阿里二面:ThreadLocal内存泄露灵魂四问,人麻了!

2023年 11月 3日 81.0k 0

ThreadLocal能够在线程本地存储对应的变量,从而有效的避免线程安全问题。但是使用ThreadLocal时,稍微不注意就有可能造成内存泄露的问题。那么ThreadLocal在哪些场景下会出现内存泄露?哪些场景下不会出现内存泄露?出现内存泄露的根本原因又是什么呢?如何真正避免内存泄露?

这可能是你职业生涯中最具含金量的一次点击,点击【项目实战】查看详情,与冰河一起研发基于大厂真正核心技术的硬核项目。

接下来,我们就用大量的图解来分析ThreadLocal内存泄露的四个核心问题:哪些场景不会内存泄露、哪些场景会内存泄露、内存泄露的根本原因是什么、以及如何真正 避免内存泄露。

一、ThreadLocal内部结构

为了更好的说明ThreadLocal内存泄露的场景,以及具体的原因,先来了解下ThreadLocal的内部结构,如图1所示。

图片图片

可以看到,ThreadLocal对象是存储在每个Thread线程内部的ThreadLocalMap中的,并且在ThreadLocalMap中有一个Entry数组,Entry数组中的每一个元素都是一个Entry对象。

每个Entry对象中存储着一个ThreadLocal对象与其对应的value值,每个Entry对象在Entry数组中的位置是通过ThreadLocal对象的threadLocalHashCode计算出来的,以此来快速定位Entry对象在Entry数组中的位置。所以,在Thread中,可以存储多个ThreadLocal对象。

二、不会出现内存泄露的场景

了解完ThreadLocal的内部存储结构后,我们先来思考下哪些场景下ThreadLocal不会发生内存泄露,假设我们单独开启一个线程,并且将变量存储到ThreadLocal中,如图2所示。

图片图片

可以看到,Thread线程在正常执行的情况下,会引用ThreadLocalMap的实例对象,只要Thread线程一直在执行任务,这种引用关系就一直存在。

当Thread线程执行任务结束退出时,Thread线程与ThreadLocalMap实例对象之间的引用关系就不存在了,如图3所示。

图片图片

Thread线程执行完任务退出后,线程里持有的ThreadLocalMap对象也就失去了强引用,此时ThreadLocalMap对象就会被GC自动回收,而ThreadLocalMap中包含的ThreadLocal对象也会被GC回收掉,如图4所示。

图片图片

可以看出,如果只是通过Thread类或者Thread类的子类来创建线程执行任务,随着对应线程的任务执行完毕,线程退出,Thread线程引用的ThreadLocal也会被GC回收掉,此时就不会出现内存泄露的问题。

三、会出现内存泄露的场景

在实际项目中,如果为每个任务的执行都开启一个线程的话,是非常耗费系统资源的,所以,在实际项目中,我们很少直接使用Thread类来创建线程,而是使用线程池来执行对应的任务。如果是在线程池场景下,线程与ThreadLocalMap之间的引用关系又是怎样的呢?

这里,我们先来看一张图,如图5所示。

图片图片

可以看到,线程池中会有多个线程执行任务,如果是通过ThreadLocal存储数据的话,每个线程都会引用一个ThreadLocalMap对象。

另外,线程池中的核心线程在执行完任务后,是不会退出的,可以循环使用,说明线程池中的每个核心线程和ThreadLocalMap之间一直是强引用关系,核心线程对应的ThreadLocal是不会自动被GC回收的,会存在内存泄露的风险。

四、内存泄露问题分析

这里,我们对在线程池中使用ThreadLocal存在内存泄露问题的原因进行分析,首先,将ThreadLocalMap中的Entry数组展开,如图6所示。

图片图片

可以看到,ThreadLocalMap中包含一个Entry数组,而Entry数组中的每一个元素就是Entry对象,Entry对象中存储的Key就是ThreadLocal对象,而value就是要存储的数据。其中,Entry对象中的Key属于弱引用,这点我们可以从ThreadLocalMap类中的内部类Entry的定义可以看出。Entry类的源码详见:java.lang.ThreadLocal.ThreadLocalMap.Entry。

static class Entry extends WeakReference k = e.get();
        if (k == null) {
            e.value = null;
            tab[i] = null;
            size--;
        } else {
            int h = k.threadLocalHashCode & (len - 1);
            if (h != i) {
                tab[i] = null;

                // Unlike Knuth 6.4 Algorithm R, we must scan until
                // null because multiple entries could have been stale.
                while (tab[h] != null)
                    h = nextIndex(h, len);
                tab[h] = e;
            }
        }
    }
    return i;
}

可以看到,在expungeStaleEntry()方法中,会将ThreadLocal为null对应的value设置为null,同时会把对应的Entry对象也设置为null,并且会将所有ThreadLocal对应的value为null的Entry对象设置为null,这样就去除了强引用,便于后续的GC进行自动垃圾回收,也就避免了内存泄露的问题。调用ThreadLocal的remove()方法后的示意图如图9所示。

图片图片

注意:在ThreadLocal中,不仅仅是remove()方法会调用expungeStaleEntry()方法,在set()方法和get()方法中也可能会调用expungeStaleEntry()方法来清理数据。

还有一点需要注意的是,ThreadLocal虽然提供了避免内存泄露的方法,但是ThreadLocal不会主动去执行这些方法,需要我们在使用完ThreadLocal对象中保存的数据后,在finally{}代码块中调用ThreadLocal的remove()方法,加快GC自动垃圾回收,避免内存泄露。

六、总结

本文,主要结合图例介绍了ThreadLocal有关内存泄露方面的知识,包括:ThreadLocal的内部结构,不会出现内存泄露的场景,会出现内存泄露的场景,内存泄露的问题分析以及如何避免内存泄露。

相关文章

JavaScript2024新功能:Object.groupBy、正则表达式v标志
PHP trim 函数对多字节字符的使用和限制
新函数 json_validate() 、randomizer 类扩展…20 个PHP 8.3 新特性全面解析
使用HTMX为WordPress增效:如何在不使用复杂框架的情况下增强平台功能
为React 19做准备:WordPress 6.6用户指南
如何删除WordPress中的所有评论

发布评论