阿里二面：谈谈ThreadLocal的内存泄漏问题？

开发运维 2024-03-22 泡泡手机阅读

引言

ThreadLocal在Java多线程编程中扮演着重要的角色，它提供了一种线程局部存储机制，允许每个线程拥有独立的变量副本，从而有效地避免了线程间的数据共享冲突。ThreadLocal的主要用途在于，当需要为每个线程维护一个独立的上下文变量时，比如每个线程的事务ID、用户登录信息、数据库连接等，可以减少对同步机制如synchronized关键字或Lock类的依赖，提高系统的执行效率和简化代码逻辑。

但是我们在使用ThreadLocal时，经常因为使用不当导致内存泄漏。此时就需要我们去探究一下ThreadLocal在哪些场景下会出现内存泄露？哪些场景下不会出现内存泄露？出现内存泄露的根本原因又是什么呢？如何避免内存泄露？

ThreadLocal原理

ThreadLocal的实现基于每个线程内部维护的一个ThreadLocalMap。

public class Thread implements Runnable {
     /* ThreadLocal values pertaining to this thread. This map is maintained
     * by the ThreadLocal class. */
    ThreadLocal.ThreadLocalMap threadLocals = null;
}

ThreadLocalMap是ThreadLocal类的一个静态内部类，ThreadLocal本身不能存储数据，它在作用上更像一个工具类，ThreadLocal类提供了set(T value)、get()等方法来操作ThreadLocalMap存储数据。

public class ThreadLocal {
    // ...
    public void set(T value) {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null)
            map.set(this, value);
        else
            createMap(t, value);
    }

    public T get() {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null) {
            ThreadLocalMap.Entry e = map.getEntry(this);
            if (e != null) {
                @SuppressWarnings("unchecked")
                T result = (T)e.value;
                return result;
            }
        }
        return setInitialValue();
    }

    ThreadLocalMap getMap(Thread t) {
        return t.threadLocals;
    }
    // ...
}

而ThreadLocalMap内部维护了一个Entry数据，用来存储数据，Entry继承了WeakReference，所以Entry的key是一个弱引用，可以被GC回收。Entry数组中的每一个元素都是一个Entry对象。每个Entry对象中存储着一个ThreadLocal对象与其对应的value值。

static class ThreadLocalMap {

    static class Entry extends WeakReference> {
            /** The value associated with this ThreadLocal. */
            Object value;

            Entry(ThreadLocal k, Object v) {
                super(k);
                value = v;
            }
        }
}

而对于弱引用WeakReference，在引用的对象使用完毕之后，即使内存足够，GC也会对其进行回收。

关于弱引用的知识点，请参考：

图片

当Entry对象中的Key被GC自动回收后，对应的ThreadLocal被GC回收掉了，变成了null，但是ThreadLocal对应的value值依然被Entry引用，不能被GC自动回收。这样就造成了内存泄漏的风险。

图片

在线程池环境下使用ThreadLocal存储数据时，内存泄露的风险主要源自于线程生命周期管理及ThreadLocalMap内部结构的设计。由于线程池中的核心线程在完成任务后会复用，每个线程都会维持对各自关联的ThreadLocalMap对象的强引用，这确保了只要线程持续存在，其对应的ThreadLocalMap就无法被垃圾收集器（GC）自动回收。

进一步分析，ThreadLocalMap内部采用一个Entry数组来保存键值对，其中每个条目的Key是当前线程中对应ThreadLocal实例的弱引用，这意味着当外部不再持有该ThreadLocal实例的强引用时，Key部分能够被GC正常回收。然而，关键在于Entry的Value部分，它直接或间接地持有着强引用的对象，即使Key因为弱引用特性被回收，但Value所引用的数据却不会随之释放，除非明确移除或者整个ThreadLocalMap随着线程结束而失效。

所以，在线程池中，如果未正确清理不再使用的ThreadLocal变量，其所持有的强引用数据将在多个任务执行过程中逐渐积累并驻留在线程的ThreadLocalMap中，从而导致潜在的内存泄露风险。

ThreadLocal如何避免内存泄漏

经过上述ThreadLocal原理以及发生内存泄漏的分析，我们知道防止内存泄漏，我们一定要在完成线程内的任务后，调用ThreadLocal的remove()方法来清除当前线程中ThreadLocal所对应的值。其remove方法源码如下：

public void remove() {
     ThreadLocalMap m = getMap(Thread.currentThread());
     if (m != null) {
         m.remove(this);
     }
 }

在remove()方法中，首先根据当前线程获取ThreadLocalMap类型的对象，如果不为空，则直接调用该对象的有参remove()方法移除value的值。ThreadLocalMap的remove方法源码如下：

private void remove(ThreadLocal key) {
    Entry[] tab = table;
    int len = tab.length;
    int i = key.threadLocalHashCode & (len-1);
    for (Entry e = tab[i];
         e != null;
         e = tab[i = nextIndex(i, len)]) {
        if (e.get() == key) {
            e.clear();
            expungeStaleEntry(i);
            return;
        }
    }
}

由上述ThreadLocalMap中的set()方法知道ThreadLocal中Entry下标是通过计算ThreadLocal的hashCode获得了，而remove()方法要找到需要移除value所在Entry数组中的下标时，也时通过当前ThreadLocal对象的hashCode获的，然后找到它的下标之后，调用expungeStaleEntry将其value也置为null。我们继续看一下expungeStaleEntry方法的源码：

private int expungeStaleEntry(int staleSlot) {
    Entry[] tab = table;
    int len = tab.length;

    // expunge entry at staleSlot
    tab[staleSlot].value = null;
    tab[staleSlot] = null;
    size--;

    // Rehash until we encounter null
    Entry e;
    int i;
    for (i = nextIndex(staleSlot, len);
         (e = tab[i]) != null;
         i = nextIndex(i, len)) {
        ThreadLocal k = e.get();
        if (k == null) {
            e.value = null;
            tab[i] = null;
            size--;
        } else {
            int h = k.threadLocalHashCode & (len - 1);
            if (h != i) {
                tab[i] = null;

                // Unlike Knuth 6.4 Algorithm R, we must scan until
                // null because multiple entries could have been stale.
                while (tab[h] != null)
                    h = nextIndex(h, len);
                tab[h] = e;
            }
        }
    }
    return i;
}

在expungeStaleEntry()方法中，会将ThreadLocal为null对应的value设置为null，同时会把对应的Entry对象也设置为null，并且会将所有ThreadLocal对应的value为null的Entry对象设置为null，这样就去除了强引用，便于后续的GC进行自动垃圾回收，也就避免了内存泄露的问题。即调用完remove方法之后，ThreadLocalMap的结构图如下：

image.png

在ThreadLocal中，不仅仅是remove()方法会调用expungeStaleEntry()方法，在set()方法和get()方法中也可能会调用expungeStaleEntry()方法来清理数据。这种设计确保了即使没有显式调用remove()方法，系统也会在必要时自动清理不再使用的ThreadLocal变量占用的内存资源。

需要我们特别注意的是，尽管ThreadLocal提供了remove这种机制来防止内存泄漏，但它并不会自动执行相关的清理操作。所以为了确保资源有效释放并避免潜在的内存泄露问题，我们应当在完成对ThreadLocal对象中数据的使用后，及时调用其remove()方法。我们最好(也是必须)是在try-finally代码块结构中，在finally块中明确地执行remove()方法，这样即使在处理过程中抛出异常，也能确保ThreadLocal关联的数据被清除，从而有利于GC回收不再使用的内存空间，避免内存泄漏。

总结

本文探讨了ThreadLocal的工作原理以及其内存泄漏问题及解决策略。ThreadLocal通过为每个线程提供独立的变量副本，实现多线程环境下的数据隔离。其内部通过ThreadLocalMap与当前线程绑定，利用弱引用管理键值对。但是，如果未及时清理不再使用的ThreadLocal变量，可能导致内存泄漏，尤其是在线程池场景下。解决办法包括在完成任务后调用remove方法移除无用数据。正确理解和使用ThreadLocal能够有效提升并发编程效率，但务必关注潜在的内存泄漏风险。