踩了定时线程池的坑，导致公司损失几千万，血的教训-每日运维

👏作者简介：大家好，我是爱敲代码的小黄，独角兽企业的Java开发工程师，CSDN博客专家，阿里云专家博主

📕系列专栏：Java设计模式、Spring源码系列、Netty源码系列、Kafka源码系列、JUC源码系列、duubo源码系列

🔥如果感觉博主的文章还不错的话，请👍三连支持👍一下博主哦

🍂博主正在努力完成2023计划中：以梦为马，扬帆起航，2023追梦人

📝联系方式：hls1793929520，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬👀

ScheduledExecutorService

一、背景

大家好呀，上周我们公司由于定时线程池使用不当出了一个故障，几千万的单子可能没了

给兄弟们分享分享这个坑，希望兄弟们以后别踩！

业务中大量的使用定时线程池（ScheduledExecutorService）执行任务，有时候会忽略掉 Try/Catch 的异常判断

当任务执行报错时，会导致整个定时线程池挂掉，影响业务的正常需求

二、问题

我们来模仿一个生产的例子：

合作方修改频率低且合作方允许最终一致性
我们有一个定时任务每隔 60 秒去 MySQL 拉取全量的 合作方 数据放至合作方缓存（本地缓存）中
当客户请求时，我们去缓存中拿取合作方即可

这样的生产例子应该存在于绝大数公司，代码如下：

public class Demo {

    // 创建定时线程池
    private static ScheduledExecutorService scheduledExecutorService = Executors.newScheduledThreadPool(1);

    private List partnerCache = new ArrayList();

    @PostConstruct
    public void init() {
        scheduledExecutorService.scheduleAtFixedRate(new Runnable() {
            @Override
            public void run() {
                // 启动时每隔60秒执行一次数据库的刷新
                // 将数据缓存至本地
                loadPartner();
            }
        }, 3, 60, TimeUnit.SECONDS);
    }

    public void loadPartner() {
        // 查询数据库当前最新合作方数据
        List partnerList = queryPartners();

        // 合作方数据放至缓存
        partnerCache.clear();
        partnerCache.addAll(partnerList);
    }


    public List queryPartners() {
        // 数据库挂了！
        throw new RuntimeException();
    }

}

运行上述样例，我们会发现程序不停止，输出一遍 Load start!，一直在运行，但后续不输出 Load start!

这个时候我们可以确认：异常确实导致当前任务不再执行

1、为什么任务报错会影响定时线程池？

2、定时线程池是真的挂掉了嘛?

3、定时线程池内部是如何执行的？

跟着这三个问题，我们一起来看一看 ScheduledExecutorService 的原理介绍

三、原理剖析

对于 ScheduledExecutorService 来说，本质上是延时队列 + 线程池

1、延时队列介绍

DelayQueue 是一个无界的 BlockingQueue，用于放置实现了Delayed接口的对象，只能在到期时才能从队列中取走。

这种队列是有序的，即队头对象的延迟到期时间最长。

我们看一下延时队列里对象的属性：

class MyDelayedTask implements Delayed{
    // 当前任务创建时间
    private long start = System.currentTimeMillis();
    // 延时时间
    private long time ;

    // 初始化
    public MyDelayedTask(long time) {
        this.time = time;
    }

    /**
     * 需要实现的接口，获得延迟时间（用过期时间-当前时间）
     */
    @Override
    public long getDelay(TimeUnit unit) {
        return unit.convert((start+time) - System.currentTimeMillis(),TimeUnit.MILLISECONDS);
    }

    /**
     * 用于延迟队列内部比较排序（当前时间的延迟时间 - 比较对象的延迟时间）
     */
    @Override
    public int compareTo(Delayed o) {
        MyDelayedTask o1 = (MyDelayedTask) o;
        return (int) (this.getDelay(TimeUnit.MILLISECONDS) - o.getDelay(TimeUnit.MILLISECONDS));
    }
}

所以，延时队列的实现原理也很简单：

生产端：投递消息时增加时间戳（当前时间+延时时间）
消费端：用当前时间与时间戳进行比较，若小于则消费，反之则循环等待

2、线程池的原理介绍

当前的线程池个数低于核心线程数，直接添加核心线程即可
当前的线程池个数大于核心线程数，将任务添加至阻塞队列中
如果添加阻塞队列失败，则需要添加非核心线程数处理任务
如果添加非核心线程数失败（满了），执行拒绝策略

3、定时线程的原理

我们从定时线程池的创建看：scheduledExecutorService.scheduleAtFixedRate(myTask, 3L, 1L, TimeUnit.SECONDS);

public ScheduledFuture scheduleAtFixedRate(Runnable command, long initialDelay, long period, TimeUnit unit) {
    // 初始化我们的任务
    // triggerTime：延时的实现
    ScheduledFutureTask sft = new ScheduledFutureTask(command,null,triggerTime(initialDelay, unit),unit.toNanos(period));
    RunnableScheduledFuture t = decorateTask(command, sft);
    sft.outerTask = t;
    delayedExecute(t);
    return t;
}
private void delayedExecute(RunnableScheduledFuture task) {
    // 将当前任务丢进延时队列
    super.getQueue().add(task);
    // 创建核心线程并启动 
    ensurePrestart();
}

// 时间轮算法
private long triggerTime(long delay, TimeUnit unit) {
    return now() + delay;
}

从这里我们可以得到结论：定时线程池通过延时队列来达到定时的目的

有一个问题：我们仅仅向 Queue 里面放了一个任务，他是怎么保证执行多次的呢？

带着这个问题，我们看一下他拉取任务启动的代码：

for (;;) {

    // 从延时队列中获取任务

    Runnable r = workQueue.take();

}

public RunnableScheduledFuture take(){

    for (;;) {

        // 获取队列第一个任务

        RunnableScheduledFuture first = queue[0];
        // 【重点】如果当前队列任务为空，则等待

        if (first == null){

            available.await();

        }
        // 获取当前任务的时间

        long delay = first.getDelay(NANOSECONDS);
        if (delay

踩了定时线程池的坑，导致公司损失几千万，血的教训

一、背景

二、问题

三、原理剖析

1、延时队列介绍

2、线程池的原理介绍

3、定时线程的原理

相关文章

发布评论取消回复

LOVEHL^ˇ^

如何使用 WinGet 下载 Microsoft Store 应用

下载丨66页PDF，云和恩墨技术通讯（2024年7月刊）

ETL数据集成丨快速将MySQL数据迁移至Doris数据库

踩了定时线程池的坑，导致公司损失几千万，血的教训

一、背景

二、问题

三、原理剖析

1、延时队列介绍

2、线程池的原理介绍

3、定时线程的原理

相关文章

发布评论 取消回复

LOVEHL^ˇ^

如何使用 WinGet 下载 Microsoft Store 应用

下载丨66页PDF，云和恩墨技术通讯（2024年7月刊）

ETL数据集成丨快速将MySQL数据迁移至Doris数据库

发布评论取消回复