`ThreadPoolExecutor`线程池详解

1. 背景

项目最近的迭代中使用到了ThreadPoolExecutor线程池，之前都只是知道怎么用，没有了解过线程池的底层原理，项目刚上线，有时间整理一下线程池的用法，学习一下线程池的底层实现与工作原理。

2. `ThreadPoolExecutor`工作原理

2.1 构造方法

public ThreadPoolExecutor(int corePoolSize,int maximumPoolSize,long keepAliveTime,TimeUnit unit,BlockingQueue<Runnable> workQueue,ThreadFactory threadFactory,RejectedExecutionHandler handler) {if (corePoolSize < 0 ||maximumPoolSize <= 0 ||maximumPoolSize < corePoolSize ||keepAliveTime < 0)throw new IllegalArgumentException();if (workQueue == null || threadFactory == null || handler == null)throw new NullPointerException();this.acc = System.getSecurityManager() == null ?null :AccessController.getContext();this.corePoolSize = corePoolSize;this.maximumPoolSize = maximumPoolSize;this.workQueue = workQueue;this.keepAliveTime = unit.toNanos(keepAliveTime);this.threadFactory = threadFactory;this.handler = handler;}

2.2 线程池的使用

worker

/*** @author itender* @date 2023/8/7 14:41* @desc*/
public class Worker implements Runnable {private String command;public Worker(String s) {this.command = s;}@Overridepublic void run() {System.out.println(Thread.currentThread().getName() + command + " startTie = " + DateUtil.now());processCommand();System.out.println(Thread.currentThread().getName() + command +  " endTime = " + DateUtil.now());}private void processCommand() {try {Thread.sleep(1000);System.out.println(Thread.currentThread().getName() + command +" 处理任务逻辑。。。。。。。。");} catch (InterruptedException e) {Thread.currentThread().interrupt();e.printStackTrace();}}@Overridepublic String toString() {return this.command;}
}

线程池

/*** @author itender* @date 2023/8/7 14:37* @desc*/
public class ThreadPoolExecutorDemo {private static final int CORE_POOL_SIZE = 5;private static final int MAX_POOL_SIZE = 10;private static final int QUEUE_CAPACITY = 100;private static final Long KEEP_ALIVE_TIME = 1L;public static void main(String[] args) {ThreadPoolExecutor threadPoolExecutor = new ThreadPoolExecutor(// 核心线程数 5CORE_POOL_SIZE,// 最大线程数 10MAX_POOL_SIZE,// 超过核心线程数，线程最大存活时间KEEP_ALIVE_TIME,// 时间单位TimeUnit.MINUTES,// 工作队列最大值new ArrayBlockingQueue<>(QUEUE_CAPACITY),// 线程工厂，创建线程的时候使用r -> {Thread thread = new Thread(r);thread.setName("pool-");return thread;},new ThreadPoolExecutor.CallerRunsPolicy());for (int i = 0; i < 10; i++) {// 创建任务Worker myRunnable = new Worker("" + i);// 执行任务threadPoolExecutor.execute(myRunnable);}// 种植线程池，不接受新任务，但是有工作线程处理队列中的任务threadPoolExecutor.shutdown();while (!threadPoolExecutor.isTerminated()) {}System.out.println("Finished All Threads!");}
}

2.3 核心参数

2.3.1 核心参数详解

corePoolSize：核心线程数，任务队列没有达到队列最大容量时，最大可以同时运行的线程数。
maximumPoolSize：最大线程数。当任务队列中存储的任务达到队列的容量时，当前可以同时运行的线程数量变为最大线程数。
keepAliveTime：线程池中的线程数量超过corePoolSize时，如果没有新任务提交，核心线程外的线程不会立即销毁，而是等待，直到等待的时间超过了keepAliveTime才会被销毁回收。
unit：keepAliveTime参数的时间单位。
workQueue：工作队列。当有新的任务提交的时候，会先判断当前运行的线程数是否达到核心线程数，如果达到核心线程数，则会把新提交的任务放到工作队列中。
threadFactory：线程工厂，创建新的线程时会使用。
handler：拒绝策略。

2.3.2 拒绝策略

如果当前同时运行的线程数量达到最大线程数量并且队列也已经被放满了任务时，ThreadPoolTaskExecutor 定义一些策略:

AbortPolicy：默认拒绝策略。抛出RejectExecutionException来拒绝新任务的处理。
CallerRunsPolicy：调用当前提交任务的线程来执行任务。一般不希望任务丢失会选用这种策略，但从实际角度来看，原来的异步调用意图会退化为同步调用。
DiscardPolicy：不处理新任务，直接丢弃。
DiscardOldestPolicy：丢弃最早的未处理的任务。

2.4 执行流程

在这里插入图片描述

2.5 线程池状态

2.5.1 线程池核心属性`ctl`

	// ctl本质是 Integer 型变量，进行了原子性的封装// ctl表示两种状态：// 高3位：线程池当前的状态// 低29位：线程池当前工作线程的数量private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));// COUNT_BITS 的值为 29（整型Integer.SIZE = 32 位）;private static final int COUNT_BITS = Integer.SIZE - 3;// CAPACITY = (1 << 29) - 1; 1左移29位，减去1；即1*2^29-1；// 0001 1111 1111 1111 1111 1111 1111 1111// 低29位用来表示线程池的最大线程容量private static final int CAPACITY   = (1 << COUNT_BITS) - 1;// 高3位用来表示线程池5种状态// 111 运行状态private static final int RUNNING    = -1 << COUNT_BITS;// 000 shutdown状态private static final int SHUTDOWN   =  0 << COUNT_BITS;// 001 停止状态private static final int STOP       =  1 << COUNT_BITS;// 010 过渡状态private static final int TIDYING    =  2 << COUNT_BITS;// 011 中介状态private static final int TERMINATED =  3 << COUNT_BITS;// 根据ctl的值，计算当前线程池的状态// 计算方式：c 与 非capacityprivate static int runStateOf(int c)     { return c & ~CAPACITY; }// 根据ctl的值，计算线程池当前运行的线程的容量private static int workerCountOf(int c)  { return c & CAPACITY; }// 通过运行状态和工作线程数计算ctl的值，或运算private static int ctlOf(int rs, int wc) { return rs | wc; }private static boolean runStateLessThan(int c, int s) {return c < s;private static boolean runStateAtLeast(int c, int s) {return c >= s;}private static boolean isRunning(int c) {return c < SHUTDOWN;}/*** Attempts to CAS-increment the workerCount field of ctl.*/private boolean compareAndIncrementWorkerCount(int expect) {return ctl.compareAndSet(expect, expect + 1);}/*** Attempts to CAS-decrement the workerCount field of ctl.*/private boolean compareAndDecrementWorkerCount(int expect) {return ctl.compareAndSet(expect, expect - 1);}/*** Decrements the workerCount field of ctl. This is called only on* abrupt termination of a thread (see processWorkerExit). Other* decrements are performed within getTask.*/private void decrementWorkerCount() {do {} while (! compareAndDecrementWorkerCount(ctl.get()));}

2.5.2 状态切换

在这里插入图片描述

RUNNING ：能接受新提交的任务，并且也能处理阻塞队列中的任务。
SHUTDOWN：关闭状态，不再接受新提交的任务，但却可以继续处理阻塞队列中已保存的任务。在线程池处于 RUNNING 状态时，调用 shutdown() 方法会使线程池进入到该状态。（finalize() 方法在执行过程中也会调用 shutdown() 方法进入该状态）。
STOP：不能接受新任务，也不处理队列中的任务，会中断正在处理任务的线程。在线程池处于 RUNNING 或 SHUTDOWN 状态时，调用 shutdownNow() 方法会使线程池进入到该状态。
TIDYING：如果所有的任务都已终止了，workerCount (有效线程数) 为0，线程池进入该状态后会调用 terminated() 方法进入 TERMINATED 状态。
TERMINATED：在terminated()方法执行完后进入该状态，默认 terminated() 方法中什么也没有做。

3. 源码分析

3.1 `execute`方法

源码

public void execute(Runnable command) {// 判断任务是否为空,如果任务为空，抛出空指针异常if (command == null)throw new NullPointerException();// 获取ctl属性int c = ctl.get();// 判断当前工作线程数量是否小于核心线程的数量if (workerCountOf(c) < corePoolSize) {// 工作线程数小于核心线程数，创建一个核心线程执行command任务if (addWorker(command, true))// 创建核心线程成功，直接返回return;// 并发情况下添加核心线程失败，需要重新获取ctl属性c = ctl.get();}// 创建核心线程失败，当前工作线程数量大于或等于核心线程数量corePoolSize// 判断线程池的状态是否为running，如果是添加任务到工作队列中（放入任务失败返回false）if (isRunning(c) && workQueue.offer(command)) {// 任务添加到队列成功，再次获取ctl属性int recheck = ctl.get();// 二次检查，判断线程池的状态是否为running，如果不是队列中移除刚刚添加的任务if (!isRunning(recheck) && remove(command))// 执行拒绝策略reject(command);// 1.任务添加到队列// 2.线程池可能是running状态// 3.传入的任务可能从任务队列中移除失败（移除失败的唯一可能就是任务已经被执行了）// 判断工作线程数量是否为0else if (workerCountOf(recheck) == 0)// 工作线程数量为0// 工作队列中有任务在排队，添加一个空任务，创建非核心线程执行队列中等待的任务addWorker(null, false);}// 创建核心线程失败，// 线程池状态不是running状态// 线程池可能是running状态，但是任务队列已经满了// 添加任务到工作队列失败，创建非核心线程执行任务else if (!addWorker(command, false))// 创建非核心线程失败，执行拒绝策略reject(command);}

第一点核心：通过execute方法源码可以看出线程池具体的执行流程，以及一些避免并发情况的判断。

第二点核心：线程池为什么会添加空任务非核心线程到线程池。

这里是一个疑惑点：为什么需要二次检查线程池的运行状态，当前工作线程数量为0，尝试创建一个非核心线程并且传入的任务对象为null？这个可以看API注释：

如果一个任务成功加入任务队列，我们依然需要二次检查是否需要添加一个工作线程（因为所有存活的工作线程有可能在最后一次检查之后已经终结）或者执行当前方法的时候线程池是否已经shutdown了。所以我们需要二次检查线程池的状态，必须时把任务从任务队列中移除或者在没有可用的工作线程的前提下新建一个工作线程。

3.2 `addWorker`方法

源码

private boolean addWorker(Runnable firstTask, boolean core) {// for循环标识// 对线程池当前状态和当前工作线程数量的判断retry:for (;;) {// 获取线程池的状态int c = ctl.get();int rs = runStateOf(c);// Check if queue empty only if necessary.if (rs >= SHUTDOWN &&! (rs == SHUTDOWN &&firstTask == null &&! workQueue.isEmpty()))return false;for (;;) {// 获取线程池工作线程的数量int wc = workerCountOf(c);// 1. 如果传入的core为true，表示将要创建核心线程，通过wc和corePoolSize判断，如果wc >= corePoolSize，则返回false表示创建核心线程失败// 2. 如果传入的core为false，表示将要创非建核心线程，通过wc和maximumPoolSize判断，如果wc >= maximumPoolSize，则返回false表示创建非核心线程失败// core参数为false说明工作队列已经满了，线程池大小变为maximumPoolSize最大线程数if (wc >= CAPACITY ||wc >= (core ? corePoolSize : maximumPoolSize))return false;// CAS更新工作线程数wc，原子操作将workCount的数量加1，更新成功则直接跳出最外层循环if (compareAndIncrementWorkerCount(c))break retry;// CAS更新工作线程数失败，判断线程池的状态是否从running编程shutdown，如果线程池的状态改变了在执行上面的操作c = ctl.get();  // Re-read ctl// 如果线程池状态已经变成shutdown，跳过最外层本次循环，执行下一次循环if (runStateOf(c) != rs)continue retry;// 如果线程池状态依然是RUNNING，CAS更新工作线程数wc失败说明有可能是并发更新导致的失败，则在内层循环重试即可 // else CAS failed due to workerCount change; retry inner loop}}// 工作线程是否启动成功boolean workerStarted = false;// 工作线程是否创建成功boolean workerAdded = false;Worker w = null;try {w = new Worker(firstTask);final Thread t = w.thread;if (t != null) {// 加锁，因为会改变一些指标值和非线程安全的集合final ReentrantLock mainLock = this.mainLock;// 加锁mainLock.lock();try {// 获取线程池状态int rs = runStateOf(ctl.get());//rs < SHUTDOWN 如果线程池状态依然为RUNNING,并且线程的状态是存活的话，就会将工作线程添加到工作线程集合中//(rs=SHUTDOWN && firstTask == null)如果线程池状态小于STOP，也就是RUNNING或者SHUTDOWN状态下，同时传入的任务实例firstTask为null，则需要添加到工作线程集合和启动新的Worker// 对于2，换言之，如果线程池处于SHUTDOWN状态下，同时传入的任务实例firstTask不为null，则不会添加到工作线程集合和启动新的Worker// 这一步其实有可能创建了新的Worker实例但是并不启动（临时对象，没有任何强引用），这种Worker有可能成功下一轮GC被收集的垃圾对象// firstTask == null证明只新建线程而不执行任务if (rs < SHUTDOWN ||(rs == SHUTDOWN && firstTask == null)) {if (t.isAlive()) // precheck that t is startablethrow new IllegalThreadStateException();// 将新建的工作线程添加到工作线程的集合workers.add(w);// 更新当前工作线程的最大容量int s = workers.size();if (s > largestPoolSize)largestPoolSize = s;// 工作线程是否添加成功workerAdded = true;}} finally {// 释放锁mainLock.unlock();}// 如果成功添加工作线程，则调用Worker内部的线程实例t的Thread#start()方法启动真实的线程实例if (workerAdded) {// 启动线程，标识线程启动成功t.start();workerStarted = true;}}} finally {// 线程启动失败，需要从工作线程中移除对应的Workerif (!workerStarted)addWorkerFailed(w);}return workerStarted;
}

4. 线程池常见问题

4.1 `execute()` 和`submit()`的区别

execute()方法用于提交不需要返回值的任务，所以无法判断任务是否被线程池执行成功与否；
submit()方法用于提交需要返回值的任务。线程池会返回一个 Future 类型的对象，通过这个 Future 对象可以判断任务是否执行成功，并且可以通过 Future 的 get()方法来获取返回值，get()方法会阻塞当前线程直到任务完成，而使用 get（long timeout，TimeUnit unit）方法的话，如果在 timeout 时间内任务还没有执行完，就会抛出 java.util.concurrent.TimeoutException。