1. 程式人生 > >Java執行緒池入門

Java執行緒池入門

# 什麼是執行緒池 當我們需要處理某個任務的時候,可以新建立一個執行緒,讓執行緒去執行任務。執行緒池的字面意思就是存放執行緒的池子,當我們需要處理某個任務的時候,可以從執行緒池裡取出一條執行緒去執行。 # 為什麼需要執行緒池 首先我們要知道不用執行緒池,直接建立執行緒有什麼弊端: 1. 第一個是建立與銷燬執行緒的開銷,Java中的執行緒是對映到作業系統執行緒上的,頻繁地建立和銷燬執行緒會極大地損耗系統的效能。 2. 執行緒會佔用一定的記憶體空間,如果我們在同一時間內建立大量的執行緒執行任務,很有可能出現記憶體不足的情況。 為了解決這兩個問題我們引入執行緒池的概念,通過複用執行緒避免重複建立銷燬執行緒帶來的開銷,同時可以設定最大執行緒數,避免同時建立大量執行緒導致記憶體溢位。 # 執行緒池的使用 ## 1.執行緒池的核心引數 想掌握執行緒池首先要理解執行緒池建構函式的引數: |引數名|型別|含義| |---|---|---| |corePoolSize|int|核心執行緒數| |maxPoolSize|int|最大執行緒數| |keepAliveTime|long|保持存活時間| |workQueue|BlockingQueue|任務儲存佇列| |threadFactory|ThreadFactory|當執行緒池需要新建立執行緒的時候,會通過ThreadFactory建立| |Handler|RejectedExecutionHandler|當執行緒池無法接受你提交的任務時所採取的拒絕策略| 逐個解釋這些引數是很難理解的,這裡我結合一張執行緒池處理的流程圖進行講解: ![image](http://www.justdojava.com/assets/images/2019/java/image-tssh/threadPool/2.png) 當我們往執行緒池裡提交任務時,如果執行緒池內的執行緒數少於corePoolSize,則會直接建立新的執行緒處理任務; 如果執行緒池的執行緒數達到了corePoolSize,並且儲存佇列沒滿,則會把任務放到workQueue任務儲存佇列裡; 如果儲存佇列也滿了,但是執行緒數還沒有達到maxPoolSize,這個時候就會繼續建立執行緒執行任務。注意:這個時候執行緒池內的執行緒數已經超過了corePoolSize,超過corePoolSize的執行緒不會一直存活線上程池內,當他們閒下來時並超過keepAliveTime設定的時間後,就會被銷燬。 如果執行緒數已經達到了maxPoolSize,這個時候如果再來任務,執行緒池就採取Handler所指定的拒絕策略拒絕任務。 ## 2.幾種常見的執行緒池分析 Java為我們提供了幾種常用的執行緒池,通過Executors類可以輕易地獲取它們。下面我們通過分析這幾種常用執行緒池的引數,瞭解這些執行緒池之間的異同。 > 1. newSingleThreadExecutor 從字面上也好理解,這是一個單執行緒的執行緒池,它的構造引數如下(建立的時候不需要傳參,這裡指的是下一層呼叫執行緒池建構函式時的傳參): corePoolSize:1 maximumPoolSize(maxPoolSize):1 keepAliveTime:0L workQueue:LinkedBlockingQueue 其他引數為預設值 大家按照照著上面的流程圖模擬提交任務走一遍,就知道為什麼這是一個單執行緒的執行緒池了。 當初次任務提交的時候,會建立一個執行緒執行任務;當提交第二個任務的時候,由於corePoolSize值為1,所以任務會放到任務佇列中。由於任務佇列選擇的是LinkedBlockingQueue,底層結構是連結串列,理論上可以存放幾乎無窮多的任務(預設的大小是Integer.MAX_VALUE),所以永遠不會觸發任務佇列已滿的條件,也就永遠不會繼續增加執行緒,所以該執行緒池能保持一個單執行緒的工作狀態。 如果這個唯一的執行緒因為異常結束了,執行緒池會建立一個新的執行緒補上。通過阻塞佇列,這個執行緒池能夠保證任務是按順序執行的。 > 2. newFixedThreadPool 這是一個固定執行緒數的執行緒池,它的構造引數如下: corePoolSize:n maximumPoolSize(maxPoolSize):n keepAliveTime:0L workQueue:LinkedBlockingQueue 其他引數為預設值 如果理解了 SingleThreadExecutor 是如何限制只有一條執行緒執行任務的話,那這裡固定執行緒數的原理也是一樣的,關鍵是限定 corePoolSize 和 maxPoolSize 的大小一樣,並使用幾乎無限容量LinkedBlockingQueue > 3. newCachedThreadPool 可快取的執行緒池,我理解的快取是關於執行緒的快取,它的構造引數如下: corePoolSize:0 maximumPoolSize(maxPoolSize):Integer.MAX_VALUE keepAliveTime:60L workQueue:SynchronousQueue 其他引數為預設值 由於corePoolSize為0,所以任務提交到該執行緒池後會直接到阻塞佇列。又由於阻塞佇列採用的是SynchronousQueue,這是一種不儲存任務的佇列,一旦獲得任務它就會分發給任務處理執行緒,所以直接觸發流程圖中第三個判斷框:如果當前執行緒數小於maxPoolSize就建立執行緒。由於maxPoolSize設定了一個很大的值,基本上可以無限地建立執行緒,具體的數量取絕於JVM所能建立的最大執行緒數。若執行緒空閒60秒沒任務處理便會被執行緒池回收。 該執行緒池在處理大量非同步短連結任務的時候有較好的效能,在空閒的時候池內是沒有執行緒的,節省了系統的資源。 > 4. newScheduledThreadPool corePoolSize:自定義 maximumPoolSize(maxPoolSize):Integer.MAX_VALUE keepAliveTime:0 workQueue:DelayedWorkQueue 其他引數為預設值 由於maxPoolSize設定為Integer.MAX_VALUE,該執行緒池可以無限建立執行緒,由於阻塞佇列選擇了DelayedWorkQueue,所以可以週期性地執行任務。 > 5. newWorkStealingPool 這個是JDK1.8新加入的執行緒池,底層使用的是ForkJoinPool。如果使用預設引數建立的話,該執行緒池能夠建立足夠多的執行緒以達到和系統相匹配的並行處理能力。每個執行緒都有自己的工作佇列,如果當前執行緒工作完了,它會到別的工作佇列中“竊取”任務執行,充分地利用了CPU的多核能力。 > 阿里巴巴關於建立執行緒池的約規 下面這段話搬運自阿里巴巴Java開發手冊,相信大家看完上面的引數解釋以及各種執行緒池的異同後,就不難理解這段約規了: (六)併發處理 4. 【強制】執行緒池不允許使用Executors去建立,而是通過ThreadPoolExecutor的方式,這樣的處理方式讓寫的同學更加明確執行緒池的執行規則,避免資源耗盡的風險。 說明:Executors返回執行緒池的弊端如下: 1) FixedThreadPool和SingleThreadPool: 允許的請求佇列長度為Integer.MAX_VALUE,可能會堆積大量的請求,從而導致OOM。 2) CacheThreadPool和ScheduledThreadPool: 允許建立的執行緒數量為Integer.MAX_VALUE,可能會建立大量的執行緒,導致OOM。 ## 3. 執行緒池的數量設定為多少比較合適? 這個問題是沒有固定答案的,我們可以先通過業界權威給出的公式計算執行緒池的數量,然後通過壓測進一步確認具體的數量。 業界給出的指導公式是: 1. 若任務是CPU密集型任務(比如說加密,計算雜湊等),執行緒數可以設定為CPU核心數的1-2倍左右。 2. 若任務是耗時IO型任務(比如說讀寫資料庫,檔案,網路等),執行緒數的公式為:執行緒數 = CPU核心數 * (1 + 平均等待時間 / 平均處理時間) 這兩種不同設計都遵循著盡力壓榨CPU效能的原則。 ## 4. 執行緒池的五種狀態 執行緒池的五種狀態都寫在了ThreadPoolExecutor類中了,它們分別是: 1. RUNNING:接受新任務,並處理新任務 2. SHUTDOWN:不接受新任務,但是會處理佇列中的任務 3. STOP:不接受新任務,不處理佇列中的任務,中斷正在處理的任務 4. TIDYING:所有任務已經結束,workerCount為零,這時執行緒會轉到TIDYING狀態,並將執行terminated()鉤子方法 5. TERMINATED:terminated()執行完成 ## 5. 執行緒池執行的原理 我們先回顧一下如何新建立一個執行緒處理任務,看懂了再看執行緒池的原理就簡單了: ```java //首先把我們要放線上程裡執行的程式碼在Runnable介面實現類的run方法中封裝好 class MyTask implements Runnable { @Override public void run() { System.out.println("處理任務 + 1"); } } //然後建立一個執行緒,把該Runnable介面實現類作為構造引數傳給執行緒 public class Basic { public static void main(String[] args) { Thread thread = new Thread(new MyTask()); thread.start(); } } //最後呼叫執行緒的start方法執行,實際上呼叫的是Runnable的run方法 ``` 在上面的程式碼中,實現了Runnable介面的例項傳入到執行緒類中,成為了執行緒物件的一個成員變數,執行緒執行的時候會呼叫該例項的run方法。 可以看到如果新建立一個執行緒來執行任務,任務會和執行緒耦合在一起。而執行緒池的關鍵原理在於它添加了一個阻塞佇列,把任務和執行緒解耦了 線上程池中,有一個worker的概念,這個概念解釋起來有點困難,你可以直接理解為worker就是一個執行緒工人,它手上拿著任務,當呼叫執行緒池的runWorker()方法時,執行緒就會處理一個任務,詳細見下面程式碼 ```java final void runWorker(Worker w) { Thread wt = Thread.currentThread(); Runnable task = w.firstTask; w.firstTask = null; w.unlock(); // allow interrupts boolean completedAbruptly = true; try { while (task != null || (task = getTask()) != null) {//會到阻塞佇列中獲取任務 w.lock(); //... try { //執行任務 } finally { //... w.unlock(); } } //... } finally { //... } } ``` 從程式碼中可以看到執行緒池的關鍵程式碼就是一個while迴圈,在while迴圈中會不斷地向阻塞佇列中獲取任務,獲取到了任務就執行。 --- 參考: 1. 慕課網《玩轉Java併發工具,精通JUC,成為併發多面手》課程 2. https://www.oschina.net/question/565065_86540 3. https://www.cnblogs.com/dolphin0520/p/3932921.html 4. https://www.cnblogs.com/ok-wolf/p/7761