Fork/Join 型執行緒池與 Work-Stealing 演算法

阿新 • • 發佈：2018-12-15

JDK 1.7 時，標準類庫添加了 ForkJoinPool，作為對 Fork/Join 型執行緒池的實現。Fork 在英文中有分叉的意思，而 Join有合併的意思。ForkJoinPool 的功能也是如此：Fork 將大任務分叉為多個小任務，然後讓小任務執行，Join 是獲得小任務的結果，然後進行合併，將合併的結果作為大任務的結果 —— 並且這會是一個遞迴的過程 —— 因為任務如果足夠大，可以將任務多級分叉直到任務足夠小。

由此可見，ForkJoinPool 可以滿足並行地實現 分治演算法（Divide-and-Conquer） 的需要。

ForkJoinPool 的類圖如下：

可以看到 ForkJoinPool 實現了 ExecutorService 介面，所以首先 ForkJoinPool 也是一個 ExecutorService （執行緒池）。因而 Runnable 和 Callable 型別的任務，ForkJoinPool 也可以通過 submit、invokeAll 和 invokeAny 等方法來執行。但是標準類庫還為 ForkJoinPool 定義了一種新的任務，它就是 ForkJoinTask<V>。

ForkJoinTask 類圖：

ForkJoinTask<V> 用來專門定義 Fork/Join 型任務 —— 完成將大任務分割為小任務以及合併結果的工作。一般我們不需要直接使用 ForkJoinTask<V>

，而是通過繼承它的子類 RecursiveAction 和 RecursiveTask 並實現對應的抽象方法 —— compute ，來定義我們自己的任務。其中，RecursiveAction 是不帶返回值的 Fork/Join 型任務，所以使用此類任務並不產生結果，也就不涉及到結果的合併；而 RecursiveTask 是帶返回值的 Fork/Join 型任務，使用此類任務的話，在任務結束前，我們需要進行結果的合併。其中，通過 ForkJoinTask<V> 的 fork 方法，我們可以產生子任務並執行；通過 join 方法，我們可以獲得子任務的結果。

ForkJoinPool 可以使用三種方法用來執行 ForkJoinTask

：

invoke 方法：

public <T> T invoke(ForkJoinTask<T> task)

invoke 方法用來執行一個帶返回值的任務（通常繼承自RecursiveTask），並且該方法是阻塞的，直到任務執行完畢，該方法才會停止阻塞並返回任務的執行結果。

submit 方法：

public <T> ForkJoinTask<T> submit(ForkJoinTask<T> task)

除了從 ExecutorService 繼承的 submit 方法外，ForkJoinPool 還定義了用來執行 ForkJoinTask 的 submit 方法 —— 一般該 submit 方法用來執行帶返回值的ForkJoinTask（通常繼承自RecursiveTask）。該方法是非阻塞的，呼叫之後將任務提交給 ForkJoinPool 去執行便立即返回，返回的便是已經提交到 ForkJoinPool 去執行的 task —— 由類圖可知 ForkJoinTask 實現了 Future 介面，所以可以直接通過 task 來和已經提交的任務進行互動。

execute 方法：

public void execute(ForkJoinTask<?> task)

除了從 Executor 獲得的 execute 方法外，ForkJoinPool 也定義了用來執行ForkJoinTask 的 execute 方法 —— 一般該 execute 方法用來執行不帶返回值的ForkJoinTask（通常繼承自RecursiveAction），該方法同樣是非阻塞的。

現在讓我們來實踐下 ForkJoinPool 的功能：計算 π 的值。計算 π 的值有一個通過多項式方法，即：π = 4 * (1 - 1/3 + 1/5 - 1/7 + 1/9 - ……)，而且多項式的項數越多，計算出的 π 的值越精確。

首先我們定義用來估算 π 的 PiEstimateTask：

class PiEstimateTask extends RecursiveTask<Double> {

    private final long begin;
    private final long end;
    private final long threshold; // 分割任務的臨界值

    public PiEstimateTask(long begin, long end, long threshold) {
        this.begin = begin;
        this.end = end;
        this.threshold = threshold;
    }

    @Override
    protected Double compute() {  // 實現 compute 方法
        if (end - begin <= threshold) {  // 臨界值之下，不再分割，直接計算

            int sign; // 符號，多項式中偶數位取 1，奇數位取 -1（位置從 0 開始）
            double result = 0.0;
            
            for (long i = begin; i < end; i++) {
                sign = (i & 1) == 0 ? 1 : -1;
                result += sign / (i * 2.0 + 1);
            }

            return result * 4;
        }

        // 分割任務
        long middle = (begin + end) / 2;
        PiEstimateTask leftTask = new PiEstimateTask(begin, middle, threshold);
        PiEstimateTask rightTask = new PiEstimateTask(middle, end, threshold);

        leftTask.fork();  // 非同步執行 leftTask
        rightTask.fork(); // 非同步執行 rightTask

        double leftResult = leftTask.join();   // 阻塞，直到 leftTask 執行完畢返回結果
        double rightResult = rightTask.join(); // 阻塞，直到 rightTask 執行完畢返回結果

        return leftResult + rightResult; // 合併結果
    }

}

然後我們使用 ForkJoinPool 的 invoke 執行 PiEstimateTask：

public class ForkJoinPoolTest {

    public static void main(String[] args) throws Exception {
        ForkJoinPool forkJoinPool = new ForkJoinPool(4);
    
        // 計算 10 億項，分割任務的臨界值為 1 千萬
        PiEstimateTask task = new PiEstimateTask(0, 1_000_000_000, 10_000_000);
    
        double pi = forkJoinPool.invoke(task); // 阻塞，直到任務執行完畢返回結果
    
        System.out.println("π 的值：" + pi);
        
        forkJoinPool.shutdown(); // 向執行緒池傳送關閉的指令
    }
}

執行結果：

我們也可以使用 submit 方法非同步的執行任務（此處 submit 方法返回的 future 指向的物件即提交任務時的 task）：

public static void main(String[] args) throws Exception {
    ForkJoinPool forkJoinPool = new ForkJoinPool(4);

    PiEstimateTask task = new PiEstimateTask(0, 1_000_000_000, 10_000_000);
    Future<Double> future = forkJoinPool.submit(task); // 不阻塞
    
    double pi = future.get();
    System.out.println("π 的值：" + pi);
    System.out.println("future 指向的物件是 task 嗎：" + (future == task));
    
    forkJoinPool.shutdown(); // 向執行緒池傳送關閉的指令
}

執行結果：

值得注意的是，選取一個合適的分割任務的臨界值，對 ForkJoinPool 執行任務的效率有著至關重要的影響。臨界值選取過大，任務分割的不夠細，則不能充分利用 CPU；臨界值選取過小，則任務分割過多，可能產生過多的子任務，導致過多的執行緒間的切換和加重 GC 的負擔從而影響了效率。所以，需要根據實際的應用場景選擇一個合適的分割任務的臨界值。

ForkJoinPool 相比於 ThreadPoolExecutor，還有一個非常重要的特點（優點）在於，ForkJoinPool具有 Work-Stealing （工作竊取）的能力。所謂 Work-Stealing，在 ForkJoinPool 中的實現為：執行緒池中每個執行緒都有一個互不影響的任務佇列（雙端佇列），執行緒每次都從自己的任務佇列的隊頭中取出一個任務來執行；如果某個執行緒對應的佇列已空並且處於空閒狀態，而其他執行緒的佇列中還有任務需要處理但是該執行緒處於工作狀態，那麼空閒的執行緒可以從其他執行緒的佇列的隊尾取一個任務來幫忙執行 —— 感覺就像是空閒的執行緒去偷人家的任務來執行一樣，所以叫 “工作竊取”。

Work-Stealing 的適用場景是不同的任務的耗時相差比較大，即某些任務需要執行較長時間，而某些任務會很快的執行完成，這種情況下用 Work-Stealing 很合適；但是如果任務的耗時很平均，則此時 Work-Stealing 並不適合，因為竊取任務時不同執行緒需要搶佔鎖，這可能會造成額外的時間消耗，而且每個執行緒維護雙端佇列也會造成更大的記憶體消耗。所以 ForkJoinPool 並不是 ThreadPoolExecutor 的替代品，而是作為對 ThreadPoolExecutor 的補充。

總結： ForkJoinPool 和 ThreadPoolExecutor 都是 ExecutorService（執行緒池），但ForkJoinPool 的獨特點在於：

ThreadPoolExecutor 只能執行 Runnable 和 Callable 任務，而 ForkJoinPool 不僅可以執行 Runnable 和 Callable 任務，還可以執行 Fork/Join 型任務 —— ForkJoinTask —— 從而滿足並行地實現分治演算法的需要；
ThreadPoolExecutor 中任務的執行順序是按照其在共享佇列中的順序來執行的，所以後面的任務需要等待前面任務執行完畢後才能執行，而 ForkJoinPool 每個執行緒有自己的任務佇列，並在此基礎上實現了 Work-Stealing 的功能，使得在某些情況下 ForkJoinPool 能更大程度的提高併發效率。

參考文獻：

jdk1.8原始碼

宣告部分圖片來源於網路，共同學習

Fork/Join 型執行緒池與 Work-Stealing 演算法

Fork/Join 型執行緒池與 Work-Stealing 演算法

執行緒池與cp命令的實現

Lock、synchronized=====可重入鎖、可中斷鎖、公平鎖、讀寫鎖====CountDownLatch、CyclicBarrier 、join()、執行緒池

python--執行緒池與程序池

Qt多執行緒-QThreadPool執行緒池與QRunnable

執行緒池與執行緒佇列分析-優

使用執行緒池與CountDownLatch多執行緒提升系統性能

執行緒池與工作佇列

跟我學Java多執行緒——執行緒池與阻塞佇列

Tomcat執行緒池與NIO配置

基於C++11併發庫的執行緒池與訊息佇列多執行緒框架——std::thread類

執行緒池與工廠模式、代理模式的結合使用

python 程序池、執行緒池與非同步呼叫、回撥機制

非同步IO、APC、IO完成埠、執行緒池與高效能伺服器之三 IO完成埠

週期性執行緒池與主要原始碼解析

Python執行緒池與程序池

規範使用執行緒池與底層原理詳解

Java併發（十）執行緒池&fork/join框架

Java多執行緒學習與總結(Join)

Android中的執行緒與執行緒池

Fork/Join 型執行緒池與 Work-Stealing 演算法

相關推薦