1. 程式人生 > >JAVA並行框架Fork/Join(一):簡介和代碼示例

JAVA並行框架Fork/Join(一):簡介和代碼示例

over 框架設計 put 分割 gif 得到 java owa trace

一、背景

雖然目前處理器核心數已經發展到很大數目,但是按任務並發處理並不能完全充分的利用處理器資源,因為一般的應用程序沒有那麽多的並發處理任務。基於這種現狀,考慮把一個任務拆分成多個單元,每個單元分別得到執行,最後合並每個單元的結果。

Fork/Join框架是JAVA7提供的一個用於並行執行任務的框架,是一個把大任務分割成若幹個小任務,最終匯總每個小任務結果後得到大任務結果的框架。它非常類似於HADOOP提供的MapReduce框架,只是MapReduce的任務可以針對集群內的所有計算節點,可以充分利用集群的能力完成計算任務。ForkJoin更加類似於單機版的MapReduce。

技術分享圖片

二、工作竊取算法

指的是某個線程從其他隊列裏竊取任務來執行。使用的場景是一個大任務拆分成多個小任務,為了減少線程間的競爭,把這些子任務分別放到不同的隊列中,並且每個隊列都有單獨的線程來執行隊列裏的任務,線程和隊列一一對應。但是會出現這樣一種情況:A線程處理完了自己隊列的任務,B線程的隊列裏還有很多任務要處理。A是一個很熱情的線程,想過去幫忙,但是如果兩個線程訪問同一個隊列,會產生競爭,所以A想了一個辦法,從雙端隊列的尾部拿任務執行。而B線程永遠是從雙端隊列的頭部拿任務執行(任務是一個個獨立的小任務),這樣感覺A線程像是小偷在竊取B線程的東西一樣。

技術分享圖片

工作竊取算法的優點:

利用了線程進行並行計算,減少了線程間的競爭。

工作竊取算法的缺點:

1、如果雙端隊列中只有一個任務時,線程間會存在競爭。

2、竊取算法消耗了更多的系統資源,如會創建多個線程和多個雙端隊列。

三、框架設計

Fork/Join中兩個重要的類:

1、ForkJoinTask:使用該框架,需要創建一個ForkJoin任務,它提供在任務中執行fork和join操作的機制。一般情況下,我們並不需要直接繼承ForkJoinTask類,只需要繼承它的子類,它的子類有兩個:

a、RecursiveAction:用於沒有返回結果的任務。

b、RecursiveTask:用於有返回結果的任務。

2、ForkJoinPool

:任務ForkJoinTask需要通過ForkJoinPool來執行。

import java.util.concurrent.ExecutionException;
import java.util.concurrent.ForkJoinPool;
import java.util.concurrent.Future;
import java.util.concurrent.RecursiveTask;

public class CountTask extends RecursiveTask<Integer> {
    private static final long serialVersionUID = 1L;
    // 閾值
    private static final int THRESHOLD = 2;
    private int start;
    private int end;

    public CountTask(int start, int end) {
        this.start = start;
        this.end = end;
    }

    @Override
    protected Integer compute() {
        int sum = 0;
        // 判斷任務是否足夠小
        boolean canCompute = (end - start) <= THRESHOLD;
        if (canCompute) {
            // 如果小於閾值,就進行運算
            for (int i = start; i <= end; i++) {
                sum += i;
            }
            System.out.println(Thread.currentThread().getName()+" A sum:"+sum);
        } else {
            // 如果大於閾值,就再進行任務拆分
            int middle = (start + end) / 2;
            System.out.println(Thread.currentThread().getName()+" start:"+start+",middle:"+middle+",end:"+end);
            CountTask leftTask = new CountTask(start, middle);
            CountTask rightTask = new CountTask(middle + 1, end);
            // 執行子任務
            leftTask.fork();
            rightTask.fork();
            // 等待子任務執行完,並得到執行結果
            int leftResult = leftTask.join();
            int rightResult = rightTask.join();
            // 合並子任務
            sum = leftResult + rightResult;
            System.out.println(Thread.currentThread().getName()+" B sum:"+sum);
        }
        return sum;
    }

    public static void main(String[] args) {
        ForkJoinPool forkJoinPool = new ForkJoinPool();// 這邊也可以指定一個最大線程數
        CountTask task = new CountTask(1, 10);
        // 執行一個任務
        Future<Integer> result = forkJoinPool.submit(task);
        try {
            System.out.println(result.get());
        } catch (InterruptedException e) {
            e.printStackTrace();
        } catch (ExecutionException e) {
            e.printStackTrace();
        }

    }

}

這個程序是將1+2+3+4+5+6拆分成1+2;3+4;5+6三個部分進行子程序進行計算後合並。

技術分享圖片

四、源碼解讀

1、leftTask.fork();

技術分享圖片
1 public final ForkJoinTask<V> fork() {
2         Thread t;
3         if ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread)
4             ((ForkJoinWorkerThread)t).workQueue.push(this);
5         else
6             ForkJoinPool.common.externalPush(this);
7         return this;
8     }
技術分享圖片

fork方法內部會先判斷當前線程是否是ForkJoinWorkerThread的實例,如果滿足條件,則將task任務push到當前線程所維護的雙端隊列中。

技術分享圖片
 1  final void push(ForkJoinTask<?> task) {
 2             ForkJoinTask<?>[] a; ForkJoinPool p;
 3             int b = base, s = top, n;
 4             if ((a = array) != null) {    // ignore if queue removed
 5                 int m = a.length - 1;     // fenced write for task visibility
 6                 U.putOrderedObject(a, ((m & s) << ASHIFT) + ABASE, task);
 7                 U.putOrderedInt(this, QTOP, s + 1);
 8                 if ((n = s - b) <= 1) {
 9                     if ((p = pool) != null)
10                         p.signalWork(p.workQueues, this);
11                 }
12                 else if (n >= m)
13                     growArray();
14             }
15         }
技術分享圖片

在push方法中,會調用ForkJoinPool的signalWork方法喚醒或創建一個工作線程來異步執行該task任務。

2、

 public final V join() {
        int s;
        if ((s = doJoin() & DONE_MASK) != NORMAL)
            reportException(s);
        return getRawResult();
    }

通過doJoin方法返回的任務狀態來判斷,如果不是NORMAL,則拋異常:

 private void reportException(int s) {
        if (s == CANCELLED)
            throw new CancellationException();
        if (s == EXCEPTIONAL)
            rethrow(getThrowableException());
    }

來看下doJoin方法:

技術分享圖片
private int doJoin() {
        int s; Thread t; ForkJoinWorkerThread wt; ForkJoinPool.WorkQueue w;
        return (s = status) < 0 ? s :
            ((t = Thread.currentThread()) instanceof ForkJoinWorkerThread) ?
            (w = (wt = (ForkJoinWorkerThread)t).workQueue).
            tryUnpush(this) && (s = doExec()) < 0 ? s :
            wt.pool.awaitJoin(w, this, 0L) :
            externalAwaitDone();
    }
技術分享圖片

先查看任務狀態,如果已經完成,則直接返回任務狀態;如果沒有完成,則從任務隊列中取出任務並執行。

JAVA並行框架Fork/Join(一):簡介和代碼示例