1. 程式人生 > >Stage生成Task

Stage生成Task

情況 分享 個數 開始 過程 數量 images image sta

一、stage 的處理過程

1、從下圖可以看出stage是通過遞歸的形式,從開始依次提交每個stage,直到ResultStage。

技術分享

2、生成task的主要代碼

技術分享

3、提交到taskScheduler

技術分享

4、

技術分享

二、每個stage生成的task的個數

技術分享

技術分享

技術分享

技術分享

技術分享

從以上的幾幅圖不難發現task的數量其實只與rdd的partition的數量是一致的,所以每個stage的Task的個數其實早就已經確定。

而通過追蹤 sc.textFile 這個方法得到partition是由core數和最小值2所確定的(如下圖)。當然其他的RDD有不同的設定,但是可以知道的

是partition的數量在stage之前就確定,也就是說task的數量其實早已經確定。

技術分享

Task的具體情況,下次繼續分解。

Stage生成Task