1. 程式人生 > >spark從入門到放棄十二: 深度剖析寬依賴與窄依賴

spark從入門到放棄十二: 深度剖析寬依賴與窄依賴

文章地址:http://www.haha174.top/article/details/256658
根據hello world 的例子介紹一個什麼是寬依賴和窄依賴。
這裡寫圖片描述
窄依賴:英文全名,Narrow Dependence.什麼樣的情況,叫做窄依賴呢?一個RDD對他的父RDD只有簡單的1對1的依賴關係。也即是說。RDD的每個partition.僅僅依賴於父RDD中的一個partition。父RDD和子RDD的關係是一對一的如圖

寬依賴:英文全名 Shuffle Dependence 每一個父類的RDD都可能傳輸一部分到下一個RDD的每個partition中。此時就會出現父子RDD之間錯綜複雜的關係。那麼這種情況稱為兩個RDD之間的寬依賴。同時他們之間的操作也是shuffle.

歡迎關注,更多福利

這裡寫圖片描述