1. 程式人生 > >Spark2.3.2原始碼解析: 8. RDD 原始碼解析 (二) textFile 返回的RDD例項是什麼

Spark2.3.2原始碼解析: 8. RDD 原始碼解析 (二) textFile 返回的RDD例項是什麼

 

本文主要目標是分析RDD的例項物件,到底放了什麼。

從程式碼val textFile = sc.textFile(args(0)) 開始:

直接看textFile 原始碼:

你會發現呼叫的是hadoop的api,通過 hadoopFile 讀取資料,返回一個hadoopRDD物件

 

 

 

 

 

 

 

hadoopRDD 返回的結果,其實就是

1  value1

2 value2

3 value3

 

通過map進行處理,轉換為

需要的資料

value1

value2

value3

 

 

rdd,中的屬性 

id ,從0開始自增

name , 其實就是資料的路徑

 

尚未寫完,待更新。。。