1. 程式人生 > >spark複習筆記(4):RDD變換

spark複習筆記(4):RDD變換

一、RDD變換

  1.返回執行新的rdd的指標,在rdd之間建立依賴關係。每個rdd都有一個計算函式和指向父rdd的指標

  2.Spark是惰性的,因此除非呼叫某個轉換或動作,否則不會執行任何操作,否則將觸發工作建立和執行。

  3.map()是對每個元素進行變換,應用變換函式;而mapPartitions()是對每個分割槽進行應用變換,輸入的是一個迭代器Iterator,返回的是一個新的迭代器,可以對整個分割槽進行函式的處理。