1. 程式人生 > >RDD基本操作之Action

RDD基本操作之Action

介紹 比較 text inf count program 圖片 訪問 器)

Action介紹

在RDD上計算出來一個結果
把結果返回給driver program或保存在文件系統,count(),save

常用的Action

技術分享圖片
技術分享圖片

reduce()

接收一個函數,作用在RDD兩個類型相同的元素上,返回新元素。
可以實現,RDD中元素的累加,計數,和其它類型的聚集操作。
舉例:

val rdd = sc.parallelize(Array(1,2,3,3))
rdd.collect()

collect()

遍歷整個RDD,想driver program返回RDD的內容
需要單機內存能容納下(因為數據要拷貝給driver,一般是測試的時候使用)
大數據的時候,使用saveAsTextFile() action等。

take(n)

返回RDD中的n個元素(同時嘗試訪問最少的的partitions)
返回結果是無序的,一般為測試時候使用

top(n)

返回排序後的前n個,(根據RDD中的數據比較器)

RDD的特性

技術分享圖片
技術分享圖片
技術分享圖片
技術分享圖片
技術分享圖片
技術分享圖片

RDD基本操作之Action