1. 程式人生 > >spark總結5 RDD

spark總結5 RDD

lec 最大 cal take collect 文件 兩種 通過 nbsp

創建RDD 有兩種方式

1 通過hdfs支持的文件系統創建 RDD, RDD裏面沒有真正要計算的數據,只記錄了一下元數據

2 從過scala集合或者數組以並行化的方式創建RDD

collect 把結果收集起來放到 scala數組裏面

reduce 匯聚 方法傳進去

count rdd有多少元素

top(2) 取RDD 最大的前兩個

take(2)取RDD前兩個

first 想到與 take(1)

takeOrdered(2,(排序規則)) 拍完序列 取前兩個

spark總結5 RDD