1. 程式人生 > >掌握Spark機器學習庫-02-mllib數據格式

掌握Spark機器學習庫-02-mllib數據格式

style inf 向量 ima img 技術 spark 特點 特征

MLlib

1.MLlib介紹

1)MLlib特點

2)哪些算法

3)閱讀官方文檔

MLlib提供了哪些:

  • 算法
  • 特征工程
  • 管道
  • 持久化

2.MLlib數據格式

1)本地向量

技術分享圖片

2)標簽數據

技術分享圖片

3)本地矩陣

技術分享圖片

4)分布式矩陣

技術分享圖片

5)分布式數據集:RDD,DATASET,DATAFRAME

技術分享圖片

技術分享圖片

技術分享圖片

掌握Spark機器學習庫-02-mllib數據格式