1. 程式人生 > >十四Spark ALS協同過濾java

十四Spark ALS協同過濾java

API
http://spark.apache.org/docs/1.6.2/api/java/index.html
機器學習裡面包含兩個包
org.apache.spark.ml  #輸入是dataframe,sql . org.apache.spark.sql.catalog

org.apache.spark.mllib

使用者產品訂單表,裡面包含欄位 使用者id, 產品id, 是否購買來預測使用者是否購買
//獲取資料轉換成RDD 1 hdfs 2SparkSql   3本地檔案系統
context.textFile("/spark/file/user-order.txt")  #hdfs中的路徑

//RDD轉換成ALS模型
ALS.train()
//把資料儲存到mysql中