1. 程式人生 > >大數據-基於Spark的機器學習-智能客戶系統項目實戰

大數據-基於Spark的機器學習-智能客戶系統項目實戰

spark

大數據-基於Spark的機器學習-智能客戶系統項目實戰

網盤地址:https://pan.baidu.com/s/19-U_XwIUZUENNgmz6VysMQ 密碼: j288

備用地址(騰訊微雲):https://share.weiyun.com/90d4d9196a9d86c74aabe8df78cdc624 密碼:uq2q3w

項目背景:
1、現在很多平臺客戶關系管理系統都是使用傳統的CRM,所有的信息全靠手工錄入,用戶尋找上下遊企業或者信息只能靠手工去查找並且標註。

2、大數據時代的到來,人工智能,雲計算,先進的分析,用機器去替代人工的部分,從 2016 年趨勢看,機器學習和人工智能 (AI) 將在未來幾年內將會徹底改變 CRM。

因此我們對CRM進行了改造,主要有如下部分:
1、企業信息、商品信息來自互聯網,機器學習去自動統計分析並且分類。
2、用戶錄入的商品信息和新從互聯網爬來的商品信息全部通過機器學習計算的模型去分類。
3、機器學習自動計算企業和供求信息上下遊。
4、機器學習每隔一段時間自動去優化計算模型。

整個項目基本思路是如何通過爬蟲爬取大量數據放到Hbase,然後通過ETL工具初步轉化篩選將數據存到mongodb,抽取mongodb的數據進行清洗處理算出模型放到hdfs。後續進來數據通過模型運算出數據的類型。項目系統主要包括前端+後端+機器學習,前端采用React Native,Native,後端采用Dubbo+Spring+java,機器學習采用Spark進行實現,本項目機器學習-spark代碼運行在mesos上。

大數據-基於Spark的機器學習-智能客戶系統項目實戰