1. 程式人生 > >資料倉庫技術結構-隨便寫寫

資料倉庫技術結構-隨便寫寫

 

 

資料採集:採用Flume收集日誌,採用Sqoop將RDBMS以及NoSQL中的資料同步到HDFS上

訊息系統:可以加入Kafka防止資料丟失

實時計算:實時計算使用Spark Streaming消費Kafka中收集的日誌資料,實時計算結果大多儲存在Redis中

機器學習:使用了Spark MLlib提供的機器學習演算法

多維分析OLAP:使用Kylin作為OLAP引擎

資料視覺化:提供視覺化前端頁面,方便運營等非開發人員直接查詢