1. 程式人生 > >離線計算與實時計算

離線計算與實時計算

離線計算?

離線計算:批量(batch)獲取資料、批量傳輸資料、週期性批量計算資料、資料展示

代表技術:sqoop批量匯入資料、HDFS批量儲存資料、MapReduce批量計算資料、hive批量計算資料

  1. hivesql
  2. 排程平臺
  3. hadoop叢集運維
  4. 資料清洗(指令碼語言)
  5. 元資料管理
  6. 資料稽查
  7. 資料倉庫模型架構

流式計算?

流式計算:資料實時產生、資料實時傳輸、資料實時計算、實時展示

代表技術:Flume實時獲取資料、

                  kafka/metaq

實時資料儲存、

                  storm/JStorm實時資料計算、

                  Redis實時結果快取、

                  持久化儲存(mysql)

離線計算與實時計算區別?

最大的區別:實時收集、實時計算、實時展示