1. 程式人生 > >批量計算和流計算簡單比對

批量計算和流計算簡單比對

剛剛說的:收集資料 - 放到DB中 - 取出來分析 的傳統的流程,叫做批量計算,顧名思義,將資料存起來,批量進行計算。

而流式計算,也跟名字一樣,是對資料流進行實時計算,它不是更快的批計算,可以說,是完全不同的處理思路。

通過與批量計算進行對比的方式,介紹下其原理:

(1) 與批量計算那樣慢慢積累資料不同,流式計算將大量資料平攤到每個時間點上,連續地進行小批量的進行傳輸,資料持續流動,計算完之後就丟棄。

(2) 批量計算是維護一張表,對錶進行實施各種計算邏輯。流式計算相反,是必須先定義好計算邏輯,提交到流失計算系統,這個計算作業邏輯在整個執行期間是不可更改的。

(3) 計算結果上,批量計算對全部資料進行計算後傳輸結果,流式計算是每次小批量計算後,結果可以立刻投遞到線上系統,做到實時化展現。