1. 程式人生 > >Hadoop 學習筆記 (2) -- 關於MapReduce

Hadoop 學習筆記 (2) -- 關於MapReduce

規模 pre 分析 bsp 學習筆記 reduce 數據中心 階段 圖例

1. MapReduce
定義:
是一種可用於數據處理的編程的模型
優勢:
MapReduce 本質上是並行運行的,因此可以將大規模的數據分析任務,分發給任何一個擁有足夠多機器的
的數據中心。
MapReduce 的優勢在於處理大規模數據集。
過程: (map 和 reduce)
每個階段都已 鍵值對 作為輸入和輸出
圖例:
map 函數
|
|
MapReduce 框架處理
|
|
reduce 函數

Hadoop 學習筆記 (2) -- 關於MapReduce