1. 程式人生 > >MapReduce編程模型

MapReduce編程模型

.cn map com map() alt 列表 ron 元素 過程

MapReduce編程模型

一種分布式計算模型框架,解決海量數據的計算問題

MapReduce將整個並行計算過程抽象到兩個函數

  map(映射):對一些獨立元素組成的列表的每一個元素進行指定的操作,可以高度並行

  reduce:對一個列表的元素進行合並

一個簡單的MapReduce程序只需要指定map(),reduce(),input和output,剩下的事有框架完成。

Map Task: 解析每條數據,傳遞給用戶編寫的map().

        將map()輸出的數據寫入本地磁盤(如果是map-only作業則直接寫入HDFS)

Reduce Taks:從Map Task上遠程讀取輸入數據,對數據排序,將數據按照分鐘傳遞給用戶編寫的reduce程序

技術分享

技術分享

MapReduce編程模型