1. 程式人生 > >mapreduce執行的大致流程

mapreduce執行的大致流程

1/對檔案進行切片規劃

2/啟動相應數量的maptask程序

3/呼叫FileInputFormat中的RecordReader,讀一行資料並封裝為k1v1

4/呼叫自定義的map函式,並將k1v1傳給map

5/收集map的輸出,進行分割槽和排序

6/reduce task任務啟動,並從map端拉取資料

7/reduce task呼叫自定義的reduce函式進行處理

8/呼叫outputformat的recordwriter將結果資料輸出