1. 程式人生 > >十二道MR習題 - 2 - 多文件保存

十二道MR習題 - 2 - 多文件保存

任務 保存 map num 調用 esc 找到 set oop

題目:

需要將MR的執行結果保存到3個文件中,該怎麽做。

又是一個送分題。

對於Hadoop的MapReduce來說只需要設置一下reduce任務的數量即可。MR的Job默認reduce數量是1,需要調用job的setNumReduceTasks()方法來調整reduce任務的數量。

對於spark來說,可以調用coalesce方法或repartition方法來調整分區的數量,這樣也可以調整最終結果輸出文件的數量。關於coalesce方法和分區的關系這裏不展開了,隨便搜搜就能找到了。

#######

十二道MR習題 - 2 - 多文件保存