1. 程式人生 > >mapreduce只用map來處理資料小案例,減少reduce一端資料傾斜

mapreduce只用map來處理資料小案例,減少reduce一端資料傾斜

mapreduce一般是由map和reduce分工合作來完成任務,但有時map分割槽之後資料不一致導致資料傾斜,某一個reduce任務負載過大,執行速度減慢。本案例以map代替reduce的工作來解決資料傾斜問題。

原始碼如下:


輸入,輸出執行結果如下

輸入檔案:

這裡我的centos系統不知道發什麼神經orange這一行資料一直顯示亂碼,修改了多此也沒修改成功,但是大家懂我什麼意思就好了,不用糾結


結果:

好了,map運算得出結果了。

dsa