1. 程式人生 > >hadoop在讀sequence檔案時,會將檔案拷貝兩份,然後進map處理

hadoop在讀sequence檔案時,會將檔案拷貝兩份,然後進map處理

讀取sequencefile,在設定輸入路徑的時候,如果設定成

SequenceFileInputFormat.addInputPath(job, new Path(args[0]));

則會把檔案拷貝兩份。

正確的還是應該設定成:

FileInputFormat.setInputPaths(job, new Path(args[0]));

記一下