1. 程式人生 > >關於從kafka采集數據到flume,然後落盤到hdfs上生成的一堆小文件的總結

關於從kafka采集數據到flume,然後落盤到hdfs上生成的一堆小文件的總結

src com 保存 pic width 配置 png hdfs alt

采集數據到kafka,然後再通過flume將數據保存到hdfs上面。在這個過程當中出現了一堆的問題。

(1)一直是提醒說必須指定topic,然後發現我kafka用的是0.9.0.1,然而我的flume用的是1.6.然後將flume的版本調為1.7之後問題解決了。

技術分享

(2)flume能夠正常啟動。然而這個時候采集的文件是一堆小文件。

技術分享

然後查看配置文件,修改配置文件。

技術分享

依然是生成了一堆小文件。最終的解決方法是:

將Hadoop配置文件裏面的相關文件加入到flume的conf目錄下。使這個配置文件能夠生效。識別這個當中的相關的配置文件。

技術分享

關於從kafka采集數據到flume,然後落盤到hdfs上生成的一堆小文件的總結