1. 程式人生 > >flume向hdfs中寫入大檔案(日誌)

flume向hdfs中寫入大檔案(日誌)

問題:

  • flume監控的目錄寫入大檔案的時候不能同步記錄在hdfs中
  • flume監控的目錄寫入大檔案的時候,同步記錄到hdfs中後變成多個小檔案
    解決辦法:更改flume的配置資訊(主要更改滾動方式),滾動的意思是當flume監控的目錄達到了配置資訊中的某一條滾動方式的時候,會觸發flume提交一個檔案到hdfs中(即在hdfs中生成一個檔案)

flume有三種滾動方式。

1.按照時間
2.按照大小
3.按照count.
如果時間不合適。可以按照大小來滾動,比如70M
rollsize=70M ,當然這裡記得換算單位

注意sink.type,如果是memory模式,注意檔案的大小,防止記憶體不足,太大可以設定sink.type = file