測試將web日誌流檔案寫入hdfs的配置檔案

阿新 • • 發佈：2018-12-11

a1.sources = r1
a1.sinks = k1
a1.channels = c1

a1.sources.r1.type = spooldir
a1.sources.r1.spoolDir =/home/hadoop/log
a1.sources.r1.fileHeader = true


a1.sinks.k1.type = hdfs
a1.sinks.k1.channel = c1
a1.sinks.k1.hdfs.path = /flume/events/%Y-%m-%d/
a1.sinks.k1.hdfs.filePrefix = events-
a1.sinks.k1.hdfs.round = true
a1.sinks.k1.hdfs.roundValue = 10
a1.sinks.k1.hdfs.roundUnit = second
a1.sinks.k1.hdfs.rollInterval = 2
a1.sinks.k1.hdfs.rollSize = 10240
a1.sinks.k1.hdfs.rollCount = 256
a1.sinks.k1.hdfs.batchSize = 50
a1.sinks.k1.hdfs.useLocalTimeStamp = true

a1.sinks.k1.hdfs.fileType = DataStream

a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

是監控資料夾，看一下寫在hdfs之後的樣子，速度很快。

在這裡插入圖片描述

需要注意的是：我監控的是整個資料夾，寫完之後，flume會將這個資料夾的名字在後面加上一個.COMPLMETED
加上了這個字尾之後，下次就不會監控這個檔案夾了。我之前測試的時候，沒注意到這一點，發現一直都沒往hdfs上寫檔案，我還傻傻等半天。

後面我又修改了配置檔案，如果不修改的話，那麼生成太多的檔案，執行MapReduce程式會非常地卡。

a1.sources = r1
a1.sinks = k1
a1.channels = c1

a1.sources.r1.type = spooldir
a1.sources.r1.spoolDir =/home/hadoop/log
a1.sources.r1.fileHeader = true


a1.sinks.k1.type = hdfs
a1.sinks.k1.channel = c1
a1.sinks.k1.hdfs.path = /flume/events/%Y-%m-%d/
a1.sinks.k1.hdfs.filePrefix = events-
a1.sinks.k1.hdfs.round = true
a1.sinks.k1.hdfs.roundValue = 10
a1.sinks.k1.hdfs.roundUnit = second
a1.sinks.k1.hdfs.rollInterval = 3
a1.sinks.k1.hdfs.rollSize = 1048576
a1.sinks.k1.hdfs.rollCount = 0
a1.sinks.k1.hdfs.batchSize = 50
a1.sinks.k1.hdfs.useLocalTimeStamp = true

a1.sinks.k1.hdfs.fileType = DataStream

a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

測試將web日誌流檔案寫入hdfs的配置檔案

a1.sources = r1 a1.sinks = k1 a1.channels = c1 a1.sources.r1.type = spooldir a1.sources.r1.spoolDir =/home/hadoop/log a1.sources.r1.fileHeader =

Mysql 流增量寫入 Hdfs（一） --從 mysql 到 kafka

一. 概述在大資料的靜態資料處理中，目前普遍採用的是用 Spark + Hdfs （Hive / Hbase）的技術架構來對資料進行處理。但有時候有其他的需求，需要從其他不同資料來源不間斷得采集資料，然後儲存到 Hdfs 中進行處理。而追加（append）這種操作在 Hdfs 裡面明顯是比較麻煩的一件事

Web日誌流處理的MapReduce程式 -- 兩個（一個使用Collections排序一個使用MapReduce本身的排序）

我的這兩個專案程式碼地址： Collections排序： https://gitee.com/tanghongping/web_click_mr_hve MapReduce排序： https://gitee.com/tanghongping/MapReduceTest 這兩個專案裡面會有

matlab將矩陣（影象）寫入.raw格式檔案

筆者近期在將bmp影象格式影象轉為raw過程中遇到了一些問題，主要是fwrite在寫入矩陣時的元素順序問題。要想保證儲存後的raw影象能夠正常的用ps開啟，需要將元素按正確的順序儲存。 matlab中fwrite在寫入矩陣時是列優先的，也就是先寫入第1列，再第二列....一

web工程讀取自定義xml配置檔案的方法

以前都是在c++中我都是習慣用ini配置檔案，接觸webx框架後，一般都是用得配置好的xml檔案，偷懶結果就是把自己給坑了。在需要自定義配置檔案的之後踩到了坑，特此記錄下。此處我想讀取

spark執行時載入hive，hdfs配置檔案

以前我用spark連線hive都是把hive的配置檔案放在spark的conf目錄，後來有個專案在執行時才能確定要連線哪個hive源，我就找了個能在執行時載入配置檔案的方法，程式碼如下： import org.apache.hadoop.conf.Configuration i

Shell讀取hdfs配置檔案內容

hdfs上檔案內容 [[email protected] test]# hdfs dfs -cat /test/jdbc.properties jdbc.driverClassName=com.mysql.jdbc.Driver jdbc.url=jdbc:mysql://

Java學習筆記10--位元組流；字元流；序列流；物件的輸入輸出流；Properties（配置檔案類）；列印流；編碼

∆ 位元組流、字元流 ∆ SequenceInputStream(序列流) 序列流，對多個流進行合併。 SequenceInputStream 表示其他輸入流的邏輯串聯。它從輸入流的有序集合開始，並從第一個輸入流開始讀取，直到到達

常見的可以寫入VIM配置檔案中的設定引數

常見的可以寫入.vimrc檔案中的設定引數設定引數含義：set nu ：set nonu 設定與取消行號 :syn on :syn off 是否依據語法顯示相關的顏色幫助，

classpath：和classpath*：的區別以及web.xml中載入多個配置檔案

首先我們都知道要使用spring，則需要在web.xml中增加如下程式碼： Xml程式碼 <listener> <listener-class> org.springfram

getResourceAsStream()在web專案中獲取不到配置檔案的原因

問題：使用Object.class.getResourceAsStream()在web專案中獲取不到配置檔案，單純java應用程式測試卻可以，放在web專案中就報空指標。 1.先放出來目錄 2.java應用程式測試沒有問題 3.當放入web專案執行後直接顯示

java 讀取檔案寫入到新檔案

/** * 把目標檔案寫到新路徑 * @param fileURL 目標檔案目錄 * @param readFileName 原檔案 * @param writeFileName 新檔案目錄 * @throws IOEx

將DELPHI資料庫連線寫進INI配置檔案中

procedure TDM.DataModuleCreate(Sender: TObject); var piececonfg:Tinifile; pathconfgstr,Providerstr,UserIDstr, Passwordstr,DataSourceStr,Da

vs2015 開啟專案或者建立新WEB專案失敗，無法讀取配置檔案 redirection.config

在網上沒有類似的解決方法，所以特意寫下來。經過： 1、當前開啟的的是32位的VS2015，所以在C:\Program Files (x86)裡面IIS Express夾查詢檔案，結果也能找到 redirection.config這個檔案 2、檢查這個檔案的許可權，新增

Java讀取/寫入Yaml配置檔案

JYaml檔案流讀取/寫入Yaml配置檔案 yaml配置檔案格式規範：- 表示sequence(list列表結構)，: 表示map鍵值對 #以下是示例yaml結構 age: 23 child

Java-log4j一直輸出Debug級別的日誌資訊，修改log4j配置檔案後依然如此

如果在之前啟動專案的時候，日誌資訊列印還正常；因為引入了某個架包之後出現“控制檯只能列印Debug級別日誌”的錯誤，就是因為你匯入的架包和log4j架包衝突所導致。解決辦法很簡單，將引入的架包去除衝突就可以了： <dependency>

Spring Boot 以流的方式讀取配置檔案

問題說明在以往的專案中，我們有時會讀取資源目錄下的*.config檔案，有時會讀取絕對路徑，還挺好用，但是這種做法在Spring Boot專案中就不好使了。因為Spring Boot專案把

tp5 File檔案寫入(生成靜態檔案)

利用\think\template\driver\File.php檔案整合buildHtml 1.在controller.php建立方法如下 /** * 建立靜態頁面 * @access protected * @htmlfile 生成的靜態檔名稱

MySQL-載入配置檔案並通過配置檔案連線資料庫

package demo5; import java.io.IOException; import java.io.InputStream; import java.sql.Connection; import java.sql.DriverManager; import java.sql.S

icf檔案，連結配置檔案

icf是連結配置檔案（Linker configuration file）字尾名。 stm32韌體庫中存放路徑為： STM32F0xx_StdPeriph_Lib_V1.5.0\Projects\STM32F0xx_StdPeriph_Templates\EWARM\

測試將web日誌流檔案寫入hdfs的配置檔案

相關推薦