用Flume採集多臺機器上的多種日誌並存儲於HDFS

阿新 • • 發佈：2019-02-13

需求：

把A、B 機器中的access.log、ugcheader.log、ugctail.log 彙總到C機器上然後統一收集到hdfs中。
IP: A:155 B:156 C：162
但是在hdfs中要求的目錄為：
/source/access/20160101/**
/source/ugcheader/20160101/**
/source/ugctail/20160101/**

結構：

這裡寫圖片描述
B機器同A機器。

Conf：

A機器：

# Name the components on this agent
a1.sources = r1 r2 r3
a1.sinks = k1
a1.channels = c1

# Describe/configure the source 

a1.sources.r1.type = exec
a1.sources.r1.command = tail -F /opt/data/access.log
a1.sources.r1.interceptors = i1
a1.sources.r1.interceptors.i1.type = static
a1.sources.r1.interceptors.i1.key = type
a1.sources.r1.interceptors.i1.value = access

a1.sources.r2.type = exec
a1.sources.r2.command = tail -F /opt/data/ugchead.log 

a1.sources.r2.interceptors = i2
a1.sources.r2.interceptors.i2.type = static
a1.sources.r2.interceptors.i2.key = type
a1.sources.r2.interceptors.i2.value = ugchead

a1.sources.r3.type = exec
a1.sources.r3.command = tail -F /opt/data/ugctail.log
a1.sources.r3.interceptors = i3
a1.sources.r3.interceptors 
.i3.type = static
a1.sources.r3.interceptors.i3.key = type
a1.sources.r3.interceptors.i3.value = ugctail


# Describe the sink
a1.sinks.k1.type = avro
a1.sinks.k1.hostname = 192.168.1.162
a1.sinks.k1.port = 41414

# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sources.r2.channels = c1
a1.sources.r3.channels = c1
a1.sinks.k1.channel = c1

B機器同A機器。

C機器：

a1.sources = r1
a1.sinks = k1
a1.channels = c1

# Describe/configure the source
a1.sources.r1.type = avro
a1.sources.r1.bind = 0.0.0.0
a1.sources.r1.port = 44444

# source r1定義攔截器，為訊息新增時間戳
a1.sources.r1.interceptors = i1
a1.sources.r1.interceptors.i1.type = org.apache.flume.interceptor.TimestampInterceptor$Builder


#具體定義sink
a1.sinks.k1.type = hdfs
a1.sinks.k1.hdfs.path = hdfs://192.168.1.156:9000/source/%{type}/%Y%m%d
#指定檔案字首
a1.sinks.k1.hdfs.filePrefix = events-
#不壓縮
a1.sinks.k1.hdfs.fileType = DataStream
#如果壓縮指定壓縮的方式
#a1.sinks.k1.hdfs.fileType = CompressedStream
#a1.sinks.k1.hdfs.codeC = gzip
#不按照條數生成檔案
a1.sinks.k1.hdfs.rollCount = 0
#如果壓縮儲存的話HDFS上的檔案達到64M時生成一個檔案注意是壓縮前大小為64生成一個檔案，然後壓縮儲存。
a1.sinks.k1.hdfs.rollSize = 67108864
a1.sinks.k1.hdfs.rollInterval = 0

# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 10000
a1.channels.c1.transactionCapacity = 1000

# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

用Flume採集多臺機器上的多種日誌並存儲於HDFS

需求：把A、B 機器中的access.log、ugcheader.log、ugctail.log 彙總到C機器上然後統一收集到hdfs中。 IP: A:155 B:156 C：162 但是在

Hexo部落格系列(二)-在多臺機器上利用Hexo釋出部落格

針對在公司及家裡的電腦上都有編輯釋出部落格的可能，或者多人同時維護一個部落格的情況，需要在多臺機器上配置環境好環境，然後將Git倉庫中的部落格更新下來，繼續編輯釋出部落格。個人是將部落格託管在Gitee（碼雲）的倉庫，將NexT主題託管在Github上的倉庫。因為部落格原始碼需要放在私有倉庫（Github

讓Python3支援SQLMap（用virtualenvwrapper切換同一臺機器上的不同Python版本環境）

說明：由於Python2.*和Python3.*之間互相不相容，因此很多第三方工具也存在Python2和Python3之間的選擇性相容，比如SQLMap只相容Python2。還有Python2的老專案和Python3的新專案之間也需要Python環境的切換。本文暫且記錄下直接

git 在一臺機器上配置多個賬戶

rac ssh xxxxxx pla 必須 account ack entity 設置前提：必須知道怎樣配置git賬戶，請參考git官方教程：https://help.github.com/articles/generating-ssh-keys 這個教程能教你怎

如何在同一臺機器上安裝多個MySQL的實例（轉）

其他搭建如果 com 啟動mysql default vim 比喻 width 　　最近由於工作的需要，需要在同一臺機器上搭建兩個MySQL的實例，（註：已經存在了一個3306的MySQL的實例）。　　先說下，什麽是mysql的多實例，簡單的來說就是一臺機器上安裝了多個

同一臺機器上多個tomcat啟動造成的內存溢出問題的解決方法。

-xms maxperm size blog 內存溢出 max gpo 解決 rms 加下面這句話就行了，我是WIN10+雙tomcat+nginx（本地站點），無壓力。在編譯器的vm option裏面加哦。 -server -Xms512m -Xmx1024m -X

在同一臺機器上啟動多個tomcat服務

技術服務 target 們的 home default catalina server cat 一臺機器上啟動多個tomcat服務應用，能夠讓我們更好的測試下自己的分布式應用，下面簡單介紹下如何在一臺機器上開啟多個tomcat應用，其實會弄兩個，之後的多個都是一樣的了

如何在同一臺機器上安裝多個MySQL的實例轉

oal 源碼包就會端口號 tar 進程信息什麽 cnblogs https://www.cnblogs.com/shangzekai/p/4375271.html 最近由於工作的需要，需要在同一臺機器上搭建兩個MySQL的實例，（註：已經存在了一個3306

在同一臺機器上實現主從複製,多個mysql(windows)

最近在自學,看到了mysql的主從複製,覺得挺有意思的,就研究了下.無奈試了多種方法均以失敗告終,最後只好在同一臺機器上安裝多個mysql.試試主從複製. 一共試了三種方式,目前只成功了一種. 1.用雲伺服器坐從伺服器,本地的電腦做主伺服器

Nginx一臺機器上負載均衡多個Tomcat

預設你的機器上安裝了Java環境，解壓了Tomcat，安裝了Nginx。預設這幾個tomcat都部署在一臺機器上。對於Tomcat需要改三個地方【你部署的所有tomcat這三個地方都不能一樣，如果你部署在不同機器上就不用改了】 vi [你的tomcat路徑]/conf/

一臺機器上搭建多個redis例項的配置檔案修改部分

1、單個redis服務搭建請參考：redis服務搭建 2、一臺Redis伺服器，分成多個節點，每個節點分配一個埠（6380，6381…），預設埠是6379。每個節點對應一個Redis配置檔案，如： redis6380.conf、redis6381.conf #cp redis.conf

在一臺機器上搭建多個redis例項

預設Redis程式安裝在/usr/local/redis目錄下；配置檔案：/usr/local/redis/redis.conf，該配置檔案中配置的埠為預設埠：6379；Redis的啟動命令路徑：/usr/local/bin/redis-server。可以指定埠啟動多個Red

如何在同一臺機器上安裝執行多個Tomcat

安裝首個Tomcat的過程不再複述。 1.首先配置兩個新的環境變數CATALINA_BASE2和CATALINA_HOME2，其中加2是為了區分伺服器，數值為新Tomcat的地址。 2.替換bin資料夾中catalina.bat和startup.bat檔案中的CATALIN

利用 Docker 在一臺機器上部署多個 Redis 例項

docker run -p 20001:6379 -d redis redis-server --appendonly yes docker run -p 20002:6379 -d redis redis-server --appendonly yes doc

在同一臺機器上安裝多個版本jdk，修改環境變數不生效

本機已經安裝了jdk1.6，而比較早期的專案需要依賴jdk1.5，於是同時在本機安裝了jdk1.5和jdk1.6. 安裝jdk1.5前，執行java -version得到 java version "1.6.0_38" Java(TM) SE Runtime

如何在同一臺機器上安裝多個版本的Java

開發十年，就只剩下這套架構體系了！ >>>

appuim-java，同時連接多臺機器，啟動微信

res med 代碼重復 col unicode src 驅動 pro 1.配置appuim信息第一臺機第二臺機類似，連接端口和監聽端口不能重復 2.appuim連接手機，微信中打開debugx5.qq.com，信息-》TBS settings-》是否打開TB

在多臺手機上批量安裝apk

bre self class init spl adb命令 a13 onu pla 1.手機要打開adb調試 2.該程序可以實現臺android手機的多個apk批量安裝 1.getSeriaoNum.py模塊，該模塊獲取已連接手機的序列號 import os imp

使用expect自動化批量向多臺機器分文件

變量生產場景批量 cat lin 解釋基本 uptime 功能自動化運維的過程中，某些時候我們需要受用輸入密碼，這時候Expect這個工具可以完成。首先要安裝expect，直接yum安裝就可以的。下來我們試試expect這個工具：使用ssh登陸：#!/bin/ex

通過scp一鍵把應用發布到多臺機器

pty rpmdb keys install exist mage ssh base bin [TOC] 前言分布式應用通常要發布到非常多的機器，需要保持每臺一致性，減輕工作量。可使用scp命令。 ssh-keygen ssh-keygen，直接回車，不用輸入。 [web

用Flume採集多臺機器上的多種日誌並存儲於HDFS

需求：

結構：

Conf：

相關推薦