【Flume】flume 容錯環境的搭建 failover

阿新 • • 發佈：2019-01-05

關於failover網上也有很多例子，但是看到的有多重做法，個人覺得，本著職責單一的原則

1、一臺機子執行一個flume agent

2、一個agent 的下游sink指向一個flume agent，不要一個flume agent配置多個埠【影響效能】

3、分機子配置，可以避免一臺機子司機，另一個仍可以使用，否則陪在一臺機子上通過埠區分，一旦宕機，全盤崩潰

下面看具體例項：

首先是flumet agent client的配置

priority越高，優先順序越高，會優先使用該sink

# Name the components on this agent
a1.sources = r1
a1.sinks = k1 k2
a1.channels = c1
 
# Describe/configure the source
a1.sources.r1.type = exec
a1.sources.r1.channels=c1
a1.sources.r1.command=tail -F /root/dev/biz/logs/bizlogic.log

#define sinkgroups
a1.sinkgroups=g1
a1.sinkgroups.g1.sinks=k1 k2
a1.sinkgroups.g1.processor.type=failover
a1.sinkgroups.g1.processor.priority.k1=10
a1.sinkgroups.g1.processor.priority.k2=5
a1.sinkgroups.g1.processor.maxpenalty=10000

#define the sink 1
a1.sinks.k1.type=avro
a1.sinks.k1.hostname=192.168.11.179
a1.sinks.k1.port=9876

#define the sink 2
a1.sinks.k2.type=avro
a1.sinks.k2.hostname=192.168.11.178
a1.sinks.k2.port=9876


# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1
a1.sinks.k2.channel=c1

這裡可以看到使用了sinkgroup，其中包括了兩個sink，兩個sink分別指向不同的flume agent

再來看flume agent server的配置，即179,178的配置，看一個即可

# Name the components on this agent
a1.sources = r1
a1.sinks = k1
a1.channels = c1
 
# Describe/configure the source
a1.sources.r1.type=avro
#any address to listen
a1.sources.r1.bind=0.0.0.0
a1.sources.r1.port=9876
a1.sources.r1.channels=c1

# Describe the sink
a1.sinks.k1.type = file_roll
a1.sinks.k1.sink.directory=/root/dev/flumeout/file
a1.sinks.k1.sink.rollInterval=3600


# Use a channel which buffers events in memory
a1.channels.c1.type = memory
a1.channels.c1.capacity = 1000
a1.channels.c1.transactionCapacity = 100

# Bind the source and sink to the channel
a1.sources.r1.channels = c1
a1.sinks.k1.channel = c1

可以看出flume agent client和server之間是通過avro來傳輸資料的，avro是flume內建的協議，非常方便，可以將flume整個串起來

下面先啟動flume agent server，再啟動flume agent client

測試如下：

for i in {1..100};
do echo "exec test tail -f $i  on terminator 176" >> bizlogic.log;
echo $i;
sleep 0.1;
done

往檔案中寫內容，觸發flume agent client的tail -F，這樣內容就會通過flume agent client 到memory channel中，在通過failover機制選擇優先順序高的sink去輸出，最終輸出的地方，有最後一環的flume配置中sink.type決定，可以看出是file_roll，也就是檔案形式寫到磁碟上，會按照一定方式滾動

起初啟動的時候，178和179都會產生此檔案，但是當你開始產生檔案內容的時候，也還有179才會寫入檔案內容了

至此，完整的flume failover 機制就走通了，共勉！

【centos】squid代理環境搭建

【作業系統環境】 centos 【安裝操作步驟】 1、yum安裝 yum install squid 2、代理埠配置：/etc/squid/squid.conf http_port 3128 3、使配置生效 squid -z 4、啟動服務 service squid start

【Centos】http服務環境搭建

安裝作業系統 centos 安裝配置步驟 1）yum安裝 yum install httpd 2）配置埠資訊：/etc/httpd/conf/httd.conf Listen 81 3）配置靜態網頁存放地址：/etc/httpd/conf/httd.conf DocumentRoot

【Python】windows開發環境搭建

1、準備 1）支援windows的伺服器/筆記本/桌上型電腦（64位） 2）jdk 1.8 3）Python 3.6版本 4）eclipse 4.5 或更高版本 5）PyDev eclipse外掛以上檔案需要和windows系統（64位）一致，或是都選擇32位看各

【Maven】Eclipse 開發環境搭建

1.下載maven安裝包。 2.配置環境變數。新建變數名：MAVEN_HOME 變數值：D:\maven\apache-maven-3.5.0（這是我的MAVEN路徑）編輯變數名：Path 在最前面加上：%MAVEN_HOME%\bin;（

【HBase】HBase的環境搭建及基本使用

1、HBase體系結構 2、HBase功能 HBase是一種Hadoop 資料庫，用於儲存資料和檢索資料。與RDBMS 相比，HBase可以儲存海量資料，資料條目數可達上億條，可以準實時檢索，檢索的速度達到秒級別。HBase是基於HDFS的，具有HDFS的優勢

【Android】as開發環境搭建

1.ADT Bundle開發工具集合，使用eclipse整合開發，Java語言； 2.QT，C++； 4.AS，即Andriod Studio整合開發環境。下面來介紹，谷歌推出的最新的Android開發環境——AS！ AS是目前最流行的手機應用平臺開發的開發環境，

【MAVEN】 Maven開發環境搭建

1、準備 1.1 下載maven安裝包 maven的官方下載地址是http://maven.apache.org/download.cgi 根據自己的作業系統選擇相應的版本 1.2 jdk環境變數因為maven依賴Java環境執行，所以在使用maven之前需要配置Jav

【Zookeeper】Zookeeper原始碼環境搭建出現的問題

一、ant eclipse 時提示Connection reset 從GitHub下載下來的壓縮包不是eclipse版本的工程，我們需要使用ant eclipse命令編譯成eclipse版本的專案，執行過程提示Connection reset 是編譯檔案build.xm

【Linux】伺服器執行環境搭建

前言 Linux伺服器對於我們開發者想必都不陌生，在現在大資料雲服務時代開發者或多或少都需要知道部分Linux的知識，本文詳細介紹在Linux系統的執行環境搭建（採用centos7），包括JDK、Mysql、Tomcat。採用工具這裡我使用VMwa

【Flume】flume 容錯環境的搭建 failover

關於failover網上也有很多例子，但是看到的有多重做法，個人覺得，本著職責單一的原則 1、一臺機子執行一個flume agent 2、一個agent 的下游sink指向一個flume agent，不要一個flume agent配置多個埠【影響效能】 3、分機子配置，可以

【Java】【Flume】Flume-NG啟動過程源代碼分析（一）

code extends fix tar top 依據 oid article gif 從bin/flume 這個shell腳本能夠看到Flume的起始於org.apache.flume.node.Application類，這是flume的main函數所在。　　m

【Android】Ubuntu 16.04搭建Android開發編譯環境

jdk8 per 參考 prot google官網 markdown ins 由於 log 一. 通用Android環境和工具配置 1. 系統更新升級 sudo apt-get update sudo apt-get upgrade 2. 配置ntlmaps代理上網環境

【JAVA零基礎入門系列】Day1 開發環境搭建

oracle 零基礎 ati 成功官方運行根目錄文件目錄 sys 一、安裝JDK java的sdk簡稱JDK ，去其官方網站下載最近的JDK即可。 http://www.oracle.com/technetwork/java/javase/downloads/jdk

【day01】【環境】JAVA開發環境搭建

root密碼 ins jdk1 www. jdk8 all pos java .com 1. 安裝ubuntu 17.10虛擬機 2. 安裝JDK jdk最新版：http://www.oracle.com/technetwork/java/javase/downloads/

【從0學Python】1.開發環境搭建

從0學Python 最近準備學習python了。主要是考慮到python在深度學習和爬蟲方面的應用較廣，未來發展潛力較大。而且python與java相比，語法簡潔靈活，開發效率比較高。正所謂“人生苦短，我選python！”。學習的過程打算用部落格記錄下來，這樣能給自己堅持下去的動力，也能養成一個愛總結的

【Spark核心原始碼】Spark原始碼環境搭建

目錄準備條件下載spark原始碼，並解壓開啟spark原始碼下的pom.xml檔案，修改對應的java和intellij裡的maven版本開啟intellij，Inport Project，將原始碼匯入intellij中問題總結（十分重要） Maven編譯打包前的準

高併發-【搶紅包案例】之一:SSM環境搭建及復現紅包超發問題

概述電商的秒殺、搶購，春運搶票，微信QQ搶紅包，從技術的角度來說，這對於Web 系統是一個很大的考驗. 高併發場景下，系統的優化和穩定是至關重要的. 網際網路的開發包括 Java 後臺、 NoSQL、資料庫、限流、CDN、負載均衡等內容, 目前並沒有權威性

【android筆記】android開發環境搭建--android studio安裝與配置

一、下載安裝android studio軟體目前最新的版本是3.1.2版本,下載即可. 下載完成之後開始安裝,安裝過程不難如下選擇軟體的安裝路徑安裝完成後啟動android studio 這裡預設選擇”do not i

【Flume】flume檔案監控的source元件開發，增量傳輸檔案內容，支援斷點續傳功能

基於flume-ng中原有exec的source型別，通過tail依賴於作業系統去監聽檔案內容變化，其次，不支援斷點續傳的功能，特此，自行開發了一個元件，大家可以看看，一起探討：該元件特點如下： 1、一個source對應一個檔案監控 2、實時監控檔案變化 3、增量傳輸檔

【Flume】flume中Avro Sink到Avro Source的效能測試，是否壓縮，是否加密

從官方下載的flume-ng的原始碼裡有單元測試的程式碼，本文就通過單元測試來體驗下flume中avro的效能如何本文中的一個event的body內容大小是1KB，讀者可自行組織文字，達到1KB即可，方便測試時，效能的計算先把我的程式碼貼出來 package flum

【Flume】flume 容錯環境的搭建 failover

相關推薦