日誌監控平臺搭建關於flume Kafka Elk

阿新 • • 發佈：2019-01-10

最近需要搭建一套日誌監控平臺,參考了新浪與美團的一些東西.現在實錄一下搭建與優化調整的過程

目前把這幾件放在一起的文件還不夠多,其中相當一部分因為elk的升級配置也已經不能用了,更多的是單機版的配置,完全沒有參考性.

優化的部分將等待專案與新平臺正式上線在另一篇文章寫出

拓撲圖

軟硬體配置

本機 ubuntu 14.04
線上 centos 6.5

host	本地搭建	線上環境
c1	1core 1g	4core 8g
c2	1core 1g	4core 8g
c3	1core 1g	4core 8g
c4	2core 4g	8core 32g
c5	2core 4g	4core 32g

c1	c2	c3	c4	c5
jdk+scala+zk+kafka	同左	同左	jdk+es+logstash+kibana	jdk+es

搭建

basic

新機器修改root密碼sudo passwd

建立使用者

useradd cluster
passwd cluster
chmod +w /etc/sudoers
vim  /etc/sudoers
cluster ALL=(root)NOPASSWD:ALL 
chmod -w /etc/sudoers
mkdir /home/cluster
mkdir /home/stack
chmod 777 /home/cluster
chmod 777 /home/stack

以上部分/home/stack用於儲存所需所有tar.gz包

/home/cluster作為所有軟體的安裝目錄

而後建立cluster目錄下data目錄,用於存放各元件配置,日誌,資料

scp推薦工具ZOC7

同步各個機器的hosts

127.0.0.1 localhost 
10.1.12.25 c1
10.1.12.23 c2
10.1.12.24 c3
10.1.12.27 c4
10.1.12.28 c5

分發各機器的rsa公鑰

ssh-keygen
cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
chmod 700 ~/.ssh/authorized_keys 
chmod 600 -R 
 ~/.ssh/

各機器profile設定

tar -zxvf 
sudo vim /etc/profile
export JAVA_HOME=/home/cluster/jdk
export ZK_HOME=/home/cluster/zookeeper
export KAFKA_HOME=/home/cluster/kafka
export SCALA_HOME=/home/cluster/scala
export PATH=$PATH:$JAVA_HOME/bin:$ZK_HOME/bin:$KAFKA_HOME/bin:$SCALA_HOME/bin   
替換系統預設java
sudo update-alternatives --install /usr/bin/java java /home/cluster/jdk/jre/bin/java 301 
sudo update-alternatives --config java 
java -version

前三臺機器的cluster目錄樹

drwxr-xr-x  4 root    root    4096  4月 20 14:34 data/
drwxr-xr-x  8 uucp        143 4096  3月 21 13:13 jdk/
drwxr-xr-x  7 root    root    4096  4月 20 14:30 kafka/
drwxrwxr-x  6 cluster cluster 4096  3月  4 23:30 scala/
drwxr-xr-x 10 zy      zy      4096  4月 20 14:13 zookeeper/

後兩臺機器的cluster目錄樹

drwxr-xr-x  4 zy      root    4096  4月 21 17:23 data/
drwxrwxrwx  7 zy      root    4096  4月 21 15:07 elasticsearch/
drwxr-xr-x  8 zy          143 4096  3月 21 13:13 jdk/
drwxr-xr-x 10 zy      staff   4096  3月 29 06:46 kibana/
drwxr-xr-x  5 zy      root    4096  4月 21 18:06 logstash/

開發環境下關閉防火牆

chkconfig  iptables off && service iptables status或者
ufw disable或者
systemctl stop firewalld.service && systemctl disable firewalld.service && setenforce 0

非ubuntu機器關閉SELinux

修改 /etc/selinux/config，將 SELINUX=enforcing 改為 SELINUX=disabled
selinux預設ubuntu不安裝,iptables預設也是全開放的.可以用getenforce和iptables -L命令檢視下兩個元件的狀態

同步各機器時區

cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime或者
ntpdate cn.pool.ntp.org

zookeeper配置

修改conf目錄下模板配置為zoo.cfg

tickTime=2000
initLimit=10
syncLimit=5
dataDir=/home/cluster/data/zookeeper
clientPort=2181
server.1= c1:2888:3888
server.2= c2:2888:3888
server.3= c3:2888:3888

而後

在配置的dataDir目錄下建立一個myid檔案，裡面寫入一個0-255之間的一個隨意數字，每個zk上這個檔案的數字要是不一樣的，這些數字應該是從1開始，依次寫每個伺服器。

檔案中序號要與dn節點下的zk配置序號一直，如：server.1=c1:2888:3888，那麼dn1節點下的myid配置檔案應該寫上1

各節點啟動:bin/zkServer.sh start
檢視節點狀態與leader與否bin/zkServer.sh status
檢視java程序jps

kafka配置

配置目錄下

zookeeper.properties

dataDir=/home/cluster/data/zookeeper
clientPort=2181
maxClientCnxns=0

server.properties

############### Server Basics ###############
broker.id=0
############# Socket Server Settings #############
listeners=PLAINTEXT://:9092
num.network.threads=3
num.io.threads=8
socket.send.buffer.bytes=102400
socket.receive.buffer.bytes=102400
socket.request.max.bytes=104857600
##############Log Basics ##############
log.dirs=/home/cluster/data/kafka/log
num.partitions=1
num.recovery.threads.per.data.dir=1
############ Log Retention Policy ###############
log.retention.hours=168
log.segment.bytes=1073741824
log.retention.check.interval.ms=300000
############## Zookeeper ###############
zookeeper.connect=localhost:2181
zookeeper.connection.timeout.ms=6000

producer.properties

############### Producer Basics ##############
metadata.broker.list=c1:9092,c2:9092,c3:9092
producer.type=sync
compression.codec=none
serializer.class=kafka.serializer.DefaultEncoder

consumer.properties

zookeeper.connect=c1:2181,c2:2181,c3:2181
zookeeper.connection.timeout.ms=6000
group.id=cluster-consumer-group

啟動nohup bin/kafka-server-start.sh config/server.properties &
依然jpsjps

測試

本部分的分片partitions有待調整,分散式的logstash需要分片的訊息,否則會出現訊息順序錯誤

leader上執行

bin/kafka-topics.sh --zookeeper c1:2181,c2:2181,c3:2181 --topic tt_topic --replication-factor 3 --partitions 3 --create
bin/kafka-topics.sh --zookeeper c1:2181,c2:2181,c3:2181 --topic tt_topic --describe

leader訊息傳送

bin/kafka-console-producer.sh --broker-list c1:9092,c2:9092,c3:9092 --topic tt_topic

從者訊息消費

bin/kafka-console-consumer.sh --zookeeper c1:2181,c2:2181,c3:2181 --from-beginning --topic tt_topic

elasticsearch配置

修改es資料夾所屬使用者組 chown -R cluster /home/cluster/elasticsearch 修改data資料夾所屬使用者組 chown -R cluster /home/cluster/data

es配置

cluster.name: elasticsearch
node.name: c4
path.data: /home/cluster/data/elasticsearch/data
path.logs: /home/cluster/data/elasticsearch/log
bootstrap.mlockall: true
//這行一定要填ip
network.host: 10.1.12.27
http.port: 9200
discovery.zen.ping.unicast.hosts: ["c4", "c5"]
discovery.zen.minimum_master_nodes: 2

安裝外掛

 bin/plugin install mobz/elasticsearch-head
 bin/plugin install lmenezes/elasticsearch-kopf
 bin/plugin install lukas-vlcek/bigdesk

執行bin/elasticsearch -d
狀態檢視http://10.1.12.27:9200/_plugin/head/

kibana配置

基本設定需要修改的部分

server.port: 5601
server.host: "c4"
elasticsearch.url: "http://c4:9200"

啟動nohup bin/kibana &
訪問http://10.1.12.27:5601

logstash配置

修改ruby源,修改Gemfile檔案https://ruby.taobao.org

安裝外掛

bin/logstash-plugin install logstash-input-kafka
bin/logstash-plugin install logstash-output-elasticsearch

新建kafka-logstash-es.conf

置於cluster/data/logstash/conf目錄下

input {
    kafka {
        zk_connect => "c1:2181,c2:2181,c3:2181"
        group_id => "cluster-consumer-group"
        topic_id => "tt_topic"
        reset_beginning => false 
        consumer_threads => 5  
        decorate_events => true 
        codec => "plain"
        }
    }
output {
    elasticsearch {
        hosts => ["c4:9200","c5:9200"]
        index => "logstash-log-%{+YYYY.MM.dd}"
        workers => 5
        codec => "json"
		  }
	 }

測試配置檔案

bin/logstash -f /home/cluster/data/logstash/conf/kafka-logstash-es.conf --configtest

執行

nohup bin/logstash -f /home/cluster/data/logstash/conf/kafka-logstash-es.conf  &

這個平臺搭建的後期我遇見了新的需求,對flume的定製需求越來越多,如果你不想面對這種情況,那麼可以這樣:

bin/logstash-plugin install logstash-input-log4j 
bin/logstash-plugin install logstash-output-kafka

把flume的部分替換成使用logstash來進行:

input{
    log4j {
        mode => "server"
        host => "[c1/c2/c3]"
        port => 4560
    }
}

output{
    kafka {
        bootstrap_servers => "c1:9092,c2:9092,c3:9092"
        topic_id => "tt_topic"
        workers => 5
        codec => "plain"
    }
}

同樣在log4j中配置新的SocketAppender指向掛在logstash叢集前的負載均衡.

<appender name="LOGSTASH-APPENDER" class="org.apache.log4j.net.SocketAppender">
    <param name="remoteHost" value="lb1" />
    <param name="port" value="4560" />
    <param name="Threshold" value="INFO" />
    <param name="ReconnectionDelay" value="1000" />
    <param name="LocationInfo" value="true" />
    <layout class="org.apache.log4j.PatternLayout">
        <param name="ConversionPattern" value="%-d{yyyy-MM-dd HH:mm:ss}-[%p]-[%l]-%m%n" />
    </layout>
  </appender>

想要使用多個 logstash 端協同消費同一個 topic 的話，那麼需要把兩個或是多個 logstash 消費端配置成相同的 group_id 和 topic_id

但是前提是要把相應的 topic 分多個 partitions (區)，多個消費者消費是無法保證訊息的消費順序性的

檢視後臺任務 jobs

殺掉後臺任務 kill %number

flume配置

確定jdk
上傳stack
同步hosts

flume-env.sh

export JAVA_HOME=/opt/software/java 
export JAVA_OPTS="-Xms1024m -Xmx2048m"

flume-kafka.properties

ag1.sources=src1 src2
ag1.sinks=sink1
ag1.channels=chn1

ag1.sources.src1.type = exec
ag1.sources.src1.shell = /bin/bash -c
ag1.sources.src1.command = tail -F tt.log
ag1.sources.src1.channels = chn1

ag1.sources.src2.type = exec
ag1.sources.src2.shell = /bin/bash -c
ag1.sources.src2.command = tail -F tt.log
ag1.sources.src2.channels = chn1

ag1.channels.chn1.type = memory
agent.channels.chn1.keep-alive = 60  
ag1.channels.chn1.capacity = 1000
ag1.channels.chn1.transactionCapacity = 100


ag1.sinks.sink1.type = org.apache.flume.sink.kafka.KafkaSink
ag1.sinks.sink1.topic = tt_topic
ag1.sinks.sink1.brokerList = c1:9092:c2:9092:c2:9092
ag1.sinks.sink1.channel = chn1

啟動

bin/flume-ng agent -n ag1  -c conf -f conf/flume-kafka.properties

初步成果

初步成果如圖,我們成功把22臺機器的agent安好,獲得了應用叢集上的指定日誌內容,後續的優化包括

效能
日誌filter
儲存/壓縮/備份
visualize與dashboard配置
更多視覺化外掛安裝

日誌監控平臺搭建關於flume Kafka Elk

最近需要搭建一套日誌監控平臺,參考了新浪與美團的一些東西.現在實錄一下搭建與優化調整的過程目前把這幾件放在一起的文件還不夠多,其中相當一部分因為elk的升級配置也已經不能用了,更多的是單機版的配置,完全沒有參考性. 優化的部分將等待專案與新平臺正式上線在另一篇文章

flume +kafka+SparkStreaming日誌監控平臺

流程圖採集方案#agentsectionproducer.sources= s1producer.channels= c1producer.sinks= k1#配置資料來源producer.sourc

ELK 日誌監控平臺環境搭建及使用說明

1. ELK概述 ELK，也就是Elasticsearch、Logstash、Kibana三者的結合，是一套開源的分散式日誌管理方案. Elasticsearch：負責日誌儲存、檢索和分析 LogStash：負責日誌的收集、處理 Kibana：負責日

ELK日誌分析平臺搭建全程

elk環境： OS：Centos 6.6 elasticsearch-5.6.3.tar.gzjdk-8u151-linux-x64.tar.gzkibana-5.6.3-linux-x86_64.tar.gzlogstash-5.6.3.tar.gznode-v6.11.4-linux-x64.tar

ELK日誌監控平臺

elasticsearch分布環境的搭 logstash基本應用和實戰 Redis+EL應用 ELK 應用一 elk 開源日誌分析平臺介紹 1 介紹 elasticsearch 是一個開源分布式搜索引擎，它的特點是：分布式，零配置，自動發現，索引自動分片，索引副本機制，restful風格接口

搭建ELK日誌分析平臺（上）—— ELK介紹及搭建 Elasticsearch 分散式叢集

轉：http://blog.51cto.com/zero01/2079879 筆記內容：搭建ELK日誌分析平臺（上）—— ELK介紹及搭建 Elasticsearch 分散式叢集筆記日期：2018-03-02 27.1 ELK介紹 27.2 ELK安裝準備工作 27.3 安

ELK日誌分析平臺搭建

一、使用背景當生產環境為分散式、很多業務模組的日誌需要每時每刻檢視時二、環境系統：centos 6.5 JDK：jdk1.8+ elasticsearch-6.4.2 logstash-6.4.2 kibana-6.4.2 三、安裝 1、安裝JDK

ELK(實時日誌分析平臺)搭建必備基礎知識-------logstash

預熱：基礎知識 Logstash 是一個開源的資料收集引擎，它具有備實時資料傳輸能力。它可以統一過濾來自不同源的資料，並按照開發者的制定的規範輸出到目的地。顧名思義，Logstash 收集資料物件就是日誌檔案。由於日誌檔案來源多（如：系統日

ELK(實時日誌分析平臺)搭建必備基礎知識-------filebeat

預熱：基礎知識 Beats是elastic公司的一款輕量級資料採集產品，它包含了幾個子產品： packetbeat(用於監控網路流量)、 filebeat(用於監聽日誌資料，可以替代logstash-input-file)、

基於Heka+Flume+Kafka+ELK的日誌系統

前期準備系統是centos6.6，64位機器。所用軟體版本： Logstash：2.3.3 JDK:1.8.0_25 Elasticsearch:2.3.4 Kibana:4.5.2 Heka:0.10.0 Flume:1.7.0 Zookeeper:3.4

zabbix 監控平臺搭建過程中的報錯與解決方法總結

監控 zabbix 運維自動化1.php option post_max_size 2.php option max_execution_time 3.php option max_input_time 4.php time zone 5.php bcm

inux監控平臺搭建-監控項

.com ios tel 應用層時區報警平臺頻率 class 平臺服 linux監控平臺搭建-監控項本人運維某生態互聯網監控平臺服務。過程中遇見了很多問題。目前互聯網有很多的開源監控工具：nagios、zabbix、falcon、cacti...各有優點。這裏不講

linux監控平臺搭建-內存

per 添加swap分區幫助區號 over 語言地址工作壓力 linux監控平臺搭建-內存上一篇文章說的硬盤。就寫一下。更加重要的東西。在手機上面是RAM。機器是memory。內存是按照字節編址。每個地址的存儲單元可以存放8bit的數據、cpu 通過內存地址獲

linux監控平臺搭建-cpu

get strong r+ 數據傳輸 awk 值類型分享 ctx sar命令 linux監控平臺搭建-cpu 目前服務器的主流CPU是intel或者AMD。到底主頻是什麽。多核、多線程、並發、並行、超頻、一級緩存、二級緩存、三級緩存。i386、x86 cpu：含

centos6.5lnmp環境 zabbix監控平臺搭建

zabbix lamp 監控 nginx+php centos6.5 一：安裝nginx~安裝依賴[root@localhost ~]# yum -y install pcre* openssl* 編譯安裝 [root@localhost ~]# ls anaconda-ks.

Linux監控平臺搭建

監控Linux監控平臺搭建 linux監控平臺介紹 zabbix監控介紹安裝zabbix linux監控平臺介紹 cacti、nagios、zabbix、smokeping、open-falcon等等cacti、smokeping偏向於基礎監控，成圖非常漂亮cacti、nagios、zabbix服務端

linux監控平臺搭建(2)主動和被動模式、添加監控主機、添加自定義模板、處理圖形亂碼、自動發現

添加監控主機主動和被動模式添加主機添加主機：1.添加主機群組：2.添加主機：點擊主機-->創建主機(1)應用集：是監控項的集合（如：cpu的集合，內存的集合）(2)監控項：監控的項目（cpu,內存）(3)觸發器：對監控項設定的告警規則，和告警級別。(4)圖形

linux監控平臺搭建(3)添加自定義監控項目、配置郵件告警、測試警報、不發郵件的問題處理

zabbix配置郵件告警添加自定義監控項目很多的監控項，我們都是在配置的模板中設置的，但是模板的選擇是不能完全滿足到我們生產中的實際需求。所以我們可以自定義監控項目，通過編寫Shell腳本或者python腳本，在腳本中獲取數據庫中所需業務的數，然後在通過在監控項裏添加這個腳本，將腳本獲

Linux監控平臺——搭建zabbix監控平臺

搭建zabbix監控平臺19.1 Linux監控平臺介紹常見開源監控軟件 cacti、nagios、zabbix、smokeping、open-falcon等等。cacti、smokeping偏向於基礎監控，成圖漂亮。cacti、nagios、zabbix服務端監控中心，需要php環境支持，其中zabbi

Linux監控平臺搭建-zabbix

zabbixzabbix監控介紹 C/S架構，基於C++開發，監控中心支持web界面配置和管理單server節點可以支持上萬臺客戶端最新版本3.4，官方文檔https://www.zabbix.com/manuals 5個組件 zabbix-server 監控中心，接收客戶端上報信息，負責配置、統計、操

日誌監控平臺搭建 關於flume Kafka Elk

拓撲圖

軟硬體配置

搭建

basic

zookeeper配置

kafka配置

elasticsearch配置

kibana配置

logstash配置

flume配置

初步成果

相關推薦

日誌監控平臺搭建關於flume Kafka Elk