七十一、告警系統主腳本、告警系統配置文件、告警系統監控項目
約定:所有的腳本放在/usr/local/sbin/下
一、告警系統主腳本main.sh
# cd /usr/local/sbin/
# mkdir mon
# cd mon
# mkdir bin conf shares log mail
# cd bin
# vim main.sh
#!/bin/bash
#Written by aming.
# 告警是否發送郵件的開關
export send=1 #//意味著這個變量會有應用到所有的子腳本裏面。
# 過濾ip地址,網卡名根據自己的定義。這裏的addr,是每一臺服務器的IP地址,也可以定義hostname。
export addr=`/sbin/ifconfig |grep -A1 "
dir=`pwd`
# 只需要最後一級目錄名,等於上面pwd出來的最後一個目錄。
last_dir=`echo $dir|awk -F'/' '{print $NF}'`
# 下面一句的判斷目的是,保證執行腳本的時候,我們在bin目錄裏,不然監控腳本、郵件和日誌很有可能找不到
if [ $last_dir == "bin" ] || [ $last_dir == "bin/" ]; then
conf_file="../conf/mon.conf"
else #如果沒有在bin目錄,輸出:你應cd到bin目錄
echo "you shoud cd bin dir"
exit
fi
exec 1>>../log/mon.log 2>>../log/err.log
echo "`date +"%F %T"` load average" #打標記,是要求出系統負載
/bin/bash ../shares/load.sh #直接執行主腳本
#先檢查配置文件中是否需要監控502
if grep -q 'to_mon_502=1' $conf_file; then
export log=`grep 'logfile=' $conf_file |awk -F '=' '{print $2}' |sed 's/ //g'`
/bin/bash ../shares/502.sh
fi
二、告警系統配置文件mon.conf
mon.conf內容 路徑:/usr/local/sbin/mon/conf/mon.conf
## to config the options if to monitor
## 定義mysql的服務器地址、端口以及user、password
to_mon_cdb=0 ##0 or 1, default 0,0 not monitor, 1 monitor,cdb是數據庫名
db_ip=10.20.3.13
db_port=3315
db_user=username
db_pass=passwd
## 監控httpd 如果是1則監控,為0不監控
to_mon_httpd=0
## 監控php 如果是1則監控,為0不監控
to_mon_php_socket=0
##監控502 http_code_502 需要定義訪問日誌的路徑,因為502在訪問日誌裏,要在這個日誌裏去過濾出來
to_mon_502=1
logfile=/data/log/xxx.xxx.com/access.log
## request_count 定義日誌路徑以及域名,監控請求數,監控為1,反之0。
to_mon_request_count=0
req_log=/data/log/www.discuz.net/access.log ##這裏是同理,在這個日誌過濾,還要定義所涉及到的域名如www.discuz.net。
domainname=www.discuz.net
可以把域名和日誌全寫到子腳本裏面去,前提是沒有太多機器的情況下是可以的。
如果想把shell系統寫得非常規範化,標準化,讓腳本通用,就把各個日誌什麽的都寫到配置文件裏,這樣改起來就很方便。省得各個子腳本挨個去改。
三、告警系統監控項目load.sh
load.sh內容 路徑:/usr/local/sbin/mon/shares/load.sh
#! /bin/bash
##Writen by aming##
load=`uptime |awk -F 'average:' '{print $2}'|cut -d',' -f1|sed 's/ //g' |cut -d. -f1`
#求出load數值
if [ $load -gt 10 ] && [ $send -eq "1" ]
#當load值大於10並且send開關等於1時。
then
echo "$addr `date +%T` load is $load" >../log/load.tmp
#輸出一條日誌,這條日誌是為了發送郵件用的,輸出到的後面的文件是用來發郵件用的一個文件
/bin/bash ../mail/mail.sh [email protected] "$addr\_load:$load" `cat ../log/load.tmp`
#mail.sh(發郵件的腳本)
fi
echo "`date +%T` load is $load"
整體:負載大於10並且send等於1時,就發郵件記錄,反之,則只記錄一條日誌。
502.sh內容 路徑:/usr/local/sbin/mon/shares/502.sh
502.sh的內容和load.sh的思路一樣。
因為主腳本是一分鐘執行一次,所以,監控的是一分鐘前的日誌,所以截取一分鐘前的時間。
#! /bin/bash
d=`date -d "-1 min" +%H:%M` #截取一分鐘前的時間
c_502=`grep :$d: $log |grep ' 502 '|wc -l`
if [ $c_502 -gt 10 ] && [ $send == 1 ]; then
echo "$addr $d 502 count is $c_502">../log/502.tmp
/bin/bash ../mail/mail.sh $addr\_502 $c_502 ../log/502.tmp
fi
echo "`date +%T` 502 $c_502"
disk.sh內容(磁盤使用率) 路徑:/usr/local/sbin/mon/shares/disk.sh
思路:把所有的分區挨個看一下
#! /bin/bash
##Writen by aming##
rm -f ../log/disk.tmp
for r in `df -h |awk -F '[ %]+' '{print $5}'|grep -v Use` #把磁盤已用的過濾出來,去掉百分號。這裏awk的分隔符比較特殊,以空格和百分號兩個作為分隔符,+號代表一個或多個空格只作為一個符號來作用,比如多個空格或多個百分號。在一個字符串裏可以用多個作為分隔符。grep -v Use就是把已用兩個字也過濾掉,英文下可過濾,中文不行。
do
if [ $r -gt 90 ] && [ $send -eq "1" ] #判斷,閾值大於90就發郵件
then
echo "$addr `date +%T` disk useage is $r" >>../log/disk.tmp
fi
if [ -f ../log/disk.tmp ] #判斷這個文件是否存在,存在就直接發郵件,不存在就寫日誌。
then
df -h >> ../log/disk.tmp
/bin/bash ../mail/mail.sh $addr\_disk $r ../log/disk.tmp
echo "`date +%T` disk useage is nook"
else
echo "`date +%T` disk useage is ok"
fi
#兩個條件同時滿足就寫disk.tmp文件,不滿足就寫日誌就行了。
七十一、告警系統主腳本、告警系統配置文件、告警系統監控項目