1. 程式人生 > >運行監控系統腳本

運行監控系統腳本

zabbix 告警 空格 之前 ech 郵件引擎 hour 郵件 cron

因為之前做zabbix的時候,做過mail.py的腳本,在這裏,直接復制到
mail目錄下就行
但是告警郵件引擎核心,conf主配置文件調用到的都是mail.sh ,所以這裏需要定義調用mail.py的sh腳本
mail.sh目的是做告警收斂,如果不想做告警收斂,在發現問題的時候直接告警就好,但是,可能會發生1分鐘前發現問題,1分鐘戶問題解決,這樣就會變成誤報,這樣會很麻煩
收斂的目的就是1分鐘前發現問題,然後到10分鐘後,服務還沒有恢復,就會告訴管理人員10分鐘了服務還未恢復

#!/bin/bahs
log=$1 ? 
t_s=`date +%s`
t_s2=`date -d "2 hours ago" +%s` #定義2個小時前的時間戳
#日誌不存在就創建日誌
if [ ! -f /tmp/$log ]
then
echo $t_s2 > /tmp/$log
fi
#下面這段,等同於一個計時器
t_s2=`tail -1 /tmp/$log|awk ‘{print $1}‘`
echo $t_s>>/tmp/$log
v=$[$t_s-$t_s2] //時間戳對比
echo $v
#當結果大於3600秒,就會進行告警
if [ $v -gt 3600 ]
then
./mail.py $1 $2 $3
echo "0" > /tmp/$log.txt //等同於計數器
else
#不然就重新計數
if [ ! -f /tmp/$log.txt ]
then
 ? ?echo "0" > /tmp/$log.txt
fi
nu=`cat /tmp/$log.txt`
nu2=$[$nu+1]
echo $nu2>/tmp/$log.txt
if [ $nu2 -gt 10 ]
then
 ? ? ./mail.py $1 "trouble continue 10 min $2" "$3"
 ? ? echo "0" > /tmp/$log.txt //郵件告警結束以後,重新開始計數
fi
fi 

運行告警系統

可以每分鐘執行一次主腳本來運行告警系統

crontab -e
* * * * * cd /usr/local/sbin/mon/bin ; bahs main.sh

調試,監控發送郵件的部分,有三個參數(發給誰,郵件名稱,內容),參數之間盡量少用空格,因為mail.py發送郵件是以空格來定義三個參數的

運行監控系統腳本