Shell指令碼監控、拉起Nimbus和Supervisor程序

阿新 • • 發佈：2018-12-30

Nimbus和Supervisor都是快速失敗，無狀態的程序，Nimbus的單點問題一直沒有很好的解決辦法，所以我們可以對相關程序進行監控，在其掛掉時嘗試重啟。

在之前的專案裡，比較常用的方式是通過monit對相關程序進行監控，通過monit監控需要對每臺機器進行配置，可以通過Fabric（http://www.fabfile.org）進行統一配置，這裡不詳細介紹monit監控的方式。

通過Shell指令碼可以實現在Nimbus節點上，監控整個叢集，前提是需要Nimbus節點與Supervisor建立SSH無密碼訪問。具體內容如下

main.sh

#!bin/bash
dir=`dirname $0`

while [ 1 ]
do
        echo "==========  "`date`"    ==============="
        nid=`jps -l|grep 'nimbus'|awk '{print $1}'`
        if [ "$nid" = "" ]; then
                echo  'storm nimbus is dead!'
                echo  'trying to start nimbus...'
                nohup storm nimbus >nimbus.log &
                echo 'finish starting!'
        else
                echo "storm nimbus id: $nid"
        fi

        uid=`jps -l|grep 'backtype.storm.ui.core'|awk '{print $1}'`
    if [ "$nid" = "" ]; then
        echo  'storm ui process is dead!'
                echo  'trying to start storm ui'
                nohup storm ui >ui.log &
                echo 'finish starting storm ui!'
    else
        echo "storm ui id: $uid"
    fi 

        sh $dir/storm_manager.sh start

        echo "sleeping 20s..."
        sleep 20
done

<pre name="code" class="plain" style="font-size: 18px;">storm_manager.sh

#!bin/bash

    slaves="cdn36 cdn37 cdn39 cdn21 cdn22 cdn23"
storm_dir='/data/tmp/storm'

check_supervisors(){
    for node in $slaves
    do 
        ssh  $node <<END
            source /etc/profile
            source ~/.bash_profile
            echo "=== check supervisor on $node..."
           
                        sid=\`jps |grep supervisor |awk '{print \$1}'\`
                        if [ "\$sid" = "" ] ;then
                               echo "supervisor is dead!"
                        else
                               echo "supervisor process id: \$sid"
                        fi

            echo "finishing checking $node's supervisor"
                        echo 
END
    done

}

stop_supervisor(){
        for node in $slaves
        do
                ssh $node <<END
                        source /etc/profile
                        source ~/.bash_profile
                        echo "=== killing supervisor on $node..."
                        jps |grep 'supervisor' |awk '{print \$1}' |xargs kill
                        echo "finishing killing $node's supervisor"
END
        done
}

start_supervisor(){
    for node in $slaves
    do 
        ssh $node <<END
            source /etc/profile
                        source ~/.bash_profile
           
                        sid=\`jps |grep supervisor |awk '{print \$1}'\`
                        echo "=== starting supervisor on $node..."
            if [ "\$sid" = "" ] ;then
                echo "supervisor is dead!"
                               mkdir -p ~/rzx
                    rm -fr $storm_dir/supervisor
                               cd ~/rzx
                    nohup storm supervisor >supervisor.log &
                echo "finishing starting $node's supervisor"
            else
                echo "supervisor process id: \$sid"
            fi

END
                echo

    done

}

#同步配置檔案
sync_config(){
    for node in $slaves
    do 
                scp /opt/package/apache-storm-0.9.2-incubating/conf/storm.yaml  
[email protected]$node:/opt/package/apache-storm-0.9.2-incubating/conf/
        echo "finishing sync $node config!"
    done
}


mytest(){
        for node in $slaves
        do
                ssh $node <<END
                ls
END
        done
}

if [ "$1" = "stop" ] ; then
        stop_supervisor
elif [ "$1" = "start" ]; then
        start_supervisor
elif [ "$1" = "sync" ]; then
        sync_config
elif [ "$1" = "check" ]; then
        check_supervisors
else
        mytest
fi

Shell指令碼監控、拉起Nimbus和Supervisor程序

Nimbus和Supervisor都是快速失敗，無狀態的程序，Nimbus的單點問題一直沒有很好的解決辦法，所以我們可以對相關程序進行監控，在其掛掉時嘗試重啟。在之前的專案裡，比較常用的方式是通過monit對相關程序進行監控，通過monit監控需要對每臺機器進行配置，可以

Shell指令碼監控CPU、記憶體和硬碟利用率

轉：http://blog.51cto.com/lizhenliang/1610415 1、監控CPU利用率（通過vmstat工具）　　　　 #!/bin/bash #==================================================== # Author: lizh

利用shell指令碼監控linux中CPU、記憶體和磁碟利用率。（centos7）

　　這篇部落格中所寫的，在實際工作中並沒有什麼卵用，工作中並不會用到這種指令碼去監控。不過自己寫一遍，可以讓初學者對CPU、記憶體、磁碟等一些基礎知識和基礎命令更加了解。 1、利用vmstat工具監控CPU詳細資訊，然後基於/proc/stat計算CPU利用率進行監控，超過80報警並提取出佔用cpu最高的前十

shell指令碼監控系統負載、CPU和記憶體使用情況

在沒有nagios監控軟體的情況下，只要伺服器能上網際網路，就可通過發郵件的方式來提醒管理員系統負載與CPU佔用的使用情況。一、安裝linux下面的一個郵件客戶端msmtp軟體(類似於一個foxmail的工具) 1、下載安裝： http://download

shell 指令碼監控系統記憶體佔用率、主備機等

執行結果 shell 指令碼實現 #!/bin/sh ########################################################## #作者:LINU_BW #時間:2016-10-28 #功能:監控伺服器系統IP cpu 記憶體磁碟主備&nb

十六週二次課 2018.02.05 shell指令碼介紹、shell指令碼結構和執行、date命令用法、shell指令碼中的變數

20.1 shell指令碼介紹微信公眾號部落格，20.2 shell指令碼結構和執行建立目錄，然後我們進去在裡面寫指令碼第一行是他表示接下來的命令是通過這一個直譯器操作解析的的，通常都是/bin/bash（如果你是在本機上執行那麼不用寫也行，因為它知道接下來的命令能夠在這臺機

shell(1)介紹、腳本結構和執行、date命令、腳本中的變量、腳本中邏輯判斷、文件目錄屬性判斷

shell語法一、shell腳本介紹我自定的shell腳本基本是放在/usr/local/sbin/目錄下。二、Shell腳本結構和執行腳本命令：bash +腳本文件路徑sh +腳本文件路徑查看腳本執行過程-x :bash -x 1.sh查看腳本是否語法

linux shell指令碼監控程序是否存在

用shell指令碼監控程序是否存在不存在則啟動的例項，先上程式碼乾貨： #!/bin/shps -fe|grep processString |grep -v grepif [ $? -ne 0 ]thenecho "start process....."elseecho

shell指令碼-監控python是否在執行，沒有則重啟python

有時候需要一些python指令碼去常連結一些東西，就需要監控是否執行正常。 #!/bin/bash project1='/root/1.py' project2='/root/2.py' for Pro in $project1 $project2 do PythonPid

第五週-磁碟分割槽GPT、shell指令碼練習、lvm詳解

1、描述GPT是什麼，應該怎麼使用 Linux中磁碟分割槽分為MBR和GPT。 MBR全稱為Master Boot Record，為主引導記錄，是傳統的分割槽機制，應用於絕大多數使用的BIOS的PC裝置。 MBR分割槽的特點： 1、MBR支援32位和64位的系統

shell指令碼監控啟動停止weblogic服務

有時，linux系統需要做HA或者類似的功能，需要配置weblogic指令碼來啟動，停止，檢視狀態，可以如下方式寫命令形式：Weblogic server start|stop|restart|status 1 2 3 4 5

shell指令碼專家指南筆記#4_比較和測試

## # 本文為《shell指令碼專家指南》一書的學習筆記。 ## 4. 比較和測試通用形式 if [ "$string" = "some_string" ]; then ... if [ $integer -eq 15 ]; then

shell指令碼專家指南筆記#3.日期和時間操作

## # 本文為《shell指令碼專家指南》一書的學習筆記。 ## 3.1. 用天數來計算日期 unix和linux以1970年1月1日0時0分開始計算時間，也就是所謂的時間戳，單位是秒。在系統中，可以使用 d

Shell指令碼實現軟體一鍵安裝和自動重啟(一)

前言在LINUX開發過程中，往往需要對已經開發好的軟體進行打包，一鍵安裝後程序能自動後臺啟動，當程序意外關閉後能自動重啟，本篇來介紹實現過程。業務分析對功能進行拆分 1、實現程式後臺執行，掛掉重啟的監聽器指令碼 2、將監聽器指令碼放入開機啟動項 3、實現軟體

利用shell指令碼監控redis的使用記憶體

前些天搭建的redis叢集終於在生產環境使用了，為了系統的穩定，研究了下redis的監控報警。雖然之前搭建了RedisLive，可以實時檢視redis的資訊，但是做不到實時的簡訊報警監控。目前只針

Shell指令碼監控Storm叢集，郵件報警

這個指令碼只是一個臨時的方案，在全面的監控，報警系統完成之前為了節省一定的人力而寫的之前寫過一個指令碼用來監控Storm的Nimbus和Supervisor程序，在檢測到程序不存在時會進行重啟，在實際使用中發現，該指令碼雖然可以不斷重啟，但某些情況下並不能完成自動重啟，人

shell指令碼監控rabbitmq佇列訊息數量(堵塞情況)

#!/bin/bash ################################################## # vim /etc/crontab # */30 * * * * root sh /mnt/rabbitmqMonitor/rabbitmq_monitor.cron #######

Shell指令碼——su、sudo

· su su命令臨時切換到root使用者； su [option] [使用者] 其中， -後接使用者名稱，表示登入並切換到使用者環境； -c後接命令，表示執行該命令再退出所切換的使用者環境；注： su表示切換到root使用者，但不改變root登入環境； su -表示切

shell指令碼監控資料庫連線數

logfile="./test.log" while true do sleep 1s thread_count=`mysqladmin -uroot -p1234 status |a

linux-shell指令碼,監控nginx,tomcat,redis,php-cli,磁碟狀態

郵件配置： [[email protected] sh]# which mail /bin/mail You have new mail in /var/spool/mail/root [[email protected] sh]#

Shell指令碼監控、拉起Nimbus和Supervisor程序

相關推薦