1. 程式人生 > >運維監控篇(2)_Zabbix簡單的效能調優

運維監控篇(2)_Zabbix簡單的效能調優

Zabbix是一款高效能的分散式監控報警系統。比如現在常見的家用桌上型電腦配置處理器I5-3470、記憶體4GB1600MHz、硬碟7200rpm就能夠監控1000臺左右的HOST,是的沒錯Zabbix就是可以達到這樣的高效能。Zabbix執行時間長了會出現小小的瓶頸,小小瓶頸中最大的瓶頸是資料庫。怎樣解決瓶頸,提供一些可能的方法。

首先在zabbix-server上也裝上zabbix-agent,並啟用Template App Zabbix Server模板,監控zabbix-server服務內部的各項引數。啟用模板後會新增加相應的監控項item、圖形graph、觸發器trigger。

類似這樣的監控項會增加不少

zabbix02e

新增加的圖形zabbix02a

類似這樣的觸發器也會增加很多zabbix02b

然後當Zabbix Server出現效能瓶頸的時候就會發出報警,根據觸發器的報警項,來更改zabbix-server的配置引數來適應當前工作環境環境。

下面分析可能出現的情景

1、關於 Zabbix data gathering process busy 問題(server收集資料時zabbix-server各個程序的效能監控)
監控項如下:zabbix02c

比如discoverer監控項報警:“Zabbix discoverer processes 75% busy”其實這時候檢視這項的監控圖或監控值可能達到了100%。
解決方法。編輯配置檔案/usr/local/zabbix/etc/zabbix-server.conf,將StartDiscoverers引數增大,預設為1,將該引數增大到合適的數值,比如5.然後重啟zabbix-server就好了,如果開啟discoverer服務程序的利用率還繼續飆高則繼續增大discoverer啟動程序數。

[[email protected] ~]#vim /usr/local/zabbix/etc/zabbix-server.conf StartDiscoverers=5 [[email protected] ~]#/etc/init.d/zabbix_server restart

比如 ipmi pinger監控項報警:“Zabbix icmp pinger processes more than 75% busy”,同樣更改server的配置檔案,增大引數StartPingers,由預設的1改為合適的數值,比如5。然後重啟zabbix-server就好了。

[[email protected] ~]#vim /usr/local/zabbix/etc/zabbix-server.conf StartPingers=5 [[email protected] ~]#/etc/init.d/zabbix_server restart

這個程序負載監控圖各個監控項對應配置檔案的引數和預設值如下,當某個程序負載過高時調整相應的值:

Zabbix busy trapper processes, in %                   StartTrappers=5 Zabbix busy poller processes, in %                      StartPollers=5 Zabbix busy ipmi poller processes, in %               StartIPMIPollers=0 Zabbix busy discoverer processes, in %                StartDiscoverers=1 Zabbix busy icmp pinger processes, in %              StartPingers=1 Zabbix busy http poller processes, in %                StartHTTPPollers=1 Zabbix busy proxy poller processes, in %              StartProxyPollers=1 Zabbix busy unreachable poller processes, in %    StartPollersUnreachable=1 Zabbix busy java poller processes, in %                 StartJavaPollers=0 Zabbix busy snmp trapper processes, in %            StartSNMPTrapper=0 Zabbix busy vmware collector processes, in %       StartVMwareCollectors=0

2、關於 Zabbix cache usage 問題(server各種快取資料空閒值的監控)
監控項如下:zabbix02d
這個快取監控圖各個監控項對應配置檔案的引數和預設值如下,當某項buffer不夠時增大容量到合適的值:

Zabbix-server: Zabbix trend write cache, % free TrendCacheSize=4M Zabbix-server: Zabbix configuration cache, % free CacheSize=8M Zabbix-server: Zabbix text write cache, % free HistoryTextCacheSize=16M Zabbix-server: Zabbix history write cache, % free HistoryCacheSize=8M Zabbix-server: Zabbix value cache, % free ValueCacheSize=8M Zabbix-server: Zabbix vmware cache, % free VMwareCacheSize=8M

3、監控項Item得設定合適的資料取樣間隔interval,一般不要小於1分鐘,對於長時間不變的量如記憶體總大小、磁碟總大小等應該儘量間隔時間大點比如一天(1d)或一週(1w)。

4、實在Host太多,還能怎樣只能拆分架構,採用分散式架構減輕zabbix server 的壓力,將這些壓力分擔到proxy上去。

5、歷史資料是資料庫爆滿的主要原因。減少歷史資料的儲存時間,預設是90天,可以調成7天或更少,放心zabbix還儲存著趨勢資料,巨集觀上歷史資料不會丟。

6、對history型別的(history、history_uint等)大表進行拆分操作,關閉housekeeper禁止自動定期清除歷史記錄資料,因為對於資料庫特別是對於InnoDB引擎大資料刪除貌似很蛋疼。

相關推薦

監控(2)_Zabbix簡單效能調

Zabbix是一款高效能的分散式監控報警系統。比如現在常見的家用桌上型電腦配置處理器I5-3470、記憶體4GB1600MHz、硬碟7200rpm就能夠監控1000臺左右的HOST,是的沒錯Zabbix就是可以達到這樣的高效能。Zabbix執行時間長了會出現小小的瓶頸,小小瓶頸中最大的瓶頸是資料庫。怎樣解

監控(4)_Zabbix SNMP裝置監控

支援SNMP協議的裝置有很多,比如交換機、Linux伺服器、印表機等大部分的網路裝置(聯網的裝置)。運維監控中最常見的就是交換機了(Linux伺服器採用Agent的方式監控),zabbix中監控SNMP裝置可以這樣整(以交換機為例)。 1、首先新增SNMP裝置,這裡主要是交換機,zabbix新增監控主機

mysql簡單效能調(一)

以前都是做小專案,資料庫表的資料一般都不超過十萬條。最近接手一考試專案,個別表的資料已經超過四百萬的資料量。資料庫一直沒有優化過,所幸表字段不多,並沒有照成很大的隱患。藉此機會學習一下mysql的效能調優。 mysql讀取sql語句順序 一條sql語句經過機器解析,會分成若干

JVM效能調2:JVM效能調引數整理

關閉新生代收集擔保。 在一次理想化的minor gc中,Eden和First Survivor中的活躍物件會被複制到Second Survivor。然而,Second Survivor不一定能容納下所有從E和F區copy過來的活躍物件。為了確保minor gc能夠順利完成,GC需要在年老代中額外保留一塊

Hbase 日常監控效能指標調

1.1監控Hbase執行狀況 1.1.1作業系統 1.1.1.1IO a.群集網路IO,磁碟IO,HDFS IO IO越大說明檔案讀寫操作越多。當IO突然增加時,有可能:1.compact佇列較大,叢集正在進行大量壓縮操作。 2.正在執行mapreduce作業 可以通過CDH前臺檢視整個叢集綜合的資料或進入指

監控大數據的提取與分析

monitor 運維監控 本文內容整理來自【敏捷運維大講堂】蔣君偉老師的線上直播分享。分別從以下3個維度來分享:1、雲時代監控分析的窘境;2、使用標簽標記監控數據的維度;3、監控數據應用場景。雲時代監控分析的窘境在虛擬化與容器技術廣泛應用的情況下,運維對象大規模地增長,監控平臺每天存儲的指標都以億計,

linux雲自動化基礎知識2(系統的基本操作)

linux運維切換用戶 如圖所示:在命令提示符之後輸入su - username 註意:高級用戶切換到低級用戶不需要密碼,低級用戶切換身份需要密碼。註意:此處密碼無回顯。2.虛擬控制臺:Ctrl+Alt+F(1|7) 進入圖形 Ctrl+Alt+F(2~6) 進入虛擬控制

zabbix監控 (1)

zabbix 監控一、監控概述1 分類:硬件監控 ----系統監控 ---- 應用監控 ---- 業務監控 ---- 安全監控 ---- 網絡監控 ----WEB監控 ---- 自動化監控 -----分布式監控 2 內容:磁盤容易壞、CPU(負載、用戶態及內核態、使用率) 、內存(使用率、尋址、大頁面內存)

IT監控解決方案介紹

rdquo one 雲監控 時間片 公眾 res 企業級 bat 效率 IT運維監控解決方案介紹 現狀 •小公司/ 創業團隊?< 500臺服務器規模? 開源方案:Zabbix、Nagios、Cacti…? 雲服務提供商:監控寶、on

寫了一款自動監控工具

signal 發送 監控 自動 cor 異常 硬盤 分發 tst AisinGioro 是一款自動運維監控工具,用於監控主機性能參數(心跳、CPU、內存、硬盤、網站連接數)、網絡連通性(Ping、Port、Http)、監控異常通知,基於B/S架構,主要技術 .Net/C#,

Open-falcon監控系統——微信接口二次開發

con 重寫方法 接口 ack sets image parse urlopen data 1、Open-falcon運維監控系統簡介 OpenFalcon是一款由小米運維團隊從互聯網公司的需求出發, 根據多年的運維經驗,結合市面上使用的一些運維監控系統的使用經驗和反饋,

監控三劍客之Nagios

操作系統 mar 瀏覽器 同時 ddc man pla dev group Nagios Nagios是一款LInux上成熟的監視系統運行狀態和網絡信息的開源IT基礎設施監控系統。Nagios能夠監控所指定的本地或遠程主機及服務,同時提供異常通知、事件處理等功能。它可以運

Jenkins用HTTP Request Plugin插件進行網站的監控/加探針(監控

pla .org 需要 技術 通知 動作 設置 特定 name 使用的插件: 【HTTP Request Plugin】 思路: 說明:只能是網站是否正常打開,而不能是這個網站業務是否正常,如果是後者,則需要寫特定的接口進行請求處理。 1、通過插件,發送GET請求指定的UR

談談監控選型以及設計思路

size 文本 最好的 監控系統 nts centreon mys 現在 應用 運維行業有句話:“無監控、不運維”,是的,一點也不誇張,監控俗稱“第三只眼”。沒了監控,什麽基礎運維,業務運維都是“瞎子”。所以說監控是運維這個職業的根本。尤其是在現在DevOps這麽火的時候,

Linux入門~2.命令列使用技巧

這一節我們學習與linux互動的方式 作為一個windows的老使用者,初接觸linux系統,甚是不習慣,但是玩兩天,感覺這種輸程式碼,系統就會有回覆方式還是蠻有趣的, 甚至還能作出刪庫這種“有趣”的操作。。那麼廢話不多說,開始吧:      1.

監控-Open-Falcon實戰部署

                  運維監控-Open-Falcon實戰部署                                            作者:尹正傑 版權宣告:原創作品,謝絕轉載!否則將追究法律責任。       一.   二

陌生又神祕的無厘頭分析

     運維,一個看起來很陌生的詞語,這是什麼意思呢?運維,這裡指網際網路運維,通常屬於技術部門,與研發、測試、系統管理同為網際網路產品技術支撐的4大部門,這個劃分在國內和國外以及大小公司間都會多少有一些不同。那麼IT運維又是什麼意思呢?度娘是這麼解釋的。 &nbs

監控不再成為你的短板!

  1.前言 隨間網際網路、雲端計算的飛速發展,越來越多的企業系統架構越來越複雜,且迭代的速度也為之迅速。隨著業務量、流量的增長,龐大的業務系統架構即將面臨一系列的問題,同時也是企業飛速發展所需解決的痛點。 複雜龐大的業務系統架構,給執行維護增加一定的難度與複雜度。 大量服

自動化之saltstack(2)

這次主要介紹saltstack的配置管理,這一部分在企業應用中比較重要,也經常用到。states是saltstack系統中的配置語言,在日常運維中需要編寫大量的states檔案,例如:建立使用者、安裝軟體、配置軟體、服務執行等。需要編寫一些"states sls"檔案。該檔案主要使用YAML語言,也可以支援使

資訊系統入門

        I T行業幹了有17個年頭了,從最初的軟體開發到專案建設管理,到今天的資訊系統運維,基本沒有靜下心來總結一下,,年齡大了卻心越來越恐慌,恐慌到這麼多年沒有進步和成長的果實讓自己值得欣慰,趁現在還有點心思,今後堅持下去,定期發一些文章,不斷積累,今天總結一下資訊