1. 程式人生 > >AIX效能監控topas命令的詳細解析

AIX效能監控topas命令的詳細解析

作業系統的最全面動態,而又檢視方便的效能檢視就是topas命令了,下面以topas輸出為例,對AIX系統的效能監控做簡要描述

另:1.作業系統報錯資訊errpt檢視。2.磁碟空間使用率採用df檢視。這裡主要分析效能問題。

  執行topas命令後如圖所示:

  #topas


Kernel:

  說明:作業系統的核心佔用的CPU時間比率。

  作業系統作為基礎軟體,為應用程式支援和服務的同時,本身的執行也需要一定的CPU和記憶體資源(順便提到記憶體資源,後面不再闡述這個內容了),特別是記憶體資源,系統負載越重,相應的核心佔用的CPU和記憶體資源也會越多。一般來說,核心佔用的CPU時間不會太多的。一般小於應用的CPU使用率。

  User:

  說明:使用者程序佔用的CPU時間比率。

  這個為CPU使用率的關鍵數值。該使用率反映了使用者在作業系統基礎上執行的各種軟體佔用的CPU時間比率的總和。一般來說,如果User+Kernel連續大於70%,即可以認為系統可能存在CPU上的嚴重效能問題。

  Wait

  說明:CPU處於等待狀態佔CPU時間的比率。

  CPU的等待一般都為等待IO的響應,眾所周知,目前計算機的主要瓶頸都在IO。應用程式執行的時候,需要讀寫磁碟等外部儲存的資料,程序就會發起IO請求後等待IO完成。這個等待的過程佔用CPU時間就是wait。當這個值很高的時候,就說明IO來不及響應很多的IO請求,這個時候,就只能從IO層面想辦法優化了。

  Idle:

  說明:CPU空閒時間比率,這個就不用說了吧。就是CPU多少時間比率在閒著。

  CPU佔用率出問題的主要可能原因:資料庫伺服器執行某一個SQL或者儲存過程(儲存過程就是封裝起來的sql程式包而已)需要大量的運算(一般為軟體設計不合理)。或者應用程式中存在異常的地方,比如死迴圈,或者其他寫程式時的邏輯錯誤導致。一般程式出錯會導致一個CPU被全部佔用,比如上述的20%佔用的原因就是一個交易程式長期佔用一個CPU全部時間片(系統共計5個CPU)。

  Netwok;列出了網絡卡介面,KBPS即每秒鐘多少KB(千位元組) I-Pack每秒鐘輸入的資料包個數, O-Pack 每秒鐘輸出的資料包個數 KB-In每秒鐘輸入的位元組數 KB-Out每秒鐘輸出的位元組數。

  當我們發現網路擁堵時(出現網絡卡傳輸失效的報錯,即網絡卡傳送資料包失敗。或者網路響應明顯變慢的時候,如果CPU沒有問題,那麼請檢查網路流量)發現某一個網絡卡的KBPS持續大於四位數,甚至五位數時(這個值要是網絡卡千兆還是百兆而定)。就要看看這個網絡卡是什麼網絡卡,在處理什麼業務了。在命令列執行netstat –in 檢視對應en*介面的ip地址,通過ip地址看看是帶官網絡卡還是生產服務網絡卡流量高。然後通過netstat –v en* 看看網絡卡的詳細工作狀態,出現了多少錯包,衝突包,crc校驗錯或者網路重置過等資訊。上述資訊請詳細看netstat –v en*的輸出.如果出現大量crc,錯包的話,可能網線有問題或者接觸不良。

  如果上述均正常,而網路反應慢,則有可能是交換機擁堵。

  網路出現問題的可能原因:通過百兆的帶管網載入大量資料(以前出現過),大量佇列的長時間的ftp傳輸,或者網線,交換機問題等。

Disk Busy%磁碟繁忙的百分比,即磁碟能滿足的最大IOPS(每秒IO運算元)和當前IO數量的比率。其他的引數不再解釋。望文生義即可。

  一般主要看磁碟的Busy%,當磁碟的Busy%持續大於85%時,即認為磁碟相當繁忙,已經可能要出問題了。當然,自己知道已經確定要產生大量IO操作的內容則不必在意,等其完成即可。

  出現問題的原因:應用伺服器上面寫日誌程序或者查詢日誌的程序大量讀寫日誌,導致磁碟繁忙率高,或者其他程式頻繁讀寫磁碟導致。系統中hdisk0,hdisk1一般為系統盤,內建SCSI磁碟的相對IOPS是較低的。很容易滿負荷執行。

  Name:程序的名稱,即程序被執行時啟動的二進位制檔案的名稱。

  PID,程序的ID,程序的ID在系統中唯一,是我們瞭解跟蹤程序資訊重要數值。

  跟蹤程序的CPU使用,磁碟IO讀寫,程序的記憶體和pagingspace佔用等等均需要使用。

  CPU%程序佔用CPU時間的比率。

  PgSp,程序佔用的pagingspace的空間大小。

  Owner程序的屬主,即由哪個操作使用者使用者啟動了這個程序。

  在topas中,預設是列出佔用cpu最高的前幾個的程序資訊供參考,如果前面第一區域的的CPU使用率持續高,就要看看這裡是那個程序佔用了大量的CPU資源,看看是哪個使用者的程序,如果自己執行的,則殺掉或者找專案組解決即可。

  換頁空間即磁碟上的空間,在AIX作業系統中用來做記憶體空間使用。具體的理論就不再闡述了,詳細資訊請參閱作業系統內容。磁碟空間的速度當然相比記憶體,慢了不止10倍。所以,只是記憶體頁面的一個暫時存放地,存放的還是那些長期不怎麼用到的記憶體頁面而已。如果paging大量出現,這時候就有麻煩了,說明:記憶體不夠用了!

  該區域主要關注PageIn,PageOut如果這兩個數值均大於三位數,並且長期大於這個數值,在技術上叫做記憶體顛簸,即不停的把記憶體頁面換到磁碟空間上,又從磁碟空間把記憶體頁面讀進來,系統的記憶體使用效率變的極差,系統響應效能也變慢了。

  這個資訊也可以用vmstat來看,pi和po列即與這裡相對應。當然,如果只是有頁面出,或者只有頁面入,或者短時間的一些頁面換入換出,則沒有什麼問題,關注一下即可。


  Real,MB作業系統實際擁有的記憶體的總量,單位是MB。

  %Comp,計算型記憶體佔用比率,%Noncomp非計算型記憶體佔用的比率。

  %Client也為非計算型記憶體,Noncomp包涵Client型記憶體,jfs檔案系統使用的記憶體為noncomp,為了區分,jfs2和nfs使用的記憶體為Client。

  計算型記憶體就是程序實際使用的記憶體,例如我們寫程式的時候malloc記憶體,或者在排序中使用了堆疊,程序中變數數值都需要在記憶體中儲存,這部分記憶體為計算型記憶體(闡述不全面,僅供參考)。而作業系統在進行檔案讀寫,需要的io緩衝區,或者我們在寫程式的時候,開啟檔案,讀寫檔案,均在檔案緩衝區進行。(裸裝置例外,CCCC的資料庫採用RAC,資料的儲存全部使用裸裝置,在資料庫伺服器上,資料檔案的緩衝在oracle的sga區的data buffer中(這個區域系統認為是計算型記憶體),是不會佔用非計算記憶體的。)

  導致記憶體出問題的可能原因很多。主要有:程序使用了更多的記憶體,例如,CCCC資料庫伺服器大量的oracle連線使用了很多記憶體,或者資料庫中執行的某一個sql指令碼或者儲存過程的執行需要大量的記憶體來完成其操作(特例庫中出現過這個情形,一個儲存過程的執行導致作業系統記憶體被耗盡,pg也隨之耗盡,作業系統自動執行PGSP_KILL,把該程序給幹掉了,我也是第一次知道aix系統還有這個功能,呵呵)。第二個主要的問題就是記憶體洩漏,記憶體洩漏最簡單的來說,就是申請了記憶體空間,使用後不再使用了,但是也沒有釋放。我們寫程式的時候malloc,卻沒有free。這就導致了嚴重的問題,隨著程式的執行,可用實體記憶體越來越少,最後就掛了,只好定期重啟應用來解決。

  作業系統的記憶體換頁機制導致了程式中不用的記憶體頁面最後都跑到pg上面去了,換頁空間會持續增長的。因應用導致系統問題就是這麼產生的。


  如果換頁空間的使用率長期增長,就說明系統記憶體不足,已經開始使用磁碟空間來緩衝記憶體了,如果PG使用率持續增長,或者大於50%,需要警惕(到50%在監控平臺已經是主要告警啦!),並馬上提交系統管理員分析記憶體增長原因。如果該數值持續增長,系統一定會掛掉的!


轉自:http://unix.ctocio.com.cn/317/9347817.shtml

相關推薦

AIX效能監控topas命令詳細解析

作業系統的最全面動態,而又檢視方便的效能檢視就是topas命令了,下面以topas輸出為例,對AIX系統的效能監控做簡要描述 另:1.作業系統報錯資訊errpt檢視。2.磁碟空間使用率採用df檢視。這裡主要分析效能問題。   執行topas命令後如圖所示:   #

惠普-UX伺服器效能監控使用命令

1,iostat the iostat command reports I/O statistics for each active disk on the system iostat -t x y x表示間隔的時間,y表示間隔顯示的次數 這個命令一般用於檢視的引數是bps、sps、

Linux效能監控分析命令—vmstat命令詳解

一、vmstat介紹 語法格式: vmstat [-V] [-n] [-S unit] [delay [count]]               -V prints version.               -n causes the headers not to

Linux 效能監控工具命令大全

談到系統性能監控和分析工具,就不得不提Brendan Gregg的系統分析,他的圖非常系統化的展示了應用程式,系統呼叫,核心,協議棧,硬體等各塊之間的互動。有興趣的朋友可以根據這張圖裡的命令進行組合進行系統問題的監控,分析,定位。 1.top top命

linux 實時監控系統IO狀態和IO效能(iostat命令解析

    linux系統的輸入輸出(I/O)效能和狀態,可以通過sysstat命令包中的iostat命令來進行實時的監控檢視,這裡介紹iostat命令的一些常用操作以便用於輸出CPU和磁碟I/O相關的統計資訊。 命令格式 iostat [ -c ] [ -d ] [ -h ]

find命令詳細解析

結果 查找 mod 選項 groupdel sbin 記得 分享 提前 1.find功能 實時查找工具,通過遍歷指定路徑完成文件查找 特點:查找速度略慢 (因為是實時查找,需要經歷每個路徑才能完成查找)???精確查找???可能只搜索用戶具備讀取和執行權限的目錄 (沒有權限

linux效能監控工具-(顯示系統整體資源使用情況-top命令)

顯示系統整體資源使用情況 -top命令 top命令是linux下常用的效能分析工具,能夠實時顯示系統中各個程序的資源佔用狀況: 前半部分是系統統計資訊,後半部分是程序資訊。 從左到右依次表示:系統當前時間,系統執行時間,當前登入使用者數。load average表示系統的平

效能測試監控 top命令詳解

top命令可以實時動態地檢視系統的整體執行情況,是一個綜合了多方資訊監測系統性能和執行資訊的實用工具。通過top命令所提供的互動式介面,用熱鍵可以管理。 語法 top(選項) 選項 -b:以批處理模式操作; -c:顯示完整的治命令; -d:螢幕重新整理間隔時間; -I:忽

JVM虛擬機器效能監控與調優(JDK命令列、JConsole)

很多資料在介紹JDK命令列工具時並不是在Java8環境下,因此還在使用過時的永久區系列的引數,給一些讀者造成困難。 Java8使用Metaspace(元空間)代替永久區,對於64位平臺,為了壓縮JVM物件中的_klass指標的大小,引入了類指標壓縮空間(Compressed Class Pointer Sp

Jmeter效能測試工具學習(6.取樣器詳細解析

取樣器(Sampler)   主要工作的元件   每個取樣器都有自己的“個性”和特點   個性? 1、每種取樣器對應相應的協議     2、在取樣器背後都是網路協議的包裝 3、學好取樣器關鍵的點要了解相應的協議&nbs

cephfs調優 & 效能測試 & 監控 & 常用命令

前言 k8s對ceph rbd模式不支援ReadWriteMany(RWX),為了滿足k8s的靈活性需求,採用支援多點掛載的cephfs工作模式.網上少有針對cephfs調優的文章,因此在本篇,將針對cephfs進行一些引數調優及效能測試 硬體規劃 配置調優

Linux(CentOS)效能監控命令strace

1、簡介 strace 常用來跟蹤程序執行時的系統呼叫和所接收的訊號。在Linux 世界,程序不能直接訪問硬體裝置,當程序需要訪問硬體裝置(比如讀取磁碟檔案,接收網路資料等等)時,必須由使用者態模式切換至核心態模式,通過系統呼叫訪問硬體裝置。strace 可以跟蹤到一個程序產生的系統呼叫

Linux(CentOS)效能監控命令lsof

1、簡介 lsof 命令的原始功能是列出開啟的檔案的程序,但LINUX 下,所有的裝置都是以檔案的行式存在的,所以,lsof 的功能很強大 2、命令用法 lsof -a:列出開啟檔案存在的程序; -c<程序名>:列出指定程序所開啟的檔案 -g

Linux(CentOS)效能監控命令vmstat

1、簡介 Vmstat也是一個功能比較齊全的效能檢測工具,可以統計CPU、記憶體使用情況、swap使用情況等資訊,不足之處是無法對某個程序進行深入分析。和sar類似,也可以指定採集週期和次數。下面是每秒取樣一次,共計3次: [[email protected]-nginx

Linux效能監控命令詳解:lsof

lsof可以檢視當前系統所有的開啟檔案,在linux環境下,一切皆檔案,通過檔案不僅僅可以訪問常規資料,還可以訪問網路連線和硬體,如傳輸控制協議 (TCP) 和使用者資料報協議 (UDP) 套接字等,系統在後臺都為該應用程式分配了一個檔案描述符,檔案描述符提供了大量關於這個

Linux效能監控命令詳解:free

在系統遇到各種IO瓶頸,記憶體使用率高,cpu使用率高等問題時,我們如何來定位錯誤?linux提供了很多命令來協助我們快速定位到錯誤,free命令是Linux最常用的命令之一:它可以檢視系統的記憶體狀況,包括伺服器的總記憶體,已經使用的記憶體和剩下未被使用的記憶體,以及緩衝區和快取各自佔用的

linux系統看系統性能進行效能監控的幾大命令

一般我們檢視系統性能主要是在以下幾個方面 1.使用者使用CPU情況 展現為 %user 2.系統使用CPU情況 展現為 %sys 3.wio或iowait     展現為 %iowait 程序由於等待磁碟IO而使CPU處於空閒狀態的比率 4.CPU的空閒率 5.CPU上下文的

jdk原始碼解析(五)——虛擬機器效能監控與故障處理工具

前面有一定的瞭解jvm、這裡就瞭解一下怎麼檢視虛擬機器,也就是對jvm的一個監控。 這裡主要講解jvm的相關工具以及使用: 1定義問題的思路 給一個系統定位問題的時候,知識,經驗是關鍵基礎,資料是依據,工具是運用知識處理資料的手段。這裡說的資料包括:執行日誌,異常堆疊,

linux===sar命令效能監控

sar介紹: sar是System Activity Reporter(系統活動情況報告)的縮寫。sar工具將對系統當前的狀態進行取樣,然後通過計算資料和比例來表達系統的當前執行狀態。它的特點是可以連續對系統取樣,獲得大量的取樣資料;取樣資料和分析的結果都可以存入檔案,所需的負載很小。sar是目前Li

Linux基礎知識之IO效能監控工具iostat命令詳解

Linux系統出現了效能問題,一般我們可以通過top、iostat、free、vmstat等命令來檢視初步定位問題。其中iostat可以提供更豐富的IO效能狀態資料。 1. 基本使用 $iostat -d -k 1 10 引數 -d 表示,顯示裝置(磁碟)使用狀態;-k某些使用block為單位的列強