1. 程式人生 > >vmstat命令詳解——linux效能分析

vmstat命令詳解——linux效能分析

版本資訊:

procps version 3.2.8

基本使用:

vmstat [-a] [-n] [-t] [-S unit] [delay [ count]]

[-a]:顯示活躍和非活躍記憶體

[-n]:只在開始時顯示一次欄位名,針對多次收集資訊的情況輸出人性化一點

[-t]:在每條資訊的末尾,顯示收集資訊的時間

[-S unit]:使用指定單位顯示。引數有 k 、K 、m 、M ,分別代表1000、1024、1000000、1048576位元組(byte)。預設單位為K(1024 bytes)

[delay [count]]:delay是資訊收集間隔,count是資訊收集的次數

vmstat [-s] [-n] [-S unit]

[-s]:顯示記憶體相關的統計資訊

vmstat [-m] [-n] [delay [ count]]

[-m]:顯示slabinfo,slabinfo資訊記錄在/proc/slabinfo檔案中。slab是linux的一個記憶體分配機制。

vmstat [-d] [-n] [delay [ count]]

[-d]:顯示相關磁碟的統計資訊   

注:這個跟樓下-p的區別統計資訊的不同、統計物件這個是磁碟-p是子分割槽、這個不能指定全部輸出

vmstat [-p disk partition] [-n] [delay [ count]]

[-p disk partition]:顯示磁碟子分割槽的統計資訊,這裡沒有iostat的資訊那麼有用

vmstat [-f]

[-f]:開機啟動至今的fork數量            注:這裡的fork應該是核心的fork()函式,在父程序中,fork返回新建立子程序的程序ID

vmstat [-V]

[-V]:版本資訊

輸出解釋:

根據vmstat的實際情況,下面針對vmstat -a的輸出進行解釋。

r :表示執行佇列(就是說多少個程序真的分配到CPU),我測試的伺服器目前CPU比較空閒,沒什麼程式在跑,當這個值超過了CPU數目,就會出現CPU瓶頸了。這個也和top的負載有關係,一般負載超過了3就比較高,超過了5就高,超過了10就不正常了,伺服器的狀態很危險。top的負載類似每秒的執行佇列。如果執行佇列過大,表示你的CPU很繁忙,一般會造成CPU使用率很高。

b: 表示阻塞的程序,這個不多說,程序阻塞,大家懂的。

swpd:虛擬記憶體已使用的大小,如果大於0,表示你的機器實體記憶體不足了,如果不是程式記憶體洩露的原因,那麼你該升級記憶體了或者把耗記憶體的任務遷移到其他機器。

free: 空閒的實體記憶體的大小,我的機器記憶體總共8G,剩餘3415M。

buff:Linux/Unix系統是用來儲存,目錄裡面有什麼內容,許可權等的快取,我本機大概佔用300多M

cache:cache直接用來記憶我們開啟的檔案,給檔案做緩衝,我本機大概佔用300多M(這裡是Linux/Unix的聰明之處,把空閒的實體記憶體的一部分拿來做檔案和目錄的快取,是為了提高 程式執行的效能,當程式使用記憶體時,buffer/cached會很快地被使用。)

si:每秒從磁碟讀入虛擬記憶體的大小,如果這個值大於0,表示實體記憶體不夠用或者記憶體洩露了,要查詢耗記憶體程序解決掉。我的機器記憶體充裕,一切正常。

so:每秒虛擬記憶體寫入磁碟的大小,如果這個值大於0,同上。

bi:塊裝置每秒接收的塊數量,這裡的塊裝置是指系統上所有的磁碟和其他塊裝置,預設塊大小是1024byte,我本機上沒什麼IO操作,所以一直是0,但是我曾在處理拷貝大量資料(2-3T)的機器上看過可以達到140000/s,磁碟寫入速度差不多140M每秒

bo:塊裝置每秒傳送的塊數量,例如我們讀取檔案,bo就要大於0。bi和bo一般都要接近0,不然就是IO過於頻繁,需要調整。

in:每秒CPU的中斷次數,包括時間中斷

cs:每秒上下文切換次數,例如我們呼叫系統函式,就要進行上下文切換,執行緒的切換,也要程序上下文切換,這個值要越小越好,太大了,要考慮調低執行緒或者程序的數目,例如在apache和nginx這種web伺服器中,我們一般做效能測試時會進行幾千併發甚至幾萬併發的測試,選擇web伺服器的程序可以由程序或者執行緒的峰值一直下調,壓測,直到cs到一個比較小的值,這個程序和執行緒數就是比較合適的值了。系統呼叫也是,每次呼叫系統函式,我們的程式碼就會進入核心空間,導致上下文切換,這個是很耗資源,也要儘量避免頻繁呼叫系統函式。上下文切換次數過多表示你的CPU大部分浪費在上下文切換,導致CPU幹正經事的時間少了,CPU沒有充分利用,是不可取的。

us:使用者CPU時間,我曾經在一個做加密解密很頻繁的伺服器上,可以看到us接近100,r執行佇列達到80(機器在做壓力測試,效能表現不佳)。

sy:系統CPU時間,如果太高,表示系統呼叫時間長,例如是IO操作頻繁。

id:空閒 CPU時間,一般來說,id + us + sy = 100,一般我認為id是空閒CPU使用率,us是使用者CPU使用率,sy是系統CPU使用率。

wt:等待IO CPU時間。

使用例項: