vmstat命令詳解——linux效能分析
版本資訊:
procps version 3.2.8
基本使用:
vmstat [-a] [-n] [-t] [-S unit] [delay [ count]]
[-a]:顯示活躍和非活躍記憶體
[-n]:只在開始時顯示一次欄位名,針對多次收集資訊的情況輸出人性化一點
[-t]:在每條資訊的末尾,顯示收集資訊的時間
[-S unit]:使用指定單位顯示。引數有 k 、K 、m 、M ,分別代表1000、1024、1000000、1048576位元組(byte)。預設單位為K(1024 bytes)
[delay [count]]:delay是資訊收集間隔,count是資訊收集的次數
vmstat [-s] [-n] [-S unit]
[-s]:顯示記憶體相關的統計資訊
vmstat [-m] [-n] [delay [ count]]
[-m]:顯示slabinfo,slabinfo資訊記錄在/proc/slabinfo檔案中。slab是linux的一個記憶體分配機制。
vmstat [-d] [-n] [delay [ count]]
[-d]:顯示相關磁碟的統計資訊
注:這個跟樓下-p的區別統計資訊的不同、統計物件這個是磁碟-p是子分割槽、這個不能指定全部輸出
vmstat [-p disk partition] [-n] [delay [ count]]
[-p disk partition]:顯示磁碟子分割槽的統計資訊,這裡沒有iostat的資訊那麼有用
vmstat [-f]
[-f]:開機啟動至今的fork數量 注:這裡的fork應該是核心的fork()函式,在父程序中,fork返回新建立子程序的程序ID
vmstat [-V]
[-V]:版本資訊
輸出解釋:
根據vmstat的實際情況,下面針對vmstat -a的輸出進行解釋。
r :表示執行佇列(就是說多少個程序真的分配到CPU),我測試的伺服器目前CPU比較空閒,沒什麼程式在跑,當這個值超過了CPU數目,就會出現CPU瓶頸了。這個也和top的負載有關係,一般負載超過了3就比較高,超過了5就高,超過了10就不正常了,伺服器的狀態很危險。top的負載類似每秒的執行佇列。如果執行佇列過大,表示你的CPU很繁忙,一般會造成CPU使用率很高。
b: 表示阻塞的程序,這個不多說,程序阻塞,大家懂的。
swpd:虛擬記憶體已使用的大小,如果大於0,表示你的機器實體記憶體不足了,如果不是程式記憶體洩露的原因,那麼你該升級記憶體了或者把耗記憶體的任務遷移到其他機器。
free: 空閒的實體記憶體的大小,我的機器記憶體總共8G,剩餘3415M。
buff:Linux/Unix系統是用來儲存,目錄裡面有什麼內容,許可權等的快取,我本機大概佔用300多M
cache:cache直接用來記憶我們開啟的檔案,給檔案做緩衝,我本機大概佔用300多M(這裡是Linux/Unix的聰明之處,把空閒的實體記憶體的一部分拿來做檔案和目錄的快取,是為了提高 程式執行的效能,當程式使用記憶體時,buffer/cached會很快地被使用。)
si:每秒從磁碟讀入虛擬記憶體的大小,如果這個值大於0,表示實體記憶體不夠用或者記憶體洩露了,要查詢耗記憶體程序解決掉。我的機器記憶體充裕,一切正常。
so:每秒虛擬記憶體寫入磁碟的大小,如果這個值大於0,同上。
bi:塊裝置每秒接收的塊數量,這裡的塊裝置是指系統上所有的磁碟和其他塊裝置,預設塊大小是1024byte,我本機上沒什麼IO操作,所以一直是0,但是我曾在處理拷貝大量資料(2-3T)的機器上看過可以達到140000/s,磁碟寫入速度差不多140M每秒
bo:塊裝置每秒傳送的塊數量,例如我們讀取檔案,bo就要大於0。bi和bo一般都要接近0,不然就是IO過於頻繁,需要調整。
in:每秒CPU的中斷次數,包括時間中斷
cs:每秒上下文切換次數,例如我們呼叫系統函式,就要進行上下文切換,執行緒的切換,也要程序上下文切換,這個值要越小越好,太大了,要考慮調低執行緒或者程序的數目,例如在apache和nginx這種web伺服器中,我們一般做效能測試時會進行幾千併發甚至幾萬併發的測試,選擇web伺服器的程序可以由程序或者執行緒的峰值一直下調,壓測,直到cs到一個比較小的值,這個程序和執行緒數就是比較合適的值了。系統呼叫也是,每次呼叫系統函式,我們的程式碼就會進入核心空間,導致上下文切換,這個是很耗資源,也要儘量避免頻繁呼叫系統函式。上下文切換次數過多表示你的CPU大部分浪費在上下文切換,導致CPU幹正經事的時間少了,CPU沒有充分利用,是不可取的。
us:使用者CPU時間,我曾經在一個做加密解密很頻繁的伺服器上,可以看到us接近100,r執行佇列達到80(機器在做壓力測試,效能表現不佳)。
sy:系統CPU時間,如果太高,表示系統呼叫時間長,例如是IO操作頻繁。
id:空閒 CPU時間,一般來說,id + us + sy = 100,一般我認為id是空閒CPU使用率,us是使用者CPU使用率,sy是系統CPU使用率。
wt:等待IO CPU時間。
使用例項: