1. 程式人生 > >Linux下監視GPU、CPU的使用情況

Linux下監視GPU、CPU的使用情況

inux volatile 情況 顯存 相關信息 查看 計算 display AR

1、在運行Tensorflow等程序時會使用到NVIDIA的GPU,所以在程序運行時需要監控GPU的運行情況

使用 nvidia-smi 命令 ,顯示如下:

技術分享圖片

nvidia-smi 顯示解讀:

GPU:本機中的GPU編號,為0,1,2等
Name:GPU 類型,GTX1080、Tesla K80等
Persistence-M:是持續模式的狀態,持續模式雖然耗能大,但是在新的GPU應用啟動時,花費的時間更少,這裏顯示的是off的狀態
Fan:風扇轉速,從0到100%之間變動,這個速度是計算機期望的風扇轉速,實際情況下如果風扇堵轉,可能打不到顯示的轉速。有的設備不會返回轉速,因為它不依賴風扇冷卻而是通過其他外設保持低溫
Temp:溫度,單位攝氏度
Perf:表征性能狀態,從P0到P12,P0表示最大性能,P12表示狀態最小性能
Pwr:Usage/Cap:能耗表示
Bus-Id:涉及GPU總線的相關信息
Disp.A:Display Active,表示GPU的顯示是否初始化
Memory-Usage:顯存使用率


Volatile GPU-Util:浮動的GPU利用率
Uncorr. ECC:關於ECC的東西
Compute M.:計算模式
Processes 顯示每塊GPU上每個進程所使用的顯存情況。

註意:顯存占用和GPU占用是兩個不一樣的東西,顯卡是由GPU和顯存等組成的,顯存和GPU的關系有點類似於內存和CPU的關系。

nvidia-smi -L 命令:列出所有可用的 NVIDIA 設備

顯示如下:

技術分享圖片

watch -n 10 nvidia-smi 命令:周期性的顯示GPU的情況,10 表示每10秒顯示一次

2、關於CPU使用情況查看的命令

詳見:ubuntu查看系統資源占用(內存,cpu和進程)

Linux下監視GPU、CPU的使用情況