系統技術非業餘研究 » Linux下誰在切換我們的程序

阿新 • • 發佈：2019-01-13

我們在做Linux伺服器的時候經常會需要知道誰在做程序切換，什麼原因需要做程序切換。因為程序切換的代價很高，我給出一個LMbench測試出來的數字：
Context switching – times in microseconds – smaller is better
————————————————————————-
Host OS 2p/0K 2p/16K 2p/64K 8p/16K 8p/64K 16p/16K 16p/64K
ctxsw ctxsw ctxsw ctxsw ctxsw ctxsw ctxsw
——— ————- —— —— —— —— —— ——- ——-
my174.cm4 Linux 2.6.18- 6.1100 7.0200 6.1100 8.7400 7.7200 8.96000 9.62000

在我的很高階的伺服器上，程序切換的開銷在8us左右，這個相對於高效能的伺服器是不可接受的，所以我們要在一個時間片內儘可能的多做事情，而不是把時間浪費在無謂的切換上。

好奇害死貓，我們來調查下誰在切換我們的程序：

[[email protected] admin]# dstat 1
----total-cpu-usage---- -dsk/total- -net/total- ---paging-- ---system--
usr sys idl wai hiq siq| read  writ| recv  send|  in   out | int   csw 
  0   0 100   0   0   0|   0     0 | 796B 1488B|   0     0 |1004   128 
  0   0 100   0   0   0|   0     0 | 280B  728B|   0     0 |1005   114 
  0   0 100   0   0   0|   0     0 | 280B  728B|   0     0 |1005   128 
  0   0 100   0   0   0|   0     0 | 280B  728B|   0     0 |1005   114 
  0   0 100   0   0   0|   0   320k| 280B  728B|   0     0 |1008   143 
...

我們可以看到 csw的數目是 120/S, 但是dstat或者vmstat類似的工具並沒有告訴我們誰在幹壞事。好吧！我們自己動手行吧。
祭出我們可愛的systemtap!

[[email protected] admin]# cat >cswmon.stp
#! /usr/bin/env stap
#
#

global csw_count
global idle_count

probe scheduler.cpu_off {
  csw_count[task_prev, task_next]++
  idle_count+=idle
}


function fmt_task(task_prev, task_next)
{
   return sprintf("%s(%d)->%s(%d)",
                                task_execname(task_prev), 
                                task_pid(task_prev), 
                                task_execname(task_next), 
                                task_pid(task_next))
}

function print_cswtop () {
  printf ("%45s %10s\n", "Context switch", "COUNT")
  foreach ([task_prev, task_next] in csw_count- limit 20) {
    printf("%45s %10d\n", fmt_task(task_prev, task_next), csw_count[task_prev, task_next])
  }
  printf("%45s %10d\n", "idle", idle_count)

  delete csw_count
  delete idle_count
}

probe timer.s($1) {
  print_cswtop ()
  printf("--------------------------------------------------------------\n")
}
CTRL+D

這個指令碼會每隔設定的時間打印出TOP 20切換最多的程序和他的pid, 我們來看下結果把：

[[email protected] admin]# stap cswmon.stp 5
                               Context switch      COUNT
                swapper(0)->systemtap/11(908)        500
                systemtap/11(908)->swapper(0)        498
                swapper(0)->fct1-worker(2492)         50
                fct1-worker(2492)->swapper(0)         50
                swapper(0)->fct0-worker(2191)         50
                fct0-worker(2191)->swapper(0)         50
                      swapper(0)->bond0(3432)         50
                      bond0(3432)->swapper(0)         50
                      stapio(879)->swapper(0)         26
                      swapper(0)->stapio(879)         25
                      stapio(879)->swapper(0)         19
                      swapper(0)->stapio(879)         17
                   swapper(0)->watchdog/9(31)          5
                   watchdog/9(31)->swapper(0)          5
                    swapper(0)->mysqld(18346)          5
                    mysqld(18346)->swapper(0)          5
                  swapper(0)->watchdog/13(43)          5
                  watchdog/13(43)->swapper(0)          5
                  swapper(0)->watchdog/14(46)          5
                  watchdog/14(46)->swapper(0)          5
                                         idle        859
--------------------------------------------------------------
...

我們可以看到程序從哪裡切換到哪裡，並且發生了多少次，最後一行，我打印出來idle的次數，也就是說這時候系統沒啥事情做，就切換到idle(0)這個程序去休息去了。

通過上面的調查，我們會很清楚的瞭解到我們系統的開銷發生在那裡，方便我們定位問題。
玩的開心！

Post Footer automatically generated by wp-posturl plugin for wordpress.

No related posts.

系統技術非業餘研究 » Linux下誰在切換我們的程序

系統技術非業餘研究 » Linux下誰在消耗我們的cache

系統技術非業餘研究 » Linux下誰在切換我們的程序

系統技術非業餘研究 » Linux下新系統呼叫sync_file_range

系統技術非業餘研究 » Linux下方便的socket讀寫檢視器（socktop）

系統技術非業餘研究 » Linux下pstack的實現

系統技術非業餘研究 » Linux下試驗大頁面對映（MAP_HUGETLB）

系統技術非業餘研究 » Linux下非同步IO(libaio)的使用以及效能

系統技術非業餘研究 » Linux下Fio和Blktrace模擬塊裝置的訪問模式

系統技術非業餘研究 » Linux下方便的塊裝置檢視工具lsblk

系統技術非業餘研究 » Linux下pipe使用注意事項

系統技術非業餘研究 » Linux下如何知道檔案被那個程序寫

系統技術非業餘研究 » Linux檔案預讀分析以及評估對系統的影響

系統技術非業餘研究 » Linux快取記憶體使用率調查

系統技術非業餘研究 » Linux系統記憶體相關資訊獲取

系統技術非業餘研究 » Linux 2.6.38 User

系統技術非業餘研究 » Linux IO協議棧框圖

系統技術非業餘研究 » Linux TASK_IO_ACCOUNTING功能以及如何使用

系統技術非業餘研究 » Linux Used記憶體到底哪裡去了？

系統技術非業餘研究 » Linux常用效能調優工具索引

系統技術非業餘研究 » 網路棧記憶體不足引發程序掛起問題

系統技術非業餘研究 » Linux下誰在切換我們的程序

相關推薦