磁盤IO高和線程切換過高性能壓測案例分析

阿新 • • 發佈：2017-11-06

cnblogs 左右系統 stp tex clas ++ class tap

案例現象：

壓力測試的時候，發現A請求壓力80tps後，cpu占用就非常高了（24核的機器，每個cpu占用率全面飆到80%以上），且設置的檢查點沒有任何報錯。

1、top命令如下：

技術分享

2、了解了一下後臺實現邏輯：大體是這樣的：服務器接到請求後，會再到另一臺kv服務器請求數據，拿回來數據後，根據用戶的機器碼做個性化運算，最後將結果返回給客戶端，期間會輸出一些調試log。

查了下，kv服務器正常，說明是本機服務服務器的問題。具體用vmstat命令看一下異常的地方。

技術分享

3、從圖中可以直觀的看出，bi、bo、in、cs這四項的值都很高，根據經驗，bi和bo代表磁盤io相關、in和cs代表系統進程相關。一個一個解決吧，先看io。

4、用iostat –x命令看了下磁盤讀寫，果然，磁盤慢慢給堵死了。

技術分享

5、看了下過程，只有寫log操作才能導致頻繁讀寫磁盤。果斷關閉log。重新打壓試下。

技術分享

6、 Bi和bo降到正常值了，說明磁盤的問題解決了。但是上下文切換數竟然達到了每秒40萬次！好可怕~

7、只知道上下文切換數很大，怎麽知道是在哪些進程間切換呢？

到網上搜了一個腳本，這個腳本用來統計特定時間內進程切換的top20並打印出來。

#! /usr/bin/env stap
#
#
global csw_count

global idle_count

probe scheduler.cpu_off {

csw_count[task_prev, task_next] 
++

idle_count+=idle
}

function fmt_task(task_prev, task_next)

{

return sprintf("%s(%d)->%s(%d)",

task_execname(task_prev),

task_pid(task_prev),

task_execname(task_next),

task_pid(task_next))

}

function print_cswtop () {

printf ("%45s %10s\n", "Context switch", "COUNT")

foreach ([task_prev, task_next] in 
 csw_count- limit 20) {

printf("%45s %10d\n", fmt_task(task_prev, task_next), csw_count[task_prev, task_next])

}

printf("%45s %10d\n", "idle", idle_count)

delete csw_count

delete idle_count

}
probe timer.s($1) {

print_cswtop ()

printf("--------------------------------------------------------------\n")

}

保存成cs.stp後，用stap cswmon.stp 5命令執行下。

技術分享

8、發現是discover進程在反復和系統進程進行切換。從此消耗了大量資源。

9、從網上查了下減少切換進程的一些方法：

技術分享

開發隨後改了下：將線程數開大了一倍，控制在一個進程中。

重新打壓了一下。發現上下文切換數降低到25萬次左右。

技術分享

此時的性能數據可以達到每秒260次左右，遠遠高於之前的80次。已經達到可以上線的需求。

但是由於頁面中斷書和上下文切換數還是很高，後續還是需要優化

磁盤IO高和線程切換過高性能壓測案例分析

cnblogs 左右系統 stp tex clas ++ class tap 案例現象：壓力測試的時候，發現A請求壓力80tps後，cpu占用就非常高了（24核的機器，每個cpu占用率全面飆到80%以上），且設置的檢查點沒有任何報錯。 1、top命令如下： 2、

java線程數過高原因分析

分享有一個其中 res set ava jhat 前臺沒有作者：鹿丸不會多項式出處：http://www.cnblogs.com/hechao123 轉載請先與我聯系。一、問題描述前陣子我們因為B機房故障，將所有的流量切到了A機房，在經歷了推送+自然高峰

python多線程測試接口性能

form tar ces logs 耗時 phone hone com glob import requests import json import threading import time # 定義請求基本地址 base_url = "http://12

使用python多線程進行簡單的性能測試

join 格式化 int info stat quest exc start append 步驟： *定義請求函數 *把請求函數添加進入多線參考代碼： 1 import threading 2 import time 3 import requests 4

cacti監控linux和windows磁盤IO

添加 attach exe rman courier input medium copyright eth cacti監控linux和windows磁盤IO 標簽：cacti linux磁盤IO windows磁盤IO 原創作品，允許轉載，轉載時請務必以超鏈接形式標明文章

CentOS針對磁盤IO[jdb2進程]的優化

rri atime db2 com 系統 article dir per ext CentOS的jdb2進程總是沾滿io，查了一些資料後才知道，這個問題源自系統bug，在此記錄一下解決辦法：將高IO的磁盤，用以下參數remount即可 mount -

查看磁盤io、內存free、系統進程ps、網絡狀態netstat、Linux抓包tcpdump

ipv mon 1.3 sda verify available x86 4.0 length 查看磁盤io性能狀態 iostat -x 查看磁盤使用（安裝包與sar的安裝包一起）主要查看%util [root@shu-test ~]# iostat -x Linux 3.

zabbix監控容器情況和磁盤IO

模板 web res 頁面 Coding containe stat sta 磁盤io 1、從https://pypi.python.org/pypi/docker-py#downloads 這裏下載docker-py-xxx.tar.gz到本地再傳進去linux系統裏面進

[Python Study Notes]磁盤分區和io性能

elif 單位 device str 磁盤 rfi 平臺 linux pre ‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘‘

快速定位性能瓶頸，檢查出所有資源（CPU、內存、磁盤IO等）的利用率（utilization）、飽和度（saturation）和錯誤（error）度量,即USE方法

sta lin system 1.8 磁盤 AI during run 5.7 通過分析mpstat的iowait和iostat的util%，判斷IO瓶頸 IO瓶頸往往是我們可能會忽略的地方（我們常會看top、free、netstat等等，但經常會忽略IO的負載情況），

一次磁盤IO高的問題處理

來源 linux 磁盤讀寫 strong inux width tro 大量分配問題現象：開發測試環境的kubernetes master服務器，磁盤讀寫速率很高，達200多M/s，IOPS超過8000/S，系統操作出現卡頓（還好硬盤是SSD，否則系統早卡死掉了），截

單例模式和線程安全

tac 可能存在版本線程不安全廣東多線程一個單例前幾天給項目的省市區加了redis。結果上線沒多久就發生了數據錯亂的現象，需要讀取山東省的市可能返回的市廣東的。一開始不明白哪裏有問題，因為測試組的同學有測試過，在測試過程種並沒有發生這樣的情況。由於使用了se

Java中的線程狀態轉換和線程控制常用方法

img sta () throw line star height style 技術 Java 中的線程狀態轉換：　　【註】：不是 start 之後就立刻開始執行, 只是就緒了(CPU 可能正在運行其他的線程). 【註】：只有被 CPU 調度之後，線程才開始執行, 當

python進程和線程3

停止工作結果 form selector not deamon io模型系統調用 socket 1 multiprocessing模塊（1.）直接導入 from multiprocessing import Process import os import time

第十六章-進程和線程

lan 進程命名永遠大小無法使用 inux wait 沒有對於操作系統來說, 一個任務就是一個進程（Process）進程內的這些“子任務”稱為線程（Thread）真正的並行執行多任務只能在多核CPU上實現多任務的實現有3種方式：

[分布式系統學習] 6.824 LEC2 RPC和線程筆記

amp star nbsp 機制並且 als goroutine 操作 page 6.824的課程通常是在課前讓你做一些準備。一般來說是先讀一篇論文，然後請你提一個問題，再請你回答一個問題。然後上課，然後布置Lab。第二課的準備-Crawler 第二課的準備不是論文

進程和線程有什麽區別？

通信一個鏈接程序單獨執行單元聯系實體作者：榴蓮藝聲鏈接：https://www.zhihu.com/question/21535820/answer/22915780來源：知乎著作權歸作者所有。商業轉載請聯系作者獲得授權，非商業轉載請註明出處。一、關於

Java並發編程：進程和線程

preamble 麻煩們的 :hover none highlight 做成 sta net .title { text-align: center } .todo { font-family: monospace; color: red } .done { color:

進程和線程、內核空間等概念

部分 .html 更新打字維護由於根據地址資源用戶空間與內核空間現在操作系統都是采用虛擬存儲器，那麽對32位操作系統而言，它的尋址空間（虛擬存儲空間）為4G（2的32次方）。操作系統的核心是內核，獨立於普通的應用程序，可以訪問受保護的內存空間，也有訪問底層

進程和線程

空間線程阻塞資源 http 優點 .cn 內核其他創建線程 1、線程的模型在Windows上，線程的模型大致為：一個內核線程調用了多個用戶線程，如果某一個用戶線程阻塞了，導致內核線程也阻塞了，進而影響了其他線程也被阻塞了，又因為 Windows上用戶線程特別

磁盤IO高和線程切換過高性能壓測案例分析

相關推薦