〇、一件事兒

以下分析是站在Java工程師的角度來分析的。

一、CPU分析

分析CPU的繁忙程度，兩個指標：系統負載和CPU利用率

1、系統負載分析

系統負載：在Linux系統中表示，一段時間內正在執行程序數和CPU執行佇列中就緒等待程序數，以及非常重要的休眠但不可中斷的程序數的平均值（具體load值的計算方式，有興趣可以自行深究，這裡不深究）。說白了就是，系統負載與R(Linux系統之程序狀態)和D(Linux系統之程序狀態)狀態的程序有關，這兩個狀態的程序越多，負載越高。

檢視系統負載，見top命令：第1部分。

怎麼看load average的值？
通常先看15分鐘的load值，如果load很高，再看1分鐘和5分鐘的load值，檢視是否有下降趨勢。短時間內load值高，無須太擔心；但是如果長時間內load值持續過高，那麼就要趕緊看看發生了什麼。
需要警惕的load average的值（以單核CPU為例）:
- load值持續大於0.7，必須開始找問題出在哪裡，防止情況惡化；
- load值持續大於1.0，解決問題已迫在眉睫；
- load值持續大升高達到5.0，表示各種請求幾乎得不到響應，機器幾近崩潰；
  
  對於多核機器，則需要根據CPU個數來判斷系統負載是否過高。如，若認為0.7算是單核機器負載的安全線的話，則四核機器的負載最好保持在3(4*0.7 = 2.8)以下。

2、CPU利用率分析

看CPU的空閒率，使用者程序CPU使用率和系統程序CPU使用率。
看個別程序的CPU利用率是否明顯高於其他程序：
- 死迴圈？
- 複雜計算？
- 超大物件耗時讀寫？

檢視CPU利用率，見top命令：第3部分和第5部分。

3、綜合兩個分析

CPU利用率高，系統負載低
- 死迴圈？
- 複雜計算？
- 超大物件耗時讀寫？
系統負載高，CPU利用率低
- 大量IO操作？
- 大量死鎖？
- 大量執行耗時SQL？
- 記憶體不足，頻繁GC？
系統負載高，CPU利用率高
- 大量程序出現死迴圈？
- 大量程序進行復雜計算？
- 大量程序對超大物件耗時讀寫？
- 硬體無法支撐應用，升級機器？

三、記憶體分析

看總記憶體的使用情況；
是否有個別程序記憶體消耗明顯高？
- JVM記憶體設定是否合理？
- 是否有大物件長時間未釋放？

檢視記憶體使用情況，見free命令和top命令：第5部分。

四、I/O分析

如果avgqu-sz比較大，表示相當量的io在等待；
如果svctm比較接近await，說明I/O幾乎沒有等待時間；如果 await遠大於svctm，說明I/O 佇列太長，io響應太慢，則需要進行必要優化；
如果%util接近 100%(70%為安全線)，說明產生的I/O請求太多，I/O系統已經滿負荷，該磁碟可能存在瓶頸；
如果I/O存在瓶頸，可以用pidstat命令找到I/O讀寫高的程序；

檢視I/O讀寫狀況，見iostat命令。

五、網路分析

netstat分析：

分析連線狀態
- 若服務端出現了大量TIME_WAIT狀態的連線，說明該伺服器經常主動發起連線關閉操作，這是不可取的；
- 若一個系統頻繁出現CLOSE_WAIT狀態的連線，說明該系統並未立即處理連線關閉請求，系統存在缺陷；
分析網路佇列
- 若Recv-Q過大，說明系統未能及時處理外部發來的請求；
- 若Send-Q過大，說明系統發包速度過快以至於連線無法及時將資料發出，或者對端接收資料包慢
  
  這兩個值通常應該為0，如果不為0可能是有問題的；資料包在兩個佇列裡都不應該有堆積；可接受短暫的非0情況。
分析伺服器端能否正常處理客戶端連線
如果Recv-Q佇列大小值>=設定的somaxconn值（cat /proc/sys/net/core/somaxconn）說明伺服器無法適應當前連線建立速度，不能及時accept新的連線。

客戶端在呼叫listen時，會傳遞backlog引數，該引數為“已建立連線但未被程式accept的連線佇列的長度”，核心層會根據cat /proc/sys/net/core/somaxconn值與傳入的backlog值，選擇兩者中的小值作為“已建立連線但未被伺服器accept的連線佇列長度”

tcpdump分析：

tcpdump通過抓指定埠的資料包，可以分析指定程序的資料包流量。

通過抓包工具tcpdump及網路狀態檢視命令netstat可以幫助定位客戶端、服務端相關網路問題，在日誌匱乏或效能統計資訊不足以分析伺服器問題時，可以輔助分析伺服器相關模組效能。

檢視網路連線狀況，見netstat命令和tcpdump命令。

六、排查思路

系統負載、CPU利用率、記憶體、I/O、網路等因素綜合考慮，才是解決問題的關鍵。
先整體分析哪塊問題，再定位特徵程序（例如CPU利用率明顯高於其他程序的程序），進而結合jstack定位到執行緒和程式碼。

Linux系統之執行狀態分析及問題排查思路

〇、一件事兒以下分析是站在Java工程師的角度來分析的。一、CPU分析分析CPU的繁忙程度，兩個指標：系統負載和CPU利用率 1、系統負載分析系統負載：在Linux系統中表示，一段時間內正在執行程序數和CPU執行佇列中就緒等待程序數，以及非常重要的休眠但不可中斷的程序數的平均值（具體load值的計算

手把手帶你自制Linux系統之六編譯核心及busybox完成系統定製

手把手帶你自制Linux系統之六編譯核心及busybox完成系統定製重新看了一下前面的幾章，發現其實前面的5章一直圍繞一個話題講解 — 如何利用CentOS現有資源組裝一個Linux。這種方式十分拙劣，Linux核心是固化的、initrd沒有充分精簡、命令需要一個一個

Linux系統之程序狀態

一、程序狀態 D：uninterruptible sleep (usually IO) R：running or runnable (on run queue) S：interruptible sleep (waiting for an event to complete) T：stopped by job

Linux系統之進程及服務的控制

user db2 3.3 -a 空間 text 什麽是 phi 虛擬 1、什麽是進程？ ??系統中正在運行的程序。 2、圖形的進程查看方式 ??gnome-system-monitor 3、查看進程的命令 ??whatis?ps3.1ps??查看進程 3.2ps?a??查看

linux網路程式設計之TCP狀態轉換及埠複用

（1）TCP狀態轉換圖其中圖中分為三種狀態：實線代表的主動發起連線，虛線代表的被動發起連線，細實線代表的可以雙向發起連線的狀態。主動發起連線方狀態變化：1）主動發起連線的一方傳送SYN標誌位，進入SYN_SENT狀態，等待接收被髮起連線方

解決Linux上crontab執行兩次及分析過程

問題描述：寫了一個python指令碼，在linux上配置了crontab任務，由於涉及檔案讀寫，發現檔案內容經常錯亂，通過命令列執行沒有問題分析過程： 1.在指令碼中增加了日誌，通過日誌發現指令碼被2個執行緒執行了，如下圖： 2.我艹...，什麼地方幫我執行了

cocos2d-x遊戲引擎核心之多執行緒分析及注意事項

一、多執行緒原理（1）單執行緒的尷尬　　重新回顧下 Cocos2d-x 的並行機制。引擎內部實現了一個龐大的主迴圈，在每幀之間更新各個精靈的狀態、執行動作、呼叫定時函式等，這些操作之間可以保證嚴格獨立，互不干擾。不得不說，這是一個非常巧妙的機制，它

linux檔案系統之mount流程分析

本質上，Ext3 mount的過程實際上是inode被替代的過程。例如，/dev/sdb塊裝置被mount到/mnt/alan目錄。那麼mount這個過程所需要解決的問題就是將/mnt/alan的dentry目錄項所指向的inode遮蔽掉，然後重新定位到/dev/sdb所

mysql 執行狀態分析執行故障排查

目錄一、優化概述二、查詢與索引優化分析 1效能瓶頸定位 Show命令慢查詢日誌 explain分析查詢 profiling分析查詢 2索引及查詢優化一、優化概述 MySQL資料庫是常見的兩個瓶頸是CPU和I/

Linux系統的執行級別及使用者命令

Linux系統的執行級別 init 0 關機 1 單使用者模式（與Windows的安全模式類似） 2 不完全多使用者，不含NFS服務 3 完全多使用者 4 未分配 5 圖形化介面 6 重啟 run

Java執行狀態分析1：執行緒及執行緒狀態

執行緒執行緒（英語：thread）是作業系統能夠進行運算排程的最小單位。它被包含在程序之中，是程序中的實際運作單位。一條執行

Linux系統調用過程分析

policy 用戶空間抽象接口保護 name ack for 內嵌驅動程序參考：《Linux內核設計與實現》 0 摘要 linux的系統調用過程：層次例如以下：用戶程序------>C庫（即API）：INT 0x80 ----->system_

Python第5堂課（linux系統之用戶群組權限篇）

用戶添加 -s 用戶和組 alex 更改讀取 ... 一個顯示作業一： 1) 新建用戶natasha，uid為1000，gid為555，備註信息為“master” 2) 修改natasha用戶的家目錄為/Natasha 3) 查看用戶信息配置文件的最後一行 4) 為n

Linux系統之文件共享NFS

network 配置文件本地磁盤局域網服務器實驗一、基礎概念NFS：Network File System網絡文件系統，Unix系統之間共享文件的一種協議，只能應用在局域網中將網絡磁盤分區映射到本地，節省本地磁盤空間協議： RPC（Remote Proced

Linux系統之啟動流程

linux系統啟動流程開機自檢(bios)MBR引導GRUB菜單加載內核（kernel）init 進程初始化·由linux內核加載運行/sbin/init·是系統的第一個進程·PID永遠為1init進程的配置文件參數說明/etc/inittab配置默認運行級別/etc/sysconfig/init控制tty終

Linux系統之守護進程和計劃任務

linux進程和計劃任務程序和進程的關系*程序·保存在硬盤、光盤等介質中可執行代碼和數據·靜態保存的代碼*進程·在cpu及內存中運行的程序代碼·動態執行的代碼·父、子進程>每個進程可創建以個或者多個進程*PID號·每個進程的唯一標識，通常作為結束進程時使用*進程查詢·ps

Android 65K問題之Multidex原理分析及NoClassDefFoundError的解決方法

bottom mini ati ... types auto weight right for Android 65K問題相信困惑了不少人，盡管AS的出來能夠通過分dex高速解決65K問題，可是同一時候也easy由於某些代碼沒有打包到MainDex裏

如何將Linux系統的多個目錄及文件備份並壓縮到一個文件，以方面保持和傳遞?

如何將linux系統的多個目錄及文件備份並壓縮到一個文件以方面保持和傳遞? 1.備份Linux系統　　window系統在運行狀態下，我們是無法將文件拷貝出來的，那麽在Linux下呢？她的文件結構式一種樹型結構。而且在系統運行的時候我們可以進行打包所有系統文件。特別要說的在Linux的root賬戶具備

js學習總結----crm客戶管理系統之前端頁面開發及數據渲染

bmi length element || useradd attribute xxx tle exe 具體代碼如下: index.html <!DOCTYPE html> <html lang="en"> <head> <

從零開始學Linux系統之Vi/Vim操作

命令模式 nmap 快捷大小 users vim 修改忽略大小寫 unmap vi/vim:編輯模式 <-：—-命令模式 —-a、i、o A、I、O —> 插入模式設置行號 :set nu :set nonu 行號移動： gg G nG/