當網站上線後,流量增加或短暫功能故障,都會造成使用者體驗相當不好,而這時該怎麼快速找到效能的瓶頸呢?通常 CPU 達到 100% 時,有時候也很難複製及找出關鍵問題點。
本篇文章,我們會介紹一套工具叫 Pyroscope,讓開發者可以快速找到效能瓶頸的程式碼。Pyroscope 目前可以支援 Python, Ruby 或 Go 的環境。本文筆者會針對 Go 環境做介紹。
什麼是Pyroscope?
Pyroscope 是一套開源的效能即時監控平臺,簡單的 Server 及 Agent 架構,讓開發者可以輕鬆監控程式碼效能,不管你要找 10 秒或幾分鐘內的效能資料,都可以快速的即時呈現,開發者也不用在意裝了此監控會造成任何效能上的負擔。Pyroscope 背後的儲存採用 Badger 這套 Key-Value 資料庫,效能上是非常好的。目前只支援 3 種語言 (Python, Ruby 及 Go) 未來會預計支援 NodeJS。假設您還沒引入任何效能分析工具或平臺,那 Pyroscope 會是您最好的選擇;
Pyroscope架構
如果你有打算找效能分析工具平臺,Pyroscope 提供了三大優勢,讓開發者可以放心使用
低 CPU 使用率,不會影響既有平臺
可儲存好幾年的資料,並且可用 10 秒細顆粒度檢視資料
壓縮儲存資料,減少浪費硬碟空間
架構只有分 Server 和 Agent,除了 Go 語言之外,Python 跟 Ruby App 都是透過 pyroscope 指令啟動相關 app 來監控系統效能。
啟動Pyroscope服務
啟動方式有兩種,第一是直接用 docker 指令啟動:
另一種可以用 docker-compose 啟動
安裝Agent
Go中使用
本篇用 Go 語言當作示例,先 import package
接著在main.go寫入底下程式碼即可:
其中 http://pyroscope 可以換成自定義的 hostname 即可,接著開啟上述網址就可以看到效能監控的畫面了;
通過畫面,我們可以快速找到是SQL或那個函式方法時間長;
在 Python 和 Ruby 語言中使用
心得
這套工具相當方便,在 Go 語言雖然可以用 pprof 快速找到問題,但是難免還是需要手動的一些地方才可以查出效能瓶頸,有了這套平臺,就可以將全部 App 都進行監控,當使用者有任何問題,就可以快速透過 Pyroscope 檢視哪些程式碼出了問題。