1. 程式人生 > >雲上的芯髒病:奇怪的阿里雲 RDS 資料庫突發 CPU 近 100% 問題

雲上的芯髒病:奇怪的阿里雲 RDS 資料庫突發 CPU 近 100% 問題

最近遇到了奇怪的阿里雲 RDS 資料庫突發 CPU 近 100% 問題,遇到了3次。

第一次是10月12日(週六)凌晨 3:24 負載極低的時候開始出現,早上發現後進行了主備切換,恢復了正常。

第二次也是出現在10月12日,就在主備切換後不久,發現後又進行了主備切換,切換回之前出問題的伺服器,恢復了正常。

第三次是昨天(10月18日)23:15 開始出現,今天早上(也是週六)發現後,再次通過主備切換恢復了正常。

阿里雲 RDS 型號用的是 SQL Server 2016 標準版,是9月份從 SQL Server 2008 R2 升級上來的,配置是 16核CPU,32G記憶體,比升級之前的配置上了一個檔次。

問題非常奇怪,目前還沒找到線索,有待進一步觀察。

我們沒向阿里雲提交工單,因為之前每次遇到類似的問題,阿里雲都是讓我們優化 SQL ,而沒有一次是通過優化 SQL 解決的。

非常抱歉,這個突發的雲上芯髒病問題給您帶來了麻煩,請您諒