1. 程式人生 > >硬體運維:記錄一次被伺服器電源模組坑成狗的案例

硬體運維:記錄一次被伺服器電源模組坑成狗的案例

事由

今天開始,逐步把硬體運維過程中遇到的坑整理成公眾號文章,以便踩到坑的人共勉,也給還沒踩到坑的人一個提醒。至於這款電源模組,反正我已經被這款電源模組(這裡說的艾默生電源PH-79RDR指的是DELL PC伺服器使用的電源模組)坑過N回了,總體總結成3類問題

問題1 :PH-79RDR在低版本的BIOS中無法選擇引導項

由於機房現場特殊的電源環境限制,該機房只能使用高壓直流電源模組,於是將一臺DELL R720伺服器的電源模組更換為PH-79RDR,瞬間點亮,很是開心。

然而,問題來了

我們裝系統都是選擇PXE安裝,可這坑爹的,居然在引導(BIOS Boot Manager)的時候只有Normal選項,沒其他選項。這裡忘記截圖,我貼上一個正常情況下的截圖。

反覆確認了幾遍之後,放棄掙扎,撥打了dell售後根據工程師要求,將BIOS升級到2.4.3版本。照方法升級後,重啟進BIOS Boot Manager很贊!問題解決了!!!

問題2 :PH-79RDR在2.4.3版本的BIOS中電源管理初始化失敗

還開心著問題解決了的時候,我發現了新的問題。在某次重啟過程中發現告警電源管理韌體初始化失敗。

WarningPower management fireware not responsive

Disconnect and reconnect system input power

WarningPower management fireware initialization error

不僅如此,最坑爹的來了,在系統命令列執行init 6命令後,只見關鍵,不見自動開機,必須點選開機鍵才能開機!

開機後繼續卡在Strike the F1 key to continueF2 to run the system setup program,無法進系統。

在DELL工程師的繼續指導下,嘗試了升級電源管理韌體,各種不耐煩情況下,我還是嘗試了4種不同的方法進行更新韌體(windows下更新除外),全部以失敗告終

問題3 :PH-79RDR電源官方不支援高壓直流!

看來準備要更換電源模組才能解決問題了,按照工程師要求吧電源模組的備件號給他PH-79RDR,結果被告知,這款電源模組支援在交流環境下使用,什麼,這款電源模組可是從你DELL

買的,說不支援就不支援了,而且在高壓直流環境下,已經有好幾臺伺服器使用這款電源模組在線上跑著呢。經過各方查詢,最後證實PH-79RDR這款確實是非官方認證的資產高壓直流,實際上是支援的!(期間為了能夠正常派件保修,我將伺服器換到交流環境下跑了一下,依然出現電源管理韌體初始化失敗的提示)

由於被官方告知,這款電源不支援高壓直流,所以在DELL上門工程師陪同下,一起在交流環境做了一次測試,結果顯示問題依舊。終於DELL終於同意更換電源模組了。結果更換完問題居然還在。

問題終於解決了

經過和dell工程師討論,決定將BIOS版本降級到2.4.2試試。經過降級BIOS,重啟。哇咔咔,一切完美,所有問題解決。

結論與解決方案

1、艾默生電源PH-79RDR在BIOS 2.4.3版本下回出現電源管理初始化失敗的問題,解決辦法是將BIOS降級回2.4.2

2、艾默生電源PH-79RDR在1.*版本的BIOS下可能會出現引導選項缺失的問題

3、艾默生電源PH-79RDR在官方認證中,是不支援高壓直流環境的,而實際使用過程中發現是可以支援的

4、補充一個艾默生電源PH-79RDR在另外一個案例中遇到的坑的結論,在電源管理韌體本07.09.49下,該電源模組可能會出現異常自動重啟的問題。解決辦法是將電源韌體版本升級到07.09.50

原文來自微信公眾號:餘果果園