1. 程式人生 > >服務器磁盤陣列數據恢復方法和數據恢復過程詳解

服務器磁盤陣列數據恢復方法和數據恢復過程詳解

服務器 數據恢復 raid5數據恢復 服務器數據恢復 硬盤離線

服務器故障描述:
客戶使用Dell 2850服務器組建了raid5磁盤陣列,陣列中包含有6塊硬盤(SCSI硬盤,單盤容量300G),服務器操作系統為linux Redhat4;文件系統為ext3文件系統。在使用過程中服務器癱瘓,管理員對陣列檢查後發現有兩塊硬盤離線,對其中一塊硬盤進行了強制上線操作,但操作系統啟動異常。管理員此時意識到事情的嚴重程度,馬上對服務器進行關機,然後聯系到數據恢復中心進行數據恢復。
技術分享圖片

數據恢復中心初檢結論:

在服務器數據恢復工作中,raid5兩塊硬盤離線的情況十分常見,由於raid5磁盤陣列支持一塊硬盤離線時的榮譽保護,一旦多塊硬盤處於離線狀態,服務器便處於癱瘓狀態,且不會自動上線。由於raid控制器具有一定的面感性,多數硬盤掉線緊緊是因為電源波動、控制器bug等隨機原因導致,所以掉線盤可能沒有嚴重的物理故障。本案例就是如此。但是此時管理員進行強制上線操作風險性是很大的,一旦上線錯誤就會導致控制器對數據產生一些不可逆的損壞,當管理員進入操作系統後因為文件系統不一致進行修復,服務器中所有硬盤數據不一致,數據恢復難度非常大。

服務器數據恢復過程:

首先對服務器中所有硬盤進行完整備份,在備份過程中發現多塊硬盤已經存在壞道但沒有下線,原因是raid沒有讀到硬盤壞道。備份完成後分析原服務器的raid組成結構然後虛擬出raid環境對raid結構畸形驗證,把服務器後期破壞的結構進行人工修正,將修正後的數據導出到一臺中間存儲上臨時存放。數據恢復的最後一步使用完好的硬盤在服務器上搭建新的raid5磁盤陣列,將恢復出的數據遷移到新raid中即可。檢驗恢復出來的數據一切正常,數據成功恢復。

服務器數據恢復結論:

一旦raid5磁盤陣列出現多塊硬盤離線、服務器癱瘓的情況切記不要盲目進行強制上線操作,如果有足夠的備用空間,可將源硬盤全部鏡像。有兩種方法(WINDOWS2003或DOS下,其他操作系統有風險):
1、可用相同或大於源盤容量的硬盤做為目標盤,將源盤全部扇區方式CLONE到目標盤。將所有盤做同樣操作。
2、可將每塊源盤完全以扇區方式輸出文件到某大容量存儲空間(如大容量硬盤、NAS、SAN、DAS等)

服務器磁盤陣列數據恢復方法和數據恢復過程詳解