1. 程式人生 > >raid5 磁碟陣列崩潰導致資料丟失的恢復案例

raid5 磁碟陣列崩潰導致資料丟失的恢復案例

資料恢復故障描述:
某研究院 DELL 磁碟陣列崩潰,內建15塊1TB硬碟搭建的RAID5陣列。一開始有一塊硬碟離線,在更換新硬碟進行同步的過程中,第二塊磁碟指示燈報警,同步失敗,陣列無法正常工作。


故障初步檢測:
儲存介質物理狀態:最先離線的硬碟訪問速度極其緩慢,第二塊離線的磁碟有少量壞扇區,其他磁碟無明顯物理問題。
儲存介質邏輯狀況:整個陣列只包含一個卷組,該卷組佔用陣列全部空間;並且該卷組只有一個起始位置為0扇區的XFS裸分割槽。


資料恢復故障分析:
RAID5陣列架構在設計上只支援一塊磁碟的錯誤冗餘功能,當第二塊磁碟離線後陣列便無法正常工作。
根據使用者描述可知,整個陣列的崩潰主要由第二塊磁碟造成。所以第二塊磁碟的處理是此次恢復的關鍵


資料恢復過程:
1、對所有硬碟做只讀映象的備份,單獨備份第二塊離線的硬碟,備份過程中略過壞扇區。
2、對15塊硬碟映象檔案進行異或測試,全部通過,無明顯錯誤。
3、計算第二塊硬碟損壞扇區位置的資料,並將其寫入映象檔案。
4、在備份過程中同時分析原RAID組成結構,構建虛擬RAID環境。
5、驗證RAID結構是否正確。
6、將第二塊磁碟的映象備份到新硬碟,並將其強制上線,更換第一塊磁碟,並對其進行同步。(注意:在操作之前要對所有硬碟進行備份)
7、拷貝資料。
資料恢復結論:
因為異或測試完全通過,所以表明該儲存發生故障後沒有新資料寫入,或結構改動。
所以可以根據其他幾塊好硬碟計算出壞硬碟對應位置的資料。
恢復完成後,目錄結構完整,重要文件全部完好。FSCK無任何錯誤提示,客戶認可所恢復的資料,恢復成功。