1. 程式人生 > >服務器數據恢復案例 / raid5陣列多塊硬盤離線處理方法

服務器數據恢復案例 / raid5陣列多塊硬盤離線處理方法

ext 型號 存取 兩個 明顯 p4500 客戶 情況 生成

服務器數據恢復案例一:

某研究院 DELL服務器 磁盤陣列崩潰,內置15塊1TB硬盤搭建的RAID5陣列。一開始有一塊硬盤離線,在更換新硬盤進行同步的過程中,第二塊磁盤指示燈報警,同步失敗,陣列無法正常工作。
服務器數據恢復檢測:
最先離線的硬盤訪問速度極其緩慢,第二塊離線的磁盤有少量壞扇區,其他磁盤無明顯物理問題。
服務器質邏輯狀況:
整個陣列只包含一個卷組,該卷組占用陣列全部空間;並且該卷組只有一個起始位置為0扇區的XFS裸分區。
制定服務器數據恢復方案:
RAID5陣列架構在設計上只支持一塊磁盤的錯誤冗余功能,當第二塊磁盤離線後陣列便無法正常工作。根據用戶描述可知,整個陣列的崩潰主要由第二塊磁盤造成。所以第二塊磁盤的處理是此次恢復的關鍵

服務器數據恢復過程:
1、對所有硬盤做只讀鏡像的備份,單獨備份第二塊離線的硬盤,備份過程中略過壞扇區。
2、對15塊硬盤鏡像文件進行異或測試,全部通過,無明顯錯誤。
3、計算第二塊硬盤損壞扇區位置的數據,並將其寫入鏡像文件。
4、在備份過程中同時分析原RAID組成結構,構建虛擬RAID環境。
5、驗證RAID結構是否正確。
6、將第二塊磁盤的鏡像備份到新硬盤,並將其強制上線,更換第一塊磁盤,並對其進行同步。(註意:在操作之前要對所有硬盤進行備份)
7、拷貝數據。
服務器數據恢復結論:
因為異或測試完全通過,所以表明該存儲發生故障後沒有新數據寫入,或結構改動。
所以可以根據其他幾塊好硬盤計算出壞硬盤對應位置的數據。
恢復完成後,目錄結構完整,重要文檔全部完好。FSCK無任何錯誤提示,客戶認可所恢復的數據,恢復成功。

服務器數據恢復案例二:

某公司的P4500服務器raid故障,強制上線操作後raid依然不可用,該用戶存儲中共三組raid,兩個卷,12塊物理硬盤。具體情況如下:
技術分享圖片
服務器數據恢復第一步:檢測物理硬盤,硬盤無故障,隨後對服務器中所有磁盤進行全盤鏡像並對鏡像文件進行分析。底層的RAID是一個HP雙循環RAID5,第一組RAID正常。第二組RAID也是RAID5,所以可以肯定第二組RAID中掉盤數量至少為2塊。
服務器數據恢復第二步:使用窮舉加校驗的方法分析最早掉線的磁盤後踢出,重組raid。
最後將生成的數據和第一組完好的RAID一同掛載到HP-P4500服務器上。然後啟動服務器,上層卷可用,檢查最新文件正常,數據恢復成功。

服務器數據恢復案例總結:

由於技術的不斷進步,不同型號的服務器出現RAID 5故障後,處理方法也不同。
現在大型應用程序的網絡拓樸結構,一般都采用C/S結構或B/S結構,至少需要一臺裝有大型數據庫的服務器安放於中心機房。基於對服務器安全性與可靠性的考慮,通常會對服務器的磁盤采用磁盤陣列RAID(Redundant Array of Inexpensive Disk)進行磁盤冗余備份。其中RAID 5陣列級別為無獨立校驗磁盤的奇偶校驗磁盤陣列,采用數據分塊和獨立存取技術,能在同一磁盤上並行處理多個訪問請求,同時允許陣列中的任何一個硬盤出現故障。
實際應用中,由於某些不可避免的客觀原因,可能會造成一些陣列故障。最常出現的狀況就是硬盤自行脫機,聯機狀態顯示為DDD(Defunct Disk Drive,無效磁盤驅動器),硬盤出現物理故障或邏輯故障。如果是物理故障,只有進行硬盤更換;如果是邏輯故障,可以通過有針對性的技術修復,恢復硬盤的在線狀態,繼續保持其原始陣列中的硬盤數據條帶化分布狀態,延續數據存儲體系的一致性。

服務器數據恢復案例 / raid5陣列多塊硬盤離線處理方法