1. 程式人生 > >兩組raid5兩塊盤掉線數據恢復成功案例-有方案

兩組raid5兩塊盤掉線數據恢復成功案例-有方案

臨時 機器 ext 產生 硬盤 操作系統 陣列 出現 由於

磁盤陣列兩塊硬盤離線數據恢復案例一:

····客戶使用Dell 2850服務器組建了raid5磁盤陣列,陣列中包含有6塊硬盤(SCSI硬盤,單盤容量300G),服務器操作系統為linux Redhat4;文件系統為ext3文件系統。在使用過程中服務器癱瘓,管理員對陣列檢查後發現有兩塊硬盤離線,對其中一塊硬盤進行了強制上線操作,但操作系統啟動異常。管理員此時意識到事情的嚴重程度,馬上對服務器進行關機,然後聯系到數據恢復中心進行數據恢復。
····數據恢復中心初檢結論:
····在服務器數據恢復工作中,raid5兩塊硬盤離線的情況十分常見,由於raid5磁盤陣列支持一塊硬盤離線時的榮譽保護,一旦多塊硬盤處於離線狀態,服務器便處於癱瘓狀態,且不會自動上線。由於raid控制器具有一定的面感性,多數硬盤掉線緊緊是因為電源波動、控制器bug等隨機原因導致,所以掉線盤可能沒有嚴重的物理故障。本案例就是如此。但是此時管理員進行強制上線操作風險性是很大的,一旦上線錯誤就會導致控制器對數據產生一些不可逆的損壞,當管理員進入操作系統後因為文件系統不一致進行修復,服務器中所有硬盤數據不一致,數據恢復難度非常大。

····服務器數據恢復過程:
····首先對服務器中所有硬盤進行完整備份,在備份過程中發現多塊硬盤已經存在壞道但沒有下線,原因是raid沒有讀到硬盤壞道。備份完成後分析原服務器的raid組成結構然後虛擬出raid環境對raid結構畸形驗證,把服務器後期破壞的結構進行人工修正,將修正後的數據導出到一臺中間存儲上臨時存放。數據恢復的最後一步使用完好的硬盤在服務器上搭建新的raid5磁盤陣列,將恢復出的數據遷移到新raid中即可。檢驗恢復出來的數據一切正常,數據成功恢復。
····服務器數據恢復結論:
····一旦raid5磁盤陣列出現多塊硬盤離線、服務器癱瘓的情況切記不要盲目進行強制上線操作,如果有足夠的備用空間,可將源硬盤全部鏡像。有兩種方法(WINDOWS2003或DOS下,其他操作系統有風險):

  1. 可用相同或大於源盤容量的硬盤做為目標盤,將源盤全部扇區方式CLONE到目標盤。將所有盤做同樣操作。
    1.可將每塊源盤完全以扇區方式輸出文件到某大容量存儲空間(如大容量硬盤、NAS、SAN、DAS等)
    ·

    磁盤陣列兩塊硬盤離線數據恢復案例二:

    ····HP LH6000的故障如下: 一塊硬盤紅燈閃亮,機器還在正常運行,但沒有多久,系統就不能正常運行,這時才發現另一塊硬盤的紅燈也在閃亮。
    ····磁盤陣列數據恢復過程:
    1.啟動服務器,自檢至陣列時按Ctrl+M進入NetRaid管理程序。查看陣列信息,發現硬盤狀態為Failed,運用修改配置將一硬盤強行設置成OnLine。重新啟動服務器,在進入系統前的硬件自檢時無效,啟動失敗。

    2.啟動服務器,自檢至陣列時按Ctrl+M進入NetRaid管理程序。選擇磁盤陣列,將原來OnLine掛起來的硬盤手工Fail掉,然後再把另一塊Failed的硬盤手工設置成OnLine,重新啟動服務器就可以進入系統了。
    3.查看系統及數據庫都運行正常後,再進陣列配置工具把Failed的硬盤手工設置成Rebuild,100%完成重建後再重啟服務器,所有的陣列及系統都恢復原狀了。

····筆者所在單位另一臺運行ERP系統的服務器(HP ProLiant 文明用語370),由4塊146GB熱插拔硬盤通過RAID卡(Smart array陣列卡)配置成一臺具有RAID 5級的磁盤陣列。其中一塊硬盤在運行過程中突然出現故障。服務器RAID 5自動啟用熱備份硬盤(Hot Spare),對損壞硬盤進行邏輯替代。整個硬盤的數據訪問任務仍然完整地運行在原來的讀寫進程序列中,應用程序和數據庫沒有發生影響。
····通過HP自帶的ACU工具查看硬盤狀態進行檢查,發現紅燈示警的硬盤處於脫機狀態。如果HP ProLiant服務器中的Raid 5有兩塊硬盤出現亮紅燈時,表明系統已經崩潰,數據庫也就不能訪問,但系統不會自動關機。當第二塊硬盤亮紅燈後,用常規的手段是不能恢復數據的,只有付費找專業的第三方數據恢復公司恢復數據。
····因此,對惠普老型號HP LH6000系列服務器來說,陣列的設計方面與現在HP ProLiant系列服務器的陣列有很多不同。就操作方法看,HP LH6000服務器的陣列操作方法有很多可選項,包括陣列失敗後可以重新刪除陣列並重建等,初始化也是手工選擇的。但是HP ProLiant系列服務器陣列的初始化是在配置陣列後自動在後臺執行的,所以ProLiant系列服務器在陣列出錯後是不能重配陣列的。

兩組raid5兩塊盤掉線數據恢復成功案例-有方案