1. 程式人生 > >IBM伺服器raid5崩潰資料恢復方法

IBM伺服器raid5崩潰資料恢復方法

概述:

    IBM X3850伺服器,5塊73G SAS硬碟,其中4塊組成一個RAID5,另一塊做為熱備盤(Hot-Spare),3號盤早已經離線,但熱備盤未自動啟用rebuild(原因不明),之後2號盤離線,RAID崩潰。

    作業系統為linux redhat 5.3,應用系統為構架於oracle的一個oa,資料重要,時間很急。因oracle已經不再對本oa系統提供後續支援,使用者要求儘可能資料恢復+作業系統復原。熱備盤完全無啟用,硬碟無明顯物理故障,無明顯同步表現。資料通常可恢復

【恢復方案】

    1、保護原環境,關閉伺服器,確保在恢復過程中不再開啟伺服器。

    2、將故障硬碟標好序號,確保在拿出槽位後可以完全復原。

    3、將故障硬碟掛載至北亞資料恢復備份伺服器環境下,對所有故障硬碟做完全映象。備份完成後交回原故障盤,之後的恢復操作直到資料確認無誤前不再涉及原故障盤。

    4、對備份盤進行RAID結構分析,得到其原來的RAID級別,條帶規則,條帶大小,校驗方向,META區域等。

    5、根據得到的RAID資訊搭建一組虛擬的RAID5環境。

    6、進行虛擬磁碟及檔案系統解釋。

    7、檢測虛擬結構是否正確,如不正確,重複4-7過程。

    8、確定資料無誤後,按使用者要求回遷資料。如果仍然使用原盤,需確定已經完全對原盤做過備份後,重建RAID,再做回遷。回遷作業系統時,可以使用linux livecd或win pe(通常不支援)等進行,也可以在故障伺服器上用另外硬碟安裝一個回遷用的作業系統,再進行扇區級別的回遷。

9、資料移交後,由北亞資料恢復中心延長保管資料3天,以避免可能忽略的紕漏。

資料恢復及系統復原過程

    1、對原硬碟進行完整映象,映象後發現2號盤有10-20個壞扇區,其餘磁碟,均無壞道。

    2、分析結構:得到的最佳結構為0,1,2,3盤序,缺3號盤,塊大小512扇區,backward parity(Adaptec),結構如下圖:wKioL1hspGOSX-KZAAHx0aIzczM802.jpg

 圖一

    3、組好後資料驗證,200M以上的最新壓縮包解壓無報錯,確定結構正確。

    4、直接按此結構生成虛擬RAID到一塊單硬碟上,開啟檔案系統無明顯報錯。

    5、確定備份包安全的情況下,經客戶同意後,對原盤重建RAID,重建時已經用全新硬碟更換損壞的2號盤。將恢復好的單盤用USB方式接入故障伺服器,再用linux SystemRescueCd啟動故障伺服器,之後通過dd命令進行全盤迴寫。

    6、回寫後,啟動作業系統。正常情況下,這時候所有工作應該完成了。不巧的是,因幫頗費周折才解決,特意另起一段敘述。

系統復原過程:

    dd所有資料後,啟動作業系統,無法進入,報錯資訊為:/etc/rc.d/rc.sysinit:Line 1:/sbin/pidof:Permission denied  

    懷疑此檔案許可權有問題,用SystemRescueCd重啟後檢查,此檔案時間,許可權,大小均有明顯錯誤,顯然節點損壞。

    重新分析重組資料中的根分割槽,定位出錯的/sbin/pidof/datahf.net,發現問題因2號盤壞道引起。

    使用0,1,3這3塊盤,針對2號盤的損壞區域進行xor補齊。補齊後重新校驗檔案系統,依然有錯誤,再次檢查inode表,發現2號盤損壞區域有部分節點表現為(圖中的55 55 55部分):wKiom1hspJOw4WFVAALyy8WX58o924.jpg

 圖二 

    很明顯,雖然節點中描述的uid還正常存在,但屬性,大小,以最初的分配塊全部是錯誤的。按照所有可能進行分析,確定無任何辦法找回此損壞節點。只能希望修復此節點,或複製一個相同的檔案過來。

    對所有可能有錯的檔案,均通過日誌確定原節點塊的節點資訊,再做修正。

    修正後重新dd根分割槽,執行fsck -fn /dev/sda5/datahf.net,進行檢測,依然有報錯,如下圖:wKioL1hspLPB_HwOAAO1WDVLOKA316.jpg

 圖三

    根據提示,在系統中發現有多個節點共用同樣的資料塊。按此提示進行底層分析,發現,因3號盤早掉線,幫存在節點資訊的新舊交集。

    按節點所屬的檔案進行區別,清除錯誤節點後,再次執行fsck -fn /dev/sda5,依然有報錯資訊,但已經很少。根據提示,發現這些節點多位於doc目錄下,不影響系統啟動,於是直接fsck -fy /dev/sda5/datahf.net強行修復。

    修復後,重啟系統,成功進入桌面。

    啟動資料庫服務,啟動應用軟體,一切正常,無報錯。

    到此,資料恢復及系統回遷工作完成。

相關推薦

IBM伺服器raid5崩潰資料恢復方法

概述:     IBM X3850伺服器,5塊73G SAS硬碟,其中4塊組成一個RAID5,另一塊做為熱備盤(Hot-Spare),3號盤早已經離線,但熱備盤未自動啟用rebuild(原因不明),之後2號盤離線,RAID崩潰。     作業系統為linux redh

系統崩潰!win10系統修復和資料恢復方法總結

如今網際網路時代,使用Windows10系統的人越來越多了,但隨之而來的是更多人在面對Windows10系統崩潰後的不知所措。 那遇到系統崩潰該怎麼解決呢?今天小編就來分享win 10系統崩潰後的解決方法。 一、win 10系統崩潰解決方法 1、Shift鍵+重啟

IBM V7000 raid5數據恢復(多塊硬盤離線)

v7000數據恢復 raid數據恢復 服務器數據恢復 數據 恢復設備信息:故障表現:首先有一塊硬盤出現故障離線,熱備盤啟用替換,在此時與離線盤同一組Mdisk中又有其他另一塊磁盤出現故障離線。從而導致熱備盤同步失敗,這組Mdisk失效,進而影響到整個通用卷,通用卷無法使用。數據恢復概率分析:由於整個陣列失效的

服務器數據恢復成功案例(raid5陣列故障恢復方法

Raid5陣列 行數 vpd 明顯 信息 成功案例 raid 5 磁盤陣列 process 服務器數據恢復故障環境: 需要進行數據恢復的服務器型號為IBM DS5300存儲設備,包含一個存儲機頭和多個存儲擴展櫃,創建了2組RAID 5磁盤陣列。發生故障的陣列組為客戶服務器中

HP MSA儲存 raid組壞了2塊硬碟的資料恢復方法

一、raid資料恢復故障描述 故障描述 HP FC MSA2000儲存 整個儲存空間由8塊450GB SAS的硬碟組成,其中7塊硬碟組成一個RAID5的陣列,剩餘1塊做成熱備盤使用。由於RAID5陣列中出現2塊硬碟損壞,而此時只有一塊熱備盤成功啟用,因此導致RAID5陣列癱瘓,上層LUN無法

FreeNAS+ESXi5資料恢復過程+虛擬化資料恢復方法

【背景簡介】 故障發生在蘇州的一家公司,此公司使用一種廉價的儲存模式,用iSCSI方式來達到FC SAN的功能。物理儲存構架在一臺 DELL 伺服器上,使用 FreeNAS 來做 iSCSI,然後使用兩臺 DELL 伺服器做 ESXi5.0 的的虛擬化系統。FreeNAS 層為UFS2檔案系統,整個儲存建一

F盤提示無法訪問裝置硬體出現致命錯誤,導致請求失敗的資料恢復方法

    F盤打不開裝置硬體出現致命錯誤,導致請求失敗,是因為這個I盤的檔案系統內部結構損壞導致的。要恢復裡面的資料就必須要注意,這個盤不能格式化,否則資料會進一步損壞。具體的恢復方法看正文 工具/軟體:流星資料恢復軟體 步驟1:先下載並解壓程式執行後,直接雙擊需要恢復

Linux網站伺服器資料恢復_伺服器宕機資料恢復

[資料恢復故障描述] 一臺linux網站伺服器,DELL R200,管理約50個左右網站,使用一塊SATA 160GB硬碟。正常使用中突然宕機,嘗試再次啟動失敗,將硬碟拆下檢測時發現存在約100個壞扇區。 某資料恢復公司修復壞道後,嘗試了約3天時間,未恢復成功。 [資料恢復

因突然斷電造成Oracle破壞的資料恢復方法

我公司因一客戶的資料庫出現突然斷電,致使資料庫被破壞,無法進入資料庫,也無法匯出oracle中的資料,因我同事急電求助,所以經過研究,我將資料復原了.現將資料復原方法寫出來,供同行們參考.  1.如果資料庫版本是9.2以上的話,可以用一個nid工具修改sid等,這個工具的具體

監控錄影資料恢復方法步驟詳解

在人們生活日益改善的今天,社會的和諧安定成為了最為重要的一個問題。一些不法分子為了一己私利,通過不法手段謀取他人的財物。這樣的行為對社會對個人都是一種威脅,為了能更好的防治這類社會危害因素,那就需要我們的電子警察——視訊監控出馬了。 視訊監控在現在生活中隨處可見,道路上有治

MySQL:生產誤刪除資料恢復方法

因為生產上誤執行語句,需要找回原資料delete from `xxx` where a = 1; 步驟 1、解析主的binlog找到執行刪除語句時對應的pos點,如下: # at 27206534

ORACLE資料庫誤操作後資料恢復方法

1、查詢誤操作之前的資料,只需要保證時間在誤操作之前即可 select * from YOUR_TABLE as of timestamp to_timestamp('2017-11-11 18:0

伺服器資料恢復通用方法/伺服器硬碟故障導致資料丟失解決方案

[伺服器資料恢復原因推斷] 伺服器資料丟失情況很多,通常無法明確伺服器資料丟失的原因,常見的丟失原因有:伺服器硬碟出現故障,管理員或者伺服器自動進行fsck操作,這一操作可能造成更加嚴重資料丟失或者導致伺服器資料恢復的難度增加。伺服器資料丟失後執行mkfs操作,若操作未完成則容易導致部分塊組全部

伺服器資料恢復成功後回遷資料方法

在伺服器資料恢復工作中有一個案例值得分享給大家,本次資料恢復中客戶伺服器中共有2塊硬碟,因為硬碟物理故障導致伺服器不可用,在我公司進行資料恢復成功,下面要介紹的並非資料恢復過程,而是資料恢復成功後的資料遷移方法。 由於客戶的伺服器原本實用2塊硬碟組raid才導致一塊硬碟掉線後伺服器立刻癱瘓,因此

伺服器資料恢復的正確方法/伺服器硬碟故障的解決方案

[伺服器資料恢復原因推斷] 伺服器資料丟失情況很多,通常無法明確伺服器資料丟失的原因,常見的丟失原因有:伺服器硬碟出現故障,管理員或者伺服器自動進行fsck操作,這一操作可能造成更加嚴重資料丟失或者導致伺服器資料恢復的難度增加。伺服器資料丟失後執行mkfs操作,若操作未完成則容易導致部分塊組全部為0。或者管

RAID5重組與資料恢復的思路方法學習

環境是在2003下自己搭建的,5塊5G的硬碟組成的RAID5,把每塊硬碟單獨做了映象用來分析,分別是1.img—5.img 。首先用winhex開啟5個映象,如下圖所示。分別檢視5個映象的0號扇區,發現都是MBR,經過計算分割槽大小,全是5G,也就是單個硬碟的大小。所以都不是

redis——通過redis實現伺服器崩潰資料恢復

由於redis儲存在記憶體中且提供一般程式語言常用的資料結構儲存型別,所以經常被用於做伺服器崩潰宕機的資料恢復處理。伺服器可以在某些指定過程中將需要儲存的資料以json物件等方式儲存到redis中,也就是我們常說的快照,當伺服器執行時讀取redis來判斷是否有待需要恢復資料繼

raid資料恢復案例之:伺服器Raid5磁碟陣列資料恢復過程

伺服器資料恢復使用者:江西省某大學伺服器資料恢復故障描述:使用者使用的是曙光某型號16盤位光纖儲存櫃,底層儲存介質為16塊600GB 光纖磁碟,做成兩組RAID5磁碟陣列,每組raid中有7塊磁碟,另兩塊磁碟做成全域性熱備磁碟。第一組RAID磁碟陣列分有3個LUN,分別分配給

raid5磁盤陣列數據恢復方法_服務器數據恢復步驟_存儲結構介紹

數據恢復 存儲 服務器 raid磁盤陣列 一、HP-lefthand存儲簡介HP-lefhand存儲具有一定的市場占有量,基於其軟件定義存儲的弊端,這款存儲設備具有非常高的數據恢復需求。lefhand存儲支持搭建RAID5、RAID6、RAID10磁盤陣列,同時還支持卷快照,卷動態擴容等。本文

IBM服務器多塊硬盤離線數據恢復方法

數據恢復 服務器 陣列 raid 【raid數據恢復故障描述】 需要進行數據恢復的是北京一家公司的IBM X3850服務器,服務器掛載了5塊73G SAS硬盤組成raid5磁盤陣列,4號盤為熱備盤(Hot-Spare),由於未知原因2號盤離線後未能成功激活熱備盤rebuild,後3號盤離線,R