1. 程式人生 > >EMC Isilon(OneFS)存儲誤刪除數據恢復方法【數據恢復實例】

EMC Isilon(OneFS)存儲誤刪除數據恢復方法【數據恢復實例】

存儲 服務器 數據恢復 誤刪除

【科普Isilon的存儲結構】
Isilon內部使用的是分布式文件系統OneFS。在Isilon存儲集群裏面每個節點均為單一OneFS文件系統,所以Isilon在支持橫向擴展的同時並不會影響數據正常使用。在存儲集群工作時,所有節點提供相同的功能,節點與節點之前沒有主備之分。當用戶往存儲集群中存儲文件時,OneFS層會將文件分成128K的片段分別存到不同的節點中,而在節點層又會將128K的片段分成8K的小片段分別存到該節點的不同硬盤中。而用戶文件的Indoe信息、目錄項及數據MAP則會分別存儲在所有節點中,這樣可以確保用戶不管從那個節點都可以訪問到所有數據。Isilon在初始化時會讓用戶選擇相應的存儲冗余模式,不同的冗余模式所提供的數據安全級別也不一樣(默認3個節點采用N+2:1模式)。

【存儲數據恢復故障描述】

某公司管理員由於誤操作將服務器中包括MSSQL數據庫,以及大量的MP4、ASF和TS類型的視頻文件等重要數據刪除。需要進行數據恢復的這臺服務器整體存儲架構采用EMC高端網絡NAS(Isilon S200),節點數量為3個,每個節點配置12塊3T STAT硬盤,無SSD。需要進行數據恢復的數據包括vmware虛擬機(WEB服務器)和視頻文件,虛擬機通過NFS協議共享到ESX主機,視頻文件通過CIFS協議共享給虛擬機(WEB服務器)。NFS共享的所有數據(也就是所有虛擬機)被刪除而CIFS共享的數據則沒有被刪除。

【備份服務器數據】

因考慮到數據安全性,避免對數據造成二次破壞,需對所有硬盤進行全部備份。但是由於磁盤數量太多(單節點12塊盤,3個節點36塊盤),且單盤容量太大(單盤3TB,一共108TB),因此備份周期會較長。最終客戶決定,只對存儲中現有數據進行備份,由數據恢復公司備份一次,客戶再備份一次,以確保現有數據安全。

【服務器數據分析】

服務器數據備份完成後在Isilon的web管理界面中將Isilon正常關機。再將所有節點上的所有硬盤貼上標簽,並依次取出再放到數據恢復平臺中,開始分析所有硬盤中的數據。
由於客戶數據是被刪除了,因此不用過多考慮存儲的冗余級別,重點需要分析文件刪除後,文件Indoe及數據MAP是否發生變化。刪除的虛擬磁盤文件都在64G或以上,並且存儲中沒有其他類型的大文件。編寫掃描所有文件Indoe的程序,將文件大小符合64G或以上的Indoe都掃描出來。再仔細分析掃描出來的Indoe,發現Indoe中記錄的數據MAP位置,其index指向的內容已不再是正常數據,並且所有節點上的Indoe均是同樣的情況。再仔細分析Inode,發現大文件的數據MAP會有多層(樹結構),並且數據MAP中會記錄文件的唯一ID,因此可以嘗試找到文件最底層的數據MAP。抱著僥幸心理對文件最底層的數據MAP做遍歷跟蹤操作,發現最低層的數據MAP果然還在。

【數據恢復過程】

從文件的Inode中取出文件的唯一ID,然後對所有符合該ID的數據MAP做聚合。並根據數據MAP中的VCN號做排序,發現每個文件的前17088項數據MAP都不存在。
·

仔細換算了一下發現丟失的數據MAP項總共才包含不到1G的數據,而刪除的文件全是虛擬機的vmdk文件,裏面都是NTFS的文件系統,而NTFS文件系統的MFT基本都在3G的位置,也就是只需要在每個vmdk文件的頭部手動偽造一個MBR和DBR就可以解釋vmdk裏面的數據了(真不知到是巧合呢!還是巧合呢!)。對掃描到的數據MAP做解釋,並根據VCN號的順序導出數據,沒有MAP的情況保留為零。
·
經過不斷的測試,先導出一個vmdk文件來看看。結果令我大吃一驚,導出的vmdk文件比實際情況要小,並且vmdk中MFT的位置也與自身描述不符。手動隨機驗證了幾個MPA發現都能指向數據區,而程序解釋MAP的方式也都沒有問題。所以猜測到可能為文件稀疏!
將代碼進行部分調整後重新導出剛才的vmdk,這次vmdk大小符合實際大小,且MFT的位置也在相應位置。手工偽造一個MBR,分區表以及DBR,再用文件系統解釋工具(自用工具)成功解釋其文件系統,導出vmdk裏面的數據庫及視頻文件。
在驗證了此vmdk中的數據庫及視頻文件沒問題後,批量導出所有重要的vmdk文件,再手工一個一個的去修改每個vmdk文件。

【數據驗收】

將客戶所有重要的數據恢復完成後,由客戶方安排工程師對恢復的所有數據做完整性及準確性檢測,數據最終確定完全沒有問題,數據恢復成功。

EMC Isilon(OneFS)存儲誤刪除數據恢復方法【數據恢復實例】