1. 程式人生 > >[精華]細說容災備份的等級和技術

[精華]細說容災備份的等級和技術

容災備份的等級
  
  容災備份是通過在異地建立和維護一個備份儲存系統,利用地理上的分離來保證系統和資料對災難性事件的抵禦能力。
  
  根據容災系統對災難的抵抗程度,可分為資料容災和應用容災。資料容災是指建立一個異地的資料系統,該系統是對本地系統關鍵應用資料實時複製。當出現災難時,可由異地系統迅速接替本地系統而保證業務的連續性。應用容災比資料容災層次更高,即在異地建立一套完整的、與本地資料系統相當的備份應用系統(可以同本地應用系統互為備份,也可與本地應用系統共同工作)。在災難出現後,遠端應用系統迅速接管或承擔本地應用系統的業務執行。
  
  設計一個容災備份系統,需要考慮多方面的因素,如備份/恢復資料量大小、應用資料中心和備援資料中心之間的距離和資料傳輸方式、災難發生時所要求的恢復速度、備援中心的管理及投入資金等。根據這些因素和不同的應用場合,通常可將容災備份分為四個等級。
  
  第0級:沒有備援中心
  
  這一級容災備份,實際上沒有災難恢復能力,它只在本地進行資料備份,並且被備份的資料只在本地儲存,沒有送往異地。
  
  第1級:本地磁帶備份,異地儲存
  
  在本地將關鍵資料備份,然後送到異地儲存。災難發生後,按預定資料恢復程式恢復系統和資料。這種方案成本低、易於配置。但當資料量增大時,存在儲存介質難管理的問題,並且當災難發生時存在大量資料難以及時恢復的問題。為了解決此問題,災難發生時,先恢復關鍵資料,後恢復非關鍵資料。
  
  第2級:熱備份站點備份
  
  在異地建立一個熱備份點,通過網路進行資料備份。也就是通過網路以同步或非同步方式,把主站點的資料備份到備份站點,備份站點一般只備份資料,不承擔業務。當出現災難時,備份站點接替主站點的業務,從而維護業務執行的連續性。
  
  第3級:活動備援中心
  
  在相隔較遠的地方分別建立兩個資料中心,它們都處於工作狀態,並進行相互資料備份。當某個資料中心發生災難時,另一個數據中心接替其工作任務。這種級別的備份根據實際要求和投入資金的多少,又可分為兩種:①兩個資料中心之間只限於關鍵資料的相互備份;②兩個資料中心之間互為映象,即零資料丟失等。零資料丟失是目前要求最高的一種容災備份方式,它要求不管什麼災難發生,系統都能保證資料的安全。所以,它需要配置複雜的管理軟體和專用的硬體裝置,需要投資相對而言是最大的,但恢復速度也是最快的。
  
  容災備份的關鍵技術
  
  在建立容災備份系統時會涉及到多種技術,如:SAN或NAS技術、遠端映象技術、基於IP的SAN的互連技術、快照技術等。這裡重點介紹遠端映象、快照和互連技術。
  
  1. 遠端映象技術
  
  遠端映象技術是在主資料中心和備援中心之間的資料備份時用到。映象是在兩個或多個磁碟或磁碟子系統上產生同一個資料的映象檢視的資訊儲存過程,一個叫主映象系統,另一個叫從映象系統。按主從映象儲存系統所處的位置可分為本地映象和遠端映象。遠端映象又叫遠端複製,是容災備份的核心技術,同時也是保持遠端資料同步和實現災難恢復的基礎。遠端映象按請求映象的主機是否需要遠端映象站點的確認資訊,又可分為同步遠端映象和非同步遠端映象。
  
  同步遠端映象(同步複製技術)是指通過遠端映象軟體,將本地資料以完全同步的方式複製到異地,每一本地的I/O事務均需等待遠端複製的完成確認資訊,方予以釋放。同步映象使遠端拷貝總能與本地機要求複製的內容相匹配。當主站點出現故障時,使用者的應用程式切換到備份的替代站點後,被映象的遠端副本可以保證業務繼續執行而沒有資料的丟失。但它存在往返傳播造成延時較長的缺點,只限於在相對較近的距離上應用。
  
  非同步遠端映象(非同步複製技術)保證在更新遠端儲存檢視前完成向本地儲存系統的基本I/O操作,而由本地儲存系統提供給請求映象主機的I/O操作完成確認資訊。遠端的資料複製是以後臺同步的方式進行的,這使本地系統性能受到的影響很小,傳輸距離長(可達1000公里以上),對網路頻寬要求小。但是,許多遠端的從屬儲存子系統的寫沒有得到確認,當某種因素造成資料傳輸失敗,可能出現數據一致性問題。為了解決這個問題,目前大多采用延遲複製的技術(本地資料複製均在後臺日志區進行),即在確保本地資料完好無損後進行遠端資料更新。
  
  2.快照技術
  
  遠端映象技術往往同快照技術結合起來實現遠端備份,即通過映象把資料備份到遠端儲存系統中,再用快照技術把遠端儲存系統中的資訊備份到遠端的磁帶庫、光碟庫中。
  
  快照是通過軟體對要備份的磁碟子系統的資料快速掃描,建立一個要備份資料的快照邏輯單元號LUN和快照cache。在快速掃描時,把備份過程中即將要修改的資料塊同時快速拷貝到快照cache中。快照LUN是一組指標,它指向快照cache和磁碟子系統中不變的資料塊(在備份過程中)。在正常業務進行的同時,利用快照LUN實現對原資料的一個完全的備份。它可使使用者在正常業務不受影響的情況下(主要指容災備份系統),實時提取當前線上業務資料。其“備份視窗”接近於零,可大大增加系統業務的連續性,為實現系統真正的7×24運轉提供了保證。
  
  快照是通過記憶體作為緩衝區(快照cache),由快照軟體提供系統磁碟儲存的即時資料映像,它存在緩衝區排程的問題。
  
  3.互連技術
  
  早期的主資料中心和備援資料中心之間的資料備份,主要是基於SAN的遠端複製(映象),即通過光纖通道FC,把兩個SAN連線起來,進行遠端映象(複製)。當災難發生時,由備援資料中心替代主資料中心保證系統工作的連續性。這種遠端容災備份方式存在一些缺陷,如:實現成本高、裝置的互操作性差、跨越的地理距離短(10公里)等,這些因素阻礙了它的進一步推廣和應用。
  
  目前,出現了多種基於IP的SAN的遠端資料容災備份技術。它們是利用基於IP的SAN的互連協議,將主資料中心SAN中的資訊通過現有的TCP/IP網路,遠端複製到備援中心SAN中。當備援中心儲存的資料量過大時,可利用快照技術將其備份到磁帶庫或光碟庫中。這種基於IP的SAN的遠端容災備份,可以跨越LAN、MAN和WAN,成本低、可擴充套件性好,具有廣闊的發展前景。基於IP的互連協議包括:FCIP、iFCP、Infiniband、iSCSI等。
  
  【小知識】
  
  衡量容災備份的兩個技術指標
  
  RPO(Recovery Point Objective):即資料恢復點目標,主要指的是業務系統所能容忍的資料丟失量。
  
  RTO(Recovery Time Objective):即恢復時間目標,主要指的是所能容忍的業務停止服務的最長時間,也就是從災難發生到業務系統恢復服務功能所需要的最短時間週期。
  
  RPO針對的是資料丟失,而RTO針對的是服務丟失,二者沒有必然的關聯性。RTO和RPO的確定必須在進行風險分析和業務影響分析後根據不同的業務需求確定。對於不同企業的同一種業務,RTO和RPO的需求也會有所不同。