企業如何制定正確的災難恢復流程
但是,IT災難不僅限於網路攻擊,硬體故障、人為錯誤、停電以及颶風或地震等自然災害也有可能破壞企業的業務流程,並將有價值的資料置於風險之中。
這凸顯了企業需要採取措施確保最小化停機時間的重要性,不過好在很多企業正在為此做出積極的響應。根據Spiceworks公司最近的一項研究,95%的組織都制定了災難恢復計劃,其中90%的計劃包括災難恢復(DR)計劃中的資料完整性和備份。
其他領域包括維護網路和網際網路連線(62%),電源/電力連續性(57%)和本地伺服器/應用程式正常執行時間(57%)。但是隻有28%的企業表示,在其災難恢復計劃中包含雲端計算或託管服務,考慮到現在有大量的企業依賴基於雲端計算的平臺,這一點令人驚訝。
這表明,災難恢復並沒有一個萬能的解決方法,企業需要投資滿足其獨特需求,並確保選擇最適合其特定需求的災難恢復解決方案。
尋找合適的人選
企業需要回答的第一個問題是“災難恢復解決方案如何適合現有的基礎設施?”。一般來說,大多數探索和採用災難恢復解決方案的企業屬於三個部門之一:擁有物理資料中心,並希望其災難恢復服務基於資料中心基礎設施的組織;擁有物理資料中心,但希望其災難恢復解決方案基於雲平臺中的組織;以及希望其資料中心基礎設施和災難恢復解決方案都是基於雲端計算的組織。
對於將資料儲存在物理資料中心,並希望災難恢復位於資料中心基礎設施上的組織來說,它們通常需要單獨的副本環境,以便能夠提供全部或部分客戶的服務。這可能是一種成本高昂的方法,因為企業必須考慮與維護設施、支付電力和購買額外硬體相關的成本。
而擁有物理資料中心但希望其災難恢復解決方案位於雲平臺中的組織,以及希望其資料中心基礎架構和災難恢復解決方案基於雲端計算的組織,都依賴雲端計算提供商的資料中心作為恢復站點。
雖然每種方法各有利弊,但基於雲端計算的系統被證明是最具成本效益和最有效的方法,可以最大限度地減少災難事件的影響。但是如前所述,最有效的災難恢復計劃是滿足業務特定需求的計劃。
可以理解,在這三種環境中實施災難恢復所需的流程和解決方案(內部部署、混合部署或雲端計算)各不相同。企業可以根據需求制定計劃,同時考慮到需要保護的不同基礎設施的性質以及停機對業務的影響。
那麼,在制定災難恢復計劃時,企業需要記住什麼?將如何選擇確保正確的解決方案?
規劃災難恢復
對於任何災難恢復策略,第一步是將業務應用程式與服務級別目標相匹配,其中有兩個特定的衡量引數:恢復點目標(RPO)和恢復時間目標(RTO)。
恢復點目標(RPO)表示發生災難時業務流程的資料丟失容限(即資料丟失量超出業務需求可接受的數量),而恢復時間目標(RTO)表示在中斷後恢復業務服務所需的時間。不同的應用程式將根據其重要性和業務型別而有不同的要求。例如,eBay公司或亞馬遜公司等主要線上零售商將要求其核心電子商務系統具有較低的恢復點目標(RPO)和恢復時間目標(RTO),而規模較小的企業中的一些應用程式能夠在24小時內離線。
通過對映其環境並分析特定應用程式的風險和要求,企業可以確定最有效地滿足恢復點目標(RPO)和恢復時間目標(RTO)引數的災難恢復解決方案。他們可能會意識到,內部部署方法最符合其未來目標,或者將所有內容移至雲端是滿足客戶需求的最佳方式。
企業可能還必須考慮內部可用的技術技能水平。 雖然這對於擁有大型IT團隊的大規模組織來說並不是什麼問題,但是那些根本無法獲得所需技能的小規模組織來說,可能不得不選擇託管的基於雲端計算的災難恢復服務。
最後,重要的是要記住,不同的需求需要不同的方法實施正確的災難恢復解決方案滿足特定需求,因此企業必須分析其基礎設施型別,並將這些需求考慮在內。
在這個持續可用性預期的時代,很多企業根本無法承受停機的損失,當然必須投資於防止災難發生的解決方案,但當這些解決方案無法阻止災難發生時,企業必須準備好立即做出反應,否則將會面臨客戶投訴的風險。