華為雲端計算IE面試筆記-請描述華為容災解決方案全景圖，並解釋雙活資料中心需要從哪些角度著手考慮雙活設計

容災全景圖：按照距離劃分：分為本地容災同城容災異地容災

本地容災包括本地高可用和本地主備。（本資料中心的兩機房、機櫃）

本地高可用這個方案為了保持業務的連續性，從兩個層面來考慮：

①一個是從主機、伺服器這個層面考慮，假如這個伺服器上的虛擬機器或者業務掛了，可以自動的從其他伺服器上把它拉活，以此來保證業務的連續性，主要是通過叢集HA、DRS、DPM的這些特性。

②另一個就是從儲存層面來考慮，使用的Hypermetro特性/ HyperMirror+SmartVirtualization（異構儲存，RTO、RPO>0）。推薦Hypermetro

Hypermetro特性基於兩套儲存陣列實現雙活，兩端陣列的雙活LUN資料實時同步，且雙端能夠同時處理應用伺服器的 I/O 讀寫請求，面向應用伺服器提供無差異的兩個站點並行訪問能力。當任何一臺磁碟陣列故障時，業務自動無縫切換到對端儲存訪問，業務訪問不中斷。

本地高可用的RTO=0、RPO=0。

本地主備容災使用的是同步遠端複製技術實現的。RPO=0、RTO>0

主備主要是儲存層的遠端複製。

同城容災包括同城主備容災和同城雙活容災。（同城的兩資料中心（300km內））

同城主備容災通過同步遠端複製技術和非同步遠端複製技術實現，這兩種技術在寫複製的時候不一樣。同步遠端複製是對端（災備端）寫IO完成返回寫成功，非同步遠端複製就是本端寫IO完成返回寫成功。主備容災這個技術很成熟，但是會停止業務，RTO>0，如果是同步遠端複製技術，RPO=0,如果是非同步遠端複製技術，RPO>0。

同城雙活容災這個技術通過華為的Hypermetro實現，一端業務故障時，另一端系統能夠自動拉起，但使用雙活的成本高，理論上RTO=0、RPO=0。

異地容災包括兩地三中心和主備容災。（兩資料中心距離大於300km）

兩地三中心是同城雙活或同城主備再與異地主備實現兩地三中心技術，使用的是並聯或級聯技術，適用於業務不允許中斷，對資料要求嚴格的場景，如金融機構等。RTO、RPO較靈活。

另外一種是異地主備容災的方式，跟同城容災的主備相比方式不一樣，主要是用非同步遠端複製實現的。RTO>0、RPO>0

雙活資料中心：

雙活要從全面的角度考慮的話，從安全層、傳輸層、業務（應用）層、網路層、計算叢集、儲存層來考慮

安全層通過防火牆、安全策略規劃和設計保證來訪問安全。

傳輸層通過裝置、鏈路和板卡冗餘，構建可靠的雙活傳輸網路。波分裝置提升光訊號傳輸距離。實現鏈路複用，將資料中心兩對鏈路，減少到一對鏈路。

業務（應用）層雙活通過負載均衡來實現，也就是GSLB和SLB實現的，通過應用叢集技術和資料庫叢集技術實現。C/S通過應用叢集自身特性（Oracle RAC 、IBM DB2），B/S通過LB實現業務負載。

網路層雙活資料中心間IP和FC網路互通。通過全域性負載均衡器（GSLB）、伺服器負載均衡器（SLB）實現雙活。如果外部有一個業務請求資訊過來，先到SLB，SLB會檢視自己所在的資料中心的主機是否可用，能否提供業務，如果發現主機故障，這時候會觸發GSLB，然後改GSLB會通知對端的GLSB開始工作，GSLB會通知下面的SLB工作，SLB會通知底下的主機對業務請求做出響應，然後返回響應給對端，完成雙活。

SLB\GSLB：

物件不一樣：

SLB：本資料中心內的流量負載，資料中心內的故障切換

GSLB：做到兩個資料中心間的流量的負載，保證使用者可以使用距離最近的伺服器，從而確保訪問質量。

原理不一樣：

SLB是通過代理的方式去選擇使用者選擇哪一臺Web伺服器。

GSLB採用DNS解析控制使用者訪問哪個資料中心

計算叢集雙活將兩個資料中心的伺服器新增至同一個大叢集。主要用的是HA\DRS

儲存層雙活一般是選用華為的儲存，用的是Hypermetro這個特性，實現了RTO、RPO=0，實現儲存雙活。在寫IO上，上層下發一個寫IO，首先兩端儲存會有一個寫互斥，先拿到寫許可權的一端，就先開始寫，寫完後，另一端也要寫完成後才會返回寫成功。讀的時候，用到了Ultra path特性，根據Ultra path特性選擇一條最優路徑，免閘道器的一個設計，不需要VIS，替代VIS去重新選擇一個最優路徑，減少裝置和開銷。而且開啟了Hypermetro也可以異構儲存，把這些儲存陣列製成了vDISK統一使用。

*兩地三中心有哪些架構？有什麼區別？

圖 1 同步+非同步（級聯組網）

圖 2 非同步+非同步（級聯組網）

圖 3 同步+非同步（並聯組網）

圖 4 非同步+非同步（並聯組網）

圖 5 多對一級聯組網

圖 6 雙活+遠端複製組網

*本地高可用與雙活資料中心的區別？（考到）

1.二者使用場景不同。本地高可用是同資料中心或者機房級的容災，雙活資料中心是異地進行的是區域級的容災；

2.本地高可用可以使用HyperMirror+SmartVirtualization 實現，雙活不可用；

3.多路徑：本地高可用使用HyperMetro時，多路徑軟體設定為負載均衡，而雙活配置本地站點優先；

4.雙活需要 GSLB、SLB、本地高可用不需要；

5.雙活需要考慮安全層、傳輸層等六個層次的雙活，而本地高可用可以不用考慮網路層、傳輸層和安全層雙活，需要考慮應用、計算、儲存三個層面的雙活（網路可以考慮，距離近不是重點）。

6. 成本：因為要考慮其他三層的物理裝置，雙活成本較高

7. 保護範圍：本地高可用是資料中心內；雙活範圍，兩個資料中心最遠可以達到300KM

*本地高可用和主備區別

1. 保護範圍：本地只能資料中心內，主備可以同城或異地

2. 儲存層實現：本地高可用使用HyperMetro 主備使用儲存裝置的遠端複製特性

3. RTO、RPO：本地高可用RTO和RPO理論上可以等於0 主備不一定

4. 工作方式：本地高可用同時提供業務，主備只有主提供業務

5. 負載均衡：主備無法實現負載均衡

*雙活和主備區別

1. 工作方式：雙活同時提供業務，主備只有主提供業務

2. 負載均衡：雙活實現負載均衡主備不可以

3. 資源利用率：主備只能達到50%；因為主工作時，備不工作

4. RTO和RPO：雙活可以理論上實現 RTO=0 RPO=0

5. 實現方式：儲存層，雙活是Hypermetro 主備是同/非同步遠端複製

6. 範圍：異地主備可以> 3000KM

7. 網路：雙活需要打通業務網路主備不需要打通

8. 業務切換：雙活可以實現災難發生時自動切換站點，主備需要管理員手動拉起

*同步遠端複製和非同步遠端複製的區別

同步遠端複製和非同步遠端複製都可用於儲存系統的容災方案，實現資料的遠端備份。兩者的實現方式不同，並且應用於不同的業務場景。

實現方式

• 同步遠端複製是對主LUN進行寫操作的同時，將I/O寫請求傳送到從LUN，當主LUN和從LUN都返回寫請求成功時，再返回主機I/O寫請求成功，從而實現主LUN資料和從LUN資料的緊密同步。

• 非同步遠端複製是對主LUN進行寫操作的同時，在主站點記錄本次寫操作所修改的資料，待主LUN返回寫請求成功後，就返回主機寫請求成功。再通過使用者手動觸發或根據使用者設定的觸發條件自動進行同步操作，保證主LUN和從LUN資料一致。

應用場景

• 由於同步遠端複製對頻寬和資料時延有極高的要求，因此同步遠端複製主要應用於主裝置和從裝置相距較近的容災場景，如同城容災備份。

• 非同步遠端複製對頻寬和資料時延的要求較低，因此非同步遠端複製適用於長距離或網路頻寬有限情況下的容災場景。

*雙活資料中心每一層都需要實現雙活嗎？

不需要每層都要實現雙活。雙活的定義是指兩資料中心同時可以對外提供業務。因此對業務而言可以通過主備的方式，也可以 AA 的部署方式。把主備放在不同側實現。

但是儲存層要雙活，因為要保障資料實時的同步，並且還要同時對外提供業務。

*同步複製原理

*非同步複製原理

*HyperMetro的工作原理

1. 主機下發寫I/O到雙活管理模組。

2. 系統記錄LOG。

3. 執行雙寫：雙活管理模組同時將該寫 I/O寫入本端Cache和遠端Cache。

4. 本端Cache和遠端Cache 向雙活管理模組返回寫 I/O 結果。

5. 雙寫結果處理：等待兩端Cache的寫處理結果都返回，才向主機返回寫I/O結果。

6. 判斷雙寫是否成功。

• 如果都寫成功：清除LOG。

• 如果有一端失敗：LOG轉換成DCL，記錄本端LUN和遠端LUN的差異資料。

*雲容災的服務（考到）

CSDR，生產儲存和容災儲存儲存複製。

CSHA，映象或雙活。

VHA 映象或雙活。

容災和備份有什麼差別? 備份和容災的區別

版本一：

1.備份是容災的基礎，一般意義上，容災指的是不在同一機房的資料或應用系統備份，備份指的是本地的資料或系統備份

2.備份保護的是業務的資料，容災保護的是整套業務系統(有配套的主機、儲存、網路裝置等)

3.備份軟體處理後的資料格式不一致(通常存放在會進行重刪壓縮、歸檔)，必須恢復後才可使用，而複製或映象軟體處理後的資料格式不發生變化，直接掛載給主機即可使用。

4.兩者的資料保護的週期不一致，複製或映象的時間週期更短。

5.一般備份為資料保護的最後一條防線，偏向于歸檔這個層面更多。

版本二：

1. 物件區別：備份針對資料，容災針對 IT 系統（業務）

2. 層次上：備份是容災的基礎

3. 距離不同：容災兩站點距離較備份站點遠

介紹下華為容災全景圖

<關鍵點：

理解思路應該為：

範圍：本地、同城300km內、異地300km外

需求：RPO、RTO值(這是衡量容災解決方案的兩個關鍵指標，應多從這兩點思考、對比)

上述解決方案並非全部，只是在相應的容災範圍推薦的方案>

容災解決方案的儲存層實現

<關鍵點：

PPT中，華為的容災解決方案，更多側重點自身產品的實現，故儲存層是重點，且儲存層是資料容災最常用的手段，是容災的基礎。

在此，RPO、RTO值也是隻考慮儲存層，整體解決方案的 RPO、RTO還需要考慮上層，如應用層、網路層、計算層等

儲存層特性的選擇，取決於容災的範圍，進行決定的 RPO、RTO值

因VIS已停產，所以在上述表格未提及，VIS可以實現非同步複製、雙活

兩地三中心容災解決方案，實際上是同城容災+異地容災的組合，具體 RPO、RTO值，需考慮災難級別，如資料中心級，那就考慮同城容災，如果是城市級，那就考慮異地容災

因異地容災距離比較大，通常已超過100km，甚至是 200km，所以只能採用非同步遠端複製，並多采用廣域網連結

儲存特性對距離的要求

Hypermetro僅支援100km 內的容災，25km以外需採用波分裝置減少光衰減及鏈路複用降低成本

同步遠端複製僅支援200km 內的容災

非同步遠端複製無距離要求，可根據距離配置合適同步週期

RPO、RTO

RPO 標誌系統能夠容忍的最大資料丟失量。系統容忍丟失的資料量越小，RPO 的值越小  RTO 標誌系統能夠容忍的服務停止的最長時間。系統服務的緊迫性要求越高，RTO 的值越小

RPO、RTO是容災的兩個關鍵指標

RPO（Recovery Point Objective）：即資料恢復點目標，以時間為單位，即在災難發生時，系統和資料必須恢復到的時間點要求。RPO標誌系統能夠容忍的最大資料丟失量。系統容忍丟失的資料量越小，RPO 的值越小。

RTO（Recovery Time Objective）：即恢復時間目標，以時間為單位，即在災難發生後，資訊系統或業務功能從停止到必須恢復的時間要求。RTO 標誌系統能夠容忍的服務停止的最長時間。系統服務的緊迫性要求越高，RTO的值越小。

RPO針對的是資料丟失，而RTO針對的是服務丟失，RTO和RPO的確定必須在進行風險分析和業務影響分析後根據不同的業務需求確定。

<補充： RPO、RTO的單位都是時間 >

兩地三中心有什麼好處？

相對同城容災，它可以應對區域級的災難，具備更高的容災能力；

相對異地容災，在生產站點故障情況下，具備更小的 RPO或RTO。

什麼是雙活資料中心？

雙活資料中心解決方案是指兩個資料中心同時處於執行狀態，同時承擔業務，提高資料中心的整體服務能力和系統資源利用率。兩個資料中心的資料實時保持一致，當單裝置故障甚至一個數據中心故障時，業務自動切換，資料零丟失，業務零中斷。

<關鍵點：

雙活資料中心具備如下特點：

屬於同城容災方案

兩資料中心同時對外提供業務

互為容災、自動切換

資料零丟失、部分業務零中斷（業務不中斷不是必要標準）

如何實現六層雙活資料中心

雙活資料中心的儲存層一定要採用HyperMetro？

如果儲存層採用華為V3儲存裝置的話，那麼一定要採用HyperMetro。HyperMetro 能讓儲存層實現雙活，利用該特性可以配合應用層或計算層的自動切換的特點，保障資料的可用性及路徑最優。

<引伸：

HyperMetro提供的儲存雙活特點，才是關鍵。如果儲存層採用別用產品或方式能夠實現雙活或類雙活的目的，也是可以的。

本地高可用的組網和具體原理（雙活 HyperMetor）

包括本地雙活和本地映象本地。

雙活原理：

本地映象：

本地高可用組網圖

<補充：

上圖只考慮儲存層組網，採用交叉組網

SmartVirtualization+Hypermirror 組網相同

除了儲存層需要陣列特性配合外，主機層、應用層需要做叢集。

主備容災的組網和具體原理（VRG 主備）

這裡只介紹儲存側的組網，主機側的請看 FusionSphere 場景容災實現方式

注意：主備容災計算層是兩個 VRM

主備容災組網圖

<注意點：

儲存層網路裝置直接相連

儲存層需要打通，業務網路不需要打通

FusionSphere主備容災儲存複製容災的組網

<補充：

圖一組網圖並不嚴謹，未實現兩BCManager通訊。可以單獨網路，可以通過打通兩管理平面實現。

儲存裝置需要接入管理網路，被BCManager接管

兩站點儲存裝置通過兩站點的儲存層網路裝置鏈路實現資料容災

儲存複製容災實現的本地高可用、雙活、兩地三中心，與通用容災組網類似

FusionSphere主備容災主機複製容災的組網

<關鍵點：

圖一組網圖並不嚴謹，未實現兩BCManager通訊。可以單獨網路，可以通過打通兩管理平面實現。

儲存平面無需打通

BCManager無需管理儲存裝置

建議給CNA節點單獨配置容災業管管理介面，讓其與 VRG通訊，不配置則走CNA管理介面

VRG與VRG之間通訊需要配置主機 IO複製平面

VRG需要被 BCManager 接管

HypereReplication的工作原理

同步遠端複製和非同步遠端複製

<附加：

同步遠端複製主從端並不打快照，非同步遠端複製主從端打快照。源端快照目的是定格資料，保障資料一致性，從端快照目的是假設非同步失敗，可回滾到開始前的狀態。

雙活資料中心組網和具體原理

注意：雙活容災是一個 VRM

<關鍵點：

儲存層網路裝置直接相連，或通過波分裝置相連

業務網路核心交換機直接相連，或通過波分裝置相連

儲存層需要打通，業務網路也需要打通

採用波分裝置原因為：減少光衰減及減少DCI 鏈路成本（由4對裸光纖降至2對）

雙活資料中心，除了儲存層需要陣列特性配合外，主機層、應用層需要做叢集。

六層雙活：儲存層、主機層、應用層、網路層、安全層、傳輸層

兩地三中心組網和具體原理。有什麼區別？

FusionSphere 場景容災實現方式

主機層組網

背景：使用 FusionStorage 或者非華為儲存作為儲存資源時，不能使用儲存遠端複製與 BCManager 結合實現容災，所以將儲存複製功能上移，讓 FusionSphere 來實現主從資料中心的資料複製，此時 Fusionsphere 中需要部署 VRG（本質上是一個虛擬機器，作用是充當虛擬化遠端複製閘道器，從而實現主機層遠端複製），從端同樣需要部署 VRG，作為資料複製的接收者。

原理：在使用主機複製容災時，一般在兩地分別建立生產站點和災備站點。利用 FusionCompute 虛擬化平臺的 IO 分流技術，實現捕獲生產端虛擬機器的實時 IO 資料並非同步複製到災備端虛擬機器卷中。

在生產站點和災備站點分別部署 VRG，主機中的 IOmirror 負責捕獲虛擬機器 IO，生產端VRG聚合虛擬機器的IO資料傳送至災備端VRG，由災備端的VRG分發到指定主機的 WriteAgent上，由WriteAgent寫入虛擬機器的卷中，完成虛擬機器IO的遠端非同步複製。

 陣列層容災：

1、利用底層 SAN 儲存的遠端複製特性，實現容災虛擬機器的資料複製和保護。可支援同步遠端複製和非同步遠端複製。

2、利用底層 SAN 儲存的 Hypermetro 雙活特性，實現容災虛擬機器的資料一致性保護。

說華為有哪些容災產品

1、RD：資料庫應用容災

2、UltraVR：虛擬化容災

3、BCManager：資料庫，虛擬化應用等容災場景進行整合

4、BCManager eReplication：針對 OpenStack 雲 DC 容災

考試追問：

應用層資料庫應用是怎麼實現雙活的？

資料庫軟體自己的技術比如oracle RAC、IBM DB2

同步遠端複製和雙活有什麼區別？

同步遠端複製技術是主備容災使用的，它是寫複製時，對端也寫IO成功才返回寫成功。雙活是通過hypermetro特性實現的雙活資料中心，當一端故障時，業務自動切換到對端，業務訪問不中斷。

RTO RPO

實現方式

成本

儲存層實現方式

多路徑軟體設定

業務切換方式

業務網路是否打通

資源利用率

工作方式

雙活資料中心一定是RTO和RPO等於零嗎？

不一定，理論等於0 是否真的等於0要看實際

使用smartvirtualization一定是異構儲存嗎？

對，SmartVirtualization將不同型號的華為儲存或異構儲存元資料對映到本端儲存中。

雙活主機層能不能雙活？

這裡我沒答好說能，跟考官糾結了一會兒，他說不能的。兩站點ha，pro會大於零的

主機層比如fusionSphere的HA DRS DPM叢集技術實現主機層高可用，但HA是虛擬機發生故障時才會HA，所以業務已經中斷RTO>0,所以RTO RPO是不是一定等於0，要看實際。

主機層形成叢集怎麼配置實現？

兩端站點加入一個叢集，前提兩端站點網路互通才能加入到一個叢集

雙活資料中心的計算層如何實現？在你提到的fusionsphere大叢集技術具體是怎麼實現的？本地叢集和跨叢集有什麼區別？

將兩個資料中心的伺服器新增至同一個大叢集。主要用的是HA\DRS。（不知道這樣答對不對。後面兩個問題我不知道）

雙活資料中心的網路層如何實現的？

（這點考官在點評的時候說想聽的是通過VxLAN大二層技術實現）

資料中心間IP和FC網路互通。SLB本地負載均衡器負責資料中心內的請求負載，GSLB負載資料中心間的請求負載。

華為雲端計算IE面試筆記-請描述華為容災解決方案全景圖，並解釋雙活資料中心需要從哪些角度著手考慮雙活設計