1. 程式人生 > >叢集容災解決方案之Rose HA

叢集容災解決方案之Rose HA

Rose是美國ROSE Datasystem公司研發的高可用性系列軟體,Rose HA也稱為基於共享儲存的雙機高可用解決方案。

Rose HA高可用性系統解決方案以低成本且簡便的方式,實現了兩個節點的Cluster環境.客戶只需要在原有的單機系統上增加一臺伺服器、一個共享儲存裝置,通過Rose基於共享儲存的高可用解決方案即可實現關鍵業務的7X24小時連續執行,對於需要更有效應用現有伺服器資源的使用者而言,是最為適用的解決方案。

一、Rose HA的工作原理:
RoseHA雙機系統的兩臺伺服器(主機)都與磁碟陣列(共享儲存)系統直接連線,使用者的作業系統、應用軟體和RoseHA高可用軟體分別安裝在兩臺主機上,資料庫等共享資料存放在儲存系統上,兩臺主機之間通過私用心跳網路連線。配置好的系統主機開始工作後,RoseHA軟體開始監控系統,通過私用網路傳遞的心跳資訊,每臺主機上的RoseHA軟體都可監控另一臺主機的狀態。當工作主機發生故障時,心跳資訊就會產生變化,這種變化可以通過私用網路被RoseHA軟體捕捉。當捕捉到這種變化後RoseHA就會控制系統進行主機切換,即備份機啟動和工作主機一樣的應用程式接管工作主機的工作(包括提供TCP/IP網路服務、儲存系統的存取等服務)並進行報警,提示管理人員對故障主機進行維修。當維修完畢後,可以根據RoseHA的設定自動或手動再切換回來,也可以不切換,此時維修好的主機就作為備份機,雙機系統繼續工作。

RoseHA實現容錯功能的關鍵在於,對客戶端來說主機是透明的,當系統發生錯誤而進行切換時,即主機的切換在客戶端看來沒有變化,所有基於主機的應用都仍然正常執行。RoseHA採用了虛擬IP地址對映技術來實現此功能。客戶端通過虛擬地址和工作主機通訊,無論系統是否發生切換,虛擬地址始終指向工作主機。在進行網路服務時,RoseHA提供一個邏輯的虛擬地址,任何一個客戶端需要請求服務時只需要使用這個虛擬地址。正常執行時,虛擬地址及網路服務由主伺服器提供。當主伺服器出現故障時,RoseHA會將虛擬地址轉移到另外一臺伺服器的網絡卡上,繼續提供網路服務。切換完成後,在客戶端看來系統並沒有出現故障,網路服務仍然可以使用。除IP地址外,HA還可以提供虛擬的計算機別名供客戶端訪問。對於資料庫服務,當有主伺服器出現故障時,另外一臺伺服器就會自動接管,同時啟動資料庫和應用程式,使使用者資料庫可以正常操作。

二、RoseHA主要功能特點:
1. 友好的介面
RoseHA 提供了友好直觀的圖形安裝介面和監控管理介面。通過直觀而又方便的Java Applet管理介面,使用者可以互動式地對集群系統進行配置、監控和管理,並可以利用Applet的網路特性,通過網路對系統進行遠端管理,實時地顯示出主機系統及服務的狀態。

2. 靈活的Active-Active模式和Active-Standby模式
RoseHA支援Active-Active模式和Active-Standby模式。使用者可指定每臺伺服器的作用(active or standby),指定要監控的服務和硬體部分,定義指定的服務發生故障後要採取的進一步行動(如是否重新啟動該服務、允許的最大啟動時間等)。

3. 支援多條心跳路徑
可以將網線和RS-232串列埠線作為RoseHA軟體的心跳路徑。配置多條心跳路徑可以避免系統的單點故障。

4. 支援虛擬MAC地址
在網路環境中,每個IP與唯一的MAC繫結在一起。而傳統的叢集結構下,將致使叢集的活動IP在不同時刻繫結不同的MAC地址,導致跨網段通訊出現問題。為了使叢集軟體更好的支援這種網路安全級別較高的網路環境,RoseHA提供了支援虛擬MAC地址的功能,使叢集環境IP地址實現與唯一MAC地址繫結。

5. 自動切換
當系統出現故障時(如:系統宕機、HA程序/應用程序被殺掉、RS-232、SCSI、光纖、網路線纜斷開),RoseHA 將確定故障原因,並採取相應對策,並將這些應用切換到備份伺服器上。而故障伺服器中未受影響的應用不會被切換,即不會受任何影響。不需要系統管理員干預。

6. 自動檢測
在集群系統的每一臺伺服器內,RoseHA具有兩個核心程序,它們互相監控,如果其中一個程序失敗,另一個程序會立即進行恢復,避免了RoseHA自身服務的單點故障。

7. 伺服器可靠性
在主伺服器出現故障(如掉電或宕機)時,另外一臺伺服器接管故障伺服器上執行的所有的關鍵性應用。

8. 網路可靠性
如果伺服器的網路部分發生故障,會導致客戶不能連線和訪問到伺服器,這同樣是致命的故障。如果該伺服器配備了冗餘的網路介面,RoseHA會使用它來恢復網路連線。在沒有配備冗餘的網路介面,或者所有的網路介面均出現故障時,HA會將該應用切換到另外一臺伺服器上。切換完成後,客戶在短暫的切換過程後能夠繼續訪問所需的服務。

9. 儲存可靠性
需要將應用的全部資料儲存在兩臺伺服器都能訪問到的共享磁碟中。建議使用磁碟陣列來儲存資料,這樣可以避免單點故障,而且便於對系統的容量進行擴充。對由Volume Manager軟體管理的磁碟陣列,RoseHA提供了相應的處理程式,以保證磁碟陣列及資料的可靠性。

10. 應用可靠性
在高可用性系統中可以執行多個應用。每一個應用是作為一個服務而存在的。在伺服器中,當某個服務失敗而其它服務正常執行時,RoseHA將處理這個失敗的服務。在將這個服務切換到另一臺伺服器上時,該伺服器上執行的服務也不會受到影響。對於與網路不相關的純資料應用,只需要切換資料儲存和資料處理軟體。而對於與網路相關的客戶機/伺服器應用,除了要切換資料儲存和資料處理軟體外,還需要切換相關的虛擬IP。如果希望兩個服務獨立地進行切換,則此兩個虛擬IP地址不能相同。如果使用了相同的IP地址,在發生切換時,RoseHA會將所有使用該IP的服務都切換到另外一臺伺服器上去。

11. 豐富的附加功能
提供不同的針對特定應用的Agent程式,使服務監控更切實際,更加有效;提供用於開發Agent程式的應用程式介面(API),使用者可針對特定的服務編寫Agent程式,執行與特定服務相關的狀態診斷及錯誤恢復工作。

三、Rose HA所支援的軟體規格:

分類 具體列表
作業系統 Windows Windows NT4.0 Server Sp6a
Windows Server 2000 各發行版本
Windows Server 2003 各發行版本
Windows Server 2008 各發行版本
Linux RedHat Enterprise Linux 2.1/3/4/5/6
SUSE Linux Enterprise Server 8/9/10/11
Asianux 1/2/3
Red Flag Linux 4.0/5.0
SCO SCO OpenServer 5.0.x/UnixWare 7.x.x
Solaris Sun Sparc Solaris 2.5.1/2.6/7/8/9/10
Sun x86 Solaris 10
支援的應用 資料庫:Oracle、MSSQL、Sybase、DB2、Mysql、Informix等
郵件伺服器:Exchange、Sendmail、Postfix、Domino等
Web伺服器:IIS、Tomcat、Apache等
檔案伺服器:Samba、FTP、NFS等
中介軟體應用:WebLogic、WebSphere等
使用者自定義應用:提供二次開發API介面
儲存支援 SCSI/IPSAN/FCSAN/SAS等