ROSE HA是美國(guó)ROSE Datasystem 公司出品的新一代高可用性軟件,它可以將UNIX服務(wù)器和Windows 服務(wù)器組成集群系統(tǒng),并對(duì)服務(wù)器進(jìn)行監(jiān)控、故障檢測(cè)、故障恢復(fù),保護(hù)運(yùn)行服務(wù)器中的關(guān)鍵性數(shù)據(jù)服務(wù)和網(wǎng)絡(luò)服務(wù)。對(duì)于在客戶機(jī)/服務(wù)器環(huán)境中的網(wǎng)絡(luò)及數(shù)據(jù)庫(kù)中集成的高可用需求,ROSE HA提供了非常靈活而且適用的解決方案。
① RoseHA
主要功能特點(diǎn)
l 友好的界面
RoseHA提供了友好直觀的圖形安裝界面和監(jiān)控管理界面。通過(guò)直觀而又方便的Java Applet 管理界面,用戶可以交互式地對(duì)集群系統(tǒng)進(jìn)行配置、監(jiān)控和管理,并可以利用Applet 的網(wǎng)絡(luò)特性,通過(guò)網(wǎng)絡(luò)對(duì)系統(tǒng)進(jìn)行遠(yuǎn)程管理,實(shí)時(shí)地顯示出主機(jī)系統(tǒng)及服務(wù)的狀態(tài)
l 靈活的Active-Active 模式和Active-Standby 模式
RoseHA 支持Active-Active 模式和Active-Standby 模式。用戶可指定每臺(tái)服務(wù)器的作用(active or standby),指定要監(jiān)控的服務(wù)和硬件部分,定義指定的服務(wù)發(fā)生故障后要采取的進(jìn)一步行動(dòng)(如是否重新啟動(dòng)該服務(wù)、允許的最大啟動(dòng)時(shí)間等)。
l 支持多條心跳路徑
可以將網(wǎng)線和RS-232 串口線作為在RoseHA 軟件的心跳路徑。配置多條心跳路徑可以避免系統(tǒng)的單點(diǎn)故障。
l 自動(dòng)切換
當(dāng)系統(tǒng)出現(xiàn)故障時(shí)(如:系統(tǒng)宕機(jī)、HA 進(jìn)程/應(yīng)用進(jìn)程被殺掉、RS-232、SCSI、光纖、網(wǎng)絡(luò)線纜斷開),RoseHA將確定故障原因,并采取相應(yīng)對(duì)策,并將這些應(yīng)用切換到備份服務(wù)器上。而故障服務(wù)器中未受影響的應(yīng)用不會(huì)被切換,既不會(huì)受任何影響。不需要系統(tǒng)管理員干預(yù)。
l 自動(dòng)檢測(cè)
在集群系統(tǒng)的每一臺(tái)服務(wù)器內(nèi),RoseHA 具有兩個(gè)核心進(jìn)程,它們互相監(jiān)控,如果其中一個(gè)進(jìn)程失敗,另一個(gè)進(jìn)程會(huì)立即進(jìn)行恢復(fù)。
l 服務(wù)器可靠性
在主服務(wù)器出現(xiàn)故障(如掉電或宕機(jī))時(shí),另外一臺(tái)服務(wù)器接管故障服務(wù)器上運(yùn)行的所有的關(guān)鍵性應(yīng)用。
l 網(wǎng)絡(luò)可靠性
如果服務(wù)器的網(wǎng)絡(luò)部分發(fā)生故障,會(huì)導(dǎo)致客戶不能連接和訪問(wèn)到服務(wù)器,這同樣是致命的故障。如果該服務(wù)器配備了冗余的網(wǎng)絡(luò)接口,RoseHA 會(huì)使用它來(lái)恢復(fù)網(wǎng)絡(luò)連接。在沒(méi)有配備冗余的網(wǎng)絡(luò)接口,或者所有的網(wǎng)絡(luò)接口均出現(xiàn)故障時(shí),HA 會(huì)將該應(yīng)用切換到另外一臺(tái)服務(wù)器上。切換完成后,客戶在短暫的切換過(guò)程后能夠繼續(xù)訪問(wèn)所需的服務(wù)。
l 存儲(chǔ)可靠性
需要將應(yīng)用的全部數(shù)據(jù)存儲(chǔ)在兩臺(tái)服務(wù)器都能訪問(wèn)到的共享磁盤中。建議使用磁盤陣列來(lái)存儲(chǔ)數(shù)據(jù),這樣可以避免單點(diǎn)固障,而且便于對(duì)系統(tǒng)的容量進(jìn)行擴(kuò)充。對(duì)由Volume Manager軟件管理的磁盤陣列,RoseHA 提供了相應(yīng)的處理程序,以保證磁盤陣列及數(shù)據(jù)的可靠性。
l 應(yīng)用可靠性
在高可用性系統(tǒng)中可以運(yùn)行多個(gè)應(yīng)用。每一個(gè)應(yīng)用是作為一個(gè)服務(wù)而存在的。在服務(wù)器中,當(dāng)某個(gè)服務(wù)失敗而其它服務(wù)正常運(yùn)行時(shí),RoseHA 將處理這個(gè)失敗的服務(wù)。在將這個(gè)服務(wù)切換到另一臺(tái)服務(wù)器上時(shí),該服務(wù)器上運(yùn)行的服務(wù)也不會(huì)受到影響。對(duì)于與網(wǎng)絡(luò)不相關(guān)的純數(shù)據(jù)應(yīng)用,只需要切換數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)處理軟件。而在與網(wǎng)絡(luò)相關(guān)的客戶機(jī)/服務(wù)器應(yīng)用,除了要切換數(shù)據(jù)存儲(chǔ)和數(shù)據(jù)處理軟件外,還需要切換相關(guān)的虛擬IP。如果希望兩個(gè)服務(wù)獨(dú)立地進(jìn)行切換,則此兩個(gè)IP 地址不能相同。如果使用了相同的IP 地址,在發(fā)生切換時(shí),RoseHA 會(huì)將所有使用該IP 的服務(wù)都切換到另外一臺(tái)服務(wù)器上去。
l 豐富的附加功能
提供不同的針對(duì)特定應(yīng)用的Agent 程序,使服務(wù)監(jiān)控更切實(shí)際,更加有效;提供用于開發(fā)Agent 程序的
應(yīng)用程序界面(API ),使用者可針對(duì)特定的服務(wù)編寫Agent 程序,執(zhí)行與特定服務(wù)相關(guān)的狀態(tài)診斷及錯(cuò)誤
恢復(fù)工作的。