欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于云計算的高可用系統(tǒng)及其實現(xiàn)方法

文檔序號:7552888閱讀:203來源:國知局
專利名稱:一種基于云計算的高可用系統(tǒng)及其實現(xiàn)方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種基于云計算的高可用系統(tǒng)及其實現(xiàn)方法。
背景技術(shù)
高可用性(High Availability, HA)是指通過盡量縮短因日常維護操作(計劃)和突發(fā)的系統(tǒng)崩潰(非計劃)所導(dǎo)致的停機時間,以提高系統(tǒng)和應(yīng)用的可用性。HA系統(tǒng)是目前企業(yè)防止核心計算機系統(tǒng)因故障停機的最有效手段。隨著企業(yè)信息應(yīng)用的不斷發(fā)展,數(shù)據(jù)在企業(yè)的應(yīng)用越來越廣,如何提高信息應(yīng)用的高可用性成為建設(shè)穩(wěn)健的計算機系統(tǒng)的首要任務(wù)之一。信息應(yīng)用通常采用雙機熱備技術(shù)提高系統(tǒng)的高可用性。雙機熱備特指基于高可用系統(tǒng)中的兩臺服務(wù)器的熱備(或高可用)。雙機熱備用來解決一種不可避免的計劃或非計劃系統(tǒng)宕機問題的系統(tǒng)(軟件或硬件),對任何導(dǎo)致系統(tǒng)宕機和服務(wù)中斷的故障,都會觸發(fā)相應(yīng)的流程進行錯誤判定、故障隔離,并聯(lián)機恢復(fù)以執(zhí)行被中斷的服務(wù)。按工作中的切換方式,雙機高可用可分為:主/備方式(Active-Standby方式)和雙主機方式(Active-Active方式)。其中,主/備方式即指的是一臺服務(wù)器處于某種業(yè)務(wù)的激活狀態(tài)(即Active狀態(tài)),另一臺服務(wù)器處于該業(yè)務(wù)的備用狀態(tài)(即Standby狀態(tài));而雙主機方式即指兩種不同業(yè)務(wù)分別在兩臺服務(wù)器上互為主備狀態(tài)(即Active-Standby和Standby-Active 狀態(tài))。目前組成雙機熱備的方案主要有三種方式:基于共享存儲(磁盤陣列)的方式、全冗余(雙機雙存儲)的方式和基于數(shù)據(jù)復(fù)制的方式?;诠蚕泶鎯?磁盤陣列)的方式是最常使用的方式,主要通過磁盤陣列提供切換后對數(shù)據(jù)完整性和連續(xù)性的保障。用戶數(shù)據(jù)一般會放在磁盤陣列上,當(dāng)主機宕機后,備機繼續(xù)從磁盤陣列上取得原有數(shù)據(jù)。傳統(tǒng)的基于單臺存儲的雙機熱備方式由一臺服務(wù)器主機、一臺服務(wù)器備機和一個磁盤陣列組成,這種方式因為使用一臺存儲設(shè)備,往往被業(yè)內(nèi)人士稱為磁盤單點故障。但一般來講存儲的安全性較高。所以如果忽略存儲設(shè)備故障的情況下,這種方式也是業(yè)內(nèi)采用最多的熱備方式?;趩闻_存儲的傳統(tǒng)雙機熱備方式確實存在單點故障的情況,為實現(xiàn)存儲冗余,存儲高可用化也已經(jīng)越來越多的被用戶接受??梢赃@樣理解,雙機熱備最早是為解決服務(wù)器的計劃性停機與非計劃性宕機的解決方案,但是無法實現(xiàn)存儲設(shè)備的計劃性停機與非計劃性宕機帶來的服務(wù)器停機,而存儲設(shè)備作為雙機熱備中唯一存儲數(shù)據(jù)的設(shè)備,它一旦發(fā)生故障往往會造成雙機熱備系統(tǒng)全面崩潰?;陔p存儲設(shè)備的高可用雙機熱備方案,消除了由于單臺存儲設(shè)備停機帶來的單點故障,進入了沒有單點故障的全冗余雙機熱備方式。全冗余雙機熱備方式由兩臺存儲設(shè)備、一臺服務(wù)器主機和一臺服務(wù)器備機組成,其優(yōu)勢在于:(1)存儲設(shè)備之間的數(shù)據(jù)復(fù)制不經(jīng)過網(wǎng)絡(luò),二是由存儲設(shè)備之間進行復(fù)制;
(2)兩個存儲設(shè)備之間的復(fù)制是完全實時的,不存在任何時間延時;(3)主備存儲之間的切換時間小于500ms,以確保系統(tǒng)存儲時不產(chǎn)生延時;(4)硬盤盤符及分區(qū)不因為主備存儲之間的切換而改變;(5)服務(wù)器的切換,不影響存儲之間的初始化,增量同步及數(shù)據(jù)復(fù)制;(6)某一存儲設(shè)備的計劃性停機,不影響整個服務(wù)器雙機熱備系統(tǒng)的工作;(7)存儲設(shè)備之間使用重復(fù)數(shù)據(jù)刪除技術(shù),完成增量同步工作;(8)真正的7X24小時或切換的全冗余方案。但是這種全冗余雙機熱備方式成本高,管理復(fù)雜,不適合小規(guī)模的信息應(yīng)用?;跀?shù)據(jù)復(fù)制的方式主要利用數(shù)據(jù)的同步方式,保證主備服務(wù)器的數(shù)據(jù)一致性。分布式復(fù)制塊設(shè)備(Distributed Replicated Block Device, DRBD)是一個開源的數(shù)據(jù)集群方案,它能夠提供一種動態(tài)的主機之間的數(shù)據(jù)同步。DRBD負責(zé)接收數(shù)據(jù),把數(shù)據(jù)寫到本地磁盤,然后發(fā)送給另一個主機。另一個主機再將數(shù)據(jù)存到自己的磁盤中。其他所需的組件有集群成員服務(wù),如TurboHA或心跳連接,以及一些能在塊設(shè)備上運行的應(yīng)用程序。例如:裸I/O、文件系統(tǒng)及fsck、具有恢復(fù)能力的數(shù)據(jù)庫等。上述三種方式的雙機熱備技術(shù),都至少需要2臺物理服務(wù)器,通過冗余的方式實現(xiàn)信息系統(tǒng)的高可用。更多的時候,這些冗余的設(shè)備處于備用狀態(tài)。隨著企業(yè)中信息系統(tǒng)數(shù)量的增加,為了保證系統(tǒng)的高可用,勢必會帶來大量冗余設(shè)備。這種情況對于中小企業(yè)來說,必然帶來建設(shè)和維護成本的增加。

發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種保證企業(yè)信息應(yīng)用高可用性的同時減少企業(yè)成本的一種基于云計算的高可用系統(tǒng)及其實現(xiàn)方法。本發(fā)明的目的是通過以下技術(shù)方案來實現(xiàn)的:一種基于云計算的高可用系統(tǒng),它包括一個中央控制管理服務(wù)子系統(tǒng)和至少一個自主控制Agent子系統(tǒng),中央控制管理服務(wù)子系統(tǒng)與自主控制Agent子系統(tǒng)之間通過協(xié)議互連,所述的中央控制管理服務(wù)子系統(tǒng)包括核心服務(wù)層、資源管理層、任務(wù)管理層、智能調(diào)度層、監(jiān)控告警層和鏡像管理層,所述的自主控制Agent子系統(tǒng)包括核心框架層、主機狀態(tài)采集層、狀態(tài)采集層、事件管理層、進程監(jiān)控層和Joblet運行環(huán)境層;
所述的核心服務(wù)層提供系統(tǒng)運行的基礎(chǔ)框架,至少包括安全管理、事件管理和日志管理,并負責(zé)建立與自主控制Agent子系統(tǒng)的通信,監(jiān)聽、采集所有受管服務(wù)器發(fā)來的信息,負責(zé)建立同底層LDAP目錄服務(wù)和數(shù)據(jù)庫服務(wù)器的通信管理,負責(zé)與其他采用RESTful方式進行通信的系統(tǒng)的通信管理;
所述的資源管理層用于對本系統(tǒng)中的所有物理機和虛擬機的資源情況、資源使用情況、運行狀態(tài)信息進行統(tǒng)一管理;
所述的任務(wù)管理層用于修改、創(chuàng)建任務(wù),以及任務(wù)調(diào)度和對運行情況進行監(jiān)控,以保證虛擬機在需要的時候完成啟動、停止和遷移的操作;
所述的智能調(diào)度層用于對本系統(tǒng)中的物理機和虛擬機完成智能調(diào)度,至少包括高可用調(diào)度、資源均衡調(diào)度和節(jié)能省電調(diào)度;
所述的監(jiān)控告警層用于對信息應(yīng)用和虛擬機運行狀態(tài)數(shù)據(jù)進行采集、匯總和展現(xiàn),并通知異常應(yīng)用相關(guān)的責(zé)任人,向其發(fā)起告警;
所述的鏡像管理層負責(zé)完成對虛擬機的鏡像文件進行創(chuàng)建、刪除、查詢和修改操作;
所述的核心框架層對應(yīng)于中央控制管理服務(wù)子系統(tǒng)的核心服務(wù)層,用于為自主控制Agent子系統(tǒng)中的系統(tǒng)安全、日志、網(wǎng)絡(luò)連接、RESTful框架提供基礎(chǔ);所述的主機狀態(tài)采集層負責(zé)周期性地采集資源池中物理機和虛擬機的運行狀態(tài),包括CPU、內(nèi)存、磁盤和網(wǎng)絡(luò)的靜態(tài)信息和動態(tài)信息,并通過核心框架層將采集到的信息上報至中央控制管理服務(wù)子系統(tǒng);
所述的狀態(tài)采集層用于對信息應(yīng)用服務(wù)器的系統(tǒng)運行狀態(tài)進行采集,并通過核心框架層將采集到的信息上傳至中央控制管理服務(wù)子系統(tǒng);
所述事件管理層用于對自主控制Agent子系統(tǒng)中產(chǎn)生的事件進行管理,包括創(chuàng)建、刪除、查詢事件狀態(tài);
所述的進程監(jiān)控層用于對配置有自主控制Agent子系統(tǒng)的信息應(yīng)用服務(wù)器上的關(guān)鍵進程進行監(jiān)控,當(dāng)發(fā)現(xiàn)關(guān)鍵進程出現(xiàn)故障時,向中央控制管理服務(wù)子系統(tǒng)發(fā)送進程失效事件,以激發(fā)對應(yīng)的虛擬機,保證信息應(yīng)用的高可用,其中,關(guān)鍵進程由管理人員根據(jù)信息應(yīng)用的不同手動進行配置需要監(jiān)聽的進程,如數(shù)據(jù)庫、Web服務(wù)等;
所述的Joblet運行環(huán)境層用于在自主控制Agent子系統(tǒng)中為Joblet運行提供基礎(chǔ),
Joblet與任務(wù)Job是--對應(yīng)的,其中,Job在中央控制服務(wù)子系統(tǒng)中執(zhí)行,負責(zé)初始化、管
理Joblet運行,Joblet被分發(fā)到資源池中的各物理機上執(zhí)行,完成實際的任務(wù)。一種基于云計算的高可用系統(tǒng)的實現(xiàn)方法,它包括以下步驟:
(1)創(chuàng)建信息應(yīng)用鏡像,即設(shè)置信息應(yīng)用服務(wù)器與云主機服務(wù)器上虛擬機的對應(yīng)主備關(guān)系;
(2)安裝部署Agent組件,即配置云主機服務(wù)器和信息應(yīng)用服務(wù)器的Agent信息;
(3)Agent層對應(yīng)用的運 行進行監(jiān)控,即虛擬云主機自主控制Agent和信息應(yīng)用主機自主控制Agent通過采集虛擬機、云主機服務(wù)器、信息應(yīng)用服務(wù)器的運行狀態(tài)對應(yīng)用的運行進行監(jiān)控,并將監(jiān)控信息上報至中央控制管理服務(wù)層;
(4)當(dāng)監(jiān)控到應(yīng)用發(fā)生故障時,中央控制管理服務(wù)層發(fā)送啟動應(yīng)急措施的任務(wù)Job至Agent 層;
(5)Agent層根據(jù)Joblet中攜帶的指示自動啟動故障應(yīng)用的鏡像虛擬機;
(6)Agent層繼續(xù)對應(yīng)用的運行進行監(jiān)控;
(7)當(dāng)檢測到故障應(yīng)用恢復(fù)后,關(guān)閉故障應(yīng)用的鏡像虛擬機。一種基于云計算的高可用系統(tǒng)的實現(xiàn)方法還包括一個當(dāng)檢測到服務(wù)器異常時向異常應(yīng)用的負責(zé)人發(fā)起告警的步驟。本發(fā)明的有益效果是:
(1)本發(fā)明改變了傳統(tǒng)雙機熱備高可用系統(tǒng)中主/備服務(wù)器數(shù)量比1:1為N:1,從而節(jié)省大量備用服務(wù)器資源,提供了服務(wù)器資源的利用率;
(2)本發(fā)明的運行數(shù)據(jù)采集由自主控制Agent對物理服務(wù)器、虛擬機和關(guān)鍵進程分別實現(xiàn),采用H2內(nèi)存數(shù)據(jù)庫技術(shù)存儲采集數(shù)據(jù),并建立了適應(yīng)各種策略的監(jiān)控數(shù)據(jù)分析模型和快速算法,從而滿足了實時數(shù)據(jù)分析、異常預(yù)警、資源調(diào)度等需求;
(3)本發(fā)明具有功能的可擴展性和靈活性,本發(fā)明的任務(wù)管理技術(shù)基于腳本編寫,工作人員只需使用Python語言編寫即可實現(xiàn)對功能的修改和擴展;
(4)本發(fā)明利用計算資源智能調(diào)度技術(shù)將資源池中所有物理服務(wù)器作為共享備用資源,統(tǒng)一為所有信息應(yīng)用提供HA支撐,當(dāng)心跳檢測發(fā)現(xiàn)異常后,本系統(tǒng)將自動調(diào)度該異常信息應(yīng)用對應(yīng)的鏡像虛擬機,在資源池中負載較輕的物理服務(wù)器上運行,接替出現(xiàn)故障的信息應(yīng)用;
(5)本發(fā)明的異常告警信息的推送方式多樣,包括郵件、短信、即時通信等多種消息發(fā)送機制,能夠保證重要信息及時可靠地傳送至負責(zé)人,使運維管理人員能夠及時掌握信息應(yīng)用的故障情況,以便及時采取相應(yīng)的后續(xù)處理措施;
(6)自主控制Agent被部署于信息應(yīng)用的操作系統(tǒng)中,自主控制Agent通過網(wǎng)絡(luò)與中央控制管理服務(wù)器建立針對信息應(yīng)用的心跳連接,智能代理將根據(jù)指定的策略對信息應(yīng)用的運行狀態(tài)進行實時監(jiān)控,當(dāng)檢測異常應(yīng)用發(fā)生時,智能代理將執(zhí)行相應(yīng)的策略動作;
(7)本發(fā)明采用具有開放、成熟、輕量級優(yōu)點的SIGAR(System Information GathererAnd Reporter)作為狀態(tài)采集方法,并將SIGAR組件集成到智能代理中,能夠?qū)崟r將監(jiān)控數(shù)據(jù)傳遞到中央控制管理服務(wù)中,并按照一定的采用頻率定期保存數(shù)據(jù)。


圖1為本發(fā)明的系統(tǒng)組成框 圖2為本發(fā)明的方法流程示意 圖3為本發(fā)明的系統(tǒng)物理架構(gòu)示意圖。
具體實施例方式下面結(jié)合附圖進一步詳細描述本發(fā)明的技術(shù)方案,但本發(fā)明的保護范圍不局限于以下所述。如圖1所示,一種基于云計算的高可用系統(tǒng),它包括一個中央控制管理服務(wù)子系統(tǒng)和至少一個自主控制Agent子系統(tǒng),中央控制管理服務(wù)子系統(tǒng)與自主控制Agent子系統(tǒng)之間通過協(xié)議互連,所述的中央控制管理服務(wù)子系統(tǒng)包括核心服務(wù)層、資源管理層、任務(wù)管理層、智能調(diào)度層、監(jiān)控告警層和鏡像管理層,所述的自主控制Agent子系統(tǒng)包括核心框架層、主機狀態(tài)采集層、狀態(tài)采集層、事件管理層、進程監(jiān)控層和Joblet運行環(huán)境層;
所述的核心服務(wù)層是整個高可用系統(tǒng)的核心,它提供系統(tǒng)運行的基礎(chǔ)框架,至少包括安全管理、事件管理、日志管理等功能,同時負責(zé)建立與自主控制Agent子系統(tǒng)的通信,監(jiān)聽、采集所有受管服務(wù)器發(fā)來的信息,并負責(zé)建立同底層LDAP目錄服務(wù)和數(shù)據(jù)庫服務(wù)器的通信管理,負責(zé)與其他采用RESTful方式進行通信的系統(tǒng)的通信管理;
所述的資源管理層用于對本系統(tǒng)中的所有物理機和虛擬機的資源情況、資源使用情況、運行狀態(tài)信息進行統(tǒng)一管理;
所述的任務(wù)管理層用于修改、創(chuàng)建任務(wù),以及任務(wù)調(diào)度和對運行情況監(jiān)控等管理工作,以保證虛擬機在需要的時候完成啟動、停止和遷移的操作;
所述的智能調(diào)度層用于對本系統(tǒng)中的物理機和虛擬機完成智能調(diào)度,至少包括高可用調(diào)度、資源均衡調(diào)度和節(jié)能省電調(diào)度;
所述的監(jiān)控告警層用于對信息應(yīng)用和虛擬機運行狀態(tài)數(shù)據(jù)進行采集、匯總和展現(xiàn),并通知異常應(yīng)用相關(guān)的責(zé)任人,向其發(fā)起告警;
所述的鏡像管理層負責(zé)完成對虛擬機的鏡像文件進行創(chuàng)建、刪除、查詢、修改等操作;所述的核心框架層對應(yīng)于中央控制管理服務(wù)子系統(tǒng)的核心服務(wù)層,用于為自主控制Agent子系統(tǒng)中的系統(tǒng)安全、日志、網(wǎng)絡(luò)連接、RESTful框架提供基礎(chǔ);所述的主機狀態(tài)采集層負責(zé)周期性地采集資源池中物理機和虛擬機的運行狀態(tài),包括CPU、內(nèi)存、磁盤、網(wǎng)絡(luò)等靜態(tài)信息和動態(tài)信息,并通過核心框架層將采集到的信息上報至中央控制管理服務(wù)子系統(tǒng);
所述的狀態(tài)采集層用于對信息應(yīng)用服務(wù)器的系統(tǒng)運行狀態(tài)進行采集,并通過核心框架層將采集到的信息上傳至中央控制管理服務(wù)子系統(tǒng);
所述事件管理層用于對自主控制Agent子系統(tǒng)中產(chǎn)生的事件進行管理,包括創(chuàng)建、刪除、查詢事件狀態(tài);
所述的進程監(jiān)控層用于對配置有自主控制Agent子系統(tǒng)的信息應(yīng)用服務(wù)器上的關(guān)鍵進程進行監(jiān)控,當(dāng)發(fā)現(xiàn)關(guān)鍵進程出現(xiàn)故障時,向中央控制管理服務(wù)子系統(tǒng)發(fā)送進程失效事件,以激發(fā)對應(yīng)的虛擬機,保證信息應(yīng)用的高可用,其中,關(guān)鍵進程由管理人員根據(jù)信息應(yīng)用的不同手動進行配置需要監(jiān)聽的進程,如數(shù)據(jù)庫、Web服務(wù)等;
所述的Joblet運行環(huán)境層用于在自主控制Agent子系統(tǒng)中為Joblet運行提供基礎(chǔ),
Joblet與任務(wù)Job是--對應(yīng)的,其中,Job在中央控制服務(wù)子系統(tǒng)中執(zhí)行,負責(zé)初始化、管
理Joblet運行,Joblet被分發(fā)到資源池中的各物理機上執(zhí)行,完成實際的任務(wù)。如圖2所示,一種基于云計算的高可用系統(tǒng)的實現(xiàn)方法,它包括以下步驟:
(1)創(chuàng)建信息應(yīng)用鏡像,即設(shè)置信息應(yīng)用服務(wù)器與云主機服務(wù)器上虛擬機的對應(yīng)主備關(guān)系;
(2)安裝部署Agent組件,即配置云主機服務(wù)器和信息應(yīng)用服務(wù)器的Agent信息;
(3)Agent層對 應(yīng)用的運行進行監(jiān)控,即虛擬云主機自主控制Agent和信息應(yīng)用主機自主控制Agent通過采集虛擬機、云主機服務(wù)器、信息應(yīng)用服務(wù)器的運行狀態(tài)對應(yīng)用的運行進行監(jiān)控,并將監(jiān)控信息上報至中央控制管理服務(wù)層;
(4)當(dāng)監(jiān)控到應(yīng)用發(fā)生故障時,中央控制管理服務(wù)層發(fā)送啟動應(yīng)急措施的任務(wù)Job至Agent 層;
(5)Agent層根據(jù)Joblet中攜帶的指示自動啟動故障應(yīng)用的鏡像虛擬機;
(6)Agent層繼續(xù)對應(yīng)用的運行進行監(jiān)控;
(7)當(dāng)檢測到故障應(yīng)用恢復(fù)后,關(guān)閉故障應(yīng)用的鏡像虛擬機。一種基于云計算的高可用系統(tǒng)的實現(xiàn)方法還包括一個當(dāng)檢測到服務(wù)器異常時向異常應(yīng)用的負責(zé)人發(fā)起告警的步驟。一種基于云計算的高可用系統(tǒng),如圖3所示,從物理架構(gòu)來分,可分為中央控制管理服務(wù)器、云主機服務(wù)器資源池和信息應(yīng)用服務(wù)器資源池三個部分,云主機服務(wù)器資源池包括至少一臺云主機服務(wù)器,信息應(yīng)用服務(wù)器資源池包括至少一臺信息應(yīng)用服務(wù)器,云主機服務(wù)器和信息應(yīng)用服務(wù)器之間通過網(wǎng)絡(luò)與中央控制管理服務(wù)器進行通信。云主機服務(wù)器資源池中的服務(wù)器上配置有虛擬機,這些虛擬機與信息應(yīng)用服務(wù)器資源池中的服務(wù)器存在主備關(guān)系,中央控制管理服務(wù)器負責(zé)對所有服務(wù)器進行任務(wù)管理和智能調(diào)度。從邏輯架構(gòu)來分,可分為Agent層和Server層,Agent層負責(zé)對信息應(yīng)用的運行數(shù)據(jù)(所有服務(wù)器和虛擬機的工作負載、關(guān)鍵進程運行狀態(tài)等信息)進行監(jiān)控、上報,同時接收、解釋并執(zhí)行來自Server層的命令,Server層收集主機的運行狀態(tài)并根據(jù)調(diào)度算法向相應(yīng)主機發(fā)送控制命令,實現(xiàn)對資源的調(diào)度和管理。
權(quán)利要求
1.一種基于云計算的高可用系統(tǒng),其特征在于:它包括一個中央控制管理服務(wù)子系統(tǒng)和至少一個自主控制Agent子系統(tǒng),中央控制管理服務(wù)子系統(tǒng)與自主控制Agent子系統(tǒng)之間通過協(xié)議互連,所述的中央控制管理服務(wù)子系統(tǒng)包括核心服務(wù)層、資源管理層、任務(wù)管理層、智能調(diào)度層、監(jiān)控告警層和鏡像管理層,所述的自主控制Agent子系統(tǒng)包括核心框架層、主機狀態(tài)采集層、狀態(tài)采集層、事件管理層、進程監(jiān)控層和Joblet運行環(huán)境層; 所述的核心服務(wù)層是整個高可用系統(tǒng)的核心,它提供系統(tǒng)運行的基礎(chǔ)框架,至少包括安全管理、事件管理和日志管理,并負責(zé)建立與自主控制Agent子系統(tǒng)的通信,監(jiān)聽、采集所有受管服務(wù)器發(fā)來的信息,負責(zé)建立同底層LDAP目錄服務(wù)和數(shù)據(jù)庫服務(wù)器的通信管理,負責(zé)與其他采用RESTful方式進行通信的系統(tǒng)的通信管理; 所述的資源管理層用于對本系統(tǒng)中的所有物理機和虛擬機的資源情況、資源使用情況、運行狀態(tài)信息進行統(tǒng)一管理; 所述的任務(wù)管理層用于修改、創(chuàng)建任務(wù),以及任務(wù)調(diào)度和對運行情況監(jiān)控,以保證虛擬機在需要的時候完成啟動、停止和遷移的操作; 所述的智能調(diào)度層用于對本系統(tǒng)中的物理機和虛擬機完成智能調(diào)度,至少包括高可用調(diào)度、資源均衡調(diào)度和節(jié)能省電調(diào)度; 所述的監(jiān)控告警層用于對信息應(yīng)用和虛擬機運行狀態(tài)數(shù)據(jù)進行采集、匯總和展現(xiàn),并通知異常應(yīng)用相關(guān)的責(zé)任人,向其發(fā)起告警; 所述的鏡像管理層負責(zé)完成對虛擬機的鏡像文件進行創(chuàng)建、刪除、查詢和修改操作; 所述的核心框架層對應(yīng)于中央控制管理服務(wù)子系統(tǒng)的核心服務(wù)層,用于為自主控制Agent子系統(tǒng)中的系統(tǒng)安全、日志、網(wǎng)絡(luò)連接、RESTful框架提供基礎(chǔ); 所述的主機狀態(tài)采集層負責(zé)周期性地采集自主控制Agent子系統(tǒng)中物理機和虛擬機的運行狀態(tài),包括CPU、內(nèi)存、磁盤和網(wǎng)絡(luò)的靜態(tài)信息和動態(tài)信息,并通過核心框架層將采集到的信息上報至中央控制管理服務(wù)子系統(tǒng); 所述的狀態(tài)采集層用于對信息應(yīng)用服務(wù)器的系統(tǒng)運行狀態(tài)進行采集,并通過核心框架層將采集到的信息上傳至中央控制管理服務(wù)子系統(tǒng); 所述事件管理層用于對自主控制Agent子系統(tǒng)中產(chǎn)生的事件進行管理,包括創(chuàng)建、刪除、查詢事件狀態(tài); 所述的進程監(jiān)控層用于對配置有自主控制Agent子系統(tǒng)的信息應(yīng)用服務(wù)器上的關(guān)鍵進程進行監(jiān)控,當(dāng)發(fā)現(xiàn)關(guān)鍵進程出現(xiàn)故障時,向中央控制管理服務(wù)子系統(tǒng)發(fā)送進程失效事件,以激發(fā)對應(yīng)的虛擬機,保證信息應(yīng)用的高可用,其中,關(guān)鍵進程由管理人員根據(jù)信息應(yīng)用的不同手動進行配置需要監(jiān)聽的進程,如數(shù)據(jù)庫、Web服務(wù)等; 所述的Joblet運行環(huán)境層用于在自主控制Agent子系統(tǒng)中為Joblet運行提供基礎(chǔ),Joblet與任務(wù)Job是--對應(yīng)的,其中,Job在中央控制服務(wù)子系統(tǒng)中執(zhí)行,負責(zé)初始化、管理Joblet運行,Joblet被分發(fā)到自主控制Agent子系統(tǒng)中的各物理機上執(zhí)行,完成實際的任務(wù)。
2.一種基于云計算的高可用系統(tǒng)的實現(xiàn)方法,其特征在于:它包括以下步驟: (1)創(chuàng)建信息應(yīng)用鏡像,即設(shè)置信息應(yīng)用服務(wù)器與云主機服務(wù)器上虛擬機的對應(yīng)主備關(guān)系; (2)安裝部署Agent組件,即配置云主機服務(wù)器和信息應(yīng)用服務(wù)器的Agent信息;(3)Agent層對應(yīng)用的運行進行監(jiān)控,即虛擬云主機自主控制Agent和信息應(yīng)用主機自主控制Agent通過采集虛擬機、云主機服務(wù)器、信息應(yīng)用服務(wù)器的運行狀態(tài)對應(yīng)用的運行進行監(jiān)控,并將監(jiān)控信息上報至中央控制管理服務(wù)層; (4)當(dāng)監(jiān)控到應(yīng)用發(fā)生故障時,中央控制管理服務(wù)層發(fā)送啟動應(yīng)急措施的任務(wù)Job至Agent 層; (5)Agent層根據(jù)Joblet中攜帶的指示自動啟動故障應(yīng)用的鏡像虛擬機; (6)Agent層繼續(xù)對應(yīng)用的運行進行監(jiān)控; (7)當(dāng)檢測到故障應(yīng)用恢復(fù)后,關(guān)閉故障應(yīng)用的鏡像虛擬機。
3.根據(jù)權(quán)利要求2所述的一種基于云計算的高可用系統(tǒng)的實現(xiàn)方法,其特征在于:它還包括一個當(dāng)檢測到服務(wù)器 異常時向異常應(yīng)用的負責(zé)人發(fā)起告警的步驟。
全文摘要
本發(fā)明公開了一種基于云計算的高可用系統(tǒng)及其實現(xiàn)方法,該系統(tǒng)包括中央控制管理服務(wù)子系統(tǒng)和自主控制Agent子系統(tǒng),中央控制管理服務(wù)子系統(tǒng)與自主控制Agent子系統(tǒng)之間通過協(xié)議互連,所述的中央控制管理服務(wù)子系統(tǒng)包括核心服務(wù)、資源管理和任務(wù)管理等5層,所述的自主控制Agent子系統(tǒng)包括核心框架、狀態(tài)采集和進程監(jiān)控等5層;該方法包括創(chuàng)建信息應(yīng)用鏡像關(guān)系、監(jiān)控應(yīng)用運行狀態(tài)、啟動對應(yīng)故障應(yīng)用的鏡像虛擬機、關(guān)閉恢復(fù)正常的故障應(yīng)用的鏡像虛擬機等步驟。本發(fā)明改變了傳統(tǒng)雙機熱備高可用系統(tǒng)中主/備服務(wù)器數(shù)量比1:1為N1,從而節(jié)省大量備用服務(wù)器資源,提供了服務(wù)器資源的利用率,具有良好的靈活性和可擴展性。
文檔編號H04L29/08GK103152414SQ20131006564
公開日2013年6月12日 申請日期2013年3月1日 優(yōu)先權(quán)日2013年3月1日
發(fā)明者王電鋼, 常健, 王鐵軍, 周毅 申請人:四川省電力公司信息通信公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
霍林郭勒市| 芜湖市| 喀喇沁旗| 新和县| 怀远县| 霍林郭勒市| 昌黎县| 邛崃市| 安乡县| 库伦旗| 虞城县| 巨野县| 宁津县| 寿宁县| 舒兰市| 洛川县| 仁寿县| 来安县| 新民市| 延长县| 清镇市| 阳谷县| 汝南县| 敦煌市| 河西区| 扶余县| 中西区| 古蔺县| 金门县| 南京市| 渭南市| 望江县| 方山县| 塔城市| 大理市| 东方市| 柯坪县| 衡阳市| 长宁县| 太康县| 视频|