專利名稱:基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)領(lǐng)域,尤其涉及一種基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法。
背景技術(shù):
云計(jì)算(Cloud Computing)是網(wǎng)格計(jì)算(Grid Computing)、分布式計(jì)算(Distributed Computing)、并行計(jì)算(Parallel Computing)、效用計(jì)算(UtilityComputing)、網(wǎng)絡(luò)存儲(Network Storage Technologies)、虛擬化(Virtualization)、負(fù)載均衡(Load Balance)等傳統(tǒng)計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)發(fā)展融合的產(chǎn)物。它旨在通過網(wǎng)絡(luò)把多個(gè)成本相對較低的計(jì)算實(shí)體整合成一個(gè)具有強(qiáng)大計(jì)算能力的完美系統(tǒng)。云計(jì)算的一個(gè)核心理念就是通過不斷提高“云”的處理能力,進(jìn)而減少用戶終端的處理負(fù)擔(dān),最終使用戶終端簡化成一個(gè)單純的輸入輸出設(shè)備,并能按需享受“云”的強(qiáng)大計(jì)算處理能力。云計(jì)算的重 要特點(diǎn)之一就是對用戶端的設(shè)備要求最低,使用起來也最方便。主機(jī)是云平臺的一個(gè)節(jié)點(diǎn),是組成云平臺的最小的實(shí)體單位,主機(jī)上主要用來開啟虛擬機(jī)。同類型主機(jī)可組成一個(gè)集群。集群是指將一組計(jì)算機(jī)關(guān)聯(lián)起來,使它們在外界從很多方面看起來如同一臺計(jì)算機(jī)。集群內(nèi)的計(jì)算機(jī)之間通常通過局域網(wǎng)連接,通常用來改善性能和可用性。虛擬化指對計(jì)算資源進(jìn)行抽象的一個(gè)廣義概念。虛擬化對上層應(yīng)用或用戶隱藏了計(jì)算資源的底層屬性。它既包括使單個(gè)的資源(比如一個(gè)服務(wù)器,一個(gè)操作系統(tǒng),一個(gè)應(yīng)用程序,一個(gè)存儲設(shè)備)劃分成多個(gè)虛擬資源,也包括將多個(gè)資源(比如存儲設(shè)備或服務(wù)器)整合成一個(gè)虛擬資源。虛擬化技術(shù)是指實(shí)現(xiàn)虛擬化的具體的技術(shù)性手段和方法的集合性概念。主機(jī)是云計(jì)算平臺中的基礎(chǔ)部分,主要向云計(jì)算平臺提供資源。當(dāng)集群出現(xiàn)錯(cuò)誤時(shí),主機(jī)與云控制器的連接被中斷,對云計(jì)算平臺來說,有部分資源無法被利用,現(xiàn)有的解決方法是在云平臺中清除錯(cuò)誤集群下的主機(jī)記錄,將主機(jī)重新注冊到另外一個(gè)集群。但是,現(xiàn)有的解決方法存在以下的不足在現(xiàn)有云計(jì)算平臺的基礎(chǔ)上,主機(jī)不能重復(fù)注冊,如果已經(jīng)注冊的主機(jī)因?yàn)榧簛G失而無法使用時(shí),需要將主機(jī)重新注冊到另外一個(gè)集群上,必須先修改云計(jì)算平臺的數(shù)據(jù),即需要清空掉云計(jì)算平臺關(guān)于主機(jī)的記錄,主機(jī)才能重新注冊到另外一個(gè)集群上。這樣,由于需要人為修改云計(jì)算平臺的數(shù)據(jù),可能會導(dǎo)致數(shù)據(jù)修改錯(cuò)誤;另外,由于修改過程繁瑣,導(dǎo)致主機(jī)資源在一段時(shí)間無法使用。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提出一種基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,能夠減少因集群出錯(cuò)而造成的資源丟失和數(shù)據(jù)丟失,減少處理的步驟和時(shí)間,降低因此給用戶帶來的影響。本發(fā)明實(shí)施例提供一種基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,其特征在于包括步驟A、當(dāng)云計(jì)算平臺監(jiān)控到與異常集群通訊中斷時(shí),判斷所述異常集群及注冊到所述異常集群下且以所述異常集群作為主要集群的主機(jī)狀態(tài)丟失,且云計(jì)算平臺無法利用所述主機(jī)的資源;B、所述云計(jì)算平臺從數(shù)據(jù)庫中查找所述主機(jī)注冊主要集群時(shí)同時(shí)注冊的備要集群,將所述備要集群變?yōu)樗鲋鳈C(jī)的當(dāng)前主要集群,并通過所述當(dāng)前主要集群與所述主機(jī)進(jìn)行通信,以重新獲取所述主機(jī)的資源;C、所述云計(jì)算平臺通知管理員對所述異常集群進(jìn)行修復(fù);D、當(dāng)所述異常集群修復(fù)成功,所述云計(jì)算平臺將所述異常集群變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群。
優(yōu)選的,還包括步驟E :當(dāng)所述異常集群修復(fù)失敗,所述云計(jì)算平臺通知一新集群替換所述異常集群,替換成功后,所述新集群變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群。實(shí)施本發(fā)明實(shí)施例,具有如下有益效果本發(fā)明基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,通過將主機(jī)注冊到主要集群的時(shí)候還同時(shí)注冊到一個(gè)備要集群,使備要集群在主要集群發(fā)生異常時(shí)候能夠變?yōu)樗鲋鳈C(jī)的當(dāng)前主要集群以代替所述主要集群以接管損壞集群下的主機(jī)資源,不會讓資源丟失,同時(shí)防止因集群損壞帶來的一段時(shí)間集群及集群下主機(jī)資源無法使用;另外,相比于現(xiàn)有方法中清除錯(cuò)誤集群下的主機(jī)記錄以將主機(jī)重新注冊到另外一個(gè)集群的繁瑣過程簡單很多;且使用備要集群相比使用特定集群(云平臺中因集群所在主機(jī)不能正常通信導(dǎo)致云控制器無法管理該集群下的正常主機(jī),而特定集群用于找回這些主機(jī);當(dāng)損壞主機(jī)修復(fù)后,特定集群會自動歸還集群的這部分主機(jī))來接管損壞集群下的主機(jī)資源,不需要配備一臺專門的機(jī)器,適合規(guī)模小一點(diǎn)的云計(jì)算平臺;特定集群在相對大一點(diǎn)的平臺中應(yīng)單獨(dú)一臺設(shè)備來接受丟失主機(jī),相對反應(yīng)速度較快,但是需要額外配備一臺專門的機(jī)器(作為特定集群)。另外,使用備要集群接管損壞集群下的主機(jī)資源同時(shí)通知管理員修復(fù)異常集群,若異常集群能修復(fù),將所述異常集群變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群;若不能修復(fù),則通知一新集群替換所述異常集群,替換成功后,所述新集群變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群,防止因集群出錯(cuò)而造成的資源丟失和數(shù)據(jù)丟失,降低因此給用戶帶來影響。
圖I是本發(fā)明所提供的基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法的流程圖。圖2是圖I所示基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法的具體流程圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。請參照圖1,本發(fā)明提供了一種基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,所述方法包括
步驟S101、當(dāng)云計(jì)算平臺監(jiān)控到與異常集群通訊中斷時(shí),判斷所述異常集群及注冊到所述異常集群下且以所述異常集群作為主要集群的主機(jī)狀態(tài)丟失,且云計(jì)算平臺無法利用所述主機(jī)的資源;步驟S102、所述云計(jì)算平臺從數(shù)據(jù)庫中查找所述主機(jī)注冊主要集群時(shí)同時(shí)注冊的備要集群,將所述備要集群變?yōu)樗鲋鳈C(jī)的當(dāng)前主要集群,并通過所述當(dāng)前主要集群與所述主機(jī)進(jìn)行通信,以重新獲取所述主機(jī)的資源;步驟S103、所述云計(jì)算平臺通知管理員對所述異常集群進(jìn)行修復(fù);步驟S104、當(dāng)所述異常集群修復(fù)成功,所述云計(jì)算平臺將所述異常集群變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群;步驟S105、當(dāng)所述異常集群修復(fù)失敗,所述云計(jì)算平臺通知一新集群替換所述異常集群,替換成功后,所述新集群變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群。 下面,結(jié)合圖2,對本發(fā)明的基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法進(jìn)行詳細(xì)描述,包括步驟Sll :主機(jī)向集群a提出正式注冊請求;步驟S12 :注冊成功后,集群a向主機(jī)返回注冊成功消息;步驟S13 :將主機(jī)注冊記錄發(fā)送給云計(jì)算平臺;以上步驟為現(xiàn)有技術(shù)中主機(jī)注冊到集群上的通用技術(shù),在此不詳細(xì)描述。步驟S14 :主機(jī)向集群a提出正式注冊請求的同時(shí)向集群b提出注冊備要集群請求;具體的,在主機(jī)正式注冊的同時(shí),同時(shí)在云計(jì)算平臺利用數(shù)據(jù)庫做個(gè)鏈接,使主機(jī)與備要集群b保持一個(gè)聯(lián)系;主要集群a平時(shí)正常使用,備要集群b其他時(shí)間可作為另一個(gè)主機(jī)的主要集群,只有在該主機(jī)的主要集群a發(fā)生故障時(shí)代替主要集群a發(fā)揮作用。步驟S15 :注冊成功后,集群b向主機(jī)返回注冊成功消息;步驟S16 :將主機(jī)注冊記錄發(fā)送給云計(jì)算平臺;步驟S17 :當(dāng)主要集群a發(fā)生異常情況時(shí),云計(jì)算平臺監(jiān)控到與集群a的通訊中斷;步驟S18 :等待一段時(shí)間后云計(jì)算平臺再次向集群a發(fā)送命令,若仍無回答,則判斷集群a以及集群a下的主機(jī)狀態(tài)丟失,且云計(jì)算平臺無法利用所述狀態(tài)丟失的主機(jī)的資源;步驟S19 :接著,所述云計(jì)算平臺從數(shù)據(jù)庫中查找所述主機(jī)的備要集群b時(shí),若發(fā)現(xiàn)所述備要集群b的狀態(tài)為正在運(yùn)行,則發(fā)送命令至所述備要集群b,以使備要集群b和丟失的主機(jī)通信;步驟S20 :集群b與狀態(tài)丟失的主機(jī)連接成功后變?yōu)樗鲋鳈C(jī)的當(dāng)前主要集群以接管所述主機(jī),所述云計(jì)算平臺通過所述集群b重新獲取狀態(tài)丟失的主機(jī)的資源,并將所述主機(jī)的狀態(tài)更改為正在進(jìn)行;步驟S21 :同時(shí),所述云計(jì)算平臺通知管理員對所述異常集群a進(jìn)行修復(fù)(圖中沒顯示);步驟S22 :當(dāng)集群a修復(fù)成功,將修復(fù)成功結(jié)果通知云計(jì)算平臺;步驟S23 :所述云計(jì)算平臺將所述集群a變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群;
步驟S24 :但是,若所述集群a修復(fù)失敗,將修復(fù)失敗結(jié)果通知云計(jì)算平臺;步驟S25 :所述云計(jì)算平臺選擇一新集群C,并與所述新集群c通信,若能正常獲取所述新集群c的信息則判定所述新集群c是正常的;步驟S26 :所述云計(jì)算平臺將所述集群a的狀態(tài)丟失主機(jī)與所述新集群c建立鏈接,以使所述新集群c替換所述集群a且變?yōu)樗鰻顟B(tài)丟失主機(jī)的當(dāng)前備要集群,并對應(yīng)修改云計(jì)算平臺的數(shù)據(jù)庫中的數(shù)據(jù)。綜上所述,本發(fā)明基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,通過將主機(jī)注冊到主要集群的時(shí)候還同時(shí)注冊到一個(gè)備要集群,使備要集群在主要集群發(fā)生異常時(shí)候能夠變?yōu)樗鲋鳈C(jī)的當(dāng)前主要集群以代替所述主要集群以接管損壞集群下的主機(jī)資源,不會讓資源丟失,同時(shí)防止因集群損壞帶來的集群及集群下主機(jī)資源無法使用;另外,相比于現(xiàn)有方法中清除錯(cuò)誤集群下的主機(jī)記錄以將主機(jī)重新注冊到另外一個(gè)集群的繁瑣過程簡單很多;且使用備要集群相比使用特定集群(云平臺中因集群所在主機(jī)不能正常通信導(dǎo)致云控制器 無法管理該集群下的正常主機(jī),而特定集群用于找回這些主機(jī);當(dāng)損壞主機(jī)修復(fù)后,特定集群會自動歸還集群的這部分主機(jī))來接管損壞集群下的主機(jī)資源,不需要配備一臺專門的機(jī)器,適合規(guī)模小一點(diǎn)的云計(jì)算平臺;特定集群在相對大一點(diǎn)的平臺中應(yīng)單獨(dú)一臺設(shè)備來接受丟失主機(jī),相對反應(yīng)速度較快,但是需要額外配備一臺專門的機(jī)器(作為特定集群)。另夕卜,使用備要集群接管損壞集群下的主機(jī)資源同時(shí)通知管理員修復(fù)異常集群,若異常集群能修復(fù),將所述異常集群變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群;若不能修復(fù),則通知一新集群替換所述異常集群,替換成功后,所述新集群變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群,防止因集群出錯(cuò)而造成的資源丟失和數(shù)據(jù)丟失,降低因此給用戶帶來影響。以上所述是本發(fā)明的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤飾,這些改進(jìn)和潤飾也視為本發(fā)明的保護(hù)范圍。
權(quán)利要求
1.一種基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,其特征在于包括步驟 A、當(dāng)云計(jì)算平臺監(jiān)控到與異常集群通訊中斷時(shí),判斷所述異常集群及注冊到所述異常集群下且以所述異常集群作為主要集群的主機(jī)狀態(tài)丟失,且云計(jì)算平臺無法利用所述主機(jī)的資源; B、所述云計(jì)算平臺從數(shù)據(jù)庫中查找所述主機(jī)注冊主要集群時(shí)同時(shí)注冊的備要集群,將所述備要集群變?yōu)樗鲋鳈C(jī)的當(dāng)前主要集群,并通過所述當(dāng)前主要集群與所述主機(jī)進(jìn)行通信,以重新獲取所述主機(jī)的資源; C、所述云計(jì)算平臺通知管理員對所述異常集群進(jìn)行修復(fù); D、當(dāng)所述異常集群修復(fù)成功,所述云計(jì)算平臺將所述異常集群變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群。
2.如權(quán)利要求I所述的基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,其特征在于,還包括步驟 E、當(dāng)所述異常集群修復(fù)失敗,所述云計(jì)算平臺通知一新集群替換所述異常集群,替換成功后,所述新集群變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群。
3.如權(quán)利要求I所述的基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,其特征在于,在所述步驟A中,當(dāng)云計(jì)算平臺發(fā)現(xiàn)與異常集群通訊中斷時(shí),再次向所述異常集群發(fā)送命令,如無應(yīng)答才判斷所述異常集群及注冊到所述異常集群下的主機(jī)狀態(tài)丟失。
4.如權(quán)利要求I所述的基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,其特征在于,在所述步驟B中,所述云計(jì)算平臺從數(shù)據(jù)庫中查找所述主機(jī)的備要集群時(shí),若發(fā)現(xiàn)所述備要集群的狀態(tài)為正在運(yùn)行,則發(fā)送命令至所述備要集群,以使備要集群和丟失的主機(jī)通信,通信成功后則變?yōu)樗鲋鳈C(jī)的當(dāng)前主要集群以接管所述主機(jī),并將主機(jī)狀態(tài)變?yōu)檎谶\(yùn)行。
5.如權(quán)利要求2所述的基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,其特征在于,所述云計(jì)算平臺通知一新集群替換所述異常集群具體包括步驟 E1、所述云計(jì)算平臺選擇一新集群,并與所述新集群通信,若能正常獲取所述新集群的信息則判定所述新集群是正常的; E2、所述云計(jì)算平臺將所述異常集群的狀態(tài)丟失主機(jī)與所送新集群重新建立鏈接,以使所送新集群替換所述異常集群且變?yōu)樗鰻顟B(tài)丟失主機(jī)的當(dāng)前備要集群,并對應(yīng)修改云計(jì)算平臺的數(shù)據(jù)庫中的數(shù)據(jù)。
6.如權(quán)利要求I所述的基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,其特征在于,所述主機(jī)同時(shí)注冊到主要集群和備要集群,是所述主機(jī)正式注冊到主要集群的同時(shí),在云計(jì)算平臺利用數(shù)據(jù)庫做鏈接,使所述主機(jī)與備要集群保持聯(lián)系。
7.如權(quán)利要求6所述的基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,其特征在于,所述備要集群在所述主要集群發(fā)生故障而變?yōu)樗鲋鳈C(jī)的當(dāng)前主要集群以代替所述主要集群發(fā)揮作用前,所述備要集群可作為另一個(gè)主機(jī)的主要集群。
全文摘要
本發(fā)明公開了一種基于云計(jì)算平臺保持主機(jī)資源穩(wěn)定的方法,包括步驟A、當(dāng)云計(jì)算平臺監(jiān)控到與異常集群通訊中斷時(shí),判斷所述異常集群及注冊到所述異常集群下且以所述異常集群作為主要集群的主機(jī)狀態(tài)丟失,且云計(jì)算平臺無法利用所述主機(jī)的資源;B、所述云計(jì)算平臺從數(shù)據(jù)庫中查找所述主機(jī)注冊主要集群時(shí)同時(shí)注冊的備要集群,將所述備要集群變?yōu)樗鲋鳈C(jī)的當(dāng)前主要集群,并通過所述當(dāng)前主要集群與所述主機(jī)進(jìn)行通信,以重新獲取所述主機(jī)的資源;C、所述云計(jì)算平臺通知管理員對所述異常集群進(jìn)行修復(fù);D、當(dāng)所述異常集群修復(fù)成功,所述云計(jì)算平臺將所述異常集群變?yōu)樗鲋鳈C(jī)的當(dāng)前備要集群。
文檔編號H04L12/24GK102882970SQ20121037165
公開日2013年1月16日 申請日期2012年9月28日 優(yōu)先權(quán)日2012年9月28日
發(fā)明者鄧書芬, 吳海玲, 吳文青, 陳浩, 庹海波 申請人:廣州杰賽科技股份有限公司