專利名稱:一種遠程監(jiān)控系統(tǒng)上電過程宕機的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計算機通信管理領(lǐng)域,具體地說是一種遠程監(jiān)控系統(tǒng)上電過程宕機的方法。
背景技術(shù):
從上個世紀(jì)90年代以來,隨著科學(xué)技術(shù)的迅速發(fā)展,人們的生產(chǎn)行為,生產(chǎn)方式都發(fā)生了重大的變化,作為生產(chǎn)中非常重要的一項技術(shù)即監(jiān)控技術(shù)的重要性正在逐漸被人們認(rèn)識和重視。而計算機監(jiān)控系統(tǒng)是以監(jiān)控控制計算機為主體,加上檢測裝置、執(zhí)行機構(gòu)和被監(jiān)控控制對象共同構(gòu)成的整體。隨著生產(chǎn)力的進步,各自獨立的監(jiān)測系統(tǒng)已不能滿足工業(yè)化的需求,于是出現(xiàn)了·分布式系統(tǒng)。這種系統(tǒng)以計算機網(wǎng)絡(luò)為基礎(chǔ),使系統(tǒng)資源分配趨于合理。另一方面數(shù)據(jù)大規(guī)模爆發(fā)式增長,數(shù)據(jù)中心的應(yīng)用越來越多,然而,當(dāng)今的數(shù)據(jù)中心管理大多是針對上層應(yīng)用的管理控制,數(shù)據(jù)采集分析之類,對于機房管理人員來說,大規(guī)模節(jié)點的可調(diào)試性,易維護性顯得尤為重要。在數(shù)據(jù)中心的建立及調(diào)試過程中,很容易出現(xiàn)個別節(jié)點異常狀況,在現(xiàn)有的監(jiān)控管理系統(tǒng)基礎(chǔ)上,提出一種適用于機房建設(shè)管理人員的監(jiān)控管理體系結(jié)構(gòu)就顯得很必要了。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種遠程監(jiān)控系統(tǒng)上電過程宕機的方法。。本發(fā)明的目的是按以下方式實現(xiàn)的,系統(tǒng)通過BIOS計時開關(guān)模塊、BMC監(jiān)控計時模塊、管理中心顯示控制模塊相互緊密配合,形成一個分布式集成監(jiān)控系統(tǒng),當(dāng)某個節(jié)點系統(tǒng)發(fā)生故障時,顯示模塊能有效的定位節(jié)點,并遠程重啟相應(yīng)節(jié)點,從而提高數(shù)據(jù)中心的調(diào)試效率,系統(tǒng)包括系統(tǒng)上電BIOS計時開關(guān)模塊(1),BMC監(jiān)控計時模塊(2),管理中心顯示控制模塊(3),其中
BMC監(jiān)控計時模塊(2)是系統(tǒng)的核心,負(fù)責(zé)協(xié)調(diào)各資源間的通信以及系統(tǒng)狀態(tài)的轉(zhuǎn)化;系統(tǒng)上電BIOS計時開關(guān)模塊(I)負(fù)責(zé)控制BMC中計時器的打開和關(guān)閉,采用專用的IPMI協(xié)議來實現(xiàn);
管理中心顯示控制模塊(3)在數(shù)據(jù)中心進行開機調(diào)試時,負(fù)責(zé)系統(tǒng)起動狀態(tài)的顯示,把系統(tǒng)狀態(tài)以LED燈的形式展現(xiàn)在控制臺上,并能發(fā)出重啟某節(jié)點的命令,監(jiān)控步驟如下BMC監(jiān)控計時模塊(2)為此體系結(jié)構(gòu)的核心,起到協(xié)調(diào)各資源間的通信及協(xié)議轉(zhuǎn)化等作用,數(shù)據(jù)中心進行調(diào)試時,各節(jié)點BMC監(jiān)控計時模塊收到BIOS打開計時器指令后,立即進行計時動作,BIOS會在節(jié)點在上電完成時,發(fā)送關(guān)閉計時器指令;如果節(jié)點機器發(fā)生宕機,BMC無法收到關(guān)閉計時器指令,從而造成計時器超出規(guī)定的限值,進而BMC監(jiān)控計時模塊會發(fā)指令更新管理中心顯示控制模塊(3)的狀態(tài),管理人員及時獲取,并經(jīng)過管理中心顯示控制模塊向BMC發(fā)出重啟故障節(jié)點的指令,來修復(fù)故障節(jié)點機器。本發(fā)明的有益效果是在以大規(guī)模服務(wù)器節(jié)點為基礎(chǔ)的數(shù)據(jù)中心,通過本體系結(jié)構(gòu)的靈活監(jiān)控管理,為機房管理人員帶來前所未有的靈活性,大大降低了維護調(diào)試人員的工作量,提高了生產(chǎn)工作效率。遠程監(jiān)控系統(tǒng)上電過程宕機的方法,對數(shù)據(jù)機房調(diào)試過程中出現(xiàn)的異常宕機狀況,可以實現(xiàn)有效定位節(jié)點位置和控制修復(fù)動作,彌補了傳統(tǒng)的以上層監(jiān)控為核心的監(jiān)控管理體系結(jié)構(gòu),使其適應(yīng)了當(dāng)今社會發(fā)展的需求,因而具有廣闊的發(fā)展前景。
圖I是本體系結(jié)構(gòu)說明圖。
具體實施例方式參照說明書附圖對本發(fā)明的方法作以下詳細(xì)地說明。正如發(fā)明內(nèi)容中所描述的,本發(fā)明體系結(jié)構(gòu)主要包括系統(tǒng)上電BIOS計時開關(guān)模塊(I),BMC監(jiān)控計時模塊(2 )、管理中心顯示控制模塊(3 );
BMC監(jiān)控計時模塊(2)為此體系結(jié)構(gòu)的核心,起到協(xié)調(diào)各資源間的通信及協(xié)議轉(zhuǎn)化等作用,數(shù)據(jù)中心進行調(diào)試時,各節(jié)點BMC監(jiān)控計時模塊收到BIOS打開計時器指令后,立即進行計時動作,BIOS會在節(jié)點在上電完成時,發(fā)送關(guān)閉計時器指令;如果節(jié)點機器發(fā)生宕機,BMC無法收到關(guān)閉計時器指令,從而造成計時器超出規(guī)定的限值,進而BMC監(jiān)控計時模塊會發(fā)指令更新管理中心顯示控制模塊(3)的狀態(tài),管理人員可以及時獲取,并經(jīng)過管理中心顯示控制模塊向BMC發(fā)出重啟故障節(jié)點的指令,來修復(fù)故障節(jié)點機器。與傳統(tǒng)的以上層應(yīng)用為核心的監(jiān)控管理服務(wù)器體系結(jié)構(gòu)相比,這種新型的體系結(jié)構(gòu)具有高可用性、高靈活性,以及基于模塊化部件靈活配置等特性。其中,高可用性的實現(xiàn)方式描述如下特征在于在體系結(jié)構(gòu)中,BIOS計時開關(guān)模塊、BMC監(jiān)控計時模塊、管理中心顯示控制模塊相互緊密配合,形成一個分布式集成監(jiān)控系統(tǒng),當(dāng)某個節(jié)點系統(tǒng)發(fā)生故障時,顯示模塊能有效的定位節(jié)點,并遠程重啟相應(yīng)節(jié)點,從而提高數(shù)據(jù)中心的調(diào)試效率。除說明書所述的技術(shù)特征外,均為本專業(yè)技術(shù)人員的已知技術(shù)。
權(quán)利要求
1.一種遠程監(jiān)控系統(tǒng)上電過程宕機的方法,其特征在于系統(tǒng)通過BIOS計時開關(guān)模塊、BMC監(jiān)控計時模塊、管理中心顯示控制模塊相互緊密配合,形成一個分布式集成監(jiān)控系統(tǒng),當(dāng)某個節(jié)點系統(tǒng)發(fā)生故障時,顯示模塊能有效的定位節(jié)點,并遠程重啟相應(yīng)節(jié)點,從而提高數(shù)據(jù)中心的調(diào)試效率,系統(tǒng)包括系統(tǒng)上電BIOS計時開關(guān)模塊(1),BMC監(jiān)控計時模塊(2),管理中心顯示控制模塊(3),其 中 BMC監(jiān)控計時模塊(2)是系統(tǒng)的核心,負(fù)責(zé)協(xié)調(diào)各資源間的通信以及系統(tǒng)狀態(tài)的轉(zhuǎn)化;系統(tǒng)上電BIOS計時開關(guān)模塊(I)負(fù)責(zé)控制BMC中計時器的打開和關(guān)閉,采用專用的IPMI協(xié)議來實現(xiàn); 管理中心顯示控制模塊(3)在數(shù)據(jù)中心進行開機調(diào)試時,負(fù)責(zé)系統(tǒng)起動狀態(tài)的顯示,把系統(tǒng)狀態(tài)以LED燈的形式展現(xiàn)在控制臺上,并能發(fā)出重啟某節(jié)點的命令,監(jiān)控步驟如下BMC監(jiān)控計時模塊(2)為此體系結(jié)構(gòu)的核心,起到協(xié)調(diào)各資源間的通信及協(xié)議轉(zhuǎn)化等作用,數(shù)據(jù)中心進行調(diào)試時,各節(jié)點BMC監(jiān)控計時模塊收到BIOS打開計時器指令后,立即進行計時動作,BIOS會在節(jié)點在上電完成時,發(fā)送關(guān)閉計時器指令;如果節(jié)點機器發(fā)生宕機,BMC無法收到關(guān)閉計時器指令,從而造成計時器超出規(guī)定的限值,進而BMC監(jiān)控計時模塊會發(fā)指令更新管理中心顯示控制模塊(3)的狀態(tài),管理人員及時獲取,并經(jīng)過管理中心顯示控制模塊向BMC發(fā)出重啟故障節(jié)點的指令,來修復(fù)故障節(jié)點機器。
全文摘要
本發(fā)明提供一種遠程監(jiān)控系統(tǒng)上電過程宕機的方法,該方法是以大規(guī)模服務(wù)器節(jié)點為基礎(chǔ)的數(shù)據(jù)中心,通過本體系結(jié)構(gòu)的靈活監(jiān)控管理,為機房管理人員帶來前所未有的靈活性,大大降低了維護調(diào)試人員的工作量,提高了生產(chǎn)工作效率。遠程監(jiān)控系統(tǒng)上電過程宕機的方法,對數(shù)據(jù)機房調(diào)試過程中出現(xiàn)的異常宕機狀況,可以實現(xiàn)有效定位節(jié)點位置和控制修復(fù)動作,彌補了傳統(tǒng)的以上層監(jiān)控為核心的監(jiān)控管理體系結(jié)構(gòu),使其適應(yīng)了當(dāng)今社會發(fā)展的需求,因而具有廣闊的發(fā)展前景。
文檔編號G06F11/30GK102929760SQ201210399008
公開日2013年2月13日 申請日期2012年10月19日 優(yōu)先權(quán)日2012年10月19日
發(fā)明者顏偉 申請人:浪潮電子信息產(chǎn)業(yè)股份有限公司