欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

Cdn設(shè)備狀態(tài)監(jiān)控方法和系統(tǒng)的制作方法

文檔序號(hào):7898825閱讀:223來源:國知局
專利名稱:Cdn設(shè)備狀態(tài)監(jiān)控方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種網(wǎng)絡(luò)設(shè)備的監(jiān)控技術(shù),尤其涉及⑶N設(shè)備的狀態(tài)監(jiān)控方法和系 統(tǒng)。
背景技術(shù)
⑶N設(shè)備正常與否直接關(guān)系到⑶N運(yùn)營平臺(tái)的正常運(yùn)轉(zhuǎn),及時(shí)準(zhǔn)確地發(fā)現(xiàn)設(shè)備上 的異常并通知管理人員處理是CDN運(yùn)營平臺(tái)得以健康運(yùn)轉(zhuǎn)的有力保障。因此,設(shè)備監(jiān)控是 ⑶N運(yùn)營監(jiān)控平臺(tái)的主要功能之一。CDN設(shè)備主要包括運(yùn)營CDN業(yè)務(wù)的服務(wù)器和交換機(jī),這些服務(wù)器和交換機(jī)基于某 種網(wǎng)絡(luò)拓?fù)溥B接起來。對(duì)設(shè)備狀態(tài)監(jiān)控目的則要及時(shí)檢測(cè)出設(shè)備的如下狀態(tài)服務(wù)器宕機(jī)當(dāng)服務(wù)器宕機(jī)時(shí)該服務(wù)器的CDN服務(wù)不能提供,該狀況需要在第一 時(shí)間內(nèi)發(fā)現(xiàn)并修復(fù)。交換機(jī)宕機(jī)當(dāng)交換機(jī)宕機(jī)時(shí),其下的所有設(shè)備都將不可達(dá),從而導(dǎo)致它們提供的 CDN服務(wù)不可用。監(jiān)控系統(tǒng)需要及時(shí)發(fā)現(xiàn)該狀況,并明確問題根源為交換機(jī)宕機(jī),影響范圍 為其下所有設(shè)備;設(shè)備不可達(dá)處于宕機(jī)狀態(tài)交換機(jī)下的所有設(shè)備都不可達(dá),監(jiān)控系統(tǒng)需要將該狀 態(tài)于宕機(jī)狀態(tài)明確區(qū)分以供運(yùn)維人員快速定位問題和解決問題;服務(wù)器僵死處于僵死狀態(tài)的服務(wù)器會(huì)導(dǎo)致該服務(wù)器的CDN服務(wù)不能正常提供, 服務(wù)器僵死通常是由于操作系統(tǒng)異常或服務(wù)異常導(dǎo)致,主要表現(xiàn)為shell登陸卡死在連 接成功建立后的驗(yàn)證狀態(tài),該服務(wù)器的對(duì)外消息不能發(fā)送,但Ping有正?;貞?yīng)。該問題現(xiàn) 場(chǎng)對(duì)CDN產(chǎn)品改進(jìn)有重要意義,監(jiān)控系統(tǒng)需要及時(shí)發(fā)現(xiàn)該狀況,并明確區(qū)分該服務(wù)器為僵 死狀態(tài)而非宕機(jī)或不可達(dá)狀態(tài),以供運(yùn)維人員采取不同的手段處理該問題;機(jī)房故障機(jī)房斷電或斷網(wǎng)會(huì)造成該機(jī)房內(nèi)的所有設(shè)備宕機(jī)或不可達(dá),監(jiān)控系統(tǒng) 需及時(shí)判定該問題并明確問題根源為機(jī)房故障而非該機(jī)房內(nèi)的所有設(shè)備故障。現(xiàn)有的監(jiān)控系統(tǒng)大都直接采用遠(yuǎn)程探測(cè)法或心跳法實(shí)施設(shè)備狀態(tài)監(jiān)控,少數(shù)監(jiān)控 系統(tǒng)結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu)做綜合判定,但都無法完全滿足上述需求直接遠(yuǎn)程探測(cè)法無探針(probe)類的監(jiān)控系統(tǒng)大都直接采用遠(yuǎn)程探測(cè)的方式監(jiān) 控設(shè)備狀態(tài),此方法周期性地對(duì)被監(jiān)控的設(shè)備進(jìn)行Ping探測(cè)或發(fā)送snmp請(qǐng)求,如果設(shè)備有 回應(yīng)則認(rèn)為設(shè)備存活,如果設(shè)備無回應(yīng)則認(rèn)為該設(shè)備宕機(jī)。此類系統(tǒng)將所有設(shè)備無響應(yīng)的 情況視為宕機(jī),無法區(qū)分“服務(wù)器宕機(jī)”和“服務(wù)器不可達(dá)”狀態(tài)。當(dāng)出現(xiàn)交互機(jī)宕機(jī)或網(wǎng) 絡(luò)故障時(shí)會(huì)產(chǎn)生大量宕機(jī)報(bào)警,不利于問題定位和處理。另外,此類系統(tǒng)無法發(fā)現(xiàn)“服務(wù)器 僵死”狀態(tài);直接心跳法有探針(probe)類的監(jiān)控系統(tǒng)可以采用心跳法監(jiān)控設(shè)備狀態(tài),此方 法由設(shè)備周期性地向服務(wù)器上報(bào)心跳信息,監(jiān)控系統(tǒng)則周期性地核對(duì)設(shè)備的心跳信息,如 果周期內(nèi)沒有收到設(shè)備的心跳信息則認(rèn)為設(shè)備宕機(jī)。此類系統(tǒng)可以發(fā)現(xiàn)“服務(wù)器僵死”狀 態(tài),但是遇到“僵死狀態(tài)”的服務(wù)器時(shí)發(fā)出的是宕機(jī)報(bào)警,另外同樣無法區(qū)分“服務(wù)器宕機(jī)”和“服務(wù)器不可達(dá)”狀態(tài);結(jié)合拓?fù)浣Y(jié)構(gòu)判定法直接遠(yuǎn)程探測(cè)法和直接心跳法都無法明確區(qū)分“服務(wù)器宕 機(jī)”和“服務(wù)器不可達(dá)”狀態(tài),部分監(jiān)控系統(tǒng)采用結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu)進(jìn)行綜合判定,但是仍然 存在如下不足1.雖然能區(qū)分“服務(wù)器宕機(jī)”和“服務(wù)器不可達(dá)”狀態(tài),但在報(bào)警展示方面未能將 問題根源和影響范圍明確化,不利于問題的定位和處理;2.沒有實(shí)現(xiàn)“機(jī)房故障”狀態(tài);3.仍然無法明確“服務(wù)器僵死”狀態(tài)。

發(fā)明內(nèi)容
本發(fā)明的目的在于解決上述問題,提供了一種CDN設(shè)備狀態(tài)的監(jiān)控方法,可以明 確判定“服務(wù)器宕機(jī)”狀態(tài)、“服務(wù)器不可達(dá)”狀態(tài)、“服務(wù)器僵死”狀態(tài)、“交換機(jī)宕機(jī)狀態(tài)”、 “機(jī)房故障狀態(tài)”,并針對(duì)各種異常狀態(tài)明確問題根源和影響范圍,為運(yùn)維人員快速定位并 正確處理異常提供了 一個(gè)高效平臺(tái)。本發(fā)明的另一目的在于提供了一種CDN設(shè)備狀態(tài)的監(jiān)控系統(tǒng)。本發(fā)明的技術(shù)方案為本發(fā)明揭示了一種CDN設(shè)備狀態(tài)監(jiān)控方法,包括被監(jiān)控的⑶N設(shè)備周期性地向作為心跳接收端的監(jiān)控服務(wù)器上報(bào)設(shè)備心跳信息;監(jiān)控服務(wù)器上周期性對(duì)被監(jiān)控設(shè)備主動(dòng)進(jìn)行狀態(tài)探測(cè),得到主動(dòng)探測(cè)結(jié)果;綜合監(jiān)控服務(wù)器上收集的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果,結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu)對(duì)設(shè) 備狀態(tài)進(jìn)行判定,并針對(duì)故障根源發(fā)出報(bào)警;將設(shè)備狀態(tài)判定裝置的判定結(jié)果結(jié)合機(jī)房分布和設(shè)備拓?fù)浣Y(jié)構(gòu)作直觀展示,并將 設(shè)備狀態(tài)判定裝置發(fā)出的根源報(bào)警展示于報(bào)警頁面。根據(jù)本發(fā)明的⑶N設(shè)備狀態(tài)監(jiān)控方法的一實(shí)施例,監(jiān)控服務(wù)器有兩臺(tái)。根據(jù)本發(fā)明的⑶N設(shè)備狀態(tài)監(jiān)控方法的一實(shí)施例,監(jiān)控服務(wù)器上對(duì)被監(jiān)控設(shè)備主 動(dòng)進(jìn)行狀態(tài)探測(cè)的過程包括使用snmp探測(cè)工具向所有被監(jiān)控設(shè)備的所有IP發(fā)送snmp請(qǐng)求;將有應(yīng)答的被監(jiān)控設(shè)備加入存活列表,將無應(yīng)答的被監(jiān)控設(shè)備加入無應(yīng)答設(shè)備列 表;使用fping工具對(duì)無應(yīng)答設(shè)備列表中的被監(jiān)控設(shè)備探測(cè)設(shè)備存活狀態(tài),將有應(yīng)答 的被監(jiān)控設(shè)備加入存活列表;根據(jù)存活列表更新被監(jiān)控設(shè)備的存活狀態(tài)。根據(jù)本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控方法的一實(shí)施例,對(duì)設(shè)備狀態(tài)的判定過程包括從兩臺(tái)監(jiān)控服務(wù)器上讀取本周期內(nèi)的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果;針對(duì)兩臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果,在不考慮設(shè)備拓?fù)浣Y(jié)構(gòu)的 情況下將被監(jiān)控設(shè)備的狀態(tài)判定為正常、僵死、宕機(jī)三類;綜合兩臺(tái)監(jiān)控服務(wù)器的判定結(jié)果,重新確定被監(jiān)控設(shè)備的狀態(tài);結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu),將已判定為宕機(jī)的被監(jiān)控設(shè)備重新判定為宕機(jī)和不可達(dá)狀 態(tài);結(jié)合機(jī)房配置信息,判定機(jī)房故障狀態(tài),如果一個(gè)機(jī)房內(nèi)的所有設(shè)備都處于非正常狀態(tài),則該機(jī)房判定為故障狀態(tài);對(duì)宕機(jī)狀態(tài)的被監(jiān)控設(shè)備、僵死狀態(tài)的被監(jiān)控設(shè)備和故障狀態(tài)的機(jī)房發(fā)出報(bào)警, 并明確其影響范圍。根據(jù)本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控方法的一實(shí)施例,在針對(duì)兩臺(tái)監(jiān)控服務(wù)器的設(shè)備 心跳信息和主動(dòng)探測(cè)結(jié)果,在不考慮設(shè)備拓?fù)浣Y(jié)構(gòu)的情況下將被監(jiān)控設(shè)備的狀態(tài)判定為正 常、僵死、宕機(jī)三類的步驟中,包括如果設(shè)備心跳信息為有心跳且主動(dòng)探測(cè)結(jié)果為有應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài) 為正常;如果設(shè)備心跳信息為有心跳且主動(dòng)探測(cè)結(jié)果為無應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài) 為正常;如果設(shè)備心跳信息為無心跳且主動(dòng)探測(cè)結(jié)果為有應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài) 為僵死;如果設(shè)備心跳信息為無心跳且主動(dòng)探測(cè)結(jié)果為無應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài) 為宕機(jī)。根據(jù)本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控方法的一實(shí)施例,綜合兩臺(tái)監(jiān)控服務(wù)器的判定結(jié) 果,重新確定被監(jiān)控設(shè)備的狀態(tài)的步驟包括如果第一臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為有心跳且第二臺(tái)監(jiān)控服務(wù)器的設(shè)備心 跳信息為有心跳,則綜合判定結(jié)果為有心跳;如果第一臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為有心跳且第二臺(tái)監(jiān)控服務(wù)器的設(shè)備心 跳信息為無心跳,則綜合判定結(jié)果為有心跳;如果第一臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為無心跳且第二臺(tái)監(jiān)控服務(wù)器的設(shè)備心 跳信息為有心跳,則綜合判定結(jié)果為有心跳;如果第一臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為無心跳且第二臺(tái)監(jiān)控服務(wù)器的設(shè)備心 跳信息為無心跳,則綜合判定結(jié)果為無心跳;如果第一臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為有應(yīng)答且第二臺(tái)監(jiān)控服務(wù)器的主動(dòng)探 測(cè)結(jié)果為有應(yīng)答,則綜合判定結(jié)果為有應(yīng)答;如果第一臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為有應(yīng)答且第二臺(tái)監(jiān)控服務(wù)器的主動(dòng)探 測(cè)結(jié)果為無應(yīng)答,則綜合判定結(jié)果為有應(yīng)答;如果第一臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為無應(yīng)答且第二臺(tái)監(jiān)控服務(wù)器的主動(dòng)探 測(cè)結(jié)果為有應(yīng)答,則綜合判定結(jié)果為有應(yīng)答;如果第一臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為無應(yīng)答且第二臺(tái)監(jiān)控服務(wù)器的主動(dòng)探 測(cè)結(jié)果為無應(yīng)答,則綜合判定結(jié)果為無應(yīng)答;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正 常,則綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵 死,則綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕 機(jī),則綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常,則綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵 死,則綜合判定結(jié)果為僵死;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕 機(jī),則綜合判定結(jié)果為僵死;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī)且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正 常,則綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī)且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵 死,則綜合判定結(jié)果為僵死;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī)且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕 機(jī),則綜合判定結(jié)果為宕機(jī)。根據(jù)本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控方法的一實(shí)施例,結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu),將已判定 為宕機(jī)的被監(jiān)控設(shè)備重新判定為宕機(jī)和不可達(dá)狀態(tài)的步驟包括遍歷被監(jiān)控設(shè)備列表,查找處于宕機(jī)狀態(tài)的交換機(jī);判斷交換機(jī)下層所有設(shè)備是否都處于宕機(jī)狀態(tài),如果是則將交換機(jī)下層所有設(shè)備 置為不可達(dá)狀態(tài)且本步驟流程結(jié)束,否則判斷非宕機(jī)狀態(tài)的設(shè)備是否為多運(yùn)營商設(shè)備,如 果不是多運(yùn)營商設(shè)備,則監(jiān)控系統(tǒng)內(nèi)部出現(xiàn)異常,發(fā)出一條關(guān)于異?,F(xiàn)象的警告信息但不 改變?nèi)魏卧O(shè)備狀態(tài)且本步驟流程結(jié)束;如果非宕機(jī)狀態(tài)的設(shè)備是多運(yùn)營商設(shè)備,則判斷非宕機(jī)狀態(tài)設(shè)備的與交換機(jī)相同 運(yùn)營商的IP探測(cè)結(jié)果是否為無應(yīng)答,如果為無應(yīng)答,則將交換機(jī)下層所有設(shè)備置為不可達(dá) 狀態(tài),如果為有應(yīng)答,則監(jiān)控系統(tǒng)內(nèi)部出現(xiàn)異常,發(fā)出一條關(guān)于異?,F(xiàn)象的警告信息但不改 變?nèi)魏卧O(shè)備狀態(tài)。根據(jù)本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控方法的一實(shí)施例,對(duì)宕機(jī)狀態(tài)的被監(jiān)控設(shè)備、僵 死狀態(tài)的被監(jiān)控設(shè)備和故障狀態(tài)的機(jī)房發(fā)出報(bào)警,并明確其影響范圍的步驟包括如果被監(jiān)控設(shè)備的狀態(tài)為服務(wù)器宕機(jī)且報(bào)警信息為服務(wù)器宕機(jī),則將影響范圍明 確為本服務(wù)器;如果被監(jiān)控設(shè)備的狀態(tài)為服務(wù)器僵死且報(bào)警信息為服務(wù)器僵死,則將影響范圍明 確為本服務(wù)器;如果被監(jiān)控設(shè)備的狀態(tài)為交換機(jī)宕機(jī)且報(bào)警信息為交換機(jī)宕機(jī),則將影響范圍明 確為該交換機(jī)下層所有處于不可達(dá)狀態(tài)的被監(jiān)控設(shè)備;如果被監(jiān)控設(shè)備的狀態(tài)為機(jī)房故障且報(bào)警信息為機(jī)房故障,則將影響范圍明確為 該機(jī)房內(nèi)的所有設(shè)備。本發(fā)明還揭示了一種⑶N設(shè)備狀態(tài)監(jiān)控系統(tǒng),包括被監(jiān)控設(shè)備、監(jiān)控服務(wù)器、設(shè)備 狀態(tài)判定裝置以及設(shè)備狀態(tài)展示裝置,監(jiān)控服務(wù)器中設(shè)有心跳接收端和主動(dòng)探測(cè)模塊,其 中被監(jiān)控設(shè)備,周期性地向監(jiān)控服務(wù)器的心跳接收端上報(bào)設(shè)備心跳信息;心跳接收端,接收被監(jiān)控設(shè)備上報(bào)的設(shè)備心跳信息;主動(dòng)探測(cè)模塊,周期性地對(duì)被監(jiān)控設(shè)備進(jìn)行狀態(tài)探測(cè),得到主動(dòng)探測(cè)結(jié)果;設(shè)備判定裝置,和監(jiān)控服務(wù)器建立數(shù)據(jù)通訊,綜合監(jiān)控服務(wù)器上收集的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果,結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu)對(duì)設(shè)備狀態(tài)進(jìn)行判定,并針對(duì)故障根源發(fā)出報(bào) m.
θ ,設(shè)備狀態(tài)展示裝置,和設(shè)備判定裝置建立數(shù)據(jù)通訊,將設(shè)備狀態(tài)判定裝置的判定 結(jié)果結(jié)合機(jī)房分布和設(shè)備拓?fù)浣Y(jié)構(gòu)作直觀展示,并將設(shè)備狀態(tài)判定裝置發(fā)出的根源報(bào)警展 示于報(bào)警頁面。根據(jù)本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控系統(tǒng)的一實(shí)施例,監(jiān)控服務(wù)器有兩臺(tái),均用于收 集被監(jiān)控設(shè)備的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果并和設(shè)備狀態(tài)判定裝置建立通訊連接。根據(jù)本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控系統(tǒng)的一實(shí)施例,系統(tǒng)具有多個(gè)設(shè)備狀態(tài)判定裝 置、監(jiān)控服務(wù)器和被監(jiān)控設(shè)備集合的結(jié)構(gòu),這些結(jié)構(gòu)統(tǒng)一連接同一個(gè)設(shè)備狀態(tài)展示裝置。本發(fā)明對(duì)比現(xiàn)有技術(shù)有如下的有益效果本發(fā)明是設(shè)備監(jiān)控系統(tǒng)的一個(gè)子系統(tǒng), 該發(fā)明面向企業(yè)及大規(guī)模設(shè)備群,可以同時(shí)監(jiān)控萬臺(tái)以上設(shè)備,并高效準(zhǔn)確地判定設(shè)備的 存活狀態(tài)。本發(fā)明采用主動(dòng)探測(cè)法和心跳法相結(jié)合,可以明確區(qū)分服務(wù)器僵死狀態(tài)。本發(fā) 明中的服務(wù)宕機(jī)判定技術(shù)用于明確區(qū)分服務(wù)器宕機(jī)、僵死和不可達(dá),向運(yùn)維人員發(fā)出最精 準(zhǔn)的報(bào)警信息。本發(fā)明的交換機(jī)宕機(jī)判定技術(shù)可以明確判定交換機(jī)宕機(jī)狀態(tài)和影響范圍。 在某臺(tái)交換機(jī)宕機(jī)時(shí)只發(fā)出交換機(jī)宕機(jī)報(bào)警,其下的所有設(shè)備是該報(bào)警的影響范圍。本發(fā) 明的機(jī)房故障判定技術(shù)可以明確判定出機(jī)房故障和影響范圍。在某機(jī)房故障時(shí),發(fā)出針對(duì) 該機(jī)房的故障報(bào)警,該機(jī)房內(nèi)的所有設(shè)備是該報(bào)警的影響范圍。本發(fā)明可以實(shí)現(xiàn)全國設(shè)備 狀況總覽,以中國地圖方式直觀展示分布于全國的個(gè)節(jié)點(diǎn)設(shè)備狀況,結(jié)合故障設(shè)備報(bào)表讓 運(yùn)維人員從全局掌控公司各設(shè)備狀況。本發(fā)明中的綜合報(bào)警分析,基于各設(shè)備狀況判定技 術(shù)和設(shè)備拓?fù)浣Y(jié)構(gòu),確定各設(shè)備異常的根源和影響范圍,針對(duì)根源發(fā)出報(bào)警,方便運(yùn)維人員 處理問題。本發(fā)明中的雙重確認(rèn)技術(shù),規(guī)避單點(diǎn)監(jiān)控受網(wǎng)絡(luò)因素干擾造成的誤判問題。本 發(fā)明中的高效設(shè)備探測(cè)技術(shù)可以輕松實(shí)現(xiàn)單臺(tái)服務(wù)器1分鐘主動(dòng)探測(cè)2萬臺(tái)設(shè)備狀態(tài),大 大提高了系統(tǒng)的檢測(cè)能力。本發(fā)明中的分布式監(jiān)控,可以讓該系統(tǒng)無限擴(kuò)展,適合用于企業(yè) 級(jí)大規(guī)模監(jiān)控。


圖1示例性的示出了本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控方法的實(shí)施例的流程圖。圖2示例性的示出了本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控方法中主動(dòng)探測(cè)步驟的細(xì)化流程 圖。圖3示例性的示出了本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控方法中設(shè)備狀態(tài)判定步驟的細(xì)化 流程圖。圖4示例性的示出了本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控方法中結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu)重新判 定宕機(jī)和不可達(dá)狀態(tài)的步驟的細(xì)化流程圖。圖5示例性的示出了本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控系統(tǒng)的實(shí)施例的結(jié)構(gòu)圖。圖6示例性的示出了本發(fā)明的分布式CDN設(shè)備狀態(tài)監(jiān)控系統(tǒng)的實(shí)施例的結(jié)構(gòu)圖。圖7示例性的示出了本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控系統(tǒng)的另一實(shí)施例的結(jié)構(gòu)圖。
具體實(shí)施例方式下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的描述。
9
CDN設(shè)備狀杰監(jiān)控方法的實(shí)施例圖1示出了本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控方法的實(shí)施例的流程。請(qǐng)參見圖1,下面是 對(duì)本實(shí)施例的方法中各個(gè)步驟的詳細(xì)描述。步驟SlO 被監(jiān)控的⑶N設(shè)備周期性地向作為心跳接收端的監(jiān)控服務(wù)器上報(bào)設(shè)備
心跳信息。步驟S20 監(jiān)控服務(wù)器上周期性對(duì)被監(jiān)控設(shè)備主動(dòng)進(jìn)行狀態(tài)探測(cè),得到主動(dòng)探測(cè)結(jié)果。主動(dòng)探測(cè)的步驟如圖2所示,請(qǐng)同時(shí)參見圖2。步驟S200 使用snmp探測(cè)工具向所有被監(jiān)控設(shè)備的所有IP發(fā)送snmp請(qǐng)求。使用snmp探測(cè)工具可以達(dá)到2萬臺(tái)/分鐘的探測(cè)規(guī)模。步驟S201 判斷snmp請(qǐng)求是否發(fā)送結(jié)束,如果已經(jīng)結(jié)束則進(jìn)入步驟S205,如果沒 有結(jié)束則進(jìn)入步驟S204。步驟S202 判斷被監(jiān)控設(shè)備是否有應(yīng)答,如果有應(yīng)答則進(jìn)入步驟S204,如果沒有 應(yīng)答則進(jìn)入步驟S203。步驟S203 將被監(jiān)控設(shè)備加入無應(yīng)答設(shè)備列表。步驟S204 將被監(jiān)控設(shè)備加入存活列表。步驟S205 使用fping工具對(duì)無應(yīng)答設(shè)備列表中的被監(jiān)控設(shè)備探測(cè)設(shè)備存活狀 態(tài)。步驟S206 將有應(yīng)答的被監(jiān)控設(shè)備加入存活列表。步驟S207 根據(jù)存活列表更新被監(jiān)控設(shè)備的設(shè)備存活狀態(tài)。步驟S30 綜合監(jiān)控服務(wù)器上收集的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果,結(jié)合設(shè)備拓 撲結(jié)構(gòu)對(duì)設(shè)備狀態(tài)進(jìn)行判定,并針對(duì)故障根源發(fā)出報(bào)警。步驟S30的細(xì)化流程如圖3所示。步驟S301 從兩臺(tái)監(jiān)控服務(wù)器上讀取本周期內(nèi)的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果。步驟S302 針對(duì)兩臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果,在不考慮設(shè)備 拓?fù)浣Y(jié)構(gòu)的情況下將被監(jiān)控設(shè)備的狀態(tài)判定為正常、僵死、宕機(jī)三類。如果設(shè)備心跳信息為有心跳且主動(dòng)探測(cè)結(jié)果為有應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài) 為正常;如果設(shè)備心跳信息為有心跳且主動(dòng)探測(cè)結(jié)果為無應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài) 為正常;如果設(shè)備心跳信息為無心跳且主動(dòng)探測(cè)結(jié)果為有應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài) 為僵死;如果設(shè)備心跳信息為無心跳且主動(dòng)探測(cè)結(jié)果為無應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài) 為宕機(jī)。步驟S303 綜合兩臺(tái)監(jiān)控服務(wù)器的判定結(jié)果,重新確定被監(jiān)控設(shè)備的狀態(tài)。如果第一臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為有心跳且第二臺(tái)監(jiān)控服務(wù)器的設(shè)備心 跳信息為有心跳,則綜合判定結(jié)果為有心跳;如果第一臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為有 心跳且第二臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為無心跳,則綜合判定結(jié)果為有心跳;如果第一 臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為無心跳且第二臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為有心跳,則 綜合判定結(jié)果為有心跳;如果第一臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為無心跳且第二臺(tái)監(jiān)控服 務(wù)器的設(shè)備心跳信息為無心跳,則綜合判定結(jié)果為無心跳。如果第一臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為有應(yīng)答且第二臺(tái)監(jiān)控服務(wù)器的主動(dòng)探
10測(cè)結(jié)果為有應(yīng)答,則綜合判定結(jié)果為有應(yīng)答;如果第一臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為有 應(yīng)答且第二臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為無應(yīng)答,則綜合判定結(jié)果為有應(yīng)答;如果第一 臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為無應(yīng)答且第二臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為有應(yīng)答,則 綜合判定結(jié)果為有應(yīng)答;如果第一臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為無應(yīng)答且第二臺(tái)監(jiān)控服 務(wù)器的主動(dòng)探測(cè)結(jié)果為無應(yīng)答,則綜合判定結(jié)果為無應(yīng)答。如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正 常,則綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常且第二臺(tái)監(jiān)控服務(wù) 器的判定結(jié)果為僵死,則綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常 且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī),則綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器 的判定結(jié)果為僵死且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常,則綜合判定結(jié)果為正常;如果 第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死,則綜合判定 結(jié)果為僵死;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為 宕機(jī),則綜合判定結(jié)果為僵死;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī)且第二臺(tái)監(jiān)控服 務(wù)器的判定結(jié)果為正常,則綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕 機(jī)且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死,則綜合判定結(jié)果為僵死;如果第一臺(tái)監(jiān)控服務(wù) 器的判定結(jié)果為宕機(jī)且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī),則綜合判定結(jié)果為宕機(jī)。步驟S304 結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu),將已判定為宕機(jī)的被監(jiān)控設(shè)備重新判定為宕機(jī)和 不可達(dá)狀態(tài)。步驟S304的細(xì)化流程如圖4所示。步驟S500 遍歷被監(jiān)控設(shè)備列表,查找處于宕機(jī)狀態(tài)的交換機(jī)。步驟S501 判斷交換機(jī)下層所有設(shè)備是否都處于宕機(jī)狀態(tài),如果是則進(jìn)入步驟 S505,否則進(jìn)入步驟S502。步驟S502:判斷非宕機(jī)狀態(tài)的設(shè)備是否為多運(yùn)營商設(shè)備,如果是則進(jìn)入步驟 S504,否則進(jìn)入步驟S503。步驟S503 監(jiān)控系統(tǒng)內(nèi)部出現(xiàn)異常(通常為拓?fù)浣Y(jié)構(gòu)配置錯(cuò)誤),發(fā)出一條關(guān)于該 現(xiàn)象的警告信息,不改變?nèi)魏卧O(shè)備狀態(tài)。步驟S504 判斷非宕機(jī)狀態(tài)設(shè)備的與交換機(jī)相同運(yùn)營商的IP探測(cè)結(jié)果為無應(yīng)答。步驟S505 將交換機(jī)下層所有設(shè)備置為不可達(dá)狀態(tài)。步驟S305 結(jié)合機(jī)房配置信息,判定機(jī)房故障狀態(tài),如果一個(gè)機(jī)房內(nèi)的所有設(shè)備 都處于非正常狀態(tài),則該機(jī)房判定為故障狀態(tài)。步驟S306 對(duì)宕機(jī)狀態(tài)的被監(jiān)控設(shè)備、僵死狀態(tài)的被監(jiān)控設(shè)備和故障狀態(tài)的機(jī)房 發(fā)出報(bào)警,并明確其影響范圍。如果被監(jiān)控設(shè)備的狀態(tài)為服務(wù)器宕機(jī)且報(bào)警信息為服務(wù)器宕機(jī),則將影響范圍明 確為本服務(wù)器;如果被監(jiān)控設(shè)備的狀態(tài)為服務(wù)器僵死且報(bào)警信息為服務(wù)器僵死,則將影響 范圍明確為本服務(wù)器;如果被監(jiān)控設(shè)備的狀態(tài)為交換機(jī)宕機(jī)且報(bào)警信息為交換機(jī)宕機(jī),則 將影響范圍明確為該交換機(jī)下層所有處于不可達(dá)狀態(tài)的被監(jiān)控設(shè)備;如果被監(jiān)控設(shè)備的狀 態(tài)為機(jī)房故障且報(bào)警信息為機(jī)房故障,則將影響范圍明確為該機(jī)房內(nèi)的所有設(shè)備。步驟S40 將設(shè)備狀態(tài)判定裝置的判定結(jié)果結(jié)合機(jī)房分布和設(shè)備拓?fù)浣Y(jié)構(gòu)作直觀 展示,并將設(shè)備狀態(tài)判定裝置發(fā)出的根源報(bào)警展示于報(bào)警頁面。
CDN設(shè)備狀杰監(jiān)控系統(tǒng)的實(shí)施例圖5示出了本發(fā)明的CDN設(shè)備狀態(tài)監(jiān)控系統(tǒng)的實(shí)施例。請(qǐng)參見圖5,本實(shí)施例的監(jiān) 控系統(tǒng)包括被監(jiān)控設(shè)備10、兩臺(tái)監(jiān)控服務(wù)器12、一臺(tái)設(shè)備狀態(tài)判定裝置14以及一臺(tái)設(shè)備 狀態(tài)展示裝置16,監(jiān)控服務(wù)器12中設(shè)有心跳接收端120和主動(dòng)探測(cè)模塊122。這些模塊之間的數(shù)據(jù)通訊關(guān)系是被監(jiān)控設(shè)備10輸出到心跳接收端120,主動(dòng)探 測(cè)模塊12輸出到被監(jiān)控設(shè)備10,設(shè)備狀態(tài)判定裝置14輸出到兩臺(tái)監(jiān)控服務(wù)器12,兩臺(tái)監(jiān) 控服務(wù)器12輸出到設(shè)備狀態(tài)展示裝置16。被監(jiān)控設(shè)備10周期性地向監(jiān)控服務(wù)器12的心跳接收端120上報(bào)設(shè)備心跳信息。心跳接收端120接收被監(jiān)控設(shè)備10上報(bào)的設(shè)備心跳信息。主動(dòng)探測(cè)模塊122周期性地對(duì)被監(jiān)控設(shè)備10進(jìn)行狀態(tài)探測(cè),得到主動(dòng)探測(cè)結(jié)果。設(shè)備判定裝置14綜合監(jiān)控服務(wù)器12上收集的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果,結(jié) 合設(shè)備拓?fù)浣Y(jié)構(gòu)對(duì)設(shè)備狀態(tài)進(jìn)行判定,并針對(duì)故障根源發(fā)出報(bào)警。設(shè)備狀態(tài)展示裝置16將設(shè)備狀態(tài)判定裝置14的判定結(jié)果結(jié)合機(jī)房分布和設(shè)備拓 撲結(jié)構(gòu)作直觀展示,并將設(shè)備狀態(tài)判定裝置發(fā)出的根源報(bào)警展示于報(bào)警頁面。這些裝置和模塊之間的數(shù)據(jù)傳輸和運(yùn)作,在上面方法實(shí)施例中已有詳細(xì)的描述, 在此不再贅述。本實(shí)施例的系統(tǒng)有一些變形,請(qǐng)參見圖6,系統(tǒng)可以是分布式的結(jié)構(gòu),S卩,系統(tǒng)可以 有多個(gè)設(shè)備狀態(tài)判定裝置、監(jiān)控服務(wù)器、被監(jiān)控設(shè)備集合的結(jié)構(gòu),這些結(jié)構(gòu)統(tǒng)一連接同一個(gè) 設(shè)備狀態(tài)展示裝置。此外,還可以設(shè)置一臺(tái)監(jiān)控服務(wù)器,如圖7所示,在圖7中,只有一臺(tái)監(jiān)控服務(wù)器參 與運(yùn)作。上述實(shí)施例是提供給本領(lǐng)域普通技術(shù)人員來實(shí)現(xiàn)或使用本發(fā)明的,本領(lǐng)域普通技 術(shù)人員可在不脫離本發(fā)明的發(fā)明思想的情況下,對(duì)上述實(shí)施例做出種種修改或變化,因而 本發(fā)明的保護(hù)范圍并不被上述實(shí)施例所限,而應(yīng)該是符合權(quán)利要求書提到的創(chuàng)新性特征的 最大范圍。
權(quán)利要求
1.一種⑶N設(shè)備狀態(tài)監(jiān)控方法,包括被監(jiān)控的CDN設(shè)備周期性地向作為心跳接收端的監(jiān)控服務(wù)器上報(bào)設(shè)備心跳信息; 監(jiān)控服務(wù)器上周期性對(duì)被監(jiān)控設(shè)備主動(dòng)進(jìn)行狀態(tài)探測(cè),得到主動(dòng)探測(cè)結(jié)果; 綜合監(jiān)控服務(wù)器上收集的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果,結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu)對(duì)設(shè)備狀 態(tài)進(jìn)行判定,并針對(duì)故障根源發(fā)出報(bào)警;將設(shè)備狀態(tài)判定裝置的判定結(jié)果結(jié)合機(jī)房分布和設(shè)備拓?fù)浣Y(jié)構(gòu)作直觀展示,并將設(shè)備 狀態(tài)判定裝置發(fā)出的根源報(bào)警展示于報(bào)警頁面。
2.根據(jù)權(quán)利要求1所述的CDN設(shè)備狀態(tài)監(jiān)控方法,其特征在于,監(jiān)控服務(wù)器有兩臺(tái)。
3.根據(jù)權(quán)利要求2所述的⑶N設(shè)備狀態(tài)監(jiān)控方法,其特征在于,監(jiān)控服務(wù)器上對(duì)被監(jiān)控 設(shè)備主動(dòng)進(jìn)行狀態(tài)探測(cè)的過程包括使用snmp探測(cè)工具向所有被監(jiān)控設(shè)備的所有IP發(fā)送snmp請(qǐng)求; 將有應(yīng)答的被監(jiān)控設(shè)備加入存活列表,將無應(yīng)答的被監(jiān)控設(shè)備加入無應(yīng)答設(shè)備列表; 使用fping工具對(duì)無應(yīng)答設(shè)備列表中的被監(jiān)控設(shè)備探測(cè)設(shè)備存活狀態(tài),將有應(yīng)答的被 監(jiān)控設(shè)備加入存活列表;根據(jù)存活列表更新被監(jiān)控設(shè)備的存活狀態(tài)。
4.根據(jù)權(quán)利要求2所述的CDN設(shè)備狀態(tài)監(jiān)控方法,其特征在于,對(duì)設(shè)備狀態(tài)的判定過程 包括從兩臺(tái)監(jiān)控服務(wù)器上讀取本周期內(nèi)的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果; 針對(duì)兩臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果,在不考慮設(shè)備拓?fù)浣Y(jié)構(gòu)的情況 下將被監(jiān)控設(shè)備的狀態(tài)判定為正常、僵死、宕機(jī)三類;綜合兩臺(tái)監(jiān)控服務(wù)器的判定結(jié)果,重新確定被監(jiān)控設(shè)備的狀態(tài); 結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu),將已判定為宕機(jī)的被監(jiān)控設(shè)備重新判定為宕機(jī)和不可達(dá)狀態(tài); 結(jié)合機(jī)房配置信息,判定機(jī)房故障狀態(tài),如果一個(gè)機(jī)房內(nèi)的所有設(shè)備都處于非正常狀 態(tài),則該機(jī)房判定為故障狀態(tài);對(duì)宕機(jī)狀態(tài)的被監(jiān)控設(shè)備、僵死狀態(tài)的被監(jiān)控設(shè)備和故障狀態(tài)的機(jī)房發(fā)出報(bào)警,并明 確其影響范圍。
5.根據(jù)權(quán)利要求4所述的CDN設(shè)備狀態(tài)監(jiān)控方法,其特征在于,在針對(duì)兩臺(tái)監(jiān)控服務(wù)器 的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果,在不考慮設(shè)備拓?fù)浣Y(jié)構(gòu)的情況下將被監(jiān)控設(shè)備的狀態(tài)判 定為正常、僵死、宕機(jī)三類的步驟中,包括如果設(shè)備心跳信息為有心跳且主動(dòng)探測(cè)結(jié)果為有應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài)為正常;如果設(shè)備心跳信息為有心跳且主動(dòng)探測(cè)結(jié)果為無應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài)為正常;如果設(shè)備心跳信息為無心跳且主動(dòng)探測(cè)結(jié)果為有應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài)為僵死;如果設(shè)備心跳信息為無心跳且主動(dòng)探測(cè)結(jié)果為無應(yīng)答,則判斷被監(jiān)控設(shè)備的狀態(tài)為宕機(jī)。
6.根據(jù)權(quán)利要求4所述的CDN設(shè)備狀態(tài)監(jiān)控方法,其特征在于,綜合兩臺(tái)監(jiān)控服務(wù)器的 判定結(jié)果,重新確定被監(jiān)控設(shè)備的狀態(tài)的步驟包括如果第一臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為有心跳且第二臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信 息為有心跳,則綜合判定結(jié)果為有心跳;如果第一臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為有心跳且第二臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信 息為無心跳,則綜合判定結(jié)果為有心跳;如果第一臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為無心跳且第二臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信 息為有心跳,則綜合判定結(jié)果為有心跳;如果第一臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信息為無心跳且第二臺(tái)監(jiān)控服務(wù)器的設(shè)備心跳信 息為無心跳,則綜合判定結(jié)果為無心跳;如果第一臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為有應(yīng)答且第二臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié) 果為有應(yīng)答,則綜合判定結(jié)果為有應(yīng)答;如果第一臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為有應(yīng)答且第二臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié) 果為無應(yīng)答,則綜合判定結(jié)果為有應(yīng)答;如果第一臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為無應(yīng)答且第二臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié) 果為有應(yīng)答,則綜合判定結(jié)果為有應(yīng)答;如果第一臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié)果為無應(yīng)答且第二臺(tái)監(jiān)控服務(wù)器的主動(dòng)探測(cè)結(jié) 果為無應(yīng)答,則綜合判定結(jié)果為無應(yīng)答;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常,則 綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死,則 綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī),則 綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常,則 綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死,則 綜合判定結(jié)果為僵死;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī),則 綜合判定結(jié)果為僵死;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī)且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為正常,則 綜合判定結(jié)果為正常;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī)且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為僵死,則 綜合判定結(jié)果為僵死;如果第一臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī)且第二臺(tái)監(jiān)控服務(wù)器的判定結(jié)果為宕機(jī),則 綜合判定結(jié)果為宕機(jī)。
7.根據(jù)權(quán)利要求4所述的CDN設(shè)備狀態(tài)監(jiān)控方法,其特征在于,結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu),將 已判定為宕機(jī)的被監(jiān)控設(shè)備重新判定為宕機(jī)和不可達(dá)狀態(tài)的步驟包括 遍歷被監(jiān)控設(shè)備列表,查找處于宕機(jī)狀態(tài)的交換機(jī);判斷交換機(jī)下層所有設(shè)備是否都處于宕機(jī)狀態(tài),如果是則將交換機(jī)下層所有設(shè)備置為 不可達(dá)狀態(tài)且本步驟流程結(jié)束,否則判斷非宕機(jī)狀態(tài)的設(shè)備是否為多運(yùn)營商設(shè)備,如果不是多運(yùn)營商設(shè)備,則監(jiān)控系統(tǒng)內(nèi)部出現(xiàn)異常,發(fā)出一條關(guān)于異?,F(xiàn)象的警告信息但不改變 任何設(shè)備狀態(tài)且本步驟流程結(jié)束;如果非宕機(jī)狀態(tài)的設(shè)備是多運(yùn)營商設(shè)備,則判斷非宕機(jī)狀態(tài)設(shè)備的與交換機(jī)相同運(yùn) 營商的IP探測(cè)結(jié)果是否為無應(yīng)答,如果為無應(yīng)答,則將交換機(jī)下層所有設(shè)備置為不可達(dá)狀 態(tài),如果為有應(yīng)答,則監(jiān)控系統(tǒng)內(nèi)部出現(xiàn)異常,發(fā)出一條關(guān)于異?,F(xiàn)象的警告信息但不改變 任何設(shè)備狀態(tài)。
8.根據(jù)權(quán)利要求4所述的CDN設(shè)備狀態(tài)監(jiān)控方法,其特征在于,對(duì)宕機(jī)狀態(tài)的被監(jiān)控設(shè) 備、僵死狀態(tài)的被監(jiān)控設(shè)備和故障狀態(tài)的機(jī)房發(fā)出報(bào)警,并明確其影響范圍的步驟包括如果被監(jiān)控設(shè)備的狀態(tài)為服務(wù)器宕機(jī)且報(bào)警信息為服務(wù)器宕機(jī),則將影響范圍明確為 本服務(wù)器;如果被監(jiān)控設(shè)備的狀態(tài)為服務(wù)器僵死且報(bào)警信息為服務(wù)器僵死,則將影響范圍明確為 本服務(wù)器;如果被監(jiān)控設(shè)備的狀態(tài)為交換機(jī)宕機(jī)且報(bào)警信息為交換機(jī)宕機(jī),則將影響范圍明確為 該交換機(jī)下層所有處于不可達(dá)狀態(tài)的被監(jiān)控設(shè)備;如果被監(jiān)控設(shè)備的狀態(tài)為機(jī)房故障且報(bào)警信息為機(jī)房故障,則將影響范圍明確為該機(jī) 房內(nèi)的所有設(shè)備。
9.一種CDN設(shè)備狀態(tài)監(jiān)控系統(tǒng),包括被監(jiān)控設(shè)備、監(jiān)控服務(wù)器、設(shè)備狀態(tài)判定裝置以及 設(shè)備狀態(tài)展示裝置,監(jiān)控服務(wù)器中設(shè)有心跳接收端和主動(dòng)探測(cè)模塊,其中被監(jiān)控設(shè)備,周期性地向監(jiān)控服務(wù)器的心跳接收端上報(bào)設(shè)備心跳信息;心跳接收端,接收被監(jiān)控設(shè)備上報(bào)的設(shè)備心跳信息;主動(dòng)探測(cè)模塊,周期性地對(duì)被監(jiān)控設(shè)備進(jìn)行狀態(tài)探測(cè),得到主動(dòng)探測(cè)結(jié)果;設(shè)備判定裝置,和監(jiān)控服務(wù)器建立數(shù)據(jù)通訊,綜合監(jiān)控服務(wù)器上收集的設(shè)備心跳信息 和主動(dòng)探測(cè)結(jié)果,結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu)對(duì)設(shè)備狀態(tài)進(jìn)行判定,并針對(duì)故障根源發(fā)出報(bào)警;設(shè)備狀態(tài)展示裝置,和設(shè)備判定裝置建立數(shù)據(jù)通訊,將設(shè)備狀態(tài)判定裝置的判定結(jié)果 結(jié)合機(jī)房分布和設(shè)備拓?fù)浣Y(jié)構(gòu)作直觀展示,并將設(shè)備狀態(tài)判定裝置發(fā)出的根源報(bào)警展示于 報(bào)警頁面。
10.根據(jù)權(quán)利要求9所述的CDN設(shè)備狀態(tài)監(jiān)控系統(tǒng),其特征在于,監(jiān)控服務(wù)器有兩臺(tái),均 用于收集被監(jiān)控設(shè)備的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果并和設(shè)備狀態(tài)判定裝置建立通訊連 接。
11.根據(jù)權(quán)利要求10所述的CDN設(shè)備狀態(tài)監(jiān)控系統(tǒng),其特征在于,系統(tǒng)具有多個(gè)設(shè)備狀 態(tài)判定裝置、監(jiān)控服務(wù)器和被監(jiān)控設(shè)備集合的結(jié)構(gòu),這些結(jié)構(gòu)統(tǒng)一連接同一個(gè)設(shè)備狀態(tài)展 示裝置。
全文摘要
本發(fā)明公開了CDN設(shè)備狀態(tài)監(jiān)控方法和系統(tǒng),為運(yùn)維人員快速定位并正確處理異常提供了一個(gè)高效平臺(tái)。其技術(shù)方案為方法包括被監(jiān)控的CDN設(shè)備周期性地向作為心跳接收端的監(jiān)控服務(wù)器上報(bào)設(shè)備心跳信息;監(jiān)控服務(wù)器上周期性對(duì)被監(jiān)控設(shè)備主動(dòng)進(jìn)行狀態(tài)探測(cè),得到主動(dòng)探測(cè)結(jié)果;綜合監(jiān)控服務(wù)器上收集的設(shè)備心跳信息和主動(dòng)探測(cè)結(jié)果,結(jié)合設(shè)備拓?fù)浣Y(jié)構(gòu)對(duì)設(shè)備狀態(tài)進(jìn)行判定,并針對(duì)故障根源發(fā)出報(bào)警;將設(shè)備狀態(tài)判定裝置的判定結(jié)果結(jié)合機(jī)房分布和設(shè)備拓?fù)浣Y(jié)構(gòu)作直觀展示,并將設(shè)備狀態(tài)判定裝置發(fā)出的根源報(bào)警展示于報(bào)警頁面。
文檔編號(hào)H04L12/24GK102111310SQ20101062216
公開日2011年6月29日 申請(qǐng)日期2010年12月31日 優(yōu)先權(quán)日2010年12月31日
發(fā)明者劉成彥, 洪珂, 苗輝 申請(qǐng)人:網(wǎng)宿科技股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
库尔勒市| 阜宁县| 高台县| 天峨县| 双牌县| 新乡县| 高唐县| 耿马| 宜兰县| 泸定县| 沙河市| 邹城市| 收藏| 双鸭山市| 光山县| 平南县| 济源市| 淮北市| 舒兰市| 崇文区| 喀什市| 崇左市| 建昌县| 海淀区| 顺昌县| 民丰县| 宣化县| 林口县| 太康县| 古田县| 宁晋县| 五寨县| 金溪县| 南川市| 大渡口区| 拉萨市| 衡山县| 陈巴尔虎旗| 平顺县| 神农架林区| 诏安县|