線上業(yè)務(wù)巡檢方法、系統(tǒng)及裝置制造方法
【專利摘要】本發(fā)明提出一種線上業(yè)務(wù)巡檢方法、系統(tǒng)及裝置,其中方法包括:預(yù)先在需要進(jìn)行業(yè)務(wù)巡檢的各個(gè)業(yè)務(wù)機(jī)器中部署業(yè)務(wù)巡檢代理,業(yè)務(wù)巡檢代理按照預(yù)先設(shè)定的巡檢更新周期下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期;業(yè)務(wù)巡檢代理按照各個(gè)巡檢項(xiàng)程序的巡檢周期運(yùn)行本地保存的巡檢項(xiàng)程序。本發(fā)明能夠保證實(shí)時(shí)有效地進(jìn)行業(yè)務(wù)巡檢,方便運(yùn)營(yíng)維護(hù)。
【專利說(shuō)明】線上業(yè)務(wù)巡檢方法、系統(tǒng)及裝置
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及巡檢系統(tǒng)【技術(shù)領(lǐng)域】,尤其涉及一種線上業(yè)務(wù)巡檢方法、系統(tǒng)及裝置。
【背景技術(shù)】
[0002]現(xiàn)有的巡檢系統(tǒng)一般采用如下兩種巡檢方式:
[0003]第一種,集中掃描方式。即由一臺(tái)管理機(jī)器定期推送巡檢項(xiàng)程序到業(yè)務(wù)機(jī)器,管理機(jī)器遠(yuǎn)程執(zhí)行巡檢項(xiàng)程序,并取回巡檢項(xiàng)程序的執(zhí)行結(jié)果。
[0004]第二種,Crontab驅(qū)動(dòng)方式。即在業(yè)務(wù)機(jī)器上將巡檢項(xiàng)程序加入到系統(tǒng)Crontab,由系統(tǒng)Crontab定期驅(qū)動(dòng)執(zhí)行巡檢項(xiàng)程序,然后上報(bào)巡檢項(xiàng)程序的執(zhí)行結(jié)果。
[0005]上述兩種方式存在如下問(wèn)題:
[0006]第一,針對(duì)集中掃描方式:整個(gè)過(guò)程需要下發(fā)巡檢項(xiàng)程序,并遠(yuǎn)程執(zhí)行指令,在此過(guò)程中常常會(huì)出現(xiàn)其他情況,如密碼錯(cuò)誤、網(wǎng)絡(luò)延時(shí)等導(dǎo)致遠(yuǎn)程執(zhí)行命令失敗;并且整個(gè)掃描過(guò)程步驟較多,從而導(dǎo)致巡檢項(xiàng)程序的執(zhí)行時(shí)間精確度不夠。
[0007]第二,針對(duì)Crontab驅(qū)動(dòng)方式:添加巡檢項(xiàng)程序的過(guò)程繁瑣,而且添加巡檢項(xiàng)程序也可能帶來(lái)一些風(fēng)險(xiǎn);系統(tǒng)Crontab有可能異常停止工作而導(dǎo)致業(yè)務(wù)巡檢失敗等;此方式不夠靈活,不方便運(yùn)營(yíng)維護(hù)。
[0008]第三,針對(duì)上述兩種方式:巡檢項(xiàng)程序的更新較為繁瑣。如有一批業(yè)務(wù)機(jī)器的巡檢項(xiàng)程序需要更新到新版本時(shí),需要手工操作更新業(yè)務(wù)巡檢項(xiàng)程序,如有網(wǎng)絡(luò)問(wèn)題或機(jī)器問(wèn)題等當(dāng)時(shí)更新不了,還需要等問(wèn)題解決之后,再次手工進(jìn)行更新。
【發(fā)明內(nèi)容】
[0009]本發(fā)明提供了一種線上業(yè)務(wù)巡檢方法,能夠保證實(shí)時(shí)有效地進(jìn)行業(yè)務(wù)巡檢,方便運(yùn)營(yíng)維護(hù)。
[0010]本發(fā)明還提供了一種線上業(yè)務(wù)巡檢系統(tǒng)以及一種用于實(shí)現(xiàn)線上業(yè)務(wù)巡檢的業(yè)務(wù)巡檢代理、參數(shù)服務(wù)器及狀態(tài)服務(wù)器,能夠保證實(shí)時(shí)有效地進(jìn)行業(yè)務(wù)巡檢,方便運(yùn)營(yíng)維護(hù)。
[0011]本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
[0012]一種線上業(yè)務(wù)巡檢方法,預(yù)先在需要進(jìn)行業(yè)務(wù)巡檢的各個(gè)業(yè)務(wù)機(jī)器中部署業(yè)務(wù)巡檢代理,所述方法包括:
[0013]業(yè)務(wù)巡檢代理按照預(yù)先設(shè)定的巡檢更新周期下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期;
[0014]業(yè)務(wù)巡檢代理按照各個(gè)巡檢項(xiàng)程序的巡檢周期運(yùn)行本地保存的巡檢項(xiàng)程序。
[0015]上述方法中,業(yè)務(wù)巡檢代理從參數(shù)服務(wù)器下載業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序;所述業(yè)務(wù)巡檢配置文件由參數(shù)服務(wù)器根據(jù)人工輸入的巡檢策略自動(dòng)生成,所述巡檢項(xiàng)程序由人工上傳或者通過(guò)在線編輯。
[0016]上述方法可以進(jìn)一步包括:業(yè)務(wù)巡檢代理按照預(yù)先設(shè)定的心跳上報(bào)周期將業(yè)務(wù)機(jī)器的心跳消息上報(bào)至狀態(tài)服務(wù)器;
[0017]狀態(tài)服務(wù)器針對(duì)各個(gè)業(yè)務(wù)機(jī)器,判斷當(dāng)前時(shí)間距離上次收到業(yè)務(wù)機(jī)器心跳消息的時(shí)間間隔是否大于預(yù)先設(shè)定的閾值,如果是,則查詢?cè)摌I(yè)務(wù)機(jī)器是否已下線,如果未下線,則給出針對(duì)該業(yè)務(wù)機(jī)器的告警信息;如果已下線,則通知所述參數(shù)服務(wù)器刪除針對(duì)所述業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
[0018]一種線上業(yè)務(wù)巡檢系統(tǒng),包括參數(shù)服務(wù)器及部署于一個(gè)以上業(yè)務(wù)機(jī)器中的一個(gè)以上業(yè)務(wù)巡檢代理;其中,
[0019]業(yè)務(wù)巡檢代理用于按照預(yù)先設(shè)定的巡檢更新周期從所述參數(shù)服務(wù)器下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期;還用于按照各個(gè)巡檢項(xiàng)程序的巡檢周期運(yùn)行本地保存的巡檢項(xiàng)程序。
[0020]上述系統(tǒng)中,參數(shù)服務(wù)器用于,接收人工輸入的巡檢策略,根據(jù)該巡檢策略生成針對(duì)各個(gè)業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件;還用于接收人工上傳或者通過(guò)在線編輯的巡檢項(xiàng)程序。
[0021 ] 上述系統(tǒng)還可以包括狀態(tài)服務(wù)器;
[0022]業(yè)務(wù)巡檢代理還用于,按照預(yù)先設(shè)定的心跳上報(bào)周期將業(yè)務(wù)機(jī)器的心跳消息上報(bào)至狀態(tài)服務(wù)器;
[0023]狀態(tài)服務(wù)器用于,針對(duì)各個(gè)業(yè)務(wù)機(jī)器,判斷當(dāng)前時(shí)間距離上次收到業(yè)務(wù)機(jī)器心跳消息的時(shí)間間隔是否大于預(yù)先設(shè)定的閾值,如果是,則查詢?cè)摌I(yè)務(wù)機(jī)器是否已下線,如果未下線,則給出針對(duì)該業(yè)務(wù)機(jī)器的告警信息;如果已下線,則通知所述參數(shù)服務(wù)器刪除針對(duì)所述業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
[0024]一種用于實(shí)現(xiàn)線上業(yè)務(wù)巡檢的業(yè)務(wù)巡檢代理,所述業(yè)務(wù)巡檢代理部署于需要進(jìn)行業(yè)務(wù)巡檢的業(yè)務(wù)機(jī)器中,包括:
[0025]下載模塊,用于按照預(yù)先設(shè)定的巡檢更新周期下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期;
[0026]巡檢執(zhí)行模塊,用于按照各個(gè)巡檢項(xiàng)程序的巡檢周期運(yùn)行本地保存的巡檢項(xiàng)程序。
[0027]上述業(yè)務(wù)巡檢代理可以進(jìn)一步包括:心跳上報(bào)模塊,用于按照預(yù)先設(shè)定的心跳上報(bào)周期上報(bào)業(yè)務(wù)機(jī)器的心跳消息。
[0028]一種用于實(shí)現(xiàn)線上業(yè)務(wù)巡檢的參數(shù)服務(wù)器,包括:
[0029]Web集中式管理界面模塊,用于接收人工輸入的巡檢策略;
[0030]參數(shù)生成模塊,用于根據(jù)所述巡檢策略生成針對(duì)各個(gè)業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期;還用于接收人工上傳或者通過(guò)在線編輯的巡檢項(xiàng)程序。
[0031]上述參數(shù)生成模塊還可以用于,當(dāng)接收到業(yè)務(wù)機(jī)器已下線的通知時(shí),刪除針對(duì)該業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
[0032]一種用于實(shí)現(xiàn)線上業(yè)務(wù)巡檢的狀態(tài)服務(wù)器,包括:
[0033]心跳接收模塊,用于接收各個(gè)業(yè)務(wù)機(jī)器的心跳消息,針對(duì)各個(gè)業(yè)務(wù)機(jī)器,判斷當(dāng)前時(shí)間距離上次收到業(yè)務(wù)機(jī)器心跳消息的時(shí)間間隔是否大于預(yù)先設(shè)定的閾值,如果是,則通知處理模塊;
[0034]處理模塊,用于根據(jù)所述心跳接收模塊的通知,查詢?cè)摌I(yè)務(wù)機(jī)器是否已下線,如果未下線,則給出針對(duì)該業(yè)務(wù)機(jī)器的告警信息;如果已下線,則通知?jiǎng)h除針對(duì)所述業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
[0035]可見(jiàn),本發(fā)明提出的線上業(yè)務(wù)巡檢方法、系統(tǒng)及裝置,能夠?qū)崟r(shí)動(dòng)態(tài)更新巡檢項(xiàng)程序,避免遠(yuǎn)程執(zhí)行巡檢項(xiàng)程序,并且避免了修改系統(tǒng)Crontab項(xiàng)帶來(lái)的風(fēng)險(xiǎn),能夠保證實(shí)時(shí)有效地進(jìn)行業(yè)務(wù)巡檢,方便運(yùn)營(yíng)維護(hù)。
【專利附圖】
【附圖說(shuō)明】
[0036]圖1為本發(fā)明提出的線上業(yè)務(wù)巡檢方法實(shí)現(xiàn)流程圖;
[0037]圖2為本發(fā)明所應(yīng)用的系統(tǒng)結(jié)構(gòu)示意圖;
[0038]圖3為本發(fā)明實(shí)施例二中業(yè)務(wù)巡檢代理單次下載并更新的實(shí)現(xiàn)流程圖;
[0039]圖4為本發(fā)明實(shí)施例三中狀態(tài)服務(wù)器的運(yùn)行流程圖;
[0040]圖5為本發(fā)明提出實(shí)現(xiàn)線上業(yè)務(wù)巡檢的業(yè)務(wù)巡檢代理結(jié)構(gòu)示意圖;
[0041]圖6為本發(fā)明提出實(shí)現(xiàn)線上業(yè)務(wù)巡檢的參數(shù)服務(wù)器結(jié)構(gòu)示意圖;
[0042]圖7為本發(fā)明提出實(shí)現(xiàn)線上業(yè)務(wù)巡檢的狀態(tài)服務(wù)器結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0043]本發(fā)明提出一種線上業(yè)務(wù)巡檢方法,該方法預(yù)先在需要進(jìn)行業(yè)務(wù)巡檢的各個(gè)業(yè)務(wù)機(jī)器中部署業(yè)務(wù)巡檢代理,如圖1為該方法實(shí)現(xiàn)流程圖,包括:
[0044]步驟101:業(yè)務(wù)巡檢代理按照預(yù)先設(shè)定的巡檢更新周期下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期;
[0045]步驟102:業(yè)務(wù)巡檢代理按照各個(gè)巡檢項(xiàng)程序的巡檢周期運(yùn)行本地保存的巡檢項(xiàng)程序。
[0046]上述步驟101中,業(yè)務(wù)巡檢代理下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序的方式可以為:
[0047]業(yè)務(wù)巡檢代理下載并更新業(yè)務(wù)巡檢配置文件,判斷所述業(yè)務(wù)巡檢配置文件是否涉及本地沒(méi)有保存的巡檢項(xiàng)程序,如果是,則下載并保存該巡檢項(xiàng)程序;否則結(jié)束本次下載。
[0048]例如,按照巡檢更新周期,在第一次更新時(shí),業(yè)務(wù)巡檢代理下載并保存業(yè)務(wù)巡檢配置文件;該業(yè)務(wù)巡檢配置文件的內(nèi)容為:巡檢項(xiàng)程序I每10分鐘巡檢一次,巡檢項(xiàng)程序2每15分鐘巡檢一次;則業(yè)務(wù)巡檢代理進(jìn)一步下載并保存業(yè)務(wù)巡檢配置文件所涉及的巡檢項(xiàng)程序I和巡檢項(xiàng)程序2。
[0049]在第二次更新時(shí),業(yè)務(wù)巡檢代理下載并保存業(yè)務(wù)巡檢配置文件(原先保存的業(yè)務(wù)巡檢配置文件被自動(dòng)刪除),該業(yè)務(wù)巡檢配置文件的內(nèi)容為:巡檢項(xiàng)程序I每10分鐘巡檢一次,巡檢項(xiàng)程序2每30分鐘巡檢一次;由于該業(yè)務(wù)巡檢配置文件所涉及的巡檢項(xiàng)程序在本地均有保存,因此結(jié)束本次下載。
[0050]在第η次更新時(shí),業(yè)務(wù)巡檢代理下載并保存業(yè)務(wù)巡檢配置文件(原先保存的業(yè)務(wù)巡檢配置文件被自動(dòng)刪除),該業(yè)務(wù)巡檢配置文件的內(nèi)容為:巡檢項(xiàng)程序I每10分鐘巡檢一次,巡檢項(xiàng)程序2每30分鐘巡檢一次,巡檢項(xiàng)程序3每20分鐘巡檢一次;由于該業(yè)務(wù)巡檢配置文件所涉及的巡檢項(xiàng)程序3在本地沒(méi)有保存,因此下載并保存巡檢項(xiàng)程序3。
[0051]可見(jiàn),采用上述方式可以避免業(yè)務(wù)巡檢代理重復(fù)下載巡檢項(xiàng)程序,減少對(duì)傳輸網(wǎng)絡(luò)造成的負(fù)擔(dān)。
[0052]上述方法中,業(yè)務(wù)巡檢配置文件還可以包含針對(duì)巡檢項(xiàng)程序的刪除指令;
[0053]業(yè)務(wù)巡檢代理下載業(yè)務(wù)巡檢配置文件之后,可以進(jìn)一步根據(jù)其包含的針對(duì)巡檢項(xiàng)程序的刪除指令刪除本地保存的該巡檢項(xiàng)程序。
[0054]通過(guò)這種方式,避免了人工登錄業(yè)務(wù)機(jī)器刪除其巡檢項(xiàng)程序,運(yùn)營(yíng)人員只需統(tǒng)一管理針對(duì)系統(tǒng)中所有業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件和巡檢項(xiàng)程序,由業(yè)務(wù)機(jī)器自動(dòng)拉取業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,保證了業(yè)務(wù)機(jī)器在任何時(shí)候都可以獲取到最新的巡檢項(xiàng)程序。
[0055]上述方法中,業(yè)務(wù)巡檢代理可以從參數(shù)服務(wù)器下載業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序;其中,業(yè)務(wù)巡檢配置文件由參數(shù)服務(wù)器根據(jù)人工輸入的巡檢策略自動(dòng)生成,巡檢項(xiàng)程序由人工上傳或者通過(guò)在線編輯。
[0056]上述方法可以進(jìn)一步包括:業(yè)務(wù)巡檢代理按照預(yù)先設(shè)定的心跳上報(bào)周期將業(yè)務(wù)機(jī)器的心跳消息上報(bào)至狀態(tài)服務(wù)器;
[0057]狀態(tài)服務(wù)器針對(duì)各個(gè)業(yè)務(wù)機(jī)器,判斷當(dāng)前時(shí)間距離上次收到業(yè)務(wù)機(jī)器心跳消息的時(shí)間間隔是否大于預(yù)先設(shè)定的閾值,如果是,則查詢?cè)摌I(yè)務(wù)機(jī)器是否已下線,如果未下線,則給出針對(duì)該業(yè)務(wù)機(jī)器的告警信息;如果已下線,則通知所述參數(shù)服務(wù)器刪除針對(duì)所述業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
[0058]通過(guò)這種方式,對(duì)于已經(jīng)下線的業(yè)務(wù)機(jī)器,系統(tǒng)可以自動(dòng)刪除參數(shù)服務(wù)器上該業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,即使該業(yè)務(wù)機(jī)器重新上線用于其它業(yè)務(wù),其業(yè)務(wù)巡檢配置文件和巡檢項(xiàng)程序也不再有效。
[0059]如圖2為本發(fā)明所應(yīng)用的系統(tǒng)結(jié)構(gòu)示意圖,包括:分別部署于業(yè)務(wù)機(jī)器1、業(yè)務(wù)機(jī)器2........業(yè)務(wù)機(jī)器η中的業(yè)務(wù)巡檢代理1、業(yè)務(wù)巡檢代理2........業(yè)務(wù)巡檢代理η,參數(shù)服務(wù)器及狀態(tài)服務(wù)器。以下舉具體的實(shí)施例,分別介紹該系統(tǒng)中的各個(gè)實(shí)體。
[0060]實(shí)施例一:
[0061]本實(shí)施例介紹參數(shù)服務(wù)器的運(yùn)行方式。
[0062]在本實(shí)施例中,可以在參數(shù)服務(wù)器上對(duì)需要業(yè)務(wù)巡檢的業(yè)務(wù)機(jī)器配置巡檢策略。該巡檢策略主要是自定義巡檢項(xiàng)程序的行為如運(yùn)行的規(guī)則、參數(shù)、巡檢項(xiàng)程序的巡檢周期(規(guī)則同Crontab),并指定其他相關(guān)的一些屬性如巡檢類型(告警類、上報(bào)類)、上報(bào)的服務(wù)器的IP地址等。參數(shù)服務(wù)器根據(jù)該巡檢策略生成針對(duì)各個(gè)業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件。
[0063]業(yè)務(wù)巡檢配置文件可以包含各個(gè)巡檢項(xiàng)程序的巡檢周期,如下為一個(gè)業(yè)務(wù)巡檢配置文件示例,其表示巡檢項(xiàng)程序MonTcpCons.sh每10分鐘執(zhí)行一次,巡檢項(xiàng)程序getcpm.sh每10分鐘執(zhí)行一次。
[0064]*/10****/data/app/MonTcpCons.sh
[1000]alarm
[0065]*/10****/data/app/getcpm.sh[124]post
[0066]另外,業(yè)務(wù)巡檢配置文件還可以包含針對(duì)巡檢項(xiàng)程序的刪除指令。
[0067]巡檢項(xiàng)程序可以包含具體的業(yè)務(wù)巡檢內(nèi)容,如監(jiān)控最大連接數(shù)、上報(bào)在線用戶數(shù)等;可以是二進(jìn)制程序或者腳本。
[0068]在本實(shí)施例中,用戶可以在線編輯巡檢項(xiàng)程序或者上傳預(yù)先準(zhǔn)備好的巡檢項(xiàng)程序。
[0069]在參數(shù)服務(wù)器上,巡檢策略可以在任何時(shí)候添加及修改,不會(huì)影響到業(yè)務(wù)巡檢代理的運(yùn)行。
[0070]另外,參數(shù)服務(wù)器還可以根據(jù)狀態(tài)服務(wù)器的通知,刪除針對(duì)某個(gè)業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
[0071]實(shí)施例二:
[0072]本實(shí)施例介紹業(yè)務(wù)巡檢代理的運(yùn)行方式。
[0073]預(yù)先在需要進(jìn)行業(yè)務(wù)巡檢的各個(gè)業(yè)務(wù)機(jī)器中部署業(yè)務(wù)巡檢代理,業(yè)務(wù)巡檢代理可以由自動(dòng)化部署平臺(tái)進(jìn)行部署,在業(yè)務(wù)機(jī)器上以后臺(tái)方式運(yùn)行,業(yè)務(wù)巡檢代理可以是二進(jìn)制程序或者腳本,也可以是Daemon后臺(tái)進(jìn)程。該業(yè)務(wù)巡檢代理是一個(gè)類Crontab系統(tǒng),循環(huán)如下過(guò)程:下載最新的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,讀取業(yè)務(wù)巡檢配置文件,在巡檢項(xiàng)程序的巡檢時(shí)間點(diǎn)運(yùn)行巡檢項(xiàng)程序;同時(shí),按照預(yù)先設(shè)定心跳上報(bào)周期上報(bào)心跳消息。
[0074]業(yè)務(wù)巡檢代理基于插件式,巡檢項(xiàng)目可以在任何時(shí)候配置,業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序從參數(shù)服務(wù)器主動(dòng)下載。
[0075]業(yè)務(wù)巡檢代理按照預(yù)先設(shè)定的巡檢更新周期從參數(shù)服務(wù)器獲取并更新業(yè)務(wù)機(jī)器最新的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。巡檢更新周期可配置,如10分鐘進(jìn)行更新一次。獲取行為為內(nèi)部實(shí)現(xiàn)的連接機(jī)制,如TCP、UDP、長(zhǎng)連接及短連接等。在本實(shí)施例中使用http-get方式;業(yè)務(wù)巡檢代理可方便地通過(guò)wget或者curl等系統(tǒng)命令方式獲取文件。根據(jù)本地保存的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,業(yè)務(wù)巡檢代理運(yùn)行巡檢項(xiàng)程序。同時(shí),業(yè)務(wù)巡檢代理還需按照預(yù)先設(shè)定的心跳上報(bào)周期向狀態(tài)服務(wù)器上報(bào)業(yè)務(wù)機(jī)器的心跳消息,心跳上報(bào)周期可配置。本實(shí)施例中采用http-post方式上報(bào)心跳消息。
[0076]如圖3為實(shí)施例二中業(yè)務(wù)巡檢代理單次下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序的實(shí)現(xiàn)流程圖,包括:
[0077]步驟301:業(yè)務(wù)巡檢代理從參數(shù)服務(wù)器下載并保存業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件,并刪除之前本地保存的業(yè)務(wù)巡檢配置文件;
[0078]步驟302:業(yè)務(wù)巡檢代理判斷本次下載的業(yè)務(wù)巡檢配置文件中是否包含針對(duì)巡檢項(xiàng)程序的刪除指令,如果包含,則刪除本地保存的該巡檢項(xiàng)程序;否則,執(zhí)行步驟303 ;
[0079]步驟303:業(yè)務(wù)巡檢代理判斷本次下載的業(yè)務(wù)巡檢配置文件是否涉及本地沒(méi)有保存的巡檢項(xiàng)程序;如果涉及,則從參數(shù)服務(wù)器下載并保存該巡檢項(xiàng)程序。這里,所謂的涉及某巡檢項(xiàng)程序是指業(yè)務(wù)巡檢配置文件中包含針對(duì)該巡檢項(xiàng)程序的巡檢周期。
[0080]以上為業(yè)務(wù)巡檢代理單次下載并更新的實(shí)現(xiàn)流程。業(yè)務(wù)巡檢代理按照預(yù)先設(shè)定的巡檢更新周期,周期性地執(zhí)行上述步驟301至303。由于業(yè)務(wù)巡檢代理周期性地下載并更新,因此,當(dāng)參數(shù)服務(wù)器中生成最新版本的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序時(shí),業(yè)務(wù)巡檢代理會(huì)自動(dòng)從服務(wù)器下載最新的版本。
[0081]另外,由于業(yè)務(wù)巡檢配置文件中可以包含針對(duì)巡檢項(xiàng)程序的刪除指令,業(yè)務(wù)巡檢代理自動(dòng)更新業(yè)務(wù)巡檢配置文件后,能夠執(zhí)行刪除指令,自動(dòng)刪除無(wú)效的巡檢項(xiàng)程序??梢?jiàn),這種刪除巡檢項(xiàng)程序的方式無(wú)需逐個(gè)登錄業(yè)務(wù)機(jī)器,而只需在參數(shù)服務(wù)器中生成刪除指令即可。該方法可以同時(shí)刪除一個(gè)或者多個(gè)巡檢項(xiàng)程序。
[0082]利用本地保存的業(yè)務(wù)巡檢配置文件和巡檢項(xiàng)程序,業(yè)務(wù)巡檢代理可以執(zhí)行對(duì)業(yè)務(wù)機(jī)器的巡檢,具體方式為:根據(jù)業(yè)務(wù)巡檢配置文件中包含的各個(gè)巡檢項(xiàng)程序的巡檢周期,以后臺(tái)方式運(yùn)行巡檢項(xiàng)程序。巡檢項(xiàng)程序可以自動(dòng)將運(yùn)行結(jié)果進(jìn)行上報(bào),具體地,對(duì)于告警類的巡檢項(xiàng)程序,可以在超過(guò)指定的閥值時(shí)將告警信息上報(bào)至告警系統(tǒng);對(duì)于上報(bào)類的巡檢項(xiàng)程序,可以將數(shù)值上報(bào)至可視化系統(tǒng);等待。
[0083]業(yè)務(wù)巡檢代理還可以按照預(yù)先設(shè)定的心跳上報(bào)周期向狀態(tài)服務(wù)器上報(bào)業(yè)務(wù)機(jī)器的心跳消息。
[0084]實(shí)施例三:
[0085]本實(shí)施例介紹狀態(tài)服務(wù)器的運(yùn)行方式。
[0086]如圖4為實(shí)施例三中狀態(tài)服務(wù)器的運(yùn)行流程圖,包括:
[0087]步驟401:針對(duì)各個(gè)業(yè)務(wù)機(jī)器,狀態(tài)服務(wù)器判斷當(dāng)前時(shí)間距離上次收到業(yè)務(wù)機(jī)器心跳消息的時(shí)間間隔是否大于預(yù)先設(shè)定的閾值,如果大于,則執(zhí)行步驟402。
[0088]步驟402:狀態(tài)服務(wù)器查詢?cè)摌I(yè)務(wù)機(jī)器是否已下線,如果已下線,則執(zhí)行步驟403 ;如果未下線,則執(zhí)行步驟404。這里,狀態(tài)服務(wù)器可以在配置系統(tǒng)中查詢業(yè)務(wù)機(jī)器的狀態(tài)。
[0089]步驟403:狀態(tài)服務(wù)器通知參數(shù)服務(wù)器刪除針對(duì)該業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,結(jié)束當(dāng)前流程。
[0090]步驟404:狀態(tài)服務(wù)器給出針對(duì)該業(yè)務(wù)機(jī)器的告警信息,可以將告警信息通知相關(guān)負(fù)責(zé)人。
[0091]本發(fā)明還提出一種線上業(yè)務(wù)巡檢系統(tǒng),包括參數(shù)服務(wù)器及部署于一個(gè)以上業(yè)務(wù)機(jī)器中的一個(gè)以上業(yè)務(wù)巡檢代理;其中,
[0092]業(yè)務(wù)巡檢代理用于按照預(yù)先設(shè)定的巡檢更新周期從參數(shù)服務(wù)器下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期;還用于按照各個(gè)巡檢項(xiàng)程序的巡檢周期運(yùn)行本地保存的巡檢項(xiàng)程序。
[0093]上述系統(tǒng)中,業(yè)務(wù)巡檢代理下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序的方式可以為:下載并更新業(yè)務(wù)巡檢配置文件,判斷所述業(yè)務(wù)巡檢配置文件是否涉及本地沒(méi)有保存的巡檢項(xiàng)程序,如果是,則下載并保存該巡檢項(xiàng)程序;否則結(jié)束本次下載。
[0094]上述系統(tǒng)中,業(yè)務(wù)巡檢配置文件還可以包含針對(duì)巡檢項(xiàng)程序的刪除指令;
[0095]相應(yīng)地,業(yè)務(wù)巡檢代理還可以用于,在下載業(yè)務(wù)巡檢配置文件之后,進(jìn)一步根據(jù)其包含的針對(duì)巡檢項(xiàng)程序的刪除指令刪除本地保存的該巡檢項(xiàng)程序。
[0096]上述系統(tǒng)中,參數(shù)服務(wù)器用于,接收人工輸入的巡檢策略,根據(jù)該巡檢策略生成針對(duì)各個(gè)業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件;還用于接收人工上傳或者通過(guò)在線編輯的巡檢項(xiàng)程序。
[0097]上述系統(tǒng)還可以包括狀態(tài)服務(wù)器;
[0098]業(yè)務(wù)巡檢代理還用于,按照預(yù)先設(shè)定的心跳上報(bào)周期將業(yè)務(wù)機(jī)器的心跳消息上報(bào)至狀態(tài)服務(wù)器;
[0099]狀態(tài)服務(wù)器用于,針對(duì)各個(gè)業(yè)務(wù)機(jī)器,判斷當(dāng)前時(shí)間距離上次收到業(yè)務(wù)機(jī)器心跳消息的時(shí)間間隔是否大于預(yù)先設(shè)定的閾值,如果是,則查詢?cè)摌I(yè)務(wù)機(jī)器是否已下線,如果未下線,則給出針對(duì)該業(yè)務(wù)機(jī)器的告警信息;如果已下線,則通知參數(shù)服務(wù)器刪除針對(duì)該業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
[0100]本發(fā)明還提出一種用于實(shí)現(xiàn)線上業(yè)務(wù)巡檢的業(yè)務(wù)巡檢代理,該業(yè)務(wù)巡檢代理部署于需要進(jìn)行業(yè)務(wù)巡檢的業(yè)務(wù)機(jī)器中,如圖5為該業(yè)務(wù)巡檢代理的結(jié)構(gòu)示意圖,包括:
[0101]下載模塊501,用于按照預(yù)先設(shè)定的巡檢更新周期下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期;
[0102]巡檢執(zhí)行模塊502,用于按照各個(gè)巡檢項(xiàng)程序的巡檢周期運(yùn)行本地保存的巡檢項(xiàng)程序。
[0103]上述業(yè)務(wù)巡檢代理中,下載模塊501下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序的方式可以為:下載并更新業(yè)務(wù)巡檢配置文件,判斷所述業(yè)務(wù)巡檢配置文件是否涉及本地沒(méi)有保存的巡檢項(xiàng)程序,如果是,則下載并保存該巡檢項(xiàng)程序;否則結(jié)束本次下載。
[0104]上述業(yè)務(wù)巡檢代理中,業(yè)務(wù)巡檢配置文件還可以包含針對(duì)巡檢項(xiàng)程序的刪除指令;
[0105]下載模塊還用于,下載業(yè)務(wù)巡檢配置文件之后,根據(jù)其包含的針對(duì)巡檢項(xiàng)程序的刪除指令刪除本地保存的該巡檢項(xiàng)程序。
[0106]上述業(yè)務(wù)巡檢代理可以進(jìn)一步包括:
[0107]心跳上報(bào)模塊503,用于按照預(yù)先設(shè)定的心跳上報(bào)周期上報(bào)業(yè)務(wù)機(jī)器的心跳消息。
[0108]本發(fā)明還提出一種用于實(shí)現(xiàn)線上業(yè)務(wù)巡檢的參數(shù)服務(wù)器,如圖6為該參數(shù)服務(wù)器的結(jié)構(gòu)示意圖,包括:
[0109]Web集中式管理界面模塊601,用于接收人工輸入的巡檢策略;
[0110]參數(shù)生成模塊602,用于根據(jù)所述巡檢策略生成針對(duì)各個(gè)業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期;還用于接收人工上傳或者通過(guò)在線編輯的巡檢項(xiàng)程序。
[0111]上述業(yè)務(wù)巡檢配置文件還可以包含針對(duì)巡檢項(xiàng)程序的刪除指令。
[0112]上述參數(shù)生成模塊602還可以用于,當(dāng)接收到業(yè)務(wù)機(jī)器已下線的通知時(shí),刪除針對(duì)該業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
[0113]本發(fā)明還提出一種用于實(shí)現(xiàn)線上業(yè)務(wù)巡檢的狀態(tài)服務(wù)器,如圖7為該狀態(tài)服務(wù)器的結(jié)構(gòu)示意圖,包括:
[0114]心跳接收模塊701,用于接收各個(gè)業(yè)務(wù)機(jī)器的心跳消息,針對(duì)各個(gè)業(yè)務(wù)機(jī)器,判斷當(dāng)前時(shí)間距離上次收到業(yè)務(wù)機(jī)器心跳消息的時(shí)間間隔是否大于預(yù)先設(shè)定的閾值,如果是,則通知處理模塊702 ;
[0115]處理模塊702,用于根據(jù)所述心跳接收模塊701的通知,查詢?cè)摌I(yè)務(wù)機(jī)器是否已下線,如果未下線,則給出針對(duì)該業(yè)務(wù)機(jī)器的告警信息;如果已下線,則通知?jiǎng)h除針對(duì)所述業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
[0116]綜上可見(jiàn),本發(fā)明提出的線上業(yè)務(wù)巡檢方法、系統(tǒng)及裝置不使用系統(tǒng)Crontab,減少了修改系統(tǒng)Crontab項(xiàng)帶來(lái)的風(fēng)險(xiǎn)及其可能存在調(diào)度失敗的風(fēng)險(xiǎn)。業(yè)務(wù)巡檢代理采用插件式,巡檢項(xiàng)目及其屬性可動(dòng)態(tài)實(shí)時(shí)配置。業(yè)務(wù)巡檢配置文件和巡檢項(xiàng)程序采用集中式管理,所見(jiàn)即所得,巡檢周期隨時(shí)可更改。巡檢項(xiàng)可以實(shí)現(xiàn)自動(dòng)更新,無(wú)需人工干預(yù),只需要將業(yè)務(wù)巡檢配置文件和巡檢項(xiàng)程序下發(fā)到參數(shù)服務(wù)器,減輕了運(yùn)營(yíng)人員的工作。業(yè)務(wù)機(jī)器自動(dòng)拉取業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,保證了業(yè)務(wù)機(jī)器任何時(shí)候可以獲取最新的巡檢項(xiàng),包括在業(yè)務(wù)機(jī)器重啟之后也能獲取到最新的文件。可以實(shí)現(xiàn)巡檢項(xiàng)程序的自動(dòng)銷毀,無(wú)需人工登錄業(yè)務(wù)機(jī)器刪除其巡檢項(xiàng),只需在參數(shù)服務(wù)器做刪除操作即可。對(duì)于已經(jīng)下線的業(yè)務(wù)機(jī)器,系統(tǒng)能夠自動(dòng)刪除參數(shù)服務(wù)器上的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,即使該機(jī)器重新上線用于其它業(yè)務(wù),該巡檢項(xiàng)也不再有效。
[0117]以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。
【權(quán)利要求】
1.一種線上業(yè)務(wù)巡檢方法,其特征在于,預(yù)先在需要進(jìn)行業(yè)務(wù)巡檢的各個(gè)業(yè)務(wù)機(jī)器中部署業(yè)務(wù)巡檢代理,所述方法包括: 業(yè)務(wù)巡檢代理按照預(yù)先設(shè)定的巡檢更新周期下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期; 業(yè)務(wù)巡檢代理按照各個(gè)巡檢項(xiàng)程序的巡檢周期運(yùn)行本地保存的巡檢項(xiàng)程序。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述業(yè)務(wù)巡檢代理從參數(shù)服務(wù)器下載業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序;所述業(yè)務(wù)巡檢配置文件由參數(shù)服務(wù)器根據(jù)人工輸入的巡檢策略自動(dòng)生成,所述巡檢項(xiàng)程序由人工上傳或者通過(guò)在線編輯。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法進(jìn)一步包括:業(yè)務(wù)巡檢代理按照預(yù)先設(shè)定的心跳上報(bào)周期將業(yè)務(wù)機(jī)器的心跳消息上報(bào)至狀態(tài)服務(wù)器; 狀態(tài)服務(wù)器針對(duì)各個(gè)業(yè)務(wù)機(jī)器,判斷當(dāng)前時(shí)間距離上次收到業(yè)務(wù)機(jī)器心跳消息的時(shí)間間隔是否大于預(yù)先設(shè)定的閾值,如果是,則查詢?cè)摌I(yè)務(wù)機(jī)器是否已下線,如果未下線,則給出針對(duì)該業(yè)務(wù)機(jī)器的告警信息;如果已下線,則通知所述參數(shù)服務(wù)器刪除針對(duì)所述業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
4.一種線上業(yè)務(wù)巡檢系統(tǒng),其特征在于,所述系統(tǒng)包括參數(shù)服務(wù)器及部署于一個(gè)以上業(yè)務(wù)機(jī)器中的一個(gè)以上業(yè)務(wù)巡檢代理;其中, 所述業(yè)務(wù)巡檢代理用于按照預(yù)先設(shè)定的巡檢更新周期從所述參數(shù)服務(wù)器下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期;還用于按照各個(gè)巡檢項(xiàng)程序的巡檢周期運(yùn)行本地保存的巡檢項(xiàng)程序。
5.根據(jù)權(quán)利要求4所述的系統(tǒng),其特征在于,所述參數(shù)服務(wù)器用于,接收人工輸入的巡檢策略,根據(jù)該巡檢策略生成針對(duì)各個(gè)業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件;還用于接收人工上傳或者通過(guò)在線編輯的巡檢項(xiàng)程序。
6.根據(jù)權(quán)利要求5所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括狀態(tài)服務(wù)器; 所述業(yè)務(wù)巡檢代理還用于,按照預(yù)先設(shè)定的心跳上報(bào)周期將業(yè)務(wù)機(jī)器的心跳消息上報(bào)至狀態(tài)服務(wù)器; 所述狀態(tài)服務(wù)器用于,針對(duì)各個(gè)業(yè)務(wù)機(jī)器,判斷當(dāng)前時(shí)間距離上次收到業(yè)務(wù)機(jī)器心跳消息的時(shí)間間隔是否大于預(yù)先設(shè)定的閾值,如果是,則查詢?cè)摌I(yè)務(wù)機(jī)器是否已下線,如果未下線,則給出針對(duì)該業(yè)務(wù)機(jī)器的告警信息;如果已下線,則通知所述參數(shù)服務(wù)器刪除針對(duì)所述業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
7.一種用于實(shí)現(xiàn)線上業(yè)務(wù)巡檢的業(yè)務(wù)巡檢代理,所述業(yè)務(wù)巡檢代理部署于需要進(jìn)行業(yè)務(wù)巡檢的業(yè)務(wù)機(jī)器中,其特征在于,所述業(yè)務(wù)巡檢代理包括: 下載模塊,用于按照預(yù)先設(shè)定的巡檢更新周期下載并更新業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期; 巡檢執(zhí)行模塊,用于按照各個(gè)巡檢項(xiàng)程序的巡檢周期運(yùn)行本地保存的巡檢項(xiàng)程序。
8.根據(jù)權(quán)利要求7所述的業(yè)務(wù)巡檢代理,其特征在于,所述業(yè)務(wù)巡檢代理進(jìn)一步包括: 心跳上報(bào)模塊,用于按照預(yù)先設(shè)定的心跳上報(bào)周期上報(bào)業(yè)務(wù)機(jī)器的心跳消息。
9.一種用于實(shí)現(xiàn)線上業(yè)務(wù)巡檢的參數(shù)服務(wù)器,其特征在于,所述參數(shù)服務(wù)器包括: Web集中式管理界面模塊,用于接收人工輸入的巡檢策略; 參數(shù)生成模塊,用于根據(jù)所述巡檢策略生成針對(duì)各個(gè)業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件,所述業(yè)務(wù)巡檢配置文件包含各個(gè)巡檢項(xiàng)程序的巡檢周期;還用于接收人工上傳或者通過(guò)在線編輯的巡檢項(xiàng)程序。
10.根據(jù)權(quán)利要求9所述的參數(shù)服務(wù)器,其特征在于,所述參數(shù)生成模塊還用于,當(dāng)接收到業(yè)務(wù)機(jī)器已下線的通知時(shí),刪除針對(duì)該業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
11.一種用于實(shí)現(xiàn)線上業(yè)務(wù)巡檢的狀態(tài)服務(wù)器,其特征在于,所述狀態(tài)服務(wù)器包括: 心跳接收模塊,用于接收各個(gè)業(yè)務(wù)機(jī)器的心跳消息,針對(duì)各個(gè)業(yè)務(wù)機(jī)器,判斷當(dāng)前時(shí)間距離上次收到業(yè)務(wù)機(jī)器心跳消息的時(shí)間間隔是否大于預(yù)先設(shè)定的閾值,如果是,則通知處理模塊; 處理模塊,用于根據(jù)所述心跳接收模塊的通知,查詢?cè)摌I(yè)務(wù)機(jī)器是否已下線,如果未下線,則給出針對(duì)該業(yè)務(wù)機(jī)器的告警信息;如果已下線,則通知?jiǎng)h除針對(duì)所述業(yè)務(wù)機(jī)器的業(yè)務(wù)巡檢配置文件及巡檢項(xiàng)程序。
【文檔編號(hào)】H04L12/24GK104518903SQ201310461624
【公開日】2015年4月15日 申請(qǐng)日期:2013年9月30日 優(yōu)先權(quán)日:2013年9月30日
【發(fā)明者】彭先木, 徐盎, 王頡, 徐偉 申請(qǐng)人:騰訊科技(北京)有限公司