本發(fā)明涉及IT監(jiān)管系統(tǒng)技術(shù)領(lǐng)域,特別是指一種監(jiān)管系統(tǒng)的告警閾值動(dòng)態(tài)配置系統(tǒng)及方法。
背景技術(shù):
近年來(lái),隨著企業(yè)信息化技術(shù)的逐步深化,業(yè)務(wù)對(duì)于IT系統(tǒng)的依賴逐步增加,同時(shí)企業(yè)對(duì)IT監(jiān)管系統(tǒng)的要求也在逐步升級(jí)。其中傳統(tǒng)監(jiān)管系統(tǒng)針對(duì)指標(biāo)告警的做法,目前都是通過采集被監(jiān)控系統(tǒng)的指標(biāo)數(shù)據(jù)信息,再根據(jù)手工設(shè)置好的指標(biāo)閥值,判斷指標(biāo)數(shù)據(jù)超出閥值的上下限,如是,則進(jìn)行告警提醒。
在IT應(yīng)用系統(tǒng)較少且業(yè)務(wù)趨勢(shì)穩(wěn)定的情況下,運(yùn)維人員可以快速根據(jù)自己的經(jīng)驗(yàn)進(jìn)行設(shè)置指標(biāo)告警閥值的工作,但隨著企業(yè)的發(fā)展,應(yīng)用主機(jī)、業(yè)務(wù)應(yīng)用逐步增加,針對(duì)指數(shù)級(jí)倍增的指標(biāo)庫(kù)中,由人工再對(duì)指標(biāo)及對(duì)應(yīng)告警上下限閥值的初始化定義、重新指定將耗費(fèi)龐大的工作量;同時(shí)伴隨著業(yè)務(wù)活動(dòng)的多樣化,各業(yè)務(wù)促銷周期內(nèi)對(duì)IT應(yīng)用系統(tǒng)響應(yīng)要求級(jí)別不同,需要根據(jù)要求對(duì)指標(biāo)進(jìn)行更高頻率的調(diào)整,以便運(yùn)維人員根據(jù)對(duì)應(yīng)的告警內(nèi)容及時(shí)作出相關(guān)應(yīng)對(duì)措施。所以針對(duì)大量業(yè)務(wù)的IT監(jiān)管系統(tǒng)再通過手工配置指標(biāo)固定告警閥值的方式已不再符合技術(shù)潮流。
現(xiàn)有IT監(jiān)管系統(tǒng),對(duì)于告警提醒的基本做法,都是采用人工設(shè)置各IT元素相關(guān)指標(biāo)的固定告警閥值信息,當(dāng)各IT元素的指標(biāo)信息被歸集后,系統(tǒng)判斷具體指標(biāo)的數(shù)值是否符合已定的告警閥值設(shè)置條件,如符合,則對(duì)該IT元素指標(biāo)進(jìn)行告警提醒。
由于僅通過人工操作的方式進(jìn)行固定閥值的定義,沒有結(jié)合業(yè)務(wù)趨勢(shì)、周期活動(dòng)數(shù)據(jù)、系統(tǒng)負(fù)載要求、歷史告警處理意見等進(jìn)行權(quán)重計(jì)算后,完成閥值自動(dòng)化初始化、更新,所以存在的缺點(diǎn)包含如下:
1無(wú)法批量對(duì)各類型指標(biāo)進(jìn)行初始化、更新,均需要人工操作。
2無(wú)法根據(jù)業(yè)務(wù)權(quán)重,在對(duì)應(yīng)的周期要求內(nèi),自動(dòng)完成閥值信息更新;尤其在頻繁度要求的情況下,人工操作無(wú)法做到快速響應(yīng)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提出一種監(jiān)管系統(tǒng)的告警閾值動(dòng)態(tài)配置系統(tǒng)及方法,解決了現(xiàn)有技術(shù)中無(wú)法自動(dòng)完成閾值信息配置的缺陷。
本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
一種監(jiān)管系統(tǒng)的告警閾值動(dòng)態(tài)配置系統(tǒng),包括數(shù)據(jù)采集模塊、權(quán)重系數(shù)運(yùn)算模塊、上下限約束模塊和閾值輸出模塊,所述數(shù)據(jù)采集模塊用于從數(shù)據(jù)庫(kù)中獲取及存儲(chǔ)閾值配置信息、活動(dòng)周期預(yù)估數(shù)據(jù)和業(yè)務(wù)趨勢(shì)預(yù)估數(shù)據(jù);所述權(quán)重系數(shù)運(yùn)算模塊用于對(duì)各指標(biāo)進(jìn)行權(quán)重系數(shù)運(yùn)算;所述上下限約束模塊用于根據(jù)各指標(biāo)的上下限約束完成指標(biāo)數(shù)據(jù)的裁減;所述閾值輸出模塊用于輸出閾值信息。
進(jìn)一步的,所述權(quán)重系數(shù)運(yùn)算模塊包括性能趨勢(shì)權(quán)重運(yùn)算模塊和業(yè)務(wù)等級(jí)權(quán)重運(yùn)算模塊,所述性能趨勢(shì)權(quán)重運(yùn)算模塊用于按照運(yùn)算型指標(biāo)、存儲(chǔ)類指標(biāo)和業(yè)務(wù)應(yīng)用指標(biāo)的歷史趨勢(shì)數(shù)據(jù)得到性能趨勢(shì)權(quán)重閾值,所述業(yè)務(wù)等級(jí)權(quán)重運(yùn)算模塊用于根據(jù)活動(dòng)周期預(yù)估數(shù)據(jù)獲取業(yè)務(wù)等級(jí)權(quán)重閾值,將性能趨勢(shì)權(quán)重閾值和業(yè)務(wù)等級(jí)權(quán)重閾值之中的最大值設(shè)為指標(biāo)的權(quán)重系數(shù)。
進(jìn)一步的,所述上下限約束模塊包括上限指標(biāo)閾值計(jì)算模塊和下限指標(biāo)閾值計(jì)算模塊,所述上限指標(biāo)閾值計(jì)算模塊用于根據(jù)權(quán)重系數(shù)和上限約束值獲取上限指標(biāo)閾值,所述下限指標(biāo)閾值計(jì)算模塊用于根據(jù)權(quán)重系數(shù)和下限約束值獲取上限指標(biāo)閾值。
進(jìn)一步的,所述數(shù)據(jù)采集模塊還用于采集歷史告警處理信息。
進(jìn)一步的,所述數(shù)據(jù)庫(kù)包括告警閾值庫(kù)、活動(dòng)周期預(yù)估庫(kù)和業(yè)務(wù)趨勢(shì)預(yù)估庫(kù),所述閾值輸出模塊將閾值信息寫入到所述告警閾值庫(kù)。
一種監(jiān)管系統(tǒng)的告警閾值動(dòng)態(tài)配置方法,具體包括以下步驟:
步驟1,數(shù)據(jù)采集:從數(shù)據(jù)庫(kù)獲取及存儲(chǔ)閾值配置信息、活動(dòng)周期預(yù)估數(shù)據(jù)和業(yè)務(wù)趨勢(shì)預(yù)估數(shù)據(jù);
步驟2,權(quán)重系數(shù)運(yùn)算:根據(jù)閾值配置信息、活動(dòng)周期預(yù)估數(shù)據(jù)和業(yè)務(wù)趨勢(shì)預(yù)估數(shù)據(jù),對(duì)指標(biāo)進(jìn)行權(quán)重系數(shù)運(yùn)算,得到權(quán)重閾值;
步驟3,上下限約束:根據(jù)各指標(biāo)的權(quán)重閾值和上下限約束得到上下限指標(biāo)閾值;
步驟4,閾值輸出:將閥值信息重新輸出到告警閥值庫(kù),替換原來(lái)的閥值信息。
進(jìn)一步的,還包括以下步驟:
步驟5,告警分析:根據(jù)閾值信息和性能負(fù)荷信息,判斷指標(biāo)數(shù)據(jù)是否超過閾值,若是,則告警并處理。
進(jìn)一步的,步驟2中,對(duì)指標(biāo)進(jìn)行權(quán)重系數(shù)運(yùn)算的公式=max(性能趨勢(shì)權(quán)重閾值,業(yè)務(wù)等級(jí)權(quán)重閾值)。
進(jìn)一步的,步驟3中,上限指標(biāo)閾值=min(max(性能趨勢(shì)權(quán)重閾值,業(yè)務(wù)等級(jí)權(quán)重閾值),上限約束),下限指標(biāo)閾值=max(max(性能趨勢(shì)權(quán)重閾值,業(yè)務(wù)等級(jí)權(quán)重閾值),下限約束)。
本發(fā)明的有益效果在于:通過對(duì)原始閥值配置信息、活動(dòng)周期預(yù)估數(shù)據(jù)和業(yè)務(wù)趨勢(shì)預(yù)估數(shù)據(jù)進(jìn)行采集,進(jìn)行權(quán)重系數(shù)運(yùn)算,最終根據(jù)上下限約束,輸出動(dòng)態(tài)分析閥值,解決了現(xiàn)有技術(shù)中無(wú)法自動(dòng)完成閾值信息配置的缺陷。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明監(jiān)管系統(tǒng)的告警閾值動(dòng)態(tài)配置系統(tǒng)的原理框圖;
圖2為本發(fā)明監(jiān)管系統(tǒng)的告警閾值動(dòng)態(tài)配置方法的流程圖;
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
如圖1,本發(fā)明提出了一種監(jiān)管系統(tǒng)的告警閾值動(dòng)態(tài)配置系統(tǒng),包括數(shù)據(jù)采集模塊、權(quán)重系數(shù)運(yùn)算模塊、上下限約束模塊和閾值輸出模塊,數(shù)據(jù)采集模塊用于從數(shù)據(jù)庫(kù)中獲取及存儲(chǔ)閾值配置信息、活動(dòng)周期預(yù)估數(shù)據(jù)和業(yè)務(wù)趨勢(shì)預(yù)估數(shù)據(jù);權(quán)重系數(shù)運(yùn)算模塊用于對(duì)各指標(biāo)進(jìn)行權(quán)重系數(shù)運(yùn)算;上下限約束模塊用于根據(jù)各指標(biāo)的上下限約束完成指標(biāo)數(shù)據(jù)的裁減;閾值輸出模塊用于輸出閾值信息。
具體的,在專利申請(qǐng)中,指標(biāo)指的是IT監(jiān)管系統(tǒng)被監(jiān)控的所有指標(biāo),更具體的,指的是需要運(yùn)維人員需要根據(jù)自身經(jīng)驗(yàn)進(jìn)行人工設(shè)置告警閾值的那些指標(biāo)。
數(shù)據(jù)采集模塊還用于采集歷史告警處理信息和性能負(fù)荷信息。
本發(fā)明通過對(duì)原始閥值配置信息、活動(dòng)周期預(yù)估數(shù)據(jù)、業(yè)務(wù)趨勢(shì)預(yù)估數(shù)據(jù)、指標(biāo)性能負(fù)荷信息、告警處理信息進(jìn)行采集,由系統(tǒng)結(jié)合指標(biāo)類型、業(yè)務(wù)權(quán)重、數(shù)值趨勢(shì)進(jìn)行權(quán)重系數(shù)運(yùn)算,最終根據(jù)上下限約束,輸出動(dòng)態(tài)分析閥值。
權(quán)重系數(shù)運(yùn)算模塊包括性能趨勢(shì)權(quán)重運(yùn)算模塊和業(yè)務(wù)等級(jí)權(quán)重運(yùn)算模塊,性能趨勢(shì)權(quán)重運(yùn)算模塊用于按照運(yùn)算型指標(biāo)、存儲(chǔ)類指標(biāo)和業(yè)務(wù)應(yīng)用指標(biāo)的歷史趨勢(shì)數(shù)據(jù)得到性能趨勢(shì)權(quán)重閾值,業(yè)務(wù)等級(jí)權(quán)重運(yùn)算模塊用于根據(jù)活動(dòng)周期預(yù)估數(shù)據(jù)獲取業(yè)務(wù)等級(jí)權(quán)重閾值,將性能趨勢(shì)權(quán)重閾值和業(yè)務(wù)等級(jí)權(quán)重閾值之中的最大值設(shè)為指標(biāo)的權(quán)重系數(shù)。
上下限約束模塊包括上限指標(biāo)閾值計(jì)算模塊和下限指標(biāo)閾值計(jì)算模塊,上限指標(biāo)閾值計(jì)算模塊用于根據(jù)權(quán)重系數(shù)和上限約束值獲取上限指標(biāo)閾值,下限指標(biāo)閾值計(jì)算模塊用于根據(jù)權(quán)重系數(shù)和下限約束值獲取上限指標(biāo)閾值。
數(shù)據(jù)庫(kù)包括告警閾值庫(kù)、活動(dòng)周期預(yù)估庫(kù)和業(yè)務(wù)趨勢(shì)預(yù)估庫(kù),閾值輸出模塊將閾值信息寫入到告警閾值庫(kù)。
具體的,在本實(shí)施例中,監(jiān)管系統(tǒng)的告警閾值動(dòng)態(tài)配置系統(tǒng)在運(yùn)行過程中所需的公式與監(jiān)管系統(tǒng)的告警閾值動(dòng)態(tài)配置方法中提到的公式相同。
如圖2所示,本發(fā)明還提出了一種監(jiān)管系統(tǒng)的告警閾值動(dòng)態(tài)配置方法,具體包括以下步驟:
步驟1,數(shù)據(jù)采集:從數(shù)據(jù)庫(kù)獲取及存儲(chǔ)閾值配置信息、活動(dòng)周期預(yù)估數(shù)據(jù)和業(yè)務(wù)趨勢(shì)預(yù)估數(shù)據(jù);
具體的,還可采集并存儲(chǔ)歷史告警處理信息和性能負(fù)荷信息。
步驟2,權(quán)重系數(shù)運(yùn)算:根據(jù)閾值配置信息、活動(dòng)周期預(yù)估數(shù)據(jù)和業(yè)務(wù)趨勢(shì)預(yù)估數(shù)據(jù),對(duì)指標(biāo)進(jìn)行權(quán)重系數(shù)運(yùn)算,得到權(quán)重閾值;
步驟2中,對(duì)指標(biāo)進(jìn)行權(quán)重系數(shù)運(yùn)算的公式=max(性能趨勢(shì)權(quán)重閾值,業(yè)務(wù)等級(jí)權(quán)重閾值)。
(1)性能趨勢(shì)權(quán)重閥值:按照運(yùn)算類型指標(biāo)(如CPU的大小、使用數(shù)、I/O量,內(nèi)存的大小、使用數(shù))、存儲(chǔ)類型指標(biāo)(如硬盤或存儲(chǔ)陣列的大小、使用數(shù)、I/O量)、業(yè)務(wù)應(yīng)用指標(biāo)(如頁(yè)面響應(yīng)時(shí)間、頁(yè)面返回錯(cuò)誤碼幾率)等指標(biāo)的歷史趨勢(shì)數(shù)據(jù),將每一天分成多個(gè)時(shí)段,按時(shí)段進(jìn)行閥值動(dòng)態(tài)調(diào)整。
如果b設(shè)置為今天全天時(shí)段的指標(biāo)量,而xa2是昨天全天時(shí)段的上限指標(biāo)閥值,xb2是昨天全天時(shí)段的下限指標(biāo)閥值,z是上一次該指標(biāo)告警并被處理后管理員設(shè)置的后續(xù)處理權(quán)重(1~10分),那今天的指標(biāo)上下限閥值計(jì)算公式如下:
上限閥值xa1=max(1,(a*b+(1–a)*xa2)*(1+z/100));
下限閥值xb1=max(0,xb2+xa1-xa2);
其中a代表取樣時(shí)段中的比重,如取樣數(shù)據(jù)為近5天,因?yàn)閎是今天的數(shù)據(jù),所以a=1/5;同時(shí)如xa2沒值,則賦值為0,如xb2沒值,也賦值為0。
(2)業(yè)務(wù)等級(jí)權(quán)重閥值:按照業(yè)務(wù)活動(dòng)周期等級(jí)數(shù)據(jù),計(jì)算歷史同個(gè)活動(dòng)周期中業(yè)務(wù)關(guān)聯(lián)的各指標(biāo)的指標(biāo)閥值及對(duì)應(yīng)的業(yè)務(wù)增長(zhǎng)趨勢(shì)系數(shù),對(duì)關(guān)聯(lián)的各指標(biāo)進(jìn)行閥值的動(dòng)態(tài)調(diào)整。
如果上個(gè)活動(dòng)周期中業(yè)務(wù)預(yù)估值為A1,它當(dāng)時(shí)關(guān)聯(lián)的運(yùn)算指標(biāo)、存儲(chǔ)指標(biāo)、業(yè)務(wù)應(yīng)用的指標(biāo)閥值分別為XA1,XB1,XC1,那么本各活動(dòng)周期業(yè)務(wù)預(yù)估值為A2,則本周活動(dòng)周期內(nèi)該業(yè)務(wù)關(guān)聯(lián)的運(yùn)算指標(biāo)、存儲(chǔ)指標(biāo)、業(yè)務(wù)應(yīng)用的指標(biāo)閥值的計(jì)算公式如下(適用于上下限指標(biāo)):
XA2=(A2/A1-1)*XA1
XB2=(A2/A1-1)*XB1
XC2=(A2/A1-1)*XC1
其中如果上個(gè)活動(dòng)周期中業(yè)務(wù)預(yù)估值沒有值,則(A2/A1-1)代替為0計(jì)算。
步驟3,上下限約束:根據(jù)各指標(biāo)的權(quán)重閾值和上下限約束得到上下限指標(biāo)閾值;
步驟3中,上限指標(biāo)閾值=min(max(性能趨勢(shì)權(quán)重閾值,業(yè)務(wù)等級(jí)權(quán)重閾值),上限約束),下限指標(biāo)閾值=max(max(性能趨勢(shì)權(quán)重閾值,業(yè)務(wù)等級(jí)權(quán)重閾值),下限約束)。
步驟4,閾值輸出:將閥值信息重新輸出到告警閥值庫(kù),替換原來(lái)的閥值信息。
具體的,本發(fā)明還包括以下步驟:
步驟5,告警分析:根據(jù)閾值信息和性能負(fù)荷信息,判斷指標(biāo)數(shù)據(jù)是否超過閾值,若是,則告警并處理。
本發(fā)明的告警閥值動(dòng)態(tài)配置引擎技術(shù),將可幫助IT運(yùn)維人員進(jìn)行閥值指標(biāo)快速初始化、并根據(jù)業(yè)務(wù)權(quán)重進(jìn)行快速更新,從而得到符合業(yè)務(wù)趨勢(shì)對(duì)應(yīng)的告警閥值內(nèi)容,而不會(huì)遺漏原本需要調(diào)低的告警信息、或耗費(fèi)大量的工作量查看原本需要調(diào)高的告警信息進(jìn)行告警的排查,從而可節(jié)約出更多時(shí)間進(jìn)行IT運(yùn)維的其它工作。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。