本發(fā)明涉及IT運(yùn)維中智能監(jiān)控技術(shù)領(lǐng)域,更具體地,涉及信息系統(tǒng)運(yùn)行狀態(tài)預(yù)測技術(shù)領(lǐng)域。
背景技術(shù):
目前,隨著信息系統(tǒng)的日益廣泛以及不同領(lǐng)域的業(yè)務(wù)種類的日益豐富,基于海量數(shù)據(jù)存儲與處理的計(jì)算信息系統(tǒng)的應(yīng)用變得越來越廣泛,由此,隨著用于大量運(yùn)算速度及存儲量的主機(jī)、中間件及數(shù)據(jù)庫的數(shù)量的顯著增長,其發(fā)生故障的概率以及不良影響也越來越大,因此,對信息系統(tǒng)運(yùn)行狀態(tài)進(jìn)行有效的預(yù)測變得越來越重要。
在信息運(yùn)維過程中,支撐應(yīng)用系統(tǒng)運(yùn)行的監(jiān)控指標(biāo)有很多,通過這些監(jiān)控指標(biāo)可以發(fā)現(xiàn)應(yīng)用系統(tǒng)的運(yùn)行狀況。
現(xiàn)有的技術(shù)方案存在如下問題需要解決:(1)如何識別關(guān)鍵監(jiān)控指標(biāo)(KPI),以減少不重要的監(jiān)控指標(biāo);(2)如何通過這些關(guān)鍵的監(jiān)控指標(biāo)綜合判斷應(yīng)用系統(tǒng)的運(yùn)行狀況;(3)如何提前預(yù)測系統(tǒng)的運(yùn)行狀況。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明提供一種克服上述問題或者至少部分地解決上述問題的方法和裝置。
根據(jù)本發(fā)明的一個方面,如圖1所示,提供了一種信息系統(tǒng)運(yùn)行狀態(tài)預(yù)測方法,包括以下步驟,S1.基于信息系統(tǒng)數(shù)據(jù),利用粗糙集算法識別出信息系統(tǒng)的關(guān)鍵監(jiān)控指標(biāo);S2.基于信息系統(tǒng)數(shù)據(jù),利用關(guān)聯(lián)規(guī)則挖掘算法建立各關(guān)鍵監(jiān)控指標(biāo)與信息系統(tǒng)運(yùn)行狀態(tài)間的關(guān)聯(lián)規(guī)則;S3.基于信息系統(tǒng)實(shí)時監(jiān)控?cái)?shù)據(jù),利用所得關(guān)聯(lián)規(guī)則,結(jié)合預(yù)測算法,進(jìn)行信息系統(tǒng)運(yùn)行狀態(tài)的預(yù)測。
根據(jù)本發(fā)明的另一個方面,如圖2所示,提供了一種信息系統(tǒng)運(yùn)行狀態(tài)預(yù)測裝置,包括以下模塊,采集模塊,用于采集信息系統(tǒng)數(shù)據(jù);處理模塊,用于基于信息系統(tǒng)數(shù)據(jù),利用粗糙集算法識別出信息系統(tǒng)的關(guān)鍵監(jiān)控指標(biāo);基于信息系統(tǒng)數(shù)據(jù),利用關(guān)聯(lián)規(guī)則挖掘算法建立各關(guān)鍵監(jiān)控指標(biāo)與信息系統(tǒng)運(yùn)行狀態(tài)間的關(guān)聯(lián)規(guī)則;基于信息系統(tǒng)實(shí)時監(jiān)控?cái)?shù)據(jù),利用所得關(guān)聯(lián)規(guī)則,結(jié)合預(yù)測算法,進(jìn)行信息系統(tǒng)運(yùn)行狀態(tài)的預(yù)測。
本申請?zhí)岢鲆环N信息系統(tǒng)運(yùn)行狀態(tài)預(yù)測方法和裝置,利用粗糙集算法識別出信息系統(tǒng)的關(guān)鍵監(jiān)控指標(biāo)、利用關(guān)聯(lián)規(guī)則挖掘算法建立各關(guān)鍵監(jiān)控指標(biāo)與信息系統(tǒng)運(yùn)行狀態(tài)間的關(guān)聯(lián)規(guī)則、利用預(yù)測算法技術(shù)以預(yù)測信息系統(tǒng)的運(yùn)行狀況。本發(fā)明具有效率高、運(yùn)用關(guān)鍵指標(biāo)準(zhǔn)確預(yù)測信息系統(tǒng)運(yùn)行狀態(tài)的有益效果。
附圖說明
圖1為根據(jù)本發(fā)明實(shí)施例的信息系統(tǒng)運(yùn)行狀態(tài)預(yù)測方法的總體流程示意圖;
圖2為根據(jù)本發(fā)明實(shí)施例的信息系統(tǒng)運(yùn)行狀態(tài)預(yù)測裝置的總體結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例,對本發(fā)明的具體實(shí)施方式作進(jìn)一步詳細(xì)描述。以下實(shí)施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍。
在一個具體實(shí)施例中,以某營銷基礎(chǔ)數(shù)據(jù)平臺信息系統(tǒng)運(yùn)行狀態(tài)預(yù)測為例,結(jié)合附圖對本發(fā)明進(jìn)行進(jìn)一步的說明。
圖1給出了根據(jù)本發(fā)明實(shí)施例的一種信息系統(tǒng)運(yùn)行狀態(tài)預(yù)測方法的總體流程示意圖??偟膩碚f,該方法包括:S1.基于信息系統(tǒng)數(shù)據(jù),利用粗糙集算法識別出信息系統(tǒng)的關(guān)鍵監(jiān)控指標(biāo);S2.基于信息系統(tǒng)數(shù)據(jù),利用關(guān)聯(lián)規(guī)則挖掘算法建立各關(guān)鍵監(jiān)控指標(biāo)與信息系統(tǒng)運(yùn)行狀態(tài)間的關(guān)聯(lián)規(guī)則;S3.基于信息系統(tǒng)實(shí)時監(jiān)控?cái)?shù)據(jù),利用所得關(guān)聯(lián)規(guī)則,結(jié)合預(yù)測算法,進(jìn)行信息系統(tǒng)運(yùn)行狀態(tài)的預(yù)測。利用大數(shù)據(jù)技術(shù)及數(shù)據(jù)挖掘方法對業(yè)務(wù)系統(tǒng)進(jìn)行關(guān)聯(lián)規(guī)則挖掘,可以發(fā)現(xiàn)支撐業(yè)務(wù)系統(tǒng)運(yùn)行的主機(jī)、中間件及數(shù)據(jù)庫等資源與業(yè)務(wù)系統(tǒng)的關(guān)聯(lián)關(guān)系,同時也可以挖掘出業(yè)務(wù)系統(tǒng)之間的關(guān)聯(lián)關(guān)系,這對與業(yè)務(wù)系統(tǒng)故障定位及提前預(yù)判有著重要意義,是自動化巡檢中的一個關(guān)鍵技術(shù)。此外,對于一些重要的系統(tǒng)(比如營銷系統(tǒng))運(yùn)行狀況的提前預(yù)判,可以讓我們能夠及時處理將來可能發(fā)生的問題,從而提升客戶體驗(yàn)。
在本發(fā)明一個具體實(shí)施例中,所述步驟S1包括,
1)確定條件屬性C和決策屬性D,并且用字母編號決策表中數(shù)據(jù)。
2)對條件屬性進(jìn)行約簡,刪除多余的屬性,本文利用屬性的依賴度分析方法來完成約簡和求核。
在本發(fā)明另一個具體實(shí)施例中,步驟S2中所述“關(guān)聯(lián)規(guī)則挖掘算法”還包括以下步驟:
利用改進(jìn)的Apriori算法建立各監(jiān)控指標(biāo)與信息系統(tǒng)運(yùn)行狀態(tài)的關(guān)聯(lián)規(guī)則;所述算法改進(jìn)點(diǎn)在于:利用頻繁項(xiàng)目集Lk-1對所述數(shù)據(jù)進(jìn)行篩選,如果Lk-1沒有包含集合k,則不對該頻繁項(xiàng)目集Lk-1進(jìn)行后續(xù)計(jì)算。
在本發(fā)明另一個具體實(shí)施例中,步驟S2中所述“關(guān)聯(lián)規(guī)則挖掘算法”還包括以下步驟:利用Apriori算法建立各監(jiān)控指標(biāo)與信息系統(tǒng)運(yùn)行狀態(tài)的關(guān)聯(lián)規(guī)則。
在本發(fā)明另一個具體實(shí)施例中,步驟S3還包括以下步驟:利用數(shù)據(jù)擬合技術(shù)進(jìn)行信息系統(tǒng)運(yùn)行狀態(tài)的預(yù)測??梢岳斫鉃?,本發(fā)明用于實(shí)現(xiàn)信息系統(tǒng)運(yùn)行狀態(tài)的預(yù)測不僅限于數(shù)據(jù)擬合算法,還可以利用但不限于以下算法:簡易平均算法、移動平均算法、指數(shù)平滑算法、線性回歸算法
在本發(fā)明另一個具體實(shí)施例中,所述步驟S1前還包括以下步驟,S001.采集信息系統(tǒng)數(shù)據(jù)S002.將所述信息系統(tǒng)數(shù)據(jù)歸一化處理,將數(shù)據(jù)都限定在[0,1]范圍內(nèi)。
在本發(fā)明另一個具體實(shí)施例中,步驟S12具體方式如下:
①求出條件屬性C的等價集;
②求出決策屬性D的等價集;
③求出決策屬性的各等價集的下近似集;
④以條件屬性A為例,計(jì)算條件屬性C相對于決策屬性D的重要性γ(C,D),以及γ(C-{A},D);
⑤求A的重要度Sig(A,C,D)
Sig(A,C,D)=γ(C,D)-γ(C-{A},D)
Sig(A,C,D)>0表示屬性是重要的,否則表示屬性是不必要冗余的,去掉它們后對分類結(jié)果不產(chǎn)生任何影響。通過這種方法就可以識別出關(guān)鍵的監(jiān)控指標(biāo)(KPI)。
在本發(fā)明的又一個實(shí)施例中,所述“關(guān)聯(lián)規(guī)則挖掘算法”還包括以下步驟:
S21.若|Lk-1|<k,則輸出Ck=φ;若|Lk-1|≥k,則計(jì)算出候選k項(xiàng)目集Ck;
S22.若CK≠φ,則計(jì)算出候選項(xiàng)目集Ck的各個候選項(xiàng)目支持度,求得k項(xiàng)目集合Lk。
在本發(fā)明另一個具體實(shí)施例中,所述“關(guān)聯(lián)規(guī)則挖掘算法”還包括以下步驟:
S21.若|Lk-1|<k,則輸出Ck=φ;若|Lk-1|≥k,則計(jì)算出候選k項(xiàng)目集Ck;
S22.若CK≠φ,則計(jì)算出候選項(xiàng)目集Ck的各個候選項(xiàng)目支持度,求得k項(xiàng)目集合Lk。
單個信息系統(tǒng)通常由主機(jī)、中間件和數(shù)據(jù)庫構(gòu)成的有機(jī)整體,它們之間是相互關(guān)聯(lián)的。因此我們需要挖掘出各監(jiān)控指標(biāo)與信息系統(tǒng)運(yùn)行狀態(tài)的關(guān)聯(lián)規(guī)則,這樣就可以通過它們之間的關(guān)聯(lián)關(guān)系預(yù)判信息系統(tǒng)是否存在問題。我們以營銷基礎(chǔ)數(shù)據(jù)平臺系統(tǒng)為例,進(jìn)行關(guān)聯(lián)分析。
營銷基礎(chǔ)數(shù)據(jù)平臺系統(tǒng)主要包括2臺數(shù)據(jù)庫服務(wù)器和4臺應(yīng)用服務(wù)器(包括主機(jī)和中間件)。
這里我們進(jìn)行關(guān)聯(lián)分析的監(jiān)控指標(biāo)包括數(shù)據(jù)庫的“數(shù)據(jù)庫表空間”與“數(shù)據(jù)庫狀態(tài)”兩個指標(biāo)、中間件的“JVM運(yùn)行時間”一個指標(biāo)、主機(jī)的“CPU利用率”一個指標(biāo),總共4個監(jiān)控指標(biāo)。通過對數(shù)據(jù)庫中各監(jiān)控指標(biāo)的各個字段的分析和研究,我們發(fā)現(xiàn)可以根據(jù)各個監(jiān)控指標(biāo)的category字段(good\warning\error)來進(jìn)行關(guān)聯(lián)分析。在本文中,我們利用改進(jìn)的Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則的挖掘,以發(fā)現(xiàn)各個監(jiān)控指標(biāo)之間的關(guān)聯(lián)關(guān)系。在這里,所有支持度大于最小支持度的項(xiàng)集稱為頻繁項(xiàng)集,簡稱頻集。為了便于分析,我們分別對各個指標(biāo)的category字段的值進(jìn)行標(biāo)記,標(biāo)記規(guī)則如表I所示。
表I標(biāo)記規(guī)則
我們對2016年3月1日至3月8日的某公司信息中心的監(jiān)控?cái)?shù)據(jù)進(jìn)行了關(guān)聯(lián)分析,分析出不同的最小支持度和可信度時的關(guān)聯(lián)規(guī)則,結(jié)果如下:
當(dāng)min_support=60000,min_confidence=0.9時,其關(guān)聯(lián)規(guī)則有:
比如關(guān)聯(lián)規(guī)則"a11"^"c11"->"b11"^"a21":0.98922274432,表示數(shù)據(jù)庫表空間是good、JVM運(yùn)行時間good時,CPU利用率是good,那么應(yīng)用系統(tǒng)的狀態(tài)是good(正常狀態(tài)),這個關(guān)聯(lián)規(guī)則的可信度為98.9%。
通過預(yù)測算法預(yù)測出數(shù)據(jù)庫表空間、JVM運(yùn)行時間和CPU利用率在將來的某個時刻的狀態(tài),就可以通過它們之間的關(guān)聯(lián)規(guī)則,預(yù)測出應(yīng)用系統(tǒng)在將來的某個時刻的運(yùn)行狀態(tài)。
在本發(fā)明的又一個實(shí)施例中,步驟S002更具體地,主要包括以下的步驟:
其中,為歸一化后的數(shù)據(jù),xmin和xmax分別為原始數(shù)據(jù)的最小值和最大值,以為數(shù)據(jù)個數(shù)。
如圖2所示,本發(fā)明的一種信息系統(tǒng)運(yùn)行狀態(tài)預(yù)測裝置的總體結(jié)構(gòu)示意圖,包括:
A1采集模塊,用于采集信息系統(tǒng)數(shù)據(jù);
A2處理模塊,用于基于信息系統(tǒng)數(shù)據(jù),利用粗糙集算法識別出信息系統(tǒng)的關(guān)鍵監(jiān)控指標(biāo);基于信息系統(tǒng)數(shù)據(jù),利用關(guān)聯(lián)規(guī)則挖掘算法建立各關(guān)鍵監(jiān)控指標(biāo)與信息系統(tǒng)運(yùn)行狀態(tài)間的關(guān)聯(lián)規(guī)則;基于信息系統(tǒng)實(shí)時監(jiān)控?cái)?shù)據(jù),利用所得關(guān)聯(lián)規(guī)則,結(jié)合預(yù)測算法,進(jìn)行信息系統(tǒng)運(yùn)行狀態(tài)的預(yù)測;
A3輸出模塊,用于輸出信息系統(tǒng)運(yùn)行狀態(tài)的預(yù)測結(jié)果。
最后,本申請的方法僅為較佳的實(shí)施方案,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。