本發(fā)明涉及異常檢測技術(shù)領(lǐng)域,特別涉及一種報(bào)警方法及裝置。
背景技術(shù):
異常檢測旨在檢測出不符合期望行為的數(shù)據(jù),因而適應(yīng)于故障診斷、入侵和欺詐檢測以及數(shù)據(jù)預(yù)處理等多個(gè)領(lǐng)域。時(shí)間序列是指將同一統(tǒng)計(jì)指標(biāo)的數(shù)值按其發(fā)生的時(shí)間先后順序排列而成的數(shù)列,時(shí)間序列在工業(yè)、金融業(yè)以及通信業(yè)等各個(gè)領(lǐng)域普遍存在,因此基于時(shí)間序列的異常檢測有著非常重要的作用。
實(shí)際應(yīng)用中,對(duì)每一個(gè)需要進(jìn)行異常檢測的對(duì)象進(jìn)行監(jiān)控時(shí),對(duì)所監(jiān)控到的時(shí)間序列進(jìn)行曲線擬合處理,可以得到該對(duì)象對(duì)應(yīng)的曲線。
以it運(yùn)維為例,無論是網(wǎng)絡(luò)流量的監(jiān)控、磁盤容量的監(jiān)控、還是響應(yīng)時(shí)間的監(jiān)控,時(shí)間序列異常檢測均可以幫助用戶及時(shí)發(fā)現(xiàn)服務(wù)運(yùn)行中出現(xiàn)的問題,比如曲線出現(xiàn)突變、曲線中的某一點(diǎn)與歷史數(shù)據(jù)不相符等等,發(fā)現(xiàn)異常時(shí),通常還會(huì)對(duì)檢測到的異常進(jìn)行報(bào)警,以提醒用戶對(duì)異常進(jìn)行處理。目前,時(shí)間序列異常檢測系統(tǒng)使用通用的異常檢測算法來檢測異常,并且對(duì)檢測到的每個(gè)異常都會(huì)進(jìn)行報(bào)警。
然而用戶對(duì)于異常的報(bào)警需求是不盡相同的。以出現(xiàn)突變的異常為例,對(duì)于磁盤剩余容量的監(jiān)控,用戶只對(duì)磁盤剩余容量的突然減小感興趣,因?yàn)榇藭r(shí)他們需要增加硬盤或者刪除文件,而磁盤剩余容量的突然增加并不會(huì)導(dǎo)致問題的出現(xiàn),因此在磁盤剩余容量突然減小時(shí)應(yīng)當(dāng)報(bào)警、而突然增加的情況無需報(bào)警;進(jìn)一步的,在磁盤剩余容量突然減小時(shí),用戶a認(rèn)為在磁盤剩余容量減小到閾值t1時(shí)需要報(bào)警,而用戶b認(rèn)為在磁盤剩余容量減小到閾值t2時(shí)才需要報(bào)警。
從上述例子可以發(fā)現(xiàn),相同類型的異常,有些情況需要報(bào)警而有些情況下不需要報(bào)警,即相同異常的報(bào)警規(guī)則是不一樣的。目前,傳統(tǒng)的異常檢測系統(tǒng)對(duì)于相同異常只能提供一種統(tǒng)一的報(bào)警規(guī)則,導(dǎo)致報(bào)警的準(zhǔn)確率不高。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例的目的在于提供一種報(bào)警方法及裝置,以提高報(bào)警的準(zhǔn)確率。具體技術(shù)方案如下:
為達(dá)到上述目的,本發(fā)明實(shí)施例公開了一種報(bào)警方法,所述方法包括:
獲得目標(biāo)曲線中預(yù)設(shè)時(shí)長內(nèi)的目標(biāo)曲線段,其中,所述目標(biāo)曲線段中包含目標(biāo)異常點(diǎn);
從所述目標(biāo)曲線段中提取所述目標(biāo)異常點(diǎn)對(duì)應(yīng)的目標(biāo)特征信息;
根據(jù)所述目標(biāo)特征信息和預(yù)先構(gòu)建的所述目標(biāo)曲線對(duì)應(yīng)的目標(biāo)預(yù)測模型,預(yù)測所述目標(biāo)異常點(diǎn)所對(duì)應(yīng)的目標(biāo)異常處理類別,其中,所述目標(biāo)預(yù)測模型是基于標(biāo)記樣本以及所述標(biāo)記樣本對(duì)應(yīng)的特征信息進(jìn)行訓(xùn)練得到的,所述標(biāo)記樣本為所述目標(biāo)曲線中標(biāo)記有異常處理類別的異常點(diǎn);
當(dāng)所述目標(biāo)異常處理類別為預(yù)設(shè)報(bào)警類別時(shí),針對(duì)所述目標(biāo)異常點(diǎn)進(jìn)行報(bào)警。
可選的,按照以下方式訓(xùn)練所述目標(biāo)預(yù)測模型:
獲得所述目標(biāo)曲線對(duì)應(yīng)的標(biāo)記樣本;
提取所述標(biāo)記樣本對(duì)應(yīng)的特征信息;
根據(jù)所述標(biāo)記樣本的特征信息和對(duì)應(yīng)的異常處理類別,訓(xùn)練所述目標(biāo)預(yù)測模型。
可選的,按照以下方式訓(xùn)練所述目標(biāo)預(yù)測模型:
獲得所述目標(biāo)曲線對(duì)應(yīng)的標(biāo)記樣本和非標(biāo)記樣本,其中,所述非標(biāo)記樣本為未標(biāo)記異常處理類別的異常點(diǎn);
分別提取所述標(biāo)記樣本和所述非標(biāo)記樣本對(duì)應(yīng)的特征信息;
根據(jù)所述非標(biāo)記樣本的特征信息、所述標(biāo)記樣本的特征信息和對(duì)應(yīng)的異常處理類別,訓(xùn)練所述目標(biāo)預(yù)測模型。
可選的,在所述針對(duì)所述目標(biāo)異常點(diǎn)進(jìn)行報(bào)警之后,還包括:
在接收到用戶對(duì)所述目標(biāo)異常點(diǎn)標(biāo)記的異常處理類別時(shí),將所述目標(biāo)異常點(diǎn)作為標(biāo)記樣本,對(duì)所述目標(biāo)預(yù)測模型進(jìn)行再次訓(xùn)練,得到新的目標(biāo)預(yù)測模型。
可選的,所述目標(biāo)預(yù)測模型為隨機(jī)森林模型。
為達(dá)到上述目的,本發(fā)明實(shí)施例還公開了一種報(bào)警裝置,所述裝置包括:
獲得模塊,用于獲得目標(biāo)曲線中預(yù)設(shè)時(shí)長內(nèi)的目標(biāo)曲線段,其中,所述目標(biāo)曲線段中包含目標(biāo)異常點(diǎn);
提取模塊,用于從所述目標(biāo)曲線段中提取所述目標(biāo)異常點(diǎn)對(duì)應(yīng)的目標(biāo)特征信息;
預(yù)測模塊,用于根據(jù)所述目標(biāo)特征信息和預(yù)先構(gòu)建的所述目標(biāo)曲線對(duì)應(yīng)的目標(biāo)預(yù)測模型,預(yù)測所述目標(biāo)異常點(diǎn)所對(duì)應(yīng)的目標(biāo)異常處理類別,其中,所述目標(biāo)預(yù)測模型是基于標(biāo)記樣本以及所述標(biāo)記樣本對(duì)應(yīng)的特征信息進(jìn)行訓(xùn)練得到的,所述標(biāo)記樣本為所述目標(biāo)曲線中標(biāo)記有異常處理類別的異常點(diǎn);
報(bào)警模塊,用于當(dāng)所述目標(biāo)異常處理類別為預(yù)設(shè)報(bào)警類別時(shí),針對(duì)所述目標(biāo)異常點(diǎn)進(jìn)行報(bào)警。
可選的,所述裝置還包括:
第一訓(xùn)練模塊,用于訓(xùn)練所述目標(biāo)預(yù)測模型;
其中,所述第一訓(xùn)練模塊,包括:
第一獲得子模塊,用于獲得所述目標(biāo)曲線對(duì)應(yīng)的標(biāo)記樣本;
第一提取子模塊,用于提取所述標(biāo)記樣本對(duì)應(yīng)的特征信息;
第一訓(xùn)練子模塊,用于根據(jù)所述標(biāo)記樣本的特征信息和對(duì)應(yīng)的異常處理類別,訓(xùn)練所述目標(biāo)預(yù)測模型。
可選的,所述裝置還包括:
第二訓(xùn)練模塊,用于訓(xùn)練所述目標(biāo)預(yù)測模型;
其中,所述第二訓(xùn)練模塊,包括:
第二獲得子模塊,用于獲得所述目標(biāo)曲線對(duì)應(yīng)的標(biāo)記樣本和非標(biāo)記樣本,其中,所述非標(biāo)記樣本為未標(biāo)記異常處理類別的異常點(diǎn);
第二提取子模塊,用于分別提取所述標(biāo)記樣本和所述非標(biāo)記樣本對(duì)應(yīng)的特征信息;
第二訓(xùn)練子模塊,用于根據(jù)所述非標(biāo)記樣本的特征信息、所述標(biāo)記樣本的特征信息和對(duì)應(yīng)的異常處理類別,訓(xùn)練所述目標(biāo)預(yù)測模型。
可選的,所述裝置還包括:
第三訓(xùn)練模塊,用于在所述報(bào)警模塊針對(duì)所述目標(biāo)異常點(diǎn)進(jìn)行報(bào)警之后,在接收到用戶對(duì)所述目標(biāo)異常點(diǎn)標(biāo)記的異常處理類別時(shí),將所述目標(biāo)異常點(diǎn)作為標(biāo)記樣本,對(duì)所述目標(biāo)預(yù)測模型進(jìn)行再次訓(xùn)練,得到新的目標(biāo)預(yù)測模型。
可選的,所述目標(biāo)預(yù)測模型為隨機(jī)森林模型。
由以上可見,本發(fā)明實(shí)施例提供的報(bào)警方法及裝置,對(duì)于目標(biāo)曲線中的異常點(diǎn),可以利用目標(biāo)預(yù)測模型來預(yù)測該異常點(diǎn)的異常處理類別,當(dāng)異常處理類別為預(yù)設(shè)報(bào)警類別時(shí),會(huì)針對(duì)該異常點(diǎn)進(jìn)行報(bào)警。目標(biāo)預(yù)測模型是基于目標(biāo)曲線中的標(biāo)記樣本以及標(biāo)記樣本對(duì)應(yīng)的特征信息進(jìn)行訓(xùn)練得到的,由于不同用戶對(duì)同一曲線的異常點(diǎn)所標(biāo)記的異常處理類別可能不同、同一用戶對(duì)不同曲線的異常點(diǎn)所標(biāo)記的異常處理類別也可能不同,因此對(duì)于不同的用戶或不同的曲線,可以得到相應(yīng)的預(yù)測模型,進(jìn)而可以對(duì)不同的用戶或不同的曲線,有針對(duì)性地進(jìn)行報(bào)警,提高報(bào)警的準(zhǔn)確率。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明實(shí)施例提供的一種報(bào)警方法的流程示意圖;
圖2為本發(fā)明實(shí)施例提供的一種報(bào)警裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
為解決現(xiàn)有技術(shù)問題,本發(fā)明實(shí)施例提供了一種報(bào)警方法及裝置。下面首先對(duì)本發(fā)明實(shí)施例所提供的一種報(bào)警方法進(jìn)行詳細(xì)說明。
圖1為本發(fā)明實(shí)施例提供的一種報(bào)警方法的流程示意圖,如圖1所示,該方法包括:
s101,獲得目標(biāo)曲線中預(yù)設(shè)時(shí)長內(nèi)的目標(biāo)曲線段,其中,目標(biāo)曲線段中包含目標(biāo)異常點(diǎn)。
可以理解的,在基于時(shí)間序列的異常檢測中,每一個(gè)監(jiān)控對(duì)象對(duì)應(yīng)一個(gè)曲線,例如,如果同時(shí)監(jiān)控一臺(tái)服務(wù)器的網(wǎng)絡(luò)流量、磁盤容量,則可以得到兩條曲線,即該服務(wù)器的網(wǎng)絡(luò)流量對(duì)應(yīng)的曲線和磁盤容量對(duì)應(yīng)的曲線,如果同時(shí)監(jiān)控兩臺(tái)服務(wù)器的網(wǎng)絡(luò)流量,則可以得到兩條曲線,即每臺(tái)服務(wù)器的網(wǎng)絡(luò)流量對(duì)應(yīng)的曲線。
實(shí)際應(yīng)用中,目標(biāo)曲線可以由異常檢測系統(tǒng)在監(jiān)控過程中根據(jù)檢測到的時(shí)間序列生成的。進(jìn)一步的,異常檢測系統(tǒng)可以根據(jù)預(yù)設(shè)的判斷標(biāo)準(zhǔn),判斷目標(biāo)曲線中的每一個(gè)點(diǎn)是否是異常點(diǎn),具體的,異常檢測系統(tǒng)對(duì)于異常點(diǎn)的判斷標(biāo)準(zhǔn)可以參考現(xiàn)有技術(shù)的方法,本實(shí)施例對(duì)此不做贅述。需要強(qiáng)調(diào)的是,本實(shí)施例并不對(duì)目標(biāo)曲線的獲得方式以及目標(biāo)異常點(diǎn)的獲得方式進(jìn)行限定。
s102,從目標(biāo)曲線段中提取目標(biāo)異常點(diǎn)對(duì)應(yīng)的目標(biāo)特征信息。
可以理解的,目標(biāo)曲線段所包含的點(diǎn)對(duì)應(yīng)的數(shù)據(jù)可以理解為與目標(biāo)異常點(diǎn)相應(yīng)的歷史數(shù)據(jù),則目標(biāo)曲線段的特征信息可以理解為對(duì)應(yīng)目標(biāo)異常點(diǎn)對(duì)應(yīng)的目標(biāo)特征信息。
實(shí)際應(yīng)用中,曲線段中可以提取的特征信息包括:曲線周期性、趨勢、季節(jié)性、自相關(guān)性、偏度、峰度、線性程度、自相似性、混沌系數(shù)、t時(shí)間內(nèi)異常點(diǎn)個(gè)數(shù),等等中的一個(gè)或多個(gè),其中t可以取半小時(shí)。具體的,從曲線段中提取特征信息的方法為現(xiàn)有技術(shù),在此不做贅述。
s103,根據(jù)目標(biāo)特征信息和預(yù)先構(gòu)建的目標(biāo)曲線對(duì)應(yīng)的目標(biāo)預(yù)測模型,預(yù)測目標(biāo)異常點(diǎn)所對(duì)應(yīng)的目標(biāo)異常處理類別。
其中,目標(biāo)預(yù)測模型是基于標(biāo)記樣本以及標(biāo)記樣本對(duì)應(yīng)的特征信息進(jìn)行訓(xùn)練得到的,標(biāo)記樣本為目標(biāo)曲線中標(biāo)記有異常處理類別的異常點(diǎn)。
實(shí)際應(yīng)用中,用戶可以將異常處理類別劃分為:需要報(bào)警、是異常但是不需要報(bào)警、不是異常等類別;也可以劃分為:一類、二類、三類等類別,其中,一類可以表示需要報(bào)警、二類可以表示是異常但是不需要報(bào)警、三類可以表示不是異常。其中,根據(jù)用戶的需要,需要報(bào)警的類別還可以進(jìn)一步劃分,例如,報(bào)警后需要立即處理、報(bào)警后不需要立即處理等類別。當(dāng)然,還可以按照其它方式進(jìn)行劃分,本實(shí)施例對(duì)此不做限定。
在本實(shí)施例中,目標(biāo)預(yù)測模型的輸入為目標(biāo)異常點(diǎn)對(duì)應(yīng)的目標(biāo)特征信息,輸出為目標(biāo)異常點(diǎn)所對(duì)應(yīng)的目標(biāo)異常處理類別。上述目標(biāo)預(yù)測模型可以為隨機(jī)森林模型,隨機(jī)森林模型也稱為協(xié)同森林模型,隨機(jī)森林顧名思義,是用隨機(jī)的方式建立一個(gè)森林,森林里面有很多決策樹組成,每一棵決策樹之間是沒有關(guān)聯(lián)的,在得到森林之后,當(dāng)有一個(gè)新的輸入樣本進(jìn)入的時(shí)候,就讓森林中的每一棵決策樹分別進(jìn)行一下判斷,看看這個(gè)樣本應(yīng)該屬于哪一類,然后看看哪一類被選擇最多,就預(yù)測這個(gè)樣本為那一類。
在一種實(shí)現(xiàn)方式中,可以按照以下方式訓(xùn)練目標(biāo)預(yù)測模型:
獲得目標(biāo)曲線對(duì)應(yīng)的標(biāo)記樣本;
提取標(biāo)記樣本對(duì)應(yīng)的特征信息;
根據(jù)標(biāo)記樣本的特征信息和對(duì)應(yīng)的異常處理類別,訓(xùn)練目標(biāo)預(yù)測模型。
提取標(biāo)記樣本對(duì)應(yīng)的特征信息,也就是從目標(biāo)曲線中預(yù)設(shè)時(shí)長的曲線段中提取特征信息,該曲線段中包含標(biāo)記樣本。具體的,提取標(biāo)記樣本對(duì)應(yīng)的特征信息的方式與上述提取目標(biāo)異常點(diǎn)對(duì)應(yīng)的目標(biāo)特征信息的方式相同,在此不做贅述。
本領(lǐng)域技術(shù)人員可以理解的是,上述訓(xùn)練目標(biāo)預(yù)測模型的方式為機(jī)器學(xué)習(xí)中的有監(jiān)督式學(xué)習(xí)(supervisedlearning)算法。由于上述有監(jiān)督學(xué)習(xí)的訓(xùn)練方式只能利用目標(biāo)曲線中的標(biāo)記有異常處理類別的異常點(diǎn)、無法利用未標(biāo)記異常處理類別的異常點(diǎn),因此需要較多的標(biāo)記樣本進(jìn)行訓(xùn)練,以提高目標(biāo)預(yù)測模型的預(yù)測精度。
而實(shí)際上,用戶不一定對(duì)所有出現(xiàn)的異常點(diǎn)都進(jìn)行標(biāo)記,而是只對(duì)部分異常點(diǎn)標(biāo)記了異常處理類別,因此并不是所有的異常點(diǎn)都是標(biāo)記樣本,即標(biāo)記樣本的數(shù)量有限,這樣導(dǎo)致有監(jiān)督式學(xué)習(xí)算法所訓(xùn)練出的預(yù)測模型的準(zhǔn)確度不高。
那么在這種情況下,為了提高目標(biāo)預(yù)測模型的預(yù)測精度,在一種較佳的實(shí)現(xiàn)方式中,可以利用機(jī)器學(xué)習(xí)算法中的無監(jiān)督式學(xué)習(xí)(unsupervisedlearning)算法,同時(shí)利用標(biāo)記樣本和未標(biāo)記樣本進(jìn)行訓(xùn)練得到預(yù)測模型。
具體的,可以按照以下方式訓(xùn)練目標(biāo)預(yù)測模型:
獲得目標(biāo)曲線對(duì)應(yīng)的標(biāo)記樣本和非標(biāo)記樣本,其中,非標(biāo)記樣本為未標(biāo)記異常處理類別的異常點(diǎn);
分別提取標(biāo)記樣本和非標(biāo)記樣本對(duì)應(yīng)的特征信息;
根據(jù)非標(biāo)記樣本的特征信息、標(biāo)記樣本的特征信息和對(duì)應(yīng)的異常處理類別,訓(xùn)練目標(biāo)預(yù)測模型。
下面對(duì)上述“根據(jù)非標(biāo)記樣本的特征信息、標(biāo)記樣本的特征信息和對(duì)應(yīng)的異常處理類別,訓(xùn)練目標(biāo)預(yù)測模型”的步驟進(jìn)行詳細(xì)說明:
步驟1、只利用標(biāo)記樣本的集合l中的標(biāo)記樣本,訓(xùn)練出一個(gè)初始的隨機(jī)森林,其中有n棵樹,一種特征信息對(duì)應(yīng)一棵樹;
步驟2、對(duì)每棵樹hi,從未標(biāo)記樣本的集合u中選擇置信度最高的未標(biāo)記樣本,如果該未標(biāo)記樣本的置信度超過閾值p,則將其加入集合li,并將該未標(biāo)記樣本的異常處理類別標(biāo)記為多數(shù)樹的分類結(jié)果;
其中,該未標(biāo)記樣本的置信度為集合hi中的樹對(duì)該未標(biāo)記樣本的分類結(jié)果的一致程度,集合hi是由除該樹hi以外的其它樹所組成的集合;如果集合hi中的樹對(duì)該未標(biāo)記樣本的分類結(jié)果都相同,那么該未標(biāo)記樣本的置信度為1;
舉例而言,如果n=8,則集合hi中包含7棵樹,對(duì)于集合u中的每一個(gè)未標(biāo)記樣本u,根據(jù)該未標(biāo)記樣本u的的特征信息可以確定集合hi中的每一棵樹對(duì)該未標(biāo)記樣本u的分類結(jié)果,如果有2棵樹將該未標(biāo)記樣本u的異常處理類別歸為一類、其它5棵樹將該未標(biāo)記樣本u的異常處理類別歸為二類,則該未標(biāo)記樣本u的置信度為5/7,如果5/7大于預(yù)設(shè)的閾值p,則表示該未標(biāo)記樣本u可以用來訓(xùn)練樹hi,并且該未標(biāo)記樣本u的異常處理類別應(yīng)當(dāng)標(biāo)記為二類;
步驟3、對(duì)每棵樹hi,重新利用集合l∪li中的標(biāo)記樣本進(jìn)行單棵樹的訓(xùn)練;
步驟4、重復(fù)步驟2~步驟3,直至所有樹的訓(xùn)練結(jié)果均不再變化。
需要說明的是,本領(lǐng)域技術(shù)人員可以理解的,本質(zhì)上,這種協(xié)同訓(xùn)練方式的半監(jiān)督式學(xué)習(xí)方法在訓(xùn)練預(yù)測模型時(shí),用的也是有監(jiān)督式學(xué)習(xí)算法,區(qū)別在于標(biāo)記樣本集合中標(biāo)記樣本數(shù)量可以不斷增加,而增加的標(biāo)記樣本是由機(jī)器對(duì)未標(biāo)記樣本進(jìn)行標(biāo)記所獲得的、不是用戶標(biāo)記的樣本。利用有監(jiān)督式學(xué)習(xí)算法訓(xùn)練出初始隨機(jī)森林模型后,由于標(biāo)記樣本的數(shù)量比較少,初始隨機(jī)森林模型不太可靠,為了增加可用的樣本數(shù),從未標(biāo)記樣本中選擇一些置信度較高的加入標(biāo)記樣本集合。之后用新的標(biāo)記樣本集合進(jìn)行訓(xùn)練,這其實(shí)也是有監(jiān)督式學(xué)習(xí),只是標(biāo)記樣本集合里面有一些樣本的標(biāo)記是由機(jī)器判斷的。按照這種方法,不斷重復(fù)來擴(kuò)大標(biāo)記樣本集合,可以使得最終得到的隨機(jī)森林模型更加準(zhǔn)確、可靠。
s104,當(dāng)目標(biāo)異常處理類別為預(yù)設(shè)報(bào)警類別時(shí),針對(duì)目標(biāo)異常點(diǎn)進(jìn)行報(bào)警。
實(shí)際應(yīng)用中,可以預(yù)先設(shè)置一種或多種異常處理類別為報(bào)警類別,例如將需要報(bào)警或者一類異常處理類別設(shè)置為報(bào)警類別。當(dāng)預(yù)測得到的目標(biāo)異常處理類別為需要報(bào)警或者一類異常處理類別時(shí),針對(duì)目標(biāo)異常點(diǎn)進(jìn)行報(bào)警,輸出報(bào)警信息。在報(bào)警信息中還可以攜帶本次報(bào)警的標(biāo)識(shí)信息和目標(biāo)曲線的標(biāo)識(shí)信息,以便于進(jìn)行區(qū)分和管理,報(bào)警的標(biāo)識(shí)信息可以理解為每條報(bào)警信息的id(identification,身份標(biāo)識(shí)號(hào)),也稱為報(bào)警id。
報(bào)警的方式可以為聲、光及其組合的方式,也可以為其它的能夠提醒或警示用戶的方式,本實(shí)施例對(duì)此不做限定。進(jìn)一步的,當(dāng)設(shè)置了多種異常處理類別為報(bào)警類別時(shí),還可以對(duì)不同的報(bào)警類別按照不同的方式進(jìn)行報(bào)警,例如以不同顏色的光來區(qū)分不同的報(bào)警類別。
當(dāng)然,當(dāng)目標(biāo)異常處理類別不是預(yù)設(shè)報(bào)警類別時(shí),也可以輸出該目標(biāo)異常點(diǎn)的目標(biāo)異常處理類別,以使用戶可以了解和掌握所監(jiān)控的對(duì)象的運(yùn)行狀況。
在一種實(shí)現(xiàn)方式中,在針對(duì)目標(biāo)異常點(diǎn)進(jìn)行報(bào)警之后,該方法還可以包括:
在接收到用戶對(duì)目標(biāo)異常點(diǎn)標(biāo)記的異常處理類別時(shí),將目標(biāo)異常點(diǎn)作為標(biāo)記樣本,對(duì)目標(biāo)預(yù)測模型進(jìn)行再次訓(xùn)練,得到新的目標(biāo)預(yù)測模型。
可以理解的,在針對(duì)目標(biāo)異常點(diǎn)進(jìn)行報(bào)警之后,用戶可能對(duì)該目標(biāo)異常點(diǎn)的異常處理類別重新進(jìn)行了標(biāo)記,例如,在預(yù)測得到目標(biāo)異常點(diǎn)的目標(biāo)異常處理類別為預(yù)設(shè)報(bào)警類別的情況下,用戶經(jīng)過分析發(fā)現(xiàn)該目標(biāo)異常點(diǎn)并不需要報(bào)警,則用戶可以重新標(biāo)記該目標(biāo)異常點(diǎn)的異常處理類別。
當(dāng)接收到用戶對(duì)目標(biāo)異常點(diǎn)的標(biāo)記信息后,表示目標(biāo)預(yù)測模型的預(yù)測結(jié)果并不符合用戶的需求,因此為了提高目標(biāo)預(yù)測模型預(yù)測的準(zhǔn)確性,可以將目標(biāo)異常點(diǎn)作為標(biāo)記樣本,按照上述訓(xùn)練方法對(duì)目標(biāo)預(yù)測模型進(jìn)行再次訓(xùn)練,得到新的目標(biāo)預(yù)測模型。
實(shí)際應(yīng)用中,當(dāng)用戶所監(jiān)控的對(duì)象較多時(shí),為了便于管理,可以為每個(gè)檢測的曲線賦予一個(gè)標(biāo)識(shí)信息,如曲線id,與該曲線對(duì)應(yīng)的預(yù)測模型、預(yù)測模型的訓(xùn)練、用戶反饋的標(biāo)記信息都可以通過該曲線id進(jìn)行關(guān)聯(lián)。
用戶對(duì)于接收到的報(bào)警信息,可以標(biāo)記所報(bào)警的異常點(diǎn)的異常處理類別,并通過報(bào)警id進(jìn)行反饋,相當(dāng)于用戶幫助系統(tǒng)對(duì)所報(bào)警的異常點(diǎn)進(jìn)行了樣本標(biāo)記。在接收到用戶的反饋信息后,可以將該異常點(diǎn)的特征信息及所標(biāo)記的異常處理類別存儲(chǔ)到數(shù)據(jù)庫中,如關(guān)系型數(shù)據(jù)庫管理系統(tǒng)mysql,以便于后續(xù)利用該異常點(diǎn)對(duì)預(yù)測模型進(jìn)行再次訓(xùn)練。
每條曲線對(duì)應(yīng)的預(yù)測模型可以存儲(chǔ)在數(shù)據(jù)庫中,如mongodb(一個(gè)基于分布式文件存儲(chǔ)的數(shù)據(jù)庫,由c++語言編寫),訓(xùn)練完成某條曲線對(duì)應(yīng)的預(yù)測模型后,會(huì)將該預(yù)測模型存入數(shù)據(jù)庫中,如果該曲線已有預(yù)測模型,則會(huì)覆蓋已有的預(yù)測模型,這樣在該曲線有新的異常點(diǎn)時(shí)可以直接使用新的預(yù)測模型。
需要強(qiáng)調(diào)的是,本實(shí)施例提供的方案利用機(jī)器學(xué)習(xí)訓(xùn)練預(yù)測模型,其中,基于半監(jiān)督式學(xué)習(xí)算法,只需要用戶對(duì)接收到的一部分異常點(diǎn)的報(bào)警信息進(jìn)行簡單的反饋,即可學(xué)習(xí)出用戶的個(gè)性化報(bào)警需求,同時(shí)利用標(biāo)記樣本和未標(biāo)記樣本進(jìn)行學(xué)習(xí),輸出與用戶相關(guān)的預(yù)測模型,提高了報(bào)警的準(zhǔn)確率,減少了用戶人工配置報(bào)警規(guī)則的時(shí)間,而建立報(bào)警規(guī)則需要用戶對(duì)所監(jiān)控的服務(wù)以及使用的異常檢測算法都有一定的了解,因此還可以降低用戶的技能要求。本實(shí)施例提供的方案可以使用在各種流量、磁盤、qps(queriespersecond,每秒查詢率)等時(shí)間序列的監(jiān)控系統(tǒng)中,提供簡單、準(zhǔn)確、個(gè)性化的報(bào)警服務(wù)。
由以上可見,本實(shí)施例提供的報(bào)警方法,對(duì)于目標(biāo)曲線中的異常點(diǎn),可以利用目標(biāo)預(yù)測模型來預(yù)測該異常點(diǎn)的異常處理類別,當(dāng)異常處理類別為預(yù)設(shè)報(bào)警類別時(shí),會(huì)針對(duì)該異常點(diǎn)進(jìn)行報(bào)警。目標(biāo)預(yù)測模型是基于目標(biāo)曲線中的標(biāo)記樣本以及標(biāo)記樣本對(duì)應(yīng)的特征信息進(jìn)行訓(xùn)練得到的,由于不同用戶對(duì)同一曲線的異常點(diǎn)所標(biāo)記的異常處理類別可能不同、同一用戶對(duì)不同曲線的異常點(diǎn)所標(biāo)記的異常處理類別也可能不同,因此對(duì)于不同的用戶或不同的曲線,可以得到相應(yīng)的預(yù)測模型,進(jìn)而可以對(duì)不同的用戶或不同的曲線,有針對(duì)性地進(jìn)行報(bào)警,提高報(bào)警的準(zhǔn)確率。
與上述的報(bào)警方法相對(duì)應(yīng),本發(fā)明實(shí)施例還提供了一種報(bào)警裝置。
與圖1所示的方法實(shí)施例相對(duì)應(yīng),圖2為本發(fā)明實(shí)施例提供的一種報(bào)警裝置的結(jié)構(gòu)示意圖,該裝置可以包括:
獲得模塊201,用于獲得目標(biāo)曲線中預(yù)設(shè)時(shí)長內(nèi)的目標(biāo)曲線段,其中,所述目標(biāo)曲線段中包含目標(biāo)異常點(diǎn);
提取模塊202,用于從所述目標(biāo)曲線段中提取所述目標(biāo)異常點(diǎn)對(duì)應(yīng)的目標(biāo)特征信息;
預(yù)測模塊203,用于根據(jù)所述目標(biāo)特征信息和預(yù)先構(gòu)建的所述目標(biāo)曲線對(duì)應(yīng)的目標(biāo)預(yù)測模型,預(yù)測所述目標(biāo)異常點(diǎn)所對(duì)應(yīng)的目標(biāo)異常處理類別,其中,所述目標(biāo)預(yù)測模型是基于標(biāo)記樣本以及所述標(biāo)記樣本對(duì)應(yīng)的特征信息進(jìn)行訓(xùn)練得到的,所述標(biāo)記樣本為所述目標(biāo)曲線中標(biāo)記有異常處理類別的異常點(diǎn);
報(bào)警模塊204,用于當(dāng)所述目標(biāo)異常處理類別為預(yù)設(shè)報(bào)警類別時(shí),針對(duì)所述目標(biāo)異常點(diǎn)進(jìn)行報(bào)警。
由以上可見,本實(shí)施例提供的報(bào)警裝置,對(duì)于目標(biāo)曲線中的異常點(diǎn),可以利用目標(biāo)預(yù)測模型來預(yù)測該異常點(diǎn)的異常處理類別,當(dāng)異常處理類別為預(yù)設(shè)報(bào)警類別時(shí),會(huì)針對(duì)該異常點(diǎn)進(jìn)行報(bào)警。目標(biāo)預(yù)測模型是基于目標(biāo)曲線中的標(biāo)記樣本以及標(biāo)記樣本對(duì)應(yīng)的特征信息進(jìn)行訓(xùn)練得到的,由于不同用戶對(duì)同一曲線的異常點(diǎn)所標(biāo)記的異常處理類別可能不同、同一用戶對(duì)不同曲線的異常點(diǎn)所標(biāo)記的異常處理類別也可能不同,因此對(duì)于不同的用戶或不同的曲線,可以得到相應(yīng)的預(yù)測模型,進(jìn)而可以對(duì)不同的用戶或不同的曲線,有針對(duì)性地進(jìn)行報(bào)警,提高報(bào)警的準(zhǔn)確率。
具體的,所述裝置還可以包括:
第一訓(xùn)練模塊(圖中未示出),用于訓(xùn)練所述目標(biāo)預(yù)測模型;
其中,所述第一訓(xùn)練模塊,可以包括:
第一獲得子模塊(圖中未示出),用于獲得所述目標(biāo)曲線對(duì)應(yīng)的標(biāo)記樣本;
第一提取子模塊(圖中未示出),用于提取所述標(biāo)記樣本對(duì)應(yīng)的特征信息;
第一訓(xùn)練子模塊(圖中未示出),用于根據(jù)所述標(biāo)記樣本的特征信息和對(duì)應(yīng)的異常處理類別,訓(xùn)練所述目標(biāo)預(yù)測模型。
具體的,所述裝置還可以包括:
第二訓(xùn)練模塊(圖中未示出),用于訓(xùn)練所述目標(biāo)預(yù)測模型;
其中,所述第二訓(xùn)練模塊,可以包括:
第二獲得子模塊(圖中未示出),用于獲得所述目標(biāo)曲線對(duì)應(yīng)的標(biāo)記樣本和非標(biāo)記樣本,其中,所述非標(biāo)記樣本為未標(biāo)記異常處理類別的異常點(diǎn);
第二提取子模塊(圖中未示出),用于分別提取所述標(biāo)記樣本和所述非標(biāo)記樣本對(duì)應(yīng)的特征信息;
第二訓(xùn)練子模塊(圖中未示出),用于根據(jù)所述非標(biāo)記樣本的特征信息、所述標(biāo)記樣本的特征信息和對(duì)應(yīng)的異常處理類別,訓(xùn)練所述目標(biāo)預(yù)測模型。
具體的,所述裝置還可以包括:
第三訓(xùn)練模塊(圖中未示出),用于在所述報(bào)警模塊針對(duì)所述目標(biāo)異常點(diǎn)進(jìn)行報(bào)警之后,在接收到用戶對(duì)所述目標(biāo)異常點(diǎn)標(biāo)記的異常處理類別時(shí),將所述目標(biāo)異常點(diǎn)作為標(biāo)記樣本,對(duì)所述目標(biāo)預(yù)測模型進(jìn)行再次訓(xùn)練,得到新的目標(biāo)預(yù)測模型。
具體的,所述目標(biāo)預(yù)測模型可以為隨機(jī)森林模型。
需要說明的是,在本文中,諸如第一和第二等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。在沒有更多限制的情況下,由語句“包括一個(gè)……”限定的要素,并不排除在包括所述要素的過程、方法、物品或者設(shè)備中還存在另外的相同要素。
本說明書中的各個(gè)實(shí)施例均采用相關(guān)的方式描述,各個(gè)實(shí)施例之間相同相似的部分互相參見即可,每個(gè)實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對(duì)于裝置實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述的比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。