專利名稱:使用動(dòng)態(tài)規(guī)則集擴(kuò)展離散幀技術(shù)行為的方法和設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及處理錯(cuò)誤數(shù)據(jù),更具體地說(shuō),涉及利用動(dòng)態(tài)可修改的DFT規(guī)則集,提供對(duì)大量來(lái)源的錯(cuò)誤數(shù)據(jù)的統(tǒng)計(jì)處理的控制的方法、設(shè)備和程序存儲(chǔ)裝置。
背景技術(shù):
隨著消費(fèi)者變得更依賴于計(jì)算機(jī)系統(tǒng)來(lái)執(zhí)行可靠的任務(wù),對(duì)計(jì)算機(jī)系統(tǒng)錯(cuò)誤的容錯(cuò)度降低。當(dāng)發(fā)生軟故障時(shí),計(jì)算機(jī)系統(tǒng)通常經(jīng)歷停機(jī)。隨著硬件老化,計(jì)算機(jī)錯(cuò)誤的發(fā)生次數(shù)越來(lái)越大,軟故障的可能性增大。如果沒(méi)有安全機(jī)構(gòu),那么計(jì)算機(jī)系統(tǒng)必然產(chǎn)生導(dǎo)致用戶不滿的故障。
為了避免計(jì)算機(jī)系統(tǒng)故障,提出了預(yù)測(cè)或診斷即將發(fā)生的系統(tǒng)故障的方法。例如,基于規(guī)范的系統(tǒng)故障診斷是一種在規(guī)定的操作條件下,根據(jù)系統(tǒng)設(shè)計(jì)規(guī)范,確定系統(tǒng)的預(yù)期行為是什么的方法。提出了基于預(yù)期的系統(tǒng)行為的測(cè)試,該測(cè)試被用于診斷系統(tǒng)故障。但是,基于規(guī)范的診斷方法在查找意料之外的故障方面,以及在制定用于診斷意料之外故障的測(cè)試方面的能力有限。
診斷系統(tǒng)故障的機(jī)制的另一例子是基于征兆(symptom)的診斷。通過(guò)利用事件或錯(cuò)誤日志識(shí)別發(fā)生錯(cuò)誤的環(huán)境來(lái)重建系統(tǒng)故障,和評(píng)估環(huán)繞導(dǎo)致系統(tǒng)故障的錯(cuò)誤的環(huán)境,依據(jù)征兆地識(shí)別系統(tǒng)故障情況。和基于規(guī)范的診斷方法一樣,基于征兆的診斷方法導(dǎo)致系統(tǒng)故障指示符,而不是測(cè)試。
基于征兆的診斷技術(shù)的一個(gè)特定例子是根據(jù)在災(zāi)難性故障之前,計(jì)算機(jī)系統(tǒng)和其它電子設(shè)備的出錯(cuò)率逐漸增大的觀察,提出的離散幀技術(shù)(dispersion frame techniqueDFT)。DFT技術(shù)通過(guò)檢查錯(cuò)誤發(fā)生在時(shí)間和空間上的緊密度,使用規(guī)則來(lái)確定錯(cuò)誤發(fā)生之間的關(guān)系。擴(kuò)展DFT規(guī)則增大了DTF引擎的功能,允許對(duì)大量計(jì)算機(jī)設(shè)備的錯(cuò)誤數(shù)據(jù)的統(tǒng)計(jì)處理進(jìn)行更嚴(yán)格控制。該規(guī)則還允許把在規(guī)定時(shí)間幀內(nèi)發(fā)生的差錯(cuò)率的顯著增加看作單一錯(cuò)誤事件。只有當(dāng)所述增加超過(guò)規(guī)則定義的指定水印時(shí),所述單一錯(cuò)誤事件才被識(shí)別。但是,使用DFT的方法利用靜態(tài)的規(guī)則,只提供統(tǒng)計(jì)分析的單一維度。
于是需要一種提供并實(shí)現(xiàn)動(dòng)態(tài)可修改的DFT規(guī)則集的方法、設(shè)備和程序存儲(chǔ)裝置。
發(fā)明內(nèi)容
為了克服上述局限性,以及克服當(dāng)閱讀和理解本說(shuō)明書時(shí)將變得顯而易見的其它局限性,本發(fā)明公開一種利用動(dòng)態(tài)可修改的DFT規(guī)則集,提供對(duì)大量來(lái)源的錯(cuò)誤數(shù)據(jù)的統(tǒng)計(jì)處理的控制的方法、設(shè)備和程序存儲(chǔ)裝置。
本發(fā)明通過(guò)擴(kuò)展離散幀技術(shù),向離散幀規(guī)則提供用戶定義的參數(shù),從而產(chǎn)生動(dòng)態(tài)可修改的規(guī)則集來(lái)允許DFT引擎在變化的數(shù)據(jù)范圍內(nèi)工作,解決了上述問(wèn)題。
提供具有用戶定義參數(shù)的錯(cuò)誤數(shù)據(jù)處理的方法包括把用戶定義的錯(cuò)誤閾值應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則,處理錯(cuò)誤事件,保存與處理的錯(cuò)誤事件相關(guān)的信息,并根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
在本發(fā)明的另一實(shí)施例中,提供一種供錯(cuò)誤數(shù)據(jù)處理系統(tǒng)之用的計(jì)算設(shè)備。該計(jì)算設(shè)備包括保存錯(cuò)誤信息的存儲(chǔ)器,和與存儲(chǔ)器耦接,用于把用戶定義的錯(cuò)誤閾值數(shù)據(jù)應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則,并根據(jù)保存的錯(cuò)誤信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足的處理器。
在本發(fā)明的另一實(shí)施例中,提供一種提供具有用戶定義的參數(shù)的錯(cuò)誤數(shù)據(jù)處理的方法。該方法包括把用戶定義的錯(cuò)誤閾值應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則,從某一來(lái)源檢測(cè)多個(gè)錯(cuò)誤,計(jì)算所述多個(gè)錯(cuò)誤之間的時(shí)間段,保存與所述多個(gè)錯(cuò)誤及所述多個(gè)錯(cuò)誤之間的時(shí)間相關(guān)的信息,并根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
在本發(fā)明的另一實(shí)施例中,提供一種供錯(cuò)誤數(shù)據(jù)處理系統(tǒng)之用的計(jì)算設(shè)備。所述計(jì)算設(shè)備包括保存錯(cuò)誤信息的存儲(chǔ)器,所述錯(cuò)誤信息與錯(cuò)誤來(lái)源和錯(cuò)誤到達(dá)間隔時(shí)間相關(guān),和與存儲(chǔ)器耦接的處理器,所述處理器用于把用戶定義的錯(cuò)誤閾值數(shù)據(jù)應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則,并根據(jù)保存的錯(cuò)誤來(lái)源和錯(cuò)誤到達(dá)間隔時(shí)間,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
在本發(fā)明的另一實(shí)施例中,提供一種程序存儲(chǔ)裝置。所述程序存儲(chǔ)裝置包括可由處理裝置執(zhí)行,從而執(zhí)行提供具有用戶定義的參數(shù)的錯(cuò)誤數(shù)據(jù)處理的操作的程序指令,所述操作包括把用戶定義的錯(cuò)誤閾值應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則,處理錯(cuò)誤事件,保存與處理的錯(cuò)誤事件相關(guān)的信息,并根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
在本發(fā)明的另一實(shí)施例中,提供一種程序存儲(chǔ)裝置。所述程序存儲(chǔ)裝置包括可由處理裝置執(zhí)行,從而執(zhí)行提供具有用戶定義的參數(shù)的錯(cuò)誤數(shù)據(jù)處理的操作的程序指令,所述操作包括把用戶定義的錯(cuò)誤閾值應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則,從某一來(lái)源檢測(cè)多個(gè)錯(cuò)誤,計(jì)算所述多個(gè)錯(cuò)誤之間的時(shí)間,保存與所述多個(gè)錯(cuò)誤及所述多個(gè)錯(cuò)誤之間的時(shí)間相關(guān)的信息,并根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
在本發(fā)明的另一實(shí)施例中,提供一種供錯(cuò)誤數(shù)據(jù)處理系統(tǒng)之用的計(jì)算設(shè)備。所述計(jì)算設(shè)備包括保存錯(cuò)誤信息的裝置,和與所述保存裝置耦接,用于把用戶定義的錯(cuò)誤閾值數(shù)據(jù)應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則,并根據(jù)保存的錯(cuò)誤信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足的裝置。
在構(gòu)成本發(fā)明一部分的附加權(quán)利要求中詳細(xì)指出了表征本發(fā)明的新事物的這些及各種其它優(yōu)點(diǎn)和特征。但是,為了更好地理解本發(fā)明,其優(yōu)點(diǎn)以及由其應(yīng)用獲得的目的,應(yīng)參考構(gòu)成本發(fā)明另一部分的附圖,以及附隨的描述內(nèi)容,其中舉例說(shuō)明了根據(jù)本發(fā)明的設(shè)備的具體例子。
現(xiàn)在參見附圖,其中相同的附圖標(biāo)記表示對(duì)應(yīng)的部件圖1表示其中可實(shí)現(xiàn)本發(fā)明的數(shù)據(jù)處理系統(tǒng)的網(wǎng)絡(luò);圖2是可被實(shí)現(xiàn)成如圖1中所示的服務(wù)器或計(jì)算機(jī)系統(tǒng)的計(jì)算機(jī)處理系統(tǒng)的方框圖;圖3示意圖解說(shuō)明時(shí)間線上的錯(cuò)誤事件,用于圖解說(shuō)明本發(fā)明的一個(gè)實(shí)施例的實(shí)現(xiàn);圖4是根據(jù)本發(fā)明的一個(gè)實(shí)施例的錯(cuò)誤數(shù)據(jù)處理方法的流程圖;圖5是根據(jù)本發(fā)明的一個(gè)實(shí)施例,向擴(kuò)展離散幀技術(shù)(DFT)規(guī)則集提供用戶定義的參數(shù)的方法的流程圖;圖6圖解說(shuō)明根據(jù)本發(fā)明的實(shí)施例,按照擴(kuò)展DFT規(guī)則集處理錯(cuò)誤的方法的流程圖。
具體實(shí)施例方式
在實(shí)施例的下述說(shuō)明中,參考了附圖,附圖構(gòu)成說(shuō)明書的一部分,其中舉例圖解說(shuō)明了可實(shí)踐本發(fā)明的具體實(shí)施例。應(yīng)當(dāng)理解,在不脫離本發(fā)明的范圍的情況下,可以使用其它實(shí)施例,因?yàn)榭梢赃M(jìn)行一些結(jié)構(gòu)變化。
本發(fā)明的一個(gè)實(shí)施例提供利用動(dòng)態(tài)可修改的DFT規(guī)則集,提供對(duì)大量來(lái)源的錯(cuò)誤數(shù)據(jù)的統(tǒng)計(jì)處理的控制的方法、設(shè)備和程序存儲(chǔ)裝置。本發(fā)明中擴(kuò)展了離散幀技術(shù),以便向離散幀規(guī)則提供用戶定義的參數(shù),產(chǎn)生動(dòng)態(tài)可修改的規(guī)則集。
圖1表示其中可實(shí)現(xiàn)本發(fā)明的數(shù)據(jù)處理系統(tǒng)100的網(wǎng)絡(luò)。網(wǎng)絡(luò)數(shù)據(jù)處理系統(tǒng)100包括網(wǎng)絡(luò)102,網(wǎng)絡(luò)102是用于提供在網(wǎng)絡(luò)數(shù)據(jù)處理系統(tǒng)100內(nèi)連接在一起的各種設(shè)備和計(jì)算機(jī)之間的通信鏈路的媒介。網(wǎng)絡(luò)102可包括連接,例如有線、無(wú)線通信鏈路,或者光纜。
在所示例子中,服務(wù)器104連同存儲(chǔ)單元106一起與網(wǎng)絡(luò)102連接。另外,客戶機(jī)108、110和112與網(wǎng)絡(luò)102連接。這些客戶機(jī)108、110和112可以是例如個(gè)人計(jì)算機(jī)、網(wǎng)絡(luò)計(jì)算機(jī)或工作站。在圖1中,服務(wù)器104向客戶機(jī)108-112提供數(shù)據(jù),例如引導(dǎo)文件,操作系統(tǒng)映像和應(yīng)用程序??蛻魴C(jī)108、110和112是服務(wù)器104的客戶機(jī)。網(wǎng)絡(luò)數(shù)據(jù)處理系統(tǒng)100可包括未示出的另外的服務(wù)器、客戶機(jī)和其它設(shè)備。
圖2是可被實(shí)現(xiàn)成如圖1中所示的服務(wù)器或計(jì)算機(jī)系統(tǒng)的計(jì)算機(jī)處理系統(tǒng)200的方框圖。計(jì)算機(jī)處理系統(tǒng)200可以是對(duì)稱的多處理器(SMP)系統(tǒng),包括與系統(tǒng)總線206連接的多個(gè)處理器202和204。另一方面,可以采用單處理器系統(tǒng)。存儲(chǔ)器控制器/高速緩存208也與系統(tǒng)總線206連接,存儲(chǔ)器控制器/高速緩存208提供到本地存儲(chǔ)器209的接口。I/O總線橋210與系統(tǒng)總線206連接,提供到I/O總線212的接口。存儲(chǔ)器控制器/高速緩存208和I/O總線橋210可如圖所示被集成。
與I/O總線212連接的外設(shè)部件互連(PCI)總線橋214提供到PCI局部總線216的接口。許多調(diào)制解調(diào)器218可與PCI局部總線216連接。典型的PCI總線實(shí)現(xiàn)將支持四個(gè)PCI擴(kuò)展插槽或者內(nèi)插連接器。通過(guò)經(jīng)內(nèi)插板與PCI局部總線216連接的通信裝置218和網(wǎng)絡(luò)適配器220,可提供到圖1中的客戶機(jī)108-112的通信鏈路。
附加的PCI總線橋222和224向附加的PCI局部總線226和228提供接口,從所述附加的PCI局部總線226和228可支持附加的調(diào)制解調(diào)器或網(wǎng)絡(luò)適配器。按照這種方式,計(jì)算機(jī)處理系統(tǒng)200允許連接到多個(gè)網(wǎng)絡(luò)計(jì)算機(jī)。存儲(chǔ)變換圖形適配器230和硬盤232也可如圖所示,直接或間接地與I/O總線212連接。
本領(lǐng)域的普通技術(shù)人員會(huì)認(rèn)識(shí)到圖2中描述的硬件可發(fā)生變化。例如,除了所示硬件之外或者代替所示硬件,也可使用其它外設(shè)部件,例如光盤驅(qū)動(dòng)器等。另外,總線的類型可以不同。所描述的例子并不意味著對(duì)本發(fā)明實(shí)施例的結(jié)構(gòu)限制。
如前所述,通過(guò)利用事件或錯(cuò)誤日志識(shí)別發(fā)生錯(cuò)誤的環(huán)境來(lái)重建系統(tǒng)故障,和評(píng)估環(huán)繞導(dǎo)致系統(tǒng)故障的錯(cuò)誤的環(huán)境,依據(jù)征兆地識(shí)別系統(tǒng)故障情況。和基于規(guī)范的診斷方法一樣,基于征兆的診斷方法導(dǎo)致系統(tǒng)故障指示符,而不是測(cè)試?;谡髡椎脑\斷技術(shù)的一個(gè)特定例子是根據(jù)在災(zāi)難性故障之前,計(jì)算機(jī)系統(tǒng)和其它電子設(shè)備的出錯(cuò)率逐漸增大的觀察,提出的離散幀技術(shù)(DFT)。DFT技術(shù)通過(guò)檢查錯(cuò)誤發(fā)生在時(shí)間和空間上的緊密度,使用規(guī)則來(lái)確定錯(cuò)誤發(fā)生之間的關(guān)系。下表1中舉例說(shuō)明了DFT規(guī)則集。
表1利用DFT的方法使用如表1中所示的靜態(tài)規(guī)則。但是,靜態(tài)規(guī)則只提供統(tǒng)計(jì)分析的單一維度。例如,如表1中所示,典型的離散幀技術(shù)(DFT)提供五種統(tǒng)計(jì)規(guī)則。錯(cuò)誤離散指數(shù)(error dispersion indexEDI)是在一半的離散幀中的出錯(cuò)次數(shù)。離散幀由到達(dá)間隔(interarrival)時(shí)間或者相同類型的連續(xù)錯(cuò)誤事件之間的時(shí)間定義。第一規(guī)則覆蓋當(dāng)源于相同離散幀的相繼應(yīng)用的兩個(gè)連續(xù)錯(cuò)誤離散指數(shù)(EDI)表現(xiàn)出至少為3的EDI時(shí)(3.3規(guī)則)。第二規(guī)則覆蓋當(dāng)源于兩個(gè)連續(xù)離散幀的兩個(gè)連續(xù)EDI表現(xiàn)出至少為2的EDI時(shí)(2.2規(guī)則)。第三規(guī)則覆蓋當(dāng)離散幀小于1小時(shí)時(shí)(2合1規(guī)則)。第四規(guī)則覆蓋當(dāng)在24小時(shí)時(shí)間幀內(nèi)發(fā)生四個(gè)錯(cuò)誤事件時(shí)(4合1規(guī)則)。第五規(guī)則覆蓋當(dāng)存在四個(gè)單調(diào)遞減離散幀,并且至少一幀的大小為其先前幀的一半時(shí)(4遞減規(guī)則)。因此,通過(guò)檢查錯(cuò)誤發(fā)生的類型和它們?cè)跁r(shí)間及空間上的緊密度,這些規(guī)則可被用于確定錯(cuò)誤發(fā)生之間的關(guān)系。
DFT利用以在某一離散幀內(nèi)的觀察結(jié)果的到達(dá)間隔時(shí)間為基礎(chǔ)的模型。根據(jù)在把錯(cuò)誤日志分解(factor)到單個(gè)的錯(cuò)誤源時(shí)獲得的經(jīng)驗(yàn),預(yù)測(cè)故障分析(PFA)引擎從持久存儲(chǔ)介質(zhì)抽取、組織和檢查錯(cuò)誤日志條目。規(guī)則的組織根據(jù)錯(cuò)誤的到達(dá)間隔模式,應(yīng)用其五種故障預(yù)測(cè)規(guī)則之一。這五種規(guī)則捕捉離散幀內(nèi),與傳統(tǒng)的統(tǒng)計(jì)分析方法檢測(cè)的行為對(duì)應(yīng)的行為。PFA引擎通過(guò)檢查錯(cuò)誤發(fā)生在時(shí)間(持續(xù)時(shí)間)和空間(影響區(qū))方面的緊密度,確定錯(cuò)誤發(fā)生之間的關(guān)系。
更具體地說(shuō),3.3規(guī)則集中于檢查源于相同離散幀的連續(xù)EDI。當(dāng)離散幀的連續(xù)應(yīng)用產(chǎn)生至少為3的EDI時(shí),發(fā)送與3.3規(guī)則對(duì)應(yīng)的報(bào)警。3.3規(guī)則要求兩個(gè)連續(xù)EDI,以及至少為3的EDI。在DFT規(guī)則集中,這些要求保持不變。
2.2規(guī)則集中于檢查連續(xù)的離散幀和離散幀內(nèi)的EDI。當(dāng)兩個(gè)離散幀具有至少為2的EDI時(shí),發(fā)送與2.2規(guī)則有關(guān)的報(bào)警。類似于3.3規(guī)則,2.2規(guī)則具有靜態(tài)要求。這里所述要求是連續(xù)離散幀中的兩個(gè)連續(xù)EDI,并且至少為2的EDI。
在2合1(2in1)規(guī)則和4合1規(guī)則中,焦點(diǎn)集中在錯(cuò)誤事件之間的時(shí)間跨度上。當(dāng)一個(gè)離散幀或者錯(cuò)誤之間的到達(dá)間隔時(shí)間的跨度小于1小時(shí)時(shí),2合1規(guī)則被滿足。當(dāng)在一天內(nèi)發(fā)生四個(gè)錯(cuò)誤事件時(shí),4合1規(guī)則被滿足。2合1規(guī)則和4合1規(guī)則均包括不變的時(shí)間要求和檢測(cè)的錯(cuò)誤要求。
4遞減規(guī)則集中于離散幀之間的時(shí)間跨度和錯(cuò)誤的發(fā)生率。在4遞減規(guī)則中,在四個(gè)離散幀大小同或者小于在先離散幀,并且其中一幀的大小為在先離散幀的一半之后發(fā)送報(bào)警。4遞減規(guī)則包括四個(gè)離散幀大小同或者小于在先離散幀,并且一個(gè)離散幀的大小為在先離散幀的一半的靜態(tài)要求。
圖3是示意圖解說(shuō)明時(shí)間線上的導(dǎo)致3.3規(guī)則報(bào)警,2.2規(guī)則報(bào)警和4遞減規(guī)則報(bào)警的事件的圖形300。圖中表示了錯(cuò)誤事件i-4、i-3、i-2、i-1和i。離散幀被定義為相同類型的連續(xù)錯(cuò)誤事件之間的到達(dá)間隔時(shí)間。從而,到達(dá)間隔時(shí)間是兩個(gè)錯(cuò)誤事件之間的時(shí)間段。離散幀(i-3)310是事件i-4和i-3之間的到達(dá)間隔時(shí)間。幀(i-2)320是事件i-3和i-2之間的離散幀。
從每幀的中心到其右端的錯(cuò)誤數(shù)目被測(cè)量并被指定為錯(cuò)誤離散指數(shù)(EDI)。幀(i-3)310的EDI為3,幀(i-2)320的EDI為2。一個(gè)例子就是幀(i-3)310的是錯(cuò)誤i-3和i-2之間的時(shí)間。
就3.3規(guī)則來(lái)說(shuō),在幀(i-3)310中,在相同幀的應(yīng)用內(nèi),兩個(gè)連續(xù)指數(shù)305和315的EDI為3。錯(cuò)誤事件之間的時(shí)間和空間要求滿足了3.3規(guī)則,發(fā)送3.3規(guī)則報(bào)警。
就2.2規(guī)則來(lái)說(shuō),在幀(i-3)310和(i-2)320之間,連續(xù)指數(shù)具有至少為2的EDI。幀(i-3)的緊鄰幀(i-2)的時(shí)間跨度315具有為3的指數(shù),幀(i-2)的緊鄰幀(i-3)的時(shí)間跨度325具有為2的指數(shù)。2.2規(guī)則的時(shí)間和空間要求被滿足,發(fā)出對(duì)應(yīng)于2.2規(guī)則的報(bào)警322。
觀察幀(i-3)~(i),可看出隨著時(shí)間的過(guò)去,四個(gè)幀(i-3)310、(i-2)320、(i-1)330和(i)340的大小減小或者保持不變,并且在這四個(gè)幀之中,至少一幀(i)340的大小為在先幀(i-1)330的一半。從而,4遞減規(guī)則344被滿足。但是,上面提及的DFT規(guī)則是靜態(tài)的,只提供統(tǒng)計(jì)分析的單一維度。
圖4是根據(jù)本發(fā)明的實(shí)施例,提供用于錯(cuò)誤數(shù)據(jù)處理的具有用戶定義參數(shù)的規(guī)則集的流程圖400。用戶定義的錯(cuò)誤閾值被接收(410),并根據(jù)用戶定義的錯(cuò)誤閾值設(shè)置錯(cuò)誤閾值規(guī)則(420)。檢測(cè)錯(cuò)誤,并保存與錯(cuò)誤相關(guān)的信息(430)。比較保存的信息和閾值規(guī)則(440),確定錯(cuò)誤閾值是否被滿足(450)。當(dāng)錯(cuò)誤閾值未被滿足時(shí),驅(qū)動(dòng)規(guī)則集的引擎繼續(xù)處理和保存檢測(cè)到的錯(cuò)誤(430),并比較保存的信息(440),直到錯(cuò)誤閾值被滿足為止。一旦達(dá)到了錯(cuò)誤閾值,那么就發(fā)送報(bào)警(460)。
上述DFT規(guī)則在本發(fā)明的實(shí)施例中被修改,并被分配給具有獨(dú)特模式的設(shè)備。用戶定義的規(guī)則被接收,作為給下面說(shuō)明的擴(kuò)展DFT處理引擎的輸入。根據(jù)本發(fā)明的實(shí)施例,表2中舉例說(shuō)明了擴(kuò)展DFT規(guī)則集。
表2類似于表1,錯(cuò)誤離散指數(shù)(EDI)是在一半的離散幀中的出錯(cuò)次數(shù)。離散幀由相同類型的連續(xù)錯(cuò)誤事件之間的到達(dá)間隔時(shí)間定義。
圖5是圖解說(shuō)明根據(jù)本發(fā)明的實(shí)施例,向擴(kuò)展離散幀規(guī)則集提供用戶定義的參數(shù)的流程圖500。擴(kuò)展離散幀規(guī)則由用戶定義并被接收(505)。在規(guī)則集內(nèi)設(shè)置每個(gè)變量(510)。變量包括2合1規(guī)則和4合1規(guī)則的時(shí)間幀,4合1規(guī)則的所需出錯(cuò)次數(shù),3.3和2.2規(guī)則的所需EDI數(shù)目,3.3和2.2規(guī)則的所需連續(xù)指數(shù)的數(shù)目,4遞減規(guī)則的幀數(shù),4遞減規(guī)則的要求大小為在先幀一半的幀的數(shù)目。識(shí)別離散幀(515),并與具有用戶定義的參數(shù)的擴(kuò)展離散幀規(guī)則集比較。
就3.3規(guī)則來(lái)說(shuō),在3.3規(guī)則要求之間進(jìn)行比較(520)。當(dāng)源于相同離散幀的連續(xù)應(yīng)用的用戶定義數(shù)目的EDI至少具有用戶定義的EDI數(shù)目時(shí),3.3規(guī)則的閾值被滿足(530),發(fā)送與滿足3.3規(guī)則相關(guān)的報(bào)警(535)。
對(duì)于2.2規(guī)則來(lái)說(shuō),比較多個(gè)錯(cuò)誤和具有用戶定義參數(shù)的2.2規(guī)則要求(520)。當(dāng)源于兩個(gè)連續(xù)幀的用戶定義數(shù)目的連續(xù)EDI表現(xiàn)出至少一個(gè)用戶定義的EDI數(shù)目時(shí),2.2規(guī)則要求被滿足(540),發(fā)送相關(guān)的2.2規(guī)則報(bào)警(545)。
對(duì)于2合1規(guī)則來(lái)說(shuō),比較多個(gè)錯(cuò)誤之間的時(shí)間幀和用戶定義的2合1規(guī)則時(shí)間幀(520)。當(dāng)在定義的時(shí)間幀內(nèi)收到錯(cuò)誤時(shí),2合1規(guī)則被滿足(550),發(fā)送2合1錯(cuò)誤消息(555)。
對(duì)于4合1規(guī)則來(lái)說(shuō),用戶定義數(shù)目的錯(cuò)誤之間的時(shí)間必須落入用戶定義的時(shí)間幀內(nèi)。當(dāng)比較保存的錯(cuò)誤信息與4合1規(guī)則用戶定義要求(520),并且要求被滿足(560)時(shí),發(fā)送4合1錯(cuò)誤消息(565)。
就4遞減規(guī)則來(lái)說(shuō),用戶定義數(shù)目的離散幀單調(diào)減小,并且用戶定義數(shù)目的離散幀的大小是在先離散幀的一半。比較錯(cuò)誤數(shù)據(jù)和用戶定義的4遞減規(guī)則(520),當(dāng)4遞減規(guī)則要求被滿足時(shí)(570),發(fā)送與4遞減規(guī)則相關(guān)的錯(cuò)誤消息(575)。
在上述規(guī)則不被滿足的情況下,該進(jìn)程返回,從存儲(chǔ)器識(shí)別離散幀(505),直到規(guī)則要求被滿足為止。
圖6圖解說(shuō)明根據(jù)本發(fā)明的一個(gè)實(shí)施例,按照擴(kuò)展DFT規(guī)則集處理錯(cuò)誤的方法的流程圖600。從某一來(lái)源檢測(cè)多個(gè)錯(cuò)誤(605)。確定錯(cuò)誤之間的時(shí)間段(610),并保存與錯(cuò)誤相關(guān)的信息(615)。比較每個(gè)擴(kuò)展DFT規(guī)則與保存的錯(cuò)誤數(shù)據(jù)(620、630、640、650和660)。確定擴(kuò)展DFT規(guī)則是否被滿足(625、635、645、655和665)。對(duì)于被滿足的每個(gè)擴(kuò)展DFT規(guī)則,發(fā)送與被滿足的特定規(guī)則相關(guān)的報(bào)警(628、638、648、658和668)。在規(guī)則集要求不被滿足的情況下,進(jìn)程返回檢測(cè)多個(gè)錯(cuò)誤的步驟(605)。
重新參見圖2,根據(jù)本發(fā)明一個(gè)實(shí)施例的恰當(dāng)計(jì)算系統(tǒng)環(huán)境200。例如,環(huán)境200可以是已描述的客戶機(jī)、數(shù)據(jù)服務(wù)器和/或主服務(wù)器。計(jì)算系統(tǒng)環(huán)境200只是恰當(dāng)?shù)挠?jì)算環(huán)境的一個(gè)例子,并不意圖建議對(duì)本發(fā)明的使用或功能范圍的任何限制。計(jì)算環(huán)境200也不應(yīng)被理解成具有關(guān)于在例證的操作環(huán)境200中圖解說(shuō)明的任意一個(gè)組件或組件的組合的依賴性或要求。特別地,環(huán)境200是能夠?qū)崿F(xiàn)服務(wù)器、客戶機(jī)或已說(shuō)明的其它節(jié)點(diǎn)的計(jì)算機(jī)化設(shè)備的例子。
計(jì)算機(jī)存儲(chǔ)介質(zhì)包括按照任意方法或技術(shù)實(shí)現(xiàn)的,用于存儲(chǔ)信息,比如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù)的易失性、非易失性、可拆卸的和不可拆卸的介質(zhì)。存儲(chǔ)器209、208,例如與PCI總線226、228連接的存儲(chǔ)器和/或硬盤驅(qū)動(dòng)器232都是計(jì)算機(jī)存儲(chǔ)介質(zhì)的例子。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括(但不限于)RAM,ROM,EEPROM,快速存儲(chǔ)器或其它存儲(chǔ)器技術(shù),CDROM,數(shù)字通用視盤(DVD)或者其它光學(xué)存儲(chǔ)器,盒式磁帶,磁帶,磁盤存儲(chǔ)器或者其它磁性存儲(chǔ)裝置,或者可用于保存所需信息,并且能夠被設(shè)備200訪問(wèn)的任意其它介質(zhì)。任意這樣的計(jì)算機(jī)存儲(chǔ)介質(zhì)可以是設(shè)備200的一部分。
設(shè)備200還可包含允許設(shè)備與其它設(shè)備通信的通信連接218。通信連接218是通信媒介的一個(gè)例子。通信媒介一般用已調(diào)數(shù)據(jù)信號(hào),例如載波或其它傳送機(jī)構(gòu)具體體現(xiàn)計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù),并且包括任意信息傳送媒介。術(shù)語(yǔ)“已調(diào)數(shù)據(jù)信號(hào)”意味以這樣的方式設(shè)置或改變其至少一個(gè)特性,以便在信號(hào)中對(duì)信息編碼的信號(hào)。例如,通信媒介包括(但不限于)有線媒介,比如有線網(wǎng)絡(luò)或直接有線連接,和無(wú)線媒介,比如聲音、RF、紅外和其它無(wú)線媒介。這里使用的術(shù)語(yǔ)“計(jì)算機(jī)可讀介質(zhì)”既包括存儲(chǔ)介質(zhì),又包括通信媒介。
上述方法可用計(jì)算機(jī)在設(shè)備200上實(shí)現(xiàn)。計(jì)算機(jī)實(shí)現(xiàn)的方法最好至少部分被實(shí)現(xiàn)成在計(jì)算機(jī)上運(yùn)行的至少一個(gè)程序。所述程序可由計(jì)算機(jī)的處理器從諸如存儲(chǔ)器之類的計(jì)算機(jī)可讀介質(zhì)執(zhí)行。程序最好可保存在機(jī)器可讀介質(zhì),例如軟盤或CD-ROM上,以便分發(fā)給另一計(jì)算機(jī),并在所述另一計(jì)算機(jī)上安裝和執(zhí)行。所述一個(gè)或多個(gè)程序可以是計(jì)算機(jī)系統(tǒng)、計(jì)算機(jī)或計(jì)算機(jī)化的設(shè)備的一部分。
在本發(fā)明的其它實(shí)施例中,擴(kuò)展DFT規(guī)則允許把在規(guī)定時(shí)間幀內(nèi)發(fā)生的差錯(cuò)率的顯著增加看作單一錯(cuò)誤事件。但是,只有當(dāng)所述增加超過(guò)規(guī)則定義的指定水印時(shí),所述單一錯(cuò)誤事件才被識(shí)別。
本發(fā)明的實(shí)施例提供動(dòng)態(tài)修改擴(kuò)展DFT規(guī)則的約定。這迫使DFT在用戶規(guī)定的不斷變化的數(shù)據(jù)范圍內(nèi)工作。這些變化范圍也可被應(yīng)用于正被監(jiān)視,并且有能力報(bào)告錯(cuò)誤的特定硬件部件。擴(kuò)展DFT的用戶將具有設(shè)置更嚴(yán)格的統(tǒng)計(jì)約束條件,調(diào)整DFT引擎以便在不斷變化的處理環(huán)境內(nèi)工作的靈活性。
出于舉例說(shuō)明的目的,給出了本發(fā)明的例證實(shí)施例的上述說(shuō)明。上述說(shuō)明并不是要窮盡本發(fā)明,或者把本發(fā)明局限于公開的具體形式。鑒于上述教導(dǎo),許多修改和變化是可能的。本發(fā)明的范圍不由該詳細(xì)說(shuō)明限定,而是由附加的權(quán)利要求限定。
權(quán)利要求
1.一種提供具有用戶定義的參數(shù)的錯(cuò)誤數(shù)據(jù)處理的方法,包括把用戶定義的錯(cuò)誤閾值應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則;處理錯(cuò)誤事件;保存與處理的錯(cuò)誤事件相關(guān)的信息;和根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
2.按照權(quán)利要求1所述的方法,其中處理錯(cuò)誤事件包括從某一來(lái)源檢測(cè)多個(gè)錯(cuò)誤;和計(jì)算所述多個(gè)錯(cuò)誤之間的時(shí)間段。
3.按照權(quán)利要求2所述的方法,其中保存與處理的錯(cuò)誤事件相關(guān)的信息還包括保存與所述多個(gè)錯(cuò)誤以及所述多個(gè)錯(cuò)誤之間的時(shí)間段相關(guān)的信息。
4.按照權(quán)利要求2所述的方法,其中確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足還包括把檢測(cè)到的錯(cuò)誤的數(shù)目以及所述多個(gè)錯(cuò)誤之間的時(shí)間段與用戶可定義的錯(cuò)誤閾值規(guī)則進(jìn)行比較。
5.按照權(quán)利要求2所述的方法,其中根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足包括確定檢測(cè)到的多個(gè)錯(cuò)誤滿足用戶定義的錯(cuò)誤離散指數(shù),其中錯(cuò)誤離散指數(shù)是在相同類型的錯(cuò)誤之間的時(shí)間段的一半中的錯(cuò)誤的數(shù)目。
6.按照權(quán)利要求5所述的方法,還包括在相同類型的錯(cuò)誤之間的相同時(shí)間段中,連續(xù)用戶定義的次數(shù)達(dá)到用戶定義的錯(cuò)誤離散指數(shù)。
7.按照權(quán)利要求6所述的方法,還包括在兩個(gè)連續(xù)離散幀中,連續(xù)用戶定義的次數(shù)達(dá)到用戶定義的錯(cuò)誤離散指數(shù)。
8.按照權(quán)利要求1所述的方法,其中檢測(cè)所述多個(gè)錯(cuò)誤包含處理在用戶定義的時(shí)間幀內(nèi)發(fā)生的錯(cuò)誤,并且當(dāng)以計(jì)算的所述多個(gè)錯(cuò)誤之間的時(shí)間段為基礎(chǔ)的出錯(cuò)率滿足用戶可定義的錯(cuò)誤閾值規(guī)則時(shí),把所述多個(gè)錯(cuò)誤識(shí)別成一個(gè)錯(cuò)誤。
9.按照權(quán)利要求1所述的方法,還包括當(dāng)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一被滿足時(shí),發(fā)送報(bào)警。
10.按照權(quán)利要求9所述的方法,其中報(bào)警是以所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一為基礎(chǔ)的特定類型的報(bào)警。
11.按照權(quán)利要求1所述的方法,還包括提供用戶定義的錯(cuò)誤閾值,用于修改用戶可定義的錯(cuò)誤閾值規(guī)則。
12.按照權(quán)利要求1所述的方法,其中根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足包括確定檢測(cè)的錯(cuò)誤之間的時(shí)間段小于用戶定義的時(shí)間幀。
13.按照權(quán)利要求1所述的方法,其中根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足包括確定用戶定義數(shù)目的檢出錯(cuò)誤在用戶定義的時(shí)間幀內(nèi)發(fā)生。
14.按照權(quán)利要求1所述的方法,其中根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足包括確定以非遞增比率發(fā)生錯(cuò)誤之間的用戶定義數(shù)目的各時(shí)間段。
15.按照權(quán)利要求14所述的方法,其中以非遞增比率發(fā)生的錯(cuò)誤還包括在錯(cuò)誤之間的在先時(shí)間段的一半內(nèi)發(fā)生的用戶定義數(shù)目的錯(cuò)誤。
16.一種供錯(cuò)誤數(shù)據(jù)處理系統(tǒng)之用的計(jì)算設(shè)備,包括保存錯(cuò)誤信息的存儲(chǔ)器;和與存儲(chǔ)器耦接的處理器,用于把用戶定義的錯(cuò)誤閾值數(shù)據(jù)應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則,并根據(jù)保存的錯(cuò)誤信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
17.按照權(quán)利要求16所述的計(jì)算設(shè)備,其中錯(cuò)誤信息包括與錯(cuò)誤到達(dá)間隔時(shí)間相關(guān)的信息。
18.按照權(quán)利要求16所述的計(jì)算設(shè)備,其中當(dāng)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一被滿足時(shí),處理器發(fā)送報(bào)警。
19.按照權(quán)利要求18所述的計(jì)算設(shè)備,其中報(bào)警包括以被滿足的所述多個(gè)錯(cuò)誤閾值之一為基礎(chǔ)的特定類型的報(bào)警。
20.按照權(quán)利要求16所述的計(jì)算設(shè)備,其中保存的錯(cuò)誤信息包括代表檢出錯(cuò)誤的錯(cuò)誤事件,和與檢出錯(cuò)誤相關(guān)的到達(dá)間隔時(shí)間。
21.按照權(quán)利要求20所述的計(jì)算設(shè)備,其中處理器通過(guò)把檢出錯(cuò)誤的數(shù)目和所述多個(gè)錯(cuò)誤之間的時(shí)間段與用戶可定義的錯(cuò)誤閾值規(guī)則進(jìn)行比較,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
22.按照權(quán)利要求16所述的計(jì)算設(shè)備,其中處理器根據(jù)接收的用戶定義的錯(cuò)誤閾值,修改用戶可定義的錯(cuò)誤閾值規(guī)則。
23.按照權(quán)利要求16所述的計(jì)算設(shè)備,其中處理器通過(guò)檢測(cè)在用戶定義的時(shí)間幀內(nèi)發(fā)生的錯(cuò)誤,并且當(dāng)以計(jì)算的所述多個(gè)錯(cuò)誤之間的時(shí)間段為基礎(chǔ)的出錯(cuò)率滿足用戶可定義的錯(cuò)誤閾值規(guī)則時(shí)把所述多個(gè)錯(cuò)誤識(shí)別成一個(gè)錯(cuò)誤,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
24.按照權(quán)利要求23所述的計(jì)算設(shè)備,其中處理器確定檢測(cè)的多個(gè)錯(cuò)誤滿足用戶定義的錯(cuò)誤離散指數(shù),其中錯(cuò)誤離散指數(shù)是在相同類型的錯(cuò)誤之間的時(shí)間段的一半中的錯(cuò)誤的數(shù)目。
25.按照權(quán)利要求16所述的計(jì)算設(shè)備,其中處理器通過(guò)確定檢測(cè)的錯(cuò)誤之間的時(shí)間段小于用戶定義的時(shí)間幀,根據(jù)保存的信息確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
26.按照權(quán)利要求16所述的計(jì)算設(shè)備,其中處理器通過(guò)確定在用戶定義的時(shí)間幀內(nèi)發(fā)生了用戶定義數(shù)目的檢出錯(cuò)誤,根據(jù)保存的信息確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
27.按照權(quán)利要求16所述的計(jì)算設(shè)備,其中處理器通過(guò)確定以非遞增比率發(fā)生錯(cuò)誤之間的用戶定義數(shù)目的各時(shí)間段,根據(jù)保存的信息確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
28.一種提供具有用戶定義的參數(shù)的錯(cuò)誤數(shù)據(jù)處理的方法,包括把用戶定義的錯(cuò)誤閾值應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則;從某一來(lái)源檢測(cè)多個(gè)錯(cuò)誤;計(jì)算所述多個(gè)錯(cuò)誤之間的時(shí)間段;保存與所述多個(gè)錯(cuò)誤及所述多個(gè)錯(cuò)誤之間的時(shí)間段相關(guān)的信息;和根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
29.一種供錯(cuò)誤數(shù)據(jù)處理系統(tǒng)之用的計(jì)算設(shè)備,包括保存錯(cuò)誤信息的存儲(chǔ)器,所述錯(cuò)誤信息與錯(cuò)誤來(lái)源和錯(cuò)誤到達(dá)間隔時(shí)間相關(guān);和與存儲(chǔ)器耦接的處理器,所述處理器用于把用戶定義的錯(cuò)誤閾值數(shù)據(jù)應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則,并根據(jù)保存的錯(cuò)誤來(lái)源和錯(cuò)誤到達(dá)間隔時(shí)間,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
30.一種程序存儲(chǔ)裝置,包括可由處理裝置執(zhí)行,從而執(zhí)行提供具有用戶定義的參數(shù)的錯(cuò)誤數(shù)據(jù)處理的操作的程序指令,所述操作包括把用戶定義的錯(cuò)誤閾值應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則;處理錯(cuò)誤事件;保存與處理的錯(cuò)誤事件相關(guān)的信息;和根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
31.一種程序存儲(chǔ)裝置,包括可由處理裝置執(zhí)行,從而執(zhí)行提供具有用戶定義的參數(shù)的錯(cuò)誤數(shù)據(jù)處理的操作的程序指令,所述操作包括把用戶定義的錯(cuò)誤閾值應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則;從某一來(lái)源檢測(cè)多個(gè)錯(cuò)誤;計(jì)算所述多個(gè)錯(cuò)誤之間的時(shí)間段;保存與所述多個(gè)錯(cuò)誤及所述多個(gè)錯(cuò)誤之間的時(shí)間段相關(guān)的信息;和根據(jù)保存的信息,確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
32.一種供錯(cuò)誤數(shù)據(jù)處理系統(tǒng)之用的計(jì)算設(shè)備,包括保存錯(cuò)誤信息的裝置;和與所述保存裝置耦接的裝置,用于把用戶定義的錯(cuò)誤閾值數(shù)據(jù)應(yīng)用于多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則,并根據(jù)保存的錯(cuò)誤信息確定何時(shí)所述多個(gè)用戶可定義的錯(cuò)誤閾值規(guī)則之一已被滿足。
全文摘要
公開一種利用動(dòng)態(tài)可修改的DFT規(guī)則集,提供對(duì)大量來(lái)源的錯(cuò)誤數(shù)據(jù)的統(tǒng)計(jì)處理的控制的方法、設(shè)備和程序存儲(chǔ)裝置。本發(fā)明中擴(kuò)展了離散幀技術(shù),以便向離散幀規(guī)則提供用戶定義的參數(shù),從而產(chǎn)生動(dòng)態(tài)可修改的規(guī)則集。
文檔編號(hào)G06F11/00GK1707438SQ20051005917
公開日2005年12月14日 申請(qǐng)日期2005年3月24日 優(yōu)先權(quán)日2004年6月10日
發(fā)明者邁克爾·加斯塔德, 托馬斯·費(fèi)蘭, 布倫特·亞德利 申請(qǐng)人:國(guó)際商業(yè)機(jī)器公司