專利名稱:通過(guò)事件相關(guān)來(lái)進(jìn)行根本原因問(wèn)題標(biāo)識(shí)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及自動(dòng)化根本原因標(biāo)識(shí)技術(shù)。
背景技術(shù):
根本原因標(biāo)識(shí)是解決問(wèn)題領(lǐng)域中用于標(biāo)識(shí)問(wèn)題或事件的根本原因的一類方法。一 般而言,能夠通過(guò)解決問(wèn)題的根本原因,而不是通過(guò)解決不斷從該問(wèn)題導(dǎo)出的癥狀來(lái)對(duì)問(wèn) 題求解。理想地,當(dāng)解決了根本原因時(shí),隨著該根本原因而來(lái)的癥狀就會(huì)消失。傳統(tǒng)的根本 原因分析是以系統(tǒng)性方式執(zhí)行的,其中結(jié)論和根本原因得到證據(jù)以及根本原因和問(wèn)題之間 建立的因果關(guān)系的支持。然而,在根本原因標(biāo)識(shí)期間,很難區(qū)分需要服務(wù)/產(chǎn)品的工作團(tuán)隊(duì) 的手動(dòng)干預(yù)的事件以及不需要手動(dòng)干預(yù)的事件。這一區(qū)分在例如軟件服務(wù)和企業(yè)IT部門 中是重要的,因?yàn)榉?wù)的正在進(jìn)行的運(yùn)行成本與系統(tǒng)發(fā)出的支持權(quán)證(support ticket)的 數(shù)量是成比例的。一些現(xiàn)有系統(tǒng)通過(guò)假設(shè)發(fā)生在進(jìn)程的分析窗口執(zhí)行期間的第一個(gè)或最后一個(gè)錯(cuò) 誤事件是根本原因來(lái)檢測(cè)進(jìn)程中的錯(cuò)誤。然而,這一方法缺乏精確性,并且可能產(chǎn)生假警報(bào) (例如,如果錯(cuò)誤事件并不嚴(yán)重,或者只是臨時(shí)的,或者如果事件能自我解決)。此外,通過(guò) 追蹤代碼路徑來(lái)理解每次失敗的原因是困難和費(fèi)時(shí)的。
發(fā)明內(nèi)容
本發(fā)明的各個(gè)實(shí)施方式提供了自動(dòng)化根本原因標(biāo)識(shí)。一些實(shí)施方式從在計(jì)算設(shè)備 上執(zhí)行的進(jìn)程接收活動(dòng)事件數(shù)據(jù),其中每個(gè)活動(dòng)事件具有與其相關(guān)聯(lián)的相關(guān)標(biāo)識(shí)符、解決 狀態(tài)以及發(fā)生時(shí)間值?;谒鱿嚓P(guān)標(biāo)識(shí)符和活動(dòng)的類型將所述多個(gè)活動(dòng)事件中的每一個(gè) 分配至多個(gè)事件組中的一個(gè)。將一個(gè)事件組標(biāo)識(shí)為指示進(jìn)程的失敗,并且選擇來(lái)自所標(biāo)識(shí) 的事件組的一個(gè)活動(dòng)事件并向用戶標(biāo)識(shí)該活動(dòng)事件作為根本原因活動(dòng)事件。提供本發(fā)明內(nèi)容是為了以簡(jiǎn)化的形式介紹將在以下具體實(shí)施方式
中進(jìn)一步描述 的一些概念。本發(fā)明內(nèi)容并非旨在標(biāo)識(shí)所要求保護(hù)的主題的關(guān)鍵特征或必要特征,也不旨 在用于幫助確定所要求保護(hù)的主題的范圍。
圖1是監(jiān)視多個(gè)設(shè)備上的多個(gè)進(jìn)程的系統(tǒng)的示例性框圖。圖2是示出與活動(dòng)事件相關(guān)聯(lián)的數(shù)據(jù)的示例性框圖。圖3是示出用于標(biāo)識(shí)問(wèn)題的根本原因的過(guò)程的示例性流程圖。圖4是示出將活動(dòng)事件選為問(wèn)題的根本原因的示例性流程圖。在附圖中,對(duì)應(yīng)的附圖標(biāo)記指示對(duì)應(yīng)的部分。
具體實(shí)施例方式參見(jiàn)附圖,本發(fā)明的實(shí)施方式提供了用于監(jiān)視多個(gè)受監(jiān)視計(jì)算設(shè)備(例如,受監(jiān)視計(jì)算設(shè)備#1至受監(jiān)視計(jì)算設(shè)備#N)上的多個(gè)進(jìn)程(例如,進(jìn)程#1至進(jìn)程#N)的系統(tǒng)100。 本發(fā)明的實(shí)施方式提供了通過(guò)將活動(dòng)事件(例如,諸如“連接至數(shù)據(jù)庫(kù)失敗”之類的低級(jí)原 因事件與系統(tǒng)級(jí)失敗事件(例如登記活動(dòng)在一預(yù)定時(shí)間段中95%的嘗試失敗))相關(guān)來(lái)自 動(dòng)確定根本原因標(biāo)識(shí)的能力。具有了將低級(jí)原因事件與系統(tǒng)級(jí)失敗事件相關(guān)的能力,可以 更有效地提供支持權(quán)證和故障診斷以最小化發(fā)出的支持權(quán)證的數(shù)量以及花費(fèi)在故障診斷 上的時(shí)間,并由此降低成本。進(jìn)程被分成多個(gè)活動(dòng)事件(例如,活動(dòng)/進(jìn)程開(kāi)始、活動(dòng)/進(jìn)程結(jié)束(失敗)、活 動(dòng)/進(jìn)程結(jié)束(成功)、以及錯(cuò)誤事件)。用唯一的相關(guān)標(biāo)識(shí)符以及其他活動(dòng)事件標(biāo)識(shí)符來(lái) 標(biāo)記作為錯(cuò)誤事件或活動(dòng)/進(jìn)程結(jié)束(失敗)的活動(dòng)事件。相關(guān)標(biāo)識(shí)符被用于跟蹤并相關(guān) 每個(gè)活動(dòng)事件。相關(guān)標(biāo)識(shí)符在差錯(cuò)第一次出現(xiàn)時(shí)創(chuàng)建并被附加到該差錯(cuò)。例如,相關(guān)標(biāo)識(shí) 符被“標(biāo)記”給產(chǎn)生錯(cuò)誤事件的第一活動(dòng)事件。因此,每個(gè)由于產(chǎn)生錯(cuò)誤的第一活動(dòng)事件而 產(chǎn)生錯(cuò)誤的活動(dòng)事件都被用與產(chǎn)生錯(cuò)誤事件的第一活動(dòng)事件相同的相關(guān)標(biāo)識(shí)符來(lái)標(biāo)記。具 有相同相關(guān)標(biāo)識(shí)符的活動(dòng)事件都被視為在同一事件組內(nèi)。用解決狀態(tài)來(lái)標(biāo)識(shí)每個(gè)事件組, 例如,“失敗“、”成功”或“從錯(cuò)誤中成功恢復(fù)”(例如,系統(tǒng)100自動(dòng)解決了導(dǎo)致錯(cuò)誤的問(wèn) 題)。使用這一技術(shù),系統(tǒng)100能夠“忽略”系統(tǒng)100成功從中恢復(fù)的活動(dòng)事件(例如,具有 “成功恢復(fù)”解決狀態(tài)的事件組)并且專注于系統(tǒng)100未能成功從中恢復(fù)的、導(dǎo)致失敗的事 件組。本發(fā)明的各個(gè)實(shí)施方式還提供了區(qū)分系統(tǒng)100中指示本地或內(nèi)部組件的問(wèn)題的 差錯(cuò)以及指示遠(yuǎn)程或外部組件的問(wèn)題的差錯(cuò)(例如,當(dāng)系統(tǒng)由于外部組件故障而不工作 時(shí))的能力。通過(guò)確定失敗的位置/范圍來(lái)進(jìn)行區(qū)分。例如,本發(fā)明的各方面可將后端確 定為失敗場(chǎng)所,盡管失敗是從前端發(fā)生過(guò)來(lái)的。再次參見(jiàn)圖1,提供了系統(tǒng)100的示例性框圖。該系統(tǒng)包括計(jì)算設(shè)備112、一個(gè)或 多個(gè)網(wǎng)絡(luò)110、以及受監(jiān)視計(jì)算設(shè)備102(例如,受監(jiān)視計(jì)算設(shè)備#1至受監(jiān)視計(jì)算設(shè)備#N)。 計(jì)算設(shè)備112被配置為通過(guò)一個(gè)或多個(gè)網(wǎng)絡(luò)110與受監(jiān)視計(jì)算設(shè)備102通信。盡管參考作為服務(wù)器計(jì)算設(shè)備的計(jì)算設(shè)備112示出并且描述了本發(fā)明的一些實(shí) 施方式,但本發(fā)明的各方面可用于執(zhí)行本文示出并且描述的功能的任何設(shè)備或其等價(jià)物。 例如,本發(fā)明的實(shí)施方式可用于上網(wǎng)本、臺(tái)式計(jì)算設(shè)備、膝上型計(jì)算機(jī)、以及其他計(jì)算設(shè)備。 在這些實(shí)施方式中,數(shù)據(jù)可由云服務(wù)來(lái)存儲(chǔ)并可由實(shí)現(xiàn)本發(fā)明的功能的任何計(jì)算設(shè)備來(lái)訪 問(wèn)。此外,在一些實(shí)施方式中,受監(jiān)視計(jì)算機(jī)設(shè)備102、網(wǎng)絡(luò)110以及計(jì)算設(shè)備112可位于同 一物理機(jī)器上。在這一拓?fù)浣Y(jié)構(gòu)下,可能存在多個(gè)系統(tǒng),每個(gè)系統(tǒng)負(fù)責(zé)單獨(dú)地報(bào)告各自系統(tǒng) 的失敗。由于以上討論的本地化/范圍,在這些實(shí)施方式中消除了對(duì)來(lái)自數(shù)個(gè)系統(tǒng)的失敗 的重復(fù)報(bào)告。因此,第一次遭遇失敗的系統(tǒng)報(bào)告該失敗。再次參考圖1,示例性框圖示出了具有存儲(chǔ)器區(qū)域116的計(jì)算設(shè)備112,所述存儲(chǔ) 器區(qū)域116用于存儲(chǔ)用于自動(dòng)標(biāo)識(shí)根本原因活動(dòng)事件的組件。計(jì)算設(shè)備112還包括顯示器 115和至少一個(gè)處理器114。顯示器115可以是例如電容式觸摸屏顯示器,該電容式觸摸屏 顯示器被集成到計(jì)算設(shè)備112中的、外置于計(jì)算設(shè)備112或者是保存設(shè)備112上的失敗的 歷史以便進(jìn)一步處理的任何種類的日志。在顯示器115中提供用戶輸入功能,其用作為用 戶輸入選擇設(shè)備以及向用戶提供根本原因活動(dòng)事件的標(biāo)識(shí)的裝置。在各實(shí)施方式中,顯示 器115被配置為響應(yīng)于顯示器115上的用戶按壓接觸以選擇性地執(zhí)行功能。因此,用戶可通過(guò)接觸顯示器115的表面來(lái)操作對(duì)于計(jì)算設(shè)備112可用的所需故障診斷功能以及在此所 提供的其它功能。存儲(chǔ)器區(qū)域116存儲(chǔ)活動(dòng)事件數(shù)據(jù)118以及一個(gè)或多個(gè)計(jì)算機(jī)可執(zhí)行組件。示例 性組件包括但不限于接口組件120、相關(guān)組件122、定位組件124、過(guò)濾組件126、以及顯示組 件128。雖然活動(dòng)事件數(shù)據(jù)118和組件120-1 被示為存儲(chǔ)在存儲(chǔ)器區(qū)域116中,但活動(dòng)事 件數(shù)據(jù)118和組件120-1 可被存儲(chǔ)在遠(yuǎn)離計(jì)算設(shè)備112的存儲(chǔ)器區(qū)域中并從中執(zhí)行。例 如,活動(dòng)事件數(shù)據(jù)118可被存儲(chǔ)在云服務(wù)、數(shù)據(jù)庫(kù)或可由計(jì)算設(shè)備112訪問(wèn)的其他存儲(chǔ)器區(qū) 域中。這些實(shí)施方式減輕了計(jì)算設(shè)備112上的計(jì)算和存儲(chǔ)負(fù)擔(dān)。處理器114執(zhí)行用于實(shí)現(xiàn)本發(fā)明的各方面的計(jì)算機(jī)可執(zhí)行指令。在某些實(shí)施方 式中,處理器114通過(guò)執(zhí)行計(jì)算機(jī)可執(zhí)行指令或通過(guò)以其他方式編程來(lái)變換成專用微處理 器。例如,接口組件120在由處理器114執(zhí)行時(shí)使處理器114接收活動(dòng)事件數(shù)據(jù)118。活動(dòng) 事件數(shù)據(jù)118對(duì)應(yīng)于多個(gè)活動(dòng)事件(例如,活動(dòng)/進(jìn)程開(kāi)始、活動(dòng)/進(jìn)程結(jié)束(失敗)、活動(dòng) /進(jìn)程結(jié)束(成功)、以及錯(cuò)誤事件)。參考圖2,示出了例示與活動(dòng)事件數(shù)據(jù)118相關(guān)聯(lián)的數(shù)據(jù)的示例性框圖。示例性數(shù) 據(jù)包括用于追蹤和相關(guān)活動(dòng)事件的相關(guān)標(biāo)識(shí)符202、用于將活動(dòng)事件標(biāo)識(shí)為“失敗”、“成功” 或“成功從錯(cuò)誤中恢復(fù)”的解決狀態(tài)204、用于將活動(dòng)事件與具體進(jìn)程相關(guān)聯(lián)的進(jìn)程標(biāo)識(shí)符 206、以及用于確定活動(dòng)事件的時(shí)間順序的發(fā)生時(shí)間值208,該數(shù)據(jù)隨后被用于標(biāo)識(shí)根本原 因活動(dòng)事件。例如,發(fā)生時(shí)間值是時(shí)間戳或者從時(shí)間戳導(dǎo)出的值。在一些實(shí)施方式中,受監(jiān)視計(jì)算設(shè)備102提供活動(dòng)事件數(shù)據(jù)118。在其它實(shí)施方式 中,其它設(shè)備或應(yīng)用程序提供、計(jì)算、或分配活動(dòng)事件118的一個(gè)或多個(gè)元素。重新參考圖1,相關(guān)組件112當(dāng)由處理器114執(zhí)行時(shí)使處理器114基于活動(dòng)事件的 相關(guān)標(biāo)識(shí)符202來(lái)將多個(gè)活動(dòng)事件中的每一個(gè)分配給多個(gè)事件組中的一個(gè)。在一個(gè)實(shí)施方 式中,相關(guān)組件122將相關(guān)標(biāo)識(shí)符標(biāo)記到被標(biāo)識(shí)為錯(cuò)誤事件的第一活動(dòng)事件,并將同一相 關(guān)標(biāo)識(shí)符標(biāo)記到被標(biāo)識(shí)為由被標(biāo)識(shí)為錯(cuò)誤事件的第一活動(dòng)事件所導(dǎo)致的錯(cuò)誤事件的任何 活動(dòng)事件。在各實(shí)施方式中,相關(guān)標(biāo)識(shí)符202將具有同一相關(guān)標(biāo)識(shí)符的活動(dòng)事件中的每一 個(gè)分配到一個(gè)事件組中。進(jìn)程可具有構(gòu)成該進(jìn)程的一個(gè)或多個(gè)事件組,其中每個(gè)事件組代 表具有同一相關(guān)標(biāo)識(shí)符的一個(gè)或多個(gè)活動(dòng)事件。定位組件IM在由處理器114執(zhí)行時(shí)使處理器114標(biāo)識(shí)多個(gè)事件組中的至少一 個(gè),該至少一個(gè)事件組具有分配給其的、具有指示進(jìn)程失敗的解決狀態(tài)的至少一個(gè)活動(dòng)事 件,該進(jìn)程由該至少一個(gè)活動(dòng)事件的進(jìn)程標(biāo)識(shí)符來(lái)標(biāo)識(shí)。因此,具有指示失敗的解決狀態(tài)的 事件組被審閱,而具有指示成功解決的解決狀態(tài)的事件組被忽略。在實(shí)施方式中,在預(yù)定義 的時(shí)間段之間對(duì)具有“成功”解決狀態(tài)的事件組進(jìn)行審閱以確定每個(gè)事件組在預(yù)定義時(shí)間 段內(nèi)出現(xiàn)了錯(cuò)誤事件但成功恢復(fù)的次數(shù)。將這一次數(shù)與閾值次數(shù)或閾值百分比相比較,以 確定錯(cuò)誤事件/成功解決是否在足夠頻繁的基礎(chǔ)上發(fā)生(例如,在每個(gè)五分鐘的三個(gè)預(yù)定 義時(shí)間段內(nèi)登記活動(dòng)在95%的嘗試中失敗),以引發(fā)支持權(quán)證、故障診斷或用戶的進(jìn)一步 審閱。過(guò)濾組件1 在由處理器114執(zhí)行時(shí)使處理器114基于每個(gè)活動(dòng)事件的發(fā)生時(shí)間 值來(lái)將來(lái)自所標(biāo)識(shí)的事件組中的至少一個(gè)活動(dòng)事件中的一個(gè)選為根本原因活動(dòng)事件。例 如,進(jìn)程中將被標(biāo)識(shí)為錯(cuò)誤事件的第一活動(dòng)事件被分配發(fā)生時(shí)間值“ 1 ”。之后,被標(biāo)識(shí)為錯(cuò)誤事件的下一活動(dòng)事件被分配發(fā)生時(shí)間值“2”,以此類推因此,可假設(shè)每個(gè)事件組中最小發(fā) 生時(shí)間值就是根本原因活動(dòng)事件。在實(shí)施方式中,過(guò)濾組件126還確定多個(gè)活動(dòng)事件的重 要性級(jí)別,并基于所確定的多個(gè)活動(dòng)事件的重要性級(jí)別發(fā)出服務(wù)權(quán)證。多個(gè)活動(dòng)事件的重 要性級(jí)別基于事件組類型、或者基于事件組類型和根本原因活動(dòng)事件兩者。顯示組件1 在由處理器114執(zhí)行時(shí)使處理器114向用戶呈現(xiàn)與根本原因活動(dòng)事件相關(guān)聯(lián)的活動(dòng)事件數(shù) 據(jù)118。另外,處理器114還可用如此處參考圖3和圖4所描述的指令編程。接著參考圖3,示例性流程圖示出了用于根本原因活動(dòng)事件標(biāo)識(shí)的過(guò)程。在302, 從在受監(jiān)視計(jì)算設(shè)備(例如,受監(jiān)視計(jì)算設(shè)備102中的一個(gè))上執(zhí)行的進(jìn)程接收活動(dòng)事件 數(shù)據(jù)(例如,活動(dòng)事件數(shù)據(jù)118)。活動(dòng)事件數(shù)據(jù)對(duì)應(yīng)于多個(gè)活動(dòng)事件(例如,活動(dòng)/進(jìn)程 開(kāi)始、活動(dòng)/進(jìn)程結(jié)束(失敗)、活動(dòng)/進(jìn)程結(jié)束(成功)、以及錯(cuò)誤事件)。每個(gè)活動(dòng)事件 包括以下各項(xiàng)中的一個(gè)或多個(gè)活動(dòng)類型(例如,存儲(chǔ)器訪問(wèn)、數(shù)據(jù)操作、數(shù)據(jù)通信等等)、 活動(dòng)實(shí)例標(biāo)識(shí)符、相關(guān)標(biāo)識(shí)符、解決狀態(tài)、以及發(fā)生時(shí)間值。在各實(shí)施方式中,基于事件組類 型、或者基于事件組類型和根本原因活動(dòng)事件兩者、或者基于事件組類型和活動(dòng)類型兩者 來(lái)確定多個(gè)活動(dòng)事件的重要性級(jí)別,因此,被認(rèn)為被其他活動(dòng)事件更重要和/或更緊急的 活動(dòng)事件能夠在被認(rèn)為沒(méi)有這么重要和/或緊急的其它活動(dòng)事件之前被解決。在306,基于活動(dòng)事件的相關(guān)標(biāo)識(shí)符來(lái)將多個(gè)活動(dòng)事件中的每一個(gè)分配到多個(gè)事 件組中的一個(gè)。在一個(gè)實(shí)施方式中,相關(guān)標(biāo)識(shí)符被標(biāo)記/分配給被標(biāo)識(shí)為錯(cuò)誤事件的第一 活動(dòng)事件,并且同一相關(guān)標(biāo)識(shí)符被標(biāo)記/分配給被標(biāo)識(shí)為由此產(chǎn)生的錯(cuò)誤事件的任何活動(dòng) 事件,并且具有相同相關(guān)標(biāo)識(shí)符的每個(gè)活動(dòng)事件被分配給同一事件組。進(jìn)程可具有構(gòu)成該 進(jìn)程的一個(gè)或多個(gè)事件組,其中每個(gè)事件組代表具有相同相關(guān)標(biāo)識(shí)符的一個(gè)或多個(gè)活動(dòng)事 件。在308,標(biāo)識(shí)多個(gè)事件組中的至少一個(gè),該至少一個(gè)事件組含有分配給其的、具有 指示進(jìn)程失敗的解決狀態(tài)的至少一個(gè)活動(dòng)事件。在實(shí)施方式中,確定在一預(yù)定義時(shí)間段中 進(jìn)程失敗的次數(shù)以及進(jìn)程失敗的時(shí)間段的量,并且提供服務(wù)權(quán)證。然而,這一審閱過(guò)程不限 于已經(jīng)失敗并且沒(méi)有恢復(fù)的進(jìn)程,具有“成功”解決狀態(tài)的進(jìn)程或事件組也可在預(yù)定義時(shí)間 段之間被審閱,以確定每個(gè)事件組在預(yù)定義時(shí)間段之間發(fā)生錯(cuò)誤但成功恢復(fù)的次數(shù)。如上 所述,將這一次數(shù)與閾值次數(shù)或閾值百分比相比較,以確定錯(cuò)誤事件/成功解決是否在足 夠頻繁的基礎(chǔ)上發(fā)生(例如,在一個(gè)星期的預(yù)定時(shí)間段內(nèi)登記活動(dòng)95%的嘗試失敗),以引 發(fā)支持權(quán)證、故障診斷或用戶的進(jìn)一步審閱。在312,基于發(fā)生時(shí)間值從所標(biāo)識(shí)的事件組中選擇至少一個(gè)活動(dòng)事件中的一個(gè)作 為根本原因活動(dòng)事件。在其中所標(biāo)識(shí)的事件組中的第一錯(cuò)誤事件被分配發(fā)生時(shí)間值“1”,且 之后同一事件組中的下一錯(cuò)誤事件被分配發(fā)生時(shí)間值“2”,以此類推的實(shí)施方式中,具有最 低發(fā)生時(shí)間值的錯(cuò)誤事件被標(biāo)識(shí)為根本原因活動(dòng)事件。在其中發(fā)生時(shí)間值是時(shí)間戳的實(shí)施 方式中,所標(biāo)識(shí)的事件組中具有最早的時(shí)間戳值的錯(cuò)誤事件被標(biāo)識(shí)為根本原因活動(dòng)事件。在314,向計(jì)算設(shè)備的用戶標(biāo)識(shí)根本原因活動(dòng)事件。在各實(shí)施方式中,根據(jù)重要性 順序?qū)⒚總€(gè)錯(cuò)誤事件呈現(xiàn)給用戶,并且每個(gè)事件組與解決狀態(tài)一起被呈現(xiàn)。在其它實(shí)施方 式中,根本原因活動(dòng)事件被存儲(chǔ)在日志中以供后續(xù)訪問(wèn)。接著參考圖4,示出了例示用于根本原因活動(dòng)事件標(biāo)識(shí)的過(guò)程400的示例性流程 圖。過(guò)程400開(kāi)始于被標(biāo)識(shí)為“活動(dòng)/進(jìn)程開(kāi)始”的活動(dòng)事件402。過(guò)程400繼續(xù)到其中標(biāo)識(shí)錯(cuò)誤事件的活動(dòng)事件404。因此,活動(dòng)事件404被標(biāo)記為“錯(cuò)誤事件”。由于活動(dòng)事件 404是過(guò)程400中的第一個(gè)錯(cuò)誤事件,因此相關(guān)標(biāo)識(shí)符“X”被分配給活動(dòng)事件404。此外, 活動(dòng)事件404被分配發(fā)生時(shí)間值“1”,因?yàn)榛顒?dòng)事件404是過(guò)程400中的第一個(gè)錯(cuò)誤事件。 過(guò)程400繼續(xù),并且在活動(dòng)事件406指示附加錯(cuò)誤事件,且活動(dòng)事件406被標(biāo)記為“錯(cuò)誤事 件”。然而,因?yàn)榛顒?dòng)事件406的所指示的錯(cuò)誤事件是從活動(dòng)事件404的所指示的錯(cuò)誤事件 生成的,所以406處的活動(dòng)事件被分配與分配給活動(dòng)事件404的相關(guān)標(biāo)識(shí)符相同的相關(guān)標(biāo) 識(shí)符(例如,相關(guān)標(biāo)識(shí)符“X”)?;顒?dòng)事件406還被分配發(fā)生時(shí)間值“2”,因?yàn)榛顒?dòng)事件406 是過(guò)程400中的第二個(gè)錯(cuò)誤事件。過(guò)程400繼續(xù)到活動(dòng)事件408?;顒?dòng)事件408被標(biāo)識(shí)為“錯(cuò)誤被解決”活動(dòng)事件。 因此,由于起始于活動(dòng)事件404的錯(cuò)誤被解決,因此活動(dòng)事件408不被分配相關(guān)標(biāo)識(shí)符或發(fā) 生標(biāo)識(shí)符值(在一些實(shí)施方式中)。然而,被標(biāo)識(shí)為是錯(cuò)誤事件的下一活動(dòng)事件被分配與當(dāng) 前過(guò)程之前提供的任何其它相關(guān)標(biāo)識(shí)符不同的相關(guān)標(biāo)識(shí)符。例如,當(dāng)過(guò)程400繼續(xù)時(shí),活動(dòng) 事件410被標(biāo)識(shí)為錯(cuò)誤事件。因此,由于活動(dòng)事件410是解決了前一錯(cuò)誤事件后的第一個(gè) 錯(cuò)誤事件,因此分配不同的相關(guān)標(biāo)識(shí)符“Y”。相關(guān)標(biāo)識(shí)符“Y”還與分配給該進(jìn)程(或被監(jiān)視 的進(jìn)程組)的任何其它相關(guān)標(biāo)識(shí)符不同?;顒?dòng)事件410還被分配發(fā)生時(shí)間值“3”,因?yàn)榛顒?dòng) 事件410是過(guò)程400中的第三個(gè)錯(cuò)誤事件。過(guò)程400前進(jìn)到被標(biāo)識(shí)為錯(cuò)誤事件的活動(dòng)事件412。然而,因?yàn)榛顒?dòng)事件412的所 指示的錯(cuò)誤事件是從活動(dòng)事件410的所指示的錯(cuò)誤事件生成的,所以活動(dòng)事件412被分配 與分配給活動(dòng)事件410的相關(guān)標(biāo)識(shí)符相同的相關(guān)標(biāo)識(shí)符(例如,相關(guān)標(biāo)識(shí)符“Y”)?;顒?dòng)事 件412還被分配發(fā)生時(shí)間值“4”,因?yàn)榛顒?dòng)事件412是過(guò)程400中的第四個(gè)錯(cuò)誤事件。進(jìn)程400繼續(xù)到活動(dòng)事件414,在那里確定過(guò)程400以“失敗”結(jié)束?;顒?dòng)事件414 被標(biāo)識(shí)為錯(cuò)誤事件,并且因?yàn)榛顒?dòng)事件414的所指示的錯(cuò)誤事件是從活動(dòng)事件412和410 的所指示的錯(cuò)誤事件生成的,所以活動(dòng)事件414被分配與分配給活動(dòng)事件412和410的相 關(guān)標(biāo)識(shí)符相同的相關(guān)標(biāo)識(shí)符(例如,相關(guān)標(biāo)識(shí)符“Y”)活動(dòng)事件414還被分配發(fā)生時(shí)間值 “5”,因?yàn)榛顒?dòng)事件414是過(guò)程400中的第五個(gè)錯(cuò)誤事件。過(guò)程400可被分為兩個(gè)事件組。包括具有相關(guān)標(biāo)識(shí)符“X”的每個(gè)活動(dòng)事件的第一 事件組,以及包括具有相關(guān)標(biāo)識(shí)符“Y”的每個(gè)活動(dòng)事件的第二事件組。在確定過(guò)程400的 根本原因事件時(shí),第一事件組被忽略,因?yàn)榈谝皇录M被標(biāo)識(shí)為“成功恢復(fù)”,而第二事件組 被審閱,因?yàn)榈诙录M被標(biāo)識(shí)為“失敗”。使用結(jié)合圖3所述的規(guī)則,第二事件組中的最低 發(fā)生時(shí)間值是過(guò)程400的根本原因活動(dòng)事件。因此,具有發(fā)生時(shí)間值“3”的活動(dòng)事件410 是過(guò)程400的失敗的根本原因活動(dòng)事件。示例性操作環(huán)境諸如此處所描述的計(jì)算機(jī)或計(jì)算設(shè)備具有一個(gè)或多個(gè)處理器或處理單元、系統(tǒng)存 儲(chǔ)器和某種形式的計(jì)算機(jī)可讀介質(zhì)。作為示例而非限制,計(jì)算機(jī)可讀介質(zhì)包括計(jì)算機(jī)存儲(chǔ) 介質(zhì)和通信介質(zhì)。計(jì)算機(jī)存儲(chǔ)介質(zhì)包括以用于存儲(chǔ)諸如計(jì)算機(jī)可讀指令、數(shù)據(jù)結(jié)構(gòu)、程序 模塊或其它數(shù)據(jù)的信息的任何方法或技術(shù)實(shí)現(xiàn)的易失性與非易失性、可移動(dòng)與不可移動(dòng)介 質(zhì)。通信介質(zhì)一般以諸如載波或其它傳輸機(jī)制等已調(diào)制數(shù)據(jù)信號(hào)來(lái)體現(xiàn)計(jì)算機(jī)可讀指令、 數(shù)據(jù)結(jié)構(gòu)、程序模塊或其它數(shù)據(jù),并且包括任何信息傳遞介質(zhì)。以上的任一種的組合也包括 在計(jì)算機(jī)可讀介質(zhì)的范圍之內(nèi)。
計(jì)算機(jī)可使用至一個(gè)或多個(gè)遠(yuǎn)程計(jì)算機(jī),如遠(yuǎn)程計(jì)算機(jī)的邏輯連接在網(wǎng)絡(luò)化環(huán)境 中操作。盡管結(jié)合示例性計(jì)算系統(tǒng)環(huán)境進(jìn)行了描述,但本發(fā)明的各實(shí)施方式可用于眾多其 它通用或?qū)S糜?jì)算系統(tǒng)環(huán)境或配置。計(jì)算系統(tǒng)環(huán)境并非旨在對(duì)本發(fā)明的任何方面的使用范 圍或功能提出任何限制。此外,計(jì)算機(jī)環(huán)境也不應(yīng)被解釋成對(duì)于示例性操作環(huán)境中所示出 的任一組件或其組合有任何依賴或要求。適用于本發(fā)明的各方面的公知的計(jì)算系統(tǒng)、環(huán)境 和/或配置的示例包括,但不僅限于個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持式或膝上型設(shè)備、多 處理器系統(tǒng)、基于微處理器的系統(tǒng)、機(jī)頂盒、可編程消費(fèi)電子產(chǎn)品、移動(dòng)電話、網(wǎng)絡(luò)PC、小型 計(jì)算機(jī)、大型計(jì)算機(jī)、包括上面的系統(tǒng)或設(shè)備的中的任何一種的分布式計(jì)算環(huán)境等等??梢栽谟梢慌_(tái)或多臺(tái)計(jì)算機(jī)或其他設(shè)備執(zhí)行的諸如程序模塊之類的計(jì)算機(jī)可執(zhí) 行的指令的一般上下文中來(lái)描述本發(fā)明的各實(shí)施方式。計(jì)算機(jī)可執(zhí)行指令可以被組織成一 個(gè)或多個(gè)計(jì)算機(jī)可執(zhí)行組件或模塊。一般而言,程序模塊包括,但不限于,執(zhí)行特定任務(wù)或 實(shí)現(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件,以及數(shù)據(jù)結(jié)構(gòu)??梢岳萌魏螖?shù)量的這樣 的組件或模塊及其組織來(lái)實(shí)現(xiàn)本發(fā)明的各方面。例如,本發(fā)明的各方面不僅限于附圖中所 示出并且在此處所描述的特定計(jì)算機(jī)可執(zhí)行指令或特定組件或模塊。本發(fā)明的其他實(shí)施方 式可以包括具有比此處所示出和描述的功能更多或更少功能的不同的計(jì)算機(jī)可執(zhí)行指令 或組件。本發(fā)明的各方面也可以在其中任務(wù)由通過(guò)通信網(wǎng)絡(luò)鏈接的遠(yuǎn)程處理設(shè)備執(zhí)行的分 布式計(jì)算環(huán)境中實(shí)現(xiàn)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)器存儲(chǔ)設(shè)備在內(nèi) 的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。本發(fā)明的各方面當(dāng)被配置成執(zhí)行此處所描述的指令時(shí)將通用計(jì)算機(jī)變換成專用 計(jì)算設(shè)備。此處所示出并描述的實(shí)施方式以及此處沒(méi)有詳細(xì)描述但是屬于本發(fā)明范疇內(nèi)的 實(shí)施方式構(gòu)成了用于確定根本原因活動(dòng)事件的示例性手段。此處所示出和描述的本發(fā)明的各實(shí)施方式中的操作的執(zhí)行或?qū)崿F(xiàn)的順序不是必 需的,除非另外指定。即,除非另外指定,否則操作可以按任何順序執(zhí)行,且本發(fā)明的各實(shí)施 方式可以包括比此處所公開(kāi)的操作更多或更少的操作。例如,構(gòu)想了在一個(gè)操作之前、同時(shí) 或之后執(zhí)行另一個(gè)操作是在本發(fā)明的各方面的范圍之內(nèi)的。當(dāng)介紹本發(fā)明的各方面的元素或其實(shí)施方式時(shí),冠詞“一”、“一個(gè)”、“該”、“所述”
旨在表示有元素中的一個(gè)或多個(gè)。術(shù)語(yǔ)“包括”、“包含”以及“具有”旨在是包含性的,并意 味著除所列出的元素以外還可以有額外的元素。已經(jīng)詳細(xì)地描述了本發(fā)明的各方面,顯然,在不偏離所附權(quán)利要求書所定義的本 發(fā)明的各方面的范圍的情況下,可以進(jìn)行各種修改和變化。在不偏離本發(fā)明的各方面的范 圍的情況下,可以對(duì)上面的構(gòu)造、產(chǎn)品以及方法作出各種更改,上面的描述中所包含的和各 個(gè)附圖中所示出的所有主題應(yīng)該解釋為說(shuō)明性的,而不是限制性的。
權(quán)利要求
1.一種用于自動(dòng)化根本原因標(biāo)識(shí)的系統(tǒng);所述系統(tǒng)包括用于儲(chǔ)存活動(dòng)事件數(shù)據(jù)(118)的存儲(chǔ)器區(qū)域(116),所述活動(dòng)事件數(shù)據(jù)(118)接收自至 少一個(gè)正在執(zhí)行的進(jìn)程(106),所述活動(dòng)事件數(shù)據(jù)(118)對(duì)應(yīng)于多個(gè)活動(dòng)事件,所述活動(dòng)事 件中的每一個(gè)都具有與其相關(guān)聯(lián)的活動(dòng)類型、活動(dòng)實(shí)例標(biāo)識(shí)符、相關(guān)標(biāo)識(shí)符(20 、解決狀 態(tài)004)、以及發(fā)生時(shí)間值Q08);處理器(114),所述處理器被編程為基于所述活動(dòng)事件的所述相關(guān)標(biāo)識(shí)符(20 和活動(dòng)類型將所述多個(gè)活動(dòng)事件中的每 一個(gè)分配至多個(gè)事件組中的一個(gè);標(biāo)識(shí)所述多個(gè)事件組中的至少一個(gè),所述至少一個(gè)事件組具有分配給其的、具有指示 所述正在執(zhí)行的進(jìn)程(106)的失敗的解決狀態(tài)O04)的至少一個(gè)活動(dòng)事件;基于所述發(fā)生時(shí)間值(208)從所標(biāo)識(shí)的事件組中選擇所述至少一個(gè)活動(dòng)事件中的一 個(gè)作為根本原因活動(dòng)事件;以及修改存儲(chǔ)在所述存儲(chǔ)器區(qū)域(116)中的活動(dòng)事件數(shù)據(jù)(118)以指示所述根本原因活動(dòng) 事件。
2.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述根本原因活動(dòng)事件是包括具有指示所 述正在執(zhí)行的進(jìn)程的失敗的解決狀態(tài)的至少一個(gè)活動(dòng)事件的事件組中的第一個(gè)活動(dòng)事件。
3.如權(quán)利要求1所述的系統(tǒng),其特征在于,所述處理器還被編程為確定所述多個(gè)活動(dòng) 事件的重要性級(jí)別。
4.如權(quán)利要求3所述的系統(tǒng),其特征在于,所述多個(gè)活動(dòng)事件的重要性級(jí)別基于事件 組類型、或者基于事件組類型和根本原因活動(dòng)事件兩者。
5.如權(quán)利要求1所述的系統(tǒng),其特征在于,從其它活動(dòng)事件生成的活動(dòng)事件用相同的 相關(guān)標(biāo)識(shí)符來(lái)標(biāo)記。
6.如權(quán)利要求1所述的系統(tǒng),其特征在于,在不具有之前相關(guān)聯(lián)的錯(cuò)誤事件的情況下 生成的錯(cuò)誤事件用新相關(guān)標(biāo)識(shí)符來(lái)標(biāo)記。
7.一種方法,包括從在計(jì)算設(shè)備(10 上執(zhí)行的進(jìn)程(106)接收活動(dòng)事件數(shù)據(jù)(118),所述活動(dòng)事件數(shù) 據(jù)(118)對(duì)應(yīng)于多個(gè)活動(dòng)事件,所述活動(dòng)事件中的每一個(gè)都具有與其相關(guān)聯(lián)的相關(guān)標(biāo)識(shí)符 (202)、解決狀態(tài)(204)、以及發(fā)生時(shí)間值(208);基于所述活動(dòng)事件的相關(guān)標(biāo)識(shí)符(20 將所述多個(gè)活動(dòng)事件中的每一個(gè)分配至多個(gè) 事件組中的一個(gè);標(biāo)識(shí)所述多個(gè)事件組中的至少一個(gè),所述至少一個(gè)事件組具有分配給其的、具有指示 所述進(jìn)程(106)的失敗的解決狀態(tài)O04)的至少一個(gè)活動(dòng)事件;基于所述發(fā)生時(shí)間值(208)從所標(biāo)識(shí)的事件組中選擇所述至少一個(gè)活動(dòng)事件中的一 個(gè)作為根本原因活動(dòng)事件;以及向所述計(jì)算設(shè)備(10 的用戶標(biāo)識(shí)所述根本原因活動(dòng)事件。
8.如權(quán)利要求7所述的方法,其特征在于,一個(gè)或多個(gè)事件組對(duì)應(yīng)于動(dòng)作。
9.如權(quán)利要求8所述的方法,其特征在于,還包括基于分配給對(duì)應(yīng)于進(jìn)程的一個(gè)或多 個(gè)事件組的一個(gè)或多個(gè)活動(dòng)事件來(lái)確定所述進(jìn)程是否失敗。
10.如權(quán)利要求9所述的方法,其特征在于,還包括確定在預(yù)定義時(shí)間段期間進(jìn)程失敗的次數(shù)。
11.如權(quán)利要求10所述的方法,其特征在于,還包括基于所確定的在預(yù)定義時(shí)間段期 間進(jìn)程失敗的次數(shù)來(lái)提供服務(wù)權(quán)證。
12.如權(quán)利要求7所述的方法,其特征在于,還包括將所述根本原因活動(dòng)事件呈現(xiàn)給用戶。
13.如權(quán)利要求7所述的方法,其特征在于,還包括確定所述多個(gè)活動(dòng)事件的重要性級(jí) 別,并且其中所述多個(gè)活動(dòng)事件的重要性級(jí)別基于事件組類型、或者基于事件組類型和根 本原因活動(dòng)事件兩者。
14.如權(quán)利要求7所述的方法,其特征在于,所述根本原因活動(dòng)事件是包括不能自動(dòng)恢 復(fù)的一個(gè)或多個(gè)活動(dòng)事件的事件組中的第一個(gè)活動(dòng)事件。
15.如權(quán)利要求7所述的方法,其特征在于,一種或多種計(jì)算機(jī)可讀介質(zhì)具有計(jì)算機(jī)可 執(zhí)行組件,所述組件包括接口組件,所述接口組件在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器接收活動(dòng) 事件數(shù)據(jù),所述活動(dòng)事件數(shù)據(jù)對(duì)應(yīng)于多個(gè)活動(dòng)事件,所述活動(dòng)事件中的每一個(gè)都具有與其 相關(guān)聯(lián)的相關(guān)標(biāo)識(shí)符、解決狀態(tài)、進(jìn)程標(biāo)識(shí)符、以及發(fā)生時(shí)間值,其中至少兩個(gè)活動(dòng)事件具 有相同的相關(guān)標(biāo)識(shí)符和不同的進(jìn)程標(biāo)識(shí)符;相關(guān)組件,所述相關(guān)組件在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器基于所述 活動(dòng)事件的相關(guān)標(biāo)識(shí)符將所述多個(gè)活動(dòng)事件中的每一個(gè)分配至多個(gè)事件組中的一個(gè);定位組件,所述定位組件在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器標(biāo)識(shí)所述 多個(gè)事件組中的至少一個(gè),所述至少一個(gè)事件組具有分配給其的、具有指示進(jìn)程的失敗的 解決狀態(tài)的至少一個(gè)活動(dòng)事件,所述進(jìn)程由所述至少一個(gè)活動(dòng)事件的進(jìn)程標(biāo)識(shí)符來(lái)標(biāo)識(shí);過(guò)濾組件,所述過(guò)濾組件在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器基于發(fā)生 時(shí)間值從所標(biāo)識(shí)的事件組中選擇所述至少一個(gè)活動(dòng)事件中的一個(gè)作為根本原因活動(dòng)事件; 以及顯示組件,所述顯示組件在由至少一個(gè)處理器執(zhí)行時(shí)使所述至少一個(gè)處理器向用戶呈 現(xiàn)與所述根本原因活動(dòng)事件相關(guān)聯(lián)的活動(dòng)事件數(shù)據(jù)。
全文摘要
提供了通過(guò)事件相關(guān)來(lái)進(jìn)行根本原因問(wèn)題標(biāo)識(shí)的各個(gè)實(shí)施例。將活動(dòng)事件相關(guān)以標(biāo)識(shí)進(jìn)程失敗的根本原因。從在計(jì)算設(shè)備上執(zhí)行的進(jìn)程接收活動(dòng)事件數(shù)據(jù)?;顒?dòng)事件數(shù)據(jù)對(duì)應(yīng)于多個(gè)活動(dòng)事件。每個(gè)活動(dòng)事件具有與其相關(guān)聯(lián)的相關(guān)標(biāo)識(shí)符、解決狀態(tài)、以及發(fā)生時(shí)間值?;诨顒?dòng)事件的相關(guān)標(biāo)識(shí)符為每個(gè)活動(dòng)事件分配多個(gè)事件組中的一個(gè)。之后,將至少一個(gè)事件組確定為含有具有指示進(jìn)程失敗的解決狀態(tài)的活動(dòng)事件?;诎l(fā)生時(shí)間值將所確定的事件組中的活動(dòng)事件之一選為根本原因活動(dòng)事件。在一些實(shí)施方式中,向計(jì)算設(shè)備的用戶標(biāo)識(shí)根本原因活動(dòng)事件。
文檔編號(hào)G06F9/44GK102129372SQ201110055059
公開(kāi)日2011年7月20日 申請(qǐng)日期2011年2月28日 優(yōu)先權(quán)日2010年3月1日
發(fā)明者A·斯勞特斯凱, I·弗蘭可, R·E·D·茲夫, Y·奧林, Z·卡斯皮 申請(qǐng)人:微軟公司