專利名稱:減少業(yè)務(wù)中斷時間的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種減少業(yè)務(wù)中斷時間的方法和裝置。
背景技術(shù):
軟失效是基于帶RAM (Random Access Memory,隨才幾存儲器)等存儲內(nèi)存 器件特有的失效模式,和硬失效相對應(yīng),硬失效是器件的硬件本身發(fā)生故障, 除此之外,對于器件不能正常運(yùn)行的情況都稱為軟失效。通常,器件的工作 電壓越低,工藝線寬越窄,或者器件工作環(huán)境所處的位置海拔越高時,器件 的軟失效概率越大。例如,采用0. 13微米技術(shù)的存儲器,其軟失效的概率高 達(dá)每兆位10000 ~ lOOOOOFITs ( Failures In Time,菲特),相當(dāng)于平均幾個月或 者幾個星期就可能會出現(xiàn)一次軟失效。
目前,為了減小由于器件的軟失效帶來的嚴(yán)重性, 一般會在單板等設(shè)備 上增加一片或多片存儲內(nèi)存用于檢測器件軟失效,為了方便說明,本申請將 增加的所述用于4企測器件軟失效的內(nèi)存統(tǒng)稱為ECC (Error Checking and Correcting,檢錯或糾錯)內(nèi)存,所述ECC內(nèi)存能夠檢測設(shè)備上的一個或多 個器件。單板在每次啟動或復(fù)位時,所述ECC內(nèi)存都要對該單板中的器件進(jìn) 行檢測,當(dāng)所述ECC內(nèi)存檢測出單板故障時,單板會重新啟動或復(fù)位,然后 重新進(jìn)行檢測,直到4企測正常。
然而,在進(jìn)行本發(fā)明創(chuàng)造過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)中至少存在如下 問題
由于ECC內(nèi)存在每次單板啟動或重啟時,對單板上的RAM器件進(jìn)行4企 測,當(dāng)出現(xiàn)故障,則重新啟動該單板?,F(xiàn)有技術(shù)中無論這種故障是單板上的 器件導(dǎo)致還是ECC內(nèi)存本身出現(xiàn)故障,只要檢測不通過,則會重復(fù)啟動。
因此,如果是由于ECC內(nèi)存本身出現(xiàn)的故障,而設(shè)備單板除ECC內(nèi)存外
的其他器件完全正常,即能夠正常執(zhí)行業(yè)務(wù),那么也會由于該ECC內(nèi)存故障, 而導(dǎo)致該單板的業(yè)務(wù)中斷。而這時,只能通過更換設(shè)備的單板或者通過冗余
系統(tǒng)的倒換等方式,才能使中斷的業(yè)務(wù)恢復(fù)正常。因此增大了 MTTR(Mean TimeToR印air,平均故障修復(fù)時間),降低了設(shè)備的可用度和運(yùn)行的可靠性。
發(fā)明內(nèi)容
本發(fā)明 一個或多個實(shí)施例的目的在于提供一種減少業(yè)務(wù)中斷時間的方法 和裝置,以達(dá)到通過及時檢測出ECC內(nèi)存故障,而減少設(shè)備業(yè)務(wù)中斷時間的 目的。
為解決上述問題,本發(fā)明實(shí)施例^提供了一種減少業(yè)務(wù)中斷時間的方法, 包括
當(dāng)設(shè)備因故障而無法正常啟動時,判斷所述故障是否是由該設(shè)備的ECC 內(nèi)存引發(fā),若是,則關(guān)閉所述ECC內(nèi)存的運(yùn)行;
觸發(fā)設(shè)備重新啟動,以在啟動后恢復(fù)業(yè)務(wù)運(yùn)行。
基于上述技術(shù)方案,本發(fā)明實(shí)施例還提供了一種對設(shè)備ECC內(nèi)存故障檢 測的方法,包4舌
當(dāng)設(shè)備因故障而無法正常啟動時,關(guān)閉設(shè)備中ECC內(nèi)存的運(yùn)行;
觸發(fā)設(shè)備重新啟動,并
檢驗該設(shè)備是否能夠正常啟動,若是,則確定該設(shè)備的ECC內(nèi)存發(fā)生故障。
基于上述技術(shù)方案,本發(fā)明實(shí)施例還提供了 一種用于減少業(yè)務(wù)中斷時間 的裝置,包括
觸發(fā)單元,用于當(dāng)獲知設(shè)備因故障而無法正常啟動時,向判斷單元發(fā)送 觸發(fā)信號;
判斷單元,用于在收到所述觸發(fā)信號后,判斷所述故障是否是由該設(shè)備 的ECC內(nèi)存引發(fā),若是,則判斷得到ECC內(nèi)存故障消息;
ECC內(nèi)存控制單元,用于在收到所述ECC內(nèi)存故障消息后,關(guān)閉所述
ECC內(nèi)存的運(yùn)行,并觸發(fā)設(shè)備重新啟動,以在啟動后恢復(fù)業(yè)務(wù)運(yùn)行。
基于上述技術(shù)方案,本發(fā)明實(shí)施例還提供了 一種用于檢測設(shè)備ECC內(nèi)存 故障的裝置,包括
觸發(fā)單元,用于當(dāng)獲知設(shè)備因故障而無法正常啟動時,向ECC內(nèi)存控制 單元發(fā)送觸發(fā)信號;
所述ECC內(nèi)存控制單元,用于在收到所述觸發(fā)信號后,關(guān)閉所述ECC
內(nèi)存的運(yùn)行,并觸發(fā)設(shè)備重新啟動,同時通知沖企驗單元進(jìn)行檢驗;
檢驗單元,用于在收到所述通知后,檢驗該設(shè)備是否能夠正常啟動,若 是,則確定該設(shè)備的ECC內(nèi)存發(fā)生故障。
與現(xiàn)有技術(shù)相比,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn)
本發(fā)明在當(dāng)設(shè)備發(fā)生故障時,能夠及時將檢測到出現(xiàn)故障的ECC內(nèi)存關(guān) 閉,從而使得設(shè)備再啟動后,能夠不運(yùn)行故障的ECC內(nèi)存,而正常啟動,并 且恢復(fù)業(yè)務(wù)運(yùn)行。本發(fā)明能夠在設(shè)備出現(xiàn)故障時,排查故障,并盡可能地克 服設(shè)備故障,保證設(shè)備的正常運(yùn)行,從而避免了設(shè)備業(yè)務(wù)的長時間中斷,減 少了設(shè)備的業(yè)務(wù)中斷時間。
圖1為本發(fā)明減少業(yè)務(wù)中斷時間的一種方法實(shí)施例的流程圖; 圖2為本發(fā)明減少業(yè)務(wù)中斷時間的另一種方法實(shí)施例的流程圖; 圖3為本發(fā)明減少業(yè)務(wù)中斷時間的另一種方法實(shí)施例的流程圖; 圖4為本發(fā)明減少業(yè)務(wù)中斷時間的另 一 種方法實(shí)施例的流程圖; 圖5為本發(fā)明用于減少業(yè)務(wù)中斷時間的一種裝置實(shí)施例的結(jié)構(gòu)框圖; 圖6為本發(fā)明用于減少業(yè)務(wù)中斷時間的另一種裝置實(shí)施例的結(jié)構(gòu)框圖7為本發(fā)明用于減少業(yè)務(wù)中斷時間的另 一種裝置實(shí)施例的結(jié)構(gòu)框圖8為本發(fā)明用于檢測設(shè)備ECC內(nèi)存故障的一種裝置實(shí)施例的結(jié)構(gòu)框圖。
具體實(shí)施例方式
本發(fā)明實(shí)施例提供的 一 種減少業(yè)務(wù)中斷時間的方法為,當(dāng)設(shè)備因故障而 無法正常啟動時,例如,設(shè)備反復(fù)重啟,此時判斷所述故障是否是由該設(shè)備
的ECC內(nèi)存引發(fā),若是,則關(guān)閉所述ECC內(nèi)存的運(yùn)行;并在關(guān)閉后,觸發(fā)設(shè) 備重新啟動,以在啟動后恢復(fù)業(yè)務(wù)運(yùn)行。
其中,所述判斷所述故障是否是由該設(shè)備的ECC內(nèi)存引發(fā)的具體實(shí)現(xiàn)包 括,可通過單獨(dú)對所述設(shè)備的ECC內(nèi)存進(jìn)行故障檢測,或者通過對設(shè)備中除
從而得知ECC內(nèi)存狀態(tài),或者通過其他常用手段來^r測所述ECC內(nèi)存的工作 狀態(tài),其中,采用的任何對所述ECC內(nèi)存的故障檢測方法都不影響對本發(fā)明 的實(shí)現(xiàn)。
本發(fā)明在當(dāng)設(shè)備發(fā)生故障時,能夠及時將檢測到出現(xiàn)故障的ECC內(nèi)存關(guān) 閉,從而使得設(shè)備再啟動后,能夠不運(yùn)行故障的ECC內(nèi)存,而正常啟動,并 且恢復(fù)業(yè)務(wù)運(yùn)行。本發(fā)明能夠在設(shè)備出現(xiàn)故障時,排查故障,并盡可能地克 服設(shè)備故障,保證設(shè)備的正常運(yùn)行,從而避免了設(shè)備業(yè)務(wù)的長時間中斷,減 少了設(shè)備的業(yè)務(wù)中斷時間。
基于上述技術(shù)方案,本發(fā)明提供的一種對設(shè)備ECC內(nèi)存故障檢測的方法, 該方法包括以下步驟
當(dāng)收到設(shè)備因故障而無法正常啟動的指令后,關(guān)閉設(shè)備中的RAM存儲內(nèi) 存的運(yùn)行;
觸發(fā)i殳備重新啟動,并
檢驗該設(shè)備中的ECC內(nèi)存是否能夠正常工作,若不能,則確定該設(shè)備的 ECC內(nèi)存發(fā)生故障。
下面結(jié)合附圖,詳細(xì)闡述一下采用本發(fā)明提供的檢測ECC內(nèi)存故障的方 法,來如何實(shí)現(xiàn)減少設(shè)備的業(yè)務(wù)中斷時間。
如圖1所示,為本發(fā)明減少業(yè)務(wù)中斷時間的一種方法實(shí)施例,該方法當(dāng) 設(shè)備單板無法正常啟動時,首先檢查是否ECC內(nèi)存發(fā)生故障,并將出現(xiàn)故障 的ECC內(nèi)存關(guān)閉,以恢復(fù)設(shè)備的正常業(yè)務(wù)運(yùn)行。該方法包括以下步驟
步驟101:設(shè)備的單板啟動或復(fù)位。其中,所述啟動或復(fù)位可以發(fā)生在該 設(shè)備的單板上電時,或者是該設(shè)備的單板由于在運(yùn)行中出現(xiàn)了故障,而執(zhí)行 的重新啟動或復(fù)位。
步驟102:所述單板中的ECC內(nèi)存檢測該單板中的待檢測的所有RAM存 儲芯片是否能正常工作(即是否軟失效),如果正常,則執(zhí)行步驟103;否貝'J, 執(zhí)行步驟104。
步驟103:所述單板在啟動后l丸行業(yè)務(wù)。并結(jié)束本流程。
步驟104:關(guān)閉所述單板中的所有待檢測的RAM存儲芯片的運(yùn)行,并且 重啟該單板。其中,所述關(guān)閉設(shè)置可通過人工手動將單板上的用于控制所述 RAM存儲芯片運(yùn)行的使能開關(guān)關(guān)閉,或由所述單板在重啟時自動關(guān)閉所述 RAM存儲芯片的運(yùn)行,或者其他停止所述RAM存儲芯片運(yùn)行的方法都不影 響本發(fā)明實(shí)施例的實(shí)現(xiàn)。
步驟105:所述單板在重啟后,檢驗所述ECC內(nèi)存是否能正常工作,若 正常,則執(zhí)行步驟106;否則,執(zhí)行步驟107。
步驟106:確定為該單板上的除所述ECC內(nèi)存外的其他RAM存儲芯片 發(fā)生故障。此時,所述單板會由于該單板上的RAM存儲芯片的故障,而無法 正常啟動,因此無法正常執(zhí)行相關(guān)業(yè)務(wù)。此時,則只能通過更換單板來恢復(fù) 業(yè)務(wù)。結(jié)束本流程。
步驟107:確定為該單板上的ECC內(nèi)存發(fā)生故障。此時,關(guān)閉所述單板 的ECC內(nèi)存,使得所述ECC內(nèi)存在每次該板重啟后不會運(yùn)行,同時,開啟所 述單板中的所有待檢測的RAM存儲芯片。之后,再執(zhí)行步驟108。
步驟108:所述單板重新啟動,此時,由于所述單板已經(jīng)將出現(xiàn)故障的 ECC內(nèi)存關(guān)閉了,即暫時消除了單板的故障,所以在重啟時,所述單板可正 常啟動,并在啟動后恢復(fù)相關(guān)的業(yè)務(wù)正常運(yùn)行。結(jié)束本流程。此外,如果所 述單板在重新啟動后,仍然不能正常啟動,則確定所述單板的RAM存儲芯片 也出現(xiàn)了故障,此時,只能通知維護(hù)人員更換單板。
本發(fā)明能夠在設(shè)備出現(xiàn)故障時,檢測是否是設(shè)備的ECC內(nèi)存出現(xiàn)故障,
并將出現(xiàn)故障的ECC內(nèi)存關(guān)閉,使得設(shè)備在重新啟動時,能夠不運(yùn)行發(fā)生故
障的ECC內(nèi)存,而正常啟動,并且恢復(fù)業(yè)務(wù)運(yùn)行,避免了設(shè)備因ECC內(nèi)存出 現(xiàn)故障而導(dǎo)致單板的業(yè)務(wù)中斷,減少了業(yè)務(wù)中斷的時間。
此外,如圖2所示,在上述實(shí)施例的基礎(chǔ)上,該方法在所述步驟107和 步驟108之間,還可包括
步驟209:所述單板分析所述ECC內(nèi)存發(fā)生故障的原因,并將故障原因 保存在該單板的存儲單元上。其中,所述存儲單元包括但不限于FLASH、 BOOTROM?;蛘?,還可直接將所述故障原因?qū)懭氪鎯卧哪臣拇嫫髦小?br>
并且,在執(zhí)行完上述實(shí)施例中的步驟108之后,還可包括
步驟210:所述單板根據(jù)所記錄的ECC內(nèi)存的故障原因,生成故障報告 或者故障日志,并以告警的形式上報。設(shè)備維護(hù)人員可以通過所述告警及時 得知所述單板的故障狀態(tài)及原因,進(jìn)行相應(yīng)的維護(hù)。
上述實(shí)施例單板能夠在確定ECC內(nèi)存發(fā)生故障后,記錄ECC內(nèi)存的故障 原因,并在單板重啟后,將所述故障原因上報。以便維護(hù)人員能夠及時了解 到所述設(shè)備的運(yùn)行情況,并當(dāng)發(fā)現(xiàn)單板出現(xiàn)故障時,能夠及時趕赴現(xiàn)場進(jìn)行 處理。尤其是對于單板的ECC內(nèi)存故障,由于已將發(fā)生故障的ECC內(nèi)存關(guān)閉, 單板不啟動ECC內(nèi)存,就能夠正常執(zhí)行業(yè)務(wù)。維護(hù)人員可以根據(jù)實(shí)際的業(yè)務(wù) 量,選擇在夜間或業(yè)務(wù)量較小的時候,更換單板。從而能夠盡大可能地維護(hù) 業(yè)務(wù)的正常運(yùn)行,減少業(yè)務(wù)中斷的時間,及業(yè)務(wù)中斷帶來的不利影響。
與此同時,本發(fā)明還提供了另一種對設(shè)備ECC內(nèi)存故障檢測的方法,該 方法包括以下步驟
當(dāng)設(shè)備因故障而無法正常啟動時,關(guān)閉設(shè)備中ECC內(nèi)存的運(yùn)行;
觸發(fā)設(shè)備重新啟動,并
檢驗該設(shè)備的RAM存儲芯片能夠正常工作,以至于使得所述單板能夠正 常啟動,若是,則確定該設(shè)備的ECC內(nèi)存發(fā)生故障。
其中,判斷所述存儲芯片能否正常工作的方法可以為設(shè)備在啟動時,
設(shè)備的CPU通過讀取所述RAM存儲芯片中的數(shù)據(jù),來判斷所述存儲芯片的 狀態(tài),當(dāng)所述RAM存儲芯片中的數(shù)據(jù)能夠全部被所述CPU正常讀到時,則 認(rèn)為該存儲芯片能正常工作。當(dāng)然,現(xiàn)有的其他對所述RAM存儲芯片是否正 常的檢測手段也同樣適用于本發(fā)明。
下面結(jié)合附圖,詳細(xì)闡述一下采用本發(fā)明提供的上述檢測ECC內(nèi)存故障 的方法,來如何實(shí)現(xiàn)減少設(shè)備的業(yè)務(wù)中斷時間。
如圖3所示,為本發(fā)明減少業(yè)務(wù)中斷時間的另一種方法實(shí)施例,與上述 實(shí)施例不同的是,本實(shí)施例在檢查是否ECC內(nèi)存發(fā)生故障時,不是直接對ECC 內(nèi)存進(jìn)行檢觀'J,而是通過對單板上除了 ECC內(nèi)存外的其他所有待檢測的RAM 存儲芯片的狀態(tài)檢測,來排查ECC內(nèi)存狀態(tài)。該實(shí)施例包括以下步驟
步驟301:設(shè)備的單板啟動或復(fù)位。其中,所述啟動或復(fù)位可以發(fā)生在該 設(shè)備的單板上電時,或者是該設(shè)備的單板由于在運(yùn)行中出現(xiàn)了故障,而進(jìn)行 的重新啟動或復(fù)位。
步驟302:所述單板中的ECC內(nèi)存檢測該單板中的待檢測的所有RAM存 儲芯片是否能正常工作(即是否軟失效),如果正常,則執(zhí)行步驟303;否則, 執(zhí)行步驟304。
步驟33:所述單板在啟動后執(zhí)行業(yè)務(wù)。并結(jié)束本流程。
步驟304:關(guān)閉所述單板中的ECC內(nèi)存的運(yùn)行,使得在重啟時不再運(yùn)行 所述ECC內(nèi)存。重啟該單板。其中,所述關(guān)閉設(shè)置可通過人工手動將單板上 的用于控制所述RAM存儲芯片運(yùn)行的使能開關(guān)關(guān)閉,或由所述單板在重啟時 自動關(guān)閉所述RAM存儲芯片的運(yùn)行,或者其他停止所述RAM存儲芯片運(yùn)行 的方法都不影響本發(fā)明實(shí)施例的實(shí)現(xiàn)。
步驟305:所述單板在重啟后,檢驗所述單板上的所有待檢測的RAM存 儲芯片是否能正常工作,以至于使得所述單板能夠正常啟動,并且進(jìn)行業(yè)務(wù) 運(yùn)行,若單板能夠正常啟動,則執(zhí)行步驟306;否則,執(zhí)行步驟307。
步驟306:確定為該單板上的ECC內(nèi)存發(fā)生故障。此時,由于所述單板 已經(jīng)將出現(xiàn)故障的ECC內(nèi)存關(guān)閉了,即暫時消除了故障,所以在重啟時,所述單板上的ECC內(nèi)存不會再對單板上的RAM存儲單元進(jìn)行檢測,使得所述 單板可正常啟動,并在啟動后執(zhí)行相關(guān)的業(yè)務(wù)。結(jié)束本流程。
步驟307:確定為該單板上的除所述ECC內(nèi)存外的其他RAM存儲芯片 發(fā)生故障。此時,所述單板會由于該單板上的RAM存儲芯片的故障,而無法 正常啟動,因此無法正常執(zhí)行相關(guān)業(yè)務(wù)。此時,則只能通過更換單板來恢復(fù) 業(yè)務(wù)。結(jié)束本流程。
本發(fā)明能夠通過在單板首次啟動失敗時,關(guān)閉ECC內(nèi)存的檢測功能,并 在之后的單板重新啟動中,判斷單板是否能夠正常啟動,從而確定了單板的 故障,同時,由于已將出現(xiàn)故障的ECC內(nèi)存關(guān)閉了,使得單板能夠正常啟動, 從而避免了設(shè)備因ECC內(nèi)存出現(xiàn)故障而導(dǎo)致單板的業(yè)務(wù)中斷,減少了業(yè)務(wù)中 斷的時間。
此外,如圖4所示,在上述實(shí)施例的基礎(chǔ)上,該方法在所述步驟306之 后,還可包括步驟409和步驟410,其中,
步驟409:所述單板分析所述ECC內(nèi)存發(fā)生故障的原因,并將所述原因 保存在該單板的存儲單元上。其中,所述存儲單元包括但不限于FLASH、 BOOTROM?;蛘?,還可直接將所述故障原因?qū)懭氪鎯卧哪臣拇嫫髦小?br>
步驟410:所述單板根據(jù)所記錄的ECC內(nèi)存的故障原因,生成故障報告 或者故障日志,并以告警的形式上報。設(shè)備維護(hù)人員可以通過所述告警及時 得知所述單板的故障狀態(tài)及原因,進(jìn)行相應(yīng)的維護(hù)。
上述實(shí)施例單板能夠在確定是ECC內(nèi)存發(fā)生故障時,生成ECC內(nèi)存的故 障原因,并將所述故障原因上報,使得維護(hù)人員能夠及時獲知單板故障的原 因,并且能夠盡可能地在不影響業(yè)務(wù)的情況下維修故障,從而能夠盡大可能 地維護(hù)業(yè)務(wù)的正常運(yùn)行,減少業(yè)務(wù)中斷的時間,及業(yè)務(wù)中斷帶來的不利影響。
務(wù)中斷時間的方法并不只針對單板,還同樣適用于設(shè)備、設(shè)備中的功能模塊、 或者系統(tǒng)中,其檢測的方法雷同,因此不再贅述。
基于上述技術(shù)方案,本發(fā)明實(shí)施例還公開了一種用于減少業(yè)務(wù)中斷時間
的裝置,如圖5所示,所述裝置包括觸發(fā)單元501、判斷單元502、 ECC內(nèi) 存控制單元503,其中,
所述觸發(fā)單元501,用于當(dāng)獲知設(shè)備因故障而無法正常啟動時,向所述判 斷單元502發(fā)送觸發(fā)信號;
所述判斷單元502,用于在收到所述觸發(fā)信號后,判斷所述故障是否是由 該設(shè)備的ECC內(nèi)存(圖中未示出)引發(fā),若是,則判斷得到ECC內(nèi)存故障消 息;
所述ECC內(nèi)存控制單元503,用于在收到所述判斷單元502的ECC內(nèi)存 故障消息后,關(guān)閉所述ECC內(nèi)存(圖中未示出)的運(yùn)行,并觸發(fā)設(shè)備重新啟 動,以在啟動后恢復(fù)業(yè)務(wù)運(yùn)^f亍。
上述實(shí)施例所述觸發(fā)單元501能夠當(dāng)獲知設(shè)備無法正常啟動時,觸發(fā)所 述判斷單元502檢測是否是ECC內(nèi)存(圖中未示出)故障導(dǎo)致,所述判斷單 元502在判斷得知所述設(shè)備的故障是有ECC (圖中未示出)內(nèi)存引發(fā)時,指 令所述ECC內(nèi)存控制單元503關(guān)閉所述ECC內(nèi)存(圖中未示出)的運(yùn)行。從 而使得設(shè)備在重新啟動后,能夠不運(yùn)行發(fā)生故障的ECC內(nèi)存(圖中未示出), 而正常啟動,并且恢復(fù)業(yè)務(wù)運(yùn)行。本發(fā)明能夠在設(shè)備出現(xiàn)故障時,排查故障, 并盡可能地克服設(shè)備故障,保證設(shè)備的正常運(yùn)行,從而避免了設(shè)備業(yè)務(wù)的長 時間中斷,減少了設(shè)備的業(yè)務(wù)中斷時間。
此外,如圖6所示,其為本發(fā)明第二種用于減少業(yè)務(wù)中斷時間的裝置實(shí) 施例的結(jié)構(gòu)框圖,該裝置包括觸發(fā)單元601、判斷單元602、 ECC內(nèi)存控制 單元603,其中,所述判斷單元602中具體包括RAM存儲內(nèi)存控制單元6021 、 ECC內(nèi)存檢驗單元6022。
所述觸發(fā)單元601,用于當(dāng)獲知設(shè)備因故障而無法正常啟動時,發(fā)送觸發(fā) 信號;
所述RAM存儲內(nèi)存控制單元6021,用于在收到所述觸發(fā)單元601的觸 發(fā)信號后,關(guān)閉設(shè)備中的RAM存儲內(nèi)存(圖中未示出)的運(yùn)行,并觸發(fā)設(shè)備 重新啟動;所述ECC內(nèi)存檢驗單元6022,用于在所述設(shè)備啟動中檢驗該設(shè)備中的 ECC內(nèi)存604是否能夠正常工作,若否,則向所述RAM存儲內(nèi)存控制單元 6021和所述ECC內(nèi)存控制單元603輸出ECC內(nèi)存故障消息;
所述RAM存儲內(nèi)存控制單元6021,還用于在收到所述ECC內(nèi)存故障消 息后,開啟設(shè)備中的RAM存儲內(nèi)存(圖中未示出)的運(yùn)行,并向所述ECC 內(nèi)存控制單元603發(fā)送觸發(fā)指令。
所述ECC內(nèi)存控制單元603,用于在收到所述ECC內(nèi)存故障消息后,關(guān)閉 所述ECC內(nèi)存604的運(yùn)行,并在收到所述RAM存^f諸內(nèi)存控制單元6021的觸 發(fā)指令后,觸發(fā)設(shè)備重新啟動,以在啟動后恢復(fù)業(yè)務(wù)運(yùn)行。
上述實(shí)施例能夠在設(shè)備出現(xiàn)故障時,所述ECC內(nèi)存檢驗單元6022檢測 是否是設(shè)備的ECC內(nèi)存604出現(xiàn)故障,并在確定ECC內(nèi)存604出現(xiàn)故障時, 指令所述ECC內(nèi)存控制單元6021將出現(xiàn)故障的ECC內(nèi)存604關(guān)閉,使設(shè)備 能夠在重新啟動后,能夠不運(yùn)行發(fā)生故障的ECC內(nèi)存,而正常啟動,并且恢 復(fù)業(yè)務(wù)運(yùn)行,避免了設(shè)備因ECC內(nèi)存出現(xiàn)故障而導(dǎo)致單板的業(yè)務(wù)中斷,減少 了業(yè)務(wù)中斷的時間。
與此同時,如圖7所示,在上述第二個裝置實(shí)施例的基礎(chǔ)上,所述裝置 還可包括告警單元701,用于在所述設(shè)備重新正常啟動后,生成有關(guān)ECC 內(nèi)存604的故障原因的故障報告,并將所述故障報告以告警的形式通過發(fā)送 單元702上報。
此外,所述告警單元701不僅可應(yīng)用于上述圖6所示的第二個裝置實(shí)施 例中,還可應(yīng)用于上述圖5所示的第一個裝置實(shí)施例中,以及其他可實(shí)現(xiàn)本 發(fā)明方法的等同裝置實(shí)施例中。
上述實(shí)施例單板能夠在確定是ECC內(nèi)存發(fā)生故障時,生成ECC內(nèi)存的故 障原因,并將所述故障原因上報,使得維護(hù)人員能夠及時獲知單板故障的原 因,并且能夠盡可能地在不影響業(yè)務(wù)的情況下維修故障,從而能夠盡大可能 地維護(hù)業(yè)務(wù)的正常運(yùn)行,減少業(yè)務(wù)中斷的時間,及業(yè)務(wù)中斷帶來的不利影響。
基于上述技術(shù)方案,本發(fā)明實(shí)施例還公開了 一種用于檢測設(shè)備ECC內(nèi)存
故障的裝置,如圖8所示,所述裝置包括觸發(fā)單元801、 ECC內(nèi)存控制單 元802、判斷單元803,其中,
所述觸發(fā)單元801,用于當(dāng)獲知設(shè)備因故障而無法正常啟動時,向所述 ECC內(nèi)存控制單元802發(fā)送觸發(fā)信號;
所述ECC內(nèi)存控制單元802,用于在收到所述觸發(fā)信號后,關(guān)閉所述ECC
內(nèi)存的運(yùn)行,并觸發(fā)設(shè)備重新啟動,同時通知所述4全驗單元803進(jìn)行檢驗;
所述沖全驗單元803,用于在收到所述通知后,4企驗該設(shè)備是否能夠正常啟 動,若是,則確定該設(shè)備的ECC內(nèi)存發(fā)生故障。
上述實(shí)施例所述觸發(fā)單元801能夠在設(shè)備發(fā)生故障時,觸發(fā)所述ECC內(nèi) 存控制單元802關(guān)閉設(shè)備的ECC內(nèi)存,使得在設(shè)備重現(xiàn)啟動后,所述檢驗單 元803能夠檢驗該設(shè)備是否能夠正常啟動,以便進(jìn)一步判定該設(shè)備故障是否 由ECC內(nèi)存故障引起,方便維護(hù)人員及時了解設(shè)備的運(yùn)行狀態(tài)。同時,由于 已經(jīng)將發(fā)生故障的ECC內(nèi)存關(guān)閉,使所述設(shè)備能夠在重新啟動時,恢復(fù)業(yè)務(wù) 運(yùn)行,避免了設(shè)備因ECC內(nèi)存出現(xiàn)故障而導(dǎo)致單板的業(yè)務(wù)中斷,減少了業(yè)務(wù) 中斷的時間。
以上所述的本發(fā)明實(shí)施方式,并不構(gòu)成對本發(fā)明保護(hù)范圍的限定。任何 在本發(fā)明的精神和原則之內(nèi)所作的修改、等同替換和改進(jìn)等,均應(yīng)包含在本 發(fā)明的保護(hù)范圍之內(nèi)。
權(quán)利要求
1、一種減少業(yè)務(wù)中斷時間的方法,其特征在于,包括當(dāng)設(shè)備因故障而無法正常啟動時,判斷所述故障是否是由該設(shè)備的ECC內(nèi)存引發(fā),若是,則關(guān)閉所述ECC內(nèi)存的運(yùn)行;觸發(fā)設(shè)備重新啟動,以在啟動后恢復(fù)業(yè)務(wù)運(yùn)行。
2、 如權(quán)利要求1所述的減少業(yè)務(wù)中斷時間的方法,其特征在于,判斷所 述故障是否是由該設(shè)備的ECC內(nèi)存引發(fā)具體包括關(guān)閉設(shè)備中的RAM存儲內(nèi)存的運(yùn)行;及 觸發(fā)i殳備重新啟動;檢驗該設(shè)備中的ECC內(nèi)存是否能夠正常工作,若不能,則確定該設(shè)備的 ECC內(nèi)存發(fā)生故障;在確定該設(shè)備的ECC內(nèi)存發(fā)生故障之后,所述方法還包括開啟所述設(shè)備中的RAM存儲內(nèi)存的運(yùn)行。
3、 如權(quán)利要求1或2所述的減少業(yè)務(wù)中斷時間的方法,其特征在于,在 確定該設(shè)備的ECC內(nèi)存發(fā)生故障之后,該方法還包括記錄ECC內(nèi)存的故障原因,并將所述故障原因以告警的形式上l艮。
4、 一種對設(shè)備ECC內(nèi)存故障檢測的方法,其特征在于,包括 當(dāng)設(shè)備因故障而無法正常啟動時,關(guān)閉設(shè)備中ECC內(nèi)存的運(yùn)行; 觸發(fā)設(shè)備重新啟動,并檢驗該設(shè)備是否能夠正常啟動,若是,則確定該設(shè)備的ECC內(nèi)存發(fā)生故障。
5、 一種用于減少業(yè)務(wù)中斷時間的裝置,其特征在于,包括觸發(fā)單元,用于當(dāng)獲知設(shè)備因故障而無法正常啟動時,向判斷單元發(fā)送 觸發(fā)信號;判斷單元,用于在收到所述觸發(fā)信號后,判斷所述故障是否是由該設(shè)備 的ECC內(nèi)存引發(fā),若是,則判斷得到ECC內(nèi)存故障消息;ECC內(nèi)存控制單元,用于在收到所述ECC內(nèi)存故障消息后,關(guān)閉所述 ECC內(nèi)存的運(yùn)行,并觸發(fā)設(shè)備重新啟動,以在啟動后恢復(fù)業(yè)務(wù)運(yùn)4亍。
6、 如權(quán)利要求5所述的用于減少業(yè)務(wù)中斷時間的裝置,其特征在于,所 述判斷單元包括RAM存儲內(nèi)存控制單元,用于在收到所述觸發(fā)信號后,關(guān)閉設(shè)備中的 RAM存儲內(nèi)存的運(yùn)行,并觸發(fā)設(shè)備重新啟動,同時通知ECC內(nèi)存4全驗單元進(jìn) 行檢驗;所述ECC內(nèi)存4全驗單元,用于在收到所述通知后,^r-驗該設(shè)備中的ECC 內(nèi)存在設(shè)備啟動時能否正常工作,若否,則輸出ECC內(nèi)存故障消息;所述RAM存儲內(nèi)存控制單元,還用于在收到所述ECC內(nèi)存故障消息后, 開啟設(shè)備中的RAM存儲內(nèi)存的運(yùn)行,并指令所述ECC內(nèi)存控制單元執(zhí)行觸 發(fā)設(shè)備重新啟動功能。
7、 如權(quán)利要求5或6所述的用于減少業(yè)務(wù)中斷時間的裝置,其特征在于, 該裝置還包括告警單元,用于在所述設(shè)備重新正常啟動后,生成有關(guān)ECC內(nèi)存故障原 因的故障報告,并將所述故障報告以告警的形式通過發(fā)送單元上報。
8、 一種用于檢測設(shè)備ECC內(nèi)存故障的裝置,其特征在于,包括觸發(fā)單元,用于當(dāng)獲知設(shè)備因故障而無法正常啟動時,向ECC內(nèi)存控制 單元發(fā)送觸發(fā)信號;所述ECC內(nèi)存控制單元,用于在收到所述觸發(fā)信號后,關(guān)閉所述ECC內(nèi)存的運(yùn)行,并觸發(fā)設(shè)備重新啟動,同時通知檢驗單元進(jìn)行檢驗;檢驗單元,用于在收到所述通知后,檢驗該設(shè)備是否能夠正常啟動,若 是,則確定該設(shè)備的ECC內(nèi)存發(fā)生故障。
全文摘要
本發(fā)明實(shí)施例公開的一種減少業(yè)務(wù)中斷時間的方法為,當(dāng)設(shè)備因故障而無法正常啟動時,判斷所述故障是否是由該設(shè)備的ECC內(nèi)存引發(fā),若是,則關(guān)閉所述ECC內(nèi)存的運(yùn)行;觸發(fā)設(shè)備重新啟動,以在啟動后恢復(fù)業(yè)務(wù)運(yùn)行。同時,本發(fā)明實(shí)施例還公開了一種對設(shè)備ECC內(nèi)存故障檢測的方法及裝置。本發(fā)明能夠在當(dāng)設(shè)備發(fā)生故障時,及時將檢測到出現(xiàn)故障的ECC內(nèi)存關(guān)閉,從而使得設(shè)備再啟動后,能夠恢復(fù)業(yè)務(wù)運(yùn)行。從而避免了設(shè)備業(yè)務(wù)的長時間中斷,減少了設(shè)備的業(yè)務(wù)中斷時間。
文檔編號H04B1/74GK101106441SQ20071013575
公開日2008年1月16日 申請日期2007年8月10日 優(yōu)先權(quán)日2007年8月10日
發(fā)明者張志龍 申請人:華為技術(shù)有限公司