本發(fā)明涉及存儲技術(shù)領(lǐng)域,特別涉及一種數(shù)據(jù)的處理方法及裝置。
背景技術(shù):
閃存(英文:Flash Memory,簡稱:Flash)是可在斷電情況下仍能保持所存儲數(shù)據(jù)的存儲器,可以對存儲器單元(塊)進行擦寫和再編程,且體積小,容量大,成本低,易于嵌入和擴展等特點,所以被廣泛應用于通訊、個人消費品和工業(yè)等各個領(lǐng)域。
Flash壞塊一般包括固有壞塊(即出廠壞塊)和使用壞塊。固有壞塊是生產(chǎn)過程中產(chǎn)生的壞塊,而使用壞塊則是擦寫過程中產(chǎn)生的壞塊。其中,使用壞塊中有些是工藝或物理缺陷導致的永久性壞塊,即真的壞塊;還有些是總線問題導致的臨時性壞塊,即假的壞塊。對于現(xiàn)有的文件系統(tǒng)而言,上述壞塊都是不可逆,是不能回收的壞塊。
現(xiàn)有技術(shù)中通過Flash壞塊隔離實現(xiàn)可靠性增強,個別壞塊一般不會影響系統(tǒng)功能。一般有兩種壞塊隔離策略,一是略過(Skip)策略,二是替換(Replace)策略。略過策略:用戶根據(jù)建立的壞塊表,在寫Flash的時候,一旦遇到壞塊,跨過它,寫下一個Block。常見系統(tǒng)的存儲空間是Flash陣列,一般有幾個并行通道,每個通道上連接了若干個Flash。替換策略:當某個Flash中的Die上發(fā)現(xiàn)壞塊,它會被該Die上的某個好塊替換。用戶在寫數(shù)據(jù)的時候,不是跨過這個Die,而是寫到替換塊上面去。采用此策略,除正常用戶使用的Block,還需額外保留一部分好的Block,用于替換用戶空間的壞塊。整個Die上Block就劃分為兩個區(qū)域:用戶區(qū)域和預留區(qū)域。
由于上述隔離策略無法避免Flash產(chǎn)生壞塊。因此,一旦Flash壞塊數(shù)量累計到一定程度,會導致Flash失效,直到影響系統(tǒng)的某些重要功能后,才上報系統(tǒng)各類功能故障和告警。然而,此時已經(jīng)嚴重影響系統(tǒng)的可靠性和可用度,這對于某些高可靠性要求的系統(tǒng)是不能接受的。
技術(shù)實現(xiàn)要素:
本申請?zhí)峁┝艘环N數(shù)據(jù)的處理方法及裝置,能夠?qū)Υ鎯υO(shè)備使用過程中的信息進行統(tǒng)計、分析,以便對存儲設(shè)備的失效做出提前預警,提高系統(tǒng)的可靠性和可用度。
本申請第一方面提供了一種數(shù)據(jù)處理方法,應用于網(wǎng)絡(luò)設(shè)備,該網(wǎng)絡(luò)設(shè)備可以是基站、控制器、傳輸設(shè)備或者核心網(wǎng)設(shè)備等。該網(wǎng)絡(luò)設(shè)備可以訪問存儲設(shè)備,以獲取存儲設(shè)備的使用信息。由于存儲設(shè)備中保存有系統(tǒng)重要數(shù)據(jù),因此,根據(jù)系統(tǒng)功能的使用頻率和讀寫該存儲設(shè)備的數(shù)據(jù)量大小對系統(tǒng)功能分類,該系統(tǒng)功能分類后的類別數(shù)量包括至少一個,該類別數(shù)量中的每一類系統(tǒng)功能對應至少一個預警級別。由此,該網(wǎng)絡(luò)設(shè)備可以根據(jù)該存儲設(shè)備的使用信息確定某個目標系統(tǒng)功能所對應的預警級別,從而按照系統(tǒng)功能的預警級別與預警提示信息的對應關(guān)系輸出該目標系統(tǒng)功能的預警級別所對應的預警提示信息。
因此,通過對存儲設(shè)備(例如Flash、SSD、EMMC等)使用過程中各類數(shù)據(jù)進行統(tǒng)計、分析,結(jié)合系統(tǒng)功能的特點和應用場景,精準預測存儲設(shè)備是否開始加速失效,以及是否即將影響哪一類系統(tǒng)功能,以便對存儲設(shè)備的失效做出提前預警,通知維護人員更換FRU或避免執(zhí)行某一類系統(tǒng)功能(例如:復位、升級、安裝license和保存配置等)或進行數(shù)據(jù)遷移,從而提高系統(tǒng)的可靠性和可用度。
上述存儲設(shè)備的使用信息可以包括如下至少一種:每個分區(qū)讀次數(shù)、每個分區(qū)讀錯次數(shù)、每個分區(qū)擦寫次數(shù)、每個分區(qū)擦寫失敗次數(shù)、每個分區(qū)壞塊個數(shù)、每個分區(qū)替換塊使用個數(shù)以及每個分區(qū)有用數(shù)據(jù)占總分區(qū)空間的比重。通過對存儲設(shè)備使用信息的收集,可以統(tǒng)計分析存儲設(shè)備不可回收空間,可用空間,以及預計壞塊個數(shù)增長趨勢等。相應的,可針對該統(tǒng)計分析結(jié)果給出不同的預警方案,例如不可回收空間越大,預警優(yōu)先級級別越高。
上述預警提示信息包括如下至少一種:提示可用空間不足、提示高危操作以及提示更換現(xiàn)場可更換單元FRU。由此,可針對不同的預警級別,輸出相應的預警提示信息。如通訊領(lǐng)域的話務統(tǒng)計數(shù)據(jù)較少的站點可以不立即通知維護人員更換FRU,但話務統(tǒng)計數(shù)據(jù)較多的站點建議立即通知維護人員更換FRU。
根據(jù)系統(tǒng)功能的分類,可以適當?shù)膶ι鲜隽信e的使用信息進行選擇性收集或者拆分收集,例如把擦寫動作拆分成擦除動作和寫動作分別統(tǒng)計。例如將每個分區(qū)擦寫失敗次數(shù)細化為每個分區(qū)擦除失敗次數(shù)和每個分區(qū)寫失敗次數(shù)。
基于上述系統(tǒng)功能分類對應的預警級別,該網(wǎng)絡(luò)設(shè)備根據(jù)該存儲設(shè)備的使用信息確定目標系統(tǒng)功能的預警級別具體可參考如下實現(xiàn)方式:
通過統(tǒng)計數(shù)據(jù)匯總分析模塊根據(jù)信息收集模塊統(tǒng)計的存儲設(shè)備的使用信息。具體的,由于系統(tǒng)功能分類后的類別數(shù)量包括至少一個,該類別數(shù)量中的每一類系統(tǒng)功能對應至少一個預警級別。因此,首先可從系統(tǒng)功能分類后的類別數(shù)量中確定目標系統(tǒng)功能所屬的目標類別,然后根據(jù)該存儲設(shè)備的使用信息從確定的該目標類別的系統(tǒng)功能所對應的至少一個預警級別中確定目標系統(tǒng)功能的預警級別。由此,通過對存儲設(shè)備的使用信息進行統(tǒng)計、分析,確定具體影響哪一類系統(tǒng)功能,以及影響程度達到了哪一個預警級別。
上述根據(jù)該存儲設(shè)備的使用信息從確定的該目標類別的系統(tǒng)功能所對應的至少一個預警級別中確定目標系統(tǒng)功能的預警級別的具體實現(xiàn)方式可參考如下:
具體的,通過對該存儲設(shè)備的使用信息的收集,從該存儲設(shè)備的使用信息中確定該存儲設(shè)備的使用狀態(tài),并建立該存儲設(shè)備的使用狀態(tài)與預警級別的對應關(guān)系。通過該存儲設(shè)備的使用信息可以預測該存儲設(shè)備是否開始加速失效等,該存儲設(shè)備的使用情況處于哪一種狀態(tài)(如可用空間是否可滿足大量信息的擦寫、可用空間是否可滿足少量信息的擦寫或者壞塊個數(shù)增長趨勢等等)。由于目標類別的系統(tǒng)功能對應至少一個預警級別,通過該步驟,可從該存儲設(shè)備的使用狀態(tài)與預警級別的對應關(guān)系中確定目標類別所對應的預警級別數(shù)量。進一步的,可從該目標類別對應的預警級別數(shù)量中確定該目標系統(tǒng)功能的預警級別。
本申請的第二方面提供了一種數(shù)據(jù)處理裝置,該裝置包括獲取單元和處理單元。獲取單元可用于訪問存儲設(shè)備,以獲取存儲設(shè)備的使用信息。由于存儲設(shè)備中保存有系統(tǒng)重要數(shù)據(jù),因此,根據(jù)系統(tǒng)功能的使用頻率和讀寫該存儲設(shè)備的數(shù)據(jù)量大小對系統(tǒng)功能分類,該系統(tǒng)功能分類后的類別數(shù)量包括至少一個,該類別數(shù)量中的每一類系統(tǒng)功能對應至少一個預警級別。由此,處理單元可用于根據(jù)該存儲設(shè)備的使用信息確定某個目標系統(tǒng)功能所對應的預警級別,從而按照系統(tǒng)功能的預警級別與預警提示信息的對應關(guān)系輸出該目標系統(tǒng)功能的預警級別所對應的預警提示信息。
因此,通過對存儲設(shè)備(例如Flash、SSD、EMMC等)使用過程中各類數(shù)據(jù)進行統(tǒng)計、分析,結(jié)合系統(tǒng)功能的特點和應用場景,精準預測存儲設(shè)備是否開始加速失效,以及是否即將影響哪一類系統(tǒng)功能,以便對存儲設(shè)備的失效做出提前預警,通知維護人員更換FRU或避免執(zhí)行某一類系統(tǒng)功能(例如:復位、升級、安裝license和保存配置等)或進行數(shù)據(jù)遷移,從而提高系統(tǒng)的可靠性和可用度。
上述存儲設(shè)備的使用信息可以包括如下至少一種:每個分區(qū)讀次數(shù)、每個分區(qū)讀錯次數(shù)、每個分區(qū)擦寫次數(shù)、每個分區(qū)擦寫失敗次數(shù)、每個分區(qū)壞塊個數(shù)、每個分區(qū)替換塊使用個數(shù)以及每個分區(qū)有用數(shù)據(jù)占總分區(qū)空間的比重。通過對存儲設(shè)備使用信息的收集,可以統(tǒng)計分析存儲設(shè)備不可回收空間,可用空間,以及預計壞塊個數(shù)增長趨勢等。相應的,可針對該統(tǒng)計分析結(jié)果給出不同的預警方案,例如不可回收空間越大,預警優(yōu)先級級別越高。
上述預警提示信息包括如下至少一種:提示可用空間不足、提示高危操作以及提示更換現(xiàn)場可更換單元FRU。由此,可針對不同的預警級別,輸出相應的預警提示信息。如通訊領(lǐng)域的話務統(tǒng)計數(shù)據(jù)較少的站點可以不立即通知維護人員更換FRU,但話務統(tǒng)計數(shù)據(jù)較多的站點建議立即通知維護人員更換FRU。
根據(jù)系統(tǒng)功能的分類,可以適當?shù)膶ι鲜隽信e的使用信息進行選擇性收集或者拆分收集,例如把擦寫動作拆分成擦除動作和寫動作分別統(tǒng)計。例如將每個分區(qū)擦寫失敗次數(shù)細化為每個分區(qū)擦除失敗次數(shù)和每個分區(qū)寫失敗次數(shù)。
基于上述系統(tǒng)功能分類對應的預警級別,該處理單元用于根據(jù)該存儲設(shè)備的使用信息確定目標系統(tǒng)功能的預警級別具體可參考如下實現(xiàn)方式:
該處理單元用于通過統(tǒng)計數(shù)據(jù)匯總分析模塊根據(jù)信息收集模塊統(tǒng)計的存儲設(shè)備的使用信息。具體的,由于系統(tǒng)功能分類后的類別數(shù)量包括至少一個,該類別數(shù)量中的每一類系統(tǒng)功能對應至少一個預警級別。因此,該處理單元可用于從系統(tǒng)功能分類后的類別數(shù)量中確定目標系統(tǒng)功能所屬的目標類別,然后根據(jù)該存儲設(shè)備的使用信息從確定的該目標類別的系統(tǒng)功能所對應的至少一個預警級別中確定目標系統(tǒng)功能的預警級別。由此,通過該處理單元對存儲設(shè)備的使用信息進行統(tǒng)計、分析,確定具體影響哪一類系統(tǒng)功能,以及影響程度達到了哪一個預警級別。
上述處理單元用于根據(jù)該存儲設(shè)備的使用信息從確定的該目標類別的系統(tǒng)功能所對應的至少一個預警級別中確定目標系統(tǒng)功能的預警級別的具體實現(xiàn)方式可參考如下:
具體的,該處理單元用于通過對該存儲設(shè)備的使用信息的收集,從該存儲設(shè)備的使用信息中確定該存儲設(shè)備的使用狀態(tài),并建立該存儲設(shè)備的使用狀態(tài)與預警級別的對應關(guān)系。通過該存儲設(shè)備的使用信息可以預測該存儲設(shè)備是否開始加速失效等,該存儲設(shè)備的使用情況處于哪一種狀態(tài)(如可用空間是否可滿足大量信息的擦寫、可用空間是否可滿足少量信息的擦寫或者壞塊個數(shù)增長趨勢等等)。由于目標類別的系統(tǒng)功能對應至少一個預警級別,通過該步驟,該處理單元可用于從該存儲設(shè)備的使用狀態(tài)與預警級別的對應關(guān)系中確定目標類別所對應的預警級別數(shù)量。進一步的,該處理單元可用于從該目標類別對應的預警級別數(shù)量中確定該目標系統(tǒng)功能的預警級別。
本申請第三方面,提供了一種存儲介質(zhì),該存儲介質(zhì)中存儲了程序代碼,該程序代碼被網(wǎng)絡(luò)設(shè)備運行時,執(zhí)行第一方面或第一方面的任意一種實現(xiàn)方式提供的數(shù)據(jù)處理方法。該存儲介質(zhì)包括但不限于快閃存儲器(英文:flash memory),硬盤(英文:hard disk drive,HDD)或固態(tài)硬盤(英文:solid state drive,SSD)。
附圖說明
圖1為本申請所提供的通信系統(tǒng)的一個結(jié)構(gòu)示意圖;
圖2為申請所提供的網(wǎng)絡(luò)設(shè)備的一個組織結(jié)構(gòu)示意圖;
圖3為本申請所提供的數(shù)據(jù)處理方法的一個流程示意圖;
圖4為本申請所提供的數(shù)據(jù)處理裝置的一個組織結(jié)構(gòu)示意圖。
具體實施方式
本申請的說明書和權(quán)利要求書以及上述附圖說明的附圖中所涉及的術(shù)語“第一”、“第二”等是用于區(qū)別類似的對象,而不必用于描述特定的順序或先后次序。下面結(jié)合本申請實施例中的附圖,對本申請實施例中的技術(shù)方案進行描述。
圖1為本申請實施例的一個通信系統(tǒng)示意圖。由于通訊系統(tǒng)中大量網(wǎng)元利用存儲設(shè)備(如Flash)保存數(shù)據(jù),故本發(fā)明應用的各通信系統(tǒng)中,涉及具體的網(wǎng)絡(luò)設(shè)備102包括但不限于:基站、控制器、傳輸設(shè)備、核心網(wǎng)設(shè)備,甚至手機終端。該網(wǎng)絡(luò)設(shè)備102用于對存儲設(shè)備104進行數(shù)據(jù)的訪問、讀寫以及信息的統(tǒng)計與分析等。該存儲設(shè)備104可以是Flash及相關(guān)模塊(如:SSD(Solid State Drives,固態(tài)硬盤)、EMMC(Embedded Multi Media Card,嵌入式多媒體卡))。SSD使用半導體材料Nand Flash作為基本的存儲介質(zhì)。Nand Flash是一種非易失性隨機訪問存儲介質(zhì),其特點是斷電后數(shù)據(jù)不消失,因此可以作為外部存儲器使用。Nand Flash通常由一個內(nèi)部寄存器和存儲矩陣組成,存儲矩陣包括若干塊(block),每個block又包含若干頁(page),每個page包含若干字節(jié)(bytes),其中的某些bytes為專有數(shù)據(jù);每種Nand Flash芯片的存儲矩陣大小定義不同,例如有一種Nand Flash以8640個bytes組成一個page,256個page組成一個block,2048個block組成一個plane,2個plane組成一個LUN(Logical Unit,邏輯存儲單元),再由一個或者若干LUN組成整個閃存(Flash)存儲器。在每頁中前8192bytes是用于存儲數(shù)據(jù),后448bytes用于存放糾錯碼(Error Correction Code,ECC)數(shù)據(jù)校驗碼,稱為帶外數(shù)據(jù)(Out of Bank,OOB)區(qū)。
圖1中的網(wǎng)絡(luò)設(shè)備可以通過圖2中的網(wǎng)絡(luò)設(shè)備200實現(xiàn),該網(wǎng)絡(luò)設(shè)備200的組織結(jié)構(gòu)示意圖如圖2所示,包括處理器202、存儲器204和收發(fā)器206,還可以包括總線208。
其中,處理器202、存儲器204和收發(fā)器206可以通過總線208實現(xiàn)彼此之間的通信連接,也可以通過無線傳輸?shù)绕渌侄螌崿F(xiàn)通信。
存儲器204可以包括易失性存儲器(英文:volatile memory),例如隨機存取存儲器(英文:random-access memory,縮寫:RAM);存儲器也可以包括非易失性存儲器(英文:non-volatile memory),例如只讀存儲器(英文:read-only memory,縮寫:ROM),快閃存儲器(英文:flash memory),硬盤(英文:hard disk drive,縮寫:HDD)或固態(tài)硬盤(英文:solid state drive,縮寫:SSD);存儲器204還可以包括上述種類的存儲器的組合。在通過軟件來實現(xiàn)本申請?zhí)峁┑募夹g(shù)方案時,用于實現(xiàn)本申請圖3提供的數(shù)據(jù)處理方法的程序代碼保存在存儲器204中,并由處理器202來執(zhí)行。
網(wǎng)絡(luò)設(shè)備200通過收發(fā)器206與其他設(shè)備通信。
處理器202可以為中央處理器(英文:central processing unit,CPU)。
所述處理器202用于:
獲取存儲設(shè)備的使用信息;
根據(jù)所述存儲設(shè)備的使用信息確定目標系統(tǒng)功能的預警級別;
按照系統(tǒng)功能的預警級別與預警提示信息的對應關(guān)系輸出所述目標系統(tǒng)功能的預警級別所對應的預警提示信息。
該處理器202通過獲取存儲設(shè)備的使用信息;并根據(jù)所述存儲設(shè)備的使用信息確定目標系統(tǒng)功能所對應的預警級別;從而按照系統(tǒng)功能的預警級別與預警提示信息的對應關(guān)系輸出所述目標系統(tǒng)功能的預警級別所對應的預警提示信息。因此,本發(fā)明通過對存儲設(shè)備(例如Flash、SSD、EMMC等)使用過程中各類數(shù)據(jù)進行統(tǒng)計、分析,結(jié)合系統(tǒng)功能的特點和應用場景,精準預測存儲設(shè)備是否開始加速失效,以及是否即將影響哪一類系統(tǒng)功能,以便對存儲設(shè)備的失效做出提前預警,通知維護人員更換FRU或避免執(zhí)行某一類系統(tǒng)功能(例如:復位、升級、安裝license和保存配置等)或進行數(shù)據(jù)遷移,從而提高系統(tǒng)的可靠性和可用度。
可選的,所述處理器202用于獲取存儲設(shè)備的使用信息之前,所述處理器202還用于:
根據(jù)系統(tǒng)功能的使用頻率和讀寫所述存儲設(shè)備的數(shù)據(jù)量大小對系統(tǒng)功能分類,所述系統(tǒng)功能分類后的類別數(shù)量包括至少一個,所述類別數(shù)量中的每一類系統(tǒng)功能對應至少一個預警級別。
可選的,所述處理器202用于根據(jù)所述存儲設(shè)備的使用信息確定目標系統(tǒng)功能的預警級別包括:
所述處理器202用于從所述系統(tǒng)功能分類后的類別數(shù)量中確定所述目標系統(tǒng)功能所屬的目標類別;根據(jù)所述存儲設(shè)備的使用信息從所述目標類別對應的至少一個預警級別中確定所述目標系統(tǒng)功能的預警級別。
可選的,所述處理器202用于根據(jù)所述存儲設(shè)備的使用信息從所述目標類別對應的至少一個預警級別中確定所述目標系統(tǒng)功能的預警級別,包括:
所述處理器202用于根據(jù)所述存儲設(shè)備的使用信息確定所述存儲設(shè)備的使用狀態(tài),并建立所述存儲設(shè)備的使用狀態(tài)與預警級別的對應關(guān)系;從所述存儲設(shè)備的使用狀態(tài)與預警級別的對應關(guān)系中確定所述目標類別對應的預警級別數(shù)量;從所述目標類別對應的預警級別數(shù)量中確定所述目標系統(tǒng)功能的預警級別。
可選的,所述存儲設(shè)備的使用信息包括如下至少一種:每個分區(qū)讀次數(shù)、每個分區(qū)讀錯次數(shù)、每個分區(qū)擦寫次數(shù)、每個分區(qū)擦寫失敗次數(shù)、每個分區(qū)壞塊個數(shù)、每個分區(qū)替換塊使用個數(shù)以及每個分區(qū)有用數(shù)據(jù)占總分區(qū)空間的比重。
可選的,所述預警提示信息包括如下至少一種:提示可用空間不足、提示高危操作以及提示更換現(xiàn)場可更換單元FRU。
本申請還提供了一種數(shù)據(jù)處理方法,可以應用于利用Flash保存數(shù)據(jù)的任何系統(tǒng)中,例如通訊、個人消費品和工業(yè)系統(tǒng)中常常利用Flash保存BIOS(Basic Input/Output System,基本輸入/輸出系統(tǒng))數(shù)據(jù)、配置和用戶數(shù)據(jù)??梢越Y(jié)合系統(tǒng)不同的應用場景和功能,分級預測Flash及相關(guān)模塊(如:SSD、EMMC)失效即將影響系統(tǒng)特定功能或系統(tǒng)整體功能。以便系統(tǒng)維護人員及時替換FRU(Field Replaceable Unit,現(xiàn)場可更換單元)或遷移數(shù)據(jù),或避免執(zhí)行高危操作命令(例如:升級、重要數(shù)據(jù)保存)。圖2中的網(wǎng)絡(luò)設(shè)備200運行時執(zhí)行該方法,其流程示意圖如圖3所示。
301、獲取存儲設(shè)備的使用信息。
可選的,所述獲取存儲設(shè)備的使用信息之前,還包括:
根據(jù)系統(tǒng)功能的使用頻率和讀寫所述存儲設(shè)備的數(shù)據(jù)量大小對系統(tǒng)功能分類,所述系統(tǒng)功能分類后的類別數(shù)量包括至少一個,所述類別數(shù)量中的每一類系統(tǒng)功能對應至少一個預警級別。
需要說明的是,該存儲設(shè)備包括但不限于Flash、SSD或EMMC。該步驟具體可通過信息收集模塊負責,以存儲設(shè)備為Flash為例,信息收集模塊根據(jù)Flash實際使用場景和特征,在芯片日常讀取、擦除和寫數(shù)據(jù)的過程中,收集如下全部或部分Flash的使用信息(包括但不限于):
1)每個分區(qū)讀次數(shù);
2)每個分區(qū)讀BIT錯次數(shù);
3)每個分區(qū)擦寫次數(shù);
4)每個分區(qū)擦寫失敗次數(shù);
5)每個分區(qū)壞塊個數(shù)(Nand);
6)每個分區(qū)替換塊使用個數(shù)(Nor);
7)每個分區(qū)有用數(shù)據(jù)(不能刪除)占總分區(qū)空間的情況。
根據(jù)系統(tǒng)自身特點,可以適當?shù)膶ι鲜隽信e的使用信息進行選擇性收集或者拆分收集,例如把Flash擦寫動作拆分成擦除動作和寫動作分別統(tǒng)計。例如:將每個分區(qū)擦寫失敗次數(shù)細化為每個分區(qū)擦除失敗次數(shù)和每個分區(qū)寫失敗次數(shù)。
根據(jù)系統(tǒng)自身特點,細分或擴大Flash統(tǒng)計范圍,例如不是對Flash分區(qū)進行信息收集和統(tǒng)計分析,而是對整個Flash空間進行信息收集和統(tǒng)計分析;或只是對Flash特定劃分的區(qū)域空間進行信息收集和統(tǒng)計分析。
302、根據(jù)所述存儲設(shè)備的使用信息確定目標系統(tǒng)功能所對應的預警級別。
需要說明的是,該步驟具體可通過統(tǒng)計數(shù)據(jù)匯總分析模塊根據(jù)信息收集模塊統(tǒng)計的存儲設(shè)備的使用信息,進行匯總,結(jié)合存儲設(shè)備如Flash所在不同單板的不同使用場景,進行大數(shù)據(jù)分析。
可選的,所述根據(jù)所述存儲設(shè)備的使用信息確定目標系統(tǒng)功能的預警級別包括:
從所述系統(tǒng)功能分類后的類別數(shù)量中確定所述目標系統(tǒng)功能所屬的目標類別;
根據(jù)所述存儲設(shè)備的使用信息從所述目標類別對應的至少一個預警級別中確定所述目標系統(tǒng)功能的預警級別。
可選的,所述根據(jù)所述存儲設(shè)備的使用信息從所述目標類別對應的至少一個預警級別中確定所述目標系統(tǒng)功能的預警級別,包括:
根據(jù)所述存儲設(shè)備的使用信息確定所述存儲設(shè)備的使用狀態(tài),并建立所述存儲設(shè)備的使用狀態(tài)與預警級別的對應關(guān)系;
從所述存儲設(shè)備的使用狀態(tài)與預警級別的對應關(guān)系中確定所述目標類別對應的預警級別數(shù)量;
從所述目標類別對應的預警級別數(shù)量中確定所述目標系統(tǒng)功能的預警級別。
根據(jù)系統(tǒng)自身特點,可將統(tǒng)計數(shù)據(jù)匯總分析模塊拆分為如下幾個部分的模塊:已收集信息匯總模塊、已收集信息上傳到某個信息處理中心的模塊、已收集信息分析模塊、已收集信息繪制Flash失效趨勢圖模塊和已收集信息顯示模塊。
303、按照系統(tǒng)功能的預警級別與預警提示信息的對應關(guān)系輸出所述目標系統(tǒng)功能的預警級別所對應的預警提示信息。
需要說明的是,該步驟具體可通過預警判決模塊根據(jù)統(tǒng)計數(shù)據(jù)匯總分析模塊給出的各個參數(shù)趨勢,綜合判斷這些參數(shù)趨勢對系統(tǒng)不同功能的影響,按照系統(tǒng)功能的預警級別與預警提示信息的對應關(guān)系對各個參數(shù)趨勢進行預測,最終給出預警。
可選的,所述預警提示信息包括如下至少一種:提示可用空間不足、提示高危操作以及提示更換現(xiàn)場可更換單元FRU。
根據(jù)系統(tǒng)自身特點,可將預警判決模塊拆分為如下幾個部分的模塊:系統(tǒng)功能維護管理模塊、告警相關(guān)性分析模塊、系統(tǒng)功能日常巡檢模塊、系統(tǒng)功能亞健康檢測模塊、系統(tǒng)功能智能診斷模塊和升級前風險排查模塊。
根據(jù)系統(tǒng)自身特點,以上統(tǒng)計數(shù)據(jù)匯總分析模塊,或與預警判決模塊合并;或者直接在一個模塊中將信息收集、統(tǒng)計數(shù)據(jù)匯總分析和預警判決的功能全部實現(xiàn)。
本發(fā)明通過獲取存儲設(shè)備的使用信息;并根據(jù)所述存儲設(shè)備的使用信息確定目標系統(tǒng)功能所對應的預警級別;從而按照系統(tǒng)功能的預警級別與預警提示信息的對應關(guān)系輸出所述目標系統(tǒng)功能的預警級別所對應的預警提示信息。因此,本發(fā)明通過對存儲設(shè)備(例如Flash、SSD、EMMC等)使用過程中各類數(shù)據(jù)進行統(tǒng)計、分析,結(jié)合系統(tǒng)功能的特點和應用場景,精準預測存儲設(shè)備是否開始加速失效,以及是否即將影響哪一類系統(tǒng)功能,以便對存儲設(shè)備的失效做出提前預警,通知維護人員更換FRU或避免執(zhí)行某一類系統(tǒng)功能(例如:復位、升級、安裝license和保存配置等)或進行數(shù)據(jù)遷移,從而提高系統(tǒng)的可靠性和可用度。
下面以一具體應用場景對本申請?zhí)峁┑臄?shù)據(jù)處理方法進行說明。
以Flash為例,由于Flash中常常保存系統(tǒng)重要數(shù)據(jù),僅僅通過壞塊隔離實現(xiàn)可靠性增強往往達不到高可靠性系統(tǒng)的要求。如下4個維度的因素往往導致系統(tǒng)部分或整體重要功能異常:
1)每片F(xiàn)lash的固有壞塊差異可能比較大;如果零星Flash偶然失效的芯片正好保存的是整個系統(tǒng)最關(guān)鍵的數(shù)據(jù),會導致系統(tǒng)崩潰;
2)應用場景非常復雜,累計的壞塊何時會影響系統(tǒng)部分或整體重要功能不確定;
3)使用壞塊的產(chǎn)生不一定有明顯的趨勢性,即第一個月使用壞塊多的Flash,未必第二個月使用壞塊就多;前幾年沒有使用壞塊的Flash,未必下一個月不會整體失效;
4)合理的失效預警方案,最大程度的滿足不同系統(tǒng)對可靠性要求的同時,又避免大幅縮短產(chǎn)品使用年限。
根據(jù)系統(tǒng)功能的特點,可將系統(tǒng)功能細分為如下表1四類(包括但不限于該四類)
表1系統(tǒng)功能分類
上表1提到的大量和少量,常用和不常用都是根據(jù)系統(tǒng)功能的特點確定,是個相對值,并非嚴格上的定義。定義系統(tǒng)功能分類的目的是制定不同的預警方案,最大程度的滿足不同系統(tǒng)對可靠性要求的同時,又避免大幅縮短產(chǎn)品使用年限。
針對Nand Flash的特點、常見應用場景及其故障模式,本發(fā)明可以采用如下的實施方案:收集如下表2所示的信息收集模塊收集的信息,統(tǒng)計分析后,給出預警方案。
表2信息收集模塊周期性統(tǒng)計數(shù)據(jù)
通過上表2的計算和統(tǒng)計分析,可以得到如下表3的當前Flash使用信息的六種狀態(tài):
表3 Flash狀態(tài)及預警優(yōu)先級級別
一般來說,預警優(yōu)先級級別為1和2的,可不必預警。預警優(yōu)先級級別3~6的,可根據(jù)“表1系統(tǒng)功能分類”逐級進行預警。對于不同的系統(tǒng)功能分類的預警策略,可參考如下表4的方案。
表4系統(tǒng)功能分類的預警策略
以上,通過對Flash芯片使用過程中各類數(shù)據(jù)進行統(tǒng)計、分析,結(jié)合系統(tǒng)功能的特點和應用場景,精準預測Flash是否開始加速失效,以及是否即將影響哪一類系統(tǒng)功能,提前預警,通知維護人員更換FRU、避免執(zhí)行某一類系統(tǒng)功能或進行數(shù)據(jù)遷移。通過本發(fā)明,可以避免升級壞件、避免隱性故障和提高產(chǎn)品可靠性和競爭力。
本申請實施例還提供了數(shù)據(jù)處理裝置400,該裝置400可以通過圖2所示的網(wǎng)絡(luò)設(shè)備200實現(xiàn),還可以通過專用集成電路(英文:application-specific integrated circuit,ASIC)實現(xiàn),或可編程邏輯器件(英文:programmable logic device,PLD)實現(xiàn)。上述PLD可以是復雜可編程邏輯器件(英文:complex programmable logic device,CPLD),F(xiàn)PGA,通用陣列邏輯(英文:generic array logic,GAL)或其任意組合。該數(shù)據(jù)處理裝置400用于實現(xiàn)圖3所示的數(shù)據(jù)處理方法。通過軟件實現(xiàn)圖3所示的數(shù)據(jù)處理方法時,該數(shù)據(jù)處理裝置400也可以為軟件模塊。
數(shù)據(jù)處理裝置400的組織結(jié)構(gòu)示意圖如圖4所示,包括:獲取單元402和處理單元404。獲取單元402工作時,執(zhí)行圖3所示的數(shù)據(jù)處理方法中的步驟301及步驟301中的可選方案;處理單元404工作時,執(zhí)行圖3所示的數(shù)據(jù)處理方法中的步驟302~303及步驟302~303中的可選方案。應注意,本申請實施例中,獲取單元402和處理單元404也可由如圖2中所示的處理器202實現(xiàn)。
數(shù)據(jù)處理裝置400通過獲取單元402獲取存儲設(shè)備的使用信息;處理單元404根據(jù)所述存儲設(shè)備的使用信息確定目標系統(tǒng)功能所對應的預警級別;從而按照系統(tǒng)功能的預警級別與預警提示信息的對應關(guān)系輸出所述目標系統(tǒng)功能的預警級別所對應的預警提示信息。因此,本發(fā)明通過對存儲設(shè)備(例如Flash、SSD、EMMC等)使用過程中各類數(shù)據(jù)進行統(tǒng)計、分析,結(jié)合系統(tǒng)功能的特點和應用場景,精準預測存儲設(shè)備是否開始加速失效,以及是否即將影響哪一類系統(tǒng)功能,以便對存儲設(shè)備的失效做出提前預警,通知維護人員更換FRU或避免執(zhí)行某一類系統(tǒng)功能(例如:復位、升級、安裝license和保存配置等)或進行數(shù)據(jù)遷移,從而提高系統(tǒng)的可靠性和可用度。
上述裝置的相關(guān)描述可以對應參閱方法實施例部分的相關(guān)描述和效果進行理解,本處不做過多贅述。
所屬領(lǐng)域的技術(shù)人員可以清楚地了解到,為描述的方便和簡潔,在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部分,可以參見其他實施例的相關(guān)描述。
對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列的動作組合,但是本領(lǐng)域技術(shù)人員應該知悉,本發(fā)明并不受所描述的動作順序的限制,因為依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時進行。其次,本領(lǐng)域技術(shù)人員也應該知悉,說明書中所涉及的動作和模塊并不一定是本發(fā)明所必需的。
在本發(fā)明所提供的幾個實施例中,應該理解到,所揭露的系統(tǒng),裝置和方法,可以通過其它的方式實現(xiàn)。例如,以上所描述的裝置實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,例如多個單元或組件可以結(jié)合或者可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。
所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡(luò)設(shè)備上。可以根據(jù)實際的需要選擇其中的部分或者全部設(shè)備來實現(xiàn)本實施例方案的目的。
另外,在本發(fā)明各個實施例中的各功能單元可以集成在一個處理單元中,也可以是各個單元單獨物理存在,也可以兩個或兩個以上單元集成在一個單元中。上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用軟件功能單元的形式實現(xiàn)。
所述集成的單元如果以軟件功能單元的形式實現(xiàn)并作為獨立的產(chǎn)品銷售或使用時,可以存儲在一個計算機可讀取存儲介質(zhì)中?;谶@樣的理解,本發(fā)明的技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來。該計算機軟件產(chǎn)品存儲在一個存儲介質(zhì)中,包括若干指令用以使得一臺計算機設(shè)備(可以是個人計算機,服務器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述方法的全部或部分步驟。而前述的存儲介質(zhì)包括:通用串行總線閃存盤(英文:USB flash disk)、移動硬盤、只讀存儲器(英文:read-only memory,ROM)、隨機存取存儲器(英文:random access memory,RAM)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。
以上所述,以上實施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應當理解:其依然可以對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換;而這些修改或者替換,并不使相應技術(shù)方案脫離權(quán)利要求的范圍。