專利名稱:水印簽名方法與裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信技術(shù),尤其是一種水印簽名方法與裝置。
背景技術(shù):
在通信等各種業(yè)務中,經(jīng)常需要對記錄本次業(yè)務事件的日志進行解析識別處理。在日志處理領(lǐng)域,對日志的解析識別處理通常包括以下兩個階段:第一個階段是,判斷一條日志能否被解析識別;第二個階段是,將可以解析識別的日志與解析識別規(guī)則進行匹配,并根據(jù)匹配上的解析識別規(guī)則對該日志進行相應處理。目前,第二個階段中,通常通過將可以解析識別的日志與類似于訪問控制鏈表(Access Control Link,以下簡稱:ACL)結(jié)構(gòu)的鏈式匹配規(guī)則列表逐一進行匹配,其中的鏈式匹配規(guī)則列表中的解析識別規(guī)則數(shù)量較高,可能高達1000條以上。因此,如果一種文本日志在第一個階段無法被有效識別是否能被解析識別,每次接收到這種文本日志,在第二個階段中,都要遍歷全部的解析識別規(guī)則列表對其進行匹配處理,需要消耗大量的計算資源?,F(xiàn)有技術(shù)在第一個階段中,采用摘要算法第五版(Message DigestAlgorithm 5,以下簡稱:MD5)或安全哈希算法(Secure HashAlgorithm,以下簡稱:SHA1)對日志的全部文本內(nèi)容進行簽名,對日志的原始文本內(nèi)容抽取特征值并采用水印簽名算法進行處理,從而得到該日志的文本水印,來識別該文本水印能否被解析識別,從而判斷該文本水印對應的日志能否被解析識別。在實現(xiàn)本發(fā)明的過程中,發(fā)明人發(fā)現(xiàn),上述現(xiàn)有技術(shù)判斷日志能否被解析識別的方法至少存在以下問題:由于需要對日志的全部文本內(nèi)容進行簽名,當日志的文本內(nèi)容較長時,由于水印簽名算法本身性能的限制,導致文本水印的生成效率較低,從而影響對日志的處理性能,使得對日志的處理性能較差;在類似日志處理等領(lǐng)域,日志的文本內(nèi)容變化較大,例如,網(wǎng)絡設(shè)備的同一種類型的日志,文本的部分內(nèi)容,例如來源IP地址、來源端口等可變信息,會發(fā)生變化,而且變化的值域會非常大,例如會在整個IP地址范圍、TCP/UDP端口范圍內(nèi)變化,再考慮到文本內(nèi)容中多部分可變內(nèi)容的交叉組合,值域范圍無法窮盡。由于需要對全部文本內(nèi)容進行抽樣,當文本內(nèi)容出現(xiàn)部分變化時,最終生成的文本水印會不同,從而增加了判斷日志能否被解析識別的工作量,影響了對日志的處理性能。
發(fā)明內(nèi)容
本發(fā)明實施例所要解決的技術(shù)問題是:提供一種水印簽名方法與裝置,以提高文本水印的生成效率,從而提高對日志的處理性能。本發(fā)明實施例提供的一種水印簽名方法,包括:對日志的文本內(nèi)容進行片段拆分,得到M個文本序列片段,其中,M為大于I的整數(shù);
對M個文本序列片段進行非隨機抽樣,得到N個抽樣序列片段,其中,N為大于O且不大于M的整數(shù); 分別去除N個抽樣序列片段中的可變信息,得到N個目標序列片段;采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到所述日志的文本水印。本發(fā)明實施例提供的一種水印簽名裝置,包括:拆分單元,用于對日志的文本內(nèi)容進行片段拆分,得到M個文本序列片段,其中,M為大于I的整數(shù);抽樣單元,用于對M個文本序列片段進行非隨機抽樣,得到N個抽樣序列片段,其中,N為大于O且不大于M的整數(shù);信息去除單元,用于分別去除N個抽樣序列片段中的可變信息,得到N個目標序列片段;簽名單元,用于采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到所述日志的文本水印。基于本發(fā)明上述實施例提供的水印簽名方法與裝置,對日志的文本內(nèi)容進行片段拆分,對拆分得到的M個文本序列片段進行非隨機抽樣,并去除N個抽樣序列片段中的可變信息,再采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到日志的文本水印。與現(xiàn)有技術(shù)相比,本發(fā)明實施例僅對日志的若干片段進行簽名,而無需對日志的全部文本內(nèi)容進行簽名,從而不會由于日志的文本內(nèi)容長度影響文本水印的生成效率,有效提高了文本水印的生成效率與對日志的處理性能;并且,去除了簽名片段中的可變信息部分,避免了可變信息對最終生成的文本水印的影響,減少了判斷日志能否被解析識別的工作量,提高了對日志的處理性能。由此,本發(fā)明實施例提高了第一個階段中日志能否被解析識別的識別效率與準確率,使無法匹配解析識別規(guī)則的日志在第一個階段盡可能的被發(fā)現(xiàn)出來,避免其進入第二個階段對解析識別規(guī)則列表的遍歷,從而極大的提高日志處理的性能。下面通過附圖和實施例,對本發(fā)明的技術(shù)方案做進一步的詳細描述。
為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本發(fā)明水印簽名方法一個實施例的流程圖;圖2為本發(fā)明水印簽名方法另一個實施例的流程圖;圖3為本發(fā)明水印簽名裝置一個實施例的結(jié)構(gòu)示意圖;圖4為本發(fā)明水印簽名裝置另一個實施例的結(jié)構(gòu)示意圖;圖5為本發(fā)明水印簽名裝置又一個實施例的結(jié)構(gòu)示意圖。
具體實施例方式下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。圖1為本發(fā)明水印簽名方法一個實施例的流程圖。如圖1所示,該實施例的水印簽名方法包括:101,對日志的文本內(nèi)容進行片段拆分,得到M個文本序列片段。其中,M為大于I的整數(shù)。示例性地,本發(fā)明實施例中可以采用定長的拆分方法,將日志的文本內(nèi)容拆分為M個長度相同的文本序列片段;或者,也可以采用固定片段數(shù)量的拆分方法,將日志的文本內(nèi)容拆分為M個文本序列片段,其中,M為預先設(shè)定的固定片段數(shù)量。102,對M個文本序列片段進行非隨機抽樣,得到N個抽樣序列片段。其中,N為大于O且不大于M的整數(shù)。示例性地,本發(fā)明實施例中,采用相同的方式對對M個文本序列片段進行多次非隨機抽樣,可以保證抽樣結(jié)果的一致,即:保證抽樣得到的N個抽樣序列片段的正確性。其中,非隨機抽樣,是指按照預設(shè)規(guī)定有規(guī)律的抽樣,以確保相同或類似的內(nèi)容,在多次抽樣處理后,得到的抽樣結(jié)果是一樣的;并且,避免采用隨機抽樣的方式導致不同或不相似的內(nèi)容在多次抽樣后,得到的抽樣結(jié)果反而是相同的,從而引起結(jié)果沖撞,這是必須要避免的。示例性地,在本發(fā)明實施例中,可以采用包括但不限于如下所示的兩種非隨機抽樣方式:一是采用固定抽取方式,例如,抽取M個文本序列片段中的前N個;二是奇偶位抽取,例如,抽取M個文本序列片段中的奇數(shù)位片段。103,分別去除N個抽樣序列片段中的可變信息,得到N個目標序列片段。示例性地,可以根據(jù)預先設(shè)定的可變信息定義,分別從N個抽樣序列片段中去除預先設(shè)定的可變信息。104,采用預設(shè)水印簽名算法,例如,包括但不限于MD5或SHA1,對N個目標序列片段進行簽名,得到日志的文本水印。本發(fā)明上述實施例提供的水印簽名方法,對日志的文本內(nèi)容進行片段拆分,對拆分得到的M個文本序列片段進行非隨機抽樣,并去除N個抽樣序列片段中的可變信息,再采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到日志的文本水印。由于僅對日志的若干片段進行簽名,而無需對日志的全部文本內(nèi)容進行簽名,從而不會由于日志的文本內(nèi)容長度影響文本水印的生成效率,有效提高了文本水印的生成效率與對日志的處理性能;并且,去除了簽名片段中的可變信息部分,避免了可變信息對最終生成的文本水印的影響,實現(xiàn)了基于模式的水印,其中的模式是指部分內(nèi)容變化而大部分內(nèi)容不變的形式,減少了判斷日志能否被解析識別的工作量,提高了對日志的處理性能。由此,本發(fā)明實施例提高了第一個階段中日志能否被解析識別的識別效率與準確率,使無法匹配解析識別規(guī)則的日志在第一個階段盡可能的被發(fā)現(xiàn)出來,避免其進入第二個階段對解析識別規(guī)則列表的遍歷,從而極大的提高日志處理的性能。另外,采用MD5、SHAI等方式對N個目標序列片段進行簽名時,由于采用單向不可逆轉(zhuǎn)換方法,從得到的簽名中,無法還原簽名前的內(nèi)容,有效提高了日志的安全性;并且,兩個不同的內(nèi)容信息,經(jīng)過簽名算法處理后,得到的水印不相同。因此,可以以及極低的沖撞幾率,應用于各種各樣的系統(tǒng)。根據(jù)本發(fā)明的一個示例而非限制,圖1所示的上述各實施例中,具體可以通過以下方式實現(xiàn)103的操作:分別從N個抽樣序列片段中去除阿拉伯數(shù)字信息;分別從N個抽樣序列片段中去除成對的符號或其它預設(shè)符號中間的內(nèi)容;分別從N個抽樣序列片段中去除等號之后直到分割邊界的所有內(nèi)容,以及冒號之后直到分割邊界的所有內(nèi)容。其中的分割邊界包括但不限于空格、TAB制表符、行尾、小于號、前中括號、前大括號、前小括號、引號與單引號等。根據(jù)本發(fā)明的另一個示例而非限制,在本發(fā)明上述各實施例的水印簽名方法中,N為預先設(shè)定的固定整數(shù),即:抽樣序列片段的數(shù)量是固定的。
·
由于抽樣序列片段的數(shù)量是固定的,即N的取值一定,該數(shù)值不會由于日志的文本內(nèi)容的長度不同而變化,由于進行簽名的目標序列片段數(shù)量一定,可以保證簽名得到水印的過程中系統(tǒng)開銷上限是收斂的,不會由于文本長度增加而導致性能的過度下降,當文本內(nèi)容較長時,也不會出現(xiàn)性能下降,確保性能在可控范圍之內(nèi)。圖2為本發(fā)明水印簽名方法另一個實施例的流程圖。如圖2所示,該實施例的水印簽名方法包括:201,對日志的文本內(nèi)容進行片段拆分,得到M個文本序列片段。示例性地,本發(fā)明實施例中可以采用定長的拆分方法,將日志的文本內(nèi)容拆分為M個長度相同的文本序列片段;或者,也可以采用固定片段數(shù)量的拆分方法,將日志的文本內(nèi)容拆分為M個文本序列片段,其中,M預先設(shè)定的固定片段數(shù)量,M的取值為大于I的整數(shù)。202,對M個文本序列片段進行非隨機抽樣,得到N個抽樣序列片段。其中,N為預先設(shè)定的固定整數(shù),且N的取值為大于O且不大于M的整數(shù)。203,別從N個抽樣序列片段中去除阿拉伯數(shù)字信息。204,分別從N個抽樣序列片段中去除成對的符號中間的內(nèi)容。其中,成對的符號例如尖括號〈>、中括號□、大括號{}、小括號O、雙引號“”、單引
縣 ,坐
V寸ο205,分別從N個抽樣序列片段中去除等號之后直到分割邊界的所有內(nèi)容,以及冒號之后直到分割邊界的所有內(nèi)容,得到N個目標序列片段。其中的分割邊界例如,空格、TAB制表符、行尾、小于號、前中括號、前大括號、前小括號、引號與單引號。206,采用預設(shè)水印簽名算法,例如,包括但不限于MD5或SHA1,對N個目標序列片段進行簽名,得到日志的文本水印。根據(jù)本發(fā)明的一個具體實施例,在圖2所示實施例的206中,具體可以將N個目標序列片段依次拼接,得到一個完整序列;并采用預設(shè)水印簽名算法對該完整序列進行簽名,得到日志的文本水印。相應的,本發(fā)明實施例判斷該日志能否被解析識別以及將第一個階段無法判定為無法解析識別的日志與解析識別規(guī)則進行匹配時,具體可以通過如下方式實現(xiàn):將得到的日志的文本水印依次與歷史記錄中未識別日志的水印比較,識別歷史記錄中未識別日志的水印中是否有與日志的文本水印一致的水印;若歷史記錄中未識別日志的水印中有與該日志的文本水印一致的水印,確認該日志無法被解析識別;若歷史記錄中未識別日志的水印中沒有與該日志的文本水印一致的水印,采用預先設(shè)置的解析識別規(guī)則列表,逐條對該日志進行匹配處理;若解析識別規(guī)則列表中的全部解析識別規(guī)則對該日志均匹配失敗,將該日志的文本水印添加為歷史記錄中未識別日志的水印,以便據(jù)此判斷后續(xù)日志的水印能否被解析識別。根據(jù)本發(fā)明的另一個具體實施例,在圖2所示實施例的206中,具體可以分別采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到N個目標序列片段的水印,其中,日志的文本水印包括該N個目標序列片段的水印。相應的,本發(fā)明實施例判斷該日志能否被解析識別以及將第一個階段無法判定為無法解析識別的日志與解析識別規(guī)則進行匹配時,具體可以通過如下方式實現(xiàn):分別將N個目標序列片段的水印依次與歷史記錄中未識別日志的水印比較,識別歷史記錄中未識別日志的水印中是否包括N個目標序列片段的水?。蝗魵v史記錄中未識別日志的水印中包括該N個目標序列片段中一個或多個片段的水印,確認日志無法被解析識別;若歷史記錄中未識別日志的水印中不包括該N個目標序列片段中任意一個片段的水印,采用預先設(shè)置的解析識別規(guī)則列表,逐條對日志進行匹配處理;若解析識別規(guī)則列表中的全部解析識別規(guī)則對日志均匹配失敗,將該N個目標序列片段的水印作為日志的文本水印,添加為歷史記錄中未識別日志的水印,以便據(jù)此判斷后續(xù)日志的水印能否被解析識別。相對于上述一個具體實施例而言,由于該另一個具體實施例中無需將N個目標序列片段依次拼接,可以進一步減少由此帶來的運算開銷,進一步提高了日志處理性能。無論采用上述兩個具體實施例中的哪種方式,得到的日志的文本水印結(jié)果是一致的,此文本水印不會隨著文本內(nèi)容中可變信息部分的改變而改變,從而滿足了同一種類日志處理系統(tǒng)的需求,解決了傳統(tǒng)的MD5、SHAl等方法在此類系統(tǒng)中的不適用性的問題。以下以對一個具體日志的處理為例,來進一步說明本發(fā)明水印簽名方法的具體應用。如下所示為通信系統(tǒng)中的一條普通日志內(nèi)容實例:<189>gzgt~nsg2:NetScreen device_id = gzgt_nsg2 [Root]system-notif icat ion-00015: Infranet Enforcer could not connect to theInfranetController because the Controller could not be reached on the network.(2010-10-09 11:05:42)在上述格式的日志中,“189”、“gzgt-nsg2”、“Root”、“00015”、“2010-10-0911:05:42”這幾部分為可變信息,其余部分為不變信息。依據(jù)本發(fā)明上述實施例的水印簽名方法,采用定長的拆分方法或者固定片段數(shù)量的拆分方法,對日志的文本內(nèi)容進行片段拆分,得到M個文本序列片段。然后對M個文本序列片段進行非隨即抽樣,得到N個抽樣序列片段,記為:P1,P2,...,PN, N為預先設(shè)定的抽樣序列片段的最大數(shù)量值,例如取值為10,其取值不大于M,N的取值可以任意選取但是需要在日志開始處理前就確定并在日志處理的過程中始終保持不變。M個文本序列片段中未被抽樣的其它文本序列片段丟棄。接下來,從這N個抽樣序列片段中,依次除去可變信息。去掉可變信息的操作如下:首先,去掉N個抽樣序列片段中的阿拉伯數(shù)字信息,即去掉該實例中的“189”數(shù)字信息;去掉成對的符號中間的內(nèi)容,成對的符號例如尖括號O、中括號□、大括號H、小括號O、雙引號“”、單引號等,即去掉該實例中的“Root”、“2010-10-09 11:05:42”信息;然后去掉等號=、冒號:后面直到分割邊界的所有內(nèi)容,其中的分割邊界例如,空格、TAB制表符、行尾、小于號、前中括號、前大括號、前小括號、引號、單引號等,即去掉該實例中的“gzgt-nsg2”信息。經(jīng)過上述操作,可以得到全部為不可變內(nèi)容的N個目標序列片段,記為:C1,C2,...,CN。圖3為本發(fā)明水印簽名裝置一個實施例的結(jié)構(gòu)示意圖。該實施例的水印簽名裝置可用于實現(xiàn)本發(fā)明上述各水印簽名方法實施例的相應流程。如圖3所示,其包括拆分單元301、抽樣單元302、信息去除單元303與簽名單元304。其中,拆分單元301,用于對日志的文本內(nèi)容進行片段拆分,得到M個文本序列片段,其中,M為大于I的整數(shù)。示例性地,拆分單元301對日志的文本內(nèi)容進行片段拆分時,具體可以采用定長的拆分方法,將日志的文本內(nèi)容拆分為M個長度相同的文本序列片段;或者,也可以采用固定片段數(shù)量的拆分方法,將日志的文本內(nèi)容拆分為M個文本序列片段,M為預先設(shè)定的固定片段數(shù)量。抽樣單元302,用于對拆分單元301得到的M個文本序列片段進行非隨機抽樣,得到N個抽樣序列片段,其中,N為大于O且不大于M的整數(shù)。信息去除單元303,用于分別去除抽樣單元302得到的N個抽樣序列片段中的可變信息,得到N個目標序列片段。簽名單元304,用于采用預設(shè)水印簽名算法,例如,MD5、SHAl等,對信息去除單元303得到的N個目標序列片段進行簽名,得到日志的文本水印。本發(fā)明上述實施例提供的水印簽名裝置,對日志的文本內(nèi)容進行片段拆分,對拆分得到的M個文本序列片段進行非隨機抽樣,并去除N個抽樣序列片段中的可變信息,再采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到日志的文本水印。本發(fā)明實施例僅對日志的若干片段進行簽名,而無需對日志的全部文本內(nèi)容進行簽名,從而不會由于日志的文本內(nèi)容長度影響文本水印的生成效率,有效提高了文本水印的生成效率與對日志的處理性能;并且,去除了簽名片段中的可變信息部分,避免了可變信息對最終生成的文本水印的影響,減少了判斷日志能否被解析識別的工作量,提高了對日志的處理性能。由此,本發(fā)明實施例提高了第一個階段中日志能否被解析識別的識別效率與準確率,使無法匹配解析識別規(guī)則的日志在第一個階段盡可能的被發(fā)現(xiàn)出來,避免其進入第二個階段對解析識別規(guī)則列表的遍歷,從而極大的提高日志處理的性能。根據(jù)本發(fā)明的一個示例而非限制,與本發(fā)明上述水印簽名方法實施例相應的,信息去除單元303具體可以根據(jù)預先設(shè)定的可變信息定義,分別從N個抽樣序列片段中去除預先設(shè)定的可變信息,得到N個目標序列片段。進一步示例性地,信息去除單元303可以分別從N個抽樣序列片段中去除阿拉伯數(shù)字信息;分別從N個抽樣序列片段中去除成對的符號中間的內(nèi)容;以及分別從N個抽樣序列片段中去除等號之后直到分割邊界的所有內(nèi)容,以及冒號之后直到分割邊界的所有內(nèi)容,得到N個目標序列片段。其中的分割邊界可以包括但不限于空格、TAB制表符、行尾、小于號、前中括號、前大括號、前小括號、引號與單引號
坐寸ο根據(jù)本發(fā)明的另一個示例而非限制,與本發(fā)明上述水印簽名方法實施例相應的,N為預先設(shè)定的固定整數(shù),即:抽樣序列片段的數(shù)量是固定的。圖4為本發(fā)明水印簽名裝置另一個實施例的結(jié)構(gòu)示意圖。與圖3所示實施例的水印簽名裝置相比,該實施例中,簽名單元304具體將N個目標序列片段依次拼接,得到一個完整序列,并采用預設(shè)水印簽名算法對完整序列進行簽名,得到日志的文本水印。相應的,如圖4所示,該實施例中,水印簽名裝置還包括存儲單元305、第一判斷單元306與第一日志處理單元307。其中,存儲單元305,用于存儲歷史記錄,該歷史記錄中包括未識別日志的水印。示例性地,該未識別日志的水印可以預先設(shè)置并可以在后續(xù)更新。第一判斷單元306,用于將簽名單元304得到的日志的文本水印依次與歷史記錄中未識別日志的水印比較,識別歷史記錄中未識別日志的水印中是否有與簽名單元304得到的日志的文本水印一致的水??;若歷史記錄中未識別日志的水印中有與簽名單元304得到的日志的文本水印一致的水印,確認簽名單元304得到的日志無法被解析識別。第一日志處理單元307,用于根據(jù)第一判斷單元306的判斷結(jié)果,在歷史記錄中未識別日志的水印中沒有與簽名單元304得到的日志的文本水印一致的水印時,采用預先設(shè)置的解析識別規(guī)則列表,逐條對簽名單元304得到的日志進行匹配處理;并在解析識別規(guī)則列表中的全部解析識別規(guī)則對簽名單元304得到的日志均匹配失敗時,將簽名單元304得到的日志的文本水印添加倒存儲單元305存儲的歷史記錄中未識別日志的水印。圖5為本發(fā)明水印簽名裝置又一個實施例的結(jié)構(gòu)示意圖。與圖3所示實施例的水印簽名裝置相比,該實施例中,簽名單元304分別采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到N個目標序列片段的水印,其中,日志的文本水印包括該N個目標序列片段的水印。相應的,如圖5所示,該實施例中,水印簽名裝置還包括存儲單元305、第二判斷單元308與第二日志處理單元309。其中,存儲單元305,用于存儲歷史記錄,該歷史記錄中包括未識別日志的水印。示例性地,該未識別日志的水印可以預先設(shè)置并可以在后續(xù)更新。第二判斷單元308,用于分別將簽名單元304得到的N個目標序列片段的水印依次與歷史記錄中未識別日志的水印比較,識別歷史記錄中未識別日志的水印中是否包括該N個目標序列片段的水??;若歷史記錄中未識別日志的水印中包括該N個目標序列片段中一個或多個片段的水印,確認日志無法被解析識別。第二日志處理單元309,用于根據(jù)第二判斷單元308的判斷結(jié)果,在歷史記錄中未識別日志的水印中不包括該N個目標序列片段中任意一個片段的水印時,采用預先設(shè)置的解析識別規(guī)則列表,逐條對日志進行匹配處理;并在解析識別規(guī)則列表中的全部解析識別規(guī)則對日志均匹配失敗時,將該N個目標序列片段的水印作為對應日志的文本水印,添加在存儲單元305存儲的歷史記錄中未識別日志的水印。本說明書中各個實施例均采用遞進的方式描述,每個實施例重點說明的都是與其它實施例的不同之處,各個實施例之間相同或相似的部分相互參見即可。對于裝置實施例而言,由于其與方法實施例基本相似,所以描述的比較簡單,相關(guān)之處參見方法實施例的部分說明即可。本領(lǐng)域普通技術(shù)人員可以理解:實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括:R0M、RAM、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。 本發(fā)明實施例無需對日志的全部文本內(nèi)容進行簽名,從而不會由于日志的文本內(nèi)容長度影響文本水印的生成效率,有效提高了文本水印的生成效率與對日志的處理性能;并且,去除了簽名片段中的可變信息部分,當文本內(nèi)容出現(xiàn)部分變化時,生成的文本水印會忽略內(nèi)容變化部分,避免了可變信息對最終生成的文本水印的影響,實現(xiàn)了對文本內(nèi)容模式的水印,保證用有限的、可枚舉的模式水印,支持對無窮日志解析識別前的處理,減少了判斷日志能否被解析識別的工作量,提高了對日志的處理性能。由此,本發(fā)明實施例提高了第一個階段中日志能否被解析識別的識別效率與準確率,使無法匹配解析識別規(guī)則的日志在第一個階段盡可能的被發(fā)現(xiàn)出來,避免其進入第二個階段對解析識別規(guī)則列表的遍歷,從而極大的提高日志處理的性能。 本發(fā)明的描述是為了示例和描述起見而給出的,而并不是無遺漏的或者將本發(fā)明限于所公開的形式。很多修改和變化對于本領(lǐng)域的普通技術(shù)人員而言是顯然的。選擇和描述實施例是為了更好說明本發(fā)明的原理和實際應用,并且使本領(lǐng)域的普通技術(shù)人員能夠理解本發(fā)明從而設(shè)計適于特定用途的帶有各種修改的各種實施例。
權(quán)利要求
1.一種水印簽名方法,其特征在于,包括: 對日志的文本內(nèi)容進行片段拆分,得到M個文本序列片段,其中,M為大于I的整數(shù);對M個文本序列片段進行非隨機抽樣,得到N個抽樣序列片段,其中,N為大于O且不大于M的整數(shù); 分別去除N個抽樣序列片段中的可變信息,得到N個目標序列片段; 采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到所述日志的文本水印。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,對日志的文本內(nèi)容進行片段拆分包括: 采用定長的拆分方法,將日志的文本內(nèi)容拆分為M個長度相同的文本序列片段;或者 采用固定片段數(shù)量的拆分方法,將日志的文本內(nèi)容拆分為M個文本序列片段,M為預先設(shè)定的固定片段數(shù)量。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,分別去除N個抽樣序列片段中的可變信息包括: 分別從N個抽樣序列片段中去除預先設(shè)定的可變信息。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,分別從N個抽樣序列片段中去除預先設(shè)定的可變信息包括: 分別從N個抽樣序列片 段中去除阿拉伯數(shù)字信息; 分別從N個抽樣序列片段中去除成對的符號中間的內(nèi)容; 分別從N個抽樣序列片段中去除等號之后直到分割邊界的所有內(nèi)容,以及冒號之后直到分割邊界的所有內(nèi)容。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述分割邊界包括空格、TAB制表符、行尾、小于號、前中括號、前大括號、前小括號、引號與單引號。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述預設(shè)水印簽名算法包括消息摘要算法第五版MD5或安全哈希算法SHAl。
7.根據(jù)權(quán)利要求1至6任意一項所述的方法,其特征在于,N為預先設(shè)定的固定整數(shù)。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到所述日志的文本水印包括: 將N個目標序列片段依次拼接,得到一個完整序列; 采用預設(shè)水印簽名算法對所述完整序列進行簽名,得到所述日志的文本水印。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,還包括: 將所述日志的文本水印依次與歷史記錄中未識別日志的水印比較,識別歷史記錄中未識別日志的水印中是否有與所述日志的文本水印一致的水?。? 若歷史記錄中未識別日志的水印中有與所述日志的文本水印一致的水印,確認所述日志無法被解析識別; 若歷史記錄中未識別日志的水印中沒有與所述日志的文本水印一致的水印,采用預先設(shè)置的解析識別規(guī)則列表,逐條對所述日志進行匹配處理; 若解析識別規(guī)則列表中的全部解析識別規(guī)則對所述日志均匹配失敗,將所述日志的文本水印添加為歷史記錄中未識別日志的水印。
10.根據(jù)權(quán)利要求7所述的方法,其特征在于,采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到所述日志的文本水印包括:分別采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到N個目標序列片段的水印,所述日志的文本水印包括N個目標序列片段的水印。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,還包括: 分別將N個目標序列片段的水印依次與歷史記錄中未識別日志的水印比較,識別歷史記錄中未識別日志的水印中是否包括N個目標序列片段的水印; 若歷史記錄中未識別日志的水印中包括N個目標序列片段中一個或多個片段的水印,確認所述日志無法被解析識別; 若歷史記錄中未識別日志的水印中不包括N個目標序列片段中任意一個片段的水印,采用預先設(shè)置的解析識別規(guī)則列表,逐條對所述日志進行匹配處理; 若解析識別規(guī)則列表中的全部解析識別規(guī)則對所述日志均匹配失敗,將N個目標序列片段的水印作為所述日志的文本水印,添加為歷史記錄中未識別日志的水印。
12.—種水印簽名裝置,其特征在于,包括: 拆分單元,用于對日志的文本內(nèi)容進行片段拆分,得到M個文本序列片段,其中,M為大于I的整數(shù); 抽樣單元,用于對M個文本序列片段進行非隨機抽樣,得到N個抽樣序列片段,其中,N為大于O且不大于M的整數(shù); 信息去除單元,用于分別去除N個抽樣序列片段中的可變信息,得到N個目標序列片段; 簽名單元,用于采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到所述日志的文本水印。
13.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述拆分單元對日志的文本內(nèi)容進行片段拆分時,具體采用定長的拆分方法,將日志的文本內(nèi)容拆分為M個長度相同的文本序列片段;或者采用固定片段數(shù)量的拆分方法,將日志的文本內(nèi)容拆分為M個文本序列片段,M為預先設(shè)定的固定片段數(shù)量。
14.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述信息去除單元具體用于分別從N個抽樣序列片段中去除預先設(shè)定的可變信息,得到N個目標序列片段。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述信息去除單元分別從N個抽樣序列片段中去除預先設(shè)定的可變信息時,具體用于分別從N個抽樣序列片段中去除阿拉伯數(shù)字信息;分別從N個抽樣序列片段中去除成對的符號中間的內(nèi)容;以及分別從N個抽樣序列片段中去除等號之后直到分割邊界的所有內(nèi)容,以及冒號之后直到分割邊界的所有內(nèi)容。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述分割邊界包括空格、TAB制表符、行尾、小于號、前中括號、前大括號、前小括號、引號與單引號。
17.根據(jù)權(quán)利要求12所述的裝置,其特征在于,所述預設(shè)水印簽名算法包括MD5或SHAl0
18.根據(jù)權(quán)利要求12至17任意一項所述的裝置,其特征在于,N為預先設(shè)定的固定整數(shù)。
19.根據(jù)權(quán)利要求18所述的裝置,其特征在于,所述簽名單元具體將N個目標序列片段依次拼接,得到一個完整序列;并采用預設(shè)水印簽名算法對所述完整序列進行簽名,得到所述日志的文本水印。
20.根據(jù)權(quán)利要求19所述的裝置,其特征在于,還包括: 存儲單元,用于存儲歷史記錄,所述歷史記錄中包括未識別日志的水?。? 第一判斷單元,用于將所述日志的文本水印依次與歷史記錄中未識別日志的水印比較,識別歷史記錄中未識別日志的水印中是否有與所述日志的文本水印一致的水印;若歷史記錄中未識別日志的水印中有與所述日志的文本水印一致的水印,確認所述日志無法被解析識別; 第一日志處理單元,用于根據(jù)第一判斷單元的判斷結(jié)果,在歷史記錄中未識別日志的水印中沒有與所述日志的文本水印一致的水印時,采用預先設(shè)置的解析識別規(guī)則列表,逐條對所述日志進行匹配處理;并在解析識別規(guī)則列表中的全部解析識別規(guī)則對所述日志均匹配失敗時,將所述日志的文本水印添加為歷史記錄中未識別日志的水印。
21.根據(jù) 權(quán)利要求18所述的裝置,其特征在于,所述簽名單元具體分別采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到N個目標序列片段的水印,所述日志的文本水印包括N個目標序列片段的水印。
22.根據(jù)權(quán)利要求21所述的裝置,其特征在于,還包括: 存儲單元,用于存儲歷史記錄,所述歷史記錄中包括未識別日志的水印; 第二判斷單元,用于分別將N個目標序列片段的水印依次與歷史記錄中未識別日志的水印比較,識別歷史記錄中未識別日志的水印中是否包括N個目標序列片段的水??;若歷史記錄中未識別日志的水印中包括N個目標序列片段中一個或多個片段的水印,確認所述日志無法被解析識別; 第二日志處理單元,用于根據(jù)第二判斷單元的判斷結(jié)果,在歷史記錄中未識別日志的水印中不包括N個目標序列片段中任意一個片段的水印時,采用預先設(shè)置的解析識別規(guī)則列表,逐條對所述日志進行匹配處理;并在解析識別規(guī)則列表中的全部解析識別規(guī)則對所述日志均匹配失敗時,將N個目標序列片段的水印作為所述日志的文本水印,添加為歷史記錄中未識別日志的水印。
全文摘要
本發(fā)明實施例公開了一種水印簽名方法與裝置,其中,方法包括對日志的文本內(nèi)容進行片段拆分,得到M個文本序列片段,其中,M為大于1的整數(shù);對M個文本序列片段進行非隨機抽樣,得到N個抽樣序列片段,其中,N為大于0且不大于M的整數(shù);分別去除N個抽樣序列片段中的可變信息,得到N個目標序列片段;采用預設(shè)水印簽名算法對N個目標序列片段進行簽名,得到所述日志的文本水印。本發(fā)明實施例可以提高文本水印的生成效率,從而提高對日志的處理性能。
文檔編號G06F21/16GK103138926SQ20111038884
公開日2013年6月5日 申請日期2011年11月30日 優(yōu)先權(quán)日2011年11月30日
發(fā)明者章軍, 唐維, 李文宇, 田朝文, 賈海燕, 馮曉東, 張鑒, 常力元, 趙洪波, 趙敬謙, 俞韶楨 申請人:中國電信股份有限公司