1.一種圖像的識別方法,其特征在于,包括:
按照顏色通道對獲取的圖像信息進行區(qū)域特征值提取處理,得到所述圖像信息中與所述顏色通道對應(yīng)的各個區(qū)域的區(qū)域特征值;
根據(jù)所述區(qū)域特征值與預(yù)先設(shè)置的第一閾值對所述圖像信息中所述各個區(qū)域進行篩選,確定所述圖像信息中的文本區(qū)域;
對所述圖像信息中的所述文本區(qū)域進行文字識別,得到與所述文本區(qū)域?qū)?yīng)的字段信息;
將所述字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進行匹配,確定所述圖像信息是否為包含非法字段信息的非法圖像。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,在將所述字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進行匹配,確定所述圖像信息是否為包含非法字段信息的非法圖像之前,所述方法還包括:
按照預(yù)先設(shè)置的分詞規(guī)則對所述字段信息進行拆分,得到與所述字段信息對應(yīng)的分詞集合,其中,所述分詞集合用于記錄對所述字段信息進行拆分后得到的分詞詞條。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,將所述字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進行匹配,確定所述圖像信息是否為包含非法字段信息的非法圖像,包括:
獲取預(yù)先設(shè)置的非法關(guān)鍵詞集合;
獲取與所述非法關(guān)鍵詞集合中各非法關(guān)鍵詞對應(yīng)的權(quán)重值;
將所述分詞集合中的所述分詞詞條,分別與所述非法關(guān)鍵詞集合中的非法關(guān)鍵詞進行匹配,得到匹配結(jié)果;
根據(jù)與所述非法關(guān)鍵詞對應(yīng)的權(quán)重值與所述匹配結(jié)果進行加權(quán)運算,得到所述字段信息的字段權(quán)重;
將所述字段權(quán)重與預(yù)先設(shè)置的第二閾值進行比對,確定所述圖像信息是否為包含所述非法字段的所述非法圖像。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述顏色通道包括:彩色通道和灰度通道,所述彩色通道至少包括:紅色通道、綠色通道、藍色通道和黃色通道,所述灰度通道至少包括:黑色通道、白色通道。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,當(dāng)所述顏色通道為所述彩色通道時,其中,按照顏色通道對獲取的圖像信息進行區(qū)域特征值提取處理,得到所述圖像信息中與所述顏色通道對應(yīng)的各個區(qū)域的區(qū)域特征值,包括:
通過對所述圖像信息中像素點的RGB顏色值進行修正處理,得到與所述像素點對應(yīng)的預(yù)處理顏色值,其中,所述預(yù)處理顏色值中包括:紅色值、綠色值、藍色值和黃色值;
根據(jù)所述預(yù)處理顏色值和所述像素點的位置信息,確定所述像素點在所述彩色通道中的第一像素特征值,其中,所述第一像素特征值與所述彩色通道對應(yīng);
根據(jù)所述第一像素特征值,對所述圖像信息進行提取處理,得到與所述彩色通道對應(yīng)的所述區(qū)域特征值。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,當(dāng)所述顏色通道為所述灰度通道時,其中,按照顏色通道對獲取的圖像信息進行區(qū)域特征值提取處理,得到所述圖像信息中與所述顏色通道對應(yīng)的各個區(qū)域的區(qū)域特征值,還包括:
獲取預(yù)先設(shè)置的計算參數(shù);
根據(jù)所述圖像信息中像素點的RGB顏色值、所述像素點的位置信息和所述計算參數(shù),確定所述像素點在所述灰度通道中的第二像素特征值,其中,所述第二像素特征值與所述灰度通道對應(yīng);
根據(jù)所述第二像素特征值對所述圖像信息進行提取處理,得到與所述灰度通道對應(yīng)的所述區(qū)域特征值。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述區(qū)域特征值與預(yù)先設(shè)置的第一閾值對所述圖像信息中所述各個區(qū)域進行篩選,確定所述圖像信息中的文本區(qū)域,包括:
將與所述顏色通道對應(yīng)的所述區(qū)域特征值分別與所述第一閾值進行比對,得到比對結(jié)果;
根據(jù)所述比對結(jié)果,確定所述圖像信息中與所述顏色通道對應(yīng)的所述文本區(qū)域。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,當(dāng)所述圖像信息中包括至少兩個所述文本區(qū)域時,在根據(jù)所述區(qū)域特征值與預(yù)先設(shè)置的第一閾值對所述圖像信息中所述各個區(qū)域進行篩選,確定所述圖像信息中的文本區(qū)域之后,所述方法還包括:
獲取所述文本區(qū)域在所述圖像信息中的相對位置信息;
根據(jù)所述文本區(qū)域的所述區(qū)域特征值,確定與所述文本區(qū)域?qū)?yīng)的顏色通道信息;
根據(jù)所述相對位置信息和所述顏色通道信息,確定所述文本區(qū)域之間的關(guān)聯(lián)關(guān)系;
將具有所述關(guān)聯(lián)關(guān)系的文本區(qū)域合并為新文本區(qū)域。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,對所述圖像信息中的所述文本區(qū)域進行文字識別,得到與所述文本區(qū)域?qū)?yīng)的字段信息,包括:
按照預(yù)定方向?qū)λ鑫谋緟^(qū)域進行投影處理,得到與所述方向?qū)?yīng)的所述文本區(qū)域的投影結(jié)果,其中,所述投影處理為沿預(yù)定方向?qū)λ鑫谋緟^(qū)域中每個區(qū)間內(nèi)的像素密度進行統(tǒng)計處理,得到與所述方向?qū)?yīng)的像素密度的分布結(jié)果;
根據(jù)所述投影結(jié)果確定所述文本區(qū)域中的文字走向;
根據(jù)所述文字走向和所述投影結(jié)果對所述文本區(qū)域進行順序分割,分割得到子字符區(qū)域,其中,每個所述子字符區(qū)域包含一個字符;
通過字符識別引擎對所述子字符區(qū)域中的字符進行識別,確定與所述子字符區(qū)域?qū)?yīng)的識別結(jié)果;
根據(jù)所述文字走向和所述識別結(jié)果,生成所述字段信息。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,通過字符識別引擎對所述子字符區(qū)域中的字符進行識別,確定與所述子字符區(qū)域?qū)?yīng)的識別結(jié)果,包括:
通過所述字符識別引擎對所述子字符區(qū)域進行識別,得到與所述子字符區(qū)域?qū)?yīng)的初始識別結(jié)果,其中,所述初始識別結(jié)果中至少包括一個備選字符和與所述備選字符對應(yīng)的置信度;
根據(jù)所述置信度,從所述初始識別結(jié)果中確定所述置信度最高的預(yù)定數(shù)量的備選字符作為所述識別結(jié)果。
11.根據(jù)權(quán)利要求1所述的方法,其特征在于,當(dāng)確定所述圖像信息為包含非法字段 信息的非法圖像之后,所述方法還包括:
獲取預(yù)先設(shè)置的第一圖像特征向量,其中,所述第一圖像特征向量用于表征特定類型圖像的圖像特征;
對所述非法圖像進行特征向量提取,得到第二圖像特征向量;
將所述第二圖像特征向量與所述第一圖像特征向量進行比對,確定所述非法圖像的圖像類型,其中,所述圖像類型至少包括:聊天截圖、非聊天截圖。
12.根據(jù)權(quán)利要求1至11中任意一項所述的方法,其特征在于,在按照顏色通道對獲取的圖像信息進行區(qū)域特征值提取處理,得到所述圖像信息中與所述顏色通道對應(yīng)的各個區(qū)域的區(qū)域特征值之前,所述方法還包括:
獲取所述圖像信息的圖像分別率;
將所述圖像分別率與預(yù)先設(shè)置的標準圖像分辨率進行比對;
當(dāng)所述圖像分別率不等于所述標準圖像分辨率時,對所述圖像信息按所述標準圖像分辨率進行等比例縮放。
13.一種圖像的識別裝置,其特征在于,包括:
第一提取模塊,用于按照顏色通道對獲取的圖像信息進行區(qū)域特征值提取處理,得到所述圖像信息中與所述顏色通道對應(yīng)的各個區(qū)域的區(qū)域特征值;
篩選模塊,用于根據(jù)所述區(qū)域特征值與預(yù)先設(shè)置的第一閾值對所述圖像信息中所述各個區(qū)域進行篩選,確定所述圖像信息中的文本區(qū)域;
識別模塊,用于對所述圖像信息中的所述文本區(qū)域進行文字識別,得到與所述文本區(qū)域?qū)?yīng)的字段信息;
匹配模塊,用于將所述字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進行匹配,確定所述圖像信息是否為包含非法字段信息的非法圖像。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括:
分詞模塊,用于按照預(yù)先設(shè)置的分詞規(guī)則對所述字段信息進行拆分,得到與所述字段信息對應(yīng)的分詞集合,其中,所述分詞集合用于記錄對所述字段信息進行拆分后得到的分詞詞條。
15.根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述匹配模塊包括:
第一子獲取模塊,用于獲取預(yù)先設(shè)置的非法關(guān)鍵詞集合;
第二子獲取模塊,用于獲取與所述非法關(guān)鍵詞集合中各非法關(guān)鍵詞對應(yīng)的權(quán)重值;
子匹配模塊,用于將所述分詞集合中的所述分詞詞條,分別與所述非法關(guān)鍵詞集合中的非法關(guān)鍵詞進行匹配,得到匹配結(jié)果;
子運算模塊,用于根據(jù)與所述非法關(guān)鍵詞對應(yīng)的權(quán)重值與所述匹配結(jié)果進行加權(quán)運算,得到所述字段信息的字段權(quán)重;
第一比對模塊,用于將所述字段權(quán)重與預(yù)先設(shè)置的第二閾值進行比對,確定所述圖像信息是否為包含所述非法字段的所述非法圖像。
16.根據(jù)權(quán)利要求13所述的裝置,其特征在于,當(dāng)所述顏色通道為彩色通道時,其中,所述第一提取模塊包括:
子修正模塊,用于通過對所述圖像信息中像素點的RGB顏色值進行修正處理,得到與所述像素點對應(yīng)的預(yù)處理顏色值,其中,所述預(yù)處理顏色值中包括:紅色值、綠色值、藍色值和黃色值;
第一子確定模塊,用于根據(jù)所述預(yù)處理顏色值和所述像素點的位置信息,確定所述像素點在所述彩色通道中的第一像素特征值,其中,所述第一像素特征值與彩色通道對應(yīng);
第一子提取模塊,用于根據(jù)所述第一像素特征值,對所述圖像信息進行提取處理,得到與所述彩色通道對應(yīng)的所述區(qū)域特征值。
17.根據(jù)權(quán)利要求13所述的裝置,其特征在于,當(dāng)所述顏色通道為灰度通道時,其中,所述第一提取模塊還包括:
第三子獲取模塊,用于獲取預(yù)先設(shè)置的計算參數(shù);
第二子確定模塊,用于根據(jù)所述圖像信息中像素點的RGB顏色值、所述像素點的位置信息和所述計算參數(shù),確定所述像素點在所述灰度通道中的第二像素特征值,其中,所述第二像素特征值與所述灰度通道對應(yīng);
第二子提取模塊,用于根據(jù)所述第二像素特征值對所述圖像信息進行提取處理,得到與所述灰度通道對應(yīng)的所述區(qū)域特征值。
18.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述篩選模塊包括:
子比對模塊,用于將與所述顏色通道對應(yīng)的所述區(qū)域特征值分別與所述第一閾值進行比對,得到比對結(jié)果;
第三子確定模塊,用于根據(jù)所述比對結(jié)果,確定所述圖像信息中與所述顏色通道對應(yīng)的所述文本區(qū)域。
19.根據(jù)權(quán)利要求18所述的裝置,其特征在于,當(dāng)所述圖像信息中包括至少兩個所述文本區(qū)域時,所述裝置還包括:
第一獲取模塊,用于獲取所述文本區(qū)域在所述圖像信息中的相對位置信息;
第一確定模塊,用于根據(jù)所述文本區(qū)域的所述區(qū)域特征值,確定與所述文本區(qū)域?qū)?yīng)的顏色通道信息;
第二確定模塊,用于根據(jù)所述相對位置信息和所述顏色通道信息,確定所述文本區(qū)域之間的關(guān)聯(lián)關(guān)系;
合并模塊,用于將具有所述關(guān)聯(lián)關(guān)系的文本區(qū)域合并為新文本區(qū)域。
20.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述識別模塊包括:
子處理模塊,用于按照預(yù)定方向?qū)λ鑫谋緟^(qū)域進行投影處理,得到與所述方向?qū)?yīng)的所述文本區(qū)域的投影結(jié)果,其中,所述投影處理為沿預(yù)定方向?qū)λ鑫谋緟^(qū)域中每個區(qū)間內(nèi)的像素密度進行統(tǒng)計處理,得到與所述方向?qū)?yīng)的像素密度的分布結(jié)果;
第四子確定模塊,用于根據(jù)所述投影結(jié)果確定所述文本區(qū)域中的文字走向;
子分割模塊,用于根據(jù)所述文字走向和所述投影結(jié)果對所述文本區(qū)域進行順序分割,分割得到子字符區(qū)域,其中,每個所述子字符區(qū)域包含一個字符;
第一子識別模塊,用于通過字符識別引擎對所述子字符區(qū)域中的字符進行識別,確定與所述子字符區(qū)域?qū)?yīng)的識別結(jié)果;
子生成模塊,用于根據(jù)所述文字走向和所述識別結(jié)果,生成所述字段信息。
21.根據(jù)權(quán)利要求20所述的裝置,其特征在于,所述子識別模塊包括:
第二子識別模塊,用于通過所述字符識別引擎對所述子字符區(qū)域進行識別,得到與所述子字符區(qū)域?qū)?yīng)的初始識別結(jié)果,其中,所述初始識別結(jié)果中至少包括一個備選字符和與所述備選字符對應(yīng)的置信度;
第五子確定模塊,用于根據(jù)所述置信度,從所述初始識別結(jié)果中確定所述置信度最高的預(yù)定數(shù)量的備選字符作為所述識別結(jié)果。
22.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述裝置還包括:
第二獲取模塊,用于獲取預(yù)先設(shè)置的第一圖像特征向量,其中,所述第一圖像特征向量用于表征特定類型圖像的圖像特征;
第二提取模塊,用于對所述非法圖像進行特征向量提取,得到第二圖像特征向量;
第二比對模塊,用于將所述第二圖像特征向量與所述第一圖像特征向量進行比對,確定所述非法圖像的圖像類型,其中,所述圖像類型至少包括:聊天截圖、非聊天截圖。
23.根據(jù)權(quán)利要求13至22中任意一項所述的裝置,其特征在于,所述裝置還包括:
第三獲取模塊,用于獲取所述圖像信息的圖像分別率;
第三比對模塊,用于將所述圖像分別率與預(yù)先設(shè)置的標準圖像分辨率進行比對;
縮放模塊,用于當(dāng)所述圖像分別率不等于所述標準圖像分辨率時,對所述圖像信息按所述標準圖像分辨率進行等比例縮放。