本申請(qǐng)涉及互聯(lián)網(wǎng)領(lǐng)域,具體而言,涉及一種圖像的識(shí)別方法及裝置。
背景技術(shù):
::隨著電子商務(wù)的發(fā)展,炒信、欺詐等非法行為也趁機(jī)悄然滋生,此類違背誠(chéng)信的虛假行為嚴(yán)重影響了電子商務(wù)的健康發(fā)展。例如,在淘寶、天貓等平臺(tái)中,為了規(guī)避文本規(guī)則的管控,以圖片作為信息載體的比重逐年增加。相比于單純的文本信息,對(duì)于嵌入圖片乃至視頻中的文本信息的提取具有較大的技術(shù)難度,其具有較大的技術(shù)難度的主要有以下兩個(gè)原因:1.圖片樣式的多樣性;2.文字嵌入樣式的多樣性。在現(xiàn)有技術(shù)中,對(duì)于帶有嵌入文字的圖片進(jìn)行識(shí)別方法分為兩類:第一類為利用以圖比圖的方法對(duì)嵌入文字進(jìn)行識(shí)別。通過標(biāo)注一定數(shù)量的嵌入文字的圖片樣本,并提取圖片樣本的圖像特征作為圖像指紋,利用圖像指紋計(jì)算圖片與圖片樣本之間的相似度來進(jìn)行圖片的識(shí)別。通過以圖比圖的方法對(duì)嵌入文字的圖片進(jìn)行識(shí)別是一種較為簡(jiǎn)單的防控方法,但是,主要存在如下問題:1、通過以圖比圖的方法對(duì)圖片進(jìn)行識(shí)別,其識(shí)別圖片的范圍受到圖片樣本庫(kù)范圍的限制,對(duì)于采用新的文字嵌入方式的圖片只能通過人工在對(duì)該類圖片審核之后,將該類圖片添加進(jìn)圖片樣本庫(kù)的方法來保證算法準(zhǔn)確,操作較為復(fù)雜,并且不能保證時(shí)效性。2、在嵌入文字的圖片中,存在很多背景相同但是嵌入的文字不同的圖片,通過意圖比圖的方法,很難區(qū)分出此類文件,導(dǎo)致識(shí)別圖片的識(shí)別精度低。第二類為利用自然場(chǎng)景OCR方法對(duì)嵌入文字進(jìn)行識(shí)別。利用自然場(chǎng)景OCR技術(shù)對(duì)圖片中的文字信息進(jìn)行識(shí)別的方法,是一種較為有效的方法,但是存在如下問題:1、嵌入文字的圖片可以選擇任意圖片作為背景,因在某些自然場(chǎng)景的圖片中,通常包含了固有的文字內(nèi)容,例如圖片中的門牌號(hào)、車牌號(hào)等,而嵌入1文字的方式又多種多樣,通過現(xiàn)有的自然場(chǎng)景OCR的識(shí)別方法很難對(duì)嵌入圖片文字與圖片自然場(chǎng)景中固有的文字內(nèi)容進(jìn)行區(qū)分。2、包含自然場(chǎng)景的圖片具有一定的方向性,通常圖片中固有的文字內(nèi)容的主軸方向與圖片自然場(chǎng)景的主軸方向相同。但是,用于嵌入圖片的文字,在圖片上可以以各種方向進(jìn)行嵌入,單純利用主軸對(duì)嵌入圖片中的文字進(jìn)行區(qū)分,難以達(dá)到識(shí)別效果。3、在嵌入文字的圖片中,因嵌入文字的字體大小、筆畫寬度等都多種多樣,所以導(dǎo)致以標(biāo)注字庫(kù)訓(xùn)練的識(shí)別引擎無(wú)法進(jìn)行識(shí)別。4、利用語(yǔ)義模型進(jìn)行文本信息優(yōu)選的方式也因準(zhǔn)確率較低,難以滿足特定類型文本圖片識(shí)別的要求。5.不同的自然場(chǎng)景對(duì)于識(shí)別算法一般都有著特定的要求,使用單一的自然場(chǎng)景OCR算法以及關(guān)鍵詞匹配算法很難保證算法的總體準(zhǔn)確率。針對(duì)上述由于受圖像信息的背景內(nèi)容的影響,導(dǎo)致的對(duì)圖像信息中的文字信息識(shí)別準(zhǔn)確率低的問題,目前尚未提出有效的解決方案。申請(qǐng)內(nèi)容本申請(qǐng)實(shí)施例提供了一種圖像的識(shí)別方法及裝置,以至少解決現(xiàn)有技術(shù)中由于受圖像信息的背景內(nèi)容的影響,導(dǎo)致的對(duì)圖像信息中的文字信息識(shí)別準(zhǔn)確率低的的技術(shù)問題。根據(jù)本申請(qǐng)實(shí)施例的一個(gè)方面,提供了一種圖像的識(shí)別方法,包括:按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值;根據(jù)區(qū)域特征值與預(yù)先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域;對(duì)圖像信息中的文本區(qū)域進(jìn)行文字識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息;將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像。根據(jù)本申請(qǐng)實(shí)施例的另一方面,還提供了一種圖像的識(shí)別裝置,包括:第一提取模塊,用于按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值;篩選模塊,用于根據(jù)區(qū)域特征值與預(yù)先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域;識(shí)別模塊,用于對(duì)圖像信息中的文本區(qū)域進(jìn)行文字識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息;匹配模塊,用于將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像。在本申請(qǐng)實(shí)施例中,采用按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值;根據(jù)區(qū)域特征值與預(yù) 先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域;對(duì)圖像信息中的文本區(qū)域進(jìn)行文字識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息;將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像的方式,通過第一提取模塊,用于按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值;篩選模塊,用于根據(jù)區(qū)域特征值與預(yù)先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域;識(shí)別模塊,用于對(duì)圖像信息中的文本區(qū)域進(jìn)行文字識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息;匹配模塊,用于將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像,達(dá)到了對(duì)圖像信息中在各種場(chǎng)景下的文字信息的進(jìn)行識(shí)別的目的,從而實(shí)現(xiàn)了提升對(duì)圖像信息中的文字信息進(jìn)行識(shí)別的準(zhǔn)確率的技術(shù)效果,進(jìn)而解決了現(xiàn)有技術(shù)中由于受圖像信息的背景內(nèi)容的影響,導(dǎo)致的對(duì)圖像信息中的文字信息識(shí)別準(zhǔn)確率低的的技術(shù)問題。附圖說明此處所說明的附圖用來提供對(duì)本申請(qǐng)的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本申請(qǐng)的示意性實(shí)施例及其說明用于解釋本申請(qǐng),并不構(gòu)成對(duì)本申請(qǐng)的不當(dāng)限定。在附圖中:圖1是根據(jù)本申請(qǐng)實(shí)施例的一種圖像的識(shí)別方法的移動(dòng)終端的硬件結(jié)構(gòu)框圖;圖2是根據(jù)本申請(qǐng)實(shí)施例的一種圖像的識(shí)別方法的流程示意圖;圖3是根據(jù)本申請(qǐng)實(shí)施例的一種可選的圖像的識(shí)別方法的流程示意圖;圖4是根據(jù)本申請(qǐng)實(shí)施例的一種可選的圖像的識(shí)別方法的流程示意圖;圖5是根據(jù)本申請(qǐng)實(shí)施例的一種圖像的識(shí)別裝置的結(jié)構(gòu)示意圖;圖6是根據(jù)本申請(qǐng)實(shí)施例的一種可選的圖像的識(shí)別裝置的結(jié)構(gòu)示意圖;圖7是根據(jù)本申請(qǐng)實(shí)施例的一種可選的圖像的識(shí)別裝置的結(jié)構(gòu)示意圖;圖8是根據(jù)本申請(qǐng)實(shí)施例的一種可選的圖像的識(shí)別裝置的第一提取模塊的結(jié)構(gòu)示意圖;圖9是根據(jù)本申請(qǐng)實(shí)施例的一種可選的圖像的識(shí)別裝置的第一提取模塊的結(jié)構(gòu)示意圖;圖10是根據(jù)本申請(qǐng)實(shí)施例的一種可選的圖像的識(shí)別裝置的結(jié)構(gòu)示意圖;圖11是根據(jù)本申請(qǐng)實(shí)施例的一種可選的圖像的識(shí)別裝置的結(jié)構(gòu)示意圖;圖12是根據(jù)本申請(qǐng)實(shí)施例的一種可選的圖像的識(shí)別裝置的識(shí)別模塊的結(jié)構(gòu)示意圖;圖13是根據(jù)本申請(qǐng)實(shí)施例的一種可選的圖像的識(shí)別裝置的結(jié)構(gòu)示意圖;以及圖14是根據(jù)本申請(qǐng)實(shí)施例的一種可選的圖像的識(shí)別裝置的結(jié)構(gòu)示意圖。具體實(shí)施方式為了使本
技術(shù)領(lǐng)域:
:的人員更好地理解本申請(qǐng)方案,下面將結(jié)合本申請(qǐng)實(shí)施例中的附圖,對(duì)本申請(qǐng)實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本申請(qǐng)一部分的實(shí)施例,而不是全部的實(shí)施例?;诒旧暾?qǐng)中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本申請(qǐng)保護(hù)的范圍。需要說明的是,本申請(qǐng)的說明書和權(quán)利要求書及上述附圖中的術(shù)語(yǔ)“第一”、“第二”等是用于區(qū)別類似的對(duì)象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的數(shù)據(jù)在適當(dāng)情況下可以互換,以便這里描述的本申請(qǐng)的實(shí)施例能夠以除了在這里圖示或描述的那些以外的順序?qū)嵤?。此外,術(shù)語(yǔ)“包括”和“具有”以及他們的任何變形,意圖在于覆蓋不排他的包含,例如,包含了一系列步驟或單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于清楚地列出的那些步驟或單元,而是可包括沒有清楚地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它步驟或單元。實(shí)施例1根據(jù)本申請(qǐng)實(shí)施例,還提供了一種圖像的識(shí)別方法的方法實(shí)施例,需要說明的是,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。本申請(qǐng)實(shí)施例一所提供的方法實(shí)施例可以在移動(dòng)終端、計(jì)算機(jī)終端或者類似的運(yùn)算裝置中執(zhí)行。以運(yùn)行在計(jì)算機(jī)終端上為例,圖1是本申請(qǐng)實(shí)施例的一種圖像的識(shí)別方法的計(jì)算機(jī)終端的硬件結(jié)構(gòu)框圖。如圖1所示,計(jì)算機(jī)終端10可以包括一個(gè)或多個(gè)(圖中僅示出一個(gè))處理器102(處理器102可以包括但不限于微處理器MCU或可編程邏輯器件FPGA等的處理裝置)、用于存儲(chǔ)數(shù)據(jù)的存儲(chǔ)器104、以及用于通信功能的傳輸模塊106。本領(lǐng)域普通技術(shù)人員可以理解,圖1所示的結(jié)構(gòu)僅為示意,其并不對(duì) 上述電子裝置的結(jié)構(gòu)造成限定。例如,計(jì)算機(jī)終端10還可包括比圖1中所示更多或者更少的組件,或者具有與圖1所示不同的配置。存儲(chǔ)器104可用于存儲(chǔ)應(yīng)用軟件的軟件程序以及模塊,如本申請(qǐng)實(shí)施例中的圖像的識(shí)別方法對(duì)應(yīng)的程序指令/模塊,處理器102通過運(yùn)行存儲(chǔ)在存儲(chǔ)器104內(nèi)的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,即實(shí)現(xiàn)上述的應(yīng)用程序的圖像的識(shí)別方法。存儲(chǔ)器104可包括高速隨機(jī)存儲(chǔ)器,還可包括非易失性存儲(chǔ)器,如一個(gè)或者多個(gè)磁性存儲(chǔ)裝置、閃存、或者其他非易失性固態(tài)存儲(chǔ)器。在一些實(shí)例中,存儲(chǔ)器104可進(jìn)一步包括相對(duì)于處理器102遠(yuǎn)程設(shè)置的存儲(chǔ)器,這些遠(yuǎn)程存儲(chǔ)器可以通過網(wǎng)絡(luò)連接至計(jì)算機(jī)終端10。上述網(wǎng)絡(luò)的實(shí)例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動(dòng)通信網(wǎng)及其組合。傳輸裝置106用于經(jīng)由一個(gè)網(wǎng)絡(luò)接收或者發(fā)送數(shù)據(jù)。上述的網(wǎng)絡(luò)具體實(shí)例可包括計(jì)算機(jī)終端10的通信供應(yīng)商提供的無(wú)線網(wǎng)絡(luò)。在一個(gè)實(shí)例中,傳輸裝置106包括一個(gè)網(wǎng)絡(luò)適配器(NetworkInterfaceController,NIC),其可通過基站與其他網(wǎng)絡(luò)設(shè)備相連從而可與互聯(lián)網(wǎng)進(jìn)行通訊。在一個(gè)實(shí)例中,傳輸裝置106可以為射頻(RadioFrequency,RF)模塊,其用于通過無(wú)線方式與互聯(lián)網(wǎng)進(jìn)行通訊。在上述運(yùn)行環(huán)境下,本申請(qǐng)?zhí)峁┝巳鐖D2所示的圖像的識(shí)別方法。圖2是根據(jù)本申請(qǐng)實(shí)施例一的圖像的識(shí)別方法的流程圖。其中,該方法包括:步驟S21,按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值。具體的,每個(gè)圖像信息都是由通過基礎(chǔ)顏色進(jìn)行疊加而成的像素點(diǎn)組成。因此,在每個(gè)與基礎(chǔ)顏色對(duì)應(yīng)的顏色通道中,都存放著圖像信息中與其對(duì)應(yīng)的顏色元素的信息。在對(duì)圖像信息進(jìn)行顯示時(shí),通過對(duì)所有顏色通道中的顏色進(jìn)行疊加混合,從而得到圖像信息中的每個(gè)像素點(diǎn)的顏色。每個(gè)圖像信息的顏色通道數(shù)量取決于圖像信息的基礎(chǔ)顏色的數(shù)量。而圖像信息的基礎(chǔ)顏色的數(shù)量,取決于圖像信息的顏色模式。例如,顏色模式為CMYK的圖像信息,具有4個(gè)與基礎(chǔ)顏色對(duì)應(yīng)的顏色通道,分別為青色通道、洋紅通道、黃色通道和黑色通道;顏色模式為位圖模式、灰度模式、雙色調(diào)模式和索引顏色模式的圖像信息,在默認(rèn)情況下具有1個(gè)顏色通道。顏色模式為RGB模式和Lab模式的圖像的信息具有3個(gè)顏色通道。在步驟S21中,分別在圖像信息的每個(gè)顏色通道對(duì)其進(jìn)行區(qū)域特征值提取處理,從而得到與每個(gè)顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值。其中,區(qū)域特征值提取處理, 是在通過對(duì)圖像中的像素點(diǎn)的顏色值、像素點(diǎn)位置,對(duì)與各個(gè)顏色通道對(duì)應(yīng)的圖像信息進(jìn)行分割后,通過計(jì)算得到與各個(gè)顏色通道對(duì)應(yīng)的每個(gè)區(qū)域的區(qū)域特征值。在實(shí)際應(yīng)用當(dāng)中,因?yàn)轭伾J讲煌?,從而?dǎo)致顏色通道數(shù)量不同。因此,為了便于處理,所以可以在對(duì)圖像信息進(jìn)行區(qū)域特征值提取處理之前,先對(duì)圖像信息的顏色模式進(jìn)行統(tǒng)一化處理。將圖像信息統(tǒng)一轉(zhuǎn)換為RGB模式,然后再對(duì)其進(jìn)行后續(xù)區(qū)域特征值提取處理。其中,區(qū)域特征值的提取算法,可以為MSER(MaximallyStableExtremeRegion)最大穩(wěn)定極值區(qū)域算法來實(shí)現(xiàn),具體方法此處不做贅述。步驟S23,根據(jù)區(qū)域特征值與預(yù)先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域。具體的,在確定第一閾值時(shí),可以利用區(qū)域特征值的提取算法,對(duì)各類帶有文字的圖像信息進(jìn)行區(qū)域特征值提取處理。通過對(duì)帶有文字的區(qū)域的區(qū)域特征值進(jìn)行統(tǒng)計(jì),從而得到用于確定圖像信息中文本區(qū)域的第一閾值。其中,第一閾值用于對(duì)與每個(gè)顏色通道對(duì)應(yīng)圖像信息中的各個(gè)區(qū)域進(jìn)行判斷,通過判斷,確認(rèn)當(dāng)前區(qū)域是否為文本區(qū)域。在步驟S23中,分別將圖像信息的與各個(gè)顏色通道對(duì)應(yīng)的區(qū)域特征值與第一閾值進(jìn)行比對(duì),通過比對(duì)在各個(gè)顏色通道中篩選出包含有文字信息的文本區(qū)域。在實(shí)際應(yīng)用當(dāng)中,圖像信息中的文字信息,通常是以一個(gè)詞組或者一個(gè)短語(yǔ)出現(xiàn)的。在制作帶有文字信息的圖像信息時(shí),為了便于用戶對(duì)詞組或者短語(yǔ)進(jìn)行識(shí)別,通常會(huì)在一個(gè)詞組或者短語(yǔ)中,使用相同大小、字體、樣式的文字,并且以符合閱讀習(xí)慣的排列方式進(jìn)行排布。例如,文字以從左到右排布、從上到下排布等。人們?cè)趯?duì)圖像信息中的文字進(jìn)行識(shí)別時(shí),通常會(huì)對(duì)于文字的字體、文字的大小、文字的字體樣式以及排列方式較為敏感。往往通過字體的大小、字體、樣式以及排列方式,即可判斷出圖像中出現(xiàn)的文字之間的邏輯關(guān)系。人們?cè)谧R(shí)別圖像信息中的文字時(shí),通常不會(huì)受到文字顏色的干擾。但是對(duì)于計(jì)算機(jī)而言,文字顏色的變化往往會(huì)造成識(shí)別上的障礙。因此,可以在對(duì)文本區(qū)域進(jìn)行篩選時(shí),將各個(gè)顏色通道的通過第一閾值篩選得到的文本區(qū)域,統(tǒng)一的只根據(jù)文字的大小、字體、樣式進(jìn)行關(guān)聯(lián),從而避免文字顏色的干擾。步驟S25,對(duì)圖像信息中的文本區(qū)域進(jìn)行文字識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息。在步驟S25中,通過文字識(shí)別引擎對(duì)文本區(qū)域中的文字依次進(jìn)行識(shí)別,從而得到與文本區(qū)域?qū)?yīng)的字段信息。其中,文字識(shí)別引擎,可以是為每種字體通過單獨(dú)訓(xùn)練得到的專門用于識(shí)別特定字體的文字識(shí)別引擎,也可以是可以對(duì)所有字體進(jìn)行識(shí)別的通用文字識(shí)別引擎。當(dāng)文字識(shí)別引擎為專門用于識(shí)別特定字體的文字識(shí)別引擎時(shí),利用每種文字識(shí)別引擎對(duì)文文本區(qū)域中的文字進(jìn)行識(shí)別,從而獲取置信度最高的預(yù)設(shè)數(shù)量的識(shí)別結(jié)果作為文字識(shí)別結(jié)果。其中,預(yù)定數(shù)量可以為5個(gè)。將通過文字識(shí)別引擎識(shí)別得到的文字,按照位置關(guān)系進(jìn)行排列,得到與文本區(qū)域?qū)?yīng)的字段信息。除此之外,還可以通過排列組合的方式,對(duì)識(shí)別得到的單個(gè)文字進(jìn)行組合,得到若干個(gè)與文本區(qū)域?qū)?yīng)的字段信息。步驟S27,將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像。在步驟S27,將上述通過文字識(shí)別引擎得到的與文本區(qū)域?qū)?yīng)的字段信息,分別與預(yù)先設(shè)置的非法關(guān)鍵詞集合中的非法關(guān)鍵詞依次進(jìn)行匹配,當(dāng)字段信息與非法關(guān)鍵詞集合中的非法關(guān)鍵詞匹配時(shí),則確定圖像信息為包含有非法字段信息的非法圖像。當(dāng)然,還可以通過對(duì)非法關(guān)鍵詞集合中的非法關(guān)鍵詞設(shè)置權(quán)重值,當(dāng)將上述字段信息與非法關(guān)鍵詞中的非法關(guān)鍵詞進(jìn)行匹配后,對(duì)匹配結(jié)果進(jìn)行加權(quán)運(yùn)算。當(dāng)與圖像信息的權(quán)重值超過預(yù)先設(shè)置的預(yù)制時(shí),則確認(rèn)圖像信息為包含非法字段信息的非法圖像。通過上述步驟S21至步驟S27,分別按照顏色通道,提取得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值。根據(jù)第一閾值對(duì)區(qū)域特征值進(jìn)行篩選,確定圖像信息中的文本區(qū)域。然后,通過文字識(shí)別引擎對(duì)文本區(qū)域中的文字進(jìn)行識(shí)別,并將識(shí)別得到的文字與預(yù)先設(shè)置的非法字段進(jìn)行匹配,來確定圖像信息是否為包含有非法字段的非法圖像。通過上述方法,達(dá)到了對(duì)圖像信息中在各種場(chǎng)景下的文字信息的進(jìn)行識(shí)別的目的,從而實(shí)現(xiàn)了提升對(duì)圖像信息中的文字信息進(jìn)行識(shí)別的準(zhǔn)確率的技術(shù)效果,解決了現(xiàn)有技術(shù)中由于受圖像信息的背景內(nèi)容的影響,導(dǎo)致的對(duì)圖像信息中的文字信息識(shí)別準(zhǔn)確率低的技術(shù)問題。作為一種可選的實(shí)施方式,如圖3所示,在步驟S27將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像之前,方法還可以包括:步驟S26,按照預(yù)先設(shè)置的分詞規(guī)則對(duì)字段信息進(jìn)行拆分,得到與字段信息對(duì)應(yīng)的分詞集合,其中,分詞集合用于記錄對(duì)字段信息進(jìn)行拆分后得到的分詞詞條。具體的,通過步驟S26,對(duì)通過識(shí)別得到的字段信息,進(jìn)行分詞處理。通過分詞處理可以將字段信息中的詞組拆分成若干個(gè)具有新的意思的新分詞分詞條。將通過分詞處理得到的新分詞詞條組合成為與圖片信息對(duì)應(yīng)的分詞集合。在實(shí)際應(yīng)用當(dāng)中,分詞處理方法通??煞譃槿箢悾夯谧址ヅ涞姆衷~處理方法、基于理解的分詞處理方法和基于統(tǒng)計(jì)的分詞處理方法,具體的分詞處理方法不做贅述。此處,可以先利用上述分詞處理方法,將識(shí)別得到的字段信息進(jìn)行分詞處理。然后在保留字段信息中原有的分詞詞條的同時(shí),將字段信息中的分詞詞條拆分成若干個(gè)二元詞,例如:一個(gè)三元詞生成兩個(gè)二元詞,通過對(duì)所有二元詞中的文字進(jìn)行排列組合,混合成新的二元詞。將利用上述方法拆分后得到的分詞詞條組合成為與圖像信息對(duì)應(yīng)的分詞集合。作為一種可選的實(shí)施方式,在對(duì)字段信息進(jìn)行分詞處理之前,可以預(yù)先對(duì)需要管控的圖片信息中的字段信息進(jìn)行標(biāo)注,并將標(biāo)注出的字段信息進(jìn)行保存,生成用于判斷圖像信息是否為非法圖像的非法關(guān)鍵詞集合。作為一種可選的實(shí)施方式,在步驟S27將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像中,可以包括:步驟S271,獲取預(yù)先設(shè)置的非法關(guān)鍵詞集合。步驟S273,獲取與非法關(guān)鍵詞集合中各非法關(guān)鍵詞對(duì)應(yīng)的權(quán)重值。步驟S275,將分詞集合中的分詞詞條,分別與非法關(guān)鍵詞集合中的非法關(guān)鍵詞進(jìn)行匹配,得到匹配結(jié)果。步驟S277,根據(jù)與非法關(guān)鍵詞對(duì)應(yīng)的權(quán)重值與匹配結(jié)果進(jìn)行加權(quán)運(yùn)算,得到字段信息的字段權(quán)重。步驟S279,將字段權(quán)重與預(yù)先設(shè)置的第二閾值進(jìn)行比對(duì),確定圖像信息是否為包含非法字段的非法圖像。具體的,通過步驟S271至步驟S279,將通過分詞處理得到的與圖像信息對(duì)應(yīng)的分詞信息,與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,并對(duì)通過匹配的到的匹配結(jié)果進(jìn)行加權(quán)計(jì)算,得到與圖像信息中包含的字段信息對(duì)應(yīng)的字段權(quán)重。通過將字段權(quán)重與預(yù)先設(shè)置的用于判斷是否為非法圖像的第二閾值進(jìn)行比對(duì),確定上述圖像信息是否為非法圖像。在實(shí)際應(yīng)用當(dāng)中,文字在不同的語(yǔ)境之下所包含的意思也不盡相同。因此,通常并不能通過圖像信息中是否包含了某個(gè)被認(rèn)為是非法的關(guān)鍵詞,而判定該圖像信息就是非法圖像。因此,可以對(duì)非法關(guān)鍵詞集合中的各個(gè)非法關(guān)鍵詞設(shè)置權(quán)重值。通過將圖像信息中包含的分詞詞條依次與非法關(guān)鍵詞集合中的非法關(guān)鍵詞進(jìn)行匹配,并根據(jù)匹配結(jié)果計(jì)算得到與該圖像信息對(duì)應(yīng)的字段權(quán)重值,來確定圖像信息是否為非法圖像。從而提高對(duì)非法圖像識(shí)別的準(zhǔn)確率。具體的,可以將通過分詞處理得到的分詞,直接通過與非法關(guān)鍵詞庫(kù)進(jìn)行匹配,利用匹配后的結(jié)果生成一維向量,并輸入關(guān)鍵詞模型進(jìn)行打分,當(dāng)分?jǐn)?shù)高于閾值時(shí),判定圖像信息為非法圖像并輸出判定結(jié)果。作為一種可選的實(shí)施方式,上述顏色通道可以包括:彩色通道和灰度通道,其中,彩色通道至少包括:紅色通道、綠色通道、藍(lán)色通道和黃色通道,灰度通道至少包括:黑色通道、白色通道。具體的,每個(gè)圖像信息可以具有一個(gè)或多個(gè)顏色通道,每個(gè)顏色通道都存放著圖像信息中顏色信息,通過將各個(gè)通道中的顏色信息進(jìn)行疊加混合,產(chǎn)生圖像信息中每個(gè)像素的顏色。因此,為了提高對(duì)圖像信息中的文本區(qū)域進(jìn)行識(shí)別的準(zhǔn)確率,可以從圖像信息中提取出特定的顏色通道,并對(duì)每個(gè)顏色通道中的文本區(qū)域分別進(jìn)行提取。作為一種可選的實(shí)施方式,當(dāng)顏色通道為彩色通道時(shí),其中,在步驟S21按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值中,可以包括:步驟S211,通過對(duì)圖像信息中像素點(diǎn)的RGB顏色值進(jìn)行修正處理,得到與像素點(diǎn)對(duì)應(yīng)的預(yù)處理顏色值,其中,預(yù)處理顏色值中包括:紅色值、綠色值、藍(lán)色值和黃色值。步驟S212,根據(jù)預(yù)處理顏色值和像素點(diǎn)的位置信息,確定像素點(diǎn)在彩色通道中的第一像素特征值,其中,第一像素特征值與彩色通道對(duì)應(yīng)。步驟S213,根據(jù)第一像素特征值,對(duì)圖像信息進(jìn)行提取處理,得到與彩色通道對(duì)應(yīng)的區(qū)域特征值。具體的,通過步驟S211至步驟S213,對(duì)圖像信息中彩色的顏色通道進(jìn)行區(qū)域特征值進(jìn)行提取。首先,對(duì)圖像信息的彩色的顏色通道進(jìn)行像素特征值的提取處理,得到在圖像信息中的每個(gè)像素點(diǎn)分別在每個(gè)彩色的顏色通道中的像素特征值。然后,根據(jù)在每個(gè)彩色通道中的像素特征值,對(duì)圖像信息進(jìn)行區(qū)域特征值的提取處理,最終得到與每個(gè)彩色的顏色通道對(duì)應(yīng)的區(qū)域特征值。在實(shí)際應(yīng)用當(dāng)中,對(duì)于顏色通道進(jìn)行提取的提取步驟如下:首先,利用修正公式對(duì)圖像信息中的原始顏色值進(jìn)行修正處理,得到修正后的修正顏色值:其中,r、g、b為圖像信息中用于表示像素顏色的三個(gè)原始顏色,r、g、b分別代表紅色、綠色、藍(lán)色;R、G、B、Y為對(duì)r、g、b三個(gè)原始顏色進(jìn)行修正處理后得到的四個(gè)修正顏色,R、G、B、Y分別代表修正后的紅色、綠色、藍(lán)色、黃色。進(jìn)一步的,分別對(duì)RG、GR、BY、YB四個(gè)彩色的顏色通道,采用MSER提取算法進(jìn)行提取處理,其中,通過MSER提取算法對(duì)圖像信息進(jìn)行提取的描述如下:步驟1,多顏色通道提?。悍謩e對(duì)RG、GR、BY、YB四個(gè)彩色的顏色通道進(jìn)行提取處理,其描述如下:RG、GR、BY、YB、為選取的四個(gè)彩色的顏色通道,(x,y)為像素點(diǎn)在圖像信息中的位置信息。步驟2,有序像素集合確定:本申請(qǐng)選用分割閾值(像素值)為8,對(duì)圖像信息的每個(gè)顏色通道進(jìn)行分割,即得到Scolor={0,7,15,...,255}。步驟3,確定候選區(qū)域:在對(duì)四個(gè)彩色的顏色通道按照有序像素集合進(jìn)行分割后,將有序像素集合中顏色數(shù)值大于預(yù)先設(shè)置的顏色閾值的與分割像素對(duì)應(yīng)的區(qū)域選定為候選區(qū)域。步驟4,從候選區(qū)域中提取聯(lián)通區(qū)域:聯(lián)通區(qū)域即在候選區(qū)域周圍8個(gè)相鄰的區(qū)域,每一個(gè)分割閾值會(huì)產(chǎn)生多個(gè)區(qū)域,假設(shè)總共區(qū)域個(gè)數(shù)為n;那么聯(lián)通區(qū)域集合可以表示為:RG(Rl)=(Rl,Rl+1,...,Rl+n),GR(Rl)=(Rl,Rl+1,...,Rl+n),BY(Rl)=(Rl,Rl+1,...,Rl+n),YB(Rl)=(Rl,Rl+1,...,Rl+n),其中,l用于表征分割閾值,Rl用于表征在有序像素集合中,所對(duì)應(yīng)的區(qū)域信息。步驟5,計(jì)算區(qū)域變化程度:區(qū)域變化程度描述如下:其中,在||絕對(duì)值符號(hào)內(nèi)代表計(jì)算區(qū)域內(nèi)的像素個(gè)數(shù)。步驟6,提取各顏色通道MSER區(qū)域:當(dāng)Rl滿足以下條件時(shí),則為需要通過MSER提取算法進(jìn)行提取的區(qū)域:v(Rl)<v(Rl-1)&v(Rl)<v(Rl+1);通過提取得到的區(qū)域特征值,與各個(gè)顏色通道相互對(duì)應(yīng)。作為一種可選的實(shí)施方式,當(dāng)顏色通道為灰度通道時(shí),其中,在步驟S21按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng) 的各個(gè)區(qū)域的區(qū)域特征值中,步驟還可以包括:步驟S214,獲取預(yù)先設(shè)置的計(jì)算參數(shù)。步驟S215,根據(jù)圖像信息中像素點(diǎn)的RGB顏色值、像素點(diǎn)的位置信息和計(jì)算參數(shù),確定像素點(diǎn)在灰度通道中的第二像素特征值,其中,第二像素特征值與彩色通道對(duì)應(yīng)。步驟S216,根據(jù)第二像素特征值對(duì)圖像信息進(jìn)行提取處理,得到與灰度通道對(duì)應(yīng)的區(qū)域特征值。具體的,在對(duì)圖像信息的彩色通道進(jìn)行提取處理之外,還可以對(duì)圖像信息的灰度通道進(jìn)行提取處理。具體的,通過步驟S214至步驟S216,對(duì)圖像信息中灰度通道進(jìn)行區(qū)域特征值進(jìn)行提取。首先,對(duì)圖像信息的灰度通道進(jìn)行像素特征值的提取處理,得到在圖像信息中的每個(gè)像素點(diǎn)分別在各個(gè)灰度顏色通道中的像素特征值。然后,根據(jù)在每個(gè)灰度通道中的像素特征值,對(duì)圖像信息進(jìn)行區(qū)域特征值的提取處理,最終得到與每個(gè)灰度通道對(duì)應(yīng)的區(qū)域特征值。在實(shí)際應(yīng)用當(dāng)中,對(duì)于灰度通道進(jìn)行提取的提取步驟如下:首先,獲取預(yù)先設(shè)置的試驗(yàn)參數(shù)α,β,γ,其中,實(shí)驗(yàn)參數(shù)需要滿足如下約束:0≤α,β,γ≤1,且α+β+γ=1。在獲取到預(yù)先設(shè)置的試驗(yàn)參數(shù)α,β,γ后,分別生成黑色通道和白色通道,其描述如下:W(x,y)=255-(α×r(x,y)+β×g(x,y)+γ×b(x,y));B(x,y)=α×r(x,y)+β×g(x,y)+γ×b(x,y);其中,W用于表示白色通道,B用于表示黑色通道。然后,分別對(duì)RG、GR、BY、YB四個(gè)彩色的顏色通道,采用MSER提取算法進(jìn)行提取處理,其中,通過MSER提取算法對(duì)圖像信息進(jìn)行提取的描述如下:步驟1,多顏色通道提?。悍謩e對(duì)RG、GR、BY、YB四個(gè)彩色的顏色通道進(jìn)行提取處理,其描述如下:RG、GR、BY、YB、為選取的四個(gè)彩色的顏色通道,(x,y)為像素點(diǎn)在圖像信息中的位置信息。步驟2,有序像素集合確定:本申請(qǐng)選用分割閾值(像素值)為8,對(duì)圖像信息的每個(gè)顏色通道進(jìn)行分割,即得到Scolor={0,7,15,...,255}。步驟3,確定候選區(qū)域:在對(duì)四個(gè)彩色的顏色通道按照有序像素集合進(jìn)行分割后,將有序像素集合中顏色數(shù)值大于預(yù)先設(shè)置的顏色閾值的與分割像素對(duì)應(yīng)的區(qū)域選定為候選區(qū)域。步驟4,從候選區(qū)域中提取聯(lián)通區(qū)域:聯(lián)通區(qū)域即在候選區(qū)域周圍8個(gè)相鄰的區(qū)域,每一個(gè)分割閾值會(huì)產(chǎn)生多個(gè)區(qū)域,假設(shè)總共區(qū)域個(gè)數(shù)為n;那么聯(lián)通區(qū)域集合可以表示為:RG(Rl)=(Rl,Rl+1,...,Rl+n),GR(Rl)=(Rl,Rl+1,...,Rl+n),BY(Rl)=(Rl,Rl+1,...,Rl+n),YB(Rl)=(Rl,Rl+1,...,Rl+n),其中,l用于表征分割閾值,Rl用于表征在有序像素集合中,所對(duì)應(yīng)的區(qū)域信息。步驟5,計(jì)算區(qū)域變化程度:區(qū)域變化程度描述如下:其中,在||絕對(duì)值符號(hào)內(nèi)代表計(jì)算區(qū)域內(nèi)的像素個(gè)數(shù)。步驟6,提取各顏色通道MSER區(qū)域:當(dāng)Rl滿足以下條件時(shí),則為需要通過MSER提取算法進(jìn)行提取的區(qū)域:v(Rl)<v(Rl-1)&v(Rl)<v(Rl+1);通過提取得到的區(qū)域特征值,與各個(gè)顏色通道相互對(duì)應(yīng)。作為一種可選的實(shí)施方式,在步驟S23根據(jù)區(qū)域特征值與預(yù)先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域中,可以包括:步驟S231,將與顏色通道對(duì)應(yīng)的區(qū)域特征值分別與第一閾值進(jìn)行比對(duì),得到比對(duì)結(jié)果。步驟S233,根據(jù)比對(duì)結(jié)果,確定圖像信息中與顏色通道對(duì)應(yīng)的文本區(qū)域。具體的,通過步驟S231至步驟S233,將在圖像信息中相同區(qū)域的與各個(gè)顏色通道對(duì)應(yīng)的區(qū)域特征值,分別與預(yù)先設(shè)置的第一閾值進(jìn)行比對(duì),從而確定當(dāng)前區(qū)域是否為包含有文字的文本區(qū)域。其中,可以分別為與各個(gè)顏色通道對(duì)應(yīng)的區(qū)域特征值設(shè)置相應(yīng)的閾值,來確定該區(qū)域是否為文本區(qū)域。也可以為所有顏色通道設(shè)置相同的閾值,來確定該區(qū)域是否為文本區(qū)域,此處不做贅述。在實(shí)際應(yīng)用當(dāng)中,針對(duì)上述通過MSER提取算法計(jì)算得到的多個(gè)顏色通道的提取結(jié)果,利用通過訓(xùn)練得到的字符區(qū)域分類器,對(duì)非字符區(qū)域進(jìn)行濾除,字符區(qū)域分類器將提取結(jié)果高于判斷閾值的區(qū)域輸出為文本區(qū)域。其中,在對(duì)字符區(qū)域分類器進(jìn)行訓(xùn)練時(shí),可以準(zhǔn)備若干個(gè)帶有文本區(qū)域的圖像信息,對(duì)圖像信息中同樣以MSER提取算法計(jì)算得到與各個(gè)顏色通道對(duì)應(yīng)的區(qū)域特征值。將與文本區(qū)域?qū)?yīng)的區(qū)域特征值進(jìn)行提取,并對(duì)提取得到的區(qū)域特征值進(jìn)行統(tǒng)計(jì)分析,最終確定用于判斷是否為文本區(qū)域的閾值。作為一種可選的實(shí)施方式,當(dāng)圖像信息中包括至少兩個(gè)文本區(qū)域時(shí),在步驟S23根據(jù)區(qū)域特征值與預(yù)先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域之后,方法還可以包括:步驟S241,獲取文本區(qū)域在圖像信息中的相對(duì)位置信息。步驟S243,根據(jù)文本區(qū)域的區(qū)域特征值,確定與文本區(qū)域?qū)?yīng)的顏色通道信息。步驟S245,根據(jù)相對(duì)位置信息和顏色通道信息,確定文本區(qū)域之間的關(guān)聯(lián)關(guān)系。步驟S247,將具有關(guān)聯(lián)關(guān)系的文本區(qū)域合并為新文本區(qū)域。具體的,在通常情況下,人們的閱讀習(xí)慣為自左至右、自上至下進(jìn)行閱讀。并且,人們會(huì)將圖像中具有相同顏色的字符串聯(lián)起來進(jìn)行閱讀。因此,可以通過步驟S241至步驟S247,根據(jù)文本區(qū)域在圖像信息中的相對(duì)位置關(guān)系,根據(jù)與區(qū)域特征值對(duì)應(yīng)的顏色通道,確定多個(gè)文本區(qū)域之間是否存在關(guān)聯(lián)關(guān)系,并將具有關(guān)聯(lián)關(guān)系的文本區(qū)域進(jìn)行合并以生成新的文本區(qū)域。當(dāng)然,還可以根據(jù)文本區(qū)域中的字符大小、字符中筆畫的寬度對(duì)圖像信息中的文本區(qū)域進(jìn)行關(guān)聯(lián)。作為一種可選的實(shí)施方式,在對(duì)具有關(guān)聯(lián)關(guān)系的文本區(qū)域進(jìn)行合并,生成新的文本區(qū)域之后,還可以再次對(duì)合并后的新文本區(qū)域利用MSER提取算法進(jìn)行提取處理,得到新文本區(qū)域?qū)?yīng)的區(qū)域特征值,并再次利用字符區(qū)域分類器對(duì)與新文本區(qū)域?qū)?yīng)的區(qū)域特征值進(jìn)行篩選,確定得到文本區(qū)域。通過上述方法,可以進(jìn)一步對(duì)文本區(qū)域進(jìn)行提取,去除圖像信息中的干擾信息。作為一種可選的實(shí)施方式,在步驟S25對(duì)圖像信息中的文本區(qū)域進(jìn)行文字識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息中,步驟可以包括:步驟S251,按照預(yù)定方向?qū)ξ谋緟^(qū)域進(jìn)行投影處理,得到與方向?qū)?yīng)的文本區(qū)域的投影結(jié)果,其中,投影處理為沿預(yù)定方向?qū)ξ谋緟^(qū)域中每個(gè)區(qū)間內(nèi)的像素密度進(jìn)行統(tǒng)計(jì)處理,得到與方向?qū)?yīng)的像素密度的分布結(jié)果。步驟S252,根據(jù)投影結(jié)果確定文本區(qū)域中的文字走向。步驟S253,根據(jù)文字走向和投影結(jié)果對(duì)文本區(qū)域進(jìn)行順序分割,分割得到子字符區(qū)域,其中,每個(gè)子字符區(qū)域包含一個(gè)字符。步驟S254,通過字符識(shí)別引擎對(duì)子字符區(qū)域中的字符進(jìn)行識(shí)別,確定與子字符區(qū)域?qū)?yīng)的識(shí)別結(jié)果。步驟S255,根據(jù)文字走向和識(shí)別結(jié)果,生成字段信息。具體的,通過步驟S251至步驟S255,對(duì)文本區(qū)域進(jìn)行投影處理,即以預(yù)定方向?qū)⑽谋緟^(qū)域劃分為若干個(gè)區(qū)間,對(duì)各個(gè)區(qū)間內(nèi)所包含的用于表示字符的像素進(jìn)行統(tǒng)計(jì)處理,得到在當(dāng)前方向各個(gè)區(qū)間內(nèi)的像素密度。進(jìn)一步,還可以通過在當(dāng)前方向上,確定包含有用于標(biāo)字符的像素的分布長(zhǎng)度。首先,通過與各個(gè)方向?qū)?yīng)的分布長(zhǎng)度,確定文本區(qū)域中的文字走向。在確定文字走向之后,可以根據(jù)像素密度對(duì)包含有多個(gè)字符的文本區(qū)域進(jìn)行分割,得到只包含有一個(gè)字符的子字符區(qū)域。按照順序分別對(duì)子 字符區(qū)域中的字符進(jìn)行識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息。其中,確定預(yù)定方向的方法為:首先,以1度為步長(zhǎng),從0度到360度對(duì)文本區(qū)域中的用于表示字符的像素點(diǎn)進(jìn)行投影,得到與投影角度對(duì)應(yīng)的投影距離。選擇投影距離最短的角度作為當(dāng)前文本區(qū)域的主角度,然后,將相對(duì)于主角度旋轉(zhuǎn)0度、90度、180度、270度后得到的四個(gè)方向作為對(duì)文本區(qū)域進(jìn)行投影處理預(yù)定方向。按照上述預(yù)定方向?qū)ξ谋緟^(qū)域中用于表示字符的像素進(jìn)行統(tǒng)計(jì)處理,確定投影距離最長(zhǎng)的方向作為該文本區(qū)域的文字走向方向。作為一種可選的實(shí)施方式,在根據(jù)像素密度以及文字走向?qū)Π卸鄠€(gè)字符的文本區(qū)域按順序進(jìn)行分割得到子字符區(qū)域之后,還可以根據(jù)子字符區(qū)域在橫向和縱向的投影距離,以及字符的寬高比例,將子字符區(qū)域區(qū)分為:包含有漢字字符類和包含有數(shù)字字符類。其中,在通常情況下,漢字字符的寬高比例為1:1,數(shù)字字符的寬高比例為1:2。當(dāng)然,也可以根據(jù)英文字符的寬高比例,對(duì)子字符區(qū)域做進(jìn)一步的分類,具體方法此處不做贅述。作為一種可選的實(shí)施方式,在步驟S254通過字符識(shí)別引擎對(duì)子字符區(qū)域中的字符進(jìn)行識(shí)別,確定與子字符區(qū)域?qū)?yīng)的識(shí)別結(jié)果中,步驟還可以包括:步驟S2541,通過字符識(shí)別引擎對(duì)子字符區(qū)域進(jìn)行識(shí)別,得到與子字符區(qū)域?qū)?yīng)的初始識(shí)別結(jié)果,其中,初始識(shí)別結(jié)果中至少包括一個(gè)備選字符和與備選字符對(duì)應(yīng)的置信度。步驟S2543,根據(jù)置信度,從初始識(shí)別結(jié)果中確定置信度最高的預(yù)定數(shù)量的備選字符作為識(shí)別結(jié)果。具體的,通過字符識(shí)別引擎對(duì)子字符區(qū)域中的字符進(jìn)行識(shí)別,得到與子字符區(qū)域匹配的包含若干備選字符的初始識(shí)別結(jié)果,以及與備選字符對(duì)應(yīng)的置信度。根據(jù)置信度,確定置信度最高的預(yù)定數(shù)量的備選字符作為識(shí)別結(jié)果,其中,預(yù)定數(shù)量可以設(shè)置為5。除此之外,還可以基于反饋對(duì)識(shí)別結(jié)果進(jìn)行矯正,具體步驟描述如下:步驟1,選取識(shí)別結(jié)果中數(shù)值最大的置信度與預(yù)先設(shè)置的閾值進(jìn)行比對(duì),如果置信度小于閾值,則對(duì)子字符區(qū)域進(jìn)行模板大小為3像素×3像素的腐蝕處理,并對(duì)經(jīng)過腐蝕處理的子字符區(qū)域再次進(jìn)行識(shí)別,得到新識(shí)別結(jié)果;步驟2,在對(duì)腐蝕處理后的子字符區(qū)域進(jìn)行識(shí)別,如果在處理結(jié)果中的數(shù)值最大的置信度大于或等于新識(shí)別結(jié)果中數(shù)值最大的置信度時(shí),將腐蝕處理后的新識(shí)別結(jié)果 作為當(dāng)前子字符區(qū)域的識(shí)別結(jié)果,并繼續(xù)重復(fù)步驟1進(jìn)行迭代處理;如果在處理結(jié)果中的數(shù)值最大的置信度小于新識(shí)別結(jié)果中數(shù)值最大的置信度時(shí),則選取新識(shí)別結(jié)果作為對(duì)字符進(jìn)行識(shí)別的輸出結(jié)果,并停止迭代過程。作為一種可選的實(shí)施方式,如圖4所示,在步驟S27當(dāng)確定圖像信息為包含非法字段信息的非法圖像之后,上述方法還包括:步驟S28,獲取預(yù)先設(shè)置的第一圖像特征向量,其中,第一圖像特征向量用于表征特定類型圖像的圖像特征。步驟S29,對(duì)非法圖像進(jìn)行特征向量提取,得到第二圖像特征向量。步驟S30,將第二圖像特征向量與第一圖像特征向量進(jìn)行比對(duì),確定非法圖像的圖像類型,其中,圖像類型至少包括:聊天截圖、非聊天截圖。具體的,在確定圖像信息為包含有非法字段信息的非法圖像之后,還可以通過步驟S28至步驟S30提取非法圖像的第二圖像特征向量,將第二圖像特征向量與預(yù)先設(shè)置的第一圖像特征向量進(jìn)行比對(duì),從而確定該非法圖像的圖像類型。通過上述方法,可以進(jìn)一步提高圖像識(shí)別的準(zhǔn)確率。在實(shí)際應(yīng)用中,可以通過后處理模型對(duì)非法圖像進(jìn)行進(jìn)一步的分類。其中,后處理模型可以分為圖像模型以及文本模型,后處理圖像模型具體描述如下:首先,對(duì)后期處理圖像的樣本進(jìn)行篩選,從通過上述圖像信息中,篩選出一些典型多文字的圖像信息。然后,對(duì)篩選得到的圖像信息進(jìn)行樣本標(biāo)注,從而區(qū)分非法圖像的圖像類型;進(jìn)一步的,對(duì)各種圖像類型的非法圖像進(jìn)行特征提取,提取得到非法圖像的顏色直方圖、分塊灰度直方圖、PCA、圖像像素梯度等特征向量。將特征向量輸入至神經(jīng)網(wǎng)絡(luò),利用神經(jīng)網(wǎng)絡(luò)對(duì)分類模型進(jìn)行訓(xùn)練,得到用于區(qū)分非法圖像的圖像類型的分類模型。在得到分類模型之后,將非法圖像的特征向量輸入至分類模型,即可對(duì)非法圖像進(jìn)行進(jìn)一步分類。進(jìn)一步的,還可以對(duì)非法圖像中出現(xiàn)的誤判的關(guān)鍵詞進(jìn)行收集整理,生成關(guān)鍵詞白名單詞庫(kù);在對(duì)圖像信息中的文字進(jìn)行識(shí)別的過程中,當(dāng)圖像信息中的分詞字段與白名單詞庫(kù)中的關(guān)鍵詞匹配時(shí),判斷該圖像信息為合法圖像。作為一種可選的實(shí)施方式,在步驟S21按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值之前,上述方法還可以包括:步驟S201,獲取圖像信息的圖像分別率。步驟S203,將圖像分別率與預(yù)先設(shè)置的標(biāo)準(zhǔn)圖像分辨率進(jìn)行比對(duì)。步驟S205,當(dāng)圖像分別率不等于標(biāo)準(zhǔn)圖像分辨率時(shí),對(duì)圖像信息按標(biāo)準(zhǔn)圖像分辨率進(jìn)行等比例縮放。具體的,在對(duì)圖像信息進(jìn)行區(qū)域特征值提取之前,還可以通過步驟S201至步驟S205對(duì)圖像信息進(jìn)行歸一化處理,對(duì)不同分辨率的圖像進(jìn)行等比例縮放,得到標(biāo)準(zhǔn)圖像分辨率的圖像信息。在實(shí)際應(yīng)用當(dāng)中,上傳至服務(wù)器的圖像,因圖像分辨率的不同,將會(huì)導(dǎo)致在對(duì)文字進(jìn)行識(shí)別時(shí)產(chǎn)生誤差。因此,可以在對(duì)圖像信息中的文字進(jìn)行識(shí)別之前,可以對(duì)圖像信息進(jìn)行等比例縮放,從而得到具有標(biāo)準(zhǔn)圖像分辨率的圖像信息。作為一種可選的實(shí)施方式,具體實(shí)施步驟如下:步驟1,文本檢測(cè),文本檢測(cè)用來檢測(cè)文本區(qū)域在圖像信息中的位置。具體的,首先,通過圖像信息歸一化處理,將輸入的圖像信息的尺寸進(jìn)行等比例縮放,對(duì)于最長(zhǎng)邊大于1024像素的圖像按照等比例縮小,使最長(zhǎng)邊等于1024像素。在縮放的過程中,可以用到的插值算法,可以是最鄰近插值算法,雙線性插值算法,三次插值算法等,本實(shí)施方式中優(yōu)選使用雙線性插值算法對(duì)圖像信息進(jìn)行歸一化處理,對(duì)于最長(zhǎng)邊小于1024像素的圖像不做處理。在對(duì)圖像信息進(jìn)行歸一化處理之后,對(duì)圖像信息中的文本區(qū)域進(jìn)行提取。將輸入的圖像信息分為6個(gè)顏色通道,對(duì)每個(gè)通道用MSER提取算法對(duì)文本區(qū)域進(jìn)行提取,得到提取結(jié)果。根據(jù)上述與每個(gè)顏色通道對(duì)應(yīng)的提取結(jié)果,利用訓(xùn)練完成的字符分類器對(duì)圖像信息中的非字符區(qū)域的濾除,字符分類器將圖像信息中提取結(jié)果高于閾值的區(qū)域輸出為文本區(qū)域。進(jìn)一步的,還可以對(duì)文本區(qū)域進(jìn)行關(guān)聯(lián)。將每個(gè)顏色通道中的文本區(qū)域,按照字符的顏色、相對(duì)位置關(guān)系、筆畫寬度等信息,對(duì)文本區(qū)域進(jìn)行關(guān)聯(lián),將相似度高的文本區(qū)域合成文本行區(qū)域;在得到文本行區(qū)域之后,還可以利用訓(xùn)練完成的文本行分類器,對(duì)文本行區(qū)域中的非字符區(qū)域進(jìn)行濾除,得到文本行區(qū)域。步驟2,文本識(shí)別,文本識(shí)別用于對(duì)步驟1中得到的文本行區(qū)域進(jìn)行識(shí)別,得到與之對(duì)應(yīng)的 字段信息。首先,以1度為步長(zhǎng),從0度到360度對(duì)文本區(qū)域中的用于表示字符的像素點(diǎn)進(jìn)行投影,得到與投影角度對(duì)應(yīng)的投影距離。選擇投影距離最短的角度作為當(dāng)前文本區(qū)域的主角度,然后,將相對(duì)于主角度旋轉(zhuǎn)0度、90度、180度、270度后得到的四個(gè)方向作為對(duì)文本區(qū)域進(jìn)行投影處理預(yù)定方向。按照上述預(yù)定方向?qū)ξ谋緟^(qū)域中用于表示字符的像素進(jìn)行統(tǒng)計(jì)處理,確定投影距離最長(zhǎng)的方向作為該文本區(qū)域的文字走向方向。在根據(jù)像素密度以及文字走向?qū)Π卸鄠€(gè)字符的文本區(qū)域按順序進(jìn)行分割得到子字符區(qū)域之后,還可以根據(jù)子字符區(qū)域在橫向和縱向的投影距離,以及字符的寬高比例,將子字符區(qū)域區(qū)分為:包含有漢字字符類和包含有數(shù)字字符類。然后,通過文字識(shí)別引擎對(duì)文本區(qū)域中的文字依次進(jìn)行識(shí)別,從而得到與文本區(qū)域?qū)?yīng)的字段信息。其中,文字識(shí)別引擎,可以是為每種字體通過單獨(dú)訓(xùn)練得到的專門用于識(shí)別特定字體的文字識(shí)別引擎,也可以是可以對(duì)所有字體進(jìn)行識(shí)別的通用文字識(shí)別引擎。當(dāng)文字識(shí)別引擎為專門用于識(shí)別特定字體的文字識(shí)別引擎時(shí),利用每種文字識(shí)別引擎對(duì)文文本區(qū)域中的文字進(jìn)行識(shí)別,從而獲取置信度最高的預(yù)設(shè)數(shù)量的識(shí)別結(jié)果作為文字識(shí)別結(jié)果。其中,預(yù)定數(shù)量可以為5個(gè)。將通過文字識(shí)別引擎識(shí)別得到的文字,按照位置關(guān)系進(jìn)行排列,得到與文本區(qū)域?qū)?yīng)的字段信息。除此之外,還可以通過排列組合的方式,對(duì)識(shí)別得到的單個(gè)文字進(jìn)行組合,得到若干個(gè)與文本區(qū)域?qū)?yīng)的字段信息。除此之外,還可以基于反饋對(duì)識(shí)別結(jié)果進(jìn)行矯正,具體步驟描述如下:步驟2.1,選取識(shí)別結(jié)果中數(shù)值最大的置信度與預(yù)先設(shè)置的閾值進(jìn)行比對(duì),如果置信度小于閾值,則對(duì)子字符區(qū)域進(jìn)行模板大小為3像素×3像素的腐蝕處理,并對(duì)經(jīng)過腐蝕處理的子字符區(qū)域再次進(jìn)行識(shí)別,得到新識(shí)別結(jié)果;步驟2.2,在對(duì)腐蝕處理后的子字符區(qū)域進(jìn)行識(shí)別,如果在處理結(jié)果中的數(shù)值最大的置信度大于或等于新識(shí)別結(jié)果中數(shù)值最大的置信度時(shí),將腐蝕處理后的新識(shí)別結(jié)果作為當(dāng)前子字符區(qū)域的識(shí)別結(jié)果,并繼續(xù)重復(fù)步驟2.1進(jìn)行迭代處理;如果在處理結(jié)果中的數(shù)值最大的置信度小于新識(shí)別結(jié)果中數(shù)值最大的置信度時(shí),則選取新識(shí)別結(jié)果作為對(duì)字符進(jìn)行識(shí)別的輸出結(jié)果,并停止迭代過程。步驟3,利用關(guān)鍵詞模型對(duì)步驟2輸出的字段信息進(jìn)行匹配,其中:首先,利用分詞模型,將與圖像信息對(duì)應(yīng)的分詞集合中的分詞詞條進(jìn)行分詞處理, 拋棄分詞中出現(xiàn)的一元詞,從而得到若干個(gè)分詞詞條。在保留字段信息中原有的分詞詞條的同時(shí),將字段信息中的分詞詞條拆分成若干個(gè)二元詞,例如:一個(gè)三元詞生成兩個(gè)二元詞,通過對(duì)所有二元詞中的文字進(jìn)行排列組合,混合成新的二元詞。將利用上述方法拆分后得到的分詞詞條組合成為與圖像信息對(duì)應(yīng)的分詞集合。然后,將與圖像信息對(duì)應(yīng)的分詞集合中的分詞詞條與非法關(guān)鍵詞庫(kù)進(jìn)行匹配,對(duì)匹配后的結(jié)果進(jìn)行加權(quán)運(yùn)算,當(dāng)權(quán)重值高于閾值時(shí),判定圖像信息為非法圖像并輸出判定結(jié)果。步驟4,還可以通過后處理模型對(duì)非法圖像進(jìn)行進(jìn)一步的分類。其中,后處理模型可以分為圖像模型以及文本模型,后處理圖像模型具體描述如下:首先,對(duì)后期處理圖像的樣本進(jìn)行篩選,從通過上述圖像信息中,篩選出一些典型多文字的圖像信息。例如,QQ聊天記錄、微信聊天記錄、旺旺聊天記錄、訂單詳情截圖、物流信息截圖等。然后,對(duì)篩選得到的圖像信息進(jìn)行樣本標(biāo)注,從而區(qū)分非法圖像的圖像類型,例如:聊天類截圖、非聊天類截圖;進(jìn)一步的,對(duì)各種圖像類型的非法圖像進(jìn)行特征提取,提取得到非法圖像的顏色直方圖、分塊灰度直方圖、PCA、圖像像素梯度等特征向量。將特征向量輸入至BP神經(jīng)網(wǎng)絡(luò),利用神經(jīng)網(wǎng)絡(luò)對(duì)分類模型進(jìn)行訓(xùn)練,得到用于區(qū)分非法圖像的圖像類型的分類模型。在得到分類模型之后,將非法圖像的特征向量輸入至分類模型,即可對(duì)非法圖像進(jìn)行進(jìn)一步分類。進(jìn)一步的,還可以對(duì)非法圖像中出現(xiàn)的誤判的關(guān)鍵詞進(jìn)行收集整理,生成關(guān)鍵詞白名單詞庫(kù);在對(duì)圖像信息中的文字進(jìn)行識(shí)別的過程中,當(dāng)圖像信息中的分詞字段與白名單詞庫(kù)中的關(guān)鍵詞匹配時(shí),判斷該圖像信息為合法圖像。除此之外,還可以建立人工審核平臺(tái),最后對(duì)通過上述方法得到的非法圖像進(jìn)行人工審核,以保證識(shí)別的準(zhǔn)確率,并可以進(jìn)行風(fēng)險(xiǎn)控制。還可以通過將人工審核的數(shù)據(jù)重新加入到標(biāo)注樣本中,從而達(dá)到定期對(duì)模型進(jìn)行訓(xùn)練的目的,以適應(yīng)用戶習(xí)慣的改變。在對(duì)非法圖像進(jìn)行識(shí)別之前,還可以通過如下步驟對(duì)判斷模型進(jìn)行訓(xùn)練:步驟1,通過批量獲取圖像信息,對(duì)圖像信息進(jìn)行0、1標(biāo)注,即,對(duì)圖像信息是否為非法圖像進(jìn)行標(biāo)注,0為合法圖像,1為非法圖像。步驟2,對(duì)上述步驟1中,標(biāo)注為非法圖像中的非法字段信息進(jìn)行標(biāo)注,并將標(biāo)注出的字段信息進(jìn)行保存,生成用于判斷圖像信息是否為非法圖像的非法關(guān)鍵詞集合。步驟3,利用分詞模型,將非法關(guān)鍵詞集合中的非法關(guān)鍵詞進(jìn)行分詞處理,拋棄分詞中出現(xiàn)的一元詞,從而得到若干個(gè)分詞。在保留原有非法關(guān)鍵詞的同時(shí),將分詞詞條拆分成若干個(gè)二元詞或三元詞,例如:一個(gè)三元詞生成兩個(gè)二元詞,通過對(duì)所有二元詞中的文字進(jìn)行排列組合,混合成新的二元詞。將利用上述方法拆分后得到的分詞與原有非法關(guān)鍵詞組合成為非法關(guān)鍵詞集合。步驟4,利用關(guān)鍵詞決策樹算法建立弱分類器:將上述步驟3中得到的每一個(gè)非法關(guān)鍵詞作為關(guān)鍵詞決策樹的決策條件,當(dāng)與該非法關(guān)鍵詞匹配命中時(shí),輸出結(jié)果為1,否則輸出結(jié)果為0。步驟5,賦予關(guān)鍵詞決策樹中每個(gè)弱分類器的初始權(quán)重為1/N,其中,N為弱分類器個(gè)數(shù)。步驟6,根據(jù)上述步驟1中通過標(biāo)注得到的標(biāo)注數(shù)據(jù)和通過步驟2至步驟3經(jīng)分詞處理得到非法關(guān)鍵詞集合,通過語(yǔ)義模型和adaboost算法對(duì)弱分類器的權(quán)重進(jìn)行訓(xùn)練,得到用于與非法關(guān)鍵詞集合中各個(gè)非法關(guān)鍵詞對(duì)應(yīng)的權(quán)重值。步驟7,對(duì)關(guān)鍵詞決策樹的判斷條件進(jìn)行提取,提取權(quán)重大于預(yù)先設(shè)置的閾值的非法關(guān)鍵詞,將其添加入非法關(guān)鍵詞詞庫(kù),以便提高匹配效率。需要說明的是,對(duì)于前述的各方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請(qǐng)并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本申請(qǐng),某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本申請(qǐng)所必須的。通過以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到根據(jù)上述實(shí)施例的方法可借助軟件加必需的通用硬件平臺(tái)的方式來實(shí)現(xiàn),當(dāng)然也可以通過硬件,但很多情況下前者是更佳的實(shí)施方式?;谶@樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如ROM/RAM、磁碟、光盤)中,包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī),計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例的方法。實(shí)施例2根據(jù)本申請(qǐng)實(shí)施例,還提供了一種用于實(shí)施上述圖像的識(shí)別方法的圖像的識(shí)別裝置,如圖5所示,該裝置包括:第一提取模塊21、篩選模塊23、識(shí)別模塊25和匹配模塊27。其中,第一提取模塊21,用于按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值。篩選模塊23,用于根據(jù)區(qū)域特征值與預(yù)先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域。識(shí)別模塊25,用于對(duì)圖像信息中的文本區(qū)域進(jìn)行文字識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息。匹配模塊27,用于將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像。通過上述第一提取模塊21、篩選模塊23、識(shí)別模塊25和匹配模塊27,分別按照顏色通道,提取得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值。根據(jù)第一閾值對(duì)區(qū)域特征值進(jìn)行篩選,確定圖像信息中的文本區(qū)域。然后,通過文字識(shí)別引擎對(duì)文本區(qū)域中的文字進(jìn)行識(shí)別,并將識(shí)別得到的文字與預(yù)先設(shè)置的非法字段進(jìn)行匹配,來確定圖像信息是否為包含有非法字段的非法圖像。通過上述方法,達(dá)到了對(duì)圖像信息中在各種場(chǎng)景下的文字信息的進(jìn)行識(shí)別的目的,從而實(shí)現(xiàn)了提升對(duì)圖像信息中的文字信息進(jìn)行識(shí)別的準(zhǔn)確率的技術(shù)效果,解決了現(xiàn)有技術(shù)中由于受圖像信息的背景內(nèi)容的影響,導(dǎo)致的對(duì)圖像信息中的文字信息識(shí)別準(zhǔn)確率低的技術(shù)問題。作為一種可選的實(shí)施方式,如圖6所示,上述裝置還可以包括:分詞模塊26。其中,分詞模塊26,用于按照預(yù)先設(shè)置的分詞規(guī)則對(duì)字段信息進(jìn)行拆分,得到與字段信息對(duì)應(yīng)的分詞集合,其中,分詞集合用于記錄對(duì)字段信息進(jìn)行拆分后得到的分詞詞條。具體的,通過上述分詞模塊26,對(duì)通過識(shí)別得到的字段信息,進(jìn)行分詞處理。通過分詞處理可以將字段信息中的詞組拆分成若干個(gè)具有新的意思的新分詞分詞條。將通過分詞處理得到的新分詞詞條組合成為與圖片信息對(duì)應(yīng)的分詞集合。在實(shí)際應(yīng)用當(dāng)中,分詞處理方法通??煞譃槿箢悾夯谧址ヅ涞姆衷~處理方法、基于理解的分詞處理方法和基于統(tǒng)計(jì)的分詞處理方法,具體的分詞處理方法不做贅述。此處,可以先利用上述分詞處理方法,將識(shí)別得到的字段信息進(jìn)行分詞處理。然后在保留字段信息中原有的分詞詞條的同時(shí),將字段信息中的分詞詞條拆分成若干個(gè)二元詞,例如:一個(gè)三元詞生成兩個(gè)二元詞,通過對(duì)所有二元詞中的文字進(jìn)行排列組合,混合成新的二元詞。將利用上述方法拆分后得到的分詞詞條組合成為與圖像信息對(duì)應(yīng)的分詞集合。作為一種可選的實(shí)施方式,在對(duì)字段信息進(jìn)行分詞處理之前,可以預(yù)先對(duì)需要管控的圖片信息中的字段信息進(jìn)行標(biāo)注,并將標(biāo)注出的字段信息進(jìn)行保存,生成用于判 斷圖像信息是否為非法圖像的非法關(guān)鍵詞集合。作為一種可選的實(shí)施方式,如圖7所示,上述匹配模塊27可以包括:第一子獲取模塊271、第二子獲取模塊273、子匹配模塊275、子運(yùn)算模塊277和第一比對(duì)模塊279。其中,第一子獲取模塊271,用于獲取預(yù)先設(shè)置的非法關(guān)鍵詞集合;第二子獲取模塊273,用于獲取與非法關(guān)鍵詞集合中各非法關(guān)鍵詞對(duì)應(yīng)的權(quán)重值;子匹配模塊275,用于將分詞集合中的分詞詞條,分別與非法關(guān)鍵詞集合中的非法關(guān)鍵詞進(jìn)行匹配,得到匹配結(jié)果;子運(yùn)算模塊277,用于根據(jù)與非法關(guān)鍵詞對(duì)應(yīng)的權(quán)重值與匹配結(jié)果進(jìn)行加權(quán)運(yùn)算,得到字段信息的字段權(quán)重;第一比對(duì)模塊279,用于將字段權(quán)重與預(yù)先設(shè)置的第二閾值進(jìn)行比對(duì),確定圖像信息是否為包含非法字段的非法圖像。具體的,通過上述第一子獲取模塊271、第二子獲取模塊273、子匹配模塊275、子運(yùn)算模塊277和第一比對(duì)模塊279,將通過分詞處理得到的與圖像信息對(duì)應(yīng)的分詞信息,與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,并對(duì)通過匹配的到的匹配結(jié)果進(jìn)行加權(quán)計(jì)算,得到與圖像信息中包含的字段信息對(duì)應(yīng)的字段權(quán)重。通過將字段權(quán)重與預(yù)先設(shè)置的用于判斷是否為非法圖像的第二閾值進(jìn)行比對(duì),確定上述圖像信息是否為非法圖像。在實(shí)際應(yīng)用當(dāng)中,文字在不同的語(yǔ)境之下所包含的意思也不盡相同。因此,通常并不能通過圖像信息中是否包含了某個(gè)被認(rèn)為是非法的關(guān)鍵詞,而判定該圖像信息就是非法圖像。因此,可以對(duì)非法關(guān)鍵詞集合中的各個(gè)非法關(guān)鍵詞設(shè)置權(quán)重值。通過將圖像信息中包含的分詞詞條依次與非法關(guān)鍵詞集合中的非法關(guān)鍵詞進(jìn)行匹配,并根據(jù)匹配結(jié)果計(jì)算得到與該圖像信息對(duì)應(yīng)的字段權(quán)重值,來確定圖像信息是否為非法圖像。從而提高對(duì)非法圖像識(shí)別的準(zhǔn)確率。具體的,可以將通過分詞處理得到的分詞,直接通過與非法關(guān)鍵詞庫(kù)進(jìn)行匹配,利用匹配后的結(jié)果生成一維向量,并輸入關(guān)鍵詞模型進(jìn)行打分,當(dāng)分?jǐn)?shù)高于閾值時(shí),判定圖像信息為非法圖像并輸出判定結(jié)果。作為一種可選的實(shí)施方式,上述顏色通道可以包括:彩色通道和灰度通道,其中,彩色通道至少包括:紅色通道、綠色通道、藍(lán)色通道和黃色通道,灰度通道至少包括:黑色通道、白色通道。如圖8所示,當(dāng)顏色通道為彩色通道時(shí),其中,第一提取模塊21包括:子修正模塊211、第一子確定模塊212和第一子提取模塊213。其中,子修正模塊211,用于通過對(duì)圖像信息中像素點(diǎn)的RGB顏色值進(jìn)行修正處理,得到與像素點(diǎn)對(duì)應(yīng)的預(yù)處理顏色值,其中,預(yù)處理顏色值中包括:紅色值、綠色值、藍(lán)色值和黃色值;第一子確定模塊212,用于根據(jù)預(yù)處理顏色值和像素點(diǎn)的位置 信息,確定像素點(diǎn)在彩色通道中的第一像素特征值,其中,第一像素特征值與彩色通道對(duì)應(yīng);第一子提取模塊213,用于根據(jù)第一像素特征值,對(duì)圖像信息進(jìn)行提取處理,得到與彩色通道對(duì)應(yīng)的區(qū)域特征值。具體的,通過上述子修正模塊211、第一子確定模塊212和第一子提取模塊213,對(duì)圖像信息中彩色的顏色通道進(jìn)行區(qū)域特征值進(jìn)行提取。首先,對(duì)圖像信息的彩色的顏色通道進(jìn)行像素特征值的提取處理,得到在圖像信息中的每個(gè)像素點(diǎn)分別在每個(gè)彩色的顏色通道中的像素特征值。然后,根據(jù)在每個(gè)彩色通道中的像素特征值,對(duì)圖像信息進(jìn)行區(qū)域特征值的提取處理,最終得到與每個(gè)彩色的顏色通道對(duì)應(yīng)的區(qū)域特征值。作為一種可選的實(shí)施方式,如圖9所示,當(dāng)顏色通道為灰度通道時(shí),其中,第一提取模塊21還包括:第三子獲取模塊214、第二子確定模塊215和第二子提取模塊216。其中,第三子獲取模塊214,用于獲取預(yù)先設(shè)置的計(jì)算參數(shù);第二子確定模塊215,用于根據(jù)圖像信息中像素點(diǎn)的RGB顏色值、像素點(diǎn)的位置信息和計(jì)算參數(shù),確定像素點(diǎn)在灰度通道中的第二像素特征值,其中,第二像素特征值與彩色通道對(duì)應(yīng);第二子提取模塊216,用于根據(jù)第二像素特征值對(duì)圖像信息進(jìn)行提取處理,得到與灰度通道對(duì)應(yīng)的區(qū)域特征值。具體的,在對(duì)圖像信息的彩色通道進(jìn)行提取處理之外,還可以對(duì)圖像信息的灰度通道進(jìn)行提取處理。具體的,通過上述第三子獲取模塊214、第二子確定模塊215和第二子提取模塊216,對(duì)圖像信息中灰度通道進(jìn)行區(qū)域特征值進(jìn)行提取。首先,對(duì)圖像信息的灰度通道進(jìn)行像素特征值的提取處理,得到在圖像信息中的每個(gè)像素點(diǎn)分別在各個(gè)灰度顏色通道中的像素特征值。然后,根據(jù)在每個(gè)灰度通道中的像素特征值,對(duì)圖像信息進(jìn)行區(qū)域特征值的提取處理,最終得到與每個(gè)灰度通道對(duì)應(yīng)的區(qū)域特征值。作為一種可選的實(shí)施方式,如圖10所示,上述篩選模塊23可以包括:子比對(duì)模塊231和第三子確定模塊233。其中,子比對(duì)模塊231,用于將與顏色通道對(duì)應(yīng)的區(qū)域特征值分別與第一閾值進(jìn)行比對(duì),得到比對(duì)結(jié)果;第三子確定模塊233,用于根據(jù)比對(duì)結(jié)果,確定圖像信息中與顏色通道對(duì)應(yīng)的文本區(qū)域。具體的,通過上述子比對(duì)模塊231和第三子確定模塊233。,將在圖像信息中相同區(qū)域的與各個(gè)顏色通道對(duì)應(yīng)的區(qū)域特征值,分別與預(yù)先設(shè)置的第一閾值進(jìn)行比對(duì),從而確定當(dāng)前區(qū)域是否為包含有文字的文本區(qū)域。其中,可以分別為與各個(gè)顏色通道對(duì)應(yīng)的區(qū)域特征值設(shè)置相應(yīng)的閾值,來確定該區(qū)域是否為文本區(qū)域。也可以為所有顏色通道設(shè)置相同的閾值,來確定該區(qū)域是否為文本區(qū)域,此處不做贅述。作為一種可選的實(shí)施方式,當(dāng)圖像信息中包括至少兩個(gè)文本區(qū)域時(shí),如圖11所示,上述裝置還可以包括:第一獲取模塊241、第一確定模塊243、第二確定模塊245和合并模塊247。其中,第一獲取模塊241,用于獲取文本區(qū)域在圖像信息中的相對(duì)位置信息;第一確定模塊243,用于根據(jù)文本區(qū)域的區(qū)域特征值,確定與文本區(qū)域?qū)?yīng)的顏色通道信息;第二確定模塊245,用于根據(jù)相對(duì)位置信息和顏色通道信息,確定文本區(qū)域之間的關(guān)聯(lián)關(guān)系;合并模塊247,用于將具有關(guān)聯(lián)關(guān)系的文本區(qū)域合并為新文本區(qū)域。具體的,在通常情況下,人們的閱讀習(xí)慣為自左至右、自上至下進(jìn)行閱讀。并且,人們會(huì)將圖像中具有相同顏色的字符串聯(lián)起來進(jìn)行閱讀。因此,可以通過上述第一獲取模塊241、第一確定模塊243、第二確定模塊245和合并模塊247,根據(jù)文本區(qū)域在圖像信息中的相對(duì)位置關(guān)系,根據(jù)與區(qū)域特征值對(duì)應(yīng)的顏色通道,確定多個(gè)文本區(qū)域之間是否存在關(guān)聯(lián)關(guān)系,并將具有關(guān)聯(lián)關(guān)系的文本區(qū)域進(jìn)行合并以生成新的文本區(qū)域。當(dāng)然,還可以根據(jù)文本區(qū)域中的字符大小、字符中筆畫的寬度對(duì)圖像信息中的文本區(qū)域進(jìn)行關(guān)聯(lián)。作為一種可選的實(shí)施方式,如圖12所示,上述識(shí)別模塊25包括:子處理模塊251、第四子確定模塊252、子分割模塊253、第一子識(shí)別模塊254和子生成模塊255。其中,子處理模塊251,用于按照預(yù)定方向?qū)ξ谋緟^(qū)域進(jìn)行投影處理,得到與方向?qū)?yīng)的文本區(qū)域的投影結(jié)果,其中,投影處理為沿預(yù)定方向?qū)ξ谋緟^(qū)域中每個(gè)區(qū)間內(nèi)的像素密度進(jìn)行統(tǒng)計(jì)處理,得到與方向?qū)?yīng)的像素密度的分布結(jié)果;第四子確定模塊252,用于根據(jù)投影結(jié)果確定文本區(qū)域中的文字走向;子分割模塊253,用于根據(jù)文字走向和投影結(jié)果對(duì)文本區(qū)域進(jìn)行順序分割,分割得到子字符區(qū)域,其中,每個(gè)子字符區(qū)域包含一個(gè)字符;第一子識(shí)別模塊254,用于通過字符識(shí)別引擎對(duì)子字符區(qū)域中的字符進(jìn)行識(shí)別,確定與子字符區(qū)域?qū)?yīng)的識(shí)別結(jié)果;子生成模塊255,用于根據(jù)文字走向和識(shí)別結(jié)果,生成字段信息。具體的,通過上述子處理模塊251、第四子確定模塊252、子分割模塊253、第一子識(shí)別模塊254和子生成模塊255,對(duì)文本區(qū)域進(jìn)行投影處理,即以預(yù)定方向?qū)⑽谋緟^(qū)域劃分為若干個(gè)區(qū)間,對(duì)各個(gè)區(qū)間內(nèi)所包含的用于表示字符的像素進(jìn)行統(tǒng)計(jì)處理,得到在當(dāng)前方向各個(gè)區(qū)間內(nèi)的像素密度。進(jìn)一步,還可以通過在當(dāng)前方向上,確定包含有用于標(biāo)字符的像素的分布長(zhǎng)度。首先,通過與各個(gè)方向?qū)?yīng)的分布長(zhǎng)度,確定文本區(qū)域中的文字走向。在確定文字走向之后,可以根據(jù)像素密度對(duì)包含有多個(gè)字符的文本區(qū)域進(jìn)行分割,得到只包含有一個(gè)字符的子字符區(qū)域。按照順序分別對(duì)子字符區(qū)域中的字符進(jìn)行識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息。作為一種可選的實(shí)施方式,上述第一子識(shí)別模塊254包括:第二子識(shí)別模塊2541和第五子確定模塊2543。其中,第二子識(shí)別模塊2541,用于通過字符識(shí)別引擎對(duì)子字符區(qū)域進(jìn)行識(shí)別,得到與子字符區(qū)域?qū)?yīng)的初始識(shí)別結(jié)果,其中,初始識(shí)別結(jié)果中至少包括一個(gè)備選字符和與備選字符對(duì)應(yīng)的置信度;第五子確定模塊2543,用于根據(jù)置信度,從初始識(shí)別結(jié)果中確定置信度最高的預(yù)定數(shù)量的備選字符作為識(shí)別結(jié)果。具體的,通過字符識(shí)別引擎對(duì)子字符區(qū)域中的字符進(jìn)行識(shí)別,得到與子字符區(qū)域匹配的包含若干備選字符的初始識(shí)別結(jié)果,以及與備選字符對(duì)應(yīng)的置信度。根據(jù)置信度,確定置信度最高的預(yù)定數(shù)量的備選字符作為識(shí)別結(jié)果,其中,預(yù)定數(shù)量可以設(shè)置為5。作為一種可選的實(shí)施方式,如圖13示,上述裝置還可以包括:第二獲取模塊28、第二提取模塊29和第二比對(duì)模塊30。其中,第二獲取模塊28,用于獲取預(yù)先設(shè)置的第一圖像特征向量,其中,第一圖像特征向量用于表征特定類型圖像的圖像特征;第二提取模塊29,用于對(duì)非法圖像進(jìn)行特征向量提取,得到第二圖像特征向量;第二比對(duì)模塊30,用于將第二圖像特征向量與第一圖像特征向量進(jìn)行比對(duì),確定非法圖像的圖像類型,其中,圖像類型至少包括:聊天截圖、非聊天截圖。具體的,在確定圖像信息為包含有非法字段信息的非法圖像之后,還可以通過上述第二獲取模塊28、第二提取模塊29和第二比對(duì)模塊30提取非法圖像的第二圖像特征向量,將第二圖像特征向量與預(yù)先設(shè)置的第一圖像特征向量進(jìn)行比對(duì),從而確定該非法圖像的圖像類型。通過上述方法,可以進(jìn)一步提高圖像識(shí)別的準(zhǔn)確率。作為一種可選的實(shí)施方式,如圖14所示,上述裝置還包括:第三獲取模塊201、第三比對(duì)模塊203和縮放模塊205。其中,第三獲取模塊201,用于獲取圖像信息的圖像分別率;第三比對(duì)模塊203,用于將圖像分別率與預(yù)先設(shè)置的標(biāo)準(zhǔn)圖像分辨率進(jìn)行比對(duì);縮放模塊205,用于當(dāng)圖像分別率不等于標(biāo)準(zhǔn)圖像分辨率時(shí),對(duì)圖像信息按標(biāo)準(zhǔn)圖像分辨率進(jìn)行等比例縮放。具體的,在對(duì)圖像信息進(jìn)行區(qū)域特征值提取之前,還可以通過上述第三獲取模塊201、第三比對(duì)模塊203和縮放模塊205對(duì)圖像信息進(jìn)行歸一化處理,對(duì)不同分辨率的圖像進(jìn)行等比例縮放,得到標(biāo)準(zhǔn)圖像分辨率的圖像信息。實(shí)施例3本申請(qǐng)的實(shí)施例可以提供一種計(jì)算機(jī)終端,該計(jì)算機(jī)終端可以是計(jì)算機(jī)終端群中的任意一個(gè)計(jì)算機(jī)終端設(shè)備??蛇x地,在本實(shí)施例中,上述計(jì)算機(jī)終端也可以替換為移動(dòng)終端等終端設(shè)備??蛇x地,在本實(shí)施例中,上述計(jì)算機(jī)終端可以位于計(jì)算機(jī)網(wǎng)絡(luò)的多個(gè)網(wǎng)絡(luò)設(shè)備中的至少一個(gè)網(wǎng)絡(luò)設(shè)備。在本實(shí)施例中,上述計(jì)算機(jī)終端可以執(zhí)行應(yīng)用程序的圖像的識(shí)別方法中以下步驟的程序代碼:S1,按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值;S2,根據(jù)區(qū)域特征值與預(yù)先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域;S3,對(duì)圖像信息中的文本區(qū)域進(jìn)行文字識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息;S4,將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像??蛇x地,圖1是根據(jù)本申請(qǐng)實(shí)施例的一種計(jì)算機(jī)終端的結(jié)構(gòu)框圖。如圖1所示,該計(jì)算機(jī)終端A可以包括:一個(gè)或多個(gè)(圖中僅示出一個(gè))處理器、存儲(chǔ)器、以及傳輸模塊。其中,存儲(chǔ)器可用于存儲(chǔ)軟件程序以及模塊,如本申請(qǐng)實(shí)施例中的圖像的識(shí)別方法和裝置對(duì)應(yīng)的程序指令/模塊,處理器通過運(yùn)行存儲(chǔ)在存儲(chǔ)器內(nèi)的軟件程序以及模塊,從而執(zhí)行各種功能應(yīng)用以及數(shù)據(jù)處理,即實(shí)現(xiàn)上述的系統(tǒng)漏洞攻擊的檢測(cè)方法。存儲(chǔ)器可包括高速隨機(jī)存儲(chǔ)器,還可以包括非易失性存儲(chǔ)器,如一個(gè)或者多個(gè)磁性存儲(chǔ)裝置、閃存、或者其他非易失性固態(tài)存儲(chǔ)器。在一些實(shí)例中,存儲(chǔ)器可進(jìn)一步包括相對(duì)于處理器遠(yuǎn)程設(shè)置的存儲(chǔ)器,這些遠(yuǎn)程存儲(chǔ)器可以通過網(wǎng)絡(luò)連接至終端A。上述網(wǎng)絡(luò)的實(shí)例包括但不限于互聯(lián)網(wǎng)、企業(yè)內(nèi)部網(wǎng)、局域網(wǎng)、移動(dòng)通信網(wǎng)及其組合。處理器可以通過傳輸裝置調(diào)用存儲(chǔ)器存儲(chǔ)的信息及應(yīng)用程序,以執(zhí)行下述步驟:按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值;根據(jù)區(qū)域特征值與預(yù)先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域;對(duì)圖像信息中的文本區(qū)域進(jìn)行文字識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息;將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合 進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像。可選的,上述處理器還可以執(zhí)行如下步驟的程序代碼:按照預(yù)先設(shè)置的分詞規(guī)則對(duì)字段信息進(jìn)行拆分,得到與字段信息對(duì)應(yīng)的分詞集合,其中,分詞集合用于記錄對(duì)字段信息進(jìn)行拆分后得到的分詞詞條。可選的,上述處理器還可以執(zhí)行如下步驟的程序代碼:獲取預(yù)先設(shè)置的非法關(guān)鍵詞集合;獲取與非法關(guān)鍵詞集合中各非法關(guān)鍵詞對(duì)應(yīng)的權(quán)重值;將分詞集合中的分詞詞條,分別與非法關(guān)鍵詞集合中的非法關(guān)鍵詞進(jìn)行匹配,得到匹配結(jié)果;根據(jù)與非法關(guān)鍵詞對(duì)應(yīng)的權(quán)重值與匹配結(jié)果進(jìn)行加權(quán)運(yùn)算,得到字段信息的字段權(quán)重;將字段權(quán)重與預(yù)先設(shè)置的第二閾值進(jìn)行比對(duì),確定圖像信息是否為包含非法字段的非法圖像??蛇x的,上述處理器還可以執(zhí)行如下步驟的程序代碼:通過對(duì)圖像信息中像素點(diǎn)的RGB顏色值進(jìn)行修正處理,得到與像素點(diǎn)對(duì)應(yīng)的預(yù)處理顏色值,其中,預(yù)處理顏色值中包括:紅色值、綠色值、藍(lán)色值和黃色值;根據(jù)預(yù)處理顏色值和像素點(diǎn)的位置信息,確定像素點(diǎn)在彩色通道中的第一像素特征值,其中,第一像素特征值與彩色通道對(duì)應(yīng);根據(jù)第一像素特征值,對(duì)圖像信息進(jìn)行提取處理,得到與彩色通道對(duì)應(yīng)的區(qū)域特征值??蛇x的,上述處理器還可以執(zhí)行如下步驟的程序代碼:獲取預(yù)先設(shè)置的計(jì)算參數(shù);根據(jù)圖像信息中像素點(diǎn)的RGB顏色值、像素點(diǎn)的位置信息和計(jì)算參數(shù),確定像素點(diǎn)在灰度通道中的第二像素特征值,其中,第二像素特征值與彩色通道對(duì)應(yīng);根據(jù)第二像素特征值對(duì)圖像信息進(jìn)行提取處理,得到與灰度通道對(duì)應(yīng)的區(qū)域特征值??蛇x的,上述處理器還可以執(zhí)行如下步驟的程序代碼:將與顏色通道對(duì)應(yīng)的區(qū)域特征值分別與第一閾值進(jìn)行比對(duì),得到比對(duì)結(jié)果;根據(jù)比對(duì)結(jié)果,確定圖像信息中與顏色通道對(duì)應(yīng)的文本區(qū)域。可選的,上述處理器還可以執(zhí)行如下步驟的程序代碼:獲取文本區(qū)域在圖像信息中的相對(duì)位置信息;根據(jù)文本區(qū)域的區(qū)域特征值,確定與文本區(qū)域?qū)?yīng)的顏色通道信息;根據(jù)相對(duì)位置信息和顏色通道信息,確定文本區(qū)域之間的關(guān)聯(lián)關(guān)系;將具有關(guān)聯(lián)關(guān)系的文本區(qū)域合并為新文本區(qū)域??蛇x的,上述處理器還可以執(zhí)行如下步驟的程序代碼:按照預(yù)定方向?qū)ξ谋緟^(qū)域進(jìn)行投影處理,得到與方向?qū)?yīng)的文本區(qū)域的投影結(jié)果,其中,投影處理為沿預(yù)定方向?qū)ξ谋緟^(qū)域中每個(gè)區(qū)間內(nèi)的像素密度進(jìn)行統(tǒng)計(jì)處理,得到與方向?qū)?yīng)的像素密度的分布結(jié)果;根據(jù)投影結(jié)果確定文本區(qū)域中的文字走向;根據(jù)文字走向和投影結(jié)果對(duì)文本區(qū)域進(jìn)行順序分割,分割得到子字符區(qū)域,其中,每個(gè)子字符區(qū)域包含一個(gè)字符; 通過字符識(shí)別引擎對(duì)子字符區(qū)域中的字符進(jìn)行識(shí)別,確定與子字符區(qū)域?qū)?yīng)的識(shí)別結(jié)果;根據(jù)文字走向和識(shí)別結(jié)果,生成字段信息??蛇x的,上述處理器還可以執(zhí)行如下步驟的程序代碼:通過字符識(shí)別引擎對(duì)子字符區(qū)域進(jìn)行識(shí)別,得到與子字符區(qū)域?qū)?yīng)的初始識(shí)別結(jié)果,其中,初始識(shí)別結(jié)果中至少包括一個(gè)備選字符和與備選字符對(duì)應(yīng)的置信度;根據(jù)置信度,從初始識(shí)別結(jié)果中確定置信度最高的預(yù)定數(shù)量的備選字符作為識(shí)別結(jié)果??蛇x的,上述處理器還可以執(zhí)行如下步驟的程序代碼:獲取預(yù)先設(shè)置的第一圖像特征向量,其中,第一圖像特征向量用于表征特定類型圖像的圖像特征;對(duì)非法圖像進(jìn)行特征向量提取,得到第二圖像特征向量;將第二圖像特征向量與第一圖像特征向量進(jìn)行比對(duì),確定非法圖像的圖像類型,其中,圖像類型至少包括:聊天截圖、非聊天截圖??蛇x的,上述處理器還可以執(zhí)行如下步驟的程序代碼:獲取圖像信息的圖像分別率;將圖像分別率與預(yù)先設(shè)置的標(biāo)準(zhǔn)圖像分辨率進(jìn)行比對(duì);當(dāng)圖像分別率不等于標(biāo)準(zhǔn)圖像分辨率時(shí),對(duì)圖像信息按標(biāo)準(zhǔn)圖像分辨率進(jìn)行等比例縮放。采用本申請(qǐng)實(shí)施例,提供了一種圖像的識(shí)別的方案。通過按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值;根據(jù)區(qū)域特征值與預(yù)先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域;對(duì)圖像信息中的文本區(qū)域進(jìn)行文字識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息;將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像,從而達(dá)到了對(duì)圖像信息中在各種場(chǎng)景下的文字信息的進(jìn)行識(shí)別的目的,進(jìn)而解決了現(xiàn)有技術(shù)中由于受圖像信息的背景內(nèi)容的影響,導(dǎo)致的對(duì)圖像信息中的文字信息識(shí)別準(zhǔn)確率低的的技術(shù)問題。本領(lǐng)域普通技術(shù)人員可以理解,計(jì)算機(jī)終端也可以是智能手機(jī)(如Android手機(jī)、iOS手機(jī)等)、平板電腦、掌聲電腦以及移動(dòng)互聯(lián)網(wǎng)設(shè)備(MobileInternetDevices,MID)、PAD等終端設(shè)備,并不對(duì)上述電子裝置的結(jié)構(gòu)造成限定。例如,計(jì)算機(jī)終端10還可包括比圖10中所示更多或者更少的組件(如網(wǎng)絡(luò)接口、顯示裝置等),或者具有與圖10所示不同的配置。本領(lǐng)域普通技術(shù)人員可以理解上述實(shí)施例的各種方法中的全部或部分步驟是可以通過程序來指令終端設(shè)備相關(guān)的硬件來完成,該程序可以存儲(chǔ)于一計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,存儲(chǔ)介質(zhì)可以包括:閃存盤、只讀存儲(chǔ)器(Read-OnlyMemory,ROM)、隨機(jī)存取器(RandomAccessMemory,RAM)、磁盤或光盤等。實(shí)施例4本申請(qǐng)的實(shí)施例還提供了一種存儲(chǔ)介質(zhì)。可選地,在本實(shí)施例中,上述存儲(chǔ)介質(zhì)可以用于保存上述實(shí)施例一所提供的圖像的識(shí)別方法所執(zhí)行的程序代碼。可選地,在本實(shí)施例中,上述存儲(chǔ)介質(zhì)可以位于計(jì)算機(jī)網(wǎng)絡(luò)中計(jì)算機(jī)終端群中的任意一個(gè)計(jì)算機(jī)終端中,或者位于移動(dòng)終端群中的任意一個(gè)移動(dòng)終端中??蛇x地,在本實(shí)施例中,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:按照顏色通道對(duì)獲取的圖像信息進(jìn)行區(qū)域特征值提取處理,得到圖像信息中與顏色通道對(duì)應(yīng)的各個(gè)區(qū)域的區(qū)域特征值;根據(jù)區(qū)域特征值與預(yù)先設(shè)置的第一閾值對(duì)圖像信息中各個(gè)區(qū)域進(jìn)行篩選,確定圖像信息中的文本區(qū)域;對(duì)圖像信息中的文本區(qū)域進(jìn)行文字識(shí)別,得到與文本區(qū)域?qū)?yīng)的字段信息;將字段信息與預(yù)先設(shè)置的非法關(guān)鍵詞集合進(jìn)行匹配,確定圖像信息是否為包含非法字段信息的非法圖像??蛇x的,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:按照預(yù)先設(shè)置的分詞規(guī)則對(duì)字段信息進(jìn)行拆分,得到與字段信息對(duì)應(yīng)的分詞集合,其中,分詞集合用于記錄對(duì)字段信息進(jìn)行拆分后得到的分詞詞條??蛇x的,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:獲取預(yù)先設(shè)置的非法關(guān)鍵詞集合;獲取與非法關(guān)鍵詞集合中各非法關(guān)鍵詞對(duì)應(yīng)的權(quán)重值;將分詞集合中的分詞詞條,分別與非法關(guān)鍵詞集合中的非法關(guān)鍵詞進(jìn)行匹配,得到匹配結(jié)果;根據(jù)與非法關(guān)鍵詞對(duì)應(yīng)的權(quán)重值與匹配結(jié)果進(jìn)行加權(quán)運(yùn)算,得到字段信息的字段權(quán)重;將字段權(quán)重與預(yù)先設(shè)置的第二閾值進(jìn)行比對(duì),確定圖像信息是否為包含非法字段的非法圖像??蛇x的,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:通過對(duì)圖像信息中像素點(diǎn)的RGB顏色值進(jìn)行修正處理,得到與像素點(diǎn)對(duì)應(yīng)的預(yù)處理顏色值,其中,預(yù)處理顏色值中包括:紅色值、綠色值、藍(lán)色值和黃色值;根據(jù)預(yù)處理顏色值和像素點(diǎn)的位置信息,確定像素點(diǎn)在彩色通道中的第一像素特征值,其中,第一像素特征值與彩色通道對(duì)應(yīng);根據(jù)第一像素特征值,對(duì)圖像信息進(jìn)行提取處理,得到與彩色通道對(duì)應(yīng)的區(qū)域特征值??蛇x的,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:獲取預(yù)先設(shè)置的計(jì)算參數(shù);根據(jù)圖像信息中像素點(diǎn)的RGB顏色值、像素點(diǎn)的位置信息和計(jì)算參數(shù),確定像素點(diǎn)在灰度通道中的第二像素特征值,其中,第二像素特征值與彩色通道對(duì)應(yīng);根據(jù)第二像素特征值對(duì)圖像信息進(jìn)行提取處理,得到與灰度通道對(duì)應(yīng)的區(qū)域特征值??蛇x的,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:將與顏色通道對(duì) 應(yīng)的區(qū)域特征值分別與第一閾值進(jìn)行比對(duì),得到比對(duì)結(jié)果;根據(jù)比對(duì)結(jié)果,確定圖像信息中與顏色通道對(duì)應(yīng)的文本區(qū)域。可選的,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:獲取文本區(qū)域在圖像信息中的相對(duì)位置信息;根據(jù)文本區(qū)域的區(qū)域特征值,確定與文本區(qū)域?qū)?yīng)的顏色通道信息;根據(jù)相對(duì)位置信息和顏色通道信息,確定文本區(qū)域之間的關(guān)聯(lián)關(guān)系;將具有關(guān)聯(lián)關(guān)系的文本區(qū)域合并為新文本區(qū)域??蛇x的,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:按照預(yù)定方向?qū)ξ谋緟^(qū)域進(jìn)行投影處理,得到與方向?qū)?yīng)的文本區(qū)域的投影結(jié)果,其中,投影處理為沿預(yù)定方向?qū)ξ谋緟^(qū)域中每個(gè)區(qū)間內(nèi)的像素密度進(jìn)行統(tǒng)計(jì)處理,得到與方向?qū)?yīng)的像素密度的分布結(jié)果;根據(jù)投影結(jié)果確定文本區(qū)域中的文字走向;根據(jù)文字走向和投影結(jié)果對(duì)文本區(qū)域進(jìn)行順序分割,分割得到子字符區(qū)域,其中,每個(gè)子字符區(qū)域包含一個(gè)字符;通過字符識(shí)別引擎對(duì)子字符區(qū)域中的字符進(jìn)行識(shí)別,確定與子字符區(qū)域?qū)?yīng)的識(shí)別結(jié)果;根據(jù)文字走向和識(shí)別結(jié)果,生成字段信息。可選的,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:通過字符識(shí)別引擎對(duì)子字符區(qū)域進(jìn)行識(shí)別,得到與子字符區(qū)域?qū)?yīng)的初始識(shí)別結(jié)果,其中,初始識(shí)別結(jié)果中至少包括一個(gè)備選字符和與備選字符對(duì)應(yīng)的置信度;根據(jù)置信度,從初始識(shí)別結(jié)果中確定置信度最高的預(yù)定數(shù)量的備選字符作為識(shí)別結(jié)果??蛇x的,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:獲取預(yù)先設(shè)置的第一圖像特征向量,其中,第一圖像特征向量用于表征特定類型圖像的圖像特征;對(duì)非法圖像進(jìn)行特征向量提取,得到第二圖像特征向量;將第二圖像特征向量與第一圖像特征向量進(jìn)行比對(duì),確定非法圖像的圖像類型,其中,圖像類型至少包括:聊天截圖、非聊天截圖??蛇x的,存儲(chǔ)介質(zhì)被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:獲取圖像信息的圖像分別率;將圖像分別率與預(yù)先設(shè)置的標(biāo)準(zhǔn)圖像分辨率進(jìn)行比對(duì);當(dāng)圖像分別率不等于標(biāo)準(zhǔn)圖像分辨率時(shí),對(duì)圖像信息按標(biāo)準(zhǔn)圖像分辨率進(jìn)行等比例縮放。上述本申請(qǐng)實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。在本申請(qǐng)的上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中沒有詳述的部分,可以參見其他實(shí)施例的相關(guān)描述。在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的技術(shù)內(nèi)容,可通過其它的方式實(shí)現(xiàn)。其中,以上所描述的裝置實(shí)施例僅僅是示意性的,例如單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,例如多個(gè)單元或組件可 以結(jié)合或者可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另一點(diǎn),所顯示或討論的相互之間的耦合或直接耦合或通信連接可以是通過一些接口,單元或模塊的間接耦合或通信連接,可以是電性或其它的形式。作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上。可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。另外,在本申請(qǐng)各個(gè)實(shí)施例中的各功能單元可以集成在一個(gè)處理單元中,也可以是各個(gè)單元單獨(dú)物理存在,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中。上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用軟件功能單元的形式實(shí)現(xiàn)。集成的單元如果以軟件功能單元的形式實(shí)現(xiàn)并作為獨(dú)立的產(chǎn)品銷售或使用時(shí),可以存儲(chǔ)在一個(gè)計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中?;谶@樣的理解,本申請(qǐng)的技術(shù)方案本質(zhì)上或者說對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分或者該技術(shù)方案的全部或部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一臺(tái)計(jì)算機(jī)設(shè)備(可為個(gè)人計(jì)算機(jī)、服務(wù)器或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:U盤、只讀存儲(chǔ)器(ROM,Read-OnlyMemory)、隨機(jī)存取存儲(chǔ)器(RAM,RandomAccessMemory)、移動(dòng)硬盤、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。以上僅是本申請(qǐng)的優(yōu)選實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本
技術(shù)領(lǐng)域:
:的普通技術(shù)人員來說,在不脫離本申請(qǐng)?jiān)淼那疤嵯?,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本申請(qǐng)的保護(hù)范圍。當(dāng)前第1頁(yè)1 2 3 當(dāng)前第1頁(yè)1 2 3