欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種字符切分的方法和裝置的制作方法

文檔序號:6371972閱讀:200來源:國知局
專利名稱:一種字符切分的方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識別及處理技術(shù)領(lǐng)域,尤其涉及一種字符切分的方法和裝置。
背景技術(shù)
一般情況下,針對某種類型的字符,例如文檔影像中的中文字符、字母和數(shù)字,都會通過專門的獨立算法進行專門的切分,因為這樣的切分準確度最高。例如專門通過算法A來實現(xiàn)對漢字的切分,通過算法B對字母和數(shù)字切分,當出現(xiàn)數(shù)字、字母和中文字符混排的情況時,再寫一個算法C專門處理這種情況。這樣處理存在兩個問題,第一是沒有辦法做到通用切分,不能使用一種方法來保 證各種字符切分的準確度;第二是在實際使用各種切分方法時,有時候并不能預先確定一行字符的具體類型,一行字符可能有時候是全漢字類型,有時候是混排類型,當不能確定字符的具體類型時,就不能選用對應的具體算法來進行切分。也有研究人員曾提出一種基于識別反饋的粘連字符切分的方法,主要是針對粘連字符的切分處理,該方法具體實現(xiàn)的流程圖如圖I所示,主要通過搜索可能的切分位置,也就是找到可能的粘連字符,把粘連字符提取出來,然后進行切分和辨認,通過調(diào)用識別模塊對粘連字符進行識別,根據(jù)反饋結(jié)果找出可靠度最大的切分點。這種方法主要有以下缺點一是僅針對粘連字符來進行切分,不具有通用性;二是該方法并不支持多個識別引擎的反饋,很多時候一個識別引擎的識別結(jié)果可能不是最優(yōu)的,在不同的情況下,不同的識別引擎表現(xiàn)不同;三是該方法只是對給定的一個粘連字符進行切分,沒有考慮到粘連字符本身可能并不是由兩個獨立的字符粘連到一起,他們可能是其他字符的組成部分,即使這些字符被切分開了,由于沒有合并,那么這些字符也不能正確定位;四是粘連字符切分過程中要確定是漢字粘連還是字母數(shù)字粘連,一種粘連切分失敗后,在去判斷另外一種類型的粘連,并且把切分正確與否的決定權(quán)完全交給了識別模塊,這對識別模塊提出了很高的要求。實際上我們使用識別模塊的時候識別率并不是100%的;五是由于該方法只是考慮了單個粘連字符的處理,因此在實際應用中只能作為字符切分方法的一部分,并不是一個完整的技術(shù)方案。

發(fā)明內(nèi)容
本發(fā)明的目的是提出的一種字符切分的方法和裝置,能夠解決圖像中一行字符的通用切分問題,適用的字符類型包括中文字符、數(shù)字和字母。本發(fā)明通過充分利用單字字符本身的特征、字符之間間距的特征、單字識別核心庫的特征以及整體合并拆分策略來實現(xiàn)用通用的處理方式對漢字、數(shù)字和英文字母的任意組合進行識別切分。本發(fā)明的思想在于,對圖像中的一行字符進行預處理及初步切分,對初步切分過的每一個字符計算匹配分數(shù),建立行內(nèi)所有字符的字符匹配表,每一個字符或者字符組合得到的識別結(jié)果都允許由多個識別器來確定,這樣增強了準確性。最終的切分點以字符匹配表為基礎(chǔ),以一行內(nèi)所有字符的匹配分數(shù)最高為原則來確定。
為達此目的,本發(fā)明采用以下技術(shù)方案本發(fā)明的一個方面,提供了一種字符切分的方法,包括步驟A、輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像;B、利用提取連通域或投影方法對圖像中的一行字符進行第一次切分;C、對于第一次切分后得到的字符按照預定規(guī)則進行拆分和/或合并;D、對于經(jīng)過步驟C處理后得到的每個字符計算匹配分數(shù),建立一個二維的字符匹配表。E、按照一行內(nèi)所有字符加起來匹配分數(shù)最高的規(guī)則確定每個字符的切分點,進行第二次切分,得到最終切分結(jié)果。
上述技術(shù)方案中,優(yōu)選地,還包括步驟F、對步驟E得到的最終切分結(jié)果進行聚類處理,去掉干擾字符。上述技術(shù)方案中,優(yōu)選地,所述步驟A還包括去黑邊和去噪處理。上述技術(shù)方案中,優(yōu)選地,所述步驟C中的預定規(guī)則具體為當一個字符的最大寬度超過了第一預設(shè)值時,對這個字符進行拆分處理;當兩個相鄰字符的重合度大于第二預設(shè)值時,對這兩個相鄰字符進行合并處理。上述技術(shù)方案中,優(yōu)選地,所述步驟D中計算字符的匹配分數(shù)具體包括以下步驟步驟一首先,將第i個字符到第j個字符進行合并,并設(shè)置Aij的初始值A(chǔ)ij =0 ;步驟二 如果合并后的字符寬度大于所述第一預設(shè)值時轉(zhuǎn)至步驟八,否則繼續(xù)執(zhí)行步驟三;步驟三根據(jù)合并后的字符的外部信息及所有的識別引擎的信息確定合并后的字符類型A ;步驟四用一個還未參與過本次合并字符識別的識別引擎對所述合并后的字符進行識別,得到識別結(jié)果,確定合并后的字符類型B ;如果所有識別引擎都參與了識別,轉(zhuǎn)步驟八;步驟五如果A和B相同,則根據(jù)本次識別結(jié)果的置信度信息和合并字符的外部信息得到合并后的字符的本次匹配分數(shù)Bij ;如果A和B不同轉(zhuǎn)步驟四;步驟六取Aij和Bij中較大值作為第i個字符的匹配分數(shù);步驟七重復步驟四-步驟六;步驟八Aij計算完成。上述技術(shù)方案中,優(yōu)選地,還包括步驟用其他的識別引擎,分別重復識別步驟并計算匹配分數(shù),比較得到的各個匹配分數(shù),取最大的匹配分數(shù)作為第i個字符的匹配分數(shù);其中,當識別引擎的置信度信息表示不統(tǒng)一時,預先對置信度信息進行歸一化處理。根據(jù)本發(fā)明的另一個方面,還提供了一種字符切分的裝置,包括圖像預處理單元、字符第一次切分單元、字符拆分合并單元、匹配分數(shù)計算單元和字符第二次切分單元,上述單各元依次連接,其中所述圖像預處理單元,用于輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像;所述字符第一次切分單元,用于利用提取連通域或投影方法對圖像中的字符進行第一次切分;所述字符拆分合并單元,用于對于第一次切分后得到的不少于一個的字符按照預定規(guī)則進行拆分和/或合并;所述匹配分數(shù)計算單元,用于對于經(jīng)過第一次切分后得到的字符,建立一個二維的字符匹配表并計算每一個字符的匹配分數(shù); 所述字符第二次切分單元,用于按照一行內(nèi)所有字符加起來匹配分數(shù)最高的規(guī)則確定所述剩余的字符的切分點,進行第二次切分,得到最終切分結(jié)果。上述技術(shù)方案中,優(yōu)選地,還包括聚類單元,用于對步驟E得到的最終切分結(jié)果進行聚類處理,去掉干擾字符。上述技術(shù)方案中,優(yōu)選地,所述圖像預處理單元還用于去黑邊和去噪處理。上述技術(shù)方案中,優(yōu)選地,所述第一次切分單元進一步用于當一個字符的最大寬度超過了第一預設(shè)值時,對這個字符進行拆分處理;當兩個相鄰字符的重合度大于第二預設(shè)值時,對這兩個相鄰字符進行合并處理。采用了本發(fā)明的技術(shù)方案,能夠?qū)崿F(xiàn)對圖像中中文字符、英文字符和數(shù)字字符三種字符任意排列情況下的切分,使得在實際應用中不用根據(jù)字符類型去選擇切分算法,對于模板化的系統(tǒng)帶來了便利。同時本發(fā)明具有很強的擴展性,如果需要對其他類型的字符進行切分,只需要描述準確該類型字符的特征,如寬高比,字符間距等,并且有相應的識別引擎作支持即可。


圖I是本發(fā)明現(xiàn)有技術(shù)的流程圖。圖2是本發(fā)明中具體實施方式
中一種字符切分方法的流程圖。圖3是本發(fā)明中具體實施方式
中匹配分數(shù)計算的流程圖。圖4是本發(fā)明中具體實施方式
中一種字符切分裝置的結(jié)構(gòu)示意圖。
具體實施例方式以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例進行說明,應當理解,此處所描述的優(yōu)選實施例僅用于說明和解釋本發(fā)明,并不用于限定本發(fā)明。圖2是本發(fā)明具體實施方式
中一種字符切分的方法的流程圖。如圖2所示,該字符切分方法包括以下步驟步驟201 :輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像。圖像預處理的目的是將給定圖像處理成初步的字符切分時需要的二值或者灰度圖像類型,同時可能包括去黑邊,去噪等操作。步驟202 :在給定圖像進行預處理之后,利用提取連通域或者投影的算法或者其他方法來對字符進行初步切分。字符初步切分后,可能的情況是,一些字符切分成了單個字符;一些字符可能發(fā)生了粘連,例如兩個或者多個字符被切分成了一個字符;一個字符被切分成了多個字符,如一個漢字可能被切分成了兩個或者多個字符。步驟203 :對于初始切分后的字符即步驟202完成后的結(jié)果,進行初步的拆分和合并。本步驟里,拆分規(guī)則是根據(jù)已知條件中給定的每個字符最大的高度和寬度來進行的,當一個字符的最大寬度超多了要求的最大寬度那么這個字符一定要進行拆分。合并的規(guī)則是根據(jù)字符的重合度來進行的,當兩個字符的重合度大于50%,那么這兩個字符必須進行合并。步驟204 :經(jīng)過步驟203的處理后,所剩下的字符就是不能確定是保留,還是進行拆分或者合并操作,這個時候我們就建立一個二維的字符匹配表來計算每一個字符與其它字符的匹配情況。
假設(shè)經(jīng)過步驟203的處理后,一共有5個字符,那么我們需要計算以下表格中所列的數(shù)據(jù)
All A12 A13 A14 A15 A21 A22 A23 A2A A25~
A31 A32 A33 A34 A35~
A41 A42 A43 A44 A45~
A51 A52 A53 A54 A55~下面對上表進行說明l)Aij的意義是指合并第i個字符到第j個字符包括i和j之間的所有字符的匹配分數(shù);2)根據(jù)Aij的意義描述可知紅色部分的數(shù)據(jù)是不需要計算的,只需要計算紅色區(qū)域以外的數(shù)據(jù),因為Aij = Aji ;3) Aij的取值范圍為0-100 ;4) Aij的計算方式(含i = j的情況)如下a)如果合并第i個字符至第j個字符后超出了我們要求的字符的參數(shù)范圍,例如合并寬度超過了我們要求的最大字符寬度則Aij = 0 ;b)通過合并字符本身的特征(寬、高、字符間距等)以及識別引擎識別結(jié)果的置信度來確定一個最優(yōu)結(jié)果,所述識別引擎識別結(jié)果的置信度就是對于識別成功的每個字符,識別引擎給出的一個置信度的值,用來描述識別結(jié)果的可靠性。Aij的計算是本發(fā)明的核心,下面對Aij如何計算具體說明,如圖3所示步驟一首先,將第i個字符到第j個字符進行合并,并設(shè)置Aij的初始值A(chǔ)ij =0 ;步驟二 302 :如果合并后的字符寬度大于所述第一預設(shè)值時轉(zhuǎn)步驟八308。否則繼續(xù)執(zhí)行步驟三303 ;步驟三303 :根據(jù)合并后的字符的外部信息及所有的識別引擎的信息確定合并后的字符類型A;步驟四304 :用一個還未參與過本次合并字符識別的識別引擎對所述合并后的字符進行識別,得到識別結(jié)果,確定合并后的字符類型B ;如果所有識別引擎都參與了識別,轉(zhuǎn)步驟八308 ;步驟五305 :如果A和B相同,則根據(jù)本次識別結(jié)果的置信度信息和合并字符的外部信息得到合并后的字符的本次匹配分數(shù)Bij ;如果A和B不同轉(zhuǎn)步驟四304。;步驟六306 :取Aij和Bij中較大值作為第i個字符的匹配分數(shù);步驟七307 :重復步驟四304-至步驟六306 ;步驟八308 =Aij計算完成。 在上述計算Aij過程中,每一個識別引擎里都要描述可以識別的字符類型,以及該字符類型的外部信息。當使用多個識別引擎時,如果識別結(jié)果的置信度表示不統(tǒng)一,需要先對識別結(jié)果的置信度表示進行歸一化。步驟205 :按照一行內(nèi)所有字符加起來匹配分數(shù)最高的規(guī)則確定一行內(nèi)所有字符的切分點,進行第二次切分,得到最終切分結(jié)果。建立了字符匹配表之后就要根據(jù)字符匹配表來確定切分點。確定切分點的原則是保證全局最優(yōu)。就是說我們確定的切分結(jié)果必須保證一行內(nèi)所有字符加起來的匹配分數(shù)最高。這里需要注意的是一般來講一個字符不會被切分超過5部分,因此在確定一行字符切分點的時候最多只要判斷到5個字符合并的情況就可以了。在另一個優(yōu)選的具體實施方式
中,還可以在步驟205之后增加一個步驟206,用于去除切分結(jié)果中的干擾字符。步驟206 :步驟205完成后,字符的切分結(jié)果已經(jīng)出來了,但是可能存在一些并非真正的字符,而是干擾,因此在本步驟對所有字符進行聚類,去掉干擾字符,并輸出最終字符切分結(jié)果。對字符進行聚類是指我們可以根據(jù)外部條件來對已經(jīng)切分好的字符進行分類,t匕如我們可以將寬高比為I : I的字符分為一類,不滿足這個條件的分為另一類。通過聚類操作,我們可以最終只選用我們需要的那一類字符。另外,關(guān)于字符匹配表的計算方式,可以考慮不使用識別核心的反饋結(jié)果,因為使用識別核心進行識別,會有一個識別置信度的結(jié)果,在計算Aij時要考慮這個置信度,如果不用識別核心的反饋,那么計算Ai j時就可以只考慮其他的因素了。本發(fā)明的另一個方面,還提供了一種字符切分的裝置,包括圖像預處理單元401、字符第一次切分單元402、字符拆分合并單元403、匹配分數(shù)計算單元404和字符第二次切分單元405,上述單各元依次連接,其中所述圖像預處理單元401,用于輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像,優(yōu)選地,該單元還用于去黑邊和去噪處理。所述字符第一次切分單元402,用于利用提取連通域或投影方法對圖像中的字符進行第一次切分;本具體實施方式
中切分規(guī)則具體為,當一個字符的最大寬度超過了第一預設(shè)值時,對這個字符進行拆分處理;當兩個相鄰字符的重合度大于第二預設(shè)值時,對這兩個相鄰字符進行合并處理。
所述字符拆分合并單元403,用于對于第一次切分后得到的不少于一個的字符按照預定規(guī)則進行拆分和/或合并;所述匹配分數(shù)計算單元404,用于對于經(jīng)過第一次切分后得到的字符,建立一個二維的字符匹配表并計算每一個字符的匹配分數(shù);所述字符第二次切分單元405,用于按照一行內(nèi)所有字符加起來匹配分數(shù)最高的規(guī)則確定所述剩余的字符的切分點,進行第二次切分,得到最終切分結(jié)果。上述技術(shù)方案中,另一種優(yōu)選方式中,還包括聚類單元406,用于對得到的最終切分結(jié)果進行聚類處理,去掉干擾字符。 在對單一類型的字符進行切分的時候,不使用識別核心的反饋可以提高字符切分速度,但是有識別核心的反饋結(jié)果無疑會提高切分的準確率。在實際使用本發(fā)明的時候可以根據(jù)速度和性能的要求情況作一個平衡。本發(fā)明能夠提高字符切分的準確性,并且由于其通用性,替代了之前單獨字符類型的字符切分算法使得識別系統(tǒng)的模板化更加容易。在證件識別系統(tǒng)中本算法對字符切分的測試結(jié)果如下
權(quán)利要求
1.一種字符切分的方法,其特征在于,包括步驟 A、輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像; B、利用提取連通域或投影方法對圖像中的一行字符進行第一次切分; C、對于第一次切分后得到的字符按照預定規(guī)則進行拆分和/或合并; D、對于經(jīng)過步驟C處理后得到的每個字符計算匹配分數(shù),建立一個二維的字符匹配表。
E、按照一行內(nèi)所有字符加起來匹配分數(shù)最高的規(guī)則確定每個字符的切分點,進行第二次切分,得到最終切分結(jié)果。
2.根據(jù)權(quán)利要求I所述的字符切分的方法,其特征在于,還包括步驟 F、對步驟E得到的最終切分結(jié)果進行聚類處理,去掉干擾字符。
3.根據(jù)權(quán)利要求I或2所述的字符切分的方法,其特征在于,所述步驟A還包括去黑邊和去噪處理。
4.根據(jù)權(quán)利要求I或2所述的字符切分的方法,其特征在于,所述步驟C中的預定規(guī)則具體為 當一個字符的最大寬度超過了第一預設(shè)值時,對這個字符進行拆分處理; 當兩個相鄰字符的重合度大于第二預設(shè)值時,對這兩個相鄰字符進行合并處理。
5.根據(jù)權(quán)利要求4所述的字符切分的方法,其特征在于,所述步驟D中計算字符的匹配分數(shù)具體包括以下步驟 步驟一首先,將第i個字符到第j個字符進行合并,并設(shè)置Aij的初始值A(chǔ)ij = O ;步驟二 如果合并后的字符寬度大于所述第一預設(shè)值時轉(zhuǎn)至步驟八,否則繼續(xù)執(zhí)行步驟三; 步驟三根據(jù)合并后的字符的外部信息及所有的識別引擎的信息確定合并后的字符類型A ; 步驟四用一個還未參與過本次合并字符識別的識別引擎對所述合并后的字符進行識另IJ,得到識別結(jié)果,確定合并后的字符類型B ;如果所有識別引擎都參與了識別,轉(zhuǎn)步驟八;步驟五如果A和B相同,則根據(jù)本次識別結(jié)果的置信度信息和合并字符的外部信息得到合并后的字符的本次匹配分數(shù)Bij ;如果A和B不同轉(zhuǎn)步驟四; 步驟六取Aij和Bij中較大值作為第i個字符的匹配分數(shù); 步驟七重復步驟四-步驟六; 步驟八:Aij計算完成。
6.根據(jù)權(quán)利要求5所述的字符切分的方法,其特征在于,還包括步驟 用其他的識別引擎,分別重復識別步驟并計算匹配分數(shù),比較得到的各個匹配分數(shù),取最大的匹配分數(shù)作為第i個字符的匹配分數(shù); 其中,當識別引擎的置信度信息表示不統(tǒng)一時,預先對置信度信息進行歸一化處理。
7.一種字符切分的裝置,其特征在于,包括圖像預處理單元、字符第一次切分單元、字符拆分合并單元、匹配分數(shù)計算單元和字符第二次切分單元,上述單各元依次連接,其中 所述圖像預處理單元,用于輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像;所述字符第一次切分單元,用于利用提取連通域或投影方法對圖像中的字符進行第一次切分;所述字符拆分合并單元,用于對于第一次切分后得到的不少于一個的字符按照預定規(guī)則進行拆分和/或合并; 所述匹配分數(shù)計算單元,用于對于經(jīng)過第一次切分后得到的字符,建立一個二維的字符匹配表并計算每一個字符的匹配分數(shù); 所述字符第二次切分單元,用于按照一行內(nèi)所有字符加起來匹配分數(shù)最高的規(guī)則確定所述剩余的字符的切分點,進行第二次切分,得到最終切分結(jié)果。
8.根據(jù)權(quán)利要求7所述的字符切分的裝置,其特征在于,還包括聚類單元,用于對步驟E得到的最終切分結(jié)果進行聚類處理,去掉干擾字符。
9.根據(jù)權(quán)利要求7或8所述的字符切分的裝置,其特征在于,所述圖像預處理單元還用于去黑邊和去噪處理。
10.根據(jù)權(quán)利要求7或8所述的字符切分的裝置,其特征在于,所述第一次切分單元進一步用于 當一個字符的最大寬度超過了第一預設(shè)值時,對這個字符進行拆分處理; 當兩個相鄰字符的重合度大于第二預設(shè)值時,對這兩個相鄰字符進行合并處理。
全文摘要
本發(fā)明公開了一種字符切分的方法,首先,輸入待處理的圖像,將所述圖像轉(zhuǎn)換成二值或灰度圖像;利用提取連通域或投影方法對圖像中的一行字符進行第一次切分;對于第一次切分后得到的字符按照預定規(guī)則進行拆分和/或合并;對于經(jīng)過以上步驟處理后得到的每個字符計算匹配分數(shù),根據(jù)這些分數(shù)建立一個二維的字符匹配表;按照一行內(nèi)所有字符加起來匹配分數(shù)最高的規(guī)則確定一行內(nèi)所有字符的切分點,進行第二次切分得到最終切分結(jié)果。采用了本發(fā)明的技術(shù)方案,能夠解決圖像中一行字符的通用切分問題,對漢字、數(shù)字和英文字母的任意組合進行切分。
文檔編號G06K9/00GK102750534SQ20121021050
公開日2012年10月24日 申請日期2012年6月26日 優(yōu)先權(quán)日2012年6月26日
發(fā)明者張雪玲 申請人:北京文通科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
青海省| 化州市| 栾川县| 乌拉特后旗| 深水埗区| 合肥市| 巴彦县| 梁河县| 赤峰市| 会宁县| 隆子县| 和平区| 东海县| 茶陵县| 治多县| 青海省| 太湖县| 远安县| 绥化市| 报价| 邻水| 高淳县| 恩平市| 沂水县| 元朗区| 陕西省| 朝阳市| 兖州市| 毕节市| 弥渡县| 石棉县| 靖远县| 绥棱县| 娄烦县| 天台县| 云龙县| 井研县| 凌云县| 宜都市| 股票| 陆川县|