專利名稱:讀取字符的方法和讀取郵政地址的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及字符讀取方法,且更具體地說是涉及字符串的讀取方法,特別是寫在郵件表面上的包括漢字字符的郵政地址的手寫字符串。
對(duì)于寫在郵件等等的表面上的郵政地址的字符串的自動(dòng)讀取,首先將郵件表面的圖象轉(zhuǎn)換成電信號(hào),并隨后檢測(cè)其中寫有字符串的區(qū)域。隨后,根據(jù)檢測(cè)區(qū)域的視頻信號(hào),對(duì)字符串的字符進(jìn)行分類。字符串的每一個(gè)字符按照以下程序進(jìn)行分類。
(1)被認(rèn)為是字符串的字符的圖象圖案通過分割而得到提取(字符段)。
(2)對(duì)分割后的字符圖案的字符種類(字符編碼)分類(字符分類)。
(3)通過連接分類后的字符種類而形成的字符串,被與寄存在一個(gè)表(字符串字典)中的郵政地址等等的字符串相比較,從而將字符串識(shí)別為一定的地址等等(字符串匹配)。
在上述過程中,項(xiàng)目(1)的字符分割是最困難的,因?yàn)橛懈鞣N情況的書寫表面,包括手寫字符、其一個(gè)字符可以由多個(gè)其他字符組成的漢字字符、以及以豎向或橫向形式書寫的字符串,如在下面結(jié)合
圖1和圖34A所描述的。
關(guān)于對(duì)從書寫表面讀出的字符串進(jìn)行字符分割的傳統(tǒng)方案,已知過度分割方法是有效的。在該過度分割方法中,字符串的圖象信號(hào)被分成有可能作為字符的多種字符圖案,各個(gè)分解的字符圖案根據(jù)字符(字符種類)而得到分類,且根據(jù)字符圖案的分類后的字符種類的類似性和根據(jù)字符種類的字符串與一個(gè)參考字典中的字符串的比較,來確定字符圖案是正確的。
作為有關(guān)過度分割方法的現(xiàn)有技術(shù)的一個(gè)具體例子,由Fujimawa等人提出了根據(jù)字符分類來測(cè)試識(shí)別候選字符的方案(在The Proceeding ofthe 1984 Institute IEIC Fall Conference“AnAugmented Segmentation Algorithm for Connected HandwrittenNumerals”中進(jìn)行了描述)。
根據(jù)字符的形狀來測(cè)試識(shí)別候選字符圖案的另一種方案,已經(jīng)由Ishidera等人提出(在The Proceeding of The 1995 Institute IEICSpring Conference D-576“A Segmentation Method ofAddressRecognition”中進(jìn)行了描述)。
根據(jù)字符分類和字符串比較來測(cè)試假定的方案,已經(jīng)由Murase等人提出(在The Translation of the Institute of Electronics,Information and Communication Engineers,(D)Vol.J69-D,No.9“Segmentation and Recognition of Hand-written CharacterStringUsing Linguistic Information”中進(jìn)行了描述);并且還由Ooi提出(在TECHNICAL REPORT OF IECE PRU 92-40“A Method toRecognize the Street Number Portion of an Address”中進(jìn)行了描述。)根據(jù)字符寬度、字符間距和字符間隔而判定字符分割的正確性的一種方案,在The Transaction of the Institute of Electronics,Information and Communication Engineers,REPORT OF IECE(D)J68-D,No.12,pp.2123-2131中進(jìn)行了描述。已知的還有根據(jù)字符圖案和關(guān)于字符種類的類似性信息來判定字符分割的正確性的一種方案,如在TheTransaction of the Institute of Electronics,Information andCommunication Engineers,REPORT OF IECE(D)J68-D,No.4,pp.765-772中描述的。
然而,上述的現(xiàn)有技術(shù)過度分割方法的方案,都遇到了正確字符分割的困難,如在以下的例子中所顯示的。
圖1顯示了手寫在郵件上的郵政地址101,其中街道號(hào)碼部分被可視地識(shí)別為漢字?jǐn)?shù)字“三—二—一”。在此情況下,根據(jù)上述過度分割方法的字符讀取設(shè)備在虛線表示的邊界處實(shí)施字符圖案分割。即,字符圖案的豎向和水平長(zhǎng)度和豎向/水平長(zhǎng)度比根據(jù)各種字符種類而有顯著的變化,因而難于從六種可能的情況103中選出正確的字符串。
圖33A顯示了有大字符間隔的手寫字符。該字符串在虛線所示的邊界處得到分割,從而產(chǎn)生了如圖34A所示的識(shí)別候選字符圖案。在此圖中,候選圖案的關(guān)系是以代表字符圖案的邊界的節(jié)點(diǎn)和代表字符圖案的弧來圖形表示的,且它被稱為“分割假設(shè)網(wǎng)絡(luò)”。
根據(jù)上述過度分割方法的正確字符圖案分割,是借助在分割假設(shè)網(wǎng)絡(luò)上找出從開始節(jié)點(diǎn)
至結(jié)束節(jié)點(diǎn)⑨的最優(yōu)路徑的過程,而進(jìn)行的。在圖34A中,由弧代表的字符圖案按照它們的字符種類而得到分類。在此情況下,“木”、“反”和“板”都表示高度的類似性,因而現(xiàn)有技術(shù)的方案難于分割該字符串。
在上述的現(xiàn)有技術(shù)方案中,F(xiàn)ujisawa等人的方案,以及Ishidera等人的方案,是用于判定各個(gè)字符圖案的合法性的,但沒有采用相鄰字符圖案間的關(guān)系,而Ooi和Murase提出的方案利用了相鄰字符圖案間的關(guān)系來匹配字符串,但這些方案沒有使用相鄰的字符的有關(guān)特征值信息—諸如間隔。
因此,本發(fā)明的主要目的,是實(shí)現(xiàn)一種字符讀取方法,它基于從一串分割的字符圖案判定正確的字符圖案和對(duì)字符圖案準(zhǔn)確分類。
本發(fā)明的另一目的,是實(shí)現(xiàn)一種方法,它從地址字符串的視頻信號(hào)準(zhǔn)確讀取郵政地址字符,其中地址字符串由書寫在郵件表面上的城鎮(zhèn)名稱部分和街道號(hào)碼部分組成。
本發(fā)明的又一個(gè)目的,是為基于過度分割方法的地址字符串的讀取實(shí)現(xiàn)一種方法—它通過利用地址字符串中所注意的圖案與相鄰圖案的的關(guān)系特征值來準(zhǔn)確地進(jìn)行字符圖案分割,其中只根據(jù)字符分類和字符串匹配不能對(duì)該地址字符串的候選字符圖案分割進(jìn)行正確的測(cè)試。
為了實(shí)現(xiàn)上述目的,本發(fā)明的字符讀取方法包括第一步驟,組合所要分類的字符串中的相連的部分(例如由相繼的黑象素形成的筆劃)—該字符串已經(jīng)借助圖象輸入裝置進(jìn)行了電子成象,從而將該字符串分割成具有作為字符的可能性的字符圖案(還沒有得到分類的分割字符圖案在以下將被稱為“暫定字符圖案”);第二步驟,通過訪問一個(gè)字符分類字典來實(shí)施暫定字符圖案的字符分類,從而獲得暫定字符圖案的從屬信息(識(shí)別候選字符和暫定字符圖案與識(shí)別候選字符的類似性);第三步驟,獲得暫定字符圖案的邊界信息;第四步驟,通過利用在第二步驟中獲得的識(shí)別候選字符作為關(guān)鍵字來訪問一個(gè)分割字典—該字典包含邊界信息,來獲得第三步驟中獲得的暫定字符圖案的邊界信息的可信性,并對(duì)暫定字符圖案進(jìn)行加權(quán);第五步驟,根據(jù)暫定字符圖案的加權(quán)來確定字符分割;以及第六步驟,通過對(duì)一組分類的字符種類使用字符分類字典而實(shí)施字匹配—其中該組分類的字符種類是從第五步驟中確定的暫定字符圖案產(chǎn)生的,并標(biāo)明字符串的各字符。
在采用該字符讀取方法讀取由城鎮(zhèn)名稱部分和街道號(hào)碼部分組成的郵政地址的字符串的情況下,字符串的圖象被轉(zhuǎn)換成電信號(hào),從該電圖象信號(hào)提取出字符串區(qū),且在上述的第一步驟中得到分割的字符串的相連部分得到組合,從而產(chǎn)生若干暫定字符圖案。
各個(gè)暫定字符圖案都經(jīng)歷利用字符分類字典的字符分類,從而獲得類似暫定字符圖案的候選字符的信息。地址的城鎮(zhèn)名稱部分利用候選字符的信息并訪問一個(gè)城鎮(zhèn)名稱字典而讀取,且街道號(hào)碼部分的開頭位置得到檢測(cè)。城鎮(zhèn)名稱字典包含實(shí)際上所有可能的城鎮(zhèn)名稱。
通過檢測(cè)街道號(hào)碼部分的開頭位置,獲得了街道號(hào)碼的暫定字符圖案的邊界信息,且通過訪問字符串字典而獲得該邊界信息的可信性。在考慮該可信性的情況下,再次實(shí)施街道號(hào)碼部分的字符的暫定字符圖案的字符分割,且通過利用類似于所產(chǎn)生的暫定字符圖案的候選字符信息并通過訪問街道號(hào)碼字典,而識(shí)別街道號(hào)碼部分的字符。街道號(hào)碼字典包含所有現(xiàn)存的街道號(hào)碼的字符信息。
根據(jù)本發(fā)明的另一種最佳形式,當(dāng)對(duì)假定的合法性的評(píng)價(jià)出現(xiàn)了每種可能類型的誤差時(shí)上述第三步驟的邊界信息是外部形式懲罰—該外部形式懲罰是基于各個(gè)假定的字符圖案與相鄰字符圖案的關(guān)系特征值的,其中該假定使得因誤差類型的不正確分割產(chǎn)生各種假定的分割字符圖案。
如上所述,本發(fā)明的字符讀取方法是基于字符串分割方案和字符圖案的假定字符圖案的整體邊界信息方案上的,其中從字符分類獲得的類似性反映在字符分割上,從而使兩個(gè)方案彼此互補(bǔ),從而能夠準(zhǔn)確地分割即使具有不規(guī)則的字符寬度、字符間距、和字符間隔的字符串,以根據(jù)有效信息的最優(yōu)使用來進(jìn)行字符分類。
在根據(jù)所有字符共同的字符寬度、字符間距和字符間隔 手寫字符串的假定值處理手寫字符串的字符分割的困難時(shí),本發(fā)明的方法通過訪問字符串字典比較字符圖案的特征值,其中該字典信號(hào)是為字符分割的假定的測(cè)試而準(zhǔn)備的,從而評(píng)價(jià)反映在字符分割上的可信性。該字符串字典包含圖案的可信性相對(duì)于特征值的可能分布。雖然可信性的計(jì)算需要大量的人力、時(shí)間和基于經(jīng)驗(yàn)的知識(shí),本發(fā)明的方法使得能夠通過只在屏幕上顯示假定的字符分割,而對(duì)各個(gè)字符種類的最優(yōu)加權(quán)的可信性進(jìn)行評(píng)價(jià),從而使操作者只需要選擇正確的假定字符分割。
圖1顯示了引起現(xiàn)有技術(shù)方案的字符分割的不確定性的輸入圖象的一個(gè)例子;圖2是流程圖,顯示了根據(jù)本發(fā)明的一個(gè)實(shí)施例的字符讀取方法;圖3是實(shí)施本發(fā)明的字符讀取方法的字符讀取設(shè)備的框圖;圖4是用于說明圖2的字符串提取過程204的圖;圖5用于說明圖2的豎向/水平形式鑒別過程205;圖6用于說明圖2的與輸入圖象相對(duì)應(yīng)的暫定圖案生成過程206;圖7顯示了圖2中的圖案表219的數(shù)據(jù)結(jié)構(gòu);圖8是概念圖,顯示了圖2的暫定圖案鑒別過程209唯一確定的假定字符圖案的串;圖9用于說明圖2的格式產(chǎn)生過程210和城鎮(zhèn)匹配過程211;圖10用于說明圖2的字符分割循環(huán)確定過程215,用于處理街道號(hào)碼部分中的漢字號(hào)碼和阿拉伯?dāng)?shù)字號(hào)碼;圖11用于說明根據(jù)輸入圖象與假定字符圖案之間的對(duì)應(yīng)性的街道號(hào)碼部分的字符分類;圖12用于說明圖10的假定字符圖案的可信性的計(jì)算過程;圖13顯示了圖案的可信性計(jì)算和街道號(hào)碼部分的假定字符分割的弧的加權(quán)的結(jié)果;圖14顯示了街道號(hào)碼部分的字符分割的循環(huán)確定處選擇的字符分割;圖15顯示了通過將城鎮(zhèn)名稱部分和街道號(hào)碼部分的識(shí)別結(jié)果結(jié)合起來而產(chǎn)生的整個(gè)地址字符串的識(shí)別結(jié)果;圖16是一個(gè)圖,顯示了屏幕上的顯示的一個(gè)工具的例子,工具用于維護(hù)和擴(kuò)充本發(fā)明的地址識(shí)別設(shè)備的功能以及用于建立和修改各字典;圖17是流程圖,顯示了本發(fā)明的總體處理的一個(gè)例子;圖18顯示了本發(fā)明的一個(gè)實(shí)施例;圖19顯示了圖案與它們的邊界之間的關(guān)系;圖20是表,顯示了包含分割假設(shè)網(wǎng)絡(luò)的弧的圖案表的結(jié)構(gòu);圖21是表,顯示了包含分割假設(shè)網(wǎng)絡(luò)的節(jié)點(diǎn)的節(jié)點(diǎn)表的結(jié)構(gòu);圖22是流程圖,顯示了外部形式懲罰的計(jì)算過程;圖23是表,顯示了分割誤差的類型;圖24是流程圖,顯示了分割誤差評(píng)價(jià)過程;圖25顯示了用在該分割誤差評(píng)價(jià)過程中的特征值;圖26顯示了分割誤差評(píng)價(jià)過程的原理;圖27是流程圖,顯示了地址字典匹配過程;圖28顯示了字典匹配過程的原理;圖29顯示了取樣收集工具在屏幕上顯示的一個(gè)例子;圖30是流程圖,顯示了參數(shù)字典的學(xué)習(xí);圖31是表,顯示了參數(shù)字典的結(jié)構(gòu);圖32是流程圖,顯示了外部形式懲罰計(jì)算過程;圖33A和33B顯示了所要識(shí)別的地址字符串的例子;圖34A和34B顯示了分割假設(shè)網(wǎng)絡(luò)和假定的分割誤差的例子。
圖2是流程圖,顯示了根據(jù)本發(fā)明的實(shí)施例的字符讀取方法。該實(shí)施例被應(yīng)用到自動(dòng)字符讀取器,用于讀取書寫在郵件表面上的郵政地址。由城鎮(zhèn)名稱和街道號(hào)碼組成的郵政地址的字符串的讀取過程是以如下方式進(jìn)行的。
郵件表面201用成象裝置(掃描器)成象,從而形成視頻信號(hào)(202),從視頻信號(hào)中提取出地址信息塊(203),且根據(jù)地址塊的圖象信息分割字符串(204)。
帶有所要分割的字符串的圖象信息,經(jīng)歷豎向形式或水平形式的鑒別(205),且處理模式根據(jù)結(jié)果而得到切換(221)。這些處理201-221是根據(jù)傳統(tǒng)的方案進(jìn)行的。
已經(jīng)用電子設(shè)備實(shí)施了自動(dòng)讀取書寫在郵件上的省名稱、城市名稱、城鎮(zhèn)名稱等等的字符串的各種方法。例如日本專利公開JP-A-Hei-2-64882公開了根據(jù)不同的字符分割處理的地址識(shí)別,該識(shí)別是用于從城鎮(zhèn)名稱開頭的一個(gè)字符串部分和街道號(hào)碼的另一字符串部分的。日本專利公開JP-A-Hei-5-151389公開了一種方法,用于根據(jù)對(duì)郵政編碼的位置的先前檢測(cè)來檢測(cè)郵件表面上書寫有地址的區(qū)域。
日本專利公開No.60-41396公開了一種方法,用于根據(jù)對(duì)塊圖案的高度的測(cè)量和對(duì)具有相同高度的字符串的檢測(cè),來分割地址塊中的字符串。日本專利公開JP-A-Sho-63-18785公開了一種方法,用于根據(jù)對(duì)地址塊中的字符的水平長(zhǎng)度和豎向長(zhǎng)度的估計(jì)和這些長(zhǎng)度的比較,來區(qū)分分割后的字符串的豎向或水平形式(字符串的方向)。
隨后,通過將圖象信息的字符串中相繼的黑象素(即筆劃)組合起來,在可能形成字符的位置進(jìn)行假定字符圖案的分割處理。對(duì)假定字符圖案分割的這種處理,將被稱為“暫定圖案生成”(206)。假定的字符圖案,除了所要識(shí)別的正確字符圖案之外,還可以包括不適當(dāng)?shù)膱D案。分割出的假定的字符圖案被寄存在圖案表219中。假定的字符圖案和圖案表219將在后面結(jié)合圖6和7進(jìn)行詳細(xì)描述。
寄存在圖案表219中的各個(gè)假定的字符圖案根據(jù)字符分類字典208受到字符識(shí)別(207)。在字符分類處理中,作為邊界信息而獲得若干個(gè)識(shí)別候選字符(它們與各個(gè)假定的字符圖案類似)、識(shí)別候選字符與假定的字符圖案的類似性、假定的字符圖案在字符串上的位置、關(guān)于相連的部分(相繼的黑象素)的號(hào)碼的信息、以及假定的字符圖案的屬性信息。識(shí)別候選字符和邊界信息與各個(gè)假定的字符圖案相對(duì)應(yīng)地被存儲(chǔ)在圖案表219中。根據(jù)當(dāng)已經(jīng)存儲(chǔ)有識(shí)別候選字符和邊界信息的圖案表219,為字符分割選擇適當(dāng)?shù)募俣ǖ淖址麍D案(209)。從與確定字符分割時(shí)選擇出的字符圖案相對(duì)應(yīng)的識(shí)別候選字符中,產(chǎn)生出一組識(shí)別候選字符,即一個(gè)識(shí)別候選字符串(210)。為各個(gè)字符圖案的識(shí)別候選字符串,寄存直到低級(jí)候選字符的各種字符種類。這種寄存的字符種類將被稱為“格子”。
進(jìn)行把格子與城鎮(zhèn)名稱字典220相比較的城鎮(zhèn)匹配(211),從而為地址的城鎮(zhèn)名稱字符產(chǎn)生適當(dāng)?shù)淖R(shí)別字符串。城鎮(zhèn)名稱字典220包含所有現(xiàn)存的城鎮(zhèn)名稱。當(dāng)由城鎮(zhèn)匹配過程211進(jìn)行的城鎮(zhèn)名稱字符讀取完成時(shí),城鎮(zhèn)名稱的字符串的最后一個(gè)字符得到確定,且街道號(hào)碼的開頭位置信息被獲得。
在獲得街道號(hào)碼的開頭位置信息時(shí),假定的字符圖案的豎向和水平長(zhǎng)度、豎向/水平比值、圖案間隔、相連部分的號(hào)碼等信息(稱為“圖案周邊信息”)或者圍繞暫定圖案的信息得到提取(212)。利用分割字典214來計(jì)算提取的周邊信息的可信性(213)。計(jì)算出的可信性作為相應(yīng)的假定的字符圖案的屬性被存儲(chǔ)在圖案表219中。
根據(jù)該可信性再次選擇圖案表219中的一個(gè)假定的字符圖案,以取代前面的選擇。即,確定字符分割以取代前面的確定,從而只使街道號(hào)碼與在暫定圖案鑒別過程209中選定的假定的字符圖案的街道號(hào)碼不同(215)。在此循環(huán)字符分割確定215之后,根據(jù)該信息重新產(chǎn)生一個(gè)格子(216)。利用街道號(hào)碼字典222,為新產(chǎn)生的格子進(jìn)行街道匹配(217),且執(zhí)行街道號(hào)碼字符識(shí)別。街道號(hào)碼字典包含表示所有街道號(hào)碼的所有字符。其結(jié)果與已經(jīng)由城鎮(zhèn)匹配(211)識(shí)別的城鎮(zhèn)名稱相結(jié)合,從而完成整個(gè)地址的識(shí)別(218)。
以下描述圖2所示的各個(gè)處理的細(xì)節(jié)和執(zhí)行這些處理的設(shè)備。從視頻信號(hào)輸入202至豎向/水平模式切換221的處理,與現(xiàn)有技術(shù)方案的相同,而從暫定圖案生成過程206至城鎮(zhèn)匹配211的處理是在上述出版物TheTransaction of the Institute of Electronics,Information andCommunication Engineers,(D)J68-D,No.4,pp.765--772中描述的技術(shù)。
圖3顯示了執(zhí)行上述地址讀取方法的設(shè)備的設(shè)置。在此圖中,箭頭表示郵件的流向。一個(gè)視頻信號(hào)202由掃描器301輸入。為了獲得讀取地址的時(shí)間,在郵件傳送路徑上提供了一個(gè)延遲線路314。掃描器301由一個(gè)輸入/輸出電纜304連接到一個(gè)字符識(shí)別設(shè)備312,后者通過另一輸入/輸出電纜305而與分檢器303相連。
字符識(shí)別設(shè)備312具有用于連接內(nèi)部裝置的內(nèi)部總線313;I/O接口306,用于與掃描器301通信;運(yùn)算處理裝置307,它控制整個(gè)設(shè)備312并實(shí)施地址讀取處理;I/O接口308,用于與分檢器303進(jìn)行通信;鍵盤309,用于啟動(dòng)操作等等,CRT單元310,用于顯示處理狀態(tài);以及存儲(chǔ)器311,用于存儲(chǔ)用于地址識(shí)別的表、程序和字典。
圖4說明了從視頻信號(hào)輸入202至字符串提取204的處理。407表示的是地址塊定位處理203從視頻信號(hào)202提取的地址塊的圖象。標(biāo)號(hào)403、404和405顯示的是通過把包括地址塊407的黑象素投影到與y軸402平行的軸408上而畫出的柱形圖。根據(jù)這些柱形圖的值,估計(jì)出如虛線406所示的字符串的頂部和底部的y軸坐標(biāo),且地址線的字符串得到提取(204)。
圖5顯示了豎向/水平形式鑒別過程205。標(biāo)號(hào)501顯示的是水平書寫的字符串的圖象。標(biāo)號(hào)502和503表示的是該字符串的開始字符和結(jié)束字符的字符圖案,且標(biāo)號(hào)505和509是從字符串完整地提取的這些字符圖案。標(biāo)號(hào)506和510表示的是從字符圖案502和503導(dǎo)出但被圖案轉(zhuǎn)動(dòng)處理504和511轉(zhuǎn)動(dòng)了90°的字符圖案。這些字符圖案受到字符分類(507)。所產(chǎn)生的類似性的值得到比較(508),且根據(jù)比較的結(jié)果實(shí)施書寫的豎向/水平形式鑒別處理205。特征提取處理根據(jù)該結(jié)果而在豎向形式與水平形式之間切換(圖2的221)。
與利用圖象的布局信息的形式鑒別(它經(jīng)常對(duì)包括不符合標(biāo)準(zhǔn)布局的地址字符串的輸入圖象造成錯(cuò)誤判定)不同,本發(fā)明的該實(shí)施例—它利用字符識(shí)別本身來實(shí)施形式鑒別—進(jìn)行可靠的豎向/水平形式鑒別過程。在地址字符串的第一和最后一個(gè)字符與被轉(zhuǎn)動(dòng)了90°的那些字符之間的類似性沒有什么不同的情況下,與第一和最后字符相鄰的字符被取出并經(jīng)歷相同形式的判定處理。即通過避免諸如“田”和“山”這樣在轉(zhuǎn)動(dòng)90°后類似性幾乎沒有變化的漢字字符,而是根據(jù)適合于判定的字符進(jìn)行豎向/水平形式鑒別過程,從而增大了形式鑒別的精度。
圖6用于說明與輸入圖象對(duì)應(yīng)的假定的字符圖案。為了識(shí)別手寫的地址字符串601,圖2的暫定圖案生成過程206在字符邊界(由虛線603-i表示,其中i=1,2,……n)處分割輸入圖象的字符串。由圓圈中的1至8表示并標(biāo)為603-i(其中i=1,2,……n)的點(diǎn),被稱為“節(jié)點(diǎn)”。連接兩個(gè)相鄰節(jié)點(diǎn)的曲線604被稱為“弧”,且與這些弧604對(duì)應(yīng)的圖案605、607、……611,是假定的字符圖案。即,圖中右邊所示的是分割假設(shè)網(wǎng)絡(luò)。例如,為了識(shí)別字符圖案“兵”,除了圖案“兵”605之外,還有可能的假定的字符圖案“丘”606和“八”607。類似地,對(duì)于字符圖案“可”,除了圖案“可”610之外,還有可能的分割字符圖案“一”609和“
”611。各個(gè)假定的字符圖案都存在于由一條弧連接的節(jié)點(diǎn)之間。
圖7顯示了存儲(chǔ)在圖案表219中的數(shù)據(jù)。701表示的是一個(gè)指針,它指向存儲(chǔ)著被分割成假定的字符圖案的圖象信息的存儲(chǔ)單元。存儲(chǔ)單元702存儲(chǔ)與該假定的字符圖案對(duì)應(yīng)的弧的可信性(該可信性表示了根據(jù)節(jié)點(diǎn)之間的距離而不同的權(quán))。存儲(chǔ)單元703存儲(chǔ)假定的字符圖案中相連的組成部分的數(shù)目(例如,對(duì)于字符圖案“三”該數(shù)目是三個(gè),且對(duì)于字符圖案“八”則是兩個(gè)),且存儲(chǔ)單元704存儲(chǔ)該假定的字符圖案的x-y坐標(biāo)(圍繞假定的字符圖案的塊的左上和右下角的坐標(biāo))。存儲(chǔ)單元705存儲(chǔ)弧的開頭處的節(jié)點(diǎn)的節(jié)點(diǎn)號(hào),且存儲(chǔ)單元706存儲(chǔ)弧的末端的節(jié)點(diǎn)的節(jié)點(diǎn)號(hào)。通過參照這些節(jié)點(diǎn)號(hào),圖案數(shù)據(jù)能夠以假定的字符圖案的分割假設(shè)網(wǎng)絡(luò)的形式來表示。存儲(chǔ)單元707存儲(chǔ)了通過參照字符分類字典208而在假定的字符圖案的字符分類207處獲得的幾個(gè)候選字符,且存儲(chǔ)單元708存儲(chǔ)候選字符與假定的字符圖案的類似度的值。
計(jì)算類似度的方式是任意的,且可以采用任何已知的方案。粗線709表示了一個(gè)假定的字符圖案的表的空間的范圍,且該范圍對(duì)應(yīng)于一條弧。例如,對(duì)于假定的字符圖案“兵”,該范圍對(duì)應(yīng)于弧604-1。相應(yīng)地,在前一個(gè)節(jié)點(diǎn)的705中的節(jié)點(diǎn)號(hào)為
,且在下一個(gè)節(jié)點(diǎn)的706中的為②。
圖8用于說明暫定圖案鑒別過程或圖2中的字符的確定過程209。在該圖中顯示的,是假定的字符圖案—它們是根據(jù)圖案表219中的數(shù)據(jù)由暫定圖案鑒別過程209唯一確定的。暫定圖案鑒別過程209把從對(duì)圖案表中的所有假定的字符圖案的字符分類產(chǎn)生的候選字符的類似度作為可信度702寄存起來,將沿著從節(jié)點(diǎn) 至節(jié)點(diǎn)⑧的可能路徑存在的弧的可信度的值相加,并把最大可信度相加值路徑上的假定的字符圖案串確定為分割的暫定圖案。圖8的例子,顯示了具有可信度最大相加值的路徑,該路徑連接節(jié)點(diǎn) 、③、④、⑤、⑦和⑧。
把圖8與圖6比較,可以發(fā)現(xiàn)在圖8中沒有圖6的網(wǎng)絡(luò)中從節(jié)點(diǎn) 至節(jié)點(diǎn)①、從節(jié)點(diǎn)①至節(jié)點(diǎn)②和從節(jié)點(diǎn)①至節(jié)點(diǎn)③的弧604,以及從節(jié)點(diǎn)④至節(jié)點(diǎn)⑥、從節(jié)點(diǎn)⑤至節(jié)點(diǎn)⑥和從節(jié)點(diǎn)⑥至節(jié)點(diǎn)⑦的弧604。相應(yīng)地,通過根據(jù)字符分類而對(duì)圖案表219中的所有假定的字符圖案進(jìn)行評(píng)價(jià),根據(jù)可信度增強(qiáng)的假定的字符圖案,而確定字符分割(圖2的209)。
圖9用于說明對(duì)于唯一確定的分割的識(shí)別字符分類結(jié)果由城鎮(zhèn)匹配過程211產(chǎn)生的城鎮(zhèn)名稱部分的字符識(shí)別結(jié)果,并用于說明街道號(hào)碼部分的開頭位置。標(biāo)號(hào)601表示了所要識(shí)別的地址字符串的圖象,虛線902表示確定的字符分割即節(jié)點(diǎn)的邊界線,且707表示作為分割的假定的字符圖案的字符分類結(jié)果的一組候選字符。包圍在圓圈中的字符903是作為候選字符707的城鎮(zhèn)匹配(圖2中的211)的結(jié)果而選定的字符。選定的字符“兵”、“庫”,……“荷”被結(jié)合起來,以產(chǎn)生作為城鎮(zhèn)名稱識(shí)別的結(jié)果的字符串910。一對(duì)虛線905表示了由城鎮(zhèn)匹配確定的字符串所對(duì)應(yīng)的輸入圖象601的范圍。街道號(hào)碼部分的開頭位置911由城鎮(zhèn)匹配過程211確定。
在此圖中,906、907、908和909表示的是街道號(hào)碼部分的假定的字符圖案,且912至916是作為對(duì)街道號(hào)碼部分的假定的字符圖案經(jīng)字符分類得到的一組字符串。這些候選字符已經(jīng)由直到格子生成211的處理獲得。在街道號(hào)碼開頭位置911之后的地址部分,在大多數(shù)情況下是用漢字?jǐn)?shù)字或阿拉伯?dāng)?shù)字書寫的,因而該部分的字符分割處理不同于用漢字字符書寫的城鎮(zhèn)名稱部分的處理。否則,如果把城鎮(zhèn)名稱部分的字符分割處理應(yīng)用于街道號(hào)碼部分,字符圖案“三”和“二”經(jīng)常被分別分成假定的字符圖案906和907以及假定的字符圖案908和909。另外,在此部分中使用的字符的種類較少。
圖10是街道號(hào)碼部分的字符分割的循環(huán)確定處理的流程圖,該處理是從圖2的圖案周邊信息提取212直到字符分割循環(huán)確定過程215的處理。下面將結(jié)合圖11至14詳細(xì)描述字符圖案的例子。
街道號(hào)碼部分的開頭從城鎮(zhèn)匹配過程211提供的輸入信息911檢測(cè)(1013),且從提取街道號(hào)碼部分的假定的字符圖案的一個(gè)識(shí)別候選字符限制為圖案表219中字符種類信息(1002)。在此實(shí)施例中,從字符分類207產(chǎn)生的候選字符串中具有最高類似度的候選字符,被當(dāng)作字符種類信息。以該限制的字符種類信息作為關(guān)鍵字訪問分割字典或參數(shù)214。在字符種類限制1002上,提取與字符種類對(duì)應(yīng)的假定的字符圖案的周邊信息(212)。該周邊信息是假定的字符圖案的豎向和水平長(zhǎng)度、豎向/水平比值、圖案間隔和相連組成部分的數(shù)量的數(shù)據(jù)。
分割字典214以該字符種類作為關(guān)鍵字而得到訪問,以獲得關(guān)于該周邊信息的似然比,其中該周邊信息包括豎向和水平長(zhǎng)度、豎向/水平比值、圖案間隔和相連組成部分的數(shù)量。分割字典214包含周邊信息的仍然比的值,且對(duì)于每一個(gè)周邊信息的該似然比都是作為可信度(1005,1006,1007,1008)而計(jì)算出來的。計(jì)算出的可信度值得到積分(1010)。對(duì)于特征值ek的似然比L(ek|H),是從分割的假定字符圖案作為分類的字符種類的正確性的事件H、圖案周邊信息的特征值e1、e2,……en、以及在事件H的情況下出現(xiàn)e的概率P(e|H),以如下方式計(jì)算出的L(ek|H)=P(ekH)P(ek|H-)---(1)]]>對(duì)于出現(xiàn)H的概率P(H),對(duì)于特征值e1、e2,……en出現(xiàn)H的概率P(H|e1、e2,……en),是根據(jù)Bayes定律,利用從公式(1)獲得的多個(gè)似然比,而從以下公式獲得的
P(H|e1,e2,e3,...,en)=…(2)P(H)P(H-)∏k=1nL(ek|H)1+P(H)P(H-)∏k=1nL(ek|H)]]>可信度積分處理1010,通過利用根據(jù)Bayes定律的公式(2),而對(duì)處理1005、1006、1007和1008中計(jì)算出的似然比進(jìn)行積分。隨后,用乘上了從字符分類產(chǎn)生的類似度的積分后的可信度,對(duì)弧進(jìn)行加權(quán)(1011)。根據(jù)從加權(quán)的弧導(dǎo)出的假定的字符圖案的數(shù)據(jù),檢索從第一節(jié)點(diǎn)至最后節(jié)點(diǎn)的最優(yōu)路徑,從而確定字符分割路徑(1012)。該結(jié)果被用于街道匹配(圖2的217)。
圖11說明了地址字符串的街道號(hào)碼部分的假定的字符圖案。地址字符串的輸入圖象的街道號(hào)碼部分1102,已經(jīng)由圖2的暫定圖案生成過程206根據(jù)邊界線1104進(jìn)行了分割,且該結(jié)果被存儲(chǔ)在圖案表219中。該圖案表的數(shù)據(jù)結(jié)構(gòu)與結(jié)合圖6和7說明的數(shù)據(jù)結(jié)構(gòu)相同。一對(duì)虛線1103表示了分割邊界線1104與節(jié)點(diǎn)號(hào)1105(圓圈包圍的50、51、52、……55)之間的對(duì)應(yīng)。例如,對(duì)假定的字符圖案“三”1106(它對(duì)應(yīng)于弧1107)的字符分類處理,產(chǎn)生了“三”、“3”和“五”的候選字符1108。類似地,對(duì)假定的字符圖案“
”1109(它對(duì)應(yīng)于弧1111)的字符分類處理,產(chǎn)生了候選字符1110“示”、“未”和“身”。
這些假定的字符圖案的弧,如結(jié)合圖10所示地得到加權(quán)。具體地,字符種類“示”、“未”和“身”1110是不適合用于街道號(hào)碼部分中的字符,因而與假定的字符圖案1109對(duì)應(yīng)的弧1111的權(quán)被減小。根據(jù)這種加權(quán)處理,除去了顯然不適合于街道號(hào)碼部分的弧。其余的假定的字符圖案(例如“二”、“一”、“一”、“|”等等)經(jīng)歷了相應(yīng)的加權(quán)處理,從而除去不適當(dāng)?shù)幕 ?br>
圖12說明了圖10中對(duì)例如在街道號(hào)碼部分中的假定的字符圖案“三”1106的弧加權(quán)處理。開始時(shí),從假定的字符圖案“三”提取周邊信息(212)。該周邊信息包括字符的豎向和高度和寬度、高寬比、圖案間隔和相連組成部分的號(hào)碼的值。此時(shí),還定位了候選字符“三”、“3”和“五”中作為字符分類的結(jié)果的最高等級(jí)的候選字符“三”。這組信息由框1213中的1214和1215表示。
在字符種類限制1002,字符種類“三”的信息1214被送到分割字典214。分割字典214以字符種類作為關(guān)鍵字而得到訪問,并包含用于弧加權(quán)的數(shù)據(jù)1205。字符種類限制1002所提供的字符種類被用于關(guān)鍵字,以在分割字典214中查找索引“三”。在檢測(cè)到帶有索引“三”的數(shù)據(jù)1205時(shí),讀出與豎向長(zhǎng)度或高度1206、水平長(zhǎng)度或?qū)挾?207、高寬比1208、相連組成部分1209的數(shù)量和圖案間隔1210相對(duì)應(yīng)的似然比,周邊信息的可信度值得到估算(1204),仍然比(可信度1,2,3,4,5)得到積分(1010),且與假定的字符圖案“三”1106有關(guān)的弧1107得到加權(quán)(1011)。相應(yīng)地,圖案周邊信息反映在假定的字符圖案1106的弧1107上,從而實(shí)施根據(jù)字符種類的最優(yōu)加權(quán)。
圖13用弧線的厚度顯示加權(quán)的結(jié)果。1301表示的是根據(jù)假定的字符圖案“三”1106的周邊信息而加權(quán)的弧?;?303具有根據(jù)假定的字符圖案“|”的周邊信息而增大的權(quán)。連接節(jié)點(diǎn)
和
的弧1302具有與由圖案“三”的兩個(gè)較低的相連組成部分所組成形成的字符圖案“二”相類似的假定的字符圖案。假定的字符圖案“二”的字符分類,產(chǎn)生了如圖11所示的字符種類“二”、“三”和“2”的候選字符,其中具有最大類似度的字符種類“二”可能被錯(cuò)誤地判定正確的假定。然而,周邊信息表明弧1302的這種圖案與緊在其上方的圖案具有窄的間隔,從而使其可信度在參照分割字典214時(shí)被降低。相應(yīng)地,弧1302的權(quán)小于只根據(jù)類似度進(jìn)行權(quán)時(shí)的權(quán),且它小于弧1301的權(quán)。因此,包括弧1302的路徑的總加權(quán)比包括弧1301的路徑的加權(quán)小。
圖14顯示了由字符分割的循環(huán)確定為街道號(hào)碼部分選定的假定的字符圖案串。具體地,借助弧加權(quán)處理(圖10的1011)對(duì)假定的字符圖案的弧進(jìn)行加權(quán),并確定具有最大的加權(quán)和的路徑。隨后,選出包括假定的字符圖案“三”的弧1301和“|”的弧1303的路徑。即為街道號(hào)碼部分的字符分割的循環(huán)確定處理,選定與假定的字符圖案“三”、“|”、“二”、“|”和“一”相對(duì)應(yīng)的弧,以形成路徑。與選定的弧的圖案有關(guān)的候選字符串被用于產(chǎn)生街道號(hào)碼部分的格子(216)。
圖15顯示了根據(jù)該實(shí)施例的整個(gè)地址字符串的識(shí)別結(jié)果。即,這是專用于街道號(hào)碼部分的字符分割、格子產(chǎn)生、街道號(hào)碼匹配、以及街道號(hào)碼部分與城鎮(zhèn)匹配的結(jié)果集合的結(jié)果。從地址字符串的輸入圖象601引出的一對(duì)虛線905表示了城鎮(zhèn)名稱部分的范圍,且910表示城鎮(zhèn)名稱匹配的結(jié)果。虛線1510表示字符分割的循環(huán)確定的邊界,且一組字符1506是各個(gè)字符的字符分類所產(chǎn)生的候選字符。虛線1507和1509表示了街道號(hào)碼部分的范圍,且字符串1508是借助街道號(hào)碼匹配217而從字符分類的結(jié)果的候選字符組獲得的街道號(hào)碼識(shí)別結(jié)果,即它是街道號(hào)碼識(shí)別的結(jié)果。字符串1504是通過將街道號(hào)碼匹配結(jié)果1508與城鎮(zhèn)名稱匹配結(jié)果1502相連而產(chǎn)生的整個(gè)地址字符串的識(shí)別結(jié)果。通過只為街道號(hào)碼部分重新嘗試字符分割并將其結(jié)果以此方式與城鎮(zhèn)名稱匹配結(jié)果相結(jié)合,改善了整個(gè)地址字符串識(shí)別的精度。
圖16顯示了在一個(gè)屏幕上進(jìn)行顯示的例子,其中該屏幕顯示了輸入地址字符串和用于字符分割的圖案表以及字符分類的結(jié)果。在圖3的顯示裝置310的屏幕1600上顯示的,是輸入地址字符串1601、圖案表的節(jié)點(diǎn)1602-i(i=1,2,……,8)、連接這些節(jié)點(diǎn)的弧1603-1和1603-4、連接相鄰節(jié)點(diǎn)的弧、假定的字符圖案1604-j(j=1,2,……,10)、以及借助假定的字符圖案1604-i的字符分類而獲得的候選字符組1605。在顯示裝置310的屏幕1600上的這種顯示,使得能夠在地址字符串識(shí)別處理期間對(duì)字符分割和字符分類處理的進(jìn)行有直觀的理解,且它可被用于維護(hù)和擴(kuò)展設(shè)備的功能。需要根據(jù)建立和修改分割字典214時(shí)的假定,來收集分割的圖案的周邊信息。
參見公式(1),存儲(chǔ)在字符串字典中的似然比的值,是正確字符分割的情況下的假定字符的周邊信息分布被不正確字符分割情況下的假定字符周邊信息的分布所除而獲得的。在此,當(dāng)設(shè)備被設(shè)計(jì)成響應(yīng)指針對(duì)弧的指定而在圖16所示的顯示屏幕上顯示諸如周邊信息的值和字符分類結(jié)果的信息時(shí),可以容易地分別為正確分割和不正確分割的情況收集圖案周邊信息。該顯示工具對(duì)于產(chǎn)生和修改字符串字典所需的字符圖案的收集也是有效的。
圖17是流程圖,顯示了根據(jù)本發(fā)明的另一實(shí)施例的字符讀取方法。該實(shí)施例也是對(duì)結(jié)合圖3說明的自動(dòng)郵政地址讀取設(shè)備的字符讀取方法的應(yīng)用。
地址線分割處理171從郵件表面的視頻信號(hào)提取地址塊區(qū)域。隨后的暫定圖案分割處理172從字符串提取假定的字符圖案,以產(chǎn)生分割假設(shè)網(wǎng)絡(luò)。外部形式懲罰計(jì)算過程173計(jì)算各個(gè)假定的字符圖案的外部形式懲罰(p)。字符分類處理174劃分各種假定的字符圖案并產(chǎn)生多個(gè)候選字符種類編碼和產(chǎn)生假定的字符圖案與候選字符的類似度。圖案可信度計(jì)算處理175根據(jù)類似度和外部形式懲罰來計(jì)算各個(gè)假定的字符圖案的可信度。地址字典匹配過程176根據(jù)圖案的可信度來選擇假定的字符圖案,并將從字符分類產(chǎn)生的候選字符種類與地址字典相比較。
圖18顯示郵件表面圖象。地址線分割處理171從郵件圖象181提取一個(gè)矩形區(qū)域182,該矩形區(qū)域182包括城鎮(zhèn)名稱和街道號(hào)碼的書寫字符串。區(qū)域182可包括一個(gè)以上的地址字符串,且該處理在此情況下提取這些字符串的區(qū)域。地址塊提取的方式與前述實(shí)施例的相同。
下面將結(jié)合圖19描述暫定圖案分割處理172,該圖顯示了區(qū)域182中的字符串的放大圖象。在此圖中,標(biāo)為
至⑨的豎線是候選邊界。該候選邊界是如在TECHNICAL REPORT OF IE88-138,“A Method toCharacter Segmentation for Printed Character Lines IncludingCharacter Lines of Irregular Pitches”中描述的矩形之間的間隙。在邊界的右側(cè)的字符圖案的左端的x軸坐標(biāo),減去在邊界的左側(cè)的字符圖案的右端的x軸坐標(biāo),被稱為“邊界間隙”,且在邊界的右側(cè)的字符圖案的左端的x軸坐標(biāo)與在邊界的左側(cè)上的字符圖案的右端的x軸坐標(biāo)的平均值,被稱為“邊界坐標(biāo)”。例如,編號(hào)為4的邊界的邊界坐標(biāo)是邊界194的x軸坐標(biāo),且邊界間隙是寬度195。
隨后,確定邊界坐標(biāo)之差不超過從字符串的高度導(dǎo)出的字符尺寸的邊界組合,且這些邊界之間的圖案作為假定的字符圖案而得到寄存。在圖19的例子中,邊界坐標(biāo)差191和192不超過導(dǎo)出的字符尺寸,而邊界坐標(biāo)差193超過了字符尺寸。因此,邊界
和①之間的字符圖案和邊界
和②之間的字符圖案得到寄存,且邊界
和③之間的字符圖案被舍棄。
圖20顯示了包含著由暫定圖案分割處理172產(chǎn)生的分割假設(shè)網(wǎng)絡(luò)的各弧的數(shù)據(jù)的圖案表的格式。圖案表的各個(gè)記錄與一個(gè)假定的字符圖案相對(duì)應(yīng)。該表由以下部分組成用于存儲(chǔ)描述在鏈編碼中的圖案的特性的字段2001、用于存儲(chǔ)假定的字符圖案的左邊界編號(hào)和右邊界編號(hào)的字段2002和2003、用于存儲(chǔ)作為字符分類結(jié)果的候選字符種類的字段2004、用于存儲(chǔ)字段2004中的候選字符種類的類似度值的字段2005、以及用于存儲(chǔ)圖案的可信度的字段2006。在這些項(xiàng)中,邊界編號(hào)從字符串的左端處的
位置開始,并隨著邊界從左向右移而增大,且多至三個(gè)候選字符種類和類似度值被左側(cè)對(duì)齊地存儲(chǔ)在字段2004和2005中,而字段2004和2005的空閑空間分別由空編碼和“0”所填充。
圖21顯示了包含著暫定圖案分割處理172所產(chǎn)生的分割假設(shè)網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)據(jù)的邊界表的格式。該邊界表中的各個(gè)記錄與一個(gè)邊界對(duì)應(yīng)。該表由用于存儲(chǔ)邊界編號(hào)的字段2101、用于存儲(chǔ)邊界坐標(biāo)的字段2102、和用于存儲(chǔ)邊界間隙的字段2103組成。
用在該實(shí)施例中的字符分類處理174是已知的過程。用于描述城鎮(zhèn)名稱和街道號(hào)碼的包括漢字字符、平假名字符、片假名字符、阿拉伯?dāng)?shù)字和符號(hào)的字符得到字符識(shí)別處理。字符分類的輸出是多個(gè)候選字符種類和輸入的字符圖案相對(duì)于各個(gè)候選字符種類的標(biāo)準(zhǔn)圖案的各類似度值。
圖22是外部形式懲罰計(jì)算過程173的流程圖,作為該處理的輸入的假定的字符圖案,由在圖案表(圖2)和邊界表(圖21)中的一個(gè)記錄表示。為各個(gè)假定的字符圖案進(jìn)行多個(gè)分割評(píng)價(jià)處理2201、2202和2203,以評(píng)價(jià)錯(cuò)誤分割的假定。處理的輸出pi(i=1,2,……,1)越大,錯(cuò)誤分割的假定的可信度就越高。輸出pi由處理2204相加,且該結(jié)果作為外部形式懲罰p而得到傳送。
圖23用于說明圖22的分割錯(cuò)誤的類型,顯示了七種類型的錯(cuò)誤分割處理E1至E7。在此圖中,實(shí)線圖象表示所注意的假定的字符圖案,虛線框表示包含正確字符圖案的矩形,且中空的圖象表示在假定的字符圖案的周邊的圖案部分。例如,錯(cuò)誤處理E1表示對(duì)于所注意的假定圖案對(duì)一個(gè)字符的左側(cè)作出錯(cuò)誤分割的假定。錯(cuò)誤處理E7表示對(duì)于所注意的假定圖案對(duì)兩個(gè)字符作出錯(cuò)誤分割的假定。
圖24是流程圖,顯示了錯(cuò)誤分割評(píng)價(jià)處理。作為該處理的輸入的假定的字符圖案,由圖案表和一個(gè)邊界表中的一個(gè)記錄(字符種類)來表示。錯(cuò)誤分割評(píng)價(jià)處理2401與假定評(píng)價(jià)處理2201、2202和2203類似。特征提取處理2402從輸入的假定的字符圖案提取諸如字符圖案尺寸和與相鄰字符圖案的位置關(guān)系的特征。該特征作為如下的n階矢量而得到處理。
F=(f1,f2,……fn)隨后,處理2403從特征F估算懲罰pi。懲罰pi是一個(gè)線性識(shí)別函數(shù)的值—該函數(shù)將正確分割的字符圖案與錯(cuò)誤結(jié)果(諸如圖23中的處理Ei的結(jié)果)相區(qū)分,并被定義如下pi=F·Vi+ci其中Vi是線性識(shí)別函數(shù)的加權(quán)矢量,ci是一個(gè)常數(shù),且F·Vi是Vi與F的內(nèi)積。
Vi和ci的值根據(jù)學(xué)習(xí)來確定,這種學(xué)習(xí)的方式將在下面描述并被預(yù)先存儲(chǔ)在參數(shù)字典2204中。作為與本實(shí)施例不同的一種替換方案,參數(shù)字典可以響應(yīng)字符分類產(chǎn)生的候選字符而得到切換。
圖25顯示了用于說明上述特征F的字符圖案。在此圖中,實(shí)圖象2501表示所注意的假定的字符圖案,且中空?qǐng)D象2502和2503表示相鄰的字符圖案。一個(gè)虛線框表示了包含各個(gè)字符圖案的矩形。
在此例中,特征F的階為6,且各個(gè)特征值被定義如下f1所注意的的字符圖案的高度f2所注意的的字符圖案的寬度f3所注意的的字符圖案與左邊相鄰的字符圖案的間隔f4所注意的的字符圖案右邊相鄰的字符圖案的間隔f5所注意的的字符圖案的最大間隙f6所注意的的字符圖案的相連組成部分的數(shù)量雖然在此例中對(duì)于所有錯(cuò)誤分割評(píng)價(jià)處理采用了相同的特征值,但對(duì)于各個(gè)處理也可以采用不同的特征值。或者,各個(gè)特征值可以相對(duì)于字符串的總體特征(例如字符串的高度h)而得到歸一化。
圖26用于說明錯(cuò)誤分割評(píng)價(jià)處理的原理。2601和2602所表示的,是n次Euclid空間的兩個(gè)坐標(biāo)軸。圖案組2603是正確分割的假定的字符圖案的特征F的分布,且另一圖案組2604是具有錯(cuò)誤分割假定Ei的假定的字符圖案的特征F的分布。在此圖中,由Wi表示的,是識(shí)別函數(shù)的加權(quán)矢量—該函數(shù)區(qū)分圖案組2603和2604,且它與分隔圖案組2603和2604的超平面B相交。
超平面B被表示為滿足以下方程的一組F(Wi·F)=a·|Wi|其中a是從原點(diǎn)到超平面B的距離,Wi·F是Wi與F的內(nèi)積,且|Wi|是Wi的模。
區(qū)分組2603和2604的線性識(shí)別函數(shù)的值d由以下公式給出d=(Wi·F)-a·|Wi|如果d大于0,則F屬于組2604,否則它屬于組2603。
Wi和a·|Wi|還可以用在Korona Co.出版的“RecognitionEngineering”,by Toriwali,ISBN4-339-01059-6,C3355,P2781E,pp.113-119中描述的方式進(jìn)行估算。然而,由于Euclid空間中各個(gè)Ei的不同的分布,為線性識(shí)別函數(shù)的值pi原樣地采用d的值是不適當(dāng)?shù)?。考慮到這點(diǎn),為pi采用了線性識(shí)別函數(shù)的以下歸一化值。
pi=d/(s·|Wi|)=(Wi·F)/(s·|Wi|)-a/s其中s是包括2603和2604的組的d的方差。
因此,存儲(chǔ)在參數(shù)字典1104中的線性識(shí)別函數(shù)的加權(quán)矢量Vi和常數(shù)ci以如下方式獲得。
Vi=Wi/(s·|Wi|)ci=a/s下面將簡(jiǎn)要描述圖案可信度計(jì)算處理175。圖案可信度表示了對(duì)分割假設(shè)網(wǎng)絡(luò)即字符圖案上的弧的可信程度,并以如下方式估算。
圖案可信度={c1·(最高等級(jí)的候選字符的類似度)-c2·p}其中p是外部形式懲罰且c1和c2是系統(tǒng)特有的常數(shù)。
圖27是地址字典匹配過程176的流程圖。該處理從前述的圖案表和邊界表接收一個(gè)假定的字符圖案、圖案可信度候選字符和類似度輸入。在開始時(shí),假定的字符圖案選擇處理2701選擇它們的圖案可信度值小于一定值的假定的字符圖案。在圖34A的例子中,由于字符分類的結(jié)果,字符圖案
-②,
-③,等等都具有小的類似度值,因而具有小的圖案可信度值。因此,這些字符圖案被除去,且分割假設(shè)網(wǎng)絡(luò)簡(jiǎn)化成為如圖34B所示的。字符圖案④-⑥具有大的外部形式懲罰,因而具有小的圖案可信度,所以它被除去。
隨后,字典匹配過程2703將字符分類產(chǎn)生的各個(gè)假定的字符圖案的候選字符與預(yù)先存儲(chǔ)在地址字典2704中的地址字符串相比較,并將匹配的地址字符串作為候選字符串傳送。候選地址字符串分檢處理2705以候選字符與候選字符串之間的匹配程度遞減的順序,重新排列候選字符串。具有較大程度的匹配的候選字符串被認(rèn)為是更可信的。
圖28簡(jiǎn)要顯示了字典匹配過程2703。該處理從地址字典2704中選擇一個(gè)地址字符串,這個(gè)地址字符串可由根據(jù)字符分類結(jié)果建立的自動(dòng)機(jī)認(rèn)可。為了確定自動(dòng)機(jī)接受的地址字符串,采用了Marukawa等人提出的方法(The Transaction of the Institute of Information Engineers,Vol.35,No.6“Chinese character address recognitionerror correctionalgorithm”)。在圖28中,框2801借助模型顯示了自動(dòng)機(jī)—它是由在選擇假定的字符圖案之后的字符分類所產(chǎn)生的候選字符建立的。圖案之間的邊界代表了狀態(tài),且從字符分類產(chǎn)生的一個(gè)候選字符代表了轉(zhuǎn)換。各個(gè)狀態(tài)得到與分割假設(shè)網(wǎng)絡(luò)的節(jié)點(diǎn)號(hào)一致的編號(hào)。該自動(dòng)機(jī)是借助具有與圖案表相同的結(jié)構(gòu)的一個(gè)表而實(shí)現(xiàn)的。自動(dòng)機(jī)2801中的粗線表示自動(dòng)機(jī)2801在地址字典2704中接收字符串2803(中住市水反町12)的路徑。在自動(dòng)機(jī)2801在地址字典2704中接受一個(gè)字符串的情況下,它將字符串作為候選字符串傳送。匹配可信度mc是匹配處理中的轉(zhuǎn)換事件的可信度tc(轉(zhuǎn)換可信度)的總和值,如下所示。
mc=∑Stc轉(zhuǎn)換可信度被估算如下。
tc={c1·sm-c2·p}·jm其中sm是候選字符相對(duì)各次轉(zhuǎn)換的類似度,且jm是轉(zhuǎn)換之前和之后的狀態(tài)編號(hào)的差。
用于估算圖案可信度的常數(shù)c1和c2是相同的。在圖28的例子中,還接受了另一個(gè)字符串“中住市水反町11”,且它作為一個(gè)地址識(shí)別結(jié)果2802而得到傳送,雖然該字符串是根據(jù)具有比前一個(gè)情況下的字符串更小的類似度的候選字符而接受的,因而它具有較小的匹配可信度。
圖29顯示了取樣收集工具的一個(gè)例子,該工具被用來收集供參數(shù)字典2404學(xué)習(xí)的樣品,其中參數(shù)字典2404被用于圖24所示的錯(cuò)誤分割評(píng)價(jià)處理2401。在此圖中,2901表示的是一個(gè)CRT屏幕,且2902表示一個(gè)用于顯示字符串圖象的窗口。在顯示在該窗口的字符串中,以不同的顏色顯示了目前注意的字符圖案(在圖中由實(shí)圖象表示)。觀看窗口2902中的該圖象的操作者,判定該圖案是否得到了正確的分割。在發(fā)現(xiàn)了不正確的分割時(shí),操作者標(biāo)明圖23中顯示的錯(cuò)誤分割的類型,并用光標(biāo)2904指向顯示在面板2903上的相應(yīng)鍵。響應(yīng)于操作者的按鍵操作,取樣收集工具將所注意的的圖案的特征值存儲(chǔ)在錯(cuò)誤類型的文件中,并在窗口2902中顯示另一個(gè)字符圖案。
圖30是圖24中的參數(shù)字典2404的學(xué)習(xí)過程的流程圖。取樣收集工具3002利用預(yù)先收集的地址線圖象數(shù)據(jù)庫(DB)3001來產(chǎn)生正確的分割圖案數(shù)據(jù)庫3003和不正確的分割圖案數(shù)據(jù)庫(3004、3005等等)—后者與圖23的不正確分割假定的圖案數(shù)據(jù)庫E1至E7相對(duì)應(yīng)。學(xué)習(xí)工具3006接收正確分割圖案數(shù)據(jù)庫3003和有關(guān)E1的不正確分割圖案數(shù)據(jù)庫3004的數(shù)據(jù),并以結(jié)合圖26說明的方式估算加權(quán)矢量V1和常數(shù)c1,并將這些值傳送給參數(shù)字典3008。類似地,該處理采用其他的學(xué)習(xí)工具(3007等等)來估算各不正確分割圖案數(shù)據(jù)庫(3005等等)的加權(quán)矢量Vi和常數(shù)ci,并將這些值傳送到參數(shù)字典3008。
圖31顯示了參數(shù)字典的表結(jié)構(gòu)。表的各個(gè)記錄pdici包含與Ei對(duì)應(yīng)的參數(shù)Vi和ci。例如,表的第一個(gè)記錄pdic1 3103包含V1和c1,且從頂部數(shù)的第i個(gè)記錄3104包含Vi和ci。參數(shù)ci和Vi分別被存儲(chǔ)在各個(gè)記錄的字段3101和3102中。
圖32顯示了外部形式懲罰計(jì)算處理的次序。第一個(gè)步驟3201變量p初始化為0。隨后的步驟3203和3204得到重復(fù),同時(shí)控制環(huán)3202中的變量i遞增。步驟3203開始了錯(cuò)誤分割評(píng)價(jià)處理,且步驟3204將錯(cuò)誤分割評(píng)價(jià)的結(jié)果pi加到p上。步驟3208將變量p作為外部形式懲罰傳送。步驟3205和3206是錯(cuò)誤分割評(píng)價(jià)子程序。步驟3205將從參數(shù)字典讀出的ci的(pdic i·c)值代入變量pi。步驟3206是用于估算從特征提取產(chǎn)生的F與從參數(shù)字典讀出的Vi的內(nèi)積的控制環(huán)。具體地,Vi的(pdici·vj)值和F(fj)的值的積被加到pi,同時(shí)在變量j達(dá)到特征的階數(shù)之前遞增j。
權(quán)利要求
1.字符讀取方法,它通過將書寫表面的圖象信息轉(zhuǎn)換成電信號(hào)并讀取包括在該圖象信息中的字符串的字符,所述方法包括第一步驟,用于定位圖象信息的電信號(hào)中的字符串描述區(qū),并將字符串區(qū)中的字符串的圖象信息分割成多個(gè)假定的字符圖案;第二步驟,用于通過訪問一個(gè)字符分類字典來實(shí)施假定的字符圖案的字符分類,從而為各個(gè)假定的字符圖案獲得多個(gè)識(shí)別候選字符;第三步驟,用于獲得假定的字符圖案的邊界信息;第四步驟,用于通過利用在所述第二步驟中獲得的識(shí)別候選字符作為關(guān)鍵字而訪問一個(gè)包含邊界信息的分割字典從而獲得在所述第三步驟中獲得的假定的字符圖案的邊界信息的可信度,并對(duì)該假定的字符圖案進(jìn)行加權(quán);第五步驟,用于根據(jù)假定的字符圖案的加權(quán)來確定字符分割;以及第六步驟,用于根據(jù)從第五步驟中確定的假定的字符圖案所產(chǎn)生的一組分類的字符種類并通過利用字符分類字典而實(shí)施字匹配,并標(biāo)明字符串的字符。
2.根據(jù)權(quán)利要求1的字符讀取方法,其中假定的所述周邊信息包括豎向長(zhǎng)度、水平長(zhǎng)度、豎向/水平長(zhǎng)度比、圖案間隔和字符圖案的相連組成部分的數(shù)量中的至少一個(gè),且其中所述分割字典包含各個(gè)字符的豎向長(zhǎng)度、水平長(zhǎng)度、豎向/水平長(zhǎng)度比、圖案間隔和相連組成部分的數(shù)量中的至少一個(gè)的似然分布的信息,且其中所述第四步驟中分割字典的所述訪問關(guān)鍵字是從字符分類產(chǎn)生的候選字符的字符種類。
3.根據(jù)權(quán)利要求1的字符讀取方法,其中所述第四步驟包括產(chǎn)生和修改分割字典的步驟,所述產(chǎn)生/修改步驟包括在一個(gè)顯示裝置的屏幕上顯示所要識(shí)別的字符串的輸入圖象、假定的字符圖案、和從假定的字符圖案的字符分類產(chǎn)生的候選字符的步驟;通過利用在顯示裝置的屏幕上的顯示來修改分割字典的步驟;以及,在屏幕上以圖形的方式顯示字符串識(shí)別處理的狀態(tài)的步驟。
4.郵政地址讀取方法,包括第一步驟,用于將包含著具有城鎮(zhèn)名稱部分和街道號(hào)碼部分的字符串信息的圖象信息轉(zhuǎn)換成電信號(hào);第二步驟,用于確定圖象信息的電信號(hào)中的字符串描述區(qū)的位置,并提取形成字符串描述區(qū)中的字符的相連圖象組成部分的組合,作為假定的字符圖案;第三步驟,用于通過訪問字符分類字典而對(duì)于各個(gè)假定的字符圖案實(shí)施字符分類,從而獲得識(shí)別候選字符和假定的字符圖案與識(shí)別候選字符的類似度;第四步驟,用于形成識(shí)別候選字符所組成的格子,將格子與城鎮(zhèn)名稱字典進(jìn)行匹配從而識(shí)別假定的字符圖案中的城鎮(zhèn)名稱部分的字符串,并檢測(cè)街道號(hào)碼部分的開頭位置;第五步驟,用于根據(jù)在所述第四步驟中獲得的開頭位置的信息,提取與街道號(hào)碼部分中的假定的字符圖案的識(shí)別候選字符相對(duì)應(yīng)的假定的字符圖案的周邊信息,并對(duì)該假定的字符圖案進(jìn)行加權(quán),以利用該識(shí)別候選字符作為關(guān)鍵字,通過訪問包含周邊信息的似然性的分割字典,而估算假定的字符圖案的周邊信息的可信度;第六步驟,用于根據(jù)加權(quán)而將街道號(hào)碼部分分割成字符;以及第七步驟,用于對(duì)所述第六步驟中產(chǎn)生的一組字符分類結(jié)果進(jìn)行與街道號(hào)碼字典的字匹配,從而識(shí)別街道號(hào)碼字符串。
5.根據(jù)權(quán)利要求4的郵政地址讀取方法,其中所述第二步驟包括從提取的字符串的頂部和末端提取字符并根據(jù)提取的字符圖案的分類來鑒別是豎向書寫形式還是水平書寫形式。
6.根據(jù)權(quán)利要求4的郵政地址讀取方法,其中所述圖案周邊信息包括字符圖案的豎向長(zhǎng)度、水平長(zhǎng)度、豎向/水平長(zhǎng)度比、圖案間隔和相連組成部分的數(shù)量中的至少一個(gè),且其中所述分割字典包含各個(gè)字符的字符圖案的豎向長(zhǎng)度、水平長(zhǎng)度、豎向/水平長(zhǎng)度比、圖案間隔和相連組成部分的數(shù)目中的至少一個(gè)的似然分布的信息,且其中所述第五步驟中識(shí)別候選字符的訪問關(guān)鍵字是分割字典中的字符。
7.根據(jù)權(quán)利要求4的郵政地址讀取方法,其中所述第五步驟包括產(chǎn)生和修改分割字典的步驟,所述產(chǎn)生/修改步驟包括在一個(gè)顯示裝置的屏幕上顯示所要識(shí)別的一個(gè)地址字符串的輸入圖象、所述字符圖案和從該字符圖案的字符分類產(chǎn)生的候選字符的步驟;通過利用在顯示裝置的屏幕上的顯示來修改分割字典的步驟;以及,在該屏幕上以圖形的方式顯示地址字符串識(shí)別處理的狀態(tài)的步驟。
8.利用郵政地址讀取設(shè)備讀取字符的方法,該郵政地址讀取設(shè)備具有用于將書寫表面上的圖象信息轉(zhuǎn)換成電信號(hào)的裝置和讀出書寫在該表面上的字符串的圖象的裝置,所述方法包括第一步驟,用于從圖象的電信號(hào)提取字符串的信號(hào);第二步驟,用于從字符串的信號(hào)提取被認(rèn)為構(gòu)成一個(gè)字符的假定的字符圖案,或者在不能唯一地確定假定的字符圖案的情況下提取多個(gè)假定的字符圖案;第三步驟,用于對(duì)提取的假定的字符圖案進(jìn)行字符分類;第四步驟,用于根據(jù)假定的字符圖案的聚類來計(jì)算外部形式懲罰并根據(jù)可能類型的字符分割錯(cuò)誤來評(píng)價(jià)周邊信息;以及第五步驟,用于根據(jù)所述第三步驟的字符分類結(jié)果和在所述第四步驟中計(jì)算出的外部形式懲罰來限定假定的字符圖案的候選者,并進(jìn)行候選字符圖案與預(yù)先存儲(chǔ)在一個(gè)字典中的字符串的匹配—該字典包含可能被書寫在書寫表面上的字符串,從而識(shí)別書寫在書寫表面上的字符串。
9.根據(jù)權(quán)利要求8的字符讀取方法,其中書寫在書寫表面上的所述字符串是表示郵政地址的字符串,且其中包含可能被書寫在書寫表面上的字符串的所述字典包括其中描述郵政地址的一個(gè)字典。
10.根據(jù)權(quán)利要求8的字符讀取方法,其中所述第四步驟利用了鑒別正確分割的假定的字符圖案和錯(cuò)誤分割的候選圖案的識(shí)別功能。
11.根據(jù)權(quán)利要求10的字符讀取方法,其中所述識(shí)別功能之一將各個(gè)假定的字符圖案與相鄰圖案的間隔作為一種特征值。
12.根據(jù)權(quán)利要求10的字符讀取方法,其中所述識(shí)別功能之一處理各個(gè)圖案中的間隙。
13.根據(jù)權(quán)利要求10的字符讀取方法,其中所述第四步驟的所述識(shí)別功能是以包括以下步驟的方法產(chǎn)生的用于從字符串的圖象提取被認(rèn)為構(gòu)成一個(gè)字符串的假定的字符圖案或者在假定的字符圖案不能被唯一確定的情況下提取多個(gè)假定的字符圖案的步驟;輸入關(guān)于假定的字符圖案是否被正確分割的信息的步驟,其中在錯(cuò)誤分割的情況下對(duì)于分割錯(cuò)誤的類型得到人工分檢;通過根據(jù)所述不正確分割判定步驟的結(jié)果對(duì)假定的字符圖案進(jìn)行分檢而將假定的字符圖案存儲(chǔ)在一個(gè)存儲(chǔ)器的步驟;以及通過利用由所述圖案存儲(chǔ)步驟存儲(chǔ)在存儲(chǔ)器中的假定的字符圖案實(shí)施分類裝置的學(xué)習(xí)的步驟g。
全文摘要
一種字符讀取方法具有改善的字符分割精度和字符串識(shí)別精度,以正確地讀取郵件上的手寫地址。該方法從地址字符串的圖象信息提取省字符圖案(步驟206),產(chǎn)生假定的字符圖案表219并實(shí)施假定的字符圖案的字符分類(步驟207),提取—特別是對(duì)地址字符串的街道號(hào)碼部分—假定的字符圖案的周邊信息(豎向和水平長(zhǎng)度、豎向/水平長(zhǎng)度比、圖案間隔等等)(步驟212),并根據(jù)該信息將字符串準(zhǔn)確地分割成字符(步驟215)。
文檔編號(hào)G06K9/80GK1158465SQ9612154
公開日1997年9月3日 申請(qǐng)日期1996年12月13日 優(yōu)先權(quán)日1995年12月13日
發(fā)明者影広達(dá)彥, 古賀昌史, 酒匂裕, 藤澤浩道, 緒方日佐男, 嶋好博, 渡邊成, 寺本正人 申請(qǐng)人:株式會(huì)社日立制作所