專利名稱:手寫字符識別裝置及方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及一種字符識別裝置及方法,更準(zhǔn)確地說,涉及聯(lián)機(jī)手寫字符識別裝置以及能夠識別象變形的手寫字符及類似手寫字符的方法。
一種已知的手寫字符識別方法按照這樣的規(guī)則操作在該方法中,把單一的手寫筆劃形狀分類成幾十種典型的筆劃(基本筆劃),而字符的形狀描述為上述典型筆劃的組合。這被稱之為模板匹配法。
該模板手寫字符識別方法需要準(zhǔn)備許多規(guī)則和多種基本筆劃,以便克服諸如連寫字符、變形的手寫字符和類似可能變形,這需要大量時間來識別,并且,也需要大容量的字符詞典數(shù)據(jù)庫。
另外,按照這種已知的手寫字符識別方法,用戶需被迫遵守例如,手寫字符的筆劃數(shù)和書寫順序等特定的書寫條件。經(jīng)??捎^察到這些書寫條件使用戶很煩惱,因而要求簡化這些書寫條件。
一般來說,本發(fā)明的目的是提供一種改進(jìn)的手寫字符識別裝置,它能克服先有技術(shù)所碰到的上述缺點(diǎn)。
更具體地說,本發(fā)明的一個目的是提供一種能有效地識別變形手寫字符的手寫字符識別裝置。
本發(fā)明的另一目的是提供一種能在比較短的時間內(nèi)識別手寫字符的手寫字符識別裝置。
本發(fā)明的再一個目的是提供一種基于線單元數(shù)據(jù)跟蹤過程的手寫字符識別裝置,并且,該裝置運(yùn)用于識別具有許多變形部分的手寫字符和符號。
按照本發(fā)明的一種樣式,提供一種手寫字符識別裝置及其操作的相應(yīng)方法,它包括用于接受在書寫一個字符時獲得的點(diǎn)式數(shù)據(jù)并由此產(chǎn)生相應(yīng)線單元數(shù)據(jù)的裝置,以命令集形式存貯各自表示不同字符形狀的字符數(shù)據(jù)的字符詞典數(shù)據(jù)庫裝置,所述字符數(shù)據(jù)包含跟蹤命令、選擇命令和檢驗命令。連接到字符詞典數(shù)據(jù)庫裝置上的子筆劃數(shù)據(jù)生成裝置通過跟蹤線單元數(shù)據(jù)產(chǎn)生子筆劃數(shù)據(jù),所述線單元數(shù)據(jù)基于從字符詞典數(shù)據(jù)庫裝置取得的字符跟蹤命令,而連接到字符詞典數(shù)據(jù)庫裝置并有子筆劃數(shù)據(jù)提供的子筆劃選擇裝置,選擇滿足從字符詞典數(shù)據(jù)庫裝置取得的字符選擇命令定義的選擇條件的子筆劃數(shù)據(jù)。最后,連接到字符詞典數(shù)據(jù)庫裝置上的子筆劃數(shù)據(jù)評價裝置和子筆劃數(shù)據(jù)選擇裝置,根據(jù)自字符詞典數(shù)據(jù)庫裝置取得的字符檢驗命令、通過檢驗所選手寫字符的子筆劃數(shù)據(jù)的相似性來評價手寫字符的相似性。
本發(fā)明的這些和其它的目的、特征及優(yōu)點(diǎn),在參照附圖時結(jié)合對最佳實(shí)施例的如下詳細(xì)說明中是顯而易見的,各附圖中用相同標(biāo)號表示相同或類似的部件。
圖1是由本發(fā)明手寫字符識別裝置的一個實(shí)施例所操縱的操作功能方框圖,圖2是參照說明本發(fā)明所用的線單元數(shù)據(jù)跟蹤電路的操作流程圖,圖3是參照說明用于本發(fā)明的子筆劃數(shù)據(jù)選擇電路的操作流程圖,圖4是參照說明用于本發(fā)明的子筆劃數(shù)據(jù)檢驗電路的操作流程圖,圖5A至5D是分別用于說明本發(fā)明的手寫字符識別過程的示意圖,以及圖6A至6D是用以說明手寫筆劃轉(zhuǎn)換成線單元數(shù)據(jù)的圖解。
下面參照附圖描述按照本發(fā)明手寫字符識別裝置的一個實(shí)施例。
圖1展示按照本發(fā)明的手寫字符識別裝置的一個實(shí)施例的總布置圖。
手寫字符輸入電路1將手寫筆劃轉(zhuǎn)換成點(diǎn)式數(shù)據(jù)。雖然未予示出,實(shí)際上該手寫字符輸入電路,還包含一個具有圖形輸入筆的數(shù)據(jù)圖形輸入板,其中字符就是用圖形輸入筆寫在數(shù)據(jù)圖形輸入板上規(guī)定的一個方形書寫區(qū)內(nèi)。
自手寫字符輸入電路1取得的對應(yīng)于手寫筆劃的點(diǎn)式數(shù)據(jù),在預(yù)定條件下由手寫筆劃的點(diǎn)式數(shù)據(jù)/線單元數(shù)據(jù)轉(zhuǎn)換電路2將點(diǎn)式數(shù)據(jù)轉(zhuǎn)換成線單元數(shù)據(jù),然后便送到線單元數(shù)據(jù)緩沖存儲器3。在這種情況下,手寫筆劃的點(diǎn)式數(shù)據(jù)表示特定取樣點(diǎn)的座標(biāo)值數(shù)據(jù),而線單元數(shù)據(jù)則是具有諸如長度、方向、起點(diǎn)座標(biāo)等等數(shù)據(jù)的手寫筆劃的時間序列數(shù)據(jù)。
參照圖6A至6D,下面將對該過程進(jìn)行更詳細(xì)的說明,如圖6A中說明的,所述輸入電路1的數(shù)據(jù)圖形輸入板包含從公共原點(diǎn)出發(fā),按有規(guī)律的角度間隔的排列成徑向延伸線形的八個量化網(wǎng)絡(luò)101至108??梢岳斫?,線數(shù)更多,例如,16條線,會得到更好的效果。
假定數(shù)據(jù)輸入筆或鐵筆的筆劃寫出如圖6B中所示的筆劃109,于是無論哪里該筆劃穿過網(wǎng)絡(luò)之一,便會以已知的座標(biāo)產(chǎn)生一個點(diǎn)信號,因此產(chǎn)生如圖6C所示的點(diǎn)座標(biāo)的數(shù)據(jù)流110。
下面參照圖6D,通過電路2對輸入筆劃點(diǎn)式數(shù)據(jù)按如下方式進(jìn)行分解,首先,將網(wǎng)格100的起點(diǎn)0置于下筆點(diǎn)A上,然后順序地檢驗點(diǎn)式數(shù)據(jù),以確定該筆劃在任何點(diǎn)的微分值是否表明其斜率與網(wǎng)格101至108之一相同,即,在該點(diǎn)筆劃是否與網(wǎng)格線之一平行。在給出的實(shí)例中,在點(diǎn)B微分值表明與網(wǎng)格101平行,因此,將從A至B的線段認(rèn)可為一個線單元數(shù)據(jù)。
于是所述電路2以數(shù)學(xué)方法把網(wǎng)格100的起點(diǎn)置于點(diǎn)B并繼續(xù)該檢驗過程。其后,在點(diǎn)C確定微分值指出與網(wǎng)格的網(wǎng)格線8平行,因此,從B至C的線段成為另一個線單元數(shù)據(jù)。在該方法中,線段A-B,C-D,D-E,和E-F構(gòu)成線單元數(shù)據(jù)的一個集合。
用于本發(fā)明的字符詞典數(shù)據(jù)庫根本上是為使用跟蹤命令、選擇命令和檢驗命令等來表達(dá)一個字符而準(zhǔn)備的。
假定輸入手寫筆劃被轉(zhuǎn)換成若干線單元數(shù)據(jù),并存貯在線單元數(shù)據(jù)緩沖存貯器3。然后字符詞典數(shù)據(jù)庫4提供其字符詞典的命令數(shù)據(jù)給線單元數(shù)據(jù)跟蹤電路5。該線單元跟蹤電路5利用諸如長度、方向和起點(diǎn)座標(biāo)等線單元數(shù)據(jù)的各數(shù)據(jù)單元,以便選擇滿足由于字符詞典中該跟蹤條件命令描述的輸入手寫筆劃的跟蹤命令的線單元數(shù)據(jù),這樣便生成由一個以上線單元數(shù)據(jù)構(gòu)成的子筆劃的子筆劃數(shù)據(jù)。生成若干滿足所述跟蹤條件的子筆劃數(shù)據(jù),而后便把這些子筆劃數(shù)據(jù)供給子筆劃數(shù)據(jù)選擇電路6。
子筆劃數(shù)據(jù)選擇電路6接收自線單元數(shù)據(jù)跟蹤電路5取得的各子筆劃數(shù)據(jù)簇,并選擇滿足由字符詞典數(shù)據(jù)庫4中的選擇命令描述的選擇條件的子筆劃數(shù)據(jù)。將這樣選定的子筆劃數(shù)據(jù)又送至子筆劃數(shù)據(jù)緩沖存貯器7。
子筆劃數(shù)據(jù)評價電路8接收存貯在子筆劃數(shù)據(jù)緩沖存貯器7中的選定的子筆劃數(shù)據(jù),并根據(jù)由字符詞典數(shù)據(jù)庫4取得的部分相似性檢驗命令的內(nèi)容檢驗子筆劃數(shù)據(jù)的相似性。另外子筆劃數(shù)據(jù)評價電路8根據(jù)總的相似性檢驗命令對所有待檢部分子筆劃執(zhí)行總的相似性檢驗,并把評價結(jié)果供給字符識別和評價電路9。
下面參照組成圖2的流程圖,對線單元數(shù)據(jù)跟蹤電路5的操作加以描述。所述“跟蹤”一詞指的是根據(jù)字符數(shù)據(jù)詞典4中描述的每個字符所固有的跟蹤條件來跟蹤手寫字形的線單元數(shù)據(jù)。
參照圖2,起動操作后,在步21存貯當(dāng)前字符詞典的讀出位置,而在步22讀入下一詞典命令。讀出位置實(shí)際上是所述詞典數(shù)據(jù)庫4的指示器。即,每次用圖形輸入筆書寫圖形(字符)時,從詞典中順序讀出字符數(shù)據(jù)庫中所有字符數(shù)據(jù)以作評價。因為該數(shù)據(jù)庫的每個字符有若干命令集,所以需要指出該詞典的讀出位置。
緊接著,程序轉(zhuǎn)向判定步23,在該步中確定這樣讀入的詞典命令是否是跟蹤命令。倘若該詞典命令不是跟蹤命令,在步23表示出“否”,則程序就此結(jié)束。在該情況下,可假定為即在跟蹤命令中描述有一種跟蹤條件和一個跟蹤中止條件。
如果在步23表示出“是”,則確定該詞典命令是跟蹤命令,程序進(jìn)行至步24,在該步中從中讀出存貯在線單元數(shù)據(jù)緩沖存貯器3中的線單元數(shù)據(jù)。在下一判定步25中,確定這樣讀出的線單元數(shù)據(jù)是否滿足跟蹤命令的跟蹤條件。倘若線單元數(shù)據(jù)不滿足跟蹤條件,在步25表示出“否”,則程序返回步24,并重復(fù)執(zhí)行步24和25。如果在線單元數(shù)據(jù)不滿足跟蹤條件時不再有待讀出的線單元數(shù)據(jù),則用適當(dāng)?shù)慕K止處理來終止該例程。
另一方面,如果該線單元數(shù)據(jù)滿足跟蹤條件,在步25表示為“是”,則程序繼續(xù)執(zhí)行步26。
步26中,將滿足跟蹤條件的初始線單元數(shù)據(jù)的起止點(diǎn)座標(biāo)作為一跟蹤起止點(diǎn)存貯在跟蹤起止點(diǎn)信息緩沖存貯器中。指定該緩沖存貯器在一個由微處理機(jī)(未畫出)控制的工作隨機(jī)存取存貯器(RAM)中(未畫出)。
此外,在線單元數(shù)據(jù)滿足跟蹤條件時,重復(fù)地順序讀出線單元數(shù)據(jù)。在下步29中,存貯跟蹤中止點(diǎn)數(shù)據(jù)。在這種情況下,由步27和28構(gòu)成的循環(huán)中,滿足跟蹤條件的最后線單元數(shù)據(jù)之后的線單元數(shù)據(jù)的起始點(diǎn)信息被存貯在跟蹤中止點(diǎn)信息緩沖存貯器。這樣,跟蹤起止點(diǎn)信息緩沖存貯器的內(nèi)容和存貯在跟蹤中止點(diǎn)信息緩沖存貯器中的內(nèi)容提供子筆劃數(shù)據(jù)。
在下一步30中讀入下一詞典命令,同時程序繼續(xù)執(zhí)行下一判定步31。判定步31中,確定下一詞典命令是否是跟蹤命令。倘若該詞典命令是跟蹤命令,在步31用“是”表示,在步33取消在步29存貯進(jìn)緩沖存貯器的跟蹤中止點(diǎn)信息,于是程序便返回步28。倘若下一詞典命令不是跟蹤命令,在步31用“否”表示,程序執(zhí)行到下一判定步32。步32確定下一詞典命令是否是跟蹤中止條件,如果確定下一詞典命令不是跟蹤中止條件,在步32用“否”表示,在步34把字符詞典的讀出位置改變成如步21中相同的條件,于程序便繼續(xù)執(zhí)行步22。
在上述實(shí)施例中,跟蹤操作如上所接受多路跟蹤。如果不需要多路跟蹤,則可省略步31和33。多路跟蹤可用于具有兩個不同跟蹤條件的子筆劃。例如,在字符確定過程期間,可把字符“フ”看作單個子筆劃“フ”,或看作“-”和“丿”兩個子筆劃,如果把字符“フ”看作單個子筆劃“フ”時,就需要多路跟蹤。
下面參照圖3組成的流程圖,對子筆劃數(shù)據(jù)選擇電路6(參見圖1)的操作加以描述。
參照圖3,起動操作后,在步41讀入下一詞典命令,同時程序繼續(xù)執(zhí)行下一判定步42。步42中,確定讀入的詞典命令是否為選擇命令。倘若是選擇命令,如步42用“是”所表示,程序繼續(xù)執(zhí)行步43。另一方面,如果確定該詞典命令不是選擇命令,如步42用“否”所表示,程序執(zhí)行就終止。
在選擇命令中描述有數(shù)據(jù)選擇命令,指出用于選擇待選子筆劃數(shù)據(jù)的跟蹤起止點(diǎn)和跟蹤中止點(diǎn)信息,用于重新排列所選子筆劃數(shù)據(jù)的一個排序命令,以及指示如何根據(jù)排序結(jié)果導(dǎo)出子筆劃數(shù)據(jù)的一個輸出選擇命令。
步43中,讀入由數(shù)據(jù)選擇命令指出的子筆劃數(shù)據(jù)的跟蹤起始點(diǎn)/中止點(diǎn)數(shù)據(jù),程序繼續(xù)到步44。步44中,這樣讀入的子筆劃數(shù)據(jù)根據(jù)排序命令進(jìn)行重新排列,而在步45選擇由輸出選擇命令所要求的子筆劃數(shù)據(jù)。然后,將所選定的數(shù)據(jù)存貯在子筆劃數(shù)據(jù)緩沖存貯器7(參見圖1)中,并終止執(zhí)行過程。
下面參照圖4組成的流程圖,對子筆劃數(shù)據(jù)評價電路8(參見圖1)加以描述。
參照圖4,操作起動后,在步51中,讀入下一詞典命令。下一判定步52中,確定這樣讀入的詞典命令是否是一個部分相似性檢驗命令,如果確定該詞典命令為一部分相似性檢驗命令,如步52表示為“是”時,程序繼續(xù)執(zhí)行步53。步53中,從子筆劃數(shù)據(jù)緩沖存貯器7(參見圖1)讀入子筆劃數(shù)據(jù)。另一方面,倘若確定該詞典命令不是一個部分相似性檢驗命令時,如步52表示為“否”,執(zhí)行過程就終止。在部分相似性檢驗命令中同時描述有部分相似性檢驗處理數(shù)據(jù),因此在步54部分相似性檢驗處理中,根據(jù)部分相似性檢驗處理數(shù)據(jù)來處理這樣讀入的子筆劃數(shù)據(jù),然后便存貯該評價結(jié)果。對部分相似性檢驗說明如下。每個字符由若干子筆劃組成。為了改進(jìn)裝置的識別速度,將每個字符的手寫筆劃分成兩或三或更多的子筆劃簇。倘若對第一簇的部分相似性檢驗沒超過某一水平,則對其余各簇的識別過程是無用的,因此,識別過程移向字符數(shù)據(jù)庫的下一字符。
在下一步55中,讀入下一詞典命令,并且程序繼續(xù)執(zhí)行下一判定步56。在判定步56中,確定所述下一詞典命令是否是一部分相似性檢驗命令。倘若確定該下一詞典命令是一部分相似性檢驗命令,如步56表示為“是”,程序返回到步53。另一方面,倘若確定該下一詞典命令不是一部分相似性檢驗命令,如在步56表示為“否”,程序繼續(xù)執(zhí)行步57。如果該下一詞典命令的內(nèi)容是一總的相似性檢驗命令,則由步53至56構(gòu)成的處理循環(huán)中所取得的各檢驗結(jié)果全部一起檢驗,其后,在步57,執(zhí)行在步54所存貯的相應(yīng)子筆劃數(shù)據(jù)的總的相似性檢驗處理。在下一步58中,對該總的檢驗結(jié)果進(jìn)行評價,并送到字符識別和評價電路9(參見圖1)。于是,操作便終止。
如上所述,對于一個手寫字符要順序檢驗字符詞典數(shù)據(jù)庫4中的所有字符數(shù)據(jù),并使之與評價值配屬,而與最佳評價點(diǎn)配屬的字符碼就被選擇作為最后識別該手寫字符的字符碼。
圖1中用一點(diǎn)鏈線畫出輪廓的部分展示使用模板數(shù)據(jù)構(gòu)成模板類型識別電路的電路單元。盡管這識別電路本身并不直接與本發(fā)明的單元有關(guān)系,但從識別速度觀點(diǎn)來看它是相當(dāng)有利的。下面參照圖1對這種類型的字符識別電路加以描述。
如圖1所示,由手寫筆劃的輸入點(diǎn)式數(shù)據(jù)/線單元數(shù)據(jù)轉(zhuǎn)換電路2將來自手寫字符輸入電路1的手寫筆劃的點(diǎn)式數(shù)據(jù)轉(zhuǎn)換成線單元數(shù)據(jù),然后便存入線單元數(shù)據(jù)緩沖存貯器3。進(jìn)一步又通過一個線單元數(shù)據(jù)/模板數(shù)據(jù)轉(zhuǎn)換電路11將存貯在線單元數(shù)據(jù)緩沖存貯器3的線單元數(shù)據(jù)轉(zhuǎn)換成模板數(shù)據(jù),然后便存入模板數(shù)據(jù)緩沖存貯器12。在模板數(shù)據(jù)中描述有對應(yīng)于單一手寫筆劃(有時是兩個或更多的手寫筆劃)的線單元數(shù)據(jù)點(diǎn)的形狀。
當(dāng)自模板數(shù)據(jù)緩沖存貯器12取得的模板數(shù)據(jù)供給模板數(shù)據(jù)評價電路13時,該電路順序接收來自字符詞典數(shù)據(jù)庫4的字符詞典模板數(shù)據(jù),并對手寫模板數(shù)據(jù)與字符詞典模板數(shù)據(jù)中所描述的內(nèi)容進(jìn)行比較。然后,模板數(shù)據(jù)評價電路13把評價結(jié)果供給字符識別和評價電路9。在該情況下,模板數(shù)據(jù)描述對應(yīng)于單個手寫筆劃的線單元數(shù)據(jù)的點(diǎn)的典型形狀,而且其中詞典數(shù)據(jù)量與線單元數(shù)據(jù)跟蹤類型詞典相比是很小的。因此,與前述電路部分5至8構(gòu)成的應(yīng)用線單元數(shù)據(jù)的識別電路相比可以輕易地提高該識別電路的識別速度。另一方面,這種模板類型的識別電路其缺點(diǎn)在于對于識別變形的手寫字符,例如,連寫字符等,它是無效的。
為了在這種模板系統(tǒng)中接受變形的手寫字符,建議由單一的手寫筆劃寫成的全部可能的筆劃形狀都作為模板數(shù)據(jù)予存貯,或根據(jù)將切斷子筆劃描述為基本模板數(shù)據(jù)的組合的某一規(guī)則把連續(xù)的手寫筆劃斷開。但這兩種方法處理速度的觀點(diǎn)來看并不有利。另一方面,由電路單元5至8構(gòu)成的識別電路利用線單元數(shù)據(jù),其線單元數(shù)據(jù)量比模板數(shù)據(jù)量大,以致雖從識別速度觀點(diǎn)來看并不有利,而對連續(xù)和變形的字符來說卻更為有效。
如果結(jié)合使用具有互補(bǔ)特征的兩種字符識別電路,其中用模板數(shù)據(jù)作為其輸入的識別電路不得不識別具有比較小變形部分的字符,而由電路元件5至8構(gòu)成的字符識別電路用線單元數(shù)據(jù)作為其輸入,用以識別具有較大變形部分的字符,于是就可提高字符識別能力。
下面研究如圖1所示由兩種字符識別電路組合構(gòu)成的裝置。
參照圖1,該字符詞典數(shù)據(jù)庫4利用附加到每個字符數(shù)據(jù)上并在字符詞典中描述的控制碼,以確定是應(yīng)用存貯于模板緩沖存貯器12的模板數(shù)據(jù)的模板數(shù)據(jù)評價電路13還是由電路元件5至8構(gòu)成的用存貯于線單元數(shù)據(jù)緩沖存貯器3中的線單元數(shù)據(jù)的評價電路。然后,字符詞典數(shù)據(jù)庫4把字符詞典的內(nèi)容供給在字符詞典描述的控制碼所選擇的評價電路(電路組),并且,選擇電路(電路組)之一執(zhí)行該處理過程。
下文結(jié)合本發(fā)明的實(shí)施例對圖2至圖4中示出的處理過程加以說明。在該情況下,假定由于手寫筆劃的輸入點(diǎn)式數(shù)據(jù)/線單元數(shù)據(jù)轉(zhuǎn)換電路2將手寫筆劃的輸入點(diǎn)式數(shù)據(jù)轉(zhuǎn)換為線單元數(shù)據(jù)包含諸如長度、方向、起始點(diǎn)的座標(biāo)和圖形輸入筆的狀態(tài)(圖形筆的上和下)的信息。另外,該線單元數(shù)據(jù)包含字符構(gòu)形的尺寸數(shù)據(jù)和輸入手寫筆劃水平和垂直方向的最大和最小座標(biāo)值。此外,還假定由字符詞典數(shù)據(jù)庫4的控制碼選擇如圖1所示使用線單元數(shù)據(jù)的電路5至8。參照圖5A至5D將對于識別構(gòu)成一個漢字偏傍的所謂“Ennyo”的一種輸入手寫筆劃的識別操作加以描述。通過圖5A至5C,由一點(diǎn)鏈線示出的部分表示在圖形輸入板上規(guī)定的矩形字符書寫區(qū)。
對于輸入手寫筆劃來說,假定存貯于字符詞典用于識別“Ennyo”字符的跟蹤命令、跟蹤條件和跟蹤中止命令描述如下,(Ⅰ)跟蹤命令跟蹤命令描述為把自當(dāng)前線單元數(shù)據(jù)當(dāng)作跟蹤起始點(diǎn)跟蹤隨后的線單元數(shù)據(jù)。
(Ⅱ)跟蹤條件命令跟蹤條件命令描述為如果圖形輸入筆指向右,那么就跟蹤線單元數(shù)據(jù)而不管圖形輸入筆的狀態(tài)。
(Ⅲ)跟蹤中止條件命令跟蹤中止條件命令描述為當(dāng)手寫筆劃靠近書寫區(qū)的右邊端部或關(guān)閉狀態(tài)出現(xiàn)兩次時中止跟蹤。
倘若跟蹤起始點(diǎn)位于如圖5A所示的點(diǎn)P′處,其后,作為應(yīng)用上述跟蹤命令跟蹤處理的結(jié)果獲得滿足上述條件、如圖5B用三條粗線部分所示的三條手寫子筆劃S1、S2和S3。
在該情況下,假定對通過跟蹤處理選擇命令獲得的三條手寫筆劃S1、S2和S3的每一條來說,存貯在字符詞典用于選擇處理“Ennyo”字符的選擇條件命令、排序命令和輸出選擇命令描述如下(ⅰ)選擇命令該選擇命令描述為根據(jù)以下命令來執(zhí)行處理過程,由此選擇手寫子筆劃。
(ⅱ)選擇條件命令該選擇條件命令描述為從緊接前面的跟蹤處理所獲得的手寫子筆劃中選擇其起始點(diǎn)位于靠近矩形書寫區(qū)的左下部分而其中止點(diǎn)位于靠近矩形書寫區(qū)的右下部分的手寫子筆劃。
(ⅲ)排序命令該排序命令描述為根據(jù)它們的長度對由選擇條件命令選擇的手寫子筆劃進(jìn)行順序排序。
(ⅳ)輸出選擇命令該輸出選擇命令描述為從由選擇條件命令選擇并由排序命令進(jìn)一步排序的手寫子筆劃中選擇最長的手寫子筆劃。
當(dāng)通過上述選擇命令選擇手寫子筆劃時,就可得到圖5C中用粗線部分示出的手寫子筆劃S3。
另外,按照“Ennyo”字符的詞典命令,在“Ennyo”字符的不同條件下執(zhí)行跟蹤和選擇。于是,通過類似的處理可獲得圖5D中用粗線部分所示出的手寫子筆劃S4。
將通過上述跟蹤和選擇操作獲得的手寫子筆劃S3和S4順序存貯在圖1所示出的子筆劃數(shù)據(jù)緩沖存貯器7中,并送至子筆劃數(shù)據(jù)評價電路8,在該電路中由字符詞典數(shù)據(jù)庫4的部分相似性檢驗命令對它們進(jìn)行處理。
于是,手寫子筆劃S3和S4便經(jīng)受部分相似性檢驗。在該情況下,如同部分相似性檢驗命令,“Ennyo”字符的形狀評價命令和位置評價評價命令描述如下。
A.部分相似性檢驗命令該部分相似性檢驗命令描述為根據(jù)由形狀評價命令和位置評價命令描述的內(nèi)容檢驗手寫子筆劃S3和S4的部分相似性。
B.形狀評價命令手寫子筆劃S4的構(gòu)形是矩形的,并且在縱向是比較長的。它的起始點(diǎn)位于其中止點(diǎn)的上面,手寫筆劃S4的實(shí)際長度與僅由該手寫子筆劃S4構(gòu)成的多邊形的垂直長度相比可能是比較長的。
該手寫子筆劃S3的構(gòu)形是矩形的,并且在橫向是相當(dāng)長的。僅由該手寫子筆劃S3構(gòu)成的多邊形的橫向長度實(shí)質(zhì)上等于手寫子筆劃S3的實(shí)際長度。
C.位置評價命令手寫子筆劃S4的中止點(diǎn)位于靠近手寫子筆劃S3的起始點(diǎn)之處。
作為對上述B和C項檢驗結(jié)果共同檢驗的總檢驗命令,用于“Ennyo”字符的總的相似性檢驗命令和總的相似性檢驗執(zhí)行命令,可描述如下。
(1)總相似性檢驗命令通過應(yīng)用該總的相似性檢驗命令檢驗緊接前面的評價結(jié)果的總相似性。
(2)總相似性檢驗執(zhí)行命令該總相似性檢驗執(zhí)行命令描述為集合地評價各個評價結(jié)果作為總的相似性檢驗結(jié)果。
按照上述處理過程,來確定輸入的手寫筆劃是否與“Ennyo”字符相同,換句話說,確定了“Ennyo”字符與輸入手寫筆劃之間的相似程度,并把檢驗結(jié)果供給圖1所示的字符識別和評價電路9。當(dāng)然,在詞典中的所有字符數(shù)據(jù)與每個手寫字符都進(jìn)行比較。
在按照存貯在字符詞典數(shù)據(jù)庫4中表示“Ennyo”字符的命令檢驗輸入“Ennyo”字符時,有可能獲得最高的評價點(diǎn)。然而,在該情況下,在“Ennyo”字符的輸入手寫筆劃顯著變形時,甚至連如果以上的“Ennyo”字符是按照存貯在字符詞典數(shù)據(jù)庫4中用于表示“Ennyo”字符的命令檢驗的,這樣獲得的評價點(diǎn)也不是那么高。在這種情況下,人們認(rèn)為不能識別輸入的手寫筆劃“Ennyo”字符,于是便終止處理。
字符識別和評價電路9順序地操作存貯與手寫圖形有關(guān)的所有字符詞典數(shù)據(jù)庫的評價結(jié)果。在存貯所有的結(jié)果之后,可導(dǎo)出具有最佳結(jié)果的字符碼作為識別過程的結(jié)果。通常只有十個左右的字符碼和評價點(diǎn)被存貯起來,而字符數(shù)據(jù)庫中其余的字符并不需要予以存貯,因為與手寫字符數(shù)據(jù)的相似性電平未達(dá)到一個預(yù)定的電平。
按照本發(fā)明,如上所述,已考慮到如果以初始字符的觀點(diǎn)或可予描述的字符的觀點(diǎn)考慮手寫筆劃時子筆劃的重要性。其次,已經(jīng)發(fā)現(xiàn)手寫筆劃是子筆劃的集合,或子筆劃是構(gòu)成手寫筆劃的單元。最后,本發(fā)明已在單元的原始形狀和單元間位置關(guān)系的基礎(chǔ)上理解字符方面獲得了成功。這樣,與先有技術(shù)需要相當(dāng)大量的計算處理不同,本發(fā)明的手寫字符識別裝置能夠輕易地識別連續(xù)的和變形的字符。
另外,在借助應(yīng)用模板數(shù)據(jù)識別手寫字符時,在模板數(shù)據(jù)中單一的手寫筆劃表示為一種典型、簡化的形狀,從識別速度觀點(diǎn)來看,存貯過多典型形狀并不有利。再說,盡管只用一種模板的數(shù)據(jù)處理系統(tǒng)可導(dǎo)致處理速度提高,但這種系統(tǒng)不能用于識別變形的字符。按照本發(fā)明的,由于模板數(shù)據(jù)處理系統(tǒng)和子筆劃劃分處理系統(tǒng)是適當(dāng)選定的,所以本發(fā)明可獲得能有效識別變形字符并且有高識別速度的手寫字符識別裝置。
應(yīng)該理解到以上說明是通過本發(fā)明單一最佳實(shí)施例的實(shí)施予以表示的,顯然,對于熟悉本行業(yè)技術(shù)的人,在不違反本發(fā)明的精神、和新穎概念范圍的情況下可對它實(shí)現(xiàn)多種修改和變化,因此,本發(fā)明的范圍只能由附帶的權(quán)利要求書加以確定。
權(quán)利要求
1.一種手寫字符識別裝置,其特征在于它包括用于接收在書寫一個字符時獲得的點(diǎn)式數(shù)據(jù)并由此產(chǎn)生相應(yīng)線單元數(shù)據(jù)的裝置。存貯各自表示不同字符構(gòu)形的命令集形式的字符詞典數(shù)據(jù)庫裝置,該字符數(shù)據(jù)包含跟蹤命令、選擇命令和檢驗命令,連接到字符詞典數(shù)據(jù)庫裝置上的子筆劃數(shù)據(jù)生成裝置,以自字符詞典數(shù)據(jù)庫裝置取得的字符跟蹤命令為基礎(chǔ)通過跟蹤線單元數(shù)據(jù)從而產(chǎn)生子筆劃數(shù)據(jù),連接到字符詞典數(shù)據(jù)庫裝置上的子筆劃選擇裝置用于從輸入的子筆劃中選擇出具有自字符詞典數(shù)據(jù)庫裝置取得的字符選擇命令所定義的選擇條件的子筆劃數(shù)據(jù),以及連接到字符詞典數(shù)據(jù)庫裝置和子筆劃數(shù)據(jù)選擇裝置的子筆劃數(shù)據(jù)評價裝置,用于根據(jù)自字符詞典數(shù)據(jù)庫裝置取得的字符檢驗命令、通過檢驗所選手寫字符的子筆劃數(shù)據(jù)的相似性來評價手寫字符的相似性。
2.如權(quán)利要求1中所述的手寫字符識別裝置,其特征在于該字符選擇命令包含選擇條件命令,排序命令和輸出選擇命令,另外包括一連接到子筆劃數(shù)據(jù)選擇裝置上的用于存貯滿足選擇條件命令的子筆劃數(shù)的緩沖存貯器。
3.如權(quán)利要求1中所述的手寫字符識別裝置,其特征在于該字符檢驗命令包含形狀評價命令和位置評價命令,而且其中子筆劃數(shù)據(jù)選擇裝置使用形狀評價命令評價手寫字符所選子筆劃數(shù)據(jù)的形狀,而位置評價命令評價手寫字符所選子筆劃數(shù)據(jù)的位置關(guān)系。
4.如權(quán)利要求2中所述的手寫字符識別裝置,其特征在于該字符檢驗命令包含形狀評價命令和位置評價命令,而且其中子筆劃數(shù)據(jù)選擇裝置使用該形狀評價命令評價手寫字符所選子筆劃數(shù)據(jù)的形狀,而使用位置評價命令評價手寫字符所選子筆劃數(shù)據(jù)的位置關(guān)系。
5.如權(quán)利要求2中所述的手寫字符識別裝置,其特征在于該字符檢驗命令包含部分檢驗命令和總檢驗命令,其中子筆劃評價裝置按照總檢驗命令根據(jù)用部分檢驗命令得到的部分評價結(jié)果對于存貯在字符詞典數(shù)據(jù)庫裝置中的字符數(shù)據(jù)產(chǎn)生手寫字符的最后評價。
6.一種手寫字符識別方法,其特征在于,它包括以下步驟接收書寫一個字符時獲得的點(diǎn)式數(shù)據(jù)并從中產(chǎn)生其相應(yīng)線單元數(shù)據(jù),把各自表示不同字符構(gòu)形的字符數(shù)據(jù)以命令集形式存貯在字符詞典數(shù)據(jù)庫中,字符數(shù)據(jù)包含跟蹤命令、選擇命令和檢驗命令,根據(jù)自字符詞典數(shù)據(jù)庫存貯器取得的字符跟蹤命令通過跟蹤線單元數(shù)據(jù)生成子筆劃數(shù)據(jù);選擇具有自字符詞典數(shù)據(jù)庫取得的字符選擇命令定義的選擇條件的子筆劃數(shù)據(jù),以及根據(jù)自字符詞典數(shù)據(jù)庫存貯器取得的字符檢驗命令,通過檢驗所選手寫字符的子筆劃數(shù)據(jù)的相似性來評價手寫字符的相似性。
7.如權(quán)利要求6中所述的手寫字符識別方法,其特征在于其中字符選擇命令包含選擇條件命令,排序命令和輸出選擇命令,并另外包括把滿足選擇條件命令的子筆劃數(shù)據(jù)存入一緩沖存貯器的各步驟。
8.如權(quán)利要求6中所述的手寫字符識別方法,其特征在于其中從字符詞典數(shù)據(jù)庫存貯器取得的字符檢驗命令包含形狀評價命令和位置評價命令,并另外包括評價手寫字符所選子筆劃數(shù)據(jù)的形狀和評價字符所選子筆劃數(shù)據(jù)的位置關(guān)系的各步驟。
9.如權(quán)利要求7中所述的手寫字符識別方法,其特征在于自字符詞典數(shù)據(jù)庫存貯器取得的字符檢驗命令包含形狀評價命令和位置評價命令,并另外包括評價字符所選子筆劃數(shù)據(jù)的形狀和評價手寫字符所選子筆劃數(shù)據(jù)的位置關(guān)系的各步驟。
10.如權(quán)利要求7中所敘述的手寫字符識別方法,其特征在于其中從字符詞典數(shù)據(jù)庫存貯器取得的字符檢驗命令包含部分檢驗命令和總檢驗命令,并另外包括使用部分檢驗命令部分地評價與存貯的字符數(shù)據(jù)有關(guān)的手寫字符,以及應(yīng)用總檢驗命令生成基于部分檢驗步驟結(jié)果的與存貯的字符有關(guān)的手寫字符的最后評價的各步驟。
全文摘要
一種手寫字符識別裝置及方法,其中,將從輸出手寫筆劃獲得的線單元數(shù)據(jù)轉(zhuǎn)換成若干滿足根據(jù)字符詞典數(shù)據(jù)庫中所描述的跟蹤命令的跟蹤條件的子筆劃,根據(jù)字符詞典數(shù)據(jù)庫描述的選擇命令滿足跟蹤條件的子筆劃,然后,基于手寫筆劃是子筆劃的集合的假設(shè),通過使用形狀評價命令評價子筆劃的形狀以及使用位置評價命令來評價子筆劃位置關(guān)系,從而識別手寫字符,借此,手寫字符諸如變形的手寫字符等等能夠輕易地加以識別。
文檔編號G06K9/22GK1040693SQ8910672
公開日1990年3月21日 申請日期1989年8月23日 優(yōu)先權(quán)日1988年8月23日
發(fā)明者茶谷公之, 吉田公義, 坂野秋夫, 田守寬文 申請人:索尼公司