專利名稱:手寫體識別中基線,行距和字高的估算的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及信號處理的領(lǐng)域,特別涉及到手寫體識別。本發(fā)明專門用于改善識別準(zhǔn)確度,其方法是將手寫字符的笛卡爾座標(biāo)規(guī)格化,使之和字符原型座標(biāo)空間相符合。
在書寫識別系統(tǒng)中,通常把手寫體區(qū)域標(biāo)上線條,以引導(dǎo)用戶為書寫定位。用戶書寫的手跡由數(shù)字化儀檢測并傳送到模式匹配器,后者把手寫體和代表書寫單元(字符)的模式進(jìn)行匹配,而此原型模式可由系統(tǒng)識別。此匹配過程中的一步是必須把數(shù)字化儀檢測到的手寫體的笛卡爾座標(biāo)加以規(guī)格化,使之和原型座標(biāo)空間相符合。
為了獲得高的識別準(zhǔn)確度,座標(biāo)的規(guī)格化是一個重要因素。在獲得正確規(guī)格化的過程中所用信息包括一些測量值,諸如行距和基線位置。由于不同用戶的書寫風(fēng)格不同,而且就是用一用戶的書寫風(fēng)格也有變化,所以這些測量值和系統(tǒng)所提供的書寫區(qū)域的線條的值會相差很多。由于規(guī)格化對模式匹配算法的成功至關(guān)重要,因此要求手寫體識別系統(tǒng)提供一種準(zhǔn)確的在線估算行距和基線位置數(shù)值的方法,以便得到高的識別準(zhǔn)確率。
有不少專利和文獻(xiàn)涉及到手寫體識別,它們各有一定值優(yōu)缺點(diǎn)。
Herbst等人的美國專利4,024,500中公開了一種方法和裝置,用于在手寫體分析系統(tǒng)中完成字符分段,包括形成所述手寫體的書寫工具的連續(xù)的x、y座標(biāo)值和x、y速度值的獲取,包括對和手寫字符的所有x和y極值點(diǎn)有關(guān)的x位移值的連續(xù)平均值,在這些x和y極值點(diǎn)處x或y速度值等于零,包括連續(xù)檢查每個x極值的x位移值并確定所述極值的x位移值是否超過了預(yù)定的閾值,該閾值是相對于當(dāng)前字符的x位移平均值而言,如果是超過了,則說明以下兩點(diǎn)所述新極值點(diǎn)位于下一字符內(nèi),應(yīng)在剛才研究過的極值點(diǎn)和以前研究過的極值點(diǎn)間的連線上預(yù)定的距離處打上分段標(biāo)記。分段的結(jié)果然后送給字符識別裝置,所述分段標(biāo)記會大大提高字符識別裝置的效率和準(zhǔn)確度。根據(jù)設(shè)計,在書寫過程中系統(tǒng)也能跟蹤基線和中位線的偏差。
Kochert等人在美國專利4,845,768中公開了一種用于字符識別的編輯裝置,該裝置在一個X/Y可尋址地圖象信號存儲器中存儲了一個用二進(jìn)制編碼的字符。信號首先從所述存儲器中逐列讀出,接著分別把所述信號中包含黑點(diǎn)的各連續(xù)列投影在字符基線上,該投影即為所述字符的第一個字符影。然后,根據(jù)在相對于Y軸的正的和/或負(fù)的斜角進(jìn)行掃描,重復(fù)地讀出存儲的字符模式,直至產(chǎn)生一個最小的字符影象。得到這個最小字符影象的被掃描模式即被選用,以便進(jìn)一步估算所述字符。
Sklarew在美國專利4,972,496中公開了一個不用鍵盤輸入的計算機(jī)系統(tǒng),該系統(tǒng)包括一個透明輸入屏和顯示屏。該透明輸入屏當(dāng)指示筆接觸時即產(chǎn)生位置信息,該顯示屏裝于所述輸入屏的下面,以使所顯示字符能在輸入屏下面看見。系統(tǒng)包括一臺計算機(jī),該計算機(jī)的程序可把位置信息編譯成筆劃,可計算筆劃特性,然后把該特性和數(shù)據(jù)庫中存儲的筆劃特性相比較,以便識認(rèn)指示筆所書寫符號。該系統(tǒng)的關(guān)鍵性能是1)透明的位置檢測子系統(tǒng);2)放在下面的顯示裝置,用于模仿所檢測到的位置的圖案和用于顯示字符或符號;3)用于把檢測到的位置首先轉(zhuǎn)換到畫出的點(diǎn),然后轉(zhuǎn)換到識別的字符或符號的裝置;和4)能“學(xué)會”把檢測到的輸入位置和某字符或符號連系起來的裝置。
J.Kim在IBM技術(shù)公報的1983年3月的25卷10期的5111-5114頁的名為“手寫試驗(yàn)中基線漂移的校正”的文章中把一個字分成幾個較小的單元。每個單元是一個等寬的框子,其高度足以包容該寬度內(nèi)的所有點(diǎn)。這些框子在該字上面均勻分布。因此可以分析框子的相對位置和檢測它們?nèi)绾紊仙蛳陆?。這些框子的dy/dx的平均值就是漂移值,可用于校正。
根據(jù)本發(fā)明,用于手寫體識別的基線,行距和字信息可通過對以前識別過的字的特征提取以及應(yīng)用筆劃的Y座標(biāo)極值點(diǎn)聚類的啟發(fā)式信息來進(jìn)行估算,從而改善手寫體的識別準(zhǔn)確度。
本發(fā)明的目的是提供手寫體識別系統(tǒng)中一個改善的行距和基線調(diào)整器。
本發(fā)明另一個目的是應(yīng)用加權(quán)平均估算法為手寫體識別系統(tǒng)提供一個改善的行距和基線調(diào)整器。
本發(fā)明又一個目的是應(yīng)用原型提取估算法為手寫體識別系統(tǒng)提供一個改善的行距和基線調(diào)整器。
本發(fā)明再一個目的是應(yīng)用端點(diǎn)群集估算法為手寫體識別系統(tǒng)提供一個改善的行距和基線調(diào)整器。
本發(fā)明還有一個目的是把原型提取估算法和極值點(diǎn)聚類估算法結(jié)合起來,加以應(yīng)用,提供手寫體識別系統(tǒng)中一個改善的行距和基線調(diào)整器。
手寫體識別系統(tǒng)中的行距基線調(diào)整器改善識別準(zhǔn)確度的方法是把由數(shù)字化儀檢測到的手寫體的迪卡爾座標(biāo)規(guī)格化,并使之和原型字符空間相重合。規(guī)格化技術(shù)包括加權(quán)平均估算法,原型提取估算法,極值點(diǎn)聚類估算法以及原型提取估算法和極值點(diǎn)聚類估算法的結(jié)合。
圖1是根據(jù)本發(fā)明設(shè)計和操作的手寫體識別系統(tǒng)的簡化框圖;
圖2顯示了手寫體識別系統(tǒng)內(nèi)的基線,行距和字高;
圖3顯示了手寫體識別系統(tǒng)內(nèi)的漂移的手跡;
圖4顯示了手寫體識別系統(tǒng)內(nèi)的省缺估算法;
圖5顯示了基于一個線段的最大和最小Y座標(biāo)值的估算結(jié)果;
圖6顯示了加權(quán)平均估算結(jié)果;
圖7顯示了原型提取估算結(jié)果;
圖8顯示了筆劃的Y軸座標(biāo)極值點(diǎn)的自然聚合類;
圖9是一個提供加權(quán)平均估算法的系統(tǒng)的框圖;
圖10是一個提供原型提取估算法的系統(tǒng)的框圖;
圖11是一個提供極值點(diǎn)聚類估算法的系統(tǒng)的框圖;和圖12是把原型提取估算法和極值點(diǎn)聚類估算法結(jié)合起來的系統(tǒng)的框圖。
圖1顯示了一個根據(jù)本發(fā)明設(shè)計和操作的在線手寫字符識別系統(tǒng)10。例如,系統(tǒng)10可以是一個帶有PenPoint操作系統(tǒng)的IBM Think Pad計算機(jī)700-T。系統(tǒng)的操作在用戶手冊(IBM部件號41G3122)中有說明。ThinkPad是IBM公司的注冊商標(biāo),而PenPoint是GO公司的注冊商標(biāo)。系統(tǒng)10包括一個手寫體轉(zhuǎn)換器,該轉(zhuǎn)換器由一個集成電子輸入面板和一個帶有書寫工具(如指示筆14)的顯示裝置12組成。對手寫字符作出響應(yīng),該轉(zhuǎn)換器輸出一串(x,y)座標(biāo)對,后者對應(yīng)于指示筆14在輸入面板12的座標(biāo)系中的相對位置。這些座標(biāo)對送到一個筆劃分段器16,后者用于鑒別離散的手寫筆劃的起點(diǎn)和終點(diǎn)。筆劃送到行距(LS)基線(BL)調(diào)整器17,該調(diào)整器估算每個字符的LS和BL以提供規(guī)格化字符,從而獲得更大的字符識別準(zhǔn)確度。如何做到這一點(diǎn)將接著在后面詳細(xì)介紹。規(guī)格化的筆劃送至字符匹配器18。字符匹配器18和一個預(yù)定的字符原存儲器20相耦合,把輸入筆劃的各點(diǎn)和存儲的字符原型的各點(diǎn)相比較,以便在一定概率下鑒別輸入的筆劃或一組筆劃是否代表一個特定的字符。被識別的字符由匹配器18經(jīng)過信號線19送至輸入面板和顯示裝置12,以便顯示該字符。該字符也可能用于例如顯示裝置那樣的實(shí)用裝置21或是類似字處理程序那種的應(yīng)用程序。實(shí)用裝置21可能向行距基線調(diào)整器17提供LS和BL的省缺值,以改善識別準(zhǔn)確度。在有些系統(tǒng)內(nèi)字符分段器16和字符匹配器18的功能可能會在一個手寫筆劃處理單元內(nèi)統(tǒng)一起來。
可以由系統(tǒng)10的一個用戶管理一個培訓(xùn)周期,并向存儲器20提供字符原型。字符原型可由一個特定的系統(tǒng)用戶輸入,而以后當(dāng)該特定用戶手寫輸入字符時即可使用該字符原型。還有,也可以產(chǎn)生一套全局或通用的字符,以供多個用戶使用。
在這方面,可以設(shè)計一套啟動原型,供任一位首次使用系統(tǒng)10的書寫者用作初始原型。如果該書寫者愿意的話,他/她可以按自己的書寫風(fēng)格增加字符原型,從而得到一套適合該書寫者的原型,這也稱之為一套個性化原型。由于一套啟動原型通常由手寫體識別系統(tǒng)的專家所建立,所以系統(tǒng)10的用戶不必操心去遵循任何書寫建議或約束。
在任何情況下,在培訓(xùn)周期內(nèi)字符從字符匹配器18經(jīng)過一個物理或邏輯開關(guān)22送至原型處理器24,后者可以是一個lntel′386處理器。原型處理器24的輸出是一串求過均值的原型字符,送到存儲器20,供隨后的系統(tǒng)10的用戶進(jìn)行識別時使用。
原型處理器24還耦合到用戶的輸入和輸出裝置,例如鍵盤26和顯示裝置28。當(dāng)系統(tǒng)10的用戶進(jìn)行手寫體識別時,如想刪除混淆的厚型,就需控制原型處理器24的操作。
應(yīng)該知道,集成的電子輸入面板和顯示裝置12可用一個不帶顯示裝置的電子輸入面板來替代,而用實(shí)用裝置21或顯示裝置28來顯示字符。
下面涉及到用于提供字符識別準(zhǔn)確度的行距基線調(diào)整器17的功能細(xì)節(jié)。
用戶書寫文句時,通常一次書寫一行,而當(dāng)一行結(jié)束時,字跡就折轉(zhuǎn)到下一行。書寫方向(由左到右,由右到左,等等)隨著書寫語言的不同而不同。這里介紹的技術(shù)適用于不同語言和書寫方向。下面術(shù)語定義用于描述本發(fā)明基線自然線條,用戶把不帶下垂筆劃的字母都寫在這條線以上。
字高所識別語言的大寫字母的頂部與基線間的距離。
下垂筆劃用戶在自然線條上書寫時,字母伸到該自然線條下面的那部分。字母“g”、“j”、“p”、“q”和“y”是包括下垂筆劃的英文字母的例子。
行距從基線往上的能包含字符各點(diǎn)的最大距離。
圖2中的例子顯示了行距30,字高32和基線位置34。由于用戶通常在書寫大寫字母時并不完全填滿相鄰基線間的空間,所以字高只是行距的一個百分?jǐn)?shù)。一般不帶上伸和下垂筆劃的小寫字母書寫時約占行距值的一半高度,而帶有上伸或下垂筆劃的小寫字母書寫時約占全部行距值。
對手寫文本的分析表明,文本并不正好座落在基線上,即使用劃好線的書寫紙也是如此。此外,手寫體的字高和行距也隨時間不同而變化。這種現(xiàn)象的例子見圖3。線36顯示字高的漂移;而線40顯示字高和基線兩者的同時漂移。由于這種自然的變動,在手寫體識別系統(tǒng)中需要對行距,基線和字高的數(shù)值進(jìn)行在線估算。
輸入數(shù)據(jù)的基本單位是筆劃。一個筆劃是從落筆到提筆間的書寫。一個字符可以包括一個或多個筆劃。筆劃可以只是一次一劃,也可以一次組成一個字母,一個字甚至一行字符。一組筆劃稱為線段。
下面將敘述手寫體識別系統(tǒng)中估算基線、行距和字高的五個逐漸詳盡和準(zhǔn)確的方法。
缺省估算法有可能為用戶在書寫面板上提供基線,同時假設(shè)用戶將在這些線條之間均勻書寫,而所寫字符的大小并無任何變動。在這個模型中,假設(shè)大寫字母書寫時完全填滿了相鄰基線間的空間,而小寫字母書寫時則占據(jù)此高度的一半。下垂筆劃向下伸至下一行的中間位置。在這種估算法的模式中基線的計算結(jié)果等于書寫面板上向用戶提供的線條的值。而行距和字高的計算結(jié)果是相鄰基線的距離。這種方法只能用于肯合作的用戶,如圖4所示。
簡單估算法第二個估算法以線段的y座標(biāo)的最大和最小值為基礎(chǔ)。取ymax為線段的y座標(biāo)最大值,ymin為同一線段的y座標(biāo)最小值。本方法中基線估算為ymin的值。行距和字高則估算為等于ymax-ymin。見圖5。
本方法可以很快地估算出基線、行距和字高值,同時當(dāng)手寫體識別系統(tǒng)沒有在書寫面上提供任何線條來引導(dǎo)用戶時也可使用。然而,它并不總能為好的模式匹配提供所需要的準(zhǔn)確度。當(dāng)線段中存在下垂筆劃時,例如圖5中的42和44,則會有較差的基差估算值。當(dāng)線段中都是不帶下垂筆劃的小寫字母時,字高和行距的估算值大約是它們正確值的一半。當(dāng)線段同時包括大寫字母和帶下垂筆劃的字母時,行距和字高的估算值約為它們正確值的一倍半。
這些缺點(diǎn)帶來的后果是相似形狀的字符對,如(C,c)和(P,p)將無法由匹配器來區(qū)別。
加權(quán)平均估算法通過計算可以獲得較好的行距,字高和基線的估算值,所述計算包括以前的計算值和換算到這一點(diǎn)的所有線段的y座標(biāo)最大值和最小值的加權(quán)平均值。如圖6所示,取LSold為系統(tǒng)對以前線段換算時所用的舊行距的估算值。取Ymax和Ymin為當(dāng)前線段的Y座標(biāo)的最大值和最小值。取Wold和Wcur為計算新的基線、行距和字高值時決定以前線段和當(dāng)前線段的相對影響的加權(quán)系數(shù)。Wold和Wcur的典型范圍。取LSsys為存入系統(tǒng)的新行距值和BLsys為存入系統(tǒng)的新基線值。于是sys估算值可由下列公式計算出LSsys=(Wold*LSold+Wcur*(Ymax-Ymin))/(Wold+Wcur)BLsys=(Wold*BLold+Wcur*Ymin)/(Wold+Wcur)依賴于以前字段的計算值,本方法試圖補(bǔ)償簡單估算法的不足。當(dāng)有足夠數(shù)量的書寫字符時,遇到的字高和y座標(biāo)的限值會有一定波動。限值是最大和最小值。特別是會有些線段包含全字高的字母而有些線段又不包含任何下垂筆劃。當(dāng)使用加權(quán)平均法去計算行距和基線位置時,這些線段可用來改變估算的基線和行距值,使它們趨向正確的估算值。在線段帶有下垂筆劃或使用簡單估算法時產(chǎn)生不正確的估算值的情況下,這些線段對估算值的影響不像使用簡單估算法時那么嚴(yán)重。相反地,估算值會緩慢地向著當(dāng)前線段的數(shù)值變動,特別是如果加權(quán)系數(shù)依賴于到目前為止所遇到的筆劃數(shù)目時更是如此。圖上顯示了行距估算值46和基線估算值48隨時間的變化曲線。
這些公式不能盲目搬用。有些字符的形狀如句號或逗號只占據(jù)行距的一小部分,若用這些公式識別時,它們都被排除掉。圖9提供了加權(quán)平均估算法的詳細(xì)描述。
原型提取估算法加權(quán)平均估算法用起來不錯,但它仍有可以改進(jìn)的地方。當(dāng)一個線段已被識別而另一個新線段要被識別時,應(yīng)用原型提取估算法可以利用以前線段的識別結(jié)果來改善行距和基線值的估算。
模式匹配包括把一個未知書寫體50映射到空間52。原型包括一個標(biāo)號、行距、基線、字高和字體形狀信息。在匹配過程中未知輸入和一套預(yù)先存儲的原型進(jìn)行比較。該過程的結(jié)果是為每一個原型打上匹配分?jǐn)?shù),以表示未知輸入和原型匹配間的緊密程度。具有最好匹配分?jǐn)?shù)的原型標(biāo)號通常被選作匹配過程的結(jié)果。
可以把原型中包括的基線54和行距56的信息反回來映射到手寫體輸入空間的座標(biāo)系上。當(dāng)一個原型選為未知輸入的最佳匹配而該原型的分配分?jǐn)?shù)又優(yōu)于預(yù)定的閾值時,可把所選原型反回來映射到手跡區(qū)域,從而便準(zhǔn)確地估算以前線段的基線和行距,因此,假定以前線段的模式匹配分?jǐn)?shù)是好的,則從所匹配的原型中提取的行距和基線信息就可用到估算公式中去。
取LSpro為以前匹配的原型集合中提取出的行距。取BLpro為以前匹配的原型集合中提取出的基線信息。取Wpro為加權(quán)系數(shù),它決定這些提取出的數(shù)值對估算計算的影響大小。Wpro和Wcur通常的取值范圍為初始化時取0-1.0,非初始化時取0.3-0.7。LSnew和BLnew同樣代表了用本方法計算所得數(shù)值。新的估算可由下列公式計算而得15 LSsys=(Wpro*LSpro+Wcur*LSnew)/(Wpro+Wcur)BLsys=(Wpro*BLpro+Wcur*BLnew)/(Wpro+Wcur)
在計算新數(shù)值時,在有些情況下不可能或最好不用從所匹配原型提取出的基線和行距值。對于從頭開始匹配的第一個線段(或是在估算基線值時一行的第一個線段),并不存在以前線段,因此也就沒有匹配原型。任何估算值,例如書寫線條的測量,或者用Ymin和Ymax計算所得數(shù)值都可在這種情況下用作行距和基線的種子數(shù)值。此外,一些標(biāo)點(diǎn)符號諸如句號或逗號都很短,只占有用行距的一小部分。這些都不能用于調(diào)整行距值。為檢查是否有這些情況,需計算線段的Ymax-Ymin值。如果該值小于預(yù)定閾值(定義為舊行距的一小部分),則從原型提取的行距值就不應(yīng)使用。同樣理由,為避免把單引號誤認(rèn)為逗號,當(dāng)線段的Ymin值超過遠(yuǎn)離舊基線值的某個閾值時,應(yīng)該使用舊基線值而不使用提取數(shù)值。這在圖10中更詳細(xì)的解釋了。
極值點(diǎn)聚類估算法原型提取估算法是很好的,但仍有局限性。特別是,系統(tǒng)對所識別的書寫行必須至少已經(jīng)識別該行的一個字符。這意味著它不能用來識別任一行的第一個字符。極值點(diǎn)聚類估算法是一種預(yù)處理方法,它用于識別時可以解決這個問題并比以前的方法提供更好的估算結(jié)果。
圖8中例子的每一個筆劃的Ymin和Ymax值存儲后,其結(jié)果是一套4組數(shù)值,本方法稱之為聚合類。聚合類也稱直方圖。這些聚合類是相對于線條A,B,C和D計算而得,也就是計算字母線條落在A-D線條上的點(diǎn)的總數(shù)。按每行的書寫字符來計算聚合類。要注意到,所有下垂筆劃的底部58,60,62和64如何歸入屬于線條A的聚合類,而所有大寫字母66和高的小寫字母的頂部68如何歸入屬于線條D的聚合類。同樣地,大寫字母的底部70和不帶下垂筆劃的小寫字母如72和74都?xì)w入屬于線條B的聚合類。歸入屬于線條B的聚合類的還有帶有下垂筆劃的小寫字母的中間點(diǎn),例如76和78。剩下的是屬于線條C的聚合類,它是所有小的小寫字母的頂部,如80和82。
最初的行距值或由應(yīng)用程序傳送,或從當(dāng)時正使用的系統(tǒng)度量值推導(dǎo)而來,或者根本不提供。應(yīng)用程序也可能傳送一個基線值,用于建立聚合類。如果基線值無法知道(從應(yīng)用程序和以前計算都無法知道時),它可設(shè)置為零。使用啟發(fā)式信息來確定哪一個聚合類最可能是基線值。以這個行距和基線值為依據(jù),可建立起一套初步的4個聚合類。直方圖84顯示了4個聚合類,它們是下垂筆劃底部86,基線88,小寫字母頂部90,和大寫字母(或高小寫字母)頂部92。這組聚合類84是參考點(diǎn),用于確定新的底線和行距值。
極值點(diǎn)聚類法訪問線段的所有點(diǎn),并提取每一筆劃的Ymin和Ymax值,把每一個值存放到4個可能的聚合類中的一個(取決于每一點(diǎn)離那個聚合類最近)。權(quán)值(出現(xiàn)次數(shù))和每個聚合類相聯(lián),其范圍是從零到最大為9的值。
當(dāng)聚合類建立后,使用啟發(fā)式信息來確定那個聚合類代表基線和行距。有效的聚合類必須有大于零的權(quán)值(至少有一點(diǎn)是落在該聚合類上)。如果找到的有效聚合類少于2個,則使用原先的行距和基線值。如果4個有效聚合類都已找到,則基線和行距值就可求得并能使用。如果找到2或3個有效聚合類,必須確定它們代表的數(shù)據(jù)類型。數(shù)據(jù)類型最大的可能是混合型(大寫和不帶下垂筆劃的小寫)、全大寫、全小寫、帶下垂筆劃的小寫、或全數(shù)字。和參考用聚合類作比較后,可以很好地指出那些數(shù)值已知,同時從已知的有效聚合類可以算出未找到的聚合類值。新的估算值可用下列公式計算而得LSsys=(Wold*LSold+Wcur*LSnew)/(Wold+Wcur)BLsys=(Wold*BLold+Wcur*BLnew)/(Wold+Wcur)在初始化時,如果使用預(yù)定義線條來書寫,則使用LS和BL的省缺值。如不用預(yù)定義線條,則可計算Ymin和Ymax以確定初始條件。
圖11給出了極值點(diǎn)聚類法的詳細(xì)描述。
現(xiàn)在看圖9,這是在圖6中一般性描述過的加權(quán)平均估算器的詳細(xì)框圖94。它可用作圖1所示行距基線調(diào)整器17。把組成一個字符的每個線段的X,Y點(diǎn)送至96框,用于計算Ymin和Ymax,計算出的Ymin和Ymax值送至98框,并按照下列公式用于計算一個字符的LS和BS值LSsys=(Wold*LSold+Wcur*(Ymax-Ymin))/(Wold+Wcur)BLsys=(Wold*BLold+Wcur*Ymin)/(Wold+Wcur)
LS和BL的估算值送至線100,同時送至框102,并被當(dāng)作LSold和BLold存儲起來,以備用來計算下一個字符的LS和BL值。圖1中這些LS和BL估算值用于從筆劃分段器16送出的被采樣字符,它在字符匹配器18中和字符原型存儲器20中的原型字符進(jìn)行比較。
現(xiàn)在來看圖10,這是一個原型提取估算器的詳細(xì)框圖104。該估算器一般可聯(lián)系圖7來描述,并可能用作圖1所示的行距基線調(diào)整器17。組成一個字符的每個線段的X,Y點(diǎn)送至匹配器框106。后者同時從原型存儲器框108接收LS和BL。使用原型存儲器框108來的LSpro和BLpro值比較使用Ymin和Ymax值能提供更準(zhǔn)確的計算,因?yàn)榧偃缬嬎阋粋€小寫字母,字高并不等于行距。LS和BL的現(xiàn)行值可在框110中按照下列公式計算而得LSsys=(Wpro*LSpro+Wcur*LScur)/(Wpro+Wcur)BLsys=(Wpro*BLpro+Wcur*BLcur)/(Wpro+Wcur)LSpro和BLpro可從原型框108推導(dǎo)而得,而Wpro和Wcur是由實(shí)驗(yàn)確定的系統(tǒng)常數(shù)。LSpro和BLpro分別是在當(dāng)前采樣字符之前的前一個采樣字符匹配原型的行距值和基線值。Wpro和Wcur的典型值是初始化時在0-1.0的范圍內(nèi),非初始化時在0.3-0.7的范圍內(nèi)。當(dāng)前LS和BL的計算值送至線112,同時送至框110以備計算下一個LS和BL時使用。
現(xiàn)在看一下極值點(diǎn)聚類估算器的詳細(xì)框圖113(示于圖11),該估算器可聯(lián)系圖8來描述,可用作圖1所示行距基線調(diào)整器17。組成字符的每個線段的X,Y點(diǎn)和LS及BL的省缺值送到框114,正如以前聯(lián)系圖8所描述那樣,在該框內(nèi)計算出陣極值點(diǎn)聚類A,B,C和D。如果正如框116所表明那樣有4個聚合類,可使用A,B,C和D的計算值,并且在線118上的LS和BL可如下計算LS=D-BBL=B框120用于判斷是否聚合類數(shù)小于2。如果這樣,則如線122所示,使用LS和BL的省缺值。例如,當(dāng)只書寫一些特殊符號如句點(diǎn)和等號時,聚合類數(shù)即小于2。如聚合類數(shù)不小于2,則框124用于判斷是聚合類數(shù)是否等于2或3。如果這樣,框126將估算未找到的聚合類。
如果有2個聚合類,則把底部聚合類和舊基線進(jìn)行比較。如果底部聚合類的值比舊基線加上1/2舊行距還大,則把B設(shè)為底部聚合類。如果底部聚合類并不大于舊基線和舊行距的1/2的總和,則把B設(shè)為舊基線加上1/2舊行距的值。在上述兩種情況下,D都設(shè)為B和舊行距之和。
如果有3個聚合類,則把最靠近舊底線的聚合類選為新的臨時底線值T。如果該新臨時底線值T大于舊基線加1/3舊行距之和,則B設(shè)為0.9*(舊基線)+0.1*T。如T小于舊基線加1/3舊行距之和,則B設(shè)為0.5*(舊基線)*0.5*T。在上述兩種情況下,D都設(shè)為B加舊底線之和。
在每個例子中,D和B的值都在線128處用于按下列公式計算行程(LS)和基線(BL)LS=D-BBL=B現(xiàn)在看圖12,它是由原型提取估算器和極值點(diǎn)聚類估算器組成的詳細(xì)框圖126,可用作圖1所示行距基線調(diào)整器17。組成一個字符的每個線段的X,Y點(diǎn)送至框128,在那里計算Xmin,Xmax,Ymin和Ymax,計算所得最小/最大值送至原型提取估算器130和極值點(diǎn)聚類估算器132。原型提取估算器130也接收輸入量LSpro和BLpro,并按照圖10所敘述那樣,向框134提供LS1和BL1。極值點(diǎn)聚類估算器132也把LS和BL的省缺值作為輸入接收進(jìn)來,并按圖11所述那樣,向框134提供LS2和BL2。在框134內(nèi)一個字符的LSsys和BLsys可按下列公式計算而得LSsys=W1*LS1+W2*LS2/(W1+W2)BLsys=W1*BL1+W2*BL2/(W1+W2)W1和W2的典型值為初始化時取0-1.0的范圍,非初始化時取0.3-0.7的范圍。把LS和BL提供給線136。
上面提出的估算行距和基線的方法可以用于格式書寫,行式書寫和隨手書寫。
權(quán)利要求
1.在手寫體識別系統(tǒng)中一種調(diào)整行距和底線的方法,其中底線是供用戶在上面書寫不帶下垂筆劃的字符的自然線條,而行距是從底線往上的最大正距離,一個字符的所有各點(diǎn)部包括在該距離內(nèi),所述方法的特征包括以下各步對于每一個書寫在輸入面板上的字符采樣一串(X,Y)座標(biāo)對,這些座標(biāo)對對應(yīng)于指示筆在所述輸入面板座標(biāo)系統(tǒng)中的相對位置;對于書寫在所述輸入面板上的每個字符,計算該字符采樣值的Y點(diǎn)最小值和最大值;對一個字符按下式計算行距值(LS)LS = (Wold*LSold+ Wcur*(Ymax- Ymin))/(Wold+ Wcur)其中LSold是LS以前的計算值;Wold和Wcur是系統(tǒng)常數(shù)按下式計算字符的基線值(BL)BL = (Wold*BLold+ Wcur*(Ymax- Ymin))/(Wold+ Wcur)其中BLold是BL以前的計算值。
2.權(quán)利要求1所述方法,其特征在于初始化時Wold和Wcur各取0-1.0范圍內(nèi)的值和非初始化時各取0.3-0.7范圍內(nèi)的值。
3.手寫體識別系統(tǒng)中一種高速行距和底線的方法,其中底線是供用戶在上面書寫不帶下垂筆劃的字符的自然線條,而行距是從底線往上的最大正距離,一個字符的所有各點(diǎn)都包括在該距離內(nèi),所述方法的特征包括以下各步為每個這樣的字符存儲一套包括基線(BLpro)值和行距(LSpro)值的原型字符;對于每一個書寫在輸入面板上的字符采樣一串(X,Y)座標(biāo)對,這些座標(biāo)對對應(yīng)于指示筆在所述輸入面板座標(biāo)系統(tǒng)中的相對位置;為書寫在所述輸入面板上的每個字符提供采樣字符;根據(jù)采樣字符和存儲原型字符的比較結(jié)果,為被識別字符提供一個選為原型字符的被識別字符,使采樣字符與該原型字符最為匹配;分別用前一個采樣字符的匹配原型的BLpro和LSpro來調(diào)整下一個采樣字符的基線和行距。
4.權(quán)利要求3所述方法,其特征在于剛才采樣的字符的行距(LSsys)是LSsys= (Wpro* LSpro+ Wcur* LSnew)/(Wpro+ Wcur)而剛才采樣的字符的基線是BLsys= (Wpro* BLpro+ Wcur* BLnew)/(Wpro+ Wcur)其中LSnew和BLnew分別是以前計算的LSsys和BLsys值,而Wpro和Wcur是系統(tǒng)常數(shù)。
5.手寫體識別系統(tǒng)中一種調(diào)整行距和底線的方法,其中底線是供用戶在上面書寫不帶下垂筆劃的字符的自然線條,而行距是從底線片上的最大距離,一個字符的所有各點(diǎn)都包括在該距離內(nèi),所述方法的特征包括以下各步對于每一個書寫在輸入面板上的字符采樣一串(X,Y)座標(biāo)對,這些座標(biāo)對對應(yīng)于指示筆在所述輸入面板座標(biāo)系統(tǒng)中的相對位置;提供一個LS和BL的省缺值;存儲一行字符中每個字符的Ymin和Ymax數(shù);給出一行字符所存儲的Ymin和Ymax數(shù)的直方圖,以便確定一套4組數(shù),每一個這樣的組稱為聚合類;第一個聚合類象征字符的下垂筆劃底部,第二個聚合類象征底線,第三個聚合類象征小寫字母的頂部,第四個聚合類象征高的小寫字母的頂部或大寫字母或數(shù)字的頂部;根據(jù)直方圖的結(jié)果,確定所找到的聚合類數(shù);如果找到的聚合類數(shù)不到2,把LS和BL的省缺值分別用作該行中采樣字符的行距和基線值;如果2和3個聚合類中的1個被發(fā)現(xiàn)具有如下式計算的一行中采樣字符的行距和基線,則估算未找到的聚合類LS=第4聚合類-第2聚合類BL=第2聚合類;如4個聚合類都找到,分別按下式計算該行中采樣字符的行距和基線LS=第4聚合類-第2聚合類BL=第2聚合類。
6.手寫體識別系統(tǒng)中一種調(diào)整行距和底線的方法,其中底線是供用戶在上面書寫不帶下垂筆劃的字符的自然線條,而行距是從底線往上的最大正距離,一個字符的所有各點(diǎn)都包括在該距離內(nèi),所述方法的特征包括以下各步存儲一套原型字符,包括每個這樣字符的基線(BLpro)值和行距(Lpro)值;對于每一個書寫在輸入面板上的字符采樣一串(X,Y)座標(biāo)對,這些座標(biāo)對對應(yīng)于指示筆在所述輸入面板座標(biāo)系統(tǒng)中的相對位置;為書寫在所述輸入面板上的每個字符提供采樣字符;根據(jù)采樣字符和存儲原型字符的比較結(jié)果,為被識別字符提供一個選為原型字符的被識別字符,使采樣字符與該原型字符最為匹配;和提供一個按下式計算的剛才采樣字符的行距的第一個中間值(LS1)LS1= (Wpro* LSpro+ Wcur* LSnew)/(Wpro+ Wcur)提供一個按下式計算的剛才采樣字符的基線的第一個中間值BL1= (Wpro* BLpro+ Wcur* BLnew)/(Wpro+ Wcur)其中LSnew和BLnew分別是剛才計算的LSsys和BLsys值,而Wpro和Wcur是系統(tǒng)常數(shù)提供LS和BL的省缺值;存儲一行字符中每個字符的Ymin和Ymax數(shù);給出一行字符所存儲的Ymin和Ymax數(shù)的直方圖,以便確定一套4組數(shù),每一個這樣的組稱為聚合類;第一個聚合類象征字符的下垂筆劃底部,第二個聚合類象征底線,第三個聚合類象征小寫字母的頂部,第四個聚合類象征高的小寫字母的頂部或大寫字母或數(shù)字的頂部;根據(jù)直方圖的結(jié)果,確定所找到的聚合類數(shù);如果找到的聚合類數(shù)不到2,把LS和BL的省缺值分別用作該行中采樣字符的行距和基線的第二中間值LS2和BL2;如果2個和3個聚合類中的1個被發(fā)現(xiàn)具有如下式計算的該行中采樣字符的行距和基線的第二中間值,則估算未找到的聚合類LS2=第4聚合類-第2聚合類,BL2=第2聚合類;如4個聚合類都找到,分別按下式計算該行中采樣字符的行距和基線的第二中間值LS2=第4聚合類-第2聚合類,BL2=第2聚合類;按下式計算采樣字符的行距值(LSsys)LSsys= (W1* LS1+ W2* LS2)/(W1+ W2)按下式計算采樣字符的底線值BLsysBLsys= (W1* BL1+ W2* BL2)/(W1+ W2)其中W1和W2是系統(tǒng)常數(shù)。
7.權(quán)利要求6所述方法,其特征在于W1和W2在初始化時的取值范圍為0-1.0,非初始化時的取值范圍為0.3-0.7。
全文摘要
通過把數(shù)字化儀檢測到的手寫體的笛卡爾座標(biāo)加以規(guī)格化,使之和原型字符空間相符合,一種手寫體識別系統(tǒng)中的行距基線調(diào)整器能改善識別準(zhǔn)確度。規(guī)格化技術(shù)包括加權(quán)平均估算法,原型提取估算法,極值點(diǎn)聚類估算法以及原型提取估算法和極值點(diǎn)聚類估算法的結(jié)合。
文檔編號G06K9/62GK1099500SQ9410213
公開日1995年3月1日 申請日期1994年2月21日 優(yōu)先權(quán)日1993年3月4日
發(fā)明者威克爾·S·布魯夫, 喬恩基·金, 唐納德·B·馬特森, 威廉·D·莫德林 申請人:國際商業(yè)機(jī)器公司