欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種文字識別的方法及其系統(tǒng)的制作方法

文檔序號:6556375閱讀:195來源:國知局
專利名稱:一種文字識別的方法及其系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種文字識別技術(shù),尤其是一種利用手寫輸入字符的輪廓點(diǎn)特征值獲取其形狀特征進(jìn)行文字識別的方法及其系統(tǒng)。
背景技術(shù)
目前,掌上型電子產(chǎn)品如手機(jī)、個人數(shù)字助理機(jī)(Personal DigitalAssistant,PDA)等幾乎都具備手寫輸入字符并識別的功能。一般而言文字運(yùn)算特征由輸入設(shè)備獲取,運(yùn)算特征可以是采樣數(shù)據(jù)中的任何有用的結(jié)構(gòu)特征信息或者其組合,其中基本結(jié)構(gòu)特征包含特征點(diǎn)、筆段及筆劃等單元結(jié)構(gòu)特征。但具體的辨識特征并不局限于以上基本結(jié)構(gòu)特征信息,而是常以組合方式來建立一組合適的辨識特征,進(jìn)而可以最大限度地描述文字的多種特征信息,同時盡量保持比較少的特征信息數(shù)量。確認(rèn)特征信息后,即可建立與特征信息相比對的一整套包括濾波、分割、辨識與參照模板數(shù)據(jù)庫的辨識系統(tǒng)。
目前存在的多種文字辨識系統(tǒng)各具特點(diǎn),其特征獲取方式多種多樣,一般的獲取特征包括距離、角度、中點(diǎn)、拐點(diǎn)、交點(diǎn)、投影、斜率以及面積等。為了能夠具備更好的辨識效果,往往將這些特征進(jìn)行組合使用。通常手寫輸入字符辨識系統(tǒng)最常用的特征組合為距離和角度,采用該組合的辨識系統(tǒng)存在以下缺點(diǎn)1、角度特征定義為文字的每一個筆段與輸入設(shè)備(比如手寫板)坐標(biāo)系的直角坐標(biāo)或其它坐標(biāo)系的夾角,即辨識系統(tǒng)必須依托于手寫輸入設(shè)備的坐標(biāo)系,不可避免在使用時會受到輸入設(shè)備的影響,導(dǎo)致該手寫輸入字符辨識系統(tǒng)穩(wěn)定性差。
2、作為特征的筆段需要筆段間的參照點(diǎn),即決定筆段的端點(diǎn)和筆段的交點(diǎn),參照點(diǎn)的存在也會引入誤差。因此,該手寫輸入字符辨識系統(tǒng)會由于輸入設(shè)備和人為因素的影響而產(chǎn)生辨識誤差。

發(fā)明內(nèi)容
本發(fā)明為解決背景技術(shù)中存在的上述技術(shù)問題,而提供一種穩(wěn)定性好、識別準(zhǔn)確的利用手寫輸入字符進(jìn)行文字識別的方法及其系統(tǒng)。
本發(fā)明的技術(shù)解決方案是本發(fā)明為一種文字識別的方法,其特殊之處在于該方法包括以下步驟1)預(yù)建一字符模板數(shù)據(jù)庫,模板數(shù)據(jù)庫中儲存有復(fù)數(shù)個字符模板數(shù)據(jù);2)對手寫輸入字符進(jìn)行預(yù)處理;3)根據(jù)手寫輸入字符的輪廓點(diǎn)特征值獲取形狀特征信息;4)根據(jù)獲取的形狀特征信息從字符模板數(shù)據(jù)庫中篩選出與手寫輸入字符的輪廓相近的字符模板;5)比對字符模板和手寫輸入字符的其它特征信息,對手寫輸入字符進(jìn)行辨識。
上述步驟2)中對手寫輸入字符進(jìn)行預(yù)處理包括對手寫輸入字符的誤差噪聲過濾、濾波處理及規(guī)范化處理。
上述步驟3)中的具體步驟如下3.1)分別在手寫輸入字符的水平方向及垂直方向查找一極值坐標(biāo)點(diǎn),并根據(jù)極值坐標(biāo)點(diǎn)連接成一字符邊框;3.2)將手寫輸入字符連同字符邊框縮放至字符模板的固定大小,進(jìn)而得到手寫輸入字符的縮放字符,其中縮放字符的坐標(biāo)大小與字符模板的坐標(biāo)大小相同;3.3)紀(jì)錄縮放字符的輪廓的所有坐標(biāo)點(diǎn);3.4)沿水平和垂直方向等距建立復(fù)數(shù)條基準(zhǔn)線,以對縮放字符的輪廓進(jìn)行切割;3.5)紀(jì)錄基準(zhǔn)線與縮放字符輪廓交點(diǎn)的特征值,得到手寫輸入字符的形狀特征信息。
上述步驟3.5)中所述基準(zhǔn)線與縮放字符輪廓交點(diǎn)的特征值為從水平垂直的四個方向用八條基準(zhǔn)線切割手寫輸入字符后的交點(diǎn)坐標(biāo),其中沿水平方向切割時,特征值為具有一交點(diǎn)的所述基準(zhǔn)線Y坐標(biāo)之和與所述交點(diǎn)總數(shù)的加權(quán)平均值;沿該垂直方向切割時,特征值為具有一交點(diǎn)的所述基準(zhǔn)線X坐標(biāo)之和與所述交點(diǎn)總數(shù)的加權(quán)平均值。
上述步驟5)中的具體步驟如下5.1)對獲取的手寫輸入字符包括角度和/或長度在內(nèi)的其它特征信息進(jìn)行計(jì)算;5.2)然后比對手寫輸入字符和篩選出的字符模板的其他特征信息,然后進(jìn)行辨識,并將辨識結(jié)果計(jì)算輸出。
一種應(yīng)用上述的文字識別的方法的系統(tǒng),其特殊之處在于該系統(tǒng)包括用來對手寫輸入字符進(jìn)行誤差噪聲過濾、濾波處理及規(guī)范化的預(yù)處理操作的預(yù)處理模塊、借助手寫輸入字符的輪廓點(diǎn)特征值獲取形狀特征信息,并篩選出與手寫輸入字符輪廓相近的字符模板的輪廓識別模塊和計(jì)算及執(zhí)行字符模板與手寫輸入字符的其它特征信息比對的特征計(jì)算模塊和儲存有復(fù)數(shù)個字符模板數(shù)據(jù)的模板數(shù)據(jù)庫,預(yù)處理模塊和模板數(shù)據(jù)庫分別接入輪廓識別模塊,輪廓識別模塊接入特征計(jì)算模塊。
上述預(yù)處理模塊外接有輸入裝置。
上述特征計(jì)算模塊外接有顯示裝置。
上述特征計(jì)算模塊外接有存儲裝置。
本發(fā)明利用手寫輸入字符的形狀特征作為辨識獲取特征,與字符結(jié)構(gòu)、筆劃及輸入坐標(biāo)系無關(guān),由于文字輪廓特征較為固定,用戶的輸入誤差幾乎可以忽略,也不會引入?yún)⒄拯c(diǎn)誤差。并且利用手寫輸入字符輪廓特征引入比對特征值作為模板的篩選,提高了模板比對的命中率和辨識速度。此外,采樣字符在輸入屏中的整個輪廓特征與其它特征比對方式相結(jié)合,減少系統(tǒng)誤差的產(chǎn)生,提供更好的比對機(jī)制,進(jìn)而可取得更好的辨識效果。


圖1為本發(fā)明的系統(tǒng)框圖;圖2-5為本發(fā)明實(shí)施例的示意圖。
具體實(shí)施例方式
本發(fā)明的方法的具體流程如下
1)預(yù)建一字符模板數(shù)據(jù)庫,模板數(shù)據(jù)庫中儲存有復(fù)數(shù)個字符模板數(shù)據(jù);2)對手寫輸入字符進(jìn)行預(yù)處理;3)根據(jù)手寫輸入字符的輪廓點(diǎn)特征值獲取形狀特征信息;3.1)分別在手寫輸入字符的水平方向及垂直方向查找一極值坐標(biāo)點(diǎn),并根據(jù)極值坐標(biāo)點(diǎn)連接成一字符邊框;3.2)將手寫輸入字符連同字符邊框縮放至字符模板的固定大小,進(jìn)而得到手寫輸入字符的縮放字符,其中縮放字符的坐標(biāo)大小與字符模板的坐標(biāo)大小相同;3.3)紀(jì)錄縮放字符的輪廓的所有坐標(biāo)點(diǎn);3.4)沿水平和垂直方向等距建立復(fù)數(shù)條基準(zhǔn)線,以對縮放字符的輪廓進(jìn)行切割;3.5)紀(jì)錄基準(zhǔn)線與縮放字符輪廓交點(diǎn)的特征值,得到手寫輸入字符的形狀特征信息。
4)根據(jù)獲取的形狀特征信息從字符模板數(shù)據(jù)庫中篩選出與手寫輸入字符的輪廓相近的字符模板;5)比對字符模板和手寫輸入字符的其它特征信息,對手寫輸入字符進(jìn)行辨識。
5.1)對獲取的手寫輸入字符包括角度和/或長度在內(nèi)的其它特征信息進(jìn)行計(jì)算;5.2)然后比對手寫輸入字符和篩選出的字符模板的其他特征信息,然后進(jìn)行辨識,并將辨識結(jié)果計(jì)算輸出。
其中步驟2)中對手寫輸入字符進(jìn)行預(yù)處理包括對手寫輸入字符的誤差噪聲過濾、濾波處理及規(guī)范化處理,噪聲(noise)也稱為雜點(diǎn)、噪音,主要是指影像所產(chǎn)生的粗糙部分,也指影像中不該出現(xiàn)的外來像素,噪聲對重建的影像有嚴(yán)重的影響,因此,在對手寫輸入字符進(jìn)行識別之前需對其做相應(yīng)的過濾處理,以除去噪聲。
步驟3.5)中所述基準(zhǔn)線與縮放字符輪廓交點(diǎn)的特征值為從水平垂直的四個方向用八條基準(zhǔn)線切割手寫輸入字符后的交點(diǎn)坐標(biāo),其中沿水平方向切割時,特征值為具有一交點(diǎn)的所述基準(zhǔn)線Y坐標(biāo)之和與所述交點(diǎn)總數(shù)的加權(quán)平均值;沿該垂直方向切割時,特征值為具有一交點(diǎn)的所述基準(zhǔn)線X坐標(biāo)之和與所述交點(diǎn)總數(shù)的加權(quán)平均值。
參見圖1,本發(fā)明的系統(tǒng)10包括預(yù)處理模塊14、輪廓識別模塊16以及特征計(jì)算模塊18,使用者通過在輸入裝置12的手寫板上書寫文字得到手寫輸入字符,然后輸入裝置12把手寫板上的所有手寫輸入字符信息采樣后經(jīng)由串行或并行接口送入預(yù)處理模塊14中。預(yù)處理模塊14對手寫輸入字符進(jìn)行包括誤差噪聲過濾、濾波處理及規(guī)范化之預(yù)處理操作,進(jìn)而將字符影像中不該出現(xiàn)的噪聲去除掉。然后,經(jīng)由預(yù)處理后的手寫輸入字符進(jìn)入輪廓識別模塊16中,輪廓識別模塊16藉由輪廓點(diǎn)特征值對其形狀特征進(jìn)行獲取,進(jìn)而得到關(guān)于手寫輸入字符的形狀特征信息。這里輪廓識別模塊16在執(zhí)行手寫輸入字符形狀特征獲取時,首先分別在手寫輸入字符的水平方向及垂直方向查找一極值坐標(biāo)點(diǎn),并藉由極值坐標(biāo)點(diǎn)連接成一字符邊框,然后將手寫輸入字符連同字符邊框縮放至字符模板的固定大小,進(jìn)而得到手寫輸入字符的縮放字符。并且紀(jì)錄縮放字符的輪廓的所有坐標(biāo)點(diǎn),然后沿水平和垂直方向等距建立復(fù)數(shù)條基準(zhǔn)線,以對縮放字符的輪廓進(jìn)行切割,最后紀(jì)錄基準(zhǔn)線與縮放字符輪廓交點(diǎn)的特征值,得到手寫輸入字符的形狀特征信息。此外,文字識別系統(tǒng)10還包括模板數(shù)據(jù)庫20,模板數(shù)據(jù)庫20中儲存復(fù)數(shù)個模板數(shù)據(jù),輪廓識別模塊16將獲取的手寫輸入字符形狀特征與模板數(shù)據(jù)庫20中的模板數(shù)據(jù)進(jìn)行比對,以篩選出與手寫輸入字符輪廓相近的字符模板。特征計(jì)算模塊18對包括角度和/或長度的其它特征信息進(jìn)行計(jì)算,并執(zhí)行上述篩選字符模板與所述角度和/或長度特征信息的比對,進(jìn)而對手寫輸入字符進(jìn)行辨識,得到最終辨識結(jié)果??蓪⒈孀R結(jié)果保存到存儲裝置24中,或者通過顯示裝置22顯示手寫輸入字符的辨識結(jié)果。通過藉由手寫輸入字符輪廓特征引入比對特征值作為模板的篩選,提高了模板比對的命中率和辨識速度。
參見下面結(jié)合圖2-5舉例說明本發(fā)明的手寫輸入字符特征獲取方法。如圖所示,首先分別在手寫輸入字符的水平方向及垂直方向查找一極值坐標(biāo)點(diǎn),依據(jù)手寫輸入字符上方、下方、左方及右方四個水平、垂直方向得到四個極值坐標(biāo)點(diǎn),藉由上述四個極值坐標(biāo)點(diǎn)連接成一矩形字符邊框,當(dāng)然也可能為正方形,具體形狀根據(jù)手寫輸入字符的輪廓結(jié)構(gòu)特征而定,然后將手寫輸入字符連同字符邊框縮放至字符模板的固定大小,進(jìn)而得到手寫輸入字符的縮放字符,其中縮放字符坐標(biāo)大小與字符模板的坐標(biāo)大小相同,字符模板來自儲存復(fù)數(shù)個模板數(shù)據(jù)的模板數(shù)據(jù)庫中,其大小為確定且固定的??s放后的字符邊框26大小及形狀如圖5所示。接著對縮放字符的輪廓的所有坐標(biāo)點(diǎn)進(jìn)行紀(jì)錄。沿水平和垂直方向四個方向等距依次建立復(fù)數(shù)條基準(zhǔn)線28,以對縮放字符的輪廓進(jìn)行切割,基準(zhǔn)線28的個數(shù)依據(jù)手寫輸入字符的輪廓復(fù)雜程度決定,輪廓越復(fù)雜的基準(zhǔn)線的個數(shù)越多,這里所舉例的泰文字體較為簡單,所以可以選擇八條基準(zhǔn)線對手寫輸入字符進(jìn)行切割。紀(jì)錄所述基準(zhǔn)線與縮放字符輪廓交點(diǎn)的特征值,即從水平垂直的四個方向用八條基準(zhǔn)線切割手寫輸入字符后的交點(diǎn)坐標(biāo),其中沿水平方向切割時,特征值為具有一交點(diǎn)的所述基準(zhǔn)線Y坐標(biāo)之和與所述交點(diǎn)總數(shù)的加權(quán)平均值;沿該垂直方向切割時,特征值為具有一交點(diǎn)的所述線條X坐標(biāo)之和與所述交點(diǎn)總數(shù)的加權(quán)平均值,進(jìn)而得到手寫輸入字符之形狀特征信息。由圖5可以看出,本發(fā)明的方法與手寫輸入字符的筆劃、筆段無關(guān),只與手寫輸入字符的形狀結(jié)構(gòu)和各部分的位置有關(guān),因此能有效地避免筆劃引起的誤差,進(jìn)而提高手寫輸入字符的辨識精度。
權(quán)利要求
1.一種文字識別的方法,其特征在于該方法包括以下步驟1)預(yù)建一字符模板數(shù)據(jù)庫,模板數(shù)據(jù)庫中儲存有復(fù)數(shù)個字符模板數(shù)據(jù);2)對手寫輸入字符進(jìn)行預(yù)處理;3)根據(jù)手寫輸入字符的輪廓點(diǎn)特征值獲取形狀特征信息;4)根據(jù)獲取的形狀特征信息從字符模板數(shù)據(jù)庫中篩選出與手寫輸入字符的輪廓相近的字符模板;5)比對字符模板和手寫輸入字符的其它特征信息,對手寫輸入字符進(jìn)行辨識。
2.根據(jù)權(quán)利要求1所述的文字識別的方法,其特征在于所述步驟2)中對手寫輸入字符進(jìn)行預(yù)處理包括對手寫輸入字符的誤差噪聲過濾、濾波處理及規(guī)范化處理。
3.根據(jù)權(quán)利要求1所述的文字識別的方法,其特征在于所述步驟3)中的具體步驟如下3.1)分別在手寫輸入字符的水平方向及垂直方向查找一極值坐標(biāo)點(diǎn),并根據(jù)極值坐標(biāo)點(diǎn)連接成一字符邊框;3.2)將手寫輸入字符連同字符邊框縮放至字符模板的固定大小,進(jìn)而得到手寫輸入字符的縮放字符,其中縮放字符的坐標(biāo)大小與字符模板的坐標(biāo)大小相同;3.3)紀(jì)錄縮放字符的輪廓的所有坐標(biāo)點(diǎn);3.4)沿水平和垂直方向等距建立復(fù)數(shù)條基準(zhǔn)線,以對縮放字符的輪廓進(jìn)行切割;3.5)紀(jì)錄基準(zhǔn)線與縮放字符輪廓交點(diǎn)的特征值,得到手寫輸入字符的形狀特征信息。
4.根據(jù)權(quán)利要求3所述的文字識別的方法,其特征在于所述步驟3.5)中所述基準(zhǔn)線與縮放字符輪廓交點(diǎn)的特征值為從水平垂直的四個方向用八條基準(zhǔn)線切割手寫輸入字符后的交點(diǎn)坐標(biāo),其中沿水平方向切割時,特征值為具有一交點(diǎn)的所述基準(zhǔn)線Y坐標(biāo)之和與所述交點(diǎn)總數(shù)的加權(quán)平均值;沿該垂直方向切割時,特征值為具有一交點(diǎn)的所述基準(zhǔn)線X坐標(biāo)之和與所述交點(diǎn)總數(shù)的加權(quán)平均值。
5.根據(jù)權(quán)利要求1所述的文字識別的方法,其特征在于所述步驟5)中的具體步驟如下5.1)對獲取的手寫輸入字符包括角度和/或長度在內(nèi)的其它特征信息進(jìn)行計(jì)算;5.2)然后比對手寫輸入字符和篩選出的字符模板的其他特征信息,然后進(jìn)行辨識,并將辨識結(jié)果計(jì)算輸出。
6.一種應(yīng)用權(quán)利要求1所述的文字識別方法的系統(tǒng),其特征在于該系統(tǒng)包括用來對手寫輸入字符進(jìn)行誤差噪聲過濾、濾波處理及規(guī)范化的預(yù)處理操作的預(yù)處理模塊、借助手寫輸入字符的輪廓點(diǎn)特征值獲取形狀特征信息,并篩選出與手寫輸入字符輪廓相近的字符模板的輪廓識別模塊和計(jì)算及執(zhí)行字符模板與手寫輸入字符的其它特征信息比對的特征計(jì)算模塊和儲存有復(fù)數(shù)個字符模板數(shù)據(jù)的模板數(shù)據(jù)庫,所述預(yù)處理模塊和模板數(shù)據(jù)庫分別接入輪廓識別模塊,所述輪廓識別模塊接入特征計(jì)算模塊。
7.根據(jù)權(quán)利要求6所述的文字識別系統(tǒng),其特征在于所述預(yù)處理模塊外接有輸入裝置。
8.根據(jù)權(quán)利要求6所述的文字識別系統(tǒng),其特征在于所述特征計(jì)算模塊外接有顯示裝置。
9.根據(jù)權(quán)利要求6所述的文字識別系統(tǒng),其特征在于所述特征計(jì)算模塊外接有存儲裝置。
全文摘要
本發(fā)明涉及一種文字識別技術(shù),尤其是一種利用手寫輸入字符的輪廓點(diǎn)特征值獲取其形狀特征進(jìn)行文字識別的方法及其系統(tǒng)。本發(fā)明包括以下步驟1)預(yù)建一字符模板數(shù)據(jù)庫,其中儲存有復(fù)數(shù)個字符模板數(shù)據(jù);2)對手寫輸入字符進(jìn)行預(yù)處理;3)根據(jù)輪廓點(diǎn)特征值獲取形狀特征信息;4)篩選出與手寫輸入字符的輪廓相近的字符模板;5)比對其它特征信息,對手寫輸入字符進(jìn)行辨識。其解決了普通技術(shù)中存在穩(wěn)定性差、識別不準(zhǔn)確的問題,可廣泛應(yīng)用于掌上型電子產(chǎn)品中。
文檔編號G06K9/20GK1851730SQ20061004287
公開日2006年10月25日 申請日期2006年5月25日 優(yōu)先權(quán)日2006年5月25日
發(fā)明者陳淮琰, 公學(xué)雷, 趙永國 申請人:無敵科技(西安)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
大邑县| 宣汉县| 名山县| 滁州市| 鸡西市| 台南市| 玛纳斯县| 右玉县| 酒泉市| 阿合奇县| 慈溪市| 根河市| 丹东市| 巨鹿县| 宜兰县| 焦作市| 石林| 太原市| 当雄县| 巴林右旗| 衡阳县| 普格县| 葫芦岛市| 包头市| 濮阳市| 搜索| 凤山市| 石首市| 开平市| 枣庄市| 邯郸市| 嘉荫县| 得荣县| 双鸭山市| 炉霍县| 潢川县| 广宁县| 三门峡市| 天全县| 清新县| 银川市|