專利名稱:一種基于字型分類的手寫字體庫生成方法
技術(shù)領(lǐng)域:
本發(fā)明融合了已經(jīng)存在的字型分類,數(shù)字字體庫以及加密技術(shù),屬于模式識別 技術(shù)的推廣應(yīng)用技術(shù)領(lǐng)域,具體為一種基于字型分類的手寫字體庫生成方法。
背景技術(shù):
隨著計算機技術(shù)的發(fā)展,數(shù)字文檔逐漸代替了紙質(zhì)文檔。目前傳統(tǒng)字體庫已經(jīng)被 使用者在商業(yè)文檔、私人書信中廣泛使用。選擇使用切合場合的字體是文檔書寫者必須要 注意的問題。但是傳統(tǒng)字庫存在如下的缺陷字體庫單一,無法體現(xiàn)文檔書寫者的個性。在 需要文檔書寫者手寫體的場合就需要借助復(fù)印,掃描等技術(shù)。
發(fā)明內(nèi)容
本發(fā)明針對傳統(tǒng)字體庫的缺陷,提供了一種基于字型分類的手寫字體庫生成的方 法,該方法生成與使用者手寫字體相應(yīng)的加密數(shù)字字體庫,字體庫多樣化,能夠體現(xiàn)文檔書 寫者的個性。一種基于字型分類的手寫字體庫生成方法,其技術(shù)方案是這樣的
其特征在于其包括獲取手寫字體圖像模塊、獲取漢字結(jié)構(gòu)單位模塊、數(shù)字字體庫生成 模塊、字體庫加密模塊;獲取漢字結(jié)構(gòu)單位模塊使用公知的字型分類技術(shù),采集到的指定用 戶的手寫字體圖像,獲取該用戶的字體結(jié)構(gòu)單位數(shù)據(jù)庫,通過數(shù)字字體庫生成模塊自動生 成對應(yīng)于此對象的手寫字體庫,然后通過字體庫加密模塊對于相應(yīng)用戶的字體庫加密,以 確保字體庫只能為對應(yīng)用戶使用。其進一步特征在于其包括以下步驟
步驟1 在獲取手寫字體圖像模塊1中,從數(shù)據(jù)源獲取字體圖像,手寫字圖像的數(shù)據(jù)源 可以是掃描的手寫字體圖像,也可以是手寫板獲得的實時圖像,采樣圖像數(shù)據(jù)的規(guī)模越大 獲取的字體庫與用戶的手寫字的相似程度就越高;
步驟2 在獲取漢字結(jié)構(gòu)單位模塊2中,采用字型分類技術(shù),獲取漢字結(jié)構(gòu)單位,該步驟 的具體實現(xiàn)可以分為如下三個子步驟
漢字預(yù)切分,初步獲取圖像中的漢字信息模塊; 根據(jù)漢字字型結(jié)構(gòu)分解漢字模塊; 建立漢字結(jié)構(gòu)單位數(shù)據(jù)庫模塊;
步驟3 在數(shù)字字體庫生成模塊3中,生成手寫字字體庫;
步驟4 在字體庫加密模塊4中,對與生成的手寫字體庫使用公知的ECC橢圓曲線加密 算法進行加密。對于相應(yīng)用戶的字體庫加密,以確保字體庫只能為對應(yīng)用戶使用。在文檔書寫的過程中,使用書寫者的手寫字體庫,體現(xiàn)了文檔書寫者的專業(yè)素養(yǎng), 提高了文檔書寫者的工作效率。由于數(shù)據(jù)源信息豐富,用戶手寫字體信息可以在數(shù)據(jù)庫中 有多份數(shù)據(jù),提高了字體庫與用戶手寫字之間的相似度。對用戶的數(shù)字字體庫加密,保證了用戶的相應(yīng)權(quán)利。該方法可以使用在商業(yè)文案,私人信件,甚至數(shù)字簽字等方面,具有很高 的經(jīng)濟效益和社會效應(yīng)。
圖1是本發(fā)明的工作流程圖2是本發(fā)明中字型層次分類編碼示例。
具體實施例方式
本發(fā)明包括獲取手寫字體圖像模塊1、獲取漢字結(jié)構(gòu)單位模塊2、數(shù)字字體庫生成模塊 3、字體庫加密模塊4 ;獲取漢字結(jié)構(gòu)單位模塊2使用公知的字型分類技術(shù),采集到的指定 用戶的手寫字體圖像,獲取該用戶的字體結(jié)構(gòu)單位數(shù)據(jù)庫,通過數(shù)字字體庫生成模塊3自 動生成對應(yīng)于此對象的手寫字體庫,然后通過字體庫加密模塊4對于相應(yīng)用戶的字體庫加 密,以確保字體庫只能為對應(yīng)用戶使用。本發(fā)明的技術(shù)方案使用了如下幾個關(guān)鍵步驟
圖1中,獲取漢字結(jié)構(gòu)單位模塊2,主要使用0RC (光學(xué)字符識別)方法對于采樣所得圖 像信息獲得筆畫特征信息,模塊6初步獲取漢字信息,根據(jù)漢字字形結(jié)構(gòu)分解漢字,建立漢 字筆結(jié)構(gòu)單位數(shù)據(jù)庫;
漢字的整體性和可分解性是漢字識別中的兩個重要影響因素。人類對于漢字的認(rèn) 識機制是由整體,分層次結(jié)構(gòu)和筆畫多種途徑符合得到的。在東方文字中,相鄰的字符粘連 的可能性比較小,所以在模塊201使用圖像預(yù)處理技術(shù),首先將數(shù)據(jù)源中獲取的圖片處理 為灰度圖像,在對原灰度圖像做邊緣灰度增強;然后根據(jù)垂直方向的投影黑像素統(tǒng)計直方 圖,設(shè)定截取漢字的個體字符圖像。獲得對于用戶的漢字手寫字符個體的認(rèn)識作為生成字 體結(jié)構(gòu)單位數(shù)據(jù)庫的基礎(chǔ)。漢字字型結(jié)構(gòu)分解漢字模塊7是對用戶漢字手寫字符的字型劃分,獲取字體結(jié)構(gòu) 單位。字型劃分是指一個漢字中彼此有一定間隔的幾個部件之間的相互位置關(guān)系。組成漢 字的部件有一定的拓?fù)潢P(guān)系,通過一定的研究得到GB2312-80漢字存在獨字,左右型,上下 型,左中右,上中下等字形結(jié)構(gòu)。在本方法中,按照漢字的層次結(jié)構(gòu)對漢字字型進行了完整 分類,層次順序用數(shù)字編碼。舉左右型示例如圖2所示。最終將GB2312-80的漢字劃分為 30種。在對用戶手寫字符字型劃分中,基于如上的字型劃分理論,使用投影法對于圖像區(qū)域 進行X軸,Y軸方向上的投影黑像素的統(tǒng)計直方圖,通過垂直投影將相互分開的部件分離, 一旦部件粘連或者重疊,垂直投影圖常常在最佳分割點上位投影值的谷值。在此設(shè)定閾值, 從而得到可能的分割位置,最終結(jié)合連通域設(shè)定確切的分割點。此時得到被認(rèn)為是在本方 法中的構(gòu)成漢字的最小結(jié)構(gòu)單位。這些部件有單筆(如一,乙等)和多筆之分(如交叉,交聯(lián), 分離等)。在漢字結(jié)構(gòu)單位數(shù)據(jù)庫模塊5將結(jié)構(gòu)單位圖像歸一化以后存儲成為該用戶的基 本手寫結(jié)構(gòu)數(shù)據(jù)庫,該數(shù)據(jù)庫中應(yīng)該包含獨字,以及獨字作為偏旁的多種數(shù)據(jù)。并且該數(shù)據(jù) 庫可以根據(jù)用戶手寫字體數(shù)據(jù)源的更新實時更新。數(shù)字字體庫生成模塊3是使用得到的用戶基本手寫結(jié)構(gòu)數(shù)據(jù)庫中的漢字結(jié)構(gòu)單 位并接GB2312-80漢字庫中的所有漢字,生成字體庫。在使用結(jié)構(gòu)單位拼接漢字的過程中 使用分級拼接的方法。一級并接若字體是獨字,則調(diào)用數(shù)據(jù)庫中的獨字信息;二級并接 若字體是左右型或是上下型,調(diào)用結(jié)構(gòu)數(shù)據(jù)庫中的偏旁信息。等等。這里使用上文中提到的字形劃分的編碼方法,示例如圖2所示。字體庫加密模塊4對于字體庫使用ECC橢圓曲線加密算法加密后交付用戶使用。 在文檔書寫的過程中,使用書寫者的手寫字體庫,體現(xiàn)了文檔書寫者的專業(yè)素養(yǎng),提高了文 檔書寫者的工作效率。由于數(shù)據(jù)源信息豐富,用戶手寫字體信息可以在數(shù)據(jù)庫中有多份數(shù) 據(jù),提高了字體庫與用戶手寫字之間的相似度。對用戶的數(shù)字字體庫加密,保證了用戶的相 應(yīng)權(quán)利。該方法可以使用在商業(yè)文案,私人信件,甚至數(shù)字簽字等方面,具有很高的經(jīng)濟效 益和社會效應(yīng)。本發(fā)明手寫字體庫具體生成步驟如下
步驟1 在獲取手寫字體圖像模塊1中,從數(shù)據(jù)源獲取字體圖像,手寫字圖像的數(shù)據(jù)源 可以是掃描的手寫字體圖像,也可以是手寫板獲得的實時圖像,采樣圖像數(shù)據(jù)的規(guī)模越大 獲取的字體庫與用戶的手寫字的相似程度就越高;
步驟2 在獲取漢字結(jié)構(gòu)單位模塊2中,采用字型分類技術(shù),獲取漢字結(jié)構(gòu)單位,該步驟 的具體實現(xiàn)可以分為如下三個子步驟
漢字預(yù)切分,初步獲取圖像中的漢字信息模塊6 ; 根據(jù)漢字字型結(jié)構(gòu)分解漢字模塊7 ; 建立漢字結(jié)構(gòu)單位數(shù)據(jù)庫模塊5 ; 步驟3 在數(shù)字字體庫生成模塊3中,生成手寫字字體庫;
步驟4 在字體庫加密模塊4中,對與生成的手寫字體庫使用公知的ECC橢圓曲線加密 算法進行加密。對于相應(yīng)用戶的字體庫加密,以確保字體庫只能為對應(yīng)用戶使用。
權(quán)利要求
一種基于字型分類的手寫字體庫生成方法,其特征在于其包括獲取手寫字體圖像模塊、獲取漢字結(jié)構(gòu)單位模塊、數(shù)字字體庫生成模塊、字體庫加密模塊;獲取漢字結(jié)構(gòu)單位模塊使用公知的字型分類技術(shù),采集到的指定用戶的手寫字體圖像,獲取該用戶的字體結(jié)構(gòu)單位數(shù)據(jù)庫,通過數(shù)字字體庫生成模塊自動生成對應(yīng)于此對象的手寫字體庫,然后通過字體庫加密模塊對于相應(yīng)用戶的字體庫加密,以確保字體庫只能為對應(yīng)用戶使用。
2.根據(jù)權(quán)利要求1所述的一種基于字型分類的手寫字體庫生成方法,其特征在于其包括以下步驟步驟1 在獲取手寫字體圖像模塊1中,從數(shù)據(jù)源獲取字體圖像,手寫字圖像的數(shù)據(jù)源 可以是掃描的手寫字體圖像,也可以是手寫板獲得的實時圖像,采樣圖像數(shù)據(jù)的規(guī)模越大 獲取的字體庫與用戶的手寫字的相似程度就越高;步驟2 在獲取漢字結(jié)構(gòu)單位模塊2中,采用字型分類技術(shù),獲取漢字結(jié)構(gòu)單位,該步驟 的具體實現(xiàn)可以分為如下三個子步驟漢字預(yù)切分,初步獲取圖像中的漢字信息模塊; 根據(jù)漢字字型結(jié)構(gòu)分解漢字模塊; 建立漢字結(jié)構(gòu)單位數(shù)據(jù)庫模塊;步驟3 在數(shù)字字體庫生成模塊3中,生成手寫字字體庫;步驟4 在字體庫加密模塊4中,對與生成的手寫字體庫使用公知的ECC橢圓曲線加密 算法進行加密。
全文摘要
本發(fā)明提供了一種基于字型分類的手寫字體庫生成的方法,該方法生成與使用者手寫字體相應(yīng)的加密數(shù)字字體庫,字體庫多樣化,能夠體現(xiàn)文檔書寫者的個性。其技術(shù)方案是這樣的其特征在于其包括獲取手寫字體圖像模塊、獲取漢字結(jié)構(gòu)單位模塊、數(shù)字字體庫生成模塊、字體庫加密模塊;獲取漢字結(jié)構(gòu)單位模塊使用公知的字型分類技術(shù),采集到的指定用戶的手寫字體圖像,獲取該用戶的字體結(jié)構(gòu)單位數(shù)據(jù)庫,通過數(shù)字字體庫生成模塊自動生成對應(yīng)于此對象的手寫字體庫,然后通過字體庫加密模塊對于相應(yīng)用戶的字體庫加密,以確保字體庫只能為對應(yīng)用戶使用。
文檔編號G06F21/00GK101853313SQ20101021493
公開日2010年10月6日 申請日期2010年7月1日 優(yōu)先權(quán)日2010年7月1日
發(fā)明者袁存鼎, 馬勇 申請人:無錫駿聿科技有限公司