欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種錯字字形編輯、編碼和輸入系統(tǒng)及方法

文檔序號:6370236閱讀:159來源:國知局
專利名稱:一種錯字字形編輯、編碼和輸入系統(tǒng)及方法
技術(shù)領(lǐng)域
本發(fā)明涉及錯字形編輯、打印和制版印刷領(lǐng)域,特別涉及數(shù)字化對外漢語教學(xué)中常見的錯字輸入系統(tǒng)及方法,具體為一種錯字字形編輯、編碼及輸入系統(tǒng)及方法。
背景技術(shù)
利用計(jì)算機(jī)進(jìn)行漢字輸入、排版和印刷,是目前辦公自動化和印刷領(lǐng)域一件極其平常的事,但是,如果要輸入并印刷計(jì)算機(jī)字庫 中沒有的漢字,用戶往往要大費(fèi)周折,通常的辦法有兩種一是利用造字程序制造,二是臨時(shí)做一個(gè)漢字圖片來暫時(shí)替代。錯字屬于字庫中沒有的字,少量的錯字可以用上述的方法來進(jìn)行,但隨著我國漢語教學(xué)特別是對外漢語教學(xué)的發(fā)展,外國人學(xué)寫漢字的人越來越多,由于漢字學(xué)習(xí)的復(fù)雜性,出現(xiàn)了外國人在書寫漢字時(shí)的錯誤種類和數(shù)量成倍增長,使用字庫制造錯字和編輯錯字圖片的方式遠(yuǎn)遠(yuǎn)不能適應(yīng)數(shù)字化漢語教學(xué)的需要。為此許多學(xué)者開始在錯字編輯和識別方面進(jìn)行研究,并且已經(jīng)取得了一些成果。比較典型的有內(nèi)蒙古師范大學(xué)李小慶和林民老師的“基于國際標(biāo)準(zhǔn)的錯字處理方案”,在該方案中,兩位老師。基于Unicode 5. I標(biāo)準(zhǔn)中表意文字變體序列標(biāo)準(zhǔn)(ideographicvariation sequences, IVS),設(shè)計(jì)并實(shí)現(xiàn)了。以正字為中心組織和管理錯字,使用正字加IVS變體選擇符表示錯字編碼,應(yīng)用OpenType字體技術(shù)進(jìn)行輸入輸出錯字處理方案。以上處理錯字的方法都是在原有字庫的基礎(chǔ)上利用標(biāo)準(zhǔn)字庫中的空閑區(qū)域或不常使用的漢字內(nèi)碼區(qū)域來存放錯字,這些方法最大的不足是占用了漢字寶貴的編碼空間,隨著錯字規(guī)模的擴(kuò)大,這些空間會很書被用完,例如,Chinese GBK國標(biāo)碼為[AAAI-AFFE],[F8A1-FEFE]和[A140-A7A0],僅這 3 個(gè)段就有 4636 個(gè),Unicode 編碼為[E000-F8FF]共6400個(gè)。即使每個(gè)漢字取一個(gè)錯字存放也需要6400個(gè),而實(shí)際情況,錯字的數(shù)量遠(yuǎn)不是一個(gè)漢字只有一個(gè)錯字,因些以上的錯字輸入和處理方案在處理大批量錯字方面還有很多缺陷。為此,需要找到一種錯字輸入和編輯的方法,能夠開放錯字的編輯數(shù)量,方便用戶輸入,更好的服務(wù)漢字的出版和印刷,為漢語教學(xué)特別是對外漢語教學(xué)提供數(shù)字化的錯字編輯和印刷環(huán)境。

發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中存在的不足,本發(fā)明提供了一種通過自建錯字字形庫,并可以進(jìn)行動態(tài)編輯的錯字字形編輯、編碼和輸入系統(tǒng)及方法。本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的一種錯字字形編輯、編碼和輸入系統(tǒng),其特征在于,包括用于創(chuàng)建錯字字形庫的錯字字形庫編輯模塊,用于提取錯字字形庫中錯字字形的特征點(diǎn)的錯字特征提取模塊,用于對錯字的特征點(diǎn)進(jìn)行編碼的錯字編碼模塊,以及用于將編碼后的錯字輸入計(jì)算機(jī)的錯字輸入模塊。上述錯字字形編輯、編碼和輸入系統(tǒng),錯字字形庫編輯模塊實(shí)時(shí)動態(tài)編輯用戶需要輸入的錯字以創(chuàng)建錯字字形庫,對于編輯過的錯字,錯字字形庫編輯模塊把錯字文字結(jié)構(gòu)的錯字特征數(shù)據(jù)傳遞給錯字特征提取模塊;錯字特征提取模塊分析接收到的錯字特征數(shù)據(jù),采用錯字特征提取算法提取錯字特征數(shù)據(jù)中的特征點(diǎn)信息,并將特征點(diǎn)信息傳遞給錯字編碼模塊;錯字編碼模塊通過錯字動態(tài)編碼算法將錯字特征提取模塊中提取的特征點(diǎn)信息進(jìn)行編碼處理,并將編碼處理后的錯字進(jìn)行存儲;錯字輸入模塊接收用戶輸入的正確漢字,通過字形檢索找到該字對應(yīng)的錯字編碼,并將經(jīng)過錯字編碼模塊編碼的錯字輸入到編輯器中進(jìn)行制版和印刷。上述錯字字形編輯、編碼和輸入系統(tǒng),還包括接收需要調(diào)整和編輯的錯字信息的錯字實(shí)時(shí)動態(tài)編輯模塊,錯字實(shí)時(shí)動態(tài)編輯模塊調(diào)用錯字字形庫編輯模塊將文檔中的錯字實(shí)時(shí)動態(tài)編輯處理,并把錯字文字結(jié)構(gòu)的錯字特征數(shù)據(jù)傳遞給錯字特征提取模塊。利用上述錯字字形編輯、編碼和輸入系統(tǒng)的錯字字形編輯、編碼和輸入方法,包括如下步驟
A.利用錯字字形庫編輯模塊創(chuàng)建錯字字形庫錯字字形庫中存儲正確漢字及每個(gè)正確漢字所對應(yīng)的錯字;B.通過錯字特征提取模塊對錯字字形庫中錯字字形的特征數(shù)據(jù)提取特征點(diǎn)信息;C.利用錯字編碼模塊對錯字編碼根據(jù)錯字字形的特征點(diǎn)信息對錯字進(jìn)行編碼,創(chuàng)建檢索表;D.通過錯字輸入模塊實(shí)現(xiàn)錯字字形的輸入根據(jù)輸入的正確漢字,通過檢索表在錯字字形庫中查找到輸入的正確漢字所對應(yīng)的錯字,選擇需要的錯字字形,即可輸入錯字字形。上述錯字字形編輯、編碼和輸入方法,在步驟A中通過繪制和臨摹來編輯用戶需要輸入的錯字,將錯字的筆畫結(jié)構(gòu)進(jìn)行可視化的修改和組合,包括在錯字字形庫中手寫增加錯字、臨摹修改錯字、挑選臨摹對象、增加錯字筆畫、移動筆畫位置、刪除筆畫、增加筆畫控制點(diǎn)、刪除筆畫控制點(diǎn)、保存編輯后的錯字、錯字部件和筆畫臨摹進(jìn)背景透明度的選擇、錯字部件和筆畫臨摹、錯字筆畫改變粗細(xì)以及存儲編輯修改的錯字字形。錯字字形編輯、編碼和輸入方法,在步驟B中錯字特征提取模塊采用錯字特征提取算法提取錯字的特征點(diǎn)信息,錯字特征提取算法采用定義錯字的筆元和特征點(diǎn)與人機(jī)交互的方法提取特征點(diǎn)信息,采用筆元來定義錯字筆畫筆元是由一個(gè)或多個(gè)有向筆段組成的一個(gè)完整的筆畫結(jié)構(gòu),設(shè)一個(gè)筆元由η個(gè)有向筆段來組成,筆元中的有向筆段稱為錯字字形的特征數(shù)據(jù);筆元的描述為SSn = (BSijBS27BS3,……,BSn}或SSn = {(Xil, Yil) | (Xjl,Yjl),(Xi2^ Yi2) I (Xj2^ Yj2),……,(Xin,YJ I (Xjn^ Yjn) I ;BSn 表示第 η 個(gè)有向筆段;(Xin,Yin)表示第η個(gè)有向筆段的開始點(diǎn)坐標(biāo),簡稱勢點(diǎn);(Xjn,Yjn)表示第η個(gè)有向筆段的結(jié)束點(diǎn)坐標(biāo),簡稱駐點(diǎn);筆元的起始界點(diǎn)稱為始界點(diǎn),筆元的終結(jié)界點(diǎn)稱為終界點(diǎn),錯字筆元中的所有勢點(diǎn)和駐點(diǎn)稱為錯字的特征點(diǎn)。上述錯字字形編輯、編碼和輸入方法,在步驟C中采用錯字動態(tài)編碼算法將錯字字形以所在行的序號和錯字各個(gè)特征點(diǎn)的坐標(biāo)進(jìn)行編碼,同時(shí)創(chuàng)建一個(gè)以行號為索引的檢索表。上述錯字字形編輯、編碼和輸入方法,錯字動態(tài)編碼算法的算法步驟如下
步驟I :建立或打開錯字字形庫,并初始化變量;變量的初始化要對分隔點(diǎn)D、始界點(diǎn)H、終界點(diǎn)T、筆元數(shù)ele_num和字形描述庫ZXDATA(i)進(jìn)行初始化操作,分隔點(diǎn)用于將相鄰兩個(gè)筆元分隔開來;Open ZXscript//打開字形描述庫INT ele_num — O, m ;POINT D — (m,O),H — (m,O),D — (m, m);ZXDATA⑴一{m, 0, m, m}//描述庫初始化步驟2 :選擇操作類型若操作類型為“Ins”,則轉(zhuǎn)步驟2. I ;若操作類型為“Mov”,則轉(zhuǎn)步驟2. 2 ;若操作類型為“Del”,則轉(zhuǎn)步驟2. 3 ;若操作類型為“Edit”,則轉(zhuǎn)向步驟2. 4 ;若操作類型為“NoOper”,則轉(zhuǎn)向步驟3 ;
·
步驟2. I :插入筆元;插入具有η個(gè)筆段的筆元En是通過逐個(gè)插入該筆元的筆段來實(shí)現(xiàn)的,設(shè)插入位置為 pos 步驟2. I. I在插入位置插入一個(gè)分隔點(diǎn)(m,0);將筆段計(jì)數(shù)變量i置I ;插入位置pos自加I ;步驟2. I. 2在插入位置插入筆元En的第i個(gè)筆段,即B[i]. x,B[i]. y,Z[i]. x和Z[i].y ;B[i]和Z[i]分別為第i個(gè)筆段的勢點(diǎn)和駐點(diǎn);在犯]和Z[i]之間畫線段;插入位置pos自加2 ;筆段數(shù)i自加I ;步驟2. I. 3若i < n,轉(zhuǎn)步驟2. I. 2 ;否則,筆元數(shù)ele num自加1,轉(zhuǎn)步驟2 ;步驟2. 2 :整體移動筆元;整體移動筆元是通過修改筆元中除始界點(diǎn)和終界點(diǎn)外各個(gè)點(diǎn)的坐標(biāo)來實(shí)現(xiàn)的,設(shè)Vertex [i]是待移動筆元中的第i個(gè)點(diǎn),dx和dy分別是水平增量和垂直增量,VerCount是待移動筆元中除始界點(diǎn)和終界點(diǎn)之外的點(diǎn)數(shù)步驟2. 2. I 置 i 為 I ;步驟2. 2. 2Vertex[i]· X 和 Vertex[i]· y 分別增加 dx 和 dy ;i 自加 I ;步驟2. 2. 3若i < VerCount,轉(zhuǎn)步驟2. 2. 2 ;否則,轉(zhuǎn)步驟2 ;步驟2. 3 :刪除筆元;刪除筆元是通過刪除筆元的各個(gè)點(diǎn)來實(shí)現(xiàn)的;設(shè)Vertex [i]是待移動筆元中的第i個(gè)點(diǎn),VerCount是待刪除筆元中除始界點(diǎn)和終界點(diǎn)之外的點(diǎn)數(shù);步驟2. 3. I刪除一個(gè)分隔點(diǎn)(m,0);置i為I ;步驟2. 3. 2 刪除 Vertex[i] ;i 自加 I ;步驟2. 2. 3若i < VerCount,轉(zhuǎn)步驟2. 3. 2 ;否則,轉(zhuǎn)步驟2 ;步驟2. 4:編輯筆元;編輯筆元主要是指移動筆元中的某個(gè)筆段,這主要通過移動相應(yīng)筆段的勢點(diǎn)或駐點(diǎn)來實(shí)現(xiàn);設(shè)待移動的筆段的勢點(diǎn)或駐點(diǎn)為Vertex[i],dx和dy分別是水平增量和垂直增量,移動該點(diǎn)的方法為Vertex[i]. x = Vertex[i]. x+dx ;Vertex[i]. y = Vertex[i]. y+dy ;轉(zhuǎn)步驟2 ;
步驟3 :保存修改,關(guān)閉字形描述庫。上述錯字字形編輯、編碼和輸入方法,在步驟D中用戶在編輯器中輸入正確的漢字,通過檢索表找到錯字所在的行,將錯字所在行的所有錯字列表顯示,用戶挑選所用錯字,即可輸入錯字字形。本發(fā)明的有益效果是通過自定義錯字字庫,將正字和錯字進(jìn)行一對多的映射編碼,而字庫中的每一個(gè)錯字都可以在使用過程中動態(tài)的編輯和修改;編輯和修改每一個(gè)錯字可以使用動態(tài)的繪制、增減筆畫和臨摹,修改后的錯字還可以重新進(jìn)行編碼和存儲。本發(fā)明能夠進(jìn)行錯字的輸入操作,從而解決了困擾錯字印刷和數(shù)字化漢語教學(xué)中多年存在的錯字輸入的困難;另外,充分利用了現(xiàn)代漢字的結(jié)構(gòu)多變,字形復(fù)雜的特性,將錯字庫的編輯和修改和漢字的臨摹有機(jī)的結(jié)合起來,保證了在不改變原有字形結(jié)構(gòu)的情況下,動態(tài)的制作多種形式的錯字字形,為數(shù)字化的漢語教學(xué)和錯字印刷排版提供了一種錯 字獲取源,是一種簡單方便而又高效地錯字輸入法。


圖I為本發(fā)明錯字字形編輯、編碼和輸入系統(tǒng)的模塊組成圖。圖中1_錯字字形庫編輯模塊,2-錯字特征提取模塊,3-錯字編碼模塊,4-錯字輸入模塊,5-錯字實(shí)時(shí)動態(tài)編輯模塊。
具體實(shí)施例方式結(jié)合附圖對本發(fā)明做進(jìn)一步的說明本實(shí)施例錯字字形編輯、編碼和輸入系統(tǒng),包括用于創(chuàng)建錯字字形庫的錯字字形庫編輯模塊1,用于提取錯字字形庫中錯字字形的特征點(diǎn)的錯字特征提取模塊2,用于對錯字的特征點(diǎn)進(jìn)行編碼的錯字編碼模塊3,以及用于將編碼后的錯字輸入計(jì)算機(jī)的錯字輸入模塊4。錯字字形庫編輯模塊丨實(shí)時(shí)動態(tài)編輯用戶需要輸入的錯字以創(chuàng)建錯字字形庫,對于編輯過的錯字,錯字字形庫編輯模塊I把錯字文字結(jié)構(gòu)的錯字特征數(shù)據(jù)傳遞給錯字特征提取1 塊2 ;錯字特征提取模塊2分析接收到的錯字特征數(shù)據(jù),采用錯字特征提取算法提取錯字特征數(shù)據(jù)中的特征點(diǎn)信息,并將特征點(diǎn)信息傳遞給錯字編碼模塊3 ;錯字編碼模塊3通過錯字動態(tài)編碼算法將錯字特征提取模塊2中提取的特征點(diǎn)信息進(jìn)行編碼處理,并將編碼處理后的錯字進(jìn)行存儲;錯字輸入模塊4接收用戶輸入的正確漢字,通過字形檢索找到該正確漢字對應(yīng)的錯字編碼,找到該正確漢字對應(yīng)的所有錯字,然后由用戶選擇對應(yīng)的錯字,并將經(jīng)過錯字編碼模塊3編碼的錯字輸入到編輯器中進(jìn)行制版和印刷。還包括接收需要調(diào)整和編輯的錯字信息的錯字實(shí)時(shí)動態(tài)編輯模塊5,錯字實(shí)時(shí)動態(tài)編輯模塊5調(diào)用錯字字形庫編輯模塊I將文檔中的錯字實(shí)時(shí)動態(tài)編輯處理,修改后的錯字可以重新加入到錯字字形表中,并把錯字文字結(jié)構(gòu)的錯字特征數(shù)據(jù)傳遞給錯字特征提取模塊2。錯字實(shí)時(shí)動態(tài)編輯模塊5通過選擇指定的錯字,再次調(diào)用錯字字形編輯模塊I進(jìn)行再編輯存儲后,將文檔中的錯字進(jìn)行存儲。
利用上述錯字字形編輯、編碼和輸入系統(tǒng)的錯字字形編輯、編碼和輸入方法,其特征在于,包括如下步驟A.利用錯字字形庫編輯模塊I創(chuàng)建錯字字形庫錯字字形庫中存儲正確漢字及每個(gè)正確漢字所對應(yīng)的錯字;通過繪制和臨摹來編輯用戶需要輸入的錯字,將錯字的筆畫結(jié)構(gòu)進(jìn)行可視化的修改和組合,包括在錯字字形庫中手寫增加錯字、臨摹修改錯字、挑選臨摹對象、增加錯字筆畫、移動筆畫位置、刪除筆畫、增加筆畫控制點(diǎn)、刪除筆畫控制點(diǎn)、保存編輯后的錯字、錯字部件和筆畫臨摹進(jìn)背景透明度的選擇、錯字部件和筆畫臨摹、錯字筆畫改變粗細(xì)以及存儲編輯修改的錯字字形。B.通過錯字特征提取模塊2對錯字字形庫中錯字字形的特征數(shù)據(jù)提取特征點(diǎn)信息;
錯字特征提取模塊2采用錯字特征提取算法提取錯字的特征點(diǎn)信息,錯字特征提取算法采用定義錯字的筆元和特征點(diǎn)與人機(jī)交互的方法提取特征點(diǎn)信息,采用筆元來定義錯字筆畫筆元是由一個(gè)或多個(gè)有向筆段組成的一個(gè)完整的筆畫結(jié)構(gòu),設(shè)一個(gè)筆元由η個(gè)有向筆段來組成,筆元中的有向筆段稱為錯字字形的特征數(shù)據(jù);筆元的描述為=SSn= (BS1,BS27BS3,……,BSn}或 SSn= {(Xil, Yil) I (XjlJjHYi2) | (XJ2,YJ2),……,(Xin,Yin) I (XJn,YjnM ;BSn表示第n個(gè)有向筆段;(Xin,Yin)表示第n個(gè)有向筆段的開始點(diǎn)坐標(biāo),簡稱勢點(diǎn);(XJn, Yjn)表示第η個(gè)有向筆段的結(jié)束點(diǎn)坐標(biāo),簡稱駐點(diǎn);筆元的起始界點(diǎn)稱為始界點(diǎn),筆元的終結(jié)界點(diǎn)稱為終界點(diǎn),錯字筆元中的所有勢點(diǎn)和駐點(diǎn)稱為錯字的特征點(diǎn)。C.利用錯字編碼模塊3對錯字編碼根據(jù)錯字字形的特征點(diǎn)信息對錯字進(jìn)行編碼,創(chuàng)建檢索表;采用錯字動態(tài)編碼算法將錯字字形以所在行的序號和錯字各個(gè)特征點(diǎn)的坐標(biāo)進(jìn)行編碼,同時(shí)創(chuàng)建一個(gè)以行號為索引的檢索表。錯字動態(tài)編碼算法的算法步驟如下步驟I :建立或打開錯字字形庫,并初始化變量;變量的初始化要對分隔點(diǎn)D、始界點(diǎn)H、終界點(diǎn)Τ、筆元數(shù)ele_num和字形描述庫ZXDATA(i)進(jìn)行初始化操作,分隔點(diǎn)用于將相鄰兩個(gè)筆元分隔開來;Open ZXscript//打開字形描述庫INT ele_num — O, m ; POINT D — (m,O),H — (m,O),D — (m, m);ZXDATA(i) — {m, 0, m, m}//描述庫初始化步驟2 :選擇操作類型若操作類型為“Ins”,則轉(zhuǎn)步驟2. I ;若操作類型為“Mov”,則轉(zhuǎn)步驟2. 2 ;若操作類型為“Del”,則轉(zhuǎn)步驟2. 3 ;若操作類型為“Edit”,則轉(zhuǎn)向步驟2. 4 ;若操作類型為“NoOper”,則轉(zhuǎn)向步驟3 ;步驟2. I :插入筆元;插入具有η個(gè)筆段的筆元En是通過逐個(gè)插入該筆元的筆段來實(shí)現(xiàn)的,設(shè)插入位置為 pos 步驟2. I. I在插入位置插入一個(gè)分隔點(diǎn)(m,0);將筆段計(jì)數(shù)變量i置I ;插入位置pos自加I ;
步驟2. I. 2在插入位置插入筆元En的第i個(gè)筆段,即B [i]. x, B [i]. y, Z [i]. x和Z[i].y ;B[i]和Z[i]分別為第i個(gè)筆段的勢點(diǎn)和駐點(diǎn);在犯]和Z[i]之間畫線段;插入位置pos自加2 ;筆段數(shù)i自加I ;步驟2. I. 3若i < n,轉(zhuǎn)步驟2. I. 2 ;否則,筆元數(shù)ele_num自加1,轉(zhuǎn)步驟2 ;步驟2. 2 :整體移動筆元;整體移動筆元是通過修改筆元中除始界點(diǎn)和終界點(diǎn)外各個(gè)點(diǎn)的坐標(biāo)來實(shí)現(xiàn)的,設(shè)Vertex[i]是待移動筆元中的第i個(gè)點(diǎn),dx和dy分別是水平增量和垂直增量,VerCount是待移動筆元中除始界點(diǎn)和終界點(diǎn)之外的點(diǎn)數(shù)步驟2. 2. I 置 i 為 I ;
步驟2. 2. 2Vertex[i]· X 和 Vertex[i]· y 分別增加 dx 和 dy ;i 自加 I ;步驟2. 2. 3若i < VerCount,轉(zhuǎn)步驟2. 2. 2 ;否則,轉(zhuǎn)步驟2 ;步驟2. 3 :刪除筆元;刪除筆元是通過刪除筆元的各個(gè)點(diǎn)來實(shí)現(xiàn)的;設(shè)Vertex [i]是待移動筆元中的第i個(gè)點(diǎn),VerCount是待刪除筆元中除始界點(diǎn)和終界點(diǎn)之外的點(diǎn)數(shù);步驟2. 3. I刪除一個(gè)分隔點(diǎn)(m,0);置i為I ;步驟2. 3. 2 刪除 Vertex[i] ;i 自加 I ;步驟2. 2. 3若i < VerCount,轉(zhuǎn)步驟2. 3. 2 ;否則,轉(zhuǎn)步驟2 ;步驟2. 4 :編輯筆元;編輯筆元主要是指移動筆元中的某個(gè)筆段,這主要通過移動相應(yīng)筆段的勢點(diǎn)或駐點(diǎn)來實(shí)現(xiàn);設(shè)待移動的筆段的勢點(diǎn)或駐點(diǎn)為Vertex[i],dx和dy分別是水平增量和垂直增量,移動該點(diǎn)的方法為Vertex[i]. x = Vertex[i]. x+dx ;Vertex[i]. y = Vertex[i]. y+dy ;轉(zhuǎn)步驟2 ;步驟3 :保存修改,關(guān)閉字形描述庫。D.通過錯字輸入模塊4實(shí)現(xiàn)錯字字形的輸入根據(jù)輸入的正確漢字,通過檢索表在錯字字形庫中查找到輸入的正確漢字所對應(yīng)的錯字,選擇需要的錯字字形,即可輸入錯字字形。用戶在編輯器中輸入正確的漢字,通過檢索表找到錯字所在的行,將錯字所在行的所有錯字列表顯示,用戶挑選所用錯字,即可輸入錯字字形。本發(fā)明能夠進(jìn)行錯字的輸入操作,從而解決了困擾錯字印刷和數(shù)字化漢語教學(xué)中多年存在的錯字輸入的困難;另外,充分利用了現(xiàn)代漢字的結(jié)構(gòu)多變,字形復(fù)雜的特性,將錯字庫的編輯和修改和漢字的臨摹有機(jī)的結(jié)合起來,保證了在不改變原有字形結(jié)構(gòu)的情況下,動態(tài)的制作多種形式的錯字字形,為數(shù)字化的漢語教學(xué)和錯字印刷排版提供了一種錯字獲取源,是一種簡單方便而又高效地錯字輸入法。上述實(shí)施例僅僅是為清楚地說明本發(fā)明創(chuàng)造所作的舉例,而并非對本發(fā)明創(chuàng)造具體實(shí)施方式
的限定。對于所屬領(lǐng)域的普通技術(shù)人員來說,在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動。這里無需也無法對所有的實(shí)施方式予以窮舉。而由此所引伸出的顯而易見的變化或變動仍處于本發(fā)明創(chuàng)造權(quán)利要求的保護(hù)范圍之中。
權(quán)利要求
1.一種錯字字形編輯、編碼和輸入系統(tǒng),其特征在于,包括用于創(chuàng)建錯字字形庫的錯字字形庫編輯模塊(I),用于提取錯字字形庫中錯字字形的特征點(diǎn)的錯字特征提取模塊(2),用于對錯字的特征點(diǎn)進(jìn)行編碼的錯字編碼模塊(3),以及用于將編碼后的錯字輸入計(jì)算機(jī)的錯字輸入模塊(4)。
2.根據(jù)權(quán)利要求I所述的錯字字形編輯、編碼和輸入系統(tǒng),其特征在于,錯字字形庫編輯模塊(I)實(shí)時(shí)動態(tài)編輯用戶需要輸入的錯字以創(chuàng)建錯字字形庫,對于編輯過的錯字,錯字字形庫編輯模塊(I)把錯字文字結(jié)構(gòu)的錯字特征數(shù)據(jù)傳遞給錯字特征提取模塊(2); 錯字特征提取模塊(2)分析接收到的錯字特征數(shù)據(jù),采用錯字特征提取算法提取錯字特征數(shù)據(jù)中的特征點(diǎn)信息,并將特征點(diǎn)信息傳遞給錯字編碼模塊(3); 錯字編碼模塊(3)通過錯字動態(tài)編碼算法將錯字特征提取模塊(2)中提取的特征點(diǎn)信息進(jìn)行編碼處理,并將編碼處理后的錯字進(jìn)行存儲; 錯字輸入模塊(4)接收用戶輸入的正確漢字,通過字形檢索找到該字對應(yīng)的錯字編碼,并將經(jīng)過錯字編碼模塊(3)編碼的錯字輸入到編輯器中進(jìn)行制版和印刷。
3.根據(jù)權(quán)利要求I或2所述的錯字字形編輯、編碼和輸入系統(tǒng),其特征在于,還包括接收需要調(diào)整和編輯的錯字信息的錯字實(shí)時(shí)動態(tài)編輯模塊(5),錯字實(shí)時(shí)動態(tài)編輯模塊(5)調(diào)用錯字字形庫編輯模塊(I)將文檔中的錯字實(shí)時(shí)動態(tài)編輯處理,并把錯字文字結(jié)構(gòu)的錯字特征數(shù)據(jù)傳遞給錯字特征提取模塊(2)。
4.ー種利用權(quán)利要求I所述錯字字形編輯、編碼和輸入系統(tǒng)的錯字字形編輯、編碼和輸入方法,其特征在于,包括如下步驟 A.利用錯字字形庫編輯模塊(I)創(chuàng)建錯字字形庫錯字字形庫中存儲正確漢字及每個(gè)正確漢字所對應(yīng)的錯字; B.通過錯字特征提取模塊(2)對錯字字形庫中錯字字形的特征數(shù)據(jù)提取特征點(diǎn)信息; C.利用錯字編碼模塊(3)對錯字編碼根據(jù)錯字字形的特征點(diǎn)信息對錯字進(jìn)行編碼,創(chuàng)建檢索表; D.通過錯字輸入模塊(4)實(shí)現(xiàn)錯字字形的輸入根據(jù)輸入的正確漢字,通過檢索表在錯字字形庫中查找到輸入的正確漢字所對應(yīng)的錯字,選擇需要的錯字字形,即可輸入錯字字形。
5.根據(jù)權(quán)利要求4的錯字字形編輯、編碼和輸入方法,其特征在于,在步驟A中通過繪制和臨摹來編輯用戶需要輸入的錯字,將錯字的筆畫結(jié)構(gòu)進(jìn)行可視化的修改和組合,包括在錯字字形庫中手寫增加錯字、臨摹修改錯字、挑選臨摹對象、増加錯字筆畫、移動筆畫位置、刪除筆畫、増加筆畫控制點(diǎn)、刪除筆畫控制點(diǎn)、保存編輯后的錯字、錯字部件和筆畫臨摹進(jìn)背景透明度的選擇、錯字部件和筆畫臨摹、錯字筆畫改變粗細(xì)以及存儲編輯修改的錯字字形。
6.根據(jù)權(quán)利要求5的錯字字形編輯、編碼和輸入方法,其特征在于,在步驟B中錯字特征提取模塊(2)采用錯字特征提取算法提取錯字的特征點(diǎn)信息,錯字特征提取算法采用定義錯字的筆元和特征點(diǎn)與人機(jī)交互的方法提取特征點(diǎn)信息,采用筆元來定義錯字筆畫筆元是由一個(gè)或多個(gè)有向筆段組成的ー個(gè)完整的筆畫結(jié)構(gòu),設(shè)ー個(gè)筆元由η個(gè)有向筆段來組成,筆元中的有向筆段稱為錯字字形的特征數(shù)據(jù);筆元的描述為=SSn= (BS1, BS2,BS3, ......,BSJ 或 SSn = {(Xn,Yil)/(Xjl, Yjl),(Xi2, Yi2)/(XJ2, Yj2),......,(Xin, Yj/(Xjn,Y>)} ;BSn表示第η個(gè)有向筆段;(Xin,Yin)表示第η個(gè)有向筆段的開始點(diǎn)坐標(biāo),有向筆段的開始點(diǎn)簡稱勢點(diǎn);(X_ Yjn)表示第η個(gè)有向筆段的結(jié)束點(diǎn)坐標(biāo),有向筆段的結(jié)束點(diǎn)簡稱駐點(diǎn);筆元的起始界點(diǎn)稱為始界點(diǎn),筆元的終結(jié)界點(diǎn)稱為終界點(diǎn),錯字筆元中的所有勢點(diǎn)和駐點(diǎn)稱為錯字的特征點(diǎn)。
7.根據(jù)權(quán)利要求6的錯字字形編輯、編碼和輸入方法,其特征在于,在步驟C中采用錯字動態(tài)編碼算法將錯字字形以所在行的序號和錯字各個(gè)特征點(diǎn)的坐標(biāo)進(jìn)行編碼,同時(shí)創(chuàng)建ー個(gè)以行號為索引的檢索表。
8.根據(jù)權(quán)利要求7的錯字字形編輯、編碼和輸入方法,其特征在干,錯字動態(tài)編碼算法的算法步驟如下 步驟I :建立或打開錯字字形庫,并初始化變量; 變量的初始化要對分隔點(diǎn)D、始界點(diǎn)H、終界點(diǎn)Τ、筆元數(shù)ele_num和字形描述庫ZXDATA (i)進(jìn)行初始化操作,分隔點(diǎn)用于將相鄰兩個(gè)筆元分隔開來;Open ZXscript//打開字形描述庫 INT ele_num 一 O, m ;POINT D — (m,O),H — (m,O),D — (m, m); ZXDATA(i) — {m,0, m, m}//描述庫初始化 步驟2 :選擇操作類型若操作類型為“Ins”,則轉(zhuǎn)步驟2. I ;若操作類型為“Mov”,則轉(zhuǎn)步驟2. 2 ;若操作類型為“Del”,則轉(zhuǎn)步驟2. 3 ;若操作類型為“Edit”,則轉(zhuǎn)向步驟2. 4 ;若操作類型為“NoOper”,則轉(zhuǎn)向步驟3 ; 步驟2. I :插入筆元; 插入具有η個(gè)筆段的筆元En是通過逐個(gè)插入該筆元的筆段來實(shí)現(xiàn)的,設(shè)插入位置為pos : 步驟2. I. I在插入位置插入ー個(gè)分隔點(diǎn)(m,0);將筆段計(jì)數(shù)變量i置I ;插入位置POS自加I ; 步驟2. I. 2在插入位置插入筆元En的第i個(gè)筆段,即B[i]. x,B[i]. y,Z[i]. x和Z[i].y ;B[i]和Z[i]分別為第i個(gè)筆段的勢點(diǎn)和駐點(diǎn);在B[i]和Z[i]之間畫線段;插入位置pos自加2 ;筆段數(shù)i自加I ; 步驟2. I. 3若i < n,轉(zhuǎn)步驟2. I. 2 ;否則,筆元數(shù)ele_num自加1,轉(zhuǎn)步驟2 ; 步驟2. 2 :整體移動筆元; 整體移動筆元是通過修改筆元中除始界點(diǎn)和終界點(diǎn)外各個(gè)點(diǎn)的坐標(biāo)來實(shí)現(xiàn)的,設(shè)Vertex [i]是待移動筆元中的第i個(gè)點(diǎn),dx和dy分別是水平增量和垂直增量,VerCount是待移動筆元中除始界點(diǎn)和終界點(diǎn)之外的點(diǎn)數(shù) 步驟2. 2. I置i為I ;步驟 2. 2. 2Vertex[i]· x 和 Vertex[i]. y 分別增加 dx 和 dy ;i 自加 I ; 步驟2. 2. 3若i < VerCount,轉(zhuǎn)步驟2. 2. 2 ;否則,轉(zhuǎn)步驟2 ; 步驟2. 3 :刪除筆元; 刪除筆元是通過刪除筆元的各個(gè)點(diǎn)來實(shí)現(xiàn)的;設(shè)VerteX[i]是待移動筆元中的第i個(gè)點(diǎn),VerCount是待刪除筆元中除始界點(diǎn)和終界點(diǎn)之外的點(diǎn)數(shù); 步驟2. 3. I刪除ー個(gè)分隔點(diǎn)(m,0);置i為I ;步驟2· 3. 2刪除Vertex[i] ;i自加I ; 步驟2· 2· 3若i < VerCount,轉(zhuǎn)步驟2· 3. 2 ;否則,轉(zhuǎn)步驟2 ; 步驟2. 4 :編輯筆元; 編輯筆元主要是指移動筆元中的某個(gè)筆段,這主要通過移動相應(yīng)筆段的勢點(diǎn)或駐點(diǎn)來實(shí)現(xiàn);設(shè)待移動的筆段的勢點(diǎn)或駐點(diǎn)為Vertex [i],dx和dy分別是水平増量和垂直増量,移動該點(diǎn)的方法為Vertex[i]. x = Vertex[I」· x+dx ;Vertex[i]. y = Vertex[i]. y+dy ; 轉(zhuǎn)步驟2 ; 步驟3 :保存修改,關(guān)閉字形描述庫。
9.根據(jù)權(quán)利要求8的錯字字形編輯、編碼和輸入方法,其特征在于,在步驟D中用戶在編輯器中輸入正確的漢字,通過檢索表找到錯字所在的行,將錯字所在行的所有錯字列表顯示,用戶挑選所用錯字,即可輸入錯字字形。
全文摘要
本發(fā)明一種錯字字形編輯、編碼和輸入系統(tǒng)及方法,包括用于創(chuàng)建錯字字形庫的錯字字形庫編輯模塊,用于提取錯字字形庫中錯字字形的特征點(diǎn)的錯字特征提取模塊,用于對錯字的特征點(diǎn)進(jìn)行編碼的錯字編碼模塊,以及用于將編碼后的錯字輸入計(jì)算機(jī)的錯字輸入模塊。錯字字形編輯、編碼和輸入方法,包括如下步驟A.利用錯字字形庫編輯模塊創(chuàng)建錯字字形庫;B.通過錯字特征提取模塊對錯字字形庫中錯字字形的特征數(shù)據(jù)提取特征點(diǎn)信息;C.利用錯字編碼模塊對錯字編碼;D.通過錯字輸入模塊實(shí)現(xiàn)錯字字形的輸入。本發(fā)明為錯字的編輯、印刷和排版及數(shù)字化漢語教學(xué)研究提供了方便,解決了困擾人們多年的錯字輸入難題。
文檔編號G06F3/023GK102722261SQ20121016540
公開日2012年10月10日 申請日期2012年5月25日 優(yōu)先權(quán)日2012年5月25日
發(fā)明者吳琴霞, 楊玉星, 栗青生, 王愛民, 郭濤 申請人:楊玉星, 栗青生, 王愛民
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
石门县| 镇坪县| 石渠县| 崇文区| 固安县| 尖扎县| 响水县| 托里县| 盐城市| 达日县| 宁明县| 巫溪县| 南丰县| 泉州市| 莫力| 郴州市| 仁怀市| 临漳县| 来宾市| 桂东县| 兴化市| 贺州市| 岑巩县| 靖州| 新兴县| 巫溪县| 太仓市| 东乌珠穆沁旗| 虹口区| 玛沁县| 昌平区| 昌平区| 宣化县| 咸宁市| 志丹县| 犍为县| 临泉县| 翁牛特旗| 集安市| 沙洋县| 石渠县|