專利名稱:二分碼漢字輸入系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明是一種漢字輸入系統(tǒng)。
現(xiàn)有漢字輸入系統(tǒng)存在兩方面的缺點,首先,現(xiàn)有以音為主的編碼方法一般不能輸入不識音的漢字,而以形為主的編碼又有思維層次多,反應(yīng)慢的缺點,改換輸入編碼,一般都需切換;其次,已經(jīng)提出的漢字編碼方案雖達(dá)1000余種,但這些編碼,在不同程度上都存在音難準(zhǔn)、鍵難記、字難拆,難學(xué)易忘的缺點,因而不易為非專業(yè)人員所接受。
本發(fā)明的目的在于克服現(xiàn)有漢字輸入的以上缺點,設(shè)計一種新的漢字輸入系統(tǒng),它包含兩種易學(xué)、難忘、重碼少、輸入快的漢字編碼方法,一種可以輸入會讀音的漢字,一種則可輸入不會讀音的漢字,通過字(詞)庫和鍵盤的特殊設(shè)計,使兩種輸入方法構(gòu)成一個整體,用戶可以同時使用兩種編碼方法輸入,并可同時輸入字、詞,既不需要切換,也不會增加重碼,互相干擾。
本發(fā)明的技術(shù)內(nèi)容是該漢字輸入系統(tǒng)由兩種漢字編碼方法、三個字(詞)庫設(shè)計及相關(guān)的鍵盤功能設(shè)計三個部分組成。
本發(fā)明的實現(xiàn)方式之一是以兩種編碼方法中的第一種為主要輸入方法,用來輸入會讀音的漢字,第二種為輔助輸入方法,偶爾用來輸入不會讀音的漢字。借助獨特的字(詞)庫及相關(guān)的鍵盤功能設(shè)計,兩種輸入方法構(gòu)成一個整體,工作時不需切換。
三個字(詞)庫設(shè)計為庫1安放一級字庫的字,并按第一種漢字編碼方法編碼,少數(shù)難認(rèn)的字可同時按兩種編碼裝入,然后以填空的方式按高頻優(yōu)先的原則無重碼地依次加入部分三碼詞和四碼詞的前三碼以及二級字庫的部分字;庫2安放二級字庫的字,同時按照兩種編碼方法編碼裝入;庫3安放剩下的全部三碼詞和四碼詞,一般按第一種漢字編碼方法編碼裝入。
與以上三個字(詞)庫設(shè)計相配合,鍵盤設(shè)計中有v、n鍵的特殊查庫功能設(shè)計。輸入時,人們不必知道所需字、詞究竟在哪個庫中,也不必告訴計算機你是按照哪種編碼輸入。當(dāng)三碼輸完后,計算機首先在庫1查找,若未找著,則予報警;如果找到,但不是所需的字,則可按v,這時,計算機首先清除屏上剛輸入的字詞,然后轉(zhuǎn)入庫2查找;如果找到的不是所需的詞,則可按n,這時,計算機亦先清除已輸入的字詞,然后轉(zhuǎn)入庫3查找;因為字、詞第一碼不取v、n,所以,三碼輸完后再輸入n、v不會被誤解為是下一字詞的第一碼。若要輸入四碼詞,可先輸入前三碼,然后按v,再鍵入第四碼即可。
本漢字輸入系統(tǒng)的兩種漢字編碼方法有相同的“首音”及鍵盤設(shè)計,相同的分部規(guī)則和相同的由部取碼的規(guī)則。它們的差別僅在于字的三個編碼的選取有所不同。兩種編碼方法都可單獨使用,這時,它們就成為兩個獨立的漢字輸入系統(tǒng)。只要按地方音或日、韓音等規(guī)定首音,這時,本漢字輸入系統(tǒng)即成為地方語或日、韓語及其它拼形語的字輸入系統(tǒng)。
本漢字輸入系統(tǒng)的兩種漢字編碼方法,其中,第一種漢字編碼方法是首先將字一分為二,成為兩部,然后每部各取一碼,加上字音碼,總共三碼,字音碼可放在兩部碼之前,也可放在兩部碼之后,字音碼恒取字的“首音”,但需避同音和避同字,避同的方法是拆分時避同、取碼時棄同、不能棄同時拆同,而重疊字的編碼規(guī)則則是字音碼恒取字的“首音”,第二碼取重字的“首音”,第三碼取數(shù)字9;其中,第二種漢字編碼方法,首先將字一分為二,成為兩部,然后根據(jù)情況從其中一部取一碼,從另一部取兩碼。取一碼時,可按第一種漢字編碼方法同樣的規(guī)則直接由部取碼,取兩碼時,只需將該部視為一新字,然后按照與第一種漢字編碼方法同樣的規(guī)則取其兩個部碼即可。三碼的排列次序與它們在原字中的次序相同。究竟哪一部取一碼,哪一部取兩碼,有以下規(guī)則a)單畫和不能獨立成字的部首優(yōu)先取一碼,其余兩碼從另一部產(chǎn)生,若不唯一,首部優(yōu)先取一碼,末部兩碼;b)能一次拆分為兩碼的部優(yōu)先取兩碼,余下一碼從另一部產(chǎn)生,若兩部皆能一次拆分為兩碼,則已成字的部取一碼,不成字的部取兩碼;若兩部皆已成字或皆不成字,則首部取一碼,末部兩碼。c)若兩部皆不能一次拆分為兩碼,則成字的部先取一碼,不成字的部取兩碼,若兩部皆成字或皆不成字,則首部取一碼,末部兩碼。
兩種漢字編碼方法可以單獨使用,這時,它們就成為兩個獨立的漢字編碼輸入系統(tǒng)。
漢語多形聲字,對這些字取首音為碼,若不避同,三碼實際變?yōu)閮纱a,減少了信息量,由此必然產(chǎn)生大量重碼。本發(fā)明制定了嚴(yán)格的避同規(guī)則,有效地抑制了重碼的產(chǎn)生。如吩=fkd咐=fkc啡=fk3若不避同音,其編碼皆為fkf;同樣,瓣、辨、辯、辮若不避同字,亦皆為重碼,避同字后,它們的編碼全都不同。
本漢字輸入系統(tǒng),有特殊的“首音”及鍵盤設(shè)計,“首音”除一般規(guī)定為漢語拼音的第一個拉丁字母外,還有以下規(guī)定a)n改l因n、l難分,故規(guī)定以n、l打頭的字、部,首音一律取l;b)分y因以y打頭的字、部特多,而u、i二鍵又無用,故規(guī)定,以yu打頭的字,首音取u,以yi打頭的字,首音取i,其余以y打頭的字,首音仍然取y,這種規(guī)定亦好記憶;c)草、木、水、手四大部首改音研究表明,與s、c、m有關(guān)的大量重碼主要是由草、木、水、手四個部首引起的,而v、n兩鍵尚無用處,a、o兩鍵也用得極少,故規(guī)定草(cao)、手(shou)首音不取其拼音的第一個字母,而取其拼音的第一個韻母,即分別取a、o,水(shui)的首音取其韻母的諧音v,木(mu)不取m而取其相鄰的鼻音n;d)h容錯f,即h,f分不清時,可按f輸入。同時還可加入其它易錯字的字音容錯。在作了以上規(guī)定后,漢字首音即可由通用英文鍵盤的對應(yīng)鍵輸入。
本漢字輸入系統(tǒng)分部規(guī)則與一般不同,它是將每字一分為二成為兩部(單筆字視為兩部相同),分部時有成字優(yōu)先,首部取小的規(guī)則(或規(guī)定首部取大),即a)分成一畫一字優(yōu)先,若不唯一,首部取小(大);b)分成兩字次之,若不唯一,首部取小(大);c)分成一字再次之,若不唯一,首部成字優(yōu)先(或規(guī)定末部成字優(yōu)先);d)實在不能成字,則分成末筆(或末部)加余部。
本漢字輸入系統(tǒng)由部取碼的規(guī)則為a)部若為字,且不避同,即取其“首音”為碼;b)部若為畫,取畫號為碼,畫號規(guī)定如下橫(提)1、豎2、撇3、捺(點)4,折彎鉤以收筆筆勢為準(zhǔn),順時針為5,逆時針為6,豎鉤視為豎,橫鉤視為橫;c)部不成字,亦不為畫,則可將其視為一新字,按照同樣的規(guī)則再將其一分為二,成為兩子部,然后從兩子部中選取一碼。選碼時的規(guī)則為首部首碼,末部末碼,即若兩子部同為字或同為畫,則首部以子首部為碼,末部以子末部為碼;字碼優(yōu)先,即若兩子部中只有一部成字,另一部不成字或僅為畫,這時即以該字為碼,子部拆分若不唯一,則首部以子首部成字優(yōu)先,末部以子末部成字優(yōu)先;若兩子部皆不能成字,亦不同時為畫,則可再將子部視為新字,重復(fù)以上步驟,再次將其一分為二,并按以下規(guī)則取碼首部從子首部中取碼,末部從子末部中取碼;字碼優(yōu)先,即若有關(guān)子部最終只能取得畫碼,這時則需從另一子部取碼,除非另一子部也只能取畫碼。
取字形碼離不開拆字,拆字最后總會遇到不能讀音的部或字根。本發(fā)明中,部不成字時的取碼規(guī)則,特別是從子部選碼時的字碼優(yōu)先規(guī)則,它引入了一種機制,能按照嚴(yán)格的步驟,自動地剔除那些不受歡迎的字根或多余的筆畫,從而巧妙的解決了不能讀音的部或字根的
其中不能讀音的部和字根或被自動舍去,或被分解。
下面是兩種漢字編碼方法、三個字(詞)庫設(shè)計及相關(guān)的鍵盤設(shè)計的詳細(xì)內(nèi)容。一、第一漢字編碼方法及其鍵盤設(shè)計1、編碼基本規(guī)則1)每字三碼1、2、3。
a)碼1為字音碼,恒取字的“首音”。
b)碼2、碼3為部碼。本編碼法中,凡字皆一分為二,成為兩部,包含首筆的稱首部,余下的稱末部(單筆字視為兩部相同)。每部各取一碼,依次為碼2、碼3。
c)部碼的取碼規(guī)則是部若成字(部首視為字,單筆字視為畫),且不避同(見5),即取字的“首音”為碼;部若為畫,取畫號為碼;部不成字亦不為畫,則可將該部視為一新字,按照字的分部規(guī)則再將其一分為二,成為兩子部,然后按規(guī)則4)從兩子部中選取一碼。
2)本編碼法設(shè)有一級簡碼和二級簡碼,編碼規(guī)則不變,只是在輸入第一,或第一、第二碼后,有關(guān)字便出現(xiàn)在提示行上,按空格鍵即可輸入。2、“首音”與鍵盤設(shè)計1)首音字的首音一般規(guī)定為其漢語拼音的第一個拉丁字母,不分卷舌,zh ch sh與z c s同,且有以下規(guī)定a)分y以y打頭的字,按以下情況,首音分別取i、u、y。
因yi為i,故規(guī)定以yi打頭的字,首音取[i],有yi(衣),yin(因),ying(英)因yu為,故規(guī)定以yu打頭的字,首音取[u],有yu(于),yuan(元),yue(月),yun(云)其余以y打頭的字首音仍然取[y]。
b)n改l因n、l難分,故規(guī)定以n、l打頭的字首音一律取[l]。
c)草、木、水、手四大部首改音
d)h容錯fh、f分不清時,可按f輸入。2)畫號畫號規(guī)定如下橫(提)1、豎2、撇3、捺(點)4,折彎鉤以收筆筆勢為準(zhǔn),順時針為5,逆時針為6,豎(左)鉤視為豎,橫鉤視為橫。畫號可按″
″(nic)的書寫筆順記憶,其中折彎鉤也可按數(shù)字5,6的書寫筆勢記憶。例好=女 子=hlz 胡=古 月=hgu 李=木 子=Inz江=氵 工=jvg 撥=扌 發(fā)=bof 繭=艸 蟲=jac九=J36丸=WJ4于=uls賣=mtt壬=r3l大=dlr*首音與畫號可由通用英文數(shù)字鍵盤輸入。漢字第一碼可取v、n之外的24個英文字母,占5位二進(jìn)制數(shù);第二碼可取26個英文字母和123456六個數(shù)字,共32個代碼,亦占5位二進(jìn)制數(shù);第三碼可取26個英文字母和1234569七個數(shù)字,共33個代碼,占6位二進(jìn)制數(shù),因此,每個漢字的三個編碼,共占16位二進(jìn)制數(shù),可壓縮為兩個字節(jié)。這樣,在字母之外加入數(shù)字鍵,既方便編碼,又可增加容字量,減少重碼,且不增加內(nèi)存占用。
*由于一級和二級簡碼皆為無重碼輸入,所以編碼中的數(shù)字鍵不會誤解為選碼序號。3、分部規(guī)則除宏觀大部和筆順連續(xù)兩條普遍原則外,分部的主要規(guī)則是一分為二,成字優(yōu)先,首部取小。
1)宏觀大部原則許多字宏觀看去,自然地被分為兩大部分,編碼時即順其自然分部。自然兩部字有以下類型上下型如息筑前落典左右型好韻福滿內(nèi)外型兇逝建外內(nèi)型國醫(yī)可褒栽中穿型部首八從北口曰四彐等字被另一字從中穿過。
如半夾坐乘束申柬秉2)筆順連續(xù)原則a)分部時,每部應(yīng)按筆順連續(xù)書寫,
b)外內(nèi)型字,外部視為一次寫成,故以下字兩部均視為連續(xù)
c)中穿型字,只要另一部也成字,中穿字即視為一次寫成,故以下字兩部均視為連續(xù)如 乘=禾北 夾=夫八d)個別字明顯由一畫一字組成,雖不合筆順連續(xù)原則,本編碼法亦以容錯方式允許按一畫一字編碼輸入,同時也可按嚴(yán)格規(guī)則分部編碼。如必=b44=bx3 止=zb1=zs2 龍=ly4=ly33)分部規(guī)則一分為二,成字優(yōu)先,首部取小(也可規(guī)定取大)a)分成一畫一字優(yōu)先,若不唯一,則首部取小(大)。
b)分成兩字次之,若不唯一,首部取小(大)。
c)能成一字再次之(單筆字視為畫!),若不唯一,首部成字優(yōu)先。不論哪部成字,成字后都應(yīng)盡量取大。
d)實在不能成字,則取末筆(或末部)加余部。
4、部不成字或畫時的取碼規(guī)則部不成字亦不為畫,這時,可將該部視為一新字,再將其一分為二成為兩子部。分部規(guī)則與前相同。最后只需從兩子部中選取一碼作為部碼。選碼時有以下規(guī)則1)首部首碼,末部末碼。
若兩子部同為字或同為畫,則首部以子首碼為碼,末部以子末部為碼。如
2)見字取碼。若兩子部中只有一部成字,另一部不成字或僅為畫,這時即以該字為碼。若不唯一,則首部以子首部成字優(yōu)先,末部以子末(這是唯一與字的分部不同的地方!)部成字優(yōu)先。
3)若兩子部皆不成字,亦不同時為畫,則可再將子部視為一新字,并按前述相同規(guī)則再次分部并取一碼。這時有以下規(guī)則a)首部從子首部取碼,末部從子末部取碼。如
b)字碼優(yōu)先。若一子部最終只能取得畫碼,這時則需從另一子部取碼,除非另一部也只能取畫碼。
4)若一字中不包含任何字或部首,那么按照以上規(guī)則,最后結(jié)果將是首碼取首筆,末碼取末筆。
如 書=s54 女=l61 母=m61或母=m6v5、避同1)避同音取碼的部不得與原字同音。僅四聲不同才視為同音。
2)避同字第二碼不得與第一碼為同一字。
如 班=王(刀王)≠bww3)避同方法a)拆分避同拆分時,在保證取碼的情況下,優(yōu)先避同。
如 單=八(日十)≠八(旦|)b)棄同取碼時,拋棄同音或同字部分。腑拆同若不能棄同,則需將其視為不能成字的部,進(jìn)一步拆分,并按部不成字時的取碼規(guī)則取碼。
4)以下情況,不必避同a)已改音的四大部首草、木、水、手不避同;如 草=艸早=caz 模=mndb)不能獨立成字的部首(筆畫雖已變形,但畫號未變的部首,視為與原字相同,如
等被認(rèn)為可以獨立成字,需得避同),如
等,永不拆分,不能棄同時不必避同。如
5)避同只避一次,如毖=比必=(匕匕)必=bbb6、重疊字編碼規(guī)則無論兩重還是三重,第二碼取重字首音,第三碼取9,借重九之意,容易記住。
如 炎=yh9 多=dx9 比=bb9 森=sn9 磊=rs97、詞組編碼規(guī)則以A B C…X…Z代表詞組,以X1 X2 X3依次代表字X的三個編碼,則二字詞的編碼為A1B1B2三字詞的編碼A1B1C1或A1B1C1C2多字詞的編碼A1B1C1Z1如果字x是按第一種編碼方法編碼,以上即為按第一種編碼法編碼的詞組,如果字x是按第二種編碼方法編碼,以上即為按第二種編碼法編碼的詞組。8、部首表與一般編碼法中的字根不同,本編碼法中的部首與字等同。它可多可少,可有可無,引入它只是為了編碼的方便,并不要求由它覆蓋或組成所需的漢字。本專利的實現(xiàn)方式之一是采用以下部首表。它基本上是按字典上通用的名稱統(tǒng)一取首音編碼。個別名稱有所改動,個別內(nèi)容有所擴充。
部首表編碼 部首名 部首 及其 變形 例字
注1)在部中日、曰皆作日;土、士皆作土;未、末皆作未;已、己、已皆作已。
2)不能獨立成字的部首在字中作為一個整體存在,不再拆分。
3)部成字時,除了表中所列的部首外,一般僅以一級字庫的常用字為準(zhǔn)。若部為二級字庫的罕見字,則不當(dāng)成字,需進(jìn)一步拆分。
如 桓=hnd≠hng(亙gen) 駁=bmi≠bmy(爻yao)4)標(biāo)有!號的部首需注意,它們或者是偏僻字,或者是沒有統(tǒng)一的稱謂,個別是本編碼法的規(guī)定或擴充。二、第二漢字編碼方法本編碼法是一個完整的漢字編碼方法,可獨立使用。其優(yōu)點是能對不會讀音的漢字進(jìn)行編碼輸入。此編碼法中,每字仍為三碼,可設(shè)一級簡碼和二級簡碼。詞組的編碼規(guī)則與第一編碼法同,只需將其中字的編碼用新的編碼代替即可。本編碼法的基本規(guī)則是首先將字一分為二,成為兩部,然后根據(jù)情況從其中一部取一碼,從另一部取兩碼。取一碼時,規(guī)則與第一編碼法中部的取碼規(guī)則相同;取兩碼時,只需將該部視為一字,并將其一分為二,然后取其兩個部碼即可。三碼的排列次序與它們在原字中的次序相同。因為第一碼不能為數(shù)字,否則將被誤解為重碼選擇序號,所以規(guī)定,當(dāng)?shù)谝淮a為數(shù)字時,應(yīng)以字母p(配)代替[或規(guī)定以d(代)、或分別以其右下方的字母鍵代替]。剩下的問題只是確定究竟哪一部取一碼,哪一部取兩碼。
總的原則是拆分最少,若不唯一,一(首)部一碼,二(末)部二碼。
具體有以下規(guī)則1)以下情況,優(yōu)先取一碼,其余兩碼從余部產(chǎn)生。
a)單畫優(yōu)先。即部為單畫時,優(yōu)先取一碼,若兩部皆為單畫,則首部一碼,末部兩碼。(注意首碼為畫號時需用字母鍵代替)
b)不能獨立成字的部首優(yōu)先。如
等,可直接取碼,不再拆分。(筆畫雖已變形,但畫號未變的部首,視為與原字相同,并被認(rèn)為能夠獨立成字,可以拆分,
例 倭=rhl 倩=rqu 儇=rsi 茺=auc 夙=jlx梔=ace 蹯=zmt2)能一次拆分為兩碼的部優(yōu)先取兩碼,余下一碼從余部產(chǎn)生。若兩部皆能一次拆分為兩碼,則已成字的部取一碼,不成字的部取兩碼;若兩部皆已成字或皆不成字,則首部取一碼,末部兩碼。
如 殫=qxd 殄=qxr 頎=cdy 歿=djy觥=dyg 靚=qme 靖=lqu 觜=zbj3)若兩部皆不能一次拆分為兩碼,則成字的部先取一碼,不成字的部取兩碼;若兩部皆成字或皆不成字,則首部一碼,末部兩碼。
如 嬖=b61三、字(詞)庫及鍵盤特殊功能設(shè)計本(第一)編碼法三碼容字量等于24*32*33=25344[只取字母,不取數(shù)字,三碼容字量僅為26*26*26=17576],加上24個一級簡碼,24*32=768個二級簡碼,總?cè)葑至繛?6136。一級字庫只有3755個字,二級字庫有3008個字,兩級字庫總共只有6763個漢字,加上容錯碼,也只有7000字左右。所以,本編碼法重碼極少,剩余空間很大。但由于字碼分布不均,重碼在所難免。為了進(jìn)一步減少重碼,以利高速盲打,并能同時輸入不會讀音的漢字和詞組,特發(fā)明了以下字庫設(shè)計和查找方法1)將字詞分三庫安放。
首先將兩級字庫分開。因為一萬個字中平均只有一字在二級字庫,所以,去掉二級字庫,實際并不影響漢字輸入。若將兩庫混裝,除徒增重碼外,別無好處。為了不使二級字庫干擾一級字庫常用字的輸入,所以本發(fā)明特將字詞分三庫安放。庫1安放一級字庫的字以及部分三碼詞組。選詞的原則,首先是填空,即不與字爭碼;二是高頻優(yōu)先,不要重碼詞;若仍有空位,則再填入二級字庫有關(guān)的字。在一級字庫的基楚上如此填入詞組和二級字庫的部分字,絲毫不會引響一級字庫字的輸入,且詞和所填入的二級字庫的字皆無重碼,這有利字詞的高速盲打。庫2安放二級字庫的字,沒有詞組。庫3安放剩下的三碼詞組及全部四碼詞組。庫1的一級、二級簡碼為無重碼輸入,庫2、庫3無一級簡碼和二級簡碼。一級字庫的字按第一編碼法編碼,少數(shù)難認(rèn)的字同時按兩種編碼裝入,二級字庫的字全部按兩種編碼裝入,但首碼為v(氵)、n(木)時,需將其輪換調(diào)至第三(或第二)碼。
2)v、n鍵的特殊查庫功能設(shè)計實際上,在輸入時,人們不必知道所需字、詞究竟在哪個庫中,也不必告訴計算機你是按照哪種編碼輸入。當(dāng)三碼輸完后,計算機首先在庫一查找。若未找著,則予報警,告知輸入為錯碼。因為庫一沒有,庫二、庫三也不會有此字詞,若有,它們早已填入庫一中對應(yīng)的空位。如果找到,但不是所需的字,則可按v,這時,計算機首先消去屏上剛輸入的字詞,然后轉(zhuǎn)入庫二查找;如果找到的不是所需的詞,則可按n,這時,計算機亦先消去已輸入的字詞,然后轉(zhuǎn)入庫三查找。因為字、詞第一碼不取v、n,所以,三碼輸完后再輸入n、v不會被誤解為是下一字詞的第一碼。若要輸入四碼詞,可先輸入前三碼,然后按v,再輸入第四碼。
本發(fā)明中字(詞)庫的這種組織方式和v、n鍵的這種特殊功能設(shè)計,使得本輸入系統(tǒng)既可按第一種漢字編碼方法輸入會讀音的漢字,又可按第二種漢字編碼方法輸入不會讀音的漢字;既可輸入單個漢字,又可輸入詞組;既不需要切換,又不會互相重碼,互相干擾。
本發(fā)明的主要優(yōu)點(除第6條外,所有舉例皆為第一種編碼方法)1、本漢字輸入系統(tǒng)不需切換,即可同時使用兩種漢字編碼方法輸入,一種可輸入會讀音的漢字,一種可以輸入不會讀音的漢字,并可同時輸入詞組,且互不干擾。
2、本發(fā)明的編碼方法只取首音和畫號,故可見字(畫)取碼,不必記字根、鍵位。且因分部、取碼規(guī)則統(tǒng)一,順理成章,簡明自然,合乎習(xí)慣,故一說即會,易學(xué)難忘。
3、“首音”及鍵盤規(guī)定簡單易記“首音”中,n改l、分y、四大部首改音、h容f的,發(fā)自自然,簡單易記,既可使鍵頻分布合理,減少重碼,又能一說即會,會后不忘,克服了一般編碼法音難準(zhǔn)、鍵難記的缺點,解決了易學(xué)性與重碼率的矛盾。
4、本發(fā)明中一分為二,成字優(yōu)先的分部規(guī)則解決了字難拆的難題。
本發(fā)明分部的基本規(guī)則是一分為二,成字優(yōu)先。將字一分為二,可使拆分規(guī)則簡化,少生歧意;每字都分為兩部,則避免了將連體字“一鍋煮”,只取筆畫,造成大量重碼的缺點;成字優(yōu)先的原則,則在拆分時即已考慮了以后編碼的方便,使拆分和編碼有機地結(jié)合在一起。如朱=z3w 未=wln 容=rbg
5、本發(fā)明中,部不成字時的取碼規(guī)則,解決了如何處理不能讀音的部或字根的難題。
取字形碼離不開拆字,拆字最后總會遇到不能讀音的部或字根。如何處理不能讀音的部或字根是漢字編碼的一個難題。有的編碼方法,如王碼、首尾碼等是將所需基本字根列出并為其分配鍵位,這樣必然導(dǎo)致鍵難記的缺點;有的編碼方法則將這類部或字根“一鍋煮”,直接取其筆畫,結(jié)果造成大量重碼。
本發(fā)明中,部不成字時的處理方法,是將該部視為一新字,按照同樣的規(guī)則再將其一分為二,成為兩子部,然后從兩子部中選取一碼,選碼時特別有字碼優(yōu)先的規(guī)則。首先,這種處理方法可避免引入新的規(guī)則(如定義內(nèi)含字等,一般規(guī)則復(fù)雜,操作困難,易生歧意)增加學(xué)習(xí)難度;而從子部選碼時的字碼優(yōu)先規(guī)則,實際上是引入了一種機制,它能按照嚴(yán)格的步驟,自動地剔除那些“不受歡”迎的字根或多余的筆畫,從而巧妙的解決了不能讀音的部或字根的取碼難題。
其中不能讀音的部和字根或被自動舍去,或被分解。由此可以看出本發(fā)明與已有形碼或音形碼,如王碼、自然碼、首尾碼、三聲碼等本質(zhì)不同的地方。
6、本編碼法制定了嚴(yán)格的避同規(guī)則,有效地抑制了重碼的產(chǎn)生。
漢語多形聲字,對這些字取首音為碼,若不避同,三碼實際變?yōu)閮纱a,減少了信息量,由此必然產(chǎn)生大量重碼。本編碼法制定了嚴(yán)格的避同規(guī)則,有效地抑制了重碼的產(chǎn)生。如吩、咐、啡若不避同音,其編碼皆為fkf,避同音后,吩=fkd 咐=fkc 啡=fk3;同樣,瓣、辨、辯、辮 若不避同字,其碼皆為bxx,避同字后則有 瓣=bxg辨=bxd 辯=bxy 辮=bxs,其編碼全都不同。
7、本發(fā)明中的第二種漢字編碼方法可以輸入不會讀音的漢字,由于它分部、取碼的基本規(guī)則與第一種編碼法相同,所以并不需要另起爐灶,從頭學(xué)起。主要記住一部取一碼,另一部取兩碼即可。究竟哪一部取一碼,哪一部取兩碼,規(guī)則貌似復(fù)雜,實際上是“視方便行事”,同等“方便”的條件下,則首部取一碼,末部兩碼。所以,雖有嚴(yán)格的規(guī)則,但因其順乎自然,故幾乎可以“無師自通”,不看規(guī)則,即可取碼。如部=lke 袼=iwk 穸=bbx 窶=xml 醅=ylk然=uqh 聵=ezb 解=jdl 福=skt 怕=x3r避=sxz 都=tre 編=sfa 分=b53 稿=hwk附圖及圖面說明
圖1是本發(fā)明的鍵盤設(shè)計圖。它是通用英文數(shù)字鍵盤,其中字母鍵代表對應(yīng)的漢語拼音字母,但z、c、s、l同時代表zh、ch、sh、n;u代表yu,i代表yi,a、o除代表原韻母外,還分別代表草部和手部,v、n除代表水部、木部外還有查字和查詞功能。
權(quán)利要求
1.一種漢字輸入系統(tǒng),其特征在于是由兩種漢字編碼方法、三個字(詞)庫設(shè)計及相關(guān)的鍵盤功能設(shè)計三個部分組成,兩種漢字編碼方法的一種可以輸入會讀音的漢字,一種則可輸入不會讀音的漢字;三個字(詞)庫設(shè)計為庫1安放一級字庫的字,并按第一種漢字編碼方法編碼,少數(shù)難認(rèn)的字可以同時按兩種編碼裝入,然后以填空的方式按高頻優(yōu)先的原則無重碼地依次加入部分三碼詞和四碼詞的前三碼以及二級字庫的部分字,庫2安放二級字庫的字,同時按照兩種編碼方法編碼裝入,庫3安放剩下的全部三碼詞和四碼詞,一般按第一種漢字編碼方法編碼裝入。
2.根據(jù)權(quán)利要求1所述的漢字輸入系統(tǒng),其特征在于兩種漢字編碼方法有相同的“首音”及鍵盤設(shè)計,相同的分部規(guī)則和相同的由部取碼的規(guī)則,其中,第一種漢字編碼方法是先將字一分為二,成為兩部,然后每部各取一碼,加上字音碼,總共三碼,字音碼可放在兩部碼之前,也可放在兩部碼之后,字音碼恒取字的“首音”,但需避同;第二種漢字編碼方法也是先將字一分為二,成為兩部,然后根據(jù)不同情況從其中的一部取一碼,從另一部取兩碼,取一碼時,是按由部取碼的規(guī)則直接取碼,取兩碼時,則是將該部視為一新字,并將其一分為二,成為兩子部,然后每子部各取一碼;兩種漢字編碼方法都可單獨使用,這時,它們就成為兩個獨立的漢字編碼輸入系統(tǒng)。
3.根據(jù)權(quán)利要求1、2所述的漢字輸入系統(tǒng),其特征在于“首音”及鍵盤設(shè)計,“首音”除一般規(guī)定為漢語拼音的第一個拉丁字母外,還有以下規(guī)定a)n改1,即以n打頭的字,首音取1;b)分y即以yu打頭的字,首音取u,以yi打頭的字,首音取i,其余以y打頭的字,首音仍然取y;c)四大部首改音,即草、木、水、手四個部首的首音分別取a、n、v、o;d)h容錯f,即h,f分不清時,可按f輸入,同時還可加入其它易錯字的字音容錯,在作了以上規(guī)定后,漢字首音即可由通用英文鍵盤的對應(yīng)鍵輸入。
4.根據(jù)權(quán)利要求1、2、3所述的漢字輸入系統(tǒng),其特征在于可按地方音、或日、韓音等規(guī)定“首音”,這時,本漢字輸入系統(tǒng)即成為地方語或日、韓語及其它拼形語的字輸入系統(tǒng)。
5.根據(jù)權(quán)利要求1、2所述的漢字輸入系統(tǒng),其特征在于分部規(guī)則是將字一分為二成為兩部,并有成字優(yōu)先,首部取小的規(guī)定(或規(guī)定首部取大)。
6.根據(jù)權(quán)利要求1、2所述的漢字輸入系統(tǒng),其特征在于由部取碼的規(guī)則是a)部若為字,且不避同,即取其“首音”為碼;b)部若為畫,取畫號為碼,畫號規(guī)定如下橫(提)1、豎2、撇3、捺(點)4,折彎鉤以收筆筆勢為準(zhǔn),順時針為5,逆時針為6;c)部不成字,亦不為畫,則可將其視為一新字,按照同樣規(guī)則再將其一分為二,成為兩子部,然后從兩子部中選取一碼,選碼時有首部首碼,末部末碼、字碼優(yōu)先的規(guī)則,若兩子部皆不成字,亦不同時為畫,則可再將子部視為新字,重復(fù)以上步驟再次將其一分為二并從中取其一碼。
全文摘要
本發(fā)明公開了一種漢字輸入系統(tǒng),它包含兩種新的漢字編碼輸入方法,一種可輸入會讀音的漢字,一種則可輸入不會讀音的漢字。通過特殊的字(詞)庫和鍵盤功能設(shè)計,不需切換輸入方式,即可同時以兩種編碼輸入,且可同時輸入字、詞而互不干擾。編碼法的要點是按照成字優(yōu)先的原則,將字一分為二成為兩部,每部可取一碼;不能取碼時可再將其一分為二,配合獨特的“首音”及鍵盤設(shè)計,克服了一般編碼法音難準(zhǔn)、鍵難記、字難拆和重碼多的缺點。
文檔編號G06F3/023GK1206137SQ9611741
公開日1999年1月27日 申請日期1996年1月17日 優(yōu)先權(quán)日1996年1月17日
發(fā)明者鄒鵬程, 劉大鳳 申請人:鄒鵬程