專利名稱:聲碼輸入法及其編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及了漢字的計(jì)算機(jī)編碼及輸入法,尤其是采用漢字或部首名稱首字拼音首字母輸入漢字的方法。
盡管社會(huì)上出現(xiàn)了許多種漢字輸入法,包括專業(yè)型五筆輸入法,以及適合大眾的聲形結(jié)合的輸入法,但絕大部分不僅學(xué)習(xí)起來難度大,記憶的東西太多,而且對(duì)漢字拆分也不符合漢字的讀寫與認(rèn)字習(xí)慣,給漢字的拆分帶來了極大的不便。盡管漢字的重碼少了,但影響了漢字的輸入速度。
鑒于此,本發(fā)明的目的在于提供一種簡(jiǎn)便易學(xué)、重碼適中、記憶量小、編碼規(guī)律,收錄字詞完備,拆分漢字容易,更符合漢字的讀寫與檢部規(guī)律的漢字輸入方法。
一、聲碼的基本名稱1.聲碼依一定規(guī)則將漢字拆分成若干字元(包括部首、字、非字筆劃),并以其名稱首字拼音首字母,即音元組合成編碼進(jìn)行漢字輸入的方法。
2.字元用以拆分表示漢字結(jié)構(gòu)的元素。
3.聲元(音元)即某字元名稱的首字拼音首字母。如“宀”寶蓋頭bao聲元為“B”?!疤铩弊x音為“TIAN”,音元為“T”。
4.非字筆劃在漢字拆分中,某部分既不成字,又不作部首,如“亠、饣”。
5.非字筆劃組多于兩筆以上的非字筆劃,如“屮、饣”等。用“A”表示。
6.特征字元在漢字拆分中,最接近末字元或?yàn)槟┳衷旧?,此字元不為?guī)定部首或規(guī)定部首字的字元或全為部首時(shí)為末字元。
7.再生字元某字元末筆相連的最大字,或無末筆連字取首筆相連的最大字(原字元除外)。如放(方,攵)特征字元為方; 再生字元為(萬(wàn)W)。
狠(犭,艮)特征字元為艮; 再生字元為(彐E)。
8.復(fù)字至少由兩個(gè)部分構(gòu)成的字或由一部分構(gòu)成且可拆為多字的字。如“古、忠、奉、留、非、以、爾、欠、朝、早、想、間、包”等。
9.非復(fù)字由一個(gè)部分或由幾個(gè)相分的單筆構(gòu)成的字。如“二、三、七等。
二、聲碼字元的構(gòu)成部分1.基本筆劃表
注“\,丶”與撇或折撇同時(shí)出現(xiàn)稱“捺”;如“未、木、久”等。否則稱為“點(diǎn)”。如“心、冬”等。“一”在單字中作筆劃稱“橫H”。
2.部首部分
注“二、三、五、六、七、八、九、十”也作為部首處理。
3.生僻字簡(jiǎn)表(只收錄部分)
注孑、孓在復(fù)體字中同“子”。單字中分別讀“JIE、JUE”三、漢字的拆分。
(一)、非復(fù)字拆法1.去第一筆劃或末筆劃有再生字元。(優(yōu)先去第一筆,再去末筆的順序)編碼為整字聲元+再生字元聲元如“方”再生字元為“萬(wàn)”編碼為FW“土”去末筆再生字元“十”編碼為TS2.去多筆有再生字元。(再生字元與首筆或末筆劃相連,第四碼一般不加)編碼為整字聲元+再生字聲元+“U”+末筆劃聲元如“石”再生字元“口”編碼為sku“艮”再生字元“彐”編碼為geun3.可拆成多字的,基本上遵照漢字書寫順序。個(gè)別兼顧直觀,其中單筆要丟棄。編碼為整字聲元+拆出各字聲元排列如“擊”(二,山)編碼為jes“夷”(一,弓,人)編碼為YGR
4.拆不出字的非復(fù)字。如五、無、七、二、兒(一級(jí)簡(jiǎn)碼除外)編碼為整字聲元+整字末筆劃聲元+補(bǔ)碼補(bǔ)碼要看字的末筆與其它筆劃的關(guān)系而定,補(bǔ)碼關(guān)系有分fen(末筆與其它筆劃相分)如八;拆為“八;捺;分”編碼為bnf交jiao(末筆與其它筆劃相交)如九;拆為“九;乙;交”編碼為jij包bao(末筆與其它筆劃相包)如寸;拆為“寸;丶;包”編碼為cdb重chong(末筆與其它筆劃相重)如乙;拆為“乙;乚;重”編碼為yic連lian(末筆與其它筆劃相連)如人;拆為“人;捺;丿”編碼為rnp注單筆劃相包含判斷方法為在內(nèi)為包(勺),在外為分(弋)。
其中相連關(guān)系時(shí)要打第一筆劃的聲元,而不打“L”。
(二)、復(fù)字拆分(至少有兩個(gè)非字筆劃組構(gòu)成或一部分且可拆出多字的字)1、拆分方法。
(1)、確定字型,依字型中相分關(guān)系或兼顧直觀將字拆分成若干部分塊(可有部首或字、非字筆劃組、單雙筆。)如“型”拆為(開;刂;土)“估”拆為(亻;古)(2)、判別部分塊類型分別處理。
1.部首、部首字確定為字元。如“估”中“亻”為部首確定為字元。
2.一般字若此字仍可以相連關(guān)系拆成多個(gè)字,(兩個(gè)字為多),可含部首、非字筆劃組,則拆為多字。如“愫”中“素”拆為(非字部分;幺;小)3.非字筆劃組,兼顧直觀??刹鸲嘧謺r(shí)拆,否則不拆。如“朝”中左部分拆為“十;日;十”①若相鄰兩部分塊都是非字筆劃組,且可組合成字,則優(yōu)先成字。如“非”在“悲”字中拆為“非;心;”編碼為FXS②若一個(gè)非字筆劃組在前與一個(gè)字在后可組合成字(可含單筆),則優(yōu)先成字。如“青”在“清”字中不拆。
③單筆或兩筆用第一筆聲元替代,兩筆劃以上非字筆劃組用“A”替代。如“京”拆為“亠;口;小”編碼為DKX “亠”用“D”表示?!棒W”拆為“镸;彡;宀;八”編碼為AOBB“镸”用“A”表示。
④單筆的運(yùn)用。
A、服從可歸不棄的原則,單筆劃若可歸于其它字則歸于其它字。如“得”字中“旦”在其右部分不拆,“一”單筆不棄。
B、單筆可棄原則。即多于四個(gè)字元時(shí)單筆劃要丟棄。如“愉”拆為“忄、人、一、月、刂”,“一”丟棄。編碼為XRVL2、復(fù)字編碼如爾、以、古、忠、留、渺、茫等。
(1)、雙字元型。首字元聲元+末字元聲元+補(bǔ)碼+次補(bǔ)碼(一般與整字含同聲元或首字元不是部首或此字不常用,加次補(bǔ)碼)(2)、三字元型。首字元聲元+次字元聲元+末字元聲元+補(bǔ)碼(一般與整字含同聲元或首字元不是部首或此字不常用,加補(bǔ)碼)(3)、三字元以上型。首字元聲元+次字元聲元+第三字元聲元+末字元聲元補(bǔ)碼與次補(bǔ)碼1.所有字元是規(guī)定的部首,且末字元無再生字元,此時(shí)看末字元與次末字元的關(guān)系取碼。關(guān)系有包含兩字元相包含如回;kkb 連接兩字元相連 如古;skl分開兩字元上下分如呂;kkf 旁邊兩字元左右分 如葉;ksp“補(bǔ)碼”為分F、連L、包B、旁P。“次補(bǔ)碼”為首字元的再生字元或無再生字元取首筆劃的聲元。
2.不全為部首?!把a(bǔ)碼”此時(shí)看特征字元是否有再生字元,有,補(bǔ)碼為再生字元的聲元;否則為特征字元的末筆劃聲元。如“放”特征字元為“方”,再生字元為“萬(wàn)”;補(bǔ)碼為“萬(wàn)W”“次補(bǔ)碼”(1)首字元不是規(guī)定部首“次補(bǔ)碼”為首字元的再生字元或無再生字元取其第一筆劃的聲元。如“放”編碼“FFWW”兩個(gè)W分別代表特征字元“方”的再生字元“萬(wàn)”?!皠ⅰ本幋a“WLND”N為特征字元末筆聲元,D為首字元的首筆聲元。
(2)首字元為規(guī)定的部首“次補(bǔ)碼”為特征字元的再生字元或無再生字元取其第一筆劃的聲元。如“證”編碼為“IZZH”,H代表特征字元的首筆劃聲元。!注當(dāng)詞組與單字發(fā)生重碼時(shí),此時(shí)單字取三碼。除非前三碼已有字占位。當(dāng)常用字與非常用字發(fā)生重碼時(shí),非常用字取全碼。
3、詞組編碼。注復(fù)字首字元與次字元的確定,基本上與單字拆法相同。非復(fù)字首字元為字本身,次字元為再生字元或無再生字元為末筆劃聲元。
①、雙字詞編碼。
首字前兩個(gè)字元聲元+次字前兩個(gè)字元聲元如中國(guó)(中;口;口;玉)ZKKY 結(jié)構(gòu)(纟;士;木;勾)JSPG②、三字詞組編碼。
前三字的首字元聲元+末字次字元聲元如結(jié)構(gòu)性(纟;木;忄;生)JPXS 圖書館(口;書;饣;宀)KSAB③、四字詞組或四字以上詞組。前三字首字元聲元+末字首字元聲元如中國(guó)人民解放軍(中;口;人;冖)ZKRB(4)、部首或特殊字符編碼。
①、部首編碼或部分非字筆劃組編碼或難檢字。部首聲元+VV+再生字元(末筆聲元)或非字筆劃組首筆聲元+VV+末筆聲元(再生字元)如纟 JVVH;冂 SVVI;②、特殊字符編碼。
A數(shù)字序號(hào);如1.、(一)、(1)、①、ii根據(jù)其特點(diǎn)編碼?!?.”含“.”點(diǎn)(D)?!?1)”含“()”括號(hào)(K)。“(一)”含“一”中文(Z)?!阿佟焙啊稹比?Q)。“ii”含“i”英文(Y)編碼為特點(diǎn)編碼+數(shù)字拼音前兩個(gè)字母+U如“5.”DWUU“(2)”ZERU“ii”YERUB拼音字母;如ā、ǒ、ē、ǖ(V)、ū等編碼為拼音字母+拼音聲調(diào)序次數(shù)字拼音前兩個(gè)字母+U如“ō”O(jiān)YIU“ǘ”VERU“ě”ESAUC萬(wàn)能碼(非標(biāo)準(zhǔn)碼)便于輸字。(只收錄部分難檢字)(1)、生僻字編碼,如毋、厶等。編碼除正常規(guī)定外可采用以下兩種規(guī)則。
①、生僻字聲母+UU+再生字元或末筆聲元②、字(首筆劃+次筆劃+末筆劃)聲元+字聲元(2)、兩部分構(gòu)成的字,第一部分為非字筆劃(收錄部分字)。如欠、爾。編碼為首字元聲元+次字元聲元+整字聲元如“旬”(勹;日;旬)PRX(3)、容錯(cuò)碼根據(jù)漢字拆分取舍不同或?qū)⑸ё肿鳛榉亲止P劃組產(chǎn)生一字多碼。如“真”拆為(十;具;八)SJB 或(直;八;十;十)ZBSS“快”拆為(忄;夬;大)XGD或XAD五、一級(jí)簡(jiǎn)碼(26個(gè))
權(quán)利要求
1.聲碼輸入法及其編碼,其特征在于以漢字或部首、筆劃的名稱首字的拼音的首字母(聲元)表碼,并以漢字中各部分相分的關(guān)系或把漢字拆分成以非復(fù)字(獨(dú)體字)、非字部分、筆劃為單位的字元,對(duì)其字元表碼組合進(jìn)行漢字編碼輸入的方法。
2.如權(quán)利要求1中所述,聲碼輸入法及其編碼其特征還在于漢字拆分中作為字元的非字部分,少于三筆劃的用其第一筆劃的聲元(音元)表碼,兩筆劃以上的非字筆劃組用字母“A”表碼的方法。
3.如權(quán)利要求1中所述,聲碼輸入法及其編碼的基本筆劃分為八種,其中“\,、”在不同位置稱謂不同,與撇或折撇同時(shí)出現(xiàn)稱為“捺”;否則稱為“點(diǎn)”。
4.如權(quán)利要求1中所述,聲碼輸入法及其編碼的基本字元為一些基本的、常用的漢字部首或字。共49個(gè)。
另外“二、三、五、六、七、八、九、十”也作為部首,表碼是其聲元(音元)。
5.聲碼輸入法及其編碼,其特征除權(quán)利要求1中所述外,最大的特征還在于聲碼的特征字元與再生字元,用以形成聲碼復(fù)字的識(shí)別碼。特征字元指除規(guī)定部首外最接近末字元的字元。再生字元為字元第一筆劃或末筆劃相連的除本字外的最大字。
6.聲碼輸入法及其編碼,如權(quán)利要求5中所述,用再生字元的聲元或無再生字元時(shí)用特征字元的末筆劃聲元形成聲碼復(fù)字的識(shí)別碼“補(bǔ)碼”;或當(dāng)所有字元都是部首時(shí),末字元又無再生字元時(shí),補(bǔ)碼視末字元與其它部首之間的關(guān)系而定。關(guān)系有“分F、連L、包B、交J”,形成補(bǔ)碼。
7.聲碼輸入法及其編碼,除前述特征外,非復(fù)字(獨(dú)體字)編碼其特征在于也運(yùn)用了再生字元,用本字的聲元與再生字元的聲元組合進(jìn)行編碼。非復(fù)字無再生字元的用字的聲元與末筆劃聲元與末筆劃與其它筆劃的關(guān)系表碼組合編碼,關(guān)系表碼有“分F、交J、旁P、包B”,當(dāng)關(guān)系相連時(shí)取字的第一筆劃聲元表碼。
8.聲碼輸入法及其編碼,另外一大特征在于對(duì)漢字以外的部分特殊字符也進(jìn)行了編碼。數(shù)字序號(hào),如1.、(一)、(1)、①、ii根據(jù)其特點(diǎn)表碼。“1.”特征“.”點(diǎn)(D)。“(1)”特征“( )”括號(hào)(K)。“(一)”特征“一”中文(Z)?!阿佟碧卣鳌啊稹比?Q)?!癷i”特征“i”英文(Y)編碼為特點(diǎn)表碼與數(shù)字拼音前兩個(gè)字母加字母“U”。拼音字母,如ā、ǒ、ē、ǖ(V)、ū等。編碼為拼音字母加拼音聲調(diào)序次數(shù)字拼音前兩個(gè)字母加字母“U”。
全文摘要
聲碼輸入法及其編碼發(fā)明涉及了漢字的計(jì)算機(jī)編碼及輸入法,編碼采用漢字或部首名稱首字拼音首字母(聲元)。其字元靈活、簡(jiǎn)便易學(xué)、重碼適中、記憶量極小、編碼規(guī)律,收錄字詞完備,拆分漢字容易,超強(qiáng)容錯(cuò),更符合漢字的讀寫與檢部規(guī)律。并收錄了部分特殊字符,其常用部首不足50個(gè),編碼采用26個(gè)英文字母,對(duì)中文排版錄入有極大優(yōu)越性。適宜于廣大非文盲人員使用,學(xué)習(xí)周期短,不易忘記,重在掌握方法,利用已有知識(shí)。
文檔編號(hào)G06F3/023GK1380595SQ0111065
公開日2002年11月20日 申請(qǐng)日期2001年4月16日 優(yōu)先權(quán)日2001年4月16日
發(fā)明者秦永久 申請(qǐng)人:秦永久