專利名稱:一種漢字編碼“音筆”碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種漢字編碼,特別是涉及用漢語(yǔ)拼音的第一個(gè)字母編碼的方法。
目前,漢字編碼的方法有許多種,拼音、五筆、快碼等。拼音重碼多,難區(qū)分平、翹舌音,輸入速度慢;五筆難記字根,需較長(zhǎng)時(shí)間的學(xué)習(xí)、記憶才能掌握;快碼仍要記字根。造成人們?cè)趯W(xué)習(xí)漢字錄入時(shí)花費(fèi)許多時(shí)間,死記硬背,時(shí)間長(zhǎng)了不用還容易忘掉。
針對(duì)上述不足之處,發(fā)明了一種漢字編碼“音筆”碼。編碼方法簡(jiǎn)單,編碼快,重碼少,不需背字根,若開發(fā)此軟件,學(xué)習(xí)時(shí)容易理解,幾分鐘就可以掌握編碼方法獨(dú)自輸入漢字。一個(gè)漢字最多輸入四碼就可上屏,許多高頻字只需二到三碼,輸入速度快,克服了上述不足之處。
一種漢字編碼“音筆”碼,包括了漢字的取碼過程,其方法是輸入的每個(gè)漢字最多取四碼,第一碼取本字字音首碼,共23個(gè);后三碼分拆字取碼和拆筆取碼拆字取碼是取拆的字、偏旁部首音首碼、無(wú)音偏旁部首或其它首筆代碼,按從左到右、從上到下、從外到里的結(jié)構(gòu)順序邊拆邊取碼;拆筆取碼是取字筆順代碼,按字筆順次序邊拆邊取碼;首筆代碼和字筆順代碼相同,共3個(gè)。
第一碼取本字字音首碼,即取被編碼的這個(gè)漢字拼音的第一個(gè)字母作該字的第一碼。漢語(yǔ)拼音音節(jié)的第一個(gè)字母共有A、B、C、D、E、F、G、H、J、K、L、M、N、O、P、Q、R、S、T、W、X、Y、Z 23個(gè),由于C、S、Z代表了CH、SH、ZH,因此不必區(qū)分漢字的翹舌音。如“沉”字的第一碼為C,“早”字為Z,“迷”字為M。
后三碼的拆字取碼是將被編碼的漢字按其結(jié)構(gòu)拆做幾部分,依次取碼。絕大多數(shù)漢字能拆為左右、上下、外內(nèi)等幾部分,各部分分為三種類型其一是字,其二是有名稱的偏旁部首,其三是無(wú)名稱的偏旁部首或其它,在依次取碼過程中,是字取該字拼音的第一個(gè)字母;是偏旁部首取其名稱拼音的第一個(gè)字母;是無(wú)名稱的偏旁部首或其它取首筆代碼。
對(duì)是字的這一部分,取該字拼音的第一個(gè)字母,即取拆字字音首碼。例左右結(jié)構(gòu)的“好”字,左為女,右為子,女、子都是字,按左右結(jié)構(gòu)順序取碼為NZ,加上第一碼H,好字的編碼為HNZ;“種”字左為禾,右為中,取碼為HZ,編碼為ZHZ,“碼”字編碼為MSM;上下結(jié)構(gòu)的“音”字,上為立,下為日,按上下結(jié)構(gòu)取碼為L(zhǎng)R,編碼為YLR,“王”字上為一,下為土,取碼為YT,編碼為WYT,“重”字編碼為CQL,“乖”字編碼為GQB;外內(nèi)結(jié)構(gòu)(含半包)的“鳳”字,外為幾,內(nèi)為又,按外內(nèi)結(jié)構(gòu)取碼為JY,編碼為FJY,“趟”字外為走,內(nèi)為尚,取碼為ZS,編碼為TZS,“啟”字編碼為QHK;左、右上下結(jié)構(gòu)的“碟”字,左為石,右上為世、右下為木,依次取碼為SSM,編碼為DSSM;左上下、右結(jié)構(gòu)的“叔”字,左上為上、左下為小,右為又,取碼為SXY,編碼為SSXY;上、下左右結(jié)構(gòu)的“品”字,取碼為KKK,編碼為PKKK;上左右、下結(jié)構(gòu)的“碧”字,取碼為WBS,編碼為BWBS,等。
對(duì)有名稱的偏旁部首,取該名稱拼音的第一個(gè)字母,即取拆字旁部音首碼。為減少重碼,便于記憶,軟件開發(fā)時(shí),可規(guī)定取某些偏旁部首名稱的第二個(gè)字音首碼為該偏旁的字音首碼,其余取第一個(gè)字音首碼為該偏旁的字音首碼。現(xiàn)列“部分漢字偏旁部首編碼表”如下
例左右結(jié)構(gòu)的“飼”字,左為旁部饣,右為司字,依次取碼為SS,編碼為SSS;“匯”字左右均為旁部,取碼為SK,編碼為HSK;上下結(jié)構(gòu)的“茄”字,上為旁部艸,下為加字,從上到下取碼CJ,編碼為QCJ,“寧”字上為旁部,下為丁字,取碼為BD,編碼為NBD;外內(nèi)結(jié)構(gòu)的“戌”字拆為戊與一字,依次取碼為WY,編碼為XWY,“回”字拆字取碼為KK,編碼為HKK。
對(duì)沒有名稱的偏旁部首(含一筆畫的部首)或其它不知道發(fā)音的某部分,取首筆代碼,用I、U、V三個(gè)代碼表示這部分凡是這部分首筆以豎起筆的用I碼表示,以橫起筆的用U碼表示,以斜起筆的(點(diǎn)、撇等)用V碼表示。即遇到無(wú)音旁部其,筆順代碼取首筆,筆畫分為三種類,豎橫斜取IUV。這種表示法,一是取字筆畫簡(jiǎn)單;二是不取豎橫斜筆畫的碼為SHX,意在降低大量重碼;三是合理應(yīng)用26個(gè)字母。例左右結(jié)構(gòu)的“彭”字,左部不發(fā)音,取該部首首筆代碼U(首筆以橫起筆),彡取S,加上第一碼P,彭字的編碼為PUS,“卵”字左右均不發(fā)音,依次取首筆代碼為VU,編碼為L(zhǎng)VU。“拜”字取碼為SU,編碼為BSU;上下結(jié)構(gòu)的“嗇”字,上部不發(fā)音,取首筆代碼為U,下部取回字字音首碼H,編碼為SUH,“共”字取碼為UB,編碼為GUB;外內(nèi)結(jié)構(gòu)的“島”字,取外部的首筆代碼為V,內(nèi)部的山字為S,編碼為DVS,“丸”字外部字九的字音首碼為J,內(nèi)部丶的首筆代碼為V,編碼為WJV。
后三碼的拆筆取碼是指對(duì)不能拆為字、偏旁、部首的少部分漢字,取字筆順代碼。字筆順代碼仍用I、U、V 3個(gè)表示,I、U、V分別表示以豎、橫、斜起筆的筆畫。拆筆取碼最多取前三筆畫的筆順代碼,不足三筆畫的字取碼不足四碼出現(xiàn)重碼,取最后一筆畫的代碼補(bǔ)足四碼。例“夕”字按筆順取碼為VUV,加上第一碼X,夕字的編碼為XVUV,“戈”字編碼為GUVV,“冊(cè)”字編碼為CVUV;“丁”字取碼為YI,若出現(xiàn)重碼,重取最后一碼I,補(bǔ)足四碼為DYII。
拆字取碼不足三碼,字碼不足四碼,出現(xiàn)重碼時(shí),再拆該字結(jié)構(gòu)的后一部分,拆法仍分拆字取碼和拆筆取碼,取二次拆后的第一部分的碼補(bǔ)足四碼。即不足四碼現(xiàn)重碼,再拆后部取首碼,取時(shí)注意后部碼,仍分拆字和拆筆。當(dāng)后部取的是音碼(字、旁部),取拆后第一部分(字、旁部、筆畫)的碼補(bǔ)足四碼。例前面提到的“控”字,編碼為KTK不足四碼,出現(xiàn)重碼,拆后一碼字空為穴與工,取第一部分字穴的拼音首碼X補(bǔ)足四碼為KTKX,“礦”字第一碼K,拆字取碼為SG,出現(xiàn)重碼,取廣字的第一部分丶的碼,丶是一筆畫部首,代碼為V,補(bǔ)足四碼為KSGV。當(dāng)后部取的是代碼(無(wú)音旁部或其它),取拆后第一部分(筆畫)的代碼補(bǔ)足四碼,代碼仍用I、U、V。例“雪”字的前三碼為XYU,彐部的首筆代碼已取為U,若出現(xiàn)重碼,接著取彐部拆后的第一部分即第二筆畫的代碼U,補(bǔ)足四碼,編碼為XYUU。當(dāng)該字結(jié)構(gòu)的后一部分只有一筆畫時(shí),仍用代碼I、U、V表示,方法同上述,取碼補(bǔ)足四碼。例且字取碼為DRY,若出現(xiàn)重碼,該字最后部分是一,一只有一畫,以橫起筆,取碼為U,補(bǔ)足四碼為DRYU。
拆字超過三部分,按結(jié)構(gòu)順序最多取前三部分的碼。例“器”字取前口口犬三碼KKQ,編碼為QKKQ。
拆字出現(xiàn)的多音字,取第一讀音為該字的字音首碼。例“翻”字拆為番和羽后,番為多音字,一讀為Fan,二讀為Pan,取第一讀音Fan中的F,為番字的字音首碼。
取足四碼出現(xiàn)重碼的少部分字,用阿拉伯?dāng)?shù)字選擇。
現(xiàn)以拼音編碼字母是K打頭的漢字,用“音筆”碼編碼,排列成表格,如第五頁(yè)所示。共206個(gè)字,重碼17個(gè)(三字重碼二碼,其余均為二字重碼),約占8%,重碼字19個(gè),約占9%,若用空格鍵選碼,基本上可消除重碼。二碼字3個(gè),約占1.5%,三碼字59個(gè),約占28%,四碼字108個(gè),約占52%。以上未包括一、二、三碼加空格鍵編碼的字,即一、二、三級(jí)簡(jiǎn)碼。若將其它22個(gè)拼音字母開頭的漢字編碼統(tǒng)計(jì),可得到如下結(jié)論“音筆”碼的重碼約占9%,重碼字約占10%,一、二、三碼字在30%左右,四碼字在51%左右??紤]簡(jiǎn)碼,重碼、重碼字還要進(jìn)一步降低。
本發(fā)明與現(xiàn)有技術(shù)比較,有益效果如下一是方法非常簡(jiǎn)單,容易掌握,具備識(shí)、拼漢字、偏旁,明白漢字結(jié)構(gòu)、筆順,掌握字旁音首碼(23個(gè))和字部筆順代碼(3個(gè)),不必背字根,不必記韻母,不分翹舌音,自學(xué)幾分鐘就能獨(dú)自輸入漢字。二是重碼少,高頻字二、三碼上屏,絕大部分字三、四碼上屏。開發(fā)“音筆”碼的軟件用于漢字錄入,具有廣泛的推廣價(jià)值。
說(shuō)明第一碼K略,第二碼大寫,三四碼小寫。
權(quán)利要求
1.一種漢字編碼“音筆”碼,包括了漢字的取碼過程,其特征是輸入的每個(gè)漢字最多取四碼,第一碼取本字字音首碼,共23個(gè);后三碼分拆字取碼和拆筆取碼拆字取碼是取拆的字、偏旁部首音首碼、無(wú)音偏旁部首或其它首筆代碼,按從左到右、從上到下、從外到里的結(jié)構(gòu)順序邊拆邊取碼;拆筆取碼是取字筆順代碼,按字筆順次序邊拆邊取碼;首筆代碼和字筆順代碼相同,共3個(gè)。
2.根據(jù)權(quán)利要求1所述的一種漢字編碼“音筆”碼,其特征是第一碼取本字字音首碼,即取被編碼的這個(gè)漢字拼音的第一個(gè)字母作該字的第一碼,漢語(yǔ)拼音音節(jié)的第一個(gè)字母共有A、B、C、D、E、F、G、H、J、K、L、M、N、O、P、Q、R、S、T、W、X、Y、Z 23個(gè)。
3.根據(jù)權(quán)利要求1所述的一種漢字編碼“音筆”碼,其特征是后三碼的拆字取碼是將被編碼的漢字按其結(jié)構(gòu)拆做幾部分,依次取碼,對(duì)能拆的漢字,依次按左右、上下、外內(nèi)等幾部分拆,拆下的各部分分為三種類型其一是字;其二是有名稱的偏旁部首;其三是無(wú)名稱的偏旁部首或其它,在依次取碼過程中,是字取該字拼音的第一個(gè)字母;是偏旁部首取其名稱拼音的第一個(gè)字母;是無(wú)名稱的偏旁部首或其它取首筆代碼。
4.根據(jù)權(quán)利要求1所述的一種漢字編碼“音筆”碼,其特征是后三碼的拆筆取碼是指對(duì)不能拆為字、偏旁、部首的少部分漢字,取字筆順代碼,最多取前三筆畫的筆順代碼,不足三筆畫的字取碼不足四碼出現(xiàn)重碼,取最后一筆畫的代碼補(bǔ)足四碼。
5.根據(jù)權(quán)利要求1所述的一種漢字編碼“音筆”碼,其特征是首筆代碼和字筆順代碼均用I、U、V 3個(gè),凡是以豎起筆的用I碼表示,以橫起筆的用U碼表示,以斜起筆的用V碼表示。
6.根據(jù)權(quán)利要求3所述的一種漢字編碼“音筆”碼,其特征是拆字取碼不足三碼,字碼不足四碼,出現(xiàn)重碼,再拆該字結(jié)構(gòu)的后一部分,拆法仍分拆字取碼和拆筆取碼,取二次拆后的第一部分的碼補(bǔ)足四碼。
全文摘要
一種用于漢字編碼的“音筆”碼,輸入的每個(gè)漢字最多取四碼。第一碼取本字字音首碼;后三碼分拆字取碼和拆筆取碼:拆字取碼是取拆字字、旁部音首碼、無(wú)音旁部或其它首筆代碼,按從左到右、從上到下、從外到里的,結(jié)構(gòu)順序邊拆邊取碼;拆筆取碼是取字筆順代碼,按字筆順次序邊拆邊取碼。使用時(shí)不背字根、記韻母、區(qū)分翹舌音,自學(xué)幾分鐘就能獨(dú)自輸入漢字。方法非常簡(jiǎn)單,編碼快,重碼少,具有廣泛的推廣價(jià)值。
文檔編號(hào)G06F3/023GK1195133SQ9810684
公開日1998年10月7日 申請(qǐng)日期1998年4月13日 優(yōu)先權(quán)日1998年4月13日
發(fā)明者徐根德 申請(qǐng)人:徐根德