專利名稱:漢字形音三位等長編碼的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及漢字的一種編碼。
國內(nèi)目前已有漢字編碼700余種,已在計算機上使用的漢字編碼也有100余種,包括常見的拼音碼、首尾碼、雙拼碼、五筆字型碼、五筆畫等。這些編碼均未能較好地同時解決漢字拆碼的簡易性、檢索或鍵入漢字的快速性以及編碼的易記易學(xué)三方面的矛盾。如拼音碼,雖簡單易學(xué),但使用起來檢索或漢字輸入速度都較慢;首尾碼、五筆字型碼等雖能實現(xiàn)計算機漢字快速輸入,但使用這些編碼漢字拆碼難,記憶規(guī)律差。其它各種編碼也存在上述這樣或那樣的缺陷。
本發(fā)明的目的在于提供一種既易學(xué)易記又能快速拆碼快速輸入或檢索,同時在鍵盤上無需標(biāo)設(shè)中文構(gòu)件(或偏旁)的漢字編碼。
本發(fā)明是這樣實現(xiàn)的,利用漢字構(gòu)件(或偏旁)與英文大寫或小寫字母之間的象形關(guān)系,用A-Z26個英文大寫或小寫字母首先來表示那些構(gòu)字量較多的漢字構(gòu)件(或偏旁),如用字母A作為钅、金、全、
等的象形碼;用字母O作為口、
、母等的象形碼。對少數(shù)漢字偏旁很難找到有象形關(guān)系的對應(yīng)英文字母。如氵、冫、灬、木等偏旁,則將該偏旁名的拼音首字母作為其拼音碼。如氵、冫、灬的偏旁名為水,則將水的拼音首字母S作為拼音碼,木偏旁的拼音首字母為M則將M(m)作為木的拼音碼。按這樣的規(guī)則便形成了漢字形音碼碼源表,由于漢字的構(gòu)件、偏旁很多,超過了280個,為簡單起見,對出現(xiàn)幾率較少的漢字構(gòu)件、偏旁采取了對照分配,即分配給其與其形似的占字量較多的構(gòu)件、偏旁的形音碼,如“
”按“兒”的形音碼分配,“禾”按“木”的形音碼分配。這類漢字構(gòu)件、偏旁已置于漢字形音碼碼源表中與其有對照分配關(guān)系的漢字構(gòu)件、偏旁之后并用括號括了起來。
按照本發(fā)明的漢字編碼,每個漢字均由三位碼元組成,每個漢字不論筆劃多少,都要首先拆為兩個構(gòu)件(或偏旁),包括最簡單的漢字“一”也不例外,然后依本發(fā)明的漢字形音碼碼源表,取該漢字的前二位碼,前二位碼可以是象形碼或是拼音碼或是兩者的混合,該漢字的第三位碼只取漢字的拼音首字母。取碼時是依照漢字字形按先左(上)后右(下)、先外后內(nèi),并優(yōu)先漢字構(gòu)件(或偏旁)筆劃多者的原則取碼。
例先左(上)后右(下)都 拆為土、阝,取碼tpd天拆為
,取碼fnt語 拆為讠、口,取碼ioy面 拆為丆、囗,取碼tom先外后內(nèi)國 拆為囗、王,取碼oeg圓 拆為囗、人,取碼ory幽 拆為凵、幺,取碼uwy繼拆為幺、
,取碼wlj筆畫多者優(yōu)先鑒 拆為刂、金而不是刂、王,取碼haj牛拆為丿、
而不是丿、十,取碼jfn吉 拆為士、口而不是十、口,取碼toj簡單字拆碼例一 拆為一、一,取碼iiy
火拆為丶、
,取碼dkh女 拆為乂、乂,取碼xxn豐拆為
、十,取碼fxf人拆為丿、
,取碼jnr本發(fā)明的漢字編碼與已有漢字編碼相比,具有可以見字識碼,易記易學(xué),檢索或鍵入漢字速度高,拆碼簡易等優(yōu)點,可以直接利用ASCⅡ鍵盤進行漢字輸入,無需在鍵盤上標(biāo)設(shè)漢字構(gòu)件或偏旁。由于采取三位等長碼,出錯幾率低,絕對重碼率僅為31.15%,最高絕對重碼字?jǐn)?shù)小于9個,無須翻頁檢找,可以實現(xiàn)計算機盲導(dǎo)快速輸入。該編碼也可擴展應(yīng)用于詞組。
本發(fā)明的漢字編碼主要為計算機漢字輸入而設(shè)計,已經(jīng)完成了其在操作系統(tǒng)水平上的軟件實現(xiàn),該編碼也可以用于字典檢索,并可提高檢索速度。由于編碼全部采用英文字母,也能提高英語國家漢字輸入人員的工作效率。
權(quán)利要求
1.一種通用的漢字形音三位等長編碼,其特征在于用英文大寫或小寫字母來表示漢字構(gòu)件(包括部分偏旁);碼源由象形碼(依漢字構(gòu)件與英文字母的象形關(guān)系構(gòu)成)及拼音碼(由少量漢字偏旁的拼音首字母構(gòu)成)組成;每一漢字拆為兩個構(gòu)件(或偏旁),由其象形碼或拼音碼或兩者混合構(gòu)成該漢字的前二位碼元,另加上該漢字的拼音首字母作為第三位碼元。
2.根據(jù)權(quán)利要求1所述的漢字編碼,其特征在于碼源與英文字母間具有下表所列的對應(yīng)關(guān)系(附文后)。
3.根據(jù)權(quán)利要求1所述的漢字編碼,其特征在于每個漢字無論筆劃多少,都要拆為二個構(gòu)件(或偏旁),然后對其取碼,包括最簡單的漢字“一”也不例外。
4.根據(jù)權(quán)利要求1所述的漢字編碼,其特征在于每個漢字前二位碼的取碼原則為先左(上)后右(下),先外后內(nèi),漢字構(gòu)件(或偏旁)筆劃多者優(yōu)先取碼,第三位碼只取該漢字的拼音首字母。
5.根據(jù)權(quán)利要求1所述的漢字編碼,其特征在于漢字偏旁若無對應(yīng)的象形碼,則用該偏旁名稱的拼音首字母作為其拼音碼,然后按規(guī)定的原則對漢字編碼。如冫、氵、灬等用水的拼音首字母S作為其拼音碼,犭則用犬的拼音首字母Q(q)作為其拼音碼。
全文摘要
一種漢字編碼,其特點是用英文大寫或小寫字母來表示漢字構(gòu)件(包括部分偏旁),并構(gòu)成基本漢字形音碼碼源表,以此對漢字取前二位碼,第三位碼為該漢字的拼音首字母。本發(fā)明的漢字編碼具有易記易學(xué)、拆碼快速、簡易、漢字輸入或檢索速度高等優(yōu)點。
文檔編號G06F3/023GK1049565SQ8910646
公開日1991年2月27日 申請日期1989年8月15日 優(yōu)先權(quán)日1989年8月15日
發(fā)明者張云云, 蔣鴻芬 申請人:西北輕工業(yè)學(xué)院