專利名稱:一種計(jì)算機(jī)漢字拼音編碼方法及其鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計(jì)算機(jī)漢字編碼方法及其鍵盤,具體地說是一種計(jì)算漢字拼音編碼方法及其鍵盤。
目前,基于中小學(xué)漢語(yǔ)拼音教學(xué)的基礎(chǔ),雖然重碼率較高但好學(xué)的拼音輸入是普及面最廣的計(jì)算機(jī)漢字輸入方法,以“全拼”、“三拼”、“雙拼”等形式存在著。臺(tái)灣現(xiàn)行的注音字符是漢語(yǔ)拼音的前身,雖然海峽兩岸使用的漢字存在部分繁、簡(jiǎn)、異體差別,但是它們的讀音基本相同。除了字音以外,漢字編碼中常用的特征信息還有筆畫及字根。筆畫雖然簡(jiǎn)單且較為一致,與數(shù)字鍵位的對(duì)應(yīng)也易掌握,但是它種類過少且分布不均,妨礙了筆畫的應(yīng)用。利用字根作為漢字鍵盤輸入的特征信息,雖能使重碼率較低,但由于字根數(shù)量繁多,很難將它們與鍵盤上的有限鍵位建立對(duì)應(yīng)關(guān)系,需要進(jìn)行專門學(xué)習(xí),大量記憶,從而限制了字根的應(yīng)用。
本發(fā)明的目的在于提供一種基于中小學(xué)漢字及漢語(yǔ)拼音教學(xué)的、重碼率較低的、易學(xué)易用的、速度較快的,適用于不同地域使用的古今中外各類繁、簡(jiǎn)、異體漢字的計(jì)算機(jī)漢字拼音編碼方法及其鍵盤。
本發(fā)明的目的是這樣實(shí)現(xiàn)的按照取大優(yōu)先、能離不連、相交不拆、照顧習(xí)慣的原則將上下型、左右型、內(nèi)外型漢字拆分為上與下、左與右、內(nèi)與外兩個(gè)部分,拆分出的兩個(gè)部分以起筆先后為序進(jìn)行編碼,可讀的偏旁部首采用其名稱的拼音的首位字母組合進(jìn)行編碼,能獨(dú)立成字的可讀部分采用其漢語(yǔ)拼音編碼,可拆漢字拆分出的不可讀部分采用該漢字的拼音編碼,不可拆分漢字采用該漢字的拼音編碼,后加空格鍵“ ”。
本發(fā)明的計(jì)算機(jī)漢字拼音編碼方法的鍵盤是采用國(guó)際通用小鍵盤,使用構(gòu)成漢語(yǔ)拼音方案字母表的26個(gè)字母鍵及代表零聲母的“0”鍵,以及用來分別代表鍵盤上沒有的拼寫中的“ai”、“ei”、“ao”、“ou”、“an”、“en”、“eng”、“ong”“ang”的“1”、“1”、“3”、“4”、“5”、“6”、“7”、“8”、“9”的九個(gè)數(shù)字鍵,以及“空格鍵”作為鍵元集,并且用“A”、“V”、“F”、“V”、“B”、“N”、“R”、“P”來分別代表鍵盤上沒的拼寫中的“zh”、“ch”、“sh”、“i”、“üe”、“ie”、“uo”、“ua”,用以“Q”、“A”為首的兩行字母鍵分別代表“u”行、“i”行,與以“1”為首的那行數(shù)字鍵所代表的各個(gè)鍵元兩兩組合,將分別以“i”、以“u”為首的韻母在鍵盤上進(jìn)行分布。
本發(fā)明的優(yōu)點(diǎn)是1、基于中小學(xué)漢字及漢語(yǔ)拼音教學(xué),編碼合理,無需記憶,易學(xué)易用,適于中小學(xué)生和非專業(yè)人員及專業(yè)人員輸入漢字;2、重碼率較低,碼長(zhǎng)適中,平均四碼,輸入速度較快;3、適用輸入不同地域古今中外的各類繁、簡(jiǎn)、異體漢字。
下面結(jié)合實(shí)例和附圖對(duì)本發(fā)明做進(jìn)一步詳細(xì)的說明
圖1是本發(fā)明的計(jì)算機(jī)漢字拼音輸入法的鍵盤信息特征分布圖;圖2是本發(fā)明的計(jì)算機(jī)漢字拼音輸入法的非字偏旁部首編碼圖。
全部漢字分為獨(dú)體字、合體字兩大類,在合體字中,大多是由形旁、聲旁兩部分組成的形聲字,且形旁、聲旁大多是可讀的,有其漢語(yǔ)拼音。也即,除了少數(shù)不可拆分的漢字外,大多數(shù)漢字可拆分為可讀的兩個(gè)部分。如“樹”,按取大優(yōu)先、能離不連、相交不拆、照顧習(xí)慣的原則將其拆分為“權(quán)”與“寸”兩個(gè)部分,當(dāng)然,某些漢字如“疑”雖說是合體字,但它拆分出的兩個(gè)部分都不可讀,所以將其視為不可拆分漢字。又如“曼”是上下結(jié)構(gòu),既可拆分為“日”“ ”,又可拆分為“ ”“又”,以哪種為準(zhǔn)呢,我們的原則是取“最上”為“上”,應(yīng)拆為“日”“ ”;又如“候”,是左右結(jié)構(gòu),我們的原則是取“最左””為“左”,拆分為“亻”“ ”,當(dāng)然,這類字拆分出的兩個(gè)部分中總有一個(gè)部分不可讀,如“ ”、“ ”。再如“衍”是左右結(jié)構(gòu),按相離結(jié)構(gòu)拆分為、彳”“ ”,但這不正確,應(yīng)按取大優(yōu)先拆分為“行”、“氵”。同樣,“修”應(yīng)拆分為“攸”“彡“而不是“亻” ”。對(duì)于“夷”、“丸”、“申”、“日”這類相交結(jié)構(gòu)的字,我們不再進(jìn)行拆分,將它們與“凹”、“口”、“丁”、“于”等不可拆分字一起按照該字的漢語(yǔ)拼音,后加“ ”,如“日”的全拼編碼為“ri ”,“中”的全拼編碼為“a8 ”,“凹”的全拼編碼為“Oao ”,“疑”的全拼編碼為“yi ”。可拆分的漢字,其拆分出的兩個(gè)部分以起筆先后為序進(jìn)行編碼,如“戊”,書寫順序?yàn)椤耙粡S 戊”,“戈”先起筆,編碼為“ge”,“丿”后起筆,編碼為“p0”?!柏笔强勺x的偏旁部首,采用其名稱的拼音的首位字母組合進(jìn)行編碼,“全拼”與“雙拼”時(shí)的編碼相同,“三拼”時(shí),要在“雙拼”編碼后加“0”補(bǔ)足鍵位,如“戊”的三拼編碼是“g0ep00”,雙拼編碼是“gep0”。所謂三拼,是將構(gòu)成一個(gè)音節(jié)的聲母、韻頭、韻腹(有韻尾的也包括在內(nèi))分別用三鍵來代表的輸入方法,空缺鍵位用“0”補(bǔ)足。雙拼,是將構(gòu)成一個(gè)音節(jié)的聲母、韻母分別用兩鍵來代表的輸入方法,零聲母鍵位用“0”補(bǔ)足。全拼時(shí),零聲母鍵位也用“0”補(bǔ)足。對(duì)于“樹”,它拆分出的兩個(gè)部分都為獨(dú)立漢字,整字編碼為“quancun”。對(duì)于、“曼”,其拆分出的兩個(gè)部分中“ ”為不可讀部分,其編碼為該可拆分漢字的拼音編碼“m5”,“日”的編碼為“ri”,整字全拼編碼為“rim5”,同樣“候”的全拼編碼為“l(fā)rhou””。“衍”的全拼編碼既可以是“xing3d”,也可是“hang3d”,因“行”是多音字,本發(fā)明提供的計(jì)算機(jī)漢字拼音輸入法允許多音字存在,如“嗟””的編碼既可以是“koucha”,也可以是“kouci”,還可以是“kouchai”。
雖說21個(gè)聲母,35個(gè)韻母只組成了417個(gè)音節(jié),但若將這417個(gè)音節(jié)兩兩組合,從理論上講,可有173889種組合,用它們來區(qū)分區(qū)區(qū)全部近六萬漢字,重碼問題將迎刃而解。
將每一個(gè)漢字的編碼按照國(guó)標(biāo)漢字庫(kù)的順序編輯為文本文件,鍵入、轉(zhuǎn)化為機(jī)器內(nèi)碼文件存入存貯器。按照編碼規(guī)則,將當(dāng)前欲輸入漢字如“樹”進(jìn)行編碼“樹”→“quancun”,鍵入,根據(jù)鍵入的編碼,內(nèi)存查找到一個(gè)與之對(duì)應(yīng)的內(nèi)碼,以來指向字形庫(kù)中對(duì)應(yīng)的漢字點(diǎn)陣或字形位置,并進(jìn)行輸出顯示。
權(quán)利要求
1.一種計(jì)算機(jī)漢字編碼方法,其特征是按照取大優(yōu)先、能離不連,相交不拆、照顧習(xí)慣的原則將上下型、左右型、內(nèi)外型漢字拆分為上與下、左與右、內(nèi)與外兩個(gè)部分,拆分出的兩個(gè)部分以起筆先后為序進(jìn)行編碼,可讀的偏旁部首采用其名稱的拼音的首位字母組合進(jìn)行編碼,能獨(dú)立成字的可讀部分采用其漢語(yǔ)拼音編碼,可拆漢字拆分出的不可讀部分采用該漢字的拼音編碼,不可拆分漢字采用該漢字的拼音編碼,后加空格鍵“ ”,
2.一種計(jì)算機(jī)漢字編碼方法的鍵盤,其特征是采用國(guó)際通用小鍵盤,使用構(gòu)成漢語(yǔ)拼音方案字母表的26個(gè)字母鍵及代表零聲母的“0”鍵,以及用來分別代表鍵盤上沒有的拼寫中的“ai”、“ei”、“ao”、“ou”、“an” 、“en”、“eng”、“ong”“ang”的“1”、“2”、“3”、“4”、“5”、“6”、“7”、“8”、“9”的九個(gè)數(shù)字鍵以及“空格鍵”作為鍵元集,并且用“A”、“V”、“F”、“ V”、“B”、“N”、“R”、“P”來分別代表鍵盤上沒的拼寫中的“zh”、“ch”、“sh”、“ü”、“üe”、“ie”、“uo”、“ua”,用以“Q”、“A”為首的兩行字母鍵分別代表“u”行、“i”行,與以“1”為首的那行數(shù)字鍵所代表的各個(gè)鍵元兩兩組合,將分別以“i”、以“u”為首的韻母在鍵盤上進(jìn)行分布。
全文摘要
本發(fā)明涉及一種計(jì)算機(jī)漢字編碼方法及其鍵盤,具體地說是一種拼音編碼方法及其鍵盤。本發(fā)明根據(jù)大多數(shù)漢字是可拆分為兩個(gè)可讀的形旁、聲旁的形聲字的特點(diǎn),將漢字分為可拆分與不可拆分兩大類。不可拆分的直接用其拼音編碼,可拆分的將其拆分出的兩個(gè)部分分別用拼音編碼。采用國(guó)標(biāo)鍵盤,將聲、韻等特征信息進(jìn)行合理分布。本發(fā)明基于中小學(xué)漢字、漢語(yǔ)拼音教學(xué),易學(xué)易用,速度較快,適用于不同地域的各類簡(jiǎn)繁漢字的計(jì)算機(jī)輸入。
文檔編號(hào)G06F3/023GK1119302SQ95106979
公開日1996年3月27日 申請(qǐng)日期1995年7月26日 優(yōu)先權(quán)日1995年7月26日
發(fā)明者李衛(wèi)紅 申請(qǐng)人:李衛(wèi)紅