專利名稱:橫豎碼漢字輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及計(jì)算機(jī)漢字輸入技術(shù),更具體地說,涉及一種基于漢字的結(jié)構(gòu)字形實(shí)現(xiàn)漢字計(jì)算機(jī)輸入的橫豎碼漢字輸入方法。
現(xiàn)有的計(jì)算機(jī)漢字輸入編碼方法,以大的編碼體系來看有形碼、音碼和形音碼三種。形碼雖有較高輸入效率,但通常難學(xué),學(xué)后易忘,不適合非專業(yè)人士使用。非專業(yè)人士大多使用拼音碼,而其雖好學(xué),但重碼較高,輸入效率低,同時(shí)還要求使用者漢語拼音掌握較好,使方言較重者更感輸入無門。
本發(fā)明的目的在于提供一種新的基于漢字字形的漢字計(jì)算機(jī)輸入方法,這種漢字輸入方法可以克服現(xiàn)有形碼輸入的缺點(diǎn),好學(xué)而不易忘,為漢字輸入非專業(yè)用戶提供一種一學(xué)就會,會了不忘的漢字輸入方法。
本發(fā)明的目的是這樣實(shí)現(xiàn)的,構(gòu)造一種橫豎碼漢字輸入方法,用于將較大漢字字符集經(jīng)過字形編碼輸入到計(jì)算機(jī),其特征在于根據(jù)字形結(jié)構(gòu)中有無縱貫上下的豎縫將欲輸入字集分劃為橫向字子集與豎向字子集,將屬于任一子集的欲輸入漢字以其字形組合次序分解為最多包含始元、中元和末元的三個(gè)單元,對屬于橫向字子集的漢字的輸入,用第一編碼集對其最多是三個(gè)的單元的首筆及整個(gè)字的末筆依次進(jìn)行編碼,對屬于豎向字子集的漢字的輸入,用第二編碼集對其三個(gè)單元的首筆及整個(gè)字的末筆依次進(jìn)行編碼,完成其漢字的輸入。
按照本發(fā)明提供的橫豎碼漢字輸入方法,其特征在于,屬于橫向字子集的漢字結(jié)構(gòu)包含左列式、右列式、三列式、二列式和單元字五種,對欲輸入橫向字的最多為三個(gè)的單元的首筆及整個(gè)字的末筆進(jìn)行編碼時(shí),所述的首筆和末筆包括橫、豎、撇、點(diǎn)和折,其中,橫筆劃包含橫和挑(提)筆劃,豎筆劃包含豎和豎勾,撇筆劃包含撇,點(diǎn)筆劃包括點(diǎn)和捺,折筆劃包括除豎勾以外的運(yùn)筆路線發(fā)生突變的23種筆劃,所述的橫、豎、撇、點(diǎn)和折可以分別用數(shù)字1、2、3、4、5來編碼。其中,對單元字用第一編碼集對整字首筆和整字末筆編碼輸入,對于二列式漢字用第一編碼集對始元、末元的首筆劃及整字末筆編碼輸入,對于左列式、右列式和三列式,用第一編碼集對始元、中元和末元的首筆及整字末筆編碼輸入。
按照本發(fā)明提供的橫豎碼漢字輸入方法,其特征在于,屬于豎向字子集的漢字結(jié)構(gòu)包含冠層式、底層式、三層式、二層式和單元字五種;對欲輸入豎向字的最多為三個(gè)的單元的首筆及整個(gè)字的末筆進(jìn)行編碼時(shí),所述的首筆和末筆包括橫、豎、撇、點(diǎn)和折,其中,橫筆劃包含橫和挑(提)筆劃,豎筆劃包含豎和豎勾,撇筆劃包含撇,點(diǎn)筆劃包括點(diǎn)和捺,折筆劃包括除豎勾以外的運(yùn)筆路線發(fā)生突變的23種筆劃,所述的橫、豎、撇、點(diǎn)和折可以分別用數(shù)字6、7、8、9、0來編碼。其中,對單元字用第二編碼集對整字首筆和整字末筆編碼輸入,對于二層式漢字用第二編碼集對始元、末元的首筆劃及整字末筆編碼輸入,對于冠層式、底層式和三層式,用第二編碼集對始元、中元和末元的首筆及整字末筆編碼輸入。
實(shí)施本發(fā)明的橫豎碼漢字輸入方法,最多只輸入四碼,雖有重碼,但優(yōu)點(diǎn)是明顯的,一是好學(xué),任何人都可以在極短時(shí)間內(nèi),象學(xué)習(xí)拼音輸入一樣快速掌握本發(fā)明的編碼輸入方法和規(guī)則,二是無需象拼音輸入那樣需要準(zhǔn)確知道其讀音;三是所用碼元較少,既適合標(biāo)準(zhǔn)鍵盤,也適用于小鍵盤的其他數(shù)字設(shè)備上,四是還適合于對繁體漢字的編碼。特別適合于非專業(yè)人士特別是年紀(jì)大、記性差和方言重的電腦用戶使用。
結(jié)合實(shí)施例,進(jìn)一步說明本發(fā)明的構(gòu)思、組成、實(shí)現(xiàn)及技術(shù)特點(diǎn)。
1.橫向字和豎向字對于漢字,如果以一個(gè)建筑工作者的眼光去觀察漢字的形體特征,那就會得出一個(gè)全新的概念漢字似堵“墻”,是用大大小小的組合單元(塊體)組合而成的。就其組合方式而言,有的是橫向組合;有的則是豎向組合。組合單元之間是存在字縫的。如果以“一個(gè)字有無一條上下貫通的豎縫”為標(biāo)準(zhǔn)來區(qū)分漢字,那么漢字只能有兩類橫向字有一條上下貫通豎縫的,組合過程基本上是自左而右的漢字;如[優(yōu)化經(jīng)濟(jì)結(jié)構(gòu)]。
豎向字沒有一條上下貫通豎縫的,組合過程基本上是自上而下的漢字。如[有志者事竟成]。
對按以上規(guī)則分類結(jié)果的統(tǒng)計(jì)表明,橫向字約占2/3;豎向字約占1/3。假定采用兩套編碼,從理論上能減少重碼1/3。從而為本輸入法采用四位碼奠定了基礎(chǔ)。
2.字形的分解根據(jù)字形結(jié)構(gòu),把漢字人為的分解若干單元,為實(shí)現(xiàn)編碼最簡,本發(fā)明最多將一個(gè)漢字分解為三個(gè)單元。在三個(gè)單元的情況下,以其組合順序的先后,可分為三元始元——首先書寫的單元;中元——中間書寫的單元;末元——最后書寫的單元。大多數(shù)漢字為“三元字”。有的無“中元”則為“二元字”。無法分拆的則為“單元字”。
3.漢字的分元規(guī)則(二條)1)不講體量大小,只講分割功能。
例“候”與“胤”的中部體量差別很大,但都造成了豎縫,因而中間單元都視為“中元”。2)不講形狀曲直,只講筆順先后把全包圍結(jié)構(gòu)字[國、圊]、“罩形頂字”[閭、商]、“左旁包頂字”[庖、彥]、“右旁包頂字”[氧、虱]的上部視作“層塊”與“始元”;把“旁包底字”[迎、飚]、“槽形底字”[函、畫]的下部視作“層塊”與“末元”。并以“旁包單元”的第一筆位置計(jì)算所在單元。
4.漢字分解中的歸并規(guī)則橫向字單元同列歸并;豎向字單元同層歸并。舉例如下[驥]的三元馬、北、田。田以下同為末元;[鼾]的三元自、田、干。田以下同為中元;[礴]的三元石、艸、氵。氵以右同為末元;[鬻]的三元粥、一、口??谝韵峦瑸槟┰?;[燕]的三元廿、口、灬??诘膬膳酝瑸橹性?;[贏]的三元亡、口、月。月以右同為末元。
5.對單體字的拆細(xì)規(guī)則為減少重碼,對某些“部首”、“單體字”凡符合下述條件之一的,均可拆細(xì)為”二元字”。[]中為例字,1)上下或左右筆劃明顯分離的[藝共比乞欠公分今令侖倉介谷爻冬爾殳冗蘭亢六它錄];2)可拆出一個(gè)可讀單字(除一、二、廿外)的[古卉去支赤幸頁當(dāng)光兄貞盧肖負(fù)色舌彖角市玄首糸允弁甬]。對能夠拆成二種可讀單字而莫衷一是的,則不拆[關(guān)并兌系充丟];3)有強(qiáng)烈分割功能的半包圍結(jié)構(gòu)字[仄歷厄灰布在石右左有友老考孝者巨區(qū)危反勺勻句旬包司可武向尚南風(fēng)同岡成兇函];不符合上述條件的均為“單元字”。
至此,二百多個(gè)“部首”可以不全記。但尚視作“部首”而不分元的有父、豆、言、示、方、文、氣、穴、、竹、羽、髟、鹿。計(jì)13個(gè)。
6.漢字字型把橫向字和豎向字各分為五種型式。為簡化漢字的型式,本發(fā)明把產(chǎn)生上下貫通豎縫的組合件稱“列塊”,并簡化為一豎立矩形;把產(chǎn)生橫向貫通水平縫或折線形縫的組合件稱“層塊”,并簡化為一水平矩形;并以“不講形狀曲直,只講筆順先后”的分元規(guī)則,對包圍結(jié)構(gòu)字與半包圍結(jié)構(gòu)字進(jìn)行抽象簡化。這樣一來,根據(jù)組合順序,可把漢字歸納為十種型式其中橫向字五種;豎向字五種。下表列出橫向字字型
*如[韶]有四個(gè)單元左面二個(gè)歸并為一個(gè)“始元”;下表列出豎向字字型
*凡頂部為二個(gè)單元(除部首竹、羽、髟外),下部為可讀字時(shí),一律歸入“底層式”。時(shí),一律歸入“底層式”。
7.編碼筆劃和筆順對組成漢字的最基本的筆劃歸并成五種。即1)橫,還包括挑(提);2)豎,還包括豎勾;3)撇;4)點(diǎn),還包括捺;5)折,還包括除豎勾外運(yùn)筆線路走向發(fā)生突變的筆劃(計(jì)23種)
本發(fā)明對漢字筆順盡可能利用傳統(tǒng)成規(guī)。這樣一來可減少學(xué)習(xí)和記憶工作量。而這些規(guī)則亦是極其復(fù)雜的。一位學(xué)者曾用十多頁篇幅才闡明。在本發(fā)明中,漢字筆順有三處特例第一處后點(diǎn)。如“龍”字點(diǎn)在首筆的旁邊。本輸入法利用了這一特點(diǎn),有一條規(guī)則“取一筆末筆筆形”,就起作用了。
第二處帶“戈”的字。以“橫”開始,再寫其他筆劃,最后以“折”“撇”“點(diǎn)”結(jié)束。本輸入法把整個(gè)“戈”及其連帶的筆劃,視作“右上包頂字”[或]或“罩形頂字”[成咸]。作為“一個(gè)單元”處理。從而撇開了“戈”字本身的筆順問題。
第三處“旁包底字”。“旁包底字”的“旁包單元”,筆劃從一劃至九劃不等;有的尚可分成二個(gè)單元;用得最多的“辶”底,空間位置于前,筆順于后。而有的“旁包單元”的筆順于前。為統(tǒng)一起見,本發(fā)明的輸入方法專設(shè)一則“特例”凡“旁包底字”的“旁包單元”在“末元”位置時(shí),一律規(guī)定“最后寫”,而其前置元?jiǎng)t多配一個(gè)碼。由于形體特征鮮明,極易辨認(rèn),不易出錯(cuò)。
至此,筆順問題已經(jīng)理順。完全可以利用原有的筆順成規(guī)了。但由于未“定筆順”,對少數(shù)尚有爭議的字,暫定如下[刀力]先折后撇;[匕九乃及萬方]先撇后折。[義]先點(diǎn);[母凡玉瓦兔刃叉舟尤成書甫肅]最后點(diǎn)。
8.編碼集合及編碼長度本發(fā)明的重要特點(diǎn)是對橫向字和豎向字分別采用第一和第二編碼集進(jìn)行編碼,即對橫向字的最多為三個(gè)的單元的首筆及整個(gè)字的末筆進(jìn)行編碼時(shí),所述的首筆和末筆包括橫、豎、撇、點(diǎn)和折,并以第一編碼集即數(shù)字1、2、3、4、5來編碼;而對豎向字的最多為三個(gè)單元的首筆及整個(gè)字的末筆進(jìn)行編碼時(shí),所述的首筆和末筆包括橫、豎、撇、點(diǎn)和折,它們分別以第二編碼集即用數(shù)字6、7、8、9、0來編碼。這樣的安排既減少了重碼,又恰到好處的利用現(xiàn)成設(shè)備,便于“左右開弓”??紤]到目前采用通用鍵盤打字非常普遍,也可以用英文字符trewq置換12345;以英文字符yuiop置換67890。而以數(shù)字碼用于周邊設(shè)備上和助記時(shí)使用。
如前所述,在本發(fā)明中,漢字最多被分解為三元字,下面分述編碼規(guī)則。由于本發(fā)明選定的漢字編碼碼元串位數(shù)不超過四位數(shù),即最長碼長為4對三元字,取三元的首筆筆形加整字末筆筆形。這樣就比較均勻的反映了漢字的外形信息特征?!稒M豎碼》較之《四角號碼》更深入漢字的內(nèi)部,科學(xué)而動(dòng)態(tài)的反映了三個(gè)單元組合過程中的外形信息特征。如果用《橫豎碼》來查字也毫不遜色。實(shí)踐證明用來鍵入電腦亦能再現(xiàn)漢字。三元字解決以后,二元字、單元字依此類推二元字取始、末元的首筆筆形加整字末筆筆形,計(jì)3碼;單元字取整字首筆、末筆筆形,計(jì)2碼。
為便于記憶本發(fā)明方法的規(guī)則,此處附上"橫豎碼"編碼要訣有無豎縫分橫豎;歸并拆細(xì)成三元。
三元首筆加字尾;按照筆順筆形編。
橫碼12345; 豎碼67890。
對應(yīng)橫豎撇點(diǎn)折。旁包底字是特例。
9.實(shí)現(xiàn)效果本發(fā)明提供的橫豎碼漢字編碼輸入方法可直接對漢字字形進(jìn)行編碼,既可在通用計(jì)算機(jī)的標(biāo)準(zhǔn)鍵盤上實(shí)現(xiàn)漢字輸入,也可在僅有數(shù)字鍵的周邊設(shè)備上實(shí)現(xiàn)漢字信息輸入;也可以同樣思路實(shí)現(xiàn)對繁體漢字的輸入。從而實(shí)現(xiàn)了本發(fā)明方法的設(shè)計(jì)初衷適度重碼,方便用戶。把絕大多數(shù)漢字控制在“首屏打見,選擇即可”。為此最大程度地簡化編碼規(guī)則,使之對任何人都易學(xué)易用。
本發(fā)明的輸入編碼方法首屏打見字占80%以上。如包括翻一屏打見字在內(nèi)達(dá)95%以上。達(dá)到了“適度重碼”的既定目標(biāo)。另外,由于重碼字的字序排列是“常用字在先”,“難得一用的字在后”,因而除少數(shù)單元字外,絕大多數(shù)常用字均能一屏打見。使用起來將十分方便。 本發(fā)明選用通用標(biāo)準(zhǔn)大鍵盤用來輸入漢字時(shí),有較多的操作空間,又可以“左右開弓”,減輕疲勞。其中左手司“橫碼”(trewq);選擇鍵(12345);造詞鍵;右手司“豎碼”(yuiop);選擇鍵(67890);標(biāo)點(diǎn)符號鍵;翻屏鍵;消除鍵。由于橫向字多于豎向字一倍,這樣分工是均勻合理的。左右手指的分工是對稱的食指司“橫、豎”;中指司“撇”;無名指司“點(diǎn) (捺)”小指司“折”;姆指司空格鍵。對稱的分工是便于記憶與觸打。一套數(shù)字碼是為周邊設(shè)備準(zhǔn)備的,適宜于小鍵盤上操作。
重碼翻屏的統(tǒng)計(jì)數(shù)據(jù)如下翻屏次數(shù)0屏 一屏 二屏 三屏 四屏字?jǐn)?shù) 5426 1013 240 78 9比例 80.195% 14.972% 3.547% 1.153% 0.133%與同樣好學(xué)的拼音輸入方法相比,其重碼率已大大降低,翻屏選字的量大大降低。
權(quán)利要求
1.一種橫豎碼漢字輸入方法,用于將較大漢字字符集經(jīng)過字形編碼輸入到計(jì)算機(jī),其特征在于根據(jù)字形結(jié)構(gòu)中有無縱貫上下的豎縫將欲輸入字集分劃為橫向字子集與豎向字子集,將屬于任一子集的欲輸入漢字以其字形組合次序分解為最多包含始元、中元和末元的三個(gè)單元,對屬于橫向字子集的漢字的輸入,用第一編碼集對其最多是三個(gè)的單元的首筆及整個(gè)字的末筆依次進(jìn)行編碼,對屬于豎向字子集的漢字的輸入,用第二編碼集對其三個(gè)單元的首筆及整個(gè)字的末筆依次進(jìn)行編碼,完成其漢字的輸入。
2.根據(jù)權(quán)利要求1所述的橫豎碼漢字輸入方法,其特征在于,屬于橫向字子集的漢字結(jié)構(gòu)包含左列式、右列式、三列式、二列式和單元字五種。
3.根據(jù)權(quán)利要求1所述的橫豎碼漢字輸入方法,其特征在于,屬于豎向字子集的漢字結(jié)構(gòu)包含冠層式、底層式、三層式、二層式和單元字五種。
4.根據(jù)權(quán)利要求1所述的橫豎碼漢字輸入方法,其特征在于,對欲輸入橫向字的最多為三個(gè)的單元的首筆及整個(gè)字的末筆進(jìn)行編碼時(shí),所述的首筆和末筆包括橫、豎、撇、點(diǎn)和折,其中,橫筆劃包含橫和挑(提)筆劃,豎筆劃包含豎和豎勾,撇筆劃包含撇,點(diǎn)筆劃包括點(diǎn)和捺,折筆劃包括除豎勾以外的運(yùn)筆路線發(fā)生突變的筆劃,所述的橫、豎、撇、點(diǎn)和折可以分別用數(shù)字1、2、3、4、5來編碼。
5.根據(jù)權(quán)利要求1所述的橫豎碼漢字輸入方法,其特征在于,對欲輸入豎向字的最多為三個(gè)的單元的首筆及整個(gè)字的末筆進(jìn)行編碼時(shí),所述的首筆和末筆包括橫、豎、撇、點(diǎn)和折,其中,橫筆劃包含橫和挑(提)筆劃,豎筆劃包含豎和豎勾,撇筆劃包含撇,點(diǎn)筆劃包括點(diǎn)和捺、折筆劃包括除豎勾以外的運(yùn)筆路線發(fā)生突變的筆劃,所述的橫、豎、撇、點(diǎn)和折可以分別用數(shù)字6、7、8、9、0來編碼。
6.根據(jù)權(quán)利要求2所述的橫豎碼漢字輸入方法,其特征在于,對單元字用第一編碼集對整字首筆和整字末筆編碼輸入,對于二列式漢字用第一編碼集對始元、末元的首筆劃及整字末筆編碼輸入,對于左列式、右列式和三列式,用第一編碼集對始元、中元和末元的首筆及整字的末筆編碼輸入。
7.根據(jù)權(quán)利要求3所述的橫豎碼漢字輸入方法,其特征在于,對單元字用第二編碼集對整字首筆和整字末筆編碼輸入,對于二層式漢字用第二編碼集對始元、末元的首筆劃及整字末筆編碼輸入,對于冠層式、底層式和三層式,用第二編碼集對始元、中元和末元的首筆及整字的末筆編碼輸入。
全文摘要
一種橫豎碼漢字輸入方法,根據(jù)字形結(jié)構(gòu)中有無豎縫分劃為橫向字與豎向字,對橫向字和豎向字,分別用第一和第二編碼集對其最多是三個(gè)的單元的首筆及整個(gè)字的末筆依次進(jìn)行編碼。這種漢字輸入方法,雖有重碼,但易學(xué)易用,不要求使用者知道漢字讀音;所用碼元較少,既適合標(biāo)準(zhǔn)鍵盤,也適用于小鍵盤的其他數(shù)字設(shè)備上,特別適合于非專業(yè)人士使用。
文檔編號G06F3/023GK1190207SQ9711434
公開日1998年8月12日 申請日期1997年12月31日 優(yōu)先權(quán)日1997年12月31日
發(fā)明者張敏, 張放 申請人:張敏, 張放