漢字拼形高效編碼輸入法的制作方法

文檔序號：6598319閱讀：462來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>計(jì)算;推算;計(jì)數(shù)設(shè)備的制造及其應(yīng)用技術(shù)

專利名稱：漢字拼形高效編碼輸入法的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及一種計(jì)算機(jī)漢字編碼輸入方法。
漢字拚形編碼輸入法目前仍是占統(tǒng)治地位的計(jì)算機(jī)漢字輸入方法?，F(xiàn)有的形碼輸入法有一共同缺點(diǎn)取碼存在歧義性，依給定的取碼規(guī)則有時不能編出唯一確定的代碼。這增加了學(xué)習(xí)的困難，降低了學(xué)習(xí)編碼的興趣，并使整個編碼方案缺乏邏輯美。其次，許多編碼輸入法的編碼效率還不夠高，例如著名的“五筆字型”輸入法一般需要擊四鍵才能輸入一個漢字，而降低漢字代碼長度是提高漢字輸入速度的重要一環(huán)。漢字信源與漢字鍵盤信道的最優(yōu)匹配是提高漢字鍵盤輸入速度的又一重要環(huán)節(jié)，在這一點(diǎn)上仍有很大的潛力可以發(fā)揮。
本發(fā)明提供一種新的漢字拚形編碼輸入方法。
1.基本筆劃及其分類書寫漢字時毛筆從下筆到提筆之間一筆寫出的連續(xù)筆劃叫基本筆劃。基本筆劃是不可拆分的筆劃，組成漢字的筆劃一共有三十多個基本筆劃。
本發(fā)明將三十多個基本筆劃分成點(diǎn)、橫、豎、撇、左折、右折、等六大類，如表一所示，分別以丶一丨丿
乙為代表。
表一本發(fā)明六大類基本筆劃及其對應(yīng)的代碼
2.字元、代表字元與基本字元漢字可以拆卸成許多部件，這些組成漢字的部件也叫字元，或叫子字。偏旁部首是字元。基本筆劃也是字元，但它們是不可以再行拆卸分解的最小字元，叫平庸字元。
本發(fā)明從漢字字元中優(yōu)選出120個基本字元作為代表字元(見表二)，依據(jù)信源信道匹配原理將基本字元分成26個基本字元組分別與26個英文字
這樣的漢字于是可編成兩碼，但這就與規(guī)則G3的三碼原則沖突。還有些漢字，它本身就是基本字元，例如巾、土……等等，這些字可以編成一碼，這也與G3的三碼原則沖突。在以上兩種及其他只能得到一碼或二碼的情況下，為貫徹三碼原則，本發(fā)明對基本字元進(jìn)行再拆析，使之產(chǎn)生三碼。
本發(fā)明依不同的具體情況制定以下三條“再拆析”規(guī)則G5.1_當(dāng)漢字取出首碼后，余下的部分是一個基本字元，應(yīng)對該字元依G1至G4取次碼和尾碼。例如扣字取出扌后，余下的口字是基本字元，依G5、1口字應(yīng)再行拆析為冂和一。現(xiàn)在，扣字已被編成三碼字扌(e)冂(g)一(j)。又如酒字，取出首碼氵后余下的酉是基本字元，為產(chǎn)生三碼，應(yīng)對酉繼續(xù)拆析，依規(guī)則G2，次碼是一，取出一后余下的
是非基本子字。現(xiàn)在依G3和G4取尾碼，尾碼是二。因此酒的代碼是氵(a)一(j)二(b)。
G5.2_當(dāng)漢字取出首碼后，余下部分是一個基本筆劃，在第一節(jié)即指出，基本筆劃是不能再拆柝的(基本筆劃雖也看作基本字元，但它們是平庸的基本字元，不能再拆析)，在這種情況下，應(yīng)依G1-G3把首字元(是基本字元)拆成首次兩碼，前述的基本筆劃作為尾碼。例如扎字，依G5、2應(yīng)拆編成扌和乚，再拆編成一(j)亅(d)乚(m)三碼。
G5.3_如果漢字是由兩個基本筆劃組成，則簡單地把第二個基本筆劃重復(fù)一次產(chǎn)生三碼，例如八編成丿(f)
(n)
(n)。
如果漢字是一個基本筆劃，則把它重復(fù)三次產(chǎn)生三碼，例如乙字編成乙(m)乙(m)乙(m)。一字編成jjj。
G6.戈、囗、匚取整原則為了提高析字取碼的質(zhì)量，本發(fā)明對戈、囗、匚等少數(shù)幾個基本字元規(guī)定特殊的取整原則如下G6在依筆順取碼(或依逆筆順取尾碼)的過程中只要碰到這三個基本字元及其所代表的三類基本字元(囗只代表自己)的第一個基本筆劃或最后一個基本筆劃(取尾碼時)，就應(yīng)當(dāng)把該字元作為整體取出成為待編字的一碼。對戈、囗、匚取整時顯然局部破壞了原來的依筆順(或逆筆順)取碼的原則。
對囗的取整還有幾條補(bǔ)充規(guī)定。
G6.1囗內(nèi)包含的字元有筆劃伸出囗外者，囗不取整，如酉由申等。
G6.2囗內(nèi)僅含橫和豎兩種筆劃者，囗不取整，如目、田、日、回等。
G6.3一個漢字如不足三碼，這時為貫徹三碼原則，戈、囗、匚三個基本字元均可依G5進(jìn)行再拆析。
以下是實(shí)施G6的實(shí)例我→丿＊找→丿＊戈＊
→丿＊戈＊
俄→亻＊我→亻＊丿＊找→亻＊丿＊戈伐→亻＊戈→亻＊
＊丶代→亻＊弋→亻＊
＊丶框→木＊_匡→木＊匚＊王國→囗＊玉→囗＊王＊丶窗→穴＊囪→穴＊丿＊
→穴＊丿＊囗西→一＊
→一＊冂＊
→一＊
＊一我字的首碼可能認(rèn)為應(yīng)取
(b)但因‘一’是戈字元中的筆劃，依戈的取整原則，不能取出它。
為了提高漢字輸入速度，提高工作效率，本發(fā)明對高頻漢字及詞的輸入方法采取如下規(guī)則G7.縮碼規(guī)則對于52個高頻字，分別用對應(yīng)的英文字母的大、小寫，加空格鍵組成該高頻字的代碼，而略去其它兩碼。
G8.詞碼規(guī)則對三字及三字以上詞，取第一二字的首碼和最后一字的首碼構(gòu)成詞的基本碼，但最后一碼用大寫。
對二字詞，取第一、二字的首碼和第二字的尾碼構(gòu)成詞基本碼，第三碼用大寫。
本發(fā)明確定了一套非常簡單而且邏輯上極為嚴(yán)謹(jǐn)?shù)娜〈a規(guī)則。依據(jù)這套規(guī)則，任何人均可以對任一漢字邏輯地推導(dǎo)出它的唯一確定的代碼，完全消除了取碼的歧義性。這就大大降低了學(xué)習(xí)的難度，提高了學(xué)習(xí)漢字編碼方案的興趣，并使本方案的學(xué)習(xí)成為訓(xùn)練青少年羅輯推理能力的一門輔助課程。
本發(fā)明依重碼率最低和學(xué)習(xí)量最小兩個準(zhǔn)則，利用計(jì)算機(jī)對編碼基本字元進(jìn)行了反復(fù)的優(yōu)選和合理的科學(xué)的分組。
本發(fā)明輸入一漢字至多只需擊三鍵，采用簡縮碼輸入后，平均碼長可降至每字1.6鍵左右，是目前編碼效率最高的形碼方案之一。本專利輸入法取簡縮碼的規(guī)則極其簡單，在獲得高編碼效率的同時還保有方案的易學(xué)性。
本發(fā)明依據(jù)信源信道匹配原理建立26個基本字元組與26個英文字母鍵之間的對應(yīng)關(guān)系，更充分地發(fā)揮了鍵盤信道的信息傳輸潛力，將進(jìn)一步顯著提高本專利輸入法的漢字極限輸入速度。
本發(fā)明已在長沙前進(jìn)計(jì)算機(jī)研究所、中南工業(yè)大學(xué)計(jì)算機(jī)科學(xué)系和湖南醫(yī)學(xué)專科學(xué)校實(shí)施、使用，效果良好，初學(xué)者經(jīng)過三小時講授即可學(xué)會，經(jīng)過三天的練習(xí)就可承接漢字輸入業(yè)務(wù)。
權(quán)利要求
1.一種漢字拚形編碼輸入法，其特征在于，從漢字字元中優(yōu)選出120個基本字元作為代表字元，依據(jù)信源信道匹配原理將基本字元分成26個基本字元組分別與26個英文字母鍵對應(yīng)。
2.根據(jù)權(quán)利要求1所述的編碼輸入法，其特征在于，120個代表字元共代表300個左右(包括120個代表字元本身)的編碼基本字元。
3.根據(jù)權(quán)利要求1所述的編碼輸入法，其特征在于，120個代表字元包括六大類三十多個基本筆劃。
4.一種根據(jù)權(quán)利要求1所述的編碼方法的漢字取碼方法，其特征在于，a.每次按照書寫順序依次給漢字取碼，取出小于待編字的最大基本字元;b.每個漢字最多取三碼。
5.根據(jù)權(quán)利要求4所述的取碼方法，其特征在于，對于多于三個基本字元的漢字，從最后一個筆劃逆筆順而上取出的最大基本字元作為第三碼。
6.根據(jù)權(quán)利要求4所述的取碼方法，其特征在于，一個漢字取出首碼后，余下部分是一個基本字元，則根據(jù)4所述的方法對基本字元，依次取出二碼和尾碼。
7.根據(jù)權(quán)利要求4所述的取碼方法，其特征在于，一個漢字取出首碼后，余下部分是一個基本筆劃，則將首字拆成首碼和二碼。
8.根據(jù)權(quán)利要求4所述的取碼方法，其特征在于，如果漢字是由兩個基本筆劃組成，則把第二個基本筆劃重復(fù)一次產(chǎn)生三碼。
9.根據(jù)權(quán)利要求4所述的取碼方法，其特征在于，在依筆順取碼(或依逆筆順取尾碼)的過程中如果遇到“戈”、“囗”、“匚”這三個基本字元及其所代表的三類基本字元的第一個基本筆劃或最后一個基本筆劃(取尾碼時)，則對這三個基本字元作為整體取碼。
10.根據(jù)權(quán)利要求9所述的取碼方法，其特征在于，“囗”內(nèi)包含的字元有筆劃伸出“囗”外者，囗不取整。
11.根據(jù)權(quán)利要求9所述的取碼方法，其特征在于，“囗”內(nèi)僅含橫和豎兩種筆劃者，“囗”不取整。
12.根據(jù)權(quán)利要求9所述的取碼方法，其特征在于，如果一個漢字不足三碼，則對“戈”、“囗”、“匚”三個基本字元依次進(jìn)行再析取碼。
13.根據(jù)權(quán)利要求4所述的取碼方法，其特征在于，對于52個高頻字，分別采用對應(yīng)的英文字母的大、小寫，加空格鍵組成該高頻字的代碼，而略去其它兩碼。
14.根據(jù)權(quán)利要求4所述的取碼方法，其特征在于，對三字及三字以上詞，取第一二字的首碼和最后一字的首碼構(gòu)成詞的基本碼，且最后一碼用大寫。
15.根據(jù)權(quán)利要求4所述的取碼方法，其特征在于，對二字詞，取第一、二字的首碼和第二字的尾碼構(gòu)成詞基本碼，第三碼用大寫。
全文摘要
一種漢字拚形高效編碼輸入法，本發(fā)明從漢字字元中優(yōu)選出120個字元作為代表字元，這120個代表字元連自己在內(nèi)共代表300個左右的編碼基本字元。根據(jù)六條取碼規(guī)則，任何人均可以嚴(yán)格邏輯地推導(dǎo)出任一漢字的唯一代碼，消除了取碼的岐義性，可降低學(xué)習(xí)輸入法的難度，提高了學(xué)習(xí)輸入法的興趣。本發(fā)明的編碼效率高，任何漢字、漢詞最多只需擊三鍵，平均每字只需擊1.7鍵左右。
文檔編號G06F3/023GK1083233SQ9210881
公開日1994年3月2日申請日期1992年7月23日優(yōu)先權(quán)日1992年7月23日
發(fā)明者謝克中申請人:中南工業(yè)大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：謝克中
技術(shù)所有人：中南工業(yè)大學(xué)
我是此專利的發(fā)明人

上一篇：醫(yī)用劃價(jià)機(jī)收款機(jī)輸入編碼方法
上一篇：223漢字編碼法的制作方法

該領(lǐng)域下的技術(shù)專家
如您需求助技術(shù)專家，請點(diǎn)此查看客服電話進(jìn)行咨詢。
1、李老師：1.計(jì)算力學(xué) 2.無損檢測
2、畢老師：機(jī)構(gòu)動力學(xué)與控制
3、袁老師：1.計(jì)算機(jī)視覺 2.無線網(wǎng)絡(luò)及物聯(lián)網(wǎng)
4、王老師：1.計(jì)算機(jī)網(wǎng)絡(luò)安全 2.計(jì)算機(jī)仿真技術(shù)
5、王老師：1.網(wǎng)絡(luò)安全；物聯(lián)網(wǎng)安全、大數(shù)據(jù)安全 2.安全態(tài)勢感知、輿情分析和控制 3.區(qū)塊鏈及應(yīng)用
如您是高校老師，可以點(diǎn)此聯(lián)系我們加入專家?guī)臁?/a>

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

漢字拼音輸入法相關(guān)技術(shù)

漢字字形編碼相關(guān)技術(shù)

拼音編碼輸入法相關(guān)技術(shù)

輸入法打不出漢字相關(guān)技術(shù)

搜狗輸入法打不出漢字相關(guān)技術(shù)

搜狗輸入法不能打漢字相關(guān)技術(shù)

3ds漢字輸入法相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

漢字拼形高效編碼輸入法的制作方法