專利名稱:漢字簡易碼輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種用于將要處理的中文信息轉(zhuǎn)變成為計算機等能夠處理的編碼形式的手動輸入方法,具體地說,是指一種漢字簡易碼輸入方法。
背景技術(shù):
對中國人而言,學(xué)習漢字輸入法是使用計算機的必備條件。上世紀八十年代初,“五筆字型”輸入法的研究成功,標志著漢字無法輸入電腦的時代結(jié)束。其后國內(nèi)漢字輸入技術(shù)的研究開發(fā)仍在不斷進行。目前國內(nèi)最流行的漢字輸入法,主要有形碼和拼音兩大類。以“五筆字型”為代表的形碼方案的優(yōu)點是一是重碼率極低,輸入速度極高,二是不認識的字也能打出來;但其缺點是編碼規(guī)則較復(fù)雜,記憶量大,盡管專門打字員由于打字速度的要求都是學(xué)習“五筆”,但對于打字速度要求不高的非專業(yè)人員,常常將學(xué)習“五筆”視為畏途。拼音碼是目前實際使用人數(shù)最多的漢字輸入方法。它的最大優(yōu)點是容易學(xué)習掌握,學(xué)會后不易忘記,操作簡便,但其缺點也是明顯的一是重碼率極高,僅在國標一、二級常用6000多漢字中,拼音“JI”的重碼字就有93個,模糊音組拼音“Z(H)I”的重碼字更高達110個,在重碼太多時,就必須通過多次翻頁才能找到所需漢字,這就大大影響了漢字的錄入速度;二是不會發(fā)音的漢字無法輸入。目前一些新開發(fā)的拼音輸入法,增加了智能處理和詞語輸入的功能,提高了輸入速度,但仍不能根本消除重碼多的困擾,也無法解決不會讀音的漢字的輸入問題??傊?,時至今日,漢字輸入法的“好學(xué)與好用”這對基本矛盾并沒有能根本解決,現(xiàn)實的需要推動著眾多的研究者投入新的漢字輸入法的研究。
實際上,漢字輸入法編碼方案除了上述的“音碼方案”和“形碼方案”,還有一類“音形碼”方案。它是根據(jù)漢字的字形和拼音的綜合特性來進行編碼,其易學(xué)性、重碼率和輸入速度一般來說是介于音碼和形碼之間,對于廣大的對輸入速度要求不是很高的非專業(yè)人士應(yīng)該是最有前途的方案。但目前公布的“音形碼”方案雖多,卻幾乎沒有一種進入輸入法的主流中。原因仍是編碼規(guī)則過于復(fù)雜,輸入速度既不能與“全形碼”競爭,又因規(guī)則過繁難以吸引目前使用“拼音碼”的用戶,便只能游離在主流之外了。
發(fā)明內(nèi)容
為了解決現(xiàn)有漢字輸入法編碼規(guī)則過繁難學(xué)或重碼率過高、輸入速度過慢的問題,本發(fā)明的目的,乃是提供一種編碼規(guī)則簡單而易學(xué)易記、重碼率低、輸入速度快的漢字簡易碼輸入方法。
本發(fā)明采用的技術(shù)方案如下(1)采用部分省略韻母字母以及將模糊音統(tǒng)一編碼的方法對現(xiàn)有全拼編碼進行簡化,具體說來是(i)漢語拼音一般由聲母+韻母組成,將原有全拼編碼中的聲母保留,韻母則只保留一個,拼音以-n或-ng結(jié)尾的漢字則另加n為編碼,零聲母漢字則取其前兩位拼音碼,如只有一位拼音碼,則取一位;(ii)對“模糊音”進行統(tǒng)一編碼,即C,CH→C;S,SH→S;Z,ZH→Z;N,NG→N;ü,U→U;L,N→L;H,F(xiàn)→F;(iii)簡化的拼音碼后加1-2位形碼作為重碼字的檢索碼;(2)采用以拼音首母為字根編碼的方法并大量使用聯(lián)想字根編碼法。該法采用26個英文字母作為編碼元件,以字母V做為萬能學(xué)習鍵,其余25個字母都用作拼音碼,編碼方法同一般的全拼碼,唯一的區(qū)別是韻母ü采用u鍵,而非V鍵;使用除V字母鍵以外的其它25個字母鍵的全部或部分作為字根編碼,具體編碼方法是(i)成字字根直接采用該字拼音聲母為編碼;(ii)非成字字根主要采用其組成或形似的常用字拼音聲母或部首命名字拼音聲母為編碼;(iii)筆劃采用其讀音或命名漢字聲母為編碼(iV)個別部首字根采用與其形似的字母為編碼;(V)同組的聯(lián)想字根取用基本字根編碼。
本發(fā)明通過采用部分省略韻母以及將模糊音統(tǒng)一編碼的方法對現(xiàn)有全拼編碼進行簡化后,使得本方法“音形碼”編碼的拼音部份只有2-3碼,再加上一個形碼為檢索碼,本方法單字的總編碼數(shù)不大于4個,小于全拼編碼的最多6個(實例見后文表1);由于引入形碼檢索,本法“音形碼”的重碼率遠低于一般的拼音碼,輸入速度更快。與其它漢字輸入法相比,本方法大量采用了形似字根同組統(tǒng)一編碼的方法(本法稱之為同碼聯(lián)想字根),大大減小了全形碼或形音碼中字根拆分的難度,減少了記憶量。
本發(fā)明的有益效果是方法簡單但又多功能,易學(xué)易記,可以利用音形碼對漢字及常用詞語進行直接輸入,重碼率遠低于一般的拼音碼,對常用漢字都勿須翻頁查找。對于不知讀音的非常用字或?qū)χ卮a率、輸入速度要求較高的專業(yè)人員,可以選擇本方法全形碼(或形音碼)進行高速盲打輸入。本方法可在軟件中同時備有拼音字庫,對于字型、檢索碼都記不清的漢字又可以全拼音輸入。本方法還在軟件中備有強大的“詞(語)庫”,可進行詞匯(短語及句子)的直接輸入。利用先進的漢字輸入方法平臺,本方法還可以進行語句的自動記憶與輸出。本發(fā)明方法特別適合目前采用傳統(tǒng)全拼輸入法的電腦操作者或有一定拼音基礎(chǔ)的新學(xué)者使用,并可廣泛用于電腦(掌上電腦)、手機、智能電話等設(shè)備輸入漢字。
具體實施例方式
按照前述本發(fā)明的技術(shù)方案,全拼碼簡化后并加檢索碼的漢字編碼實例見后表1。完整的漢字簡易音形碼,由表1中的簡化拼音碼+檢索碼組成,如“唱”字由CANK組成。本發(fā)明字根(檢索碼)編碼方法舉例見表2,該表說明,除了個別字根是按照與其形似的字母取碼外,絕大多數(shù)字根都是采取字根漢字或相關(guān)漢字的拼音聲母作為編碼。正因為這樣,對于有一定拼音基礎(chǔ)或過去就是使用拼音輸入法的使用者來說,非常容易記憶,也不必強行記憶編碼在鍵盤上的位置,見字就知音,知音就知字母,知字母就知鍵位。無論是電腦的標準鍵盤,或是手機的少鍵鍵盤,都可以按照鍵盤上標注的字母,順利輸入漢字編碼,如同一般的拼音法一樣。
按照前述本發(fā)明的技術(shù)方案,使用除V字母鍵以外的其它25個字母鍵的全部或部分作為字根編碼,而后述表3則是采用B、C、D、E、F、G、H、I、J、K、L、M、P、Q、R、S、T、W、X、Y、Z這21個字母鍵作為字根編碼的實施例。該簡易碼字根編碼匯總表3共有213個基本字根和330個同碼聯(lián)想字根。字根數(shù)目雖多,但由于基本上是按照相關(guān)漢字聲母取碼,并聯(lián)想擴大,實際上很易記憶,一般有一定拼音基礎(chǔ)的人看一遍就能大部掌握,剩余的也不一定要死記硬背。由于本方法的軟件中采用逐漸提示的方法,只要掌握了拼音簡碼,對少數(shù)字(詞),即使不熟悉檢索碼,也可查到該字及其檢索碼,在使用中逐步積累學(xué)習。為了進一步說明這一點,后述簡易碼字根編碼表4還就表3中鍵盤字母B、C、D所包含的字根編碼方法,同碼聯(lián)想字根及漢字實例進行了舉例說明。這里還需補充說明的是,對于部分高頻使用的字根,也可使用上述21個字母鍵實施例中未使用的字母鍵A、N、O、U來進行替換編碼,以降低重碼率,與此相關(guān)的編碼實施例見自定義字根編碼表5。但由于部分突破了以漢字拼音聲母編碼的規(guī)則,故加大了使用者的強制記憶量。
本發(fā)明在前述技術(shù)方案的基礎(chǔ)上,還可在全形碼和形音碼的編碼方式中,突破傳統(tǒng)編碼方法中字根一般不進行二次拆分的慣例(有的只利用字根的部分筆劃作為識別碼),允許對字根二次拆分(不僅是拆為筆劃),這樣就不必制定復(fù)雜的“識別碼”規(guī)則,用于成字字根及字根數(shù)少于4個的漢字編碼。其具體規(guī)定是(1)成字字根編碼=字根碼+該字根二次拆分首碼+二次拆分尾碼(二級簡碼字則尾碼省略);(2)可拆分字根數(shù)少于4個的漢字,必要時取其末位字根的二次拆分尾碼為補充碼;(3)少數(shù)不便拆分的字根重復(fù)取字根碼為拆分首碼或尾碼。對字根進行二次拆分的實施例見后面的字根拆分編碼實施例表6。
本發(fā)明在前述技術(shù)方案的基礎(chǔ)上,還可多方案編碼,同字庫混用,操作者可以根據(jù)自己的操作習慣和工作性質(zhì)靈活選用。采用上述的簡化拼音編碼和字根編碼,本發(fā)明提供了多方案的編碼字庫,包括簡化全拼碼(標準全拼僅進行模糊音統(tǒng)一簡化編碼);簡化全拼+檢索碼;音形碼(簡化拼音+檢索碼);三鍵形碼(僅用于拼音及音形碼使用中少量不知讀音的難字檢索);形音碼(漢字聲母+三鍵形碼)及全形碼(最多四碼)。其中前四種方案的字庫混編于一個字庫中,操作者不需按切換鍵,就可以根據(jù)自己的操作習慣、熟練程度和工作性質(zhì)靈活選用。部分漢字的多方案編碼舉例見漢字多方案編碼實例表7。
表1 漢字簡易碼編碼實例
表2 字根(檢索碼)編碼方法示例表
表3 簡易碼字根編碼總表
表4 “簡易碼”字根編碼表
表5 自定義字根編碼表
表6 字根拆分編碼實例表
表7 漢字多方案編碼實例表
權(quán)利要求
1.一種漢字簡易碼輸入方法,其特征在于(1)采用部分省略韻母字母以及將模糊音統(tǒng)一編碼方法對現(xiàn)有全拼編碼進行簡化,具體說來是(i)漢語拼音一般由聲母+韻母組成,即對原有全拼編碼中的聲母保留,韻母則只保留一個,拼音以-n或-ng結(jié)尾的漢字則另加n為編碼,零聲母漢字則取其前兩位拼音碼,如只有一位拼音碼,則取一位;(ii)對“模糊音”進行統(tǒng)一編碼,即C,CH→C;S,SH→S;Z,ZH→Z,N,NG→N;U,ü→U;L,N→L;H,F(xiàn)→F;(iii)簡化的拼音碼后加1-2位形碼作為重碼字的檢索碼;(2)采用以拼音首母為字根編碼的方法并大量使用聯(lián)想字根編碼法,該法采用26個英文它母作為編碼元件,以字母V做為萬能學(xué)習鍵,其余25個字母都用作拼音碼,編碼方法同一般的全拼碼,唯一的區(qū)別是韻母ü采用u鍵,而非V鍵;使用除V字母鍵以外的其它25個字母鍵的全部或部分作為字根編碼,具體編碼方法是(i)成字字根直接采用該字拼音聲母為編碼;(ii)非成字字根主要采用其組成或形似的常用字拼音聲母或部首命名字拼音聲母為編碼;(iii)筆劃采用其讀音或命名漢字聲母為編碼(iV)個別部首字根采用與其形似的字母為編碼;(V)同組的聯(lián)想字根取用基本字根編碼。
2.根據(jù)權(quán)利要求1所述的漢字簡易碼輸入方法,其特征在于,在其全形碼和形音碼的編碼方式中,允許對字根進行二次拆分,其具體規(guī)定是(1)成字字根編碼=字根碼+該字根二次拆分首碼+二次拆分尾碼;(2)可拆分字根數(shù)少于4個的漢字,必要時取其末位字根的二次拆分尾碼為補充碼;(3)少數(shù)不便拆分的字根重復(fù)取字根碼為拆分首碼或尾碼。
全文摘要
本發(fā)明為一種漢字簡易碼輸入方法。其特點是拼音部分采用部分省略韻母以及將模糊音統(tǒng)一編碼的方法進行簡化,簡化的拼音碼后加1-2位形碼作為重碼字的檢索碼;采用以拼音首母為字根編碼的方法,并大量使用聯(lián)想字根編碼法,采用26個英文字母作為編碼元件,以字母V作為萬能學(xué)習鍵,其余25個字母都用作拼音碼;使用除V字母鍵以外的其它25個字母鍵的全部或部分作為字根編碼;在其全形碼和形音碼編碼方式中,允許對字根進行二次拆分.本發(fā)明方法編碼規(guī)則簡單,易學(xué)易記,便于使用者學(xué)習掌握;與原有全拼輸入法相比,其碼長縮短,重碼率低,輸入速度快,功能全面,可廣泛應(yīng)用于電腦(掌上電腦)、手機、智能電話等設(shè)備的漢字輸入。
文檔編號G06F3/023GK1700149SQ200410023230
公開日2005年11月23日 申請日期2004年5月21日 優(yōu)先權(quán)日2004年5月21日
發(fā)明者周良才 申請人:周良才