專利名稱:漢字大小字元輸入法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種計算機漢字輸入技術(shù),特別是一種漢字大小字元輸入法,能方便快捷地將漢字輸入計算機。
背景技術(shù):
目前的計算機漢字輸入方法有很多種,有音碼、形碼、音形結(jié)合碼等。其中最早普及采用的是五筆字型輸入法,它是一種形碼輸入法。雖然該輸入法字根較多,輸入速度較快,但重碼率仍較高(在6763個一、二級漢字中產(chǎn)生大約250個重碼,占2%),且該輸入法的補充碼需用字型結(jié)構(gòu)來判斷。此外,在一、二級漢字中,它的重碼問題無處理方法可以解決(一般仍需要視檢)。
發(fā)明內(nèi)容
本發(fā)明的任務(wù)是提供一種漢字大小字元輸入法,使得具有字元標準、拆字規(guī)范、規(guī)則易學。尤其是本輸入法所產(chǎn)生的字與字重碼率極低(1%)。而且,本輸入法中字與字重碼、字與詞重碼及詞與詞重碼易于盲打識別處理。
本發(fā)明的任務(wù)是這樣完成的本輸入法主要是利用現(xiàn)有的26個英文字母鍵進行輸入操作。其特征在于a.將漢字中的只有單個字元的獨元字(如“木”、“口”、“子”等)、有兩個或兩個以上字元的復元字(如雙元字“杏”、“打”等,如三元字“河”、“部”等,如四元字“照”、“資”等,如多元字“微”、“耀”等)中的字元(部件)分成“大字元”、“中字元”、“小字元”及“獨元字末筆劃字元”四類。其中的大字元主要是指包含較多漢字數(shù)量的“大部首”或“較大部首”,這些大字元共有26個,包括“艸”、“口”、“氵”、“日”、“人”、“亻”等(見附圖),它們分別按其首筆劃種類安排在26個英文字母鍵上,并居于本鍵各字元之首。其中的中字元是指大字元的簡體或繁體,或與大字元形似的字元,并外加小括號,共有12個,包括(讠)、(钅)、(八)、(己巳)、(士)、(幺 )、(曰 )、 ( )、(車),它們分別安排在英文字母鍵上,并跟隨其相關(guān)的大字元之后。其中的小字元是指大字元及中字元除外的字元,共有216個,包括“大”、“貝”、“丿”、“忄”、“廣”、“蟲”等,它們大多數(shù)也按其首筆劃的種類各自分別安排在26個英文字母鍵上。
b.將其中的獨元字末筆劃字元,即小字元和中字元獨元字的末字元,并外加中括號,包括[一]、[丨]、[丿]、[丶]、[乙],分別安排在英文字母T、R、E、W及Q鍵上,其元碼,即前述的英文代碼專門充當小字元及中字元獨元字的末字元元碼。
c.每個漢字編碼的基本規(guī)則,即編碼的方法是單字的全碼(參與一個漢字編碼的各個元碼的總和)編為三位碼或四位碼。一個單字全碼的編取(1)規(guī)定對獨元字編為三位碼,后加空格鍵,對其中屬于大字元獨元字的編碼是該字元元碼+F+J,如“木”字的編碼為TFJ+空格鍵,“車”字的編碼為ZFJ+空格鍵等。對其中屬于小字元和中字元的獨元字的,其編碼是該字元元碼+次筆劃字元元碼+該獨元字末筆劃字元元碼,如“方”字的編碼為SHE+空格鍵(方S、一H、[丿]E),“钅”字的編碼為CHQ+空格鍵(钅C、一H、[乙]Q),“小”字的編碼為JKW+空格鍵(小J、丿K、[丶]W),“己”字的編碼為MHQ+空格鍵(己M、一H、[乙]Q)等。當獨元字為雙筆劃小字元字或雙筆劃中字元字時,其末筆劃也是它的次筆劃,可以重復取用(但元碼不同),如“二”字的編碼為YHT+空格鍵(二Y、一H、[一]T),“十”字的編碼為BJR+空格鍵(十B、丨J、[丨]R),“八”字的編碼為DLW+空格鍵(八D、丶L、[丶]W),“兒”字的編碼為KPQ+空格鍵(兒K、乙P、[乙]Q)等等。其中對屬于單筆字或單筆劃的,其編碼是連續(xù)編取三個該字元(或筆劃)元碼,如“一”編碼為HHH,“丨”編碼為JJJ,“丿”編碼為KKK,“丶”的編碼為LLL,“乙”的編碼為PPP等(2)規(guī)定對雙元字編為三位碼,后加空格鍵,即規(guī)定為首字元元碼+末字元元碼+實末筆劃代碼(以大字元或中字元先行時),或+虛末筆劃代碼(以小字元先行時)。+實末筆劃代碼的,如“扣”字的編碼為BUH+空格鍵(扌B、口U、一H),“休”字的編碼為ITL+空格鍵(亻I、木T、丶L),“幻”字的編碼為APP+空格鍵(幺A、乙P、乙P),“分”字的編碼為DAK+空格鍵(八D、刀A、丿K),“異”字的編碼為MGJ+空格鍵(巳M、 G、丨J);+虛末筆劃代碼的,如“古”字的編碼為BUG+空格鍵(十B、口U、{一}G),“閑”字的編碼為ITS+空格鍵(門I、木T、{丶}S),“孔”字的編碼為APA+空格鍵(子A、乙P、{乙}A),“千”字的編碼為KBF+空格鍵(丿K、十B、{丨}F)等等;(3)規(guī)定對三元字編為四位碼,即規(guī)定為首字元元碼+次字元元碼+末字元元碼+實末筆劃代碼(以大字元或中字元先行時),或+虛末筆劃代碼(以小字元先行時)。+實末筆劃代碼的,如“維”字的編碼為AIEH(纟A、亻I、 E、一H),“沙”字的編碼為SJKK(氵S、小J、丿K、丿K),“英”字的編碼為GRYL(艸G、冂R、大Y、丶L),等等。+虛末筆劃代碼的,如“難”字的編碼為AIEG(又A、亻I、 E、{一}G),“秒”字的編碼為SJKD(禾S、小J、丿K、{丿}D),“鞅”字的編碼為GRYS。(革G、冂R、大Y、{丶}S),等等。(4)規(guī)定對所有四元及四元以上字(不論是以大字元或中字元先行,還是以小字元先行)編為四位碼,即規(guī)定為首字元元碼+次字元元碼+第三字元元碼+末字元元碼。如“幕”字的編碼為GFYJ(艸G、日F、大Y、丨J),“作”字的編碼為IIJY(亻I、I、丨J、二Y),“商”字的編碼為OSRU(ニO、 S、冂R、口U),“輩”字的編碼為JNJZ(丨J、三N、丨J、車Z)。
d.詞的編碼的基本規(guī)則,即編碼方法是所有詞均編為四位碼(1)規(guī)定對雙字詞編為前字的首字元元碼+次字元元碼+后字的首字元元碼+次字元元碼,如“生活”的編碼為KYSK(丿K、Y、氵S、丿K),“奮斗”的編碼為YVXB(大Y、田V、 X、十B),“今天”的編碼為DLHY(人D、丶L、一H、大Y),等等;(2)規(guī)定對三字詞的編碼為首字的首字元元碼+次字的首字元元碼+末字的首字元元碼+末字的次字元元碼;如“委員會”的編碼為SUDY(禾S、口U、人D、二Y),“浙江省”的編碼為SSJK(氵S、氵S、小J、丿K),“俱樂部”的編碼為IKWU(亻I、丿K、立W、口U),等等;(3)規(guī)定對四字及四字以上詞編碼為首字的首字元元碼+次字的首字元元碼+第三字的首字元元碼+末字的首字元元碼如“社會主義”的編碼為ZDLL(礻Z、人D、丶L、丶L),“五谷豐登”的編碼為FDNC(五F、八D、三N、癶C),“個人所得稅”的編碼為DDES(人D、人D、 E、禾S),等等。
本發(fā)明中所述的“實末筆劃”是指漢字的橫“一”、豎“丨”、撇“丿”、捺(點)“ 丶”、折“乙”這五種真實末筆劃。它們分別位于英文字母H、J、K、L、P鍵上。它們專門充當以大字元及中字元先行的雙元字及三元字的補充碼,即雙元字及三元字在取完各元碼后,須加補充碼才能得到全碼。所述的“虛末筆劃”是指漢字的五種虛擬末筆劃,外加大括號,即{一}、{丨}、{丿}、{丶}、{乙},分別位于英文字母G. F. D. S. A鍵上,它們專門充當以小字元先行的雙元字及三元字的補充碼。
本發(fā)明中所述的“以大字元及中字元先行的雙元字及三元字的補充碼”,應該取該字的實末筆劃代碼,如江ST+“工”(末筆劃為“一”)的實末筆劃代碼H一,如花GIV+“匕”(末筆劃為“乙”)的實末筆劃代碼P乙;如分DA+“刀”(末筆劃為“丿”)的實末筆劃代碼K丿,等等。而“以小字元先行的雙元字及三元字的補充碼”,應該取該字的虛末筆劃代碼,如主LY+“王”(末筆劃為“一”)的虛末筆劃代碼G{一},如種SUJ+“丨”(單筆劃字元的末筆劃即為該筆劃)的虛末筆劃代碼F{丨}。
本發(fā)明在采用上述輸入法的基礎(chǔ)上還可以提供重碼字的盲打處理的方法,即利用數(shù)字鍵對246個重碼字中的大部分字(約199個)進行識別處理(注另有47個字為無法盲打識別的死碼字),即用數(shù)字鍵5代表橫筆,4代表豎筆,3代表撇筆,2代表捺(點)筆,1代表折筆。利用警鈴提示重碼,識別步驟如下(1)如有未取碼的字元(五元以上),取末二字元的末筆劃代碼;(2)如無未取碼的字元(四元及四元以下),且為上下結(jié)構(gòu)的,取數(shù)字0;(3)如無未取碼的字元(四元及四元以下),且不是上下結(jié)構(gòu)的,取該字首筆劃代碼。
詞的重碼識別也可處理。利用警鈴提示重碼,識別步驟如下(1)取連接鍵“;”;(2)取首字末字元元碼或補充碼(如末字元已被取碼)+次字末字元元碼或補充碼(如末字元已被取碼)。
本發(fā)明是依據(jù)國家語言文字工作委員會標準化委員會1997年頒布的《現(xiàn)代漢語通用字筆順規(guī)范》和《信息處理用GB13000.1字符集漢語部件規(guī)范》的標準進行開發(fā)的。與現(xiàn)有五筆字型輸入法比較,本發(fā)明除了具有字元標準、拆字規(guī)范、規(guī)則易學等特點外,輸入時基本不用字型結(jié)構(gòu)(僅在重碼處理時,用了41個上下結(jié)構(gòu)的字)。其最大的優(yōu)點是在6763個一、二級漢字中,不但字與字重碼率低(121個全碼,占1%),而且大部分字與字重碼可用數(shù)字鍵盲打識別。我們只要用比其它各種輸入法少得多的記憶量(301個<254個字元+47個死碼字>)就能實現(xiàn)全部一. 二級漢字的盲打輸入。此外,字與詞重碼及詞與詞重碼也可盲打識別,是一種理想的漢字輸入法。
以下結(jié)合附圖對本發(fā)明的輸入方法作進一步詳細說明。
圖1是本發(fā)明提供的用于漢字大小字元輸入法的專用鍵盤的實例(26個英文字母鍵上字元分布和部分數(shù)字鍵的示意圖)。
具體實施例方式參照附圖,本發(fā)明字元共有254個,大多數(shù)字元是以首筆劃歸類。其中“橫”首筆字元(由兩手食指負責)是位于鍵盤中線兩側(cè)第一列,即G、T、B、H、Y、N鍵(共6個);其中“豎”首筆字元(也由兩手食指負責)是位于鍵盤中線兩側(cè)的第二列,即F、R、V、J、U鍵(共五個);其中“撇”首筆字元(由兩手中指負責)是位于鍵盤中線兩側(cè)的第三列,即D、E、C、K、I鍵(共五個);其中“點”首筆字元(由兩手無名指負責)是位于鍵盤中線兩側(cè)的第四列,即S、W、X、O、L鍵(共五個);其中“折”首筆字元(由兩手小指負責)是位于鍵盤中線的第五列,即A、Q、P鍵,另有M鍵(食指負責),共四個鍵。此外,Z鍵的大字元為“車(車)”,小字元為其它首筆字元。另有一部分小字元安排在其規(guī)定鍵列的相鄰一列里?!岸薄ⅰ鞍住?、“饣”三個字元分別安排在Q、Z、N鍵上。
本發(fā)明還可提供一級簡碼(僅取首元碼)、二級簡碼(僅取前兩個元碼)和三級簡碼(取前三個元碼)。簡碼是在省去后面元碼后打空格鍵形成的,如一H、水EP、首SKJ.等等。
本發(fā)明輸入法還提供有容錯碼允許判斷錯誤,少數(shù)漢字有兩種全碼,如喪BSWS、NSWS,蒙APYV、GPHV等等。
權(quán)利要求
1.一種漢字大小字元輸入法,主要是利用現(xiàn)有鍵盤上的26個英文字母鍵進行輸入操作,其特征在于a.將漢字中的只有單個字元的獨元字及有兩個或兩個以上字元的復元字中的字元分成“大字元”、“中字元”、“小字元”和“獨元字末筆劃字元”四類,其中所述的大字元是指包含較多漢字數(shù)量的“大部首”或“較大部首”,它們共有26個,包括“艸”、“口”、“氵”、“日”、“人”、“亻”等,這些大字元分別按其首筆劃種類安排在26個英文字母鍵上,并居于本鍵各字元之首,其中所述的中字元是指大字元的簡體或繁體,或與大字元形似的字元,并外加小括號,共有12個,包括(讠)、(钅)、(八)、(己巳)、(士)、(幺 )、(曰 )、( )、(車),在字母鍵上它們跟隨各自相關(guān)的大字元之后,其中所述的小字元是指大字元及中字元除外的字元,共有216個,包括“大”、“貝”、“丿”、“忄”、“廣”、“蟲”等,它們大多數(shù)也按其首筆劃的種類分別各自安排在26個英文字母鍵上。b.將獨元字末筆劃字元,即小字元和中字元獨元字的末字元,并外加中括號,包括[一]、[丨]、[丿]、[丶]、[乙],分別安排在英文字母T、R、E、W及Q鍵上,其元碼,即前述的英文代碼專門充當小字元及中字元獨元字的末字元元碼。c.每個漢字編碼的基本規(guī)則,即編碼的方法是單字的全碼編為三位碼或四位碼,一個單字全碼的編取(1)規(guī)定對獨元字編為三位碼,后加空格鍵,對其中屬于大字元的獨元字的,其編碼是該字元元碼+F+J,對其中屬于小字元和中字元的獨元字,其編碼是該字元元碼+次筆劃字元元碼+該獨元字末筆劃字元元碼,當獨元字為雙筆劃小字元字或雙筆劃中字元字時,其末筆劃也是它的次筆劃,可以重復取用,對其中屬于單筆字或單筆劃的,其編碼是連續(xù)編取三個該字元(或筆劃)元碼;(2)規(guī)定對雙元字編為三位碼,后加空格鍵,即首字元元碼+末字元元碼+實末筆劃代碼(以大字元或中字元先行時),或+虛末筆劃代碼(以小字元先行時);(3)規(guī)定對三元字編為四位碼,即首字元元碼+次字元元碼+末字元元碼+實末筆劃代碼(以大字元或中字元先行時),或+虛末筆劃代碼(以小字元先行時);(4)規(guī)定對所有四元及四元以上字(不論是以大字元或中字元先行,還是以小字元先行)編為四位碼,即首字元元碼+次字元元碼+第三字元元碼+末字元元碼。d.詞的編碼的基本規(guī)則,即編碼方法是所有詞均編為四位碼,(1)規(guī)定對雙字詞編為前字的首字元元碼+次字元元碼+后字的首字元元碼+次字元元碼,(2)規(guī)定對三字詞編為首字的首字元元碼+次字的首字元元碼+末字的首字元元碼+末字的次字元元碼,(3)規(guī)定對四字及四字以上詞編為首字的首字元元碼+次字的首字元元碼+第三字的首字元元碼+末字的首字元元碼。
2.根據(jù)權(quán)利要求1所述的漢字大小字元輸入法,其特征是所述的“實末筆劃”是指漢字的橫“一”、豎“丨”、撇“丿”、捺(點)“丶”、折“乙”這五種真實末筆劃,它們分別位于英文字母H、J、K、L、P鍵上,專門充當以大字元及中字元先行的雙元字及三元字的補充碼,即雙元字及三元字在取完各元碼后,須加補充碼才能得到全碼,所述的“虛末筆劃”是指漢字的五種虛擬末筆劃,即{一}、{丨}、{丿}、{丶}、{乙},它們分別位于G.F.D.S.A字母鍵上,專門充當以小字元先行的雙元字及三元字的補充碼。
3.根據(jù)權(quán)利要求1所述的漢字大小字元輸入法,其特征是所述的“以大字元及中字元先行的雙元字及三元字的補充碼”,應該取該字的實末筆劃代碼,而“以小字元先行的雙元字及三元字的補充碼”,應該取該字的虛末筆劃代碼。
4.根據(jù)權(quán)利要求1所述的漢字大小字元輸入法,其特征是還可以提供重碼字的盲打識別處理方法,即可以利用數(shù)字鍵對246個重碼字中的大部分活碼字進行識別處理,即用數(shù)字鍵5代表橫筆,4代表豎筆,3代表撇筆,2代表捺(點),1代表折筆,識別步驟如下(1)如有未取碼的字元(五元以上),取末二字元的末筆劃代碼,(2)如無未取碼的字元(四元及四元以下),且為上下結(jié)構(gòu)的,取數(shù)字0,(3)如無未取碼的字元(四元及四元以下),且不是上下結(jié)構(gòu)的,取該字首筆劃代碼。
5.根據(jù)權(quán)利要求1所述的漢字大小字元輸入法,其特征是還可以提供重碼詞的盲打識別處理方法,其識別步驟如下(1)取連接鍵“;”,(2)取首字末字元元碼或補充碼(如末字元已被取碼)+次字末字元元碼或補充碼(如末字元已被取碼)。
全文摘要
漢字大小字元輸入法,將漢字中只有單個字元的獨元字及有兩個以上字元的復元字中的字元分成“大字元”、“中字元”、“小字元”和“獨元字末筆劃字元”四類,其中26個大字元分別按其首筆劃種類安排在26個字母鍵上,并居于本鍵各字元之首,12個中字元在字母鍵上位于大字元之后,216個小字元也按首筆劃種類位于26個字母鍵上,將獨元字末筆劃字元分別安排在T、R、E、W及Q鍵上,編碼的方法是單字的全碼有三位碼或四位碼,獨元字和雙元字編為三位碼,后加空格鍵,三元字和四元及四元以上字編為四位碼,所有詞編為四位碼。與現(xiàn)有五筆字型輸入法比較,本發(fā)明除了具有字元標準、拆字規(guī)范、規(guī)則易學等特點外,輸入時基本不用字型結(jié)構(gòu),字與字重碼率低(121個全碼占1%),可用數(shù)字鍵盲打識別,是一種理想的漢字輸入法。
文檔編號G06F3/023GK1519686SQ03115119
公開日2004年8月11日 申請日期2003年1月20日 優(yōu)先權(quán)日2003年1月20日
發(fā)明者郭松森 申請人:郭松森