去末點漢字輸入法
【專利摘要】一種計算機漢字編碼輸入方法即去末點漢字輸入法,它由音碼和形部編碼兩部分組成,通過優(yōu)選取碼規(guī)則,去掉某些漢字末筆點的辦法,只需選用28個左右的多筆畫部件和五種基本筆畫就能做到既簡單又低重碼、快速方便地輸入漢字。
【專利說明】去末點漢字輸入法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于電腦漢字編碼輸入方法,也就是計算機漢字編碼輸入法。因為本輸入法規(guī)定編碼時,要將部分漢字的末點略去,再進行編碼,所以稱為去末點漢字輸入法,還涉及了為實現(xiàn)這一輸入法的鍵盤。
【背景技術(shù)】
[0002]鍵盤輸入法是目前漢字輸入法中技術(shù)最成熟,使用最廣泛的輸入法。鍵盤輸入的特點是必須對輸入的漢字進行編碼,漢字編碼是指用一組代碼表示一個漢字,按漢字編碼所在鍵,通常要按I?4鍵輸入一個漢字。鍵盤輸入按編碼劃分,可分為音碼、形碼、音形碼三類。
[0003]音碼以漢語拼音為基礎(chǔ),利用漢字的讀音進行編碼。音碼的優(yōu)點是使用方便,只要會懂漢字拼音,就可以進行輸入,簡單易學(xué),所以使用最為廣泛。缺點是同音字多,導(dǎo)致單字重碼率高,漢字輸入速度慢,采用智能拼音輸入法也只能部分提高輸入速度,無法完全避免同音字選擇。還有對不認識的字無法用拼音直接輸入,對發(fā)音不準的字和冷僻字也不能很快輸入。
[0004]形碼利用漢字的字形特征進行編碼,克服了音碼重碼率高、輸入速度慢等缺點,但往往漢字部件太多,記憶麻煩,有時拆分也麻煩。有的形碼采用將漢字五種基本筆畫二二組合的方法,漢字部件少,記憶方便,但卻付出了不夠直觀,將漢字部件拆散了的代價。雖然形碼雖然聲稱對不認識的漢字也能迅速輸入,但對于一個文盲來說,他打字的速度是要受限制的,根本原因是漢字的字與詞無明顯間隔,不知道哪個是詞組,無法利用詞組輸入,因此形碼輸入人員也要有文化。
[0005]音形碼利用漢字的語音特征和漢字的字形特征編碼。它利用了漢字的音碼和形碼各自的優(yōu)點,兼顧了漢字的音和形,往往較為簡單,容易學(xué)習(xí)和記憶,有的音形碼比如三五音碼等輸入法重碼率低,輸入速度足以與任何形碼相比,利用整個拼音參與編碼的音形碼還有利于推廣普通話,優(yōu)點十分明顯。音形碼的缺點是打字時在音和形之間思維不斷轉(zhuǎn)換,容易疲勞。當(dāng)然對熟練的打字者來說,往往已熟記漢字的編碼,見字識碼,根本不存在音和形之間思維轉(zhuǎn)換問題。還要指出的是,只用漢字聲母參與編碼的音形碼,由于必須舍棄韻母,與人們的習(xí)慣思維不符,才特別存在音形思維轉(zhuǎn)換問題。如果完整地利用了漢字的聲母和韻母,即利用了漢字的整個拼音,并且規(guī)定音碼部分在先,形部編碼部分在后的話,則思維不大需要在音和形之間不停轉(zhuǎn)換,基本上不會影響思維。因為在一般的文章中,大多數(shù)都是詞語,平常打字時,往往盡量采用詞組輸入的方式,因此大部分內(nèi)容都可用拼音詞組輸入。還有一些常用的字也可用拼音輸入,即便要用到形部編碼,一般也只要輸入形部編碼的第一碼,而形部編碼的第一碼多為漢字的偏旁部首,偏旁部首數(shù)量是有限的,且常見偏旁部首數(shù)量更少,一般都有固定編碼代碼,是很容易記住形部編碼的第一碼的。真正需要輸入形部編碼第二碼的單字是很少的,只有這少部分漢字才不大容易記住形部編碼,由于輸入形部編碼的第一碼后,第二碼會提示出來,實際上沒有多大必要記住形部編碼第二碼,因此這種音形碼基本上不會影響思維,思維甚至比形碼更簡單。所以如果想發(fā)明音形碼,為避免音形轉(zhuǎn)換麻煩,要盡量利用漢字的整個拼音輸入,而不要只利用拼音的首字母或聲母。受方言的影響,有些人讀不準某些漢字的拼音,但這也可通過南方模糊音解決,而且多利用拼音輸入漢字也有利于推廣普通話。正因為如此,整個漢字拼音在先的音形碼相對與其它音碼、形碼、只用漢字拼音首字母的音形碼來說,越來越顯示出其優(yōu)越性。
[0006]音碼有全拼、雙拼、注音字母拼音幾種,全拼采用漢字的標(biāo)準拼音來輸入漢字,可音碼使用全拼的話,則存在著全拼的碼長過長,輸入不便的問題,使用雙拼則能使碼長大為縮短,雙拼將漢語拼音的聲母、韻母分別用一個字母表示,因而只要擊兩次鍵就可以輸入一個漢字??赡壳暗拇蠖鄶?shù)雙拼的韻母排列都比較難記,要記什么口訣,所幸的是本人發(fā)明了幾種新的雙拼,由于發(fā)明人是王治陽,所以稱為王治陽雙拼,已申請專利,很簡單易學(xué),不要記口訣,幾分鐘就可學(xué)會,記憶雙拼已不成問題。因此發(fā)明音形碼的關(guān)鍵是發(fā)明出簡單易學(xué)且能有效區(qū)分同音字的方法,這就要靠音形碼的形部編碼設(shè)計簡單合理。有的輸入法也稱形部編碼為輔助碼。然而目前各種利用了整個拼音的音形碼的形部編碼往往存在漢字部件過多或部件不夠直觀規(guī)范或取碼規(guī)則不合理或重碼多等問題。如何解決這個問題是一個長期未能解決的大難題。
【發(fā)明內(nèi)容】
[0007]這樣,目前的漢字輸入法要么漢字部件不規(guī)范或選取漢字部件過多;要么碼長太長;要么重碼過高,影響輸入速度;要么只利用漢字的聲母或拼音首字母;要么不夠直觀;要么取碼規(guī)則不太合理,會影響頭腦反應(yīng),都沒能很好解決簡單的不快速,快速的不簡單這一技術(shù)難題,輸入漢字不甚方便。
[0008]本發(fā)明的目的是提供一種漢字部件規(guī)范直觀、簡單易學(xué)、取碼規(guī)則合理、輸入漢字簡便快捷的計算機漢字編碼輸入方法,那就是去末點漢字輸入法。
[0009]為達到去末點漢字輸入法的目的,本發(fā)明規(guī)定去末點漢字輸入法的編碼由音碼和形部編碼這兩個部分組成。音碼部分建議采用王治陽雙拼,占二碼。形部編碼部分也最多占二碼。當(dāng)然音碼也可用全拼或其它雙拼或注音字母拼音或不完整拼音。
[0010]音碼部分很多人喜歡采用全拼,因為全拼根本不必學(xué)習(xí),所以音碼部分也可采用全拼,臺灣人可采用注音字母拼音。但為提高輸入速度,建議采用雙拼,最好采用王治陽雙拼。王治陽雙拼對那些按漢語聲韻互補規(guī)律中沒被合并的多個字母組成的韻母按第一個字母分為&、0、6、1、11區(qū),每區(qū)又按韻母個數(shù)多少以及&、0、6、1、11、114的順序排列,極具規(guī)律性,當(dāng)然也可不按韻母的個數(shù),只按a、O、e、i、U、n、g的順序?qū)㈨嵞阜謪^(qū)排列。唯一需要記憶的是雙拼韻母的合并規(guī)律。在記憶雙拼韻母合并規(guī)律時,只要記住以a、ong結(jié)尾的多個字母的韻母合并,以ang結(jié)尾的4個字母的韻母合并排列就是,ia被ua合并,iang被uang合并,iong被ong合并,以U開頭的多個字母的韻母均被以u開頭的多個字母的韻母合并,另外Ui被V合并,UO被ο合并,讀音簡記為“為余”(為我),“我窩”。
[0011]形部編碼也由兩個代碼組成,本發(fā)明優(yōu)選了五種基本筆畫和28個左右的多筆畫部件參與編碼,這五種基本筆畫和28個左右的多筆畫部件被統(tǒng)稱為基本部件,全部選自漢字的偏旁部首,既簡單常見又直觀,并且數(shù)量少,容易記憶。由于國家語委將五種基本筆畫也稱為漢字部件,因此在本發(fā)明中稱五種基本筆畫稱為單筆畫部件,而其它28個左右的優(yōu)選的漢字部件由多個筆畫組成,稱為多筆畫部件。在形部編碼時要優(yōu)先按筆畫多的基本部件編碼,否則由于多筆畫部件可拆分成單筆畫部件,若按單筆畫部件編碼的話,選取多筆畫部件就無意義。形部編碼的取碼規(guī)則是:按書寫順序,取漢字的首尾二個基本部件的代碼編碼,只有一個基本部件的漢字,就只取這個基本部件的代碼編碼,但當(dāng)某個漢字的末筆為點(捺)并且該漢字最末的基本部件不是優(yōu)選的多筆畫部件時,再取去掉該漢字的末二筆后的最末一個基本部件的代碼編碼,如果某個漢字去掉末二筆后,只剩一個已經(jīng)編碼過的基本部件或沒有基本部件時,不再去掉該漢字的末二筆,取單筆畫部件點的代碼進行編碼。
[0012]這一編碼規(guī)則是本人歷時20年潛心研究、反復(fù)思考、千錘百煉后的結(jié)晶,該取碼規(guī)則針對漢字末筆為點多的特點,結(jié)合音形碼在取首尾部件編碼時常遇到又、厶、八、乂、小、夂、文、戈、小、豕、衣、大、寸等末筆為撇、點或為折、點或豎、點的漢字部件,如果不選取這些部件,往往會付出重碼太多的代價,如果選取這些漢字部件又會增加部件數(shù)量,造成記憶困難,而采用這一編碼規(guī)則,就能有效減低重碼,并且減少漢字部件數(shù)量,做到簡單易記。
[0013]下面再解說優(yōu)選基本部件的方法。在國標(biāo)6763個漢字中,合體字占了絕大多數(shù),約為95%。同音又同偏旁部首的合體字數(shù)量較多,約有五、六百對。其中?、*、口、木、?、韋d、女、1、個、月、蟲、土、鄉(xiāng)、火、廣、、、山、石、日U、魚、禾、貝等偏旁部首產(chǎn)生的同音字較多,為降低重碼,這些偏旁被選了出來,分別用一個字母或別的符號編碼,當(dāng)然個別偏旁也可棄而不選,之所以選“貝”是為了繁體簡體兼容。有的偏旁部首如“田”、“目”、“?!?、“年”、“巾”、“十”、“~”等漢字部件雖然常用,可選了這些漢字部件只能減少幾對重碼,可選可不選,這樣,26個左右的多筆畫部件和五種基本筆畫被優(yōu)選出來,排列到鍵盤上,將這26個左右的多筆畫部件分別用一個相應(yīng)的字母或標(biāo)點符號編碼,在編碼實例中將這些多筆畫部件盡量排在不同的字母鍵上,若優(yōu)選“田”、“目”等漢字部件的話,也可將它們分別與26個優(yōu)選的多筆畫部件合并排列在鍵上,用同一個字母或標(biāo)點符號編碼。部件1_、卩、鳥慣常出現(xiàn)在漢字的字尾,其中卩已被列為基本部件;部件“鳥”也會產(chǎn)生幾個的重碼,就將部件“鳥”列為多筆畫部件;部件“1_”的首筆為點,由于點在漢字的末尾位置出現(xiàn)得較多,將部件“1_”按點編碼容易造成重碼,就將它列為基本部件。為降低重碼,將1_與廣合并排列,用同一個字母或其它符號編碼。這樣共優(yōu)選了 28個左右的多筆畫部件。而五種基本筆畫則可從減少重碼角度出發(fā),也分別用一個字母或符號編碼,其中的幾個組字頻率相對較低的基本筆畫如折的等,還與某個多筆畫部件合并排列在同一個鍵上,用同一個字母或其他符號編碼。當(dāng)然這28個左右的多筆畫部件不是固定的,可少于28個多筆畫部件,也可多于28個多筆畫部件,只要28個左右即可,例如也可將漢字部件“十”入選,用一個字母或標(biāo)點符號編碼。
[0014]為便于記憶,在去末點漢字輸入法中排列多筆畫部件時不按筆畫數(shù)和橫、豎、撇、點、折的次序排列,而按拼音或象形排列,見附圖3或附圖4所示。附圖3以按基本部件的拼音字母排列為主,對少數(shù)幾個拼音首字母或聲母相同的基本部件改按象形的方式排列。這樣由于按基本部件的讀音編碼幾乎無需記憶,少數(shù)幾個改按象形的方式排列的基本部件也能很快記住,記憶量很小,因此極為簡單。附圖4完全按象形排列,可漢字的方塊筆畫部件與西文字母畢竟有所區(qū)別,難以做到十分相像,需要按象形記憶的漢字基本部件就要多上幾倍,記憶量也相應(yīng)多上幾倍,因此本發(fā)明也不太建議用這種方式排列經(jīng)過反復(fù)優(yōu)選的基本部件。當(dāng)然有人可能更喜歡這種排列方式。形部編碼的取碼規(guī)則均可采用附圖3或附圖4編碼。
[0015]橫、豎、撇、點等基本筆畫橫、豎、撇、點等基本筆畫在形部編碼中出現(xiàn)的頻率較高,為降低重碼,不宜與基本部件排在同一個鍵上。將這四個基本筆畫排到標(biāo)點符號鍵上,分別用一個標(biāo)點符號編碼的話比較合理。折因為組字頻率低,與某些多筆畫部件排在同一個鍵上,用同一個字母或別的符號編碼的話,幾乎不會導(dǎo)致重碼,因此就按拼音首字母排列。當(dāng)然硬要將橫、豎、撇、點等基本筆畫與多筆畫部件排在同一個鍵上,也是可以的。
[0016]這樣,通過優(yōu)選28個左右的多筆畫部件和五種基本筆畫,創(chuàng)造性地規(guī)定取碼規(guī)貝U,就做到了形部編碼既簡單易記,又能有效地區(qū)分同音字,重碼率很低,輸入速度足以與其他任何輸入法相比。這就解決了其他任何輸入法都未能解決的難題,真正做到了簡單直觀、重碼率很低、輸入速度高,是一種唯一的理想的標(biāo)準的漢字輸入法。
【專利附圖】
【附圖說明】
[0017]附圖1為王治陽雙拼鍵盤排列圖之一
[0018]附圖2為王治陽雙拼鍵盤排列圖之二
[0019]附圖3為形部編碼鍵盤排列圖之一
[0020]附圖4為形部編碼鍵盤排列圖之二
【具體實施方式】
[0021]去末點漢字輸入法由兩部分組成,一部分是音碼,即拼音,或稱拼音碼,另一部分是形部編碼。這兩部分組成編碼時可以是音碼在先,形部編碼在后;也可以是形部編碼在先,音碼在后。但一經(jīng)選定,次序就不能改變。為便于想打,與思維一致,又能充分利用標(biāo)點符號鍵,建議拼音在先,形部編碼在后,在編碼實例中就采用這種方法。拼音可采用全拼或雙拼或簡拼或不完整拼音,不想學(xué)習(xí)雙拼的人可采用全拼,即采用一個漢字的標(biāo)準拼音。為縮短碼長,提高輸入速度,建議采用雙拼,最好采用幾分鐘可學(xué)會的王治陽雙拼。當(dāng)然也可采用全拼,它幾乎不要記憶?,F(xiàn)在漢字輸入技術(shù)有了很大的進步,可做到全拼、雙拼兼容,而不需要調(diào)整輸入法狀態(tài)。在實施例中音碼選用王治陽發(fā)明的雙拼,同時也可規(guī)定兼容全拼。
[0022]王治陽雙拼是一種聲母、韻母的鍵位配置合理,在鍵盤上排列規(guī)律性強的雙拼計算機漢字輸入法??蓡为氉鳛橐环N輸入法使用,也可作為去末點漢字輸入法的音碼部分使用。
[0023]王治陽雙拼的技術(shù)方案的特征在于:
[0024](I)單個字母的聲母與各字母鍵一致,而翹舌音ch、sh、zh按音序分別用1、u、v表示,以便于記憶,當(dāng)然也可改而將ch用u表示,sh用i表示,zh仍用V作代碼,單韻母U用字母V表示。根據(jù)韻母的語音互補關(guān)系,單個字母的韻母除了可排按聲韻合并規(guī)律,被它包含的韻母外,不能再排其它韻母。對按聲韻互補規(guī)律沒被合并的多個字母組成的其它的復(fù)韻母和鼻韻母也用單個字母表示,開口呼韻母配置在標(biāo)準鍵盤中排,并按第一個字母分為
a、O、e區(qū);齊齒呼韻母配置在鍵盤上排,稱為i區(qū),合口呼和撮口呼韻母配置在標(biāo)準鍵盤下排,稱為u區(qū),包括U區(qū);每區(qū)又按韻母字母個數(shù)從左到右排列,字母個數(shù)相同的韻母按a、
o、e、1、u、n、g的次序從左到右排列。見附圖1。當(dāng)然也可將合口呼和撮口呼韻母配置在鍵盤上排,稱為u區(qū),齊齒呼韻母配置在鍵盤下排,稱為i區(qū)。在編碼實例中不這么排列。[0025](2)各韻母與字母映射關(guān)系設(shè)定為:
【權(quán)利要求】
1.一種計算機漢字編碼鍵盤輸入法即去末點漢字輸入法,將漢字的各種筆畫歸類為橫、豎、撇、點、折五種基本筆畫,將這五種基本筆畫稱為單筆畫部件,由多個筆畫組成的漢字部件,稱為多筆畫部件,單筆畫部件和多筆畫部件統(tǒng)稱為基本部件,其特征是: (1)編碼由兩部分組成,一部分是音碼,即拼音,或稱拼音碼,另一部分是形部編碼,這兩部分組成編碼時,可以是音碼在先,形部編碼在后;也可以是形部編碼在先,音碼在后,但一經(jīng)選定,次序就不能改變; (2)音碼采用漢字的標(biāo)準拼音或雙拼或注音字母拼音; (3)形部編碼的取碼規(guī)則是:按書寫順序,取漢字的首尾二個基本部件的代碼編碼,只有一個基本部件的漢字,就只取這個基本部件的代碼編碼,但當(dāng)某個漢字的末筆為基本筆畫點并且該漢字最末一個基本部件不是優(yōu)選的多筆畫部件時,再取去掉該漢字的末二筆后的最末一個基本部件的代碼編碼,如果某個漢字去掉末二筆后,只剩一個已經(jīng)編碼過的基本部件或沒有基本部件時,不再去掉該漢字的末二筆,取單筆畫部件點的代碼進行編碼; (4)形部編碼時,多筆畫部件的編碼方法是:偏旁?、*、口、木、?、韋^必須被選出,分別用一個字母或別的符號編碼;偏旁女、1、個、月、蟲、土、鄉(xiāng)、火、廣、1_也要被選出,分別用一個字母或別的符號編碼;偏旁、、山、石、日、王、卩、魚、禾,也分別用一個字母或別的符號編碼;基本筆畫橫、豎、撇、點、折分別用一個標(biāo)點符號或字母編碼。
2.根據(jù)權(quán)利要求1所述的去末點漢字輸入法,其特征是:雙拼采用王治陽雙拼: 各韻母與字母的一種映射關(guān)系設(shè)定為:
3.根據(jù)權(quán)利要求1所述的去末點漢字輸入法,其特征是:形部編碼時,基本部件與字母、標(biāo)點符號的一種映射關(guān)系設(shè)定為:
4.根據(jù)權(quán)利要求1所述的去末點漢字輸入法,其特征是:同類基本部件,用同一字母編碼,這類基本部件如:和竹,足和,彳和人和言,韋和金和水、氺,?和手,丨和心,纟和g ,土和士。
5.根據(jù)權(quán)利要求1所述的去末點漢字輸入法,其特征是:組字頻率很高的多筆畫部件?、*、口、木、?、韋、彳不宜映射到組字頻率很高的y、j、l、x鍵上,而要盡量將這些高頻的多筆畫部件映射到組字頻率較低的a、O、e、r鍵上。
6.根據(jù)權(quán)利要求3所述的去末點漢字輸入法,其特征是:主要以多筆畫部件的讀音的拼音首字母或聲母為代碼,多筆畫部件與字母的一種映射關(guān)系為:a的大寫A與韋相似;b是廣的聲母;c是*的聲母;d是?的聲母;e是禾的韻母;f似? ;g形似貝、鳥;h是火的聲母;i因為ch排在其上,而ch是蟲的聲母;j是鄉(xiāng)的聲母;k是口的聲母;L似魚的左上角;m是木的聲母;η是女的聲母;0似月亮的外形;P似P ;Q似日,就作為日代碼;r是彳的聲母;s是石的拼音的首字母;t是土的聲母;u因為sh排在u上,而sh是山的聲母;v因為zh排在u上,而zh是的聲母;w是王的聲母;X是丨的聲母;Y是i的聲母;z是和折的聲母;這些字母就分別作為相應(yīng)的基本部件的代碼; 或者主要以多筆畫部件與英文字母的相似程度編碼,筆畫部件與字母的另一種映射關(guān)系為:大寫a似^ ;大寫b似日;c似貝、鳥外形;大寫e似山;f似孑;g似足、鳥;大寫h似廿;i似i ;j似廣;k似;1似個;m似木;η似月;0似口;P似P ;大寫q似蟲;大寫r似女;s似? ;t似土;u似魚;V似韋;w似鄉(xiāng);x似火;y似禾;z似王;這些字母就分別作為相應(yīng)的基本部件的代碼。
7.根據(jù)權(quán)利要求1所述的去末點漢字輸入法,其特征是:基本筆畫橫、豎、撇、點與多筆畫部件用不同的字母或其他符號編碼。
8.根據(jù)權(quán)利要求1所述的去末點漢字輸入法,其特征是:詞組的取碼規(guī)則是:雙字詞,分別取每個字完整編碼的前2碼;三字詞,前兩個字取完整編碼的第I碼,第三個字取前2.碼;四個及以上的字組成的詞組,取第1、第2、第3和最后一個字完整編碼的第I碼。
【文檔編號】G06F3/023GK103838389SQ201210527683
【公開日】2014年6月4日 申請日期:2012年11月26日 優(yōu)先權(quán)日:2012年11月26日
【發(fā)明者】王治陽 申請人:王治陽