專利名稱:一種簡便快速的重碼漢字輸入方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種重碼漢字輸入方法以及與此相關(guān)的重碼處理方法,利用這種方法可以方便、快速地輸入重碼漢字。這種方法適用于任何漢字編碼輸入重碼漢字的場合。
漢字輸入是計算機漢字信息處理中的一項重要課題,通常采用小鍵盤漢字編碼輸入方法。由于漢字?jǐn)?shù)量多,編碼中往往遇到重碼,即一個代碼對應(yīng)一個以上的漢字,當(dāng)遇到重碼時就不能根據(jù)代碼唯一地確定漢字,還需要進(jìn)一步處理重碼。絕大多數(shù)漢字編碼都有重碼,有重碼就會影響輸入速度,重碼率越高影響的越大,怎樣處理重碼就成為漢字輸入中的關(guān)鍵問題,重碼處理得好壞直接影響漢字輸入的效率。
通常采用以下三種方法處理重碼。第一種方法就是通過人機對話選擇漢字,當(dāng)遇到重碼時,提示全部或部分重碼漢字,根據(jù)每個漢字的提示序號按鍵選擇。這種方法簡單,但是重碼多時要反復(fù)地選擇漢字,影響了漢字輸入速度。第二種方法是在詞組中確定漢字,輸入詞組第一個漢字的代碼時,如果遇到重碼,不必選擇,接著輸入第二個漢字的代碼,即使再遇到重碼也不必選擇,能夠在詞組中確定這兩個漢字。前一個重碼由后一個漢字確定,后一個漢字由前一個漢字確定,不需要人機對話選擇。這種方法比較方便,也可以提高輸入速度,但是它對不能組詞的漢字無能為力,而且有時侯也有重碼的情況,還需要通過人機對話再選擇。第三種方法通過增加編碼規(guī)則減少重碼。編碼規(guī)則越多,重碼出現(xiàn)的越少,重碼少可以提高輸入速度,但是這種處理方法由于增加了編碼規(guī)則,使編碼難以掌握,使用起來比較困難。具體操作中一般把三種方法結(jié)合使用,在編碼中增加一些規(guī)則,降低重碼率;在輸入漢字時采用詞組輸入,用詞組確定部分重碼漢字;余下的重碼漢字用人機對話方法處理。即使這樣,現(xiàn)有的重碼漢字處理方法還是不能方便、快速地輸入重碼漢字。
《漢字讀音編碼及其集中處理重碼法》(專利申請?zhí)?3117951.3)提出了給重碼漢字加標(biāo)識、通過重碼標(biāo)識處理重碼的方法。這種方法分離了漢字輸入操作和重碼處理操作,在輸入中遇到重碼不必馬上選擇,面是先輸入一個代表漢字,并且給這個代表漢字加上重碼標(biāo)識(內(nèi)部碼第二字節(jié)的最高位為0)。最后再把全部帶重碼標(biāo)識的漢字集中到一起統(tǒng)一處理。這種方法的優(yōu)點在于實現(xiàn)了重碼漢字的盲打輸入,即使有較多的重碼也能象沒有重碼一樣輸入,因此加快了輸入速度。但是這種方法要改變漢字的內(nèi)部碼,與通常使用的雙高位均為1的漢字內(nèi)部碼(國標(biāo)碼)有區(qū)別,在處理漢字信息時必須考慮重碼標(biāo)識,不能與現(xiàn)有的漢字處理軟件兼容,因此使用起來不太方便。
本發(fā)明提供一種不必加重碼標(biāo)識便可以集中處理重碼的方法。輸入重碼漢字不必馬上選擇,臨時輸入一個使用頻度最高的代表重碼字,不必給這個代表字加上重碼標(biāo)識,它的內(nèi)部碼結(jié)構(gòu)與非重碼漢字的內(nèi)部碼結(jié)構(gòu)完全一致。輸入若干漢字后再集中處理其中的重碼漢字,也就是把臨時輸入的代表重碼字經(jīng)過選擇替換成打算輸入的漢字。對于重碼漢字不是根據(jù)重碼標(biāo)識而是根據(jù)一張代表重碼字表來查找。
以拼音碼為例說明重碼漢字的輸入方法和重碼處理方法。首先要有三個相互關(guān)聯(lián)的數(shù)據(jù)表,這三張表用來輸入重碼漢字和處理重碼,基本結(jié)構(gòu)如下代碼 代表重碼字對應(yīng)重碼字a阿啊呵吖鈳腌嗄ai 愛埃礙哀矮挨哎…an 安按案暗岸氨胺…重碼就是對應(yīng)兩個以上漢字的代碼,代表重碼字就是一組重碼字中使用頻度最高的漢字,對應(yīng)重碼字是一組重碼字中除了代表重碼字外的其余重碼字。三個表之間有內(nèi)在的聯(lián)系,代碼與代表重碼字一一對應(yīng),從代碼或代表重碼字可以查到對應(yīng)重碼字。例如輸入“阿”時,輸入代碼a并鍵入空格鍵結(jié)束本次代碼輸入,由轉(zhuǎn)換程序去代碼表中查找a,可以根據(jù)這個代碼在表中的位置找到代表重碼字“阿”和其余對應(yīng)重碼字。這是一個重碼漢字,使用集中處理重碼方法就不必通過人機對話選擇,面是出程序自動先把這個代表重碼字“阿”輸入,在內(nèi)部碼中不加任何標(biāo)識,然后繼續(xù)輸入下一個漢字。臨時輸入的只是這組重碼字中的代表重碼字,代表重碼字可能與所要輸入的漢字不同,如輸入“啊”字時暫時輸入的是代表字“阿”。這樣輸入的好處在于不必選擇重碼漢字,即使是重碼漢字也可以盲打輸入,加快了輸入速度。
按照這種方法輸入完一段漢字后,用一個專用程序來查找其中的重碼漢字。查找重碼漢字時不是根據(jù)重碼標(biāo)識,面是根據(jù)代表重碼字表,可以根據(jù)代表重碼字表區(qū)別重碼漢字和非重碼漢字。專用程序自動測試字符內(nèi)部碼,如果找到一個漢字,就去查代表重碼字表,看它是否為代表重碼字,如果不是代表重碼字就是非重碼漢字,沒有處理重碼的必要;如果是代表重碼字,就根據(jù)這個代表重碼字查到其它對應(yīng)重碼字,用重碼處理方法確定所要輸入的漢字,把代表重碼漢字替換成確定的漢字,這就完成了重碼處理。例如查到“阿”字時,去代表重碼字表中查找,找到了“阿”字,說明這是一個重碼漢字,再根據(jù)代表重碼字和對應(yīng)重碼字的關(guān)聯(lián)查到其余重碼字,利用人機對話等方法選擇所要輸入的漢字。把不確定的代表重碼字替換成選定的漢字,完成了最后的輸入。
現(xiàn)有的漢字編碼輸入方法通常一次性輸入重碼漢字,遇到重碼時馬上用人機對話方法選定之后輸入。采用集中處理重碼方法可以分兩步輸入一個重碼漢字。第一步輸入代表重碼字時不必看屏選字,有很多重碼也可以盲打輸入,提高了速度。第二步處理重碼時可以借助下面介紹的方法方便、快速地確定所要輸入的重碼漢字。分兩步輸入一個重碼漢字比一次性輸入一個漢字更方便、更快速,在輸入大量文字時這個優(yōu)點表現(xiàn)得更加明顯。
在查找重碼、確定漢字時可以使用以下幾種方法。
(1)連續(xù)處理同一個重碼。
在漢字文件中,一個重碼漢字往往重復(fù)出現(xiàn)許多次,一個一個地確定這些重碼漢字非常麻煩,許多都是不必要的重復(fù)勞動。本發(fā)明提供的連續(xù)處理同一個重碼的方法可以方便、快速地確定重復(fù)出現(xiàn)的重碼漢字。
查重程序根據(jù)代表重碼字表(或重碼標(biāo)識)查找重碼字,找到重碼字后根據(jù)代表重碼字查到其余對應(yīng)重碼字,用簡單的人機對話方法選擇確定這個重碼漢字。這是集中處理重碼的基本方法。連續(xù)處理同一個重碼的方法就是根據(jù)這個基本方法連續(xù)處理完一個漢字文件中多次出現(xiàn)的同一個重碼。在處理重碼過程中,查找并處理完一個重碼漢字之后,在文件中繼續(xù)查找這個重碼漢字進(jìn)行處理,對其他重碼漢字暫時不做處理,直到全部處理完文件中出現(xiàn)的這個重碼漢字,再去處理其他重碼漢字。例如在一段文字中重復(fù)出現(xiàn)幾次代表重碼字“阿”,面且不是連續(xù)出現(xiàn)的,中間還隔有其他漢字,在處理重碼時,第一次查到代表重碼字“阿”,根據(jù)代表重碼字找到其他對應(yīng)重碼字,選擇所要輸入的漢字,接下來繼續(xù)尋找“阿”字并處理,處理完全部“阿”字之后再去處理其他重碼漢字。
連續(xù)處理同一個重碼時,在提示行中出現(xiàn)的重碼字及其序號位置完全一樣,選擇一次或幾次之后,可以短時記憶某個漢字的序號。由于連續(xù)選擇同一組重碼漢字,中間不處理其他重碼,面且往往選定的是同一個漢字,所以不必看提示行,根據(jù)短期記憶可以正確地選擇所要輸入的漢字。不必反復(fù)地看提示行,這就減少了找字的負(fù)擔(dān),加快了處理重碼的速度。在具體的操作中,也可以一次選定多次重復(fù)出現(xiàn)的重碼漢字,例如在一段文字中有許多“阿”字,當(dāng)?shù)谝淮芜x定“阿”字之后,以下就自動選擇“阿”字,不需要操作者的干預(yù)。也可以只選定同一詞組中出現(xiàn)的重碼漢字,例如在“阿姨”這個詞中選定“阿”字之后,以下查找“阿”字時,檢測后一個漢字是否為“姨”字,如果是“姨”字便自動選定前一個漢字為“阿”字。這樣處理更方便,也更快。
處理重碼時可以把提示信息移到正在處理的漢字附近,這樣選擇重碼漢字就更方便。在處理重碼時也可以只顯示包含所處理的漢字在內(nèi)的一小段文字,例如前后各三個字,根據(jù)前后幾個字就可以確定所要輸入的漢字,其他文字都不顯示,面且把這一小段文字顯示在固定的位置上,可以避免其他無用信息的干擾。
(2)利用鼠標(biāo)器、光筆等設(shè)備處理重碼。
輸入重碼漢字時暫時輸入一個代表重碼字,要輸入的可能是這個代表漢字,也可能是其他漢字,如果所要輸入的是這個作為代表重碼字的漢字,那么就不必替換這個漢字。上述方法(1)對全部重碼漢字都要選擇一次,即使代表重碼字就是所要輸入的漢字也得選擇一下,這也是不必要的重復(fù)勞動。因為代表重碼漢字是一組重碼漢字中使用頻度最高的漢字,所以很多時侯暫時輸入的代表重碼字就是所要輸入的漢字,只須處理其他需要替換的代表重碼漢字。利用鼠標(biāo)器、光筆等設(shè)備可以做到這一點。
具體方法是把鼠標(biāo)器或光筆指向要替換的漢字,并且選取這個漢字,程序自動識別這個漢字,根據(jù)代表重碼字表判斷這個漢字是否為重碼漢字,如果是重碼漢字,就根據(jù)這個代表重碼字查找其他對應(yīng)重碼字,在這個代表字下面開一個小窗口,把重碼漢字和序號顯示在內(nèi),利用鼠標(biāo)器、光筆或鍵盤選擇處理。因為減少了選擇次數(shù),也提高了處重碼的速度這種方法可以借助于任何能夠移動光標(biāo)的設(shè)備實現(xiàn)。
(3)智能處理重碼。
一個重碼漢字可以在詞語中確定,智能處理重碼的方法就是要在詞組和語句中確定重碼漢字。具體方法如下專用的查重程序根據(jù)代表重碼字表或重碼標(biāo)識自動查找重碼漢字,找到重碼漢字后,再取前一個漢字和后一個漢字,如果前一個漢字或后一個漢字是重碼漢字,則根據(jù)代表重碼字查到其他對應(yīng)重碼字。首先根據(jù)一張詞組表,檢測前一個漢字與正在處理的重碼漢字能否構(gòu)成詞組,要對一組重碼字中的每一個都檢測一次,并記錄檢測結(jié)果。然后用同樣的方法檢測后一個漢字與正在處理的重碼漢字能否構(gòu)成詞組,要對一組重碼字中的每一個都檢測一次,并記錄檢測結(jié)果。根據(jù)檢測結(jié)果做如下判定如果在檢測的全部重碼漢字中,只有一個漢字可以與前一個漢字或后一個漢字組成詞組,那么這個詞組中的漢字就是所選的漢字,程序用這個選定的漢字自動替換代表重碼漢字;如果在檢測的全部重碼漢字中,沒有一個漢字可以與前一個漢字或后一個漢字組成詞組,那么不自動選擇重碼字;如果在檢測的全部重碼漢字中,有一個以上漢字可以與前一個漢字或后一個漢字組成詞組,那么不自動選擇重碼字。由于智能方法能夠根據(jù)詞組和語法自動選定重碼漢字,所以大大地提高了重碼漢字的處理速度。用來檢測構(gòu)詞情況的詞組表應(yīng)該包含所有的常用詞組,根據(jù)需要還應(yīng)有相應(yīng)的專業(yè)詞組和個人詞組,詞量在一萬至三萬之間比較合適。智能處理方法還可以增加語法判斷,進(jìn)一步增進(jìn)智能處理的可靠性。不能由智能方法確定的重碼漢字可以用方法(1)和方法(2)處理。
結(jié)合使用這三種方法可以方便、快速地處理重碼。
由于不同的漢字編碼中的重碼不同,相應(yīng)地代表重碼字和對應(yīng)重碼字也不一樣,只有根據(jù)輸入漢字時使用的代表重碼字表和相應(yīng)的對應(yīng)重碼字表才能正確處理重碼。
本發(fā)明提供的重碼漢字輸入方法和三種重碼處理方法獨立于任何漢字編碼方案,只要編碼有重碼都可以利用它方便、快速地輸入重碼漢字??梢栽诓僮飨到y(tǒng)中使用,也可以在漢字編輯軟件中使用,甚至所有涉及漢字輸入的軟件都能夠使用。
這種方法分兩步輸入一個重碼漢字,也能實現(xiàn)重碼漢字的盲打輸入,即使有較多重碼也不影響輸入速度??梢允购唵蔚臐h字編碼獲得較快的輸入速度,解決了漢字輸入中簡單與快速的矛盾。
本發(fā)明提供的重碼漢字輸入方法與《漢字讀音編碼輸入及其集中處理重碼法》的根本區(qū)別在于不給重碼漢字加重碼標(biāo)識。因為不改變漢字內(nèi)部碼,所以與現(xiàn)有的漢字信息處理軟件完全兼容,使用起來更方便。在漢字輸入中重碼漢字和非重碼漢字沒有區(qū)別,在查找重碼漢字時不是根據(jù)重碼標(biāo)識,面是根據(jù)代表重碼字表判定是否重碼漢字。并且為這種重碼漢字輸入方法提供了三種重碼處理方法,比起《漢字讀音編碼輸入及其集中處理重碼法》的人機對話方法更方便、更快速。這三種重碼處理方法使得漢字輸入真正實現(xiàn)了簡單和快速的統(tǒng)一。
權(quán)利要求
1.重碼漢字輸入方法及其重碼處理方法,其特征是利用重碼與代表重碼字的關(guān)系以及代表重碼字與其對應(yīng)重碼字的關(guān)系分兩步輸入一個重碼漢字,首先輸入不帶重碼標(biāo)識的代表重碼字,然后根據(jù)代表重碼字表判斷哪些漢字是重碼字,并從代表重碼字找到其對應(yīng)重碼字,利用重碼處理方法確定所要輸入的漢字。
2.根據(jù)權(quán)利要求1,把漢字編碼中的重碼、代表重碼字、對應(yīng)重碼字制成數(shù)據(jù)表,這個數(shù)據(jù)表供漢字輸入程序和重碼處理程序使用,其中重碼和代表重碼字一一對應(yīng),從重碼或代表重碼字可以查到與其對應(yīng)的重碼字。
3.根據(jù)權(quán)利要求1或2,輸入重碼漢字時,根據(jù)重碼與代表重碼字的一一對應(yīng)關(guān)系暫時輸入代表重碼字,這個代表重碼字不帶重碼標(biāo)識,其內(nèi)碼結(jié)構(gòu)與非代表重碼字一致。
4.根據(jù)權(quán)利要求1或2,查找重碼漢字時利用重碼代表字表判斷漢字是否為代表重碼字,如果是代表重碼字就根據(jù)它與對應(yīng)重碼字的聯(lián)系找到其余對應(yīng)重碼字,利用相應(yīng)的重碼處理方法確定所要輸入的漢字。
5.根據(jù)權(quán)利要求4,用下面的幾種方法處理重碼(1)處理重碼時連續(xù)處理同一個重碼,全部處理完這個重碼之后再去處理其他重碼;(2)處理重碼時,把查到的對應(yīng)重碼字及其序號顯示在代表重碼字的下面或上面,以便選擇;(3)處理重碼時,利用鼠標(biāo)器、光筆等外部設(shè)備把光標(biāo)移動到代表重碼字處,并選取這個漢字,查到其對應(yīng)重碼字并顯示出來,選擇所要輸入的重碼漢字;(4)處理重碼時利用漢字詞組和漢語語法智能確定重碼漢字,首先由程序自動尋找代表重碼字。并查到其對應(yīng)重碼字,再判斷代表重碼字和對應(yīng)重碼字是否與前后漢字構(gòu)成詞組,同時判斷是否符合漢語語法,能夠唯一地與前一字或后一字組成詞組,并且符合漢語語法,那么程序自動選擇這個重碼漢字。
全文摘要
本發(fā)明提供一種方便、快速地輸入重碼漢字的方法。輸入重碼漢字時首先輸入不加重碼標(biāo)識的代表重碼字,然后根據(jù)代表重碼字表判斷哪些漢字是重碼漢字,哪些漢字不是重碼漢字,根據(jù)代表重碼字與對應(yīng)重碼字的聯(lián)系,利用方便的重碼處理方法確定其中的重碼漢字。這種方法適用于任何漢字編碼輸入重碼漢字的場合。
文檔編號G06F3/023GK1122468SQ9510108
公開日1996年5月15日 申請日期1995年1月17日 優(yōu)先權(quán)日1995年1月17日
發(fā)明者蘭久富 申請人:蘭久富