背景技術(shù):
現(xiàn)有漢字編碼鍵盤輸入,主要分為音碼、形碼兩類。
音碼以漢字的拼音為編碼,以拼音字母或其特定組合映射鍵盤字母鍵或數(shù)字鍵等,通過擊鍵輸入漢字的拼音編碼完成漢字輸入,它要求目標漢字有音且使用者掌握其讀音,否則無法輸入。
形碼以按特定序列提取被賦予代碼的特定特征獲得相應漢字編碼,其涉及漢字特征基本都是部件、筆畫分類、筆順等較復雜的漢字專有知識,它要求使用者具備相應的漢字教育背景,否則難以學習掌握。
本發(fā)明的目的是提供一個基于漢字字形中簡單幾何特征建立的一種數(shù)字分類管理漢字并可運用于鍵盤輸入的方法、方案,其作用包括但不限于可以作為任何其它漢字輸入方案的輔助配套方案,以進一步提高原方案的漢字輸入精確度或輸入效率,其特點還在于涉及的漢字特征為簡單幾何特征,基本不需要漢字知識也能識別,不具備漢字教育背景者也能掌握使用本發(fā)明所涉及的方法、方案。
技術(shù)實現(xiàn)要素:
漢字本質(zhì)是數(shù)量不等的幾何線段(筆畫)構(gòu)成的二維平面圖案,其不同筆畫呈現(xiàn)長短、正斜、鋒鉤等多種形態(tài),不同筆畫相互之間,形成相連、相交、平行等多種形態(tài)特征。
本發(fā)明選擇表露在漢字底部的鉤筆形——稱為“底鉤”,及任意兩筆畫相交的形態(tài)——稱為“交叉”,作為數(shù)字化分類漢字的有效特征,按不同情況將漢字分為可用數(shù)字0~9代表的十類:
1、計算目標漢字包含的“交叉”特征數(shù)量,但數(shù)量超過四個后忽略不計,以數(shù)量得數(shù)作為目標漢字代碼,從而使得所有漢字分別獲得0~4五個不同代碼之一;
2、看目標漢字是否有表露到底部的帶鉤筆畫,如豎鉤(如“扌”)、彎鉤(如“犭”)、提勾(如“钅”)、臥鉤(如“乙”)等,如有,則上一步獲得的漢字數(shù)字代碼加上5,改變?yōu)橐粋€6~9的數(shù)字代碼。
步驟2可以改為根據(jù)其它簡單幾何特征如目標漢字是否包含表露到底部的露鋒的橫豎筆畫或各面首、末筆畫特征等決定步驟1獲得的數(shù)字是否加5得到相應分類代碼。
由此,每個漢字都將獲得一個0~9之間的數(shù)字代碼,換而言之,全部漢字或特定漢字集的所有漢字,都可以通過本方法,分類為代碼分別為0~9的十類。
例:方:5(零“交叉”有“底鉤”:0+5=5) 漢:1(一“交叉”無“底鉤”:1)
塊:3(三“交叉”無“底鉤”:3) 字:6(一“交叉”有“底鉤”:1+5=6)
將本分類輸入方法作為其他輸入法的輔助方法時,可以顯著提高其效率。例如作為全拼輸入法的輔助輸入,則基本集多達111字的yi拼音同碼字,經(jīng)過本方法進一步分類,得到如下分類結(jié)果:
0:熠頤翌宜衤沂益溢縊怡一眙貽嗌 5:翊亦衣疙食裔意癔誼依仡詒飴以佾詣屹易邑乙已億噫臆悒憶
1:矣奕壹移疫逸義嶷儀醫(yī)役殪疑 6:射弋銥倚旖鐿懿鎰劓議刈埸釔毅圯
2:羿弈遺迤佚異黟 7:翳苡藝蛇椅薏猗艤漪蜴挹囈抑
3:翼咿彝瘞蟻泄伊繹懌嶧 8:驛譯揖
4:夷痍荑姨肄軼咦 9:蛾胰酏
顯然極大分化了同碼字,大大提高實際輸入效率。同理,也能大大提高詞的輸入效率。
具體實施方式以上述方法建立漢字集分類數(shù)字代碼表,如作為其它輸入法漢字編碼的輔助碼,則將分類數(shù)字代碼附加在相應漢字編碼后,通過系統(tǒng)建立數(shù)字代碼與物理鍵盤中約定鍵的映射關(guān)系,將漢字代碼1、2、3、4、5、6、7、8、9、0分別映射到標準英文鍵盤a、s、d、f、g、h、j、k、l、m鍵或q、w、e、r、t、y、u、i、o、p鍵,或其它約定字母鍵序列,或數(shù)字鍵盤相應的數(shù)字鍵,從而通過鍵盤相應鍵位輸入目標漢字數(shù)字代碼,通過系統(tǒng)轉(zhuǎn)換輸出代碼相應漢字,完成目標漢字輸入。