專利名稱:一種圖形文字的輸入方法及其鍵盤的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于文字信息處理領(lǐng)域,更準確地說,本發(fā)明涉及一種圖形文字的輸入方法及其鍵盤。
利用計算機進行文字識別信息處理時,首先要解決字形輸入這個問題。對于字符較少的拼音文字,這早已不成其問題。對于字數(shù)眾多、結(jié)構(gòu)復(fù)雜的漢字,這個問題則比較復(fù)雜。迄今為止,我國已有數(shù)百種漢字編碼鍵盤輸入方案,其中有電報碼一類無理編碼,也有利用漢字音、形、義等信息特征的有理編碼。利用漢字字形結(jié)構(gòu)信息進行編碼,抓住了漢字作為一種圖形文字的本質(zhì)特征,因而是方案最多,又最易為人們普遍接受的一種方法。
常見形碼都要確立漢字的結(jié)構(gòu)層次,一般認為漢字具有筆劃、字根、單字三個層次,且大都遵循拆分單字、離析字根、處理筆劃三個步驟。不同形碼的差別主要在于具體處理手段上的差異。不少形碼都列出一個字根表,不同形碼的差別就集中反映在字根的數(shù)量及分類的區(qū)別上。事實上,漢字平均筆劃數(shù)在十二劃左右,常用漢字都比較簡單,拆成字根后往往發(fā)現(xiàn)所需編碼信息過少,以致重碼率高,于是想方設(shè)法補加區(qū)別信息,使得使用起來很不方便。
我們目前所使用的文字是書寫年代的遺物,其字形結(jié)構(gòu)保留著太多的書寫痕跡,對文字的電腦識別極為不利。文字從書寫年代進入電腦時代,單靠優(yōu)秀的編碼方案顯然是無法從根本上解決問題的,文字的電腦化顯得愈來愈重要,我們的電腦操作人員要花費大量的時間學(xué)習(xí)文字的輸入是一種巨大的社會浪費。我國文字改革已取得了巨大的成就,但我們應(yīng)該看到,漢字簡化后雖去掉了大量的視讀冗余信息,卻并非完全為漢字進入電腦服務(wù),不少漢字結(jié)構(gòu)顯得過于簡單,給編碼工作帶來一定困難,而且不少漢字部件并非真正意義上的規(guī)范化,因此有必要進一步規(guī)范漢字字形結(jié)構(gòu)。
本發(fā)明的目的在于提供一種用一套有規(guī)律的簡單圖形作為圖形文字字形結(jié)構(gòu)信息特征單元來輸入各種圖形文字的方法,根據(jù)本方法的思想可以進一步對漢字字形進行規(guī)范化工作。
本發(fā)明的另一目的在于提供一種可以輸入各種圖形文字的鍵盤,利用該鍵盤,還可以輸入各種合乎規(guī)范的圖形符號。
本發(fā)明認為將一些有規(guī)律的簡單圖形作為圖形文字字形結(jié)構(gòu)的基本信息單元,可使數(shù)量眾多、結(jié)構(gòu)復(fù)雜、形狀各異的圖形文字及各種常用符號用這些簡單圖形來表示,按照一定的規(guī)則輸入這些簡單圖形就可以完成相應(yīng)的圖形文字的輸入。根據(jù)本發(fā)明提供的原理和方法,還可以創(chuàng)制一種完全合乎規(guī)范的文字符號和圖形。
本發(fā)明將橫豎直線段構(gòu)成的最基本的圖形稱作字元。字元可以這樣得到在一個正方形格子上,兩個八卦符號垂直相交構(gòu)成八卦圖元,其陽爻所構(gòu)成的圖形稱作字元。字元是一種相當規(guī)范的字符,結(jié)構(gòu)簡單,容易識別。通過歸納,字元具有這樣十九種基本結(jié)構(gòu) 日田。前三種只具一種方向,稱一維字元,后十六種具有兩個方向,稱二維字元。
經(jīng)過研究發(fā)現(xiàn),拉丁字母與八卦圖元基本結(jié)構(gòu)間存在著對映關(guān)系A(chǔ)→ 、B→ 、C→ 、D→ 、E→ 、F→ 、G→ 、H→ 、I→ J→ 、K→ 、L→ 、M→ 、N→ 、O→ 、P→ 、Q→ 、R→ S→ 、T→ 、U→ 、V→ 、W→ 、X→ 、Y→ 、Z→ 。其中I表示向上或正向,R表示向下或反向。L、M、N、S、P、U、V、W各表示一定方向或旋轉(zhuǎn)角度。如果用M表示將圖形順時旋轉(zhuǎn)90°的話,則EM可表示將E旋轉(zhuǎn)至 狀態(tài),依此我們可以輸入處于八種位置狀態(tài)的拉丁字母。同樣原理我們可以輸入某個字符旋轉(zhuǎn)后的八種狀態(tài)。
八卦圖元不僅可以旋轉(zhuǎn)變化,產(chǎn)生各種方位圖形。還可以通過衍變產(chǎn)生各種復(fù)雜的字符。字元上的直線段被某一字元替代時可產(chǎn)生一階字符,如“十”可衍變生成 豐、井、中、申、甘。一階字符同樣可衍變出二階字符、高階字符,如 可衍變出冊、世、我。新字符中的替代字元可依次稱作一階字元、二階字元、高階字元。將字符中的字符字元特征和替代字元等結(jié)構(gòu)信息提取出來,可完成該字符的輸入如漢字“重”,其字元衍變依次為王→→重,一階、二階字元依次為三、日,輸入“王、三、日”三個字元可完成該字符的輸入。較為復(fù)雜的是由字元“一、 川、 ”等一維字元衍變出來的字符。如漢字“胡”,其衍變順序可認為是 → → → ,分析起來比較麻煩。一般地,可將該字符拆分成幾個獨立的部件,即通常所說的字根。按照書寫順序,“胡”可拆分成“十、口、月”或“古、月”等形式,不同拆分意味著輸入方法的不同。本方案將“胡”拆分成“十、口、月”,是因為這些部件更接近字元狀態(tài)。本方案對字根有嚴格的定義,所謂字根是指若干互不接觸的筆劃構(gòu)成的具有一維字元特征的組合,如二、三、川,或若干筆劃互相接觸且具有二維字元特征的組合,如口、日、月可見“古”不是本發(fā)明所稱的字根,而“甲”則是一個字根。本發(fā)明根據(jù)字根的字元特征對字根進行分類,在漢字中,常見下列字根。
1、--丨丿 2、=二 亠 3、 刂 八丷幾 4、 三氵彡六 興 5、 巛 忄 心小川6、 廠尸 7、 斥斤8、 爪瓜9、 氏10、 乙 11、 刁 12、 刀 乃 刃13、 14、 15、 匕 16、 17、 18、 19、 20、 21、 22、 丁 丆 丌亻 丁兀丫個下甲歹 23、 皿 業(yè)上且止由丘曲24、 卜片及人25、 26、 ①十 ナ 九力七巾中申丹甘內(nèi)電身 大火②扌牛串 丈女 木 夫③豐 車(車)柬 本 ④ 廾艸也世冊我⑤ 卅 ⑥27、 于 千下予 午幣開果牙雨兩更年耳夭平矢乎 28、土土士主 蟲出 生29、 30、 31、 工 亞西酉正 32、 33、 王壬五里重禺 34、 35、 阝 勹 幾門 36、 臼37、匚匚 巴 38、 39、 月夕勻勺40、 (甘)41、 匹 42、 ( 巴)43、 44、 山45、 巨 46、彐 (雪)47、 用 48、 (兇)49、 (區(qū)) 50、 (丑)51、 口凹凸 52、 日曰目(母)53、 四54、 田(因國)上面列舉了常見字根及其字元特征??梢钥闯觯^大多數(shù)字根均含有橫豎直筆劃,與其字元特征極其相似。在漢字中,只有少數(shù)字根全由斜筆構(gòu)成,其基本結(jié)構(gòu)為八、人、 ,實際上是某些規(guī)范字根旋轉(zhuǎn)所得,本發(fā)明將其歸入相應(yīng)字元中。
漢字結(jié)構(gòu)之所以復(fù)雜,不在于筆劃的變化,而在于大多數(shù)漢字是由大大小小的字根拼成的。有的漢字字根多,有的字根少。根據(jù)書寫的順序,我們將漢字分解成上述字根的組合。例如解 用刀牛 放亠 乂然后輸入字根所對應(yīng)的字元即可輸入該漢字。
有些字根本身就是一個漢字,它們稱作獨元字,如重、里;有些字根不能獨立成字,如字根“ ”等。根據(jù)本發(fā)明對圖形文字的認識,也可以將這些字根輸入電腦。字根均由字元衍變而來,具有字元、一階字元、二階字元等信息特征。逐層輸入信息單元即可,如輸入字元“王三日”即可輸入字根“重”。
根據(jù)本發(fā)明提供的方法,可以對漢字進行排序。我們先規(guī)定字元的先后順序,將字根按字元、一階字元、二階字元的先后可排出順序,然后可將漢字按字根的先后排出順序。
八卦字元由兩個八卦符號垂直相交構(gòu)成,八卦符號可用二進制數(shù)字表示,同樣我們可用二進制來表示八卦字元,用1表示陽,用0表示陰,根據(jù)從上至下,然后從左至右的順序,可以給出其二進制編碼。如干110010、土011010,輸入0、1構(gòu)成的代碼即可輸入相應(yīng)的八卦字元。
八卦字元上的陽爻都有確定的位置,按照從上至下,然后從左至右的順序,我們規(guī)定陽爻可能存在的位置依次為1、2、3、4、5、6,這樣字元可用阿拉伯數(shù)字表示,如于125、土235。對于由八卦字元衍變出的字符,我們可以指出一階、二階字元所在位置。如“重” 2曰2。
將字根結(jié)構(gòu)信息字元化后,有利于漢字輸入電腦。同時我們還應(yīng)看到,漢字中不僅存在橫豎直筆,而且存在不少斜筆、曲筆、折筆,雖然可以相應(yīng)地字元化,但總有些不規(guī)范的地方,而且個別字還造成了重碼。如“千、干、于、乇”,其字元特征相同。其中“于、乇”有一階字元,易區(qū)別,而“千”、“干”則較難區(qū)別,必要時可指出斜筆位置,如“千”可用字元干和數(shù)字1表示。
漢字楷書化后,字形已相當規(guī)范,但其它字體的漢字和其它文字卻存在著大量曲筆和折筆,經(jīng)過研究發(fā)現(xiàn),圖形文字中存在的十類基本筆劃的結(jié)構(gòu)特征恰好對應(yīng)著十個阿拉伯數(shù)字的書寫特征。即1對應(yīng)各種長度和方位的直筆,如一丨丿2對應(yīng)各種順時針起筆的筆劃,如 3對應(yīng)各種順時針起筆的筆劃,如4對應(yīng)各種反時針起筆的筆劃,如 5對應(yīng)各種反時針起筆的筆劃,如6對應(yīng)反時針起筆的多卷筆劃,如 7對應(yīng)各種順時針起筆的筆劃,如 8 9對應(yīng)順時針起筆起筆的筆劃,如 0對應(yīng)各種封閉的圖形 我們將十個阿拉伯數(shù)字叫做筆元,各代表一類筆劃或圖形,將一個圖形文字拆分成筆劃的組合,輸入筆元信息即可輸入該圖形文字,一般地,將圖形文字的字元特征與筆元特征相結(jié)合,我們可以輸入該圖形文字。如乃 b o必要時可指出筆元所替代的字元部分或筆元所在位置,如乃 b o 這樣我們可以用字元與筆元輸入各種筆劃構(gòu)成的圖形文字。
在一個鍵盤上,我們既可以輸入字元又可以輸入筆元,利用這樣的鍵盤我們可以輸入各種圖形文字。
十個阿拉伯數(shù)字對應(yīng)著10個筆元,26個拉丁字母對應(yīng)著十六個字元的基本二維結(jié)構(gòu)和8個方位指示命令及獨元字組合的基本形狀和一對正反向、橫豎向、直曲筆轉(zhuǎn)換的指示命令符號。利用標準小鍵盤我們就可以輸入各種形狀的圖形和字符。例如我們約定I表示直筆、R表示曲筆、M表示左右結(jié)構(gòu)的漢字或表示將字元順時針旋轉(zhuǎn)90°,那么,根據(jù)格式字型十字元+旋轉(zhuǎn)角度+I或R可輸入某個圖形文字。如MEMIFMR則可輸入圖形 。當然按照一定的規(guī)則可輸入更復(fù)雜的圖形。總之可用10個數(shù)字表示10類筆元,拉丁字母中16個字母表示二維字元;8個表示有一定含義的八卦符號;2個表示一對相反或相對概念的符號,在鍵盤上標識它們,可以通過擊鍵的方式輸入各種字符,此外必要時還可增加相應(yīng)的鍵位,例如空格符,一組指示字元上直筆位置的數(shù)字鍵和其它形狀字元的鍵位。
本發(fā)明具有的優(yōu)點在于1、它有一定的理論基礎(chǔ),本發(fā)明建立在下列哲學(xué)思想的指導(dǎo)上。
“大哉乾元,萬物資始;至哉坤元,萬物資生;天地感而萬物化生;天地相遇,品物成章”;“道生一,一生二,二生三,三生萬物,萬物負陰而抱陽”。
2、字元結(jié)構(gòu)符合電腦對圖形文字的要求,本發(fā)明可以較好地協(xié)調(diào)“電腦的中文化”與“中文的電腦化”之間的矛盾,可為進一步規(guī)范圖形文字提供一定的參考。
3、本發(fā)明處理漢字時,思路清晰,字根分解合乎邏輯,有一定思維能力的人一學(xué)就會,而且由于字根定義確切,易于分類。
4、它有利于圖形文字計算機處理時內(nèi)碼、外碼可保持對映關(guān)系。
由于漢字的處理是中文信息處理的重點,下面結(jié)合漢字的具體情況提供一種較好的實施途徑。
漢字的情況比較復(fù)雜,對于獨元字不少形碼處理時信息不夠,而對于合體字,則出現(xiàn)信息冗余,如何在一種方案中既能很好處理合體字,又能方便地輸入獨體字,關(guān)鍵在于字根的靈活處理上。
對于獨元字,其字型可用字元“一”表示,如中、申、西、酉。對于合體字,其字型可用“”表示。
二表示上下結(jié)構(gòu)的漢字,例古、呂、品、咒 表示左右結(jié)構(gòu)的漢字,例如、胡、泊、杉三表示上中下結(jié)構(gòu)的漢字,例章、復(fù)、合 表示左中右結(jié)構(gòu)的漢字,例湖、例合體字的字形還可細分,但一般取上面四種字元形式作為合體字的字型信息即可。
對于字根較少的漢字,有必要將字型信息、一階字元信息、二階字元甚至筆元信息提取出來,如“九”,其字元信息為“十”,字型信息為“一”,一階字元 、筆元“2”,輸入“十 2一”即可輸入漢字“九”。
常用的鍵盤鍵位并不多,無法使每個字元、筆元都占用一個鍵位,同時漢字中并不存在全部字元,而有的字元所屬字根相當多,有的字元所屬字根則很少甚至沒有,這時可以采用常用字元和一階字符標識字母鍵,非常用字元則酌情處理。在第一排字母鍵上可以安排“田日口 十個字符,在第二排字母鍵上安排“ ,在第三排字母鍵上安排“王干工丁土十 ”,在其它鍵位上還可安排些非常用字元,必要時可對鍵位進行調(diào)整。
上述二十六個碼元分別代表的字元如下,田田,日日、 土, 一 則分成五類一階字符十、權(quán)利要求
1.一種圖形文字的輸入方法,其特征在于將一套有規(guī)律的簡單圖形作為圖形文字形狀結(jié)構(gòu)的基本信息單元,從圖形文字中將其提取出來,按照一定的規(guī)則編成代碼,輸入代碼即可完成圖形文字的輸入。
2.按照權(quán)利要求1的方法,其特征在于所述單元至少包括一組八卦字元,八卦字元是指兩個八卦符號垂直相交時所構(gòu)成的圖形,其中由陽爻構(gòu)成的圖形稱作圖形文字的字元,字元反映了圖形文字形狀結(jié)構(gòu)的基本特征。
3.按照權(quán)利要求2的方法,其特征在于所述字元可衍變出新的字符,新字符具有多層字元信息,可以將新字符轉(zhuǎn)換成多個字元的集合。
4.按照權(quán)利要求2的方法,其特征在于所述八卦字元可用二進制數(shù)字表示,輸入0與1即可完成八卦字元的輸入。
5.按照權(quán)利要求2的方法,其特征在于可以指出八卦字元中各直筆的確定位置,對于字元衍變所得新字符,可指明替代字元的位置。
6.根據(jù)權(quán)利要求2的方法,其特征在于拉丁字母與八卦字元存在內(nèi)在聯(lián)系。
7.按照權(quán)利要求1的方法,其特征在于所述基本信息單元還包括一組阿拉伯數(shù)字,十個阿拉伯數(shù)字作為筆元,對應(yīng)著圖形文字中十類基本筆劃。
8.一種用于輸入圖形文字的鍵盤,其特征在于包含用圖形文字字形結(jié)構(gòu)信息單元標識的鍵,通過擊鍵,可完成圖形文字的輸入。
9.根據(jù)權(quán)利要求8所述的鍵盤,其特征在于所述鍵盤包含八卦字元標識的鍵。
10.根據(jù)權(quán)利要求8所述鍵盤其特征在于所述鍵盤包含筆元標識的鍵。
全文摘要
本發(fā)明屬于文字信息處理技術(shù)領(lǐng)域,將圖形文字輸入計算機,可以按照一定的規(guī)則從圖形文字字形結(jié)構(gòu)上提取基本信息單元;八卦字元和阿拉伯數(shù)字筆元,輸入這些信息單元的集合,即可將圖形文字輸入計算機,漢字作為一種特殊的圖形文字,可根據(jù)其結(jié)構(gòu)特點重新標識鍵盤,本方案可給出一種漢字的排序檢字法。
文檔編號G06F3/023GK1132367SQ95110690
公開日1996年10月2日 申請日期1995年3月31日 優(yōu)先權(quán)日1995年3月31日
發(fā)明者胡敬禹 申請人:胡敬禹