專利名稱:漢字的形音數(shù)的綜合編碼方法和應(yīng)用的制作方法
漢字的形音數(shù)的綜合編碼方法和應(yīng)用本發(fā)明是一種漢字的形音數(shù)的綜合編碼方法和應(yīng)用,是一種主要用于計(jì)算機(jī)、手 機(jī)等漢字輸入,以及信息交換、信息處理、漢字查詢用的綜合編碼、輸入方法,其核心是針對(duì) 漢字的兩維圖形特征和造字特點(diǎn),盡量利用編碼資源,融合了筆劃、形碼部件、雙拼、映射等 要素,進(jìn)行了系統(tǒng)、全面的整合,形成了以四筆層次碼為核心的,鍵盤資源利用配置合理的 四筆編碼、輸入架構(gòu)體系,對(duì)GB2312是采用3個(gè)編碼的最佳選擇,比五筆等輸入方法整整少 了 1鍵;對(duì)GB18030的70244個(gè)漢字,則是增加了一層次,采用4個(gè)編碼,從實(shí)際編碼排序效 果來(lái)看,4碼重碼最多只有九個(gè),和目前流行的4碼體系相比無(wú)疑是一項(xiàng)重大的突破。漢字編碼的實(shí)質(zhì)只是建立一個(gè)相對(duì)穩(wěn)定的數(shù)據(jù)庫(kù),在我的以往的編碼方法中,為 了追求速度,曾采用了 30多個(gè)代碼,目的就在于追求3鍵無(wú)重碼的輸入效果,現(xiàn)在提升到用 26個(gè)字母,實(shí)現(xiàn)了對(duì)GB2312的3鍵無(wú)重碼的輸入,這是經(jīng)歷了十?dāng)?shù)年的一個(gè)漫長(zhǎng)的逐步精 煉、眾多反復(fù)、優(yōu)化、簡(jiǎn)化的過(guò)程,將形、音、數(shù)整合到一起的關(guān)鍵在于,我發(fā)現(xiàn)了鍵位數(shù)碼的 映射關(guān)系,從而使拼音輸入,拼音的數(shù)字輸入變得非常的簡(jiǎn)明,從而使手機(jī)的數(shù)碼輸入變得 特別的簡(jiǎn)明快捷,形成了一個(gè)完整的綜合編碼體系,在易學(xué)、碼長(zhǎng)、實(shí)用、速度等多方面都得 到了全面地提升。四筆層次形碼的記憶量非常的少,少到約50類的編碼組合,從根本上解 決了易學(xué)性的問(wèn)題,只要按編碼部件的首、次筆劃或整體特征,就能對(duì)征入組入位,無(wú)須記 憶部件的多少,這可以說(shuō)是在漢字編碼領(lǐng)域的一次首創(chuàng),其特點(diǎn)是1、部件的歸類是主要的,例如‘大’如果是編碼部件,應(yīng)該用什么代碼呢,在哪兒能 找到它?大字橫起筆,代碼肯定在第2行的9個(gè)字母之中;橫后有撇,那就是第2個(gè)字母s, 實(shí)際的記憶量是非常少的。2、根據(jù)漢字的層次造字特征,針對(duì)3部件碼和形數(shù)碼中的層次3碼的特征,根據(jù)3 部件在字平面中的相對(duì)位置關(guān)系,歸納出3點(diǎn)式九宮結(jié)構(gòu)碼,找到了 3碼長(zhǎng)和速度的最佳切 入點(diǎn),三點(diǎn)式如正3角(. .)、倒3角( )等3點(diǎn)的相互關(guān)系,正如權(quán)利要求書(shū)表2所示, 這樣比較形象好記,為編碼輸入,特別是形數(shù)碼的輸入找到了捷徑。右邊是取三碼時(shí)的實(shí)際編碼例,表中九宮格內(nèi),最少有一例是三點(diǎn)式結(jié)構(gòu),特別形 象、便于記憶,所以命名為九宮結(jié)構(gòu)表,這樣的結(jié)構(gòu)碼用在形碼輸入中非常有利于重碼的減 少。 3、充分發(fā)揮了符號(hào)鍵的示根和釋放重碼的功能,方法是輸入某代碼后,表明已進(jìn) 入漢字的輸入狀態(tài),此時(shí)的符號(hào)鍵已不能起到輸入符號(hào)的作用,本法充分地利用了這一資 源,令之作為字根的窗口顯示輸入和重碼區(qū)別鍵使用,這種于教、于學(xué)、于輸為一體的前瞻 性減少重碼的方法,既有示根作用,又利于提高輸入速度,有百利而無(wú)一害,定會(huì)受到社會(huì) 大眾的歡迎。4、韓碼的編碼體系的形、音、數(shù)的大致架構(gòu)如下表1所示韓碼總體構(gòu)架配置一覽表(表1)
記憶量大幅度地減少了,只和通用的字母量處在同樣的量級(jí)。四筆用26個(gè)字母進(jìn)行非常簡(jiǎn)明的編碼,重碼率很低,用于字典的排序,比四角號(hào) 碼查字法的容量大多了,比部首查字法簡(jiǎn)單多了,也就是說(shuō)四筆層次形碼是一項(xiàng)非常簡(jiǎn)單 有效的編碼發(fā)明,將四筆層次形碼單列出來(lái),就是明確地強(qiáng)調(diào)了四筆層次形碼在字詞典編 撰、出版、排序方面的應(yīng)用,將對(duì)社會(huì)產(chǎn)生巨大的反響,按四筆層次編碼方法排序的字典,已 經(jīng)編撰成功,完全地刪除了筆劃?rùn)z字的環(huán)節(jié),這是一個(gè)劃時(shí)代的進(jìn)步,下面按四筆和層次的 兩個(gè)分項(xiàng)要求加以說(shuō)明。1. 1四筆是以點(diǎn)豎橫撇的4種筆劃作為編碼部件的分類,點(diǎn)筆類占據(jù)上行的q w e r t 5個(gè)代碼鍵,豎筆占據(jù)上行的y u i o p的5個(gè)代碼鍵,橫筆占據(jù)中行的a s d f g h J k 1的9個(gè)代碼鍵,撇筆占據(jù)下行的z x c v b n m的7個(gè)代碼鍵,三行共26鍵,比例分 配是5 5 9 7,5+5 = 10,10、9、7正好符合電腦鍵盤三行的設(shè)計(jì),非常便于四類部件 的記憶。1. 2將鍵盤上的26個(gè)字母,按5、5、9、7配置四筆的分類,這樣的比例分配,正好符 合部件多少、使用頻度的實(shí)際需求,在對(duì)GB2312字符集的編碼排序統(tǒng)計(jì)中發(fā)現(xiàn)(即相當(dāng)于 將6763個(gè)漢字輸入一遍),點(diǎn)筆類占20 %,豎筆占19 %,橫筆占35 %,撇筆占26 % ;而按26 個(gè)鍵的5 5 9 7的所占比例分別是,19. 2%,19. 2%,34.6%,27%,最小誤差是豎類, 19. 2%-19%=0.2% ;最大誤差是撇類,也只有27% -26%= 1 %,非常符合四類代碼字母 所占的比例,這說(shuō)明26個(gè)字母的使用頻度非常相近,是本發(fā)明最為突出的成功之處之一。1. 3將編碼部件歸納為約50種組合,是四筆的又一突出貢獻(xiàn),克服了在漢字編碼 方面強(qiáng)調(diào)編碼部件的多少,拆分是否規(guī)范的問(wèn)題,四筆編碼部件和GF3001的560個(gè)標(biāo)準(zhǔn)部 件對(duì)照,有增有減,增加的如權(quán)利要求書(shū)表1中的手寫(xiě)部件,減少的有531號(hào)部件等,相應(yīng)的 例字有‘羲’,在總體上則大致相同;在本法中具體的字母設(shè)置的560個(gè)部件舉例如下,不排 除會(huì)有變動(dòng)1.3. 1 點(diǎn)筆類,共 q(u)w e(h)r t 5 個(gè)代碼q(u) 1個(gè)‘點(diǎn)橫折’大類,存在著‘門’是否要單獨(dú)分類的問(wèn)題;其特點(diǎn)是起筆是點(diǎn) 筆,其后有橫折的筆劃特點(diǎn),共有14個(gè)部件;w鍵也是1個(gè)大類,有13部件,特點(diǎn)是‘兩點(diǎn)’,部件‘廣對(duì),也屬于此類;e(h)鍵有2個(gè)大類,一是3點(diǎn),包括舉字頭,二是捺,包括捺勾,象部件‘匕’就屬于 這一類,這也是為了平衡,有10個(gè)部件;r鍵有2大類,一類是4點(diǎn),包括‘火、心、米’等,二類是點(diǎn)撇類,如 、為、為為、州 等,有15個(gè)部件;t鍵有2大類,一類是點(diǎn)、提(點(diǎn)折),二類是點(diǎn)橫,有12個(gè)部件歸類;點(diǎn)筆類共有8大類64個(gè)部件。1. 3. 2豎筆類,共用了 y u i o p 5個(gè)代碼y鍵有3個(gè)大類,一是‘足’類、包括甲、里、果等,二是下口,包括下開(kāi)口,如內(nèi)、巾、 凸等,三是‘凸’類,有28個(gè)部件;u(q)鍵有3大類,一是上口(豎折),如屮、ffi、另、凹、由、曲等,二是‘日’,包括 ‘門、’等,三是‘母、毋’等,有32個(gè)部件;I(z)鍵有2大類,一是豎起筆,如上、山、小等,二是中、央類,如等,29個(gè)部件;
0鍵有2大類,一是口,這是一較大的部件,二是穿、竄(申)類,如電、串、弗等,有 13個(gè)部件;P鍵有3大類,一是雙豎類,如業(yè)、非等,二是多口類,如目、且、田類,三是四黑類, 如皿和‘曾’的第2個(gè)部件等,有21個(gè)部作;豎筆類共有13個(gè)大類,123個(gè)部件。1.3.3橫筆類,共用了 a s d f g h(e)j k j/九個(gè)代碼a鍵有2大類,一是‘一’類,包括正、工、雨等,三是右開(kāi)口類,如匚、牙、瓦、髟等,共 同特點(diǎn)是橫豎不相交,有37個(gè)部件;s鍵有1大類,特征是橫有撇,如西、大、夷、頁(yè)、百等,有27個(gè)部件;d鍵有1大類,是十字類,比較簡(jiǎn)明的分類,其中束事包括在內(nèi),有12個(gè)部件;f 鍵有1大類,是兩橫(單豎)類,如干、曳、專、土等,有19個(gè)部件;g鍵有2大類,一是三橫,如王、韋、耒等,二是左開(kāi)口,如聿、尹、艮、彐、丑等,有38 個(gè)部件;h(e)鍵有3大類,一是雙(多)豎(交)類,如卅、*、甘、共的上半部等,二是橫折 (雙豎)類,如巴、也、乜、三是兼的后半部等,有18個(gè)部件;j鍵有2大類,一是J 丁類,如弓、已、弗等,二是革世類,如帶竽,有37個(gè)部件;k鍵有2大類,是橫后有點(diǎn)類,如戈、太、寸、犬、才等,此處的呀,,是把提看成‘點(diǎn)’ 的,和提從點(diǎn)從T是一致的,有18個(gè)部件;1鍵有2大類,1是七(7)字類,如車、了、乙、飛等,2是橫兩點(diǎn)類,來(lái)、平、夾等,有 29個(gè)部件;橫筆類共有16個(gè)大類,235個(gè)部件。1. 3. 4撇筆類,有z (i) x c v b n m 7個(gè)代碼分別是Z(i)鍵有1個(gè)大類,是撇橫類,如氣、生、我、韋、牛、手等,有15個(gè)部件;x鍵有2大類,一是撇豎(人)類,如隹、人J、白、豕等,二是叉類,如乂、乂等,有 12個(gè)部件;c鍵有1大類,是撇橫折類,如象、t、勹、免、鳥(niǎo)、魚(yú)等,有16個(gè)部件;v鍵有1大類,是撇折類,如女、鄉(xiāng)、氏、〈〈〈、發(fā)的上半部等,有22個(gè)部件;b鍵有2大類,一是撇類,如j、九、長(zhǎng)、乃、片、千、禾、舌等,二是白類,如卑、鬼、囪、 殷的首部件等此處要說(shuō)明一下,有26個(gè)部件;n鍵有3個(gè)大類,一是雙撇或撇雙類,如4、豸、乎、兒、斤等,二是撇橫折類,如月、 用、丹、冊(cè)、幾等,三是自舟類,如身等,有30個(gè)部件;m鍵有3個(gè)大類,一是3撇或撇3類,如鄉(xiāng)、川、爪、3、采的上半部等,二是個(gè)字類, 如食、竹、僉的上半部等,三是八字類,如入、共的下兩點(diǎn)等,有17個(gè)部件;撇筆類共有13個(gè)大類,138個(gè)部件。四筆和GF3001的560個(gè)部件分類,大部分相同,四筆部件中有560個(gè)部件中沒(méi)有 設(shè)置的部件,如表1中手寫(xiě)的部件(一八)屬橫撇類,代碼為S,例字‘爾’的編碼是‘sy’ ;
也有四筆中沒(méi)有的,如編號(hào)是521號(hào)531號(hào)兩部件,在四筆中被拆分,其例字■,的
編碼是‘dbo rzbo', ‘羲’的編碼是‘wbs’等;編碼部件在四筆中歸納成約50個(gè)大類,由于 在分類中擦邊球是難免的,如兩橫類和橫雙豎交差類的區(qū)別,F(xiàn)鍵是雙橫,H是雙豎,同為雙
14橫、雙豎就是擦邊球等;又如橫折類的J/K/L鍵的區(qū)別,K鍵有兩類,1是橫點(diǎn),2是和折點(diǎn), 和點(diǎn)有關(guān)聯(lián),如‘又’從折點(diǎn)K,L的橫折和‘7’相似,‘令’的編碼是‘mk’,‘今’的編碼是 ‘ml,等。2.關(guān)于漢字的層次編碼的方法分四項(xiàng)說(shuō)明,一是漢字的層次性及編碼方法;二是 8項(xiàng)編碼規(guī)則;三是四筆層次形碼的編碼重點(diǎn)說(shuō)明;四是四筆層次形碼的應(yīng)用。2. 1.漢字的層次性及編碼方法四筆層次碼的編碼方法是以GB18030的70244個(gè)漢字為基礎(chǔ)的4碼長(zhǎng)編碼體系, 首先要根據(jù)字的特點(diǎn)采用相應(yīng)的編碼,編碼部件可以是筆劃、部首、獨(dú)體字、也可以是多根 字,具有明顯的變通特征和省略,層次性非常的突出;對(duì)于復(fù)雜的漢字,采取逆向思維逐層 取根碼的方法,按碼長(zhǎng)優(yōu)先等8項(xiàng)編碼規(guī)則和多根字組字的編碼。2. 1.漢字的層次性a在國(guó)標(biāo)基本字符集中,大多數(shù)常用字都是兩根、3根字,例如"包"是雙根字, 飽、泡、炮、皰、胞、抱、苞這一系列字都是由包加不同的偏旁組成的3根字,讀音似包,加上 偏旁就有了不同的意思,有明顯的橫向(加邊旁)的層次特點(diǎn);b漢字層次性的有明顯的縱向(趨向復(fù)雜)特點(diǎn),如母、每、敏、繁、蘩,其中蘩的層 次分別是‘糸’ ‘夂’,即首、尾、尾,就是說(shuō),按層次取部件碼絕對(duì)不是按前后次序排列 的;c大、犬、尤、尤、龍、隴、壟、龍、鼸、鏽等說(shuō)明,用一二三末這類的部件選取規(guī)則已 不適用,層次編碼就好象用什么鑰匙開(kāi)什么鎖一樣,是最為適用的方法,象后兩個(gè)字,取碼 時(shí)是按多根字組合的編碼規(guī)則,其編碼規(guī)則是取‘首、尾、首、尾’和‘首、首、首、尾’,實(shí)用編 碼是‘tata、ttta’,象由兩個(gè)顛倒的‘或’字組成的字,取兩個(gè)‘或’的首尾部件碼,編碼是 ‘ktkt,。2. 2.八項(xiàng)編碼規(guī)則在新版GB18030中漢字總數(shù)已達(dá)到70244個(gè),以后還會(huì)增加,不管漢字有多復(fù)雜, 層次性的編碼方法都能應(yīng)付,例如,在新增的字集中有一個(gè)字由‘西域哲人’ 4個(gè)字組成,那 編碼就由這4個(gè)字的首部件組成,編碼就是afkx,就整個(gè)編碼體系而言,為了編碼更加規(guī) 范,以下這18個(gè)大號(hào)字,編碼具有一定的代表性,(壽禱 矓籯、娛娛崾箭I、網(wǎng)概嫫唷 蘐、蟁Hlil)(其后只用排序號(hào)代替)制定了八項(xiàng)編碼規(guī)則如下1、碼長(zhǎng)優(yōu)先是針同一編碼體系中,對(duì)少筆劃漢字和多筆劃字的用于減少重碼的 具體措施,指的是在選取編碼部件時(shí),部件數(shù)要向碼長(zhǎng)數(shù)靠攏(優(yōu)先),多了碼長(zhǎng)不允許,少 了會(huì)因編碼空間的減少而增加重碼,這在編碼輸入時(shí)更為突出,而這種優(yōu)先僅僅是目的,往 往用其它的規(guī)則來(lái)實(shí)現(xiàn);例如,對(duì)上述2、3、5、16、18號(hào)這5個(gè)字,2號(hào)光右側(cè)的壽字就由6個(gè) 分列部件組成,就得和平衡省略相配合,3號(hào)、16號(hào)和成字優(yōu)先相配合,5號(hào)和要點(diǎn)優(yōu)先相配 合,18號(hào)和交重拆2相配合,它們的編碼分別是“yfak、vjpi、mtop、SSSi、zgb”字。2、部件設(shè)定主要有兩條,一是在漢字的拆分中使用有相當(dāng)?shù)念l度,過(guò)少就不一定 有設(shè)定價(jià)值;二是看這樣的設(shè)定是否有利于輸入的簡(jiǎn)化,這與GF3001中所述的部件設(shè)定要 求是分立的、交不拆不同。在本法中為了編碼的分布均勻,有時(shí)將獨(dú)體字拆分成兩個(gè)部件, 如‘重’ ‘垂’ ‘肅’等;有時(shí)將分開(kāi)的的兩部分視為一個(gè)編碼部件,如‘一口 ’等,依此將‘事’ 列入G的范疇;這有利于編碼部件在26個(gè)字母代碼分配上的總體平衡。以上述第6號(hào)、第7號(hào)字為例,涉及到口天吳的兩種寫(xiě)法,特別是6號(hào)7號(hào)字的第三部分,按搭接分成兩個(gè)部件, 前一部件的編碼都從代碼u,后一部件的代碼要看是否存‘ ’而定,如果存在,這在9號(hào)字中 就已用到,符合部件設(shè)定原則,編碼都從s ;如不存在,則編碼從‘八’從‘m’,則其編碼依據(jù) 碼長(zhǎng)優(yōu)先原則和此部件設(shè)定原則,6號(hào)字的編碼是vous,7號(hào)字的編碼是vous或voum。3、對(duì)征入座是強(qiáng)化部件特征,淡化部件的多少,依據(jù)部件的特征對(duì)號(hào)入座,從而 降低了漢字編碼輸入的準(zhǔn)入門坎,這是將數(shù)百種部件歸納為約50個(gè)部件組合的基本原 則,具有較大的靈活性。在上述字例中,1號(hào)字的第一個(gè)部件就比較特別,筆劃多到8劃,依 據(jù)對(duì)征入座規(guī)則,則非常的簡(jiǎn)明,因?yàn)槠鸸P是‘橫’,那必在鍵盤的第二行,編碼必定是9個(gè) 字母代碼中一個(gè);又因?yàn)槭嵌鄼M,范圍一下子就指向了 ‘G’,那就很快得出1號(hào)字的編碼是 >k’。再以‘為’'為"爲(wèi)’的編碼為例,前兩個(gè)字的首筆劃是點(diǎn),那肯定是‘q、w、e、r、t’中 的一個(gè),次筆是撇,部件代碼馬上指向了 ‘r’,這兩個(gè)字的編碼分別是‘r’ ‘rr’ ;第三個(gè)字 的首筆是‘撇’,那部件歸類肯定在鍵盤的第三行,后續(xù)‘3點(diǎn)’,其部件代碼立即指向了 ‘m’, 編碼是‘mbr’ ;用同樣的方法,‘飯’和‘飯’的編碼是‘cnk’ ‘mnk’,鳥(niǎo)’和‘鳥(niǎo)’的編碼是 ‘ca’ ‘ba’,這說(shuō)明字的形碼由于寫(xiě)法、簡(jiǎn)繁的不同,編碼也不盡相同。象凹、凸、及GF3001 中的編號(hào)是487的部件,都從豎起筆,以總體特征設(shè)定代碼,分別從u y和u。4、總體平衡在上述2號(hào)字的右側(cè)壽字有6個(gè)部件,要在6個(gè)中取3個(gè)部件作代 碼,取首、中、末比較平衡,其中還要參考后好續(xù)的‘成字優(yōu)先’,最后取‘士、工、寸’ 3個(gè)比較 合適的部件,其編碼是‘yfak’。5、突出特征在‘贏’ ‘衡’等系列漢字中尤為突出,變化的只在中間的貝、女、羊等, 其貝、女、羊就是要點(diǎn)特征,其余部分可以歸一、或用雙碼。在本系統(tǒng)中是設(shè)定‘亡’為首部 件、‘口’為替補(bǔ)部件,這三個(gè)字的編碼分別是t0y、t0V、t0W。所以在本編碼體系中,把特征 部件視為要點(diǎn)優(yōu)先,有要點(diǎn)就有省略,省略‘月’ ‘凡’等部分。6、成字優(yōu)先是為了迎合大眾的日常習(xí)慣設(shè)定的一項(xiàng)原則。通常所說(shuō)的口天吳, 那樣的順口,就是體現(xiàn)了 ‘成字’易記的優(yōu)越性,這一原則在獨(dú)體字的拆分中,尤為突出,象 ‘朱’這個(gè)字,如要拆分,以拆分為‘ j ’和‘未’為佳,末可拆分成‘一木’,未可不拆分等。7、交重拆2是部件設(shè)定規(guī)則的局部特例,是針對(duì)的象‘重、垂、‘肅’等交重復(fù)雜部 件,為減少重碼而設(shè)定的1條規(guī)則。這是因?yàn)椴辉试S拆分會(huì)導(dǎo)致部件過(guò)于集中,分布不均的 現(xiàn)象,而且會(huì)導(dǎo)致部件的多而雜;但不允許多拆,多拆會(huì)引起拆分的混亂,故特設(shè)定再?gòu)?fù)雜 的交重部件,最多只能拆分為兩個(gè)部件代碼,同時(shí)限定同一筆劃不允許在兩個(gè)部件中重復(fù) 體現(xiàn)。上述3個(gè)例字拆分代碼分別設(shè)定為bu、bh、gb ;上述9號(hào)字18號(hào)字的筆劃雖很多, 總體上只分為兩個(gè)部分,第2個(gè)部分適用拆2原則,9號(hào)字的編碼是msy,18號(hào)字的編碼是 zgbo8、簡(jiǎn)碼設(shè)定簡(jiǎn)碼是編碼輸入中是一項(xiàng)通用原則,在眾多的編碼體系中都被廣泛 采用,其具體的應(yīng)用將在權(quán)利要求2的編碼輸入中再加舉例說(shuō)明。2. 3四筆層次形碼的編碼重點(diǎn)說(shuō)明層次編碼的取舍與書(shū)寫(xiě)次序無(wú)關(guān)。例如,‘枷’ ‘弩’ ‘進(jìn)’字,第1個(gè)層次部件分 別是‘木、弓、1_’,由此可見(jiàn),層次編碼部件的確定與書(shū)寫(xiě)次序無(wú)關(guān),這3個(gè)字的編碼依次是 ‘dho、vkj、xtq’,從中可以看出編碼中的次序,從寫(xiě)書(shū)順序。2. 3. 1字按四筆編碼用在字詞典的出版中進(jìn)行排序,是四筆應(yīng)用的重要組成部分,其適用范圍可擴(kuò)大到韓、日等使用漢字體系的國(guó)家和地區(qū)。2. 3. 2四筆中有幾種非常規(guī)編碼取碼設(shè)定,如(羸、成、匕、刁、凹)等特說(shuō)明一下1)羸、羸的第3個(gè)編碼,依據(jù)特征省略原則,把女、羊等設(shè)定為必取的編碼;其編碼 分別為tov和tow。2)成、貳、武、載、越、藏等字中都帶弋、戈的編碼方法,是將此類部件單列弋類從 k,粘連從粘類部件。如藏的第2個(gè)部件,編碼視規(guī)范起筆從橫撇從s,編碼從u的前提是豎 起筆,視習(xí)慣或規(guī)范而定,‘成’拆分時(shí)的首部件代碼是s ; ‘越’字中的后一部件的代碼是從 3;其全碼分別是貳-1^7,成-^,武-akl,載-fr,越-fia,藏-has等。3)把筆劃‘提’視為點(diǎn)更為形似,符合3點(diǎn)水的習(xí)慣說(shuō)法,所以在部件歸類中將 ‘才,從橫點(diǎn)類從K,更為簡(jiǎn)明;如刁、或的編碼從jt、kot等。4) ‘匕’按書(shū)寫(xiě)習(xí)慣應(yīng)從豎勾,本法將‘匕’視為捺折(勾)從點(diǎn)類e,這是因?yàn)槿?點(diǎn)水的部件用量很大,而且集中在前,使之從點(diǎn)折類,起到了平衡單鍵負(fù)擔(dān)的作用;要提及 的‘比’的首部件(即規(guī)范中的43號(hào)部件)按筆順規(guī)范應(yīng)從橫起筆a,‘北’的首部件從豎 起筆i,編碼分別是ae和ie。5) ‘行’有時(shí)可視作一個(gè)部件編碼,如‘衡’字的3碼長(zhǎng)編碼可以是nCS,4碼長(zhǎng)時(shí) 仍拆分為雙碼。有些獨(dú)體字,象‘凹、凸’等筆劃特征不明顯,而總的形象特征十分明顯,就 以‘形’分別約定代碼,編碼分別從u、y。6)字碼在大字符集中非常突出,以權(quán)利要求中所提到的‘原’字為例,是由3個(gè)部 件‘廠’ ‘白’ ‘小’組成,在GB18030大字符集中有‘蟁’這個(gè)字,顯然是由3個(gè)相同的‘原’ 字組成,所以依據(jù)層次關(guān)系,應(yīng)該屬于并列的,如果取3碼,則取3個(gè)‘原’字的首部件‘廠’, 如果取4碼,可再取一個(gè)尾部件碼‘小’,編碼sssi;另外如‘瀛、黻、_、瀛、籮、’等字的4個(gè) 編碼分別是討叩、切切、驟呢、《切、《忉。其中第一個(gè)字的第4個(gè)編碼是‘P,而不是‘N,, 體現(xiàn)了本法所倡導(dǎo)的要件優(yōu)先原則。7)下面再以22個(gè)字為例“一、二、三、四、五、六、七、八、九、十、百、千、萬(wàn)、田’、卍、 凹、凸、萬(wàn)、億、繁、蘩、蟁”,具有層次編碼的代表性,其編碼分別是“&、&&、&&&^、&、恤、1、111、 b、d、s、b、s、u、j、u、y、hy、xtur、zuzv、hzzv、sssi,,。2.4.四筆層次形碼的應(yīng)用在新版GB18030中漢字總數(shù)高達(dá)70244個(gè),對(duì)于這樣的大字符集用得最多的還是 其子集,可以是簡(jiǎn)體漢字集、繁體漢字集或者是它們的多少不等的組合集,可用于漢字的鍵 盤輸入,也可在字詞典上應(yīng)用,現(xiàn)在的字典、辭海都是以部首分類的方法進(jìn)行分類查找,非 常的復(fù)雜繁鎖,所以用起來(lái)非常的費(fèi)時(shí),而四筆層次形碼編碼,用的也是象新華字典中使用 的拼音排序的26個(gè)英文字母,優(yōu)越性體現(xiàn)在部件分四個(gè)大類,還歸納成約50組分類,十 分簡(jiǎn)明,非常地便于記憶;加上編碼空間有26的4次方,空間高達(dá)45萬(wàn)(456976),漢語(yǔ)拼 音的碼長(zhǎng)雖長(zhǎng)到六個(gè)字母,變化只有約417*4 = 1668個(gè),重碼多達(dá)百數(shù)個(gè)之多,字典收字不 多還可行,如新華字典,多了根本行不通,如辭海等;根據(jù)對(duì)70244個(gè)漢字的排序來(lái)看,內(nèi)的 編碼,重碼也很少,如果分中、日、韓及其它子集,重碼會(huì)更少;可見(jiàn)此編碼方法非常的實(shí)用, 準(zhǔn)確率特高,實(shí)用價(jià)值是顯然的,不愧為是一種新穎高級(jí)的排序檢字方法。在我新編的約 一萬(wàn)多字的字典中,要查“韓”字,編碼是‘djoa’的字只有一個(gè)“韓”字,可見(jiàn)檢字效果有多 好!如果字典收字夠多的話,要查找前面第5頁(yè)中所提到的18個(gè)字,編碼分別是gok yfakvjpi utya mtop vous vous ianc msy ouoovxym dbo vpps otwn sisi sssi uu/uuuu zgb, 依據(jù)這些編碼,就能找到對(duì)應(yīng)的字,其中6號(hào)、7號(hào)兩個(gè)字是通假字,在余下的16個(gè)字中,在 本發(fā)明中只有2、3、17號(hào)字是2中選1有重碼,其余13個(gè)漢字都是4鍵無(wú)重碼,可直接輸 入,平均約4. 1鍵,可見(jiàn)實(shí)際重碼率是很低的,由此可見(jiàn),如果在字典、詞典中用之作為編碼 排序查找漢字,是非常的簡(jiǎn)明快捷,完全避開(kāi)了筆劃查字的繁鎖程序,功在千秋。二、權(quán)利要求2電腦鍵盤輸入方法權(quán)利要求2是漢字的四筆電腦鍵盤輸入方法,是四筆層次形碼的主要應(yīng)用之一, 和權(quán)利要求1相同的是,編碼部件的分類、歸納以及編碼規(guī)則基本相同,所不同的是面對(duì) 漢字輸入的不同的需求,要設(shè)計(jì)不同的子集,有不同的具體設(shè)定,如碼長(zhǎng)、簡(jiǎn)碼、結(jié)構(gòu)碼等, 目前主要的有以GB2312為主的3碼長(zhǎng)的輸入子集,和以GB13000為主體的4碼長(zhǎng)輸入子集 等,講電腦鍵盤輸入就不能不講輸入速度,為提高輸入速度,就得區(qū)分常用字和非常用字、 冷避字,并根據(jù)特定的人群,設(shè)定特定的輸入子集。在輸入方面需要說(shuō)明的主要有3點(diǎn),1是 對(duì)部件設(shè)定規(guī)則的修正,2是符號(hào)鍵的利用,包括結(jié)構(gòu)碼的實(shí)際應(yīng)用,3是簡(jiǎn)碼的設(shè)定,以及 由于這些特殊需要,需要說(shuō)明的其它問(wèn)題。1.GB2312 輸入子集漢字的輸入常針對(duì)的是常用字,加入過(guò)多的冷僻字會(huì)占用資源,降底輸入速度,造 成資源的浪費(fèi),實(shí)際應(yīng)用中往往是簡(jiǎn)繁并存的,就范圍而言,以GB2312為主的輸入子集和 以簡(jiǎn)體字為主的輸入子集有相近的內(nèi)涵,很難有強(qiáng)制性的規(guī)定。1. 1權(quán)利要求2. 1是針對(duì)簡(jiǎn)體形碼的四筆輸入方法,以GB2312為主的四筆輸入子 集,設(shè)定為3碼長(zhǎng),3部件字以下(含3部件)的編碼,從部件碼;如不、什、部,四筆編碼是 ‘s xd tol’;3部件以上取層次3碼,如繁,編碼是‘ZZV’;在常用子集中,部件都相對(duì)較少, 取層次編碼的頻度較低。漢字輸入的最終目的是準(zhǔn)確無(wú)誤的輸入某一個(gè)特定的漢字,這是輸入的唯一性要 求,實(shí)現(xiàn)的手段主要有三種,一種是從提示窗口中選定某一漢字,點(diǎn)擊鍵入,此法的缺點(diǎn)是, 選擇需要時(shí)間,特別當(dāng)重碼很多時(shí)(拼音輸入),需要翻頁(yè),比較麻煩;二是用詞條輸入(拼 音),以減少重碼;三是將常用字設(shè)定為用簡(jiǎn)碼輸入,本法還利用符號(hào)鍵作亞簡(jiǎn)碼輸入,盡 量減少了重碼,基本實(shí)現(xiàn)了 3鍵無(wú)重碼輸入的目的,無(wú)重碼直輸是輸入的最佳選擇,是對(duì)輸 入性能的綜合顯示,貢獻(xiàn)突出。1.2四筆層次形碼用于電腦的漢字編碼輸入中的符號(hào)鍵的應(yīng)用,特別是在GB2312 子集的漢字3鍵無(wú)重碼的輸入中發(fā)揮著難以取代的作用,是四筆提高效率的一條很重要的 措施,在此先具體地介紹一下使用的方法,綜合使用效果,然后再介紹具體的編碼輸入方 法。在鍵盤上有11個(gè)符號(hào)鍵,在進(jìn)入輸入狀態(tài)的(擊過(guò)第1個(gè)英文代碼鍵)前提下, 使用符號(hào)鍵,可不影響其基本的功能,即不影響作為符號(hào)鍵任何功能的使用;本法將符號(hào)鍵 設(shè)定為示根、簡(jiǎn)碼、重碼區(qū)別鍵、詞選擇鍵使用,從而大幅度地降低了重碼,保證了極低的重碼率。用符號(hào)鍵作亞簡(jiǎn)碼設(shè)定,利用符號(hào)鍵作1級(jí)簡(jiǎn)碼,具有示根作用,系增加了新的功 能;2級(jí)簡(jiǎn)碼能體現(xiàn)兩根(部件)的相互關(guān)系,起到結(jié)構(gòu)碼和簡(jiǎn)碼的雙重作用。通常兩個(gè)代 碼所存在的相互關(guān)系,有4種設(shè)定情況,1、獨(dú)體字的首尾碼、或拆分2碼;2、左右兩部件碼;
183、上下兩部件碼;4、交包兩部件碼,結(jié)構(gòu)碼如權(quán)利要求2所示,當(dāng)某1類過(guò)量時(shí),因?yàn)橛写翱?提示,為減少重碼,允許相互兼容,以提高輸入速度。符號(hào)鍵共11個(gè),單根時(shí),用其中的10 個(gè)作示根,包括數(shù)字專用的一個(gè)符號(hào)(_),剩下的一個(gè)符號(hào)Γ)專作在輸字過(guò)程中很少用, 甚至不用的40個(gè)專用部首邊旁部件,如M、彳、!_、*’等,本體系設(shè)定用「’及后續(xù)符號(hào) 顯示,格式是代碼+「’ +指定符,幾乎不占字母代碼資源。例如4的編碼是‘ιΓ,’,分別 鍵入‘η’ ‘〃 ‘,’就輸入了 1,字,有此功能既能滿足輸入此類符號(hào)的特殊需要,又不占 用正常的輸入資源,不會(huì)影響正常的輸入速度,是一個(gè)兩全齊美的選擇。1.3作為一種輸入方法,對(duì)高頻字的簡(jiǎn)碼設(shè)定是不可缺少的,和其它輸入方法一 樣,簡(jiǎn)碼設(shè)定不受部件多少的限制。使用符號(hào)鍵輸入,因未占用數(shù)字資源,自動(dòng)生成的數(shù)字 同樣能起到輸入的目的??傊訥B2312為主體的3碼長(zhǎng)子集,突顯簡(jiǎn)明快捷的輸入特點(diǎn), 加上詞條的輸入,將更方便快捷。2. GB18030的四筆編碼輸入子集權(quán)利要求2. 2是針對(duì)GB18030的四筆輸入,由于此集擴(kuò)充的漢字特多,包括中日韓 使用的許多冷僻字,在實(shí)際應(yīng)用中往往是用其子集,我國(guó)現(xiàn)行比較實(shí)用的是GBK子集,已基 本上具備了四筆輸入的主要特征,其編碼規(guī)則和權(quán)利要求1基本相同,所不同的是針對(duì)不 同的輸入實(shí)用子集,會(huì)有所調(diào)整,通常都選擇4碼長(zhǎng),和前款輸入集相比,主要差別是增加 了一個(gè)編碼層次,即增加一個(gè)代碼的代價(jià),換來(lái)的是編碼空間增加了 25倍,編碼的重碼率 大為降低;另外,在符號(hào)鍵的利用上,增加了三點(diǎn)式結(jié)構(gòu)碼的應(yīng)用。2.1從3碼長(zhǎng)調(diào)整為4碼的直接結(jié)果是,4部件以下(含4部件)字的編碼從部件 碼,4部件以上字取層次4碼。由于新版GB18030字符集涵蓋‘中日韓’的許多冷僻字,象 由兩個(gè)‘或’組成的漢字等,在講輸入時(shí)不能排除任何一個(gè)字的輸入、使用,當(dāng)然包括這類漢 字,取層次4碼的方法,又有所增加;這同時(shí)也預(yù)示著,此編碼、輸入方法的適用范圍已經(jīng)擴(kuò) 大到用漢字的地方,如‘日、韓’等國(guó)家和地區(qū);四筆層次形碼的編碼、輸入方法可以根據(jù)實(shí) 際環(huán)境的需要和使用范圍,設(shè)計(jì)成各種各樣的漢字、輸入子集,大如相對(duì)獨(dú)立的中、日、韓三 國(guó)的漢字編碼集或輸入集,小到各行各業(yè)的諸如科貿(mào)、工商、教學(xué)等實(shí)際使用環(huán)境的需要, 都能得到廣泛的應(yīng)用。2. 2符號(hào)鍵在漢字輸入中的應(yīng)用1、符號(hào)鍵在漢字輸入中應(yīng)用,在3碼長(zhǎng)的簡(jiǎn)碼子集中已就1級(jí)簡(jiǎn)碼和2級(jí)簡(jiǎn)碼作 了介紹,在此集中仍然延用,作第二鍵運(yùn)用時(shí),即在鍵入字母鍵后的使用,設(shè)定了 3個(gè)使用 功能,一是作獨(dú)體字的直接輸入用,起到了輸入分流的作用,如鍵入‘J,’就輸入了 ‘已’字, 鍵入‘J’’就輸入了 ‘巳’字,鍵入‘J.,就輸入了 ‘己’字等,這兒個(gè)字筆劃數(shù)相同,筆劃也相 同,連形狀也近乎相同,在形碼輸入中,肯定是重碼,此時(shí)用符號(hào)鍵輸入非常有效,也不排斥 用數(shù)字鍵選擇輸入;二是作常用字的簡(jiǎn)碼輸入用,提高了輸入的效率,其中設(shè)定符號(hào)鍵‘_’ 專作中文數(shù)字輸入,如用編碼Τ-、L-、M-、B-輸入六、七、八、九這4個(gè)數(shù)字;三是作示根鍵 用,即拿出一個(gè)符號(hào)鍵,例如用「’符作示根符,當(dāng)鍵入任一鍵,如‘X’鍵,再鍵入「’鍵,會(huì) 從窗口彈出‘彳,’,指定輸入符號(hào)是‘,’,輸入符號(hào)‘,’就會(huì)實(shí)現(xiàn)輸入‘彳’的目的,這樣就 讓這些不常用的字符,既能輸入又避開(kāi)常用的輸入的資源環(huán)境,用符號(hào)鍵輸入,是兩全齊美 的選擇。2、符號(hào)鍵在漢字輸入中的第三鍵的使用主要用于區(qū)分雙根字結(jié)構(gòu)的作用,也作二級(jí)簡(jiǎn)碼輸入使用,作簡(jiǎn)碼使用時(shí),包括后續(xù)的第四鍵都不受字結(jié)構(gòu)的約束,參見(jiàn)9頁(yè)雙根設(shè) 定介紹。3、符號(hào)鍵在漢字輸入中的第四鍵主要作九宮結(jié)構(gòu)碼使用(參見(jiàn)此說(shuō)明書(shū)的第11 頁(yè)),也可作簡(jiǎn)碼使用,在權(quán)利要求書(shū)中的表2,除符號(hào)鍵的設(shè)定外,還包含了九個(gè)數(shù)字碼, 這是用于手機(jī)漢字輸入時(shí)的結(jié)構(gòu)碼的設(shè)定,表中最后一行中的數(shù)字,1示獨(dú)體字、2示雙根 字,這是后話。2. 3四筆層次形碼的輸入方法應(yīng)用2. 3. 1根據(jù)權(quán)利要求1所述的四筆層次形碼的編碼方法,即用50類相關(guān)部件分配 映射在26個(gè)英文字母上,再依照八項(xiàng)基本編碼規(guī)則進(jìn)行具體的編碼,再加上2. 1. 1所說(shuō)的 符號(hào)鍵的設(shè)計(jì),就自然形成了四筆層次形碼的鍵盤輸入方法,適用GB18030整個(gè)綜合編碼
字符集。2. 3. 2在權(quán)利要求2. 1中所講到的符號(hào)鍵的運(yùn)用,在4碼長(zhǎng)的體系中,由于范圍和 內(nèi)容的改變,符號(hào)鍵只在少于3個(gè)部件的漢字中有所利用,此時(shí)用空格鍵加選擇也是簡(jiǎn)明 的輸入方案,在前面(第5頁(yè)那18個(gè)字)提及第1、第9、第12、第18這4個(gè)字,可加上符號(hào) 成了 ‘g0V、msy/、db0,Zgb; ’,加上符號(hào)成了帶符號(hào)鍵輸入的編碼,其它編碼則完全相同, 體現(xiàn)符號(hào)鍵的功能。三、權(quán)利要求3的四筆形數(shù)碼輸入四筆形數(shù)碼是適用于GB2312或以常用字集為主體的,為手機(jī)數(shù)字輸入或電腦數(shù) 字輸入漢字的輸入方法,是基于權(quán)利要求1. 2所述的根據(jù)漢字的造字層次,逐層取根碼,不 管字的筆劃、部件多少,都取3個(gè)層次編碼,編碼部件是直接映射到9個(gè)數(shù)字鍵上,并以點(diǎn)2、 橫3、撇2、豎2的四筆比例設(shè)定1 9個(gè)數(shù)字,再加一個(gè)九宮結(jié)構(gòu)數(shù)碼,單字輸入共4個(gè)數(shù) 字編碼,是一種集形部件和部件結(jié)構(gòu)為一體的數(shù)字編碼輸入方法。1.四筆形數(shù)碼的編碼部件可以是筆劃,偏旁部首或獨(dú)體字等,以四筆分類;表3是 部件歸類表,即表明什么樣的部件,該用什么樣的數(shù)字代碼,現(xiàn)以點(diǎn)筆為例加以說(shuō)明,第一 行的數(shù)字代碼是‘ 1’,設(shè)定點(diǎn)、捺、或起筆是點(diǎn),次筆非點(diǎn)的部件代碼為‘ 1’,表3中的第三列 是‘1’編碼部件的舉例,如‘+、門’等,這里要提醒注意的是,部件的舉例只是少數(shù),關(guān)鍵在 于對(duì)中間一列的規(guī)則的設(shè)定。將編碼部件映射到具體數(shù)字鍵上的列表,有利于盡快地確定 可靠的代碼,在四筆形數(shù)碼的碼表中,好在一個(gè)類型除橫筆3種外,只有兩種選擇,兩種可 能,這和筆劃碼的麻煩、筆順相比,則比較簡(jiǎn)明,而速度要快多了,是一種非常實(shí)用快捷的編 碼方法。2.四筆形數(shù)碼輸入取3根碼,而且對(duì)獨(dú)體字、雙根字、3根字、多根(4根以上)字都 取三碼,3根字取3碼、多根字取層次3碼,此前已作了多次說(shuō)明,在形數(shù)碼中要說(shuō)明的重點(diǎn) 在于少筆劃的獨(dú)體字、雙根字和筆劃本身。方法是單筆劃重復(fù)兩次成3碼,如‘一’字,編 碼是‘333’,加結(jié)構(gòu)碼1,全碼是‘3331’;獨(dú)體字取部件碼加首尾筆排碼或拆2部件碼(含 筆劃、部件的交錯(cuò)),如‘人、千,等,編碼是‘761、764,,加結(jié)構(gòu)碼1,全碼是‘7611、7641,;又 如‘垂、凸、凹’等;取總根碼、加拆2(部件或首尾筆劃)碼,編碼是‘7751、8831、9831’ ;兩 根字取‘邊旁部首’碼(難分部首時(shí)取‘首部件’碼),加非部首部件的拆2雙碼,如‘根、碼、 審,等字,編碼是‘456、353、198,,加結(jié)構(gòu)碼2,全碼分別是‘4562、3532、1982,。3.筆形數(shù)碼的第4個(gè)數(shù)字碼設(shè)定為數(shù)字結(jié)構(gòu)碼,在前款中已說(shuō)明了單根、雙根字的應(yīng)用,這里要介紹的是權(quán)利要求2中的三點(diǎn)式九宮結(jié)構(gòu)碼在形數(shù)碼中的應(yīng)用,由于形數(shù) 碼只取3個(gè)部件碼,所以結(jié)構(gòu)碼在這里顯得特別重要。三點(diǎn)式九宮結(jié)構(gòu)數(shù)字碼例字表 從此表中可見(jiàn),九個(gè)格子叫做九宮是通俗的叫法,每個(gè)格子用1個(gè)數(shù)字代表,也是 毫無(wú)疑問(wèn)的,每一個(gè)格子內(nèi)最少有一種類型,是可以拆分為3點(diǎn)式的,所以將此表命名為九 宮結(jié)構(gòu)碼表,其中的數(shù)字就叫做九宮結(jié)構(gòu)數(shù)碼。以表中的例字為例,‘遠(yuǎn)、品、架’字的四筆形 數(shù)編碼分別是‘3313、8886、5849’,用如此的數(shù)碼輸入,不僅重碼很少,而且非常簡(jiǎn)明,是減 少重碼的有效手段之一。四筆形數(shù)碼的簡(jiǎn)碼設(shè)定是用‘0’替代1 3個(gè)數(shù)字碼。一級(jí)簡(jiǎn)碼一定是以該數(shù)字 為首碼的高頻字,二級(jí)簡(jiǎn)碼也是以前兩個(gè)數(shù)碼加‘0’設(shè)定,三級(jí)簡(jiǎn)碼同3個(gè)部件碼,直接加 ‘0’輸入,省略了結(jié)構(gòu)碼。4.四筆形數(shù)碼輸入是本發(fā)明的一個(gè)亮點(diǎn),去除簡(jiǎn)碼的設(shè)定,輸入的重碼實(shí)際上非 常少,滿4碼長(zhǎng)時(shí)最多也只有6 7個(gè),5鍵就能輸入GB2312中的任1個(gè)漢字,這是非常難得 的成果,現(xiàn)以輸入‘國(guó)家知識(shí)產(chǎn)權(quán)局’這七個(gè)字為例,其編碼分別是‘8 13 7487 1824 1131 4512 (6重碼選1)5583 (3重碼選1),擊鍵總數(shù)為(包括空格鍵在內(nèi))是27,27 + 7 = 3.86, 平均單字只有3. 86鍵,學(xué)起來(lái)也非常容易,輸入快捷方便,定將對(duì)社會(huì)的文明和進(jìn)步產(chǎn)生 極其深遠(yuǎn)的影響。四權(quán)利要求4的字母鍵位映射數(shù)字關(guān)系的說(shuō)明權(quán)利要求4講的是字母(鍵位)數(shù)字的映射關(guān)系,是本發(fā)明的又一個(gè)亮點(diǎn),后續(xù) 的權(quán)利要求6只是其在拼音數(shù)碼輸入、漢字?jǐn)?shù)碼輸入的具體的應(yīng)用而已。就字母映射而 言,只要字母總數(shù)不超過(guò)81個(gè),便能實(shí)現(xiàn)和兩個(gè)數(shù)字的對(duì)應(yīng)關(guān)系,如俄文、日文等;英文字 母只有26個(gè),只占三分之一,更可以利用鍵位映射數(shù)碼輸入,即每輸入一個(gè)字母用兩個(gè)映 射數(shù)字替代就行了,有些場(chǎng)合需將英文名如Obama譯成中文奧巴馬,在另一場(chǎng)合又要將奧 巴馬譯成英文,通常比較麻煩,是不可逆的,用此映射關(guān)系(以下表的前3行作映射例) Obama — 1935213721 — Obama是可逆的,是最好不過(guò)了,特別簡(jiǎn)明,包括俄、日字母等都可以 進(jìn)行此類方便的轉(zhuǎn)換,應(yīng)用極其廣泛,可以用兩個(gè)數(shù)字替代一個(gè)字母,對(duì)任意碼長(zhǎng)的字母編 碼都是可行的,比如,在本發(fā)明的3碼長(zhǎng)的四筆層次形碼中,就可以用6個(gè)數(shù)字映射編碼替 代,再加一個(gè)數(shù)字結(jié)構(gòu)碼便形成7碼長(zhǎng)的形數(shù)碼的輸入方法,只不過(guò)在韓碼體系中,有更簡(jiǎn) 明的4碼長(zhǎng)的形數(shù)碼輸入,遠(yuǎn)低小于7,因而未被采用。在26個(gè)字母的基礎(chǔ)上,如果按3倍計(jì)算,3組,共78個(gè)字符,映射78個(gè)雙數(shù)字碼; 或者用26個(gè)英文字母,再加一個(gè)虛擬字母,共27個(gè),相當(dāng)于權(quán)利要求4中表4中的占81 個(gè)映射數(shù)字,都能實(shí)現(xiàn)漢字的雙拼輸入。方法是用其3分之一,即26或27個(gè)字母鍵,作拼 音的無(wú)聲調(diào)雙拼數(shù)碼輸入,用另外的52或54個(gè),又分為兩組,按2 X 2組合,形成4種組合, 正好對(duì)應(yīng)拼音的4個(gè)聲調(diào),進(jìn)行漢字的4聲調(diào)的拼音數(shù)字輸入,特別是其中還兼有純漢語(yǔ)拼 音的4聲調(diào)數(shù)碼的輸入,具體的映射方式和輸入效果緊密相關(guān)。字母鍵位映射拼音數(shù)碼例表 1.在漢字的電腦鍵盤輸入中,具體的映射方式大致有行列排序、和(組)塊排序等 類型;因九九排序中不涉及數(shù)字‘0’,首先要將鍵盤第一行的最后一個(gè)字母P視為第三行的 字母,再?gòu)?fù)制兩次,成三組九行;前3行為第一組,如權(quán)利要求中的表4-1所示;中3行為第 二組,后3行為第三組,如表4-2所示。表4-1表4-2合并即如左表,前1個(gè)映射數(shù)字顯示 行,后1個(gè)數(shù)字顯示列數(shù),和通常所說(shuō)的行列式的表示方式極為相似,這在敘說(shuō)字母數(shù)字映 射關(guān)系時(shí),比較簡(jiǎn)單明了,在實(shí)際應(yīng)用中則不如后續(xù)的組塊排序便于記憶。1. 1用表4-1的映射關(guān)系可以作任何雙拼的數(shù)碼輸入。漢字的雙拼輸入是用漢字 的聲母+韻母的拼音輸入方法,由于聲母只有23個(gè),加1個(gè)虛擬聲母,只24個(gè),少于26個(gè) 字母,韻母用26個(gè)字母替代,實(shí)用中要靠記憶這些韻母的設(shè)定,因版本很多,繁雜無(wú)序、難 有特色、很難記憶,所以使用并不普遍;有了字母(鍵位)數(shù)字的映射,便能用數(shù)字替代聲 母、韻母的設(shè)定,進(jìn)行數(shù)碼的雙拼輸入,便能在僅有數(shù)字鍵盤的手機(jī)上進(jìn)行簡(jiǎn)單明快的漢字 輸入了,從而突顯了雙拼數(shù)碼漢字輸入的功能;由此可見(jiàn),此映射關(guān)系具有一定的普遍性, 用途廣泛。1. 2用表4-2的映射關(guān)系可以作任何4聲調(diào)的雙拼數(shù)碼輸入。表4_2包括兩組26 個(gè)字母的映射數(shù)字,再用兩組數(shù)字進(jìn)行2X2組合,即依據(jù)11、12、21、22的設(shè)定組成4組編 碼,正好對(duì)應(yīng)4個(gè)聲調(diào),便能在僅有數(shù)字鍵盤的手機(jī)上進(jìn)行簡(jiǎn)單明快的4聲調(diào)雙拼數(shù)碼輸 入,包括拼音和漢字的輸入。1. 3同時(shí)用表4-1,表4-2的映射關(guān)系可以同時(shí)作無(wú)聲調(diào)的、4聲調(diào)的綜合雙拼數(shù)碼 輸入,而且兩者互不干擾,數(shù)字‘0’均可作簡(jiǎn)碼輸入。2.字符數(shù)字的映射關(guān)系的組塊排序,即權(quán)利要求4中表4-3、表4-4所示,和前款 表4-1表4-2相比,特別是在雙拼輸入時(shí)直觀有序,便于記憶,最為簡(jiǎn)明。2. 1用表4-3的26鍵的1 9的字母映射的數(shù)碼,可以進(jìn)行無(wú)聲調(diào)的漢語(yǔ)拼音或 漢字的雙拼數(shù)碼輸入。在電腦鍵盤輸入中,如表4-3所示,26個(gè)字母在一個(gè)大組內(nèi),其特點(diǎn) 是作單獨(dú)無(wú)聲調(diào)輸入時(shí),相對(duì)比較簡(jiǎn)明,即每一行的3個(gè)組號(hào)數(shù)字和3個(gè)位號(hào)數(shù)字相同;如 輸入‘?dāng)?shù)’字,拼音是‘shu’,用無(wú)聲調(diào)輸入,sh — e — 13、u — q — 11,輸入數(shù)碼是1311, 就可輸入拼音‘shu’或漢字‘?dāng)?shù)’。2. 2用表4-4的兩組26鍵的1 9的字母映射的數(shù)碼,可以進(jìn)行4聲調(diào)的漢字的 雙拼數(shù)碼輸入,方法是將兩組的字母(鍵位)映射數(shù)字編碼,按組號(hào)分類成1、2,按11、12、 21、22四種組合,并令之對(duì)應(yīng)4個(gè)聲調(diào),就能實(shí)現(xiàn)漢字的雙拼4聲調(diào)的拼音數(shù)碼輸入,好處是 用4個(gè)數(shù)碼就能實(shí)現(xiàn)4聲調(diào)的漢字或漢語(yǔ)拼音的輸入,用于只有數(shù)字鍵盤的手機(jī)漢字輸入, 突顯方便。
22
左圖表是表4-4所示的9個(gè)小組中的第一小組的映射關(guān)系,涵蓋qw e 3個(gè)字母, 映射數(shù)碼的前位碼,即小組編碼是1,后位碼又分上、下兩種情況,并進(jìn)行2 · 2組合(2進(jìn) 制),即依據(jù)11、12、21、22的設(shè)定組成4組編碼,正好對(duì)應(yīng)4個(gè)聲調(diào)的雙拼輸入,包括拼音和 漢字的數(shù)碼輸入等;如輸入‘?dāng)?shù)’字,拼音是‘shu’,有兩個(gè)讀音,分別是sM和shi!,以3聲 輸入的規(guī)則是‘21’,數(shù)碼是Sh—e\19,t>—丨4、即SM—1914;4聲輸入的規(guī)則是‘22’,數(shù)碼 是sh-e\19,^qM7jp shu - 1917 ;輸入數(shù)碼1914 (3聲調(diào))、1917 (4聲調(diào)),就可輸入拼 音'shu, shu'或漢字‘?dāng)?shù),。2. 3同時(shí)用表4-3,表4_4的映射關(guān)系可以同時(shí)作無(wú)聲調(diào)的、4聲調(diào)的綜合雙拼數(shù)碼 輸入,而且兩者互不干擾,數(shù)字‘0’均可作簡(jiǎn)碼輸入。表4-3表4-4所示的特點(diǎn)是突出顯示組碼相同,即前位碼相同的前題下,前、后兩 組的次位碼的規(guī)則排序具有多樣性,即權(quán)利要求書(shū)所述的‘不外是’ ‘123、456、789’,證明在 漢字或拼音的雙拼數(shù)碼輸入中有多種選擇,同樣可行。3.用三組1 9的字母(鍵位)映射的數(shù)碼,即78或81個(gè)數(shù)碼空間,就能同時(shí)實(shí) 現(xiàn)雙拼無(wú)聲調(diào)、和4聲調(diào)的漢語(yǔ)拼音或漢字的雙拼數(shù)碼輸入,由于它們有各自的編碼空間, 沒(méi)有重疊的部分,所以綜合版的拼音、漢字的雙拼數(shù)碼輸入可以同時(shí)作無(wú)聲調(diào)輸入和4聲 調(diào)輸入,而且互不干擾,是一種嶄新的字母數(shù)字映射輸入方法,為雙拼輸入開(kāi)辟了數(shù)碼輸入 拼音、漢字的美好前景;特別是4聲調(diào)的拼音輸入,只要取兩組鍵盤字母復(fù)制映射數(shù)碼,然 后按2X2的組合,形成4聲調(diào)的拼音輸入數(shù)碼,便能進(jìn)行漢語(yǔ)拼音、漢字的4聲調(diào)的輸入, 具體的實(shí)用價(jià)值非常高,使在字母鍵盤輸入中難以實(shí)現(xiàn)的漢語(yǔ)拼音的4聲輸入變得十分的 簡(jiǎn)單,這在后續(xù)的權(quán)利要求6中有充分的體現(xiàn),是本發(fā)明的又一精彩的亮點(diǎn)。五、權(quán)利要求5的韓碼雙拼輸入語(yǔ)言文字是難以分割的兩部分,在漢字編碼、輸入實(shí)踐中,形碼輸入特別符合漢字 的特點(diǎn),可以說(shuō)是對(duì)癥下藥的編碼、輸入方法,漢字有417種發(fā)音,用拼音輸入漢字最大的 缺點(diǎn)就是重碼特多,在僅有數(shù)千字的編碼輸入子集中,重碼就多達(dá)百余個(gè),如再增加字?jǐn)?shù), 重碼當(dāng)然會(huì)更多,實(shí)用的拼音輸入往往以詞條輸入為主,這就減少了重碼,成了比較流行的 漢字輸入方法,和形碼輸入有互補(bǔ)的作用。在漢語(yǔ)拼音中有23個(gè)聲母,30多個(gè)韻母,作雙拼輸入時(shí),通??梢栽?6個(gè)字母之 內(nèi)23個(gè)聲母以外設(shè)定某鍵作虛擬聲母以滿足無(wú)聲母拼音的輸入,如果在26個(gè)字母以外再 加1個(gè)虛擬字母或鍵,那就給數(shù)碼拼音的輸入增加了編碼空間,其中包括韻母、虛擬聲母的 設(shè)定和韻母輸入時(shí)的后虛擬鍵的雙拼輸入等,這種后虛擬鍵的雙拼輸入,已經(jīng)不是完整的 ‘聲韻’雙拼輸入的概念。1.在拼音輸入中漢字的雙拼輸入是一種較為流行的輸入方法,而雙拼的聲母韻母
設(shè)定的版本很多。本編碼體系采用了比較特殊的韻母設(shè)定,基本上是按韻母的5個(gè)板塊和
字母的自然次序順次排列,特別便于記憶,加上聲母絕大多數(shù)和電腦鍵盤上的設(shè)定一樣,所以在總體上記憶量很少,是一種非常簡(jiǎn)單易行的拼音輸入方法,而且可以利用其字母鍵位, 映射成數(shù)碼輸入,這就淡化了字母,強(qiáng)化了鍵位與編碼數(shù)字的設(shè)定關(guān)系,從而突顯了數(shù)碼的 板塊和順序的設(shè)定優(yōu)點(diǎn),為韓碼數(shù)字雙拼打好了良好的基礎(chǔ),好就好在經(jīng)字母鍵盤映射數(shù) 碼后,見(jiàn)到的僅僅是5個(gè)韻母系列,和系列中的韻母有規(guī)則的排列,這是韓碼雙拼和其它雙 拼的本質(zhì)區(qū)別。2.韓碼鍵盤是將e移到了 h位,u移到q位,i移到ζ位,并互換這6個(gè)字母的鍵 位,這樣就避免了 h當(dāng)作e用、q當(dāng)作u用、ζ當(dāng)作I用的尷尬,就可以把聲母的設(shè)定和韻母 的設(shè)定統(tǒng)一了起來(lái),就常用韓碼輸入的人來(lái)說(shuō),有百利而無(wú)一害。2. 1那改動(dòng)是否具有科學(xué)性呢,回答是肯定的,這是因?yàn)橹形妮斎氩煌谟⑽妮?入,有自己的特點(diǎn),而鍵盤是針對(duì)英文輸入字母使用的頻度設(shè)計(jì)的,中文的拼音字母是借用 英文字母的,但字母的使用頻度則完全不一樣,有的字母占據(jù)著重要的鍵位,象U、i等使 用的頻度并不高,而使用頻度較高的q、ζ卻被邊緣化了,所以面對(duì)中國(guó)如此多的使用鍵盤 的人群,改是一定要改的,只是找不到合理的依據(jù)而已;隨著韓碼雙拼的問(wèn)世,為提高雙拼 的輸入效率,勢(shì)必要取代雜亂無(wú)章的雙拼,那改動(dòng)鍵盤字母鍵位的設(shè)計(jì),當(dāng)然要提上議事日 程,具有毋庸置疑的科學(xué)性。2. 2在韓碼輸入體系中,鍵位是一個(gè)重復(fù)率很高的詞,在映射關(guān)系中最為突出的數(shù) 字編碼就是由鍵位確定的,鍵位和指法有緊密的聯(lián)系,韓碼鍵盤就是針對(duì)鍵位和指法的一 種實(shí)用性很強(qiáng)的中文輸入的鍵盤設(shè)計(jì),是依據(jù)韻母的設(shè)定e — h、i — z、u — q進(jìn)行的,令之 互換位置,則新鍵盤的字母排列是UWHRTYQZOP,ASDFGEJKL,IXCVB匪,顯然,H、Q、Z都調(diào)到了 便于擊鍵的高頻度區(qū)域,加上原聲母的設(shè)定zh = ο, ch = ν, sh = e,就將z、zh, c、ch, S、 sh又都在同行呈現(xiàn),其便于記憶的優(yōu)點(diǎn)是不言而喻的,而且和韻母在26英文字母設(shè)定所在 的鍵位上,按a ο e i u 5個(gè)系列分塊有序排列,形成了高度的統(tǒng)一,即第1行10個(gè)鍵位排 列u7o3兩個(gè)系列,第2行9個(gè)鍵位排列a5e4兩個(gè)系列,第3行7個(gè)鍵位由‘i’系列獨(dú)占, 是表5的鍵位形態(tài)的突出體現(xiàn),其中u系和i系有互補(bǔ)交換,以便于在作純漢語(yǔ)拼音輸入時(shí) 出現(xiàn)重碼;字母在鍵盤中的具體位置是次要的,故延用英文鍵盤設(shè)計(jì),保留英文輸入基本格 局,只對(duì)牽涉到韓碼雙拼輸入的6個(gè)字母進(jìn)行變動(dòng),這樣改動(dòng)的實(shí)用性是顯然的,可以在兩 種輸入體系中共享鍵盤資源。3.輸入的鍵盤韻母設(shè)定如表5所示,這是按26個(gè)字母鍵位設(shè)定的韻母排序,說(shuō)明 如下3. 1第一行的兩個(gè)韻母系列,設(shè)定a和e正好占9個(gè)代碼,完全按字母的自然順序 排列。3. 2將韻母u移至字母q位鍵位,這樣的好處是有利于韻母按字母的自然順序排 列,其最后一個(gè)韻母是110,和ο系的韻母OU正好有對(duì)稱的形式,再加上韻母‘U’,共9個(gè)與 ‘U’有關(guān),這樣淡化了字母,只講排序,特別便于記憶。3. 3在一行中ο系占用右鍘3個(gè)鍵位,依次是0U、0、0ng分別從I、o、p原鍵盤字母 鍵位,這里的OU設(shè)置是為了此行的整體排序效果,形成U系和O系的自然鏈接,即形成第1 行的U0 ou(u)o ong,效果,以便于記憶。3. 4第3行將I設(shè)定在ζ鍵上,I系列的排列和in ing和字母η的有機(jī)地聯(lián)系在一起。
3. 5互韻母有iang從ua,uang從ia或iu,具有對(duì)等、互換或聯(lián)想的色彩;iao隨 iang之后從uai或i在系單列;U從ο鍵,和U0 ou U有自成一體的感覺(jué)。3. 6雙拼輸入中對(duì)表5中的加有‘*’的韻母,表示可無(wú)聲母直接輸入漢字,實(shí)際輸 入時(shí)缺少一個(gè)‘無(wú)’的輸入信息,需虛擬一個(gè)聲母,如可選字母a (實(shí)為鍵位);或在后續(xù)的拼 音數(shù)碼輸入(權(quán)利要求6)中設(shè)定的26個(gè)字母之外的虛擬鍵位輸入,后虛擬鍵才是真正的 虛擬,無(wú)需設(shè)定特定的字母或符號(hào)。3.7表5對(duì)韻母的設(shè)定可以看出,韻母除了 a外,e u Ui在英文鍵盤上都不是用英 文字母鍵,這里特引進(jìn)鍵位這個(gè)詞,忽略、淡化字母本身,想到的僅是韻母、鍵位、數(shù)碼,強(qiáng)化 了字母數(shù)碼的映射、界定,特別的簡(jiǎn)明,非常便于記憶,當(dāng)然用韓碼鍵盤則能高度的統(tǒng)一。4.碼雙拼中當(dāng)進(jìn)入雙拼狀態(tài),即擊過(guò)字母鍵之后,到輸入漢字之前,借助符號(hào)鍵可 作聲調(diào)的篩選及翻頁(yè)的功能。六、權(quán)利要求6的韓碼的漢語(yǔ)拼音數(shù)碼輸入和漢字的數(shù)碼輸入漢字的雙拼輸入實(shí)際上有兩個(gè)輸入層次,1是拼音,2是漢字,漢字的雙拼數(shù)碼輸 入也是如此。在絕大多數(shù)情況下,講輸入都是指輸入漢字,很少用到拼音的輸入,而忽略了 輸入拼音的需求,在韓碼的雙拼數(shù)碼輸入中,不僅講漢字的輸入,還要講漢語(yǔ)拼音的輸入, 特別是4聲調(diào)的漢語(yǔ)拼音的輸入功能。1.韓碼的漢語(yǔ)拼音輸入或漢字的數(shù)碼輸入形式之一是用26鍵的設(shè)定,拼音數(shù)碼 輸入或者叫漢語(yǔ)拼音數(shù)碼輸入是權(quán)利要求6的請(qǐng)求保護(hù)的內(nèi)容,這是在權(quán)利要求4的字母 鍵盤數(shù)字映射的基礎(chǔ)上,加上權(quán)利要求中的表5或表6的聲母、韻母設(shè)定基礎(chǔ)上形成的數(shù)碼 輸入方法;漢字的雙拼數(shù)碼輸入,和拼音的數(shù)碼輸入的基本條件和形成過(guò)程幾乎一樣,區(qū)別 僅在于最終的輸入目的的差別,兩者是緊密地聯(lián)系在一起的,都存在著無(wú)聲調(diào)輸入,4聲調(diào) 輸入和兩者兼而有之的綜合輸入方法。1. 1采用權(quán)利要求4所述的字母鍵盤映射數(shù)字編碼方法,加上拼音的聲母、韻母設(shè) 定,就能映射成4個(gè)數(shù)字編碼,實(shí)現(xiàn)拼音即漢語(yǔ)拼音、或漢字的拼音輸入;在說(shuō)明通用拼音 輸入時(shí)按表4-1表4-2的行排序的鍵位數(shù)字映射取拼音的輸入數(shù)碼,最為簡(jiǎn)潔明了,具體 的舉例和體驗(yàn),由于聲母、韻母設(shè)定的未知性和不確定性,只能參照后續(xù)的韓碼拼音數(shù)字輸 入,以理解其普遍適用性。1. 2韓碼拼音26鍵映射數(shù)字輸入是用權(quán)利要求中的表5或表6所述的對(duì)聲母、韻 母的設(shè)定,將拼音的聲母、韻母映射成4個(gè)數(shù)字編碼,共78個(gè),實(shí)現(xiàn)拼音即漢語(yǔ)拼音的輸入, 或漢字的拼音輸入;在權(quán)利要求4中的鍵位數(shù)字的映射數(shù)碼,有取一組、兩組、或三組數(shù)字 映射編碼的選擇,取一組的映射可實(shí)現(xiàn)雙拼的無(wú)聲調(diào)的拼音輸入,取兩組就可作4聲調(diào)的 雙拼的拼音輸入,取三組的編碼方式是同時(shí)兼有無(wú)聲調(diào)和有聲調(diào)雙拼的拼音輸入;因?yàn)槠?音的數(shù)碼輸入和漢字的拼音數(shù)碼輸入大同小異,只是映射目標(biāo)的差異,或者說(shuō)是半成品和 成品之間的關(guān)系;作韓碼的漢語(yǔ)拼音的數(shù)碼輸入或漢字的數(shù)碼輸入時(shí)引用表4-3表4-4的 塊(組)分組排序的鍵位數(shù)字映射的數(shù)碼輸入,都采用4碼長(zhǎng)設(shè)定,僅僅是舉例不同而已, 互換同樣適用。1. 2. 1表4-3是包括虛鍵的單組設(shè)定,完全滿足表5的只用26個(gè)字母鍵的雙拼輸 入,或跳過(guò)(虛鍵數(shù)碼92,用此選)或刪除虛擬鍵(將字母P的映射數(shù)碼93改為92),此時(shí) 的無(wú)聲母的韻母輸入可用26鍵中去除23個(gè)聲母設(shè)定以外的3鍵作虛擬聲母作無(wú)母韻的輸
25入,表5中是設(shè)A鍵作虛擬聲母鍵;現(xiàn)以輸入拼音zhong為例,按權(quán)利要求5的設(shè)定,zh的代 碼為o,ong的代碼為P,再按表4-3的鍵位數(shù)字映射的數(shù)碼就分別是33和93,即輸入3393 四個(gè)數(shù)字就等同于輸入了拼音zhong,在軟件的支持下,便能顯示拼音zhong,從而達(dá)到了 輸入的目的,或者以此數(shù)碼輸入‘中’字等。1. 2. 2表4-4是包括虛鍵的雙組設(shè)定,和前述一樣,用26鍵時(shí)選擇跳過(guò),按權(quán)利要 求4表4權(quán)利要求5的表5進(jìn)行兩組的鍵位數(shù)字的一一映射,并進(jìn)行類似2進(jìn)制的排列組合 形成的4組數(shù)字編碼,其聲調(diào)隱藏在4個(gè)數(shù)字編碼之中,這是韓碼雙拼的4聲調(diào)輸入的典型 特色,如要輸入拼音‘zhdng,,是1聲,取‘1-1,的映射關(guān)系,即zh — ο — 36,ong — P — 96 的兩組數(shù)字,兩者的結(jié)合就是3696,輸入3696即相當(dāng)于輸入了 zhdng,在軟件的支持下便能 顯示zhdng的輸入,或輸入‘中’字;再以輸入6r為例,系第二聲,為1-2的映射關(guān)系,根據(jù) 表4表5,即J映射成67,因?yàn)槭菬o(wú)聲母,在表4-4中設(shè)定A虛鍵的映射數(shù)字是44,輸入4467 即相當(dāng)于輸入了 ι·,并用軟件顯示 ι·,或可輸入漢字‘兒’,由此可見(jiàn),聲調(diào)隱藏在4個(gè)數(shù)碼 之中。1. 2. 3根據(jù)權(quán)利要求4的鍵位數(shù)字映射方法,權(quán)利要求5或權(quán)利要求6的聲母韻 母的鍵位設(shè)定,從以上表4-3取單組作無(wú)聲調(diào)的拼音輸入,表4-4取兩組作4聲調(diào)的拼音的 數(shù)碼輸入,可見(jiàn)無(wú)聲調(diào)輸入和有聲調(diào)的4聲調(diào)的拼音數(shù)碼輸入都有各自的編碼空間互不干 擾,取三組的實(shí)質(zhì)便是同時(shí)兼有這兩種輸入而已,要輸入上述兩例,過(guò)程和結(jié)果完全一樣, 是一種特別適用于數(shù)字鍵盤(如手機(jī))的漢字輸入方法。2.碼的漢語(yǔ)拼音輸入或漢字的數(shù)碼輸入形式之二是用27鍵的設(shè)定,用表4-3和 表4-4是最為簡(jiǎn)明的塊分組排序映射設(shè)定,其好處是兩位數(shù)字的前一個(gè)數(shù)字在作無(wú)聲調(diào)或 4聲調(diào)輸入變化時(shí)都不會(huì)發(fā)生變化,變化的只是后一個(gè)數(shù)字。無(wú)聲調(diào)輸入(表4-3的后1個(gè)數(shù)字(第二、第四)不外是1、2、3中的1個(gè);4聲調(diào)輸入(表4-4)的第1聲(1-1)組合的第二、第四個(gè)數(shù)字不外是4、5、6中的 1個(gè)數(shù)字;第2聲(1-2)組合的第二個(gè)數(shù)字是4、5、6中的一個(gè),第四個(gè)數(shù)字是7、8、9中的1 個(gè);第3聲(2-1)組合的第二個(gè)數(shù)字是7、8、9中的一個(gè),第四個(gè)數(shù)字是4、5、6中的1 個(gè);第4聲(2-2)組合的第二、第四個(gè)數(shù)字不外是7、8、9中的1個(gè)數(shù)字。如果設(shè)定某一組作無(wú)聲調(diào)輸入,那另外兩組就用作4聲調(diào)的輸入,而且如前述,和 4聲的關(guān)系類似二進(jìn)制的約定,下面就漢字的音數(shù)碼輸入舉例加以說(shuō)明2. 1韓碼雙拼的漢字無(wú)聲調(diào)輸入,是在聲母、韻母設(shè)定的基礎(chǔ)上加上權(quán)利要求4的 表4-3鍵位數(shù)字映射完成。如權(quán)利要求所述,要輸入‘創(chuàng)’字,首先要知道其拼音chuang,再 區(qū)分出聲母是ch,韻母是uang,根據(jù)權(quán)利要求5的表5設(shè)定,ch — v,uang — m,根據(jù)表4_3, v-81,m-91,那漢字‘創(chuàng),的拼音無(wú)聲調(diào)數(shù)碼輸入的4個(gè)編碼就是8191 ;輸入8191即相 當(dāng)于映射到chuang的拼音,是可以作輸入chuang的,而這和前款的拼音輸入要求不同,是 要在拼音是chuang的眾多的漢字里找到漢字‘創(chuàng)’,在此后的窗口有6個(gè)漢字顯示(本試用 版),1聲有‘窗、疫’,2聲有‘床’,3聲有‘闖’,4聲有‘愴、創(chuàng)’,‘創(chuàng)’字是6中選一。這里的 輸入數(shù)碼是8191,權(quán)利要求中的是8192,區(qū)別僅于韻母的設(shè)定而異。
2. 2表4-4是兩組鍵位數(shù)字映射,作4聲調(diào)漢字輸入或漢語(yǔ)拼音輸入,表6是韓碼 聲母、韻母27鍵設(shè)定例表,表4-4的前組的組內(nèi)編碼是4、5、6,后組是7、8、9,每組的中行是 公用的小組號(hào),小組號(hào)編碼即為映射前數(shù)碼,與有、無(wú)聲調(diào),及各聲調(diào)的輸入選擇無(wú)關(guān);作漢 字或漢語(yǔ)拼音4聲調(diào)輸入時(shí),第一、第三個(gè)數(shù)字是小組數(shù)(即映射的前數(shù)碼),區(qū)別僅在于第 二、第四的小組內(nèi)映射數(shù)碼,即在塊分組的鍵位數(shù)字映射關(guān)系中,在表4-3表4-4的四個(gè)數(shù) 字中有如下特點(diǎn)按表4-4是兩組模式的鍵位數(shù)字映射表,和表6的聲母、韻母設(shè)定,有4種組合數(shù) 字編碼,對(duì)應(yīng)著拼音的4個(gè)聲調(diào),還以續(xù)前無(wú)聲調(diào)輸入例,改輸入拼音是chfeng,并2聲調(diào)的 漢字‘床,字為例,根據(jù)表6的聲母、韻母設(shè)定,ch—虛\98,即chtiang — 8498, 當(dāng)輸入2聲調(diào)數(shù)碼8498,就能輸入2聲調(diào)的拼音一chfeng,或輸入‘床,字8498 — ‘床,;同 樣,要輸入‘闖’字,系3聲調(diào),數(shù)碼是8795,就能直接輸入‘闖’字,無(wú)須選擇;‘創(chuàng)’有兩個(gè) 讀音,系1聲和4聲,1聲的4聲調(diào)映射輸入數(shù)碼是8495,4聲調(diào)數(shù)碼是8798,都能輸入‘創(chuàng), 字,這比無(wú)聲調(diào)的輸入數(shù)碼8191或8192,效果好得多了,請(qǐng)注意這8192、8495、8498、8795、 8798中,正好符合了 5種輸入狀態(tài)的數(shù)碼,都有各自的編碼空間,就某鍵位而言,其后數(shù)碼 正好是1、4、7,或2、5、8的規(guī)律,和權(quán)利要求書(shū)中的不外是123、456、789,或者是147、258、 369的規(guī)律,而且淡化了字母了 ν、‘虛’鍵的實(shí)際意義,只在于鍵位和映射的組合。在27鍵輸入時(shí),編碼空間更大更方便,如韻母uang,在表5中設(shè)定在ζ (i)鍵位,在 表6中設(shè)定在虛鍵位,iao在表6中是獨(dú)占了一個(gè)鍵位,這都是編碼空所帶來(lái)的好處,具有 更大的機(jī)動(dòng)能力。2. 3韻母的直接輸入例,欲輸入漢字‘兒’,拼音是 ι·,音調(diào)系第二聲,無(wú)聲母,按4 聲調(diào)漢字的拼音數(shù)碼輸入,可用表4-2、表4-4映射數(shù)碼設(shè)定,聲母、韻母設(shè)定可用表5或 表6的約定,現(xiàn)先以用表4-4和表5為例,表5的虛聲母為A鍵,按虛聲母+韻母的2聲調(diào) 的映射,虛一Α —44,er — j — 67,那輸入6r或漢字‘兒,的數(shù)字編碼是4467 ;再以表 6的聲母、韻母設(shè)定,拼音是無(wú)聲母輸入例,或用韻母+虛鍵進(jìn)行漢字的拼音數(shù)碼輸入, er — j — 64,虛一98,其輸入數(shù)碼是6498,也就是說(shuō)輸入數(shù)碼6498就可輸入拼音‘6r,或 漢字‘兒’,在GB2312中有5個(gè)字,‘兒’從5中選一輸入即可。2. 4在漢字的拼音數(shù)碼輸入中,可設(shè)定數(shù)字‘0’作中斷符,輸入特定的常用高頻 字,這種對(duì)簡(jiǎn)碼的記憶投入會(huì)給自己帶來(lái)輸入快捷的豐厚回報(bào)。續(xù)前款,如果設(shè)定‘兒’是 簡(jiǎn)碼6490,就可直接輸6490就能直輸‘兒’字了,請(qǐng)注意,簡(jiǎn)碼的設(shè)定,是加數(shù)字‘0’,可替 代后1個(gè)、兩個(gè)、最多3個(gè)數(shù)字編碼,實(shí)現(xiàn)直輸?shù)哪康摹F唔n碼的卓越性能1、四筆的部件分配均衡合理,根據(jù)對(duì)編碼數(shù)據(jù)庫(kù)的初步統(tǒng)計(jì),對(duì)GB2312未作簡(jiǎn)碼 設(shè)定前的全碼進(jìn)行統(tǒng)計(jì),能3碼直接輸入的漢字占總數(shù)的64% ;點(diǎn)筆類的總擊鍵數(shù)占擊鍵 總數(shù)、代碼數(shù)占代碼總數(shù)的比例分別是20%和19.2%,豎筆是19%和19.2%,橫筆是35% 和34.6%,撇筆是26%和27%,誤差很少,非常符合26個(gè)鍵的5 5 9 7的所占比 例,這是最為突出的成功之處;2、四筆的重碼率極低,以GB2312為主的字符集,借助符號(hào)鍵能實(shí)現(xiàn)3鍵無(wú)重輸 入;3、四筆對(duì)GB18030的編碼非常的簡(jiǎn)明方便,通過(guò)對(duì)70244個(gè)漢字的編碼排序發(fā)現(xiàn),滿碼長(zhǎng)重碼最多只有的9個(gè),其編碼是mum,在現(xiàn)輸入平臺(tái)中只有1個(gè)‘郷’字能顯示(注), 此重碼奪冠,與GF3001的‘120號(hào)部件(門)’設(shè)定有關(guān);次重碼8個(gè),編碼是nsbi,以下便 是8組7重碼,以編碼rmoy為例,能輸入顯示(GBK)的只‘熵’ 一個(gè)字;可見(jiàn)重碼字會(huì)因子 集收字的范圍變更而改變,多數(shù)在GB18030新增的范圍內(nèi),很難有定論。4、本人已用四筆層次編碼方法,對(duì)收錄了約一萬(wàn)多字的字典進(jìn)行了編碼排序,現(xiàn) 已裝訂成策,此字典的特點(diǎn)是用四筆編碼排序替代拼音排序,把原來(lái)的拼音排序改成拼音 索引,取消了部首筆劃查字的環(huán)節(jié)。漢字講的就是字形,按形碼編碼排序,一字可能有多個(gè) 發(fā)音,都集中在一起,這樣特別利于了解一字多音的內(nèi)涵,克服了往往因?yàn)閼械脛?dòng)手再去查 驗(yàn),造成對(duì)字的不甚了解;我在編撰字典中,發(fā)現(xiàn)一例,是‘拽’這個(gè)字,我通常的理解是‘拉’ 的意思,這也沒(méi)有錯(cuò),當(dāng)在編碼排序后發(fā)現(xiàn),此字有3個(gè)發(fā)音,其中‘zhuM’的意思是‘扔’, 然后‘zhuM’的意思才是‘拉’,不同的聲調(diào),意思完全相反,拉和扔的方向正好相反,此例 充分說(shuō)明,以形碼歸類,將讀音歸到一起,對(duì)于對(duì)字的理解十分有利,所以用四筆層次編碼 排序,為字典、辭典的字詞的查找提供了極大的方便,非常的快捷,又因四筆編碼只須記憶4 筆分類約50個(gè)部件組合,非常的簡(jiǎn)明,查找快捷,必將為中文漢字的研究、出版、創(chuàng)造了非 常有利的條件。5、四筆編碼(權(quán)利要求1)也好,輸入(權(quán)利要求2)也好,適用范圍很廣涵蓋 GB18030的70244個(gè)漢字,顯然包括中、日、韓在內(nèi),當(dāng)然可以編撰適用各自范圍的子集,將 為中、日、韓等民眾廣泛地使用漢字開(kāi)了便捷管道,造福各國(guó)人民。6、四筆的形數(shù)碼(權(quán)利要求3)只有4碼長(zhǎng),重碼也只有數(shù)個(gè),5鍵就能(GB2312) 輸入任一個(gè)漢字,特別適用于通訊用手機(jī)的漢字輸入。7、權(quán)利要求4的表4特征,是字母鍵盤映射數(shù)字的發(fā)明,是韓碼拼音數(shù)碼輸入的關(guān) 鍵所在,也為其它雙拼輸入轉(zhuǎn)化為數(shù)碼輸入提供了捷徑,和韓碼雙拼的區(qū)別僅局限于虛擬 聲母的設(shè)定。8、韓碼的雙拼聲母韻母的設(shè)定,為華人鍵盤的誕生開(kāi)辟了廣闊的前景,這是符合 華人語(yǔ)言習(xí)慣的鍵盤,屬于中國(guó)人的鍵盤,真正的功勞要?dú)w功于韓碼雙拼中的韻母按板塊 的系列設(shè)置和鍵位數(shù)字的映射。9、韓碼雙拼的拼音(漢語(yǔ)拼音)數(shù)碼輸入是韓碼音數(shù)碼漢字輸入的基礎(chǔ),是十分 有效的拼音的輸入方法,具有難以替代的誘惑和魅力,用4個(gè)數(shù)字就能夠作4聲調(diào)的拼音輸 入,就是用26個(gè)英文字母都難以實(shí)現(xiàn),4位數(shù)碼做到了,而且有著比字母的拼音輸入更快的 速度、更高的效率,這是一項(xiàng)奇績(jī)。10、韓碼的雙拼數(shù)碼漢字的輸入極其簡(jiǎn)明,具有拼音固有的優(yōu)點(diǎn),即對(duì)熟悉拼音的 青年學(xué)生來(lái)講幾乎不用學(xué)習(xí)就會(huì)使用,會(huì)給手機(jī)通訊的發(fā)展帶來(lái)十分利好的前景。下面以韓碼應(yīng)用實(shí)例,證明其優(yōu)越性能。a)音數(shù)碼的輸入和形數(shù)碼一樣,也設(shè)定為4碼長(zhǎng),現(xiàn)以輸入我的前申請(qǐng)‘漢字的 四筆層次形碼及形音的數(shù)字編碼輸入方法’這21個(gè)字為例,加深理解一下音數(shù)碼塊分組4 聲數(shù)碼輸入的實(shí)際效果,這21字譯成數(shù)碼如下漢594、字7787選4、的4、四4887選0、筆 8884選7、層7669、次7987選3、形7589選4、碼9744選4、及6487翻選、形7589選4、音 2686翻選、的4、數(shù)19、字7787選4、編8575選5、碼9744選4、輸1311翻選9、入2717選 6、方5454選3、法5744選2,(注此數(shù)碼用的老版本,字和數(shù)碼后的‘選’字說(shuō)明在現(xiàn)用輸
28入軟件中輸入了這些數(shù)碼后,需要選擇重碼字,‘翻選’是指需要翻頁(yè)再選。)從中可見(jiàn)有3 次需翻頁(yè),有3次不足規(guī)定的碼長(zhǎng),大致單字需要輸5鍵左右,可見(jiàn)就4碼長(zhǎng)的數(shù)字編碼輸 入方法來(lái)講,效率非常高,據(jù)編碼排序發(fā)現(xiàn),作無(wú)聲調(diào)輸入時(shí)重碼會(huì)多到100多個(gè),作4聲輸 入時(shí)重碼只有50多個(gè)。b)列寧在國(guó)家與革命中講的一段話是‘被壓迫階級(jí)的解放,不僅非進(jìn)行暴力革 命不可,而且非消滅統(tǒng)治階級(jí)所建立的、體現(xiàn)這種脫離的國(guó)家政權(quán)機(jī)構(gòu)不可。這是馬克思對(duì) 革命的任務(wù)做了具體的歷史的分析后得出的絕對(duì)肯定結(jié)論?!瘜⑦@段話,分別用簡(jiǎn)形碼、形 數(shù)碼,音碼、音數(shù)碼進(jìn)行了輸入演示,根據(jù)示例的單字輸入統(tǒng)計(jì),包括空格鍵、翻頁(yè)鍵在內(nèi), 平均單字單輸擊鍵數(shù)效果如下表單輸擊鍵數(shù)效果表 c)再舉胡錦濤同志在西柏坂的一段講話是‘我們永遠(yuǎn)不能忘記他們?yōu)辄h和人民 建立的豐功偉績(jī),永遠(yuǎn)不能忘記他們用生命培育的奮斗精神,一定要繼承和發(fā)揚(yáng)他們的優(yōu) 秀品質(zhì)和崇高精神,做到為黨和人民的事業(yè)生命不息、奮斗不止?!?78字)現(xiàn)以單字對(duì)應(yīng)的 形式,譯成四筆形碼如下:z xq q ;asq s vye tr ;qjxh xq r Ion bo x, jl gl tw b g ;ah, xg vgy, q ;asq s vye tr ;qj xh xq n,z,moj fto ty ;b sp ;wd rgy qo,,a_ rj av vru Ie bo vk kl xh xq b xk bb ooo ndxbo irq to rgy qo,, xdz afp r Ion bo x, jl b g p, ζ ;moj s nr、sp ;wd s i]。從編碼的譯文可見(jiàn),單字最多3碼,平均單字單輸擊鍵數(shù)如下如不包括空格鍵 共171個(gè)字符,171/78 = 2. 2 (鍵);如包括空格鍵,設(shè)空格=0. 6鍵,則有(171+25) /78 = 2. 51 (鍵),此例是依據(jù)實(shí)際編碼設(shè)定的輸入軟件的統(tǒng)計(jì)數(shù),單字平均擊鍵數(shù)不僅與所選文 章相關(guān),也與部件歸類的多少呈逆相關(guān),減少大類必然導(dǎo)致?lián)翩I數(shù)增高,此只比原說(shuō)明書(shū)增 加了 0.1鍵,都在可選擇之中。d)下面是利用韓碼排序編撰字典例,突顯了刪除筆劃?rùn)z字的環(huán)節(jié),以百家姓中的 前24個(gè)姓在字典中所在頁(yè)碼,還在表中列出了相應(yīng)的形數(shù)碼、雙拼碼和4聲調(diào)的數(shù)字編碼, 其中包括簡(jiǎn)體字和正體字,突顯韓碼的綜合性能。證明用四筆50類部件組合的層次編碼 排序,非常的簡(jiǎn)明便捷。韓碼字典及雙拼數(shù)碼例字列表 注1、表中字典頁(yè)是指收字約一萬(wàn)多字韓碼字典試用本;形數(shù)是指權(quán)利要求3的3 部件碼加1結(jié)構(gòu)碼輸入法(表2);2、韓碼雙拼的字母代碼用的是韓碼鍵盤設(shè)定,和通用鍵盤的差別在于‘U e i’3個(gè) 字母和‘q h ζ’對(duì)調(diào)。3、韓碼音數(shù)碼用的是4聲調(diào)的數(shù)字設(shè)定,映射關(guān)系采用的是權(quán)利要求4中的表 4-4。
e)再用通用鍵盤映射的韓碼4聲調(diào)數(shù)碼輸入例如下親愛(ài)的爸爸媽媽,新年 好,……祝你們身qinl ai4 de ba4 ba4 ma ma, xin nian2 hao4,......zhu4 ni3 men4 shen1485 4748 4656 8847 8847 9644 9644 7585 8678 5958 3917 8974 9768 8565體健 康,壽 比 南山! 兒某。ti jian4 kang, shou4 bi3 nan2 shang3 ! er2 mou3。2574 6778 6554 8738 8874 8649 1954 4467 9735。其效果顯然是,只用4位數(shù)字,即擊鍵數(shù)只為4,比用字母的擊鍵數(shù)要少許多,還能 區(qū)分音調(diào),比字母拼音輸入要簡(jiǎn)明得多,定會(huì)給手機(jī)的漢字輸入應(yīng)用提供極大的方便,具有 美好的前景,加設(shè)‘0’簡(jiǎn)碼,效果會(huì)更好。
權(quán)利要求
一種漢字的形音數(shù)的綜合編碼方法和應(yīng)用,是一種用于漢字信息交換、信息處理的編碼方法,集形(GB18030)、音(GB2312)、數(shù)(GB2312)為一體的多種集合的綜合編碼、輸入方法。對(duì)GB2312形碼采用的是層次3碼的方案,對(duì)GB18030則增加了一個(gè)層次,采用了層次4碼的方法,編碼部件都以點(diǎn)、豎、橫、撇4筆分類,也叫漢字的四筆層次形碼(簡(jiǎn)稱四筆),再加上雙拼音碼和形、音的數(shù)字編碼、輸入等,統(tǒng)稱為漢字的形音數(shù)的綜合編碼方法(簡(jiǎn)稱韓碼)。韓碼四筆非常的簡(jiǎn)明,編碼部件和GF3001中的560個(gè)部件的大部分相同,新增、減少的部件很少,并歸納為約50類的部件組合,記憶量很少,可操作性極強(qiáng),非常簡(jiǎn)單易行,應(yīng)用非常的廣泛;例如可對(duì)GB18030的任何子集進(jìn)行編碼排序,應(yīng)用到字典就能替代部首檢字,刪除筆劃排序的檢字環(huán)節(jié),具有劃時(shí)代的意義;在鍵盤編碼輸入中,形碼常用漢字子集可用3碼長(zhǎng)的26個(gè)字母輸入和4碼長(zhǎng)的10個(gè)數(shù)字鍵輸入兩種,對(duì)通用漢字子集則常用層次4碼輸入漢字;韓碼拼音數(shù)字輸入是建立在字母鍵位映射數(shù)字關(guān)系上的數(shù)字輸入,以聲韻雙拼基礎(chǔ),所以適用于任何聲韻雙拼輸入,而且包括兩部分,1是拼音的直接輸入,2是漢字的拼音輸入;韓碼拼音輸入是以韻母鍵位順次設(shè)置為特征的輸入,韓碼拼音數(shù)字輸入是以韓碼的聲母韻母設(shè)置,再映射成4位數(shù)字的數(shù)碼輸入,兼有無(wú)聲調(diào)輸入、4聲調(diào)輸入的綜合數(shù)字輸入等,且輸入目的可以是漢語(yǔ)的拼音,也可以是漢字等。這就形成了一種綜合的編碼方法,輸入是其最主要的應(yīng)用,其特征在于1.1漢字形碼的編碼部件以起筆分點(diǎn)(捺)、豎、橫、撇四個(gè)人類,分別以通用鍵盤的26個(gè)英文字母為代碼,按5∶5∶9∶7的鍵盤自然順序從左到右、從上到下依次排列,據(jù)GB2312字符集的編碼排序統(tǒng)計(jì)表明,四筆依5∶5∶9∶7的比例分類配置恰到好處,四筆部件所用代碼使用的頻度幾乎和字母所占的比例相同,將編碼部件綜合概括成約50種組合,編碼部件和GF3001中的560個(gè)部件的大部分相同,新增、減少的部件很少,這樣的按鍵盤鍵位的自然順序依次設(shè)置,既簡(jiǎn)明又便于記憶、詳見(jiàn)表1和說(shuō)明書(shū)。1.2漢字的四筆層次形碼,是根據(jù)漢字的造字層次,逐層取根碼的編碼方法,特點(diǎn)是編碼部件可以是筆劃、部首、獨(dú)體字、也可以是多根字,具有明顯的變通特征和省略,層次性非常突出;目前的GB18030收字70244個(gè)漢字,包括中日韓三國(guó)使用的任何漢字,都可采用4碼長(zhǎng)的四筆層次編碼方法,具體的層次編碼方法是4部件以內(nèi)直取部件代碼,對(duì)多部件組成的即4部件以上的復(fù)雜漢字,取層次4碼,是先按層次找出兩個(gè)突出的偏旁部首代碼,然后再取剩余部分的首尾雙碼,且4碼的排序依照書(shū)寫(xiě)次序排次;如‘敏、繁’兩字,系4部件以內(nèi),取部件的編碼分別是zuz、zuzv;如‘蘩’字的編碼方法是,先逐層找出部首‘艸、糸’,再找出首尾部件‘ 攵’,這4個(gè)部件的代碼是‘h、v、z、z’,從部件代碼變成編碼是按字的部件的書(shū)寫(xiě)次序依次排列,編碼是‘hzzv’。層次編碼大致有如下五種類型,一是逐層分解類(即前例),二是并列兩字型,如 字的編碼取兩個(gè)字的首尾代碼‘tata’;三是3字并列型,如‘厵’字,取3個(gè)字的首部件代碼,再加末部件碼,其編碼是‘sssi’。四由4字組成類,如由4個(gè)‘原’組成的字的編碼則是‘ssss’,這里只把‘原’看成一個(gè)編碼部件,只取首部件(廠)的代碼,把以后的‘白’‘小’都視 為省略,再如‘西域哲人’例,編碼取4字的首部碼,編碼是‘a(chǎn)fkx’;五層次性不明顯的漢字編碼,相對(duì)要復(fù)雜些,如‘壽、 嘂、 ’等,編碼見(jiàn)說(shuō)明。在實(shí)際應(yīng)用中,對(duì)復(fù)雜漢字的編碼是按碼長(zhǎng)優(yōu)先、部件設(shè)定、對(duì)征入座、總體平衡、突出特征、成字優(yōu)先、交重拆2和簡(jiǎn)碼設(shè)定等8項(xiàng)基本規(guī)則編碼,詳見(jiàn)說(shuō)明書(shū)。漢字四筆層次編碼的應(yīng)用,最簡(jiǎn)單的也是最突出的用途就是按四筆編碼排序編撰字典,可根據(jù)各種需要編撰若干類子集,或用于電腦鍵盤的漢字輸入等,重碼少說(shuō)明四筆層次設(shè)計(jì)合理,都突顯了簡(jiǎn)單易學(xué),部件設(shè)置、分類層次分明,簡(jiǎn)潔明快的特點(diǎn)。字根代碼分類設(shè)置表(表1)注表中第6行為GF3001之560部件代碼,其中521號(hào) 的例字 的編碼是dbo,523號(hào)例字 的編碼是it,528號(hào)‘牽’的編碼是tvz,553號(hào)‘書(shū)’的編碼是jt。 部件是560部件外的舉例部件,是指橫下加撇捺,編碼字例‘壐’的編碼是syg(t),用此證明四筆部件和560個(gè)部件大部分相同,新增、減少部件不多,拆分方法不盡不同。F2009101499393C00011.tif,F2009101499393C00012.tif,F2009101499393C00021.tif,F2009101499393C00022.tif,F2009101499393C00023.tif,F2009101499393C00031.tif,F2009101499393C00032.tif,F2009101499393C00033.tif,F2009101499393C00034.tif,F2009101499393C00035.tif
2.根據(jù)權(quán)利要求1所述的漢字的形音數(shù)的綜合編碼方法利應(yīng)用,四筆層次形碼的鍵盤 輸入方法是以輸入漢字為目的的主要應(yīng)用之一,GB18030有七萬(wàn)多字,四筆層次形碼的實(shí)際 應(yīng)用例是最常用的就是以GB2312為主體的3碼長(zhǎng)的輸入子集,和以GBK為主體的兩萬(wàn)多字的4碼長(zhǎng)的輸入子集,所用編碼部件和GF3001中的560個(gè)部件大部分都相同;四筆層次形 碼輸入自96年問(wèn)世以來(lái),利用符號(hào)鍵的剩余資源,在十多年的輸入實(shí)踐中發(fā)揮著良好的效 果,其特征在于·2. 1漢字的四筆層次形碼的鍵盤輸入方法,是四筆編碼方法的具體應(yīng)用,最常用的是以 GB2312為主體的3碼長(zhǎng)的輸入子集,設(shè)定編碼最多取3個(gè),3部件(含3個(gè))以下字用部件 碼,3部件以上的取層次3碼,單根字、雙根字、包括3部件字或3部件以上的高頻字,可以用 空格鍵、或符號(hào)鍵作一級(jí)簡(jiǎn)碼或二級(jí)簡(jiǎn)碼輸入,如‘敏、繁、蘩’用3碼長(zhǎng)的輸入編碼分別是 ‘ZUZ、ZZV、hZV’,象‘的’ “不”的這類高頻字就是用編碼b、s加空格作簡(jiǎn)碼直接輸入等,其 符號(hào)鍵的利用和具體輸入例,祥見(jiàn)說(shuō)明書(shū)?!?. 2漢字的四筆層次形碼的鍵盤輸入方法,對(duì)GB18030為主的輸入子集,編碼最多取4 個(gè),單根字、雙根字,取根碼,用特定符號(hào)(11個(gè))作簡(jiǎn)碼輸入;3根字取3根碼,有重碼時(shí)可 加如表2所示的三點(diǎn)式九宮結(jié)構(gòu)碼符號(hào)直接輸入,這樣可減少重碼;編碼部件是4個(gè)的正 好取4碼,多于4個(gè)的取層次4碼;對(duì)高頻字可以不受部件多少的限制,可直接加空格作1、 2、3級(jí)簡(jiǎn)碼輸入。以‘母、每、敏、繁、蘩’為例,輸入編碼分別是u、zu、ZUZ, ZUZV, hzzv ;再 以‘原’、‘蟁’的編碼輸入為例,‘原’單獨(dú)輸入時(shí)用3個(gè)明顯的根部件‘廠’ ‘白’ ‘小’,即 ‘sbi’ 3碼加空格直接輸入,‘蟁’字先取3個(gè)首部件(廠)的代碼,再取末部件‘小’的編 碼,全碼是‘sssi’,也可用3點(diǎn)式九宮結(jié)構(gòu)碼(詳見(jiàn)表2) 'sss/'輸入;由4個(gè)‘原’組成的 字,是把‘原’看成一個(gè)編碼部件,把以后的白、小視為省略,輸入編碼是‘ssss’。九宮結(jié)構(gòu)碼分類表(表2) 注每格的上行為結(jié)構(gòu)特征,下行的數(shù)字為數(shù)字結(jié)構(gòu)代碼、標(biāo)點(diǎn)符號(hào)因鍵盤設(shè)計(jì)的差異 為暫定代碼,是按標(biāo)準(zhǔn)鍵盤排列的鍵位設(shè)置,本質(zhì)是9類結(jié)構(gòu)代碼,允許具體數(shù)字、符號(hào)有 變動(dòng)。在輸入中雙根結(jié)構(gòu)碼分4種,即左右(,.)、上下(;‘)、交包(/、)、粘聯(lián)即拆分的獨(dú)體字 ([])等8個(gè)符號(hào)表示,包括剩余的3個(gè)(- = J共11個(gè)符號(hào)鍵,Γ)設(shè)為符號(hào)的專用輸入 鍵,(")為中文數(shù)字專用,Γ、-、=)也作字根、兩級(jí)簡(jiǎn)碼鍵使用;單根時(shí)10個(gè)符號(hào)鍵作重碼 區(qū)別鍵和1級(jí)簡(jiǎn)碼鍵使用。
3.根據(jù)權(quán)利要求1所述的漢字的形音數(shù)的綜合編碼方法和應(yīng)用,四筆形碼的數(shù)字編碼 輸入是用3個(gè)部件數(shù)字碼加1個(gè)九宮數(shù)字結(jié)構(gòu)碼輸入漢字,是用于涵蓋GB2312字符集為主 體的一種數(shù)字編碼輸入方法,主要適用于通訊手機(jī)的漢字輸入、也可用于電腦數(shù)字鍵盤的 輸入,其特征在于四筆編碼部件以點(diǎn)2、橫3、撇2、豎2的比例,設(shè)定在1 9的9個(gè)數(shù)字鍵上。不管漢字 的筆劃多少,都取3個(gè)部件編碼,獨(dú)體字中單筆重1筆,兩筆以上取總根碼、加拆2雙(或首 尾筆劃,或兩部件)碼(如人、凸、凹、垂、重等);雙根字取偏旁部首碼,和非偏旁部首部件 的拆2雙碼;3根字取3根碼、多根字取層次3根碼。在四筆形數(shù)碼的輸入中,部件編碼只 取3個(gè),再加一個(gè)同權(quán)利要求2(1)表2中的數(shù)字鍵所示的3點(diǎn)式結(jié)構(gòu)碼,碼長(zhǎng)為4,其中獨(dú) 體字的結(jié)構(gòu)碼為1,雙根字的結(jié)構(gòu)碼為2,‘0’數(shù)字鍵作中斷、簡(jiǎn)碼鍵使用,即加0作1、2、3級(jí)簡(jiǎn)碼輸入,不受部件多少的約束,部件數(shù)碼設(shè)定(可調(diào)整)如下 形數(shù)碼歸類表(表3)
4.根據(jù)權(quán)利要求1所述的漢字的形音數(shù)的綜合編碼方法和應(yīng)用,將字母或鍵位映射成 81(78)個(gè)1-9的兩個(gè)數(shù)字的方法,可以作信息的轉(zhuǎn)換、傳輸、漢語(yǔ)拼音的輸入、漢字的數(shù)碼 輸入等廣泛地應(yīng)用,特別是手機(jī)的漢字的拼音輸入功能,效果特佳,克服了手機(jī)漢字輸入難 的瓶頸難題,其特征在于以電腦鍵盤的26個(gè)字母鍵位,再加一個(gè)虛擬鍵位,共27個(gè),正好以1 9的數(shù)字排列 作字母鍵位代碼,字母鍵位碼長(zhǎng)為2,共81種,其中26個(gè)可作為字母映射數(shù)字信息的轉(zhuǎn)換代 碼,作轉(zhuǎn)換傳輸信息用,或作拼音的無(wú)聲調(diào)數(shù)碼輸入、雙拼輸入用;54個(gè)或81個(gè)都可用于作 信息的傳輸用的字符轉(zhuǎn)換,特別是以52個(gè)字母鍵位映射數(shù)字,作為漢語(yǔ)拼音的4聲調(diào)數(shù)字 編碼輸入,效果極佳;由此可見(jiàn),用78或81個(gè)的字母鍵位映射數(shù)字可以同時(shí)作無(wú)聲調(diào)輸入 和4聲調(diào)輸入漢語(yǔ)拼音輸入或漢字的輸入,而且它們有各自的編碼空間,互不干擾,無(wú)需切 換便可任意變通輸入,同時(shí)可以令數(shù)字‘0’鍵作中斷鍵使用。在雙拼輸入中是用26個(gè)字母 設(shè)定,設(shè)有虛擬聲母,那就直接導(dǎo)用字母鍵位映射數(shù)碼輸入,在27個(gè)鍵位映射條件下,韻母 直接輸入還可以后虛擬代碼的方式輸入,即將新增的虛鍵作為韻母的后虛擬直接輸入漢字寸。鍵位行無(wú)聲調(diào)拼音數(shù)碼設(shè)定表(表4-1) 映射數(shù)碼作無(wú)聲調(diào)輸入和4聲調(diào)輸入時(shí),具體的設(shè)置數(shù)字映射方法根據(jù)九九行列排列,大體上有行、列、錯(cuò)3種設(shè)置,以行設(shè)置最為簡(jiǎn)明易懂,塊設(shè)置在拼音輸入中最為實(shí)用。 鍵位行4聲調(diào)拼音數(shù)碼設(shè)定表(表4-2) 鍵位組塊第一組無(wú)聲調(diào)數(shù)碼設(shè)定表(表4-3) 注上表分9個(gè)小組,擬作無(wú)聲調(diào)輸入,上行是組號(hào)數(shù)碼和所屬組內(nèi)字母,下行是鍵位 字母和相應(yīng)的位碼。鍵位組塊第二、第三組4聲調(diào)數(shù)碼設(shè)定表(表4-4) 注上表大格中行是組碼,小格是字母的位次碼,上行為2進(jìn)制的‘1’的位碼,下行為 ‘2’的位碼,兩者組合形成4個(gè)數(shù)碼,用作4聲調(diào)拼音、4聲調(diào)漢字輸入。輕聲可用表6-1的 456、789,表6-2的123等實(shí)施輸入。上表4-3表4-4是組塊設(shè)置(包括斜角轉(zhuǎn)換設(shè)置)例表,特點(diǎn)是在拼音數(shù)字輸入中,明 顯地隱含著大組特征,具有區(qū)分無(wú)聲調(diào)輸入、4聲調(diào)輸入和何聲調(diào)輸入的特點(diǎn),以標(biāo)準(zhǔn)鍵盤 中的27個(gè)鍵位分成9組,3個(gè)字母為1小組,分別用1 9個(gè)數(shù)字代表,小組內(nèi)的代碼不外 是123、456、789 ;或者是147、258、369這兩種分類組合,實(shí)際上它們是基本等價(jià)的,都是9 個(gè)數(shù)字中的3個(gè),分配給3個(gè)鍵位作代碼。表4-3可用作無(wú)聲調(diào)拼音輸入,其后數(shù)字特征 是1、2、3個(gè)數(shù)字中的一個(gè),表4-4是兩組27個(gè)數(shù)字,采用2進(jìn)制作雙拼4聲輸入,形成4位 數(shù)碼的4種組合,方法是11、12、21、22分別對(duì)應(yīng)一、二、三、四、四個(gè)聲調(diào)的數(shù)字編碼,其中1 對(duì)應(yīng)4、5、6,2對(duì)應(yīng)7、8、9,四聲輸入的數(shù)字編碼,按這樣的組合,其后一個(gè)數(shù)字不外是4、5、6 或7、8、9中的一個(gè),顯然兩者互不干擾,異常的簡(jiǎn)明,兩者合并起來(lái)便能同時(shí)得到兩類拼音 的綜合輸入,對(duì)26鍵映射同樣適用,同時(shí)可以用‘0’數(shù)字鍵作中斷鍵使用。
5.根據(jù)權(quán)利要求1所述的漢字的形音數(shù)的綜合編碼方法和應(yīng)用,韓碼的拼音輸入是以 聲韻雙拼為基礎(chǔ)的輸入方法,和形碼輸入有互補(bǔ)的作用,其特征在于韓碼的雙拼輸入是以26個(gè)英文字母為代碼的輸入方法,設(shè)定聲母ch = ν, zh = ο, sh =6,虛擬聲母=3鍵,其它聲母從原鍵;韻母設(shè)定是將10、6、1、11(11)這5個(gè)韻母系列,劃 定5個(gè)區(qū)域順次設(shè)定,如表5所示,表中的26格代表鍵盤的26個(gè)字母鍵位,其特點(diǎn)是用通 用鍵盤的第一行設(shè)定u ο系列,第二行設(shè)定a e系列,第三行設(shè)定為i系列,并按字母的自 然順序排列,這樣的聲母、韻母的鍵位設(shè)定非常容易記憶,是一種簡(jiǎn)明快捷的拼音輸入或用 漢字的拼音輸入方法。根據(jù)韓碼拼音輸入的鍵盤設(shè)定,作u — q — u,e — h — e,i — z — i互換,韓碼鍵盤也 就順理成章地誕生了,新的鍵盤字母排序是上行u w h r t y q ζ ο p,中行a s d f g e j k 1,下行i xcvbn m其突出的優(yōu)點(diǎn)是適合漢字或漢語(yǔ)拼音的輸入,是屬于華人的鍵 盤,尤其是將字母鍵位變換成數(shù)字輸入狀態(tài)時(shí),淡化了字母的特質(zhì),強(qiáng)化了拼音韻母的有規(guī) 則的排列,從而使手機(jī)的漢字?jǐn)?shù)字雙拼輸入變得非常的簡(jiǎn)明快捷,特別是用鍵盤難以實(shí)現(xiàn) 的4聲調(diào)的拼音輸入,變得十分簡(jiǎn)單易行,為后續(xù)數(shù)字雙拼輸入奠定了良好基礎(chǔ)。 韓碼鍵盤雙拼鍵位設(shè)定A表(表5) 注韻母帶*表示有無(wú)聲母發(fā)音字,CH等表示聲母,在雙拼輸入中@作虛擬聲母用,在 數(shù)字輸入中或用后虛擬鍵直接輸入。在韓碼鍵盤中3對(duì)字母厘、迎、作鍵位互換。韓碼雙拼利用符號(hào)鍵可作變通設(shè)定翻頁(yè)功能,即在拼音進(jìn)入輸入狀態(tài)后,即擊過(guò)首鍵 (聲母或韻母)后,會(huì)彈出窗口,提示常用字的的輸入;擊過(guò)第二鍵(即聲母后續(xù)韻母鍵)即 完成雙拼后,或繼續(xù)輸入雙拼數(shù)字作詞條的輸入,或利用彈出的所輸音節(jié)的漢字提示窗口,直接選中字的輸入;提示窗口有15個(gè)分類漢字提示輸入鍵(5類音標(biāo),每類3個(gè)),還有5個(gè) 翻頁(yè)鍵,分別是4聲調(diào)和無(wú)聲調(diào)5類輸入,選中便進(jìn)行分類翻頁(yè),翻頁(yè)后便能同時(shí)提示20 (10 個(gè)符號(hào)和10個(gè)數(shù)字)個(gè)選擇,這樣就減少了層次,輸入更為快捷。
6.根據(jù)權(quán)利要求1所述的漢字的形音數(shù)的綜合編碼方法和應(yīng)用,和權(quán)利要求4所述 的字母鍵位映射數(shù)碼設(shè)定,以及拼音的聲母、韻母的設(shè)定,就可以作漢語(yǔ)拼音數(shù)碼輸入或漢 字的拼音數(shù)碼輸入,其中聲母、韻母設(shè)定可以用權(quán)利要求5的韓碼雙拼設(shè)定,也可以作其它 的任意的聲韻設(shè)定,都可以作拼音的無(wú)聲調(diào)的輸入、4聲調(diào)的輸入,和兩者的綜合數(shù)碼輸入 等,這是韓碼的又一典型應(yīng)用之一,其特征在于6. 1韓碼的漢語(yǔ)拼音數(shù)字輸入和漢字的拼音數(shù)字輸入,是在權(quán)利要求4的字母鍵位映 射數(shù)字基礎(chǔ)上的輸入方法,以表4-3、表4-4映射關(guān)系為例,采用權(quán)利要求5的韓碼雙拼的 用26個(gè)鍵位的映射,即權(quán)利要求5的聲母、韻母(表5)設(shè)定,顯然,此時(shí)的映射只涉及26 個(gè)字母鍵位,共78個(gè)映射數(shù)字,再依據(jù)這些數(shù)字編碼,輸入漢語(yǔ)拼音或漢字,現(xiàn)以輸入拼音 "chuang"和漢字“創(chuàng)”為例,加以方法的闡明。首先作拼音“chimng”的無(wú)聲調(diào)輸入,根據(jù)權(quán)利要求5的表5的聲韻雙拼設(shè)定,將 chuang 拆分成 ‘ch, ‘uang,,其中 ch — ν, uang — m,艮口 chuang — vm ;按權(quán)禾[I要求 4 的表 4-3的映射關(guān)系,ν — 81、m — 91,雙拼的字符編碼映射成數(shù)字編碼就是8191,在軟件的支持 下,鍵入8191,便可輸入一chuang或漢字‘創(chuàng)’。作拼音“chutog”的4聲調(diào)的輸入,所涉鍵位相同,有ch — ν, uang — m, chuang — vm ; 由于是4聲調(diào)的第4聲的拼音、漢字輸入,所以要依據(jù)表4-4的映射關(guān)系表,第4聲屬22設(shè) 定,便得出ch — ν \ 87,uang — m \ 97,vz — 8797 ;在軟件的支持下,鍵入8797,便可輸 入一chuang,或輸入漢字‘創(chuàng),。6. 2韓碼的漢語(yǔ)拼音數(shù)字輸入和漢字的拼音數(shù)字輸入,在27個(gè)鍵位映射條件下,編碼 空間有了擴(kuò)大,選擇的余地增加了,表6和表5的不同正在于此,表6的變化體現(xiàn)在將‘ iao’ 單列,其后韻母順延,即‘uang’移到了虛擬鍵位,下面仍以輸入拼音“chutog”和漢字“創(chuàng)” 為例,用表4-3、表4-4的字母鍵位映射數(shù)字,舉例說(shuō)明漢語(yǔ)拼音或漢字的數(shù)字輸入方法。首先對(duì)拼音“chuang”作無(wú)聲調(diào)輸入,將chuang拆分成‘ch’ ‘uang’,根據(jù)表6聲韻 雙拼設(shè)定,其中ch — ν, uang —虛,即chuang — ν虛;按權(quán)利要求4的表4_3的映射關(guān)系, ν —81、虛一92,雙拼的字符編碼映射成數(shù)字的編碼是8192,在軟件的支持下,鍵入8192,便 可輸入一chuang,或輸入漢字‘創(chuàng)’。作拼音“chutog”的4聲調(diào)的輸入,同樣根據(jù)表6的聲韻雙拼設(shè)定,字母鍵位代碼和緊 前相同,有ch — ν,uang —虛,chuang — ν虛;由于是4聲調(diào)的第4聲的拼音、漢字輸入,所 以映射關(guān)系要依據(jù)表4-4進(jìn)行,即第4聲屬22設(shè)定(參見(jiàn)第7頁(yè)第2行),便得出ch — ν \ 87,uang —虛 \ 98,ν 虛一8798 ;在軟件的支持下,鍵入8798,便可輸入一chutog,或輸入漢字‘創(chuàng),。 從上述的漢語(yǔ)拼音“chutog”及漢字‘創(chuàng)’的拼音數(shù)碼輸入證明,利用權(quán)利要求4的映 射關(guān)系可以作26鍵(可以是通用鍵盤,也可以如表5所示的特定鍵盤等)雙拼的無(wú)聲調(diào)、4 聲調(diào)的輸入,也可以適用27鍵(表6)雙拼的無(wú)聲調(diào)、4聲調(diào)的輸入,同時(shí)還證明權(quán)利要求4 的映射是關(guān)鍵,應(yīng)用變化萬(wàn)千,是非常廣泛的,韓碼拼音及鍵盤就是映射應(yīng)用的最好范例。 韓碼鍵盤雙拼鍵位設(shè)定B表(表6)
全文摘要
本發(fā)明是漢字的綜合編碼方法和應(yīng)用,形碼以四筆約50類部件分組,用26個(gè)字母4碼長(zhǎng)對(duì)70244個(gè)漢字進(jìn)行了層次編碼,排序發(fā)現(xiàn)編碼勻稱重碼相對(duì)很少,特別適合字典的編撰和鍵盤編碼輸入,能對(duì)任意漢字集字典進(jìn)行層次編碼排序,檢字十分快捷;或作漢字鍵盤輸入,給漢字書(shū)寫(xiě)應(yīng)用出版提供了極大方便。對(duì)GB2312為主的常用子集只需3碼輸入,雙拼2碼輸入,或用4數(shù)字作形數(shù)、音數(shù)碼輸入等;利用符號(hào)、數(shù)字作九宮結(jié)構(gòu)碼使用,或作簡(jiǎn)碼直輸;在形數(shù)碼輸入中用5鍵就能輸入一個(gè)漢字。本法用字鍵映射數(shù)字的設(shè)定為雙拼打開(kāi)了音數(shù)碼輸入,特別是4聲調(diào)音數(shù)碼輸入的大門;韓碼拼音及鍵盤為漢語(yǔ)拼音、漢字音數(shù)碼,特別是4聲調(diào)的輸入就是映射應(yīng)用的最好范例。
文檔編號(hào)G06F3/023GK101930292SQ200910149939
公開(kāi)日2010年12月29日 申請(qǐng)日期2009年6月18日 優(yōu)先權(quán)日2009年6月18日
發(fā)明者韓恒瑞, 韓正揚(yáng), 韓正躍 申請(qǐng)人:徐州捷諾軟件科技有限公司;韓正揚(yáng)