欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

漢字簡(jiǎn)易編碼輸入法的制作方法

文檔序號(hào):6599370閱讀:622來(lái)源:國(guó)知局
專利名稱:漢字簡(jiǎn)易編碼輸入法的制作方法
漢字簡(jiǎn)易編碼輸入法隸屬于漢字終端處理技術(shù)領(lǐng)域。目前,編碼輸入漢字尚是信息處理和漢字終端技術(shù)的重要構(gòu)成部分,但當(dāng)今的各編碼方案多有這樣那樣的不足,離最優(yōu)化,標(biāo)準(zhǔn)化尚有距離,不能解決“容易學(xué)的輸入慢,輸入快的不容易學(xué)”這一問(wèn)題,關(guān)鍵還在于上述編碼沒(méi)有抓住漢字音形義方面的本質(zhì)特征,筆者認(rèn)為其特征是每個(gè)漢字是由若干漢字單元構(gòu)成的,即組成漢字的每一部分也是漢字!而部件及基本筆畫則是漢字的一種特殊形式,鑒于此,筆者在現(xiàn)有技術(shù)水平上,采納其他方案的成功之處,充分利用漢字音形義方面的特殊性設(shè)計(jì)了如下方案,希望能促使?jié)h字輸入技術(shù)向更普及,更高效的方面發(fā)展。
方案如下文[2.1]基本原則[2.1.1]漢字漢語(yǔ)拼音雙拼形式的聲碼與其韻碼及義碼的組合為基本編碼形式,即聲碼+韻碼+義碼。(參見(jiàn)表1)[2.1.2]義碼指漢字常見(jiàn)偏旁部首或書寫序中盡可能不與字韻母相同的第一成字部件的聲母代碼或字第一基本筆劃的聲母代碼之一。
說(shuō)明(1)“聲碼+韻碼+義碼”碼元為A~Z26個(gè)拉丁字母碼位為三位,因此,碼組合可能(20~26)3大于GB2312-80共收6763字?jǐn)?shù),具備構(gòu)碼的必要條件;另外,每音節(jié)含有的常用字量,大致是均勻的,義碼的標(biāo)記分布大致也是均勻的,(也存在特殊性,如“i”韻部),因此,GB2312-80,特別是其一級(jí)字庫(kù)3755個(gè)漢字,基本能被一一對(duì)應(yīng)到碼映射上,故用上述263形式來(lái)給漢字編碼是可能的,其它編碼或許也能做到這一點(diǎn),但多不能解決前述“容易學(xué)的輸入慢,輸入快的不容易學(xué)”這一問(wèn)題,而本編碼可以較容易的解決這一難題。
說(shuō)明對(duì)[2.1.2].義碼見(jiàn)表(1),其中,成字部件是指其本身是漢字者,但這里指經(jīng)(或不經(jīng))過(guò)變形的充當(dāng)所組成字的一部分的字形,包括部分獨(dú),合體字,基本筆劃?rùn)M豎撇點(diǎn)折以及上述常用偏旁部首,后者因?yàn)槭褂美垲l較高,因此單獨(dú)列出,此定義是筆者首創(chuàng)。具體編碼規(guī)則,見(jiàn)表(2),表(1)為具體編碼的預(yù)備資料[2.2.1]對(duì)表(1)說(shuō)明。表中A~Z26個(gè)拉丁字母表示需輸入所在行信息時(shí)必須鍵入的相應(yīng)鍵位即碼元。聲母-聲,義碼列中,鍵A,E,I,U分別用來(lái)表示韻母為I(或U)時(shí)字聲調(diào)的陰平,陽(yáng)平,上聲和去聲,上述U韻部指fu,gu,ku,hu等音節(jié);i韻部指所有以i為韻母的音節(jié),此為減少重碼的有效方法之一,鍵O用來(lái)表示零聲母,鍵v定義為學(xué)習(xí)鍵,鍵c用來(lái)表示聲母c和ch,鍵z,s功能同,其余聲母與同名鍵相對(duì)應(yīng)。韻母-韻碼列中,韻母用同名鍵或其他非元音字母鍵代替;但如韻母en,eng用同一鍵G表示,此為一碼雙韻法,下同,筆者有意識(shí)的將數(shù)組讀音相近的兩韻母歸納在同一碼上實(shí)踐證明,此法更有利于漢字的快速輸入。常用偏旁部首列中,一般常用部首用聲母同名鍵表示,如钅→金字旁→丁。扌、艸、氵、木。等因其組成字多,分別用元音鍵A,E,I,U等表示,基本筆畫橫、豎、撇、點(diǎn)、折分別用同名鍵H、S、P、D、Z表示。下文對(duì)表(2)說(shuō)明,先說(shuō)明字輸入形式。一般形式,同[2.1.1]為字輸入的基本式,而其他則為其在特殊情況時(shí)的具體應(yīng)用。零聲母,用韻母鍵O表示零聲碼,其他同[2.2.2.1],[2.2.2.3]I,U韻部,參見(jiàn)[2.2.1.2],后續(xù)字聲碼及義碼。
上述字輸入方式出現(xiàn)重碼時(shí)處理情況參見(jiàn)[2.3]。高頻字,指使用累頻相對(duì)較高的二十余個(gè)最常用字(詞),累頻達(dá)10%左右,打一鍵加空格即可輸入(內(nèi)容見(jiàn)表(1))[2.2.2.5]最常用字(約400字),設(shè)計(jì)每個(gè)音節(jié)中使用累頻相對(duì)最高的單字(詞)為音節(jié)字,即最常用字,不包括高頻字形式,打聲韻兩碼加空格即可輸入,與高頻字一樣,不含重碼,設(shè)計(jì)此類字亦可用[2.2.2.1]節(jié)聲韻義碼一般形式輸入,但出現(xiàn)重碼時(shí),系統(tǒng)會(huì)采用靜態(tài)先見(jiàn)技術(shù)自動(dòng)優(yōu)先輸入,使用累頻達(dá)60~70%。不認(rèn)識(shí)的字,這是一個(gè)模糊區(qū)域,因各操作者的文化層次不同而有不同的內(nèi)容,其輸入方法是V+聲1+聲2+聲末(或韻2),然后根據(jù)重碼選擇,實(shí)際上,此類字以GB2312-80二級(jí)字為主,出現(xiàn)累頻<1%,此形式也適用于繁體字的輸入,聲1、聲2等分別為組成字的成字部件的聲碼(或韻碼)。
本編碼根據(jù)漢字本身的特征采用字詞混合輸入方式,采用等長(zhǎng)四碼,不足時(shí)采用空格補(bǔ)足或示終,以下為詞語(yǔ)輸入可能形式。二字詞,前述任何形式之一加第二字聲碼加空格鍵,使用累頻約達(dá)40%。三字詞,見(jiàn)表(2)。多字詞,主要指四字及以上詞,如成語(yǔ)、詩(shī)句等,見(jiàn)表(2)。重碼處理技術(shù)。筆者分析發(fā)現(xiàn)“I”韻部,部分“U”韻部之音節(jié)內(nèi)含同音字?jǐn)?shù)量相對(duì)較多,如果按照前述“聲碼+韻碼+義碼”法來(lái)編碼,重碼率肯定高于其他音節(jié),根據(jù)這種特殊性,筆者設(shè)計(jì)在不增加碼位情況下,增加聲調(diào)識(shí)別信號(hào),使每音節(jié)區(qū)別力達(dá)26×4>100之多,方法參表(2)規(guī)定A,E,I,U四元音字在編碼組合首位時(shí),分別表示“I”韻部分音節(jié)“FU”,“GU”,“KU”,“HU”等的聲調(diào)陰平、陽(yáng)平、上聲和去聲,而此時(shí)韻母“I”,“U”不再以韻碼形式表現(xiàn)出來(lái),這樣,由于解決了矛盾的特殊性,便整個(gè)編碼的重碼率大為降低。采用上述技術(shù)后,對(duì)GB2312-80一級(jí)漢字,在每音節(jié)組合中,仍平均有2~3對(duì)重碼,以聲韻義三碼不能充分給出區(qū)別,必須增加識(shí)別碼,筆者考慮,可用二字詞的第二字聲碼來(lái)作為第一字的重碼時(shí)的識(shí)別碼,主要因?yàn)?,語(yǔ)言是以詞語(yǔ)為記錄載體的,我們漢語(yǔ)則尤以二字詞為主;很有可能,我們要輸入的恰是以其字所構(gòu)成的一條詞語(yǔ),因此,如果正需輸入該詞,打一下,“間隔”即可,否則,繼續(xù)輸入下一字代碼,則該重碼字也可被選擇與輸入了,記錄時(shí),可用個(gè)別代碼(如第四碼)的大小寫形式來(lái)區(qū)別詞語(yǔ)或重碼字。其他,可采用靜態(tài)高頻字先見(jiàn)技術(shù),重碼時(shí),令累頻高者置于優(yōu)先輸入地位,若不給予反對(duì)或不追加信息,則系統(tǒng)可自然輸入該字,或可采用聲音信號(hào)或屏幕提示信號(hào)打入選擇序或字后續(xù)信息來(lái)輸入漢字,重碼狀態(tài)時(shí),系統(tǒng)不會(huì)誤會(huì)輸入信息而出錯(cuò),詞語(yǔ)出現(xiàn)重碼可能要少得多,重碼時(shí)還可按上述處理。容錯(cuò)處理技術(shù).
在方言語(yǔ)系,往往把某些聲(韻)母間相混淆,因此,本編碼在安排聲母、韻母代碼時(shí),作了容錯(cuò)處理,把分辨力不強(qiáng)的聲(韻)母音素在不增加重碼的前提下安排到同一鍵位上,這樣,編碼對(duì)人的語(yǔ)音要求變得模糊而簡(jiǎn)單了,但輸入速度反而得以提高,(見(jiàn)表(1))。鍵盤鑒于國(guó)際標(biāo)準(zhǔn)化和便于推廣普及的原則,本編碼擬采用標(biāo)準(zhǔn)鍵盤,當(dāng)然,其他鍵盤上也可應(yīng)用?!皾h字簡(jiǎn)易碼”的技術(shù)特點(diǎn)。對(duì)GB2312-80而言,在標(biāo)準(zhǔn)鍵盤上本編碼是能夠?qū)崿F(xiàn)的最短編碼之一,平均動(dòng)態(tài)碼長(zhǎng)為1.8~2.0鍵每字,含(間隔鍵),并且,兼具有見(jiàn)字知碼和見(jiàn)碼識(shí)字的特點(diǎn),[2.6.2]創(chuàng)造性的設(shè)計(jì)了義碼,利用它來(lái)給漢字或其詞語(yǔ)編碼,義碼與其他以部首作形識(shí)別碼者之區(qū)別所在,也是本編碼成功原因之一。編碼本身與字詞有本質(zhì)聯(lián)系,屬有理碼,沒(méi)有眾多煩難而不標(biāo)準(zhǔn)的規(guī)則,不涉及所謂“字根”的拆分,沒(méi)有“Z-ZH”、“in-ing”等分辨力不強(qiáng)的音素之間的區(qū)分,而可以容錯(cuò)輸入,對(duì)方言語(yǔ)系或低水平者輸入漢字尤顯便利,標(biāo)準(zhǔn)而又模糊,既效率高而又適于推廣普及,這是一般編碼所無(wú)法比擬的。與漢語(yǔ)言文字拼音化方面一致,編碼本身即不失為一種優(yōu)秀的拼音文字,并且,因大多數(shù)繁體漢字與簡(jiǎn)化字的“簡(jiǎn)易碼”是相同的,這也為文字拼音化方向和書同文方向奠定了基礎(chǔ)。將簡(jiǎn)易碼按拉丁字母順序排列,可廣泛用于文字排序,圖書情報(bào)檢索,檔案管理,信息傳輸?shù)阮I(lǐng)域,可用來(lái)編制“簡(jiǎn)易碼漢字查字表”,可以象西文一樣直接翻閱查字,比部首查字法等要簡(jiǎn)捷的多。
附參考資料,(1).現(xiàn)代漢語(yǔ) 甘肅人民出版社 黃伯榮等(2).漢字終端技術(shù)入門 人民郵電出版社 周關(guān)興(3).漢字信息處理系統(tǒng) 東南大學(xué)出版社 曾慶輝(4).中文信息 90~92.
(5).GB2312-80.
(6).語(yǔ)言文字規(guī)范手冊(cè) 語(yǔ)言出版社編


權(quán)利要求
一種漢字編碼輸入法,以“雙拼”為基礎(chǔ)構(gòu)成,其技術(shù)特征是“義碼”規(guī)律、及其編碼基本形式,聲碼+韻碼+義碼。(表1、表2)。
全文摘要
漢字簡(jiǎn)易編碼輸入法隸屬于漢字終端處理技術(shù)領(lǐng)域,當(dāng)今的各類編碼有這樣或那樣的不足,尚未真正解決“容易學(xué)的輸入慢,輸入快的不容易學(xué)”的問(wèn)題,關(guān)鍵還在于沒(méi)有抓住漢字音形義的本質(zhì)特征,鑒于此,筆者通過(guò)“義碼”的設(shè)立使得對(duì)GB2312-80在拼音形式下用三碼進(jìn)行標(biāo)記成為可能,(2文檔編號(hào)G06F3/023GK1099493SQ9310443
公開日1995年3月1日 申請(qǐng)日期1993年4月13日 優(yōu)先權(quán)日1993年4月13日
發(fā)明者嚴(yán)文魁 申請(qǐng)人:嚴(yán)文魁
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
丹巴县| 广南县| 长岭县| 玉龙| 仁化县| 仁化县| 酒泉市| 南澳县| 渭南市| 武清区| 三河市| 利辛县| 双桥区| 海南省| 青海省| 永福县| 平和县| 阜新市| 鲜城| 阿克陶县| 博兴县| 江城| 江都市| 杭锦后旗| 自贡市| 延寿县| 鹤壁市| 梅州市| 平塘县| 铁力市| 柯坪县| 临夏市| 留坝县| 鹿泉市| 措美县| 仙游县| 安陆市| 波密县| 南雄市| 通许县| 河北省|