欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

計(jì)算機(jī)漢字詞字二分拼形輸入方案的制作方法

文檔序號(hào):89202閱讀:773來源:國知局
專利名稱:計(jì)算機(jī)漢字詞字二分拼形輸入方案的制作方法
本發(fā)明是一種用于計(jì)算機(jī)信息處理的漢字編碼輸入方法。
國內(nèi)外現(xiàn)有漢字編碼方案500多種,可分為流水碼,拼音碼、拼形碼、音形結(jié)合碼四大類型。
流水碼有四位數(shù)字電碼(即中華人民共和國郵電部編《標(biāo)準(zhǔn)電碼本》)、三位英文字母電碼和其他各種專用電碼。流水碼都是任性規(guī)定的,代碼與漢字的屬性沒有內(nèi)在的聯(lián)系,必須死記硬背,操作者必須經(jīng)過長期的職業(yè)訓(xùn)練,不適應(yīng)電子計(jì)算機(jī)的推廣和普及。
我國1958年2月11日正式公布的《漢語拼音方案》,加上適當(dāng)?shù)耐糇謪^(qū)別手段,可用作計(jì)算機(jī)漢字輸入方案。比如南開大學(xué)李約瑟設(shè)計(jì)的《漢語普通話新文字電腦Ⅱ型》、英國“大文豪第二型中英文處理系統(tǒng)”(SCHOLAR Ⅱ Chinese/English Text Processor)就是采用《漢語拼音方案》加上聯(lián)詞、定調(diào)、同音字選擇鍵等手段來輸入漢字的。這種編碼輸入法,受過良好漢語拼音教育的人都能操作,但輸入效率低,有時(shí)光輸入一個(gè)音節(jié)要擊6鍵,加上調(diào)號(hào)和同音字選擇等,多達(dá)七、八鍵才能輸入一個(gè)漢字。
為了克服音素制的《漢語拼音方案》輸入效率低的缺點(diǎn),扶良文創(chuàng)造了《雙拼對(duì)字方案》,只用26個(gè)單字母既表示了21個(gè)聲母,又表示了36個(gè)韻母,加上“聲調(diào)×起筆”的對(duì)字字母,其簡約式最多只用3個(gè)字母就能表示一個(gè)漢字。但是懂得漢語拼音的人也得從頭學(xué)起,一個(gè)字母表示2~3個(gè)音值不如原拼音方案好記;同時(shí)重碼字太多,必須附加別的手段才能在機(jī)器上實(shí)現(xiàn)。畢業(yè)于華南工學(xué)院的林才松等設(shè)計(jì)的FMB漢字詞處理系統(tǒng),是一個(gè)《漢語拼音方案》雙打輸入方式,輸入一個(gè)單字最多只要4碼,而且輸入一個(gè)詞匯碼能夠輸出詞的一串漢字,既不要重新學(xué)習(xí)一套拼音字母,又能大幅度提高效率。但是操作者得掌握一套以單詞為基元的拼音編碼規(guī)則,同時(shí)還要記住數(shù)以萬計(jì)的單詞中那些是最常用詞、常用詞、次常用詞、罕用詞、同音詞等等。
拼形碼又可分為筆形碼和字根碼兩類。北京師范大學(xué)李金
的《漢字筆形編碼法》和澳大利亞墨爾本大學(xué)教授蘆遂現(xiàn)博士的“基本筆畫編碼法”用為數(shù)不多的筆畫和筆畫組合作碼元,易于學(xué)習(xí),但輸入效率低,前者一字最多要擊8鍵,后者一字多達(dá)12鍵。
美國王安實(shí)驗(yàn)室采用的、由胡立人等研制的“三角編碼”,以300個(gè)字根(包括筆畫)作碼元,分成99組,每組用一個(gè)二位十進(jìn)數(shù)表示,取碼按“Z”字形路線從漢字的左上角取到右下角,每字皆取三個(gè)角號(hào)(即6位數(shù)字),不足者補(bǔ)“0”。用國際標(biāo)準(zhǔn)鍵盤為6位等長碼;若另做中鍵盤,碼長可壓縮到3位。漢字的拓?fù)浣Y(jié)構(gòu)很復(fù)雜,不能生硬搬用“四角”的概念來描述。有人統(tǒng)計(jì)該方案的碼元分布位置只有30%勉強(qiáng)符合角號(hào)的含義,其他情況只好用反常規(guī)則編碼,(周逸奇等《淺評(píng)王安編碼》中國中文信息研究會(huì)成立大會(huì)論文1981.6)。
臺(tái)灣朱幫復(fù)的“倉頡中文字母”編碼法,選取24個(gè)高頻字根為主字母,分別用24個(gè)英文字母表示,每個(gè)主字母包含1~6個(gè)輔字母或變形字母。取碼按寫字的次序,由外到里,由上到下,由左到右。碼長2~5位(包括間隔符)。
河南省南陽地區(qū)科委王永民的“五筆字形漢字編碼方案”,把漢字的五種基本筆形和4種拓?fù)鋱D形各賦予一個(gè)數(shù)字代號(hào)
一 1
1丨 2
2丿 3
3
4
4乙 5并通過字根實(shí)用頻率統(tǒng)計(jì),選取了165個(gè)基本字根和70來個(gè)副字根作碼元,分成25組,每組用一個(gè)兩位數(shù)字作代號(hào);另設(shè)識(shí)別碼20個(gè),由漢字末筆的5種筆形代號(hào)與4種拓?fù)鋱D代號(hào)交叉構(gòu)成。按字根在漢字中的出現(xiàn)位次一一首次次尾取碼,一字最多4碼,不足4碼者追加一識(shí)別碼。為了提高輸入速度和降低重碼,另設(shè)626個(gè)簡碼和2100個(gè)詞匯碼。
上海儀器儀表研究所總工程師支秉彝的“見字識(shí)碼”方案和郵電部數(shù)據(jù)通訊研究所郭淑珍的“聲韻部形編碼方案”,是比較典型的音形結(jié)合碼。前者以字根為單元取碼,而字根的代碼則是這個(gè)字根(或關(guān)系字)的漢語拼音的第一個(gè)字母。每字編碼都是4位,取法有5種,大體上是先找出每個(gè)字的4個(gè)特征字根,然后依漢語拼音的首字母編碼;少于4個(gè)字根的,重復(fù)取其中的特征字根;超過4個(gè)字根用“前拼后折”的方法省略。后者每字最長取4碼,第一碼為聲,第二碼為韻,第三碼為按字義分類的部首碼,第四位為形碼(5種起筆筆形×5種基本部首)。這個(gè)方案既要懂拼音,又要記字根,還要曉得事物的分類知識(shí)等等。
拼音碼要求操作者諳熟拼音知識(shí),能講比較標(biāo)準(zhǔn)的普通話。筆形碼碼長難于限制、輸入效率低,為減少重碼非制訂一些死記硬背的反常碼不可。字根拼形碼不受方言限制,輸入效率高,但碼元多,絕大多數(shù)是離散型的,缺乏內(nèi)在聯(lián)系,記憶困難,背熟了也容易回生。拼音和拼形相結(jié)合的音形碼,把兩者的缺陷集于一身,對(duì)操作者的要求更高。因此,目前國內(nèi)外編碼方案雖多,但一般很難推廣應(yīng)用。本發(fā)明的目的是為普通工作人員(指非專業(yè)操作員)提供一個(gè)容易掌握的,而效率不低于其他方案的普及型計(jì)算機(jī)漢字輸入方案。
本發(fā)明把128個(gè)高頻字根集約成64個(gè)常用字,并兩兩搭配成雙音節(jié)常用詞(部分是諧音的),有規(guī)律地配置在國際標(biāo)準(zhǔn)英文鍵盤下三列32個(gè)鍵位上,作為通用漢字的輸入碼元。
本發(fā)明不落傳統(tǒng)拼形方案的窠臼,在鍵面體現(xiàn)的是一個(gè)一個(gè)由整字構(gòu)成的人們記熟用慣了的常用雙音詞,字根就蘊(yùn)含在詞的中間,字根的聯(lián)系是有機(jī)的,使方案兼具了大、小鍵盤的優(yōu)點(diǎn)。同時(shí)本方案運(yùn)用了與眾不同的析取重碼因素和考察構(gòu)字重合率等思想,使方案設(shè)計(jì)更趨科學(xué)合理。
字根碼元不是作者主觀臆造的,而是經(jīng)過嚴(yán)密的靜態(tài)頻率統(tǒng)計(jì)篩選出來的高頻字根;整字和單詞也不是簡單的湊合,而是在常用的前提下,通過重合率統(tǒng)計(jì)把重碼機(jī)會(huì)少的字根搭配成字和詞;單詞碼元也不是隨意安排在鍵面上的,而是經(jīng)過碼元?jiǎng)討B(tài)頻率的計(jì)算,把它們配置在適當(dāng)?shù)逆I位上。如附圖所示。
上機(jī)輸入漢字時(shí)遵循下述規(guī)則1、每字最長四碼,順次連取,從大,從整,“割尾巴”。
從大-在同時(shí)有兩種取法時(shí),選取最大的碼元。例如“生”取“牜5-”,不取“丿-土”和“丿三丨”。
從整-在從大取碼時(shí),不破壞前后碼元的完整性。例如“朱”取“3木3”,不取“牛丿
”。
“割尾巴”-四碼取不盡的繁復(fù)漢字,四碼之后的信息不取。例如“麓”取“木木廣
”。
2、第一碼元用一次擊一鍵;第二、三、四、五、六碼元獨(dú)立成字或出現(xiàn)在二根字中需加擊區(qū)別鍵,三根以上的字一律不加擊區(qū)別鍵。例如“?!比 芭?”、“牯”取“牛5古6”、“牲”取“牛牛一”、“犟”取“弓口蟲牛”。
3、不足四碼者,加擊空格鍵;取足4碼者不需要擊空格鍵。
4、連擊兩次空格鍵為中西文轉(zhuǎn)換標(biāo)識(shí)符,用于中西文字更替的時(shí)候。
本發(fā)明有如下特點(diǎn)1、易學(xué)。碼元都是人們很熟悉的筆畫、字根、合體字,沒有生造的奇異結(jié)構(gòu)。取碼和取碼順序遵循漢字本身的結(jié)構(gòu)規(guī)律,規(guī)則簡單,一律無變通用法。用戶只要具有初中語文知識(shí),略經(jīng)講解或看看《說明書》即可操作。
2、易找。所有碼元集合成64個(gè)常用兩折合體字,并搭配成32個(gè)常用雙音節(jié)詞,制成鍵帽,清晰直觀、一覽無余。初學(xué)者能夠在鍵面上較容易地找到所需要的碼元,然后逐步記熟所有碼元的位置。
3、易記??梢猿浞掷迷~、字的相關(guān)信息集中記憶。記住了32個(gè)詞,也就記住了64個(gè)字;記住了64個(gè)字,也就記住了所有碼元,而且經(jīng)久不忘。
4、誤碼少。絕大多數(shù)碼元是構(gòu)字能力強(qiáng)、使用頻率高的字和字根,80%左右的通用漢字可直接用鍵面字根和整字碼元拼形輸入,少量通用漢字才用到筆畫碼元,這樣可以充分利用漢字的信息量、減少繁復(fù)漢字的輸入難度和誤碼概率。編碼本除給出標(biāo)準(zhǔn)碼外,還給出了容錯(cuò)碼,即使操作者輸入小錯(cuò),也能輸出正確結(jié)果。
5、重碼少。本方案采用了析取重碼因素的手段,成功地降低了重碼。
6、操作方便。利用國際通用英文鍵盤前三列32個(gè)字符鍵輸入,所耗內(nèi)存跟26鍵方案相等;操作時(shí)手掌也不需要移動(dòng),熟練后可以盲打。跟26鍵方案一樣便捷。碼元是按各自的動(dòng)態(tài)頻率配置在適當(dāng)鍵位上的,同時(shí)兼顧了人們輸入漢字時(shí)的心理反映過程,有利于操作時(shí)大腦與十指協(xié)調(diào)工作。
7、容易擴(kuò)充。本方案在初擬時(shí)就考慮了詞匯碼的兼容問題,留有足夠的“有理空間”(即有規(guī)律,不要死記的編碼空間),作為公共或用戶自定義詞匯碼的編碼區(qū)域,以便大幅度提高輸入效率。
附圖為本發(fā)明鍵面碼元配置圖。
1、圖中每一鍵位都置一常用詞。每個(gè)詞都蘊(yùn)含著6個(gè)碼元,而且都能按照詞字二分的原則展成一個(gè)自然的線性序列,例如“是的”一詞可展成碼元是的 日
白勺序號(hào)1 2 3 4 5 6任一鍵位的碼元按其線性排列的序號(hào),分別叫做第一碼元、第二碼元,……第六碼元。
2、第一列鍵外標(biāo)注的數(shù)碼分別為對(duì)應(yīng)碼元的區(qū)別符,即“2”為第二碼元的區(qū)別符,“3”為第三碼元的區(qū)別符,……,“6”為第六碼元的區(qū)別符。
3、基本筆畫暗含在第一列的另外五個(gè)鍵位上,“一”、“丨”、“丿”、“丶”分別以“丕”、“鴨”、“外”、“被”的第一筆為標(biāo)志,“乛”以“醫(yī)”的第二筆為標(biāo)志。
計(jì)算機(jī)廠家或用戶可根據(jù)自己的需要,選擇一種或數(shù)種西文計(jì)算機(jī),把按照附圖印刷的塑料薄膜鍵帽粘貼在所選機(jī)種的輸入鍵盤上(當(dāng)然也可以自行設(shè)計(jì)制造一種與主機(jī)相對(duì)獨(dú)立的漢字輸入終端),另外配置一個(gè)硬漢字庫和一臺(tái)漢字打印機(jī)(也應(yīng)根據(jù)需要選型);在原西文操作系統(tǒng)的基礎(chǔ)上,建立與之兼容的中文操作系統(tǒng),在不損害原西文操作功能的前提下,實(shí)現(xiàn)漢字的輸入、輸出。若必要可以進(jìn)一步開發(fā)一些漢字信息處理的應(yīng)用軟件。這樣就可以把西文計(jì)算機(jī)改造成普及型中西文兼容信息處理機(jī)。上機(jī)時(shí),按照輸入規(guī)則輸入漢字編碼即可。
權(quán)利要求
1.一種計(jì)算機(jī)漢字字根拼形輸入方法,本發(fā)明的特征是用128個(gè)高頻字根,兩兩搭配成64個(gè)常用字。
2.權(quán)利要求
1中所述的64個(gè)常用字,其特征是每兩個(gè)字搭配成一個(gè)常用雙音節(jié)詞(少量是諧音的),共32個(gè)詞。
3.權(quán)利要求
2中所述的32個(gè)常用雙音節(jié)詞,其特征是有規(guī)律地配置在國際標(biāo)準(zhǔn)英文鍵盤的下三列鍵位上,形成通用漢字集的計(jì)算機(jī)輸入碼元。
4.權(quán)利要求
3中所述的碼元,其特征是每個(gè)鍵位上的碼元都能用二分法拆成6個(gè)碼元,并形成一致的自然序列。
專利摘要
一個(gè)計(jì)算機(jī)漢字拼形輸入方法,本發(fā)明通過字根靜態(tài)和動(dòng)態(tài)頻率統(tǒng)計(jì),篩選出128個(gè)高頻字根,兩兩搭配成64個(gè)字(絕大部分為高頻和常用字),每兩個(gè)字又搭配成一個(gè)常用雙音節(jié)詞(少量是諧音的),一共32個(gè)詞,這32個(gè)詞有規(guī)律地配置在國際標(biāo)準(zhǔn)英文鍵盤的下三列鍵位上,用作通用漢字輸入計(jì)算機(jī)的碼元,記住這32個(gè)詞,就基本上記住了全部字根碼元。取碼遵循漢字的結(jié)構(gòu)規(guī)律和書寫習(xí)慣,規(guī)則簡單,易學(xué)、易找、易記、重碼少、誤碼少、操作方便,有容錯(cuò)能力,尤適用于一般用戶。
文檔編號(hào)G06F3/023GK85100382SQ85100382
公開日1986年8月20日 申請日期1985年4月1日
發(fā)明者田志祥 申請人:湖南省計(jì)算技術(shù)研究所導(dǎo)出引文BiBTeX, EndNote, RefMan
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
乐清市| 九龙县| 湖南省| 定西市| 陇南市| 澄迈县| 和平县| 新昌县| 新竹市| 乡城县| 神木县| 阿合奇县| 开江县| 页游| 日照市| 洪泽县| 五家渠市| 舟曲县| 当阳市| 五大连池市| 永州市| 德惠市| 华蓥市| 昭通市| 武安市| 洪泽县| 庆安县| 建德市| 余干县| 原阳县| 清新县| 江津市| 普兰店市| 昌乐县| 枣庄市| 襄垣县| 邢台市| 仁寿县| 江华| 河源市| 来凤县|