欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

部首組字英語組詞漢語信息編碼的制作方法

文檔序號:6602642閱讀:450來源:國知局
專利名稱:部首組字英語組詞漢語信息編碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明是一種漢語信息地編碼方法,包括字、詞二個部分的編碼。目前主要應(yīng)用于電腦漢字的鍵盤輸入等文字處理工作。在電腦應(yīng)用中亦可以稱為一種新的漢字輸入法。
電腦漢字輸入法現(xiàn)在有許多種了。但是就目前而言都存在幾個問題,妨礙了電腦的進(jìn)一步普及。好學(xué)的速度慢,如拼音法,一分鐘只能有十來字的速度,而一般人手寫也有四十字/分速度的,所以用它來代替是不現(xiàn)實(shí)的。另外,象zheng zhen zeng zen四個拼音幾乎一樣,誰有保證能一次打?qū)δ兀慷髖i下有超過一百個同音,如果在打字是遇見二、三次我想發(fā)現(xiàn)要的字費(fèi)時不說,興趣也會大受影響的。
而輸入速度快就要很難學(xué),象代表性的五筆字型法,光字根就有一百三十個,忘了一個也不行,就會有字輸入不進(jìn)去了。通常要專門花半月以上的時間才能過關(guān),普通人并沒有這個耐心的。
如《漢字國文電腦》(申請?zhí)?9100801.2),雖然也有易學(xué)的優(yōu)點(diǎn),但是它的編碼有一個很大的缺陷,它的碼的選取是不按生活習(xí)慣的?!皻А弊质怯伤牟糠纸M成的,但它的實(shí)際的取碼為工幾又臼,在使用時會發(fā)生混亂的,而且它是用號碼來編碼的,使用時和鍵盤的關(guān)系又要費(fèi)一番力的了。
本發(fā)明就是想為使用者提供一種沒有明顯缺陷即好學(xué)又有速度快優(yōu)點(diǎn)的新型漢字輸入方法,具體說就是在半天能完全學(xué)會,而在經(jīng)半月使用后能打五十字每分鐘以上,讓使用過的人在能用電腦能用筆時,選擇用電腦,為電腦的普及作貢獻(xiàn)。
基于目前漢字編碼非常多的現(xiàn)實(shí),只有特別簡單、方便的方法才有生命力,因此我在這方面特別下了一番苦功。設(shè)計了好幾個方案,盡管都是有創(chuàng)新的,但是一試用說不夠簡單。幾經(jīng)周折,我特別注意了日常生活中的觀察,發(fā)現(xiàn)人們對字的區(qū)別是有一套的。如我姓張是弓長張,不是立早章,我的對座姓李,是木子李。這里我們清晰的區(qū)分了三個字,且非常的簡單。
我試驗(yàn)了一下用三個拼音首字母來代替三個字,如gcz來代替張,用lzz作為章的編碼,mzl作為李的編碼。如此編碼發(fā)現(xiàn)非常好用幾乎不必學(xué)習(xí)。同時我試驗(yàn)用英語詞的前五個字母來作為中文詞的編碼,象tv~電視、book~書籍、newsp~報紙。我發(fā)現(xiàn)根據(jù)高頻先見的原則,其實(shí)英語詞很少打到五鍵的,平均在三鍵稍多一點(diǎn)而已。但是就在完成GB2112中6763個漢字以后,我發(fā)現(xiàn)它存在以下幾個小問題1重碼率稍高,因?yàn)楝F(xiàn)在幾乎所有的編碼是四位的,而現(xiàn)在這個發(fā)明是三位的。2有部分不認(rèn)識的偏旁如“屮、髟、攴、殳”等。3象“手、未、電”等字是獨(dú)體字,不能拆分,如何編碼。
同時在完成后我發(fā)現(xiàn)一個新的優(yōu)點(diǎn),差不多所有的編碼是由拼音的聲母組成的,即鍵盤上的aeiouv六個字母很少用到。而同時拼音法是由聲母和韻母組成的,即每一個拼音碼都是用到aeiouv的。所以兩者放在一起是不會增加重碼的,我試驗(yàn)了一下,兩者完全兼容,不增加重碼。這樣別的輸入法存在的要按一下功能鍵才能轉(zhuǎn)換,而這個發(fā)明就不必了。在萬一有一字打不出時,直接打拼音就可以了?,F(xiàn)在的ucdos等中文平臺有查字編碼的功能的,所以說現(xiàn)在這個發(fā)明是不會卡殼的。
于是我開始了修改的工作。我先把原來的拆字為兩部分最后形成三碼,改變成將字拆成三部分以最后形成四碼,如“謝”的編為yscx。而同時我把v字母作為所有不認(rèn)識的部首的替代碼。我把獨(dú)體字用筆劃的前三個來組碼,如手~phhs、口~szhk。
同時我設(shè)了二十六個一級簡碼,二級字五百個。經(jīng)試驗(yàn)平均每字在三鍵以下。重碼率在3%,而常用字出現(xiàn)的頻率高,所以使用時的重碼實(shí)際率更低。另外我把重碼的第二放在拼音的第一個,如護(hù)和滬的編碼都是sdsh,我就把滬放在拼音的第一個,在熟悉以后,打hu就能夠得到滬字的了。如按這樣計算,重碼率為1%,完全能夠進(jìn)行盲打的了,不僅為一般使用者能用,專業(yè)打字員也能用字的。按上述幾個數(shù)據(jù)可以推測出本方法打字和五筆字型應(yīng)該是速度是差不多的。本人屬手腳笨拙一類的,現(xiàn)在也可以打五十字一分鐘了。
此編碼可以在中國龍和ucdos和ccdos等中文平臺上應(yīng)用。
筆劃、偏旁、部首、獨(dú)體字通稱為部件。部件的采用主要根據(jù)使用最廣泛的、具規(guī)范意義的新華字典中所述。
筆劃采用〖新華字典〗部首檢字表內(nèi)的劃分法,內(nèi)稱單筆部首分為橫(一)豎(丨)撇(丿)點(diǎn)(丶)折(乙)五種。象提()捺()分別歸在撇和點(diǎn)內(nèi)。筆劃的對應(yīng)字母分別為橫~h豎~s撇~p點(diǎn)~d折~z。
偏旁、部首和獨(dú)體字采用字典部首目錄和正文所述內(nèi)容。
對于生僻或沒有統(tǒng)一叫法的部件一律用字母V來表示。如髟、屮、殳、攴。
大多數(shù)人是能適用此法的,包括一些方言地區(qū),盡管讀音不準(zhǔn),但是聲母還是都能讀對的。而象zh ch sh與z c s,enin與eng ing等老大難問題都順利解決了。讀音采用部件的代表性的部分的讀音。如二點(diǎn)水、三點(diǎn)水、四點(diǎn)水都放在水部,用s來
在純拼音中困難的問題如“真”是zheng zhen zeng zen中哪一個,在本發(fā)明中是唯一的編碼sqbz,一下子就找到了。
在本發(fā)明中多音字的碼也對應(yīng)有多個,如長的編有zphc和zpjz二個
拆分時盡量拆成三部分,如“謝”拆成言身寸,“章”拆成立日十,“森”拆成為木木木。對于獨(dú)體字采用筆劃的前三筆,如手的前三筆劃為撇橫橫,手的編為phhs,口的編碼為szhk。
除了筆劃取碼的獨(dú)體字,我們規(guī)定拆分時有交叉的部件是不拆分的,如“重”可分為千里二部分的,但是按此原則,重為獨(dú)體字,編碼為phsc和phsz。戈為獨(dú)體字,編碼為hzpg。
漢字中字的部件之間的關(guān)系有散、連、交三種。如“吳”口和天的關(guān)系為散,象這樣明顯分開的為散。而“天”字的一和大的關(guān)系就是連了,象這樣相連而不相交的為連。而“大”的第一、二筆的關(guān)系就是交了,象這樣交叉的關(guān)系為交,我們統(tǒng)一規(guī)定交叉的部件一律不進(jìn)行拆分,象“里”硬分的話也可以分成為日和土二部分,但是二者的關(guān)系是交叉,所以這里就把它當(dāng)作一個整體不進(jìn)行拆分的了。
拆分的原則就是盡量拆成三部分和交叉的不拆。
在部件多于三時,取前三個。如噩的全編碼是wkke,同樣“輸”~crhs。
對不足四碼的字為防重碼過多,加一識別碼。如李的全碼為mzlq,張的全碼為gczv。識別碼采用首尾筆劃的組合。如李為折和點(diǎn),識別碼為折點(diǎn)。
此鍵位分布圖就表示了識別碼的情況,以1、2、3、4、5來代替橫、豎、撇、點(diǎn)、折,二個筆劃的組合就有二十五個,如此和二十五個鍵一一對應(yīng)李的識別碼為橫橫,圖中以22表示,即U。同樣張的識別碼為V。有了識別碼,重碼率就大大下降了,我們能夠進(jìn)行盲打的了。
采用英語詞匯和中文詞一一對應(yīng)的辦法進(jìn)行編碼。如pen---鋼筆,pencil--鉛筆,tv--電視。在電腦應(yīng)用中采用取前五個字母的辦法,以提高速度。象鉛筆的實(shí)際編碼為penci,這樣可以輸入絕大多數(shù)的詞匯了。當(dāng)然在使用中發(fā)現(xiàn)一個小小的問題就是象下午(afternoon)和(after)后來的編碼都是after,現(xiàn)統(tǒng)一規(guī)定合成詞取前三字母和后一詞的二個字母,如下午的編碼為aftno。這個詞組的編碼為一些英語較好的電腦使用者可以提高輸錄速度,根據(jù)電腦的高頻先見功能,大多數(shù)的詞匯只要三鍵就能完成輸入了,真正用到五鍵的就在百分之七以下。詞匯平均用鍵為三鍵稍多一點(diǎn)。且重碼率極低,使用起來非常方便。
在用以上組碼的同時,完全兼容漢語全拼法,而同時不增加重碼率,象五筆字型等方法遇到了輸不進(jìn)的字的字,要alt+f3轉(zhuǎn)到拼音法,在完成以后同樣要按以上的步驟回到五筆字型法下。一來一去不但復(fù)雜費(fèi)時,一個初學(xué)者又要多一樣記憶的內(nèi)容了。而在本發(fā)明中就完全不必了。碼本表中就包括了漢語全拼法,遇見了一下中吃不準(zhǔn)怎樣拆分的字就可以直接用拼音法輸入的了,不會再有令人煩惱的卡殼現(xiàn)象了。在拼音中我們把碼本中前半部分有重碼的字的第二個字放在拼音的第一個,這樣熟練的使用者在遇到重碼后就能打拼音輸入的了,而重碼又進(jìn)一步降低的。
對所有生僻和沒有統(tǒng)一叫法的部件,我們規(guī)定它們的碼為V因?yàn)闈h語中沒有以V開頭的拼音,真正用到V的也不到十個字,我們把所有不認(rèn)識的部件稱為V是適當(dāng)?shù)?,事?shí)證明碼本表中V字母的數(shù)字在總字母的三十分之一左右,是完全合理的。
下面給出部分字的全編碼本~hspb發(fā)~zpzf明~rymy的~bbdd名~xkma稱hdxc是~rpso部~lkeb首~bhzs組~jqzz字~bzzh英~cyyr語~ywky組~jqzz詞~yzhc漢~syhl語~ywky信~rgex息~pmxx編~jhvb碼~smmq其中“的、是”為一級簡碼,“名、漢、明”為二級簡碼。趙~zvzr錢~jjqf孫~zzbs李~mzlq周~kskz吳~khdw鄭~btez王~hshw
權(quán)利要求
1)一種漢語信息編碼,包括漢語單字和詞語的編碼,主要適用于計算機(jī)鍵盤輸入漢字,進(jìn)行文字此理。其特征在于單字的編碼,將字拆分成為幾個部分,每個部分可以是筆劃、偏旁、部首或獨(dú)體字,根據(jù)標(biāo)準(zhǔn)讀音分別取其一字母作為此部分的碼,再將這些碼按書寫順序相加,尾部加上整字的拼音首字母就得到了字的完整的編碼;詞匯的編碼采用漢、英對應(yīng)來進(jìn)行,常用的中文詞匯的編碼即是同樣意思的英語單詞的字母。
2)根據(jù)權(quán)利要求1所述字的編碼方法,字的拆分采用〖新華字典〗新舊字型對照表和部首檢字表所列舉的內(nèi)容。筆劃、偏旁、部首和獨(dú)體字的取碼采用標(biāo)準(zhǔn)讀音的拼音首字母。
3)根據(jù)權(quán)利要求1所述的字的編碼,基本采用全聲母組碼,所以完全兼容漢語拼音,不增加重碼,碼本表中包括有漢語拼音部分,不必按轉(zhuǎn)換鍵即可用拼音法輸入漢字。
4)根據(jù)權(quán)利要求1所述的字的編碼,針對部分漢字的偏旁、部首生僻或不可讀,指定字母作為它的碼。
5)根據(jù)權(quán)利要求1所述的字的編碼,對不足四碼的字采用在尾部加一識別碼,以防重碼過多,其組碼方式筆劃有五種,二個筆劃就有5×5共25種可能,我們?nèi)℃I盤上二十五個鍵為五區(qū)五組,同樣有25種,這樣一一對應(yīng)就可以得到了一個碼。識別碼為首、尾筆劃的結(jié)合
6)根據(jù)權(quán)利要求1詞的組碼方法,在電腦應(yīng)用中只要鍵入英語詞的前幾個英語字母就可以得到同樣意思的中文詞匯了。
7)根據(jù)權(quán)利要求1所述的字和詞的編碼方法,在電腦應(yīng)用中可進(jìn)行漢語單字和詞匯的輸入,一個標(biāo)準(zhǔn)鍵盤鍵位對照表A對照拼音A,英語字母A、首筆劃為撇末劃筆為橫的識別碼、凹、敖、安、愛等讀音首字母為A的筆劃、部首及獨(dú)體字B對照聲母B、英語字母B、首筆劃為折末筆為折的識別碼、不、半、巴、包(勹)、寶(宀、冖)、病(疒)、八(丷)、比、貝、本、白、拜、百以及所有讀音拼音首字母為B的部首偏旁C對照聲母C、英語字母C、首末筆劃為折和撇的識別碼、長、才、芻、草(艸、廾)、廠、倉、春、蟲、丑、成、車、此以及所有讀音拼音首字母首字母為C的筆劃部首獨(dú)體字D對照聲母D,英語字母D、首尾筆劃為撇和撇的識別碼、當(dāng)、單、歹、大、豆、代、旦、點(diǎn)(丶)、刀(刂、)、單、弟、典、丁、以及所有讀音拼音首字母為D的部首偏旁E對照韻母E、英語字母E、首尾筆劃為橫和撇的識別碼、二、爾、厄、而、耳(卩、阝、
)、兒以及所有讀音拼音首字母為E的部首偏旁F對照聲母F、英語字母F、首尾筆劃為撇和點(diǎn)的識別碼、發(fā)、反、分、父、方、非、飛、弗、
、甫、番、夫、
豐、風(fēng)、凡、以、方、缶、及所有讀音拼音首字母為F的筆劃偏旁G對照聲母G、英語字母G、首尾筆劃為撇和折的識別碼、個、丐、關(guān)、公、皋、官、國、岡、勾、古、高(亠)、干、戈、工、更、革、廣、龜、艮、甘、弓、鬼、骨、哥、光、干、羔以及所有拼音首讀音為G的部首偏旁H對照聲母H、英語字母H、首尾筆劃為點(diǎn)和橫的識別碼、禾、化、卉、害、火、后、虎
或、灰、乎、互、戶、黑、合、會、亥、橫(—)以及所有讀音拼音首字母為H的部首偏旁I對照韻母I、英語字母I、首尾筆劃為豎和撇的識別碼、愛、艾、以及所有讀音拼音首字母為I的部首偏旁J對照聲母J、英語字母J、首尾筆劃為點(diǎn)和豎的識別碼、及、家節(jié)、京、金(钅)、絞(纟)、久、角、居、九、句、巨、巾、今、斤、幾、及、祭以及所有讀音拼音首字母為J的部首偏旁K對照聲母K、英語字母K首尾筆劃為點(diǎn)和撇的識別碼、可、看、考、克、口、框(囗、匚、冂、凵)、虧以及所有讀音拼音首字母為K部首偏旁L對照聲母L、英語字母L、首尾筆劃為點(diǎn)和點(diǎn)的識別碼、了、令、另、兩、隸、麗、六、力、里、侖、林、立、錄、卵、鹵、盧,鹿、龍、覽、來(耒)以及所有讀音拼音首字母為L的部首偏旁M對照聲母M、英語字母M、首尾筆劃為點(diǎn)和折的識別碼、毛、卯、馬、米、苗、門、每、木、目、米、矛、麥、美、民、面、母、免以及所有讀音拼音首字母為M的部首偏旁N對照聲母N、英語字母N、那、寧、奴、年、廿、牛
、女、鳥
男以及所有讀音拼音首字母為N的筆劃偏旁O(shè)對照韻母O、英語字母O、首尾部首為豎和點(diǎn)的識別碼P對照聲母P、英語字母P、首尾筆劃為豎和折的識別碼、片、爿、票、皮(疋)、撇(丿、彡)、辟、品以及所有讀音拼音首字母為P的部首偏旁Q對照聲母Q、英語字母Q、首尾筆劃為橫和橫的識別碼、七、去、其、喬、且、氣、求、丘、酋、妻、青、秦、欠、犬(犭)、豈、前、千、戚、以及所有讀音拼音首字母為Q的部首偏旁R對照聲母R、英語字母R、首尾筆劃為橫和點(diǎn)的識別碼、人(亻、彳)、刃、日、冉、肉以及所有讀音拼音首字母為R的部首偏旁S對照聲母S、英語字母S、首尾筆劃為撇和豎的識別碼、三、上、尚、山、商、喪、受、是、食(饣)、水(冫、氵、灬、
視(礻)、少、司、申、失、升、束、書、手(扌)、石、士、十、四、身、甚、舌、氏、私(厶)、豎(丨)以及所有讀音拼音首字母為S的部首偏旁T對照聲母T、英語字母T、首尾筆劃為橫和折的識別碼、它、廳、妥、天、土()、同、團(tuán)、屯、臺、條、田、以及所有讀音拼音首字母為T的部首偏旁U對照韻母U、英語字母U、首尾筆劃為豎和豎的識別碼、又以及所有讀音拼音首字母為U的部首偏旁V對照韻母ü、英語字母V、首尾筆劃為折和點(diǎn)的識別碼、所有不可讀的部首、髟、屮、殳、
攴、丬、乇、爻、囟、亓、芉、厙、卣、
丌、等W對照聲母W、英語字母W、首尾筆劃為橫和豎的識別碼、我、萬、瓦、完、無
、危、王、午、亡、文(攵、夊)、五、戊、勿、烏、丸、為、衛(wèi)、韋、毋、舞、以及所有讀音拼音首字母為W的部首偏旁X對照聲母X、英語字母X、首尾筆劃為折和豎的識別碼、西、夕、習(xí)、下、小、心(忄)、穴、興、彐、血、戌、等Y對照聲母Y、英語字母Y、首尾筆劃為豎和橫的識別碼、有、右、永、甬、友、尤(尢)、于、爰、月、聿、與、雨、應(yīng)、言(讠)、衣(衤、
庸、也、業(yè)、云、魚、羊
)、幺、丫、堯、牙、音、月、酉、已(巳)、尹、以、央、又、由、予、夜、易以及所有讀音拼音首字母為Y的部首偏旁Z對照聲母Z、英語字母Z、首尾筆劃為折和橫的識別碼、在、占、乍、字、總、州、舟、走(辶、廴、
中、只、周、折(巛、乙)、子、專、足、左、卓、之、至、豕、豸、竹()、主、自、直、卒以及所有讀音拼音首字母為Z的部首偏旁
全文摘要
一種漢語信息編碼,包括字和詞二部分,適用于計算機(jī)標(biāo)準(zhǔn)鍵盤輸入漢字。具好學(xué)和速度快二大優(yōu)點(diǎn)。采用規(guī)范的新華字典的部首,拆分單字?jǐn)?shù)個部首,以拼音首字母作為部首的碼,數(shù)個碼相加,再加上整字的拼音首字母,即為該字的編碼。其中對不認(rèn)識的部首用V字母代替,可以了輸入GB-2312中所有6763個漢字。詞語采用同義的英語詞作為它的編碼。
文檔編號G06F3/023GK1159025SQ96101569
公開日1997年9月10日 申請日期1996年3月1日 優(yōu)先權(quán)日1996年3月1日
發(fā)明者張沐陽 申請人:張沐陽
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
拜城县| 秀山| 巨野县| 石嘴山市| 左云县| 恩施市| 丽江市| 高雄市| 全南县| 原阳县| 诸暨市| 交口县| 通渭县| 利津县| 阜平县| 全南县| 横峰县| 河北区| 蕲春县| 手游| 舞钢市| 台安县| 石狮市| 贵港市| 尉氏县| 靖宇县| 徐汇区| 海安县| 武强县| 海丰县| 富宁县| 来凤县| 贵南县| 邛崃市| 荣成市| 明光市| 淄博市| 临沧市| 开封市| 二手房| 霍城县|