專利名稱:一種漢字直查三碼檢字法的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于一種漢字檢字方法,是涉及一種主要用于中文字詞典的漢字檢索的漢字檢字法。
背景技術(shù):
目前廣泛使用的檢字法有部首檢字法、拼音音序檢字法、四角號碼檢字法、筆畫檢字法 等,這些檢字法各有其優(yōu)缺點。
部首檢字法歷史悠久,用的最廣,幾乎所有的中文字詞典都有部首檢字表。其缺點是檢 字步驟繁多,耗費時間,査一個字需要經(jīng)過判斷部首+査該部首筆畫數(shù)》査部首目錄+找到 該部首在檢字表中的頁碼+查該字除部首以外的筆畫數(shù)》查檢字表+根據(jù)在檢字表中所示的 頁碼數(shù)翻到字典的正文頁碼等7個步驟,查一個字最快需要一分鐘左右,有的字則數(shù)分鐘也 査不到。
拚音音序檢字法的優(yōu)點是,認識并能夠準確讀音的字一翻就能査到。其缺點 一是對不 認識的字一籌莫展,而我們査字還往往是査不認識的字;二是同音字太多,增加了査找難度, 有時查一個字也需要數(shù)分鐘。
四角號碼檢字法的優(yōu)點是號碼多,同碼字較少,其缺點是規(guī)則多,難記憶,準確度低, 因而現(xiàn)在已很少有人使用。
筆畫檢字法查字速度更慢,更困難,經(jīng)常是在使用多種方法不靈時才被迫使用。
綜上所述,目前廣泛使用的部首、拼音音序、四角號碼、筆畫等常用檢字法存在著檢字 步驟繁雜、速度慢、規(guī)則難記憶、準確度低、或同碼字過多造成檢字難等缺點。
本發(fā)明就是為了克服上述幾種常用檢字法的缺點而設(shè)計的,提出了一種新的快速、簡明、 易記、易學(xué)的漢字檢字法。
發(fā)明內(nèi)容
本發(fā)明依據(jù)漢字的筆畫和漢字的書寫順序自然取碼,提出一種新的漢字編碼方法,其要 點是
(一)利用"1、 2、 3、 4、 5"五個數(shù)字,分別代表"一 (橫)I (豎)〗(撇)、(點) 乙(折)"五種基本筆形,即"橫1、豎2、撇3、點4、折5",這五個數(shù)字稱作"筆形碼";利用"6、 7、 8、 9、 0"等五個數(shù)字,分別代表"矛廿木> 口"這五個在漢字結(jié)構(gòu)中出現(xiàn)頻 率相對較高的部首,即"手6、草7、木8、水9、 口 0",這五個數(shù)字稱為"部首碼"。筆 形碼和部首碼統(tǒng)稱為"筆碼"。"1、 2、 3、 4、 5、 6、 7、 8、 9、 0"這10個數(shù)字就是其所對
應(yīng)的漢字筆碼。
其中,z (提)歸一 (橫),J (豎鉤)歸I (豎),、(捺)歸、(點),各種折筆筆 畫歸為乙(折)。
筆碼與筆形、部首的對應(yīng)關(guān)系見下列表一。
表一 漢字筆碼表
筆形碼部首碼筆形和部首— 1、乙凈卄木
筆碼1234567890
為了便于記憶,編以下口訣-
橫1豎2撇是3, 點捺為4折作5, 6手割7草8木, 好酒(9)水配好口令(0)。
(二) 編碼規(guī)則
直査三碼的編碼規(guī)則非常簡單,其編碼規(guī)則如下
直査三碼-筆畫數(shù).首筆碼+第二筆碼+末筆碼 艮P:直査三碼是由筆畫數(shù)、圓點和三筆碼共同組成的一組編碼。
圓點"."左邊是該字的筆畫數(shù),圓點右邊是由首筆碼、第二.筆碼、末筆碼等3個筆碼組 成的"三碼"。圓點的功能是區(qū)分和連接筆畫數(shù)和三筆碼。
具體方法是
先數(shù)漢字的筆畫數(shù),加一圓點,然后按漢字的書寫順序依次取該字的首筆碼、第二筆碼、 末筆碼等3個筆碼組成"三碼",放在圓點后,由筆畫數(shù)、圓點和三筆碼共同組成一組編碼。
"三筆碼"不足三碼時補加"0", 因為檢字時首先直接先査漢字的筆畫數(shù),然后再把漢字的首筆碼、第二筆碼和末筆碼組 成三筆碼,由筆畫數(shù)和三筆碼共同組成一組編碼,因此本檢字法稱為為"直查三碼檢字法", 所編的碼稱為"直查三碼"
(三) 編碼例舉例l.對"碼"字編碼
先數(shù)"碼"的筆畫數(shù)為8,加一圓點,然后依次取"碼"字的首筆碼"橫1"、第二筆碼 "撇3"和末筆碼"橫1"組成該字的"三筆碼"。 即:"碼"的直查三碼是8.131 園點前的8是筆畫數(shù),園點后面的131是"三筆碼" 絕大多數(shù)漢字可以本例進行編碼。 例2.對"核"字編碼
先數(shù)"核"的筆畫數(shù)為10,加一圓點,然后取"核"字的首筆碼"木8"、第二筆碼"點 4"和末筆碼"點4"組成該字的"三筆碼"。 艮P:"核"的直査三碼是10.844 園點前的10是筆畫數(shù),園點后面的844是"三筆碼"
字體結(jié)構(gòu)中含有"凈^木? 口"這五個部首之一的漢字(此類漢字約占全部漢字數(shù)的五 分之一)可以本例進行編碼,其特點是,將部首碼作為第一碼,此部首后面的筆碼為第二碼, 末筆碼是第三碼。如在本例中,"核"字由"木"和"亥"兩個部件組成的合體字,"木"是 以部首碼作為"核"字的首筆碼"木8",第二碼筆依次是"木"這個部首之后"亥"部件的 第一筆"點4"。同理,如果這五類部首碼雖然沒有在出現(xiàn)在字的首筆位置,如需要編碼時也 要按部首碼進行編碼。
把"凈^木? 口"這5個部首設(shè)為部首碼的依據(jù)是在漢字的結(jié)構(gòu)中,"凈*木'? 口" 這5個部首的造字能力特別強,例如在《新華字典》中收錄的1萬個漢字中,"#*木? 口" 這5個部首下的漢字數(shù)分別是401、 500、 460、 552、 470個,即這5個部首下的漢字數(shù)達2383 個,約占《新華字典》收錄個漢字數(shù)的五分只一。這也是許多漢字檢字法重碼率高的主要原 因之一。把"凈^木? 口"這5個部首設(shè)置為部首碼,有效的解決了漢字編碼中出現(xiàn)的重碼 率高的難題。
例3.對"人"字編碼
先數(shù)"人"的筆畫數(shù)2,將"2"作為該字的筆數(shù)碼,然后取"人"字的首筆碼"撇3"、 第二筆碼"捺4",因不夠三筆,末筆碼補以"0"組成該字的"三筆碼"。 艮P:"人"的直三碼=2.340
只有一、二筆畫的漢字(常用的一、二筆畫漢字不足20個)可以用此方法。 (四)"直查三碼檢字法"的優(yōu)點
1. 編碼規(guī)則少而簡單,容易掌握,讀者只需花幾分鐘時間就能看懂并熟練運用。
2. 十種筆碼簡單明了,不需要特殊記憶,極大的簡化人們在檢索漢字的心理過程。3. 把復(fù)雜的漢字簡單化,不考慮漢字是獨體字還是合體字,也不考慮漢字的結(jié)構(gòu)有多么
復(fù)雜,只數(shù)筆畫數(shù),取字的第一、二筆碼和末筆碼進行編碼,極大的減少了影響編碼的因素。
4. 査字方便、迅速,用該檢字法編篡的字詞典,根據(jù)編碼可直接翻到該字所在的頁碼, 使檢字步驟最少化,省略了大多數(shù)字典常用的"檢字表",節(jié)省了檢字時間,提高了檢字效率。
5. 重碼率低,絕大多數(shù)的"直査三碼"的編碼所包含的漢字數(shù)在IO個以內(nèi),提高了檢 字的速度。
具體實施例方式
1. 根據(jù)本發(fā)明可以進行中文字詞典等漢字工具書的編篡。
例如,用"直査三碼"編篡漢語字典、漢語詞典、漢語學(xué)習(xí)字典等工具書,字詞典正文 中所收錄漢字按照"直査三碼"進行升序排列。
2. 根據(jù)本發(fā)明可以編寫現(xiàn)有中文字詞典的輔助檢索工具書。
3. 根據(jù)本發(fā)明可以編寫中文圖書、文獻、檔案、資料等部門的索引工具書
4. 根據(jù)本發(fā)明可用于移動電話、電子字典的中文編排輸入,以及與漢字輸入、檢索有關(guān) 的其它領(lǐng)域。
權(quán)利要求
1.一種漢字直查三碼檢字法,其特征在于用“1、2、3、4、5”五個數(shù)字,分別代表“一(橫)丨(豎)丿(撇)丶(點)乙(折)”五種基本筆形,這5個數(shù)字稱為“筆形碼”;用“6、7、8、9、0”等五個數(shù)字,分別代表“扌艸 木 氵口”這五個在漢字結(jié)構(gòu)中出現(xiàn)頻率相對較高的部首,這5個數(shù)字稱為“部首碼”;筆形碼和部首碼統(tǒng)稱為“筆碼”;“1、2、3、4、5、6、7、8、9、0”這10個數(shù)字就是其所對應(yīng)的漢字筆碼;漢字直查三碼是由筆畫數(shù)、圓點、三筆碼組成;漢字直查三碼可用于中文字詞典等工具書的編篡以及與漢字輸入、檢索等相關(guān)領(lǐng)域。
2. 根據(jù)權(quán)利要求1所述的"漢字直査三碼是由筆畫數(shù)、圓點、三筆碼組成",其特征在 于編碼時,先數(shù)漢字的筆畫數(shù),加一圓點,然后按漢字的書寫順序依次取該字的首筆碼、 第二筆碼、末筆碼等3個筆碼組成"三筆碼",放在圓點后,由筆畫數(shù)、圓點和三筆碼共同組 成一組編碼。
3. 根據(jù)權(quán)利要求1所述的"漢字直查三碼可用于中文字詞典等工具書的編篡",其特征在于漢字直査三碼可用于編篡各種各類漢語字典、漢語詞典、漢語學(xué)習(xí)字典等工具書。
4. 根據(jù)權(quán)利要求1所述的"漢字直査三碼可用于中文字詞典等工具書的編篡以及與漢字輸入、檢索等相關(guān)領(lǐng)域"中的"以及與漢字輸入、檢索等相關(guān)領(lǐng)域",其特征在于漢字直査三碼可用于移動電話、電子字典等事項的中文編排輸入,漢字直査三碼可用于編寫中文圖書、 文獻、檔案、資料等部門的索引工具書,漢字直査三碼可用于與漢字輸入、檢索有關(guān)的其它 領(lǐng)域。
全文摘要
一種漢字直查三碼檢字法,它屬于一種漢字檢字方法。它克服了部首、拼音音序、四角號碼、筆畫等檢字法所存在的檢字步驟繁雜、速度慢、規(guī)則難記憶、準確度低、同碼字過多等缺點。其要點是用“12345”五個數(shù)字,分別代表“一丨丿丶乙”五種基本筆形,這五個數(shù)字稱作“筆形碼”;用“67890”五個數(shù)字,分別代表在漢字結(jié)構(gòu)中出現(xiàn)頻率較高的五個部首“扌艸木 氵口”,這五個數(shù)字稱為“部首碼”。筆形碼和部首碼統(tǒng)稱為“筆碼”。編碼規(guī)則直查三碼=筆畫數(shù),首筆碼+第二筆碼+末筆碼圓點“.”左邊是該字的筆畫數(shù),圓點右邊是由首筆碼、第二筆碼、末筆碼等3個筆碼組成的“三碼”。本發(fā)明可用于中文字詞典等漢字工具書的編篡。
文檔編號G09B19/00GK101493999SQ200910014169
公開日2009年7月29日 申請日期2009年2月18日 優(yōu)先權(quán)日2009年2月18日
發(fā)明者賈守治 申請人:賈守治