專利名稱:一種矩形碼編碼方法及基于該方法的矩形碼的制作方法
技術領域:
本發(fā)明涉及一種以圖形結構描述字符等信息的編碼技術。
背景技術:
矩形碼是利用圖形結構描述字符等信息的一種編碼技術。條形碼是由一組寬度不同的相互間隔的條和空按一定的編碼規(guī)則組合而成,完成數(shù)據(jù)字符的編碼,是一種易于機器表示、便于機器識別的信息代碼。利用條形碼閱讀器識別條形碼,可以快速地提供可靠性很高的數(shù)據(jù),其誤碼率幾乎為零(小于百萬分之一)。正是主要由于這種原因——便于機器識別,條形碼才得到如此廣泛的應用。然而,條形碼等一類圖形碼卻極不便于手工表示,誰也無法手拿一只筆像寫字一樣畫出一個條形碼。不便于手工表示是條碼的一個重大缺陷,大大地限制了它的應用范圍。
日本學者曾發(fā)明了一種稱作卡拉碼的矩形碼,較好地解決了手工表示的問題。但由于沒有檢錯能力,致使其識別誤碼率大大增加。
字符識別技術的出現(xiàn)使人們寄希望于用手寫或印刷的普通字符(西文字符、數(shù)字、漢字等)取代條碼一類圖形碼。遺憾的是,雖然人類自古以來創(chuàng)造的用于交流信息的文字符號便于人工表示和人工識別,但讓機器識別字符卻異常困難,近年來,文字符號識別技術有了一定進展。包括漢字在內的各種識別系統(tǒng)在文本自動閱讀、人機通信、語言處理和機器翻譯等方面得到了應用,但其誤碼率居高不下與條形碼相差甚遠,普通印刷體字符的識別誤碼率高于百分之一;手寫體字符的識別誤碼率則更高;即使專門針對機器識別而設計的印刷體OCRA、OCRB等的識別誤碼率也很難達到萬分之一。因此,字符識別技術現(xiàn)在(甚至在今后相當長的時期)只能局限在辦公自動化等方面的文字處理領域使用,無法在要求誤碼率極低的場所取代條形碼等圖形碼。
發(fā)明內容
本發(fā)明所要解決的技術問題是提供一種矩形碼編碼方法,并提供基于該方法的矩形碼。該矩形碼便于手工表示、易于機器識別??蓮V泛應用在商業(yè)、銀行、郵電等數(shù)據(jù)需手工書寫并由機器自動識別,而且對識別誤碼率有較嚴格要求的場所。
本發(fā)明解決技術問題所采用的技術方案是本發(fā)明矩形碼編碼方法的特點是被編碼的有序字符集為0、1、2、3、4、5、6、7、8、9,所述編碼是包括權值“0”的正權碼,其碼長為6,采用6取2碼,記為(6,2)碼。
本發(fā)明基于上述編碼方法的矩形碼的特點是將所述六個碼符集中排列成塊狀圖形。
本發(fā)明限制待設計編碼滿足等比碼的條件。由條碼編碼的啟發(fā),條碼的識別誤碼率之所以可以很低,是因為其編碼有很強的自動校驗查錯能力。目前較流行的各種條碼者是等比碼,除整體上可以有校驗手段外,其每個字符的編碼都有自校驗功能。對于(n,m)碼中碼字的數(shù)目最多為Cnm,而非法碼字的數(shù)目至少為2n—Cnm,凡由于錯誤表示或錯誤識別而變成非法碼字的情況均可檢測出來。因此,對于等比碼有如下結論。定理等比碼能檢測所有非對稱性錯誤譯碼。推論等比碼能檢測所有1位錯誤譯碼。
與已有技術相比,本發(fā)明的有益效果體現(xiàn)在圖形直觀,便于手工表示和易于機器識別,可以在數(shù)據(jù)需手工表示、機器識別和對誤碼率有較嚴格要求的場所廣泛使用。調查結果表明,不同職業(yè)、不同文化水平者(包括近乎文盲者)均能容易地使用本矩形碼手工表示數(shù)據(jù)。配合使用現(xiàn)有技術中類似字符識別的掃描、預處理、旋轉定向定位、切分、特征抽取、判定及譯碼、校驗等機器識別步驟,可以快速、準確地識別本矩形碼表示的數(shù)據(jù)。理論分析表明,其誤碼率可以達到條碼的識別誤碼率的水平。
圖面說明
圖1為本發(fā)明矩形碼的編碼表。
圖2為本發(fā)明另一實施方式矩形碼編碼表。
圖3為本發(fā)明矩形碼的塊狀編碼圖形。
圖4為本發(fā)明矩形碼的塊狀編碼圖形另一形式。
圖5為本發(fā)明矩形碼的一種手工表示方法。
圖6為將本發(fā)明應用于信封一角表示郵政編碼。
圖7為將本發(fā)明應用于表示金額數(shù)。
具體實施例方式本實施例中的矩形碼編碼方法是被編碼的有序字符集為0、1、2、3、4、5、6、7、8、9,所述編碼是包括權值“0”的正權碼,其碼長為6,采用6取2碼,記為(6,2)碼。
參見圖1,具體實施中,一種方式是按圖1所示設置各碼位權值為(w1,w2,w3,w4,w5,w6)=(6,3,2,1,0,0),即有字符“0”編碼為兩個權值為“0”的碼位均為“1”、其余為“0”;字符“1”編碼為任一權值為“0”的碼位和權值為“1”的碼位為“1”,其余為“0”;字符“2”編碼為任一權值為“0”的碼位和權值為“2”的碼位為“1”,其余為“0”;字符“3”編碼為任一權值為“0”的碼位和權值為“3”的碼位為“1”,其余為“0”;或權值為“1”的碼位和權值為“2”的碼位為“1”,其余為“0”;字符“4”編碼為權值為“1”的碼位和權值為“3”的碼位為“1”,其余為“0”;字符“5”編碼為權值為“2”的碼位和權值為“3”的碼位為“1”,其余為“0”;字符“6”編碼為任一個權值為“0”的碼位和權值為“6”的碼位為“1”,其余為“0”;字符“7”編碼為權值為“1”的碼位和權值為“6”的碼位為“1”,其余為“0”;字符“8”編碼為權值為“2”的碼位和權值為“6”的碼位為“1”,其余為“0”;字符“9”編碼為權值為“3”的碼位和權值為“6”的碼位為“1”,其余為“0”。
參見圖2,具體實施中,另一種實施方式是按圖2所述設置各碼位權值為(w1,w2,w3,w4,w5,w6)=(7,4,2,1,0,0),即有字符“0”編碼為兩個權值為“0”的碼位均為“1”,其余為“0”;字符“1”編碼為任一權值為“0”的碼位和權值為“1”的碼位為“1”,其余為“0”;字符“2”編碼為任一權值為“0”的碼位和權值為“2”的碼位為“1”,其余為“0”;字符“3”編碼為權值為“1”的碼位和權值為“2”的碼位為“1”,其余為“0”;字符“4”編碼為任一權值為“0”的碼位和權值為“4”的碼位為“1”,其余為“0”;字符“5”編碼為權值為“1”的碼位和權值為“4”的碼位為“1”,其余為“0”;字符“6”編碼為權值為“2”的碼位和權值為“4”的碼位為“1”,其余為“0”;字符“7”編碼為任一權值為“0”的碼位和權值為“7”的碼位為“1”其余為“0”;字符“8”編碼為權值為“1”的碼位和權值為“7”的碼位為“1”,其余為“0”;字符“9”編碼為權值為“2”的碼位和權值為“7”的碼位為“1”,其余為“0”。
上述采用包括權值為“0”的正權碼,即w≥0,而并非是w>0,是為了將校驗位與整個碼字統(tǒng)一處理方便。
參見圖3、圖4,基于上述方法的矩形碼是將六個碼符集中排列成塊狀圖形。具體的塊狀圖形可以是將六個碼符按兩列三行(圖3所示)或兩行三列排列而成。也可以是將六個碼符按一行(圖4所示)或一列排列而成。
除圖3、圖4中所示圖形之處,其拓樸變形、置換以及不同的標記方式均可作為圖1或圖2所示編碼表的編碼圖形。本實施中,選擇圖3所示圖形,詳細明本設計方案的矩形碼表示方法。
表示方法1如圖5所示,用筆劃掉其中的4個小方格,使留下的2個小方格中的數(shù)字之和等于需表示的數(shù)字。采用此方法,0到9數(shù)字可用圖4中的劃法表示。
表示方法2與表示方法1相反,用筆劃掉其中的2個小方格,使這2個小方格中的數(shù)字之和等于需要表示的數(shù)字。
具體應用例1,對于傳統(tǒng)使用的直接書寫數(shù)字式郵政編碼,由于書寫者的書寫風格不同等原因,會有無數(shù)變化的數(shù)字形狀,正確識別是異常困難的,識別誤碼率居高不下,嚴重影響了信函的自動分揀。圖6所示,以本發(fā)明矩形碼表達郵政編碼,圖中所示為230039。這種形式顯著地減少了識別誤碼率。
例2,在金融、財政、商業(yè)等部門的一些場所采用圖7所示的矩形碼表示金額,利用機器可靠地自動讀入手工表示的有關金額,將能大大提高工作效率和管理水平。
權利要求
1.一種矩形碼編碼方法,其特征是被編碼的有序字符集為0、1、2、3、4、5、6、7、8、9,所述編碼是包括權值“0”的正權碼,其碼長為6,采用6取2碼,記為(6,2)碼。
2.根據(jù)權利要求1所述的矩形碼編碼方法,其特征是設置各碼位權值(w1,w2,w3,w4,w5,w6)=(6,3,2,1,0,0),即有字符“0”編碼為兩個權值為“0”的碼位均為“1”、其余為“0”;字符“1”編碼為任一權值為“0”的碼位和權值為“1”的碼位為“1”,其余為“0”;字符“2”編碼為任一權值為“0”的碼位和權值為“2”的碼位為“1”,其余為“0”;字符“3”編碼為任一權值為“0”的碼位和權值為“3”的碼位為“1”,其余為“0”;或權值為“1”的碼位和權值為“2”的碼位為“1”,其余為“0”;字符“4”編碼為權值為“1”的碼位和權值為“3”的碼位為“1”,其余為“0”;字符“5”編碼為權值為“2”的碼位和權值為“3”的碼位為“1”,其余為“0”;字符“6”編碼為任一個權值為“0”的碼位和權值為“6”的碼位為“1”,其余為“0”;字符“7”編碼為權值為“1”的碼位和權值為“6”的碼位為“1”,其余為“0”;字符“8”編碼為權值為“2”的碼位和權值為“6”的碼位為“1”,其余為“0”;字符“9”編碼為權值為“3”的碼位和權值為“6”的碼位為“1”,其余為“0”。
3.根據(jù)權利要求1所述的矩形碼編碼方法,其特征是設置各碼位權值(w1,w2,w3,w4,w5,w6)=(7,4,2,1,0,0),即有字符“0”編碼為兩個權值為“0”的碼位均為“1”,其余為“0”;字符“1”編碼為任一權值為“0”的碼位和權值為“1”的碼位為“1”,其余為“0”;字符“2”編碼為任一權值為“0”的碼位和權值為“2”的碼位為“1”,其余為“0”;字符“3”編碼為權值為“1”的碼位和權值為“2”的碼位為“1”,其余為“0”;字符“4”編碼為任一權值為“0”的碼位和權值為“4”的碼位為“1”,其余為“0”;字符“5”編碼為權值為“1”的碼位和權值為“4”的碼位為“1”,其余為“0”;字符“6”編碼為權值為“2”的碼位和權值為“4”的碼位為“1”,其余為“0”;字符“7”編碼為任一權值為“0”的碼位和權值為“7”的碼位為“1”,其余為“0”;字符“8”編碼為權值為“1”的碼位和權值為“7”的碼位為“1”,其余為“0”;字符“9”編碼為權值為“2”的碼位和權值為“7”的碼位為“1”,其余為“0”。
4.一種基于權利要求1所述方法的矩形碼,其特征是將六個碼符集中排列成塊狀圖形。
5.根據(jù)權利要求4所述的矩形碼,其特征是所述塊狀圖形是將六個碼符按兩列三行或兩行三列排列而成。
6.根據(jù)權利要求4所述的矩形碼,其特征是所述塊狀圖形是將六個碼符按一行或一列排列而成。
全文摘要
一種矩形碼編碼方法及基于該方法的矩形碼。其特征是編碼方法中被編碼的有序字符集為0、1、2、3、4、5、6、7、8、9,所述編碼是包括權值“0”的正權碼,碼長為6,采用6取2碼,記為(6,2)碼?;谠摲椒ǖ木匦未a是將六個碼符集中排列成塊狀圖形。本發(fā)明的有益效果體現(xiàn)在圖形直觀、便于手工表示、易于機器識別,可以在數(shù)據(jù)需手工表示、機器識別和對誤碼率有較嚴格要求的場所廣泛使用。其誤碼率可以達到條碼的識別誤碼率的水平。
文檔編號G06K9/18GK1437157SQ0211265
公開日2003年8月20日 申請日期2002年2月5日 優(yōu)先權日2002年2月5日
發(fā)明者吳建國, 周建強 申請人:安徽大學, 吳建國, 周建強