欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

通信過(guò)程中漢字的處理方法和裝置的制作方法

文檔序號(hào):6339368閱讀:434來(lái)源:國(guó)知局
專利名稱:通信過(guò)程中漢字的處理方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及通信技術(shù)領(lǐng)域,特別是涉及一種通信過(guò)程中漢字的處理方法和裝置。
技術(shù)背景
數(shù)據(jù)通信領(lǐng)域中,許多通信數(shù)據(jù)都需要包含漢字?!缎畔⒔粨Q用漢字編碼字符集》 基本集(簡(jiǎn)稱GB2312-80)是我國(guó)中文信息處理技術(shù)的發(fā)展基礎(chǔ),也是目前國(guó)內(nèi)所有漢字系統(tǒng)的統(tǒng)一標(biāo)準(zhǔn)。根據(jù)GB2312-80,每個(gè)漢字用2個(gè)16進(jìn)制字節(jié)表示,這2個(gè)16進(jìn)制字節(jié)不妨稱為表示該漢字的“16進(jìn)制對(duì)”。由于在通信過(guò)程中通信數(shù)據(jù)的長(zhǎng)度是指定的,并且在數(shù)據(jù)接收端對(duì)通信數(shù)據(jù)的解析位置或者截取長(zhǎng)度可能出現(xiàn)偏差,這就需要在數(shù)據(jù)接收端對(duì)通信數(shù)據(jù)進(jìn)行漢字處理。如果處理不當(dāng),在數(shù)據(jù)接收端程序可能出現(xiàn)亂碼甚至程序崩潰等問(wèn)題。總之,由于通信過(guò)程中,通信數(shù)據(jù)存在漢字的現(xiàn)象極為普遍,所以對(duì)漢字的處理非常重要,否則會(huì)造成不可估量的損失。
現(xiàn)有技術(shù)數(shù)據(jù)接收端接收到需要進(jìn)行漢字處理的通信數(shù)據(jù)段時(shí),判斷該通信數(shù)據(jù)段中的每一個(gè)16進(jìn)制字節(jié)的字節(jié)值。如果某一 16進(jìn)制字節(jié)的字節(jié)值大于128,則將該字節(jié)作為一個(gè)漢字的字節(jié);反之,則將該字節(jié)作為一個(gè)非漢字的字節(jié)。在統(tǒng)計(jì)通信數(shù)據(jù)段中漢字字節(jié)的總個(gè)數(shù)之后,將該通信數(shù)據(jù)段中的16進(jìn)制字節(jié)識(shí)別為人可識(shí)別的漢字和非漢字。
發(fā)明人在實(shí)踐現(xiàn)有技術(shù)的過(guò)程中發(fā)現(xiàn),通過(guò)16進(jìn)制字節(jié)的字節(jié)值判斷該字節(jié)是否為漢字的字節(jié)的現(xiàn)有技術(shù)覆蓋的漢字面較窄,導(dǎo)致數(shù)據(jù)接端漢字識(shí)別的正確率較低。例如生僻字“高”的16進(jìn)制對(duì)為0xF3和0x7B ;如果采用現(xiàn)有方法進(jìn)行判斷,則表示“高”字的第二 16進(jìn)制字節(jié)0x7B的字節(jié)值小于128,則數(shù)據(jù)接收端會(huì)將該第二 16進(jìn)制字節(jié)0x7B作為一個(gè)非漢字字節(jié),從而導(dǎo)致數(shù)據(jù)接收端程序可能顯示亂碼甚至出現(xiàn)程序崩潰等問(wèn)題。發(fā)明內(nèi)容
本發(fā)明提供一種通信過(guò)程中漢字的處理方法裝置,用以提高通信過(guò)程中數(shù)據(jù)接收端漢字識(shí)別的正確率。
本發(fā)明提供了一種通信過(guò)程中漢字的處理方法,包括
在數(shù)據(jù)接收端接收到的通信數(shù)據(jù)中,確定需要進(jìn)行漢字處理的通信數(shù)據(jù)段,所述通信數(shù)據(jù)段中任一漢字采用一 16進(jìn)制對(duì)表示,任一 16進(jìn)制對(duì)包括一低字節(jié)和一高字節(jié);
確定所述通信數(shù)據(jù)段中表示漢字的字節(jié),包括從所述通信數(shù)據(jù)段包含的第一個(gè)字節(jié)開始,順次將每2個(gè)相鄰的字節(jié)作為一 16進(jìn)制對(duì),分別與預(yù)先統(tǒng)計(jì)的、表示漢字的16 進(jìn)制對(duì)范圍比較,并將落入所述表示漢字的16進(jìn)制對(duì)范圍的任一字節(jié),確定為表示漢字的一個(gè)字節(jié);
統(tǒng)計(jì)所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù),且在所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字;
所述表示漢字的16進(jìn)制對(duì)范圍包括第一、二區(qū)間,其低字節(jié)編碼范圍均是 0x81 OxAO且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxFF ;第三、四區(qū)間,其低字節(jié)編碼范圍均是OxAA OxAF且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO ;第五、六區(qū)間,其低字節(jié)編碼范圍均是OxBO 0xF7且高字節(jié)編碼范圍分別是0x40 0x7F和 0x7F OxFF ;和第七、八區(qū)間,其低字節(jié)編碼范圍均是0XF8 OxFE且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO ;八個(gè)區(qū)間均不包含邊界0x7F且均包含其它相應(yīng)邊界。
本發(fā)明還提供了一種通信過(guò)程中漢字的處理裝置,包括
通信數(shù)據(jù)段確定模塊,用于在數(shù)據(jù)接收端接收到的通信數(shù)據(jù)中,確定需要進(jìn)行漢字處理的通信數(shù)據(jù)段,所述通信數(shù)據(jù)段中任一漢字采用一 16進(jìn)制對(duì)表示,任一 16進(jìn)制對(duì)包括一低字節(jié)和一高字節(jié);
漢字字節(jié)確定模塊,用于確定所述通信數(shù)據(jù)段中表示漢字的字節(jié),包括從所述通信數(shù)據(jù)段包含的第一個(gè)字節(jié)開始,順次將每2個(gè)相鄰的字節(jié)作為一 16進(jìn)制對(duì),分別與預(yù)先統(tǒng)計(jì)的、表示漢字的16進(jìn)制對(duì)范圍比較,并將落入所述表示漢字的16進(jìn)制對(duì)范圍的任一字節(jié),確定為表示漢字的一個(gè)字節(jié);
統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù);
漢字識(shí)別模塊,用于在所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字;
所述表示漢字的16進(jìn)制對(duì)范圍包括第一、二區(qū)間,其低字節(jié)編碼范圍均是 0x81 OxAO且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxFF ;第三、四區(qū)間,其低字節(jié)編碼范圍均是OxAA OxAF且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO ;第五、六區(qū)間,其低字節(jié)編碼范圍均是OxBO 0xF7且高字節(jié)編碼范圍分別是0x40 0x7F和 0x7F OxFF ;和第七、八區(qū)間,其低字節(jié)編碼范圍均是0XF8 OxFE且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO ;八個(gè)區(qū)間均不包含邊界0x7F且均包含其它相應(yīng)邊界。
本發(fā)明提供的通信過(guò)程中漢字的處理方法和裝置中,通過(guò)對(duì)大量的常用字和生僻字等漢字的編碼預(yù)先統(tǒng)計(jì)得到的表示漢字的16進(jìn)制對(duì)范圍,來(lái)確定需要進(jìn)行漢字處理的通信數(shù)據(jù)段中表示漢字的字節(jié),提高了漢字字節(jié)識(shí)別的準(zhǔn)確性,從而提高了通信過(guò)程中數(shù)據(jù)接收端漢字識(shí)別的正確率、以及數(shù)據(jù)接收端的穩(wěn)定性和可靠性,降低了由于漢字識(shí)別錯(cuò)誤而給用戶帶來(lái)的損失。


為了更清楚地說(shuō)明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對(duì)實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對(duì)于本領(lǐng)域普通技術(shù)人員來(lái)講,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明一實(shí)施例提供的通信過(guò)程中漢字的處理方法流程圖2為本發(fā)明提供的表示漢字的16進(jìn)制對(duì)范圍的示意圖3為本發(fā)明提供的生僻字“高”字在16進(jìn)制對(duì)范圍中的位置示意圖4為本發(fā)明另一實(shí)施例提供的偏移填充處理方法的流程圖5為本發(fā)明又一實(shí)施例提供的通信過(guò)程中漢字的處理裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒(méi)有付出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
圖1為本發(fā)明一實(shí)施例提供的通信過(guò)程中漢字的處理方法流程圖。本實(shí)施例的實(shí)施主體不受限制,如可為數(shù)據(jù)接收端具有下述漢字處理功能的某一裝置。如圖1所示,本實(shí)施例提供的通信過(guò)程中漢字的處理方法包括
步驟11 從數(shù)據(jù)接收端接收到的通信數(shù)據(jù)中,確定需要進(jìn)行漢字處理的通信數(shù)據(jù)段,所述通信數(shù)據(jù)段中任一漢字采用一 16進(jìn)制對(duì)表示,任一 16進(jìn)制對(duì)包括一低字節(jié)和一高字節(jié)。
通信過(guò)程中,任一漢字的計(jì)算機(jī)編碼采用2個(gè)16進(jìn)制字節(jié)表示。這2個(gè)16進(jìn)制字節(jié)分別為一低字節(jié)和一高字節(jié),且這一低字節(jié)和一高字節(jié)即組成本發(fā)明所述的一 “ 16進(jìn)制對(duì)”。
步驟12 確定所述通信數(shù)據(jù)段中表示漢字的字節(jié),包括從所述通信數(shù)據(jù)段包含的第一個(gè)字節(jié)開始,順次將每2個(gè)相鄰的字節(jié)作為一 16進(jìn)制對(duì),分別與預(yù)先統(tǒng)計(jì)的、表示漢字的16進(jìn)制對(duì)范圍比較,并將落入所述表示漢字的16進(jìn)制對(duì)范圍的任一字節(jié),確定為表示漢字的一個(gè)字節(jié)。
發(fā)明人在實(shí)踐本發(fā)明過(guò)程中發(fā)現(xiàn),雖然通信過(guò)程中,每個(gè)漢字的計(jì)算機(jī)編碼采用2 個(gè)16進(jìn)制字節(jié)表示,但并不是任意2個(gè)16進(jìn)制字節(jié)都能組合表示一個(gè)漢字,因此,需要根據(jù)盡可能多的漢字的16進(jìn)制字節(jié)表示,統(tǒng)計(jì)表示漢字的16進(jìn)制對(duì)區(qū)域。發(fā)明人通過(guò)對(duì)大量的表示漢字的16進(jìn)制對(duì)任意組合匹配,從而獲得了表示這些漢字的16進(jìn)制對(duì)區(qū)域。該 16進(jìn)制對(duì)區(qū)域考慮的漢字覆蓋范圍廣,不僅包括了 GB2312-80收納的常用字,還包括眾多生僻字,是發(fā)明人在創(chuàng)造性勞動(dòng)的基礎(chǔ)上得到的漢字的計(jì)算機(jī)編碼表示規(guī)律,具有較好的普適性,可基本滿足通信過(guò)程的漢字處理需求。
圖2為本發(fā)明提供的表示漢字的16進(jìn)制對(duì)范圍的示意圖。圖2中,橫坐標(biāo)為低字節(jié)編碼范圍,縱坐標(biāo)為高字節(jié)編碼范圍;圖中陰影區(qū)域部分為統(tǒng)計(jì)得到的表示漢字的16進(jìn)制對(duì)范圍,即表示常用字及生僻字的編碼區(qū)域。如圖2所示,表示漢字的16進(jìn)制對(duì)范圍包括八個(gè)區(qū)間,分別為第一、二區(qū)間,其低字節(jié)編碼范圍均是0x81 OxAO且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxFF ;第三、四區(qū)間,其低字節(jié)編碼范圍均是OxAA OxAF且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO ;第五、六區(qū)間,其低字節(jié)編碼范圍均是OxBO 0xF7且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxFF ;和第七、八區(qū)間,其低字節(jié)編碼范圍均是0XF8 OxFE且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO。 上述八個(gè)區(qū)間均不包含邊界0x7F且均包含其它相應(yīng)邊界,如第一區(qū)間編碼范圍包括邊界 0x81、OxAO和0x40,但不包括邊界0x7F ;第二區(qū)間編碼范圍包括邊界0x81、OxAO和OxFF,但不包括邊界0x7F;以此類推。落入上述八個(gè)區(qū)間中的任一區(qū)間的字節(jié),即為表示漢字的字節(jié);否則為表示非漢字的字節(jié)。
具體的,在判斷通信數(shù)據(jù)段包含的字節(jié)是否是表示漢字的字節(jié)時(shí),需要根據(jù)上述表示漢字的16進(jìn)制對(duì)范圍,對(duì)通信數(shù)據(jù)段中包含的字節(jié)順次進(jìn)行判斷,每次判斷一 16進(jìn)制對(duì)且對(duì)該16進(jìn)制對(duì)中的每一字節(jié)分別進(jìn)行判斷,即將通信數(shù)據(jù)段中包含的字節(jié)順次每2個(gè)相鄰字節(jié)為一組作為一 16進(jìn)制對(duì),在該16進(jìn)制對(duì)中,第一個(gè)字節(jié)作為低字節(jié),第二個(gè)字節(jié)作為高字節(jié),判斷該16進(jìn)制對(duì)中的每一字節(jié)是否落入上述第一區(qū)間、第二區(qū)間、第三區(qū)間、第四區(qū)間、第五區(qū)間、第六區(qū)間、第七區(qū)間或第八區(qū)間;如果落入,則該16進(jìn)制對(duì)中的相應(yīng)字節(jié)即為表示漢字的字節(jié),否則為表示非漢字的字節(jié)。
步驟13 統(tǒng)計(jì)所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)。
本步驟還可統(tǒng)計(jì)所述通信數(shù)據(jù)段中表示非漢字的字節(jié)總個(gè)數(shù)。
步驟14 在所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
本步驟從所述通信數(shù)據(jù)段中第一個(gè)表示漢字的字節(jié)開始,順次將每2個(gè)相鄰的表示漢字的字節(jié)作為一 16進(jìn)制對(duì)進(jìn)行漢字識(shí)別,直至將所述通信數(shù)據(jù)段中所有表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。本步驟還可將所述通信數(shù)據(jù)段中表示非漢字的字節(jié)識(shí)別為相應(yīng)的非漢字字符。
本實(shí)施例提供的通信過(guò)程中漢字的處理方法,將數(shù)據(jù)接收端需要進(jìn)行漢字處理的通信數(shù)據(jù)段中字節(jié),按照預(yù)先統(tǒng)計(jì)得到的表示漢字的16進(jìn)制對(duì)范圍進(jìn)行比較,確定通信數(shù)據(jù)段中的字節(jié)哪些是表示漢字的字節(jié)以及表示漢字的字節(jié)總個(gè)數(shù),從而在表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)的情況下進(jìn)行漢字識(shí)別。該方法相對(duì)于通過(guò)判斷某一字節(jié)的字節(jié)值是否大于128,來(lái)判斷該字節(jié)是否為表示漢字的字節(jié)的現(xiàn)有技術(shù),提高了確定表示漢字字節(jié)的準(zhǔn)確性。
例如表示生僻字“高”字的16進(jìn)制對(duì)為0xF3和0x7B。如果采用上述現(xiàn)有技術(shù)的方法進(jìn)行判斷,由于“高”的第二個(gè)字節(jié)小于128,那么“高”字的第二個(gè)字節(jié)就會(huì)被當(dāng)作非漢字字節(jié),這顯然是錯(cuò)誤的,數(shù)據(jù)接收端可能出現(xiàn)亂碼甚至導(dǎo)致程序崩潰。但是采用本實(shí)施例提供的方法進(jìn)行判斷,由于“高”字的16進(jìn)制對(duì),就會(huì)落入上述表示漢字的16進(jìn)制對(duì)范圍的第三區(qū)間內(nèi),具體如圖3所示。這就保證將“高”字作為漢字進(jìn)行處理,提高了漢字字節(jié)識(shí)別的準(zhǔn)確性,從而提高了通信過(guò)程中數(shù)據(jù)接收端漢字識(shí)別的正確率。
此外,發(fā)明人在實(shí)踐本發(fā)明過(guò)程中還發(fā)現(xiàn),由于通信過(guò)程中,任一漢字采用2個(gè)16 進(jìn)制字節(jié),即一 16進(jìn)制對(duì)表示,這意味著該需要進(jìn)行漢字處理的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)理論上應(yīng)為偶數(shù)。但是,由于數(shù)據(jù)發(fā)送端和數(shù)據(jù)接收端所使用的通信協(xié)議可能存在差異,或者,數(shù)據(jù)接收端對(duì)通信數(shù)據(jù)的解析位置或者截取長(zhǎng)度可能出現(xiàn)偏差,或者,通信過(guò)程中可能存在數(shù)據(jù)丟失等原因,使得在實(shí)際應(yīng)用過(guò)程中,數(shù)據(jù)接收端統(tǒng)計(jì)得到的需要進(jìn)行漢字處理的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù),該情形下如果不對(duì)其不進(jìn)行處理或處理不當(dāng),在數(shù)據(jù)接收端程序可能出現(xiàn)亂碼甚至程序崩潰等問(wèn)題,從而給用戶帶來(lái)?yè)p失。
為了解決數(shù)據(jù)接收端統(tǒng)計(jì)得到的需要進(jìn)行漢字處理的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù)的問(wèn)題,本發(fā)明在上述實(shí)施例技術(shù)方案的基礎(chǔ)上,進(jìn)一步提出了優(yōu)化處理方法,不妨稱之為“偏移填充處理方法”,下面結(jié)合圖4進(jìn)行詳細(xì)描述。
圖4為本發(fā)明另一實(shí)施例提供的偏移填充處理方法的流程圖。本實(shí)施例是在上述實(shí)施例的基礎(chǔ)上,考慮當(dāng)數(shù)據(jù)接收端接收到的、需要進(jìn)行漢字處理的通信數(shù)據(jù)段中,包括表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù)的情況下,而進(jìn)行的優(yōu)化處理方法。如圖4所示,本實(shí)施例提供的偏移填充方法包括頁(yè)
步驟41 判斷數(shù)據(jù)接收端確定的需要進(jìn)行漢字處理的通信數(shù)據(jù)段(為便于描述, 該通信數(shù)據(jù)段以下不妨稱為“原通信數(shù)據(jù)段”)中,表示漢字的字節(jié)總個(gè)數(shù)是否為奇數(shù);如果是,則執(zhí)行步驟43,否則執(zhí)行步驟42。
步驟42 將原通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
本步驟還可將原通信數(shù)據(jù)段中表示非漢字的字節(jié)識(shí)別為相應(yīng)的非漢字字符。
步驟43 將原通信數(shù)據(jù)段整體左偏移一個(gè)字節(jié),并在原通信數(shù)據(jù)段的結(jié)尾處增加一個(gè)表示結(jié)束符的字節(jié),得到左偏移后的通信數(shù)據(jù)段;執(zhí)行步驟44。
本步驟中,表示結(jié)束符的字節(jié)例如‘\0’,其對(duì)應(yīng)的16進(jìn)制表示為‘0x00’。
步驟44 確定左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)、并統(tǒng)計(jì)左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù),判斷左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)是否為奇數(shù),如果是奇數(shù)則執(zhí)行步驟46,否則執(zhí)行步驟45。
本步驟中確定左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)的方法,與上述步驟12 中確定原通信數(shù)據(jù)段中表示漢字的字節(jié)的方法相似,在此不再贅述。本步驟還可確定左偏移后的通信數(shù)據(jù)段中表示非漢字的字節(jié)。
步驟45 將左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
本步驟還可將左偏移后的通信數(shù)據(jù)段中表示非漢字的字節(jié)識(shí)別為相應(yīng)的非漢字字符。
步驟46 將原通信數(shù)據(jù)段整體右偏移一個(gè)字節(jié),并在原通信數(shù)據(jù)段的起始處增加一個(gè)表示起始符的字節(jié),得到右偏移后的通信數(shù)據(jù)段;執(zhí)行步驟47。
本步驟中,表示起始符的字節(jié)例如空格。
步驟47 確定右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)、并統(tǒng)計(jì)右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù),判斷右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)是否為奇數(shù),如果為奇數(shù)則執(zhí)行步驟49,否則執(zhí)行步驟48。
本步驟中確定右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)的方法,與上述步驟12 中確定原通信數(shù)據(jù)段中表示漢字的字節(jié)的方法相似,在此不再贅述。本步驟還可確定右偏移后的通信數(shù)據(jù)段中表示非漢字的字節(jié)。
步驟48 將右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
本步驟還可將右偏移后的通信數(shù)據(jù)段中表示非漢字的字節(jié)識(shí)別為相應(yīng)的非漢字字符。
步驟49 將原通信數(shù)據(jù)段的最后一個(gè)表示漢字的字節(jié)置為一個(gè)表示結(jié)束符的字節(jié),得到修正后的通信數(shù)據(jù)段;將修正后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
本步驟中,表示結(jié)束符的字節(jié)例如‘\0’,其對(duì)應(yīng)的16進(jìn)制表示為‘0x00’。本步驟還可確定修正后的通信數(shù)據(jù)段中表示非漢字的字節(jié),并將修正后的通信數(shù)據(jù)段中表示非漢字的字節(jié),識(shí)別為相應(yīng)的非漢字字符。
在圖4所示的方法流程中,步驟43 步驟45為原通信數(shù)據(jù)段左偏移填充的處理步驟,步驟46 步驟48為原通信數(shù)據(jù)段右偏移填充的處理步驟,步驟49為原通信數(shù)據(jù)段修正填充的處理步驟。
需要說(shuō)明的是,原通信數(shù)據(jù)段左偏移填充的處理步驟和右偏移填充的處理步驟的執(zhí)行順序不受限制。圖4所示的方法流程中,是以先執(zhí)行左偏移填充的處理步驟而后執(zhí)行右偏移填充的處理步驟為例,進(jìn)行說(shuō)明的。此外,本發(fā)明還可先執(zhí)行右偏移填充的處理步驟而后執(zhí)行左偏移填充的處理步驟,即先執(zhí)行步驟46 步驟48后執(zhí)行步驟43 步驟45,在此不再贅述。進(jìn)一步的,上述偏移填充方法即可獨(dú)立執(zhí)行,也可結(jié)合圖1對(duì)應(yīng)實(shí)施例執(zhí)行, 這些均屬于本發(fā)明的保護(hù)范圍。
通信過(guò)程中通信數(shù)據(jù)的長(zhǎng)度通常是指定的,且在數(shù)據(jù)接收端對(duì)通信數(shù)據(jù)的解析位置或者截取長(zhǎng)度可能出現(xiàn)偏差,因此可能出現(xiàn)數(shù)據(jù)接收端需要進(jìn)行漢字處理的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù)調(diào)整為奇數(shù)的情形。采用本發(fā)明提供的偏移填充處理方法,可在數(shù)據(jù)接收端需要進(jìn)行漢字處理的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù)調(diào)整為奇數(shù)情形下,將該通信數(shù)據(jù)段的頭和/或尾進(jìn)行偏移填充或修正處理,以將通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)調(diào)整為偶數(shù)。實(shí)踐表明,該方法可有效提高漢字字節(jié)識(shí)別的準(zhǔn)確性,從而提高了通信過(guò)程中數(shù)據(jù)接收端漢字識(shí)別的正確率,降低由于漢字識(shí)別錯(cuò)誤而給用戶帶來(lái)的損失。
下面結(jié)合本發(fā)明在稅控領(lǐng)域的發(fā)票打印解決方案中的應(yīng)用為例進(jìn)行說(shuō)明。稅控領(lǐng)域中一種常用的發(fā)票打印解決方案為通過(guò)PC機(jī)與稅控器串口通信,完成發(fā)票打印與管理,以下不妨將該方案稱為“稅控器發(fā)票解決方案”。
在稅控器發(fā)票解決方案中,PC機(jī)與稅控器的通信數(shù)據(jù)中許多數(shù)據(jù)項(xiàng)目都會(huì)包含漢字,如果在數(shù)據(jù)接收端不對(duì)接收數(shù)據(jù)進(jìn)行漢字處理,就會(huì)引起數(shù)據(jù)接收端程序出現(xiàn)問(wèn)題,輕則出現(xiàn)亂碼,重則程序崩潰。由于稅控器發(fā)票解決方案針對(duì)發(fā)票種類繁多,這里只是列舉北京市服務(wù)業(yè)、娛樂(lè)業(yè)、文化體育業(yè)專用發(fā)票進(jìn)行舉例。在北京市服務(wù)業(yè)、娛樂(lè)業(yè)、文化體育業(yè)專用發(fā)票的發(fā)票票面中包括有收款單位,付款單位,項(xiàng)目名稱,金額大寫和收款員等包含漢字的項(xiàng)目。
對(duì)于該票樣的通信數(shù)據(jù)解決過(guò)程如下1)提煉出需要進(jìn)行漢字處理的通信數(shù)據(jù)段,這種通信數(shù)據(jù)段有收款單位,付款單位,項(xiàng)目名稱,金額大寫,收款員。2、根據(jù)圖2所示的表示漢字的16進(jìn)制對(duì)區(qū)域,確定提煉出的通信數(shù)據(jù)段中表示漢字和非漢字的字節(jié)及總個(gè)數(shù),具體方法如上述步驟11 步驟13所示,在此不再贅述。3)如果提煉出的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù),則將通信數(shù)據(jù)段中表示漢字的字節(jié)和/或表示非漢字的字節(jié),分別識(shí)別為相應(yīng)漢字和/或非漢字。4)如果提煉出的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù),對(duì)通信數(shù)據(jù)使用偏移填充算法進(jìn)行處理;具體如上述圖4對(duì)應(yīng)的流程所示, 在此不再贅述。
實(shí)踐表明,將本發(fā)明提供的方法應(yīng)用于稅控器發(fā)票解決方案中,可有效提高漢字字節(jié)識(shí)別的準(zhǔn)確性,從而提高了通信過(guò)程中數(shù)據(jù)接收端漢字識(shí)別的正確率,降低由于漢字識(shí)別錯(cuò)誤而給用戶帶來(lái)的損失。需要說(shuō)明的是,稅控領(lǐng)域僅僅為本發(fā)明提供技術(shù)方案的一個(gè)應(yīng)用實(shí)例,顯然本發(fā)明提供的技術(shù)方案還可應(yīng)用到通信過(guò)程中需要對(duì)漢字進(jìn)行處理的其他領(lǐng)域,在此不再贅述。
圖5為本發(fā)明又一實(shí)施例提供的通信過(guò)程中漢字的處理裝置的結(jié)構(gòu)示意圖。如圖 5所示,本實(shí)施例提供的通信過(guò)程中漢字的處理裝置包括通信數(shù)據(jù)段確定模塊51、漢字字節(jié)確定模塊52、統(tǒng)計(jì)模塊53和漢字識(shí)別模塊W。
通信數(shù)據(jù)段確定模塊51用于在數(shù)據(jù)接收端接收到的通信數(shù)據(jù)中,確定需要進(jìn)行漢字處理的通信數(shù)據(jù)段,所述通信數(shù)據(jù)段中任一漢字采用一 16進(jìn)制對(duì)表示,任一 16進(jìn)制對(duì)包括一低字節(jié)和一高字節(jié)。
漢字字節(jié)確定模塊52用于確定所述通信數(shù)據(jù)段中表示漢字的字節(jié),包括從所述通信數(shù)據(jù)段包含的第一個(gè)字節(jié)開始,順次將每2個(gè)相鄰的字節(jié)作為一 16進(jìn)制對(duì),分別與預(yù)先統(tǒng)計(jì)的、表示漢字的16進(jìn)制對(duì)范圍比較,并將落入所述表示漢字的16進(jìn)制對(duì)范圍的任一字節(jié),確定為表示漢字的一個(gè)字節(jié)。所述表示漢字的16進(jìn)制對(duì)范圍包括八個(gè)區(qū)間,分別為 第一、二區(qū)間,其低字節(jié)編碼范圍均是0x81 OxAO且高字節(jié)編碼范圍分別是0x40 0x7F 和0x7F OxFF ;第三、四區(qū)間,其低字節(jié)編碼范圍均是OxAA OxAF且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO ;第五、六區(qū)間,其低字節(jié)編碼范圍均是OxBO 0xF7且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxFF ;和第七、八區(qū)間,其低字節(jié)編碼范圍均是0XF8 OxFE且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO。上述八個(gè)區(qū)間均不包含邊界0x7F且均包含其它相應(yīng)邊界,如第一區(qū)間編碼范圍包括邊界0x81、0xA0和 0x40,但不包括邊界0x7F ;第二區(qū)間編碼范圍包括邊界0x81、0xA0和OxFF,但不包括邊界 0x7F;以此類推。
統(tǒng)計(jì)模塊53用于統(tǒng)計(jì)所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù);
漢字識(shí)別模塊M用于在所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。其中,將某一通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字,可具體為從該通信數(shù)據(jù)段中第一個(gè)表示漢字的字節(jié)開始,順次將每2個(gè)相鄰的表示漢字的字節(jié)作為一 16進(jìn)制對(duì)進(jìn)行漢字識(shí)別,直至將該通信數(shù)據(jù)段中所有表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
在上述技術(shù)方案的基礎(chǔ)上,可選的,所述裝置還可包括左偏移處理模塊和/或右偏移處理模塊。
左偏移處理模塊用于在所述通信數(shù)據(jù)段或右偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù)時(shí),將所述通信數(shù)據(jù)段整體左偏移一個(gè)字節(jié),并在所述通信數(shù)據(jù)段的結(jié)尾處增加一個(gè)表示結(jié)束符的字節(jié),得到左偏移后的通信數(shù)據(jù)段。
右偏移處理模塊用于在所述通信數(shù)據(jù)段或左偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù)時(shí),將所述通信數(shù)據(jù)段整體右偏移一個(gè)字節(jié),并在所述通信數(shù)據(jù)段的起始處增加一個(gè)表示起始符的字節(jié),得到右偏移后的通信數(shù)據(jù)段。
相應(yīng)的,漢字字節(jié)確定模塊還可用于確定所述左偏移后的通信數(shù)據(jù)段和/或所述右偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié);統(tǒng)計(jì)模塊還可用于統(tǒng)計(jì)所述左偏移后的通信數(shù)據(jù)段和/或所述右偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù);漢字識(shí)別模塊還可用于在所述左偏移后的通信數(shù)據(jù)段或所述右偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
進(jìn)一步的,所述裝置還可包括修正處理模塊。
修正處理模塊用于在所述右偏移后的通信數(shù)據(jù)段和所述左偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù)都為奇數(shù)時(shí),將所述通信數(shù)據(jù)段的最后一個(gè)表示漢字的字節(jié)置為一個(gè)表示結(jié)束符的字節(jié),得到修正后的通信數(shù)據(jù)段。相應(yīng)的,漢字識(shí)別模塊還可用于將所述修正后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
本發(fā)明提供的通信過(guò)程中漢字的處理裝置中,通過(guò)漢字字節(jié)確定模塊按照預(yù)先統(tǒng)計(jì)得到的表示漢字的16進(jìn)制對(duì)范圍,來(lái)確定需要進(jìn)行漢字處理的通信數(shù)據(jù)段中表示漢字的字節(jié),提高了漢字字節(jié)識(shí)別的準(zhǔn)確性,從而提高了通信過(guò)程中數(shù)據(jù)接收端漢字識(shí)別的正確率。進(jìn)一步的,該裝置還可通過(guò)左偏移處理模塊、右偏移處理模塊和/或修正處理模塊, 對(duì)通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù)的情形進(jìn)行優(yōu)化處理,以保證優(yōu)化處理后表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù),從而進(jìn)一步提高了通信過(guò)程中數(shù)據(jù)接收端漢字識(shí)別的正確率,降低由于漢字識(shí)別錯(cuò)誤而給用戶帶來(lái)的損失。
需要說(shuō)明的是,本發(fā)明提供的通信過(guò)程中漢字的處理裝置的表現(xiàn)實(shí)體不受限制, 如可具體為某一數(shù)據(jù)接收端設(shè)備等,其工作機(jī)理可參見本發(fā)明提供的方法實(shí)施例的相應(yīng)記載,在此不再贅述。
本領(lǐng)域普通技術(shù)人員可以理解附圖只是一個(gè)實(shí)施例的示意圖,附圖中的模塊或流程并不一定是實(shí)施本發(fā)明所必須的。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)施例中的裝置中的模塊可以按照實(shí)施例描述分布于實(shí)施例的裝置中,也可以進(jìn)行相應(yīng)變化位于不同于本實(shí)施例的一個(gè)或多個(gè)裝置中。上述實(shí)施例的模塊可以合并為一個(gè)模塊,也可以進(jìn)一步拆分成多個(gè)子模塊。
上述本發(fā)明實(shí)施例序號(hào)僅僅為了描述,不代表實(shí)施例的優(yōu)劣。
本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括R0M、RAM、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
最后應(yīng)說(shuō)明的是以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解其依然可以對(duì)前述實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換; 而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明實(shí)施例技術(shù)方案的精神和范圍。
權(quán)利要求
1.一種通信過(guò)程中漢字的處理方法,其特征在于,包括在數(shù)據(jù)接收端接收到的通信數(shù)據(jù)中,確定需要進(jìn)行漢字處理的通信數(shù)據(jù)段,所述通信數(shù)據(jù)段中任一漢字采用一 16進(jìn)制對(duì)表示,任一 16進(jìn)制對(duì)包括一低字節(jié)和一高字節(jié);確定所述通信數(shù)據(jù)段中表示漢字的字節(jié),包括從所述通信數(shù)據(jù)段包含的第一個(gè)字節(jié)開始,順次將每2個(gè)相鄰的字節(jié)作為一 16進(jìn)制對(duì),分別與預(yù)先統(tǒng)計(jì)的、表示漢字的16進(jìn)制對(duì)范圍比較,并將落入所述表示漢字的16進(jìn)制對(duì)范圍的任一字節(jié),確定為表示漢字的一個(gè)字節(jié);統(tǒng)計(jì)所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù),且在所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字;所述表示漢字的16進(jìn)制對(duì)范圍包括第一、二區(qū)間,其低字節(jié)編碼范圍均是0x81 OxAO且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxFF ;第三、四區(qū)間,其低字節(jié)編碼范圍均是OxAA OxAF且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO ;第五、 六區(qū)間,其低字節(jié)編碼范圍均是OxBO 0xF7且高字節(jié)編碼范圍分別是0x40 0x7F和 0x7F OxFF ;和第七、八區(qū)間,其低字節(jié)編碼范圍均是0XF8 OxFE且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO ;八個(gè)區(qū)間均不包含邊界0x7F且均包含其它相應(yīng)邊界。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,將所述通信數(shù)據(jù)段中所述表示漢字的字節(jié)識(shí)別為相應(yīng)漢字,包括從所述通信數(shù)據(jù)段中第一個(gè)表示漢字的字節(jié)開始,順次將每2個(gè)相鄰的表示漢字的字節(jié)作為一 16進(jìn)制對(duì)進(jìn)行漢字識(shí)別,直至將所述通信數(shù)據(jù)段中所有表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括在所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù)時(shí),將所述通信數(shù)據(jù)段整體左偏移一個(gè)字節(jié),并在所述通信數(shù)據(jù)段的結(jié)尾處增加一個(gè)表示結(jié)束符的字節(jié),得到左偏移后的通信數(shù)據(jù)段;確定所述左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)、并統(tǒng)計(jì)所述左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù),且在所述左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述方法還包括在所述左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù)時(shí),將所述通信數(shù)據(jù)段整體右偏移一個(gè)字節(jié),并在所述通信數(shù)據(jù)段的起始處增加一個(gè)表示起始符的字節(jié),得到右偏移后的通信數(shù)據(jù)段;確定所述右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)、并統(tǒng)計(jì)所述右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù),且在所述右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括在所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù)時(shí),將所述通信數(shù)據(jù)段整體右偏移一個(gè)字節(jié),并在所述通信數(shù)據(jù)段的起始處增加一個(gè)表示起始符的字節(jié),得到右偏移后的通信數(shù)據(jù)段;確定所述右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)、并統(tǒng)計(jì)所述右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù),且在所述右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述方法還包括在所述右偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù)時(shí),將所述通信數(shù)據(jù)段整體左偏移一個(gè)字節(jié),并在所述通信數(shù)據(jù)段的結(jié)尾處增加一個(gè)表示結(jié)束符的字節(jié),得到左偏移后的通信數(shù)據(jù)段;確定所述左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)、并統(tǒng)計(jì)所述左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù),且在所述左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
7.根據(jù)權(quán)利要求4或6所述的方法,其特征在于,所述方法還包括在所述右偏移后的通信數(shù)據(jù)段和所述左偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù)都為奇數(shù)時(shí),將所述通信數(shù)據(jù)段的最后一個(gè)表示漢字的字節(jié)置為一個(gè)表示結(jié)束符的字節(jié),得到修正后的通信數(shù)據(jù)段;將所述修正后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
8.一種通信過(guò)程中漢字的處理裝置,其特征在于,包括通信數(shù)據(jù)段確定模塊,用于在數(shù)據(jù)接收端接收到的通信數(shù)據(jù)中,確定需要進(jìn)行漢字處理的通信數(shù)據(jù)段,所述通信數(shù)據(jù)段中任一漢字采用一 16進(jìn)制對(duì)表示,任一 16進(jìn)制對(duì)包括一低字節(jié)和一高字節(jié);漢字字節(jié)確定模塊,用于確定所述通信數(shù)據(jù)段中表示漢字的字節(jié),包括從所述通信數(shù)據(jù)段包含的第一個(gè)字節(jié)開始,順次將每2個(gè)相鄰的字節(jié)作為一 16進(jìn)制對(duì),分別與預(yù)先統(tǒng)計(jì)的、表示漢字的16進(jìn)制對(duì)范圍比較,并將落入所述表示漢字的16進(jìn)制對(duì)范圍的任一字節(jié), 確定為表示漢字的一個(gè)字節(jié);統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù);漢字識(shí)別模塊,用于在所述通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字;所述表示漢字的16進(jìn)制對(duì)范圍包括第一、二區(qū)間,其低字節(jié)編碼范圍均是0x81 OxAO且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxFF ;第三、四區(qū)間,其低字節(jié)編碼范圍均是OxAA OxAF且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO ;第五、 六區(qū)間,其低字節(jié)編碼范圍均是OxBO 0xF7且高字節(jié)編碼范圍分別是0x40 0x7F和 0x7F OxFF ;和第七、八區(qū)間,其低字節(jié)編碼范圍均是0XF8 OxFE且高字節(jié)編碼范圍分別是0x40 0x7F和0x7F OxAO ;八個(gè)區(qū)間均不包含邊界0x7F且均包含其它相應(yīng)邊界。
9.根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述裝置還包括左偏移處理模塊和/或右偏移處理模塊;所述左偏移處理模塊,用于在所述通信數(shù)據(jù)段或右偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù)時(shí),將所述通信數(shù)據(jù)段整體左偏移一個(gè)字節(jié),并在所述通信數(shù)據(jù)段的結(jié)尾處增加一個(gè)表示結(jié)束符的字節(jié),得到左偏移后的通信數(shù)據(jù)段;所述右偏移處理模塊,用于在所述通信數(shù)據(jù)段或左偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù)為奇數(shù)時(shí),將所述通信數(shù)據(jù)段整體右偏移一個(gè)字節(jié),并在所述通信數(shù)據(jù)段的起始處增加一個(gè)表示起始符的字節(jié),得到右偏移后的通信數(shù)據(jù)段;所述漢字字節(jié)確定模塊,還用于確定所述左偏移后的通信數(shù)據(jù)段和/或所述右偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié);所述統(tǒng)計(jì)模塊,還用于統(tǒng)計(jì)所述左偏移后的通信數(shù)據(jù)段和/或所述右偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù);所述漢字識(shí)別模塊,還用于在所述左偏移后的通信數(shù)據(jù)段或所述右偏移后的通信數(shù)據(jù)段中,表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將所述左偏移后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
10.根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括 修正處理模塊,用于在所述右偏移后的通信數(shù)據(jù)段和所述左偏移后的通信數(shù)據(jù)段中, 表示漢字的字節(jié)總個(gè)數(shù)都為奇數(shù)時(shí),將所述通信數(shù)據(jù)段的最后一個(gè)表示漢字的字節(jié)置為一個(gè)表示結(jié)束符的字節(jié),得到修正后的通信數(shù)據(jù)段;所述漢字識(shí)別模塊,還用于將所述修正后的通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。
全文摘要
本發(fā)明涉及一種通信過(guò)程中漢字的處理方法和裝置。其中,方法包括在數(shù)據(jù)接收端接收到的通信數(shù)據(jù)中,確定需要進(jìn)行漢字處理的通信數(shù)據(jù)段,通信數(shù)據(jù)段中任一漢字采用一16進(jìn)制對(duì)表示,任一16進(jìn)制對(duì)包括一低字節(jié)和一高字節(jié);從通信數(shù)據(jù)段包含的第一個(gè)字節(jié)開始,順次將每2個(gè)相鄰的字節(jié)作為一16進(jìn)制對(duì),分別與預(yù)先統(tǒng)計(jì)的、表示漢字的16進(jìn)制對(duì)范圍比較,并將落入表示漢字的16進(jìn)制對(duì)范圍的任一字節(jié),確定為表示漢字的一個(gè)字節(jié);統(tǒng)計(jì)通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù),且在通信數(shù)據(jù)段中表示漢字的字節(jié)總個(gè)數(shù)為偶數(shù)時(shí),將通信數(shù)據(jù)段中表示漢字的字節(jié)識(shí)別為相應(yīng)漢字。本發(fā)明提高了通信過(guò)程中數(shù)據(jù)接收端漢字識(shí)別的正確率、及數(shù)據(jù)接收端的穩(wěn)定性和可靠性。
文檔編號(hào)G06F17/22GK102541822SQ20101059902
公開日2012年7月4日 申請(qǐng)日期2010年12月21日 優(yōu)先權(quán)日2010年12月21日
發(fā)明者付立庫(kù), 何陽(yáng), 唐日升, 張偉, 張曉佳, 郭東明, 陳懿, 陳皓, 韓寶成 申請(qǐng)人:航天信息股份有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
城市| 肃南| 天台县| 桑植县| 名山县| 稷山县| 普定县| 梅州市| 宽甸| 观塘区| 皋兰县| 柘荣县| 赤峰市| 苍梧县| 隆安县| 濮阳县| 徐水县| 河南省| 达孜县| 甘肃省| 织金县| 榆树市| 郧西县| 蒲江县| 新泰市| 罗田县| 慈溪市| 毕节市| 扶余县| 通榆县| 巴马| 黔东| 太湖县| 家居| 蓝田县| 黑水县| 常德市| 琼结县| 通化市| 疏附县| 临沭县|