欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用于郵政分揀系統(tǒng)的郵政編碼識別方法

文檔序號:6578240閱讀:397來源:國知局
專利名稱:一種用于郵政分揀系統(tǒng)的郵政編碼識別方法
技術(shù)領域
本發(fā)明屬于郵政技術(shù)領域,特別涉及一種用于郵政分揀系統(tǒng)的郵政編碼識別方法。
背景技術(shù)
郵政編碼的識別是郵政自動分揀設備能準確分揀函件的核心。目前對于郵政編碼識別的算法均基于傳統(tǒng)的單個數(shù)字的識別,假設每類數(shù)字是均衡分布的,沒有考慮在郵政編碼中各類數(shù)字出現(xiàn)的頻次。然而在郵政編碼中,每類數(shù)字的分布不是均衡的,尤其是本口分揀中,由于處理的都是當?shù)匦藕?,郵政編碼中的前幾位有很大的重復性,數(shù)字類別分布的不均衡現(xiàn)象尤其明顯,因此郵政編碼的識別也是一種類別不均衡問題,需要適合的方法來降低類別分布不均衡帶來的影響,提高自動信函分揀系統(tǒng)的性能。近年來,類別不均衡分布問題已經(jīng)被意識到是機器學習和數(shù)據(jù)挖掘領域的一個非常重要的問題。人們已經(jīng)對類別不平衡問題進行了大量的研究,但是一直沒有成熟有效的解決方案。

發(fā)明內(nèi)容
本發(fā)明目的是提供一種用于郵政分揀系統(tǒng)的郵政編碼識別方法,以解決現(xiàn)有技術(shù)中郵政分揀系統(tǒng)的郵政編碼識別難題。本發(fā)明的原理是基于研究表明,基于類別不平衡數(shù)據(jù)集的分類器學習和錯識代價不相同或未知情況下分類器的學習可以用相似的方式來實現(xiàn),而代價敏感學習是這類問題的一個很好的解決方案。本發(fā)明的技術(shù)方案是,一種用于郵政分揀系統(tǒng)的郵政編碼識別方法,包括以下步驟根據(jù)郵政分揀系統(tǒng)提供的名址庫統(tǒng)計所在地域的郵政編碼的數(shù)字字符的分布情況,具體統(tǒng)計所涵蓋的所有郵政編碼中每類數(shù)字的出現(xiàn)次數(shù),統(tǒng)計表I如下所示,表I
權(quán)利要求
1.一種用于郵政分揀系統(tǒng)的郵政編碼識別方法,其特征在于,包括以下步驟 根據(jù)郵政分揀系統(tǒng)提供的名址庫統(tǒng)計所在地域的郵政編碼的數(shù)字字符的分布情況,具體統(tǒng)計所涵蓋的所有郵政編碼中每類數(shù)字的出現(xiàn)次數(shù),統(tǒng)計表如下所示,
全文摘要
本發(fā)明公開了一種適用于郵政本口分揀的郵政編碼識別方法,統(tǒng)計分揀系統(tǒng)所在地域的郵政編碼的數(shù)字字符的分布情況,確定出現(xiàn)次數(shù)最少的數(shù)字字符c,設數(shù)字字符c的錯分代價為1,即Cost[c]=1,其他類別數(shù)字的錯分代價Cost[i]根據(jù)類別的分布統(tǒng)計數(shù)據(jù)進行計算,根據(jù)計算出的所有類別的錯分代價得到適用于本地域的代價敏感矩陣Cost。采集大數(shù)量的郵政編碼組成郵政編碼數(shù)字字符圖像樣本庫,在該樣本庫中利用所述的錯誤代價矩陣采集訓練樣本集,根據(jù)所述的代價敏感矩陣,為錯分代價最小的類別c選取訓練樣本Mc個,其他類別的訓練樣本個數(shù)Mi根據(jù)代價敏感矩陣Cost及Mc進行計算得到,用該訓練樣本集對支持向量機分類器進行訓練,然后用訓練好的支持向量機分類器對郵政編碼進行識別。
文檔編號G06K9/62GK103049759SQ20121054503
公開日2013年4月17日 申請日期2012年12月14日 優(yōu)先權(quán)日2012年12月14日
發(fā)明者呂淑靜, 呂岳 申請人:上海郵政科學研究院
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
金华市| 湘阴县| 南江县| 白山市| 武山县| 监利县| 建宁县| 利川市| 平罗县| 辛集市| 谢通门县| 大庆市| 闽清县| 留坝县| 宁化县| 石景山区| 阿巴嘎旗| 柯坪县| 哈尔滨市| 丰城市| 高雄县| 武陟县| 嘉黎县| 海晏县| 大名县| 东光县| 营山县| 大新县| 同德县| 湄潭县| 津南区| 略阳县| 乌拉特后旗| 柞水县| 合肥市| 沽源县| 山阴县| 稷山县| 临西县| 广安市| 呼和浩特市|