欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種發(fā)票字條自動定位的方法及裝置的制造方法

文檔序號:9350822閱讀:377來源:國知局
一種發(fā)票字條自動定位的方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及發(fā)票識別領(lǐng)域,特別涉及一種發(fā)票字條自動定位的方法及裝置。
【背景技術(shù)】
[0002]在進(jìn)行發(fā)票識別時,發(fā)票識別相對于其他素材的識別,其識別格式非常多。因為發(fā)票識別需要一個自動化系統(tǒng),能夠自動化定位字條的位置,但目前還不能做到對發(fā)票字條的自動定位。傳統(tǒng)技術(shù)中,在對發(fā)票字條進(jìn)行定位時,通常在尋找最優(yōu)的字條的時,系統(tǒng)會對每種發(fā)票格式進(jìn)行運算和匹配,引起大量的計算,導(dǎo)致系統(tǒng)計算時間大量上漲,造成對發(fā)票字條的定位速度較慢,定位效率較低。

【發(fā)明內(nèi)容】

[0003]本發(fā)明要解決的技術(shù)問題在于,針對現(xiàn)有技術(shù)的上述對發(fā)票字條的定位速度較慢、定位效率較低的缺陷,提供一種對發(fā)票字條的定位速度較快、定位效率較高的發(fā)票字條自動定位的方法及裝置。
[0004]本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:構(gòu)造一種發(fā)票字條自動化定位的方法,包括如下步驟:
[0005]A)建立訓(xùn)練數(shù)據(jù)庫,收集各種不同格式的發(fā)票并保存到所述訓(xùn)練數(shù)據(jù)庫中;所述發(fā)票包括多個字條;
[0006]B)對所述訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票中的每個字條進(jìn)行包圍盒及文字內(nèi)容的標(biāo)記;
[0007]C)接收需要識別的發(fā)票,遍歷所述訓(xùn)練數(shù)據(jù)庫中所有格式的發(fā)票,并將每種格式的發(fā)票上面標(biāo)記的包圍盒分別套用到所述需要識別的發(fā)票上;
[0008]D)對套用在所述需要識別的發(fā)票上的包圍盒進(jìn)行識別并得到包圍盒識別結(jié)果;
[0009]E)根據(jù)所述包圍盒識別結(jié)果,分別計算所述訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票的分?jǐn)?shù),并將分?jǐn)?shù)最高的發(fā)票的格式作為所述需要識別的發(fā)票的格式。
[0010]在本發(fā)明所述的發(fā)票字條自動化定位的方法中,在所述步驟D)中,使用開源0CR(光學(xué)字符識別)識別引擎對套用在所述需要識別的發(fā)票上的包圍盒進(jìn)行識別。
[0011]在本發(fā)明所述的發(fā)票字條自動化定位的方法中,在所述步驟B)和步驟C)之間還包括:
[0012]CO)計算所述訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票中每個字條的字符的出現(xiàn)概率。
[0013]在本發(fā)明所述的發(fā)票字條自動化定位的方法中,所述步驟E)進(jìn)一步包括:
[0014]El)計算出當(dāng)前包圍盒識別結(jié)果中每個字符的出現(xiàn)概率及其數(shù)量的乘積;
[0015]E2)將所述每個字符的出現(xiàn)概率及其數(shù)量的乘積進(jìn)行相加得到所述當(dāng)前包圍盒的分?jǐn)?shù);
[0016]E3)找到所述當(dāng)前包圍盒所在的發(fā)票中剩余的包圍盒,并按照所述步驟El)和E2)的方式分別計算所述剩余包圍盒的分?jǐn)?shù);
[0017]E4)將每個所述包圍盒的分?jǐn)?shù)進(jìn)行相加后除以所述包圍盒的個數(shù),得到當(dāng)前格式的發(fā)票的分?jǐn)?shù);
[0018]E5)判斷是否遍歷所述訓(xùn)練數(shù)據(jù)庫中所有格式的發(fā)票,如是,找到分?jǐn)?shù)最高的發(fā)票,并將所述分?jǐn)?shù)最高的發(fā)票的格式作為所述需要識別的發(fā)票的格式;否則,找到下一種格式的發(fā)票中的包圍盒,并返回所述步驟El)。
[0019]在本發(fā)明所述的發(fā)票字條自動化定位的方法中,所述不同格式的發(fā)票為每種格式的發(fā)票中字條的分布位置不同。
[0020]本發(fā)明還涉及一種實現(xiàn)上述發(fā)票字條自動化定位的方法的裝置,包括:
[0021]訓(xùn)練數(shù)據(jù)庫建立單元:用于建立訓(xùn)練數(shù)據(jù)庫,收集各種不同格式的發(fā)票并保存到所述訓(xùn)練數(shù)據(jù)庫中;所述發(fā)票包括多個字條;
[0022]標(biāo)記單元:用于對所述訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票中的每個字條進(jìn)行包圍盒及文字內(nèi)容的標(biāo)記;
[0023]套用單元:用于接收需要識別的發(fā)票,遍歷所述訓(xùn)練數(shù)據(jù)庫中所有格式的發(fā)票,并將每種格式的發(fā)票上面標(biāo)記的包圍盒分別套用到所述需要識別的發(fā)票上;
[0024]識別單元:用于對套用在所述需要識別的發(fā)票上的包圍盒進(jìn)行識別并得到包圍盒識別結(jié)果;
[0025]字條定位單元:用于根據(jù)所述包圍盒識別結(jié)果,分別計算所述訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票的分?jǐn)?shù),并將分?jǐn)?shù)最高的發(fā)票的格式作為所述需要識別的發(fā)票的格式。
[0026]在本發(fā)明所述的裝置中,在所述識別單元中,使用開源OCR識別引擎對套用在所述需要識別的發(fā)票上的包圍盒進(jìn)行識別。
[0027]在本發(fā)明所述的裝置中,還包括:
[0028]字符出現(xiàn)概率計算單元:用于計算所述訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票中每個字條的字符的出現(xiàn)概率。
[0029]在本發(fā)明所述的裝置中,所述字條定位單元進(jìn)一步包括:
[0030]乘積計算模塊:用于計算出當(dāng)前包圍盒識別結(jié)果中每個字符的出現(xiàn)概率及其數(shù)量的乘積;
[0031]當(dāng)前包圍盒獲取模塊:用于將所述每個字符的出現(xiàn)概率及其數(shù)量的乘積進(jìn)行相加得到所述當(dāng)前包圍盒的分?jǐn)?shù);
[0032]剩余包圍盒分?jǐn)?shù)計算模塊:用于找到所述當(dāng)前包圍盒所在的發(fā)票中剩余的包圍盒,并按照所述乘積計算模塊和當(dāng)前包圍盒獲取模塊的方式分別計算所述剩余包圍盒的分?jǐn)?shù);
[0033]當(dāng)前發(fā)票分?jǐn)?shù)獲取模塊:用于將每個所述包圍盒的分?jǐn)?shù)進(jìn)行相加后除以所述包圍盒的個數(shù),得到當(dāng)前格式的發(fā)票的分?jǐn)?shù);
[0034]遍歷判斷模塊:用于判斷是否遍歷所述訓(xùn)練數(shù)據(jù)庫中所有格式的發(fā)票,如是,找到分?jǐn)?shù)最高的發(fā)票,并將所述分?jǐn)?shù)最高的發(fā)票的格式作為所述需要識別的發(fā)票的格式;否則,找到下一種格式的發(fā)票中的包圍盒。
[0035]在本發(fā)明所述的裝置中,所述不同格式的發(fā)票為每種格式的發(fā)票中字條的分布位置不同。
[0036]實施本發(fā)明的發(fā)票字條自動定位的方法及裝置,具有以下有益效果:由于通過收集各種不同格式的發(fā)票并保存到訓(xùn)練數(shù)據(jù)庫中,對訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票中的每個字條進(jìn)行包圍盒及文字內(nèi)容的標(biāo)記;將每種格式的發(fā)票上面標(biāo)記的包圍盒分別套用到需要識別的發(fā)票上;根據(jù)對包圍盒識別結(jié)果,分別計算訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票的分?jǐn)?shù),并將分?jǐn)?shù)最高的發(fā)票的格式作為需要識別的發(fā)票的格式,這樣就能得到需要識別的發(fā)票上每個字條位置和類別,其不再需要對每種發(fā)票格式進(jìn)行運算和匹配,這樣會大大減小計算量,所以其對發(fā)票字條的定位速度較快、定位效率較高。
【附圖說明】
[0037]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0038]圖1為本發(fā)明發(fā)票字條自動定位的方法及裝置一個實施例中方法的流程圖;
[0039]圖2為所述實施例中根據(jù)包圍盒識別結(jié)果,分別計算訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票的分?jǐn)?shù),并將分?jǐn)?shù)最高的發(fā)票的格式作為需要識別的發(fā)票的格式的具體流程圖;
[0040]圖3為所述實施例中裝置的結(jié)構(gòu)示意圖。
【具體實施方式】
[0041]下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動的前提下所獲得的所有其他實施例,都屬于本發(fā)明保護(hù)的范圍。
[0042]在本發(fā)明發(fā)票字條自動化定位的方法及裝置實施例中,其發(fā)票字條自動化定位的方法的流程圖如圖1所示。圖1中,該發(fā)票字條自動化定位的方法包括如下步驟:
[0043]步驟SOl建立訓(xùn)練數(shù)據(jù)庫,收集各種不同格式的發(fā)票并保存到訓(xùn)練數(shù)據(jù)庫中:本步驟中,建立訓(xùn)練數(shù)據(jù)庫,收集各種不同格式的發(fā)票并保存到訓(xùn)練數(shù)據(jù)庫中,值得一提的是,發(fā)票包括多個字條,例如:字條可以是發(fā)票抬頭、發(fā)票代碼、發(fā)票號碼、發(fā)票金額、開票日期或開票人中的幾個或全部;利用訓(xùn)練數(shù)據(jù)庫中的發(fā)票格式可以對字條進(jìn)行定位。不同格式的發(fā)票指的是每種格式的發(fā)票中字條的分布位置不同。例如:如果第一張發(fā)票中各個字條的分布位置和第二張發(fā)票中各個字條的分布位置不一樣,這樣就把第一張發(fā)票和第二張發(fā)票認(rèn)為是不同格式的發(fā)票。
[0044]步驟S02對訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票中的每個字條進(jìn)行包圍盒及文字內(nèi)容的標(biāo)記:本步驟中,對訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票中的每個字條進(jìn)行包圍盒及文字內(nèi)容的標(biāo)記,具體來講,對訓(xùn)練數(shù)據(jù)庫中每種格式的發(fā)票中的每個字條分別畫一個外框,這
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
长兴县| 浮梁县| 玉环县| 文安县| 明溪县| 潞城市| 常宁市| 娄烦县| 宝兴县| 乌兰县| 城固县| 余姚市| 黔南| 南涧| 楚雄市| 织金县| 安顺市| 本溪| 达州市| 鹤岗市| 临沂市| 邵武市| 隆化县| 惠州市| 古交市| 都匀市| 浠水县| 綦江县| 枝江市| 进贤县| 鹿泉市| 颍上县| 普定县| 石棉县| 曲阳县| 友谊县| 中牟县| 汉阴县| 射阳县| 丰顺县| 赣榆县|