專利名稱:帳票識別方法
技術(shù)領(lǐng)域:
本發(fā)明涉及在讀取多種帳票時(shí),在帳票處理之前識別讀取的帳票種類的帳票識別方法以及登錄識別了的帳票的帳票登錄方法,特別是,涉及能夠?qū)τ趲て钡姆较蚧蛘呱炜s、傾斜,穩(wěn)定地識別帳票的種類的帳票識別方法以及帳票登錄方法。
作為上述的帳票識別的特征量利用格的現(xiàn)有技術(shù)中,例如已知在特開昭61-59568號公報(bào)中等記載的技術(shù)。該現(xiàn)有技術(shù)通過使用帳票內(nèi)的橫線以及縱線進(jìn)行帳票的結(jié)構(gòu)分析,識別帳票種類。
另外,作為用點(diǎn)座標(biāo)來反映帳票識別的特征量并進(jìn)行對照的現(xiàn)有技術(shù),例如已知在特開昭62-184585號公報(bào)等中記載的技術(shù)。該現(xiàn)有技術(shù)是把由點(diǎn)集合構(gòu)成的圖形進(jìn)行對照的方法,通過求用于檢測2個(gè)點(diǎn)集合的相似性的對照程度,或者,以被分割為橫方向以及縱方向的小區(qū)域的塊單位高速地求對照程度,識別帳票的種類。另外,例如,在特開平8-25236號公報(bào)中,公開了作為把框的中心點(diǎn)作為特征量,根據(jù)以橫方向以及縱方向?yàn)榛A(chǔ)的混列表進(jìn)行對照的方法,進(jìn)而,在特開2000-339406號公報(bào)中,公開了從橫方向以及列方向的連接關(guān)系求帳票內(nèi)的最小矩形的位置關(guān)系,決定最小矩形的屬性的方法。
另外,作為特征量利用文字行的位置的現(xiàn)有技術(shù),例如已知在特開平7-114616號公報(bào)等中記載的技術(shù)。該現(xiàn)有技術(shù)為了識別治療收費(fèi)申請明細(xì)書的樣式,根據(jù)抽取出的文字行的位置進(jìn)行帳票識別。
進(jìn)而,作為對于由于帳票的伸縮或者格的掠過等,抽取出帳票內(nèi)的各個(gè)矩形不穩(wěn)定的帳票的帳票識別的現(xiàn)有技術(shù),例如已知在特開2000-306030號公報(bào)中記載的技術(shù)。該現(xiàn)有技術(shù)把一致的矩形的座標(biāo)作為下一次對照的矩形的基準(zhǔn)點(diǎn),使基準(zhǔn)點(diǎn)順序移動進(jìn)行對照。
以往,作為檢索具有相似性質(zhì)的圖像的方法,例如已知有在「日本工業(yè)出版,圖像研究,第11卷9號第5頁~第9頁,2000年9月,著作者名武者義則,廣池敦」中公開的技術(shù)。該現(xiàn)有技術(shù)從圖像抽取出圖像特征矢量,在其矢量彼此之間的距離中從密鑰圖像收集接近的圖像,作為圖像特征矢量,使用紅綠藍(lán)的三原色空間中的顏色特征量和輝度圖像的明暗移動變化的微分方程特征量。但是,該現(xiàn)有技術(shù)并沒有考慮到有關(guān)在帳票圖像中特有的格或者文字行、框的特征。
另外,以往作為用于個(gè)人識別的指紋對照方法,例如,已知在特開2000-293688號公報(bào)等中記載的技術(shù)。該現(xiàn)有技術(shù)把輸入的指紋圖像的特征信息與預(yù)先存儲的指紋圖像的特征信息進(jìn)行對照,以及,把特征信息的某一方旋轉(zhuǎn)成倒立狀態(tài)或者正交狀態(tài)對照指紋。但是,該現(xiàn)有技術(shù)沒有關(guān)于在帳票圖像中特有的格或者文字行、框的特征的考慮。
另外,以往,作為檢測文書的旋轉(zhuǎn)角的方法,例如,已知在特開平6-103411號公報(bào)等中記載的技術(shù)。該現(xiàn)有技術(shù)使文書旋轉(zhuǎn)0度,90度,180度,270度,分別進(jìn)行文字識別,把其中最正確文書的旋轉(zhuǎn)角決定為文書的方向。但是,該現(xiàn)有技術(shù)為了檢測帳票的方向,以各個(gè)角度進(jìn)行文字識別,具有在文字識別方面需要花費(fèi)處理時(shí)間的問題,而且,并沒有考慮到識別帳票的種類。
另外,以往,作為識別帳票的同時(shí),還識別帳票的90度單位的旋轉(zhuǎn)方向的方法,例如,已知在特開平7-249099號公報(bào)中記載的技術(shù)。該現(xiàn)有技術(shù)對于把輸入帳票旋轉(zhuǎn)了90度,180度,270度的帳票,求格即垂直線·水平線的分布,通過它們與預(yù)先求出的垂直線·水平線的分布進(jìn)行對照,從而識別帳票的同時(shí)還識別所輸入的帳票90度單位的旋轉(zhuǎn)方向。但是,該現(xiàn)有技術(shù)中存在對于作為特征量所使用的格的掠過或者粗細(xì)不穩(wěn)定,根據(jù)所接觸的文字的排列,將發(fā)生連接文字筆畫那樣的偽格,進(jìn)行錯誤的帳票識別以及旋轉(zhuǎn)方向識別的問題。
以往,作為使用框線的線種類進(jìn)行帳票識別的方法,例如已知在特開平11-66228號公報(bào)等中公開的技術(shù)。該現(xiàn)有技術(shù)判定框線的線種類,生成用于帳票讀取的格式信息。另外,作為這種技術(shù),在特開平11-85900號公報(bào)中公開的現(xiàn)有技術(shù)把實(shí)線與虛線區(qū)別開來識別帳票,進(jìn)而,能夠通過在識別精度方面不區(qū)別實(shí)線和虛線進(jìn)行處理,識別帳票。但是,該現(xiàn)有技術(shù)并沒有公開對是否利用每個(gè)帳票種類、每個(gè)帳票框的格的種類的這種情況進(jìn)行切換,以便使之成為有效或者無效。
以往,作為即使帳票有伸縮也能夠進(jìn)行帳票識別的方法,例如已知在特開2000-306030號公報(bào)等中記載的技術(shù)。該現(xiàn)有技術(shù)通過使基準(zhǔn)點(diǎn)順序移動并對照鄰接的帳票的框,防止帳票總體的伸縮引起的位置偏移所產(chǎn)生的對照錯誤。但是,該現(xiàn)有技術(shù)在框丟失不能夠抽取出框的情況下或者產(chǎn)生偽矩形的情況下,存在著在每個(gè)框的對照中將出錯的問題點(diǎn),另外,并沒有考慮到基準(zhǔn)位置的偏移。還有,作為同種技術(shù),已知在特開2000-123174號公報(bào),特開平8-315068號公報(bào),特開平7249099號公報(bào)等中記載的技術(shù)。這些現(xiàn)有技術(shù)是把包含在一定區(qū)域內(nèi)的格的間隔進(jìn)行對照,從其對照結(jié)果推斷帳票圖像的伸縮率的方法,但是,在格之間的對照中,發(fā)生格的丟失或者偽格時(shí),對照自身會出錯,因此,不能夠解決有關(guān)所推斷的伸縮率的值出錯這樣的問題,由于是依賴于格的對照,處理伸縮的方法,因此具有如果格的對照出錯則在伸縮方面將發(fā)生錯誤這樣的問題。
上述現(xiàn)有技術(shù)中,識別成為帳票識別對象的輸入帳票的方向的技術(shù),通過在預(yù)先登錄的帳票的角部印刷特殊的標(biāo)志或者指定的文字列,對于輸入帳票讀取其標(biāo)志等,在沿著帳票旋轉(zhuǎn)90度的方向設(shè)定掃描儀的情況下或者上下反轉(zhuǎn)即旋轉(zhuǎn)180度狀態(tài)的帳票用掃描儀輸入的情況下,能夠識別帳票的種類,但是存在著在帳票上需要特殊的指定印刷區(qū)域,不能夠有效地使用帳票的空間這樣的問題點(diǎn)。
另外,上述現(xiàn)有技術(shù)中,作為在帳票識別的同時(shí)還識別帳票的90度單位的旋轉(zhuǎn)方向的方法,記載在上述特開平7-249099號公報(bào)中的技術(shù),對于把輸入帳票旋轉(zhuǎn)90度,180度,270度的帳票,求格即垂直線水平線的分布,通過把它們與預(yù)先求出的垂直線水平線的分布進(jìn)行對照,從而識別帳票的同時(shí),還識別所輸入的帳票的90度單位的旋轉(zhuǎn)方向這樣的技術(shù),在存在作為特征而利用的格的掠過或者過粗的情況下,識別變得不穩(wěn)定,另外,根據(jù)所接觸的文字的排列,會產(chǎn)生連接文字筆畫的偽格,從而存在進(jìn)行錯誤的帳票識別以及旋轉(zhuǎn)方向的識別這樣的問題點(diǎn)。
另外,在上述現(xiàn)有技術(shù)中,區(qū)別成為帳票識別對象的輸入帳票中的框線的種類,實(shí)線和虛線,從而識別帳票的技術(shù),沒有考慮對是否利用每個(gè)帳票種類、每個(gè)帳票框的格的種類的這種情況進(jìn)行切換,以便使之成為有效還是無效。因此,該現(xiàn)有技術(shù)在虛線的間隔狹窄的帳票的情況下,或者虛線的點(diǎn)過粗而相鄰的點(diǎn)連接在一起成為實(shí)線的情況下,存在著有可能錯誤地識別為不同的帳票,或者不能夠檢測該帳票而拒絕的問題點(diǎn),另外,根據(jù)帳票的不同,在框的形狀相同,且不需要區(qū)別實(shí)線和虛線,且特定部分是實(shí)線還是虛線都應(yīng)該視為同一帳票的帳票被混合輸入的情況下,或者相對于所有種類的帳票,把虛線和實(shí)線視為相同而進(jìn)行帳票識別等,或者進(jìn)行虛線與實(shí)線的區(qū)別視為不同的帳票進(jìn)行帳票識別,除去唯一地選擇以上某一種方法以外就不能夠進(jìn)行處理。即,該現(xiàn)有技術(shù)即使對于在不需要實(shí)線和虛線的區(qū)別,且特征部分是實(shí)線還是虛線都應(yīng)視為同一帳票的帳票,也需要預(yù)先分別登錄用于帳票識別用的辭典或者帳票讀取用的格式信息,因此存在辭典登錄的作業(yè)過多,另外存儲辭典的容量過大的問題點(diǎn)。
進(jìn)而,上述現(xiàn)有技術(shù)中,為了對應(yīng)帳票的伸縮使基準(zhǔn)點(diǎn)順序移動進(jìn)行對照的方法,如果由于格的丟失或者偽格的出現(xiàn),在對照過程中使新設(shè)定的基準(zhǔn)出錯,則存在著在帳票識別中產(chǎn)生錯誤,或者有可能被拒絕這樣的問題點(diǎn)。
進(jìn)而,以上說明過的現(xiàn)有技術(shù)如果每一種都增多登錄帳票的種類,則使用者難以判斷新的成為登錄對象的帳票已經(jīng)登錄完畢還是未登錄,另外,存在著在登錄完畢的相似帳票識別為同一種類的帳票時(shí),不能夠把其帳票與相似帳票進(jìn)行區(qū)別這樣的問題點(diǎn)。
本發(fā)明的第1個(gè)目的在于提供解決上述現(xiàn)有技術(shù)的問題點(diǎn),即使在從掃描儀輸入了任意設(shè)定帳票的方向的帳票,例如,旋轉(zhuǎn)90度的狀態(tài)或者上下反轉(zhuǎn)即旋轉(zhuǎn)180度狀態(tài)的帳票時(shí),也與正立狀態(tài)的帳票時(shí)相同,能夠可靠地識別帳票種類的同時(shí),檢測帳票的旋轉(zhuǎn)方向的帳票識別方法。
本發(fā)明的第2個(gè)目的在于提供在預(yù)先登錄的每個(gè)帳票或者該帳票的每個(gè)框中具備控制信息,利用框線的種類,例如是實(shí)線或虛線,即使在框的形狀相同時(shí),進(jìn)行切換使得把框線的種類不同的帳票識別為不同種類的帳票或者把框線的種類不同的帳票識別為相同的帳票,從而能夠識別帳票的種類的帳票識別方法。
本發(fā)明的第3個(gè)目的在于提供即使在帳票中存在位置偏移,也能夠高精度地識別帳票的種類的帳票識別方法。
本發(fā)明的第4個(gè)目的在于提供即使對于因格的掠過等引起的丟失或者出現(xiàn)偽格,或者即使帳票存在伸縮,也能夠高精度地穩(wěn)定地識別帳票的種類的帳票識別方法。
本發(fā)明的第5個(gè)目的在于提供具備用于使用者以目視進(jìn)行判斷成為新登錄對象的帳票已經(jīng)登錄完畢還是未登錄的畫面接口,編輯并印刷對象帳票試行再次登錄的功能,確保保管有對應(yīng)于已印刷的帳票的帳票識別用辭典的功能的帳票登錄方法。
本發(fā)明的帳票識別方法的特征在于,作為特征從輸入帳票抽取出一個(gè)或者多個(gè)框的中心點(diǎn),以90度單位使輸入帳票的輸入特征或者預(yù)先登錄的登錄帳票的特征中的某一個(gè)旋轉(zhuǎn),把輸入特征與登錄特征進(jìn)行對照,把最一致的角度作為帳票的方向,把對應(yīng)于特征的帳票種類作為帳票識別結(jié)果輸出,由此,帳票在旋轉(zhuǎn)90度的方向上設(shè)定于掃描儀的情況下,或者向掃描儀輸入了上下反轉(zhuǎn)即旋轉(zhuǎn)180度的狀態(tài)的帳票的情況下,也能夠與正立狀態(tài)的帳票相同地進(jìn)行帳票識別。作為特征的框的中心點(diǎn)與其它的特征,例如,格的投影分布等相比較,能夠穩(wěn)定地抽出,并能夠減小識別誤差。這是因?yàn)楦耠m然在文字行的內(nèi)部抽取為偽格,但是通過抽取出4邊由格構(gòu)成的框,把其框的利用格為框線,因此能夠減少誤抽取。
另外,本發(fā)明的帳票識別方法的特征在于,從輸入帳票抽取出框線的種類,求出其與預(yù)先登錄的帳票的框線種類的一致性,即使框的形狀相同,也能夠把框線種類不同的帳票識別為不同的帳票,進(jìn)而,即使是框線種類不同的帳票,但如果框的形狀相同,還能夠識別為相同種類的帳票。
另外,本發(fā)明的帳票識別方法的特征在于,把具有輸入帳票的特征的各個(gè)位置從預(yù)先登錄的特征的基準(zhǔn)位置,沿著橫方向以及縱方向以一定寬度平行移動的同時(shí)進(jìn)行對照,把與登錄特征最一致的平行移動位置作為輸入帳票的位置,把對應(yīng)于特征的帳票種類作為帳票識別結(jié)果輸出,由此即使帳票存在位置偏移也能夠進(jìn)行帳票識別。
另外,本發(fā)明的帳票識別方法的特征在于,使帳票的特征的對照與特征的伸縮相互獨(dú)立,與特征的對照誤差無關(guān)地,使特征伸縮。這里,使具有輸入帳票的特征的各位置各以一定倍率沿著橫方向以及縱方向伸縮,把與登錄特征最一致的伸縮率作為輸入帳票的伸縮率而輸出,把對應(yīng)于特征的帳票種類作為帳票識別結(jié)果輸出,由此即使帳票存在伸縮也能夠進(jìn)行帳票識別。
本發(fā)明的帳票識別方法的特征在于,在畫面上顯示新成為登錄對象的帳票圖像和根據(jù)帳票識別判斷為相似的登錄完畢的帳票圖像,輸入該帳票已經(jīng)登錄完畢還是未登錄的使用者的判斷信息,為了作為新帳票,登錄對象帳票,通過把對象帳票的數(shù)據(jù)編輯并印刷,且再次試行登錄,從而能夠進(jìn)行帳票登錄。
在本發(fā)明的帳票識別方法中,把輸入帳票的特征與登錄帳票的特征進(jìn)行對照的方法具備在輸入帳票的特征中賦予了點(diǎn)座標(biāo)的輸入點(diǎn)和在登錄帳票的特征中賦予了點(diǎn)座標(biāo)的辭典點(diǎn),計(jì)算上述輸入點(diǎn)與辭典點(diǎn)的距離,如果上述距離是預(yù)定值以下則判斷為存在與輸入點(diǎn)相對應(yīng)的辭典點(diǎn),通過基于相應(yīng)的點(diǎn)數(shù),輸入點(diǎn)以及辭典點(diǎn)數(shù),求出對照的一致的程度,從而能夠進(jìn)行高精度的帳票識別。
圖1是示出進(jìn)行本發(fā)明一實(shí)施形態(tài)的帳票識別以及帳票登錄的帳票識別系統(tǒng)的結(jié)構(gòu)例的框圖。
圖2是說明在辭典登錄站中的用于帳票識別的辭典登錄的處理動作的流程圖。
圖3是說明用于進(jìn)行根據(jù)圖2說明過的辭典登錄中的對話式操作的畫面顯示例的圖。
圖4是說明在帳票識別站中的輸入帳票的特征抽取處理與帳票識別處理的動作的流程圖。
圖5是說明圖4的步驟401中的帳票識別處理的動作的流程圖。
圖6是說明圖5的步驟501中的搜索對照處理的動作的流程圖。
圖7是說明圖6的步驟604中的點(diǎn)對照處理的動作的流程圖。
圖8是說明圖7的步驟702中的相似度抽取處理的動作的流程圖。
圖9是說明圖8的步驟802中的投入票數(shù)抽取處理的動作的流程圖。
圖10是說明圖4的步驟400中的框抽取處理的動作的流程圖。
圖11是說明帳票識別站106中的輸入帳票的特征抽取處理和帳票識別處理的另一個(gè)動作例的流程圖。
圖12A,12B說明作為有關(guān)在圖4的步驟400中的框抽取處理中說明的帳票識別的特征的框中心點(diǎn)。
圖13A~13D是說明存儲在帳票辭典文件中的辭典點(diǎn)的圖。
圖14是說明計(jì)算圖9的步驟903中的輸入點(diǎn)與辭典點(diǎn)的最小距離的方法的圖。
圖15是說明把在圖6的步驟602,603中所示的座標(biāo)值向X、Y方向偏移的點(diǎn)對照的圖。
圖16是說明作為框的特征使用的框線的種類的圖。
圖17是說明在圖8的步驟802中的投入票數(shù)抽取處理中,利用點(diǎn)的屬性時(shí)的處理動作的流程圖。
圖18是說明在圖5的步驟500中的框座標(biāo)的旋轉(zhuǎn)90度的處理。
圖19是說明在圖8的步驟802中的投入票數(shù)抽取處理中,把點(diǎn)的屬性切換為有效或者無效中的某一種,并求出投票數(shù)時(shí)的處理動作的流程圖。
圖20是說明在帳票識別站中使用的帳票圖像的特征例的圖。
圖21是示出本發(fā)明其它實(shí)施形態(tài)的帳票圖像識別系統(tǒng)的結(jié)構(gòu)例的框圖。
圖22是說明作為帳票圖像的特征,使用框、格、文字行矩形,進(jìn)行帳票識別的處理動作的例子的流程圖。
圖23是說明在圖22的步驟2206中的帳票識別結(jié)果的復(fù)合判斷的處理動作的流程圖。
圖24是說明使用了3種帳票特征的帳票識別的處理動作的其它例子的流程圖。
圖25是說明進(jìn)行帳票辭典文件108與帳票文件2113之間的匹配性檢驗(yàn)的處理動作的流程圖。
圖26是示出把處理中心與遠(yuǎn)方的支店或者事務(wù)所連接到網(wǎng)絡(luò)上進(jìn)行帳票識別的系統(tǒng)的結(jié)構(gòu)例的框圖。
圖1是示出進(jìn)行本發(fā)明一實(shí)施形態(tài)的帳票識別以及帳票登錄的帳票識別系統(tǒng)的結(jié)構(gòu)例的框圖。圖1中,100是網(wǎng)絡(luò),101是辭典登錄站,102、107是掃描儀,103是登錄對象帳票圖像文件,104、108是帳票辭典文件,105是顯示裝置,106是帳票識別站,109是帳票生成站,110是帳票文件,111是帳票打印機(jī)。
圖1所示的帳票識別系統(tǒng)構(gòu)成為經(jīng)過通信網(wǎng)絡(luò)100,連接辭典登錄站101、帳票識別站106、帳票生成站109,這些站能夠相互協(xié)同動作。辭典登錄站101為了識別帳票的種類預(yù)先登錄帳票圖像的特征。在辭典登錄站101中,具備獲取帳票圖像的掃描儀102,保管成為登錄對象的帳票圖像的登錄對象帳票圖像文件103,保管登錄的帳票圖像的特征的帳票辭典文件104。另外,辭典登錄站101具有顯示裝置105,在該顯示裝置105的畫面上顯示登錄完畢的帳票圖像或者用掃描儀獲得的新的帳票圖像,對話式地進(jìn)行登錄作業(yè)。
帳票識別站106使用保管登錄的帳票圖像特征的帳票辭典文件108識別從掃描儀107輸入的帳票圖像的種類。帳票辭典文件108的內(nèi)容是復(fù)制了帳票登錄站101一側(cè)的帳票辭典文件104的內(nèi)容,能夠經(jīng)過通信網(wǎng),始終更新最新的數(shù)據(jù)。另外,作為在帳票識別中使用的帳票辭典文件,也可以是經(jīng)過通信網(wǎng)訪問使用辭典登錄站一側(cè)的帳票辭典文件104的結(jié)構(gòu)。
帳票生成站109具備帳票文件110和帳票打印機(jī)111,對于保管于帳票文件110中的帳票數(shù)據(jù),使用帳票打印機(jī)111并在紙張上印刷帳票。帳票生成站109編輯并印刷帳票數(shù)據(jù)使得容易地進(jìn)行帳票識別,在帳票登錄站101中,能夠用掃描儀102獲取印刷了的帳票的圖像,試行新登錄。
圖2是說明在辭典登錄站101中用于帳票識別的辭典登錄的處理動作的流程圖,以下進(jìn)行說明。
(1)首先,輸入帳票圖像,作為帳票圖像的特征抽取出框。該處理是從帳票圖像抽取出橫線和縱線,根據(jù)其交叉點(diǎn)抽取出框的處理,進(jìn)而,作為特征抽取出框內(nèi)的中心點(diǎn)的座標(biāo)。一般,框由于抽取出多個(gè),因此作為特征抽取出多個(gè)框的中心點(diǎn)的座標(biāo)(步驟200,201)。
(2)接著,進(jìn)行已經(jīng)登錄的帳票辭典與從輸入帳票抽取出的特征的對照,求對照的程度(步驟202)。
(3)根據(jù)在步驟202中的對照程度,決定是拒絕還是驗(yàn)收。這里可以簡單地構(gòu)成為如果對照的程度比預(yù)定值大則驗(yàn)收,如果比預(yù)定值小則拒絕(步驟203)。
(4)在步驟203中,判斷為拒絕時(shí),把從輸入帳票抽取出的該特征作為辭典而追加登錄在帳票辭典文件104中,把該帳票圖像保管在登錄對象帳票圖像文件103中(步驟204,205)。
(5)在步驟203中,判斷為驗(yàn)收時(shí),有可能輸入的帳票已登錄完畢或者登錄著相似帳票,在顯示裝置105上顯示警告的同時(shí),從登錄對象帳票圖像文件103讀入登錄帳票圖像,在畫面上顯示輸入的帳票圖像和登錄帳票圖像,進(jìn)行該帳票的確認(rèn)以及在帳票生成站109中的帳票的變更(步驟206,207)。
如以上說明的那樣,辭典登錄站101在畫面上顯示成為登錄對象的帳票圖像和根據(jù)帳票識別判斷為相似的登錄完畢的帳票圖像,使得使用者判斷該帳票是已經(jīng)登錄完畢還是未登錄,輸入其判斷信息。由此,由于作為新帳票而登錄對象帳票,因此能夠編輯并印刷對象帳票的數(shù)據(jù),試行再次登錄。
圖3是說明用于進(jìn)行根據(jù)圖2說明過的辭典登錄中的對話操作的畫面顯示例的圖。在顯示裝置105的顯示畫面300上,顯示輸入帳票圖像301和登錄完畢或者作為相似帳票的登錄帳票圖像304。另外,在顯示畫面300上,把顯示圖像的說明文303、304也進(jìn)行顯示,另外,為了向使用者指示所需要的確認(rèn),在顯示警告文305的同時(shí),顯示用于轉(zhuǎn)移到編輯、印刷對象帳票的數(shù)據(jù)的帳票生成站109的處理的單擊按鈕306。
圖4是說明在帳票識別站106中的輸入帳票的特征抽取處理和帳票識別處理的動作的流程圖。在圖4所示的流程中,在步驟400中從輸入帳票圖像抽取出帳票識別用的特征。在所說明的例中,作為特征抽取出位于帳票內(nèi)的所有框的中心點(diǎn)的座標(biāo)。但是,作為特征并不限定于框的中心點(diǎn)的座標(biāo),例如也可以是格的中心點(diǎn)的座標(biāo)或者文字行的中心點(diǎn)的座標(biāo)。其次,在步驟401中根據(jù)抽取出的特征識別帳票的種類。
圖5是說明在圖4的步驟401中的帳票識別處理的動作的流程圖,以下進(jìn)行說明。
(1)以90度單位旋轉(zhuǎn)在圖4的步驟400抽取出的輸入帳票圖像的特征,即,框線的中心點(diǎn)(輸入點(diǎn))的座標(biāo)。這里,進(jìn)行左旋90度,右旋90度,上下反轉(zhuǎn)180度的3種旋轉(zhuǎn)。這些旋轉(zhuǎn)能夠通過變換作為特征的框的中心點(diǎn)的座標(biāo)進(jìn)行(步驟500)。
(2)對于在步驟500的3種旋轉(zhuǎn)的每一種,以及沒有旋轉(zhuǎn)的情況,求中心座標(biāo),反復(fù)進(jìn)行后述的步驟501的搜索對照,步驟502的相似度登錄(步驟505)。
(3)在搜索對照的處理中,使基準(zhǔn)位置以預(yù)定寬度沿著橫方向,接著,沿著縱方向平行移動的同時(shí),進(jìn)行輸入點(diǎn)與辭典中的點(diǎn)的對照。而且,在相似度登錄的處理中,按每個(gè)在步驟500中設(shè)定的旋轉(zhuǎn)角,求通過對照可以得到的相似度,登錄其相似度和其旋轉(zhuǎn)角(步驟501,502)。
(4)然后,把在每個(gè)登錄了的旋轉(zhuǎn)角的相似度中,具有最大相似度的旋轉(zhuǎn)角決定為帳票的方向,進(jìn)而,把具有其最大相似度的辭典的種類決定為相對應(yīng)的帳票的種類(步驟503,504)。
圖6是說明圖5的步驟501中的搜索對照處理的動作的流程圖,以下進(jìn)行說明。
(1)首先,設(shè)定用于平行移動點(diǎn)座標(biāo)的基準(zhǔn)位置的移動開始位置,即,設(shè)定從基準(zhǔn)位置的搜索等級寬度,即,基準(zhǔn)位置的平行移動的單位(步驟600,601)。
(2)使基準(zhǔn)位置的X方向以所設(shè)定的等級寬度偏移,進(jìn)而,使基準(zhǔn)位置的Y方向以所設(shè)定的等級寬度偏移,同時(shí)反復(fù)進(jìn)行步驟604,605,606的處理(步驟602,603)。
(3)在點(diǎn)對照的處理中,把輸入點(diǎn)與辭典點(diǎn)的對照進(jìn)行到辭典結(jié)束為止。而且,在相似度登錄的處理中,登錄該點(diǎn)對照的相似度,及此時(shí)的X方向,Y方向的偏移量(步驟604秒,605)。
(4)由于在步驟604、605的處理中,登錄了旋轉(zhuǎn)與X方向、Y方向的偏移量之間的多個(gè)組合中的每一個(gè)的點(diǎn)對照的相似度,及此時(shí)的X方向、Y方向的偏移量,因此,與X方向、Y方向的偏移量一起登錄其中具有最大相似度的X方向、Y方向的偏移量的辭典的種類。該登錄的X方向、Y方向的偏移量以后確定要讀取的帳票內(nèi)的框之一,并在框內(nèi)的文字等的讀取中使用(步驟606)。
圖7是說明圖6的步驟604中的點(diǎn)對照處理的動作的流程圖。在圖7所示的流程中,首先,在步驟700中,設(shè)定從基準(zhǔn)位置的位置偏移量。接著,在步驟701中,至辭典結(jié)束為止反復(fù)進(jìn)行步驟702中的相似度的抽取。而且,在步驟703中按照抽取出的相似度的大小順序改變排列帳票種類。
圖8是說明圖7的步驟702中的相似度抽取處理的動作的流程圖,以下進(jìn)行說明。該處理是假設(shè)在輸入帳票中具有伸縮,假定伸縮率為多個(gè),并抽取出相似度,由于獨(dú)立地進(jìn)行對照處理與對于特征的伸縮處理,因此具有不會受到對照處理的誤差影響的優(yōu)點(diǎn)。
(1)首先,設(shè)定多個(gè)放大縮小的倍率,并設(shè)定成反復(fù)進(jìn)行步驟801,802,803的處理,直到它們結(jié)束為止(步驟800)。
(2)根據(jù)對應(yīng)的放大縮小率進(jìn)行輸入點(diǎn)座標(biāo)的放大縮小。在該處理中,由于假定伸縮率為多個(gè)并進(jìn)行輸入點(diǎn)座標(biāo)的放大縮小,因此具有即使在帳票伸縮的情況下也能夠計(jì)算出相似度,另外,即使在作為特征利用的點(diǎn)中發(fā)生丟失或者假點(diǎn),也能夠可靠地計(jì)算出相似度的效果(步驟801)。
(3)接著,作為投入票數(shù)求出與輸入點(diǎn)對照的辭典點(diǎn)的個(gè)數(shù),抽取出投入票數(shù),并根據(jù)投入票數(shù)和輸入點(diǎn)數(shù)以及辭典點(diǎn)數(shù)計(jì)算相似的程度(步驟802,803)。
在上述的處理中,作為相似度的計(jì)算方法,例如可以使用以輸入點(diǎn)數(shù)和辭典點(diǎn)數(shù)之和除投入票數(shù)的百分率。即,相似度成為投入票數(shù)/(輸入點(diǎn)數(shù)+辭典點(diǎn)數(shù))的百分率。另外,相似度例如也可以使用以輸入點(diǎn)數(shù)與辭典點(diǎn)數(shù)之和除投入票數(shù)減去輸入點(diǎn)數(shù)與辭典點(diǎn)數(shù)之差而計(jì)算的個(gè)數(shù)的百分率。即,相似度成為(投入票數(shù)-絕對值(辭典點(diǎn)數(shù)-輸入點(diǎn)數(shù)))/(輸入點(diǎn)數(shù)+辭典點(diǎn)數(shù))的百分率。這種情況下,由于對于投入票數(shù)減去輸入點(diǎn)數(shù)與辭典點(diǎn)數(shù)之差求出,因此在檢測出多個(gè)輸入點(diǎn)的情況下,具有能夠減少投入票數(shù),降低相似度的效果。
圖9是說明圖8的步驟802中的投入票數(shù)抽出處理的動作的流程圖。該處理是對于所注目的輸入點(diǎn)求位于其附近的辭典點(diǎn)內(nèi)處于最小距離的辭典點(diǎn),從其最小距離的長度判斷是否存在對照的辭典點(diǎn)的同時(shí),作為投入票數(shù)計(jì)數(shù)對于輸入點(diǎn)存在辭典點(diǎn)的輸入點(diǎn)的個(gè)數(shù)的處理。
在圖9所示的流程中,首先,在步驟900中,把投入票數(shù)初始化。接著,在步驟901中,設(shè)定成反復(fù)進(jìn)行步驟902以下的處理,直到輸入點(diǎn)結(jié)束為止。在步驟902,903的處理中,計(jì)算輸入點(diǎn)與辭典點(diǎn)的最小距離,直到辭典的點(diǎn)結(jié)束為止。而且,在步驟904中判斷該距離是否小于預(yù)定值,如果小于則在步驟905中把投入票數(shù)的值增加1。通過反復(fù)進(jìn)行以上的處理,能夠計(jì)算出投入票數(shù)。
圖10是說明圖4的步驟400中的框抽取處理的動作的流程圖,以下進(jìn)行說明。
(1)首先,從帳票圖像檢測出橫線和縱線。在該處理中,用黑線部分即黑列(ラン)的集合反映圖像,作為橫線抽取出線長較長的黑列。另外,縱線的抽取通過把圖像旋轉(zhuǎn)90度,同樣地抽取出線長較長的黑列進(jìn)行。另外,作為其它的方法,也可以使用抽取出黑象素的塊的輪廓線,取出框線的方法(步驟1000)。
(2)接著檢測框。該框的檢測能夠通過從縱線以及橫線的交點(diǎn)取出框來進(jìn)行。另外,詳細(xì)的框檢測方法也可以是在特開平8-125855號公報(bào)中公開的方法(步驟1001)。
(3)接著,檢測框的四個(gè)角的座標(biāo),計(jì)算框的中心點(diǎn)座標(biāo),把該中心點(diǎn)座標(biāo)作為用于帳票識別的特征(步驟1002,1003)。
(4)進(jìn)而,根據(jù)從框線的傾斜或者帳票邊緣的傾斜而檢測出的帳票的微小傾斜角,對于計(jì)算出的中心點(diǎn)座標(biāo)進(jìn)行傾斜修正。這里的修正是對于微小的傾斜角的點(diǎn)座標(biāo)的修正,關(guān)于90度單位的旋轉(zhuǎn),以已經(jīng)說明過的步驟505的處理進(jìn)行。這樣,對于微小的傾斜進(jìn)行了傾斜修正的中心點(diǎn)座標(biāo)作為用于帳票識別的特征(步驟1004)。
圖11是說明帳票識別站106中的輸入帳票的特征抽取處理和帳票識別處理的其它動作例的流程圖,是與根據(jù)圖4說明過的例子不同的處理。該處理作為特征使用文字行的位置座標(biāo)進(jìn)行帳票識別。
在圖11所示的流程中,在步驟1101的處理中,從輸入帳票圖像抽取文字行。詳細(xì)的文字行抽取方法能夠使用在特開平11-232376號公報(bào)中公開的條形碼行的抽取處理方法。而且,以文字行的座標(biāo),例如文字行內(nèi)部的中心點(diǎn)的座標(biāo)為特征,由此,在步驟1102的處理中反復(fù)進(jìn)行帳票識別。另外,步驟1102的帳票識別處理也可以是與圖4的步驟401的處理相同的處理。
圖12是說明在圖4的步驟400中的框抽取處理,說明作為帳票識別的特征的框的中心點(diǎn)的圖。圖12(a)示出輸入帳票圖像1200的例子,該例中,在輸入帳票圖像1200中,存在框1201,1202,1203的3個(gè)框。而且,圖12(b)示出抽取出了輸入帳票圖像1200內(nèi)各框的中心點(diǎn)1211,1212,1213的結(jié)果的圖像1210。各個(gè)框內(nèi)部的中心點(diǎn)表現(xiàn)為橫方向以及縱方向的座標(biāo)。
圖13說明存儲在帳票辭典文件104或者108中的辭典點(diǎn)。圖13(a)~圖13(d)中,把作為帳票種類登錄完畢的辭典的例子示為1300,1301,1302,1303。對應(yīng)于帳票的種類分別具備各自的辭典點(diǎn)。在辭典1300中,作為位置座標(biāo)具備辭典點(diǎn)1310、1311、1312、1313,另外,在辭典1301中,作為位置座標(biāo)具備辭典點(diǎn)1314、1315、13l6,在辭典1302中,作為位置座標(biāo)具備辭典點(diǎn)1317、1318、1319,在辭典1303中,作為位置座標(biāo)具備辭典點(diǎn)1320、1321、1322。
圖14說明在圖9的步驟903中的計(jì)算輸入點(diǎn)與辭典點(diǎn)的最小距離的方法。圖14中,在以1400表示的橫方向X,以1401表示的縱方向Y的帳票平面中,把從輸入帳票圖像抽取出的輸入點(diǎn)(用黑點(diǎn)表示)記為1410、1411、1412。另外,把某個(gè)辭典的辭典點(diǎn)(用白點(diǎn)表示)記為1420、1421、1422、1423。
對于任意的輸入點(diǎn)1410,為了求存在于附近的最短距離的辭典點(diǎn),計(jì)算該輸入點(diǎn)1410與辭典點(diǎn)1420、1421、1422、1423的距離,具有其最短距離的辭典點(diǎn)在本例中求出為辭典點(diǎn)1420。對于各個(gè)輸入點(diǎn),進(jìn)行同樣的處理,求位于最短距離的辭典點(diǎn)。其結(jié)果,作為位于輸入點(diǎn)1411的最短距離的辭典點(diǎn)抽取出1421,對于輸入點(diǎn)1412抽取出1422。另外,由于以輸入點(diǎn)為基準(zhǔn)檢測相對應(yīng)的辭典點(diǎn),因此對于辭典點(diǎn)1423沒有對應(yīng)的輸入點(diǎn)。
圖15是說明把在圖6的步驟602,603中示出的座標(biāo)值向X、Y方向偏移了的點(diǎn)對照的圖。在圖15所示的輸入帳票圖像中,把用1500所示的橫方向X,用1501所示的縱方向Y的原點(diǎn)位置記為1540。另外,把從輸入帳票圖像抽取出的輸入點(diǎn)記為1520、1521、1522,把某個(gè)辭典的辭典點(diǎn)記為1530,1531、1532、1533。而且,縱方向的虛線1502~1507表示把原點(diǎn)的位置沿著橫方向以一定間隔移動時(shí)的偏移位置,另外,橫方向的虛線1508~1512表示把原點(diǎn)的位置沿著縱方向以一定間隔移動時(shí)的偏移位置。
在圖15中,使原點(diǎn)沿著上述虛線的交點(diǎn)平行移動。即,把輸入點(diǎn)的座標(biāo)值僅更新預(yù)定量。而且,對于平行移動了的輸入點(diǎn)座標(biāo),進(jìn)行圖6的步驟604的點(diǎn)對照的處理。本發(fā)明的實(shí)施形態(tài)由于像這樣把原點(diǎn)以一定的間隔沿著橫方向以及縱方向平行移動進(jìn)行點(diǎn)之間的對照,因此即使在輸入帳票中存在位置偏移也能夠高精度地進(jìn)行帳票識別。
圖16是說明作為框的特征使用的框線的種類的圖。在上述說明過的圖10的流程中的、抽取線段的步驟1000中,不僅抽取實(shí)線,例如還能夠抽取出虛線,把其作為框的特征在帳票識別中利用。作為構(gòu)成框線的種類,有實(shí)線和虛線時(shí),如圖16所示,作為框的種類,有作為框1600~1615所示的16種。另外,作為框線的種類,不一定限定于實(shí)線和虛線,例如,也可以包括點(diǎn)劃線或者點(diǎn)線等線種類。另外,在線種類中還可以包括線粗細(xì)。如果框的線種類不同,則即使框的形狀或者位置相同,帳票的種類也不同。
在本發(fā)明的實(shí)施形態(tài)中,在框線的種類不同的16種框中分別提供屬性。屬性對應(yīng)于框線的種類,例如,也可以是從1~16的號碼。例如,框1600的4條框線是實(shí)線。另外,框1601~1604的3條框線是實(shí)線,剩余的1條框線是虛線??蚓€1605~1610的2條框線是實(shí)線,其余的2條框線是虛線???611~1614的3條框線是虛線,剩余的1條框線是實(shí)線???615的4條框線是虛線,這些是所有不同種類的框。另外,在步驟1000中從格中抽取出虛線的處理中,例如,能夠使用在特開平9-319824號公報(bào)中公開的虛線抽取方法。
圖17是說明在圖8的步驟802中的投入票數(shù)抽取處理中,利用點(diǎn)的屬性時(shí)的處理動作的流程圖。這里的處理,作為點(diǎn)的屬性賦予框線的線種類。而且,該處理是對于所注目的輸入點(diǎn),求位于其附近的辭典點(diǎn)內(nèi),輸入點(diǎn)與辭典點(diǎn)的屬性相同而且位于最小距離的辭典點(diǎn),從其最小距離的長度判斷是否存在對照的辭典點(diǎn),同時(shí),對于輸入點(diǎn)作為投入票數(shù)計(jì)數(shù)存在辭典點(diǎn)的輸入點(diǎn)個(gè)數(shù)的處理。
圖17中,首先,在步驟1700把投入票數(shù)初始化。接著,在步驟1701中,設(shè)定成反復(fù)進(jìn)行步驟1702以下的處理,直到輸入點(diǎn)結(jié)束為止。在步驟1702中,至辭典點(diǎn)結(jié)束為止,在步驟1703中求輸入點(diǎn)與辭典點(diǎn)的屬性一致的辭典點(diǎn),在步驟1704中計(jì)算輸入點(diǎn)與該辭典點(diǎn)的最小距離。而且,在步驟1705中判斷該距離是否小于預(yù)定值,在小于時(shí),在步驟1706中使投入票數(shù)的值增加1。通過反復(fù)進(jìn)行以上的處理,能夠計(jì)算投入票數(shù)。
通過上述圖17的處理,能夠?qū)τ诳蚓€種類不同的帳票,判斷為帳票種類不同。由此,例如,即使框線的屬性不同也視為相同種類的帳票時(shí),能夠共用用于文字讀取的格式數(shù)據(jù),能夠得到可以省略格式數(shù)據(jù)生成的作業(yè)的優(yōu)點(diǎn)。另外,在帳票圖像中,點(diǎn)線由于受到圖像2值化的影響而破壞,有時(shí)成為點(diǎn)線相連接的實(shí)線。對于這樣的帳票,通過忽視框線的屬性,能夠可靠地識別帳票的種類。
圖18是說明圖5的步驟500中的框座標(biāo)旋轉(zhuǎn)90度的處理的圖。在圖18中,把從輸入帳票圖像抽取出的特征示為1800。這里,作為特征具備框中心點(diǎn)的位置座標(biāo)。對于該輸入特征1800,向右旋轉(zhuǎn)90度的特征是特征1801,另外,對于該輸入特征1800,上下反轉(zhuǎn)的特征是特征1802,向左旋轉(zhuǎn)90度的特征是特征1803。本發(fā)明的實(shí)施形態(tài)由于如上述那樣以90度單位旋轉(zhuǎn)輸入特征進(jìn)行對照,因此即使在掃描儀上沿著任意方向設(shè)定帳票,也能夠進(jìn)行帳票的識別。另外也可以與使輸入點(diǎn)旋轉(zhuǎn)的方法不同,使辭典點(diǎn)旋轉(zhuǎn)進(jìn)行對照。
圖19是說明在圖8的步驟802中的投入票數(shù)抽取處理中,把點(diǎn)的屬性切換為有效或者無效,從而求投入票數(shù)時(shí)的處理動作的流程圖,以下進(jìn)行說明。
該切換處理按照每個(gè)帳票種類進(jìn)行。但是,并不是限定于按照每個(gè)帳票種類進(jìn)行切換處理,也可以按照帳票內(nèi)的每個(gè)框進(jìn)行切換處理。而且,在預(yù)先登錄的每個(gè)帳票或者每個(gè)帳票內(nèi)的框中具備把框線的種類置為有效無效的識別控制信息。這里,作為一例,作為識別控制信息具備屬性標(biāo)志,根據(jù)在步驟1907中使用的該屬性標(biāo)志而切換控制。另外,在該例中,作為點(diǎn)的屬性賦予框線的線種類,可切換考慮線種類的識別處理與忽視線種類的差別的識別處理。而且,該處理是對于所注目的輸入點(diǎn),求在位于其附近的辭典點(diǎn)內(nèi),輸入點(diǎn)與辭典點(diǎn)的屬性相同而且位于最小距離的辭典點(diǎn),從其最小距離的長度判斷是否存在對照的辭典點(diǎn),同時(shí),作為投入票數(shù)計(jì)數(shù)對于輸入點(diǎn)存在辭典點(diǎn)的輸入點(diǎn)的個(gè)數(shù)的處理。
(1)首先,把投入票數(shù)初始化,并設(shè)定成反復(fù)進(jìn)行步驟1902以下的處理,直到輸入點(diǎn)結(jié)束為止(步驟1901)。
(2)直到辭典的點(diǎn)結(jié)束為止,判斷各框的屬性,例如,把線種類置為有效還是置為無效。如果把屬性置為有效,求輸入點(diǎn)與辭典點(diǎn)的屬性一致的辭典點(diǎn),計(jì)算輸入點(diǎn)與該辭典點(diǎn)之間的最小距離(步驟1902,1907,1903,1904)。
這里,在上述的步驟1907中,把屬性置為無效時(shí),不進(jìn)行步驟1903的處理以下的最小距離計(jì)算的處理,但也不一定限定于這樣做。例如,也可以是在步驟1907中屬性標(biāo)志無效時(shí),在步驟1903中,即使輸入點(diǎn)與辭典點(diǎn)的屬性不一致,也在步驟1904的處理中進(jìn)行最小距離的計(jì)算而忽視屬性的方法。
(3)接著,判斷在步驟1904中計(jì)算出的最小距離是否小于預(yù)定值,如果小于則使投入票數(shù)的值增加1。通過反復(fù)進(jìn)行以上的處理,能夠計(jì)算投入票數(shù)(步驟1905,1906)。
通過上述圖19所示的處理,對于框線種類不同的帳票,能夠切換判斷為帳票種類相同或者判斷為不同,計(jì)算投入票數(shù)。
圖20是說明帳票識別中使用的帳票圖像的特征例的圖。作為帳票的特征,如圖20所示,有帳票中的框2001中的框內(nèi)部的中心點(diǎn)2000的座標(biāo),帳票中的格2003中的格的中心點(diǎn)2002的座標(biāo),帳票中的文字行外接的矩形2005的中心點(diǎn)2004的座標(biāo)等,能夠把這些作為在帳票識別中利用的特征使用。
圖22是說明作為帳票圖像的特征,使用根據(jù)圖20說明的3種特征,即框、格、文字行矩形進(jìn)行帳票識別的處理動作例的流程圖。圖22中,在步驟2200中作為帳票的特征抽取出框,在步驟2201中利用框進(jìn)行帳票識別。接著,在步驟2202中作為帳票的特征抽取出格,在步驟2203中進(jìn)行利用了格的帳票識別。進(jìn)而,在步驟2204中抽取出文字行,在步驟2205中進(jìn)行利用了文字行的帳票識別。最后,在步驟2206中進(jìn)行在步驟2201、2203、2205中各帳票識別結(jié)果的復(fù)合判斷。
圖23是說明在圖22的步驟2206中的帳票識別結(jié)果的復(fù)合判斷的動作處理的流程圖,以下進(jìn)行說明。
首先,在步驟2300中指示反復(fù)進(jìn)行步驟2301~2305的處理直到預(yù)先登錄的帳票的種類結(jié)束為止。在步驟2301的處理中,把用于復(fù)合判斷的指標(biāo)值按照每個(gè)帳票種類進(jìn)行初始化。接著,在步驟2302的處理中,把利用框的帳票識別結(jié)果加入到該指標(biāo)值,這里是加入到初始值上。接著,在步驟2303的處理中,把利用格框的帳票識別結(jié)果加入到該指標(biāo)值,這里是加入到初始值+利用框的識別結(jié)果的指標(biāo)值上。進(jìn)而,在步驟2304的處理中,把利用文字行的帳票識別結(jié)果加入到該指標(biāo)值,這里是加入到初始值+利用框的識別結(jié)果+利用格的識別結(jié)果的指標(biāo)值上。接著,在步驟2305的處理中,登錄在步驟2304中得到的初始值+利用框的識別結(jié)果+利用格的識別結(jié)果+利用文字行的識別結(jié)果的指標(biāo)值。最后,在步驟2306的處理中,按照指標(biāo)值的大小排列作為識別結(jié)果的帳票種類。
在上述中,作為指標(biāo)值使用了各帳票識別候補(bǔ)的順序時(shí),按照指標(biāo)值小的順序分類帳票種類?;蛘撸谧鳛橹笜?biāo)值使用了各帳票識別候補(bǔ)的相似度時(shí),按照指標(biāo)值大的順序分類帳票種類。本發(fā)明的實(shí)施形態(tài)如上述那樣,由于能夠使用多個(gè)帳票的特征輸出帳票識別結(jié)果因此能夠進(jìn)行高精度的帳票識別。例如,能夠高精度的識別框和下劃線混合存在的帳票。
圖24是說明使用了3種帳票特征的帳票識別的處理動作的其它例子的流程圖,是與根據(jù)圖23說明過的流程的方法不同的方法的例子。
圖24中,首先,在步驟2400抽取框,在步驟2401中進(jìn)行利用框的帳票識別。接著,在步驟2402中,判斷是否拒絕利用框帳票識別,如果拒絕,則在步驟2403中抽取格,在步驟2404中進(jìn)行基于利用格的帳票識別。接著,在步驟2405中判斷是否拒絕利用格的帳票識別,在判斷為拒絕時(shí),在步驟2406中抽取文字行,在步驟2407中進(jìn)行利用了文字行的帳票識別。
圖24所示的處理中,如上述那樣,在拒絕了利用某種特征的帳票識別時(shí),由于進(jìn)行利用了其它特征的帳票識別,因此能夠縮短處理時(shí)間。圖26是示出處理中心和位于遠(yuǎn)方的支店或者事務(wù)所連接于網(wǎng)絡(luò)從而進(jìn)行帳票識別的系統(tǒng)的結(jié)構(gòu)例的框圖。圖26中,2600是網(wǎng)絡(luò),2601是中心站,2602是登錄站,2603、2604是生成站,2610~2612是支店站,2613是識別站。
圖26所示的系統(tǒng)構(gòu)成為在網(wǎng)絡(luò)2600上連接有在全國設(shè)有多個(gè)的中心站2601和設(shè)置在遠(yuǎn)方的支店或事務(wù)所中的支店站2610~2612。中心站2601中,具備進(jìn)行帳票登錄的登錄站2602,生成帳票的生成站2603。另外,在支店站2610~2612中,具備進(jìn)行帳票圖像的輸入、識別的識別站2613,能夠進(jìn)行支店中的帳票生成的生成站2614。在這樣構(gòu)成的系統(tǒng)中,經(jīng)過網(wǎng)絡(luò)2600,帳票識別用的辭典或者印刷用的帳票文件從中心站2601分發(fā)到各支店站2610~2612,因此能夠統(tǒng)一管理辭典等的保存,能夠減輕保存作業(yè)。
圖21是示出本發(fā)明其它實(shí)施形態(tài)的帳票圖像識別系統(tǒng)的結(jié)構(gòu)例的框圖。圖21中,2110是中心站,2111是遠(yuǎn)方站,2112是帳票生成站,2113是帳票文件,2114是帳票打印機(jī),其它的符號與圖1相同。
圖21所示的本發(fā)明其它實(shí)施形態(tài)帳票圖像識別系統(tǒng)構(gòu)成為經(jīng)過通信網(wǎng)絡(luò)100連接辭典登錄站101,帳票識別站106,帳票生成站109、2112,這些站能夠協(xié)同動作。而且,辭典登錄站101、帳票生成站109構(gòu)成為用點(diǎn)劃線包圍的中心站2110,另一方面,帳票識別站106、帳票生成站2112構(gòu)成為用點(diǎn)劃線包圍的設(shè)置在位于遠(yuǎn)方的各事務(wù)所中的遠(yuǎn)方站2111。
辭典登錄站101為了識別帳票的種類預(yù)先登錄帳票圖像的特征。在辭典登錄站101中,具備獲取帳票圖像的掃描儀102,保管成為登錄對象的帳票圖像的登錄對象帳票圖像文件103,保管登錄的帳票圖像的特征的帳票辭典文件104。另外,辭典登錄站101具有顯示裝置105,在該顯示裝置105的畫面上顯示登錄完畢的帳票圖像或者用掃描儀獲得的新的帳票圖像,對話式地進(jìn)行登錄作業(yè)。
帳票識別站106使用保管登錄的帳票圖像的特征的帳票辭典文件108識別從掃描儀107輸入的帳票圖像的種類。帳票辭典文件108的內(nèi)容復(fù)制了辭典登錄站101一側(cè)的帳票辭典文件104的內(nèi)容,經(jīng)過通信網(wǎng)絡(luò),能夠始終更新為最新的數(shù)據(jù)。另外,作為帳票識別中使用的帳票辭典文件,還可以是經(jīng)過通信網(wǎng)絡(luò)訪問辭典登錄站一側(cè)的帳票辭典文件104的結(jié)構(gòu)。
帳票生成站109具備帳票文件110和帳票打印機(jī)111,對于保管在帳票文件110中的帳票數(shù)據(jù),使用帳票打印機(jī)在紙張上印刷帳票。帳票生成站109為了使得帳票識別容易,編輯并印刷帳票數(shù)據(jù),在辭典登錄站101中,能夠用掃描儀102獲得印刷了的帳票的圖像,試行新登錄。
帳票生成站2112設(shè)置在作為事務(wù)所一側(cè)的遠(yuǎn)方站,連接帳票文件2113,帳票打印機(jī)2114。而且,保管在帳票文件2113中的帳票在事務(wù)所一側(cè)從帳票打印機(jī)2114印刷并進(jìn)行分發(fā)。這時(shí),在更新帳票辭典文件108,并且沒有保管最新的帳票文件時(shí),不存在帳票辭典文件108與帳票文件2113之間的匹配性,有可能對于前述的印刷并分發(fā)的帳票拒絕帳票識別。因此,需要檢測帳票辭典文件108與帳票文件2113的匹配性。
圖25是說明進(jìn)行帳票辭典文件108與帳票文件2113之間的匹配性檢測的處理動作的流程圖。
在圖25所示的流程中,帳票生成站2112,首先,在步驟2500中指定印刷對象的帳票的種類。接著,在步驟2501中搜索帳票辭典文件108,在步驟2502中判斷是否保管著該帳票辭典。如果保管著該帳票辭典,則在步驟2503中從帳票文件2113選擇該帳票數(shù)據(jù),在步驟2504中印刷帳票數(shù)據(jù)。另一方面,在步驟2502的判斷中,如果沒有保管著帳票辭典,則在步驟2505中向位于中心一側(cè)的辭典登錄站101發(fā)出帳票辭典的發(fā)送請求,更新帳票辭典文件108。由此,能夠保證保管與所印刷的帳票相對應(yīng)的帳票識別用辭典。
如以上那樣,本發(fā)明為了把預(yù)先登錄的多個(gè)帳票的特征與所輸入的帳票的特征相對照,進(jìn)行識別帳票的種類的帳票識別,公開了預(yù)先登錄帳票的特征的帳票登錄方法,該帳票登錄方法的特征是在畫面上顯示成為登錄對象的輸入帳票圖像和根據(jù)帳票識別判斷為相似的登錄完畢的帳票圖像,輸入上述輸入帳票是已經(jīng)登錄完畢還是未登錄這樣的使用者的判斷信息,并為了將對象帳票作為新帳票而登錄,將對象帳票的數(shù)據(jù)進(jìn)行編輯、印刷,試行再登錄;以及公開了把預(yù)先登錄的多個(gè)帳票的特征與所輸入的帳票的特征根據(jù)座標(biāo)位置進(jìn)行對照,識別帳票的種類的帳票識別方法。所公開的帳票識別方法,例如,是以下述為特征的帳票識別方法,即,把作為輸入帳票的輸入特征抽取出的各位置從預(yù)先登錄的帳票的登錄特征的基準(zhǔn)位置,沿著橫方向以及縱方向以一定間隔平行移動的同時(shí),與上述基準(zhǔn)位置相對照,把與登錄特征最一致的平行移動位置作為輸入帳票的位置,把具有最一致的登錄特征的帳票種類作為帳票識別結(jié)果。另外,帳票識別方法具備在輸入帳票的特征上賦予點(diǎn)座標(biāo)的輸入點(diǎn)和在登錄帳票的特征上賦予點(diǎn)座標(biāo)的辭典點(diǎn),計(jì)算上述輸入點(diǎn)與辭典點(diǎn)的距離,如果上述距離是預(yù)定值以下則判斷是否存在與輸入點(diǎn)相對應(yīng)的辭典點(diǎn),根據(jù)相對應(yīng)的點(diǎn)數(shù),輸入點(diǎn)數(shù)以及辭典點(diǎn)數(shù),把輸入帳票的特征與登錄帳票的特征相對照,求對照一致的程度,識別輸入帳票的種類。
如以上所說明的那樣,如果依據(jù)本發(fā)明,則由于根據(jù)從框線的傾斜或者帳票邊緣的傾斜而檢測出的帳票的傾斜角,對于框的中心點(diǎn)座標(biāo)進(jìn)行傾斜的修正,因此即使對于具有傾斜的帳票也能夠進(jìn)行高精度的帳票識別。另外,如果依據(jù)本發(fā)明,則由于把伸縮率設(shè)定為多個(gè),進(jìn)行輸入點(diǎn)座標(biāo)的放大縮小,因此即使在丟失特征或者發(fā)生偽格的帳票伸縮的情況下,也可以得到能夠計(jì)算相似度的效果。
進(jìn)而,如果依據(jù)本發(fā)明,則由于把原點(diǎn)以一定的間隔沿著橫方向以及縱方向平行移動,進(jìn)行點(diǎn)之間的對照,因此即使在輸入帳票中存在位置偏移的情況下,也能夠高精度地進(jìn)行帳票識別。另外,如果依據(jù)本發(fā)明,則由于對于框線種類不同的帳票,能夠按每個(gè)帳票或者每個(gè)帳票內(nèi)的框,切換框線種類的有效、無效,識別帳票的種類,因此可以得到能夠謀求提高帳票識別的可靠性,而且,能夠減少存儲總量的效果。
進(jìn)而,如果依據(jù)本發(fā)明,則由于作為輸入特征把框的中心點(diǎn)以90度單位旋轉(zhuǎn),進(jìn)行對照,因此即使把帳票以任意的方向設(shè)定在掃描儀中,也能夠進(jìn)行帳票的識別,另外,與利用格的分布特征的帳票識別相比較能夠進(jìn)行可靠的帳票的識別。
權(quán)利要求
1.一種帳票識別方法,該帳票識別方法根據(jù)位置座標(biāo),把預(yù)先登錄的多個(gè)帳票的特征與所輸入的帳票的特征相對照,識別帳票的種類,其特征在于從輸入帳票抽取出包含在帳票內(nèi)的一個(gè)或者多個(gè)框、格或者文字行,作為輸入特征抽取出作為帳票特征的框、格或者文字行的中心點(diǎn)座標(biāo),以90度單位旋轉(zhuǎn)上述輸入特征或者預(yù)先登錄的帳票的登錄特征中的某一個(gè),根據(jù)從框、格或者文字行檢測出的微小傾斜角,把上述輸入特征進(jìn)行微小角度修正,把輸入特征與登錄特征相對照,把最一致的角度作為輸入帳票的方向,把具有最一致的登錄特征的帳票種類作為帳票識別結(jié)果。
2.根據(jù)權(quán)利要求1所述的帳票識別方法,其特征在于輸出具有上述最一致角度的輸入帳票的方向。
3.一種帳票識別方法,其特征在于在所登錄的每個(gè)帳票種類或者每個(gè)帳票的框中具備把框的線種類置為有效·無效的識別控制信息,從輸入帳票抽取出框線的種類,求與預(yù)先登錄的帳票的框線種類的一致性,切換把即使框的形狀相同但框線的種類不同的帳票識別為其它類型的帳票的控制,以及如果框的形狀相同則即使框線的種類不同也識別為相同種類的帳票的控制。
4.一種帳票識別方法,該帳票識別方法根據(jù)位置座標(biāo)把預(yù)先登錄的多個(gè)帳票的特征與所輸入的帳票的特征進(jìn)行對照,識別帳票的種類,其特征在于把作為輸入帳票的輸入特征而抽取出的各位置座標(biāo)各以一定倍率沿著橫方向以及縱方向伸縮,或者,沿著橫方向或者縱方向假設(shè)多個(gè)伸縮率,根據(jù)上述假設(shè)的伸縮率使輸入特征伸縮,把與預(yù)先登錄的帳票的登錄特征最一致伸縮率作為輸入帳票的伸縮率,把具有最一致的登錄特征的帳票種類作為帳票識別結(jié)果。
5.根據(jù)權(quán)利要求4所述的帳票識別方法,其特征在于把上述最一致的伸縮率作為輸入帳票的伸縮率。
全文摘要
本發(fā)明提供即使從掃描儀輸入的帳票的方向不同,或者帳票具有伸縮,也能夠無誤地進(jìn)行帳票識別的帳票識別方法,或者,在預(yù)先登錄帳票的種類時(shí),能夠進(jìn)行帳票的更新修正的結(jié)構(gòu)的帳票登錄方法,從帳票抽取成為特征的輸入點(diǎn),對于輸入點(diǎn)進(jìn)行伸縮、旋轉(zhuǎn)、傾斜的修正,根據(jù)與預(yù)先登錄的辭典點(diǎn)的距離的最小值識別帳票的種類,另外,登錄帳票種類時(shí),能夠?qū)τ谙嗨茙て边M(jìn)行警告畫面顯示,該系統(tǒng)構(gòu)成為經(jīng)過通信網(wǎng)絡(luò)(100),連接辭典登錄站(101)、帳票識別站(106)和帳票生成站(109),各個(gè)站相互協(xié)同動作,進(jìn)行輸入帳票的識別以及向辭典的登錄。
文檔編號G06Q10/10GK1383094SQ02102049
公開日2002年12月4日 申請日期2002年1月18日 優(yōu)先權(quán)日2001年4月25日
發(fā)明者嶋好博 申請人:株式會社日立制作所, 日立電腦機(jī)器股份有限公司