欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信息處理裝置、信息處理方法以及程序的制作方法

文檔序號:6365926閱讀:175來源:國知局
專利名稱:信息處理裝置、信息處理方法以及程序的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息處理裝置、信息處理方法以及程序的技術(shù)。
背景技術(shù)
近年來,根據(jù)業(yè)務(wù)改善以及成本消減的觀點,在各種業(yè)務(wù)中正在開展文牘精簡化(paperless,無紙化辦公)。但在一個方面看來,仍然使用紙的情況還多數(shù)存在,例如在交易文件等方面仍然使用紙。以往,為了對這樣使用紙的業(yè)務(wù)的效率進(jìn)行改善,而使用了OCR (Optical Character Recognition :光學(xué)字符識別)軟件。為了在這樣的OCR軟件中指定讀取區(qū)域等,需要該讀取區(qū)域等的定義信息。在以下列舉的專利文獻(xiàn)I以及專利文獻(xiàn)2中,公開了與該定義信息相關(guān)的技術(shù)。
在專利文獻(xiàn)I中公開了這樣的技術(shù)按顏色來掃描圖像數(shù)據(jù),由此讀取與顏色相對應(yīng)的字符種類。另外,在專利文獻(xiàn)2中公開了這樣的技術(shù)對在由規(guī)定色框圍起的區(qū)域內(nèi)記載的屬性信息進(jìn)行識別,生成讀取項目的屬性信息定義體?,F(xiàn)有技術(shù)文獻(xiàn)專利文獻(xiàn)專利文獻(xiàn)I JP實開平05-008670號公報,專利文獻(xiàn)2 JP特開平05-081472號公報。然而,在以往的技術(shù)中,用戶在制作OCR軟件的定義信息時,針對從圖像數(shù)據(jù)中取得的讀取區(qū)域的位置信息,需要通過手動輸入來設(shè)定用于表示該讀取區(qū)域的記載內(nèi)容的項目名。

發(fā)明內(nèi)容
本發(fā)明正是考慮這樣的問題點而做成的,目的在于,提供一種能夠高效生成用于OCR軟件等的定義信息的技術(shù)。本發(fā)明為了解決上述問題而采用以下的結(jié)構(gòu)。S卩,本發(fā)明的信息處理裝置,其特征在于,包括區(qū)域識別部,其用于針對在圖像數(shù)據(jù)內(nèi)由規(guī)定的表現(xiàn)方式指定的區(qū)域,來識別第一區(qū)域和第二區(qū)域,所述第一區(qū)域是由第一區(qū)域指定表現(xiàn)方式指定的區(qū)域,所述第二區(qū)域是由與所述第一區(qū)域指定表現(xiàn)方式不同的第二區(qū)域指定表現(xiàn)方式指定的區(qū)域,位置信息取得部,其用于在所述圖像數(shù)據(jù)內(nèi)取得由所述區(qū)域識別部識別出的所述第一區(qū)域的位置信息,來作為用于指定成為字符識別對象的區(qū)域的位置信息,項目名取得部,其用于取得字符信息來作為項目名,所述字符信息是通過對由所述區(qū)域識別部識別出的所述第二區(qū)域內(nèi)存在的字符進(jìn)行識別而得的信息,所述項目名是針對由所述位置信息取得部取得的所述位置信息所指定的所述成為字符識別對象的區(qū)域的項目名。在此,區(qū)域指定表現(xiàn)方式是指,用于指定區(qū)域的表現(xiàn)方式,例如框、填充圖、陰影
坐寸ο
通過上述結(jié)構(gòu),識別出圖像數(shù)據(jù)內(nèi)中的第一區(qū)域與第二區(qū)域。并且,從第一區(qū)域取得用于指定成為字符識別對象的區(qū)域的位置信息。另外,從第二區(qū)域取得針對該成為字符識別對象的區(qū)域的項目名。因此,用戶無需通過手動輸入來設(shè)定與所取得的位置信息相關(guān)的針對成為字符識別對象的區(qū)域的項目名。因此,通過上述結(jié)構(gòu),能夠高效地生成(制作)用于OCR軟件等的定義信息。另外,作為本發(fā)明的其它方式,本發(fā)明的信息處理裝置還具有用于使所述第一區(qū)域與所述第二區(qū)域相對應(yīng)關(guān)聯(lián)的對應(yīng)關(guān)聯(lián)部,
所述項目名取得部,在被所述對應(yīng)關(guān)聯(lián)部對應(yīng)關(guān)聯(lián)的所述第一區(qū)域和第二區(qū)域中,可以從被對應(yīng)關(guān)聯(lián)的所述第二區(qū)域取得所述字符信息來作為針對特定區(qū)域的項目名,所述特定區(qū)域是由特定位置信息指定的所述成為字符識別對象的區(qū)域,所述特定位置信息是從被對應(yīng)關(guān)聯(lián)的所述第一區(qū)域取得的位置信息。通過上述結(jié)構(gòu),使得用于指定成為字符識別對象的區(qū)域的位置信息與針對該成為字符識別對象的區(qū)域的項目名相對應(yīng)關(guān)聯(lián)。因此,用戶無需再進(jìn)行使所取得的位置信息與項目名相對應(yīng)關(guān)聯(lián)的處理。因此,通過上述結(jié)構(gòu),能夠高效地生成(制作)用于OCR軟件等的定義信息。另外,作為本發(fā)明的其它實施方式,所述對應(yīng)關(guān)聯(lián)部可以使所述第一區(qū)域與在圖像數(shù)據(jù)上距離所述第一區(qū)域最近的所述第二區(qū)域相對應(yīng)關(guān)聯(lián)。另外,作為本發(fā)明的其它實施方式,所述對應(yīng)關(guān)聯(lián)部,可以判斷所述第一區(qū)域的位置與所述第二區(qū)域的位置的位置關(guān)系是否滿足規(guī)定條件,使判斷為滿足規(guī)定條件的所述第一區(qū)域與所述第二區(qū)域相對應(yīng)關(guān)聯(lián)。另外,作為本發(fā)明的其它實施方式,所述對應(yīng)關(guān)聯(lián)部,可以在圖像數(shù)據(jù)內(nèi)縱向排列的多個第一區(qū)域與縱向排列的多個第二區(qū)域中,判斷為橫向排列的一個第一區(qū)域與一個第二區(qū)域滿足所述規(guī)定條件。另外,作為本發(fā)明的其它實施方式,所述對應(yīng)關(guān)聯(lián)部,可以在圖像數(shù)據(jù)內(nèi)橫向排列的多個第一區(qū)域與橫向排列的多個第二區(qū)域中,判斷為縱向排列的一個第一區(qū)域與一個第二區(qū)域滿足所述規(guī)定條件。另外,作為本發(fā)明的其它實施方式,所述對應(yīng)關(guān)聯(lián)部,可以識別存在于圖像數(shù)據(jù)內(nèi)的表示所述第一區(qū)域與所述第二區(qū)域的對應(yīng)關(guān)系的規(guī)定的對應(yīng)關(guān)系指示表現(xiàn)方式,基于識別出的該對應(yīng)關(guān)系,使所述第一區(qū)域與所述第二區(qū)域相對應(yīng)關(guān)聯(lián)。另外,作為本發(fā)明的其它實施方式,本發(fā)明的信息處理裝置還可以具有用于生成項目定義信息的項目定義信息生成部,所述項目定義信息包括用于對由所述位置信息取得部取得的所述成為字符識別對象的區(qū)域進(jìn)行指定的所述位置信息,由所述項目名取得部取得的針對由所述位置信息指定的所述成為字符識別對象的區(qū)域的所述項目名。此外,作為本發(fā)明的其它實施方式,可以是用于實現(xiàn)以上各結(jié)構(gòu)的信息處理方法,也可以是程序,也可以是存儲了這樣的程序的、計算機(jī)能夠讀取的存儲介質(zhì)。另外,作為本發(fā)明的其它實施方式,也可以是由用于實現(xiàn)以上各結(jié)構(gòu)的多個裝置構(gòu)成的信息處理系統(tǒng),所述多個裝置能夠相互通信。通過本發(fā)明,提供了一種能夠高效地生成(制作)用于OCR軟件等的定義信息的技術(shù)。


圖I例示出實施方式的信息處理裝置的處理。圖2例示出實施方式的信息處理裝置的結(jié)構(gòu)。圖3是表示實施方式的信息處理裝置的處理順序一例的流程圖。圖4表示通過實施方式的信息處理裝置處理的圖像數(shù)據(jù)的一例。圖5表示第一區(qū)域與第二區(qū)域的掃描順序的一例。圖6表示第一區(qū)域與第二區(qū)域的對應(yīng)關(guān)聯(lián)的一例。
圖7表示第一區(qū)域與第二區(qū)域的對應(yīng)關(guān)聯(lián)的一例。圖8表示第一區(qū)域與第二區(qū)域的對應(yīng)關(guān)聯(lián)的一例。圖9表示第一區(qū)域與第二區(qū)域的對應(yīng)關(guān)聯(lián)的一例。圖10表示從圖4所示的圖像數(shù)據(jù)中取得的項目定義信息的一例。附圖標(biāo)記的說明I信息處理裝置,2掃描儀,11存儲部,12控制部,13 總線,14輸入輸出部,31區(qū)域識別部,32位置信息取得部,33項目名取得部,34對應(yīng)關(guān)聯(lián)部,35項目定義信息生成部50、50a、50b、50c 第一區(qū)域,60、60a、60b、60c 第二區(qū)域,70對應(yīng)關(guān)系指示表現(xiàn)方式(箭頭),71對應(yīng)關(guān)系指示表現(xiàn)方式(線段),72a、72b對應(yīng)關(guān)系指示表現(xiàn)方式(標(biāo)記)。
具體實施例方式下面,說明本發(fā)明的一方面的信息處理裝置、信息處理方法以及程序等的實施方式(下面也稱為“本實施方式”)。但是,本實施方式是例示,本發(fā)明并非限于本實施方式的結(jié)構(gòu)。此外,雖然通過自然語言(中文等)來說明本實施方式中出現(xiàn)的數(shù)據(jù),但在具體實施中,能夠用計算機(jī)可識別的模擬語言、指令、參數(shù)、機(jī)器語言等來指定?!?I信息處理裝置利用圖I以及圖2來說明本實施方式的信息處理裝置。< 概要 >
圖I例示出本實施方式的信息處理裝置所執(zhí)行的處理。本實施方式的信息處理裝置對第一區(qū)域50和第二區(qū)域60進(jìn)行識別,該第一區(qū)域50和第二區(qū)域60是在圖像數(shù)據(jù)內(nèi)根據(jù)規(guī)定表現(xiàn)方式而指定的區(qū)域。第一區(qū)域50由第一區(qū)域指定表現(xiàn)方式來指定。另一方面,第二區(qū)域60由第二區(qū)域指定表現(xiàn)方式來指定。即,第一區(qū)域50和第二區(qū)域60的區(qū)域指定表現(xiàn)方式不同。區(qū)域指定表現(xiàn)方式是用于指定區(qū)域的表現(xiàn)方式,例如,框、填充圖(filling)、各種陰影等。在圖I所示的例子中,第一區(qū)域指定表現(xiàn)方式僅為框。即,在第一區(qū)域指定表現(xiàn)方式中,在框內(nèi)沒有填充圖以及各種陰影等。另一方面,在圖I所示的例子中,第二區(qū)域指定表現(xiàn)方式是填充圖。第一區(qū)域50是在圖像數(shù)據(jù)內(nèi)作為字符識別對象而被指定的區(qū)域。另外,第二區(qū)域60是特定的項目名所存在的區(qū)域,所述特定的項目名是針對被指定為字符識別對象的區(qū)域的項目名。例如,用戶在表單或卡片等的紙面上通過標(biāo)記、封印或印刷等,來描畫框、填充圖或各種陰影等,由此指定第一區(qū)域50和第二區(qū)域60。信息處理裝置利用掃描儀等來讀取這樣指定了第一區(qū)域50和第二區(qū)域60的紙,由此取得指定了第一區(qū)域50和第二區(qū)域60的圖像數(shù)據(jù)。本實施方式的信息處理裝置對由不同區(qū)域指定表現(xiàn)方式所指定的第一區(qū)域50和第二區(qū)域60進(jìn)行識別。并且,本實施方式的信息處理裝置從第一區(qū)域50中取得用于指定成為字符識別對象的區(qū)域的位置信息。另外,本實施方式的信息處理裝置從第二區(qū)域60中取得針對成為該字符識別對象的區(qū)域的項目名(與成為該字符識別對象的區(qū)域相關(guān)的項目名)。這樣一來,本實施方式的信息處理裝置,從在圖像數(shù)據(jù)上被指定的第一區(qū)域以及第二區(qū)域中,針對成為字符識別對象的區(qū)域,分別取得位置信息和項目名,由此,用戶能夠高效制作定義信息。此外,用戶也可以利用描畫軟件等來編輯圖像數(shù)據(jù),由此在該圖像數(shù)據(jù)上指定第一區(qū)域50和第二區(qū)域60。<結(jié)構(gòu)例>圖2表示本實施方式的信息處理裝置I的結(jié)構(gòu)例。信息處理裝置I如圖2所示,作為其硬件結(jié)構(gòu),具有與總線13連接的存儲部11、控制部12、輸入輸出部14等。存儲部11用于存儲由控制部12執(zhí)行的處理中所用的各種數(shù)據(jù)和程序(未圖示)。存儲部11例如由硬盤實現(xiàn)。存儲部11也可以由USB (UniversalSerial Bus:通用串行總線)存儲器等的存儲介質(zhì)實現(xiàn)。此外,存儲部11所存儲的上述各種數(shù)據(jù)和程序也可以從⑶(CompactDisc :光盤)或DVD(Digital Versatile Disc :數(shù)字化通用磁盤)等的存儲介質(zhì)中取得。另外,存儲部11也可以稱為輔助存儲裝置。 控制部12具有微處理器或CPU (Central Processing Unit :中央處理器)等的一個或多個處理器;該處理器的處理所使用的周邊電路(ROM(Readonly Memory :只讀存儲器)、RAM (Random Access Memory :隨機(jī)存取存儲器)、接口電路等)??刂撇?2通過執(zhí)行存儲在存儲部11中的各種數(shù)據(jù)和程序,來實現(xiàn)本實施方式中的信息處理裝置I的處理。從配置在由控制部12內(nèi)的處理器訪問的地址空間內(nèi)的意義上來說,ROM、RAM等也可以稱為主
存儲裝置。輸入輸出部14是一個或多個接口,用于與信息處理裝置I外部的裝置之間收發(fā)數(shù)據(jù)。輸入輸出部14例如是用于連接LAN(Local Area Network :局域網(wǎng))電纜的接口,用于與輸入裝置以及輸出裝置等用戶接口相連接的接口,或USB(Universal Serial Bus :通用串行總線)等的接口。如圖2所示,輸入輸出部14例如可以與掃描儀2相連接。另外,輸入輸出部14也可以與未圖示的用戶接口(觸摸面板、輔助鍵盤、鍵盤、鼠標(biāo)、顯示器等的輸入輸出裝置)相連接。進(jìn)而,輸入輸出部14也可以與⑶驅(qū)動器、DVD驅(qū)動器等可裝拆的存儲介質(zhì)的輸入輸出裝置相連接,或者與存儲卡等的非易失性的便攜式存儲介質(zhì)等的輸入輸出裝置相連接。輸入輸出部14也可以具有進(jìn)行網(wǎng)絡(luò)連接的接口(通信部)功能。
本實施方式的信息處理裝置,分別取得針對成為字符識別對象的區(qū)域的位置信息和項目名,由此使用戶高效地制作定義信息。該處理實現(xiàn)為控制部12的處理。如圖2所示,控制部12為了實現(xiàn)上述處理而包括區(qū)域識別部31、位置信息取得部32、項目名取得部33、對應(yīng)關(guān)聯(lián)部34以及項目定義信息生成部35。例如,通過在作為控制部12的周邊電路的RAM等中將存儲在存儲部11中的程序等展開,由控制部12的處理器來執(zhí)行這些程序等,由此實現(xiàn)區(qū)域識別部31、位置信息取得部32、項目名取得部33、對應(yīng)關(guān)聯(lián)部34以及項目定義信息生成部35。區(qū)域識別部31,針對在圖像數(shù)據(jù)內(nèi)由規(guī)定表現(xiàn)方式指定的區(qū)域,來識別第一區(qū)域和第二區(qū)域,所述第一區(qū)域是由第一區(qū)域指定表現(xiàn)方式所指定的區(qū)域,所述第二區(qū)域是由與所述第一區(qū)域指定表現(xiàn)方式不同的第二區(qū)域指定表現(xiàn)方式所指定的區(qū)域。區(qū)域識別部31例如區(qū)分識別出圖I所示的第一區(qū)域50和第二區(qū)域60。位置信息取得部32在圖像數(shù)據(jù)內(nèi)取得由區(qū)域識別部識別出的第一區(qū)域的位置信息,將其作為用于指定成為字符識別對象的區(qū)域的位置信息。如圖I所示,位置信息取得部32例如取得圖像數(shù)據(jù)內(nèi)的第一區(qū)域50的位置信息,將其作為用于指定成為字符識別對象的區(qū)域的位置信息。此外,位置信息取得部32也可以為了后述的對應(yīng)關(guān)聯(lián)部34的處理而可以取得第二區(qū)域的位置信息。位置信息取得部32例如取得圖I所示的圖像數(shù)據(jù)內(nèi)的第二區(qū)域60的
位置信息。項目名取得部33取得字符信息來作為項目名,所述字符信息是通過對由區(qū)域識別部31識別出的第二區(qū)域內(nèi)存在的字符進(jìn)行識別而得到的信息,所述項目名是針對成為字符識別對象的區(qū)域的項目名,所述字符識別對象是根據(jù)由位置信息取得部32取得的位置信息而指定的。如圖I所示,例如,項目名取得部33取得通過對第二區(qū)域內(nèi)存在的字符進(jìn)行字符識別而得的字符信息,來作為針對第一區(qū)域50的項目名。此外,如后述,對應(yīng)關(guān)聯(lián)部34對第一區(qū)域和第二區(qū)域進(jìn)行對應(yīng)關(guān)聯(lián)。在本實施方式中,對應(yīng)關(guān)聯(lián)部34對第一區(qū)域和第二區(qū)域進(jìn)行對應(yīng)關(guān)聯(lián),從被關(guān)聯(lián)的第一區(qū)域取得位置信息,根據(jù)取得的位置信息指定作為字符識別對象的區(qū)域,項目名取得部33從關(guān)聯(lián)的該第二區(qū)域取得字符信息來作為針對該區(qū)域的項目名。對應(yīng)關(guān)聯(lián)部34使第一區(qū)域和第二區(qū)域?qū)?yīng)關(guān)聯(lián)。
例如,對應(yīng)關(guān)聯(lián)部34使第一區(qū)域與在圖像數(shù)據(jù)上距離該第一區(qū)域最近的第二區(qū)域相對應(yīng)關(guān)聯(lián)。另外,例如,對應(yīng)關(guān)聯(lián)部34判斷第一區(qū)域的位置與第二區(qū)域的位置之間的位置關(guān)系是否滿足規(guī)定條件,將判斷為滿足規(guī)定條件的第一區(qū)域與第二區(qū)域相對應(yīng)關(guān)聯(lián)。規(guī)定條件是針對對應(yīng)關(guān)系中第一區(qū)域與第二區(qū)域的位置關(guān)系賦予的條件。詳細(xì)后述。另外,例如,對應(yīng)關(guān)聯(lián)部34識別出存在于圖像數(shù)據(jù)內(nèi)的規(guī)定的對應(yīng)關(guān)系指示表現(xiàn)方式,該規(guī)定的對應(yīng)關(guān)系指示表現(xiàn)方式表示第一區(qū)域與第二區(qū)域的對應(yīng)關(guān)聯(lián)。并且,對應(yīng)關(guān)聯(lián)部34基于該識別出的對應(yīng)關(guān)系,來使第一區(qū)域與第二區(qū)域?qū)?yīng)關(guān)聯(lián)。對應(yīng)關(guān)系指示表現(xiàn)方式表示第一區(qū)域與第二區(qū)域的對應(yīng)關(guān)聯(lián)。例如,對應(yīng)關(guān)系指示表現(xiàn)方式是指設(shè)在第一區(qū)域與第二區(qū)域之間的箭頭,連接第一區(qū)域與第二區(qū)域的線段,在第一區(qū)域與第二區(qū)域標(biāo)注的相同標(biāo)記或印記。對應(yīng)關(guān)系指示表現(xiàn)方式只要能夠表示第一 區(qū)域與第二區(qū)域的對應(yīng)關(guān)系即可,可以使用任何方式實現(xiàn)。項目定義信息生成部35生成包括位置信息和項目名的項目定義信息,該位置信息是位置信息取得部32取得的用于指定成為字符識別對象的區(qū)域的信息,該項目名是,由項目名取得部33取得的、針對由該位置信息指定的成為字符識別對象的區(qū)域的項目名。所生成的項目定義信息,是用于指定成為字符識別對象的區(qū)域的位置以及項目名的信息。該項目定義信息例如通過OCR軟件等使用?!?2動作例接著,利用圖3來說明本實施方式的信息處理裝置I的動作例。圖3表示本實施方式的信息處理裝置I的處理順序的一例。此外,在圖3中,將步驟簡稱為“S”。
< 開始 >首先,例如響應(yīng)于用戶的操作,存儲在存儲部11中的程序被展開在控制部12的RAM等中。然后,由控制部12的處理器執(zhí)行展開在控制部12的RAM等中的該程序。這樣一來,信息處理裝置I開始處理。〈步驟101〉接著,控制部12取得用于該處理的圖像數(shù)據(jù)(步驟101)。所取得的圖像數(shù)據(jù)例如可以是通過圖2所示的掃描儀2獲取的數(shù)據(jù)。另外,所取得的圖像數(shù)據(jù)也可以是存儲在存儲部11中的數(shù)據(jù)。這樣的圖像數(shù)據(jù)也可以是通過網(wǎng)絡(luò)取得的。另外,圖像數(shù)據(jù)也可以是從存儲卡等的非易失性的便攜式的存儲介質(zhì)等中取得的。圖4表示此時取得的圖像數(shù)據(jù)的一例。圖像數(shù)據(jù)例如是通過對表單以及卡片等紙介質(zhì)進(jìn)行電子化而得到的數(shù)據(jù)。如圖4所示,第一區(qū)域(50a、50b)以及第二區(qū)域(60a、60b),被指定在記載于表單以及卡片等中的欄以及字符等之上。將第一區(qū)域(50a、50b)以及第二區(qū)域(60a、60b)表現(xiàn)為能夠與記載于表單以及卡片等中的欄以及字符等相區(qū)別。例如,為了使第一區(qū)域(50a、50b)以及第二區(qū)域(60a、60b)能夠明確地與記載于表單以及卡片等中的欄以及字符等相區(qū)別,可以用與記載于表單以及卡片等中的欄以及字符等的顏色不同的顏色來表現(xiàn)第一區(qū)域(50a、50b)以及第二區(qū)域^0a、60b)。如果這樣表現(xiàn),通過對該不同顏色進(jìn)行檢測讀取的OCR引擎,能夠從圖像數(shù)據(jù)內(nèi)描畫圖像數(shù)據(jù)中,只提取第一區(qū)域(50a、50b)以及第二區(qū)域^0a、60b)的區(qū)域指定表現(xiàn)方式。例如,如果記載在表單以及卡片等中欄以及字符等為黑色,則該OCR引擎檢測讀取該黑色以外的顏色,由此提取第一區(qū)域(50a、50b)以及第二區(qū)域(60a、60b)。但是,并非一定要用與記載于表單以及卡片等中的欄以及字符等的顏色不同的顏色來表現(xiàn)第一區(qū)域(50a、50b)以及第二區(qū)域(60a、60b)。例如,只要通過能夠與記載于表單以及卡片等中的欄等的區(qū)域指定表現(xiàn)方式相區(qū)別的區(qū)域指定表現(xiàn)方式來表現(xiàn)出將第一區(qū)域(50a、50b)以及第二區(qū)域(60a、60b)即可,也可以使用與記載于表單以及卡片等中的欄以及字符等的顏色相同的顏色來表現(xiàn)。< 步驟 102〉接著,如圖3所示,控制部12對在步驟101中取得的圖像數(shù)據(jù)內(nèi)的第一區(qū)域進(jìn)行識別(步驟102)。在圖4所示的圖像數(shù)據(jù)中、使用框來作為第一區(qū)域指定表現(xiàn)方式。換言之,在圖4所示的圖像數(shù)據(jù)中,第一區(qū)域(50a、50b)是由框表現(xiàn)出來的??刂撇?2對由該框表現(xiàn)的第一區(qū)域(50a、50b)進(jìn)行識別?!だ?,控制部12從在圖像數(shù)據(jù)內(nèi)描畫的圖像數(shù)據(jù)中提取第一區(qū)域以及第二區(qū)域的區(qū)域指定表現(xiàn)方式。由于第一區(qū)域(50a、50b)以及第二區(qū)域(60a、60b)表現(xiàn)為能夠與記載于表單以及卡片等中的欄以及字符等相區(qū)別,因此該提取能夠執(zhí)行。接著,控制部12從所提取的第一區(qū)域以及第二區(qū)域的區(qū)域指定表現(xiàn)方式中確定第一區(qū)域指定表現(xiàn)方式的區(qū)域。例如通過圖案匹配等來實現(xiàn)用于該確定的處理。并且,控制部12將所確定的區(qū)域識別為第一區(qū)域。這樣一來,控制部12在圖4所示的圖像數(shù)據(jù)內(nèi)識別出由框表現(xiàn)的第一區(qū)域(50a、50b)ο〈步驟103〉接著,控制部12取得在步驟102中識別出的第一區(qū)域的圖像數(shù)據(jù)內(nèi)的位置信息(步驟103)。位置信息只要是表示圖像數(shù)據(jù)內(nèi)的位置的信息即可,可以是任意信息。在本實施方式中,用xy坐標(biāo)系來表現(xiàn)位置信息,該xy坐標(biāo)系以圖像數(shù)據(jù)的左上端為原點,以橫軸為X軸,以縱軸為y軸。但是,位置信息的表現(xiàn)方式并不限于xy坐標(biāo)系。例如,位置信息的表現(xiàn)方式也可以是極坐標(biāo)系,該極坐標(biāo)系以圖像數(shù)據(jù)的某一點(例如,圖像數(shù)據(jù)的中心)為原點。另外,本實施方式的第一區(qū)域的位置信息包括第一區(qū)域的左上端的位置(坐標(biāo))、橫向長度以及縱向長度。該位置信息如后述的圖9中例示??刂撇?2確定在步驟102中識別出的第一區(qū)域的左上端的位置坐標(biāo)。另外,控制部12確定所識別出的第一區(qū)域的橫向長度與縱向長度。由此,控制部12取得所識別出的第一區(qū)域的圖像數(shù)據(jù)內(nèi)的位置信息。〈步驟104〉接著,控制部12對在步驟101中取得的圖像數(shù)據(jù)內(nèi)的第二區(qū)域進(jìn)行識別(步驟104)。在圖4所示的圖像數(shù)據(jù)中,用填充圖作為第二區(qū)域指定表現(xiàn)方式。換言之,在圖4所示的圖像數(shù)據(jù)中、第二區(qū)域^0a、60b)由填充圖表現(xiàn)出來。控制部12對由該填充圖表現(xiàn)的第二區(qū)域(60a、60b)進(jìn)行識別。此外,利用與在步驟102中的第一區(qū)域的識別方法相同的方法來識別該第二區(qū)域。〈步驟105〉
接著,控制部12取得在步驟104中識別出的第二區(qū)域的圖像數(shù)據(jù)內(nèi)的位置信息(步驟105)。此外,該步驟105也可以省略。本實施方式中,由于在后述的步驟107中使用對應(yīng)關(guān)聯(lián)的第二區(qū)域的位置信息,因此取得該第二區(qū)域的位置信息。此外,第二區(qū)域的位置信息的取得方法與步驟103中的第一區(qū)域的位置信息的取得方法相同?!床襟E106〉接著,控制部12通過對在步驟104中識別出的第二區(qū)域內(nèi)存在的字符進(jìn)行字符識另|J,由此取得該第二區(qū)域內(nèi)存在的字符的字符信息(步驟106)。字符識別可以通過任意方法執(zhí)行。在本步驟106中,控制部12通過對記載在第二區(qū)域內(nèi)的字符進(jìn)行字符識別,由此取得記載在該第二區(qū)域內(nèi)的字符的字符信息。此外,所取得的字符信息,作為針對成為字符識別對象的第一區(qū)域的項目名。第一 區(qū)域與第二區(qū)域分別只存在一個時,只考慮一種第一區(qū)域與第二區(qū)域的組合,因此無需確定第一區(qū)域與第二區(qū)域的對應(yīng)關(guān)系。即,在本步驟106中從第二區(qū)域取得的字符信息,無需確定是針對哪個第一區(qū)域的項目名。在本步驟106中取得了字符信息的時刻,將該字符信息確定為針對步驟102以及103所涉及的第一區(qū)域的項目名。另一方面,在第一區(qū)域與第二區(qū)域分別存在多個時,需要確定從第二區(qū)域取得的字符信息是針對哪個第一區(qū)域的項目名。在本實施方式中,在后述的步驟107中,通過使第一區(qū)域與第二區(qū)域相對應(yīng)關(guān)聯(lián),由此確定從第二區(qū)域取得的字符信息是針對哪個第一區(qū)域的項目名。然而,這樣的對應(yīng)關(guān)聯(lián)并非都是必要的。例如,如圖5所示,控制部12從圖像數(shù)據(jù)的上部開始按順序進(jìn)行掃描,從而進(jìn)行步驟102涉及的第一區(qū)域的識別以及步驟104涉及的第二區(qū)域的識別。并且,控制部12每發(fā)現(xiàn)一個第一區(qū)域和一個第二區(qū)域,就會重復(fù)步驟102 106的處理。此時,所處理的第一區(qū)域與第二區(qū)域一直分別為一個,因此不需要上述對應(yīng)關(guān)聯(lián)的處理。此外,例如,如果這樣執(zhí)行處理,則在圖5所示的例子中,從第二區(qū)域60a取得的字符信息被確定為針對第一區(qū)域50a的項目名。另外,從第二區(qū)域60b取得的字符信息被確定為針對第一區(qū)域50b的項目名。從第二區(qū)域60c取得的字符信息被確定為針對第一區(qū)域50c的項目名。此外,在該處理中,根據(jù)發(fā)現(xiàn)第一區(qū)域與第二區(qū)域的順序,交替執(zhí)行步驟102 103和步驟104 106?!床襟E107〉接著,控制部12確定在步驟102中識別出的第一區(qū)域與在步驟104中識別出的第二區(qū)域之間的對應(yīng)關(guān)系,因此將該第一區(qū)域與該第二區(qū)域相對應(yīng)關(guān)聯(lián)。例如在對應(yīng)關(guān)聯(lián)的第一區(qū)域與第二區(qū)域分別為一個時,也可以省略本步驟107。在本步驟107中,如上述,確定從第二區(qū)域取得的字符信息是針對哪個第一區(qū)域的項目名。利用圖6 9來說明控制部12進(jìn)行的對應(yīng)關(guān)聯(lián)的處理的例子。例如,控制部12將第一區(qū)域與圖像數(shù)據(jù)上距離該第一區(qū)域最近的第二區(qū)域相對應(yīng)關(guān)聯(lián)。圖6表示該處理的例子。在本實施方式中,在步驟103以及105中,取得第一區(qū)域與第二區(qū)域的位置信息。在該位置信息中,包括各區(qū)域的左上端的位置坐標(biāo)??刂撇?2利用該位置坐標(biāo),分別計算第一區(qū)域與第二區(qū)域的距離。即,控制部12分別計算第一區(qū)域的左上端的位置坐標(biāo)與第二區(qū)域的左上端的位置坐標(biāo)之間的距離。并且,控制部12將該距離最短的第一區(qū)域與第二區(qū)域相對應(yīng)關(guān)聯(lián)。在圖6所示的例子中,控制部12將第一區(qū)域50a與圖像數(shù)據(jù)上距離該第一區(qū)域50a最近的第二區(qū)域60a相對應(yīng)關(guān)聯(lián)。另外,將第一區(qū)域50b與圖像數(shù)據(jù)上距離該第一區(qū)域50b最近的第二區(qū)域60b相對應(yīng)關(guān)聯(lián)。此外,也可以交換該處理中的第一區(qū)域與第二區(qū)域。即,控制部12也可以將第二區(qū)域與圖像數(shù)據(jù)上距離該第二區(qū)域最近的第一區(qū)域相對應(yīng)關(guān)聯(lián)。另外,例如,控制部12也可以判斷第一區(qū)域的位置與第二區(qū)域的位置之間的位置關(guān)系是否滿足規(guī)定條件,從而將判斷為滿足規(guī)定條件的第一區(qū)域與第二區(qū)域相對應(yīng)關(guān)聯(lián)。規(guī)定條件是在對應(yīng)關(guān)系中對第一區(qū)域與第二區(qū)域的位置關(guān)系附加的條件。例如,規(guī)定條件涉及對應(yīng)關(guān)系中第一區(qū)域與第二區(qū)域的距離??刂撇?2,在圖像數(shù)據(jù)內(nèi)的第一區(qū)域與第二區(qū)域中,判斷為處于閾值以內(nèi)距離的第一區(qū)域與第二區(qū)域滿足規(guī)定條件,所述閾值可以由用戶設(shè)定以及變更。另外,例如,規(guī)定條件涉及對應(yīng)關(guān)系中第一區(qū)域與第二區(qū)域的相對位置關(guān)系??刂撇?2,在圖像數(shù)據(jù)內(nèi)的第一區(qū)域與第二區(qū)域中,判斷為處于某特定相對位置關(guān)系的第一區(qū)域與第二區(qū)域滿足規(guī)定條件。在此,在本實施方式中,相對位置關(guān)系表現(xiàn)為,以圖像數(shù)據(jù)的左上端為原點,指向第一區(qū)域左上端的矢量與指向第二區(qū)域左上端的矢量之間的差分矢量。另外,某特定相對位置關(guān)系表現(xiàn)為,應(yīng)該滿足該差分矢量的條件矢量。并且,例如,在該差分矢量與條件矢量的內(nèi)積處于特定范圍內(nèi)的情況下,判斷為該差分矢量的第一區(qū)域與第二區(qū)域滿足某特定相對位置關(guān)系,該特定范圍是能夠由用戶設(shè)定以及變更值的范圍。另外,例如,規(guī)定條件涉及對應(yīng)關(guān)系中的第一區(qū)域與第二區(qū)域的橫向排列方式。控制部12,在圖像數(shù)據(jù)內(nèi)縱向排列的第一區(qū)域與縱向排列的第二區(qū)域中,判斷為橫向排列的第一區(qū)域與第二區(qū)域滿足規(guī)定條件。圖7例示出滿足該條件的第一區(qū)域與第二區(qū)域。此外,圖7中的坐標(biāo)(X、y)中的X表示橫軸(X軸)的坐標(biāo)。另外,y表示縱軸(y軸)的坐標(biāo)。在此,在本實施方式中,縱向排列的第一區(qū)域是指,與第一區(qū)域的左上端的橫軸(X軸)相關(guān)的位置坐標(biāo)(X坐標(biāo))存在于閾值以內(nèi)誤差范圍內(nèi)的第一區(qū)域,所述閾值能夠由用戶設(shè)定以及變更。例如,圖7所示的第一區(qū)域50a的X坐標(biāo)為70。第一區(qū)域50b的x坐標(biāo) 為68。第一區(qū)域50c的X坐標(biāo)為70。此時,例如如果閾值為5,則第一區(qū)域50a、第一區(qū)域50b以及第一區(qū)域50c分別是縱向排列的第一區(qū)域。針對第二區(qū)域也是同樣的。在本實施方式中,縱向排列的第二區(qū)域是指,與第二區(qū)域的左上端的橫軸(X軸)相關(guān)的位置坐標(biāo)(X坐標(biāo))存在于閾值以內(nèi)誤差范圍內(nèi)的第二區(qū)域,所述閾值能夠由用戶設(shè)定以及變更。例如,圖7所示的第二區(qū)域60a的X坐標(biāo)為20。第二區(qū)域60b的X坐標(biāo)為21。第二區(qū)域60c的X坐標(biāo)為19。此時,例如如果閾值為5,則第二區(qū)域60a、第二區(qū)域60b以及第二區(qū)域60c分別為縱向排列的第二區(qū)域。控制部12取得這樣縱向排列的第一區(qū)域與縱向排列的第二區(qū)域。并且,控制部12,在縱向排列的第一區(qū)域以及第二區(qū)域中,判斷為橫向排列的第一區(qū)域與第二區(qū)域滿足上述規(guī)定條件。在此,在本實施方式中,第一區(qū)域與第二區(qū)域橫向排列是指如下狀態(tài)第一區(qū)域左上端的縱軸(y軸)所相關(guān)的位置坐標(biāo)(y坐標(biāo))與第二區(qū)域左上端的縱軸所相關(guān)的位置坐標(biāo)之間的差,處于能夠由用戶設(shè)定以及變更的閾值以內(nèi)。
例如,圖7所示的第一區(qū)域50a的y坐標(biāo)為59。第一區(qū)域50b的y坐標(biāo)為98。第一區(qū)域50c的y坐標(biāo)為140。與此相對,圖7所示的第二區(qū)域60a的y坐標(biāo)為60。第二區(qū)域60b的Y坐標(biāo)為100。第二區(qū)域60c的Y坐標(biāo)為141。此時,例如如果閾值為5,則控制部12判斷為第一區(qū)域50a與第二區(qū)域60a為橫向排列,滿足規(guī)定條件。另外,控制部12判斷為第一區(qū)域50b與第二區(qū)域60b為橫向排列,滿足規(guī)定條件。進(jìn)而,控制部12判斷為第一區(qū)域50c與第二區(qū)域60c為橫向排列,滿足規(guī)定條件。即,控制部12使第一區(qū)域50a與第二區(qū)域60a相對應(yīng)關(guān)聯(lián)。另外,控制部12使第一區(qū)域50b與第二區(qū)域60b相對應(yīng)關(guān)聯(lián)。進(jìn)而,控制部12使第一區(qū)域50c與第二區(qū)域60c相對應(yīng)關(guān)聯(lián)。另外,例如,規(guī)定條件涉及對應(yīng)關(guān)系中的第一區(qū)域與第二區(qū)域的縱向排列方式??刂撇?2,在圖像數(shù)據(jù)內(nèi)橫向排列的第一區(qū)域與橫向排列的第二區(qū)域中,判斷為縱向排列的第一區(qū)域與第二區(qū)域滿足規(guī)定條件。圖8例示出滿足該條件的第一區(qū)域與第二區(qū)域。圖8中的坐標(biāo)(x、y)與圖7中的坐標(biāo)相同。
在此,判斷第一區(qū)域是否為橫向排列的方法,以及判斷第二區(qū)域是否為橫向排列的方法,與判斷上述第一區(qū)域與第二區(qū)域是否為橫向排列的方法相同。另外,判斷第一區(qū)域與第二區(qū)域是否為縱向排列的方法,與判斷上述第一區(qū)域是否為縱向排列的方法以及判斷上述第二區(qū)域是否為縱向排列的方法相同。例如,如果閾值為5,則控制部12判斷圖8中的第一區(qū)域50a與第二區(qū)域60a為縱向排列,滿足規(guī)定條件。另外,控制部12判斷為第一區(qū)域50b與第二區(qū)域60b為縱向排列,滿足規(guī)定條件。進(jìn)而,控制部12判斷為第一區(qū)域50c與第二區(qū)域60c為縱向排列,滿足規(guī)定條件。即,控制部12使第一區(qū)域50a與第二區(qū)域60a相對應(yīng)關(guān)聯(lián)。另外,控制部12使第一區(qū)域50b與第二區(qū)域60b相對應(yīng)關(guān)聯(lián)。進(jìn)而,控制部12使第一區(qū)域50c與第二區(qū)域60c相對應(yīng)關(guān)聯(lián)。另外,例如,控制部12識別出存在于圖像數(shù)據(jù)內(nèi)的規(guī)定的對應(yīng)關(guān)系指示表現(xiàn)方式,該規(guī)定的對應(yīng)關(guān)系指示表現(xiàn)方式表示第一區(qū)域與第二區(qū)域的對應(yīng)關(guān)系。并且,控制部12基于該識別出的對應(yīng)關(guān)系指示表現(xiàn)方式所示的對應(yīng)關(guān)系,使第一區(qū)域與第二區(qū)域相對應(yīng)關(guān)聯(lián)。對應(yīng)關(guān)系指示表現(xiàn)方式,表示第一區(qū)域與第二區(qū)域的對應(yīng)關(guān)聯(lián)。圖9例示出該對應(yīng)關(guān)系指示表現(xiàn)方式。例如,對應(yīng)關(guān)系指示表現(xiàn)方式是圖9所示的箭頭70。例如,控制部12識別出存在于圖像數(shù)據(jù)內(nèi)的箭頭70。然后,控制部12根據(jù)識別出的箭頭70,來取得與該箭頭70所指示的方向相關(guān)的矢量信息。進(jìn)而,控制部12利用該取得的矢量信息,來確定該箭頭70所指示的第一區(qū)域50a和第二區(qū)域60a。其結(jié)果,控制部12使所確定的第一區(qū)域50a和第二區(qū)域60a相對應(yīng)關(guān)聯(lián)。另外,例如,對應(yīng)關(guān)系指示表現(xiàn)方式是圖9所示的線段71。例如,控制部12識別出存在于圖像數(shù)據(jù)內(nèi)的線段71。然后,控制部12確定線段71所連接的第一區(qū)域50b和第二區(qū)域60b。其結(jié)果,控制部12使所確定的第一區(qū)域50b和第二區(qū)域60b相對應(yīng)關(guān)聯(lián)。另外,例如,對應(yīng)關(guān)系指示表現(xiàn)方式是圖9所示的標(biāo)記72a和標(biāo)記72b。例如,控制部12識別出存在于圖像數(shù)據(jù)內(nèi)的作為同一標(biāo)記的標(biāo)記72a和標(biāo)記72b。然后,控制部12確定標(biāo)注了作為同一標(biāo)記的標(biāo)記72a和標(biāo)記72b的第一區(qū)域50c和第二區(qū)域60c。其結(jié)果,控制部12使所確定的第一區(qū)域50c和第二區(qū)域60c相對應(yīng)關(guān)聯(lián)??刂撇?2,通過至此為止例示的對應(yīng)關(guān)聯(lián)的方法,使在步驟102中識別出的第一區(qū)域與在步驟104中識別出的第二區(qū)域相對應(yīng)關(guān)聯(lián)。此外,控制部12也可以使用至此為止例示的對應(yīng)關(guān)聯(lián)的方法的多種組合 ,來使第一區(qū)域與第二區(qū)域相對應(yīng)關(guān)聯(lián)?!床襟E108〉接著,控制部12生成項目定義信息,該項目定義信息包括在步驟103中取得的位置信息和在步驟106中取得的項目名。圖10例示出針對圖4所示的圖像數(shù)據(jù)執(zhí)行上述步驟102 107的處理的結(jié)果,即,在該步驟108中生成的項目定義信息。如圖10所示,第一區(qū)域50a與第二區(qū)域60a相對應(yīng)關(guān)聯(lián)。另外,第一區(qū)域50b與第二區(qū)域60b相對應(yīng)關(guān)聯(lián)。并且,第一區(qū)域50a的x坐標(biāo)(左側(cè))、y坐標(biāo)(頂端)、橫軸的長度(寬度)以及縱軸的長度(高度)分別為120、80、320以及30。第一區(qū)域50b的x坐標(biāo)、y坐標(biāo)、橫軸的長度以及縱軸的長度分別為120、120、320以及30。另外,第二區(qū)域60a的x坐標(biāo)、y坐標(biāo)、橫軸的長度以及縱軸的長度分別為20、80、90以及30。第二區(qū)域60b的x坐標(biāo)、y坐標(biāo)、橫軸的長度以及縱軸的長度分別為20、120、90以及30。圖10例示出從這樣的第一區(qū)域50a與第二區(qū)域60a以及第一區(qū)域50b與第二區(qū)域60b取得的項目定義信息。此外,圖10例示的項目定義信息中的“項目名”字段(field)存儲有從第二區(qū)域取得的字符信息?!白髠?cè)”字段存儲有第一區(qū)域的左上端的X坐標(biāo)?!绊敹恕弊侄未鎯τ械谝粎^(qū)域的左上端的y坐標(biāo)。“寬度”字段存儲有第一區(qū)域的橫軸的長度?!案叨取弊侄未鎯τ械谝粎^(qū)域的縱軸的長度。在此,項目定義信息的行數(shù)據(jù)(記錄record)表示對應(yīng)關(guān)系中的第一區(qū)域與第二區(qū)域的信息。即,項目定義信息的記錄包括成為字符識別對象的區(qū)域的位置信息與針對該區(qū)域的項目名。此外,OCR軟件等可以從項目定義信息的記錄中取得成為字符識別對象的區(qū)域的位置信息以及針對該區(qū)域的項目名。即,可以在OCR軟件等中,為了確定成為字符識別對象的區(qū)域的信息而使用項目定義信息。另外,控制部12,可以將從項目定義信息的記錄中得到的成為字符識別對象的區(qū)域的位置信息與項目名以及取得了這些信息的圖像數(shù)據(jù),一起顯示在與信息處理裝置I連接的顯示裝置上?!唇Y(jié)束〉最后,控制部12例如將在步驟108中生成的項目定義信息存儲在存儲部11中。然后,信息處理裝置I結(jié)束本動作例的處理?!雌渌荡送?,控制部12進(jìn)行的上述步驟102和104中的第一區(qū)域和第二區(qū)域的識別處理,相當(dāng)于區(qū)域識別部31的處理。控制部12進(jìn)行的上述步驟103中的位置信息取得的處理,相當(dāng)于位置信息取得部32的處理??刂撇?2進(jìn)行的上述步驟106中的項目名取得的處理,相當(dāng)于項目名取得部33的處理??刂撇?2進(jìn)行的上述步驟107中的對應(yīng)關(guān)聯(lián)的處理,相當(dāng)于對應(yīng)關(guān)聯(lián)部34的處理??刂撇?2進(jìn)行的上述步驟108中的項目定義信息的生成處理,相當(dāng)于項目定義信息生成部35的處理?!?3實施方式的作用以及效果根據(jù)上述,在本實施方式的信息處理裝置I中,識別出圖像數(shù)據(jù)內(nèi)中的第一區(qū)域與第二區(qū)域(步驟102以及104)。并且,從第一區(qū)域取得用于指定成為字符識別對象的區(qū)域的位置信息(步驟103)。另外,從第二區(qū)域取得針對該成為字符識別對象的區(qū)域的項目 名(步驟106)。因此,通過本實施方式的信息處理裝置1,用戶無需通過手動輸入來設(shè)定與所取得的位置信息相關(guān)的、針對成為字符識別對象的區(qū)域的項目名。因此,通過本實施方式的信息處理裝置1,能夠高效地生成(制作)用于OCR軟件等的定義信息。另外,在本實施方式的信息處理裝置I中,使得用于指定成為字符識別對象的區(qū)域的位置信息與針對該成為字符識別對象的區(qū)域的項目名相對應(yīng)關(guān)聯(lián)(步驟107)。因此,用戶無需再進(jìn)行使所取得的位置信息與項目名相對應(yīng)關(guān)聯(lián)的處理。因此,通過本實施方式的信息處理裝置1,能夠高效地生成(制作)用于OCR軟件等的定義信息?!? 補(bǔ)充以上,詳細(xì)說明了本發(fā)明的實施方式,但上述說明的全部觀點僅為本發(fā)明的例示,并非用于限定其范圍。在不脫離本發(fā)明的精神的范圍內(nèi),能夠進(jìn)行各種改良和變形。本領(lǐng)域技術(shù)人員能夠根據(jù)上述本實施方式的記載,基于權(quán)利要求書的記載以及技術(shù)常識,來實施等價的范圍。另外,本說明書中使用的用語并不特別限定,能夠用作該領(lǐng)域常用用語。因此,只要沒有其它定義,本說明書中使用的全部專用用語和技術(shù)用語,具有本發(fā)明所屬領(lǐng)域技術(shù)人員能夠一般理解的意義。在兩者矛盾時,在本說明書(包括定義)中記載的意義中來理解本說明書中使用的用語。
權(quán)利要求
1.一種信息處理裝置,其特征在于,包括 區(qū)域識別部,其用于針對在圖像數(shù)據(jù)內(nèi)利用規(guī)定的表現(xiàn)方式來指定的區(qū)域,識別第一區(qū)域和第二區(qū)域,所述第一區(qū)域是利用第一區(qū)域指定表現(xiàn)方式來指定的區(qū)域,所述第二區(qū)域是利用與所述第一區(qū)域指定表現(xiàn)方式不同的第二區(qū)域指定表現(xiàn)方式來指定的區(qū)域, 位置信息取得部,其用于在所述圖像數(shù)據(jù)內(nèi)取得由所述區(qū)域識別部識別出的所述第一區(qū)域的位置信息,作為用于指定成為字符識別對象的區(qū)域的位置信息, 項目名取得部,其用于取得字符信息作為項目名,所述字符信息是通過對由所述區(qū)域識別部識別出的所述第二區(qū)域內(nèi)存在的字符進(jìn)行識別所得到的信息,所述項目名是利用由所述位置信息取得部取得的所述位置信息來指定的所述成為字符識別對象的區(qū)域的項目名。
2.如權(quán)利要求I所述的信息處理裝置,其特征在于, 還具有用于使所述第一區(qū)域與所述第二區(qū)域相對應(yīng)關(guān)聯(lián)的對應(yīng)關(guān)聯(lián)部, 所述項目名取得部從所述第二區(qū)域取得所述字符信息作為特定區(qū)域的項目名,所述特定區(qū)域是利用特定位置信息來指定的所述成為字符識別對象的區(qū)域,所述特定位置信息是從通過所述對應(yīng)關(guān)聯(lián)部與該第二區(qū)域相對應(yīng)關(guān)聯(lián)的所述第一區(qū)域取得的位置信息。
3.如權(quán)利要求2所述的信息處理裝置,其特征在于, 所述對應(yīng)關(guān)聯(lián)部使所述第一區(qū)域與在圖像數(shù)據(jù)上離所述第一區(qū)域最近的所述第二區(qū)域相對應(yīng)關(guān)聯(lián)。
4.如權(quán)利要求2所述的信息處理裝置,其特征在于, 所述對應(yīng)關(guān)聯(lián)部判斷所述第一區(qū)域的位置與所述第二區(qū)域的位置之間的位置關(guān)系是否滿足規(guī)定條件,并使判斷為滿足規(guī)定條件的所述第一區(qū)域與所述第二區(qū)域相對應(yīng)關(guān)聯(lián)。
5.如權(quán)利要求4所述的信息處理裝置,其特征在于, 所述對應(yīng)關(guān)聯(lián)部,在圖像數(shù)據(jù)內(nèi)縱向排列的多個第一區(qū)域與縱向排列的多個第二區(qū)域中,將橫向排列的一個第一區(qū)域與一個第二區(qū)域判斷為滿足所述規(guī)定條件。
6.如權(quán)利要求4所述的信息處理裝置,其特征在于, 所述對應(yīng)關(guān)聯(lián)部,在圖像數(shù)據(jù)內(nèi)橫向排列的多個第一區(qū)域與橫向排列的多個第二區(qū)域中,將縱向排列的一個第一區(qū)域與一個第二區(qū)域判斷為滿足所述規(guī)定條件。
7.如權(quán)利要求2所述的信息處理裝置,其特征在于, 所述對應(yīng)關(guān)聯(lián)部,對存在于圖像數(shù)據(jù)內(nèi)的用于表示所述第一區(qū)域與所述第二區(qū)域的對應(yīng)關(guān)系的規(guī)定的對應(yīng)關(guān)系指示表現(xiàn)方式進(jìn)行識別,并基于識別出的該對應(yīng)關(guān)系,使所述第一區(qū)域與所述第二區(qū)域相對應(yīng)關(guān)聯(lián)。
8.如權(quán)利要求I 7中任意一項所述的信息處理裝置,其特征在于, 還具有用于生成項目定義信息的項目定義信息生成部, 所述項目定義信息包括 用于對由所述位置信息取得部取得的所述成為字符識別對象的區(qū)域進(jìn)行指定的所述位置信息; 由所述項目名取得部取得的利用所述位置信息來指定的所述成為字符識別對象的區(qū)域的所述項目名。
9.一種信息處理方法,其特征在于,使計算機(jī)執(zhí)行如下步驟區(qū)域識別步驟,針對在圖像數(shù)據(jù)內(nèi)利用規(guī)定的表現(xiàn)方式來指定的區(qū)域,識別第一區(qū)域和第二區(qū)域,所述第一區(qū)域是利用第一區(qū)域指定表現(xiàn)方式來指定的區(qū)域,所述第二區(qū)域是利用與所述第一區(qū)域指定表現(xiàn)方式不同的第二區(qū)域指定表現(xiàn)方式來指定的區(qū)域, 位置信息取得步驟,在所述圖像數(shù)據(jù)內(nèi)取得所識別出的所述第一區(qū)域的位置信息,作為用于指定成為字符識別對象的區(qū)域的位置信息, 項目名取得步驟,取得字符信息作為項目名,所述字符信息是通過對識別出的所述第二區(qū)域內(nèi)存在的字符進(jìn)行識別所得到的信息,所述項目名是利用所取得的所述位置信息來指定的所述成為字符識別對象的區(qū)域的項目名。
10.一種程序,其特征在于,使計算機(jī)執(zhí)行如下步驟 區(qū)域識別步驟,針對在圖像數(shù)據(jù)內(nèi)利用規(guī)定的表現(xiàn)方式來指定的區(qū)域,識別第一區(qū)域和第二區(qū)域,所述第一區(qū)域是利用第一區(qū)域指定表現(xiàn)方式來指定的區(qū)域,所述第二區(qū)域是利用與所述第一區(qū)域指定表現(xiàn)方式不同的第二區(qū)域指定表現(xiàn)方式來指定的區(qū)域, 位置信息取得步驟,在所述圖像數(shù)據(jù)內(nèi)取得所識別出的所述第一區(qū)域的位置信息,作為用于指定成為字符識別對象的區(qū)域的位置信息, 項目名取得步驟,取得字符信息作為項目名,所述字符信息是通過對識別出的所述第二區(qū)域內(nèi)存在的字符進(jìn)行識別所得到的信息,所述項目名是利用所取得的所述位置信息來指定的所述成為字符識別對象的區(qū)域的項目名。
全文摘要
能高效生成用于OCR軟件等的定義信息的信息處理裝置、方法及程序。本發(fā)明的信息處理裝置包括區(qū)域識別部,針對在圖像數(shù)據(jù)內(nèi)由規(guī)定的表現(xiàn)方式指定的區(qū)域,來識別第一區(qū)域和第二區(qū)域,第一區(qū)域是由第一區(qū)域指定表現(xiàn)方式指定的區(qū)域,第二區(qū)域是由與第一區(qū)域指定表現(xiàn)方式不同的第二區(qū)域指定表現(xiàn)方式指定的區(qū)域;位置信息取得部,在圖像數(shù)據(jù)內(nèi)取得由區(qū)域識別部識別出的第一區(qū)域的位置信息,作為用于指定成為字符識別對象的區(qū)域的位置信息;項目名取得部,取得字符信息來作為項目名,字符信息是通過對由區(qū)域識別部識別出的第二區(qū)域內(nèi)存在的字符進(jìn)行識別而得的信息,項目名是針對由位置信息取得部取得的位置信息所指定的成為字符識別對象的區(qū)域的項目名。
文檔編號G06K9/20GK102708365SQ20121005924
公開日2012年10月3日 申請日期2012年3月2日 優(yōu)先權(quán)日2011年3月17日
發(fā)明者伊藤修光, 毛木達(dá)也, 澤田敬, 藤塚誠弘 申請人:株式會社Pfu
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
彭山县| 凌海市| 炎陵县| 惠东县| 托克托县| 陵水| 漯河市| 赤峰市| 内丘县| 仪征市| 元阳县| 察雅县| 芦山县| 平度市| 瑞安市| 迭部县| 南靖县| 烟台市| 合作市| 铅山县| 多伦县| 白城市| 洱源县| 密云县| 类乌齐县| 肥城市| 安多县| 芒康县| 太湖县| 桐庐县| 池州市| 丰台区| 青川县| 许昌县| 承德市| 沅江市| 玛曲县| 花垣县| 扬州市| 临汾市| 隆尧县|