圖像處理裝置及圖像處理方法
【專利摘要】本發(fā)明提供一種可以高精度地判別原稿種類的圖像處理裝置及圖像處理方法。圖像處理裝置(10)包括:輸入圖像取得部(161),其讀取原稿并取得生成的輸入圖像;文字列信息算出部(168),計算出輸入圖像的文字列密度或文字列方差;原稿種類判別部(169),其基于文字列密度或文字列方差來判別原稿種類。
【專利說明】圖像處理裝置及圖像處理方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種圖像處理裝置及圖像處理方法,尤其涉及一種判別原稿種類的圖像處理裝置及圖像處理方法。
【背景技術(shù)】
[0002]一般來說,掃描儀裝置等圖像讀取裝置讀取原稿,將圖像數(shù)據(jù)暫時存儲在存儲部中并發(fā)送到個人電腦等信息處理裝置。另一方面,信息處理裝置對從圖像讀取裝置接收到的圖像數(shù)據(jù)進(jìn)行OCR (Optical Character Recognit1n)處理等來取得特定的信息,將圖像數(shù)據(jù)與已取得的信息相關(guān)聯(lián)地進(jìn)行管理。在這種信息處理裝置中,希望針對收據(jù)、名片、照片等各種原稿種類來管理圖像數(shù)據(jù)。
[0003]已知一種圖像裝置,其存儲設(shè)定信息,基于設(shè)定信息,判斷出與被讀取圖像的原稿尺寸相對應(yīng)的應(yīng)用并起動該應(yīng)用,其中,所述設(shè)定信息定義了基于原稿尺寸而應(yīng)當(dāng)被啟動的應(yīng)用(參見專利文獻(xiàn)I)。
[0004]又,已知一種判定已讀取的圖像數(shù)據(jù)是彩色圖像還是黑白圖像的圖像處理裝置。該圖像處理裝置基于檢知出傳送的原稿頂端及后端的時機(jī)來確定原稿尺寸,并針對多個不同規(guī)格紙張的尺寸,判定已讀取的圖像數(shù)據(jù)是彩色圖像還是黑白圖像。然后,圖像處理裝置從多個判定結(jié)果中,選擇使用與確定的原稿尺寸相同規(guī)格紙張的尺寸而進(jìn)行了判定的判定結(jié)果(參見專利文獻(xiàn)2)。
[0005]現(xiàn)有技術(shù)文獻(xiàn)
[0006]專利文獻(xiàn)
[0007]專利文獻(xiàn)1:日本專利公開2008-131254號公報
[0008]專利文獻(xiàn)2:日本專利公開2010-273053號公報
【發(fā)明內(nèi)容】
[0009]發(fā)明所要解決的技術(shù)問題
[0010]希望在使用已讀取的原稿的圖像數(shù)據(jù)的圖像處理裝置中,高精度地判定原稿種類。
[0011]本發(fā)明的目的在于提供一種可以高精度地判別原稿種類的圖像處理裝置及圖像處理方法。
[0012]解決技術(shù)問題的手段
[0013]本發(fā)明所涉及的圖像處理裝置,包括:輸入圖像取得部,其讀取原稿并取得生成的輸入圖像;文字列信息算出部,其計算出所述輸入圖像的文字列密度或文字列方差;和原稿種類判別部,其基于所述文字列密度或文字列方差來判別所述原稿的種類。
[0014]本發(fā)明所涉及的圖像處理方法,包括:讀取原稿并取得生成的輸入圖像的步驟;計算出所述輸入圖像的文字列密度或文字列方差的步驟;和基于所述文字列密度或文字列方差來判別所述原稿的種類的步驟。
[0015]發(fā)明的效果
[0016]通過本發(fā)明,基于輸入圖像的文字列密度或文字列方差來判別原稿種類。由此,能夠提供一種可以高精度地判別原稿種類的圖像處理裝置及圖像處理方法。
【專利附圖】
【附圖說明】
[0017]圖1是基于實施方式的圖像處理系統(tǒng)I的硬件構(gòu)成圖。
[0018]圖2是圖像處理電路16的功能框圖。
[0019]圖3是示出原稿種類判別處理的動作的流程圖。
[0020]圖4是用于對原稿尺寸進(jìn)行說明的不意圖。
[0021]圖5是示出原稿尺寸算出處理的動作示例的流程圖。
[0022]圖6是用于對矩形的旋轉(zhuǎn)進(jìn)行說明的示意圖。
[0023]圖7是示出文字方向判別處理的動作示例的流程圖。
[0024]圖8是用于對文字方向判別處理進(jìn)行說明的示意圖。
[0025]圖9是示出文字列信息算出處理的動作示例的流程圖。
[0026]圖10是示出文字列信息算出處理的動作的另一示例的流程圖。
[0027]圖11是用于對標(biāo)注處理進(jìn)行說明的示意圖。
[0028]圖12是示出文字列信息算出處理的動作的又一示例的流程圖。
[0029]圖13是用于對文字列方差的算出處理進(jìn)行說明的示意圖。
[0030]圖14是示出文字列信息算出處理的動作的又一示例的流程圖。
[0031]圖15是另一圖像處理系統(tǒng)2的硬件構(gòu)成圖。
【具體實施方式】
[0032]下面,參照附圖,對本發(fā)明的一個方面所涉及到的圖像處理裝置、圖像處理方法及計算機(jī)程序進(jìn)行說明。但是,本發(fā)明的技術(shù)范圍并不限于這些實施方式,而是涉及權(quán)利要求書中所記載的發(fā)明及其等同物。
[0033]圖1是基于實施方式的圖像處理系統(tǒng)I的硬件構(gòu)成圖。如圖1所示,圖像處理系統(tǒng)I包括圖像讀取裝置10和信息處理裝置20。圖像讀取裝置10是圖像處理裝置的一個示例,例如為圖像掃描儀、數(shù)碼相機(jī)等,信息處理裝置20是例如與圖像讀取裝置10連接而使用的個人電腦等。
[0034]圖像讀取裝置10包括:圖像輸入裝置11、第一圖像存儲器12、第一接口裝置13、第一存儲裝置14、第一 CPU (Central Processing Unit) 15、圖像處理電路16。下面,對圖像讀取裝置10的各部分進(jìn)行詳細(xì)說明。
[0035]圖像輸入裝置11包括分別拍攝作為攝像對象物的原稿的表面及背面的兩個攝像傳感器。各攝像傳感器具有以一維或者二維排列的CCD(Charge Coupled Device)、CMOS (Complementary Metal Oxide Semiconductor)等攝像兀件。各攝像傳感器還具有將攝像對象物的像成像于攝像元件的光學(xué)系統(tǒng),各個攝像元件輸出與RGB各顏色對應(yīng)的模擬值。圖像輸入裝置11將攝像傳感器輸出的各個模擬值轉(zhuǎn)換為數(shù)字值,生成像素數(shù)據(jù),并生成由生成的各個像素數(shù)據(jù)構(gòu)成的圖像數(shù)據(jù)(下面稱為RGB圖像)。該RGB圖像的各個像素數(shù)據(jù)為例如以8位來表示RGB各顏色中的每個顏色的合計24位RGB值所構(gòu)成的彩色圖像數(shù)據(jù)。
[0036]然后,圖像輸入裝置11生成將RGB圖像的各個像素的RGB值轉(zhuǎn)換為亮度值及色差值(YUV值)的圖像(下面稱為輸入圖像),保存在第一圖像存儲器12中。此外,例如根據(jù)以下的計算公式,能夠計算出YUV值。
[0037]Y 值=0.30XR 值+0.59XG 值+0.1lXB 值 (I)
[0038]U 值=-0.17XR 值一0.33XG 值+0.50XB 值 (2)
[0039]V 值=0.50XR 值一0.42XG 值一0.08XB 值 (3)
[0040]第一圖像存儲器12包括非易失性半導(dǎo)體存儲器、易失性半導(dǎo)體存儲器、磁盤等存儲裝置。第一圖像存儲器12連接圖像輸入裝置11,保存通過圖像輸入裝置11生成的輸入圖像,并連接圖像處理電路16,保存通過圖像處理電路16對輸入圖像進(jìn)行圖像處理后的各種處理圖像。
[0041]第一接口裝置13具有例如USB (Universal Serial Bus)等以串行總線為標(biāo)準(zhǔn)的接口電路,與信息處理裝置20電連接,發(fā)送接收圖像數(shù)據(jù)及各種信息。又,也可以將閃存等連接到第一接口裝置13,保存第一圖像存儲12中保存的圖像數(shù)據(jù)。
[0042]第一存儲裝置14 包括 RAM (Random Access Memory)、ROM (Read Only Memory)等存儲裝置、硬盤等固定磁盤裝置、或者軟盤、光盤等可移動存儲裝置等。又,第一存儲裝置14中存儲了用于圖像讀取裝置10的各種處理的計算機(jī)程序、數(shù)據(jù)庫、列表等。計算機(jī)程序也可以從計算機(jī)可讀取的可移動型存儲介質(zhì)使用公知的安裝程序等被安裝到第一存儲裝置14。計算機(jī)可讀取的可移動型存儲介質(zhì)是例如CD-ROM (compact disk read only memory) >DVD-ROM(digital versatile disk read only memory)等
[0043]第一 CPU15連接圖像輸入裝置11、第一圖像存儲器12、第一接口裝置13、第一存儲裝置14及圖像處理電路16,并控制上述各部分。第一 CPU15進(jìn)行圖像輸入裝置11的輸入圖像生成控制、第一圖像存儲器12的控制、通過第一接口裝置13的與信息處理裝置20的數(shù)據(jù)發(fā)送接收控制、第一存儲裝置14的控制、基于圖像處理電路16的圖像處理的控制等。
[0044]圖像處理電路16連接第一圖像存儲器12,進(jìn)行判別原稿種類的原稿種類判別處理等。該圖像處理電路16連接第一 CPU15并根據(jù)來自于第一 CPU15的控制基于預(yù)先存儲在第一存儲裝置14中的程序進(jìn)行動作?;蛘?,圖像處理電路16也可以用獨(dú)立的集成電路、微處理器、固件等構(gòu)成。
[0045]信息處理裝置20包括第二接口裝置21、第二圖像存儲器22、顯示裝置23、第二存儲裝置24、第二 CPU25。下面,對信息處理裝置20的各部分進(jìn)行詳細(xì)說明。
[0046]第二接口裝置21包括和圖像讀取裝置10的第一接口裝置13同樣的接口電路,并連接信息處理裝置20和圖像讀取裝置10。
[0047]第二圖像存儲器22包括和圖像讀取裝置10的第一圖像存儲器12同樣的存儲裝置。在第二圖像存儲器22中,保存有通過第二接口裝置21從圖像讀取裝置10接收的圖像數(shù)據(jù)和各種信息。
[0048]顯示裝置23包括由液晶、有機(jī)EL(Electro-Luminescence)等構(gòu)成的顯示器及向顯示器輸出圖像數(shù)據(jù)的接口電路。顯示裝置23與第二圖像存儲器22連接,并將保存在第二圖像存儲器22中的圖像數(shù)據(jù)顯示在顯示器上。
[0049]第二存儲裝置24包括和圖像讀取裝置10的第一存儲裝置14同樣的存儲裝置、固定磁盤裝置、可移動存儲裝置等。第二存儲裝置24中,存儲了用于信息處理裝置20的各種處理的計算機(jī)程序、數(shù)據(jù)庫、列表等。計算機(jī)程序也可以從例如CD-ROM、DVD-ROM等計算機(jī)可讀取的可移動型存儲介質(zhì)中使用公知的安裝程序等被安裝到第二存儲裝置24。
[0050]第二 CPU25與第二接口裝置21、第二圖像存儲器22、顯示裝置23、第二存儲裝置24連接,并控制上述各部分。第二 CPU25進(jìn)行通過第二接口裝置21的與圖像讀取裝置10的數(shù)據(jù)發(fā)送接收控制、第二圖像存儲器22的控制、顯示裝置23的顯示控制、第二存儲裝置24的控制等。
[0051]圖2是圖像處理電路16的功能框圖。如圖2所示的圖像處理電路16包括:輸入圖像提取部161、原稿尺寸算出部162、印刷面判別部163、印刷顏色判別部164、二值化圖像生成部165、直方圖生成部166、文字方向判別部167及文字列信息算出部168等。進(jìn)一步地,圖像處理電路16包括原稿種類判別部169及數(shù)據(jù)處理部170等。
[0052]圖3是示出基于圖像讀取裝置10的原稿種類判別處理的動作的流程圖。下面,參照圖3所示的流程圖,對原稿種類判別處理的動作進(jìn)行說明。此外,下面說明的動作流程是基于預(yù)先存儲在第一存儲裝置14中的程序,主要通過第一 CPU14協(xié)同圖像讀取裝置10的各個元件被實行。圖3所示的示例中,圖像輸入裝置11判別收據(jù)、名片、照片及PPC(PlainPaper Copier)紙張作為原稿種類。
[0053]最初,圖像輸入裝置11讀取攝像對象物(原稿),生成RGB圖像及輸入圖像并保存在第一圖像存儲器12中。輸入圖像取得部161從第一圖像存儲器12中讀出并取得RGB圖像及輸入圖像(步驟S101)。
[0054]然后,原稿尺寸算出部162實施原稿尺寸算出處理(步驟S102)。原稿尺寸算出處理中,原稿尺寸算出部162基于輸入圖像計算出原稿尺寸。關(guān)于原稿尺寸算出處理,將在后面詳述。
[0055]然后,原稿種類判別部169判別原稿尺寸是否被包含在作為收據(jù)尺寸范圍和名片尺寸范圍的共同范圍的第一尺寸范圍或作為收據(jù)尺寸范圍和照片尺寸范圍的共同范圍的第二尺寸范圍中(步驟S103)。
[0056]圖4是用于對原稿尺寸進(jìn)行說明的示意圖。圖4所示的圖表400是根據(jù)讀取各種各樣的收據(jù)、名片及照片而生成的輸入圖像,繪制了計算出的尺寸的圖表。圖表400的橫軸表示水平方向的長度(mm),縱軸表示垂直方向的長度(mm)。此外,收據(jù)的水平方向為寬度方向(與打印收據(jù)時的收據(jù)傳送方向正交的方向),名片及照片的水平方向為橫向。
[0057]根據(jù)讀取收據(jù)而生成的輸入圖像,區(qū)域401?403示出繪制了計算出的大部分尺寸的區(qū)域。因為一般的收據(jù)規(guī)定了寬度方向的長度(例如:45mm、58mm、80mm等),所以區(qū)域401?403成為沿水平方向為45mm、58mm、80mm的線的區(qū)域。
[0058]根據(jù)讀取名片而生成的輸入圖像,區(qū)域411示出繪制了計算出的大部分尺寸的區(qū)域?;诿膮^(qū)域411位于縱向長度為70mm?110mm、橫向長度為43mm?60mm的范圍中。
[0059]根據(jù)讀取照片而生成的輸入圖像,區(qū)域421?423示出繪制了計算出的大部分尺寸的區(qū)域。一般的照片尺寸為E開(83mmX 117mm)、L開(89mmX 127mm)、2L開(127mmX 178mm)中的任何一個。區(qū)域421與E開的照片對應(yīng),區(qū)域422與L開的照片對應(yīng),區(qū)域423與2L開的照片對應(yīng)。
[0060]如圖4所示,基于收據(jù)的區(qū)域401及402和基于名片的區(qū)域411在區(qū)域431重疊,基于收據(jù)的區(qū)域403和基于照片的區(qū)域421在區(qū)域432重疊。因而,根據(jù)基于輸入圖像計算出的原稿尺寸,如果打算判別原稿是收據(jù)還是名片亦或是照片,存在錯誤地進(jìn)行判別的可能性。在原稿尺寸如區(qū)域431包含在收據(jù)尺寸范圍和名片尺寸范圍的共同范圍中、或者如區(qū)域432那樣被包含在收據(jù)尺寸范圍和照片尺寸范圍的共同范圍中的情況下,應(yīng)當(dāng)基于原稿尺寸以外的要素來判別原稿種類。
[0061]然后,原稿種類判別部169在原稿尺寸沒有被包含在第一尺寸范圍或第二尺寸范圍中的情況下,根據(jù)原稿尺寸來判別原稿種類(步驟S106)并將處理切換到步驟S116。原稿種類判別部169在原稿尺寸被包含在如圖所示的各區(qū)域所對應(yīng)的范圍中的情況下,判別該原稿是該區(qū)域所對應(yīng)的收據(jù)、名片或者照片。另一方面,原稿種類判別部169在原稿尺寸沒有被包含在任何一個各區(qū)域所對應(yīng)的范圍中的情況下,判別該原稿是PPC紙張。
[0062]另一方面,在原稿尺寸被包含在第一尺寸范圍或第二尺寸范圍中的情況下,印刷面判別部163判別原稿表面及背面是分別的印刷面(步驟S105)。原稿種類判別部169用規(guī)定的二值化閾值(例如:128)對拍攝了原稿表面及背面的輸入圖像的亮度值進(jìn)行二值化。在表示二值化后的值中任何一方的值的像素個數(shù)與全部像素個數(shù)的比例在規(guī)定比例(例如:1% )以下的情況下,原稿種類判別部169判別該面不是印刷面。
[0063]然后,印刷顏色判別部164對被印刷面判別部163判別為印刷面的面是單色還是彩色進(jìn)行判別(步驟S106)。對于RGB圖像,印刷顏色判別部164生成以各R值為梯級、以表示各R值的像素個數(shù)為頻數(shù)的直方圖。同樣地,印刷顏色判別部164生成以各G值為梯級、以表示各G值的像素個數(shù)為頻數(shù)的直方圖和以各B值為梯級、以表示各B值的像素個數(shù)為頻數(shù)的直方圖。在生成的各直方圖中,印刷顏色判別部164判別頻數(shù)在閾值Thl以上的梯級是否在規(guī)定數(shù)量以上。在頻數(shù)在閾值Thl以上的梯級在規(guī)定數(shù)量以上的情況下,印刷顏色判別部164判別該面是彩色,沒有在規(guī)定數(shù)量以上的情況下,判別該面是單色。
[0064]然后,印刷顏色判別部164判別原稿是否具有單色印刷面(步驟S107)。在被印刷面判別部163判別為印刷面的面中的任何一個面是單色的情況下,印刷顏色判別部164判別原稿具有單色印刷面,在被印刷面判別部163判別為印刷面的面中的任何一個面都不是單色的情況下,判別原稿沒有單色印刷面。
[0065]一般的收據(jù)中,用單色印刷商品名稱、金額等,在其背面,或不進(jìn)行印刷,或用單色或者彩色印刷表示店鋪廣告等的文字、照片、圖像等。另一方面,一般的名片中,在兩面或者單面用單色或者彩色印刷姓名、公司名稱、住所、電話號碼等。又,一般的照片中,用彩色印刷拍攝圖像,在其背面,或不進(jìn)行印刷,或用單色印刷拍攝日期和時間等。因而,在原稿沒有單色印刷面的情況下,能夠判別該原稿至少不是收據(jù)。
[0066]然后,在原稿沒有單色印刷面的情況下,原稿種類判別部169判別原稿不是收據(jù)而是名片或照片,并將處理切換到步驟S113。
[0067]另一方面,在原稿具有單色印刷面的情況下,文字方向判別部167實施文字方向判別處理(步驟S108)。對于文字方向判別處理,文字方向判別部167基于輸入圖像,對印刷在原稿上的文字所排列的文字方向進(jìn)行判別。對于文字方向判別處理,將在后面詳述。
[0068]然后,原稿種類判別部169對文字方向判別部167所判別出的文字方向是否是水平方向進(jìn)行判別(步驟S109)。原稿種類判別部169在原稿的縱向尺寸和橫向尺寸中的任何一方與一般的收據(jù)所規(guī)定的寬度方向長度大體一致的情況下,將大體一致的方向當(dāng)作水平方向,另一方當(dāng)作垂直方向。另一方面,原稿種類判別部169在原稿的縱向尺寸和橫向尺寸中的任何一方都與一般的收據(jù)所規(guī)定的寬度方向長度大體不一致的情況下,將原稿的橫向當(dāng)作水平方向,縱向當(dāng)作垂直方向。即是說,原稿是收據(jù)的情況下寬度方向是水平方向,不是收據(jù)的情況下橫向是水平方向。
[0069]一般的收據(jù)中,商品名稱、金額等文字列被配置在寬度方向(水平方向)上。另一方面,一般的名片中,雖然姓名、公司名稱、住所、電話號碼等文字列被配置在縱向(垂直方向)上,但也存在文字列被配置在橫向(水平方向)上的名片。又,照片中,既有文字列被配置在縱向(垂直方向)上的情況,也有被配置在橫向(水平方向)上的情況。因而,在文字方向不是水平方向的情況下,能夠判別該原稿至少不是收據(jù)。
[0070]然后,在文字方向不是水平方向的情況下,原稿種類判別部169判別原稿不是收據(jù)而是名片或照片,并將處理切換到步驟S113。
[0071]另一方面,在文字方向是水平方向的情況下,文字列信息算出部168實施文字列信息算出處理(步驟S110)。文字列信息算出處理中,文字列信息算出部168計算出輸入圖像的水平方向及垂直方向的文字列密度作為文字列信息。文字列密度是文字列分布相對于整個輸入圖像的比例。對于文字列信息算出處理,將在后面詳述。
[0072]然后,原稿種類判別部169判別文字列信息算出部168計算出的文字列密度是否比規(guī)定值Vl更大(步驟S111)。規(guī)定值Vl被確定為根據(jù)事前的實驗而對各種收據(jù)計算出的文字列密度平均值與對文字被印刷在橫向上的各種名片計算出的文字列密度平均值的中間值(例如:30% )。
[0073]文字列被配置在橫向上的名片中存在空白部分較多的傾向。因而,文字列被設(shè)置在橫向上的名片中,配置文字的區(qū)域相對于整個名片的比例比一般的收據(jù)的文字相對于整個收據(jù)的比例更小的可能性較高。又,在拍攝日期和時間等被配置在照片背面的情況下,一般來說該文字列被配置在照片下端,背面大部分是空白部分。因而,配置文字的區(qū)域相對于照片背面的整個照片的比例比一般的收據(jù)的配置文字的區(qū)域相對于整個收據(jù)的比例更小的可能性較高。
[0074]此外,原稿種類判別部169在水平方向的文字列密度及垂直方向的文字列密度的至少一方在規(guī)定值Vl以下的情況下,判定文字列密度在規(guī)定值Vl以下。另一方面,原稿種類判別部169在水平方向的文字列密度及垂直方向的文字列密度都比規(guī)定值Vl更大的情況下,判定文字列密度比規(guī)定值Vl更大。
[0075]然后,原稿種類判別部169在文字列密度在指定值Vl以下的情況下,判別原稿種類不是收據(jù)并將處理切換到步驟S113。
[0076]另一方面,原稿種類判別部169在文字列密度比規(guī)定值Vl更大的情況下,判別原稿是收據(jù)(步驟S112)并將處理切換到步驟S116。
[0077]步驟S113中,原稿種類判別部169對原稿尺寸算出部162計算出的原稿尺寸是被包含在第一尺寸中還是被包含在第二尺寸進(jìn)行判定。
[0078]然后,在原稿尺寸包含在第一尺寸中的情況下原稿種類判別部169判別原稿是名片(步驟SI 14),在原稿尺寸包含在第二尺寸中的情況下判別原稿是照片(步驟SI 15),并將處理切換到步驟SI 16。
[0079]步驟SI 16中,數(shù)據(jù)處理部170實行與原稿種類判別部169判別出的原稿種類相應(yīng)的數(shù)據(jù)處理,并結(jié)束一系列步驟。
[0080]數(shù)據(jù)處理部170利用公知的OCR技術(shù),從圖像數(shù)據(jù)中確定的信息。在原稿是收據(jù)的情況下,數(shù)據(jù)處理部170從輸入圖像中提取出以“YYYY年MM月DD日”、“YYYY/MM/DD”等格式記載的文字列,取得表示購入日期和時間的信息。又,數(shù)據(jù)處理部170提取出輸入圖像上部所記載的文字列或標(biāo)識,取得表示店名的信息。又,數(shù)據(jù)處理部170提取出位于輸入圖像下部所記載的“合計”、“Total”等文字列的右側(cè)的文字列,取得表示金額的信息。又,數(shù)據(jù)處理部170提取出列表形式地記載在輸入圖像的中央部分的文字列,取得表示品種的信肩、O
[0081]另一方面,在原稿是名片的情況下,數(shù)據(jù)處理部170在輸入圖像的中央部分從具有比其他文字列更大的區(qū)域的文字列中取得表示姓名的信息,并從輸入圖像中提取出標(biāo)識,取得表示公司名稱的信息。又,數(shù)據(jù)處理部170提取出位于輸入圖像所記載的“TEL”等文字列或表示電話的標(biāo)記等的右側(cè)的數(shù)字列,取得表示電話號碼的信息。又,數(shù)據(jù)處理部170提取出位于輸入圖像所記載的“Mail”等文字列或表示電子郵件的標(biāo)記等的右側(cè)的字母數(shù)字列,取得表示郵件地址的信息。
[0082]另一方面,在原稿是照片的情況下,數(shù)據(jù)處理部170從輸入圖像中提取出“YYYY年麗月DD日”、“YYYY/MM/DD”等格式的文字列,取得表示拍攝日期和時間或者印刷日期和時間的信息。
[0083]數(shù)據(jù)處理部170將輸入圖像、原稿種類及已取得的各種信息進(jìn)行關(guān)聯(lián),儲存在第一圖像存儲器12中,并通過第一接口裝置13發(fā)送到信息處理裝置20。
[0084]此外,在第一圖像存儲器12中,數(shù)據(jù)處理部170也可以針對不同原稿種類來變更儲存輸入圖像的區(qū)域。又,數(shù)據(jù)處理部170也可以利用公知的圖像處理技術(shù)來實行與原稿種類相應(yīng)的校正處理。又,將各原稿種類(收據(jù)、名片或照片)所對應(yīng)的多個應(yīng)用程序與該原稿種類進(jìn)行關(guān)聯(lián)并存儲在第一存儲裝置14中,數(shù)據(jù)處理部170也可以實行對原稿種類進(jìn)行過關(guān)聯(lián)的應(yīng)用程序。
[0085]如上所述,原稿種類判別部169基于原稿尺寸、原稿是否具有單色印刷面、文字方向和文字列密度來判別原稿種類。此外,原稿種類判別部169也可以不使用原稿尺寸、原稿是否具有單色印刷面和/或文字方向來判別原稿種類。
[0086]例如,也可以省略步驟S102?S104和步驟S113?S115的處理,原稿種類判別部169僅判別原稿是否是收據(jù)。這種情況下,也可以進(jìn)一步省略步驟S106?S107和/或S108?S109的處理,原稿種類判別部169判別原稿是否是收據(jù)。又,也可以實施步驟S102?S104和步驟SI 13?SI 15的處理,并省略步驟S106?S107和/或S108?S109的處理,原稿種類判別部169判別原稿種類。
[0087]又,一般地,用戶集中相同種類的原稿來讓圖像讀取裝置10讀取的可能性較高。因而,在圖像讀取裝置10連續(xù)讀取多個原稿的情況下,原稿種類判別部169也可以利用處理中原稿的前后讀取的原稿種類的判別結(jié)果來判別處理中原稿的種類。例如,原稿種類判別部169將原稿種類判別為與剛傳送走的原稿種類相同?;蛘?,原稿種類判別部169也可以對連續(xù)讀取的多個原稿分別地判別原稿種類,將連續(xù)讀取的全部原稿種類判別為被判別出的原稿種類中最多的那種。
[0088]或者,在圖像讀取裝置10讀取多個原稿的情況下,原稿種類判別部169也可以利用處理中原稿的前后讀取的原稿種類的判別結(jié)果來變更處理中原稿的種類的判別方法。例如,原稿種類判別部169在判別剛讀取的原稿是收據(jù)的情況下,降低與文字列密度作比較的規(guī)定值VI,更容易將處理中原稿判別為收據(jù)。另一方面,原稿種類判別部169在判別剛傳送走的原稿是收據(jù)的情況下,提高與文字列密度作比較的規(guī)定值VI,更容易將處理中原稿判別為不是收據(jù)。由此,原稿種類判別部169能夠更高精度地判別原稿種類。
[0089]圖5是示出原稿尺寸算出處理的動作示例的流程圖。圖5所示出的動作流程在圖3所示出的流程圖的步驟S102中被實行。
[0090]最初,對于輸入圖像亮度值,原稿尺寸算出部162提取出水平方向和垂直方向的邊緣像素(步驟S201)。
[0091]原稿尺寸算出部162計算出輸入圖像各像素的水平方向兩鄰的像素亮度值之差的絕對值(下面,稱為相鄰差分值),在相鄰差分值在閾值Th2以上的情況下,將該圖像上的像素作為垂直邊緣像素。該閾值Th2例如可以設(shè)定為人能夠用目視辨別圖像上亮度差異的亮度值之差(例如:15)。原稿尺寸算出部162在垂直方向上也進(jìn)行相同的處理,提取出水平邊緣像素。
[0092]然后,原稿尺寸算出部162從由水平邊緣像素生成的邊緣圖像(下面,稱為水平邊緣圖像)和由垂直邊緣像素生成的邊緣圖像(下面,稱為垂直邊緣圖像)中分別檢測出多條直線(步驟S202)。此外,從水平邊緣圖像中檢測出在水平方向上延伸的直線,從垂直邊緣圖像中檢測出在垂直方向上延伸的直線。原稿尺寸算出部162用霍夫轉(zhuǎn)換檢測直線。此夕卜,原稿尺寸算出部162也可以用最小二乘法檢測直線。
[0093]然后,原稿尺寸算出部162檢測出由檢測出的直線構(gòu)成的矩形(步驟S203)。原稿尺寸算出部162提取出由檢測出的多條直線之中大致兩兩正交的四條直線構(gòu)成的多個候選矩形首先,原稿尺寸算出部162選擇一條水平方向的直線(下面,稱為第一水平線),提取出與選擇的直線大致平行(例如±3°以內(nèi))且相距閾值Th3以上的水平方向的直線(下面,稱為第二水平線)。然后,原稿尺寸算出部162提取出與第一水平線大致正交(例如相對于90°在±3°以內(nèi))的垂直方向的直線(下面,稱為第一垂直線)。然后,原稿尺寸算出部162提取出與第一水平線大致正交且與第一垂直線相距閾值Th4以上的垂直方向的直線(下面,稱為第二垂直線)。又,閾值Th3和閾值Th4也可根據(jù)圖像讀取裝置10的讀取對象即原稿的尺寸預(yù)先確定,可為相同。
[0094]對于檢測出的全部直線,原稿尺寸算出部162提取滿足上述條件的第一水平線、第二水平線、第一垂直線及第二垂直線的全部組合,并提取由提取出的各組合組成的矩形作為候選矩形。對于提取出的候選矩形,原稿尺寸算出部162計算出面積并檢測出面積最大的候選矩形作為矩形。
[0095]然后,原稿尺寸算出部162旋轉(zhuǎn)該矩形,使得檢測出的矩形的四邊分別與輸入圖像的四邊大致平行(步驟S204)。
[0096]圖6是用于對矩形的旋轉(zhuǎn)進(jìn)行說明的示意圖。在圖6所示的輸入圖像600中,由第一水平線601、第二水平線602、第一垂直線603及第二垂直線604組成的矩形605被檢測出來了。原稿尺寸算出部162計算出兩條水平線之中位于靠近輸入圖像600的上端部一側(cè)的第一水平線601與在輸入圖像900的上端部平行的水平線606之間的角度607。同樣地,原稿尺寸算出部162計算出兩條垂直線之中位于靠近輸入圖像600的上端部一側(cè)的第二垂直線604與水平線606之間的角度608。在角度607小于角度608的情況下,原稿尺寸算出部162旋轉(zhuǎn)矩形605,使得第一水平線601與水平線606平行(角度607變?yōu)?° )。另一方面,在角度607大于角度608的情況下,原稿尺寸算出部162旋轉(zhuǎn)矩形605,使得第二垂直線604與水平線606平行(角度608變?yōu)?° )。
[0097]然后,原稿尺寸算出部162根據(jù)檢測出的矩形縱向點數(shù)及橫向的點數(shù)和讀入原稿時的分辨率(dpi:dots per inch)計算出原稿的縱向尺寸和橫向尺寸(步驟S205)。原稿尺寸算出部162計算出各尺寸并結(jié)束一系列的步驟。
[0098]圖7是示出文字方向判別處理的動作的示例的流程圖。圖7所示的動作流程在圖3所示的流程圖的步驟S108中被實行。
[0099]最初,二值化圖像生成部165生成已進(jìn)行二值化的輸入圖像的二值化圖像(步驟S301)。對于輸入圖像的亮度值,二值化圖像生成部165使用二值化閾值來進(jìn)行二值化處理,將大于二值化閾值的像素轉(zhuǎn)換為有效像素(黑色像素),將小于二值化閾值的像素轉(zhuǎn)換為無效像素(白色像素)。二值化閾值可以是被預(yù)先決定的值(例如128),也可以等于輸入圖像全部像素亮度值的平均值。
[0100]然后,直方圖生成部166生成二值化圖像的有效像素的直方圖(步驟S302)。直方圖生成部166生成以二值化圖像的水平方向或垂直方向的線為梯級、以水平方向或垂直方向的線的有效像素個數(shù)為頻數(shù)的直方圖。直方圖生成部166生成以連續(xù)的規(guī)定數(shù)量的水平方向的線為一個梯級、以該規(guī)定數(shù)量的水平方向的線的有效像素個數(shù)為頻數(shù)的水平直方圖。同樣地,直方圖生成部166生成以連續(xù)的規(guī)定數(shù)量的垂直方向的線為一個梯級、以該規(guī)定數(shù)量的垂直方向的線的有效像素個數(shù)為頻數(shù)的垂直直方圖。規(guī)定數(shù)量例如為1,為了降低處理負(fù)荷也可以設(shè)為2以上的值。
[0101]然后,在直方圖生成部166生成的直方圖中,文字方向判別部167提取出頻數(shù)在閾值以上的梯級連續(xù)的連續(xù)區(qū)域之中梯級的寬度是規(guī)定范圍的連續(xù)區(qū)域(步驟S303)。文字方向判別部167分別在水平直方圖和垂直直方圖中,提取出頻數(shù)在閾值Th5以上的梯級,并提取出頻數(shù)在閾值Th5以上的梯級連續(xù)的區(qū)域作為第一連續(xù)區(qū)域。該閾值Th5例如為1,為了去除一定的噪聲也可為2以上的值。文字方向判別部167從提取出的第一連續(xù)區(qū)域中,提取出與假定梯級的寬度作為文字的高度或?qū)挾鹊姆秶?例如2mm?6mm)相當(dāng)?shù)姆秶膮^(qū)域作為第二連續(xù)區(qū)域。
[0102]然后,文字方向判別部167計算出對于水平直方圖提取出的第二連續(xù)區(qū)域的數(shù)量和對于垂直直方圖提取出的第二連續(xù)區(qū)域的數(shù)量(步驟S304)。
[0103]然后,文字方向判別部167根據(jù)對于水平直方圖提取出的第二連續(xù)區(qū)域的數(shù)量和對于垂直直方圖提取出的第二連續(xù)區(qū)域的數(shù)量來判別文字方向(步驟S305)。文字方向判別部167在對于水平直方圖提取出的第二連續(xù)區(qū)域的數(shù)量在對于垂直直方圖提取出的第二連續(xù)區(qū)域的數(shù)量以上的情況下,將文字方向判別為水平方向。文字方向判別部167在對于水平直方圖提取出的第二連續(xù)區(qū)域的數(shù)量不及對于垂直直方圖提取出的第二連續(xù)區(qū)域的數(shù)量的情況下,將文字方向判別為垂直方向。
[0104]圖8是用于對文字方向判別處理進(jìn)行說明的示意圖。圖8的圖像801是對于收據(jù)而生成的二值化圖像的一個示例。圖表802示出以圖像801所示的收據(jù)寬度方向(水平方向)的線的有效像素個數(shù)為頻數(shù)的水平直方圖。圖表803示出以正交于圖像801所示的收據(jù)寬度方向的方向(垂直方向)的線的有效像素個數(shù)為頻數(shù)的垂直直方圖。又,區(qū)域804?814示出對于水平直方圖提取出的第一連續(xù)區(qū)域,區(qū)域815?818示出對于垂直直方圖提取出的第一連續(xù)區(qū)域。雖然區(qū)域804?814及區(qū)域815?816也作為第二連續(xù)區(qū)域被提取,但因為區(qū)域817?818比規(guī)定范圍更長,所以沒有作為第二連續(xù)區(qū)域被提取。
[0105]如圖8所示,在文字排列在水平方向上的情況下,對于水平直方圖,因為與“ABC” “ 7卜9 > ”等各行的文字列對應(yīng)地提取連續(xù)區(qū)域,所以對于水平直方圖提取的連續(xù)區(qū)域的數(shù)量是文字被印刷的行數(shù)。另一方面,因為在垂直方向的各條線中各行的文字重復(fù)地存在,所以對于垂直直方圖提取的連續(xù)區(qū)域較少。圖8所示的示例中,對于水平直方圖提取的連續(xù)區(qū)域的數(shù)量是11,對于垂直直方圖提取的連續(xù)區(qū)域的數(shù)量是4,并將文字方向判別為水平方向。
[0106]圖9是示出文字列信息算出處理的動作示例的流程圖。圖9所示的動作流程在圖3所示的流程圖的步驟SllO被實行。即是說,圖9所示的動作流程在圖7所示的動作流程之后被實行,文字列信息算出部168基于在圖7的步驟S302中生成的直方圖計算出文字列山/又ο
[0107]最初,文字列信息算出部168計算出直方圖生成部166生成的直方圖的全部梯級數(shù)和頻數(shù)在閾值Th6以上的梯級數(shù)(步驟S401)。該閾值Th6例如為1,為了去除一定的噪聲,也可以設(shè)為2以上的值。文字列信息算出部168對于水平直方圖及垂直直方圖分別計算出全部梯級數(shù)和頻數(shù)在閾值Th6以上的梯級數(shù)。
[0108]然后,文字列信息算出部168計算出頻數(shù)在閾值Th6以上的梯級數(shù)相對于直方圖的全部梯級數(shù)的比例作為文字列密度(步驟S402)并結(jié)束一系列的步驟。
[0109]如上詳述,通過按照圖3、5、7及9所示的流程圖進(jìn)行動作,圖像讀取裝置10基于原稿尺寸、原稿是否具有單色印刷面、文字方向及文字列密度,能夠高精度地判別原稿種類。
[0110]圖10是示出文字列信息算出處理的動作的另一示例的流程圖。
[0111]該流程圖在圖像讀取裝置10中可以代替上述的圖9所示的流程圖來實行。圖10所示的流程圖中,文字列信息算出部168使用標(biāo)注處理來計算出文字列密度。
[0112]最初,對于二值化圖像生成部165生成的二值化圖像,文字列信息算出部168判定各有效像素是否與其他有效像素連接,并將連接的有效像素標(biāo)注為一個群組(步驟S501)。文字列信息算出部168判定在水平方向、垂直方向或傾斜方向(8附近)上相鄰的有效像素相連接。此外,文字列信息算出部168也可以判定僅在水平方向或垂直方向(4附近)上相鄰的有效像素相連接。
[0113]然后,文字列信息算出部168判定各群組是否接近其他群組,并將相互接近的群組結(jié)合成一個區(qū)塊(步驟S502)。文字列信息算出部168將在垂直方向上互相重復(fù)且在水平方向上互相的端部位于規(guī)定距離以內(nèi)的群組、在水平方向上互相重復(fù)且在垂直方向上互相的端部位于規(guī)定距離以內(nèi)的群組結(jié)合成區(qū)塊。
[0114]然后,文字列信息算出部168計算出各區(qū)塊的面積(步驟S503)。文字列信息算出部168計算出區(qū)塊的外接矩形的面積(垂直方向的像素個數(shù)X水平方向的像素個數(shù))作為該區(qū)塊的面積。
[0115]然后,文字列信息算出部168計算出全部區(qū)塊的外接矩形的面積總和相對于二值化圖像中的全部像素個數(shù)的比例作為文字列密度(步驟S504)并結(jié)束一系列的步驟。
[0116]圖11是用于對標(biāo)注處理進(jìn)行說明的示意圖。圖11中,橫向是水平方向,縱向是垂直方向。圖11的圖像1100示出二值化圖像。二值化圖像1100中,各文字A?Z分別被標(biāo)注為一個群組。因為文字A的群組和文字B的群組在垂直方向上重合,且在水平方向上文字A的群組的右端和文字B的群組的左端位于規(guī)定距離以內(nèi),所以相互結(jié)合。同樣地,分別地結(jié)合文字B的群組和文字C的群組、文字C的群組和文字D的群組、文字D的群組和文字E的群組,并將文字A?E的群組結(jié)合成一個區(qū)塊1101。同樣地,將文字F?K的群組結(jié)合成一個區(qū)塊1102,將文字L?R的群組結(jié)合成一個區(qū)塊1103,將文字S?Z的群組結(jié)合成一個區(qū)塊1104。另一方面,因為區(qū)塊1101?1104互相在垂直方向上相隔的距離大于規(guī)定距離,所以沒有被結(jié)合。
[0117]此外,文字列信息算出部168也可以計算出全部群組的面積總和、全部群組的外接矩形的面積總和或全部有效像素的總和相對于二值化圖像全部像素個數(shù)的比例作為文字列密度。
[0118]圖3所示的步驟Slll中,原稿種類判別部169判別文字列密度是否比規(guī)定值V2更大。與決定規(guī)定值Vl同樣地決定規(guī)定值V2。
[0119]又,原稿種類判別部169也可以基于第一文字列密度和第二文字列密度來判別原稿種類,該第一文字列密度基于用圖9所示的流程圖計算出的直方圖,該第二文字列密度是用圖10所示的流程圖計算出的。這種情況下,原稿種類判別部169在第一文字列密度在規(guī)定值Vl以下的情況下,或者在第二文字列密度在規(guī)定值V2以下的情況下,判別原稿不是收據(jù)。另一方面,原稿種類判別部169在第一文字列密度比規(guī)定值Vl更大且第二文字列密度比規(guī)定值V2更大的情況下,判別原稿是收據(jù)。由此,基于文字列的水平方向成分、垂直方向成分及整體分布,能夠高精度地判別原稿是不是收據(jù)。
[0120]如上詳述,通過按照圖3、5、7及10所示的流程圖來進(jìn)行動作,圖像讀取裝置10基于原稿尺寸、原稿是否具有單色印刷面、文字方向及文字列密度,能夠高精度地判別原稿種類。
[0121]圖12是示出文字列信息算出處理的動作的又一示例的流程圖。
[0122]該流程圖在圖像讀取裝置10中可以代替上述的圖9所示的流程圖來實行。圖12所示的流程圖中,文字列信息算出部168計算出輸入圖像的文字列方差作為文字列信息。文字列方差是輸入圖像中文字列零散程度(離散程度)。
[0123]最初,文字列信息算出部168提取直方圖生成部166生成的直方圖中頻數(shù)在閾值以上的第一連續(xù)區(qū)域(步驟S601)。與圖7的流程圖的步驟S303同樣地,文字列信息算出部168提取第一連續(xù)區(qū)域。文字列信息算出部168在文字方向是水平方向的情況下,從水平直方圖中提取出第一連續(xù)區(qū)域,在文字方向是垂直方向的情況下,從垂直直方圖中提取出第一連續(xù)區(qū)域。
[0124]然后,文字列信息算出部168在提取出第一連續(xù)區(qū)域的直方圖中,計算出相互鄰近的第一連續(xù)區(qū)域的中心間的距離。又,文字列信息算出部168計算出直方圖的梯級的最小值與最接近最小值的第一連續(xù)區(qū)域的中心之間的距離。又,文字列信息算出部168計算出直方圖的梯級的最大值與最接近最大值的第一連續(xù)區(qū)域的中心之間的距離(步驟S602)。
[0125]在文字方向是水平方向的情況下,文字列信息算出部168計算出各第一連續(xù)區(qū)域的垂直方向的中心,并計算出相互鄰近的第一連續(xù)區(qū)域的垂直方向的中心之間的距離。又,文字列信息算出部168計算出水平直方圖的梯級的最小值與最接近最小值的第一連續(xù)區(qū)域的垂直方向的中心之間的距離。又,文字列信息算出部168計算出水平直方圖的梯級的最大值與最接近最大值的第一連續(xù)區(qū)域的垂直方向的中心之間的距離。
[0126]另一方面,在文字方向是垂直方向的情況下,文字列信息算出部168計算出各第一連續(xù)區(qū)域的水平方向的中心,并計算出相互鄰近的第一連續(xù)區(qū)域的水平方向的中心之間的距離。又,文字列信息算出部168計算出垂直直方圖的梯級的最小值與最接近最小值的第一連續(xù)區(qū)域的水平方向的中心之間的距離。又,文字列信息算出部168計算出垂直直方圖的梯級的最大值與最接近最大值的第一連續(xù)區(qū)域的水平方向的中心之間的距離。
[0127]然后,文字列信息算出部168計算出已計算出的全部距離的方差作為文字列方差(步驟S603)并結(jié)束一系列的步驟。
[0128]圖13是用于對文字列方差的算出處理進(jìn)行說明的示意圖。圖13的圖像1301表示對于收據(jù)而生成的二值化圖像的一個示例。圖表1302表示對于圖像1301的水平直方圖。虛線1321表示水平直方圖的梯級的最小值,虛線1322表示水平直方圖的梯級的最大值,虛線1321和虛線1322之間的各虛線表示第一連續(xù)區(qū)域的垂直方向的中心。距離1303表示水平直方圖的梯級的最小值與最接近最小值的第一連續(xù)區(qū)域的垂直方向的中心之間的距離。距離1304?1313表示相互鄰近的第一連續(xù)區(qū)域的垂直方向的中心之間的距離。距離1314表示水平直方圖的梯級的最大值與最接近最大值的第一連續(xù)區(qū)域的垂直方向的中心之間的距離。
[0129]如圖13所示,一般的收據(jù)中,文字列被配置在整張紙中。另一方面,在文字列被配置在橫向上的名片中,文字列被配置在偏下側(cè)處的情況較多。又,在拍攝日期和時間等文字列被配置在照片背面的情況下,一般來說,該文字列被配置在照片下端。因而,文字列被配置在橫向上的名片及照片中,與一般的收據(jù)相比,配置文字的區(qū)域偏向某一側(cè)的可能性較高。因而,基于文字列方差,能夠高精度地判別原稿種類。
[0130]圖3所示的步驟Slll中,原稿種類判別部169判別文字列方差是否比規(guī)定值V3更大。與決定規(guī)定值Vl同樣地決定規(guī)定值V3。由此,原稿種類判別部169基于文字列方差來判別原稿種類。
[0131]又,原稿種類判別部169也可以基于文字列密度和文字列方差來判別原稿種類。這種情況下,在文字列密度在規(guī)定值Vl以下的情況下,或者在文字列方差在規(guī)定值V3以下的情況下,原稿種類判別部169判別原稿不是收據(jù)。另一方面,在文字列密度大于規(guī)定值Vl且文字列方差大于規(guī)定值V3的情況下,原稿種類判別部169判別原稿是收據(jù)。由此,能夠高精度地判別原稿種類。
[0132]如上詳述,通過按照圖3、5、7及12所示的流程圖來進(jìn)行動作,圖像讀取裝置10基于原稿尺寸、原稿是否具有單色印刷面、文字方向及文字列方差,能夠高精度地判別原稿種類。
[0133]圖14是示出文字列信息算出處理的動作的又一示例的流程圖。
[0134]該流程圖在圖像讀取裝置10中可以代替上述的圖12所示的流程圖來實行。圖14所示的流程圖中,文字列信息算出部168使用標(biāo)注處理來計算出文字列方差。此外,因為步驟S701?S702的處理與圖10所示的步驟S501?S502的處理相同,所以省略說明。
[0135]步驟S703中,文字列信息算出部168計算出各區(qū)塊的中心間的距離、二值化圖像的一端與最接近該端的區(qū)塊的中心之間的距離、以及二值化圖像的另一端與最接近該另一端的區(qū)塊的中心之間的距離。
[0136]在文字方向是水平方向的情況下,文字列信息算出部168計算出各區(qū)塊的垂直方向的中心,并計算出相互鄰近的區(qū)塊的垂直方向的中心間的距離。又,文字列信息算出部168計算出二值化圖像的上端與最接近上端的區(qū)塊的垂直方向的中心之間的距離。又,文字列信息算出部168計算出二值化圖像的下端與最接近下端的區(qū)塊的垂直方向的中心之間的距離。
[0137]另一方面,在文字方向是垂直方向的情況下,文字列信息算出部168計算出各區(qū)塊的水平方向的中心,并計算出相互鄰近的區(qū)塊的水平方向的中心間的距離。又,文字列信息算出部168計算出二值化圖像的左端與最接近左端的區(qū)塊的水平方向的中心之間的距離。又,文字列信息算出部168計算出二值化圖像的右端與最接近右端的區(qū)塊的水平方向的中心之間的距離。
[0138]然后,文字列信息算出部168計算出已算出的全部距離的方差作為文字列方差(步驟S704)并結(jié)束一系列的步驟。
[0139]此外,文字列信息算出部168也可以計算出全部群組的重心間距離的方差、全部群組的外接矩形的中心間距離的方差、或者全部有效像素間距離的方差作為文字列密度。又,文字列信息算出部168也可以計算出全部區(qū)塊的中心位置的方差、全部群組的重心位置的方差、全部群組的外接矩形的中心位置的方差、或者全部有效像素位置的方差作為文字列密度。
[0140]如上詳述,通過按照圖3、5、7及14所示的流程圖來進(jìn)行動作,圖像讀取裝置10基于原稿尺寸、原稿是否具有單色印刷面、文字方向及文字列方差,能夠高精度地判別原稿種類。
[0141]圖15是另一圖像處理系統(tǒng)2的硬件構(gòu)成圖。圖15所示的圖像處理系統(tǒng)2與圖1所示的圖像處理系統(tǒng)I的不同之處在于設(shè)有圖像處理電路的裝置不同。即是說,圖像處理系統(tǒng)2中,信息處理裝置40是圖像處理裝置的一個示例,不是圖像讀取裝置30而是信息處理裝置40具有圖像處理電路46。該圖像處理電路46具有與圖1所示的圖像讀取裝置10的圖像處理電路16相同的功能。
[0142]在圖15所示的圖像處理系統(tǒng)2中能夠?qū)嵭信c上述圖3的流程圖所示的處理大致相同的處理。下面,對如何適合圖3的流程圖所示的處理進(jìn)行說明。圖像處理系統(tǒng)2中,圖3的流程圖所示的處理基于預(yù)先存儲在第二存儲裝置44中的程序,主要通過第二 CPU45協(xié)同信息處理裝置40的各個元件被實行。
[0143]然而,圖3的步驟SlOl中,圖像讀取裝置30的圖像輸入裝置31生成RGB圖像及輸入圖像并保存在第一圖像存儲器32中,第一 CPU35通過第一接口裝置33將各圖像發(fā)送到信息處理裝置40。另一方面,一旦信息處理裝置40的第二 CPU45通過第二接口裝置41從圖像讀取裝置30接收各圖像,就將接收到的各圖像保存在第二圖像存儲器42中。信息處理裝置40的圖像處理電路46從第二圖像存儲器42中讀出并取得各圖像(步驟S101)。
[0144]其他的處理通過信息處理裝置40的圖像處理電路46被實行。對圖像處理系統(tǒng)I進(jìn)行了說明的圖像讀取裝置10的圖像處理電路16所實行的情況與上述處理的動作相同。
[0145]由此,信息處理裝置40具備圖像處理電路46來實行原稿種類判別處理的情況能夠得到與圖像讀取裝置具備圖像處理電路來實行原稿種類判別處理的情況相同的效果。
[0146]以上,對本發(fā)明的適宜的實施方式進(jìn)行了說明,但本發(fā)明并不被這些實施方式所限定。例如,圖像讀取裝置和信息處理裝置的功能分擔(dān)并不被圖1及圖15所示的圖像處理系統(tǒng)的示例所限定,可以適當(dāng)?shù)剡M(jìn)行變更,將包含圖像處理電路中的各部分在內(nèi)的圖像讀取裝置及信息處理裝置的各部分配置于圖像讀取裝置或信息處理裝置?;蛘撸部梢杂靡惑w裝置來構(gòu)成圖像讀取裝置和信息處理裝置。
[0147]又,在圖像處理系統(tǒng)I或2中,例如也可以通過互聯(lián)網(wǎng)、電話線路網(wǎng)(包含便攜終端線路網(wǎng)、普通電話線路網(wǎng))、內(nèi)聯(lián)網(wǎng)等網(wǎng)絡(luò)來連接圖像讀取裝置和信息處理裝置?;蛘?,也可以通過無線LAN (Local Area Network)來連接。在那種情況下,在第一接口裝置及第二接口裝置設(shè)置連接網(wǎng)絡(luò)的通信接口電路。又,也可以在網(wǎng)絡(luò)上將多個信息處理裝置20分散配置,各信息處理裝置20協(xié)作來分擔(dān)直線檢測處理、矩形檢測處理等,使得能夠以云計算的方式提供圖像處理的服務(wù)。由此,對于多個圖像讀取裝置生成的讀取圖像,圖像處理系統(tǒng)能夠更高效率地實施原稿種類判別處理。
[0148]符號說明
[0149]10,30圖像讀取裝置
[0150]20、40信息處理裝置
[0151]161輸入圖像取得部
[0152]162原稿尺寸算出部
[0153]164印刷顏色判別部
[0154]165 二值化圖像生成部
[0155]166直方圖生成部
[0156]167文字方向判別部
[0157]168文字列信息算出部
[0158]169原稿種類判別部。
【權(quán)利要求】
1.一種圖像處理裝置,其特征在于,包括: 輸入圖像取得部,其讀取原稿并取得生成的輸入圖像; 文字列信息算出部,其計算出所述輸入圖像的文字列密度或文字列方差;和 原稿種類判別部,其基于所述文字列密度或文字列方差來判別所述原稿的種類。
2.如權(quán)利要求1所述的圖像處理裝置,其特征在于,還包括: 二值化圖像生成部,其生成對所述輸入圖像進(jìn)行了二值化的二值化圖像;和 直方圖生成部,其生成所述二值化圖像的有效像素的直方圖, 所述文字列信息算出部基于所述直方圖來計算出所述文字列密度或文字列方差。
3.如權(quán)利要求2所述的圖像處理裝置,其特征在于, 所述直方圖生成部生成以所述二值化圖像的水平方向或垂直方向的線為梯級、以水平方向或垂直方向的線的有效像素個數(shù)為頻數(shù)的直方圖, 所述文字列信息算出部計算出頻數(shù)在閾值以上的梯級數(shù)相對于所述直方圖的全部梯級數(shù)的比例作為所述文字列密度。
4.如權(quán)利要求2所述的圖像處理裝置,其特征在于,所述直方圖生成部生成以所述二值化圖像的水平方向或垂直方向的線為梯級、以水平方向或垂直方向的線的有效像素個數(shù)為頻數(shù)的直方圖, 所述文字列信息算出部提取所述直方圖中頻數(shù)在閾值以上的梯級連續(xù)的連續(xù)區(qū)域,計算出所述直方圖的梯級的最小值與最接近所述最小值的所述連續(xù)區(qū)域的中心之間的距離、所述直方圖的梯級的最大值與最接近所述最大值的所述連續(xù)區(qū)域的中心之間的距離、以及相互鄰近的所述連續(xù)區(qū)域的中心之間的距離的方差作為所述文字列方差。
5.如權(quán)利要求1或2所述的圖像處理裝置,其特征在于,所述原稿種類判別部至少判別名片、收據(jù)及照片作為所述原稿的種類。
6.如權(quán)利要求1或2所述的圖像處理裝置,其特征在于,還包括: 原稿尺寸算出部,其計算出所述原稿的尺寸, 所述原稿種類判別部還基于所述原稿的尺寸來判別所述原稿的種類。
7.如權(quán)利要求1或2所述的圖像處理裝置,其特征在于,還包括: 印刷顏色判別部,其判別所述原稿是否具有單色印刷面, 所述原稿種類判別部還基于所述原稿是否具有單色印刷面來判別所述原稿的種類。
8.如權(quán)利要求1或2所述的圖像處理裝置,其特征在于,還包括: 文字方向判別部,其對打印在所述原稿上的文字所排列的文字方向進(jìn)行判別, 所述原稿種類判別部還基于所述文字方向來判別所述原稿的種類。
9.一種圖像處理方法,其特征在于,包括: 讀取原稿并取得生成的輸入圖像的步驟; 計算出所述輸入圖像的文字列密度或文字列方差的步驟;和 基于所述文字列密度或文字列方差來判別所述原稿的種類的步驟。
【文檔編號】G06K17/00GK104469071SQ201410168163
【公開日】2015年3月25日 申請日期:2014年4月24日 優(yōu)先權(quán)日:2013年9月19日
【發(fā)明者】島崎克仁, 松田夕貴 申請人:株式會社Pfu