專利名稱:圖像處理裝置及圖像處理方法
技術領域:
本發(fā)明涉及圖像處理裝置和圖像處理方法。
背景技術:
未經(jīng)審查的日本專利申請公開No. 2003-317034披露了一種文檔分揀系統(tǒng),該文檔分揀系統(tǒng)利用字符識別裝置確定存儲在基本詞典中的詞語的出現(xiàn)頻率并且判斷文檔類型。未經(jīng)審查的日本專利申請公開No. 9-65143披露了一種具有地圖文檔識別功能的 圖像處理裝置,該圖像處理裝置判斷文檔是否為地圖并且基于判斷結果切換處理。未經(jīng)審查的日本專利申請公開No. 2004-297212披露了一種圖像處理裝置,該圖像處理裝置通過查找表示輸入文檔的全部內容的數(shù)據(jù)的特征來判斷文檔類型。
發(fā)明內容
本發(fā)明的目的在于提供一種圖像處理裝置和圖像處理方法,該圖像處理裝置和該圖像處理方法能夠設定適合文檔類型的壓縮格式而無需用戶設定壓縮格式。根據(jù)本發(fā)明的第一方面,提供一種圖像處理裝置,所述圖像處理裝置包括如下部件。文檔類型判斷單元基于利用文檔讀取器獲得的作為文檔讀取結果的讀取信息來判斷文檔屬于哪種文檔類型。壓縮格式設定單元基于由所述文檔類型判斷單元判斷出的文檔類型來設定用于從所述讀取信息生成圖像數(shù)據(jù)的壓縮格式。生成器利用由所述壓縮格式設定單元設定的壓縮格式壓縮所述讀取信息,以便生成與所述文檔對應的圖像數(shù)據(jù)。根據(jù)本發(fā)明的第二方面,根據(jù)本發(fā)明的第一方面所述的圖像處理裝置還可以包括顏色信息提取單元,其從所述讀取信息中提取顏色信息。所述壓縮格式設定單元可以基于由所述顏色信息提取單元提取出的顏色信息來設定用于從所述讀取信息生成圖像數(shù)據(jù)的壓縮格式。根據(jù)本發(fā)明的第三方面,在根據(jù)本發(fā)明的第二方面所述的圖像處理裝置中,當所述文檔類型判斷單元沒有判斷出所述文檔類型時,所述壓縮格式設定單元可以基于由所述顏色信息提取單元提取出的所述顏色信息來設定壓縮格式。根據(jù)本發(fā)明的第四方面,在根據(jù)本發(fā)明的第二方面所述的圖像處理裝置中,當所述讀取信息中最常出現(xiàn)的色值的比例與在所述讀取信息中最常出現(xiàn)的色值的預定范圍內的色值的比例之和超過閾值時,所述壓縮格式設定單元可以基于所述顏色信息設定第一壓縮格式,在所述第一壓縮格式中,包含在所述讀取信息中的顏色的數(shù)目減少為預定的顏色數(shù)目。根據(jù)本發(fā)明的第五方面,在根據(jù)本發(fā)明的第四方面所述的圖像處理裝置中,當所述讀取信息中最常出現(xiàn)的色值的比例與在所述讀取信息中最常出現(xiàn)的色值的預定范圍內的色值的比例之和小于或等于所述閾值時,所述壓縮格式設定單元可以基于所述顏色信息設定第二壓縮格式,在所述第二壓縮格式中,包含在所述讀取信息中的顏色的數(shù)目大于在所述第一壓縮格式中使用的顏色數(shù)目。根據(jù)本發(fā)明的第六方面,根據(jù)本發(fā)明的第一至第五方面的任一方面所述的圖像處理裝置還可以包括多頁面設置單元,當所述文檔包括多個頁面時,所述多頁面設置單元設置是否要為所述多個頁面中的每一頁設定壓縮格式。當所述多頁面設置單元設置不用為所述多個頁面中的每一頁設定壓縮格式時,所述生成器可以利用為第一頁設定的壓縮格式來生成與全部所述多個頁面對應的圖像數(shù)據(jù)。根據(jù)本發(fā)明的第七方面,在根據(jù)本發(fā)明的第六方面所述的圖像處理裝置中,當所述多頁面設置單元設置要為所述多個頁面中的每一頁設定壓縮格式時,所述文檔類型判斷單元可以為所述多個頁面中的每一頁判斷文檔類型,所述壓縮格式設定單元可以為所述多個頁面中的每一頁設定壓縮格式,并且所述生成器可以利用為所述多個頁面中的每一頁設 定的壓縮格式生成圖像數(shù)據(jù)。根據(jù)本發(fā)明的第八方面,提供一種圖像處理方法,所述圖像處理方法包括基于作為文檔讀取結果獲得的讀取信息判斷文檔屬于哪種文檔類型;基于所判斷出的文檔類型設定用于從所述讀取信息生成圖像數(shù)據(jù)的壓縮格式;以及利用所設定的壓縮格式壓縮所述讀取信息,以便生成與所述文檔對應的圖像數(shù)據(jù)。根據(jù)本發(fā)明的第一方面,可以提供一種圖像處理裝置,該圖像處理裝置能夠設定適合文檔類型的壓縮格式而無需用戶設定壓縮格式。根據(jù)本發(fā)明的第二方面,除通過本發(fā)明的第一方面獲得的優(yōu)點之外,即使無法判斷出文檔類型,也能夠設定壓縮格式而無需用戶設定壓縮格式。根據(jù)本發(fā)明的第三方面,與不具有第三方面的圖像處理裝置的構造的圖像處理裝置相比,可以根據(jù)是否能夠判斷文檔類型更有效地設定壓縮格式。根據(jù)本發(fā)明的第四方面,除通過本發(fā)明的第二方面獲得的優(yōu)點之外,與不具有第四方面的圖像處理裝置的構造的圖像處理裝置相比,可以更有效地設定壓縮格式。根據(jù)本發(fā)明的第五方面,除通過本發(fā)明的第四方面獲得的優(yōu)點之外,與不具有第五方面的圖像處理裝置的構造的圖像處理裝置相比,可以更有效地設定壓縮格式。根據(jù)本發(fā)明的第六方面,除通過本發(fā)明的第一至第五方面的任一方面獲得的優(yōu)點之外,與不具有第六方面的圖像處理裝置的構造的圖像處理裝置相比,當文檔具有多個頁面時,可以更有效地為所有頁面設定壓縮格式。根據(jù)本發(fā)明的第七方面,除通過本發(fā)明的第六方面獲得的優(yōu)點之外,可以為所有頁面設定壓縮格式而無需用戶為所有頁面設定壓縮格式。根據(jù)本發(fā)明的第八方面,可以提供一種圖像處理方法,該圖像處理方法能夠設定適合文檔類型的壓縮格式而無需用戶設定壓縮格式。
基于下列附圖,詳細地描述本發(fā)明的示例性實施例,其中圖I示出根據(jù)本發(fā)明的示例性實施例的圖像處理裝置的硬件構造的實例;圖2示出在圖I所示圖像處理裝置中運行的處理程序的構造;圖3示出圖2所示文檔類型判斷單元的構造;圖4示出圖2所示壓縮格式設定單元的構造;
圖5A和5B分別示出文檔判斷信息的實例和文檔類型壓縮格式關聯(lián)信息的實例;圖6是示出由圖4所示最常出現(xiàn)色判斷部分執(zhí)行的處理的頻率分布圖;圖7A至7C是示出通過處理程序執(zhí)行的處理的流程圖;圖8示出待通過根據(jù)本示例性實施例的處理程序處理的第一文檔;圖9示出待通過根據(jù)本示例性實施例 的處理程序處理的第二文檔;圖10示出待通過根據(jù)本示例性實施例的處理程序處理的第三文檔;圖11示出待通過根據(jù)本示例性實施例的處理程序處理的第四文檔;以及圖12示出待通過根據(jù)本示例性實施例的處理程序處理的第五文檔。
具體實施例方式圖I示出了根據(jù)本發(fā)明的示例性實施例的圖像處理裝置2的硬件構造的實例。如圖I所示,圖像處理裝置2包括控制器21、通信裝置22、記錄裝置24、用戶界面(UI)裝置25和圖像讀取器27??刂破?1包括例如中央處理單元(CPU)等計算單元212和例如存儲器等存儲單元214。UI裝置25包括例如液晶顯示器(IXD)或陰極射線管(CRT)等顯示單元以及鍵盤或觸控面板。圖像讀取器27例如是掃描儀,并且圖像讀取器27從例如文檔等記錄介質中讀取圖像等并將讀取出的圖像轉換成例如位圖形式的讀取信息。也就是說,圖像處理裝置2具有用作計算機的硬件部件,該硬件部件能夠執(zhí)行信息處理并且能夠與其他圖像處理裝置或終端通信。在附圖中,相同的部件和步驟分別以相同的附圖標記和步驟編號表示。在本示例性實施例中,圖像處理裝置2包括圖像讀取器27。然而,圖像處理裝置2也可以是不具有圖像讀取器的個人計算機(PC),在這種情況下,圖像處理裝置2可以經(jīng)由局域網(wǎng)(LAN)與圖像讀取器連接。圖2示出了在圖I所示圖像處理裝置2中運行的處理程序3的構造。如圖2所示,處理程序3包括文檔讀取信息接收器302、文檔讀取信息存儲單元304、壓縮格式手動指定單元306、文檔判斷信息存儲單元308、文檔類型壓縮格式存儲單元310、顏色信息提取單元314、顏色分布計算器316、文檔類型判斷單元32、壓縮格式設定單元34、壓縮處理器372、圖像數(shù)據(jù)生成器374、多頁面設置單元376、圖像數(shù)據(jù)輸出單元378和異常通知單元380。處理程序3經(jīng)由例如記錄介質240 (如圖I所示)提供給圖像處理裝置2。然后,處理程序3加載到存儲單元214中,并且利用圖像處理裝置2的硬件資源在安裝于圖像處理裝置2中的操作系統(tǒng)(OS)(未示出)下執(zhí)行。在本示例性實施例中,處理程序3由軟件實現(xiàn)。然而,處理程序3的全部功能或部分功能也可以由例如現(xiàn)場可編程門陣列(FPGA)等硬件實現(xiàn)。圖3示出了圖2所示文檔類型判斷單元32的構造。如圖3所示,文檔類型判斷單元32包括布局分析部分322、字符識別部分324、特定字符串判斷部分326、特定字符串位置判斷部分330、特定字符串尺寸判斷單元332和文檔判斷部分338。
圖4示出了圖2所示壓縮格式設定單元34的構造。如圖4所示,壓縮格式設定單元34包括文檔類型信息接收器342、文檔類型壓縮格式接收器344、文檔類型壓縮格式關聯(lián)部分348、壓縮格式確定部分350、黑白格式設定部分362、限制色格式設定部分364和高質量格式設定部分366。在處理程序3中,文檔讀取信息接收器302接收從圖像讀取器27獲得的讀取信息(文檔讀取信息),并且將文檔讀取信息輸出到文檔讀取信息存儲單元304。文檔讀取信息存儲單元304存儲從文檔讀取信息接收器302輸出的文檔讀取信
肩、O壓縮格式手動指定單元306利用UI裝置25接收從用戶獲得的壓縮格式手動指定、信息,并且將所接收到的壓縮格式手動指定信息輸出到壓縮格式設定單元34。壓縮格式手動指定信息表示是否通過根據(jù)預定的壓縮格式壓縮文檔讀取信息來生成圖像數(shù)據(jù)。壓縮格式手動指定信息包括不壓縮文檔讀取信息而生成圖像數(shù)據(jù)的指令、通過根據(jù)預定的壓縮格式壓縮文檔讀取信息來生成圖像數(shù)據(jù)的指令(稍后將要描述)以及通過根據(jù)所需的壓縮格式壓縮文檔讀取信息來生成圖像數(shù)據(jù)的指令。文檔判斷信息存儲單元308存儲稍后將要參照圖5A描述的文檔判斷信息。文檔判斷信息用于判斷被讀取文檔的類型,并且是利用UI裝置25從用戶獲得的。文檔類型壓縮格式存儲單元310存儲稍后將要參照圖5B描述的文檔類型壓縮格式關聯(lián)信息。文檔類型壓縮格式關聯(lián)信息用于根據(jù)文檔類型設定壓縮格式,并且是利用UI裝置25從用戶獲得的。圖5A示出了文檔判斷信息的實例,而圖5B示出了文檔類型壓縮格式關聯(lián)信息的實例。如圖5A所示,文檔判斷信息包括表示文檔的類型的文檔類型、表征文檔的類型的特定字符串、表示圍繞特定字符串所在位置的區(qū)域的位置信息以及表示特定字符串所在區(qū)域的尺寸的尺寸信息。如圖5B所示,文檔類型壓縮格式關聯(lián)信息包括文檔類型和根據(jù)文檔類型設定的壓縮格式。顏色信息提取單元314 (圖2)從存儲在文檔讀取信息存儲單元304中的文檔讀取信息中提取與包含在被讀取文檔中的顏色對應的顏色信息。顏色分布計算器316基于所提取出的顏色信息計算顏色分布。如果顏色信息是以RGB三維色空間表示的,則顏色信息提取單元314從文檔讀取信息中提取每個像素的三種顏色(即紅色(R)、綠色(G)和藍色(B))中的每一種的色值(例如亮度值)。在這種情況下,顏色分布計算器316計算各個像素中的色值出現(xiàn)的頻率,并且生成表示色值和色值出現(xiàn)的頻率之間的關系的頻率分布圖。下面,描述顏色信息以RGB三維色空間表示的情況。然而,顏色信息也可以由例如L*a*b色空間等其他色空間表示。在文檔類型判斷單元32中,布局分析部分322(圖3)分析文檔讀取信息,以便分揀出包含在文檔中的例如字符、表格、例如照片等非人工圖片、計算機圖形(CG)和繪畫等對象。然后,布局分析部分322將揀出的對象與位置信息相關聯(lián)。例如,可以通過檢測各種線條、邊框、格線、顏色信息和邊緣以及執(zhí)行圖案匹配來進行上述對象分揀。然而,對象分揀技術不限于這種類型。字符識別部分324利用例如光學字符識別(OCR)功能來分析文檔讀取信息。在這種情況下,字符識別部分324執(zhí)行詞素分析,以便將文檔讀取信息劃分成尺寸最小的有意義的字符串。按照如下方式執(zhí)行字符識別。將通過讀取文檔獲得的表示字符的圖像數(shù)據(jù)與預先存儲的圖案核對,以便指定字符并生成字符數(shù)據(jù)(字符串)。上述詞素分析是指如下處理。使用預先存儲的包括與語法規(guī)則和詞語有關的信息的詞典將一個句子細分成詞素(有意義的最小語言單位),并且判斷所細分成的詞素的詞類。字符識別部分324計算所檢測到的字符串的位置,以便生成字符串與字符串的位置相關聯(lián)的位置信息。特定字符串判斷部分326判斷包含在由文檔判斷信息存儲單元308提供的文檔判斷信息中的特定字符串是否包含在由字符識別部分324檢測到的字符串中。如果特定字符串包含在由字符識別部分324檢測到的字符串中,則特定字符串判斷部分326將與所檢測到的特定字符串有關的信息輸出到特定字符串位置判斷部分330和特定字符串尺寸判斷單元332。如果特定字符串不包含在由字符識別部分324檢測到的字符串中,則特定字符串判斷部分326將與特定字符串有關的信息(無特定字符串信息)輸出到文檔判斷部分338。如果特定字符串的位置位于圍繞以位置信息(位置信息包含在文檔判斷信息中且與相應的特定字符串相關聯(lián))表示的位置的區(qū)域內,則特定字符串位置判斷部分330生成表明特定字符串的位置與包含在位置信息中的位置一致的信息,并且將該信息(位置一致信息)輸出到文檔判斷部分338。如果特定字符串的尺寸在以尺寸信息(尺寸信息包含在文檔判斷信息中且與相應的特定字符串相關聯(lián))表示的尺寸的范圍內,則特定字符串位置判斷部分330生成表明特定字符串的尺寸與包含在尺寸信息中的尺寸一致的信息,并且將該信息(尺寸一致信息)輸出到文檔判斷部分338。如果位置一致信息和尺寸一致信息均已為預定的特定字符串生成,則文檔判斷部分338判定與文檔讀取信息對應的文檔是與該特定字符串相關的文檔,并且生成表示所判斷出的與文檔讀取信息對應的文檔類型的文檔類型信息。此外,文檔判斷部分338將文檔類型信息輸出到壓縮格式設定單元34。與此相反,如果位置一致信息和尺寸一致信息中的一者尚未生成或者無特定字符串信息已生成,則文檔判斷部分338生成表明沒有判斷出與文檔讀取信息對應的文檔類型的文檔類型信息。下面,參照圖5A具體地描述上述處理。例如,現(xiàn)在假定特定字符串判斷部分326已經(jīng)從文檔讀取信息中檢測到特定字符 串 “AAA”。在這種情況下,如果特定字符串位置判斷部分330判定特定字符串“AAA”的位置位于圍繞以位置信息#1表示的位置的區(qū)域內并且特定字符串尺寸判斷單元332判定特定字符串“AAA”的尺寸在以尺寸信息#1表示的尺寸的范圍內,則為特定字符串“AAA”生成位
置一致信息和尺寸一致信息。因此,文檔判斷部分338判定與文檔讀取信息對應的文檔類型是“文檔A”。在上述示例性實施例中,當位置一致信息和尺寸一致信息均已為預定的特定字符串生成時,文檔判斷部分338判定包含該特定字符串的文檔類型并且生成文檔類型信息。然而,當位置一致信息和尺寸一致信息中的一者已為預定的特定字符串生成時,文檔判斷部分338也可以判定包含該特定字符串的文檔類型。
在上述示例性實施例中,位置信息和尺寸信息各自具有預定范圍,并且判斷特定字符串的位置和尺寸是否分別在位置信息和尺寸信息的范圍內。作為選擇,位置信息和尺寸信息也可以各自具有預定的特定值。于是,當特定字符串的位置和尺寸接近預定的特定值時,可以給予特定字符串的位置和尺寸較高的分數(shù)。如果給予位置和尺寸的分數(shù)的總值超過閾值,則文檔判斷部分338可以判定包含該特定字符串的文檔類型。在上述示例性實施例中,基于特定字符串的位置和尺寸判斷文檔類型。然而,也可以以不同方式判斷文檔類型。例如,為了判斷文檔類型是否為設計圖,如果在特定位置(例如右下部或左上部)包含有預定數(shù)目的橫、豎格線,則可以判定文檔類型為設計圖。在壓縮格式設定單元34中,文檔類型信息接收器342 (圖4)從文檔類型判斷單元32接收文檔類型信息,并且將所接收到的文檔類型信息輸出到文檔類型壓縮格式關聯(lián)部分348。文檔類型壓縮格式接收器344從文檔類型壓縮格式存儲單元310接收文檔類型壓縮格式關聯(lián)信息,并且將所接收到的文檔類型壓縮格式關聯(lián)信息輸出到文檔類型壓縮格式關聯(lián)部分348。文檔類型壓縮格式關聯(lián)部分348基于文檔類型壓縮格式關聯(lián)信息確定與以文檔類型信息表示的文檔類型對應的壓縮格式。此外,如果文檔類型壓縮格式關聯(lián)部分348確定壓縮格式為黑白格式,則文檔類型壓縮格式關聯(lián)部分348指示黑白格式設定部分362設定壓縮格式。如果文檔類型壓縮格式關聯(lián)部分348確定壓縮格式為限制色格式,則文檔類型壓縮格式關聯(lián)部分348指示限制色格式設定部分364設定壓縮格式。如果文檔類型壓縮格式關聯(lián)部分348確定壓縮格式為高質量格式,則文檔類型壓縮格式關聯(lián)部分348指示高質量格式設定部分366設定壓縮格式?!昂诎赘袷皆O定”是如下數(shù)據(jù)壓縮設定。當生成圖像數(shù)據(jù)時,將待表達的顏色限制為只有黑色和白色?!跋拗粕袷皆O定”是如下數(shù)據(jù)壓縮設定。當生成圖像數(shù)據(jù)時,將待表達的顏色限制為預定數(shù)目的顏色。生成與每一種顏色對應的層并且將各個層壓縮為二值數(shù)據(jù),以便生成具有支持多層結構的文件格式(例如便攜文檔格式(PDF))的圖像數(shù)據(jù)?!案哔|量格式設定”是如下數(shù)據(jù)壓縮設定。當生成圖像數(shù)據(jù)時,從原始圖像中提取例如字符、照片和CG等對象。然后,生成各個層并且將各個層壓縮成適合所提取的對象的格式,并且隨后將各個層整合在一起以便生成具有支持多層結構的文件格式(例如HF)的圖像數(shù)據(jù)。
也就是說,在壓縮表示文檔讀取信息的數(shù)據(jù)時圖像數(shù)據(jù)所再現(xiàn)的顏色的數(shù)目根據(jù)采用哪種壓縮格式(即“黑白格式設定”、“限制色格式設定”或“高質量格式設定”)而不同。按照“黑白格式設定”、“限制色格式設定”和“高質量格式設定”的順序能夠獲得的再現(xiàn)色的數(shù)目越來越大。在采用“高質量設定”的情況下,可再現(xiàn)的顏色的數(shù)目最大?!跋拗粕笔侵竿ㄟ^基于頻率分布圖的計算提取出的一種或多種代表色。在“限制色設定”的情況下,顏色與預定的限制色不同的像素分別被轉換成RGB色空間內與限制色中的一種最接近(色值與限制色中的一種的色值最接近)的顏色。這樣,通過將顏色的數(shù)目減少為限制色的數(shù)目,“限制色格式設定”的壓縮比高于“高質量格式設定”的壓縮比。如果文檔類型信息不表示文檔類型(即如果沒有判斷出文檔類型),則文檔類型壓縮格式關聯(lián)部分348將沒有判斷出文檔類型的信息(類型未指定信息)輸出到壓縮格式確定部分350。如果文檔類型信息表示文檔類型并且相應的壓縮格式是“彩色設定格式”,則意味著可以采用“限制色格式設定”和“高質量格式設定”中的任何一種。
從而,文檔類型壓縮格式關聯(lián)部分348將該信息(顏色設定信息)輸出到壓縮格式確定部分350。參照圖5B,具體地描述上述處理。例如,如果判定文檔類型是“文檔A”,則文檔類型壓縮格式關聯(lián)部分348指示限制色格式設定部分364設定壓縮格式以便根據(jù)“限制色格式設定”壓縮“文檔A”。如果判定文檔類型是“文檔D”,則文檔類型壓縮格式關聯(lián)部分348將類型未指定信息輸出到壓縮格式確定部分350 (圖4)。如果判定文檔類型是“文檔B”,則文檔類型壓縮格式關聯(lián)部分348將顏色設定信息輸出到壓縮格式確定部分350。在文檔類型壓縮格式關聯(lián)部分348沒有將壓縮格式確定為一種格式的情況下,壓縮格式確定部分350確定所要設定的壓縮格式。壓縮格式確定部分350包括最常出現(xiàn)色確定部分354和包含色確定部分356。圖6是示出由最常出現(xiàn)色確定部分354執(zhí)行的處理的頻率分布圖。在圖6中,橫軸是每一種RGB顏色的色值(例如亮度),而縱軸是相對于每個色值的像素出現(xiàn)頻率(像素數(shù)目)。在本示例性實施例中,作為顏色分布給出了示出相對于RGB值的像素出現(xiàn)頻率的二維頻率分布圖。然而,也可以生成示出相對于單獨的R色、G色和B色的像素出現(xiàn)頻率的三維頻率分布圖。為了便于圖示,在本示例性實施例中,作為顏色分布示出了二維頻率分布圖。然而,也可以生成計算和分析相對于每個單獨的R色、G色和B色的像素出現(xiàn)頻率的三維頻率分布圖。在這種情況下,在三維頻率分布圖中,像素的數(shù)目與對應于2563個立方體中的每一個的顏色相關聯(lián),其中,對于RGB三維空間的三個維度中的每個維度都形成有256個分區(qū)。最常出現(xiàn)色確定部分354指定與最常出現(xiàn)點對應的色值,并且將包含在該最常出現(xiàn)點的預定色值寬度內的色值設定為最常出現(xiàn)色。
更具體來說,在圖6所示的實例中,最常出現(xiàn)色確定部分354指定點B作為最常出現(xiàn)點并且將包含在點B的預定色值寬度W2內的色值設定為最常出現(xiàn)色。然后,最常出現(xiàn)色確定部分354判斷最常出現(xiàn)色在整個文檔中的比例是否小于或等于閾值(例如80% ) 如果找到的最常出現(xiàn)色的比例小于或等于閾值,則最常出現(xiàn)色確定部分354指示高質量格式設定部分366設定壓縮格式。與此相反,如果最常出現(xiàn)色確定部分354判定找到的最常出現(xiàn)色的比例大于閾值,則包含色確定部分356執(zhí)行如下處理。包含色確定部分356對頻率分布圖進行采樣和量化,然后指定出現(xiàn)頻率大于或等于閾值的色值并且將包含在所指定的色值的預定范圍內的色值設定為包含在文檔中的顏色(包含色)。 包含色確定部分356還計算包含色的數(shù)目并且判斷包含色的數(shù)目是否大于或等于閾值。如果包含色的數(shù)目大于或等于閾值,則包含色確定部分356指示高質量格式設定部分366設定壓縮格式。如果判定包含色的數(shù)目小于閾值并且已經(jīng)從文檔類型壓縮格式關聯(lián)部分348輸出了顏色設定信息,則包含色確定部分356指示限制色格式設定部分364設定壓縮格式。如果判定包含色的數(shù)目小于閾值并且沒有從文檔類型壓縮格式關聯(lián)部分348輸出顏色設定信息,則包含色確定部分356判斷包含色是否被限制為只有黑色和白色或者被限制為色值在黑色或白色的預定范圍內的顏色。如果該判斷結果是肯定(是),則包含色確定部分356指示黑白格式設定部分362設定壓縮格式。如果該判斷結果是否定(否),則包含色確定部分356指示限制色格式設定部分364設定壓縮格式。黑白格式設定部分362將壓縮格式設定為黑白格式,并且將與所設定的壓縮格式有關的信息輸出到壓縮處理器372。限制色格式設定部分364將壓縮格式設定為限制色格式,并且將與所設定的壓縮格式有關的信息輸出到壓縮處理器372。高質量格式設定部分366將壓縮格式設定為高質量格式,并且將與所設定的壓縮格式有關的信息輸出到壓縮處理器372。在本示例性實施例中,壓縮格式的具體實例是黑白格式、限制色格式和高質量格式。然而,壓縮格式不限于這些類型。壓縮處理器372 (圖2)根據(jù)由黑白格式設定部分362、限制色格式設定部分364或高質量格式設定部分366設定的壓縮格式對文檔讀取信息執(zhí)行壓縮處理。如果文檔包括多個頁面,則多頁面設置單元376設置第二頁和隨后的頁面是否遵循為第一頁設定的壓縮格式或者設置是否要為每一頁設定壓縮格式??梢岳肬I裝置25從用戶獲得該設置。如果文檔包括多個頁面并且第二頁和隨后的頁面遵循為第一頁設定的壓縮格式,則壓縮處理器372按照為第一頁設定的壓縮格式壓縮第二頁和隨后的頁面。與此相反,如果文檔包括多個頁面并且要為每一頁設定壓縮格式,則壓縮處理器372控制文檔類型判斷單元32和壓縮格式設定單元34執(zhí)行上述處理。圖像數(shù)據(jù)生成器374為經(jīng)歷過壓縮處理的信息生成例如PDF格式的圖像。如果文檔包括多個頁面,則通過組合經(jīng)歷過壓縮處理的多個頁面來生成圖像數(shù)據(jù)。圖像數(shù)據(jù)輸出單元378將所生成的圖像數(shù)據(jù)顯示在用作顯示裝置的n裝置25上。如果壓縮格式確定部分350沒有確定出壓縮格式,則異常通知單元380將警告信息顯示在用作顯示裝置的UI裝置25上或者使得用作揚聲器的UI裝置25發(fā)出警告。圖7A至7C是示出通過處理程序3執(zhí)行的處理的流程圖。在步驟S102中,文檔讀取信息接收器302接收作為文檔讀取結果而獲得的文檔讀取信息。在步驟S104中,壓縮格式手動指定單元306判斷是否給出了在生成圖像數(shù)據(jù)時壓縮文檔讀取信息的指令。如果步驟S104中的結果是否定,則處理轉入步驟S106。如果步驟S104中的結果是肯定,則處理轉入步驟S108。在步驟S106中,圖像數(shù)據(jù)生成器374不壓縮文檔讀取信息而生成圖像數(shù)據(jù),并且完成處理。在步驟S108中,壓縮格式手動指定單元306判斷是否指定了壓縮格式。如果已經(jīng)指定了壓縮格式,則處理轉入步驟S110。如果沒有指定壓縮格式,S卩如果要自動地設定壓縮格式,則處理轉入步驟SI 12。在步驟SllO中,壓縮處理器372利用所指定的壓縮格式執(zhí)行壓縮處理。在步驟S112中,文檔類型判斷單元32判斷文檔是否屬于特定類型。如果文檔屬于特定類型,則處理轉入步驟S114。如果在步驟S112中判定文檔不屬于特定類型或者沒有判斷出文檔類型,則處理轉入步驟S162。在步驟S114中,壓縮格式設定單元34的文檔類型壓縮格式關聯(lián)部分348判斷是否指定了與文檔類型對應的壓縮格式。如果步驟S114中的結果是肯定,則處理轉入步驟S116。如果步驟S114中的結果是否定,則處理轉入步驟S162。在步驟S116中,文檔類型壓縮格式關聯(lián)部分348判斷所指定的壓縮格式是否為黑白格式。如果指定了黑白格式,則處理轉入步驟S118。如果沒有指定黑白格式,則處理轉入步驟S120。在步驟S118中,黑白格式設定部分362將壓縮格式設定為黑白格式,并且壓縮處理器372利用黑白格式執(zhí)行壓縮處理。在步驟S120中,文檔類型壓縮格式關聯(lián)部分348判斷所指定的壓縮格式是限制色格式和高質量格式中的一者還是僅僅指定了彩色設定。如果指定了限制色格式和高質量格式中的一者,則處理轉入步驟S122。如果僅僅指定了彩色設定,則處理轉入步驟S172。在步驟S122中,限制色格式設定部分364或高質量格式設定部分366設定相應的壓縮格式,并且壓縮處理器372利用限制色格式或高質量格式執(zhí)行壓縮處理。在步驟S142中,多頁面設置單元376判斷文檔是否包括多個頁面。如果文檔包括多個頁面,則處理轉入步驟S144。如果文檔只包括一個頁面,則處理轉入步驟S150。在步驟S144中,多頁面設置單元376判斷第二頁和隨后的頁面是否遵循為第一頁設定的壓縮格式。如果步驟S144中的結果是肯定,則處理轉入步驟S146。如果步驟S144中的結果是否定,則處理轉入步驟S148。在步驟S146中,壓縮處理器372利用為第一頁設定的壓縮格式對第二頁和隨后的頁面執(zhí)行壓縮處理。在步驟S148中,壓縮處理器372判斷所有的頁面是否都已經(jīng)歷過壓縮處理。如果步驟S148中的結果是肯定,則處理轉入步驟S150。如果步驟S148中的結果是否定,則處理返回到步驟S112。在步驟S150中,圖像數(shù)據(jù)生成器374生成經(jīng)歷過壓縮處理的圖像數(shù)據(jù)。于是,完成處理。在步驟S162中,壓縮格式設定單元34的最常出現(xiàn)色確定部分354判斷最常出現(xiàn)色的比例是否小于或等于閾值。如果步驟S162中的結果是肯定,則處理轉入步驟S184。如果步驟S162中的結果是否定,則處理轉入步驟S164。
在步驟S164中,壓縮格式設定單元34的包含色確定部分356判斷包含色的數(shù)目是否大于或等于閾值。如果步驟S164中的結果是肯定,則處理轉入步驟S184。如果步驟S164中的結果是否定,則處理轉入步驟S166。在步驟S166中,壓縮格式設定單元34的包含色確定部分356判斷包含色是否被限制為只有黑色和白色或者被限制為色值在黑色或白色的預定范圍內的顏色。如果步驟S166中的結果是肯定,則處理轉入步驟S180。如果步驟S166中的結果是否定,則處理轉入步驟S182。在步驟S172中,壓縮格式設定單元34的最常出現(xiàn)色確定部分354判斷最常出現(xiàn)色的比例是否小于或等于閾值。如果步驟S172中的結果是肯定,則處理轉入步驟S184。如果步驟S172中的結果是否定,則處理轉入步驟S174。在步驟S174中,壓縮格式設定單元34的包含色確定部分356判斷包含色的數(shù)目是否大于或等于閾值。如果步驟S174中的結果是肯定,則處理轉入步驟S184。如果步驟S174中的結果是否定,則處理轉入步驟S182。在步驟S180中,壓縮格式設定單元34的黑白格式設定部分362將壓縮格式設定為黑白格式。在步驟S182中,壓縮格式設定單元34的限制色格式設定部分364將壓縮格式設定為限制色格式。在步驟S184中,壓縮格式設定單元34的高質量格式設定部分366將壓縮格式設定為高質量格式。下面,借助于具體實例描述通過根據(jù)本示例性實施例的處理程序3執(zhí)行的處理。圖8示出了待通過根據(jù)本示例性實施例的處理程序3處理的第一文檔。圖8所示的第一文檔是估價單。該文檔的背景是白色,以E表示的部分是紅色,而其他字符和線條是黑色?,F(xiàn)在假定包含在圖5A所示文檔判斷信息中的文檔類型的文檔A是估價單,相應的特定字符串“AAA”是“估價單”,相應的位置信息#1表示“文檔的頂部中心”,并且相應的尺寸信息#1表示“較大的尺寸(字體)”。在圖8所示的實例中,字符串“估價單”位于文檔的頂部中心處,并且該字符串的尺寸大于其他字符串的尺寸。
因此,文檔類型判斷單元32(圖2)基于圖5A所示的文檔判斷信息判定圖8所示文檔是估價單。然后,壓縮格式設定單元34的文檔類型壓縮格式關聯(lián)部分348 (圖4)基于文檔類型壓縮格式關聯(lián)信息確定為估價單使用哪種壓縮格式。例如,如果圖5B中所示的文檔A是估價單,則文檔類型壓縮格式關聯(lián)部分348將壓縮格式設定為限制色格式,并且如果圖5B中所示的文檔C是估價單,則文檔類型壓縮格式關聯(lián)部分348將壓縮格式設定為黑白格式。如果圖5B中所示的文檔B是估價單,則壓縮格式為“彩色格式”,并且文檔類型壓縮格式關聯(lián)部分348無法確定要使用哪種壓縮格式(S卩,限制色格式還是高質量格式)。因而,壓縮格式確定部分350確定壓縮格式。白色占據(jù)圖8所示文檔的90%或更多,因此最常出現(xiàn)色確定部分354分析頻率分 布圖并且判定最常出現(xiàn)色是白色且白色在文檔中的比例超過閾值(例如50%)。此外,在圖8所示的文檔中,包含色只有白色、黑色和紅色(E部分),因而包含色確定部分356判定包含色的數(shù)目小于或等于閾值。從而,限制色格式設定部分364將壓縮格式設定為限制色格式。圖9示出了待通過根據(jù)本示例性實施例的處理程序3處理的第二文檔。圖9所示的第二文檔是地鐵線路圖,該地鐵線路圖包括白色的背景、紅色、藍色、黃色和綠色的線條以及黑色的字符。如果圖9所示的文檔類型不包含在圖5A所示的文檔判斷信息中,則文檔類型判斷單元32將類型未指定信息輸出到壓縮格式確定部分350,并且壓縮格式確定部分350確定壓縮格式。白色占據(jù)圖9所示文檔的50%或更多,因此最常出現(xiàn)色確定部分354分析頻率分布圖并且判定最常出現(xiàn)色是白色且白色在文檔中的比例超過閾值(例如50%)。此外,在圖9所示的文檔中,包含色有白色、黑色、紅色、藍色、黃色和綠色,因而如果閾值是5,則包含色確定部分356判定包含色的數(shù)目大于閾值。從而,高質量格式設定部分366將壓縮格式設定為高質量格式。圖10示出了待通過根據(jù)本示例性實施例的處理程序3處理的第三文檔。圖10所示的第三文檔是設計圖。該文檔的背景是白色,以F表示的部分(尺寸被修改的部分)是紅色,而其他字符和線條是黑色?,F(xiàn)在假定包含在圖5A所示文檔判斷信息中的文檔類型的文檔D是設計圖,相應的特定字符串“DDD”是“圖號”,相應的位置信息#4表示“文檔右下部的框體內”,并且相應的尺寸信息#4表示“容納在框體內的尺寸”。在圖10所示的實例中,字符串“圖號”位于文檔右下部的框體內。因此,文檔類型判斷單元32基于圖5A所示的文檔判斷信息判定圖10所示文檔是設計圖。然后,壓縮格式設定單元34的文檔類型壓縮格式關聯(lián)部分348基于文檔類型壓縮格式關聯(lián)信息確定為設計圖使用哪種壓縮格式。例如,如果圖5B中所示的文檔D是設計圖,則文檔類型壓縮格式關聯(lián)部分348無法確定壓縮格式,從而壓縮格式確定部分350確定壓縮格式。白色占據(jù)圖10所示文檔的90 %或更多,因此最常出現(xiàn)色確定部分354分析頻率分布圖并且判定最常出現(xiàn)色是白色且白色在文檔中的比例超過閾值(例如50%)。此外,在圖10所示的文檔中,包含色只有白色、黑色和紅色(F部分),因而包含色確定部分356判定包含色的數(shù)目小于或等于閾值。從而,限制色格式設定部分364將壓縮格式設定為限制色格式。圖11示出了待通過根據(jù)本示例性實施例的處理程序3處理的第四文檔。圖11所示的第四文檔是修理報告。該文檔的背景是白色,以G表示的部分(打印部分)是藍色,以H表示的部分是紅色,而其他字符和線條是黑色。如果圖11所示的文檔類型不包含在圖5A所示的文檔判斷信息中,則文檔類型判斷單元32將類型未指定信息輸出到壓縮格式確定部分350,并且 壓縮格式確定部分350確定壓縮格式。白色占據(jù)圖11所示文檔的50 %或更多,因此最常出現(xiàn)色確定部分354分析頻率分布圖并且判定最常出現(xiàn)色是白色且白色在文檔中的比例超過閾值(例如50%)。此外,在圖11所示的文檔中,包含色只有白色、黑色、藍色和紅色,因而包含色確定部分356判定包含色的數(shù)目小于閾值(例如5)。從而,限制色格式設定部分364將壓縮格式設定為限制色格式。圖12示出了待通過根據(jù)本示例性實施例的處理程序3處理的第五文檔。圖12所示的文檔包括例如估價單、設計圖和修理報告等多個文檔。在這種情況下,如果多頁面設置單元376設置第二頁和隨后的頁面遵循已經(jīng)為第一頁設定的壓縮格式,則按照已經(jīng)為估價單設定的壓縮格式壓縮第二頁和隨后的頁面。與此相反,如果多頁面設置單元376設置要為每一頁設定壓縮格式,則利用已經(jīng)為估價單、設計圖和修理報告分別設定的壓縮格式對各個頁面執(zhí)行壓縮處理。需要注意的是顏色信息提取單元314和顏色分布計算器316可以僅僅在文檔類型壓縮格式關聯(lián)部分348無法將壓縮格式確定為一種壓縮格式時才執(zhí)行處理。為了解釋和說明起見,已經(jīng)提供了對于本發(fā)明的示例性實施例的以上描述。本發(fā)明并非意在窮舉或將本發(fā)明限制在所披露的具體形式。顯然,許多修改和變型對于本領域的技術人員而言是顯而易見的。實施例的選取和描述是為了更好地解釋本發(fā)明的原理及其實際應用,從而使本領域的其他技術人員能夠理解本發(fā)明適用于各種實施例,并且本發(fā)明的各種變型適合于所設想的特定用途。本發(fā)明意在用前面的權利要求書及其等同內容來限定本發(fā)明的保護范圍。
權利要求
1.一種圖像處理裝置,包括 文檔類型判斷單元,其基于利用文檔讀取器獲得的作為文檔讀取結果的讀取信息來判斷文檔屬于哪種文檔類型; 壓縮格式設定單元,其基于由所述文檔類型判斷單元判斷出的文檔類型來設定用于從所述讀取信息生成圖像數(shù)據(jù)的壓縮格式;以及 生成器,其利用由所述壓縮格式設定單元設定的壓縮格式壓縮所述讀取信息,以便生成與所述文檔對應的圖像數(shù)據(jù)。
2.根據(jù)權利要求I所述的圖像處理裝置,還包括 顏色信息提取單元,其從所述讀取信息中提取顏色信息, 其中,所述壓縮格式設定單元基于由所述顏色信息提取單元提取出的顏色信息來設定用于從所述讀取信息生成圖像數(shù)據(jù)的壓縮格式。
3.根據(jù)權利要求2所述的圖像處理裝置,其中, 當所述文檔類型判斷單元沒有判斷出所述文檔類型時,所述壓縮格式設定單元基于由所述顏色信息提取單元提取出的所述顏色信息來設定壓縮格式。
4.根據(jù)權利要求2所述的圖像處理裝置,其中, 當所述讀取信息中最常出現(xiàn)的色值的比例與在所述讀取信息中最常出現(xiàn)的色值的預定范圍內的色值的比例之和超過閾值時,所述壓縮格式設定單元基于所述顏色信息設定第一壓縮格式,在所述第一壓縮格式中,包含在所述讀取信息中的顏色的數(shù)目減少為預定的顏色數(shù)目。
5.根據(jù)權利要求4所述的圖像處理裝置,其中, 當所述讀取信息中最常出現(xiàn)的色值的比例與在所述讀取信息中最常出現(xiàn)的色值的預定范圍內的色值的比例之和小于或等于所述閾值時,所述壓縮格式設定單元基于所述顏色信息設定第二壓縮格式,在所述第二壓縮格式中,包含在所述讀取信息中的顏色的數(shù)目大于在所述第一壓縮格式中使用的顏色數(shù)目。
6.根據(jù)權利要求I至5中任一項所述的圖像處理裝置,還包括 多頁面設置單元,當所述文檔包括多個頁面時,所述多頁面設置單元設置是否要為所述多個頁面中的每一頁設定壓縮格式, 其中,當所述多頁面設置單元設置不用為所述多個頁面中的每一頁設定壓縮格式時,所述生成器利用為第一頁設定的壓縮格式來生成與全部所述多個頁面對應的圖像數(shù)據(jù)。
7.根據(jù)權利要求6所述的圖像處理裝置,其中, 當所述多頁面設置單元設置要為所述多個頁面中的每一頁設定壓縮格式時,所述文檔類型判斷單元為所述多個頁面中的每一頁判斷文檔類型,所述壓縮格式設定單元為所述多個頁面中的每一頁設定壓縮格式,并且所述生成器利用為所述多個頁面中的每一頁設定的壓縮格式生成圖像數(shù)據(jù)。
8.—種圖像處理方法,包括 基于作為文檔讀取結果獲得的讀取信息判斷文檔屬于哪種文檔類型; 基于所判斷出的文檔類型設定用于從所述讀取信息生成圖像數(shù)據(jù)的壓縮格式;以及 利用所設定的壓縮格式壓縮所述讀取信息,以便生成與所述文檔對應的圖像數(shù)據(jù)。
全文摘要
本發(fā)明公開了一種圖像處理裝置及圖像處理方法。該圖像處理裝置包括如下部件。文檔類型判斷單元基于利用文檔讀取器獲得的作為文檔讀取結果的讀取信息來判斷文檔屬于哪種文檔類型。壓縮格式設定單元基于由文檔類型判斷單元判斷出的文檔類型來設定用于從讀取信息生成圖像數(shù)據(jù)的壓縮格式。生成器利用由壓縮格式設定單元設定的壓縮格式壓縮讀取信息,以便生成與文檔對應的圖像數(shù)據(jù)。
文檔編號H04N1/40GK102710887SQ20111040973
公開日2012年10月3日 申請日期2011年12月9日 優(yōu)先權日2011年3月28日
發(fā)明者上條裕義, 岡田茂, 大谷和宏, 安達真太郎, 小柳勝也, 張臻瑞, 袖浦稔 申請人:富士施樂株式會社