欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

圖像處理設(shè)備、圖像處理程序、及存儲介質(zhì)的制作方法

文檔序號:7616168閱讀:135來源:國知局
專利名稱:圖像處理設(shè)備、圖像處理程序、及存儲介質(zhì)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及不需要將作為處理對象圖像的多級圖像的圖像質(zhì)量減少太多,就可以獲得明顯減小的文件尺寸的圖像處理設(shè)備,圖像處理程序,及存儲介質(zhì)。
背景技術(shù)
通常,由于彩色圖像的文件尺寸非常大,彩色圖像的傳送需要大量時間,并且彩色圖像的存儲需要大量的存儲區(qū)域。因此,為了彩色圖像的傳送和存儲,需要提供一種不需要減少彩色圖像的圖像質(zhì)量就可以減小文件尺寸的技術(shù)。
目前,執(zhí)行JPEG壓縮等方法來壓縮圖像已被廣泛使用。這種JPEG壓縮是用于對諸如照片之類的自然圖像壓縮的極好方法,但是它不適于含有字符的文檔圖像的壓縮。具體地被稱為蚊子噪聲的異常噪聲經(jīng)常出現(xiàn)在顏色被急劇改變的文檔圖像區(qū)域中,諸如字符的邊緣區(qū)域。此外,諸如文檔圖像的顏色被頻繁地急劇改變的圖像的壓縮效率也不是很高。
盡管有可能強(qiáng)行提高可壓縮性,但在這種情況下字符的邊緣區(qū)域會發(fā)生變形,并且字符的可見度會急劇下降。
日本專利No.3095804公開了一種避免上述問題的建議方法。在日本專利No.3095804的方法中,將處理對象圖像劃分為預(yù)定尺寸的塊,并且將每一塊分成中間色調(diào)(halftone)區(qū)域和字符區(qū)域。對中間色調(diào)區(qū)域執(zhí)行2維空間離散余弦變換,并使用量化表進(jìn)行編碼。該字符區(qū)域僅由亮度信號和分辨色代碼組成,并執(zhí)行字符區(qū)域的壓縮編碼。
根據(jù)上述方法,由于中間色調(diào)區(qū)域中幾乎沒有顏色改變,使用諸如JPEG壓縮功能之類的離散余弦變換的壓縮方法來對中間色調(diào)區(qū)域進(jìn)行編碼是非常有效的,并且使用不同的編碼方法來編碼字符區(qū)域。因此,通過使用上述方法可以將可壓縮性和圖像質(zhì)量之間的平衡維持在一個高水平上。
然而,由于根據(jù)日本專利No.3095804的方法,將字符部分和中間色調(diào)部分取決于塊的尺寸以塊為基礎(chǔ)進(jìn)行分割,可能會出現(xiàn)字符區(qū)域和中間色調(diào)區(qū)域共存于同一塊中的情況。
在這種情況下,相關(guān)塊中的字符區(qū)域和中間色調(diào)區(qū)域之一的圖像質(zhì)量將會惡化。
解決該問題的可能的方法是使塊的尺寸變小。但是,如果將塊的尺寸變小,用于判斷是字符區(qū)域還是中間色調(diào)區(qū)域的信息將會減少,且會增加判斷錯誤的可能性以及降低準(zhǔn)確度。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種消除上述問題的改進(jìn)了的圖像處理設(shè)備、程序以及存儲介質(zhì)。
為了達(dá)到上述目的,本發(fā)明提供了一種圖像處理設(shè)備,包括多級圖像獲取單元,用于獲取作為處理對象圖像的多級圖像;二值圖像獲取單元,用于獲取基于多級圖像而創(chuàng)建的二值圖像;特定屬性區(qū)域提取單元,用于從多級圖像中提取為具有特定屬性的區(qū)域的特定屬性區(qū)域;白色像素置換單元,用于將二值圖像中的特定屬性區(qū)域之外的像素變?yōu)榘咨袼?;特定屬性區(qū)域消除圖像創(chuàng)建單元,用于創(chuàng)建其中由背景顏色替換特定屬性區(qū)域的像素的多級圖像;特定屬性區(qū)域顏色確定單元,用于確定特定屬性區(qū)域的顏色;特殊屬性像素圖像創(chuàng)建單元,用于創(chuàng)建具有由特定屬性區(qū)域顏色確定單元確定的顏色的特定屬性區(qū)域的圖像;圖像編碼單元,用于對分別由特定屬性區(qū)域消除圖像創(chuàng)建單元和特定屬性像素圖像創(chuàng)建單元所創(chuàng)建的兩個或多個圖像進(jìn)行壓縮編碼;以及組合文件創(chuàng)建單元,用于創(chuàng)建合并了來自圖像編碼單元的編碼圖像的組合文件。
根據(jù)本發(fā)明,獲取作為原始圖像的多級圖像和基于原始圖像的二值圖像,并基于該二值圖像確定如字符區(qū)域那樣的具有特定屬性的區(qū)域(特定屬性區(qū)域)的像素。創(chuàng)建包含確定顏色的特定屬性區(qū)域的圖像,該顏色是在根據(jù)這樣的特定屬性區(qū)域的存在而生成將特定屬性區(qū)域之外的像素改變?yōu)榘咨袼氐亩祱D像之后確定的。創(chuàng)建由其中特定屬性區(qū)域的像素被改變?yōu)楸尘邦伾亩嗉増D像。對每幅圖像進(jìn)行編碼并創(chuàng)建每個編碼圖像的組合文件。本發(fā)明可以無需將用作處理對象圖像的多級圖像的圖像質(zhì)量降低太多,便可實現(xiàn)文件尺寸的明顯減小,而即使當(dāng)原始圖像包含諸如字符和格線之類的特定屬性的特定屬性區(qū)域時,也可以保持特定屬性區(qū)域像素的可見度。


本發(fā)明的其他目的、特征以及優(yōu)點將通過以下結(jié)合附圖的詳細(xì)說明而展現(xiàn)。
圖1是示出本發(fā)明優(yōu)選實施例中圖像處理設(shè)備的電氣連接的方框圖。
圖2是用于解釋本實施例中的圖像處理設(shè)備的概要處理的流程圖。
圖3是用于解釋本實施例中的圖像處理設(shè)備的概念操作的示意圖。
圖4是本發(fā)明優(yōu)選實施例中的圖像處理設(shè)備的功能組合的方框圖。
圖5是用于解釋本發(fā)明另一個優(yōu)選實施例中圖像處理設(shè)備的概要處理的流程圖。
圖6是用于解釋在本實施例中為何執(zhí)行多級圖像的平滑處理的原理圖。
圖7是本實施例中圖像處理設(shè)備的功能組合方框圖。
圖8是用于解釋本發(fā)明的另一個優(yōu)選實施例中圖像處理設(shè)備的概要處理的流程圖。
圖9是本實施例中的圖像處理設(shè)備的功能組合的方框圖。
圖10是用于解釋本發(fā)明的另一個優(yōu)選實施例中圖像處理設(shè)備的附加處理的流程圖。
圖11是用于舉例說明代表顏色計算方法的流程圖。
圖12A和12B是示出原始圖像分割的范例的示意圖。
圖13是用于解釋連通分量和網(wǎng)格區(qū)域之間的位置關(guān)系的示意圖。
圖14是示出本發(fā)明另一個優(yōu)選實施例中圖像處理設(shè)備的功能組合的方框圖。
圖15是用于解釋本實施例中由特定屬性區(qū)域消除圖像創(chuàng)建單元執(zhí)行的處理內(nèi)容的流程圖。
圖16是本實施例中特定屬性區(qū)域消除圖像創(chuàng)建單元的方框圖。
圖17是用于解釋邊界像素的示意圖。
圖18是用于解釋消除了字符并且示出位于邊界位置的邊界像素的多級圖像的示意圖。
圖19是用于解釋在字符的輪廓區(qū)域處理中的問題的示意圖。
圖20是用于解釋本發(fā)明優(yōu)選實施例中圖像處理設(shè)備的概要處理的概要流程圖。
圖21是該處理的概念圖。
圖22是圖像處理設(shè)備的功能方框圖。
圖23是示出處理的范例的示意圖。
圖24是示出字符識別處理的范例的示意圖。
圖25是示出組合范例的示意圖。
圖26是用于解釋本發(fā)明的另一個優(yōu)選實施例的概要處理的概要流程圖。
圖27是該處理的概念圖。
圖28是圖像處理設(shè)備的功能方框圖。
圖29是示出處理的范例的示意圖。
圖30是示出組合的范例的示意圖。
圖31是示出本發(fā)明優(yōu)選實施例中圖像處理方法的處理的流程圖。
圖32是示出圖31的處理中的線條提取處理步驟的詳細(xì)流程的流程圖。
圖33是示出本發(fā)明優(yōu)選實施例中圖像處理設(shè)備的組成的方框圖。
圖34是示出本發(fā)明另一個優(yōu)選實施例中圖像處理方法的處理的流程圖。
圖35是示出本發(fā)明另一個優(yōu)選實施例中圖像處理設(shè)備的組成的方框圖。
圖36是示出為線條候選者而統(tǒng)一連通分量的處理情形的示意圖。
圖37是示出對字符圖像以及照片圖像中的線條候選者進(jìn)行合并處理的情形的示意圖。
圖38是用于解釋反轉(zhuǎn)的刪除條件、非反轉(zhuǎn)圖像的線條候選者提取以及重復(fù)線條的示意圖。
圖39是示出實施本發(fā)明的圖像處理設(shè)備的計算機(jī)的組成的方框圖。
圖40A和圖40B是示出本發(fā)明的優(yōu)選實施例中的文檔數(shù)據(jù)結(jié)構(gòu)的示意圖。
圖41是示出本發(fā)明優(yōu)選實施例中的文檔轉(zhuǎn)換設(shè)備的方框圖。
圖42是用于解釋本發(fā)明的優(yōu)選實施例的文檔轉(zhuǎn)換方法的示意圖。
圖43是示出本發(fā)明的優(yōu)選實施例中的文檔恢復(fù)設(shè)備的方框圖。
圖44是用于解釋本發(fā)明優(yōu)選實施例中的文檔恢復(fù)方法的示意圖。
圖45A和45B是示出本發(fā)明的另一個優(yōu)選實施例中的文檔數(shù)據(jù)結(jié)構(gòu)的示意圖。
圖46是用于解釋本發(fā)明的另一個優(yōu)選實施例的文檔轉(zhuǎn)換方法的示意圖。
圖47是用于解釋本發(fā)明的另一個優(yōu)選實施例中的文檔恢復(fù)方法的示意圖。
圖48A和48B是示出本發(fā)明的另一個優(yōu)選實施例中的文檔數(shù)據(jù)結(jié)構(gòu)的示意圖。
圖49是示出本發(fā)明的另一個優(yōu)選實施例中的文檔轉(zhuǎn)換方法的示意圖。
圖50是示出本發(fā)明的另一個優(yōu)選實施例的文檔恢復(fù)方法的示意圖。
圖51A和圖51B是示出本發(fā)明另一個優(yōu)選實施例中的文檔數(shù)據(jù)結(jié)構(gòu)的示意圖。
圖52是用于解釋本發(fā)明的另一個優(yōu)選實施例中的文檔轉(zhuǎn)換方法的示意圖。
圖53是用于解釋本發(fā)明另一個優(yōu)選實施例中文檔恢復(fù)方法的示意圖。
圖54A和圖54B是示出本發(fā)明優(yōu)選實施例中的文檔數(shù)據(jù)結(jié)構(gòu)的示意圖。
圖55是用于解釋平面PLN(2)的低分辨率處理的示意圖。
圖56是示出本發(fā)明的優(yōu)選實施例中文檔轉(zhuǎn)換設(shè)備的方框圖。
圖57是用于解釋本發(fā)明優(yōu)選實施例中的文檔轉(zhuǎn)換方法的示意圖。
圖58是用于解釋本發(fā)明優(yōu)選實施例中的文檔恢復(fù)設(shè)備的示意圖。
圖59是用于解釋本發(fā)明優(yōu)選實施例中的文檔恢復(fù)方法的示意圖。
圖60是用于解釋圖55中的平面PLN(2)的低分辨率處理的示意圖。
圖61是用于解釋平面PLN(2)的低分辨率處理的流程圖。
圖62是示出本發(fā)明優(yōu)選實施例中的圖像處理設(shè)備的功能方框圖。
圖63是示出圖62中的圖像處理設(shè)備的處理流程的示意圖。
圖64A是示出圖62的圖像處理設(shè)備中將字符的一部分識別為獨立字符的示意圖。
圖64B是示出圖62的圖像處理設(shè)備中正確識別字符的示意圖。
圖65是示出在原始圖像中包含諸如照片之類的圖像的情況下,本發(fā)明優(yōu)選實施例中的圖像處理設(shè)備的功能方塊圖。
圖66是用于解釋由圖65的圖像處理設(shè)備執(zhí)行的處理流程的示意圖。
圖67A是示出包括相同顏色長游程提取單元和長游程連通分量創(chuàng)建單元的格線提取單元的示意圖。
圖67B是示出包括相同顏色短游程提取單元和短游程連通分量創(chuàng)建單元的格線提取單元的示意圖。
圖68是示出根據(jù)圖67A的格線提取單元的格線提取的情形以及根據(jù)圖67B的格線提取單元的格線提取的情形的示意圖。
圖69是示出可以識別圖67A的格線提取單元接觸的字符的格線以及不可以識別圖67B的格線提取單元接觸的字符的格線的示意圖。
圖70是由本發(fā)明優(yōu)選實施例中的圖像處理設(shè)備執(zhí)行的處理的功能方框圖。
圖71是用于解釋由字符顏色指定單元執(zhí)行的處理的功能方框圖。
圖72是用于解釋伽瑪轉(zhuǎn)換的示意圖。
圖73是用于解釋由無字符圖像創(chuàng)建單元執(zhí)行的處理的功能方框圖。
圖74是本發(fā)明優(yōu)選實施例中的圖像處理設(shè)備的功能方框圖。
圖75是用于解釋圖像處理設(shè)備執(zhí)行的處理的流程圖。
圖76A和圖76B是用于解釋接觸字符的提取的示意圖。
圖77是用于解釋提取接觸字符的流程圖。
圖78是本發(fā)明另一個優(yōu)選實施例中圖像處理設(shè)備的功能方框圖。
圖79是用于解釋由圖78的圖像處理設(shè)備執(zhí)行的處理的流程圖。
圖80是用于解釋解碼及顯示由圖像處理設(shè)備創(chuàng)建的組合文件的流程圖。
圖81是用于解釋本發(fā)明另一個優(yōu)選實施例中的概要處理的概要流程圖。
圖82是該處理的概念圖。
圖83是本實施例中的圖像處理設(shè)備的功能方框圖。
圖84是用于舉例說明減少顏色的圖像創(chuàng)建處理的概要流程圖。
圖85是用于舉例說明代表顏色計算處理的概要流程圖。
圖86是用于舉另一例子說明代表顏色計算處理的概要流程圖。
圖87是用于解釋代表顏色分配處理的概要流程圖。
圖88是用于舉例說明用背景顏色改變字符區(qū)域的處理的概要流程圖。
圖89是用于解釋本發(fā)明另一個優(yōu)選實施例的處理概要的概要流程圖。
圖90是用于解釋一部分處理的概要流程圖。
圖91是本實施例中圖像處理設(shè)備的功能方框圖。
圖92是示出特定屬性像素指定單元的組成的功能方框圖。
具體實施例方式
現(xiàn)在將參考

本發(fā)明的優(yōu)選實施例。
參照圖1至圖4,將說明本發(fā)明優(yōu)選實施例中的圖像處理設(shè)備和程序。
圖1示出了本實施例中圖像處理設(shè)備1的電氣連接。如圖1所示,圖像處理設(shè)備1是諸如個人計算機(jī)(PC)之類的計算機(jī),包括CPU(中央處理單元)2,其共同執(zhí)行圖像處理設(shè)備1的各個部件的各種操作以及控制,包含各種類型ROM(只讀存儲器)和RAM(隨機(jī)存取存儲器)的存儲器3,以及互聯(lián)CPU2和存儲器3的總線4。
圖像處理設(shè)備1中還包括由總線4互聯(lián)的諸如硬盤驅(qū)動器之類的磁存儲器5、諸如鍵盤和鼠標(biāo)之類的輸入設(shè)備6、顯示設(shè)備7、讀取諸如光盤之類的存儲介質(zhì)8的存儲介質(zhì)讀取設(shè)備9、讀取圖像的圖像讀取設(shè)備10、以及通過預(yù)定接口與網(wǎng)絡(luò)11通信的通信控制設(shè)備12。圖像處理設(shè)備1通過使用通信控制設(shè)備12經(jīng)由網(wǎng)絡(luò)11傳送組合文件(其中合并了編碼圖像)。
另外,所使用的存儲介質(zhì)8可以是任何類型的介質(zhì),包括諸如CD和DVD之類的光盤、磁光盤、以及軟盤(FD)。此外,根據(jù)所使用的存儲介質(zhì)8的種類,所使用的存儲介質(zhì)讀取設(shè)備9可以是光盤驅(qū)動器、磁光盤驅(qū)動器、軟盤驅(qū)動器等的任何一種。
圖像處理設(shè)備1從存儲介質(zhì)8中讀取使計算機(jī)執(zhí)行根據(jù)本發(fā)明的實施例的圖像處理的圖像處理程序13,并將該程序安裝到磁存儲器5中。該程序可以經(jīng)由諸如互聯(lián)網(wǎng)之類的網(wǎng)絡(luò)11下載到圖像處理設(shè)備1中,并可以安裝在磁存儲器5中。
通過這種安裝,圖像處理設(shè)備1將處于能夠執(zhí)行以下將描述的圖像處理的狀態(tài)。另外,圖像處理程序13可以在預(yù)定的OS(操作系統(tǒng))上運行。
在本實施例中,通過使用圖像處理程序13,不需要損失作為處理對象圖像(原始圖像)的多級圖像中的字符可見性,便可以明顯減小文件的尺寸。
圖2是用于解釋本實施例中的圖像處理設(shè)備的概要處理的流程圖。圖3是用于解釋本實施例中的圖像處理設(shè)備的示意圖。
在圖2的處理中,使用諸如圖像掃描儀之類的圖像讀取設(shè)備10獲得圖3(a)所示的用作處理對象圖像的多級圖像(步驟S1)。并通過多級圖像的二值化創(chuàng)建圖3(b)所示的二值圖像(步驟S2)。隨后,提取具有特定屬性的區(qū)域(特定屬性區(qū)域),諸如字符區(qū)域(步驟S3)。
如圖3(c)所示,執(zhí)行白色像素處理,其將除特定屬性區(qū)域之外的像素,即二值圖像中不具有特定屬性的像素,變?yōu)榘咨袼?,以使得結(jié)果圖像僅包含字符(步驟S4)。也就是說,在二值圖像中消除了字符以外的黑色像素。這種處理將允許示出字符每個像素的位置。
另一方面,如圖3(d)所示,變換多級圖像以使背景顏色填充到具有特定屬性的區(qū)域(特定屬性區(qū)域)中,如字符區(qū)域,以及消除具有特定屬性的區(qū)域(特定屬性區(qū)域),如字符區(qū)域(步驟S5)。
在接下來的步驟S6中,確定特定屬性區(qū)域中的顏色。具體地確定位于彩色圖像中構(gòu)成特定屬性區(qū)域的黑色像素位置的所有像素的顏色,并選擇這種顏色數(shù)據(jù)中經(jīng)常使用的一些主要顏色作為代表顏色。確定代表顏色中最接近構(gòu)成字符的每一個像素的顏色或最接近每個連通分量的顏色的代表顏色。
接下來,如圖3(e)所示,創(chuàng)建具有特定屬性的像素具有為每個像素和每個連通分量所選擇的代表顏色的圖像(步驟S7)。在這種情況下,為每個所選擇的代表顏色創(chuàng)建一個二值圖像(或一個只具有有限顏色的多級圖像)。
對在步驟S5中創(chuàng)建的消除了特定屬性像素的圖像以及在步驟S7中創(chuàng)建的僅包含特定屬性像素的圖像進(jìn)行壓縮編碼(步驟S8)。舉例來說,對前一個圖像進(jìn)行JPEG壓縮編碼,并對后一個圖像進(jìn)行MMR壓縮編碼。因此有效地減小了文件尺寸。
然后,根據(jù)與原始圖像所保持的相同位置關(guān)系,創(chuàng)建組合文件,該文件格式(如PDF)可以將背景圖像(消除了特定屬性區(qū)域的圖像)和字符圖像(僅含有特定屬性像素的圖像)組合顯示(步驟S9)。
無需減小通過上述處理創(chuàng)建的結(jié)果圖像文件的可見性,文件尺寸可獲得顯著減少。理由如下所述。
盡管在圖像存在像素值急劇改變的情況下,JPEG壓縮不提供很高的壓縮效率,但上述實施例的處理從多級圖像中消除了字符區(qū)域,并且排除了字符區(qū)域的像素值的急劇改變,由此使得壓縮率顯著提高。此外,明顯減少了字符區(qū)域中的顏色數(shù)量,并可以使得壓縮率變得更高。
圖4示出了本實施例中的圖像處理設(shè)備1的操作組合。在本實施例中,如下所述基于圖像處理程序13實現(xiàn)圖像處理設(shè)備1的上述處理。
1、獲取作為處理對象圖像的多級圖像和基于多級圖像的二值圖像通過多級圖像獲取單元21和二值圖像獲取單元22獲取多級圖像和二值圖像(步驟S1和S2)?;谠摱嗉増D像,同時創(chuàng)建二值圖像。
二值圖像的創(chuàng)建需要使用固定閾值,以及將顏色大于該閾值的像素變?yōu)榘咨袼?,將顏色小于該閾值的像素變?yōu)楹谏袼?。此外,二值圖像和多級圖像可能具有不同分辨率。
例如,通過上述方法創(chuàng)建二值圖像之后,可以實現(xiàn)變薄處理,可以降低多級圖像的分辨率,并且可以獲取作為處理對象的多級圖像的這種圖像。
此外,可使用另一種設(shè)備來執(zhí)行該二值圖像的創(chuàng)建,并可獲得通過其它設(shè)備創(chuàng)建的結(jié)果圖像文件。
2、提取字符區(qū)域通過使用特定屬性區(qū)域提取單元24,確定字符在原始圖像中的位置(步驟S3)。可以將特定屬性區(qū)域提取單元24配置成從二值圖像或多級圖像中的任何一個獲取字符區(qū)域。當(dāng)從多級圖像獲取時,可以使用日本公開專利申請No.2002-288589提出的字符區(qū)域提取方法,當(dāng)從二值圖像中獲取時,可以使用日本公開專利申請No.06-020092提出的字符區(qū)域提取方法。在本實施例中,基于二值圖像提取構(gòu)成字符的像素來作為具有特定屬性的像素。
3、將字符區(qū)域以外的像素變?yōu)榘咨袼赝ㄟ^使用白色像素置換單元25,將二值圖像中的字符區(qū)域以外的像素(特定屬性區(qū)域之外的像素)變?yōu)榘咨珗D像(步驟S4)。
4、創(chuàng)建無字符的多級圖像通過使用特定屬性區(qū)域消除圖像創(chuàng)建單元23,將背景顏色填充到相應(yīng)于在上述第3項的處理中剩余的黑色像素區(qū)域的多級圖像的字符區(qū)域中,并創(chuàng)建不包含字符的無字符多級圖像(步驟S5)。
5、確定特定屬性區(qū)域的顏色通過使用特定屬性區(qū)域顏色確定單元26,確定特定屬性區(qū)域的顏色(步驟S6)。確定位于構(gòu)成字符的黑色像素位置上的彩色圖像的所有像素顏色,并選擇在這種顏色數(shù)據(jù)中經(jīng)常使用的一些主要顏色作為代表顏色。以及確定代表顏色中最接近構(gòu)成字符的每個像素的顏色或最接近每個連通分量的顏色的代表顏色。
6、創(chuàng)建彩色圖像通過使用特定屬性像素圖像創(chuàng)建單元27,創(chuàng)建其中具有特定屬性的像素具有為每個像素以及每個連通分量所選擇的代表顏色的圖像(步驟S7)。在這種情況下,為每一個所選擇的代表顏色創(chuàng)建一幅二值圖像(或僅含有有限顏色的一幅多級圖像)。
7、圖像編碼通過使用圖像編碼單元28,對于消除了特定屬性像素的無字符圖像,以及僅含有特定屬性像素的減少顏色圖像執(zhí)行壓縮編碼,以便于有效減小尺寸(步驟S8)。舉例來說,對無字符圖像進(jìn)行JPEG壓縮編碼以大大減小尺寸,并且這是不可逆的壓縮編碼。如果在降低分辨率之后進(jìn)行壓縮編碼,尺寸將會更小。
此外,對減少顏色的圖像進(jìn)行可逆的壓縮編碼。如果是二值圖像,適于進(jìn)行PNG壓縮編碼或MMR壓縮編碼。如果是4級或16級圖像,適于進(jìn)行PNG壓縮編碼。
8、創(chuàng)建組合文件通過使用組合文件創(chuàng)建單元29,將壓縮的圖像合并在單個文件中(步驟S9)。如果創(chuàng)建了能夠使這些圖像組合顯示的文件格式,無需減少字符區(qū)域的可見性便可能創(chuàng)建明顯減小了文件尺寸以及在某種程度上再現(xiàn)了原始圖像的背景顏色的彩色圖像。
根據(jù)本實施例,獲取了作為原始圖像的多級圖像以及基于原始圖像的二值圖像,并基于該二值圖像確定了具有特定屬性的區(qū)域(特定屬性區(qū)域)的像素,如字符區(qū)域。創(chuàng)建含有在生成二值圖像之后確定的顏色的特定屬性區(qū)域的圖像,其中根據(jù)這種特定屬性區(qū)域的存在,二值圖像中不同于特定屬性區(qū)域的像素被改變?yōu)榘咨袼?。?chuàng)建將其中的特定屬性區(qū)域的像素轉(zhuǎn)換為背景顏色的多級圖像。執(zhí)行每個圖像的編碼并創(chuàng)建每個編碼圖像的組合文件。本實施例無需大幅降低用作處理對象圖像的多級圖像的圖像質(zhì)量便可顯著減少文件的尺寸,而即使當(dāng)原始圖像包含如字符和格線之類的具有特定屬性的特定屬性區(qū)域時,也仍然保持著特定屬性區(qū)域的像素的可見性。
接下來,將根據(jù)圖5至圖7解釋本發(fā)明的另一個優(yōu)選實施例。
在圖5至圖7中,使用相同的附圖標(biāo)記來表示與圖1至圖4的在前述實施例中相應(yīng)元素相同的元素,并將省略對它們的描述。本實施例還配置成增加對提高圖像的質(zhì)量及壓縮率的處理。
在本實施例中,通過使用圖像處理程序13實現(xiàn)顯著的尺寸減少,不需要損失作為處理對象圖像(原始圖像)的多級圖像中的字符可見性。
圖5示出了本實施例中圖像處理設(shè)備的概要處理。
首先,使用圖像讀取器10,諸如圖像掃描儀,來獲取如圖3(a)所示的用作處理對象圖像的多級圖像(步驟S1)。
接下來,平滑處理所獲取的多級圖像(步驟S11)。執(zhí)行該平滑處理的原因如下所述。存在這樣一種情況,即由一組互不相同的精細(xì)的中間顏色的像素來表達(dá)彩色圖像。如果在這種情況下為彩色圖像進(jìn)行二值化,字符筆劃的內(nèi)部變成帶有內(nèi)部空缺的二值圖像,并且字符圖像的壓縮效率也降低了(見圖6)。
通過對執(zhí)行了這樣的平滑處理的多級圖像的二值化來創(chuàng)建如圖3(b)所示的二值圖像(步驟S2)。然后,提取帶有特定屬性的區(qū)域(特定屬性區(qū)域),如字符區(qū)域(步驟S3)。
執(zhí)行白色像素處理,該處理將二值圖像中特定屬性的區(qū)域之外的不帶有特定屬性的像素改變?yōu)榘咨袼?,以使得結(jié)果圖像中僅含有圖3(c)所示的字符(步驟S4)。也就是說,消除了二值圖像中除了字符以外的黑色像素。該處理允許按每一個像素指定字符位置。
此外,在執(zhí)行白色像素處理之后,從消除了字符以外的黑色像素的二值圖像中提取黑色像素的連通分量,以進(jìn)一步消除太大和太小的字符(步驟S12)。太小的連通分量不是字符而是噪聲的可能性被認(rèn)為是很高的,并且如果不轉(zhuǎn)換便創(chuàng)建二值圖像,則會惡化壓縮率。
另一方面,將多級圖像轉(zhuǎn)換成由背景顏色來填充帶有諸如字符區(qū)域之類的特定屬性的區(qū)域(特定屬性區(qū)域)的圖像,以創(chuàng)建消除了如圖3(d)所示的諸如字符區(qū)域之類的具有特定屬性的區(qū)域(特定屬性區(qū)域)的圖像(步驟S5)。
在接下來的步驟S6中,確定特定屬性區(qū)域的顏色。具體地,確定位于構(gòu)成特定屬性區(qū)域的黑色像素的位置的彩色圖像的所有像素的顏色,并選擇作為代表顏色的通常在這些顏色中經(jīng)常使用的一些主要顏色。以及確定代表顏色中最接近構(gòu)成字符的每一個像素的顏色或最接近每個連通分量的顏色的代表顏色。
接下來,如圖3(e)所示,創(chuàng)建其中具有特定屬性的像素具有為每個像素和每個連通分量所選擇的代表顏色的圖像(步驟S7)。在這種情況下,為每個所選擇的代表顏色創(chuàng)建一個二值圖像(或一個只具有有限顏色的多級圖像)。
隨后,對在步驟S5創(chuàng)建的、消除了特定屬性像素的圖像(背景圖像),以及在步驟S7創(chuàng)建的、僅含有特定屬性像素的二值圖像(字符圖像)進(jìn)行對比度轉(zhuǎn)換(步驟S13),以削弱該對比度并創(chuàng)建平滑的圖像。
此外,進(jìn)行分辨率轉(zhuǎn)換,并將消除了特定屬性像素的圖像(背景圖像)轉(zhuǎn)換為低分辨率(步驟S14)。
對在步驟S5創(chuàng)建的、消除了特定屬性像素的圖像(背景圖像),以及在步驟S7創(chuàng)建的、僅含有特定屬性像素的圖像進(jìn)行壓縮編碼(步驟S8)。例如,對前一個圖像進(jìn)行JPEG壓縮編碼,而對后一個圖像進(jìn)行MMR壓縮編碼。由此有效地減小文件尺寸。
接下來,根據(jù)與原始圖像所保持的相同的位置關(guān)系,創(chuàng)建可以組合顯示背景圖像(消除了特定屬性區(qū)域的圖像)和字符圖像(僅含有特定屬性像素的圖像)的格式的組合文件(步驟S9)。
無需減少上述處理所創(chuàng)建的結(jié)果圖像文件的可見度,便可獲得文件尺寸的明顯減小。理由如下。盡管在圖像具有像素值急劇改變的情況下JPEG壓縮不提供很高壓縮率,但本實施例中的上述處理從多級圖像中消除了字符區(qū)域,并排除了字符區(qū)域的像素值的急劇改變,因此使得壓縮率明顯提高。另外,明顯減少了字符區(qū)域中的顏色數(shù)量,壓縮率可以變得更高。
圖7示出了本實施例中圖像處理設(shè)備1的功能組合。在本實施例中,基于圖像處理程序13實現(xiàn)上述處理,并且在下面根據(jù)圖7給出對它的描述。
1、獲取作為處理對象圖像的多級圖像和基于該多級圖像的二值圖像通過多級圖像獲取單元21和二值圖像獲取單元22獲取多級圖像和二值圖像(步驟S1和S2)?;谠摱嗉増D像,創(chuàng)建二值圖像。
接下來,通過使用平滑處理單元31對所獲取的多級圖像進(jìn)行平滑處理(步驟S11)。執(zhí)行該平滑處理的原因如下所述。存在由一組互不相同的精細(xì)的中間顏色的像素來表達(dá)彩色圖像的情況。如果在這種情況下為彩色圖像進(jìn)行二值化處理,字符筆劃的內(nèi)部變成帶有內(nèi)部空缺的二值圖像,并且字符圖像的壓縮效率也降低了(見圖6)。
此外,可以對消除了字符區(qū)域的彩色圖像(背景圖像)進(jìn)行圖像平滑處理。理由如下。由于背景圖像受到JPEG壓縮編碼,通過該平滑處理提高了壓縮率,并且這對抑制由于低分辨率圖像而可能出現(xiàn)的波紋是有效的。
創(chuàng)建二值圖像所必需的是只是使用固定閾值,以及將具有亮于該閾值的顏色的像素改變?yōu)榘咨袼?,以及將具有暗于該閾值的像素轉(zhuǎn)化為黑色像素。此外,二值圖像和多級圖像可能具有不同的分辨率。
舉例來說,在通過上述方法創(chuàng)建二值圖像之后,可以實現(xiàn)變薄處理,多級圖像的分辨率可以變得更低,并可以獲取這種圖像以作為處理對象的多級圖像。
此外,可以使用另一種設(shè)備來執(zhí)行二值圖像的創(chuàng)建,以及可以獲取由其它設(shè)備創(chuàng)建的結(jié)果圖像文件。
2、提取字符區(qū)域通過使用特定屬性區(qū)域提取單元24,確定字符在原始圖像中的位置(步驟S3)??梢詫⑻囟▽傩詤^(qū)域提取單元24配置成從二值圖像或多級圖像中獲取字符區(qū)域。當(dāng)從多級圖像獲取時,可以使用日本公開專利申請No.2002-288589提出的字符區(qū)域提取方法,當(dāng)從二值圖像中獲取時,可以使用日本公開專利申請No.06-020092提出的字符區(qū)域提取方法。在本實施例中,基于二值圖像提取構(gòu)成字符的像素,作為具有特定屬性的像素。
3、將字符區(qū)域以外的像素變?yōu)榘咨袼亍?br> 通過使用白色像素置換單元25,將二值圖像中的字符區(qū)域以外的像素(特定屬性區(qū)域以外的像素)變?yōu)榘咨珗D像(步驟S4)。
此外,在進(jìn)行了白色像素處理之后,通過使用連通分量尺寸檢查單元32,從消除了字符以外的黑色像素的二值圖像中提取黑色像素的連通分量,以進(jìn)一步消除太大和太小的字符(步驟S12)。理由如下。太小的連通分量不是字符而是噪聲的可能性被認(rèn)為是很高的,并且如果不進(jìn)行轉(zhuǎn)換便創(chuàng)建二值圖像,則會惡化壓縮率。由于字符區(qū)域的提取在技術(shù)上是困難的,并且無需提取正確的字符區(qū)域,因此,當(dāng)圖的區(qū)域以及照片區(qū)域位于在前圖像中時,這其中也可能會出現(xiàn)錯誤并誤認(rèn)為是字符。
此外,太大的連通分量不是字符的可能性被認(rèn)為是很高的。即使當(dāng)大的連通分量確實是字符,卻根據(jù)這種處理被意外地歸分到背景中的時候,這種連通分量的尺寸對人眼的識別來說也是足夠大的。
4、創(chuàng)建無字符的多級圖像通過使用特定屬性區(qū)域消除圖像創(chuàng)建單元23,獲得多級圖像,該多級圖像相應(yīng)于通過處理3保留的黑色像素區(qū)域,其通過背景顏色隱藏了多級圖像的字符區(qū)域,并不含有字符(步驟S5)。
5、確定特定屬性區(qū)域的顏色通過使用特定屬性區(qū)域顏色確定單元26,確定特定屬性區(qū)域的顏色(步驟S6)。確定位于構(gòu)成字符的黑色像素位置上的彩色圖像的所有像素顏色,并選擇在該顏色數(shù)據(jù)中經(jīng)常使用的一些主要顏色作為代表顏色。以及確定代表顏色中最接近構(gòu)成字符的每個像素的顏色或最接近每個連通分量的顏色的代表顏色。
6、創(chuàng)建彩色圖像通過使用特定屬性像素圖像創(chuàng)建單元27,創(chuàng)建其中具有特定屬性的像素具有為每個像素以及每個連通分量選擇的代表顏色的圖像(步驟S7)。在這種情況下,為每一個所選擇的代表顏色創(chuàng)建一幅二值圖像(或僅含有有限顏色的一幅多級圖像)。
此外,通過對比度調(diào)整單元33,將消除了特定屬性像素的圖像(背景圖像)的轉(zhuǎn)換與僅包含特定屬性像素的二值圖像(字符圖像)進(jìn)行對比度轉(zhuǎn)換(步驟S13)。削弱對比度并隨后進(jìn)行圖像的平滑處理。理由如下。當(dāng)在進(jìn)行背景圖像的JPEG壓縮編碼的情況下像素值幾乎沒有改變時,壓縮率變高。由于對字符圖像進(jìn)行了MMR壓縮編碼,即使在執(zhí)行了對比度轉(zhuǎn)換時,對尺寸也沒有影響。然而,為了在顯示組合文件時產(chǎn)生不自然的色調(diào),對字符圖像進(jìn)行了與背景圖像相同的對比度轉(zhuǎn)換。
另外,對在步驟S5創(chuàng)建的、消除了特定屬性像素的圖像(背景圖像)以及在步驟S7創(chuàng)建的、僅含有特定屬性像素的二值圖像(字符圖像)進(jìn)行對比度轉(zhuǎn)換(步驟S13)。削弱該對比度并隨后進(jìn)行平滑處理。
此外,執(zhí)行分辨率轉(zhuǎn)換,以將消除了特定屬性像素的圖像(背景圖像)的分辨率轉(zhuǎn)換為低分辨率(步驟S14)。由于即使背景圖像的分辨率稍有降低,對可見度的影響相對于字符圖像來說是很小的,因此可考慮該壓縮率并創(chuàng)建低分辨率。
7、圖像編碼通過使用圖像編碼單元28,對不含有字符的多級圖像以及組成字符的減少顏色的圖像進(jìn)行編碼,并壓縮圖像的尺寸(步驟S8)。舉例來說,對無字符圖像進(jìn)行JPEG壓縮編碼以大大減小尺寸,并且這是不可逆的壓縮編碼。如果在降低分辨率之后進(jìn)行壓縮編碼,尺寸將會更小。
此外,對減少顏色的圖像進(jìn)行可逆的壓縮編碼。如果是二值圖像,適于進(jìn)行PNG壓縮編碼或MMR壓縮編碼。如果是4級或16級圖像,適于進(jìn)行PNG壓縮編碼。
8、創(chuàng)建組合文件通過使用組合文件創(chuàng)建單元29,創(chuàng)建合并了編碼圖像的組合圖像(步驟S9)。
如果將編碼圖像合并成能夠集中顯示這些圖像的格式的文件,可以創(chuàng)建無需降低字符區(qū)域的可見度便可明顯減小文件尺寸、以及在某種程度上再現(xiàn)了原始圖像的背景顏色的彩色圖像。
接下來,將參照圖8和圖9解釋本發(fā)明的另一優(yōu)選實施例。
在該實施例中,通過使用圖像處理程序13實現(xiàn)顯著的尺寸減少,無需損失作為處理對象圖像(原始圖像)的多級圖像中的字符可見度。
參照圖8的流程圖來解釋本實施例的概要處理。
在圖8的處理中,使用諸如圖像掃描儀之類的圖像讀取器10獲取圖3(a)示出的用作處理對象圖像的多級圖像(步驟S101)。
通過多級圖像的二值化創(chuàng)建如圖3(b)所示的二值圖像(步驟S102)。然后,提取帶有特定屬性的區(qū)域(特定屬性區(qū)域),如字符區(qū)域(步驟S103)。
如圖3(c)所示,執(zhí)行將二值圖像中不具有特定屬性的像素(特定屬性區(qū)域以外的像素)改變?yōu)榘咨袼氐陌咨袼靥幚?,以便可以僅剩下字符(步驟S104)。也就是說,在二值圖像中消除字符以外的黑色像素。該處理將按照每個像素示出字符的位置。
此外,從消除了字符之外的黑色像素的二值圖像中提取黑色像素的連通分量,并進(jìn)一步消除太大和太小的連通分量(步驟S105)。
由于噪聲等,如果存在不是字符使其成為最頂端的二值圖像的可能性,太小的連通分量將導(dǎo)致壓縮率的降低。也就是說,在步驟S104和步驟S105將示按照每個像素出字符的位置。
另一方面,如圖3(d)所示,多級圖像使其成為由背景顏色中具有特定屬性的區(qū)域(特定屬性區(qū)域),如字符區(qū)域,填充的圖像,并創(chuàng)建消除了諸如字符區(qū)域之類的具有特定屬性的區(qū)域的圖像(步驟S106)。
在接下來的步驟S107確定特定屬性區(qū)域的顏色。具體地,確定位于構(gòu)成特定屬性區(qū)域的黑色像素位置上的彩色圖像的所有像素顏色,并選擇這些顏色數(shù)據(jù)中常用的一些主要顏色作為代表顏色。以及確定代表顏色中最接近構(gòu)成字符的每個像素的顏色或最接近每個連通分量的顏色的代表顏色。
接下來,如圖3(e)所示,創(chuàng)建其中具有特定屬性的像素具有為每個連通分量判斷的顏色以及每個像素的圖像(步驟S108)。雖然多級圖像僅具有有限顏色便足夠了,并且每個顏色都可能具有它們的二值圖像,假設(shè)每個顏色具有一個二值圖像。
從在步驟S106創(chuàng)建的消除了特定屬性像素的圖像以及在步驟S108創(chuàng)建的僅由特定屬性像素構(gòu)成的圖像中創(chuàng)建壓縮圖像(步驟S109)。例如,如果前一個執(zhí)行JPEG壓縮以及后一個執(zhí)行MMR壓縮,則文件尺寸將會有效變小。
然后,將編碼圖像合并在文件中,該文件的格式可以組合顯示以下圖像具有與原始圖像所保持的相同位置關(guān)系的背景圖像(消除了特定屬性區(qū)域的圖像),以及字符圖像(僅包含特定屬性像素的圖像)(步驟S110)。
無需減少上述處理所創(chuàng)建的圖像文件的可見度,便可獲得文件尺寸的顯著壓縮。理由如下。如果通過在此描述的方法消除了字符區(qū)域,盡管JPEG壓縮對具有像素值急劇改變的圖像不具有很好的壓縮率,但由于將不會存在字符區(qū)域的像素值改變,壓縮率將變好。另外,由于字符區(qū)域極大地減少了顏色數(shù)目,在此壓縮效率也變好了。
參照圖9,將解釋說明圖像處理設(shè)備1的功能組合?;趫D像處理程序13通過圖像處理設(shè)備1來實現(xiàn)這些功能。
1、獲取作為處理對象圖像的多級圖像和基于多級圖像的二值圖像通過多級圖像獲取單元121和二值圖像獲取單元122獲取多級圖像和二值圖像(步驟S101和S102)?;谠摱嗉増D像,創(chuàng)建二值圖像。
二值化方法需要固定的閾值以及使用該方法,如將亮度高于該閾值的像素設(shè)定為白色像素,以及將較暗的像素設(shè)定為黑色像素。此外,不同的分辨率滿足二值圖像和多級圖像。
例如,通過上述方法創(chuàng)建二值圖像之后,可以進(jìn)行變薄處理,降低多級圖像的分辨率,并且可被獲取作為處理對象的多級圖像。
此外,可使用另一種設(shè)備來執(zhí)行該二值圖像的創(chuàng)建并獲得所創(chuàng)建的圖像文件。
2、提取字符區(qū)域通過使用特定屬性區(qū)域提取單元124,確定字符在原始圖像中的位置(步驟S103)??梢詫⑻囟▽傩詤^(qū)域提取單元124配置成從二值圖像或多級圖像中獲取字符區(qū)域。當(dāng)從多級圖像獲取時,可以使用日本公開專利申請No.2002-288589提出的字符區(qū)域提取方法,當(dāng)從二值圖像中獲取時,可以使用日本公開專利申請No.06-020092提出的字符區(qū)域提取方法。在本實施例中,基于二值圖像提取構(gòu)成字符的像素,作為具有特定屬性的像素。
3、將字符區(qū)域之外的像素變?yōu)榘咨袼亍?br> 通過使用白色像素置換單元125,將二值圖像中的字符區(qū)域以外的像素(特定屬性區(qū)域以外的像素)變?yōu)榘咨袼?步驟S104)。
4、檢查連通分量連通分量尺寸檢查單元128從消除了字符以外的分量的二值圖像中提取的黑色像素的連通分量,并進(jìn)一步消除太大和太小連通分量(步驟S105)。太小的連通分量不是字符而是噪聲的可能性是很高的,并且如果沒有改變就創(chuàng)建二值圖像,將惡化壓縮率。
此外,由于字符區(qū)域的提取在技術(shù)上是困難的,并且正確的字符區(qū)域是不需要提取的,因此當(dāng)視圖的區(qū)域或照片的區(qū)域在前一個圖像中時,也存在誤認(rèn)為是字符的可能性。
此外,太大的連通分量不是字符的可能性被認(rèn)為是很高的。即使當(dāng)大的連通分量確實是字符卻根據(jù)這種處理將其意外地歸入到背景中時,這種連通分量的尺寸對于人眼的識別來說也是足夠大的。
5、創(chuàng)建無字符的多級圖像通過使用特定屬性區(qū)域消除圖像創(chuàng)建單元123,將背景顏色填充到相應(yīng)于在上述第3項的處理中剩余的黑色像素區(qū)域的多級圖像的字符區(qū)域中,并創(chuàng)建不包含字符的無字符多級圖像(步驟S106)。
6、確定特定屬性區(qū)域的顏色通過使用特定屬性區(qū)域顏色確定單元126,確定特定屬性區(qū)域的顏色(步驟S107)。確定位于構(gòu)成字符的黑色像素位置上的彩色圖像的所有像素顏色,并選擇在這種顏色數(shù)據(jù)中經(jīng)常使用的一些主要顏色作為代表顏色。以及確定代表顏色中最接近構(gòu)成字符的像素的每個像素的顏色或最接近每個連通分量的顏色的代表顏色。
7、創(chuàng)建彩色圖像通過使用特定屬性像素圖像創(chuàng)建單元127,創(chuàng)建其中帶有特定屬性的像素具有為每個像素以及每個連通分量所選擇的代表顏色的圖像(步驟S108)。在這種情況下,為每一個所選擇的代表顏色創(chuàng)建一幅二值圖像(或僅含有有限顏色的一幅多級圖像)。
8、圖像編碼通過使用圖像編碼單元129,對不包含字符的多級圖像以及構(gòu)成字符的減少顏色的圖像進(jìn)行編碼,以便于有效減小尺寸(步驟S109)。舉例來說,對無字符圖像進(jìn)行JPEG壓縮編碼以便大大減小尺寸,并且這是不可逆的壓縮編碼。如果在降低了分辨率之后進(jìn)行壓縮編碼,尺寸將會更小。
此外,對減少顏色的圖像進(jìn)行可逆的壓縮編碼。如果是二值圖像,適于進(jìn)行PNG壓縮編碼或MMR壓縮編碼。如果是4級或16級圖像,適于進(jìn)行PNG壓縮編碼。
9、創(chuàng)建組合文件通過使用組合文件創(chuàng)建單元130,將壓縮圖像合并在一個單一文件中(步驟S110)。如果創(chuàng)建了能夠使這些圖像組合顯示的格式的文件,便可能創(chuàng)建無需減少字符區(qū)域的可見性就可以明顯減小文件尺寸以及在某種程度上再現(xiàn)原始圖像的背景顏色的彩色圖像。
根據(jù)本實施例,消除了具有特定屬性的區(qū)域(特定屬性區(qū)域),如字符區(qū)域,的像素值急劇改變。即使使用了不適于像素值急劇改變的圖像的壓縮技術(shù),如JPEG壓縮編碼,壓縮率也可能是適合的。可以通過急劇減少顏色數(shù)量來使得諸如字符區(qū)域這樣的具有特定屬性的區(qū)域(特定屬性區(qū)域)的壓縮率是適合的。無需將作為處理對象圖像的多級圖像的圖像質(zhì)量降低太多,便可以獲得文件尺寸的明顯減小。以及,即使存在如字符和格線之類的具有特定屬性的區(qū)域(特定屬性區(qū)域),也仍然可以保證特定屬性區(qū)域的像素的可見性。
接下來,將參照圖10-13解釋說明本發(fā)明的另一個優(yōu)選實施例。
在下文中,使用相同的附圖標(biāo)記來表示與在前實施例中相應(yīng)元素相同的元素,并將省略對它們的描述。
在本實施例中,還增加了對提高圖像質(zhì)量和可壓縮性的處理。
如之前對圖8的描述,通過使用特定屬性像素圖像創(chuàng)建單元127在像素基礎(chǔ)上或連通分量基礎(chǔ)上確定顏色(步驟S108),但這種處理存在下述問題。
(1)如果執(zhí)行每個像素的著色,當(dāng)通過抖動來表示中間色調(diào)的字符時,像素顏色在非常精細(xì)的分量的單元上改變。在這種情況下,所創(chuàng)建的字符圖像具有噪點的增長量,并且壓縮率將惡化。
(2)如果執(zhí)行每個連通分量的著色,當(dāng)關(guān)于連通分量屬于哪種顏色的確定是錯誤的時候,結(jié)果圖像的質(zhì)量將變差。雖然,即使每個像素的著色是錯誤的并不會對人眼產(chǎn)生很大的影響,但如果每個連通分量的著色是錯誤的,由于連通分量的尺寸很大,其將會是明顯的。
為了避免這種問題,在本實施例中,通過將圖像分割成固定尺寸網(wǎng)格部分并確定網(wǎng)格部分上的顏色,創(chuàng)建具有上述第(1)項和第(2)項之間的中間特征的圖像。
網(wǎng)格部分的尺寸適于做成對人眼來幾乎不明顯的尺寸。假定本實施例中的網(wǎng)格部分的一個塊由2×2個像素構(gòu)成。
此外,由于即使連通分量的顏色中存在很小尺寸的錯誤也是不明顯的,因此如果在這種情況下按照每個連通分量著色,當(dāng)錯誤上升時,圖像質(zhì)量的壓縮率也將不會有太大下降,而不是按照每個網(wǎng)格進(jìn)行著色。
圖10是用于解釋所增加的處理的流程圖。圖10的流程圖解釋了圖8的特定屬性區(qū)域顏色確定(步驟S107)以及特定屬性區(qū)域圖像創(chuàng)建(步驟S108)的處理。
首先,在步驟S121計算字符區(qū)域的代表顏色。將解釋說明字符區(qū)域的代表顏色的詳細(xì)計算。圖11是用于舉例說明代表顏色計算方法的流程圖。
計算在多級圖像上與二值圖像的黑色像素的位置相同的像素值,并創(chuàng)建像素值的直方圖(步驟S151)。例如,需要將RGB空間分割成4×4×4的相等的塊,確定目標(biāo)像素位于相關(guān)塊的什么位置,以及將相應(yīng)空間的頻率值加1。
確定具有高頻率值的塊,并根據(jù)頻率值指定每個塊的優(yōu)先順序(步驟S152)。這些塊被稱為代表顏色候選塊。
從最高優(yōu)先級的塊開始,確定相關(guān)塊是否無顏色或者是否非彩色(步驟S153)。假設(shè)如果塊的RGB中心值(塊的RGB中間值)幾乎相同,則所述的塊無顏色。
當(dāng)步驟S153的結(jié)果是否定的,將控制轉(zhuǎn)移到對下一個優(yōu)先級的塊的檢查(步驟S157)。
如果步驟S153的結(jié)果是肯定的,確定上一級候選者中非彩色的數(shù)量是否大于第一給定數(shù)(步驟S154)。如果非彩色的數(shù)量達(dá)到第一給定數(shù),則從代表顏色候選者中去除相應(yīng)的塊(步驟S156)。否則,遞增非彩色的數(shù)量并進(jìn)行下一個處理(步驟S155)。
重復(fù)步驟S152-S156的處理直到完成了對所有代表顏色候選塊的檢查(步驟S157)。
當(dāng)步驟S157的結(jié)果是肯定時,從剩余的、沒有被去除的代表顏色候選塊的最高優(yōu)先級開始將處于第二給定數(shù)的顏色作為代表顏色的顏色輸出(步驟S158)。
回過來參照圖10,在下一個步驟S122中,對步驟S121計算的字符區(qū)域的每個代表顏色創(chuàng)建具有代表顏色以及“透明”像素值的二值圖像。使所有早先的像素值成為“透明”。
接下來,在步驟S123獲取連通分量的信息。該連通分量是構(gòu)成字符的像素的連通分量。
并在步驟S124檢查連通分量的尺寸,當(dāng)連通分量小于預(yù)先定義的尺寸時,向前執(zhí)行(步驟S124為N)步驟S125,確定哪一種代表顏色應(yīng)該按照每個連通分量來著色。
具體地,需要確定位于構(gòu)成連通分量的像素位置的原始圖像的平均像素值,計算其與代表顏色之間的距離,并選擇最接近的代表顏色。
隨后,將構(gòu)成連通分量的像素寫入到像素值中具有在步驟S125選擇的代表顏色的二值圖像中(步驟S126),以及將寫入到二值圖像結(jié)尾的連通分量信息消除(步驟S127)。
另一方面,當(dāng)連通分量超過預(yù)先定義的尺寸時,返回到步驟S123(步驟S124為是),并獲取另一個連通分量的信息。
重復(fù)以上步驟S123-S127的處理直到檢查了所有的連通分量的信息(步驟S128為是)。
所有連通分量信息的檢查的結(jié)尾將原始圖像分割為網(wǎng)格形狀(步驟S129)。(步驟S128為是)如圖12A和圖12B所示,假設(shè)將整個圖像分割成2×2像素大小的塊。
接下來,順序檢查各個網(wǎng)格區(qū)域。
首先,確定目標(biāo)網(wǎng)格區(qū)域是否在可被認(rèn)為是字符的連通分量上(步驟S130)。由于當(dāng)連通分量上沒有像素時則表示其中不存在字符(步驟130為否)及其區(qū)域,則檢查下一個網(wǎng)格。
當(dāng)它在連通分量上時,則表示其中存在字符(步驟S130為是)以及可適用網(wǎng)格區(qū)域。
接著,確定網(wǎng)格區(qū)域是否在連通分量的邊界部分(末端)(步驟S131)。如果是圖13所示的整個網(wǎng)格構(gòu)成連通分量的像素,則斷定在邊界上沒有像素。
當(dāng)斷定在邊界上沒有像素時(像素在內(nèi)部),計算網(wǎng)格內(nèi)的像素值以及它們的平均值(步驟S131為否),并選擇靠近該平均值的代表顏色(步驟S132)。
另一方面,當(dāng)確定像素在邊界中時(內(nèi)部沒有像素),在網(wǎng)格內(nèi)并構(gòu)成連通分量的像素中選擇亮度最低的像素(步驟S131為是),并選擇最接近它的代表顏色(步驟S133)。
因此,不對邊界區(qū)域使用平均值的原因是由于在混合背景的顏色時,在許多情況下邊界附近擠進(jìn)這種像素值并取得平均值,背景顏色的影響具有很強(qiáng)值。
由于它是由實際字符顏色構(gòu)成,因此傾向于斷定背景顏色附近是最接近于代表顏色的顏色,并且如果背景顏色的影響很大,當(dāng)它再次作為字符圖像出現(xiàn)時將變得不自然。
將網(wǎng)格中構(gòu)成連通分量的像素寫到具有所選擇的代表顏色作為像素顏色的二值圖像中(步驟S134)。如圖13所示,由于不是如其本身一樣將網(wǎng)格的形式寫入到二值圖像中,而是僅將網(wǎng)格中構(gòu)成連通分量的像素部分寫入,因此分辨率不會下降。
重復(fù)上述步驟S130-S134的處理直到檢查了所有網(wǎng)格部分(步驟S135為是)。
因此,在本實施例中,提供了分別確定不同顏色的多種顏色確定方法。例如,下述的多種顏色確定方法(1)確定每個連通分量的顏色的方法;(2)確定每個塊的顏色的方法(對代表顏色的選擇使用平均顏色);(3)確定每個塊的顏色的方法(對代表顏色的選擇使用最暗的顏色)。
通過選擇其中一種方法以及根據(jù)情況結(jié)合使用上述方法,就可能平衡結(jié)果圖像的質(zhì)量和處理時間。
此外,如果在步驟S103中提取了具有特定屬性的區(qū)域(特定屬性區(qū)域),如字符區(qū)域,則可能使得當(dāng)原始圖像的分辨率較低時,在本實施例中錯誤地使用了具有高分辨率的圖像。因此,當(dāng)發(fā)現(xiàn)特定屬性區(qū)域時,可以增加精確度。
相反,如果在原始圖像的分辨率很高時,使用了低分辨率的圖像,其將導(dǎo)致處理時間的縮短。
圖8-圖13的上述實施例提供了一種圖像處理設(shè)備,其包括多級圖像獲取單元,用于獲取作為處理對象圖像的多級圖像;二值圖像獲取單元,用于獲取基于多級圖像而創(chuàng)建的二值圖像;特定屬性區(qū)域提取單元,用于從多值圖像中提取為具有特定屬性的區(qū)域的特定屬性區(qū)域;白色像素置換單元,用于將二值圖像中除特定屬性區(qū)域之外的像素改變?yōu)榘咨袼?;連通分量尺寸檢查單元,用于從二值圖像中提取黑色像素的連通分量,對連通分量的尺寸進(jìn)行分類,并將太大或太小的部分改變?yōu)榘咨袼?,其中在所述二值圖像中,通過白色像素置換單元將其中的特定屬性區(qū)域以外的像素改變?yōu)榘咨袼?;特定屬性區(qū)域消除圖像創(chuàng)建單元,用于創(chuàng)建由背景顏色改變了特定屬性區(qū)域的像素的多級圖像;特定屬性區(qū)域顏色確定單元,用于確定特定屬性區(qū)域的顏色;特定屬性像素圖像創(chuàng)建單元,用于創(chuàng)建具有特定屬性區(qū)域顏色確定單元所確定的顏色的特定屬性區(qū)域的圖像;圖像編碼單元,用于對分別由特定屬性區(qū)域消除圖像創(chuàng)建單元以及特定屬性像素圖像創(chuàng)建單元創(chuàng)建的兩幅或多幅圖像進(jìn)行壓縮編碼;以及組合文件創(chuàng)建單元,用于創(chuàng)建合并了來自于圖像編碼單元的編碼圖像的組合文件。
根據(jù)本發(fā)明,消除了如字符區(qū)域那樣的具有特定屬性的區(qū)域(特定屬性區(qū)域)的像素值的急劇改變。即使使用了不適于像素值急劇改變的圖像的壓縮技術(shù),如JPEG壓縮編碼,也可能獲得適當(dāng)?shù)膲嚎s率。通過大量減少顏色數(shù)量,可以使得如字符區(qū)域那樣具有特定屬性的區(qū)域(特定屬性區(qū)域)的壓縮率變得合適。無需將用作處理對象圖像的多級圖像的圖像質(zhì)量減少太多,就可以得到文件尺寸的明顯減少。并且即使存在如字符或格線那樣具有特定屬性的區(qū)域(特定屬性區(qū)域),也可以保證特定屬性的像素的可見度。
上述圖像處理設(shè)備可以被配置為使得特定屬性區(qū)域顏色確定單元包括圖像分割單元,用于將多級圖像分割為固定的區(qū)域;和顏色確定單元,用于確定由圖像分割單元創(chuàng)建的每一個固定區(qū)域的顏色。
上述圖像處理設(shè)備可以被配置為使得顏色確定單元包括多個顏色確定單元,用于分別確定不同的顏色,并使用從所述多個顏色確定單元中選擇的一個、根據(jù)連通分量大小檢查單元給定的連通分量的大小的分類來確定特定屬性區(qū)域的顏色。
上述圖像處理設(shè)備可以被配置為使得顏色確定單元包括多個顏色確定單元,用于分別確定不同的顏色,并且,為了確定特定屬性區(qū)域的顏色,在其中兩個或多個像素位于特定屬性區(qū)域的情況和其中兩個或多個像素單元位于特定屬性區(qū)域以外的區(qū)域與特定屬性區(qū)域的邊界上的情況之間選擇多個顏色確定單元中的一個。
上述圖像處理設(shè)備可以被配置為使得提供特定屬性區(qū)域提取單元,當(dāng)從多級圖像中提取作為具有特定屬性的區(qū)域的特定屬性區(qū)域時,將多級圖像的分辨率改變?yōu)榱硪环N分辨率。
圖8-圖13的實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟獲取作為處理對象圖像的多級圖像;獲取基于多級圖像而創(chuàng)建的二值圖像;從多級圖像中提取作為具有特定屬性的區(qū)域的特定屬性區(qū)域;將二值圖像中的特定屬性區(qū)域以外的像素變?yōu)榘咨袼?;從二值圖像中提取黑色像素的連通分量,其中由白色像素置換單元將特定屬性區(qū)域以外的像素改變?yōu)榘咨袼?;將連通分量的大小分類;將太大或太小的連通分量改變?yōu)榘咨袼?;?chuàng)建用背景顏色改變特定屬性區(qū)域的像素的多級圖像;確定特定屬性區(qū)域的顏色;創(chuàng)建具有由特定屬性區(qū)域顏色確定步驟所確定的顏色的特定屬性區(qū)域的圖像;分別對由特定屬性區(qū)域消除圖像創(chuàng)建步驟和特定屬性像素圖像創(chuàng)建步驟創(chuàng)建的兩個或更多圖像分別進(jìn)行壓縮編碼;以及創(chuàng)建合并了在圖像編碼步驟創(chuàng)建的編碼圖像的組合文件。
上述計算機(jī)程序產(chǎn)品還被配置為使得特定屬性區(qū)域顏色確定步驟包括步驟將多級圖像分割為固定的區(qū)域;和確定在圖像分割步驟創(chuàng)建的每一個固定區(qū)域的顏色。
上述計算機(jī)程序產(chǎn)品可以被配置為使得,在顏色確定步驟中分別提供多個顏色確定方法,用于確定不同的顏色,并使用從所述多個顏色確定方法中選擇的一個、根據(jù)連通分量大小檢查步驟中給定的連通分量的大小的分類來確定特定屬性區(qū)域的顏色。
上述計算機(jī)程序產(chǎn)品可以被配置為使得,在顏色確定步驟中,提供多個顏色確定方法,用于分別確定不同的顏色,并且,為了確定特定屬性區(qū)域的顏色,在其中兩個或多個像素位于特定屬性區(qū)域的情況和其中兩個或多個像素單元位于特定屬性區(qū)域以外的區(qū)域與特定屬性區(qū)域的邊界上的情況之間選擇多個顏色確定方法中的一個。
上述計算機(jī)程序產(chǎn)品可以被配置為使得提供特定屬性區(qū)域提取步驟,當(dāng)從多級圖像中提取作為具有特定屬性的區(qū)域的特定屬性區(qū)域時,將多級圖像的分辨率改變?yōu)榱硪环N分辨率。
圖8-圖13的上述實施例提供了一種計算機(jī)可讀存儲介質(zhì),存儲了能夠使計算機(jī)執(zhí)行圖像處理方法的程序,該圖像處理方法包括以下步驟獲取作為處理對象圖像的多級圖像;獲取基于多級圖像而創(chuàng)建的二值圖像;從多級圖像中提取作為具有特定屬性的區(qū)域的特定屬性區(qū)域;將二值圖像中的特定屬性區(qū)域以外的像素變?yōu)榘咨袼?;從二值圖像中提取黑色像素的連通分量,其中由白色像素置換單元將特定屬性區(qū)域以外的像素改變?yōu)榘咨袼?;將連通分量的大小分類;將太大或太小的連通分量改變?yōu)榘咨袼?;?chuàng)建用背景顏色改變特定屬性區(qū)域的像素的多級圖像;確定特定屬性區(qū)域的顏色;創(chuàng)建具有由特定屬性區(qū)域顏色確定步驟所確定的顏色的特定屬性區(qū)域的圖像;分別對由特定屬性區(qū)域消除圖像創(chuàng)建步驟和特定屬性像素圖像創(chuàng)建步驟創(chuàng)建的兩個或更多圖像進(jìn)行壓縮編碼;以及創(chuàng)建合并了在圖像編碼步驟創(chuàng)建的編碼圖像的組合文件。
接下來,將根據(jù)圖14至圖18解釋說明本發(fā)明的另一個優(yōu)選實施例。
為了通過使用圖3的方法提高可壓縮性,創(chuàng)建僅包含消除了字符的背景的圖像是很重要的。
通過消除字符,字符區(qū)域與周圍區(qū)域的像素值之間的差異將變小,并且通過圖像編碼提高了壓縮效率以及可以抑制蚊子(mosquito)噪聲的出現(xiàn)。
然而,如圖19(a)所示,在多級圖像中平滑地變化字符的邊界部分。盡管在執(zhí)行了二值化(圖19(b))的情況下,將位于使用某個閾值進(jìn)行了平滑改變的位置上的邊界變?yōu)閱紊?,如果該位置是如其本身一樣用作二值圖像的黑色像素,其將保留,而不需要消除字符的輪廓區(qū)域(圖19(c))。
由于仍將保有與周圍的像素值的差異,保留的區(qū)域?qū)⑹沟脡嚎s率降低以及由于蚊子噪聲惡化圖像的質(zhì)量。
為了解決該問題,本實施例的技術(shù)目的是抑制在消除時間內(nèi)保留字符輪廓的現(xiàn)象,以及改善可壓縮性和圖像質(zhì)量。
圖14示出了本實施例中圖像處理設(shè)備1的功能組成。在本實施例中,如下所示,圖像處理設(shè)備1的處理是基于圖像處理程序13實現(xiàn)的。
1、獲取作為處理對象圖像的多級圖像和基于多級圖像的二值圖像通過多級圖像獲取單元21和二值圖像獲取單元22獲取多級圖像和二值圖像(S1,S2)?;谠摱嗉増D像,創(chuàng)建二值圖像。
二值圖像的創(chuàng)建所需要的是使用固定閾值,并將顏色亮于該閾值的像素改變?yōu)榘咨袼?、以及顏色暗于該閾值的像素改變?yōu)楹谏袼?。此外,二值圖像和多級圖像可能具有不同分辨率。
例如,通過上述方法創(chuàng)建二值圖像之后,可以進(jìn)行變薄處理,降低多級圖像的分辨率,并且可獲取這種圖像作為處理對象的多級圖像。
此外,可使用另一種設(shè)備來執(zhí)行該二值圖像的創(chuàng)建,并通過其它設(shè)備獲得所創(chuàng)建的結(jié)果圖像文件。
2、獲取字符區(qū)域通過使用特定屬性區(qū)域提取單元24,確定字符在原始圖像中的位置(S3)。從二值圖像還是多級圖像中獲取是無所謂的。當(dāng)從多級圖像獲取時,可以使用日本公開專利申請No.2002-288589提出的字符區(qū)域提取方法,當(dāng)從二值圖像中獲取時,可以使用日本公開專利申請No.06-020092提出的字符區(qū)域提取方法。在本實施例中,基于二值圖像提取構(gòu)成字符的像素,作為具有特定屬性的像素。
3、將字符區(qū)域以外的像素變?yōu)榘咨袼亍?br> 通過使用白色像素置換單元25,將二值圖像中的字符區(qū)域之外的像素(特定屬性區(qū)域之外的像素)變?yōu)榘咨袼?S4)。
4、用背景顏色改變字符區(qū)域的像素通過使用特定屬性區(qū)域消除圖像創(chuàng)建單元23,創(chuàng)建消除了特定屬性區(qū)域(字符區(qū)域)的圖像(S5)。所必需的恰是創(chuàng)建由彩色圖像中的周圍顏色來替換字符部分的像素的圖像。
5、確定特定屬性區(qū)域的顏色通過使用特定屬性區(qū)域顏色確定單元26,確定特定屬性區(qū)域(字符區(qū)域)的顏色(S6)。確定位于構(gòu)成字符的黑色像素位置上的彩色圖像的所有像素顏色,并選擇在這種顏色數(shù)據(jù)中經(jīng)常使用的一些主要顏色作為代表顏色。以及確定代表顏色中最接近構(gòu)成字符的每個像素的顏色或最接近每個連通分量的顏色的代表顏色。
6、創(chuàng)建特定屬性像素圖像通過使用特定屬性像素圖像創(chuàng)建單元27,創(chuàng)建具有特定屬性的像素具有為每個像素以及每個連通分量選擇的代表顏色的圖像(S7)。在這種情況下,為每一個所選擇的代表顏色創(chuàng)建一幅二值圖像(或僅含有有限顏色的一幅多級圖像)。
7、圖像編碼通過使用圖像編碼單元28,為其中消除了特定屬性像素的無字符圖像,以及僅含有特定屬性像素的顏色減少圖像執(zhí)行壓縮編碼,以便于創(chuàng)建壓縮圖像(S8)。舉例來說,為了有效減小文件尺寸,對無字符圖像進(jìn)行JPEG壓縮編碼,對減少了顏色的圖像進(jìn)行MMR壓縮編碼。
8、創(chuàng)建組合文件通過使用組合文件創(chuàng)建單元29,將壓縮圖像合并在一個單一文件中(S9)。如果合并了這些圖像,它變成字符粘貼于背景上的形式,并可以簡單地將其認(rèn)作為原始圖像。
參照圖15和圖16的流程圖示出的概括性功能框圖將詳細(xì)描述通過特定屬性區(qū)域消除圖像創(chuàng)建單元23執(zhí)行的、尤其是通過這種操作形式表現(xiàn)的步驟S5的處理。此外,在圖16中,省略并簡單化了對不直接相關(guān)的部分的說明。
首先,獲取處理對象圖像(S5a)。處理對象圖像是多值的原始圖像,并且可以從多級圖像獲取單元21獲得。
獲取替換了像素值的像素(S5b)。這是步驟S4獲取的二值圖像,并且是黑色像素相應(yīng)的部分。該圖像可以通過白色像素置換單元25獲取。
在替換處理后獲取像素值(S5c)。將與作為替換對象的黑色像素的周圍區(qū)域的白色像素的位置相同的像素值用作替換后的像素值。這通過置換像素獲取單元23a來獲得。
使用像素值置換單元23b將置換后的像素值取代要進(jìn)行置換的像素的值(S5d)。
使用邊界像素指定單元23c獲取替換了的像素以及沒有替換的像素的邊界位置(S5e)。在本實施例中,將存在于構(gòu)成字符的黑色像素的邊界線以外部分的1個像素、以及構(gòu)成字符以外部分的白色像素轉(zhuǎn)換到邊界位置,并且這是針對相關(guān)的像素。在圖6示出的例子中,斜線部分是邊界像素。
使用邊界像素圖像處理單元23d對邊界位置中存在的像素進(jìn)行圖像處理(S5f)。
一些方法可認(rèn)為適用于圖像處理。將執(zhí)行(R1,G1,B1)后的像素值以及在進(jìn)行圖像處理之前對像素值的圖像處理設(shè)置為(R2,G2,B2)。
圖18示出了消除了字符的多級圖像的邊界位置的邊界像素。將對該邊界像素(斜線部分)進(jìn)行圖像處理。
a.亮度補(bǔ)償處理通過與固定值相乘來提高亮度,如R2=R1×V,G2=G1×V,以及B2=B1×V(V是常數(shù))。由于RGB每一部分的比例不改變,通常僅有亮度會改變。
b.色調(diào)補(bǔ)償處理使用固定值,如R2=R1+VR,G2=G1+VG,以及B2=B1×VB(VR,VG,以及VB是常數(shù))。通過使用對RGB每一部分不同的值來改變色調(diào)。亮度也依靠該值來改變。
c.平滑處理如果用(RL,GL,BL)以及(RR,GR,BR)來設(shè)置左右鄰接的像素值,則通過R2=(RL+RR+R1)/3,G2=(GL+GR+G1)/3,B2=(BL+BR+B1)/3的計算來執(zhí)行該平滑處理。
d.加權(quán)平均值運算處理該處理也可以稱為是一種平滑處理。例如,R2=(RL+RR+R1×2)/4,G2=(GL+GR+G1×2)/4,B2=(BL+BR+B1×2)/4的計算可以通過改變權(quán)值來改變字符輪廓的平滑量。
通過上述處理,在消除了字符的圖像中,保留在輪廓區(qū)域的字符顏色淡化,并且可以期待對可壓縮性以及抑制蚊子噪聲的進(jìn)一步改善。
圖14-圖18的上述實施例提供了一種圖像處理設(shè)備,其包括圖像獲取單元,獲取處理對象圖像;像素獲取單元,獲取處理對象圖像中用于進(jìn)行像素值置換的像素;像素值獲取單元,獲取像素值置換后的像素值;像素值置換單元,將所獲取的像素的像素值改變?yōu)樗@取的像素值;邊界像素指定單元,在用于進(jìn)行像素值置換的像素以及處理對象圖像中不進(jìn)行像素值置換的像素之間確定界位置;以及邊界像素圖像處理單元,對處理對象圖像中位于邊界位置的像素的像素值執(zhí)行圖像處理。
根據(jù)本發(fā)明,當(dāng)通過用預(yù)定像素值替換關(guān)于處理對象圖像的預(yù)定像素的像素值來執(zhí)行消除處理時,對在邊界線的外部不替換像素值的像素部分執(zhí)行預(yù)定圖像處理(例如,光補(bǔ)償、色調(diào)補(bǔ)償、平滑、與周圍像素的加權(quán)平均運算的處理等)。可以抑制其中相關(guān)像素部分保留為輪廓的現(xiàn)象,并因此可以達(dá)到改進(jìn)可壓縮性和改進(jìn)圖像質(zhì)量的目的。
上述圖像處理設(shè)備可以被配置為使得提供邊界像素圖像處理單元,對處理對象圖像中位于進(jìn)行像素值置換的像素以外位置的像素值執(zhí)行圖像處理。
上述圖像處理設(shè)備可以被配置為使得提供邊界位置指定單元,用于在處理對象圖像中僅獲取不進(jìn)行像素值置換的像素。
上述圖像處理設(shè)備可以被配置為使得圖像處理是亮度補(bǔ)償處理。
上述圖像處理設(shè)備可以被配置為使得圖像處理是色調(diào)補(bǔ)償處理。
上述圖像處理設(shè)備可以被配置為使得圖像處理是平滑處理。
上述圖像處理設(shè)備可以被配置為使得圖像處理是與周圍像素有關(guān)的加權(quán)平均運算。
圖14-圖18的上述實施例提供了一種圖像處理方法,包括以下步驟獲取處理對象圖像;獲取處理對象圖像中用于進(jìn)行像素值置換的像素;獲取像素值置換后的像素值;將所獲取的像素的像素值改變?yōu)樗@取的像素值;在用于進(jìn)行像素值置換的像素以及處理對象圖像中不進(jìn)行像素值置換的像素之間確定邊界位置;以及關(guān)于處理對象圖像中位于邊界位置的像素的像素值執(zhí)行圖像處理。
圖14-圖18的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟獲取處理對象圖像;獲取處理對象圖像中用于進(jìn)行像素值置換的像素;獲取像素值置換后的像素值;將所獲取的像素的像素值改變?yōu)樗@取的像素值;在用于進(jìn)行像素值置換的像素以及處理對象圖像中不進(jìn)行像素值置換的像素之間確定邊界位置;以及關(guān)于處理對象圖像中位于邊界位置的像素的像素值執(zhí)行圖像處理。
上述計算機(jī)程序產(chǎn)品可以被配置為使得關(guān)于處理對象圖像中位于進(jìn)行像素值置換的像素以外的像素的像素值而執(zhí)行圖像處理。
上述計算機(jī)程序產(chǎn)品可以被配置為使得在邊界位置確定步驟中,僅獲取在處理對象圖像中不進(jìn)行像素值置換的像素。
上述計算機(jī)程序產(chǎn)品可以被配置為使得圖像處理是亮度補(bǔ)償處理。
上述計算機(jī)程序產(chǎn)品可以被配置為使得圖像處理是色調(diào)補(bǔ)償處理。
上述計算機(jī)程序產(chǎn)品可以被配置為使得圖像處理是平滑處理。
上述計算機(jī)程序產(chǎn)品可以被配置為使得圖像處理是結(jié)合周圍像素的加權(quán)平均運算。
圖14-圖18的上述實施例提供了一種計算機(jī)可讀存儲介質(zhì),存儲了能夠使計算機(jī)執(zhí)行圖像處理方法的程序,該圖像處理方法包括以下步驟獲取處理對象圖像;獲取處理對象圖像中用于進(jìn)行像素值置換的像素;獲取像素值置換后的像素值;將所獲取的像素的像素值改變?yōu)樗@取的像素值;在用于進(jìn)行像素值置換的像素以及處理對象圖像中不進(jìn)行像素值置換的像素之間確定邊界位置;以及關(guān)于處理對象圖像中位于邊界位置的像素的像素值執(zhí)行圖像處理。
接下來,將參照圖20至圖25解釋說明本發(fā)明的優(yōu)選實施例。
在本實施例中,當(dāng)實現(xiàn)尺寸明顯減小時,通過使用圖像處理程序13,無需損失作為處理對象圖像(原始圖像)的多級圖像的字符可見性,便基于字符代碼進(jìn)行檢索。
參照圖20和圖21解釋說明本實施例的處理概況。
首先,使用圖像讀取器10,如圖像掃描儀,獲取如圖21(a)所示的作為處理對象圖像的原始圖像的多級圖像(彩色圖像)(步驟S201)。
并通過二值化這種多級圖像來創(chuàng)建圖21(b)所示的二值圖像(步驟S202)。接下來,提取字符部分(步驟S203)。以及執(zhí)行白色像素處理,該處理通過二值圖像將除字符部分以外的像素改變?yōu)榘咨袼?,以便僅剩余字符部分,如圖21(c)所示(步驟S204)。也就是說,在二值圖像中消除字符以外的黑色像素。該處理將按照像素示出字符的位置。
在接下來的步驟S205中確定字符部分的顏色。具體地,確定彩色圖像中位于構(gòu)成字符部分的黑色像素位置上的所有像素的顏色,并從這些數(shù)據(jù)中選擇經(jīng)常使用的一些主要顏色作為代表顏色。以及確定是否每個像素以及構(gòu)成字符的每個連通分量的像素最接近某個代表顏色。
接著,如圖21(d)所示,創(chuàng)建具有特定屬性的像素(字符部分)具有每個像素及為每個連通分量確定的顏色的圖像(步驟S206)。盡管只帶有有限顏色的多級圖像是足夠的,并且可以擁有每種顏色的每一個二值圖像,假設(shè)每種顏色具有每一個二值圖像。
另一方面,使多級圖像成為用背景顏色改變字符部分的像素值的圖像,并創(chuàng)建如圖21(e)所示的消除了字符部分的圖像(步驟S207)。填充了背景顏色的圖像被認(rèn)為是不具有重要信息的圖像,并如圖21(f)所示,執(zhí)行低分辨率處理(步驟S208)。
從在步驟S208創(chuàng)建的消除了字符部分的低分辨率圖像,以及在步驟S206創(chuàng)建的僅由字符部分構(gòu)成的每種顏色的二值圖像中創(chuàng)建壓縮圖像(步驟S209)。舉例來說,如果對前一幅圖像執(zhí)行JPEG壓縮并對后一幅圖像進(jìn)行MMR壓縮,文件尺寸將明顯變小。
在接下來的步驟S210中,進(jìn)行字符識別處理并創(chuàng)建字符代碼。對原始圖像(彩色圖像)或二進(jìn)制字符圖像(僅由字符部分構(gòu)成的圖像)進(jìn)行字符識別處理。盡管處理時間需要對原始圖像(彩色圖像)進(jìn)行字符識別處理的優(yōu)點,卻也獲得了高精度字符識別處理。
在另一方面,雖然如果對通過上述處理獲得的二值字符圖像執(zhí)行字符識別處理,由于將對二值圖像執(zhí)行字符識別處理是高速的,但另一方面由處理獲得的二值圖像質(zhì)量的結(jié)果可能會下降。
接下來,需要選擇執(zhí)行字符識別處理的圖像,并且只是通過是否需要高速執(zhí)行字符識別處理或者是否需要執(zhí)行高精確度的字符識別處理來使得圖像轉(zhuǎn)換。
此外,在原始圖像以及每個字符圖像中執(zhí)行字符識別處理時,如果選擇了更高可靠性的代碼,從而使得字符識別結(jié)果的字符代碼不同于坐標(biāo)(coordinate)的相同字符圖像的結(jié)果,則可能提高字符識別的精確度。
另外,在本實施例中,具有每一種顏色的二值字符圖像,以及通過對每一個二值字符圖像分別進(jìn)行字符識別處理而改善精確度。
由于這種原因,對雜志進(jìn)行縱向?qū)懭牒蜋M向?qū)懭氲幕旌?,并且另一部?例如縱向?qū)懭?畫出帶有顏色的標(biāo)識部分(如橫向?qū)懭?。當(dāng)執(zhí)行這種字符識別處理時,可以稱為是線條的提取出錯了。
然而,在本實施例中,由于對每種顏色創(chuàng)建了另一幅二值圖像,并且它創(chuàng)建了顏色不同的標(biāo)識分割(如橫向?qū)懭?以及其它部分(如縱向?qū)懭?的兩幅圖像,改善了字符識別的精確度。
此外,在本實施例中,具有對每種顏色的二值字符圖像,以及分別對每幅二值字符圖像執(zhí)行字符識別處理,字符識別處理需要多倍的時間,并發(fā)生了高速處理是不可能的主題。于是,通過對每種顏色的二值字符圖像執(zhí)行OR處理,以及執(zhí)行字符識別處理作為一頁的字符圖像以高速處理,來獲得處理速度的改善。
接著,根據(jù)與原始圖像保持的相同位置關(guān)系進(jìn)行排列,這種排列的格式(如PDF文件類型)可以組合并顯示,使得其包括無字符圖像(消除了字符部分的圖像)、二值字符圖像(僅包含字符部分的圖像)、字符識別結(jié)果的字符代碼、以及它們的位置坐標(biāo)(步驟S211)。
通過嵌入用于組合的字符代碼以及它們的位置坐標(biāo),圖像的可見度可以實現(xiàn)圖像的檢索,而無需降低可見度,其中位置坐標(biāo)采用不同于圖像的層上的透明文本的形式。
此外,盡管由PDF文件類型來組合,但也可以通過具有多層功能的方法來進(jìn)行組合,如不僅僅是PDF文件類型,JPEG2000形式也可以,當(dāng)然,采用多個文件來保存也是沒有問題的。
當(dāng)通過這種處理創(chuàng)建的圖像文件沒有減少可見度而獲得文件尺寸的明顯壓縮時,可以基于字符代碼進(jìn)行搜索。理由如下。
盡管JPEG壓縮對具有像素值急劇改變的圖像沒有很好的壓縮效果,如果通過此處描述的方法消除了字符部分,由于字符部分的像素值的改變將丟失,因此效果將變好。
另外,由于字符部分急劇減少了顏色數(shù)量,也正因如此,壓縮率變好。
參照示出了基于圖像處理程序13實現(xiàn)這種流程的細(xì)節(jié)的圖像處理設(shè)備1的功能的功能方框22,進(jìn)行詳細(xì)說明。
1、獲取作為處理對象圖像的多級圖像和基于多級圖像的二值圖像通過多級圖像獲取單元221和二值圖像獲取單元222獲取多級圖像和二值圖像(步驟S201和S202)。
基于該多級圖像,創(chuàng)建二值圖像。二值化方法所需要的是固定閾值以及僅僅使用該方法,例如將亮于該閾值的像素改變?yōu)榘咨袼?、以及將暗像素轉(zhuǎn)換為黑色像素。
此外,作為二值圖像和多級圖像,不同的分辨率是足夠的。例如,通過該方法創(chuàng)建二值圖像之后,可以進(jìn)行變薄處理,降低多級圖像的分辨率,并且可獲取其作為處理對象的多級圖像。
此外,可使用另一種設(shè)備來執(zhí)行該二值圖像的創(chuàng)建,并獲得所創(chuàng)建的圖像文件。
2、提取字符區(qū)域通過使用字符部分提取單元224,創(chuàng)建字符存在于圖像上的位置(步驟S203)。在本實施例中,基于二值圖像確定構(gòu)成字符的像素位置作為具有特定屬性的像素。
3、將字符區(qū)域之外的像素變?yōu)榘咨袼赝ㄟ^使用白色像素置換單元225,將二值圖像中的字符區(qū)域之外的像素變?yōu)榘咨袼?步驟S204)。
4、確定字符區(qū)域的顏色字符區(qū)域顏色確定單元226確定字符部分的顏色(步驟S205)。確定位于構(gòu)成字符的黑色像素位置上的彩色圖像的所有像素顏色,并在這種數(shù)據(jù)中選擇經(jīng)常使用的一些主要顏色作為代表顏色。以及確定每個像素以及構(gòu)成每個連通分量的字符的像素是否最接近某一個代表顏色。
5、創(chuàng)建彩色圖像通過字符圖像創(chuàng)建單元227,創(chuàng)建其中具有特定屬性的像素(字符部分)具有每個像素及為每個連通分量斷定的顏色的全彩圖像(步驟S206)。盡管多級圖像擁有有限的顏色已足夠,并且每種顏色都具有每一個二值圖像,假設(shè)每種顏色具有每一幅二值圖像。
6、創(chuàng)建無字符的多級圖像通過使用字符部分消除圖像創(chuàng)建單元223創(chuàng)建多級圖像,其中該圖像中相應(yīng)于在上述第3項的處理中保留的黑色像素部分的字符部分的像素值被改變?yōu)楸尘邦伾?,并且不具有字?步驟S207)。
7、圖像編碼通過使用圖像編碼單元228,對沒有字符的僅由多級圖像構(gòu)成的每種顏色的二值圖像以及字符的二值圖像進(jìn)行編碼,并壓縮尺寸(步驟S209)。這其中,不具有字符的多級圖像的重要信息表示不存在任何東西,并通過JPEG等實現(xiàn)不可逆的高度壓縮。如果在降低了分辨率之后進(jìn)行壓縮,尺寸將會變得更小。
此外,實現(xiàn)僅包含字符的每種顏色的二值圖像的可逆壓縮。
如果是二值圖像,適于進(jìn)行PNG壓縮或MMR壓縮等,諸如4值或16值,適于進(jìn)行PNG壓縮編碼等。
8、字符識別通過字符識別單元230,對原始圖像(彩色圖像)或二值字符圖像(僅由字符部分構(gòu)成的圖像)進(jìn)行字符識別處理,并創(chuàng)建字符代碼(步驟S210)。
特別的,字符識別處理不限于本方法,并建議使用迄今為止的不同字符識別方法來執(zhí)行。
雖然,作為字符識別的結(jié)果,需要除了字符識別的字符代碼之外的坐標(biāo)位置。
9、創(chuàng)建組合文件通過組合文件創(chuàng)建單元229,將壓縮圖像組合在一個文件中(步驟S211)。如果該組合到文件中的格式可以相互重復(fù)并能夠顯示,則可認(rèn)為是字符部分的可見度沒有下降的文件尺寸小的彩色圖像,并且背景也在某種程度上進(jìn)行了再現(xiàn)。
接下來參照圖23至圖25解釋上述處理的一個例子。
在圖23所示出的例子中,在黃色背景上,原始圖像(彩色圖像)用紅色字符顯示了“<方針発表會“plan meeting”>”,以及用黑色字符顯示了“日期xx月xx日”以及“地點xxx”。
上述處理從這種原始圖像(彩色圖像)中創(chuàng)建了僅有黃色背景的無字符圖像a,紅色字符的二值字符圖像b,以及黑色字符的二值字符圖像c。
隨后,執(zhí)行字符識別處理。在此,應(yīng)對原始圖像(彩色圖像)進(jìn)行字符識別處理。
首先字符識別處理執(zhí)行對如圖24(a)所示的原始圖像(彩色圖像)的辨別處理,并提取字符行。
在圖24所示的例子中,提取“<plan meeting>”、“日期xx月xx日”、以及“地點xxx”三行字符(參照圖24(b))。
此外,通過使用從日本專利No.3278471等得知的技術(shù)來實現(xiàn)區(qū)域辨別處理。
接下來,從提取的字符行中提取字符。此處,示出了二值圖像的字符是黑色連通分量(黑色像素塊)的例子。
圖24(c)示出了線條提取結(jié)果1的字符提取結(jié)果。然而,類似于“meeting(會議)”,即使在將原始黑色連通分量分割成多個部分的時候,通過圖像組合,如圖24(c)所示的在長度方向上(垂直于線書寫方向)交迭的黑色連通分量的字符記錄變得可能。
然而,如圖24(c)所示,將針“needle”分割成金“gold”以及十“10”。需要的只是通過使用被稱為字符識別處理或語言處理的路徑選擇的處理,從關(guān)于選項“needle”、“gold”以及“10”中對“needle”進(jìn)行選擇。
因此,根據(jù)正確的字符串“<plan meeting>”獲取每個字符坐標(biāo)(參照圖24(d))。
最后,將字符識別結(jié)果的字符代碼粘貼在結(jié)合字符坐標(biāo)的位置上,并創(chuàng)建字符結(jié)果平面(參見圖24(e))。
雖然可以看見圖24(e)舉例示出的字符代碼“<plan(計劃)…”,但由于實際上它是作為透明文本粘貼的(將顏色映射指定為透明的),因此人眼是看不到它的。
然而,當(dāng)訪問個人計算機(jī)等時,由于存在文本代碼粘貼的平面,檢索變得可能。
此外,通過在與原始圖像相同的坐標(biāo)位置上粘貼字符識別結(jié)果,使得通過執(zhí)行字符代碼的高亮顯示,或執(zhí)行反轉(zhuǎn)視頻作為檢索的結(jié)果來告知用戶檢索位置變?yōu)榭赡堋?br> 最后,如圖25所示,根據(jù)與原始圖像所保持的相同的位置關(guān)系進(jìn)行排列,該排列的格式(如PDF文件類型)可以被組合并顯示,使得其包括作為背景圖像的無字符圖像、每種顏色的二值字符圖像、字符識別結(jié)果的字符代碼、以及其位置坐標(biāo)。
通過以與圖像不同的層中的透明文本的形式嵌入用于混合的字符代碼以及它們的位置坐標(biāo),圖像的可見度可以通過字符代碼等實現(xiàn)圖像檢索,而無需降低可見度。
準(zhǔn)備作為處理對象圖像的多級圖像,以及基于多級圖像的二值圖像,并從二值圖像中提取字符部分,當(dāng)創(chuàng)建由白色像素取代了字符部分之外的像素的二值字符圖像,以及創(chuàng)建由背景顏色隱藏了多級圖像中的字符部分的像素的無字符多級圖像時,創(chuàng)建由構(gòu)成字符部分的顏色組成的二值字符圖像。
此外,至少對由每一種確定的顏色組成的二值字符圖像以及多級圖像中的一個進(jìn)行字符識別處理,并獲取字符代碼。分別對由每種確定的顏色構(gòu)成的二值字符圖像以及無字符的多級圖像進(jìn)行編碼,并與字符代碼一起合并到組合文件中。
無需大大降低作為處理對象圖像的多級圖像的質(zhì)量,便可以實現(xiàn)文件尺寸的急劇減小,即使在存在字符部分的時候,也可以保護(hù)字符部分的像素的可見度。由于可能基于字符代碼進(jìn)行搜索,可以創(chuàng)建能夠搜索并保持圖像質(zhì)量的高壓縮數(shù)據(jù)。
此外,借助具有每種顏色的二值字符圖像,旨在通過分別對每一個二值字符圖像進(jìn)行字符識別處理,來改善字符識別的精確度變得可能。
接下來,根據(jù)圖26至圖30解釋說明本發(fā)明的另一個優(yōu)選實施例。
使用相同的附圖標(biāo)記來表示與在前實施例中相應(yīng)元素相同的元素,并將省略對它們的描述。
盡管在前述實施中每一種顏色都應(yīng)具有一幅二值字符圖像,不是每一種顏色都具有二值字符圖像,但要從本實施例中的二值字符圖像中創(chuàng)建分離出的每個字符的顏色信息。
在本實施例中,當(dāng)通過使用圖像處理程序13實現(xiàn)尺寸明顯減小,而不需要損失作為處理對象圖像(原始圖像)的多級圖像的字符可見度時,可以基于字符代碼進(jìn)行檢索。
根據(jù)圖26和圖27解釋說明本實施例的處理概要。
首先,使用諸如圖像掃描儀之類的圖像讀取器10來獲取如圖27(a)示出的、為用作處理對象圖像的原始圖像的多級圖像(彩色圖像)(步驟S221)。并通過二值化這種多級圖像創(chuàng)建圖27(b)示出的二值圖像(步驟S222)。
接著,提取字符部分(步驟S223)。并進(jìn)行將二值圖像中字符部分以外的像素調(diào)換為白色像素的白色像素處理,以使得僅保留字符,如圖27(c)所示(步驟S224)。也就是說,在二值圖像中消除了字符以外的黑色像素。該處理將按照每個像素顯示出字符的位置。
在下一個步驟S225中,如圖27(d)所示,創(chuàng)建每個字符的顏色信息。
另一方面,使用背景顏色來隱藏多級圖像的字符部分,并創(chuàng)建圖27(e)所示的消除了字符部分的圖像(步驟S226)。
這種填充了背景顏色的圖像被認(rèn)為是沒有重要信息的,并如圖27(f)所示,執(zhí)行低分辨率處理(步驟S227)。
從在步驟S227創(chuàng)建的消除了字符部分的低分辨率圖像、在步驟S224創(chuàng)建的、消除了字符以外的黑色像素的二值字符圖像、以及在步驟S224創(chuàng)建的字符顏色信息中創(chuàng)建壓縮圖像(步驟S228)。
例如,如果在二值字符圖像中,MMR壓縮和字符的顏色信息執(zhí)行JPEG壓縮,其中從該二值字符圖像中消除了字符部分的低分辨率圖像消除了除JPEG壓縮以及字符部分以外的黑色像素,文件尺寸將明顯變小。
在接下來的步驟S229中,執(zhí)行與第一操作形式的步驟S210相同的字符識別處理,并創(chuàng)建字符代碼。
然后,根據(jù)與原始圖像所保持的相同位置關(guān)系進(jìn)行排列,該排列的格式(如PDF文件類型)可以被組合并顯示,使得其包括無字符圖像(消除了字符部分的圖像)、二值字符圖像(僅包含字符部分的圖像)、字符顏色信息、字符識別結(jié)果的字符代碼、及其位置坐標(biāo)(步驟S230)。
圖像的可見度可以借助字符代碼等,通過以與圖像不同的層中的透明文本的形式嵌入用于合成的字符代碼及其位置坐標(biāo)來實現(xiàn)圖像的檢索,而無需降低可見度。
此外,雖然通過PDF文件類型進(jìn)行合成,但也可以使用具有多層性能的方法來組合,例如不僅可以是PDF文件類型,JPEG2000形式也可以,當(dāng)然,即使用多個文件進(jìn)行保存也是可以的。
當(dāng)無需減少由這種處理創(chuàng)建的圖像的可見度便獲得文件尺寸的明顯壓縮時,可以基于字符代碼進(jìn)行搜索。理由如下。
盡管JPEG壓縮對具有像素值急劇改變的圖像沒有很好的壓縮效率,但如果通過此處描述的方法消除了字符部分,由于將不會發(fā)生字符部分的像素值的改變,因此效率將變好。
另外,由于字符部分急劇減少了顏色數(shù)量,也正因如此,壓縮率變好。
根據(jù)示出了基于圖像處理程序13實現(xiàn)這種程序細(xì)節(jié)的涉及圖像處理設(shè)備1的功能方框圖28,進(jìn)行詳細(xì)說明。
1、獲取作為處理對象圖像的多級圖像和基于多級圖像的二值圖像通過多級圖像獲取單元221和二值圖像獲取單元222獲取多級圖像和二值圖像(步驟S221,S222)。
基于該多級圖像,應(yīng)當(dāng)創(chuàng)建二值圖像。二值化方法所需要的是固定閾值以及僅僅使用該方法,例如將亮于該閾值的像素設(shè)置成白色像素、以及將暗于該閾值像素設(shè)置為黑色像素。
此外,作為二值圖像和多級圖像,不同的分辨率足夠了。例如,通過該方法創(chuàng)建二值圖像之后,可以實現(xiàn)變薄處理,降低多級圖像的分辨率,并且可獲取其作為處理對象的多級圖像。此外,可使用另一種設(shè)備來執(zhí)行該二值圖像的創(chuàng)建,并獲得所創(chuàng)建的圖像文件。
2、獲取字符區(qū)域通過使用字符部分提取單元224,創(chuàng)建存在于圖像上的字符的位置(步驟S223)。在本實施例中,基于該二值圖像確定構(gòu)成字符的像素位置作為具有特定屬性的像素。
3、將字符以外的像素變?yōu)榘咨袼赝ㄟ^使用白色像素置換單元225,將二值圖像中的字符部分以外的像素轉(zhuǎn)置為白色像素(S224)。
4、創(chuàng)建每個字符的顏色信息使用字符顏色信息創(chuàng)建單元231來創(chuàng)建每個字符的顏色信息。這里,創(chuàng)建表示字符圖像的顏色信息的字符顏色信息代碼。
5、創(chuàng)建無字符的多級圖像通過使用字符部分消除圖像創(chuàng)建單元223創(chuàng)建多級圖像,其中該多級圖像中相應(yīng)于在上述第3項的處理中剩余的黑色像素部分的字符部分被用背景顏色改變,并且該圖像不包含字符(步驟S226)。
6、圖像編碼通過使用圖像編碼單元228,對二值字符圖像以及僅包含沒有字符的多級圖像的每一個字符的顏色信息以及字符進(jìn)行編碼,并壓縮尺寸(步驟S228)。這其中,帶有不含有字符的重要多級圖像的信息表示圖像中沒有任何東西,并通過JPEG等實現(xiàn)不可逆的高度壓縮。如果在降低了分辨率之后進(jìn)行壓縮,尺寸將會變得更小。
此外,實現(xiàn)僅由字符構(gòu)成的二值字符圖像的可逆壓縮。如果是二值圖像,并且PNG壓縮或MMR壓縮等是諸如4值或16值的圖像,適于進(jìn)行PNG壓縮等。此外,通過JPEG等方法高度實現(xiàn)每個字符的顏色信息的不可逆壓縮。
7、字符識別通過字符識別單元230,對原始圖像(彩色圖像)或二值字符圖像(僅由字符部分構(gòu)成的圖像)進(jìn)行字符識別處理,并創(chuàng)建字符代碼(步驟S229)。
特別的,字符識別處理可以不限于本方法,并可使用迄今為止所建議的不同字符識別方法來執(zhí)行。然而,作為字符識別的結(jié)果,還需要除了字符識別結(jié)果的字符代碼之外的位置坐標(biāo)。
8、創(chuàng)建組合文件通過組合文件創(chuàng)建單元229,將壓縮圖像合并在一個文件中(步驟S230)。如果可以相互重復(fù)并能夠顯示的格式的文件中,則可認(rèn)為是字符部分的可見度沒有下降、并且背景也在某種程度上進(jìn)行了再現(xiàn)的文件尺寸的小彩色圖像。
接下來根據(jù)圖29和圖30解釋說明上述處理的一個例子。
在圖29所示出的例子中,在黃色背景上,將原始圖像(彩色圖像)用紅色字符表示為“<方針発表會“plan meeting(計劃會議)”>”,以及用黑色字符表示為“xx月xx日”以及“地點xxx”。
上述處理將原始圖像(彩色圖像)創(chuàng)建于僅有黃色背景的無字符圖像a、二值字符圖像b、以及字符顏色信息c。
此外,字符識別處理與之前的實施例是相同的,并省略這些描述。
最后,如圖30所示,根據(jù)與原始圖像所保持的相同的位置關(guān)系進(jìn)行排列,該排列的格式(如PDF文件類型)可以被組合并顯示,使得其包括作為背景圖像的無字符圖像、二值字符圖像、字符的顏色信息、字符識別結(jié)果的字符代碼、及其位置坐標(biāo)。
圖像的可見度可以借助字符代碼等、通過在與圖像不同的層中以透明文本的形式嵌入用于合成的字符代碼以及它們的位置坐標(biāo)來實現(xiàn)圖像的檢索,而無需降低可見度。
在此,準(zhǔn)備作為處理對象圖像的多級圖像,以及基于多級圖像的二值圖像,并從二值圖像中提取字符部分,當(dāng)創(chuàng)建由白色像素取代了字符部分之外的像素的二值字符圖像,以及創(chuàng)建由背景顏色隱藏了多級圖像中的字符部分的像素的無字符多級圖像時,創(chuàng)建了二值字符圖像的每個字符部分的顏色信息。
此外,對多級圖像以及二值字符圖像的至少一個執(zhí)行字符識別處理,并獲取字符代碼。以及分別對二值字符圖像的每個字符部分的顏色信息,無字符的多級圖像,以及二值字符圖像進(jìn)行編碼,并與字符代碼一起合并到組合文件中。
即使在存在字符部分的時候,也無需大大降低作為處理對象圖像的多級圖像的質(zhì)量,便可以實現(xiàn)文件尺寸的急劇減小,也可以保護(hù)字符部分的像素的可見度。
由于可以基于字符代碼進(jìn)行搜索,可以創(chuàng)建能夠搜索并保持圖像質(zhì)量的高度壓縮數(shù)據(jù)。
圖20-圖30的上述實施例提供了一種圖像處理設(shè)備,其包括多級圖像獲取單元,獲取作為處理對象圖像的多級圖像;二值圖像獲取單元,獲取基于多級圖像創(chuàng)建的二值圖像;二值字符圖像創(chuàng)建單元,創(chuàng)建將從二值圖像中提取的字符區(qū)域以外的像素改變?yōu)榘咨袼氐亩底址麍D像;無字符多級圖像創(chuàng)建單元,創(chuàng)建用背景顏色改變多級圖像中的字符區(qū)域的像素的無字符多級圖像;顏色確定單元,確定字符區(qū)域的像素的顏色;基于顏色的字符圖像創(chuàng)建單元,分別對每種確定的顏色創(chuàng)建二值字符圖像;字符識別單元,對多級圖像以及確定顏色的二值字符圖像中至少一個執(zhí)行字符識別處理,以獲得字符代碼;以及組合文件創(chuàng)建單元,用于分別對字符代碼、無字符多級圖像、以及確定顏色的二值字符圖像中的每個執(zhí)行壓縮編碼,并創(chuàng)建合并了該編碼圖像的組合文件。
根據(jù)本發(fā)明,獲取作為處理對象圖像的多級圖像及基于多級圖像創(chuàng)建的二值圖像,從二值圖像中提取字符部分,創(chuàng)建將字符區(qū)域以外的像素改變?yōu)榘咨袼氐亩底址麍D像,創(chuàng)建用背景顏色改變多級圖像中的字符區(qū)域的像素的無字符多級圖像,創(chuàng)建包括構(gòu)成字符區(qū)域的顏色的二值祖父圖像。另外,至少對具有包括確定為多級圖像的每種顏色的二值字符圖像的一方執(zhí)行字符識別處理,并獲得字符代碼。并通過分別對包括每種顏色的二值字符圖像和無字符多級圖像進(jìn)行編碼,使得創(chuàng)建具有字符代碼的組合文件。有可能在不極大地減小用作處理對象圖像的多級圖像的圖像質(zhì)量的情況下實現(xiàn)文件尺寸的極大減小,甚至當(dāng)存在字符部分時也可以保證字符部分的像素的可見度。
圖20-圖30的上述實施例提供了一種圖像處理設(shè)備,其包括多級圖像獲取單元,獲取作為處理對象圖像的多級圖像;二值圖像獲取單元,獲取基于多級圖像創(chuàng)建的二值圖像;二值字符圖像創(chuàng)建單元,創(chuàng)建將從二值圖像中提取的字符區(qū)域以外的像素改變?yōu)榘咨袼氐亩底址麍D像;無字符多級圖像創(chuàng)建單元,創(chuàng)建用背景顏色改變多級圖像中的字符區(qū)域的像素的無字符多級圖像;字符顏色數(shù)據(jù)創(chuàng)建單元,創(chuàng)建字符區(qū)域的像素的顏色數(shù)據(jù);字符識別單元,對多級圖像以及確定顏色的二值字符圖像中至少一個執(zhí)行字符識別處理,以獲得字符代碼;以及組合文件創(chuàng)建單元,用于分別對字符代碼、無字符多級圖像、以及確定顏色的二值字符圖像中的每個執(zhí)行壓縮編碼,并創(chuàng)建合并了該編碼圖像的組合文件。
上述圖像處理設(shè)備可以被配置為使得將字符代碼以透明文本的形式嵌入與圖像不同的層中。
上述圖像處理設(shè)備可以被配置為使得根據(jù)字符代碼的位置坐標(biāo)將字符代碼以透明文本的形式嵌入與圖像不同的層中。
圖20-圖30的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟獲取作為處理對象圖像的多級圖像;獲取在多級圖像的基礎(chǔ)上創(chuàng)建的二值圖像;創(chuàng)建將從二值圖像中提取的字符區(qū)域以外的像素改變?yōu)榘咨袼氐亩底址麍D像;創(chuàng)建用背景顏色改變多級圖像中的字符區(qū)域的像素的無字符多級圖像;確定字符區(qū)域的像素的顏色;分別對每種確定的顏色創(chuàng)建二值字符圖像;對多級圖像以及確定顏色的二值字符圖像中至少一個執(zhí)行字符識別處理,以獲得字符代碼;以及用于分別對字符代碼、無字符多級圖像、以及確定顏色的二值字符圖像中的每一個執(zhí)行壓縮編碼,并創(chuàng)建合并了該編碼圖像的組合文件。
圖20-圖30的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟獲取作為處理對象圖像的多級圖像;獲取在多級圖像的基礎(chǔ)上創(chuàng)建的二值圖像;創(chuàng)建將從二值圖像中提取的字符區(qū)域以外的像素改變?yōu)榘咨袼氐亩底址麍D像;創(chuàng)建用背景顏色改變多級圖像中的字符區(qū)域的像素的無字符多級圖像;創(chuàng)建字符區(qū)域的像素的顏色數(shù)據(jù);對多級圖像以及確定顏色的二值字符圖像中至少一個執(zhí)行字符識別處理,以獲得字符代碼;以及分別對顏色數(shù)據(jù)、字符代碼、無字符多級圖像、以及確定顏色的二值字符圖像中的每一個執(zhí)行壓縮編碼,并創(chuàng)建合并了該編碼圖像的組合文件。
上述計算機(jī)程序產(chǎn)品可以被配置為使得將字符代碼以透明文本的形式嵌入與圖像不同的層中。
上述計算機(jī)程序產(chǎn)品可以被配置為使得根據(jù)字符代碼的位置坐標(biāo)將字符代碼以透明文本的形式嵌入與圖像不同的層中。
圖20-圖30的上述實施例提供了一種計算機(jī)可讀存儲介質(zhì),其中存儲了能夠使計算機(jī)執(zhí)行圖像處理方法的程序,該圖像處理方法包括獲取作為處理對象圖像的多級圖像;獲取在多級圖像的基礎(chǔ)上創(chuàng)建的二值圖像;創(chuàng)建將從二值圖像中提取的字符區(qū)域以外的像素改變?yōu)榘咨袼氐亩底址麍D像;創(chuàng)建用背景顏色改變多級圖像中的字符區(qū)域的像素的無字符多級圖像;確定字符區(qū)域的像素的顏色;分別對每種確定的顏色創(chuàng)建二值字符圖像;對多級圖像以及確定顏色的二值字符圖像中至少一個執(zhí)行字符識別處理,以獲得字符代碼;以及分別對字符代碼、無字符多級圖像、以及確定顏色的二值字符圖像中的每一個執(zhí)行壓縮編碼,并創(chuàng)建合并了該編碼圖像的組合文件。
接下來,根據(jù)圖31和圖32描述本發(fā)明的另一個優(yōu)選實施例。
圖31示出了本實施例涉及的圖像處理方法的處理過程,圖32示出了圖31中的線條提取處理(S303)的詳細(xì)流程。此外,圖33示出了本實施例涉及的圖像處理設(shè)備的組成。
在圖33的圖像處理設(shè)備中,多級圖像輸入單元301是獲取并存儲處理對象的原始圖像的設(shè)備(可通過輸出彩色圖像數(shù)據(jù)的文檔讀取設(shè)備進(jìn)行操作,如掃描儀和圖像拾取設(shè)備),將由多級圖像輸入單元301獲取的原始多級圖像數(shù)據(jù)發(fā)送給二值化單元303、連通分量創(chuàng)建單元307、代表顏色確定單元309、以及字符線條確定單元313。
此外,雖然陰影圖像作為多級圖像是足夠的,但將給出假設(shè)多級圖像作為彩色圖像的解釋說明。
二值化單元303將彩色圖像(R,G,B)數(shù)據(jù)改變?yōu)槎祷瘮?shù)據(jù),并將結(jié)果二值圖像數(shù)據(jù)輸出給游程(run)創(chuàng)建單元305。此外,可以使用不同的方法來實現(xiàn)執(zhí)行彩色圖像(RGB)數(shù)據(jù)的二值化的單元,舉例來說,可使用如對G顏色數(shù)據(jù)進(jìn)行預(yù)定閾值處理這樣的處理,并不限于特定的方法。
游程創(chuàng)建單元305是從二值化圖像中創(chuàng)建像素游程、并將從黑色像素中創(chuàng)建的游程發(fā)送給連通分量創(chuàng)建單元307的設(shè)備。連通分量創(chuàng)建單元307是從像素游程創(chuàng)建連通分量、并將結(jié)果連通分量發(fā)送給代表顏色確定單元309以及外接矩形組合單元311的設(shè)備。
代表顏色確定單元309獲取原始處理對象多級圖像的像素值(R,G,B),該像素相應(yīng)于構(gòu)成由連通分量創(chuàng)建單元305獲得的連通分量的像素,以及基于所獲取的像素值確定代表每個連通分量的連通分量的像素值,并將確定的代表像素值發(fā)送給外接矩形組合單元311以及字符線條確定單元313。
外接矩形組合單元311將連通分量創(chuàng)建單元307創(chuàng)建的連通分量的外接矩形整合為一體,并將其發(fā)送給字符線條確定單元313。
字符線條確定單元313確定由外接矩形組合單元311整合的外接矩形(字符線條候選者)的線條相似率,將斷定具有較低的線條相似率的字符線條刪除,并將獲得的正確的字符線條發(fā)送給字符區(qū)域輸出單元315。
字符區(qū)域輸出單元315是輸出斷定為字符線條的坐標(biāo)的輸出設(shè)備。
接下來,將根據(jù)圖31和圖32的流程圖解釋說明本實施例所涉及的圖像處理方法。
此外,以下的說明也作為上述圖像處理設(shè)備(圖33)的操作說明。
根據(jù)圖31的流程圖,首先通過多級圖像輸入單元301獲取用于處理的文檔作為原始圖像(彩色圖像)(步驟S301)。
所獲取的彩色圖像采用每個R,G,B像素數(shù)據(jù)的形式,其中R,G,B數(shù)據(jù)通過圖像傳感器以主掃描以及次掃描方法檢測。
隨后,通過二值化單元303獲取作為處理對象的彩色圖像(多值)的二值化圖像(步驟S302)。
該二值化方法設(shè)置固定閾值,并將像素值(例如,G顏色的像素數(shù)據(jù))與該閾值相比較,可采用如下的方法來實現(xiàn),如將亮于該閾值的像素改變?yōu)榘咨?,并將暗像素改變?yōu)楹谏?br> 雖然,基于所獲取的黑色像素數(shù)據(jù)進(jìn)行后續(xù)字符線條的提取處理,但即使實現(xiàn)用作處理對象的彩色(多值)圖像的二值化,并首先采用這一過程,關(guān)于幾乎所有字符生成(在以下提及的實施例中,示出與白色字符的對應(yīng)關(guān)系)在提取中接收例外刪除的白色字符,在提取中也幾乎不存在引起刪除的可能性。
下面參照圖32的流程圖解釋說明字符線條的提取。
首先,基于二值圖像數(shù)據(jù)獲取黑色像素的連通分量(步驟S311)。該處理創(chuàng)建了黑色像素列表,游程創(chuàng)建單元305基于二值圖像數(shù)據(jù)將列表中黑色像素水平連接,形成黑色像素游程。此外,概念“游程”表示當(dāng)連續(xù)像素數(shù)據(jù)具有相同值時的連續(xù)像素陣列。
在通過傳真等處理的二值圖像中,通過考慮將在一維方向上延伸的白色像素或黑色像素的塊作為“游程”來作為編碼的單元的例子是公知的。
連通分量創(chuàng)建單元307,對于創(chuàng)建的在水平方向并列的黑色像素的游程,將通過把在垂直方向鄰接的像素放入行中而創(chuàng)建的組作為連通分量來創(chuàng)建。因此,將提取構(gòu)成字符的像素陣列作為連通分量。
接下來,代表顏色確定單元309確定每個連通分量的代表顏色。獲取相應(yīng)于構(gòu)成連通分量的黑色像素的原始處理對象多值(彩色)圖像的像素值(相應(yīng)于黑色像素的位置的R,G,B3成分的像素數(shù)據(jù))(步驟S312)。
根據(jù)連通分量的代表顏色的定義,基于所獲取的像素值確定每個連通分量的代表顏色數(shù)據(jù)(步驟S313)。
此時,連通分量的代表顏色定義為構(gòu)成連通分量的所有像素的顏色像素數(shù)據(jù)的平均值,根據(jù)這種定義計算連通分量一種代表顏色,并確定一個連通分量的一種代表顏色。
因此,在以后的部分中,當(dāng)連通分量作為線條候選者進(jìn)行結(jié)合時,所確定的連通分量的代表顏色被用作組合條件,更進(jìn)一步,為了建立字符線條的相似率而使用該代表顏色。
接下來,通過外接矩形組合單元311進(jìn)行從連通分量中創(chuàng)建字符線條候選者的一系列處理。
由于本處理包含在前段描述的處理步驟獲得的連通分量中的字符的分量,因此要根據(jù)連通分量的字符線條候選者的結(jié)合(unifying)條件來判斷連通分量能否合并,并創(chuàng)建字符線條候選者的矩形部分。分別地,將距離接近連通分量之間的關(guān)系,并假設(shè)該顏色與組合條件相同。
作為處理的過程,如圖32的流程圖所示,選擇一個連通分量并將其記為線條候選者的第一階段(步驟S314),取出另一個連通分量作為組合的首個線條候選者(步驟S315),并確定它們是否都滿足組合條件。
這里,針對它們是否是連通分量、它們是否靠近、以及不是的情況來發(fā)現(xiàn)連通分量的外接矩形(定義外接于連通分量的矩形,并且最后以線條開始的區(qū)域也表示在該外接矩形的區(qū)域中)之間的距離,如果通過對發(fā)現(xiàn)的距離執(zhí)行閾值處理來斷定不遠(yuǎn),將可以實現(xiàn)合并(步驟316-是)。
而且,通過比較在上述步驟S313中決定的各個連接分量的代表顏色數(shù)據(jù)并對求出的比較值進(jìn)行閾值處理,判斷連接分量之間的顏色是否相似。如果顏色相似,則可以組合(步驟S317為“是”)。
響應(yīng)上述判斷連通分量是否能合并的結(jié)果,外接矩形組合單元311為線條候選者進(jìn)行連通分量的組合(步驟S318)。
由于根據(jù)與連通分量合并的線條候選者構(gòu)成了如圖36示出的為線條候選者進(jìn)行連通分量的合并的處理情形中的連通分量的外接矩形(用虛線表示)區(qū)域,并在該圖中示出了,將通過增加的連通分量的矩形部分把存在范圍擴(kuò)展到目標(biāo)線條候選者。
此外,由于線條候選者根據(jù)組合結(jié)果而改變,所以需要在線條候選者的外接矩形中以及用上述判斷組合條件的步驟S316和S317中提到的代表顏色來反映組合的結(jié)果,盡管對比度判斷是在帶有線條候選者的連通分量之間進(jìn)行的。
也就是說,由于線條候選者由兩個或多個連通分量組成,構(gòu)成連通分量的外接矩形的位置以及構(gòu)成連通分量的顏色的平均值確定了線條候選者的顏色。
由于對文檔頁的每個預(yù)定處理區(qū)域進(jìn)行了為線條候選者合并連通分量的處理,檢驗了應(yīng)核對組合條件的連通分量沒有保留在處理區(qū)域中(步驟S319-是)。
此外,由于對文檔頁中的每個預(yù)定區(qū)域重復(fù)進(jìn)行上述步驟S314-319,檢驗了在第一階段不存在應(yīng)記錄到文檔頁中的連通分量存在的未處理的區(qū)域(步驟S320-是),并結(jié)束連通分量的組合處理。
此外,當(dāng)該未處理的連通分量位于處理區(qū)域中時,存在應(yīng)在第一階段記錄的連通分量存在的未處理的區(qū)域(步驟S319-否)(步驟S320-否),返回到每個處理循環(huán)的開始,并重復(fù)連通分量的組合處理。
如果確定實現(xiàn)上述分組(組合)的連通分量的外接矩形部分作為字符線條候選者,接下來,檢查在以前的步驟由字符線條確定單元313確定的線條候選者的字符線條的相似性,判斷出與字符線條完全不同的線條候選者,并執(zhí)行根據(jù)該結(jié)果刪除該線條候選者的處理。
在檢查字符線條相似性的過程中,計算示出字符線條相似性的字符線條的特征量,特征量被看作是線條相似率,并且根據(jù)該線條相似率判斷應(yīng)刪除的線條候選者。
在本實施例中,如下所示,計算特征的四個量,并從結(jié)果中創(chuàng)建線條相似率。
作為特征量1,計算線條候選者的縱橫比(步驟S321)。這里,作為分組(組合)的連接分量的外接矩形區(qū)域來求線條候選者,因而越細(xì)長則認(rèn)為越像線條,所以將其作為用于判斷線條相似率的特征量。
作為特征量2,對構(gòu)成線條候選者的連通分量進(jìn)行計數(shù)(步驟S322)。如果不是太少的連通分量存在于線條中,由于這將很難從表面上說它就是線條,因此它被用作線條相似率判斷的特征量。
作為特征量3,對線條候選者周圍的黑色像素進(jìn)行計數(shù)(步驟S323)。
圖37示出了對線條候選者進(jìn)行組合處理的情形,圖37中的(A)示出了照片圖像的例子以及圖37中的(B)示出了字符圖像的例子。如圖37的(A)和(B)所示,分別提取由虛線圍繞的線條候選者,作為原始圖像的處理結(jié)果。
對于字符圖像,由白色像素圍繞線條候選者的四周,并且(A)具有大量白色像素以及作為字符線條的特征。
另一方面,(B)是照片圖像,并且是從照片圖像中提取一部分作為線條候選者的例子,在這種情況下存在加入線條中的連通分量的可能性較高,線條候選者的周圍具有相對較多的黑色像素,并且不具有作為字符線條的特征。
因此,將(B)的照片圖像中完全不像字符線條的線條候選者作為刪除的對象是合適的,并且將線條候選者四周的黑色像素的數(shù)量用作判斷線條相似率的特征量。
然而,由于長線條具有大量分開的圍地(enclosure)中的像素,需要將怎樣取出這些特征量中的長度或邊界長度進(jìn)行標(biāo)準(zhǔn)化。
作為特征量4,創(chuàng)建線條候選者的顏色與周圍顏色的差別(步驟S324)。(R1,G1,B1),以及為線條候選者的顏色(可以使用在上述步驟S313確定的連通分量的代表顏色數(shù)據(jù))獲取周圍像素的平均顏色為(R2,G2,B-2),它就是與周圍的色差D。
色差D使用下述公式計算D=|R1-R2|+|G1-G2|+|B1-B2|。由于通常字符是與背景不同的顏色而更具可讀性,因此,與四周的色差一般趨向于很大。
因此,小的線條候選者適于作為刪除的對象,并且將色差D考慮作為使用色差D判斷線條相似率的特征量。
在計算了特征量1至4之后,基于所計算的特征量1至4計算表示字符線條相似性的線條相似率(步驟S315)。假設(shè)用F表示線條相似率,F(xiàn)i表示特征量i的值,以及Wi表示與每個特征量i的值相乘的系數(shù)。
使用下述公式計算線條相似率FF=SUM(Fi*Wi)(其中,i=1-4,SUM表示求和函數(shù))。
示出了對每個特征量Fi的線條相似率的權(quán)(貢獻(xiàn)程度)的權(quán)值Wi定義了可以提前繪制實驗的正確結(jié)果的合適的系數(shù)。
隨后,通過與預(yù)先定義的、根據(jù)所計算的線條相似率對保留或是刪除線條候選者進(jìn)行限制的閾值進(jìn)行比較,畫出字符線條判斷的最終結(jié)果(步驟S326)。
此處,當(dāng)計算的線條相似率大于閾值時,判定為字符線條。否則,判斷為不是字符線條。
根據(jù)上述獲得的字符線條判斷的最終結(jié)果,從提取的線條候選者中刪除沒有判斷為字符線條的候選者的線條數(shù)據(jù)(步驟S327)。
此外,例如當(dāng)計算了某個特征量,例如該值與適合該線條的值相差很遠(yuǎn)時,以及盡管在計算了所有特征量之后綜合地尋找線條相似物,當(dāng)清楚地斷定不是線條時,刪除相關(guān)的線條候選者。
該處理判斷線條候選者的字符線條相似性并根據(jù)結(jié)果刪除線條候選者。由于對每個線條候選者都進(jìn)行該處理,當(dāng)檢查出完成對所有應(yīng)被檢查的線條候選者的判斷時(步驟S328),不存在沒有被判斷的線條候選者。
由于重復(fù)進(jìn)行上述步驟S321-S327,檢查出不存在未處理的線條候選者(步驟S328-是),并且結(jié)束字符線條的判斷處理。
由于可刪除被認(rèn)為是錯誤提取的線條并可從獲取的字符線條數(shù)據(jù)中提取適當(dāng)?shù)淖址€條數(shù)據(jù),其中該錯誤提取可能是由進(jìn)行上述圖31的線條提取處理的過程中(步驟S303,也就是圖32的流程)的線條候選者產(chǎn)生的,字符區(qū)域輸出單元315將相應(yīng)的線條區(qū)域坐標(biāo)值作為處理結(jié)果輸出(S304),并結(jié)束該處理流程。
接下來的實施例給出了對上述實施例的改進(jìn),其中增加了對上述實施例中產(chǎn)生的白色字符的提取中的失去遺漏的改進(jìn)。
如上述實施例所描述的,實現(xiàn)了作為處理對象的彩色(多值)圖像的二值化,雖然在基于所獲取的黑色像素數(shù)據(jù)的基礎(chǔ)上執(zhí)行字符線條提取處理時,在提取中遺漏幾乎所有的字符的可能性很小,但在對白色字符的遺漏卻例外地提高了。
為了改善這一點,在本實施例中,對二值化圖像進(jìn)行線條提取處理以反轉(zhuǎn)二值化圖像并進(jìn)行反轉(zhuǎn),并結(jié)合使用未反轉(zhuǎn)的提取處理。
此外,通過增加提取在分別基于反轉(zhuǎn)的以及未反轉(zhuǎn)的二值化圖像確定的線條候選者之間交迭的線條候選者的處理來阻止錯誤提取,并刪除交迭的線條候選者之一。
盡管是二值圖像反轉(zhuǎn)處理步驟、反轉(zhuǎn)圖像的線條提取處理步驟以及重復(fù)線條的排除處理步驟,如果新需要的用于實現(xiàn)上述改善的單元位于該設(shè)備中,則在圖像反轉(zhuǎn)單元中,重復(fù)區(qū)域排除單元以及該方法都依賴于所增加的組成部分以及在上述實施例中另外使用的除該組成部分以外的元素。
圖34示出了本實施例涉及的圖像處理方法的處理流程,并在之前的圖32中示出了圖34中線條提取處理(S303,S305)的詳細(xì)流程。
此外,圖35示出了本實施例涉及的圖像處理設(shè)備的組成。
下面參照圖35解釋說明本實施例的圖像處理設(shè)備。
此外,由于上述優(yōu)選實施例的重復(fù)說明,建議上述說明只涉及本實施例中除圖像反轉(zhuǎn)單元以外新增的組成部分,以及重復(fù)區(qū)域排除單元,并省略已說明的部分。
圖像反轉(zhuǎn)單元304是用于將二值化單元303改變的二值圖像數(shù)據(jù)的黑色和白色進(jìn)行反轉(zhuǎn),并將反轉(zhuǎn)的圖像數(shù)據(jù)輸出給游程創(chuàng)建單元305的設(shè)備。
重復(fù)區(qū)域排除單元314響應(yīng)由字符線條確定單元313獲得的反轉(zhuǎn)及非反轉(zhuǎn)圖像的兩種線條候選者提取結(jié)果,將線條候選者中交迭的線條候選者中的一條削除,并將結(jié)果發(fā)送給字符區(qū)域輸出單元315。
接下來,將參照圖34的流程圖解釋說明本實施例涉及的圖像處理方法。
此外,以下的說明還作為對上述圖像處理設(shè)備(圖35)的圖像反轉(zhuǎn)單元304以及重復(fù)區(qū)域排除單元314的操作說明。
根據(jù)圖34的流程圖,首先通過多級圖像輸入單元301獲取將被處理的文檔作為原始圖像(彩色圖像)(步驟S331)。
這里所獲取的彩色圖像是采用由圖像傳感器用主掃描及次掃描方法檢測的每個R,G,B像素數(shù)據(jù)的形式。
隨后,通過二值化單元303為用作處理對象的彩色(多值)圖像獲取二值化圖像(步驟S332)。
該二值化方法設(shè)置固定閾值,并將像素值(例如,G顏色的像素數(shù)據(jù))與該閾值相比較,可采用如下的方法來實現(xiàn),如將亮于該閾值的像素改變?yōu)榘咨迪袼馗淖優(yōu)楹谏?br> 因此,實現(xiàn)了用作處理對象的彩色(多值)圖像的二值化,并基于所獲取的黑色像素數(shù)據(jù)進(jìn)行字符線條的提取處理(步驟S333)。
根據(jù)上述實施例中示出的圖32的流程圖執(zhí)行字符線條的提取。
接下來,當(dāng)原始圖像中包含白色字符時,為了在提取中防止疏漏,通過圖像反轉(zhuǎn)單元304反轉(zhuǎn)由步驟S332的二值化處理所獲得的二值圖像數(shù)據(jù)(步驟S334)。
通過使用已知的方法可以實現(xiàn)單色反轉(zhuǎn)處理。
基于反轉(zhuǎn)了黑色和白色的二值圖像數(shù)據(jù)進(jìn)行字符線條的提取處理(步驟S333)。
根據(jù)上述圖32的流程圖執(zhí)行字符線條的提取(步驟S335)。當(dāng)分別在步驟S333和S335執(zhí)行對非反轉(zhuǎn)圖像以及反轉(zhuǎn)圖像兩種圖像分別進(jìn)行線條候選者提取,并且提取出在反轉(zhuǎn)圖像與非反轉(zhuǎn)圖像之間的交迭位置時,重復(fù)區(qū)域排除單元314確定一個作為正確答案以及另一個作為錯誤的,由此使得實現(xiàn)消除一個的處理,直到獲得沒有重復(fù)的提取結(jié)果為止。
例如,如圖38所示,當(dāng)把‘Mr.Tanaka”制成處理對象圖像(A)進(jìn)行常規(guī)處理(非反轉(zhuǎn)的)時,字符線條區(qū)域轉(zhuǎn)換成圖(A’)中的由虛線圍繞的區(qū)域,并獲得(A”)的數(shù)據(jù)作為提取線條候選者。
另一方面,如果反轉(zhuǎn)了二值圖像,構(gòu)成字符的白色像素的連通分量將轉(zhuǎn)換為黑色像素,作為反轉(zhuǎn)圖像(B),并將被提取作為線條。也就是說,如果是字符“田(ricefield)”,原始圖像的四個小的白色交叉線構(gòu)成了反轉(zhuǎn)的圖像(B)。
因此,字符線條區(qū)域可以轉(zhuǎn)換成圖(B’)中由虛線圍繞的區(qū)域,并可以提取(B”)作為線條候選者。
如圖38的例子所示,由于從反轉(zhuǎn)圖像(B)中提取的線條候選者(B”)是錯的,并且顯露出來,因此在這種情況下需要留下非反轉(zhuǎn)圖像的線條候選者(A”),并需要刪除反轉(zhuǎn)圖像的線條候選者(B”)。
作為這種情況下的刪除條件,如圖38所示,由于被刪除的反轉(zhuǎn)圖像的線條候選者(B”)比非反轉(zhuǎn)圖像的線條候選者(A”)的尺寸小,因此可以根據(jù)這種特性定義該條件。
因此,可以通過比較兩者的線條尺寸并刪除較小的一個來去除錯誤數(shù)據(jù)。此外,上述實施例給出了通過比較來實現(xiàn)線條相似率的計算以及可以刪除完全不像線條的指示,并且即使將它們一起使用也是沒問題的。
在圖34的流程所示的重復(fù)線條的排除處理步驟中提取應(yīng)用排除處理的對象線條(步驟S336)。也就是說,通過對反轉(zhuǎn)和非反轉(zhuǎn)兩種圖像進(jìn)行線條提取來提取在步驟S333和S335中獲得的線條候選者中位置交迭的線條候選者。
隨后,比較所提取的重復(fù)線條候選者的線條尺寸,并將具有小尺寸的指示的線條候選者刪除(步驟S337)。由于一次執(zhí)行只能提取一組重復(fù)線條,因此重復(fù)執(zhí)行步驟S336-S338的排除處理步驟直到去除交迭線條(步驟S338-是)。
因此,由于可以刪除被認(rèn)為可能是為線條候選者產(chǎn)生的錯誤提取的線條,并在對非反轉(zhuǎn)圖像進(jìn)行反轉(zhuǎn)及線條提取時可以從獲取的字符線條數(shù)據(jù)中提取正確的字符線條數(shù)據(jù),因此字符區(qū)域輸出單元315將相應(yīng)的線條區(qū)域的坐標(biāo)值作為處理結(jié)果輸出(步驟S339),并結(jié)束該處理流程。
接下來的實施例給出了使用通用處理器(計算機(jī))作為圖像處理設(shè)備來執(zhí)行圖像處理方法的各個步驟以及執(zhí)行上述實施例所示的字符區(qū)域提取。
圖39示出了本實施例的處理器的組成。如圖39所示,本實施例示出了使用的通用處理器(計算機(jī)),其包括CPU341,存儲器342,硬盤驅(qū)動器343,輸入設(shè)備344(鼠標(biāo)等),CD-ROM驅(qū)動器345,以及顯示器346作為其組成部件。
此外,將使計算機(jī)執(zhí)行本實施例的字符區(qū)域(字符線條)提取處理流程的程序(軟件)記錄在記錄介質(zhì)347上,如與CD-ROM驅(qū)動器345結(jié)合使用的CD-ROM。
將例如存儲在硬盤驅(qū)動器343中的處理對象的彩色(多值)圖像通過輸入設(shè)備344進(jìn)行輸入,如掃描儀。
CPU341從記錄介質(zhì)347讀取用于實現(xiàn)上述字符區(qū)域提取處理的流程的程序,根據(jù)該程序執(zhí)行彩色(多值)圖像的字符區(qū)域提取處理,并由于在字符圖像處理步驟中需要使用作為提取結(jié)果而得到的字符區(qū)域數(shù)據(jù)而進(jìn)行輸出,如字符識別處理。
因此,通過根據(jù)用于執(zhí)行字符區(qū)域提取處理的程序進(jìn)行操作,該計算機(jī)被用作本發(fā)明的圖像處理設(shè)備。
圖31-圖39的上述實施例提供了一種圖像處理設(shè)備,包括二值圖像創(chuàng)建單元,通過對作為處理對象圖像的多級圖像進(jìn)行二值化來創(chuàng)建二值圖像;連通分量創(chuàng)建單元,獲取二值圖像中每一個具有黑色像素游程的連通分量;距離確定單元,分別確定連通分量之間的水平距離和垂直距離;線條候選者單元,將水平距離和垂直距離小于預(yù)定閾值的連通分量合并成線條候選者之一;特征量計算單元,分別基于每個線條候選者,計算代表多級圖像中相應(yīng)線條的特征的特征量;以及線條候選者刪除單元,如果基于相關(guān)線條候選者的特征值的線條相似率小于給定值,刪除線條候選者中的一個。
根據(jù)本發(fā)明,對處理對象的多級圖像進(jìn)行二值化,根據(jù)二值圖像獲取像素游程和連通分量,整合字符線條候選者,有可能通過短的處理時間來創(chuàng)建字符線條候選者,并且其后將字符線條候選者作為示出該線條的特征的值。通過檢查連通分類的數(shù)目、線條候選者周圍的灰色像素的數(shù)目、以及線條候選者的代表像素值和構(gòu)成線條候選者的縱橫比的線條候選者周圍和線條候選者的比較結(jié)果,可以快速地執(zhí)行字符線條的日志處理,而較少地發(fā)生錯誤,并刪除不合適字符線條。
上述圖像處理設(shè)備可以被配置為使得圖像處理設(shè)備還包括分別獲取相應(yīng)于多級圖像中構(gòu)成每個連通分量的像素的像素值的單元;基于所獲取的像素值,確定表示連通分量的像素值的代表像素值的單元;以及基于所獲取的像素值,確定表示線條候選者的像素值的代表像素值的單元。
上述圖像處理設(shè)備可以被配置為使得線條候選者單元包含色差計算單元,用于計算連通分量的代表像素值和線條候選者的代表像素值之間的差值;以及提供線條候選者單元,用于當(dāng)所計算的差值小于預(yù)定閾值時,將連通分量合并到一條線條候選者。
上述圖像處理設(shè)備可以被配置為使得特征量計算單元包括以下單元的至少一個縱橫比計算單元,用于計算相關(guān)線條候選者的縱橫比;連通分量數(shù)量計算單元,用于計算構(gòu)成一條線條候選者的連通分量的數(shù)量;以及黑色像素數(shù)量計算單元,用于計算一條線條候選者周圍的黑色像素的數(shù)量。
上述圖像處理設(shè)備可以被配置為使得特征量計算單元包括獲取多級圖像中位于相應(yīng)于一個線條候選者的像素周圍的像素的像素值的單元;基于所獲取的像素值,確定表示一條線條候選者周圍的像素的像素值的代表像素值的單元;以及將表示一條線條候選者周圍的像素的像素值的代表像素值與表示線條候選者的像素值的代表像素值進(jìn)行比較的單元。
上述圖像處理設(shè)備可以被配置為使得圖像處理設(shè)備還包括二值圖像反轉(zhuǎn)單元,用于將來自二值圖像創(chuàng)建單元的二值圖像進(jìn)行反轉(zhuǎn)。
上述圖像處理設(shè)備可以被配置為使得圖像處理設(shè)備包括下述單元中的至少一個提取在基于非反轉(zhuǎn)二值圖像創(chuàng)建的線條候選者和基于反轉(zhuǎn)二值圖像創(chuàng)建的線條候選者之間交迭的線條候選者的單元,刪除具有較小尺寸的交迭線條候選者的單元,以及將交迭線條候選者的特征量進(jìn)行比較并且刪除具有較小的線條相似率的交迭線條候選者的單元。
圖31-圖39的上述實施例提供了一種圖像處理方法,包括以下步驟通過對作為處理對象圖像的多級圖像進(jìn)行二值化創(chuàng)建二值圖像;獲取二值圖像中每一個具有黑色像素游程的連通分量;分別確定連通分量之間的水平距離和垂直距離;將水平距離和垂直距離小于預(yù)定閾值的連通分量合并成一條線條候選者;分別基于每條線條候選者,計算代表多級圖像中相應(yīng)線條的特征的特征量;以及如果基于相關(guān)線條候選者的特征值的線條相似率小于給定值,刪除線條候選者中的一個。
上述圖像處理方法可以被配置為使得圖像處理方法還包括以下步驟分別獲取相應(yīng)于多級圖像中構(gòu)成每個連通分量的像素的像素值;基于所獲取的像素值,確定表示連通分量的像素值的代表像素值;以及基于所獲取的像素值,確定表示線條候選者的像素值的代表像素值。
上述圖像處理方法可以被配置為使得組合步驟包括計算連通分量的代表像素值和線條候選者的代表像素值之間的差值,以及當(dāng)所計算的差值小于預(yù)定閾值時,將連通分量合并到一條線條候選者中。
上述圖像處理方法可以被配置為使得特征量計算步驟包括至少以下步驟之一,計算相關(guān)線條候選者的縱橫比;計算構(gòu)成一條線條候選者的連通分量的數(shù)量;以及計算一條線條候選者周圍的黑色像素的數(shù)量。
上述圖像處理方法可以被配置為使得特征量計算步驟包括獲取多級圖像中位于相應(yīng)于一條線條候選者的像素周圍的像素的像素值;基于所獲取的像素值,確定表示一條線條候選者周圍的像素的像素值的代表像素值;以及將表示一條線條候選者周圍的像素的像素值的代表像素值與表示線條候選者的像素值的代表像素值進(jìn)行比較。
上述圖像處理方法可以被配置為使得圖像處理方法還包括將在二值圖像創(chuàng)建步驟中創(chuàng)建的二值圖像進(jìn)行反轉(zhuǎn)的步驟,以及獲取二值圖像中每一個具有黑色像素游程的連通分量以及獲取反轉(zhuǎn)二值圖像中每一個具有黑色像素游程的連通分量的連通分量獲取步驟。
上述圖像處理方法可以被配置為使得圖像處理方法至少包括下述步驟之一提取在基于非反轉(zhuǎn)二值圖像創(chuàng)建的線條候選者和基于反轉(zhuǎn)二值圖像創(chuàng)建的線條候選者之間交迭的線條候選者,刪除具有較小尺寸的交迭線條候選者中的一個,以及將交迭線條候選者的特征量進(jìn)行比較,并且刪除具有較小的線條相似率的交迭線條候選者中的一個。
圖31-圖39的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟通過對作為處理對象圖像的多級圖像進(jìn)行二值化處理創(chuàng)建二值圖像;獲取二值圖像中每一個具有黑色像素游程的連通分量;分別確定連通分量之間的水平距離和垂直距離;將水平距離和垂直距離小于預(yù)定閾值的連通分量合并成一條線條候選者;分別基于每條線條候選者,計算代表多級圖像中相應(yīng)線條的特征的特征量;以及如果基于相關(guān)線條候選者中的特征值的線條相似率小于給定值,刪除一條線條候選者。
圖40A和圖40B是本發(fā)明的優(yōu)選實施例中的文檔數(shù)據(jù)結(jié)構(gòu)的示意圖。
如圖40B所示,文檔數(shù)據(jù)DD由n個平面組成從圖40A的原始文檔100提取的平面-PLN(1)、平面-PLN(2)、以及平面-PLN(3)(本實施例中n=3),以及參考圖像REF。
如圖40A所示,原始文檔100包括8位彩色圖像101、藍(lán)色繪制的字符以及藍(lán)色橫紋繪制的字符102、以及紅色點狀背景103。
在本實施例中,如圖40B所示,根據(jù)由所涉及的圖像表示的對象,將在原始文檔100上顯示的圖像分割成平面-PLN(1)、平面-PLN(2)、以及平面-PLN(3),并提取。參考圖像REF包括每個像素的用于選擇PLN(1)、PLN(2)以及PLN(s)(3)之一的信息,作為m個色調(diào)級別的值A(chǔ)1,A2,和A3(本實施例中m=3)。例如,可以是A1“00”、A2“01”以及A3“10”。
在本實施中,通過8位彩色圖像以及適用于照片等的壓縮的方法來對平面PLN(1)進(jìn)行編碼。平面PLN(2)可以通過字符(由圖像或文本代碼表示的圖像)以及適用于字符壓縮的方法進(jìn)行編碼。平面PLN(3)可以通過示出背景的圖像以及適用于背景壓縮的方法進(jìn)行編碼。
舉例來說,當(dāng)參考圖像REF是單色圖像時,MMR壓縮等在壓縮率方面是令人滿意的。此外,由于平面PLN(1)是彩色圖像,諸如JPEG和JPEG2000之類的方法變得適用。
此外,由于平面PLN(2)是字符圖像,則認(rèn)為MMR壓縮是合意的。
圖41是示出了第一優(yōu)選實施例的文檔轉(zhuǎn)換設(shè)備的方塊圖,通過該文檔轉(zhuǎn)換設(shè)備可以創(chuàng)建圖40B所示結(jié)構(gòu)的文檔數(shù)據(jù)DD。
圖41中,文檔轉(zhuǎn)換設(shè)備11包括平面圖像提取單元411、參考圖像創(chuàng)建單元412、圖像處理單元413、編碼單元414、以及組合單元415。
平面圖像提取單元411可以根據(jù)編碼方法從原始文檔100中提取三頁(1)、PLN(2)以及PLN(3)中的平面PLN。在本實施例中,平面PLN(1)是彩色圖像。
此外,當(dāng)PLN(2)和PLN(3)上的對象的原始文檔100的顏色是單色時,PLN(2)和PLN(3)上的對象也可以制成單色,并可作為單色圖像。當(dāng)將PLN(2)和PLN(3)制成彩色圖像時,參考圖像REF是單色圖像。
另外,當(dāng)將PLN(2)和PLN(3)制成單色圖像時,將該單色定義成色調(diào)級別值A(chǔ)2和A3,該值選擇參考圖像REF的PLN(2),以及PLN(3)。
本實施例彩色照片等中的平面是通過PLN(1)提取的,字符平面是通過PLN(2)提取的,以及背景平面是通過PLN(3)提取的,由于對象的明顯區(qū)別(字符的提取,背景的提取)技術(shù)是公知技術(shù),因此不再給出說明。
參考圖像創(chuàng)建單元412可以創(chuàng)建參考圖像REF。
圖像操作單元413可以執(zhí)行圖像操作或圖像補(bǔ)償(分辨率轉(zhuǎn)換,濾波處理,亮度補(bǔ)償,色調(diào)補(bǔ)償,噪聲抑制)。通常,通過這種處理,在編碼的時候可壓縮性會變高。
例如,由于平面PLN(2)在恢復(fù)文件100’上只要知道字符的顏色就行,所以,在定義平面PLN(2)上的點間距的分辨率或?qū)ζ矫鍼LN(2)定義單色顏色的情況下,可降低色調(diào)的分辨率。由于平面PLN(2)的對象是字符,所以分辨率降低,辨認(rèn)性并不明顯降低。
此外,關(guān)于平面PLN(2),如果執(zhí)行字符識別處理,將獲得文本狀碼。如果這與最后創(chuàng)建并設(shè)置的一系列數(shù)據(jù)集合(通常數(shù)據(jù)集合中包括文本數(shù)據(jù))有關(guān),可以在恢復(fù)文檔100’中執(zhí)行文本代碼中的檢索。
另外,插入處理等可以執(zhí)行提高分辨率的圖像處理。雖然文件尺寸變大,但當(dāng)照片區(qū)域等重要時,其在圖像質(zhì)量中有了改善。
在本實施例中,盡管參考圖像REF沒有改變點的間距,但可以將它改變。
通過消除平面PLN(2)的連通分量以及參考圖像REF中的黑色像素的方法,可以實現(xiàn)噪聲抑制,并且可壓縮性將會提高。
另外,可根據(jù)文件被如何使用來適當(dāng)?shù)貨Q定各平面的加工處理。例如,在認(rèn)為照片重要的情況下,可不降低平面PLN(1)的分辨率,相反,在照片不那么重要的情況下,降低平面PLN(1)的分辨率,提高平面PLN(2)的分辨率就可以。由于它們是圖像質(zhì)量和最終信息的大小的折中,所以根據(jù)用途來決定。
編碼單元414是平面PLN(1)、PLN(2)、PLN(3),以及根據(jù)在原始文檔上的對象的類型,參考圖像REF可以使用該方法(該方法是對所涉及的對象進(jìn)行壓縮的適當(dāng)方法,每個平面各不相同)進(jìn)行編碼。
組合單元415可以將由編碼單元413編碼的參考圖像REF和n個平面PLN(1)、PLN(2)、以及PLN(3)合并在數(shù)據(jù)集合中。此外,例如在組合的時候,每個平面都具有包含在數(shù)據(jù)集合中的信息(例如,如照片、字符、以及背景這樣的位像的信息)的屬性,在之后描述的文檔恢復(fù)時,使用平面排除單元213為操作者排除不需要的平面。因此,只有某一特定平面也可以在圖像表達(dá)的情況下看見。因此,由于不需要的信息是不可視的,文檔變得容易辨認(rèn)。
另外,在數(shù)據(jù)通信期間,從數(shù)據(jù)集合中適當(dāng)?shù)厝コ吮徽J(rèn)為是不需要的平面,并減輕了傳送和接收的數(shù)據(jù)量(收發(fā)器的時間也因此縮短)。
圖42是示出了第一優(yōu)選實施例的文檔轉(zhuǎn)換方法的示意圖。可以通過使用圖41的文檔轉(zhuǎn)換設(shè)備11執(zhí)行該文檔轉(zhuǎn)換方法。
在圖42中,首先從原始文檔100中提取對應(yīng)于編碼方法的三個平面PLN(1)、PLN(2)、PLN(3)(平面提取步驟S411)。
在平面提取步驟S411中,將原始文檔上的對象分割成三層平面PLN(1)、PLN(2)以及PLN(3),并提取它們。
接著,將3個色調(diào)級別的值A(chǔ)1、A2、A3賦予各像素,根據(jù)3個色調(diào)級別的值,創(chuàng)建用于確定平面PLN(1)、PLN(2)、PLN(3)其中之一的參照圖像REF(參照圖像作成步驟S412)。
進(jìn)一步對三層平面PLN(1)、PLN(2)以及PLN(3)進(jìn)行圖像操作或圖像補(bǔ)償(分辨率轉(zhuǎn)換、濾波處理、亮度補(bǔ)償、色調(diào)補(bǔ)償、噪聲抑制)(圖像操作步驟S413)。
接著,對三層平面PLN(1)、PLN(2)、PLN(3)的平面PLN以及參考圖像REF進(jìn)行編碼(編碼步驟S414)。
在編碼步驟S414中,通過根據(jù)原始文檔100上的對象類型的方法對三層平面PLN(1)、PLN(2)、PLN(3)的平面PLN以及參考圖像REF進(jìn)行編碼。在本實施例中,分別通過不同的編碼方法對三層平面進(jìn)行編碼。
將在編碼步驟S414中編碼的參考圖像REF和三層平面PLN(1)、PLN(2)以及PLN(3)的平面PLN合并在數(shù)據(jù)集合中。
此外,將平面PLN(1)、PLN(2)以及PLN(3)所不涉及的區(qū)域中的像素值轉(zhuǎn)換成預(yù)定的像素值(如白色、黑色等)。因此,在這種情況下編碼可以提高壓縮率。
在圖像再現(xiàn)時僅參照平面PLN(1)的情況下,可利用周圍的像素將規(guī)定的像素值賦予平面PLN(1)上的參照圖像REF的字符所對應(yīng)的像素。在圖像再現(xiàn)時僅參照平面PLN(2)的情況下,可以將字符容易辨認(rèn)的顏色且壓縮效率不下降的像素值賦予平面PLN(2)上的參照圖像REF的字符以外的像素。
圖43示出了本發(fā)明的優(yōu)選實施例中的文檔恢復(fù)設(shè)備。
圖43中的文檔恢復(fù)設(shè)備21包括文檔分解/解碼單元211、色調(diào)級別值獲取單元212、平面排除單元213、平面指定單元214、以及文檔恢復(fù)單元215。在本實施例中,文檔恢復(fù)設(shè)備21可以獲取文檔數(shù)據(jù)DD,并可以從相關(guān)文檔數(shù)據(jù)中恢復(fù)原始文檔100。
文檔分解/解碼單元211可以對文檔數(shù)據(jù)DD執(zhí)行解碼處理,并可以創(chuàng)建三層平面PLN(1)、PLN(2)、PLN(3)以及參考圖像REF。
色調(diào)級別值獲取單元212可以獲取掃描參考圖像REF的像素的三種色調(diào)級別的值A(chǔ)1、A2、A3中的任何一種,并將它們賦予所掃描的像素。
平面排除單元213可以從三層平面PLN(1)、PLN(2)以及PLN(3)的平面PLN中的處理對象中移除一層或兩層平面。
不包含在由平面指定單元214指定的對象中,由平面排除單元213排除的平面可以僅顯示在再現(xiàn)圖像100’上的所需對象。
平面指定單元214可確定與3個色調(diào)級別的值A(chǔ)1、A2、A3的值對應(yīng)的平面PLN(1)、PLN(2)、PLN(3)。
文檔恢復(fù)單元215可以對應(yīng)于參考圖像REF的像素位置給出的像素,提取由平面指定單元214確定的平面上的值,并可以恢復(fù)文檔,以及可以獲得恢復(fù)文檔100’。
當(dāng)將單色定義為平面PLN(2)和PLN(3)上的對象,以及參考圖像的像素的色調(diào)級別值為A2或A3時,將平面PLN(2)和PLN(3)上定義的顏色反映到恢復(fù)文檔100’中。
此外,當(dāng)對應(yīng)于色調(diào)級別值A(chǔ)2和A3將單色定義為平面PLN(2)以及PLN(3),而不需要提前定義顏色時,將這些單色反映到恢復(fù)圖像中。
圖44示出了本發(fā)明優(yōu)選實施例中的文檔恢復(fù)方法。
可通過使用圖43中的文檔恢復(fù)設(shè)備21執(zhí)行該文檔恢復(fù)方法。
在圖44中,首先,將文檔數(shù)據(jù)DD分解成三層平面PLN(1)、PLN(2)、PLN(3)的平面PLN以及參考圖像REF,并對它們執(zhí)行解碼處理(文檔分解/解碼步驟S421)。
掃描參考圖像REF的像素,并獲取對每個像素給定的三種色調(diào)級別的值A(chǔ)1、A2、A3(色調(diào)級別值獲取步驟S422)。
排除作為預(yù)定對象的平面(平面排除步驟S423)。
確定相應(yīng)于三種色調(diào)級別的值A(chǔ)1、A2及A3的平面(平面指定步驟S424)。
提取賦予在平面指定步驟S424中確定的平面上的像素位置像素值,并創(chuàng)建恢復(fù)文檔100’(文檔恢復(fù)步驟S425)。
接下來,圖45A和45B示出了本發(fā)明的另一個優(yōu)選實施例中的文檔數(shù)據(jù)結(jié)構(gòu)。
在本實施例中,如圖45A所示,原始文檔200與在前實施例中的原始文檔100是相同的(參見圖40A),并包含8位彩色圖像201、藍(lán)色繪制的字符以及藍(lán)色橫紋繪制的字符202、以及紅色點狀背景203。
此外,文檔數(shù)據(jù)DD包含從圖45B的原始文檔中提取的平面PLN(1)、平面PLN(2)、平面PLN(3),以及參考圖像REF。
參考圖像REF具有每個像素的用于選擇平面PLN(1)、PLN(2)以及PLN(3)之一的信息作為m個色調(diào)級別的A1,A2,A3值(本實施例中m=3)。
然而,圖45B的平面PLN(2)以及參考圖像REF與優(yōu)選實施例(參見圖40B)中的平面PLN(2)以及參考圖像REF是不同的。
由參考圖像REF指示藍(lán)色繪制的字符以及藍(lán)色橫紋繪制的字符202。由黑色繪制以及黑色條紋繪制的圖形B1在與平面PLN(2)的字符202相同的部分中形成(參見圖46的平面PLN(2))。
可以通過圖41的文檔轉(zhuǎn)換設(shè)備11創(chuàng)建圖45B所示的文檔數(shù)據(jù)DD的結(jié)構(gòu),并可用圖45B中的文檔恢復(fù)設(shè)備12將其恢復(fù)。
圖46示出了第二優(yōu)選實施例的文檔轉(zhuǎn)換方法。
該文件變換方法與第1實施方式的文件變換方法基本上相同。但是,在平面提取步驟S411中,第1實施方式,將原始文檔200上的對象分成3張平面PLN(1)、PLN(2)、PLN(3)來提取,而本實施方式,將原始文檔100上的對象分成2張平面PLN(1)、PLN(3)以及參照圖像REF來提取。
圖47示出了本發(fā)明的另一個優(yōu)選實施例中的文檔恢復(fù)方法。
該文檔恢復(fù)方法與在前實施例中的文檔恢復(fù)方法基本上是相同的,并且恢復(fù)文檔200’所執(zhí)行的恢復(fù)處理也與第一優(yōu)選實施例的主旨相似。但是,在平面指定步驟S424中,第1實施方式,通過參照圖像REF上的涂抹和平面PLN(2)上的字符對象來恢復(fù)字符202,而第2實施方式,通過參照圖像REF上的字符對象和平面PLN(2)的涂抹來恢復(fù)字符202。
圖48A和48B示出了本發(fā)明的另一個優(yōu)選實施例中的文檔數(shù)據(jù)結(jié)構(gòu)。
在本實施例中,如圖48A所示,原始文檔300包括8位彩色圖像301、上下格由綠色進(jìn)行區(qū)分的藍(lán)色表格304,以及被抹掉并用黑色表示的字符(上邊區(qū)域用302表示,下邊區(qū)域由303表示),以及紅色點狀的背景305。
此外,文檔數(shù)據(jù)包括從圖48B的原始文檔300提取出來的平面PLN(1)、PLN(2)、PLN(3)、PLN(4),以及參考圖像REF。參考圖像REF具有用于每個像素選擇平面PLN(1)、PLN(2)、PLN(3)以及PLN(s)(4)之一的信息,作為m個色調(diào)級別的值A(chǔ)1,A2,A3、和A4,以及A5(本實施例中m=5)。也就是說,本實施例中,n<m。
圖48B的平面PLN(1)包括8位彩色圖像301。此外,平面PLN(2)由單色繪制的字符構(gòu)成。平面-PLN(3)由單色的表格構(gòu)成。平面-PLN(4)由單色的點圖構(gòu)成。
另外,如上所述,參考圖像REF包含五個色調(diào)級別的值A(chǔ)1、A2、A3及A4,以及區(qū)域A5。
帶有色調(diào)級別值A(chǔ)1的區(qū)域相應(yīng)于平面PLN(1)的彩色圖像301形成。此外,帶有色調(diào)級別值A(chǔ)2的區(qū)域相應(yīng)于平面PLN(2)上的字符的上邊區(qū)域302形成,以及帶有色調(diào)級別值A(chǔ)3的區(qū)域相應(yīng)于平面PLN(2)上的字符的下邊區(qū)域303形成。
帶有色調(diào)級別值A(chǔ)4的區(qū)域相應(yīng)于平面PLN(3)的表格304形成,以及帶有色調(diào)級別值A(chǔ)5的區(qū)域相應(yīng)于平面PLN(4)的點圖背景305。
圖45B中所示結(jié)構(gòu)的文檔數(shù)據(jù)DD可以通過圖41的文檔轉(zhuǎn)換設(shè)備11來創(chuàng)建,并可通過圖43的文檔恢復(fù)設(shè)備12進(jìn)行恢復(fù)。
在本實施例中,根據(jù)PLN(1)上的像素值顯示平面PLN(1)。此外,對于本實施例中的平面PLN(2)、(3)及(4),沒有定義顏色,但分別相應(yīng)于A2、A3、A4及A5如參考圖像REF那樣定義顏色。
因此,關(guān)于平面PLN(2)上的對象(本實施例中的字符),用預(yù)先定義為色調(diào)級別A2區(qū)域的顏色(藍(lán)色)來表示,或者是預(yù)先定義為色調(diào)級別A3區(qū)域的顏色(綠色)來表示。
此外,平面-PLN(3)上的對象(本實施例中的表格),用預(yù)先定義為色調(diào)級別A3區(qū)域的顏色(這里是黑色)來表示。平面PLN(4)上的對象(本實施例中的點圖)用預(yù)先定義為色調(diào)級別A4區(qū)域的顏色(這里是紅色)來表示。
另外,也可以通過平面PLN(2)、PLN(3)及PLN(4)上的像素值來顯示平面PLN(2)、PLN(3)及PLN(4)。在這種情況下,將顏色定義為平面PLN(2)、PLN(3)及PLN(4)上的對象。
圖48B所示結(jié)構(gòu)的文檔數(shù)據(jù)DD可以通過圖41的文檔轉(zhuǎn)換設(shè)備11來創(chuàng)建,并通過圖43中的文檔恢復(fù)設(shè)備12將其恢復(fù)。
圖49示出了本發(fā)明的另一個優(yōu)選實施例中的文檔轉(zhuǎn)換方法。
該文檔轉(zhuǎn)換方法與在前實施例中的文檔轉(zhuǎn)換方法基本上是相同的。然而,雖然字符對應(yīng)于一個色調(diào)級別值A(chǔ)2,但通過本實施例中的參考圖像創(chuàng)建步驟S412,字符對應(yīng)于兩個色調(diào)級別值A(chǔ)2和A3。
此外,在本實施例中,由于在原始文檔300中增加了表格作為對象,一共有四個平面。
圖50示出了本發(fā)明的另一個優(yōu)選實施例的文檔恢復(fù)方法。
該文檔恢復(fù)方法與在前實施例中的文檔恢復(fù)方法基本上是相同的,并且對恢復(fù)文檔300執(zhí)行的恢復(fù)處理也與第一優(yōu)選實施例的主旨相似。然而,由于本實施例中的平面是參考圖像REF上由色調(diào)級別值A(chǔ)2和A3兩種顏色顯示的字符對象,但是,在平面指定步驟S424中,第1實施方式,通過參照圖像REF上的涂抹和平面PLN(2)上的字符對象來恢復(fù)字符102,而第3實施方式,通過參照圖像REF上的色調(diào)值A(chǔ)2、A3表示的2色的字符對象、和平面PLN(2)的涂抹來恢復(fù)字符的上部區(qū)域302以及字符的下部區(qū)域303字符102。
圖51A和圖51B示出了本發(fā)明另一個優(yōu)選實施例中的文檔數(shù)據(jù)結(jié)構(gòu)。
在本實施例中,如圖51A所示,原始文檔400包括由灰度級修飾的字符401,以及紅色點圖的背景402。
此外,文檔數(shù)據(jù)DD包括從圖51B的原始文檔400中提取的n個平面(本實施例中n=2)PLN(1)和PLN(2),以及參考圖像REF。
參考圖像REF具有用于為每個像素選擇平面PLN(1)和PLN(s)(2)之一的信息,作為m個色調(diào)級別的值A(chǔ)1,A2,……(本實施例中m=16)。也就是說,本實施例中,n<m。
如上所述,參考圖像REF包括16個色調(diào)級別的值A(chǔ)1、A2、……、A16的區(qū)域。將在相應(yīng)的平面PLN(1)上的像素值賦予具有色調(diào)級別值A(chǔ)1的區(qū)域的像素。
此外,將“白色”定義為具有色調(diào)級別值A(chǔ)2的區(qū)域,“黑色”定義為具有色調(diào)級別值A(chǔ)16的區(qū)域,將從“白色”逐漸靠近“黑色”的灰色定義為具有色調(diào)級別值A(chǔ)3-A15的區(qū)域。
圖51B所示結(jié)構(gòu)的文檔數(shù)據(jù)DD可以通過圖41的文檔轉(zhuǎn)換設(shè)備11來創(chuàng)建,并通過圖43中的文檔恢復(fù)設(shè)備12將其恢復(fù)。
在本實施例中,關(guān)于相應(yīng)于參考圖像REF上的具有色調(diào)級別值A(chǔ)1的像素的PLN(1)上的像素值,在與其相關(guān)的參考圖像REF上顯示像素值。對于平面PLN(2),沒有定義顏色,但是白色、灰色以及黑色出現(xiàn)在對應(yīng)于分別給予參考圖像REF上的像素的色調(diào)級別值A(chǔ)2-A16的恢復(fù)圖像中。
此外,也可以用平面PLN(2)、PLN(3)及PLN(4)上的像素值來顯示平面PLN(2)、PLN(3)及PLN(4)。在這種情況下,顏色被定義為平面PLN(2)、PLN(3)及PLN(4)上的對象。
圖51B所示結(jié)構(gòu)的文檔數(shù)據(jù)DD可以通過圖41的文檔轉(zhuǎn)換設(shè)備11來創(chuàng)建,并通過圖43中的文檔恢復(fù)設(shè)備12將其恢復(fù)。
圖52示出了本發(fā)明的另一個優(yōu)選實施例的文檔轉(zhuǎn)換方法。
該文檔轉(zhuǎn)換方法與在前實施例中的文檔轉(zhuǎn)換方法基本上是相同的。此外,圖53示出了本發(fā)明的另一個優(yōu)選實施例的文檔恢復(fù)方法。該文檔恢復(fù)方法與在前實施例中的文檔恢復(fù)方法基本上是相同的,并且對恢復(fù)文檔400’的恢復(fù)的執(zhí)行也與第一優(yōu)選實施例的主旨相似。
對于參考圖像REF的解碼,在本實施例中,期望采用適于多級圖像的方法。在本實施例中,諸如圖像連續(xù)改變之類的灰度適用于在圖框及背景中大量使用該灰度的圖像。
圖40A-圖53的上述實施例提供了一種文檔轉(zhuǎn)換設(shè)備,其包括平面圖像提取單元,用從原始文檔中提取n個平面;參考圖像創(chuàng)建單元,用于創(chuàng)建其中將m個色調(diào)級別值指定給參考圖像的每個像素的參考圖像,參考圖像還包含用于根據(jù)m個色調(diào)級別值選擇n個平面之一的信息;以及編碼單元,用于對n個平面以及參考圖像進(jìn)行編碼。
根據(jù)本發(fā)明,可以將涉及彩色圖像的文檔的文件大小制作得很小,而不急劇地降低圖像的質(zhì)量。再有,在再現(xiàn)文檔中,可以維持包括字符、格線和單色圖形的圖像的可視性,并且也可以被應(yīng)用于具有灰度的圖像。再有,將文檔圖像分割為兩個或多個平面以及參考圖像,僅僅可以顯示或傳送所需要的對象。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得提供平面圖像提取單元,通過將原始文檔上的對象分割為n個平面或是n個平面和參考圖像,而而提取出n個平面。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得提供編碼單元,通過使用根據(jù)原始文檔上的對象類型的編碼方法來對n個平面和/或參考圖像進(jìn)行編碼。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得提供編碼單元,通過使用不同于其它平面使用的編碼方法對n個平面中的至少一個平面進(jìn)行編碼。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得文檔轉(zhuǎn)換設(shè)備還包括圖像組合單元,用于將編碼單元編碼的參考圖像和n個平面合并到數(shù)據(jù)集合中。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得文檔轉(zhuǎn)換設(shè)備還包括操作單元,用于執(zhí)行圖像操作處理或圖像補(bǔ)償處理。
圖40A-圖53的上述實施例提供了一種文檔恢復(fù)設(shè)備,通過獲取具有文檔數(shù)據(jù)結(jié)構(gòu)的文檔數(shù)據(jù)來恢復(fù)文檔,該文檔數(shù)據(jù)結(jié)構(gòu)通過將從原始文檔提取的n個平面組合成一個文件來創(chuàng)建,該文檔數(shù)據(jù)具有n個平面以及包含用于為每一個像素選擇n個平面中的一個作為m個色調(diào)級別的值的信息的參考圖像,該文檔恢復(fù)設(shè)備包括文檔分解/解碼單元,將文檔數(shù)據(jù)分解成n個平面和參考圖像,并對n個平面中的每一個平面及參考圖像執(zhí)行解碼處理;掃描單元,掃描參考圖像的像素;色調(diào)級別值獲取單元,獲取分配給每一個掃描的像素的m個色調(diào)級別的值;平面確定單元,確定相應(yīng)于m個色調(diào)級別的值的n個平面中的一個平面;像素值提取單元,提取平面確定單元確定的平面上的像素的像素值,該像素是對應(yīng)于參考圖像的像素位置,以及文檔重建單元,通過將像素值提取單元提取的像素值分配給重建的文檔圖像中對應(yīng)于參考圖像的各個像素的像素來恢復(fù)文檔。
上述文檔恢復(fù)設(shè)備可以被配置為使得文檔恢復(fù)設(shè)備還包括平面排除單元,用于在n個平面中指定一個或多個要排除的平面,其中所指定的平面不需要平面確定單元進(jìn)行平面確定,并且在恢復(fù)的文檔圖像上只顯示需要的對象。
圖40A-圖53的上述實施例提供了一種文檔轉(zhuǎn)換方法,包括以下步驟從原始文檔中提取n個平面;創(chuàng)建其中將m個色調(diào)級別值指定給參考圖像的每個像素的參考圖像,參考圖像還包含用于根據(jù)m個色調(diào)級別值選擇n個平面之一的信息;以及對n個平面以及參考圖像進(jìn)行編碼。
上述文檔轉(zhuǎn)換方法可以被配置為使得提供提取步驟,通過將原始文檔上的對象分割為n個平面或是n個平面和參考圖像而提取出n個平面。
上述文檔轉(zhuǎn)換方法可以被配置為使得提供編碼步驟,通過使用根據(jù)原始文檔上的對象類型的編碼方法來對n個平面和/或參考圖像進(jìn)行編碼。
上述文檔轉(zhuǎn)換方法可以被配置為使得提供編碼步驟,通過使用不同于其它平面使用的編碼方法對n個平面中的至少一個平面進(jìn)行編碼。
上述文檔轉(zhuǎn)換方法可以被配置為使得文檔轉(zhuǎn)換方法還包括將編碼步驟編碼的參考圖像和n個平面合并到數(shù)據(jù)集合中的步驟。
上述文檔轉(zhuǎn)換方法可以被配置為使得文檔轉(zhuǎn)換方法還包括執(zhí)行圖像操作處理或圖像補(bǔ)償處理的步驟。
圖40A-圖53的上述實施例提供了一種文檔恢復(fù)方法,通過獲取具有文檔數(shù)據(jù)結(jié)構(gòu)的文檔數(shù)據(jù)來恢復(fù)文檔,該文檔數(shù)據(jù)結(jié)構(gòu)通過將從原始文檔提取的n個平面組合成一個文檔來創(chuàng)建,該文檔數(shù)據(jù)具有n個平面以及包含用于為每一個像素選擇n個平面中的一個作為m個色調(diào)級別的值的信息的參考圖像,該文檔恢復(fù)方法包括以下步驟將文檔數(shù)據(jù)分解成n個平面和參考圖像,并對n個平面中的每一個平面及參考圖像執(zhí)行解碼處理;掃描參考圖像的像素;獲取分配給每一個掃描的像素的m個色調(diào)級別的值;確定相應(yīng)于m個色調(diào)級別的值的n個平面中的一個平面;提取平面確定步驟所確定的平面上的像素的像素值,該像素對應(yīng)于參考圖像的像素位置;以及通過將在提取步驟中提取的像素值分配給重建的文檔圖像中對應(yīng)于參考圖像的各個像素的像素來恢復(fù)文檔。
上述文檔恢復(fù)方法可以被配置為使得文檔恢復(fù)方法還包括在n個平面中指定一個或多個要排除的平面的步驟,其中所指定的平面不需要進(jìn)行平面確定,并且在恢復(fù)的文檔圖像上只顯示需要的對象。
圖40A-圖53的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行上述圖像轉(zhuǎn)換方法。
圖40A-圖53的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行上述圖像恢復(fù)方法。
圖40A-圖53的上述實施例提供了一種計算機(jī)可讀存儲介質(zhì),存儲了能夠使計算機(jī)執(zhí)行上述圖像轉(zhuǎn)換方法和/或上述圖像恢復(fù)方法。
接下來,圖54A和圖54B示出了本發(fā)明優(yōu)選實施例中的文檔數(shù)據(jù)結(jié)構(gòu)。
如圖54B所示,文檔數(shù)據(jù)DD包括參考圖像REF以及從圖54A的原始文檔100中提取的n個平面平面PLN(1),平面PLN(2)(本實施例中,n=2)。
如圖54A所示,原始文檔100由8位彩色圖像101、黑色繪制的字符以及灰色的繪制字符102構(gòu)成。
在本實施例中,如圖54B所示,根據(jù)相關(guān)圖像指示的對象,將顯示在原始文檔100上的圖像分割成平面PLN(1)和PLN(2),并提取它們。參考圖像REF具有應(yīng)用為每個像素選擇平面PLN(1)和PLN(s)(2)之一的信息,作為m個色調(diào)級別的值A(chǔ)1和A2(本實施例中m=2)。例如,可以將A1作為“0”,A2“1”。
在本實施例中,參考圖像REF包括應(yīng)用原始文檔100上的字符的m個色調(diào)級別中的一個色調(diào)級別的繪制(painting-out)圖像。在本實施例中該繪制圖像是字符。
在本實施例中,通過8位彩色圖像以及適用于照片等壓縮的方法來對平面-PLN(1)進(jìn)行編碼。
通過適用于簡單形式的繪制圖像的壓縮的方法來對平面-PLN(2)進(jìn)行編碼。以及通過原始文檔(字符)上的對象的像素值來確定相應(yīng)于參考圖像REF的繪制圖像(字符)的像素值。
通過字符(由圖像或文本代碼表示的圖像)以及適于字符壓縮的方法對參考圖像REF進(jìn)行編碼。
由于平面PLN(1)是彩色圖像,其適合使用諸如JPEG以及JPEG2000之類的壓縮方法。此外,平面PLN(2)可以應(yīng)用如JPEG以及JPEG2000之類的壓縮方法。由于參考圖像REF是字符圖像,其適用MMR壓縮。
在本實施例中,如圖54A和54B所示,參考圖像REF的分辨率與原始文檔100的分辨率是相同的,并且平面PLN(2)的分辨率設(shè)置成低于參考圖像REF的分辨率。
在降低平面PLN(2)的分辨率時,當(dāng)決定通過變薄處理或平均值處理將圖像的像素值簡單地經(jīng)過低分辨率處理時,有時是比較困難的。例如,由于平面PLN(2)是再現(xiàn)字符顏色的圖像,因此不希望除字符以外的像素值攙入平面PLN(2)中。也就是說,由于除字符以外的部分是適于單色的確定值的像素值,如黑色,因此不適于在低分辨率的平面PLN(2)的圖像中映射該像素值。
圖55是說明平面PLN(2)的低分辨率處理的示意圖。圖55(A)示出了平面PLN(2)的像素的值。圖55(B)示出了用于對平面PLN(2)確定像素值(A的參考圖像REF的像素值)的平均計算圖像GA。圖55C示出了平面PLN(2)的像素值。
用于取平均值的圖像GA僅提取原始文檔100的字符對象的像素值,并給出平面PLN(2)上的像素值作為包含在用于取平均值的圖像GA中3×3個像素塊中的字符對象的平均像素值。
如圖55(B)所示,將平面PLN(1)的像素值選擇給參考圖像REF的白色像素。并將平面PLN(2)像素值(像素平均值視圖深處字符對象的灰度)選擇給黑色像素。
圖56示出了第一優(yōu)選實施例的文檔轉(zhuǎn)換設(shè)備的方塊圖,通過該文檔轉(zhuǎn)換設(shè)備可以創(chuàng)建圖54B所示結(jié)構(gòu)的文檔數(shù)據(jù)DD。
在圖56中,文檔轉(zhuǎn)換設(shè)備410包括平面圖像提取單元411,參考圖像創(chuàng)建單元412,圖像操作單元413,編碼單元414,以及圖像組合單元415。
平面圖像提取單元411可以根據(jù)編碼方法從原始文檔100中提取兩層平面PLN(1)和PLN(2)的平面PLN。
在本實施例中,平面PLN(1)是彩色圖像。此外,在PLN(2)中,當(dāng)原始文檔100上的對象顏色是彩色時,可作為實現(xiàn)PLN(2)上的對象平均值的顏色。此外,參考圖像REF是單色圖像。
在本實施例中,由平面PLN(1)提取彩色照片等,由平面PLN(2)提取字符。由于與這些提取相關(guān)的對象的提取技術(shù)(字符提取,背景提取)是公知的,將不再給出說明。
參考圖像創(chuàng)建單元412可以創(chuàng)建參考圖像REF。
圖像操作單元413可以執(zhí)行圖像操作或圖像補(bǔ)償(分辨率轉(zhuǎn)換,濾波處理,亮度補(bǔ)償,色調(diào)補(bǔ)償,噪聲抑制)。通常,通過這種處理,編碼時的可壓縮性會變高。
例如,僅字符的顏色應(yīng)當(dāng)理解恢復(fù)文檔100’上的平面PLN(2)。因此,將平面PLN(2)上的分辨率設(shè)置為低。
此外,由于參考圖像REF上的對象是字符,即使降低平面PLN(2)的分辨率也不會使可見度下降很多。另外,對于參考圖像REF,如果執(zhí)行了字符識別處理,將獲得文本代碼。
如果這與最終創(chuàng)建并設(shè)置的一系列數(shù)據(jù)集合有關(guān)(數(shù)據(jù)集合中通常包括文本數(shù)據(jù)),可以在恢復(fù)文檔100中執(zhí)行文本代碼的檢索。
此外,內(nèi)插處理等可以執(zhí)行提高分辨率的圖像處理。盡管文件尺寸變大,但當(dāng)照片區(qū)域等比較重要時,可以改善圖像質(zhì)量。在本實施例中,雖然參考圖像REF沒有改變點間距,但可以對它進(jìn)行改變。
對于參考圖像REF,可以通過消除細(xì)小的黑色像素的連通分量的方法來進(jìn)行噪聲抑制,并可壓縮性也將隨之變高。
此外,根據(jù)如何使用該文檔,可以對每個平面所適用的機(jī)器處理進(jìn)行選擇。例如,當(dāng)認(rèn)為照片是比較重要的時候,將不會降低平面PLN(1)的分辨率。
相反,當(dāng)不是很重要時,照片降低平面PLN(1)的分辨率,并使平面PLN(2)的分辨率變高。由于是圖像質(zhì)量與最終信息尺寸的折衷,因此要根據(jù)使用方式來確定它們。
編碼單元414可以通過根據(jù)原始文檔100上的對象類型的方法(是用于對相關(guān)對象進(jìn)行壓縮的適當(dāng)方法,并且對每個平面是不同的)來對平面PLN(1)、PLN(2)以及參考圖像REF進(jìn)行編碼。
圖像組合單元415可將由編碼單元413編碼的參考圖像REF以及n個平面PLN(1)和PLN(2)合并到數(shù)據(jù)集合中。此外,在進(jìn)行組合的時候,每個平面包括在數(shù)據(jù)集合中顯示其所具有的屬性的信息(例如,如照片、字符、以及背景之類的位像的信息)。在這種情況下,當(dāng)進(jìn)行文檔恢復(fù)時,對操作者來說,不需要的平面可以通過平面排除單元423來排除。因此,就圖像表示來說,只有某個特定的平面還可以顯示出來。因此,由于不需要的信息是不可視的,因此文檔變得容易辨認(rèn)。
此外,在數(shù)據(jù)通信時,從數(shù)據(jù)集合中排除適宜認(rèn)作不需要的平面,并由此降低了發(fā)送和接收的數(shù)據(jù)量(收發(fā)器的時間也因此縮短)。
圖57示出了優(yōu)選實施例的文檔轉(zhuǎn)換方法??梢酝ㄟ^使用圖56的文檔轉(zhuǎn)換設(shè)備來實現(xiàn)該文檔轉(zhuǎn)換方法。
在圖57中,首先根據(jù)編碼方法從原始文檔100中提取兩層平面PLN(1)和PLN(2)的平面PLN(平面提取步驟S411)。在平面提取步驟S411中,將原始文檔100上的對象分割成平面PLN(1)和平面PLN(2),并提取它們。
接下來,當(dāng)將兩種色調(diào)級別的值A(chǔ)1、A2指定給每個像素時,創(chuàng)建用于根據(jù)兩種色調(diào)級別的值來確定是平面PLN(1)和平面PLN(2)中任意一個的參考圖像REF(參考圖像創(chuàng)建步驟S412)。
此外,對兩層平面PLN(1)和PLN(2)的平面PLN進(jìn)行圖像操作或圖像補(bǔ)償(分辨率轉(zhuǎn)換、濾波處理、亮度補(bǔ)償、色調(diào)補(bǔ)償、噪聲抑制)(圖像操作步驟S413)。對平面PLN(2)進(jìn)行上述分辨率轉(zhuǎn)換。
接著,對兩層平面PLN(1)、PLN(2)的平面PLN以及參考圖像REF進(jìn)行編碼(編碼步驟S414)。在編碼步驟S414中,通過根據(jù)原始文檔100上的對象類型(本實施例中為字符)的方法對兩層平面PLN(1)、PLN(2)的平面PLN以及參考圖像REF進(jìn)行編碼。
在本實施例中,分別通過不同的編碼方法分別對兩層平面進(jìn)行編碼。并將在編碼步驟S414中編碼的參考圖像REF以及兩層平面PLN(1)、PLN(2)的平面PLN合并在數(shù)據(jù)集合中。
此外,可以將與原始文檔100的平面PLN(1)上的字符相對應(yīng)的像素替換成周圍的典型顏色。
此外,也可以將平面PLN(2)所不涉及的區(qū)域中的像素值轉(zhuǎn)換成預(yù)定的像素值(如白色、黑色等)。因此,在這種情況下編碼可以提高壓縮率。
圖58示出了優(yōu)選實施例中的文檔恢復(fù)設(shè)備。
圖58中的文檔恢復(fù)設(shè)備21包括文檔分解/解碼單元421、色調(diào)級別值獲取單元422、平面排除單元423、平面指定單元424、以及文檔恢復(fù)單元425。
在本實施例中,文檔恢復(fù)設(shè)備21可以獲取文檔數(shù)據(jù)DD,并可以從相關(guān)文檔數(shù)據(jù)中恢復(fù)原始文檔100。
文檔分解/解碼單元421可以對文檔數(shù)據(jù)DD執(zhí)行解碼處理,并可以創(chuàng)建兩層平面PLN(1)、PLN(2)的平面PLN以及參考圖像REF。
色調(diào)級別值獲取單元422可以獲取掃描參考圖像REF的像素的兩種色調(diào)級別的值A(chǔ)1和A2中的任何一個,并將其指定給掃描的像素。
平面排除單元423可以從兩層平面PLN(1)和PLN(2)的平面PLN的處理對象中移除一層或兩層平面。通過不包含平面指定單元424指定的對象,平面排除單元423排除的平面可以僅在再現(xiàn)的圖像100’上顯示所需的對象。
平面指定單元424可以相應(yīng)于兩種色調(diào)級別的A1和A2值來確定平面PLN(1)和PLN(2)的平面PLN。
文檔恢復(fù)單元425可以相應(yīng)于指定給參考圖像REF的像素位置的像素,提取由平面指定單元424確定的平面上的值,可以恢復(fù)文檔,以及可以獲得恢復(fù)文檔100’。
當(dāng)在平面PLN(2)上定義顏色、并且參考圖像REF的像素的色調(diào)級別值為A2時,將平面PLN(2)上定義的顏色反應(yīng)到恢復(fù)文檔100’中。
圖59示出了優(yōu)選實施例的文檔恢復(fù)方法。該文檔恢復(fù)方法可以通過使用圖58的文檔恢復(fù)設(shè)備21來執(zhí)行。
在圖59中,首先,將文檔數(shù)據(jù)DD分解成兩層平面PLN(1)、PLN(2)的平面PLN以及參考圖像REF,并對它們執(zhí)行解碼處理(文檔分解/解碼步驟S421)。
掃描參考圖像REF的像素,并獲取對每個像素指定的兩種色調(diào)級別的值A(chǔ)1和A2(色調(diào)級別值獲取步驟S422)。
排除作為預(yù)定對象的平面(平面排除步驟S423)。
確定相應(yīng)于兩種色調(diào)級別的值A(chǔ)1和A2的平面(平面指定步驟S424)。
提取為在平面指定步驟S424中確定的平面上的像素位置指定的像素值,并創(chuàng)建恢復(fù)文檔100’(文檔恢復(fù)步驟S425)。
圖60示出了改變平面PLN(2)的低分辨率處理的優(yōu)選實施例。圖60(A)示出了平面PLN(2)的像素的值。圖60(B)示出了用于從(A)的參考圖像REF的像素值中確定平面PLN(2)的像素值的平均計算圖像GA。圖60C示出了平面PLN(2)的像素值。
用于取平均值的圖像GA僅提取原始文檔100的字符對象的像素值,并給出平面PLN(2)上的像素值作為包含在用于取平均值的圖像GA的8×8個像素塊T中的字符對象的平均像素值。
如圖60(B)所示,將平面PLN(1)的像素值選擇給參考圖像REF的白色像素。并將平面PLN(2)的像素值(作為字符對象的平均像素值的圖60的深灰色)選擇給黑色像素。
當(dāng)用于取平均值的圖像GA上相當(dāng)于8×8個像素的塊T中的字符的像素中的變化很小時,由相同的顏色圍繞相應(yīng)于平面PLN(2)上的像素值。
此外,當(dāng)塊T的像素值中的變化很大時,判斷較小尺寸的塊(如2×2個像素塊)中的變化,并當(dāng)該變化很小時,可以由相同顏色圍繞相應(yīng)于平面PLN(2)上的像素值。
圖61示出了上述平面PLN(2)的低分辨率處理流程圖。
首先,在用于取平均值的圖像GA上選擇相當(dāng)于8×8個像素的塊(層-tile)T(S401)。接下來,判斷是否提取塊T中相當(dāng)于該字符位置的像素(S402),并是否存在相應(yīng)的像素(S403)。
在步驟S403中,當(dāng)塊T中不存在相當(dāng)于該字符位置的像素時,將預(yù)定的像素值指定給平面PLN(2)的像素(S404)。并且確定關(guān)于平面PLN(2)的所有像素是否完成像素值的分配(S410)。
在步驟S403中,當(dāng)塊T中存在相當(dāng)于該字符位置的像素時,計算所涉及的每個像素值的平均值及變化(S405),并確定該變化是否大于預(yù)定值(S406)。
當(dāng)變化大于預(yù)定值時,將用于取平均值的圖像GA上的8×8像素塊T重新分割成2×2的像素塊(S407)。
將重新分解的塊中相當(dāng)于字符的像素的像素平均值指定給平面PLN(2)的像素(S408)。并且確定關(guān)于平面PLN(2)的所有像素是否完成了像素值的分配(S410)。
在步驟S406中,當(dāng)變化大于預(yù)定值時,將8×8像素塊T中字符相當(dāng)像素的像素的平均值分配給PLN(2)的像素。并且確定對于平面PLN(2)的所有像素是否完成了像素值的分配(S410)在步驟S410中,當(dāng)結(jié)束對平面PLN(2)上所有像素分配像素值時,結(jié)束低分辨率處理。
在本實施例中,判斷原始文檔100的顏色變化,如果在好的單元上的顏色產(chǎn)生變化,則將不摻入該顏色。此外,由于選擇性地改變著色單元,因此無需降低本實施例中的圖像質(zhì)量,就可以期望獲得提高壓縮率的效果。
此外,作為在顏色中建立變化的方法,雖然是基于變化的,但可以使用非彩色的像素與其它彩色像素的比例。在這種情況下,同時對無色和彩色進(jìn)行判斷,除非顏色中的變化很大。
當(dāng)某個像素顏色為(R,G,B)等時,在預(yù)先定義的閾值th之間實現(xiàn)|R-G|<th,|G-B|<th,|B-R|<th之間的關(guān)系的時候,可以考慮如何判斷無色判斷是無色的。
在攙入彩色時,通過使用如非彩色或彩色的比例的方法來攙入顏色。但是,由于并不需要執(zhí)行偏差計算所需要的乘法,因此,具有計算成本小的優(yōu)點。
圖54A-圖61的上述實施例提供了一種文檔轉(zhuǎn)換設(shè)備,其包括平面圖像提取單元,用從原始文檔中提取n個平面;參考圖像創(chuàng)建單元,用于創(chuàng)建參考圖像,其中將m個色調(diào)級別的值分配給參考圖像,參考圖像還包含用于為每個像素選擇n個平面之一的信息作為m個色調(diào)級別的值,以及參考圖像包括作為由m個色調(diào)級別之一給定的繪制圖像的原始文檔上的預(yù)定對象;以及編碼單元,用于對n個平面以及參考圖像進(jìn)行編碼;其中平面圖像提取單元用于基于原始文檔上繪制圖像的像素值來確定相應(yīng)于平面上繪制圖像的每個像素的像素值,所述平面是根據(jù)參考圖像中包含的每個像素的信息,從n個平面中選擇的。
根據(jù)本發(fā)明,可以將涉及彩色圖像的文檔的文件大小制作得很小,而不急劇地降低圖像的質(zhì)量。再有,在再現(xiàn)文檔中,可以維持包括字符、格線和單色圖形的圖像的可視性,并且也可以被應(yīng)用于具有灰度的圖像。再有,由于將文檔圖像分割為兩個或多個平面以及參考圖像,僅僅可以顯示或傳送所需要的對象。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得平面圖像提取單元提取根據(jù)參考平面上繪制圖像的每一個像素的信息選擇的平面圖像,該平面圖像具有低于原始圖像的分辨率,并且平面圖像提取單元根據(jù)相應(yīng)于所提取的平面圖像的像素的原始文檔中的塊中的繪制圖像的像素值改變來確定該選擇的平面圖像的像素值。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得平面圖像提取單元提取根據(jù)參考圖像上繪制圖像的每個像素的信息選擇的平面圖像,該平面圖像具有低于原始圖像的分辨率,并且其中平面圖像提取單元確定相應(yīng)于所提取的平面圖像的像素的原始文檔第一層(first tile)中的繪制圖像的像素值的改變,以及當(dāng)所述改變小于給定值時,根據(jù)第一層中的給制圖像的像素平均值確定所選擇的平面圖像的像素值,以及當(dāng)所述改變大于給定值時,確定原始文檔的第二較小層中的繪制圖像的像素值的改變,以及當(dāng)所述改變小于給定值時,根據(jù)第二較小層中的繪制圖像的平均像素值來確定所選擇的平面圖像的像素值。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得平面圖像提取單元通過將原始文檔上的對象分割成n個平面或是n個平面和參考圖像來提取n個平面。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得編碼單元通過使用根據(jù)原始文檔上的對象類型的編碼方法來對n個平面和/或參考圖像進(jìn)行編碼。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得編碼單元通過使用不同于編碼其它平面的編碼方法來對n個平面中的至少一個平面進(jìn)行編碼。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得文檔轉(zhuǎn)換設(shè)備還包括圖像組合單元,用于將編碼單元編碼的參考圖像和n個平面合并到數(shù)據(jù)集合中。
上述文檔轉(zhuǎn)換設(shè)備可以被配置為使得文檔轉(zhuǎn)換設(shè)備還包括圖像操作單元,用于執(zhí)行圖像操作處理或圖像補(bǔ)償處理。
圖54A-圖61的上述實施例提供了一種文檔恢復(fù)設(shè)備,通過獲取具有通過將從原始文檔提取的n個平面組合成一個文件而創(chuàng)建的文檔數(shù)據(jù)結(jié)構(gòu)的文檔數(shù)據(jù)來恢復(fù)文檔,該文檔數(shù)據(jù)具有n個平面和包含用于為每一個像素選擇n個平面中的一個作為m中色調(diào)級別的值的信息的參考圖像,參考圖像包括作為由m種色調(diào)級別中的一種指定的繪制圖像的原始文檔上的預(yù)定對象,基于原始文檔上的預(yù)定對象的像素值,來確定相應(yīng)于根據(jù)參考圖像所包含的每個像素的信息、在n個平面中選擇的平面上的繪制圖像的每個像素的像素值,所述文檔恢復(fù)設(shè)備包括文檔分解/解碼單元,將文檔數(shù)據(jù)分解成n個平面和參考圖像,并對n個平面中的每一個平面及參考圖像執(zhí)行解碼處理;掃描單元,掃描參考圖像的像素;色調(diào)級別值獲取單元,獲取分配給每一個由掃描單元掃描的像素的m個色調(diào)級別的值;平面確定單元,確定相應(yīng)于m個色調(diào)級別的值的n個平面中的一個平面;像素值提取單元,提取平面確定單元確定的平面上的像素的像素值,該像素是對應(yīng)于參考圖像的像素的位置,以及文檔重建單元,通過將像素值提取單元提取的像素值分配給重建的文檔圖像中對應(yīng)于參考圖像的各個像素的像素來恢復(fù)文檔。
上述文檔恢復(fù)設(shè)備可以被配置為使得文檔恢復(fù)設(shè)備包括平面排除單元,用于在n個平面中指定一個或多個平面,其中所指定的平面不經(jīng)受平面確定單元的特定處理,并且在恢復(fù)的文檔圖像上只顯示需要的對象。
圖54A-圖61的上述實施例提供了一種文檔轉(zhuǎn)換方法,包括以下步驟從原始文檔中提取n個平面;創(chuàng)建參考圖像,其中將m個色調(diào)級別的值指定給參考圖像的每個像素,參考圖像還包含用于為每個像素選擇n個平面之一的信息,作為m個色調(diào)級別的值,以及參考圖像包括作為由m個色調(diào)級別之一給定的繪制圖像的原始文檔上的預(yù)定對象;以及對n個平面以及參考圖像進(jìn)行編碼;其中提供提取步驟,使得基于原始文檔上繪制圖像的像素值來確定平面上相應(yīng)于繪制圖像的每個像素的像素值,該平面是根據(jù)參考圖像中包含的每個像素的信息從n個平面中選擇的。
上述文檔轉(zhuǎn)換方法可以被配置為使得在提取步驟中,提取根據(jù)參考圖像上繪制圖像的每個像素的信息選擇的平面圖像,該平面圖像具有低于原始圖像的分辨率,并且提供提取步驟,使得根據(jù)相應(yīng)于所提取的平面圖像的像素的原始文檔中的一層繪制圖像的像素值的改變來確定該選擇的平面圖像的像素值。
上述文檔轉(zhuǎn)換方法可以被配置為使得在提取步驟中,提取根據(jù)參考圖像上繪制圖像的每個像素的信息選擇的平面圖像,該平面圖像具有低于原始圖像的分辨率,并且其中提取步驟確定相應(yīng)于所提取的平面圖像的像素的原始文檔中第一層繪制圖像的像素值的改變,以及當(dāng)所述改變小于給定值時,根據(jù)第一層中的繪制圖像的像素平均值確定所選擇的平面圖像的像素值,以及當(dāng)所述改變大于給定值時,確定原始文檔的第二較小層中的繪制圖像的像素值的改變,以及當(dāng)所述改變小于給定值時,根據(jù)第二較小層中的繪制圖像的平均像素值來確定所選擇的平面圖像的像素值。
上述文檔轉(zhuǎn)換方法可以被配置為使得提取步驟通過將原始文檔上的對象分割成n個平面或是n個平面和參考圖像來提取n個平面。
上述文檔轉(zhuǎn)換方法可以被配置為使得編碼步驟通過使用根據(jù)原始文檔上的對象類型的編碼方法來對n個平面和/或參考圖像進(jìn)行編碼。
上述文檔轉(zhuǎn)換方法可以被配置為使得編碼步驟通過使用不同于編碼其它平面的編碼方法來對n個平面中的至少一個平面進(jìn)行編碼。
上述文檔轉(zhuǎn)換方法可以被配置為使得文檔轉(zhuǎn)換方法還包括組合步驟,將編碼步驟中編碼的參考圖像和n個平面合并到數(shù)據(jù)集合中。
上述文檔轉(zhuǎn)換方法可以被配置為使得文檔轉(zhuǎn)換方法還包括執(zhí)行圖像操作處理或圖像補(bǔ)償處理的步驟。
圖54A-圖61的上述實施例提供了一種文檔恢復(fù)方法,通過獲取具有通過將從原始文檔提取的n個平面組合成一個文檔而創(chuàng)建的文檔數(shù)據(jù)結(jié)構(gòu)的文檔數(shù)據(jù)來恢復(fù)文檔,該文檔數(shù)據(jù)具有n個平面和包含用于為每一個像素選擇n個平面中之一的信息作為m個色調(diào)級別的值的參考圖像,參考圖像包括作為由m種色調(diào)級別中的一種指定的繪制圖像的原始文檔上的預(yù)定對象,基于原始文檔上的預(yù)定對象的像素值,來確定相應(yīng)于根據(jù)參考圖像所包含的每個像素的信息、在n個平面中選擇的平面上的繪制圖像的每個像素的像素值,該文檔恢復(fù)方法包括以下步驟將文檔數(shù)據(jù)分解成n個平面和參考圖像,并對n個平面中的每一個平面及參考圖像執(zhí)行解碼處理;掃描參考圖像的像素;獲取分配給每一個掃描的像素的m個色調(diào)級別的值;確定相應(yīng)于m個色調(diào)級別的值的n個平面中的平面;提取確定步驟中確定的平面上的像素的像素值,該像素對應(yīng)于參考圖像的像素的位置,以及通過將像素值提取單元提取的像素值分配給重建的文檔圖像中對應(yīng)于參考圖像的各個像素的像素來恢復(fù)文檔。
上述文檔恢復(fù)方法可以被配置為使得文檔恢復(fù)方法還包括在n個平面中指定一個或多個要被排除的平面的步驟,其中所指定的平面不需要進(jìn)行平面確定,并且在恢復(fù)的文檔圖像上只顯示需要的對象。
圖54A-圖61的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行上述文檔轉(zhuǎn)換方法。
圖54A-圖61的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行上述文檔恢復(fù)方法。
圖54A-圖61的上述實施例提供了一種計算機(jī)可讀存儲介質(zhì),其中存儲了能夠使計算機(jī)執(zhí)行上述文檔轉(zhuǎn)換方法和/或上述文檔恢復(fù)方法。
接下來,圖62是示出了本發(fā)明的優(yōu)選實施例中的圖像處理設(shè)備的功能方塊圖。
如圖62所示,圖像處理設(shè)備11包括特定屬性區(qū)域提取單元111,格線提取單元112,特定屬性區(qū)域消除圖像創(chuàng)建單元113,特定屬性區(qū)域顏色確定單元114,特定屬性區(qū)域著色圖像創(chuàng)建單元115,格線繪制單元116,以及著色單元117。
特定屬性區(qū)域提取單元11可以從原始圖像OG(EP示出了特定屬性信息)中提取帶有特定屬性的部分(特定屬性區(qū)域本實施例中的字符部分)。特定屬性指的是本實施例中的字符屬性。
此外,在本實施例中,特定屬性區(qū)域提取單元111包含二值化原始圖像創(chuàng)建單元1111,特定屬性區(qū)域提取單元1112,格線消除二值化圖像創(chuàng)建單元1113,連通分量提取單元1114,以及連通分量尺寸分類單元1115。
二值化原始圖像創(chuàng)建單元1111創(chuàng)建實現(xiàn)原始圖像OG的二值化的二值化原始圖像OGB。特定屬性區(qū)域識別單元1112在由二值化原始圖像創(chuàng)建單元1111創(chuàng)建的二值化原始圖像OGB中執(zhí)行特定屬性區(qū)域的識別處理。
格線消除二值化圖像創(chuàng)建單元1113從二值化原始圖像OGB中消除由格線提取單元112提取的格線,并創(chuàng)建格線消除二值化圖像OGB’。
連通分量提取單元1114從由格線消除二值化圖像生成單元1113生成的格線消除二值化圖像OGB’中提取連通分量LE,連通分量大小分類單元1115對由連通分量提取單元1114提取的連接分量的大小進(jìn)行分類。該分類結(jié)果是特定屬性信息EP。
格線提取單元112提取包含在原始圖像OG中的格線。在本實施例中,格線提取單元112將從由二值化原始圖像創(chuàng)建單元1111創(chuàng)建的二值化原始圖像OGB中提取格線FB。
特定屬性區(qū)域消除圖像創(chuàng)建單元113創(chuàng)建特定屬性區(qū)域消除圖像OGE,該圖像中消除了由特定屬性區(qū)域提取單元111從原始圖像中提取的特定屬性區(qū)域(字符部分)。
特定屬性區(qū)域顏色確定單元114確定由特定屬性區(qū)域提取單元111提取的特定屬性區(qū)域(字符部分)的顏色。將該顏色信息設(shè)為LC。
特定屬性區(qū)域著色圖像創(chuàng)建單元115創(chuàng)建至少一幅特定屬性區(qū)域著色圖像CGG,該圖像由特定屬性區(qū)域顏色確定單元114所確定的特性屬性區(qū)域(字符部分)的圖像的顏色所繪制。
在連通分量尺寸分類單元的處理之后,格線繪制單元116將由格線消除二值化圖像創(chuàng)建單元消除的格線FB重新畫到圖像中去。
編碼單元117從消除了特定屬性區(qū)域的圖像以及僅由特定屬性區(qū)域構(gòu)成的圖像中創(chuàng)建壓縮圖像。在本實施例中,無需損失原始圖像的字符可見度,圖像處理設(shè)備11便可以實現(xiàn)尺寸的明顯減少。
圖63是用于解釋說明圖62中的圖像處理設(shè)備11的處理流程的方塊圖。
由于對圖像處理設(shè)備11使用了圖像掃描儀等,以及輸入帶有ゐ的上述多值原始圖像(S501),二值化原始圖像創(chuàng)建單元1111創(chuàng)建實現(xiàn)原始圖像OG的二值化的二值化原始圖像OGB(S502)。
隨后,特定屬性區(qū)域識別單元1112從原始圖像OG中確認(rèn)特定屬性區(qū)域(本實施例中的字符部分)的位置(S503)??梢园凑彰總€像素來獲知字符的位置。
字符部分的位置確定技術(shù)是公知的技術(shù),該技術(shù)也可以從多級圖像中直接確定字符部分的位置,從多級圖像中創(chuàng)建二值化原始圖像OGB(參見日本公開專利申請No.2002-288589),并且也可以從該二值化原始圖像OGB中確定字符部分的位置(參見日本公開專利申請No.06-020092)。
通過消除在步驟S503中識別的特定屬性區(qū)域之外的黑色像素(將黑色像素改變?yōu)楸尘邦伾?通常是白色))來執(zhí)行特定屬性區(qū)域的提取(S504)。
此外,格線提取單元112執(zhí)行格線提取(S505)。在本實施例中,基于由如上所述的二值化圖像創(chuàng)建單元1111創(chuàng)建的二值化原始圖像OGB來執(zhí)行格線的提取。
此外,由格線消除二值化原始圖像創(chuàng)建單元1113消除格線(S506)。也就是說,通過改變?yōu)榘咨袼貋韺崿F(xiàn)格線消除。
另外,步驟S504至S506可以調(diào)換順序。如上所述,創(chuàng)建了格線消除二值化原始圖像OGB’。
接下來,通過連通分量提取單元1114,從格線消除二值化原始圖像OGB’中提取黑色像素的連通分量(S507),并消除尺寸太大和太小的連通分量(S508)。
由于噪聲等,如果存在不是字符位于二值圖像的最頂端的可能性,則尺寸太小的連通分量將導(dǎo)致壓縮率的降低。
此外,字符區(qū)域的定位在技術(shù)上是困難的,并且不必提取正確的字符區(qū)域。因此,當(dāng)視圖區(qū)域以及照片區(qū)域位于原始圖像OG中時,該區(qū)域可能會被錯認(rèn)為是字符。因此,尺寸太大的連通分量具有不是字符的高可能性。
另外,雖然當(dāng)大尺寸的連通分量確實是字符時,其會根據(jù)該處理被意外地分類到背景中,但由于尺寸很大,其足可以被人的眼睛讀出。
當(dāng)格線沒有被消除時,它變成與格線相同的連通分量,尺寸變得很大,并且這里不可能提取與格線接觸的字符。因此,執(zhí)行格線消除具有易于提取與格線接觸的字符的效果。
例如,雖然如圖64A所示字符的一部分會被識別為獨立的字符或者字符的一部分和格線會被識別為圖像,當(dāng)依尺寸提取字符時,不需要區(qū)分字符和格線。盡管當(dāng)字符和格線分開時按尺寸提取字符,如圖64B所示,字符的識別是正確的。
由于在許多情況下格線是單色的,即使由二值圖像來再現(xiàn),也不會降低可見度。因而,再次畫出該格線并使得消除了字符以外內(nèi)容的格線消除二值化原始圖像OGB’作為二值圖像再次顯示(S509)。
此外,如果不是格線的部分,如照片部分,被作為格線進(jìn)行提取并由二值圖像進(jìn)行再現(xiàn),顏色數(shù)量將大量減少并將導(dǎo)致圖像質(zhì)量的下降。在這種情況下,也可能省略該處理。因此,格線將作為背景顏色被再現(xiàn)。
接下來,通過特定屬性區(qū)域消除圖像創(chuàng)建單元113產(chǎn)生消除了特定屬性區(qū)域(特定屬性區(qū)域)的特定屬性區(qū)域消除圖像OGE(S510)。
需要的只是創(chuàng)建由周圍的顏色具體取代格線消除二值化原始圖像OGB’中字符部分的像素的圖像。
具體地,該特定屬性區(qū)域消除圖像OGE是從二值化原始圖像OGB中移除了特定屬性區(qū)域(字符部分)以及格線的圖像。
然后,特定屬性區(qū)域顏色確定單元確定特定屬性區(qū)域的顏色(S511)。確定彩色圖像中所有位于構(gòu)成字符的黑色像素位置上的像素的顏色,并從該數(shù)據(jù)中選擇一些常用的主要顏色作為代表顏色。
以及確定每個像素以及構(gòu)成每個連通分量的字符的像素是否最接近某一個代表顏色。
通過特定屬性區(qū)域著色圖像創(chuàng)建單元115,創(chuàng)建具有特定屬性區(qū)域的特定屬性區(qū)域著色圖像CGG(具有繪制每個像素以及每個連通分量的顏色)(S512)。對于這種圖像來說,僅具有有限顏色的多級圖像是足夠的,并且它可以具有針對每種顏色的每一幅二值圖像。假設(shè)它具有針對每種顏色的每一幅二值圖像。
從編碼單元117創(chuàng)建的消除了特定屬性區(qū)域的圖像以及僅包括特定屬性區(qū)域的圖像中創(chuàng)建壓縮圖像(S513)。例如,如果前一個圖像執(zhí)行JPEG壓縮而后一個圖像執(zhí)行MMR壓縮,文件的尺寸將會明顯變小。
接下來,通過組合文件產(chǎn)生單元118組合成可以將僅包括特定屬性像素的圖像堆疊并顯示在消除了特定屬性區(qū)域的圖像上的格式(S514)。
如果組合了它們,將變成字符粘貼在背景上的形式,并可簡單地作為原始圖像OG。
圖65示出了在原始圖像OG中包含諸如照片之類的圖像IM的情況下,本發(fā)明優(yōu)選實施例中的圖像處理設(shè)備的功能方塊圖,以及圖66是示出了所涉及的圖像處理設(shè)備的處理流程圖。
雖然圖65的組成與圖62的簡略組成是相同的,但其與圖62中多值圖像提取單元119從原始圖像OG中分離字符以及提取諸如照片之類的圖像IM是不同的。在本實施例中,通過原始圖像OG將帶有格線FB的字符LT表示為圖像IM。
從該原始圖像OG提取圖像IM部分的多值原圖像OG1和全體進(jìn)行二值化,生成圖像(二值化原始圖像OGB)(A1、A2)。特定屬性區(qū)域提取單元111從二值化原始圖像OGB中提取特定屬性區(qū)域(字符部分)(A3),格線提取單元112從二值化原始圖像OGB中提取格線,通過格線描畫單元116進(jìn)行描畫(A4),同時由特定區(qū)域顏色確定單元114對二值化原始圖像OGB施加彩色,創(chuàng)建格線消除二值化原始圖像OGB’。
接著,編碼單元117進(jìn)行編碼,并通過組合文件產(chǎn)生單元118將圖像IM、格線部分FB(它們作為特定屬性區(qū)域消除圖像OGE)、以及格線消除二值化原始圖像OGB’(特定屬性區(qū)域(字符部分))合并起來(A6)。
參照圖67A至68,將解釋說明通過格線提取單元112執(zhí)行格線提取的情況。
圖67A和圖67B是示出了格線提取單元112的詳細(xì)結(jié)構(gòu)圖,如圖67A所示,格線提取單元112包括用于提取被認(rèn)為是相同顏色的長游程的相同顏色長游程提取單元1121,以及用于創(chuàng)建構(gòu)成由相同顏色長游程提取單元1121提取的分量長游程的連通分量的長游程連通分量創(chuàng)建單元1122。
此外,如圖67B所示,格線提取單元112包括用于提取被認(rèn)為是相同顏色的短游程的相同顏色短游程提取單元1123,以及用于創(chuàng)建構(gòu)成由相同顏色短游程提取單元1123提取的分量短游程的連通分量的短游程連通分量創(chuàng)建單元1124。
圖67A的格線提取單元112僅從黑色像素的游程(垂直連續(xù)的級別或黑色像素組)中提取長的游程,概括這些長游程所到達(dá)的位置,并將其分組作為連通分量。
僅將在游程的方向長、在與游程垂直的方向短、細(xì)長的連通分量看作格線。
此外,圖67B中的格線提取單元112僅從黑色像素的游程中提取短的游程,并從中提取連通分量。如果在游程方向上是短的,則認(rèn)為在垂直方向上的游程中僅有長的以及細(xì)長的連通分量是字符??梢允褂脠D67A或67B中示出的部件。
如圖68(A1)、(A2)及(A3)所示的小寫字母的情況,圖67A的格線提取單元112是非常傾斜和雜亂的,以及也可以提取小的像素。相反,如圖68(B1)、(B2)及(B3)所示,圖67B中的線格提取單元112是不太傾斜和雜亂的,并且不能提取小的像素(在每個視圖中,大寫字母示出了原始圖像OG以及小寫字母的繪制示出了由格線提取單元112提取的圖像)。
此外,盡管圖67A的格線提取單元112可以識別圖69(A)所示的格線,而圖67B的格線提取單元112不能識別圖69(B)所示的格線(在每個視圖中,大寫字母示出了原始圖像OG,小寫字母的繪制示出了由格線提取單元112提取的圖像)。
由于在上述圖67A和67B的格線提取單元112分別存在的優(yōu)缺點,如果使用了同時具有兩種功能的格線提取單元,格線提取中的遺漏將會減少。
通過上述處理,無需減少可見度,便可獲得文件尺寸的明顯壓縮。也就是說,雖然JPEG壓縮對于像素值急劇改變的圖像不具有很好的壓縮率,但如果通過在此描述的方法消除字符部分,由于將不會存在字符部分的像素值改變,效果會變好。
此外,由于字符部分急劇減少顏色數(shù)量,也由于這個原因壓縮率變好。如果字符作為二值圖像被再現(xiàn),由于輪廓在圖像質(zhì)量方面變得清晰,可見度也趨于改善。
圖62-圖69的上述實施例提供了一種圖像處理設(shè)備,包括特定屬性區(qū)域提取單元,用于從原始圖像中提取具有特定屬性的特定屬性區(qū)域;格線提取單元,用于提取包含在原始圖像中的格線;特定屬性區(qū)域消除圖像創(chuàng)建單元,用于創(chuàng)建從原始圖像中消除了由特定屬性區(qū)域提取單元提取的特定屬性區(qū)域的特定屬性區(qū)域消除圖像;特定屬性區(qū)域顏色確定單元,用于確定由特定屬性區(qū)域提取單元提取的特定屬性區(qū)域的顏色;和特定屬性區(qū)域著色圖像創(chuàng)建單元,用于創(chuàng)建至少一幅特定屬性區(qū)域著色圖像,其中該特定屬性區(qū)域的圖像是由特定屬性區(qū)域顏色確定單元確定的顏色繪制的。
根據(jù)本發(fā)明,在不降低可見性的情況下獲得了文件尺寸的顯著壓縮。即,盡管JPEG壓縮對于像素值急劇變化的圖像不具有很好的壓縮效率,但是由于通過JPEG方法以外的壓縮方法(適于字符等的MMR方法的壓縮)編碼字符區(qū)域,壓縮效率變高。此外,由于字符區(qū)域急劇減少了顏色數(shù)量,壓縮效率變好(由于執(zhí)行了二值化)。如果將字符再現(xiàn)為二值圖像,由于輪廓的圖像質(zhì)量變得清晰,可見性趨于改善。
上述圖像處理設(shè)備可以被配置為使得特定屬性區(qū)域提取單元包括用于通過原始圖像的二值化創(chuàng)建二值原始圖像的二值原始圖像創(chuàng)建單元,以及用于識別由二值原始圖像創(chuàng)建單元創(chuàng)建的二值原始圖像中的特定屬性區(qū)域的特定屬性區(qū)域識別單元,以及其中格線提取單元從由二值原始圖像創(chuàng)建單元創(chuàng)建的二值原始圖像中提取格線。
上述圖像處理設(shè)備可以被配置為使得特定屬性區(qū)域提取單元還包括格線消除二值圖像創(chuàng)建單元,用于創(chuàng)建從二值原始圖像中消除了由格線提取單元提取的格線的格線消除二值圖像;連通分量提取單元,從由格線消除二值圖像創(chuàng)建單元創(chuàng)建的格線消除二值圖像中提取連通分量;以及連通分量尺寸分類單元,用于對連通分量提取單元提取的連通分量的尺寸進(jìn)行分類。
上述圖像處理設(shè)備可以被配置為使得圖像處理設(shè)備還包括在連通分量尺寸分類單元的處理后再次將格線繪制到圖像中的格線繪制單元,所述格線是由格線消除二值圖像創(chuàng)建單元消除的格線。
上述圖像處理設(shè)備可以被配置為使得格線提取單元包括相同顏色長游程提取單元,用于提取被認(rèn)為具有相同顏色的長游程;以及長游程連通分量創(chuàng)建單元,用于創(chuàng)建由相同顏色長游程提取單元提取的長游程構(gòu)成的連通分量。
上述圖像處理設(shè)備可以被配置為使得格線提取單元包括相同顏色短游程提取單元,用于提取被認(rèn)為具有相同顏色的短游程;以及短游程連通分量創(chuàng)建單元,用于創(chuàng)建由相同顏色短游程提取單元提取的短游程構(gòu)成的連通分量。
上述圖像處理設(shè)備可以被配置為使得格線提取單元包括相同顏色長游程提取單元,用于提取被認(rèn)為具有相同顏色的長游程;長游程連通分量創(chuàng)建單元,用于創(chuàng)建由相同顏色長游程提取單元提取的長游程構(gòu)成的連通分量;相同顏色短游程提取單元,用于提取被認(rèn)為具有相同顏色的短游程;以及短游程連通分量創(chuàng)建單元,用于創(chuàng)建由相同顏色短游程提取單元提取的短游程構(gòu)成的連通分量。
圖62-圖69的上述實施例提供了一種圖像處理方法,包括以下步驟從原始圖像中提取具有特定屬性的特定屬性區(qū)域;提取包含在原始圖像中的格線;創(chuàng)建從原始圖像中消除了提取的特定屬性區(qū)域的特定屬性區(qū)域消除圖像;確定提取的特定屬性區(qū)域的顏色;創(chuàng)建至少一幅特定屬性區(qū)域著色圖像,其中該特定屬性區(qū)域的圖像是由確定步驟中確定的顏色繪制的。
上述圖像處理方法可以被配置為使得特定屬性區(qū)域提取步驟包括通過原始圖像的二值化創(chuàng)建二值原始圖像,以及其中格線提取步驟用于從創(chuàng)建的二值原始圖像中提取格線。
上述圖像處理方法可以被配置為使得特定屬性區(qū)域提取步驟還包括創(chuàng)建從二值原始圖像中消除由格線提取步驟提取的格線的格線消除二值圖像;從所創(chuàng)建的格線消除二值圖像中提取連通分量;以及對所提取的連通分量的尺寸進(jìn)行分類。
上述圖像處理方法可以被配置為使得圖像處理方法還包括在連通分量尺寸分類步驟的處理后再次將格線繪制到圖像中的步驟,所述格線是由格線消除二值圖像創(chuàng)建步驟消除的格線。
上述圖像處理方法可以被配置為使得格線提取步驟包括提取被認(rèn)為具有相同顏色的長游程;以及創(chuàng)建由提取的長游程構(gòu)成的連通分量。
上述圖像處理方法可以被配置為使得格線提取步驟包括提取被認(rèn)為具有相同顏色的短游程;以及創(chuàng)建由提取的短游程構(gòu)成的連通分量。
上述圖像處理方法可以被配置為使得格線提取步驟包括提取被認(rèn)為具有相同顏色的長游程;創(chuàng)建由提取的長游程構(gòu)成的連通分量;提取被認(rèn)為具有相同顏色的短游程;以及創(chuàng)建由提取的短游程構(gòu)成的連通分量。
圖62-圖69的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行上述圖像處理方法。
圖62-圖69的上述實施例提供了一種計算機(jī)可讀存儲介質(zhì),其中存儲了能夠使計算機(jī)執(zhí)行上述圖像處理方法。
接下來,圖70是由基于圖像處理程序13的圖像處理設(shè)備1執(zhí)行的處理的功能方塊圖。
圖像處理設(shè)備1通過圖像處理程序13執(zhí)行預(yù)處理單元621、字符圖像創(chuàng)建單元622、無字符圖像創(chuàng)建單元624、字符顏色指定單元625、圖像編碼單元626以及組合文件創(chuàng)建單元627各自的功能。
接下來,解釋說明各個單元的基本功能。
首先,預(yù)處理單元621在作為處理對象的原始圖像的多級文檔圖像(在本例中是24位彩色圖像)中執(zhí)行邊界突出(emphasis)處理、平滑處理等處理。
接著,字符圖像創(chuàng)建單元622基于該原始圖像(在本例中,是字符部分的位置)確定具有特定屬性的部分(特定屬性部分)的位置。
字符圖像創(chuàng)建單元623創(chuàng)建二值圖像,其中將相應(yīng)于作為多級圖像的原始圖像中不具有特定屬性的區(qū)域的該部分的像素值,以及將相應(yīng)于具有特定屬性的字符區(qū)域的部分的像素值改變?yōu)橄嗷ゲ煌南袼刂?。在本例中,在二值圖像中消除了除字符以外的黑色像素并將其改變?yōu)榘咨袼?。通過這種處理,可以按照每個像素獲知字符的位置。
字符顏色指定單元625確定作為特定屬性部分的字符的顏色。字符顏色指定單元625確定構(gòu)成字符的黑色字符的位置上的彩色圖像中所有像素的顏色,并基于該顏色數(shù)據(jù)選擇圖像中常用的一些主要顏色作為代表顏色。
對每個像素或者每個連通分量,判斷構(gòu)成字符的像素最接近哪種代表色。然后,創(chuàng)建其中帶有特定屬性的像素具有對每個像素或者每個連通分量判斷了的顏色的圖像。
僅具有有限顏色的多級圖像也是令人滿意的,并且可以實現(xiàn)為每種顏色的每個二值圖像創(chuàng)建這種圖像。
無字符圖像創(chuàng)建單元624創(chuàng)建消除了作為特定屬性部分的字符的圖像。應(yīng)該恰好創(chuàng)建用彩色圖像中的周圍顏色取代了用作特定屬性部分的字符部分像素的圖像。
圖像編碼單元626從消除了創(chuàng)建的特定屬性像素而創(chuàng)建的圖像(無字符圖像)以及僅由特定屬性像素構(gòu)成的圖像(字符圖像)中創(chuàng)建壓縮圖像。其壓縮例如,可以由JPEG方法對無字符圖像進(jìn)行壓縮,字符圖像通過MMR方法或PNG方法等進(jìn)行壓縮等,由此文件尺寸顯著變小。
通過組合文件創(chuàng)建單元627以可以將字符圖像堆疊并顯示在無字符圖像上的格式組合文件。因此,如果解碼合并及創(chuàng)建的圖像,將組合這些圖像,變成在背景上粘貼字符的形式,并可簡單地認(rèn)作原始圖像。
接下來,將舉例說明圖70示出的圖像處理設(shè)備1執(zhí)行的其他功能的功能方塊圖。
在本例中,說明不同于上述功能范例的區(qū)別點,并省略了共有的細(xì)節(jié)說明。在本例中,例如字符顏色指定單元625和圖像編碼單元626的功能是不同的。
字符顏色指定單元625從僅有由其創(chuàng)建的字符的二值圖像中創(chuàng)建字符屏蔽圖像。通過屏蔽處理保留Bit ON(比特開)(這里的黑色像素),并對屏蔽處理沒有保留下的像素Bit OFF(比特關(guān))(這里的白色像素)的像素進(jìn)行處理。
此外,從原始圖像中獲取相應(yīng)于特定屬性區(qū)域的黑色像素的字符顏色,并去除作為特定屬性部分的字符的黑色像素。
將該圖像創(chuàng)建為前景圖像(顏色信息)。此時,將除字符以外的像素部分繪制成背景顏色。
圖像編碼單元626通過JPEG(DCT)方法執(zhí)行背景圖像的壓縮編碼,通過MMR方法對僅含有特定屬性像素的字符屏蔽圖像執(zhí)行壓縮編碼,通過JPEG(DCT)方法對僅繪制了特定屬性部分的前景圖像進(jìn)行壓縮編碼。
接下來,將解釋說明圖像處理設(shè)備1所執(zhí)行的特性處理的內(nèi)容。
圖71是用于解釋說明由字符顏色指定單元625執(zhí)行的特性處理的功能方塊圖。
在字符顏色指定單元625中,通過由字符圖像創(chuàng)建單元622創(chuàng)建作為輸入的字符圖像(包括格線)、由預(yù)處理單元621完成的24位彩色圖像、以及創(chuàng)建著色的字符圖像來執(zhí)行“字符區(qū)域的代表顏色計算處理”、“字符顏色指定處理”以及“伽瑪校正處理”。
首先,代表顏色計算單元631執(zhí)行將字符區(qū)域的顏色減少到用戶指定的顏色數(shù)量的處理。“字符區(qū)域顏色直方圖的創(chuàng)建”以及“對于代表顏色選擇的直方圖”是很大的,該處理由兩項處理組成。
接下來,將說明這些處理。
字符區(qū)域顏色直方圖創(chuàng)建從預(yù)處理單元621創(chuàng)建的24位彩色圖像中獲取相當(dāng)于由字符圖像創(chuàng)建單元622創(chuàng)建的僅包含字符的二值圖像的字符的部分的像素值,并創(chuàng)建RGB顏色直方圖。其在RGB中量化8個顏色組成部分的每個,創(chuàng)建的直方圖將彩色空間分割成8×8×8個顏色,計算屬于該空間的像素數(shù)量。
從直方圖中選擇代表顏色從上述創(chuàng)建的RGB直方圖中按照頻率大的順序選擇出128種顏色,作為最初的代表顏色。然而,在某種程度上,由于如果按慣例進(jìn)行選擇會選擇出大量無色彩顏色,對于無色彩顏色來說,對上述應(yīng)用進(jìn)行限制以使得不對它們進(jìn)行選擇。
如果選擇的無色彩顏色超過了用戶給出的最大字符顏色數(shù)量的一半,將不再進(jìn)行選擇。然而,僅排除了構(gòu)成字符的合理的黑色,并且即使它超出了半數(shù),也是通過添加(addition)來選擇顏色。
接下來,選擇最接近所選擇顏色的顏色對,并從代表顏色中刪除具有少量像素的情況。重復(fù)該操作并直到減少到用戶所給出的顏色數(shù)。此外,即使最接近的顏色降低到用戶指定的顏色,該顏色小于事先定義的閾值時,確定該減少的顏色是不足夠的并繼續(xù)進(jìn)行顏色減少處理。由于這種原因,用戶給出的顏色數(shù)量變成給出稱為最大顏色數(shù)量的情況。
黑色連通分量構(gòu)成的矩形的尺寸小于預(yù)定尺寸時,字符顏色指定處理單元632確定每個字符(矩形單元)的顏色。
首先,創(chuàng)建黑色連通分量中除字符邊緣之外的字符筆劃中的顏色平均值(RGB值)以及構(gòu)成字符的所有像素的RGB顏色平均值。
接下來,確定這些顏色是否是無色的。確定小的連通分量中字符筆劃中的顏色平均值,并將構(gòu)成字符的所有像素的顏色平均值與上述的代表顏色進(jìn)行比較,將最接近的代表顏色作為可使用矩形的字符顏色。
雖然當(dāng)僅有背景像素以及接觸像素時,為了阻止背景顏色的混合,也可考慮將最暗的顏色與代表顏色相比較,但當(dāng)連通分量的筆劃較細(xì),并且最暗顏色中的顏色傾向于在字符中改變并最終再次顯示為字符時,可以在字符中改變該顏色。
然后,將組成字符的所有像素的顏色平均值與代表顏色相比。此外,在字符筆劃中,當(dāng)存在背景像素和不接觸的像素時,將顏色平均值與代表顏色進(jìn)行比較。
然而,需要的顏色平均值是無色彩顏色(當(dāng)每個RGB值的差值的絕對值小于預(yù)定閾值時)。例如,當(dāng)|R-G|<th時,通過將該值與從RGB值減去預(yù)定值所得到的代表顏色相比較來改善黑色像素的再現(xiàn)性。
由于根據(jù)輸入圖像和字符顏色的分類結(jié)果,字符顏色可能變亮或者伽瑪校正單元6 33可能變暗,為了調(diào)整字符圖像的亮度值,執(zhí)行圖72所示的伽瑪校正。伽瑪校正在RGB中共同進(jìn)行。
接下來,參照圖73解釋說明無字符圖像創(chuàng)建單元624中的處理流程。
通過用“字符的周圍顏色的規(guī)范”取代字符區(qū)域的顏色,從預(yù)處理單元621中輸出用于創(chuàng)建無字符圖像的24位彩色圖像,并通過考慮從字符圖像創(chuàng)建單元622中輸出的僅包含字符的二值圖像確定作為輸入的字符周圍顏色。執(zhí)行“字符區(qū)域移除(暫時的)處理”、“分辨率轉(zhuǎn)換(低分辨率處理)”、“平滑”以及“伽瑪校正”中的每一個處理。
首先,在周圍顏色指定單元641中執(zhí)行字符的周圍顏色指定處理。在開始時,建立相應(yīng)于僅由字符構(gòu)成的二值圖像的字符矩形的外圍矩形坐標(biāo)的彩色圖像的像素值。
求出計算出的像素值的平均值并將它作為圍繞連通分量的顏色。此外,由于其對應(yīng)于字符的輸入,因此僅針對作為二值圖像的白色像素的像素。
接下來,在字符區(qū)域移除單元642中執(zhí)行圖像的字符區(qū)域移除(暫時的)處理。也就是,將從周圍顏色指定單元641所需要的周圍顏色中構(gòu)成彩色圖像的字符的部分的像素值換成周圍顏色。
由于可以近似認(rèn)為周圍顏色就是背景顏色,將創(chuàng)建消除了字符的彩色圖像。
并且在分辨率轉(zhuǎn)換單元643中執(zhí)行圖像的分辨率轉(zhuǎn)換(低分辨率處理)。也就是,旨在通過背景圖像的低分辨率處理獲得文件尺寸的減小。盡管用戶可以指定低分辨率處理的級別,將2×2個像素合計成一個像素的標(biāo)準(zhǔn)的級別是有益的。
具體地,確定移除字符的彩色圖像的2×2像素的平均顏色,并將具有低分辨率的背景圖像中的每個像素的像素值轉(zhuǎn)換成這個平均顏色的像素值。
接下來,通過平滑處理單元644執(zhí)行平滑處理。也就是,當(dāng)照片包含在背景圖像中時,如果將它改變?yōu)榈头直媛?,在該部分的再現(xiàn)圖像中將可能產(chǎn)生缺陷。然后,對背景圖像進(jìn)行平滑處理。通過給出與原始圖像的平滑處理相似的3×3像素尺寸的空間濾波來執(zhí)行平滑處理。
由伽瑪校正單元645執(zhí)行伽瑪校正處理。取決于處理后的圖像打印機(jī)的合并,將由上述處理中通過獲取圖像處理設(shè)備1處理的原始圖像的掃描儀獲得的圖像可以再現(xiàn)成全部的暗色或亮色。然后,為了調(diào)整背景圖像的亮度值,執(zhí)行如圖72所示的伽瑪校正。
在RGB中共同進(jìn)行伽瑪校正處理。這具有在由JPEG方法對背景圖像進(jìn)行壓縮時提高壓縮率的效果。
通過上述的組成部件,通過圖像處理設(shè)備1,在將圖像分割成字符圖像和無字符圖像之后,圖像分割成字符圖像和無字符圖像,伽瑪校正單元33和45分別獨立地執(zhí)行伽瑪校正。
由于它全是暗的,并且背景圖像可以執(zhí)行分別在字符圖像與無字符圖像之間不同的灰度校正,例如希望將它變亮,盡管因為字符圖像是帶黑色的而希望將它變亮,其可以響應(yīng)想要分別在字符圖像和無字符圖像中執(zhí)行不同的灰度校正的用戶的請求。
此外,在通過平滑處理單元644對無字符圖像進(jìn)行平滑處理之前,通過周圍顏色指定單元641執(zhí)行周圍顏色的指定處理。在周圍顏色指定單元641中,雖然執(zhí)行了字符的周圍顏色的指定處理,在圖像平滑之后完成該處理時,將字符顏色混入到字符的周圍顏色中,并將字符顏色保留在無字符圖像中。
接著,在平滑處理單元644的平滑處理之前,通過由周圍顏色指定單元641對周圍顏色的指定處理,字符顏色不能保留在無字符圖像中,并可以將無字符圖像正確分離。
此外,在平滑單元644對無字符圖像進(jìn)行的平滑處理之前,還通過分辨率轉(zhuǎn)換單元643將分辨率轉(zhuǎn)換成低分辨率。這是由于,如果通過分辨率轉(zhuǎn)換減小圖像的尺寸,可以高速執(zhí)行平滑處理。
另外,在分辨率轉(zhuǎn)換單元643將分辨率轉(zhuǎn)換成低分辨率之前,通過周圍顏色指定單元641執(zhí)行周圍顏色的指定。這是由于,如果將分辨率轉(zhuǎn)換成低分辨率,字符圖像的位置將會變得模糊不清并且將難于正確地執(zhí)行字符周圍顏色的指定處理。
圖70-圖73的上述實施例提供了一種圖像處理設(shè)備,包括基于從多級圖像創(chuàng)建的二值圖像或作為原始圖像的多級圖像來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置的單元;創(chuàng)建二值字符圖像的單元,其中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像的單元,其中用原始圖像的背景顏色來改變原始圖像中的特定屬性區(qū)域的像素值;對所創(chuàng)建的多級無字符圖像執(zhí)行伽瑪校正的單元;確定構(gòu)成特定屬性區(qū)域的像素顏色的單元;基于二值字符圖像,創(chuàng)建具有所確定的顏色的特定屬性區(qū)域的二值或多級圖像的單元;對所創(chuàng)建的特定屬性區(qū)域的二值或多級圖像執(zhí)行伽瑪校正的單元;圖像編碼單元,用于分別對伽瑪轉(zhuǎn)換之后的每個多級無字符圖像、伽瑪轉(zhuǎn)換之后的特定屬性區(qū)域的二值或多級的每個執(zhí)行壓縮編碼;以及組合文件創(chuàng)建單元,用于創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件。
根據(jù)本發(fā)明,可以從處理對象圖像創(chuàng)建諸如字符的特定屬性部分的圖像和其它部分的圖像,可以獨立地對這些圖像中的每一個進(jìn)行伽瑪校正,使得能夠根據(jù)圖像的屬性進(jìn)行伽瑪校正,并可以滿足用戶的請求。
圖70-圖73的上述實施例提供了一種圖像處理設(shè)備,包括基于作為多級圖像的原始圖像或從多級圖像創(chuàng)建的二值圖像,來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置的單元;創(chuàng)建二值字符圖像的單元,在該二值字符圖像中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;對所創(chuàng)建的二值字符圖像執(zhí)行伽瑪校正的單元;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像的單元,其中,將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;確定構(gòu)成特定屬性區(qū)域的像素顏色的單元;創(chuàng)建表示所確定的顏色的顏色信息的單元;對所創(chuàng)建的顏色信息執(zhí)行伽瑪校正的單元;圖像編碼單元,用于分別對伽瑪轉(zhuǎn)換之后的多級無字符圖像、特定屬性區(qū)域的二值字符圖像、以及枷瑪轉(zhuǎn)換之后的顏色信息中的每個進(jìn)行壓縮編碼;以及組合文件創(chuàng)建單元,用于創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件。
圖70-圖73的上述實施例提供了一種圖像處理設(shè)備,包括基于作為原始圖像的多級圖像或從多級圖像創(chuàng)建的二值圖像中的任何一個,來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置的單元;創(chuàng)建二值字符圖像的單元,在該二值字符圖像中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像的單元,其中,用于將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;確定構(gòu)成特定屬性區(qū)域的像素顏色的單元;基于二值字符圖像創(chuàng)建具有所確定的顏色的特定屬性區(qū)域的二值或多級圖像的單元;圖像編碼單元,用于分別對多級無字符圖像以及特定屬性區(qū)域的二值或多級圖像中的每個進(jìn)行壓縮編碼;以及組合文件創(chuàng)建單元,用于創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件,其中多級無字符圖像創(chuàng)建單元包括確定原始圖像中特定屬性區(qū)域周圍顏色的單元;用原始圖像中的周圍顏色取代特定屬性區(qū)域的像素值的單元;以及平滑處理單元,在確定周圍顏色之后對作為原始圖像的多級圖像進(jìn)行平滑處理。
圖70-圖73的上述實施例提供了一種圖像處理設(shè)備,包括基于作為原始圖像的多級圖像或從多級圖像創(chuàng)建的二值圖像中的任何一個,來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置的單元;創(chuàng)建二值字符圖像的單元,其中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像的單元,其中,用于將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;確定構(gòu)成特定屬性區(qū)域的像素顏色的單元;創(chuàng)建表示所確定的顏色的顏色信息的單元;圖像編碼單元,用于分別對多級無字符圖像、特定屬性區(qū)域的二值字符圖像、以及顏色信息中的每個實現(xiàn)壓縮編碼;以及組合文件創(chuàng)建單元,用于創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件,其中多級無字符圖像創(chuàng)建單元包括確定原始圖像中特定屬性區(qū)域周圍顏色的單元;用原始圖像中的周圍顏色取代特定屬性區(qū)域的像素值的單元;以及平滑處理單元,在確定周圍顏色之后對作為原始圖像的多級圖像進(jìn)行平滑處理。
上述圖像處理設(shè)備可以被配置為使得多級無字符圖像創(chuàng)建單元還包括分辨率轉(zhuǎn)換單元,用于在執(zhí)行平滑處理之前將作為原始圖像的多級圖像的分辨率轉(zhuǎn)換成低分辨率。
上述圖像處理設(shè)備可以被配置為使得多級無字符圖像創(chuàng)建單元還包括分辨率轉(zhuǎn)換單元,用于在執(zhí)行平滑處理之前將作為原始圖像的多級圖像的分辨率轉(zhuǎn)換成低分辨率。
上述圖像處理設(shè)備可以被配置為使得分辨率轉(zhuǎn)換單元用于在確定周圍顏色之后將作為原始圖像的多級圖像的分辨率轉(zhuǎn)換成低分辨率。
上述圖像處理設(shè)備可以被配置為使得分辨率轉(zhuǎn)換單元用于在確定周圍顏色之后將作為原始圖像的多級圖像的分辨率轉(zhuǎn)換成低分辨率。
上述圖像處理設(shè)備可以被配置為使得圖像處理設(shè)備還包括通信控制設(shè)備,用于通過預(yù)定網(wǎng)絡(luò)傳送組合文件。
上述圖像處理設(shè)備可以被配置為使得圖像處理設(shè)備還包括用于分別對包含在組合文件中的每一個編碼圖像進(jìn)行解碼的單元。
圖70-圖73的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟基于作為原始圖像的多級圖像或從多級圖像創(chuàng)建的二值圖像中的任何一個來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置;創(chuàng)建二值字符圖像,在該二值字符圖像中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像,其中將原始圖像中的特定屬性區(qū)域的像素改變?yōu)樵紙D像的背景顏色;對所創(chuàng)建的多級無字符圖像執(zhí)行伽瑪校正;確定構(gòu)成特定屬性區(qū)域的像素顏色;基于二值字符圖像,創(chuàng)建具有所確定的顏色的特定屬性區(qū)域的二值或多級圖像;執(zhí)行所創(chuàng)建的特定屬性區(qū)域的二值或多級圖像的伽瑪轉(zhuǎn)換;分別對伽瑪轉(zhuǎn)換之后的多級無字符圖像和伽瑪轉(zhuǎn)換后的特定屬性區(qū)域的二值或多級圖像實現(xiàn)壓縮編碼;以及創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件。
圖70-圖73的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟基于作為原始圖像的多級圖像或從多級圖像創(chuàng)建的二值圖像中的任何一個來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置;創(chuàng)建二值字符圖像,其中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;對所創(chuàng)建的二值字符圖像執(zhí)行伽瑪校正;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像,其中,將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;確定構(gòu)成特定屬性區(qū)域的像素顏色;創(chuàng)建表示所確定的顏色的顏色信息;對所創(chuàng)建的顏色信息執(zhí)行伽瑪轉(zhuǎn)換;分別對伽瑪轉(zhuǎn)換之后的多級無字符圖像、特定屬性區(qū)域的二值字符圖像、以及伽瑪轉(zhuǎn)換之后的顏色信息中的每個實現(xiàn)壓縮編碼;以及創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件。
圖70-圖73的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟基于作為原始圖像的多級圖像或從多級圖像創(chuàng)建的二值圖像中的任何一個來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置;創(chuàng)建二值字符圖像,其中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像,其中,將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;確定構(gòu)成特定屬性區(qū)域的像素顏色;基于二值字符圖像,創(chuàng)建具有確定顏色的特定屬性區(qū)域的二值或多級圖像;分別對多級無字符圖像以及特定屬性區(qū)域的二值或多級圖像中的每個實現(xiàn)壓縮編碼;以及創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件,其中多級無字符圖像創(chuàng)建步驟包括確定原始圖像中特定屬性區(qū)域周圍顏色;用原始圖像中的周圍顏色取代特定屬性區(qū)域的像素值;以及在確定周圍顏色之后對作為原始圖像的多級圖像進(jìn)行平滑處理。
圖70-圖73的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟基于作為原始圖像的多級圖像或從多級圖像創(chuàng)建的二值圖像中的任何一個來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置;創(chuàng)建二值字符圖像,其中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像,其中,將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;確定構(gòu)成特定屬性區(qū)域的像素顏色;創(chuàng)建表示所確定的顏色的顏色信息;分別對多級無字符圖像、特定屬性區(qū)域的二值字符圖像、以及顏色信息中的每個實現(xiàn)壓縮編碼;以及創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件,其中多級無字符圖像創(chuàng)建步驟包括確定原始圖像中特定屬性區(qū)域周圍顏色;用原始圖像中的周圍顏色取代特定屬性區(qū)域的像素值;以及在確定周圍顏色之后對作為原始圖像的多級圖像進(jìn)行平滑處理。
上述計算機(jī)程序產(chǎn)品可以被配置為使得圖像處理方法還包括分辨率轉(zhuǎn)換步驟,執(zhí)行平滑處理之前將作為原始圖像的多級圖像的分辨率轉(zhuǎn)換成低分辨率。
上述計算機(jī)程序產(chǎn)品可以被配置為使得圖像處理方法還包括分辨率轉(zhuǎn)換步驟,在執(zhí)行平滑處理之前將作為原始圖像的多級圖像的分辨率轉(zhuǎn)換成低分辨率。
上述計算機(jī)程序產(chǎn)品可以被配置為使得分辨率轉(zhuǎn)換步驟用于在確定周圍顏色之后將作為原始圖像的多級圖像的分辨率轉(zhuǎn)換成低分辨率。
上述計算機(jī)程序產(chǎn)品可以被配置為使得分辨率轉(zhuǎn)換步驟用于在確定周圍顏色之后將作為原始圖像的多級圖像的分辨率轉(zhuǎn)換成低分辨率。
圖70-圖73的上述實施例提供了計算機(jī)可讀存儲介質(zhì),其中存儲了能夠使計算機(jī)執(zhí)行圖像處理方法的程序,該圖像處理方法包括以下步驟基于作為原始圖像的多級圖像或從多級圖像創(chuàng)建的二值圖像中的任何一個來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置;創(chuàng)建二值字符圖像,其中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像,其中將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;對所創(chuàng)建的多級無字符圖像執(zhí)行伽瑪轉(zhuǎn)換;確定構(gòu)成特定屬性區(qū)域的像素顏色;根據(jù)二值字符圖像,創(chuàng)建具有所確定的顏色的特定屬性區(qū)域的二值或多級圖像;執(zhí)行所創(chuàng)建的特定屬性區(qū)域的二值或多級圖像的伽瑪轉(zhuǎn)換;分別對伽瑪轉(zhuǎn)換之后的多級無字符圖像和伽瑪轉(zhuǎn)換后的特定屬性區(qū)域的二值字符圖像實現(xiàn)壓縮編碼;以及創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件。
接下來,圖74是圖像處理設(shè)備701基于圖像處理程序13所執(zhí)行的處理的功能方塊圖。此外,圖75是該處理的流程圖。
首先,多級圖像輸入單元701通過未示出的圖像掃描儀獲取作為處理對象的原始圖像的多值的文檔圖像(步驟S701)。
特定屬性區(qū)域提取單元704從該文檔圖像中定位具有特定屬性的部分(特定屬性部分)的位置,例如字符部分(步驟S705)。
在本例中,應(yīng)當(dāng)從多級圖像中創(chuàng)建二值圖像(步驟S704),并從二值圖像中獲取該特定屬性部分。
白色像素置換單元705消除二值圖像中除字符以外的黑色像素并將其轉(zhuǎn)換成白色像素,并建立它們的二值圖像(步驟S706)。通過該處理,將按照每個像素獲知字符的位置。
通過特定屬性區(qū)域消除圖像創(chuàng)建單元703創(chuàng)建消除了特定屬性區(qū)域的圖像(步驟S708)。這應(yīng)當(dāng)創(chuàng)建恰好通過用彩色圖像中的周圍顏色替換作為特定屬性部分的字符部分的像素的圖像。
接下來,特定屬性區(qū)域顏色確定單元706確定特定屬性部分的顏色(步驟S709)。該步驟確定了位于構(gòu)成字符的黑色像素位置上所有像素的顏色,并從該數(shù)據(jù)中確定在圖像常用的一些主要顏色作為代表顏色。并確定每個像素以及構(gòu)成每個連通分量的字符的像素是否最接近某個代表顏色。
通過特定屬性像素圖像創(chuàng)建單元707創(chuàng)建其中具有特定屬性的像素具有每個像素和為每個連通分量確定的顏色的圖像(步驟S710)。在這種情況下,僅具有有限顏色的多級圖像也是足夠的,并可能實現(xiàn)為每種顏色創(chuàng)建每一幅二值圖像。
圖像編碼單元708從消除了特定屬性像素的圖像中創(chuàng)建壓縮圖像,并創(chuàng)建僅含有特定屬性像素的圖像(步驟S713)。并考慮對字符圖像使用MMR方法或PNG方法進(jìn)行壓縮,對圖案圖像通過JPEG方法進(jìn)行壓縮等,由此,文件尺寸將有效減小。
通過使用組合文件創(chuàng)建單元709將僅包含特定屬性像素的圖像堆疊并顯示在消除了特定屬性區(qū)域的圖像上(步驟S714)。如果組合這些圖像,將變成字符粘貼在背景上的形式,并可以簡單地認(rèn)作為原始圖像。
通過執(zhí)行上述處理,無需將可見度減少太多,就可以得到文件尺寸的明顯壓縮。理由如下。
盡管JPEG方法對具有像素值急劇改變的圖像沒有很好的壓縮效果,但如果通過處理從圖像中消除了字符部分,由于將不會存在字符部分的像素值的改變,因此將改善JPEG方法的壓縮率(步驟S713)。
由于字符部分急劇減少了顏色數(shù)量,也正因如此,壓縮率得到改善。
接下來,將解釋說明基于圖像處理程序13的圖像處理設(shè)備701執(zhí)行的特有處理。該處理是為了進(jìn)一步提高圖像質(zhì)量和可壓縮性而執(zhí)行的。
(A)檢查連通分量的尺寸在執(zhí)行了步驟S706的處理之后,步驟S708的處理之前,從消除了字符以外的像素的二值圖像中提取黑色像素的連通分量,并通過連通分量尺寸檢查單元713檢查連通分量的尺寸(步驟S707)。
也就是,進(jìn)一步消除了小于預(yù)定基準(zhǔn)點的部分以及連通分量中大于預(yù)定基準(zhǔn)點的另一較大部分。由于噪聲等原因,如果存在不是字符位于二值圖像的最頂端的可能性,尺寸太小的連通分量將導(dǎo)致壓縮率的降低。
此外,字符區(qū)域的定位在技術(shù)上是困難的,并且不必提取正確的字符區(qū)域。因此,當(dāng)視圖區(qū)域以及照片區(qū)域位于在前的圖像中時,也排除了在其中出錯以及被認(rèn)為沒有完成字符的可能性。因此,尺寸太大的連通分量比這些字符具有更高的可能性。
另外,雖然當(dāng)大尺寸的連通分量確實是字符時,根據(jù)該處理其會被意外地分類到背景中,但由于尺寸很大,其足可以由人的眼睛讀出。
圖76A示出了輸入圖像的鄰接字符中“接觸字符”的部分。圖76B示出了當(dāng)傳統(tǒng)方法提取接觸字符時的提取結(jié)果。
通過該傳統(tǒng)方法,確定了從分辨率以及標(biāo)準(zhǔn)字符的尺寸(10.5pt)中顯示為字符的連通分量的外接矩形尺寸n,并除非該矩形在限定的n×n尺寸中,未完成特定屬性部分的提取,如字符部分。
通過這種方法,從消除了字符以外的像素的二值圖像(或多級圖像)中提取黑色像素的連通分量。并需要請求在輸入圖像的分辨率及標(biāo)準(zhǔn)字符尺寸(10.5pt)中首先顯示為字符的外接矩形的高度尺寸n(也就是,根據(jù)輸入圖像的分辨率而改變n值),以及判定用于相應(yīng)于諸如字符部分的特定屬性部分的像素的取值的范圍(閾值)。該閾值使用矩形部分的尺寸n×m,其中n代入上述值,m的值可以從使用建立接觸字符長度的閾值Thr的以下公式(1)中獲得。
由于寬度尺寸大于字符的高度,接觸字符不能提取接觸字符,除非將m值設(shè)置成大于n。因此,通過將條件m>n作為寬度和高度大致比例的標(biāo)準(zhǔn),建立Thr的值以將比例設(shè)置成1∶3。在此后的說明中,暫時假設(shè)“Thr=3”。
m=n×Thr……(1)連同圖77的流程圖,將解釋說明步驟S707的處理,也就是圖76A的對接觸字符的提取處理。
首先,從字符、照片以及背景共存的輸入圖像或二值圖像中執(zhí)行字符提取處理(步驟S721)。字符提取處理可以通過使用傳統(tǒng)的使用連通分量的公知字符提取處理。
圖76B中由虛線示出步驟S721提取的矩形部分。并分別確定該矩形部分的寬度和高度是否在n×m的界限中(步驟S722)。
作為判斷的結(jié)果,當(dāng)是在界限內(nèi)時(步驟S722為是),它的矩形部分被判斷為字符圖像(步驟S723)。當(dāng)超出該范圍時(步驟S722為否),判定其為背景圖像(步驟S724)。
(B)圖像的基礎(chǔ)化(radicalization)通過基礎(chǔ)化單元711,在步驟S701進(jìn)行輸入,并在步驟S704創(chuàng)建二值圖像之前,在彩色圖像中進(jìn)行基礎(chǔ)化(步驟S702)。當(dāng)可以通過彩色圖像中具有淡的邊緣的圖像來表示,并用其進(jìn)行二值化處理時,字符將變模糊,對可讀性的感覺以及字符的壓縮率下降。也就是說,字符的可讀性通過基礎(chǔ)化而改善。
(C)圖像的平滑處理在進(jìn)行步驟S702的基礎(chǔ)化和在步驟S704創(chuàng)建二值圖像之前,通過平滑處理單元712平滑處理彩色圖像(步驟S703)。這是為了用互不相同的精細(xì)顏色的像素集合表現(xiàn)中色(neutral color)并且用該其在彩色圖像中執(zhí)行二值化時,將字符筆劃的內(nèi)部變成完全由孔構(gòu)成的二值圖像,以及降低字符圖像的壓縮率。
然后,由于在平滑處理后可以得到字符筆劃內(nèi)部通過實現(xiàn)二值化而改變的二值圖像,因此改善了字符圖像的壓縮率。
此外,可以實現(xiàn)對消除了字符的彩色圖像(背景圖像)的圖像平滑處理。由于背景圖像執(zhí)行JPEG壓縮,這有益于通過平滑處理增加對壓縮率的抑制,以及由于低分辨率的轉(zhuǎn)化而可能產(chǎn)生的波紋。
(D)對比度調(diào)整在步驟S710的處理之后,步驟S713的處理之前,執(zhí)行消除了特定屬性像素的圖像(背景圖像)以及僅由特定屬性像素構(gòu)成的二值圖像(字符圖像)的對比度轉(zhuǎn)換(步驟S711),削弱該對比度,并通過對比度調(diào)整單元714形成平滑圖像。
由于壓縮率很高,使得當(dāng)通過JPEG方法在背景圖像中壓縮時,像素值幾乎不變化。雖然即使執(zhí)行對比度轉(zhuǎn)換也不會在尺寸上產(chǎn)生影響,由于字符圖像使用的是MMR方法等,當(dāng)組合并顯示它們時,執(zhí)行與背景圖像相同的對比度轉(zhuǎn)換,以使得不會變成不自然的色調(diào)。
(E)分辨率轉(zhuǎn)換在步驟S711的處理之后,步驟S713的處理之前,實現(xiàn)分辨率轉(zhuǎn)換,并通過分辨率轉(zhuǎn)換單元715將消除了特定屬性像素的圖像設(shè)置成低分辨率(步驟S712)。
由于即使背景圖像的分辨率有些低,對比于字符圖像的可見度的影響也是很小的,因此考慮壓縮率并改變?yōu)榈头直媛省?br> 將解釋說明本發(fā)明的另一優(yōu)選實施例。由于本實施例的圖像處理設(shè)備701的硬件組成與圖1是相同的,將省略對它的詳細(xì)說明。
圖78是圖像處理設(shè)備701基于圖像處理程序13所執(zhí)行的處理的功能方框圖。此外,圖79是該處理的流程圖。
在圖78和圖79中,使用相同的附圖標(biāo)記來表示與圖74和圖75的相應(yīng)元素相同的元素,并將省略對它們的詳細(xì)說明。
特定屬性區(qū)域消除圖像創(chuàng)建單元703創(chuàng)建消除了特定屬性部分的圖像(步驟S708)。該步驟應(yīng)當(dāng)通過彩色圖像中的周圍顏色來創(chuàng)建替換了字符部分的像素的圖像。
字符屏蔽圖像創(chuàng)建單元721從在步驟S706創(chuàng)建的僅包含字符的二值圖像中創(chuàng)建字符屏蔽圖像(步驟S731)。通過屏蔽處理保留像素Bit ON(這里的黑色像素),并對屏蔽處理沒有保留下的像素Bit OFF(這里的白色像素)的像素進(jìn)行處理。
用于繪制相應(yīng)于特定屬性區(qū)域的黑色圖像部分的顏色的單元722從在步驟S701輸入的彩色圖像中獲取相應(yīng)于特定屬性部分的黑色像素的字符顏色,并去除特定屬性部分的黑色像素(步驟S732)。
前景圖像創(chuàng)建單元723創(chuàng)建在步驟S732繪制的圖像作為前景圖像(顏色信息)(步驟S733)。此時,將字符以外的像素部分繪制成背景顏色。
圖像編碼單元708通過JPEG(DCT)方法壓縮由特定屬性區(qū)域消除圖像創(chuàng)建單元703創(chuàng)建的消除了特定屬性像素的背景圖像,通過MMR方法壓縮僅由特定屬性像素構(gòu)成的字符屏蔽圖像,以及通過JPEG(DCT)方法壓縮僅繪制了特定屬性部分的前景圖像(步驟S713)。
組合文件創(chuàng)建單元709將文件組合成可以堆疊并顯示下述內(nèi)容的形式保留了相應(yīng)于黑色像素部分的像素的前景圖像、應(yīng)用到消除了特定屬性區(qū)域的背景圖像的字符屏蔽、以及僅由特定屬性像素構(gòu)成的前景圖像(步驟S714)。
如果將它們合并,將變成字符粘貼在背景之上的形式,并可簡單地認(rèn)為是原始圖像。
在上述實施例中,圖像處理設(shè)備701可以通過上述圖80的處理創(chuàng)建的文件的解碼,其可以由圖像來表示。也就是,輸入上述創(chuàng)建的組合文件(步驟S741),并分別解碼和顯示包含在組合文件中的每一個編碼圖像(步驟S742)。組合并顯示每一個解碼圖像(步驟S744)。
在這種情況下,當(dāng)通過分辨率轉(zhuǎn)換單元715執(zhí)行如上所述的圖像分辨率轉(zhuǎn)換時,執(zhí)行可變功率(power)的處理來返回到原始分辨率(步驟S743)。
圖74-圖80的上述實施例提供了一種圖像處理設(shè)備,包括位置確定單元,用于基于作為原始圖像的多級圖像或從該多級圖像中創(chuàng)建的二值圖像,確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置;創(chuàng)建二值字符圖像的單元,其中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像的單元,其中,將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;確定構(gòu)成特定屬性區(qū)域的像素顏色的單元;基于二值字符圖像,創(chuàng)建具有確定顏色的特定屬性區(qū)域的二值或多級圖像的單元;圖像編碼單元,用于分別對多級無字符圖像以及特定屬性區(qū)域的二值或多級圖像中的每個實現(xiàn)壓縮編碼;以及組合文件創(chuàng)建單元,用于創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件,其中位置確定單元包括從作為原始圖像的多級圖像或特定屬性區(qū)域的二值字符圖像中提取連通分量的單元;以及當(dāng)相關(guān)的矩形部分的高和寬分別小于高度閾值n和寬度閾值m時,其中閾值m和n符合m>n的條件,確定連通分量的矩形部分作為字符區(qū)域的單元。
根據(jù)本發(fā)明,矩形部分的寬度閾值m的值大于高度閾值n的值,以及高度和寬度閾值n×n不用于矩形部分,因此,可以適當(dāng)?shù)靥崛∠喈?dāng)于接觸字符的連通分量的矩形作為特定屬性區(qū)域。
圖74-圖80的上述實施例提供了一種圖像處理設(shè)備,包括位置確定單元,用于基于作為原始圖像的多級圖像或從多級圖像創(chuàng)建的二值圖像中的任何一個來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置;創(chuàng)建二值字符圖像的單元,其中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像的單元,其中,將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;確定構(gòu)成特定屬性區(qū)域的像素顏色的單元;創(chuàng)建表示所確定顏色的顏色信息的單元;圖像編碼單元,用于分別對多級無字符圖像、特定屬性區(qū)域的二值字符圖像以及顏色信息中的每個實現(xiàn)壓縮編碼;以及組合文件創(chuàng)建單元,用于創(chuàng)建組合了壓縮編碼后的編碼圖像的組合文件,其中位置確定單元包括從作為原始圖像的多級圖像或特定屬性區(qū)域的二值字符圖像中提取連通分量的單元;以及當(dāng)相關(guān)的矩形部分的高和寬分別小于高度閾值n和寬度閾值m時,其中閾值m和n符合m>n的條件,確定連通分量的矩形部分為字符區(qū)域的單元。
上述圖像處理設(shè)備可以被配置為使得位置確定單元用于根據(jù)作為原始圖像的多級圖像的分辨率改變高度閾值n的值。
上述圖像處理設(shè)備可以被配置為使得圖像處理設(shè)備還包括至少下述單元之一用于執(zhí)行作為原始圖像的多級圖像的明顯對比度處理的單元,用于執(zhí)行作為原始圖像的多級圖像的平滑處理的單元,在壓縮編碼之前執(zhí)行圖像的對比度調(diào)整處理的單元,以及在壓縮編碼之前將多級圖像的分辨率改變?yōu)榈头直媛实膯卧?br> 上述圖像處理設(shè)備可以被配置為使得圖像處理設(shè)備還包括用于分別對包含在組合文件中的每一個編碼圖像進(jìn)行解碼的單元。
圖74-圖80的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟基于作為原始圖像的多級圖像或從多級圖像創(chuàng)建的二值圖像中的任何一個來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置;創(chuàng)建二值字符圖像,其中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像,其中,將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;確定構(gòu)成特定屬性區(qū)域的像素顏色;基于二值字符圖像,創(chuàng)建具有所確定顏色的特定屬性區(qū)域的二值或多級圖像;分別對多級無字符圖像以及特定屬性區(qū)域的二值或多級圖像中的每個實現(xiàn)壓縮編碼;以及創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件,其中位置確定步驟包括從作為原始圖像的多級圖像或特定屬性區(qū)域的二值字符圖像中提取連通分量;以及如果相關(guān)的矩形部分的高和寬分別小于高度閾值n和寬度閾值m,其中閾值m和n符合m>n的條件,確定連通分量的矩形部分作為字符區(qū)域。
圖74-圖80的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟基于作為原始圖像的多級圖像或從多級圖像創(chuàng)建的二值圖像中的任何一個來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置;創(chuàng)建二值字符圖像,其中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像,其中,將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;確定構(gòu)成特定屬性區(qū)域的像素顏色;創(chuàng)建表示所確定顏色的顏色信息;分別對多級無字符圖像、特定屬性區(qū)域的二值字符圖像以及顏色信息中的每個執(zhí)行壓縮編碼;以及創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件,其中位置確定步驟包括從作為原始圖像的多級圖像或特定屬性區(qū)域的二值字符圖像中提取連通分量;以及如果相關(guān)的矩形部分的高和寬分別小于高度閾值n和寬度閾值m,其中閾值m和n符合m>n的條件,確定連通分量的矩形部分作為字符區(qū)域。
上述計算機(jī)程序產(chǎn)品可以被配置為使得位置確定步驟用于根據(jù)作為原始圖像的多級圖像的分辨率改變高度閾值n的值。
上述計算機(jī)程序產(chǎn)品可以被配置為使得圖像處理方法還包括至少下述步驟之一執(zhí)行作為原始圖像的多級圖像的明顯對比度處理,執(zhí)行作為原始圖像的多級圖像的平滑處理,在壓縮編碼之前執(zhí)行圖像的對比度調(diào)整處理,以及在壓縮編碼之間將多級圖像的分辨率改變?yōu)榈头直媛省?br> 上述計算機(jī)程序產(chǎn)品可以被配置為使得圖像處理方法還包括分別對包含在組合文件中的每一個編碼圖像進(jìn)行解碼的步驟。
圖74-圖80的上述實施例提供了一種計算機(jī)可讀存儲介質(zhì),其中存儲了能夠使計算機(jī)執(zhí)行圖像處理方法的程序,該圖像處理方法包括以下步驟基于作為原始圖像的多級圖像或從多級圖像創(chuàng)建的二值圖像中的任何一個來確定原始圖像中具有特定屬性的特定屬性區(qū)域的位置;創(chuàng)建二值字符圖像,其中,將原始圖像中相應(yīng)于不具有特定屬性的非特定屬性區(qū)域的像素值替換成不同于特定屬性區(qū)域所對應(yīng)的像素值的給定像素值;創(chuàng)建非特定屬性區(qū)域的多級無字符圖像,其中,將原始圖像中的特定屬性區(qū)域的像素值改變?yōu)樵紙D像的背景顏色;確定構(gòu)成特定屬性區(qū)域的像素顏色;根據(jù)二值字符圖像,創(chuàng)建具有確定顏色的特定屬性區(qū)域的二值或多級圖像;分別對多級無字符圖像以及特定屬性區(qū)域的二值或多級圖像中的每個執(zhí)行壓縮編碼;以及創(chuàng)建合并了壓縮編碼后的編碼圖像的組合文件,其中位置確定步驟包括從作為原始圖像的多級圖像或特定屬性區(qū)域的二值字符圖像中提取連通分量;以及如果相關(guān)的矩形部分的高和寬分別小于高度閾值n和寬度閾值m,其中閾值m和n符合m>n的條件,確定連通分量的矩形部分作為字符區(qū)域。
接下來,在下面的實施例中,通過使用圖像處理程序13實現(xiàn)明顯尺寸減少,無需損失作為處理對象圖像(原始圖像)的多級圖像的字符的可見度。
根據(jù)圖81和圖82的概要流程圖中所示出的處理概念圖解釋說明本實施例的處理概要。
首先,通過圖像讀取設(shè)備10,如圖像掃描儀,獲取如圖82(a)所示的用作處理對象圖像的多級圖像(步驟S801)。通過對該多級圖像的二值化獲取如圖82(b)所示的二值圖像(S802)。
接著,確定具有特定屬性的區(qū)域,如字符區(qū)域(步驟S803)。如圖82(c)所示,執(zhí)行將二值圖像中不具有特定屬性的像素改變?yōu)榘咨袼氐陌咨袼靥幚?,以使得二值圖像中僅保留字符(S804),以及如圖82(d)所示,創(chuàng)建字符部分的減少顏色的圖像(S805)。
另一方面,多值圖像設(shè)為用背景顏色填埋特定的屬性部分的圖像,設(shè)為如圖82(e)所示的消除字符的圖像(S806)。
由背景顏色填充的圖像被認(rèn)為不具有重要的信息,并將它改變?yōu)榈头直媛?,以使得它可以在編碼中被高度地顯示(JPEG形式等的不可逆壓縮),即圖82(f)(S807)。
此外,減少構(gòu)成字符的像素的顏色數(shù),并進(jìn)行編碼(PNG形式等的可逆壓縮),或者通過該顏色數(shù)創(chuàng)建二值(兩種顏色)圖像,并進(jìn)行編碼(S807)。(MMR形式等的可逆壓縮)接著,組合成可堆疊并顯示背景圖像和字符圖像的格式(例如,PDF),并具有與原始圖像所保持的相同的位置關(guān)系。將所獲得的文件與原始圖像相比較,文件的尺寸急劇減小。
參照圖83示出的功能方框圖,將詳細(xì)說明相關(guān)的圖像處理設(shè)備1基于圖像處理程序13所實現(xiàn)的功能。
1、獲取作為處理對象圖像的多級圖像和基于多級圖像的二值圖像通過多級圖像獲取單元821和二值圖像獲取單元822獲取多級圖像和二值圖像(S801和S802)。基于該多級圖像,應(yīng)該創(chuàng)建二值圖像。二值化方法所需要的是固定閾值以及使用該方法,就象將亮度高于該閾值的像素變?yōu)榘咨袼?,以及將較暗的像素變?yōu)楹谏袼亍?br> 此外,作為二值圖像和多級圖像,不同的分辨率使足夠的。例如,通過上述方法創(chuàng)建二值圖像之后,可以執(zhí)行變薄處理,降低多級圖像的分辨率,并且可獲取其作為處理對象的多級圖像。
此外,可使用另一種設(shè)備來執(zhí)行該二值圖像的創(chuàng)建并獲得所創(chuàng)建的圖像文件。
2、獲取字符區(qū)域通過使用特定屬性像素指定單元824,確定字符在原始圖像中的位置(步驟S803)??梢詫⑻囟▽傩韵袼刂付▎卧?24配置成從二值圖像或多級圖像中獲取字符區(qū)域。當(dāng)從多級圖像獲取時,可以使用日本公開專利申請No.2002-288589提出的字符區(qū)域提取方法,當(dāng)從二值圖像中獲取時,可以使用日本公開專利申請No.06-020092提出的字符區(qū)域提取方法。在本實施例中,基于二值圖像提取構(gòu)成字符的像素作為具有特定屬性的像素。
3、將字符區(qū)域之外的像素變?yōu)榘咨袼亍?br> 通過使用白色像素置換單元825,將二值圖像中的除字符區(qū)域以外的像素(不具有特定屬性的像素)變?yōu)榘咨珗D像(步驟S804)。
4、創(chuàng)建僅包含字符像素的減少顏色圖像該處理是由上述第3項處理保留下來的黑色像素部分組成并創(chuàng)建帶有顏色信息的圖像(由特定屬性像素圖像創(chuàng)建單元826執(zhí)行的處理)(S805)。
將參照圖84對該處理進(jìn)行解釋。首先,獲取具有特定屬性的像素的像素值(S811),并計算這些像素的代表顏色(S812)。
也就是說,雖然從多級圖像中創(chuàng)建了顏色信息,但其計算一些主要顏色作為代表顏色—這些像素值中的大約十種顏色,而不是按原樣使用相應(yīng)位置上的像素值。
并將某個顏色指定給每個黑色像素(S813),以及創(chuàng)建幾種顏色到幾十種顏色的圖像(S814)。創(chuàng)建了幾種到幾十種顏色的圖像,則也創(chuàng)建了幾個到幾十個具有字符顏色和透明背景顏色的二值(兩種顏色)圖像。
總之,由于字符部分使用的顏色變得比用作處理對象圖像的多級圖像少,因此將該圖像稱為“減少顏色的圖像”。
接下來,將詳細(xì)解釋用于計算代表顏色的單元(S812)。
圖85舉例說明了代表顏色計算方法的概要流程圖。
(1)計算多級圖像中位于相當(dāng)于二值圖像中的黑色像素位置的像素值,并創(chuàng)建該像素值的直方圖(S821)。例如,需要實現(xiàn)等份分割率,將RGB空間分解成4×4×4的塊,以及執(zhí)行目標(biāo)像素如何將1加到確定的空間的頻率值。
(2)確定具有高頻率的塊,并確定頻率的量作為優(yōu)先權(quán)的高度,并根據(jù)頻率值指定優(yōu)先權(quán)(S822)。將這些塊稱為“代表顏色候選塊”。
(3)從具有高優(yōu)先權(quán)的塊順序檢查,并確定所涉及的塊是否是無色的(S823)。如果塊的RGB中心值(塊的RGB中間值等)是幾乎相同的值,則表示它是無色的。
(4)如果不是無色的(S823為否),將移向下一個優(yōu)先權(quán)的塊檢查(S827)。
(5)如果是無色的(S826為是),將通過舊的較高級的候選者檢查哪一個是無色的(S824)。如果無色達(dá)到了預(yù)定的值(第一預(yù)定數(shù)),則將相應(yīng)的塊從代表顏色候選者中排除(S826),如果未達(dá)到,則將無色數(shù)加1并進(jìn)行下面的處理(S825)。
(6)重復(fù)執(zhí)行步驟S822-S826的處理,直到檢查了所有代表顏色候選塊(S827)。
(7)從保留下來的沒有被排除的優(yōu)先級較高的代表顏色候選塊之一輸出作為代表顏色的第二預(yù)定數(shù)(S828)。
此外,作為代表顏色計算方法,也可以考慮圖86所示的方法。
(1)計算多級圖像中位于相當(dāng)于二值圖像的黑色像素位置的像素值,并創(chuàng)建這些像素值的直方圖(S831)。該處理可以使用與圖85說明的相同的處理。
(2)確定具有高頻率的塊,并將頻率的量作為優(yōu)先權(quán)的高度,根據(jù)頻率值指定優(yōu)先權(quán)(S832)。
(3)從優(yōu)先權(quán)的高塊順序地留下甚至第一預(yù)定數(shù),并從候選者中排除其它塊(S833)。
(4)從高優(yōu)先權(quán)的塊順序檢查,并確定所涉及的塊是否是無色的(S834)。
(5)如果不是無色的(S834為否),將移向下一個優(yōu)先權(quán)的塊檢查(S838)。
(6)如果是無色(S834的“是”),則用舊的高順序的候選者來檢查無色為多大程度(S835)。如果無色達(dá)到了預(yù)定的值(第一預(yù)定數(shù))(S835的“是”),則將相應(yīng)的塊從代表顏色候選者中排除(S837),如果未達(dá)到(S835的“否”),則將無彩色數(shù)加1并進(jìn)行下面的處理(S836)。
(7)重復(fù)執(zhí)行步驟S833-S837的處理直到檢查了所有代表顏色候選塊(S838)。
(8)從代表顏色候選者中選擇最接近的顏色(S839),通過使用RGB每個分量的差值的平方和等來計算顏色的接近值。
(9)將兩個要選擇的代表顏色塊中頻率值較低的一個從候選者中排除(S840)。
(10)重復(fù)執(zhí)行(8)和(9)的處理直到低于第三預(yù)定數(shù)(S841)。
(11)將保留下來的沒有被排除的代表顏色候選塊作為代表顏色輸出(S842)。
接下來,參照圖87詳細(xì)說明為計算出的代表顏色的任意一個分配具有諸如字符之類的特定屬性的像素值的單元(S813)。
(1)從二值圖像中提取黑色像素的連通分量(S851)。
(2)計算多級圖像上相應(yīng)于該連通分量的位置的位置(S852)。
(3)建立可應(yīng)用位置的像素平均值??梢杂嬎隳J絹砣〈骄???梢允褂门c建立像素值直方圖相同的計算方法。這里,將使用該計算方法(S853)。
(4)找到模式與代表顏色的距離,并選擇最接近的(S854)。
(5)整個連通分量具有代表顏色的像素值,并寫出以作為減少顏色的圖像(S855)。如果減少顏色的圖像是為每種顏色定義的二值圖像,將連通分量寫出到二值圖像來表示相應(yīng)的顏色。此外,如果減少顏色的圖像是多級圖像,顏色信息和連通分量寫入到減少顏色的圖像。
(6)對所有連通分量執(zhí)行(2)-(5)的處理(S856)。這里,雖然以連通分量為單位來進(jìn)行向代表顏色的分配,但以像素為單位進(jìn)行也可以。
在以像素為單位進(jìn)行的情況下,生成的文件大小有變大的傾向,處理時間也稍稍增加,但與以連通分量為單位相比,由于可應(yīng)對像素值的細(xì)微變動,所以生成的圖像的外觀變好。
此外,雖然作為指定來說字符單元已經(jīng)足夠,在這種情況下新需要判斷字符位置的處理。此外,取決于判斷字符位置處理的精確度,字符的分隔與顏色的改變可能不一致,并可能變成不自然的字符再現(xiàn)。
同時,如果找到模式與代表顏色的距離,并如同圖87中步驟S854選擇最接近的代表顏色,雖然會減少與原始圖像的不同,象顯示的那樣,但有時并不是很好。
因此,當(dāng)最相似的顏色是無色時,適于改變?yōu)楦谝稽c的顏色,來執(zhí)行與取代的顏色和取代的代表顏色的比較,并選擇最接近的。
將解釋說明具體流程。
(1)根據(jù)相應(yīng)于步驟S853建立模式的處理,首先建立最大相似顏色。將所尋求的最相似的顏色設(shè)為R、G、B。
(2)當(dāng)所建立的最大相似顏色R、G、B小于預(yù)先定義的閾值Diff時,判斷它為無色。也就是,當(dāng)|R-G|<Diff,|G-B|<Diff,且|B-R|<Diff時,判斷它為無色。
(3)當(dāng)斷定最大相似顏色是無色時,為了使黑色字符表現(xiàn)得更黑并改善顯示效果,校正該顏色。
當(dāng)補(bǔ)償后的顏色變?yōu)镽’、G’、B’,并且預(yù)先定義的校正值設(shè)為Rt、Gt、Bt時,進(jìn)行減法處理,即R’=max(R-Rt,0),G’=max(G-Gt,0),B’=max(B-Bt,0)。這里,max(a,b)是指從a,b值中選擇較大的一個。也就是說,通過減去預(yù)定校正值,將字符顏色變暗(黑色)。由于負(fù)值是不允許作為像素值的,當(dāng)相減時,將最小值設(shè)為0,使得結(jié)果不會為負(fù)。
(4)尋找校正模式(R’,G’,B’)及最接近的代表顏色,并如步驟S854的情形進(jìn)行選擇。
此外,在本例的處理中限制處理無色的原因是當(dāng)在彩色中執(zhí)行(3)的減法處理時,色調(diào)會改變。在本例中,不執(zhí)行對彩色顏色的顏色補(bǔ)償處理,但用接近原始圖像的顏色再現(xiàn)該處理。
同時指出,可以不對模式(R,G,B)進(jìn)行減法處理而換成乘法處理,也可以使顏色包含更深的彩色顏色。也就是,需要使用預(yù)先定義的校正值Ru、Gu及Bu(分別小于0或大于1)來滿足R’=R×Ru,G’=G×Gu,B’=B×Bu。
雖然關(guān)于對每個連通分量指定代表顏色的處理進(jìn)行了參考,但也可以對每個像素執(zhí)行與圖87說明的情況相同的處理。
在補(bǔ)償處理之后,需要調(diào)整顏色(將顏色變暗)以及選擇接近代表顏色的顏色。
5、無字符多級圖像的創(chuàng)建通過使用特定屬性像素消除多級圖像創(chuàng)建單元823創(chuàng)建多級圖像,其中用背景顏色改變多級圖像中相應(yīng)于在第3項的處理中剩余的黑色像素部分的字符部分的像素值,且該圖像不包含字符(步驟S806)。根據(jù)圖88詳細(xì)示出的概要流程圖進(jìn)行詳細(xì)說明。
(1)將二值圖像變濃(S861)。在這種情況下,像素值可以逐漸傾斜地改變,并且字符顏色可以混入背景中的多級圖像的字符和背景的邊界區(qū)域中。
通過執(zhí)行變濃處理,由于字符和背景的邊界區(qū)域為了消除也變寬了,因此會減少在邊界區(qū)域中字符顏色保持未融合的可能性。
(2)從變濃的圖像中提取黑色像素的連通分量(S862)。
(3)從一個連通分量計算圍繞相應(yīng)多級圖像的像素值(在連通分量的外接矩形的外圍中的像素值),取其平均值,并作為背景顏色。
然而,構(gòu)成不是背景而是字符的部分的可能性要高,因此在平均值計算(S863)中不包括二值圖像的黑色像素部分。
(4)將相應(yīng)于黑色像素連通分量的多級圖像的像素部分置換成所請求的背景顏色(S865)。因此,多級圖像的可適用部分作為消除了字符的圖像。
(5)對所有連通分量執(zhí)行(3)和(4)的處理(S866)。
6、圖像編碼通過使用圖像編碼單元827,對不包含字符的多級圖像以及構(gòu)成字符的減少顏色的圖像進(jìn)行編碼,并壓縮尺寸(步驟S807)。在這其中,不具有字符的多級圖像的信息被認(rèn)為是不重要的,并通過JPEG等實現(xiàn)不可逆的高度壓縮。如果在降低了分辨率之后進(jìn)行壓縮編碼,尺寸將會更小。
此外,執(zhí)行減少顏色的圖像的可逆壓縮。如果是二值圖像,適于進(jìn)行PNG壓縮或MMR壓縮等。如果是4級或16級值的圖像,適于進(jìn)行PNG壓縮等。
7、創(chuàng)建組合文件通過使用組合文件創(chuàng)建單元828,將壓縮圖像合并在一個文件中(圖82(g),步驟S808)。如果組合成的文件的格式可以相互重復(fù),并能夠顯示,則可認(rèn)為是文件尺寸的小彩色圖像的字符部分的可見度沒有下降,并且背景也在某種程度上進(jìn)行了再現(xiàn)。
此外,由于需要僅獲取減少顏色的圖像并使用它,如果僅需要背景則僅需要使用無字符圖像,因此當(dāng)編碼圖像文件僅需要文字部分時,文件尺寸在這種情況下將減小很多。
此外,在這種情況下不需要組合文件創(chuàng)建單元。
根據(jù)本實施例,雖然針對作為特定屬性的字符,也可以使用另一種屬性,如格線和線條畫,或者可以將這些聯(lián)合使用。
參照圖89至圖92解釋說明本發(fā)明的另一優(yōu)選實施例。使用相同的附圖標(biāo)記來表示與在前實施例中相應(yīng)元素相同的像素,并將省略對它們的描述。
雖然提取字符區(qū)域并用這種操作形式創(chuàng)建字符圖像作為減少顏色的圖像,由一種顏色構(gòu)成的標(biāo)記不使用“字符”而是使用“可認(rèn)為是單色的區(qū)域”作為本實施例的特定屬性,使得即使不是字符,圖像和可壓縮性變得更好二值化。
圖89是示出了本實施例的處理的概要流程圖,以及圖91是該功能框圖。雖然這與圖81和圖83示出的操作形式基本相同,但區(qū)別是由請求單色區(qū)域的部分替代了字符(S803’)。
此外,特定屬性像素指定單元824所涉及的部分與多級圖像獲取單元821的多級圖像也是不同的。
參照圖90中的概要流程圖,說明確定單色區(qū)域(特定屬性像素)的方法。此外,圖92是詳細(xì)示出了特定屬性像素指定單元824的更多組成示例的功能框圖。
首先,連通分量提取單元831從二值圖像中提取黑色像素的連通分量(S871)。通過顏色信息獲取單元832獲取位于相應(yīng)于連通分量的黑色像素位置上的多級圖像的顏色信息,并創(chuàng)建顏色信息的變化(S872)。
根據(jù)變化,使用分布計算單元833計算每個彩色分量的分布。如果平均值用E()表示并將彩色分量設(shè)為r、g、b,分布值為V??梢酝ㄟ^下述公式計算V=E(r2)-{E(r)}2+{E(g2)}-{E(g)}2+E(b2)-{E(b)}2。該值的大小表示變化。
接著,檢查該變化的大小(S873)。當(dāng)該變化大于預(yù)定值時,需要斷定該分布的大小的變化較大。
通過白色像素置換單元825,從二值圖像中消除較大的變化(S874)。由于是二值圖像,將可應(yīng)用的像素改變?yōu)榘咨袼?。并對所有的連通分量進(jìn)行步驟S872-S874的處理(S875)。這意味著通過上述處理完成了步驟S804’和S805’的處理。
根據(jù)本實施例的方法,其不關(guān)心是否是字符,但由于將單色區(qū)域分配給減少顏色的圖像,改善了圖像的質(zhì)量和壓縮率。
圖81-92的上述實施例提供了一種圖像處理設(shè)備,其包括多級圖像獲取單元,用于獲取作為處理對象圖像的多級圖像;二值圖像獲取單元,用于獲取基于處理對象圖像創(chuàng)建的二值圖像;特定屬性像素指定單元,用于從處理對象圖像中確定具有特定屬性的像素;白色像素置換單元,用于將二值圖像中不具有特定屬性的像素改變?yōu)榘咨袼?;特定屬性像素圖像創(chuàng)建單元,用于創(chuàng)建一幅或多幅僅包含特定屬性的像素部分的圖像;特定屬性區(qū)域消除圖像創(chuàng)建單元,用于創(chuàng)建用背景顏色改變特定屬性像素的像素值的多級圖像;以及圖像編碼單元,用于對由圖像創(chuàng)建單元創(chuàng)建的兩幅或多幅圖像的每一幅進(jìn)行壓縮編碼,其中特定屬性像素指定單元基于二值圖像確定具有特定屬性的像素。
根據(jù)本發(fā)明的上述圖像處理設(shè)備,獲取作為原始圖像的多級圖像和基于該原始圖像的二值圖像。基于二值圖像確定具有諸如字符的特定屬性的像素,并根據(jù)這種特定屬性的存在而創(chuàng)建僅具有特定屬性像素部分的一個或多個二值圖像。創(chuàng)建其中由背景顏色改變具有特定屬性的像素的像素值的多級圖像。無需將用作處理對象圖像的多級圖像的圖像質(zhì)量減少太多,就可能實現(xiàn)文件尺寸的明顯減少,同時保證具有特定屬性的像素的可見度。
上述圖像處理設(shè)備可以被配置為使得由特定屬性像素指定單元確定的具有特定屬性的像素包括構(gòu)成字符、格線、或線條畫的像素。
上述圖像處理設(shè)備可以被配置為使得由特定屬性像素指定單元確定的具有特定屬性的像素包括被認(rèn)為構(gòu)成單色區(qū)域的像素。
上述圖像處理設(shè)備可以被配置為使得特定屬性像素指定單元包括從二值圖像中提取黑色像素的連通分量的單元;獲取相應(yīng)于構(gòu)成連通分量的黑色像素的作為處理對象圖像的多級圖像的顏色信息的單元;以及當(dāng)所獲取的顏色信息的改變小于預(yù)定值時,確定相應(yīng)于黑色像素的連通分量的區(qū)域為單色區(qū)域。
圖81-92的上述實施例提供了一種圖像處理設(shè)備,其包括多級圖像獲取單元,用于獲取作為處理對象圖像的多級圖像;二值圖像獲取單元,用于獲取在處理對象圖像的基礎(chǔ)上創(chuàng)建的二值圖像;特定屬性像素指定單元,用于從處理對象圖像中確定具有特定屬性的像素;白色像素置換單元,用于將二值圖像中不具有特定屬性的像素改變?yōu)榘咨袼兀惶囟▽傩韵袼貓D像創(chuàng)建單元,用于創(chuàng)建一幅或多幅僅包含特定屬性像素部分的圖像;特定屬性區(qū)域消除圖像創(chuàng)建單元,用于創(chuàng)建用背景顏色改變特定屬性像素的像素值的多級圖像;以及圖像編碼單元,用于對由圖像創(chuàng)建單元創(chuàng)建的兩幅或多幅圖像的每一幅進(jìn)行壓縮編碼,其中特定屬性像素消除圖像創(chuàng)建單元包括從二值圖像中提取黑色像素的連通分量的單元,其中將不具有特定屬性的像素改變?yōu)榘咨袼?;獲取黑色像素連通分量周圍的像素的像素值的單元;和基于周圍像素的像素值,計算相當(dāng)于連通分量的位置的背景顏色的單元。
上述圖像處理設(shè)備可以被配置為使得圖像處理設(shè)備還包括基于將不具有特定屬性的像素改變?yōu)榘咨袼氐亩祱D像,通過預(yù)定值創(chuàng)建將黑色像素部分變濃的濃化二值圖像的單元,其中連通分量提取單元用于從濃化二值圖像中計算黑色像素的連通分量。
上述圖像處理設(shè)備可以被配置為使得周圍像素值獲取單元不使用二值圖像中設(shè)置為連通分量計算對象的黑色像素部分作為周圍像素的值。
上述圖像處理設(shè)備可以被配置為使得周圍像素值獲取單元包括計算連通分量的外接矩形的周邊上的像素的像素平均值的單元。
上述圖像處理設(shè)備可以被配置為使得特定屬性像素消除圖像創(chuàng)建單元包括將多級圖像中等同于連通分量的位置上的像素值改變?yōu)橛嬎愕谋尘邦伾膯卧?br> 圖81-92的上述實施例提供了一種圖像處理設(shè)備,其包括多級圖像獲取單元,用于獲取作為處理對象圖像的多級圖像;二值圖像獲取單元,用于獲取在處理對象圖像的基礎(chǔ)上創(chuàng)建的二值圖像;特定屬性像素指定單元,用于從處理對象圖像中確定具有特定屬性的像素;白色像素置換單元,用于將二值圖像中不具有特定屬性的像素改變?yōu)榘咨袼兀惶囟▽傩韵袼貓D像創(chuàng)建單元,用于創(chuàng)建一幅或多幅僅包含特定屬性像素部分的圖像;特定屬性區(qū)域消除圖像創(chuàng)建單元,用于創(chuàng)建用背景顏色改變特定屬性像素的像素值的多級圖像;以及圖像編碼單元,用于對由圖像創(chuàng)建單元創(chuàng)建的兩幅或多幅圖像的每一幅進(jìn)行壓縮編碼,其中特定屬性像素圖像創(chuàng)建單元包括獲取相應(yīng)于二值圖像中具有特定屬性的像素的多級圖像中的像素的像素值的單元;從獲取的像素值中計算代表顏色的單元;對具有特定屬性的像素分配任一個所計算的代表顏色的單元;以及創(chuàng)建一幅或多幅圖像的單元,其中根據(jù)像素值分配結(jié)果僅有所計算的代表顏色作為組合像素的顏色。
上述圖像處理設(shè)備可以被配置為使得該代表顏色計算單元包括創(chuàng)建像素值直方圖的單元;從直方圖的較大頻率開始連續(xù)地設(shè)置具有高優(yōu)先權(quán)的代表顏色候選者的單元;確定代表顏色候選者是否為非彩色的單元;當(dāng)具有高優(yōu)先權(quán)的非彩色代表顏色候選者的數(shù)量大于第一預(yù)定數(shù)量時,從代表顏色候選者中排除非彩色代表顏色候選者的單元;以及從具有高優(yōu)先權(quán)的代表顏色候選者中選擇位于第二預(yù)定數(shù)量的代表顏色候選者之一作為代表顏色的單元。
上述圖像處理設(shè)備可以被配置為使得代表顏色計算單元包括創(chuàng)建像素值直方圖的單元;從直方圖的較大頻率開始連續(xù)地設(shè)置具有高優(yōu)先權(quán)的代表顏色候選者的單元;設(shè)置具有高優(yōu)先權(quán)的代表顏色候選者的第一預(yù)定數(shù)量的單元;確定代表顏色候選者是否為非彩色的單元;當(dāng)具有高優(yōu)先權(quán)的非彩色代表顏色候選者的數(shù)量大于第二預(yù)定數(shù)量時,從代表顏色候選者中排除非彩色代表顏色候選者的單元;以及計算代表顏色候選者的顏色不一致性的單元。
上述圖像處理設(shè)備可以被配置為使得代表顏色分配單元包括提取具有特定屬性的像素的連通分量的單元;對每個連通分量執(zhí)行代表顏色分配的單元。
上述圖像處理設(shè)備可以被配置為使得代表顏色分配單元包括對每個像素執(zhí)行代表顏色分配的單元。
上述圖像處理設(shè)備可以被配置為使得圖像處理設(shè)備還包括分辨率轉(zhuǎn)換單元,用于將多級圖像的分辨率轉(zhuǎn)換成低分辨率。
圖81-92的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟獲取作為處理對象圖像的多級圖像;獲取在處理對象圖像的基礎(chǔ)上創(chuàng)建的二值圖像;從處理對象圖像中確定具有特定屬性的像素;將二值圖像中不具有特定屬性的像素改變?yōu)榘咨袼?;?chuàng)建一幅或多幅僅包含特定屬性像素部分的圖像;創(chuàng)建由背景顏色替換了具有特定屬性的像素的像素值的多級圖像;以及對由圖像創(chuàng)建單元創(chuàng)建的兩幅或多幅圖像的每一幅實現(xiàn)壓縮編碼,其中確定步驟基于二值圖像確定具有特定屬性的像素。
圖81-92的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟獲取作為處理對象圖像的多級圖像;獲取在處理對象圖像的基礎(chǔ)上創(chuàng)建的二值圖像;從處理對象圖像中確定具有特定屬性的像素;將二值圖像中不具有特定屬性的像素改變?yōu)榘咨袼兀粍?chuàng)建一幅或多幅僅包含特定屬性像素部分的圖像;創(chuàng)建由背景顏色替換了具有特定屬性的像素的像素值的多級圖像;以及對由圖像創(chuàng)建單元創(chuàng)建的兩幅或多幅圖像的每一幅實現(xiàn)壓縮編碼,其中特定屬性像素消除圖像創(chuàng)建步驟包括從二值圖像中提取黑色像素的連通分量,其中該二值圖像中將不具有特定屬性的像素改變?yōu)榘咨袼?;獲取黑色像素的連通分量周圍的像素的像素值;基于周圍像素的像素值,計算相當(dāng)于連通分量的位置的背景顏色。
圖81-92的上述實施例提供了一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟獲取作為處理對象圖像的多級圖像;獲取在處理對象圖像的基礎(chǔ)上創(chuàng)建的二值圖像;從處理對象圖像中確定具有特定屬性的像素;將二值圖像中不具有特定屬性的像素改變?yōu)榘咨袼兀粍?chuàng)建一幅或多幅僅包含特定屬性像素部分的圖像;創(chuàng)建由背景顏色替換了具有特定屬性的像素的像素值的多級圖像;以及對由圖像創(chuàng)建單元創(chuàng)建的兩幅或多幅圖像的每一幅實現(xiàn)壓縮編碼,其中特定屬性像素圖像創(chuàng)建步驟包括獲取相應(yīng)于二值圖像中具有特定屬性的像素的多級圖像中的像素的像素值;從獲取的像素值中計算代表顏色;對具有特定屬性的像素分配任一個所計算的代表顏色;以及創(chuàng)建一幅或多幅圖像,其中根據(jù)像素值分配結(jié)果僅使所計算的代表顏色作為組合像素的顏色。
圖81-92的上述實施例提供了一種計算機(jī)可讀存儲介質(zhì),其中存儲了能夠使計算機(jī)執(zhí)行圖像處理方法的程序,該圖像處理方法包括以下步驟獲取作為處理對象圖像的多級圖像;獲取在處理對象圖像的基礎(chǔ)上創(chuàng)建的二值圖像;從處理對象圖像中確定具有特定屬性的像素;將二值圖像中不具有特定屬性的像素改變?yōu)榘咨袼?;?chuàng)建一幅或多幅僅包含特定屬性像素部分的圖像;創(chuàng)建由背景顏色替換了特定屬性像素的像素值的多級圖像;以及對由圖像創(chuàng)建單元創(chuàng)建的兩幅或多幅圖像的每一幅實現(xiàn)壓縮編碼,其中確定步驟根據(jù)二值圖像確定具有特定屬性的像素。
上述計算機(jī)程序產(chǎn)品可以被配置為使得代表顏色計算步驟包括創(chuàng)建像素值直方圖;從直方圖的較大頻率開始連續(xù)地設(shè)置具有高優(yōu)先權(quán)的代表顏色候選者;確定代表顏色候選者是否為非彩色;當(dāng)具有高優(yōu)先權(quán)的非彩色代表顏色候選者的數(shù)量大于第一預(yù)定數(shù)量時,從代表顏色候選者中排除非彩色代表顏色候選者;以及從具有高優(yōu)先權(quán)的代表顏色候選者中選擇位于第二預(yù)定數(shù)量的代表顏色候選者之一作為代表顏色。
上述計算機(jī)程序產(chǎn)品可以被配置為使得代表顏色計算步驟包括創(chuàng)建像素值直方圖;從直方圖的較大頻率開始連續(xù)地設(shè)置具有高優(yōu)先權(quán)的代表顏色候選者;設(shè)置具有高優(yōu)先權(quán)的代表顏色候選者的第一預(yù)定數(shù)量;確定代表顏色候選者是否為非彩色;當(dāng)具有高優(yōu)先權(quán)的非彩色代表顏色候選者的數(shù)量大于第二預(yù)定數(shù)量時,從代表顏色候選者中排除非彩色代表顏色候選者;以及計算代表顏色候選者的顏色不一致性。
上述計算機(jī)程序產(chǎn)品可以被配置為使得代表顏色分配步驟包括提取具有特定屬性的像素的連通分量;和對每個連通分量執(zhí)行代表顏色分配。
上述計算機(jī)程序產(chǎn)品可以被配置為使得代表顏色分配步驟包括對每個像素執(zhí)行代表顏色分配。
本實施例不限于上述實施例,并可以進(jìn)行不脫離本發(fā)明范圍的變化和修改。
權(quán)利要求
1.一種圖像處理設(shè)備,包括多級圖像獲取單元(21),獲取作為處理對象圖像的多級圖像;二值圖像獲取單元(22),獲取基于多級圖像而創(chuàng)建的二值圖像;特定屬性區(qū)域提取單元(24),從多級圖像中提取作為具有特定屬性的區(qū)域的特定屬性區(qū)域;白色像素置換單元(25),將二值圖像中特定屬性區(qū)域以外的像素變?yōu)榘咨袼兀惶囟▽傩詤^(qū)域消除圖像創(chuàng)建單元(23),創(chuàng)建其中用背景顏色改變特定屬性區(qū)域的像素的多級圖像;特定屬性區(qū)域顏色確定單元(26),確定特定屬性區(qū)域的顏色;特殊屬性像素圖像創(chuàng)建單元(27),創(chuàng)建具有由特定屬性區(qū)域顏色確定單元確定的顏色的特定屬性區(qū)域的圖像;圖像編碼單元(28),分別對由特定屬性區(qū)域消除圖像創(chuàng)建單元和特定屬性像素圖像創(chuàng)建單元創(chuàng)建的兩個或更多圖像進(jìn)行壓縮編碼;和組合文件創(chuàng)建單元(29),創(chuàng)建其中合并了來自圖像編碼單元的編碼圖像的組合文件。
2.根據(jù)權(quán)利要求1的圖像處理設(shè)備,還包括平滑處理單元(31),對多級圖像獲取單元所獲取的多級圖像進(jìn)行平滑處理。
3.根據(jù)權(quán)利要求1的圖像處理設(shè)備,還包括連通分量尺寸檢查單元(32),用于從二值圖像中提取黑色像素的連通分量,對連通分量的尺寸進(jìn)行分類,并將太大或太小的分量改變?yōu)榘咨袼兀渲型ㄟ^白色像素置換單元將所述二值圖像中的特定屬性區(qū)域以外的像素改變?yōu)榘咨袼亍?br> 4.根據(jù)權(quán)利要求1的圖像處理設(shè)備,還包括對比度調(diào)整單元(33),削弱由特定屬性區(qū)域消除圖像創(chuàng)建單元創(chuàng)建的圖像與特定屬性像素圖像創(chuàng)建單元創(chuàng)建的圖像之間的對比度。
5.根據(jù)權(quán)利要求1的圖像處理設(shè)備,還包括分辨率轉(zhuǎn)換單元(34),將由特定屬性區(qū)域消除圖像創(chuàng)建單元創(chuàng)建的、用背景顏色改變特定屬性區(qū)域的像素的多級圖像的分辨率轉(zhuǎn)換為低分辨率。
6.一種計算機(jī)程序產(chǎn)品,能夠使計算機(jī)執(zhí)行圖像處理方法,該圖像處理方法包括以下步驟獲取作為處理對象圖像的多級圖像;獲取基于多級圖像而創(chuàng)建的二值圖像從多級圖像中提取作為具有特定屬性的區(qū)域的特定屬性區(qū)域;將二值圖像中的特定屬性區(qū)域以外的像素變?yōu)榘咨袼?;?chuàng)建其中用背景顏色改變特定屬性區(qū)域的像素的多級圖像;確定特定屬性區(qū)域的顏色;創(chuàng)建具有由特定屬性區(qū)域顏色確定步驟所確定的顏色的特定屬性區(qū)域的圖像;分別對由特定屬性區(qū)域消除圖像創(chuàng)建步驟和特定屬性像素圖像創(chuàng)建步驟創(chuàng)建的兩個或更多圖像進(jìn)行壓縮編碼;以及創(chuàng)建其中合并了在圖像編碼步驟創(chuàng)建的編碼圖像的組合文件。
7.根據(jù)權(quán)利要求6的計算機(jī)程序產(chǎn)品,其中所述方法還包括對多級圖像獲取步驟中所獲取的多級圖像進(jìn)行平滑處理的步驟。
8.根據(jù)權(quán)利要求6的計算機(jī)程序產(chǎn)品,其中所述方法還包括以下步驟從二值圖像中提取黑色像素的連通分量,其中通過白色像素置換單元將特定屬性區(qū)域以外的像素改變?yōu)榘咨袼?;對連通分量的尺寸進(jìn)行分類;以及將太大或太小的分量改變?yōu)榘咨袼亍?br> 9.根據(jù)權(quán)利要求6的計算機(jī)程序產(chǎn)品,其中所述方法還包括削弱由特定屬性區(qū)域消除圖像創(chuàng)建步驟創(chuàng)建的圖像與特定屬性像素圖像創(chuàng)建步驟創(chuàng)建的圖像之間的對比度的步驟。
10.根據(jù)權(quán)利要求6的計算機(jī)程序產(chǎn)品,其中所述方法還包括將特定屬性區(qū)域消除圖像創(chuàng)建步驟創(chuàng)建的、用背景顏色改變特定屬性區(qū)域的像素的多級圖像的分辨率轉(zhuǎn)換為低分辨率的步驟。
11.一種計算機(jī)可讀存儲介質(zhì),其中存儲了能夠使計算機(jī)執(zhí)行圖像處理方法的程序,該圖像處理方法包括以下步驟獲取作為處理對象圖像的多級圖像;獲取基于多級圖像而創(chuàng)建的二值圖像;從多級圖像中提取作為具有特定屬性的區(qū)域的特定屬性區(qū)域;將二值圖像中的特定屬性區(qū)域以外的像素變?yōu)榘咨袼?;?chuàng)建其中用背景顏色改變特定屬性區(qū)域的像素的多級圖像;確定特定屬性區(qū)域的顏色;創(chuàng)建具有由特定屬性區(qū)域顏色確定步驟所確定的顏色的特定屬性區(qū)域的圖像;分別對由特定屬性區(qū)域消除圖像創(chuàng)建步驟和特定屬性像素圖像創(chuàng)建步驟創(chuàng)建的兩個或更多圖像進(jìn)行壓縮編碼;以及創(chuàng)建其中合并了在圖像編碼步驟創(chuàng)建的編碼圖像的組合文件。
全文摘要
一種圖像處理設(shè)備,包括獲取作為處理對象圖像的多級圖像的單元,獲取基于該多級圖像創(chuàng)建的二值圖像的單元,從多級圖像中提取作為具有特定屬性的區(qū)域的特定屬性區(qū)域的單元,將二值圖像中除特定屬性區(qū)域之外的像素轉(zhuǎn)換成白色像素的單元,創(chuàng)建其中用背景顏色改變特定屬性區(qū)域的像素的多級圖像的單元,確定特定屬性區(qū)域顏色的單元,創(chuàng)建具有所確定的顏色的特定屬性區(qū)域的圖像的單元,分別對創(chuàng)建的兩個或多個圖像進(jìn)行壓縮編碼的圖像編碼單元,以及創(chuàng)建其中合并了編碼圖像的組合文件的單元。
文檔編號H04N1/387GK1649384SQ200510054300
公開日2005年8月3日 申請日期2005年1月19日 優(yōu)先權(quán)日2004年1月19日
發(fā)明者長谷川史裕, 關(guān)口優(yōu), 宮澤利夫 申請人:株式會社理光
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
青田县| 新闻| 乌恰县| 巧家县| 德庆县| 贡觉县| 蚌埠市| 芜湖县| 安陆市| 家居| 阜康市| 敖汉旗| 汨罗市| 白城市| 乳源| 突泉县| 玉山县| 涿州市| 建阳市| 大埔县| 罗田县| 吴桥县| 阿拉善盟| 长阳| 拉萨市| 日土县| 东山县| 项城市| 沙河市| 眉山市| 无极县| 固镇县| 黑山县| 福鼎市| 五指山市| 个旧市| 厦门市| 西乡县| 光泽县| 英山县| 营山县|