欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種圖像二值化的方法

文檔序號:6626110閱讀:264來源:國知局
專利名稱:一種圖像二值化的方法
技術(shù)領(lǐng)域
本發(fā)明涉及計算機信息處理領(lǐng)域的圖像處理技術(shù),具體涉及一種圖像二值化的方法。
背景技術(shù)
圖像二值化是一種非常有用的圖像處理技術(shù),用來將灰度圖像轉(zhuǎn)化為單色圖像。對圖像進行二值化,可以有效縮減圖像占用的存儲空間,方便傳輸;同時很多相關(guān)技術(shù)必須使用二值化后的圖像,如文字識別(OCR)。圖像二值化的質(zhì)量好壞,不僅影響到圖像的主觀質(zhì)量評價,還會直接影響到后續(xù)處理環(huán)節(jié),比如會直接影響到OCR的識別率。
現(xiàn)有技術(shù)中,圖像二值化基本思路是通過確定一個域值,對圖像中的點進行逐點判定,小于(或等于)域值的為黑點,大于域值的為白點。因此二值化的關(guān)鍵在于域值的確定。二值化域值的確定一般是通過圖像的灰度直方圖運算得到的,基本思路是將圖像中的點分為兩類,找最小誤判概率下的二值化域值。文獻“圖像二值化算法研究及其實現(xiàn)”[科技情報開發(fā)與經(jīng)濟,2004年第14卷第12期,作者呂俊哲]較好地總結(jié)了二值化域值選取的方法。還有很多文獻涉及到多域值選取方法,全局和局部域值選取方法,以及相應(yīng)的改進策略,如文獻“一種改進的文本圖像二值化算法”[計算機工程,第29卷第13期,2003年8月,作者陳丹等]描述了局域域值的一種改進方法,再如專利“圖像二值化的方法”[中國專利申請?zhí)?0808969.8]描述了多灰度級的圖像二值化方法,專利“灰度圖像二值化處理系統(tǒng)和方法”[中國專利申請?zhí)?8119135]描述了一種根據(jù)鄰居點確定局域域值方法。
一般的數(shù)字化設(shè)備產(chǎn)生的數(shù)字化圖像,其灰度直方圖多數(shù)表現(xiàn)為沒有偏移的正常的雙峰、或多峰特征,現(xiàn)有技術(shù)能夠較好地處理這類圖像。但當(dāng)數(shù)字圖像的灰度直方圖產(chǎn)生偏移,使顏色明顯偏淺或偏深,表現(xiàn)在灰度直方圖中,即最左側(cè)或最右側(cè)出現(xiàn)異常高峰時,現(xiàn)有技術(shù)處理的二值化結(jié)果會導(dǎo)致圖像過深或過淺,導(dǎo)致前景/背景不能有效分離而使圖像質(zhì)量下降。這種下降將極大影響主觀評價或影響后續(xù)的處理過程,如導(dǎo)致文字識別率下降。

發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)中對圖像二值化的不足,本發(fā)明的目的是提出一種改進的圖像二值化方法,該方法對直方圖發(fā)生偏移的圖像能有較好的二值化結(jié)果,從而使圖像主觀質(zhì)量提高,并能有效提高OCR的識別率。
為實現(xiàn)以上目的,本發(fā)明采用的技術(shù)方案是一種圖像二值化的方法,包括以下步驟(1)首先統(tǒng)計待處理的數(shù)字圖像的灰度等級直方圖;(2)檢查灰度直方圖是否存在偏移,對偏移的直方圖進行直方圖邊緣補償,對補償后的直方圖求二值化域值;(3)對圖像按域值進行二值化。
在步驟(1)中,設(shè)灰度等級為N,得到的統(tǒng)計直方圖為H[N],統(tǒng)計直方圖中每一個元素H[n]表示該圖像中灰度等級為n的像素個數(shù),其中n=0,1,...N-1。
在步驟(2)中,通過檢查直方圖兩個端點H
和H[N-1]數(shù)值是否明顯高于同側(cè)附近點的外推值,如果明顯偏高,則可以認定直方圖存在偏移,需要補償,并對補償后的直方圖求二值化域值,具體包括下面的步驟1)取直方圖左側(cè)扣除最邊界的M個數(shù)值,H[i],i=1,2,...,M作為外推的基準點,推測第0點的數(shù)值H1;2)計算左側(cè)補償系數(shù)k1=c*H
/H1,其中c為補償因子;3)同法取直方圖右側(cè)扣除最邊界的M個數(shù)值,H[N-M+i-1],i=1,2,...,M作為外推的基準點,推測第N-1點的數(shù)值Hr;4)計算右側(cè)補償系數(shù)kr=c*H[N-1]/Hr;5)使用變化的大津法求二值化域值,即最左側(cè)點的矩由H
*0改變?yōu)镠
*(0-k1),而最右側(cè)點的矩由H[N-1]*(N-1)改變?yōu)镠[N-1]*(N-1+kr),得到二值化域值d。
進一步,步驟(2)中的步驟1)和步驟3)中,外推時使用線性外推或曲線外推方法計算端點的估計值,或者使用算術(shù)平均值作為端點的估計值。步驟(2)中的步驟5)中,求二值化域值時使用雙峰法、迭代法或基于矩的二值化方法。
更進一步,為使本發(fā)明具有更好的效果,在步驟(2)和步驟(3)中,求二值化的方法是全局二值化方法,或者是局部二值化方法;該方法在二值化時,能夠采用單域值二值化,也能夠采用多域值二值化。
本發(fā)明的效果在于采用本發(fā)明所述的方法,能對直方圖發(fā)生偏移的圖像能有較好的二值化結(jié)果,從而使圖像主觀質(zhì)量提高,并能有效提高OCR的識別率。
本發(fā)明的原理是假設(shè)直方圖右側(cè)端點的高峰是因為有更高亮度的像素被截斷到最大灰度等級引起的,而直方圖左側(cè)端點的高峰是因為有更低亮度的像素被截斷到最小灰度等級引起的。通過對分拆右側(cè)高峰的像素到更高亮度等級和分拆左側(cè)高峰的像素到更低亮度等級來近似還原符合統(tǒng)計規(guī)律的正常峰值的直方圖,使用還原后的直方圖確定二值化域值,從而得到更為真實的二值化域值,最終使用該二值化域值對原圖像進行二值化。


圖1是本發(fā)明所述方法的流程圖;圖2是待處理的圖像樣張;圖3是為圖像樣張的統(tǒng)計直方圖;圖4是常規(guī)的大津法二值化后的圖像以及識別結(jié)果;圖5是使用本發(fā)明方法的二值化后的圖像以及識別結(jié)果;具體實施方式
下面結(jié)合附圖和實施方式對本發(fā)明作進一步詳細的描述。
如圖1所示,一種改進的圖像二值化方法,包括以下步驟(1)統(tǒng)計數(shù)字圖像的灰度直方圖如圖2、圖3所示,先對數(shù)字化以后的灰度圖像(圖2)統(tǒng)計灰度直方圖(圖3),可以看到,直方圖右側(cè)存在明顯高峰,本實施例中,灰度等級為256級(N=256);(2)根據(jù)補償方法計算二值化域值取直方圖左側(cè)扣除最邊界的M個數(shù)值,H[i],i=1,2,...,M作為外推的基準點,推測第0點的數(shù)值H1;取直方圖右側(cè)扣除最邊界的M個數(shù)值,H[N-M+i-1],i=1,2,...,M作為外推的基準點,推測第N-1點的數(shù)值Hr。本實施例中,M取5,外推方法使用5點的算術(shù)平均值作為邊界點的估計值。按修正后的大津法計算得到二值化域值為254;(3)對圖像進行二值化如圖4、圖5所示,本實施例中,按全局單域值二值化方法進行二值化,得到的二值化圖像如圖5左側(cè)所示。作為對比,不使用本發(fā)明的方法直接使用大津法得到的二值化域值為185,得到的二值化圖像如圖4左側(cè)所示;(4)對得到的二值化圖像使用OCR軟件進行文字識別,圖4和圖5的右側(cè)顯示識別結(jié)果。
可以看到,本發(fā)明的圖像二值化明顯提高了圖像的質(zhì)量,文字的斷筆明顯減少,而輸出結(jié)果給OCR軟件使用時,能有效提高識別率。
本發(fā)明所述的方法并不限于具體實施方式
中所述的實施例,本領(lǐng)域技術(shù)人員根據(jù)本發(fā)明的技術(shù)方案得出其他的實施方式,同樣屬于本發(fā)明的技術(shù)創(chuàng)新范圍。
權(quán)利要求
1.一種圖像二值化的方法,包括以下步驟(1) 首先統(tǒng)計待處理的數(shù)字圖像的灰度等級直方圖;(2) 檢查灰度直方圖是否存在偏移,對偏移的直方圖進行直方圖邊緣補償,對補償后的直方圖求二值化域值;(3) 對圖像按域值進行二值化。
2.如權(quán)利要求1所述的一種圖像二值化的方法,其特征是在步驟1中,設(shè)灰度等級為N,得到的統(tǒng)計直方圖為H[N],統(tǒng)計直方圖中每一個元素H[n]表示該圖像中灰度等級為n的像素個數(shù),其中n=0,1,...,N-1。
3.如權(quán)利要求1所述的一種圖像二值化的方法,其特征是在步驟2中,通過檢查直方圖兩個端點H
和H[N-1]數(shù)值是否明顯高于同側(cè)附近點的外推值,如果明顯偏高,則可以認定直方圖存在偏移,需要補償,并對補償后的直方圖求二值化域值,具體包括下面的步驟1)取直方圖左側(cè)扣除最邊界的M個數(shù)值,H[i],i=1,2,...,M作為外推的基準點,推測第0點的數(shù)值H1;2)計算左側(cè)補償系數(shù)k1=c*H
/H1,其中c為補償因子;3)同法取直方圖右側(cè)扣除最邊界的M個數(shù)值,H[N-M+i-1],i=1,2,...,M作為外推的基準點,推測第N-1點的數(shù)值Hr;4)計算右側(cè)補償系數(shù)kr=c*H[N-1]/Hr;5)使用變化的大津法求二值化域值,即最左側(cè)點的矩由H
*0改變?yōu)镠
*(0-k1),而最右側(cè)點的矩由H[N-1]*(N-1)改變?yōu)镠[N-1]*(N-1+kr),得到二值化域值d。
4.如權(quán)利要求3所述的一種圖像二值化的方法,其特征是在步驟(2)中的步驟1)和步驟3)中,外推時使用線性外推或曲線外推方法計算端點的估計值,或者使用算術(shù)平均值作為端點的估計值。
5.如權(quán)利要求3所述的一種圖像二值化的方法,其特征是在步驟(2)中的步驟5)中,求二值化域值時使用雙峰法、迭代法或基于矩的二值化方法。
6.如權(quán)利要求1所述的一種圖像二值化的方法,其特征是求二值化的方法是全局二值化方法,或者是局部二值化方法。
7.如權(quán)利要求1所述的一種圖像二值化的方法,其特征是該方法在二值化時,能夠采用單域值二值化,也能夠采用多域值二值化。
全文摘要
本發(fā)明涉及計算機信息處理領(lǐng)域的圖像處理技術(shù),具體涉及一種圖像二值化的方法?,F(xiàn)有技術(shù)中,通過計算機系統(tǒng)對數(shù)字化的圖像進行二值化方法時,處理灰度直方圖為正常的雙峰圖像一般效果比較好,但當(dāng)雙峰出現(xiàn)明顯的偏移,如圖像的亮度過高時,往往導(dǎo)致二值化域值選擇不能準確而導(dǎo)致二值化后的圖像過淺或過深,從而影響到后面對圖像的繼續(xù)處理,如進行文字識別。本發(fā)明所述的方法通過對二值化圖像的灰度直方圖進行補償,再使用常規(guī)的二值化域值確定方法,使二值化后的圖像質(zhì)量提高。采用本發(fā)明所述的方法,可以有效提高灰度直方圖中雙峰偏移的圖像的二值化效果。
文檔編號G06K9/38GK1694119SQ200510080050
公開日2005年11月9日 申請日期2005年6月28日 優(yōu)先權(quán)日2005年6月28日
發(fā)明者徐劍波, 康凱 申請人:北大方正集團有限公司, 北京北大方正技術(shù)研究院有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
深水埗区| 伊金霍洛旗| 白玉县| 南开区| 清水河县| 通江县| 涿鹿县| 建宁县| 长武县| 新密市| 天津市| 天台县| 茌平县| 常山县| 涞水县| 田林县| 深圳市| 永新县| 双江| 遂溪县| 建平县| 曲水县| 铜山县| 潼关县| 丹棱县| 营口市| 隆子县| 广宁县| 乾安县| 扎囊县| 黄山市| 舟曲县| 邵阳市| 化隆| 鄂托克前旗| 郧西县| 保山市| 江北区| 修水县| 城步| 兴海县|