欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于漢字特征的文檔圖像分割方法

文檔序號(hào):6573479閱讀:358來源:國知局
專利名稱:基于漢字特征的文檔圖像分割方法
技術(shù)領(lǐng)域
本發(fā)明是一種基于漢字特征的文檔圖像分割方法,針對(duì)彩色或灰度掃描圖像進(jìn)行分割,屬于計(jì)算機(jī)數(shù)字圖像處理技術(shù)領(lǐng)域。
背景技術(shù)
文檔圖像分割算法廣泛應(yīng)用于打印、傳真、OCR(Optical CharacterRecognition,光學(xué)字符識(shí)別)、文檔圖像壓縮等圖像處理工作,它使得大型數(shù)據(jù)庫中的文本圖像的高效搜索與存儲(chǔ)更加容易,是從文檔圖像中提取文檔數(shù)據(jù)的有力工具。
現(xiàn)有的文檔圖像分割方法大致可以分為基于分塊的和基于分層的分割方法?;诜謮K的分割方法,先對(duì)輸入圖像進(jìn)行分塊,然后再對(duì)每個(gè)子圖像塊進(jìn)行處理?;诜謱拥姆指罘椒?,先對(duì)輸入圖像按某種準(zhǔn)則分層,然后對(duì)各個(gè)子層圖像進(jìn)行處理。基于最大類間距離與最小類內(nèi)距離比值的最大值進(jìn)行分層是圖像分層的常用方法。具體描述如下1)計(jì)算圖像直方圖及其最大類間距與最小類內(nèi)距的比值Jf(t)。
2)根據(jù)Jf(t)取最大值時(shí)的tth值將圖像分為兩層。
設(shè)一幅圖像I的像素總數(shù)為n,灰度級(jí)為
,其中灰度值i的像素?cái)?shù)為ni。分層閾值tth將其分為A、B兩個(gè)子層圖像,其中A的像素總數(shù)為nA,灰度級(jí)為
,B的像素總數(shù)為nB,灰度級(jí)為[tth+1,0,1,…,T-1],則nA=Σi=0tthni]]>nB=Σi=tth+1T-1ni]]>n=nA+nB=Σi=0T-1ni]]>
子層圖像A、B和原始圖像I各灰度級(jí)i出現(xiàn)的頻率hiA,hiB和hiI分別為hiA=ninA]]>i=0,1,…,tthhiB=ninB]]>i=tth+1,tth+2,…,T-1hiI=nin]]>i=0,1,…,T-1子層圖像A、B出現(xiàn)的概率pA,pB分別為pA=nAn=Σi=0tthhiI]]>pB=nBn=Σi=tth+1T-1hiI=1-pA]]>子層圖像A、B和原始圖像I的灰度均值mA,mB和m分別為mA=Σi=0tthihiA]]>mB=Σi=tth+1T-1ihiB]]>m=Σi=0T-1ihiI]]>當(dāng)將兩個(gè)子層圖像視為兩類時(shí),它們的類間距離為sb2(t)=pA(mA-m)2+pB(mB-m)2---(5)]]>類內(nèi)距離為
sw2(t)=pAΣi=0tth(i-mA)2hiA+pBΣi=tth+1T-1(i-mB)2hiB]]>=Σi=0tth(i-mA)2hiI+Σi=tth+1T-1(i-mB)2hiI]]>于是,依據(jù)最大類間距與最小類內(nèi)距比的最大值準(zhǔn)則,最佳閾值tth應(yīng)滿足Jf(t)=sb2(t)sw2(t)|t=tth→max]]>目前對(duì)于復(fù)雜背景(字符與背景重疊)的文檔圖像,仍缺乏有效的分割方法。Yen-Lin Chen等(Yen-Lin Chen,Chung-Cheng Chiu and Bing-Fei Wu.Complex Document Image Segmentation using Localized Histogram Analysiswith Multi-Layer Matching and Clustering,2004 IEEE InternationalConference on Systems,Man and Cybernetics3063-3070)提出了一種基于區(qū)域的分割方法,該方法首先對(duì)圖像進(jìn)行均勻分塊,并利用每個(gè)子塊的直方圖信息對(duì)子塊進(jìn)行分層,然后再根據(jù)子層圖像的邊緣等信息對(duì)各個(gè)子層進(jìn)行連接,將屬于同一類型的子層連接為一個(gè)大的子層,最后對(duì)這些子層進(jìn)行文本層判斷,分割出文本。該方法計(jì)算比較復(fù)雜,對(duì)圖像進(jìn)行分塊處理容易造成漢字的斷裂。

發(fā)明內(nèi)容
本發(fā)明提出了一種針對(duì)復(fù)雜文檔圖像的分割算法,該方法計(jì)算簡單,不容易造成漢字?jǐn)嗔选?br> 本發(fā)明屬于基于分層的圖像分割,依據(jù)最大類間距與最小類內(nèi)距比的最大值準(zhǔn)則,對(duì)輸入圖像進(jìn)行遞歸分層,得到一系列的分層文檔圖像,并依據(jù)子層圖像像素灰度最大值,對(duì)各層圖像排序。根據(jù)子層圖像合并規(guī)則,對(duì)排序的結(jié)果進(jìn)行子層圖像合并,得到最終的若干子層圖像。對(duì)合并后的各個(gè)子層進(jìn)行文本分割,并將各層分割結(jié)果合并,得到最終的分割圖像。
具體創(chuàng)新點(diǎn)圖像分層的遞歸終止準(zhǔn)則;相關(guān)子層的合并規(guī)則;基于漢字特征的圖像分割。具體內(nèi)容如下1、圖像分層的遞歸終止準(zhǔn)則利用上述介紹的最大類間距與最小類內(nèi)距比的最大值準(zhǔn)則,將輸入圖像分為兩層。本發(fā)明在于,將分出的子層繼續(xù)分層,直到滿足遞歸終止準(zhǔn)則為止。然后并依據(jù)子層圖像像素灰度最大值,對(duì)分割出的一系列子層進(jìn)行排序。
2、相關(guān)子層的合并規(guī)則對(duì)于已排序的各子層圖像,并不全都利于圖像的文本分割。本發(fā)明在于,對(duì)已排序的各子層圖像,利用合并規(guī)則對(duì)相關(guān)子層進(jìn)行合并。合并后的子層圖像有利于文本的分割。
3、基于漢字特征的圖像分割本發(fā)明在于,對(duì)合并后的子層,計(jì)算每個(gè)子層圖像所包含的連通區(qū)域信息,并根據(jù)其特征判斷漢字區(qū)域和背景區(qū)域,然后將背景區(qū)域慮除。對(duì)各子層圖像的分割結(jié)果合并成最終分割結(jié)果。
本發(fā)明的技術(shù)方案如圖1所示。這種基于漢字特征的文檔圖像分割方法,以灰度或者彩色bmp格式(或其他格式的圖像轉(zhuǎn)換為bmp格式)的圖像作為輸入,保存于計(jì)算機(jī)硬盤或移動(dòng)存儲(chǔ)媒體上,再由計(jì)算機(jī)進(jìn)行運(yùn)算和處理。其主要過程為計(jì)算機(jī)系統(tǒng)接收輸入圖像,再由分割程序?qū)ζ溥M(jìn)行處理。
具體方法步驟為輸入文檔圖像后,若為彩色圖像則將轉(zhuǎn)為灰度圖像,然后計(jì)算圖像的灰度直方圖,利用直方圖對(duì)灰度圖像進(jìn)行遞歸分層,并對(duì)分層結(jié)果進(jìn)行排序,再根據(jù)合并準(zhǔn)則對(duì)相關(guān)子層圖像進(jìn)行合并,對(duì)合并后的子層圖像進(jìn)行基于漢字特征的分割處理,并合并各分層圖像的分割結(jié)果。
1、遞歸分層的方法步驟如下設(shè)圖像灰度值t在[a,b](0≤a<256,0≤b<256,a<b,a、b均為整數(shù))范圍內(nèi),第一次的分層閾值為使Jf(t)取得最大值的tth,將圖像分為兩層,其灰度值的范圍分別為[a,tth]和[tth+1,b]。接下來,繼續(xù)在[a,tth]和[tth+1,b]區(qū)間上找出使Jf(t)取得最大值時(shí)所對(duì)應(yīng)的分層閾值tth1和tth2,將各子層圖像再分層。如此進(jìn)行,直到滿足如下終止條件設(shè)待分層圖像的灰度值變化區(qū)間為[t1,t2](t1<t2),此區(qū)間像素總數(shù)、灰度均值和方差分別為nt、mt和δt。當(dāng)δt<c×mt(0.01<c<0.3)或者nt>d×n(0.01<d<0.5)時(shí),即停止對(duì)此圖像繼續(xù)分層。其中,n為原始文檔圖像的像素總數(shù),i為像素灰度級(jí),hit為i在待分層圖像中出現(xiàn)的頻率。
mt=Σi=t1t2ihit]]>δt2=Σi=t1t2ni(i-mt)2]]>nt=Σi=t1t2ni]]>遞歸分層完成后,根據(jù)各分層子圖像像素灰度最大值,對(duì)其進(jìn)行遞增(或遞減)排序。排序后,各子層圖像的灰度值范圍相互鄰接但互不重疊。
2、子層合并的方法步驟如下這里的合并是指將兩個(gè)子層圖像相加,得到一個(gè)新的子層圖像。對(duì)于已排序的各子層圖像,并不全都利于圖像的文本分割,需要對(duì)相關(guān)子層圖像進(jìn)行合并。首先判斷當(dāng)前層是否需要合并,如果需要合并,應(yīng)該合并到與其相鄰的哪個(gè)子層,若當(dāng)前層只有一個(gè)相鄰層,則直接合并。對(duì)合并后得到的新子層圖像,再進(jìn)行判斷,并根據(jù)判斷進(jìn)行合并,直到不滿足合并條件為止。如此進(jìn)行下去,直到所有的子層均不滿足合并條件為止。合并可以按遞增(或者遞減)的順序進(jìn)行。
設(shè)已排序的子層圖像共n個(gè),其中第i個(gè)子層圖像si的灰度值范圍為[ti,ti+1-1],i=0,1,…,n-1。對(duì)si而言,np表示有效像素點(diǎn)的總數(shù)(像素灰度值在[ti,ti+1-1]內(nèi)的像素為有效像素,否則為無效像素),nph表示總的孔洞像素點(diǎn)數(shù)(同一行的兩個(gè)有效像素點(diǎn)之間,若只有一個(gè)無效像素點(diǎn),則這兩個(gè)有效像素點(diǎn)稱為孔洞像素),nr0表示子圖像內(nèi)連通區(qū)域總數(shù),nrs表示小連通區(qū)域總數(shù)(小連通區(qū)域是指包含的有效像素點(diǎn)數(shù)小于N的連通區(qū)域。其中,0<N<50),nps表示所有小連通區(qū)域所含的有效像素點(diǎn)總數(shù),nr max p表示最大連通區(qū)域所含的有效像素點(diǎn)總數(shù)(最大連通區(qū)域是指包含有效像素點(diǎn)數(shù)最多的連通區(qū)域),nρs表示有效像素密度小于R的所有連通區(qū)域所包含的有效像素點(diǎn)總數(shù)(有效像素密度是指該連通區(qū)域包含的有效像素點(diǎn)總數(shù)與包圍該連通區(qū)域最小矩形面積之比),其中,0<R<0.5,則滿足以下4個(gè)條件之一,該層si需要合并(1)若nph>a×np,則合并; (a>0.05)(2)若nrs>b×nr0]]>且nr max p<c×np,則合并;(b>0.6,c>0.1)(3)若nps>d×np,則合并; (d>0.3)(4)若nρs>e×np,則合并。 (e>0.3)具體合并到哪一層的判斷方法為設(shè)待合并子層si的前一層和后一層分別為si-1和si+1,其灰度值范圍分別為[ti-1,ti-1]和[ti+1,ti+2-1],其包含的連通區(qū)域總數(shù)分別為nr-1和nr1。若si與si-1合并,則新層為si-1′,范圍為[ti-1,ti+1-1],連通區(qū)域數(shù)目為nr;若si與si+1合并,則新層為si+1′,范圍為[ti,ti+2-1],連通區(qū)域數(shù)目為nr′。
合并步驟為(1)計(jì)算si-1與si所含連通區(qū)域數(shù)目的比值r1,r1=min(nr-1,nr0)max(nr-1,nr0);]]>si+1與si所含連通區(qū)域數(shù)目的比值r2,r2=min(nr1,nr0)max(nr1,nr0).]]>(2)計(jì)算si-1′與si-1所含連通區(qū)域數(shù)目的比值r1′,r1′=nrnr-1;]]>si+1′與si+1所含連通區(qū)域數(shù)目的比值r2′,r2′=nr′nr1;]]>(3)若(r1+r1′)≤(r2+r2′),則將si與si-1合并;若(r1+r1′)>(r2+r2′),則將si與si+1合并。
3、子層圖像的文本分割具體步驟如下對(duì)于合并后的子圖像si(其寬和高分別為lw、lh,總有效像素?cái)?shù)為np),進(jìn)行區(qū)域生長(即尋找出所有的由有效像素構(gòu)成的連通區(qū)域),得到一系列的連通區(qū)域。對(duì)于第i個(gè)連通區(qū)域而言,其有效像素密度為ρiρi=niwi×hi]]>其中,ni表示其包含的有效像素個(gè)數(shù),wi和hi分別表示包圍此連通區(qū)域最小矩形的寬和高(以像素?cái)?shù)為單位)。
對(duì)于單個(gè)連通區(qū)域及包圍此連通區(qū)域的最小矩形,本發(fā)明提出如下定義1)跳變像素pv在同一行中(或者在同一列中),每一個(gè)與無效像素相鄰的有效像素均為跳變像素,對(duì)所有位于矩形邊界的像素,雖然其與矩形邊界外部的無效像素相鄰,但不屬于跳變像素。
2)孔洞像素ph在同一行中兩個(gè)跳變像素之間只有一個(gè)無效像素,此兩個(gè)跳變像素均為孔洞像素;3)跳變行wv,包含跳變像素的行;4)跳變列hv包含跳變像素的列;
5)孔洞行wh包含孔洞像素的行;6)外跳變像素pov對(duì)行而言,是指某跳變行的第一個(gè)跳變像素或者最后一個(gè)跳變像素,其中,第一個(gè)跳變像素左側(cè)是無效像素,最后一個(gè)跳變像素右側(cè)是無效像素。
7)內(nèi)跳變像素piv對(duì)行而言,是指某跳變行中外跳變像素之外的跳變像素。
8)外跳變行wv包含外跳變像素的行。
9)雙外跳變行hv包含兩個(gè)外跳變像素的行。
在以上定義的基礎(chǔ)上,提出了下列漢字特征1)矩形寬高比rwh=min(wi,hi)max(wi,hi)]]>矩形中寬度和高度之間的小值與兩者間的大值的比值;2)跳變行平均跳變次數(shù)mwv=nwpvnwv,]]>對(duì)行而言,所有的跳變像素?cái)?shù)與所有的跳變行數(shù)的比值;3)跳變列平均跳變次數(shù)mhv=nhpvnhv,]]>對(duì)列而言,所有的跳變像素?cái)?shù)與所有的跳變列數(shù)的比值;4)行跳變像素密度ρwpv=nwpvnp,]]>對(duì)行而言,所有的跳變像素?cái)?shù)與該子層圖像包含的總像素?cái)?shù)的比值;5)列跳變像素密度ρhpv=nhpvnp,]]>對(duì)列而言,所有的跳變像素?cái)?shù)與該子層圖像包含的總像素?cái)?shù)的比值;6)跳變行密度ρwv=nwvnw,]]>所有的跳變行數(shù)與當(dāng)前子層圖像包含的總行數(shù)的比值;7)跳變列密度ρhv=nhvnh,]]>所有的跳變列數(shù)與當(dāng)前子層圖像包含的總列數(shù)的比值;8)孔洞行密度ρwh=nwhnw,]]>所有的包含孔洞像素的行數(shù)與當(dāng)前子層圖像包含的總行數(shù)的比值;9)外跳變行密度ρwov=nwovnwv,]]>所有包含外跳變像素(一個(gè)或者兩個(gè))行的總數(shù)與當(dāng)前子層圖像包含的總行數(shù)的比值;10)雙外跳變行密度ρwbov=nwbovnwv,]]>所有包含兩個(gè)外跳變像素行的總數(shù)與當(dāng)前子層圖像包含的總行數(shù)的比值。
這里,nwpv為總跳變行包含的跳變像素?cái)?shù)(即水平方向上所有的跳變像素?cái)?shù)),nhpv為總跳變列包含的跳變像素?cái)?shù)(即垂直方向上所有的跳變像素?cái)?shù)),nw為總行數(shù),nh為總列數(shù),nwv為總跳變行數(shù)(即跳變行的總個(gè)數(shù)),nhv為總跳變列數(shù)(即跳變列的總個(gè)數(shù)),nwh為包含孔洞像素的行數(shù)(即孔洞行的總個(gè)數(shù)),nwov為包含外跳變像素的行數(shù)(即外跳變行的總個(gè)數(shù)),nwbov為包含兩個(gè)外跳變像素的行數(shù)(即雙外跳變行的總個(gè)數(shù))。
令nph表示當(dāng)前子層圖像的孔洞像素點(diǎn)總數(shù),npiv表示當(dāng)前子層圖像的內(nèi)跳變像素點(diǎn)總數(shù)。
分割步驟為兩大步,第一步為粗分割,第二步為細(xì)分割。
粗分割的過程為,先尋找該子層圖像的所有連通區(qū)域,然后根據(jù)以下規(guī)則濾除子層圖像中的所有非文本連通區(qū)域1)對(duì)于所有連通區(qū)域,滿足以下條件之一者,則濾除
A)如果max(wi,hi)<a1,則濾除。
B)如果max(mwv,mhv)>b11且ρwov<b12,則濾除。
C)如果nph>c1,則濾除。
D)如果npiv<d11且ρi<d12,則濾除。
E)如果nhp>e1×np,則濾除。
F)如果rwh<f1,則濾除。
G)如果ρi<g1,則濾除。
H)如果ρwh>h1,則濾除。
其中,0<a1<30,b11>5,0.05<b12<0.2,c1>20,d11>1,d12>0.5,0.05<e1<0.3,0<f1<0.3,0<g1<0.3,h1>0.2。
2)對(duì)于max(wi,hi)>k2×max(lw,lh)的連通區(qū)域,滿足以下條件之一者,則濾除A)如果min(ρwv,ρhv)<a2,則濾除。
B)如果rwh<b2,則濾除。
C)如果ρi<c2,則濾除。
其中,k2>0.6,0.3<a2<0.8,0.4<b2<0.6,0.2<c2<0.5。
3)對(duì)于max(wi,hi)<k3的連通區(qū)域,滿足以下條件之一者,則濾除A)如果max(ρwpv,ρhpv)<a3,則濾除。
B)如果np<b3,則濾除。
C)如果nhp>c3,則濾除。
其中,10<k3<30,0.6<a3<1,0<b3<30,c3>10。
對(duì)各子層圖像經(jīng)過上述分割后,合并分割結(jié)果得到文本分割圖像。
對(duì)以上分割方法獲得的文本圖像,還可以進(jìn)一步進(jìn)行分割,其分割的步驟為1)對(duì)于ρi≥k4的連通區(qū)域,滿足rwh>a41且max(ρwv,ρhv)<a42,則濾除;其中,k4>0.95,a41>0.1,0.3<a42<0.6。
2)對(duì)于k51≤ρi<k52的連通區(qū)域,滿足以下條件之一者,則濾除A)如果rwh≤a51,則濾除;B)如果rwh>b51且max(ρwv,ρhv)<b52,則濾除;C)如果c51≤rwh≤c52且max(ρwv,ρhv)<c53,則濾除;D)如果d51≤rwh≤d52,則濾除;其中,0.8<k51<0.95,0.95<k52<1,0<a51<0.1,b51>0.5,b52>0.5,0<c51<0.1,0.1<c52<0.3,c53>0.4,0.5<d52<0.8,0.1<d51<0.3。
3)對(duì)于k61≤ρi<k62的連通區(qū)域,滿足以下條件之一者,則濾除A)如果rwh>a61且max(ρwpv,ρhpv)<a62且npiv<a63,則濾除;B)如果b61<rwh<b62且max(ρvw,ρvh)<b63,則濾除;C)如果rwh<c6,則濾除;其中,0.7<k61<0.8,0.8<k62<0.95,0.3<a61<0.5,0.4<a62<0.6,a63>1,0<b61<0.2,0.2<b62<0.4,0.6<b63<1,0.05<c6<0.2。
4)對(duì)于k71≤ρi<k72的連通區(qū)域,滿足以下條件之一者,則濾除A)如果ρwbov<a71且nph>a72,則濾除;B)如果ρi>b71且rwh>b72且max(ρwv,ρhv)>b73且npiv<b74,則濾除;C)如果rwh<c7,則濾除;其中,0.4<k71<0.6,0.6<k72<0.8,0.1<a71<0.3,a72>15,0.5<b71<0.7,0.6<b72<0.8,b73>0.7,b74>1,0.05<c7<0.2。
5)對(duì)于k81≤ρi<k82的連通區(qū)域,滿足以下條件之一者,則濾除A)如果rwh>a81且max(ρwv,ρhv)<a82,則濾除;B)如果rwh≤b8,則濾除;其中,0.1<k81<0.3,0.3<k82<0.6,a81>0.1,0.2<a82<0.5,0.1<b8<0.3。
本發(fā)明中的連通區(qū)域可以是4連通區(qū)域,也可以是8連通區(qū)域。
本發(fā)明對(duì)復(fù)雜背景的文檔圖像中漢字的提取不僅清晰而且完整,不受漢字之間顏色變化的影響。


圖1系統(tǒng)整體流程框2測試輸入的原始圖像圖3對(duì)圖2的遞歸分層子圖像圖4對(duì)圖3各層圖像進(jìn)行合并后的子層圖像圖5圖2的最終分割結(jié)果圖6測試輸入的原始圖像圖7對(duì)圖6的遞歸分層子圖像圖8對(duì)圖7各層圖像進(jìn)行合并后的子層圖像圖9圖6的最終分割結(jié)果具體實(shí)施方式
根據(jù)圖1配置本發(fā)明的實(shí)施例。本實(shí)施例中計(jì)算機(jī)為“清華同方微機(jī),Intel(R)Celeron(R)CPU 3.20GHz,256M內(nèi)存,80G硬盤”。采用VC++6.0編程實(shí)現(xiàn)。
具體實(shí)施方案為1、彩色圖像轉(zhuǎn)灰度圖像方案若輸入圖像為彩色圖像,則用如下公式轉(zhuǎn)換Y=0.299×R+0.587×G+0.144×B其中,Y為轉(zhuǎn)換后的灰度值,R、G、B分別為轉(zhuǎn)換前的彩色圖像的三個(gè)顏色分量,R代表紅色,G代表綠色,B代表藍(lán)色,其值均在
范圍內(nèi)。
2、遞歸分層方案設(shè)待分層圖像的灰度值變化區(qū)間為[t1,t2](t1<t2),當(dāng)δt<c×mt(c=0.1)或者nt>d×n(d=0.2)時(shí),停止對(duì)此圖像繼續(xù)分層,否則,繼續(xù)遞歸分層,其中,n為輸入文檔圖像的像素點(diǎn)總數(shù),nt、mt和δt分別為此區(qū)間像素總數(shù)、灰度均值和方差。當(dāng)分出的所有子層均滿足上述停止分層條件時(shí),停止分層,并對(duì)分出的各子層遞增排序。
3、子層合并方案對(duì)以邊界值從小到大排列的初始子層從小到大逐個(gè)判斷是否需要合并。對(duì)于待合并子層si,滿足以下4個(gè)條件之一,即可合并(1)若nph>a×np,則合并;(a=0.1)(2)若nrs>b×nr0]]>且nr max p<c×np,則合并; (b=0.9,c=0.15)(3)若nps>d×np,則合并;(d=0.5)(4)若nρs>e×np,則合并。
(e=0.6)其中N=20,R=0.3計(jì)算r1=min(nr-1,nr0)max(nr-1,nr0),r2=min(nr1,nr0)max(nr1,nr0),r1′=nrnr-1,r2′=nr′nr1]]>若(r1+r1′)≤(r2+r2′),則將si與si-1合并;若(r1+r1′)>(r2+r2′),則將si與si+1合并。
4、子層分割方案依次對(duì)各個(gè)子層圖像進(jìn)行分割,包括粗分割和細(xì)分割。下列步驟中粗分割包含第一至第三步,細(xì)分割包含第四至第八步。具體分割步驟為首先找出該層圖像的所有連通區(qū)域,根據(jù)以下規(guī)則濾除非文本區(qū)域1)對(duì)于所有連通區(qū)域,滿足以下條件之一者,則濾除A)如果max(wi,hi)<a1,則濾除。
B)如果max(mwv,mhv)>b11且ρwov<b12,則濾除。
C)如果nph>c1,則濾除。
D)如果npiv<d11且ρi<d12,則濾除。
E)如果nhp>e1×np,則濾除。
F)如果rwh<f1,則濾除。
G)如果ρi<g1,則濾除。
H)如果ρwh>h1,則濾除。
其中,a1=4,b11=12,b12=0.15,c1=50,d11=2,d12=0.8,e1=0.1,f1=0.05,g1=0.2,h1=0.3。
2)對(duì)于max(wi,hi)>k2×max(lw,lh)的連通區(qū)域,滿足以下條件之一者,則濾除A)如果min(ρwv,ρhv)<a2,則濾除。
B)如果rwh<b2,則濾除。
C)如果ρi<c2,則濾除。
其中,k2=0.8,a2=0.5,b2=0.5,c2=0.4。
3)對(duì)于max(wi,hi)<k3的連通區(qū)域,滿足以下條件之一者,則濾除A)如果max(ρwpv,ρhpv)<a3,則濾除。
B)如果np<b3,則濾除。
C)如果nhp>c3,則濾除。
其中,k3=20,a3=0.8,b3=30,c3=20。
4)對(duì)于ρi≥k4的連通區(qū)域,滿足rwh>a41且max(ρwv,ρhv)<a42,則濾除;其中,k4=0.99,a41=0.2,a42=0.5。
5)對(duì)于k51≤ρi<k52的連通區(qū)域,滿足以下條件之一者,則濾除A)如果rwh≤a51,則濾除;B)如果rwh>b51且max(ρwv,ρhv)<b52,則濾除;C)如果c51≤rwh≤c52且max(ρwv,ρhv)<c53,則濾除;D)如果d51≤rwh≤d52,則濾除;其中,k51=0.9,k52=0.99,a51=0.05,b51=0.7,b52=0.6,c51=0.05,c52=0.2,c53=0.5,d51=0.2 d52=0.7。
6)對(duì)于k61≤ρi<k62的連通區(qū)域,滿足以下條件之一者,則濾除A)如果rwh>a61且max(ρwpv,ρhpv)<a62且npiv<a63,則濾除;B)如果b61<rwh<b62且max(ρvw,ρvh)<b63,則濾除;C)如果rwh<c6,則濾除;其中,k61=0.75,k62=0.9,a61=0.35,a62=0.5,a63=3,b61=0.1,b62=0.1,b63=0.8,c6=0.1。
7)對(duì)于k71≤ρi<k72的連通區(qū)域,滿足以下條件之一者,則濾除A)如果ρwbov<a71且nph>a72,則濾除;B)如果ρi>b71且rwh>b72且max(ρwv,ρhv)>b73且npiv<b74,則濾除;C)如果rwh<c7,則濾除;其中,k71=0.5,k72=0.75,a71=0.2,a72=25,b71=0.6,b72=0.7,b73=0.8,b74=3,c7=0.1。
8)對(duì)于k81≤ρi<k82的連通區(qū)域,滿足以下條件之一者,則濾除A)如果rwh>a81且max(ρwv,ρhv)<a82,則濾除;B)如果rwh≤b8,則濾除;其中,k81=0.2,k82=0.5,a81=0.15,a82=0.3,b8=0.15。
待各層圖像分割完畢后,對(duì)其結(jié)果進(jìn)行合并(相加),得到最終的分割圖像。
5、綜述按照以上的步驟對(duì)輸入的文檔圖像進(jìn)行處理。首先在遞歸分層時(shí),將一幅文檔圖像分為了一系列同樣大小的子圖像,并根據(jù)子圖像的像素灰度最大值遞增排序。其次,對(duì)已排序的各子圖像按合并準(zhǔn)則進(jìn)行合并,得到了利于文本分割的若干分層圖像。然后,利用本發(fā)明規(guī)定的漢字特征對(duì)這些子層圖像進(jìn)行分割,并將分割結(jié)果合并,得到最終的文本分割圖像。
利用本實(shí)施例中的方法,分別對(duì)圖2、圖6所示的原始圖像進(jìn)行了分割。其中,圖2是24位彩色文檔圖像,水平方向224個(gè)像素,垂直方向129個(gè)像素。對(duì)圖2的遞歸分層圖像、合并后的子層圖像、分割結(jié)果分別如圖3、4、5所示。為了清楚顯示,各個(gè)子層圖像以及最終的分割結(jié)果圖像中的像素顏色均改變?yōu)榱撕谏?。本?shí)施例對(duì)圖2的處理中,所說的連通區(qū)域均是指4連通區(qū)域。
圖6所示的原始圖像為24位彩色文檔圖像,水平方向498個(gè)像素,垂直方向291個(gè)像素,對(duì)圖6的遞歸分層圖像、合并后的子層圖像、分割結(jié)果分別如圖7、8、9所示。為了清楚顯示,各個(gè)子層圖像以及最終的分割結(jié)果圖像中的像素顏色均改變?yōu)榱撕谏?。在?duì)圖6的處理中,所說的連通區(qū)域均是指8連通區(qū)域。
實(shí)驗(yàn)結(jié)果表明,本發(fā)明對(duì)復(fù)雜文檔圖像中漢字的提取,不僅清晰,而且完整。
權(quán)利要求
1.基于漢字特征的文檔圖像分割方法,以灰度或者彩色文檔圖像作為輸入,將圖像存儲(chǔ)在計(jì)算機(jī)硬盤或者移動(dòng)存儲(chǔ)設(shè)備中,再由程序讀入到內(nèi)存中進(jìn)行處理;若讀入的是彩色圖像,則先轉(zhuǎn)為灰度圖像,若為灰度圖像則不用轉(zhuǎn)換;其特征在于,具體處理步驟如下(1)對(duì)原始圖像進(jìn)行遞歸分層利用最大類間距與最小類內(nèi)距之比取得最大值的準(zhǔn)則,對(duì)圖像進(jìn)行遞歸分層。即當(dāng)一幅圖像根據(jù)上述距離比準(zhǔn)則得到一個(gè)分割閾值后,以此閾值將圖像分為兩個(gè)子層圖像,然后再對(duì)這兩個(gè)子層圖像分別進(jìn)行分層,直到滿足以下兩個(gè)條件之一為止1)δt<c×mt; (0.01<c<0.3)2)nt<d×n; (0.01<d<0.5)mt=Σi=t1t2ihit]]>δt2=Σi=t1t2ni(i-mt)2]]>nt=Σi=t1t2ni]]>t1和t2分別為待分層圖像像素灰度值的上界和下界(t1表示最小值,t2表示最大值),n為輸入文檔圖像的像素點(diǎn)總數(shù),nt、mt和δt分別為待分層圖像的像素點(diǎn)總數(shù)、灰度均值和方差;i為像素灰度級(jí),hit為i在待分層圖像中出現(xiàn)的頻率;遞歸分層完成后,根據(jù)各分層子圖像像素灰度最大值,對(duì)其進(jìn)行遞增(或遞減)排序;-(2)子層的合并對(duì)排序后的子層圖像根據(jù)判別準(zhǔn)則進(jìn)行合并;判別準(zhǔn)則為若子層圖像滿足下列四個(gè)條件之一者,則需合并1)若nph>a×np,則合并; (a>0.05)2)若nrs>b×nr0]]>且nrmax p<c×np,則合并; (b>0.6,c>0.1)3)若nps>d×np,則合并; (d>0.3)4)若nρs>e×np,則合并; (e>0.3)其中,對(duì)于當(dāng)前層而言,np表示有效像素點(diǎn)的總數(shù),nph表示總的孔洞像素點(diǎn)數(shù),nr0表示子圖像內(nèi)連通區(qū)域總數(shù);nrs表示小連通區(qū)域總數(shù),小連通區(qū)域是指包含的有效像素點(diǎn)數(shù)小于N的連通區(qū)域,其中,0<N<50;nps表示所有小連通區(qū)域所含的有效像素點(diǎn)總數(shù),nr max p表示最大連通區(qū)域所含的有效像素點(diǎn)總數(shù),nρs表示有效像素密度小于R(0<R<0.5)的所有連通區(qū)域所包含的有效像素點(diǎn)總數(shù);若判斷當(dāng)前層需要合并,則具體合并到哪一層的判斷方法為若(r1+r1′)≤(r2+r2′),則將si與si-1合并;若(r1+r1′)>(r2+r2′),則將si與si+1合并;其中,r1=min(nr-1,nr0)max(nr-1,nr0),r2=min(nr1,nr0)max(nr1,nr0),r1′=nrnr-1,r2′=nr′nr1.]]>用si表示當(dāng)前層,si-1和si+1分別為當(dāng)前層的前一層和后一層,nr0,nr-1和nr1分別表示si、si-1和si+1包含的連通區(qū)域總個(gè)數(shù),nr表示si與si-1。合并后的連通區(qū)域數(shù)目;nr′表示si與si+1合并后的連通區(qū)域數(shù)目;若需要合并的當(dāng)前層只有一個(gè)相鄰層,則直接合并到相鄰層;(3)子層圖像的文本分割對(duì)于合并后的子圖像si,其寬和高分別為lw、lh,總有效像素?cái)?shù)為np,進(jìn)行區(qū)域生長,得到一系列的連通區(qū)域。對(duì)于第i個(gè)連通區(qū)域而言,其有效像素密度為ρiρi=niwi×hi]]>其中,ni表示其包含的有效像素個(gè)數(shù),wi和hi分別表示包圍此連通區(qū)域最小矩形的寬和高(以像素?cái)?shù)為單位)。對(duì)于單個(gè)連通區(qū)域及包圍此連通區(qū)域的最小矩形,本發(fā)明提出如下定義1)跳變像素pv在同一行中(或者在同一列中),每一個(gè)與無效像素相鄰的有效像素均為跳變像素,對(duì)所有位于矩形邊界的像素,雖然其與矩形邊界外部的無效像素相鄰,但不屬于跳變像素;2)孔洞像素ph在同一行中兩個(gè)跳變像素之間只有一個(gè)無效像素,此兩個(gè)跳變像素均為孔洞像素;3)跳變行wv,包含跳變像素的行;4)跳變列hv包含跳變像素的列;5)孔洞行wh包含孔洞像素的行;6)外跳變像素pov對(duì)行而言,是指某跳變行的第一個(gè)跳變像素或者最后一個(gè)跳變像素,其中,第一個(gè)跳變像素左側(cè)是無效像素,最后一個(gè)跳變像素右側(cè)是無效像素;7)內(nèi)跳變像素piv對(duì)行而言,是指某跳變行中外跳變像素之外的跳變像素;8)外跳變行wv包含外跳變像素的行;9)雙外跳變行hv包含兩個(gè)外跳變像素的行;在以上定義的基礎(chǔ)上,提出了下列漢字特征1)矩形寬高比rwh=min(wi,hi)max(wi,hi);]]>2)跳變行平均跳變次數(shù)mwv=nwpvnwv;]]>3)跳變列平均跳變次數(shù)mhv=nhpvnhv;]]>4)行跳變像素密度ρwpv=nwpvnp;]]>5)列跳變像素密度ρhpv=nhpvnp;]]>6)跳變行密度ρwv=nwvnw;]]>7)跳變列密度ρhv=nhvnh;]]>8)孔洞行密度ρwh=nwhnw;]]>9)外跳變行密度ρwov=nwovnwv;]]>10)雙外跳變行密度ρwbov=nwbovnwv;]]>這里,nwpv為總跳變行包含的跳變像素?cái)?shù)(即水平方向上所有的跳變像素?cái)?shù)),nhpv為總跳變列包含的跳變像素?cái)?shù)(即垂直方向上所有的跳變像素?cái)?shù)),nw為總行數(shù),nh為總列數(shù),nwv為總跳變行數(shù)(即跳變行的總個(gè)數(shù)),nhv為總跳變列數(shù)(即跳變列的總個(gè)數(shù)),nwh為包含孔洞像素的行數(shù)(即孔洞行的總個(gè)數(shù)),nwov為包含外跳變像素的行數(shù)(即外跳變行的總個(gè)數(shù)),nwbov為包含兩個(gè)外跳變像素的行數(shù)(即雙外跳變行的總個(gè)數(shù));令nph表示當(dāng)前子層圖像的孔洞像素點(diǎn)總數(shù),npiv表示當(dāng)前子層圖像的內(nèi)跳變像素點(diǎn)總數(shù);子層圖像的分割過程為,尋找該子層圖像的所有連通區(qū)域,然后根據(jù)以下規(guī)則濾除子層圖像中的所有非文本連通區(qū)域1)對(duì)于所有連通區(qū)域,滿足以下條件之一者,則濾除A)如果max(wi,hi)<a1,則濾除;B)如果max(mwv,mhv)>b11且ρwov<b12,則濾除;C)如果nph>c1,則濾除;D)如果npiv<d11且ρi<d12,則濾除;E)如果nhp>e1×np,則濾除;F)如果rwh<f1,則濾除;G)如果ρi<g1,則濾除;H)如果ρwh>h1,則濾除;其中,0<a1<30,b11>5,0.05<b12<0.2,c1>20,d11>1,d12>0.5,0.05<e1<0.3,0<f1<0.3,0<g1<0.3,h1>0.2;2)對(duì)于max(wi,hi)>k2×max(lw,lh)的連通區(qū)域,滿足以下條件之一者,則濾除A)如果min(ρwv,ρhv)<a2,則濾除;B)如果rwh<b2,則濾除;C)如果ρi<c2,則濾除;其中,k2>0.6,0.3<a2<0.8,0.4<b2<0.6,0.2<c2<0.5;3)對(duì)于max(wi,hi)<k3的連通區(qū)域,滿足以下條件之一者,則濾除A)如果max(ρwpv,ρhpv)<a3,則濾除;B)如果np<b3,則濾除;C)如果nhp>c3,則濾除;其中,10<k3<30,0.6<a3<1,0<b3<30,c3>10;對(duì)各子層圖像經(jīng)過上述分割后,合并分割結(jié)果得到文本分割圖像。
2.根據(jù)權(quán)利要求1所述的基于漢字特征的文檔圖像分割方法,其特征在于,對(duì)子層圖象的文本分割還包括以下濾除條件1)對(duì)于ρi≥k4的連通區(qū)域,滿足rwh>a41且max(ρwv,ρhv)<a42,則濾除;其中,k4>0.95,a41>0.1,0.3<a42<0.6;2)對(duì)于k51≤ρi<k52的連通區(qū)域,滿足以下條件之一者,則濾除A)如果rwh≤a51,則濾除;B)如果rwh>b51且max(ρwv,ρhv)<b52,則濾除;C)如果c51≤rwh≤c52且max(ρwv,ρhv)<c53,則濾除;D)如果d51≤rwh≤d52,則濾除;其中,0.8<k51<0.95,0.95<k52<1,0<a51<0.1,b51>0.5,b52>0.5,0<c51<0.1,0.1<c52<0.3,c53>0.4,0.5<d52<0.8,0.1<d51<0.3;3)對(duì)于k61≤ρi<k62的連通區(qū)域,滿足以下條件之一者,則濾除A)如果rwh>a61且max(ρwpv,ρhpv)<a62且npiv<a63,則濾除;B)如果b61<rwh<b62且max(ρvw,ρvh)<b63,則濾除;C)如果rwh<c6,則濾除;其中,0.7<k61<0.8,0.8<k62<0.95,0.3<a61<0.5,0.4<a62<0.6,a63>1,0<b61<0.2,0.2<b62<0.4,0.6<b63<1,0.05<c6<0.2;4)對(duì)于k71≤ρi<k72的連通區(qū)域,滿足以下條件之一者,則濾除A)如果ρwbov<a71且nph>a72,則濾除;B)如果ρi>b71且rwh>b72且max(ρwv,ρhv)>b73且npiv<b74,則濾除;C)如果rwh<c7,則濾除;其中,0.4<k71<0.6,0.6<k72<0.8,0.1<a71<0.3,a72>15,0.5<b71<0.7,0.6<b72<0.8,b73>0.7,b74>1,0.05<c7<0.2;5)對(duì)于k81≤ρi<k82的連通區(qū)域,滿足以下條件之一者,則濾除A)如果rwh>a81且max(ρwv,ρhv)<a82,則濾除;B)如果rwh≤b8,則濾除;其中,0.1<k81<0.3,0.3<k82<0.6,a81>0.1,0.2<a82<0.5,0.1<b8<0.3。
全文摘要
本發(fā)明是基于漢字特征的文檔圖像分割方法,屬于圖像處理技術(shù)領(lǐng)域。主要包括圖像的遞歸分層及排序、排序后子層圖像的合并及合并后子層圖像的文本分割。首先讀取文檔圖像,若為彩色圖像,則將該圖像轉(zhuǎn)換為灰度。其次,根據(jù)最大類間距與最小類內(nèi)距之比取得最大值準(zhǔn)則對(duì)圖像進(jìn)行遞歸分層,根據(jù)子層圖像的方差及所含有效像素點(diǎn)總數(shù)確定遞歸終止條件。并對(duì)各分層圖像進(jìn)行排序。然后,對(duì)已排序的各子層圖像進(jìn)行合并,由子層圖像的連通特性確定合并準(zhǔn)則。最后,對(duì)已合并的各子層圖像進(jìn)行文本分割,分割準(zhǔn)則由漢字表現(xiàn)出的一系列圖像特性決定。將各子層圖像的分割結(jié)果合并成最終結(jié)果。本發(fā)明對(duì)復(fù)雜背景的文檔圖像進(jìn)行分割,得到的文本不僅清晰而且完整。
文檔編號(hào)G06K9/34GK101030257SQ200710065408
公開日2007年9月5日 申請日期2007年4月13日 優(yōu)先權(quán)日2007年4月13日
發(fā)明者黃祥林, 楊朝, 呂銳, 楊占昕 申請人:中國傳媒大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
白水县| 微博| 盘山县| 兴安县| 兴和县| 龙南县| 高平市| 江津市| 江陵县| 开江县| 阜康市| 上虞市| 太和县| 乌鲁木齐市| 昭觉县| 永兴县| 鸡东县| 寿宁县| 新野县| 雷山县| 阿尔山市| 宝坻区| 瓦房店市| 图们市| 福州市| 静乐县| 岳普湖县| 芦山县| 浦江县| 崇文区| 佛冈县| 兴隆县| 塔河县| 贵州省| 海原县| 衡阳县| 万载县| 砀山县| 巴青县| 炎陵县| 文成县|