欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

在保留交叉字符筆劃的同時(shí)去除文檔圖像中的下劃線和表格線的制作方法

文檔序號(hào):6623425閱讀:265來源:國知局
在保留交叉字符筆劃的同時(shí)去除文檔圖像中的下劃線和表格線的制作方法【專利摘要】一種在保留與文檔圖像中的水平和垂直線交叉的字符筆劃的完整性的同時(shí)、去除這些線的方法。對(duì)于每一檢測(cè)的水平線,計(jì)算垂直游程長(zhǎng)度分布圖。檢測(cè)具有其間具有山谷的兩個(gè)相鄰山峰的游程長(zhǎng)度分布圖的區(qū)域,所述區(qū)域?qū)?yīng)于水平線與非垂直線的交叉??墒褂靡浑A導(dǎo)數(shù)曲線來檢測(cè)這樣的山峰和山谷。也檢測(cè)用于連續(xù)像素地點(diǎn)的具有大游程長(zhǎng)度值的游程長(zhǎng)度分布圖的區(qū)域,所述區(qū)域?qū)?yīng)于水平線與接近垂直線的交叉。在保留交叉區(qū)域中的像素的同時(shí),在交叉區(qū)域之外的區(qū)域中去除水平線??深愃频剡M(jìn)行垂直線去除。該無模板方法能去除表格、制表和下劃線中的線,并提取手寫或打印字符?!緦@f明】在保留交叉字符筆劃的同時(shí)去除文檔圖像中的下劃線和表格線【
技術(shù)領(lǐng)域
】[0001]本發(fā)明涉及文檔圖像的處理,并具體地,它涉及在保留與水平、垂直、或其他直線交叉的字符筆劃的連續(xù)性的同時(shí)、從文檔圖像去除這些線的處理?!?br>背景技術(shù)
】[0002]在文檔圖像(B卩,代表文檔的數(shù)字圖像)的數(shù)字處理中,經(jīng)常期望去除圖像中的水平和垂直線。這樣的直線的示例包括文本中的下劃線、以及表格(table)和制表(form)中的水平和垂直線。例如,當(dāng)向文檔圖像應(yīng)用OCR(光學(xué)字符識(shí)別)以提取文檔的文本時(shí),經(jīng)常期望首先去除下劃線,因?yàn)樗鼈兏蓴_字符識(shí)別。在另一示例中,銀行支票的圖像的數(shù)字處理經(jīng)常需要去除各種線。文檔圖像典型地通過掃描或拍攝硬拷貝文檔而獲得;能在作為將灰度等級(jí)文檔圖像變換為二進(jìn)制文檔圖像的處理的二值化之前或之后,執(zhí)行線檢測(cè)和去除。[0003]已提出各種線檢測(cè)和去除方法。能對(duì)二進(jìn)制圖像執(zhí)行檢測(cè)線段。這類方法包括游程(run)長(zhǎng)度編碼、最小二乘法擬合(Leastsquarefitting)、霍夫變換、和具有針對(duì)鄰居中心對(duì)稱的單調(diào)線性結(jié)構(gòu)元素(flatlinearstructuringelement)的數(shù)學(xué)形態(tài)學(xué)(MathematicalMorphology)。最小二乘法擬合方法能受到噪聲的顯著影響。游程長(zhǎng)度編碼基于作為線段的候選的局部線狀結(jié)構(gòu)的搜索或跟蹤。塊鄰接圖(BAG)是其中合并鄰接水平游程的線鄰接圖的概括。例如參見,BinYu和AnilK.Jain,uKGenericSystemforFormDropout”,IEEETrans.PAMI,Vol.18,N0.11,1996(其后“Yuetal.1996”)。然而,在要去除的線是斷開片段的情況下,游程長(zhǎng)度編碼及其擴(kuò)展BAG方法通常不產(chǎn)生(deliver)令人滿意的結(jié)果。在基于BAG的系統(tǒng)中,僅當(dāng)提供空白制表文檔以生成制表結(jié)構(gòu)模板時(shí),才能提取手寫和機(jī)器打印的字符兩者?;舴蜃儞Q是特別耗時(shí)的,因?yàn)樗ㄟ^昂貴的三角法計(jì)算而將圖像中的每一像素變換到霍夫參數(shù)空間中。[0004]也能對(duì)灰度等級(jí)文檔圖像執(zhí)行檢測(cè)線段。典型方法包括基于向量化的跟蹤、數(shù)學(xué)形態(tài)學(xué)、和線段檢測(cè)器(LSD)?;贚SD的方法對(duì)于文檔圖像不能很好工作,因?yàn)長(zhǎng)SD基于梯度(gradient)擬合。復(fù)雜文本域梯度圖(fieldgradientmap)能改變局部線梯度分布。[0005]許多現(xiàn)有線去除方法不保留與這些線交叉的手寫和打印字符的完整筆劃;結(jié)果,在線去除之后的二值化圖像中,個(gè)別符號(hào)有時(shí)變得分解為幾個(gè)破碎部分,或者符號(hào)的部分有時(shí)被截短。圖7圖示了使用傳統(tǒng)方法的下劃線去除的一些示例,其中能看到破碎字符和截短的結(jié)果。一些方法嘗試在線去除之后重新連接破碎字符。例如,Yuetal.1996描述了線去除的方案,其包括線的局部化、字符和線的分離、以及在分離期間引入的破碎筆劃的重構(gòu)。[0006]XiangyunYe、MohamedCheriet、ChingY.Suen和KeLiu,“Extract1nofbankcheckitemsbymathematicalmorphology,”Internat1nalJ.0nDocumentAnalysisandRecognit1n(1999)(其后“Yeetal.1999”)描述了從銀行支票圖像中提取字符的方法,其使用數(shù)學(xué)形態(tài)學(xué)用于線檢測(cè)。線去除之后的破碎筆劃然后使用動(dòng)態(tài)內(nèi)核來恢復(fù)。在Ye的筆劃恢復(fù)方法中,需要線和筆劃交叉的區(qū)域周圍的正確局部定位,以發(fā)現(xiàn)用于修補(bǔ)破碎筆劃的正確動(dòng)態(tài)內(nèi)核,但是局部定位取決于接觸線和筆劃的長(zhǎng)度和寬度?!?br/>發(fā)明內(nèi)容】[0007]本發(fā)明針對(duì)用于文檔圖像中的線去除的方法和相關(guān)設(shè)備,其基本消除由于現(xiàn)有技術(shù)的缺陷和缺點(diǎn)導(dǎo)致的問題中的一個(gè)或多個(gè)。[0008]本發(fā)明的目的是提供用于在保留與直線交叉的字符筆劃的同時(shí)、從文檔圖像去除這些線的方法。[0009]本發(fā)明的其他特征和優(yōu)點(diǎn)將在接下來的描述中闡明,并將根據(jù)該描述而部分清楚,或者可通過實(shí)踐本發(fā)明來得知。本發(fā)明的目的和其他優(yōu)點(diǎn)將通過在書寫的描述及其權(quán)利要求以及附圖中具體指出的結(jié)構(gòu)來實(shí)現(xiàn)和達(dá)到。[0010]為了實(shí)現(xiàn)這些和/或其他目的,如實(shí)施和廣泛描述的,本發(fā)明提供了一種用于處理包括沿第一方向延伸的直線的文檔圖像的方法,該方法包括:(a)標(biāo)識(shí)沿第一方向延伸的直線;(b)計(jì)算用于該線的游程長(zhǎng)度分布圖,該游程長(zhǎng)度分布圖是作為沿著該線的第一方向中的位置的函數(shù)的游程長(zhǎng)度值,其中給定位置處的每一游程長(zhǎng)度值是包括該線中的非白像素的、沿著與第一方向正交的第二方向延伸的多個(gè)連續(xù)非白像素;(c)通過檢測(cè)該游程長(zhǎng)度分布圖的第一類特性特征,來檢測(cè)該線的第一類交叉區(qū)域的集合,所述第一類特性特征中的每一個(gè)包括山谷、和在預(yù)定義距離內(nèi)位于山谷兩側(cè)的兩個(gè)山峰,每一山峰和山谷的游程長(zhǎng)度值之間的差大于第一閾值;(d)通過檢測(cè)該游程長(zhǎng)度分布圖的第二類特性特征,來檢測(cè)該線的第二類交叉區(qū)域的集合,所述第二類特性特征中的每一個(gè)包括其中游程長(zhǎng)度值大于第二閾值的多個(gè)連續(xù)位置;和(e)在保留所述第一和第二類交叉區(qū)域中的線的同時(shí),去除第一和第二類交叉區(qū)域外的區(qū)域中的線。[0011]在一個(gè)實(shí)施例中,步驟(C)包括:計(jì)算該游程長(zhǎng)度分布圖的一階導(dǎo)數(shù)曲線;檢測(cè)該一階導(dǎo)數(shù)曲線的向上過零點(diǎn)和向下過零點(diǎn);和通過匹配向上過零點(diǎn)和向下過零點(diǎn),來標(biāo)識(shí)所述第一類交叉區(qū)域。在一個(gè)實(shí)施例中,使用N點(diǎn)中心差來計(jì)算一階導(dǎo)數(shù)曲線。[0012]在另一方面中,本發(fā)明提供了一種計(jì)算機(jī)程序產(chǎn)品,包括其中嵌入有用于控制數(shù)據(jù)處理設(shè)備的計(jì)算機(jī)可讀程序代碼的計(jì)算機(jī)可用非瞬時(shí)介質(zhì)(即,存儲(chǔ)器或儲(chǔ)存裝置),該計(jì)算機(jī)可讀程序代碼被配置為促使該數(shù)據(jù)處理設(shè)備運(yùn)行以上方法。[0013]應(yīng)理解的是,前述一般描述和后面詳細(xì)描述是示范性和解釋性的,并意欲提供要求保護(hù)的本發(fā)明的進(jìn)一步解釋?!緦@綀D】【附圖說明】[0014]圖1示意性圖示了根據(jù)本發(fā)明實(shí)施例的用于從文檔圖像檢測(cè)和去除直線的方法的階段。[0015]圖2(a)圖示了包括與手寫字符的筆劃交叉的水平直線的灰度等級(jí)文檔圖像的示例。[0016]圖2(b)圖示了在使用根據(jù)本發(fā)明實(shí)施例的方法去除水平線之后、從圖2(a)的圖像獲得的二進(jìn)制圖像。[0017]圖3(a)是示出了水平線段和字符筆劃的部分的交叉的文檔圖像的補(bǔ)丁(patch)的放大示意圖示。[0018]圖3(b)示意性圖示了使用根據(jù)本發(fā)明實(shí)施例的方法在保留交叉筆劃的同時(shí)去除線之后的、圖3(a)的圖像的補(bǔ)丁。[0019]圖4(a)圖示了用于水平線的垂直游程長(zhǎng)度分布圖。[0020]圖4(b)圖示了從圖4(a)的游程長(zhǎng)度分布圖獲得的一階導(dǎo)數(shù)曲線。[0021]圖5示意性圖示了根據(jù)本發(fā)明實(shí)施例的檢測(cè)線交叉區(qū)域的方法。[0022]圖6示意性圖示了其中可實(shí)現(xiàn)本發(fā)明的實(shí)施例的數(shù)據(jù)處理設(shè)備。[0023]圖7示出了使用傳統(tǒng)方法的線去除的示例。【具體實(shí)施方式】[0024]本發(fā)明的實(shí)施例在文檔圖像處理中提供了用于在保留與直線交叉的字符筆劃的同時(shí)、檢測(cè)和去除這些線的方法。文檔中的字符可包括打印或手寫字符。這些直線的示例包括文本的下劃線、表格和制表中的線等。這樣的線趨于非常接近垂直或水平,并在該公開中被稱為垂直和水平線,但是應(yīng)理解的是,在成像處理中由于歪斜或其他失真,它們可以不是嚴(yán)格水平或垂直的。換言之,應(yīng)理解的是,該公開和所附權(quán)利要求中使用的術(shù)語“水平線”、“垂直線”、“沿著水平方向延伸的線”、和“沿著垂直方向延伸的線”廣義包括接近水平和接近垂直的線,例如可分別與水平和垂直方向偏離至多I度的線。應(yīng)注意的是,從成像處理(例如,掃描或拍攝)獲得的原始圖像經(jīng)常包括歪斜和其他失真。作為文檔圖像處理中的廣泛使用的技術(shù)的去歪斜應(yīng)作為預(yù)處理步驟被施加到圖像,以校正成像處理中引入的歪斜。當(dāng)前可用的去歪斜技術(shù)能將歪斜校正為遠(yuǎn)低于I度。[0025]下面的描述集中于水平和垂直線的去除;然而,如稍后描述的,該方法也可被用來通過首先旋轉(zhuǎn)圖像、來去除非垂直和非水平線。[0026]圖1示意性圖示了根據(jù)本發(fā)明實(shí)施例的用于從文檔圖像檢測(cè)和去除水平或垂直直線的方法。該方法被應(yīng)用到已二值化的文檔圖像。該方法包括三個(gè)階段。首先,通過使用例如數(shù)學(xué)形態(tài)學(xué)來檢測(cè)線的存在(步驟SI)??墒褂靡阎椒ㄓ糜谠撾A段。第二,使用采用局部游程長(zhǎng)度分布圖的方法,來檢測(cè)字符筆劃和線之間的交叉區(qū)域(步驟S2)。第三,基于來自步驟S2的檢測(cè)結(jié)果,使用保留交叉字符筆劃的方法來去除這些線(步驟S3)。[0027]在應(yīng)用圖1中示出的步驟SI到S3之前,文檔圖像可經(jīng)受某些預(yù)處理步驟,其許多步驟是本領(lǐng)域普遍知道的。[0028]下面使用圖2(a)-4(b)中示出的示例來更詳細(xì)地描述這些階段。下面的描述使用水平線作為示例,但是該方法可利用適當(dāng)變型(例如,通過切換該方法中的X和I像素坐標(biāo))應(yīng)用到垂直線。[0029]圖2(a)示出了原始灰度等級(jí)文檔圖像的一部分的示例,其示出了三根水平直線,具有其中一些手寫字符的筆劃與每一線交叉的多個(gè)區(qū)域。圖2(b)示出了在二值化之后、和使用圖1的方法去除水平線之后的圖2(a)的圖像。圖3(a)是示出了水平線段31和字符筆劃/線32的一部分的交叉的文檔圖像的放大補(bǔ)丁的示意圖示。圖3(a)的虛線代表這兩根線的大致中心。要注意的是,為了簡(jiǎn)化,將字符筆劃32示出為直線,但是其也可以是曲線。[0030]對(duì)于線檢測(cè)的第一階段SI,可以采用數(shù)學(xué)形態(tài)學(xué)?;緮?shù)學(xué)形態(tài)學(xué)運(yùn)算包括腐蝕、膨脹、開和閉。為了檢測(cè)水平線,可向該圖像應(yīng)用具有固定長(zhǎng)度單調(diào)線性結(jié)構(gòu)元素(例如,大約線結(jié)構(gòu)的尺寸選擇150個(gè)像素)的水平開運(yùn)算。也可使用其他線檢測(cè)方法,諸如霍夫變換、游程長(zhǎng)度編碼、多灰度線檢測(cè)等。這些方法中的一些能檢測(cè)沿著任何方向延伸的線,而不僅是接近水平和接近垂直的線。這些方法中的許多是公知的。線檢測(cè)步驟從文檔圖像提取線,并生成僅包括提取的線的中間圖像。該中間圖像不包括與提取的線交叉的其他線。[0031]參考圖3(a)、4(a)和4(b)來描述線和筆劃的交叉的檢測(cè)(第二階段S2)。交叉檢測(cè)方法使用檢測(cè)的水平線的垂直游程長(zhǎng)度分布圖。垂直游程長(zhǎng)度是沿著垂直(y)方向游動(dòng)的連續(xù)非白像素的數(shù)目。這里定義的水平線的垂直游程長(zhǎng)度分布圖是作為沿著該線的水平坐標(biāo)X的函數(shù)的垂直游程長(zhǎng)度值;垂直方向的非白像素的游程包括構(gòu)成該線的非白像素、和與它們(沿著y方向)連續(xù)連接的任何非白像素。在交叉中沒有涉及的沿著該線的X位置處,垂直游程長(zhǎng)度趨于成為作為該線的高度的恒定值(水平線的寬度被統(tǒng)稱為線高度)。圖4(a)示出了用于水平線的垂直游程長(zhǎng)度分布圖;在該示例中,這是位于簽名之上的圖2(a)中的水平線的游程長(zhǎng)度分布圖??梢钥吹?,例如,段41對(duì)應(yīng)于沒有涉及任何交叉的線的一段;該線段的線寬度是大約8個(gè)像素,垂直游程長(zhǎng)度值在7和9個(gè)像素之間波動(dòng)。應(yīng)注意的是,像素的X和I坐標(biāo)值是整數(shù)。[0032]在與另一線(例如,字符筆劃)的交叉點(diǎn)附近的X位置處,如圖3(a)中示意性描繪的,垂直游程長(zhǎng)度值顯著偏移恒定值(線高度)。在圖3(a)中,繪制多根短的雙向箭頭的垂直線以示意性指示各個(gè)X位置處的游程長(zhǎng)度。游程長(zhǎng)度分布圖的典型行為如下。從交叉區(qū)域之外的X位置開始,當(dāng)X增加時(shí),游程長(zhǎng)度值保持接近恒定值(線高度);當(dāng)X到達(dá)交叉區(qū)域的開端時(shí),游程長(zhǎng)度值急劇增加;當(dāng)X接近交叉區(qū)域的中心時(shí),它然后相對(duì)緩和地下降到最小值,之后相對(duì)緩和地增加;當(dāng)X到達(dá)交叉區(qū)域的結(jié)尾時(shí),游程長(zhǎng)度值急劇向回下降到接近恒定值。換言之,沿著X軸的游程長(zhǎng)度分布圖具有兩個(gè)山峰和其間的山谷,其中山峰的外坡(它們的朝向遠(yuǎn)離山谷)陡峭并且內(nèi)坡(它們朝向山谷)相對(duì)不太陡峭。在圖4(a)中,標(biāo)記為42的插入盒是示出該行為的游程長(zhǎng)度分布圖的一部分的擴(kuò)展圖。[0033]因?yàn)樵撚纬涕L(zhǎng)度分布圖的該行為是線交叉的區(qū)域中的特性,所以其能用來檢測(cè)交叉。圖5示意性圖示了根據(jù)本發(fā)明實(shí)施例的用于檢測(cè)沿著線的交叉點(diǎn)、并按照保留筆劃的方式來去除線的方法。該方法對(duì)應(yīng)于圖1的階段S2和S3。圖5中示出的步驟施加到階段SI中所檢測(cè)的每一線。[0034]使用僅包括所檢測(cè)的線的中間圖像,將形態(tài)平滑首先施加到正在處理的線,以使得其平滑(步驟S51)。該步驟是期望的但是是可選的。然后,計(jì)算該線的限制盒(步驟S52)。圖像對(duì)象的限制盒是限制該圖像對(duì)象的、形狀典型為矩形的盒子。因?yàn)橹虚g圖像僅包括所檢測(cè)的線并不包括其他交叉線,所以如果線是嚴(yán)格水平的,則限制盒將基本上符合線的形狀。如果線不是嚴(yán)格水平的,則限制盒將比線高度更高。然后,使用多個(gè)樣本點(diǎn)(即,X位置)來估計(jì)線高度(步驟S53)。優(yōu)選地,樣本點(diǎn)的數(shù)目是預(yù)先確定的,并且這些點(diǎn)處于沿著該線的相等間隔的地點(diǎn)處。可通過對(duì)X位置處的限制盒中的非白像素的數(shù)目進(jìn)行計(jì)數(shù),來計(jì)算每一樣本點(diǎn)X處的線高度。在一個(gè)示例中,使用30個(gè)樣本點(diǎn)。[0035]然后,計(jì)算該線的中間軸(步驟S54)。一般來說,對(duì)象的中間軸是對(duì)象的邊界上具有多于一個(gè)最接近的點(diǎn)的所有點(diǎn)的集合。應(yīng)注意的是,線對(duì)象的真實(shí)中間軸可以不經(jīng)過像素中心,特別是當(dāng)線不嚴(yán)格水平的時(shí)侯。這里,線的中間軸可以通過位于與真實(shí)中間軸最接近處的像素來定義。由此,如果線輕微傾斜,則中間軸可具有臺(tái)階形狀。中間軸可通過跟蹤該線而獲得。而且,由于中間圖像僅包括沒有分支的水平線,所以跟蹤是直線前進(jìn)的。即使在其中兩根線平行并且彼此非常接近的情況下,中間軸跟蹤也將不越過線的邊界。[0036]然后,計(jì)算用于該線的垂直游程長(zhǎng)度分布圖,S卩,沿著中間軸的每一點(diǎn)(X位置)處的垂直游程長(zhǎng)度值(步驟S55)。這可例如通過從中間軸上的像素開始、并對(duì)沿著垂直上下方向的連續(xù)連接的非白像素的數(shù)目進(jìn)行計(jì)數(shù)來進(jìn)行。優(yōu)選地,當(dāng)計(jì)算垂直游程長(zhǎng)度時(shí),強(qiáng)加中間軸上面和下面的y坐標(biāo)的上限和下限,以便避免在水平線與垂直線或字符筆劃交叉的情況下、過分長(zhǎng)的游程長(zhǎng)度。[0037]然后,使用游程長(zhǎng)度分布圖(例如圖4(a)),在步驟S561—S565檢測(cè)交叉區(qū)域。首先,使用N點(diǎn)中心差來計(jì)算游程長(zhǎng)度分布圖的一階導(dǎo)數(shù)(步驟S561)。N點(diǎn)中心差被定義為:[0038]d(i)=S(i+N)-S(1-N)[0039]其中S是信號(hào)(游程長(zhǎng)度)值,d是一階導(dǎo)數(shù),i是X位置,并且N是預(yù)定數(shù)。N的值可以是例如從I到10。一般來說,交叉線越接近垂直,山峰和山谷將越窄,并且所以N的相對(duì)較小值將是可期望的。[0040]計(jì)算一階導(dǎo)數(shù)的較簡(jiǎn)單的等式將是[0041]d(i)=S(i+1)-S(i)[0042]與該更典型的定義相比,該實(shí)施例中使用的N點(diǎn)中心差幫助去除局部噪聲,并處置垂直游程長(zhǎng)度分布圖中的平坦峰頂,如圖4(a)的插入盒42中所示(右邊的山峰)。如果使用較簡(jiǎn)單的等式,則在平坦山峰區(qū)域中一階導(dǎo)數(shù)將為零,導(dǎo)致檢測(cè)過零點(diǎn)的困難,這將稍后更詳細(xì)地進(jìn)行描述。[0043]可使用其他計(jì)算一階導(dǎo)數(shù)的方式,但是優(yōu)選地,使用的等式應(yīng)包括一些形式的平均化,以降低或消除平坦峰頂?shù)挠绊?。[0044]優(yōu)選例如通過使用滑動(dòng)窗口平均化來對(duì)一階導(dǎo)數(shù)曲線進(jìn)行平滑化(步驟S562)。窗口尺寸可以是例如6個(gè)像素。[0045]圖4(b)示出了圖4(a)中示出的垂直游程長(zhǎng)度分布圖的一階導(dǎo)數(shù)曲線。在該特定示例中,使用N(N=3)點(diǎn)中心差來計(jì)算一階導(dǎo)數(shù)。插入盒43示出了交叉區(qū)域中的一階導(dǎo)數(shù)曲線的一部分的擴(kuò)展圖。因?yàn)榻徊鎱^(qū)域中的垂直游程長(zhǎng)度分布圖具有兩個(gè)山峰之間具有山谷的特性形狀,所以,該區(qū)域中的一階導(dǎo)數(shù)曲線具有以下特性形狀:從接近零的電平開始,它急劇上升為正值,然后在經(jīng)過第一過零點(diǎn)的同時(shí)急劇下降到負(fù)值,然后在經(jīng)過第二過零點(diǎn)的同時(shí)第二次急劇上升到正值,然后在經(jīng)過第三過零點(diǎn)的同時(shí)第二次急劇下降到負(fù)值,并最后上升返回到接近零的電平。第一和第三過零點(diǎn)(向下過零)對(duì)應(yīng)于游程長(zhǎng)度分布圖中的峰頂;第二過零點(diǎn)(向上過零)對(duì)應(yīng)于谷底。[0046]使用一階導(dǎo)數(shù)曲線的該特性形狀來檢測(cè)游程長(zhǎng)度分布圖的山谷(步驟S563)和山峰(步驟S564)。特別是,一階導(dǎo)數(shù)曲線中的向上過零(對(duì)應(yīng)于山谷)可通過找到滿足以下的X位置j來檢測(cè):[0047]d(j)(O并且d(j+1)>0,以及[0048]d(j+l)-d(j)>Tl[0049]換言之,一階導(dǎo)數(shù)值在點(diǎn)j附近從負(fù)(或零)改變?yōu)檎?,并且該點(diǎn)處的一階導(dǎo)數(shù)曲線的斜率大于閾值Tl。閾值Tl的目的是消除其中一階導(dǎo)數(shù)值在零周圍少量波動(dòng)的非交叉區(qū)域中的點(diǎn)。[0050]一階導(dǎo)數(shù)曲線中的向下過零(對(duì)應(yīng)于山峰)可通過找到滿足以下的X位置k來檢測(cè):[0051]d(k)彡O并且d(k+l)〈0,以及[0052]d(k)-d(k+l)>T2[0053]其中T2是閾值。[0054]按照該方式發(fā)現(xiàn)的地點(diǎn)j和k對(duì)應(yīng)于垂直游程長(zhǎng)度分布圖中的山峰和山谷地點(diǎn)。[0055]在發(fā)現(xiàn)所有山谷和山峰地點(diǎn)之后,通過匹配山谷地點(diǎn)和山峰地點(diǎn),來驗(yàn)證交叉區(qū)域的存在(步驟S565)。特別是,對(duì)于每一山谷地點(diǎn)(向上過零點(diǎn)),如果兩個(gè)山峰地點(diǎn)(向下過零點(diǎn))分別存在于山谷的左邊和右邊的特定距離中,并且如果山峰地點(diǎn)和山谷地點(diǎn)之間的游程長(zhǎng)度值的差值大于左和右山峰兩者的閾值,則認(rèn)為山谷和兩個(gè)對(duì)應(yīng)山峰定義交叉區(qū)域。該交叉區(qū)域可被定義為分別在左和右山峰地點(diǎn)處開始和結(jié)束,或者其可被定義為也分別包括在山峰左邊和右邊的預(yù)定數(shù)目的像素。[0056]如前面提及的,一般來說,N點(diǎn)中心差的相對(duì)小值N趨于較好工作用于檢測(cè)與比較接近垂直的線的交叉點(diǎn),并且相對(duì)大值N趨于較好工作用于檢測(cè)與比較接近水平的線的交叉點(diǎn)。對(duì)于典型文檔,小心選擇的N值(例如,5)將產(chǎn)生令人滿意的結(jié)果。為了增強(qiáng)線檢測(cè)可靠性和穩(wěn)定性,在一個(gè)實(shí)現(xiàn)中,利用不同N值來多次執(zhí)行步驟S561到S565(例如,兩次分別N=3和N=6),并且在步驟S565從多個(gè)游程檢測(cè)的交叉區(qū)域被組合到一起(即,通過檢測(cè)的交叉點(diǎn)的多個(gè)集合的聯(lián)合)。[0057]垂直游程長(zhǎng)度分布圖及其一階導(dǎo)數(shù)曲線的上述特性行為出現(xiàn)在其中水平線與非垂直線交叉的一類交叉區(qū)域中。在其中水平線與垂直或接近垂直的線交叉的第二類交叉區(qū)域中,垂直游程長(zhǎng)度分布圖將不具有山谷和兩個(gè)山峰;相反,其將具有具有大游程長(zhǎng)度值(典型地,比線高度大三倍)的多個(gè)連續(xù)X位置。如前面提及的,當(dāng)計(jì)算垂直游程長(zhǎng)度時(shí),強(qiáng)加上和下限;由此,與垂直或接近垂直的線交叉的區(qū)域中的游程長(zhǎng)度值經(jīng)常和將允許的上和/或下限一樣高。這些第二類交叉區(qū)域通過檢測(cè)游程長(zhǎng)度分布圖中的這樣的特征來檢測(cè)(步驟S566)。[0058]在步驟S57(對(duì)應(yīng)于圖1的階段S3),例如通過對(duì)于位于這兩類交叉區(qū)域(即,在步驟S565和S566檢測(cè)的交叉區(qū)域)之外的線的所有像素、將像素值改變?yōu)榘?,來去除所檢測(cè)的線。將保留位于這些交叉區(qū)域中的像素的像素值。圖3(b)示意性圖示了向圖3(a)中示出的線段施加的線去除的結(jié)果。[0059]這里描述的線檢測(cè)和去除方法不需要關(guān)于線的地點(diǎn)的先驗(yàn)知識(shí)或假設(shè)。換言之,該方法是去除表格、制表和下劃線中的線并提取手寫或打印字符的無模板系統(tǒng)。[0060]上述方法能被修改用于垂直線去除。例如,代替垂直游程長(zhǎng)度分布圖,使用用于垂直線的水平游程長(zhǎng)度分布圖。[0061]而且,該方法不限于水平和垂直線的去除;其也可用來去除傾斜線。為了實(shí)現(xiàn)此,在線檢測(cè)階段(Si)中,使用能檢測(cè)任何方向的線的方法,諸如霍夫變換方法。在計(jì)算出所檢測(cè)的線的方向之后,旋轉(zhuǎn)包括傾斜線的圖像或圖像的一部分,使得傾斜線成為水平(或垂直)線。然后,能對(duì)旋轉(zhuǎn)的圖像執(zhí)行交叉檢測(cè)階段和線去除階段(圖1的步驟S2和S3,圖5的步驟S51-S57)。在線去除之后,將圖像旋轉(zhuǎn)回到其原始朝向。[0062]這里描述的線去除方法能在諸如圖6中示出的計(jì)算機(jī)120的數(shù)據(jù)處理系統(tǒng)中實(shí)現(xiàn)。計(jì)算機(jī)120包括處理器121、存儲(chǔ)裝置(例如,硬盤)122、和內(nèi)部存儲(chǔ)器(例如,RAM)123。存儲(chǔ)裝置122存儲(chǔ)軟件程序,所述軟件程序被讀出到RAM123并由處理器121運(yùn)行,以執(zhí)行所述方法。[0063]本領(lǐng)域技術(shù)人員將顯而易見的是,能在本發(fā)明的線去除方法中進(jìn)行各種修改和變型,而不脫離本發(fā)明的精神或范圍。由此,本發(fā)明意欲覆蓋落入所附權(quán)利要求及其等效的范圍中的修改和變型?!緳?quán)利要求】1.一種用于處理包括沿第一方向延伸的直線的文檔圖像的方法,該方法包括:(a)標(biāo)識(shí)沿第一方向延伸的直線;(b)計(jì)算用于該線的游程長(zhǎng)度分布圖,該游程長(zhǎng)度分布圖是作為沿著該線的第一方向的位置的函數(shù)的游程長(zhǎng)度值,其中給定位置處的每一游程長(zhǎng)度值是包括該線中的非白像素的、沿著與第一方向正交的第二方向延伸的多個(gè)連續(xù)非白像素;(C)通過檢測(cè)該游程長(zhǎng)度分布圖的第一類特性特征,來檢測(cè)該線的第一類交叉區(qū)域的集合,所述第一類特性特征中的每一個(gè)包括山谷、和在預(yù)定義距離內(nèi)位于山谷兩側(cè)的兩個(gè)山峰,每一山峰和山谷的游程長(zhǎng)度值之間的差大于第一閾值;(d)通過檢測(cè)該游程長(zhǎng)度分布圖的第二類特性特征,來檢測(cè)該線的第二類交叉區(qū)域的集合,所述第二類特性特征中的每一個(gè)包括其中游程長(zhǎng)度值大于第二閾值的多個(gè)連續(xù)位置;和(e)在保留所述第一和第二類交叉區(qū)域中的線的同時(shí),去除所述第一和第二類交叉區(qū)域外的區(qū)域中的線。2.根據(jù)權(quán)利要求1的方法,其中步驟(b)包括:計(jì)算該線的中間軸;和通過對(duì)與中間軸上的像素連接并沿著第二方向延伸的多個(gè)連續(xù)非白像素進(jìn)行計(jì)數(shù),來計(jì)算該中間軸的每一像素位置處的游程長(zhǎng)度值。3.根據(jù)權(quán)利要求1的方法,其中步驟(c)包括:計(jì)算該游程長(zhǎng)度分布圖的一階導(dǎo)數(shù)曲線;檢測(cè)該一階導(dǎo)數(shù)曲線的向上過零點(diǎn)和向下過零點(diǎn);和通過匹配向上過零點(diǎn)和向下過零點(diǎn),來標(biāo)識(shí)所述第一類交叉區(qū)域。4.根據(jù)權(quán)利要求1的方法,其中步驟(c)包括:(cl)計(jì)算該游程長(zhǎng)度分布圖的一階導(dǎo)數(shù)曲線d(i),其中i是第一方向上的位置;(c2)檢測(cè)該一階導(dǎo)數(shù)曲線中滿足下式的向上過零點(diǎn)j:d(j)彡O并且d(j+l)>0,以及d(j+l)-d(j)>Tl其中Tl是第三閾值,(c3)檢測(cè)該一階導(dǎo)數(shù)曲線中滿足下式的向下過零點(diǎn)k:d(k)彡O并且d(k+l)〈0,以及d(k)-d(k+l)>T2其中T2是第四閾值,(c4)標(biāo)識(shí)所述第一類交叉區(qū)域的集合,在所述第一類交叉區(qū)域中的每一個(gè)中,兩個(gè)向下過零點(diǎn)位于向上過零點(diǎn)兩側(cè)的預(yù)定義距離內(nèi),并且向下過零點(diǎn)中的每一個(gè)和向上過零點(diǎn)之間的游程長(zhǎng)度值之差大于第一閾值,其中第一類交叉區(qū)域被定義為兩個(gè)向下過零點(diǎn)之間的區(qū)域。5.根據(jù)權(quán)利要求4的方法,其中,在步驟(Cl)中,使用N點(diǎn)中心差來計(jì)算一階導(dǎo)數(shù)曲線.d(i)=S(i+N)-S(1-N)其中S是游程長(zhǎng)度值并且N是預(yù)定數(shù)目。6.根據(jù)權(quán)利要求5的方法,其中步驟(c)進(jìn)一步包括:(c5)使用不同N值重復(fù)步驟(Cl),以計(jì)算該游程長(zhǎng)度分布圖的另一一階導(dǎo)數(shù)曲線;(c6)使用所述另一一階導(dǎo)數(shù)曲線重復(fù)步驟(c2)、(c3)和(c4),以標(biāo)識(shí)第一類交叉區(qū)域的另一集合;和(c7)組合在步驟(c4)標(biāo)識(shí)的第一類交叉區(qū)域的集合和在步驟(c6)標(biāo)識(shí)的第一類交叉區(qū)域的另一集合。7.根據(jù)權(quán)利要求5的方法,進(jìn)一步包括:在步驟(c2)之前,使得通過N點(diǎn)中心差計(jì)算的一階導(dǎo)數(shù)曲線平滑。8.一種計(jì)算機(jī)程序產(chǎn)品,包括其中嵌入有用于控制數(shù)據(jù)處理設(shè)備的計(jì)算機(jī)可讀程序代碼的計(jì)算機(jī)可用非瞬時(shí)介質(zhì),該計(jì)算機(jī)可讀程序代碼被配置為促使該數(shù)據(jù)處理設(shè)備運(yùn)行用于處理包括沿第一方向延伸的直線的文檔圖像的處理,該處理包括:(a)標(biāo)識(shí)沿第一方向延伸的直線;(b)計(jì)算用于該線的游程長(zhǎng)度分布圖,該游程長(zhǎng)度分布圖是作為沿著該線的第一方向的位置的函數(shù)的游程長(zhǎng)度值,其中給定位置處的每一游程長(zhǎng)度值是包括該線中的非白像素的、沿著與第一方向正交的第二方向延伸的多個(gè)連續(xù)非白像素;(C)通過檢測(cè)該游程長(zhǎng)度分布圖的第一類特性特征,來檢測(cè)該線的第一類交叉區(qū)域的集合,所述第一類特性特征中的每一個(gè)包括山谷、和在預(yù)定義距離內(nèi)位于山谷兩側(cè)的兩個(gè)山峰,每一山峰和山谷的游程長(zhǎng)度值之間的差大于第一閾值;(d)通過檢測(cè)該游程長(zhǎng)度分布圖的第二類特性特征,來檢測(cè)該線的第二類交叉區(qū)域的集合,所述第二類特性特征中的每一個(gè)包括其中游程長(zhǎng)度值大于第二閾值的多個(gè)連續(xù)位置;和(e)在保留所述第一和第二類交叉區(qū)域中的線的同時(shí),去除所述第一和第二類交叉區(qū)域外的區(qū)域中的線。9.根據(jù)權(quán)利要求8的計(jì)算機(jī)程序產(chǎn)品,其中步驟(b)包括:計(jì)算該線的中間軸;和通過對(duì)與中間軸上的像素連接并沿著第二方向延伸的多個(gè)連續(xù)非白像素進(jìn)行計(jì)數(shù),來計(jì)算該中間軸的每一像素位置處的游程長(zhǎng)度值。10.根據(jù)權(quán)利要求8的計(jì)算機(jī)程序產(chǎn)品,其中步驟(c)包括:計(jì)算該游程長(zhǎng)度分布圖的一階導(dǎo)數(shù)曲線;檢測(cè)該一階導(dǎo)數(shù)曲線的向上過零點(diǎn)和向下過零點(diǎn);和通過匹配向上過零點(diǎn)和向下過零點(diǎn),來標(biāo)識(shí)所述第一類交叉區(qū)域。11.根據(jù)權(quán)利要求8的計(jì)算機(jī)程序產(chǎn)品,其中步驟(C)包括:(cl)計(jì)算該游程長(zhǎng)度分布圖的一階導(dǎo)數(shù)曲線d(i),其中i是第一方向上的位置;(c2)檢測(cè)該一階導(dǎo)數(shù)曲線中滿足下式的向上過零點(diǎn)j:d(j)(O并且d(j+l)>0,以及d(j+l)-d(j)>Tl其中Tl是第三閾值,(c3)檢測(cè)該一階導(dǎo)數(shù)曲線中滿足下式的向下過零點(diǎn)k:d(k)彡O并且d(k+l)〈0,以及d(k)-d(k+l)>T2其中T2是第四閾值,(c4)標(biāo)識(shí)所述第一類交叉區(qū)域的集合,在所述第一類交叉區(qū)域中的每一個(gè)中,兩個(gè)向下過零點(diǎn)位于向上過零點(diǎn)兩側(cè)的預(yù)定義距離內(nèi),并且向下過零點(diǎn)中的每一個(gè)和向上過零點(diǎn)之間的游程長(zhǎng)度值之差大于第一閾值,其中第一類交叉區(qū)域被定義為兩個(gè)向下過零點(diǎn)之間的區(qū)域。12.根據(jù)權(quán)利要求11的計(jì)算機(jī)程序產(chǎn)品,其中,在步驟(Cl)中,使用N點(diǎn)中心差來計(jì)算一階導(dǎo)數(shù)曲線:d(i)=S(i+N)-S(1-N)其中S是游程長(zhǎng)度值并且N是預(yù)定數(shù)目。13.根據(jù)權(quán)利要求12的計(jì)算機(jī)程序產(chǎn)品,其中步驟(c)進(jìn)一步包括:(c5)使用不同N值重復(fù)步驟(Cl),以計(jì)算該游程長(zhǎng)度分布圖的另一一階導(dǎo)數(shù)曲線;(c6)使用所述另一一階導(dǎo)數(shù)曲線重復(fù)步驟(c2)、(c3)和(c4),以標(biāo)識(shí)第一類交叉區(qū)域的另一集合;和(c7)組合在步驟(c4)標(biāo)識(shí)的第一類交叉區(qū)域的集合和在步驟(c6)標(biāo)識(shí)的第一類交叉區(qū)域的另一集合。14.根據(jù)權(quán)利要求12的計(jì)算機(jī)程序產(chǎn)品,進(jìn)一步包括:在步驟(c2)之前,使得通過N點(diǎn)中心差計(jì)算的一階導(dǎo)數(shù)曲線平滑?!疚臋n編號(hào)】G06K9/46GK104376318SQ201410398898【公開日】2015年2月25日申請(qǐng)日期:2014年8月14日優(yōu)先權(quán)日:2013年8月15日【發(fā)明者】巫朝紅申請(qǐng)人:柯尼卡美能達(dá)美國研究所有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
广饶县| 深泽县| 十堰市| 镇平县| 常山县| 奉节县| 金塔县| 丹寨县| 潮安县| 禹城市| 双牌县| 宁安市| 报价| 泌阳县| 屏东县| 连城县| 隆安县| 长沙县| 叙永县| 榆林市| 辽阳县| 临沭县| 乌兰察布市| 莱阳市| 衢州市| 大洼县| 揭东县| 大石桥市| 黄山市| 彰化县| 吉安县| 葫芦岛市| 荔波县| 富源县| 大化| 塔城市| 雷波县| 措美县| 丘北县| 莱西市| 葵青区|