專利名稱:一種二值工程圖中的字符檢測方法
技術(shù)領(lǐng)域:
本發(fā)明涉及圖像字符檢測領(lǐng)域,特別是一種方便快捷準(zhǔn)確的二值工程圖中的字符檢測方法。
背景技術(shù):
在自然場景圖像中進(jìn)行字符檢測對(duì)于各類計(jì)算機(jī)視覺問題有著重要的作用,并可在此基礎(chǔ)上探索自動(dòng)導(dǎo)航、圖像檢索、基于內(nèi)容的視頻摘要等研究。此外,在基于內(nèi)容的圖像檢索技術(shù)中,字符檢測算法也扮演著重要的角色。傳統(tǒng)的二值工程圖中的字符檢測方法有著對(duì)圖元和圖元之間粘連相交情況,或者字符串方向的限制,而且為了檢測字符單元會(huì)進(jìn)行耗時(shí)的非字符單元檢測與移除工作。因此如何解決實(shí)際中存在的大量噪音和各種退化情況以及基于內(nèi)容檢索的實(shí)際需要,已成為進(jìn)一步擴(kuò)展各類基于字符檢測應(yīng)用的瓶頸之一。
發(fā)明內(nèi)容
發(fā)明目的本發(fā)明所要解決的技術(shù)問題是針對(duì)現(xiàn)有技術(shù)的不足,提供一種二值工程圖中的字符檢測方法。為了實(shí)現(xiàn)本發(fā)明所述的目的,本發(fā)明提供的一種二值工程圖中的字符檢測方法, 其特征是,包含以下步驟(1)提取二值工程圖中的局部一致性單元(local consecutive segment簡稱LCQ,得到局部一致性單元集合,所述局部一致性單元為一段方向和寬度不變的線段;(2)對(duì)局部一致性單元集合進(jìn)行篩選,得到字符型局部一致性單元,并根據(jù)鄰接性歸并字符型局部一致性單元;(3)根據(jù)幾何特征對(duì)字符型局部一致性單元中的字符區(qū)域進(jìn)行篩選,得到字符塊;(4)對(duì)所述字符塊通過霍夫(Hough)變換找到字符串。本發(fā)明步驟(1)中,提取二值工程圖的局部一致性單元包括以下步驟逐行掃描二值工程圖,對(duì)于掃描過程中遇到的黑色行程r,進(jìn)行以下步驟,所述黑色行程為一行的連續(xù)黑色像素尋找所有和黑色行程r鄰接的局部一致性單元;遍歷鄰接的局部一致性單元,計(jì)算歸屬函數(shù)e (r,S),若歸屬函數(shù)e (r,S)等于1則將黑色行程r加入局部一致性單元S,否則創(chuàng)建一個(gè)新的局部一致性單元Smw,并將黑色行程r放入其中;歸屬函數(shù)e(r,S)的計(jì)算方法如下式
權(quán)利要求
1.一種二值工程圖中的字符檢測方法,其特征在于,包含以下步驟(1)提取二值工程圖中的局部一致性單元,得到局部一致性單元集合,所述局部一致性單元為一段方向和寬度不變的線段;(2)對(duì)局部一致性單元集合進(jìn)行篩選,得到字符型局部一致性單元,并根據(jù)鄰接性歸并字符型局部一致性單元;(3)根據(jù)幾何特征對(duì)字符型局部一致性單元中的字符區(qū)域進(jìn)行篩選,得到字符塊;(4)對(duì)所述字符塊通過霍夫變換找到字符串。
2.如權(quán)利要求1所述的一種二值工程圖中的字符檢測方法,其特征是,步驟(1)中,提取二值工程圖的局部一致性單元包括以下步驟逐行掃描二值工程圖,對(duì)于掃描過程中遇到的黑色行程r,進(jìn)行以下步驟,所述黑色行程為一行的連續(xù)黑色像素尋找所有和黑色行程r鄰接的局部一致性單元;遍歷鄰接的局部一致性單元,計(jì)算歸屬函數(shù)e (r, S),若歸屬函數(shù)e (r,S)等于1則將黑色行程r加入局部一致性單元S,否則創(chuàng)建一個(gè)新的局部一致性單元Snrat,并將黑色行程r放入其中;歸屬函數(shù)e(r,S)的計(jì)算方法如下式
3.如權(quán)利要求1所述的一種二值工程圖中的字符檢測方法,其特征在于,步驟O)中, 包括以下步驟采用下式計(jì)算局部一致性單元的數(shù)值Size (S)
4.如權(quán)利要求3所述的一種二值工程圖中的字符檢測方法,其特征在于,步驟(3)中, 根據(jù)幾何特征對(duì)所得到的候選字符區(qū)進(jìn)行篩選包括以下步驟對(duì)于候選字符區(qū)域包圍盒CC,若滿足以下三項(xiàng)的任意一項(xiàng),則判定是非字符區(qū)域,并排除A)WBRatio < Ta, WBRatio表示候選字符區(qū)域包圍盒CC的像素密度;B)HWRatio > Tb, HWRatio表示候選字符區(qū)域包圍盒CC的高寬比OMaxLength < Tc, MaxLength表示候選字符區(qū)域包圍盒CC的最長邊;Ta、Tb、T。為的設(shè)定閾值。
5.如權(quán)利要求1所述的一種二值工程圖中的字符檢測方法,其特征在于,步驟中, 對(duì)所述字符塊通過霍夫變換找到字符串包括以下步驟步驟(41),將所有距離小于值Td的相鄰的字符塊歸并入一個(gè)連通集合中,Td使用如下公式計(jì)算Td - 0.5 xmax(^,>v). 其中h表示包圍盒的高度,W表示包圍盒的寬度,Z和。分別代表兩個(gè)字符塊包圍盒的平均高度和寬度;步驟(42),以所述連通集合為單位進(jìn)行霍夫變換,從中找到分布在一條直線上的字符塊區(qū)域,將字符塊區(qū)域中具有相同參數(shù)的候選字符區(qū)域進(jìn)行合并,得到共線而且相鄰的字符,從而得到字符串區(qū)域。
全文摘要
本發(fā)明提供了一種二值工程圖中的字符檢測方法,包括如下步驟對(duì)二值的線條圖紙首先進(jìn)行LCS單元提取,得到LCS集合;排除掉噪音型LCS及長直線條型LCS;對(duì)剩下的LCS進(jìn)行歸并,得到候選字符區(qū)域;對(duì)候選字符區(qū)域進(jìn)行幾何特征分析,從而進(jìn)行篩選與排除;對(duì)得到的可信字符塊進(jìn)行Hough得到字符串。本發(fā)明的有益效果在于輸入一張二值線條圖紙,可自動(dòng)定位到其中的字符區(qū)域,該區(qū)域可用于進(jìn)一步的OCR過程等。該方法可節(jié)省大量人工讀圖的時(shí)間開銷,得到的結(jié)果可以直觀反應(yīng)圖紙中的文字內(nèi)容。
文檔編號(hào)G06T7/00GK102289662SQ20111021339
公開日2011年12月21日 申請(qǐng)日期2011年7月28日 優(yōu)先權(quán)日2011年7月28日
發(fā)明者張振宇, 趙妍, 路通 申請(qǐng)人:南京大學(xué)