一種掃描答卷圖像的邊界定位方法
【專利摘要】本發(fā)明提出一種依據(jù)背景灰度與前景的灰度差別特征的圖像邊界定位方法,根據(jù)掃描答卷圖像先計算圖像的邊界特征點,根據(jù)這些邊界特征點可以計算圖像邊界對應(yīng)的直線方程,根據(jù)直線方程之間的交點可以獲取掃描圖像的邊界,最終完成把掃描圖像從掃描背景中分割出來。本發(fā)明提出了邊界特征點計算方法和邊界特征點對應(yīng)的直線方程估計算法;邊界特征點計算時,提出了邊界特征點的自適應(yīng)調(diào)整算法;設(shè)計了掃描答卷圖像的傾斜角度的估計算法,傾斜角度估計精度可達0.01角度。該掃描答卷圖像邊界定位方法具有準確率高、算法時間復(fù)雜度低且易于實現(xiàn)的優(yōu)點,廣泛應(yīng)用于掃描答卷圖像的掃描、分析、識別等領(lǐng)域。
【專利說明】一種掃描答卷圖像的邊界定位方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及圖像處理領(lǐng)域,具體地講,涉及一種掃描答卷圖像的邊界定位方法。
【背景技術(shù)】
[0002]答卷圖像是一類文檔圖像,答卷經(jīng)采集設(shè)備掃描得到答卷圖像,這些圖像一般存儲在計算機中,答卷圖像廣泛應(yīng)用于教育領(lǐng)域的數(shù)字化網(wǎng)上閱卷工程。
[0003]本發(fā)明研究的領(lǐng)域是答卷圖像的自動邊界定位問題,屬圖像預(yù)處理領(lǐng)域,目的是把掃描答卷圖像從原始掃描圖像中分割出來,因此掃描答卷圖像的邊界定位問題也可以理解為掃描答卷圖像的分割問題。
[0004]常用的答卷圖像邊界定位方法使用投影方法,通過統(tǒng)計方法得到掃描答卷圖像的邊界,這種方法對掃描圖像的質(zhì)量要求較高,不能處理噪聲相對復(fù)雜的情況(例如掃描圖像邊界破損或者掃描圖像發(fā)生了傾斜),而且邊界定位的精度不夠,為此本發(fā)明研究了在復(fù)雜噪聲環(huán)境下的掃描答卷邊界定位方法,該方法具備更好的適應(yīng)性,設(shè)計了高精度圖像傾斜角度估計算法,提出了圖像傾斜角度的可信度計算指標,從而在掃描圖像的邊界不規(guī)則時給出量化指標,提高了掃描圖像數(shù)據(jù)處理的質(zhì)量。
[0005]如圖1所示,原始掃描答卷圖像(圖1a)包含大量的背景區(qū)域,一般需要將答卷圖像從原始圖像中分割出來,原始圖像背景區(qū)域含有一些白色直線噪聲,同時答卷圖像中含有一些黑色直線,這些特點使得基于水平投影和垂直的投影的方法變得不穩(wěn)定,如果掃描圖像發(fā)生傾斜或者掃描答卷的尺寸發(fā)生變化,會加劇該算法的不穩(wěn)定性。
【發(fā)明內(nèi)容】
[0006]本發(fā)明要解決的技術(shù)問題是提供一種掃描答卷圖像的邊界定位方法,提高掃描答卷圖像邊界定位的精確度和自適應(yīng)能力。
[0007]本發(fā)明采用如下技術(shù)方案實現(xiàn)發(fā)明目的:
[0008]一種掃描答卷圖像的邊界定位方法,其特征在于,包括如下步驟:
[0009](I)根據(jù)掃描答卷圖像計算圖像的邊界特征點;
[0010](2)估計掃描答卷圖像的傾斜角度;
[0011](3)根據(jù)邊界特征點和傾斜角度計算掃描答卷圖像邊界對應(yīng)的直線方程;
[0012](4)根據(jù)獲取的直線方程之間的交點可以獲取掃描圖像的邊界,完成將掃描圖像從掃描背景中分割出來。
[0013]作為對本技術(shù)方案的進一步限定,所述步驟(I)包括如下步驟:
[0014](1.1)檢測底邊邊界特征點;
[0015](1.2)檢測頂邊邊界特征點;
[0016](1.3)檢測左邊邊界特征點;
[0017](1.4)檢測右邊邊界特征點。
[0018]作為對本技術(shù)方案的進一步限定,所述步驟(1.1)包括如下步驟:[0019](I)記底邊邊界特征點檢測的圖像列的位置總數(shù)為Nh,取Nh = 32,圖像的寬度表示為W,圖像高度表示為H,則圖像列的位置的步長Sh可表示為:
[0020]Sh = ff/Nh (3)
[0021](2)所有的圖像列的位置的集合表示為:
[0022]Ph = (Pi I i*Sj , i = O, I, 2,...(Nh-1) (4)
[0023](3)依次判斷每個圖像列位置上對應(yīng)的像素位置是否滿足底邊邊界特征點檢測條件,每個圖像列最多檢測一個特征點,當檢測到一個特征點時,該列的檢測停止,邊界特征點判斷位置最大到圖像的高度H的一半,并且總是從底向上的順序依次判斷;
[0024](4)按照步長檢測得到的底邊邊界特征點的總數(shù)Dh,如果(Dh/Nh)〈Rh成立,取Rh =
0.80,重新調(diào)整步長Sh為Sh’如下:
[0025]Sh,=Sh*(Dh/Nh) (5)
[0026]經(jīng)過列的步長調(diào)整后,根據(jù)公式(6)調(diào)整列位置的總數(shù)Nh為Nh’:
[0027]Nh,=W/Sh,(6)
[0028](5)輸出所有的底邊邊界特征點坐標。
[0029]作為對本技術(shù)方案的進一步限定,所述步驟(3)底邊邊界特征點的檢測條件為:
[0030](3.1)特征點對應(yīng)的像素灰度大于給定的灰度閾值Tg,灰度閾值取值為128 ;
[0031](3.2)特征點位置對應(yīng)的答卷圖像區(qū)域在Tc范圍內(nèi)大于灰度Tg的像素個數(shù)Wt滿足以下條件:
[0032]ffT/Tc ≥ Rc (I)
[0033]其中R。為比例控制參數(shù),取R。= 0.80,T。表示特征點檢測時的閾值參數(shù),典型值設(shè)置為32 ;
[0034](3.3)特征點位置對應(yīng)的背景區(qū)域在Tc范圍內(nèi)小于灰度Tg的像素個數(shù)Bt滿足以下條件:
[0035]BT/TC ≥ Rc (2)
[0036]其中Rc為比例控制參數(shù),取Rc = 0.80。
[0037]作為對本技術(shù)方案的進一步限定,所述步驟(2)包括如下步驟:
[0038](2.1)計算底邊邊界特征點對應(yīng)的傾斜角度;
[0039](2.2)計算頂邊邊界特征點對應(yīng)的傾斜角度;
[0040](2.3)計算左邊邊界特征點對應(yīng)的傾斜角度;
[0041](2.4)計算右邊邊界特征點對應(yīng)的傾斜角度;
[0042](2.5)計算掃描答卷圖像的傾斜角度。
[0043]作為對本技術(shù)方案進一步限定,所述步驟(2.1)包括如下步驟:
[0044](I)初值A(chǔ)、F、Dp設(shè)置,其中A表示傾斜角度的估計范圍,F(xiàn)表示傾斜角度檢測的精度,設(shè)置初值Dp用以描述兩個點之間的最小距離;
[0045](2)根據(jù)傾斜角度檢測精度,每隔F為一個累加器,總共有Nf個累加器,工程上采用數(shù)組實現(xiàn),每個累加器初值設(shè)置為O ;
[0046]Nf = (max (A) -min (A)) /F (9)
[0047](3)從集合Lb中任意取兩個點Pi, Pj,集合Lb表示底邊邊界特征點位置對應(yīng)的坐標集合,如果兩個點之間的距離L滿足:[0048]di;J = I P1-Pj I ≥Dp (10)
[0049]則計算兩個點所決定的直線的角度Θ.j:
【權(quán)利要求】
1.一種掃描答卷圖像的邊界定位方法,其特征在于,包括如下步驟: (1)根據(jù)掃描答卷圖像計算圖像的邊界特征點; (2)估計掃描答卷圖像的傾斜角度; (3)根據(jù)邊界特征點和傾斜角度計算掃描答卷圖像邊界對應(yīng)的直線方程; (4)根據(jù)獲取的直線方程之間的交點可以獲取掃描圖像的邊界,完成將掃描圖像從掃描背景中分割出來。
2.根據(jù)權(quán)利要求1所述的掃描答卷圖像的邊界定位方法,其特征在于,所述步驟(1)包括如下步驟: (1.D檢測底邊邊界特征點; (1.2)檢測頂邊邊界特征點; (1.3)檢測左邊邊界特征點; (1.4)檢測右邊邊界特征點。
3.根據(jù)權(quán)利要求2所述的掃描答卷圖像的邊界定位方法,其特征在于,所述步驟(1.1)包括如下步驟: (1)記底邊邊界特征點 檢測的圖像列的位置總數(shù)為Nh,取Nh= 32,圖像的寬度表示為W,圖像聞度表不為H,則圖像列的位置的步長Sh可表不為:
Sh = ff/Nh (3) (2)所有的圖像列的位置的集合表示為:
Ph = (Pi I i*Sj , i = O, 1, 2,...(Nh-1) (4) (3)依次判斷每個圖像列位置上對應(yīng)的像素位置是否滿足底邊邊界特征點檢測條件,每個圖像列最多檢測一個特征點,當檢測到一個特征點時,該列的檢測停止,邊界特征點判斷位置最大到圖像的高度H的一半,并且總是從底向上的順序依次判斷; (4)按照步長檢測得到的底邊邊界特征點的總數(shù)Dh,如果(Dh/Nh)〈Rh成立,取Rh=.0.80,重新調(diào)整步長Sh為Sh’如下:
Sh,= Sh*(Dh/Nh) (5) 經(jīng)過列的步長調(diào)整后,根據(jù)公式(6)調(diào)整列位置的總數(shù)Nh為Nh’:
Nh,= ff/S; (6) (5)輸出所有的底邊邊界特征點坐標。
4.根據(jù)權(quán)利要求3所述的掃描答卷圖像的邊界定位方法,其特征在于,所述步驟(3)底邊邊界特征點的檢測條件為: (3.1)特征點對應(yīng)的像素灰度大于給定的灰度閾值Tg,灰度閾值取值為128 ; (3.2)特征點位置對應(yīng)的答卷圖像區(qū)域在Tc范圍內(nèi)大于灰度Tg的像素個數(shù)Wt滿足以下條件:
Wt/Tc>Rc (1) 其中R。為比例控制參數(shù),取R。= 0.80,T。表示特征點檢測時的閾值參數(shù),典型值設(shè)置為32 ; (3.3)特征點位置對應(yīng)的背景區(qū)域在Tc范圍內(nèi)小于灰度Tg的像素個數(shù)Bt滿足以下條件:
BT/TC ^ Rc (2)其中Rc為比例控制參數(shù),取Rc = 0.80。
5.根據(jù)權(quán)利要求1所述的掃描答卷圖像的邊界定位方法,其特征在于,所述步驟(2)包括如下步驟: (2.1)計算底邊邊界特征點對應(yīng)的傾斜角度; (2.2)計算頂邊邊界特征點對應(yīng)的傾斜角度; (2.3)計算左邊邊界特征點對應(yīng)的傾斜角度; (2.4)計算右邊邊界特征點對應(yīng)的傾斜角度; (2.5)計算掃描答卷圖像的傾斜角度。
6.根據(jù)權(quán)利要求5所述的掃描答卷圖像的邊界定位方法,其特征在于,所述步驟(2.1)包括如下步驟: (1)初值A(chǔ)、F、Dp設(shè)置,其中A表示傾斜角度的估計范圍,F(xiàn)表示傾斜角度檢測的精度,設(shè)置初值Dp用以描述兩個點之間的最小距離; (2)根據(jù)傾斜角度檢測精度,每隔F為一個累加器,總共有Nf個累加器,工程上采用數(shù)組實現(xiàn),每個累加器初值設(shè)置為O ;
Nf = (max (A) -min (A)) /F (9) (3)從集合Lb中任意取兩個點Pi,P」,集合Lb表示底邊邊界特征點位置對應(yīng)的坐標集合,如果兩個點之間的距離du滿足:
(Ii j = P1-Pj ^ Dp (10) 則計算兩個點所決定的直線的角度Qiij:1(ZiZiL)(11)
7.根據(jù)權(quán)利要求5所述的掃描答卷圖像的邊界定位方法,其特征在于,所述步驟(2.5)包括如下步驟: (1)計算上、下和左、右邊界特征點對應(yīng)的傾斜角度之間的夾角ΘΒΤ,0LR:
8.根據(jù)權(quán)利要求1所述的掃描答卷圖像的邊界定位方法,其特征在于,所述步驟(3)包括如下步驟: (1)計算底邊特征點對應(yīng)的直線方程; (2)計算頂邊特征點對應(yīng)的直線方程; (3)計算左邊特征點對應(yīng)的直線方程; (4)計算右邊特征點對應(yīng)的直線方程。
9.根據(jù)權(quán)利要求8所述的掃描答卷圖像的邊界定位方法,其特征在于,所述步驟(1)包括如下步驟: 根據(jù)底邊特征點集合Lb和對應(yīng)的傾斜角度θ B,計算對應(yīng)直線的斜率kB如下: kB = tan ( θ B) (27) 直線的方程表示為: y = kBx+bB (28) 其中kB由公式(27)確定,bB是需要確定的參數(shù),根據(jù)最小二乘法直線擬合設(shè)計原理,bB滿足的條件為:
【文檔編號】G06K9/00GK103996022SQ201410197780
【公開日】2014年8月20日 申請日期:2014年5月12日 優(yōu)先權(quán)日:2014年5月12日
【發(fā)明者】馬磊, 劉江, 張華英 申請人:山東山大鷗瑪軟件有限公司