基于二值圖像連通域統(tǒng)計的答題卡自動評分方法
【專利摘要】本發(fā)明提供基于二值圖像連通域統(tǒng)計的答題卡自動評分方法,用戶掃描一個答題卡,檢測出定位點后,對作答區(qū)域進(jìn)行二值化,然后采用基于二值圖像連通域統(tǒng)計的答題卡自動評分方法對圖像中各選擇題的答案進(jìn)行識別并評分,然后輸出各題目的答案以及成績。本發(fā)明以填涂點相對于標(biāo)記點的位置來定位填涂點,對于答題卡掃描時的傾斜、移位、輕微褶皺不敏感;采用自適應(yīng)閾值的方法判斷填涂與否,對于不同填涂的深淺均可有效檢測,兼容單選、多選題,能有效區(qū)分擦除不凈及多選的情況。用戶不必再因為掃描時的輕微異常而重新掃描答題卡,大大減少了重復(fù)勞動。
【專利說明】基于二值圖像連通域統(tǒng)計的答題卡自動評分方法【技術(shù)領(lǐng)域】[0001]本發(fā)明一般涉及計算機(jī)模式識別與圖像處理領(lǐng)域,具體涉及基于二值圖像連通域 統(tǒng)計的答題卡自動評分方法。【背景技術(shù)】[0002]隨著信息技術(shù)的發(fā)展,計算機(jī)處理的數(shù)據(jù)量越來越大,在很多領(lǐng)域里,亟需解決 海量數(shù)據(jù)的采集、識別和錄入的問題。目前,在高考、成人高考、全國大學(xué)英語等級考試等大 型考試已經(jīng)使用OMR (光學(xué)標(biāo)記閱讀機(jī))解決該問題。雖然OMR技術(shù)解決了一些答題卡數(shù) 據(jù)錄入的問題,但是由于其自身技術(shù)是基于光電識別技術(shù)的,存在許多目前難以解決的問 題:(1)設(shè)備專用:光電識別機(jī)只能在審閱客觀題中使用,主觀題仍需使用掃描儀掃描,價 格昂貴;(2)答題卡格式固定:受限于光電頭安裝位置和排列密度相對固定,對于不同格式 的答題卡調(diào)整難度很大,甚至無法滿足要求;(3)答題卡制造成本高:0MR答題卡必須為含 鉛銅版紙進(jìn)行彩色印刷且對答題卡裁切精度有嚴(yán)格要求,經(jīng)濟(jì)成本、環(huán)境成本高,對于大多 數(shù)中小學(xué)無力承擔(dān)該費用;(4)糾錯流程復(fù)雜:0MR技術(shù)中,若在識別的過程中發(fā)生異常,必 須停機(jī),人工分揀出出錯答題卡,逐張人工重新填涂,才能重新開機(jī)識別,大大影響閱卷效 率。(5)圖像不能保存待查:不能保存識別過的答題卡圖像,判題透明性差,若要查對必須 人工從紙質(zhì)答題卡中重新分揀出來。[0003]利用圖像處理技術(shù)對經(jīng)過掃描的答題卡的數(shù)據(jù)進(jìn)行識別和錄入是一項新技術(shù)。它 除了可以克服上述OMR技術(shù)存在的缺陷外,還具有設(shè)備、紙張成本低,識別率及速度可隨計 算機(jī)軟、硬件發(fā)展不斷優(yōu)化、提升,改卷結(jié)果可直接顯示在掃描圖像上,判卷透明性高,校對 方便等特點。該技術(shù)將在計算機(jī)閱卷、電子政務(wù)、社會調(diào)查數(shù)據(jù)采集、生產(chǎn)和流通領(lǐng)域的過 程管理及其它領(lǐng)域中顯示出其良好的應(yīng)用前景。
【發(fā)明內(nèi)容】
[0004]本發(fā)明針對答題卡識別技術(shù)的不足,提供了基于二值圖像連通域統(tǒng)計的答題卡自 動評分方法。本發(fā)明的目的在于使用計算機(jī)圖像處理技術(shù)解決高準(zhǔn)確率的答題卡自動識別 問題,克服現(xiàn)有的OMR技術(shù)的缺陷,提供一個成本低、使用簡單的、可靠的答題卡識別方案, 具體技術(shù)方案如下。[0005]基于二值圖像連通域統(tǒng)計的答題卡自動評分方法,包括以下步驟:[0006](a)從本地磁盤讀入一個掃描得到的答題卡圖像文件;[0007](b)對答題卡圖像進(jìn)行傾斜檢測及校正;[0008](C)對步驟(b)中校正后的圖像進(jìn)行校準(zhǔn)點檢測及定位;[0009](d)根據(jù)步驟(C)中得到的校準(zhǔn)點位置以及答題卡描述文件,計算每一個填涂點 在本張圖像中的絕對位置;[0010](e)根據(jù)步驟(d)得到的每個填涂點進(jìn)行識別,判斷其是否填涂。[0011]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中,步驟(b)包括以下步驟:[0012](b-1)將掃描得到的圖像轉(zhuǎn)化為灰度圖像;[0013](b-2)讀取答題卡描述文件中校準(zhǔn)點的類型以及掃描圖像的分辨率,生成矩形的 結(jié)構(gòu)元素并使用它對掃描圖像進(jìn)行灰度級形態(tài)學(xué)閉操作;[0014](b-3)對步驟(b-2)得到的圖像進(jìn)行二值化,二值化閾值為100,即灰度值大于100 的像素點設(shè)為I,否則設(shè)為O;[0015](b-4)計算二值圖像中各個連通域的位置并判斷數(shù)量是否與答題卡描述文件中的 校準(zhǔn)點數(shù)量一致,如不一致則利用該類型校準(zhǔn)點的寬高比以及面積去除干擾塊;[0016](b-5)分別計算圖像上方、下方校準(zhǔn)點構(gòu)成直線的斜率,若上下斜率差值過大,則 認(rèn)為發(fā)生褶皺并提示,否則取兩者均值作為傾斜度數(shù),對圖像進(jìn)行傾斜校正。[0017]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中,步驟(C)包括以下步 驟:[0018](c-1)讀取答題卡描述文件中關(guān)于水平方向校準(zhǔn)點與豎直方向校準(zhǔn)點的區(qū)域描 述,并根據(jù)相對于校準(zhǔn)點的位置裁剪出整個水平方向以及豎直方向區(qū)域;[0019](c-2)分別讀取答題卡描述文件中水平方向、豎直方向校準(zhǔn)點的類型以及掃描圖 像的分辨率,生成相對應(yīng)的矩形結(jié)構(gòu)元素并分別對水平校準(zhǔn)點區(qū)域、豎直校準(zhǔn)點區(qū)域進(jìn)行 灰度級形態(tài)學(xué)閉操作;[0020](c-3)對圖像進(jìn)行二值化操作,判斷二值圖像中連通域數(shù)量是否與答題卡描述文 件中的校準(zhǔn)點數(shù)量一致,如不一致則利用該類型校準(zhǔn)點的寬高比以及面積去除干擾連通 域。[0021]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中,步驟(d)使用步驟(C) 得到的各個連通域的最小外接矩形,計算校準(zhǔn)點邊界,并根據(jù)答題卡描述文件,計算出各題 中各個選項的在本圖像中的絕對位置。[0022]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中,計算邊界時加入了邊 界緩沖區(qū),其上、下、左、右邊界計算方法為:top=y_hXedge_rate, buttom=y+hX (l+edge_ rate), left=x~wX edge_rate, right=x+wX (l+edge_rate),其中 x、y、w、h、edge_rate 分別 表示連通域最小外接矩形的左上角橫、縱坐標(biāo),矩形的寬、高以及邊緣緩沖率,邊緣緩沖率 設(shè)為0.3。[0023]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中,步驟(d)包括以下步 驟:[0024](e-1)根據(jù)步驟(d)得到的填涂點位置,將同一題的所有填涂點區(qū)域提取出來。[0025](e-2)對每一題區(qū)域計算自適應(yīng)閾值并進(jìn)行二值化[0026](e-3)根據(jù)步驟(C)中得到的校準(zhǔn)點的大小計算填涂面積閾值:[0027]threshold=s X 0.15。[0028](e-4)對每個填涂點區(qū)域,若二值圖像值為I的區(qū)域大于填涂面積閾值,則認(rèn)為填 涂,否則認(rèn)為沒有填涂。[0029]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中,步驟(e-2)中使用最大 類間方差法計算自適應(yīng)二值化閾值,類間方差法計算方法如下U1)2,其中g(shù) 為類間方差,ω。CO1分別為灰度值小于、大于閾值T的像素點占整幅圖像的比例,μ O, U1分別為灰度值小于、大于閾值T的像素點的平均灰度;最大類間方差法閾值計算方法為分 別計算T從O到255對應(yīng)的類間方差法g的大小,取g最大的時候?qū)?yīng)的T即為所求。[0030]上述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法中,步驟(e-2)中,把自適 應(yīng)閾值計算結(jié)果用于區(qū)分未作答與掃描儀噪聲,對于自適應(yīng)二值化閾值大于230的情況, 認(rèn)為該題未作答。[0031]本發(fā)明采用常用的掃描儀作為輸入設(shè)備;識別答題卡中的校準(zhǔn)點是識別答題卡的 關(guān)鍵操作,本發(fā)明通過灰度級形態(tài)學(xué)閉操作的方式去除非校準(zhǔn)點外的其他因素的影響;通 過答題卡中的校準(zhǔn)點的位置,對掃描圖像進(jìn)行精確的傾斜校正,并計算出各題選項在這張 答題卡中的絕對位置;通過一定的數(shù)據(jù)格式將答題卡各題的選項的上、下、左、右邊界記錄 下來,達(dá)到快速提取各題選項區(qū)域的目的;將同一道題的區(qū)域提取出來,計算出自適應(yīng)二值 化閾值并對該區(qū)域二值化,然后根據(jù)連通域面積對該題每個選項逐一識別是否填涂,最后 輸出結(jié)果。[0032]與現(xiàn)有技術(shù)相比,本發(fā)明具有如下優(yōu)點和技術(shù)效果:[0033]相對于OMR (光學(xué)標(biāo)記閱讀機(jī))技術(shù)本發(fā)明克服了設(shè)備專用、答題卡格式固定、答 題卡制造成本高、糾錯流程復(fù)雜、圖像不能保存待查等缺點,并具有識別率及速度可隨計算 機(jī)軟、硬件發(fā)展不斷優(yōu)化、提升,改卷結(jié)果可直接顯示在掃描圖像上,判卷透明性高,校對方 便等特點。相對于其他基于圖像處理的技術(shù),本發(fā)明具有對答題卡掃描時的傾斜、移位、輕 微褶皺不敏感的優(yōu)點,用戶不必再因為掃描時的輕微異常而重新掃描答題卡,大大減少了 重復(fù)勞動。本發(fā)明采用自適應(yīng)閾值的方法判斷填涂與否,對于不同的填涂深淺均可有效檢 測,兼容單選、多選題,并能有效區(qū)分擦除不凈、未作答及多選的情況;對掃描設(shè)備的寬容度 高,能適應(yīng)不同分辨率的掃描以及不同掃描儀帶來的噪聲。用戶不用再擔(dān)心因為掃描儀更 換、掃描分辨率改變而更換新的識別技術(shù)?!緦@綀D】
【附圖說明】[0034]圖1為實施方式中基于二值圖像連通域統(tǒng)計的答題卡自動評分方法的流程圖。 【具體實施方式】[0035]以下結(jié)合附圖對本發(fā)明的實施方式作進(jìn)一步說明,但本發(fā)明的實施不限于此。[0036]如圖1,基于二值圖像連通域統(tǒng)計的答題卡自動評分方法的主要流程包括以下步驟:[0037](a)從本地磁盤讀入一個掃描得到的答題卡圖像文件;[0038](b)對答題卡圖像進(jìn)行傾斜檢測及精確校正。[0039](C)對步驟(b)中校正后的圖像進(jìn)行校準(zhǔn)點檢測及定位;[0040](d)根據(jù)步驟(C)中得到的校準(zhǔn)點位置以及答題卡描述文件,計算每一個填涂點 在本張圖像中的絕對位置;[0041](e)根據(jù)步驟(d)得到的每個填涂點進(jìn)行識別,判斷其是否填涂。[0042]步驟(a)允許用戶通過文件選擇窗口從本地硬盤選擇多個圖像文件或一個文件 夾作為答題卡圖像數(shù)據(jù)源,圖像文件要求是jpg格式文件。[0043]步驟(b)灰度級形態(tài)學(xué)閉操作去除與校準(zhǔn)點無關(guān)的因素的影響,灰度級形態(tài)學(xué)閉 操作是圖像處理的常用操作,其主要原理是:將圖像先進(jìn)行灰度級腐蝕操作再進(jìn)行灰度級膨脹操作?;叶燃壐g操作將結(jié)構(gòu)元素中心對應(yīng)的圖像像素點的灰度值設(shè)為結(jié)構(gòu)元素覆蓋的圖像區(qū)域中所有像素中最小的灰度值,而灰度級膨脹操作將結(jié)構(gòu)元素中心對應(yīng)的圖像像素點的灰度值設(shè)為結(jié)構(gòu)元素覆蓋的圖像區(qū)域中所有像素中最大的灰度值。[0044]步驟(b)包括以下步驟:[0045](b-Ι)將掃描得到的圖像轉(zhuǎn)化為灰度圖像;[0046](b-2)讀取答題卡描述文件中校準(zhǔn)點的類型以及掃描圖像的分辨率,生成矩形的結(jié)構(gòu)素并使用它對掃描圖像進(jìn)行灰度級形態(tài)學(xué)閉操作;[0047](b-3)對步驟(b-2)得到的圖像進(jìn)行二值化;[0048](b-4)計算二值圖像中各個連通域的位置并判斷數(shù)量是否與答題卡描述文件中的校準(zhǔn)點數(shù)量一致,如不一致則利用該類型校準(zhǔn)點的寬高比以及面積去除干擾塊;[0049](b-5)分別計算圖像上方、下方校準(zhǔn)點構(gòu)成直線的斜率,若上下斜率差值過大,則認(rèn)為發(fā)生褶皺并提示,否則取兩者均值作為傾斜度數(shù),對圖像進(jìn)行傾斜校正;[0050]步驟(c)灰度級形態(tài)學(xué)閉操作去除與校準(zhǔn)點無關(guān)的因素的影響,其原理與步驟(b)中的一致。[0051]步驟(C)包括以下步驟:[0052](c-Ι)讀取答題卡描述文件中關(guān)于水平方向校準(zhǔn)點與豎直方向校準(zhǔn)點的區(qū)域描述,并根據(jù)相對于校準(zhǔn)點的位置裁剪出整個水平方向以及豎直方向區(qū)域;[0053](c-2)分別讀取答題卡描述文件中水平方向、豎直方向校準(zhǔn)點的類型以及掃描圖像的分辨率,生成相對應(yīng)的矩形結(jié)構(gòu)元素并分別對水平校準(zhǔn)點區(qū)域、豎直校準(zhǔn)點區(qū)域進(jìn)行灰度級形態(tài)學(xué)閉操作;[0054](c-3)對圖像進(jìn)行二值化操作,判斷二值圖像中連通域數(shù)量是否與答題卡描述文件中的校準(zhǔn)點數(shù)量一致,如不一致則利用該類型校準(zhǔn)點的寬高比以及面積去除干擾連通域;[0055]步驟(d)將步驟(C)所識別到的校準(zhǔn)點用特定數(shù)據(jù)格式將校準(zhǔn)點的邊界存儲下來。特定數(shù)據(jù)格式具體如表1所示。這里是通過記錄校準(zhǔn)點在答題卡圖像數(shù)據(jù)中的位置, 用以快速定位答題卡中各道題目的選項對應(yīng)的位置。[0056]表1保存校準(zhǔn)點邊界的數(shù)據(jù)格式[0057]
【權(quán)利要求】
1.基于二值圖像連通域統(tǒng)計的答題卡自動評分方法,其特征在于,包括以下步驟:(a)從本地磁盤讀入一個掃描得到的答題卡圖像文件;(b)對答題卡圖像進(jìn)行傾斜檢測及校正;(C)對步驟(b)中校正后的圖像中的校準(zhǔn)點進(jìn)行檢測及定位;(d)根據(jù)步驟(C)中得到的校準(zhǔn)點位置以及答題卡描述文件,計算每一個填涂點在本張圖像中的絕對位置;(e)根據(jù)步驟(d)得到的每個填涂點進(jìn)行識別,判斷其是否填涂。
2.根據(jù)權(quán)利要求1所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法,其特征在于,步驟(b)包括以下步驟:(b-Ι)將掃描得到的圖像轉(zhuǎn)化為灰度圖像;(b-2)讀取答題卡描述文件中校準(zhǔn)點的類型以及掃描圖像的分辨率,生成矩形的結(jié)構(gòu)元素并使用該結(jié)構(gòu)元素對掃描圖像進(jìn)行灰度級形態(tài)學(xué)閉操作;(b-3)對步驟(b-2)最后得到的圖像進(jìn)行二值化,二值化閾值為100,即灰度值大于100 的像素點設(shè)為I,否則設(shè)為O;(b-4)計算二值圖像中各個連通域的位置并判斷數(shù)量是否與答題卡描述文件中的校準(zhǔn)點數(shù)量一致,如不一致則利用該類型校準(zhǔn)點的寬高比以及面積去除干擾塊;(b-5)分別計算圖像上方、下方校準(zhǔn)點構(gòu)成直線的斜率,若該兩個斜率的差值大于0.2,則認(rèn)為發(fā)生褶皺并提示,否則取兩者均值作為傾斜度數(shù),對圖像進(jìn)行傾斜校正。
3.根據(jù)權(quán)利要求1所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法,其特征在于步驟(C)中,包括以下步驟:(c-1)讀取答題卡描述文件中關(guān)于水平方向校準(zhǔn)點與豎直方向校準(zhǔn)點的區(qū)域描述,并根據(jù)相對于校準(zhǔn)點的位置裁剪出整個水平方向以及豎直方向的校準(zhǔn)點組區(qū)域;(c-2)分別讀取答題卡描述文件中水平方向、豎直方向校準(zhǔn)點的類型以及掃描圖像的分辨率,生成相對應(yīng)的矩形結(jié)構(gòu)元素并分別對水平校準(zhǔn)點區(qū)域、豎直校準(zhǔn)點區(qū)域進(jìn)行灰度級形態(tài)學(xué)閉操作;(c-3)對圖像進(jìn)行二值化操作,其中,二值化閾值為100,并判斷二值圖像中連通域數(shù)量是否與答題卡描述文件中的校準(zhǔn)點數(shù)量一致,如不一致則利用該類型校準(zhǔn)點的寬高比以及面積去除干擾連通域。
4.根據(jù)權(quán)利要求3所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法,其特征在于:步驟⑷中,使用步驟(C)最后得到的各個連通域的最小外接矩形,計算校準(zhǔn)點邊界,并根據(jù)答題卡描述文件,計算出各題中各個選項的在本圖像中的絕對位置。
5.根據(jù)權(quán)利要求4所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法,其特征在于:計算校準(zhǔn)點邊界時考慮到填涂偏差,加入了邊界緩沖區(qū),其上top、下buttom、左 left、右 right 邊界計算方法為:top=y_hX edge—rate,buttom=y+hX (1+edge—rate), left=x_wXedge—rate,right=x+wX (1+edge—rate),其中 x、y、w、h、edge—rate 分別表不連通域最小外接 矩形的左上角橫、縱坐標(biāo),矩形的寬、高以及邊緣緩沖率,邊緣緩沖率設(shè)為0.3。
6.根據(jù)權(quán)利要求1所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法,其特征在于步驟⑷中包括以下步驟:(e-1)根據(jù)步驟(d)得到的填涂點位置,將同一題的所有填涂點區(qū)域提取出來;(e-2)對每一題區(qū)域計算自適應(yīng)閾值并進(jìn)行二值化;(e-3)根據(jù)步驟(C)中得到的校準(zhǔn)點的大小s計算填涂面積閾值threshold: threshold=sX0.15 ;(e-4)對每個填涂點區(qū)域,若二值圖像值為I的區(qū)域大于填涂面積閾值,則認(rèn)為填涂, 否則認(rèn)為沒有填涂。
7.根據(jù)權(quán)利要求6所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法,其特征在于:使用最大類間方差法計算自適應(yīng)二值化閾值,類間方差法計算方法如下: g= ω0ω j ( μ 0- μ J2,其中g(shù)為類間方差,ω0> Q1分別為灰度值小于、大于閾值T的像素點占整幅圖像的比例,μ ο、μ i分別為灰度值小于、大于閾值T的像素點的平均灰度;最大類間方差法閾值計算方法為分別計算T從O到255對應(yīng)的類間方差法g的大小,取g最大的時候?qū)?yīng)的T即為所求。
8.根據(jù)權(quán)利要求7所述基于二值圖像連通域統(tǒng)計的答題卡自動評分方法,其特征在于:考慮到掃描儀產(chǎn)生的噪聲,對于自適應(yīng)二值化閾值大于230的情況,認(rèn)為該題未作答 , 有效區(qū)分未作答與掃描儀噪聲。
【文檔編號】G06K9/32GK103559490SQ201310473334
【公開日】2014年2月5日 申請日期:2013年10月11日 優(yōu)先權(quán)日:2013年10月11日
【發(fā)明者】黃翰, 梁椅輝 申請人:華南理工大學(xué)