一種成績錄入系統(tǒng)及圖像處理的方法
【專利摘要】本發(fā)明公開了一種成績錄入系統(tǒng)及圖像處理的方法,成績錄入系統(tǒng)包括采集單元、成績錄入客戶端、防火墻、路由器、中心服務(wù)器和用戶終端,行圖像處理的方法包括進(jìn)行手寫體數(shù)字識別分類器的訓(xùn)練、采集原始彩色圖像、對圖像進(jìn)行處理、識別、分析,顯示處理結(jié)果的步驟;其有益效果是:是使成績登統(tǒng)操作變的簡單化、高效化、智能化,并且能夠?yàn)榻處熀蛯W(xué)校領(lǐng)導(dǎo)提供詳細(xì)、準(zhǔn)確、科學(xué)地考試結(jié)果分析;本發(fā)明適用于教育領(lǐng)域中的任何考試。
【專利說明】
一種成績錄入系統(tǒng)及圖像處理的方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于數(shù)字教育技術(shù)領(lǐng)域,涉及一種成績錄入系統(tǒng)及圖像處理的方法。
【背景技術(shù)】
[0002] 隨著計(jì)算機(jī)技術(shù)、大數(shù)據(jù)分析和人工智能技術(shù)的高速發(fā)展,教育教學(xué)工作已不再 是過去的傳統(tǒng)方式,而是追求更為高效、科學(xué)、前沿的教育教學(xué)理念。當(dāng)前為了保證公平性、 客觀性,無論是要進(jìn)一步深造學(xué)習(xí),還是要考公務(wù)員或是事業(yè)單位等,都需要通過考試對人 員進(jìn)行選拔。因此頻繁的進(jìn)行考試練習(xí)以及階段性考試檢測很長時(shí)間內(nèi)都是存在的。而考 試數(shù)據(jù)作為體現(xiàn)學(xué)生學(xué)習(xí)情況的重要依據(jù),可以指引學(xué)生后續(xù)的學(xué)習(xí)方向,同時(shí)也能為教 師改進(jìn)教學(xué)提供幫助。因此對于考試數(shù)據(jù)的采集和統(tǒng)計(jì)分析意義重大。
[0003] 目前,很多研究機(jī)構(gòu)和企業(yè)為了能夠方便的采集到考試數(shù)據(jù),提出一種在線考試 的形式。例如中國專利公開了一種《考試系統(tǒng)》(公開號:CN 103617584 A),該系統(tǒng)包括系統(tǒng) 管理模塊、考試管理模塊、個(gè)人考試模塊、將空管理模塊和統(tǒng)計(jì)分析模塊。上述專利雖然可 以很便捷的獲取到考試數(shù)據(jù),并做了知識點(diǎn)關(guān)聯(lián),給出了詳細(xì)的統(tǒng)計(jì)分析數(shù)據(jù)。但是這種系 統(tǒng)在當(dāng)前K12教育中是很難推廣的??紤]到經(jīng)濟(jì)條件限制,舉辦在線考試工作繁瑣的問題, 全校統(tǒng)一考試實(shí)現(xiàn)困難的制約等問題,中小學(xué)的每次考試都要求在線是不可能實(shí)現(xiàn)的。因 此就目前情況看,很長時(shí)間內(nèi),學(xué)校仍然會以紙質(zhì)試卷形式進(jìn)行考試。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明所要解決的技術(shù)問題是提供一種在不改變當(dāng)前教師和學(xué)生考試習(xí)慣的基 礎(chǔ)上,使成績登統(tǒng)操作簡單化、高效化和智能化的成績錄入系統(tǒng)及圖像處理的方法。
[0005] 為實(shí)現(xiàn)上述技術(shù)方案所采用的技術(shù)方案是:一種成績錄入系統(tǒng),其包括采集單元、 成績錄入客戶端、防火墻、路由器、中心服務(wù)器和用戶終端; 所述采集單元的輸入端獲取試卷圖像;所述采集單元的輸出端接所述成績錄入客戶端 的相應(yīng)輸入端;所述成績錄入客戶端與互聯(lián)網(wǎng)相連接; 所述中心服務(wù)器經(jīng)路由器、防火墻與互聯(lián)網(wǎng)相連接; 所述用戶終端與互聯(lián)網(wǎng)相連接。
[0006] 所述采集單元為掃描儀、高拍儀、照相機(jī)、攝像機(jī)或手機(jī)攝像頭。
[0007] 所述成績錄入客戶端為計(jì)算機(jī)、平板電腦或手機(jī)。
[0008] 所述中心服務(wù)器為計(jì)算機(jī);所述用戶終端為計(jì)算機(jī)。
[0009] 利用所述成績錄入系統(tǒng)進(jìn)行圖像處理的方法,其包括如下步驟: (1) 進(jìn)行手寫體數(shù)字識別分類器的訓(xùn)練:通過手寫體數(shù)字樣本的采集和篩選,獲得有效 的手寫體數(shù)字樣本,利用支持向量機(jī)的方法,訓(xùn)練并生成識別手寫體數(shù)字的svm分類器; (2) 利用所述采集單元采集帶有卷頭的已評分紙質(zhì)試卷原始彩色圖像; (3) 成績錄入客戶端獲取帶有卷頭的已評分紙質(zhì)試卷原始彩色圖像;成績錄入客戶端 通過灰度化處理方法將所述帶有卷頭的已評分紙質(zhì)試卷原始彩色圖像轉(zhuǎn)化為灰度圖像; (4) 成績錄入客戶端將所述灰度圖像轉(zhuǎn)化為二值圖像; (5) 成績錄入客戶端利用高斯低通濾波法對所述二值圖像進(jìn)行第一次去噪,得到一次 去噪二值圖像; (6) 成績錄入客戶端將所述一次去噪二值圖像通過hough變換找到基準(zhǔn)線,并根據(jù)基準(zhǔn) 線計(jì)算傾斜角度,最后對一次去噪二值圖像進(jìn)行傾斜校正,得到校正后一次去噪二值圖像; (7) 成績錄入客戶端對校正后一次去噪二值圖像進(jìn)行連通域標(biāo)記,找到所有的連通區(qū) 域,并根據(jù)連通區(qū)域面積大小的信息對連通區(qū)域進(jìn)行篩選,將面積太小的干擾項(xiàng)排除,得到 篩選后連通區(qū)域; (8) 成績錄入客戶端利用位置信息將所述篩選后連通區(qū)域進(jìn)行試卷卷頭的粗定位,得 到粗定位后試卷卷頭圖像; (9) 成績錄入客戶端對粗定位后試卷卷頭圖像分別進(jìn)行水平方向、豎直方向投影,查看 是否符合卷頭表格特征;將符合卷頭表格特征的部分確定為卷頭的精確位置; (10) 成績錄入客戶端根據(jù)卷頭的精確位置對校正后一次去噪二值圖像進(jìn)行裁剪,提取 出精確卷頭圖像; (11) 成績錄入客戶端對精確卷頭圖像分別進(jìn)行水平方向、豎直方向投影,計(jì)算出表格 的坐標(biāo)位置; (12) 成績錄入客戶端對圖像進(jìn)行垂直的分割,獲得小題分?jǐn)?shù)表格圖像; (13) 成績錄入客戶端對小題分?jǐn)?shù)表格圖像進(jìn)行水平方向的分割,獲得小題分?jǐn)?shù)的每一 位數(shù)字的圖像; (14) 根據(jù)從中心服務(wù)器獲得的試卷結(jié)構(gòu)信息,成績錄入客戶端對分割結(jié)果進(jìn)行校驗(yàn), 驗(yàn)證圖像分割是否準(zhǔn)確無誤; (15) 成績錄入客戶端利用高斯低通濾波方法對每個(gè)手寫體數(shù)字圖像進(jìn)行去噪,得到去 噪后手寫體數(shù)字圖像; (16) 成績錄入客戶端通過形態(tài)學(xué)的膨脹方法對噪后手寫體數(shù)字圖像進(jìn)行圖像增強(qiáng),獲 得增強(qiáng)型手寫體數(shù)字圖像; (17) 通過向內(nèi)縮進(jìn)和形態(tài)學(xué)重建的方法,成績錄入客戶端對增強(qiáng)型手寫體數(shù)字圖像進(jìn) 行去除邊框處理; (18) 成績錄入客戶端將去除邊框的增強(qiáng)型手寫體數(shù)字圖像通過svm分類器進(jìn)行數(shù)字識 另IJ,最終得到每道題目的分?jǐn)?shù)數(shù)據(jù)信息,并將所述分?jǐn)?shù)數(shù)據(jù)信息傳輸給所述中心服務(wù)器; (19) 所述中心服務(wù)器對所述分?jǐn)?shù)數(shù)據(jù)信息進(jìn)行數(shù)據(jù)處理,得到分析處理結(jié)果; (20) 所述用戶終端通過互聯(lián)網(wǎng)從所述中心服務(wù)器獲取每道題目的分?jǐn)?shù)數(shù)據(jù)信息和分 析處理結(jié)果,并通過用戶終端顯示器顯示所述每道題目的分?jǐn)?shù)數(shù)據(jù)信息和分析處理結(jié)果。 [00?0]上述圖像處理方法,利用Highcharts將所述分析處理結(jié)果以表格、直方圖、曲線圖 或文字描述的形式展示給用戶。
[0011]所述分?jǐn)?shù)數(shù)據(jù)信息的數(shù)據(jù)處理包括平均分統(tǒng)計(jì)、試題難度預(yù)測曲線及試題難度實(shí) 測曲線和考試診斷報(bào)告; 所述平均分統(tǒng)計(jì)是以班級為單位,通過對所述班級中每位學(xué)生得分求和,然后除以總 人數(shù),來獲得該班級的平均分,表達(dá)式為:
;其中,T為該班答題人數(shù),馬:為第i個(gè)學(xué)生的成績。
[0012] 所述試題難度預(yù)測曲線及試題難度實(shí)測曲線生成方法如下: 計(jì)算試題難度值的公式為:其中P為試題正答率,R為該試題做對 的人數(shù),T為參加答題班級人數(shù);
以題號為橫坐標(biāo),試題難度值為縱坐標(biāo),在坐標(biāo)中標(biāo)出相應(yīng)的坐標(biāo)點(diǎn),并根據(jù)題號先后 用平滑曲線順次連接坐標(biāo)點(diǎn),即獲得試題難度預(yù)測曲線。
[0013] 成績錄入完成后,每道試題的真實(shí)正答率為RP,計(jì)算出每道試題真實(shí)難度值RV,表 達(dá)式為RV = :[ -RP;以題號為橫坐標(biāo),試題真實(shí)難度值為縱坐標(biāo),在坐標(biāo)中標(biāo)出相應(yīng)的 坐標(biāo)點(diǎn),并根據(jù)題號先后用平滑曲線順次連接坐標(biāo)點(diǎn),即獲得試題難度實(shí)測曲線。
[0014]所述考試診斷報(bào)告包括對試卷的診斷、失分率診斷、每位學(xué)生知識掌握程度的診 斷、學(xué)生能力點(diǎn)診斷; a、 對試卷的診斷包括用于區(qū)分各個(gè)層次水平學(xué)生的試題區(qū)分度、試卷難度、知識點(diǎn)的 搭配和能力點(diǎn)的側(cè)重; 試題區(qū)分度指試題對考生實(shí)際水平的區(qū)分程度;試題區(qū)分度的計(jì)算公式為 D=PH-PL 其中D為試題區(qū)分度,PH、PL分別為試題高分組和低分組考生的正答率,高分組正答 率公式為:
,其中RH高分組做對的人數(shù),TH為高分組人數(shù);低分組正答率公式為:
,其中RL低分組做對的人數(shù),TL為低分組人數(shù); 所述試卷難度通過試題平均難度系數(shù)進(jìn)行衡量;所述平均難度系數(shù)為所有試題難度值 的實(shí)測平均值; 平均難度系數(shù)A的公式為:
;其中袴為第i道題目的難度值,q為試卷中試題的 總數(shù); 知識點(diǎn)搭配是列出每個(gè)知識點(diǎn)的分布比例,查看知識點(diǎn)的分布是比較平均還是有所側(cè) 重;分布比例是根據(jù)每個(gè)知識所占的分?jǐn)?shù)除以試卷總分來獲得,分布比例公式為:
^其中為第k個(gè)知識點(diǎn)所占的分?jǐn)?shù);η為知識點(diǎn)的個(gè)數(shù),丨為第i個(gè)知識 點(diǎn)所占分?jǐn)?shù); 能力點(diǎn)搭配是列出每個(gè)能力點(diǎn)的分布比例,查看能力點(diǎn)的分布是比較平均還是有所側(cè) 重;能力點(diǎn)分布比例計(jì)算公式與知識點(diǎn)比例分布公式類似,即用每個(gè)能力點(diǎn)所占的分?jǐn)?shù)除 以試卷總分?jǐn)?shù);分布比例公式為
;其中爲(wèi)為第k個(gè)能力點(diǎn)所占的分?jǐn)?shù);m 為能力點(diǎn)的個(gè)數(shù),義民為第i個(gè)能力點(diǎn)所占分?jǐn)?shù); b、 失分率診斷的目的是統(tǒng)計(jì)出整個(gè)班級失分率比較高的題目,并建議教師重點(diǎn)講解此 類題目的內(nèi)容;其中失分率超過40%的題目定義為失分率比較高的試題,失分率公式為
,其中L為該試題沒有獲得滿分的人數(shù),T為該班答題人數(shù); c、 學(xué)生知識掌握程度的診斷 每道題目都有相對應(yīng)的知識點(diǎn),根據(jù)學(xué)生每道題目得分情況即可以了解到學(xué)生對知識 點(diǎn)的掌握程度;學(xué)生知識掌握程度的診斷是統(tǒng)計(jì)出每個(gè)知識點(diǎn)的得分率;其中知識點(diǎn)得分
,其中?^為該班第i名同學(xué)的本知識點(diǎn)所獲得的分?jǐn)?shù),KF為此知 識點(diǎn)在試卷中所占的總分?jǐn)?shù);T為該班答題人數(shù); d、 學(xué)生能力點(diǎn)診斷 每道題目都有相對應(yīng)的能力點(diǎn),根據(jù)學(xué)生每道題目得分情況即可以了解到學(xué)生對能力 點(diǎn)的掌握程度;學(xué)生各個(gè)能力掌握程度的診斷是統(tǒng)計(jì)出每個(gè)能力點(diǎn)的得分率;計(jì)算能力點(diǎn) 得分率公式為
;AGi為該班第i名同學(xué)的本能力點(diǎn)所獲得的分?jǐn)?shù),AF為此能 力點(diǎn)在試卷中所占的總分?jǐn)?shù);T為該班答題人數(shù)。
[0015] 本發(fā)明的有益效果是:是使成績登統(tǒng)操作變的簡單化、高效化、智能化,并且能夠 為教師和學(xué)校領(lǐng)導(dǎo)提供詳細(xì)、準(zhǔn)確、科學(xué)地考試結(jié)果分析;本發(fā)明適用于教育領(lǐng)域中的任何 考試。
【附圖說明】
[0016] 圖1為本發(fā)明成績錄入系統(tǒng)原理框圖。
[0017] 圖2為成績錄入客戶端運(yùn)行效果圖截圖。
[0018] 圖3為圖像處理算法流程圖。
[0019]圖4為已登統(tǒng)試卷成績列表圖。
[0020]圖5為平均分柱狀圖。
[0021]圖6為試題難度預(yù)測及實(shí)測曲線圖。
[0022] 圖7為試卷診斷圖。
[0023] 圖8為失分率診斷圖。
[0024]圖9為學(xué)生知識掌握程度診斷圖。
[0025]圖10為學(xué)生能力掌握程度診斷圖。
【具體實(shí)施方式】
[0026] 下面結(jié)合圖1-10及實(shí)施例對本發(fā)明做具體說明。
[0027] 為了能夠簡單、高效、智能的收集每次考試數(shù)據(jù),本發(fā)明提出了一種基于數(shù)字圖像 處理的成績錄入系統(tǒng)。該系統(tǒng)將紙質(zhì)試卷信息自動(dòng)的錄入到系統(tǒng)中,并對考試數(shù)據(jù)信息進(jìn) 行了詳細(xì)的統(tǒng)計(jì)和分析,能夠快速地、便捷地、科學(xué)地幫助教師分析考試結(jié)果。
[0028]為實(shí)現(xiàn)上述目的,本發(fā)明所采用的技術(shù)方案如下: 圖像采集設(shè)備與成績錄入客戶端進(jìn)行連接(例如,手機(jī)中成績錄入客戶端和圖像采集 設(shè)備為一體除外),使成績錄入客戶端程序能夠獲取到圖像采集設(shè)備的信息,并通過成績錄 入客戶端對圖像采集設(shè)備進(jìn)行控制,將紙質(zhì)試卷采集成為試卷圖像。
[0029]成績錄入客戶端中圖像處理模塊對試卷圖像首先進(jìn)行圖像處理,通過圖像二值 化,形態(tài)學(xué)處理、連通域分析、試卷填分區(qū)域粗定位、試卷填分區(qū)域精確定位、圖像剪切、填 分區(qū)域圖像傾斜校正等步驟提取出試卷填分區(qū)域表格圖像,通過對填分表格圖像進(jìn)行投 影,根據(jù)投影信息裁剪出每道題目的分?jǐn)?shù)圖像。然后成績錄入客戶端的圖像識別模塊識別 出相應(yīng)題目的分?jǐn)?shù),并在客戶端界面上顯示識別結(jié)果。最后成績錄入客戶端通過Web Service技術(shù)將識別正確的分?jǐn)?shù)上傳到中心服務(wù)器。
[0030]成績統(tǒng)計(jì)分析端從中心服務(wù)器獲取數(shù)據(jù),系統(tǒng)通過計(jì)算統(tǒng)計(jì),將分析結(jié)果以表格、 直方圖、曲線圖和文字描述等形式展示給用戶。主要內(nèi)容包括:平均分的統(tǒng)計(jì),試題難度預(yù) 測與實(shí)測曲線,考試診斷報(bào)告。其中診斷報(bào)告包括對試卷的診斷、失分率診斷、每位學(xué)生知 識掌握程度的診斷、學(xué)生能力點(diǎn)診斷。
[0031]為了能夠更清楚地了解本發(fā)明的技術(shù)手段,并可依照說明書的內(nèi)容予以實(shí)施,以 下以一較佳實(shí)施例以及附圖對本發(fā)明的技術(shù)方案作進(jìn)一步的說明。
[0032]成績錄入系統(tǒng)參閱圖1,本實(shí)施例所述圖像采集設(shè)備為高拍儀。成績錄入客戶端部 署到帶有windows系統(tǒng)的臺式機(jī)上。高拍儀通過數(shù)據(jù)線與臺式機(jī)連接。已經(jīng)注冊的用戶運(yùn)行 成績錄入客戶端程序,通過用戶名、密碼、驗(yàn)證碼進(jìn)行登錄驗(yàn)證。成績錄入客戶端運(yùn)行效果 參閱圖2。
[0033]成績錄入客戶端包括試卷預(yù)覽框,卷頭表格預(yù)覽框,分?jǐn)?shù)識別顯示框以及當(dāng)前已 登統(tǒng)試卷成績列表顯示窗口。教師登分過程中,首先將試卷放在高拍儀所拍攝的范圍內(nèi),通 過試卷預(yù)覽框確保試卷放置準(zhǔn)確,盡量保證卷頭表格在試卷預(yù)覽框的中心。然后通過敲擊 鍵盤中的"空格"鍵或是鼠標(biāo)左鍵點(diǎn)擊"拍照"按鈕控制高拍儀進(jìn)行試卷圖像采集。獲取圖像 后客戶端應(yīng)用圖像處理技術(shù)將卷頭登分表格從原始試卷圖像中分割出來,并將處理結(jié)果顯 示在卷頭表格預(yù)覽框內(nèi)。最后成績錄入客戶端自動(dòng)將分?jǐn)?shù)識別結(jié)果顯示在識別后的分?jǐn)?shù)框 內(nèi)。圖像處理算法流程圖參閱圖3,主要內(nèi)容如下: 試卷圖像處理及識別前,首先要進(jìn)行手寫體數(shù)字分類器的訓(xùn)練。通過數(shù)字樣本的采集, 樣本的篩選,獲得有效的手寫體數(shù)字樣本,通過支持向向量機(jī)(svm)的方法,訓(xùn)練并生成數(shù) 字識別的svm分類器。
[0034]第一步:通過高拍儀等圖像采集設(shè)備采集試卷原始彩色圖像。
[0035]第二步:通過灰度化處理將原始彩色圖像轉(zhuǎn)化為灰度圖像。
[0036] 第三步:應(yīng)用局部自適應(yīng)二值化方法或是先通過sobel算子邊緣提取再應(yīng)用ostu 二值化方法,將灰度試卷圖像轉(zhuǎn)化為二值圖像。
[0037] 第四步:應(yīng)用高斯低通濾波對試卷的二值圖像進(jìn)行第一次去噪。
[0038] 第五步:將去噪后的二值圖像通過hough變換找到基準(zhǔn)線,并根據(jù)基準(zhǔn)線計(jì)算傾斜 角度,最后對二值圖像進(jìn)行傾斜校正,得到校正后的二值圖像。
[0039] 第六步:對傾斜校正后的二值圖像進(jìn)行連通域標(biāo)記,找到所有的連通區(qū)域,并根據(jù) 連通域的面積大小信息對連通域進(jìn)行篩選,將面積太小的干擾項(xiàng)排除。
[0040] 第七步:將篩選出的連通區(qū)域通過位置信息進(jìn)行試卷卷頭的粗定位。
[0041] 第八步:對粗定位的卷頭圖像部分進(jìn)行水平、豎直方向投影,查看是否符合卷頭表 格的特征。將符合表格特征的部分確定為卷頭的精確位置。
[0042]第九步:根據(jù)卷頭精確的位置對傾斜校正后的二值圖像進(jìn)行裁剪,提取出卷頭圖 像。
[0043] 第十步:對卷頭圖像進(jìn)行水平、豎直方向投影,計(jì)算出表格的坐標(biāo)位置。
[0044] 第十一步:由于高拍儀采集圖像有球形畸變,為了盡可能避免畸變造成的影響,首 先對圖像進(jìn)行垂直的分割,獲得沒到小題的分?jǐn)?shù)表格圖像。
[0045] 第十二步:對每小題的分?jǐn)?shù)表格圖像進(jìn)行水平方向的分割,獲得該小題分?jǐn)?shù)的每 一位數(shù)字的圖像。
[0046] 第十三步:根據(jù)從中心服務(wù)器獲得的試卷結(jié)構(gòu)信息對分割結(jié)果進(jìn)行校驗(yàn),確保圖 像分割準(zhǔn)確無誤。
[0047] 第十四步:對每一位手寫體的數(shù)字圖像通過高斯低通濾波進(jìn)行去噪。
[0048] 第十五步:對去噪后的數(shù)字圖像通過形態(tài)學(xué)的膨脹方法進(jìn)行圖像增強(qiáng),獲得增強(qiáng) 后的數(shù)字圖像。
[0049] 第十六步:通過向內(nèi)縮進(jìn)、形態(tài)學(xué)重建的方法,對增強(qiáng)后的數(shù)字圖像進(jìn)行去除邊框 處理。
[0050] 第十七步:將去除邊框的數(shù)字圖像通過svm分類器進(jìn)行數(shù)字識別,最終獲得每道題 目的分?jǐn)?shù)。
[0051] 本實(shí)施例中所述圖像處理算法細(xì)分為四部分: 一、圖像預(yù)處理 首先將采集到的彩色圖像通過灰度化處理為灰度圖像,并通過局部自適應(yīng)二值化或是 邊緣提取后進(jìn)行0STU二值化將灰度圖像轉(zhuǎn)為只有黑白色的二值圖像。然后對而知圖像進(jìn)行 第一次去除噪聲。最后應(yīng)用hough變換法對圖像進(jìn)行傾斜校正。
[0052]二、卷頭圖像提取 卷頭為前面所述的待識別區(qū)域。應(yīng)用連通域方法對卷頭進(jìn)行粗定位,并根據(jù)表格所具 有的特征對卷頭進(jìn)行精確定位,然后剪切出需要識別的區(qū)域。
[0053]三、卷頭表格分割 應(yīng)用水平和垂直投影,分割出每道小題的分?jǐn)?shù)圖像。應(yīng)用畸變校正和圖像細(xì)化方法克 服高拍儀采集圖像時(shí)造成的球形畸變。并配合從中心服務(wù)器中獲得的json串,即試卷結(jié)構(gòu) 信息對分割結(jié)果進(jìn)行校驗(yàn),確保分割正確。
[0054]四、分?jǐn)?shù)識別 識別前用手寫體數(shù)字樣本訓(xùn)練分類器,本實(shí)施例采用的是支持向量機(jī)方法。對分?jǐn)?shù)圖 像進(jìn)行第二次去燥,并通過形態(tài)學(xué)處理和消除邊框處理等操作進(jìn)行圖像增強(qiáng)。最后識別出 學(xué)生的學(xué)號和每道題目的分?jǐn)?shù)。為提高成績登統(tǒng)效率,其中填空題如果答題正確可以不填 或是填"V",得分為填空題的滿分;如果答題錯(cuò)誤填"X",得分為零分。
[0055]用戶通過敲擊鍵盤上"空格"鍵或是點(diǎn)擊"確認(rèn)保存"按鈕將成績上傳到中心服務(wù) 器中。同時(shí)也可以通過點(diǎn)擊"查看"按鈕查看當(dāng)前已經(jīng)登統(tǒng)的所有成績,參閱圖4。
[0056]本實(shí)施例中,用戶使用瀏覽器登錄到成績統(tǒng)計(jì)分析端系統(tǒng)。系統(tǒng)從中心服務(wù)器獲 取數(shù)據(jù),通過計(jì)算統(tǒng)計(jì),將分析結(jié)果以表格、直方圖、曲線圖和文字描述等形式展示給用戶, 其中的圖標(biāo)內(nèi)容均由Highcharts實(shí)現(xiàn)的(一種用純JavaScript編寫的一個(gè)圖表庫)。主要內(nèi) 容包括:平均分的統(tǒng)計(jì),試題難度預(yù)測與實(shí)測曲線,考試診斷報(bào)告等分析數(shù)據(jù)。
[0057]其中平均分的統(tǒng)計(jì)是以班級為單位,通過對該班級中每位學(xué)生得分求和,然后除 以總?cè)藬?shù),來獲得該班級的平均分,公式為:
為該班學(xué)生人數(shù),_為第i個(gè)學(xué)生的 成績。參閱圖5,不同的柱形圖代表不同班級的最低分、平均分、最高分,左上位置的餅狀圖 代表不同分?jǐn)?shù)段學(xué)生人數(shù)的分布情況。
[0058] 試題難度的預(yù)測和實(shí)測曲線圖主要是評價(jià)教師所出試題的難度是否符合預(yù)期。本 實(shí)施例中通過正答率的情況來標(biāo)量難度值,計(jì)算試題難度值的公式為:¥ i·-!5,其中p 為正答率。
,R為該題做對的人數(shù),T為答題總?cè)藬?shù)。
[0059] 試題難度預(yù)測曲線圖生成過程如下:教師出試題的時(shí)候會對每道題目進(jìn)行難度預(yù) 測,例如班級總?cè)藬?shù)為50人,教師預(yù)測第1題會有40名同學(xué)做對,那么第一題的難度值依據(jù) 上述公式就為1-40/50=0.2。依照此方法,教師對整張?jiān)嚲碇忻康李}目進(jìn)行難度值預(yù)測。然 后以題號為橫坐標(biāo),試題難度值為縱坐標(biāo),在坐標(biāo)中標(biāo)出相應(yīng)的坐標(biāo)點(diǎn),并根據(jù)題號先后用 平滑曲線順次連接坐標(biāo)點(diǎn),從而獲得試題難度預(yù)測曲線圖。
[0060] 試題難度實(shí)測曲線圖生成過程與試題難度預(yù)測曲線圖類似,成績錄入完成后,會 有每道題目的真實(shí)正答率,根據(jù)真實(shí)的數(shù)據(jù)通過上述試題難度值公式計(jì)算出每道試題的真 實(shí)難度值,然后按照試題難度預(yù)測曲線圖生成方式得到試題難度實(shí)測曲線。參閱圖6。
[0061] 其中診斷報(bào)告包括對試卷的診斷、失分率診斷、每位學(xué)生知識掌握程度的診斷、學(xué) 生能力點(diǎn)診斷。
[0062] a、對試卷的診斷 主要包括試卷區(qū)分度(是否可以區(qū)分各個(gè)水平層次的學(xué)生)、試卷難度、知識點(diǎn)的搭配 和能力點(diǎn)的側(cè)重等,對試卷的診斷參閱圖7。
[0063] 區(qū)分度指試題對考生實(shí)際水平的區(qū)分程度。試題區(qū)分度D的計(jì)算公式 D=PH-PL ( PH、PL分別為試題高分組和低分組考生的正答率,
做對的人數(shù),T為總?cè)藬?shù)) 例如一次生物測試中,在100名學(xué)生中,高低分組各有27人,其中高分組答對第一題有 20人,低分組答對第一題的有5分,這道題的區(qū)分度為: D=PH-PL=20/27-5/27=0.55 試卷難度主要通過試題平均難度系數(shù)進(jìn)行衡量。平均難度系數(shù)為所有試題難度值的實(shí) 測平均值。有上述可得試題難度值為V,平均難度系數(shù)A的公式為:
?其中轉(zhuǎn)為第i 道題目的難度值,q為試卷中試題的總數(shù)。
[0064] 知識點(diǎn)搭配主要是列出每個(gè)知識點(diǎn)的分布比例,查看知識點(diǎn)的分布是比較平均還 是有所側(cè)重。分布比例主要是根據(jù)每個(gè)知識所占的分?jǐn)?shù)除以試卷總分來獲得,分布比例公
;其中.為第k個(gè)知識點(diǎn)所占的分?jǐn)?shù);η為知識點(diǎn)的個(gè)數(shù),1?為第i 個(gè)知識點(diǎn)所占分?jǐn)?shù)。
[0065]能力點(diǎn)搭配主要是列出每個(gè)能力點(diǎn)的分布比例,查看能力點(diǎn)的分布是比較平均還 是有所側(cè)重。能力點(diǎn)分布比例計(jì)算公式與知識點(diǎn)比例分布公式類似,即用每個(gè)能力點(diǎn)所占 的分?jǐn)?shù)除以試卷總分?jǐn)?shù)。分布比例公式為:
;其中義為第k個(gè)能力點(diǎn)所占 的分?jǐn)?shù);m為能力點(diǎn)的個(gè)數(shù),為第i個(gè)能力點(diǎn)所占分?jǐn)?shù)。
[0066] b、失分率診斷 統(tǒng)計(jì)出整個(gè)班級失分率比較高的題目,建議教師重點(diǎn)講解此類題目的內(nèi)容。其中失分 率超過40%的題目定義為失分率比較高的試題,失分率公式為,其中L為該試題沒有 獲得滿分的人數(shù),T為該班答題人數(shù)。參閱圖8。
[0067] c、學(xué)生知識掌握程度的診斷 每道題目都有相對應(yīng)的知識點(diǎn),根據(jù)學(xué)生每道題目得分情況即可以了解到學(xué)生對知識 點(diǎn)的掌握程度。學(xué)生知識掌握程度的診斷主要是統(tǒng)計(jì)出每個(gè)知識點(diǎn)的得分率。其中知識點(diǎn) 得分率公式為:
其中1?為該班第i名同學(xué)的本知識點(diǎn)所獲得的分?jǐn)?shù),KF為 此知識點(diǎn)在試卷中所占的總分?jǐn)?shù);T為該班答題人數(shù)。參閱圖9。
[0068] d、學(xué)生能力點(diǎn)診斷 每道題目都有相對應(yīng)的能力點(diǎn),根據(jù)學(xué)生每道題目得分情況即可以了解到學(xué)生對能力 點(diǎn)的掌握程度。學(xué)生各個(gè)能力掌握程度的診斷主要是統(tǒng)計(jì)出每個(gè)能力點(diǎn)的得分率。計(jì)算能 力點(diǎn)得分率公式與計(jì)算知識點(diǎn)類似,公式為:
。鳧化為該班第i名同學(xué)的本能 力點(diǎn)所獲得的分?jǐn)?shù),AF為此能力點(diǎn)在試卷中所占的總分?jǐn)?shù);T為該班答題人數(shù)。參閱圖10。 [0069]以上所述實(shí)施方式僅為本發(fā)明的優(yōu)選實(shí)施例,而并非本發(fā)明可行實(shí)施例的窮舉。 對于本領(lǐng)域一般技術(shù)人員而言,在不背離本發(fā)明原理和精神的前提下對其所作出的任何顯 而易見的改動(dòng),都應(yīng)當(dāng)被認(rèn)為包含在本發(fā)明的權(quán)利要求保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種成績錄入系統(tǒng),其特征在于包括采集單元、成績錄入客戶端、防火墻、路由器、中 心服務(wù)器和用戶終端; 所述采集單元的輸入端獲取試卷圖像;所述采集單元的輸出端接所述成績錄入客戶端 的相應(yīng)輸入端;所述成績錄入客戶端與互聯(lián)網(wǎng)相連接; 所述中心服務(wù)器經(jīng)路由器、防火墻與互聯(lián)網(wǎng)相連接; 所述用戶終端與互聯(lián)網(wǎng)相連接。2. 根據(jù)權(quán)利要求1所述的一種基于圖像處理的成績錄入系統(tǒng),其特征在于:所述采集單 元為掃描儀、高拍儀、照相機(jī)、攝像機(jī)或手機(jī)攝像頭。3. 根據(jù)權(quán)利要求1所述的一種基于圖像處理的成績錄入系統(tǒng),其特征在于:所述成績錄 入客戶端為計(jì)算機(jī)、平板電腦或手機(jī)。4. 根據(jù)權(quán)利要求1所述的一種基于圖像處理的成績錄入系統(tǒng),其特征在于:所述中心服 務(wù)器為計(jì)算機(jī);所述用戶終端為計(jì)算機(jī)。5. 利用權(quán)利要求1所述的成績錄入系統(tǒng)進(jìn)行圖像處理的方法,其特征在于包括如下步 驟: (1) 進(jìn)行手寫體數(shù)字識別分類器的訓(xùn)練:通過手寫體數(shù)字樣本的采集和篩選,獲得有效 的手寫體數(shù)字樣本,利用支持向量機(jī)的方法,訓(xùn)練并生成識別手寫體數(shù)字的svm分類器; (2) 利用所述采集單元采集帶有卷頭的已評分紙質(zhì)試卷原始彩色圖像; (3) 成績錄入客戶端獲取帶有卷頭的已評分紙質(zhì)試卷原始彩色圖像;成績錄入客戶端 通過灰度化處理方法將所述帶有卷頭的已評分紙質(zhì)試卷原始彩色圖像轉(zhuǎn)化為灰度圖像; (4) 成績錄入客戶端將所述灰度圖像轉(zhuǎn)化為二值圖像; (5) 成績錄入客戶端利用高斯低通濾波法對所述二值圖像進(jìn)行第一次去噪,得到一次 去噪二值圖像; (6) 成績錄入客戶端將所述一次去噪二值圖像通過hough變換找到基準(zhǔn)線,并根據(jù)基準(zhǔn) 線計(jì)算傾斜角度,最后對一次去噪二值圖像進(jìn)行傾斜校正,得到校正后一次去噪二值圖像; (7) 成績錄入客戶端對校正后一次去噪二值圖像進(jìn)行連通域標(biāo)記,找到所有的連通區(qū) 域,并根據(jù)連通區(qū)域面積大小的信息對連通區(qū)域進(jìn)行篩選,將面積太小的干擾項(xiàng)排除,得到 篩選后連通區(qū)域; (8) 成績錄入客戶端利用位置信息將所述篩選后連通區(qū)域進(jìn)行試卷卷頭的粗定位,得 到粗定位后試卷卷頭圖像; (9) 成績錄入客戶端對粗定位后試卷卷頭圖像分別進(jìn)行水平方向、豎直方向投影,查看 是否符合卷頭表格特征;將符合卷頭表格特征的部分確定為卷頭的精確位置; (10) 成績錄入客戶端根據(jù)卷頭的精確位置對校正后一次去噪二值圖像進(jìn)行裁剪,提取 出精確卷頭圖像; (11) 成績錄入客戶端對精確卷頭圖像分別進(jìn)行水平方向、豎直方向投影,計(jì)算出表格 的坐標(biāo)位置; (12) 由于采集單元所采集的圖像通常會有球形畸變,為了盡可能避免畸變造成的影 響,成績錄入客戶端對圖像進(jìn)行垂直的分割,獲得小題分?jǐn)?shù)表格圖像; (13) 成績錄入客戶端對小題分?jǐn)?shù)表格圖像進(jìn)行水平方向的分割,獲得小題分?jǐn)?shù)的每一 位數(shù)字的圖像; (14) 根據(jù)從中心服務(wù)器獲得的試卷結(jié)構(gòu)信息,成績錄入客戶端對分割結(jié)果進(jìn)行校驗(yàn), 驗(yàn)證圖像分割是否準(zhǔn)確無誤; (15) 成績錄入客戶端利用高斯低通濾波方法對每個(gè)手寫體數(shù)字圖像進(jìn)行去噪,得到去 噪后手寫體數(shù)字圖像; (16) 成績錄入客戶端通過形態(tài)學(xué)的膨脹方法對噪后手寫體數(shù)字圖像進(jìn)行圖像增強(qiáng),獲 得增強(qiáng)型手寫體數(shù)字圖像; (17) 通過向內(nèi)縮進(jìn)和形態(tài)學(xué)重建的方法,成績錄入客戶端對增強(qiáng)型手寫體數(shù)字圖像進(jìn) 行去除邊框處理; (18) 成績錄入客戶端將去除邊框的增強(qiáng)型手寫體數(shù)字圖像通過svm分類器進(jìn)行數(shù)字識 另IJ,最終得到每道題目的分?jǐn)?shù)數(shù)據(jù)信息,并將所述分?jǐn)?shù)數(shù)據(jù)信息傳輸給所述中心服務(wù)器; (19 )所述中心服務(wù)器對所述分?jǐn)?shù)數(shù)據(jù)信息進(jìn)行數(shù)據(jù)處理,得到分析處理結(jié)果; (20)所述用戶終端通過互聯(lián)網(wǎng)從所述中心服務(wù)器獲取每道題目的分?jǐn)?shù)數(shù)據(jù)信息和分 析處理結(jié)果,并通過用戶終端顯示器顯示所述每道題目的分?jǐn)?shù)數(shù)據(jù)信息和分析處理結(jié)果。6. 根據(jù)權(quán)利要求5所述的圖像處理的方法,其特征在于:利用Highcharts將所述分析處 理結(jié)果以表格、直方圖、曲線圖或文字描述的形式展示給用戶。7. 根據(jù)權(quán)利要求5所述的圖像處理的方法,其特征在于:所述分?jǐn)?shù)數(shù)據(jù)信息的數(shù)據(jù)處理 包括平均分統(tǒng)計(jì)、試題難度預(yù)測曲線及試題難度實(shí)測曲線和考試診斷報(bào)告。8. 根據(jù)權(quán)利要求7所述的圖像處理的方法,其特征在于:所述平均分統(tǒng)計(jì)是以班級為單 位,通過對所述班級中每位學(xué)生得分求和,然后除以總?cè)藬?shù),來獲得該班級的平均分,表達(dá) 式為: s = ilii;其中,T為該班答題人數(shù),_:為第i個(gè)學(xué)生的成績。 . 寒.9. 根據(jù)權(quán)利要求7所述的圖像處理的方法,其特征在于:所述試題難度預(yù)測曲線及試題 難度實(shí)測曲線生成方法如下: 計(jì)算試題難度值的公式為:康,其中P為試題正答率,F(xiàn) = |,R為該試題做對的 人數(shù),T為參加答題班級人數(shù); 以題號為橫坐標(biāo),試題難度值為縱坐標(biāo),在坐標(biāo)中標(biāo)出相應(yīng)的坐標(biāo)點(diǎn),并根據(jù)題號先后 用平滑曲線順次連接坐標(biāo)點(diǎn),即獲得試題難度預(yù)測曲線; 成績錄入完成后,每道試題的真實(shí)正答率為RP,計(jì)算出每道試題真實(shí)難度值RV,表達(dá)式 為RY = 1 - RP ;以題號為橫坐標(biāo),試題真實(shí)難度值為縱坐標(biāo),在坐標(biāo)中標(biāo)出相應(yīng)的坐標(biāo) 點(diǎn),并根據(jù)題號先后用平滑曲線順次連接坐標(biāo)點(diǎn),即獲得試題難度實(shí)測曲線。10. 根據(jù)權(quán)利要求7所述的圖像處理的方法,其特征在于:所述考試診斷報(bào)告包括對試 卷的診斷、失分率診斷、每位學(xué)生知識掌握程度的診斷、學(xué)生能力點(diǎn)診斷; a、對試卷的診斷包括用于區(qū)分各個(gè)層次水平學(xué)生的試題區(qū)分度、試卷難度、知識點(diǎn)的 搭配和能力點(diǎn)的側(cè)重; 試題區(qū)分度指試題對考生實(shí)際水平的區(qū)分程度;試題區(qū)分度的計(jì)算公式為 D=PH-PL 其中D為試題區(qū)分度,PH、PL分別為試題高分組和低分組考生的正答率,高分組正答 率公式為:PH ==,其中RH高分組做對的人數(shù),ΤΗ為高分組人數(shù);低分組正答率公式為: 誦: PL = #,其中RL低分組做對的人數(shù),TL為低分組人數(shù); 微 所述試卷難度通過試題平均難度系數(shù)進(jìn)行衡量;所述平均難度系數(shù)為所有試題難度值 的實(shí)測平均值; 平均難度系數(shù)Α的公式為:/? =@;其中·^為第i道題目的難度值,q為試卷中試題的 總數(shù); 知識點(diǎn)搭配是列出每個(gè)知識點(diǎn)的分布比例,查看知識點(diǎn)的分布是比較平均還是有所側(cè) 重;分布比例是根據(jù)每個(gè)知識所占的分?jǐn)?shù)除以試卷總分來獲得,分布比例公式為: 1?? p;其中K%為第k個(gè)知識點(diǎn)所占的分?jǐn)?shù);η為知識點(diǎn)的個(gè)數(shù),1?為第i個(gè)知識 點(diǎn)所占分?jǐn)?shù); 能力點(diǎn)搭配是列出每個(gè)能力點(diǎn)的分布比例,查看能力點(diǎn)的分布是比較平均還是有所側(cè) 重;能力點(diǎn)分布比例計(jì)算公式與知識點(diǎn)比例分布公式類似,即用每個(gè)能力點(diǎn)所占的分?jǐn)?shù)除 以試卷總分?jǐn)?shù);分布比例公式為:_翻響其中1?為第k個(gè)能力點(diǎn)所占的分?jǐn)?shù);m 為能力點(diǎn)的個(gè)數(shù),·為第i個(gè)能力點(diǎn)所占分?jǐn)?shù); b、失分率診斷的目的是統(tǒng)計(jì)出整個(gè)班級失分率比較高的題目,并建議教師重點(diǎn)講解此 類題目的內(nèi)容;其中失分率超過40%的題目定義為失分率比較高的試題,失分率公式為 .LR = ¥,其中L為該試題沒有獲得滿分的人數(shù),τ為該班答題人數(shù); C、學(xué)生知識掌握程度的診斷 每道題目都有相對應(yīng)的知識點(diǎn),根據(jù)學(xué)生每道題目得分情況即可以了解到學(xué)生對知識 點(diǎn)的掌握程度;學(xué)生知識掌握程度的診斷是統(tǒng)計(jì)出每個(gè)知識點(diǎn)的得分率;其中知識點(diǎn)得分 率公式為其中1??為該班第i名同學(xué)的本知識點(diǎn)所獲得的分?jǐn)?shù),KF為此知 識點(diǎn)在試卷中所占的總分?jǐn)?shù);T為該班答題人數(shù); d、學(xué)生能力點(diǎn)診斷 每道題目都有相對應(yīng)的能力點(diǎn),根據(jù)學(xué)生每道題目得分情況即可以了解到學(xué)生對能力 點(diǎn)的掌握程度;學(xué)生各個(gè)能力掌握程度的診斷是統(tǒng)計(jì)出每個(gè)能力點(diǎn)的得分率;計(jì)算能力點(diǎn) 得分率公式為:AGR = .'扁_ 該班第i名同學(xué)的本能力點(diǎn)所獲得的分?jǐn)?shù),AF為此能力點(diǎn)在試卷中所占的總分 數(shù);T為該班答題人數(shù)。
【文檔編號】G06K9/20GK105869085SQ201610186428
【公開日】2016年8月17日
【申請日】2016年3月29日
【發(fā)明人】王永剛, 蔣佳憶, 周丙寅, 楊宇軒, 穆紅偉, 夏炳坤
【申請人】河北師范大學(xué)