本發(fā)明涉及在線學習診斷方法。
背景技術:
隨著網(wǎng)絡的發(fā)展,用戶的學習與網(wǎng)絡緊密聯(lián)系起來。很多學校和教育機構都設計了在線教學與試題系統(tǒng),為了使用戶可以通過在線練習試題,了解對相關知識點的掌握情況,現(xiàn)有技術采用了很多方法。
公開號為104317825a的中國發(fā)明專利申請公開了一種知識點量化分析方法,包括:s101、在數(shù)據(jù)庫中獲得已設置好的試題包含的各知識點數(shù)據(jù),并設置每個知識點占該試題內(nèi)容的權重記為x權;s102、在數(shù)據(jù)庫中根據(jù)不同類型考試獲得的知識點來源,設置各知識點來源的權重記為y權;s103、通過選取待檢測用戶的某道試題實際得分成績和該試題中設置的各知識點x權數(shù)據(jù),計算各知識點標準分記為s;s104、根據(jù)知識點標準分s和y權更新知識點評價成績記為vn,計算公式如下,vn=s×y+vn-1×(100%-y);其中,n為自然數(shù),知識點評價成績初始值v0=500,vn-1為當前知識點評價成績。
但是,上述分析方法完全依賴于做題的結果,無法做到全面、客觀的反應用戶對于某知識點的掌握情況。
技術實現(xiàn)要素:
本發(fā)明所要解決的技術問題就是提供一種基于大數(shù)據(jù)的知識點掌握概率計算方法,可以更加全面、真實的反應用戶對于某知識點的掌握情況。
為解決上述技術問題,本發(fā)明采用如下技術方案:一種基于大數(shù)據(jù)的知識點掌握概率計算方法,
計算公式為p(θ)=1/(1+e^(b-θ));
b表示每個題目的難度系數(shù),針對該知識點的每個題目,對全平臺用戶預先設定統(tǒng)一的難度系數(shù)標準,每個題目的難度系數(shù)確定包括如下步驟:
步驟一,利用
步驟二,根據(jù)每道題所抽取的用戶樣本,計算出每道題的平均正確率,對正確率最低pmin的題目難度系數(shù)賦值為1,正確率最高pmax的題目難度系數(shù)賦值為0.01,而對于正確率為m的題目難度系數(shù)確定的方法為k=1-(1-0.01)·(m-pmin)/(pmax-pmin);
θ表示評定用戶的能力參數(shù),θ的計算方法為:選取該知識點最近n題且n≥20,計算ln(答題正確數(shù)/答題錯誤數(shù));
e=2.71828。
作為優(yōu)選,步驟一利用
作為優(yōu)選,每個題目的難度系數(shù)每間隔一個月重新計算并更新。
作為優(yōu)選,θ的計算選取該知識點最近30題。
作為優(yōu)選,在計算θ時,當答題正確數(shù)為0或者答題錯誤數(shù)為0時,答題正確數(shù)或答題錯誤數(shù)采用修正值0.5。
本發(fā)明依據(jù)整個平臺用戶的大數(shù)據(jù)分析,對于知識點達標的評價方法依據(jù)項目反應原理(irt)的1pl模型的p(θ)值進行計算,對于知識點的掌握判定,從題目的客觀難度、用戶學習能力入手,更加全面、真實的反應用戶對于某知識點的掌握情況。
具體實施方式
項目反應理論(itemresponsetheory,irt)是一系列心理統(tǒng)計學模型的總稱,是針對經(jīng)典測量理論(classicaltesttheory,簡稱ctt)的局限性提出來的。irt是用來分析考試成績或者問卷調查數(shù)據(jù)的數(shù)學模型,這些模型的目標是來確定的潛在心理特征(latenttrait)是否可以通過測試題被反應出來,以及測試題和被測試者之間的互動關系。
現(xiàn)代遠程教育以計算機網(wǎng)絡為基礎來實施教學的各個環(huán)節(jié),有著信息化水平高的特點。這一特殊的教學環(huán)境非常有利于項目反應原理(又稱irt,itemresponsetheory)發(fā)揮優(yōu)勢,提高教學質量。
遺忘曲線由德國心理學家艾賓浩斯(h.ebbinghaus)研究發(fā)現(xiàn),這條曲線告訴人們在學習中的遺忘是有規(guī)律的,遺忘的進程很快,并且先快后慢。
本發(fā)明依據(jù)項目反應原理(irt)的1pl模型的p(θ)以及遺忘曲線的r值進行計算,對平臺用戶的知識點掌握情況進行診斷。以下結合具體實施例對本發(fā)明做出具體說明。
實施例1,一種在線學習知識點診斷方法,包括如下步驟:
步驟一,評定用戶對于該知識點掌握的概率,計算公式為p(θ)=1/(1+e^(b-θ)),其中,θ表示評定用戶的能力參數(shù),b表示每個題目的難度系數(shù),e為常數(shù)2.71828;
其中,針對該知識點,b采用標準難度系數(shù),指對于全平臺用戶而言,通過定量與定性的研究方法,分析確定的統(tǒng)一的難度系數(shù)標準。
根據(jù)全平臺海量用戶的練習累計數(shù)據(jù),結合每道題目的正確率(每道題目的正確率采用全國各地(縣區(qū))的平均正確率,用以降低全國各地區(qū)教學水平差異的影響,進而保證標準難度系數(shù)對于全國各地的通用性及合理性),按照科學的統(tǒng)計分析方法,對題目難度系數(shù)進行賦值(對全國各地采用配比抽樣,組成題目難度評定樣本,根據(jù)正確率最低與正確率最高對定義難度最高系數(shù)與難度最低系數(shù),并對每道題目進行難度賦值)。具體包括如下步驟:
抽樣方法細述:首先研究的問題為題目a全國各地區(qū)學生的平均正確率,地區(qū)的級別為縣區(qū),使估算誤差出不超過0.5%,且具有95%的可信度。
利用
上述的抽樣方法只是一種舉例,當然也可以采用其他現(xiàn)有的抽樣方法,在此不再一一贅述。對本發(fā)明來說,更重要的還在于根據(jù)抽樣結果,進行難度系數(shù)賦值的方法。
難度系數(shù)賦值方法:根據(jù)每道題所抽取的學生樣本,可計算出每道題的平均正確率。對正確率最低(pmin)的題目難度系數(shù)賦值為1,正確率最高(pmax)的題目難度系數(shù)賦值為0.01,對于正確率為m的題目難度系數(shù)確定的方法為k=1-(1-0.01)·(m-pmin)/(pmax-pmin)。
另外,題目的難度系數(shù)每月進行更新。
θ的計算方法為:為降低歷史能力對最新能力的影響,同時保障能力評估的準確性,選取該知識點最近練習的30題,計算ln(答題正確數(shù)/答題錯誤數(shù)),當答題正確數(shù)為0或者答題錯誤數(shù)為0時,答題正確數(shù)或答題錯誤數(shù)采用修正值0.5。當然為了保證θ的準確性,也可以選擇選取該知識點最近練習30題以上甚至更多題目。
步驟二,評定用戶對于該知識點的記憶程度,計算公式為r=e^(-t/s),其中,t為以天為基本單位的時間間隔,s為記憶強度,e為常數(shù)2.71828;
s的計算方法為,每個知識點初始s=1,且s最小為1,練習答案正確,則該題的直接和間接知識點的s=s+1,練習答案錯誤,直接知識點s=s-1,間接知識點s=s-(1-0.2n),n為該間接知識點與直接知識點之間的相隔層級,n>5時把n視為5。
直接知識點指與該題目直接關聯(lián)的知識點,間接知識點指與該題目的知識點相關聯(lián)的知識點。因為知識點與知識點不是相互獨立的,是有先后或者父子級關系的,學生所學的所有知識點是個網(wǎng)狀關系,知識點之間彼此相互聯(lián)系。例如乘除法混合運算屬于子級知識點,四則混合運算屬于父級知識點,當一個學生練了一個乘除法混合運算的題目,但同時對四則混合運算也間接的進行了練習,因為四則混合運算里面包含乘除法混合運算,這時乘法混合運算為直接知識點,四則混合運算為間接知識點。間接知識點與直接知識點的相隔層級指在知識點關系圖中,之間相隔幾個知識點,層級越低兩個知識點的關聯(lián)層度越大,層級越大,兩個知識點的關聯(lián)層度越小。
t的計算方法為,t=當前日期-記憶時間,當一道題做正確時,該題的直接知識點和間接知識點的記憶時間=該題練習的日期,也就是答對該題時的具體日期。
每個知識點的初始r=0,每天(凌晨)重新計算r,當一道題做正確時,該題的直接知識點和間接知識點的r=1。
步驟三,實時計算p(θ)*r,當結果大于等于0.75時該用戶知識點達標,反之不達標。
之所以確定75%,一個是結合具體的答題數(shù)據(jù)及代表性學生的分析,同時也采用了專家訪談,即經(jīng)驗豐富教師的意見。
實施例2,與實施例1的不同在于,進一步的,對每個難度段的題目,隨機抽取樣本,難度系數(shù)在統(tǒng)計分析結果基礎上,通過專家評定,最終確定,確保題目難度系數(shù)的客觀準確。即專家根據(jù)經(jīng)驗首先明確難度最高題目的難度系數(shù),然后根據(jù)豐富的教學經(jīng)驗,對個別題目進行檢驗。
實施例3,與實施例1和2的不同在于,將專家評定結果與統(tǒng)計分析賦值結果進行綜合,確定每個個題目的最終難度系數(shù)b=0.5*累積數(shù)據(jù)分析結果+0.5*專家難度賦值。
除上述優(yōu)選實施例外,本發(fā)明還有其他的實施方式,本領域技術人員可以根據(jù)本發(fā)明作出各種改變和變形,只要不脫離本發(fā)明的精神,均應屬于本發(fā)明權利要求書中所定義的范圍。