本發(fā)明涉及計算機(jī)技術(shù)領(lǐng)域,具體涉及一種試題數(shù)據(jù)處理方法及系統(tǒng)。
背景技術(shù):
在教育出版領(lǐng)域中,在線學(xué)習(xí)服務(wù)平臺已經(jīng)逐漸成為一種非常重要和典型的產(chǎn)品形態(tài)?;谠嚲淼脑诰€學(xué)習(xí)、測試、再學(xué)習(xí),也是在線學(xué)習(xí)服務(wù)平臺提供的主要學(xué)習(xí)方式之一。目前,在線學(xué)習(xí)服務(wù)平臺的試卷是由老師或?qū)I(yè)編輯人員根據(jù)自身經(jīng)驗精心挑選試題組織的,工作效率較低;而且,由于老師或?qū)I(yè)編輯人員的是根據(jù)自身經(jīng)驗進(jìn)行出題,由他們提供的試卷質(zhì)量并不能有效針對每一個學(xué)生。推送給學(xué)生用戶的內(nèi)容有太多重復(fù)內(nèi)容,用戶體驗差;學(xué)習(xí)重復(fù)率高,效率低,沒有針對學(xué)生的個人情況進(jìn)行出題測試。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種試題數(shù)據(jù)處理方法及系統(tǒng),能夠有效針對每個學(xué)生的情況。
本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:
依據(jù)本發(fā)明的一個方面,提供了一種試題數(shù)據(jù)處理方法,所述方法包括:
S101、根據(jù)待測學(xué)科的考試大綱信息列表中包括的各知識點信息,在與所述待測學(xué)科對應(yīng)的試題庫中獲取與所述各知識點信息匹配的試題并存儲至待查重試題庫中;
S102、按照預(yù)設(shè)規(guī)則從待查重試題庫中提取試題得到待查重試題,并從待查重試題庫中篩選出與所述待查重試題相似度超過預(yù)設(shè)值的試題集合,得到相似試題集合;
S103、分別提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征;
S104、按順序分別采用相似度算法計算待查重試題的數(shù)據(jù)特征和相似試題集合中試題的數(shù)據(jù)特征的相似度,根據(jù)相似度得到與所述待查重試題重復(fù)的試題,并將其從所述待查重試題庫刪除,得到練習(xí)試題庫。
本發(fā)明的有益效果:本發(fā)明提供一種試題數(shù)據(jù)處理方法,能夠按照考試大綱信息得到對應(yīng)的試題,并能對試題進(jìn)行查重,刪除重復(fù)的試題,得到練習(xí)試題庫。本發(fā)明能夠針對考試大綱得到試題信息,并對試題進(jìn)行查重,便于學(xué)生有效的針對考試進(jìn)行練習(xí),且不會重復(fù)做題,提高了練習(xí)質(zhì)量。
進(jìn)一步,所述S101具體包括:
獲取與所述待測學(xué)科的各知識點信息對應(yīng)的試題存儲地址,并在與所述待測學(xué)科對應(yīng)的試題庫中所述試題存儲地址指向的存儲空間中獲取與所述各知識點信息對應(yīng)的試題。
采用上述進(jìn)一步方案的有益效果:獲取待測學(xué)科的知識點對應(yīng)的試題,便于針對性的進(jìn)行練習(xí)。
進(jìn)一步,所述S102具體包括:
采用布爾模型和余弦定理分別計算出所述待查重試題庫中其他試題與所述待查重試題的第一相似度值,如果所述第一相似度值大于預(yù)設(shè)第一相似度值,則該試題與所述待查重試題相似度超過預(yù)設(shè)值,得到相似試題集合。
采用上述進(jìn)一步方案的有益效果:對試題進(jìn)行查重,避免重復(fù)做題。
進(jìn)一步,所述S103中所述數(shù)據(jù)特征具體包括數(shù)字、字母、漢字和漢字的長度。
采用上述進(jìn)一步方案的有益效果:根據(jù)數(shù)據(jù)特征判斷相似度。
進(jìn)一步,所述S104之后還包括:
獲取用戶對所述練習(xí)試題庫中的試題的答復(fù)信息,并檢測所述答復(fù)信息是否與預(yù)設(shè)的該試題的試題答案一致,若一致,則將該試題從所述練習(xí)數(shù)據(jù)可中刪除并移動至備用試題庫;若不一致,則依然將該試題保存在所述練習(xí)試題庫中。
采用上述進(jìn)一步方案的有益效果:針對學(xué)生的情況,學(xué)生掌握之后的知識點不再出現(xiàn),根據(jù)學(xué)生的情況進(jìn)行出題,避免重復(fù)做題。
依據(jù)本發(fā)明的另一個方面,提供了一種試題數(shù)據(jù)處理系統(tǒng),所述系統(tǒng)包括:
匹配存儲單元,用于根據(jù)待測學(xué)科的考試大綱信息列表中包括的各知識點信息,在與所述待測學(xué)科對應(yīng)的試題庫中獲取與所述各知識點信息匹配的試題并存儲至待查重試題庫中;
篩選單元,用于按照預(yù)設(shè)規(guī)則從待查重試題庫中提取試題得到待查重試題,并從待查重試題庫中篩選出與所述待查重試題相似度超過預(yù)設(shè)值的試題集合,得到相似試題集合;
提取單元,用于分別提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征;
計算單元,用于按順序分別采用相似度算法計算待查重試題的數(shù)據(jù)特征和相似試題集合中試題的數(shù)據(jù)特征的相似度,根據(jù)相似度得到與所述待查重試題重復(fù)的試題;
查重刪除單元,用于將與所述待查重試題重復(fù)的試題從所述待查重試題庫刪除,得到練習(xí)試題庫。
本發(fā)明的有益效果:本發(fā)明提供一種試題數(shù)據(jù)處理系統(tǒng),能夠按照考試大綱信息得到對應(yīng)的試題,并能對試題進(jìn)行查重,刪除重復(fù)的試題,得到練習(xí)試題庫。本發(fā)明能夠針對考試大綱得到試題信息,并對試題進(jìn)行查重,便于學(xué)生有效的針對考試進(jìn)行練習(xí),且不會重復(fù)做題,提高了練習(xí)質(zhì)量。
進(jìn)一步,所述匹配存儲單元具體用于:
獲取與所述待測學(xué)科的各知識點信息對應(yīng)的試題存儲地址,并在與所述待測學(xué)科對應(yīng)的試題庫中所述試題存儲地址指向的存儲空間中獲取與所述各知識點信息對應(yīng)的試題。
采用上述進(jìn)一步方案的有益效果:獲取待測學(xué)科的知識點對應(yīng)的試題,便于針對性的進(jìn)行練習(xí)。
進(jìn)一步,所述篩選單元具體用于:
采用布爾模型和余弦定理分別計算出所述待查重試題庫中其他試題與所述待查重試題的第一相似度值,如果所述第一相似度值大于預(yù)設(shè)第一相似度值,則該試題與所述待查重試題相似度超過預(yù)設(shè)值,得到相似試題集合。
采用上述進(jìn)一步方案的有益效果:對試題進(jìn)行查重,避免重復(fù)做題。
進(jìn)一步,所述提取單元中所述數(shù)據(jù)特征具體包括數(shù)字、字母、漢字和漢字的長度。
采用上述進(jìn)一步方案的有益效果:根據(jù)數(shù)據(jù)特征判斷相似度。
進(jìn)一步,所述系統(tǒng)還包括:
檢測刪除單元,用于獲取用戶對所述練習(xí)試題庫中的試題的答復(fù)信息,并檢測所述答復(fù)信息是否與預(yù)設(shè)的該試題的試題答案一致,若一致,則將該試題從所述練習(xí)數(shù)據(jù)可中刪除并移動至備用試題庫;若不一致,則依然將該試題保存在所述練習(xí)試題庫中。
采用上述進(jìn)一步方案的有益效果:針對學(xué)生的情況,學(xué)生掌握之后的知識點不再出現(xiàn),根據(jù)學(xué)生的情況進(jìn)行出題,避免重復(fù)做題。
附圖說明
圖1為本發(fā)明實施例一的一種試題數(shù)據(jù)處理方法流程圖;
圖2為本發(fā)明實施例二的一種試題數(shù)據(jù)處理系統(tǒng)示意圖。
具體實施方式
以下結(jié)合附圖對本發(fā)明的原理和特征進(jìn)行描述,所舉實例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。
實施例一、一種試題數(shù)據(jù)處理方法。下面結(jié)合圖1對本實施例提供的方法進(jìn)行詳細(xì)說明。
參見圖1,一種試題數(shù)據(jù)處理方法,所述方法包括以下步驟:
S101、根據(jù)待測學(xué)科的考試大綱信息列表中包括的各知識點信息,在與所述待測學(xué)科對應(yīng)的試題庫中獲取與所述各知識點信息匹配的試題并存儲至待查重試題庫中。
獲取與所述待測學(xué)科的各知識點信息對應(yīng)的試題存儲地址,并在與所述待測學(xué)科對應(yīng)的試題庫中所述試題存儲地址指向的存儲空間中獲取與所述各知識點信息對應(yīng)的試題。
S102、按照預(yù)設(shè)規(guī)則從待查重試題庫中提取試題得到待查重試題,并從待查重試題庫中篩選出與所述待查重試題相似度超過預(yù)設(shè)值的試題集合,得到相似試題集合。
具體的,所述預(yù)設(shè)規(guī)則包括遍歷算法,即:將題庫中序數(shù)為1的試題先和序數(shù)為2的試題相比較,判斷完成后繼續(xù)循環(huán)遍歷下去逐個比較。采用布爾模型和余弦定理分別計算出所述待查重試題庫中其他試題與所述待查重試題的第一相似度值,如果所述第一相似度值大于預(yù)設(shè)第一相似度值,則該試題與所述待查重試題相似度超過預(yù)設(shè)值,得到相似試題集合。
S103、分別提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征。
具體的,所述數(shù)據(jù)特征具體包括數(shù)字、字母、漢字和漢字的長度。
S104、按順序分別采用相似度算法計算待查重試題的數(shù)據(jù)特征和相似試題集合中試題的數(shù)據(jù)特征的相似度,根據(jù)相似度得到與所述待查重試題重復(fù)的試題,并將其從所述待查重試題庫刪除,得到練習(xí)試題庫。
具體的,分別提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中每個試題的數(shù)據(jù)特征,按順序?qū)⑺鱿嗨圃囶}集合中試題的數(shù)據(jù)特征分別與所述待查重試題的數(shù)據(jù)特征輸入預(yù)設(shè)決策樹模型中使用對應(yīng)的相似度算法計算相似度,根據(jù)相似度得到與所述待查重試題重復(fù)的試題。
具體的,如果所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征不包含數(shù)字和字母,使用Jaro Distance算法判斷所述相似試題集合中試題是否與所述待查重試題重復(fù),得到與所述待查重試題重復(fù)的試題。
如果所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征不包含數(shù)字,包含字母,使用Dice系數(shù)判斷所述相似試題集合中試題是否與所述待查重試題重復(fù),得到與所述待查重試題重復(fù)的試題。
如果所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征包含數(shù)字和漢字,且漢字的長度小于預(yù)設(shè)長度,提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征中的數(shù)字,使用最大公共子序列計算二者的第二相似度值,并且采用布爾模型和余弦定理計算二者的第三相似度值,根據(jù)所述第二相似度值和所述第三相似度值,得到與所述待查重試題重復(fù)的試題。
如果所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征包含數(shù)字、漢字和大寫字母,同時漢字的長度大于或等于所述預(yù)設(shè)長度,且大寫字母小于預(yù)設(shè)個數(shù),提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征中的數(shù)字,使用最大公共子序列計算二者的第四相似度值,并且采用Dice系數(shù)計算第五相似度值,根據(jù)所述第四相似度值和所述第五相似度值,得到與所述待查重試題重復(fù)的試題。
如果所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征包含數(shù)字、漢字和大寫字母,同時漢字的長度大于或等于所述預(yù)設(shè)長度,且大寫字母大于或等于預(yù)設(shè)個數(shù),提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征中的數(shù)字,使用最大公共子序列計算二者的第六相似度值,根據(jù)所述第六相似度值,得到與所述待查重試題重復(fù)的試題。
所述第一預(yù)設(shè)相似度值等于0.7;所述第二預(yù)設(shè)相似度值、第三預(yù)設(shè)相似度值、第四預(yù)設(shè)相似度值和第六預(yù)設(shè)相似度值均等于0.9;所述第五預(yù)設(shè)相似度值等于1。
另外,獲取用戶對所述練習(xí)試題庫中的試題的答復(fù)信息,并檢測所述答復(fù)信息是否與預(yù)設(shè)的該試題的試題答案一致,若一致,則將該試題從所述練習(xí)數(shù)據(jù)可中刪除并移動至備用試題庫;若不一致,則依然將該試題保存在所述練習(xí)試題庫中。
實施例二、一種試題數(shù)據(jù)處理系統(tǒng)。下面結(jié)合圖2對本實施例提供的系統(tǒng)進(jìn)行詳細(xì)說明。
圖2中,本實施例提供的一種試題數(shù)據(jù)處理系統(tǒng),所述系統(tǒng)包括匹配存儲單元、篩選單元、提取單元、計算單元、查重刪除單元以及檢測刪除單元。
匹配存儲單元,用于根據(jù)待測學(xué)科的考試大綱信息列表中包括的各知識點信息,在與所述待測學(xué)科對應(yīng)的試題庫中獲取與所述各知識點信息匹配的試題并存儲至待查重試題庫中。
具體的,所述匹配存儲單元,用于獲取與所述待測學(xué)科的各知識點信息對應(yīng)的試題存儲地址,并在與所述待測學(xué)科對應(yīng)的試題庫中所述試題存儲地址指向的存儲空間中獲取與所述各知識點信息對應(yīng)的試題。
篩選單元,用于按照預(yù)設(shè)規(guī)則從待查重試題庫中提取試題得到待查重試題,并從待查重試題庫中篩選出與所述待查重試題相似度超過預(yù)設(shè)值的試題集合,得到相似試題集合。
具體的,所述篩選單元,用于采用布爾模型和余弦定理分別計算出所述待查重試題庫中其他試題與所述待查重試題的第一相似度值,如果所述第一相似度值大于預(yù)設(shè)第一相似度值,則該試題與所述待查重試題相似度超過預(yù)設(shè)值,得到相似試題集合。所述預(yù)設(shè)規(guī)則包括遍歷算法,即:將題庫中序數(shù)為1的試題先和序數(shù)為2的試題相比較,判斷完成后繼續(xù)循環(huán)遍歷下去逐個比較。
提取單元,用于分別提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征。
具體的,所述數(shù)據(jù)特征具體包括數(shù)字、字母、漢字和漢字的長度。
計算單元,用于按順序分別采用相似度算法計算待查重試題的數(shù)據(jù)特征和相似試題集合中試題的數(shù)據(jù)特征的相似度,根據(jù)相似度得到與所述待查重試題重復(fù)的試題。
具體的,所述計算單元具體用于如果所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征不包含數(shù)字和字母,使用Jaro Distance算法判斷所述相似試題集合中試題是否與所述待查重試題重復(fù),得到與所述待查重試題重復(fù)的試題;如果所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征不包含數(shù)字,包含字母,使用Dice系數(shù)判斷所述相似試題集合中試題是否與所述待查重試題重復(fù),得到與所述待查重試題重復(fù)的試題;如果所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征包含數(shù)字和漢字,且漢字的長度小于預(yù)設(shè)長度,提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征中的數(shù)字,使用最大公共子序列計算二者的第二相似度值,并且采用布爾模型和余弦定理計算二者的第三相似度值,根據(jù)所述第二相似度值和所述第三相似度值,得到與所述待查重試題重復(fù)的試題;如果所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征包含數(shù)字、漢字和大寫字母,同時漢字的長度大于或等于所述預(yù)設(shè)長度,且大寫字母小于預(yù)設(shè)個數(shù),提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征中的數(shù)字,使用最大公共子序列計算二者的第四相似度值,并且采用Dice系數(shù)計算第五相似度值,根據(jù)所述第四相似度值和所述第五相似度值,得到與所述待查重試題重復(fù)的試題;如果所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征包含數(shù)字、漢字和大寫字母,同時漢字的長度大于或等于所述預(yù)設(shè)長度,且大寫字母大于或等于預(yù)設(shè)個數(shù),提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征中的數(shù)字,使用最大公共子序列計算二者的第六相似度值,根據(jù)所述第六相似度值,得到與所述待查重試題重復(fù)的試題。
查重刪除單元,用于將與所述待查重試題重復(fù)的試題從所述待查重試題庫刪除,得到練習(xí)試題庫。
檢測刪除單元,用于獲取用戶對所述練習(xí)試題庫中的試題的答復(fù)信息,并檢測所述答復(fù)信息是否與預(yù)設(shè)的該試題的試題答案一致,若一致,則將該試題從所述練習(xí)數(shù)據(jù)可中刪除并移動至備用試題庫;若不一致,則依然將該試題保存在所述練習(xí)試題庫中。
本發(fā)明提供的一種試題數(shù)據(jù)處理方法及系統(tǒng),能夠按照考試大綱信息得到對應(yīng)的試題,并能對試題進(jìn)行查重,刪除重復(fù)的試題,得到練習(xí)試題庫。本發(fā)明能夠針對考試大綱得到試題信息,并對試題進(jìn)行查重,便于學(xué)生有效的針對考試進(jìn)行練習(xí),且不會重復(fù)做題,提高了練習(xí)質(zhì)量,并能夠針對學(xué)生的情況,學(xué)生掌握之后的知識點對應(yīng)的試題不再出現(xiàn),根據(jù)學(xué)生的情況進(jìn)行出題,避免重復(fù)做題。
以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。