1.一種試題數(shù)據(jù)處理方法,其特征在于,所述方法包括:
S101、根據(jù)待測學科的考試大綱信息列表中包括的各知識點信息,在與所述待測學科對應(yīng)的試題庫中獲取與所述各知識點信息匹配的試題并存儲至待查重試題庫中;
S102、按照預設(shè)規(guī)則從待查重試題庫中提取試題得到待查重試題,并從待查重試題庫中篩選出與所述待查重試題相似度超過預設(shè)值的試題集合,得到相似試題集合;
S103、分別提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征;
S104、按順序分別采用相似度算法計算待查重試題的數(shù)據(jù)特征和相似試題集合中試題的數(shù)據(jù)特征的相似度,根據(jù)相似度得到與所述待查重試題重復的試題,并將其從所述待查重試題庫刪除,得到練習試題庫。
2.如權(quán)利要求1所述的一種試題數(shù)據(jù)處理方法,其特征在于,所述S101具體包括:
獲取與所述待測學科的各知識點信息對應(yīng)的試題存儲地址,并在與所述待測學科對應(yīng)的試題庫中所述試題存儲地址指向的存儲空間中獲取與所述各知識點信息對應(yīng)的試題。
3.如權(quán)利要求1所述的一種試題數(shù)據(jù)處理方法,其特征在于,所述S102具體包括:
采用布爾模型和余弦定理分別計算出所述待查重試題庫中其他試題與所述待查重試題的第一相似度值,如果所述第一相似度值大于預設(shè)第一相似度值,則該試題與所述待查重試題相似度超過預設(shè)值,得到相似試題集合。
4.如權(quán)利要求1所述的一種試題數(shù)據(jù)處理方法,其特征在于,所述S103中所述數(shù)據(jù)特征具體包括數(shù)字、字母、漢字和漢字的長度。
5.如權(quán)利要求1所述的一種試題數(shù)據(jù)處理方法,其特征在于,所述S104之后還包括:
獲取用戶對所述練習試題庫中的試題的答復信息,并檢測所述答復信息是否與預設(shè)的該試題的試題答案一致,若一致,則將該試題從所述練習數(shù)據(jù)可中刪除并移動至備用試題庫;若不一致,則依然將該試題保存在所述練習試題庫中。
6.一種試題數(shù)據(jù)處理系統(tǒng),其特征在于,所述系統(tǒng)包括:
匹配存儲單元,用于根據(jù)待測學科的考試大綱信息列表中包括的各知識點信息,在與所述待測學科對應(yīng)的試題庫中獲取與所述各知識點信息匹配的試題并存儲至待查重試題庫中;
篩選單元,用于按照預設(shè)規(guī)則從待查重試題庫中提取試題得到待查重試題,并從待查重試題庫中篩選出與所述待查重試題相似度超過預設(shè)值的試題集合,得到相似試題集合;
提取單元,用于分別提取所述待查重試題的數(shù)據(jù)特征和所述相似試題集合中試題的數(shù)據(jù)特征;
計算單元,用于按順序分別采用相似度算法計算待查重試題的數(shù)據(jù)特征和相似試題集合中試題的數(shù)據(jù)特征的相似度,根據(jù)相似度得到與所述待查重試題重復的試題;
查重刪除單元,用于將與所述待查重試題重復的試題從所述待查重試題庫刪除,得到練習試題庫。
7.如權(quán)利要求6所述的一種試題數(shù)據(jù)處理系統(tǒng),其特征在于,所述匹配存儲單元具體用于:
獲取與所述待測學科的各知識點信息對應(yīng)的試題存儲地址,并在與所述待測學科對應(yīng)的試題庫中所述試題存儲地址指向的存儲空間中獲取與所述各知識點信息對應(yīng)的試題。
8.如權(quán)利要求6所述的一種試題數(shù)據(jù)處理系統(tǒng),其特征在于,所述篩選單元具體用于:
采用布爾模型和余弦定理分別計算出所述待查重試題庫中其他試題與所述待查重試題的第一相似度值,如果所述第一相似度值大于預設(shè)第一相似度值,則該試題與所述待查重試題相似度超過預設(shè)值,得到相似試題集合。
9.如權(quán)利要求6所述的一種試題數(shù)據(jù)處理系統(tǒng),其特征在于,所述提取單元中所述數(shù)據(jù)特征具體包括數(shù)字、字母、漢字和漢字的長度。
10.如權(quán)利要求6所述的一種試題數(shù)據(jù)處理系統(tǒng),其特征在于,還包括:
檢測刪除單元,用于獲取用戶對所述練習試題庫中的試題的答復信息,并檢測所述答復信息是否與預設(shè)的該試題的試題答案一致,若一致,則將該試題從所述練習數(shù)據(jù)可中刪除并移動至備用試題庫;若不一致,則依然將該試題保存在所述練習試題庫中。