本發(fā)明屬于人工智能與教育交叉的,具體涉及一種基于在線學習平臺過程數(shù)據(jù)成績預測裝置及方法。
背景技術:
1、隨著互聯(lián)網(wǎng)技術的快速發(fā)展,在線學習已成為越來越多人獲取知識、提升能力的重要途徑。然而,由于在線學習的自主性和靈活性,學生容易受到各種因素的影響,導致學習效果不佳。因此,如何利用在線學習過程數(shù)據(jù)預測學生的學習成績。發(fā)現(xiàn)問題并采取有效措施,成為教育領域亟待解決的問題。
2、在線教育平臺和系統(tǒng)的普及使得學生可以在任何時間、任何地點進行學習,這種靈活的學習方式使得學習的自主性越來越高,在線學習方式也受到了廣泛的歡迎。然而,隨著在線學習的普及,如何保證學習質(zhì)量和效率成為了一個關鍵問題。傳統(tǒng)的教育模式中,教師可以通過觀察學生的課堂表現(xiàn)、作業(yè)完成情況和考試結果來評估學生的學習狀況,但在線學習中,教師與學生之間的直接互動減少,這使得評估學生的學習狀態(tài)和預測學習成績變得更加困難。
3、為了解決這一問題,研究者們開始探索利用在線學習過程中產(chǎn)生的數(shù)據(jù)來預測學生的學習成績。這些數(shù)據(jù)包括但不限于在線課堂簽到情況、視頻觀看次數(shù)和時長、論壇參與度、作業(yè)提交情況和測試成績等。通過對這些數(shù)據(jù)的分析,可以揭示學生的學習習慣、參與度和學習效果,從而為教師提供評估學生學習狀況的依據(jù),為學生提供個性化的學習建議和幫助。
4、現(xiàn)有的學習成績預測方法多基于傳統(tǒng)的機器學習技術,如決策樹、隨機森林、支持向量機等。這些方法通常將學習過程數(shù)據(jù)作為特征輸入到模型中,通過訓練得到一個預測模型,用于預測學生的學習成績。然而,這些方法往往忽略了學習過程數(shù)據(jù)中的時間序列特性,即學生學習行為隨時間的變化規(guī)律。
5、此外,現(xiàn)有的方法通常將多維度的學習過程數(shù)據(jù)直接輸入到模型中,忽略了數(shù)據(jù)之間的內(nèi)在聯(lián)系和結構。這使得模型難以捕捉到數(shù)據(jù)中的復雜關系,從而影響了預測的準確性和可靠性。
技術實現(xiàn)思路
1、針對現(xiàn)有技術的以上缺陷或改進需求,本發(fā)明提供了一種基于在線學習平臺過程數(shù)據(jù)成績預測裝置及方法,其核心在于將學生的學習行為數(shù)據(jù)轉(zhuǎn)化為圖像數(shù)據(jù),并利用圖像處理和分類技術來預測學生的學習成績;該方法通過構建多維度的時序數(shù)據(jù),將一維時序數(shù)據(jù)轉(zhuǎn)換為二維圖像數(shù)據(jù),并對圖像進行分類來進行成績預測。這種方法能夠更好地捕捉學習過程數(shù)據(jù)中的時間序列特性和多維數(shù)據(jù)之間的關系,從而提高學習成績預測的準確性和可靠性。
2、具體技術方案如下:
3、一種基于在線學習平臺過程數(shù)據(jù)成績預測裝置,包括:
4、(1)數(shù)據(jù)收集模塊:從在線學習平臺中收集學生的學習行為數(shù)據(jù),包括在線課堂簽到情況、視頻觀看次數(shù)和時長、論壇參與度、作業(yè)提交情況和測試成績、視頻觀看過程數(shù)據(jù)(包含動作、動作對應的視頻時間點、動作發(fā)生的具體時間)等;
5、(2)數(shù)據(jù)預處理模塊:對收集到的數(shù)據(jù)進行清洗和格式化處理,剔除無效數(shù)據(jù),統(tǒng)一數(shù)據(jù)格式,確保數(shù)據(jù)的質(zhì)量和一致性;
6、(3)時序數(shù)據(jù)構建模塊:將預處理后的數(shù)據(jù)按照時間順序構建成時序數(shù)據(jù),每個學生的一組學習行為數(shù)據(jù)形成一個時間序列,每個視頻的觀看動作、動作對應的視頻時間點、動作發(fā)生的具體時間分別形成一個時序序列;
7、(4)數(shù)據(jù)轉(zhuǎn)換模塊:將一維的時序數(shù)據(jù)轉(zhuǎn)換為二維的圖像數(shù)據(jù),采用一維時序數(shù)據(jù)二維化的方法,將時序數(shù)據(jù)轉(zhuǎn)換為二維圖像數(shù)據(jù),并生成圖像數(shù)據(jù)集;
8、(5)圖像融合模塊;將之前生成的多個表征不同行為特征的圖像進行拼接;
9、(6)圖像分類模塊:利用構建的圖像數(shù)據(jù)集中的訓練集對學業(yè)成績分類網(wǎng)絡進行訓練,提取數(shù)據(jù)的多維度特征和數(shù)據(jù)之間的關聯(lián)信息,并結合深度學習網(wǎng)絡結構中各模塊的獨特優(yōu)勢,以實現(xiàn)對數(shù)據(jù)的精確分析和分類,得到學習成績的預測結果;
10、(7)反饋模塊:根據(jù)學習成績的預測結果,為學生提供個性化的學習建議。
11、一種基于在線學習平臺過程數(shù)據(jù)成績預測方法,包括:
12、(1)數(shù)據(jù)收集:從在線學習平臺中收集學生的學習行為數(shù)據(jù),包括在線課堂簽到情況、視頻觀看次數(shù)和時長、論壇參與度、作業(yè)提交情況和測試成績、視頻觀看過程數(shù)據(jù)(包含動作、動作對應的視頻時間點、動作發(fā)生的具體時間)等;
13、(2)數(shù)據(jù)預處理,對收集到的數(shù)據(jù)進行清洗和格式化處理,剔除無效數(shù)據(jù),統(tǒng)一數(shù)據(jù)格式,確保數(shù)據(jù)的質(zhì)量和一致性;
14、(3)構建時序數(shù)據(jù):將預處理后的數(shù)據(jù)按照時間順序構建成時序數(shù)據(jù),每個學生的一組學習行為數(shù)據(jù)形成一個時間序列;
15、(4)數(shù)據(jù)轉(zhuǎn)換;將一維的時序數(shù)據(jù)轉(zhuǎn)換為二維的圖像數(shù)據(jù),采用一維時序數(shù)據(jù)二維化的方法,將時序數(shù)據(jù)轉(zhuǎn)換為二維圖像數(shù)據(jù),并生成圖像數(shù)據(jù)集;圖像化的方法包括但不限于格拉姆角場法(gaf)、馬爾科夫轉(zhuǎn)移場法(mtf)和基于像素填充的圖像化方法。
16、(5)圖像融合:將之前生成的多個表征不同行為特征的圖像進行拼接。
17、(6)圖像分類;利用構建的圖像數(shù)據(jù)集中的訓練集對學業(yè)成績分類網(wǎng)絡進行訓練,提取數(shù)據(jù)的多維度特征和數(shù)據(jù)之間的關聯(lián)信息,并結合深度學習網(wǎng)絡結構中各模塊的獨特優(yōu)勢,以實現(xiàn)對數(shù)據(jù)的精確分析和分類,得到學習成績的預測結果;
18、(7)反饋:根據(jù)學習成績的預測結果,為學生提供個性化的學習建議。
19、進一步的,所述數(shù)據(jù)收集模塊收集學習行為數(shù)據(jù)包括如下步驟:
20、(11)確定在線學習平臺的api或數(shù)據(jù)庫接口;
21、(12)收集學生的學習行為數(shù)據(jù):通過在線學習平臺的api或數(shù)據(jù)庫接口,自動收集學生的學習行為數(shù)據(jù),包括在線課堂簽到情況、視頻觀看次數(shù)和時長、論壇參與度、作業(yè)提交情況和測試成績、視頻觀看過程數(shù)據(jù)(包含動作、動作對應的視頻時間點、動作發(fā)生的具體時間);
22、(13)將這些數(shù)據(jù)存儲到數(shù)據(jù)倉庫中:將這些數(shù)據(jù)存儲到數(shù)據(jù)倉庫中,以便后續(xù)的數(shù)據(jù)預處理和分析。
23、進一步的,數(shù)據(jù)預處理模塊的工作過程包括如下步驟:
24、(21)對收集到的原始數(shù)據(jù)進行清洗:去除空值、異常值和重復數(shù)據(jù);
25、(22)對數(shù)據(jù)進行歸一化處理:將數(shù)據(jù)轉(zhuǎn)換為相同的尺度,以便后續(xù)的分析和建模;
26、(23)對時間序列數(shù)據(jù)進行填充和處理缺失值,以確保數(shù)據(jù)的完整性和連續(xù)性;
27、(24)根據(jù)需要對數(shù)據(jù)進行特征工程:提取有助于學習成績預測的關鍵特征。
28、進一步的,時序數(shù)據(jù)構建模塊構建時序數(shù)據(jù),包括如下步驟:
29、(31)將預處理后的數(shù)據(jù)按照時間順序構建成時序數(shù)據(jù);
30、(32)按照時間順序?qū)υ诰€課堂簽到情況、視頻觀看次數(shù)和時長、論壇參與度、作業(yè)提交情況和測試成績、每個視頻觀看過程數(shù)據(jù)(包含動作、動作對應的視頻時間點、動作發(fā)生的具體時間)分別進行處理,構成多個學習行為數(shù)據(jù)集,按照課程-學生-學習行為數(shù)據(jù)的樹形結構,整理好原始數(shù)據(jù)集;對于在線課堂簽到情況,按照時間順序,以1和0代表是否簽到構建時序數(shù)據(jù)集;對于觀看視頻的次數(shù)和時長,以數(shù)值的形式表征各個時點發(fā)生的動作;對于論壇參與度,以課程中的每次課為單位統(tǒng)計論壇發(fā)帖數(shù)量,以便后續(xù)構建時序數(shù)據(jù);對于作業(yè)提交情況和測試成績,按照時間順序排列作業(yè)和測試成績,將數(shù)據(jù)歸一化,以便后續(xù)構建時序數(shù)據(jù);對于視頻觀看動作,定義1,2,3,4分別表示播放、暫停、跳轉(zhuǎn)、完成四個動作,處理視頻觀看動作、動作對應的視頻時間點、動作發(fā)生的具體時間這三個特征信息,并對每個視頻的三個維度特征構建時序數(shù)據(jù)集。
31、(33)將每個學生的學習行為數(shù)據(jù)聚合到相應的時間粒度上,形成時間序列數(shù)據(jù)。
32、進一步的,數(shù)據(jù)轉(zhuǎn)換模塊,其工作過程包括如下步驟:
33、(41)使用格拉姆角場法(gaf)對在線課堂簽到情況、視頻觀看次數(shù)和時長、論壇參與度、作業(yè)提交情況和測試成績這六個維度的學習行為時序數(shù)據(jù)進行數(shù)據(jù)轉(zhuǎn)換,形成兩個32×32×3(w×h×c)三通道的時序圖像,將以上兩個圖像拼接成一個64×32×3(w×h×c)三通道的時序圖像一。
34、(42)從每個視頻觀看過程數(shù)據(jù)(包含動作、動作對應的視頻時間點、動作發(fā)生的具體時間)中提取三個關鍵維度的信息:將這些信息填充到三通道圖像中,三通道指的是圖像有三個顏色通道,通常是rgb模式,其中r代表紅色,g代表綠色,b代表藍色;
35、(43)對每個視頻觀看過程數(shù)據(jù)(包含動作、動作對應的視頻時間點、動作發(fā)生的具體時間)三個序列進行量化和歸一化:然后對三個序列進行量化和歸一化使其范圍都在0到255這個區(qū)間內(nèi),方便后續(xù)的像素填充;
36、(44)填充和裁剪數(shù)據(jù):為了能夠準確存儲信息且不丟失太多信息,將三組序列數(shù)據(jù)通過填充和裁剪的方式使長度統(tǒng)一為64,這一步驟確保了所有序列數(shù)據(jù)在長度上的對齊;
37、(45)轉(zhuǎn)換為三通道的圖像:最后通過像素填充的方式,將每個視頻觀看過程數(shù)據(jù)(包含動作、動作對應的視頻時間點、動作發(fā)生的具體時間)這三組序列數(shù)據(jù)轉(zhuǎn)換為一個三通道的圖像,得到單個視頻學習數(shù)據(jù)對應的圖像尺寸為64×1×3(w×h×c),選取最多為32個的視頻觀看時序圖像數(shù)據(jù)拼接成一個64×32×3(w×h×c)的時序圖像,不足32個的數(shù)據(jù)則用空白補齊,這樣就得到了視頻觀看過程數(shù)據(jù)(包含動作、動作對應的視頻時間點、動作發(fā)生的具體時間)的三通道圖像二。
38、進一步的,圖像融合模塊,其工作過程包括如下步驟:
39、將時序圖像一和時序圖像二進行拼接,這樣就得到了一個圖像尺寸為64×64×3(w×h×c)的,包含在線課堂簽到情況、視頻觀看次數(shù)和時長、論壇參與度、作業(yè)提交情況和測試成績、視頻觀看過程數(shù)據(jù)(包含動作、動作對應的視頻時間點、動作發(fā)生的具體時間)的三通道總圖像。
40、進一步的,圖像分類模塊,其工作過程包括如下步驟:
41、(61)采用深度學習或其他圖像分類算法對處理后的圖像進行分類:輸入的圖像數(shù)據(jù)經(jīng)過self?attention?model模塊的殘差連接模塊和channel?attention?model模塊的殘差連接模塊進行注意力機制的提取后,再輸入到一個transformer?model中進行特征提取,最后經(jīng)過分類器分類后得到成績預測的結果。
42、在self-attention?model模塊中,第一步,生成查詢(query)、鍵(key)和值(value),對于輸入圖像中的每個像素,通過可學習的權重矩陣wq、wk和wv分別生成對應的query、key和value向量,計算公式如公式1所示:
43、q=xwq,k=xwk,v=xwv??(公式1)
44、其中,x是輸入圖像的像素值,q、k和v分別代表查詢、鍵和值。
45、第二步,注意力權重的計算:計算每個查詢向量q與所有鍵向量k之間的相似度,并通過softmax函數(shù)歸一化,得到注意力權重,計算公式如公式2所示。
46、
47、其中dk是鍵向量的維度,用于縮放點積,避免梯度消失問題。
48、第三步,輸出計算:歸一化的權重與值向量相乘,得到加權求和的輸出,即注意力值,計算公式如公式3所示。
49、attention(q,k,v)=weight?ts·v??(公式3)
50、attention(q,k,v)可以被視為輸入序列的新表示,其中包含了每個元素相對于整個序列的重要性信息。
51、數(shù)據(jù)在進入channel-attention模塊之前,會先通過一個殘差連接模塊,計算公式如公式4所示。
52、
53、channel?attention?model模塊分為兩個部分,壓縮通道特征和特征重標定:
54、壓縮通道特征的計算公式如公式5所示,x代表輸入的特征圖,c1dc表示核大小為c的一維卷積。
55、z=σ(c1dc(x))??公式5)
56、特征重標定通常通過一個簡單的逐元素乘法操作來實現(xiàn),即每個通道的值乘以相應的注意力權重。經(jīng)過壓縮通道特征后,還需要和原特征圖x進行合并,就是把這個向量直接與原特征圖相乘,如公式6所示。
57、f(z,x)=zx??(公式6)
58、經(jīng)過channel-attention模塊處理后的數(shù)據(jù)在輸入transformer模塊之前要經(jīng)過一次殘差連接,如公式7所示。
59、
60、最后,經(jīng)過transformer?model進行特征提取和分類器進行分類后的預測結果分為優(yōu)秀、良好、中等、及格和不及格五類。
61、(62)使用訓練數(shù)據(jù)集對分類模型進行訓練,直到模型達到滿意的準確率;
62、(63)使用驗證數(shù)據(jù)集對模型進行驗證,調(diào)整模型參數(shù),以提高模型的泛化能力;
63、(64)使用訓練好的模型對新的學生圖像數(shù)據(jù)進行預測,得到學習成績的預測結果。
64、進一步的,反饋模塊,其實現(xiàn)步驟如下:
65、(71)根據(jù)學習成績的預測結果,為學生提供個性化的學習建議;
66、(72)將學習成績的預測結果反饋給教師和教育機構,以便他們更好地了解學生的學習狀況,提供更有效的教育服務。
67、本發(fā)明提供一種電子設備,所述電子設備包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器運行所述計算機程序時,執(zhí)行上面所述的一種基于在線學習平臺過程數(shù)據(jù)成績預測方法的步驟。
68、本發(fā)明提供一種計算機可讀存儲介質(zhì),其存儲計算機程序,所述計算機程序使得計算機可讀存儲介質(zhì)執(zhí)行上面所述的一種基于在線學習平臺過程數(shù)據(jù)成績預測方法的步驟。
69、本發(fā)明提供一種計算機程序產(chǎn)品,包括計算機程序,該計算機程序被處理器執(zhí)行時實現(xiàn)上面所述的一種基于在線學習平臺過程數(shù)據(jù)成績預測方法的步驟。
70、本發(fā)明具有如下有益技術效果:
71、1、本發(fā)明所述的一種基于在線學習平臺過程數(shù)據(jù)成績預測裝置及方法,通過將在線學習過程數(shù)據(jù)轉(zhuǎn)換為圖像數(shù)據(jù),并結合圖像處理和分類技術,本發(fā)明能夠更準確地預測學生的學習成績。這種基于圖像的分類方法能夠捕捉到學習行為數(shù)據(jù)中的復雜模式和特征,從而提高學習成績預測的準確性和可靠性。
72、2、本發(fā)明所述的一種基于在線學習平臺過程數(shù)據(jù)成績預測裝置及方法,采用了多維度的時序數(shù)據(jù)構建方法,能夠全面地考慮學生的學習行為隨時間的變化規(guī)律。通過將不同維度的學習行為數(shù)據(jù)映射到圖像中,可以更好地觀察到學習行為之間的關聯(lián)和趨勢,為學習成績預測提供了更豐富的信息。
73、3、本發(fā)明所述的一種基于在線學習平臺過程數(shù)據(jù)成績預測裝置及方法,提供了個性化的學習建議和指導。通過預測學生的學習成績,可以根據(jù)學生的具體情況提供個性化的學習建議,幫助學生識別自身的優(yōu)勢和不足,并針對性地進行學習計劃的調(diào)整和改進,從而提高學習效果。
74、4、本發(fā)明所述的一種基于在線學習平臺過程數(shù)據(jù)成績預測裝置及方法,可廣泛應用于各類在線學習平臺和系統(tǒng)。無論是高等教育、職業(yè)教育還是終身學習,本發(fā)明的方法都可以為教育者提供有價值的參考,幫助改善教學質(zhì)量和學習效果,提升在線教育的整體水平。
75、5、本發(fā)明所述的一種基于在線學習平臺過程數(shù)據(jù)成績預測裝置及方法,具有較好的實用性和可行性。通過收集在線學習平臺上的學習行為數(shù)據(jù),結合圖像處理和分類技術,本發(fā)明提供了一種高效、準確的學習成績預測方法。同時,該方法具有良好的擴展性,可以結合其他類型的數(shù)據(jù)和更先進的圖像處理技術,進一步提高學習成績預測的準確性和可靠性。