欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種數(shù)字教育資源推薦方法及系統(tǒng)的制作方法

文檔序號(hào):10512295閱讀:294來(lái)源:國(guó)知局
一種數(shù)字教育資源推薦方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明公開了一種數(shù)字教育資源推薦方法,其特征在于,包括以下步驟:(1)提取教育資源的文本信息;(2)將文本信息數(shù)字化處理,得到文本數(shù)字矩陣;(3)將文本數(shù)字矩陣輸入預(yù)訓(xùn)練得到的資源特征識(shí)別器,資源特征識(shí)別器輸出教育資源特征向量;(4)將教育資源特征向量與用戶特征向量相乘,得到學(xué)生對(duì)教育資源的興趣度。本發(fā)明從資源文本信息中提取教育資源特征,并結(jié)合學(xué)生特征判定學(xué)生對(duì)資源的興趣度,任何只要有部分文字說(shuō)明的資源均可適用該方法,適用面廣,推薦滿意度高。
【專利說(shuō)明】
一種數(shù)字教育資源推薦方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及教育信息化領(lǐng)域,尤其涉及一種數(shù)字教育資源推薦方法及系統(tǒng)。
【背景技術(shù)】
[0002] 近十年來(lái),互聯(lián)網(wǎng)規(guī)模和覆蓋面的迅速增長(zhǎng)帶來(lái)了信息超載的問題,為了解決這 個(gè)問題推薦系統(tǒng)變得流行起來(lái)。推薦系統(tǒng)被用于很多場(chǎng)景,例如:電影、音樂、新聞、研究論 文等。在基于教育云的在線教育領(lǐng)域也采取了推薦系統(tǒng)去使得學(xué)生提升學(xué)習(xí)效率和體驗(yàn) 度,并為學(xué)生提供個(gè)性化的學(xué)習(xí)服務(wù)。
[0003] 目前,實(shí)現(xiàn)推薦系統(tǒng)的方法有很多,這些方法主要可分為兩大類:協(xié)同過(guò)濾方法和 基于內(nèi)容的推薦方法。協(xié)同過(guò)濾的基本思想是:找到與當(dāng)前用戶相似(比如興趣和口味相 似)的其他用戶,并結(jié)合相似用戶的評(píng)價(jià)記錄進(jìn)行推薦,在日常生活中,我們往往會(huì)利用好 朋友的推薦來(lái)進(jìn)行一些選擇。協(xié)同過(guò)濾正是把這一思想運(yùn)用到推薦系統(tǒng)中來(lái)。但是協(xié)同過(guò) 濾容易陷入"冷啟動(dòng)"問題,在面對(duì)新資源或者冷門資源時(shí)不能正常工作?;趦?nèi)容的推薦 是指根據(jù)用戶選擇的對(duì)象,推薦其他類似屬性的對(duì)象作為推薦。這一推薦策略首先提取推 薦對(duì)象的內(nèi)容特征,和用戶模型中的用戶興趣偏好匹配,匹配度較高的推薦對(duì)象就可作為 推薦結(jié)果推薦給用戶,但是構(gòu)建資源的內(nèi)容特征往往需要大量的人工參與,并且很難得到 合適的特征。

【發(fā)明內(nèi)容】

[0004] 針對(duì)現(xiàn)有技術(shù)中的缺陷,本發(fā)明的技術(shù)目的在于提供一種數(shù)字教育資源推薦方法 及系統(tǒng),從資源文本信息中提取教育資源特征,并結(jié)合學(xué)生特征判定學(xué)生對(duì)資源的興趣度, 任何只要有部分文字說(shuō)明的資源均可適用該方法,適用面廣,推薦滿意度高。
[0005] -種數(shù)字教育資源推薦方法,包括以下步驟:
[0006] (1)提取教育資源的文本信息;
[0007] (2)將文本信息數(shù)字化處理,得到文本數(shù)字矩陣;
[0008] (3)將文本數(shù)字矩陣輸入預(yù)訓(xùn)練得到的資源特征識(shí)別器,資源特征識(shí)別器輸出教 育資源特征向量;
[0009] (4)將教育資源特征向量與用戶特征向量相乘,得到學(xué)生對(duì)教育資源的興趣度。
[0010] 進(jìn)一步地,所述步驟(4)中的用戶特征向量按照如下方式確定:
[0011] 初始化用戶特征矩陣U,用戶特征矩陣U中的行表示用戶,列表示影響用戶興趣度 的隱含因子,記表示用戶特征矩陣U的第i行用戶特征向量;
[0012] 初始化資源特征矩陣V,資源特征矩陣V中的行表示教育資源,列表示影響用戶興 趣度的隱含因子,記f表示特征資源矩陣V的第j行資源特征向量;
[0013] 確定用戶-資源矩陣,用戶-資源矩陣中的元素〇」表示用戶i對(duì)資源j的興趣度分 值;
[0014]
為目標(biāo)函數(shù),計(jì)算確定用戶特征向量和特征資源向 量Κ/:,其中上標(biāo)τ表示轉(zhuǎn)置。
[0015] 進(jìn)一步地,所述步驟(2)將文本信息數(shù)字化處理得到文本信息矩陣的具體實(shí)現(xiàn)過(guò) 程為:對(duì)文本信息進(jìn)行分詞處理,將所得的每一個(gè)詞采用向量表示,各詞向量組成為文本數(shù) 字矩陣。
[0016] 進(jìn)一步地,采用選擇話題模型或分布式表達(dá)模型作為語(yǔ)言模型,將所得的每一個(gè) 詞采用向量表示。
[0017] 進(jìn)一步地,所述資源特征識(shí)別器采用卷積神經(jīng)網(wǎng)絡(luò)、時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng) 網(wǎng)絡(luò)中的任意一種訓(xùn)練得到。
[0018] -種數(shù)字教育資源推薦系統(tǒng),包括以下模塊:
[0019] 第一模塊,用于提取教育資源的文本信息;
[0020] 第二模塊,用于將文本信息數(shù)字化處理,得到文本數(shù)字矩陣;
[0021] 第三模塊,用于將文本數(shù)字矩陣輸入預(yù)訓(xùn)練得到的資源特征識(shí)別器,資源特征識(shí) 別器輸出教育資源特征向量;
[0022] 第四模塊,用于將教育資源特征向量與用戶特征向量相乘,得到學(xué)生對(duì)教育資源 的興趣度。
[0023]進(jìn)一步地,所述第四模塊包括:
[0024]第四一子模塊,用于初始化用戶特征矩陣U,用戶特征矩陣U中的行表示用戶,列表 示影響用戶興趣度的隱含因子,記q4表示用戶特征矩陣U的第i行用戶特征向量;
[0025] 第四二子模塊,用于初始化資源特征矩陣V,資源特征矩陣V中的行表示教育資源, 列表示影響用戶興趣度的隱含因子,記f表示特征資源矩陣V的第j行資源特征向量;
[0026] 第四三子模塊,用于確定用戶-資源矩陣,用戶-資源矩陣中的元素rij表示用戶i對(duì) 資源j的興趣度分值;
[0027] 第四四子模塊,
為目標(biāo)函數(shù),計(jì)算確定用戶特征向 量和特征資源向量巧,其中上標(biāo)T表示轉(zhuǎn)置。
[0028]本發(fā)明的技術(shù)效果體現(xiàn)在:
[0029]在云教育環(huán)境下,產(chǎn)生了大量的學(xué)習(xí)資源,使得學(xué)生難以在其環(huán)境中找到合適的、 有幫助的學(xué)習(xí)資源,陷入"資源迷航"的困境中,而本發(fā)明教育資源推薦方法則是破除這一 困境的有效方法。相對(duì)于傳統(tǒng)的推薦方法,本發(fā)明能夠直接利用資源文本信息,預(yù)估其特征 值,結(jié)合學(xué)生特征直接做出推薦。高效地利用了資源文本信息,任何只要有部分文字說(shuō)明的 資源均可適用該方法,適用面廣。試驗(yàn)表明,推薦結(jié)果用戶滿意度高,克服了傳統(tǒng)推薦方法 中的"冷啟動(dòng)"問題。
【附圖說(shuō)明】
[0030]圖1是本發(fā)明方法流程圖;
[0031]圖2是卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)造;
[0032] 圖3是卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練示意圖;
[0033] 圖4是訓(xùn)練隱含因子模型的流程圖。
【具體實(shí)施方式】
[0034]為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對(duì) 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并 不用于限定本發(fā)明。此外,下面所描述的本發(fā)明各個(gè)實(shí)施方式中所涉及到的技術(shù)特征只要 彼此之間未構(gòu)成沖突就可以相互組合。
[0035]請(qǐng)參考圖1,本發(fā)明提供了一種數(shù)字教育資源推薦方法,包括以下步驟:
[0036]步驟1,提取教育資源的文本信息。
[0037]所述教育資源可以是譬如WorcUText的文本、網(wǎng)頁(yè)、音頻、視頻、PPT等各種類型。如 果是文本資源,可以直接提取文本全文內(nèi)容或部分資源文字簡(jiǎn)介,如果是文本以外的資源, 則提取資源文字簡(jiǎn)介。
[0038]步驟2,文本信息數(shù)字化。
[0039] 將提取的文本信息進(jìn)行分詞處理,按照分詞前的次序,形成一個(gè)有序的詞序列。使 用語(yǔ)言模型將每個(gè)詞用對(duì)應(yīng)的向量表示,結(jié)合之前生成的詞序列,形成一個(gè)矩陣來(lái)表示原 文本信息。
[0040] 分詞處理采用的語(yǔ)言模型要單獨(dú)訓(xùn)練,訓(xùn)練資源推薦為大規(guī)模語(yǔ)料庫(kù)。可以采取 詞語(yǔ)的話題模型或者分布式表達(dá)模型作為語(yǔ)言模型。
[0041]如果選擇話題模型,則將一個(gè)詞表示成為多個(gè)話題上的從屬概率(向量),訓(xùn)練方 法為L(zhǎng)DA(見文南犬:D.M.Blei,A.Y.Ng, and Μ· I .Jordan,''Latent dirichlet allocation, the Journal of machine Learning research,vol·3,pp·993-1022,2003·)〇 [0042] 如果選擇分布式表達(dá)模型,則將一個(gè)詞語(yǔ)表不成為一個(gè)向量,訓(xùn)練方法為CB0W或 ^Skip-Gram( :T.Mikolov,I.Sutskever,K.Chen,G.S. Corrado , and J · Dean, 〃 Distributed representations of words and phrases and their compositionality,^ in Advances in neural information processing systems,2013,pp·3111-3119·)〇
[0043] 步驟3,將文本數(shù)字矩陣輸入預(yù)訓(xùn)練得到的資源特征識(shí)別器,資源特征識(shí)別器輸出 教育資源特征向量。
[0044] 所述資源特征識(shí)別器采用卷積神經(jīng)網(wǎng)絡(luò)、時(shí)間遞歸(LSTM)神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng) 絡(luò)或其他深度學(xué)習(xí)模型中的任意一種訓(xùn)練得到。下面以卷積神經(jīng)網(wǎng)絡(luò)為例詳細(xì)說(shuō)明訓(xùn)練過(guò) 程。
[0045] 卷積神經(jīng)網(wǎng)絡(luò)作為近期在人工智能領(lǐng)域取得巨大成功的模型,本發(fā)明將其引入作 為推薦模型,其示意圖請(qǐng)見圖2。其作用方法為:將文本數(shù)字?jǐn)?shù)據(jù)作為輸入,結(jié)合訓(xùn)練的卷積 神經(jīng)網(wǎng)絡(luò)模型,通過(guò)神經(jīng)網(wǎng)絡(luò)的正向傳播,得到對(duì)應(yīng)的學(xué)習(xí)資源特征向量
[0046] 其中神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程包括:將系統(tǒng)搜集到的教育資源文本信息數(shù)字化之后作 為卷積神經(jīng)網(wǎng)絡(luò)輸入,再將對(duì)應(yīng)的教育資源特征作為輸出。
[0047] 卷積神經(jīng)網(wǎng)絡(luò)通常由三種模塊構(gòu)成:卷積層、降采樣層、全連接層。其中卷積層、全 連接層由參數(shù)權(quán)重矩陣、偏置項(xiàng)與非線性映射函數(shù)構(gòu)成。
[0048]訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。其目標(biāo)函數(shù)為均方誤差(MSE):
[0050] 其中,w,b代表了卷積神經(jīng)網(wǎng)絡(luò)中的全部參數(shù),即要優(yōu)化的目標(biāo)。yi'表示訓(xùn)練庫(kù)中 第i個(gè)學(xué)習(xí)資源的特征向量,示卷積神經(jīng)網(wǎng)絡(luò)的輸出值。
[0051] 其訓(xùn)練方法為小批度隨機(jī)梯度下降,選取一定數(shù)量的樣本作為一次梯度下降的樣 本,結(jié)合神經(jīng)網(wǎng)絡(luò)的前向后向傳導(dǎo)進(jìn)行梯度下降。具體訓(xùn)練過(guò)程見圖3。
[0052]步驟4,將教育資源特征向量與用戶特征向量相乘,得到學(xué)生對(duì)教育資源的興趣 度。
[0053]本發(fā)明使用向量來(lái)表示用戶以及資源的特征,將教育資源特征向量與學(xué)生特征向 量進(jìn)行相乘,得到對(duì)應(yīng)的興趣度預(yù)估值再根據(jù)設(shè)定的興趣度閾值決定是否要進(jìn)行推薦操 作。
[0054]其中,學(xué)生特征向量按照如下方式確定:
[0055] 初始化用戶特征矩陣U,用戶特征矩陣U中的行表示用戶,列表示影響用戶興趣度 的隱含因子,記表示用戶特征矩陣U的第i行學(xué)生特征向量。
[0056] 初始化用戶特征矩陣U,用戶特征矩陣U中的行表示用戶,列表示影響用戶興趣度 的隱含因子,記表示用戶特征矩陣U的第i行學(xué)生特征向量。
[0057] 初始化資源特征矩陣V,資源特征矩陣V中的行表示教育資源,列表示影響用戶興 趣度的隱含因子,記f表示特征資源矩陣V的第j行資源特征向量;
[0058] 確定用戶-資源矩陣,用戶-資源矩陣中的元素^」表示用戶i對(duì)資源j的興趣度分 值;
[0059] 為目標(biāo)函數(shù),計(jì)算確定用戶特征向量W和特征資源向量 f,其中上標(biāo)T表示轉(zhuǎn)置。上述計(jì)算過(guò)程可以采用梯度下降的方法進(jìn)行求解,具體的求解過(guò) 程請(qǐng)見圖4。
[0060] 用戶特征矩陣U的列數(shù)與初始化資源特征矩陣V的行數(shù)相等,具體大小可根據(jù)訓(xùn)練 樣本數(shù)確定,訓(xùn)練樣本數(shù)越多則列數(shù)和行數(shù)越多,反之越小,可根據(jù)推薦結(jié)果調(diào)整。
[0061] 實(shí)例:
[0062] 計(jì)算學(xué)生甲對(duì)學(xué)習(xí)資源《數(shù)據(jù)挖掘?qū)д摗分g的興趣度,其過(guò)程為:首先獲取《數(shù)據(jù) 挖掘?qū)д摗返奈谋拘畔?,將其轉(zhuǎn)化為數(shù)字化信息,得到《數(shù)據(jù)挖掘?qū)д摗返奈谋拘畔,將Μ作 為訓(xùn)練完成的卷積神經(jīng)網(wǎng)絡(luò)的輸入,通過(guò)卷積神經(jīng)網(wǎng)絡(luò)的正向轉(zhuǎn)播得到預(yù)測(cè)的《數(shù)據(jù)挖掘 導(dǎo)論》的特征向量Ν,再?gòu)膶W(xué)生特征庫(kù)中取出學(xué)生甲的特征向量S,將向量Ν與S相乘,得到生 甲對(duì)學(xué)習(xí)資源《數(shù)據(jù)挖掘?qū)д摗返呐d趣度預(yù)估值a,若a大于系統(tǒng)預(yù)設(shè)的閾值,則對(duì)其進(jìn)行推 薦操作,反之則不進(jìn)行推薦。
[0063]實(shí)例中,用戶-資源矩陣如表1所示
[0065]其中空缺的值表示該用戶對(duì)對(duì)應(yīng)書籍未做出評(píng)價(jià),在計(jì)算過(guò)程中對(duì)空缺值不進(jìn)行 計(jì)算。通過(guò)目標(biāo)函數(shù)計(jì)算得到的用戶特征矩陣U和資源特征矩陣V如表2和3所示:
[0067] 本例中潛在因子選取為20個(gè)。
[0068]本領(lǐng)域的技術(shù)人員容易理解,以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以 限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換和改進(jìn)等,均應(yīng)包含 在本發(fā)明的保護(hù)范圍之內(nèi)。
【主權(quán)項(xiàng)】
1. 一種數(shù)字教育資源推薦方法,其特征在于,包括以下步驟: (1) 提取教育資源的文本信息; (2) 將文本信息數(shù)字化處理,得到文本數(shù)字矩陣; (3) 將文本數(shù)字矩陣輸入預(yù)訓(xùn)練得到的資源特征識(shí)別器,資源特征識(shí)別器輸出教育資 源特征向量; (4) 將教育資源特征向量與用戶特征向量相乘,得到學(xué)生對(duì)教育資源的興趣度。2. 根據(jù)權(quán)利要求1所述的數(shù)字教育資源推薦方法,其特征在于,所述步驟(4)中的用戶 特征向量按照如下方式確定: 初始化用戶特征矩陣U,用戶特征矩陣U中的行表示用戶,列表示影響用戶興趣度的隱 含因子,記tc表示用戶特征矩陣U的第i行用戶特征向量; 初始化資源特征矩陣V,資源特征矩陣V中的行表示教育資源,列表示影響用戶興趣度 的隱含因子,記€表示特征資源矩陣V的第j行資源特征向量; 確定用戶-資源矩陣,用戶-資源矩陣中的元素表示用戶i對(duì)資源j的興趣度分值; ^為目標(biāo)函數(shù),計(jì)算確定用戶特征向量€和特征資源向量$, 其中上標(biāo)T表示轉(zhuǎn)置。3. 根據(jù)權(quán)利要求1或2所述的數(shù)字教育資源推薦方法,其特征在于,所述步驟(2)將文本 信息數(shù)字化處理得到文本信息矩陣的具體實(shí)現(xiàn)過(guò)程為:對(duì)文本信息進(jìn)行分詞處理,將所得 的每一個(gè)詞采用向量表示,各詞向量組成為文本數(shù)字矩陣。4. 根據(jù)權(quán)利要求3所述的數(shù)字教育資源推薦方法,其特征在于,采用選擇話題模型或分 布式表達(dá)模型作為語(yǔ)言模型,將所得的每一個(gè)詞采用向量表示。5. 根據(jù)權(quán)利要求1或2或3所述的數(shù)字教育資源推薦方法,其特征在于,所述資源特征識(shí) 別器采用卷積神經(jīng)網(wǎng)絡(luò)、時(shí)間遞歸神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)中的任意一種訓(xùn)練得到。6. -種數(shù)字教育資源推薦系統(tǒng),其特征在于,包括以下模塊: 第一模塊,用于提取教育資源的文本信息; 第二模塊,用于將文本信息數(shù)字化處理,得到文本數(shù)字矩陣; 第三模塊,用于將文本數(shù)字矩陣輸入預(yù)訓(xùn)練得到的資源特征識(shí)別器,資源特征識(shí)別器 輸出教育資源特征向量; 第四模塊,用于將教育資源特征向量與用戶特征向量相乘,得到學(xué)生對(duì)教育資源的興 趣度。7. 根據(jù)權(quán)利要求6所述的數(shù)字教育資源推薦系統(tǒng),其特征在于,所述第四模塊包括: 第四一子模塊,用于初始化用戶特征矩陣U,用戶特征矩陣U中的行表示用戶,列表示影 響用戶興趣度的隱含因子,記g表示用戶特征矩陣U的第i行用戶特征向量; 第四二子模塊,用于初始化資源特征矩陣V,資源特征矩陣V中的行表示教育資源,列表 示影響用戶興趣度的隱含因子,記f表示特征資源矩陣V的第j行資源特征向量; 第四三子模塊,用于確定用戶-資源矩陣,用戶-資源矩陣中的元素表示用戶i對(duì)資源 j的興趣度分值; 第四四子模塊,用于b為目標(biāo)函數(shù),計(jì)算確定用戶特征向量W 和特征資源向量G,其中上標(biāo)T表示轉(zhuǎn)置。
【文檔編號(hào)】G06F17/30GK105868317SQ201610179836
【公開日】2016年8月17日
【申請(qǐng)日】2016年3月25日
【發(fā)明人】劉海, 楊宗凱, 劉三女牙, 張昭理, 舒江波
【申請(qǐng)人】華中師范大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
乌拉特前旗| 台中县| 鄂州市| 岐山县| 双鸭山市| 东城区| 叙永县| 剑阁县| 衡山县| 黎平县| 汤原县| 奈曼旗| 锦屏县| 阳春市| 南汇区| 旬阳县| 霍州市| 宁波市| 五指山市| 忻州市| 吐鲁番市| 武夷山市| 田林县| 疏附县| 高阳县| 门头沟区| 仁寿县| 通山县| 乌兰察布市| 博野县| 雷山县| 塔城市| 台湾省| 长春市| 儋州市| 绍兴市| 社会| 乌拉特后旗| 随州市| 措美县| 全南县|