,根據(jù)用戶的瀏覽記錄不斷的更新用戶動(dòng)機(jī)向量,因此可以隨用戶的選擇而不斷的獲取用戶的最新動(dòng)向,為用戶推薦更加有價(jià)值、有針對性的數(shù)字資源。
【附圖說明】
[0046]為了更清楚地說明本發(fā)明【具體實(shí)施方式】或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對【具體實(shí)施方式】或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施方式,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動(dòng)的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0047]圖1為本發(fā)明實(shí)施例1中數(shù)字資源推薦方法的一個(gè)具體示例的流程圖;
[0048]圖2為本發(fā)明實(shí)施例2中數(shù)字資源推薦方法的一個(gè)具體示例的原理框圖;
[0049]圖3為本發(fā)明實(shí)施例3中數(shù)字資源推薦裝置的一個(gè)具體示例的結(jié)構(gòu)框圖;
【具體實(shí)施方式】
[0050]下面將結(jié)合附圖對本發(fā)明的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0051]在本發(fā)明的描述中,需要說明的是,術(shù)語“第一”、“第二”、“第三”僅用于描述目的,而不能理解為指示或暗示相對重要性。此外,下面所描述的本發(fā)明不同實(shí)施方式中所涉及的技術(shù)特征只要彼此之間未構(gòu)成沖突就可以相互結(jié)合。
[0052]實(shí)施例1
[0053]本實(shí)施例提供一種數(shù)字資源推薦方法,用于在用戶瀏覽網(wǎng)頁、文獻(xiàn)等數(shù)字信息時(shí),向用戶推薦其更關(guān)注的信息,使得推薦的信息更具有針對性,提供用戶瀏覽瀏覽數(shù)字資源的效率。
[0054]本實(shí)施例中的數(shù)字資源推薦方法,流程圖如圖1所示,包括以下步驟:
[0055]S1、設(shè)置一個(gè)或多個(gè)動(dòng)機(jī)標(biāo)簽。
[0056]每個(gè)動(dòng)機(jī)標(biāo)簽從一個(gè)角度表示該數(shù)字資源所體現(xiàn)的動(dòng)機(jī)傾向,這些動(dòng)機(jī)標(biāo)簽構(gòu)成一個(gè)動(dòng)機(jī)標(biāo)簽組,用于標(biāo)識數(shù)字資源的動(dòng)機(jī)傾向。如針對動(dòng)機(jī)標(biāo)簽組“出國留學(xué)”,其包含的動(dòng)機(jī)標(biāo)簽可以是“考試,托福,雅思,GMAT,GRE”。每件數(shù)字資源中又可以包含多個(gè)動(dòng)機(jī)標(biāo)簽組,每個(gè)標(biāo)簽組內(nèi)包含若干個(gè)動(dòng)機(jī)標(biāo)簽。
[0057]S2、為第一數(shù)字資源標(biāo)注所述動(dòng)機(jī)標(biāo)簽,獲得每篇數(shù)字資源的動(dòng)機(jī)向量。
[0058]動(dòng)機(jī)標(biāo)簽組構(gòu)成了一個(gè)向量空間,由動(dòng)機(jī)標(biāo)簽及其權(quán)重構(gòu)成的向量稱為“動(dòng)機(jī)向量”,用于表示動(dòng)機(jī)傾向,每件數(shù)字資源的每個(gè)動(dòng)機(jī)標(biāo)簽的權(quán)重根據(jù)相關(guān)程度來確定。如為數(shù)字資源A標(biāo)定的動(dòng)機(jī)向量為[0.5考試,0.5托福,0.5雅思,0.5GMAT,0.5GRE]。
[0059]S3、根據(jù)所述第一數(shù)字資源及其動(dòng)機(jī)向量為第二數(shù)字資源推薦動(dòng)機(jī)標(biāo)簽,確定所述第二數(shù)字資源的動(dòng)機(jī)向量。第一數(shù)字資源為已經(jīng)標(biāo)注的數(shù)字資源,所述第二數(shù)字資源時(shí)待標(biāo)注的數(shù)字資源
[0060]在通過步驟S2標(biāo)定了一部分?jǐn)?shù)字資源后,其余的數(shù)字資源可以根據(jù)標(biāo)定的數(shù)字資源來自動(dòng)生成推薦的動(dòng)機(jī)向量。
[0061]第一步,從所述第一數(shù)字資源的動(dòng)機(jī)標(biāo)簽中選擇一個(gè)或多個(gè)動(dòng)機(jī)標(biāo)簽作為推薦策略。
[0062]第二步,計(jì)算該推薦策略和所述第二數(shù)字資源的文本相似度;
[0063]第三步,將所述推薦策略和多數(shù)文本相似度的乘積作為該推薦策略對應(yīng)的動(dòng)機(jī)向量。
[0064]具體地,用向量空間模型(VSM)計(jì)算出推薦策略和未標(biāo)注資源的文本相似度,把文本相似度和推薦策略的動(dòng)機(jī)向量的乘積作為推薦標(biāo)簽,推薦給待標(biāo)注資源,例如:
[0065]在動(dòng)機(jī)標(biāo)簽組!^^^,…,、])時(shí)’使用推薦策略六^匕^])和匕(待標(biāo)注資源),通過VSM計(jì)算出相似度為0.5,則為薦標(biāo)簽R J0.5L 0.5t2, 0.5t3]。
[0066]若相似度小于0.1,則視為無效,丟棄結(jié)果。
[0067]由于可以設(shè)置不同的推薦策略,根據(jù)可以上述方式計(jì)算所有推薦策略對應(yīng)的動(dòng)機(jī)向量。
[0068]將不同推薦策略下的動(dòng)機(jī)向量對應(yīng)累加后取均值,作為最終的第二數(shù)字資源的動(dòng)機(jī)向量。
[0069]公式如下:
[0070]R = (Rl+R2+*"+Rn)/n,其中R1、R2、…、Rn為計(jì)算出的動(dòng)機(jī)向量,R為該數(shù)字資源的動(dòng)機(jī)向量。
[0071]例如:
[0072]若同樣在T1中,除了 A1還匹配了 A2。A2 ([t2,t4,t5])和B1的相似度為0.4,則為B1推薦標(biāo)簽R2 [0.4t2, 0.4t4, 0.4t5]。則B1的最終推薦結(jié)果等于:
[0073]R = (Rl+R2)/2
[0074]結(jié)果為[0.25tl, 0.45t2, 0.25t3, 0.2t4, 0.2t5]。
[0075]針對每個(gè)動(dòng)機(jī)標(biāo)簽組分別計(jì)算,而不同動(dòng)機(jī)標(biāo)簽組的計(jì)算結(jié)果相互隔離,若使用不同動(dòng)機(jī)標(biāo)簽組推薦標(biāo)簽時(shí),不同推薦策略中即使有同名標(biāo)簽也不合并。
[0076]針對所有標(biāo)注的數(shù)字資源對上述未標(biāo)注數(shù)字資源進(jìn)行上述推薦,將一個(gè)動(dòng)機(jī)標(biāo)簽組可以看做一種動(dòng)機(jī)類型,其動(dòng)機(jī)向量P,等于該動(dòng)機(jī)標(biāo)簽組下所有推薦策略下的動(dòng)機(jī)向量的均值,即:
[0077]P = (P1+P2+…+Ρη)/η
[0078]S4、根據(jù)用戶瀏覽的數(shù)字資源的動(dòng)機(jī)向量確定用戶動(dòng)機(jī)向量,所述部分或全部數(shù)字資源屬于所述第一數(shù)字資源或第二數(shù)字資源。
[0079]首先,獲取用戶瀏覽的數(shù)字資源的動(dòng)機(jī)向量;
[0080]然后,將所述用戶瀏覽的數(shù)字資源的動(dòng)機(jī)向量累加,作為用戶動(dòng)機(jī)向量。
[0081]其中,用戶每增加瀏覽一件數(shù)字資源,獲取該數(shù)字資源的動(dòng)機(jī)向量,將其增加到用戶動(dòng)機(jī)向量中,對用戶動(dòng)機(jī)向量進(jìn)行更新。
[0082]具體方式為:該方案中,為用戶進(jìn)行推薦之前,用戶需要先選擇動(dòng)機(jī)類型,使用過程中,需要收集用戶使用軌跡中的動(dòng)機(jī)向量,形成用戶動(dòng)機(jī)向量Q和訪問資源次數(shù)N,用戶動(dòng)機(jī)向量Q的初始值等于所選動(dòng)機(jī)類型T的動(dòng)機(jī)向量P,即Q = P,而N的初始值為0,即N=0,且每一次檢索操作都會(huì)重置這兩個(gè)值。當(dāng)用戶點(diǎn)擊一篇資源,該資源的動(dòng)機(jī)向量札就會(huì)加入到用戶動(dòng)機(jī)向量Q中,同時(shí)N自增1,即Q = Q+RpN = N+1 ;
[0083]S5、根據(jù)每件數(shù)字資源的動(dòng)機(jī)向量和所述用戶動(dòng)機(jī)向量推薦數(shù)字資源。具體方法為:計(jì)算用戶動(dòng)機(jī)向量和每件數(shù)字資源的動(dòng)機(jī)向量的余弦值,根據(jù)所述余弦值的大小向用戶推薦數(shù)字資源。
[0084]本實(shí)施例中采用通過計(jì)算用戶動(dòng)機(jī)向量Q和所有資源的動(dòng)機(jī)向量R的余弦值L,按L遞減排序,推薦資源。
[0085]在其他的實(shí)施方案中,還可以選擇余弦值將大于一定預(yù)設(shè)閾值的數(shù)字資源推薦給用戶。
[0086]本實(shí)施例中的數(shù)字資源推薦方案,與傳統(tǒng)技術(shù)相比,本方法結(jié)合了大數(shù)據(jù)分析和文本相似度計(jì)算的優(yōu)點(diǎn):該方法本質(zhì)上是對大數(shù)據(jù)分析的優(yōu)化,但不盲目的推薦,而是聚焦于用戶的使用動(dòng)機(jī),通過分析用戶操作來確認(rèn)資源的動(dòng)機(jī)傾向。這種方法要求資源本身有自己的動(dòng)機(jī)傾向,否則就無法被推薦,但是人工標(biāo)注成本又過高,而文本相似度計(jì)算則解決了這個(gè)問題:如果兩個(gè)資源是相似的,那么其使傾向也是相似的。利用這個(gè)理論,為未標(biāo)注的資源推薦標(biāo)簽。在實(shí)際應(yīng)用中,文本相似度計(jì)算是有誤差的,但是在該方法中使用多個(gè)推薦策略為同一個(gè)資源推薦標(biāo)簽,這樣正確標(biāo)簽的權(quán)重就會(huì)提高,錯(cuò)誤標(biāo)簽的權(quán)重就會(huì)降低,從算法上修正了誤差。但是推薦策略的匱乏將導(dǎo)致這個(gè)誤差依然很大,該方法考慮到了這個(gè)問題,在實(shí)際應(yīng)用中,通過系統(tǒng)分析用戶的行為,給資源提供大量備選動(dòng)機(jī)向量(