一種基于隨機(jī)游走的社交網(wǎng)絡(luò)推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及計算機(jī)應(yīng)用技術(shù)領(lǐng)域,尤其是涉及一種基于隨機(jī)游走的社交網(wǎng)絡(luò)推薦 方法。
【背景技術(shù)】
[0002] 隨著網(wǎng)絡(luò)上信息過載問題越來越嚴(yán)重,用戶如何快速準(zhǔn)確地找到自己需要的信息 面臨著很大的挑戰(zhàn)。推薦系統(tǒng)的出現(xiàn)在一定程度上緩解了這個問題。推薦系統(tǒng)主要是分析 用戶的歷史行為,分析出用戶偏好以及利用用戶之間的關(guān)系,最終對用戶做出推薦。目前推 薦系統(tǒng)中傳統(tǒng)的推薦方法有協(xié)同過濾推薦(Collaborative Filtering)、基于內(nèi)容的推薦 (Content-based Recommendations)等,矩陣分解在Netflix比賽中被證明效果相當(dāng)好。然 而傳統(tǒng)的推薦方法存在著不少問題,當(dāng)對某個歷史行為較少的用戶做推薦時很難取得比較 好的效果,這就是推薦系統(tǒng)中的冷啟動問題。而且其實用戶之間也是存在著信任關(guān)系的,傳 統(tǒng)的推薦系統(tǒng)并沒有考慮這些因素。
[0003] 近些年,基于社交網(wǎng)絡(luò)的推薦是一個研宄熱點(diǎn)?;谏缃痪W(wǎng)絡(luò)的推薦在模型中會 度量用戶之間的信任度,研宄已經(jīng)證明來自所信任用戶的推薦更能讓用戶所接收。只要一 個用戶屬于一個社交網(wǎng)絡(luò),有著直接相連的用戶,那么推薦系統(tǒng)就能做出推薦,因此基于社 交網(wǎng)絡(luò)的推薦能夠明顯提高推薦系統(tǒng)的覆蓋率。社交網(wǎng)絡(luò)中用戶之間的信任度可以分為顯 示信任度和隱式信任度。顯示信任度是指被用戶明確指明的信任度,而隱式信任度是系統(tǒng) 根據(jù)一些用戶歷史行為推導(dǎo)出來的,比如用戶間交流頻率、用戶共同好友數(shù)目等。同時信任 度又分為直接信任度和間接信任度,直接信任度是指直接相連的用戶之間的信任度,而間 接信任度是通過直接信任度的傳播在兩個不直接相連的用戶之間產(chǎn)生的信任度。信任度的 傳播是社交網(wǎng)絡(luò)推薦中的一個重要問題。Massa提出利用乘法傳播信任度,并且還有考慮到 信任度傳播的最大距離和最小信任閥值。信任度傳播距離越大,信任度就會衰減。在推薦 中利用信任度能夠一定程度上解決推薦系統(tǒng)的冷啟動問題。Inay Ha提出了一種結(jié)合用戶 之間的關(guān)系和傳統(tǒng)的協(xié)同過濾推薦算法,首先計算出用戶之間的權(quán)值,依據(jù)六度分離理論, 在由用戶構(gòu)成的圖中找出兩個用戶之間的所有路徑從而計算出兩者之間的權(quán)值。最后利用 用戶協(xié)同過濾做推薦時考慮這個權(quán)值因素,實驗結(jié)果表明這種方法在準(zhǔn)確性上上獲得了一 定的提高。J. Golbeck提出了 TidalTrust模型,在這個模型中預(yù)測源用戶對物品的評分時, 采用廣度遍歷的策略,找出與源用戶距離最近的并且對該物品有評分記錄的用戶,并將這 些用戶對該物品的評分與用戶與源用戶之間的信任度相乘的結(jié)果做聚合,最終做為預(yù)測的 分?jǐn)?shù)。但是這個模型的缺點(diǎn)在于只要與源用戶距離稍遠(yuǎn)的用戶都沒有被考慮,甚至他們之 間的信任度比較大。MoleTrust相對于TidalTrust而言,不同點(diǎn)在于,在尋找對某物品有評 分記錄的用戶時設(shè)置了一個最大深度來作為限制。Mohsen Jamali等人提出了一個隨機(jī)圖 游走模型,利用隨機(jī)圖游走策略來控制信任度傳播,但是當(dāng)游走距離較遠(yuǎn)時考慮使用相似 物品來替代目標(biāo)物品時產(chǎn)生不少誤差;Hao Ma指出了在社交網(wǎng)絡(luò)中存在著一些特點(diǎn):用戶 信任和用戶的興趣相似度正向關(guān)聯(lián),好友關(guān)系和用戶的興趣相似度不具有正向關(guān)聯(lián),用戶 和其好友之間的興趣是不同的;Nicola Barbieri等人提出了一個隨機(jī)話題模型(WTFW), WTFW能夠預(yù)測用戶之間是否存在邊,并且能對預(yù)測的邊做出是社交還是話題興趣的解釋。
[0004] 然而在社交網(wǎng)絡(luò)推薦系統(tǒng)中尋找與源用戶相關(guān)的用戶時,如果考慮的用戶之間距 離越長,則產(chǎn)生推薦的覆蓋率越高,但同時噪音越大。這個一直是基于信任度的社交網(wǎng)絡(luò)推 薦中的難題所在。我們利用隨機(jī)圖游走策略提出一個模型,該模型能度量用戶之間的信任 度,并且在覆蓋率和誤差方面表現(xiàn)不錯。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的就是為了克服上述現(xiàn)有技術(shù)存在的缺陷而提供一種準(zhǔn)確率高、覆蓋 率廣、方法先進(jìn)的基于隨機(jī)游走的社交網(wǎng)絡(luò)推薦方法。
[0006] 本發(fā)明的目的可以通過以下技術(shù)方案來實現(xiàn):
[0007] 一種基于隨機(jī)游走的社交網(wǎng)絡(luò)推薦方法,包括以下步驟:
[0008] 1. 一種基于隨機(jī)游走的社交網(wǎng)絡(luò)推薦方法,其特征在于,包括以下步驟:
[0009] 1)在社交網(wǎng)絡(luò)中選定一個源用戶u和待預(yù)測物品i,以源用戶u為起點(diǎn)開始進(jìn)行 隨機(jī)游走,并且設(shè)定游走步數(shù)k的最大值為6 ;
[0010] 2)當(dāng)?shù)竭_(dá)用戶uk時,判斷用戶uk是否對待預(yù)測物品i有評分,若是,則記錄該評 分為停止游走,并進(jìn)行步驟6),若否,則進(jìn)行步驟3);
[0011] 3)根據(jù)用戶uk的所有已評分物品的集合和步數(shù)k計算此次停止游走的概率 ,并以的概率進(jìn)行步驟4),以的概率進(jìn)行步驟5);
[0012] 4)在用戶Uk的所有已評分物品的集合中選擇一個代替物品j,記錄用戶U k對 代替物品j的評分為,停止游走,并進(jìn)行步驟6);
[0013] 5)若游走步數(shù)k小于6,則k = k+Ι,繼續(xù)此次游走,并且在社交網(wǎng)絡(luò)中與Uk直接相 連的用戶集合中選擇下一步隨機(jī)游走的節(jié)點(diǎn)用戶u k+1,并且返回步驟2),若游走步數(shù)k 等于6,則停止游走,進(jìn)行步驟6);
[0014] 6)根據(jù)記錄下來的評分,預(yù)測源用戶u對待預(yù)測物品i的評分riU,并將待預(yù)測物 品i推薦給源用戶u。
[0015] 所述的步驟3)中概率A的計算方法為:
[0016] 31)計算在用戶Uk的所有已評分物品的集洽中的每個物品m與待預(yù)測物品i 之間的物品相似度sim(m, i),sim(m, i)的計算式為:
【主權(quán)項】
1. 一種基于隨機(jī)游走的社交網(wǎng)絡(luò)推薦方法,其特征在于,包括以下步驟: 1) 在社交網(wǎng)絡(luò)中選定一個源用戶U和待預(yù)測物品i,以源用戶U為起點(diǎn)開始進(jìn)行隨機(jī) 游走,并且設(shè)定游走步數(shù)k的最大值為6 ; 2) 當(dāng)?shù)竭_(dá)用戶uk時,判斷用戶uk是否對待預(yù)測物品i有評分,若是,則記錄該評分為 ,停止游走,并進(jìn)行步驟6),若否,則進(jìn)行步驟3); 3) 根據(jù)用戶uk的所有已評分物品的集合%t和步數(shù)k計算此次停止游走的概率 ①,并以?K的概率進(jìn)行步驟4),以1 _ ? 的概率進(jìn)行步驟5); 4) 在用戶uk的所有已評分物品的集合中選擇一個代替物品j,記錄用戶uk對代替 物品j的評分為\./,停止游走,并進(jìn)行步驟6); 5) 若游走步數(shù)k小于6,則k=k+1,繼續(xù)此次游走,并且在社交網(wǎng)絡(luò)中與uk直接相連 的用戶集合7 中選擇下一步隨機(jī)游走的節(jié)點(diǎn)用戶uk+1,并且返回步驟2),若游走步數(shù)k等 于6,則停止游走,進(jìn)行步驟6); 6) 根據(jù)記錄下來的評分,預(yù)測源用戶u對待預(yù)測物品i的評分riU,并將待預(yù)測物品i 推薦給源用戶u。
2. 根據(jù)權(quán)利要求1所述的一種基于隨機(jī)游走的社交網(wǎng)絡(luò)推薦方法,其特征在于,所述 的步驟3)中概率的計算方法為: 31) 計算在用戶uk的所有已評分物品的集合〃/中的每個物品m與待預(yù)測物品i之間 的物品相似度sim(m,i),sim(m,i)的計算式為:
其中,對物品m和i均有評分的用戶的集合,uke此^^^和^分別為用戶uk對物品m和i的評分,&為用戶uk對所有已評分物品的平均分; 32) 根據(jù)物品相似度sim(m,i)計算停止游走的概率的計算式為:
3. 根據(jù)權(quán)利要求1所述的一種基于隨機(jī)游走的社交網(wǎng)絡(luò)推薦方法,其特征在于,所述 的步驟4)中選擇代替物品j的條件滿足:
其中,t(Un,uk)為uk_^uk的相互信任度,V為此次游走經(jīng)過所有路徑節(jié)點(diǎn) (u"u2. ? ?uk)的集合。
4. 根據(jù)權(quán)利要求1所述的一種基于隨機(jī)游走的社交網(wǎng)絡(luò)推薦方法,其特征在于,所述 的步驟5)中選擇下一步的節(jié)點(diǎn)用戶%+1的概率為:
其中,W為與uk直接相連的用戶集合中的用戶節(jié)點(diǎn)。
5.根據(jù)權(quán)利要求1所述的一種基于隨機(jī)游走的社交網(wǎng)絡(luò)推薦方法,其特征在于,所述 的步驟6)中預(yù)測源用戶u對待預(yù)測物品i評分ru,i的計算式為:
其中,R#為多次游走后返回的(uk,j)集合,^為用戶uk對替代物品j的評分,1^是 用戶%對物品i的評分或者是其他替代用戶對替代物品j評分的加權(quán)和。
【專利摘要】本發(fā)明涉及一種基于隨機(jī)游走的社交網(wǎng)絡(luò)推薦方法,包括以下步驟:1)在社交網(wǎng)絡(luò)中選定一個源用戶u和待預(yù)測物品i,設(shè)定游走步數(shù)k的最大值為6;2)在社交網(wǎng)絡(luò)中以源用戶u為起點(diǎn)開始進(jìn)行隨機(jī)游走,到達(dá)用戶uk時,判斷用戶uk是否對待預(yù)測物品i有評分;3)根據(jù)用戶uk的所有已評分物品的集合和步數(shù)k計算此次停止游走的概率4)選擇一個代替物品j,記錄用戶uk對代替物品j的評分為5)在社交網(wǎng)絡(luò)中與uk直接相連的用戶集合中選擇下一步隨機(jī)游走的節(jié)點(diǎn)用戶uk+1;6)根據(jù)記錄下來的評分,預(yù)測源用戶u對待預(yù)測物品i的評分ru,i,并將待預(yù)測物品i推薦給源用戶u。與現(xiàn)有技術(shù)相比,本發(fā)明具有準(zhǔn)確率高、覆蓋率廣、方法先進(jìn)等優(yōu)點(diǎn)。
【IPC分類】G06Q50-00, G06F17-30
【公開號】CN104778213
【申請?zhí)枴緾N201510121263
【發(fā)明人】黃震華, 方強(qiáng), 張佳雯, 向陽
【申請人】同濟(jì)大學(xué)
【公開日】2015年7月15日
【申請日】2015年3月19日