一種概率矩陣分解推薦方法
【技術領域】
[0001] 本發(fā)明涉及在線社交網(wǎng)絡的交互方法,建立一種新型推薦方法,結合顯性與隱性 反饋信息,利用概率矩陣分解原理進行準確的評分預測,屬于軟件工程、人機交互、互聯(lián)網(wǎng) 交叉技術應用領域。
【背景技術】
[0002] 近年來,在線社交網(wǎng)絡逐漸流行,吸引了成千上萬的用戶,已經(jīng)成為當今信息的傳 播與分享的主要平臺之一。由于商品規(guī)模越來越龐大,用戶很難快速準確地找到自己感興 趣的商品,推薦系統(tǒng)的任務就是幫助用戶快速準確地找到喜歡的商品。在線社交網(wǎng)絡中,朋 友的推薦很重要,它可以給用戶提供準確的建議,使用戶能夠快速地找到理想中的商品。供 應商們也很愿意利用推薦系統(tǒng)給他們潛在的客戶推薦需要的商品,并且希望把客戶變成真 正的買家。
[0003] 為了獲得更準確的推薦,需要對未知的商品進行評分的預測,除了朋友的推薦之 外,其它的信息也很重要,如顯性反饋和隱性反饋信息。顯性反饋信息是指用戶給出的顯性 傾向,如評分信息、用戶與用戶之間的信任關系等。隱性反饋信息是指用戶不直接表現(xiàn)出的 隱性傾向,如購買了哪些商品、給哪些電影評分了等。近年來,基于協(xié)同過濾的顯性反饋的 推薦系統(tǒng)普遍增多,很多推薦系統(tǒng)都是結合用戶的評分和信任信息來提高推薦的準確度, 但這卻浪費了大量的寶貴的隱性反饋信息。由于推薦系統(tǒng)可以很容易地獲取隱性反饋信 息,而且用戶不會很反感,同時隱性反饋信息還具有收集成本低、應用場景廣、數(shù)據(jù)規(guī)模大 等特點。因此,在推薦系統(tǒng)中需要將隱性反饋信息和顯性反饋信息相結合。
[0004] 矩陣分解技術已逐步應用于推薦系統(tǒng),其中就包括概率矩陣分解技術。概率矩陣 分解技術是根據(jù)用戶和商品的特征向量以及觀察到的評分服從的高斯先驗分布,利用貝葉 斯推導,得到用戶和商品的特征矩陣,最后根據(jù)特征矩陣計算出預測的評分。該方法可以 有效地利用多方面信息,在推薦時有著更好的準確率,而且復雜度不高,適合處理大規(guī)模數(shù) 據(jù)。
【發(fā)明內容】
[0005] 技術問題:本發(fā)明的目的是提供一種概率矩陣分解推薦方法,該方法是一種基于 顯性與隱性反饋信息同時結合概率矩陣分解技術幫助用戶給商品評分的方法,該方法以在 線社交網(wǎng)絡為平臺,對顯性與隱性反饋信息進行概率矩陣分解,并根據(jù)貝葉斯推理來預測 出用戶對商品的評分,解決了預測精度不高以及評分稀疏與冷啟動的問題。
[0006] 技術方案:本發(fā)明所述概率矩陣分解推薦方法,首先對用戶信任關系矩陣進行概 率矩陣分解,然后對用戶的商品評分矩陣和隱性反饋信息進行概率矩陣分解,綜合兩次分 解的結果,求出隱含用戶特征矩陣、隱含商品特征矩陣以及隱性反饋信息特征向量,最后計 算出給用戶推薦的評分。
[0007] 本發(fā)明所述概率矩陣分解推薦方法包括以下步驟:
[0008] 步驟1)獲得用戶在線社交網(wǎng)絡中的信任關系矩陣與用戶商品評分矩陣;所述在 線社交網(wǎng)絡是在互聯(lián)網(wǎng)上與其他人相聯(lián)系的一個平臺,用戶對產(chǎn)品進行評分,同時分享給 該用戶的朋友,查詢該用戶的朋友的評分;
[0009] 步驟2)隨機生成U和Z,所述U e Rdx?表示隱含用戶特征矩陣,Z e Rdx?表示隱 含信任關系特征矩陣,Z e Rdxm表示d行m列的矩陣,d是用戶根據(jù)經(jīng)驗指定的隱含特征數(shù), m是用戶的個數(shù),將隱含用戶特征矩陣和隱含信任關系特征矩陣的先驗分布表示為:
[0010]
[0011]
[0012] 所述i表示用戶個數(shù)的變量,k表示用戶個數(shù)的變量,Ui表示用戶U ;的特征列向 量,Zk表示第k個信任關系特征向量,I 表示是均值為〇,方差為^的高斯分布 的概率密度函數(shù),iV(ZJ0,c^)表示是均值為〇,方差為σ〗的高斯分布的概率密度函數(shù);
[0013] 步驟3)對用戶信任關系矩陣進行概率矩陣分解,用戶信任關系矩陣的條件概率 分布表不為:
[0014]
[0015] 所述T表示mXm維的用戶信任關系矩陣,表示1^的轉置,
表不均值為ZA_)、方差為4的高斯分布的概率密度函數(shù),IijiJ是一個變量,表不用 戶Ui與用戶u k之間信任關系,當用戶u ;信任用戶u k時,I i_k_T= 1,否則I i_k_T= 0 ;所 述gif/%,是將£/?的值映射在[0,1]之間,
,G是一個變量,
表示用戶u i與用戶u k之間的信任權值,d + (U1)表示用 戶U1信任的用戶數(shù)量,d (Uk)表示用戶Uk被信任的用戶數(shù)量;
[0016] 步驟4)隨機生成V,所述V e Rdxn表示隱含商品特征矩陣,Rdxn表示d行η列的 矩陣,η表示商品的個數(shù),將隱含商品特征矩陣的先驗分布表示為:
[0017]
[0018] 所述j表示商品個數(shù)的變量,Vj表示商品i 的特征向量,ArG77 I 〇,<_)表示是均值 為〇,方差為的高斯分布的概率密度函數(shù);
[0019] 步驟5)對用戶的商品評分矩陣進行概率矩陣分解,用戶的商品評分矩陣的條件 概率分布表不為: υ?Ν 丄 丄 λ J ^ o/ υ
[0020]
, 所述R表示mXn維的用戶的商品評分矩陣,Γι ]表示用戶u i對商品i ,的評分,
'表示均值為
、方差為4的高斯分 布的概率密度函數(shù),Iu表示被用戶評過分的商品集合,|lu|表示被用戶評過分的商品的數(shù) 量,Ii」_R表示用戶Ui是否給商品i .j評過分,若評過分,則I ^jjf= 1,否則I ^jjf = 0,y .j表示 已被用戶評過分的商品對即將要評分商品的隱性影響的權重值,初始值為1. 〇 ;
[0021] 步驟6)分別計算Up Vp Z1^ y郝更新值U /、V /、Z k'與y /,
,所述γ為預先 定義的步長,γ足夠小且γ >〇, γ的具體值根據(jù)經(jīng)驗確定,其中
'Λ
[0026] 所述
λ為預先定義的規(guī)則 化參數(shù),λ足夠小且λ > 〇, λ的具體值根據(jù)經(jīng)驗確定;
[0027] 步驟7)根據(jù)公式
[0028]
[0029] 計算目標函數(shù)L的值,當目標函數(shù)L的值變化小于某個預先定義的很小的常數(shù)或 在經(jīng)過設定的迭代次數(shù)后終止迭代過程,否則令U i=U/,Vj= V/ ,Zk=Z1/,yj=y/, 返回步驟6),所述|*£是歐幾里得向量范數(shù);
[0030] 步驟8)當?shù)\算終止后,得到U1'、V / 以及y /,使用
計算用戶U1對商品i j的未知評分考」。
[0031] 有益效果:
[0032] 1)本發(fā)明提供一種基于在線社交網(wǎng)絡的一種基于顯性與隱性反饋信息同時結合 概率矩陣分解技術幫助用戶給商品評分的方法,整個過程思路清晰完整,可讀性強,盡量將 晦澀難懂的相關技術概念、相關算法表述清晰,易于理解。
[0033] 2)本發(fā)明中所述的評分預測過程,提供了一套計算公式,能夠將實際社交網(wǎng)絡中 相關的數(shù)據(jù)轉化為數(shù)學化的模型形式,從而得到最終的結果。
[0034] 3)本發(fā)明中所述的推薦方法能夠緩解社交網(wǎng)絡中數(shù)據(jù)稀疏問題和冷啟動問題,有 著更好的推薦效果,并且該推薦方法能運用于有大規(guī)模數(shù)據(jù)集的推薦系統(tǒng)。
【附圖說明】
[0035] 圖1是基于顯性與隱性反饋信息同時結合概率矩陣分解技術幫助用戶給商品評 分的方法流程圖;
[0036] 圖2是基于顯性與隱性反饋信息同時結合概率矩陣分解技術幫助用戶給商品評 分的方法的圖形模型。
【具體實施方式】
[0037] 本發(fā)明在在線社交網(wǎng)絡中,結合用戶對商品的評分以及用戶之間的關系等相關數(shù) 據(jù),給用戶提供了準確地推薦評分。下面根據(jù)圖1和實施例