專利名稱:融合偏好和信任關(guān)系的協(xié)同過濾推薦方法
技術(shù)領(lǐng)域:
本發(fā)明屬于信息檢索領(lǐng)域,尤其涉及一種融合偏好信任關(guān)系的協(xié)同過濾推薦方法。
背景技術(shù):
推薦系統(tǒng)可以幫助用戶從海量信息中更容易的找到最感興趣的內(nèi)容(如新聞、圖書、電影和音樂等),是解決互聯(lián)網(wǎng)信息過載的主要途徑之一,已廣泛應(yīng)用在電子商務(wù)中。目前,已提出了多種推薦方法,如協(xié)同過濾推薦方法、基于內(nèi)容的推薦方法及混合推薦方法等。其中,協(xié)同過濾算法由于其容易理解、實現(xiàn)簡單,已成功應(yīng)用于大型商業(yè)推薦系統(tǒng)中?;谟脩舻膮f(xié)同過濾方法的基本原理是尋找與目標(biāo)用戶偏好相似的其他用戶,然 后將其感興趣的內(nèi)容推薦給目標(biāo)用戶。因而,尋找與目標(biāo)用戶偏好相似的用戶是基于用戶的協(xié)同過濾的關(guān)鍵。目前,Pearson相關(guān)性、余弦相似度等是計算用戶偏好相似度的主要方法,這些方法都是利用兩個用戶之間的共同評分項目信息。然而,通常用戶-項目評分矩陣是非常稀疏的,導(dǎo)致與目標(biāo)用戶有共同評分的用戶很少。此外,兩個用戶共同評分的項目數(shù)量一般很少。因此,現(xiàn)有的協(xié)同過濾推薦方法面臨著偏好相似用戶定位不準(zhǔn)確問題,從而影響了評分預(yù)測的準(zhǔn)確度和推薦質(zhì)量。針對評分?jǐn)?shù)據(jù)稀疏問題,目前已提出一些方法減少其對推薦結(jié)果的影響,但效果并不理想。例如,利用奇異值分解方法刪除不重要的或噪音用戶和項目,降低用戶-項目評分矩陣的維數(shù);利用潛在語義索引技術(shù)將兩個用戶投影到一個低維的空間上,再計算兩者的相似度等。現(xiàn)實生活中,人與人之間自然地形成不同類型的社會關(guān)系網(wǎng)絡(luò)(如朋友關(guān)系、同事關(guān)系、合作關(guān)系),并通過這些關(guān)系網(wǎng)絡(luò)傳遞信息。其中,相互間的信任對信息的交流發(fā)揮著重要作用,如人們更樂意與他所信任的人交流,也更容易被他所信任的人影響,而這種信任關(guān)系可從社會網(wǎng)絡(luò)中發(fā)現(xiàn),我們稱之為信任關(guān)系。隨著web2.0的發(fā)展,人們(用戶)之間的社會關(guān)系網(wǎng)絡(luò),可以更容易的挖掘出來。因此,利用社會關(guān)系網(wǎng)絡(luò)中的信任關(guān)系,解決推薦系統(tǒng)的數(shù)據(jù)稀疏性問題,開始受到關(guān)注。2006年,Golbeck等人采用社會信任網(wǎng)絡(luò),根據(jù)目標(biāo)用戶信任的用戶對項目的評分來估計目標(biāo)用戶對項目的評分值。2007年,Avesani等人基于用戶的社會信任網(wǎng)絡(luò),采用有限步長的信任傳播方法,得到目標(biāo)用戶對其他用戶的估計信任值,基于信任估計值產(chǎn)生評分估計。2010年,Jebrin等人通過用戶之間的信任關(guān)系和用戶對項目的評分信息來計算每個用戶的“全局信譽”值,基于“全局信譽”值較高的用戶對項目的評分來估計目標(biāo)用戶對項目的評分。但以上方法將用戶間的信任關(guān)系和用戶對項目的評分信息隔離開來或者進(jìn)行簡單的線性融合,仍未能有效解決數(shù)據(jù)稀疏性對推薦系統(tǒng)的影響
發(fā)明內(nèi)容
針對用戶評分?jǐn)?shù)據(jù)稀疏導(dǎo)致推薦系統(tǒng)產(chǎn)生的推薦結(jié)果不準(zhǔn)確問題,本發(fā)明的目的是提供一種融合偏好信任關(guān)系的協(xié)同過濾推薦方法。該方法將互聯(lián)網(wǎng)上的多種信息源有效融合到圖模型中,利用馬爾可夫隨機游走方法,計算用戶間的相似度,進(jìn)行評分預(yù)測,可以獲得更準(zhǔn)確的推薦結(jié)果。本發(fā)明提供了一種融合偏好信任關(guān)系的協(xié)同過濾推薦方法,所述方法包括如下步驟 SI,基于用戶-項目評分?jǐn)?shù)據(jù),計算用戶間的相似度,構(gòu)建用戶偏好關(guān)系網(wǎng)絡(luò);S2,融合偏好關(guān)系網(wǎng)絡(luò)與信任關(guān)系網(wǎng)絡(luò),構(gòu)建用戶偏好信任關(guān)系網(wǎng)絡(luò);S3,基于馬爾可夫隨機游走方法,利用用戶偏好信任關(guān)系網(wǎng)絡(luò),計算用戶間的相似度,確定目標(biāo)用戶的相似近鄰;S4,根據(jù)目標(biāo)用戶的相似近鄰對某一項目的評分值,為目標(biāo)用戶預(yù)測其對相應(yīng)項目的評分值。
圖I給出了融合偏好信任關(guān)系的協(xié)同過濾推薦方法的流程示意圖。圖2用戶-項目評分?jǐn)?shù)據(jù)的矩陣示意3用戶偏好關(guān)系網(wǎng)絡(luò)示意4用戶信任關(guān)系數(shù)據(jù)的矩陣示意5用戶信任關(guān)系網(wǎng)絡(luò)示意6用戶偏好信任關(guān)系網(wǎng)絡(luò)示意7平均絕對誤差與P的關(guān)系8均方根與P的關(guān)系圖。
具體實施例方式以下實施例用于說明本發(fā)明,但不用來限制本發(fā)明的范圍?,F(xiàn)通過附圖和實施例對本發(fā)明作進(jìn)一步的詳細(xì)描述。本發(fā)明實施例的前提是已獲得了用戶-項目評分?jǐn)?shù)據(jù)與用戶信任關(guān)系數(shù)據(jù)。圖I為本發(fā)明實施例提供的融合偏好信任關(guān)系的協(xié)同過濾推薦方法流程示意圖,如圖I所示,本實施例主要包含以下步驟步驟SI,根據(jù)用戶-項目評分?jǐn)?shù)據(jù),按公式⑴計算用戶間的相似度Simin,構(gòu)建用戶偏好關(guān)系網(wǎng)絡(luò)Gp,計算出的Simij作為網(wǎng)絡(luò)Gp的邊權(quán)重
rlike ^ Tlike\ 丄 I Tdislike ^ Tdislike
njj | + |7,· CMj.半』Simij = jI IiKJlj I,⑴
0, i = j其中,Simij表示網(wǎng)絡(luò)Gp的節(jié)點(用戶)i和j間的邊權(quán)重,Ii表示被用戶i評分的項目集合,/廣(f)表示被用戶i(j)評分大于設(shè)定閥值的項的集合,和廣'te (f )表示被用戶i(j)評分小于設(shè)定閥值的項的集合。圖2為用戶-項目評分?jǐn)?shù)據(jù)的矩陣示意圖,U1,..., U5表示用戶,I1, . . .,I6表示項目,用戶評分有5個等級,分別為I、2、3、4、5,如果用戶對某項目評分,則在相應(yīng)位置標(biāo)出評分等級,如圖2,用戶U1對I1評分為3,對I3評分為2.用戶偏好關(guān)系網(wǎng)絡(luò)為帶權(quán)網(wǎng)絡(luò),根據(jù)用戶-項目數(shù)據(jù)構(gòu)建,網(wǎng)絡(luò)的權(quán)重根據(jù)用戶-項目評分?jǐn)?shù)據(jù),通過步驟SI計算得到。圖3為用戶偏好關(guān)系網(wǎng)絡(luò)示意圖,有向邊上的權(quán)重表示用戶間的偏好程度,如圖3用戶U1對U2的偏好程度(權(quán)重)為1/4,用戶U3對U4的偏好程度(權(quán)重)1/3。步驟S2,將步驟SI所得到的偏好關(guān)系網(wǎng)絡(luò)Gp與信任關(guān)系網(wǎng)絡(luò)Gt相融合,構(gòu)建用戶偏好/[目任關(guān)系網(wǎng)絡(luò)G。圖4為用戶信任關(guān)系數(shù)據(jù)的矩陣示意圖,U1,…,U5分別為5個用戶,用戶I如對用戶2信任,則U12= I。如圖4中,用戶U1對隊、U3存在信任關(guān)系。圖5為用戶信任關(guān)系網(wǎng)絡(luò)示意圖,用戶信任關(guān)系網(wǎng)絡(luò)是通過用戶信任關(guān)系數(shù)據(jù)構(gòu)建的帶權(quán)有向圖,有向邊上的權(quán)重表示用戶間是否存在信任關(guān)系。如圖5中,用戶U5信任U2,但用戶U2不信任U5。偏好關(guān)系網(wǎng)絡(luò)Gp與信任關(guān)系網(wǎng)絡(luò)Gt按照如下公式(2)進(jìn)行融合,得到用戶偏好信任關(guān)系網(wǎng)絡(luò)G
權(quán)利要求
1.一種融合偏好和信任關(guān)系的協(xié)同過濾推薦方法,其特征在于,包括如下步驟 Si,基于用戶-項目評分?jǐn)?shù)據(jù),計算用戶間的相似度,構(gòu)建用戶偏好關(guān)系網(wǎng)絡(luò); S2,融合偏好關(guān)系網(wǎng)絡(luò)與信任關(guān)系網(wǎng)絡(luò),構(gòu)建用戶偏好信任關(guān)系網(wǎng)絡(luò); S3,基于馬爾可夫隨機游走模型,利用用戶偏好信任關(guān)系網(wǎng)絡(luò),計算用戶間的相似度,確定目標(biāo)用戶的相似近鄰; S4,根據(jù)目標(biāo)用戶的相似近鄰對某一項目的評分值,為目標(biāo)用戶預(yù)測對相應(yīng)項目的評分值。
2.根據(jù)權(quán)利要求I所述的融合偏好信任關(guān)系的協(xié)同過濾推薦方法,其特征在于,該方法采用如下基本原理預(yù)測用戶對項目的評分值 存在共同信任關(guān)系或偏好關(guān)系的用戶,一般都有共同的習(xí)慣與愛好,融合兩種關(guān)系,可得到相對稠密的用戶相似度關(guān)系圖,基于這種稠密圖的相似度計算,能得到更為準(zhǔn)確的相似近鄰,進(jìn)而產(chǎn)生更準(zhǔn)確的評分預(yù)測值。
3.根據(jù)權(quán)利要求I所述的融合偏好信任關(guān)系的協(xié)同過濾推薦方法,其特征在于,基于用戶-項目評分?jǐn)?shù)據(jù),按照如下方法構(gòu)造用戶偏好關(guān)系網(wǎng)絡(luò)Gp
4.根據(jù)權(quán)利要求I所述的融合偏好信任關(guān)系的協(xié)同過濾推薦方法,其特征在于,將用 戶信任關(guān)系網(wǎng)絡(luò)Gt和偏好關(guān)系網(wǎng)絡(luò)Gp通過如下方法融合為帶權(quán)重的偏好信任關(guān)系網(wǎng)絡(luò)G
5.根據(jù)權(quán)利要求I所述的融合偏好信任關(guān)系的協(xié)同過濾推薦方法,其特征在于,基于偏好信任關(guān)系網(wǎng)絡(luò)G,按照如下方法計算目標(biāo)用戶節(jié)點i對其他用戶節(jié)點的相似度 設(shè)向量
6.根據(jù)權(quán)利要求I所述的融合偏好信任關(guān)系的協(xié)同過濾推薦方法,其特征在于,按照如下方法計算目標(biāo)用戶i對項目ο的評分預(yù)測值
全文摘要
一種融合偏好和信任關(guān)系的協(xié)同過濾推薦方法,包括下列主要步驟根據(jù)用戶-項目評分?jǐn)?shù)據(jù),挖掘用戶間的偏好關(guān)系,構(gòu)建偏好關(guān)系網(wǎng)絡(luò);融合偏好關(guān)系與信任關(guān)系,構(gòu)建偏好信任關(guān)系網(wǎng)絡(luò);基于偏好信任關(guān)系網(wǎng)絡(luò),利用馬爾可夫隨機游走方法,定位目標(biāo)用戶的相似近鄰;基于相似近鄰對某一項目的評分值,為目標(biāo)用戶預(yù)測相應(yīng)項目的評分值。本發(fā)明為推薦系統(tǒng)預(yù)測用戶對項目的評分提供了一種全新和高效的方法,與現(xiàn)有方法比較,本發(fā)明具有如下主要優(yōu)點(1)方法簡單,易于實現(xiàn),并且能產(chǎn)生更準(zhǔn)確的評分預(yù)測值。(2)該方法只有一個參數(shù),推薦結(jié)果對該參數(shù)不敏感,便于選擇。
文檔編號G06F17/30GK102779182SQ201210223579
公開日2012年11月14日 申請日期2012年7月2日 優(yōu)先權(quán)日2012年7月2日
發(fā)明者劉大有, 楊博, 趙學(xué)華, 趙鵬飛 申請人:吉林大學(xué)