一種基于項(xiàng)目的混合顯性隱性反饋的協(xié)同過濾推薦算法
【專利摘要】本發(fā)明公開了一種基于項(xiàng)目的混合顯性隱性反饋的協(xié)同過濾推薦算法,包括以下步驟:獲得用戶對(duì)各個(gè)項(xiàng)目的興趣信息,建立各用戶對(duì)所有項(xiàng)目的評(píng)分矩陣;計(jì)算每個(gè)用戶的平均評(píng)分、每個(gè)項(xiàng)目的評(píng)分用戶數(shù)、每個(gè)項(xiàng)目的平均得分;計(jì)算共同評(píng)價(jià)用戶數(shù)矩陣;計(jì)算任意兩個(gè)項(xiàng)目之間的Pearson相似度和修正余弦相似度;計(jì)算基于顯性反饋的相似度;計(jì)算基于隱形反饋的余弦相似度;計(jì)算最終相似度;獲取當(dāng)前項(xiàng)目的最近鄰居集I;向目標(biāo)用戶u提供推薦列表時(shí),依據(jù)評(píng)分矩陣,得到目標(biāo)用戶u已評(píng)分項(xiàng)目和目標(biāo)用戶u未評(píng)分項(xiàng)目;計(jì)算目標(biāo)用戶u未評(píng)分項(xiàng)目的預(yù)測評(píng)分,選取其中預(yù)測評(píng)分最高的N個(gè)項(xiàng)目推薦給用戶。本發(fā)明可以有效地提高預(yù)測推薦的準(zhǔn)確度。
【專利說明】一種基于項(xiàng)目的混合顯性隱性反饋的協(xié)同過濾推薦算法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及個(gè)性化推薦【技術(shù)領(lǐng)域】,具體涉及一種基于項(xiàng)目的混合顯性隱性反饋的協(xié)同過濾推薦算法。
【背景技術(shù)】
[0002]推薦系統(tǒng)是為解決信息過載問題而提出的一種智能代理系統(tǒng),能從大量信息中向用戶自動(dòng)推薦出符合其興趣偏好或需求的資源。隨著互聯(lián)網(wǎng)的普及和飛速發(fā)展,推薦系統(tǒng)已經(jīng)被廣泛應(yīng)用于各種領(lǐng)域,尤其在電子商務(wù)領(lǐng)域,推薦系統(tǒng)得到了越來越多的研究和應(yīng)用。目前,幾乎所有的大型電子商務(wù)網(wǎng)站都不同程度的使用了各種形式的推薦系統(tǒng),比如Amazon、eBay和當(dāng)當(dāng)網(wǎng)上書店等,在現(xiàn)有使用的推薦系統(tǒng)中,協(xié)同過濾技術(shù)獲得了較大的成功。
[0003]協(xié)同過濾算法主要有基于用戶的協(xié)同過濾算法和基于項(xiàng)目的協(xié)同過濾算法,這兩種算法的輸入都是用戶對(duì)項(xiàng)目的評(píng)分矩陣,用戶對(duì)項(xiàng)目的評(píng)分可以顯式獲得,例如:通過用戶對(duì)項(xiàng)目進(jìn)行評(píng)分操作;也可以隱式獲得,例如:通過用戶對(duì)項(xiàng)目的捜索、瀏覽、購買等行為構(gòu)造評(píng)分函數(shù)計(jì)算得到。矩陣的每一行形成的向量表示該行對(duì)應(yīng)用戶的對(duì)各個(gè)項(xiàng)目的評(píng)分向量。
[0004]基于用戶的協(xié)同過濾算法的基本原理是利用用戶對(duì)項(xiàng)目評(píng)分的相似性來互相推薦用戶可能感興趣的項(xiàng)目。例如:對(duì)當(dāng)前用戶U,推薦系統(tǒng)通過其評(píng)分記錄及特定相似度函數(shù),計(jì)算出與其評(píng)分行為最相近的k個(gè)用戶作為用戶U的最近鄰居集,統(tǒng)計(jì)用戶U的近鄰用戶評(píng)分過而用戶U未評(píng)分的項(xiàng)目生成候選推薦集,然后計(jì)算用戶U對(duì)候選推薦集中每個(gè)項(xiàng)目i的預(yù)測評(píng)分,取其中預(yù)測評(píng)分最高的N個(gè)項(xiàng)目作為用戶U的Top-N推薦集。
[0005]基于項(xiàng)目的協(xié)同過濾算法則比較項(xiàng)目之間的相似性,根據(jù)當(dāng)前用戶已評(píng)分的項(xiàng)目集合推薦未評(píng)分的項(xiàng)目。由于項(xiàng)目之間的相似性比用戶相似性穩(wěn)定,因此可以離線進(jìn)行計(jì)算存儲(chǔ)并定期更新,所以基于項(xiàng)目的協(xié)同過濾算法相對(duì)于基于用戶的協(xié)同過濾算法,推薦精度高,實(shí)時(shí)性好,對(duì)基于項(xiàng)目的協(xié)同過濾算法進(jìn)行優(yōu)化,能夠使推薦準(zhǔn)確度更高、效果更佳、更符合客戶需求。
[0006]基于項(xiàng)目的協(xié)同推薦的基本處理流程,分為線下相似度計(jì)算和線上推薦兩個(gè)部分。線下相似度計(jì)算流程用于計(jì)算并保存項(xiàng)目間的相似度包括以下步驟:步驟1:獲取每一用戶對(duì)每個(gè)項(xiàng)目的評(píng)分矩陣;步驟2:計(jì)算各個(gè)項(xiàng)目間相似度,相似度函數(shù)可采用余弦相似度、皮爾森相似度(Pearson)等;步驟3:存儲(chǔ)各個(gè)不同項(xiàng)目間相似度。
[0007]在預(yù)先計(jì)算存儲(chǔ)了各個(gè)不同項(xiàng)目間相似度的基礎(chǔ)上,線上推薦流程如下:步驟1:獲取待推薦的用戶標(biāo)識(shí)(ID),即目標(biāo)用戶標(biāo)識(shí)(ID);步驟2:獲取目標(biāo)用戶ID對(duì)應(yīng)的目標(biāo)用戶已經(jīng)評(píng)分的項(xiàng)目集合;步驟3:根據(jù)預(yù)先存儲(chǔ)的項(xiàng)目相似度數(shù)據(jù),獲取與目標(biāo)用戶已經(jīng)評(píng)分的項(xiàng)目集合中各項(xiàng)目相似度高的項(xiàng)目,形成該目標(biāo)用戶的待推薦項(xiàng)目集;步驟4:根據(jù)項(xiàng)目間相似度,進(jìn)一步計(jì)算目標(biāo)用戶對(duì)待推薦項(xiàng)目集中每個(gè)項(xiàng)目的預(yù)測評(píng)分,例如:根據(jù)如下公式計(jì)算預(yù)測評(píng)分,
【權(quán)利要求】
1.一種基于項(xiàng)目的混合顯性隱性反饋的協(xié)同過濾推薦算法,其特征在于,包括以下步驟: (1)服務(wù)器通過跟蹤用戶的訪問,獲得用戶對(duì)各個(gè)項(xiàng)目的興趣信息,并根據(jù)設(shè)定的評(píng)分原則,利用所獲得的興趣信息建立各用戶對(duì)所有項(xiàng)目的評(píng)分矩陣; (2)根據(jù)所述評(píng)分矩陣計(jì)算每個(gè)用戶的平均評(píng)分、每個(gè)項(xiàng)目的評(píng)分用戶數(shù)、每個(gè)項(xiàng)目的平均得分; (3)根據(jù)所述評(píng)分矩陣計(jì)算共同評(píng)價(jià)用戶數(shù)矩陣,所述共同評(píng)價(jià)用戶數(shù)矩陣用于記錄對(duì)任意兩個(gè)項(xiàng)目都有評(píng)分的共同用戶數(shù); (4)計(jì)算任意兩個(gè)項(xiàng)目之間的Pearson相似度和修正余弦相似度; (5)利用Pearson相似度和修正余弦相似度計(jì)算基于顯性反饋的相似度Simk(i,j),計(jì)算公式如下:
Simk (i, j) = aSimr(i, j) + (1-a) Simc (i, j) 其中,a為常數(shù); Simr (i, j)為項(xiàng)目i和項(xiàng)目j的Pearson相似度; Simc (i, j)為項(xiàng) 目i和項(xiàng)目j的修正余弦相似度; (6)依據(jù)步驟(2)中每個(gè)項(xiàng)目的評(píng)分用戶數(shù)以及步驟(3)中得到的共同評(píng)價(jià)用戶數(shù)矩陣,計(jì)算基于隱形反饋的余弦相似度; (7)利用步驟(5)基于顯性反饋的相似度和步驟(6)基于隱性反饋的相似度,計(jì)算最終相似度; (8)針對(duì)每個(gè)項(xiàng)目,根據(jù)其它項(xiàng)目與當(dāng)前項(xiàng)目的最終相似度由高到低的順序,對(duì)其它項(xiàng)目進(jìn)行排序,在得到的序列中選擇最終相似度大于閾值的至多K個(gè)項(xiàng)目作為當(dāng)前項(xiàng)目的最近鄰居項(xiàng)目,所有最近鄰居項(xiàng)目構(gòu)成當(dāng)前項(xiàng)目的最近鄰居集I ; (9)向目標(biāo)用戶u提供推薦列表時(shí),首先依據(jù)步驟(1)所得的評(píng)分矩陣,得到目標(biāo)用戶u已評(píng)分項(xiàng)目和目標(biāo)用戶u未評(píng)分項(xiàng)目; (10)計(jì)算目標(biāo)用戶u未評(píng)分項(xiàng)目的預(yù)測評(píng)分,選取其中預(yù)測評(píng)分最高的N個(gè)項(xiàng)目推薦給用戶。
2.如權(quán)利要求1所述的基于項(xiàng)目的混合顯性隱性反饋的協(xié)同過濾推薦算法,其特征在于,所述步驟(4)中Peanson相似度的計(jì)算公式如下: 其中:U表示對(duì)項(xiàng)目i和項(xiàng)目j都評(píng)分過的用戶集合; Riu表示用戶U對(duì)項(xiàng)目i的評(píng)分; 瓦表示項(xiàng)目i的平均得分; R,,,表示用戶u對(duì)項(xiàng)目j的評(píng)分; 瓦表示項(xiàng)目j的平均得分。
3.如權(quán)利要求2所述的基于項(xiàng)目的混合顯性隱性反饋的協(xié)同過濾推薦算法,其特征在于,所述步驟(4)中修正余弦相似度的計(jì)算公式如下:
4.如權(quán)利要求3所述的基于項(xiàng)目的混合顯性隱性反饋的協(xié)同過濾推薦算法,其特征在于,所述步驟(6)中基于隱形反饋的余弦相似度Simv(i,j)的計(jì)算公式如下:
5.如權(quán)利要求4所述的基于項(xiàng)目的混合顯性隱性反饋的協(xié)同過濾推薦算法,其特征在于,所述步驟(7)中最終相似度的計(jì)算公式如下:
Sim(i, j) = Simk (i, j)*Simv(i, j)。
6.如權(quán)利要求5所述的基于項(xiàng)目的混合顯性隱性反饋的協(xié)同過濾推薦算法,其特征在于,所述步驟(10)中預(yù)測評(píng)分的計(jì)算公式如下:
【文檔編號(hào)】G06F19/00GK103745100SQ201310738030
【公開日】2014年4月23日 申請(qǐng)日期:2013年12月27日 優(yōu)先權(quán)日:2013年12月27日
【發(fā)明者】尹建偉, 張宗禹, 李瑩, 鄧水光, 吳朝暉, 吳建 申請(qǐng)人:浙江大學(xué)