選的,現(xiàn)有技術(shù)中的相似度計算可以采用針對Pearson系數(shù)的MAX改進方案以 下公式進行計算:
其中,;和巧分別是對商品i和j評過分的用戶集合,f為手動可調(diào)參數(shù),具體取值由 數(shù)據(jù)集而定,(ij)為商品i和j的Pearson相關(guān)系數(shù)。通常,滬取值一般在2-7之間, 在本申請中優(yōu)選為7=5。
[0030] 線性結(jié)合評分項相似度和現(xiàn)有技術(shù)中的相似度計算得到融合評分項的相似度。
[0031] 其中,參數(shù)#是用來均衡評分項相似度和現(xiàn)有技術(shù)中相似度的影響,在本申請中 根據(jù)實驗數(shù)據(jù),優(yōu)選翁=0.5。
[0032] St印4的優(yōu)選實施方式: 若商品i的最近商品集為N⑴,則用戶u對商品i的預(yù)測評分Pu,,可以根據(jù)用戶u對 最近商品集N(i)中的評分得到,計算方法如下:
其中表示商品i與其最近相似商品j之間的相似度,:?和A分別表示用戶對 商品i和j的平均評分。
[0033] 最后,根據(jù)計算得到的評分大小產(chǎn)生推薦商品。
[0034] 本申請還提供了一種基于行為預(yù)測的推薦裝置,如圖2所示,該推薦裝置包括: 評分收集模塊,收集用戶對商品的評分信息; 評分相似度計算模塊,根據(jù)商品評分的評分方差,計算評分相似度; 融合計算模塊,融合評分項的相似度; 推薦模塊,根據(jù)融合的評分項相似度得到最近商品集,預(yù)測用戶對商品的評分,并根據(jù) 評分大小產(chǎn)生推薦商品。
[0035] 下面詳細介紹每一模塊的優(yōu)選實施方式。
[0036] 評分收集模塊的優(yōu)選實施方式: 收集用戶對于商品的評分信息,并所有評分信息進行存儲。這里對評分信息的收集和 存儲可以采用現(xiàn)有技術(shù)中本領(lǐng)域技術(shù)人員公知的技術(shù)手段,優(yōu)選地,可以采用矩陣的形式 存儲用戶評分信息。
[0037] 用戶對商品的評分矩陣可以如下表所示:
可以看出,用戶評分的缺失,可以是所有評分項全部缺失,也可以是部分評分項缺失。
[0038] 評分相似度計算模塊的優(yōu)選實施方式: 通過計算評分項的相似度尋找該用戶的最相似用戶集。
[0039] 根據(jù)商品評分的評分方差,計算評分相似度。
[0040] 商品的評分方差越大表示用戶對該商品評分的相似度越小,評分方差越小表示用 戶對該商品評分的相似度越大。因此,不同商品i,j評分之間的相似度為:
其中、_髮是商品i和j的評分方差,評分方差適度表示了評分項之間方差差異的 大小。
[0041 ]例如,評分項 i、j、s 的方差分別是 I、1. 5 和 3,則 = S) = 0.5 ,方差差值越小,表示用戶對他們的評分項相似度越大。
[0042] 融合計算模塊的優(yōu)選實施方式: 融合評分項的相似度。
[0043] 優(yōu)選的,現(xiàn)有技術(shù)中的相似度計算可以采用針對Pearson系數(shù)的MX改進方案以 下公式進行計算:
其中,M和^:分別是對商品i和j評過分的用戶集合,尸為手動可調(diào)參數(shù),具體取值由 數(shù)據(jù)集而定,為商品i和j的Pearson相關(guān)系數(shù)。通常^取值一般在2-7之間, 在本申請中優(yōu)選為浐=5。
[0044] 線性結(jié)合評分項相似度和現(xiàn)有技術(shù)中的相似度計算得到融合評分項的相似度。
[0045] 其中,參數(shù)是用來均衡評分項相似度和現(xiàn)有技術(shù)中相似度的影響,在本申請中 根據(jù)實驗數(shù)據(jù),優(yōu)選#=0.5。
[0046] 推薦模塊的優(yōu)選實施方式: 若商品i的最近商品集為N⑴,則用戶u對商品i的預(yù)測評分Pu,,可以根據(jù)用戶u對 最近商品集N(i)中的評分得到,計算方法如下:
其中sjwU)表不商品i與其最近相似商品j之間的相似度,式和4分別表不用戶對 商品i和j的平均評分。
[0047] 最后,根據(jù)計算得到的評分大小產(chǎn)生推薦商品。
[0048] 本領(lǐng)域的技術(shù)人員應(yīng)明白,本申請的實施例可提供為方法、裝置(設(shè)備)、或計算 機程序產(chǎn)品。因此,本申請可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方 面的實施例的形式。
[0049] 盡管已描述了本申請的優(yōu)選實施例,但本領(lǐng)域內(nèi)的技術(shù)人員一旦得知了基本創(chuàng)造 性概念,則可對這些實施例作出另外的變更和修改。所以,所附權(quán)利要求意欲解釋為包括 優(yōu)選實施例以及落入本申請范圍的所有變更和修改。顯然,本領(lǐng)域的技術(shù)人員可以對本申 請進行各種改動和變型而不脫離本申請的精神和范圍。這樣,倘若本申請的這些修改和變 型屬于本申請權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本申請也意圖包含這些改動和變型在 內(nèi)。
【主權(quán)項】
1. 一種基于行為預(yù)測的推薦方法,包括: Stepl:收集用戶對商品的評分信息; Step2 :根據(jù)商品評分的評分方差,計算評分相似度; Step3 :融合評分項的相似度; Step4:根據(jù)融合的評分項相似度得到最近商品集,預(yù)測用戶對商品的評分,并根據(jù)評 分大小產(chǎn)生推薦商品。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,在所述St印2中根據(jù)商品評分的評分方差 計算評分項的相似度得到最相似商品集。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于:不同商品i,j評分之間的相似度為:其中!!^、^沒是商品i和j的評分方差,評分方差表示了評分項之間方差差異的大 小。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述St印3包括:將評分相似度和現(xiàn)有技 術(shù)中的計算得到的相似度線性融合得到評分項的相似度,其中所述現(xiàn)有技術(shù)的相似度計算 可以采用針對Pearson系數(shù)的MX改進方案以下公式進行計算:其中,M和^p分別是對商品i和j評過分的用戶集合,少為手動可調(diào)參數(shù),具體取值由 數(shù)據(jù)集而定,為商品i和j的Pearson相關(guān)系數(shù),f=5。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述St印4包括: 若商品i的最近商品集為N⑴,則用戶u對商品i的預(yù)測評分Pu,,可以根據(jù)用戶u對 最近商品集N(i)中的評分得到,計算方法如下:其中表示商品i與其最近相似商品j之間的相似度,:f和^分別表示用戶對 商品i和j的平均評分; 并且根據(jù)計算得到的評分大小產(chǎn)生推薦商品。6. -種基于行為預(yù)測的推薦裝置,包括: 評分收集模塊,收集用戶對商品的評分信息; 評分相似度計算模塊,根據(jù)商品評分的評分方差,計算評分相似度; 融合計算模塊,融合評分項的相似度; 推薦模塊,根據(jù)融合的評分項相似度得到最近商品集,預(yù)測用戶對商品的評分,并根據(jù) 評分大小產(chǎn)生推薦商品。7. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,在所述評分相似度計算模塊中根據(jù)商品 評分的評分方差計算評分項的相似度得到最相似商品集。8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于:不同商品i,j評分之間的相似度為:其中是商品i和j的評分方差,評分方差表示了評分項之間方差差異的大 小。9. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述融合計算模塊包括:將評分相似度和 現(xiàn)有技術(shù)中的計算得到的相似度線性融合得到評分項的相似度,其中所述現(xiàn)有技術(shù)的相似 度計算可以采用針對Pearson系數(shù)的MAX改進方案以下公式進行計算:其中,M和%分別是對商品i和j評過分的用戶集合,;?為手動可調(diào)參數(shù),具體取值由 數(shù)據(jù)集而定,為商品i和j的Pearson相關(guān)系數(shù),:f=5。10. 根據(jù)權(quán)利要求6所述的裝置,其特征在于,所述推薦模塊包括: 若商品i的最近商品集為N⑴,則用戶u對商品i的預(yù)測評分Pu,,可以根據(jù)用戶u對 最近商品集N(i)中的評分得到,計算方法如下:其中表不商品i與其最近相似商品j之間的相似度,式和4分別表不用戶對 商品i和j的平均評分; 并且根據(jù)計算得到的評分大小產(chǎn)生推薦商品。
【專利摘要】本發(fā)明提出了一種基于行為預(yù)測的推薦方法及裝置,所述推薦方法包括:Step1,收集用戶對商品的評分信息;Step2,根據(jù)商品評分的評分方差,計算評分相似度;Step3,融合評分項的相似度;Step4,根據(jù)融合的評分項相似度得到最近商品集,預(yù)測用戶對商品的評分,并根據(jù)評分大小產(chǎn)生推薦商品。
【IPC分類】G06Q30/02
【公開號】CN105046535
【申請?zhí)枴緾N201510541763
【發(fā)明人】劉申寧
【申請人】劉申寧
【公開日】2015年11月11日
【申請日】2015年8月31日