一種融合協(xié)同過(guò)濾算法和位置信息的目標(biāo)地推薦方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種融合協(xié)同過(guò)濾算法和位置信息的目標(biāo)地推薦方法。
【背景技術(shù)】
[0002] 在網(wǎng)絡(luò)爆炸的時(shí)代,人們往往要面對(duì)"信息過(guò)載"的問(wèn)題,即如何在海量的信息中 找到自己感興趣的信息。搜索引擎和推薦系統(tǒng)是目前解決該問(wèn)題的主要技術(shù),與搜索引擎 相比,用戶更加青睞于使用個(gè)性化推薦系統(tǒng),因?yàn)樗茏詣?dòng)的從用戶注冊(cè)信息、用戶瀏覽日 志、歷史評(píng)分記錄和項(xiàng)目信息等方面進(jìn)行分析,從而挖掘用戶的興趣偏好和項(xiàng)目的特征,然 后為用戶實(shí)現(xiàn)個(gè)人感興趣信息的私人訂制。
[0003] 因此,有必要設(shè)計(jì)一種融合協(xié)同過(guò)濾算法和位置信息的目標(biāo)地推薦方法。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明所要解決的技術(shù)問(wèn)題是提供一種融合協(xié)同過(guò)濾算法和位置信息的目標(biāo)地 推薦方法,該融合協(xié)同過(guò)濾算法和位置信息的目標(biāo)地推薦方法易于實(shí)施,結(jié)合了協(xié)同過(guò)濾 算法和旅行代價(jià)計(jì)算,為用戶給出了最佳目標(biāo)地的推薦,科學(xué)性和實(shí)用性強(qiáng),能為用戶的生 活和出行帶來(lái)極大的便利。
[0005] 發(fā)明的技術(shù)解決方案如下:
[0006] -種融合協(xié)同過(guò)濾算法和位置信息的目標(biāo)地推薦方法,計(jì)算(1)基于協(xié)同過(guò)濾 算法生成用戶u對(duì)目標(biāo)地i的預(yù)測(cè)評(píng)分P(u,i),以及⑵用戶u到目標(biāo)地i的旅行代價(jià) TravelPenalty(u, i);
[0007] 則最終目標(biāo)地i在用戶U的推薦列表中的推薦值定義為:
[0008] RecScore(u,i) = P (u,i)-TravelPenalty(u,i)
[0009] 針對(duì)多個(gè)目標(biāo)地i計(jì)算RecScore (u,i),并將RecScore (u,i)最大值對(duì)應(yīng)的目標(biāo) 地作為最終推薦的目標(biāo)地;
[0010] 多個(gè)目標(biāo)地位于距離當(dāng)前用戶U所在地半徑為距離閾值K的目標(biāo)區(qū)域內(nèi)。
[0011] 所述的預(yù)測(cè)評(píng)分P (U,i)計(jì)算方法如下:
[0013] 其中,S(i,k)是與目標(biāo)地i最相近的K個(gè)目標(biāo)地集合,N(U)是用戶u給過(guò)評(píng)分的 目標(biāo)地的集合;
[0014] ru, j是用戶u對(duì)目標(biāo)地j的評(píng)分;
[0015] @是所有N個(gè)用戶對(duì)目標(biāo)地i評(píng)分的均值,其計(jì)算公式為其中Tlt 表示用戶t對(duì)目標(biāo)地i的評(píng)分;
[0016] sim' (i,j)為余弦相似度修正值,有:
對(duì)數(shù)的底數(shù)默認(rèn)為10 ;
[0018] 其中sim(i,j)為修正前的余弦相似度:
[0020] %是用戶u對(duì)所有目標(biāo)地評(píng)分的均值;
[0021] 其中
,ru>1是用戶u對(duì)目標(biāo)地i的評(píng)分;r u, j 是用戶u對(duì)目標(biāo)地j的評(píng)分;%;是用戶u對(duì)所有目標(biāo)地【所有目標(biāo)地的范圍為前述的目標(biāo)區(qū) 域】評(píng)分的均值;U = N(i) n N(j)是給目標(biāo)地i和目標(biāo)地j都打過(guò)評(píng)分的用戶集合;N(i) 是給目標(biāo)地i打過(guò)評(píng)分的用戶集合,N(j)是給目標(biāo)地j打過(guò)評(píng)分的用戶集合;
[0022] 當(dāng)sim(i,j)為正時(shí),說(shuō)明目標(biāo)地i和目標(biāo)地j正相關(guān),具有相似性,具有推薦價(jià) 值。當(dāng)sim(i,j)為非正值時(shí),說(shuō)明目標(biāo)地i和目標(biāo)地j負(fù)相關(guān)或不相關(guān),不具有相似性,則 不具有推薦價(jià)值;并且計(jì)算修正后的相似度時(shí),只計(jì)算正相關(guān)的目標(biāo)地:
[0023] 評(píng)分的計(jì)算方法為:假定T天時(shí)間內(nèi),連接次數(shù)為n,那么評(píng)分為
由于歸 一化處理f后r的值過(guò)小,為防止量級(jí)誤差將r值倍數(shù)級(jí)增加。數(shù)字"7"并無(wú)特殊含義,此 處取該值。
[0024] 旅行代價(jià)TravelPenalty (u,i)的計(jì)算方法如下:
[0025] 給定用戶u的位置L,設(shè)定距離閾值K,得到距離用戶u旅行代價(jià)不大于K值的目 標(biāo)地集合;假定用戶u到目標(biāo)地i的距離為I1,則對(duì)應(yīng)的旅行代價(jià)為:
[0027] A和B兩點(diǎn)的距離1的計(jì)算公式為:
[0029] 其中Lat 1和Lungl分別為A點(diǎn)的經(jīng)煒度,Lat2和Lung2分別為B點(diǎn)的經(jīng)煒度;其 中a = Latl-Lat2為兩點(diǎn)煒度之差;b = Lungl-Lung2為兩點(diǎn)經(jīng)度之差;6378. 137為地球半 徑,單位為公里。
[0030] 對(duì)于多個(gè)目標(biāo)地,將計(jì)算得到的RecScore (u,i)按照降序排列,取前N個(gè)值輸出為 推薦目標(biāo)地列表。
[0031] 所述的目標(biāo)地為商鋪、展覽館或運(yùn)動(dòng)場(chǎng)館。
[0032] 用戶U對(duì)商鋪的評(píng)分是本用戶U對(duì)商鋪的評(píng)分。
[0033] 本方案基于全城布點(diǎn)的商鋪(以下均已商鋪為例進(jìn)行說(shuō)明,則這里的商鋪也可以 是展覽館等,特此說(shuō)明)AP上報(bào)的數(shù)據(jù)信息,根據(jù)用戶的行為記錄,為用戶推薦其感興趣的 私人訂制商鋪列表。由于商鋪具有位置屬性,用戶更加傾向于離自身距離較近的商鋪,同時(shí) 考慮需要付出的旅行代價(jià)。
[0034] 根據(jù)用戶的需求推薦:即只按照興趣度高低推薦或在興趣度的基礎(chǔ)上考慮地理因 素推薦??紤]地理因素推薦時(shí),需要用戶自己定位自己所在的位置(GPS獲取用戶所在地的 經(jīng)煒度)。
[0035] 有益效果:
[0036] 本發(fā)明的融合協(xié)同過(guò)濾算法和位置信息的目標(biāo)地推薦方法,易于實(shí)施,實(shí)施成本 低,且結(jié)合了協(xié)同過(guò)濾算法和旅行代價(jià)計(jì)算,為用戶給出了最佳目標(biāo)地的推薦,科學(xué)性和實(shí) 用性強(qiáng),能為用戶的生活和出行帶來(lái)極大的便利。
【具體實(shí)施方式】
[0037] 以下將結(jié)合具體實(shí)施例對(duì)本發(fā)明做進(jìn)一步詳細(xì)說(shuō)明:
[0038] 實(shí)施例1 :
[0039] 一、基于金字塔模型的協(xié)同過(guò)濾算法(PMCF)
[0040] PMCF算法首先忽略物品的位置信息,利用基于商鋪的協(xié)同過(guò)濾算法生成用戶u對(duì) 商鋪i的預(yù)測(cè)評(píng)分P (U,i),再考慮到商鋪的位置屬性對(duì)用戶興趣度的影響,最終商鋪i在 用戶u的推薦列表中的推薦值定義為:
[0041] RecScore(u,i) = P (u,i)-TravelPenalty(u,i)
[0042] 其中TravelPenalty (u,i)標(biāo)示用戶u到商鋪i的旅行代價(jià)。
[0043] 2. 1基于商鋪的協(xié)同過(guò)濾算法
[0044] 基于商鋪的協(xié)同過(guò)濾算法主要分為兩步:
[0045] 1)計(jì)算商鋪之間的相似度。
[0046] 2)根據(jù)商鋪的相似度和用戶的歷史行為為用戶生成推薦列表。
[0047] 2. I. 1商鋪相似度計(jì)算
[0048] 本方案采用修正的余弦相似度來(lái)計(jì)算商鋪之間的相似度。其中用戶對(duì)商鋪的評(píng)分 由一定周期內(nèi)用戶連接商鋪AP的次數(shù)表征。假定一定周期T天時(shí)間內(nèi),連接次數(shù)為n,那么 評(píng)分為Γ = f X 7,即將評(píng)分歸一化到[0, 7]范圍內(nèi)。
[0050] 其中
其中ru, i是用戶u對(duì)商鋪i的評(píng)分; ru, j是用戶u對(duì)商鋪j的評(píng)分;$是用戶對(duì)所有商鋪評(píng)分的均值;U = N(i) (? N(j)是給商 鋪i和商鋪j都打過(guò)評(píng)分的用戶集合。
[0051] 兩個(gè)商鋪如果被同一個(gè)用戶打過(guò)相同的評(píng)分,那么其商鋪之間的相似度比被同一 用戶打過(guò)不同評(píng)分的兩個(gè)商鋪之間的相似度高。本方案通過(guò)使用同一用戶對(duì)兩個(gè)商鋪的評(píng) 分差值的倒數(shù)來(lái)修正余弦相似度。公式如下:
[0053] 2. 1. 2生成推薦列表
[0054] 給定一個(gè)用戶u,通過(guò)計(jì)算用戶u對(duì)商鋪i的預(yù)測(cè)評(píng)分P (u,i)來(lái)判斷用戶u對(duì)商 鋪i的喜好程度。公式如下:
[0056] 其中S(i,k)是與商鋪i最相近的K個(gè)商鋪集合,N(U)是用戶u給過(guò)評(píng)分的商鋪 的集合。設(shè)置最低推薦值,將大于最低推薦值的商鋪生成Top-N推薦列表提供給用戶。
[0057] 2. 2基于位置信息的推薦
[0058] 推薦系統(tǒng)首先忽略商鋪的位置信息,使用基于商鋪的協(xié)同過(guò)濾算法生成用戶u對(duì) 商鋪i的預(yù)測(cè)評(píng)分P (u,i)。再考慮商鋪的位置信息對(duì)用戶興趣度的影響,最終物品i在用 戶u的推薦列表中定義為:
[0059] RecScore(u,i) = P (u,i)-TravelPenalty(u,i)
[0060] 其中TravelPenalty (u,i)表示為用戶u到商鋪i的旅行代價(jià)。TravelPenalty (u, i)的基本思想是對(duì)商鋪i與用戶u之前評(píng)分的所有商鋪的位置計(jì)算距離的平均值,然后將 所求的平均值歸一化到評(píng)分取值的相同范圍內(nèi),如[0, 1]。
[0061] 給定用戶u的位置L,設(shè)定K值(距離閾值),返回距離用戶u旅行代價(jià)不大于K值 的商鋪集合。假定用戶u到商鋪i的距離為I1,這時(shí)其旅行代價(jià)為:
即將旅行代價(jià)歸一化到[0,1]范圍內(nèi),用戶可以隨意定