欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于用戶軌跡的協(xié)同過濾推薦方法、裝置及系統(tǒng)的制作方法

文檔序號:6398658閱讀:223來源:國知局
專利名稱:一種基于用戶軌跡的協(xié)同過濾推薦方法、裝置及系統(tǒng)的制作方法
技術領域
本發(fā)明涉及網絡技術領域,具體涉及一種基于用戶軌跡的協(xié)同過濾推薦方法、裝置及系統(tǒng)。
背景技術
隨著互聯(lián)網技術的不斷發(fā)展,用戶能夠獲得的信息量不斷增加,用戶面臨著信息過載的問題。例如,當用戶以休閑為目的沒有明確需求時瀏覽視頻網站或視頻客戶端時,面對數不勝數的視頻文件,用戶會面對不知如何進行選擇的問題。因此,需要推薦系統(tǒng)幫助用戶進行信息過濾。協(xié)同過濾推薦是信息過濾和信息系統(tǒng)中的一項重要技術。在現有技術中,協(xié)同過濾推薦算法的步驟包括:記錄并統(tǒng)計用戶的瀏覽記錄;利用存在相似興趣的用戶群體或與用戶興趣相似的信息做推薦;當用戶產生新的瀏覽行為時,推薦系統(tǒng)對用戶沒有看過但可能感興趣的信息隊列重新排序,推薦給用戶。但是,協(xié)同過濾推薦算法在線運算中往往需要考慮到實際服務器的壓力來簡化算法。在擁有千萬級用戶的網站中,如果要維護一個用戶相似度矩陣,從存儲和計算的角度來說,維護成本很高。因此在實際應用中在線計算通常不會遍歷所有的用戶或者用戶所有的瀏覽記錄,只能截取一小部分用戶及一小部分用戶的瀏覽記錄,依據幾個共同的瀏覽記錄來判斷相似興趣的用戶群體,而這些瀏覽記錄的產生很可能是偶然發(fā)生而非興趣類似導致。因此,以此為據進行推薦往往準確率不高,并且很難將推薦理由介紹給被推薦用戶。另夕卜,對于新用戶來說,由于缺乏該用戶的瀏覽記錄,故很難預測其感興趣的內容,推薦系統(tǒng)會遇到冷啟動現象。

發(fā)明內容
有鑒于此,本發(fā)明的主要目的是提供一種基于用戶軌跡的協(xié)同過濾推薦方法、裝置及系統(tǒng),以解決現有技術中協(xié)同過濾推薦方法推薦準確率不高的問題。為解決上述問題,本發(fā)明提供的技術方案如下:—種基于用戶軌跡的協(xié)同過濾推薦方法,所述方法包括:獲得移動終端的位置信息,根據所述位置信息確定用戶的地理位置坐標;對由所述地理位置坐標確定的位置點進行聚類,確定所述用戶的用戶軌跡,所述用戶軌跡為半徑小于第一閾值且所述位置點密度大于第二閾值的區(qū)域;比較目標用戶與其他用戶的用戶軌跡,確定所述目標用戶的近鄰用戶,所述目標用戶為所述用戶中待提供推薦結果的用戶;獲得并保存所述用戶的瀏覽記錄;根據所述目標用戶與所述近鄰用戶的所述瀏覽記錄,利用協(xié)同過濾算法,為目標用戶提供推薦結果。相應的,所述比較目標用戶與其他用戶的用戶軌跡,確定所述目標用戶的近鄰用戶,包括:
比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與所述目標用戶的用戶軌跡直接相交區(qū)域面積大于第三閾值的其他用戶確定為所述目標用戶的近鄰用戶;比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與所述目標用戶的用戶軌跡間接相交區(qū)域面積大于第四閾值的其他用戶確定為所述目標用戶的近鄰用戶。相應的,所述根據所述目標用戶與所述近鄰用戶的所述瀏覽記錄,利用協(xié)同過濾算法,為目標用戶提供推薦結果,包括:根據所述目標用戶與所述近鄰用戶的所述瀏覽記錄,計算所述目標用戶與每個近鄰用戶的興趣相似度;確定所述近鄰用戶中與所述目標用戶中興趣相似度大于第五閾值的用戶為所述目標用戶的興趣相似用戶;根據所述興趣相似用戶的瀏覽記錄,獲得為目標用戶提供的推薦結果。相應的,所述方法還包括:當所述地理位置坐標數據不斷增加,利用機器學習,調整第一閾值和/或第二閾值的取值范圍。相應的,所述方法還包括:將所述用戶化分為若干組;在為不同組用戶中的所述目標用戶分別提供推薦結果的過程中,設置不同的所述第三閾值、所述第四閾值和/或所述第五閾值;獲得不同組的目標用戶的推薦結果轉化率;根據所述不同組的目標用戶的推薦結果轉化率,調整所述第三閾值、所述第四閾值和/或所述第五閾值。—種基于用戶軌跡的協(xié)同過濾推薦裝置,所述裝置包括:第一確定單元,用于獲取移動終端的位置信息,根據所述位置信息確定用戶的地理位置坐標;第二確定單元,用于對由所述地理位置坐標確定的位置點進行聚類,確定所述用戶的用戶軌跡,所述用戶軌跡為半徑小于第一閾值且所述位置點密度大于第二閾值的區(qū)域;第三確定單元,用于比較目標用戶與其他用戶的用戶軌跡,確定所述目標用戶的近鄰用戶,所述目標用戶為所述用戶中待提供推薦結果的用戶;第一獲得單元,用于獲得并保存所述用戶的瀏覽記錄;推薦單元,用于根據所述目標用戶與所述近鄰用戶的所述瀏覽記錄,利用協(xié)同過濾算法,為目標用戶提供推薦結果。相應的,所述第三確定單元包括:第一確定子單元,用于比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與所述目標用戶的用戶軌跡直接相交區(qū)域面積大于第三閾值的其他用戶確定為所述目標用戶的近鄰用戶;第二確定子單元,用于比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與所述目標用戶的用戶軌跡間接相交區(qū)域面積大于第四閾值的其他用戶確定為所述目標用戶的近鄰用戶。
相應的,所述推薦單元包括:計算子單元,用于根據所述目標用戶與所述近鄰用戶的所述瀏覽記錄,計算所述目標用戶與每個近鄰用戶的興趣相似度;第三確定子單元,用于確定所述近鄰用戶中與所述目標用戶中興趣相似度大于第五閾值的用戶為所述目標用戶的興趣相似用戶;推薦子單元,用于根據所述興趣相似用戶的瀏覽記錄,獲得為目標用戶提供的推薦結果。相應的,所述裝置還包括:第一調整單元,用于當所述地理位置坐標數據不斷增加,利用機器學習,調整第一閾值和/或第二閾值的取值范圍。相應的,所述裝置還包括:劃分單元,用于將所述用戶化分為若干組;設置單元,用于在為不同組用戶中的所述目標用戶分別提供推薦結果的過程中,設置不同的所述第三閾值、所述第四閾值和/或所述第五閾值;第二獲得單元,用于獲得不同組的目標用戶的推薦結果轉化率;第二調整單元,用于根據所述不同組的目標用戶的推薦結果轉化率,調整所述第三閾值、所述第四閾值和/或所述第五閾值。一種基于用戶軌跡的協(xié)同過濾推薦系統(tǒng),所述系統(tǒng)包括:若干個移動終端以及推薦服務器;所述推薦服務器是權利要求6-10任一項所述的基于用戶軌跡的協(xié)同過濾推薦裝置;所述移動終端,用于向所述推薦服務器發(fā)送位置信息以及用戶的瀏覽記錄并獲得所述推薦服務器為目標用戶提供的推薦結果。由此可見,本發(fā)明具有如下有益效果:本發(fā)明利用移動設備對用戶的地理位置坐標進行聚類,產生用戶軌跡,利用用戶軌跡確定近鄰用戶,可以將興趣相似的用戶在空間上進行劃分,進而通過近鄰用戶及其瀏覽記錄,將用戶線上行為和線下行為相結合,利用協(xié)同過濾算法獲得推薦結果。由于用戶的活動范圍可以反映該用戶的自身屬性,同時將全國范圍內的用戶相似度計算大幅度降低為附近區(qū)域高度重疊的用戶相似度計算,降低了計算難度,提高了推薦準確率。另外,一個新用戶只要產生用戶軌跡,就可以在其瀏覽記錄不足夠的情況下,利用其近鄰用戶的瀏覽記錄為該新用戶提供推薦結果,避免了推薦系統(tǒng)冷啟動的現象。


圖1為本發(fā)明基于用戶軌跡的協(xié)同過濾推薦方法的流程圖;圖2為本發(fā)明中用戶軌跡的示意圖;圖3為本發(fā)明中近鄰用戶的示意圖;圖4為本發(fā)明基于用戶軌跡的協(xié)同過濾推薦方法的一種實施例流程圖;圖5為本發(fā)明中用戶-物品排列表以及物品-用戶排列表的示意圖;圖6為本發(fā)明中用戶相似度矩陣表的示意圖7為本發(fā)明基于用戶軌跡的協(xié)同過濾推薦方法的一種具體實施例的流程圖;圖8為本發(fā)明基于用戶軌跡的協(xié)同過濾推薦裝置的示意圖;圖9為本發(fā)明基于用戶軌跡的協(xié)同過濾推薦裝置中的第三確定單元的示意圖;圖10為本發(fā)明基于用戶軌跡的協(xié)同過濾推薦裝置中的推薦單元的示意圖;圖11為本發(fā)明基于用戶軌跡的協(xié)同過濾推薦裝置的一種具體實施例的示意圖;圖12為本發(fā)明實現基于用戶軌跡的協(xié)同過濾推薦系統(tǒng)的示意圖。
具體實施例方式為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結合附圖和具體實施方式
對本發(fā)明實施例作進一步詳細的說明。本發(fā)明基于用戶軌跡的協(xié)同過濾推薦方法,主要是針對現有技術中協(xié)同過濾推薦方法推薦準確率低的問題。由于興趣特征類似的用戶在空間上的活動也往往存在區(qū)域高度重疊的現象,如:某重點大學的學生人群、某IT公司的職員,這些人群在興趣上有分別,在活動范圍上各自保持一定的區(qū)域,區(qū)域間的人群很少相互重疊,而同一群體內的人活動范圍基本類似。因此,提出引入地理位置服務獲取用戶位置信息后,通過用戶軌跡分析,可以從看似雜亂無章的用戶位置集合中確定出用戶的主要活動區(qū)域,并根據重疊區(qū)域找出近鄰用戶,將其它近鄰用戶的興趣愛好聯(lián)系用戶目標,使用戶在瀏覽、挑選網頁信息時,例如瀏覽視頻時,給出用戶更有效的推薦,使移動在線瀏覽與傳統(tǒng)的PC在線瀏覽形成差異?;谏鲜鏊枷?,參見圖1所示,本發(fā)明用戶軌跡的協(xié)同過濾推薦方法,包括以下步驟:步驟101:獲得移動終端的位置信息,根據位置信息確定用戶的地理位置坐標。對同意開啟該功能的用戶,在用戶開啟該功能時,為每個用戶使用的移動終端分配不同的經過加密的唯一編號,匿名統(tǒng)計該移動終端(即代表該用戶)的位置信息。具體的,位置信息可以通過GPS、wifi網絡或移動運營商基站獲得。將位置地理轉換為地理位置坐標,如經緯度坐標。該地理位置坐標與實際地址無關,即采用“雙匿名”模式,既可以保護用戶的隱私,有可以獲得用戶的位置信息,完成用戶行為分析。步驟102:對由地理位置坐標確定的位置點進行聚類,確定用戶的用戶軌跡,用戶軌跡為半徑小于第一閾值且位置點密度大于第二閾值的區(qū)域。用戶的地理位置坐標可以形成位置點的集合,對這些位置點進行聚類,形成用戶的用戶軌跡,即用戶主要活動的區(qū)域,可以以此來描述該用戶的屬性,每個用戶形成的用戶軌跡可以為若干個“點簇”。具體的,可以設置第二閾值,將密度大于第二閾值的位置點集聚類,將密度小于或等于第二閾值的位置點集拋棄,并考慮到點集的連續(xù)性,盡量減少形成“點簇”的數量,最后形成用戶的軌跡。聚類的同時考慮到最大聚合半徑(第一閾值),該參數可以不斷進行調整,保證聚類而成的每個“點簇”不會無限制的擴大,從而保證協(xié)同的效果。參見圖2所示,對由地理位置坐標確定的位置點進行聚類后確定的用戶軌跡,可以抽象為若干個“點簇”,例如,一個用戶常見的用戶軌跡通常會包括兩個“點簇居住地區(qū)3公里以內”以及“工作地區(qū)3公里以內”,其它零星點由于其位置點集密度不能達到第二閾值,則可以被拋棄。
步驟103:比較目標用戶與其他用戶的用戶軌跡,確定目標用戶的近鄰用戶,目標用戶為用戶中待提供推薦結果的用戶。具體的,該步驟可以包括:比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與目標用戶的用戶軌跡直接相交區(qū)域面積大于第三閾值的其他用戶確定為目標用戶的近鄰用戶;比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與目標用戶的用戶軌跡間接相交區(qū)域面積大于第四閾值的其他用戶確定為目標用戶的近鄰用戶。在步驟102中,獲得了每個用戶的用戶軌跡,可以通過判斷每個用戶的用戶軌跡直接的相交情況,確定近鄰用戶。參見圖3所示,例如,一個用戶目標A與其他用戶B-H在居住地區(qū)的用戶軌跡如圖所示,當目標用戶的用戶軌跡與其他用戶的用戶軌跡直接相交面積區(qū)域大于第三閾值時,例如,用戶A與用戶C、D,則用戶C、D為用戶A的近鄰用戶;當目標用戶的用戶軌跡與其他用戶的用戶軌跡間接相交面積區(qū)域大于第四閾值時,例如,用戶A與用戶B、E,則用戶B、E為用戶A的近鄰用戶;當目標用戶的用戶軌跡與其他用戶的用戶軌跡相切或不相交時,為非近鄰用戶,例如用戶H ;當目標用戶的用戶軌跡與其他用戶的用戶軌跡間接相交面積區(qū)域小于或等于第四閾值時,為非近鄰用戶,例如用戶F、G。這樣,可以獲得目標用戶的所有近鄰用戶,另外,也可以說這些用戶互為近鄰用戶,例如,用戶A、B、C、D、E之間互為近鄰用戶。步驟104:獲得并保存用戶的瀏覽記錄。用戶對網站的操作可定義為用戶行為,用戶行為可以包括所有能表示用戶喜好的與網站系統(tǒng)交互的操作,用戶行為在網站中的通常用用戶日志的形式保存。具體的,可以通過用戶日志獲得并保存用戶在網站中的瀏覽記錄。步驟105:根據目標用戶與近鄰用戶的瀏覽記錄,利用協(xié)同過濾算法,為目標用戶提供推薦結果。協(xié)同過濾算法是研究預測用戶行為的一類算法,一般是指在個性化推薦系統(tǒng)中,當一個目標用戶A需要個性化推薦時,可以先找到和他有相似特征的人群,然后把那些用戶喜歡而用戶A沒有聽說過的物品推薦給A,或者根據A以往喜好過的物品,將類似的物品推薦給用戶,這種方法稱協(xié)同過濾算法。在上述實施例中,步驟101-103可以與步驟104并行執(zhí)行。本發(fā)明利用目標用戶與近鄰用戶的瀏覽記錄,為目標用戶提供推薦結果,將興趣愛好類似的用戶在空間上進行劃分,幫助用戶發(fā)現對自己有價值的信息,為用戶提供更好的使用體驗。參見圖4所示,在上述實施例中,根據目標用戶與近鄰用戶的瀏覽記錄,利用協(xié)同過濾算法,為目標用戶提供推薦結果,具體可以包括:步驟1051:根據目標用戶與近鄰用戶的瀏覽記錄,計算目標用戶與每個近鄰用戶的興趣相似度。假設有用戶U和用戶V,令N (U)為用戶U的瀏覽記錄的集合,N(V)為用戶V的瀏覽
w I尋)rw(v)|
記錄的集合,根據用戶矩陣表,用戶U和用戶V的興趣相似度Wuv為M,'釋)丨叫釋;I。參見圖5所示,可以在近鄰用戶中獲得用戶-物品排列表,例如用戶A-E,瀏覽記錄1-V,可以將用戶-物品排列表轉換為物品-用戶排列表。參見圖6所示,以5個用戶為例,根據物品-用戶排列表可以得到用戶矩陣表,表格中的數值為用戶之間的興趣相似度示例,例如對物品I,用戶A、B、E都操作過,因此AB、BA、AE、EA、BE、EB的相似度加1,以此類推,當掃描完全部瀏覽記錄后,即可以得到Wuv的分子部分。本發(fā)明的方法在近鄰用戶中計算興趣相似度,可以簡化用戶矩陣,大幅降低服務器的計算壓力,同時,降低新用戶冷啟動現象,提高推薦結果。步驟1052:確定近鄰用戶中與目標用戶中興趣相似度大于第五閾值的用戶為目標用戶的興趣相似用戶。步驟1053:根據興趣相似用戶的瀏覽記錄,獲得為目標用戶提供的推薦結果。假設用戶U對物品i感興趣的程度為:P(UJ) =唭中,S (U,K)表示和
用戶U興趣最接近的K個用戶,N(i)是對物品i有過行為的用戶集合,Wuv表示用戶U和用戶V之間的興趣相似度,rvi表示用戶V對物品i的興趣。即可通過興趣相似用戶的瀏覽記錄,獲得為目標用戶提供的推薦結果。本發(fā)明用戶軌跡的協(xié)同過濾推薦方法還可以包括:當地理位置坐標數據不斷增加,利用機器學習,調整第一閾值和/或第二閾值的取值范圍。當地理位置坐標數據不斷增加時,用戶經常活動區(qū)域更加突出,可以調整第一閾值和/或第二閾值的取值范圍,即可以調整“點簇”半徑,并進一步控制最大近鄰數目,使得協(xié)同推薦結果更加準確。

另外,本發(fā)明用戶軌跡的協(xié)同過濾推薦方法還可以包括:將用戶化分為若干組;在為不同組用戶中的目標用戶分別提供推薦結果的過程中,設置不同的第三閾值、第四閾值和/或第五閾值;獲得不同組的目標用戶的推薦結果轉化率;根據不同組的目標用戶的推薦結果轉化率,調整第三閾值、第四閾值和/或第五閾值。該方法是一種在線算法測評試驗方法,當用戶訪問時,將用戶劃分為若干個組,將部分用戶在使用推薦功能時設置新的參數值,而另一部分用戶在使用推薦功能時依然使用原有的參數值,通過對推薦結果轉化率的分析,評估新的參數值是否優(yōu)于舊的參數值,并確定優(yōu)于現有參數值的方法進行調整。例如,對視頻信息對用戶進行推薦,推薦結果轉化率是指視頻播放次數與視頻展示次數之間的比值??梢杂赏扑]結果轉化率對推薦結果進行評價,不斷逼近最優(yōu)的推薦算法參數取值范圍。具體的,第三閾值、第四閾值和/或第五閾值也可以利用機器學習進行調整。參見圖7所示,本發(fā)明用戶軌跡的協(xié)同過濾推薦方法的一種具體實施例,包括以下步驟:步驟201:獲得移動終端的位置信息,根據位置信息確定用戶的地理位置坐標。步驟202:對由地理位置坐標確定的位置點進行聚類,確定用戶的用戶軌跡,用戶軌跡為半徑小于第一閾值且位置點密度大于第二閾值的區(qū)域。
步驟203:當地理位置坐標數據不斷增加,利用機器學習,調整第一閾值和/或第二閾值的取值范圍。步驟204:在為不同組用戶中的目標用戶分別提供推薦結果的過程中,將用戶化分為若干組,設置不同的第三閾值、第四閾值和/或第五閾值。步驟205:比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與目標用戶的用戶軌跡直接相交區(qū)域面積大于第三閾值和/或間接相交區(qū)域面積大于第四閾值的其他用戶確定為目標用戶的近鄰用戶。步驟206:獲得并保存用戶的瀏覽記錄。步驟207:根據目標用戶與近鄰用戶的瀏覽記錄,計算目標用戶與每個近鄰用戶的興趣相似度。步驟208:確定近鄰用戶中與目標用戶中興趣相似度大于第五閾值的用戶為目標用戶的興趣相似用戶。步驟209:根據興趣相似用戶的瀏覽記錄,獲得為目標用戶提供的推薦結果。步驟210:獲得不同組的目標用戶的推薦結果轉化率。步驟211:根據不同組的目標用戶的推薦結果轉化率,調整第三閾值、第四閾值和/或第五閾值,之后可以返回步驟204,獲得最優(yōu)的第三閾值、第四閾值以及第五閾值取值范圍。這樣,利用移動設備對用戶的地理位置坐標進行聚類,產生用戶軌跡,利用用戶軌跡確定近鄰用戶,可以將興趣相似的用戶在空間上進行劃分,進而通過近鄰用戶及其瀏覽記錄,將用戶線上行為和線下行為相結合,利用協(xié)同過濾算法獲得推薦結果。由于用戶的活動范圍可以反映該用戶的自身屬性,同時將全國范圍內的用戶相似度計算大幅度降低為附近區(qū)域高度重疊的用戶相似度計算,降低了計算難度,提高了推薦準確率。另外,一個新用戶只要產生用戶軌跡,就可以在其瀏覽記錄不足夠的情況下,利用其近鄰用戶的瀏覽記錄為該新用戶提供推薦結果,避免了推薦系統(tǒng)冷啟動的現象。相應的,本發(fā)明還提供一種基于用戶軌跡的協(xié)同過濾推薦裝置,參見圖8所示,該裝置包括:第一確定單元11、第二確定單元12、第三確定單元13、第一獲得單元14以及推薦單元15。其中,第一確定單元11,用于獲取移動終端的位置信息,根據位置信息確定用戶的地理位置坐標;第二確定單元12,用于對由地理位置坐標確定的位置點進行聚類,確定用戶的用戶軌跡,用戶軌跡為半徑小于第一閾值且位置點密度大于第二閾值的區(qū)域;第三確定單元13,用于比較目標用戶與其他用戶的用戶軌跡,確定目標用戶的近鄰用戶,目標用戶為用戶中待提供推薦結果的用戶;第一獲得單元14,用于獲得并保存用戶的瀏覽記錄;推薦單元15,用于根據目標用戶與近鄰用戶的瀏覽記錄,利用協(xié)同過濾算法,為目標用戶提供推薦結果。在上述實施例中,參見圖9所示,第三確定單元13可以包括:第一確定子單元131,用于比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與目標用戶的用戶軌跡直接相交區(qū)域面積大于第三閾值的其他用戶確定為目標用戶的近鄰用戶;第二確定子單元132,用于比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與目標用戶的用戶軌跡間接相交區(qū)域面積大于第四閾值的其他用戶確定為目標用戶的近鄰用戶。參見圖10所示,推薦單元15可以包括:計算子單元151,用于根據目標用戶與近鄰用戶的瀏覽記錄,計算目標用戶與每個近鄰用戶的興趣相似度;第三確定子單元152,用于確定近鄰用戶中與目標用戶中興趣相似度大于第五閾值的用戶為目標用戶的興趣相似用戶;推薦子單元153,用于根據興趣相似用戶的瀏覽記錄,獲得為目標用戶提供的推薦結果。參見圖11所示,本發(fā)明一種基于用戶軌跡的協(xié)同過濾推薦裝置還可以包括:第一調整單元16,用于當地理位置坐標數據不斷增加,利用機器學習,調整第一閾值和/或第二閾值的取值范圍。劃分單元17,用于將用戶化分為若干組。設置單元18,用于在為不同組用戶中的目標用戶分別提供推薦結果的過程中,設置不同的第三閾值、第四閾值和/或第五閾值。第二獲得單元19,用于獲得不同組的目標用戶的推薦結果轉化率。第二調整單元110,用于根據不同組的目標用戶的推薦結果轉化率,調整第三閾值、第四閾值和/或第五閾值。相應的,本發(fā)明還提供一種基于用戶軌跡的協(xié)同過濾推薦系統(tǒng),參見圖12所示,該系統(tǒng)包括:若干個移動終端2以及推薦服務器I。其中,推薦服務器I可以是上述實施例提供的基于用戶軌跡的協(xié)同過濾推薦裝置;移動終端2,用于向推薦服務器發(fā)送位置信息以及用戶的瀏覽記錄并獲得推薦服務器為目標用戶提供的推薦結果。該移動終端中可以包括客戶端,例如視頻客戶端,用戶使用該移動終端在客戶端軟件中瀏覽、選擇視頻,由該客戶端為用戶提供推薦結果。本系統(tǒng)的工作原理是:在移動終端使用時可以根據用戶的移動將位置信息以及用戶的瀏覽記錄發(fā)送推薦服務器,在推薦服務器形成日志。推薦服務器根據位置信息確定用戶的地理位置坐標;對由地理位置坐標確定的位置點進行聚類,確定用戶的用戶軌跡,用戶軌跡為半徑小于第一閾值且位置點密度大于第二閾值的區(qū)域;當地理位置坐標數據不斷增加,利用機器學習,調整第一閾值和/或第二閾值的取值范圍;在為不同組用戶中的目標用戶分別提供推薦結果的過程中,將用戶化分為若干組,設置不同的第三閾值、第四閾值和/或第五閾值;比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與目標用戶的用戶軌跡直接相交區(qū)域面積大于第三閾值和/或間接相交區(qū)域面積大于第四閾值的其他用戶確定為目標用戶的近鄰用戶;根據目標用戶與近鄰用戶的瀏覽記錄,計算目標用戶與每個近鄰用戶的興趣相似度;確定近鄰用戶中與目標用戶中興趣相似度大于第五閾值的用戶為目標用戶的興趣相似用戶;根據興趣相似用戶的瀏覽記錄,獲得為目標用戶提供的推薦結果;獲得不同組的目標用戶的推薦結果轉化率;根據不同組的目標用戶的推薦結果轉化率,調整第三閾值、第四閾值和/或第五閾值。移動終端最終獲得推薦服務器為目標用戶提供的推薦結果。這樣,本發(fā)明利用移動設備對用戶的地理位置坐標進行聚類,產生用戶軌跡,利用用戶軌跡確定近鄰用戶,可以將興趣相似的用戶在空間上進行劃分,進而通過近鄰用戶及其瀏覽記錄,將用戶線上行為和線下行為相結合,利用協(xié)同過濾算法獲得推薦結果。由于用戶的活動范圍可以反映該用戶的自身屬性,同時將全國范圍內的用戶相似度計算大幅度降低為附近區(qū)域高度重疊的用戶相似度計算,降低了計算難度,提高了推薦準確率。另外,一個新用戶只要產生用戶軌跡,就可以在其瀏覽記錄不足夠的情況下,利用其近鄰用戶的瀏覽記錄為該新用戶提供推薦結果,避免了推薦系統(tǒng)冷啟動的現象。需要說明的是,本說明書中各個實施例采用遞進的方式描述,每個實施例重點說明的都是與其他實施例的不同之處,各個實施例之間相同相似部分互相參見即可。對于實施例公開的系統(tǒng)或裝置而言,由于其與實施例公開的方法相對應,所以描述的比較簡單,相關之處參見方法部分說明即可。還需要說明的是,在本文中,諸如第一和第二等之類的關系術語僅僅用來將一個實體或者操作與另一個實體或操作區(qū)分開來,而不一定要求或者暗示這些實體或操作之間存在任何這種實際的關系或者順序。而且,術語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設
備所固有的要素。在沒有更多限制的情況下,由語句“包括一個......”限定的要素,并不
排除在包括所述要素的過程、方法、物品或者設備中還存在另外的相同要素。結合本文中所公開的實施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結合來實施。軟件模塊可以置于隨機存儲器(RAM)、內存、只讀存儲器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動磁盤、CD-ROM、或技術領域內所公知的任意其它形式的存儲介質中。對所公開的實施例的上述說明,使本領域專業(yè)技術人員能夠實現或使用本發(fā)明。對這些實施例的多種修改對本領域的專業(yè)技術人員來說將是顯而易見的,本文中所定義的一般原理可以在不脫離本發(fā)明的精神或范圍的情況下,在其它實施例中實現。因此,本發(fā)明將不會被限制于本文所示的這些實施例,而是要符合與本文所公開的原理和新穎特點相一致的最寬的范圍。
權利要求
1.一種基于用戶軌跡的協(xié)同過濾推薦方法,其特征在于,所述方法包括: 獲得移動終端的位置信息,根據所述位置信息確定用戶的地理位置坐標; 對由所述地理位置坐標確定的位置點進行聚類,確定所述用戶的用戶軌跡,所述用戶軌跡為半徑小于第一閾值且所述位置點密度大于第二閾值的區(qū)域; 比較目標用戶與其他用戶的用戶軌跡,確定所述目標用戶的近鄰用戶,所述目標用戶為所述用戶中待提供推薦結果的用戶; 獲得并保存所述用戶的瀏覽記錄; 根據所述目標用戶與所述近鄰用戶的所述瀏覽記錄,利用協(xié)同過濾算法,為目標用戶提供推薦結果。
2.根據權利要求1所述的方法,其特征在于,所述比較目標用戶與其他用戶的用戶軌跡,確定所述目標用戶的近鄰用戶,包括: 比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與所述目標用戶的用戶軌跡直接相交區(qū)域面積大于第三閾值的其他用戶確定為所述目標用戶的近鄰用戶; 比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與所述目標用戶的用戶軌跡間接相交區(qū)域面積大于第四閾值的其他用戶確定為所述目標用戶的近鄰用戶。
3.根據權利要求1所述的方法,其特征在于,所述根據所述目標用戶與所述近鄰用戶的所述瀏覽記錄,利用協(xié)同過濾算法,為目標用戶提供推薦結果,包括: 根據所述目標用戶與所述近鄰用戶的所述瀏覽記錄,計算所述目標用戶與每個近鄰用戶的興趣相似度; 確定所述近鄰用戶中與所述目標用戶中興趣相似度大于第五閾值的用戶為所述目標用戶的興趣相似用戶; 根據所述興趣相似用戶的瀏覽記錄,獲得為目標用戶提供的推薦結果。
4.根據權利要求2所述的方法,其特征在于,所述方法還包括: 當所述地理位置坐標數據不斷增加,利用機器學習,調整第一閾值和/或第二閾值的取值范圍。
5.根據權利要求2或3所述的方法,其特征在于,所述方法還包括: 將所述用戶化分為若干組; 在為不同組用戶中的所述目標用戶分別提供推薦結果的過程中,設置不同的所述第三閾值、所述第四閾值和/或所述第五閾值; 獲得不同組的目標用戶的推薦結果轉化率; 根據所述不同組的目標用戶的推薦結果轉化率,調整所述第三閾值、所述第四閾值和/或所述第五閾值。
6.一種基于用戶軌跡的協(xié)同過濾推薦裝置,其特征在于,所述裝置包括: 第一確定單元,用于獲取移動終端的位置信息,根據所述位置信息確定用戶的地理位置坐標; 第二確定單元,用于對由所述地理位置坐標確定的位置點進行聚類,確定所述用戶的用戶軌跡,所述用戶軌跡為半徑小于第一閾值且所述位置點密度大于第二閾值的區(qū)域;第三確定單元,用于比較目標用戶與其他用戶的用戶軌跡,確定所述目標用戶的近鄰用戶,所述目標用戶為所述用戶中待提供推薦結果的用戶;第一獲得單元,用于獲得并保存所述用戶的瀏覽記錄; 推薦單元,用于根據所述目標用戶與所述近鄰用戶的所述瀏覽記錄,利用協(xié)同過濾算法,為目標用戶提供推薦結果。
7.根據權利要求6所述的裝置,其特征在于,所述第三確定單元包括: 第一確定子單元,用于比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與所述目標用戶的用戶軌跡直接相交區(qū)域面積大于第三閾值的其他用戶確定為所述目標用戶的近鄰用戶; 第二確定子單元,用于比較目標用戶與其他用戶的用戶軌跡,將用戶軌跡與所述目標用戶的用戶軌跡間接相交區(qū)域面積大于第四閾值的其他用戶確定為所述目標用戶的近鄰用戶。
8.根據權利要求6所述的裝置,其特征在于,所述推薦單元包括: 計算子單元,用于根據所述目標用戶與所述近鄰用戶的所述瀏覽記錄,計算所述目標用戶與每個近鄰用戶的興趣相似度; 第三確定子單元,用于確定所述近鄰用戶中與所述目標用戶中興趣相似度大于第五閾值的用戶為所述目標用戶的興趣相似用戶; 推薦子單元,用于根據所述興趣相似用戶的瀏覽記錄,獲得為目標用戶提供的推薦結果。
9.根據權利要求7所述的裝置,其特征在于,所述裝置還包括: 第一調整單元,用于當所述地理位置坐標數據不斷增加,利用機器學習,調整第一閾值和/或第二閾值的取值范圍。
10.根據權利要求7或8所述的裝置,其特征在于,所述裝置還包括: 劃分單元,用于將所述用戶化分為若干組; 設置單元,用于在為不同組用戶中的所述目標用戶分別提供推薦結果的過程中,設置不同的所述第三閾值、所述第四閾值和/或所述第五閾值; 第二獲得單元,用于獲得不同組的目標用戶的推薦結果轉化率; 第二調整單元,用于根據所述不同組的目標用戶的推薦結果轉化率,調整所述第三閾值、所述第四閾值和/或所述第五閾值。
11.一種基于用戶軌跡的協(xié)同過濾推薦系統(tǒng),其特征在于,所述系統(tǒng)包括: 若干個移動終端以及推薦服務器; 所述推薦服務器是權利要求6-10任一項所述的基于用戶軌跡的協(xié)同過濾推薦裝置;所述移動終端,用于向所述推薦服務器發(fā)送位置信息以及用戶的瀏覽記錄并獲得所述推薦服務器為目標用戶提供的推薦結果。
全文摘要
本發(fā)明公開了一種基于用戶軌跡的協(xié)同過濾推薦方法,用于在用戶瀏覽挑選網頁或視頻時,為用戶提供更有效的推薦,該方法包括獲得移動終端的位置信息,根據位置信息確定用戶的地理位置坐標;對由地理位置坐標確定的位置點進行聚類,確定用戶的用戶軌跡,用戶軌跡為半徑小于第一閾值且位置點密度大于第二閾值的區(qū)域;比較目標用戶與其他用戶的用戶軌跡,確定目標用戶的近鄰用戶,目標用戶為用戶中待提供推薦結果的用戶;獲得并保存用戶的瀏覽記錄;根據目標用戶與近鄰用戶的瀏覽記錄,利用協(xié)同過濾算法,為目標用戶提供推薦結果。本發(fā)明還公開了一種基于用戶軌跡的協(xié)同過濾推薦裝置及系統(tǒng)。
文檔編號G06F17/30GK103116614SQ20131003047
公開日2013年5月22日 申請日期2013年1月25日 優(yōu)先權日2013年1月25日
發(fā)明者晉向前, 傅一峰, 王敏, 張磊, 楊子斌 申請人:北京奇藝世紀科技有限公司
網友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
达拉特旗| 将乐县| 桃源县| 松溪县| 盐源县| 鄄城县| 通江县| 柳河县| 思南县| 西充县| 竹溪县| 来凤县| 桦甸市| 新晃| 琼结县| 万州区| 交城县| 剑河县| 普陀区| 贺兰县| 高邮市| 威海市| 西和县| 乐都县| 牟定县| 策勒县| 通城县| 南皮县| 太白县| 禄丰县| 福清市| 天津市| 靖边县| 通化县| 平南县| 定州市| 麻栗坡县| 临沭县| 连南| 清镇市| 奉节县|