專利名稱:一種基于協(xié)同過濾的rss信息推薦方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種信息推薦方法,具體涉及一種基于協(xié)同過濾的RSS信息推薦方 法。 目前互聯(lián)網(wǎng)中的RSS信息推薦方法,只能推薦整條信息源,不能針對單篇文章進(jìn) 行個(gè)性化推薦。例如谷歌閱讀器,抓蝦網(wǎng)、鮮果網(wǎng)等的在線RSS閱讀器均不能完成同好用 戶的單篇文章個(gè)性化推薦。如專利號為200510022721. 3、發(fā)明名稱為《一種基于XML文件 的RSS信息交互處理方法》的專利即屬于此列。 這樣會導(dǎo)致使用者得到的推薦文章泛濫,不能得到精準(zhǔn)的使用者喜好的單篇文
化早。 本發(fā)明解決的技術(shù)問題是提供一種既能薦整條信息源,又能針對同好用戶的單 篇文章進(jìn)行個(gè)性化推薦。 本發(fā)明基于以下假設(shè)有相同或類似訂閱習(xí)慣的用戶,其相互推薦的信息更具價(jià) 值;最相似的同好用戶推薦的信息比次相似同好用戶的推薦更具價(jià)值。通過分析用戶的習(xí) 慣,找到每個(gè)用戶的同好用戶群,以及該用戶群的訂閱集。通過加權(quán)每個(gè)同好用戶的收藏文 章,以推薦該用戶最有可能喜歡的文章,從而達(dá)到個(gè)性化的推薦效果。
為達(dá)到上述目標(biāo),本發(fā)明采用如下的技術(shù)方案
—種基于協(xié)同過濾的RSS信息推薦方法,步驟如下 1)用戶從大量RSS源集中訂閱某些RSS源時(shí),服務(wù)器行為記錄模塊獲取登錄的用 戶信息,查詢會話表獲得用戶唯一身份標(biāo)識u,連同該RSS信息源在系統(tǒng)中的唯一標(biāo)識r,形 成用戶對RSS源的訂閱情況Wu,r,更新至行為處理模塊的用戶-RSS源訂閱矩陣W(m,n)之 中,m為系統(tǒng)中的用戶數(shù)目,n為RSS源的數(shù)目,訂閱情況Wu, r的值當(dāng)訂閱時(shí)為1 ,未訂閱時(shí)
為O; 2)行為處理模塊從用戶-RSS源訂閱矩陣W(m,n)中獲取訂閱情況Wu,r,利用余弦 相關(guān)性算法計(jì)算兩用戶之間的相似度sim(ip,i,),其中ip,i,分別為p、q兩名用戶;并將相 似度更新至用戶相似度方陣sim(m,m)中,余弦相關(guān)算法的公式為 3)行為處理模塊根據(jù)用戶相似度方陣sim(m,m)推算出與每個(gè)用戶有相似訂閱習(xí) 慣的"同好"用戶,并將該用戶所有"同好"用戶訂閱的所有RSS源形成同好用戶訂閱集,再 按相似度由高到低排列,形成對該用戶的推薦加權(quán)系數(shù)f ;
背景技術(shù):
發(fā)明內(nèi)容
3
4)用戶從一個(gè)RSS源的文章列表中收藏某篇文章時(shí),服務(wù)器行為記錄模塊獲取登 錄的用戶信息,查詢會話表獲得用戶唯一身份標(biāo)識u,連同該篇文章在系統(tǒng)中的唯一標(biāo)識 rt,形成用戶對文章的收藏情況Cu,rt,更新至行為處理模塊的同好收藏矩陣C(a,b)之中, a為某用戶的同好用戶數(shù)目,b為同好用戶訂閱集中所有文章的數(shù)目; 5)行為處理模塊針對同好收藏矩陣C(a, b)中單篇文章的所有同好用戶行為,做
推薦加權(quán)處理,按推薦優(yōu)先級形成推薦文章集,并將推薦文章集更新至推薦模塊; 6)在用戶獲取文章推薦時(shí),推薦模塊實(shí)時(shí)地從推薦文章集篩選出目標(biāo)用戶可能會
感興趣的TopN條內(nèi)容推薦給用戶。 上述RSS是在線共享內(nèi)容的一種簡易方式(也稱聚合內(nèi)容,Really SimpleSyndication)。通常在時(shí)效性比較強(qiáng)的內(nèi)容上使用RSS訂閱能更快速獲取信息,網(wǎng) 站提供RSS輸出,有利于讓用戶獲取網(wǎng)站內(nèi)容的最新更新。 上述RSS源是一種描述和同步網(wǎng)站內(nèi)容的格式,是目前使用最廣泛的XML應(yīng)用。發(fā) 布一個(gè)RSS文件后,這個(gè)RSS Feed中包含的信息就能直接被其他站點(diǎn)調(diào)用,而且由于這些 數(shù)據(jù)都是標(biāo)準(zhǔn)的XML格式,所以也能在其他的終端和服務(wù)中使用。
上述余弦相關(guān)性算法為信息推薦領(lǐng)域內(nèi)公知的通用算法。 —種用于上述方法的RSS閱讀系統(tǒng),由閱讀模塊、訂閱模塊、訂閱管理模塊、行為 記錄模塊、行為處理模塊和推薦模塊組成,其特征在于閱讀模塊分別和訂閱模塊、訂閱管理 模塊、行為記錄模塊及推薦模塊相連接;行為處理模塊分別和行為記錄模塊及推薦模塊相 連接;訂閱模塊和訂閱管理模塊相互連接,模塊之間通過由編程實(shí)現(xiàn)的控制語句,共享一個(gè) 或多個(gè)服務(wù)器數(shù)據(jù)庫的數(shù)據(jù)。
本發(fā)明有以下有益效果 1.相比起傳統(tǒng)的RSS推薦方法,本發(fā)明使其推薦效果不僅僅局限于整個(gè)RSS信息 源的推薦,更加突出了信息源中單篇文章的推薦,有效避免了信息冗余和過載;
2.相比起傳統(tǒng)的基于用戶的信息推薦技術(shù),本發(fā)明結(jié)合了基于項(xiàng)的推薦方式,使 其推薦效果有一定的差異覆蓋面,便于用戶發(fā)現(xiàn)可能感興趣的新內(nèi)容; 3.相比傳統(tǒng)的基于項(xiàng)的信息推薦技術(shù),本發(fā)明引入了同好用戶群,并利用同好用 戶加權(quán)因子,使推薦內(nèi)容更加精準(zhǔn)可信。
圖1是本發(fā)明閱讀系統(tǒng)的結(jié)構(gòu)示意圖。 其中1、閱讀模塊,2、訂閱模塊,3、訂閱管理模塊,4、行為記錄模塊,5、推薦模塊, 6、行為處理模塊。 圖2是本發(fā)明方法的流程圖,其中7-12為其中的各個(gè)步驟。
具體實(shí)施例方式
下面結(jié)合附圖和實(shí)施例對本發(fā)明做進(jìn)一步說明,但不限于此。
實(shí)施例1 : —種基于協(xié)同過濾的RSS信息推薦方法,如圖2所示,步驟如下 7、用戶從大量RSS源集中訂閱某些RSS源時(shí),服務(wù)器行為記錄模塊獲取登錄的用戶信息,查詢會話表獲得用戶唯一身份標(biāo)識u,連同該RSS信息源在系統(tǒng)中的唯一標(biāo)識r,形 成用戶對RSS源的訂閱情況Wu,r,更新至行為處理模塊的用戶-RSS源訂閱矩陣W(m,n)之 中,m為系統(tǒng)中的用戶數(shù)目,n為RSS源的數(shù)目,訂閱情況Wu, r的值當(dāng)訂閱時(shí)為1 ,未訂閱時(shí)
為O; 8、行為處理模塊從用戶-RSS源訂閱矩陣W(m,n)中獲取訂閱情況Wu, r,利用余弦 相關(guān)性算法計(jì)算兩用戶之間的相似度sim(ip,i,),其中ip,i,分別為p、q兩名用戶;并將相 似度更新至用戶相似度方陣sim(m,m)中,余弦相關(guān)算法的公式為 9、行為處理模塊根據(jù)用戶相似度方陣sim(m, m)推算出與每個(gè)用戶有相似訂閱習(xí) 慣的"同好"用戶,并將該用戶所有"同好"用戶訂閱的所有RSS源形成同好用戶訂閱集,再 按相似度由高到低排列,形成對該用戶的推薦加權(quán)系數(shù)f ; 10、用戶從一個(gè)RSS源的文章列表中收藏某篇文章時(shí),服務(wù)器行為記錄模塊獲取 登錄的用戶信息,查詢會話表獲得用戶唯一身份標(biāo)識u,連同該篇文章在系統(tǒng)中的唯一標(biāo)識 rt,形成用戶對文章的收藏情況Cu,rt,更新至行為處理模塊的同好收藏矩陣C(a,b)之中, a為某用戶的同好用戶數(shù)目,b為同好用戶訂閱集中所有文章的數(shù)目; 11、行為處理模塊針對同好收藏矩陣C(a, b)中單篇文章的所有同好用戶行為,做
推薦加權(quán)處理,按推薦優(yōu)先級形成推薦文章集,并將推薦文章集更新至推薦模塊; 12、在用戶獲取文章推薦時(shí),推薦模塊實(shí)時(shí)地從推薦文章集篩選出目標(biāo)用戶可能
會感興趣的TopN條內(nèi)容推薦給用戶。 實(shí)施例2 : —種用于上述方法的RSS閱讀系統(tǒng),如圖1所示,由閱讀模塊1、訂閱模塊2、訂閱 管理模塊3、行為記錄模塊4、行為處理模塊6和推薦模塊5組成,其特征在于閱讀模塊1分 別和訂閱模塊2、訂閱管理模塊3、行為記錄模塊4及推薦模塊5相連接;行為處理模塊6分 別和行為記錄模塊4及推薦模塊5相連接;訂閱模塊2和訂閱管理模塊3相互連接,模塊之 間通過由編程實(shí)現(xiàn)的控制語句,共享一個(gè)或多個(gè)服務(wù)器數(shù)據(jù)庫的數(shù)據(jù)。
權(quán)利要求
一種基于協(xié)同過濾的RSS信息推薦方法,步驟如下1)用戶從大量RSS源集中訂閱某些RSS源時(shí),服務(wù)器行為記錄模塊獲取登錄的用戶信息,查詢會話表獲得用戶唯一身份標(biāo)識u,連同該RSS信息源在系統(tǒng)中的唯一標(biāo)識r,形成用戶對RSS源的訂閱情況Wu,r,更新至行為處理模塊的用戶-RSS源訂閱矩陣W(m,n)之中,m為系統(tǒng)中的用戶數(shù)目,n為RSS源的數(shù)目,訂閱情況Wu,r的值當(dāng)訂閱時(shí)為1,未訂閱時(shí)為0;2)行為處理模塊從用戶-RSS源訂閱矩陣W(m,n)中獲取訂閱情況Wu,r,利用余弦相關(guān)性算法計(jì)算兩用戶之間的相似度sim(ip,iq),其中ip,iq分別為p、q兩名用戶;并將相似度更新至用戶相似度方陣sim(m,m)中,余弦相關(guān)算法的公式為 <mrow><mi>sim</mi><mrow> <mo>(</mo> <msub><mi>i</mi><mi>p</mi> </msub> <mo>,</mo> <msub><mi>i</mi><mi>q</mi> </msub> <mo>)</mo></mrow><mo>=</mo><mi>cos</mi><mrow> <mo>(</mo> <msub><mi>i</mi><mi>p</mi> </msub> <mo>,</mo> <msub><mi>i</mi><mi>q</mi> </msub> <mo>)</mo></mrow><mo>=</mo><mfrac> <mrow><munderover> <mi>Σ</mi> <mrow><mi>k</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><msub> <mi>W</mi> <mrow><mi>p</mi><mo>,</mo><mi>k</mi> </mrow></msub><mo>×</mo><msub> <mi>W</mi> <mrow><mi>q</mi><mo>,</mo><mi>k</mi> </mrow></msub> </mrow> <msqrt><munderover> <mi>Σ</mi> <mrow><mi>k</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><msup> <mrow><mo>(</mo><msub> <mi>W</mi> <mrow><mi>p</mi><mo>,</mo><mi>k</mi> </mrow></msub><mo>)</mo> </mrow> <mn>2</mn></msup><mo>×</mo><munderover> <mi>Σ</mi> <mrow><mi>k</mi><mo>=</mo><mn>1</mn> </mrow> <mi>n</mi></munderover><msup> <mrow><mo>(</mo><msub> <mi>W</mi> <mrow><mi>q</mi><mo>,</mo><mi>k</mi> </mrow></msub><mo>)</mo> </mrow> <mn>2</mn></msup> </msqrt></mfrac> </mrow>3)行為處理模塊根據(jù)用戶相似度方陣sim(m,m)推算出與每個(gè)用戶有相似訂閱習(xí)慣的“同好”用戶,并將該用戶所有“同好”用戶訂閱的所有RSS源形成同好用戶訂閱集,再按相似度由高到低排列,形成對該用戶的推薦加權(quán)系數(shù)f;4)用戶從一個(gè)RSS源的文章列表中收藏某篇文章時(shí),服務(wù)器行為記錄模塊獲取登錄的用戶信息,查詢會話表獲得用戶唯一身份標(biāo)識u,連同該篇文章在系統(tǒng)中的唯一標(biāo)識rt,形成用戶對文章的收藏情況Cu,rt,更新至行為處理模塊的同好收藏矩陣C(a,b)之中,a為某用戶的同好用戶數(shù)目,b為同好用戶訂閱集中所有文章的數(shù)目;5)行為處理模塊針對同好收藏矩陣C(a,b)中單篇文章的所有同好用戶行為,做推薦加權(quán)處理,按推薦優(yōu)先級形成推薦文章集,并將推薦文章集更新至推薦模塊;6)在用戶獲取文章推薦時(shí),推薦模塊實(shí)時(shí)地從推薦文章集篩選出目標(biāo)用戶可能會感興趣的TopN條內(nèi)容推薦給用戶。
2. —種用于權(quán)利要求1所述方法的RSS閱讀系統(tǒng),由閱讀模塊、訂閱模塊、訂閱管理模 塊、行為記錄模塊、行為處理模塊和推薦模塊組成,其特征在于閱讀模塊分別和訂閱模塊、 訂閱管理模塊、行為記錄模塊及推薦模塊相連接;行為處理模塊分別和行為記錄模塊及推 薦模塊相連接;訂閱模塊和訂閱管理模塊相互連接,模塊之間通過由編程實(shí)現(xiàn)的控制語句, 共享一個(gè)或多個(gè)服務(wù)器數(shù)據(jù)庫的數(shù)據(jù)。
全文摘要
一種基于協(xié)同過濾的RSS信息推薦方法,屬信息推薦技術(shù)領(lǐng)域,系統(tǒng)由閱讀模塊、訂閱模塊、訂閱管理模塊、行為記錄模塊、行為處理模塊和推薦模塊組成,其中閱讀模塊分別和訂閱模塊、訂閱管理模塊、行為記錄模塊及推薦模塊相連接;行為處理模塊分別和行為記錄模塊及推薦模塊相連接;訂閱模塊和訂閱管理模塊相互連接,模塊之間通過由編程實(shí)現(xiàn)的控制語句,共享一個(gè)或多個(gè)服務(wù)器數(shù)據(jù)庫的數(shù)據(jù)。本發(fā)明使其推薦效果不僅限于整個(gè)RSS信息源的推薦,更加突出了單篇文章的推薦,有效避免了信息冗余和過載;推薦效果有一定的差異覆蓋面,便于用戶發(fā)現(xiàn)可能感興趣的新內(nèi)容;引入了同好用戶群,并利用同好用戶加權(quán)因子,使推薦內(nèi)容更加精準(zhǔn)可信。
文檔編號H04L29/06GK101753573SQ20091025645
公開日2010年6月23日 申請日期2009年12月25日 優(yōu)先權(quán)日2009年12月25日
發(fā)明者徐超, 林賀, 王恒, 石祚夫, 袁東風(fēng), 陳飛, 顏廷芝, 魏斌 申請人:山東大學(xué)