專利名稱::基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng)的制作方法
技術領域:
:本發(fā)明涉及視頻節(jié)目推薦系統(tǒng)。
背景技術:
:隨著視頻網(wǎng)絡的發(fā)展,通過網(wǎng)絡觀看視頻節(jié)目成為眾多網(wǎng)絡用戶的上網(wǎng)目的之一。如何最大限度地吸引用戶,成為視頻網(wǎng)站的所要考慮的重要問題。一種有效的方法是根據(jù)用戶的觀看的喜好向用戶推薦視頻節(jié)目。經(jīng)過分析,用戶通常具有觀看某類節(jié)目的喜好。例如,有的用戶喜歡觀看體育節(jié)目,有的用戶則喜歡觀看娛樂節(jié)目,而有的用戶只喜歡觀看功夫節(jié)目等等。在第十屆國際互聯(lián)網(wǎng)會議上(Proceedingsofthe10thinternationalconferenceonWorldWideWeb),Badru和George等人提出了基于項目(Item)的協(xié)同過濾推薦系統(tǒng)(Item-basedCollaborativeFilteringRecommendationAlgorithms),在這篇文章中同時還提到一種基于用戶(User)的協(xié)同過濾推薦系統(tǒng)。這兩種過濾系統(tǒng)的基本原理如下根據(jù)已知的用戶對某些節(jié)目的喜好程度進行計算,然后向具有相同喜好的用戶推薦已知用戶的其他喜好節(jié)目。這種喜好程度通過分值表示,該分值由用戶選擇,例如1分表示討厭某個節(jié)目,5分表示非常喜歡某個節(jié)目。然而在視頻網(wǎng)站中,采用這種方法的進行節(jié)目推薦的時候,卻碰到許多困難。例如一、用戶不愿意刻意去給節(jié)目打分。通常用戶到視頻網(wǎng)站的目的是觀看視頻,他們不愿意刻意去給一個節(jié)目打分。二、即便有少量的用戶給視頻節(jié)目打分,這些被打分的節(jié)目數(shù)在所有視頻節(jié)目的比例非常的小,通常不到1%。上述這些困難會導致上述的協(xié)同過濾推薦系統(tǒng)出現(xiàn)"冷啟動問題",(請參見發(fā)表于《計算機研究與發(fā)展》上的"基于類別的推薦——一種解決協(xié)同推薦中冷啟動問題的方法"),這種冷啟動問題會導致推薦系統(tǒng)無法正常工作,產(chǎn)生錯誤的推薦結果。
發(fā)明內(nèi)容針對現(xiàn)有推薦系統(tǒng)中的不足,本發(fā)明提供一種基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),該系統(tǒng)首先收集用戶在視頻網(wǎng)站上的與興趣度相關的瀏覽行為,然后通過分析瀏覽行為并打分后,進行數(shù)據(jù)融合,融合后的分值,也就是某用戶對某視頻節(jié)目的興趣度值,根據(jù)該興趣度值進行節(jié)目的推薦。本發(fā)明具體是通過以下技術方案實現(xiàn)的—種基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于包括用戶行為數(shù)據(jù)收集模塊,用于收集和存儲用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù);數(shù)據(jù)融合模塊,與所述用戶行為數(shù)據(jù)收集模塊相連接,用于將某個用戶對某個視頻節(jié)目的瀏覽行為數(shù)據(jù)轉化為該用戶對某個視頻節(jié)目的興趣度值;節(jié)目推薦模塊,根據(jù)用戶對某些節(jié)目的興趣度值,向具有相同喜好的其他用戶推薦該用戶的其他興趣度值高的節(jié)目;其中,瀏覽行為數(shù)據(jù)包括為播放行為數(shù)據(jù),將用戶播放節(jié)目的時長除以該節(jié)目的4長度得到時長比例r,時長比例r越大,興趣度值越高。進一步地,所述用戶行為數(shù)據(jù)收集模塊中收集數(shù)據(jù)的時間長度為某一時刻之前的一個時間段。進一步地,所述數(shù)據(jù)融合模塊中的興趣度值為某一時刻之前的一個時間段內(nèi)的瀏覽行為數(shù)據(jù)轉化而獲得的數(shù)值。進一步地,所述節(jié)目推薦模塊為采用定期的方式向具有相同喜好的其他用戶推薦該用戶的其他興趣度高的節(jié)目的模塊。本發(fā)明避免了用戶在不愿意刻意去給節(jié)目打分的情況下,導致上述的協(xié)同過濾推薦系統(tǒng)出現(xiàn)冷啟動的問題,只要用戶有播放行為,就可產(chǎn)生正確的推薦結果。并且在融合了用戶其它與興趣度相關的瀏覽行為數(shù)據(jù)后,可更加準確地產(chǎn)生推薦的節(jié)目列表,通過這種無需用戶刻意評分的技術方案,大大提高了用戶對推薦節(jié)目的滿意度,降低了視頻服務器因用戶盲目點擊造成的負擔。圖1為本發(fā)明基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng)實施例示意圖。具體實施例方式如圖1所示,一種基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),包括以下模塊用戶行為數(shù)據(jù)收集模塊,用于收集和存儲用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù);數(shù)據(jù)融合模塊,與所述用戶行為數(shù)據(jù)收集模塊相連接,用于將某個用戶對某個視頻節(jié)目的瀏覽行為數(shù)據(jù)轉化為該用戶對某個視頻節(jié)目的興趣度值;節(jié)目推薦模塊,根據(jù)用戶對某些節(jié)目的興趣度值,向具有相同喜好的其他用戶推薦該用戶的其他興趣度值高的節(jié)目;其中,瀏覽行為數(shù)據(jù)包括為播放行為數(shù)據(jù),將用戶播放節(jié)目的時長除以該節(jié)目的長度得到時長比例r,時長比例r越大,興趣度值越高。所述用戶行為數(shù)據(jù)收集模塊中收集數(shù)據(jù)的時間長度為某一時刻之前的一個時間段。例如最近的一個月至三個月內(nèi)用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù)。所述數(shù)據(jù)融合模塊中的興趣度值為某一時刻之前的一個時間段內(nèi)的瀏覽行為數(shù)據(jù)轉化而獲得的數(shù)值。所述節(jié)目推薦模塊為采用定期的方式向具有相同喜好的其他用戶推薦該用戶的其他興趣度高的節(jié)目的模塊。所述數(shù)據(jù)融合模塊為以用戶編號為行,視頻節(jié)目編號為列,用戶對視頻節(jié)目的興趣度值為內(nèi)容,形成一個二維的用戶對視頻節(jié)目的興趣度值表格的模塊;所述節(jié)目推薦模塊為在該興趣度值表的基礎上,采用基于協(xié)同過濾的推薦方法對已知用戶和未知用戶產(chǎn)生推薦節(jié)目列表的模塊,其中,有對應興趣度值的用戶為已知用戶,否則為未知用戶。所述節(jié)目推薦模塊為包括去除推薦的節(jié)目中其他用戶已經(jīng)觀看過的節(jié)目的模塊。其中,所述瀏覽行為數(shù)據(jù)還包括以下行為中的一個、多個或全部對節(jié)目打分行為數(shù)據(jù)、收藏節(jié)目行為數(shù)據(jù)、挖行為數(shù)據(jù)、埋行為數(shù)據(jù)或上傳節(jié)目行為數(shù)據(jù)。所述數(shù)據(jù)融合模塊為對于同一類型的瀏覽行為,后出現(xiàn)的行為的分值覆蓋先出現(xiàn)的行為的分值的模塊。其中,數(shù)據(jù)融合的順序依次為播放行為數(shù)據(jù)、對節(jié)目打分行為、收藏節(jié)目行為、挖(或頂\踩)行為\埋行為(或頂\踩)或上傳節(jié)目行為。本實施例中所述數(shù)據(jù)融合模塊采用1、2、3、4、5五個離散化的數(shù)值表示興趣度值,其中l(wèi)表示很討厭,2表示一般討厭,3表示一般,4表示喜歡,5表示很喜歡。用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù)的截取范圍為最近的一個月內(nèi)。用戶瀏覽行為的融合規(guī)則如表1所示。表1各種用戶瀏覽行為數(shù)據(jù)的融合規(guī)則瀏覽行為原始取值r說明對應取值截取范圍播放0%100%以最后一次播放為準,r為播放1,2,3,4,5近一個月的時長比例1:r《0.1;2:0.1<r《0.3;3:0.3<r《0.7;4:0.7<r《0.9;5:0.9<r。打分15按原值1,2,3,4,5近一個月收藏1或or=l表示用戶收藏某一個節(jié)目,打5分;r=0時,則不記分數(shù)。5近一個月挖行為1或or=1表示用戶挖行為某一個節(jié)目,打5分;r=0時,則不記分數(shù)。5近一個月埋行為1或or=1表示用戶埋行為某一個節(jié)目,打1分;r=0時,則不記分數(shù)。1近一個月上傳1或or=l表示用戶上傳某一個節(jié)目,打5分;r=0時,則不記分數(shù)。5近一個月6將同一用戶對某個視頻節(jié)目的上述瀏覽行為數(shù)據(jù)值融合,即將對節(jié)目打分行為數(shù)據(jù)、收藏節(jié)目行為數(shù)據(jù)、挖行為\埋行為(或頂\踩)數(shù)據(jù)或上傳節(jié)目行為數(shù)據(jù)中r的對應取值累加后,得到該用戶對某個視頻節(jié)目的興趣度值。并在得到興趣度值表后,采用基于項目的協(xié)同過濾方法進行視頻節(jié)目的推薦。所述節(jié)目推薦模塊為在得到興趣度值表后,按每天兩次的頻率更推薦節(jié)目列表的模塊。以上所述的實施例僅用于說明本發(fā)明的技術思想及特點,其目的在使本領域內(nèi)的技術人員能夠了解本發(fā)明的內(nèi)容并據(jù)以實施,當不能僅以本實施例來限定本發(fā)明的專利范圍,即凡依本發(fā)明所揭示的精神所作的同等變化或修飾,仍落在本發(fā)明的專利范圍內(nèi)。權利要求一種基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于包括用戶行為數(shù)據(jù)收集模塊,用于收集和存儲用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù);數(shù)據(jù)融合模塊,與所述用戶行為數(shù)據(jù)收集模塊相連接,用于將某個用戶對某個視頻節(jié)目的瀏覽行為數(shù)據(jù)轉化為該用戶對某個視頻節(jié)目的興趣度值;節(jié)目推薦模塊,根據(jù)用戶對某些節(jié)目的興趣度值,向具有相同喜好的其他用戶推薦該用戶的其他興趣度值高的節(jié)目;其中,瀏覽行為數(shù)據(jù)包括為播放行為數(shù)據(jù),將用戶播放節(jié)目的時長除以該節(jié)目的長度得到時長比例r,時長比例r越大,興趣度值越高。2.根據(jù)權利要求1所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述用戶行為數(shù)據(jù)收集模塊中收集數(shù)據(jù)的時間長度為某一時刻之前的一個時間段。3.根據(jù)權利要求2所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述數(shù)據(jù)融合模塊中的興趣度值為某一時刻之前的一個時間段內(nèi)的瀏覽行為數(shù)據(jù)轉化而獲得的數(shù)值。4.根據(jù)權利要求1所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述節(jié)目推薦模塊為采用定期的方式向具有相同喜好的其他用戶推薦該用戶的其他興趣度高的節(jié)目的模塊。5.根據(jù)權利要求1至4中任一權利要求所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述數(shù)據(jù)融合模塊為以用戶編號為行,視頻節(jié)目編號為列,用戶對視頻節(jié)目的興趣度值為內(nèi)容,形成一個二維的用戶對視頻節(jié)目的興趣度值表格的模塊;所述節(jié)目推薦模塊為在該興趣度值表的基礎上,采用基于協(xié)同過濾的推薦方法對已知用戶和未知用戶產(chǎn)生推薦節(jié)目列表的模塊,其中,有對應興趣度值的用戶為已知用戶,否則為未知用戶。6.根據(jù)權利要求5所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述節(jié)目推薦模塊為包括去除推薦的節(jié)目中其他用戶已經(jīng)觀看過的節(jié)目的模塊。7.根據(jù)權利要求6所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述瀏覽行為數(shù)據(jù)還包括以下行為中的一個、多個或全部對節(jié)目打分行為數(shù)據(jù)、收藏節(jié)目行為數(shù)據(jù)、挖行為數(shù)據(jù)、埋行為數(shù)據(jù)或上傳節(jié)目行為數(shù)據(jù)。8.根據(jù)權利要求7所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述數(shù)據(jù)融合模塊為對于同一類型的瀏覽行為,后出現(xiàn)的行為的分值覆蓋先出現(xiàn)的行為的分值的模塊。9.根據(jù)權利要求8所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述數(shù)據(jù)融合模塊為采用1、2、3、4、5五個離散化的數(shù)值表示興趣度值,其中1表示很討厭,2表示一般討厭,3表示一般,4表示喜歡,5表示很喜歡,用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù)的截取范圍為最近的一個月內(nèi),各種用戶瀏覽行為數(shù)據(jù)的融合規(guī)則如下表<table>tableseeoriginaldocumentpage3</column></row><table>將同一用戶對某個視頻節(jié)目的打分行為數(shù)據(jù)、收藏行為數(shù)據(jù)、挖行為數(shù)據(jù)、埋行為數(shù)據(jù)和上傳節(jié)目行為數(shù)據(jù)中r的對應取值累加后,得到該用戶對某個視頻節(jié)目的興趣度值的模塊。10.根據(jù)權利要求9所述的基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),其特征在于所述節(jié)目推薦模塊為在得到興趣度值表后,按每天兩次的頻率更推薦節(jié)目列表的模塊。全文摘要一種基于數(shù)據(jù)融合的視頻節(jié)目推薦系統(tǒng),包括用戶行為數(shù)據(jù)收集模塊,用于收集和存儲用戶在視頻網(wǎng)站的瀏覽行為數(shù)據(jù);數(shù)據(jù)融合模塊,與所述用戶行為數(shù)據(jù)收集模塊相連接,用于將某個用戶對某個視頻節(jié)目的瀏覽行為數(shù)據(jù)轉化為該用戶對某個視頻節(jié)目的興趣度值;節(jié)目推薦模塊,根據(jù)用戶對某些節(jié)目的興趣度值,向具有相同喜好的其他用戶推薦該用戶的其他興趣度值高的節(jié)目;其中,瀏覽行為數(shù)據(jù)包括為播放行為數(shù)據(jù),將用戶播放節(jié)目的時長除以該節(jié)目的長度得到時長比例r,時長比例r越大,興趣度值越高。本發(fā)明只要用戶有播放行為,并且在融合了用戶其它與興趣度相關的瀏覽行為數(shù)據(jù)后,可更加準確地產(chǎn)生推薦的節(jié)目列表,大大提高了用戶對推薦節(jié)目的滿意度。文檔編號H04H60/61GK101764661SQ20081020760公開日2010年6月30日申請日期2008年12月23日優(yōu)先權日2008年12月23日發(fā)明者連惠城申請人:未序網(wǎng)絡科技(上海)有限公司