專利名稱::向用戶提供目標信息的方法及設備的制作方法
技術領域:
:本發(fā)明涉及網(wǎng)絡
技術領域:
,尤其涉及向用戶提供目標信息的方法及設備。技術背景互聯(lián)網(wǎng)上存在海量的信息,內容豐富,形式各異。網(wǎng)絡用戶希望從浩瀚的信息資源中獲取滿足個人需求的信息。搜索引擎、元搜索引擎以及其他的一些搜索工具可以幫助我們從巨大的信息網(wǎng)絡中提取信息。當用戶進行檢索時一般只會提供較少的沖企索關鍵詞,而搜索引擎會返回數(shù)量巨大的搜索結果。如果缺少對用戶的興趣分析,即如果沒有建立準確的用戶模型,用戶將會被淹沒在信息的海洋中。由此可見,建立準確的用戶模型對于用戶目標信息的獲取非常重要。用戶建模已經(jīng)成為網(wǎng)絡數(shù)據(jù)挖掘的核心研究內容,比如,個性化搜索,廣告目標客戶定位,信息推薦,市場商業(yè)決策和客戶關系管理等等。目前主要存在兩種用戶建模的方法,一種是靜態(tài)用戶建4莫,一種是動態(tài)用戶建模。靜態(tài)用戶建模分析用戶提供的個人信息,比如,注冊信息和問巻調查。發(fā)明人經(jīng)過分析,發(fā)現(xiàn)靜態(tài)用戶建模的方法只能對用戶的興趣做一個粗略的描述,在實際應用中存在一些問題,首先,由于這種用戶模型是靜態(tài)的,因此模型描述的用戶興趣只在某一段時間內有效,不能反映未來用戶興趣的變化情況;其次,用戶提交的個人信息是一種主觀的輸入,不能客觀反映其興趣的特征。動態(tài)用戶建模分析用戶在網(wǎng)站上的活動和行為,發(fā)明人經(jīng)過分析,發(fā)現(xiàn)這種模型對用戶模型的描述粒度很小,具體到某一個興趣點,沒有一個概括的描述。另外,還有其它一些用戶建模的方法需要用戶提供反饋信息,這樣會使用戶的操作變得復雜,影響用戶正常的行為。
發(fā)明內容本發(fā)明實施例提供一種向用戶提供目標信息的方法,用以量化并按用戶需求多粒度地描述用戶對信息的興趣,動態(tài)反映用戶興趣的變化過程,簡化用戶操作,該方法包括獲取用戶瀏覽信息的歷史行為數(shù)據(jù),所述歷史行為數(shù)據(jù)包括信息的內容及瀏覽的時刻;對所述信息的內容進行分類,獲得所述信息歸屬于設定類別的概率;根據(jù)所述概率及所述瀏覽的時刻,獲得用戶在設定時刻的興趣值;根據(jù)所述興趣值,在所述設定時刻向用戶提供目標信息。較佳的,所述歷史行為數(shù)據(jù)還包括用戶標識;根據(jù)用戶標識、所述概率及所述瀏覽的時刻,獲得不同用戶在設定時刻的興趣值;根據(jù)所述興趣值及接收的用戶標識,在所述設定時刻向相應用戶提供目標信息。較佳的,所述用戶標識為用戶的注冊名或IP地址。較佳的,對所述信息的內容進行分類,獲得所述信息歸屬于設定類別的概率包括對所述信息的內容進行分類,獲得所述信息歸屬的類別的個數(shù);根據(jù)所述信息歸屬的類別的個數(shù),獲得所述信息歸屬于設定類別的概率。較佳的,根據(jù)所述概率及所述瀏覽的時刻,獲得用戶在設定時刻的興趣值包括按如下公式,獲得用戶在所述瀏覽的時刻的興趣值其中,k為遺忘因子,、為記憶因子,w妙,為所述相Jt率,t為所述瀏覽的時刻;按如下公式,獲得用戶在設定時刻的興趣值Z(")(0=Z("-1)("z")+、而沐(一-e力)其中,t為所述瀏覽的時刻,t+r為所述設定時刻,"meS《,r=—!,we/g似為所述扭克率。較佳的,所述信息為網(wǎng)站、網(wǎng)頁、或網(wǎng)頁中的對象。較佳的,根據(jù)所述興趣值,在所述設定時刻向用戶提供目標信息包括將所述興趣值與閾值進行大小比較;在所述設定時刻向用戶提供不小于所述閾值的興趣值所對應類別的信息。本發(fā)明實施例還提供一種向用戶提供目標信息的設備,用以量化并按用戶需求多粒度地描述用戶對信息的興趣,動態(tài)反映用戶興趣的變化過程,簡化用戶操作,該設備包括獲取模塊,用于獲取用戶瀏覽信息的歷史行為數(shù)據(jù),所述歷史行為數(shù)據(jù)包括信息的內容及瀏覽的時刻;分類模塊,用于對所述信息的內容進行分類,獲得所述信息歸屬于設定類別的概率;處理模塊,用于根據(jù)所述概率及所述瀏覽的時刻,獲得用戶在設定時刻的興趣值;提供模塊,用于根據(jù)所述興趣值,在所述設定時刻向用戶提供目標信息。較佳的,所述歷史行為數(shù)據(jù)還包括用戶標識;所述處理模塊進一步用于根據(jù)用戶標識、所述概率及所述瀏覽的時刻,獲得不同用戶在設定時刻的興趣值;所述提供模塊包括接收單元,用于4妄收用戶標識;第一提供單元,用于根據(jù)所述興趣值及接收的用戶標識,在所述設定時刻向相應用戶提供目標信息。較佳的,所述分類模塊包括第一分類單元,用于對所述信息的內容進行分類,獲得所述信息歸屬的類別的個數(shù);第二分類單元,用于根據(jù)所述信息歸屬的類別的個數(shù),獲得所述信息歸屬于設定類別的概率。較佳的,所述處理模塊包括第一處理單元,用于按如下公式,獲得用戶在所述瀏覽的時刻的興趣值<formula>formulaseeoriginaldocumentpage8</formula>其中,k為遺忘因子,、為記憶因子,w妙,為所述扭X率,t為所述瀏覽的時刻;第二處理單元,用于按如下公式,獲得用戶在設定時刻的興趣值<formula>formulaseeoriginaldocumentpage8</formula>其中,t為所述瀏覽的時刻,t+r為所述設定時刻,<formula>formulaseeoriginaldocumentpage8</formula>為所述相Jt率。較佳的,所述提供模塊包括比較單元,用于將所述興^值與閾值進行大小比較;第二提供單元,用于在所述設定時刻向用戶提供不小于所迷閾值的興趣值所對應類別的信息。本發(fā)明實施例中,通過獲取用戶瀏覽信息的歷史行為數(shù)據(jù),所述歷史行為數(shù)據(jù)包括信息的內容及瀏覽的時刻;對所述信息的內容進行分類,獲得所述信息歸屬于設定類別的概率;根據(jù)所述概率及所述瀏覽的時刻,獲得用戶在設定時刻的興趣值;根據(jù)所述興趣值,在所述設定時刻向用戶提供目標信息,不但可以量化并按用戶需求多粒度地描述用戶對信息的興趣,動態(tài)反映用戶興趣的變化過程,對用戶未來的興趣趨勢作出預測,實施時也無需用戶提供反饋信息,使用戶操作相對簡化。圖1為本發(fā)明實施例中向用戶提供目標信息的流程圖;圖2為本發(fā)明實施例中用戶瀏覽的信息歸屬于設定類別的概率曲線圖;圖3為本發(fā)明實施例中向用戶提供目標信息的設備的結構示意圖;圖4、圖7為本發(fā)明實施例中提供模塊的結構示意圖;圖5為本發(fā)明實施例中分類模塊的結構示意圖;圖6為本發(fā)明實施例中處理模塊的結構示意圖。具體實施方式下面結合說明書附圖對本發(fā)明實施例進行詳細說明。如圖l所示,本發(fā)明實施例中,向用戶提供目標信息的流程如下步驟ll、獲取用戶瀏覽信息的歷史行為數(shù)據(jù),該歷史行為數(shù)據(jù)包括信息的內容及瀏覽的時刻。步驟12、對信息的內容進行分類,獲得該信息歸屬于設定類別的概率。步驟13、根據(jù)獲得的概率及瀏覽的時刻,獲得用戶在設定時刻的興趣值。步驟14、根據(jù)該興趣值,在設定時刻向用戶提供目標信息。圖l所示流程中,用戶所瀏覽的信息可以是網(wǎng)站,也可以是網(wǎng)頁,還可以是網(wǎng)頁中的對象,具體可根據(jù)用戶需求設置。本領域普通技術人員容易理解,在不同的應用場合,可以針對用戶所需要的目標信息進行上述處理,大到一個網(wǎng)站,小到網(wǎng)頁中的一件商品,都可適用本發(fā)明實施例方法,從而實現(xiàn)按用戶需求多粒度地描述用戶對信息感興趣的程度。一個實施例中,在用戶為多個時,步驟11中的歷史行為數(shù)據(jù)還可以包括用戶標識,用以唯一標識用戶。該用戶標識可以是用戶的注冊名、nM也址等。表l以用戶所瀏覽的信息是網(wǎng)頁為例,說明用戶的歷史行為數(shù)據(jù)表l用戶的歷史行為數(shù)據(jù)<table>tableseeoriginaldocumentpage10</column></row><table>若用戶為多個,則在步驟12中,可以才艮據(jù)用戶標識、所述概率及所述瀏覽的時刻,獲得不同用戶在設定時刻的興趣值。才艮據(jù)不同用戶的需求,可以預設不同的分類體系,可以是單層的,也可以是多層的,還可以是其它的分類方法。無論采用什么分類方法,其最終目的均是將用戶瀏覽的信息的內容歸類到某一個或者某幾個類別中,并獲得用戶瀏覽的信息歸屬于某一個類別的概率p。例如,表1中,http:〃idoican/page1.html的信息內容歸屬于新聞類別的概率p=0.8,http:〃idoican/2008.mp3的信息內容歸屬于音樂類別的相無率p=1.0,http:〃idoican/page2.h加l的信息內容歸屬于體育類別的概率p=0.6。一個實施例中,可以先對信息的內容進行分類,獲得該信息歸屬的類別的個數(shù),后續(xù)根據(jù)該信息歸屬的類別的個數(shù),獲得該信息歸屬于設定類別的概率。例如,某信息既包含新聞類別的內容,又包含音樂類別的內容,還包含體育類別的內容,則該信息可歸屬于新聞、音樂、體育3個類別,概率均為p-0.33。又如,某信息僅包含新聞類別的內容,則該信息歸屬于新聞1個類別,概率為p=l。實施中也可結合考慮信息內容的具體構成,例如,某信息80%的內容屬新聞類別,20%的內容屬音樂類別,則可以認為該信息歸屬于新聞類別的概率為p-0.8,歸屬于音樂類別的概率為p=0.2。一個實施例中,對用戶瀏覽的信息的內容按照分類體系進行分類后,可以在每一個類別中按照時間順序對概率進行排序,數(shù)據(jù)處理完成后可得如表2所示的分類后的歷史行為數(shù)據(jù)。其中,Topic是分類體系中的某一個類別,weight是用戶瀏覽的信息歸屬于設定類別的概率。表2分類后的歷史行為數(shù)據(jù)<table>tableseeoriginaldocumentpage11</column></row><table>將表1的舉例應用到表2,可以得到表3:表3分類后的歷史行為數(shù)據(jù)的具體實例<table>tableseeoriginaldocumentpage11</column></row><table>一個實施例中,根據(jù)艾賓浩斯的記憶遺忘規(guī)律,步驟14在實施時可按公式①獲得用戶在瀏覽的時刻的興趣值—其中,k為遺忘因子,例如取k-0.1;^為記憶因子,例如取、=0.9;weight為概率,t為瀏覽的時刻??梢?,公式①描述用戶在瀏覽的時刻對某一個類別該興趣的程度,值越大,興趣越大,實際是興趣的一種量化表示。由迭代關系推導,可按公式②獲得用戶在設定時刻的興趣值、②其中,t為瀏覽的時刻,t+r為設定時刻,"附SfS"me+1,<formula>formulaseeoriginaldocumentpage11</formula>&為概率。由此可見,在"r時刻,用戶的興趣值為上一時刻遺留的興趣值與此刻新增加的興趣值的疊加值。將表2中每個用戶的每個topic的時間序列帶入公式②可獲得每個用戶的興趣模型,在每一個用戶興趣模型中,每一個topic對應一個興趣值Z(t),根據(jù)Z(t)就可以預測出未來某個時間用戶的興趣變化。由圖2所示的公式②的函數(shù)曲線圖可知,本發(fā)明實施例中的興趣值可以動態(tài)反映用戶興趣的變化,如新的興趣的產(chǎn)生,已有興趣的消失或增強。在任何時刻均能計算出用戶對某個類別信息的興趣值。圖2僅為一例,從圖中可以看出,用戶對美食(cooking)和教育(education)這兩個類別的興趣有所增強,而家庭(home)這個類別的興趣有所減弱。根據(jù)本發(fā)明實施例中的用戶模型可以計算出用戶對不同信息的興趣值,用戶在網(wǎng)站上瀏覽信息時,可將興趣值大的內容推薦給用戶。具體在實施時,可設定一閾值,將計算所得的興趣值與該閾值進行大小比較;后續(xù)在設定時刻向用戶提供不小于該閾值的興趣值所對應類別的信息。若用戶為多個時,用戶需提交用戶標識,步驟14在實施例,可以根據(jù)前述獲得的興趣值及接收的用戶標識,在設定時刻向相應用戶提供目標信息。基于同一發(fā)明構思,本發(fā)明還提供一種向用戶提供目標信息的設備,其結構如圖3所示,包括獲取模塊31、分類模塊32、處理模塊33、提供模塊34;其中,獲取模塊31,用于獲取用戶瀏覽信息的歷史行為數(shù)據(jù),該歷史行為數(shù)據(jù)包括信息的內容及瀏覽的時刻;分類模塊32,用于對信息的內容進行分類,獲得該信息歸屬于設定類別的概率;處理模塊33,用于根據(jù)該概率及瀏覽的時刻,獲得用戶在設定時刻的興趣值;提供模塊34,用于根據(jù)該興趣值,在設定時刻向用戶提供目標信息。一個實施例中,歷史行為數(shù)據(jù)還包括用戶標識;此時,處理模塊33還可以用于根據(jù)用戶標識、前述獲得的概率及瀏覽的時刻,獲得不同用戶在設定時刻的興趣值;如圖4所示,此時提供模塊34包括接收單元341,用于接收用戶標識;第一提供單元342,用于根據(jù)興趣值及接收的用戶標識,在設定時刻向相應用戶提供目標信息。如圖5所示,一個實施例中,分類模塊32可以包括第一分類單元321,用于對信息的內容進行分類,獲得信息歸屬的類別的個數(shù);第二分類單元322,用于根據(jù)信息歸屬的類別的個數(shù),獲得信息歸屬于設定類別的概率。如圖6所示,一個實施例中,處理模塊33包括第一處理單元331,用于按如下公式,獲得用戶在瀏覽的時刻的興趣值A:a-fc其中,k為遺忘因子,、為記憶因子,^妙,為概率,t為瀏覽的時刻;第二處理單元332,用于按如下公式,獲得用戶在設定時刻的興趣值<formula>formulaseeoriginaldocumentpage13</formula>其中,t為瀏覽的時刻,t+r為設定時刻,"we,r=—"附e"—!,we/g似為所述和克率。如圖7所示,一個實施例中,提供模塊34可以包括比較單元343,用于將興趣值與閾值進行大小比較;第二提供單元344,用于在設定時刻向用戶提供不小于閾值的興趣值所對應類別的信息。以通過程序來指令相關的硬件完成,該程序可以存儲于一計算^L可讀存儲介質中,存儲介質可以包括ROM、RAM、磁盤或光盤等。本發(fā)明實施例中,通過獲取用戶瀏覽信息的歷史行為數(shù)據(jù),該歷史行為數(shù)據(jù)包括信息的內容及瀏覽的時刻;對信息的內容進行分類,獲得該信息歸屬于設定類別的概率;根據(jù)獲得的概率及瀏覽的時刻,獲得用戶在設定時刻的興趣值;根據(jù)興趣值,在設定時刻向用戶提供目標信息,不但可以量化并按用戶需求多粒度地描述用戶對信息的興趣,動態(tài)反映用戶興趣的變化過程,對用戶未來的興趣趨勢作出預測,實施時也無需用戶提供反饋信息,使用戶操作相對簡化。顯然,本領域的技術人員可以對本發(fā)明進行各種改動和變形而不脫離本發(fā)明的精神和范圍。這樣,倘若對本發(fā)明的這些修改和變型屬于本發(fā)明權利要求及其等同技術的范圍之內,則本發(fā)明也意圖包含這些改動和變型在內。權利要求1、一種向用戶提供目標信息的方法,其特征在于,該方法包括獲取用戶瀏覽信息的歷史行為數(shù)據(jù),所述歷史行為數(shù)據(jù)包括信息的內容及瀏覽的時刻;對所述信息的內容進行分類,獲得所述信息歸屬于設定類別的概率;根據(jù)所述概率及所述瀏覽的時刻,獲得用戶在設定時刻的興趣值;根據(jù)所述興趣值,在所述設定時刻向用戶提供目標信息。2、如權利要求1所述的方法,其特征在于,所述歷史行為數(shù)據(jù)還包括用戶標識;根據(jù)用戶標識、所述概率及所述瀏覽的時刻,獲得不同用戶在設定時刻的興趣值;根據(jù)所述興趣值及接收的用戶標識,在所述設定時刻向相應用戶提供目標信息。3、如權利要求2所述的方法,其特征在于,所述用戶標識為用戶的注冊名或IP;也址。4、如權利要求l所述的方法,其特征在于,對所述信息的內容進行分類,獲得所述信息歸屬于設定類別的概率包括對所述信息的內容進行分類,獲得所述信息歸屬的類別的個數(shù);根據(jù)所述信息歸屬的類別的個數(shù),獲得所述信息歸屬于設定類別的概率。5、如權利要求1所述的方法,其特征在于,根據(jù)所述概率及所述瀏覽的時刻,獲得用戶在設定時刻的興趣值包括按如下公式,獲得用戶在所述瀏覽的時刻的興趣值z<formula>formulaseeoriginaldocumentpage2</formula>其中,k為遺忘因子,、為記憶因子,w妙,為所述^t率,t為所述瀏覽的時刻;按如下公式,獲得用戶在設定時刻的興趣值)=Z("-+r)+、麗抓(e-勤—其中,t為所述瀏覽的時刻,t+z"為所述設定時刻,"we"Sf《,r=">we—!,wdg/^為所述相克率。6、如權利要求1所述的方法,其特征在于,所述信息為網(wǎng)站、網(wǎng)頁、或網(wǎng)頁中的對象。7、如權利要求1至6任一項所述的方法,其特征在于,根據(jù)所述興趣值,在所述設定時刻向用戶提供目標信息包括將所述興趣值與閾值進行大小比較;在所述設定時刻向用戶提供不小于所述閾值的興趣值所對應類別的信息。8、一種向用戶提供目標信息的設備,其特征在于,包括獲取模塊,用于獲取用戶瀏覽信息的歷史行為數(shù)據(jù),所述歷史行為數(shù)據(jù)包括信息的內容及瀏覽的時刻;分類模塊,用于對所述信息的內容進行分類,獲得所述信息歸屬于設定類別的概率;處理模塊,用于根據(jù)所述概率及所述瀏覽的時刻,獲得用戶在設定時刻的興趣值;提供模塊,用于根據(jù)所述興趣值,在所述設定時刻向用戶提供目標信息。9、如權利要求8所述的設備,其特征在于,所述歷史行為數(shù)據(jù)還包括用戶標識;所述處理模塊進一步用于根據(jù)用戶標識、所述概率及所述瀏覽的時刻,獲得不同用戶在設定時刻的興趣值;所述提供模塊包括接收單元,用于接收用戶標識;第一提供單元,用于根據(jù)所述興趣值及接收的用戶標識,在所述設定時刻向相應用戶提供目標信息。10、如權利要求8所述的設備,其特征在于,所述分類模塊包括第一分類單元,用于對所述信息的內容進行分類,獲得所述信息歸屬的類別的個數(shù);第二分類單元,用于根據(jù)所述信息歸屬的類別的個數(shù),獲得所述信息歸屬于設定類別的概率。11、如權利要求8所述的設備,其特征在于,所述處理模塊包括第一處理單元,用于按如下公式,獲得用戶在所述瀏覽的時刻的興趣值其中,k為遺忘因子,^為記憶因子,w妙,為所述概率,t為所述瀏覽的時刻;第二處理單元,用于按如下公式,獲得用戶在設定時刻的興趣值Z(")(,)=Z("-')(,+r)+、衡.*"(-一。');其中,t為所述瀏覽的時刻,t+r為所述i殳定時刻,"weSt^"'me+1,t="附e"—"we"—!,為所述扭克率。12、如權利要求8至11任一項所述的設備,其特征在于,所述提供模塊包括比較單元,用于將所述興趣值與閾值進行大小比較;第二提供單元,用于在所述設定時刻向用戶提供不小于所述閾值的興趣值所對應類別的信息。全文摘要本發(fā)明公開了一種向用戶提供目標信息的方法,該方法包括獲取用戶瀏覽信息的歷史行為數(shù)據(jù),所述歷史行為數(shù)據(jù)包括信息的內容及瀏覽的時刻;對所述信息的內容進行分類,獲得所述信息歸屬于設定類別的概率;根據(jù)所述概率及所述瀏覽的時刻,獲得用戶在設定時刻的興趣值;根據(jù)所述興趣值,在所述設定時刻向用戶提供目標信息。本發(fā)明同時公開一種向用戶提供目標信息的設備。采用本發(fā)明可以量化并按用戶需求多粒度地描述用戶對信息的興趣,動態(tài)反映用戶興趣的變化過程,簡化用戶操作。文檔編號G06F17/30GK101266620SQ200810103480公開日2008年9月17日申請日期2008年4月7日優(yōu)先權日2008年4月7日發(fā)明者吳定明,趙東巖申請人:北京大學;北大方正集團有限公司;北京方正阿帕比技術有限公司