1.一種實時信息的推薦方法,其特征在于,包括:
獲取用戶行為數(shù)據(jù);
根據(jù)所述用戶行為數(shù)據(jù)分別計算用戶的短期興趣、長期興趣和實時興趣;
根據(jù)所述用戶的短期興趣、長期興趣和實時興趣確定用戶興趣;
基于所述用戶興趣向用戶推薦實時信息。
2.根據(jù)權利要求1所述的方法,其特征在于,所述根據(jù)所述用戶行為數(shù)據(jù)分別計算用戶的短期興趣、長期興趣和實時興趣,包括:
根據(jù)所述用戶行為數(shù)據(jù)計算用戶在預置周期中每一天的興趣權值,得到天興趣權值,并對所述天興趣權值按照時間進行衰減,得到用戶的短期興趣;
根據(jù)所述用戶行為數(shù)據(jù)計算用戶在預置時間范圍內的興趣權值,得到用戶的長期興趣,所述預置時間范圍大于一天;
根據(jù)所述用戶行為數(shù)據(jù)確定用戶當前點擊的興趣權值,得到用戶的實時興趣。
3.根據(jù)權利要求2所述的方法,其特征在于,所述對所述天興趣權值按照時間進行衰減,得到用戶的短期興趣,包括:
根據(jù)所述天興趣權值確定當前需要進行衰減的興趣權值;
對所述需要進行衰減的興趣權值按照時間進行衰減,得到衰減后的興趣權值;
返回執(zhí)行根據(jù)所述天興趣權值確定當前需要進行衰減的興趣權值的步驟,直至所述天興趣權值中所有需要進行衰減的興趣權重衰減完畢;
對得到的所有衰減后的興趣權值進行統(tǒng)計,得到用戶的短期興趣。
4.根據(jù)權利要求3所述的方法,其特征在于,所述對所述需要進行衰減的興趣權值按照時間進行衰減,得到衰減后的興趣權值,包括:
確定所述需要進行衰減的興趣權值所在的日期與當前日期的日期差;
計算所述日期差與預置衰減系數(shù)的乘積,并計算1與所述乘積的差;
將所述需要進行衰減的興趣權值乘以所述差,得到衰減后的興趣權值。
5.根據(jù)權利要求2所述的方法,其特征在于,所述根據(jù)所述用戶行為數(shù)據(jù) 計算用戶在預置時間范圍內的興趣權值,得到用戶的長期興趣,包括:
根據(jù)所述用戶行為數(shù)據(jù)統(tǒng)計用戶在當前日期的一年內,每個月的用戶行為;
根據(jù)所述每個月的用戶行為計算每個興趣在當月的權重;
根據(jù)所述每個興趣在當月的權重計算一年內每個興趣的平均權重;
對所述平均權重進行統(tǒng)計,得到用戶的長期興趣。
6.根據(jù)權利要求1至5任一項所述的方法,所述基于所述用戶興趣向用戶推薦實時信息,包括:
根據(jù)所述用戶興趣,從實時信息的倒排索引中召回相應的實時信息,得到候選推薦信息;
基于所述候選推薦信息推薦實時信息給所述用戶。
7.根據(jù)權利要求6所述的方法,其特征在于,所述將基于所述候選推薦信息推薦實時信息給所述用戶,包括:
計算所述候選推薦信息中各實時信息與所述用戶興趣的匹配度,得到實時信息的興趣相關性;
確定所述候選推薦信息中各實時信息的發(fā)布時間確定各實時信息的新鮮度,得到實時信息的時新性;
確定所述候選推薦信息中各實時信息的點擊率,并根據(jù)所述點擊率計算點擊模型因子;
根據(jù)所述興趣相關性、時新性和點擊模型因子從所述候選推薦信息中確定推薦信息;
將所述推薦信息推薦給所述用戶。
8.根據(jù)權利要求7所述的方法,其特征在于,所述根據(jù)所述興趣相關性、時新性和點擊模型因子從所述候選推薦信息中確定推薦信息,包括:
根據(jù)所述興趣相關性、時新性和點擊模型因子對所述候選推薦信息中的實時信息進行評分;
將評分高于預置閾值的實時信息確定為推薦信息。
9.根據(jù)權利要求6所述的方法,其特征在于,所述根據(jù)所述興趣相關性、時新性和點擊模型因子從所述候選推薦信息中確定推薦信息之前,還包括:
確實所述候選推薦信息中各實時信息的信息質量;
所述根據(jù)所述興趣相關性、時新性和點擊模型因子從所述候選推薦信息中確定推薦信息,包括:根據(jù)上所述興趣相關性、時新性、點擊模型因子和信息質量從所述候選推薦信息中確定推薦信息。
10.根據(jù)權利要求9所述的方法,其特征在于,所述根據(jù)上所述興趣相關性、時新性、點擊模型因子和信息質量從所述候選推薦信息中確定推薦信息,包括:
根據(jù)所述興趣相關性、時新性、點擊模型因子和信息質量對所述候選推薦信息中的實時信息進行評分;
將評分高于預置閾值的實時信息確定為推薦信息。
11.根據(jù)權利要求6所述的方法,其特征在于,所述根據(jù)所述用戶興趣,從實時信息的倒排索引中召回相應的實時信息,得到候選推薦信息之前,還包括:
從原始實時信息庫中獲取原始實時信息;
對獲取到的原始實時信息進行特征提取;
根據(jù)提取到的特征對所述原始實時信息進行分類預測和話題預測,以確定原始實時信息類目和主題;
對獲取到的原始實時信息的內容進行詞性加權處理后,進行文本域加權,以確定原始實時信息所屬的關鍵字;
根據(jù)原始實時信息類目、主題和關鍵字計算所述原始實時信息庫中原始實時信息的倒排索引,得到實時信息的倒排索引;
所述根據(jù)所述用戶興趣,從實時信息的倒排索引中召回相應的實時信息,得到候選推薦信息,具體為:根據(jù)用戶興趣確定用戶所感興趣的類目、主題和/或關鍵字,從所述實時信息的倒排索引中獲取與用戶所感興趣的類目、主題和/或關鍵字相同、相似或相近的原始實時信息,得到候選推薦信息。
12.一種實時信息的推薦裝置,其特征在于,包括:
獲取單元,用于獲取用戶行為數(shù)據(jù);
運算單元,用于根據(jù)所述用戶行為數(shù)據(jù)分別計算用戶的短期興趣、長期興趣和實時興趣;
確定單元,用于根據(jù)所述用戶的短期興趣、長期興趣和實時興趣確定用戶興趣;
推薦單元,用于基于所述用戶興趣向用戶推薦實時信息。
13.根據(jù)權利要求12所述的裝置,其特征在于,所述運算單元包括第一計算子單元、第二計算子單元和第三計算子單元;
第一計算子單元,用于根據(jù)所述用戶行為數(shù)據(jù)計算用戶在預置周期中每一天的興趣權值,得到天興趣權值,并對所述天興趣權值按照時間進行衰減,得到用戶的短期興趣;
第二計算子單元,用于根據(jù)所述用戶行為數(shù)據(jù)計算用戶在預置時間范圍內的興趣權值,得到用戶的長期興趣,所述預置時間范圍大于一天;
第三計算子單元,用于根據(jù)所述用戶行為數(shù)據(jù)確定用戶當前點擊的興趣權值,得到用戶的實時興趣。
14.根據(jù)權利要求13所述的裝置,其特征在于,
所述第一計算子單元,具體用于根據(jù)所述天興趣權值確定當前需要進行衰減的興趣權值,對所述需要進行衰減的興趣權值按照時間進行衰減,得到衰減后的興趣權值;返回執(zhí)行根據(jù)所述天興趣權值確定當前需要進行衰減的興趣權值的操作,直至所述天興趣權值中所有需要進行衰減的興趣權重衰減完畢;對得到的所有衰減后的興趣權值進行統(tǒng)計,得到用戶的短期興趣。
15.根據(jù)權利要求14所述的裝置,其特征在于,
所述第一計算子單元,具體用于確定所述需要進行衰減的興趣權值所在的日期與當前日期的日期差;計算所述日期差與預置衰減系數(shù)的乘積,并計算1與所述乘積的差;將所述需要進行衰減的興趣權值乘以所述差,得到衰減后的興趣權值。
16.根據(jù)權利要求13所述的裝置,其特征在于,
第二計算子單元,具體用于根據(jù)所述用戶行為數(shù)據(jù)統(tǒng)計用戶在當前日期的一年內,每個月的用戶行為;根據(jù)所述每個月的用戶行為計算每個興趣在當月的權重;根據(jù)所述每個興趣在當月的權重計算一年內每個興趣的平均權重;對所述平均權重進行統(tǒng)計,得到用戶的長期興趣。
17.根據(jù)權利要求12至16任一項所述的裝置,其特征在于,所述推薦單元包括召回子單元和推薦子單元;
所述召回子單元,用于根據(jù)所述用戶興趣,從實時信息的倒排索引中召回相應的實時信息,得到候選推薦信息;
所述推薦子單元,用于基于所述候選推薦信息推薦實時信息給所述用戶。
18.根據(jù)權利要求17所述的裝置,其特征在于,
所述推薦子單元,具體用于計算所述候選推薦信息中各實時信息與所述用戶興趣的匹配度,得到實時信息的興趣相關性;確定所述候選推薦信息中各實時信息的發(fā)布時間確定各實時信息的新鮮度,得到實時信息的時新性;確定所述候選推薦信息中各實時信息的點擊率,并根據(jù)所述點擊率計算點擊模型因子;根據(jù)所述興趣相關性、時新性和點擊模型因子從所述候選推薦信息中確定推薦信息;將所述推薦信息推薦給所述用戶。
19.根據(jù)權利要求17所述的裝置,其特征在于,
所述推薦子單元,具體用于計算所述候選推薦信息中各實時信息與所述用戶興趣的匹配度,得到實時信息的興趣相關性;確定所述候選推薦信息中各實時信息的發(fā)布時間確定各實時信息的新鮮度,得到實時信息的時新性;確定所述候選推薦信息中各實時信息的點擊率,并根據(jù)所述點擊率計算點擊模型因子;確實所述候選推薦信息中各實時信息的信息質量;根據(jù)所述興趣相關性、時新性、點擊模型因子和信息質量從所述候選推薦信息中確定推薦信息;將所述推薦信息推薦給所述用戶。
20.根據(jù)17所述的裝置,其特征在于,還包括倒排索引確定單元;
倒排索引確定單元,用于從原始實時信息庫中獲取原始實時信息;對獲取 到的原始實時信息進行特征提?。桓鶕?jù)提取到的特征對所述原始實時信息進行分類預測和話題預測,以確定原始實時信息類目和主題;對獲取到的原始實時信息的內容進行詞性加權處理后,進行文本域加權,以確定原始實時信息所屬的關鍵字;根據(jù)原始實時信息類目、主題和關鍵字計算所述原始實時信息庫中原始實時信息的倒排索引,得到實時信息的倒排索引;
所述召回子單元,具體用于根據(jù)用戶興趣確定用戶所感興趣的類目、主題和/或關鍵字,從所述實時信息的倒排索引中獲取與用戶所感興趣的類目、主題和/或關鍵字相同、相似或相近的原始實時信息,得到候選推薦信息。
21.一種實時信息的推薦系統(tǒng),其特征在于,包括權利要求12至20所述的任一種實時信息的推薦裝置。