專利名稱:一種信息推薦方法及系統(tǒng)的制作方法
技術領域:
本申請涉及互聯(lián)網(wǎng)應用技術領域,特別是涉及一種信息推薦方法及系統(tǒng)。
背景技術:
隨著互聯(lián)網(wǎng)的不斷發(fā)展,通過網(wǎng)站或即時通信等方式結(jié)識網(wǎng)友已經(jīng)成為一種流行趨勢。目前,很多網(wǎng)站或即時通信工具都具有好友信息推薦的功能,通過好友信息推薦,可以拓展用戶群體,增進網(wǎng)友之間的交流和互動,也可以加強網(wǎng)站或即時通信工具對用戶的粘性。現(xiàn)有技術中一種常用的好友信息推薦方式是根據(jù)當前已經(jīng)存在的好友關系進行推薦,例如,當前,用戶A和用戶B具有好友關系,并且用戶B和用戶C具有好友關系,則系統(tǒng)會根據(jù)上述已存在的好友關系,將用戶C的標識信息推薦給用戶A,其中,用戶標識信息可以在系統(tǒng)中唯一標識用戶的身份,例如用戶名、用戶郵件賬號、用戶ID號碼等。上述信息推薦方式的問題在于,系統(tǒng)向用戶所推薦的只是“好友的好友”,卻并不一定是用戶真正感興趣的好友。現(xiàn)有技術中另一種信息推薦方式是根據(jù)用戶的屬性信息進行推薦,例如,向用戶推薦具有相同或相似愛好的用戶作為好友。這種方式的實現(xiàn)依賴于用戶屬性信息的完整性和準確性,然而在實際應用中,很多用戶在注冊時往往并不注重這部分信息的填寫,使得這種方案難以實施。綜上所述,現(xiàn)有的推薦方案無法實現(xiàn)準確有效的好友信息推薦,而一旦向用戶推薦了不合適的網(wǎng)友的信息,則很可能會降低用戶的使用感受。從系統(tǒng)的角度而言,不合適的好友信息推薦必然會增加用戶之間不必要的信息交互,從而導致為網(wǎng)站服務器或即時通信服務器增加額外的無效負擔,以及網(wǎng)絡帶寬資源的額外浪費。
發(fā)明內(nèi)容
為解決上述技術問題,本申請實施例提供一種信息推薦方法及系統(tǒng),以提高用戶的使用感受、減少用戶之間不必要的信息交互,減輕系統(tǒng)服務器的負擔,節(jié)省網(wǎng)絡帶寬資源占用。本申請實施例所提供的技術方案如下本申請實施例提供一種信息推薦方法,包括查詢預置時間段內(nèi)的用戶行為數(shù)據(jù);根據(jù)所查詢的用戶行為數(shù)據(jù),獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,并利用所獲得的子類目興趣度和/或關鍵詞興趣度,構(gòu)成用戶的興趣度向量;利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;根據(jù)相似性計算結(jié)果,選取與當前用戶興趣度向量相似性最高的至少一名用戶, 將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述子類目興趣度,用于表示用戶對網(wǎng)站子類目訪問興趣度的相對關系;所述關鍵詞興趣度,用于表示用戶對關鍵詞使用興趣的相對關系。
本申請實施例還提供一種信息推薦系統(tǒng),包括查詢單元,用于查詢預置時間段內(nèi)的用戶行為數(shù)據(jù);用戶興趣度獲得單元,用于根據(jù)所述查詢單元的查詢結(jié)果,獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,并利用所獲得的子類目興趣度和/或關鍵詞興趣度,構(gòu)成用戶的興趣度向量;用戶相似性計算單元,用于利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;第一推薦單元,用于根據(jù)相似性計算結(jié)果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述子類目興趣度,用于表示用戶對網(wǎng)站子類目訪問興趣度的相對關系;所述關鍵詞興趣度,用于表示用戶對關鍵詞使用興趣的相對關系。本申請實施例提供的技術方案,利用用戶在網(wǎng)站上的行為數(shù)據(jù)進行好友標識信息的推薦。行為數(shù)據(jù)是在用戶訪問網(wǎng)站時系統(tǒng)所要記錄的必要信息,因此本申請方案不會為系統(tǒng)增加額外的負擔。與現(xiàn)有的推薦方式相比,行為數(shù)據(jù)信息能夠在客觀上反映用戶的興趣及需求,也不需要依賴于用戶個人的填寫,因此本申請方案可以實現(xiàn)更為準確和有效的好友信息推薦,從而提高用戶的使用感受、減少用戶之間不必要的信息交互,減輕系統(tǒng)服務器的負擔,節(jié)省網(wǎng)絡帶寬資源占用。
為了更清楚地說明本申請實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本申請中記載的一些實施例,對于本領域普通技術人員來講,還可以根據(jù)這些附圖獲得其他的附圖。圖1為本申請實施例信息推薦方法的一種流程圖;圖2為本申請實施例信息推薦方法的第二種流程圖;圖3為本申請實施例信息推薦方法的第三種流程圖;圖4為本申請實施例信息推薦方法的第四種流程圖;圖5為本申請實施例信息推薦系統(tǒng)的結(jié)構(gòu)示意圖;圖6為本申請實施例信息推薦系統(tǒng)的另一種結(jié)構(gòu)示意圖;圖7為本申請實施例信息推薦系統(tǒng)的第三種結(jié)構(gòu)示意圖。
具體實施例方式為了使本技術領域的人員更好地理解本申請中的技術方案,下面將結(jié)合本申請實施例中的附圖,對本申請實施例中的技術方案進行清楚、完整地描述,顯然,所描述的實施例僅僅是本申請一部分實施例,而不是全部的實施例?;诒旧暾堉械膶嵤├绢I域普通技術人員所獲得的所有其他實施例,都應當屬于本申請保護的范圍。首先對本申請實施例的一種信息推薦方法進行說明,參見圖1所示,包括以下步驟查詢預置時間段內(nèi)的用戶行為數(shù)據(jù),
根據(jù)所查詢的用戶行為數(shù)據(jù),獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,并利用所獲得的子類目興趣度和/或關鍵詞興趣度,構(gòu)成用戶的興趣度向量;利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;根據(jù)相似性計算結(jié)果,選取與當前用戶興趣度向量相似性最高的至少一名用戶, 將所選取的用戶的標識信息,向當前用戶進行推薦;在上述方案中,“子類目興趣度”的作用是表示用戶對網(wǎng)站各個子類目訪問興趣度的相對關系,其中,在用戶行為數(shù)據(jù)中,一般都記錄著用戶對每個網(wǎng)站子類目頁面的點擊/ 瀏覽次數(shù)、在每個子類目的停留時間、在每個子類目發(fā)布信息的次數(shù)等信息,這些信息都可以用來表示用戶對子類目的興趣。在實際應用中,可以利用上述任意一種信息數(shù)據(jù)值,或者多種信息數(shù)據(jù)值的加權(quán),分別表示出用戶對每個網(wǎng)站子類目的興趣值,某個用戶對每個網(wǎng)站子類目的興趣值的數(shù)據(jù)集合,即構(gòu)成了該用戶的子類目興趣度。類似地,“關鍵詞興趣度”的作用是表示用戶對各種關鍵詞使用興趣度的相對關系,其中,在用戶行為數(shù)據(jù)中,一般都記錄著用戶對各種關鍵詞的使用場景、使用次數(shù)等信息,這些信息都可以用來表示用戶對關鍵詞的使用興趣。在實際應用中,可以利用上述任意一種信息數(shù)據(jù)值,或者多種信息數(shù)據(jù)值的加權(quán),分別表示出用戶對每個關鍵詞的興趣值,某個用戶對每個關鍵詞的興趣值的數(shù)據(jù)集合,即構(gòu)成了該用戶的關鍵詞興趣度。在本申請實施例的方案中,為系統(tǒng)中的每個用戶構(gòu)建一個興趣度向量,然后根據(jù)用戶間的興趣度向量的相似性關系,判斷用戶之間是否有相似的興趣,并以此作為推薦好友的依據(jù)。其中,用戶的興趣度向量可以單獨根據(jù)子類目興趣度構(gòu)建、也可以單獨根據(jù)關鍵詞興趣度構(gòu)建,還可以同時使用以上兩者進行構(gòu)建。上述方案利用了用戶在網(wǎng)站上的行為數(shù)據(jù)進行好友信息推薦。由于行為數(shù)據(jù)是在用戶訪問網(wǎng)站時系統(tǒng)所要記錄的必要信息,因此本申請方案不會為系統(tǒng)增加額外的負擔。與現(xiàn)有的推薦方式相比,行為數(shù)據(jù)信息能夠在客觀上反映用戶的興趣及需求,也不需要依賴于用戶個人的填寫,因此本申請方案可以實現(xiàn)更為準確和有效的好友信息推薦,從而提高用戶的使用感受、減少用戶之間不必要的信息交互,減輕系統(tǒng)服務器的負擔,節(jié)省網(wǎng)絡帶寬資源占用。下面結(jié)合具體的實施方式,對本申請的信息推薦方案進行說明圖1所示為本申請實施例一種信息推薦方法的流程圖,包括以下步驟S101,查詢預置時間段內(nèi)的用戶行為數(shù)據(jù);本申請實施例方案,是基于用戶的行為的歷史數(shù)據(jù),對用戶之間的興趣相似性進行分析,作為好友信息推薦的依據(jù)。對于網(wǎng)站或即時通信工具的每一個注冊用戶,系統(tǒng)都會記錄用戶的各種行為,并將這些行為記錄在用戶日志中,常見的用戶行為數(shù)據(jù)包括用戶的瀏覽行為數(shù)據(jù)(例如曾經(jīng)瀏覽過哪些頁面、瀏覽頁面的次數(shù)、瀏覽頁面的時間)、搜索行為數(shù)據(jù)(例如曾經(jīng)使用過哪些搜索關鍵詞、使用搜索關鍵詞的次數(shù))等等,當然,對于不同應用的網(wǎng)站或即時通信工具,所記錄的具體行為數(shù)據(jù)的種類也各不相同。例如,對于電子商務網(wǎng)站而言,用戶的行為數(shù)據(jù)還可以包括用戶的賣、買行為數(shù)據(jù)等等,這些都可以體現(xiàn)出用戶的個人興趣,本領域技術人員也可以根據(jù)實際的應用需求,獲取不同類型的用戶行為數(shù)據(jù), 本實施例對此并不進行限定。 本申請實施例方案中,通過用戶日志獲取用戶的各種行為數(shù)據(jù),在實際應用中,可以獲取用戶從注冊時間開始至今的行為數(shù)據(jù)作為計算用戶興趣度的依據(jù)。而考慮到用戶的興趣很可能是隨著時間階段性變化的,因此也可以選擇用戶在最近一段時間(例如30天、 60天等等)的行為數(shù)據(jù)作為計算用戶短期興趣度的依據(jù)。本領域技術人員可以根據(jù)實際需求對所查詢時間段進行設定。S102,根據(jù)所查詢的用戶行為數(shù)據(jù),獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,并利用子類目興趣度和/或關鍵詞興趣度,構(gòu)成用戶的興趣度向量;1)子類目興趣度“子類目興趣度”的作用是表示用戶對網(wǎng)站各個子類目訪問興趣度的相對關系,例如,某網(wǎng)站共有兩個子類目A、B,那么對于該網(wǎng)站而言,用戶的子類目興趣度中,應該同時體現(xiàn)用戶對A、B兩個子類目興趣的相對關系。具體而言,用戶的對單個子類目的興趣,可以根據(jù)用戶行為數(shù)據(jù)中的相關信息來表示,例如,根據(jù)用戶行為數(shù)據(jù)可知用戶1曾經(jīng)瀏覽過子類目A下的網(wǎng)頁2次、瀏覽過子類目B下的網(wǎng)頁5次;用戶2曾經(jīng)瀏覽過子類目A下的網(wǎng)頁3次、瀏覽過子類目B下的網(wǎng)頁0次。那么可以將用戶1的子類目興趣度表示為O、5),將用戶2的子類目興趣度表示為 (3,0)。上述例子中,是以“用戶瀏覽子類目下網(wǎng)頁次數(shù)”這一行為數(shù)據(jù)來構(gòu)建用戶的子類目興趣度,可以理解的是,在實際應用中,還可以用其他的行為數(shù)據(jù)來構(gòu)建用戶的子類目興趣度,或者綜合考慮多種行為數(shù)據(jù)來構(gòu)建用戶的子類目興趣度,以電子商務網(wǎng)站應用為例, 可以采用以下的方式,計算用戶對單個子類目的興趣值用戶對某子類目興趣值=在該子類目下發(fā)布的商品數(shù)量拉+對該子類目下頁面的瀏覽次數(shù)*0. 1+在該子類目下的回復次數(shù)*0. 4+在該子類目下的訂單發(fā)放次數(shù)拉+在該子類目下的求購信息發(fā)布次數(shù)拉在上述方法中,利用到了電子商務網(wǎng)站中的5種行為數(shù)據(jù),并且對每種行為數(shù)據(jù)賦予一定的權(quán)重,然后通過計算加權(quán)值,得到對單個子類目的興趣值。通過上面的公式可以看出,結(jié)合電子商務網(wǎng)站的實際情況,對于發(fā)布商品、發(fā)布訂單等買賣行為賦予了較高的權(quán)值,而對于瀏覽等行為賦予了較低的權(quán)值。當然,以上公式僅用于示意性說明,根據(jù)不同的應用需求,也可以設置其他的權(quán)重值,或者選擇其他類型的行為數(shù)據(jù),本申請實施例對此并不進行限定。分別計算出用戶對每個子類目的興趣值之后,這些興趣值的集合也就構(gòu)成了用戶的子類目興趣度。2)關鍵詞興趣度“關鍵詞興趣度”的作用是表示用戶對各種關鍵詞使用興趣度的相對關系。在實際應用中,不同用戶所使用過的關鍵詞可能千差萬別,為了便于統(tǒng)計,系統(tǒng)可以根據(jù)所有用戶的歷史搜索行為,選取出一定數(shù)量的使用頻率較高、或者比較具有代表性的關鍵詞作為統(tǒng)計的依據(jù)。例如,某網(wǎng)站選用個搜索關鍵詞χ、γ、ζ作為關鍵詞興趣度的統(tǒng)計依據(jù),那么對于該網(wǎng)站而言,用戶的關鍵詞興趣度中,應該同時體現(xiàn)用戶對X、Y、Z三個關鍵詞使用興趣的相對關系。
具體而言,用戶的對單個關鍵詞的使用興趣,可以根據(jù)用戶行為數(shù)據(jù)中的相關信息來表示,例如,根據(jù)用戶行為數(shù)據(jù)可知用戶1曾經(jīng)使用關鍵詞X進行搜索共2次、使用關鍵詞Y進行搜索共3次、使用關鍵詞Z進行搜索共4次;用戶2曾經(jīng)使用關鍵詞X進行搜索共3次、使用關鍵詞Y進行搜索共1次、使用關鍵詞Z進行搜索共0次;那么可以將用戶1的關鍵詞興趣度表示為0、3、4),將用戶2的關鍵詞興趣度表示為(3、1、0)。當然,在實際應用中,所選用的關鍵詞數(shù)量可能遠大于3,上述例子僅用于示意性說明。上述例子中,是以“用戶使用關鍵詞進行搜索的次數(shù)”這一行為數(shù)據(jù)來構(gòu)建用戶的關鍵詞興趣度,可以理解的是,在實際應用中,還可以用其他的行為數(shù)據(jù)來構(gòu)建用戶的關鍵詞興趣度,或者綜合考慮多種行為數(shù)據(jù)來構(gòu)建用戶的關鍵詞興趣度,以電子商務網(wǎng)站應用為例,可以采用以下的方式,計算用戶對單個關鍵詞的興趣值用戶對某關鍵詞興趣值=所發(fā)布的商品信息中包含該關鍵詞的次數(shù)拉+所發(fā)布的求購信息中包含該關鍵詞的次數(shù)拉+使用該關鍵詞進行搜索的次數(shù)*0. 4在上述方法中,利用到了電子商務網(wǎng)站中的3種行為數(shù)據(jù),并且對每種行為數(shù)據(jù)賦予一定的權(quán)重,然后通過計算加權(quán)值,得到對單個關鍵詞的興趣值。通過上面的公式可以看出,結(jié)合電子商務網(wǎng)站的實際情況,對于在買賣行為中使用關鍵詞的行為賦予了較高的權(quán)值,而對于使用關鍵詞進行搜索的行為賦予了較低的權(quán)值。當然,以上公式僅用于示意性說明,根據(jù)不同的應用需求,也可以設置其他的權(quán)重值,或者選擇其他類型的行為數(shù)據(jù),本申請實施例對此并不進行限定。分別計算出用戶對每個關鍵詞的興趣值之后,這些興趣值的集合也就構(gòu)成了用戶的關鍵詞興趣度。3)用戶興趣度向量本申請實施例中,利用子類目興趣度和關鍵詞興趣度,構(gòu)成用戶的興趣度向量,例如,根據(jù)前面的例子,可得到將用戶1的興趣度向量為K2、5),(2、3、4)]、用戶2的興趣度向量為[(3、0),(3、1、0)]。當然,可以理解的是,也可以僅采用子類目興趣度或關鍵詞興趣度中的一種,直接構(gòu)成用戶的興趣度向量,本實施例對此不再詳細說明。S103,利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;通過步驟S102,可以獲得在網(wǎng)站中注冊的所有用戶的興趣度向量??梢钥闯?, 上述例子中,用戶的興趣度都是以一個5維向量的形式表示,根據(jù)多維歐氏空間中對向量夾角的定義,可以使用向量夾角公式來表示任意兩個用戶興趣度向量之間的相似性,例如用戶1的興趣度向量為a,用戶2的興趣度向量為b,那么,向量a和向量b的相似性 similarity (a, b)可表示為Similarity (a, b) = cos (a, b)=(向量a與向量b的內(nèi)積)/(向量a與向量b模的乘積)
根據(jù)上述公式可知,用戶興趣度向量相似性的取值范圍為[_1,1],當取值為1時, 兩個向量相同(向量夾角為0度),說明兩個用戶的興趣也完全相同;而取值為-1時,兩個向量相反(夾角為180度),說明兩個用戶間的興趣也完全沒有相似之處。假設用戶1為當前用戶,準備對用戶1進行信息推薦,則系統(tǒng)分別計算出用戶1與系統(tǒng)中其他用戶興趣度向量的相似性。S104,根據(jù)相似性計算結(jié)果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;得到當前用戶與系統(tǒng)中其他用戶興趣度向量的相似性之后,可以按照相似性排列的大小順序,選取相似性最高的一名或多名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;當然,也可以預先設置一個相似性閾值,這個閾值的理論取值范圍是(_1,1),考慮到相似性的實際意義,該閾值一般應該設置為大于0。如果某個用戶與當前用戶的相似性不小于該閾值,則可以對將這個用戶的標識信息加入推薦列表中,推薦給當前用戶。在實際應用中,可能推薦結(jié)果中的有些用戶已經(jīng)和當前用戶具有好友關系了,這種情況下,系統(tǒng)可以將這些已經(jīng)成為好友的用戶的標識信息濾除,按照相似性排列的大小順序,繼續(xù)選擇其他用戶進行推薦。此外,考慮到向用戶推薦的網(wǎng)友,應該是在網(wǎng)絡中活動比較多的網(wǎng)友,因此,可以利用一種或多種用戶歷史行為數(shù)據(jù)的加權(quán),構(gòu)成“用戶活躍度”,例如,定義用戶活躍度=用戶登錄網(wǎng)站的次數(shù)*0. 2+用戶登錄網(wǎng)站的時長*0. 2+用戶登錄即時通信工具的次數(shù)*0. 1+用戶登錄即時通信工具的時長*0. 2+新增好友的數(shù)目*0.3其中,上述的即時通信工具,應該是與網(wǎng)站有所關聯(lián)的即時通信工具,例如阿里巴巴網(wǎng)站所對應的貿(mào)易通(阿里旺旺),因此,用戶在即時通信工具的相關行為信息,也可以反映出用戶在網(wǎng)站的活躍程度。在上述方法中,利用到了電子商務網(wǎng)站中的5種行為數(shù)據(jù),并且對每種行為數(shù)據(jù)賦予一定的權(quán)重,然后通過計算加權(quán)值,得到用戶在一定時期內(nèi)的活躍度,當然,以上公式僅用于示意性說明,根據(jù)不同的應用需求,也可以設置其他的權(quán)重值,或者選擇其他類型的行為數(shù)據(jù),本申請實施例對此并不進行限定。得到每個用戶的活躍度之后,可以結(jié)合S103中的計算結(jié)果,在與當前用戶興趣度向量相似性較高的用戶中,進一步選出活躍度較高的用戶,將所選取的用戶的標識信息,向當前用戶進行推薦。當然,也可以預先設置一個活躍度閾值,如果某個用戶活躍度不小于該閾值,則可以將這個用戶的標識信息加入推薦列表中,推薦給當前用戶。上述方法中,根據(jù)用戶的行為數(shù)據(jù),為系統(tǒng)中的每個用戶構(gòu)建一個興趣度向量,然后根據(jù)用戶間的興趣度向量的相似性關系,判斷用戶之間是否有相似的興趣,并以此作為推薦好友的依據(jù)。結(jié)合電子商務網(wǎng)站的實際情況,在本申請的另一個實施例中,還可以根據(jù)用戶的買賣行為對用戶類型進行劃分,然后根據(jù)不同的用戶類型分別進行信息推薦,參見圖2所示,本申請實施例所提供的另一種信息推薦方法,可以包括以下步驟S101,查詢預置時間段內(nèi)的用戶行為數(shù)據(jù);
這部分內(nèi)容與前一實施例中的SlOl基本類似,具體到本實施例而言,只是所獲取的具體行為數(shù)據(jù)類型有所區(qū)別,這里不再重復說明。S105,根據(jù)所查詢的用戶歷史行為數(shù)據(jù),確定用戶的類別;買賣行為是電子商務的網(wǎng)站中的一種特有的行為,本實施根據(jù)用戶的買賣行為數(shù)據(jù),將用戶分為以下三類第一類用戶(純賣家用戶)僅發(fā)布過商品供應信息、沒有購買行為的用戶;第二類用戶(純買家用戶)沒有發(fā)布過商品供應信息、僅有購買行為的用戶;第三類用戶(買賣用戶)既發(fā)布過商品供應信息、又有購買行為的用戶。S106,根據(jù)當前用戶的類別,選取與其對應的推薦類別的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;根據(jù)S105所確定的用戶類別,采用以下原則進行信息推薦如果當前用戶為純賣家用戶,則向其推薦純買家用戶作為網(wǎng)友;如果當前用戶為純買家用戶,則向其推薦純賣家用戶作為網(wǎng)友;如果當前用戶為買賣用戶,那么,一種推薦方案是也向其推薦買賣用戶作為網(wǎng)友; 另一種方案是,既向其推薦純賣家用戶,也向其推薦純買家用戶;在推薦過程中,還可以結(jié)合用戶的興趣商品類目進行推薦,即所推薦的網(wǎng)友應該是與當前網(wǎng)友具有相同或相似興趣商品類目的,這里,可以利用步驟S102中對單一子類目興趣值的計算方法,得到每名用戶最感興趣(興趣值最高)的一個或多個類目。相應地,在推薦過程中,根據(jù)當前用戶的類別,首先選取與其對應的推薦類別,然后進一步在推薦類別中,選取當前用戶的具有相同偏好子類目的一名或多名用戶,將所選取的用戶的標識信息, 向當前用戶進行推薦。特別地,對于買賣用戶而言,其“購買興趣類目”和“售賣興趣類目” 可能并不一致,因此,當應用上述的同時推薦純賣家用戶和純買家用戶的方案時,可以根據(jù)當前用戶的買賣行為,分別計算得到其“購買興趣類目”和“售賣興趣類目”,然后針對其“購買興趣類目,,推薦相應的純賣家用戶、針對其“售賣興趣類目,,推薦相應的純買家用戶??梢岳斫獾氖牵@里同樣可以結(jié)合考慮“用戶活躍度”的因素,即在與當前用戶的具有相同偏好子類目的用戶中,進一步選出活躍度較高的用戶,將所選取的用戶的標識信息,向當前用戶進行推薦。其中,用戶活躍度的計算方式可以與S104中所述相同,這里不再重復描述。以上,提供了兩種根據(jù)用戶的行為數(shù)據(jù)進行信息推薦的具體方案,在實際應用中, 這兩種方案可以分別單獨使用,也可以共同使用,參見圖3所示,該方法中,根據(jù)用戶的興趣度相似性和用戶的類別,分別得到兩組推薦結(jié)果,在步驟S107中,對這兩組推薦結(jié)果進行綜合處理,綜合處理的方式可以是分將兩組推薦結(jié)果分別展示給用戶,并且告知每組結(jié)果的推薦依據(jù),讓用戶根據(jù)個人需求進行選擇;當然,也可以分別從兩組推薦結(jié)果中各隨機選取一部分,混合處理之后展示給用戶。本實施例對具體的綜合處理方式并不進行限定。參見圖4所示,在本申請的另一個實施例中,將根據(jù)用戶類別所選擇的用戶的集合,作為根據(jù)相似性計算結(jié)果所選擇的用戶的集合的補充數(shù)據(jù)集,向當前用戶進行信息推薦。本實施例中S201-S204與前述的S101-S104相同,而在S205中,推薦系統(tǒng)判斷根據(jù)相似性計算結(jié)果所推薦的好友數(shù)是否達到預定的推薦數(shù)量,如果沒有達到,則繼續(xù)執(zhí)行后續(xù)步驟,根據(jù)用戶類別進行好友信息推薦。例如,系統(tǒng)要求每次向當前用戶推薦20個用戶的標識信息作為選擇,但是由于相似性閾值、活躍度閾值等條件限制,導致S204結(jié)果推薦的用戶標識信息數(shù)并沒有達到20, 此時將進一步執(zhí)行S206-S207(與前述的S106-S107相同),然后,在S208中,將S207的推薦結(jié)果作為S204推薦結(jié)果的補充,作為最終的推薦結(jié)果反饋給當前用戶。在補充數(shù)據(jù)集的實際實現(xiàn)中,可以為每個類目預先計算出每個100名活躍度高的純買家用戶、100名活躍度高的純賣家用戶、以及100名活躍度高的買賣用戶作為候選。選擇100這個數(shù)字遠大于實際需要的推薦數(shù)量20,這樣可以避免為不同用戶提供的補足數(shù)據(jù)太過重復。在推薦過程中,根據(jù)當前用戶的類型和偏好子類目,找到對應的推薦類型下的候選數(shù)據(jù),隨機選取需要的數(shù)目進行補足。在隨機選取補足數(shù)據(jù)時,可以根據(jù)被推薦用戶的ID 生成一個Hash函數(shù),映射到1-100之間,然后根據(jù)這個映射的序號,選取在此序號后面需要的補足個數(shù)的數(shù)據(jù)。這樣既保證了取數(shù)的隨機性,又能夠保證對相同的用戶ID,取到的補足的推薦數(shù)據(jù)是相同的。最后,如果當前用戶是新的注冊用戶,沒有足夠的行為數(shù)據(jù)可用于識別用戶的興趣或類型,這種情況下,作為對本申請方案的補充,可以根據(jù)用戶的屬性信息(例如來源地區(qū)等),隨機從具有相同屬性信息的100個活躍度高的用戶中選取20名用戶進行信息推薦。上述實施例所提供的方案,可應用于電子商務網(wǎng)站頁面的好友信息推薦,如阿里巴巴人脈通應用;也可應用于即時通信工具的好友信息推薦,如阿里巴巴的貿(mào)易通;還可應用于移動通訊終端設備的應用程序。當然,結(jié)合不同的應用需求,也可以將本申請的方案應用與其他類型的網(wǎng)站或即時通信工具的好友信息推薦。以實現(xiàn)更為準確和有效的好友信息推薦,提高用戶的使用感受、減少用戶之間不必要的信息交互,減輕系統(tǒng)服務器的負擔, 節(jié)省網(wǎng)絡帶寬資源占用。相應于上面的方法實施例,本申請還提供一種信息推薦系統(tǒng),參見圖5所示,該系統(tǒng)可以包括查詢單元510,用于查詢預置時間段內(nèi)的用戶行為數(shù)據(jù),用戶興趣度獲得單元520,用于根據(jù)所述查詢單元510的查詢結(jié)果,獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,并利用所獲得的子類目興趣度和/或關鍵詞興趣度,構(gòu)成用戶的興趣度向量;用戶相似性計算單元530,用于利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;第一推薦單元M0,用于根據(jù)相似性計算結(jié)果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述子類目興趣度,用于表示用戶對網(wǎng)站各個子類目訪問興趣度的相對關系;所述關鍵詞興趣度,用于表示用戶對各種關鍵詞使用興趣的相對關系。其中,所述用戶興趣度獲得單元520,可以利用用戶對多個網(wǎng)站子類目的興趣值, 構(gòu)成用戶的子類目興趣度向量。而用戶對單個子類目的興趣值,可以利用以下一種或多種用戶歷史行為數(shù)據(jù)的加權(quán)來獲得在該子類目下發(fā)布的商品數(shù)量、對該子類目下頁面的瀏覽次數(shù)、在該子類目下的回復次數(shù)、在該子類目下的訂單發(fā)放次數(shù)、在該子類目下的求購信息發(fā)布次數(shù)。
此外,所述用戶興趣度獲得單元520,可以利用用戶對多個關鍵詞的興趣值,構(gòu)成用戶的關鍵詞興趣度向量。而用戶對單個關鍵詞的興趣值,可以利用以下一種或多種用戶歷史行為數(shù)據(jù)的加權(quán)來獲得所發(fā)布的商品信息中包含該關鍵詞的次數(shù)、所發(fā)布的求購信息中包含該關鍵詞的次數(shù)、使用該關鍵詞進行搜索的次數(shù)。參見圖6所示,本申請實施例所提供的信息推薦系統(tǒng),還可以包括用戶類別確定單元550,用于根據(jù)所述查詢單元510的查詢結(jié)果,確定用戶的類別;第二推薦單元560,用于根據(jù)當前用戶的類別,選取與其對應的推薦類別的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,用戶類別包括第一類用戶僅發(fā)布過商品供應信息、沒有購買行為的用戶;第二類用戶沒有發(fā)布過商品供應信息、僅有購買行為的用戶;第三類用戶既發(fā)布過商品供應信息、又有購買行為的用戶;所述第一類用戶對應的推薦類別為第二類用戶;所述第二類用戶對應的推薦類別為第一類用戶;所述第三類用戶對應的推薦類別為第三類用戶、或第一類用戶與第二類用戶的組合。具體而言,所述第二推薦單元560,可以根據(jù)當前用戶的類別,選取與其對應的推薦類別中的、且與當前用戶的具有相同偏好子類目的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述偏好子類目為用戶對該子類目的興趣值大于預置門限值的子類目。更為具體地,所述第二推薦單元560,可以根據(jù)當前用戶的類別,選取與其對應的推薦類別中的、且與當前用戶的具有相同偏好子類目的、且用戶活躍度最高至少一名用戶, 將所選取的用戶的標識信息,向當前用戶進行推薦;其中,用戶的活躍度,可以利用以下一種或多種用戶歷史行為數(shù)據(jù)的加權(quán)來獲得登錄網(wǎng)站的次數(shù)、時長、登錄與所述網(wǎng)站關聯(lián)的即時通信工具的次數(shù)、時長、新增的好友數(shù)目。參見圖7所示,本申請實施例所提供的信息推薦系統(tǒng),還可以進一步包括第三推薦單元570,用于對第一推薦單元540和第二推薦單元560的處理結(jié)果進行綜合處理,然后向當前用戶進行推薦,例如將所述第二推薦單元560所選擇的用戶的集合,作為所述第一推薦單元540所選擇的用戶的集合的補充數(shù)據(jù)集,向所述當前用戶進行信息推薦。為了描述的方便,描述以上裝置時以功能分為各種單元分別描述。當然,在實施本申請時可以把各單元的功能在同一個或多個軟件和/或硬件中實現(xiàn)。通過以上的實施方式的描述可知,本領域的技術人員可以清楚地了解到本申請可借助軟件加必需的通用硬件平臺的方式來實現(xiàn)?;谶@樣的理解,本申請的技術方案本質(zhì)上或者說對現(xiàn)有技術做出貢獻的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計算機軟件產(chǎn)品可以存儲在存儲介質(zhì)中,如ROM/RAM、磁碟、光盤等,包括若干指令用以使得一臺計算機設備 (可以是個人計算機,服務器,或者網(wǎng)絡設備等)執(zhí)行本申請各個實施例或者實施例的某些部分所述的方法。本說明書中的各個實施例均采用遞進的方式描述,各個實施例之間相同相似的部分互相參見即可,每個實施例重點說明的都是與其他實施例的不同之處。尤其,對于系統(tǒng)實施例而言,由于其基本相似于方法實施例,所以描述得比較簡單,相關之處參見方法實施例的部分說明即可。以上所描述的系統(tǒng)實施例僅僅是示意性的,其中所述作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個地方,或者也可以分布到多個網(wǎng)絡單元上??梢愿鶕?jù)實際的需要選擇其中的部分或者全部模塊來實現(xiàn)本實施例方案的目的。本領域普通技術人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實施。本申請可用于眾多通用或?qū)S玫挠嬎阆到y(tǒng)環(huán)境或配置中。例如個人計算機、服務器計算機、手持設備或便攜式設備、平板型設備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂盒、可編程的消費電子設備、網(wǎng)絡PC、小型計算機、大型計算機、包括以上任何系統(tǒng)或設備的分布式計算環(huán)境等等。本申請可以在由計算機執(zhí)行的計算機可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計算環(huán)境中實踐本申請,在這些分布式計算環(huán)境中,由通過通信網(wǎng)絡而被連接的遠程處理設備來執(zhí)行任務。在分布式計算環(huán)境中,程序模塊可以位于包括存儲設備在內(nèi)的本地和遠程計算機存儲介質(zhì)中。以上所述僅是本申請的具體實施方式
,應當指出,對于本技術領域的普通技術人員來說,在不脫離本申請原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應視為本申請的保護范圍。
權(quán)利要求
1.一種信息推薦方法,其特征在于,包括 查詢預置時間段內(nèi)的用戶行為數(shù)據(jù);根據(jù)所查詢的用戶行為數(shù)據(jù),獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度, 并利用所獲得的子類目興趣度和/或關鍵詞興趣度,構(gòu)成用戶的興趣度向量;利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性; 根據(jù)相似性計算結(jié)果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述子類目興趣度,用于表示用戶對網(wǎng)站子類目訪問興趣度的相對關系;所述關鍵詞興趣度,用于表示用戶對關鍵詞使用興趣的相對關系。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲得用戶的子類目興趣度,包括利用用戶對多個網(wǎng)站子類目的興趣值,構(gòu)成用戶的子類目興趣度向量;所述獲得用戶的關鍵詞興趣度,包括利用用戶對多個關鍵詞的興趣值,構(gòu)成用戶的關鍵詞興趣度向量。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,利用以下一種或多種用戶歷史行為數(shù)據(jù)的加權(quán),獲得用戶對單個子類目的興趣值 在該子類目下發(fā)布的商品數(shù)量、對該子類目下頁面的瀏覽次數(shù)、在該子類目下的回復次數(shù)、在該子類目下的訂單發(fā)放次數(shù)、在該子類目下的求購信息發(fā)布次數(shù)。
4.根據(jù)權(quán)利要求2所述的方法,其特征在于,利用以下一種或多種用戶歷史行為數(shù)據(jù)的加權(quán),獲得用戶對單個關鍵詞的興趣值 所發(fā)布的商品信息中包含該關鍵詞的次數(shù)、所發(fā)布的求購信息中包含該關鍵詞的次數(shù)、使用該關鍵詞進行搜索的次數(shù)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦,包括在與當前用戶興趣度向量相似性最高的至少一名用戶中,進一步選取用戶活躍度最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,利用以下一種或多種用戶歷史行為數(shù)據(jù)的加權(quán),獲得用戶的活躍度 登錄網(wǎng)站的次數(shù)、時長、登錄與所述網(wǎng)站關聯(lián)的即時通信工具的次數(shù)、時長、新增的好友數(shù)目。
6.根據(jù)權(quán)利要求1-5任一項所述的方法,其特征在于,所述方法還包括 根據(jù)所查詢的用戶歷史行為數(shù)據(jù),確定用戶的類別;根據(jù)當前用戶的類別,選取與其對應的推薦類別的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦; 其中,用戶類別包括第一類用戶僅發(fā)布過商品供應信息、沒有購買行為的用戶; 第二類用戶沒有發(fā)布過商品供應信息、僅有購買行為的用戶; 第三類用戶既發(fā)布過商品供應信息、又有購買行為的用戶;所述第一類用戶對應的推薦類別為第二類用戶;所述第二類用戶對應的推薦類別為第一類用戶;所述第三類用戶對應的推薦類別為第三類用戶、或第一類用戶與第二類用戶的組合。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)當前用戶的類別,選取與其對應的推薦類別的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦,包括根據(jù)當前用戶的類別,選取與其對應的推薦類別中的、且與當前用戶的具有相同偏好子類目的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述偏好子類目為用戶對該子類目的興趣值大于預置門限值的子類目。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述選取與當前用戶的具有相同偏好子類目的至少一名用戶,包括選取與當前用戶的具有相同偏好子類目的、且用戶活躍度最高的至少一名用戶; 其中,利用以下一種或多種用戶歷史行為數(shù)據(jù)的加權(quán),獲得用戶的活躍度 登錄網(wǎng)站的次數(shù)、時長、登錄與所述網(wǎng)站關聯(lián)的即時通信工具的次數(shù)、時長、新增的好友數(shù)目。
9.根據(jù)權(quán)利要求6所述的方法,其特征在于,將根據(jù)用戶類別所選擇的用戶的集合,作為根據(jù)相似性計算結(jié)果所選擇的用戶的集合的補充數(shù)據(jù)集,向所述當前用戶進行信息推薦。
10.一種信息推薦系統(tǒng),其特征在于,包括查詢單元,用于查詢預置時間段內(nèi)的用戶行為數(shù)據(jù);用戶興趣度獲得單元,用于根據(jù)所述查詢單元的查詢結(jié)果,獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,并利用所獲得的子類目興趣度和/或關鍵詞興趣度,構(gòu)成用戶的興趣度向量;用戶相似性計算單元,用于利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;第一推薦單元,用于根據(jù)相似性計算結(jié)果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦;其中,所述子類目興趣度,用于表示用戶對網(wǎng)站子類目訪問興趣度的相對關系;所述關鍵詞興趣度,用于表示用戶對關鍵詞使用興趣的相對關系。
11.根據(jù)權(quán)利要求10所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括用戶類別確定單元,用于根據(jù)所述查詢單元的查詢結(jié)果,確定用戶的類別; 第二推薦單元,用于根據(jù)當前用戶的類別,選取與其對應的推薦類別的至少一名用戶, 將所選取的用戶的標識信息,向當前用戶進行推薦; 其中,用戶類別包括第一類用戶僅發(fā)布過商品供應信息、沒有購買行為的用戶; 第二類用戶沒有發(fā)布過商品供應信息、僅有購買行為的用戶; 第三類用戶既發(fā)布過商品供應信息、又有購買行為的用戶;所述第一類用戶對應的推薦類別為第二類用戶;所述第二類用戶對應的推薦類別為第一類用戶;所述第三類用戶對應的推薦類別為第三類用戶、或第一類用戶與第二類用戶的組合。
12.根據(jù)權(quán)利要求11所述的系統(tǒng),其特征在于,該系統(tǒng)還包括第三推薦單元,用于將所述第二推薦單元所選擇的用戶的集合,作為所述第一推薦單元所選擇的用戶的集合的補充數(shù)據(jù)集,向所述當前用戶進行信息推薦。
全文摘要
本申請公開了一種信息推薦方法及系統(tǒng)。一種信息推薦方法包括查詢預置時間段內(nèi)的用戶行為數(shù)據(jù);根據(jù)所查詢的用戶行為數(shù)據(jù),獲得用戶的子類目興趣度和/或用戶的關鍵詞興趣度,并利用所獲得的子類目興趣度和/或關鍵詞興趣度,構(gòu)成用戶的興趣度向量;利用向量夾角公式,計算當前用戶興趣度向量與其他用戶興趣度向量的相似性;根據(jù)相似性計算結(jié)果,選取與當前用戶興趣度向量相似性最高的至少一名用戶,將所選取的用戶的標識信息,向當前用戶進行推薦信息。本申請方案可以實現(xiàn)更為準確和有效的信息推薦,從而提高用戶的使用感受、減少用戶之間不必要的信息交互,減輕系統(tǒng)服務器的負擔,節(jié)省網(wǎng)絡帶寬資源占用。
文檔編號G06F17/30GK102411596SQ20101029845
公開日2012年4月11日 申請日期2010年9月21日 優(yōu)先權(quán)日2010年9月21日
發(fā)明者楊志雄, 蘇寧軍, 顧海杰 申請人:阿里巴巴集團控股有限公司