本發(fā)明涉及互聯(lián)網(wǎng)應(yīng)用技術(shù)領(lǐng)域,尤其涉及一種用戶興趣差異性挖掘方法及系統(tǒng)。
背景技術(shù):
隨著Twitter、微博、QQ等網(wǎng)絡(luò)社區(qū)的興起,開放平臺已經(jīng)成為互聯(lián)網(wǎng)應(yīng)用的核心組成部分。開放平臺擁有海量的用戶和豐富的用戶信息,應(yīng)用開發(fā)者或第三方網(wǎng)站可以在開放協(xié)議許可的條件下,通過平臺的應(yīng)用程序接口(Application Program Interface,簡稱API)從開放平臺獲取這些用戶信息,分析用戶興趣、好友關(guān)系等價值信息,實(shí)現(xiàn)開放平臺與第三方之間的信息共享。而如何進(jìn)行用戶的興趣差異性分析,亟需解決。
技術(shù)實(shí)現(xiàn)要素:
鑒于目前互聯(lián)網(wǎng)應(yīng)用技術(shù)領(lǐng)域存在的上述不足,本發(fā)明提供一種用戶興趣差異性挖掘方法及系統(tǒng),能夠?qū)τ脩舻呐d趣進(jìn)行差異性挖掘。
為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:
一種用戶興趣差異性挖掘方法,所述用戶興趣差異性挖掘方法包括以下步驟:
采集用戶數(shù)據(jù)形成原始用戶數(shù)據(jù)庫;
根據(jù)原始用戶數(shù)據(jù)庫進(jìn)行用戶興趣數(shù)據(jù)采集;
將采集到的興趣數(shù)據(jù)進(jìn)行提取和轉(zhuǎn)化以形成用戶興趣數(shù)據(jù)中心;
對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘。
依照本發(fā)明的一個方面,所述采集用戶數(shù)據(jù)形成原始用戶數(shù)據(jù)庫的具體實(shí)施方式可為:從用戶的發(fā)文、活動和社團(tuán)之類的行為操作中采集數(shù)據(jù),以形成原始的用戶數(shù)據(jù)庫。
依照本發(fā)明的一個方面,所述根據(jù)原始用戶數(shù)據(jù)庫進(jìn)行用戶興趣數(shù)據(jù)采集的具體實(shí)施方式可為:采集原始用戶數(shù)據(jù)庫中跟興趣有關(guān)的行為操作信息數(shù)據(jù)。
依照本發(fā)明的一個方面,所述將采集到的興趣數(shù)據(jù)進(jìn)行提取和轉(zhuǎn)化以形成用戶興趣數(shù)據(jù)中心的具體實(shí)施方式可為:根據(jù)采集到的用戶 興趣數(shù)據(jù)中的行為操作信息進(jìn)行興趣元素提取和轉(zhuǎn)化,并將興趣數(shù)據(jù)集中起來形成用戶興趣數(shù)據(jù)中心。
依照本發(fā)明的一個方面,所述根據(jù)行為操作信息進(jìn)行興趣元素提取和轉(zhuǎn)化的具體實(shí)施方式可為:根據(jù)用戶行為操作對象的卡片屬性以及標(biāo)簽屬性進(jìn)行用戶興趣元素的提取和轉(zhuǎn)化。
依照本發(fā)明的一個方面,所述根據(jù)行為操作信息進(jìn)行興趣元素提取和轉(zhuǎn)化可包括:對用戶行為操作信息進(jìn)行行為邏輯判斷。
依照本發(fā)明的一個方面,所述對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘的具體實(shí)施方式可為:通過興趣差異算法對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘,以發(fā)現(xiàn)一些不同興趣之間的潛在的可能的聯(lián)系。
依照本發(fā)明的一個方面,所述對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘具體可包括:通過興趣卡、興趣標(biāo)簽和切詞算法對興趣中心的興趣數(shù)據(jù)進(jìn)行差異性挖掘。
一種用戶興趣差異性挖掘系統(tǒng),所述用戶興趣差異性挖掘系統(tǒng)包括:
用戶數(shù)據(jù)采集模塊,用于采集用戶數(shù)據(jù)形成原始用戶數(shù)據(jù)庫;
興趣數(shù)據(jù)采集模塊,用于根據(jù)原始用戶數(shù)據(jù)庫進(jìn)行用戶興趣數(shù)據(jù)采集;
興趣提取轉(zhuǎn)化模塊,用于將采集到的興趣數(shù)據(jù)進(jìn)行提取和轉(zhuǎn)化以形成用戶興趣數(shù)據(jù)中心;
差異興趣挖掘模塊,用于對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘。
依照本發(fā)明的一個方面,所述差異興趣挖掘模塊的工作方式可為:通過興趣差異算法對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘,以發(fā)現(xiàn)一些不同興趣之間的潛在的可能的聯(lián)系。
本發(fā)明實(shí)施的優(yōu)點(diǎn):本發(fā)明所述的用戶興趣差異性挖掘方法,通過采集用戶數(shù)據(jù)形成原始用戶數(shù)據(jù)庫;根據(jù)原始用戶數(shù)據(jù)庫進(jìn)行用戶興趣數(shù)據(jù)采集;將采集到的興趣數(shù)據(jù)進(jìn)行提取和轉(zhuǎn)化以形成用戶興趣數(shù)據(jù)中心;對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘,能根據(jù)用戶的興趣特點(diǎn)可以進(jìn)行差異化興趣數(shù)據(jù)挖掘開發(fā),基于單一 興趣出發(fā),分析數(shù)據(jù)源,從中發(fā)現(xiàn)一些不同興趣之間的潛在的可能的關(guān)聯(lián)或者聯(lián)系,方便對興趣點(diǎn)的差異性進(jìn)行不同的分類,從而進(jìn)行不同或相似的推薦。
附圖說明
為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明所述的一種用戶興趣差異性挖掘方法示意圖;
圖2為本發(fā)明所述的一種用戶興趣差異性挖掘系統(tǒng)結(jié)構(gòu)示意圖。
具體實(shí)施方式
下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
如圖1所示,一種用戶興趣差異性挖掘方法,所述用戶興趣差異性挖掘方法包括以下步驟:
步驟S1:采集用戶數(shù)據(jù)形成原始用戶數(shù)據(jù)庫;
所述步驟S1采集用戶數(shù)據(jù)形成原始用戶數(shù)據(jù)庫的具體實(shí)施方式可為:從用戶的發(fā)文、活動和社團(tuán)之類的行為操作中采集數(shù)據(jù),以形成原始的用戶數(shù)據(jù)庫。例如,從用戶的發(fā)文中,了解到用戶的所有發(fā)文信息,有關(guān)新聞類的、體育類的和軍事類的等等。
步驟S2:根據(jù)原始用戶數(shù)據(jù)庫進(jìn)行用戶興趣數(shù)據(jù)采集;
所述步驟S2根據(jù)原始用戶數(shù)據(jù)庫進(jìn)行用戶興趣數(shù)據(jù)采集的具體實(shí)施方式可為:采集原始用戶數(shù)據(jù)庫中跟興趣有關(guān)的行為操作信息數(shù)據(jù),例如,從原始數(shù)據(jù)庫中獲取的用戶的所有發(fā)文信息,根據(jù)發(fā)文的多寡,關(guān)注程度等來采集用戶的發(fā)文興趣數(shù)據(jù),如新聞類等。
步驟S3:將采集到的興趣數(shù)據(jù)進(jìn)行提取和轉(zhuǎn)化以形成用戶興趣數(shù)據(jù)中心;
所述步驟S3將采集到的興趣數(shù)據(jù)進(jìn)行提取和轉(zhuǎn)化以形成用戶興趣 數(shù)據(jù)中心的具體實(shí)施方式可為:根據(jù)采集到的用戶興趣數(shù)據(jù)中的行為操作信息進(jìn)行興趣元素提取和轉(zhuǎn)化,并將興趣數(shù)據(jù)集中起來形成用戶興趣數(shù)據(jù)中心。
在實(shí)際應(yīng)用中,所述對采集到的興趣數(shù)據(jù)進(jìn)行提取和轉(zhuǎn)化具體可為:根據(jù)用戶行為操作對象的卡片屬性以及標(biāo)簽屬性進(jìn)行用戶興趣元素的提取和轉(zhuǎn)化。
在實(shí)際應(yīng)用中,所述根據(jù)行為操作信息進(jìn)行興趣元素提取和轉(zhuǎn)化可包括:對用戶行為操作信息進(jìn)行行為邏輯判斷。
步驟S4:對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘。
所述步驟S4對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘具體實(shí)施方式可為:通過興趣差異算法對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘,以發(fā)現(xiàn)一些不同興趣之間的潛在的可能的聯(lián)系。
在實(shí)際應(yīng)用中,所述對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘具體可包括:通過興趣卡、興趣標(biāo)簽和切詞算法對興趣中心的興趣數(shù)據(jù)進(jìn)行差異性挖掘。
本實(shí)施例所述的用戶興趣差異性挖掘方法,通過采集用戶數(shù)據(jù)形成原始用戶數(shù)據(jù)庫;根據(jù)原始用戶數(shù)據(jù)庫進(jìn)行用戶興趣數(shù)據(jù)采集;將采集到的興趣數(shù)據(jù)進(jìn)行提取和轉(zhuǎn)化以形成用戶興趣數(shù)據(jù)中心;對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘,能根據(jù)用戶的興趣特點(diǎn)可以進(jìn)行差異化興趣數(shù)據(jù)挖掘開發(fā),基于單一興趣出發(fā),分析數(shù)據(jù)源,從中發(fā)現(xiàn)一些不同興趣之間的潛在的可能的關(guān)聯(lián)或者聯(lián)系,方便對興趣點(diǎn)的差異性進(jìn)行不同的分類,從而進(jìn)行不同或相似的推薦。
一種用戶興趣差異性挖掘系統(tǒng)實(shí)施例
如圖2所示,一種用戶興趣差異性挖掘系統(tǒng),所述用戶興趣差異性挖掘系統(tǒng)包括:
用戶數(shù)據(jù)采集模塊1,用于采集用戶數(shù)據(jù)形成原始用戶數(shù)據(jù)庫;
興趣數(shù)據(jù)采集模塊2,用于根據(jù)原始用戶數(shù)據(jù)庫進(jìn)行用戶興趣數(shù)據(jù)采集;
興趣提取轉(zhuǎn)化模塊3,用于將采集到的興趣數(shù)據(jù)進(jìn)行提取和轉(zhuǎn)化以形成用戶興趣數(shù)據(jù)中心;
差異興趣挖掘模塊4,用于對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘。
在實(shí)際應(yīng)用中,所述差異興趣挖掘模塊的工作方式可為:通過興趣差異算法對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘,以發(fā)現(xiàn)一些不同興趣之間的潛在的可能的聯(lián)系。
本發(fā)明實(shí)施的優(yōu)點(diǎn):本發(fā)明所述的用戶興趣差異性挖掘方法,通過采集用戶數(shù)據(jù)形成原始用戶數(shù)據(jù)庫;根據(jù)原始用戶數(shù)據(jù)庫進(jìn)行用戶興趣數(shù)據(jù)采集;將采集到的興趣數(shù)據(jù)進(jìn)行提取和轉(zhuǎn)化以形成用戶興趣數(shù)據(jù)中心;對用戶興趣數(shù)據(jù)中心的興趣數(shù)據(jù)進(jìn)行差異興趣數(shù)據(jù)挖掘,能根據(jù)用戶的興趣特點(diǎn)可以進(jìn)行差異化興趣數(shù)據(jù)挖掘開發(fā),基于單一興趣出發(fā),分析數(shù)據(jù)源,從中發(fā)現(xiàn)一些不同興趣之間的潛在的可能的關(guān)聯(lián)或者聯(lián)系,方便對興趣點(diǎn)的差異性進(jìn)行不同的分類,從而進(jìn)行不同或相似的推薦。
以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本領(lǐng)域技術(shù)的技術(shù)人員在本發(fā)明公開的技術(shù)范圍內(nèi),可輕易想到的變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。