欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

使用非隨機(jī)樣本用戶進(jìn)行網(wǎng)絡(luò)行為信息的估計(jì)方法和裝置的制作方法

文檔序號(hào):6606894閱讀:184來(lái)源:國(guó)知局
專利名稱:使用非隨機(jī)樣本用戶進(jìn)行網(wǎng)絡(luò)行為信息的估計(jì)方法和裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種樣本估計(jì)技術(shù),具體地說(shuō),是涉及一種使用非隨機(jī)樣本用戶進(jìn)行網(wǎng)絡(luò)行為信息的估計(jì)方法和裝置。
背景技術(shù)
隨著互聯(lián)網(wǎng)的飛速發(fā)展,網(wǎng)絡(luò)在人們的日常生活中發(fā)揮著越來(lái)越重要的作用,如何智能并客觀有效地預(yù)測(cè)各網(wǎng)民在各互聯(lián)網(wǎng)資源的總體信息成為互聯(lián)網(wǎng)信息、商品以及服務(wù)供應(yīng)商關(guān)注的一個(gè)重要問(wèn)題。其中,信息、商品以及服務(wù)供應(yīng)商包括但不限于互聯(lián)網(wǎng)媒體、商品擁有者、服務(wù)擁有者、廣告擁有者或者網(wǎng)絡(luò)電視(IPTV)運(yùn)營(yíng)商等等。當(dāng)前,信息、商品以及服務(wù)供應(yīng)商自己或者通過(guò)網(wǎng)絡(luò)監(jiān)測(cè)方可以獲得一部分互聯(lián)網(wǎng)用戶的網(wǎng)絡(luò)行為信息的數(shù)據(jù)。其中,互聯(lián)網(wǎng)用戶的網(wǎng)絡(luò)行為信息包括但不限于用戶瀏覽網(wǎng)頁(yè)、用戶點(diǎn)擊廣告、用戶網(wǎng)上購(gòu)買活動(dòng)、用戶瀏覽商品、用戶點(diǎn)擊某網(wǎng)站鏈接的次數(shù)、用戶的上網(wǎng)時(shí)間或者IPTV用戶點(diǎn)播的頻道等等;樣本用戶是指擁有具體的詳細(xì)信息(如性別、年齡,上網(wǎng)活動(dòng)等),并且可以獲得其網(wǎng)絡(luò)行為信息的用戶。如果能夠使用這部分真實(shí)可靠的樣本用戶的網(wǎng)絡(luò)行為信息來(lái)準(zhǔn)確預(yù)測(cè)總體網(wǎng)民在各個(gè)目標(biāo)互聯(lián)網(wǎng)資源的總體信息,將預(yù)測(cè)結(jié)果用于對(duì)各互聯(lián)網(wǎng)資源的評(píng)估,就可能得到較客觀的評(píng)價(jià)結(jié)果。其中,互聯(lián)網(wǎng)資源包括但不限于網(wǎng)站、媒體、網(wǎng)頁(yè)或廣告等。但是,本發(fā)明的發(fā)明人發(fā)現(xiàn),現(xiàn)有技術(shù)中至少還存在下述問(wèn)題通常情況下,可以跟蹤網(wǎng)絡(luò)行為的互聯(lián)網(wǎng)用戶數(shù)量比較有限,當(dāng)以這部分用戶作為樣本估計(jì)總體網(wǎng)民的總體信息時(shí),由于這些樣本用戶不是隨機(jī)選取的,使得根據(jù)這些非隨機(jī)樣本用戶對(duì)總體網(wǎng)民網(wǎng)絡(luò)行為信息的估計(jì)結(jié)果與實(shí)際結(jié)果的誤差可能較大。

發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是需要提供一種使用非隨機(jī)樣本用戶進(jìn)行網(wǎng)絡(luò)行為信息的估計(jì)技術(shù),以解決現(xiàn)有技術(shù)中根據(jù)非隨機(jī)樣本用戶對(duì)總體網(wǎng)民的網(wǎng)絡(luò)行為信息的估計(jì)結(jié)果與實(shí)際結(jié)果的誤差可能較大的技術(shù)缺陷。為了解決上述技術(shù)問(wèn)題,本發(fā)明提供了一種使用非隨機(jī)樣本用戶進(jìn)行網(wǎng)絡(luò)行為信息的估計(jì)方法,包括獲取所述樣本用戶的網(wǎng)絡(luò)行為信息;對(duì)所述樣本用戶進(jìn)行劃分,獲得一個(gè)或一個(gè)以上的代表用戶;統(tǒng)計(jì)各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息;對(duì)各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行學(xué)習(xí),為各代表用戶分別賦予權(quán)值;獲得所述樣本用戶在目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果;根據(jù)各代表用戶所被賦予的權(quán)值以及所述統(tǒng)計(jì)結(jié)果,獲得總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息的估計(jì)結(jié)果。
4
優(yōu)選地,根據(jù)所述權(quán)值以及統(tǒng)計(jì)結(jié)果獲得所述估計(jì)結(jié)果的步驟,包括使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在所述目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果的加權(quán)和,將所述加權(quán)和作為所述估計(jì)結(jié)果。優(yōu)選地,獲取所述樣本用戶的網(wǎng)絡(luò)行為信息的同時(shí),進(jìn)一步獲取所述樣本用戶的屬性信息;根據(jù)各代表用戶所被賦予的權(quán)值,獲得所述總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果。優(yōu)選地,根據(jù)所述權(quán)值獲得所述總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果的步驟,包括使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的加權(quán)和,將所述加權(quán)和作為所述總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果。優(yōu)選地,對(duì)各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行學(xué)習(xí)的步驟,包括將所述訓(xùn)練用互聯(lián)網(wǎng)資源的已知總體信息以及各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源的相關(guān)信息作為訓(xùn)練集,利用所述訓(xùn)練集對(duì)各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行所述學(xué)習(xí)。為了解決上述技術(shù)問(wèn)題,本發(fā)明還提供了一種使用非隨機(jī)樣本用戶進(jìn)行網(wǎng)絡(luò)行為信息的估計(jì)裝置,包括第一獲取模塊、劃分模塊、統(tǒng)計(jì)模塊、賦值模塊、第二獲取模塊以及估計(jì)模塊,其中所述第一獲取模塊,用于獲取所述樣本用戶的網(wǎng)絡(luò)行為信息;所述劃分模塊,用于對(duì)所述樣本用戶進(jìn)行劃分,獲得一個(gè)或一個(gè)以上的代表用戶;所述統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息;所述賦值模塊,用于對(duì)各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行學(xué)習(xí),為各代表用戶分別賦予權(quán)值;所述第二獲取模塊,用于獲得所述樣本用戶在目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果;所述估計(jì)模塊,用于根據(jù)各代表用戶所被賦予的權(quán)值,以及所述樣本用戶在所述目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果,獲得總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息的估計(jì)結(jié)果。優(yōu)選地,所述估計(jì)模塊用于使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在所述目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果的加權(quán)和,將所述加權(quán)和作為所述估計(jì)結(jié)^ ο優(yōu)選地,所述第一獲取模塊用于獲取所述樣本用戶的網(wǎng)絡(luò)行為信息的同時(shí),進(jìn)一步獲取所述樣本用戶的屬性信息;所述估計(jì)模塊用于根據(jù)各代表用戶所被賦予的權(quán)值,獲得所述樣總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果。優(yōu)選地,所述估計(jì)模塊用于使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的加權(quán)和,將所述加權(quán)和作為所述總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果。優(yōu)選地,所述賦值模塊用于將所述訓(xùn)練用互聯(lián)網(wǎng)資源的已知總體信息以及各代表
5用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源的相關(guān)信息作為訓(xùn)練集,利用所述訓(xùn)練集對(duì)各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行所述學(xué)習(xí)。與現(xiàn)有技術(shù)相比,本發(fā)明的技術(shù)方案利用訓(xùn)練集對(duì)非隨機(jī)樣本用戶進(jìn)行訓(xùn)練,為樣本用戶賦予權(quán)值,通過(guò)對(duì)非隨機(jī)樣本用戶的加權(quán)估計(jì),實(shí)現(xiàn)了對(duì)互聯(lián)網(wǎng)資源的總體信息的客觀預(yù)測(cè)。本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說(shuō)明書(shū)中闡述,并且,部分地從說(shuō)明書(shū)中變得顯而易見(jiàn),或者通過(guò)實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過(guò)在說(shuō)明書(shū)、權(quán)利要求書(shū)以及附圖中所特別指出的結(jié)構(gòu)來(lái)實(shí)現(xiàn)和獲得。


附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,并且構(gòu)成說(shuō)明書(shū)的一部分,與本發(fā)明的實(shí)施例一起用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的限制。在附圖中圖1為本發(fā)明實(shí)施例所提網(wǎng)絡(luò)行為信息的估計(jì)方法的流程示意圖;圖2為本發(fā)明圖1所示實(shí)施例中用戶分類示意圖;圖3為本發(fā)明圖1所示實(shí)施例的一應(yīng)用實(shí)施的流程示意圖;圖4為本發(fā)明圖1所示實(shí)施例的另一應(yīng)用實(shí)施的示意圖;圖5為本發(fā)明實(shí)施例所提網(wǎng)絡(luò)行為信息的估計(jì)裝置的組成示意圖。
具體實(shí)施例方式以下將結(jié)合附圖及實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明的實(shí)施方式,借此對(duì)本發(fā)明如何應(yīng)用技術(shù)手段來(lái)解決技術(shù)問(wèn)題,并達(dá)成技術(shù)效果的實(shí)現(xiàn)過(guò)程能充分理解并據(jù)以實(shí)施。首先,如果不沖突,本發(fā)明實(shí)施例以及實(shí)施例中的各個(gè)特征可以相互結(jié)合,均在本發(fā)明的保護(hù)范圍之內(nèi)。另外,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。本發(fā)明的核心思想是,在根據(jù)非隨機(jī)樣本用戶對(duì)總體網(wǎng)民的網(wǎng)絡(luò)行為信息進(jìn)行估計(jì)時(shí),通過(guò)機(jī)器學(xué)習(xí)方法對(duì)非隨機(jī)樣本用戶(通常代表用戶)賦予權(quán)值,使得根據(jù)非隨機(jī)樣本用戶對(duì)總體網(wǎng)民進(jìn)行預(yù)測(cè)所得的估計(jì)結(jié)果能夠接近隨機(jī)預(yù)測(cè)結(jié)果。權(quán)值能夠表現(xiàn)樣本用戶在全部網(wǎng)民中的代表性,權(quán)值越大,表示這類用戶在總體網(wǎng)民中所占的比重越大,具體到一個(gè)互聯(lián)網(wǎng)資源上,代表用戶的加權(quán)和越大,表示該資源被越多的人關(guān)注。需要說(shuō)明的是, 在何種范圍內(nèi)選擇非隨機(jī)樣本用戶,相應(yīng)的對(duì)統(tǒng)計(jì)結(jié)果就應(yīng)該是適用于與該范圍相應(yīng)的總體網(wǎng)民。比如,針對(duì)某一國(guó)選擇的樣本用戶,據(jù)其所進(jìn)行的估計(jì)結(jié)果應(yīng)該適用于該國(guó)范圍內(nèi)的總體網(wǎng)民;如果針對(duì)全世界互聯(lián)網(wǎng)用戶選擇樣本用戶,則相應(yīng)的估計(jì)結(jié)果就應(yīng)該適用于全世界范圍內(nèi)的總體網(wǎng)民。再比如,對(duì)某網(wǎng)站的估計(jì)結(jié)果應(yīng)該是樣本用戶所對(duì)應(yīng)的事先劃定的網(wǎng)民范圍,比如全國(guó)網(wǎng)民、北京市網(wǎng)民等等;如果在全國(guó)網(wǎng)民中選擇樣本用戶,則對(duì)該網(wǎng)站的估計(jì)結(jié)果應(yīng)該是全國(guó)的總體網(wǎng)民中瀏覽過(guò)該網(wǎng)站的網(wǎng)民個(gè)數(shù)或者人群屬性的情況; 如果在北京市網(wǎng)民中選擇樣本用戶,則對(duì)該網(wǎng)站的估計(jì)結(jié)果應(yīng)該是北京市的總體網(wǎng)民中瀏覽過(guò)該網(wǎng)站的網(wǎng)民個(gè)數(shù)或者人群屬性的情況。實(shí)施例一、使用非隨機(jī)樣本用戶進(jìn)行網(wǎng)絡(luò)行為信息的估計(jì)方法
6
如圖1所示,本實(shí)施例主要包括如下步驟步驟S110,獲取某一范圍內(nèi)的樣本用戶的已知信息;其中該已知信息包括樣本用戶對(duì)互聯(lián)網(wǎng)的網(wǎng)絡(luò)行為信息以及樣本用戶的性別、年齡等用戶屬性信息等(當(dāng)然,也可以只包括樣本用戶的網(wǎng)絡(luò)行為信息)(注根據(jù)預(yù)測(cè)問(wèn)題需要獲得樣本用戶的某些特定屬性信息,也可能只需要樣本用戶的網(wǎng)絡(luò)行為信息,例如如果只進(jìn)行網(wǎng)站流量的預(yù)測(cè),則只需要通過(guò)獲得樣本用戶在這個(gè)網(wǎng)站的流量(即只獲得樣本用戶的網(wǎng)絡(luò)行為信息),便可推測(cè)總體網(wǎng)民在這個(gè)網(wǎng)站的流量;如果需要預(yù)測(cè)網(wǎng)站的訪問(wèn)者的人群構(gòu)成,則還需要獲得樣本用戶的屬性信息);優(yōu)選地,樣本用戶對(duì)互聯(lián)網(wǎng)的網(wǎng)絡(luò)行為信息包含某一時(shí)間段內(nèi)其每一次的訪問(wèn)活動(dòng);步驟S120,根據(jù)預(yù)設(shè)的劃分標(biāo)準(zhǔn)對(duì)樣本用戶進(jìn)行劃分,獲得一個(gè)或一個(gè)以上的代表用戶;其中,該劃分標(biāo)準(zhǔn)比如為聚類(網(wǎng)絡(luò)行為相似、人口統(tǒng)計(jì)信息相似)等標(biāo)準(zhǔn),根據(jù)該劃分標(biāo)準(zhǔn),將樣本用戶劃分成一個(gè)或一個(gè)以上的用戶集合,將該用戶集合作為一個(gè)整體,該一個(gè)整體稱之為一個(gè)代表用戶;代表用戶可以是樣本用戶中的一類用戶,也可以是樣本用戶中的一個(gè)用戶;步驟S130,統(tǒng)計(jì)各代表用戶在已知其總體信息的訓(xùn)練用互聯(lián)網(wǎng)資源上的相關(guān)信息;步驟S140,將該訓(xùn)練用互聯(lián)網(wǎng)資源的已知總體信息以及各代表用戶在該訓(xùn)練用互聯(lián)網(wǎng)資源的相關(guān)信息作為訓(xùn)練集,并使用機(jī)器學(xué)習(xí)的方法,對(duì)各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行學(xué)習(xí),為各代表用戶分別賦予權(quán)值;各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息是每個(gè)代表用戶中每個(gè)用戶在該訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息的總和,總體信息是指總體網(wǎng)民在該訓(xùn)練用互聯(lián)網(wǎng)資源的相關(guān)信息之和;某用戶在某互聯(lián)網(wǎng)資源上的相關(guān)信息包括但不限于用戶瀏覽該互聯(lián)網(wǎng)資源的瀏覽行為信息(如瀏覽次數(shù)和/或?yàn)g覽時(shí)間)等;訓(xùn)練集包括但不限于已知其總體信息的一組互聯(lián)網(wǎng)資源,以及代表用戶在這組互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息;訓(xùn)練集包含兩個(gè)組成部分,第一組成部分是總體網(wǎng)民在該互聯(lián)網(wǎng)資源上的總體信息,第二組成部分是各代表用戶在該互聯(lián)網(wǎng)資源上的相關(guān)信息;步驟S150,獲得樣本用戶在目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果;步驟S160,根據(jù)代表用戶所被賦予的權(quán)值,以及該相關(guān)信息的統(tǒng)計(jì)結(jié)果,得到步驟 SllO中所述范圍內(nèi)的總體網(wǎng)民(或者說(shuō),樣本用戶所在范圍內(nèi)的總體網(wǎng)民)在目標(biāo)互聯(lián)網(wǎng)資源上的總體信息的估計(jì)結(jié)果;其中該總體信息的估計(jì)結(jié)果包括總體網(wǎng)民在目標(biāo)互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息的估計(jì)結(jié)果(對(duì)應(yīng)于已知信息中的網(wǎng)絡(luò)行為信息)以及總體網(wǎng)民在目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果(對(duì)應(yīng)于已知信息中的用戶屬性信息);本步驟的實(shí)現(xiàn),包括但不限于對(duì)于網(wǎng)絡(luò)行為信息的估計(jì)結(jié)果,是使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果的加權(quán)和,將該加權(quán)和作為總體網(wǎng)民在該目標(biāo)互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息的估計(jì)結(jié)果;
對(duì)于用戶屬性信息的估計(jì)結(jié)果,是使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的加權(quán)和,將該加權(quán)和作為總體網(wǎng)民在該目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果;其中樣本用戶在目標(biāo)互聯(lián)網(wǎng)資源上的總體信息,以及代表用戶在該目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息構(gòu)成預(yù)測(cè)集,因此預(yù)測(cè)集可以理解為包括待預(yù)測(cè)某總體信息的一組互聯(lián)網(wǎng)資源及代表用戶的相關(guān)信息。本實(shí)施例中,如圖2所示,樣本用戶來(lái)自于總體網(wǎng)民,身份明確并可獲得其詳細(xì)的網(wǎng)絡(luò)行為。根據(jù)預(yù)設(shè)的劃分標(biāo)準(zhǔn)對(duì)樣本用戶進(jìn)行劃分,生成各代表用戶,圖2以代表用戶、
代表用戶2.....代表用戶η等示出,每個(gè)代表用戶包含一組樣本用戶,這些樣本用戶具有
某些相似的行為或特征。本發(fā)明的一個(gè)應(yīng)用實(shí)施是欲要預(yù)測(cè)訪問(wèn)過(guò)一預(yù)測(cè)網(wǎng)站B的學(xué)生人數(shù),如圖3所示, 該應(yīng)用實(shí)施主要包括如下步驟步驟S310,對(duì)樣本用戶進(jìn)行聚類(劃分標(biāo)準(zhǔn)不限于此且不是本發(fā)明的重點(diǎn))劃分, 得到三個(gè)代表用戶,分別記載為第一代表用戶U1、第二代表用戶U2和第三代表用戶U3 ;步驟S320,統(tǒng)計(jì)該三個(gè)代表用戶在一訓(xùn)練用網(wǎng)站A上的網(wǎng)絡(luò)行為信息;步驟S330,統(tǒng)計(jì)出該三個(gè)代表用戶在訓(xùn)練用網(wǎng)站A上的相關(guān)信息,比如第一代表用戶Ul中有100個(gè)用戶訪問(wèn)了訓(xùn)練用網(wǎng)站Α,這100個(gè)用戶中有20個(gè)是學(xué)生,其中該第一代表用戶Ul中有20個(gè)學(xué)生訪問(wèn)了訓(xùn)練用網(wǎng)站A這個(gè)信息就是第一代表用戶Ul在該訓(xùn)練用網(wǎng)站A上的相關(guān)信息;訓(xùn)練用網(wǎng)站A相對(duì)于總體網(wǎng)民的總體信息,比如總體網(wǎng)民中有10,000個(gè)用戶訪問(wèn)過(guò)訓(xùn)練用網(wǎng)站Α,在10,000個(gè)用戶中有6,000個(gè)用戶是學(xué)生,其中訪問(wèn)過(guò)訓(xùn)練用網(wǎng)站A的 10,000個(gè)用戶中有6,000個(gè)是學(xué)生這個(gè)信息就是總體網(wǎng)民在訓(xùn)練用網(wǎng)站A上的總體信息;步驟S340,通過(guò)機(jī)器學(xué)習(xí)方法,利用該訓(xùn)練用網(wǎng)站A的已知總體信息以及該三個(gè)代表用戶在訓(xùn)練用網(wǎng)站A上的相關(guān)信息,對(duì)該三個(gè)代表用戶在該訓(xùn)練用網(wǎng)站A上的網(wǎng)絡(luò)行為信息進(jìn)行學(xué)習(xí),為該三個(gè)代表用戶分別賦予各自的權(quán)值(為用戶Ui賦予權(quán)值wi,i等于 1、2或者幻,其中的機(jī)器學(xué)習(xí)方法為一個(gè)多元方程組尋找符合某約束條件的一組最優(yōu)解, 但不限于此;賦予各代表用戶的權(quán)值后,學(xué)習(xí)過(guò)程結(jié)束;步驟S350,統(tǒng)計(jì)出各代表用戶在該預(yù)測(cè)網(wǎng)站B上的相關(guān)信息,例如第一代表用戶 U1、第二代表用戶U2以及第三代表用戶U3中分別有10個(gè)、20個(gè)和30個(gè)學(xué)生訪問(wèn)了預(yù)測(cè)網(wǎng)站B ;步驟S360,根據(jù)各代表用戶所被賦予的權(quán)值,以及各代表用戶在該預(yù)測(cè)網(wǎng)站B上的相關(guān)信息就可以獲得訪問(wèn)過(guò)預(yù)測(cè)網(wǎng)站B的訪問(wèn)者的總體信息(學(xué)生總?cè)藬?shù)在總體網(wǎng)民范圍內(nèi)的總體信息),具體根據(jù)如下所示的加權(quán)和表達(dá)式(1)獲得Iroatal = Σ (Wi *Ii) = W}*l0 + W2*20+W3*30( 1 )
(=1其中,Iloatal為待預(yù)測(cè)的總體信息,本應(yīng)用中表示訪問(wèn)預(yù)測(cè)網(wǎng)站B的學(xué)生總?cè)藬?shù);wi為第i個(gè)代表用戶的權(quán)值,η等于3 ;Ii為第i個(gè)代表用戶的相關(guān)信息,本應(yīng)用中表示代表用戶在預(yù)測(cè)網(wǎng)站B中的訪問(wèn)
8的人數(shù)。需要說(shuō)明的是,上述應(yīng)用實(shí)施是較為簡(jiǎn)單的一個(gè)舉例,在實(shí)際應(yīng)用過(guò)程中,代表用戶一般都會(huì)有很多,訓(xùn)練集和預(yù)測(cè)集所包含的互聯(lián)網(wǎng)資源也會(huì)有很多。根據(jù)這些代表用戶在訓(xùn)練集包括的網(wǎng)站(如第一訓(xùn)練用網(wǎng)站Al,第二訓(xùn)練用網(wǎng)站A2等等)的相關(guān)信息,才可以為各代表用戶設(shè)定權(quán)值,該設(shè)定權(quán)值的過(guò)程由機(jī)器學(xué)習(xí)自動(dòng)完成。同時(shí),由于預(yù)先知道的代表用戶的信息可以不止是學(xué)生,還可以是教師或者家長(zhǎng)等信息,也還可以包含對(duì)象的性別、年齡等諸多信息,因此,如果要統(tǒng)計(jì)訪問(wèn)過(guò)測(cè)試網(wǎng)站B的性別、年齡等其他信息,也可以通過(guò)本發(fā)明技術(shù)方案得出。圖4示出了本發(fā)明更為廣泛的應(yīng)用,共η個(gè)代表用戶(分別以代表用戶1、代表用
戶2.....代表用戶η示出)通過(guò)在共m個(gè)訓(xùn)練資源(分別以訓(xùn)練資源1、訓(xùn)練資源2.....
訓(xùn)練資源m示出)上的網(wǎng)絡(luò)行為信息進(jìn)行機(jī)器學(xué)習(xí)后,獲得各自的權(quán)值;該共η個(gè)代表用戶根據(jù)學(xué)習(xí)所得的權(quán)值分別對(duì)共P個(gè)預(yù)測(cè)資源進(jìn)行估計(jì)預(yù)測(cè),得到相應(yīng)的P個(gè)預(yù)測(cè)結(jié)果(分別以預(yù)測(cè)結(jié)果1、預(yù)測(cè)結(jié)果2.....預(yù)測(cè)結(jié)果ρ示出)。實(shí)施例二、一種使用非隨機(jī)樣本用戶進(jìn)行網(wǎng)絡(luò)行為信息的估計(jì)裝置如圖5所示,本實(shí)施例主要包括第一獲取模塊510、劃分模塊520、統(tǒng)計(jì)模塊530、賦值模塊Μ0、第二獲取模塊550以及估計(jì)模塊560,其中第一獲取模塊510,用于獲取樣本用戶的網(wǎng)絡(luò)行為信息;劃分模塊520,用于對(duì)樣本用戶進(jìn)行劃分,獲得一個(gè)或一個(gè)以上的代表用戶;統(tǒng)計(jì)模塊530,與該第一獲取模塊510及劃分模塊520相連,用于統(tǒng)計(jì)各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息;賦值模塊Μ0,與該第一獲取模塊510及統(tǒng)計(jì)模塊530相連,用于對(duì)各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行學(xué)習(xí),為各代表用戶分別賦予權(quán)值;第二獲取模塊550,用于獲得樣本用戶在目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果;估計(jì)模塊560,與該賦值模塊540及第二獲取模塊550相連,用于根據(jù)各代表用戶所被賦予的權(quán)值,以及樣本用戶在目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果,獲得總體網(wǎng)民在目標(biāo)互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息的估計(jì)結(jié)果。其中,估計(jì)模塊560用于使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果的加權(quán)和,將加權(quán)和作為總體網(wǎng)民在目標(biāo)互聯(lián)網(wǎng)資源上的總體信息的估計(jì)結(jié)果。其中,第一獲取模塊510用于獲取樣本用戶的網(wǎng)絡(luò)行為信息的同時(shí),進(jìn)一步獲取樣本用戶的屬性信息;估計(jì)模塊560用于根據(jù)各代表用戶所被賦予的權(quán)值,獲得總體網(wǎng)民在目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果。其中,估計(jì)模塊560用于使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的加權(quán)和,將加權(quán)和作為總體網(wǎng)民在目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果。其中,賦值模塊540用于將訓(xùn)練用互聯(lián)網(wǎng)資源,以及各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源的相關(guān)信息作為訓(xùn)練集,利用訓(xùn)練集對(duì)各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行學(xué)習(xí)。
9
本實(shí)施例中,在訓(xùn)練階段,首先獲得代表用戶在各訓(xùn)練集中互聯(lián)網(wǎng)資源上的相關(guān)信息,結(jié)合這些互聯(lián)網(wǎng)資源的總體信息,使用機(jī)器學(xué)習(xí)方法獲得各代表用戶的權(quán)值。在預(yù)測(cè)階段,首先獲得代表用戶在各待測(cè)互聯(lián)網(wǎng)資源上的相關(guān)信息,計(jì)算代表用戶在互聯(lián)網(wǎng)資源上的加權(quán)和作為總體網(wǎng)民在目標(biāo)互聯(lián)網(wǎng)資源上的總體信息的預(yù)測(cè)值。本領(lǐng)域的技術(shù)人員應(yīng)該明白,上述的本發(fā)明的各模塊或各步驟可以用通用的計(jì)算裝置來(lái)實(shí)現(xiàn),它們可以集中在單個(gè)的計(jì)算裝置上,或者分布在多個(gè)計(jì)算裝置所組成的網(wǎng)絡(luò)上,可選地,它們可以用計(jì)算裝置可執(zhí)行的程序代碼來(lái)實(shí)現(xiàn),從而,可以將它們存儲(chǔ)在存儲(chǔ)裝置中由計(jì)算裝置來(lái)執(zhí)行,或者將它們分別制作成各個(gè)集成電路模塊,或者將它們中的多個(gè)模塊或步驟制作成單個(gè)集成電路模塊來(lái)實(shí)現(xiàn)。這樣,本發(fā)明不限制于任何特定的硬件和軟件結(jié)合。雖然本發(fā)明所揭露的實(shí)施方式如上,但所述的內(nèi)容只是為了便于理解本發(fā)明而采用的實(shí)施方式,并非用以限定本發(fā)明。任何本發(fā)明所屬技術(shù)領(lǐng)域內(nèi)的技術(shù)人員,在不脫離本發(fā)明所揭露的精神和范圍的前提下,可以在實(shí)施的形式上及細(xì)節(jié)上作任何的修改與變化, 但本發(fā)明的專利保護(hù)范圍,仍須以所附的權(quán)利要求書(shū)所界定的范圍為準(zhǔn)。
10
權(quán)利要求
1.一種使用非隨機(jī)樣本用戶進(jìn)行網(wǎng)絡(luò)行為信息的估計(jì)方法,其特征在于,包括 獲取所述樣本用戶的網(wǎng)絡(luò)行為信息;對(duì)所述樣本用戶進(jìn)行劃分,獲得一個(gè)或一個(gè)以上的代表用戶; 統(tǒng)計(jì)各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息;對(duì)各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行學(xué)習(xí),為各代表用戶分別賦予權(quán)值;獲得所述樣本用戶在目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果; 根據(jù)各代表用戶所被賦予的權(quán)值以及所述統(tǒng)計(jì)結(jié)果,獲得總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息的估計(jì)結(jié)果。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,根據(jù)所述權(quán)值以及統(tǒng)計(jì)結(jié)果獲得所述估計(jì)結(jié)果的步驟,包括使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在所述目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果的加權(quán)和,將所述加權(quán)和作為所述估計(jì)結(jié)果。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于獲取所述樣本用戶的網(wǎng)絡(luò)行為信息的同時(shí),進(jìn)一步獲取所述樣本用戶的屬性信息; 根據(jù)各代表用戶所被賦予的權(quán)值,獲得所述總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,根據(jù)所述權(quán)值獲得所述總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果的步驟,包括使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的加權(quán)和,將所述加權(quán)和作為所述總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果。
5.根據(jù)權(quán)利要求1或3所述的方法,其特征在于,對(duì)各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行學(xué)習(xí)的步驟,包括將所述訓(xùn)練用互聯(lián)網(wǎng)資源的已知總體信息以及各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源的相關(guān)信息作為訓(xùn)練集,利用所述訓(xùn)練集對(duì)各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行所述學(xué)習(xí)。
6.一種使用非隨機(jī)樣本用戶進(jìn)行網(wǎng)絡(luò)行為信息的估計(jì)裝置,其特征在于,包括第一獲取模塊、劃分模塊、統(tǒng)計(jì)模塊、賦值模塊、第二獲取模塊以及估計(jì)模塊,其中所述第一獲取模塊,用于獲取所述樣本用戶的網(wǎng)絡(luò)行為信息; 所述劃分模塊,用于對(duì)所述樣本用戶進(jìn)行劃分,獲得一個(gè)或一個(gè)以上的代表用戶; 所述統(tǒng)計(jì)模塊,用于統(tǒng)計(jì)各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息; 所述賦值模塊,用于對(duì)各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行學(xué)習(xí),為各代表用戶分別賦予權(quán)值;所述第二獲取模塊,用于獲得所述樣本用戶在目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果;所述估計(jì)模塊,用于根據(jù)各代表用戶所被賦予的權(quán)值,以及所述樣本用戶在所述目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果,獲得總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息的估計(jì)結(jié)果。
7.根據(jù)權(quán)利要求6所述的裝置,其特征在于所述估計(jì)模塊用于使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在所述目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果的加權(quán)和,將所述加權(quán)和作為所述估計(jì)結(jié)果。
8.根據(jù)權(quán)利要求6所述的方法,其特征在于所述第一獲取模塊用于獲取所述樣本用戶的網(wǎng)絡(luò)行為信息的同時(shí),進(jìn)一步獲取所述樣本用戶的屬性信息;所述估計(jì)模塊用于根據(jù)各代表用戶所被賦予的權(quán)值,獲得所述樣總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于所述估計(jì)模塊用于使用各代表用戶所被賦予的權(quán)值,計(jì)算各代表用戶在目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的加權(quán)和,將所述加權(quán)和作為所述總體網(wǎng)民在所述目標(biāo)互聯(lián)網(wǎng)資源上的用戶屬性信息的估計(jì)結(jié)果。
10.根據(jù)權(quán)利要求6或8所述的方法,其特征在于所述賦值模塊用于將所述訓(xùn)練用互聯(lián)網(wǎng)資源的已知總體信息以及各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源的相關(guān)信息作為訓(xùn)練集,利用所述訓(xùn)練集對(duì)各代表用戶在所述訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行所述學(xué)習(xí)。
全文摘要
本發(fā)明公開(kāi)了一種使用非隨機(jī)樣本用戶進(jìn)行網(wǎng)絡(luò)行為信息的估計(jì)方法和裝置,以解決現(xiàn)有技術(shù)中根據(jù)非隨機(jī)樣本用戶對(duì)總體網(wǎng)民的估計(jì)結(jié)果與實(shí)際結(jié)果的誤差可能較大的技術(shù)缺陷,其中該方法包括獲取樣本用戶的網(wǎng)絡(luò)行為信息;對(duì)樣本用戶進(jìn)行劃分,獲得代表用戶;統(tǒng)計(jì)各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息;對(duì)各代表用戶在訓(xùn)練用互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息進(jìn)行學(xué)習(xí),為各代表用戶分別賦予權(quán)值;獲得樣本用戶在目標(biāo)互聯(lián)網(wǎng)資源上的相關(guān)信息的統(tǒng)計(jì)結(jié)果;根據(jù)各代表用戶所被賦予的權(quán)值以及統(tǒng)計(jì)結(jié)果,獲得總體網(wǎng)民在目標(biāo)互聯(lián)網(wǎng)資源上的網(wǎng)絡(luò)行為信息的估計(jì)結(jié)果。與現(xiàn)有技術(shù)相比,本發(fā)明的技術(shù)方案實(shí)現(xiàn)了對(duì)互聯(lián)網(wǎng)資源的總體信息的客觀預(yù)測(cè)。
文檔編號(hào)G06Q30/00GK102346739SQ20101024194
公開(kāi)日2012年2月8日 申請(qǐng)日期2010年7月30日 優(yōu)先權(quán)日2010年7月30日
發(fā)明者吳明輝, 申志輝, 聞凌云, 陳家耀 申請(qǐng)人:北京學(xué)之途網(wǎng)絡(luò)科技有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
太和县| 饶河县| 玉屏| 温泉县| 波密县| 比如县| 莱西市| 荆州市| 资阳市| 会同县| 汕头市| 汾阳市| 墨竹工卡县| 闽侯县| 施秉县| 郑州市| 理塘县| 噶尔县| 高尔夫| 潮安县| 建水县| 卢龙县| 通州区| 贡觉县| 莱芜市| 沂源县| 廊坊市| 萨迦县| 社旗县| 绥宁县| 富锦市| 华坪县| 辉县市| 石门县| 芒康县| 澎湖县| 左云县| 白玉县| 公安县| 左贡县| 乌拉特后旗|