專利名稱:一種基于VideoBag特征的精準(zhǔn)廣告投放系統(tǒng)及方法
技術(shù)領(lǐng)域:
本發(fā)明屬于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種廣告投放系統(tǒng)及方法。
背景技術(shù):
廣告投放是互聯(lián)網(wǎng)最常用的信息傳播模式之一。對于視頻網(wǎng)站,目前最主要的廣告投放方式還是基于內(nèi)容定向、時(shí)間定向和頻道定向的,以上的廣告投放方式最大的缺點(diǎn)是目標(biāo)受眾到達(dá)率低。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種針對目標(biāo)受眾投放廣告,從而有效提升廣告效果的系統(tǒng)和方法。本發(fā)明的技術(shù)方案是一種基于VideoBag特征的精準(zhǔn)廣告投放系統(tǒng),它包括用戶數(shù)據(jù)采集模塊,視頻節(jié)目鑒別能力計(jì)算和排序模塊,VideoBag打包模塊,權(quán)重計(jì)算模塊,用戶特征表生成模塊,用戶性別分類模型訓(xùn)練模塊,用戶年齡段分類模型訓(xùn)練模塊,用戶性別與年齡段預(yù)測模塊,廣告投放模塊;所述用戶數(shù)據(jù)采集模塊獲取用戶視頻節(jié)目觀看日志,并通過網(wǎng)上投遞的調(diào)查問卷,收集用戶性別、年齡信息;所述視頻節(jié)目鑒別能力計(jì)算和排序模塊利用所述用戶數(shù)據(jù)采集模塊收集的用戶性別、年齡信息,計(jì)算各視頻節(jié)目的性別鑒別能力I1和年齡鑒別能力I2 I1= (man_v i ew-woman_v i ew) / (man_v i ew+woman_v i ew)I2 = (in_group_view-not_in_group_view)/(in_group_view+not_in_group_view)式中man_view為該視頻節(jié)目被男性觀看的次數(shù),woman_view為被女性觀看的數(shù)次;in_group_view為該視頻節(jié)目被屬于年齡段[min_age,max_age]用戶的觀看次數(shù),not_in_group_view為不屬于年齡段[min_age, max_age]用戶的觀看次數(shù);將所有視頻節(jié)目分別按Ip I2值大小進(jìn)行兩個(gè)排序,分別稱為I1排序和I2排序;在每個(gè)排序中為每個(gè)視頻節(jié)目賦予相應(yīng)ID編號; 所述VideoBag打包模塊將所述視頻節(jié)目鑒別能力計(jì)算和排序模塊給出的I1排序和I2排序,分別依序每m個(gè)視頻節(jié)目打包在一起得到一個(gè)VideoBag,最后一個(gè)VideoBag中視頻節(jié)目不足m個(gè)則按實(shí)際數(shù)量;從I開始,為每個(gè)VideoBag賦予一個(gè)編號,從而得到分別對應(yīng)I1排序和I2排序的兩個(gè)VideoBag序列;所述權(quán)重計(jì)算模塊計(jì)算各個(gè)VideoBag中所有視頻節(jié)目的I1或I2絕對值的平均值;并令其為本VideoBag的權(quán)重Weight 所述用戶特征表生成模塊從所述用戶數(shù)據(jù)采集模塊獲取的用戶視頻節(jié)目觀看日志,將每個(gè)用戶在一段時(shí)間內(nèi)觀看的所有視頻節(jié)目列表,將該表中的每一視頻節(jié)目在I1排序和I2排序中的ID編號轉(zhuǎn)換成所在VideoBag的編號和權(quán)重Weight,得到每個(gè)用戶的特征列表;由于觀看次數(shù)過少的樣本數(shù)據(jù)噪聲較大,故剔除觀看視頻節(jié)目次數(shù)少于k次的用戶樣本;設(shè)得到UserNum個(gè)已知性另I」、所屬年齡段的用戶特征列表;將這UserNum個(gè)用戶特征列表分為兩部分,一部分用于訓(xùn)練,另一部分由于用戶測試;所述用戶性別分類模型訓(xùn)練模塊使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成模塊提供的一部分用戶特征列表,將其中男性用戶作為正樣本、女性用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特征表生成模塊提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為性別模型;所述用戶年齡段分類模型訓(xùn)練模塊使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分 類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成模塊提供的一部分用戶特征列表,將其中年齡屬于要求年齡段[min_age, max_age]的用戶作為正樣本、其他年齡段的用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特征表生成模塊提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為年齡段模型;所述用戶性別與年齡段預(yù)測模塊對所述用戶數(shù)據(jù)采集模塊獲取的性別、年齡段未知的用戶,依據(jù)其視頻節(jié)目觀看日志,使用所述性別模型預(yù)測其性別,使用所述年齡段模型預(yù)測其年齡段,得到對該用戶性別與年齡段的預(yù)測結(jié)果;基于預(yù)測結(jié)果,對該用戶賦予性另IJ、年齡段標(biāo)簽;所述廣告投放模塊根據(jù)所述用戶性別與年齡段預(yù)測模塊給出的用戶性別、年齡段標(biāo)簽,以及所述用戶數(shù)據(jù)采集模塊收集的用戶性別、年齡信息,按照某廣告投放的目標(biāo)人群,向具有適合性別、年齡段的用戶投放該廣告。一種基于VideoBag特征的精準(zhǔn)廣告投放方法,它依序執(zhí)行以下步驟A.用戶數(shù)據(jù)采集步驟,它獲取用戶視頻節(jié)目觀看日志,并通過網(wǎng)上投遞的調(diào)查問卷,收集用戶性別、年齡信息;B.視頻節(jié)目鑒別能力計(jì)算和排序步驟,它利用所述用戶數(shù)據(jù)采集步驟收集的用戶性別、年齡信息,計(jì)算各視頻節(jié)目的性別鑒別能力I1和年齡鑒別能力I2 I1= (man_v i ew-woman_v i ew) / (man_v i ew+woman_v i ew)I2 = (in_group_view-not_in_group_view)/(in_group_view+not_in_group_view)式中man_view為該視頻節(jié)目被男性觀看的次數(shù),woman_view為被女性觀看的數(shù)次;in_group_view為該視頻節(jié)目被屬于年齡段[min_age,max_age]用戶的觀看次數(shù),not_in_group_view為不屬于年齡段[min_age, max_age]用戶的觀看次數(shù);將所有視頻節(jié)目分別按Ip I2值大小進(jìn)行兩個(gè)排序,分別稱為I1排序和I2排序;在每個(gè)排序中為每個(gè)視頻節(jié)目賦予相應(yīng)ID編號;C. VideoBag打包步驟,它將所述視頻節(jié)目鑒別能力計(jì)算和排序步驟給出的I1排序和I2排序,分別依序每m個(gè)視頻節(jié)目打包在一起得到一個(gè)VideoBag,最后一個(gè)VideoBag中視頻節(jié)目不足m個(gè)則按實(shí)際數(shù)量;從I開始,為每個(gè)VideoBag賦予一個(gè)編號,從而得到分別對應(yīng)I1排序和I2排序的兩個(gè)VideoBag序列;D.權(quán)重計(jì)算步驟,它計(jì)算各個(gè)VideoBag中所有視頻節(jié)目的I1或I2絕對值的平均值;并令其為本VideoBag的權(quán)重Weight E.用戶特征表生成步驟,它從所述用戶數(shù)據(jù)采集步驟獲取的用戶視頻節(jié)目觀看日志,將每個(gè)用戶在一段時(shí)間內(nèi)觀看的所有視頻節(jié)目列表,將該表中的每一視頻節(jié)目在I1排序和I2排序中的ID編號轉(zhuǎn)換成所在VideoBag的編號和權(quán)重Weight,得到每個(gè)用戶的特征列表;由于觀看次數(shù)過少的樣本數(shù)據(jù)噪聲較大,故剔除觀看視頻節(jié)目次數(shù)少于k次的用戶樣本;設(shè)得到UserNum個(gè)已知性另U、所屬年齡段的用戶特征列表;將這UserNum個(gè)用戶特 征列表分為兩部分,一部分用于訓(xùn)練,另一部分由于用戶測試;F.用戶性別分類模型訓(xùn)練步驟,它使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成步驟提供的一部分用戶特征列表,將其中男性用戶作為正樣本、女性用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特征表生成步驟提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為性別模型;G.用戶年齡段分類模型訓(xùn)練步驟,它使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成步驟提供的一部分用戶特征列表,將其中年齡屬于要求年齡段[min_age, max_age]的用戶作為正樣本、其他年齡段的用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特征表生成步驟提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為年齡段模型;H.用戶性別與年齡段預(yù)測步驟,它對所述用戶數(shù)據(jù)采集步驟獲取的性別、年齡段未知的用戶,依據(jù)其視頻節(jié)目觀看日志,使用所述性別模型預(yù)測其性別,使用所述年齡段模型預(yù)測其年齡段,得到對該用戶性別與年齡段的預(yù)測結(jié)果;基于預(yù)測結(jié)果,對該用戶賦予性另IJ、年齡段標(biāo)簽;I.廣告投放步驟,它根據(jù)所述用戶性別與年齡段預(yù)測步驟給出的用戶性別、年齡段標(biāo)簽,以及所述用戶數(shù)據(jù)采集步驟收集的用戶性別、年齡信息,按照某廣告投放的目標(biāo)人群,向具有適合性別、年齡段的用戶投放該廣告。本發(fā)明直接利用用戶的觀看行為對目標(biāo)受眾進(jìn)行高精度的性別、年齡的分類,在較大程度上提升了廣告到達(dá)目標(biāo)受眾的精確度,從而有效地提升了廣告效果。
附圖為本發(fā)明中一種基于VideoBag特征的精準(zhǔn)廣告投放系統(tǒng)的結(jié)構(gòu)框圖。
具體實(shí)施例方式實(shí)施例I :參見附圖,一種基于VideoBag特征的精準(zhǔn)廣告投放系統(tǒng),它包括用戶數(shù)據(jù)采集模塊I,視頻節(jié)目鑒別能力計(jì)算和排序模塊2,VideoBag打包模塊3,權(quán)重計(jì)算模塊4,用戶特征表生成模塊5,用戶性別分類模型訓(xùn)練模塊6,用戶年齡段分類模型訓(xùn)練模塊7,用戶性別與年齡段預(yù)測模塊8,廣告投放模塊9 ;所述用戶數(shù)據(jù)采集模塊I獲取用戶視頻節(jié)目觀看日志,并通過網(wǎng)上投遞的調(diào)查問卷,收集用戶性別、年齡信息;所述視頻節(jié)目鑒別能力計(jì)算和排序模塊2利用所述用戶數(shù)據(jù)采集模塊I收集的用戶性別、年齡信息,計(jì)算各視頻節(jié)目的性別鑒別能力I1和年齡鑒別能力I2 I1= (man_v i ew-woman_v i ew) / (man_v i ew+woman_v i ew)I2 = (in_group_view-not_in_group_view)/(in_group_view+not_in_group_view)式中man_view為該視頻節(jié)目被男性觀看的次數(shù),woman_view為被女性觀看的數(shù)次;in_group_view為該視頻節(jié)目被屬于年齡段[min_age, max_age]用戶(如25 40歲的用戶)的觀看次數(shù),not_in_group_view為不屬于年齡段[min_age, max_age]用戶(如·25 40歲以外的用戶)的觀看次數(shù);將所有視頻節(jié)目分別按Ip I2值大小進(jìn)行兩個(gè)排序,分別稱為I1排序和I2排序;在每個(gè)排序中為每個(gè)視頻節(jié)目賦予相應(yīng)ID編號;所述VideoBag打包模塊3將所述視頻節(jié)目鑒別能力計(jì)算和排序模塊2給出的I1排序和I2排序,分別依序每m個(gè)視頻節(jié)目打包在一起得到一個(gè)VideoBag,最后一個(gè)VideoBag中視頻節(jié)目不足m個(gè)則按實(shí)際數(shù)量;從I開始,為每個(gè)VideoBag賦予一個(gè)編號,從而得到分別對應(yīng)I1排序和I2排序的兩個(gè)VideoBag序列;所述權(quán)重計(jì)算模塊4計(jì)算各個(gè)VideoBag中所有視頻節(jié)目的I1或I2絕對值的平均值;并令其為本VideoBag的權(quán)重Weight 所述用戶特征表生成模塊5從所述用戶數(shù)據(jù)采集模塊I獲取的用戶視頻節(jié)目觀看日志,將每個(gè)用戶在一段時(shí)間內(nèi)觀看的所有視頻節(jié)目列表,將該表中的每一視頻節(jié)目在I1排序和I2排序中的ID編號轉(zhuǎn)換成所在VideoBag的編號和權(quán)重Weight,得到每個(gè)用戶的特征列表;由于觀看次數(shù)過少的樣本數(shù)據(jù)噪聲較大,故剔除觀看視頻節(jié)目次數(shù)少于k次的用戶樣本;設(shè)得到UserNum個(gè)已知性另I」、所屬年齡段的用戶特征列表;將這UserNum個(gè)用戶特征列表分為兩部分,一部分用于訓(xùn)練,另一部分由于用戶測試;所述用戶性別分類模型訓(xùn)練模塊6使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成模塊5提供的一部分用戶特征列表,將其中男性用戶作為正樣本、女性用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特征表生成模塊5提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為性別模型;所述用戶年齡段分類模型訓(xùn)練模塊7使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成模塊5提供的一部分用戶特征列表,將其中年齡屬于要求年齡段[min_age,max_age]的用戶作為正樣本、其他年齡段的用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特征表生成模塊5提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為年齡段模型;
所述用戶性別與年齡段預(yù)測模塊8對所述用戶數(shù)據(jù)采集模塊I獲取的性別、年齡段未知的用戶,依據(jù)其視頻節(jié)目觀看日志,使用所述性別模型預(yù)測其性別,使用所述年齡段模型預(yù)測其年齡段,得到對該用戶性別與年齡段的預(yù)測結(jié)果;基于預(yù)測結(jié)果,對該用戶賦予性別、年齡段標(biāo)簽;所述廣告投放模塊9根據(jù)所述用戶性別與年齡段預(yù)測模塊8給出的用戶性別、年齡段標(biāo)簽,以及所述用戶數(shù)據(jù)采集模塊I收集的用戶性別、年齡信息,按照某廣告投放的目標(biāo)人群,向具有適合性別、年齡段的用戶投放該廣告。實(shí)施例2 :在實(shí)施例I所述的基于VideoBag特征的精準(zhǔn)廣告投放系統(tǒng)中,所述VideoBag打包模塊3中,m取值為6000 ;所述用戶特征表生成模塊5中,k取值為5 ;所述用戶特征表生成模塊5和所述用戶性別分類模型訓(xùn)練模塊6、所述用戶年齡段分類模型訓(xùn)練模塊7中,用于訓(xùn)練的用戶特征列表為30% UserNum個(gè),其余70% UserNum個(gè)用于測試。實(shí)施例3 : —種基于VideoBag特征的精準(zhǔn)廣告投放方法,它依序執(zhí)行以下步驟A.用戶數(shù)據(jù)采集步驟,它獲取用戶視頻節(jié)目觀看日志,并通過網(wǎng)上投遞的調(diào)查問卷,收集用戶性別、年齡信息;B.視頻節(jié)目鑒別能力計(jì)算和排序步驟,它利用所述用戶數(shù)據(jù)采集步驟收集的用戶性別、年齡信息,計(jì)算各視頻節(jié)目的性別鑒別能力I1和年齡鑒別能力I2 I1= (man_v i ew-woman_v i ew) / (man_v i ew+woman_v i ew)I2 = (in_group_view-not_in_group_view)/(in_group_view+not_in_group_view)式中man_view為該視頻節(jié)目被男性觀看的次數(shù),woman_view為被女性觀看的數(shù)次;in_group_view為該視頻節(jié)目被屬于年齡段[min_age, max_age]用戶(如25 40歲的用戶)的觀看次數(shù),not_in_group_view為不屬于年齡段[min_age, max_age]用戶(如25 40歲以外的用戶)的觀看次數(shù);將所有視頻節(jié)目分別按Ip I2值大小進(jìn)行兩個(gè)排序,分別稱為I1排序和I2排序;在每個(gè)排序中為每個(gè)視頻節(jié)目賦予相應(yīng)ID編號;C. VideoBag打包步驟,它將所述視頻節(jié)目鑒別能力計(jì)算和排序步驟給出的I1排序和I2排序,分別依序每m個(gè)視頻節(jié)目打包在一起得到一個(gè)VideoBag,最后一個(gè)VideoBag中視頻節(jié)目不足m個(gè)則按實(shí)際數(shù)量;從I開始,為每個(gè)VideoBag賦予一個(gè)編號,從而得到分別對應(yīng)I1排序和I2排序的兩個(gè)VideoBag序列;D.權(quán)重計(jì)算步驟,它計(jì)算各個(gè)VideoBag中所有視頻節(jié)目的I1或I2絕對值的平均 值;并令其為本VideoBag的權(quán)重Weight E.用戶特征表生成步驟,它從所述用戶數(shù)據(jù)采集步驟獲取的用戶視頻節(jié)目觀看日志,將每個(gè)用戶在一段時(shí)間內(nèi)觀看的所有視頻節(jié)目列表,將該表中的每一視頻節(jié)目在I1排序和I2排序中的ID編號轉(zhuǎn)換成所在VideoBag的編號和權(quán)重Weight,得到每個(gè)用戶的特征列表;由于觀看次數(shù)過少的樣本數(shù)據(jù)噪聲較大,故剔除觀看視頻節(jié)目次數(shù)少于k次的用戶樣本;設(shè)得到UserNum個(gè)已知性另I」、所屬年齡段的用戶特征列表;將這UserNum個(gè)用戶特征列表分為兩部分,一部分用于訓(xùn)練,另一部分由于用戶測試;
F.用戶性別分類模型訓(xùn)練步驟,它使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成步驟提供的一部分用戶特征列表,將其中男性用戶作為正樣本、女性用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特征表生成步驟提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為性別模型;G.用戶年齡段分類模型訓(xùn)練步驟,它使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成步驟提供的一部分用戶特征列表,將其中年齡屬于要求年齡段[min_age, max_age]的用戶作為正樣本、其他年齡段的用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特 征表生成步驟提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為年齡段模型;H.用戶性別與年齡段預(yù)測步驟,它對所述用戶數(shù)據(jù)采集步驟獲取的性別、年齡段未知的用戶,依據(jù)其視頻節(jié)目觀看日志,使用所述性別模型預(yù)測其性別,使用所述年齡段模型預(yù)測其年齡段,得到對該用戶性別與年齡段的預(yù)測結(jié)果;基于預(yù)測結(jié)果,對該用戶賦予性另IJ、年齡段標(biāo)簽;I.廣告投放步驟,它根據(jù)所述用戶性別與年齡段預(yù)測步驟給出的用戶性別、年齡段標(biāo)簽,以及所述用戶數(shù)據(jù)采集步驟收集的用戶性別、年齡信息,按照某廣告投放的目標(biāo)人群,向具有適合性別、年齡段的用戶投放該廣告。實(shí)施例4 :在實(shí)施例3所述的基于VideoBag特征的精準(zhǔn)廣告投放方法中,所述VideoBag打包步驟中,m取值為6000 ;所述用戶特征表生成步驟中,k取值為5 ;所述用戶特征表生成步驟和所述用戶性別分類模型訓(xùn)練步驟、所述用戶年齡段分類模型訓(xùn)練步驟中,用于訓(xùn)練的用戶特征列表為30% UserNum個(gè),其余70% UserNum個(gè)用于測試。
權(quán)利要求
1.一種基于VideoBag特征的精準(zhǔn)廣告投放系統(tǒng),其特征是它包括用戶數(shù)據(jù)采集模塊(I),視頻節(jié)目鑒別能力計(jì)算和排序模塊(2) ,VideoBag打包模塊(3),權(quán)重計(jì)算模塊(4),用戶特征表生成模塊(5),用戶性別分類模型訓(xùn)練模塊¢),用戶年齡段分類模型訓(xùn)練模塊(7),用戶性別與年齡段預(yù)測模塊(8),廣告投放模塊(9); 所述用戶數(shù)據(jù)采集模塊(I)獲取用戶視頻節(jié)目觀看日志,并通過網(wǎng)上投遞的調(diào)查問卷,收集用戶性別、年齡信息; 所述視頻節(jié)目鑒別能力計(jì)算和排序模塊(2)利用所述用戶數(shù)據(jù)采集模塊(I)收集的用戶性別、年齡信息,計(jì)算各視頻節(jié)目的性別鑒別能力I1和年齡鑒別能力I2 11= (man_view-woman_view)/(man_v i ew+woman_v i ew) 12= (i n_group_v i ew-no t_i n_group_v i ew)/(i n_group_v i ew+no t_i n_group_v i ew) 式中man_view為該視頻節(jié)目被男性觀看的次數(shù),woman_view為被女性觀看的數(shù)次;in_group_view為該視頻節(jié)目被屬于年齡段[min_age,max_age]用戶的觀看次數(shù),not_in_group_view為不屬于年齡段[min_age, max_age]用戶的觀看次數(shù); 將所有視頻節(jié)目分別按I:、I2值大小進(jìn)行兩個(gè)排序,分別稱為I1排序和I2排序;在每個(gè)排序中為每個(gè)視頻節(jié)目賦予相應(yīng)ID編號; 所述VideoBag打包模塊(3)將所述視頻節(jié)目鑒別能力計(jì)算和排序模塊(2)給出的I1排序和I2排序,分別依序每m個(gè)視頻節(jié)目打包在一起得到一個(gè)VideoBag,最后一個(gè)VideoBag中視頻節(jié)目不足m個(gè)則按實(shí)際數(shù)量;從I開始,為每個(gè)VideoBag賦予一個(gè)編號,從而得到分別對應(yīng)I1排序和I2排序的兩個(gè)VideoBag序列; 所述權(quán)重計(jì)算模塊(4)計(jì)算各個(gè)VideoBag中所有視頻節(jié)目的I1或I2絕對值的平均值;并令其為本VideoBag的權(quán)重Weight 所述用戶特征表生成模塊(5)從所述用戶數(shù)據(jù)采集模塊(I)獲取的用戶視頻節(jié)目觀看日志,將每個(gè)用戶在一段時(shí)間內(nèi)觀看的所有視頻節(jié)目列表,將該表中的每一視頻節(jié)目在I1排序和I2排序中的ID編號轉(zhuǎn)換成所在VideoBag的編號和權(quán)重Weight,得到每個(gè)用戶的特征列表;由于觀看次數(shù)過少的樣本數(shù)據(jù)噪聲較大,故剔除觀看視頻節(jié)目次數(shù)少于k次的用戶樣本; 設(shè)得到U serNum個(gè)已知性別、所屬年齡段的用戶特征列表;將這U serNum個(gè)用戶特征列表分為兩部分,一部分用于訓(xùn)練,另一部分由于用戶測試; 所述用戶性別分類模型訓(xùn)練模塊(6)使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成模塊(5)提供的一部分用戶特征列表,將其中男性用戶作為正樣本、女性用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特征表生成模塊(5)提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為性別模型; 所述用戶年齡段分類模型訓(xùn)練模塊(7)使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成模塊(5)提供的一部分用戶特征列表,將其中年齡屬于要求年齡段[min_age,max_age]的用戶作為正樣本、其他年齡段的用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特征表生成模塊(5)提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為年齡段模型; 所述用戶性別與年齡段預(yù)測模塊(8)對所述用戶數(shù)據(jù)采集模塊(I)獲取的性別、年齡段未知的用戶,依據(jù)其視頻節(jié)目觀看日志,使用所述性別模型預(yù)測其性別,使用所述年齡段模型預(yù)測其年齡段,得到對該用戶性別與年齡段的預(yù)測結(jié)果;基于預(yù)測結(jié)果,對該用戶賦予性別、年齡段標(biāo)簽; 所述廣告投放模塊(9)根據(jù)所述用戶性別與年齡段預(yù)測模塊(8)給出的用戶性別、年齡段標(biāo)簽,以及所述用戶數(shù)據(jù)采集模塊(I)收集的用戶性別、年齡信息,按照某廣告投放的目標(biāo)人群,向具有適合性別、年齡段的用戶投放該廣告。
2.根據(jù)權(quán)利要求I所述的基于VideoBag特征的精準(zhǔn)廣告投放系統(tǒng),其特征是所述VideoBag打包模塊(3)中,m取值為6000 ;所述用戶特征表生成模塊(5)中,k取值為5 ;所述用戶特征表生成模塊(5)和所述用戶性別分類模型訓(xùn)練模塊¢)、所述用戶年齡段分類模型訓(xùn)練模塊(7)中,用于訓(xùn)練的用戶特征列表為30% UserNum個(gè),其余70% UserNum個(gè)用于測試。
3.一種基于VideoBag特征的精準(zhǔn)廣告投放方法,它依序執(zhí)行以下步驟 A.用戶數(shù)據(jù)采集步驟,它獲取用戶視頻節(jié)目觀看日志,并通過網(wǎng)上投遞的調(diào)查問卷,收集用戶性別、年齡信息; B.視頻節(jié)目鑒別能力計(jì)算和排序步驟,它利用所述用戶數(shù)據(jù)采集步驟收集的用戶性另IJ、年齡信息,計(jì)算各視頻節(jié)目的性別鑒別能力I1和年齡鑒別能力I2 11= (man_view-woman_view)/(man_v i ew+woman_v i ew) 12= (i n_group_v i ew-no t_i n_group_v i ew)/(i n_group_v i ew+no t_i n_group_v i ew) 式中man_view為該視頻節(jié)目被男性觀看的次數(shù),woman_view為被女性觀看的數(shù)次;in_group_view為該視頻節(jié)目被屬于年齡段[min_age,max_age]用戶的觀看次數(shù),not_in_group_view為不屬于年齡段[min_age, max_age]用戶的觀看次數(shù); 將所有視頻節(jié)目分別按I:、I2值大小進(jìn)行兩個(gè)排序,分別稱為I1排序和I2排序;在每個(gè)排序中為每個(gè)視頻節(jié)目賦予相應(yīng)ID編號; C.VideoBag打包步驟,它將所述視頻節(jié)目鑒別能力計(jì)算和排序步驟給出的I1排序和I2排序,分別依序每m個(gè)視頻節(jié)目打包在一起得到一個(gè)VideoBag,最后一個(gè)VideoBag中視頻節(jié)目不足m個(gè)則按實(shí)際數(shù)量;從I開始,為每個(gè)VideoBag賦予一個(gè)編號,從而得到分別對應(yīng)I1排序和I2排序的兩個(gè)VideoBag序列; D.權(quán)重計(jì)算步驟,它計(jì)算各個(gè)VideoBag中所有視頻節(jié)目的I1或I2絕對值的平均值;并令其為本VideoBag的權(quán)重Weight E.用戶特征表生成步驟,它從所述用戶數(shù)據(jù)采集步驟獲取的用戶視頻節(jié)目觀看日志,將每個(gè)用戶在一段時(shí)間內(nèi)觀看的所有視頻節(jié)目列表,將該表中的每一視頻節(jié)目在I1排序和I2排序中的ID編號轉(zhuǎn)換成所在VideoBag的編號和權(quán)重Weight,得到每個(gè)用戶的特征列表;由于觀看次數(shù)過少的樣本數(shù)據(jù)噪聲較大,故剔除觀看視頻節(jié)目次數(shù)少于k次的用戶樣本; 設(shè)得到U serNum個(gè)已知性別、所屬年齡段的用戶特征列表;將這U serNum個(gè)用戶特征列表分為兩部分,一部分用于訓(xùn)練,另一部分由于用戶測試;F.用戶性別分類模型訓(xùn)練步驟,它使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成步驟提供的一部分用戶特征列表,將其中男性用戶作為正樣本、女性用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特征表生成步驟提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為性別模型; G.用戶年齡段分類模型訓(xùn)練步驟,它使用支持向量機(jī)作為分類器,按照機(jī)器學(xué)習(xí)分類算法的常規(guī)方式進(jìn)行訓(xùn)練,訓(xùn)練數(shù)據(jù)來源為所述用戶特征表生成步驟提供的一部分用戶特征列表,將其中年齡屬于要求年齡段[min_age, max_age]的用戶作為正樣本、其他年齡段的用戶作為反樣本進(jìn)行訓(xùn)練,并以所述用戶特征表生成步驟提供的另一部分用戶特征列表為測試數(shù)據(jù)進(jìn)行測試,訓(xùn)練結(jié)果為支持向量機(jī)分類模型,選擇測試結(jié)果最優(yōu)的訓(xùn)練結(jié)果,命名該模型為年齡段模型; H.用戶性別與年齡段預(yù)測步驟,它對所述用戶數(shù)據(jù)采集步驟獲取的性別、年齡段未知 的用戶,依據(jù)其視頻節(jié)目觀看日志,使用所述性別模型預(yù)測其性別,使用所述年齡段模型預(yù)測其年齡段,得到對該用戶性別與年齡段的預(yù)測結(jié)果;基于預(yù)測結(jié)果,對該用戶賦予性別、年齡段標(biāo)簽; I.廣告投放步驟,它根據(jù)所述用戶性別與年齡段預(yù)測步驟給出的用戶性別、年齡段標(biāo)簽,以及所述用戶數(shù)據(jù)采集步驟收集的用戶性別、年齡信息,按照某廣告投放的目標(biāo)人群,向具有適合性別、年齡段的用戶投放該廣告。
4.根據(jù)權(quán)利要求3所述的基于VideoBag特征的精準(zhǔn)廣告投放方法,其特征是所述VideoBag打包步驟中,m取值為6000 ;所述用戶特征表生成步驟中,k取值為5 ;所述用戶特征表生成步驟和所述用戶性別分類模型訓(xùn)練步驟、所述用戶年齡段分類模型訓(xùn)練步驟中,用于訓(xùn)練的用戶特征列表為30% UserNum個(gè),其余70% UserNum個(gè)用于測試。
全文摘要
本發(fā)明屬于互聯(lián)網(wǎng)技術(shù)領(lǐng)域,特別涉及一種廣告投放系統(tǒng)及方法。其技術(shù)方案是一種基于VideoBag特征的精準(zhǔn)廣告投放系統(tǒng),包括以下模塊用戶數(shù)據(jù)采集模塊(1),視頻節(jié)目鑒別能力計(jì)算和排序模塊(2),VideoBag打包模塊(3),權(quán)重計(jì)算模塊(4),用戶特征表生成模塊(5),用戶性別分類模型訓(xùn)練模塊(6),用戶年齡段分類模型訓(xùn)練模塊(7),用戶性別與年齡段預(yù)測模塊(8),廣告投放模塊(9),它根據(jù)某廣告投放的目標(biāo)人群,向具有適合性別、年齡段標(biāo)簽的用戶投放該廣告。本發(fā)明直接利用用戶的觀看行為對目標(biāo)受眾進(jìn)行高精度的性別、年齡的分類,在較大程度上提升了廣告到達(dá)目標(biāo)受眾的精確度,從而有效地提升了廣告效果。
文檔編號G06K9/62GK102708497SQ20121000948
公開日2012年10月3日 申請日期2012年1月13日 優(yōu)先權(quán)日2012年1月13日
發(fā)明者嚴(yán)金龍, 盧學(xué)裕, 盧述奇, 姚鍵, 尹玉宗, 潘柏宇, 王曉龍 申請人:合一網(wǎng)絡(luò)技術(shù)(北京)有限公司