欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一個(gè)基于混合學(xué)習(xí)模型的DSP實(shí)時(shí)競價(jià)廣告系統(tǒng)的制作方法

文檔序號:11520540閱讀:322來源:國知局
一個(gè)基于混合學(xué)習(xí)模型的DSP實(shí)時(shí)競價(jià)廣告系統(tǒng)的制造方法與工藝

本發(fā)明屬于一種基于混合學(xué)習(xí)模型的dsp實(shí)時(shí)競價(jià)廣告系統(tǒng),屬于計(jì)算機(jī)領(lǐng)域。



背景技術(shù):

廣告主對于移動(dòng)程序化購買的需求也在不斷加強(qiáng),推動(dòng)了移動(dòng)程序化購買市場的整體發(fā)展。程序化購買是開發(fā)者進(jìn)行流量變現(xiàn)的重要渠道之一,開發(fā)者對于庫存資源的開放意愿提高,部分明星應(yīng)用heroapp積極將資源轉(zhuǎn)向程序化購買,從而推動(dòng)了市場規(guī)模,dsp為廣告主提供一個(gè)綜合性的操作平臺,廣告主可以通過一個(gè)平臺管理多個(gè)渠道的流量來源,避免復(fù)雜的媒體購買方式帶來的資源浪費(fèi)。dsp利用rtb可以從廣告交易平臺中實(shí)時(shí)的按需購買廣告。并以受眾為中心的購買模式

現(xiàn)有rtb競價(jià)主要從以下幾個(gè)因素進(jìn)行決策:

1.受眾定向投放技術(shù)

客戶根據(jù)受眾的人口統(tǒng)計(jì)學(xué)特征和興趣愛好采買受眾,包括地理位置、年齡、性別、職業(yè)/行業(yè)、收入狀態(tài)、婚姻狀態(tài)、教育程度和興趣愛好從adexchange的流量中來采買受眾;

2.反作弊技術(shù)

根據(jù)當(dāng)前用戶訪問頁面內(nèi)容相關(guān)性,和廣告進(jìn)行匹配,做出投放;

3.流量質(zhì)量評估

分析流量請求的低價(jià)的分布情況,即請求廣告位的價(jià)格的概率分布。

4.ctr預(yù)估

通過采集的投放數(shù)據(jù)培訓(xùn)ctr預(yù)估的模型來預(yù)測廣告的點(diǎn)擊率;

5.在線機(jī)器學(xué)習(xí)(onlinelearning)

不需要維護(hù)一個(gè)固定的訓(xùn)練集,每次新數(shù)據(jù)來,學(xué)習(xí)更新模型,然后繼續(xù)接收新數(shù)據(jù),繼續(xù)更新模型。不必要一定有訓(xùn)練的過程,可以一邊預(yù)測的同時(shí)一邊訓(xùn)練;

6.離線機(jī)器學(xué)習(xí)(batchlearning)

一次性批量輸入給學(xué)習(xí)算法.先用訓(xùn)練集進(jìn)行訓(xùn)練,然后才進(jìn)行預(yù)測,這種方式訓(xùn)練的模型上線后,更新的周期會(huì)比較長(一般是一天,效率高的時(shí)候?yàn)橐恍r(shí)),這種模型上線后,一般是靜態(tài)的(一段時(shí)間內(nèi)不會(huì)改變),不會(huì)與線上的狀況有任何互動(dòng),假設(shè)預(yù)測錯(cuò)了,只能在下一次更新的時(shí)候完成更正。

針對廣告出價(jià)流程,以模塊為單位,進(jìn)行描述:

(一)出價(jià)模塊

1.出價(jià)請求反作弊處理;

判斷請求的流量是否為作弊流量或者是歷史投放證明的低價(jià)值請求;

如果請求為作弊請求或者為低價(jià)值的請求,則放棄此次競價(jià),否則到第2步;

2.廣告過濾

1)廣告加載;

根據(jù)廣告位信息加載可投放的廣告;

2)廣告過濾

判斷請求的信息是否滿足廣告設(shè)置的定投條件,包括是否為定投的設(shè)備信息、定投的應(yīng)用,定投的應(yīng)用類型、是否在應(yīng)用黑名單中。

設(shè)備信息:機(jī)型、品牌、制造商、設(shè)備類型、網(wǎng)絡(luò)類型、運(yùn)營商、操作系統(tǒng)版本;

3.受眾判別

根據(jù)出價(jià)請求或者用戶的標(biāo)識,通過表示加載用戶的人口統(tǒng)計(jì)學(xué)信息和興趣愛好的標(biāo)簽;輪詢廣告,判斷用戶是否為廣告定向的受眾,如果是,在加入到候選列表,如果不是,在繼續(xù)輪詢知道遍歷所有可投放的廣告;

4.ctr預(yù)測

通過出價(jià)的信息和廣告信息,使用基于歷史數(shù)據(jù)通過機(jī)器學(xué)習(xí)培訓(xùn)的ctr預(yù)測模型,預(yù)測所有廣告在請求上下文的約束下的各自的點(diǎn)擊率ctr;

5.根據(jù)3計(jì)算的廣告點(diǎn)擊率計(jì)算所有廣告投放的roe

6.根據(jù)計(jì)算的roe來對候選的廣告進(jìn)行排序;

7.在5中根據(jù)roe排序的廣告中選取roe最高的廣告,將選擇的廣告和出價(jià)借個(gè)返回給adx;

(二)模型培訓(xùn)模塊

1.采集競價(jià)請求的數(shù)據(jù),包括競價(jià)數(shù)據(jù)、贏價(jià)數(shù)據(jù)、展示數(shù)據(jù),監(jiān)測數(shù)據(jù);

2.對數(shù)據(jù)進(jìn)行預(yù)處理,包括處理異常處理和數(shù)據(jù)轉(zhuǎn)換,使之對培訓(xùn)模型更加友好;

3.使用處理后的批量數(shù)據(jù)通過機(jī)器學(xué)習(xí)算法來訓(xùn)練離線的模型,得到可信的模型后提供給出價(jià)引擎來預(yù)測廣告的ctr。

現(xiàn)在基于rtb競價(jià)的dsp在廣告投放的關(guān)鍵的ctr預(yù)測的模型使用上缺少足夠多的靈活性,很多都是基于歷史數(shù)據(jù)通過離線的機(jī)器學(xué)習(xí)技術(shù)來訓(xùn)練ctr預(yù)估的模型,對于一個(gè)新的dsp或者對于新對接的adx,缺少歷史數(shù)據(jù)來訓(xùn)練模型,在這種情況下,使用離線歷史數(shù)據(jù)來培訓(xùn)模型顯示不顯示,這就需要考慮使用在線的機(jī)器學(xué)習(xí)方式來培訓(xùn)ctr預(yù)測模型,比如在線學(xué)習(xí)的機(jī)器學(xué)習(xí)方式,可以變預(yù)測變訓(xùn)練,當(dāng)前對模型的使用和算法缺少靈活性。



技術(shù)實(shí)現(xiàn)要素:

本發(fā)明所要解決的技術(shù)問題是提供一種基于混合學(xué)習(xí)模型的dsp實(shí)時(shí)競價(jià)廣告系統(tǒng),用于解決現(xiàn)有技術(shù)存在的問題。

本發(fā)明解決上述技術(shù)問題所采取的技術(shù)方案如下:

一種基于混合學(xué)習(xí)模型的dsp實(shí)時(shí)競價(jià)廣告系統(tǒng),包括:rtb廣告出價(jià)引擎模塊、離線模型訓(xùn)練模塊和在線模型訓(xùn)練模塊;

其中,所述rtb廣告出價(jià)引擎模塊用于連接所述離線模型訓(xùn)練模塊和在線模型訓(xùn)練模塊,并結(jié)合兩者或者之一生成的ctr模型,調(diào)用其ctr預(yù)測引擎進(jìn)行預(yù)測相應(yīng)廣告的ctr值,進(jìn)行相應(yīng)的廣告投放。

優(yōu)選的是,所述離線模塊訓(xùn)練模塊,包括:

離線采集數(shù)據(jù)單元,用于采集競價(jià)請求的數(shù)據(jù),包括競價(jià)數(shù)據(jù)、贏價(jià)數(shù)據(jù)、展示數(shù)據(jù),監(jiān)測數(shù)據(jù);

離線數(shù)據(jù)預(yù)處理單元,用于對數(shù)據(jù)進(jìn)行預(yù)處理,包括處理異常處理和數(shù)據(jù)轉(zhuǎn)換,使之對培訓(xùn)模型更加友好;

離線訓(xùn)練單元,用于使用處理后的批量數(shù)據(jù)通過機(jī)器學(xué)習(xí)算法來訓(xùn)練離線的模型,得到可信的模型后提供給所述rtb廣告出價(jià)引擎模塊以預(yù)測廣告的ctr。

優(yōu)選的是,所述在線數(shù)據(jù)訓(xùn)練模塊,包括:

在線采集數(shù)據(jù)單元,用于接收競價(jià)請求后續(xù)的投放廣告的贏價(jià)、展示和點(diǎn)擊的數(shù)據(jù);

在線數(shù)據(jù)預(yù)處理單元,用于將數(shù)據(jù)預(yù)測成預(yù)測模型可接受的數(shù)據(jù);

在線訓(xùn)練單元,用于將數(shù)據(jù)給在線機(jī)器學(xué)習(xí)的訓(xùn)練模型,生成新的模型,并同步更新引擎中的ctr預(yù)估模型。

優(yōu)選的是,所述rtb廣告出價(jià)引擎模塊,具體包括:

廣告加載單元,用于根據(jù)廣告位信息加載可投放的廣告;

廣告過濾單元,用于判斷請求的信息是否滿足廣告設(shè)置的定投條件,包括是否為定投的設(shè)備信息、定投的應(yīng)用,定投的應(yīng)用類型、是否在應(yīng)用黑名單中,其中,設(shè)備信息:機(jī)型、品牌、制造商、設(shè)備類型、網(wǎng)絡(luò)類型、運(yùn)營商、操作系統(tǒng)版本;

反作弊處理單元,包括:判斷請求的流量是否為作弊流量或者是歷史投放證明的低價(jià)值請求,如果請求為作弊請求或者為低價(jià)值的請求,則放棄此次競價(jià)。

優(yōu)選的是,還包括:

受眾判別單元,用于根據(jù)出價(jià)請求或者用戶的標(biāo)識,通過表示加載用戶的人口統(tǒng)計(jì)學(xué)信息和興趣愛好的標(biāo)簽;輪詢廣告,判斷用戶是否為廣告定向的受眾,如果是,在加入到候選列表,如果不是,在繼續(xù)輪詢知道遍歷所有可投放的廣告。

優(yōu)選的是,加載模型單元,用于根據(jù)請求來源的adx,加載設(shè)置的ctr預(yù)測的模型;

判別模型策略是離線還是在線,如果在線,使用的算法;如果離線,判別模型使用的算法;

crt預(yù)估單元,用于當(dāng)使用的為離線生成的ctr模型,在根據(jù)請求的上下文、請求的用戶信息和廣告來調(diào)用ctr預(yù)估模型來計(jì)算廣告的點(diǎn)擊率;

使用的為在線生成的ctr模型,則根據(jù)請求的上下文、請求的用戶信息和廣告來調(diào)用ctr預(yù)估模型來計(jì)算廣告的點(diǎn)擊率,并使用數(shù)據(jù)調(diào)用在線機(jī)器學(xué)習(xí)模塊來在線更新模型,并獲取新的模型;

排序單元,用于根據(jù)計(jì)算的roe來對候選的廣告進(jìn)行排序;

廣告選擇單元,用于根據(jù)roe排序的廣告中選取roe最高的廣告,將選擇的廣告和出價(jià)借個(gè)返回給adx。

優(yōu)選的是,所述rtb廣告出價(jià)引擎模塊,還包括:

統(tǒng)計(jì)單元,用于統(tǒng)計(jì)廣告展示、點(diǎn)擊監(jiān)測上報(bào)的數(shù)據(jù)來統(tǒng)計(jì)廣告的投放效果,展示數(shù)、點(diǎn)擊數(shù)、ctr。

優(yōu)選的是,還包括:

ctr預(yù)測模型訓(xùn)練模塊,用于選擇已經(jīng)有歷史投放數(shù)據(jù)的adexchange,同步離線的批量數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)的訓(xùn)練;

或者,在線學(xué)習(xí)的ftrl模型,然后更新競價(jià)系統(tǒng)模型,給下一個(gè)競價(jià)請求來使用。

本發(fā)明的其它特征和優(yōu)點(diǎn)將在隨后的說明書中闡述,并且,部分地從說明書中變得顯而易見,或者通過實(shí)施本發(fā)明而了解。本發(fā)明的目的和其他優(yōu)點(diǎn)可通過在所寫的說明書、權(quán)利要求書、以及附圖中所特別指出的結(jié)構(gòu)來實(shí)現(xiàn)和獲得。

附圖說明

下面結(jié)合附圖對本發(fā)明進(jìn)行詳細(xì)的描述,以使得本發(fā)明的上述優(yōu)點(diǎn)更加明確。其中,

圖1是現(xiàn)有技術(shù)的示意圖;

圖2是本發(fā)明的系統(tǒng)的示意圖;

圖3是本發(fā)明的系統(tǒng)的部分工作原理示意圖;

圖4是本發(fā)明系統(tǒng)的部分工作原理示意圖。

具體實(shí)施方式

以下將結(jié)合附圖及實(shí)施例來詳細(xì)說明本發(fā)明的實(shí)施方式,借此對本發(fā)明如何應(yīng)用技術(shù)手段來解決技術(shù)問題,并達(dá)成技術(shù)效果的實(shí)現(xiàn)過程能充分理解并據(jù)以實(shí)施。需要說明的是,只要不構(gòu)成沖突,本發(fā)明中的各個(gè)實(shí)施例以及各實(shí)施例中的各個(gè)特征可以相互結(jié)合,所形成的技術(shù)方案均在本發(fā)明的保護(hù)范圍之內(nèi)。

另外,在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。

cpm:按廣告每千次被展現(xiàn),成為一個(gè)cpm;

rtb:實(shí)時(shí)競價(jià)

ctr:點(diǎn)擊轉(zhuǎn)化率

adx:廣告交易市場

dsp:廣告需求方平臺

roe:投資回報(bào)率

gbdt:隨機(jī)梯度下降樹

lr:邏輯回歸算法

libfm:因子機(jī)

rf:隨機(jī)森林

ftrl:followtheregularizedleader

對于一個(gè)競價(jià)的dsp系統(tǒng),需要綜合考慮歷史和未來的流量去兼顧兩者的ctr的預(yù)估。即根據(jù)實(shí)際的情況靈活的配置算法的訓(xùn)練方式,并能有一套模型選擇的系統(tǒng)

如圖2所示,一種基于混合學(xué)習(xí)模型的dsp實(shí)時(shí)競價(jià)廣告系統(tǒng),包括:rtb廣告出價(jià)引擎模塊、離線模型訓(xùn)練模塊和在線模型訓(xùn)練模塊;

其中,所述rtb廣告出價(jià)引擎模塊用于連接所述離線模型訓(xùn)練模塊和在線模型訓(xùn)練模塊,并結(jié)合兩者或者之一生成的ctr模型,調(diào)用其ctr預(yù)測引擎進(jìn)行預(yù)測相應(yīng)廣告的ctr值,進(jìn)行相應(yīng)的廣告投放。

優(yōu)選的是,所述離線模塊訓(xùn)練模塊,包括:

離線采集數(shù)據(jù)單元,用于采集競價(jià)請求的數(shù)據(jù),包括競價(jià)數(shù)據(jù)、贏價(jià)數(shù)據(jù)、展示數(shù)據(jù),監(jiān)測數(shù)據(jù);

離線數(shù)據(jù)預(yù)處理單元,用于對數(shù)據(jù)進(jìn)行預(yù)處理,包括處理異常處理和數(shù)據(jù)轉(zhuǎn)換,使之對培訓(xùn)模型更加友好;

離線訓(xùn)練單元,用于使用處理后的批量數(shù)據(jù)通過機(jī)器學(xué)習(xí)算法來訓(xùn)練離線的模型,得到可信的模型后提供給所述rtb廣告出價(jià)引擎模塊以預(yù)測廣告的ctr。

優(yōu)選的是,所述在線數(shù)據(jù)訓(xùn)練模塊,包括:

在線采集數(shù)據(jù)單元,用于接收競價(jià)請求后續(xù)的投放廣告的贏價(jià)、展示和點(diǎn)擊的數(shù)據(jù);

在線數(shù)據(jù)預(yù)處理單元,用于將數(shù)據(jù)預(yù)測成預(yù)測模型可接受的數(shù)據(jù);

在線訓(xùn)練單元,用于將數(shù)據(jù)給在線機(jī)器學(xué)習(xí)的訓(xùn)練模型,生成新的模型,并同步更新引擎中的ctr預(yù)估模型。

優(yōu)選的是,所述rtb廣告出價(jià)引擎模塊,具體包括:

廣告加載單元,用于根據(jù)廣告位信息加載可投放的廣告;

廣告過濾單元,用于判斷請求的信息是否滿足廣告設(shè)置的定投條件,包括是否為定投的設(shè)備信息、定投的應(yīng)用,定投的應(yīng)用類型、是否在應(yīng)用黑名單中,其中,設(shè)備信息:機(jī)型、品牌、制造商、設(shè)備類型、網(wǎng)絡(luò)類型、運(yùn)營商、操作系統(tǒng)版本;

反作弊處理單元,包括:判斷請求的流量是否為作弊流量或者是歷史投放證明的低價(jià)值請求,如果請求為作弊請求或者為低價(jià)值的請求,則放棄此次競價(jià)。

優(yōu)選的是,還包括:

受眾判別單元,用于根據(jù)出價(jià)請求或者用戶的標(biāo)識,通過表示加載用戶的人口統(tǒng)計(jì)學(xué)信息和興趣愛好的標(biāo)簽;輪詢廣告,判斷用戶是否為廣告定向的受眾,如果是,在加入到候選列表,如果不是,在繼續(xù)輪詢知道遍歷所有可投放的廣告。

優(yōu)選的是,加載模型單元,用于根據(jù)請求來源的adx,加載設(shè)置的ctr預(yù)測的模型;

判別模型策略是離線還是在線,如果在線,使用的算法;如果離線,判別模型使用的算法;

crt預(yù)估單元,用于當(dāng)使用的為離線生成的ctr模型,在根據(jù)請求的上下文、請求的用戶信息和廣告來調(diào)用ctr預(yù)估模型來計(jì)算廣告的點(diǎn)擊率;

使用的為在線生成的ctr模型,則根據(jù)請求的上下文、請求的用戶信息和廣告來調(diào)用ctr預(yù)估模型來計(jì)算廣告的點(diǎn)擊率,并使用數(shù)據(jù)調(diào)用在線機(jī)器學(xué)習(xí)模塊來在線更新模型,并獲取新的模型;

排序單元,用于根據(jù)計(jì)算的roe來對候選的廣告進(jìn)行排序;

廣告選擇單元,用于根據(jù)roe排序的廣告中選取roe最高的廣告,將選擇的廣告和出價(jià)借個(gè)返回給adx。

優(yōu)選的是,所述rtb廣告出價(jià)引擎模塊,還包括:

統(tǒng)計(jì)單元,用于統(tǒng)計(jì)廣告展示、點(diǎn)擊監(jiān)測上報(bào)的數(shù)據(jù)來統(tǒng)計(jì)廣告的投放效果,展示數(shù)、點(diǎn)擊數(shù)、ctr。

優(yōu)選的是,還包括:

ctr預(yù)測模型訓(xùn)練模塊,用于選擇已經(jīng)有歷史投放數(shù)據(jù)的adexchange,同步離線的批量數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)的訓(xùn)練;

或者,在線學(xué)習(xí)的ftrl模型,然后更新競價(jià)系統(tǒng)模型,給下一個(gè)競價(jià)請求來使用。

技術(shù)實(shí)現(xiàn)原理,如下:

第一步:針對不同的adx配置不同的使用不同的機(jī)器學(xué)習(xí)訓(xùn)練方式生成的算法,如果一個(gè)adx有相關(guān)的歷史數(shù)據(jù),并且已經(jīng)通過離線的機(jī)器學(xué)習(xí)過程配訓(xùn)過ctr出價(jià)的算法,并且算法的可信度在設(shè)置的置信區(qū)間,則配置使用離線數(shù)據(jù)訓(xùn)練生成的ctr預(yù)測算法;如果為新對接的adx,當(dāng)前沒有可以使用的通過離線數(shù)據(jù)批量訓(xùn)練的ctr預(yù)測算法可以用,則配置此adx使用在線的機(jī)器學(xué)習(xí)算法。

第二步:一個(gè)adx的發(fā)送一個(gè)廣告的競價(jià)請求,首先對流量做作弊監(jiān)測,如果是作弊流量做放棄出價(jià);對于非作弊請求,先加載廣告,根據(jù)請求的上下問和廣告設(shè)置要求的上下文的設(shè)置來過濾廣告,選擇可繼續(xù)投放的廣告,先根據(jù)請求里面的用戶id來獲取用戶的人口統(tǒng)計(jì)學(xué)信息和標(biāo)簽,如果不是廣告選擇受眾,則廣告不對請求出價(jià),否則,則通過請求和廣告來進(jìn)行ctr預(yù)測

第三步:根據(jù)請求來源來判斷請求來自于那個(gè)adx。獲取使用的ctr預(yù)估的模型,如果使用離線批量數(shù)據(jù)培訓(xùn)生成的ctr模型,則調(diào)用其ctr預(yù)測引擎進(jìn)行預(yù)測,如果配置的是在線機(jī)器學(xué)習(xí)模型,這將參數(shù)傳遞給在線機(jī)器學(xué)習(xí)ctr模型,獲取預(yù)測值,同時(shí)更新模型參數(shù)

對于離線模型的更新,隨時(shí)數(shù)據(jù)不但增長,安時(shí)間間隔更新模型,是模型更加準(zhǔn)確。

當(dāng)用戶請求訪問時(shí),分析其訪問行為,其行為包括如下:請求廣告、統(tǒng)計(jì)展示廣告、統(tǒng)計(jì)點(diǎn)擊廣告;針對不同行為,走不同處理流程。請求廣告時(shí),為用戶在合適時(shí)間選取一個(gè)合適廣告,展示到用戶面前,便于滿足用戶當(dāng)時(shí)需求或興趣,提高用戶體驗(yàn),減少用戶信息檢索成本。針對統(tǒng)計(jì)效果,根據(jù)實(shí)際效果,做動(dòng)態(tài)調(diào)整和優(yōu)化。

(一)rtb廣告出價(jià)引擎模塊

1.出價(jià)請求反作弊處理

判斷請求的流量是否為作弊流量或者是歷史投放證明的低價(jià)值請求;

如果請求為作弊請求或者為低價(jià)值的請求,則放棄此次競價(jià),否則到第2步;

2.廣告過濾

3)廣告加載

根據(jù)廣告位信息加載可投放的廣告;

4)廣告過濾

判斷請求的信息是否滿足廣告設(shè)置的定投條件,包括是否為定投的設(shè)備信息、定投的應(yīng)用,定投的應(yīng)用類型、是否在應(yīng)用黑名單中。

設(shè)備信息:機(jī)型、品牌、制造商、設(shè)備類型、網(wǎng)絡(luò)類型、運(yùn)營商、操作系統(tǒng)版本;

3.受眾判別

根據(jù)出價(jià)請求或者用戶的標(biāo)識,通過表示加載用戶的人口統(tǒng)計(jì)學(xué)信息和興趣愛好的標(biāo)簽;輪詢廣告,判斷用戶是否為廣告定向的受眾,如果是,在加入到候選列表,如果不是,在繼續(xù)輪詢知道遍歷所有可投放的廣告;

4.加載使用的模型

根據(jù)請求來源的adx,加載設(shè)置的ctr預(yù)測的模型;

5.判別使用的模型

判別模型策略是離線還是在線,如果在線,使用的算法(ftrl);如果離線,判別模型使用的算法(gbdt+lr,rf+lr,gbdt+libfm、rf+libfm);

6.crt預(yù)估

6.1步驟5)選擇的ctr預(yù)估使用的為離線生成的ctr模型,在根據(jù)請求的上下文、請求的用戶信息和廣告來調(diào)用ctr預(yù)估模型來計(jì)算廣告的點(diǎn)擊率

6.2步驟5)選擇的ctr預(yù)估使用的為在線生成的ctr模型,在根據(jù)請求的上下文、請求的用戶信息和廣告來調(diào)用ctr預(yù)估模型來計(jì)算廣告的點(diǎn)擊率,并使用數(shù)據(jù)調(diào)用在線機(jī)器學(xué)習(xí)模塊來在線更新模型,并獲取新的模型;

7.根據(jù)計(jì)算的roe來對候選的廣告進(jìn)行排序

8.在5中根據(jù)roe排序的廣告中選取roe最高的廣告,將選擇的廣告和出價(jià)借個(gè)返回給adx;

(二)離線模型培訓(xùn)模塊

1.采集競價(jià)請求的數(shù)據(jù),包括競價(jià)數(shù)據(jù)、贏價(jià)數(shù)據(jù)、展示數(shù)據(jù),監(jiān)測數(shù)據(jù)

2.對數(shù)據(jù)進(jìn)行預(yù)處理,包括處理異常處理和數(shù)據(jù)轉(zhuǎn)換,使之對培訓(xùn)模型更加友好;

3.使用處理后的批量數(shù)據(jù)通過機(jī)器學(xué)習(xí)算法來訓(xùn)練離線的模型,得到可信的模型后提供給出價(jià)引擎來預(yù)測廣告的ctr。

(三)在線數(shù)據(jù)訓(xùn)練模塊

1.接收競價(jià)請求后續(xù)的投放廣告的贏價(jià)、展示和點(diǎn)擊的數(shù)據(jù)

2.將數(shù)據(jù)預(yù)測成預(yù)測模型可接受的數(shù)據(jù)

3.將數(shù)據(jù)給在線機(jī)器學(xué)習(xí)的訓(xùn)練模型,生成新的模型,并同步更新引擎中的ctr預(yù)估模型

其中,系統(tǒng)預(yù)先根據(jù)adexchange的情況來配置通過批量學(xué)習(xí)訓(xùn)練的ctr預(yù)測的模型

1)模型訓(xùn)練

a)機(jī)器學(xué)習(xí)方式的選擇

選擇已經(jīng)有歷史投放數(shù)據(jù)的adexchange,同步離線的批量數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)的訓(xùn)練

b)數(shù)據(jù)預(yù)處理

從log文件中加載歷史數(shù)據(jù),對數(shù)據(jù)進(jìn)行清洗和采樣

c)使用采樣的批量數(shù)據(jù)來選擇ctr預(yù)測的模型

模型訓(xùn)練和選擇:使用gbdt+lr、rf+lr、gbdt+libfm、rf+libfm做候選算法,以上算法經(jīng)過培訓(xùn)后,在測試數(shù)據(jù)上測試,使用logloss作為評估指標(biāo),選擇logloss最小的算法作為ctr預(yù)測算法,最終選擇gbdt+lr作為對選定的adexchange的ctr預(yù)測的算法

2)模型配置

為選擇的adexchange配置使用的模型為在離線批量數(shù)據(jù)選擇的ctr預(yù)測模型gbdt+lr

3)廣告發(fā)布

針對選擇的adexchange發(fā)布多條廣告來為rtb出價(jià),設(shè)置廣告的受眾(區(qū)域、性別、年齡、婚姻狀況、職業(yè)、興趣愛好)和對請求上下文的要求(媒介類型、設(shè)備信息)

4)廣告競價(jià)

a)出價(jià)請求反作弊處理

判斷請求的流量是否為作弊流量(來自于黑名單的app等等)或者是歷史投放證明的低價(jià)值請求(ctr低于設(shè)置的閥值)

如果請求為作弊請求或者為低價(jià)值的請求,則放棄此次競價(jià),否則到第b)步

b)廣告加載

根據(jù)廣告位信息加載可投放的廣告

c)廣告過濾

判斷請求的信息是否滿足廣告設(shè)置的定投條件,包括是否為定投的設(shè)備信息、定投的應(yīng)用,定投的應(yīng)用類型、是否在應(yīng)用黑名單中。

設(shè)備信息:機(jī)型、品牌、制造商、設(shè)備類型、網(wǎng)絡(luò)類型、運(yùn)營商、操作系統(tǒng)版本

d)受眾判別

根據(jù)出價(jià)請求或者用戶的標(biāo)識,通過表示加載用戶的人口統(tǒng)計(jì)學(xué)信息和興趣愛好的標(biāo)簽;輪詢廣告,判斷用戶是否為廣告定向的受眾,如果是,在加入到候選列表,如果不是,在繼續(xù)輪詢知道遍歷所有可投放的廣告

e)加載使用的模型

根據(jù)請求來源的adeexchange,加載設(shè)置的ctr預(yù)測的模型

f)判別使用的模型

判別模型策略為離線批量數(shù)據(jù)所訓(xùn)練的gbdt+lr模型算法,使用次算法在下一步進(jìn)行ctr的預(yù)測

g)crt預(yù)估

在根據(jù)請求的上下文、請求的用戶信息和廣告來調(diào)用gbdt+lr模型來計(jì)算廣告的點(diǎn)擊率

h)根據(jù)計(jì)算的roe來對候選的廣告進(jìn)行排序

在h)中根據(jù)roe排序的廣告中選取roe最高的廣告,將選擇的廣告和出價(jià)借個(gè)返回給adx

5)效果反饋

統(tǒng)計(jì)廣告展示、點(diǎn)擊監(jiān)測上報(bào)的數(shù)據(jù)來統(tǒng)計(jì)廣告的投放效果,展示數(shù)、點(diǎn)擊數(shù)、ctr(廣告的點(diǎn)擊率)

需要說明的是,對于上述方法實(shí)施例而言,為了簡單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本申請并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本申請,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作和模塊并不一定是本申請所必須的。

本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本申請的實(shí)施例可提供為方法、系統(tǒng)、或計(jì)算機(jī)程序產(chǎn)品。因此,本申請可采用完全硬件實(shí)施例、完全軟件實(shí)施例、或結(jié)合軟件和硬件方面的實(shí)施例的形式。

而且,本申請可采用在一個(gè)或多個(gè)其中包含有計(jì)算機(jī)可用程序代碼的計(jì)算機(jī)可用存儲介質(zhì)(包括但不限于磁盤存儲器、cd-rom、光學(xué)存儲器等)上實(shí)施的計(jì)算機(jī)程序產(chǎn)品的形式。

最后應(yīng)說明的是:以上所述僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,盡管參照前述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,對于本領(lǐng)域的技術(shù)人員來說,其依然可以對前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
景谷| 运城市| 仙游县| 洛扎县| 龙岩市| 敖汉旗| 岑巩县| 获嘉县| 德格县| 绿春县| 得荣县| 扎兰屯市| 稷山县| 武鸣县| 星子县| 祥云县| 和顺县| 富源县| 钦州市| 钟山县| 安化县| 廉江市| 高邮市| 卢氏县| 佛山市| 五河县| 塔河县| 清河县| 遂平县| 依安县| 波密县| 亳州市| 葵青区| 芦溪县| 罗山县| 浙江省| 麟游县| 泗洪县| 旬阳县| 西乌珠穆沁旗| 宕昌县|