一種點(diǎn)擊到達(dá)率ctr的確定方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及互聯(lián)網(wǎng)技術(shù)領(lǐng)域,具體涉及一種點(diǎn)擊到達(dá)率CTR的確定方法及裝置。
【背景技術(shù)】
[0002] 在互聯(lián)網(wǎng)技術(shù)領(lǐng)域,互聯(lián)網(wǎng)產(chǎn)品的推廣方可以利用應(yīng)用墻等推廣資源為應(yīng)用的開 發(fā)方推廣應(yīng)用,即互聯(lián)網(wǎng)產(chǎn)品的推廣方會(huì)根據(jù)用戶的當(dāng)前操作場(chǎng)景以及確定出的應(yīng)用的點(diǎn) 擊到達(dá)率(CTR,ClickThroughRate)為用戶推薦CTR較高的一個(gè)或多個(gè)優(yōu)質(zhì)應(yīng)用??梢姡?快速確定出應(yīng)用的CTR在應(yīng)用的推廣方面顯得尤為重要。
[0003] 當(dāng)前,常見的CTR確定方法為基于統(tǒng)計(jì)的確定方法,即假設(shè)應(yīng)用在相同操作場(chǎng)景 下的CTR相同,從根據(jù)歷史樣本數(shù)據(jù)統(tǒng)計(jì)出應(yīng)用在不同操作場(chǎng)景下的CTR中查找與當(dāng)前操 作場(chǎng)景相同或相似的操作場(chǎng)景下的CTR,以作為應(yīng)用在當(dāng)前操作場(chǎng)景下的CTR。但是,由于 操作場(chǎng)景由多個(gè)特征維度構(gòu)成,該基于統(tǒng)計(jì)的確定方法依賴于大量的歷史樣本數(shù)據(jù),且在 查找與當(dāng)前操作場(chǎng)景相同或相似的操作場(chǎng)景時(shí)需要考慮到多個(gè)特征維度,無(wú)法快速的確定 出應(yīng)用的CTR且資源消耗大。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實(shí)施例公開了一種點(diǎn)擊到達(dá)率CTR的確定方法及裝置,能夠快速的確定出 應(yīng)用的CTR且資源消耗小。
[0005] 本發(fā)明實(shí)施例第一方面公開了一種點(diǎn)擊到達(dá)率CTR的確定方法,所述方法包括:
[0006] 在檢測(cè)到針對(duì)應(yīng)用的顯示請(qǐng)求時(shí),確定每個(gè)應(yīng)用的特征值序列,所述特征值序列 由用于描述應(yīng)用信息的應(yīng)用特征值序列、用于描述用戶信息的用戶特征值序列以及流量特 征值序列組成;
[0007] 分別將每個(gè)所述特征值序列作為預(yù)先設(shè)置的CTR計(jì)算算法的輸入,獲取與每個(gè)所 述特征值序列對(duì)應(yīng)的所述CTR計(jì)算算法的輸出;
[0008] 將每個(gè)所述特征值序列對(duì)應(yīng)的所述CTR計(jì)算算法的輸出確定為該特征值序列對(duì) 應(yīng)應(yīng)用的CTR。
[0009] 在本發(fā)明實(shí)施例第一方面的第一種可能的實(shí)現(xiàn)方式中,所述CTR計(jì)算算法為基于 邏輯回歸模型的算法,且所述基于邏輯回歸模型的算法的計(jì)算公式為:
[0010]
[0011] 其中,所述yCTR為所述計(jì)算公式的輸出,所述f.為所述計(jì)算公式的輸入,所述為 預(yù)先計(jì)算出的所述計(jì)算公式的系數(shù)。
[0012] 結(jié)合本發(fā)明實(shí)施例第一方面的第一種可能的實(shí)現(xiàn)方式,在本發(fā)明實(shí)施例第一方面 的第二種可能的實(shí)現(xiàn)方式中,所述在檢測(cè)到針對(duì)應(yīng)用的顯示請(qǐng)求時(shí),確定每個(gè)應(yīng)用的特征 值序列之前,所述方法還包括:
[0013] 從預(yù)先存儲(chǔ)的樣本數(shù)據(jù)中讀取第一數(shù)量的第一樣本數(shù)據(jù),所述樣本數(shù)據(jù)由特征值 序列、用于標(biāo)識(shí)該樣本數(shù)據(jù)是否被展現(xiàn)的展現(xiàn)標(biāo)識(shí)以及用于標(biāo)識(shí)該樣本數(shù)據(jù)是否被點(diǎn)擊的 點(diǎn)擊標(biāo)識(shí)組成;
[0014] 歸并所述第一數(shù)量的第一樣本數(shù)據(jù)中特征值序列相同的第一樣本數(shù)據(jù),以獲取第 二數(shù)量的第二樣本數(shù)據(jù),所述第二樣本數(shù)據(jù)由形成該第二樣本數(shù)據(jù)的第一樣本數(shù)據(jù)的特征 值序列、形成該第二樣本數(shù)據(jù)的第一樣本數(shù)據(jù)的展現(xiàn)標(biāo)識(shí)之和以及形成該第二樣本數(shù)據(jù)的 第一樣本數(shù)據(jù)的點(diǎn)擊標(biāo)識(shí)之和組成;
[0015] 將每個(gè)所述第二樣本數(shù)據(jù)表達(dá)成似然表達(dá)式,并將所有所述似然表達(dá)式相乘以獲 取乘積似然表達(dá)式;
[0016] 通過牛頓迭代法以及初始迭代參數(shù)進(jìn)行目標(biāo)次數(shù)次的迭代,計(jì)算出所述乘積似然 表達(dá)式取最大值時(shí)所述乘積似然表達(dá)式中未知參數(shù)的值,并將所述未知參數(shù)的值確定為所 、I、..-* 還談 <3:
[0017] 結(jié)合本發(fā)明實(shí)施例第一方面的第一種可能的實(shí)現(xiàn)方式,在本發(fā)明實(shí)施例第一方面 的第三種可能的實(shí)現(xiàn)方式中,所述在檢測(cè)到針對(duì)應(yīng)用的顯示請(qǐng)求時(shí),確定每個(gè)應(yīng)用的特征 值序列之前,所述方法還包括:
[0018] 從預(yù)先存儲(chǔ)的樣本數(shù)據(jù)中讀取第一數(shù)量的第一樣本數(shù)據(jù),所述第一樣本數(shù)據(jù)由特 征值序列、用于標(biāo)識(shí)該樣本數(shù)據(jù)是否被展現(xiàn)的展現(xiàn)標(biāo)識(shí)以及用于標(biāo)識(shí)該樣本數(shù)據(jù)是否被點(diǎn) 擊的點(diǎn)擊標(biāo)識(shí)組成;
[0019] 歸并所述第一數(shù)量的第一樣本數(shù)據(jù)中特征值序列相同的第一樣本數(shù)據(jù),以獲取第 二數(shù)量的第二樣本數(shù)據(jù),所述第二樣本數(shù)據(jù)由形成該第二樣本數(shù)據(jù)的第一樣本數(shù)據(jù)的特征 值序列、形成該第二樣本數(shù)據(jù)的第一樣本數(shù)據(jù)的展現(xiàn)標(biāo)識(shí)之和以及形成該第二樣本數(shù)據(jù)的 第一樣本數(shù)據(jù)的點(diǎn)擊標(biāo)識(shí)之和組成;
[0020] 將所述第二數(shù)量的第二樣本數(shù)據(jù)均分成每份包括第三數(shù)量的第二樣本數(shù)據(jù)的樣 本組;
[0021] 分別將每個(gè)所述樣本組包括的每個(gè)第二樣本數(shù)據(jù)表達(dá)成似然表達(dá)式,并將每個(gè)所 述樣本組對(duì)應(yīng)的所有所述似然表達(dá)式相乘以獲取該樣本組的乘積似然表達(dá)式;
[0022] 通過牛頓迭代法以及初始迭代參數(shù)進(jìn)行一次迭代,分別計(jì)算出每個(gè)所述乘積似然 表達(dá)式取最大值時(shí)該乘積似然表達(dá)式中未知參數(shù)的第一值,將每個(gè)所述第一值的和作為下 一次迭代的初始迭代參數(shù),執(zhí)行所述通過牛頓迭代法以及初始迭代參數(shù)進(jìn)行一次迭代的操 作,直至迭代次數(shù)到達(dá)目標(biāo)次數(shù);
[0023] 將在所述目標(biāo)次數(shù)迭代后計(jì)算出的每個(gè)所述乘積似然表達(dá)式中所述未知參數(shù)的 第二值的和確定為所述分。
[0024] 結(jié)合本發(fā)明實(shí)施例第一方面的第三種可能的實(shí)現(xiàn)方式,在本發(fā)明實(shí)施例第一方面 的第四種可能的實(shí)現(xiàn)方式中,所述歸并所述第一數(shù)量的第一樣本數(shù)據(jù)中特征值序列相同的 第一樣本數(shù)據(jù)之后,所述將所述第二數(shù)量的第二樣本數(shù)據(jù)均分成每份包括第三數(shù)量的第二 樣本數(shù)據(jù)的樣本組之前,所述方法還包括:
[0025] 將所述第二數(shù)量的第二樣本數(shù)據(jù)存儲(chǔ)在地址連續(xù)的內(nèi)存空間中。
[0026] 本發(fā)明實(shí)施例第二方面公開了一種點(diǎn)擊到達(dá)率CTR的確定裝置,所述裝置包括第 一確定單元、第一獲取單元以及第二確定單元,其中:
[0027]所述第一確定單元,用于在檢測(cè)到針對(duì)應(yīng)用的顯示請(qǐng)求時(shí),確定每個(gè)應(yīng)用的特征 值序列,所述特征值序列由用于描述應(yīng)用信息的應(yīng)用特征值序列、用于描述用戶信息的用 戶特征值序列以及流量特征值序列組成;
[0028] 所述第一獲取單元,用于分別將每個(gè)所述特征值序列作為預(yù)先設(shè)置的CTR計(jì)算算 法的輸入,獲取與每個(gè)所述特征值序列對(duì)應(yīng)的所述CTR計(jì)算算法的輸出;
[0029] 所述第二確定單元,用于將每個(gè)所述特征值序列對(duì)應(yīng)的所述CTR計(jì)算算法的輸出 確定為該特征值序列對(duì)應(yīng)應(yīng)用的CTR。
[0030] 在本發(fā)明實(shí)施例第二方面的第一種可能的實(shí)現(xiàn)方式中,所述CTR計(jì)算算法為基于 邏輯回歸模型的算法,且所述基于邏輯回歸模型的算法的計(jì)算公式為:
[0031]
[0032] 其中,所述yCT[?為所述計(jì)算公式的輸出,所述i為所述計(jì)算公式的輸入,所述涵:為 預(yù)先計(jì)算出的所述計(jì)算公式的系數(shù)。
[0033] 結(jié)合本發(fā)明實(shí)施例第二方面的第一種可能的實(shí)現(xiàn)方式,在本發(fā)明實(shí)施例第二方面 的第二種可能的實(shí)現(xiàn)方式中,所述裝置還包括第一讀取單元、第一歸并單元、第二獲取單 元、第一計(jì)算單元以及第三確定單元,其中:
[0034] 所述第一讀取單元,用于從預(yù)先存儲(chǔ)的樣本數(shù)據(jù)中讀取第一數(shù)量的第一樣本數(shù) 據(jù),所述樣本數(shù)據(jù)由特征值序列、用于標(biāo)識(shí)該樣本數(shù)據(jù)是否被展現(xiàn)的展現(xiàn)標(biāo)識(shí)以及用于標(biāo) 識(shí)該樣本數(shù)據(jù)是否被點(diǎn)擊的點(diǎn)擊標(biāo)識(shí)組成;
[0035] 所述第一歸并單元,用于歸并所述第一數(shù)量的第一樣本數(shù)據(jù)中特征值序列相同的 第一樣本數(shù)據(jù),以獲取第二數(shù)量的第二樣本數(shù)據(jù),所述第二樣本數(shù)據(jù)由形成該第二樣本數(shù) 據(jù)的第一樣本數(shù)據(jù)的特征值序列、形成該第二樣本數(shù)據(jù)的第一樣本數(shù)據(jù)的展現(xiàn)標(biāo)識(shí)之和以 及形成該第二樣本數(shù)據(jù)的第一樣本數(shù)據(jù)的點(diǎn)擊標(biāo)識(shí)之和組成;
[0036] 所述第二獲取單元,用于將每個(gè)所述第二樣本數(shù)據(jù)表達(dá)成似然表達(dá)式,并將所有 所述似然表達(dá)式相乘以獲取乘積似然表達(dá)式;
[0037] 所述第一計(jì)算單元,用于通過牛頓迭代法以及初始迭代參數(shù)進(jìn)行目標(biāo)次數(shù)次的迭 代,計(jì)算出所述乘積似然表達(dá)式取最大值時(shí)所述乘積似然表達(dá)式中未知參數(shù)的值;
[0038] 所述第三確定單元,用于將所述未知參數(shù)的值確定為所述# ?
[0039] 結(jié)合本發(fā)明實(shí)施例第二方面的第一種可能的實(shí)現(xiàn)方式,在本發(fā)明實(shí)施例第二方面 的第三種可能的實(shí)現(xiàn)方式中,所述裝置還包括第二讀取單元、第二歸并單元、均分單元、第 三獲取單元、第二計(jì)算單元以及第四確定單元,其中:
[0040] 所述第二讀取單元,用于從預(yù)先存儲(chǔ)的樣本數(shù)據(jù)中讀取第一數(shù)量的第一樣本數(shù) 據(jù),所述第一樣本數(shù)據(jù)由特征值序列、用于標(biāo)識(shí)該樣本數(shù)據(jù)是否被展現(xiàn)的展現(xiàn)標(biāo)識(shí)以及用 于標(biāo)識(shí)該樣本數(shù)據(jù)是否被點(diǎn)擊的點(diǎn)擊標(biāo)識(shí)組成;
[0041] 所述第二歸