114] 將上述第二數(shù)量的第二樣本數(shù)據(jù)存儲(chǔ)在地址連續(xù)的內(nèi)存空間中。
[0115] 本發(fā)明實(shí)施例中,將上述第二數(shù)量的第二樣本數(shù)據(jù)存儲(chǔ)在地址連續(xù)的內(nèi)存空間中 且可以用頭尾指針數(shù)組標(biāo)識(shí)每一個(gè)第二樣本數(shù)據(jù)的開始內(nèi)存和結(jié)束內(nèi)存,這樣能夠加速第 二樣本數(shù)據(jù)的讀取。
[0116] 實(shí)施本發(fā)明實(shí)施例能夠快速的確定出應(yīng)用的CTR且資源消耗小。
[0117] 請(qǐng)參閱圖4,圖4是本發(fā)明實(shí)施例公開的一種點(diǎn)擊到達(dá)率CTR的確定裝置的結(jié)構(gòu)示 意圖。如圖4所示,該裝置可以安裝在服務(wù)器中。如圖4所示,該裝置可以包括第一確定單 元401、第一獲取單元402以及第二確定單元403,其中:
[0118] 第一確定單元401用于在檢測到針對(duì)應(yīng)用的顯示請(qǐng)求時(shí),確定每個(gè)應(yīng)用的特征值 序列。
[0119] 本發(fā)明實(shí)施例中,針對(duì)應(yīng)用的顯示請(qǐng)求可以是由用戶通過終端設(shè)備觸發(fā)的,也可 以是由終端設(shè)備主動(dòng)觸發(fā)的,且每個(gè)應(yīng)用的特征值序列由用于描述應(yīng)用信息(如應(yīng)用的類 別以及應(yīng)用的相關(guān)描述信息等)的應(yīng)用特征值序列、用于描述用戶信息(如用戶的性別及 用戶的興趣等)的用戶特征值序列以及用于描述用戶行為信息(如時(shí)間、地點(diǎn)以及語言等) 的流量特征值序列組成,且該特征值序列為由多個(gè)〇和1作為分量的特征值向量。
[0120] 第一獲取單元402用于分別將每個(gè)特征值序列作為預(yù)先設(shè)置的CTR計(jì)算算法的輸 入,獲取與每個(gè)特征值序列對(duì)應(yīng)的CTR計(jì)算算法的輸出。
[0121] 本發(fā)明實(shí)施例中,預(yù)先設(shè)置的CTR計(jì)算算法用于表示應(yīng)用的特征值序列(輸入) 與該應(yīng)用的CTR(輸出)之間的關(guān)系,即將每個(gè)應(yīng)用的特征值序列分別作為該CTR計(jì)算算法 的輸入,對(duì)應(yīng)的CTR計(jì)算算法的輸出即為應(yīng)用的CTR。這樣只要預(yù)先設(shè)置好CTR計(jì)算算法, 就可以快速的確定出應(yīng)用的CTR,無需再依賴于大量的歷史樣本數(shù)據(jù),資源消耗低。
[0122] 第二確定單元403用于將每個(gè)特征值序列對(duì)應(yīng)的CTR計(jì)算算法的輸出確定為該特 征值序列對(duì)應(yīng)應(yīng)用的CTR。
[0123] 作為一種可選的實(shí)施方式,該CTR計(jì)算算法為基于邏輯回歸模型的算法,且該基 于邏輯回歸模型的算法的計(jì)算公式為:
[0124]
[0125]其中,yCTR
為該計(jì)算公式的輸出(應(yīng)用的CTR),I為該計(jì)算公式的輸入(應(yīng)用的特 征值序列),該為預(yù)先計(jì)算出的該計(jì)算公式的系數(shù)。本發(fā)明實(shí)施例中,只要根據(jù)一定的歷史 樣本數(shù)據(jù)計(jì)算出該計(jì)算公式中的i,在后續(xù)的CTR確定過程中只要獲取到應(yīng)用的特征值序 列均可快速的確定出應(yīng)用的CTR。
[0126] 在上述可選的實(shí)施方式中,可選的,在圖4所示的裝置結(jié)構(gòu)基礎(chǔ)上,該裝置還可以 包括第一讀取單元404、第一歸并單元405、第二獲取單元406、第一計(jì)算單元407以及第三 確定單元408,此時(shí),該裝置的結(jié)構(gòu)可以如圖5所示,圖5是本發(fā)明實(shí)施例公開的另一種點(diǎn)擊 到達(dá)率CTR的確定裝置的結(jié)構(gòu)示意圖。其中:
[0127] 第一讀取單元404用于從預(yù)先存儲(chǔ)的樣本數(shù)據(jù)中讀取第一數(shù)量的第一樣本數(shù)據(jù)。
[0128] 本發(fā)明實(shí)施例中,每個(gè)樣本數(shù)據(jù)由特征值序列、用于標(biāo)識(shí)該樣本是否被展現(xiàn)的展 現(xiàn)標(biāo)識(shí)pv以及用于標(biāo)識(shí)該樣本數(shù)據(jù)是否被點(diǎn)擊的點(diǎn)擊標(biāo)識(shí)click組成,且特征值序列由用 于描述應(yīng)用信息(如應(yīng)用的類別以及應(yīng)用的相關(guān)描述信息等)的應(yīng)用特征值序列、用于描 述用戶信息(如用戶的性別及用戶的興趣等)的用戶特征值序列以及用于描述用戶行為信 息(如時(shí)間、地點(diǎn)以及語言等)的流量特征值序列組成,其中,pv為1且click為0表示該 樣本數(shù)據(jù)為展現(xiàn)樣本數(shù)據(jù),pv為〇且click為1表示該樣本數(shù)據(jù)為點(diǎn)擊樣本數(shù)據(jù)。
[0129] 第一歸并單元405用于歸并上述第一數(shù)量的第一樣本數(shù)據(jù)中特征值序列相同的 第一樣本數(shù)據(jù),以獲取第二數(shù)量的第二樣本數(shù)據(jù)。
[0130] 本發(fā)明實(shí)施例中,以特征值序列相同為歸并原則,將特征值序列相同的多條第一 樣本數(shù)據(jù)歸并成一條第二樣本數(shù)據(jù),即將上述第一數(shù)量的第一樣本數(shù)據(jù)歸并成第二數(shù)量的 第二樣本數(shù)據(jù),且第二數(shù)量等于上述第一數(shù)量的第一樣本數(shù)據(jù)中特征值序列的不同取值的 個(gè)數(shù)。其中,第二數(shù)量的第二樣本數(shù)據(jù)由形成該第二樣本數(shù)據(jù)的第一樣本數(shù)據(jù)的特征值序 列、形成該第二樣本數(shù)據(jù)的所有第一樣本數(shù)據(jù)的pv之和以及形成該第二樣本數(shù)據(jù)的所有 第一樣本數(shù)據(jù)的click之和組成。
[0131] 第二獲取單元406用于將每個(gè)第二樣本數(shù)據(jù)表達(dá)成似然表達(dá)式,并將所有似然表 達(dá)式相乘以獲取乘積似然表達(dá)式。
[0132] 第一計(jì)算單元407用于通過牛頓迭代法以及初始迭代參數(shù)進(jìn)行目標(biāo)次數(shù)次的迭 代,計(jì)算出上述乘積似然表達(dá)式取最大值時(shí)上述乘積似然表達(dá)式中未知參數(shù)的值。
[0133] 第三確定單元408用于將上述未知參數(shù)的值確定為上述:
[0134] 在上述可選的實(shí)施方式中,可選的,在圖4所示的裝置結(jié)構(gòu)基礎(chǔ)上,該裝置還可以 包括第二讀取單元409、第二歸并單元410、存儲(chǔ)單元411、均分單元412、第三獲取單元413、 第二計(jì)算單元414以及第四確定單元415,此時(shí),該裝置的結(jié)構(gòu)可以如圖6所示,圖6是本發(fā) 明實(shí)施例公開的又一種點(diǎn)擊到達(dá)率CTR的確定裝置的結(jié)構(gòu)示意圖。其中:
[0135] 第二讀取單元409用于從預(yù)先存儲(chǔ)的樣本數(shù)據(jù)中讀取第一數(shù)量的第一樣本數(shù)據(jù)。
[0136] 第二歸并單元410用于歸并上述第一數(shù)量的第一樣本數(shù)據(jù)中特征值序列相同的 第一樣本數(shù)據(jù),以獲取第二數(shù)量的第二樣本數(shù)據(jù)。
[0137] 本發(fā)明實(shí)施例中,以特征值序列相同為歸并原則,將特征值序列相同的多條第一 樣本數(shù)據(jù)歸并成一條第二樣本數(shù)據(jù),即將上述第一數(shù)量的第一樣本數(shù)據(jù)歸并成第二數(shù)量的 第二樣本數(shù)據(jù),且第二數(shù)量等于上述第一數(shù)量的第一樣本數(shù)據(jù)中特征值序列的不同取值的 個(gè)數(shù)。其中,第二數(shù)量的第二樣本數(shù)據(jù)由形成該第二樣本數(shù)據(jù)的第一樣本數(shù)據(jù)的特征值序 列、形成該第二樣本數(shù)據(jù)的所有第一樣本數(shù)據(jù)的pv之和以及形成該第二樣本數(shù)據(jù)的所有 第一樣本數(shù)據(jù)的click之和組成。
[0138] 存儲(chǔ)單元411用于將上述第二數(shù)量的第二樣本數(shù)據(jù)存儲(chǔ)在地址連續(xù)的內(nèi)存空間 中。
[0139] 均分單元412用于將第二數(shù)量的第二樣本數(shù)據(jù)均分成每份包括第三數(shù)量的第二 樣本數(shù)據(jù)的樣本組。
[0140] 本發(fā)明實(shí)施例中,第三數(shù)量可以小于等于服務(wù)器中的CPU核數(shù),這樣將第二數(shù)量 的第二樣本數(shù)據(jù)均分的方式能夠同時(shí)對(duì)每份第三數(shù)量的第二樣本數(shù)據(jù)進(jìn)行相同的處理,加 快了處理速度。
[0141] 第三獲取單元413用于分別將每個(gè)樣本組包括的每個(gè)第二樣本數(shù)據(jù)表達(dá)成似然 表達(dá)式,并將每個(gè)樣本組對(duì)應(yīng)的所有似然表達(dá)式相乘以獲取該樣本組的乘積似然表達(dá)式。
[0142] 第二計(jì)算單元414用于通過牛頓迭代法以及初始迭代參數(shù)進(jìn)行一次迭代,分別計(jì) 算出每個(gè)乘積似然表達(dá)式取最大值時(shí)該乘積似然表達(dá)式中未知參數(shù)的第一值,將每個(gè)第一 值的和作為下一次迭代的初始迭代參數(shù),并執(zhí)行通過牛頓迭代法以及初始迭代參數(shù)進(jìn)行一 次迭代的操作,直至迭代次數(shù)到達(dá)目標(biāo)次數(shù)。
[0143] 第四確定單元415用于將在目標(biāo)次數(shù)迭代后計(jì)算出的每個(gè)乘積似然表達(dá)式中未 知參數(shù)的第二值的和確定為上述訪》
[0144] 實(shí)施本發(fā)明實(shí)施例能夠快速的確定出應(yīng)用的CTR且資源消耗小。
[0145] 需要說明的是,在上述實(shí)施例中,對(duì)各個(gè)實(shí)施例的描述都各有側(cè)重,某個(gè)實(shí)施例中 沒有詳細(xì)描述的部分,可以參見其他實(shí)施例的相關(guān)描述。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知 悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作以及單元并不一定是本發(fā) 明所必須的。
[0146] 本發(fā)明實(shí)施例方法中的步驟可以根據(jù)實(shí)際需要進(jìn)行順序調(diào)整、合并和刪減。
[0147] 本發(fā)明實(shí)施例裝置中的單元可以根據(jù)實(shí)際需要進(jìn)行合并、劃分和刪減。
[0148] 本發(fā)明實(shí)施例中所述單元可以通過通用集成電路,例如CPU(CentralProcessing Unit,中央處理器),或通過ASIC(ApplicationSpecificIntegratedCircuit,專用集成 電路)來實(shí)現(xiàn)。
[0149] 本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分流程,是可以 通過計(jì)算機(jī)程序來指令相關(guān)的硬件來完成,所述的程序可存儲(chǔ)于計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì) 中,該程序在執(zhí)行時(shí),可包括如上述各方法的實(shí)施例的流程。其中,所述的存儲(chǔ)介質(zhì)可為磁 碟、光盤、只讀存儲(chǔ)記憶體(Read-OnlyMemory,ROM)或隨機(jī)存儲(chǔ)記憶體(RandomAccess Memory,RAM)等。