欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種業(yè)務(wù)對(duì)象的展示方法和裝置與流程

文檔序號(hào):12271341閱讀:318來(lái)源:國(guó)知局
一種業(yè)務(wù)對(duì)象的展示方法和裝置與流程

本發(fā)明涉及計(jì)算機(jī)處理技術(shù)領(lǐng)域,特別是涉及一種業(yè)務(wù)對(duì)象的展示方法和一種業(yè)務(wù)對(duì)象的展示裝置。



背景技術(shù):

隨著網(wǎng)絡(luò)的快速發(fā)展,各種網(wǎng)絡(luò)平臺(tái)集成眾多的產(chǎn)品信息,便于各網(wǎng)站通過(guò)該網(wǎng)絡(luò)平臺(tái)與其他用戶交流。

后端用戶為讓更多的網(wǎng)絡(luò)用戶獲取自己的產(chǎn)品信息,通常有兩條途徑,一條是通過(guò)自然搜索的方式,二是通過(guò)競(jìng)爭(zhēng)推廣的方式。

第一種方式競(jìng)爭(zhēng)比較激烈,優(yōu)化周期較長(zhǎng),因此,很多后端用戶會(huì)選擇更加快捷的第二種方式。

在競(jìng)爭(zhēng)推廣中,通常會(huì)預(yù)估該產(chǎn)品信息的點(diǎn)擊率進(jìn)行排序的優(yōu)化。

目前,對(duì)點(diǎn)擊率的預(yù)估大多采用邏輯回歸(LR)模型,LR模型是一個(gè)簡(jiǎn)單的線性模型,需要額外地對(duì)樣本進(jìn)行處理才能預(yù)估點(diǎn)擊率,而且很容易造成數(shù)據(jù)稀疏和模型訓(xùn)練過(guò)擬合,從而導(dǎo)致點(diǎn)擊率預(yù)估準(zhǔn)確度下降。

由于基于LR模型預(yù)估點(diǎn)擊率準(zhǔn)確率較低,,導(dǎo)致排序的效果較差,會(huì)使得能滿足用戶需求的產(chǎn)品信息的排序很低,使得其展示的位置靠后,甚至無(wú)法展示。

一方面,這些不匹配用戶需求的產(chǎn)品信息不僅占用了平臺(tái)服務(wù)器的資源,而且還占用了客戶端的資源,造成不必要的資源占用與浪費(fèi)。

另一方面,用戶需要獲取自己感興趣的產(chǎn)品信息,可能需要進(jìn)行多次翻頁(yè)操作,甚至再次去其他平臺(tái)進(jìn)行搜索,再次進(jìn)行海量信息的搜索、對(duì)比、篩選等獲取相關(guān)的產(chǎn)品信息,操作更加繁瑣,耗費(fèi)用戶的時(shí)間,降低用戶的使用體驗(yàn),而且,將大大增加其他平臺(tái)服務(wù)器和客戶端的資源消耗。



技術(shù)實(shí)現(xiàn)要素:

鑒于上述問(wèn)題,提出了本發(fā)明以便提供一種克服上述問(wèn)題或者至少部分地解決上述問(wèn)題的一種業(yè)務(wù)對(duì)象的展示方法和相應(yīng)的一種業(yè)務(wù)對(duì)象的展示裝置。

依據(jù)本發(fā)明的一個(gè)方面,提供了一種業(yè)務(wù)對(duì)象的展示方法,包括:

從第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù);

根據(jù)所述特征數(shù)據(jù)之間的交叉關(guān)系訓(xùn)練模型參數(shù);

當(dāng)查找到第二業(yè)務(wù)對(duì)象時(shí),按照所述模型參數(shù)計(jì)算所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率;

根據(jù)所述預(yù)估點(diǎn)擊率對(duì)所述第二業(yè)務(wù)對(duì)象進(jìn)行展示。

可選地,所述從第一業(yè)務(wù)對(duì)象的展示日志和點(diǎn)擊日志中提取特征數(shù)據(jù)的步驟包括:

對(duì)未發(fā)生點(diǎn)擊操作的第一業(yè)務(wù)對(duì)象的展示日志進(jìn)行采樣;

從采樣獲得的第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù)。

可選地,所述根據(jù)所述特征數(shù)據(jù)之間的交叉關(guān)系訓(xùn)練模型參數(shù)的步驟包括:

將所述特征數(shù)據(jù)劃分到多個(gè)特征分組中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系;

至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得分組因子分解模型;

對(duì)所述分組因子分解模型進(jìn)行迭代;

當(dāng)?shù)諗繒r(shí),將收斂的結(jié)果設(shè)置為模型參數(shù)。

可選地,所述至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得分組因子分解模型的步驟包括:

對(duì)所述多個(gè)特征分組和篩選分組進(jìn)行因子分解,獲得分組因子分解模型;

其中,所述篩選分組包括不涉及交叉關(guān)系的特征數(shù)據(jù)。

可選地,所述對(duì)所述分組因子分解模型進(jìn)行迭代的步驟包括:

對(duì)所述分組因子分解模型進(jìn)行采用FTRL方式進(jìn)行迭代訓(xùn)練。

可選地,所述對(duì)所述分組因子分解模型進(jìn)行迭代的步驟包括:

采用異步多線程對(duì)所述分組因子分解模型進(jìn)行迭代。

可選地,所述對(duì)所述分組因子分解模型進(jìn)行迭代的步驟包括:

采用預(yù)設(shè)的指令集對(duì)迭代操作進(jìn)行向量化。

可選地,所述分組被劃分成多份數(shù)據(jù)集;

所述對(duì)所述分組因子分解模型進(jìn)行迭代的步驟包括:

對(duì)當(dāng)前數(shù)據(jù)集的分組因子分解模型進(jìn)行迭代的同時(shí),加載另一數(shù)據(jù)集。

可選地,所述當(dāng)查找到第二業(yè)務(wù)對(duì)象時(shí),按照所述模型參數(shù)計(jì)算所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率的步驟包括:

當(dāng)接收到客戶端發(fā)送的搜索關(guān)鍵詞時(shí),搜索綁定所述搜索關(guān)鍵詞的第二業(yè)務(wù)對(duì)象;將當(dāng)前搜索操作對(duì)應(yīng)的特征數(shù)據(jù)代入預(yù)設(shè)的點(diǎn)擊率預(yù)估模型中,計(jì)算出所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率。

可選地,所述將當(dāng)前搜索操作對(duì)應(yīng)的特征數(shù)據(jù)代入由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型中,計(jì)算出所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率的步驟包括:

將當(dāng)前搜索對(duì)應(yīng)的特征數(shù)據(jù)劃分到多個(gè)特征分組中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系

至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型,計(jì)算出所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率。

可選地,所述至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型的步驟包括:

對(duì)所述多個(gè)特征分組和篩選分組進(jìn)行因子分解,獲得由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型;

其中,所述篩選分組包括不涉及交叉關(guān)系的特征數(shù)據(jù)。

可選地,所述根據(jù)所述預(yù)估點(diǎn)擊率對(duì)所述第二業(yè)務(wù)對(duì)象進(jìn)行展示的步驟包括:

采用所述預(yù)估點(diǎn)擊率計(jì)算所述第二業(yè)務(wù)對(duì)象的排序權(quán)重;

將排序權(quán)重最高的一個(gè)或多個(gè)第二業(yè)務(wù)對(duì)象發(fā)送至客戶端進(jìn)行展示。

根據(jù)本發(fā)明的另一方面,提供了一種業(yè)務(wù)對(duì)象的展示裝置,包括:

特征數(shù)據(jù)提取模塊,適于從第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù);

模型參數(shù)訓(xùn)練模塊,適于根據(jù)所述特征數(shù)據(jù)之間的交叉關(guān)系訓(xùn)練模型參數(shù);

預(yù)估點(diǎn)擊率計(jì)算模塊,適于在查找到第二業(yè)務(wù)對(duì)象時(shí),按照所述模型參數(shù)計(jì)算所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率;

業(yè)務(wù)對(duì)象展示模塊,適于根據(jù)所述預(yù)估點(diǎn)擊率對(duì)所述第二業(yè)務(wù)對(duì)象進(jìn)行展示。

可選地,所述特征數(shù)據(jù)提取模塊還適于:

對(duì)未發(fā)生點(diǎn)擊操作的第一業(yè)務(wù)對(duì)象的展示日志進(jìn)行采樣;

從采樣獲得的第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù)。

可選地,所述模型參數(shù)訓(xùn)練模塊還適于:

將所述特征數(shù)據(jù)劃分到多個(gè)特征分組中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系;

至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得分組因子分解模型;

對(duì)所述分組因子分解模型進(jìn)行迭代;

當(dāng)?shù)諗繒r(shí),將收斂的結(jié)果設(shè)置為模型參數(shù)。

可選地,所述模型參數(shù)訓(xùn)練模塊還適于:

對(duì)所述多個(gè)特征分組和篩選分組進(jìn)行因子分解,獲得分組因子分解模型;

其中,所述篩選分組包括不涉及交叉關(guān)系的特征數(shù)據(jù)。

可選地,所述模型參數(shù)訓(xùn)練模塊還適于:

對(duì)所述分組因子分解模型進(jìn)行采用FTRL方式進(jìn)行迭代。

可選地,所述模型參數(shù)訓(xùn)練模塊還適于:

采用異步多線程對(duì)所述分組因子分解模型進(jìn)行迭代。

可選地,所述模型參數(shù)訓(xùn)練模塊還適于:

采用預(yù)設(shè)的指令集對(duì)迭代操作進(jìn)行向量化。

可選地,所述分組被劃分成多份數(shù)據(jù)集;

所述模型參數(shù)訓(xùn)練模塊還適于:

對(duì)當(dāng)前數(shù)據(jù)集的分組因子分解模型進(jìn)行迭代的同時(shí),加載另一數(shù)據(jù)集。

可選地,所述預(yù)估點(diǎn)擊率計(jì)算模塊還適于:

當(dāng)接收到客戶端發(fā)送的搜索關(guān)鍵詞時(shí),搜索綁定所述搜索關(guān)鍵詞的第二業(yè)務(wù)對(duì)象;

將當(dāng)前搜索操作對(duì)應(yīng)的特征數(shù)據(jù)代入預(yù)設(shè)的點(diǎn)擊率預(yù)估模型中,計(jì)算出所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率。

可選地,所述預(yù)估點(diǎn)擊率計(jì)算模塊還適于:

將當(dāng)前搜索對(duì)應(yīng)的特征數(shù)據(jù)劃分到多個(gè)特征分組中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系

至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型,計(jì)算出所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率。

可選地,所述業(yè)務(wù)對(duì)象展示模塊還適于:

采用所述預(yù)估點(diǎn)擊率計(jì)算所述第二業(yè)務(wù)對(duì)象的排序權(quán)重;

將排序權(quán)重最高的一個(gè)或多個(gè)第二業(yè)務(wù)對(duì)象發(fā)送至客戶端進(jìn)行展示。

本發(fā)明實(shí)施例通過(guò)特征數(shù)據(jù)之間的交叉關(guān)系訓(xùn)練模型參數(shù),一方面,從模型層面上對(duì)特征數(shù)據(jù)的交叉關(guān)系進(jìn)行建模,避免額外的處理,在模型中使用低秩矩陣逼近的思想,避免了對(duì)特征數(shù)據(jù)直接的交叉關(guān)系過(guò)擬合訓(xùn)練,大大提高了模型的擬合能力。

另一方面,按照較高精確度的模型參數(shù)計(jì)算出第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率,根據(jù)該預(yù)估點(diǎn)擊率對(duì)第二業(yè)務(wù)對(duì)象進(jìn)行展示,提高了展示的準(zhǔn)確率,提高了用戶需求的業(yè)務(wù)對(duì)象的展示幾率,提高了用戶的使用體驗(yàn),增強(qiáng)用戶對(duì)搜索結(jié)果的滿意度。降低了當(dāng)前平臺(tái)服務(wù)器、客戶端的資源占用與浪費(fèi),避免用戶多次翻頁(yè)操作或者去其他平臺(tái)進(jìn)行搜索,提高了操作的簡(jiǎn)便性,減少用戶時(shí)間的耗費(fèi),也減少了其他平臺(tái)服務(wù)器和客戶端的資源消耗。

此外,本發(fā)明實(shí)施例通過(guò)負(fù)例采樣、異步多線程、操作向量化、訓(xùn)練線程和預(yù)讀取線程并行等方式加快模型的訓(xùn)練,可以在短時(shí)間(如一個(gè)小時(shí))內(nèi),完成海量數(shù)據(jù)的訓(xùn)練,提高模型的時(shí)效性。

上述說(shuō)明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技 術(shù)手段,而可依照說(shuō)明書的內(nèi)容予以實(shí)施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點(diǎn)能夠更明顯易懂,以下特舉本發(fā)明的具體實(shí)施方式。

附圖說(shuō)明

通過(guò)閱讀下文優(yōu)選實(shí)施方式的詳細(xì)描述,各種其他的優(yōu)點(diǎn)和益處對(duì)于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實(shí)施方式的目的,而并不認(rèn)為是對(duì)本發(fā)明的限制。而且在整個(gè)附圖中,用相同的參考符號(hào)表示相同的部件。在附圖中:

圖1示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種業(yè)務(wù)對(duì)象的展示方法實(shí)施例的步驟流程圖;以及

圖2示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種業(yè)務(wù)對(duì)象的展示裝置實(shí)施例的結(jié)構(gòu)框圖。

具體實(shí)施方式

下面將參照附圖更詳細(xì)地描述本公開(kāi)的示例性實(shí)施例。雖然附圖中顯示了本公開(kāi)的示例性實(shí)施例,然而應(yīng)當(dāng)理解,可以以各種形式實(shí)現(xiàn)本公開(kāi)而不應(yīng)被這里闡述的實(shí)施例所限制。相反,提供這些實(shí)施例是為了能夠更透徹地理解本公開(kāi),并且能夠?qū)⒈竟_(kāi)的范圍完整的傳達(dá)給本領(lǐng)域的技術(shù)人員。

參照?qǐng)D1,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種業(yè)務(wù)對(duì)象的展示方法實(shí)施例的步驟流程圖,具體可以包括如下步驟:

步驟101,從第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù);

需要說(shuō)明的是,本發(fā)明實(shí)施例可以應(yīng)用于網(wǎng)絡(luò)平臺(tái),其本質(zhì)為獨(dú)立的服務(wù)器或服務(wù)器集群,如分布式系統(tǒng),存儲(chǔ)了海量的不同領(lǐng)域的業(yè)務(wù)對(duì)象。

在不同的領(lǐng)域中可以具有不同的業(yè)務(wù)對(duì)象(如第一業(yè)務(wù)對(duì)象、第二業(yè)務(wù)對(duì)象),即體現(xiàn)該領(lǐng)域特性的數(shù)據(jù)。

例如,在通信領(lǐng)域中,業(yè)務(wù)對(duì)象可以為通信數(shù)據(jù);在新聞媒體領(lǐng)域中,業(yè)務(wù)對(duì)象可以為新聞數(shù)據(jù);在搜索領(lǐng)域中,業(yè)務(wù)對(duì)象可以為網(wǎng)頁(yè);在電子商務(wù)(Electronic Commerce,EC)領(lǐng)域中,業(yè)務(wù)對(duì)象可以為廣告數(shù)據(jù),等等。

在不同的領(lǐng)域中,雖然業(yè)務(wù)對(duì)象承載領(lǐng)域特性而有所不同,但其本質(zhì)都是數(shù)據(jù),例如,文本數(shù)據(jù)、圖像數(shù)據(jù)、音頻數(shù)據(jù)、視頻數(shù)據(jù)等等,相對(duì)地,對(duì)業(yè)務(wù)對(duì)象的處理,本質(zhì)都是對(duì)數(shù)據(jù)的處理。

為使本領(lǐng)域技術(shù)人員更好地理解本發(fā)明實(shí)施例,在本發(fā)明實(shí)施例中,將廣告數(shù)據(jù)作為業(yè)務(wù)對(duì)象的一種示例進(jìn)行說(shuō)明。

在實(shí)際應(yīng)用中,用戶可以通過(guò)客戶端(如瀏覽器)提交搜索關(guān)鍵詞,則網(wǎng)絡(luò)平臺(tái)依據(jù)該搜索關(guān)鍵詞進(jìn)行搜索,如搜索綁定該搜索關(guān)鍵詞的一個(gè)或多個(gè)第一業(yè)務(wù)對(duì)象,基于預(yù)估點(diǎn)擊率對(duì)該第一業(yè)務(wù)對(duì)象計(jì)算排序權(quán)重,并展示排序權(quán)重最高的前N(N為正整數(shù))個(gè)第一業(yè)務(wù)對(duì)象。

上述歷史行為可以記錄在網(wǎng)絡(luò)平臺(tái)的展示日志中,例如,用戶ID、廣告數(shù)據(jù)ID、廣告主ID、搜索關(guān)鍵詞、操作系統(tǒng)、瀏覽器版本、IP地址、是否點(diǎn)擊、廣告數(shù)據(jù)的競(jìng)價(jià)、扣費(fèi)等等。

本發(fā)明實(shí)施例分析影響點(diǎn)擊率(Click-Through Rate,CTR)的因素,從展示日志中獲取所需的特征數(shù)據(jù),形成特征文件,作為模型的訓(xùn)練集。

在本發(fā)明的一種可選實(shí)施例中,步驟101可以包括如下子步驟:

子步驟S11,對(duì)未發(fā)生點(diǎn)擊操作的第一業(yè)務(wù)對(duì)象的展示日志進(jìn)行采樣;

子步驟S12,從采樣獲得的第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù)。

由于點(diǎn)擊率CTR一般很小(可能只有百分之幾),而且本發(fā)明實(shí)施例更關(guān)心的是展現(xiàn)后是否被點(diǎn)擊。

因此,本發(fā)明實(shí)施例可以對(duì)訓(xùn)練集進(jìn)行負(fù)例(即未發(fā)生點(diǎn)擊操作的展示)采樣,如均勻采樣,AdBlindness采樣等等,負(fù)例采樣后對(duì)模型的預(yù)測(cè)效果影響很小,但是,可以大量減少訓(xùn)練集的數(shù)據(jù)量,減少了訓(xùn)練的計(jì)算量,降低了系統(tǒng)的資源消耗,加快了訓(xùn)練的速度。

步驟102,根據(jù)所述特征數(shù)據(jù)之間的交叉關(guān)系訓(xùn)練模型參數(shù);

交叉關(guān)系,可以為對(duì)于點(diǎn)擊率具有共同作用的特征數(shù)據(jù)之間的關(guān)系,例如,IP地址與搜索關(guān)鍵詞具有交叉關(guān)系,如四川地區(qū)(IP地址)對(duì)麻辣火鍋(搜索關(guān)鍵詞)的廣告數(shù)據(jù)的點(diǎn)擊率較高,廣東地區(qū)(IP地址)對(duì)麻辣火鍋(搜索關(guān)鍵詞)的廣告數(shù)據(jù)的點(diǎn)擊率較低,等等,利用這種共同作用可以訓(xùn) 練模型參數(shù),即應(yīng)用于點(diǎn)擊率預(yù)估模型的參數(shù)。

在本發(fā)明的一種可選實(shí)施例中,步驟102可以包括如下子步驟:

子步驟S21,將所述特征數(shù)據(jù)劃分到多個(gè)特征分組中;

其中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系;

例如,某一廣告數(shù)據(jù)屬于具體一個(gè)廣告主,即廣告數(shù)據(jù)ID與廣告主ID不具有交叉關(guān)系,可以劃分在同一個(gè)特征分組中。

例如,IP地址與搜索關(guān)鍵詞具有交叉關(guān)系,可以劃分在不同特征分組。

本發(fā)明上來(lái)可以自動(dòng)學(xué)習(xí)特征數(shù)據(jù)之間的交叉關(guān)系,解決特征交叉過(guò)擬合問(wèn)題,同時(shí)大大提高線上預(yù)測(cè)的準(zhǔn)確度。

子步驟S22,至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得分組因子分解模型;

在具體實(shí)現(xiàn)中,對(duì)所述多個(gè)特征分組和篩選分組進(jìn)行因子分解,獲得分組因子分解模型;

其中,所述篩選分組包括不涉及交叉關(guān)系的特征數(shù)據(jù),例如,廣告數(shù)據(jù)的展示位置(一般展示位置較好的廣告數(shù)據(jù)的點(diǎn)擊率較高)、流量來(lái)源等等,對(duì)分組因子分解模型進(jìn)行偏移。

由于本發(fā)明實(shí)施例是基于分組進(jìn)行因子分解,則分組因子分解模型可以稱之為GFM(Group Factorization Machines,分組因子分解機(jī))。

其示例可以如下:

其中,W為需要訓(xùn)練模型參數(shù),x為特征數(shù)據(jù)的向量。W0為篩選分組的模型參數(shù),x0為篩選分組的特征數(shù)據(jù)的向量,G為特征分組的數(shù)量,則Wi為第i組特征分組的模型參數(shù),Xi為第i組特征分組的特征數(shù)據(jù)的向量,Wj為第j組特征分組的模型參數(shù),Xj為第j組特征分組的特征數(shù)據(jù)的向量。

子步驟S23,對(duì)所述分組因子分解模型進(jìn)行迭代;

在具體實(shí)現(xiàn)中,可以采用SGD(Stochastic Gradient Descent,隨即梯度下降)對(duì)分組因子分解模型進(jìn)行迭代。

進(jìn)一步地,為了提高迭代的收斂速度,可以對(duì)分組因子分解模型進(jìn)行采用FTRL(Follow-the-Regularized-Leader)方式進(jìn)行迭代。

具體而言,為了對(duì)GFM進(jìn)行優(yōu)化求解,可以計(jì)算其導(dǎo)數(shù):

其中,yn表征第n個(gè)特征數(shù)據(jù)是否被點(diǎn)擊,xn是第n個(gè)特征數(shù)據(jù)的向量,λ為常量,

有了導(dǎo)數(shù)之后,則可以根據(jù)SGD優(yōu)化方法更新參數(shù)。

SGD更新的公式的示例可以如下:

其中,α為SGD中設(shè)定的模型參數(shù)的學(xué)習(xí)率。

當(dāng)然,除了SGD之外,還可以應(yīng)用其他方式進(jìn)行迭代,如GD(梯度下降)、共軛梯度法等其他一階優(yōu)化方式,如牛頓法等二階優(yōu)化方式,等等,本發(fā)明實(shí)施例對(duì)此不加以限制。

在具體實(shí)現(xiàn)中,本發(fā)明實(shí)施例可以通過(guò)以下的一種或多種方式加快迭代 速度:

1、采用異步多線程對(duì)所述分組因子分解模型進(jìn)行迭代。

在本方式中,采用異步多線程進(jìn)行加速,每個(gè)線程處理一個(gè)數(shù)據(jù)樣本,所有線程共享模型。

由于訓(xùn)練集本身的特性,即特征數(shù)據(jù)的向量是稀疏的,所以在進(jìn)行了數(shù)據(jù)打亂順序之后,兩個(gè)線程同時(shí)更新同一個(gè)模型參數(shù)的概率就大大降低,因而訓(xùn)練的收斂速度不會(huì)受到太大影響。

2、采用預(yù)設(shè)的指令集對(duì)迭代操作進(jìn)行向量化加速。

由于GFM模型中含有大量的向量計(jì)算,本方式中可以采用AVX或者SSE指令集對(duì)操作進(jìn)行向量化,這樣每個(gè)指令可同時(shí)操作8個(gè)或者4個(gè)浮點(diǎn)數(shù),使用AVX可以加速5倍多,使用SSE可以加速3倍多。

3、對(duì)當(dāng)前數(shù)據(jù)集的分組因子分解模型進(jìn)行迭代的同時(shí),加載另一數(shù)據(jù)集。

在本方式中,為解決訓(xùn)練數(shù)據(jù)過(guò)大,內(nèi)存放不下的問(wèn)題,可以對(duì)整個(gè)訓(xùn)練集進(jìn)行切割,即分組被劃分成多份數(shù)據(jù)集,逐份進(jìn)行加載。

迭代線程和預(yù)讀取線程并行,對(duì)磁盤載入下一數(shù)據(jù)集和GFM模型的訓(xùn)練操作進(jìn)行重疊,充分利用磁盤I/O和CPU資源。

當(dāng)然,上述迭代方式只是作為示例,在實(shí)施本發(fā)明實(shí)施例時(shí),可以根據(jù)實(shí)際情況設(shè)置其他迭代方式,以加快迭代速度,本發(fā)明實(shí)施例對(duì)此不加以限制。另外,除了上述迭代方式外,本領(lǐng)域技術(shù)人員還可以根據(jù)實(shí)際需要采用其它迭代方式,本發(fā)明實(shí)施例對(duì)此也不加以限制。

子步驟S24,當(dāng)?shù)諗繒r(shí),將收斂的結(jié)果設(shè)置為模型參數(shù)。

在得到模型參數(shù)之后,可以采用二進(jìn)制的格式推送到線上的預(yù)估服務(wù)器,替換線上已有點(diǎn)擊率預(yù)估模型。

步驟103,當(dāng)查找到第二業(yè)務(wù)對(duì)象時(shí),按照所述模型參數(shù)計(jì)算所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率;

在具體實(shí)現(xiàn)中,用戶可以通過(guò)客戶端(如瀏覽器)向網(wǎng)絡(luò)平臺(tái)發(fā)出搜索關(guān)鍵詞,則當(dāng)接收到客戶端發(fā)送的搜索關(guān)鍵詞時(shí),可以查找綁定所述搜索 關(guān)鍵詞的第二業(yè)務(wù)對(duì)象。

例如,用戶可以在網(wǎng)絡(luò)平臺(tái)的頁(yè)面搜索某個(gè)搜索關(guān)鍵詞,也可以在搜索引擎中搜索某個(gè)搜索關(guān)鍵詞等等。

若網(wǎng)絡(luò)平臺(tái)接收到搜索關(guān)鍵詞,則可以搜索與該搜索關(guān)鍵詞匹配的業(yè)務(wù)對(duì)象。

在電子商務(wù)領(lǐng)域中,網(wǎng)絡(luò)平臺(tái)可以通過(guò)該搜索關(guān)鍵詞與第二業(yè)務(wù)對(duì)象預(yù)先綁定的文本信息(如廣告數(shù)據(jù)的競(jìng)價(jià)詞)進(jìn)行匹配,若匹配上該文本信息,可以認(rèn)為該搜索關(guān)鍵詞與該業(yè)務(wù)對(duì)象匹配。

進(jìn)一步地,將當(dāng)前搜索對(duì)應(yīng)的特征數(shù)據(jù)代入預(yù)設(shè)的點(diǎn)擊率預(yù)估模型中,計(jì)算出第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率。

具體而言,將當(dāng)前搜索對(duì)應(yīng)的特征數(shù)據(jù)劃分到多個(gè)特征分組中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系;

至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得由模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型,計(jì)算出第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率。

進(jìn)一步而言,可以對(duì)多個(gè)特征分組和篩選分組進(jìn)行因子分解,獲得由模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型;

其中,篩選分組包括不涉及交叉關(guān)系的特征數(shù)據(jù)。

點(diǎn)擊率預(yù)估模型的示例可以如下:

其中,W為已訓(xùn)練好的模型參數(shù),x為特征數(shù)據(jù)的向量。W0為篩選分組的模型參數(shù),x0為篩選分組的特征數(shù)據(jù)的向量,G為特征分組的數(shù)量,則Wi為第i組特征分組的模型參數(shù),Xi為第i組特征分組的特征數(shù)據(jù)的向量,Wj為第j組特征分組的模型參數(shù),Xj為第j組特征分組的特征數(shù)據(jù)的向量。

步驟104,根據(jù)所述預(yù)估點(diǎn)擊率對(duì)所述第二業(yè)務(wù)對(duì)象進(jìn)行展示。

在實(shí)際應(yīng)用中,可以采用預(yù)估點(diǎn)擊率計(jì)算第二業(yè)務(wù)對(duì)象的排序權(quán)重;

將排序權(quán)重最高的一個(gè)或多個(gè)第二業(yè)務(wù)對(duì)象發(fā)送至客戶端進(jìn)行展示。

以廣告數(shù)據(jù)為例,可以通過(guò)RankScore=BidPrice×QS×eCTR、RankScore=eCTRα×BidPrice計(jì)算排序權(quán)重,展示排序分最高的N個(gè)廣告數(shù)據(jù),N為正整數(shù)。

其中,RankScore為排序分,BidPrice為廣告數(shù)據(jù)的競(jìng)價(jià),eCTR為預(yù)估點(diǎn)擊率(基于模型估算得到的業(yè)務(wù)對(duì)象的點(diǎn)擊率,estimated CTR)、QS為質(zhì)量參數(shù)(衡量搜索關(guān)鍵詞與業(yè)務(wù)對(duì)象的匹配度)。

若展示的廣告數(shù)據(jù)被點(diǎn)擊,則按照其競(jìng)價(jià)BidPrice對(duì)廣告主進(jìn)行扣費(fèi)。

而實(shí)際扣除的費(fèi)用一般小于或等于該競(jìng)價(jià)BidPrice,如基于廣義第二價(jià)格扣費(fèi)GSP(General Second Price)進(jìn)行計(jì)價(jià),廣告數(shù)據(jù)的實(shí)際的扣費(fèi)一般小于其競(jìng)價(jià),防止了廣告主頻繁調(diào)價(jià)帶來(lái)的價(jià)格波動(dòng)。

在電子商務(wù)領(lǐng)域中,廣告數(shù)據(jù)作為電商的收益方式之一,得到了非常好的發(fā)展。

廣告數(shù)據(jù)的排序通常以eCPM(effective cost per mille,每一千次展示可以獲得的收入)為目標(biāo),eCPM=eCTR*Bidprice,即預(yù)估點(diǎn)擊概率eCTR與廣告主競(jìng)價(jià)Bidprice的乘積。

因此,網(wǎng)絡(luò)平臺(tái)可以預(yù)定用戶在輸入搜索關(guān)鍵詞的情況下,精確地預(yù)測(cè)廣告數(shù)據(jù)的點(diǎn)擊概率,進(jìn)而采用eCPM高的廣告數(shù)據(jù)優(yōu)先展示的策略來(lái)優(yōu)化平臺(tái)的收入,改善廣告主的體驗(yàn)。

目前,對(duì)廣告數(shù)據(jù)的點(diǎn)擊率預(yù)估大多采用邏輯回歸(LR)模型,由于LR模型是一個(gè)簡(jiǎn)單的線性模型,所以被廣泛采用。但是,LR模型本身并不能直接對(duì)輸入的特征數(shù)據(jù)之間的交叉關(guān)系進(jìn)行建模,需要額外的處理才能達(dá)到該目標(biāo),而且很容易造成模型在數(shù)據(jù)上的過(guò)擬合。

在模型的訓(xùn)練方法上,目前大多采用隨機(jī)梯度SDG進(jìn)行優(yōu)化。SGD每次選擇一個(gè)或多個(gè)數(shù)據(jù)樣本,然后計(jì)算模型在這些數(shù)據(jù)樣本下的梯度,對(duì)該次數(shù)據(jù)所涉及到的參數(shù)進(jìn)行更新。

但是由于SGD本身是一個(gè)順序優(yōu)化算法,無(wú)法進(jìn)行并行優(yōu)化,訓(xùn)練幾 十億樣本的廣告數(shù)據(jù)時(shí),非常耗時(shí),無(wú)法體現(xiàn)時(shí)效性特征。

本發(fā)明實(shí)施例針對(duì)LR模型在CTR預(yù)估的缺陷,創(chuàng)造性地提出了GFM模型以及基于SGD的異步并行訓(xùn)練方案。

具體而言,本發(fā)明實(shí)施例通過(guò)特征數(shù)據(jù)之間的交叉關(guān)系訓(xùn)練模型參數(shù),一方面,從模型層面上對(duì)特征數(shù)據(jù)的交叉關(guān)系進(jìn)行建模,避免額外的處理,在模型中使用低秩矩陣逼近的思想,避免了對(duì)特征數(shù)據(jù)直接的交叉關(guān)系過(guò)擬合訓(xùn)練,大大提高了模型的擬合能力。

另一方面,按照較高精確度的模型參數(shù)計(jì)算出第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率,根據(jù)該預(yù)估點(diǎn)擊率對(duì)第二業(yè)務(wù)對(duì)象進(jìn)行展示,提高了展示的準(zhǔn)確率,提高了用戶需求的業(yè)務(wù)對(duì)象的展示幾率,提高用戶體驗(yàn),增加用戶使用滿意度。降低了當(dāng)前平臺(tái)服務(wù)器、客戶端的資源占用與浪費(fèi),避免用戶多次翻頁(yè)操作或者去其他平臺(tái)進(jìn)行搜索,提高了操作的簡(jiǎn)便性,減少用戶時(shí)間的耗費(fèi),也減少了其他平臺(tái)服務(wù)器和客戶端的資源消耗。

此外,本發(fā)明實(shí)施例通過(guò)負(fù)例采樣、異步多線程、操作向量化、訓(xùn)練線程和預(yù)讀取線程并行等方式加快模型的訓(xùn)練,可以在短時(shí)間(如一個(gè)小時(shí))內(nèi),完成海量數(shù)據(jù)的訓(xùn)練,提高模型的時(shí)效性。

對(duì)比開(kāi)源的類似程序,本發(fā)明實(shí)施例的訓(xùn)練速度提高了200倍左右,可以在短時(shí)間(如一個(gè)小時(shí))內(nèi)對(duì)較長(zhǎng)時(shí)間(如2個(gè)月)內(nèi)的數(shù)據(jù)進(jìn)行訓(xùn)練,符合線上模型的時(shí)效性要求。

對(duì)于方法實(shí)施例,為了簡(jiǎn)單描述,故將其都表述為一系列的動(dòng)作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明實(shí)施例并不受所描述的動(dòng)作順序的限制,因?yàn)橐罁?jù)本發(fā)明實(shí)施例,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知悉,說(shuō)明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動(dòng)作并不一定是本發(fā)明實(shí)施例所必須的。

參照?qǐng)D2,示出了根據(jù)本發(fā)明一個(gè)實(shí)施例的一種業(yè)務(wù)對(duì)象的展示裝置實(shí)施例的結(jié)構(gòu)框圖,具體可以包括如下模塊:

特征數(shù)據(jù)提取模塊201,適于從第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù);

模型參數(shù)訓(xùn)練模塊202,適于根據(jù)所述特征數(shù)據(jù)之間的交叉關(guān)系訓(xùn)練模型參數(shù);

預(yù)估點(diǎn)擊率計(jì)算模塊203,適于在查找到第二業(yè)務(wù)對(duì)象時(shí),按照所述模型參數(shù)計(jì)算所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率;

業(yè)務(wù)對(duì)象展示模塊204,適于根據(jù)所述預(yù)估點(diǎn)擊率對(duì)所述第二業(yè)務(wù)對(duì)象進(jìn)行展示。

在本發(fā)明的一種可選實(shí)施例中,所述特征數(shù)據(jù)提取模塊201還可以適于:

對(duì)未發(fā)生點(diǎn)擊操作的第一業(yè)務(wù)對(duì)象的展示日志進(jìn)行采樣;

從采樣獲得的第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù)。

在本發(fā)明的一種可選實(shí)施例中,所述模型參數(shù)訓(xùn)練模塊202還可以適于:

將所述特征數(shù)據(jù)劃分到多個(gè)特征分組中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系;

至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得分組因子分解模型;

對(duì)所述分組因子分解模型進(jìn)行迭代;

當(dāng)?shù)諗繒r(shí),將收斂的結(jié)果設(shè)置為模型參數(shù)。

在本發(fā)明的一種可選實(shí)施例中,所述模型參數(shù)訓(xùn)練模塊202還可以適于:

對(duì)所述多個(gè)特征分組和篩選分組進(jìn)行因子分解,獲得分組因子分解模型;

其中,所述篩選分組包括不涉及交叉關(guān)系的特征數(shù)據(jù)。

在本發(fā)明的一種可選實(shí)施例中,所述模型參數(shù)訓(xùn)練模塊202還可以適于:

對(duì)所述分組因子分解模型進(jìn)行采用FTRL方式進(jìn)行迭代。

在本發(fā)明的一種可選實(shí)施例中,所述模型參數(shù)訓(xùn)練模塊202還可以適于:

采用異步多線程對(duì)所述分組因子分解模型進(jìn)行迭代。

在本發(fā)明的一種可選實(shí)施例中,所述模型參數(shù)訓(xùn)練模塊202還可以適于:

采用預(yù)設(shè)的指令集對(duì)迭代操作進(jìn)行向量化。

在本發(fā)明的一種可選實(shí)施例中,所述分組被劃分成多份數(shù)據(jù)集;

所述模型參數(shù)訓(xùn)練模塊202還可以適于:

對(duì)當(dāng)前數(shù)據(jù)集的分組因子分解模型進(jìn)行迭代的同時(shí),加載另一數(shù)據(jù)集。

在本發(fā)明的一種可選實(shí)施例中,所述預(yù)估點(diǎn)擊率計(jì)算模塊203還可以適于:

當(dāng)接收到客戶端發(fā)送的搜索關(guān)鍵詞時(shí),搜索綁定所述搜索關(guān)鍵詞的第二業(yè)務(wù)對(duì)象;

將當(dāng)前搜索操作對(duì)應(yīng)的特征數(shù)據(jù)代入由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型中,計(jì)算出所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率。

在本發(fā)明的一種可選實(shí)施例中,所述預(yù)估點(diǎn)擊率計(jì)算模塊203還可以適于:

將當(dāng)前搜索對(duì)應(yīng)的特征數(shù)據(jù)劃分到多個(gè)特征分組中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系

至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型,計(jì)算出所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率。

在本發(fā)明的一種可選實(shí)施例中,所述預(yù)估點(diǎn)擊率計(jì)算模塊203還可以適于:

對(duì)所述多個(gè)特征分組和篩選分組進(jìn)行因子分解,獲得由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型;

其中,所述篩選分組包括不涉及交叉關(guān)系的特征數(shù)據(jù)。

在本發(fā)明的一種可選實(shí)施例中,所述業(yè)務(wù)對(duì)象展示模塊204還可以適于:

采用所述預(yù)估點(diǎn)擊率計(jì)算所述第二業(yè)務(wù)對(duì)象的排序權(quán)重;

將排序權(quán)重最高的一個(gè)或多個(gè)第二業(yè)務(wù)對(duì)象發(fā)送至客戶端進(jìn)行展示。

對(duì)于裝置實(shí)施例而言,由于其與方法實(shí)施例基本相似,所以描述的比較簡(jiǎn)單,相關(guān)之處參見(jiàn)方法實(shí)施例的部分說(shuō)明即可。

在此提供的算法和顯示不與任何特定計(jì)算機(jī)、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見(jiàn)的。此外,本發(fā)明也不針對(duì)任何特定 編程語(yǔ)言。應(yīng)當(dāng)明白,可以利用各種編程語(yǔ)言實(shí)現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對(duì)特定語(yǔ)言所做的描述是為了披露本發(fā)明的最佳實(shí)施方式。

在此處所提供的說(shuō)明書中,說(shuō)明了大量具體細(xì)節(jié)。然而,能夠理解,本發(fā)明的實(shí)施例可以在沒(méi)有這些具體細(xì)節(jié)的情況下實(shí)踐。在一些實(shí)例中,并未詳細(xì)示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對(duì)本說(shuō)明書的理解。

類似地,應(yīng)當(dāng)理解,為了精簡(jiǎn)本公開(kāi)并幫助理解各個(gè)發(fā)明方面中的一個(gè)或多個(gè),在上面對(duì)本發(fā)明的示例性實(shí)施例的描述中,本發(fā)明的各個(gè)特征有時(shí)被一起分組到單個(gè)實(shí)施例、圖、或者對(duì)其的描述中。然而,并不應(yīng)將該公開(kāi)的方法解釋成反映如下意圖:即所要求保護(hù)的本發(fā)明要求比在每個(gè)權(quán)利要求中所明確記載的特征更多的特征。更確切地說(shuō),如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開(kāi)的單個(gè)實(shí)施例的所有特征。因此,遵循具體實(shí)施方式的權(quán)利要求書由此明確地并入該具體實(shí)施方式,其中每個(gè)權(quán)利要求本身都作為本發(fā)明的單獨(dú)實(shí)施例。

本領(lǐng)域那些技術(shù)人員可以理解,可以對(duì)實(shí)施例中的設(shè)備中的模塊進(jìn)行自適應(yīng)性地改變并且把它們?cè)O(shè)置在與該實(shí)施例不同的一個(gè)或多個(gè)設(shè)備中??梢园褜?shí)施例中的模塊或單元或組件組合成一個(gè)模塊或單元或組件,以及此外可以把它們分成多個(gè)子模塊或子單元或子組件。除了這樣的特征和/或過(guò)程或者單元中的至少一些是相互排斥之外,可以采用任何組合對(duì)本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的所有特征以及如此公開(kāi)的任何方法或者設(shè)備的所有過(guò)程或單元進(jìn)行組合。除非另外明確陳述,本說(shuō)明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開(kāi)的每個(gè)特征可以由提供相同、等同或相似目的的替代特征來(lái)代替。

此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實(shí)施例包括其它實(shí)施例中所包括的某些特征而不是其它特征,但是不同實(shí)施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實(shí)施例。例如,在下面的權(quán)利要求書中,所要求保護(hù)的實(shí)施例的任意之一都可以以任意的組合方式來(lái)使用。

本發(fā)明的各個(gè)部件實(shí)施例可以以硬件實(shí)現(xiàn),或者以在一個(gè)或者多個(gè)處理 器上運(yùn)行的軟件模塊實(shí)現(xiàn),或者以它們的組合實(shí)現(xiàn)。本領(lǐng)域的技術(shù)人員應(yīng)當(dāng)理解,可以在實(shí)踐中使用微處理器或者數(shù)字信號(hào)處理器(DSP)來(lái)實(shí)現(xiàn)根據(jù)本發(fā)明實(shí)施例的業(yè)務(wù)對(duì)象的展示設(shè)備中的一些或者全部部件的一些或者全部功能。本發(fā)明還可以實(shí)現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的設(shè)備或者裝置程序(例如,計(jì)算機(jī)程序和計(jì)算機(jī)程序產(chǎn)品)。這樣的實(shí)現(xiàn)本發(fā)明的程序可以存儲(chǔ)在計(jì)算機(jī)可讀介質(zhì)上,或者可以具有一個(gè)或者多個(gè)信號(hào)的形式。這樣的信號(hào)可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號(hào)上提供,或者以任何其他形式提供。

應(yīng)該注意的是上述實(shí)施例對(duì)本發(fā)明進(jìn)行說(shuō)明而不是對(duì)本發(fā)明進(jìn)行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計(jì)出替換實(shí)施例。在權(quán)利要求中,不應(yīng)將位于括號(hào)之間的任何參考符號(hào)構(gòu)造成對(duì)權(quán)利要求的限制。單詞“包含”不排除存在未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個(gè)”不排除存在多個(gè)這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當(dāng)編程的計(jì)算機(jī)來(lái)實(shí)現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個(gè)可以是通過(guò)同一個(gè)硬件項(xiàng)來(lái)具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。

本發(fā)明實(shí)施例公開(kāi)了A1、一種業(yè)務(wù)對(duì)象的展示方法,包括:

從第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù);

根據(jù)所述特征數(shù)據(jù)之間的交叉關(guān)系訓(xùn)練模型參數(shù);

當(dāng)查找到第二業(yè)務(wù)對(duì)象時(shí),按照所述模型參數(shù)計(jì)算所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率;

根據(jù)所述預(yù)估點(diǎn)擊率對(duì)所述第二業(yè)務(wù)對(duì)象進(jìn)行展示。

A2、如A1所述的方法,所述從第一業(yè)務(wù)對(duì)象的展示日志和點(diǎn)擊日志中提取特征數(shù)據(jù)的步驟包括:

對(duì)未發(fā)生點(diǎn)擊操作的第一業(yè)務(wù)對(duì)象的展示日志進(jìn)行采樣;

從采樣獲得的第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù)。

A3、如A1所述的方法,所述根據(jù)所述特征數(shù)據(jù)之間的交叉關(guān)系訓(xùn)練模型參數(shù)的步驟包括:

將所述特征數(shù)據(jù)劃分到多個(gè)特征分組中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系;

至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得分組因子分解模型;

對(duì)所述分組因子分解模型進(jìn)行迭代;

當(dāng)?shù)諗繒r(shí),將收斂的結(jié)果設(shè)置為模型參數(shù)。

A4、如A3所述的方法,所述至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得分組因子分解模型的步驟包括:

對(duì)所述多個(gè)特征分組和篩選分組進(jìn)行因子分解,獲得分組因子分解模型;

其中,所述篩選分組包括不涉及交叉關(guān)系的特征數(shù)據(jù)。

A5、如A3所述的方法,所述對(duì)所述分組因子分解模型進(jìn)行迭代的步驟包括:

對(duì)所述分組因子分解模型進(jìn)行采用FTRL方式進(jìn)行迭代。

A6、如A3所述的方法,所述對(duì)所述分組因子分解模型進(jìn)行迭代的步驟包括:

采用異步多線程對(duì)所述分組因子分解模型進(jìn)行迭代。

A7、如A3所述的方法,所述對(duì)所述分組因子分解模型進(jìn)行迭代的步驟包括:

采用預(yù)設(shè)的指令集對(duì)迭代操作進(jìn)行向量化。

A8、如A3所述的方法,所述分組被劃分成多份數(shù)據(jù)集;

所述對(duì)所述分組因子分解模型進(jìn)行迭代的步驟包括:

對(duì)當(dāng)前數(shù)據(jù)集的分組因子分解模型進(jìn)行迭代的同時(shí),加載另一數(shù)據(jù)集。

A9、如A1-A8任一項(xiàng)所述的方法,所述當(dāng)查找到第二業(yè)務(wù)對(duì)象時(shí),按照所述模型參數(shù)計(jì)算所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率的步驟包括:

當(dāng)接收到客戶端發(fā)送的搜索關(guān)鍵詞時(shí),查找綁定所述搜索關(guān)鍵詞的第二業(yè)務(wù)對(duì)象;

將所述模型參數(shù)代入預(yù)設(shè)的點(diǎn)擊率預(yù)估模型中,計(jì)算出所述第二業(yè)務(wù)對(duì) 象的預(yù)估點(diǎn)擊率。

A10、如A9所述的方法,所述將當(dāng)前搜索操作對(duì)應(yīng)的特征數(shù)據(jù)代入由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型中,計(jì)算出所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率的步驟包括:

將當(dāng)前搜索對(duì)應(yīng)的特征數(shù)據(jù)劃分到多個(gè)特征分組中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系

至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型,計(jì)算出所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率。

A11、如A10所述的方法,所述至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型的步驟包括:

對(duì)所述多個(gè)特征分組和篩選分組進(jìn)行因子分解,獲得由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型;

其中,所述篩選分組包括不涉及交叉關(guān)系的特征數(shù)據(jù)。

A12、如A1-A8任一項(xiàng)所述的方法,所述根據(jù)所述預(yù)估點(diǎn)擊率對(duì)所述第二業(yè)務(wù)對(duì)象進(jìn)行展示的步驟包括:

采用所述預(yù)估點(diǎn)擊率計(jì)算所述第二業(yè)務(wù)對(duì)象的排序權(quán)重;

將排序權(quán)重最高的一個(gè)或多個(gè)第二業(yè)務(wù)對(duì)象發(fā)送至客戶端進(jìn)行展示。

本發(fā)明實(shí)施例還公開(kāi)了B13、一種業(yè)務(wù)對(duì)象的展示裝置,包括:

特征數(shù)據(jù)提取模塊,適于從第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù);

模型參數(shù)訓(xùn)練模塊,適于根據(jù)所述特征數(shù)據(jù)之間的交叉關(guān)系訓(xùn)練模型參數(shù);

預(yù)估點(diǎn)擊率計(jì)算模塊,適于在查找到第二業(yè)務(wù)對(duì)象時(shí),按照所述模型參數(shù)計(jì)算所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率;

業(yè)務(wù)對(duì)象展示模塊,適于根據(jù)所述預(yù)估點(diǎn)擊率對(duì)所述第二業(yè)務(wù)對(duì)象進(jìn)行展示。

B14、如B13所述的裝置,所述特征數(shù)據(jù)提取模塊還適于:

對(duì)未發(fā)生點(diǎn)擊操作的第一業(yè)務(wù)對(duì)象的展示日志進(jìn)行采樣;

從采樣獲得的第一業(yè)務(wù)對(duì)象的展示日志中提取特征數(shù)據(jù)。

B15、如B13所述的裝置,所述模型參數(shù)訓(xùn)練模塊還適于:

將所述特征數(shù)據(jù)劃分到多個(gè)特征分組中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系;

至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得分組因子分解模型;

對(duì)所述分組因子分解模型進(jìn)行迭代;

當(dāng)?shù)諗繒r(shí),將收斂的結(jié)果設(shè)置為模型參數(shù)。

B16、如B15所述的裝置,所述模型參數(shù)訓(xùn)練模塊還適于:

對(duì)所述多個(gè)特征分組和篩選分組進(jìn)行因子分解,獲得分組因子分解模型;

其中,所述篩選分組包括不涉及交叉關(guān)系的特征數(shù)據(jù)。

B17、如B15所述的裝置,所述模型參數(shù)訓(xùn)練模塊還適于:

對(duì)所述分組因子分解模型進(jìn)行采用FTRL方式進(jìn)行迭代。

B18、如B15所述的裝置,所述模型參數(shù)訓(xùn)練模塊還適于:

采用異步多線程對(duì)所述分組因子分解模型進(jìn)行迭代。

B19、如B15所述的裝置,所述模型參數(shù)訓(xùn)練模塊還適于:

采用預(yù)設(shè)的指令集對(duì)迭代操作進(jìn)行向量化。

B20、如B15所述的裝置,所述分組被劃分成多份數(shù)據(jù)集;

所述模型參數(shù)訓(xùn)練模塊還適于:

對(duì)當(dāng)前數(shù)據(jù)集的分組因子分解模型進(jìn)行迭代的同時(shí),加載另一數(shù)據(jù)集。

B21、如B13-B20任一項(xiàng)所述的裝置,所述預(yù)估點(diǎn)擊率計(jì)算模塊還適于:

當(dāng)接收到客戶端發(fā)送的搜索關(guān)鍵詞時(shí),查找綁定所述搜索關(guān)鍵詞的第二業(yè)務(wù)對(duì)象;

將所述模型參數(shù)代入預(yù)設(shè)的點(diǎn)擊率預(yù)估模型中,計(jì)算出所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率。

B22、如B21所述的裝置,所述預(yù)估點(diǎn)擊率計(jì)算模塊還適于:

將當(dāng)前搜索對(duì)應(yīng)的特征數(shù)據(jù)劃分到多個(gè)特征分組中,同一個(gè)特征分組的特征數(shù)據(jù)不具有交叉關(guān)系,不同特征分組之間的特征數(shù)據(jù)具有交叉關(guān)系

至少對(duì)所述多個(gè)特征分組進(jìn)行因子分解,獲得由所述模型參數(shù)構(gòu)建的點(diǎn) 擊率預(yù)估模型,計(jì)算出所述第二業(yè)務(wù)對(duì)象的預(yù)估點(diǎn)擊率。

B23、如B22所述的裝置,所述預(yù)估點(diǎn)擊率計(jì)算模塊還適于:

對(duì)所述多個(gè)特征分組和篩選分組進(jìn)行因子分解,獲得由所述模型參數(shù)構(gòu)建的點(diǎn)擊率預(yù)估模型;

其中,所述篩選分組包括不涉及交叉關(guān)系的特征數(shù)據(jù)。

B24、如B13-B20任一項(xiàng)所述的裝置,所述業(yè)務(wù)對(duì)象展示模塊還適于:

采用所述預(yù)估點(diǎn)擊率計(jì)算所述第二業(yè)務(wù)對(duì)象的排序權(quán)重;

將排序權(quán)重最高的一個(gè)或多個(gè)第二業(yè)務(wù)對(duì)象發(fā)送至客戶端進(jìn)行展示。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
安丘市| 三江| 莫力| 建瓯市| 鹤岗市| 葵青区| 门源| 东莞市| 孙吴县| 兴和县| 太白县| 靖安县| 临湘市| 新和县| 策勒县| 循化| 曲沃县| 黄山市| 永修县| 宜丰县| 西乌| 漠河县| 朝阳区| 寻甸| 岳普湖县| 神农架林区| 迁安市| 邓州市| 大港区| 岢岚县| 井冈山市| 茂名市| 手机| 中阳县| 裕民县| 思茅市| 竹溪县| 水富县| 梅州市| 融水| 马鞍山市|