1.一種基于大數(shù)據(jù)驅(qū)動的在線廣告精準(zhǔn)投放方法,其特征在于,包括:
基于大數(shù)據(jù)分析對用戶行為進(jìn)行標(biāo)簽化處理,所述用戶行為包括:用戶設(shè)備信息、瀏覽器cookie、瀏覽URL歷史、廣告點(diǎn)擊歷史、自有ID體系,通過對用戶行為數(shù)據(jù)的分析,對用戶行為進(jìn)行標(biāo)簽化處理,所述對用戶行為進(jìn)行標(biāo)簽化處理后的用戶標(biāo)簽輸出格式為:用戶ID、用戶標(biāo)簽;
獲取用戶訪問網(wǎng)站頁面時(shí)加載的廣告位代碼信息,提取用戶特征信息,并將廣告位代碼信息和用戶特征信息返回至在線廣告精準(zhǔn)投放系統(tǒng),用戶通過internet訪問網(wǎng)站頁面時(shí)會加載廣告位,通過獲取用戶廣告位代碼,獲取到用戶的訪問IP、訪問時(shí)間、瀏覽器Cookie信息,將獲取的用戶特征信息和廣告位代碼信息返回至在線廣告精準(zhǔn)投放系統(tǒng);
在線廣告精準(zhǔn)投放系統(tǒng)通過廣告實(shí)時(shí)競價(jià)和興趣權(quán)重,進(jìn)行廣告匹配精準(zhǔn)投放,當(dāng)在線廣告精準(zhǔn)投放系統(tǒng)獲取到用戶返回信息時(shí),通過實(shí)時(shí)競價(jià)技術(shù)進(jìn)行實(shí)時(shí)競價(jià),對符合要求的廣告集跟據(jù)用戶興趣權(quán)重和用戶競價(jià)高低,篩選出最終唯一的廣告對用戶進(jìn)行展示。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取用戶訪問網(wǎng)站頁面時(shí)加載的廣告位代碼信息,提取用戶特征信息,并將廣告位代碼信息和用戶特征信息返回至在線廣告精準(zhǔn)投放系統(tǒng),包括:
解析用戶訪問網(wǎng)站頁面時(shí)加載的廣告位代碼信息,解析廣告位代碼信息內(nèi)容包括:用戶訪問時(shí)間、用戶訪問IP、用戶cookie、廣告內(nèi)容信息、廣告發(fā)布商戶信息、廣告發(fā)布平臺信息、加載網(wǎng)站頁面的URL信息、廣告點(diǎn)擊歷史信息、同一地址廣告點(diǎn)擊次數(shù)信息、廣告點(diǎn)擊事件信息;
通過特征向量,提取用戶特征信息,定義用戶的相似性,建立用戶聚類模型,所述特征向量是指把每個(gè)網(wǎng)絡(luò)用戶在一定時(shí)間內(nèi)瀏覽的所有內(nèi)容看作是一個(gè)文本信息,將每個(gè)文本信息映射成為能夠表示所述網(wǎng)絡(luò)用戶特征信息的特征向量,使用余弦相似性求出兩個(gè)向量之間的相似性,即文本信息之間的相似性;
利用k-means算法進(jìn)行用戶聚類,根據(jù)應(yīng)用需要調(diào)整聚類的大小和分辨率,所述K-means算法是硬聚類算法,是基于原型的目標(biāo)函數(shù)聚類方法,是數(shù)據(jù)點(diǎn)到原型的距離作為優(yōu)化的目標(biāo)函數(shù),利用函數(shù)求極值的方法得到迭代運(yùn)算的調(diào)整規(guī)則。
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述在線廣告精準(zhǔn)投放系統(tǒng)通過廣告實(shí)時(shí)競價(jià)和興趣權(quán)重,進(jìn)行廣告匹配精準(zhǔn)投放包括:
用戶訪問網(wǎng)頁請求,通過日志的形式實(shí)時(shí)返回用戶信息到在線廣告精準(zhǔn)投放系統(tǒng),并根據(jù)文本包含的內(nèi)容,篩選出符合當(dāng)前用戶興趣的廣告集;
在線廣告精準(zhǔn)投放系統(tǒng)通過廣告開關(guān)的狀態(tài)進(jìn)行實(shí)時(shí)廣告精準(zhǔn)投放。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述當(dāng)在線廣告精準(zhǔn)投放系統(tǒng)獲取到用戶返回信息時(shí),通過實(shí)時(shí)競價(jià)技術(shù)進(jìn)行實(shí)時(shí)競價(jià),符合要求的廣告集跟據(jù)用戶興趣權(quán)重和用戶競價(jià)高低,篩選出最終唯一的廣告對用戶進(jìn)行展示,包括:
實(shí)時(shí)競價(jià)技術(shù)對網(wǎng)站消息按照事先約定解包,在內(nèi)部依靠網(wǎng)頁信息數(shù)據(jù)進(jìn)行計(jì)算;
返回pb或json格式的競價(jià)價(jià)格和廣告代碼給在線廣告精準(zhǔn)投放系統(tǒng);
根據(jù)出價(jià)權(quán)重和和興趣權(quán)重,計(jì)算每個(gè)廣告集的權(quán)重值,換算成廣告投放概率。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述文本包含的內(nèi)容包括:用戶訪問的時(shí)間、用戶IP和瀏覽器cookie。
6.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述k-means算法包括:
從N個(gè)文本信息中隨機(jī)選取K個(gè)文本信息作為質(zhì)心;
測量剩余的每個(gè)文本信息到每個(gè)質(zhì)心的距離,并把它歸到最近的質(zhì)心的類;
重新計(jì)算已經(jīng)得到的各個(gè)類的質(zhì)心;
迭代上述兩個(gè)步驟,直至新的質(zhì)心與原質(zhì)心相等或小于指定閾值,算法結(jié)束。
7.一種基于大數(shù)據(jù)驅(qū)動的在線廣告精準(zhǔn)投放系統(tǒng),其特征在于,包括:用戶行為標(biāo)簽管理模塊、廣告位代碼提取模塊、用戶特征信息提取模塊、廣告投放模塊、廣告訂單管理模塊;
所述用戶行為標(biāo)簽管理模塊通過對用戶行為數(shù)據(jù)的分析,對用戶行為進(jìn)行標(biāo)簽化處理,所述對用戶行為進(jìn)行標(biāo)簽化處理后的用戶標(biāo)簽輸出格式為:用戶ID、用戶標(biāo)簽;
所述廣告位代碼提取模塊提取經(jīng)過用戶行為標(biāo)簽管理模塊處理過的用戶標(biāo)簽,按照用戶通過internet訪問網(wǎng)站頁面時(shí)會加載廣告位,解析獲取用戶廣告位代碼信息;
所述用戶特征信息提取模塊通過廣告位代碼提取模塊獲得的用戶廣告位代碼信息,提取用戶的訪問IP、訪問時(shí)間、瀏覽器Cookie的用戶特征信息;
所述廣告投放模塊通過廣告位代碼提取模塊、用戶特征信息提取模塊獲取的廣告位代碼信息和用戶特征信息,獲取用戶的興趣權(quán)重,根據(jù)實(shí)時(shí)競價(jià)技術(shù),獲取實(shí)時(shí)競價(jià)權(quán)重,進(jìn)行實(shí)時(shí)廣告精準(zhǔn)投放;
所述廣告訂單管理模塊在用戶創(chuàng)建廣告訂單后和人群標(biāo)簽進(jìn)行匹配,所述訂單管理模塊采用倒敘排列隊(duì)列方式等待請求。
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述廣告位代碼提取模塊解析廣告位代碼信息內(nèi)容包括:用戶訪問時(shí)間、用戶訪問IP、用戶cookie、廣告內(nèi)容信息、廣告發(fā)布商戶信息、廣告發(fā)布平臺信息、加載網(wǎng)站頁面的URL信息、廣告點(diǎn)擊歷史信息、同一地址廣告點(diǎn)擊次數(shù)信息、廣告點(diǎn)擊事件信息。
9.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述廣告投放模塊通過廣告開關(guān)的狀態(tài)進(jìn)行實(shí)時(shí)廣告精準(zhǔn)投放。
10.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述實(shí)時(shí)競價(jià)技術(shù)實(shí)時(shí)競價(jià)技術(shù)對網(wǎng)站消息按照事先約定解包,在內(nèi)部依靠網(wǎng)頁信息數(shù)據(jù)進(jìn)行計(jì)算,最終返回pb或json格式的競價(jià)價(jià)格和廣告代碼給廣告投放模塊。
11.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述廣告訂單管理模塊包括:廣告計(jì)劃管理、廣告創(chuàng)意管理、廣告投放數(shù)據(jù)報(bào)表,所述廣告計(jì)劃管理包含廣告創(chuàng)意管理,所述的廣告訂單管理模塊為用戶創(chuàng)建廣告訂單進(jìn)行管理、對廣告投放效果數(shù)據(jù)進(jìn)行監(jiān)測。