欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

推送信息粗選排序方法及裝置與流程

文檔序號:12818950閱讀:428來源:國知局
推送信息粗選排序方法及裝置與流程

本發(fā)明涉及信息處理領域,尤其涉及一種推送信息粗選排序方法及裝置。



背景技術:

隨著信息技術的發(fā)展,在信息推送領域確定出信息推送的目標用戶以提升信息推送的效率是現(xiàn)有技術中一直致力解決的問題。所述信息推送包括廣告推送,向用戶推薦的視頻、音頻以及圖文信息等。為了向用戶發(fā)送感興趣的推送信息,提高推送信息的傳達率及資源有效利用率,會對各個推送信息進行受歡迎程度的排序預測。在進行預測時,包括預測值的粗選排序及精選排序。在粗選排序中將根據(jù)推送信息目前的數(shù)據(jù),從成千上萬數(shù)量級的推送信息中選擇少量的受歡迎程度較高的推送信息,再由精選排序進一步對粗選出的推送信息進行受歡迎程度、被觀看或被點擊的預測概率再次進行精確的排序。然而在現(xiàn)有技術中發(fā)現(xiàn),通常某些推送信息是非常受用戶歡迎的,但是有推送的時間短等問題,導致在粗選中就被過濾掉了,導致的處理結(jié)果精確度低等問題。



技術實現(xiàn)要素:

有鑒于此,本發(fā)明實施例期望提供一種推送信息粗選排序方法及裝置,至少部分解決粗選結(jié)果精確度低的問題。

為達到上述目的,本發(fā)明的技術方案是這樣實現(xiàn)的:

本發(fā)明實施例第一方面提供了一種推送信息粗選方法,所述方法包括:

根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特征及所述特征對應的權(quán)值;

計算所述特征的標準差;

確定所述標準差的波動概率;

基于所述權(quán)值、標準差及波動概率,計算所述預測值;其中,所述標準差和所述波動概率用于計算得到修正所述權(quán)值的波動值;

基于所述預測值,選擇滿足預設條件的推送信息。

基于上述方案,所述方法還包括:

確定波動系數(shù);其中,所述波動系數(shù)用于限制所述波動值的取值范圍;

所述基于所述權(quán)值、標準差及波動概率,計算所述預測值,包括:

基于所述權(quán)值、標準差、波動概率及所述波動系數(shù),計算所述預測值。

基于上述方案,所述方法還包括:

確定安全因子,其中,所述安全因子用于防止所述標準差異為特定值或未獲取到標準差時導致的波動值求解異常;

所述基于所述權(quán)值、標準差及波動概率,計算所述預測值,包括:

基于所述權(quán)值、標準差、波動概率及所述安全因子,計算所述預測值。

基于上述方案,述預測值,包括:

利用如下公式計算所述預測值y;

其中,所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述α為所述波動系數(shù);所述β為所述安全因子;所述σi為所述特征的標準差。

基于上述方案,所述根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特征及所述特征對應的權(quán)值,包括:

確定用于計算所述預測值的推送信息特征;

確定用于計算所述預測值的用戶特征。

基于上述方案,所述確定用于計算所述預測值的用戶特征,包括:

確定各種用戶特征的可信度;

基于所述可信度,選擇用于計算所述預測值的用戶特征。

基于上述方案,所述確定用于計算所述預測值的用戶特征,包括:

從各種用戶特征中選擇出一個或多個非加工用戶特征,作為用于計算所述預測值的用戶特征。

本發(fā)明實施例第二方面提供一種推送信息粗選裝置,所述裝置包括確定單元、計算單元及選擇單元;

所述確定單元,用于根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特征及所述特征對應的權(quán)值;

所述計算單元,用于計算所述特征的標準差;

所述確定單元,還用于確定所述標準差的波動概率;

所述計算單元,還用于基于所述權(quán)值、標準差及波動概率,計算所述預測值;其中,所述標準差和所述波動概率用于計算得到修正所述權(quán)值的波動值;

所述選擇單元,用于基于所述預測值,選擇滿足預設條件的推送信息。

基于上述方案,所述確定單元,還用于確定波動系數(shù);其中,所述波動系數(shù)用于限制所述波動值的取值范圍;

所述計算單元,具體用于基于所述權(quán)值、標準差、波動概率及所述波動系數(shù),計算所述預測值。

基于上述方案,所述確定單元,具體用于確定安全因子,其中,所述安全因子用于防止所述標準差異為特定值或未獲取到標準差時導致的波動值求解異常;

所述計算單元,具體用于基于所述權(quán)值、標準差、波動概率及所述安全因子,計算所述預測值。

基于上述方案,所述計算單元,具體用于利用如下公式計算所述預測值y;

其中,所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述α為所述 波動系數(shù);所述β為所述安全因子;所述σi為所述特征的標準差。

基于上述方案,所述確定單元,具體用于確定用于計算所述預測值的推送信息特征;確定用于計算所述預測值的用戶特征。

基于上述方案,所述確定單元,具體用于確定各種用戶特征的可信度;基于所述可信度,選擇用于計算所述預測值的用戶特征。

基于上述方案,所述確定單元,具體用于從各種用戶特征中選擇出一個或多個非加工用戶特征,作為用于計算所述預測值的用戶特征。

本發(fā)明實施例提供的推送信息粗選方法及裝置,在進行用于粗選的預測值計算時,將計算特征的標準差,并確定對應特征的波動概率,而標準差和波動概率能夠用于計算出修正該特征對應的權(quán)值的波動值。這樣的話,有利于目前歷史推送數(shù)據(jù)較小的推送信息在標準值波動較大的情況下,也能有機會作為被粗選出的推送信息進入后續(xù)精選的再次選擇;能夠解決現(xiàn)有技術中部分推送信息因歷史推送數(shù)據(jù)少,但是推送效果佳的訂單在粗選中被篩選掉,導致最終沒能選擇出推送效果佳的推送信息,提升了粗選的精確度。

附圖說明

圖1為本發(fā)明實施例提供的第一種推送信息粗選方法的流程示意圖;

圖2為本發(fā)明實施例提供的第二種推送信息粗選方法的流程示意圖;

圖3為本發(fā)明實施例提供的第一種推送信息粗選裝置的結(jié)構(gòu)示意圖;

圖4為本發(fā)明實施例提供的第二種推送信息粗選裝置的結(jié)構(gòu)示意圖;

圖5為本發(fā)明實施例提供的預測值的計算示意流程圖。

具體實施方式

以下結(jié)合說明書附圖及具體實施例對本發(fā)明的技術方案做進一步的詳細闡述。

實施例一:

如圖1所示,本實施例提供一種推送信息粗選方法,所述方法包括:

步驟s110:根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特征及所述特征對應的權(quán)值;

步驟s120:計算所述特征的標準差;

步驟s130:確定所述標準差的波動概率;

步驟s140:基于所述權(quán)值、標準差及波動概率,計算所述預測值;其中,所述標準差和所述波動概率用于計算得到修正所述權(quán)值的波動值;

步驟s150:基于所述預測值,選擇滿足預設條件的推送信息。

本實施例所述的推送信息可包括廣告等信息。這里的廣告可包括社交廣告等各種類型的廣告。本實施例所述的推送信息粗選方法,可以應用于各種推送信息的推送平臺中,也可以用于各種確定采用作為效果推送信息的選擇設備中。

在本實施例中所述步驟s110將根據(jù)推送信息的歷史推送數(shù)據(jù),這里的歷史推送數(shù)據(jù)對應于廣告可包括歷史廣告數(shù)據(jù)。這里的歷史廣告數(shù)據(jù)可包括點擊了或觀看了或執(zhí)行廣告期待的轉(zhuǎn)換行為的種子用戶、行為有效期及點擊率、轉(zhuǎn)換率、廣告投放位、廣告投放時間等各種基于推送信息在推送過程中形成的各種數(shù)據(jù)。所述轉(zhuǎn)換行為可包括下載應用(application,app)、購買對應的推送信息中推廣的各自服務、商品等推送信息希望用戶執(zhí)行的操作。

在本實施例中步驟s120中計算的標準差為針對某一特征的標準差。這的標準差為:該特征為指定值時,歷史推送數(shù)據(jù)中操作結(jié)果的標準差。這里的操作結(jié)果用于表征特征為指定值的用戶是否執(zhí)行了該推送數(shù)據(jù)期望的操作的取值。例如,以廣告a為例,對應的特征為年齡;若4個比特分別表示4個不同的年齡段。假設用戶c在第1個年齡段,則對應于第1個年齡段的第1個比特為1,其他比特為0;則此時年齡這一特征的取值為1000。在計算標準差時,若取年齡特征為1000的歷史推送數(shù)據(jù)的數(shù)據(jù)行,這些數(shù)據(jù)行中包括用戶是否點擊了廣告a的操作結(jié)果列。假設在操作結(jié)果列中以“1”表示點擊了該廣告,“0”表示未點擊該廣告。例如,在歷史推送數(shù)據(jù)的數(shù)據(jù)行中有50個數(shù)據(jù)行的年齡特征的取值為1000,則提取這50個列的結(jié)果列作為樣本數(shù)據(jù),求解標準差。求解出的該標準差即為年齡特征在取第1年齡段的標準差。在計算預測值時,會確 定出接收該推送信息的用戶集,提取這些用戶的年齡特征,例如,利用上述計算出的標準差,可以計算出在第1年齡段的用戶間推送,該廣告被點擊的概率值。再比如,該特征的取值為“性別為女”,該“性別為女”這一個特征的標準差為,歷史推送數(shù)據(jù)中女性執(zhí)行該推送信息期望的轉(zhuǎn)換操作的標準差。例如,女性點擊該廣告的標準差。

步驟s130中確定所述標準差的波動概率,在本實施例中可以采用預設算法確定所述波動概率,例如采用隨機算法確定所述波動概率,這里的隨機算法包括高斯隨機算法。

在步驟s140中基于所述權(quán)值、標準差及波動概率,計算所述預測值。這里的權(quán)值為對應進行預測值計算的每一個特征的權(quán)值。

在本實施例中參與所述預測值計算的特征可包括推送信息的特征及用戶特征。這里的推送信息的特征可包括推送位、推送標識。這里的推送標識可為推送信息的序列號;所述推送位可包括發(fā)布所述推送信息的發(fā)布位。這里的發(fā)布位可包括社交應用上的信息發(fā)布位,例如,微信朋友圈、應用登錄界面首頁,再比如應用頁面的頁首部位。當然這里的發(fā)布位還可包括瀏覽器的首頁、瀏覽器的側(cè)邊廣告位及懸浮窗等。所述用戶特征可包括閱讀了該推送信息,點擊了該推送信息或執(zhí)行了該推送信息期待的其他轉(zhuǎn)換行為的用戶的特征。這些用戶特征可包括用戶的年齡、性別、職業(yè)、行為偏好、興趣愛好及消費水平等各種能夠表征用戶特點的特征。

在本實施例中所述預測值可用于表征繼續(xù)發(fā)布該推送信息,用戶將執(zhí)行該推送信息期待的轉(zhuǎn)換行為的概率。例如,發(fā)布廣告a一段時間了,根據(jù)廣告a已發(fā)布形成的歷史廣告數(shù)據(jù),計算出所述特征標準差。在步驟s130中確定出波動概率,在步驟s140中利用標準差和波動概率修正權(quán)值,得到一個后修正后的權(quán)值,再利用修正后的權(quán)值預測出后續(xù)廣告a將被點擊的概率。

在步驟s140中具體可用入校公式計算所述預測值:

在上述公式中,所述y為所述預測值,所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述σi為所述特征的標準差。在本實施例中利用的是邏輯回歸算法來計算所述預測值,在具體實現(xiàn)時還可以利用頁貝斯算法來計算所述預測值。其中為基于波動概率及標準差計算得到的修正后的權(quán)值,在也貝斯算法中也可以利用修正后的權(quán)值替代原有的權(quán)值,同樣計算得到本實施例中所述預測值。值得注意的是在本實施例中特征共有i個,所述i的取值從1到i。這里的i為不小于1的整數(shù)。值得注意的是:這里的為e的指數(shù)。所述e為自然常數(shù)。

在具體實現(xiàn)時,可以根據(jù)各個推送信息的預測值,進行預測值大小的排序,然后選擇排序靠前的推送信息作為本次推送信息粗選的粗選結(jié)果;或者將預測值大于粗選閾值的推送信息作為本次推送信息粗選的粗選結(jié)果??傊趫?zhí)行完本實施例中所述的步驟s140之后,還可基于預測值選擇滿足預設條件的推送信息。這里選擇出的推送信息可作為效果推送的推送信息。這里的效果推送可為基于推送效果進行付費的推送操作。

在本實施例中因引入了標準差和波動概率來修正權(quán)值,這樣的話,對于目前推送時間較短或推送量較小的推送信息,但是達到預期的推送效果的推送信息參與競爭,減少粗選的時后這些推送量較少的推送信息因為推送量較少導致被遺漏的現(xiàn)象,從而提升了粗選選擇出推送效果佳的推送信息。例如,廣告以訂單進行標識,有些訂單才被投放到廣告平臺,由于投放時間短或投放量少導致歷史廣告數(shù)據(jù)較少,若采用現(xiàn)有技術進行訂單粗選,很容易將這些投放量或投放時間短的廣告篩選掉,從而導致粗選出的廣告并不是投放效果最好的一個或多個廣告,導致粗選的精確度低等現(xiàn)象。但是利用本實施例所述的信息處理方法,將通過撥動概率及標準差的引入,減少因為歷史推送數(shù)據(jù)少導致的數(shù)據(jù)撥動性大,導致的將推送效果優(yōu)良的推送信息漏選的現(xiàn)象,提升了粗選的精確 度。

實施例二:

如圖1所示,本實施例提供一種推送信息粗選方法,所述方法包括:

步驟s110:根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特征及所述特征對應的權(quán)值;

步驟s120:計算所述特征的標準差;

步驟s130:確定所述標準差的波動概率;

步驟s140:基于所述權(quán)值、標準差及波動概率,計算所述預測值;其中,所述標準差和所述波動概率用于計算得到修正所述權(quán)值的波動值;

步驟s150:基于所述預測值,選擇滿足預設條件的推送信息。

所述方法還包括:

確定波動系數(shù);其中,所述波動系數(shù)用于限制所述波動值的取值范圍;

所述步驟s140可包括:基于所述權(quán)值、標準差、波動概率及所述波動系數(shù),計算所述預測值。

在本實施例所述方法中還引入了波動系數(shù),這里的波動系數(shù)用于限制所述波動值的取值范圍。當一個特征的標準差過大時,若采用前述實施例的所述方法就可能導致波動值的取值過大的現(xiàn)象,在本實施例中引入了波動系數(shù),波動系數(shù)可用于與基于波動概率和標準差得到的結(jié)果進行乘積運算,得到所述波動值。在本實施例中所述波動系數(shù)通常為大于0且不大于1的整數(shù)。若所述波動系數(shù)取值為0,在本例子中則波動值可為0,這時就不對權(quán)值進行修正,忽略的因歷史推動數(shù)據(jù)的數(shù)據(jù)量少導致的標準差浮動大的現(xiàn)象。所述波動系數(shù)可為預先設置的參數(shù),具體可根據(jù)歷史操作記錄得到的經(jīng)驗值,也可以實驗數(shù)據(jù)通過一次或多次實驗得到的實驗值,總之在計算本實施例所述推送信息粗選方法時,可預先知道的一個取值。在本實施例中,引入了波動系數(shù)調(diào)整所述波動值,以避免所述波動值過大或過小,以避免因特征值的波動過大導致的計算結(jié)果不夠精確現(xiàn)象,進一步提升了粗選的精確度。

圖2為本實施例所述推送信息粗選方法的另一個流程示意圖,具體包括: 提取推送信息特征和用戶特征,計算標準差;這里的計算標準差包括計算各個用于計算預測值的特征的標準差。在計算標注差的同時或之前或之后,還將確定波動系數(shù)、確定安全因子、確定波動概率;接著,基于波動概率、標準差、波動系數(shù)及安全因子,計算預測值;最后對預測值進行排序,形成排序結(jié)果;基于排序結(jié)果選擇預測值靠前的推送信息作為推送結(jié)果。

實施例三:

如圖1所示,本實施例提供一種推送信息粗選方法,所述方法包括:

步驟s110:根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特征及所述特征對應的權(quán)值;

步驟s120:計算所述特征的標準差;

步驟s130:確定所述標準差的波動概率;

步驟s140:基于所述權(quán)值、標準差及波動概率,計算所述預測值;其中,所述標準差和所述波動概率用于計算得到修正所述權(quán)值的波動值;

步驟s150:基于所述預測值,選擇滿足預設條件的推送信息。

所述方法還包括:

確定波動系數(shù);其中,所述波動系數(shù)用于限制所述波動值的取值范圍;

所述步驟s150可包括:基于所述權(quán)值、標準差、波動概率及所述波動系數(shù),計算所述預測值。

所述方法還包括:

確定安全因子,其中,所述安全因子用于防止所述標準差異為特定值或未獲取到標準差時導致的波動值求解異常;

所述步驟s140可包括:

基于所述權(quán)值、標準差、波動概率及所述安全因子,計算所述預測值。

在本實施例中還引入了安全因子,若出現(xiàn)所述標準差異?;驑O端的情況,如何確定所述標準差異常,例如所述標準差的取值為特定值,具體如,所述標準差為0。在本實施例中所述未獲取到標準差也為一種標準差異常的情況下,通常若未獲得標準差將默認所述標準差為0。若所述標準差為0,則可能導致波 動值為0,在本實施例中將引入一個安全因子。所述安全因子通常為一個極小的正數(shù)。在本實施例中所述安全因子為小于預定值的常數(shù),例如,一般可為不大于千分之一的常數(shù),例如所述安全因子的取值為萬分之一。

在標準差正常時,因為極小對波動值的計算干擾極小,當表征差異常時,所述安全因子因為為極小的正數(shù),從而使得波動值不為0,但是通常會使波動值極小。這樣,通過安全因子的引入,電子設備在計算所述波動值異常導致的預測值異常等現(xiàn)象。

作為本實施例的進一步改進,以下特別提出一種基于波動概率、標準差、安全因子及波動系數(shù)的一個具可選示例。所述步驟s150可包括:

利用如下公式計算所述預測值y

其中,所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述α為所述波動系數(shù);所述β為所述安全因子;所述σi為所述特征的標準差。

顯然在本實施例中所述σi不能為0,否則會導致出現(xiàn)異常,進而導致波動值異常,這樣會導致預測值計算的異常。當然在具體實現(xiàn)時,也很難出現(xiàn)推送信息的特征取值的標準差為0的現(xiàn)象。

在本實施例中同樣值得注意的是在本實施例中特征共有i個,所述i的取值從1到i。這里的i為不小于1的整數(shù)。

通過上述公式,可以簡便的精確的計算出進行推送信息粗選的預測值,且在計算的過程中異常出現(xiàn)的概率較小,波動值的取值范圍也可在控制范圍內(nèi);大大的提升了推送信息粗選的精確度。

實施例四:

如圖1所示,本實施例提供一種推送信息粗選方法,所述方法包括:

步驟s110:根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特 征及所述特征對應的權(quán)值;

步驟s120:計算所述特征的標準差;

步驟s130:確定所述標準差的波動概率;

步驟s140:基于所述權(quán)值、標準差及波動概率,計算所述預測值;其中,所述標準差和所述波動概率用于計算得到修正所述權(quán)值的波動值;

步驟s150:基于所述預測值,選擇滿足預設條件的推送信息。

首先本實施例所述推送信息粗選方法,為在前述實施例中任意一個技術方案上的改進,例如所述步驟s140可以采用實施例三中提供的公式計算所述預測值。本實施例與上述實施例不同的在于,所述步驟s110可包括:

確定用于計算所述預測值的推送信息特征;

確定用于計算所述預測值的用戶特征。

這里的推送信息特征可包括推送信息的發(fā)布位、發(fā)布時間、推送信息的時長、推送信息的信息量及推送信息的標識等各種信息。

這里的計算所述預測值的用戶特征,這里的用戶特征可包括用戶年齡、性別、膚色、國籍及職業(yè)等各種特征。所述i的取值在本實施例中可為推送信息特征和用戶特征的個數(shù)和。

在現(xiàn)有技術中通常進行推送信息粗選時,將僅依據(jù)推送信息特征來進行推送信息的粗選,這樣導致的結(jié)果是忽略的用戶特點對推送信息的推送效果的影響,從而會導致推送效果佳的推送信息的預測值低的現(xiàn)象。首先,在本實施例中將引入用戶特征,將用戶特征作為計算所述預測值的特征。若結(jié)合實施例一至實施例三提供的技術方案,則所述xi可為推送信息特征或用戶特征的取值,以進一步提升推送信息粗選的精確度。其次,在本實施例中將通過用戶特征的確定,選擇出用戶的少量用戶特征作為所述預測值的計算的用戶特征,而并非所有的用戶特征,這樣可以避免用戶特征過多,導致的計算量大的顯現(xiàn)。例如,在本實施例中將確定指定個數(shù)的用戶特征參與所述預測值的計算。這里的指定個數(shù)為事先確定的值,通常這里的指定個數(shù)為不小于1的整數(shù),優(yōu)選為2個或 2個以上的用戶特征。

在選擇所述推送信息特征時可以參見現(xiàn)有技術,再此就不一一詳細介紹了,進行所述用戶特征的篩選也有很多種,以下提供兩種可選方式:

可選方式一:

所述步驟s110中確定用于計算所述預測值的用戶特征可包括:

確定各種用戶特征的可信度;

基于所述可信度,選擇用于計算所述預測值的用戶特征。

在本實施例中所述可信度可為用戶特征的真實性或正確性的概率。確定用戶特征的可信度可以根據(jù)所述用戶特征的獲取方式進行賦值得到。例如,所述獲取方式可包括基于用戶輸入確定的特征及電子設備自動進行信息處理整合得到的特征。例如,用戶在社交網(wǎng)絡中自行填寫的性別、年齡及畢業(yè)院校等。所述電子設備整合的特征包括基于用戶操作確定的用戶行為偏好等特征。在確定所述可信度時,還可根據(jù)用戶特征的特征屬性來確定。例如,電子設備統(tǒng)計用戶登錄關注某一話題的頻次信息,和用戶自行填寫的頻次信息,這時可結(jié)合用戶特征屬性及信息來源。這個時候在確定所述可信度時,由于時頻次信息電子設備的統(tǒng)計在大多數(shù)情況下將比用戶自行填寫更加準確;在進行可信度賦值時就可以給若該頻次信息是電子設備自行統(tǒng)計的則賦予更高的值,若是用戶填寫的則賦予較低的值。再比如針對用戶性別,電子設備可以通過用戶行為特點分析出該用戶是女性用戶還是男性用戶,但是顯然在社交比較透明的社交應用中,或熟人社交中,用戶自行填寫或好友填寫的用戶性別,會比電子設備根據(jù)用戶行為特點更加精確,這個時候?qū)⒔Y(jié)合特征屬性和信息來源兩種方式為用戶特征進行可信度賦值。在具體實現(xiàn)時,確定所述用戶特征的可信度的方式還有多種,在本實施例中就不一一舉例了。

若可信度一旦確定,就可以根據(jù)可信度選擇用于進行預測值計算的用戶特征,根據(jù)可信度從高到底,選擇出排序靠前的n個可信度對應的用戶特征作為計算所述預測值的用戶特征,再比如選擇出可信度大于可信度閾值的用戶特征作為所述預測值的用戶特征。

可選方式二:

所述步驟s110中確定用于計算所述預測值的用戶特征可包括:

從各種用戶特征中選擇出一個或多個非加工用戶特征,作為用于計算所述預測值的用戶特征。

在本實施例中將用戶特征分為加工特征和非加工特征,這里的加工特征為基于對多個信息的處理得到的特征;而非加工特征可包括用戶自動填寫的特征,沒有進行過信息二次整合等方式確定的。例如,通過身份證掃描得到的用戶的年齡、姓名、身份證號及原籍地址都是所述非加工特征。再比如,根據(jù)記錄著用戶每一次打開應用a的統(tǒng)計頻次,這個通過直接統(tǒng)計操作,并沒有和其他信息通過二次整合處理得到的特征,也可是非加工特征。所述加工特征可為確定出非加工特征以外的所有特征。例如,根據(jù)用戶購買商品、服務及旅行的車票的預定等方法,確定出用戶消費水平這一用戶特征,整合了用戶購買行為、預定行為等,從而是所述加工特征。

由于非加工特征的非加工,即確定的直接性,通常其精準度高于加工特征,故在本實施例中將非加工特征作的一個或多個作為計算所述預測值的用戶特征。這里的計算所述預測值的用戶特征的個數(shù)可為靜態(tài)的預設值,也可以為動態(tài)確定的動態(tài)值。例如,若在本實施例中將所有的非加工特征都作為計算所述預測值的用戶特征,則這個時候計算所述預測值的用戶特征的個數(shù)是動態(tài)確定的。當然,也可以預先確定一個預設值,從而多個非加工特征中選擇出預設值個非加工特征作為計算所述預測值的用戶特征。那么此時可能涉及到如何選擇部分非加工特征作為計算所述預測值的用戶特征,例如,可事先給非加工特征設置優(yōu)先級,根據(jù)優(yōu)選級選擇若干計算所述預測值的用戶特征。

在本實施例中通??蓛?yōu)選出用戶的基本用戶特征作為計算預測值的用戶特征,例如,選擇年齡、性別、職業(yè)、所在區(qū)域及教育背景等用戶較為基本的信息作為計算所述預測值的用戶特征。當然這些基本信息可能是用戶親自填寫或好友代填的,可能屬于可信度較高的用戶特征,可將作為精確度較高的非加工特征被選擇作為計算預測值的用戶特征。

在本實施例中首先,引入了用戶特征來參與推送信息的粗選,從而解決了僅采用推送信息特征進行推送信息的粗選導致的精確度低的現(xiàn)象,同時通過用戶特征選擇,將僅選擇部分用戶特征進行計算,以減少信息量,避免降低粗選的效率,最后,在選擇用戶特征時可以根據(jù)可信度進行選擇,也可以選擇非加工特征參與計算,不管采用哪種方式進行用戶特征的選擇,都能夠再次提升計算的精確度。

實施例五:

如圖3所示,本實施例提供一種推送信息粗選裝置,所述裝置包括確定單元110、計算單元120及選擇單元130;

所述確定單元110,用于根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特征及所述特征對應的權(quán)值;

所述計算單元120,用于計算所述特征的標準差;

所述確定單元130,還用于確定所述標準差的波動概率;

所述計算單元120,還用于基于所述權(quán)值、標準差及波動概率,計算所述預測值;其中,所述標準差和所述波動概率用于計算得到修正所述權(quán)值的波動值;

所述選擇單元130,用于基于所述預測值,選擇滿足預設條件的推送信息。

所述確定單元110及選擇單元130的具體結(jié)構(gòu)可對應于處理器或處理電路,所述處理器可包括應用處理器、中央處理器、微處理器、數(shù)字信號處理器或可編程陣列等處理結(jié)構(gòu)。所述處理電路可包括專用集成電路。

所述確定單元110及選擇單元130可分別對應于不同的處理器或處理電路,也可以集成對應于相同的處理器或處理電路。當確定單元110及選擇單元130集成對應于相同的處理器或處理電路時,所述處理器或處理電路可采用時分復用或并發(fā)線程等方式來分別實現(xiàn)上述確定單元110及選擇單元130的功能。

本實施例中所述計算單元120的具體結(jié)構(gòu)可對應于計算器或具有計算功能的處理器等結(jié)構(gòu),將首先用于計算標準差,再利用標準差、波動概率計算波動值,利用波動值和權(quán)值計算修正后的權(quán)值,最后基于修正后的權(quán)值及所述特征 的取值計算出所述預測值。

圖4所示,本實施例提供一種推送信息粗選裝置,包括處理器220、存儲介質(zhì)240、顯示屏250以及至少一個外部通信接口210;所述處理器220、存儲介質(zhì)240以及外部通信接210均通過總線230連接。所述處理器220可為微處理器、中央處理器、數(shù)字信號處理器或可編程邏輯陣列等具有處理功能的電子元器件。所述存儲介質(zhì)240上存儲有計算機可執(zhí)行指令;所述處理器220執(zhí)行所述存儲介質(zhì)240中存儲的所述計算機可執(zhí)行指令可實現(xiàn)上述方法中的任意一個;具體如,根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特征及所述特征對應的權(quán)值;計算所述特征的標準差;確定所述標準差的波動概率;基于所述權(quán)值、標準差及波動概率,計算所述預測值;其中,所述標準差和所述波動概率用于計算得到修正所述權(quán)值的波動值;基于所述預測值,選擇滿足預設條件的推送信息。

在本實施例中所述標準差、波動概率及預測值的相關描述可參見對應的實施例,在此就不一一再詳細介紹了。例如,所述波動概率可為隨機概率,例如,所述波動概率等于高斯隨機概率值。

本實施例所述推送信息粗選裝置可為一臺或多臺進行推送信息粗選的服務器的組成結(jié)構(gòu),該服務器可為位于廣告等推送信息平臺中的設備??傊緦嵤├兴鐾扑托畔⒋诌x裝置為前述推送信息粗選方法提供了實現(xiàn)硬件,同樣具有推送信息粗選精確度高的特點。

實施例六:

如圖3所示,本實施例提供一種推送信息粗選裝置,所述裝置包括確定單元110、計算單元120及選擇單元130;

所述確定單元110,用于根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特征及所述特征對應的權(quán)值;

所述計算單元120,用于計算所述特征的標準差;

所述確定單元130,還用于確定所述標準差的波動概率;

所述計算單元120,還用于基于所述權(quán)值、標準差及波動概率,計算所述 預測值;其中,所述標準差和所述波動概率用于計算得到修正所述權(quán)值的波動值;

所述選擇單元130,用于基于所述預測值,選擇滿足預設條件的推送信息。

所述確定單元110,還用于確定波動系數(shù);其中,所述波動系數(shù)用于限制所述波動值的取值范圍;

所述計算單元120,具體用于基于所述權(quán)值、標準差、波動概率及所述波動系數(shù),計算所述預測值。

在本實施例中所述確定單元110可對應于人機交互接口,可利用所述人機交互接口接收工作人員輸入的所述波動系數(shù)。當然所述確定單元110也可對應于處理器或處理電路,讀取預先存儲在計算機存儲介質(zhì)中的所述波動系數(shù),也可以對應于通信接口,從而其他電子設備查詢或接收到所述波動系數(shù)。

在本實施例中所述計算單元120具體將根據(jù)權(quán)值、標準差、波動概率及波動系數(shù)來計算所述預測值。這里的波動系數(shù)、標準差及波動概率都為計算波動值的一個參數(shù)。具體的計算函數(shù)關系或方法可以參見實施例一至實施例四,在本實施例中就再重復了。

總之,在本實施例中通過波動系數(shù)的引入,避免標準差過大時導致的預測值出現(xiàn)異常的現(xiàn)象,以提升計算的精確度。

實施例七:

如圖3所示,本實施例提供一種推送信息粗選裝置,所述裝置包括確定單元110、計算單元120及選擇單元130;

所述確定單元110,用于根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特征及所述特征對應的權(quán)值;

所述計算單元120,用于計算所述特征的標準差;

所述確定單元130,還用于確定所述標準差的波動概率;

所述計算單元120,還用于基于所述權(quán)值、標準差及波動概率,計算所述預測值;其中,所述標準差和所述波動概率用于計算得到修正所述權(quán)值的波動值;

所述選擇單元130,用于基于所述預測值,選擇滿足預設條件的推送信息。

所述確定單元110,還用于確定波動系數(shù);其中,所述波動系數(shù)用于限制所述波動值的取值范圍;

所述計算單元120,具體用于基于所述權(quán)值、標準差、波動概率及所述波動系數(shù),計算所述預測值。

所述確定單元110,具體用于確定安全因子,其中,所述安全因子用于防止所述標準差異為特定值或未獲取到標準差時導致的波動值求解異常;

所述計算單元120,具體用于基于所述權(quán)值、標準差、波動概率及所述安全因子,計算所述預測值。

在本實施例中還引入了安全因子,這里的安全因子可為小于千分之一的常數(shù)等極小的取值。在本實施例中所述確定單元110對應的硬件結(jié)構(gòu)可以參見前述實施例中確定所述波動系數(shù)的硬件結(jié)構(gòu),但是不同的是本實施例中確定的安全因子。這里的標準差異??砂藴什顬轭A定的異常值,也可以未獲取到異常值,等滿足異常條件的標準差獲取情況。

當然在本申請的各個實施例中所述安全因子,與所述波動系數(shù)、標準差及波動概率一樣是參與波動值計算的因變量。

在本實施例中計算單元120將基于安全因子來計算波動值,避免波動值異常導致預測值的異常,減少計算過程中的異常情況的出現(xiàn)。

計算所述預測值的函數(shù)關系有多種,在本實施例中所述計算單元120用于利用如下公式計算所述預測值y;

其中,所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述α為所述波動系數(shù);所述β為所述安全因子;所述σi為所述特征的標準差。

當然所述計算單元可以采用貝葉斯算法或邏輯回歸算法計算所述預測值, 不局限于上述公式。

總之,本實施例提供了一種具體如何計算所述預測值的裝置,在具有根據(jù)該預測值進行推送信息粗選的精確度高的特點的同時,還具有結(jié)構(gòu)簡單、實現(xiàn)簡便的特點。

實施例八:

如圖3所示,本實施例提供一種推送信息粗選裝置,所述裝置包括確定單元110、計算單元120及選擇單元130;

所述確定單元110,用于根據(jù)所述推送信息的歷史推送數(shù)據(jù),確定用于計算預測值的特征及所述特征對應的權(quán)值;

所述計算單元120,用于計算所述特征的標準差;

所述確定單元130,還用于確定所述標準差的波動概率;

所述計算單元120,還用于基于所述權(quán)值、標準差及波動概率,計算所述預測值;其中,所述標準差和所述波動概率用于計算得到修正所述權(quán)值的波動值;

所述選擇單元130,用于基于所述預測值,選擇滿足預設條件的推送信息。

所述確定單元,110具體用于確定用于計算所述預測值的推送信息特征;確定用于計算所述預測值的用戶特征。

在本版實施例中所述確定單元110的硬件結(jié)構(gòu)與前述實施例提供的確定單元類似,值得注意的是在本實施例中所述確定單元110確定的用于計算預測值的特征包括推送信息特征和用戶特征。這里的推送信息特征可包括推送位及推送時間等各種推送信息,所述用戶特征可包括用戶各種形式的特征。

這樣的話,本實施例所述推送信息粗選裝置,在計算所述預測值不僅關注了推送信息特征和關注了用戶特征,沒有認為的割裂用戶特征和推送信息特征,就避免了在進行預測值計算時,忽略了用戶特征對推送效果的影響,從而能夠再次提升推送信息粗選的精確度。

所述確定單元110對應的可選結(jié)構(gòu)有多種,以下提供兩種可選結(jié)構(gòu):

可選結(jié)構(gòu)一:

所述確定單元110,具體用于確定各種用戶特征的可信度;基于所述可信度,選擇用于計算所述預測值的用戶特征。這個時候所述確定單元110也可對應于處理器或處理電路,也可以對應于比較器,例如通過比較器的比較選擇可信度大于可信度閾值的用戶特征作為計算預測值的用戶特征。

可選結(jié)構(gòu)二:

所述確定單元110,具體用于從各種用戶特征中選擇出一個或多個非加工用戶特征,作為用于計算所述預測值的用戶特征。在本實施例中所述確定單元110對應的硬件結(jié)構(gòu)同樣可包括處理器或處理電路,通過將用戶特征非為非加工特征和加工特征,選擇出非加工特征的一個或多個作為計算預測值的用戶特征。

總之首先本實施例所述的推送信息粗選裝置,引入用戶特征計算所述預測值,基于這樣的預測值對推送信息的粗選結(jié)果具有精確度高的特點;其次,通過用戶特征的篩選,可以避免因用戶特征引入計算導致的計算量大的問題,再次,通過選擇可信度高的用戶特征或選擇非加工特征等能夠精確表征用戶特點的用戶特征參與計算,能夠再次提升所述粗選結(jié)果的精確度。

以下提供一個具體示例:

在本示例中的推送信息可為廣告,本示例基于上述實施例中記載的任意一個技術方案,提供一種廣告粗選方法。在本實施例中,

在本示例中,利用如下公式計算廣告的預測值y,這里的預測值可為該廣告被點擊的概率。

所述xi為特征i的取值;所述wi為所述特征i的權(quán)值;所述α為所述波動系數(shù);所述β為所述安全因子;所述σi為所述特征的標準差。所述rand_gaussian為服從高斯隨機分布確定的隨機概率。

α為波動值的波動系數(shù),當α為0時,波動值則不起作用。

β是極小常數(shù),一般可以取到萬分之一。

σi則是特征i取值為指定值的待處理數(shù)據(jù)的標準差;以下表為例進行標準差求解說明。在本示例中可能先根據(jù)歷史廣告數(shù)據(jù),確定出分類模型;再利用分類模型對數(shù)據(jù)庫中待投放廣告的廣告信息及待測用戶數(shù)據(jù)進行處理,確定出用戶點擊該廣告的概率。這里的廣告信息及為待測用戶數(shù)據(jù)即為所述待處理數(shù)據(jù)。

在上述表中,中間5列稱作特征列,第1列為行序號列;第7列是分類標簽列。前述i可為所述特征列的序號。在上表中1的特征列中“1”表示邏輯值為“是”,“0”表示邏輯值為“否”。例如,在第2列中,“1”表示是男性,“0”表示不是男性。

對第2列而言,是男性的記錄數(shù)有4條;且這4條記錄分別在行序號為1、4、5及6的特征行中,而這4行所對應的分類標簽分別是1、0、0、0,那么σi這里的計算就是計算(1,0,0,0)的標準差。當然具體的求解標準差的方式不止這一種,這里盡是一個具體示例。

通過引入波動值可以使得中小廣告的預測值產(chǎn)生一些波動,使得這些訂單能夠有參與競爭的機會,從而可以保障整個廣告系統(tǒng)的生態(tài)健康,而不至于產(chǎn)生極個別訂單占了絕大部分的曝光的現(xiàn)象。

于此同時,還將利用上述公式在計算預測值時,將粗選序中直接引入用戶特征,例如用戶的基礎信息如年齡、性別等用戶特征,和訂單信息,如廣告位、 訂單id作為特征。這里的訂單信息實質(zhì)上為前述實施例中提到的推送信息特征的組成部分。

圖5所示一種計算預測值的圖示,對訓練數(shù)據(jù)進行訓練。這里的訓練數(shù)據(jù)即對應著前述的歷史推送數(shù)據(jù)。在本實施例中都用01離散化各個用戶特征和廣告特征。例如,圖5中0100和1000兩個序列對應了用戶的不同年齡或不同的年齡段。10和01對應了不同的廣告。年齡*廣告表征了年齡對應特征列與廣告對應的特征列的笛卡爾乘積。圖5示中的x*x表示未示出的其他用戶特征或廣告特征。通常在進行一個廣告的預測值計算時,僅會出現(xiàn)一個廣告列,且用0和1分別表示對應的用戶是否觀看該或點擊了廣告。

訓練數(shù)據(jù)中的分類標簽用于表征歷史廣告數(shù)據(jù)某一個用戶對該廣告是否執(zhí)行了點擊等轉(zhuǎn)化操作。例如,訓練數(shù)據(jù)中包括用戶a點擊了廣告b的這一紀錄。那么在圖5中用戶a所在的訓練數(shù)據(jù)行中,紀錄了用戶a的年齡,用戶a看的廣告,而對應的用戶a所在的訓練數(shù)據(jù)行中的分類標簽將為“1”表征用戶a觀看了該廣告。

對訓練數(shù)據(jù)進行訓練得到了基于w和σ的訓練模型。所述w表示權(quán)重,所述σ表示標準差。計算預測值y。圖中0.02表示一個示例中計算出的預測值y為0.02。在預測值對應的數(shù)據(jù)行中的分類標簽的取值表示的即為所述預測值,該預測值是基于對歷史廣告數(shù)據(jù)得到訓練模型,確定推送該廣告被點擊的概率。

在本申請所提供的幾個實施例中,應該理解到,所揭露的設備和方法,可以通過其它的方式實現(xiàn)。以上所描述的設備實施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可以有另外的劃分方式,如:多個單元或組件可以結(jié)合,或可以集成到另一個系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過一些接口,設備或單元的間接耦合或通信連接,可以是電性的、機械的或其它形式的。

上述作為分離部件說明的單元可以是、或也可以不是物理上分開的,作 為單元顯示的部件可以是、或也可以不是物理單元,即可以位于一個地方,也可以分布到多個網(wǎng)絡單元上;可以根據(jù)實際的需要選擇其中的部分或全部單元來實現(xiàn)本實施例方案的目的。

另外,在本發(fā)明各實施例中的各功能單元可以全部集成在一個處理模塊中,也可以是各單元分別單獨作為一個單元,也可以兩個或兩個以上單元集成在一個單元中;上述集成的單元既可以采用硬件的形式實現(xiàn),也可以采用硬件加軟件功能單元的形式實現(xiàn)。

本領域普通技術人員可以理解:實現(xiàn)上述方法實施例的全部或部分步驟可以通過程序指令相關的硬件來完成,前述的程序可以存儲于一計算機可讀取存儲介質(zhì)中,該程序在執(zhí)行時,執(zhí)行包括上述方法實施例的步驟;而前述的存儲介質(zhì)包括:移動存儲設備、只讀存儲器(rom,read-onlymemory)、隨機存取存儲器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲程序代碼的介質(zhì)。

以上所述,僅為本發(fā)明的具體實施方式,但本發(fā)明的保護范圍并不局限于此,任何熟悉本技術領域的技術人員在本發(fā)明揭露的技術范圍內(nèi),可輕易想到變化或替換,都應涵蓋在本發(fā)明的保護范圍之內(nèi)。因此,本發(fā)明的保護范圍應以所述權(quán)利要求的保護范圍為準。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
通道| 建阳市| 和平区| 克拉玛依市| 台北市| 永仁县| 宣武区| 比如县| 周至县| 承德市| 庆阳市| 巴楚县| 林甸县| 陆河县| 侯马市| 郁南县| 大渡口区| 阜宁县| 玉门市| 顺平县| 习水县| 轮台县| 丰原市| 三亚市| 剑川县| 林甸县| 河池市| 黎川县| 手机| 淮滨县| 宝坻区| 个旧市| 陇川县| 东城区| 江城| 北川| 乐亭县| 西平县| 右玉县| 轮台县| 富锦市|