欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種終端推送方法及裝置與流程

文檔序號:12034644閱讀:131來源:國知局
一種終端推送方法及裝置與流程
本發(fā)明涉及網(wǎng)絡(luò)應(yīng)用
技術(shù)領(lǐng)域
,尤指一種終端推送方法及裝置。
背景技術(shù)
:隨著信息技術(shù)的迅速發(fā)展,為給用戶帶來更好的應(yīng)用體驗,信息推送在行業(yè)內(nèi)以其大量的應(yīng)用方向,是當(dāng)今互聯(lián)網(wǎng)十分重要的技術(shù)方向。現(xiàn)階段的終端推送方法通常采用隨機(jī)推送的方式,或者對終端的訪問行為的歷史數(shù)據(jù)進(jìn)行分析,基于固定的時間段對終端進(jìn)行信息推送。然而,用戶在不同時間不同地點使用終端的訪問行為有所不同,因而訪問內(nèi)容也存在很大差異。例如,用戶在上班時間和休閑時間訪問行為存在很大差異,用戶在家里訪問學(xué)術(shù)文章的網(wǎng)站,在工作時間訪問商務(wù)合作類網(wǎng)站。此外,由于用戶的個體差異性,即使對時間進(jìn)行劃分,在同一時間段不同用戶的訪問內(nèi)容仍存在較大差異。例如,一家人公用同一臺平板電腦,不同家庭成員的訪問內(nèi)容大不相同,平板電腦并不能區(qū)分使用設(shè)備的用戶,從而也不通用區(qū)分用戶對使用者推送不同的信息。因此,通過上述方法對終端進(jìn)行信息推送的推送準(zhǔn)確率較低。技術(shù)實現(xiàn)要素:本發(fā)明實施例提供一種終端推送方法及裝置,用以解決現(xiàn)有技術(shù)中信息推送的準(zhǔn)確率低的問題。第一方面,本發(fā)明實施例提供一種終端推送方法,所述方法包括:在終端訪問網(wǎng)站時,根據(jù)所述終端的地址信息以及當(dāng)前時間確定所述終端在當(dāng)前時間所屬的訪問活躍時間段;根據(jù)確定的所述終端在當(dāng)前時間所屬的訪問活躍時間段,確定與所述訪問活躍時間段對應(yīng)的興趣標(biāo)簽;根據(jù)所述興趣標(biāo)簽向所述終端推送與所述興趣標(biāo)簽相關(guān)的業(yè)務(wù)信息。在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述方法中,在根據(jù)所述終端的地址信息以及當(dāng)前時間確定所述終端在當(dāng)前時間所屬的訪問活躍時間段之前,所述方法還包括:獲取所述終端訪問行為的歷史數(shù)據(jù);將所述歷史數(shù)據(jù)按照相似訪問行為進(jìn)行聚類處理,根據(jù)聚類處理后的各類相似訪問行為的時間分布,確定所述終端對應(yīng)的多個訪問活躍時間段;根據(jù)所述終端訪問行為的歷史數(shù)據(jù),分別確定在各所述訪問活躍時間段內(nèi)所述終端的興趣標(biāo)簽。在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述方法中,所述獲取所述終端訪問行為的歷史數(shù)據(jù),包括:獲取所述終端的網(wǎng)關(guān)日志,并在所述網(wǎng)關(guān)日志中提取統(tǒng)一資源定位符;根據(jù)所述統(tǒng)一資源定位符進(jìn)行爬蟲處理后,獲得所述終端訪問行為的歷史數(shù)據(jù)。在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述方法中,所述根據(jù)聚類處理后的各類相似訪問行為的時間分布,確定所述終端對應(yīng)的多個訪問活躍時間段,包括:將屬于各類相似訪問行為的時間分布中的部分時間段作為該類相似訪問行為對應(yīng)的訪問活躍時間段。在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述方法中,所述根據(jù)所述終端訪問行為的歷史數(shù)據(jù),分別確定在各所述訪問活躍時間段內(nèi)所述終端的興趣標(biāo)簽,包括:對所述終端訪問行為的歷史數(shù)據(jù)采用主題模型進(jìn)行主題分類,并將主題分類得到的各興趣關(guān)鍵詞作為所述興趣標(biāo)簽;按照所述訪問活躍時間段分別確定在各所述訪問活躍時間段內(nèi)所述終端的興趣標(biāo)簽。在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述方法中,在對所述終端訪問行為的歷史數(shù)據(jù)采用主題模型進(jìn)行主題分類之前,所述方法還包括:根據(jù)所有終端訪問行為的歷史數(shù)據(jù),對所述主題模型進(jìn)行訓(xùn)練。優(yōu)選地,所述根據(jù)所述興趣標(biāo)簽向所述終端推送與所述興趣標(biāo)簽相關(guān)的業(yè)務(wù)信息,包括:確定每個待推送業(yè)務(wù)信息的主題信息與所述興趣標(biāo)簽的相似度;向所述終端推送所述相似度大于預(yù)設(shè)值的待推送業(yè)務(wù)信息。第二方面,本發(fā)明實施例提供一種終端推送裝置,所述裝置包括:第一確定單元,用于在終端訪問網(wǎng)站時,根據(jù)所述終端的地址信息以及當(dāng)前時間確定所述終端在當(dāng)前時間所屬的訪問活躍時間段;第二確定單元,用于根據(jù)確定的所述終端在當(dāng)前時間所屬的訪問活躍時間段,確定與所述訪問活躍時間段對應(yīng)的興趣標(biāo)簽;業(yè)務(wù)信息推送單元,用于根據(jù)所述興趣標(biāo)簽向所述終端推送與所述興趣標(biāo)簽相關(guān)的業(yè)務(wù)信息。在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述裝置中,所述裝置還包括:歷史數(shù)據(jù)獲取單元,用于獲取所述終端訪問行為的歷史數(shù)據(jù);第三確定單元,用于將所述歷史數(shù)據(jù)按照相似訪問行為進(jìn)行聚類處理,根據(jù)聚類處理后的各類相似訪問行為的時間分布,確定所述終端對應(yīng)的多個訪問活躍時間段;第四確定單元,用于根據(jù)所述終端訪問行為的歷史數(shù)據(jù),分別確定在各所述訪問活躍時間段內(nèi)所述終端的興趣標(biāo)簽。在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述裝置中,所述歷史數(shù)據(jù)獲取單元,具體用于獲取所述終端的網(wǎng)關(guān)日志,并在所述網(wǎng)關(guān)日志中提取 統(tǒng)一資源定位符;根據(jù)所述統(tǒng)一資源定位符進(jìn)行爬蟲處理后,獲得所述終端訪問行為的歷史數(shù)據(jù)。在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述裝置中,所述第三確定單元,具體用于將屬于各類相似訪問行為的時間分布中的部分時間段作為該類相似訪問行為對應(yīng)的訪問活躍時間段。在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述裝置中,所述第四確定單元,具體用于對所述終端訪問行為的歷史數(shù)據(jù)采用主題模型進(jìn)行主題分類,并將主題分類得到的各興趣關(guān)鍵詞作為所述興趣標(biāo)簽;按照所述訪問活躍時間段分別確定在各所述訪問活躍時間段內(nèi)所述終端的興趣標(biāo)簽。在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述裝置中,所述裝置還包括:主題模型訓(xùn)練單元,用于根據(jù)所有終端訪問行為的歷史數(shù)據(jù),對所述主題模型進(jìn)行訓(xùn)練。在一種可能的實現(xiàn)方式中,在本發(fā)明實施例提供的上述裝置中,所述業(yè)務(wù)信息推送單元,具體用于確定每個待推送業(yè)務(wù)信息的主題信息與所述興趣標(biāo)簽的相似度;向所述終端推送所述相似度大于預(yù)設(shè)值的待推送業(yè)務(wù)信息。本發(fā)明實施例的有益效果包括:本發(fā)明提供了一種終端推送方法及裝置,在終端訪問網(wǎng)站時,根據(jù)終端的地址信息以及當(dāng)前時間確定終端在當(dāng)前時間所屬的訪問活躍時間段;根據(jù)確定的終端在當(dāng)前時間所屬的訪問活躍時間段,確定與訪問活躍時間段對應(yīng)的興趣標(biāo)簽;根據(jù)興趣標(biāo)簽向終端推送與興趣標(biāo)簽相關(guān)的業(yè)務(wù)信息。在本發(fā)明提供的上述終端推送方法中,由于將終端的訪問行為劃分成為多個訪問活躍時間段,針對當(dāng)前訪問時間確定當(dāng)前時間所屬訪問活躍時間段對應(yīng)興趣標(biāo)簽對應(yīng)的業(yè)務(wù)信息,因此,有效提高了信息推送的準(zhǔn)確率;通過對終端訪問活躍時間段的劃分,在進(jìn)行推送時,只需要對當(dāng)前時間所屬的訪問活躍時間內(nèi)的訪問行為進(jìn)行分析,從而縮小了推送時對訪問行為分析匹配的計算量,提高了計算精度。附圖說明圖1為本發(fā)明實施例提供的一種終端推送方法的流程示意圖之一;圖2為本發(fā)明實施例提供的一種終端推送方法的流程示意圖之二;圖3為本發(fā)明實施例提供的一種終端推送裝置的結(jié)構(gòu)示意圖。具體實施方式針對現(xiàn)有技術(shù)中存在的信息推送的準(zhǔn)確率低及推送計算精度低的問題,本發(fā)明實施例提供的終端推送方法,首先,本發(fā)明方法的流程如圖1所示,執(zhí)行步驟如下:s101、在終端訪問網(wǎng)站時,根據(jù)終端的地址信息以及當(dāng)前時間確定終端在當(dāng)前時間所屬的訪問活躍時間段;s102、根據(jù)確定的終端在當(dāng)前時間所屬的訪問活躍時間段,確定與訪問活躍時間段對應(yīng)的興趣標(biāo)簽;s103、根據(jù)興趣標(biāo)簽向終端推送與興趣標(biāo)簽相關(guān)的業(yè)務(wù)信息。本發(fā)明實施例提供的上述終端推送方法,由于將終端的訪問行為劃分成為多個訪問活躍時間段,針對當(dāng)前訪問時間確定當(dāng)前時間所屬訪問活躍時間段對應(yīng)興趣標(biāo)簽,向終端推送與這些興趣標(biāo)簽對應(yīng)的業(yè)務(wù)信息,因此,有效提高了信息推送的準(zhǔn)確率;通過對終端訪問活躍時間段的劃分,只需要對當(dāng)前時間所屬的訪問活躍時間段內(nèi)的訪問行為進(jìn)行分析,從而縮小了推送時對訪問行為分析匹配的計算量,提高了計算精度。在具體實施時,在執(zhí)行本發(fā)明實施例提供的上述終端推送方法中的步驟s101之前,本發(fā)明實施例提供的上述終端推送方法,還包括如圖2所示的步驟s101’至步驟s103’。s101’、獲取終端訪問行為的歷史數(shù)據(jù);s102’、將歷史數(shù)據(jù)按照相似訪問行為進(jìn)行聚類處理,根據(jù)聚類處理后的 各類相似訪問行為的時間分布,確定終端對應(yīng)的多個訪問活躍時間段;s103’、根據(jù)終端訪問行為的歷史數(shù)據(jù),分別確定在各訪問活躍時間段內(nèi)終端的興趣標(biāo)簽。下面對上述各步驟的具體實現(xiàn)方式進(jìn)行詳細(xì)的說明。在上述步驟s101’中,獲取終端訪問行為的歷史數(shù)據(jù),具體可以包括:獲取終端的網(wǎng)關(guān)日志,并在網(wǎng)關(guān)日志中提取統(tǒng)一資源定位符;根據(jù)統(tǒng)一資源定位符進(jìn)行爬蟲處理后,獲得終端訪問行為的歷史數(shù)據(jù)。在具體實施時,可定時將網(wǎng)關(guān)日志上傳匯總來記錄終端訪問過的網(wǎng)頁內(nèi)容。而網(wǎng)關(guān)日志中并不能直接顯示終端瀏覽過的具體內(nèi)容,因此,首先要對網(wǎng)關(guān)日志進(jìn)行清理將用戶訪問過的統(tǒng)一資源定位符(uniformresourelocator,簡稱url)提取出來。例如,可通過正則表達(dá)式將網(wǎng)關(guān)日志中的url提取,并對提取出來的url進(jìn)行解析。再采用網(wǎng)絡(luò)爬蟲方式獲得將每個url所對應(yīng)的終端訪問行為的歷史數(shù)據(jù),并將獲得的歷史數(shù)據(jù)存儲于本地服務(wù)器上。在具體實施時,在上述的步驟s102’中,由于用戶在使用終端的訪問行為在一天中的多個時間段有很大差異,并且在同一個時間段的訪問行為又具有很高的相似度,因此,將終端訪問行為的歷史數(shù)據(jù)按照相似訪問行為進(jìn)行聚類處理。具體地,在終端訪問行為的歷史數(shù)據(jù)超過預(yù)設(shè)值時,可認(rèn)為該終端為具有歷史數(shù)據(jù)積累。此處的預(yù)設(shè)值可根據(jù)實際需要進(jìn)行設(shè)定,本實施例不對其具體取值進(jìn)行限定。此時,可采用非監(jiān)督學(xué)習(xí)的分類方法將終端所有訪問行為分為多類。例如,可采用k-means算法對終端的訪問行為進(jìn)行聚類。由于聚類算法要針對終端的每次訪問行為進(jìn)行分類,可將終端的訪問行為用向量x(i)來表示,x(i)表示終端第i次的訪問行為,可具體表示為:其中,idi為終端標(biāo)識,timei為終端的時間標(biāo)簽,表示第i次訪問時間,至為終端感興趣的主題標(biāo)簽。如下以將終端訪問行為聚類為三類為例,對上述步驟s102’中,將終端訪問行為的歷史數(shù)據(jù)按照相似訪問行為進(jìn)行聚類處理進(jìn)行具體說明。聚類算法的聚類簇數(shù)k,可取值為3,即分為三類,如此分類是基于用戶使用終端一天之內(nèi)的活動周期的假設(shè)。首先,對聚類算法進(jìn)行初始設(shè)置:將聚類中心位置μ1,μ2,μ3設(shè)置在初始值8:00,12:30和17:30三個時間位置,在這三個時間點各取一個訪問行為的樣本點,在初始值處存在多個樣本數(shù)據(jù)時,隨機(jī)選擇其一作為訪問行為的樣本點;在初始值處無樣本數(shù)據(jù)時,則在距離此初始值時間點最近的樣本數(shù)據(jù)中隨機(jī)選取其一作為該分類的中心位置。上述的初始設(shè)置克服了k-means算法因初始值的隨機(jī)性導(dǎo)致最終解陷于局部最優(yōu)的缺點,也使初始的聚類中心離最終解更近從而加快了收斂速度。具體地,采用如下公式執(zhí)行循環(huán)迭代操作直至收斂后結(jié)束:其中,c(i)表示聚類,μj表示中心位置,m為樣本總數(shù),1{}表示指示函數(shù)。每次迭代中心位置μj都會發(fā)生變化,將變化后的中心位置μj重新代入公式,確定其屬于哪一個聚類。由此,可將所有的訪問行為聚類為三類。在具體實施時,還可采用k-medoids算法或適合的劃分算法進(jìn)行相似訪問行為的聚類,本實施例不對其進(jìn)行限定,此外,采用上述的聚類算法還可將上述終端的訪問行為分為兩類、四類或更多類,本實施例不對聚類簇數(shù)的具體取值進(jìn)行限定。進(jìn)一步的,在上述的步驟s102’中,根據(jù)聚類處理后的各類相似訪問行為的時間分布,確定終端對應(yīng)的多個訪問活躍時間段,具體可以包括:將屬于各類相似訪問行為的時間分布中的部分時間段作為該類相似訪問行為對應(yīng)的訪問活躍時間段。具體地,在上述計算得到的三個聚類中,每一類的訪問行為的時間分布可為正態(tài)分布,將該類的訪問行為的時間分布進(jìn)行劃分,將第一個四分位數(shù)至第三個四分位數(shù)之間的時間區(qū)域,即正態(tài)分布的中心部分時間段,作為該類相似訪問行為對應(yīng)的訪問活躍時間段。此外,可選取其它部分時間段或全部時間段作訪問活躍時間段,本實施例不對其進(jìn)行限定。在實施應(yīng)用時,可通過提取各類訪問行為x(i)中的時間標(biāo)簽timei來獲得訪問行為的時間分布,從而選取時間分布中的部分時間段作為該類相似訪問行為對應(yīng)的訪問活躍時間段。在一種可能實施的方式中,在終端沒有訪問行為或訪問行為的歷史數(shù)據(jù)較少,低于上述的預(yù)設(shè)值時,則將該終端的訪問活躍時間段設(shè)置為默認(rèn)值。例如,劃分7:00至9:00,11:00至14:00,19:00至24:00三個時間段為該終端對應(yīng)的多個訪問活躍時間段。在確定終端對應(yīng)的多個訪問活躍時間段之后,在上的步驟s103’中,根據(jù)終端訪問行為的歷史數(shù)據(jù),分別確定在各訪問活躍時間段內(nèi)終端的興趣標(biāo)簽,具體可以包括:對終端訪問行為的歷史數(shù)據(jù)采用主題模型進(jìn)行主題分類,并將主題分類得到的各興趣關(guān)鍵詞作為興趣標(biāo)簽;按照訪問活躍時間段分別確定在各訪問活躍時間段內(nèi)終端的興趣標(biāo)簽。進(jìn)一步地,在對終端訪問行為的歷史數(shù)據(jù)采用主題模型進(jìn)行主題分類之前,本發(fā)明實施例提供的上述方法,還包括:根據(jù)所有終端訪問行為的歷史數(shù)據(jù),對主題模型進(jìn)行訓(xùn)練。如下以采用plsa模型進(jìn)行主題模型訓(xùn)練過程為例對上述的步驟s103’進(jìn)行說明。采用上述步驟s101’中獲取訪問行為歷史數(shù)據(jù)的方式獲取所有終端的歷史數(shù)據(jù)作為待訓(xùn)練的文檔,可分別采用長文本訓(xùn)練方式或短文本訓(xùn)練方式來進(jìn)行主題模型的訓(xùn)練。在采用長文本訓(xùn)練方式時,提取html中的段落,即<p>標(biāo)簽內(nèi)的文本作為文檔d;在采用短文本訓(xùn)練方式時,提取html中的標(biāo)題,即 <h>標(biāo)簽內(nèi)的文本作為文檔d。再通過詞庫分詞模型,將上述獲得的文本文檔d進(jìn)行分詞,得到word1、word2…wordn,從而并建立詞袋模型,如下表所示。word1word2word3…wordndx1x2x3…xn其中x1,x2表明對應(yīng)的詞word1、word2在文檔d中出現(xiàn)的次數(shù)。經(jīng)過統(tǒng)計分詞word出現(xiàn)的比率之后進(jìn)行保存并且?guī)胫黝}模型進(jìn)行訓(xùn)練和判斷。具體地,可采用plsa模型對主題模型進(jìn)行訓(xùn)練。假設(shè)每個文檔d都是由多個主題z組成,此時,設(shè)文檔d包含主題z的條件概率為p(z|d),而每個詞word都是又主題z生成的,設(shè)主題生成詞的概率為p(w|z)。通過這兩個概率可以計算文檔和詞共同出現(xiàn)的概率:其中,p(d,w)是文檔d和詞w共同出現(xiàn)的概率,p(d)是文檔d在所有文檔中出現(xiàn)的概率,z是所有主題的集合z中的一個元素,即一個主題。進(jìn)一步地,求上式的最大似然估計,對主題模型進(jìn)行訓(xùn)練,得到可以用于主題分類的主題模型。經(jīng)過訓(xùn)練后獲得的兩組條件概率p(z|d)和p(w|z)反映了已知文檔內(nèi)容與何種主題的相關(guān)度的大小。因此針對每一個文檔d,可以獲得一個由p(z|d)組成的向量(p(z1|d),p(z2|d),p(z3|d)......,p(zn|d)),其中的條件概率p(zi|d)從由訓(xùn)練后的主題模型推算得到描述了當(dāng)前文檔d屬于主題zi概率。由此,可將終端瀏覽內(nèi)容對應(yīng)的主題提取出來,再將主題中的興趣關(guān)鍵詞作為興趣標(biāo)簽進(jìn)行存儲。進(jìn)一步地,將存儲的終端所有興趣標(biāo)簽按照訪問活躍時間段分別確定在各訪問活躍時間段內(nèi)終端的興趣標(biāo)簽。具體實施時,在上述的步驟s103中,根據(jù)興趣標(biāo)簽向終端推送與興趣標(biāo)簽相關(guān)的業(yè)務(wù)信息,具體包括:確定每個待推送業(yè)務(wù)信息的主題信息與興趣標(biāo)簽的相似度;向終端推送相似度大于預(yù)設(shè)值的待推送業(yè)務(wù)信息。具體地,上述的待推送業(yè)務(wù)信息可為廣告信息、新聞信息、文檔信息、圖片信息或與終端當(dāng)前搜索內(nèi)容相關(guān)的業(yè)務(wù)信息。在向終端推送上述任一種業(yè)務(wù)信息之前,確定待推送業(yè)務(wù)信息與興趣標(biāo)簽的相似度,從而將相似度高的待推送業(yè)務(wù)信息向終端進(jìn)行推送,可有效提高推送的準(zhǔn)確度。上述的預(yù)設(shè)值為經(jīng)驗值,可根據(jù)實際需要進(jìn)行取值,本實施例不對預(yù)設(shè)值的具體取值進(jìn)行限定。在一種可能實施的方式中,本發(fā)明實施例提供的上述方法中,還可根據(jù)終端之間的相似度,對終端進(jìn)行業(yè)務(wù)信息推送。例如,廣告信息推送環(huán)節(jié)中,僅僅通過對已有用戶進(jìn)行推送是遠(yuǎn)遠(yuǎn)不夠的,而向新用戶推送廣告信息時,通常會由廣告商提供一部分種子用戶,由需求方平臺(demand-sideplatform,簡稱dsp)計算用戶使用終端的訪問行為的相似性來找到潛在的用戶。具體地,可通過計算某一終端與種子終端訪問行為的相似度,找到相似度系數(shù)高的終端,由此向該種子終端推送與該種子終端相似度高的終端訪問的廣告信息,從而實現(xiàn)更準(zhǔn)確的廣告信息推送。上述相似度的計算方式可為余弦相似性,調(diào)整余弦性,皮爾森系數(shù)等方法。如下以余弦相似性的計算為例進(jìn)行說明。用向量x=(x1,x2,...,xn)作為用戶當(dāng)前使用終端的興趣向量,其中,x1至xn為上述終端的興趣標(biāo)簽。xi的值用來衡量終端對于第i個主題的興趣關(guān)鍵詞的相關(guān)強(qiáng)度,強(qiáng)度的衡量可以是出現(xiàn)該主題的次數(shù)占總訪問行為的比例,或者是由plsa算法得出的訪問行為與該主題的相關(guān)性概率后求和。進(jìn)一步地,計算第i個終端和第j個終端的余弦相似度:在計算的余弦相似度大于預(yù)設(shè)值時,將廣告信息向新用戶當(dāng)前使用的終端進(jìn)行推送。由于傳統(tǒng)方法中,興趣向量x中不為零的項有很多,也就意味著終 端的興趣標(biāo)簽項很多,然而找到兩個興趣標(biāo)簽完全重合或較多興趣標(biāo)簽重合的終端的難度較大,因此,先根據(jù)當(dāng)前時間確定終端當(dāng)前所屬的訪問活躍時間段,再確定該訪問活躍時間段對應(yīng)的興趣標(biāo)簽,可以提高兩終端關(guān)注幾個興趣方向的重合的幾率,使得生成的相關(guān)矩陣比較稀疏,從而提高了計算的準(zhǔn)確性。在一種可實施的方式中,可將上述的終端對應(yīng)各訪問活躍時間段進(jìn)行標(biāo)識,以三元組(u,t,l)對終端進(jìn)行標(biāo)識,其中,u表示終端的地址信息,t為表示訪問活躍時間段的標(biāo)簽,l為地理標(biāo)簽。由于用戶在通過終端訪問網(wǎng)站時,通常在一天中的同一時間段會處于相同或相近的地理位置,因此,t標(biāo)簽與l標(biāo)簽通常具有關(guān)聯(lián)性。在具體實施時,可針對標(biāo)識中的t標(biāo)簽關(guān)聯(lián)多個興趣標(biāo)簽。在終端訪問網(wǎng)站時,通過獲取時間標(biāo)簽對應(yīng)的終端標(biāo)識(u,t,l)來獲得當(dāng)前時間對應(yīng)的終端的興趣標(biāo)簽,從而根據(jù)興趣標(biāo)簽向終端推送相關(guān)的業(yè)務(wù)信息?;谕话l(fā)明構(gòu)思,本發(fā)明實施例提供一種終端推送裝置,由于該裝置解決問題的原理與前述一種在內(nèi)部通信網(wǎng)中通信數(shù)據(jù)的處理方法相似,因此該裝置的實施可以參見方法的實施,重復(fù)之處不再贅述。本發(fā)明實施例提供一種終端推送裝置,結(jié)構(gòu)如圖3所示,包括:第一確定單元31,用于在終端訪問網(wǎng)站時,根據(jù)終端的地址信息以及當(dāng)前時間確定終端在當(dāng)前時間所屬的訪問活躍時間段;第二確定單元32,用于根據(jù)確定的終端在當(dāng)前時間所屬的訪問活躍時間段,確定與訪問活躍時間段對應(yīng)的興趣標(biāo)簽;業(yè)務(wù)信息推送單元33,用于根據(jù)興趣標(biāo)簽向終端推送與興趣標(biāo)簽相關(guān)的業(yè)務(wù)信息。進(jìn)一步地,本發(fā)明實施例提供的上述裝置,如圖3所示,還包括:歷史數(shù)據(jù)獲取單元34,用于獲取終端訪問行為的歷史數(shù)據(jù);第三確定單元35,用于將歷史數(shù)據(jù)按照相似訪問行為進(jìn)行聚類處理,根據(jù)聚類處理后的各類相似訪問行為的時間分布,確定終端對應(yīng)的多個訪問活躍時間段;第四確定單元36,用于根據(jù)終端訪問行為的歷史數(shù)據(jù),分別確定在各訪問活躍時間段內(nèi)終端的興趣標(biāo)簽。具體地,上述歷史數(shù)據(jù)獲取單元34,具體用于獲取終端的網(wǎng)關(guān)日志,并在網(wǎng)關(guān)日志中提取統(tǒng)一資源定位符;根據(jù)統(tǒng)一資源定位符進(jìn)行爬蟲處理后,獲得終端訪問行為的歷史數(shù)據(jù)。具體地,上述第三確定單元35,具體用于將屬于各類相似訪問行為的時間分布中的部分時間段作為該類相似訪問行為對應(yīng)的訪問活躍時間段。具體地,上述第四確定單元36,具體用于對終端訪問行為的歷史數(shù)據(jù)采用主題模型進(jìn)行主題分類,并將主題分類得到的各興趣關(guān)鍵詞作為興趣標(biāo)簽;按照訪問活躍時間段分別確定在各訪問活躍時間段內(nèi)終端的興趣標(biāo)簽。進(jìn)一步地,本發(fā)明實施例提供的上述裝置,如圖3所示,還包括:主題模型訓(xùn)練單元37,用于根據(jù)所有終端訪問行為的歷史數(shù)據(jù),對主題模型進(jìn)行訓(xùn)練。具體地,上述業(yè)務(wù)信息推送單元33,具體用于確定每個待推送業(yè)務(wù)信息的主題信息與興趣標(biāo)簽的相似度;向終端推送相似度大于預(yù)設(shè)值的待推送業(yè)務(wù)信息。通過以上的實施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明實施例可以通過硬件實現(xiàn),也可以借助軟件與必要的通用硬件平臺的方式來實現(xiàn)?;谶@樣的理解,本發(fā)明實施例的技術(shù)方案可以以軟件產(chǎn)品的形式體現(xiàn)出來,該軟件產(chǎn)品可以存儲在一個非易失性存儲介質(zhì)(可以是cd-rom,u盤,移動硬盤等)中,包括若干指令用以使得一臺計算機(jī)設(shè)備(可以是個人計算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個實施例所述的方法。本領(lǐng)域技術(shù)人員可以理解附圖只是一個優(yōu)選實施例的示意圖,附圖中的模塊或流程并不一定是實施本發(fā)明所必須的。本領(lǐng)域技術(shù)人員可以理解實施例中的裝置中的模塊可以按照實施例描述進(jìn)行分布于實施例的裝置中,也可以進(jìn)行相應(yīng)變化位于不同于本實施例的一個 或多個裝置中。上述實施例的模塊可以合并為一個模塊,也可以進(jìn)一步拆分成多個子模塊。上述本發(fā)明實施例序號僅僅為了描述,不代表實施例的優(yōu)劣。本發(fā)明實施例提供的上述終端推送方法,在終端訪問網(wǎng)站時,根據(jù)終端的地址信息以及當(dāng)前時間確定終端在當(dāng)前時間所屬的訪問活躍時間段,并根據(jù)確定的終端在當(dāng)前時間所屬的訪問活躍時間段,確定與訪問活躍時間段對應(yīng)的興趣標(biāo)簽,從而根據(jù)興趣標(biāo)簽向終端推送與興趣標(biāo)簽相關(guān)的業(yè)務(wù)信息。在本發(fā)明提供的上述終端推送方法中,由于將終端的訪問行為劃分成為多個訪問活躍時間段,針對當(dāng)前訪問時間確定當(dāng)前時間所屬訪問活躍時間段對應(yīng)興趣標(biāo)簽對應(yīng)的業(yè)務(wù)信息,因此,有效提高了信息推送的準(zhǔn)確率;通過對終端訪問活躍時間段的劃分,在進(jìn)行推送時,只需要對當(dāng)前時間所屬的訪問活躍時間內(nèi)的訪問行為進(jìn)行分析,從而縮小了推送時對訪問行為分析匹配的計算量,提高了計算精度。顯然,本領(lǐng)域的技術(shù)人員可以對本發(fā)明進(jìn)行各種改動和變型而不脫離本發(fā)明的精神和范圍。這樣,倘若本發(fā)明的這些修改和變型屬于本發(fā)明權(quán)利要求及其等同技術(shù)的范圍之內(nèi),則本發(fā)明也意圖包含這些改動和變型在內(nèi)。當(dāng)前第1頁12
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
德惠市| 阿巴嘎旗| 益阳市| 娱乐| 兰坪| 托里县| 禄丰县| 永春县| 习水县| 盖州市| 酉阳| 社会| 台北市| 甘洛县| 房山区| 疏勒县| 旬阳县| 凭祥市| 依兰县| 赫章县| 武宁县| 浮山县| 龙门县| 东乌珠穆沁旗| 故城县| 环江| 江山市| 巴塘县| 正蓝旗| 全椒县| 隆子县| 禄劝| 普宁市| 建瓯市| 阳谷县| 蓝山县| 靖安县| 澄江县| 德安县| 泾川县| 永泰县|