欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

檢測(cè)異常渠道的方法和系統(tǒng)與流程

文檔序號(hào):12375938閱讀:386來(lái)源:國(guó)知局
檢測(cè)異常渠道的方法和系統(tǒng)與流程

本發(fā)明涉及互聯(lián)網(wǎng)應(yīng)用技術(shù)領(lǐng)域,特別涉及一種檢測(cè)異常渠道的方法和系統(tǒng)。



背景技術(shù):

隨著互聯(lián)網(wǎng)應(yīng)用的發(fā)展,各種應(yīng)用被開(kāi)發(fā),相應(yīng)的,用于實(shí)現(xiàn)應(yīng)用推廣的渠道也隨之日益增多,開(kāi)發(fā)者可通過(guò)任一渠道進(jìn)行應(yīng)用的發(fā)布,以便得用戶得以通過(guò)該渠道下載得到所需要的應(yīng)用。

進(jìn)行應(yīng)用發(fā)布和推廣的渠道中,開(kāi)發(fā)者是基于用戶由該渠道下載應(yīng)用并注冊(cè)或者聯(lián)網(wǎng)激活的數(shù)量而付給費(fèi)用。例如,對(duì)于渠道提供的游戲應(yīng)用或者其它應(yīng)用,每有一個(gè)用戶注冊(cè)了游戲賬號(hào)或者應(yīng)用賬號(hào)之后,開(kāi)發(fā)者將付給渠道一個(gè)費(fèi)用;或者每有一個(gè)用戶聯(lián)網(wǎng)登錄了游戲應(yīng)用或者其它應(yīng)用,開(kāi)發(fā)者將付給渠道一個(gè)費(fèi)用。

基于此,渠道制造虛假用戶而騙取開(kāi)發(fā)者費(fèi)用的情況時(shí)有發(fā)生,即存在著刷量工具的使用,以通過(guò)刷量工具生成應(yīng)用的虛假新用戶,以使得渠道中存在著大量用戶。

為檢測(cè)渠道中是否存在虛假新用戶,以獲知該渠道是否為異常渠道,一方面,將基于硬件接入環(huán)境屬性的分布來(lái)進(jìn)行虛假新用戶以及異常渠道的檢測(cè),具體的,鑒于當(dāng)前的刷量工具是自動(dòng)生成各種硬件環(huán)境接入?yún)?shù),如MAC地址,每一新增的硬件環(huán)境接入?yún)?shù)均代表一個(gè)新用戶,因此,現(xiàn)有的方案中常常是通過(guò)檢測(cè)當(dāng)前渠道下的硬件環(huán)境接入?yún)?shù)的分布與應(yīng)用在所有渠道下的硬件環(huán)境接入?yún)?shù)的分布是否一致實(shí)現(xiàn)的。然而,不斷改進(jìn)的刷量工具可基于各硬件環(huán)境接入?yún)?shù)在真實(shí)情況下的分布來(lái)生成,進(jìn)而使得由此所進(jìn)行的異常渠道的檢測(cè)猶為不準(zhǔn)確。

另一方面,將基于留存率進(jìn)行異常渠道的檢測(cè)。各種類型的渠道均有存在,其中不乏質(zhì)量并不高的渠道,在這些渠道中,留存的用戶很少,因此,異常渠道的檢測(cè)并不適用于各種類型的渠道。



技術(shù)實(shí)現(xiàn)要素:

基于此,有必要提供一種準(zhǔn)確性高且能夠適用于各種渠道的檢測(cè)異常渠道的方法。

此外,還有必要提供一種準(zhǔn)確性高且能夠適用于各種渠道的檢測(cè)異常渠道的系統(tǒng)。

為解決上述技術(shù)問(wèn)題,將采用如下技術(shù)方案:

一種檢測(cè)異常渠道的方法,包括:

提取渠道版本下應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址;

將所述網(wǎng)絡(luò)接入地址存在關(guān)聯(lián)的多個(gè)應(yīng)用訪問(wèn)用戶形成所述渠道版本對(duì)應(yīng)的多個(gè)用戶集合;

統(tǒng)計(jì)所述用戶集合的屬性;

根據(jù)統(tǒng)計(jì)得到的所述屬性進(jìn)行異常渠道的識(shí)別。

一種檢測(cè)異常渠道的系統(tǒng),包括:

提取裝置,用于提取渠道版本下應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址;

用戶關(guān)聯(lián)裝置,用于將所述網(wǎng)絡(luò)接入地址存在關(guān)聯(lián)的多個(gè)應(yīng)用訪問(wèn)用戶形成所述渠道版本對(duì)應(yīng)的多個(gè)用戶集合;

統(tǒng)計(jì)裝置,用于統(tǒng)計(jì)所述用戶集合的屬性;

識(shí)別裝置,用于根據(jù)統(tǒng)計(jì)得到的所述屬性進(jìn)行異常渠道的識(shí)別。

由上述技術(shù)方案可知,下載自各渠道的應(yīng)用觸發(fā)運(yùn)行并進(jìn)行網(wǎng)絡(luò)訪問(wèn)時(shí),對(duì)于該種應(yīng)用而言,各渠道版本的應(yīng)用都將進(jìn)行網(wǎng)絡(luò)訪問(wèn),因此,將提取渠道版本下應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址,以網(wǎng)絡(luò)接入地址為依據(jù)得到多個(gè)關(guān)聯(lián)的應(yīng)用訪問(wèn)用戶,相互之間存在關(guān)系的應(yīng)用訪問(wèn)用戶將形成渠道版本對(duì)應(yīng)的多個(gè)用戶集合,統(tǒng)計(jì)每一用戶集合的屬性,以根據(jù)該屬性進(jìn)識(shí)別提供應(yīng)用下載的各渠道是否存在異常渠道,同一渠道版本中應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址將作為形成用戶集合的依據(jù),通過(guò)渠道中每一用戶集合的屬性識(shí)別其所在的渠道是否異常,應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址無(wú)法篡改,為渠道作弊提供最為直接的證據(jù),并且由于是基于應(yīng)用訪問(wèn)用戶的,對(duì)于渠道而言,即便該渠道不是優(yōu)質(zhì)渠道也不會(huì)對(duì)異常渠道的準(zhǔn)確識(shí)別造成影響,進(jìn)而使得異常渠道的識(shí)別準(zhǔn)確性高,且能夠適用于各種渠道。

附圖說(shuō)明

圖1是一個(gè)實(shí)施例中檢測(cè)異常渠道的方法的流程圖;

圖2是圖1中將網(wǎng)絡(luò)接入地址存在關(guān)聯(lián)的多個(gè)應(yīng)用訪問(wèn)用戶形成渠道版本對(duì)應(yīng)的多個(gè)用戶集合的方法流程圖;

圖3是圖2中由網(wǎng)絡(luò)接入地址得到應(yīng)用訪問(wèn)用戶的地理特征的方法流程圖;

圖4是圖3中處理提取的IP2段得到應(yīng)用訪問(wèn)用戶的地理特征的方法流程圖;

圖5是圖2中根據(jù)地理特征進(jìn)行聚類得到相似的多個(gè)應(yīng)用訪問(wèn)用戶,相似的應(yīng)用訪問(wèn)用戶形成用戶集合的方法流程圖;

圖6是圖1中統(tǒng)計(jì)用戶集合的屬性的方法流程圖;

圖7是圖1中根據(jù)統(tǒng)計(jì)得到的屬性進(jìn)行異常渠道的識(shí)別的方法流程圖;

圖8是一個(gè)實(shí)施例中檢測(cè)異常渠道的系統(tǒng)的結(jié)構(gòu)框圖;

圖9是圖8中用戶關(guān)聯(lián)裝置的結(jié)構(gòu)框圖;

圖10是圖9中特征生成模塊的結(jié)構(gòu)框圖;

圖11是圖10中IP2段處理單元的結(jié)構(gòu)框圖;

圖12是圖9中聚類模塊的結(jié)構(gòu)框圖;

圖13圖8中統(tǒng)計(jì)裝置的結(jié)構(gòu)框圖;

圖14是圖8中識(shí)別模塊的結(jié)構(gòu)框圖;

圖15是一個(gè)實(shí)施例中多方推薦源的聚合方法的運(yùn)行環(huán)境示意框圖。

具體實(shí)施方式

體現(xiàn)本發(fā)明特征與優(yōu)點(diǎn)的典型實(shí)施方式將在以下的說(shuō)明中詳細(xì)敘述。應(yīng)理解的是本發(fā)明能夠在不同的實(shí)施方式上具有各種的變化,其皆不脫離本發(fā)明的范圍,且其中的說(shuō)明及圖示在本質(zhì)上是當(dāng)作說(shuō)明之用,而非用以限制本發(fā)明。

如前所述,種類繁多的應(yīng)用通過(guò)各種渠道發(fā)布并推廣,使用各種便攜終端的用戶可通過(guò)任一渠道下載得到所需要的應(yīng)用。任一應(yīng)用在渠道中的發(fā)布和推廣均需要付費(fèi),因此,為騙取費(fèi)用,渠道制造虛假用戶的可能性非常高。

對(duì)于與應(yīng)用進(jìn)行交互的服務(wù)器而言,需要對(duì)渠道中與應(yīng)用相關(guān)的行為進(jìn)行監(jiān)控。渠道制造虛假用戶的方式大都是通過(guò)刷量工具的生成不同的硬件接入環(huán)境參數(shù)實(shí)現(xiàn)的,因此,對(duì)于渠道中與應(yīng)用相關(guān)的行為進(jìn)行的監(jiān)控將受到檢測(cè)依據(jù)被惡意篡改和渠道本身屬性,例如,質(zhì)量不高的渠道的影響,仍然需要不斷進(jìn)行優(yōu)化。

為屏蔽異常渠道檢測(cè)的依據(jù)被惡意篡改和渠道本身的影響,特提出了一種檢測(cè)異常渠道的方法。該方法可依賴于計(jì)算機(jī)程序,該計(jì)算機(jī)程序?qū)⑦\(yùn)行于計(jì)算機(jī)系統(tǒng)之上,計(jì)算機(jī)系統(tǒng)可以運(yùn)行于智能手機(jī)、平板電腦、個(gè)人電腦和筆記本電腦等便攜終端中。

在一個(gè)實(shí)施例中,具體的,該檢測(cè)異常渠道的方法如圖1所示,包括:

步驟10,提取渠道版本下應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址。

渠道擁有各種應(yīng)用和用戶,其能夠進(jìn)行應(yīng)用分發(fā),例如,各種為用戶提供應(yīng)用的平臺(tái)即可稱為渠道。對(duì)于開(kāi)發(fā)的應(yīng)用,都將按照其即將使用的發(fā)布渠道預(yù)先設(shè)置了不同的版本,即每一即將使用的發(fā)布渠道都有對(duì)應(yīng)版本的應(yīng)用,并通過(guò)相應(yīng)的渠道版本進(jìn)行標(biāo)識(shí)。

需要說(shuō)明的是,本發(fā)明所指的用戶以及應(yīng)用訪問(wèn)用戶均是渠道以及應(yīng)用中的虛擬對(duì)象標(biāo)識(shí),其將作為渠道中任一應(yīng)用的下載者和應(yīng)用的使用者,并以用戶標(biāo)識(shí)的數(shù)據(jù)形式存在。

應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址是應(yīng)用觸發(fā)運(yùn)行時(shí)與后臺(tái)的服務(wù)器進(jìn)行網(wǎng)絡(luò)交互所采用的IP(Internet Protocol,網(wǎng)際協(xié)議)地址。隨著應(yīng)用與后臺(tái)的服務(wù)器所進(jìn)行的交互,服務(wù)器將進(jìn)行應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址和該應(yīng)用的渠道版本的記錄,也就是說(shuō),將以應(yīng)用的渠道版本、應(yīng)用訪問(wèn)用戶為依據(jù)進(jìn)行網(wǎng)絡(luò)接入地址的記錄,由此,對(duì)于應(yīng)用的多個(gè)渠道版本而言,每一渠道版本都有對(duì)應(yīng)的多個(gè)應(yīng)用訪問(wèn)用戶,每一應(yīng)用訪問(wèn)用戶都有對(duì)應(yīng)的一個(gè)或者多個(gè)網(wǎng)絡(luò)接入地址。

在優(yōu)選的實(shí)施例中,該渠道版本、應(yīng)用訪問(wèn)用戶和網(wǎng)絡(luò)接入地址將隨著應(yīng)用所進(jìn)行的訪問(wèn)而寫(xiě)入服務(wù)器中的日志,以供隨時(shí)提取。

與之對(duì)應(yīng)的,對(duì)于與應(yīng)用交互的后臺(tái)的服務(wù)器而言,服務(wù)器需對(duì)多個(gè)渠道進(jìn)行異常渠道的檢測(cè),以防止任一渠道隨時(shí)出現(xiàn)的作弊行為。具體的,服務(wù)器將在日志中以渠道版本和應(yīng)用訪問(wèn)用戶為依據(jù)進(jìn)行網(wǎng)絡(luò)接入地址的有序提取,從而得到一渠道版本下每一應(yīng)用訪問(wèn)用戶的一個(gè)或者多個(gè)網(wǎng)絡(luò)接入地址。

步驟30,將網(wǎng)絡(luò)接入地址存在關(guān)聯(lián)的多個(gè)應(yīng)用訪問(wèn)用戶形成渠道版本對(duì)應(yīng)的多個(gè)用戶集合。

由于通過(guò)網(wǎng)絡(luò)接入地址可以獲知應(yīng)用訪問(wèn)用戶所在的大致地理位置,例如,應(yīng)用訪問(wèn)用戶所在的省份、地級(jí)市等。因此,對(duì)于同一這一大致地理位置的應(yīng)用訪問(wèn)用戶而言,其網(wǎng)絡(luò)接入地址是存在一定關(guān)聯(lián)的。

因此,在一渠道版本下,以應(yīng)用訪問(wèn)用戶對(duì)應(yīng)的一個(gè)或者多個(gè)網(wǎng)絡(luò)接入地址為依據(jù),找尋在網(wǎng)絡(luò)接入地址上存在關(guān)聯(lián)的應(yīng)用訪問(wèn)用戶,這些應(yīng)用訪問(wèn)用戶便形成了該渠道版本下的一個(gè)用戶集合。

以此類推,將得到該渠道版本下的多個(gè)用戶集合,同一用戶集合中的應(yīng)用訪問(wèn)用戶彼此相似,并與其它用戶集合中的應(yīng)用訪問(wèn)用戶相異。

步驟50,統(tǒng)計(jì)用戶集合的屬性。

對(duì)每一用戶集合,根據(jù)該用戶集合中多個(gè)應(yīng)用訪問(wèn)用戶所對(duì)應(yīng)的大量網(wǎng)絡(luò)接入地址中存在的特征進(jìn)行統(tǒng)計(jì),以得到該用戶集合的屬性。其中,用戶集合的屬性將是對(duì)用戶集合中應(yīng)用訪問(wèn)用戶所對(duì)應(yīng)的大量網(wǎng)絡(luò)接入地址之間存在的共同特征進(jìn)行統(tǒng)計(jì)得到的。

具體的,如上所述,由網(wǎng)絡(luò)接入地址即可獲知應(yīng)用訪問(wèn)用戶所在的大致地理位置,因此,可對(duì)網(wǎng)絡(luò)接入地址提供的大致地理位置進(jìn)行統(tǒng)計(jì),以得到用戶集合中所有應(yīng)用訪問(wèn)用戶均在同一地理位置的屬性、所有應(yīng)用訪問(wèn)用戶雖然分布于多個(gè)地理位置,但是這些地理位置均在同一省份的屬性或者所有應(yīng)用訪問(wèn)用戶分布于多個(gè)地理位置且這此地理位置未在同一省份的屬性等,在此不一一進(jìn)行列舉。

步驟70,根據(jù)統(tǒng)計(jì)得到的屬性進(jìn)行異常渠道的識(shí)別。

若渠道的應(yīng)用訪問(wèn)用戶中存在著由刷量工具制造的虛假用戶,該虛假用戶大都為具有相同屬性的用戶,因此,將以屬性為依據(jù)進(jìn)行異常渠道的準(zhǔn)確識(shí)別。

例如,渠道的應(yīng)用訪問(wèn)用戶中,若大都處于同一省份,并大量存在,則這些用戶為虛假用戶的可能性將非常高,可將其所在的渠道判定為異常渠道。

由于用戶集合的屬性是基于應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址進(jìn)行統(tǒng)計(jì)得到的,該網(wǎng)絡(luò)接入地址與應(yīng)用訪問(wèn)用戶進(jìn)行應(yīng)用訪問(wèn)的行為相一致,無(wú)論是應(yīng)用的激活還是應(yīng)用的訪問(wèn)均會(huì)在服務(wù)器的日志中留下其網(wǎng)絡(luò)接入地址,因此直接由服務(wù)器的日志提取得到相應(yīng)的網(wǎng)絡(luò)接入地址將有效地提高了異常渠道識(shí)別的準(zhǔn)確性,有效屏蔽各種因素的干擾。

進(jìn)一步的,在本實(shí)施例中,如圖2所示,步驟30包括:

步驟310,由網(wǎng)絡(luò)接入地址得到應(yīng)用訪問(wèn)用戶的地理特征。

地理特征將是根據(jù)網(wǎng)絡(luò)接入地址中的IP2段進(jìn)行處理得到的,其可由一個(gè)或者多個(gè)IP2段所構(gòu)成的。具體的,如圖3所示,步驟310的具體過(guò)程為:

步驟311,從渠道版本下應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址提取IP2段。

對(duì)于一渠道版本下每一應(yīng)用訪問(wèn)用戶對(duì)應(yīng)的一個(gè)或者多個(gè)網(wǎng)絡(luò)接入地址,逐一對(duì)每一網(wǎng)絡(luò)接入地址進(jìn)行IP2段的提取,以得到每一應(yīng)用訪問(wèn)用戶對(duì)應(yīng)的一個(gè)或者多個(gè)IP2段。

步驟313,處理提取的IP2段得到應(yīng)用訪問(wèn)用戶的地理特征。

IP2段指的是網(wǎng)絡(luò)接入地址的前兩段,前兩段相同的網(wǎng)絡(luò)接入地址一般屬于同一地域,例如,同一省份或者地級(jí)市。應(yīng)用訪問(wèn)用戶的地理特征將包含了該應(yīng)用訪問(wèn)用戶對(duì)應(yīng)的網(wǎng)絡(luò)接入地址中的IP2段,因此,通過(guò)該地理特征即可獲知應(yīng)用訪問(wèn)用戶進(jìn)行應(yīng)用激活和訪問(wèn)時(shí)所在的地理位置。

在每一應(yīng)用訪問(wèn)用戶提取得到的一個(gè)或者多個(gè)IP2段中,對(duì)該應(yīng)用訪問(wèn)用戶對(duì)應(yīng)的一個(gè)或者多個(gè)IP2段進(jìn)行去重和排序處理,即可得到該應(yīng)用訪問(wèn)用戶的地理特征,在消除重復(fù)信息的同時(shí),也保證了地理特征中信息的有序性。

步驟330,根據(jù)地理特征進(jìn)行聚類得到相似的多個(gè)應(yīng)用訪問(wèn)用戶,相似的應(yīng)用訪問(wèn)用戶形成用戶集合。

以地理特征為依據(jù),進(jìn)行應(yīng)用訪問(wèn)用戶的聚類,以形成由相似應(yīng)用訪問(wèn)用戶組成的多個(gè)用戶集合。

進(jìn)一步的,在本實(shí)施例中,如圖4所示,步驟313的具體過(guò)程為:

步驟3131,去重處理應(yīng)用訪問(wèn)用戶的IP2段,消除重復(fù)的IP2段。

步驟3133,對(duì)去重處理后的IP2段進(jìn)行排序得到應(yīng)用訪問(wèn)用戶的地理特征。

去重處理并排序得到的地理特征將形成一字符串,該字符串即為地理特征。

例如,一應(yīng)用訪問(wèn)用戶對(duì)應(yīng)的網(wǎng)絡(luò)接入地址包括:129.138.2.1、129.138.2.155、186.132.5.13和172.15.120.11,提取得到IP2段分別為:129.138、129.138、186.132和172.15,經(jīng)進(jìn)去重處理和排序,形成的有序列表為:

129.138

172.15

186.132

最后將其拼接起來(lái)以形成字符串,形式如:129.138 172.15 186.132,該字符串即為地理特征。

進(jìn)一步的,在本實(shí)施例中,如圖5所示,步驟330包括:

步驟331,分別對(duì)每一應(yīng)用訪問(wèn)用戶的地理特征進(jìn)行哈希計(jì)算得到相應(yīng)的指紋。

通過(guò)哈希計(jì)算使得地理特征相似的應(yīng)用訪問(wèn)用戶具有相同的指紋,這樣就可以對(duì)擁有相似地理特征的應(yīng)用訪問(wèn)用戶進(jìn)行聚類。

具體的,對(duì)地理特征所進(jìn)行的哈希計(jì)算可以是Simhash計(jì)算,相應(yīng)的,所得到的指紋即為由此計(jì)算得到的Simhash值。

其中,對(duì)地理特征所進(jìn)行的Simhash計(jì)算過(guò)程可以是:將一f維的向量V初始化為0,對(duì)應(yīng)的二進(jìn)制數(shù)S初始化為0;對(duì)每一個(gè)地理特征,通過(guò)hash算法產(chǎn)生一個(gè)f位的指紋b,對(duì)指紋b中的if位,其中,i為1,若指紋b的第i位為1,則向量V的第i個(gè)元素加上該特征的權(quán)重即為向量V的第i個(gè)元素所對(duì)應(yīng)的數(shù)值,否則向量V的第i個(gè)元素減去該特征的權(quán)重即為向量V的第i個(gè)元素所對(duì)應(yīng)的數(shù)值。該權(quán)重可設(shè)置為1。

若向量V的第i個(gè)元素大于0,則指紋S的第i位為1,否則為0,以此類推即可得到指紋S所對(duì)應(yīng)的數(shù)值。

步驟333,按照指紋對(duì)應(yīng)用訪問(wèn)用戶進(jìn)行排序,在排序的應(yīng)用訪問(wèn)用戶中將指紋相同的應(yīng)用訪問(wèn)用戶歸類為同一用戶集合。

針對(duì)哈希計(jì)算結(jié)果,基于指紋進(jìn)行排序,具有相同指紋的應(yīng)用訪問(wèn)用戶將形成一個(gè)用戶集合。

在一個(gè)實(shí)施例中,如圖6所示,上述步驟50包括:

步驟510,統(tǒng)計(jì)用戶集合中各應(yīng)用訪問(wèn)用戶的地理特征包含的地理位置種類。

在聚類所得到的用戶集合中,由于每一用戶均有對(duì)應(yīng)的地理特征,即一個(gè)或者多個(gè)IP2段形成的字符串,并且經(jīng)由IP2段即可得到大致的地理位置,如省份或者地級(jí)市等,因此,在一個(gè)用戶集合中,對(duì)各應(yīng)用訪問(wèn)用戶的地理特征進(jìn)行統(tǒng)計(jì)得到該地理特征對(duì)應(yīng)了哪一個(gè)省份、哪一個(gè)地級(jí)市,以得到用戶集合所對(duì)應(yīng)的各省份、地級(jí)市種類,因此,通過(guò)統(tǒng)計(jì)得到的地理位置種類即可得到所在的用戶集合中的地理特征對(duì)應(yīng)了多少個(gè)不同的省份。

步驟520,判斷用戶集合中統(tǒng)計(jì)得到的地理位置種類是否為多個(gè),若為否,則進(jìn)入步驟530,若為是,則進(jìn)入步驟540。

步驟530,將用戶集合的屬性標(biāo)記為單一地理位置屬性。

在判斷得到用戶集合中統(tǒng)計(jì)得到的地理位置種類為一個(gè),則將這一用戶集合標(biāo)記為單一地理位置屬性,以便后續(xù)識(shí)別中對(duì)該用戶集合按照單一地理位置進(jìn)行。對(duì)于屬性標(biāo)記為單一地理位置屬性的用戶集合而言,該用戶集合中各應(yīng)用訪問(wèn)用戶的地理特征均為一個(gè)相同的IP2段。

步驟540,進(jìn)一步判斷多個(gè)地理位置是否跨省,若為是,則進(jìn)入步驟550,若為否,則進(jìn)入步驟560。

步驟550,將用戶集合的屬性標(biāo)記為多地理位置且跨省屬性。

步驟560,將用戶集合的屬性標(biāo)記為多地理位置且未跨省屬性。

在判斷到用戶集合中統(tǒng)計(jì)得到的地理位置種類為多個(gè)的前提條件下,將進(jìn)一步判斷該用戶集合中包含的地理位置是否跨省,即判斷用戶集合中地理位置的多個(gè)IP2段是否為同一省份,若為是,則將該用戶集合的屬性標(biāo)記為多地理位置且未跨省屬性,若為否,則將該用戶集合的屬性標(biāo)記為多地理位置且跨省屬性。

在一個(gè)實(shí)施例中,如圖7所示,上述步驟70包括:

步驟710,獲取應(yīng)用在渠道中的新增用戶總量。

按照預(yù)設(shè)時(shí)間周期獲取渠道中應(yīng)用在這一預(yù)設(shè)時(shí)間周期的新增用戶總量,該預(yù)設(shè)時(shí)間周期可以是單天或者數(shù)天,相應(yīng)的,獲取得到的新增用戶總量可為單天的新增用戶總量或多天的新增用戶總量。

步驟730,按照預(yù)設(shè)的特征值種類根據(jù)渠道中屬性相同的用戶集合和/或新增用戶總量得到特征值。

根據(jù)標(biāo)記的屬性,即單一地理位置屬性、多地理位置且跨省屬性和多地理位置且未跨省屬性,在該渠道的所有用戶集合中,得到屬性相同的用戶集合,即同為單一地理位置的用戶集合、同為多地理位置且跨省的用戶集合以及同為多地理位置且未跨省的用戶集合。

根據(jù)屬性相同的用戶集合按照預(yù)設(shè)的特征值種類進(jìn)行特征值的計(jì)算,其中,根據(jù)特征值種類的計(jì)算需要,也需要將新增用戶總量加入特征值的計(jì)算中。

具體的,預(yù)設(shè)的特征值種類包括相同屬性的用戶集合中應(yīng)用訪問(wèn)用戶總數(shù)量、相同屬性的用戶集合中的應(yīng)用訪問(wèn)用戶比例、相同屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶總數(shù)量以及相同屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶比例。

其中,相同屬性的用戶集合中應(yīng)用訪問(wèn)用戶總數(shù)量是對(duì)屬性相同的所有用戶集合進(jìn)行應(yīng)用訪問(wèn)用戶數(shù)量的統(tǒng)計(jì)得到的;相同屬性的用戶集合可以是單一地理位置屬性,即單IP2聚類的用戶集合中應(yīng)用訪問(wèn)用戶總數(shù)量,也可以是多地理位置且跨省屬性,即多IP2且跨省的用戶集合中應(yīng)用訪問(wèn)用戶總數(shù)量,還可以是多地理位置且未跨省屬性,即多IP2且未跨省的用戶集合中應(yīng)用訪問(wèn)用戶總數(shù)量。

相同屬性的用戶集合中的應(yīng)用訪問(wèn)用戶比例是在屬性相同的用戶集合中計(jì)算這些用戶集合中應(yīng)用訪問(wèn)用戶總數(shù)量和渠道中新增用戶總數(shù)量之間的比例;相同屬性的用戶集合中的應(yīng)用訪問(wèn)用戶比例可以是單一地理位置屬性,即單IP2聚類的用戶集合中的應(yīng)用訪問(wèn)用戶比例,也可以是多地理位置且跨省屬性,即多IP2且跨省的用戶集合中應(yīng)用訪問(wèn)用戶比例,還可以是多地理位置且未跨省屬性,即多IP2且未跨省的用戶集合中應(yīng)用訪問(wèn)用戶比例。

相同屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶總數(shù)量是對(duì)屬性相同的多個(gè)用戶集合中的應(yīng)用訪問(wèn)用戶數(shù)量最多的用戶集合進(jìn)行統(tǒng)計(jì)的。

相同屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶比例是在屬性相同的多個(gè)用戶集合中的應(yīng)用訪問(wèn)用戶數(shù)量最多的用戶集合中計(jì)算應(yīng)用訪問(wèn)用戶總數(shù)量和渠道中新增用戶總數(shù)量之間的比例。

步驟750,判斷特征值是否大于屬性和特征值種類對(duì)應(yīng)的限值,若為是,則進(jìn)入步驟770,若否是,則進(jìn)入步驟790。

由于存在著多種屬性,且特征值也存在著多種,因此,需要根據(jù)特征值所對(duì)應(yīng)的屬性以及該特征值種類選取對(duì)應(yīng)的限值,以使得用于進(jìn)行異常渠道判斷的限值能夠在多種特征值的使用中準(zhǔn)確適應(yīng)當(dāng)前進(jìn)行判斷的特征值,進(jìn)而保證了異常渠道判斷的精準(zhǔn)性。

進(jìn)一步的,如前所述,由于特征值可以是任一屬性和任一特征值種類所對(duì)應(yīng)的,該特征值可以是單一地理位置屬性的用戶集合中應(yīng)用訪問(wèn)用戶總數(shù)量、多地理位置且跨省屬性的用戶集合中應(yīng)用訪問(wèn)用戶總數(shù)量、多地理位置且未跨省屬性的用戶集合中應(yīng)用訪問(wèn)用戶總數(shù)量、單一地理位置屬性的用戶集合中的應(yīng)用訪問(wèn)用戶比例、多地理位置且跨省屬性的用戶集合中應(yīng)用訪問(wèn)用戶比例、多地理位置且未跨省屬性的用戶集合中應(yīng)用訪問(wèn)用戶比例、單一地理位置屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶總數(shù)量、多地理位置且跨省屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶總數(shù)量、多地理位置且未跨省屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶總數(shù)量、單一地理位置屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶比例、多地理位置且跨省屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶比例和多地理位置且未跨省屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶比例中的任意一種。

其中,若相同屬性下的應(yīng)用訪問(wèn)用戶過(guò)多,則說(shuō)明這些應(yīng)用訪問(wèn)用戶可能為虛假用戶,相應(yīng)的,該渠道為異常渠道,該渠道中使用了刷量工具,因此,可判斷相同屬性的用戶集合中應(yīng)用訪問(wèn)用戶總數(shù)量是否大于該屬性和特征值種類對(duì)應(yīng)的限值,若為是,則生成渠道為異常渠道的識(shí)別結(jié)果。

若一個(gè)渠道下有很高比例的應(yīng)用訪問(wèn)用戶均來(lái)自于某一相同屬性的用戶集合,則該渠道可能使用了刷量工具。因此,可判斷相同屬性的用戶集合中的應(yīng)用訪問(wèn)用戶比例是否大于對(duì)應(yīng)的限值,若為是,則生成渠道為異常渠道的識(shí)別結(jié)果。

若相同屬性的多個(gè)用戶集合中,最大用戶集合的應(yīng)用訪問(wèn)用戶總數(shù)量很多,則該渠道使用了刷量工具的可能性也極高。因此,可判斷相同屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶總數(shù)量是否大于對(duì)應(yīng)的限值,若為是,則生成渠道為異常渠道的識(shí)別結(jié)果。

若一個(gè)渠道下相同屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶總數(shù)量占新增用戶總數(shù)量的比例很高,則說(shuō)明該渠道使用刷量工具的可能性極高。因此,判斷相同屬性的用戶集合中最大用戶集合的應(yīng)用訪問(wèn)用戶比例是否大于對(duì)應(yīng)的限值,若為是,則生成渠道為異常渠道的識(shí)別結(jié)果。

如上所述的多個(gè)特征值的逐一判斷過(guò)程可根據(jù)實(shí)際運(yùn)營(yíng)的需要選取使用某一種或幾種特征值,也可選用所有種類的特征值,而具體一的判斷順序也可根據(jù)實(shí)際運(yùn)營(yíng)的情況而確定。

步驟770,生成渠道為異常渠道的識(shí)別結(jié)果。

通過(guò)如上所述的特征值的判斷,將精準(zhǔn)識(shí)別異常渠道,從而使得應(yīng)用的開(kāi)發(fā)者得以獲知應(yīng)用的實(shí)際運(yùn)營(yíng)情況,并且避免了異常渠道向應(yīng)用的開(kāi)發(fā)者騙取應(yīng)用的推廣費(fèi)用,屏蔽了渠道中存在的各種惡意手段,有助于安全性的提高。

步驟790,生成渠道為正常渠道的識(shí)別結(jié)果。

通過(guò)如此所述的檢測(cè)異常渠道的方法,可通過(guò)應(yīng)用的服務(wù)器直接監(jiān)控進(jìn)行應(yīng)用分發(fā)的多個(gè)渠道,識(shí)別出其中的異常渠道,進(jìn)而為應(yīng)用提供安全的生態(tài)環(huán)境。

在一個(gè)實(shí)施例中,還相應(yīng)地提供了一種檢測(cè)異常渠道的系統(tǒng),如圖8所示,包括:提取裝置810、用戶關(guān)聯(lián)裝置830、統(tǒng)計(jì)裝置850和識(shí)別裝置870,其中:

提取裝置810,用于提取渠道版本下應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址。

用戶關(guān)聯(lián)裝置830,用于將網(wǎng)絡(luò)接入地址存在關(guān)聯(lián)的多個(gè)應(yīng)用訪問(wèn)用戶形成該渠道版本對(duì)應(yīng)的多個(gè)用戶集合。

統(tǒng)計(jì)裝置850,用于統(tǒng)計(jì)用戶集合的屬性。

識(shí)別裝置870,用于根據(jù)統(tǒng)計(jì)得到的屬性進(jìn)行異常渠道的識(shí)別。

進(jìn)一步的,在本實(shí)施例中,如圖9所示,該用戶關(guān)聯(lián)裝置830包括:特征生成模塊831和聚類模塊833,其中:

特征生成模塊831,用于由網(wǎng)絡(luò)接入地址得到應(yīng)用訪問(wèn)用戶的地理特征。

聚類模塊833,用于根據(jù)地理特征進(jìn)行聚類得到相似的多個(gè)應(yīng)用訪問(wèn)用戶,相似的應(yīng)用訪問(wèn)用戶形成用戶集合。

進(jìn)一步的,在本實(shí)施例中,如圖10所示,該特征生成模塊831包括IP2段提取單元8311和IP2段處理單元8313。

IP2段提取單元8311,用于從渠道版本下應(yīng)用訪問(wèn)用戶的網(wǎng)絡(luò)接入地址提取IP2段。

IP2段處理單元8313,用于處理提取的IP2段得到應(yīng)用訪問(wèn)用戶的地理特征。

具體的,如圖11所示,上述IP2段處理單元8313包括去重子單元83131和排序子單元83133,其中:

去重子單元在83131,用于去重處理應(yīng)用訪問(wèn)用戶的IP2段,消除重復(fù)的IP2段。

排序子單元83133,用于對(duì)去重處理后的IP2段進(jìn)行排序得到應(yīng)用訪問(wèn)用戶的地理特征。

在另一個(gè)實(shí)施例中,如圖12所示,聚類模塊833包括哈希計(jì)算單元8331和指紋排序單元8333。

哈希計(jì)算單元8331,用于分別對(duì)每一應(yīng)用訪問(wèn)用戶的地理特征進(jìn)行哈希計(jì)算得到相應(yīng)的指紋。

指紋排序單元,用于按照指紋對(duì)應(yīng)用訪問(wèn)用戶進(jìn)行排序,在排序的應(yīng)用訪問(wèn)用戶中將指紋相同的應(yīng)用訪問(wèn)用戶歸類為同一用戶集合。

在另一個(gè)實(shí)施例中,如圖13所示,上述統(tǒng)計(jì)裝置850包括:種類統(tǒng)計(jì)模塊851、判斷模塊852、單一屬性標(biāo)記模塊853、跨省位置判斷模塊854和跨省屬性標(biāo)記模塊855和未跨省屬性標(biāo)記模塊857,其中:

種類統(tǒng)計(jì)模塊851,用于統(tǒng)計(jì)用戶集合中各應(yīng)用訪問(wèn)用戶的地理特征包含的地理位置種類。

判斷模塊852,用于判斷用戶集合中統(tǒng)計(jì)得到的地理位置是否為多個(gè),若為否,則通知單一屬性標(biāo)記模塊853,若為是,則通知跨省位置判斷模塊854。

單一屬性標(biāo)記模塊853,用于將用戶集合的屬性標(biāo)記為單一地理位置屬性。

跨省位置判斷模塊854,用于進(jìn)一步判斷多個(gè)地理位置是否跨省,若為是,則通知跨省屬性標(biāo)記模塊855,若為否,則通知未跨省屬性標(biāo)記模塊857。

跨省屬性標(biāo)記模塊855,用于將用戶集合的屬性為多地理位置且跨省屬性。

未跨省屬性標(biāo)記模塊857,用于將用戶集合的屬性標(biāo)記為多地理位置且未跨省屬性。

在另一個(gè)實(shí)施例中,如圖14所示,上述識(shí)別模塊870包括:新增總量獲取模塊871、特征值運(yùn)算模塊873和超限判斷模塊875,其中:

新增總量獲取模塊871,用于獲取應(yīng)用在渠道中的新增用戶總量。

特征值運(yùn)算模塊873,用于按照預(yù)設(shè)的特征值種類根據(jù)渠道中屬性相同的用戶集合和/或新增用戶總量得到特征值。

超限判斷模塊875,用于判斷特征值是否大于屬性和特征值種類對(duì)應(yīng)的限值,若為是,則生成渠道為異常渠道的識(shí)別結(jié)果,若為否,則生成渠道為正常渠道的識(shí)別結(jié)果。

圖15是本發(fā)明實(shí)施例提供的一種服務(wù)器結(jié)構(gòu)示意圖。該服務(wù)器2000可因配置或性能不同而產(chǎn)生比較大的差異,可以包括一個(gè)或一個(gè)以上中央處理器(central processing units,CPU)2010(例如,一個(gè)或一個(gè)以上處理器)和存儲(chǔ)器2020,一個(gè)或一個(gè)以上存儲(chǔ)應(yīng)用程序2031或數(shù)據(jù)2033的存儲(chǔ)介質(zhì)2030(例如一個(gè)或一個(gè)以上海量存儲(chǔ)設(shè)備)。其中,存儲(chǔ)器2020和存儲(chǔ)介質(zhì)2030可以是短暫存儲(chǔ)或持久存儲(chǔ)。存儲(chǔ)在存儲(chǔ)介質(zhì)2030的程序可以包括一個(gè)或一個(gè)以上模塊(圖示未示出),每個(gè)模塊可以包括對(duì)服務(wù)器中的一系列指令操作。更進(jìn)一步地,中央處理器2010可以設(shè)置為與存儲(chǔ)介質(zhì)2030通信,在服務(wù)器2000上執(zhí)行存儲(chǔ)介質(zhì)2030中的一系列指令操作。服務(wù)器2000還可以包括一個(gè)或一個(gè)以上電源2050,一個(gè)或一個(gè)以上有線或無(wú)線網(wǎng)絡(luò)接口2070,一個(gè)或一個(gè)以上輸入輸出接口2080,和/或,一個(gè)或一個(gè)以上操作系統(tǒng)2035,例如Windows ServerTM,Mac OS XTM,UnixTM, LinuxTM,F(xiàn)reeBSDTM等等。上述圖1至圖7所示實(shí)施例中所述的由服務(wù)器所執(zhí)行的步驟可以基于該圖15所示的服務(wù)器結(jié)構(gòu)。

本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例的全部或部分步驟可以通過(guò)硬件來(lái)完成,也可以通過(guò)程序來(lái)指令相關(guān)的硬件完成,所述的程序可以存儲(chǔ)于一種計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)中,上述提到的存儲(chǔ)介質(zhì)可以是只讀存儲(chǔ)器,磁盤(pán)或光盤(pán)等。

雖然已參照幾個(gè)典型實(shí)施方式描述了本發(fā)明,但應(yīng)當(dāng)理解,所用的術(shù)語(yǔ)是說(shuō)明和示例性、而非限制性的術(shù)語(yǔ)。由于本發(fā)明能夠以多種形式具體實(shí)施而不脫離發(fā)明的精神或?qū)嵸|(zhì),所以應(yīng)當(dāng)理解,上述實(shí)施方式不限于任何前述的細(xì)節(jié),而應(yīng)在隨附權(quán)利要求所限定的精神和范圍內(nèi)廣泛地解釋,因此落入權(quán)利要求或其等效范圍內(nèi)的全部變化和改型都應(yīng)為隨附權(quán)利要求所涵蓋。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
雅安市| 根河市| 尚义县| 潜山县| 涞水县| 三河市| 梁河县| 静宁县| 西宁市| 绥阳县| 长岭县| 汝城县| 府谷县| 莱阳市| 开平市| 杭锦旗| 兴安盟| 文成县| 峡江县| 竹溪县| 五河县| 依安县| 靖州| 镇远县| 茶陵县| 河东区| 萨嘎县| 宿迁市| 凤冈县| 辛集市| 太仓市| 扎囊县| 镇平县| 荥经县| 天柱县| 凤冈县| 松桃| 根河市| 津南区| 平南县| 太和县|