一種識別網(wǎng)站用戶的方法和裝置制造方法
【專利摘要】本發(fā)明實施例公開了一種識別網(wǎng)站用戶的方法和裝置。其中,從數(shù)據(jù)庫中獲取賬號和用戶標識;通過將所述賬號和用戶標識作為節(jié)點,并連接具有關聯(lián)關系的賬號節(jié)點和用戶標識節(jié)點的方式,建立連通圖;在所述連通圖中查找連通分量,所述連通分量中所有賬號節(jié)點對應的賬號構成與同一個網(wǎng)站用戶綁定的賬號群體;計算所述賬號群體的賬號密度和賬號欺詐關閉率;判斷所述賬號密度和賬號欺詐關閉率是否在預設的正常數(shù)值范圍內(nèi);如果是,將所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶,否則,將所述賬號群體確定為正常賬號群體,與所述正常賬號群體綁定的網(wǎng)站用戶為正常的網(wǎng)站用戶。根據(jù)本發(fā)明實施例,以有效地識別網(wǎng)站用戶,提高識別的準確率,并且可以實現(xiàn)提前預防欺詐事件發(fā)生的目的。
【專利說明】一種識別網(wǎng)站用戶的方法和裝置
【技術領域】
[0001]本發(fā)明涉及計算機應用領域,特別是涉及一種識別網(wǎng)站用戶的方法和裝置。
【背景技術】
[0002]各類網(wǎng)站通常都擁有大量的網(wǎng)站用戶,在這些網(wǎng)站用戶中,有些網(wǎng)站用戶在登錄網(wǎng)站后會憑借網(wǎng)站這個平臺對其它的網(wǎng)站用戶實施某種欺詐行為。例如,一些賣家(淘寶網(wǎng)的網(wǎng)站用戶)在淘寶網(wǎng)上發(fā)布虛假商品信息,并且只收錢而不發(fā)貨,詐騙買家的錢財。對于網(wǎng)站系統(tǒng)而言,這些實施欺詐行為的網(wǎng)站用戶就屬于危險的網(wǎng)站用戶。
[0003]為了防控危險的網(wǎng)站用戶的欺詐行為,必須要先從海量的網(wǎng)站用戶中準確地識別出哪些為危險的網(wǎng)站用戶。通常,網(wǎng)站用戶是通過賬號來登錄網(wǎng)站的,不同的網(wǎng)站用戶綁定的賬號也不同,因此,可以直接利用賬號來識別一個網(wǎng)站用戶。并且,通過判斷某個賬號是否發(fā)生欺詐事實,進一步確定與該賬號綁定的網(wǎng)站用戶是否屬于危險的網(wǎng)站用戶。對于那些被確定為危險的網(wǎng)站用戶,服務器可以進一步采取一些防控措施,如,對該賬號進行重點監(jiān)視,必要時還可以關閉該賬號。然而,這些危險的網(wǎng)站用戶往往會通過各種手段在同一個網(wǎng)站上注冊多個賬號,一個賬號被關閉后,還可以利用其它未關閉的賬號繼續(xù)實施欺詐行為。
[0004]網(wǎng)站用戶在利用賬號登錄網(wǎng)站時,服務器通常會記錄一些反映用戶基本信息的用戶標識,如,IP地址、Agent、cookie、用戶ID (如,用戶的郵箱或手機號)或MAC(Medium/Media Access Control,介質訪問控制)地址等。即使網(wǎng)站用戶在同一個網(wǎng)站上注冊了多個賬號,但所有賬號很有可能會關聯(lián)同一個用戶標識,如,當網(wǎng)站用戶利用同一臺電腦在網(wǎng)站上注冊多個賬號時,所有的賬號都會關聯(lián)同一個IP地址。如果多個賬號關聯(lián)同一個用戶標識,由這些賬號構成的賬號集合可能是與同一個網(wǎng)站用戶綁定的。因此,除了賬號之外,也可以利用與同一個用戶標識關聯(lián)的賬號集合來識別一個網(wǎng)站用戶。并且,通過判斷某個賬號集合中是否有一個賬號發(fā)生欺詐事實,進一步確定與該賬號集合綁定的網(wǎng)站用戶是否屬于危險的網(wǎng)站用戶。例如,服務器會把該賬號所關聯(lián)的所有用戶標識列入黑名單中,與任何一個使用黑名單中的用戶標識的賬號綁定的網(wǎng)站用戶都屬于危險的網(wǎng)站用戶。
[0005]但是,在實現(xiàn)本發(fā)明的過程中,本發(fā)明的發(fā)明人發(fā)現(xiàn)現(xiàn)有技術中至少存在如下問題:雖然利用與同一個用戶標識關聯(lián)的賬號集合識別網(wǎng)站用戶要比利用賬號識別網(wǎng)站用戶的識別范圍廣,準確率高,然而,由于危險的網(wǎng)站用戶的警惕性較高,其使用的所有賬號有時也未必會共用同一個用戶標識,例如,當網(wǎng)站用戶利用不同的電腦在網(wǎng)站上注冊多個賬號時,這些賬號就會關聯(lián)不同的IP地址。因此,利用與欺詐事實成立的賬號關聯(lián)的用戶標識也無法全面地識別出一個危險的網(wǎng)站用戶,其識別的準確率也受到了一定的限制。并且,在利用上述關聯(lián)關系確定賬號群體時,需要在所有的賬號和用戶標識中查找與同一個用戶標識關聯(lián)的賬號集合,由于帳號和用戶標識的數(shù)量都非常大,服務器在進行上述查找時的工作量也非常巨大,因此,服務器的處理速度就會非常慢。
【發(fā)明內(nèi)容】
[0006]為了解決上述技術問題,本發(fā)明實施例提供了一種識別網(wǎng)站用戶的方法和裝置,以有效地識別網(wǎng)站用戶,提高識別的準確率,提高服務器的處理速度,并且可以實現(xiàn)提前預防欺詐事件發(fā)生的目的。
[0007]本發(fā)明實施例公開如下技術方案:
[0008]一種識別網(wǎng)站用戶的方法,包括:
[0009]從數(shù)據(jù)庫中獲取賬號和用戶標識;
[0010]通過將所述賬號和用戶標識作為節(jié)點,并連接具有關聯(lián)關系的賬號節(jié)點和用戶標識節(jié)點的方式,建立連通圖;
[0011]在所述連通圖中查找連通分量,所述連通分量中所有賬號節(jié)點對應的賬號構成與同一個網(wǎng)站用戶綁定的賬號群體;
[0012]計算所述賬號群體的賬號密度和賬號欺詐關閉率;
[0013]判斷所述賬號密度和賬號欺詐關閉率是否在預設的正常數(shù)值范圍內(nèi);
[0014]如果是,將所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶,否則,將所述賬號群體確定為正常賬號群體,與所述正常賬號群體綁定的網(wǎng)站用戶為正常的網(wǎng)站用戶。
[0015]一種識別網(wǎng)站用戶的方法,包括:
[0016]從數(shù)據(jù)庫中獲取賬號和用戶標識;
[0017]通過將所述賬號和用戶標識作為節(jié)點,并連接具有關聯(lián)關系的賬號節(jié)點和用戶標識節(jié)點的方式,建立連通圖;
[0018]在所述連通圖中查找連通分量,所述連通分量中所有賬號節(jié)點對應的賬號構成與同一個網(wǎng)站用戶綁定的賬號群體;
[0019]判斷所述賬號群體中是否存在因欺詐和/或疑似欺詐而關閉的賬號;
[0020]如果是,將所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶,否則,將所述賬號群體確定為正常賬號群體,與所述正常賬號群體綁定的網(wǎng)站用戶為正常的網(wǎng)站用戶。
[0021]一種識別網(wǎng)站用戶的裝置,包括:
[0022]獲取模塊,用于從數(shù)據(jù)庫中獲取賬號和用戶標識;
[0023]建立模塊,用于通過將所述賬號和用戶標識作為節(jié)點,并連接具有關聯(lián)關系的賬號節(jié)點和用戶標識節(jié)點的方式,建立連通圖;
[0024]查找模塊,用于在所述連通圖中查找連通分量,所述連通分量中的所有節(jié)點對應的賬號和用戶標識構成與同一個網(wǎng)站用戶綁定的賬號群體;
[0025]第一參數(shù)計算模塊,用于計算所述賬號群體的賬號密度和賬號欺詐關閉率;
[0026]第一參數(shù)判斷模塊,用于判斷所述賬號密度和賬號欺詐關閉率是否在預設的正常數(shù)值范圍內(nèi);
[0027]第一網(wǎng)站用戶識別模塊,用于當?shù)谝粎?shù)判斷模塊的判斷結果為是時,將所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶,否貝U,將所述賬號群體確定為正常賬號群體,與所述正常賬號群體綁定的網(wǎng)站用戶為正常的網(wǎng)站用戶。[0028]一種識別網(wǎng)站用戶的裝置,包括:
[0029]獲取模塊,用于從數(shù)據(jù)庫中獲取賬號和用戶標識;
[0030]建立模塊,用于通過將所述賬號和用戶標識作為節(jié)點,并連接具有關聯(lián)關系的賬號節(jié)點和用戶標識節(jié)點的方式,建立連通圖;
[0031]查找模塊,用于在所述連通圖中查找連通分量,所述連通分量中的所有節(jié)點對應的賬號和用戶標識構成與同一個網(wǎng)站用戶綁定的賬號群體;
[0032]判斷模塊,用于判斷所述賬號群體中是否存在因欺詐和/或疑似欺詐而關閉的賬號;
[0033]第二網(wǎng)站用戶識別模塊,用于當判斷模塊的判斷結果為是時,將所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶,否則,將所述賬號群體確定為正常賬號群體,與所述正常賬號群體綁定的網(wǎng)站用戶為正常的網(wǎng)站用戶。
[0034]由上述實施例可以看出,對于數(shù)據(jù)庫中存在的海量賬號和用戶標識,利用圖論原理,從中找到直接關聯(lián)和間接關聯(lián)的賬號,而由這些賬號以及與這些賬號關聯(lián)的用戶標識所構成的賬號群體是屬于一個網(wǎng)站用戶的,這樣識別出的網(wǎng)站用戶更加全面更加準確。并且,當服務器利用圖論原理查找上述賬號群體時,并不需要在所有的賬號和用戶標識中一一進行查找,節(jié)省了服務器的工作量,也就提高了服務器的處理速度。對于擁有一個賬號群體的網(wǎng)站用戶,可以通過計算這個賬號群體的賬號密度和賬號欺詐關閉率預先識別出這個網(wǎng)站用戶是否為一個危險的網(wǎng)站用戶。也可以通過判斷該賬號群體中是否存在因欺詐和/或疑似欺詐而關閉的賬號,而識別出這個網(wǎng)站用戶是否為一個危險的網(wǎng)站用戶。
【專利附圖】
【附圖說明】
[0035]為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術中的技術方案,下面將對實施例或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實施例,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
[0036]圖1為本發(fā)明一種識別網(wǎng)站用戶的方法一個實施例流程圖;
[0037]圖2為圖論中的連通圖示意圖;
[0038]圖3為本發(fā)明中一種利用標記擴散法查找連通圖中連通分量的方法示意圖;
[0039]圖4為本發(fā)明中連通分量的查找示意圖;
[0040]圖5為本發(fā)明一種識別網(wǎng)站用戶的方法的另一個實施例流程圖;
[0041]圖6為本發(fā)明一種標識網(wǎng)站用戶的方法的另一個實施例流程圖;
[0042]圖7為本發(fā)明一種標識網(wǎng)站用戶的裝置的一個實施例結構圖;
[0043]圖8為本發(fā)明中查找模塊的結構示意圖;
[0044]圖9為本發(fā)明一種標識網(wǎng)站用戶的裝置的另一個實施例結構圖;
[0045]圖10為本發(fā)明一種標識網(wǎng)站用戶的裝置的另一個實施例結構圖。
【具體實施方式】
[0046]本發(fā)明實施例提供了識別網(wǎng)站用戶的方法和裝置。對于數(shù)據(jù)庫中存在的海量賬號和用戶標識,利用圖論原理,從中找到直接關聯(lián)和間接關聯(lián)的賬號,而由這些賬號以及與這些賬號關聯(lián)的用戶標識所構成的賬號群體是屬于一個網(wǎng)站用戶的,這樣識別出的網(wǎng)站用戶更加全面更加準確。對于擁有一個賬號群體的網(wǎng)站用戶,可以通過計算這個賬號群體的賬號密度和賬號欺詐關閉率預先識別出這個網(wǎng)站用戶是否為一個危險的網(wǎng)站用戶。也可以通過判斷該賬號群體中是否存在因欺詐和/或疑似欺詐而關閉的賬號,而識別出這個網(wǎng)站用戶是否為一個危險的網(wǎng)站用戶。
[0047]為使本發(fā)明的上述目的、特征和優(yōu)點能夠更加明顯易懂,下面結合附圖對本發(fā)明實施例進行詳細描述。
[0048]實施例一
[0049]請參閱圖1,其為本發(fā)明一種識別網(wǎng)站用戶的方法一個實施例流程圖,該方法包括以下步驟:
[0050]步驟101:從數(shù)據(jù)庫中獲取賬號和用戶標識;
[0051]當網(wǎng)站用戶登錄網(wǎng)站時,服務器會記錄每個網(wǎng)站用戶登錄網(wǎng)站時的賬號以及一些用戶標識,并保存到數(shù)據(jù)庫中。在具體實施時,可定期從數(shù)據(jù)庫中獲取某一段時間內(nèi)(如,最近3個月內(nèi))保存的賬號和用戶標識。
[0052]例如,從數(shù)據(jù)庫中獲取的賬號和用戶標識可包括以下數(shù)據(jù):(I)每一個賬號關聯(lián)的所有用戶標識的列表;(2)每一個用戶標識關聯(lián)的所有賬號的列表。這些數(shù)據(jù)可以作為圖論中的用于表示一個連通圖的鄰接表,并根據(jù)該鏈接表構建一個連通圖。
[0053]步驟102:通過將所述賬號和用戶標識作為節(jié)點,并連接具有關聯(lián)關系的賬號節(jié)點和用戶節(jié)點的方式,建立連通圖;
[0054]如圖2所示,其為圖論中的連通圖示意圖。圖2中的連通圖由3個連通分量構成。在圖論中,如果其中的任何兩個節(jié)點之間都存在一條路徑,并且它們都不和子圖之外的節(jié)點相連,這樣的子圖被稱為連通分量。圖2中的圓點表示連通分量中的節(jié)點,在本發(fā)明中,將賬號和用戶標識作為節(jié)點,圖2中的連接線表示連通分量中的路徑,在本發(fā)明中,當一個賬號和一個用戶標識具有關聯(lián)關系時,在該賬號對應的賬號節(jié)點和該用戶標識對應的用戶標識節(jié)點之間可建立一條路徑。
[0055]步驟103:在所述連通圖中查找連通分量,所述連通分量中所有賬號節(jié)點對應的賬號構成與同一個網(wǎng)站用戶綁定的賬號群體;
[0056]在利用賬號和用戶標識構建了圖2所示的連通圖后,可利用圖論中的標記擴散方法來尋找連通圖中的連通分量。當然,也可以采用圖論中的其它方法來尋找連通圖中的連通分量,本發(fā)明對此不做限定。
[0057]優(yōu)選的,如圖3所示,其為本發(fā)明中一種利用標記擴散法查找連通圖中連通分量的方法示意圖,所述在連通圖中查找連通分量包括:
[0058]步驟301、比較連通圖中的各節(jié)點的當前標記值與和與所述各節(jié)點具有連接關系的其它節(jié)點的當前標記值的大小;
[0059]步驟302:選擇最小的標記值作為所述各節(jié)點的當前標記值;
[0060]步驟303、判斷是否至少有一個節(jié)點的當前標記值發(fā)生了變化,如果是,返回步驟301,否則,進入步驟304 ;
[0061]步驟304、從連通圖中提取擁有相同標記值的節(jié)點為一個連通分量。
[0062]例如,如圖4-1所示,假設連通圖中有5個節(jié)點:A、B、C、D和E,并對這5個節(jié)點進行標記,每個節(jié)點就會擁有一個標記值。如,可以使用任意5個數(shù)字對這5個節(jié)點進行標記,當然,一種更簡單的方式是:按照節(jié)點自上而下的順序依次對各節(jié)點進行標記,假設,經(jīng)過標記后,這5個節(jié)點的當前標記值分別為O、1、3、2和4。將A節(jié)點的當前標記值發(fā)送給B節(jié)點,將B節(jié)點的當前標記值發(fā)送給A節(jié)點和C節(jié)點,將C節(jié)點的當前標記值發(fā)送給B節(jié)點、D節(jié)點和E節(jié)點,將D節(jié)點的當前標記值發(fā)送給C節(jié)點,將E節(jié)點的當前標記值發(fā)送給C節(jié)點。對于A節(jié)點而言,由于其自身的當前標記值為O,而接收的B節(jié)點的當前標記值為1,因此,A節(jié)點的當前標記值仍然為O。對于B節(jié)點而言,由于其自身的當前標記值為1,而接收的A節(jié)點的當前標記值為O,因此,B節(jié)點的當前標記值由I變?yōu)镺,以此類推,如圖4-2所示,經(jīng)過第一次更新后,B節(jié)點的當前標記值由I變?yōu)镺,C節(jié)點的當前標記值由3變?yōu)?,D節(jié)點的當前標記值仍然為2,E節(jié)點的當前標記值由4變?yōu)?。
[0063]由于B節(jié)點、C節(jié)點和E節(jié)點的當前標記值發(fā)生了變化,繼續(xù)將各節(jié)點的當前標記值發(fā)送給具有連接關系的其它節(jié)點,并第二次更新各節(jié)點的當前標記值,如圖4-3所示,經(jīng)過第二次更新后,C節(jié)點的當前標記值由I變?yōu)?,D節(jié)點的當前標記值由2變?yōu)?,E節(jié)點的當前標記值由3變?yōu)?,A節(jié)點和B節(jié)點的當前標記值沒有發(fā)生改變,仍然為O。 [0064]由于C節(jié)點、D節(jié)點和E節(jié)點的當前標記值發(fā)生了變化,繼續(xù)將各節(jié)點的當前標記值發(fā)送給具有連接關系的其它節(jié)點,并第三次更新各節(jié)點的當前標記值。如圖4-4所示,經(jīng)過第三次更新后,D節(jié)點的當前標記值由I變?yōu)?,E節(jié)點的當前標記值由I變?yōu)?,其它節(jié)點的當前標記值沒有發(fā)生改變,仍然為O。
[0065]由于D節(jié)點和E節(jié)點的當前標記值發(fā)生了變化,繼續(xù)將各節(jié)點的當前標記值發(fā)送給具有連接關系的其它節(jié)點,并第四次更新各節(jié)點的當前標記值。經(jīng)過第四次更新后,所有節(jié)點的當前標記值均沒有發(fā)生改變,仍然為0,結束更新過程。此時,A-E節(jié)點為擁有相同標記值的節(jié)點,其構成一個連通分量。,以上采用的是圖論中的標記擴散方法來尋找具有相同標記值的節(jié)點,在圖論中,這些具有相同標記值的節(jié)點就是連通圖中的一個連通分量。該連通分量中由所有賬號節(jié)點對應的賬號構成與同一個網(wǎng)站用戶綁定的賬號群體。例如,假設圖4中的A節(jié)點和C節(jié)點為用戶標識節(jié)點,B節(jié)點、D節(jié)點和E節(jié)點為賬號節(jié)點,那么,B節(jié)點、D節(jié)點和E節(jié)點對應的賬號構成一個賬號群體,該賬號群體與同一個網(wǎng)站用戶綁定,也就是說,該賬號群體標識了同一個網(wǎng)站用戶。并且,通過圖論的理論得到的賬號群體中可能不僅包括直接關聯(lián)的賬號,還包括間接關聯(lián)的賬號。所謂直接關聯(lián)的賬號為關聯(lián)相同的用戶標識的一組賬號,所謂間接關聯(lián)的賬號為對于帳號A和帳號B來說,如果能找到一系列帳號X1, X2,..Xm(M≥1),使得A與X1直接關聯(lián),Xi與X+1(1 ≤i≤n_1)直接關聯(lián),Xm與B直接關聯(lián),則A與B是間接關聯(lián)帳號。
[0066]步驟104:計算所述賬號群體的賬號密度和賬號欺詐關閉率;
[0067]其中,通過如下方式計算一個賬號群體的賬號密度:
[0068]統(tǒng)計在所述賬號群體中所有賬號的總個數(shù),以及所有賬號對應的賬號節(jié)點的節(jié)點度數(shù)之和;
[0069]按照公式
【權利要求】
1.一種識別網(wǎng)站用戶的方法,其特征在于,包括: 從數(shù)據(jù)庫中獲取賬號和用戶標識; 通過將所述賬號和用戶標識作為節(jié)點,并連接具有關聯(lián)關系的賬號節(jié)點和用戶標識節(jié)點的方式,建立連通圖; 在所述連通圖中查找連通分量,所述連通分量中所有賬號節(jié)點對應的賬號構成與同一個網(wǎng)站用戶綁定的賬號群體; 計算所述賬號群體的賬號密度和賬號欺詐關閉率; 判斷所述賬號密度和賬號欺詐關閉率是否在預設的正常數(shù)值范圍內(nèi); 如果是,將所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶,否則,將所述賬號群體確定為正常賬號群體,與所述正常賬號群體綁定的網(wǎng)站用戶為正常的網(wǎng)站用戶。
2.根據(jù)權利要求1所述的方法,其特征在于,所述在所述連通圖中查找連通分量包括: 比較連通圖中各節(jié)點的當前標記值和與所述各節(jié)點具有連接關系的其它節(jié)點的當前標記值的大??; 選取最小的標記值作為所 述各節(jié)點的當前標記值; 判斷是否至少有一個節(jié)點的當前標記值發(fā)生了變化; 如果是,繼續(xù)比較連通圖中各節(jié)點的當前標記值和具有連接關系的其它節(jié)點的當前標記值大??; 否則,從連通圖中提取擁有相同標記值的節(jié)點為一個連通分量。
3.根據(jù)權利要求1所述的方法,其特征在于,所述計算所述賬號群體的賬號密度包括: 統(tǒng)計在所述賬號群體中所有賬號的總個數(shù),以及所有賬號對應的賬號節(jié)點的節(jié)點度數(shù)之和;
?在所述賬&群體111所有賬兮對應的賬&節(jié)點的節(jié)點度數(shù)總和 '、、、ax(n-l)密度,η為在所述賬號群體中所有賬號的總個數(shù)。
4.根據(jù)權利要求1所述的方法,其特征在于,所述計算所述賬號群體的賬號欺詐關閉率包括: 統(tǒng)計在所述賬號群體中所有賬號的總個數(shù)、以及因欺詐和/或疑似欺詐而關閉的賬號個數(shù); 計算在所述賬號群體中因欺詐和/或疑似欺詐而關閉的賬號個數(shù)與所有賬號的總個數(shù)的比值,所述比值為所述賬號群體的賬號欺詐關閉率。
5.根據(jù)權利要求1-4中任意一項所述的方法,其特征在于,當所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶后,所述方法還包括: 計算所述連通分量中用戶標識節(jié)點對應的用戶標識的標識欺詐關閉率; 判斷所述標識欺詐關閉率是否在預設的正常數(shù)據(jù)范圍內(nèi); 如果是,將所述用戶標識確定為危險用戶標識,與所述危險用戶標識關聯(lián)的賬號為危險賬號; 否則,將所述用戶標識確定為正常用戶標識,與所述正常用戶標識關聯(lián)的賬號為正常賬號。
6.根據(jù)權利要求5所述的方法,其特征在于,所述計算所述連通分量中用戶標識節(jié)點對應的用戶標識的標識欺詐關閉率包括: 統(tǒng)計在所述賬號群體中與所述用戶標識關聯(lián)的賬號總個數(shù),以及在所述與用戶標識關聯(lián)的賬號總個數(shù)中因欺詐和/或疑似欺詐而關閉的賬號個數(shù); 計算在所述與用戶標識關聯(lián)的賬號總個數(shù)中因欺詐和/或疑似欺詐而關閉的賬號個數(shù)與在所述賬號群體中與所述用戶標識關聯(lián)的賬號總個數(shù)的比值,所述比值為用戶標識的標識欺詐關閉率。
7.一種識別網(wǎng)站用戶的方法,其特征在于,包括: 從數(shù)據(jù)庫中獲取賬號和用戶標識; 通過將所述賬號和用戶標識作為節(jié)點,并連接具有關聯(lián)關系的賬號節(jié)點和用戶標識節(jié)點的方式,建立連通圖; 在所述連通圖中查找連通分量,所述連通分量中所有賬號節(jié)點對應的賬號構成與同一個網(wǎng)站用戶綁定的賬號群體; 判斷所述賬號群體中是否存在因欺詐和/或疑似欺詐而關閉的賬號; 如果是,將所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶,否則,將所述賬號群體確定為正常賬號群體,與所述正常賬號群體綁定的網(wǎng)站用戶為正常的網(wǎng)站用戶。
8.根據(jù)權利要求7所述的方法,其特征在于,所述在所述連通圖中查找連通分量包括: 比較連通圖中的各節(jié)點的當前標記值和與所述各節(jié)點具有連接關系的其它節(jié)點的當前標記值的大小; 選取最小的標記值作為所述各節(jié)點的當前標記值; 判斷是否至少有一個節(jié)點的當前標記值發(fā)生了變化,如果是,繼續(xù)比較連通圖中各節(jié)點的當前標記值和具有連接關系的其它節(jié)點的當前標記值大??; 否則,從連通圖中提取擁有相同標記值的節(jié)點為一個連通分量。
9.根據(jù)權利要求7或8所述的方法,其特征在于,當所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶后,所述方法還包括: 計算所述連通分量中用戶標識節(jié)點對應的用戶標識的標識欺詐關閉率; 判斷所述標識欺詐關閉率是否在預設的正常數(shù)據(jù)范圍內(nèi); 如果是,將所述用戶標識確定為危險用戶標識,與所述危險用戶標識關聯(lián)的賬號為危險賬號; 否則,將所述用戶標識確定為正常用戶標識,與所述正常用戶標識關聯(lián)的賬號為正常賬號。
10.根據(jù)權利要求9所述的方法,其特征在于,所述計算所述連通分量中用戶標識節(jié)點對應的用戶標識的標識欺詐關閉率包括: 統(tǒng)計在所述賬號群體中與所述用戶標識節(jié)點關聯(lián)的賬號總個數(shù),以及在所述與用戶標識關聯(lián)的賬號總個數(shù)中因欺詐和/或疑似欺詐而關閉的賬號個數(shù); 計算在所述與用戶標識關聯(lián)的賬號總個數(shù)中因欺詐和/或疑似欺詐而關閉的賬號個數(shù)與在所述賬號群體中與所述用戶標識節(jié)點關聯(lián)的賬號總個數(shù)的比值,所述比值為用戶標識的標識欺詐關閉率。
11.一種識別網(wǎng)站用戶的裝置,其特征在于,包括: 獲取模塊,用于從數(shù)據(jù)庫中獲取賬號和用戶標識; 建立模塊,用于通過將所述賬號和用戶標識作為節(jié)點,并連接具有關聯(lián)關系的賬號節(jié)點和用戶標識節(jié)點的方式,建立連通圖; 查找模塊,用于在所述連通圖中查找連通分量,所述連通分量中的所有節(jié)點對應的賬號和用戶標識構成與同一個網(wǎng)站用戶綁定的賬號群體; 第一參數(shù)計算模塊,用于計算所述賬號群體的賬號密度和賬號欺詐關閉率; 第一參數(shù)判斷模塊,用于判斷所述賬號密度和賬號欺詐關閉率是否在預設的正常數(shù)值范圍內(nèi); 第一網(wǎng)站用戶識別模塊,用于當?shù)谝粎?shù)判斷模塊的判斷結果為是時,將所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶,否則,將所述賬號群體確定為正常賬號群體,與所述正常賬號群體綁定的網(wǎng)站用戶為正常的網(wǎng)站用戶。
12.根據(jù)權利要求11所述的裝置,其特征在于,所述查找模塊包括: 比較子模塊,用于比較連通圖中的各節(jié)點的當前標記值和與所述各節(jié)點具有連接關系的其它節(jié)點的當前標記值的大小; 選取子模塊,用于選取最小的標記值作為所述各節(jié)點的當前標記值; 第一判斷子模塊,用于判斷是否至少有一個節(jié)點的當前標記值發(fā)生了變化; 重復子模塊,用于當所述第一判斷子模塊的判斷結果為是時,觸發(fā)比較子模塊繼續(xù)比較連通圖中各節(jié)點的當前標記值和具有連接關系的其它節(jié)點的當前標記值大??; 提取子模塊,用于當所述第一判斷子模塊的判斷結果為否時,從連通圖中提取擁有相同標記值的節(jié)點為一個連通分量。
13.根據(jù)權利要求11所述的裝置,其特征在于,所述第一參數(shù)計算模塊包括: 第一統(tǒng)計子模塊,用于統(tǒng)計在所述賬號群體中所有賬號的總個數(shù),以及所有賬號對應的賬號節(jié)點的節(jié)點度數(shù)之和; 密度計算子模塊,用于按照公式
14.根據(jù)權利要求11所述的裝置,其特征在于,所述第一參數(shù)計算模塊包括: 第二統(tǒng)計子模塊,用于統(tǒng)計在所述賬號群體中所有賬號的總個數(shù)、以及因欺詐和/或疑似欺詐而關閉的賬號個數(shù); 賬號欺詐關閉率計算子模塊,用于計算在所述賬號群體中因欺詐和/或疑似欺詐而關閉的賬號個數(shù)與所有賬號的總個數(shù)的比值,所述比值為所述賬號群體的賬號欺詐關閉率。
15.根據(jù)權利要求11-14中任意一項所述的裝置,其特征在于,當所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶后,所述裝置還包括: 第二參數(shù)計算模塊,用于計算所述連通分量中用戶標識節(jié)點對應的用戶標識的標識欺詐關閉率; 第二參數(shù)判斷模塊,用于判斷所述標識欺詐關閉率是否在預設的正常數(shù)據(jù)范圍內(nèi);用戶標識識別模塊,用于當所述第二參數(shù)判斷模塊的判斷結果為是時,將所述用戶標識確定為危險用戶標識,與所述危險用戶標識關聯(lián)的賬號為危險賬號,否則,將所述用戶標識確定為正常用戶標識,與所述正常用戶標識關聯(lián)的賬號為正常賬號。
16.根據(jù)權利要求15所述的裝置,其特征在于,所述第二參數(shù)計算模塊包括: 第三統(tǒng)計子模塊,用于統(tǒng)計在所述賬號群體中與所述用戶標識關聯(lián)的賬號總個數(shù),以及在所述與用戶標識關聯(lián)的賬號總個數(shù)中因欺詐和/或疑似欺詐而關閉的賬號個數(shù);標識欺詐關閉率計算子模塊,用于計算在所述與用戶標識關聯(lián)的賬號總個數(shù)中因欺詐和/或疑似欺詐而關閉的賬號個數(shù)與在所述賬號群體中與所述用戶標識關聯(lián)的賬號總個數(shù)的比值,所述比值為用戶標識的標識欺詐關閉率。
17.一種識別網(wǎng)站用戶的裝置,其特征在于,包括: 獲取模塊,用于從數(shù)據(jù)庫中獲取賬號和用戶標識; 建立模塊,用于通過將所述賬號和用戶標識作為節(jié)點,并連接具有關聯(lián)關系的賬號節(jié)點和用戶標識節(jié)點的方式,建立連通圖; 查找模塊,用于在所述連通圖中查找連通分量,所述連通分量中的所有節(jié)點對應的賬號和用戶標識構成與同一個網(wǎng)站用戶綁定的賬號群體; 判斷模塊,用于判斷所述賬號群體中是否存在因欺詐和/或疑似欺詐而關閉的賬號;第二網(wǎng)站用戶識別模塊,用于當判斷模塊的判斷結果為是時,將所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶,否則,將所述賬號群體確定為正常賬號群體,與所述正常賬號群體綁定的網(wǎng)站用戶為正常的網(wǎng)站用戶。
18.根據(jù)權利要求17所述的方法,其特征在于,所述查找模塊包括: 比較子模塊,用于比較連通圖中的各節(jié)點的當前標記值和與所述各節(jié)點具有連接關系的其它節(jié)點的當前標記值的大??; 選取子模塊,用于選取最小的標記值作為所述各節(jié)點的當前標記值; 第一判斷子模塊,用于判斷是否至少有一個節(jié)點的當前標記值發(fā)生了變化; 重復子模塊,用于當所述第一判斷子模塊的判斷結果為是時,觸發(fā)比較子模塊繼續(xù)比較連通圖中各節(jié)點的當前標記值和具有連接關系的其它節(jié)點的當前標記值大??; 提取子模塊,用于當所述第一判斷子模塊的判斷結果為否時,從連通圖中提取擁有相同標記值的節(jié)點為一個連通分量。
19.根據(jù)權利要求17或18所述的裝置,其特征在于,當所述賬號群體確定為危險賬號群體,與所述危險賬號群體綁定的網(wǎng)站用戶為危險的網(wǎng)站用戶后,所述裝置還包括: 第二參數(shù)計算模塊,用于計算所述連通分量中用戶標識節(jié)點對應的用戶標識的標識欺詐關閉率; 第二參數(shù)判斷模塊,用于判斷所述標識欺詐關閉率是否在預設的正常數(shù)據(jù)范圍內(nèi);用戶標識識別模塊,用于當所述第二參數(shù)判斷模塊的判斷結果為是時,將所述用戶標識確定為危險用戶標識,與所述危險用戶標識關聯(lián)的賬號為危險賬號,否則,將所述用戶標識確定為正常用戶標識,與所述正常用戶標識關聯(lián)的賬號為正常賬號。
20.根據(jù)權利要求19所述的裝置,其特征在于,所述第二參數(shù)計算模塊包括:第三統(tǒng)計子模塊,用于統(tǒng)計在所述賬號群體中與所述用戶標識關聯(lián)的賬號總個數(shù),以及在所述與用戶標識關聯(lián)的賬號總個數(shù)中因欺詐和/或疑似欺詐而關閉的賬號個數(shù);標識欺詐關閉率計算子模塊,用于計算在所述與用戶標識關聯(lián)的賬號總個數(shù)中因欺詐和/或疑似欺詐而關閉的賬號個數(shù)與在所述賬號群體中與所述用戶標識節(jié)點關聯(lián)的賬號總個數(shù)的比值,所 述比值為用戶標識的標識欺詐關閉率。
【文檔編號】G06F17/30GK103927307SQ201310011312
【公開日】2014年7月16日 申請日期:2013年1月11日 優(yōu)先權日:2013年1月11日
【發(fā)明者】林古立, 陳德品, 陳智強 申請人:阿里巴巴集團控股有限公司