本發(fā)明涉及網(wǎng)絡(luò)技術(shù),特別涉及一種身份識(shí)別方法和裝置。
背景技術(shù):
隨著中國(guó)國(guó)內(nèi)互聯(lián)網(wǎng)實(shí)名制的趨勢(shì)發(fā)展,越來(lái)越多的互聯(lián)網(wǎng)場(chǎng)景要求實(shí)名認(rèn)證,金融和電商等行業(yè)首當(dāng)其沖。在這種趨勢(shì)下,欺詐作弊分子為了藏匿自己的真實(shí)身份,常常通過(guò)互聯(lián)網(wǎng)泄露或者批量購(gòu)買等方式獲取到大量的他人身份證件信息,冒用他人身份證號(hào)碼、姓名,并利用自己掌控的手機(jī)號(hào),進(jìn)行互聯(lián)網(wǎng)場(chǎng)景下的賬戶注冊(cè)、認(rèn)證,用以進(jìn)行信用卡申請(qǐng)或貸款等信貸申請(qǐng)欺詐行為,給商戶和金融機(jī)構(gòu)帶來(lái)?yè)p失。
而現(xiàn)有的身份識(shí)別方式,主要是基于網(wǎng)絡(luò)層面或設(shè)備層面來(lái)認(rèn)定,比如,可以根據(jù)欺詐作弊分子使用的設(shè)備的ip地址、mac地址,或者設(shè)備的imei等標(biāo)識(shí),通過(guò)一定的識(shí)別模型來(lái)識(shí)別身份冒用。但是,有很多欺詐作弊分子是職業(yè)黑客,具有很強(qiáng)的網(wǎng)絡(luò)技術(shù),能夠通過(guò)執(zhí)行一定的策略繞過(guò)現(xiàn)有的身份識(shí)別模型,使得身份識(shí)別較為困難。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明提供一種身份識(shí)別方法和裝置,以實(shí)現(xiàn)對(duì)身份冒用行為的識(shí)別。
具體地,本發(fā)明是通過(guò)如下技術(shù)方案實(shí)現(xiàn)的:
第一方面,提供一種身份識(shí)別方法,所述方法包括:
采集通訊錄大數(shù)據(jù),所述通訊錄大數(shù)據(jù)包括:多個(gè)用戶擁有的通訊錄,每個(gè)通訊錄中記錄有多個(gè)身份信息對(duì),所述身份信息對(duì)包括姓名和手機(jī)號(hào)碼;
將待識(shí)別的身份信息對(duì)與所述通訊錄大數(shù)據(jù)進(jìn)行比對(duì),獲取信息比對(duì)結(jié)果,所述待識(shí)別的身份信息對(duì)包括:待識(shí)別的用戶使用的姓名和手機(jī)號(hào)碼;
若所述信息比對(duì)結(jié)果滿足風(fēng)險(xiǎn)條件,則確定所述用戶是風(fēng)險(xiǎn)用戶。
第二方面,提供一種身份識(shí)別裝置,所述裝置包括:
數(shù)據(jù)采集模塊,用于采集通訊錄大數(shù)據(jù),所述通訊錄大數(shù)據(jù)包括:多個(gè)用戶擁有的通訊錄,每個(gè)通訊錄中記錄有多個(gè)身份信息對(duì),所述身份信息對(duì)包括姓名和手機(jī)號(hào)碼;
信息比較模塊,用于將待識(shí)別的身份信息對(duì)與所述通訊錄大數(shù)據(jù)進(jìn)行比對(duì),獲取信息比對(duì)結(jié)果,所述待識(shí)別的身份信息對(duì)包括:待識(shí)別的用戶使用的姓名和手機(jī)號(hào)碼;
風(fēng)險(xiǎn)判斷模塊,用于在所述信息比對(duì)結(jié)果滿足風(fēng)險(xiǎn)條件時(shí),則確定待識(shí)別的所述用戶是風(fēng)險(xiǎn)用戶。
本發(fā)明實(shí)施例的身份識(shí)別方法和裝置,通過(guò)采集通訊錄大數(shù)據(jù),建立了身份信息數(shù)據(jù)庫(kù),并將待識(shí)別的身份信息對(duì)與該身份信息數(shù)據(jù)庫(kù)比對(duì),就可以判斷出某一個(gè)姓名和手機(jī)號(hào)碼的身份信息對(duì)是否是真實(shí)的,從而識(shí)別到用戶的身份是否是冒用,實(shí)現(xiàn)了對(duì)身份冒用行為的識(shí)別。
附圖說(shuō)明
圖1為本發(fā)明實(shí)施例提供的一種身份識(shí)別方法的流程圖;
圖2為本發(fā)明實(shí)施例提供的用戶的通訊錄的大數(shù)據(jù)示意圖;
圖3為本發(fā)明實(shí)施例提供的另一種身份識(shí)別方法的流程圖;
圖4為本發(fā)明實(shí)施例提供的一種身份識(shí)別裝置的結(jié)構(gòu)示意圖;
圖5為本發(fā)明實(shí)施例提供的另一種身份識(shí)別裝置的結(jié)構(gòu)示意圖。
具體實(shí)施方式
本申請(qǐng)實(shí)施例提供了一種身份識(shí)別方法,該方法可以用于識(shí)別身份冒用行為,比如,欺詐作弊分子冒用他人身份證號(hào)碼、姓名,并利用自己掌控的手機(jī)號(hào),進(jìn)行互聯(lián)網(wǎng)場(chǎng)景下的賬戶注冊(cè)、認(rèn)證,用以進(jìn)行信用卡申請(qǐng)或貸款等信貸申請(qǐng)欺詐行為。為了使得即使在欺詐作弊分子繞過(guò)網(wǎng)絡(luò)設(shè)備層面的識(shí)別模型時(shí),也能將其識(shí)別出來(lái),本申請(qǐng)考慮了一種“判斷用戶使用的手機(jī)號(hào)碼是否是其聲稱的這個(gè)人正常使用的電話號(hào)碼”的識(shí)別方案。
上述識(shí)別方案的基本思想是:要對(duì)客戶進(jìn)行身份識(shí)別的身份識(shí)別方,在獲取到足夠多用戶的通訊錄后,其對(duì)所有潛在客戶的手機(jī)號(hào)碼基本全部覆蓋,組成了一個(gè)通訊錄數(shù)據(jù)庫(kù),如果后續(xù)驗(yàn)證的客戶不在這個(gè)通訊錄數(shù)據(jù)庫(kù)里出現(xiàn),或者在這個(gè)數(shù)據(jù)庫(kù)里出現(xiàn)時(shí)權(quán)重非常低,則是非本人操作的可能性非常大,即所驗(yàn)證的客戶更傾向于屬于身份冒用。
基于上述思想,本申請(qǐng)實(shí)施例提供的身份識(shí)別方法,可以參見(jiàn)圖1所示的流程,該方法可以包括:
在步驟101中,采集通訊錄大數(shù)據(jù),所述通訊錄大數(shù)據(jù)包括:多個(gè)用戶擁有的通訊錄,每個(gè)通訊錄中記錄有多個(gè)身份信息對(duì),所述身份信息對(duì)包括姓名和手機(jī)號(hào)碼。
例如,通訊錄大數(shù)據(jù)可以包括很多用戶的通訊錄數(shù)據(jù),圖2示例了用戶1、用戶2、用戶3直至用戶y的通訊錄數(shù)據(jù),其中包括的通訊錄的數(shù)量足夠多,盡可能多的覆蓋所有可能的潛在業(yè)務(wù)客戶,這樣才能在后續(xù)步驟用于對(duì)業(yè)務(wù)客戶的身份驗(yàn)證。每個(gè)通訊錄中都包括多個(gè)身份信息對(duì),所述身份信息對(duì)包括姓名和手機(jī)號(hào)碼。以用戶1的通訊錄為例,“姓名n11-號(hào)碼p11”是一個(gè)身份信息對(duì),表示姓名n11所代表的人使用的手機(jī)號(hào)碼是p11;“姓名n12-號(hào)碼p12”是另一個(gè)身份信息對(duì),表示姓名n12所代表的人使用的手機(jī)號(hào)碼是p12。
本步驟中,通訊錄數(shù)據(jù)的采集方式可以有多種,例如,可以通過(guò)運(yùn)行在用戶手機(jī)上的客戶端軟件采集用戶手機(jī)上的通訊錄數(shù)據(jù)。
在步驟102中,將待識(shí)別的身份信息對(duì)與通訊錄大數(shù)據(jù)進(jìn)行比對(duì),獲取信息比對(duì)結(jié)果,待識(shí)別的身份信息對(duì)包括:待識(shí)別的用戶使用的姓名和手機(jī)號(hào)碼。
本步驟中的信息對(duì)比結(jié)果,例如,可以是通訊錄大數(shù)據(jù)中是否存在與待識(shí)別的身份信息對(duì)相同的身份信息對(duì),或者還可以是通訊錄大數(shù)據(jù)中包括所述待識(shí)別的身份信息對(duì)的數(shù)量是多少,等。
在步驟103中,若信息比對(duì)結(jié)果滿足風(fēng)險(xiǎn)條件,則確定用戶是風(fēng)險(xiǎn)用戶。
例如,該風(fēng)險(xiǎn)條件的設(shè)定也可以包括多種,比如,可以設(shè)定為若通訊錄大數(shù)據(jù)中不存在與待識(shí)別的身份信息對(duì)相同的身份信息對(duì)時(shí),認(rèn)為該待識(shí)別的用戶是風(fēng)險(xiǎn)用戶;或者,若通訊錄大數(shù)據(jù)中即使存在待識(shí)別的身份信息對(duì),但是包含的數(shù)量較少時(shí),認(rèn)為該待識(shí)別的用戶是風(fēng)險(xiǎn)用戶。
本例子的身份識(shí)別方法,通過(guò)采集通訊錄大數(shù)據(jù),建立身份信息數(shù)據(jù)庫(kù),可以根據(jù)該大數(shù)據(jù)判斷出某一個(gè)姓名和手機(jī)號(hào)碼的身份信息對(duì)是否是真實(shí)的,從而識(shí)別到用戶的身份是否是冒用,實(shí)現(xiàn)了對(duì)身份冒用行為的識(shí)別。
在一個(gè)例子中,還可以按照?qǐng)D3所示的方法執(zhí)行身份識(shí)別,該圖3中的方法,將根據(jù)通訊錄大數(shù)據(jù),構(gòu)建一個(gè)信息權(quán)重表,該信息權(quán)重表可以用于后續(xù)對(duì)用戶身份的驗(yàn)證。如圖3所示,該流程可以包括:
在步驟301中,采集通訊錄大數(shù)據(jù)。在步驟302中,對(duì)通訊錄大數(shù)據(jù)中的身份信息對(duì)進(jìn)行統(tǒng)計(jì),得到每個(gè)身份信息對(duì)分別對(duì)應(yīng)的信息權(quán)重,生成信息權(quán)重表。
本步驟中所述的信息權(quán)重,可以用于表示身份信息對(duì)的可信程度,比如,如果一個(gè)身份信息對(duì)“姓名n11-號(hào)碼p11”在很多用戶的通訊錄中出現(xiàn),則很大概率上該身份信息對(duì)的信息是真實(shí)的,是被很多人所認(rèn)可的;反之,表示該身份信息對(duì)的可信程度較低,可能信息是偽造的。
而信息權(quán)重的計(jì)算方法可以有多種,只要能根據(jù)各個(gè)身份信息對(duì)在通訊錄中不同的出現(xiàn)情況,體現(xiàn)出不同身份信息對(duì)的權(quán)重差異。
例如,可以統(tǒng)計(jì)包括所述身份信息對(duì)的通訊錄的個(gè)數(shù),作為所述身份信息對(duì)的信息權(quán)重,假設(shè)身份信息對(duì)“姓名n11-號(hào)碼p11”在五個(gè)用戶的通訊錄中出現(xiàn),則對(duì)應(yīng)的信息權(quán)重可以為5,假設(shè)身份信息對(duì)“姓名n12-號(hào)碼p12”在八個(gè)用戶的通訊錄中出現(xiàn),則對(duì)應(yīng)的信息權(quán)重可以為8。
又例如,還可以根據(jù)pagerank方法計(jì)算每一個(gè)身份信息對(duì)的pagerank值,將該pagerank值作為身份信息對(duì)的信息權(quán)重。其中,在構(gòu)建pagerank方法使用的web圖模型時(shí),可以將每一個(gè)身份信息對(duì)分別作為一個(gè)頁(yè)面節(jié)點(diǎn)(相當(dāng)于pagerank中的頁(yè)面節(jié)點(diǎn)),該節(jié)點(diǎn)的出鏈指向所述身份信息對(duì)所屬用戶的通訊錄中包括的另一個(gè)身份信息對(duì),例如,“姓名n11-號(hào)碼p11”這個(gè)節(jié)點(diǎn)所屬的用戶即姓名n11的用戶,該用戶的通訊錄中還包括身份信息對(duì)“姓名n12-號(hào)碼p12”,則“姓名n11-號(hào)碼p11”節(jié)點(diǎn)的出鏈將指向節(jié)點(diǎn)“姓名n12-號(hào)碼p12”。一個(gè)頁(yè)面節(jié)點(diǎn)的入鏈來(lái)自包含所述身份信息對(duì)的通訊錄用戶的身份信息對(duì),同樣以上述例子來(lái)說(shuō),對(duì)于節(jié)點(diǎn)“姓名n12-號(hào)碼p12”來(lái)說(shuō),其入鏈來(lái)自“姓名n11-號(hào)碼p11”,而該“姓名n11-號(hào)碼p11”節(jié)點(diǎn)用戶的通訊錄中包含“姓名n12-號(hào)碼p12”。在構(gòu)造web圖模型后,可以根據(jù)pagerank方法計(jì)算每一個(gè)身份信息對(duì)的pagerank值,將所述pagerank值作為所述身份信息對(duì)的信息權(quán)重。
其中,在通過(guò)pagerank方法計(jì)算時(shí),可以基于如下兩個(gè)假設(shè):
數(shù)量假設(shè):在web圖模型中,如果一個(gè)頁(yè)面節(jié)點(diǎn)接收到的其他網(wǎng)頁(yè)指向的入鏈數(shù)量越多,那么這個(gè)頁(yè)面越重要。在本申請(qǐng)的例子中,即對(duì)于某一個(gè)身份信息對(duì)來(lái)說(shuō),如果越多的通訊錄中包含該身份信息對(duì),則表明該身份信息對(duì)的可信程度越高。
質(zhì)量假設(shè):指向頁(yè)面的入鏈質(zhì)量不同,質(zhì)量高的頁(yè)面會(huì)通過(guò)鏈接向其他頁(yè)面?zhèn)鬟f更多的權(quán)重。所以越是質(zhì)量高的頁(yè)面指向頁(yè)面,則頁(yè)面越重要。在本申請(qǐng)的例子中,即考慮了出現(xiàn)身份信息對(duì)的通訊錄所屬的用戶的影響力,身份信息對(duì)出現(xiàn)在一個(gè)廣為熟知的公眾人物的通訊錄中,相比于出現(xiàn)在一個(gè)不知名的普通人物的通訊錄中,其信息的真實(shí)可信程度應(yīng)該有所區(qū)別。
經(jīng)過(guò)本步驟的計(jì)算,可以得到如下表1所示的信息權(quán)重表。其中需要說(shuō)明的是,在本申請(qǐng)的方案中,所生成的信息權(quán)重表主要包括身份信息對(duì)與對(duì)應(yīng)的信息權(quán)重,在存儲(chǔ)方式上可以不局限于以表的形式存儲(chǔ)。
表1信息權(quán)重表
此外,在通訊錄中記錄的身份信息對(duì),可能會(huì)出現(xiàn)記錄不規(guī)范的情況。比如,一個(gè)用戶的真實(shí)姓名叫“王曉月”,結(jié)果該用戶的朋友在記錄其姓名和手機(jī)號(hào)碼時(shí),不小心記錄成了“王小月”,即寫成了錯(cuò)別字,本實(shí)施例對(duì)于這種情況,可以進(jìn)行一致性糾偏處理,即原本應(yīng)該是相同的身份信息對(duì),可能在記錄時(shí)在不同的通訊錄中出現(xiàn)了記錄誤差。在一個(gè)例子中,這種情況可以按照如下方式處理:在對(duì)通訊錄大數(shù)據(jù)的身份信息進(jìn)行信息權(quán)重的統(tǒng)計(jì)計(jì)算之前,在信息權(quán)重表中記錄身份信息對(duì)時(shí),“王曉月—號(hào)碼h”和“王小月—號(hào)碼h”,均統(tǒng)一記錄為“wangxiaoyue—號(hào)碼h”,即還是將“王小月”和“王曉月”,兩者作為同一身份信息對(duì),對(duì)應(yīng)的信息權(quán)重可以是2(即“wangxiaoyue—號(hào)碼h”出現(xiàn)兩次)。在后續(xù)的將待識(shí)別的身份信息對(duì)與信息權(quán)重表比對(duì)時(shí),根據(jù)待識(shí)別的身份信息,先根據(jù)號(hào)碼找到匹配的號(hào)碼h,再將姓名轉(zhuǎn)換為拼音,看是否有匹配的拼音姓名。經(jīng)過(guò)上述處理,可以使得對(duì)信息權(quán)重的計(jì)算更加準(zhǔn)確,不過(guò),具體對(duì)于何種情況的誤差才能進(jìn)行一致性糾偏處理,可以根據(jù)實(shí)際業(yè)務(wù)情況或者實(shí)驗(yàn)確定具體的策略。
此外,也可以有其他的實(shí)現(xiàn)方式,比如,對(duì)于上述例子中出現(xiàn)相同拼音不同字,且相同號(hào)碼的情況,可以在信息權(quán)重表中通過(guò)記錄拼音字符串的方式進(jìn)行統(tǒng)一處理;而對(duì)于不包含錯(cuò)別字的情況,也還可以在信息權(quán)重表中采用漢字記錄姓名,那么對(duì)于待識(shí)別的身份信息對(duì),可以先根據(jù)號(hào)碼找到匹配的號(hào)碼h,再進(jìn)行姓名的匹配,可以先判斷是否有匹配的漢字,沒(méi)有時(shí)再將姓名轉(zhuǎn)換為拼音,看是否有匹配的拼音姓名,姓名和號(hào)碼都匹配時(shí),則找到了匹配的身份信息對(duì),獲取對(duì)應(yīng)的信息權(quán)重即可。
在又一個(gè)例子中,在尋找匹配的身份信息對(duì)時(shí),也可以采取容許一定范圍誤差的匹配方式。比如,信息權(quán)重表中記錄的是“xiaoyue—號(hào)碼h”(即少了姓),待識(shí)別的身份信息對(duì)是“王曉月—號(hào)碼h”,在匹配時(shí)將發(fā)現(xiàn),這兩個(gè)身份信息對(duì)的號(hào)碼h能夠匹配,是相同的,而姓名字段中,“xiaoyue”與“王曉月”(具體是與王曉月轉(zhuǎn)換的拼音wangxiaoyue)特別相似,例如按照一定算法計(jì)算得到的相似度達(dá)到70%以上,那么也可以認(rèn)為“xiaoyue”與“王曉月”是匹配的。這種情況可以設(shè)定一相似度閾值,高于該閾值時(shí),則盡管不完全相同,也可以認(rèn)為兩者匹配。而諸如“xiaoyue”與“王家惠”這兩個(gè),明顯是不相似的,一般會(huì)低于相似度閾值,判定為不匹配。
在生成信息權(quán)重表的基礎(chǔ)上,如下的步驟中將利用該信息權(quán)重表,用于身份信息的識(shí)別??梢詫⒋R(shí)別的身份信息對(duì)與預(yù)先生成的信息權(quán)重表進(jìn)行比對(duì),獲取信息比對(duì)結(jié)果,該待識(shí)別的身份信息對(duì)包括:待進(jìn)行身份識(shí)別的用戶使用的姓名和手機(jī)號(hào)碼。若信息比對(duì)結(jié)果滿足風(fēng)險(xiǎn)條件,則確定用戶是風(fēng)險(xiǎn)用戶。
在步驟303中,獲取待識(shí)別用戶的身份信息對(duì)。
例如,可以獲取正在注冊(cè)用戶的一些身份信息,以用于識(shí)別該用戶是否是冒用別人身份的非法分子。該身份信息可以包括:身份證號(hào)、姓名、手機(jī)號(hào)碼、地址等聯(lián)系信息,其中的姓名和手機(jī)號(hào)碼,本例子中可以稱為身份信息對(duì)。
在步驟304中,校驗(yàn)用戶的身份證號(hào)和手機(jī)號(hào)碼的使用權(quán)是否通過(guò)驗(yàn)證。
本步驟中,可以通過(guò)公安網(wǎng)實(shí)名校驗(yàn)身份證號(hào)和姓名,或者通過(guò)人臉與身份證關(guān)聯(lián)的公安網(wǎng)照片做人臉比對(duì),或者是其他形式的校驗(yàn)。還可以校驗(yàn)用戶的手機(jī)號(hào),以保證用戶此時(shí)擁有該手機(jī)號(hào)碼的使用權(quán)。
如果本步驟通過(guò)驗(yàn)證,在繼續(xù)執(zhí)行步驟305;否則,轉(zhuǎn)至步驟309。
在步驟305中,查詢身份信息對(duì)是否出現(xiàn)在信息權(quán)重表中。
如果在信息權(quán)重表中,則繼續(xù)執(zhí)行步驟306;否則,若所述信息權(quán)重表不包括所述待識(shí)別的身份信息對(duì),則轉(zhuǎn)至步驟309。
在步驟306中,由信息權(quán)重表中獲取對(duì)應(yīng)的信息權(quán)重。
例如,可以由預(yù)先建立的信息權(quán)重表中,獲取與步驟303中的身份信息對(duì)對(duì)應(yīng)的信息權(quán)重。
在步驟307中,判斷信息權(quán)重是否大于或等于權(quán)重閾值。
假設(shè)權(quán)重閾值是t0,該權(quán)重閾值的設(shè)置,可以依據(jù)建立信息權(quán)重表時(shí)采集的大數(shù)據(jù)數(shù)量占全部潛在客戶中的覆蓋度,以及使用本身份識(shí)別方法的業(yè)務(wù)方對(duì)身份冒用風(fēng)險(xiǎn)的管控尺度等因素確定。比如,假設(shè)業(yè)務(wù)方需要嚴(yán)格把控用戶身份,則可以將權(quán)重閾值設(shè)置的較高,保證較高的信息真實(shí)可靠度;又比如,如果采集的大數(shù)據(jù)數(shù)量占全部潛在客戶中的覆蓋度稍低,可以將權(quán)重閾值設(shè)置的較高,以提高信息真實(shí)可靠度。
如果本步驟的判斷結(jié)果為是,則繼續(xù)步驟308;否則,執(zhí)行步驟309。
在步驟308中,確定待識(shí)別的用戶通過(guò)驗(yàn)證,為合法用戶。
在步驟309中,確定待識(shí)別的用戶是風(fēng)險(xiǎn)用戶。
在確定用戶是風(fēng)險(xiǎn)用戶后,相應(yīng)的,可以定位到該用戶對(duì)應(yīng)的欺詐操作。
本例子的身份識(shí)別方法,通過(guò)根據(jù)通訊錄大數(shù)據(jù)建立信息權(quán)重表,預(yù)先確定了各個(gè)身份信息對(duì)的可信度,并結(jié)合權(quán)重閾值,可以判斷出某一個(gè)姓名和手機(jī)號(hào)碼的身份信息對(duì)是否是真實(shí)的,從而識(shí)別到用戶的身份是否是冒用,實(shí)現(xiàn)了對(duì)身份冒用行為的識(shí)別。
為了實(shí)現(xiàn)上述的方法,本申請(qǐng)實(shí)施例提供了一種身份識(shí)別裝置,如圖4所示,該裝置可以包括:數(shù)據(jù)采集模塊41、信息比較模塊42和風(fēng)險(xiǎn)判斷模塊43。
數(shù)據(jù)采集模塊41,用于采集通訊錄大數(shù)據(jù),所述通訊錄大數(shù)據(jù)包括:多個(gè)用戶擁有的通訊錄,每個(gè)通訊錄中記錄有多個(gè)身份信息對(duì),所述身份信息對(duì)包括姓名和手機(jī)號(hào)碼;
信息比較模塊42,用于將待識(shí)別的身份信息對(duì)與所述通訊錄大數(shù)據(jù)進(jìn)行比對(duì),獲取信息比對(duì)結(jié)果,所述待識(shí)別的身份信息對(duì)包括:待識(shí)別的用戶使用的姓名和手機(jī)號(hào)碼;
風(fēng)險(xiǎn)判斷模塊43,用于在所述信息比對(duì)結(jié)果滿足風(fēng)險(xiǎn)條件時(shí),則確定待識(shí)別的所述用戶是風(fēng)險(xiǎn)用戶。
在一個(gè)例子中,如圖5所示,該裝置中的信息比較模塊42,可以包括:
權(quán)重統(tǒng)計(jì)單元421,用于對(duì)所述通訊錄大數(shù)據(jù)中的身份信息對(duì)進(jìn)行統(tǒng)計(jì),得到每個(gè)身份信息對(duì)分別對(duì)應(yīng)的信息權(quán)重,所述信息權(quán)重用于表示身份信息對(duì)的可信程度;
權(quán)重獲取單元422,用于由統(tǒng)計(jì)結(jié)果中,獲取對(duì)應(yīng)所述待識(shí)別的身份信息對(duì)的信息權(quán)重。
在一個(gè)例子中,風(fēng)險(xiǎn)判斷模塊43,具體用于:若統(tǒng)計(jì)結(jié)果中不存在對(duì)應(yīng)所述待識(shí)別的身份信息對(duì)的信息權(quán)重;或者,若對(duì)應(yīng)所述待識(shí)別的身份信息對(duì)的信息權(quán)重,低于預(yù)定的權(quán)重閾值,則確定所述待識(shí)別的用戶是風(fēng)險(xiǎn)用戶。
在一個(gè)例子中,權(quán)重統(tǒng)計(jì)單元421,具體用于:以包括所述身份信息對(duì)的通訊錄的數(shù)量,作為所述身份信息對(duì)的信息權(quán)重;或者,根據(jù)pagerank方法計(jì)算每一個(gè)身份信息對(duì)的pagerank值,將所述pagerank值作為所述身份信息對(duì)的信息權(quán)重。
在一個(gè)例子中,權(quán)重統(tǒng)計(jì)單元421,還用于在對(duì)通訊錄大數(shù)據(jù)中的身份信息對(duì)進(jìn)行統(tǒng)計(jì)之前,對(duì)不同通訊錄出現(xiàn)的同一身份信息對(duì),進(jìn)行一致性糾偏處理。
本例子的身份識(shí)別裝置,通過(guò)根據(jù)通訊錄大數(shù)據(jù)建立信息權(quán)重表,預(yù)先確定了各個(gè)身份信息對(duì)的可信度,并結(jié)合權(quán)重閾值,可以判斷出某一個(gè)姓名和手機(jī)號(hào)碼的身份信息對(duì)是否是真實(shí)的,從而識(shí)別到用戶的身份是否是冒用,實(shí)現(xiàn)了對(duì)身份冒用行為的識(shí)別。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明保護(hù)的范圍之內(nèi)。