本發(fā)明涉及通信領(lǐng)域,具體而言,涉及一種域名可信度確定的方法及裝置。
背景技術(shù):
:隨著因特網(wǎng)的高速發(fā)展,網(wǎng)絡(luò)購(gòu)物以及網(wǎng)絡(luò)辦公已經(jīng)成為人們?nèi)粘I畹囊徊糠?,?jīng)過(guò)專(zhuān)業(yè)統(tǒng)計(jì),現(xiàn)在中國(guó)每年在網(wǎng)上購(gòu)物達(dá)到的金額已經(jīng)超過(guò)了100億人民幣。但由于普通大眾對(duì)網(wǎng)絡(luò)安全的意識(shí)以及知識(shí)掌握不夠,不法分子從網(wǎng)絡(luò)交易的過(guò)程中也發(fā)現(xiàn)了存在有利可圖的漏洞,其中最主要的就是網(wǎng)絡(luò)釣魚(yú)事件,圖1是各國(guó)受網(wǎng)絡(luò)釣魚(yú)攻擊的餅狀圖。據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心聯(lián)合國(guó)家互聯(lián)網(wǎng)應(yīng)急中心發(fā)布的《2009年中國(guó)網(wǎng)民網(wǎng)絡(luò)信息安全狀況調(diào)查報(bào)告》顯示,2009年有超過(guò)九成網(wǎng)民遇到過(guò)網(wǎng)絡(luò)釣魚(yú),在遭遇過(guò)網(wǎng)絡(luò)釣魚(yú)事件的網(wǎng)民中,4500萬(wàn)網(wǎng)民蒙受了經(jīng)濟(jì)損失,占網(wǎng)民總數(shù)11.9%。網(wǎng)絡(luò)釣魚(yú)給網(wǎng)民造成的損失已達(dá)76億元。目前用于實(shí)現(xiàn)反釣魚(yú)欺詐的方法主要有三個(gè):1、白名單;2、黑名單;3、白名單黑名單結(jié)合。白名單的方法是認(rèn)為只有在白名單之內(nèi)的網(wǎng)站才是可信的,否則都是不可信的。黑名單的方法是認(rèn)為在黑名單內(nèi)的網(wǎng)站都是不可信的,黑名單之外的都是可信的,黑白名單結(jié)合的方法是綜合了以上兩個(gè)方法的優(yōu)點(diǎn),白名單都是可信的,黑名單都是不可信的,其他都是可疑的,需要進(jìn)行辨識(shí)。然而這些方法都存在一個(gè)問(wèn)題,這些名單的誰(shuí)來(lái)維護(hù)白名單,名單的容量如何保證,尤其是白名單的方法,定義的不夠會(huì)導(dǎo)致大量的誤報(bào),而且現(xiàn)在也沒(méi)有辦法來(lái)進(jìn)行杜絕所有的釣魚(yú)攻擊。通過(guò)搜索相關(guān)的專(zhuān)利文獻(xiàn),發(fā)現(xiàn)相關(guān)的方法都是采用黑白名單或者分析網(wǎng)頁(yè)內(nèi)容等復(fù)雜手段來(lái)進(jìn)行釣魚(yú)欺詐識(shí)別,即進(jìn)行域名是否合法的識(shí)別,這些方法的一個(gè)主要缺點(diǎn)就是實(shí)現(xiàn)復(fù)雜,然而達(dá)到的效果也不會(huì)太好。實(shí)際上現(xiàn)在也沒(méi)有一個(gè)100%的方法能夠?qū)顾蓄?lèi)型的網(wǎng)絡(luò)釣魚(yú)欺詐手段。一般都是針對(duì)于某些特殊需求進(jìn)行一些防范。針對(duì)相關(guān)技術(shù)中存在的在判定非法域名時(shí)準(zhǔn)確率低,判定復(fù)雜的問(wèn)題,目前尚未提出有效的解決方案。技術(shù)實(shí)現(xiàn)要素:本發(fā)明的主要目的在于提供一種域名可信度確定的方法及裝置,以至少解決相關(guān)技術(shù)中存在的在判定非法域名時(shí)準(zhǔn)確率低,判定復(fù)雜的問(wèn)題。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種域名可信度確定的方法,包括:將待檢測(cè)域名與真實(shí)域名進(jìn)行相似度判斷;根據(jù)判斷結(jié)果確定所述待檢測(cè)域名的可信度??蛇x地,將待檢測(cè)域名與真實(shí)域名進(jìn)行相似度判斷包括:將待檢測(cè)域名與真實(shí)域名數(shù)據(jù)庫(kù)中記錄的真實(shí)域名進(jìn)行相似度判斷,其中,所述真實(shí)域名數(shù)據(jù)庫(kù)中記錄的真實(shí)域名為需要保護(hù)的真實(shí)域名。可選地,將待檢測(cè)域名與真實(shí)域名進(jìn)行相似度判斷包括:確定所述待檢測(cè)域名和所述真實(shí)域名的字符串中的最大的相似子串;根據(jù)所述最大的相似子串和預(yù)定義的字符之間的相似度確定所述待檢測(cè)域名與所述真實(shí)域名的相似度??蛇x地,根據(jù)判斷結(jié)果確定所述待檢測(cè)域名的可信度包括:當(dāng)所述待檢測(cè)域名和所述真實(shí)域名的相似度為100%或相似度小于預(yù)定閾值時(shí),確定所述待檢測(cè)域名為可信域名,其中,所述預(yù)定閾值小于100%;當(dāng)所述待檢測(cè)域名和所述真實(shí)域名的相似度大于或等于預(yù)定閾值且小于100%時(shí),確定所述待檢測(cè)域名為可疑域名??蛇x地,在確定所述待檢測(cè)域名為可疑域名之后,還包括以下至少之一:顯示用于提醒所述待檢測(cè)域名為可疑域名的告警信息;將所述待檢測(cè)域名加入黑名單。根據(jù)本發(fā)明的另一個(gè)方面,提供了一種域名可信度確定的裝置,包括:處理模塊,用于將待檢測(cè)域名與真實(shí)域名進(jìn)行相似度判斷;確定模塊,用于根據(jù)判斷結(jié)果確定所述待檢測(cè)域名的可信度??蛇x地,所述處理模塊包括:將待檢測(cè)域名與真實(shí)域名數(shù)據(jù)庫(kù)中記錄的真實(shí)域名進(jìn)行相似度判斷,其中,所述真實(shí)域名數(shù)據(jù)庫(kù)中記錄的真實(shí)域名為需要保護(hù)的真實(shí)域名??蛇x地,所述處理模塊包括:第一確定單元,用于確定所述待檢測(cè)域名和所述真實(shí)域名的字符串中的最大的相似子串;第二確定單元,用于根據(jù)所述最大的相似子串和預(yù)定義的字符之間的相似度確定所述待檢測(cè)域名與所述真實(shí)域名的相似度??蛇x地,所述確定模塊包括:第三確定單元,用于當(dāng)所述待檢測(cè)域名和所述真實(shí)域名的相似度為100%或相似度小于預(yù)定閾值時(shí),確定所述待檢測(cè)域名為可信域名,其中,所述預(yù)定閾值小于100%;第四確定單元,用于當(dāng)所述待檢測(cè)域名和所述真實(shí)域名的相似度大于或等于預(yù)定閾值且小于100%時(shí),確定所述待 檢測(cè)域名為可疑域名。可選地,所述裝置還包括以下至少之一:告警模塊,用于顯示用于提醒所述待檢測(cè)域名為可疑域名的告警信息;添加模塊,用于將所述待檢測(cè)域名加入黑名單。通過(guò)本發(fā)明,采用將待檢測(cè)域名與真實(shí)域名進(jìn)行相似度判斷,根據(jù)判斷結(jié)果確定該待檢測(cè)域名的可信度的方式,無(wú)需采用分析網(wǎng)頁(yè)內(nèi)容等復(fù)雜手段,直接進(jìn)行待檢測(cè)域名與真實(shí)域名的相似度判斷,解決了相關(guān)技術(shù)中存在的在判定非法域名時(shí)準(zhǔn)確率低,判定復(fù)雜的問(wèn)題,達(dá)到了提高判定非法域名的準(zhǔn)確率,降低判定的復(fù)雜度的效果。附圖說(shuō)明此處所說(shuō)明的附圖用來(lái)提供對(duì)本發(fā)明的進(jìn)一步理解,構(gòu)成本申請(qǐng)的一部分,本發(fā)明的示意性實(shí)施例及其說(shuō)明用于解釋本發(fā)明,并不構(gòu)成對(duì)本發(fā)明的不當(dāng)限定。在附圖中:圖1是各國(guó)受網(wǎng)絡(luò)釣魚(yú)攻擊的餅狀圖;圖2是根據(jù)本發(fā)明實(shí)施例的域名可信度確定方法的流程圖;圖3是根據(jù)本發(fā)明實(shí)施例的域名可信度確定裝置的結(jié)構(gòu)框圖;圖4是根據(jù)本發(fā)明實(shí)施例的域名可信度確定裝置中處理模塊32的結(jié)構(gòu)框圖;圖5是根據(jù)本發(fā)明實(shí)施例的域名可信度確定裝置中確定模塊34的結(jié)構(gòu)框圖;圖6是根據(jù)本發(fā)明實(shí)施例的域名可信度確定裝置的優(yōu)選結(jié)構(gòu)框圖;圖7是根據(jù)本發(fā)明實(shí)施例的反釣魚(yú)欺詐裝置的裝置框圖;圖8是根據(jù)本發(fā)明實(shí)施例的反釣魚(yú)欺詐裝置應(yīng)用于瀏覽器中的工作流程圖;圖9是根據(jù)本發(fā)明實(shí)施例的反釣魚(yú)欺詐裝置應(yīng)用于域名申請(qǐng)系統(tǒng)中的工作流程圖;圖10是根據(jù)本發(fā)明實(shí)施例的反釣魚(yú)欺詐裝置應(yīng)用于網(wǎng)關(guān)設(shè)備中的工作流程圖。具體實(shí)施方式需要說(shuō)明的是,在不沖突的情況下,本申請(qǐng)中的實(shí)施例及實(shí)施例中的特征可以相互組合。下面將參考附圖并結(jié)合實(shí)施例來(lái)詳細(xì)說(shuō)明本發(fā)明。在附圖的流程圖示出的步驟可以在諸如一組計(jì)算機(jī)可執(zhí)行指令的計(jì)算機(jī)系統(tǒng)中執(zhí)行,并且,雖然在流程圖中示出了邏輯順序,但是在某些情況下,可以以不同于此處的順序執(zhí)行所示出或描述的步驟。以下實(shí)施例中的“第一”“第二”僅用于區(qū)分,并不對(duì)順序進(jìn)行限定。本實(shí)施例提供了一種域名可信度確定的方法,圖2是根據(jù)本發(fā)明實(shí)施例的域名可信度確定方法的流程圖,如圖2所示,該方法包括:步驟S202:將待檢測(cè)域名與真實(shí)域名進(jìn)行相似度判斷;步驟S204:根據(jù)判斷結(jié)果確定該待檢測(cè)域名的可信度。通過(guò)上述各個(gè)處理步驟,可以直接根據(jù)待檢測(cè)域名與真實(shí)域名的相似度判斷結(jié)果,來(lái)確定該待檢測(cè)域名的可信度,無(wú)需采用分析網(wǎng)頁(yè)內(nèi)容等復(fù)雜手段,解決了相關(guān)技術(shù)中存在的在判定非法域名時(shí)準(zhǔn)確率低,判定復(fù)雜的問(wèn)題,使得非法域名的判斷更加具有目的性、智能性,在一定程度上保證了用戶進(jìn)行網(wǎng)絡(luò)交易的安全性,達(dá)到了提高判定非法域名的準(zhǔn)確率,降低判定的復(fù)雜度的效果。在一個(gè)可選實(shí)施方式中,上述的真實(shí)域名可以使真實(shí)域名數(shù)據(jù)庫(kù)中的域名,并且,該真實(shí)域名數(shù)據(jù)庫(kù)中存儲(chǔ)的域名都是合法的域名,也可以是需要被保護(hù)的域名。因此,上述的與待檢測(cè)域名進(jìn)行相似度判斷的真實(shí)域名是合法的域名,也可以是受保護(hù)的域名。通過(guò)將真實(shí)域名預(yù)先記錄在真實(shí)域名數(shù)據(jù)庫(kù)中,可以方便的查找到需要保護(hù)的真實(shí)域名,提高了相似度判斷的效率。在一個(gè)可選的實(shí)施方式中,步驟S202可以采取如下方式實(shí)現(xiàn):確定待檢測(cè)域名和真實(shí)域名的字符串中的最大的相似子串;根據(jù)最大的相似子串和預(yù)定義的字符之間的相似度確定該待檢測(cè)域名與真實(shí)域名的相似度。在該可選的實(shí)施方式中,通過(guò)首先確定待檢測(cè)域名和真實(shí)域名的最大的相似子串,以及預(yù)定的每個(gè)字符與其它字符的相似度,可以快速的得到待檢測(cè)域名和真實(shí)域名的相似度。其中,確定待檢測(cè)域名和真實(shí)域名的最大的相似子串的方式,可以采用后綴樹(shù)算法,也可以采用其它算法。步驟S204的實(shí)現(xiàn)方式有多種,其中,在一個(gè)可選的實(shí)施方式中,步驟S204可以包括:當(dāng)所檢測(cè)域名和真實(shí)域名的相似度為100%或相似度小于預(yù)定閾值時(shí),確定待檢測(cè)域名為可信域名,其中,預(yù)定閾值小于100%;當(dāng)待檢測(cè)域名和真實(shí)域名的相似度大于或等于預(yù)定閾值且小于100%時(shí),確定待檢測(cè)域名為可疑域名。在可選實(shí)施方式中,可以根據(jù)計(jì)算得到的待檢測(cè)域名與真實(shí)域名的相似度與預(yù)定的相似度判斷規(guī)則進(jìn)行匹配,判斷出該待檢測(cè)域名是否為可信域名。在一個(gè)可選的實(shí)施方式中,在確定該待檢測(cè)域名為可疑域名的情況下,還可 以顯示用于提醒該待檢測(cè)域名為可疑域名的告警信息;和/或,將該待檢測(cè)域名加入黑名單。在該可選的實(shí)施方式中,可以在一定程度上避免用戶受到釣魚(yú)欺詐,和/或,在該待檢測(cè)域名再次有釣魚(yú)嫌疑時(shí),迅速的將該待檢測(cè)域名定位成可疑域名,禁止訪問(wèn)可疑的域名。通過(guò)以上的實(shí)施方式的描述,本領(lǐng)域的技術(shù)人員可以清楚地了解到根據(jù)上述實(shí)施例的方法可借助軟件加必需的通用硬件平臺(tái)的方式來(lái)實(shí)現(xiàn),當(dāng)然也可以通過(guò)硬件,但很多情況下前者是更佳的實(shí)施方式。基于這樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說(shuō)對(duì)現(xiàn)有技術(shù)做出貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來(lái),該計(jì)算機(jī)軟件產(chǎn)品存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)(如ROM/RAM、磁碟、光盤(pán))中,包括若干指令用以使得一臺(tái)終端設(shè)備(可以是手機(jī),計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。在本實(shí)施例中還提供了一種域名可信度確定的裝置,該裝置用于實(shí)現(xiàn)上述實(shí)施例及優(yōu)選實(shí)施方式,已經(jīng)進(jìn)行過(guò)說(shuō)明的不再贅述。如以下所使用的,術(shù)語(yǔ)“模塊”可以實(shí)現(xiàn)預(yù)定功能的軟件和/或硬件的組合。盡管以下實(shí)施例所描述的裝置較佳地以軟件來(lái)實(shí)現(xiàn),但是硬件,或者軟件和硬件的組合的實(shí)現(xiàn)也是可能并被構(gòu)想的。本發(fā)明實(shí)施例中還提供了一種域名可信度確定的裝置,圖3是根據(jù)本發(fā)明實(shí)施例的域名可信度確定裝置的結(jié)構(gòu)框圖,如圖3所示,該裝置包括處理模塊32和確定模塊34,下面對(duì)該裝置進(jìn)行說(shuō)明:處理模塊32,用于將待檢測(cè)域名與真實(shí)域名進(jìn)行相似度判斷;確定模塊34,連接至上述處理模塊32,用于根據(jù)判斷結(jié)果確定該待檢測(cè)域名的可信度。處理模塊32的實(shí)現(xiàn)方式有多種,在本實(shí)施例的一個(gè)可選實(shí)施方式中,處理模塊32還可以用于將待檢測(cè)域名與真實(shí)域名數(shù)據(jù)庫(kù)中記錄的真實(shí)域名進(jìn)行相似度判斷,其中,在真實(shí)域名數(shù)據(jù)庫(kù)中記錄的真實(shí)域名為需要保護(hù)的真實(shí)域名。在該可選實(shí)施方式中,通過(guò)將真實(shí)域名預(yù)先記錄在真實(shí)域名數(shù)據(jù)庫(kù)中,可以方便的查找到需要保護(hù)的真實(shí)域名,提高了相似度判斷的效率。圖4是根據(jù)本發(fā)明實(shí)施例的域名可信度確定裝置中處理模塊32的結(jié)構(gòu)框圖,如圖4所示,該處理模塊32包括第一確定單元42和第二確定單元44,下面對(duì)該處理模塊32進(jìn)行說(shuō)明。第一確定單元42,用于確定待檢測(cè)域名和真實(shí)域名的字符串中的最大的相似子串;第二確定單元44,連接至上述第一確定單元42,用于根據(jù)最大的相似子串和預(yù)定義的字符之間的相似度確定該待檢測(cè)域名與真實(shí)域名的相似度。在該可選的實(shí)施方式中,通過(guò)第一確定單元42可以首先確定待檢測(cè)域名和真實(shí)域名的最大的相似子串,再通過(guò)第二確定單元44可以根據(jù)預(yù)定的每個(gè)字符與其它 字符的相似度,快速的得到待檢測(cè)域名和真實(shí)域名的相似度。其中,上述第一確定單元42中確定待檢測(cè)域名和真實(shí)域名的最大的相似子串的方式,可以采用后綴樹(shù)算法,也可以采用其他算法。圖5是根據(jù)本發(fā)明實(shí)施例的域名可信度確定裝置中確定模塊34的結(jié)構(gòu)框圖,如5所示,該確定模塊34包括第三確定單元52和第四確定單元54,下面對(duì)該確定模塊34進(jìn)行說(shuō)明。第三確定單元52,用于當(dāng)所檢測(cè)域名和真實(shí)域名的相似度為100%或相似度小于預(yù)定閾值時(shí),確定待檢測(cè)域名為可信域名,其中,該預(yù)定閾值小于100%;第四確定單元54,用于當(dāng)待檢測(cè)域名和真實(shí)域名的相似度大于或等于預(yù)定閾值且小于100%時(shí),確定待檢測(cè)域名為可疑域名。在該可選實(shí)施方式中,可以根據(jù)計(jì)算得到的待檢測(cè)域名與真實(shí)域名的相似度與預(yù)定的相似度判斷規(guī)則進(jìn)行匹配,判斷出該待檢測(cè)域名是否為可信域名。圖6是根據(jù)本發(fā)明實(shí)施例的域名可信度確定裝置的優(yōu)選結(jié)構(gòu)框圖,如圖6所示,該裝置除包括圖5所示的所有模塊外,還包括告警模塊62和/或添加模塊64,下面對(duì)該裝置進(jìn)行說(shuō)明。告警模塊62,連接至上述確定模塊34,用于在確定該待檢測(cè)域名為可疑域名的情況下,顯示用于提醒該待檢測(cè)域名為可疑域名的告警信息;和/或,添加模塊64,連接至上述確定模塊34,用于在確定該待檢測(cè)域名為可疑域名的情況下,將該待檢測(cè)域名加入黑名單。在該可選的實(shí)施方式中,可以在一定程度上避免用戶受到釣魚(yú)欺詐,和/或,在該待檢測(cè)域名再次有釣魚(yú)嫌疑時(shí),根據(jù)黑名單技術(shù)迅速的將該待檢測(cè)域名定位成可疑域名。需要說(shuō)明的是,上述各個(gè)模塊是可以通過(guò)軟件或硬件來(lái)實(shí)現(xiàn)的,對(duì)于后者,可以表現(xiàn)為以下形式,但不限于此:處理模塊32和確定模塊34位于同一處理器中,或者,處理模塊32和確定模塊34分別位于第一處理器和第二處理器中。下面,結(jié)合具體應(yīng)用場(chǎng)景對(duì)本發(fā)明進(jìn)行舉例說(shuō)明,以WEB網(wǎng)站為例,相關(guān)技術(shù)中,采用WEB方式進(jìn)行欺詐主要是通過(guò)注冊(cè)相近或者相似的域名,用來(lái)模仿用戶需要訪問(wèn)的域名來(lái)進(jìn)行欺詐,比如www.cctv01.com,www.taobao.com-agc.us等等域名都有欺詐的嫌疑。本發(fā)明實(shí)施例主要針對(duì)于這種采用WEB網(wǎng)頁(yè)方式的釣魚(yú)欺詐。另外本實(shí)施例還可以用于保護(hù)用戶指定的某些網(wǎng)站,比如用戶比較常用的淘寶、易趣、cctv以及一些知名的公共域名等等。圖7是根據(jù)本發(fā)明實(shí)施例的反釣魚(yú)欺詐裝置的裝置框圖,如圖7所示,本實(shí)施例中的反釣魚(yú)欺詐裝置(即域名可信度確定的裝置)包括:真實(shí)域名數(shù)據(jù)庫(kù)72,用來(lái)保存用戶需要進(jìn)行保護(hù)的真實(shí)的域名;相似度計(jì)算模塊74,用來(lái)計(jì)算用戶正在訪問(wèn)的域名與真實(shí)的域名之間的相似度;釣魚(yú)欺詐判定模塊76,用來(lái)判斷當(dāng)前訪問(wèn)的域名是否是釣魚(yú)欺詐;結(jié)果反饋模塊78,向用戶反饋當(dāng)前訪問(wèn)的域名是否存在釣魚(yú)欺詐的嫌疑;釣魚(yú)網(wǎng)站數(shù)據(jù)庫(kù)710,這個(gè)數(shù)據(jù)庫(kù)是明確已知的釣魚(yú)URL數(shù)據(jù),用于更加明確判斷網(wǎng)絡(luò)欺詐。數(shù)據(jù)來(lái)源于用戶的輸入,也可以在用戶使用本裝置以后反饋結(jié)果來(lái)進(jìn)行知識(shí)更新和共享。在利用本實(shí)施例中的反釣魚(yú)欺詐裝置對(duì)用戶訪問(wèn)域名進(jìn)行處理時(shí),具體處理方法包括以下步驟:步驟A,相似度計(jì)算模塊74取出用戶訪問(wèn)的域名,例如從統(tǒng)一資源定位符(URL)中取出用戶訪問(wèn)的域名;步驟B,相似度計(jì)算模塊74利用用戶訪問(wèn)的域名與真實(shí)域名數(shù)據(jù)庫(kù)72中的域名進(jìn)行相似度計(jì)算;步驟C,相似度計(jì)算模塊74將計(jì)算的結(jié)果傳遞到釣魚(yú)欺詐判定模塊76進(jìn)行判定;步驟D,結(jié)果反饋模塊78進(jìn)行結(jié)果反饋,用戶可以根據(jù)判斷結(jié)果確定訪問(wèn)的域名如果是釣魚(yú)欺詐,則不允許進(jìn)行域名訪問(wèn),如果判定結(jié)果可能是釣魚(yú)欺詐,則向用戶進(jìn)行告警提示。另外,本實(shí)施例中的反釣魚(yú)欺詐裝置還提供接口來(lái)進(jìn)行:1、判定規(guī)則配置,用來(lái)設(shè)置判定的各種規(guī)則。2、真實(shí)域名配置,用來(lái)更新需要保護(hù)的網(wǎng)站。3、釣魚(yú)網(wǎng)站配置,用來(lái)更新釣魚(yú)網(wǎng)站數(shù)據(jù)庫(kù)。下面,進(jìn)行判定規(guī)則配置的詳細(xì)描述。相似程度的計(jì)算主要采用變化的后綴樹(shù)(suffixtree)來(lái)完成,后綴樹(shù)(Suffixtree)是一種數(shù)據(jù)結(jié)構(gòu),能快速解決很多關(guān)于字符串的問(wèn)題。后綴樹(shù)的概念最早由Weiner于1973年提出,既而由McCreight在1976年和Ukkonen在1992年和1995年加以改進(jìn)完善。后綴樹(shù)提出的目的是用來(lái)支持有效的字符串匹配和查詢。可以用來(lái)很方便的匹配兩個(gè)字符串中最大的公共子串。本發(fā)明實(shí)施例中需要對(duì)后綴樹(shù)進(jìn)行擴(kuò)展和修改,主要用來(lái)查詢兩個(gè)字符串中 最大的相似子串,然后得出兩個(gè)字符串的相似程度。為了得到兩個(gè)字符串的相似度,首先需要定義字符的相似程度,如字符與字符本身的相似程度是100%,然后如1和l,o和0也是很相似的,在一個(gè)字符串中通過(guò)修改一兩個(gè)字符也會(huì)讓用戶認(rèn)為是一樣的,那么對(duì)于這樣的字符之間需要定義出相似的程度。如表1定義的字符間的相似程度的定義:表1字符A字符B相似程度1l0.970o0.95pq0.6uv0.8yv0.9根據(jù)預(yù)先定義的字符間的相似程度,再采用變化后的后綴樹(shù)算法,就可以為兩個(gè)字符串計(jì)算出相似程度,然后根據(jù)相似程度定義出如表2所示的判定規(guī)則,可以得出正在訪問(wèn)的域名是否可信。當(dāng)然,此規(guī)則可以通過(guò)配置進(jìn)行修改。表2相似程度判定規(guī)則100%真實(shí)可信大于等于80%非??梢纱笥诘扔?0%小于80%比較可疑大于等于30小于60%可疑站點(diǎn)小于30%可信站點(diǎn)或者不需要保護(hù)站點(diǎn)與相關(guān)技術(shù)相比較,本實(shí)施例引入了真實(shí)域名數(shù)據(jù)庫(kù)72、相似度計(jì)算模塊74、釣魚(yú)欺詐判定模塊76,通過(guò)采用后綴樹(shù)的數(shù)據(jù)結(jié)構(gòu)來(lái)計(jì)算字符串相似程度的算法來(lái)判定某一個(gè)域名是否是釣魚(yú)網(wǎng)站的方法,使得反釣魚(yú)欺詐的判斷更加具有目的性、智能性、一方面保證了用戶進(jìn)行網(wǎng)絡(luò)交易的安全性,另一方面提高了判斷釣魚(yú)欺詐的性能。同時(shí)還可以采用現(xiàn)有的黑名單技術(shù),將確定的釣魚(yú)網(wǎng)站的 域名加入黑名單,從而能更加快速的判定和檢查釣魚(yú)欺詐信息。此外,本發(fā)明的可選的實(shí)施例中,該反釣魚(yú)欺詐裝置(即域名可信度確定的裝置還可以用于域名注冊(cè)系統(tǒng)、終端用戶使用的瀏覽器插件、網(wǎng)關(guān)設(shè)備、網(wǎng)絡(luò)設(shè)備上等等。下面,對(duì)于該反釣魚(yú)欺詐裝置應(yīng)用于瀏覽器、域名申請(qǐng)系統(tǒng)、網(wǎng)關(guān)設(shè)備中的使用情況進(jìn)行具體描述。情況一:在瀏覽器中使用在一個(gè)可選的實(shí)施例中,該反釣魚(yú)欺詐裝置可以使用在瀏覽器上,通過(guò)在瀏覽器中使用插件來(lái)集成本裝置,可以及時(shí)的對(duì)用戶訪問(wèn)釣魚(yú)網(wǎng)站盡心保護(hù),能及時(shí)、高效的進(jìn)行反釣魚(yú)欺詐。圖8是根據(jù)本發(fā)明實(shí)施例的反釣魚(yú)欺詐裝置應(yīng)用于瀏覽器中的工作流程圖,如圖8所示,包括:步驟S802,用戶在瀏覽器上輸入要訪問(wèn)的URL;步驟S804,用戶提交URL訪問(wèn)請(qǐng)求;步驟S806,瀏覽器插件獲取URL;步驟S808,調(diào)用本裝置接口進(jìn)行檢查;步驟S810,判斷被訪問(wèn)站點(diǎn)是否是釣魚(yú)站點(diǎn);步驟S812,如果可疑則彈出告警,由用戶自己決策是否繼續(xù)請(qǐng)求網(wǎng)頁(yè);步驟S814,如果確定是釣魚(yú)網(wǎng)站則拒絕訪問(wèn);步驟S816,如果確定不是釣魚(yú)網(wǎng)站則正常訪問(wèn)。情況二:在域名申請(qǐng)系統(tǒng)中使用在一個(gè)可選的實(shí)施例中,該反釣魚(yú)欺詐裝置可以使用在域名申請(qǐng)系統(tǒng)中,所有的域名分配都由域名注冊(cè)機(jī)構(gòu)來(lái)進(jìn)行,那么為了從源頭上進(jìn)行反釣魚(yú)欺詐,本裝置可以在域名申請(qǐng)系統(tǒng)中使用,同時(shí)也可以用于防止惡意域名搶注的應(yīng)用中。圖9是根據(jù)本發(fā)明實(shí)施例的反釣魚(yú)欺詐裝置應(yīng)用于域名申請(qǐng)系統(tǒng)中的工作流程圖,如圖9所示:步驟S902,在用戶準(zhǔn)備注冊(cè)某個(gè)域名時(shí),接受用戶申請(qǐng)請(qǐng)求;步驟S904,在用戶提交注冊(cè)請(qǐng)求后,獲取用戶要申請(qǐng)的域名;步驟S906,調(diào)用本裝置進(jìn)行檢查;步驟S908,進(jìn)行結(jié)果檢查,判斷該域名是否會(huì)構(gòu)成釣魚(yú)網(wǎng)頁(yè);步驟S910,如果檢查結(jié)果可信,則準(zhǔn)許注冊(cè);步驟S912,如果檢查結(jié)果可疑,則進(jìn)行告警,不允許用戶進(jìn)行申請(qǐng)注冊(cè),可以用戶進(jìn)行申述,申訴成功則轉(zhuǎn)向步驟S910,否則轉(zhuǎn)S902,重新申請(qǐng)。情況三:在網(wǎng)關(guān)設(shè)備中使用在一個(gè)可選的實(shí)施例中,該反釣魚(yú)詐欺裝置可以在網(wǎng)關(guān)設(shè)備上使用,在網(wǎng)絡(luò)設(shè)備級(jí)別上進(jìn)行控制,可以減少部署的成本。圖10是根據(jù)本發(fā)明實(shí)施例的反釣魚(yú)欺詐裝置應(yīng)用于網(wǎng)關(guān)設(shè)備中的工作流程圖,如圖10所示,包括:步驟S1002,網(wǎng)關(guān)設(shè)備收到報(bào)文;步驟S1004,對(duì)報(bào)文進(jìn)行判斷,是否是http報(bào)文;步驟S1006,如果不是HTTP報(bào)文則進(jìn)行轉(zhuǎn)發(fā);步驟S1008,報(bào)文類(lèi)型是HTTP,從中解析出URL,同時(shí)向網(wǎng)絡(luò)請(qǐng)求網(wǎng)頁(yè)信息;步驟S1010,調(diào)用本裝置提供的接口進(jìn)行檢查,判斷是否是釣魚(yú)網(wǎng)站,判斷結(jié)果為是,轉(zhuǎn)至步驟S1012,否則,轉(zhuǎn)至步驟S1006;步驟S1012,如果檢查結(jié)果為可疑的釣魚(yú)網(wǎng)站,向用戶推送警告的HTTP信息。綜上所述,本發(fā)明實(shí)施例實(shí)現(xiàn)了以下有益效果:通過(guò)采用后綴樹(shù)的數(shù)據(jù)結(jié)構(gòu)來(lái)計(jì)算字符串相似程度的算法來(lái)判定某一個(gè)域名是否是釣魚(yú)網(wǎng)站的方法,使得反釣魚(yú)欺詐的判斷更加具有目的性、智能性、一方面保證了用戶進(jìn)行網(wǎng)絡(luò)交易的安全性,另一方面提高了判斷釣魚(yú)欺詐的性能。同時(shí)還采用現(xiàn)有的黑名單技術(shù),能更加快速的判定和檢查釣魚(yú)欺詐信息。另外,通過(guò)在瀏覽器、域名注冊(cè)系統(tǒng)、網(wǎng)關(guān)設(shè)備上應(yīng)用該反釣魚(yú)詐欺裝置,可以分別在用戶側(cè)、源側(cè)、中間傳輸中,實(shí)現(xiàn)對(duì)可疑域名系統(tǒng)的識(shí)別。在另外一個(gè)實(shí)施例中,還提供了一種軟件,該軟件用于執(zhí)行上述實(shí)施例及優(yōu)選實(shí)施方式中描述的技術(shù)方案。在另外一個(gè)實(shí)施例中,還提供了一種存儲(chǔ)介質(zhì),上述存儲(chǔ)介質(zhì)可以被設(shè)置為存儲(chǔ)用于執(zhí)行以下步驟的程序代碼:S1,將待檢測(cè)域名與真實(shí)域名進(jìn)行相似度判斷;S2,根據(jù)判斷結(jié)果確定該待檢測(cè)域名的可信度??蛇x地,在本實(shí)施例中,上述存儲(chǔ)介質(zhì)可以包括但不限于:U盤(pán)、只讀存儲(chǔ)器(Read-OnlyMemory,簡(jiǎn)稱(chēng)為ROM)、隨機(jī)存取存儲(chǔ)器(RandomAccessMemory,簡(jiǎn)稱(chēng)為RAM)、移動(dòng)硬盤(pán)、磁碟或者光盤(pán)等各種可以存儲(chǔ)程序代碼的介質(zhì)。可選地,在本實(shí)施例中,處理器根據(jù)存儲(chǔ)介質(zhì)中已存儲(chǔ)的程序代碼執(zhí)行將待檢測(cè)域名與真實(shí)域名數(shù)據(jù)庫(kù)中記錄的真實(shí)域名進(jìn)行相似度判斷,其中,在真實(shí)域名數(shù)據(jù)庫(kù)中記錄的真實(shí)域名為需要保護(hù)的真實(shí)域名??蛇x地,在本實(shí)施例中,處理器根據(jù)存儲(chǔ)介質(zhì)中已存儲(chǔ)的程序代碼執(zhí)行確定待檢測(cè)域名和真實(shí)域名的字符串中的最大的相似子串;根據(jù)最大的相似子串和預(yù)定義的字符之間的相似度確定該待檢測(cè)域名與真實(shí)域名的相似度??蛇x地,本實(shí)施例中的具體示例可以參考上述實(shí)施例及可選實(shí)施方式中所描述的示例,本實(shí)施例在此不再贅述。以上僅為本發(fā)明的優(yōu)選實(shí)施例而已,并不用于限制本發(fā)明,對(duì)于本領(lǐng)域的技術(shù)人員來(lái)說(shuō),本發(fā)明可以有各種更改和變化。凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。當(dāng)前第1頁(yè)1 2 3