欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用于判斷網(wǎng)頁網(wǎng)址重寫的方法、設(shè)備和系統(tǒng)的制作方法

文檔序號:6379060閱讀:185來源:國知局
專利名稱:一種用于判斷網(wǎng)頁網(wǎng)址重寫的方法、設(shè)備和系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及計算機安全,尤其涉及一種用于判斷網(wǎng)頁網(wǎng)址重寫的方法、設(shè)備和系統(tǒng)。
背景技術(shù)
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,提供各種網(wǎng)絡(luò)服務(wù)的網(wǎng)站大量出現(xiàn),這些網(wǎng)站可能因為諸如操作系統(tǒng)漏洞、應用程序漏洞、權(quán)限配置之類的問題,而存在各種安全隱患。因此,需要對這些網(wǎng)站進行安全檢測。一種網(wǎng)站安全檢測的方式是從網(wǎng)站外部去抓取網(wǎng)站的所有網(wǎng)頁,分析這些網(wǎng)頁的內(nèi)容是否存在安全隱患。在網(wǎng)站的安全檢測過程中,需要判斷所抓取的頁面是真實的頁面、還是網(wǎng)址重寫的頁面。 網(wǎng)址重寫是指在網(wǎng)絡(luò)服務(wù)器上,為了讓網(wǎng)站更容易被訪問并且更容易被搜索引擎收錄,將網(wǎng)址重寫成網(wǎng)站可以處理的另一個網(wǎng)址的過程。例如,如果原先網(wǎng)址是“WWW.
a.com/UserProf ile. aspx ID=l”,則可以將其重寫為“www. a. com/UserProf ile/1. aspx”這樣的網(wǎng)址。如何準確判斷頁面是否是網(wǎng)址重寫頁面是一大技術(shù)難點,現(xiàn)有的網(wǎng)站安全檢測方法不能判斷出頁面是否為網(wǎng)址重寫頁面。而且,網(wǎng)址重寫的方法隨著網(wǎng)站數(shù)量的增加,也在急劇增加,每個不同的網(wǎng)站都有可能使用不同的網(wǎng)址重寫規(guī)則,也就增加了判斷網(wǎng)址重寫頁面的規(guī)則的數(shù)量。因此,如何準確識別頁面是正常頁面還是網(wǎng)址重寫頁面存在很大的難度。

發(fā)明內(nèi)容
鑒于上述問題,提出了本發(fā)明,以便提供一種克服上述問題或者至少部分地解決上述問題的用于判斷網(wǎng)頁網(wǎng)址重寫的方法以及相應的設(shè)備和系統(tǒng)。依據(jù)本發(fā)明的一個方面,提供了一種用于判斷網(wǎng)頁網(wǎng)址重寫的方法,包括以下步驟獲取目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼;獲取與所述目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址所指向的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼;以及根據(jù)所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容之間的區(qū)別、或者所述錯誤網(wǎng)頁對應的狀態(tài)代碼、或者所述錯誤網(wǎng)頁對應的狀態(tài)代碼與所述目標網(wǎng)頁對應的狀態(tài)代碼之間的區(qū)別,判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。可選地,在根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的方法中,所述獲取目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼的步驟包括訪問所述目標網(wǎng)頁一次或多次,并且保存每次訪問的內(nèi)容以及對應的狀態(tài)代碼。可選地,在根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的方法中,所述獲取與所述目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址所指向的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼的步驟包括訪問所述錯誤網(wǎng)頁一次或多次,并且保存每次訪問的內(nèi)容以及對應的狀態(tài)代碼。
可選地,在根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的方法中,所述根據(jù)所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容之間的區(qū)別判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁的步驟包括比較所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容;以及在所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容相同的情況下,將所述目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁;或者在所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容不同的情況下,從所述錯誤網(wǎng)頁與所述目標網(wǎng)頁相比特有的內(nèi)容中獲取錯誤關(guān)鍵字,并且根據(jù)所述錯誤關(guān)鍵字來判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。可選地,在根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的方法中,所述根據(jù)所述錯誤關(guān)鍵字來判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁的步驟包括在所述錯誤關(guān)鍵字的長度小于預先定義的長度的情況下,將所述目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁??蛇x地,在根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的方法中,所述從所述錯誤網(wǎng)頁與所述目標網(wǎng)頁相比特有的內(nèi)容中獲取錯誤關(guān)鍵字的步驟包括從保存所述錯誤網(wǎng)頁一次或多次得到的內(nèi)容與保存所述目標網(wǎng)頁一次或多次得到的內(nèi)容中,分別提取每次保存的錯誤網(wǎng)頁與相應的目標網(wǎng)頁相比特有的內(nèi)容;從所述特有的內(nèi)容的交集中提取潛在 錯誤關(guān)鍵字;以及獲取出現(xiàn)次數(shù)最多的一個或多個潛在錯誤關(guān)鍵字作為錯誤關(guān)鍵字??蛇x地,在根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的方法中,所述根據(jù)所述錯誤網(wǎng)頁對應的狀態(tài)代碼判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁的步驟包括在所述錯誤網(wǎng)頁對應的狀態(tài)代碼指示該錯誤網(wǎng)頁的網(wǎng)址不可訪問的情況下,將所述目標網(wǎng)頁判斷為非網(wǎng)址重寫的網(wǎng)頁??蛇x地,所述與所述目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址是與所述目標網(wǎng)頁的網(wǎng)址相對應的、實際不存在的網(wǎng)址??蛇x地,所述網(wǎng)址是統(tǒng)一資源定位符。依據(jù)本發(fā)明的另一方面,提供了一種用于判斷網(wǎng)頁網(wǎng)址重寫的網(wǎng)絡(luò)檢測設(shè)備,包括網(wǎng)絡(luò)接口,適于獲取目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼、以及與所述目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址所指向的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼。所述網(wǎng)絡(luò)檢測設(shè)備還包括網(wǎng)址重寫判斷器,適于根據(jù)所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容之間的區(qū)別、或者所述錯誤網(wǎng)頁對應的狀態(tài)代碼、或者所述錯誤網(wǎng)頁對應的狀態(tài)代碼與所述目標網(wǎng)頁對應的狀態(tài)代碼之間的區(qū)別,判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。可選地,根據(jù)本發(fā)明的實施例的所述網(wǎng)絡(luò)檢測設(shè)備還包括網(wǎng)址構(gòu)造器,適于構(gòu)造與所述目標網(wǎng)頁的網(wǎng)址相對應的、實際不存在的所述錯誤網(wǎng)址,并將所述目標網(wǎng)頁的網(wǎng)址和錯誤網(wǎng)址發(fā)送給所述網(wǎng)絡(luò)接口??蛇x地,根據(jù)本發(fā)明的實施例的所述網(wǎng)絡(luò)檢測設(shè)備還包括網(wǎng)頁存儲器,適于存儲由所述網(wǎng)絡(luò)接口獲取的目標網(wǎng)頁的內(nèi)容及其對應的狀態(tài)代碼、以及所述錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼,并提供給所述網(wǎng)址重寫判斷器。可選地,在根據(jù)本發(fā)明的實施例的所述網(wǎng)絡(luò)檢測設(shè)備中,所述網(wǎng)絡(luò)接口訪問所述目標網(wǎng)頁一次或多次,并且將每次訪問的目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼保存到所述網(wǎng)頁存儲器中。可選地,在根據(jù)本發(fā)明的實施例的所述網(wǎng)絡(luò)檢測設(shè)備中,所述網(wǎng)絡(luò)接口訪問所述錯誤網(wǎng)頁一次或多次,并且將每次訪問的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼保存到所述網(wǎng)頁存儲器中??蛇x地,在根據(jù)本發(fā)明的實施例的所述網(wǎng)絡(luò)檢測設(shè)備中,所述網(wǎng)址重寫判斷器包括網(wǎng)頁內(nèi)容比較器,適于比較所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容;錯誤關(guān)鍵字獲取器,適于在所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容不同的情況下,從所述錯誤網(wǎng)頁與所述目標網(wǎng)頁相比特有的內(nèi)容中獲取錯誤關(guān)鍵字;以及網(wǎng)址重寫子判斷器,適于在所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容相同的情況下,將所述目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁,并且在所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容不同的情況下,根據(jù)所述錯誤關(guān)鍵字來判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁??蛇x地,在根據(jù)本發(fā)明的實施例的所述網(wǎng)絡(luò)檢測設(shè)備中,在所述錯誤關(guān)鍵字的長度小于預先定義的長度的情況下,所述網(wǎng)址重寫子判斷器將所述目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁。可選地,在根據(jù)本發(fā)明的實施例的所述網(wǎng)絡(luò)檢測設(shè)備中,在所述錯誤網(wǎng)頁的內(nèi)容·與所述目標網(wǎng)頁的內(nèi)容不同的情況下,所述網(wǎng)址重寫子判斷器從保存所述錯誤網(wǎng)頁一次或多次得到的內(nèi)容與保存所述目標網(wǎng)頁一次或多次得到的內(nèi)容中,分別提取每次保存的錯誤網(wǎng)頁與相應的目標網(wǎng)頁相比特有的內(nèi)容;從所述特有的內(nèi)容的交集中提取潛在錯誤關(guān)鍵字;并且獲取出現(xiàn)次數(shù)最多的一個或多個潛在錯誤關(guān)鍵字作為錯誤關(guān)鍵字??蛇x地,在根據(jù)本發(fā)明的實施例的所述網(wǎng)絡(luò)檢測設(shè)備中,在所述錯誤網(wǎng)頁對應的狀態(tài)代碼指示該錯誤網(wǎng)頁的網(wǎng)址不可訪問的情況下,所述網(wǎng)址重寫判斷器將所述目標網(wǎng)頁判斷為非網(wǎng)址重寫的網(wǎng)頁??蛇x地,所述與所述目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址是與所述目標網(wǎng)頁的網(wǎng)址相對應的、實際不存在的網(wǎng)址??蛇x地,所述網(wǎng)址是統(tǒng)一資源定位符。依據(jù)本發(fā)明的又一方面,提供了一種用于判斷網(wǎng)頁網(wǎng)址重寫的網(wǎng)絡(luò)檢測系統(tǒng),包括根據(jù)本發(fā)明的實施例的上述網(wǎng)絡(luò)檢測設(shè)備、以及一個或者多個目標服務(wù)器,適于響應于所述網(wǎng)絡(luò)檢測設(shè)備提供的所述目標網(wǎng)頁的網(wǎng)址和所述錯誤網(wǎng)址,向所述網(wǎng)絡(luò)檢測設(shè)備提供所述目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼、以及所述錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼。本發(fā)明提供了用于判斷網(wǎng)頁網(wǎng)址重寫的方法以及相應的設(shè)備和系統(tǒng)。根據(jù)本發(fā)明的實施例,可以利用目標網(wǎng)頁以及與其相對應的錯誤網(wǎng)頁的內(nèi)容和狀態(tài)代碼,來準確有效地判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁,能夠適用于各種形式的網(wǎng)址重寫的網(wǎng)頁。在網(wǎng)頁為網(wǎng)址重寫的網(wǎng)頁的情況下,在網(wǎng)站的安全檢測過程中,就不再需要對該網(wǎng)頁相關(guān)目錄下的鏈接進行進一步的分析和判斷,可以很大程度地節(jié)省安全檢測所需要的掃描時間。而在網(wǎng)頁為非網(wǎng)址重寫的網(wǎng)頁時,可以準確提取錯誤關(guān)鍵字以進行漏洞判斷,從而減少漏洞誤報。上述說明僅是本發(fā)明技術(shù)方案的概述,為了能夠更清楚了解本發(fā)明的技術(shù)手段,而可依照說明書的內(nèi)容予以實施,并且為了讓本發(fā)明的上述和其它目的、特征和優(yōu)點能夠更明顯易懂,以下特舉本發(fā)明的具體實施方式
。


通過閱讀下文優(yōu)選實施方式的詳細描述,各種其他的優(yōu)點和益處對于本領(lǐng)域普通技術(shù)人員將變得清楚明了。附圖僅用于示出優(yōu)選實施方式的目的,而并不認為是對本發(fā)明的限制。而且在整個附圖中,用相同的參考符號表示相同的部件。在附圖中 圖I是根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的方法的流程圖;圖2是根據(jù)本發(fā)明的實施例的根據(jù)錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容之間的區(qū)別判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁的步驟的流程圖;圖3是根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的網(wǎng)絡(luò)檢測設(shè)備的框圖;圖4是根據(jù)本發(fā)明的實施例的網(wǎng)址重寫判斷器的框圖;以及圖5是根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的網(wǎng)絡(luò)檢測系統(tǒng)的框圖。
具體實施例方式下面將參照附圖更詳細地描述本公開的示例性實施例。雖然附圖中顯示了本公開的示例性實施例,然而應當理解,可以以各種形式實現(xiàn)本公開而不應被這里闡述的實施例所限制。相反,提供這些實施例是為了能夠更透徹地理解本公開,并且能夠?qū)⒈竟_的范圍完整的傳達給本領(lǐng)域的技術(shù)人員。圖I示意性地圖示了根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的方法100的流程圖。如圖I所示,在根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的方法100中,一開始,執(zhí)行步驟SlOl :獲取目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼;接著,執(zhí)行步驟S103 :獲取與目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址所指向的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼;最后,執(zhí)行步驟S105:根據(jù)錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容之間的區(qū)別、或者錯誤網(wǎng)頁對應的狀態(tài)代碼、或者錯誤網(wǎng)頁對應的狀態(tài)代碼與目標網(wǎng)頁對應的狀態(tài)代碼之間的區(qū)別,判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。根據(jù)本發(fā)明的實施例,網(wǎng)址例如可以是URL(Uniform ResourceLocator,統(tǒng)一資源定位符),下文中以URL為例進行描述,但網(wǎng)址并不僅限于URL,而是可以包括任何標識網(wǎng)站地址的方式。在步驟SlOl中,獲取目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼。可選地,可以訪問目標網(wǎng)頁一次或多次,并且保存每次訪問的內(nèi)容以及對應的狀態(tài)代碼。例如,在訪問目標網(wǎng)頁多次的情況下,可以將多次訪問的內(nèi)容保存為html_okl、html_ok2、*“、html_okn,將這些次訪問結(jié)果的狀態(tài)代碼保存為 http_status_okl、http_status_ok2、…、http_status_okn。接下來,在步驟S103中,獲取與目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址所指向的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼。根據(jù)本發(fā)明的實施例,與目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址是與目標網(wǎng)頁的網(wǎng)址相對應的、實際不存在的網(wǎng)址,例如,如果目標網(wǎng)頁的網(wǎng)址是/site/content/1/,則錯誤網(wǎng)址則可以是 /site/content/1/neverexistpage??蛇x地,同樣,可以訪問錯誤網(wǎng)頁一次或多次,并且保存每次訪問的內(nèi)容以及對應的狀態(tài)代碼。例如,在訪問錯誤網(wǎng)頁多次的情況下,可以將多次訪問的內(nèi)容保存為html_err I、html_err 2、…、html_errn,將這些次訪問結(jié)果的狀態(tài)代碼保存為ht tp_s tatus_err I、http_status_err2、…、http_status_errn。隨后,在步驟S105中,可以根據(jù)以下三者之一來判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁(I)錯誤網(wǎng)頁對應的狀態(tài)代碼、或者(2)錯誤網(wǎng)頁對應的狀態(tài)代碼與目標網(wǎng)頁對應的狀態(tài)代碼之間的區(qū)別、或者(3 )錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容之間的區(qū)別。下面分別針對以上三種情況進行描述。第一,可以根據(jù)錯誤網(wǎng)頁對應的狀態(tài)代碼來判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。例如,根據(jù)本發(fā)明的實施例,如果訪問錯誤URL的訪問結(jié)果的狀態(tài)代碼指示該錯誤URL不可訪問(例如狀態(tài)代碼為404 服務(wù)器找不到請求的網(wǎng)頁”),則可以判斷出目標網(wǎng)頁不是網(wǎng)址重寫的網(wǎng)頁,即非網(wǎng)址重寫的網(wǎng)頁。第二,可以根據(jù)錯誤網(wǎng)頁對應的狀態(tài)代碼與目標網(wǎng)頁對應的狀態(tài)代碼之間的區(qū)別來判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。例如,根據(jù)本發(fā)明的實施例,如果訪問錯誤URL的訪問結(jié)果的狀態(tài)代碼為200 (“服務(wù)器已成功處理了請求”),而訪問對應的正常URL的訪問結(jié)果的狀態(tài)代碼為302 (“服務(wù)器目前從不同位置的網(wǎng)頁響應請求,但請求者應繼續(xù)使用原有位置來進行以后的請求”),則可以判斷目標網(wǎng)頁是網(wǎng)址重寫的網(wǎng)頁。第三,可以根據(jù)錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容之間的區(qū)別來判斷目標網(wǎng)頁是 否為網(wǎng)址重寫的網(wǎng)頁。圖2示意性地圖示了根據(jù)本發(fā)明的實施例的根據(jù)錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容之間的區(qū)別判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁的步驟的流程圖,如圖2所示,首先執(zhí)行步驟S105al :比較錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容。之后,在錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容相同的情況下,執(zhí)行步驟S105a2 :將目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁。而在錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容不同的情況下,則執(zhí)行步驟S105a2’ 從錯誤網(wǎng)頁與目標網(wǎng)頁相比特有的內(nèi)容中獲取錯誤關(guān)鍵字,并且根據(jù)錯誤關(guān)鍵字來判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。其中,可以通過如下方式從錯誤網(wǎng)頁與目標網(wǎng)頁相比特有的內(nèi)容中獲取錯誤關(guān)鍵字。首先,可以從保存錯誤網(wǎng)頁一次或多次得到的內(nèi)容與保存目標網(wǎng)頁一次或多次得到的內(nèi)容中,分別提取每次保存的錯誤網(wǎng)頁與相應的目標網(wǎng)頁相比特有的內(nèi)容。仍以訪問目標網(wǎng)頁多次并且訪問錯誤網(wǎng)頁多次為例進行描述,可以分別比較上述的html_errl〈==>html_okl到html_errn〈==>html_okn,并且將錯誤網(wǎng)頁所特有的內(nèi)容分別保存為html_err_specialI>…、html_err_specialn。具體而言,可以采用本領(lǐng)域常用的一種開源(opensource)項目 “dtl: :Diff”(請參見 http://code, google, com/p/dtl-cpp/),利用該項目,可以提取出每個錯誤網(wǎng)頁特有的一段或者多段內(nèi)容(字符串),并且每段特有的內(nèi)容之間用分割標記分隔開。之后,可以從特有的內(nèi)容的交集中提取潛在錯誤關(guān)鍵字,例如,可以從上述的html_err_specialI> ···>html_err_specialn 中提取交集,保存為 html_err_join。具體而言,同樣可以米用開源項目 “dtl: :Diff ”來從 html_err_speciall、…、html_err_specialn中提取交集,并保存為html_err_join,這里是提取內(nèi)容一致的部分,每段相同的內(nèi)容(字符串)之間同樣有分割標記分割開。然后,可以從交集html_err_join中提取錯誤關(guān)鍵字,也就是從一段一段的文本中提取關(guān)鍵字(不區(qū)分語言),提取出的結(jié)構(gòu)是錯誤關(guān)鍵字列表。舉例而言,所提取出來的錯誤關(guān)鍵字包括但不限于“網(wǎng)頁未找到”(或者“page not found”)、“頁面不存在”(或者“page does not exist”)、“404 錯誤”(或者“404error”)、“找不到文件”(或者“file notfound,,)等等。之后,可選地,還可以對所提取出來的錯誤關(guān)鍵字進行排序和去重等處理,以保證錯誤關(guān)鍵字列表中每個錯誤關(guān)鍵字的唯一性,排序例如可以采用錯誤關(guān)鍵字出現(xiàn)的次數(shù)來作為排序條件。并且,可選地,作為復查,從錯誤關(guān)鍵字列表中排除正確頁面中存在的關(guān)鍵字,以確保錯誤關(guān)鍵字的正確性。然后,可選地,可以從錯誤關(guān)鍵字列表中提取排名第一(或者根據(jù)需要,提取排名前η)的錯誤關(guān)鍵字作為有效錯誤關(guān)鍵字。即,獲取出現(xiàn)次數(shù)最多的一個或多個潛在錯誤關(guān)鍵字作為最終的錯誤關(guān)鍵字。如果依據(jù)上述步驟,沒有獲取到錯誤關(guān)鍵字,則可以判斷目標網(wǎng)頁為網(wǎng)址重寫的網(wǎng)頁。在獲取了錯誤關(guān)鍵字之后,可以根據(jù)其來判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。可選地,在錯誤關(guān)鍵字的長度小于預先定義的長度的情況下,將目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁。預先定義的長度可以根據(jù)實際需要來進行選擇,例如2或3個字符,即,在錯誤關(guān) 鍵字的長度小于2或3個字符的情況下,將目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁。在不滿足上述條件的情況下,可以將目標網(wǎng)頁判斷為非網(wǎng)址重寫的網(wǎng)頁,并且保存錯誤關(guān)鍵字。隨后,根據(jù)本發(fā)明的網(wǎng)站安全檢測系統(tǒng)可以利用上述錯誤關(guān)鍵字來確定該網(wǎng)站存在的問題,錯誤關(guān)鍵字是在網(wǎng)站處理錯誤請求時產(chǎn)生的頁面中的特定內(nèi)容。在對網(wǎng)站進行安全檢測時,會構(gòu)造一些惡意攻擊鏈接,如果網(wǎng)站同樣對其進行了處理,并返回了包括特定關(guān)鍵字的內(nèi)容,則說明網(wǎng)站已經(jīng)注意到這種惡意攻擊并且進行了相應的處理,因此可以認為該網(wǎng)站對這種惡意攻擊進行了防范,就可以不再進行進一步的檢測,從而節(jié)省了檢測時間。本發(fā)明提供了一種用于判斷網(wǎng)頁網(wǎng)址重寫的方法。根據(jù)本發(fā)明的實施例,可以利用目標網(wǎng)頁以及與其相對應的錯誤網(wǎng)頁的內(nèi)容和狀態(tài)代碼,來準確有效地判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁,能夠適用于各種形式的網(wǎng)址重寫的網(wǎng)頁。在網(wǎng)頁為網(wǎng)址重寫的網(wǎng)頁的情況下,在網(wǎng)站的安全檢測過程中,就不再需要對該網(wǎng)頁相關(guān)目錄下的鏈接進行進一步的分析和判斷,可以很大程度地節(jié)省安全檢測所需要的掃描時間。而在網(wǎng)頁為非網(wǎng)址重寫的網(wǎng)頁時,可以準確提取錯誤關(guān)鍵字以進行漏洞判斷,從而減少漏洞誤報。與上述的方法100相對應,本發(fā)明還提供了一種用于判斷網(wǎng)頁網(wǎng)址重寫的網(wǎng)絡(luò)檢測設(shè)備200。圖3示意性地圖示了根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的網(wǎng)絡(luò)檢測設(shè)備200的框圖,參見圖3,網(wǎng)絡(luò)檢測設(shè)備200主要包括網(wǎng)絡(luò)接口 201以及網(wǎng)址重寫判斷器203,并且可選地還可以包括網(wǎng)址構(gòu)造器205以及網(wǎng)頁存儲器207。根據(jù)本發(fā)明的實施例,網(wǎng)絡(luò)接口 201適于利用目標網(wǎng)頁的網(wǎng)址和與目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址向例如一個或者多個目標服務(wù)器請求網(wǎng)頁,并且從一個或者多個目標服務(wù)器獲取目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼、以及錯誤網(wǎng)址所指向的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼。網(wǎng)絡(luò)接口 201可以用于執(zhí)行上述方法100中的步驟SlOl和步驟S103。網(wǎng)址重寫判斷器203適于根據(jù)錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容之間的區(qū)別、或者錯誤網(wǎng)頁對應的狀態(tài)代碼、或者錯誤網(wǎng)頁對應的狀態(tài)代碼與目標網(wǎng)頁對應的狀態(tài)代碼之間的區(qū)別,判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁,網(wǎng)址重寫判斷器203可以用于執(zhí)行上述方法100中的步驟S105。
根據(jù)本發(fā)明的實施例,網(wǎng)絡(luò)檢測設(shè)備200還可以包括網(wǎng)址構(gòu)造器205,其適于構(gòu)造與目標網(wǎng)頁的網(wǎng)址相對應的、實際不存在的錯誤網(wǎng)址,并將目標網(wǎng)頁的網(wǎng)址和錯誤網(wǎng)址發(fā)送給網(wǎng)絡(luò)接口 201。可選地,網(wǎng)絡(luò)檢測設(shè)備200還可以包括網(wǎng)頁存儲器207,其適于存儲由網(wǎng)絡(luò)接口 201獲取的目標網(wǎng)頁的內(nèi)容及其對應的狀態(tài)代碼、以及錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼,并提供給網(wǎng)址重寫判斷器203。根據(jù)本發(fā)明的實施例,網(wǎng)絡(luò)接口 201可以訪問目標網(wǎng)頁一次或多次,并且將每次訪問的目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼保存到網(wǎng)頁存儲器207中。類似地,網(wǎng)絡(luò)接口201也可以訪問錯誤網(wǎng)頁一次或多次,并且將每次訪問的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼保存到網(wǎng)頁存儲器207中。在網(wǎng)址重寫判斷器203從網(wǎng)頁存儲器207獲取到目標網(wǎng)頁的內(nèi)容及其對應的狀態(tài)代碼、以及錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼之后,就可以根據(jù)錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容之間的區(qū)別、或者錯誤網(wǎng)頁對應的狀態(tài)代碼、或者錯誤網(wǎng)頁對應的狀態(tài)代碼與目標網(wǎng)頁對應的狀態(tài)代碼之間的區(qū)別,判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。 其中,在錯誤網(wǎng)頁對應的狀態(tài)代碼指示該錯誤網(wǎng)頁的網(wǎng)址不可訪問(例如狀態(tài)代碼為404 服務(wù)器找不到請求的網(wǎng)頁”)的情況下,網(wǎng)址重寫判斷器203將目標網(wǎng)頁判斷為非網(wǎng)址重寫的網(wǎng)頁。另外,根據(jù)本發(fā)明的實施例,例如,如果訪問錯誤URL的訪問結(jié)果的狀態(tài)代碼為200 (“服務(wù)器已成功處理了請求”),而訪問對應的正常URL的訪問結(jié)果的狀態(tài)代碼為302(“服務(wù)器目前從不同位置的網(wǎng)頁響應請求,但請求者應繼續(xù)使用原有位置來進行以后的請求”),則網(wǎng)址重寫判斷器203可以判斷目標網(wǎng)頁是網(wǎng)址重寫的網(wǎng)頁。圖4示意性地圖示了根據(jù)本發(fā)明的實施例的網(wǎng)址重寫判斷器203的框圖。根據(jù)本發(fā)明的實施例,如圖4所示,網(wǎng)址重寫判斷器203可以包括網(wǎng)頁內(nèi)容比較器203a,適于比較錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容,可以用于執(zhí)行上述方法100中的步驟S105al ;錯誤關(guān)鍵字獲取器203b,適于在錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容不同的情況下,從錯誤網(wǎng)頁與目標網(wǎng)頁相比特有的內(nèi)容中獲取錯誤關(guān)鍵字;以及網(wǎng)址重寫子判斷器203c,適于在錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容相同的情況下,將目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁,并且在錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容不同的情況下,根據(jù)錯誤關(guān)鍵字來判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。錯誤關(guān)鍵字獲取器203b和網(wǎng)址重寫子判斷器203c可以用于執(zhí)行上述方法100中的步驟S105a2以及步驟S105a2’。根據(jù)本發(fā)明的實施例,在錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容不同的情況下,網(wǎng)址重寫子判斷器203c從保存錯誤網(wǎng)頁一次或多次得到的內(nèi)容與保存目標網(wǎng)頁一次或多次得到的內(nèi)容中,分別提取每次保存的錯誤網(wǎng)頁與相應的目標網(wǎng)頁相比特有的內(nèi)容,從特有的內(nèi)容的交集中提取潛在錯誤關(guān)鍵字,并且獲取出現(xiàn)次數(shù)最多的一個或多個潛在錯誤關(guān)鍵字作為錯誤關(guān)鍵字。如果依據(jù)上述步驟,沒有獲取到錯誤關(guān)鍵字,則網(wǎng)址重寫判斷器203可以判斷目標網(wǎng)頁為網(wǎng)址重寫的網(wǎng)頁。在獲取了錯誤關(guān)鍵字之后,網(wǎng)址重寫判斷器203可以根據(jù)其來判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。可選地,在錯誤關(guān)鍵字的長度小于預先定義的長度的情況下,網(wǎng)址重寫判斷器203將目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁。預先定義的長度可以根據(jù)實際需要來進行選擇,例如2或3個字符,即,在錯誤關(guān)鍵字的長度小于2或3個字符的情況下,網(wǎng)址重寫判斷器203將目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁。在不滿足上述條件的情況下,網(wǎng)址重寫判斷器203可以將目標網(wǎng)頁判斷為非網(wǎng)址重寫的網(wǎng)頁,并且保存錯誤關(guān)鍵字。由于上述各設(shè)備(裝置)實施例與前述各方法實施例相對應,因此不再對各裝置實施例進行詳細描述。根據(jù)本發(fā)明的又一方面,還提供了一種用于判斷網(wǎng)頁網(wǎng)址重寫的網(wǎng)絡(luò)檢測系統(tǒng)1000。圖5示意性地圖示了根據(jù)本發(fā)明的實施例的用于判斷網(wǎng)頁網(wǎng)址重寫的網(wǎng)絡(luò)檢測系統(tǒng)1000的框圖,參見圖5,網(wǎng)絡(luò)監(jiān)測系統(tǒng)1000可以包括上述的網(wǎng)絡(luò)檢測設(shè)備200、以及一個或者多個目標服務(wù)器300-1,…,300-n,這一個或者多個目標服務(wù)器可以響應于網(wǎng)絡(luò)檢測設(shè)備200通過其中的網(wǎng)絡(luò)接口 201提供的目標網(wǎng)頁的網(wǎng)址和錯誤網(wǎng)址,來向網(wǎng)絡(luò)檢測設(shè)備200中的網(wǎng)絡(luò)接口 201提供目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼、以及錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼,以供網(wǎng)絡(luò)檢測設(shè)備200中的網(wǎng)址重寫判斷器203根據(jù)錯誤網(wǎng)頁的內(nèi)容與目標網(wǎng)頁的內(nèi)容之間的區(qū)別、或者錯誤網(wǎng)頁對應的狀態(tài)代碼、或者錯誤網(wǎng)頁對應的狀態(tài)代碼與·目標網(wǎng)頁對應的狀態(tài)代碼之間的區(qū)別,判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。在此提供的算法和顯示不與任何特定計算機、虛擬系統(tǒng)或者其它設(shè)備固有相關(guān)。各種通用系統(tǒng)也可以與基于在此的示教一起使用。根據(jù)上面的描述,構(gòu)造這類系統(tǒng)所要求的結(jié)構(gòu)是顯而易見的。此外,本發(fā)明也不針對任何特定編程語言。應當明白,可以利用各種編程語言實現(xiàn)在此描述的本發(fā)明的內(nèi)容,并且上面對特定語言所做的描述是為了披露本發(fā)明的最佳實施方式。在此處所提供的說明書中,說明了大量具體細節(jié)。然而,能夠理解,本發(fā)明的實施例可以在沒有這些具體細節(jié)的情況下實踐。在一些實例中,并未詳細示出公知的方法、結(jié)構(gòu)和技術(shù),以便不模糊對本說明書的理解。類似地,應當理解,為了精簡本公開并幫助理解各個發(fā)明方面中的一個或多個,在上面對本發(fā)明的示例性實施例的描述中,本發(fā)明的各個特征有時被一起分組到單個實施例、圖、或者對其的描述中。然而,并不應將該公開的方法解釋成反映如下意圖即所要求保護的本發(fā)明要求比在每個權(quán)利要求中所明確記載的特征更多的特征。更確切地說,如下面的權(quán)利要求書所反映的那樣,發(fā)明方面在于少于前面公開的單個實施例的所有特征。因此,遵循具體實施方式
的權(quán)利要求書由此明確地并入該具體實施方式
,其中每個權(quán)利要求本身都作為本發(fā)明的單獨實施例。本領(lǐng)域那些技術(shù)人員可以理解,可以對實施例中的裝置中的模塊進行自適應性地改變并且把它們設(shè)置在與該實施例不同的一個或多個裝置中。可以把實施例中的若干模塊組合成一個模塊或單元或組件,以及此外可以把它們分成多個子模塊或子單元或子組件。除了這樣的特征和/或過程或者模塊中的至少一些是相互排斥之外,可以采用任何組合對本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的所有特征以及如此公開的任何方法或者設(shè)備的所有過程或單元進行組合。除非另外明確陳述,本說明書(包括伴隨的權(quán)利要求、摘要和附圖)中公開的每個特征可以由提供相同、等同或相似目的替代特征來代替。此外,本領(lǐng)域的技術(shù)人員能夠理解,盡管在此所述的一些實施例包括其它實施例中所包括的某些特征而不是其它特征,但是不同實施例的特征的組合意味著處于本發(fā)明的范圍之內(nèi)并且形成不同的實施例。例如,在權(quán)利要求書中,所要求保護的實施例的任意之一都可以以任意的組合方式來使用。本發(fā)明的各個裝置實施例可以以硬件實現(xiàn),或者以在一個或者多個處理器上運行的軟件模塊實現(xiàn),或者以它們的組合實現(xiàn)。本領(lǐng)域的技術(shù)人員應當理解,可以在實踐中使用微處理器或者數(shù)字信號處理器(DSP )來實現(xiàn)根據(jù)本發(fā)明實施例的裝置中的一些或者全部模塊的一些或者全部功能。本發(fā)明還可以實現(xiàn)為用于執(zhí)行這里所描述的方法的一部分或者全部的裝置程序(例如,計算機程序和計算機程序產(chǎn)品)。這樣的實現(xiàn)本發(fā)明的程序可以存儲在計算機可讀介質(zhì)上,或者可以具有一個或者多個信號的形式。這樣的信號可以從因特網(wǎng)網(wǎng)站上下載得到,或者在載體信號上提供,或者以任何其他形式提供。應該注意的是上述實施例對本發(fā)明進行說明而不是對本發(fā)明進行限制,并且本領(lǐng)域技術(shù)人員在不脫離所附權(quán)利要求的范圍的情況下可設(shè)計出替換實施例。在權(quán)利要求中,不應將位于括號之間的任何參考符號構(gòu)造成對權(quán)利要求的限制。單詞“包含”不排除存在
未列在權(quán)利要求中的元件或步驟。位于元件之前的單詞“一”或“一個”不排除存在多個這樣的元件。本發(fā)明可以借助于包括有若干不同元件的硬件以及借助于適當編程的計算機來實現(xiàn)。在列舉了若干裝置的單元權(quán)利要求中,這些裝置中的若干個可以是通過同一個硬件項來具體體現(xiàn)。單詞第一、第二、以及第三等的使用不表示任何順序??蓪⑦@些單詞解釋為名稱。
權(quán)利要求
1.一種用于判斷網(wǎng)頁網(wǎng)址重寫的方法(100),包括以下步驟 獲取目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼(SlOl); 獲取與所述目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址所指向的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼(S103);以及 根據(jù)所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容之間的區(qū)別、或者所述錯誤網(wǎng)頁對應的狀態(tài)代碼、或者所述錯誤網(wǎng)頁對應的狀態(tài)代碼與所述目標網(wǎng)頁對應的狀態(tài)代碼之間的區(qū)另IJ,判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁(S105)。
2.如權(quán)利要求I所述的方法,其中所述獲取目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼(SlOl)的步驟包括訪問所述目標網(wǎng)頁一次或多次,并且保存每次訪問的內(nèi)容以及對應的狀態(tài)代碼。
3.如權(quán)利要求I所述的方法,其中所述獲取與所述目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址所指向的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼(S103)的步驟包括訪問所述錯誤網(wǎng)頁一次或多次,并且保存每次訪問的內(nèi)容以及對應的狀態(tài)代碼。
4.如權(quán)利要求I至3中的任一項所述的方法,其中所述根據(jù)所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容之間的區(qū)別判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁的步驟包括 比較所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容(S105al);以及 在所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容相同的情況下,將所述目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁(S105a2);或者 在所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容不同的情況下,從所述錯誤網(wǎng)頁與所述目標網(wǎng)頁相比特有的內(nèi)容中獲取錯誤關(guān)鍵字,并且根據(jù)所述錯誤關(guān)鍵字來判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁(S105a2’)。
5.如權(quán)利要求4所述的方法,其中所述根據(jù)所述錯誤關(guān)鍵字來判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁的步驟包括在所述錯誤關(guān)鍵字的長度小于預先定義的長度的情況下,將所述目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁。
6.如權(quán)利要求4所述的方法,其中所述從所述錯誤網(wǎng)頁與所述目標網(wǎng)頁相比特有的內(nèi)容中獲取錯誤關(guān)鍵字的步驟包括 從保存所述錯誤網(wǎng)頁一次或多次得到的內(nèi)容與保存所述目標網(wǎng)頁一次或多次得到的內(nèi)容中,分別提取每次保存的錯誤網(wǎng)頁與相應的目標網(wǎng)頁相比特有的內(nèi)容; 從所述特有的內(nèi)容的交集中提取潛在錯誤關(guān)鍵字;以及 獲取出現(xiàn)次數(shù)最多的一個或多個潛在錯誤關(guān)鍵字作為錯誤關(guān)鍵字。
7.如權(quán)利要求I至6中的任一項所述的方法,其中所述根據(jù)所述錯誤網(wǎng)頁對應的狀態(tài)代碼判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁的步驟包括在所述錯誤網(wǎng)頁對應的狀態(tài)代碼指示該錯誤網(wǎng)頁的網(wǎng)址不可訪問的情況下,將所述目標網(wǎng)頁判斷為非網(wǎng)址重寫的網(wǎng)頁。
8.如權(quán)利要求I至7中的任一項所述的方法,其中所述與所述目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址是與所述目標網(wǎng)頁的網(wǎng)址相對應的、實際不存在的網(wǎng)址。
9.如權(quán)利要求I至8中的任一項所述的方法,其中所述網(wǎng)址是統(tǒng)一資源定位符。
10.一種用于判斷網(wǎng)頁網(wǎng)址重寫的網(wǎng)絡(luò)檢測設(shè)備(200),包括 網(wǎng)絡(luò)接口(201),適于獲取目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼、以及與所述目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址所指向的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼;以及網(wǎng)址重寫判斷器(203),適于根據(jù)所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容之間的區(qū)別、或者所述錯誤網(wǎng)頁對應的狀態(tài)代碼、或者所述錯誤網(wǎng)頁對應的狀態(tài)代碼與所述目標網(wǎng)頁對應的狀態(tài)代碼之間的區(qū)別,判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。
11.如權(quán)利要求10所述的網(wǎng)絡(luò)檢測設(shè)備(200),還包括網(wǎng)址構(gòu)造器(205),適于構(gòu)造與所述目標網(wǎng)頁的網(wǎng)址相對應的、實際不存在的所述錯誤網(wǎng)址,并將所述目標網(wǎng)頁的網(wǎng)址和錯誤網(wǎng)址發(fā)送給所述網(wǎng)絡(luò)接口(201)。
12.如權(quán)利要求10或者11所述的網(wǎng)絡(luò)檢測設(shè)備(200),還包括網(wǎng)頁存儲器(207),適于存儲由所述網(wǎng)絡(luò)接口(201)獲取的目標網(wǎng)頁的內(nèi)容及其對應的狀態(tài)代碼、以及所述錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼,并提供給所述網(wǎng)址重寫判斷器(203)。
13.如權(quán)利要求10-12中的任一項所述的網(wǎng)絡(luò)檢測設(shè)備(200),其中所述網(wǎng)絡(luò)接口(201)訪問所述目標網(wǎng)頁一次或多次,并且將每次訪問的目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼保存到所述網(wǎng)頁存儲器(207)中。
14.如權(quán)利要求10-13中的任一項所述的網(wǎng)絡(luò)檢測設(shè)備(200),其中所述網(wǎng)絡(luò)接口(201)訪問所述錯誤網(wǎng)頁一次或多次,并且將每次訪問的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼保存到所述網(wǎng)頁存儲器(207)中。
15.如權(quán)利要求10至14中的任一項所述的網(wǎng)絡(luò)檢測設(shè)備(200),其中所述網(wǎng)址重寫判斷器(203)包括: 網(wǎng)頁內(nèi)容比較器(203a),適于比較所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容; 錯誤關(guān)鍵字獲取器(203b),適于在所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容不同的情況下,從所述錯誤網(wǎng)頁與所述目標網(wǎng)頁相比特有的內(nèi)容中獲取錯誤關(guān)鍵字;以及 網(wǎng)址重寫子判斷器(203c),適于在所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容相同的情況下,將所述目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁,并且在所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容不同的情況下,根據(jù)所述錯誤關(guān)鍵字來判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。
16.如權(quán)利要求15所述的網(wǎng)絡(luò)檢測設(shè)備(200),其中在所述錯誤關(guān)鍵字的長度小于預先定義的長度的情況下,所述網(wǎng)址重寫子判斷器(203c)將所述目標網(wǎng)頁判斷為網(wǎng)址重寫的網(wǎng)頁。
17.如權(quán)利要求15或16所述的網(wǎng)絡(luò)檢測設(shè)備(200),其中在所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容不同的情況下,所述網(wǎng)址重寫子判斷器(203c) 從保存所述錯誤網(wǎng)頁一次或多次得到的內(nèi)容與保存所述目標網(wǎng)頁一次或多次得到的內(nèi)容中,分別提取每次保存的錯誤網(wǎng)頁與相應的目標網(wǎng)頁相比特有的內(nèi)容; 從所述特有的內(nèi)容的交集中提取潛在錯誤關(guān)鍵字;并且 獲取出現(xiàn)次數(shù)最多的一個或多個潛在錯誤關(guān)鍵字作為錯誤關(guān)鍵字。
18.如權(quán)利要求10至17中的任一項所述的網(wǎng)絡(luò)檢測設(shè)備(200),其中在所述錯誤網(wǎng)頁對應的狀態(tài)代碼指示該錯誤網(wǎng)頁的網(wǎng)址不可訪問的情況下,所述網(wǎng)址重寫判斷器(203)將所述目標網(wǎng)頁判斷為非網(wǎng)址重寫的網(wǎng)頁。
19.如權(quán)利要求10至18中的任一項所述的網(wǎng)絡(luò)檢測設(shè)備(200),其中所述與所述目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址是與所述目標網(wǎng)頁的網(wǎng)址相對應的、實際不存在的網(wǎng)址。
20.如權(quán)利要求10至19中的任一項所述的網(wǎng)絡(luò)檢測設(shè)備(200),其中所述網(wǎng)址是統(tǒng)一資源定位符。
21.一種用于判斷網(wǎng)頁網(wǎng)址重寫的網(wǎng)絡(luò)檢測系統(tǒng)(1000),包括 如權(quán)利要求10-20所述的網(wǎng)絡(luò)檢測設(shè)備(200);以及 一個或者多個目標服務(wù)器(300-1,…,300-n),適于響應于 所述網(wǎng)絡(luò)檢測設(shè)備(200)提供的所述目標網(wǎng)頁的網(wǎng)址和所述錯誤 網(wǎng)址,向所述網(wǎng)絡(luò)檢測設(shè)備(200 )提供所述目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼、以及所述錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼。
全文摘要
本發(fā)明公開了一種用于判斷網(wǎng)頁網(wǎng)址重寫的方法、網(wǎng)絡(luò)檢測設(shè)備、以及網(wǎng)絡(luò)檢測系統(tǒng),其中所述方法包括以下步驟獲取目標網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼;獲取與所述目標網(wǎng)頁的網(wǎng)址相對應的錯誤網(wǎng)址所指向的錯誤網(wǎng)頁的內(nèi)容以及對應的狀態(tài)代碼;以及根據(jù)所述錯誤網(wǎng)頁的內(nèi)容與所述目標網(wǎng)頁的內(nèi)容之間的區(qū)別、或者所述錯誤網(wǎng)頁對應的狀態(tài)代碼、或者所述錯誤網(wǎng)頁對應的狀態(tài)代碼與所述目標網(wǎng)頁對應的狀態(tài)代碼之間的區(qū)別,判斷所述目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁。根據(jù)本發(fā)明的實施例,可以利用目標網(wǎng)頁以及與其相對應的錯誤網(wǎng)頁的內(nèi)容和狀態(tài)代碼,來準確有效地判斷目標網(wǎng)頁是否為網(wǎng)址重寫的網(wǎng)頁,能夠適用于各種形式的網(wǎng)址重寫的網(wǎng)頁。
文檔編號G06F17/30GK102917053SQ20121039747
公開日2013年2月6日 申請日期2012年10月18日 優(yōu)先權(quán)日2012年10月18日
發(fā)明者龍專, 趙武 申請人:北京奇虎科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
武穴市| 砀山县| 康平县| 响水县| 金昌市| 隆化县| 渭南市| 江永县| 来宾市| 拜城县| 新宾| 柳江县| 同江市| 临泉县| 上杭县| 乐东| 镇坪县| 靖江市| 长武县| 搜索| 秦皇岛市| 惠来县| 澄城县| 和硕县| 曲松县| 峡江县| 水城县| 镇远县| 北流市| 右玉县| 吴川市| 定襄县| 忻城县| 加查县| 安国市| 洛隆县| 兴化市| 桦川县| 吴旗县| 沙坪坝区| 得荣县|