專利名稱:用于網(wǎng)頁的動態(tài)及實(shí)時歸類的系統(tǒng)及方法
技術(shù)領(lǐng)域:
本申請案涉及針對內(nèi)容掃描網(wǎng)頁且更特定來說涉及一種用于在網(wǎng)頁包括動態(tài)內(nèi) 容的情況下僅針對經(jīng)更新內(nèi)容掃描網(wǎng)頁的系統(tǒng)及方法。
背景技術(shù):
因特網(wǎng)過濾是由于某些網(wǎng)站所含有的內(nèi)容而限制用戶接入所述網(wǎng)站的能力。舉例 來說,雇主可能限制雇員接入被反對或妨礙生產(chǎn)率的某些網(wǎng)站。雇主可針對雇員設(shè)定策略, 以僅允許雇員在辦公時間接入與辦公相關(guān)的網(wǎng)站。類似地,學(xué)校及父母可限制學(xué)生及孩子 僅接入年齡上適當(dāng)?shù)木W(wǎng)站。另外,因特網(wǎng)過濾用于防止用戶接入可能含有惡意內(nèi)容的網(wǎng)站。隨著網(wǎng)頁含有更 加精細(xì)的內(nèi)容,此增加惡意代碼被下載到用戶的計算機(jī)上的機(jī)會。由于操作系統(tǒng)及web瀏 覽應(yīng)用程序中的安全弱點(diǎn)被識別,因此肆無忌憚的黑客已開始編寫惡意代碼及應(yīng)用程序, 其利用這些弱點(diǎn)來將自身下載到用戶的機(jī)器上,而不依賴于用戶啟動被感染文件的任何特 定活動。此種攻擊的一個此種實(shí)例是使用嵌入到網(wǎng)頁的活動內(nèi)容對象中的惡意代碼。通常,使用自動化的過程或手動地將網(wǎng)頁內(nèi)容歸類。創(chuàng)建含有網(wǎng)站地址(URL)及 網(wǎng)站的歸類的數(shù)據(jù)庫。此數(shù)據(jù)庫規(guī)則地傳輸?shù)竭^濾用戶請求的網(wǎng)站的網(wǎng)絡(luò)裝置。然而,通 過此方法,網(wǎng)站被歸類的時間與更新被發(fā)送到所述網(wǎng)絡(luò)裝置的時間之間可存在延遲,使得 惡意或不適當(dāng)?shù)木W(wǎng)站可能被網(wǎng)絡(luò)用戶接入。為減小此延遲,已開發(fā)實(shí)時掃描技術(shù)。通過這些技術(shù),如果用戶接入未經(jīng)歸類的網(wǎng) 站,那么緊在所述網(wǎng)站被發(fā)送給用戶之前將其歸類。此準(zhǔn)許用戶緊在歸類之后接入所述網(wǎng) 站。然而,實(shí)時掃描僅適于未經(jīng)歸類的網(wǎng)站。由于因特網(wǎng)上可接入的網(wǎng)站的數(shù)目巨大,實(shí)時 分析用戶所請求的每一及每個網(wǎng)站將是不切實(shí)際的。因此,仍存先前已經(jīng)歸類的網(wǎng)站上可 存在惡意或不適當(dāng)內(nèi)容的威脅。此外,由于一些網(wǎng)站的性質(zhì)改變(例如,博客及社會性網(wǎng)絡(luò) 站點(diǎn)),網(wǎng)站的歸類可能已改變,因此其現(xiàn)在應(yīng)由網(wǎng)絡(luò)裝置阻止。
發(fā)明內(nèi)容
本發(fā)明揭示一種用于將網(wǎng)頁上的內(nèi)容歸類的系統(tǒng)及方法。所述方法包含接收來自 用戶的計算機(jī)的對網(wǎng)頁的請求。接下來,所述系統(tǒng)通過查看能夠改變所述網(wǎng)頁的地址、鏈 接、信譽(yù)、類型、樣式及其它指示符來確定所述網(wǎng)頁上是否存在動態(tài)內(nèi)容。如果所述網(wǎng)頁含 有可改變的內(nèi)容,那么掃描所述網(wǎng)頁以確定其歸類。如果所述網(wǎng)頁不具有動態(tài)內(nèi)容,那么所 述網(wǎng)頁的歸類將保持不變,或者如果所述內(nèi)容還未經(jīng)歸類,那么所述系統(tǒng)的實(shí)時歸類模塊 可將所述內(nèi)容歸類。
此外,揭示一種用于允許用戶更新網(wǎng)頁的歸類的系統(tǒng)及方法。具體來說,網(wǎng)絡(luò)管理 員指定可信任將網(wǎng)頁歸類的用戶。接著所述用戶能夠改變網(wǎng)頁的歸類而不需要網(wǎng)絡(luò)管理員 的預(yù)先批準(zhǔn)。
在本說明中,參照其中貫穿所有圖式使用相同編號指定相同部件的圖式。圖1是顯示用于網(wǎng)頁上的內(nèi)容的動態(tài)歸類的系統(tǒng)的圖示。圖2、圖3及圖4圖解說明使用圖1中所示的系統(tǒng)的動態(tài)歸類的過程。圖5是顯示用于網(wǎng)頁上的內(nèi)容的實(shí)時歸類的系統(tǒng)的圖示。圖6、圖7、圖8及圖9圖解說明使用圖5中所示的系統(tǒng)的網(wǎng)頁的內(nèi)容的實(shí)時歸類 的過程。圖10是顯示用于網(wǎng)頁上的內(nèi)容的用戶歸類的系統(tǒng)的圖表。
具體實(shí)施例方式以下詳細(xì)說明針對本發(fā)明的某些具體實(shí)施例。然而,可以如權(quán)利要求書所定義及 涵蓋的許多不同方式來體現(xiàn)本發(fā)明。圖1是顯示可如何實(shí)施網(wǎng)頁的動態(tài)歸類的圖示。應(yīng)理解,下文所描述的模塊可經(jīng) 由網(wǎng)絡(luò)在單個計算機(jī)或多個計算機(jī)上以軟件或硬件實(shí)施,如所屬技術(shù)領(lǐng)域中普遍已知。使 用計算機(jī)的用戶10向與因特網(wǎng)14通信的網(wǎng)關(guān)模塊12請求網(wǎng)頁。網(wǎng)關(guān)模塊12通常位于用 戶的局部網(wǎng)絡(luò)與因特網(wǎng)之間且控制其之間的業(yè)務(wù)流動。網(wǎng)關(guān)模塊12借助web過濾器16來 確認(rèn)用戶的請求以確定所述網(wǎng)頁的內(nèi)容是否已經(jīng)歸類。具體來說,web過濾器16確定網(wǎng)頁 內(nèi)容先前是否已經(jīng)掃描及內(nèi)容是否已經(jīng)歸類。web過濾器16可含有先前經(jīng)掃描網(wǎng)頁的網(wǎng)頁 地址(URL)與其對應(yīng)歸類的數(shù)據(jù)庫。如果所述網(wǎng)頁的內(nèi)容還未經(jīng)掃描,那么需要將所述網(wǎng) 頁歸類以確定用戶10是否應(yīng)能夠接入所述網(wǎng)頁。如果所述網(wǎng)頁的URL不在先前經(jīng)歸類網(wǎng) 頁的數(shù)據(jù)庫中或如果知道所述網(wǎng)頁上的內(nèi)容動態(tài)地改變,那么web過濾器16指令網(wǎng)關(guān)模塊 16將所述網(wǎng)頁內(nèi)容發(fā)送到動態(tài)歸類服務(wù)器模塊18。具有動態(tài)內(nèi)容的網(wǎng)頁是那些具有基于 用戶交互(例如,帖子、博客、照片等)而頻繁地改變的內(nèi)容的網(wǎng)頁。網(wǎng)頁的地址、網(wǎng)頁的安 全性、網(wǎng)頁的信譽(yù)及網(wǎng)頁上所含有的內(nèi)容全部可以是動態(tài)內(nèi)容的指示符。舉例來說,社會性 網(wǎng)絡(luò)網(wǎng)站可被視為是動態(tài)的,因?yàn)橛脩舨粩嗟刭N出新材料。因此,應(yīng)頻繁地分析社會性網(wǎng)絡(luò) 網(wǎng)站的內(nèi)容以確保歸類恰當(dāng)。為容易地將網(wǎng)頁分類為是動態(tài)的,可將已知動態(tài)網(wǎng)頁(例如, 社會性網(wǎng)絡(luò)站點(diǎn))的地址存儲于web過濾器16中。如果網(wǎng)頁內(nèi)容還未經(jīng)歸類或web過濾器16確定網(wǎng)頁由于動態(tài)內(nèi)容而需要經(jīng)重新 歸類,那么web過濾器16借助網(wǎng)關(guān)12向因特網(wǎng)14請求網(wǎng)頁的內(nèi)容。一旦網(wǎng)關(guān)12接收到 網(wǎng)頁的內(nèi)容,那么其將所述內(nèi)容發(fā)送到動態(tài)歸類服務(wù)器模塊18以用于分類。通過僅掃描及 分析具有動態(tài)內(nèi)容的網(wǎng)頁,可極大地改善系統(tǒng)的性能,因?yàn)橄惹敖?jīng)歸類網(wǎng)頁不需要重新掃 描及重新歸類。動態(tài)歸類模塊18掃描網(wǎng)頁以分析內(nèi)容且確定所述網(wǎng)頁的恰當(dāng)歸類。舉例來說,動 態(tài)歸類模塊18可查看關(guān)鍵詞及鏈接來確定所述網(wǎng)頁的類別。動態(tài)歸類模塊18也可將內(nèi) 容發(fā)送到中心實(shí)體20來進(jìn)行歸類。一旦已將網(wǎng)頁歸類,那么將結(jié)果發(fā)送到web過濾器16。
5web過濾器16可存儲所述結(jié)果以用于用戶10的未來請求。web過濾器16接著針對用戶先 前請求時網(wǎng)頁的類別來獲得用于用戶10的策略。web過濾器16可阻止或允許所述網(wǎng)頁, 此取決于所述策略及所述網(wǎng)頁的歸類。舉例來說,如果所述網(wǎng)頁被分類為“色情”且針對類 別“色情”的用戶的策略是阻止所述頁面,那么web過濾器16將阻止用戶10接入到所述頁 面。然而,如果用于所述用戶的策略允許所述類別,那么將準(zhǔn)予用戶10接入。前述實(shí)例將網(wǎng)頁描述為具有作為整體的內(nèi)容。然而,應(yīng)認(rèn)識到,可按不同區(qū)段來阻 止及允許網(wǎng)頁上的內(nèi)容。舉例來說,許多網(wǎng)頁從許多不同源接收內(nèi)容。對于這些類型的網(wǎng) 頁,個別條內(nèi)容中的每一者可個別地由網(wǎng)關(guān)模塊12接收且由web過濾器16及動態(tài)歸類服 務(wù)器模塊18來歸類,以使得每一條內(nèi)容具有其自己的歸類且可獨(dú)立于網(wǎng)頁上的其它內(nèi)容 被阻止或允許。在此種系統(tǒng)中,每一區(qū)段的URL可被視為單獨(dú)的網(wǎng)頁,以使得網(wǎng)頁上的所有 URL的組合組成整個頁面。圖2及圖3圖解說明內(nèi)容被允許的情況下的圖1中所示系統(tǒng)的過程且圖4圖解說 明內(nèi)容被阻止的情況下的過程。具體來說,圖2顯示用戶向網(wǎng)關(guān)模塊12進(jìn)行請求,網(wǎng)關(guān)模塊12又借助web過濾器 16來執(zhí)行HTTP查找。如果所述請求有效,那么網(wǎng)關(guān)模塊12將從因特網(wǎng)14檢索內(nèi)容。接下 來,動態(tài)歸類服務(wù)器模塊18使用鏈接分析、關(guān)鍵詞、從中心實(shí)體的查找及內(nèi)容的其它指示 符來確定所述內(nèi)容的歸類。一旦確定了所述歸類,則所述內(nèi)容是允許的并被發(fā)送回用戶且 記入結(jié)果。圖3包括借助web過濾器16來記入結(jié)果以使得所述結(jié)果可用于未來查找的步 驟。圖4進(jìn)一步包含在用戶未被授權(quán)觀看所述頁面的情況下將阻止頁面通知發(fā)送到用戶或 將向所述用戶發(fā)送網(wǎng)頁,以指示所述用戶可在有限持續(xù)時間內(nèi)觀看所述網(wǎng)頁。如果用戶請 求在有限持續(xù)時間內(nèi)觀看所述頁面,那么所述內(nèi)容將被遞送到所述用戶且記入結(jié)果。圖5圖解說明用于來自網(wǎng)頁的內(nèi)容的實(shí)時歸類的系統(tǒng)。用戶10向內(nèi)容網(wǎng)關(guān)模塊 12進(jìn)行對含有內(nèi)容的網(wǎng)頁的請求。內(nèi)容網(wǎng)關(guān)模塊12借助web過濾器16來確認(rèn)所述請求 以確定所述內(nèi)容是否已經(jīng)歸類。如果所述內(nèi)容還未經(jīng)歸類,那么web過濾器16請求內(nèi)容網(wǎng) 關(guān)12以從因特網(wǎng)14獲得所述內(nèi)容。內(nèi)容網(wǎng)關(guān)模塊12接著將所述內(nèi)容發(fā)送到實(shí)時歸類服 務(wù)器模塊22以進(jìn)行歸類。歸類服務(wù)器模塊22使用鏈接分析、關(guān)鍵詞及其它語言分析學(xué)來 確定所述網(wǎng)頁上的所述內(nèi)容的歸類。來自中心實(shí)體20的更新使得歸類服務(wù)器模塊22能夠 正確地確定并歸類所述網(wǎng)頁的所述內(nèi)容。歸類服務(wù)器模塊22將歸類結(jié)果發(fā)送到內(nèi)容網(wǎng)關(guān)12。web過濾器16接著接收用戶 10的關(guān)于所述內(nèi)容的類別的策略以確定阻止還是允許所述內(nèi)容。接著將允許或阻止策略從 web過濾器16傳輸?shù)絻?nèi)容網(wǎng)關(guān)模塊12以阻止或允許用戶10接入到所述網(wǎng)頁的所述內(nèi)容。 應(yīng)認(rèn)識到,可將動態(tài)歸類服務(wù)器模塊18與實(shí)時歸類服務(wù)器模塊22組合于同一系統(tǒng)中以向 還未經(jīng)歸類的網(wǎng)頁提供實(shí)時歸類。圖6圖解說明在所述網(wǎng)頁上的所述內(nèi)容由實(shí)時歸類服務(wù)器模塊22使用圖5的系 統(tǒng)確定為是惡意的情況下的過程。具體來說,用戶10向內(nèi)容網(wǎng)關(guān)12進(jìn)行請求。web過濾 器16執(zhí)行HTTP查找且接著內(nèi)容網(wǎng)關(guān)12從因特網(wǎng)14檢索所述內(nèi)容。網(wǎng)關(guān)12接著將所述 內(nèi)容發(fā)送到實(shí)時歸類服務(wù)器模塊22,實(shí)時歸類服務(wù)器模塊22執(zhí)行所述內(nèi)容的即刻歸類。如 果實(shí)時歸類服務(wù)器模塊22檢測到惡意內(nèi)容,那么內(nèi)容網(wǎng)關(guān)12將被阻止頁面消息返回到用 戶10且記入結(jié)果。
圖7及圖8顯示如何使用圖5的系統(tǒng)阻止來自網(wǎng)頁的內(nèi)容。圖9顯示在對于用戶 10來說用于觀看網(wǎng)頁的配額系統(tǒng)在作用中的情況下圖5的系統(tǒng)如何操作。舉例來說,圖5 的系統(tǒng)可具有用于用戶10的允許在規(guī)定時間周期內(nèi)接入到正常被阻止的內(nèi)容的策略。此 時間通常稱為“配額時間”。參照圖10,其顯示用于基于用戶的建議來將網(wǎng)頁內(nèi)容歸類的系統(tǒng)。替代使用網(wǎng)站 的實(shí)時分類,用戶10也可對未經(jīng)歸類網(wǎng)頁的歸類提出建議。具體來說,用戶10向因特網(wǎng)14 請求未經(jīng)歸類站點(diǎn)。web過濾器16辨識所述請求且檢索所述站點(diǎn),因?yàn)槠湮唇?jīng)歸類。用戶 可接著向管理員28提出恰當(dāng)歸類。管理員28接著改變web過濾器16的數(shù)據(jù)庫中的歸類。 在此實(shí)例中,用戶10不具有改變網(wǎng)頁的歸類的授權(quán),因?yàn)橛脩?0是不被信任的。僅管理員 28可改變歸類。web過濾器16將歸類傳輸?shù)街行膶?shí)體20以將歸類應(yīng)用及發(fā)布給其它者。還涵蓋管理員28準(zhǔn)予用戶10 “歸類”接入。在此情形中,管理員28確定可信任 用戶10將未經(jīng)歸類站點(diǎn)的內(nèi)容歸類。此允許用戶10將接著被自動發(fā)布到web過濾器16 的數(shù)據(jù)庫且發(fā)送到中心實(shí)體20的網(wǎng)站歸類,而不需要管理員28的任何進(jìn)一步批準(zhǔn)。所屬領(lǐng)域的技術(shù)人員應(yīng)認(rèn)識到,結(jié)合本文中所揭示實(shí)施例描述的各種說明性邏輯 塊、模塊、電路及算法步驟可實(shí)施為電子硬件、計算機(jī)軟件或兩者的組合。為清楚地圖解說 明硬件與軟件的此互換性,上文已按照其功能性大體描述了各種說明性組件、塊、模塊、電 路及步驟。此種功能性實(shí)施為硬件還是軟件取決于特定應(yīng)用及施加于整個系統(tǒng)的設(shè)計約束 條件。技術(shù)人員可針對每一特定應(yīng)用以不同方式實(shí)施所描述的功能性,但不應(yīng)將此類實(shí) 施方案決策解釋為導(dǎo)致背離本發(fā)明的范圍。結(jié)合本文中所揭示實(shí)施例描述的各種說明性邏 輯塊、模塊及電路可以以下裝置實(shí)施或執(zhí)行通用處理器、數(shù)字信號處理器(DSP)、專用集 成電路(ASIC)、現(xiàn)場可編程門陣列(FPGA)或其它可編程邏輯裝置、離散門或晶體管邏輯、 離散硬件組件或其設(shè)計用于執(zhí)行本文中所描述功能的任一組合。通用處理器可為微處理器,但或者,處理器可為任何常規(guī)處理器、控制器、微控制 器或狀態(tài)機(jī)。處理器也可實(shí)施為計算裝置的組合,例如,DSP與微處理器的組合、多個微處 理器的組合、一個或一個以上微處理器與DSP核心的聯(lián)合或任一其它此種配置。結(jié)合本文中所揭示實(shí)施例描述的方法或算法的步驟可直接在硬件、在由處理器執(zhí) 行的軟件模塊中或兩者的組合中體現(xiàn)。軟件模塊可駐存于RAM存儲器、快閃存儲器、ROM存 儲器、EPROM存儲器、EEPROM存儲器、寄存器、硬磁盤、可拆卸式磁盤、⑶ROM或所屬技術(shù)領(lǐng)域 中已知的任一其它形式的存儲媒體內(nèi)。例示性存儲媒體耦合到該處理器,以使該處理器可 從該存儲媒體讀取信息及向該存儲媒體寫入信息?;蛘?,該存儲媒體可以是處理器的組成 部分。所述處理器及所述存儲媒體可駐存于ASIC中。所述ASIC可駐存于用戶終端或某其 它類型的裝置中?;蛘?,處理器及存儲媒體可作為離散組件駐存于用戶終端中。雖然以上詳細(xì)說明已顯示、描述及指出本發(fā)明的適用于各種實(shí)施例的新穎特征, 然而應(yīng)理解,所屬領(lǐng)域的技術(shù)人員可在不背離本發(fā)明的精神的情況下在形式及細(xì)節(jié)上對所 圖解說明的裝置或過程作出各種省略、替代及改變。應(yīng)認(rèn)識到,由于可獨(dú)立于其它特征使用 或?qū)嵺`一些特征,因此可以一種并不提供所有本文所述特征及益處的形式體現(xiàn)本發(fā)明。本 發(fā)明的范圍由所附權(quán)利要求書而非由上文說明來指示。歸屬于權(quán)利要求書的等效物的意義 及范圍內(nèi)的所有改變均將涵蓋在權(quán)利要求書的范圍內(nèi)。
權(quán)利要求
1.一種用于使用動態(tài)歸類計算機(jī)系統(tǒng)將網(wǎng)頁上的動態(tài)內(nèi)容歸類的方法,所述方法包含接收來自具有所述動態(tài)歸類系統(tǒng)的用戶的計算機(jī)的對網(wǎng)頁的請求;確定所述網(wǎng)頁是否含有動態(tài)內(nèi)容;如果所述網(wǎng)頁含有動態(tài)內(nèi)容,那么分析所述網(wǎng)頁的所述內(nèi)容;及如果所述網(wǎng)頁含有動態(tài)內(nèi)容,那么確定所述內(nèi)容的所述歸類。
2.根據(jù)權(quán)利要求1所述的方法,其中所述確定所述網(wǎng)頁是否含有動態(tài)內(nèi)容的步驟包含 分析所述網(wǎng)頁的信譽(yù)。
3.根據(jù)權(quán)利要求1所述的方法,其中所述確定所述網(wǎng)頁是否含有動態(tài)內(nèi)容的步驟包含 分析所述網(wǎng)頁的地址。
4.根據(jù)權(quán)利要求1所述的方法,其中所述確定所述網(wǎng)頁是否含有動態(tài)內(nèi)容的步驟包含 分析所述網(wǎng)頁上的所述內(nèi)容以確定所述內(nèi)容是否可容易地改變。
5.根據(jù)權(quán)利要求1所述的方法,其中所述網(wǎng)頁包括多個區(qū)段,且分析并歸類每一區(qū)段 的所述內(nèi)容。
6.根據(jù)權(quán)利要求1所述的方法,其進(jìn)一步包含響應(yīng)于所述網(wǎng)頁的所述歸類而允許所述 用戶的計算機(jī)接入到所述網(wǎng)頁的步驟。
7.根據(jù)權(quán)利要求6所述的方法,其中所述允許接入的步驟進(jìn)一步包含在所述內(nèi)容為惡 意的情況下阻止接入。
8.一種用于借助計算機(jī)系統(tǒng)將網(wǎng)頁上的內(nèi)容歸類的系統(tǒng),所述系統(tǒng)包含內(nèi)容網(wǎng)關(guān)模塊,其經(jīng)配置以接收來自用戶的計算機(jī)的對網(wǎng)頁的請求;web過濾器模塊,其與所述內(nèi)容網(wǎng)關(guān)模塊通信,所述web過濾器模塊經(jīng)配置以存儲所述 網(wǎng)頁的所述歸類且確定所述網(wǎng)頁是否含有動態(tài)內(nèi)容;及動態(tài)歸類模塊,其與所述web過濾器模塊及所述內(nèi)容網(wǎng)關(guān)模塊通信,所述動態(tài)歸類模 塊經(jīng)配置以在所述網(wǎng)頁含有動態(tài)內(nèi)容的情況下將所述網(wǎng)頁歸類。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其中所述內(nèi)容網(wǎng)關(guān)經(jīng)配置以響應(yīng)于所述網(wǎng)頁的所述歸 類而向所述用戶提供接入。
10.根據(jù)權(quán)利要求8所述的系統(tǒng),其中所述web過濾器模塊經(jīng)配置以通過分析所述網(wǎng)頁 的信譽(yù)來確定所述網(wǎng)頁是否含有動態(tài)內(nèi)容。
11.根據(jù)權(quán)利要求8所述的系統(tǒng),其中所述web過濾器模塊經(jīng)配置以通過分析所述網(wǎng)頁 的地址來確定所述網(wǎng)頁是否含有動態(tài)內(nèi)容。
12.根據(jù)權(quán)利要求9所述的系統(tǒng),其中所述web過濾器模塊經(jīng)配置以通過分析所述網(wǎng)頁 上的所述內(nèi)容以確定所述內(nèi)容是否可容易地改變來確定所述網(wǎng)頁是否含有動態(tài)內(nèi)容。
13.根據(jù)權(quán)利要求9所述的系統(tǒng),其中所述網(wǎng)頁含有多個區(qū)段,且每一區(qū)段的所述內(nèi)容 是由所述web過濾器來分析。
14.根據(jù)權(quán)利要求9所述的系統(tǒng),其進(jìn)一步包含實(shí)時歸類服務(wù)器模塊,所述實(shí)時歸類服 務(wù)器模塊經(jīng)配置以將所述網(wǎng)頁的所述動態(tài)內(nèi)容歸類。
15.根據(jù)權(quán)利要求14所述的系統(tǒng),其中所述動態(tài)歸類模塊經(jīng)配置以在所述內(nèi)容為動態(tài) 的情況下將所述網(wǎng)頁的每一區(qū)段歸類。
16.一種用于確定網(wǎng)頁上的動態(tài)內(nèi)容的系統(tǒng),所述系統(tǒng)包含具有動態(tài)歸類模塊的計算機(jī),所述動態(tài)歸類模塊經(jīng)配置以在網(wǎng)頁含有為動態(tài)的內(nèi)容的情況下分析所述網(wǎng)頁的所述內(nèi)容。
17.根據(jù)權(quán)利要求16所述的系統(tǒng),其進(jìn)一步包含web過濾器模塊,所述web過濾器模塊 經(jīng)配置以在所述網(wǎng)頁上的所述內(nèi)容可容易地改變的情況下確定所述內(nèi)容為動態(tài)的。
18.根據(jù)權(quán)利要求17所述的系統(tǒng),其中所述web過濾器模塊經(jīng)配置以分析所述網(wǎng)頁內(nèi) 容的地址以確定所述內(nèi)容是否為動態(tài)的。
19.根據(jù)權(quán)利要求18所述的系統(tǒng),其進(jìn)一步包含實(shí)時歸類服務(wù)器模塊,所述實(shí)時歸類 服務(wù)器模塊經(jīng)配置以將所述網(wǎng)頁的所述內(nèi)容歸類。
全文摘要
本發(fā)明揭示一種用于將網(wǎng)頁上的內(nèi)容歸類的系統(tǒng)及方法。所述方法包含接收來自用戶的計算機(jī)的對網(wǎng)頁的請求。接下來,所述系統(tǒng)通過分析能夠容易地改變所述網(wǎng)頁的地址、鏈接、信譽(yù)、類型、樣式及其它指示符來確定所述網(wǎng)頁上是否存在動態(tài)內(nèi)容。如果所述網(wǎng)頁含有可改變的內(nèi)容,那么分析所述網(wǎng)頁以確定其當(dāng)前歸類。如果所述網(wǎng)頁不具有動態(tài)內(nèi)容,那么所述網(wǎng)頁的所述歸類將保持不變,從而通過僅分析動態(tài)網(wǎng)頁來釋放系統(tǒng)資源。
文檔編號G06F17/30GK102077201SQ200980125479
公開日2011年5月25日 申請日期2009年6月29日 優(yōu)先權(quán)日2008年6月30日
發(fā)明者丹·拉斯金, 丹尼爾·萊爾·哈伯德 申請人:網(wǎng)圣公司