欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用于確定網(wǎng)頁訪問請求的方法、裝置及設(shè)備的制作方法

文檔序號:6353117閱讀:324來源:國知局
專利名稱:一種用于確定網(wǎng)頁訪問請求的方法、裝置及設(shè)備的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)頁瀏覽技術(shù),尤其涉及一種用于確定網(wǎng)頁訪問請求的方法、裝置及 設(shè)備。
背景技術(shù)
當(dāng)前許多網(wǎng)頁中都包含了 JS、Applet、AjaX、VBscript等可執(zhí)行對象,而對于該等 可執(zhí)行對象,需要瀏覽器在獲得初步網(wǎng)頁信息的基礎(chǔ)上發(fā)起多次網(wǎng)頁請求才能完整的獲取 網(wǎng)頁內(nèi)容。當(dāng)前的現(xiàn)有技術(shù)是對所有網(wǎng)頁都執(zhí)行二次請求,但事實上,許多網(wǎng)頁中并不包含 需要多次請求的可執(zhí)行對象,對這些網(wǎng)頁進(jìn)行多次請求會增加網(wǎng)絡(luò)帶寬負(fù)擔(dān),耗費更多的 時間。因此,需要一種預(yù)判斷技術(shù),來判斷網(wǎng)頁是否需要多次請求,以達(dá)到節(jié)約網(wǎng)絡(luò)帶 寬,并提高瀏覽效率與用戶體驗的目的。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于涉及確定網(wǎng)頁訪問請求的方法與設(shè)備。根據(jù)本發(fā)明的一個方面,提供一種計算機實現(xiàn)的用于確定網(wǎng)頁訪問請求的方法, 其中,該方法包括以下步驟a獲取網(wǎng)頁信息;b當(dāng)檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象,判斷該網(wǎng)頁信 息是否符合預(yù)定條件;-當(dāng)所述網(wǎng)頁信息符合該預(yù)定條件時,發(fā)起與該可執(zhí)行對象相對應(yīng)的網(wǎng)頁訪問請 求。根據(jù)本發(fā)明的另一個方面,還提供了一種用于確定網(wǎng)頁訪問請求的訪問裝置,其 中,該訪問裝置包括第一獲取裝置、用于獲取網(wǎng)頁信息;判斷裝置、用于當(dāng)檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象, 判斷該網(wǎng)頁信息是否符合預(yù)定條件;第一請求發(fā)起裝置、用于當(dāng)所述網(wǎng)頁信息符合該預(yù)定條件時,發(fā)起與該可執(zhí)行對 象相對應(yīng)的網(wǎng)頁訪問請求。與現(xiàn)有技術(shù)相比,本發(fā)明具有以下優(yōu)點1)能夠快速根據(jù)已獲得的網(wǎng)頁信息判斷 該網(wǎng)頁信息所屬網(wǎng)頁是否為可能觸發(fā)進(jìn)一步請求的網(wǎng)頁,并根據(jù)判斷結(jié)果,僅對可能觸發(fā) 進(jìn)一步請求的網(wǎng)頁發(fā)起下一次請求,從而節(jié)約網(wǎng)絡(luò)帶寬,提高網(wǎng)頁訪問效率;幻根據(jù)本發(fā) 明的方案能夠依據(jù)多層級的預(yù)定條件來對網(wǎng)頁信息是否可能觸發(fā)下次網(wǎng)頁請求進(jìn)行判定, 使得判定的結(jié)果更加準(zhǔn)確;幻根據(jù)本發(fā)明的方案能夠在多種應(yīng)用中輔助相應(yīng)設(shè)備減少網(wǎng) 頁請求次數(shù),提高訪問效率,例如,能夠大大減少網(wǎng)絡(luò)蜘蛛請求網(wǎng)頁信息的次數(shù),提高網(wǎng)頁 蜘蛛獲取網(wǎng)頁的速度;或者,在用戶瀏覽網(wǎng)頁時,減少瀏覽器請求網(wǎng)頁的次數(shù),提高了用戶瀏覽體驗等。


通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細(xì)描述,本發(fā)明的其它 特征、目的和優(yōu)點將會變得更明顯圖1為本發(fā)明一個方面的計算機實現(xiàn)的用于確定網(wǎng)頁訪問請求的方法流程圖;圖2為本發(fā)明一個優(yōu)選實施例的用于確定網(wǎng)頁訪問請求的方法流程圖;圖3為本發(fā)明另一個優(yōu)選實施例的用于確定網(wǎng)頁訪問請求的方法流程圖;圖4示意出了本發(fā)明另一個方面的用于確定網(wǎng)頁訪問請求的訪問裝置的結(jié)構(gòu)示 意圖;圖5示意出了本發(fā)明一個優(yōu)選實施例的用于確定網(wǎng)頁訪問請求的訪問裝置的結(jié) 構(gòu)示意圖;圖6示意出了本發(fā)明另一個優(yōu)選實施例的用于確定網(wǎng)頁訪問請求的訪問裝置的 結(jié)構(gòu)示意圖。 附圖中相同或相似的附圖標(biāo)記代表相同或相似的部件。
具體實施例方式下面結(jié)合附圖對本發(fā)明作進(jìn)一步詳細(xì)描述。圖1示意出了本發(fā)明一個方面的計算機實現(xiàn)的用于確定網(wǎng)頁訪問請求的方法流 程圖。其中,根據(jù)本發(fā)明的方法可通過計算機設(shè)備中的操作系統(tǒng)或處理控制器來完成,為簡 明起見,以下將所述操作系統(tǒng)或處理控制器統(tǒng)稱為訪問裝置。其中,該計算機設(shè)備包括但不 限于1)用戶設(shè)備;2)網(wǎng)絡(luò)設(shè)備。所述用戶設(shè)備包括但不限于計算機、智能手機、PDA等;所 述網(wǎng)絡(luò)設(shè)備包括但不限于單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器組成的服務(wù)器組或基于云計算 (Cloud Computing)的由大量計算機或網(wǎng)絡(luò)服務(wù)器構(gòu)成的云,其中,云計算是分布式計算的 一種,由一群松散耦合的計算機集組成的一個超級虛擬計算機。在步驟Sl中,訪問裝置獲取網(wǎng)頁信息。其中,所述獲取網(wǎng)頁信息的方式包括但不 限于1)訪問裝置根據(jù)所獲取的地址信息來向?qū)?yīng)的網(wǎng)頁服務(wù)器進(jìn)行一次網(wǎng)頁獲取請求 而獲得;幻訪問裝置讀取保存于訪問裝置或與訪問裝置物理分離但通信連接的裝置中的 網(wǎng)頁信息。在步驟S2中,當(dāng)訪問裝置檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí) 行對象,判斷該網(wǎng)頁信息是否符合預(yù)定條件。其中,所述可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象包 括基于Java、JS、Ajax和/或VBscript的對象;所述檢測方式包括但不限于分析所獲得的 網(wǎng)頁信息中是否包含與可執(zhí)行對象相對應(yīng)的代碼或標(biāo)簽等可執(zhí)行對象的標(biāo)識信息。例如,預(yù)定條件為網(wǎng)頁信息中包含關(guān)鍵詞“試聽”并且網(wǎng)頁信息對應(yīng)的網(wǎng)頁的URL 中包括以下任一字符串“mp3”、“rm”、“Wn^^r‘a(chǎn)pe”。訪問裝置檢測已獲得的網(wǎng)頁信息,并 在網(wǎng)頁信息中查詢得到j(luò)avascript的標(biāo)簽,則訪問裝置判斷所述網(wǎng)頁信息中包括可能觸 發(fā)網(wǎng)頁訪問的可執(zhí)行對象JS,并繼續(xù)判斷該網(wǎng)頁信息是否符合預(yù)定條件。訪問裝置對網(wǎng)頁 信息及所述網(wǎng)頁信息所對應(yīng)網(wǎng)頁的URL進(jìn)行分析,在網(wǎng)頁信息中查詢得到關(guān)鍵詞“試聽”, 并且在所述URL中查詢得到字符串“wma”,則訪問裝置判定所述網(wǎng)頁信息符合預(yù)定條件。
又例如,預(yù)定條件為網(wǎng)頁信息代碼中同時包含字符串“playlist”及字符 串“object”。訪問裝置在已獲得的網(wǎng)頁信息中查詢與可執(zhí)行對象對應(yīng)的代碼,并獲得 Vbscript的標(biāo)簽,則訪問裝置判定所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象 Vbscript,并繼續(xù)判斷該網(wǎng)頁信息是否符合預(yù)定條件,即判斷該網(wǎng)頁信息是否同時包含字 符串“playlist”及字符串“object”。當(dāng)訪問裝置在網(wǎng)頁信息的代碼部分中查詢到字符串“playlist”及字符串“object”,即網(wǎng)頁信息所包含的代碼信息中同時包含了字符 串“playlist”及字符串“object”,則訪問裝置判定網(wǎng)頁信息符合預(yù)定條件。其中,訪問裝 置可根據(jù)網(wǎng)頁信息中的標(biāo)識信息來確定網(wǎng)頁信息中的代碼部分。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限 制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何通過檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的 可執(zhí)行對象,判斷該網(wǎng)頁信息是否符合預(yù)定條件的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。在步驟S3中,當(dāng)所述網(wǎng)頁信息符合該預(yù)定條件時,訪問裝置發(fā)起與該可執(zhí)行對象 相對應(yīng)的網(wǎng)頁訪問請求。例如,對包含JS可執(zhí)行對象的網(wǎng)頁信息,當(dāng)訪問裝置判定符合所述網(wǎng)頁信息符合 預(yù)定條件時,則根據(jù)所述JS可執(zhí)行對象,向網(wǎng)頁信息所對應(yīng)網(wǎng)頁的服務(wù)器發(fā)起JS請求。又例如,如訪問裝置判定符合預(yù)定條件的網(wǎng)頁信息中包括可執(zhí)行對象JS及可執(zhí) 行對象Applet,則瀏覽器向所述網(wǎng)頁信息所對應(yīng)網(wǎng)頁的服務(wù)器分別發(fā)起JS請求和Applet 請求。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限 制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何當(dāng)所述網(wǎng)頁信息符合該預(yù)定條件時,發(fā)起與該可執(zhí)行對 象相對應(yīng)的網(wǎng)頁訪問請求的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。作為本發(fā)明的優(yōu)選方案之一,其中,根據(jù)本發(fā)明的方法還包括步驟S10(圖未示)、 步驟Sll(圖未示)、步驟S12(圖未示)和步驟S13(圖未示)。在步驟SlO中,當(dāng)判斷一個網(wǎng)頁信息符合該預(yù)定條件時,訪問裝置根據(jù)該網(wǎng)頁信 息所屬網(wǎng)頁的地址信息來建立或更新網(wǎng)頁類別庫。具體的,當(dāng)訪問裝置判定一個網(wǎng)頁信息符合該預(yù)定條件時,若訪問裝置已獲取該 網(wǎng)頁信息所屬網(wǎng)頁的地址信息,則訪問裝置將該地址信息添加或更新至網(wǎng)頁類別庫中,若 訪問裝置未獲取該網(wǎng)頁信息所屬網(wǎng)頁的地址信息,則訪問裝置進(jìn)一步獲取所述地址信息, 并將所述地址信息加入網(wǎng)頁類別庫中。在步驟Sll中,訪問裝置獲取一個新網(wǎng)頁信息及其所屬網(wǎng)頁的地址信息。具體的,獲取所述新網(wǎng)頁信息及其所屬網(wǎng)頁的地址信息的方式包括但不限于1) 訪問裝置由預(yù)設(shè)的網(wǎng)頁信息庫中獲取網(wǎng)頁信息,并根據(jù)網(wǎng)頁信息進(jìn)行搜索來獲得所述網(wǎng)頁 信息所屬網(wǎng)頁的地址信息;2)訪問裝置由預(yù)設(shè)的網(wǎng)頁信息庫中獲取網(wǎng)頁信息,并在已有的 與網(wǎng)頁信息相對應(yīng)的數(shù)據(jù)庫中進(jìn)行查詢來獲得所述網(wǎng)頁信息所屬網(wǎng)頁的地址信息;3)訪 問裝置獲取所述地址信息,并根據(jù)所述地址信息來獲取所述新網(wǎng)頁信息等。接著,在步驟S12中,訪問裝置基于所獲取的網(wǎng)頁的地址信息來在所述網(wǎng)頁類別 庫中進(jìn)行查詢,以獲得查詢結(jié)果。接著,在步驟S13中,當(dāng)查詢結(jié)果為匹配時,訪問裝置對該新網(wǎng)頁信息中的可執(zhí)行 對象發(fā)起相對應(yīng)的網(wǎng)頁訪問請求。其中,所述匹配表示所述新網(wǎng)頁信息所屬網(wǎng)頁的地址信息與網(wǎng)頁類別庫中的地址信息完全匹配。具體的,當(dāng)在網(wǎng)頁類別庫中查詢到新網(wǎng)頁信息所屬網(wǎng)頁的地址信息,則訪問裝置 進(jìn)一步獲取新網(wǎng)頁信息中所包含的各類可執(zhí)行對象信息,并根據(jù)所述可執(zhí)行對象的信息發(fā) 起相應(yīng)的網(wǎng)頁訪問請求。根據(jù)本實施例的方法,訪問裝置對于所請求的網(wǎng)頁信息,能夠快速判定其所屬網(wǎng) 頁是否為可能觸發(fā)進(jìn)一步請求的網(wǎng)頁,并根據(jù)判斷結(jié)果,僅對可能觸發(fā)進(jìn)一步請求的網(wǎng)頁 發(fā)起下一次請求,可以較大的提高網(wǎng)頁的訪問效率。例如,在網(wǎng)絡(luò)蜘蛛或爬蟲等爬取網(wǎng)頁信 息時,通過采用本發(fā)明的方案,能夠大大減少網(wǎng)頁請求次數(shù),提高爬取速遞,減少網(wǎng)絡(luò)帶寬 的消耗;或者,在用戶訪問網(wǎng)頁時,加快網(wǎng)頁生成速度,改善用戶體驗。圖2示意出了本發(fā)明一個優(yōu)選實施例的用于確定網(wǎng)頁訪問請求的方法流程圖。根 據(jù)本實施例的方法包括步驟Si、步驟S4、步驟S2、步驟S3。步驟Sl已在參照圖1所示實施例中予以詳述,并以引用的方式包含于此,不再贅 述。在步驟S4中,訪問裝置獲取所述網(wǎng)頁信息中所包含的預(yù)定文本信息的數(shù)量。其中,所述預(yù)定文本信息包括以下至少一類1)短文本信息;2)短文本信息組合。獲取所述預(yù)定文本信息數(shù)量的方式包括但不限于在網(wǎng)頁信息中查詢預(yù)定文本信 息并累計所有預(yù)定文本信息的出現(xiàn)次數(shù)。例如,預(yù)定文本信息包括“歌曲”、“試聽”、“熱門點播”、“mp3”、“新歌在線”;第一預(yù)
定閾值為10。訪問裝置在網(wǎng)頁信息中查詢前述預(yù)定文本信息,獲得網(wǎng)頁信息中出現(xiàn)“歌曲” 的次數(shù)為5次,獲得網(wǎng)頁信息中出現(xiàn)“試聽”的次數(shù)為3次,獲得網(wǎng)頁信息中出現(xiàn)“熱門點 播”的次數(shù)為3次,則訪問裝置獲得的預(yù)定文本信息數(shù)量共計為11。接著,在步驟S2中,當(dāng)訪問裝置檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的 可執(zhí)行對象,判斷該網(wǎng)頁信息是否符合預(yù)定條件。其中,所述預(yù)定條件包括所述網(wǎng)頁信息 所包含的預(yù)定文本信息數(shù)量大于或等于第一預(yù)定閾值,所述第一預(yù)定閾值應(yīng)可由本領(lǐng)域技 術(shù)人員根據(jù)實際情況及需求來確定。例如,若第一預(yù)定閾值為10,在前述步驟S4中所得的預(yù)定文本信息數(shù)量為11,則 訪問裝置判定獲得的網(wǎng)頁信息符合預(yù)定條件。需要說明的是,所述訪問裝置獲取所述網(wǎng)頁信息中所包含的預(yù)定文本信息的數(shù)量 的步驟既可以在步驟S2之前執(zhí)行,也可以包含在步驟S2中執(zhí)行,例如,在步驟S2中,訪問 裝置檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象后,執(zhí)行步驟S4來獲得 預(yù)定文本信息數(shù)量,隨后,基于預(yù)定條件及所獲得的預(yù)定文本信息數(shù)量,來判斷是否對該新 網(wǎng)頁信息中的可執(zhí)行對象發(fā)起相對應(yīng)的網(wǎng)頁訪問請求。需要進(jìn)一步說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā) 明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何獲取所述網(wǎng)頁信息中所包含的預(yù)定文本信息的 數(shù)量的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。步驟S3已在參照圖1所示的實施例中予以詳述,并以引用的方式包含于此,不再 贅述。圖3示意出了本發(fā)明另一個優(yōu)選實施例的用于確定網(wǎng)頁訪問請求的方法流程圖。 根據(jù)本實施例的方法包括步驟Si、步驟S5、步驟S6、步驟S2及步驟S3。
步驟Sl已在參照圖1所示的實施例中予以詳述,并以引用的方式包含于此,不再 贅述。在步驟S5中,訪問裝置獲取所述網(wǎng)頁信息中包含的預(yù)定文本信息。具體的,所述獲取預(yù)定文本信息的方式包括但不限于通過訪問裝置在網(wǎng)頁信息 中查詢并對所述預(yù)定文本信息進(jìn)行統(tǒng)計獲得。在步驟S6中,訪問裝置基于第一預(yù)定規(guī)則,根據(jù)所獲取的預(yù)定文本信息,來確定 所述網(wǎng)頁信息的總評價值。其中,所述第一預(yù)定規(guī)則根據(jù)以下至少任一項,來確定所述總評價值1)所述網(wǎng)頁信息所包含的預(yù)定文本信息的總數(shù)量;其中,所述預(yù)定文本信息的總數(shù)量為所有特定類別的預(yù)定文本信息的數(shù)量之和。 具體的,訪問裝置在網(wǎng)頁信息中查詢并統(tǒng)計預(yù)定文本信息出現(xiàn)的次數(shù),并根據(jù)網(wǎng)頁信息中 預(yù)定文本信息出現(xiàn)的總次數(shù),來確定所述網(wǎng)頁信息的總評價值。例如,直接將所述總次數(shù)對 應(yīng)的數(shù)量值作為總評價值,或者,將該數(shù)量值進(jìn)行一定的處理,例如,乘以相應(yīng)系數(shù),或者, 進(jìn)行歸一化處理后,作為總評價值。2)所述網(wǎng)頁信息所包含的預(yù)定文本信息的總類別;具體的,訪問裝置根據(jù)網(wǎng)頁信息中所包含的預(yù)定文本信息的類別的數(shù)量,來確定 所述網(wǎng)頁信息的總評價值。例如,第一預(yù)定規(guī)則包括根據(jù)所述網(wǎng)頁信息所包含的預(yù)定文本信息的總類別的數(shù) 量來確定總評價值,例如,將網(wǎng)頁信息中包含的預(yù)定文本信息的類別數(shù)量作為總評價值。訪 問裝置對獲得的網(wǎng)頁信息進(jìn)行分析,獲得其中包含自然語言類的短文本信息“歌曲”和“播 放”;地址類別的短文本信息“gequ”,以及代碼類別的短文本信息“playmusic”。訪問裝置 根據(jù)第一預(yù)定規(guī)則,獲得所述網(wǎng)頁信息的總評價值為3。3)所述網(wǎng)頁信息所包含的所有預(yù)定文本信息所對應(yīng)的權(quán)重值;具體的,訪問裝置獲取網(wǎng)頁信息中所包含的預(yù)定文本信息,根據(jù)所述預(yù)定文本信 息獲取其相應(yīng)的權(quán)重值,并根據(jù)所述權(quán)重值獲得總評價值。例如,直接將網(wǎng)頁信息所包含預(yù) 定文本信息對應(yīng)的權(quán)重值相加,以獲得該總評價值,又例如,將各網(wǎng)頁信息所包含預(yù)定文本 信息對應(yīng)的權(quán)重值取平均值后獲得該總評價值等。其中,所述獲得特定類別的預(yù)定文本信息權(quán)重值的方式包括但不限于a)通過查 詢訪問裝置或其他裝置中預(yù)存儲的與預(yù)定文本信息對應(yīng)的權(quán)重值來獲得;b)通過獲取預(yù) 設(shè)的與該預(yù)定文本對應(yīng)的相關(guān)信息,例如,該預(yù)定文本信息的搜索頻次,該預(yù)定文本信息的 表意能力等,并多所獲取的相關(guān)信息進(jìn)行相應(yīng)處理,例如,求和或求取平均值等來得到。4)所述網(wǎng)頁信息所包含的所有預(yù)定文本信息類別所對應(yīng)的權(quán)重值。具體的,訪問裝置獲取網(wǎng)頁信息中的預(yù)定文本信息,根據(jù)所獲取的預(yù)定文本信息 的特定類別,獲取與所述特定類別對應(yīng)的權(quán)重值,并根據(jù)所述權(quán)重值獲得總評價值。其中, 所述類別對應(yīng)的權(quán)重值通過查詢預(yù)設(shè)的與各特定類別對應(yīng)的權(quán)重值信息來獲得。其中,所述特定類別包括但不限于1)自然語言類別;該自然語言類別的預(yù)定文本信息在網(wǎng)頁生成后能夠被用戶所 閱讀,例如,網(wǎng)頁信息中所包含的自然語言詞匯或自然語言詞匯的組合等;2)地址類別;例如,網(wǎng)頁信息中所包含的URL地址信息,或者,網(wǎng)頁信息所包含的可執(zhí)行對象中的鏈接信息等;3)代碼類別;例如,瀏覽器能夠根據(jù)預(yù)定的解碼規(guī)則來進(jìn)行解析的代碼信息等。其中,對于代碼類別的預(yù)定文本信息,訪問裝置可根據(jù)網(wǎng)頁信息中所包含的標(biāo)志 信息來確定;對于地址類別的預(yù)定文本信息,可通過以下任一方式來確定i)根據(jù)標(biāo)識信息來識別地址信息,并將所有識別得到的地址信息作為地址類別的 預(yù)定文本信息;ii)根據(jù)標(biāo)識信息來識別可執(zhí)行對象范圍,并識別可執(zhí)行對象范圍內(nèi)的地址信息 來作為地址類別的預(yù)定文本信息未被識別為代碼類別及地址類別的文本信息,作為自然語言類別的預(yù)定文本信 肩、ο需要說明的是,訪問裝置還可結(jié)合上述四項因素中的任意若干種,來獲得所述網(wǎng) 頁信息的總評價值。例如,第一預(yù)定規(guī)則規(guī)定,總評價值=Σ (Wi^Ni);其中,i表示預(yù)定文 本信息的類別,Wi表示特定類別對應(yīng)的預(yù)定文本信息的權(quán)重值,Ni表示特定類別的預(yù)定文 本信息的數(shù)量,即總評價值由各個類別的預(yù)定文本信息的數(shù)量乘以與類別對應(yīng)的類別權(quán)重 值后累加得到。當(dāng)預(yù)設(shè)自然語言類別的類別權(quán)重值為2 ;地址類別的類別權(quán)重值為4 ;代碼 類別的類別權(quán)重值為8,且訪問裝置獲取的預(yù)定文本信息中,包括33項自然語言類別的預(yù) 定文本信息、2項地址類別的預(yù)定文本信息以及4項代碼類別的預(yù)定文本信息,則訪問裝置 根據(jù)第一預(yù)定規(guī)則確定所述網(wǎng)頁信息的總評價值為106。又例如,訪問裝置根據(jù)上述四項因素分別獲得相應(yīng)的值后,再對所獲得的四個值 進(jìn)行相應(yīng)處理,例如,取平均值,或取平方和,或分別加權(quán)后相加等,來得到總評價值。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限 制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何基于第一預(yù)定規(guī)則,根據(jù)所獲取的預(yù)定文本信息,來確 定所述網(wǎng)頁信息的總評價值的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。在步驟S2中,當(dāng)訪問裝置檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí) 行對象,判斷該網(wǎng)頁信息是否符合預(yù)定條件。其中,所述預(yù)定條件還包括所述總評價值大 于或等于第二預(yù)定閾值;所述第二預(yù)定閾值應(yīng)可由本領(lǐng)域技術(shù)人員根據(jù)實際情況及需求來 確定。需要說明的是,所述步驟S5與步驟S6既可以在步驟S2之前執(zhí)行,也可以包含在 步驟S2中執(zhí)行,例如,在步驟S2中,訪問裝置檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪 問的可執(zhí)行對象后,執(zhí)行步驟S5來獲取所述網(wǎng)頁信息中包含的預(yù)定文本信息,接著執(zhí)行步 驟S6,基于第一預(yù)定規(guī)則,根據(jù)所獲取的預(yù)定文本信息,來確定所述網(wǎng)頁信息的總評價值。 隨后,基于預(yù)定條件及所獲得的總評價值,來判斷是否對該新網(wǎng)頁信息中的可執(zhí)行對象發(fā) 起相對應(yīng)的網(wǎng)頁訪問請求。接著,步驟S3已在參照圖1所示的實施例中予以詳述,并以引用的方式包含于此, 不再贅述。作為本發(fā)明的優(yōu)選方案之一,其中,根據(jù)本實施例的方法還包括步驟S7(圖未 示)。所述預(yù)定條件還包括所述總評價值小于所述第三預(yù)定閾值且所述網(wǎng)頁的重要度大 于第四預(yù)定閾值。其中,所述第三預(yù)定閾值小于等于所述第二預(yù)定閾值,所述第三預(yù)定閾值和第四預(yù)定閾值可由本領(lǐng)域技術(shù)人員根據(jù)實際情況及需求來確定。在步驟S7中,訪問裝置獲取所述網(wǎng)頁信息所屬的網(wǎng)頁的重要度。訪問裝置獲取該 重要度的方式包括但不限于1)獲取預(yù)設(shè)的與該網(wǎng)頁信息所述網(wǎng)頁對應(yīng)的重要度;2)獲取 預(yù)獲取的與該網(wǎng)頁信息對應(yīng)的相關(guān)信息,通過對相關(guān)信息進(jìn)行相應(yīng)處理,例如,直接將相關(guān) 信息中包含的一項因素對應(yīng)的值來作為該重要度,或者,將相關(guān)信息中包含的各項因素對 應(yīng)的值相加或取平均值或加權(quán)相加后歸一化等,來獲得該重要度。其中,所述相關(guān)信息包括 以下至少一項1)所述網(wǎng)頁信息所屬網(wǎng)頁的被點擊次數(shù);2)所述網(wǎng)頁信息所屬網(wǎng)頁的被推 薦次數(shù);幻所述網(wǎng)頁信息所屬網(wǎng)頁的權(quán)威性等。前述步驟S7可在步驟Sl之后,步驟S2之前執(zhí)行;或者,步驟S7包含在步驟S2 中,且當(dāng)在步驟S2中,訪問裝置判斷所述總評價值小于第二預(yù)定閾值后執(zhí)行,隨后,訪問裝 置判斷根據(jù)網(wǎng)頁信息所獲得的重要度及總評價值是否滿足所述總評價值小于所述第三預(yù) 定閾值且所述網(wǎng)頁的重要度大于第四預(yù)定閾值的預(yù)定條件,以根據(jù)判斷結(jié)果來確定是否執(zhí) 行步驟S3。作為本發(fā)明的優(yōu)選方案之一,其中,根據(jù)本實施例的方法還包括步驟S8(圖未 示)°在步驟S8中,訪問裝置基于第二預(yù)定規(guī)則,根據(jù)所述網(wǎng)頁信息所包含的各個特定 類別的預(yù)定文本信息分別獲得相應(yīng)的各個單項評價值。其中,所述第二預(yù)定規(guī)則包括根據(jù) 以下至少一項因素,來確定所述單項評價值1)所述網(wǎng)頁信息所包含的各個特定類別的預(yù)定文本信息分別對應(yīng)的數(shù)量;具體的,訪問裝置查詢并統(tǒng)計獲得網(wǎng)頁信息中各個特定類別的預(yù)定文本信息的數(shù) 量,并根據(jù)所述特定類別的預(yù)定文本信息的數(shù)量,獲得相應(yīng)類別的單項評價值。其中,所述 獲得相應(yīng)類別的單項評價值的方法包括但不限于采用以預(yù)定文本信息數(shù)量為參數(shù)的多種 函數(shù)。例如,第二預(yù)定規(guī)則規(guī)定,自然語言類別單項評價值為網(wǎng)頁信息所包含的各自然 語言類別的預(yù)定文本信息數(shù)量的平均值;地址類別單項評價值為網(wǎng)頁信息所屬網(wǎng)頁的地址 信息中所包含的地址類別預(yù)定文本信息的數(shù)量;代碼類別單項評價值為網(wǎng)頁信息所屬網(wǎng)頁 的代碼信息中所包含的代碼類別預(yù)定文本信息的數(shù)量乘以調(diào)整系數(shù),例如,0. 5后的值。對 于一網(wǎng)頁信息,訪問裝置獲得自然語言類別的預(yù)定文本信息中,“音樂”出現(xiàn)8次、“點歌”出 現(xiàn)12次、“熱播”出現(xiàn)4次;地址類別的預(yù)定文本信息中,“song”出現(xiàn)1次,“l(fā)isten”出現(xiàn)1 次;代碼類別的預(yù)定文本信息中,“playlist^^S3次,“musicbof出現(xiàn)4次,“l(fā)ister^,出現(xiàn) 2次,則根據(jù)第二預(yù)定規(guī)則,訪問裝置獲得自然語言類別單項評價值為各自然語言預(yù)定文本 信息的出現(xiàn)次數(shù)之和的平均值,即自然語言類別單項評價值為(8+12+4)/3 = 8 ;地址類別 預(yù)定文本信息共有2項,即地址類別單項評價值為2 ;代碼類別單項評價值為(3+4+2)*0. 5 =4. 5。2)所述網(wǎng)頁信息所包含的各個特定類別的預(yù)定文本信息分別對應(yīng)的權(quán)重值;具體的,訪問裝置獲取網(wǎng)頁信息中所包含的特定類別的預(yù)定文本信息,并獲取所 述預(yù)定文本信息對應(yīng)的權(quán)重值,以根據(jù)該權(quán)重值來獲得相應(yīng)類別的單項評價值。其中,所述 獲得特定類別的預(yù)定文本信息權(quán)重值的方式包括但不限于a)通過查詢預(yù)存儲的預(yù)定文 本信息的權(quán)重值表獲得;b)獲取預(yù)獲取的與該特定類別的預(yù)定文本信息對應(yīng)的相關(guān)信息,通過對相關(guān)信息進(jìn)行相應(yīng)處理,例如,直接將相關(guān)信息中包含的一項因素對應(yīng)的值來作為 該重要度,或者,將相關(guān)信息中包含的各項因素對應(yīng)的值相加或取平均值或加權(quán)相加后歸
一化等,來獲得該重要度。例如,第二預(yù)定規(guī)則規(guī)定,各單項評價值由網(wǎng)頁信息所包含的各特定類別預(yù)定文 本信息的權(quán)重值相加后獲得。若訪問裝置在步驟S5所獲得的預(yù)定文本信息包括自然語 言類別的預(yù)定文本信息“音樂”、“點歌”出及“熱播”;地址類別的預(yù)定文本信息“song”及 “l(fā)isten” ;代碼類別的預(yù)定文本信息“playliSt”、“mUSicb0X”及“l(fā)isten”,訪問裝置通過 查詢預(yù)設(shè)的各預(yù)定文本信息對應(yīng)的權(quán)重值表,獲得類別權(quán)重值如下自然語言類別中,“音樂”權(quán)重值為0. 5,點歌權(quán)重值為1,熱播為1. 2 ;地址類別中,“song”權(quán)重值為1. 1,“ listen”權(quán)重值為1. 6 ;代碼類別中,“playlist”權(quán)重值為2. 1,“musicbox”權(quán)重值為1. 4,“l(fā)isten”權(quán)重 值為1.2;則訪問裝置根據(jù)第二預(yù)定規(guī)則,獲得各單項權(quán)重如下自然語言類別單項權(quán)重值=0. 5+1+1. 2 = 2. 7 ;地址類別單項權(quán)重值=1. 1+1. 6 = 2. 7 ;代碼類別單項權(quán)重值=2. 1+1. 4+1. 2 = 4. 7。需要說明的是,訪問裝置還可結(jié)合上述兩項因素來獲得各單項權(quán)重值,例如,若第 二預(yù)定規(guī)則規(guī)定,單項權(quán)重值為各預(yù)定文本信息的出現(xiàn)次數(shù)乘以其權(quán)重值后相加所得的 值,則訪問裝置根據(jù)第二預(yù)定規(guī)則,計算各個類別下預(yù)定文本信息的加權(quán)和作為相應(yīng)類別 的單項權(quán)重值,訪問裝置所得的各特定類別的預(yù)定文本信息及其出現(xiàn)次數(shù)及權(quán)重值如上述 兩個實施例所示,則訪問裝置分別獲得各個單項平均值如下自然語言類別單項權(quán)重值為8*0. 5+12*1+4*1. 2 = 20. 8 ;地址類別單項權(quán)重值為1*1. 1+1*1. 6 = 2. 7 ;代碼類別單項權(quán)重值為3*2. 1+4*1. 4+2*1. 2 = 14. 3。在步驟S2中,當(dāng)訪問裝置檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí) 行對象,判斷該網(wǎng)頁信息是否符合預(yù)定條件。其中,所述預(yù)定條件還包括所述總評價值大 于第五預(yù)定閾值,而且所述各個單項評價值均大于相應(yīng)的各個預(yù)定閾值;所述第五預(yù)定閾 值可由本領(lǐng)域技術(shù)人員根據(jù)實際情況及需求來確定,但所述第五預(yù)定閾值的選取應(yīng)滿足大 于或等于所述第二預(yù)定閾值的條件。例如,訪問裝置中預(yù)設(shè)自然語言類別單項評價值的預(yù)定閾值為12,地址類別單項 評價值的預(yù)定閾值為1,代碼類別單項評價值的預(yù)定閾值為10,總評價值為76,且訪問裝置 在步驟S6中所獲得的總評價值為106,在步驟S8中所獲得的自然語言類別單項權(quán)重值為 20. 8,地址類別單項權(quán)重值為2. 7,代碼類別單項權(quán)重值為14. 3,則訪問裝置判定所述總評 價值大于第五預(yù)定閾值,而且所述各個單項評價值均大于相應(yīng)的各個預(yù)定閾值,則所述網(wǎng) 頁信息符合預(yù)定條件。又例如,訪問裝置中預(yù)設(shè)自然語言類別單項評價值的預(yù)定閾值為12,地址類別單 項評價值的預(yù)定閾值為5,代碼類別單項評價值的預(yù)定閾值為10,總評價值為76,且訪問裝 置在步驟S6中所獲得的總評價值為106,在步驟S8中所獲得的自然語言類別單項權(quán)重值為 20. 8,地址類別單項權(quán)重值為2. 7,代碼類別單項權(quán)重值為14. 3,則訪問裝置判斷地址類別單項權(quán)重值小于其預(yù)定閾值,所述網(wǎng)頁信息不符合預(yù)定條件。前述步驟S8可在步驟Sl之后,步驟S2之前執(zhí)行;或者,步驟S8包含在步驟S2中 執(zhí)行,例如,在步驟S2中訪問裝置檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行 對象后,訪問裝置執(zhí)行步驟S6及步驟S8以獲得總評價值及各單項評價值,隨后,訪問裝置 判斷根據(jù)網(wǎng)頁信息所獲得的總評價值及個單項評價值是否滿足總評價值大于第五預(yù)定閾 值,且所述各個單項評價值均大于相應(yīng)的各個預(yù)定閾值,以根據(jù)判斷結(jié)果來確定是否執(zhí)行 步驟S3 ο需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限 制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何基于第二預(yù)定規(guī)則,根據(jù)所述網(wǎng)頁信息所包含的各個特 定類別的預(yù)定文本信息分別獲得相應(yīng)的各個單項評價值的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的 范圍內(nèi)。作為本發(fā)明的優(yōu)選方案之一,其中,所述方法還包括步驟S9(圖未示)。在步驟S9中,訪問裝置通過對多個網(wǎng)頁進(jìn)行預(yù)訓(xùn)練來確定所述預(yù)定條件。其中, 所述預(yù)訓(xùn)練的方式包括但不限于采用以下分類模型來實現(xiàn)1)支持向量機模型;2)貝葉斯 模型;3)最大熵模型等。所述預(yù)定條件包括分類模型判斷所獲得的網(wǎng)頁信息為需要進(jìn)行多 次訪問的網(wǎng)頁信息。具體的,訪問裝置獲得多個已確定為需發(fā)起多次訪問請求的網(wǎng)頁及多個已確定為 僅需發(fā)起一次訪問請求的網(wǎng)頁,隨后,訪問裝置根據(jù)該等多個網(wǎng)頁來對分類模型進(jìn)行訓(xùn)練, 以獲得訓(xùn)練后的分類模型。則當(dāng)在步驟S2中,訪問裝置判斷網(wǎng)頁信息中包含可執(zhí)行對象 時,若分類模型根據(jù)網(wǎng)頁信息所輸出的分類結(jié)果為需要進(jìn)行多次訪問的網(wǎng)頁信息,則訪問 裝置判斷網(wǎng)頁信息符合預(yù)定條件,并執(zhí)行步驟S3。根據(jù)本實施例的方法,訪問裝置依據(jù)多個層級的預(yù)定條件,來對網(wǎng)頁信息是否可 能觸發(fā)下次網(wǎng)頁請求進(jìn)行判定,使得判定的結(jié)果更加準(zhǔn)確,更加有效提高網(wǎng)頁訪問效率,避 免因不必要的網(wǎng)頁訪問請求所造成的資源浪費與時間消耗。圖4示意出了本發(fā)明一個方面的用于確定網(wǎng)頁訪問請求的訪問裝置的結(jié)構(gòu)示意 圖。第一獲取裝置1獲取網(wǎng)頁信息。其中,所述獲取網(wǎng)頁信息的方式包括但不限于1) 第一獲取裝置1根據(jù)所獲取的地址信息來向?qū)?yīng)的網(wǎng)頁服務(wù)器進(jìn)行一次網(wǎng)頁獲取請求而 獲得;幻第一獲取裝置1讀取保存于訪問裝置或與訪問裝置物理分離但通信連接的裝置中 的網(wǎng)頁信息。當(dāng)判斷裝置2檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象,判斷 該網(wǎng)頁信息是否符合預(yù)定條件。其中,所述可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象包括基于Java、 JS.Ajax和/或VBscript的對象;所述檢測方式包括但不限于分析所獲得的網(wǎng)頁信息中是 否包含與可執(zhí)行對象相對應(yīng)的代碼或標(biāo)簽等可執(zhí)行對象的標(biāo)識信息。例如,預(yù)定條件為網(wǎng)頁信息中包含關(guān)鍵詞“試聽”并且網(wǎng)頁信息對應(yīng)的網(wǎng)頁的URL 中包括以下任一字符串“mp3”、“rm”、“Wn^^r‘a(chǎn)pe”。判斷裝置2檢測已獲得的網(wǎng)頁信息, 并在網(wǎng)頁信息中查詢得到j(luò)avascript的標(biāo)簽,則判斷裝置2判斷所述網(wǎng)頁信息中包括可能 觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象JS,隨后,判斷裝置2對網(wǎng)頁信息及所述網(wǎng)頁信息所對應(yīng)網(wǎng)頁 的URL進(jìn)行分析,在網(wǎng)頁信息中查詢得到關(guān)鍵詞“試聽”,并且在所述URL中查詢得到字符串“wma”,則判斷裝置2判定所述網(wǎng)頁信息符合預(yù)定條件。又例如,預(yù)定條件為網(wǎng)頁信息代碼中同時包含字符串“playlist”及字符串 “object”。判斷裝置2在已獲得的網(wǎng)頁信息中查詢與可執(zhí)行對象對應(yīng)的代碼,并獲得 Vbscript的標(biāo)簽,則判斷裝置2判定所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對 象Vbscript,并繼續(xù)判斷該網(wǎng)頁信息是否符合預(yù)定條件,即判斷該網(wǎng)頁信息是否同時包含 字符串“playlist”及字符串“object”。當(dāng)判斷裝置2在網(wǎng)頁信息的代碼部分中查詢到字 符串“playlist”及字符串“object”,即網(wǎng)頁信息所包含的代碼信息中同時包含了字符串 “playlist”及字符串“object”,則判斷裝置2判定網(wǎng)頁信息符合預(yù)定條件。其中,判斷裝 置2可根據(jù)網(wǎng)頁信息中的標(biāo)識信息來確定網(wǎng)頁信息中的代碼部分。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限 制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何通過檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的 可執(zhí)行對象,判斷該網(wǎng)頁信息是否符合預(yù)定條件的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。當(dāng)所述網(wǎng)頁信息符合該預(yù)定條件時,第一請求發(fā)起裝置3發(fā)起與該可執(zhí)行對象相 對應(yīng)的網(wǎng)頁訪問請求。例如,對包含JS可執(zhí)行對象的網(wǎng)頁信息,當(dāng)判斷裝置2判定符合所述網(wǎng)頁信息符 合預(yù)定條件時,則第一請求發(fā)起裝置3根據(jù)所述JS可執(zhí)行對象,向網(wǎng)頁信息所對應(yīng)網(wǎng)頁的 服務(wù)器發(fā)起JS請求。又例如,如判斷裝置2判定符合預(yù)定條件的網(wǎng)頁信息中包括可執(zhí)行對象JS及可執(zhí) 行對象Applet,則第一請求發(fā)起裝置3向所述網(wǎng)頁信息所對應(yīng)網(wǎng)頁的服務(wù)器分別發(fā)起JS請 求禾口 Applet請求。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限 制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何當(dāng)所述網(wǎng)頁信息符合該預(yù)定條件時,發(fā)起與該可執(zhí)行對 象相對應(yīng)的網(wǎng)頁訪問請求的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。作為本發(fā)明的優(yōu)選方案之一,其中,根據(jù)本發(fā)明的訪問裝置還包括第二更新裝置 (圖未示)、第五獲取裝置(圖未示)、查詢裝置(圖未示)和第二請求發(fā)起裝置(圖未示)。當(dāng)判斷一個網(wǎng)頁信息符合該預(yù)定條件時,第二更新裝置根據(jù)該網(wǎng)頁信息所屬網(wǎng)頁 的地址信息來建立或更新網(wǎng)頁類別庫。具體的,當(dāng)判斷裝置2判定一個網(wǎng)頁信息符合該預(yù)定條件時,若訪問裝置已獲取 該網(wǎng)頁信息所屬網(wǎng)頁的地址信息,則第二更新裝置將該地址信息添加或更新至網(wǎng)頁類別庫 中,若第二更新裝置未獲取該網(wǎng)頁信息所屬網(wǎng)頁的地址信息,則訪問裝置進(jìn)一步獲取所述 地址信息,并將所述地址信息加入網(wǎng)頁類別庫中。第五獲取裝置獲取一個新網(wǎng)頁信息及其所屬網(wǎng)頁的地址信息。具體的,獲取所述新網(wǎng)頁信息及其所屬網(wǎng)頁的地址信息的方式包括但不限于1) 第五獲取裝置由預(yù)設(shè)的網(wǎng)頁信息庫中獲取網(wǎng)頁信息,并根據(jù)網(wǎng)頁信息進(jìn)行搜索來獲得所述 網(wǎng)頁信息所屬網(wǎng)頁的地址信息;2)第五獲取裝置由預(yù)設(shè)的網(wǎng)頁信息庫中獲取網(wǎng)頁信息,并 在已有的與網(wǎng)頁信息相對應(yīng)的數(shù)據(jù)庫中進(jìn)行查詢來獲得所述網(wǎng)頁信息所屬網(wǎng)頁的地址信 息;3)第五獲取裝置獲取所述地址信息,并根據(jù)所述地址信息來獲取所述新網(wǎng)頁信息等。接著,查詢裝置基于所獲取的網(wǎng)頁的地址信息來在所述網(wǎng)頁類別庫中進(jìn)行查詢, 以獲得查詢結(jié)果。
接著,當(dāng)查詢結(jié)果為匹配時,第二請求發(fā)起裝置對該新網(wǎng)頁信息中的可執(zhí)行對象 發(fā)起相對應(yīng)的網(wǎng)頁訪問請求。其中,所述匹配表示所述新網(wǎng)頁信息所屬網(wǎng)頁的地址信息與 網(wǎng)頁類別庫中的地址信息完全匹配。具體的,當(dāng)在網(wǎng)頁類別庫中查詢到新網(wǎng)頁信息所屬網(wǎng)頁的地址信息,則第二請求 發(fā)起裝置進(jìn)一步獲取新網(wǎng)頁信息中所包含的各類可執(zhí)行對象信息,并根據(jù)所述可執(zhí)行對象 的信息發(fā)起相應(yīng)的網(wǎng)頁訪問請求。根據(jù)本實施例的訪問裝置,對于所請求的網(wǎng)頁信息,能夠快速判定其所屬網(wǎng)頁是 否為可能觸發(fā)進(jìn)一步請求的網(wǎng)頁,并根據(jù)判斷結(jié)果,僅對可能觸發(fā)進(jìn)一步請求的網(wǎng)頁發(fā)起 下一次請求,可以較大的提高網(wǎng)頁的訪問效率。例如,在網(wǎng)絡(luò)蜘蛛或爬蟲等爬取網(wǎng)頁信息 時,通過采用本發(fā)明的方案,能夠大大減少網(wǎng)頁請求次數(shù),提高爬取速遞,減少網(wǎng)絡(luò)帶寬的 消耗;或者,在用戶訪問網(wǎng)頁時,加快網(wǎng)頁生成速度,改善用戶體驗。圖5示意出了本發(fā)明一個優(yōu)選實施例的用于確定網(wǎng)頁訪問請求的訪問裝置的結(jié) 構(gòu)示意圖。根據(jù)本實施例的訪問裝置包括第一獲取裝置1、第二獲取裝置4、判斷裝置2和 第一請求發(fā)起裝置3。第一獲取裝置1已在參照圖4所示實施例中予以詳述,并以引用的方式包含于此, 不再贅述。第二獲取裝置4獲取所述網(wǎng)頁信息中所包含的預(yù)定文本信息的數(shù)量。其中,所述預(yù)定文本信息包括以下至少一類1)短文本信息;2)短文本信息組合。獲取所述預(yù)定文本信息數(shù)量的方式包括但不限于在網(wǎng)頁信息中查詢預(yù)定文本信 息并累計所有預(yù)定文本信息的出現(xiàn)次數(shù)。例如,預(yù)定文本信息包括“歌曲”、“試聽”、“熱門點播”、“mp3”、“新歌在線”;第一預(yù)
定閾值為10。第二獲取裝置4在網(wǎng)頁信息中查詢前述預(yù)定文本信息,獲得網(wǎng)頁信息中出現(xiàn) “歌曲”的次數(shù)為5次,獲得網(wǎng)頁信息中出現(xiàn)“試聽”的次數(shù)為3次,獲得網(wǎng)頁信息中出現(xiàn)“熱 門點播”的次數(shù)為3次,則第二獲取裝置4獲得的預(yù)定文本信息數(shù)量共計為11。接著,當(dāng)判斷裝置2檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對 象,判斷該網(wǎng)頁信息是否符合預(yù)定條件。其中,所述預(yù)定條件包括所述網(wǎng)頁信息所包含的 預(yù)定文本信息數(shù)量大于或等于第一預(yù)定閾值,所述第一預(yù)定閾值應(yīng)可由本領(lǐng)域技術(shù)人員根 據(jù)實際情況及需求來確定。例如,若第一預(yù)定閾值為10,在前述步驟S4中所得的預(yù)定文本信息數(shù)量為11,則 判斷裝置2判定獲得的網(wǎng)頁信息符合預(yù)定條件。需要說明的是,所述第二獲取裝置4獲取所述網(wǎng)頁信息中所包含的預(yù)定文本信息 的數(shù)量的操作既可以在判斷裝置2執(zhí)行判斷步驟之前執(zhí)行,也可以判斷裝置2的執(zhí)行判斷 步驟的過程中執(zhí)行,例如,當(dāng)判斷裝置2檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的 可執(zhí)行對象后,第二獲取裝置4獲得預(yù)定文本信息數(shù)量,隨后,基于預(yù)定條件及所獲得的預(yù) 定文本信息數(shù)量,來判斷是否對該新網(wǎng)頁信息中的可執(zhí)行對象發(fā)起相對應(yīng)的網(wǎng)頁訪問請 求。需要進(jìn)一步說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā) 明的限制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何獲取所述網(wǎng)頁信息中所包含的預(yù)定文本信息的 數(shù)量的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。
第一請求發(fā)起裝置3已在參照圖4所示的實施例中予以詳述,并以引用的方式包 含于此,不再贅述。圖6示意出了本發(fā)明另一個優(yōu)選實施例的用于確定網(wǎng)頁訪問請求的訪問裝置的 結(jié)構(gòu)示意圖。根據(jù)本實施例的訪問裝置包括第一獲取裝置1、第三獲取裝置5、第一確定裝 置6、判斷裝置2及第一請求發(fā)起裝置3。第一獲取裝置1已在參照圖4所示的實施例中予以詳述,并以引用的方式包含于 此,不再贅述。第三獲取裝置5獲取所述網(wǎng)頁信息中包含的預(yù)定文本信息。具體的,所述獲取預(yù)定文本信息的方式包括但不限于通過訪問裝置在網(wǎng)頁信息 中查詢并對所述預(yù)定文本信息進(jìn)行統(tǒng)計獲得。第一確定裝置6基于第一預(yù)定規(guī)則,根據(jù)所獲取的預(yù)定文本信息,來確定所述網(wǎng) 頁信息的總評價值。其中,所述第一預(yù)定規(guī)則根據(jù)以下至少任一項,來確定所述總評價值1)所述網(wǎng)頁信息所包含的預(yù)定文本信息的總數(shù)量;其中,所述預(yù)定文本信息的總數(shù)量為所有特定類別的預(yù)定文本信息的數(shù)量之和。 具體的,第三獲取裝置5在網(wǎng)頁信息中查詢并統(tǒng)計預(yù)定文本信息出現(xiàn)的次數(shù),第一確定裝 置6根據(jù)網(wǎng)頁信息中預(yù)定文本信息出現(xiàn)的總次數(shù),來確定所述網(wǎng)頁信息的總評價值。例如, 直接將所述總次數(shù)對應(yīng)的數(shù)量值作為總評價值,或者,將該數(shù)量值進(jìn)行一定的處理,例如, 乘以相應(yīng)系數(shù),或者,進(jìn)行歸一化處理后,作為總評價值。2)所述網(wǎng)頁信息所包含的預(yù)定文本信息的總類別;具體的,第一確定裝置6根據(jù)網(wǎng)頁信息中所包含的預(yù)定文本信息的類別的數(shù)量, 來確定所述網(wǎng)頁信息的總評價值。例如,第一預(yù)定規(guī)則包括根據(jù)所述網(wǎng)頁信息所包含的預(yù)定文本信息的總類別的數(shù) 量來確定總評價值,例如,將網(wǎng)頁信息中包含的預(yù)定文本信息的類別數(shù)量作為總評價值。第 一確定裝置6對獲得的網(wǎng)頁信息進(jìn)行分析,獲得其中包含自然語言類的短文本信息“歌曲” 和“播放”;地址類別的短文本信息“gequ”,以及代碼類別的短文本信息“playmusic”。第一 確定裝置6根據(jù)第一預(yù)定規(guī)則,獲得所述網(wǎng)頁信息的總評價值為3。3)所述網(wǎng)頁信息所包含的所有預(yù)定文本信息所對應(yīng)的權(quán)重值;具體的,第一確定裝置6根據(jù)網(wǎng)頁信息中所包含的預(yù)定文本信息,獲取相應(yīng)的權(quán) 重值,并根據(jù)所述權(quán)重值獲得總評價值。例如,直接將網(wǎng)頁信息所包含預(yù)定文本信息對應(yīng)的 權(quán)重值相加,以獲得該總評價值,又例如,將各網(wǎng)頁信息所包含預(yù)定文本信息對應(yīng)的權(quán)重值 取平均值后獲得該總評價值等。其中,所述獲得特定類別的預(yù)定文本信息權(quán)重值的方式包括但不限于a)通過查 詢訪問裝置或其他裝置中預(yù)存儲的與預(yù)定文本信息對應(yīng)的權(quán)重值來獲得;b)通過獲取預(yù) 設(shè)的與該預(yù)定文本對應(yīng)的相關(guān)信息,例如,該預(yù)定文本信息的搜索頻次,該預(yù)定文本信息的 表意能力等,并多所獲取的相關(guān)信息進(jìn)行相應(yīng)處理,例如,求和或求取平均值等來得到。4)所述網(wǎng)頁信息所包含的所有預(yù)定文本信息類別所對應(yīng)的權(quán)重值。具體的,第一確定裝置6根據(jù)第三獲取裝置5所獲取的預(yù)定文本信息的特定類別, 獲取與所述特定類別對應(yīng)的權(quán)重值,并根據(jù)所述權(quán)重值獲得總評價值。其中,所述類別對應(yīng)的權(quán)重值通過查詢預(yù)設(shè)的與各特定類別對應(yīng)的權(quán)重值信息來獲得。其中,所述特定類別包括但不限于1)自然語言類別;該自然語言類別的預(yù)定文本信息在網(wǎng)頁生成后能夠被用戶所 閱讀,例如,網(wǎng)頁信息中所包含的自然語言詞匯或自然語言詞匯的組合等;2)地址類別;例如,網(wǎng)頁信息中所包含的URL地址信息,或者,網(wǎng)頁信息所包含的 可執(zhí)行對象中的鏈接信息等;3)代碼類別;例如,瀏覽器能夠根據(jù)預(yù)定的解碼規(guī)則來進(jìn)行解析的代碼信息等。其中,對于代碼類別的預(yù)定文本信息,訪問裝置可根據(jù)網(wǎng)頁信息中所包含的標(biāo)志 信息來確定;對于地址類別的預(yù)定文本信息,可通過以下任一方式來確定i)根據(jù)標(biāo)識信息來識別地址信息,并將所有識別得到的地址信息作為地址類別的 預(yù)定文本信息;ii)根據(jù)標(biāo)識信息來識別可執(zhí)行對象范圍,并識別可執(zhí)行對象范圍內(nèi)的地址信息 來作為地址類別的預(yù)定文本信息未被識別為代碼類別及地址類別的文本信息,作為自然語言類別的預(yù)定文本信 肩、ο需要說明的是,第一確定裝置6還可結(jié)合上述四項因素中的任意若干種,來獲得 所述網(wǎng)頁信息的總評價值。例如,第一預(yù)定規(guī)則規(guī)定,總評價值=Σ (Wi^Ni);其中,i表示預(yù) 定文本信息的類別,Wi表示特定類別對應(yīng)的預(yù)定文本信息的權(quán)重值,Ni表示特定類別的預(yù) 定文本信息的數(shù)量,即總評價值由各個類別的預(yù)定文本信息的數(shù)量乘以與類別對應(yīng)的類別 權(quán)重值后累加得到。當(dāng)預(yù)設(shè)自然語言類別的類別權(quán)重值為2 ;地址類別的類別權(quán)重值為4 ; 代碼類別的類別權(quán)重值為8,且第三獲取裝置5獲取的預(yù)定文本信息中,包括33項自然語言 類別的預(yù)定文本信息、2項地址類別的預(yù)定文本信息以及4項代碼類別的預(yù)定文本信息,則 第一確定裝置6根據(jù)第一預(yù)定規(guī)則確定所述網(wǎng)頁信息的總評價值為106。又例如,第一確定裝置6根據(jù)上述四項因素分別獲得相應(yīng)的值后,再對所獲得的 四個值進(jìn)行相應(yīng)處理,例如,取平均值,或取平方和,或分別加權(quán)后相加等,來得到總評價 值。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限 制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何基于第一預(yù)定規(guī)則,根據(jù)所獲取的預(yù)定文本信息,來確 定所述網(wǎng)頁信息的總評價值的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的范圍內(nèi)。判斷裝置2檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象,判斷該 網(wǎng)頁信息是否符合預(yù)定條件。其中,所述預(yù)定條件還包括所述總評價值大于或等于第二預(yù) 定閾值;所述第二預(yù)定閾值應(yīng)可由本領(lǐng)域技術(shù)人員根據(jù)實際情況及需求來確定。需要說明的是,所述第三獲取裝置5和第一確定裝置6既可以在判斷裝置2之前 執(zhí)行操作,也可以在判斷裝置2執(zhí)行判斷操作的過程中執(zhí)行操作,例如,判斷裝置2檢測到 所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象后,第三獲取裝置5獲取所述網(wǎng)頁信 息中包含的預(yù)定文本信息,接著第一確定裝置6基于第一預(yù)定規(guī)則,根據(jù)所獲取的預(yù)定文 本信息,來確定所述網(wǎng)頁信息的總評價值。隨后,基于預(yù)定條件及所獲得的總評價值,來判 斷是否對該新網(wǎng)頁信息中的可執(zhí)行對象發(fā)起相對應(yīng)的網(wǎng)頁訪問請求。
接著,第一請求生成裝置3已在參照圖4所示的實施例中予以詳述,并以引用的方 式包含于此,不再贅述。作為本發(fā)明的優(yōu)選方案之一,其中,根據(jù)本實施例的裝置還包括第四獲取裝置 (圖未示)。所述預(yù)定條件還包括所述總評價值小于所述第三預(yù)定閾值且所述網(wǎng)頁的重要 度大于第四預(yù)定閾值。其中,所述第三預(yù)定閾值小于等于所述第二預(yù)定閾值,所述第三預(yù)定 閾值和第四預(yù)定閾值可由本領(lǐng)域技術(shù)人員根據(jù)實際情況及需求來確定。第四獲取裝置獲取所述網(wǎng)頁信息所屬的網(wǎng)頁的重要度。第四獲取裝置獲取該重要 度的方式包括但不限于1)獲取預(yù)設(shè)的與該網(wǎng)頁信息所述網(wǎng)頁對應(yīng)的重要度;幻獲取預(yù)獲 取的與該網(wǎng)頁信息對應(yīng)的相關(guān)信息,通過對相關(guān)信息進(jìn)行相應(yīng)處理,例如,直接將相關(guān)信息 中包含的一項因素對應(yīng)的值來作為該重要度,或者,將相關(guān)信息中包含的各項因素對應(yīng)的 值相加或取平均值或加權(quán)相加后歸一化等,來獲得該重要度。其中,所述相關(guān)信息包括以下 至少一項1)所述網(wǎng)頁信息所屬網(wǎng)頁的被點擊次數(shù);2)所述網(wǎng)頁信息所屬網(wǎng)頁的被推薦次 數(shù);3)所述網(wǎng)頁信息所屬網(wǎng)頁的權(quán)威性等。第四獲取裝置可在第一獲取裝置1之后,判斷裝置2之前執(zhí)行操作;或者,第四獲 取裝置可在判斷裝置2執(zhí)行操作的過程中,且當(dāng)在判斷裝置2判斷所述總評價值小于第二 預(yù)定閾值后執(zhí)行操作,隨后,訪問裝置判斷根據(jù)網(wǎng)頁信息所獲得的重要度及總評價值是否 滿足所述總評價值小于所述第三預(yù)定閾值且所述網(wǎng)頁的重要度大于第四預(yù)定閾值的預(yù)定 條件,以根據(jù)判斷結(jié)果來確定是否執(zhí)行第一請求發(fā)起裝置3的操作。作為本發(fā)明的優(yōu)選方案之一,其中,根據(jù)本實施例的訪問裝置還包括第二確定裝 置(圖未示)。第二確定裝置基于第二預(yù)定規(guī)則,根據(jù)所述網(wǎng)頁信息所包含的各個特定類別的預(yù) 定文本信息分別獲得相應(yīng)的各個單項評價值。其中,所述第二預(yù)定規(guī)則包括根據(jù)以下至少 一項因素,來確定所述單項評價值1)所述網(wǎng)頁信息所包含的各個特定類別的預(yù)定文本信息分別對應(yīng)的數(shù)量;具體的,第二確定裝置根據(jù)網(wǎng)頁信息中各個特定類別的預(yù)定文本信息的數(shù)量,并 根據(jù)所述特定類別的預(yù)定文本信息的數(shù)量,獲得相應(yīng)類別的單項評價值。其中,所述獲得相 應(yīng)類別的單項評價值的方法包括但不限于采用以預(yù)定文本信息數(shù)量為參數(shù)的多種函數(shù)。例如,第二預(yù)定規(guī)則規(guī)定,自然語言類別單項評價值為網(wǎng)頁信息所包含的各自然 語言類別的預(yù)定文本信息數(shù)量的平均值;地址類別單項評價值為網(wǎng)頁信息所屬網(wǎng)頁的地址 信息中所包含的地址類別預(yù)定文本信息的數(shù)量;代碼類別單項評價值為網(wǎng)頁信息所屬網(wǎng)頁 的代碼信息中所包含的代碼類別預(yù)定文本信息的數(shù)量乘以調(diào)整系數(shù),例如,0. 5后的值。對 于一網(wǎng)頁信息,第三獲取裝置5獲得自然語言類別的預(yù)定文本信息中,“音樂”出現(xiàn)8次、“點 歌”出現(xiàn)12次、“熱播1現(xiàn)4次;地址類別的預(yù)定文本信息中,“song”出現(xiàn)1次,“l(fā)isten”出 現(xiàn)1次;代碼類別的預(yù)定文本信息中,“playlist^^S3次,“musicbof出現(xiàn)4次,“l(fā)isten” 出現(xiàn)2次,則根據(jù)第二預(yù)定規(guī)則,第二確定裝置獲得自然語言類別單項評價值為各自然語 言預(yù)定文本信息的出現(xiàn)次數(shù)之和的平均值,即自然語言類別單項評價值為(8+12+4)/3 = 8 ;地址類別預(yù)定文本信息共有2項,即地址類別單項評價值為2 ;代碼類別單項評價值為 (3+4+2) *0. 5 = 4. 5。2)所述網(wǎng)頁信息所包含的各個特定類別的預(yù)定文本信息分別對應(yīng)的權(quán)重值;
具體的,第二確定裝置獲取網(wǎng)頁信息中所包含的特定類別的預(yù)定文本信息,并獲 取所述預(yù)定文本信息對應(yīng)的權(quán)重值,以根據(jù)該權(quán)重值來獲得相應(yīng)類別的單項評價值。其中, 所述獲得特定類別的預(yù)定文本信息權(quán)重值的方式包括但不限于a)通過查詢預(yù)存儲的預(yù) 定文本信息的權(quán)重值表獲得;b)獲取預(yù)獲取的與該特定類別的預(yù)定文本信息對應(yīng)的相關(guān) 信息,通過對相關(guān)信息進(jìn)行相應(yīng)處理,例如,直接將相關(guān)信息中包含的一項因素對應(yīng)的值來 作為該重要度,或者,將相關(guān)信息中包含的各項因素對應(yīng)的值相加或取平均值或加權(quán)相加 后歸一化等,來獲得該重要度。例如,第二預(yù)定規(guī)則規(guī)定,各單項評價值由網(wǎng)頁信息所包含的各特定類別預(yù)定文 本信息的權(quán)重值相加后獲得。若第三獲取裝置5所獲得的預(yù)定文本信息包括自然語言類別 的預(yù)定文本信息“音樂”、“點歌”出及“熱播”;地址類別的預(yù)定文本信息“song”及“l(fā)isten”; 代碼類別的預(yù)定文本信息“playliSt”、“mUSicb0X”及“l(fā)isten”,第二確定裝置通過查詢預(yù) 設(shè)的各預(yù)定文本信息對應(yīng)的權(quán)重值表,獲得類別權(quán)重值如下自然語言類別中,“音樂”權(quán)重值為0. 5,點歌權(quán)重值為1,熱播為1. 2 ;地址類別中,“song”權(quán)重值為1. 1,“ listen”權(quán)重值為1. 6 ;代碼類別中,“playlist”權(quán)重值為2. 1,“musicbox”權(quán)重值為1. 4,“l(fā)isten”權(quán)重 值為1.2;則第二確定裝置根據(jù)第二預(yù)定規(guī)則,獲得各單項權(quán)重如下自然語言類別單項權(quán)重值=0. 5+1+1. 2 = 2. 7 ;地址類別單項權(quán)重值=1. 1+1. 6 = 2. 7 ;代碼類別單項權(quán)重值=2. 1+1. 4+1. 2 = 4. 7。需要說明的是,第二確定裝置還可結(jié)合上述兩項因素來獲得各單項權(quán)重值,例如, 若第二預(yù)定規(guī)則規(guī)定,單項權(quán)重值為各預(yù)定文本信息的出現(xiàn)次數(shù)乘以其權(quán)重值后相加所得 的值,則第二確定裝置根據(jù)第二預(yù)定規(guī)則,計算各個類別下預(yù)定文本信息的加權(quán)和作為相 應(yīng)類別的單項權(quán)重值,第三獲取裝置5所得的各特定類別的預(yù)定文本信息及其出現(xiàn)次數(shù)及 權(quán)重值如上述兩個實施例所示,則第二確定裝置分別獲得各個單項平均值如下自然語言類別單項權(quán)重值為8*0. 5+12*1+4*1. 2 = 20. 8 ;地址類別單項權(quán)重值為1*1. 1+1*1. 6 = 2. 7 ;代碼類別單項權(quán)重值為3*2. 1+4*1. 4+2*1. 2 = 14. 3。判斷裝置2檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象,判斷該 網(wǎng)頁信息是否符合預(yù)定條件。其中,所述預(yù)定條件還包括所述總評價值大于第五預(yù)定閾 值,而且所述各個單項評價值均大于相應(yīng)的各個預(yù)定閾值;所述第五預(yù)定閾值可由本領(lǐng)域 技術(shù)人員根據(jù)實際情況及需求來確定,但所述第五預(yù)定閾值的選取應(yīng)滿足大于或等于所述 第二預(yù)定閾值的條件。例如,訪問裝置中預(yù)設(shè)自然語言類別單項評價值的預(yù)定閾值為12,地址類別單項 評價值的預(yù)定閾值為1,代碼類別單項評價值的預(yù)定閾值為10,總評價值為76,且第一確定 裝置6所獲得的總評價值為106,第二確定裝置所獲得的自然語言類別單項權(quán)重值為20. 8, 地址類別單項權(quán)重值為2. 7,代碼類別單項權(quán)重值為14. 3,則判斷裝置2判定所述總評價值 大于第五預(yù)定閾值,而且所述各個單項評價值均大于相應(yīng)的各個預(yù)定閾值,則所述網(wǎng)頁信 息符合預(yù)定條件。
又例如,預(yù)設(shè)自然語言類別單項評價值的預(yù)定閾值為12,地址類別單項評價值的 預(yù)定閾值為5,代碼類別單項評價值的預(yù)定閾值為10,總評價值為76,且第一確定裝置6中 所獲得的總評價值為106,第二確定裝置所獲得的自然語言類別單項權(quán)重值為20.8,地址 類別單項權(quán)重值為2. 7,代碼類別單項權(quán)重值為14. 3,則判斷裝置2判斷地址類別單項權(quán)重 值小于其預(yù)定閾值,所述網(wǎng)頁信息不符合預(yù)定條件。第二確定裝置可在第一獲取裝置1之后,判斷裝置2之前執(zhí)行操作;或者,第二確 定裝置可以在判斷裝置2執(zhí)行判斷操作的過程中執(zhí)行操作,例如,判斷裝置2檢測到所述網(wǎng) 頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象后,通過第一確定裝置6和第二確定裝置執(zhí) 行的操作以獲得總評價值及各單項評價值,隨后,判斷裝置2判斷根據(jù)網(wǎng)頁信息所獲得的 總評價值及個單項評價值是否滿足總評價值大于第五預(yù)定閾值,且所述各個單項評價值均 大于相應(yīng)的各個預(yù)定閾值,以根據(jù)判斷結(jié)果來確定是否執(zhí)行第一請求發(fā)起裝置3的操作。需要說明的是,上述舉例僅為更好地說明本發(fā)明的技術(shù)方案,而非對本發(fā)明的限 制,本領(lǐng)域技術(shù)人員應(yīng)該理解,任何基于第二預(yù)定規(guī)則,根據(jù)所述網(wǎng)頁信息所包含的各個特 定類別的預(yù)定文本信息分別獲得相應(yīng)的各個單項評價值的實現(xiàn)方式,均應(yīng)包含在本發(fā)明的 范圍內(nèi)。作為本發(fā)明的優(yōu)選方案之一,其中,所述訪問裝置還包括第一更新裝置(圖未 示)°第一更新裝置通過根據(jù)多個網(wǎng)頁進(jìn)行預(yù)訓(xùn)練來確定所述預(yù)定條件。其中,所述預(yù) 訓(xùn)練的方式包括但不限于采用以下分類模型來實現(xiàn)1)支持向量機模型;2)貝葉斯模型; 3)最大熵模型等。所述預(yù)定條件包括分類模型判斷所獲得的網(wǎng)頁信息為需要進(jìn)行多次訪問 的網(wǎng)頁信息。具體的,訪問裝置獲得多個已確定為需發(fā)起多次訪問請求的網(wǎng)頁及多個已確定為 僅需發(fā)起一次訪問請求的網(wǎng)頁,隨后,第一更新裝置根據(jù)該等多個網(wǎng)頁來對分類模型進(jìn)行 訓(xùn)練,以獲得訓(xùn)練后的分類模型。則當(dāng)判斷裝置2判斷網(wǎng)頁信息中包含可執(zhí)行對象時,若分 類模型根據(jù)網(wǎng)頁信息所輸出的分類結(jié)果為需要進(jìn)行多次訪問的網(wǎng)頁信息,則判斷裝置2判 斷網(wǎng)頁信息符合預(yù)定條件,并執(zhí)行第一請求發(fā)起裝置3的操作。根據(jù)本實施例的訪問裝置,依據(jù)多層級的預(yù)定條件,來對網(wǎng)頁信息是否可能觸發(fā) 下次網(wǎng)頁請求進(jìn)行判定,使得判定的結(jié)果更加準(zhǔn)確,更加有效提高網(wǎng)頁訪問效率,避免因不 必要的網(wǎng)頁訪問請求所造成的資源浪費與時間消耗。對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細(xì)節(jié),而且在 不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論 從哪一點來看,均應(yīng)將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán) 利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有 變化涵括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。此 外,顯然“包括” 一詞不排除其他單元或步驟,單數(shù)不排除復(fù)數(shù)。系統(tǒng)權(quán)利要求中陳述的多 個單元或裝置也可以由一個單元或裝置通過軟件或者硬件來實現(xiàn)。第一,第二等詞語用來 表示名稱,而并不表示任何特定的順序。
權(quán)利要求
1.一種計算機實現(xiàn)的用于確定網(wǎng)頁訪問請求的方法,其中,該方法包括以下步驟 a獲取網(wǎng)頁信息;b當(dāng)檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象,判斷該網(wǎng)頁信息是 否符合預(yù)定條件;-當(dāng)所述網(wǎng)頁信息符合該預(yù)定條件時,發(fā)起與該可執(zhí)行對象相對應(yīng)的網(wǎng)頁訪問請求。
2.根據(jù)權(quán)利要求1所述的方法,其中,該方法還包括以下步驟 -獲取所述網(wǎng)頁信息中所包含的預(yù)定文本信息的數(shù)量;其中,所述預(yù)定條件包括-所述網(wǎng)頁信息所包含的預(yù)定文本信息數(shù)量大于或等于第一預(yù)定閾值。
3.根據(jù)權(quán)利要求1所述的方法,其中,該方法還包括以下步驟 -獲取所述網(wǎng)頁信息中包含的預(yù)定文本信息;-基于第一預(yù)定規(guī)則,根據(jù)所獲取的預(yù)定文本信息,來確定所述網(wǎng)頁信息的總評價值; 其中,所述預(yù)定條件還包括 -所述總評價值大于或等于第二預(yù)定閾值。
4.根據(jù)權(quán)利要求3所述的方法,其中,該方法還包括以下步驟 -獲取所述網(wǎng)頁信息所屬的網(wǎng)頁的重要度;其中,所述預(yù)定條件還包括-所述總評價值小于所述第三預(yù)定閾值且所述網(wǎng)頁的重要度大于第四預(yù)定閾值,其中, 所述第三預(yù)定閾值小于等于所述第二預(yù)定閾值。
5.根據(jù)權(quán)利要求3或4所述的方法,其中,所述第一預(yù)定規(guī)則根據(jù)以下至少任一項,來 確定所述總評價值-所述網(wǎng)頁信息所包含的預(yù)定文本信息的總數(shù)量; -所述網(wǎng)頁信息所包含的預(yù)定文本信息的總類別; -所述網(wǎng)頁信息所包含的所有預(yù)定文本信息所對應(yīng)的權(quán)重值; -所述網(wǎng)頁信息所包含的所有預(yù)定文本信息類別所對應(yīng)的權(quán)重值。
6.根據(jù)權(quán)利要求3至5中任一項所述的方法,其中,該方法還包括以下步驟-基于第二預(yù)定規(guī)則,根據(jù)所述網(wǎng)頁信息所包含的各個特定類別的預(yù)定文本信息分別 獲得相應(yīng)的各個單項評價值; 其中,所述預(yù)定條件還包括-所述總評價值大于第五預(yù)定閾值,而且所述各個單項評價值均大于相應(yīng)的各個預(yù)定 閾值。
7.根據(jù)權(quán)利要求6所述的方法,其中,所述第二預(yù)定規(guī)則包括,根據(jù)以下至少一項因 素,來確定所述單項評價值-所述網(wǎng)頁信息所包含的各個特定類別的預(yù)定文本信息分別對應(yīng)的數(shù)量; -所述網(wǎng)頁信息所包含的各個特定類別的預(yù)定文本信息分別對應(yīng)的權(quán)重值。
8.根據(jù)權(quán)利要求5至7中任一項所述的方法,其中,所述類別包括 -自然語言類別;-地址類別; -代碼類別。
9.根據(jù)權(quán)利要求2至8中任一項所述的方法,其中,所述預(yù)定文本信息包括以下至少一類-短文本信息; -短文本信息組合。
10.根據(jù)權(quán)利要求1至9中任一項所述的方法,其中,該方法還包括以下步驟 -通過根據(jù)多個網(wǎng)頁進(jìn)行預(yù)訓(xùn)練來確定所述預(yù)定條件。
11.根據(jù)權(quán)利要求1至10中任一項所述的方法,其中,該方法還包括以下步驟-當(dāng)判斷一個網(wǎng)頁信息符合該預(yù)定條件時,根據(jù)該網(wǎng)頁信息所屬網(wǎng)頁的地址信息來建 立或更新網(wǎng)頁類別庫。
12.根據(jù)權(quán)利要求11所述的方法,其中,該方法包括以下步驟 -獲取一個新網(wǎng)頁信息及其所屬網(wǎng)頁的地址信息;-基于所獲取的網(wǎng)頁的地址信息來在所述網(wǎng)頁類別庫中進(jìn)行查詢,以獲得查詢結(jié)果; -當(dāng)所述查詢結(jié)果為匹配時,對該新網(wǎng)頁信息中的可執(zhí)行對象發(fā) 起相對應(yīng)的網(wǎng)頁訪問請求。
13.根據(jù)權(quán)利要求1至12中任一項所述的方法,其中,所述可執(zhí)行對象包括基于Java、 JS、Ajax 和 / 或 VBscript 的對象。
14.一種用于確定網(wǎng)頁訪問請求的訪問裝置,其中,該訪問裝置包括 第一獲取裝置、用于獲取網(wǎng)頁信息;判斷裝置、用于當(dāng)檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象,判斷 該網(wǎng)頁信息是否符合預(yù)定條件;第一請求發(fā)起裝置、用于當(dāng)所述網(wǎng)頁信息符合該預(yù)定條件時,發(fā)起與該可執(zhí)行對象相 對應(yīng)的網(wǎng)頁訪問請求。
15.根據(jù)權(quán)利要求14所述的訪問裝置,其中,該訪問裝置還包括 第二獲取裝置、用于獲取所述網(wǎng)頁信息中所包含的預(yù)定文本信息的數(shù)量; 其中,所述預(yù)定條件包括-所述網(wǎng)頁信息所包含的預(yù)定文本信息數(shù)量大于或等于第一預(yù)定閾值。
16.根據(jù)權(quán)利要求14所述的訪問裝置,其中,該訪問裝置還包括 第三獲取裝置、用于獲取所述網(wǎng)頁信息中包含的預(yù)定文本信息;第一確定裝置、用于基于第一預(yù)定規(guī)則,根據(jù)所獲取的預(yù)定文本信息,來確定所述網(wǎng)頁 信息的總評價值;其中,所述預(yù)定條件還包括 -所述總評價值大于或等于第二預(yù)定閾值。
17.根據(jù)權(quán)利要求16所述的訪問裝置,其中,該訪問裝置還包括 第四獲取裝置、用于獲取所述網(wǎng)頁信息所屬的網(wǎng)頁的重要度; 其中,所述預(yù)定條件還包括-所述總評價值小于所述第三預(yù)定閾值且所述網(wǎng)頁的重要度大于第四預(yù)定閾值,其中, 所述第三預(yù)定閾值小于等于所述第二預(yù)定閾值。
18.根據(jù)權(quán)利要求16或17所述的訪問裝置,其中,所述第一預(yù)定規(guī)則包含,根據(jù)以下至 少任一項,來確定所述總評價值-所述網(wǎng)頁信息所包含的預(yù)定文本信息的總數(shù)量; -所述網(wǎng)頁信息所包含的預(yù)定文本信息的總類別; -所述網(wǎng)頁信息所包含的所有預(yù)定文本信息所對應(yīng)的權(quán)重值; -所述網(wǎng)頁信息所包含的所有預(yù)定文本信息類別所對應(yīng)的權(quán)重值。
19.根據(jù)權(quán)利要求16至18中任一項所述的訪問裝置,其中,該訪問裝置還包括 第二確定裝置、用于基于第二預(yù)定規(guī)則,根據(jù)所述網(wǎng)頁信息所包含的各個特定類別的預(yù)定文本信息分別獲得相應(yīng)的各個單項評價值; 其中,所述預(yù)定條件還包括-所述總評價值大于第五預(yù)定閾值,而且所述各個單項評價值均大于相應(yīng)的各個預(yù)定 閾值。
20.根據(jù)權(quán)利要求19所述的訪問裝置,其中,所述第二預(yù)定規(guī)則根據(jù)以下至少一項因 素,來確定所述單項評價值-所述網(wǎng)頁信息所包含的各個特定類別的預(yù)定文本信息分別對應(yīng)的數(shù)量; -所述網(wǎng)頁信息所包含的各個特定類別的預(yù)定文本信息分別對應(yīng)的權(quán)重值。
21.根據(jù)權(quán)利要求18至20中任一項所述的訪問裝置,其中,所述類別包括 -自然語言類別;-地址類別; -代碼類別。
22.根據(jù)權(quán)利要求15至21中任一項所述的訪問裝置,其中,所述預(yù)定文本信息包括以 下至少一類-短文本信息; -短文本信息組合。
23.根據(jù)權(quán)利要求14至21中任一項所述的訪問裝置,其中,該訪問裝置還包括 第一更新裝置、用于通過根據(jù)多個網(wǎng)頁進(jìn)行預(yù)訓(xùn)練來確定所述預(yù)定條件。
24.根據(jù)權(quán)利要求14至23中任一項所述的訪問裝置,其中,該訪問裝置還包括 第二更新裝置、用于當(dāng)判斷一個網(wǎng)頁信息符合該預(yù)定條件時,根據(jù)該網(wǎng)頁信息所屬網(wǎng)頁的地址信息來建立或更新網(wǎng)頁類別庫。
25.根據(jù)權(quán)利要求M所述的訪問裝置,其中,該訪問裝置包括 第五獲取裝置、用于當(dāng)獲取一個新網(wǎng)頁信息及其所屬網(wǎng)頁的地址信息;查詢裝置、用于基于所獲取的網(wǎng)頁的地址信息來在所述網(wǎng)頁類別庫中進(jìn)行查詢,以獲 得查詢結(jié)果;第二請求發(fā)起裝置、用于當(dāng)所述查詢結(jié)果為匹配時,對該新網(wǎng)頁信息中的可執(zhí)行對象 發(fā)起相對應(yīng)的網(wǎng)頁訪問請求。
26.根據(jù)權(quán)利要求14至25中任一項所述的訪問裝置,其中,所述可執(zhí)行對象包括基于 Java、JS, Ajax 和 / 或 VBscript 的對象。
27.一種計算機設(shè)備,其中,該計算機設(shè)備包括如權(quán)利要求14至16中任一項所述的訪 問裝置。
全文摘要
本發(fā)明涉及一種用于確定網(wǎng)頁訪問請求的方法和設(shè)備,其中,根據(jù)本發(fā)明的方案獲取網(wǎng)頁信息;當(dāng)檢測到所述網(wǎng)頁信息中包括可能觸發(fā)網(wǎng)頁訪問的可執(zhí)行對象,判斷該網(wǎng)頁信息是否符合預(yù)定條件;當(dāng)所述網(wǎng)頁信息符合該預(yù)定條件時,發(fā)起與該可執(zhí)行對象相對應(yīng)的網(wǎng)頁訪問請求。與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點在于能夠預(yù)先判定網(wǎng)頁中是否可能包含可執(zhí)行對象,對不包含可執(zhí)行對象的網(wǎng)頁不再發(fā)起網(wǎng)頁請求,提高了網(wǎng)頁瀏覽的效率。
文檔編號G06F17/30GK102073728SQ20111000677
公開日2011年5月25日 申請日期2011年1月13日 優(yōu)先權(quán)日2011年1月13日
發(fā)明者姚遠(yuǎn) 申請人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
正宁县| 翁牛特旗| 左云县| 巴南区| 木兰县| 固镇县| 沙坪坝区| 石渠县| 博野县| 正蓝旗| 九寨沟县| 浦江县| 汝城县| 莱阳市| 普格县| 内黄县| 化州市| 双流县| 德化县| 江华| 盐边县| 自贡市| 沙河市| 惠安县| 道孚县| 灵武市| 塔河县| 凤凰县| 玉林市| 正宁县| 宜宾市| 当雄县| 宣武区| 秦皇岛市| 永吉县| 娄烦县| 三门峡市| 页游| 施秉县| 布尔津县| 化德县|