專(zhuān)利名稱(chēng):用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置及方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)搜索技術(shù)領(lǐng)域,尤其涉及一種用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置及方法。
背景技術(shù):
互聯(lián)網(wǎng)的搜索引擎面向數(shù)以億萬(wàn)計(jì)的各種各樣的網(wǎng)頁(yè),雖然現(xiàn)有的搜索技術(shù)和相應(yīng)的搜索算法已取得了巨大的改進(jìn)及飛躍,但是在處理海量的形形色色的網(wǎng)頁(yè)時(shí)難免出現(xiàn)搜索結(jié)果效果不理想的情況,例如,搜索結(jié)果的相關(guān)性不好、搜索結(jié)果的展現(xiàn)效果不好、死鏈、亂碼、搜索結(jié)果重復(fù)、標(biāo)題摘要不準(zhǔn)確等現(xiàn)象,我們統(tǒng)稱(chēng)這些現(xiàn)象為Bad Case,及時(shí)發(fā)現(xiàn)這些Bad Case并進(jìn)行相應(yīng)的進(jìn)行搜索算法的改進(jìn),對(duì)于互聯(lián)網(wǎng)的搜索引擎異常重要。
發(fā)明內(nèi)容
本發(fā)明旨在至少解決上述技術(shù)問(wèn)題之一。為此,本發(fā)明的一個(gè)目的在于提出一種可以在用戶使用搜索引擎的同時(shí)自動(dòng)對(duì)搜索結(jié)果進(jìn)行分析進(jìn)而挖掘出搜索壞點(diǎn)并自動(dòng)向后臺(tái)服務(wù)器反饋以用于搜索引擎改進(jìn)的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置。本發(fā)明的另一目的在于提出一種用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的第一方面實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置包括提取模塊,所述提取模塊用于提取所述搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者所述搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息;判斷模塊,所述判斷模塊用于根據(jù)所述結(jié)構(gòu)信息或所述每條信息項(xiàng)的信息判斷所述搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn);以及自動(dòng)反饋模塊,所述自動(dòng)反饋模塊用于將所述搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置,一方面通過(guò)提取模塊和判斷模塊可以實(shí)現(xiàn)對(duì)搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息分析及每條信息項(xiàng)所包括的死鏈、標(biāo)題、摘要和搜索關(guān)鍵字進(jìn)行檢查判斷,進(jìn)而挖掘出相關(guān)性或展現(xiàn)效果不好的搜索結(jié)果并反饋給后臺(tái)服務(wù)器,便于改進(jìn)搜索引擎算法;另一方面該裝置可以利用搜索引擎客戶端的空閑資源進(jìn)行搜索結(jié)果頁(yè)面的提取、分析、判斷及反饋,節(jié)約資源,同時(shí)在用戶使用搜索引擎時(shí)同步實(shí)現(xiàn)對(duì)搜索結(jié)果頁(yè)面的分析,不需要單獨(dú)向搜索引擎發(fā)起分析請(qǐng)求,不會(huì)造成對(duì)搜索產(chǎn)品本身的壓力,也不會(huì)對(duì)用戶的使用產(chǎn)生影響。為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的第二方面實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法包括以下步驟提取所述搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者所述搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息;根據(jù)所述結(jié)構(gòu)信息或所述每條信息項(xiàng)的信息判斷所述搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn);以及將所述搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法,一方面通過(guò)提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息,對(duì)搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息分析及每條信息項(xiàng)所包括的死鏈、標(biāo)題、摘要和搜索關(guān)鍵字進(jìn)行檢查判斷,進(jìn)而挖掘出相關(guān)性或展現(xiàn)效果不好的搜索結(jié)果并反饋給后臺(tái)服務(wù)器,便于改進(jìn)搜索引擎算法;另一方面該方法可以利用搜索引擎客戶端的空閑資源進(jìn)行搜索結(jié)果頁(yè)面的提取、分析、判斷及反饋,節(jié)約資源,同時(shí)在用戶使用搜索引擎時(shí)同步實(shí)現(xiàn)對(duì)搜索結(jié)果頁(yè)面的分析,不需要單獨(dú)向搜索引擎發(fā)起分析請(qǐng)求,不會(huì)造成對(duì)搜索產(chǎn)品本身的壓力,也不會(huì)對(duì)用戶的使用產(chǎn)生影響。本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過(guò)本發(fā)明的實(shí)踐了解到。
本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中,圖I是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置的結(jié)構(gòu)框圖;圖2是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置的結(jié)構(gòu)框圖;圖3是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置的結(jié)構(gòu)框圖;圖4是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法的流程圖;圖5是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法的流程圖;以及圖6是根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法的流程圖。
具體實(shí)施例方式下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類(lèi)似的標(biāo)號(hào)表示相同或類(lèi)似的元件或具有相同或類(lèi)似功能的元件。下面通過(guò)參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。相反,本發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書(shū)的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。在本發(fā)明的描述中,需要理解的是,術(shù)語(yǔ)“第一”、“第二”等僅用于描述目的,而不能理解為指示或暗示相對(duì)重要性。在本發(fā)明的描述中,需要說(shuō)明的是,除非另有明確的規(guī)定和限定,術(shù)語(yǔ)“相連”、“連接”應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機(jī)械連接,也可以是電連接;可以是直接相連,也可以通過(guò)中間媒介間接相連。對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以具體情況理解上述術(shù)語(yǔ)在本發(fā)明中的具體含義。此外,在本發(fā)明的描述中,除非另有說(shuō)明,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上。流程圖中或在此以其他方式描述的任何過(guò)程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過(guò)程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來(lái)執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。下面參考說(shuō)明書(shū)附圖描述根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置。一種用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置,包括提取模塊,提取模塊用于提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息;判斷模塊,判斷模塊用于根據(jù)結(jié)構(gòu)信息或每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn);以及自動(dòng)反饋模塊,自動(dòng)反饋模塊用于將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。圖I為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置的結(jié)構(gòu)框圖。如圖I所示,根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置包括 提取模塊100、判斷模塊200和自動(dòng)反饋模塊300。具體地,提取模塊100用于提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息。在本發(fā)明的一個(gè)實(shí)施例中,結(jié)構(gòu)信息包括搜索結(jié)果頁(yè)面包括的廣告信息項(xiàng)的數(shù)目及位置和普通信息項(xiàng)的數(shù)目及位置。具體地,廣告信息項(xiàng)可以包括品牌廣告、贊助商鏈接廣告、推廣廣告、品牌保護(hù)結(jié)果等,普通信息項(xiàng)可以為AS結(jié)果,此為還包括Aladdin結(jié)果(搜索引擎百度推出的通用開(kāi)放平臺(tái),將接口開(kāi)放提供給獨(dú)特信息數(shù)據(jù)的擁有者,解決現(xiàn)有搜索引擎無(wú)法抓取和檢索到的暗網(wǎng)信息)等。在本發(fā)明的一個(gè)實(shí)施例中,每條信息項(xiàng)的信息包括每條信息項(xiàng)包括的鏈接、標(biāo)題、摘要和搜索關(guān)鍵字。在本發(fā)明的一個(gè)實(shí)施例中,提取模塊100的功能可以使用JavaScript進(jìn)行定義,例如定義一個(gè)batOverlay. js文件,該batOverlay. js文件里面定義了一個(gè)類(lèi)bat (可執(zhí)行文件)及相關(guān)的方法以用于初始化,同時(shí)在該batOverlay. js文件里面定義了各種針對(duì)搜索結(jié)果進(jìn)行分析的函數(shù)。例如函數(shù)Bat. page_analysis()可以對(duì)搜索結(jié)果頁(yè)面包括的廣告信息項(xiàng)的數(shù)目及位置和普通信息項(xiàng)的數(shù)目及位置進(jìn)行分析,如調(diào)用該函數(shù)對(duì)某個(gè)搜索結(jié)果頁(yè)面進(jìn)行頁(yè)面分析之后輸出的結(jié)果為{P:l,AS:5, AL: I, AS:3},其中,P: I表示一個(gè)品牌廣告位于第一個(gè)位置,AS:5表示5個(gè)普通結(jié)果,位置在一個(gè)品牌廣告的后面,AL: I表示I個(gè) Aladdin結(jié)果,位置在5個(gè)普通結(jié)果的后面,AS: 3表不3個(gè)普通結(jié)果,位置在I個(gè)Aladdin結(jié)果的后面。判斷模塊200用于根據(jù)結(jié)構(gòu)信息或每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。具體地,判斷模塊200根據(jù)結(jié)構(gòu)信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。首先設(shè)置搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息的閾值,例如在一個(gè)搜索結(jié)果頁(yè)面中根據(jù)用戶輸入的搜索關(guān)鍵字設(shè)置廣告信息項(xiàng)的數(shù)目閾值為1,Aladdin結(jié)果的數(shù)目閾值為1,如果一個(gè)搜索結(jié)果頁(yè)面中的設(shè)置廣告信息項(xiàng)的數(shù)目或者Aladdin結(jié)果的數(shù)目超過(guò)設(shè)置的閾值1,則判斷模塊200判斷該搜索結(jié)果頁(yè)面中存在搜索壞點(diǎn)。判斷模塊200還可以根據(jù)每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。例如,如果每條信息項(xiàng)中的第一信息項(xiàng)包括的鏈接是無(wú)法打開(kāi)的鏈接,或者第一信息項(xiàng)不包括摘要,或者第一信息項(xiàng)包括的標(biāo)題和/或摘要重復(fù),或者第一信息項(xiàng)包括的標(biāo)題或摘要中不包含搜索關(guān)鍵字,則判斷模塊200判斷該第一信息項(xiàng)是搜索壞點(diǎn)。在本發(fā)明的一個(gè)實(shí)施例中,判斷模塊200的功能也可以使用JavaScript進(jìn)行定義,例如定義的batOverlay. js文件里面定義了各種針對(duì)搜索結(jié)果進(jìn)行分析的函數(shù),如函數(shù) Bat. Iinkcheck(type)、Bat. is_equal O、Bat. piaohongO 等。例如,使用函數(shù) Bat.Iinkcheck(type)可以對(duì)搜索結(jié)果的信息項(xiàng)進(jìn)行死鏈檢查,其中,當(dāng)參數(shù)type = all表示對(duì)搜索結(jié)果頁(yè)面中的所有信息項(xiàng)進(jìn)行死鏈檢查,當(dāng)參數(shù)type = top表示對(duì)搜索結(jié)果頁(yè)面中的前三條信息項(xiàng)進(jìn)行死鏈檢查,當(dāng)參數(shù)type = random表示對(duì)搜索結(jié)果頁(yè)面中隨機(jī)的三條信息項(xiàng)進(jìn)行死鏈檢查。使用函數(shù)Bat. is_eqUal()可以判斷搜索結(jié)果頁(yè)面中是否存在標(biāo)題或者摘要相同的信息項(xiàng)。使用函數(shù)Bat. piaohong O可以判斷搜索結(jié)果頁(yè)面中的飄紅是否正 常,標(biāo)題和摘要中是否有無(wú)飄紅的情況,即信息項(xiàng)中的標(biāo)題或摘要中是否包含搜索關(guān)鍵字。使用函數(shù)Bat. title_abstract()可以檢查搜索結(jié)果頁(yè)面中信息項(xiàng)的標(biāo)題摘要是否正確,例如調(diào)用該函數(shù)之后的一個(gè)輸出結(jié)果為{A:10,Al :{0,0,0},A2 :{0,1,0},…,AlO :{0,0,0}},表示共展現(xiàn)了 10條普通結(jié)果,其中第2條結(jié)果(A2 : {0,I,0})的摘要標(biāo)記為I,表示摘要有異常。自動(dòng)反饋模塊300用于將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。在本發(fā)明的一個(gè)實(shí)施例中,自動(dòng)反饋模塊300通過(guò)使用HTTP請(qǐng)求向后臺(tái)服務(wù)器進(jìn)行反饋。例如,自動(dòng)反饋模塊300將判斷模塊200所判斷的存在搜索壞點(diǎn)的搜索結(jié)果以json (JavaScript Object Notation,輕量級(jí)的數(shù)據(jù)交換格式)格式通過(guò)HTTP Service端口傳遞到后臺(tái)服務(wù)器,HTTP Service端口提供一個(gè)write_db. php文件,該文件能夠?qū)OST傳遞的數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)中,在瀏覽器中可以通過(guò)插件經(jīng)由XmlHttpRequest請(qǐng)求該write_db. php對(duì)應(yīng)的php頁(yè)面將結(jié)果上傳到數(shù)據(jù)庫(kù)中,其中,自動(dòng)反饋模塊300可以將上述功能封裝起來(lái),當(dāng)判斷模塊200判斷存在搜索壞點(diǎn)時(shí)將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置,一方面通過(guò)提取模塊和判斷模塊可以實(shí)現(xiàn)對(duì)搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息分析及每條信息項(xiàng)所包括的死鏈、標(biāo)題、摘要和搜索關(guān)鍵字進(jìn)行檢查判斷,進(jìn)而挖掘出相關(guān)性或展現(xiàn)效果不好的搜索結(jié)果并反饋給后臺(tái)服務(wù)器,便于改進(jìn)搜索引擎算法;另一方面該裝置可以利用搜索引擎客戶端的空閑資源進(jìn)行搜索結(jié)果頁(yè)面的提取、分析、判斷及反饋,節(jié)約資源,同時(shí)在用戶使用搜索引擎時(shí)同步實(shí)現(xiàn)對(duì)搜索結(jié)果頁(yè)面的分析,不需要單獨(dú)向搜索引擎發(fā)起分析請(qǐng)求,不會(huì)造成對(duì)搜索產(chǎn)品本身的壓力,也不會(huì)對(duì)用戶的使用產(chǎn)生影響。圖2為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置的結(jié)構(gòu)框圖。如圖2所示,根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置包括提取模塊100、判斷模塊200、自動(dòng)反饋模塊300和手動(dòng)反饋模塊400。具體地,提取模塊100用于提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息。判斷模塊200用于根據(jù)結(jié)構(gòu)信息或每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。自動(dòng)反饋模塊300用于將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。手動(dòng)反饋模塊400提供接口從而用戶能夠使用接口來(lái)向后臺(tái)服務(wù)器反饋對(duì)搜索結(jié)果的意見(jiàn)。在本發(fā)明的一個(gè)實(shí)施例中,自動(dòng)反饋模塊300或手動(dòng)反饋模塊400通過(guò)使用HTTP請(qǐng)求向后臺(tái)服務(wù)器進(jìn)行反饋。例如,自動(dòng)反饋模塊300或手動(dòng)反饋模塊400將判斷模塊200所判斷的存在搜索壞點(diǎn)的搜索結(jié)果以j son (JavaScript Object Notation,輕量級(jí)的數(shù)據(jù)交換格式)格式通過(guò)HTTP Service端口傳遞到后臺(tái)服務(wù)器,HTTP Service端口提供一個(gè)write_db. php文件,該文件能夠?qū)OST傳遞的數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)中,在瀏覽器中可以通過(guò)插件經(jīng)由XmlHttpRequest請(qǐng)求該write_db. php對(duì)應(yīng)的php頁(yè)面將結(jié)果上傳到數(shù)據(jù)庫(kù)中。其中,自動(dòng)反饋模塊300可以將上述功能封裝起來(lái),當(dāng)判斷模塊200判斷存在搜索壞點(diǎn)時(shí)將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器,手動(dòng)反饋模塊400可以將上述功能做成接口,當(dāng)用戶認(rèn)為搜索結(jié)果效果不好時(shí)可以快捷反饋,通過(guò)簡(jiǎn)單的功能按鈕例如右鍵菜單可以方便及時(shí)地反饋搜索壞點(diǎn),做到一鍵式反饋。根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置,當(dāng)用戶認(rèn)為搜索結(jié)果效果不好時(shí)可以通過(guò)手動(dòng)反饋模塊快捷地反饋向后臺(tái)服務(wù)器盡心反饋,通過(guò)用戶加速搜索壞點(diǎn)的發(fā)現(xiàn),提高效率,同時(shí)將手動(dòng)反饋模塊包裝成接口,用戶通過(guò)簡(jiǎn)單的功能按鈕即可方便及時(shí)地反饋搜索壞點(diǎn),降低用戶參與測(cè)試的成本。圖3為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置的結(jié)構(gòu)框圖。如圖3所示,根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置包括提取模塊100、判斷模塊200、設(shè)置單元210、比較單元220、確定單元230和自動(dòng)反饋模塊300。具體地,提取模塊100用于提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息。判斷模塊200用于根據(jù)結(jié)構(gòu)信息或每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。在本發(fā)明的一個(gè)實(shí)施例中,判斷模塊200包括設(shè)置單元210、比較單元220和確定單元230。更具體地,設(shè)置單元210用于根據(jù)搜索關(guān)鍵字設(shè)置搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息的閾值。例如,在一個(gè)搜索結(jié)果頁(yè)面中根據(jù)用戶輸入的搜索關(guān)鍵字設(shè)置廣告信息項(xiàng)的數(shù)目閾值為1,Aladdin結(jié)果數(shù)目閾值為I。比較單元220用于將結(jié)構(gòu)信息與閾值比較。具體地,比較單元將提取模塊100提取的結(jié)構(gòu)信息與設(shè)置單元210設(shè)置的結(jié)構(gòu)信息的閾值相比較。確定單元230用于根據(jù)比較單元220的比較結(jié)果或者根據(jù)每條信息項(xiàng)的信息確定搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。在本發(fā)明的一個(gè)實(shí)施例中,確定單元230用于根據(jù)比較單元220的比較結(jié)果確定搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn),例如如果根據(jù)比較單元220的比較結(jié)果,一個(gè)搜索結(jié)果頁(yè)面中的廣告信息項(xiàng)的數(shù)目為2或者Aladdin結(jié)果的數(shù)目為3,超過(guò)設(shè)置的閾值,則確定單元230確定搜索結(jié)果頁(yè)面中存在搜索壞點(diǎn)。在本發(fā)明的一個(gè)實(shí)施例中,確定單元230還用于根據(jù)每條信息項(xiàng)的信息確定搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn),例如,如果每條信息項(xiàng)中的第一信息項(xiàng)包括的鏈接是無(wú)法打開(kāi)的鏈接,或者第一信息項(xiàng)不包括摘要,或者第一信息項(xiàng)包括的標(biāo)題和/或摘要重復(fù),或 者第一信息項(xiàng)包括的標(biāo)題或摘要中不包含搜索關(guān)鍵字,則確定單元230確定該第一信息項(xiàng)是搜索壞點(diǎn)。在本發(fā)明的一個(gè)實(shí)施例中,確定單元230根據(jù)每條信息項(xiàng)的信息確定搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)的功能也可以使用JavaScript進(jìn)行定義,例如定義的batOverlay.js文件里面定義了各種針對(duì)搜索結(jié)果進(jìn)行分析的函數(shù),如函數(shù)Bat. Iinkcheck(type)、Bat. is_equal O、Bat. piaohong O 等。例如,使用函數(shù) Bat. Iinkcheck (type)可以對(duì)搜索結(jié)果的信息項(xiàng)進(jìn)行死鏈檢查,其中,當(dāng)參數(shù)type = all表示對(duì)搜索結(jié)果頁(yè)面中的所有信息項(xiàng)進(jìn)行死鏈檢查,當(dāng)參數(shù)type = top表示對(duì)搜索結(jié)果頁(yè)面中的前三條信息項(xiàng)進(jìn)行死鏈檢查,當(dāng)參數(shù)type = random表示對(duì)搜索結(jié)果頁(yè)面中隨機(jī)的三條信息項(xiàng)進(jìn)行死鏈檢查。使用函數(shù)Bat. is_equal()可以判斷搜索結(jié)果頁(yè)面中是否存在標(biāo)題或者摘要相同的信息項(xiàng)。使用函數(shù)Bat. piaohongO可以判斷搜索結(jié)果頁(yè)面中的飄紅是否正常,標(biāo)題和摘要中是否有無(wú)飄紅的情況,即信息項(xiàng)中的標(biāo)題或摘要中是否包含搜索關(guān)鍵字。使用函數(shù)Bat. title_abstract O可以檢查搜索結(jié)果頁(yè)面中信息項(xiàng)的標(biāo)題摘要是否正確,例如調(diào)用該函數(shù)之后的一個(gè)輸出結(jié)果為{A:10, Al :{0,0,0},A2 :{0,1,0},…,AlO : {0,0,0}},表示共展現(xiàn)了 10 條普通結(jié)果,其中第2條結(jié)果(A2 :{0,1,0})的摘要標(biāo)記為1,表示摘要有異常。 自動(dòng)反饋模塊300用于將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。手動(dòng)反饋模塊400提供接口從而用戶能夠使用接口來(lái)向后臺(tái)服務(wù)器反饋對(duì)搜索結(jié)果的意見(jiàn)。在本發(fā)明的一個(gè)實(shí)施例中,自動(dòng)反饋模塊300或手動(dòng)反饋模塊400通過(guò)使用HTTP請(qǐng)求向后臺(tái)服務(wù)器進(jìn)行反饋。例如,自動(dòng)反饋模塊300或手動(dòng)反饋模塊400將確定單元230所確定的存在搜索壞點(diǎn)的結(jié)果以j son (JavaScript Object Notation,輕量級(jí)的數(shù)據(jù)交換格式)格式通過(guò)HTTP Service端口傳遞到后臺(tái)服務(wù)器,HTTP Service端口提供一個(gè)write_db. php文件,該文件能夠?qū)OST傳遞的數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)中,在瀏覽器中可以通過(guò)插件經(jīng)由XmlHttpRequest請(qǐng)求該write_db. php對(duì)應(yīng)的php頁(yè)面將結(jié)果回傳到數(shù)據(jù)庫(kù)中,其中,自動(dòng)反饋模塊300可以將上述功能封裝起來(lái),當(dāng)確定單元230確定存在搜索壞點(diǎn)時(shí)將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器,手動(dòng)反饋模塊400可以將上述功能做成接口,當(dāng)用戶認(rèn)為搜索結(jié)果效果不好時(shí)可以快捷地向后臺(tái)服務(wù)器反饋。根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置,通過(guò)提取模塊提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息及搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息,再通過(guò)設(shè)置單元、比較單元和確定單元實(shí)現(xiàn)對(duì)搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息分析及每條信息項(xiàng)所包括的死鏈、標(biāo)題、摘要和搜索關(guān)鍵字進(jìn)行檢查判斷,進(jìn)而挖掘出相關(guān)性或展現(xiàn)效果不好的搜索結(jié)果并反饋給后臺(tái)服務(wù)器,便于改進(jìn)搜索引擎算法;另一方面該裝置可以利用搜索引擎客戶端的空閑資源進(jìn)行搜索結(jié)果頁(yè)面提取、分析、判斷及反饋,節(jié)約資源,同時(shí)在用戶使用搜索引擎時(shí)同步實(shí)現(xiàn)對(duì)搜索結(jié)果頁(yè)面的分析,不需要單獨(dú)向搜索引擎發(fā)起分析請(qǐng)求,不會(huì)造成對(duì)搜索產(chǎn)品本身的壓力,也不會(huì)對(duì)用戶的使用產(chǎn)生影響。下面參考說(shuō)明書(shū)附圖描述根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法。一種用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法,包括以下步驟提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息;根據(jù)結(jié)構(gòu)信息或每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn);以及將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。圖4為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法的流程圖。
如圖4所示,根據(jù)本發(fā)明實(shí)施例用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法,包括下述步驟。步驟S101,提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信
肩、O在本發(fā)明的一個(gè)實(shí)施例中,結(jié)構(gòu)信息包括搜索結(jié)果頁(yè)面包括的廣告信息項(xiàng)的數(shù)目及位置和普通信息項(xiàng)的數(shù)目及位置。具體地,廣告信息項(xiàng)可以包括品牌廣告、贊助商鏈接廣告、推廣廣告、品牌保護(hù)結(jié)果等,普通信息項(xiàng)可以為AS結(jié)果,此為還包括Aladdin結(jié)果(搜索引擎百度推出的通用開(kāi)放平臺(tái),將接口開(kāi)放提供給獨(dú)特信息數(shù)據(jù)的擁有者,解決現(xiàn)有搜索引擎無(wú)法抓取和檢索到的暗網(wǎng)信息)等。在本發(fā)明的一個(gè)實(shí)施例中,每條信息項(xiàng)的信息包括每條信息項(xiàng)包括的鏈接、標(biāo)題、摘要和搜索關(guān)鍵字。在本發(fā)明的一個(gè)實(shí)施例中,提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息的功能可以使用JavaScript進(jìn)行定義,例如定義一個(gè)batOverlay. js文件,該batOverlay. js文件里面定義了一個(gè)類(lèi)bat (可執(zhí)行文件)及相關(guān)的方法以用于初始化,同時(shí)在該batOverlay. js文件里面定義了各種針對(duì)搜索結(jié)果進(jìn)行分析的函數(shù)。例如函數(shù)Bat.page_analySiS()可以對(duì)搜索結(jié)果頁(yè)面包括的廣告信息項(xiàng)的數(shù)目及位置和普通信息項(xiàng)的數(shù)目及位置進(jìn)行分析,如調(diào)用該函數(shù)對(duì)某個(gè)搜索結(jié)果頁(yè)面進(jìn)行頁(yè)面分析之后輸出的結(jié)果為{P: I,AS: 5, AL: I, AS: 3},其中,P: I表不一個(gè)品牌廣告位于第一個(gè)位置,AS: 5表不5個(gè)普通結(jié)果,位置在一個(gè)品牌廣告的后面,AL: I表示I個(gè)Aladdin結(jié)果,位置在5個(gè)普通結(jié)果的后面,AS: 3表不3個(gè)普通結(jié)果,似直在I個(gè)Aladdin結(jié)果的后面。步驟S102,根據(jù)結(jié)構(gòu)信息或每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。具體地,根據(jù)結(jié)構(gòu)信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)首先需要設(shè)置搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息的閾值,例如在一個(gè)搜索結(jié)果頁(yè)面中根據(jù)用戶輸入的搜索關(guān)鍵字設(shè)置廣告信息項(xiàng)的數(shù)目閾值為1,Aladdin結(jié)果的數(shù)目閾值為1,如果一個(gè)搜索結(jié)果頁(yè)面中的設(shè)置廣告信息項(xiàng)的數(shù)目或者Aladdin結(jié)果的數(shù)目超過(guò)設(shè)置的閾值1,則判斷搜索結(jié)果頁(yè)面中存在搜索壞點(diǎn)。根據(jù)每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)主要通過(guò)特定的現(xiàn)象實(shí)現(xiàn),例如,如果每條信息項(xiàng)中的第一信息項(xiàng)包括的鏈接是無(wú)法打開(kāi)的鏈接,或者第一信息項(xiàng)不包括摘要,或者第一信息項(xiàng)包括的標(biāo)題和/或摘要重復(fù),或者第一信息項(xiàng)包括的標(biāo)題或摘要中不包含搜索關(guān)鍵字,則判斷該第一信息項(xiàng)是搜索壞點(diǎn)。在本發(fā)明的一個(gè)實(shí)施例中,根據(jù)每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)的功能可以利用batOverlay. js文件里面定義的各種搜索結(jié)果分析的函數(shù)。例如,使用JavaScript進(jìn)行定義,例如定義的batOverlay. js文件里面定義了各種針對(duì)搜索 結(jié)果進(jìn)行分析的函數(shù),如函數(shù) Bat. Iinkcheck(type)、Bat. is_equal O、Bat. piaohongO等。例如,使用函數(shù)Bat. Iinkcheck(type)可以對(duì)搜索結(jié)果的信息項(xiàng)進(jìn)行死鏈檢查,其中,當(dāng)參數(shù)type = all表示對(duì)搜索結(jié)果頁(yè)面中的所有信息項(xiàng)進(jìn)行死鏈檢查,當(dāng)參數(shù)type = top表示對(duì)搜索結(jié)果頁(yè)面中的前三條信息項(xiàng)進(jìn)行死鏈檢查,當(dāng)參數(shù)type = random表示對(duì)搜索結(jié)果頁(yè)面中隨機(jī)的三條信息項(xiàng)進(jìn)行死鏈檢查。使用函數(shù)Bat. is_eqUal()可以判斷搜索結(jié)果頁(yè)面中是否存在標(biāo)題或者摘要相同的信息項(xiàng)。使用函數(shù)Bat. piaohongO可以判斷搜索結(jié)果頁(yè)面中的飄紅是否正常,標(biāo)題和摘要中是否有無(wú)飄紅的情況,即信息項(xiàng)中的標(biāo)題或摘要中是否包含搜索關(guān)鍵字。使用函數(shù)Bat. title_abstract()可以檢查搜索結(jié)果頁(yè)面中信息項(xiàng)的標(biāo)題摘要是否正確,例如調(diào)用該函數(shù)之后的一個(gè)輸出結(jié)果為{A:10,Al :{0,0,0},A2 :{0,1,0},…,AlO :{0,0,0}},表示共展現(xiàn)了 10條普通結(jié)果,其中第2條結(jié)果(A2 :{0,1,O})的摘要標(biāo)記為I,表示摘要有異常。步驟S103,將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)使用HTTP請(qǐng)求向后臺(tái)服務(wù)器進(jìn)行反饋。例如,將判斷存在搜索壞點(diǎn)的搜索結(jié)果以 j son (JavaScript Object Notation,輕量級(jí)的數(shù)據(jù)交換格式)格式通過(guò)HTTP Service端口傳遞到后臺(tái)服務(wù)器,HTTP Service端口提供一個(gè)write_db. php文件,該文件能夠?qū)OST傳遞的數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)中,在瀏覽器中可以通過(guò)插件經(jīng)由XmlHttpRequest請(qǐng)求該write_db. php對(duì)應(yīng)的php頁(yè)面將結(jié)果上傳到數(shù)據(jù)庫(kù)中,其中,可以將上述功能封裝起來(lái),當(dāng)判斷存在搜索壞點(diǎn)時(shí)將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法,一方面通過(guò)提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息,對(duì)搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息分析及每條信息項(xiàng)所包括的死鏈、標(biāo)題、摘要和搜索關(guān)鍵字進(jìn)行檢查判斷,進(jìn)而挖掘出相關(guān)性或展現(xiàn)效果不好的搜索結(jié)果并反饋給后臺(tái)服務(wù)器,便于改進(jìn)搜索引擎算法;另一方面該方法可以利用搜索引擎客戶端的空閑資源進(jìn)行搜索結(jié)果頁(yè)面的提取、分析、判斷及反饋,節(jié)約資源,同時(shí)在用戶使用搜索引擎時(shí)同步實(shí)現(xiàn)對(duì)搜索結(jié)果頁(yè)面的分析,不需要單獨(dú)向搜索引擎發(fā)起分析請(qǐng)求,不會(huì)造成對(duì)搜索產(chǎn)品本身的壓力,也不會(huì)對(duì)用戶的使用產(chǎn)生影響。圖5為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法的流程圖。如圖5所示,根據(jù)本發(fā)明實(shí)施例用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法,包括下述步驟。步驟S201,提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信
肩、O在本發(fā)明的一個(gè)實(shí)施例中,結(jié)構(gòu)信息包括搜索結(jié)果頁(yè)面包括的廣告信息項(xiàng)的數(shù)目及位置和普通信息項(xiàng)的數(shù)目及位置。具體地,廣告信息項(xiàng)可以包括品牌廣告、贊助商鏈接廣告、推廣廣告、品牌保護(hù)結(jié)果等,普通信息項(xiàng)可以為AS結(jié)果,此為還包括Aladdin結(jié)果(搜索引擎百度推出的通用開(kāi)放平臺(tái),將接口開(kāi)放提供給獨(dú)特信息數(shù)據(jù)的擁有者,解決現(xiàn)有搜索引擎無(wú)法抓取和檢索到的暗網(wǎng)信息)等。在本發(fā)明的一個(gè)實(shí)施例中,每條信息項(xiàng)的信息包括每條信息項(xiàng)包括的鏈接、標(biāo)題、摘要和搜索關(guān)鍵字。在本發(fā)明的一個(gè)實(shí)施例中,提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息的功能可以使用JavaScript進(jìn)行定義,例如定義一個(gè)batOverlay. js文件,該batOverlay. js文件里面定義了一個(gè)類(lèi)bat (可執(zhí)行文件)及相關(guān)的方法以用于初始化,同時(shí)在該batOverlay. js文件里面定義了各種針對(duì)搜索結(jié)果進(jìn)行分析的函數(shù)。例如函數(shù)Bat.page_analySiS()可以對(duì)搜索結(jié)果頁(yè)面包括的廣告信息項(xiàng)的數(shù)目及位置和普通信息項(xiàng)的數(shù)目及位置進(jìn)行分析,如調(diào)用該函數(shù)對(duì)某個(gè)搜索結(jié)果頁(yè)面進(jìn)行頁(yè)面分析之后輸出的結(jié)果為{P: I,AS: 5, AL: I, AS: 3},其中,P: I表不一個(gè)品牌廣告位于第一個(gè)位置,AS: 5表不5個(gè)普通結(jié)果,位置在一個(gè)品牌廣告的后面,AL: I表示I個(gè)Aladdin結(jié)果,位置在5個(gè)普通結(jié)果的后面,AS: 3表不3個(gè)普通結(jié)果,似直在I個(gè)Aladdin結(jié)果的后面。步驟S202,根據(jù)結(jié)構(gòu)信息或每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。具體地,根據(jù)結(jié)構(gòu)信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)首先需要設(shè)置搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息的閾值,例如在一個(gè)搜索結(jié)果頁(yè)面中根據(jù)用戶輸入的搜索關(guān)鍵字設(shè)置廣告信息項(xiàng)的數(shù)目閾值為1,Aladdin結(jié)果的數(shù)目閾值為1,如果一個(gè)搜索結(jié)果頁(yè)面中的設(shè)置廣告信息項(xiàng)的數(shù)目或者Aladdin結(jié)果的數(shù)目超過(guò)設(shè)置的閾值1,則判斷搜索結(jié)果頁(yè)面中存在搜索壞點(diǎn)。根據(jù)每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)主要通過(guò)特定的 現(xiàn)象實(shí)現(xiàn),例如,如果每條信息項(xiàng)中的第一信息項(xiàng)包括的鏈接是無(wú)法打開(kāi)的鏈接,或者第一信息項(xiàng)不包括摘要,或者第一信息項(xiàng)包括的標(biāo)題和/或摘要重復(fù),或者第一信息項(xiàng)包括的標(biāo)題或摘要中不包含搜索關(guān)鍵字,則判斷該第一信息項(xiàng)是搜索壞點(diǎn)。在本發(fā)明的一個(gè)實(shí)施例中,根據(jù)每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)的功能可以利用batOverlay. js文件里面定義的各種搜索結(jié)果分析的函數(shù)。例如,使用JavaScript進(jìn)行定義,例如定義的batOverlay. js文件里面定義了各種針對(duì)搜索結(jié)果進(jìn)行分析的函數(shù),如函數(shù) Bat. Iinkcheck(type)、Bat. is_equal O、Bat. piaohongO等。例如,使用函數(shù)Bat. Iinkcheck(type)可以對(duì)搜索結(jié)果的信息項(xiàng)進(jìn)行死鏈檢查,其中,當(dāng)參數(shù)type = all表示對(duì)搜索結(jié)果頁(yè)面中的所有信息項(xiàng)進(jìn)行死鏈檢查,當(dāng)參數(shù)type = top表示對(duì)搜索結(jié)果頁(yè)面中的前三條信息項(xiàng)進(jìn)行死鏈檢查,當(dāng)參數(shù)type = random表示對(duì)搜索結(jié)果頁(yè)面中隨機(jī)的三條信息項(xiàng)進(jìn)行死鏈檢查。使用函數(shù)Bat. is_eqUal()可以判斷搜索結(jié)果頁(yè)面中是否存在標(biāo)題或者摘要相同的信息項(xiàng)。使用函數(shù)Bat. piaohongO可以判斷搜索結(jié)果頁(yè)面中的飄紅是否正常,標(biāo)題和摘要中是否有無(wú)飄紅的情況,即信息項(xiàng)中的標(biāo)題或摘要中是否包含搜索關(guān)鍵字。使用函數(shù)Bat. title_abstract()可以檢查搜索結(jié)果頁(yè)面中信息項(xiàng)的標(biāo)題摘要是否正確,例如調(diào)用該函數(shù)之后的一個(gè)輸出結(jié)果為{A:10,Al :{0,0,0},A2 :{0,1,0},-,AlO :{0,0,0}},表示共展現(xiàn)了 10條普通結(jié)果,其中第2條結(jié)果(A2 :{0,1,0})的摘要標(biāo)記為I,表示摘要有異常。步驟S203,將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)使用HTTP請(qǐng)求向后臺(tái)服務(wù)器進(jìn)行反饋。例如,將判斷存在搜索壞點(diǎn)的搜索結(jié)果以j son (JavaScript Object Notation,輕量級(jí)的數(shù)據(jù)交換格式)格式通過(guò)HTTP Service端口傳遞到后臺(tái)服務(wù)器,HTTP Service端口提供一個(gè)write_db. php文件,該文件能夠?qū)OST傳遞的數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)中,在瀏覽器中可以通過(guò)插件經(jīng)由XmlHttpRequest請(qǐng)求該write_db. php對(duì)應(yīng)的php頁(yè)面將結(jié)果上傳到數(shù)據(jù)庫(kù)中,其中,可以將上述功能封裝起來(lái),當(dāng)判斷存在搜索壞點(diǎn)時(shí)將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。步驟S204,提供用戶能夠主動(dòng)向后臺(tái)服務(wù)器反饋對(duì)搜索結(jié)果的意見(jiàn)的接口。在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)使用HTTP請(qǐng)求向后臺(tái)服務(wù)器進(jìn)行反饋。例如,將判斷存在搜索壞點(diǎn)的搜索結(jié)果以j son (JavaScript Object Notation,輕量級(jí)的數(shù)據(jù)交換格式)格式通過(guò)HTTP Service端口傳遞到后臺(tái)服務(wù)器,HTTP Service端口提供一個(gè)write_db. php文件,該文件能夠?qū)OST傳遞的數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)中,在瀏覽器中,通過(guò)插件經(jīng)由XmlHttpRequest請(qǐng)求該write_db. php對(duì)應(yīng)的php頁(yè)面將結(jié)果上傳到數(shù)據(jù)庫(kù)中。其中,可以將上述功能做成接口,當(dāng)用戶認(rèn)為搜索結(jié)果效果不好時(shí)可以快捷反饋,通過(guò)簡(jiǎn)單的功能按鈕例如右鍵菜單可以方便及時(shí)地反饋搜索壞點(diǎn),做到一鍵式反饋。根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法,當(dāng)用戶認(rèn)為搜索結(jié)果效果不好時(shí)可以通過(guò)提供的接口快捷地向后臺(tái)服務(wù)器反饋,通過(guò)用戶加速搜索壞點(diǎn)的發(fā)現(xiàn),提高效率,同時(shí)將手動(dòng)反饋包裝成接口,用戶通過(guò)簡(jiǎn)單的功能按鈕即可方便及時(shí)地反饋搜索壞點(diǎn),降低用戶參與測(cè)試的成本。
圖6為根據(jù)本發(fā)明一個(gè)實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法的流程圖。如圖6所示,根據(jù)本發(fā)明實(shí)施例用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法,包括下述步驟。步驟S301,提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信肩、O在本發(fā)明的一個(gè)實(shí)施例中,結(jié)構(gòu)信息包括搜索結(jié)果頁(yè)面包括的廣告信息項(xiàng)的數(shù)目及位置和普通信息項(xiàng)的數(shù)目及位置。具體地,廣告信息項(xiàng)可以包括品牌廣告、贊助商鏈接廣告、推廣廣告、品牌保護(hù)結(jié)果等,普通信息項(xiàng)可以為AS結(jié)果,此為還包括Aladdin結(jié)果(搜索引擎百度推出的通用開(kāi)放平臺(tái),將接口開(kāi)放提供給獨(dú)特信息數(shù)據(jù)的擁有者,解決現(xiàn)有搜索引擎無(wú)法抓取和檢索到的暗網(wǎng)信息)等。在本發(fā)明的一個(gè)實(shí)施例中,每條信息項(xiàng)的信息包括每條信息項(xiàng)包括的鏈接、標(biāo)題、摘要和搜索關(guān)鍵字。在本發(fā)明的一個(gè)實(shí)施例中,提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息的功能可以用JavaScript進(jìn)行定義,如定義了一個(gè)batOverlay. js文件,該batOverlay. js文件里面定義了一個(gè)類(lèi)bat (可執(zhí)行文件)及相關(guān)的方法以用于初始化,同時(shí)在該batOverlay. js里面定義了各種針對(duì)搜索結(jié)果進(jìn)行分析的函數(shù)。例如函數(shù)Bat.page_analysis()可以對(duì)搜索結(jié)果頁(yè)面包括的廣告信息項(xiàng)的數(shù)目及位置和普通信息項(xiàng)的數(shù)目及位置進(jìn)行分析,如調(diào)用該函數(shù)對(duì)某個(gè)搜索結(jié)果頁(yè)面進(jìn)行頁(yè)面分析之后輸出的結(jié)果為{P I, AS: 5, AL: I, AS: 3},其中,P: I表不一個(gè)品牌廣告位于第一個(gè)位置,AS:5表不5個(gè)普通結(jié)果,位置在一個(gè)品牌廣告的后面,AL: I表示I個(gè)Aladdin結(jié)果,位置在5個(gè)普通結(jié)果的后面,AS: 3表示3個(gè)普通結(jié)果,位置在I個(gè)Aladdin結(jié)果的后面。步驟S302,根據(jù)搜索關(guān)鍵字設(shè)置搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息的閾值。例如,在一個(gè)搜索結(jié)果頁(yè)面中根據(jù)用戶輸入的搜索關(guān)鍵字設(shè)置廣告信息項(xiàng)的數(shù)目閾值為I,Aladdin結(jié)果數(shù)目閾值為I。步驟S303,將結(jié)構(gòu)信息與閾值比較。具體地,將步驟S301所提取到的結(jié)構(gòu)信息與步驟S302所設(shè)置的結(jié)構(gòu)信息的閾值相比較。步驟S304,根據(jù)比較結(jié)果或者根據(jù)每條信息項(xiàng)的信息確定搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。在本發(fā)明的一個(gè)實(shí)施例中,根據(jù)比較結(jié)果確定搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。例如,將結(jié)構(gòu)信息與閾值比較,一個(gè)搜索結(jié)果頁(yè)面中的廣告信息項(xiàng)的數(shù)目為2或者Aladdin結(jié)果的數(shù)目為3,超過(guò)設(shè)置的閾值,則確定單元230確定搜索結(jié)果頁(yè)面中存在搜索壞點(diǎn)。在本發(fā)明的一個(gè)實(shí)施例中,還可以根據(jù)每條信息項(xiàng)的信息確定搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。例如,如果每條信息項(xiàng)中的第一信息項(xiàng)包括的鏈接是無(wú)法打開(kāi)的鏈接,或者第一信息項(xiàng)不包括摘要,或者第一信息項(xiàng)包括的標(biāo)題和/或摘要重復(fù),或者第一信息項(xiàng)包括的標(biāo)題或摘要中不包含搜索關(guān)鍵字,則確定該第一信息項(xiàng)是搜索壞點(diǎn)。其中,根據(jù)每條信息項(xiàng)的信息確定搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)的功能也可以使用JavaScript進(jìn)行定義,例如定義的batOverlay. js文件里面定義了各種針對(duì)搜索結(jié)果進(jìn)行分析的函數(shù),如函數(shù) Bat. Iinkcheck(type)、Bat. is_equal O、Bat. piaohongO 等。例如,使用函數(shù)Bat. Iinkcheck(type)可以對(duì)搜索結(jié)果的信息項(xiàng)進(jìn)行死鏈檢查,其中,當(dāng)參數(shù)type = all表示對(duì)搜索結(jié)果頁(yè)面中的所有信息項(xiàng)進(jìn)行死鏈檢查,當(dāng)參數(shù)type = top表示對(duì)搜索結(jié)果頁(yè)面中的前三條信息項(xiàng)進(jìn)行死鏈檢查,當(dāng)參數(shù)type = random表示對(duì)搜索結(jié)果 頁(yè)面中隨機(jī)的三條信息項(xiàng)進(jìn)行死鏈檢查。使用函數(shù)Bat. is_eqUal()可以判斷搜索結(jié)果頁(yè)面中是否存在標(biāo)題或者摘要相同的信息項(xiàng)。使用函數(shù)Bat. piaohongO可以判斷搜索結(jié)果頁(yè)面中的飄紅是否正常,標(biāo)題和摘要中是否有無(wú)飄紅的情況,即信息項(xiàng)中的標(biāo)題或摘要中是否包含搜索關(guān)鍵字。使用函數(shù)Bat. title_abstract()可以檢查搜索結(jié)果頁(yè)面中信息項(xiàng)的標(biāo)題摘要是否正確,例如調(diào)用該函數(shù)之后的一個(gè)輸出結(jié)果為{A:10,A1 :{0,0,0},A2 :{0,1,0},…,AlO :{0,0,0}},表示共展現(xiàn)了 10條普通結(jié)果,其中第2條結(jié)果(A2:{0,1,0})的摘要標(biāo)記為I,表不摘要有異常。步驟S305,將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)使用HTTP請(qǐng)求向后臺(tái)服務(wù)器進(jìn)行反饋。例如,將判斷存在搜索壞點(diǎn)的搜索結(jié)果以j son (JavaScript Object Notation,輕量級(jí)的數(shù)據(jù)交換格式)格式通過(guò)HTTP Service端口傳遞到后臺(tái)服務(wù)器,HTTP Service端口提供一個(gè)write_db. php文件,該文件能夠?qū)OST傳遞的數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)中,在瀏覽器中可以通過(guò)插件經(jīng)由XmlHttpRequest請(qǐng)求該write_db. php對(duì)應(yīng)的php頁(yè)面將結(jié)果上傳到數(shù)據(jù)庫(kù)中,其中,可以將上述功能封裝起來(lái),當(dāng)判斷存在搜索壞點(diǎn)時(shí)將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。步驟S306,提供用戶能夠主動(dòng)向后臺(tái)服務(wù)器反饋對(duì)搜索結(jié)果的意見(jiàn)的接口。在本發(fā)明的一個(gè)實(shí)施例中,通過(guò)使用HTTP請(qǐng)求向后臺(tái)服務(wù)器進(jìn)行反饋。例如,將判斷存在搜索壞點(diǎn)的搜索結(jié)果以j son (JavaScript Object Notation,輕量級(jí)的數(shù)據(jù)交換格式)格式通過(guò)HTTP Service端口傳遞到后臺(tái)服務(wù)器,HTTP Service端口提供一個(gè)write_db. php文件,該文件能夠?qū)OST傳遞的數(shù)據(jù)寫(xiě)入數(shù)據(jù)庫(kù)中,在瀏覽器中,通過(guò)插件經(jīng)由XmlHttpRequest請(qǐng)求該write_db. php對(duì)應(yīng)的php頁(yè)面將結(jié)果上傳到數(shù)據(jù)庫(kù)中。其中,可以將上述功能做成接口,當(dāng)用戶認(rèn)為搜索結(jié)果效果不好時(shí)可以快捷反饋,通過(guò)簡(jiǎn)單的功能按鈕例如右鍵菜單可以方便及時(shí)地反饋搜索壞點(diǎn),做到一鍵式反饋。根據(jù)本發(fā)明實(shí)施例的用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法,通過(guò)提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息及搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息,再通過(guò)對(duì)搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息分析及每條信息項(xiàng)所包括的死鏈、標(biāo)題、摘要和搜索關(guān)鍵字進(jìn)行檢查判斷,進(jìn)而挖掘出相關(guān)性或展現(xiàn)效果不好的搜索結(jié)果并反饋給后臺(tái)服務(wù)器,便于改進(jìn)搜索引擎算法;另一方面該方法可以利用搜索引擎客戶端的空閑資源進(jìn)行搜索結(jié)果頁(yè)面提取、分析、判斷及反饋,節(jié)約資源,同時(shí)在用戶使用搜索引擎時(shí)同步實(shí)現(xiàn)對(duì)搜索結(jié)果頁(yè)面的分析,不需要單獨(dú)向搜索引擎發(fā)起分析請(qǐng)求,不會(huì)造成對(duì)搜索產(chǎn)品本身的壓力,也不會(huì)對(duì)用戶的使用產(chǎn)生影響。應(yīng)當(dāng)理解,本發(fā)明的各部分可以用硬件、軟件、固件或它們的組合來(lái)實(shí)現(xiàn)。在上述實(shí)施方式中,多個(gè)步驟或方法可以用存儲(chǔ)在存儲(chǔ)器中且由合適的指令執(zhí)行系統(tǒng)執(zhí)行的軟件或固件來(lái)實(shí)現(xiàn)。例如,如果用硬件來(lái)實(shí)現(xiàn),和在另一實(shí)施方式中一樣,可用本領(lǐng)域公知的下列技術(shù)中的任一項(xiàng)或他們的組合來(lái)實(shí)現(xiàn)具有用于對(duì)數(shù)據(jù)信號(hào)實(shí)現(xiàn)邏輯功能的邏輯門(mén)電路的離散邏輯電路,具有合適的組合邏輯門(mén)電路的專(zhuān)用集成電路,可編程門(mén)陣列(PGA),現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)等。在本說(shuō)明書(shū)的描述中,參考術(shù)語(yǔ)“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說(shuō)明書(shū)中,對(duì)上述術(shù)語(yǔ)的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。盡管已經(jīng)示出和描述了本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以 理解在不脫離本發(fā)明的原理和精神的情況下可以對(duì)這些實(shí)施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由所附權(quán)利要求及其等同限定。
權(quán)利要求
1.一種用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置,其特征在于,包括提取模塊,所述提取模塊用于提取所述搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者所述搜索結(jié)果頁(yè) 面中每條信息項(xiàng)的信息;判斷模塊,所述判斷模塊用于根據(jù)所述結(jié)構(gòu)信息或所述每條信息項(xiàng)的信息判斷所述搜 索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn);以及自動(dòng)反饋模塊,所述自動(dòng)反饋模塊用于將所述搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。
2.根據(jù)權(quán)利要求I所述的裝置,其特征在于,進(jìn)一步包括手動(dòng)反饋模塊,所述手動(dòng)反饋模塊提供接口從而用戶能夠使用所述接口來(lái)向后臺(tái)服務(wù) 器反饋對(duì)搜索結(jié)果的意見(jiàn)。
3.根據(jù)權(quán)利要求I或2所述的裝置,其特征在于,所述判斷模塊包括設(shè)置單元,所述設(shè)置單元用于根據(jù)搜索關(guān)鍵字設(shè)置搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息的閾值; 比較單元,所述比較單元用于將所述結(jié)構(gòu)信息與所述閾值比較;以及 確定單元,所述確定單元用于根據(jù)所述比較單元的比較結(jié)果或者根據(jù)所述每條信息項(xiàng) 的信息確定所述搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn)。
4.根據(jù)權(quán)利要求3所述的裝置,其特征在于,所述結(jié)構(gòu)信息包括所述搜索結(jié)果頁(yè)面包 括的廣告信息項(xiàng)的數(shù)目及位置和普通信息項(xiàng)的數(shù)目及位置。
5.根據(jù)權(quán)利要求3所述的裝置,其特征在于,所述每條信息項(xiàng)的信息包括所述每條信 息項(xiàng)包括的鏈接、標(biāo)題、摘要和搜索關(guān)鍵字。
6.根據(jù)權(quán)利要求5所述的裝置,其特征在于,如果所述每條信息項(xiàng)中的第一信息項(xiàng)包 括的鏈接是無(wú)法打開(kāi)的鏈接,或者所述第一信息項(xiàng)不包括摘要,或者所述第一信息項(xiàng)包括 的標(biāo)題和/或摘要重復(fù),或者所述第一信息項(xiàng)包括的標(biāo)題或摘要中不包含搜索關(guān)鍵字,則 所述確定單元確定所述第一信息項(xiàng)是搜索壞點(diǎn)。
7.根據(jù)權(quán)利要求I或2所述的裝置,其特征在于,所述自動(dòng)反饋模塊或所述手動(dòng)反饋模 塊通過(guò)使用HTTP請(qǐng)求向后臺(tái)服務(wù)器進(jìn)行反饋。
8.一種用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的方法,其特征在于,包括以下步驟提取所述搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者所述搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息; 根據(jù)所述結(jié)構(gòu)信息或所述每條信息項(xiàng)的信息判斷所述搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn);以及將所述搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,進(jìn)一步包括步驟提供用戶能夠主動(dòng)向后臺(tái)服務(wù)器反饋對(duì)搜索結(jié)果的意見(jiàn)的接口。
10.根據(jù)權(quán)利要求8或9所述的方法,其特征在于,所述判斷步驟包括根據(jù)搜索關(guān)鍵字設(shè)置搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息的閾值;將所述結(jié)構(gòu)信息與所述閾值比較;以及根據(jù)所述比較結(jié)果或者根據(jù)所述每條信息項(xiàng)的信息確定所述搜索結(jié)果頁(yè)面中是否存 在搜索壞點(diǎn)。
11.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述結(jié)構(gòu)信息包括所述搜索結(jié)果頁(yè)面 包括的廣告信息項(xiàng)的數(shù)目及位置和普通信息項(xiàng)的數(shù)目及位置。
12.根據(jù)權(quán)利要求10所述的方法,其特征在于,所述每條信息項(xiàng)的信息包括所述每條信息項(xiàng)包括的鏈接、標(biāo)題、摘要和搜索關(guān)鍵字。
13.根據(jù)權(quán)利要求12所述的方法,其特征在于,如果所述每條信息項(xiàng)中的第一信息項(xiàng) 包括的鏈接是無(wú)法打開(kāi)的鏈接,或者所述第一信息項(xiàng)不包括摘要,或者所述第一信息項(xiàng)包 括的標(biāo)題和/或摘要重復(fù),或者所述第一信息項(xiàng)包括的標(biāo)題或摘要中不包含搜索關(guān)鍵字, 則確定所述第一信息項(xiàng)是搜索壞點(diǎn)。
14.根據(jù)權(quán)利要求8或9所述的方法,其特征在于,通過(guò)使用HTTP請(qǐng)求向后臺(tái)服務(wù)器進(jìn) 行反饋。
全文摘要
本發(fā)明提出一種用于優(yōu)化瀏覽器的搜索結(jié)果頁(yè)面的裝置及方法,其中該裝置包括提取模塊,用于提取搜索結(jié)果頁(yè)面的結(jié)構(gòu)信息或者搜索結(jié)果頁(yè)面中每條信息項(xiàng)的信息;判斷模塊,用于根據(jù)結(jié)構(gòu)信息或每條信息項(xiàng)的信息判斷搜索結(jié)果頁(yè)面中是否存在搜索壞點(diǎn);以及自動(dòng)反饋模塊,用于將搜索壞點(diǎn)自動(dòng)反饋給后臺(tái)服務(wù)器。根據(jù)本發(fā)明實(shí)施例的裝置,一方面可以挖掘出相關(guān)性或展現(xiàn)效果不好的搜索結(jié)果并反饋給后臺(tái)服務(wù)器,便于改進(jìn)搜索引擎算法;另一方面可以利用搜索引擎客戶端的空閑資源進(jìn)行搜索結(jié)果頁(yè)面分析,節(jié)約資源,在用戶使用搜索引擎時(shí)同步實(shí)現(xiàn)搜索結(jié)果頁(yè)面分析,無(wú)需單獨(dú)向搜索引擎發(fā)起分析請(qǐng)求,不會(huì)造成對(duì)搜索產(chǎn)品本身的壓力,也不會(huì)對(duì)用戶的使用產(chǎn)生影響。
文檔編號(hào)G06F17/30GK102662957SQ201210054359
公開(kāi)日2012年9月12日 申請(qǐng)日期2012年3月2日 優(yōu)先權(quán)日2012年3月2日
發(fā)明者阮星華, 高亮 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司