專利名稱:原創(chuàng)內(nèi)容的搜索方法和搜索服務(wù)器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及搜索技術(shù)領(lǐng)域,特別涉及一種原創(chuàng)內(nèi)容的搜索方法和搜索服務(wù)器。
背景技術(shù):
隨著互聯(lián)網(wǎng)的發(fā)展,用戶可以通過多種途徑上傳或者獲取互聯(lián)網(wǎng)上的各種資源,使得互聯(lián)網(wǎng)上的資源越來越多,更新越來越快,資源的質(zhì)量也參差不齊,目前,資源搜索方法大多只展現(xiàn)搜索結(jié)果的鏈接,而不能對(duì)優(yōu)秀資源(如原創(chuàng)內(nèi)容等)和低質(zhì)量資源進(jìn)行標(biāo)識(shí)以進(jìn)行區(qū)別顯示,使得用戶無法對(duì)資源進(jìn)行分辨,這一方面會(huì)導(dǎo)致由于一些低質(zhì)量的資源而大大降低用戶的閱讀體驗(yàn),另一方面會(huì)由于無法對(duì)原創(chuàng)和非原創(chuàng)資源進(jìn)行標(biāo)識(shí)區(qū)分,使得對(duì)原創(chuàng)的優(yōu)秀資源難以進(jìn)行有效的保護(hù),損害原創(chuàng)用戶的利益,不利于互聯(lián)網(wǎng)知識(shí)產(chǎn)權(quán)保護(hù)的發(fā)展。
發(fā)明內(nèi)容
本發(fā)明的旨在至少解決上述技術(shù)缺陷之一。為此,本發(fā)明第一個(gè)目的在于提出一種原創(chuàng)內(nèi)容的搜索方法,該方法能夠?yàn)橛脩籼峁└哔|(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng)內(nèi)容的價(jià)值,同時(shí)有效的保護(hù)了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識(shí)產(chǎn)權(quán)保護(hù)的發(fā)展。本發(fā)明第二個(gè)目的在于提出一種搜索服務(wù)器。為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明第一方面的實(shí)施例的原創(chuàng)內(nèi)容的搜索方法包括以下步驟:搜索服務(wù)器接收客戶端發(fā)送的搜索詞;所述搜索服務(wù)器根據(jù)所述搜索詞獲得N個(gè)搜索結(jié)果,所述N為大于I的正整數(shù);所述搜索服務(wù)器對(duì)所述N個(gè)搜索結(jié)果進(jìn)行分析以確定所述N個(gè)搜索結(jié)果中的M個(gè)原創(chuàng)內(nèi)容發(fā)布源,其中,所述M為正整數(shù)且小于N ;以及所述搜索服務(wù)器對(duì)所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記之后并提供至所述客戶端。根據(jù)本發(fā)明實(shí)施例的原創(chuàng)內(nèi)容的搜索方法,通過對(duì)搜索結(jié)果進(jìn)行分析獲取搜索結(jié)果中的原創(chuàng)內(nèi)容發(fā)布源,并對(duì)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記后提供至客戶端,能夠?yàn)橛脩籼峁└哔|(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng)內(nèi)容的價(jià)值,同時(shí)有效的保護(hù)了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識(shí)產(chǎn)權(quán)保護(hù)的發(fā)展。為實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明第二方面的搜索服務(wù)器包括:接收模塊,用于接收客戶端發(fā)送的搜索詞;搜索模塊,用于根據(jù)所述搜索詞獲得N個(gè)搜索結(jié)果,所述N為大于I的正整數(shù);分析模塊,用于對(duì)所述N個(gè)搜索結(jié)果進(jìn)行分析以確定所述N個(gè)搜索結(jié)果中的M個(gè)原創(chuàng)內(nèi)容發(fā)布源,其中,所述M為正整數(shù)且小于N ;以及搜索結(jié)果提供模塊,用于對(duì)所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記之后并提供至所述客戶端。根據(jù)本發(fā)明實(shí)施例的搜索服務(wù)器,通過分析模塊對(duì)搜索結(jié)果進(jìn)行分析獲取搜索結(jié)果中的原創(chuàng)內(nèi)容發(fā)布源,進(jìn)而對(duì)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記后提供至客戶端,能夠?yàn)橛脩籼峁└哔|(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng) 內(nèi)容的價(jià)值,同時(shí)有效的保護(hù)了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識(shí)產(chǎn)權(quán)保護(hù)的發(fā)展。
本發(fā)明附加的方面和優(yōu)點(diǎn)將在下面的描述中部分給出,部分將從下面的描述中變得明顯,或通過本發(fā)明的實(shí)踐了解到。
本發(fā)明上述的和/或附加的方面和優(yōu)點(diǎn)從下面結(jié)合附圖對(duì)實(shí)施例的描述中將變得明顯和容易理解,其中:圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例的原創(chuàng)內(nèi)容的搜索方法的流程圖;圖2為根據(jù)本發(fā)明又一個(gè)實(shí)施例的原創(chuàng)內(nèi)容的搜索方法的流程圖;圖3為根據(jù)本發(fā)明另一個(gè)實(shí)施例的原創(chuàng)內(nèi)容的搜索方法的流程圖;圖4為根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索服務(wù)器的結(jié)構(gòu)框圖;圖5為根據(jù)本發(fā)明又一個(gè)實(shí)施例的搜索服務(wù)器的結(jié)構(gòu)框圖;圖6為根據(jù)本發(fā)明另一個(gè)實(shí)施例的搜索服務(wù)器的結(jié)構(gòu)框圖;圖7為根據(jù)本發(fā)明一個(gè)實(shí)施例的原創(chuàng)內(nèi)容特殊標(biāo)記效果圖;圖8為根據(jù)本發(fā)明一個(gè)實(shí)施例的原創(chuàng)機(jī)構(gòu)顯示結(jié)果示意圖;圖9為根據(jù)本發(fā)明一個(gè)實(shí)施例的原創(chuàng)作者相關(guān)信息的顯示結(jié)果示意圖。
具體實(shí)施例方式
下面詳細(xì)描述本發(fā)明的實(shí)施例,所述實(shí)施例的示例在附圖中示出,其中自始至終相同或類似的標(biāo)號(hào)表示相同或類似的元件或具有相同或類似功能的元件。下面通過參考附圖描述的實(shí)施例是示例性的,僅用于解釋本發(fā)明,而不能理解為對(duì)本發(fā)明的限制。相反,本發(fā)明的實(shí)施例包括落入所附加權(quán)利要求書的精神和內(nèi)涵范圍內(nèi)的所有變化、修改和等同物。在本發(fā)明的描述中,需要說明的是,除非另有明確的規(guī)定和限定,術(shù)語“相連”、“連接”應(yīng)做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機(jī)械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連。對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以具體情況理解上述術(shù)語在本發(fā)明中的具體含義。此外,在本發(fā)明的描述中,除非另有說明,“多個(gè)”的含義是兩個(gè)或兩個(gè)以上。流程圖中或在此以其他方式描述的任何過程或方法描述可以被理解為,表示包括一個(gè)或更多個(gè)用于實(shí)現(xiàn)特定邏輯功能或過程的步驟的可執(zhí)行指令的代碼的模塊、片段或部分,并且本發(fā)明的優(yōu)選實(shí)施方式的范圍包括另外的實(shí)現(xiàn),其中可以不按所示出或討論的順序,包括根據(jù)所涉及的功能按基本同時(shí)的方式或按相反的順序,來執(zhí)行功能,這應(yīng)被本發(fā)明的實(shí)施例所屬技術(shù)領(lǐng)域的技術(shù)人員所理解。下面參考附圖描述根據(jù)本發(fā)明實(shí)施例的原創(chuàng)內(nèi)容的搜索方法。一種原創(chuàng)內(nèi)容的搜索方法,包括以下步驟:搜索服務(wù)器接收客戶端發(fā)送的搜索詞;搜索服務(wù)器根據(jù)搜索詞獲得N個(gè)搜索結(jié)果,N為大于I的正整數(shù);搜索服務(wù)器對(duì)N個(gè)搜索結(jié)果進(jìn)行分析以確定N個(gè)搜索結(jié)果中的M個(gè)原創(chuàng)內(nèi)容發(fā)布源,其中,M為正整數(shù)且小于N;以及搜索服務(wù)器對(duì)M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記之后并提供至客戶端。圖1為根據(jù)本發(fā)明一個(gè)實(shí)施例的原創(chuàng)內(nèi)容的搜索方法的流程圖。如圖1所示,根據(jù)本發(fā)明實(shí)施例原創(chuàng)內(nèi)容的搜索方法包括以下步驟。
S101,搜索服務(wù)器接收客戶端發(fā)送的搜索詞。S102,搜索服務(wù)器根據(jù)搜索詞獲得N個(gè)搜索結(jié)果,N為大于I的正整數(shù)。S103,搜索服務(wù)器對(duì)N個(gè)搜索結(jié)果進(jìn)行分析以確定N個(gè)搜索結(jié)果中的M個(gè)原創(chuàng)內(nèi)容發(fā)布源,其中,M為正整數(shù)且小于N。具體地,搜索服務(wù)器可按照搜索結(jié)果的主題內(nèi)容進(jìn)一步對(duì)這N個(gè)搜索結(jié)果進(jìn)行分組,進(jìn)而可在M組具有不同主題內(nèi)容的搜索結(jié)果中的每組分別確定一個(gè)具有原創(chuàng)內(nèi)容的搜索結(jié)果,可將發(fā)布時(shí)間最早的一個(gè)搜索結(jié)果作為具有原創(chuàng)內(nèi)容的搜索結(jié)果,并據(jù)此確定原創(chuàng)內(nèi)容發(fā)布源,其中,原創(chuàng)內(nèi)容發(fā)布源可以是具有原創(chuàng)內(nèi)容的搜索結(jié)果的URL (UniformResourcel Locator,統(tǒng)一資源定位符)。S104,搜索服務(wù)器對(duì)M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記之后并提供至客戶端。其中,特殊標(biāo)記可以是搜索服務(wù)器根據(jù)原創(chuàng)內(nèi)容發(fā)布源的來源、作者等為原創(chuàng)內(nèi)容發(fā)布源設(shè)定的文字標(biāo)識(shí),在本發(fā)明的一個(gè)實(shí)施例中,搜索服務(wù)器還可在M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中進(jìn)行原創(chuàng)標(biāo)記,以及在M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中標(biāo)記作者和發(fā)表時(shí)間,并且,這M個(gè)原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級(jí),在提供至客戶端時(shí),可在搜索結(jié)果頁面中前排顯示。例如,如圖7所示,對(duì)于用戶輸入的搜索詞“ X X X X ”,搜索服務(wù)器將原創(chuàng)內(nèi)容作為第一搜索結(jié)果優(yōu)先顯示,并在輸入框中和搜索結(jié)果中的搜索詞“ X X X X ”之前自動(dòng)添加特殊標(biāo)記“[舒立觀察]”,以及為第一個(gè)搜索結(jié)果中添加原創(chuàng)標(biāo)記“財(cái)新網(wǎng)的原創(chuàng)文章”,并標(biāo)記出作者和發(fā)表時(shí)間。根據(jù)本發(fā)明實(shí)施 例的原創(chuàng)內(nèi)容的搜索方法,通過對(duì)搜索結(jié)果進(jìn)行分析獲取搜索結(jié)果中的原創(chuàng)內(nèi)容發(fā)布源,并對(duì)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記后提供至客戶端,能夠?yàn)橛脩籼峁└哔|(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng)內(nèi)容的價(jià)值,同時(shí)有效的保護(hù)了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識(shí)產(chǎn)權(quán)保護(hù)的發(fā)展。在本發(fā)明的一個(gè)實(shí)施例中,搜索服務(wù)器還將發(fā)布原創(chuàng)內(nèi)容的機(jī)構(gòu)的信息以及發(fā)布的原創(chuàng)內(nèi)容提供給客戶端進(jìn)行顯示,圖8為搜索服務(wù)器提供給客戶端顯示的關(guān)于南京日?qǐng)?bào)搜索結(jié)果的展示圖,由此,能夠?qū)⒃瓌?chuàng)機(jī)構(gòu)明確展現(xiàn)給用戶,并使得用戶能夠直接瀏覽原創(chuàng)機(jī)構(gòu)發(fā)布的原創(chuàng)內(nèi)容,既有效保護(hù)了原創(chuàng)機(jī)構(gòu)的知識(shí)產(chǎn)權(quán),又方便了用戶獲取原創(chuàng)資源,將原創(chuàng)價(jià)值最大化。圖2為根據(jù)本發(fā)明又一個(gè)實(shí)施例的原創(chuàng)內(nèi)容的搜索方法的流程圖。如圖2所示,根據(jù)本發(fā)明實(shí)施例的原創(chuàng)內(nèi)容的搜索方法包括以下步驟。S201,搜索服務(wù)器接收客戶端發(fā)送的搜索詞。S202,搜索服務(wù)器根據(jù)搜索詞獲得N個(gè)搜索結(jié)果,N為大于I的正整數(shù)。S203,搜索服務(wù)器對(duì)N個(gè)搜索結(jié)果進(jìn)行文本相似度分析。具體地,可通過深度學(xué)習(xí)技術(shù)計(jì)算搜索結(jié)果的文本相似度,并可認(rèn)為文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的主題內(nèi)容一致,進(jìn)而可根據(jù)主題內(nèi)容對(duì)N個(gè)搜索結(jié)果進(jìn)行分組。S204,獲得相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的數(shù)量Q,并進(jìn)一步判斷搜索數(shù)量Q是否大于預(yù)設(shè)數(shù)量。具體地,對(duì)于主題內(nèi)容一致的搜索結(jié)果組,也就是相似度滿足預(yù)設(shè)閾值的搜索結(jié)果組,可獲取其中搜索結(jié)果的數(shù)量Q,并進(jìn)一步判斷每組中搜索結(jié)果的數(shù)量Q是否大于預(yù)設(shè)數(shù)量。S205,如果判斷大于預(yù)設(shè)數(shù)量,則搜索服務(wù)器從Q個(gè)搜索結(jié)果中抽取M個(gè)原創(chuàng)內(nèi)容發(fā)布源中的一個(gè),其中,M為正整數(shù)且小于N。其中,原創(chuàng)內(nèi)容發(fā)布源可以是具有原創(chuàng)內(nèi)容的搜索結(jié)果的URL,具體地,如果有M組的搜索結(jié)果的數(shù)量Q大于預(yù)設(shè)數(shù)量,則可在這M組中每組分別抽取一個(gè)遠(yuǎn)程內(nèi)容發(fā)布源。例如,可設(shè)定預(yù)設(shè)數(shù)量為10,對(duì)于搜索到的40個(gè)搜索結(jié)果,如果文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果有A、B、C三組,搜索結(jié)果數(shù)量分別8、12、14,則可在B組合C組中分別抽取一個(gè)原創(chuàng)內(nèi)容發(fā)布源。S206,根據(jù)權(quán)威網(wǎng)站獲取的原創(chuàng)數(shù)據(jù)對(duì)M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行修正。在本發(fā)明的一個(gè)實(shí)施例中,可通過權(quán)威網(wǎng)站引入高質(zhì)量的原創(chuàng)數(shù)據(jù),輔以機(jī)器識(shí)別交叉驗(yàn)證,檢驗(yàn)引入數(shù)據(jù)的原創(chuàng)度,經(jīng)過多倫篩選修正,最終抽取出100%的原創(chuàng)內(nèi)容,并獲取相應(yīng)的原創(chuàng)內(nèi)容發(fā)布源,保證了原創(chuàng)內(nèi)容發(fā)布源的準(zhǔn)確性。S207,搜索服務(wù)器對(duì)M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記之后并提供至客戶端。其中,特殊標(biāo)記可以是搜索服務(wù)器根據(jù)原創(chuàng)內(nèi)容發(fā)布源的來源、作者等為原創(chuàng)內(nèi)容發(fā)布源設(shè)定的文字標(biāo)識(shí),在本發(fā)明的一個(gè)實(shí)施例中,搜索服務(wù)器還可在M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中進(jìn)行原創(chuàng)標(biāo)記,以及在M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中標(biāo)記作者和發(fā)表時(shí)間,并且,這M個(gè)原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級(jí),在提供至客戶端時(shí),可在搜索結(jié)果頁面中前排顯示。例如,如圖7所示,對(duì)于用戶輸入的搜索詞“ X X X X ”,搜索服務(wù)器將原創(chuàng)內(nèi)容作為第一搜索結(jié)果優(yōu)先顯示,并在輸入框中和搜索結(jié)果中的搜索詞“ X X X X ”之前自動(dòng)添加特殊標(biāo)記“[舒立觀察]”,以及為第一個(gè)搜索結(jié)果中添加原創(chuàng)標(biāo)記“財(cái)新網(wǎng)的原創(chuàng)文章”,并標(biāo)記出作者和發(fā)表時(shí)間。應(yīng)當(dāng)理解,在本發(fā)明的一個(gè)實(shí)施例中,步驟S206是可選的。根據(jù)本發(fā)明實(shí)施例的原創(chuàng)內(nèi)容的搜索方法,通過對(duì)搜索結(jié)果進(jìn)行相似度分析,以獲取一定數(shù)量的內(nèi)容相似的搜索結(jié)果,進(jìn)而從中抽取原創(chuàng)內(nèi)容發(fā)布源,能夠更準(zhǔn)確的獲取原創(chuàng)內(nèi)容發(fā)布源,保證原創(chuàng)內(nèi)容判斷的準(zhǔn)確性,進(jìn)而為用戶提供更優(yōu)質(zhì)的原創(chuàng)內(nèi)容。圖3為根據(jù)本發(fā)明另一個(gè)實(shí)施例的原創(chuàng)內(nèi)容的搜索方法的流程圖。如圖3所示,根據(jù)本發(fā)明實(shí)施例的原創(chuàng)內(nèi)容的搜索方法包括以下步驟。S301,搜索服務(wù)器接收客戶端發(fā)送的搜索詞。S302,搜索服務(wù)器根據(jù)搜索詞獲得N個(gè)搜索結(jié)果,N為大于I的正整數(shù)。S303,搜索服務(wù)器對(duì)N個(gè)搜索結(jié)果進(jìn)行文本相似度分析。具體地,可通過深度學(xué)習(xí)技術(shù)計(jì)算搜索結(jié)果的文本相似度,并可認(rèn)為文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的主題內(nèi)容一致,進(jìn)而可根據(jù)主題內(nèi)容對(duì)N個(gè)搜索結(jié)果進(jìn)行分組。S304,獲得相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的數(shù)量Q,并進(jìn)一步判斷搜索數(shù)量Q是否大于預(yù)設(shè)數(shù)量。具體地, 對(duì)于主題內(nèi)容一致的搜索結(jié)果組,也就是相似度滿足預(yù)設(shè)閾值的搜索結(jié)果組,獲取其中搜索結(jié)果的數(shù)量Q,并進(jìn)一步判斷每組中搜索結(jié)果的數(shù)量Q是否大于預(yù)設(shè)數(shù)量。S305,如果判斷大于預(yù)設(shè)數(shù)量,則搜索服務(wù)器從Q個(gè)搜索結(jié)果中抽取M個(gè)原創(chuàng)內(nèi)容發(fā)布源中的一個(gè),其中,M為正整數(shù)且小于N。其中,原創(chuàng)內(nèi)容發(fā)布源可以是具有原創(chuàng)內(nèi)容的搜索結(jié)果的URL,具體地,如果有M組的搜索結(jié)果的數(shù)量Q大于預(yù)設(shè)數(shù)量,則可在這M組中每組分別抽取一個(gè)遠(yuǎn)程內(nèi)容發(fā)布源。例如,可設(shè)定預(yù)設(shè)數(shù)量為10,對(duì)于搜索到的40個(gè)搜索結(jié)果,文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果有A、B、C三組,搜索結(jié)果數(shù)量分別8、12、14,則可在B組合C組中分別抽取一個(gè)原創(chuàng)內(nèi)容發(fā)布源。S306,根據(jù)權(quán)威網(wǎng)站獲取的原創(chuàng)數(shù)據(jù)對(duì)M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行修正。在本發(fā)明的一個(gè)實(shí)施例中,可通過權(quán)威網(wǎng)站引入高質(zhì)量的原創(chuàng)數(shù)據(jù),輔以機(jī)器識(shí)別交叉驗(yàn)證,檢驗(yàn)引入數(shù)據(jù)的原創(chuàng)度,經(jīng)過多倫篩選修正,最終抽取出100%的原創(chuàng)內(nèi)容,并獲取相應(yīng)的原創(chuàng)內(nèi)容發(fā)布源,保證了原創(chuàng)內(nèi)容發(fā)布源的準(zhǔn)確性。S307,搜索服務(wù)器對(duì)M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記之后并提供至客戶端。其中,特殊標(biāo)記可以是搜索服務(wù)器根據(jù)原創(chuàng)內(nèi)容發(fā)布源的來源、作者等為原創(chuàng)內(nèi)容發(fā)布源設(shè)定的文字標(biāo)識(shí),在本發(fā)明的一個(gè)實(shí)施例中,搜索服務(wù)器還可在M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中進(jìn)行原創(chuàng)標(biāo)記,以及在M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中標(biāo)記作者和發(fā)表時(shí)間,并且,這M個(gè)原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級(jí),在提供至客戶端時(shí),可在搜索結(jié)果頁面中前排顯示。例如,如圖7所示,對(duì)于用戶輸入的搜索詞“XX XX”,搜索服務(wù)器將原創(chuàng) 內(nèi)容作為第一搜索結(jié)果優(yōu)先顯示,并在輸入框中和搜索結(jié)果中的搜索詞“ X X X X ”之前自動(dòng)添加特殊標(biāo)記“[舒立觀察]”,以及為第一個(gè)搜索結(jié)果中添加原創(chuàng)標(biāo)記“財(cái)新網(wǎng)的原創(chuàng)文章”,并標(biāo)記出作者和發(fā)表時(shí)間。S308,搜索服務(wù)器分別從M個(gè)原創(chuàng)內(nèi)容發(fā)布源中獲取作者名稱。具體地,搜索服務(wù)器可根據(jù)每個(gè)原創(chuàng)內(nèi)容發(fā)布源中標(biāo)記的作者分別從M個(gè)原創(chuàng)內(nèi)容發(fā)布源中獲取每個(gè)原創(chuàng)內(nèi)容發(fā)布源的作者名稱,以便獲取更多原創(chuàng)內(nèi)容發(fā)布源的作者的相關(guān)內(nèi)容。S309,搜索服務(wù)器根據(jù)作者名稱進(jìn)行檢索以獲取與作者名稱相關(guān)的內(nèi)容并提供
至客戶端。舉例來說,搜索服務(wù)器可根據(jù)作者名稱進(jìn)一步檢索原創(chuàng)內(nèi)容發(fā)布源的作者的簡(jiǎn)介、圖片、原創(chuàng)文章、社交網(wǎng)絡(luò)信息、相關(guān)新聞等內(nèi)容,并提供至客戶端,以提升原創(chuàng)作者的認(rèn)知度,進(jìn)而將更多原創(chuàng)內(nèi)容推薦給用戶,例如,當(dāng)搜索服務(wù)器在關(guān)于“ XXXX ”的原創(chuàng)內(nèi)容中獲取其作者為“胡舒立”時(shí),如圖9所示,可進(jìn)一步獲取“胡舒立”的相關(guān)信息:百科名牌、圖像、簡(jiǎn)介、相關(guān)原創(chuàng)文章等。應(yīng)當(dāng)理解,在本發(fā)明的一個(gè)實(shí)施例中,步驟S306是可選的。根據(jù)本發(fā)明實(shí)施例的原創(chuàng)內(nèi)容的搜索方法,能夠進(jìn)一步展現(xiàn)原創(chuàng)作者的相關(guān)信息和其他原創(chuàng)文章,可將原創(chuàng)作者的高質(zhì)量原創(chuàng)文章推薦給用戶,更有利于原創(chuàng)價(jià)值的體現(xiàn)。為了實(shí)現(xiàn)上述實(shí)例,本發(fā)明還提出一種搜索服務(wù)器?!N搜索服務(wù)器,包括:接收模塊,用于接收客戶端發(fā)送的搜索詞;搜索模塊,用于根據(jù)搜索詞獲得N個(gè)搜索結(jié)果,N為大于I的正整數(shù);分析模塊,用于對(duì)N個(gè)搜索結(jié)果進(jìn)行分析以確定N個(gè)搜索結(jié)果中的M個(gè)原創(chuàng)內(nèi)容發(fā)布源,其中,M為正整數(shù)且小于N;以及搜索結(jié)果提供模塊,用于對(duì)M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記之后并提供至客戶端。
圖4為根據(jù)本發(fā)明一個(gè)實(shí)施例的搜索服務(wù)器的結(jié)構(gòu)框圖。如圖4所示,根據(jù)本發(fā)明實(shí)施例的搜索服務(wù)器包括:接收模塊100、搜索模塊200、分析模塊300和搜索結(jié)果提供模塊400。具體地,接收模塊100用于接收客戶端發(fā)送的搜索詞。搜索模塊200用于根據(jù)搜索詞獲得N個(gè)搜索結(jié)果,N為大于I的正整數(shù)。分析模塊300用于對(duì)N個(gè)搜索結(jié)果進(jìn)行分析以確定N個(gè)搜索結(jié)果中的M個(gè)原創(chuàng)內(nèi)容發(fā)布源,其中,M為正整數(shù)且小于N。更具體地,分析模塊300可按照搜索結(jié)果的主題內(nèi)容進(jìn)一步對(duì)這N個(gè)搜索結(jié)果進(jìn)行分組分析,進(jìn)而可在M組具有不同主題內(nèi)容的搜索結(jié)果中的每組分別確定一個(gè)具有原創(chuàng)內(nèi)·容的搜索結(jié)果,可將發(fā)布時(shí)間最早的一個(gè)搜索結(jié)果作為具有原創(chuàng)內(nèi)容的搜索結(jié)果,并據(jù)此確定原創(chuàng)內(nèi)容發(fā)布源,其中,原創(chuàng)內(nèi)容發(fā)布源可以是具有原創(chuàng)內(nèi)容的搜索結(jié)果的URL。搜索結(jié)果提供模塊400用于對(duì)M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記之后并提供至客戶端。其中,特殊標(biāo)記可以是搜索服務(wù)器根據(jù)原創(chuàng)內(nèi)容發(fā)布源的來源、作者等為原創(chuàng)內(nèi)容發(fā)布源設(shè)定的文字標(biāo)識(shí),在本發(fā)明的一個(gè)實(shí)施例中,搜索服務(wù)器還可在M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中進(jìn)行原創(chuàng)標(biāo)記,以及在M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中標(biāo)記作者和發(fā)表時(shí)間,并且,這M個(gè)原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級(jí),在提供至客戶端時(shí),可在搜索結(jié)果頁面中前排顯示。例如,如圖7所示,對(duì)于用戶輸入的搜索詞“XX XX”,搜索服務(wù)器將原創(chuàng)內(nèi)容作為第一搜索結(jié)果優(yōu)先顯示,并在輸入框中和搜索結(jié)果中的搜索詞“ X X X X ”之前自動(dòng)添加特殊標(biāo)記“[舒立觀察]”,以及為第一個(gè)搜索結(jié)果中添加原創(chuàng)標(biāo)記“財(cái)新網(wǎng)的原創(chuàng)文章”,并標(biāo)記出作者和發(fā)表時(shí)間。根據(jù)本發(fā)明實(shí)施例的搜索服務(wù)器,通過分析模塊對(duì)搜索結(jié)果進(jìn)行分析獲取搜索結(jié)果中的原創(chuàng)內(nèi)容發(fā)布源,進(jìn)而對(duì)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記后提供至客戶端,能夠?yàn)橛脩籼峁└哔|(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng)內(nèi)容的價(jià)值,同時(shí)有效的保護(hù)了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識(shí)產(chǎn)權(quán)保護(hù)的發(fā)展。在本發(fā)明的一個(gè)實(shí)施例中,搜索服務(wù)器還將發(fā)布原創(chuàng)內(nèi)容的機(jī)構(gòu)的信息以及發(fā)布的原創(chuàng)內(nèi)容提供給客戶端進(jìn)行顯示,圖8為搜索服務(wù)器提供給客戶端顯示的關(guān)于南京日?qǐng)?bào)搜索結(jié)果的展示圖,由此,能夠?qū)⒃瓌?chuàng)機(jī)構(gòu)明確展現(xiàn)給用戶,并使得用戶能夠直接瀏覽原創(chuàng)機(jī)構(gòu)發(fā)布的原創(chuàng)內(nèi)容,既有效保護(hù)了原創(chuàng)機(jī)構(gòu)的知識(shí)產(chǎn)權(quán),又方便了用戶獲取原創(chuàng)資源,將原創(chuàng)價(jià)值最大化。圖5為根據(jù)本發(fā)明又一個(gè)實(shí)施例的搜索服務(wù)器的結(jié)構(gòu)框圖。如圖5所示,根據(jù)本發(fā)明實(shí)施例的搜索服務(wù)器包括:接收模塊100、搜索模塊200、分析模塊300、搜索結(jié)果提供模塊400、文本相似度分析子模塊310、判斷子模塊320、抽取子模塊330和修正子模塊340,其中,分析模塊300具體包括文本相似度分析子模塊310、判斷子模塊320、抽取子模塊330和修正子模塊340。具體地,文本相似度分析子模塊310用于對(duì)N個(gè)搜索結(jié)果進(jìn)行文本相似度分析。更具體地,文本相似度分析子模塊310可通過深度學(xué)習(xí)技術(shù)計(jì)算搜索結(jié)果的文本相似度,并可認(rèn)為文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的主題內(nèi)容一致,進(jìn)而可根據(jù)主題內(nèi)容對(duì)N個(gè)搜索結(jié)果進(jìn)行分組。判斷子模塊320用于獲得相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的數(shù)量Q,并進(jìn)一步判斷搜索數(shù)量Q是否大于預(yù)設(shè)數(shù)量。更具體地,對(duì)于主題內(nèi)容一致的搜索結(jié)果組,也就是相似度滿足預(yù)設(shè)閾值的搜索結(jié)果組,判斷子模塊320可獲取其中搜索結(jié)果的數(shù)量Q,并進(jìn)一步判斷每組中搜索結(jié)果的數(shù)量Q是否大于預(yù)設(shè)數(shù)量。抽取子模塊330用于當(dāng)判斷子模塊320判斷搜索數(shù)量Q大于預(yù)設(shè)數(shù)量時(shí),從Q個(gè)搜索結(jié)果中抽取M個(gè)原創(chuàng)內(nèi)容發(fā)布源,其中,Q為預(yù)設(shè)數(shù)量。更具體地,如果有M組的搜索結(jié)果的數(shù)量Q大于預(yù)設(shè)數(shù)量,則抽取子模塊330可在這M組中每組分別抽取一個(gè)遠(yuǎn)程內(nèi)容發(fā)布源。例如,可設(shè)定預(yù)設(shè)數(shù)量為10,對(duì)于搜索到的40個(gè)搜索結(jié)果,文本相似度滿足預(yù)設(shè)閾值的搜索結(jié)果有A、B、C三組,搜索結(jié)果數(shù)量分別8、12、14,則抽取子模塊330可在B組合C組中分別抽取一個(gè)原創(chuàng)內(nèi)容發(fā)布源。修正子模塊340用于根據(jù)權(quán)威網(wǎng)站獲取的原創(chuàng)數(shù)據(jù)對(duì)M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行修正。在本發(fā)明的一個(gè)實(shí)施例中,可通過權(quán)威網(wǎng)站引入高質(zhì)量的原創(chuàng)數(shù)據(jù),輔以機(jī)器識(shí)別交叉驗(yàn)證,檢驗(yàn)引入數(shù)據(jù)的原創(chuàng)度,經(jīng)過多倫篩選修正,最終抽取出100%的原創(chuàng)內(nèi)容,并獲取相應(yīng)的原創(chuàng)內(nèi)容發(fā)布源,保 證了原創(chuàng)內(nèi)容發(fā)布源的準(zhǔn)確性。應(yīng)當(dāng)理解,在本發(fā)明的一個(gè)實(shí)施例中,修正子模塊340是可選的。根據(jù)本發(fā)明實(shí)施例的搜索服務(wù)器,通過對(duì)搜索結(jié)果進(jìn)行相似度分析,以獲取一定數(shù)量的內(nèi)容相似的搜索結(jié)果,進(jìn)而從中抽取原創(chuàng)內(nèi)容發(fā)布源,能夠更準(zhǔn)確的獲取原創(chuàng)內(nèi)容發(fā)布源,保證原創(chuàng)內(nèi)容判斷的準(zhǔn)確性,進(jìn)而為用戶提供更優(yōu)質(zhì)的原創(chuàng)內(nèi)容。圖6為根據(jù)本發(fā)明另一個(gè)實(shí)施例的搜索服務(wù)器的結(jié)構(gòu)框圖。如圖6所示,根據(jù)本發(fā)明實(shí)施例的搜索服務(wù)器在圖5所示的基礎(chǔ)上還包括:擴(kuò)展內(nèi)容提供模塊500。具體地,擴(kuò)展內(nèi)容提供模塊500分別從M個(gè)原創(chuàng)內(nèi)容發(fā)布源中獲取作者名稱,并根據(jù)作者名稱進(jìn)行檢索以獲取與作者名稱相關(guān)的內(nèi)容并提供至客戶端。更具體地,擴(kuò)展內(nèi)容提供模塊500可根據(jù)每個(gè)原創(chuàng)內(nèi)容發(fā)布源中標(biāo)記的作者分別從M個(gè)原創(chuàng)內(nèi)容發(fā)布源中獲取每個(gè)原創(chuàng)內(nèi)容發(fā)布源的作者名稱,以便獲取更多原創(chuàng)內(nèi)容發(fā)布源的作者的相關(guān)內(nèi)容。舉例來說,擴(kuò)展內(nèi)容提供模塊500可根據(jù)作者名稱進(jìn)一步檢索原創(chuàng)內(nèi)容發(fā)布源的作者的簡(jiǎn)介、圖片、原創(chuàng)文章、社交網(wǎng)絡(luò)信息、相關(guān)新聞等內(nèi)容,并提供至客戶端,以提升原創(chuàng)作者的認(rèn)知度,進(jìn)而將更多原創(chuàng)內(nèi)容推薦給用戶,例如,當(dāng)搜索服務(wù)器在關(guān)于“ XXXX ”的原創(chuàng)內(nèi)容中獲取其作者為“胡舒立”時(shí),如圖9所示,可進(jìn)一步獲取“胡舒立”的相關(guān)信息:百科名牌、圖像、簡(jiǎn)介、相關(guān)原創(chuàng)文章等。根據(jù)本發(fā)明實(shí)施例的搜索服務(wù)器,能夠進(jìn)一步展現(xiàn)原創(chuàng)作者的相關(guān)信息和其他原創(chuàng)文章,可將原創(chuàng)作者的高質(zhì)量原創(chuàng)文章推薦給用戶,更有利于原創(chuàng)價(jià)值的體現(xiàn)。在本說明書的描述中,參考術(shù)語“一個(gè)實(shí)施例”、“一些實(shí)施例”、“示例”、“具體示例”、或“一些示例”等的描述意指結(jié)合該實(shí)施例或示例描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)包含于本發(fā)明的至少一個(gè)實(shí)施例或示例中。在本說明書中,對(duì)所述術(shù)語的示意性表述不一定指的是相同的實(shí)施例或示例。而且,描述的具體特征、結(jié)構(gòu)、材料或者特點(diǎn)可以在任何的一個(gè)或多個(gè)實(shí)施例或示例中以合適的方式結(jié)合。盡管已經(jīng)示出和描述了本發(fā)明的實(shí)施例,對(duì)于本領(lǐng)域的普通技術(shù)人員而言,可以理解在不脫離本發(fā)明的原理和精神的情況下可以對(duì)這些實(shí)施例進(jìn)行多種變化、修改、替換和變型,本發(fā)明的范圍由所附權(quán)利要求及其等同限定。
權(quán)利要求
1.一種原創(chuàng)內(nèi)容的搜索方法,其特征在于,包括以下步驟: 搜索服務(wù)器接收客戶端發(fā)送的搜索詞; 所述搜索服務(wù)器根據(jù)所述搜索詞獲得N個(gè)搜索結(jié)果,所述N為大于I的正整數(shù); 所述搜索服務(wù)器對(duì)所述N個(gè)搜索結(jié)果進(jìn)行分析以確定所述N個(gè)搜索結(jié)果中的M個(gè)原創(chuàng)內(nèi)容發(fā)布源,其中,所述M為正整數(shù)且小于N ;以及 所述搜索服務(wù)器對(duì)所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記之后并提供至所述客戶端。
2.如權(quán)利要求1所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,所述搜索服務(wù)器對(duì)所述N個(gè)搜索結(jié)果進(jìn)行分析以確定所述N個(gè)搜索結(jié)果中的M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)一步包括: 所述搜索服務(wù)器對(duì)所述N個(gè)搜索結(jié)果進(jìn)行文本相似度分析; 獲得相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的數(shù)量Q,并進(jìn)一步判斷搜索數(shù)量Q是否大于預(yù)設(shè)數(shù)量; 如果判斷大于所述預(yù)設(shè)數(shù)量,則所述搜索服務(wù)器從所述Q個(gè)搜索結(jié)果中抽取所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源中的一個(gè)。
3.如權(quán)利要求2所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,還包括: 根據(jù)權(quán)威網(wǎng)站獲取的原創(chuàng)數(shù)據(jù)對(duì)所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行修正。
4.如權(quán)利要求1-3任一項(xiàng)所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,所述搜索服務(wù)器對(duì)所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn) 行特殊標(biāo)記進(jìn)一步包括: 所述搜索服務(wù)器在所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中進(jìn)行原創(chuàng)標(biāo)記。
5.如權(quán)利要求4所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,還包括: 所述搜索服務(wù)器在所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中標(biāo)記作者和發(fā)表時(shí)間。
6.如權(quán)利要求1-5任一項(xiàng)所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級(jí)。
7.如權(quán)利要求1-6任一項(xiàng)所述的原創(chuàng)內(nèi)容的搜索方法,其特征在于,還包括: 所述搜索服務(wù)器分別從所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源中獲取作者名稱;以及 所述搜索服務(wù)器根據(jù)所述作者名稱進(jìn)行檢索以獲取與所述作者名稱相關(guān)的內(nèi)容并提供至所述客戶端。
8.一種搜索服務(wù)器,其特征在于,包括: 接收模塊,用于接收客戶端發(fā)送的搜索詞; 搜索模塊,用于根據(jù)所述搜索詞獲得N個(gè)搜索結(jié)果,所述N為大于I的正整數(shù); 分析模塊,用于對(duì)所述N個(gè)搜索結(jié)果進(jìn)行分析以確定所述N個(gè)搜索結(jié)果中的M個(gè)原創(chuàng)內(nèi)容發(fā)布源,其中,所述M為正整數(shù)且小于N ;以及 搜索結(jié)果提供模塊,用于對(duì)所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記之后并提供至所述客戶端。
9.如權(quán)利要求8所述的搜索服務(wù)器,其特征在于,所述分析模塊進(jìn)一步包括: 文本相似度分析子模塊,用于對(duì)所述N個(gè)搜索結(jié)果進(jìn)行文本相似度分析; 判斷子模塊,用于獲得相似度滿足預(yù)設(shè)閾值的搜索結(jié)果的數(shù)量Q,并進(jìn)一步判斷搜索數(shù)量Q是否大于預(yù)設(shè)數(shù)量; 抽取子模塊,用于當(dāng)所述判斷子模塊判斷所述搜索數(shù)量Q大于所述預(yù)設(shè)數(shù)量時(shí),從所述Q個(gè)搜索結(jié)果中抽取所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源,其中,Q為預(yù)設(shè)數(shù)量。
10.如權(quán)利要求9所述的搜索服務(wù)器,其特征在于,還包括: 修正子模塊,用于根據(jù)權(quán)威網(wǎng)站獲取的原創(chuàng)數(shù)據(jù)對(duì)所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行修正。
11.如權(quán)利要求8所述的搜索服務(wù)器,其特征在于,所述搜索結(jié)果提供模塊在所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中進(jìn)行原創(chuàng)標(biāo)記。
12.如權(quán)利要求11所述的搜索服務(wù)器,其特征在于,所述搜索結(jié)果提供模塊在所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源對(duì)應(yīng)的搜索結(jié)果中標(biāo)記作者和發(fā)表時(shí)間。
13.如權(quán)利要求8所述的搜索服務(wù)器,其特征在于,所述M個(gè)原創(chuàng)內(nèi)容發(fā)布源具有高的排序優(yōu)先級(jí)。
14.如權(quán)利要求8所述的搜索服務(wù)器,其特征在于,還包括: 擴(kuò)展內(nèi)容提供模塊,用于分別從所 述M個(gè)原創(chuàng)內(nèi)容發(fā)布源中獲取作者名稱,并根據(jù)所述作者名稱進(jìn)行檢索以獲取與所述作者名稱相關(guān)的內(nèi)容并提供至所述客戶端。
全文摘要
本發(fā)明提出一種原創(chuàng)內(nèi)容的搜索方法和搜索服務(wù)器,其中方法包括搜索服務(wù)器接收客戶端發(fā)送的搜索詞;搜索服務(wù)器根據(jù)搜索詞獲得N個(gè)搜索結(jié)果,N為大于1的正整數(shù);搜索服務(wù)器對(duì)N個(gè)搜索結(jié)果進(jìn)行分析以確定N個(gè)搜索結(jié)果中的M個(gè)原創(chuàng)內(nèi)容發(fā)布源,其中,M為正整數(shù)且小于N;以及搜索服務(wù)器對(duì)M個(gè)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記之后并提供至客戶端。根據(jù)本發(fā)明實(shí)施例的方法,通過對(duì)搜索結(jié)果進(jìn)行分析獲取搜索結(jié)果中的原創(chuàng)內(nèi)容發(fā)布源,并對(duì)原創(chuàng)內(nèi)容發(fā)布源進(jìn)行特殊標(biāo)記后提供至客戶端,能夠?yàn)橛脩籼峁└哔|(zhì)量的原創(chuàng)內(nèi)容,并充分體現(xiàn)了原創(chuàng)內(nèi)容的價(jià)值,同時(shí)有效的保護(hù)了原創(chuàng)內(nèi)容作者的權(quán)益,有利于互聯(lián)網(wǎng)知識(shí)產(chǎn)權(quán)保護(hù)的發(fā)展。
文檔編號(hào)G06F17/30GK103235821SQ20131015366
公開日2013年8月7日 申請(qǐng)日期2013年4月27日 優(yōu)先權(quán)日2013年4月27日
發(fā)明者熊詠志, 張剛, 劉悅 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司