專利名稱:一種用于生成搜索結(jié)果的摘要的方法與設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及網(wǎng)絡(luò)搜索技術(shù)領(lǐng)域,尤其涉及一種用于生成搜索結(jié)果的摘要的技術(shù)。
背景技術(shù):
在網(wǎng)絡(luò)信息極大豐富的今天,為了快速而準確的找到所需的信息,搜索引擎應運而生。雖然搜索引擎提供了較準確的搜索結(jié)果排序,但是由于搜索引擎是基于全文索引技術(shù)提供服務(wù)的,只要文檔中包含查詢關(guān)鍵詞就會作為搜索結(jié)果返回,經(jīng)常會有一些靠前的搜索結(jié)果并不是用戶所需要的。因此,用戶會通過閱讀摘要來判斷搜索結(jié)果的價值,此時, 摘要中是否包括用戶需要的信息就成了至關(guān)重要的問題?,F(xiàn)有的摘要生成方法主要有兩種,一種是靜態(tài)摘要生成方法,以文檔的主題為中心,即“全文摘要”,這種方法生成的摘要雖然很好的表達了文檔的中心意思,但是文檔中與用戶查詢相關(guān)的信息未必是文檔主題,該信息卻可能對用戶很有價值,故靜態(tài)摘要生成方法很難滿足用戶的查詢需求;另一種是動態(tài)摘要生成方法,根據(jù)用戶的查詢關(guān)鍵詞,從文檔中提取與查詢關(guān)鍵詞最相關(guān)的部分,但是很多時候查詢關(guān)鍵詞并不直接體現(xiàn)用戶的查詢需求,故動態(tài)摘要生成方法同樣很難滿足用戶的查詢需求,并且當查詢關(guān)鍵詞分散在文檔中的多個段落時,提取出來的摘要更是很難包括用戶需要的信息。因此,如何提供一種生成搜索結(jié)果的摘要的方法,使得摘要能夠較好的滿足用戶的查詢需求,以及包含較多的相關(guān)信息,成為目前急需解決的問題之一。
發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用于生成搜索結(jié)果的摘要的方法與設(shè)備。根據(jù)本發(fā)明的一個方面,提供了一種計算機實現(xiàn)的用于生成搜索結(jié)果的摘要的方法,其中,該方法包括以下步驟a獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果;b獲取所述搜索結(jié)果所對應的文檔的摘要提取參數(shù);其中,該方法還包括χ根據(jù)所述查詢序列,從所述文檔中提取與所述查詢序列相對應的摘要片段;y根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),生成所述摘要。根據(jù)本發(fā)明的另一個方面,還提供了一種用于生成搜索結(jié)果的摘要的設(shè)備,其中, 該設(shè)備包括結(jié)果獲取裝置,用于獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果;參數(shù)獲取裝置,用于獲取所述搜索結(jié)果所對應的文檔的摘要提取參數(shù);其中,該設(shè)備還包括片段提取裝置,用于根據(jù)所述查詢序列,從所述文檔中提取與所述查詢序列相對應的摘要片段;
摘要生成裝置,用于根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),生成所述摘要。與現(xiàn)有技術(shù)相比,本發(fā)明根據(jù)摘要提取參數(shù),諸如查詢序列的需求類型、查詢序列與搜索結(jié)果的匹配信息等,生成搜索結(jié)果的摘要。本發(fā)明通過獲取查詢序列的需求類型,使得生成的摘要能夠滿足用戶的查詢需求,例如,當查詢序列的需求類型為問答型時,本發(fā)明可以從文檔的答案資源塊中提取問題的全部答案作為摘要,使得用戶不用點擊搜索結(jié)果的鏈接即可獲得問題的答案,同時提升用戶的搜索體驗。本發(fā)明還通過獲取查詢序列與搜索結(jié)果的匹配信息,使得生成的摘要能夠包含更多的信息,提高用戶的搜索效率,例如,當查詢序列與搜索結(jié)果的匹配信息為完全匹配時,即查詢序列中的查詢關(guān)鍵詞連續(xù)或者非連續(xù)出現(xiàn)在文檔的同一段落內(nèi),本發(fā)明可以將該文檔段落作為相應的摘要。更進一步地,本發(fā)明還可以根據(jù)摘要提取參數(shù)確定摘要的長度,也使得生成的摘要具有更好的可讀性。
通過閱讀參照以下附圖所作的對非限制性實施例所作的詳細描述,本發(fā)明的其它特征、目的和優(yōu)點將會變得更明顯圖1示出根據(jù)本發(fā)明一個方面的用于生成搜索結(jié)果的摘要的設(shè)備的示意圖;圖2示出根據(jù)本發(fā)明一個優(yōu)選實施例的用于生成搜索結(jié)果的摘要的設(shè)備的示意圖;圖3示出根據(jù)本發(fā)明另一個方面的用于生成搜索結(jié)果的摘要的方法流程圖;圖4示出根據(jù)本發(fā)明一個優(yōu)選實施例的用于生成搜索結(jié)果的摘要的方法流程圖。附圖中相同或相似的附圖標記代表相同或相似的部件。
具體實施例方式下面結(jié)合附圖對本發(fā)明作進一步詳細描述。圖1為根據(jù)本發(fā)明一個方面的設(shè)備示意圖,示出一種用于生成搜索結(jié)果的摘要的設(shè)備。其中,摘要生成設(shè)備1包括結(jié)果獲取裝置11、參數(shù)獲取裝置12、片段提取裝置13和摘要生成裝置14。具體地,結(jié)果獲取裝置11獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果;接著,參數(shù)獲取裝置12獲取所述搜索結(jié)果所對應的文檔的摘要提取參數(shù) ’片段提取裝置13根據(jù)所述查詢序列,從所述文檔中提取與所述查詢序列相對應的摘要片段; 隨后,摘要生成裝置14根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),生成所述摘要。在此, 摘要生成設(shè)備1包括但不限于搜索引擎、或者與搜索引擎相連的網(wǎng)絡(luò)設(shè)備,其中,該網(wǎng)絡(luò)設(shè)備包括但不限于網(wǎng)絡(luò)主機、單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器集或基于云計算的計算機集合。本領(lǐng)域技術(shù)人員應能理解上述摘要生成設(shè)備僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的摘要生成設(shè)備如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。更具體地,結(jié)果獲取裝置11獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果。具體地,結(jié)果獲取裝置11通過諸如在摘要生成設(shè)備1或者第三方設(shè)備的搜索信息庫中進行查詢、或者接收第三方設(shè)備發(fā)送的與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果,從而獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果。例如,用戶通過鼠標、鍵盤或者手寫板等輸入設(shè)備向用戶設(shè)備輸入查詢序列,用戶設(shè)備將該查詢序列發(fā)送至搜索引擎,該搜索引擎將基于該查詢序列的搜索結(jié)果發(fā)送至摘要生成設(shè)備1,摘要生成設(shè)備1的結(jié)果獲取裝置11獲取該搜索結(jié)果。本領(lǐng)域技術(shù)人員應能理解上述獲取搜索結(jié)果的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取搜索結(jié)果的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。接著,參數(shù)獲取裝置12獲取所述搜索結(jié)果所對應的文檔的摘要提取參數(shù)。具體地,參數(shù)獲取裝置12獲取結(jié)果獲取裝置11獲取的搜索結(jié)果所對應的文檔的摘要提取參數(shù), 諸如用戶輸入查詢序列的需求類型、搜索結(jié)果與查詢序列的匹配信息等。例如,結(jié)果獲取裝置11獲取與用戶輸入查詢序列相對應的搜索結(jié)果,參數(shù)獲取裝置12根據(jù)該搜索結(jié)果,獲取該搜索結(jié)果與該查詢序列的匹配信息,如完全匹配或部分匹配,以作為該文檔的摘要提取參數(shù)。在此,完全匹配指切分查詢序列獲得的查詢關(guān)鍵詞連續(xù)或者非連續(xù)出現(xiàn)在該文檔的同一段落內(nèi);部分匹配指查詢關(guān)鍵詞分散出現(xiàn)在不同的文檔段落,即該文檔中不存在一個同時包含這(些)查詢關(guān)鍵詞的段落。又如,參數(shù)獲取裝置12對用戶經(jīng)由用戶設(shè)備輸入的查詢序列進行切分,并對切分后的查詢詞進行語義分析,以獲得該查詢序列的需求類型,以作為該文檔的摘要提取參數(shù)。本領(lǐng)域技術(shù)人員應能理解上述獲取摘要提取參數(shù)的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取摘要提取參數(shù)的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。片段提取裝置13根據(jù)所述查詢序列,從所述文檔中提取與所述查詢序列相對應的摘要片段。具體地,片段提取裝置13根據(jù)用戶輸入的查詢序列,從結(jié)果獲取裝置11獲取的搜索結(jié)果所對應的文檔中提取與該查詢序列相對應的摘要片段。例如,結(jié)果獲取裝置11 獲取與用戶輸入查詢序列相對應的搜索結(jié)果,片段提取裝置13根據(jù)該查詢序列,從該搜索結(jié)果所對應的文檔中提取與該查詢序列、或者該查詢序列所包括的查詢關(guān)鍵詞相匹配的摘要片段。本領(lǐng)域技術(shù)人員應能理解上述提取摘要片段的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的提取摘要片段的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。需要說明的是,本領(lǐng)域技術(shù)人員應能理解,參數(shù)獲取裝置12獲取摘要提取參數(shù)的操作,與片段提取裝置13提取摘要片段的操作之間不具有順序關(guān)系,而是相互獨立執(zhí)行的。在結(jié)果獲取裝置11獲取搜索結(jié)果之后,既可以參數(shù)獲取裝置12先獲取摘要提取參數(shù), 然后片段提取裝置13再提取摘要片段;也可以片段提取裝置13先提取摘要片段,然后參數(shù)獲取裝置12再獲取摘要提取參數(shù);還可以參數(shù)獲取裝置12獲取摘要提取參數(shù),同時片段提取裝置13提取摘要片段。隨后,摘要生成裝置14根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),生成與所述查詢序列相對應的摘要。具體地,摘要生成裝置14根據(jù)片段提取裝置13提取的摘要片段, 結(jié)合參數(shù)獲取裝置12獲取的摘要提取參數(shù),生成與用戶輸入查詢序列相對應的摘要。例如,假設(shè)用戶經(jīng)由用戶設(shè)備輸入的查詢序列為“2011年2月上映的電影有哪些”,結(jié)果獲取裝置11獲取與該查詢序列相對應的搜索結(jié)果,參數(shù)獲取裝置12對該查詢序列進行語義分析,獲得其需求類型為問答型,片段提取裝置13從該搜索結(jié)果中提取與該查詢序列相匹配的摘要片段,摘要生成裝置14從這些摘要片段中選擇符合該需求類型的摘要片段,如根據(jù)這些摘要片段在文檔中所屬區(qū)域,選擇位于答案區(qū)的摘要片段,并將這些相符的摘要片段合并,以生成與該查詢序列相對應的摘要。又如,假設(shè)用戶經(jīng)由用戶設(shè)備輸入的查詢序列為“杏仁薏仁”,結(jié)果獲取裝置11獲取與該查詢序列相對應的搜索結(jié)果,參數(shù)獲取裝置12獲取該查詢序列與該搜索結(jié)果的匹配信息為部分匹配,即“杏仁”和“薏仁”出現(xiàn)在不同的文檔段落,片段提取裝置13從該搜索結(jié)果中提取與“杏仁”或者“薏仁”相匹配的摘要片段, 摘要生成裝置14從這些摘要片段中選擇“杏仁”出現(xiàn)最多的摘要片段和“薏仁”出現(xiàn)最多的摘要片段,將這兩個摘要片段合并,以生成與該查詢序列相對應的摘要。本領(lǐng)域技術(shù)人員應能理解上述生成摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的生成摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于止。優(yōu)選地,結(jié)果獲取裝置11、參數(shù)獲取裝置12、片段提取裝置13和摘要生成裝置14 是持續(xù)不斷工作的。具體地,結(jié)果獲取裝置11獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果;接著,參數(shù)獲取裝置12獲取所述搜索結(jié)果所對應的文檔的摘要提取參數(shù);片段提取裝置13根據(jù)所述查詢序列,從所述文檔中提取與所述查詢序列相對應的摘要片段;隨后,摘要生成裝置14根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),生成所述摘要。 在此,本領(lǐng)域技術(shù)人員應理解“持續(xù)”是指摘要生成設(shè)備1的結(jié)果獲取裝置11、參數(shù)獲取裝置12、片段提取裝置13和摘要生成裝置14分別按照設(shè)定的或?qū)崟r調(diào)整的工作模式要求進行搜索結(jié)果的獲取,摘要提取參數(shù)的獲取,摘要片段的提取,以及摘要的生成,直至用戶在較長時間內(nèi)停止向用戶設(shè)備輸入查詢序列。圖2為根據(jù)本發(fā)明一個優(yōu)選實施例的設(shè)備示意圖,示出一種用于生成搜索結(jié)果的摘要的設(shè)備。其中,摘要生成裝置14’包括長度確定單元141’和摘要生成單元142’。具體地,長度確定單元141’根據(jù)所述摘要提取參數(shù),確定與所述摘要提取參數(shù)相對應的摘要長度;摘要生成單元142’根據(jù)所述摘要片段,結(jié)合所述摘要長度,生成所述摘要。更具體地,長度確定單元141’根據(jù)所述摘要提取參數(shù),確定或調(diào)整與所述摘要提取參數(shù)相對應的摘要長度。具體地,長度確定單元141’根據(jù)參數(shù)獲取裝置12獲取的摘要提取參數(shù),諸如用戶輸入查詢序列的需求類型、搜索結(jié)果與查詢序列的匹配信息等,確定與這(些)摘要提取參數(shù)相對應的摘要長度。例如,假設(shè)用戶輸入查詢序列的需求類型為問答型,長度確定單元141’根據(jù)該需求類型,確定相應的摘要長度為答案的長度。又如,假設(shè)預設(shè)摘要長度為2行,用戶輸入查詢序列與其相應搜索結(jié)果的匹配信息為部分匹配,長度確定單元141’根據(jù)該匹配信息,調(diào)整相應的摘要長度,如將摘要程度增至4行。還如,假設(shè)摘要提取參數(shù)包括用戶輸入查詢序列的需求類型和查詢序列與其相應搜索結(jié)果的匹配信息, 長度確定單元141’根據(jù)該需求類型確定初始摘要長度,再根據(jù)該匹配信息調(diào)整該初始摘要長度,從而得到最終的摘要長度。本領(lǐng)域技術(shù)人員應能理解上述確定摘要長度的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的確定摘要長度的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。摘要生成單元142’根據(jù)所述摘要片段,結(jié)合所述摘要長度,生成所述摘要。具體地,摘要生成單元142’根據(jù)片段提取裝置13提取的摘要片段,結(jié)合長度確定單元141’根據(jù)摘要提取參數(shù)確定的摘要長度,生成與用戶輸入查詢序列相對應的摘要。例如,片段提取裝置13提取與查詢序列相對應的摘要片段,摘要提取參數(shù)為查詢序列的需求類型“問答型”,長度確定單元141’根據(jù)該“問答型”確定相應的摘要長度為全部答案的長度,則摘要生成單元142’選擇該查詢序列的答案所在的摘要片段,如最佳答案所在的摘要片段,如果該摘要片段未完全包括最佳答案,則將該摘要片段擴展至完整的最佳答案,并根據(jù)該“最佳答案”摘要片段生成相應的摘要。優(yōu)選地,如果還有其他摘要片段包括或者部分包括其他答案,摘要生成單元142’還可以將該其他摘要片段與完全包括“最佳答案”的摘要片段結(jié)合,生成相應的摘要;更優(yōu)選地,摘要生成設(shè)備1還可以將該其他摘要片段擴展至完整的其他答案,并將該完全包括“其他答案”的摘要片段與完全包括“最佳答案”的摘要片段結(jié)合, 生成相應的摘要。本領(lǐng)域技術(shù)人員應能理解上述生成摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的生成摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,長度確定單元141’還根據(jù)所述摘要提取參數(shù),結(jié)合大量用戶的摘要點擊記錄的統(tǒng)計信息,確定所述摘要長度。具體地,長度確定單元141’還根據(jù)參數(shù)獲取裝置12 獲取的摘要提取參數(shù),結(jié)合大量用戶的摘要點擊記錄的統(tǒng)計信息,諸如在相同查詢序列需求類型所對應的搜索結(jié)果頁面中,大量用戶首次點擊同一順序的搜索結(jié)果的時間,或者在查詢序列與搜索結(jié)果的匹配信息相同的搜索結(jié)果頁面中,大量用戶對不同長度的摘要的點擊量,確定摘要長度。例如,假設(shè)查詢序列的需求類型為軟件下載,在該需求類型所對應的搜索結(jié)果頁面中有10個搜索結(jié)果,統(tǒng)計大量用戶首次點擊每一個搜索結(jié)果的時間,該時間即為用戶瀏覽摘要的時間,如大量用戶瀏覽第5個摘要的統(tǒng)計平均時間=大量用戶首次點擊第5個搜索結(jié)果的時間的平均值-大量用戶首次點擊第4個搜索結(jié)果的時間的平均值, 據(jù)此可以得到用戶瀏覽每一順序的摘要的統(tǒng)計平均時間,并對該統(tǒng)計平均時間求均值,從而長度確定單元141’得到該需求類型下,用戶瀏覽一個摘要的時間,并根據(jù)該時間確定相應的摘要長度,如用戶瀏覽摘要的時間低于3S的,則確定相應的摘要長度為3行,用戶瀏覽摘要的時間超過3S的,則確定相應的摘要長度為4行。又如,假設(shè)查詢序列與搜索結(jié)果的匹配信息為部分匹配,統(tǒng)計部分匹配的搜索結(jié)果頁面中,用戶點擊量最大的搜索結(jié)果所對應的摘要長度L,長度確定單元141’確定該摘要長度L為該匹配信息所對應的摘要長度。 本領(lǐng)域技術(shù)人員應能理解上述確定摘要長度的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的確定摘要長度的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。在一個優(yōu)選實施例中(參照圖1),摘要生成裝置14還根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),以及所述摘要片段的段權(quán)值,生成所述摘要。具體地,摘要生成裝置14還根據(jù)片段提取裝置13提取的摘要片段,結(jié)合參數(shù)獲取裝置12獲取的摘要提取參數(shù),以及這些摘要片段的段權(quán)值,生成與用戶輸入查詢序列相對應的摘要。例如,片段提取裝置13提取多個摘要片段,摘要提取參數(shù)為用戶輸入查詢序列的需求類型,摘要生成裝置14從這些摘要片段中選擇與該需求類型相符的摘要片段,再根據(jù)這些相符的摘要片段的段權(quán)值,選擇段權(quán)值最高的4個相符的摘要片段生成摘要。本領(lǐng)域技術(shù)人員應能理解上述生成摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的生成摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,所述段權(quán)值基于但不限于,以下至少任一項1)所述摘要片段中與所述查詢序列相對應的查詢關(guān)鍵詞的個數(shù);2)所述摘要片段中與所述查詢序列相對應的查詢關(guān)鍵詞的權(quán)值;3)所述摘要片段在所述文檔中的位置;4)所述摘要片段與所述文檔的標題的相似度。
具體地,1)摘要片段的段權(quán)值可以基于該摘要片段中查詢關(guān)鍵詞的個數(shù),在此,查詢關(guān)鍵詞由對查詢序列進行切分獲得;例如,假設(shè)查詢序列為“杏仁薏仁”,對該查詢序列進行切分,得到查詢關(guān)鍵詞“杏仁”和“薏仁”,則摘要片段中包括“杏仁”和“薏仁”的個數(shù)越多,該摘要片段的段權(quán)值越大。2)摘要片段的段權(quán)值還可以基于該摘要片段中查詢關(guān)鍵詞的權(quán)值,在此,查詢關(guān)鍵詞由對查詢序列進行切分獲得,不同查詢關(guān)鍵詞的權(quán)值也不相同; 例如,假設(shè)查詢序列為“宮穿越”,對該查詢序列進行切分,得到查詢關(guān)鍵詞“宮”和“穿越”, 且“宮”的權(quán)值>“穿越”的權(quán)值,則包括“宮”和“穿越”的摘要片段的段權(quán)值>僅包括“宮” 的摘要片段的段權(quán)值>僅包括“穿越”的摘要片段的段權(quán)值?;谜蔚亩螜?quán)值還可以基于該摘要片段在搜索結(jié)果所對應文檔中的位置,例如,位于文檔首段的摘要片段的段權(quán)值>位于文檔中間的摘要片段的段權(quán)值>位于文檔末尾的摘要片段的段權(quán)值。4)摘要片段的段權(quán)值還可以基于該摘要片段與搜索結(jié)果所對應文檔的標題的相似度,摘要片段與該文檔標題的相似度越高,其段權(quán)值也越大。需要說明的是,本領(lǐng)域技術(shù)人員應能理解,上述摘要片段段權(quán)值的每一個參考因素不僅可以單獨用于確定摘要片段的段權(quán)值,還可以將其中多個參考因素相結(jié)合用于確定摘要片段的段權(quán)值。本領(lǐng)域技術(shù)人員還應能理解上述摘要片段段權(quán)值的參考因素僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的摘要片段段權(quán)值的參考因素如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。在一個優(yōu)選實施例中(參照圖1),片段提取裝置13還從所述搜索結(jié)果所對應的文檔中提取與所述查詢序列相對應的匹配句;根據(jù)所述匹配句,參照所述匹配句的相關(guān)信息, 生成所述摘要片段。具體地,片段提取裝置13還從搜索結(jié)果所對應的文檔中提取與用戶輸入查詢序列相對應的匹配句,并根據(jù)這些匹配句,結(jié)合這些匹配句的相關(guān)信息,諸如匹配句之間的緊密度、匹配句在文檔中的位置、匹配句的內(nèi)容重復度等,生成相應的摘要片段。例如,片段提取裝置13對用戶輸入的查詢序列進行切分,獲得查詢關(guān)鍵詞,從該查詢序列的搜索結(jié)果所對應的文檔中提取包括查詢關(guān)鍵詞的匹配句,再根據(jù)這些匹配句之間的緊密度以及這些匹配句在文檔中的位置,選擇緊密度較高且在文檔位置較靠前的匹配句,將這些匹配句合并生成摘要片段。本領(lǐng)域技術(shù)人員應能理解上述生成摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的生成摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,所述相關(guān)信息包括但不限于,以下至少任一項1)所述匹配句之間的緊密度;2)所述匹配句在文檔中的位置;3)所述匹配句在文檔段落中的位置;4)所述匹配句的內(nèi)容重復度;5)所述匹配句的基礎(chǔ)權(quán)值;6)所述匹配句的匹配權(quán)值。具體地,匹配句的相關(guān)信息包括但不限于,以下至少任一項1)匹配句之間的緊密度,包括匹配句所處位置之間的緊密度、匹配句內(nèi)容之間的相關(guān)度等,其中,匹配句所處位置之間的緊密度指匹配句是否處于相同的內(nèi)容塊,如最佳答案塊、補充答案塊、其他問題塊等,相互之間緊密度越高的匹配句,被選中生成摘要片段的可能性越高;2)匹配句在文檔中的位置,包括匹配句位于文檔的標題、正文、側(cè)邊欄、腳注等,位于文檔正文的匹配句被選中生成摘要片段的可能性更高;3)匹配句在文檔段落中的位置,包括匹配句位于文檔段落的首句、中間、或者末句等,位于文檔段落的首句和末句的匹配句被選中生成摘要片段的可能性更高;4)匹配句的內(nèi)容重復度,包括匹配句與查詢序列的內(nèi)容重復度、匹配句之間的內(nèi)容重復度和匹配句與文檔標題的內(nèi)容重復度,其中,匹配句與查詢序列的內(nèi)容重復度較高的內(nèi)容一般會作為較相關(guān)內(nèi)容納入摘要片段,由于文檔標題多會作為搜索結(jié)果的標題,同時為了提高摘要片段的可讀性和增加摘要片段的有效內(nèi)容,與文檔標題的內(nèi)容重復度較高的內(nèi)容,不會被納入摘要片段,而匹配句之間相互重復的內(nèi)容則可以經(jīng)過去重處理, 將去重后的內(nèi)容納入摘要片段;5)匹配句的基礎(chǔ)權(quán)值,根據(jù)匹配句與文檔主題的相關(guān)度確定,匹配句與文檔主題的相關(guān)度越高,其相應的基礎(chǔ)權(quán)值越高,被選中生成摘要片段的可能性越高;6)匹配句的匹配權(quán)值,根據(jù)匹配句與查詢序列中查詢關(guān)鍵詞的匹配程度確定,當匹配句與查詢序列完全匹配時,即該匹配句包括所有查詢關(guān)鍵詞,其相應的匹配權(quán)值最高, 還可以進一步結(jié)合該匹配句中查詢關(guān)鍵詞的個數(shù),包括單個出現(xiàn)的查詢關(guān)鍵詞的個數(shù)以及各查詢關(guān)鍵詞的重復次數(shù),根據(jù)該匹配句中查詢關(guān)鍵詞的個數(shù)和各查詢關(guān)鍵詞的重復次數(shù)調(diào)高其匹配權(quán)值,當匹配句與查詢序列部分匹配時,即該匹配句包括部分查詢關(guān)鍵詞,其相應的匹配權(quán)值由該匹配句中包括的查詢關(guān)鍵詞的權(quán)值決定,該查詢關(guān)鍵詞的權(quán)值越高的, 其所在的匹配句的匹配權(quán)值也越高,同樣可以進一步結(jié)合該匹配句中查詢關(guān)鍵詞的個數(shù), 并根據(jù)該匹配句中查詢關(guān)鍵詞的個數(shù)調(diào)高其匹配權(quán)值。需要說明的是,本領(lǐng)域技術(shù)人員應能理解,上述各項匹配句的相關(guān)信息不僅可以單獨用于匹配句的選擇,還可以將其中多項匹配句的相關(guān)信息相結(jié)合用于匹配句的選擇。 本領(lǐng)域技術(shù)人員還應能理解上述匹配句的相關(guān)信息僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的匹配句的相關(guān)信息如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。在另一個優(yōu)選實施例中(參照圖1),所述摘要提取參數(shù)包括但不限于,以下至少任一項1)所述查詢序列的需求類型;2)所述搜索結(jié)果與所述查詢序列的匹配信息。具體地,摘要提取參數(shù)包括但不限于,以下至少任一項1)用戶輸入查詢序列的需求類型,諸如問答類、商情類、下載類、小說類等;參數(shù)獲取裝置12可以對用戶輸入的查詢序列進行切分,獲得查詢關(guān)鍵詞,再根據(jù)查詢關(guān)鍵詞確定相應的需求類型,如查詢序列 “2011年2月有哪些商場做促銷”,切分后獲得查詢關(guān)鍵詞“2011年”、“2月”、“哪些”、“商場” 和“促銷”,根據(jù)“哪些”確定該查詢序列的需求類型為問答型;2)搜索結(jié)果與查詢序列的匹配信息包括完全匹配和部分匹配,在此,完全匹配指切分查詢序列獲得的查詢關(guān)鍵詞連續(xù)或者非連續(xù)出現(xiàn)在該文檔的同一段落內(nèi);部分匹配指查詢關(guān)鍵詞分散出現(xiàn)在不同的文檔段落,即該文檔中不存在一個同時包含這(些)查詢關(guān)鍵詞的段落。本領(lǐng)域技術(shù)人員應能理解,上述各項摘要提取參數(shù)不僅可以單獨作為摘要生成的參考因素,還可以共同作為摘要生成的參考因素。本領(lǐng)域技術(shù)人員還應能理解上述摘要提取參數(shù)僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的摘要提取參數(shù)如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。
優(yōu)選地,所述摘要提取參數(shù)包括所述查詢序列的需求類型;參數(shù)獲取裝置12還根據(jù)所述查詢序列的查詢相關(guān)屬性,獲取所述查詢序列的需求類型。具體地,摘要提取參數(shù)包括用戶輸入查詢序列的需求類型,參數(shù)獲取裝置12根據(jù)用戶輸入查詢序列的查詢相關(guān)屬性,諸如用戶歷史查詢記錄、該查詢序列的語義分析結(jié)果等,獲取該查詢序列的需求類型。 例如,當摘要提取參數(shù)包括用戶輸入查詢序列的需求類型時,假設(shè)查詢序列為“2011年2月有哪些商場做促銷”,參數(shù)獲取裝置12對該查詢序列切分后獲得查詢關(guān)鍵詞“2011年”、“2 月”、“哪些”、“商場”和“促銷”,根據(jù)“哪些”確定該查詢序列的需求類型為問答型。本領(lǐng)域技術(shù)人員應能理解上述獲取查詢序列的需求類型的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取查詢序列的需求類型的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。更優(yōu)選地,所述查詢相關(guān)屬性包括但不限于,以下至少任一項1)用戶歷史查詢記錄;2)所述查詢序列的語義分析結(jié)果;3)查詢序列分類信息。具體地,1)用戶歷史查詢記錄,包括當前輸入該查詢序列的用戶的歷史查詢記錄和大量用戶對該查詢序列的歷史查詢記錄。例如,將當前輸入該查詢序列的用戶的若干次連續(xù)查詢行為當做一個單元,在該單元中,該當前用戶的查詢主題是相同的,而其每次輸入的查詢序列可能不一致,如先后輸入“五筆輸入法”、“五筆輸入法下載”等,據(jù)此參數(shù)獲取裝置12確定該用戶的與查詢關(guān)鍵詞“五筆輸入法”對應的序列類型為下載類。又如,用戶輸入的查詢序列為“五筆輸入法”,但是該用戶點擊的搜索結(jié)果均是關(guān)于五筆輸入法的下載信息,據(jù)此參數(shù)獲取裝置12獲取該用戶的與查詢關(guān)鍵詞“五筆輸入法”對應的序列類型為下載類。還如,對于新聞類的查詢需求,在特定時間內(nèi)其查詢次數(shù)會激增,如在元宵期間,大量用戶對“趙本山元宵晚會”的查詢次數(shù)會激增,而在元宵節(jié)之前和之后,查詢次數(shù)均較少, 據(jù)此參數(shù)獲取裝置12確定該查詢序列的需求類型為新聞類。2)根據(jù)查詢序列的語義分析結(jié)果獲取查詢序列的需求類型的方式包括但不限于 對查詢序列進行語義分析,根據(jù)獲得的語義分析結(jié)果確定該查詢序列的需求類型,如對“五筆輸入法下載”進行語義分析,獲得其需求類型為下載類;切分查詢序列,對切分獲得的查詢關(guān)鍵詞進行語義分析,如切分查詢序列“2011年2月有哪些商場做促銷”,獲得查詢關(guān)鍵詞“2011年”、“2月”、“哪些”、“商場”和“促銷”,根據(jù)“哪些”確定該查詢序列的需求類型為問答型。3)根據(jù)查詢序列分類信息獲取查詢序列的需求類型的方式包括但不限于切分查詢序列,對切分獲得的查詢關(guān)鍵詞與專有詞進行匹配,當匹配成功時,該專有詞的分類信息即為該查詢序列的需求類型,在此,專有詞的分類信息來源于對特定視頻網(wǎng)站、特定小說網(wǎng)站等知名網(wǎng)站的資源挖掘,對從這些網(wǎng)站獲取的專有詞按照來源網(wǎng)站的屬性進行分類, 以獲得相應專有詞的分類信息。例如,對“小說閱讀網(wǎng)”進行資源挖掘,獲得專有詞“綰青絲”,其分類信息為“小說”,據(jù)此確定當用戶輸入查詢序列“綰青絲”時,該查詢序列的需求類型為小說類。本領(lǐng)域技術(shù)人員應能理解,上述各項查詢相關(guān)屬性不僅可以單獨用于獲取查詢序列的需求類型,還可以將其中多項查詢相關(guān)屬性相結(jié)合共同用于獲取查詢序列的需求類型。本領(lǐng)域技術(shù)人員還應能理解上述查詢相關(guān)屬性僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的查詢相關(guān)屬性如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,所述摘要提取參數(shù)包括所述搜索結(jié)果與所述查詢序列的匹配信息;摘要生成裝置14當所述搜索結(jié)果與所述查詢序列的匹配信息包括部分匹配時,根據(jù)所述查詢序列中各查詢關(guān)鍵詞的權(quán)重,對所述摘要片段進行篩選處理,以獲取篩選后的所述摘要片段;根據(jù)所述篩選后的摘要片段,生成所述摘要。具體地,摘要提取參數(shù)包括搜索結(jié)果與用戶輸入查詢序列的匹配信息;摘要生成裝置14當該匹配信息包括部分匹配時,根據(jù)該查詢序列中各查詢關(guān)鍵詞的權(quán)重,對片段提取裝置13提取的摘要片段進行篩選處理,以獲取篩選后的摘要片段,并根據(jù)這些篩選后的摘要片段,生成與該查詢序列相對應的摘要。例如, 摘要提取參數(shù)包括搜索結(jié)果與用戶輸入查詢序列的匹配信息,當該匹配信息為部分匹配時,根據(jù)該查詢序列中各查詢關(guān)鍵詞的權(quán)重,如查詢序列“宮穿越”,切分獲得查詢關(guān)鍵詞 “宮”和“穿越”,其中,“宮”的權(quán)重>“穿越”的權(quán)重,片段提取裝置13提取出僅包括“宮”的摘要片段和僅包括“穿越”的摘要片段,摘要生成裝置14對這些摘要片段進行篩選處理,獲得僅包括“宮”的摘要片段,并據(jù)此生成摘要。本領(lǐng)域技術(shù)人員應能理解上述生成摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的生成摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。在再一個優(yōu)選實施例中(參照圖1),摘要生成設(shè)備1還包括提供裝置(未示出), 該提供裝置將所述摘要提供至所述用戶設(shè)備。具體地,提供裝置將摘要生成裝置14生成的摘要提供至輸入查詢序列的用戶設(shè)備。例如,摘要生成裝置14生成與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的摘要,提供裝置將這些摘要置于搜索結(jié)果頁面中,與該查詢序列所對應的搜索結(jié)果一并發(fā)送至該用戶設(shè)備;在此,摘要或者位于其對應搜索結(jié)果的下方,或者當用戶的鼠標停留在某一搜索結(jié)果上時,該搜索結(jié)果所對應的摘要即以懸浮窗的形式顯示,或者以逐個收起的形式統(tǒng)一顯示在搜索結(jié)果頁面的右側(cè),與該摘要對應的搜索結(jié)果相平行,當鼠標停留在某一搜索結(jié)果上時,其右側(cè)的相應文檔摘要則展開顯示。本領(lǐng)域技術(shù)人員應能理解上述提供摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的提供摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。圖3為根據(jù)本發(fā)明另一個方面的方法流程圖,示出一種用于生成搜索結(jié)果的摘要的過程。具體地,在步驟Sl中,摘要生成設(shè)備1獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果;接著,在步驟S2中,摘要生成設(shè)備1獲取所述搜索結(jié)果所對應的文檔的摘要提取參數(shù);在步驟S3中,摘要生成設(shè)備1根據(jù)所述查詢序列,從所述文檔中提取與所述查詢序列相對應的摘要片段;隨后,在步驟S4中,摘要生成設(shè)備1根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),生成所述摘要。在此,摘要生成設(shè)備1包括但不限于搜索引擎、或者與之相連的專用設(shè)備,其中,該專用設(shè)備包括但不限于網(wǎng)絡(luò)主機、單個網(wǎng)絡(luò)服務(wù)器、多個網(wǎng)絡(luò)服務(wù)器集或基于云計算的計算機集合。本領(lǐng)域技術(shù)人員應能理解上述摘要生成設(shè)備僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的摘要生成設(shè)備如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。更具體地,在步驟Sl中,摘要生成設(shè)備1獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果。具體地,在步驟Sl中,摘要生成設(shè)備1通過諸如在其自身或者第三方設(shè)備的搜索信息庫中進行查詢、或者接收第三方設(shè)備發(fā)送的與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果,從而獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果。例如,用戶通過鼠標、鍵盤或者手寫板等輸入設(shè)備向用戶設(shè)備輸入查詢序列,用戶設(shè)備將該查詢序列發(fā)送至搜索引擎,該搜索引擎將基于該查詢序列的搜索結(jié)果發(fā)送至摘要生成設(shè)備1,摘要生成設(shè)備1據(jù)此獲取該搜索結(jié)果。本領(lǐng)域技術(shù)人員應能理解上述獲取搜索結(jié)果的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取搜索結(jié)果的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。接著,在步驟S2中,摘要生成設(shè)備1獲取所述搜索結(jié)果所對應的文檔的摘要提取參數(shù)。具體地,在步驟S2中,摘要生成設(shè)備1獲取其在步驟Sl中獲取的搜索結(jié)果所對應的文檔的摘要提取參數(shù),諸如用戶輸入查詢序列的需求類型、搜索結(jié)果與查詢序列的匹配信息等。例如,在步驟Sl中,摘要生成設(shè)備1獲取與用戶輸入查詢序列相對應的搜索結(jié)果,在步驟S2中,摘要生成設(shè)備1根據(jù)該搜索結(jié)果,獲取該搜索結(jié)果與該查詢序列的匹配信息,如完全匹配或部分匹配,以作為該文檔的摘要提取參數(shù)。在此,完全匹配指切分查詢序列獲得的查詢關(guān)鍵詞連續(xù)或者非連續(xù)出現(xiàn)在該文檔的同一段落內(nèi);部分匹配指查詢關(guān)鍵詞分散出現(xiàn)在不同的文檔段落,即該文檔中不存在一個同時包含這(些)查詢關(guān)鍵詞的段落。又如, 在步驟S2中,摘要生成設(shè)備1對用戶經(jīng)由用戶設(shè)備輸入的查詢序列進行切分,并對切分后的查詢詞進行語義分析,以獲得該查詢序列的需求類型,以作為該文檔的摘要提取參數(shù)。本領(lǐng)域技術(shù)人員應能理解上述獲取摘要提取參數(shù)的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取摘要提取參數(shù)的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。在步驟S3中,摘要生成設(shè)備1根據(jù)所述查詢序列,從所述文檔中提取與所述查詢序列相對應的摘要片段。具體地,在步驟S3中,摘要生成設(shè)備1根據(jù)用戶輸入的查詢序列, 從其在步驟Sl中獲取的搜索結(jié)果所對應的文檔中提取與該查詢序列相對應的摘要片段。 例如,在步驟Sl中,摘要生成設(shè)備1獲取與用戶輸入查詢序列相對應的搜索結(jié)果,在步驟S3 中,摘要生成設(shè)備1根據(jù)該查詢序列,從該搜索結(jié)果所對應的文檔中提取與該查詢序列、或者該查詢序列所包括的查詢關(guān)鍵詞相匹配的摘要片段。本領(lǐng)域技術(shù)人員應能理解上述提取摘要片段的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的提取摘要片段的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。需要說明的是,本領(lǐng)域技術(shù)人員應能理解,步驟S2中摘要生成設(shè)備1獲取摘要提取參數(shù)的操作,與步驟S3中摘要生成設(shè)備1提取摘要片段的操作之間不具有順序關(guān)系,而是相互獨立執(zhí)行的。在步驟Sl摘要生成設(shè)備1獲取搜索結(jié)果之后,摘要生成設(shè)備1既可以向執(zhí)行步驟S2獲取摘要提取參數(shù),然后再執(zhí)行步驟S3提取摘要片段;也可以先執(zhí)行步驟 S3提取摘要片段,然后再執(zhí)行步驟S2獲取摘要提取參數(shù);還可以執(zhí)行步驟S2獲取摘要提取參數(shù)的同時,執(zhí)行步驟S3提取摘要片段。隨后,在步驟S4中,摘要生成設(shè)備1根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù), 生成與所述查詢序列相對應的摘要。具體地,在步驟S4中,摘要生成設(shè)備1根據(jù)其在步驟 S3中提取的摘要片段,結(jié)合其在步驟S2中獲取的摘要提取參數(shù),生成與用戶輸入查詢序列相對應的摘要。例如,假設(shè)用戶經(jīng)由用戶設(shè)備輸入的查詢序列為“2011年2月上映的電影有哪些”,在步驟Sl中,摘要生成設(shè)備1獲取與該查詢序列相對應的搜索結(jié)果;在步驟S2中,摘要生成設(shè)備1對該查詢序列進行語義分析,獲得其需求類型為問答型;在步驟S3中,摘要生成設(shè)備1從該搜索結(jié)果中提取與該查詢序列相匹配的摘要片段;在步驟S4中,摘要生成設(shè)備1從這些摘要片段中選擇符合該需求類型的摘要片段,如根據(jù)這些摘要片段在文檔中所屬區(qū)域,選擇位于答案區(qū)的摘要片段,并將這些相符的摘要片段合并,以生成與該查詢序列相對應的摘要。又如,假設(shè)用戶經(jīng)由用戶設(shè)備輸入的查詢序列為“杏仁薏仁”,在步驟Sl 中,摘要生成設(shè)備1獲取與該查詢序列相對應的搜索結(jié)果;在步驟S2中,摘要生成設(shè)備1獲取該查詢序列與該搜索結(jié)果的匹配信息為部分匹配,即“杏仁”和“薏仁”出現(xiàn)在不同的文檔段落;在步驟S3中,摘要生成設(shè)備1從該搜索結(jié)果中提取與“杏仁”或者“薏仁”相匹配的摘要片段;在步驟S4中,摘要生成設(shè)備1從這些摘要片段中選擇“杏仁”出現(xiàn)最多的摘要片段和“薏仁”出現(xiàn)最多的摘要片段,將這兩個摘要片段合并,以生成與該查詢序列相對應的摘要。本領(lǐng)域技術(shù)人員應能理解上述生成摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的生成摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,摘要生成設(shè)備1在步驟Si、步驟S2、步驟S3和步驟S4是持續(xù)不斷工作的。 具體地,在步驟Sl中,摘要生成設(shè)備1獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果;接著,在步驟S2中,摘要生成設(shè)備1獲取所述搜索結(jié)果所對應的文檔的摘要提取參數(shù);在步驟S3中,摘要生成設(shè)備1根據(jù)所述查詢序列,從所述文檔中提取與所述查詢序列相對應的摘要片段;隨后,在步驟S4中,摘要生成設(shè)備1根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),生成所述摘要。在此,本領(lǐng)域技術(shù)人員應理解“持續(xù)”是指摘要生成設(shè)備1在步驟Si、步驟S2、步驟S3和步驟S4分別按照設(shè)定的或?qū)崟r調(diào)整的工作模式要求進行搜索結(jié)果的獲取,摘要提取參數(shù)的獲取,摘要片段的提取,以及摘要的生成,直至用戶在較長時間內(nèi)停止向用戶設(shè)備輸入查詢序列。圖4為根據(jù)本發(fā)明一個優(yōu)選實施例的方法流程圖,示出一種用于生成搜索結(jié)果的摘要的過程。其中,圖4中步驟Si’、步驟S2’和步驟S3’的內(nèi)容與圖3中步驟Si、步驟S2 和步驟S3的內(nèi)容相同,為簡明起見,不再贅述,以引用方式包含于此。在步驟S41’中,摘要生成設(shè)備1根據(jù)所述摘要提取參數(shù),確定與所述摘要提取參數(shù)相對應的摘要長度;在步驟S42’中,摘要生成設(shè)備1根據(jù)所述摘要片段,結(jié)合所述摘要長度,生成所述摘要。具體地,在步驟S41’中,摘要生成設(shè)備1根據(jù)所述摘要提取參數(shù),確定或調(diào)整與所述摘要提取參數(shù)相對應的摘要長度。具體地,在步驟S41’中,摘要生成設(shè)備1根據(jù)其在步驟S3’中獲取的摘要提取參數(shù),諸如用戶輸入查詢序列的需求類型、搜索結(jié)果與查詢序列的匹配信息等,確定與這(些)摘要提取參數(shù)相對應的摘要長度。例如,假設(shè)用戶輸入查詢序列的需求類型為問答型,在步驟S41’中,摘要生成設(shè)備1根據(jù)該需求類型,確定相應的摘要長度為答案的長度。又如,假設(shè)預設(shè)摘要長度為2行,用戶輸入查詢序列與其相應搜索結(jié)果的匹配信息為部分匹配,在步驟S41’中,摘要生成設(shè)備1根據(jù)該匹配信息,調(diào)整相應的摘要長度,如將摘要程度增至4行。還如,假設(shè)摘要提取參數(shù)包括用戶輸入查詢序列的需求類型和查詢序列與其相應搜索結(jié)果的匹配信息,在步驟S41’中,摘要生成設(shè)備1根據(jù)該需求類型確定初始摘要長度,再根據(jù)該匹配信息調(diào)整該初始摘要長度,從而得到最終的摘要長度。 本領(lǐng)域技術(shù)人員應能理解上述確定摘要長度的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的確定摘要長度的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。 在步驟S42’中,摘要生成設(shè)備1根據(jù)所述摘要片段,結(jié)合所述摘要長度,生成所述摘要。具體地,在步驟S42’中,摘要生成設(shè)備1根據(jù)其在步驟S3’中提取的摘要片段,結(jié)合其在步驟S41’中根據(jù)摘要提取參數(shù)確定的摘要長度,生成與用戶輸入查詢序列相對應的摘要。例如,在步驟S3’中,摘要生成設(shè)備1提取與查詢序列相對應的摘要片段,摘要提取參數(shù)為查詢序列的需求類型“問答型”;在步驟S41’中,摘要生成設(shè)備1根據(jù)該“問答型”確定相應的摘要長度為全部答案的長度;則在步驟S42’中,摘要生成設(shè)備1選擇該查詢序列的答案所在的摘要片段,如最佳答案所在的摘要片段,如果該摘要片段未完全包括最佳答案,則將該摘要片段擴展至完整的最佳答案,并根據(jù)該“最佳答案”摘要片段生成相應的摘要。優(yōu)選地,如果還有其他摘要片段包括或者部分包括其他答案,在步驟S42’中,摘要生成設(shè)備1 還可以將該其他摘要片段與完全包括“最佳答案”的摘要片段結(jié)合,生成相應的摘要;更優(yōu)選地,摘要生成設(shè)備1還可以將該其他摘要片段擴展至完整的其他答案,并將該完全包括 “其他答案”的摘要片段與完全包括“最佳答案”的摘要片段結(jié)合,生成相應的摘要。本領(lǐng)域技術(shù)人員應能理解上述生成摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的生成摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。
優(yōu)選地,在步驟S41’中,摘要生成設(shè)備1還根據(jù)所述摘要提取參數(shù),結(jié)合大量用戶的摘要點擊記錄的統(tǒng)計信息,確定所述摘要長度。具體地,在步驟S41’中,摘要生成設(shè)備1 還根據(jù)其在步驟S2’中獲取的摘要提取參數(shù),結(jié)合大量用戶的摘要點擊記錄的統(tǒng)計信息,諸如在相同查詢序列需求類型所對應的搜索結(jié)果頁面中,大量用戶首次點擊同一順序的搜索結(jié)果的時間,或者在查詢序列與搜索結(jié)果的匹配信息相同的搜索結(jié)果頁面中,大量用戶對不同長度的摘要的點擊量,確定摘要長度。例如,假設(shè)查詢序列的需求類型為軟件下載,在該需求類型所對應的搜索結(jié)果頁面中有10個搜索結(jié)果,統(tǒng)計大量用戶首次點擊每一個搜索結(jié)果的時間,該時間即為用戶瀏覽摘要的時間,如大量用戶瀏覽第5個摘要的統(tǒng)計平均時間=大量用戶首次點擊第5個搜索結(jié)果的時間的平均值-大量用戶首次點擊第4個搜索結(jié)果的時間的平均值,據(jù)此可以得到用戶瀏覽每一順序的摘要的統(tǒng)計平均時間,并對該統(tǒng)計平均時間求均值,從而摘要生成設(shè)備1得到該需求類型下,用戶瀏覽一個摘要的時間,并根據(jù)該時間確定相應的摘要長度,如用戶瀏覽摘要的時間低于3S的,則確定相應的摘要長度為3行,用戶瀏覽摘要的時間超過3S的,則確定相應的摘要長度為4行。又如,假設(shè)查詢序列與搜索結(jié)果的匹配信息為部分匹配,統(tǒng)計部分匹配的搜索結(jié)果頁面中,用戶點擊量最大的搜索結(jié)果所對應的摘要長度L,摘要生成設(shè)備1確定該摘要長度L為該匹配信息所對應的摘要長度。本領(lǐng)域技術(shù)人員應能理解上述確定摘要長度的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的確定摘要長度的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。 在一個優(yōu)選實施例中(參照圖3),在步驟S4中,摘要生成設(shè)備1還根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),以及所述摘要片段的段權(quán)值,生成所述摘要。具體地,在步驟 S4中,摘要生成設(shè)備1還根據(jù)其在步驟S3中提取的摘要片段,結(jié)合其在步驟S2中獲取的摘要提取參數(shù),以及這些摘要片段的段權(quán)值,生成與用戶輸入查詢序列相對應的摘要。例如, 在步驟S3中,摘要生成設(shè)備1提取多個摘要片段,摘要提取參數(shù)為用戶輸入查詢序列的需求類型;在步驟S4中,摘要生成設(shè)備1從這些摘要片段中選擇與該需求類型相符的摘要片段,再根據(jù)這些相符的摘要片段的段權(quán)值,選擇段權(quán)值最高的4個相符的摘要片段生成摘要。本領(lǐng)域技術(shù)人員應能理解上述生成摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的生成摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,所述段權(quán)值基于但不限于,以下至少任一項1)所述摘要片段中與所述查詢序列相對應的查詢關(guān)鍵詞的個數(shù);2)所述摘要片段中與所述查詢序列相對應的查詢關(guān)鍵詞的權(quán)值;3)所述摘要片段在所述文檔中的位置;4)所述摘要片段與所述文檔的標題的相似度。具體地,1)摘要片段的段權(quán)值可以基于該摘要片段中查詢關(guān)鍵詞的個數(shù),在此,查詢關(guān)鍵詞由對查詢序列進行切分獲得;例如,假設(shè)查詢序列為“杏仁薏仁”,對該查詢序列進行切分,得到查詢關(guān)鍵詞“杏仁”和“薏仁”,則摘要片段中包括“杏仁”和“薏仁”的個數(shù)越多,該摘要片段的段權(quán)值越大。2)摘要片段的段權(quán)值還可以基于該摘要片段中查詢關(guān)鍵詞的權(quán)值,在此,查詢關(guān)鍵詞由對查詢序列進行切分獲得,不同查詢關(guān)鍵詞的權(quán)值也不相同; 例如,假設(shè)查詢序列為“宮穿越”,對該查詢序列進行切分,得到查詢關(guān)鍵詞“宮”和“穿越”, 且“宮”的權(quán)值>“穿越”的權(quán)值,則包括“宮”和“穿越”的摘要片段的段權(quán)值>僅包括“宮” 的摘要片段的段權(quán)值>僅包括“穿越”的摘要片段的段權(quán)值?;谜蔚亩螜?quán)值還可以基于該摘要片段在搜索結(jié)果所對應文檔中的位置,例如,位于文檔首段的摘要片段的段權(quán)值>位于文檔中間的摘要片段的段權(quán)值>位于文檔末尾的摘要片段的段權(quán)值。4)摘要片段的段權(quán)值還可以基于該摘要片段與搜索結(jié)果所對應文檔的標題的相似度,摘要片段與該文檔標題的相似度越高,其段權(quán)值也越大。需要說明的是,本領(lǐng)域技術(shù)人員應能理解,上述摘要片段段權(quán)值的每一個參考因素不僅可以單獨用于確定摘要片段的段權(quán)值,還可以將其中多個參考因素相結(jié)合用于確定摘要片段的段權(quán)值。本領(lǐng)域技術(shù)人員還應能理解上述摘要片段段權(quán)值的參考因素僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的摘要片段段權(quán)值的參考因素如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。在一個優(yōu)選實施例中(參照圖3),在步驟S3中,摘要生成設(shè)備1還從所述搜索結(jié)果所對應的文檔中提取與所述查詢序列相對應的匹配句;根據(jù)所述匹配句,參照所述匹配句的相關(guān)信息,生成所述摘要片段。具體地,在步驟S3中,摘要生成設(shè)備1還從搜索結(jié)果所對應的文檔中提取與用戶輸入查詢序列相對應的匹配句,并根據(jù)這些匹配句,結(jié)合這些匹配句的相關(guān)信息,諸如匹配句之間的緊密度、匹配句在文檔中的位置、匹配句的內(nèi)容重復度等,生成相應的摘要片段。例如,在步驟S3中,摘要生成設(shè)備1對用戶輸入的查詢序列進行切分,獲得查詢關(guān)鍵詞,從該查詢序列的搜索結(jié)果所對應的文檔中提取包括查詢關(guān)鍵詞的匹配句,再根據(jù)這些匹配句之間的緊密度以及這些匹配句在文檔中的位置,選擇緊密度較高且在文檔位置較靠前的匹配句,將這些匹配句合并生成摘要片段。本領(lǐng)域技術(shù)人員應能理解上述生成摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的生成摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,所述相關(guān)信息包括但不限于,以下至少任一項
1)所述匹配句之間的緊密度;2)所述匹配句在文檔中的位置;3)所述匹配句在文檔段落中的位置;4)所述匹配句的內(nèi)容重復度;5)所述匹配句的基礎(chǔ)權(quán)值;6)所述匹配句的匹配權(quán)值。具體地,匹配句的相關(guān)信息包括但不限于,以下至少任一項1)匹配句之間的緊密度,包括匹配句所處位置之間的緊密度、匹配句內(nèi)容之間的相關(guān)度等,其中,匹配句所處位置之間的緊密度指匹配句是否處于相同的內(nèi)容塊,如最佳答案塊、補充答案塊、其他問題塊等,相互之間緊密度越高的匹配句,被選中生成摘要片段的可能性越高;2)匹配句在文檔中的位置,包括匹配句位于文檔的標題、正文、側(cè)邊欄、腳注等,位于文檔正文的匹配句被選中生成摘要片段的可能性更高;3)匹配句在文檔段落中的位置,包括匹配句位于文檔段落的首句、中間、或者末句等,位于文檔段落的首句和末句的匹配句被選中生成摘要片段的可能性更高;4)匹配句的內(nèi)容重復度,包括匹配句與查詢序列的內(nèi)容重復度、匹配句之間的內(nèi)容重復度和匹配句與文檔標題的內(nèi)容重復度,其中,匹配句與查詢序列的內(nèi)容重復度較高的內(nèi)容一般會作為較相關(guān)內(nèi)容納入摘要片段,由于文檔標題多會作為搜索結(jié)果的標題,同時為了提高摘要片段的可讀性和增加摘要片段的有效內(nèi)容,與文檔標題的內(nèi)容重復度較高的內(nèi)容,不會被納入摘要片段,而匹配句之間相互重復的內(nèi)容則可以經(jīng)過去重處理, 將去重后的內(nèi)容納入摘要片段;5)匹配句的基礎(chǔ)權(quán)值,根據(jù)匹配句與文檔主題的相關(guān)度確定,匹配句與文檔主題的相關(guān)度越高,其相應的基礎(chǔ)權(quán)值越高,被選中生成摘要片段的可能性越高;6)匹配句的匹配權(quán)值,根據(jù)匹配句與查詢序列中查詢關(guān)鍵詞的匹配程度確定,當匹配句與查詢序列完全匹配時,即該匹配句包括所有查詢關(guān)鍵詞,其相應的匹配權(quán)值最高, 還可以進一步結(jié)合該匹配句中查詢關(guān)鍵詞的個數(shù),包括單個出現(xiàn)的查詢關(guān)鍵詞的個數(shù)以及各查詢關(guān)鍵詞的重復次數(shù),根據(jù)該匹配句中查詢關(guān)鍵詞的個數(shù)和各查詢關(guān)鍵詞的重復次數(shù)調(diào)高其匹配權(quán)值,當匹配句與查詢序列部分匹配時,即該匹配句包括部分查詢關(guān)鍵詞,其相應的匹配權(quán)值由該匹配句中包括的查詢關(guān)鍵詞的權(quán)值決定,該查詢關(guān)鍵詞的權(quán)值越高的, 其所在的匹配句的匹配權(quán)值也越高,同樣可以進一步結(jié)合該匹配句中查詢關(guān)鍵詞的個數(shù), 并根據(jù)該匹配句中查詢關(guān)鍵詞的個數(shù)調(diào)高其匹配權(quán)值。需要說明的是,本領(lǐng)域技術(shù)人員應能理解,上述各項匹配句的相關(guān)信息不僅可以單獨用于匹配句的選擇,還可以將其中多項匹配句的相關(guān)信息相結(jié)合用于匹配句的選擇。 本領(lǐng)域技術(shù)人員還應能理解上述匹配句的相關(guān)信息僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的匹配句的相關(guān)信息如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。在另一個優(yōu)選實施例中(參照圖3),所述摘要提取參數(shù)包括但不限于,以下至少任一項1)所述查詢序列的需求類型;2)所述搜索結(jié)果與所述查詢序列的匹配信息。具體地,摘要提取參數(shù)包括但不限于,以下至少任一項1)用戶輸入查詢序列的需求類型,諸如問答類、商情類、下載類、小說類等;摘要生成設(shè)備1可以對用戶輸入的查
18詢序列進行切分,獲得查詢關(guān)鍵詞,再根據(jù)查詢關(guān)鍵詞確定相應的需求類型,如查詢序列 “2011年2月有哪些商場做促銷”,切分后獲得查詢關(guān)鍵詞“2011年”、“2月”、“哪些”、“商場” 和“促銷”,根據(jù)“哪些”確定該查詢序列的需求類型為問答型;2)搜索結(jié)果與查詢序列的匹配信息包括完全匹配和部分匹配,在此,完全匹配指切分查詢序列獲得的查詢關(guān)鍵詞連續(xù)或者非連續(xù)出現(xiàn)在該文檔的同一段落內(nèi);部分匹配指查詢關(guān)鍵詞分散出現(xiàn)在不同的文檔段落,即該文檔中不存在一個同時包含這(些)查詢關(guān)鍵詞的段落。本領(lǐng)域技術(shù)人員應能理解,上述各項摘要提取參數(shù)不僅可以單獨作為摘要生成的參考因素,還可以共同作為摘要生成的參考因素。本領(lǐng)域技術(shù)人員還應能理解上述摘要提取參數(shù)僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的摘要提取參數(shù)如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,所述摘要提取參數(shù)包括所述查詢序列的需求類型;在步驟S2中,摘要生成設(shè)備1還根據(jù)所述查詢序列的查詢相關(guān)屬性,獲取所述查詢序列的需求類型。具體地,摘要提取參數(shù)包括用戶輸入查詢序列的需求類型,在步驟S2中,摘要生成設(shè)備1根據(jù)用戶輸入查詢序列的查詢相關(guān)屬性,諸如用戶歷史查詢記錄、該查詢序列的語義分析結(jié)果等,獲取該查詢序列的需求類型。例如,當摘要提取參數(shù)包括用戶輸入查詢序列的需求類型時,假設(shè)查詢序列為“2011年2月有哪些商場做促銷”,在步驟S2中,摘要生成設(shè)備1對該查詢序列切分后獲得查詢關(guān)鍵詞“2011年”、“2月”、“哪些”、“商場”和“促銷”,根據(jù)“哪些”確定該查詢序列的需求類型為問答型。本領(lǐng)域技術(shù)人員應能理解上述獲取查詢序列的需求類型的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的獲取查詢序列的需求類型的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。更優(yōu)選地,所述查詢相關(guān)屬性包括但不限于,以下至少任一項1)用戶歷史查詢記錄;2)所述查詢序列的語義分析結(jié)果;3)查詢序列分類信息。具體地,1)用戶歷史查詢記錄,包括當前輸入該查詢序列的用戶的歷史查詢記錄和大量用戶對該查詢序列的歷史查詢記錄。例如,將當前輸入該查詢序列的用戶的若干次連續(xù)查詢行為當做一個單元,在該單元中,該當前用戶的查詢主題是相同的,而其每次輸入的查詢序列可能不一致,如先后輸入“五筆輸入法”、“五筆輸入法下載”等,據(jù)此摘要生成設(shè)備1確定該用戶的與查詢關(guān)鍵詞“五筆輸入法”對應的序列類型為下載類。又如,用戶輸入的查詢序列為“五筆輸入法”,但是該用戶點擊的搜索結(jié)果均是關(guān)于五筆輸入法的下載信息,據(jù)此摘要生成設(shè)備1獲取該用戶的與查詢關(guān)鍵詞“五筆輸入法”對應的序列類型為下載類。還如,對于新聞類的查詢需求,在特定時間內(nèi)其查詢次數(shù)會激增,如在元宵期間,大量用戶對“趙本山元宵晚會”的查詢次數(shù)會激增,而在元宵節(jié)之前和之后,查詢次數(shù)均較少,據(jù)此摘要生成設(shè)備1確定該查詢序列的需求類型為新聞類。2)根據(jù)查詢序列的語義分析結(jié)果獲取查詢序列的需求類型的方式包括但不限于 對查詢序列進行語義分析,根據(jù)獲得的語義分析結(jié)果確定該查詢序列的需求類型,如對“五筆輸入法下載”進行語義分析,獲得其需求類型為下載類;切分查詢序列,對切分獲得的查詢關(guān)鍵詞進行語義分析,如切分查詢序列“2011年2月有哪些商場做促銷”,獲得查詢關(guān)鍵詞“2011年”、“2月”、“哪些”、“商場”和“促銷”,根據(jù)“哪些”確定該查詢序列的需求類型為16/17頁
問答型。3)根據(jù)查詢序列分類信息獲取查詢序列的需求類型的方式包括但不限于切分查詢序列,對切分獲得的查詢關(guān)鍵詞與專有詞進行匹配,當匹配成功時,該專有詞的分類信息即為該查詢序列的需求類型,在此,專有詞的分類信息來源于對特定視頻網(wǎng)站、特定小說網(wǎng)站等知名網(wǎng)站的資源挖掘,對從這些網(wǎng)站獲取的專有詞按照來源網(wǎng)站的屬性進行分類, 以獲得相應專有詞的分類信息。例如,對“小說閱讀網(wǎng)”進行資源挖掘,獲得專有詞“綰青絲”,其分類信息為“小說”,據(jù)此確定當用戶輸入查詢序列“綰青絲”時,該查詢序列的需求類型為小說類。本領(lǐng)域技術(shù)人員應能理解,上述各項查詢相關(guān)屬性不僅可以單獨用于獲取查詢序列的需求類型,還可以將其中多項查詢相關(guān)屬性相結(jié)合共同用于獲取查詢序列的需求類型。本領(lǐng)域技術(shù)人員還應能理解上述查詢相關(guān)屬性僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的查詢相關(guān)屬性如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。優(yōu)選地,所述摘要提取參數(shù)包括所述搜索結(jié)果與所述查詢序列的匹配信息;在步驟S4中,摘要生成設(shè)備1當所述搜索結(jié)果與所述查詢序列的匹配信息包括部分匹配時,根據(jù)所述查詢序列中各查詢關(guān)鍵詞的權(quán)重,對所述摘要片段進行篩選處理,以獲取篩選后的所述摘要片段;根據(jù)所述篩選后的摘要片段,生成所述摘要。具體地,摘要提取參數(shù)包括搜索結(jié)果與用戶輸入查詢序列的匹配信息;在步驟S4中,摘要生成設(shè)備1當該匹配信息包括部分匹配時,根據(jù)該查詢序列中各查詢關(guān)鍵詞的權(quán)重,對其在步驟S3中提取的摘要片段進行篩選處理,以獲取篩選后的摘要片段,并根據(jù)這些篩選后的摘要片段,生成與該查詢序列相對應的摘要。例如,摘要提取參數(shù)包括搜索結(jié)果與用戶輸入查詢序列的匹配信息,當該匹配信息為部分匹配時,根據(jù)該查詢序列中各查詢關(guān)鍵詞的權(quán)重,如查詢序列“宮穿越”,切分獲得查詢關(guān)鍵詞“宮”和“穿越”,其中,“宮”的權(quán)重>“穿越”的權(quán)重;在步驟S3中,摘要生成設(shè)備1提取出僅包括“宮”的摘要片段和僅包括“穿越”的摘要片段;在步驟S4中,摘要生成設(shè)備1對這些摘要片段進行篩選處理,獲得僅包括“宮”的摘要片段,并據(jù)此生成摘要。本領(lǐng)域技術(shù)人員應能理解上述生成摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的生成摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。在再一個優(yōu)選實施例中(參照圖3),該過程還包括步驟S5(未示出),在步驟S5 中,摘要生成設(shè)備1將所述摘要提供至所述用戶設(shè)備。具體地,在步驟S5中,摘要生成設(shè)備 1將其在步驟S4中生成的摘要提供至輸入查詢序列的用戶設(shè)備。例如,在步驟S4中,摘要生成設(shè)備1生成與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的摘要;在步驟S5中,摘要生成設(shè)備1將這些摘要置于搜索結(jié)果頁面中,與該查詢序列所對應的搜索結(jié)果一并發(fā)送至該用戶設(shè)備;在此,摘要或者位于其對應搜索結(jié)果的下方,或者當用戶的鼠標停留在某一搜索結(jié)果上時,該搜索結(jié)果所對應的摘要即以懸浮窗的形式顯示,或者以逐個收起的形式統(tǒng)一顯示在搜索結(jié)果頁面的右側(cè),與該摘要對應的搜索結(jié)果相平行,當鼠標停留在某一搜索結(jié)果上時,其右側(cè)的相應文檔摘要則展開顯示。本領(lǐng)域技術(shù)人員應能理解上述提供摘要的方式僅為舉例,其他現(xiàn)有的或今后可能出現(xiàn)的提供摘要的方式如可適用于本發(fā)明,也應包含在本發(fā)明保護范圍以內(nèi),并以引用方式包含于此。
對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化涵括在本發(fā)明內(nèi)。不應將權(quán)利要求中的任何附圖標記視為限制所涉及的權(quán)利要求。此外,顯然“包括” 一詞不排除其他單元或步驟,單數(shù)不排除復數(shù)。系統(tǒng)權(quán)利要求中陳述的多個單元或裝置也可以由一個單元或裝置通過軟件或者硬件來實現(xiàn)。第一,第二等詞語用來表示名稱,而并不表示任何特定的順序。
權(quán)利要求
1.一種計算機實現(xiàn)的用于生成搜索結(jié)果的摘要的方法,其中,該方法包括以下步驟 a獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果;b獲取所述搜索結(jié)果所對應的文檔的摘要提取參數(shù); 其中,該方法還包括X根據(jù)所述查詢序列,從所述文檔中提取與所述查詢序列相對應的摘要片段; y根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),生成與所述查詢序列相對應的摘要。
2.根據(jù)權(quán)利要求1所述的方法,其中,所述步驟y還包括yl根據(jù)所述摘要提取參數(shù),確定或調(diào)整與所述摘要提取參數(shù)相對應的摘要長度; 12根據(jù)所述摘要片段,結(jié)合所述摘要長度,生成所述摘要。
3.根據(jù)權(quán)利要求2所述的方法,其中,所述步驟yl還包括-根據(jù)所述摘要提取參數(shù),結(jié)合大量用戶的摘要點擊記錄的統(tǒng)計信息,確定所述摘要長度。
4.根據(jù)權(quán)利要求1至3中任一項所述的方法,其中,所述步驟y還包括-根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),以及所述摘要片段的段權(quán)值,生成所述摘要。
5.根據(jù)權(quán)利要求4所述的方法,其中,所述段權(quán)值基于以下至少任一項 -所述摘要片段中與所述查詢序列相對應的查詢關(guān)鍵詞的個數(shù);-所述摘要片段中與所述查詢序列相對應的查詢關(guān)鍵詞的權(quán)值; -所述摘要片段在所述文檔中的位置; -所述摘要片段與所述文檔的標題的相似度。
6.根據(jù)權(quán)利要求1至5中任一項所述的方法,其中,所述步驟χ還包括 -從所述搜索結(jié)果所對應的文檔中提取與所述查詢序列相對應的匹配句; -根據(jù)所述匹配句,參照所述匹配句的相關(guān)信息,生成所述摘要片段。
7.根據(jù)權(quán)利要求6所述的方法,其中,所述相關(guān)信息包括以下至少任一項 -所述匹配句之間的緊密度;-所述匹配句在文檔中的位置; -所述匹配句在文檔段落中的位置; -所述匹配句的內(nèi)容重復度; -所述匹配句的基礎(chǔ)權(quán)值; -所述匹配句的匹配權(quán)值。
8.根據(jù)權(quán)利要求1至7中任一項所述的方法,其中,所述摘要提取參數(shù)包括以下至少任一項-所述查詢序列的需求類型; -所述搜索結(jié)果與所述查詢序列的匹配信息。
9.根據(jù)權(quán)利要求8所述的方法,其中,所述摘要提取參數(shù)包括所述查詢序列的需求類型;其中,所述步驟b還包括-根據(jù)所述查詢序列的查詢相關(guān)屬性,獲取所述查詢序列的需求類型。
10.根據(jù)權(quán)利要求9所述的方法,其中,所述查詢相關(guān)屬性包括以下至少任一項-用戶歷史查詢記錄; -所述查詢序列的語義分析結(jié)果; -查詢序列分類信息。
11.根據(jù)權(quán)利要求8至10中任一項所述的方法,其中,所述摘要提取參數(shù)包括所述搜索結(jié)果與所述查詢序列的匹配信息;其中,所述步驟y還包括-當所述搜索結(jié)果與所述查詢序列的匹配信息包括部分匹配時,根據(jù)所述查詢序列中各查詢關(guān)鍵詞的權(quán)重,對所述摘要片段進行篩選處理,以獲取篩選后的所述摘要片段; -根據(jù)所述篩選后的摘要片段,生成所述摘要。
12.根據(jù)權(quán)利要求1至11中任一項所述的方法,其中,該方法還包括 ζ將所述摘要提供至所述用戶設(shè)備。
13.一種用于生成搜索結(jié)果的摘要的設(shè)備,其中,該設(shè)備包括結(jié)果獲取裝置,用于獲取與用戶經(jīng)由用戶設(shè)備輸入的查詢序列相對應的搜索結(jié)果; 參數(shù)獲取裝置,用于獲取所述搜索結(jié)果所對應的文檔的摘要提取參數(shù); 其中,該設(shè)備還包括片段提取裝置,用于根據(jù)所述查詢序列,從所述文檔中提取與所述查詢序列相對應的摘要片段;摘要生成裝置,用于根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),生成與所述查詢序列相對應的摘要。
14.根據(jù)權(quán)利要求13所述的設(shè)備,其中,所述摘要生成裝置還包括長度確定單元,用于根據(jù)所述摘要提取參數(shù),確定或調(diào)整與所述摘要提取參數(shù)相對應的摘要長度;摘要生成單元,用于根據(jù)所述摘要片段,結(jié)合所述摘要長度,生成所述摘要。
15.根據(jù)權(quán)利要求14所述的設(shè)備,其中,所述長度確定單元還用于-根據(jù)所述摘要提取參數(shù),結(jié)合大量用戶的摘要點擊記錄的統(tǒng)計信息,確定所述摘要長度。
16.根據(jù)權(quán)利要求13至15中任一項所述的設(shè)備,其中,所述摘要生成裝置還用于-根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),以及所述摘要片段的段權(quán)值,生成所述摘要。
17.根據(jù)權(quán)利要求16所述的設(shè)備,其中,所述段權(quán)值基于以下至少任一項 -所述摘要片段中與所述查詢序列相對應的查詢關(guān)鍵詞的個數(shù);-所述摘要片段中與所述查詢序列相對應的查詢關(guān)鍵詞的權(quán)值; -所述摘要片段在所述文檔中的位置; -所述摘要片段與所述文檔的標題的相似度。
18.根據(jù)權(quán)利要求13至17中任一項所述的設(shè)備,其中,所述片段提取裝置還用于 -從所述搜索結(jié)果所對應的文檔中提取與所述查詢序列相對應的匹配句;-根據(jù)所述匹配句,參照所述匹配句的相關(guān)信息,生成所述摘要片段。
19.根據(jù)權(quán)利要求18所述的設(shè)備,其中,所述相關(guān)信息包括以下至少任一項 -所述匹配句之間的緊密度;-所述匹配句在文檔中的位置; -所述匹配句在文檔段落中的位置; -所述匹配句的內(nèi)容重復度; -所述匹配句的基礎(chǔ)權(quán)值; -所述匹配句的匹配權(quán)值。
20.根據(jù)權(quán)利要求13至19中任一項所述的設(shè)備,其中,所述摘要提取參數(shù)包括以下至少任一項-所述查詢序列的需求類型; -所述搜索結(jié)果與所述查詢序列的匹配信息。
21.根據(jù)權(quán)利要求20所述的設(shè)備,其中,所述摘要提取參數(shù)包括所述查詢序列的需求類型;其中,所述參數(shù)獲取裝置還用于-根據(jù)所述查詢序列的查詢相關(guān)屬性,獲取所述查詢序列的需求類型。
22.根據(jù)權(quán)利要求21所述的設(shè)備,其中,所述查詢相關(guān)屬性包括以下至少任一項 -用戶歷史查詢記錄;-所述查詢序列的語義分析結(jié)果; -查詢序列分類信息。
23.根據(jù)權(quán)利要求20至22中任一項所述的設(shè)備,其中,所述摘要提取參數(shù)包括所述搜索結(jié)果與所述查詢序列的匹配信息;其中,所述摘要生成裝置還用于-當所述搜索結(jié)果與所述查詢序列的匹配信息包括部分匹配時,根據(jù)所述查詢序列中各查詢關(guān)鍵詞的權(quán)重,對所述摘要片段進行篩選處理,以獲取篩選后的所述摘要片段; -根據(jù)所述篩選后的摘要片段,生成所述摘要。
24.根據(jù)權(quán)利要求13至23中任一項所述的設(shè)備,其中,該設(shè)備還包括 提供裝置,用于將所述摘要提供至所述用戶設(shè)備。
全文摘要
本發(fā)明的目的是提供一種用于生成搜索結(jié)果的摘要的方法與設(shè)備。其中,摘要生成設(shè)備獲取與查詢序列相對應的搜索結(jié)果以及所述搜索結(jié)果所對應的文檔的摘要提取參數(shù);根據(jù)所述查詢序列,從所述文檔中提取與所述查詢序列相對應的摘要片段;根據(jù)所述摘要片段,結(jié)合所述摘要提取參數(shù),生成與所述查詢序列相對應的摘要。與現(xiàn)有技術(shù)相比,本發(fā)明通過獲取查詢序列的需求類型,使得生成的摘要能夠滿足用戶的查詢需求,同時提升用戶的搜索體驗;本發(fā)明還通過獲取查詢序列與搜索結(jié)果的匹配信息,使得生成的摘要能夠包含更多的信息,提高用戶的搜索效率,也使得生成的摘要具有更好的可讀性。
文檔編號G06F17/30GK102163229SQ20111009245
公開日2011年8月24日 申請日期2011年4月13日 優(yōu)先權(quán)日2011年4月13日
發(fā)明者喬勇, 蘭芳, 鄭楓耀 申請人:北京百度網(wǎng)訊科技有限公司