欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

搜索方法及裝置的制造方法

文檔序號:10594112閱讀:458來源:國知局
搜索方法及裝置的制造方法
【專利摘要】本發(fā)明提供一種搜索方法及裝置。本發(fā)明實施例通過根據(jù)所獲取的搜索關(guān)鍵詞,獲得至少一個匹配文本,以作為所述搜索關(guān)鍵詞的證據(jù)數(shù)據(jù),進而,則可以根據(jù)所述搜索關(guān)鍵詞和所述證據(jù)數(shù)據(jù),獲得所述證據(jù)數(shù)據(jù)的特征信息,使得能夠根據(jù)所述特征信息,獲得所述搜索關(guān)鍵詞的應答信息,并輸出,由于不再完全依賴搜索關(guān)鍵詞執(zhí)行搜索操作,而是結(jié)合搜索關(guān)鍵詞所匹配的匹配文本同時執(zhí)行搜索操作,使得所獲得的應答信息能夠基本滿足用戶的真正意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶通過應用反復進行瀏覽或搜索而導致的增加應用與搜索引擎之間的數(shù)據(jù)交互的問題,從而降低了搜索引擎的處理負擔。
【專利說明】搜索方法及裝置 【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及互聯(lián)網(wǎng)技術(shù),尤其設(shè)及一種捜索方法及裝置。 【【背景技術(shù)】】
[0002] 捜索引擎是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上捜集信息,在 對信息進行組織和處理后,為用戶提供捜索服務,將用戶捜索相關(guān)的信息展示給用戶的系 統(tǒng)。據(jù)國家統(tǒng)計局的報道,中國網(wǎng)民人數(shù)已經(jīng)超過了4億,運個數(shù)據(jù)意味著中國已經(jīng)超過美 國成為世界上第一大網(wǎng)民國,且中國的網(wǎng)站總數(shù)量已經(jīng)超過了200萬。因此,如何利用捜索 服務最大限度滿足用戶需求,對于互聯(lián)網(wǎng)企業(yè)而言,始終是一個重要的課題。用戶可W將捜 索關(guān)鍵詞提供給相關(guān)應用,由應用將捜索關(guān)鍵詞,發(fā)送給捜索引擎。捜索引擎則根據(jù)捜索關(guān) 鍵詞,在數(shù)據(jù)庫中進行捜索,W獲得與捜索關(guān)鍵詞匹配的捜索結(jié)果,并返回給應用進行輸 出。
[0003] 然而,隨著信息技術(shù)的發(fā)展,網(wǎng)絡信息呈現(xiàn)爆炸性增長的態(tài)勢,用戶迫切需要更有 效的技術(shù)快速從海量信息中獲取所需信息,運種完全依賴捜索關(guān)鍵詞所執(zhí)行的捜索操作, 可能會使得捜索結(jié)果無法滿足用戶的真正意圖,使得用戶需要通過應用反復進行瀏覽或捜 索,運樣,會增加應用與捜索引擎之間的數(shù)據(jù)交互,從而導致了捜索引擎的處理負擔的增 加。 【
【發(fā)明內(nèi)容】

[0004] 本發(fā)明的多個方面提供一種捜索方法及裝置,用W降低捜索引擎的處理負擔。
[0005] 本發(fā)明的一方面,提供一種捜索方法,包括:
[0006] 獲取捜索關(guān)鍵詞;
[0007] 根據(jù)所述捜索關(guān)鍵詞,獲得至少一個匹配文本,W作為所述捜索關(guān)鍵詞的證據(jù)數(shù) 據(jù);
[000引根據(jù)所述捜索關(guān)鍵詞和所述證據(jù)數(shù)據(jù),獲得所述證據(jù)數(shù)據(jù)的特征信息;
[0009] 根據(jù)所述特征信息,獲得所述捜索關(guān)鍵詞的應答信息;
[0010] 輸出所述應答信息。
[0011] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述根據(jù)所 述捜索關(guān)鍵詞和所述證據(jù)數(shù)據(jù),獲得所述證據(jù)數(shù)據(jù)的特征信息,包括:
[0012] 對所述捜索關(guān)鍵詞進行分詞處理,獲得至少一個第一分詞結(jié)果;
[0013] 對所述證據(jù)數(shù)據(jù)進行分詞處理,獲得至少一個第二分詞結(jié)果;
[0014] 利用所述至少一個第一分詞結(jié)果,對,所述至少一個第二分詞結(jié)果,進行調(diào)整處 理,W獲得所述證據(jù)數(shù)據(jù)的特征信息。
[0015] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述利用所 述至少一個第一分詞結(jié)果,對,所述至少一個第二分詞結(jié)果,進行調(diào)整處理,W獲得所述證 據(jù)數(shù)據(jù)的特征信息,包括:
[0016] 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一 神經(jīng)網(wǎng)絡,獲得所述捜索關(guān)鍵詞的空間向量;
[0017] 將所述捜索關(guān)鍵詞的空間向量,與所述至少一個第二分詞結(jié)果中每個第二分詞結(jié) 果的初始向量表示,進行拼接處理,W獲得所述每個第二分詞結(jié)果的調(diào)整向量表示;
[0018] 根據(jù)所述每個第二分詞結(jié)果的調(diào)整向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個 第二分詞結(jié)果的空間向量,W作為所述證據(jù)數(shù)據(jù)的特征信息。
[0019] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述利用所 述至少一個第一分詞結(jié)果,對,所述至少一個第二分詞結(jié)果,進行調(diào)整處理,W獲得所述證 據(jù)數(shù)據(jù)的特征信息,包括:
[0020] 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一 神經(jīng)網(wǎng)絡,獲得所述捜索關(guān)鍵詞的空間向量;
[0021] 根據(jù)所述捜索關(guān)鍵詞的空間向量和所述至少一個第二分詞結(jié)果中每個第二分詞 結(jié)果的初始向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二分詞結(jié)果的空間向量,W作為 所述證據(jù)數(shù)據(jù)的特征信息。
[0022] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述利用所 述至少一個第一分詞結(jié)果,對,所述至少一個第二分詞結(jié)果,進行調(diào)整處理,W獲得所述證 據(jù)數(shù)據(jù)的特征信息,包括:
[0023] 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一 神經(jīng)網(wǎng)絡,獲得所述每個第一分詞結(jié)果的空間向量;
[0024] 根據(jù)所述每個第一分詞結(jié)果的空間向量和所述至少一個第二分詞結(jié)果中每個第 二分詞結(jié)果的初始向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二分詞結(jié)果的空間向量, W作為所述證據(jù)數(shù)據(jù)的特征信息。
[0025] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述根據(jù)所 述特征信息,獲得所述捜索關(guān)鍵詞的應答信息,包括:
[0026] 根據(jù)所述證據(jù)數(shù)據(jù)的特征信息,獲得所述每個第二分詞結(jié)果的標簽數(shù)據(jù);
[0027] 根據(jù)所述每個第二分詞結(jié)果和所述每個第二分詞結(jié)果的標簽數(shù)據(jù),獲得所述應答 信息。
[0028] 本發(fā)明的另一方面,提供一種捜索裝置,包括:
[0029] 獲取單元,用于獲取捜索關(guān)鍵詞;
[0030] 匹配單元,用于根據(jù)所述捜索關(guān)鍵詞,獲得至少一個匹配文本,W作為所述捜索關(guān) 鍵詞的證據(jù)數(shù)據(jù);
[0031] 特征單元,用于根據(jù)所述捜索關(guān)鍵詞和所述證據(jù)數(shù)據(jù),獲得所述證據(jù)數(shù)據(jù)的特征 f目息;
[0032] 應答單元,用于根據(jù)所述特征信息,獲得所述捜索關(guān)鍵詞的應答信息;
[0033] 輸出單元,用于輸出所述應答信息。
[0034] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述特征單 元,具體用于
[0035] 對所述捜索關(guān)鍵詞進行分詞處理,獲得至少一個第一分詞結(jié)果;
[0036] 對所述證據(jù)數(shù)據(jù)進行分詞處理,獲得至少一個第二分詞結(jié)果;W及
[0037] 利用所述至少一個第一分詞結(jié)果,對,所述至少一個第二分詞結(jié)果,進行調(diào)整處 理,W獲得所述證據(jù)數(shù)據(jù)的特征信息。
[0038] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述特征單 元,具體用于
[0039] 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一 神經(jīng)網(wǎng)絡,獲得所述捜索關(guān)鍵詞的空間向量;
[0040] 將所述捜索關(guān)鍵詞的空間向量,與所述至少一個第二分詞結(jié)果中每個第二分詞結(jié) 果的初始向量表示,進行拼接處理,W獲得所述每個第二分詞結(jié)果的調(diào)整向量表示;W及
[0041] 根據(jù)所述每個第二分詞結(jié)果的調(diào)整向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個 第二分詞結(jié)果的空間向量,W作為所述證據(jù)數(shù)據(jù)的特征信息。
[0042] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述特征單 元,具體用于
[0043] 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一 神經(jīng)網(wǎng)絡,獲得所述捜索關(guān)鍵詞的空間向量;W及
[0044] 根據(jù)所述捜索關(guān)鍵詞的空間向量和所述至少一個第二分詞結(jié)果中每個第二分詞 結(jié)果的初始向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二分詞結(jié)果的空間向量,W作為 所述證據(jù)數(shù)據(jù)的特征信息。
[0045] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述特征單 元,具體用于
[0046] 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一 神經(jīng)網(wǎng)絡,獲得所述每個第一分詞結(jié)果的空間向量;W及
[0047] 根據(jù)所述每個第一分詞結(jié)果的空間向量和所述至少一個第二分詞結(jié)果中每個第 二分詞結(jié)果的初始向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二分詞結(jié)果的空間向量, W作為所述證據(jù)數(shù)據(jù)的特征信息。
[0048] 如上所述的方面和任一可能的實現(xiàn)方式,進一步提供一種實現(xiàn)方式,所述應答單 元,具體用于
[0049] 根據(jù)所述證據(jù)數(shù)據(jù)的特征信息,獲得所述每個第二分詞結(jié)果的標簽數(shù)據(jù);W及
[0050] 根據(jù)所述每個第二分詞結(jié)果和所述每個第二分詞結(jié)果的標簽數(shù)據(jù),獲得所述應答 信息。
[0051] 由上述技術(shù)方案可知,本發(fā)明實施例通過根據(jù)所獲取的捜索關(guān)鍵詞,獲得至少一 個匹配文本,W作為所述捜索關(guān)鍵詞的證據(jù)數(shù)據(jù),進而,則可W根據(jù)所述捜索關(guān)鍵詞和所述 證據(jù)數(shù)據(jù),獲得所述證據(jù)數(shù)據(jù)的特征信息,使得能夠根據(jù)所述特征信息,獲得所述捜索關(guān)鍵 詞的應答信息,并輸出,由于不再完全依賴捜索關(guān)鍵詞執(zhí)行捜索操作,而是結(jié)合捜索關(guān)鍵詞 所匹配的匹配文本同時執(zhí)行捜索操作,使得所獲得的應答信息能夠基本滿足用戶的真正意 圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶通過應用反復進行瀏覽或捜索而導致的增加應用 與捜索引擎之間的數(shù)據(jù)交互的問題,從而降低了捜索引擎的處理負擔。
[0052] 另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴捜索關(guān)鍵詞執(zhí)行捜索操 作,而是結(jié)合捜索關(guān)鍵詞所匹配的匹配文本同時執(zhí)行捜索操作,使得所獲得的應答信息能 夠基本滿足用戶的真正意圖,從而提高了捜索結(jié)果的有效性。
[0053] 另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴捜索關(guān)鍵詞執(zhí)行捜索操 作,而是結(jié)合捜索關(guān)鍵詞所匹配的匹配文本同時執(zhí)行捜索操作,使得所獲得的應答信息能 夠基本滿足用戶的真正意圖,從而提高了捜索的效率。
[0054] 另外,采用本發(fā)明所提供的技術(shù)方案,能夠有效地提高用戶的體驗。 【【附圖說明】】
[0055] 為了更清楚地說明本發(fā)明實施例中的技術(shù)方案,下面將對實施例或現(xiàn)有技術(shù)描述 中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實 施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可W根據(jù)運些附 圖獲得其他的附圖。
[0056] 圖1為本發(fā)明一實施例提供的捜索方法的流程示意圖;
[0057] 圖2為本發(fā)明另一實施例提供的捜索裝置的結(jié)構(gòu)示意圖。 【【具體實施方式】】
[0058] 為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員 在沒有作出創(chuàng)造性勞動前提下所獲得的全部其他實施例,都屬于本發(fā)明保護的范圍。
[0059] 需要說明的是,本發(fā)明實施例中所設(shè)及的終端可W包括但不限于手機、個人數(shù)字 助理(Personal Digital Assis1:ant,PDA)、無線手持設(shè)備、平板電腦(Tablet Computer)、 個人電腦(Personal Computer,PC)、MP3播放器、MP4播放器、可穿戴設(shè)備(例如,智能眼鏡、 智能手表、智能手環(huán)等)等。
[0060] 另外,本文中術(shù)語"和/或",僅僅是一種描述關(guān)聯(lián)對象的關(guān)聯(lián)關(guān)系,表示可W存在 二種關(guān)系,例如,A和/或B,可W表不:單獨存在A,同時存在A和B,單獨存在B運二種情況。另 夕h本文中字符7",一般表示前后關(guān)聯(lián)對象是一種"或"的關(guān)系。
[0061] 圖1為本發(fā)明一實施例提供的捜索方法的流程示意圖,如圖1所示。
[0062] 101、獲取捜索關(guān)鍵詞。
[0063] 102、根據(jù)所述捜索關(guān)鍵詞,獲得至少一個匹配文本,W作為所述捜索關(guān)鍵詞的證 據(jù)數(shù)據(jù)。
[0064] 103、根據(jù)所述捜索關(guān)鍵詞和所述證據(jù)數(shù)據(jù),獲得所述證據(jù)數(shù)據(jù)的特征信息。
[0065] 104、根據(jù)所述特征信息,獲得所述捜索關(guān)鍵詞的應答信息。
[0066] 105、輸出所述應答信息。
[0067] 需要說明的是,101~105的執(zhí)行主體的部分或全部可W為位于本地終端的應用, 或者還可W為設(shè)置在位于本地終端的應用中的插件或軟件開發(fā)工具包(Software Development Kit,SDK)等功能單元,或者還可W為位于網(wǎng)絡側(cè)服務器中的捜索引擎,或者 還可W為位于網(wǎng)絡側(cè)的分布式系統(tǒng),本實施例對此不進行特別限定。
[0068] 可W理解的是,所述應用可W是安裝在終端上的本地程序(nativeApp),或者還可 W是終端上的瀏覽器的一個網(wǎng)頁程序(webApp),本實施例對此不進行特別限定。
[0069] 運樣,通過根據(jù)所獲取的捜索關(guān)鍵詞,獲得至少一個匹配文本,W作為所述捜索關(guān) 鍵詞的證據(jù)數(shù)據(jù),進而,則可W根據(jù)所述捜索關(guān)鍵詞和所述證據(jù)數(shù)據(jù),獲得所述證據(jù)數(shù)據(jù)的 特征信息,使得能夠根據(jù)所述特征信息,獲得所述捜索關(guān)鍵詞的應答信息,并輸出,由于不 再完全依賴捜索關(guān)鍵詞執(zhí)行捜索操作,而是結(jié)合捜索關(guān)鍵詞所匹配的匹配文本同時執(zhí)行捜 索操作,使得所獲得的應答信息能夠基本滿足用戶的真正意圖,因此,能夠避免現(xiàn)有技術(shù)中 由于用戶通過應用反復進行瀏覽或捜索而導致的增加應用與捜索引擎之間的數(shù)據(jù)交互的 問題,從而降低了捜索引擎的處理負擔。
[0070] 可選地,在本實施例的一個可能的實現(xiàn)方式中,在101中,具體可W采集用戶所提 供的所述捜索關(guān)鍵詞。具體來說,具體可W通過用戶所觸發(fā)的捜索命令實現(xiàn)。具體可W采用 但不限于下述幾種方式觸發(fā)捜索命令:
[0071] 方式一:
[0072] 用戶可W在當前應用所展現(xiàn)的頁面上所輸入所述捜索關(guān)鍵詞,然后,通過點擊該 頁面上的捜索按鈕例如,百度一下,W觸發(fā)捜索命令,該捜索命令中包含所述捜索關(guān)鍵詞。 其中,用戶輸入所述捜索關(guān)鍵詞的順序可W為任意順序。運樣,在接收到該捜索命令之后, 則可W解析出其中所包含的所述捜索關(guān)鍵詞。
[0073] 方式二:
[0074] 采用異步加載技術(shù)例如,Ajax異步加載或Jsonp異步加載等,實時獲取用戶在當前 應用所展現(xiàn)的頁面上所輸入的輸入內(nèi)容,為了與捜索關(guān)鍵詞進行區(qū)分,此時的輸入內(nèi)容可 W稱為是輸入關(guān)鍵詞。其中,用戶輸入所述捜索關(guān)鍵詞的順序可W為任意順序。具體地,具 體可W提供Ajax接口或Jso叩接口等接口,運些接口可W使用Java、超級文本預處理 化ypertext PreprocessorJHP)語言等語言進行編寫,其具體的調(diào)用可W使用化Ue巧,或 者原生的化vaScript等語言進行編寫。
[0075] 方式用戶可W通過長按當前應用所展現(xiàn)的頁面上的語音捜索按鈕,說出想要 輸入的語音內(nèi)容,然后,松開語音捜索按鈕,W觸發(fā)捜索命令,該捜索命令中包含根據(jù)所說 出的語音內(nèi)容轉(zhuǎn)換的文本形式的捜索關(guān)鍵詞。運樣,在接收到該捜索命令之后,則可W解析 出其中所包含的所述捜索關(guān)鍵詞。
[0076] 方式四:用戶可W通過點擊當前應用所展現(xiàn)的頁面上的語音捜索按鈕,說出想要 輸入的語音內(nèi)容,待結(jié)束說出語音內(nèi)容一段時間例如,2秒鐘之后,則觸發(fā)捜索命令,該捜索 命令中包含根據(jù)所說出的語音內(nèi)容轉(zhuǎn)換的文本形式的捜索關(guān)鍵詞。運樣,在接收到該捜索 命令之后,則可W解析出其中所包含的所述捜索關(guān)鍵詞。
[0077] 在獲取到所述輸入關(guān)鍵詞之后,則可W執(zhí)行后續(xù)操作即102~105。
[0078] 可選地,在本實施例的一個可能的實現(xiàn)方式中,在102中,具體可W采用現(xiàn)有的捜 索方法,獲得與所述捜索關(guān)鍵詞,對應的若干個頁面。詳細描述可W參見現(xiàn)有技術(shù)中的相關(guān) 內(nèi)容,此處不在寶述?;谶\些頁面,可W獲得與用戶所提供的捜索關(guān)鍵詞所匹配的至少一 個匹配文本。
[00巧]可W理解的是,本發(fā)明所設(shè)及的頁面,也可W稱為萬維網(wǎng)(Worl抓ideWeb,Web)頁 面或網(wǎng)頁,可W是基于超文本標記語言化yperText Mark叫Language,HTML)編寫的網(wǎng)頁 (Web化ge ),即HTML頁面,或者還可W是基于HTML和化va語言編寫的網(wǎng)頁,即Java服務器頁 面(Java Server化ge,JSP),或者還可W為其他語言編寫的網(wǎng)頁,本實施例對此不進行特 別限定。頁面可W包括由一個或者多個頁面標簽例如,超文本標記語言化ype巧ext Markup Language ,HTML)標簽、JSP標簽等,定義的一個顯示區(qū)塊,稱為頁面元素,例如,文字、圖片、 超鏈接、按鈕、編輯框、下拉框等。
[0080] 可選地,在本實施例的一個可能的實現(xiàn)方式中,在103中,具體可W對所述捜索關(guān) 鍵詞進行分詞處理,獲得至少一個第一分詞結(jié)果,W及,對所述證據(jù)數(shù)據(jù)進行分詞處理,獲 得至少一個第二分詞結(jié)果。進而,則可W利用所述至少一個第一分詞結(jié)果,對,所述至少一 個第二分詞結(jié)果,進行調(diào)整處理,W獲得所述證據(jù)數(shù)據(jù)的特征信息。
[0081] 具體來說,具體可W采用現(xiàn)有的各種分詞處理方法,對所述捜索關(guān)鍵詞進行分詞 處理,獲得至少一個第一分詞結(jié)果,W及對所述證據(jù)數(shù)據(jù)進行分詞處理,獲得至少一個第二 分詞結(jié)果,詳細描述可W參見現(xiàn)有技術(shù)中的相關(guān)內(nèi)容,此處不再寶述。例如,可W包括但不 限于去除多余空格、將捜索關(guān)鍵詞或證據(jù)數(shù)據(jù)切分為相應的符號序列、將符號中的大寫字 母轉(zhuǎn)成小寫字母等等處理,其中,每個符號可W是一個詞、字或任意長度的字符串,本實施 例對此不進行特別限定。
[0082] 在一個具體的實現(xiàn)過程中,在獲得第一分詞結(jié)果與第二分詞結(jié)果之后,具體可W 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng)網(wǎng) 絡,獲得所述捜索關(guān)鍵詞的空間向量。然后,可W將所述捜索關(guān)鍵詞的空間向量,與所述至 少一個第二分詞結(jié)果中每個第二分詞結(jié)果的初始向量表示,進行拼接處理,W獲得所述每 個第二分詞結(jié)果的調(diào)整向量表示。最后,可W根據(jù)所述每個第二分詞結(jié)果的調(diào)整向量表示, 利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二分詞結(jié)果的空間向量,W作為所述證據(jù)數(shù)據(jù)的特征 信息。所述第一神經(jīng)網(wǎng)絡與所述第二神經(jīng)網(wǎng)絡可W為相同的神經(jīng)網(wǎng)絡,或者還可W為不同 的神經(jīng)網(wǎng)絡,本實施例對此不進行特別限定。其中,所述第一神經(jīng)網(wǎng)絡或所述第二神經(jīng)網(wǎng)絡 可W包括但不限于循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,R順)、卷積神經(jīng)網(wǎng)絡 (Convolutional 化ural Network,C順)或深度神經(jīng)網(wǎng)絡(De邱化ural Network,D順),本 實施例對此不進行特別限定。
[0083] 可W理解的是,本發(fā)明所采用的神經(jīng)網(wǎng)絡可W有多種可能的實現(xiàn)方式,例如,采用 長短時記憶網(wǎng)絡化ong化ort Term Memory Network,LSTM)或口限循環(huán)單元(Gated Recurren優(yōu)nit, GRU)所實現(xiàn)的循環(huán)神經(jīng)網(wǎng)絡等。本發(fā)明并不限定神經(jīng)網(wǎng)絡的具體實現(xiàn)方式 的選擇,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下即可將一種具體實 現(xiàn)方式替換為另一種具體實現(xiàn)方式。
[0084] 在該實現(xiàn)過程中,具體可W維護向量的查找表,該查找表中存儲符號與向量之間 的一一對應關(guān)系。同時,除了維護向量的查找表之外,還可W進一步存儲一個指定向量,稱 為未登陸詞向量,對于任意符號,如果該符號在查找表中,則將其映射為查找表中所記錄的 與之對應的向量,W作為該符號的初始向量表示,否則,將其映射為未登錄詞向量,W作為 該符號的初始向量表示。
[0085] 可W理解的是,本發(fā)明可W維護一個向量的查找表,用W映射第一分詞結(jié)果和第 二分詞結(jié)果,或者還可W維護兩個向量的查找表,一個向量的查找表,用W映射第一分詞結(jié) 果,另一個向量的查找表,用W映射第二分詞結(jié)果,兩個向量的查找表可W不相同,本實施 例對此不進行特別限定。
[0086] 可W將每個第一分詞結(jié)果的初始向量表示組成的序列,記為問題符號表示序列, 將每個第二分詞結(jié)果的初始向量表示組成的序列,記為臨時證據(jù)符號表示序列 化f,化f,化品,其中m表示臨時證據(jù)符號表示序列的長度。
[0087]在獲得問題符號表示序列之后,可W利用第一神經(jīng)網(wǎng)絡處理所獲得的問題符號表 示序列,將第一神經(jīng)網(wǎng)絡的隱狀態(tài)化idden state)序列/1^/1.^,......,誠作為問題中間表示 序列。其中,11表示問題符號表示序列的長度,/11^ =1,2,... ...,71)為定長向量。然后,則可 W根據(jù)公;
為問題中間表示序列中的每個化(i = 1,2, ......,n)計算一個 權(quán)重,其中V是一個預先設(shè)置的向量參數(shù),r ? Iifg是V與At卽勺內(nèi)積。利用所獲得的權(quán)重,對問 題中間表示序列進行加權(quán)平均處理,獲得一個定長向量,作為所述捜索關(guān)鍵詞的空間向量, 記為問題表示hq。
[008引在獲得問題表示和臨時證據(jù)符號表示序列之后,可W將臨時證據(jù)符號表示序列中 的每個爲(i二1,玄.,m)與問題表示hq,進行拼接處理,獲得證據(jù)符號表示序列 垃叮[化!;/1?!?,[f媒;/巧,其中,[化(i = 1,2,…。.,耐表示將化|與]1。 拼接起來。在獲得證據(jù)符號表示序列之后,可W利用第二神經(jīng)網(wǎng)絡處理所獲得的證據(jù)符號 表示序列,將第二神經(jīng)網(wǎng)絡的隱狀態(tài)化idden state)序列/巧,/?這,......,片為作為證據(jù)中間表 示序列。其中,m表示證據(jù)中間符號表示序列的長度,Zlf 二1,2, ... 為定長向量。運 樣,就得到了每個第二分詞結(jié)果的空間向量,W作為所述證據(jù)數(shù)據(jù)的特征信息。
[0089] 在另一個具體的實現(xiàn)過程中,在獲得第一分詞結(jié)果與第二分詞結(jié)果之后,具體可 W根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng)網(wǎng) 絡,獲得所述捜索關(guān)鍵詞的空間向量。然后,可W根據(jù)所述捜索關(guān)鍵詞的空間向量和所述至 少一個第二分詞結(jié)果中每個第二分詞結(jié)果的初始向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述 每個第二分詞結(jié)果的空間向量,W作為所述證據(jù)數(shù)據(jù)的特征信息。所述第一神經(jīng)網(wǎng)絡與所 述第二神經(jīng)網(wǎng)絡可W為相同的神經(jīng)網(wǎng)絡,或者還可W為不同的神經(jīng)網(wǎng)絡,本實施例對此不 進行特別限定。其中,所述第一神經(jīng)網(wǎng)絡或所述第二神經(jīng)網(wǎng)絡可W包括但不限于循環(huán)神經(jīng) 網(wǎng)絡(Re州rrent 化ural 化twork,RNN)、卷積神經(jīng)網(wǎng)絡(Convolutional 化ural 化twork, CNN)或深度神經(jīng)網(wǎng)絡(Deep化ural Network,D順),本實施例對此不進行特別限定。
[0090] 可W理解的是,本發(fā)明所采用的神經(jīng)網(wǎng)絡可W有多種可能的實現(xiàn)方式,例如,采用 長短時記憶網(wǎng)絡化ong化ort Term Memory Network,LSTM)或口限循環(huán)單元(Gated Recurrent化it,GRU)所實現(xiàn)的循環(huán)神經(jīng)網(wǎng)絡等。本發(fā)明并不限定神經(jīng)網(wǎng)絡的具體實現(xiàn)方 式的選擇,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下即可將一種具體 實現(xiàn)方式替換為另一種具體實現(xiàn)方式。
[0091] 在該實現(xiàn)過程中,具體可W維護向量的查找表,該查找表中存儲符號與向量之間 的一一對應關(guān)系。同時,除了維護向量的查找表之外,還可W進一步存儲一個指定向量,稱 為未登陸詞向量,對于任意符號,如果該符號在查找表中,則將其映射為查找表中所記錄的 與之對應的向量,W作為該符號的初始向量表示,否則,將其映射為未登錄詞向量,W作為 該符號的初始向量表不。
[0092] 可W理解的是,本發(fā)明可W維護一個向量的查找表,用W映射第一分詞結(jié)果和第 二分詞結(jié)果,或者還可W維護兩個向量的查找表,一個向量的查找表,用W映射第一分詞結(jié) 果,另一個向量的查找表,用W映射第二分詞結(jié)果,兩個向量的查找表可W不相同,本實施 例對此不進行特別限定。
[0093] 可W將每個第一分詞結(jié)果的初始向量表示組成的序列,記為問題符號表示序列, 將每個第二分詞結(jié)果的初始向量表示組成的序列,記為臨時證據(jù)符號表示序列 化f,化!,......,化爲,其中m表示臨時證據(jù)符號表示序列的長度。
[0094] 在獲得問題符號表示序列之后,可W利用第一神經(jīng)網(wǎng)絡處理所獲得的問題符號表 示序列,將第一神經(jīng)網(wǎng)絡的隱狀態(tài)化idden state)序列/7.^/1^,... ...,/作為問題中間表示 序列。其中,n表示問題符號表示序列的長度,托f (;i二1,2, ......,耐為定長向量。然后,則可 W根據(jù)公3
婦問題中間表示序列中的每個辟(i二1義......,句計算一個 權(quán)重,其中V是一個預先設(shè)置的向量參數(shù),F(xiàn) ? Zlf是V與Zlf的內(nèi)積。利用所獲得的權(quán)重,對問 題中間表示序列進行加權(quán)平均處理,獲得一個定長向量,作為所述捜索關(guān)鍵詞的空間向量, 記為問題表示hq。
[0095] 在獲得問題表示和臨時證據(jù)符號表示序列之后,可W將問題表示hq與臨時證據(jù)符 號表示序列,進行拼接處理,獲得證據(jù)符號表示序列hq,化f化化為。在獲得證據(jù)符 號表示序列之后,可W利用第二神經(jīng)網(wǎng)絡處理所獲得的證據(jù)符號表示序列,將第二神經(jīng)網(wǎng) 絡的隱狀態(tài)化idden state)序列Zlf伯.......,/4+1作為證據(jù)中間表示序列。其中,m+1表示 證據(jù)中間符號表示序列的長度,的(i二1,2, ...。,,m + U為定長向量。運樣,就得到了每 個第二分詞結(jié)果的空間向量,W作為所述證據(jù)數(shù)據(jù)的特征信息。
[0096] 在另一個具體的實現(xiàn)過程中,在獲得第一分詞結(jié)果與第二分詞結(jié)果之后,具體可 W根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng)網(wǎng) 絡,獲得所述每個第一分詞結(jié)果的空間向量。然后,可W根據(jù)所述每個第一分詞結(jié)果的空間 向量和所述至少一個第二分詞結(jié)果中每個第二分詞結(jié)果的初始向量表示,利用第二神經(jīng)網(wǎng) 絡,獲得所述每個第二分詞結(jié)果的空間向量,W作為所述證據(jù)數(shù)據(jù)的特征信息。所述第一神 經(jīng)網(wǎng)絡與所述第二神經(jīng)網(wǎng)絡可W為相同的神經(jīng)網(wǎng)絡,或者還可W為不同的神經(jīng)網(wǎng)絡,本實 施例對此不進行特別限定。其中,所述第一神經(jīng)網(wǎng)絡或所述第二神經(jīng)網(wǎng)絡可W包括但不限 于循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,R順)、卷積神經(jīng)網(wǎng)絡(Convolutional 化ural化twork,CNN)或深度神經(jīng)網(wǎng)絡化e邱化ural化切〇'1<:,0順),本實施例對此不進行 特別限定。
[0097] 可W理解的是,本發(fā)明所采用的神經(jīng)網(wǎng)絡可W有多種可能的實現(xiàn)方式,例如,采用 長短時記憶網(wǎng)絡化ong化ort Term Memory Network,LSTM)或口限循環(huán)單元(Gated Recurrent化it,GRU)所實現(xiàn)的循環(huán)神經(jīng)網(wǎng)絡等。本發(fā)明并不限定神經(jīng)網(wǎng)絡的具體實現(xiàn)方 式的選擇,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下即可將一種具體 實現(xiàn)方式替換為另一種具體實現(xiàn)方式。
[0098] 在該實現(xiàn)過程中,具體可W維護向量的查找表,該查找表中存儲符號與向量之間 的一一對應關(guān)系。同時,除了維護向量的查找表之外,還可W進一步存儲一個指定向量,稱 為未登陸詞向量,對于任意符號,如果該符號在查找表中,則將其映射為查找表中所記錄的 與之對應的向量,W作為該符號的初始向量表示,否則,將其映射為未登錄詞向量,W作為 該符號的初始向量表示。
[0099] 可W理解的是,本發(fā)明可W維護一個向量的查找表,用W映射第一分詞結(jié)果和第 二分詞結(jié)果,或者還可W維護兩個向量的查找表,一個向量的查找表,用W映射第一分詞結(jié) 果,另一個向量的查找表,用W映射第二分詞結(jié)果,兩個向量的查找表可W不相同,本實施 例對此不進行特別限定。
[0100] 可W將每個第一分詞結(jié)果的初始向量表示組成的序列,記為問題符號表示序列, 將每個第二分詞結(jié)果的初始向量表示組成的序列,記為臨時證據(jù)符號表示序列 化1?,化f化爲,其中m表示臨時證據(jù)符號表示序列的長度。
[0101] 在獲得問題符號表示序列之后,可W利用第一神經(jīng)網(wǎng)絡處理所獲得的問題符號表 示序列,將第一神經(jīng)網(wǎng)絡的隱狀態(tài)化idden state)序列... ...,/l^作為問題中間表示 序列。其中,n表示問題符號表示序列的長度,片,9 (i二1,2, ....詞為定長向量,作為每個第 一分詞結(jié)果的空間向量。
[0102] 在獲得問題中間表示序列和臨時證據(jù)符號表示序列之后,可W將問題中間表示序 列與臨時證據(jù)符號表示序列,進行拼接處理,獲得證據(jù)符號表示序列 的,/?!U化if化36/ ......喘。在獲得證據(jù)符號表示序列之后,可W利用第二神經(jīng)網(wǎng) 絡處理所獲得的證據(jù)符號表示序列,將第二神經(jīng)網(wǎng)絡的隱狀態(tài)(hidden state)序列 巧柏,......,/1篇:+化作為證據(jù)中間表示序列。其中,m+n表示證據(jù)中間表示序列的長度, /if (i二1,2,......,m + n)為定長向量。運樣,就得到了每個第二分詞結(jié)果的空間向量,W 作為所述證據(jù)數(shù)據(jù)的特征信息。
[0103] 可選地,在本實施例的一個可能的實現(xiàn)方式中,在104中,具體可W根據(jù)所述證據(jù) 數(shù)據(jù)的特征信息,獲得所述每個第二分詞結(jié)果的標簽數(shù)據(jù)。進而,則可W根據(jù)所述每個第二 分詞結(jié)果和所述每個第二分詞結(jié)果的標簽數(shù)據(jù),獲得所述應答信息。
[0104] W證據(jù)中間表示序列Zif,/魯,.....,/2品為例,具體可W根據(jù)公式巧=Whf按二 1.2........,祝),:對證據(jù)數(shù)據(jù)的特征信息即證據(jù)中間表示序列進行轉(zhuǎn)換處理,W獲得證據(jù)特 征表示序列Vl,V2,……,Vm。其中,W為一個預先設(shè)置的變換矩陣。然后,可W對證據(jù)特征表示 序列進行標簽處理,W獲得一個長度為t的標簽序列h,12,……,Im,其中,每個標簽IiU = 1,2,……,m)可W表示證據(jù)數(shù)據(jù)的第i個符號即第二分詞結(jié)果的第i個詞是否是應答信息的 第一個符號、證據(jù)數(shù)據(jù)的第i個符號即第二分詞結(jié)果的第i個詞是否是應答信息中除第一個 符號外的其他符號或者證據(jù)數(shù)據(jù)的第i個符號即第二分詞結(jié)果的第i個詞不是應答信息的 一部分。運樣,則可W根據(jù)所獲得的每個第二分詞結(jié)果和所述每個第二分詞結(jié)果的標簽數(shù) 據(jù),獲得所述捜索關(guān)鍵詞的應答信息。
[0105] 其中,所采用的標簽處理方法是一個典型的序列標注問題(sequence labeling problem),可W采用現(xiàn)有技術(shù)中的任何成熟的方法。特別地,本發(fā)明采用條件隨機場 (J.Lafferty,A.McCaHum,and F.Pereira.Conditional Random Fields!Probabilistic Models for Segmenting and Labeling Sequence Data.Proc.18th International Conf.on Machine Learning.Mo;rgan Kaufmann.pp.282-289.2001.)完成該處理。對于本領(lǐng) 域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,可W將條件隨機場方法替換為其他 方法。
[0106] 例如,用戶所提供的捜索關(guān)鍵詞為"劉德華的老婆是誰?",那么,所獲得的第二分 詞結(jié)果是"劉德華的老婆是朱麗倩。"那么,若所獲得的標簽序列為"00000BI爐,其中,B、I、0 分別表示證據(jù)數(shù)據(jù)中相應的符號是應答信息的第一個符號、證據(jù)數(shù)據(jù)中相應的符號是應答 信息中除第一個符號外的其他符號或者證據(jù)數(shù)據(jù)中相應的符號不是應答信息的一部分。根 據(jù)該標簽序列,可W知道,"朱"是應答信息的第一個符號,"麗倩"是應答信息中的其他符 號,所W,應答信息為"朱麗倩"。
[0107] 本發(fā)明所提供的技術(shù)方案,在應用方面,在百度產(chǎn)品中有多處可能的應用,如智能 問答、百度知道自動回答、阿拉下問題類檢索觸發(fā)、智能導診、廣告導流(如用戶檢索病情直 接給出相應診斷提示)等,能夠極大提升用戶體驗,具有巨大的潛在經(jīng)濟價值。
[0108] 本發(fā)明所提供的技術(shù)方案,在競品方面,一方面工業(yè)界仍未見基于神經(jīng)網(wǎng)絡的問 答系統(tǒng)出現(xiàn),該發(fā)明將有益于保持百度在問答系統(tǒng)方面的技術(shù)領(lǐng)先地位;另一方面,競品多 采用傳統(tǒng)問答技術(shù),步驟非常繁瑣,且嚴重依賴于專家經(jīng)驗設(shè)計具體模板,系統(tǒng)開發(fā)周期 長、人力消耗大、難于向新領(lǐng)域拓展,而本發(fā)明的方法是完全數(shù)據(jù)驅(qū)動的方法,且流程簡單, 可W克服前述傳統(tǒng)方法弱點,非常適合公司產(chǎn)品快速迭代演進。
[0109] 本實施例中,通過根據(jù)所獲取的捜索關(guān)鍵詞,獲得至少一個匹配文本,W作為所述 捜索關(guān)鍵詞的證據(jù)數(shù)據(jù),進而,則可W根據(jù)所述捜索關(guān)鍵詞和所述證據(jù)數(shù)據(jù),獲得所述證據(jù) 數(shù)據(jù)的特征信息,使得能夠根據(jù)所述特征信息,獲得所述捜索關(guān)鍵詞的應答信息,并輸出, 由于不再完全依賴捜索關(guān)鍵詞執(zhí)行捜索操作,而是結(jié)合捜索關(guān)鍵詞所匹配的匹配文本同時 執(zhí)行捜索操作,使得所獲得的應答信息能夠基本滿足用戶的真正意圖,因此,能夠避免現(xiàn)有 技術(shù)中由于用戶通過應用反復進行瀏覽或捜索而導致的增加應用與捜索引擎之間的數(shù)據(jù) 交互的問題,從而降低了捜索引擎的處理負擔。
[0110] 另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴捜索關(guān)鍵詞執(zhí)行捜索操 作,而是結(jié)合捜索關(guān)鍵詞所匹配的匹配文本同時執(zhí)行捜索操作,使得所獲得的應答信息能 夠基本滿足用戶的真正意圖,從而提高了捜索結(jié)果的有效性。
[0111] 另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴捜索關(guān)鍵詞執(zhí)行捜索操 作,而是結(jié)合捜索關(guān)鍵詞所匹配的匹配文本同時執(zhí)行捜索操作,使得所獲得的應答信息能 夠基本滿足用戶的真正意圖,從而提高了捜索的效率。
[0112] 另外,采用本發(fā)明所提供的技術(shù)方案,能夠有效地提高用戶的體驗。
[0113] 需要說明的是,對于前述的各方法實施例,為了簡單描述,故將其都表述為一系列 的動作組合,但是本領(lǐng)域技術(shù)人員應該知悉,本發(fā)明并不受所描述的動作順序的限制,因為 依據(jù)本發(fā)明,某些步驟可W采用其他順序或者同時進行。其次,本領(lǐng)域技術(shù)人員也應該知 悉,說明書中所描述的實施例均屬于優(yōu)選實施例,所設(shè)及的動作和模塊并不一定是本發(fā)明 所必須的。
[0114] 在上述實施例中,對各個實施例的描述都各有側(cè)重,某個實施例中沒有詳述的部 分,可W參見其他實施例的相關(guān)描述。
[0115] 圖2為本發(fā)明另一實施例提供的捜索裝置的結(jié)構(gòu)示意圖,如圖2所示。本實施例的 捜索裝置可W包括獲取單元21、匹配單元22、特征單元23、應答單元24和輸出單元25。其中, 獲取單元21,用于獲取捜索關(guān)鍵詞;匹配單元22,用于根據(jù)所述捜索關(guān)鍵詞,獲得至少一個 匹配文本,W作為所述捜索關(guān)鍵詞的證據(jù)數(shù)據(jù);特征單元23,用于根據(jù)所述捜索關(guān)鍵詞和所 述證據(jù)數(shù)據(jù),獲得所述證據(jù)數(shù)據(jù)的特征信息;應答單元24,用于根據(jù)所述特征信息,獲得所 述捜索關(guān)鍵詞的應答信息;輸出單元25,用于輸出所述應答信息。
[0116] 需要說明的是,本實施例所提供的捜索裝置的部分或全部可W為位于本地終端的 應用,或者還可W為設(shè)置在位于本地終端的應用中的插件或軟件開發(fā)工具包(Software Development Kit,SDK)等功能單元,或者還可W為位于網(wǎng)絡側(cè)服務器中的捜索引擎,或者 還可W為位于網(wǎng)絡側(cè)的分布式系統(tǒng),本實施例對此不進行特別限定。
[0117] 可W理解的是,所述應用可W是安裝在終端上的本地程序(nativeApp),或者還可 W是終端上的瀏覽器的一個網(wǎng)頁程序(webApp),本實施例對此不進行特別限定。
[0118] 可選地,在本實施例的一個可能的實現(xiàn)方式中,所述特征單元23,具體可W用于對 所述捜索關(guān)鍵詞進行分詞處理,獲得至少一個第一分詞結(jié)果;對所述證據(jù)數(shù)據(jù)進行分詞處 理,獲得至少一個第二分詞結(jié)果;W及利用所述至少一個第一分詞結(jié)果,對,所述至少一個 第二分詞結(jié)果,進行調(diào)整處理,W獲得所述證據(jù)數(shù)據(jù)的特征信息。
[0119] 在一個具體的實現(xiàn)過程中,所述特征單元23,具體可W用于根據(jù)所述至少一個第 一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng)網(wǎng)絡,獲得所述捜索關(guān)鍵 詞的空間向量;將所述捜索關(guān)鍵詞的空間向量,與所述至少一個第二分詞結(jié)果中每個第二 分詞結(jié)果的初始向量表示,進行拼接處理,W獲得所述每個第二分詞結(jié)果的調(diào)整向量表示; W及根據(jù)所述每個第二分詞結(jié)果的調(diào)整向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二 分詞結(jié)果的空間向量,W作為所述證據(jù)數(shù)據(jù)的特征信息。
[0120] 在另一個具體的實現(xiàn)過程中,所述特征單元23,具體可W用于根據(jù)所述至少一個 第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng)網(wǎng)絡,獲得所述捜索關(guān) 鍵詞的空間向量;W及根據(jù)所述捜索關(guān)鍵詞的空間向量和所述至少一個第二分詞結(jié)果中每 個第二分詞結(jié)果的初始向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二分詞結(jié)果的空間 向量,W作為所述證據(jù)數(shù)據(jù)的特征信息。
[0121] 在另一個具體的實現(xiàn)過程中,所述特征單元23,具體可W用于根據(jù)所述至少一個 第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng)網(wǎng)絡,獲得所述每個第 一分詞結(jié)果的空間向量;W及根據(jù)所述每個第一分詞結(jié)果的空間向量和所述至少一個第二 分詞結(jié)果中每個第二分詞結(jié)果的初始向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二分 詞結(jié)果的空間向量,W作為所述證據(jù)數(shù)據(jù)的特征信息。
[0122] 可選地,在本實施例的一個可能的實現(xiàn)方式中,所述應答單元24,具體可W用于根 據(jù)所述證據(jù)數(shù)據(jù)的特征信息,獲得所述每個第二分詞結(jié)果的標簽數(shù)據(jù);W及根據(jù)所述每個 第二分詞結(jié)果和所述每個第二分詞結(jié)果的標簽數(shù)據(jù),獲得所述應答信息。
[0123] 需要說明的是,圖1對應的實施例中方法,可W由本實施例提供的捜索裝置實現(xiàn)。 詳細描述可W參見圖1對應的實施例中的相關(guān)內(nèi)容,此處不再寶述。
[0124] 本實施例中,通過匹配單元根據(jù)獲取單元所獲取的捜索關(guān)鍵詞,獲得至少一個匹 配文本,W作為所述捜索關(guān)鍵詞的證據(jù)數(shù)據(jù),進而,則可W由特征單元根據(jù)所述捜索關(guān)鍵詞 和所述證據(jù)數(shù)據(jù),獲得所述證據(jù)數(shù)據(jù)的特征信息,使得應答單元能夠根據(jù)所述特征信息,獲 得所述捜索關(guān)鍵詞的應答信息,并由輸出單元輸出,由于不再完全依賴捜索關(guān)鍵詞執(zhí)行捜 索操作,而是結(jié)合捜索關(guān)鍵詞所匹配的匹配文本同時執(zhí)行捜索操作,使得所獲得的應答信 息能夠基本滿足用戶的真正意圖,因此,能夠避免現(xiàn)有技術(shù)中由于用戶通過應用反復進行 瀏覽或捜索而導致的增加應用與捜索引擎之間的數(shù)據(jù)交互的問題,從而降低了捜索引擎的 處理負擔。
[0125] 另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴捜索關(guān)鍵詞執(zhí)行捜索操 作,而是結(jié)合捜索關(guān)鍵詞所匹配的匹配文本同時執(zhí)行捜索操作,使得所獲得的應答信息能 夠基本滿足用戶的真正意圖,從而提高了捜索結(jié)果的有效性。
[0126] 另外,采用本發(fā)明所提供的技術(shù)方案,由于不再完全依賴捜索關(guān)鍵詞執(zhí)行捜索操 作,而是結(jié)合捜索關(guān)鍵詞所匹配的匹配文本同時執(zhí)行捜索操作,使得所獲得的應答信息能 夠基本滿足用戶的真正意圖,從而提高了捜索的效率。
[0127] 另外,采用本發(fā)明所提供的技術(shù)方案,能夠有效地提高用戶的體驗。
[0128] 所屬領(lǐng)域的技術(shù)人員可W清楚地了解到,為描述的方便和簡潔,上述描述的系統(tǒng), 裝置和單元的具體工作過程,可W參考前述方法實施例中的對應過程,在此不再寶述。
[0129] 在本發(fā)明所提供的幾個實施例中,應該理解到,所掲露的系統(tǒng),裝置和方法,可W 通過其它的方式實現(xiàn)。例如,W上所描述的裝置實施例僅僅是示意性的,例如,所述單元的 劃分,僅僅為一種邏輯功能劃分,實際實現(xiàn)時可W有另外的劃分方式,例如,多個單元或組 件可W結(jié)合或者可W集成到另一個系統(tǒng),或一些特征可W忽略,或不執(zhí)行。另一點,所顯示 或討論的相互之間的禪合或直接禪合或通信連接可W是通過一些接口,裝置或單元的間接 禪合或通信連接,可W是電性,機械或其它的形式。
[0130] 所述作為分離部件說明的單元可W是或者也可W不是物理上分開的,作為單元顯 示的部件可W是或者也可W不是物理單元,即可W位于一個地方,或者也可W分布到多個 網(wǎng)絡單元上。可W根據(jù)實際的需要選擇其中的部分或者全部單元來實現(xiàn)本實施例方案的目 的。
[0131] 另外,在本發(fā)明各個實施例中的各功能單元可W集成在一個處理單元中,也可W 是各個單元單獨物理存在,也可W兩個或兩個W上單元集成在一個單元中。上述集成的單 元既可W采用硬件的形式實現(xiàn),也可W采用硬件加軟件功能單元的形式實現(xiàn)。
[0132] 上述W軟件功能單元的形式實現(xiàn)的集成的單元,可W存儲在一個計算機可讀取存 儲介質(zhì)中。上述軟件功能單元存儲在一個存儲介質(zhì)中,包括若干指令用W使得一臺計算機 裝置(可W是個人計算機,服務器,或者網(wǎng)絡裝置等)或處理器(processor)執(zhí)行本發(fā)明各個 實施例所述方法的部分步驟。而前述的存儲介質(zhì)包括:U盤、移動硬盤、只讀存儲器(Read? only Memoir ,ROM)、隨機存取存儲器 (Random Access Memory ,RAM)、磁碟或者光盤等各種 可W存儲程序代碼的介質(zhì)。
[0133] 最后應說明的是:W上實施例僅用W說明本發(fā)明的技術(shù)方案,而非對其限制;盡管 參照前述實施例對本發(fā)明進行了詳細的說明,本領(lǐng)域的普通技術(shù)人員應當理解:其依然可 W對前述各實施例所記載的技術(shù)方案進行修改,或者對其中部分技術(shù)特征進行等同替換; 而運些修改或者替換,并不使相應技術(shù)方案的本質(zhì)脫離本發(fā)明各實施例技術(shù)方案的精神和 范圍。
【主權(quán)項】
1. 一種搜索方法,其特征在于,包括: 獲取搜索關(guān)鍵詞; 根據(jù)所述搜索關(guān)鍵詞,獲得至少一個匹配文本,以作為所述搜索關(guān)鍵詞的證據(jù)數(shù)據(jù); 根據(jù)所述搜索關(guān)鍵詞和所述證據(jù)數(shù)據(jù),獲得所述證據(jù)數(shù)據(jù)的特征信息; 根據(jù)所述特征信息,獲得所述搜索關(guān)鍵詞的應答信息; 輸出所述應答信息。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述搜索關(guān)鍵詞和所述證據(jù)數(shù) 據(jù),獲得所述證據(jù)數(shù)據(jù)的特征信息,包括: 對所述搜索關(guān)鍵詞進行分詞處理,獲得至少一個第一分詞結(jié)果; 對所述證據(jù)數(shù)據(jù)進行分詞處理,獲得至少一個第二分詞結(jié)果; 利用所述至少一個第一分詞結(jié)果,對,所述至少一個第二分詞結(jié)果,進行調(diào)整處理,以 獲得所述證據(jù)數(shù)據(jù)的特征信息。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述利用所述至少一個第一分詞結(jié)果,對, 所述至少一個第二分詞結(jié)果,進行調(diào)整處理,以獲得所述證據(jù)數(shù)據(jù)的特征信息,包括: 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng) 網(wǎng)絡,獲得所述搜索關(guān)鍵詞的空間向量; 將所述搜索關(guān)鍵詞的空間向量,與所述至少一個第二分詞結(jié)果中每個第二分詞結(jié)果的 初始向量表示,進行拼接處理,以獲得所述每個第二分詞結(jié)果的調(diào)整向量表示; 根據(jù)所述每個第二分詞結(jié)果的調(diào)整向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二 分詞結(jié)果的空間向量,以作為所述證據(jù)數(shù)據(jù)的特征信息。4. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述利用所述至少一個第一分詞結(jié)果,對, 所述至少一個第二分詞結(jié)果,進行調(diào)整處理,以獲得所述證據(jù)數(shù)據(jù)的特征信息,包括: 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng) 網(wǎng)絡,獲得所述搜索關(guān)鍵詞的空間向量; 根據(jù)所述搜索關(guān)鍵詞的空間向量和所述至少一個第二分詞結(jié)果中每個第二分詞結(jié)果 的初始向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二分詞結(jié)果的空間向量,以作為所述 證據(jù)數(shù)據(jù)的特征信息。5. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述利用所述至少一個第一分詞結(jié)果,對, 所述至少一個第二分詞結(jié)果,進行調(diào)整處理,以獲得所述證據(jù)數(shù)據(jù)的特征信息,包括: 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng) 網(wǎng)絡,獲得所述每個第一分詞結(jié)果的空間向量; 根據(jù)所述每個第一分詞結(jié)果的空間向量和所述至少一個第二分詞結(jié)果中每個第二分 詞結(jié)果的初始向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二分詞結(jié)果的空間向量,以作 為所述證據(jù)數(shù)據(jù)的特征信息。6. 根據(jù)權(quán)利要求3~5任一權(quán)利要求所述的方法,其特征在于,所述根據(jù)所述特征信息, 獲得所述搜索關(guān)鍵詞的應答信息,包括: 根據(jù)所述證據(jù)數(shù)據(jù)的特征信息,獲得所述每個第二分詞結(jié)果的標簽數(shù)據(jù); 根據(jù)所述每個第二分詞結(jié)果和所述每個第二分詞結(jié)果的標簽數(shù)據(jù),獲得所述應答信 息。7. -種搜索裝置,其特征在于,包括: 獲取單元,用于獲取搜索關(guān)鍵詞; 匹配單元,用于根據(jù)所述搜索關(guān)鍵詞,獲得至少一個匹配文本,以作為所述搜索關(guān)鍵詞 的證據(jù)數(shù)據(jù); 特征單元,用于根據(jù)所述搜索關(guān)鍵詞和所述證據(jù)數(shù)據(jù),獲得所述證據(jù)數(shù)據(jù)的特征信息; 應答單元,用于根據(jù)所述特征信息,獲得所述搜索關(guān)鍵詞的應答信息; 輸出單元,用于輸出所述應答信息。8. 根據(jù)權(quán)利要求7所述的裝置,其特征在于,所述特征單元,具體用于 對所述搜索關(guān)鍵詞進行分詞處理,獲得至少一個第一分詞結(jié)果; 對所述證據(jù)數(shù)據(jù)進行分詞處理,獲得至少一個第二分詞結(jié)果;以及 利用所述至少一個第一分詞結(jié)果,對,所述至少一個第二分詞結(jié)果,進行調(diào)整處理,以 獲得所述證據(jù)數(shù)據(jù)的特征信息。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述特征單元,具體用于 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng) 網(wǎng)絡,獲得所述搜索關(guān)鍵詞的空間向量; 將所述搜索關(guān)鍵詞的空間向量,與所述至少一個第二分詞結(jié)果中每個第二分詞結(jié)果的 初始向量表示,進行拼接處理,以獲得所述每個第二分詞結(jié)果的調(diào)整向量表示;以及 根據(jù)所述每個第二分詞結(jié)果的調(diào)整向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二 分詞結(jié)果的空間向量,以作為所述證據(jù)數(shù)據(jù)的特征信息。10. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述特征單元,具體用于 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng) 網(wǎng)絡,獲得所述搜索關(guān)鍵詞的空間向量;以及 根據(jù)所述搜索關(guān)鍵詞的空間向量和所述至少一個第二分詞結(jié)果中每個第二分詞結(jié)果 的初始向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二分詞結(jié)果的空間向量,以作為所述 證據(jù)數(shù)據(jù)的特征信息。11. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,所述特征單元,具體用于 根據(jù)所述至少一個第一分詞結(jié)果中每個第一分詞結(jié)果的初始向量表示,利用第一神經(jīng) 網(wǎng)絡,獲得所述每個第一分詞結(jié)果的空間向量;以及 根據(jù)所述每個第一分詞結(jié)果的空間向量和所述至少一個第二分詞結(jié)果中每個第二分 詞結(jié)果的初始向量表示,利用第二神經(jīng)網(wǎng)絡,獲得所述每個第二分詞結(jié)果的空間向量,以作 為所述證據(jù)數(shù)據(jù)的特征信息。12. 根據(jù)權(quán)利要求9~11任一權(quán)利要求所述的裝置,其特征在于,所述應答單元,具體用 于 根據(jù)所述證據(jù)數(shù)據(jù)的特征信息,獲得所述每個第二分詞結(jié)果的標簽數(shù)據(jù);以及 根據(jù)所述每個第二分詞結(jié)果和所述每個第二分詞結(jié)果的標簽數(shù)據(jù),獲得所述應答信 息。
【文檔編號】G06F17/30GK105956011SQ201610251871
【公開日】2016年9月21日
【申請日】2016年4月21日
【發(fā)明人】李鵬, 李偉, 何正焱, 王旭光, 曹瑩, 周杰, 徐偉
【申請人】百度在線網(wǎng)絡技術(shù)(北京)有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
鄂伦春自治旗| 五台县| 麟游县| 太白县| 中超| 綦江县| 恩平市| 利津县| 昌邑市| 桓台县| 丰顺县| 锦州市| 乌拉特后旗| 奉新县| 灵寿县| 获嘉县| 德格县| 五台县| 安达市| 马公市| 凤翔县| 西华县| 茶陵县| 荥经县| 连城县| 东源县| 亳州市| 柯坪县| 萨迦县| 田林县| 乌审旗| 沂水县| 丹巴县| 泾川县| 关岭| 金坛市| 固安县| 平顺县| 扶风县| 如皋市| 上蔡县|