欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法及裝置的制造方法

文檔序號(hào):10725107閱讀:518來(lái)源:國(guó)知局
一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法及裝置的制造方法
【專(zhuān)利摘要】本發(fā)明實(shí)施例公開(kāi)了一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法及裝置。該方法包括:獲取用戶輸入的查詢文本以及用戶個(gè)性化信息,其中所述用戶個(gè)性化信息是依據(jù)所述用戶的歷史搜索行為,或者所述用戶持有的智能終端的屬性信息確定的;對(duì)所述查詢文本、搜索條目以及所述用戶個(gè)性化信息進(jìn)行深度神經(jīng)網(wǎng)絡(luò)處理,并依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所述搜索條目之間的相似度。本發(fā)明實(shí)施例的技術(shù)方案,通過(guò)在深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中,融合了用戶個(gè)性化信息,提升了傳統(tǒng)語(yǔ)義相似度確定的模型效果,從而提高了查詢文本與搜索條目之間相似度的準(zhǔn)確性。
【專(zhuān)利說(shuō)明】
一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法及裝置
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及通信技術(shù)領(lǐng)域,尤其涉及一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定 方法及裝置一種圖像分割方法及裝置。
【背景技術(shù)】
[0002] 針對(duì)用戶輸入的查詢文本,為用戶返回搜索結(jié)果是搜索引擎系統(tǒng)的基礎(chǔ)。其中確 定用戶輸入的查詢文本與查詢文本對(duì)應(yīng)的搜索條目之間的相似度,是為用戶返回搜索結(jié)果 的前提。
[0003] 目前,基于深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)的相似度確定方法,僅對(duì)用 戶輸入的查詢文本以及查詢文本對(duì)應(yīng)的搜索條目進(jìn)行DNN處理,并基于DNN處理結(jié)果得到相 似度,而未考慮自然語(yǔ)言文本的一詞多義或一義多詞現(xiàn)象,因而現(xiàn)有相似度確定的準(zhǔn)確性 低,不能滿足用戶的個(gè)性化需求,在實(shí)際應(yīng)用中往往不能達(dá)到令人滿意的效果。

【發(fā)明內(nèi)容】

[0004] 有鑒于此,本發(fā)明實(shí)施例提供一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法及 裝置,以提高相似度確定的準(zhǔn)確性,從而滿足用戶的個(gè)性化需求。
[0005] 第一方面,本發(fā)明實(shí)施例提供了一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方 法,包括:
[0006] 獲取用戶輸入的查詢文本以及用戶個(gè)性化信息,其中所述用戶個(gè)性化信息是依據(jù) 所述用戶的歷史搜索行為,或者所述用戶持有的智能終端的屬性信息確定的;
[0007] 對(duì)所述查詢文本、搜索條目以及所述用戶個(gè)性化信息進(jìn)行深度神經(jīng)網(wǎng)絡(luò)處理,并 依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所述搜索條目之間的相似度。
[0008] 第二方面,本發(fā)明實(shí)施例提供了一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定裝置 方,包括:
[0009] 查詢文本獲取模塊,用于獲取用戶輸入的查詢文本以及用戶個(gè)性化信息,其中所 述用戶個(gè)性化信息是依據(jù)所述用戶的歷史搜索行為,或者所述用戶持有的智能終端的屬性 信息確定的;
[0010] 相似度確定模塊,用于對(duì)所述查詢文本、搜索條目以及所述用戶個(gè)性化信息進(jìn)行 深度神經(jīng)網(wǎng)絡(luò)處理,并依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所述搜索條目之間 的相似度。
[0011] 本發(fā)明實(shí)施例提供的技術(shù)方案,通過(guò)在深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中,融合了用戶個(gè)性化 信息,從而依據(jù)用戶輸入的查詢文本、查詢文本對(duì)應(yīng)的搜索條目以及用戶個(gè)性化信息得到 了個(gè)性化的神經(jīng)網(wǎng)絡(luò),提升了傳統(tǒng)語(yǔ)義相似度確定的模型效果,從而提高了查詢文本與搜 索條目之間相似度的準(zhǔn)確性。
【附圖說(shuō)明】
[0012] 圖1是本發(fā)明實(shí)施例一提供的一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法的 流程圖;
[0013] 圖2a是本發(fā)明實(shí)施例二提供的一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法 的流程圖;
[0014] 圖2b是本發(fā)明實(shí)施例二提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法的原 理示意圖;
[0015] 圖3a是本發(fā)明實(shí)施例三提供的一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法 的流程圖;
[0016] 圖3b是本發(fā)明實(shí)施例三提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法的原 理示意圖;
[0017] 圖4a是本發(fā)明實(shí)施例四提供的一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法 的流程圖;
[0018] 圖4b是本發(fā)明實(shí)施例四提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法的原 理示意圖;
[0019] 圖5是本發(fā)明實(shí)施例五提供的一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定裝置的 結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0020] 下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步的詳細(xì)說(shuō)明。可以理解的是,此處所描 述的具體實(shí)施例僅僅用于解釋本發(fā)明,而非對(duì)本發(fā)明的限定。另外還需要說(shuō)明的是,為了便 于描述,附圖中僅示出了與本發(fā)明相關(guān)的部分而非全部結(jié)構(gòu)。
[0021] 實(shí)施例一
[0022] 圖1是本發(fā)明實(shí)施例一提供的一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法的 流程圖。本實(shí)施例的方法可以由基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定裝置來(lái)執(zhí)行,該裝 置可通過(guò)硬件和/或軟件的方式實(shí)現(xiàn),且本實(shí)施例的方法一般可適用于用戶想要得到查詢 文本與搜索條目之間相似度的情形。參見(jiàn)圖1,本實(shí)施例提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的 相似度確定方法具體可以包括如下:
[0023] S11、獲取用戶輸入的查詢文本以及用戶個(gè)性化信息。
[0024] 具體的,在檢測(cè)到用戶通過(guò)觸摸屏或鍵盤(pán)等輸入設(shè)備在搜索輸入框中進(jìn)行文本輸 入時(shí),獲取用戶輸入的查詢文本以及用戶個(gè)性化信息。其中,用戶個(gè)性化信息可以是依據(jù)所 述用戶的歷史搜索行為確定的。相應(yīng)地,還可以獲取用戶登錄搜索引擎所使用的用戶標(biāo)識(shí) 信息如用戶身份標(biāo)識(shí)號(hào)(Identificati 〇n,ID)等,并且依據(jù)用戶標(biāo)識(shí)信息獲取用戶個(gè)性化 信息。用戶的歷史搜索行為可以包括用戶的歷史查詢文本以及用戶從歷史查詢文本對(duì)應(yīng)的 搜索條目中選擇的歷史搜索條目。其中,用戶個(gè)性化信息也可以是依據(jù)所述用戶持有的智 能終端的屬性信息確定。
[0025] 示例性的,用戶個(gè)性化信息可以包括用戶的興趣,用戶所在地域,或者,用戶持有 的智能終端的型號(hào)、品牌、操作系統(tǒng)或?yàn)g覽器等。其中,用戶的興趣可以包括體育、文學(xué)、IT、 游戲、電子、水果、食物或農(nóng)產(chǎn)品等,是依據(jù)用戶的歷史搜索行為得到的。用戶所在地域也可 以依據(jù)用戶歷史搜索行為得到。
[0026] S12、對(duì)所述查詢文本、搜索條目以及所述用戶個(gè)性化信息進(jìn)行深度神經(jīng)網(wǎng)絡(luò)處 理,并依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所述搜索條目之間的相似度。
[0027] 其中,深度神經(jīng)網(wǎng)絡(luò)技術(shù)用于學(xué)習(xí)詞的向量表示,即通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理將詞 表示成實(shí)數(shù)組成的向量。具體的,利用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)技術(shù),依據(jù)用戶個(gè)性化信息對(duì)用戶 個(gè)體進(jìn)行建模,得到每個(gè)用戶對(duì)應(yīng)的個(gè)性化的用戶嵌入,并把用戶嵌入引入到傳統(tǒng)深度神 經(jīng)網(wǎng)絡(luò)語(yǔ)義模型中,并且基于包含用戶嵌入的深度神經(jīng)網(wǎng)絡(luò)語(yǔ)義模型,確定查詢文本與搜 索條目之間的相似度,如余弦相似度。由于包含用戶嵌入的深度神經(jīng)網(wǎng)絡(luò)語(yǔ)義模型既保持 了傳統(tǒng)的查詢文本與搜索條目之間的語(yǔ)義相似度,又具有個(gè)性化的用戶嵌入,以最大程度 地滿足用戶的個(gè)性化需求,提高了查詢文本與搜索條目之間相似度的準(zhǔn)確性。
[0028] 需要說(shuō)明的是,搜索條目指的是查詢文本對(duì)應(yīng)的搜索條目,且本實(shí)施例中對(duì)搜索 條目個(gè)數(shù)不作具體限定。例如,查詢文本是蘋(píng)果時(shí),搜索條目可以是農(nóng)產(chǎn)品價(jià)格和手機(jī)零配 件等。
[0029] 本實(shí)施例提供的技術(shù)方案,通過(guò)在深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中,融合了用戶個(gè)性化信息, 從而依據(jù)用戶輸入的查詢文本、查詢文本對(duì)應(yīng)的搜索條目以及用戶個(gè)性化信息得到了個(gè)性 化的神經(jīng)網(wǎng)絡(luò),提升了傳統(tǒng)語(yǔ)義相似度確定的模型效果,從而提高了查詢文本與搜索條目 之間相似度的準(zhǔn)確性。
[0030] 示例性的,依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所述搜索條目之間的 相似度之后,可以包括:根據(jù)所述查詢文本與所述搜索條目之間的相似度,對(duì)所述搜索條目 進(jìn)行排序。具體的,針對(duì)任一搜索條目,若該搜索條目與查詢文本的相似度越大,則該搜索 條目排序越在前。
[0031] 實(shí)施例二
[0032] 本實(shí)施例在上述實(shí)施例一的基礎(chǔ)上提供了一種新的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的 相似度確定方法。在本實(shí)施例中將用戶個(gè)性化信息視為查詢文本的一部分信息,在深度神 經(jīng)網(wǎng)絡(luò)模型頂層將用戶個(gè)性化信息的表示與查詢文本的表示進(jìn)行融合。
[0033]圖2a是本發(fā)明實(shí)施例二提供的一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法 的流程圖,圖2b是本發(fā)明實(shí)施例二提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法的原 理示意圖。為了便于理解,本實(shí)施例中以查詢文本是蘋(píng)果,搜索條目是農(nóng)產(chǎn)品價(jià)格為例進(jìn)行 說(shuō)明。結(jié)合圖2a和圖2b,本實(shí)施例提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法具體 可以包括如下:
[0034] S21、獲取用戶輸入的查詢文本以及用戶個(gè)性化信息。
[0035] 其中,所述用戶個(gè)性化信息是依據(jù)所述用戶的歷史搜索行為,或者所述用戶持有 的智能終端的屬性信息確定的。具體的,獲取用戶在搜索輸入框中輸入的查詢文本-蘋(píng)果。 [0036] S22、通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢向量,將搜索條目表示 成搜索向量,并將所述用戶個(gè)性化信息表示成用戶嵌入向量。
[0037] 具體的,通過(guò)詞嵌入(Word Embedding)處理將查詢文本表示成查詢中間向量,并 經(jīng)過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將查詢中間向量表示成查詢向量。相應(yīng)地,獲取查詢文本對(duì)應(yīng)的搜 索條目-農(nóng)產(chǎn)品價(jià)格,通過(guò)詞嵌入處理將搜索條目表示成搜索中間向量,并經(jīng)過(guò)深度神經(jīng)網(wǎng) 絡(luò)處理,將搜索中間向量表示成查詢向量;獲取用戶個(gè)性化信息,通過(guò)詞嵌入處理將用戶個(gè) 性化信息處理成用戶中間向量,并經(jīng)過(guò)深度神經(jīng)網(wǎng)絡(luò)處理將用戶中間向量表示成用戶嵌入 向量。
[0038] S23、融合所述查詢向量與所述用戶嵌入向量,以得到新的查詢向量。
[0039] 具體的,可以確定查詢向量的權(quán)重值以及用戶嵌入向量的權(quán)重值,且二者權(quán)重值 之和等于1,并基于二者權(quán)重值對(duì)查詢向量與用戶嵌入向量進(jìn)行加權(quán)疊加,以得到新的查詢 向量。需要說(shuō)明的是,一般查詢向量的權(quán)重值大于或等于用戶嵌入向量的權(quán)重值,如二者權(quán) 重值可以均等于0.5。
[0040] S24、確定新的查詢向量與所述搜索向量之間的相似度。
[0041] 具體的,可以將新的查詢向量與搜索向量繪制到向量空間中,確定新的查詢向量 與搜索向量之間的夾角,并得到夾角對(duì)應(yīng)的余弦值,該余弦值用來(lái)表征向量的余弦相似度。 夾角越小,余弦值越接近于1,則新的查詢向量與搜索向量越相似。
[0042] 本實(shí)施例提供的技術(shù)方案,通過(guò)將用戶個(gè)性化信息視為查詢文本的一部分信息, 在深度神經(jīng)網(wǎng)絡(luò)模型頂層將用戶個(gè)性化信息的表示與查詢文本的表示進(jìn)行融合,得到新的 查詢向量,通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理將搜索條目表示成搜索向量,并將新的查詢向量與搜索 向量之間的相似度作為查詢文本與搜索條目之間的相似度。由于該方法在深度神經(jīng)網(wǎng)絡(luò)學(xué) 習(xí)中,融合了用戶個(gè)性化信息,提高了查詢文本與搜索條目之間相似度的準(zhǔn)確性。
[0043] 實(shí)施例三
[0044]本實(shí)施例在上述實(shí)施例一的基礎(chǔ)上提供了一種新的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的 相似度確定方法。在本實(shí)施例中增加了搜索條目的向量表示與用戶個(gè)性化信息的向量表示 之間的相似度確定。
[0045]圖3a是本發(fā)明實(shí)施例三提供的一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法 的流程圖,圖3b是本發(fā)明實(shí)施例三提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法的原 理示意圖。為了便于理解,本實(shí)施例中以查詢文本是蘋(píng)果,搜索條目是農(nóng)產(chǎn)品價(jià)格為例進(jìn)行 說(shuō)明。結(jié)合圖3a和圖3b,本實(shí)施例提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法具體 可以包括如下:
[0046] S31、獲取用戶輸入的查詢文本以及用戶個(gè)性化信息。
[0047] 其中,所述用戶個(gè)性化信息是依據(jù)所述用戶的歷史搜索行為,或者所述用戶持有 的智能終端的屬性信息確定的。
[0048] S32、通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢向量,將搜索條目表示 成搜索向量,并將所述用戶個(gè)性化信息表示成用戶嵌入向量。
[0049] 具體的,可以基于深度神經(jīng)網(wǎng)絡(luò)語(yǔ)義模型對(duì)查詢文本、搜索條目和用戶個(gè)性化信 息進(jìn)行處理,得到查詢向量、搜索向量和用戶嵌入向量。
[0050] S33、確定所述查詢向量與所述搜索向量之間的第一相似度。
[0051] 具體的,可以確定查詢向量與搜索向量之間的余弦相似度,作為第一相似度。
[0052] S34、確定所述用戶嵌入向量與所述搜索向量之間的第二相似度。
[0053] 具體的,可以確定用戶嵌入向量與搜索向量之間的余弦相似度,作為第二相似度。
[0054] S35、依據(jù)所述第一相似度和所述第二相似度,確定所述查詢文本與所述搜索條目 之間的相似度。
[0055] 具體的,可以確定第一相似度的權(quán)重值以及第二相似度的權(quán)重值,且二者權(quán)重值 之和等于1,并基于二者權(quán)重值對(duì)第一相似度與第二相似度進(jìn)行加權(quán)疊加,將疊加結(jié)果作為 查詢文本與搜索條目之間的相似度。需要說(shuō)明的是,一般第一相似度的權(quán)重值大于或等于 第二相似度的權(quán)重值,如第一相似度的權(quán)重值為0.7,第二相似度的權(quán)重值為0.3。
[0056]本實(shí)施例提供的技術(shù)方案,通過(guò)增加搜索條目的向量表示與用戶個(gè)性化信息的向 量表示之間的相似度確定,以得到第二相似度,并確定查詢向量與搜索向量之間的第一相 似度,且依據(jù)第二相似度和第一相似度得到查詢文本與搜索條目之間的相似度。由于該方 法在深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中,融合了用戶個(gè)性化信息,提高了查詢文本與搜索條目之間相似 度的準(zhǔn)確性。
[0057]實(shí)施例四
[0058] 本實(shí)施例在上述實(shí)施例一的基礎(chǔ)上提供了一種新的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的 相似度確定方法。在本實(shí)施例中將用戶個(gè)性化信息當(dāng)作查詢文本的一部分,在深度神經(jīng)網(wǎng) 絡(luò)模型底層將用戶個(gè)性化信息與查詢文本進(jìn)行融合,相當(dāng)于在查詢文本中增加了用戶個(gè)性 化信息。
[0059] 圖4a是本發(fā)明實(shí)施例四提供的一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法 的流程圖,圖4b是本發(fā)明實(shí)施例四提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法的原 理示意圖。為了便于理解,本實(shí)施例中以查詢文本是蘋(píng)果,搜索條目是農(nóng)產(chǎn)品價(jià)格為例進(jìn)行 說(shuō)明。結(jié)合圖4a和圖4b,本實(shí)施例提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法具體 可以包括如下:
[0060] S41、獲取用戶輸入的查詢文本以及用戶個(gè)性化信息。
[0061]其中,所述用戶個(gè)性化信息是依據(jù)所述用戶的歷史搜索行為,或者所述用戶持有 的智能終端的屬性信息確定的。
[0062] S42、通過(guò)詞嵌入處理,將所述查詢文本表示成查詢中間向量,并將所述用戶個(gè)性 化信息表示成用戶中間向量。
[0063] S43、融合所述查詢中間向量與所述用戶中間向量,以得到用戶新增向量。
[0064] 示例性的,融合所述查詢中間向量與所述用戶中間向量,以得到用戶新增向量,可 以包括:通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢向量,并將所述用戶個(gè)性化信 息表示成用戶嵌入向量;確定所述查詢向量與所述搜索向量之間的第三相似度,并確定所 述用戶嵌入向量與所述搜索向量之間的第四相似度;對(duì)所述第三相似度與所述第四相似度 作歸一化處理,得到所述查詢中間向量的第一權(quán)重和所述用戶中間向量的第二權(quán)重;依據(jù) 所述第一權(quán)重和所述第二權(quán)重,融合所述查詢中間向量與所述用戶中間向量,以得到用戶 新增向量。
[0065]需要說(shuō)明的是,也可以依據(jù)用戶需要,設(shè)置查詢向量的第一權(quán)重和用戶中間向量 的第二權(quán)重。
[0066] S44、通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述用戶新增向量表示成新的查詢向量,并將搜 索條目表示成搜索向量。
[0067] 需要說(shuō)明的是,本實(shí)施例中對(duì)深度神經(jīng)網(wǎng)絡(luò)處理算法不作具體限定,只需基于深 度神經(jīng)網(wǎng)絡(luò)語(yǔ)義模型,將用戶新增向量表示成新的查詢向量,并將搜索條目表示成搜索向 量即可。
[0068] S45、依據(jù)所述新的查詢向量與所述搜索向量,確定所述查詢文本與所述搜索條目 之間的相似度。
[0069] 本實(shí)施例提供的技術(shù)方案,通過(guò)將用戶個(gè)性化信息當(dāng)作查詢文本的一部分,在深 度神經(jīng)網(wǎng)絡(luò)模型底層將用戶個(gè)性化信息與查詢文本進(jìn)行融合,即通過(guò)在查詢文本中增加用 戶個(gè)性化信息,提高了查詢文本與搜索條目之間相似度的準(zhǔn)確性。
[0070] 實(shí)施例五
[0071] 圖5是本發(fā)明實(shí)施例五提供的一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定裝置的 結(jié)構(gòu)圖。該裝置一般可適用于用戶想要得到查詢文本與搜索條目之間相似度的情形。參見(jiàn) 圖5,本實(shí)施例提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定裝置的具體結(jié)構(gòu)如下:
[0072] 查詢文本獲取模塊51,用于獲取用戶輸入的查詢文本以及用戶個(gè)性化信息,其中 所述用戶個(gè)性化信息是依據(jù)所述用戶的歷史搜索行為,或者所述用戶持有的智能終端的屬 性信息確定的;
[0073] 相似度確定模塊52,用于對(duì)所述查詢文本、搜索條目以及所述用戶個(gè)性化信息進(jìn) 行深度神經(jīng)網(wǎng)絡(luò)處理,并依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所述搜索條目之 間的相似度。
[0074] 示例性的,相似度確定模塊52可以包括:
[0075] 第一處理單元,用于通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢向量,將 搜索條目表示成搜索向量,并將所述用戶個(gè)性化信息表示成用戶嵌入向量;
[0076] 第一向量融合單元,用于融合所述查詢向量與所述用戶嵌入向量,以得到新的查 詢向量;
[0077] 第一相似度確定單元,用于確定新的查詢向量與所述搜索向量之間的相似度。
[0078] 示例性的,相似度確定模塊52可以包括:
[0079] 第二處理單元,用于通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢向量,將 搜索條目表示成搜索向量,并將所述用戶個(gè)性化信息表示成用戶嵌入向量;
[0080] 第一向量確定單元,用于確定所述查詢向量與所述搜索向量之間的第一相似度;
[0081] 第二向量確定單元,用于確定所述用戶嵌入向量與所述搜索向量之間的第二相似 度;
[0082] 第二相似度確定單元,用于依據(jù)所述第一相似度和所述第二相似度,確定所述查 詢文本與所述搜索條目之間的相似度。
[0083] 示例性的,相似度確定模塊52可以包括:
[0084]詞嵌入處理單元,用于通過(guò)詞嵌入處理,將所述查詢文本表示成查詢中間向量,并 將所述用戶個(gè)性化信息表示成用戶中間向量;
[0085]第二向量融合單元,用于融合所述查詢中間向量與所述用戶中間向量,以得到用 戶新增向量;
[0086] 第三處理單元,用于通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述用戶新增向量表示成新的查 詢向量,并將搜索條目表示成搜索向量;
[0087] 第三相似度確定單元,用于依據(jù)所述新的查詢向量與所述搜索向量,確定所述查 詢文本與所述搜索條目之間的相似度。
[0088] 示例性,第二向量融合單元可以包括:
[0089] 神經(jīng)網(wǎng)絡(luò)處理子單元,用于通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢 向量,并將所述用戶個(gè)性化信息表示成用戶嵌入向量;
[0090] 向量確定子單元,用于確定所述查詢向量與所述搜索向量之間的第三相似度,并 確定所述用戶嵌入向量與所述搜索向量之間的第四相似度;
[0091] 權(quán)重確定子單元,用于對(duì)所述第三相似度與所述第四相似度作歸一化處理,得到 所述查詢中間向量的第一權(quán)重和所述用戶中間向量的第二權(quán)重;
[0092] 向量確定子單元,用于依據(jù)所述第一權(quán)重和所述第二權(quán)重,融合所述查詢中間向 量與所述用戶中間向量,以得到用戶新增向量。
[0093] 示例性的,用戶個(gè)性化信息包括用戶的興趣,用戶所在地域,或者,用戶持有的智 能終端的型號(hào)、品牌、操作系統(tǒng)或?yàn)g覽器。
[0094]示例性的,上述裝置可以包括:
[0095] 搜索條目排序模塊,用于在依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所述 搜索條目之間的相似度之后,根據(jù)所述查詢文本與所述搜索條目之間的相似度,對(duì)所述搜 索條目進(jìn)行排序。
[0096] 另外,為了驗(yàn)證本實(shí)施例中提供的深度神經(jīng)網(wǎng)絡(luò)模型的有效性,針對(duì)不同指標(biāo)進(jìn) 行了如下多組對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)效果均超過(guò)了非個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的最佳結(jié)果。
[0097] 實(shí)驗(yàn)?zāi)康模候?yàn)證個(gè)性化神經(jīng)網(wǎng)絡(luò)在真實(shí)的網(wǎng)頁(yè)搜索環(huán)境下判斷文本相似度的效 果。
[0098]訓(xùn)練數(shù)據(jù):來(lái)自于某搜索引擎的日志語(yǔ)料(2015年8月-2015年10月)的訓(xùn)練集。
[0099]測(cè)試數(shù)據(jù):來(lái)自于某搜索引擎的日志語(yǔ)料(2015年11月)的測(cè)試集。
[0100] 評(píng)估方法:評(píng)估測(cè)試數(shù)據(jù)的正逆序比和AUC(Area Under roc Curve,R0C曲線下的 面積)指標(biāo)。
[0101]實(shí)驗(yàn)設(shè)置:分別采用方案一:在深度神經(jīng)網(wǎng)絡(luò)模型頂層將用戶個(gè)性化信息的表示 與查詢文本的表示進(jìn)行融合,方案二:增加搜索條目的向量表示與用戶個(gè)性化信息的向量 表示之間的相似度確定,方案三:在深度神經(jīng)網(wǎng)絡(luò)模型底層將用戶個(gè)性化信息與查詢文本 進(jìn)行融合,以及非個(gè)性化模型(不考慮用戶個(gè)性化信息),在訓(xùn)練數(shù)據(jù)上訓(xùn)練模型,并分別在 測(cè)試上測(cè)試正逆序比和AUC指標(biāo),最后和非個(gè)性化的傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比,結(jié)果如 下:
[0103]相對(duì)于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型,三種個(gè)性化神經(jīng)網(wǎng)絡(luò)方案均取得了優(yōu)異的效果提 升,并且方案三中將用戶個(gè)性化信息作為附加詞添加到查詢文本中的方案效果最佳,在非 個(gè)性化模型的基礎(chǔ)上正逆序提高了〇. 377 (搜索排序中一般正逆序比提高0.2即為效果提升 明顯),AUC指標(biāo)提尚3.6%。綜上,本發(fā)明實(shí)施例中提供的基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)確定查 詢文本與搜索條目相似度的方法可以顯著提高傳統(tǒng)語(yǔ)義相似度確定的效果。
[0104]本實(shí)施例提供的技術(shù)方案,相對(duì)于傳統(tǒng)的個(gè)性化策略,采用了深度學(xué)習(xí)技術(shù),避免 了較為繁瑣的特征工程,減少了人力成本,并且不需要維護(hù)成本較高的用戶輪廓 (profile),因而減少了成本以及資源消耗。
[0105]注意,上述僅為本發(fā)明的較佳實(shí)施例及所運(yùn)用技術(shù)原理。本領(lǐng)域技術(shù)人員會(huì)理解, 本發(fā)明不限于這里所述的特定實(shí)施例,對(duì)本領(lǐng)域技術(shù)人員來(lái)說(shuō)能夠進(jìn)行各種明顯的變化、 重新調(diào)整和替代而不會(huì)脫離本發(fā)明的保護(hù)范圍。因此,雖然通過(guò)以上實(shí)施例對(duì)本發(fā)明進(jìn)行 了較為詳細(xì)的說(shuō)明,但是本發(fā)明不僅僅限于以上實(shí)施例,在不脫離本發(fā)明構(gòu)思的情況下,還 可以包括更多其他等效實(shí)施例,而本發(fā)明的范圍由所附的權(quán)利要求范圍決定。
【主權(quán)項(xiàng)】
1. 一種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定方法,包括: 獲取用戶輸入的查詢文本以及用戶個(gè)性化信息,其中所述用戶個(gè)性化信息是依據(jù)所述 用戶的歷史搜索行為,或者所述用戶持有的智能終端的屬性信息確定的; 對(duì)所述查詢文本、搜索條目以及所述用戶個(gè)性化信息進(jìn)行深度神經(jīng)網(wǎng)絡(luò)處理,并依據(jù) 深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所述搜索條目之間的相似度。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)所述查詢文本、搜索條目以及所述用戶 個(gè)性化信息進(jìn)行深度神經(jīng)網(wǎng)絡(luò)處理,并依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所 述搜索條目之間的相似度,包括: 通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢向量,將搜索條目表示成搜索向 量,并將所述用戶個(gè)性化信息表示成用戶嵌入向量; 融合所述查詢向量與所述用戶嵌入向量,以得到新的查詢向量; 確定新的查詢向量與所述搜索向量之間的相似度。3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)所述查詢文本、搜索條目以及所述用戶 個(gè)性化信息進(jìn)行深度神經(jīng)網(wǎng)絡(luò)處理,并依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所 述搜索條目之間的相似度,包括: 通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢向量,將搜索條目表示成搜索向 量,并將所述用戶個(gè)性化信息表示成用戶嵌入向量; 確定所述查詢向量與所述搜索向量之間的第一相似度; 確定所述用戶嵌入向量與所述搜索向量之間的第二相似度; 依據(jù)所述第一相似度和所述第二相似度,確定所述查詢文本與所述搜索條目之間的相 似度。4. 根據(jù)權(quán)利要求1所述的方法,其特征在于,對(duì)所述查詢文本、搜索條目以及所述用戶 個(gè)性化信息進(jìn)行深度神經(jīng)網(wǎng)絡(luò)處理,并依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所 述搜索條目之間的相似度,包括: 通過(guò)詞嵌入處理,將所述查詢文本表示成查詢中間向量,并將所述用戶個(gè)性化信息表 示成用戶中間向量; 融合所述查詢中間向量與所述用戶中間向量,以得到用戶新增向量; 通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述用戶新增向量表示成新的查詢向量,并將搜索條目表 示成搜索向量; 依據(jù)所述新的查詢向量與所述搜索向量,確定所述查詢文本與所述搜索條目之間的相 似度。5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,融合所述查詢中間向量與所述用戶中間向 量,以得到用戶新增向量,包括: 通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢向量,并將所述用戶個(gè)性化信息 表示成用戶嵌入向量; 確定所述查詢向量與所述搜索向量之間的第三相似度,并確定所述用戶嵌入向量與所 述搜索向量之間的第四相似度; 對(duì)所述第三相似度與所述第四相似度作歸一化處理,得到所述查詢中間向量的第一權(quán) 重和所述用戶中間向量的第二權(quán)重; 依據(jù)所述第一權(quán)重和所述第二權(quán)重,融合所述查詢中間向量與所述用戶中間向量,以 得到用戶新增向量。6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,用戶個(gè)性化信息包括用戶的興趣,用戶所 在地域,或者,用戶持有的智能終端的型號(hào)、品牌、操作系統(tǒng)或?yàn)g覽器。7. 根據(jù)權(quán)利要求1所述的方法,其特征在于,依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢 文本與所述搜索條目之間的相似度之后,包括: 根據(jù)所述查詢文本與所述搜索條目之間的相似度,對(duì)所述搜索條目進(jìn)行排序。8. -種基于個(gè)性化深度神經(jīng)網(wǎng)絡(luò)的相似度確定裝置,包括: 查詢文本獲取模塊,用于獲取用戶輸入的查詢文本以及用戶個(gè)性化信息,其中所述用 戶個(gè)性化信息是依據(jù)所述用戶的歷史搜索行為,或者所述用戶持有的智能終端的屬性信息 確定的;相似度確定模塊,用于對(duì)所述查詢文本、搜索條目以及所述用戶個(gè)性化信息進(jìn)行深 度神經(jīng)網(wǎng)絡(luò)處理,并依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所述搜索條目之間的 相似度。9. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,相似度確定模塊包括: 第一處理單元,用于通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢向量,將搜索 條目表示成搜索向量,并將所述用戶個(gè)性化信息表示成用戶嵌入向量; 第一向量融合單元,用于融合所述查詢向量與所述用戶嵌入向量,以得到新的查詢向 量; 第一相似度確定單元,用于確定新的查詢向量與所述搜索向量之間的相似度。10. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,相似度確定模塊包括: 第二處理單元,用于通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢向量,將搜索 條目表示成搜索向量,并將所述用戶個(gè)性化信息表示成用戶嵌入向量; 第一向量確定單元,用于確定所述查詢向量與所述搜索向量之間的第一相似度; 第二向量確定單元,用于確定所述用戶嵌入向量與所述搜索向量之間的第二相似度; 第二相似度確定單元,用于依據(jù)所述第一相似度和所述第二相似度,確定所述查詢文 本與所述搜索條目之間的相似度。11. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,相似度確定模塊包括: 詞嵌入處理單元,用于通過(guò)詞嵌入處理,將所述查詢文本表示成查詢中間向量,并將所 述用戶個(gè)性化信息表示成用戶中間向量; 第二向量融合單元,用于融合所述查詢中間向量與所述用戶中間向量,以得到用戶新 增向量; 第三處理單元,用于通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述用戶新增向量表示成新的查詢向 量,并將搜索條目表示成搜索向量; 第三相似度確定單元,用于依據(jù)所述新的查詢向量與所述搜索向量,確定所述查詢文 本與所述搜索條目之間的相似度。12. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,第二向量融合單元包括: 神經(jīng)網(wǎng)絡(luò)處理子單元,用于通過(guò)深度神經(jīng)網(wǎng)絡(luò)處理,將所述查詢文本表示成查詢向量, 并將所述用戶個(gè)性化信息表示成用戶嵌入向量; 向量確定子單元,用于確定所述查詢向量與所述搜索向量之間的第三相似度,并確定 所述用戶嵌入向量與所述搜索向量之間的第四相似度; 權(quán)重確定子單元,用于對(duì)所述第三相似度與所述第四相似度作歸一化處理,得到所述 查詢中間向量的第一權(quán)重和所述用戶中間向量的第二權(quán)重; 向量確定子單元,用于依據(jù)所述第一權(quán)重和所述第二權(quán)重,融合所述查詢中間向量與 所述用戶中間向量,以得到用戶新增向量。13. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,用戶個(gè)性化信息包括用戶的興趣,用戶所 在地域,或者,用戶持有的智能終端的型號(hào)、品牌、操作系統(tǒng)或?yàn)g覽器。14. 根據(jù)權(quán)利要求8所述的裝置,其特征在于,包括: 搜索條目排序模塊,用于在依據(jù)深度神經(jīng)網(wǎng)絡(luò)處理結(jié)果確定所述查詢文本與所述搜索 條目之間的相似度之后,根據(jù)所述查詢文本與所述搜索條目之間的相似度,對(duì)所述搜索條 目進(jìn)行排序。
【文檔編號(hào)】G06K9/62GK106095983SQ201610445828
【公開(kāi)日】2016年11月9日
【申請(qǐng)日】2016年6月20日
【發(fā)明人】廖夢(mèng), 姜迪, 石磊, 李辰, 王昕煜
【申請(qǐng)人】北京百度網(wǎng)訊科技有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
江北区| 翁源县| 三穗县| 鹤壁市| 朝阳区| 大方县| 明溪县| 阆中市| 新龙县| 谷城县| 阜南县| 富源县| 顺平县| 乐至县| 富蕴县| 闽侯县| 泸溪县| 剑阁县| 镇原县| 凉山| 江华| 托克托县| 龙州县| 昭通市| 江门市| 延长县| 张家口市| 漳州市| 乐东| 无锡市| 尤溪县| 库尔勒市| 郴州市| 承德市| 吕梁市| 泰宁县| 库尔勒市| 九寨沟县| 独山县| 平度市| 苗栗市|