欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種語(yǔ)音對(duì)話的多場(chǎng)景管理方法及裝置制造方法

文檔序號(hào):2827989閱讀:453來(lái)源:國(guó)知局
一種語(yǔ)音對(duì)話的多場(chǎng)景管理方法及裝置制造方法
【專利摘要】本發(fā)明提供了一種語(yǔ)音對(duì)話的多場(chǎng)景管理方法及裝置,該方法包括:從文本信息中獲取用戶輸入的需求信息,其中,所述文本信息從所述用戶的語(yǔ)音信息中進(jìn)行文本識(shí)別得到;根據(jù)所述需求信息獲取場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景各自對(duì)應(yīng)的至少一個(gè)評(píng)分值;根據(jù)所述至少一個(gè)評(píng)分值確定欲執(zhí)行的場(chǎng)景切換動(dòng)作,并展示與切換后的場(chǎng)景相對(duì)應(yīng)的語(yǔ)音內(nèi)容。本發(fā)明實(shí)施例能夠很好地解決用戶與對(duì)話系統(tǒng)中在語(yǔ)音對(duì)話過(guò)程中的多場(chǎng)景切換問(wèn)題。
【專利說(shuō)明】一種語(yǔ)音對(duì)話的多場(chǎng)景管理方法及裝置

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語(yǔ)音識(shí)別【技術(shù)領(lǐng)域】,尤其涉及一種語(yǔ)音對(duì)話的多場(chǎng)景管理方法及裝 置。

【背景技術(shù)】
[0002] 隨著語(yǔ)音識(shí)別技術(shù)和移動(dòng)互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,語(yǔ)音輸入在移動(dòng)端的優(yōu)勢(shì)表現(xiàn) 得越發(fā)明顯。隨著各大互聯(lián)網(wǎng)公司分別發(fā)布語(yǔ)音對(duì)話系統(tǒng),通過(guò)自然而低成本的語(yǔ)音輸入, 從而理解用戶的需求并為用戶解決問(wèn)題。
[0003] 在語(yǔ)音識(shí)別過(guò)程中,可能存在多場(chǎng)景多領(lǐng)域的對(duì)話,并需要解決在多領(lǐng)域多輪對(duì) 話的過(guò)程中的決策問(wèn)題。現(xiàn)有技術(shù)中的多場(chǎng)景管理,一是基于規(guī)則(rule-based),通過(guò)制定 一系列的規(guī)則來(lái)實(shí)現(xiàn)場(chǎng)景之間切換的管理;一是基于分類模型,通過(guò)當(dāng)前系統(tǒng)狀態(tài)使用分 類模型預(yù)測(cè)接下來(lái)執(zhí)行動(dòng)作。
[0004] 基于規(guī)則的方法,需要規(guī)則制定者有很好的背景知識(shí),隨著規(guī)則涉及的因素變多, 處理邏輯變得復(fù)雜,效果不能達(dá)到最優(yōu)狀態(tài);基于規(guī)則的多場(chǎng)景管理沒(méi)有結(jié)合用戶的反饋 信息,因此不了解用戶的真實(shí)使用情況,最終生成的決策動(dòng)作未必是最合理的。


【發(fā)明內(nèi)容】

[0005] 本發(fā)明實(shí)施例提供一種語(yǔ)音對(duì)話的多場(chǎng)景管理方法及裝置,實(shí)現(xiàn)有效地進(jìn)行多場(chǎng) 景切換管理。
[0006] 為達(dá)到上述目的,本發(fā)明的實(shí)施例采用如下技術(shù)方案:
[0007] 一種語(yǔ)音對(duì)話的多場(chǎng)景管理方法,該方法包括:
[0008] 從文本信息中獲取用戶輸入的需求信息,其中,所述文本信息從所述用戶的語(yǔ)音 ?目息中進(jìn)行文本識(shí)別得到;
[0009] 根據(jù)所述需求信息獲取場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景各自對(duì)應(yīng)的至少一個(gè)評(píng)分值;
[0010] 根據(jù)所述至少一個(gè)評(píng)分值確定欲執(zhí)行的場(chǎng)景切換動(dòng)作,并展示與切換后的場(chǎng)景相 對(duì)應(yīng)的語(yǔ)音內(nèi)容。
[0011] 一種語(yǔ)音對(duì)話的多場(chǎng)景管理裝置,該裝置包括:
[0012] 第一獲取模塊,用于從文本信息中獲取用戶輸入的需求信息,其中,所述文本信息 從所述用戶的語(yǔ)音信息中進(jìn)行文本識(shí)別得到;
[0013] 第二獲取模塊,用于根據(jù)所述需求信息獲取場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景各自對(duì)應(yīng)的至 少一個(gè)評(píng)分值;
[0014] 切換模塊,用于根據(jù)所述至少一個(gè)評(píng)分值確定欲執(zhí)行的場(chǎng)景切換動(dòng)作,并展示與 切換后的場(chǎng)景相對(duì)應(yīng)的語(yǔ)音內(nèi)容。
[0015] 本發(fā)明實(shí)施例提供的語(yǔ)音對(duì)話的多場(chǎng)景管理方法及裝置,通過(guò)從本文信息中獲取 用戶輸入的需求信息,根據(jù)用戶輸入的需求信息獲取場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景,從而為用于 提供欲執(zhí)行的且適用于用戶需求的語(yǔ)音內(nèi)容,能夠很好地解決用戶與對(duì)話系統(tǒng)中在語(yǔ)音對(duì) 話過(guò)程中的多場(chǎng)景切換問(wèn)題。

【專利附圖】

【附圖說(shuō)明】
[0016] 圖1為本發(fā)明實(shí)施例所適用的多場(chǎng)景管理的關(guān)系示意圖。
[0017] 圖2為本發(fā)明實(shí)施例一提供的語(yǔ)音對(duì)話的多場(chǎng)景管理方法的流程示意圖。
[0018] 圖3為本發(fā)明實(shí)施例二提供的語(yǔ)音對(duì)話的多場(chǎng)景管理方法的流程示意圖。
[0019] 圖4為本發(fā)明實(shí)施例二中場(chǎng)景切換動(dòng)作的示意圖。
[0020] 圖5為本發(fā)明實(shí)施例三提供的語(yǔ)音對(duì)話的多場(chǎng)景管理方法的流程示意圖。
[0021] 圖6為本發(fā)明實(shí)施例四提供的語(yǔ)音對(duì)話的多場(chǎng)景管理裝置的結(jié)構(gòu)示意圖。
[0022] 圖7為本發(fā)明實(shí)施例五提供的語(yǔ)音對(duì)話的多場(chǎng)景管理裝置的結(jié)構(gòu)示意圖。

【具體實(shí)施方式】
[0023] 下面結(jié)合附圖對(duì)本發(fā)明實(shí)施例提供的語(yǔ)音對(duì)話的多場(chǎng)景管理方法及裝置進(jìn)行詳 細(xì)描述。
[0024] 本發(fā)明實(shí)施例中所述的多輪對(duì)話,是指通過(guò)用戶與終端的多輪的交互幫助用戶完 成特定的需求或任務(wù)。在本發(fā)明實(shí)施例中,當(dāng)前的多輪對(duì)話按照領(lǐng)域(或者,場(chǎng)景)劃分, 可以為任務(wù)型的多輪對(duì)話。圖1為本發(fā)明實(shí)施例所適用的多場(chǎng)景管理的關(guān)系示意圖,如圖 1所示,在本發(fā)明實(shí)施例中,可以包括多個(gè)場(chǎng)景,例如,旅行場(chǎng)景、餐飲場(chǎng)景、天氣場(chǎng)景以及股 票場(chǎng)景,再例如,旅行場(chǎng)景可分為多個(gè)子場(chǎng)景:機(jī)票場(chǎng)景、火車票場(chǎng)景和酒店場(chǎng)景。
[0025] 具體地,本發(fā)明實(shí)施例以如下對(duì)話為例進(jìn)行示例性說(shuō)明:
[0026] 用戶:去青島的機(jī)票。
[0027] 移動(dòng)終端:好的,到青島的飛機(jī)票。請(qǐng)問(wèn)您什么時(shí)候離開(kāi)?
[0028] 用戶:明天出發(fā)。
[0029] 移動(dòng)終端:好的,明天到青島的飛機(jī)票。您預(yù)計(jì)由哪兒出發(fā)???
[0030] 用戶:北京。
[0031] 對(duì)話到此時(shí),移動(dòng)終端將機(jī)票的相關(guān)信息展示給用戶。
[0032] 用戶:青島有好吃的四川菜嗎?
[0033] (語(yǔ)音識(shí)別到了"有好吃的酸的川菜嗎? ")
[0034] 移動(dòng)終端:您要繼續(xù)訂機(jī)票么?
[0035] 用戶:不是。
[0036] 移動(dòng)終端:聽(tīng)到有好吃的酸的川菜嗎?
[0037] 用戶:明天去青島。
[0038] 對(duì)話到此時(shí),移動(dòng)終端將相應(yīng)的在青島的川菜館展示給用戶。
[0039] 用戶:青島機(jī)場(chǎng)附近的餐廳。
[0040] 移動(dòng)終端:為您找到以下餐廳(并進(jìn)行相應(yīng)的結(jié)果展示)
[0041] 用戶:青島明天會(huì)下雨嗎?
[0042] 移動(dòng)終端:青島明天陣雨,溫度16攝氏度至20攝氏度,東風(fēng)5-6級(jí)。
[0043] 實(shí)施例一:
[0044] 圖2為本發(fā)明實(shí)施例一提供的語(yǔ)音對(duì)話的多場(chǎng)景管理方法的流程示意圖,如圖1 所示,本發(fā)明實(shí)施例包括如下步驟:
[0045] 步驟101,從文本信息中獲取用戶輸入的需求信息,其中,文本信息從用戶的語(yǔ)音 信息中進(jìn)行文本識(shí)別得到。
[0046] 步驟102,根據(jù)需求信息獲取場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景,并獲取與至少一個(gè)場(chǎng)景分別 對(duì)應(yīng)的至少一個(gè)特征向量。
[0047] 步驟103,獲取至少一個(gè)特征向量與各自對(duì)應(yīng)的權(quán)重向量的內(nèi)積,得到至少一個(gè)內(nèi) 積。
[0048] 步驟104,根據(jù)至少一個(gè)內(nèi)積確定欲執(zhí)行場(chǎng)景切換動(dòng)作,并展示與切換后的場(chǎng)景相 對(duì)應(yīng)的語(yǔ)音內(nèi)容。
[0049] 在步驟101中,通過(guò)語(yǔ)音識(shí)別將用戶的語(yǔ)音信息識(shí)別轉(zhuǎn)換為文本信息,根據(jù)本發(fā) 明一實(shí)施例,從識(shí)別得到的文本信息中獲取用戶的需求信息,例如,用戶輸入語(yǔ)音"去青島 的機(jī)票",將該語(yǔ)音信息識(shí)別為文本信息后,獲取到用戶輸入的需求信息為"機(jī)票"。
[0050] 在步驟102中,根據(jù)步驟101中獲取的需求信息獲取場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景,在一 個(gè)實(shí)施例中,場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景可以根據(jù)語(yǔ)音對(duì)話的上下文信息中作出判斷。其中,場(chǎng) 景內(nèi)為在對(duì)話系統(tǒng)中預(yù)設(shè)的多個(gè)場(chǎng)景(例如,圖1中示出的旅行場(chǎng)景、餐飲場(chǎng)景、天氣場(chǎng)景 以及股票場(chǎng)景),具體地,在步驟101中獲取到用戶輸入的需求信息"機(jī)票",可根據(jù)該需求 信息獲取到場(chǎng)景內(nèi)的旅游場(chǎng)景(其中,旅游場(chǎng)景還可以包括機(jī)票場(chǎng)景、火車票場(chǎng)景和酒店 場(chǎng)景等多個(gè)子場(chǎng)景),進(jìn)一步地,該需求信息對(duì)應(yīng)了該旅游場(chǎng)景中的機(jī)票場(chǎng)景這一子場(chǎng)景。 在一個(gè)實(shí)施例中,可以從語(yǔ)音信息中獲取與該旅游場(chǎng)景對(duì)應(yīng)的至少一個(gè)特征向量,例如,在 語(yǔ)音信息"去青島的機(jī)票"中,"去、青島、機(jī)票"形成該語(yǔ)音信息的特征,對(duì)上述特征進(jìn)行量 化,即可形成特征向量,在該特征向量中,具體包括:目的地(青島)、機(jī)票(需求信息),此 夕卜,本發(fā)明實(shí)施例中的特征向量中還可以包含但不限于如下信息:出發(fā)地、日期、座位類型、 出發(fā)時(shí)間等信息。在一個(gè)實(shí)施例中,出發(fā)地、目的地和日期為必選信息,座位類型、出發(fā)時(shí)間 為可選信息;通過(guò)上述特征向量,可以使本發(fā)明實(shí)施例具有很好的泛化能力,避免了現(xiàn)有技 術(shù)中每增加一個(gè)新的場(chǎng)景就要對(duì)應(yīng)的標(biāo)注數(shù)據(jù),并重新訓(xùn)練場(chǎng)景所對(duì)應(yīng)的模型。
[0051] 在步驟103中,獲取在步驟102中獲取的至少一個(gè)特征向量及與其各自對(duì)應(yīng)的權(quán) 重向量的至少一個(gè)內(nèi)積(例如,獲得內(nèi)積為A 1, A2, A3,…,Αη,η為內(nèi)積的個(gè)數(shù)),其中,權(quán) 重向量是根據(jù)收集的語(yǔ)料訓(xùn)練得到的場(chǎng)景特征對(duì)應(yīng)的權(quán)重向量,本領(lǐng)域技術(shù)人員可以理解 的是,本發(fā)明實(shí)施例以評(píng)分值具體為內(nèi)積進(jìn)行示例性說(shuō)明,內(nèi)積的具體計(jì)算方式并不能形 成對(duì)本發(fā)明實(shí)施例的限制。
[0052] 在步驟104中,根據(jù)在步驟103中獲取的至少一個(gè)內(nèi)積確定欲執(zhí)行的場(chǎng)景切換動(dòng) 作,并展示與切換后的場(chǎng)景相對(duì)應(yīng)的語(yǔ)音內(nèi)容。根據(jù)本發(fā)明一實(shí)施例,在步驟104中,將至 少一個(gè)內(nèi)積進(jìn)行排序,得到至少一個(gè)內(nèi)積中的最大值,將該內(nèi)積對(duì)應(yīng)的場(chǎng)景切換動(dòng)作作為 對(duì)應(yīng)場(chǎng)景的決策動(dòng)作,并將其通過(guò)語(yǔ)音內(nèi)容的方式反饋給用戶。在一個(gè)實(shí)施例中,獲取到用 戶的需求信息"機(jī)票"對(duì)應(yīng)場(chǎng)景的特征向量,計(jì)算得到其內(nèi)積為A n A2、A3、A4,排序后得到內(nèi) 積中的最大值為Α2,則將八 2對(duì)應(yīng)的語(yǔ)音內(nèi)容(例如,其語(yǔ)音內(nèi)容為"好的,到青島的飛機(jī)票, 請(qǐng)問(wèn)您什么時(shí)候離開(kāi)")輸出給用戶。
[0053] 本發(fā)明實(shí)施例提供的語(yǔ)音對(duì)話的多場(chǎng)景管理方法,通過(guò)從本文信息中獲取用戶輸 入的需求信息,根據(jù)用戶輸入的需求信息獲取場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景,從而為用于提供欲 執(zhí)行的且適用于用戶需求的場(chǎng)景切換動(dòng)作,并展示與切換后的場(chǎng)景相對(duì)應(yīng)的語(yǔ)音內(nèi)容,能 夠很好地解決對(duì)話系統(tǒng)中語(yǔ)音對(duì)話的多場(chǎng)景切換的問(wèn)題。此外,通過(guò)特征向量表示場(chǎng)景使 對(duì)話系統(tǒng)具有很好的泛化能力,可以快速的增加新的場(chǎng)景到系統(tǒng)中,進(jìn)而有效地進(jìn)行多場(chǎng) 景切換管理,還能充分了解用戶的真實(shí)使用情況,為用戶提供最合理的動(dòng)作決策,增強(qiáng)了用 戶體驗(yàn)。
[0054] 實(shí)施例二:
[0055] 圖3為本發(fā)明實(shí)施例二提供的語(yǔ)音對(duì)話的多場(chǎng)景管理方法的流程示意圖,圖4為 本發(fā)明實(shí)施例二中場(chǎng)景切換動(dòng)作的示意圖;如圖3所示,本發(fā)明實(shí)施例包括如下步驟:
[0056] 步驟201,從文本信息中獲取用戶輸入的需求信息,其中,文本信息從用戶的語(yǔ)音 信息中進(jìn)行文本識(shí)別得到。
[0057] 步驟202,根據(jù)步驟201中識(shí)別得到的需求信息對(duì)語(yǔ)音對(duì)話進(jìn)行場(chǎng)景分類,得到需 求信息所適用的場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景。
[0058] 步驟203,根據(jù)步驟202中得到的至少一個(gè)場(chǎng)景對(duì)需求信息進(jìn)行場(chǎng)景特征抽取,得 到與至少一個(gè)場(chǎng)景分別對(duì)應(yīng)的至少一個(gè)特征向量。
[0059] 步驟204,獲取至少一個(gè)特征向量與各自對(duì)應(yīng)的權(quán)重向量的內(nèi)積,得到至少一個(gè)內(nèi) 積。
[0060] 步驟205,對(duì)至少一個(gè)內(nèi)積進(jìn)行排序,得到所有內(nèi)積中的最大值。
[0061] 步驟206,根據(jù)最大值對(duì)應(yīng)的場(chǎng)景特征對(duì)需求信息進(jìn)行場(chǎng)景切換動(dòng)作,并展示與切 換后的場(chǎng)景相對(duì)應(yīng)的語(yǔ)音回應(yīng)。
[0062] 在步驟201中,可以參考實(shí)施例一中的步驟101的描述,在此不再進(jìn)一步詳述。
[0063] 在步驟202中,根據(jù)在步驟201中得到的需求信息對(duì)語(yǔ)音對(duì)話進(jìn)行場(chǎng)景分類,得到 適用于場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景,例如,用戶輸入的需求信息為"青島"、"機(jī)票",可將該語(yǔ)音 對(duì)話分類到旅行場(chǎng)景的子場(chǎng)景機(jī)票場(chǎng)景中。分類得到多個(gè)場(chǎng)景后,在步驟203中,根據(jù)該場(chǎng) 景對(duì)需求信息進(jìn)行場(chǎng)景特征抽取,獲取到與其對(duì)應(yīng)的特征向量。
[0064] 在步驟203和步驟204中,可以參考實(shí)施例一中的步驟102和步驟103,在此不再 進(jìn)一步詳述。
[0065] 在步驟205中,對(duì)在步驟204中得到的至少一個(gè)內(nèi)積進(jìn)行排序,得到內(nèi)積中的最大 值,例如,獲取到用戶的需求信息"機(jī)票"對(duì)應(yīng)場(chǎng)景的特征向量,計(jì)算得到其內(nèi)積為A 1,A2,A3, 排序后得到內(nèi)積中的最大值為A2。
[0066] 在步驟206中,圖4為本發(fā)明實(shí)施例二中場(chǎng)景切換動(dòng)作的示意圖根據(jù)最大值對(duì)應(yīng) 的場(chǎng)景特征,響應(yīng)與需求信息相適應(yīng)的的語(yǔ)音信息,并將語(yǔ)音內(nèi)容反饋給用戶,例如,在步 驟205中提及的內(nèi)積中的最大值A(chǔ) 2對(duì)應(yīng)的語(yǔ)音內(nèi)容為"好的,到青島的飛機(jī)票,請(qǐng)問(wèn)您什么 時(shí)候離開(kāi)",在語(yǔ)音對(duì)話的過(guò)程中,則將這段語(yǔ)音內(nèi)容反饋給用戶。
[0067] 本領(lǐng)域技術(shù)人員可以理解的是,在實(shí)際的應(yīng)用過(guò)程中,對(duì)于場(chǎng)景的設(shè)置和學(xué)習(xí)不 可能是面面俱到的,也可能出現(xiàn)預(yù)設(shè)場(chǎng)景外的場(chǎng)景特征(場(chǎng)景外特征),根據(jù)本發(fā)明一實(shí)施 例,根據(jù)場(chǎng)景外特征與至少一個(gè)場(chǎng)景特征生成場(chǎng)景確認(rèn)動(dòng)作的特征向量,場(chǎng)景確認(rèn)動(dòng)作的 特征向量為至少一個(gè)特征向量中的一個(gè),進(jìn)一步地,如果步驟205中得到的最大值對(duì)應(yīng)場(chǎng) 景內(nèi)的一個(gè)場(chǎng)景特征,根據(jù)該場(chǎng)景特征對(duì)需求信息進(jìn)行回應(yīng);如果最大值對(duì)應(yīng)場(chǎng)景內(nèi)的兩 個(gè)以上的特征向量,根據(jù)兩個(gè)以上的特征向量對(duì)需求信息進(jìn)行澄清;如果最大值對(duì)應(yīng)場(chǎng)景 外特征與場(chǎng)景內(nèi)的場(chǎng)景特征,對(duì)場(chǎng)景外特征與場(chǎng)景內(nèi)的場(chǎng)景特征進(jìn)行確認(rèn)。
[0068] 在場(chǎng)景澄清過(guò)程中,可以通過(guò)獲取至少兩個(gè)以上的場(chǎng)景特征對(duì)應(yīng)的場(chǎng)景向量的差 值,獲取該差值的指數(shù)運(yùn)算,根據(jù)指數(shù)運(yùn)算結(jié)果確定對(duì)兩個(gè)場(chǎng)景澄清特征向量;例如,有兩 個(gè)場(chǎng)景的特征向量f_l和特征向量f_2,計(jì)算兩個(gè)場(chǎng)景特征的差值進(jìn)一步計(jì)算該 差值對(duì)應(yīng)的指數(shù)(f_l_f_2),其中,e表示自然常數(shù),當(dāng)然,還可以采用其它數(shù)值作為指數(shù) 運(yùn)算的底數(shù)。根據(jù)該指數(shù)的運(yùn)算結(jié)果確定對(duì)兩個(gè)場(chǎng)景進(jìn)行澄清的特征向量,具體地,將場(chǎng)景 澄清的特征向量和場(chǎng)景澄清的權(quán)重向量計(jì)算內(nèi)積,得到這兩個(gè)場(chǎng)景澄清的得分,當(dāng)該得分 值最大時(shí),對(duì)兩個(gè)場(chǎng)景進(jìn)行澄清。
[0069] 例如,在上述多輪語(yǔ)音對(duì)話過(guò)程中,當(dāng)移動(dòng)終端將用戶輸入的語(yǔ)音信息"青島有好 吃的四川菜嗎"識(shí)別為了"有好吃的酸的川菜嗎"時(shí),移動(dòng)終端根據(jù)該文本信息,此時(shí)通過(guò)本 發(fā)明實(shí)施例二,移動(dòng)終端可以結(jié)合上下文信息和解析信息,在執(zhí)行場(chǎng)景切換動(dòng)作時(shí),采用了 場(chǎng)景確認(rèn),并展示了場(chǎng)景確認(rèn)相對(duì)應(yīng)的語(yǔ)音回應(yīng)"您要繼續(xù)訂機(jī)票么",從而使用戶進(jìn)行場(chǎng) 景確認(rèn)。
[0070] 進(jìn)一步地,在用戶確認(rèn)"不是"后,移動(dòng)終端結(jié)合上下文信息和解析信息,在執(zhí)行場(chǎng) 景切換動(dòng)作時(shí),采用了場(chǎng)景澄清,并展示了場(chǎng)景澄清確認(rèn)相對(duì)應(yīng)的語(yǔ)音回應(yīng)"聽(tīng)到有好吃的 酸的川菜嗎",從而使用戶對(duì)場(chǎng)景進(jìn)行澄清。
[0071] 如圖5所示,為本發(fā)明實(shí)施例三提供的語(yǔ)音對(duì)話的多場(chǎng)景管理方法的流程示意 圖;在本發(fā)明實(shí)施例中,以移動(dòng)終端具體執(zhí)行語(yǔ)音對(duì)話的多場(chǎng)景管理方法為例進(jìn)行示例性 說(shuō)明,如圖5所示,本發(fā)明實(shí)施例包括如下步驟:
[0072] 在步驟501中的離線學(xué)習(xí)過(guò)程中,在眾測(cè)過(guò)程中,可以設(shè)定多個(gè)場(chǎng)景目標(biāo),讓用戶 與移動(dòng)終端進(jìn)行多輪語(yǔ)音交互,從而使得移動(dòng)終端具有一定的隨機(jī)性決策;其中,眾測(cè)數(shù)據(jù) 是本發(fā)明實(shí)施例中的移動(dòng)終端訓(xùn)練數(shù)據(jù)的其中一個(gè)依據(jù),可以使得本發(fā)明實(shí)施例基于訓(xùn)練 數(shù)據(jù)能夠?qū)崿F(xiàn)在線預(yù)測(cè)。
[0073] 在步驟502中的在線學(xué)習(xí)過(guò)程中,如果語(yǔ)音對(duì)話涉及到多輪(S卩,用戶與移動(dòng)終端 進(jìn)行了多次語(yǔ)音對(duì)話),可以收集用戶與移動(dòng)終端的上下文信息和解析信息,從而獲取到特 征向量來(lái)表示場(chǎng)景的特征狀態(tài),增強(qiáng)學(xué)習(xí)模型對(duì)特征向量與權(quán)重向量計(jì)算內(nèi)積;通過(guò)該過(guò) 程,能夠使得本發(fā)明實(shí)施例達(dá)到全局收益最大,通過(guò)多組對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)效果均超過(guò)現(xiàn)有技 術(shù)中的基于規(guī)則的多場(chǎng)景管理。此外,本發(fā)明實(shí)施例通過(guò)選擇與場(chǎng)景領(lǐng)域無(wú)關(guān)的特征向量, 利用特征向量來(lái)表示場(chǎng)景特征,從而最大化地覆蓋了與場(chǎng)景切換相關(guān)的因素,提高了泛化 能力。特征向量的示意可以參見(jiàn)圖4。
[0074] 在步驟503中的場(chǎng)景切換動(dòng)作中,本發(fā)明實(shí)施例以表1中所示的4類動(dòng)作作為示 例性說(shuō)明,包括但不限于:展現(xiàn)場(chǎng)景外(present (NULL)),展現(xiàn)場(chǎng)景(present (d)),場(chǎng)景確 認(rèn)(C〇nfirm(d))和場(chǎng)景間澄清(clarify(dl,d2))。通過(guò)場(chǎng)景確認(rèn)與場(chǎng)景澄清增強(qiáng)了人機(jī) 在整個(gè)多輪對(duì)話過(guò)程中的交互能力。
[0075] 表 1
[0076]

【權(quán)利要求】
1. 一種語(yǔ)音對(duì)話的多場(chǎng)景管理方法,其特征在于,所述方法包括: 從文本信息中獲取用戶輸入的需求信息,其中,所述文本信息從所述用戶的語(yǔ)音信息 中進(jìn)行文本識(shí)別得到; 根據(jù)所述需求信息場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景各自對(duì)應(yīng)的至少一個(gè)評(píng)分值; 根據(jù)所述至少一個(gè)評(píng)分值確定欲執(zhí)行的場(chǎng)景切換動(dòng)作,并展示與切換后的場(chǎng)景相對(duì)應(yīng) 的語(yǔ)音內(nèi)容。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)所述需求信息獲取場(chǎng)景內(nèi)的至 少一個(gè)場(chǎng)景各自對(duì)應(yīng)的至少一個(gè)評(píng)分值的步驟包括: 根據(jù)所述需求信息獲取場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景,并獲取與所述至少一個(gè)場(chǎng)景分別對(duì)應(yīng) 的至少一個(gè)特征向量. 獲取所述至少一個(gè)特征向量與各自對(duì)應(yīng)的權(quán)重向量的內(nèi)積,得到至少一個(gè)內(nèi)積,所述 內(nèi)積作為評(píng)分值。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述根據(jù)所述需求信息獲取場(chǎng)景內(nèi)的至 少一個(gè)場(chǎng)景,并獲取與所述至少一個(gè)場(chǎng)景分別對(duì)應(yīng)的至少一個(gè)特征向量的步驟包括: 根據(jù)所述需求信息對(duì)所述語(yǔ)音對(duì)話進(jìn)行場(chǎng)景分類,得到所述需求信息所適用的場(chǎng)景內(nèi) 的至少一個(gè)場(chǎng)景. 根據(jù)所述至少一個(gè)場(chǎng)景對(duì)所述需求信息進(jìn)行場(chǎng)景特征抽取,得到與所述至少一個(gè)場(chǎng)景 分別對(duì)應(yīng)的至少一個(gè)特征向量。
4. 根據(jù)權(quán)利要求2所述的方法,其特征在于,如果從所述需求信息還獲取到場(chǎng)景外特 征,所述方法還包括: 根據(jù)所述場(chǎng)景外特征與所述至少一個(gè)場(chǎng)景特征從所述至少一個(gè)場(chǎng)景特征中獲取場(chǎng)景 確認(rèn)動(dòng)作的特征向量。
5. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述方法還包括: 在眾測(cè)過(guò)程中獲取所述至少一個(gè)場(chǎng)景的目標(biāo)特征,通過(guò)統(tǒng)計(jì)模型對(duì)所述目標(biāo)特征進(jìn)行 多輪語(yǔ)音訓(xùn)練; 在所述統(tǒng)計(jì)模型具有隨機(jī)性決策時(shí),獲取所述權(quán)重向量的初始值。
6. 根據(jù)權(quán)利要求1-5任一所述的方法,其特征在于,所述根據(jù)所述至少一個(gè)評(píng)分值確 定欲執(zhí)行的場(chǎng)景切換動(dòng)作的步驟包括: 對(duì)所述至少一個(gè)評(píng)分值進(jìn)行排序,得到所有評(píng)分值中的最大值; 根據(jù)所述最大值對(duì)應(yīng)的場(chǎng)景特征確定欲執(zhí)行的場(chǎng)景切換動(dòng)作,并展示與所述最大值對(duì) 應(yīng)的場(chǎng)景特征的語(yǔ)音內(nèi)容。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)所述最大值對(duì)應(yīng)的場(chǎng)景特征對(duì) 所述需求信息進(jìn)行回應(yīng)的步驟包括: 如果所述最大值對(duì)應(yīng)所述場(chǎng)景內(nèi)的一個(gè)場(chǎng)景特征,根據(jù)該場(chǎng)景特征對(duì)所述需求信息進(jìn) 行回應(yīng); 如果所述最大值對(duì)應(yīng)所述場(chǎng)景內(nèi)的兩個(gè)W上的特征向量,根據(jù)所述兩個(gè)W上的特征向 量對(duì)所述需求信息進(jìn)行澄清; 如果所述最大值對(duì)應(yīng)所述場(chǎng)景外特征與所述場(chǎng)景內(nèi)的場(chǎng)景特征,對(duì)所述場(chǎng)景外特征與 所述場(chǎng)景內(nèi)的場(chǎng)景特征進(jìn)行確認(rèn)。
8. 根據(jù)權(quán)利要求7所述的方法,其特征在于,所述根據(jù)所述兩個(gè)W上的場(chǎng)景特征對(duì)所 述需求信息進(jìn)行澄清的步驟包括: 獲取所述至少兩個(gè)W上的場(chǎng)景特征對(duì)應(yīng)的場(chǎng)景向量的差值; 獲取所述差值的指數(shù)運(yùn)算,根據(jù)指數(shù)運(yùn)算結(jié)果確定對(duì)所述兩個(gè)W上的場(chǎng)景特征進(jìn)行澄 清。
9. 一種語(yǔ)音對(duì)話的多場(chǎng)景管理裝置,其特征在于,所述裝置包括: 第一獲取模塊,用于從文本信息中獲取用戶輸入的需求信息,其中,所述文本信息從所 述用戶的語(yǔ)音信息中進(jìn)行文本識(shí)別得到; 第二獲取模塊,用于根據(jù)所述需求信息獲取場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景各自對(duì)應(yīng)的至少一 個(gè)評(píng)分值; 切換模塊,用于根據(jù)所述至少一個(gè)評(píng)分值確定欲執(zhí)行的場(chǎng)景切換動(dòng)作,并展示與切換 后的場(chǎng)景相對(duì)應(yīng)的語(yǔ)音內(nèi)容。
10. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述第二獲取模塊包括: 第一獲取單元,用于根據(jù)所述需求信息獲取場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景,并獲取與所述至 少一個(gè)場(chǎng)景分別對(duì)應(yīng)的至少一個(gè)特征向量; 第二獲取單元,用于獲取所述至少一個(gè)特征向量與各自對(duì)應(yīng)的權(quán)重向量的內(nèi)積,得到 至少一個(gè)評(píng)分值。
11. 根據(jù)權(quán)利要求10所述的裝置,其特征在于,所述第一獲取單元包括: 場(chǎng)景分類子單元,用于根據(jù)所述需求信息對(duì)所述語(yǔ)音對(duì)話進(jìn)行場(chǎng)景分類,得到所述需 求信息所適用的場(chǎng)景內(nèi)的至少一個(gè)場(chǎng)景; 特征抽取子單元,用于根據(jù)所述至少一個(gè)場(chǎng)景對(duì)所述需求信息進(jìn)行場(chǎng)景特征抽取,得 到與所述至少一個(gè)場(chǎng)景分別對(duì)應(yīng)的至少一個(gè)特征向量。
12. 根據(jù)權(quán)利要求11所述的裝置,其特征在于,如果從所述需求信息還獲取到場(chǎng)景外 特征,所述裝置還包括: 第=獲取模塊,用于根據(jù)所述場(chǎng)景外特征與所述至少一個(gè)場(chǎng)景特征從所述至少一個(gè)場(chǎng) 景特征中獲取場(chǎng)景確認(rèn)動(dòng)作的特征向量。
13. 根據(jù)權(quán)利要求9所述的裝置,其特征在于,所述裝置還包括: 第四獲取模塊,用于在眾測(cè)過(guò)程中獲取所述至少一個(gè)場(chǎng)景的目標(biāo)特征,通過(guò)統(tǒng)計(jì)模型 對(duì)所述目標(biāo)特征進(jìn)行多輪語(yǔ)音訓(xùn)練; 第五獲取模塊,用于在所述統(tǒng)計(jì)模型具有隨機(jī)性決策時(shí),獲取所述權(quán)重向量的初始值。
14. 根據(jù)權(quán)利要求9-13任一所述的裝置,其特征在于,所述切換模塊包括: 排序單元,用于對(duì)所述至少一個(gè)評(píng)分值進(jìn)行排序,得到所有評(píng)分值中的最大值; 確定單元,用于根據(jù)所述最大值對(duì)應(yīng)的場(chǎng)景特征確定欲執(zhí)行的場(chǎng)景切換動(dòng)作,并展示 與所述最大值對(duì)應(yīng)的場(chǎng)景特征的語(yǔ)音內(nèi)容。
15. 根據(jù)權(quán)利要求14所述的裝置,其特征在于,所述確定單元包括: 第一回應(yīng)子單元,用于如果所述最大值對(duì)應(yīng)所述場(chǎng)景內(nèi)的一個(gè)場(chǎng)景特征,根據(jù)該場(chǎng)景 特征對(duì)所述需求信息進(jìn)行回應(yīng); 第二回應(yīng)子單元,用于如果所述最大值對(duì)應(yīng)所述場(chǎng)景內(nèi)的兩個(gè)W上的特征向量,根據(jù) 所述兩個(gè)W上的特征向量對(duì)所述需求信息進(jìn)行澄清; 第=回應(yīng)子單元,用于如果所述最大值對(duì)應(yīng)所述場(chǎng)景外特征與所述場(chǎng)景內(nèi)的場(chǎng)景特 征,對(duì)所述場(chǎng)景外特征與所述場(chǎng)景內(nèi)的場(chǎng)景特征進(jìn)行確認(rèn)。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述第=回應(yīng)子單元包括: 差值獲取子單元,用于獲取所述至少兩個(gè)W上的場(chǎng)景特征對(duì)應(yīng)的場(chǎng)景向量的差值; 澄清子單元,用于獲取所述差值的指數(shù)運(yùn)算,根據(jù)指數(shù)運(yùn)算結(jié)果確定對(duì)所述兩個(gè)W上 的場(chǎng)景特征進(jìn)行澄清。
【文檔編號(hào)】G10L15/26GK104464733SQ201410590076
【公開(kāi)日】2015年3月25日 申請(qǐng)日期:2014年10月28日 優(yōu)先權(quán)日:2014年10月28日
【發(fā)明者】陳洪亮, 汪冠春, 吳華 申請(qǐng)人:百度在線網(wǎng)絡(luò)技術(shù)(北京)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
桓台县| 增城市| 泌阳县| 嘉祥县| 北川| 西安市| 合作市| 黄骅市| 曲松县| 年辖:市辖区| 合肥市| 雅江县| 阿克| 沽源县| 全椒县| 渝北区| 灵宝市| 延长县| 岳西县| 临澧县| 临洮县| 临湘市| 固阳县| 中方县| 贡嘎县| 雷山县| 胶南市| 青川县| 闻喜县| 莱芜市| 莲花县| 枞阳县| 垣曲县| 元谋县| 武功县| 信宜市| 泸水县| 罗平县| 南丰县| 曲沃县| 桓台县|