一種人機(jī)對(duì)話的語(yǔ)義分析方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及人機(jī)對(duì)話相關(guān)技術(shù)領(lǐng)域,特別是一種人機(jī)對(duì)話的語(yǔ)義分析方法及系 統(tǒng)。
【背景技術(shù)】
[0002] 現(xiàn)在的人機(jī)對(duì)話問(wèn)答系統(tǒng)中,當(dāng)用戶輸入問(wèn)題后,識(shí)別用戶所要詢問(wèn)的意圖是整 個(gè)問(wèn)答系統(tǒng)中核心的部分,意圖識(shí)別正確但準(zhǔn)確率太低,會(huì)造成后期給用戶返回答案時(shí),答 案太多而無(wú)法選擇最優(yōu)答案的問(wèn)題;意圖識(shí)別錯(cuò)誤會(huì)造成無(wú)法理解用戶的意思,從而會(huì)給 用戶提供其不想要的答案或者直接無(wú)法給出答案?,F(xiàn)有的技術(shù)做法是:
[0003] 模型預(yù)測(cè):該方法主要是先由人工進(jìn)行分類和語(yǔ)料的標(biāo)注,然后通過(guò)決策樹(shù)或者 分類算法來(lái)訓(xùn)練出一個(gè)模型,當(dāng)用戶輸入一句話后,進(jìn)行分詞、實(shí)體抽取和向量轉(zhuǎn)化后,把 處理后的信息輸入到模型中來(lái)進(jìn)行預(yù)測(cè)判斷,給出一個(gè)用戶意圖預(yù)測(cè)的結(jié)果。
[0004] 現(xiàn)有意圖識(shí)別的方法都是基于人工標(biāo)注大量的語(yǔ)料來(lái)進(jìn)行訓(xùn)練和預(yù)測(cè),由于需要 大量的人工標(biāo)注,會(huì)存在很多的不可控因素,比如每個(gè)標(biāo)注人員對(duì)于語(yǔ)料理解的不同會(huì)導(dǎo) 致不同的標(biāo)注結(jié)果,對(duì)相同的問(wèn)題會(huì)有重復(fù)標(biāo)注的結(jié)果,以及不同的分類標(biāo)注里有相同語(yǔ) 料的標(biāo)注;而且當(dāng)需要添加新的意圖分類的時(shí)候,必須由相關(guān)人員進(jìn)行商討、確定,再培訓(xùn) 標(biāo)注人員才能開(kāi)始進(jìn)行標(biāo)注工作,機(jī)器無(wú)法自動(dòng)添加新的分類。在整個(gè)訓(xùn)練模型的過(guò)程中 會(huì)消耗大量的人力物力,并且由于諸多的不可控因素會(huì)影響函數(shù)訓(xùn)練的速度和進(jìn)度。
[0005] 在實(shí)際過(guò)程中模型預(yù)測(cè)也很難區(qū)分用戶是在詢問(wèn)問(wèn)題還是和問(wèn)答系統(tǒng)進(jìn)行聊天, 用戶在實(shí)際使用時(shí)是不會(huì)提示機(jī)器自己的意圖是什么,所以需要問(wèn)答系統(tǒng)來(lái)識(shí)別和區(qū)分, 如果光靠模型的預(yù)測(cè)就需要在語(yǔ)料里加入大量的聊天語(yǔ)料來(lái)進(jìn)行訓(xùn)練,大量聊天語(yǔ)料的存 在勢(shì)必會(huì)造成其他分類語(yǔ)料權(quán)重的降低,從而影響其他意圖分類的準(zhǔn)確性,而不加入聊天 語(yǔ)料則又會(huì)影響到意圖識(shí)別的最終效果。最終整個(gè)系統(tǒng)的效果也會(huì)大打折扣。
【發(fā)明內(nèi)容】
[0006] 基于此,有必要針對(duì)現(xiàn)有技術(shù)中無(wú)法對(duì)用戶進(jìn)行語(yǔ)義分析,從而對(duì)用戶的意圖識(shí) 別不準(zhǔn)確的技術(shù)問(wèn)題,提供一種人機(jī)對(duì)話的語(yǔ)義分析方法及系統(tǒng)。
[0007] -種人機(jī)對(duì)話的語(yǔ)義分析方法,包括:
[0008] 函數(shù)訓(xùn)練步驟,包括:獲取包括多個(gè)訓(xùn)練語(yǔ)句的訓(xùn)練語(yǔ)料,通過(guò)所述訓(xùn)練語(yǔ)料訓(xùn)練 出情感函數(shù),所述情感函數(shù)對(duì)輸入的語(yǔ)句計(jì)算對(duì)應(yīng)的情感值;
[0009] 情感值計(jì)算步驟,包括:獲取用戶輸入語(yǔ)句,將所述用戶輸入語(yǔ)句輸入所述情感函 數(shù)后得出關(guān)于所述用戶輸入語(yǔ)句的情感值作為用戶情感值;
[0010] 情感執(zhí)行步驟,包括:從與所述用戶輸入語(yǔ)句相關(guān)的多個(gè)回答答案中,選擇滿足所 述用戶情感值的回答答案作為語(yǔ)義分析答案,顯示所述語(yǔ)義分析答案。
[0011] 一種人機(jī)對(duì)話的語(yǔ)義分析系統(tǒng),包括:
[0012] 函數(shù)訓(xùn)練模塊,用于:獲取包括多個(gè)訓(xùn)練語(yǔ)句的訓(xùn)練語(yǔ)料,通過(guò)所述訓(xùn)練語(yǔ)料訓(xùn)練 出情感函數(shù),所述情感函數(shù)對(duì)輸入的語(yǔ)句計(jì)算對(duì)應(yīng)的情感值;
[0013] 情感值計(jì)算模塊,用于:獲取用戶輸入語(yǔ)句,將所述用戶輸入語(yǔ)句輸入所述情感函 數(shù)后得出關(guān)于所述用戶輸入語(yǔ)句的情感值作為用戶情感值;
[0014] 情感執(zhí)行模塊,用于:從與所述用戶輸入語(yǔ)句相關(guān)的多個(gè)回答答案中,選擇滿足所 述用戶情感值的回答答案作為語(yǔ)義分析答案,顯示所述語(yǔ)義分析答案。
[0015] 本發(fā)明通過(guò)函數(shù)訓(xùn)練得到計(jì)算情感值的情感函數(shù),從而能夠?qū)⒂脩糨斎胝Z(yǔ)句計(jì)算 出相應(yīng)的情感值,并根據(jù)情感值選擇回答用戶的方式,從而能夠更好地回答用戶的輸入。
【附圖說(shuō)明】
[0016] 圖1為本發(fā)明一種人機(jī)對(duì)話的語(yǔ)義分析方法的工作流程圖;
[0017] 圖2為本發(fā)明最佳實(shí)施例的工作流程圖;
[0018] 圖3為本發(fā)明一種人機(jī)對(duì)話的語(yǔ)義分析系統(tǒng)的結(jié)構(gòu)模塊圖。
【具體實(shí)施方式】
[0019] 下面結(jié)合附圖和具體實(shí)施例對(duì)本發(fā)明做進(jìn)一步詳細(xì)的說(shuō)明。
[0020] 如圖1所示為本發(fā)明一種人機(jī)對(duì)話的語(yǔ)義分析方法的工作流程圖,包括:
[0021] 步驟S101,包括:獲取包括多個(gè)訓(xùn)練語(yǔ)句的訓(xùn)練語(yǔ)料,通過(guò)所述訓(xùn)練語(yǔ)料訓(xùn)練出 情感函數(shù),所述情感函數(shù)對(duì)輸入的語(yǔ)句計(jì)算對(duì)應(yīng)的情感值;
[0022] 步驟S102,包括:獲取用戶輸入語(yǔ)句,將所述用戶輸入語(yǔ)句輸入所述情感函數(shù)后 得出關(guān)于所述用戶輸入語(yǔ)句的情感值作為用戶情感值;
[0023] 步驟S103,包括:從與所述用戶輸入語(yǔ)句相關(guān)的多個(gè)回答答案中,選擇滿足所述 用戶情感值的回答答案作為語(yǔ)義分析答案,顯示所述語(yǔ)義分析答案。
[0024] 用戶的各種意圖識(shí)別其實(shí)也是用模型去擬合用戶的問(wèn)題,語(yǔ)義分析就是用函數(shù)擬 合出合適的模型的方式,最后可以得到的可以比較意圖類別的情感函數(shù),則可以直接得出 用戶的意圖。
[0025] 本發(fā)明通過(guò)步驟S101訓(xùn)練情感函數(shù),并在步驟S102對(duì)用戶輸入語(yǔ)句在情感函數(shù) 中計(jì)算得到對(duì)應(yīng)的用戶情感值。在步驟S103中,根據(jù)用戶情感值選擇對(duì)應(yīng)的回答答案并顯 不〇
[0026] 本發(fā)明由于采用訓(xùn)練模型獲取用戶情感值,因此使實(shí)體識(shí)別的準(zhǔn)確率得到了明顯 提高,并且也大大提高了模型迭代速度和節(jié)省了人力成本;更重要的是當(dāng)用戶量大的時(shí)候, 對(duì)于同一個(gè)問(wèn)題會(huì)有多種的問(wèn)法,當(dāng)初始訓(xùn)練的樣本不足時(shí),可能無(wú)法得到用戶的意圖,然 而通過(guò)不斷的訓(xùn)練則可以提高獲取用戶意圖的可能性。經(jīng)過(guò)一段時(shí)間后,可以將獲得的用 戶輸入語(yǔ)句對(duì)情感函數(shù)進(jìn)行輸入,從而對(duì)算法的參數(shù)和語(yǔ)料進(jìn)行自動(dòng)的補(bǔ)充和調(diào)優(yōu)。
[0027] 計(jì)算情感值,可以通過(guò)在訓(xùn)練語(yǔ)料中,預(yù)先對(duì)每個(gè)訓(xùn)練語(yǔ)句設(shè)定相應(yīng)的情感值,然 后通過(guò)函數(shù)擬合的方式,擬合出一條能對(duì)輸入的語(yǔ)句計(jì)算出相應(yīng)的情感值的函數(shù)。然而,采 用預(yù)先設(shè)定情感值的方式,需要人工大量的打分,因此會(huì)導(dǎo)致出現(xiàn)比較大量的主觀判斷,從 而影響實(shí)際的語(yǔ)義分析結(jié)果。
[0028] 在其中一個(gè)實(shí)施例中:
[0029] 所述步驟101,具體包括:獲取包括多個(gè)訓(xùn)練語(yǔ)句的訓(xùn)練語(yǔ)料,每個(gè)訓(xùn)練語(yǔ)句與一 種情感類型關(guān)聯(lián),對(duì)所述訓(xùn)練語(yǔ)料進(jìn)行訓(xùn)練,得到用于對(duì)情感類型進(jìn)行分類的情感函數(shù),所 述情感值用于表示輸入情感函數(shù)的語(yǔ)句所屬的情感類型;
[0030] 所述步驟102,具體包括:根據(jù)所述用戶情感值確定對(duì)應(yīng)的情感類型為用戶情感 類型,從與所述用戶輸入語(yǔ)句相關(guān)的多個(gè)回答答案中,選擇所述用戶情感類型所對(duì)應(yīng)的回 答答案作為語(yǔ)義分析答案,顯示所述語(yǔ)義分析答案。
[0031] 本實(shí)施例中情感函數(shù)是對(duì)情感類型進(jìn)行分類,因此無(wú)需對(duì)訓(xùn)練語(yǔ)句進(jìn)行打分,只 要預(yù)先將訓(xùn)練語(yǔ)句進(jìn)行分類,使得最終的語(yǔ)義分析結(jié)果更加具有客觀性。
[0032] 在其中一個(gè)實(shí)施例中:
[0033] 所述步驟S101,還包括:將所述訓(xùn)練語(yǔ)句進(jìn)行向量化處理得到訓(xùn)練向量值,對(duì)多 個(gè)所述訓(xùn)練向量值進(jìn)行訓(xùn)練得到情感函數(shù),所述訓(xùn)練向量值包括多個(gè)維度,且每個(gè)維度與 一個(gè)單詞關(guān)聯(lián),在所述訓(xùn)練向量值中將所述訓(xùn)練語(yǔ)句所包括的單詞所對(duì)應(yīng)的維度置1 ;
[0034] 所述步驟S102,還包括:將所述用戶輸入語(yǔ)句進(jìn)行向量化處理得到用戶輸入向量 值,,所述用戶輸入向量值包括多個(gè)維度,且每個(gè)維度與一個(gè)單詞關(guān)聯(lián),在所述用戶輸入向 量值中將所述用戶輸入語(yǔ)句所包括的單詞所對(duì)應(yīng)的維度置1。
[0035] 在其中一個(gè)實(shí)施例中:
[0036] 所述情感類型包括第一情感類型和第二情感類型,所述訓(xùn)練語(yǔ)料包括第一訓(xùn)練語(yǔ) 料和第二訓(xùn)練語(yǔ)料,所述第一訓(xùn)練語(yǔ)料包括多個(gè)預(yù)先選定的與第一情感類型關(guān)聯(lián)的第一訓(xùn) 練語(yǔ)句,所述第二訓(xùn)練語(yǔ)料包括多個(gè)預(yù)先選定的與第二情感類型關(guān)聯(lián)的第二訓(xùn)練語(yǔ)句;
[0037] 所述步驟S101中,分別對(duì)第一訓(xùn)練語(yǔ)料進(jìn)行訓(xùn)練得到第一情感函數(shù),對(duì)第二訓(xùn)練 語(yǔ)料進(jìn)行訓(xùn)練得到第二情感函數(shù);
[0038] 所述第一情感函數(shù)采用
【主權(quán)項(xiàng)】
1. 一種人機(jī)對(duì)話的語(yǔ)義分析方法,其特征在于,包括: 函數(shù)訓(xùn)練步驟,包括:獲取包括多個(gè)訓(xùn)練語(yǔ)句的訓(xùn)練語(yǔ)料,通過(guò)所述訓(xùn)練語(yǔ)料訓(xùn)練出情 感函數(shù),所述情感函數(shù)對(duì)輸入的語(yǔ)句計(jì)算對(duì)應(yīng)的情感值; 情感值計(jì)算步驟,包括:獲取用戶輸入語(yǔ)句,將所述用戶輸入語(yǔ)句輸入所述情感函數(shù)后 得出關(guān)于所述用戶輸入語(yǔ)句的情感值作為用戶情感值; 情感執(zhí)行步驟,包括:從與所述用戶輸入語(yǔ)句