本發(fā)明涉及自然語言處理
技術(shù)領(lǐng)域:
,尤其涉及一種語義受控的答案生成方法、裝置及系統(tǒng)。
背景技術(shù):
:隨著自然語言處理技術(shù)的發(fā)展,基于自然語言學(xué)習(xí)技術(shù)建立起來的對(duì)話系統(tǒng)也得到了廣泛的應(yīng)用,傳統(tǒng)的對(duì)話系統(tǒng)由人工在問答庫中預(yù)先錄入的問題庫和答案庫組成,當(dāng)用戶提問時(shí),對(duì)話系統(tǒng)根據(jù)用戶提問的內(nèi)容在問題模型庫中檢索相應(yīng)的問題,然后輸出問題相應(yīng)的答案。近年來,隨著深度學(xué)習(xí)技術(shù)的飛速發(fā)展,基于深度學(xué)習(xí)技術(shù)的對(duì)話系統(tǒng)得到了大規(guī)模的應(yīng)用,與傳統(tǒng)的基于問題庫信息檢索的對(duì)話系統(tǒng)不同,深度學(xué)習(xí)運(yùn)用了大量的統(tǒng)計(jì)學(xué)理論,通過設(shè)計(jì)深度學(xué)習(xí)算法,基于深度學(xué)習(xí)技術(shù)的對(duì)話系統(tǒng)可以從大規(guī)模的語料中學(xué)習(xí)到潛在的回復(fù)模式,從而根據(jù)學(xué)習(xí)到的潛在回復(fù)模式對(duì)未知語料生成回復(fù)答案,或者可以生成預(yù)料中從未出現(xiàn)過的回復(fù)語句。參見圖1,為現(xiàn)有技術(shù)公開的一種答案生成方法,在該方法中:基于深度學(xué)習(xí)的對(duì)話系統(tǒng)通過建立一個(gè)基于rnn(遞歸神經(jīng)網(wǎng)絡(luò):recurrentneuralnetworks)的sequencetosequence模型(簡(jiǎn)稱:seq2seq模型),并使用該模型進(jìn)行大量的語料訓(xùn)練,使seq2seq模型能夠從問答對(duì)中學(xué)習(xí)到對(duì)未知問題的潛在回答模式,從而對(duì)新提出的未知問題給出答案。由于,seq2seq模型進(jìn)行語義訓(xùn)練時(shí),使用的是統(tǒng)計(jì)學(xué)領(lǐng)域中的一種基于概率的算法來實(shí)現(xiàn)訓(xùn)練過程,且無法通過外界干預(yù)去控制seq2seq模型內(nèi)部的訓(xùn)練過程,因此,將問題輸入到seq2seq模型后,能生成什么樣的答案,是一種概率事件,每次生成的答案不盡相同,其答案的語義內(nèi)容是不可控的,這就導(dǎo)致了現(xiàn)有技術(shù)中,運(yùn)用seq2seq模型的深度學(xué)習(xí)技術(shù)生成的問題答案在語義上,常常與問題無關(guān)聯(lián),導(dǎo)致答案不符合對(duì)話邏輯。例如用戶提出的問題為“我吃過芒果”,seq2seq模型生成的答案為“你沒見過芒果”,顯然這個(gè)答案在語義上與問題是無關(guān)聯(lián)的,是不符合對(duì)話邏輯的。因此,對(duì)seq2seq模型生成的答案進(jìn)行語義控制,以解決seq2seq模型生成的答案與問題無語義關(guān)聯(lián)的情況,成為本領(lǐng)域技術(shù)人員亟待解決的技術(shù)問題。技術(shù)實(shí)現(xiàn)要素:本發(fā)明提供了一種語義受控的答案生成方法、裝置及系統(tǒng),以解決現(xiàn)有技術(shù)中存在的問題。第一方面,本發(fā)明實(shí)施例提供了一種語義受控的答案生成方法,所述方法包括:獲取問題的第一答案集,所述第一答案集包括問題對(duì)應(yīng)的至少一個(gè)候選答案;提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息;對(duì)第一答案集中的全部候選答案進(jìn)行句法分析,得到包含句法分析結(jié)果的第二答案集;根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)第二答案集中的候選答案進(jìn)行語義限制處理,得到包含語義受控候選答案的第三答案集;從第三答案集中選擇一個(gè)候選答案作為問題答案。第二方面,本發(fā)明實(shí)施例提供了一種語義受控的答案生成裝置,所述裝置包括:獲取模塊,用于獲取問題的第一答案集,所述第一答案集包括問題對(duì)應(yīng)的至少一個(gè)候選答案;結(jié)構(gòu)化分析模塊,用于提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息;句法分析模塊,用于對(duì)第一答案集中的全部候選答案進(jìn)行句法分析,得到包含句法分析結(jié)果的第二答案集;語義控制模塊,用于根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)第二答案集中的候選答案進(jìn)行語義限制處理,得到包含語義受控候選答案的第三答案集;答案選擇模塊,用于從第三答案集中選擇一個(gè)候選答案作為問題答案。第三方面,本發(fā)明實(shí)施例提供了一種語義受控的答案生成系統(tǒng),所述系統(tǒng)包括:用戶終端和服務(wù)器;所述用戶終端,用于接收問題,并發(fā)送問題到服務(wù)器,以及,從服務(wù)器接收問題答案;所述服務(wù)器包括處理器、存儲(chǔ)器;所述存儲(chǔ)器用于存儲(chǔ)處理器可執(zhí)行的程序;所述處理器被配置為:獲取問題的第一答案集,所述第一答案集包括問題對(duì)應(yīng)的至少一個(gè)候選答案;提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息;對(duì)對(duì)第一答案集中的全部候選答案進(jìn)行句法分析,得到包含句法分析結(jié)果的第二答案集;根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)第二答案集中的候選答案進(jìn)行語義限制處理,得到包含語義受控候選答案的第三答案集;從第三答案集中選擇一個(gè)候選答案作為問題答案。本發(fā)明實(shí)施例提供的技術(shù)方案,為了實(shí)現(xiàn)對(duì)seq2seq模型生成的答案進(jìn)行語義控制,對(duì)于用戶提出的問題,首先,獲取問題的候選答案,提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息;其次,對(duì)問題的候選答案進(jìn)行句法分析;然后,根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)候選答案進(jìn)行語義限制處理,得到語義受控的候選答案,最后,從候選答案中產(chǎn)生與問題具有語義關(guān)聯(lián)的問題答案。實(shí)現(xiàn)了對(duì)現(xiàn)有技術(shù)的seq2seq模型生成的答案進(jìn)行語義控制,解決了seq2seq模型生成的答案與問題無語義關(guān)聯(lián)的問題。附圖說明為了更清楚地說明本發(fā)明的技術(shù)方案,下面將對(duì)實(shí)施例中所需要使用的附圖作簡(jiǎn)單地介紹,顯而易見地,對(duì)于本領(lǐng)域普通技術(shù)人員而言,在不付出創(chuàng)造性勞動(dòng)性的前提下,還可以根據(jù)這些附圖獲得其他的附圖。圖1為現(xiàn)有技術(shù)公開的一種答案生成方法;圖2為本發(fā)明實(shí)施例提供的一種語義受控的答案生成方法的流程圖;圖3為本發(fā)明實(shí)施例提供的一種語義受控的答案生成方法步驟s140的流程圖;圖4為本發(fā)明實(shí)施例提供的一種語義受控的答案生成方法步驟s150的流程圖;圖5為本發(fā)明實(shí)施例提供的一種語義受控的答案生成方法步驟s151的流程圖;圖6為本發(fā)明實(shí)施例提供的另一種語義受控的答案生成方法步驟s140的流程圖;圖7為本發(fā)明實(shí)施例提供的另一種語義受控的答案生成方法步驟s151的流程圖;圖8為本發(fā)明實(shí)施例提供的又一種語義受控的答案生成方法步驟s140的流程圖;圖9為本發(fā)明實(shí)施例提供的一種語義受控的答案生成裝置框圖;圖10為本發(fā)明實(shí)施例提供的一種語義受控的答案生成系統(tǒng)框圖。具體實(shí)施方式為了使本
技術(shù)領(lǐng)域:
的人員更好地理解本發(fā)明中的技術(shù)方案,下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對(duì)本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動(dòng)前提下所獲得的所有其他實(shí)施例,都應(yīng)當(dāng)屬于本發(fā)明保護(hù)的范圍。本領(lǐng)域的常用概念解釋sequencetosequence模型(縮寫為:seq2seq模型)是一種建模兩個(gè)序列間關(guān)系的通用深度學(xué)習(xí)模型,一個(gè)標(biāo)準(zhǔn)的seq2seq模型通常由兩部分組成:encoder(編碼器)和decoder(解碼器)。encoder負(fù)責(zé)依次讀入輸入序列的每個(gè)單位,將其編碼成一個(gè)模型的中間表示(一般為一個(gè)向量)。decoder負(fù)責(zé)在給定上下文向量的情況下預(yù)測(cè)出輸出序列。seq2seq模型在自然語言處理領(lǐng)域中得到了廣泛的應(yīng)用,通過使用大量的語料對(duì)seq2seq模型進(jìn)行訓(xùn)練,使seq2seq模型可以從大量的語料訓(xùn)練中學(xué)習(xí)到潛在的回答模式,從而可以生成語料中從未出現(xiàn)過的回答語句。實(shí)施例一本發(fā)明實(shí)施例提供了一種語義受控的答案生成方法。圖2為本發(fā)明實(shí)施例提供的一種語義受控的答案生成方法的流程圖,如圖2所示,所述方法可以包括以下步驟:在步驟s110中,獲取問題的第一答案集,所述第一答案集包括問題對(duì)應(yīng)的至少一個(gè)候選答案。本實(shí)施例中,可以搭建一個(gè)標(biāo)準(zhǔn)的seq2seq框架,并對(duì)該seq2seq框架進(jìn)行大量的語料訓(xùn)練,從而得到一個(gè)seq2seq模型,并且,可以設(shè)定當(dāng)輸入一個(gè)問題到seq2seq模型時(shí),seq2seq模型返回多個(gè)結(jié)果作為候選答案,作為示例地,本實(shí)施例設(shè)定seq2seq模型對(duì)一個(gè)問題返回五個(gè)結(jié)果,即返回五個(gè)候選答案。本實(shí)施例中,將問題輸入到seq2seq模型中,得到五個(gè)候選答案,這五個(gè)候選答案構(gòu)成了本實(shí)例中的第一答案集。示例地,本實(shí)施例中,向seq2seq模型中輸入的問題為:我想吃云南的芒果。seq2seq模型返回的五個(gè)候選答案組成的第一答案集為:我也想吃,我芒果不錯(cuò)哦我很喜歡我吃過我們?nèi)コ园≡诓襟Es120中,提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息。結(jié)構(gòu)化信息是指對(duì)問題進(jìn)行結(jié)構(gòu)化識(shí)別,將問題轉(zhuǎn)化為結(jié)構(gòu)化的語義表示以后,結(jié)構(gòu)化的語義中包含的信息。在人機(jī)對(duì)話領(lǐng)域中,結(jié)構(gòu)化的語義通常被稱作dialogueact,dialogueact由communicativefunction和slot-valuepairs組成(由于在國(guó)內(nèi),本領(lǐng)域技術(shù)人員未對(duì)以上英文概念的中文翻譯做統(tǒng)一的規(guī)定,而是普遍引用英文原文來表述這些概念,因此,為了避免翻譯后產(chǎn)生歧義,本實(shí)施例中也使用英文原文來表述這些概念,本領(lǐng)域技術(shù)人員能夠理解這些英文概念),其中communicativefunction表示query(可理解為問題)的類型,如:陳述需求、詢問屬性、否定、選擇疑問等;而每個(gè)slot-valuepair則表達(dá)一個(gè)限制條件。例如對(duì)于問題:“我要吃西二旗附近的川菜”,其對(duì)應(yīng)的dialogueact可以表示為inform(person=我,foodtype=川菜,location=西二旗),在上述dialogueact中,“inform”就是一種類型的communicativefunction,它表示問題類型為陳述需求,而“inform”之后括號(hào)內(nèi)“person=我,foodtype=川菜,location=西二旗”則屬于slot-valuepairs,是對(duì)語義的具有控制作用的限制條件。具體來說,對(duì)于問題“我要吃西二旗附近的川菜”來說,對(duì)其進(jìn)行結(jié)構(gòu)化語義表示之后,slot-valuepairs中包含:person=我,foodtype=川菜,location=西二旗。其中“我”為句子中的主語,為人稱代詞,表示“吃”這個(gè)動(dòng)作的執(zhí)行者;“川菜”為句子中的賓語,表示“我”要吃的內(nèi)容;“西二旗”為句子中的定語,是一個(gè)表示位置的信息,對(duì)川菜的位置做出的限定,以上slot-valuepairs信息中的限制條件,共同對(duì)問題的語義做出了限制,使問題能夠表達(dá)出提問者的特定的提問需求。由于slot-valuepairs信息有對(duì)語義進(jìn)行限制的作用,因此,本實(shí)施例中的語義限制信息,就是將問題轉(zhuǎn)化為結(jié)構(gòu)化的語義表示以后,從dialogueact的slot-valuepairs信息中提取的。此外,本實(shí)施例中的結(jié)構(gòu)化信息至少包括語義限制信息,還可以包括問題類型信息,例如communicativefunction信息。示例地,對(duì)本實(shí)施例步驟s110中的問題“我想吃云南的芒果”,結(jié)構(gòu)化的語義表示為:inform(person=我,location=云南,foodtype=芒果),因此,本實(shí)施例中的提取到的語義限制信息為:我、云南、芒果。在步驟s130中,對(duì)第一答案集中的全部候選答案進(jìn)行句法分析,得到包含句法分析結(jié)果的第二答案集。本實(shí)施例中,步驟s130的一種實(shí)現(xiàn)方法為:對(duì)第一答案集中的全部候選答案進(jìn)行句法分析,根據(jù)句法分析結(jié)果,去除無效答案,得到第二答案集,所述無效答案包括句法成分缺失的候選答案和句法成分冗余的候選答案。本實(shí)施例中,使用依存句法分析的方法對(duì)第一答案集中全部的候選答案進(jìn)行句法分析。依存句法(dependencyparsing,dp)分析通過分析語言單位內(nèi)成分之間的依存關(guān)系揭示其語法結(jié)構(gòu)。直觀來講,依存句法分析識(shí)別句子中的“主謂賓”、“定狀補(bǔ)”這些句法成分,并分析各句法成分之間的關(guān)系。示例地,對(duì)本實(shí)施例中的第一答案集中的候選答案使用依存句法分析的結(jié)果為:在本實(shí)施例中,候選答案“我也想吃,我”的句法分析結(jié)果為“主謂,主”,即在一個(gè)句子中出現(xiàn)了兩個(gè)主語,屬于句法成分冗余,屬于無效答案,因此在步驟s130中,此候選答案被去除,最終得到的第二答案集為:芒果不錯(cuò)哦我很喜歡我吃過我們?nèi)コ园⌒枰f明的是,本實(shí)施例中,與第一答案集相比,在步驟s130中得到的第二答案集,包括了第二答案集中每個(gè)候選答案的句法分析結(jié)果。在步驟s140中,根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)第二答案集中的候選答案進(jìn)行語義限制處理,得到包含語義受控候選答案的第三答案集。參見圖3,本實(shí)施例中,步驟s140包括以下步驟:在步驟s1411中,根據(jù)句法分析結(jié)果,確定每個(gè)候選答案的句法成分中包含的語義信息。語義信息能夠表達(dá)語句中心內(nèi)容,本實(shí)例中定義的語義信息,由句子中做“主謂賓”成分的內(nèi)容構(gòu)成,句子中的“主謂賓”成分構(gòu)成了句子的主干,通過識(shí)別句子中“主謂賓”成分的具體內(nèi)容(如:主語是人、動(dòng)物、水果等,謂語是:動(dòng)作、狀態(tài)等,賓語是人、食物等),就能夠確定句子的中心內(nèi)容。本實(shí)施例中,可以通過步驟s130中的依存句法分析結(jié)果,確定語義信息。示例地,每個(gè)候選答案的句法成分中包含的語義信息的結(jié)果為(括號(hào)內(nèi)是對(duì)語義信息的注釋信息):候選答案語義信息芒果不錯(cuò)哦芒果(主語,食物)不錯(cuò)(謂語,狀態(tài))我很喜歡我(主語,人稱代詞)喜歡(謂語,狀態(tài))我吃過我(主語,人稱代詞)吃過(謂語,狀態(tài))我們?nèi)コ园∥覀?主語,人稱代詞)去吃(謂語,動(dòng)作)在步驟s1412中,在語義限制信息中,查找與語義信息存在語義關(guān)聯(lián)的第一目標(biāo)信息;本實(shí)施例中,語義關(guān)聯(lián)是指語義信息和語義限制信息根據(jù)句法關(guān)系組合能形成符合邏輯的語義。示例地,對(duì)于本實(shí)施例而言,語義限制信息已經(jīng)在步驟s120中提取到,包括(括號(hào)中是對(duì)語義限制信息的注釋信息):我(人稱代詞),云南(地點(diǎn)),芒果(食物)對(duì)于第二答案集中的每個(gè)候選答案,在語義限制信息中,查找第一目標(biāo)信息的具體過程為:a.候選答案:芒果不錯(cuò)哦“芒果”在本候選答案中為主語,且“芒果”為一種食物;語義限制信息中的“云南”為地點(diǎn),“云南”和“芒果”可以構(gòu)成語義關(guān)聯(lián),組合成“云南芒果”,此時(shí)“云南”作為“芒果”狀語,起到限制“芒果”產(chǎn)地的語義控制作用,因此,對(duì)于本候選答案來說,“云南”是與“芒果”存在語義關(guān)聯(lián)的第一目標(biāo)信息。b.候選答案:我很喜歡“喜歡”在本候選答案中為謂語,表示主語“我”表達(dá)出的一種狀態(tài);語義限制信息中的“芒果”為食物,“喜歡”和“芒果”可以構(gòu)成語義關(guān)聯(lián),組合成“喜歡芒果”,此時(shí)“芒果”作為賓語,起到限制“喜歡”的對(duì)象的語義控制作用,因此,對(duì)于本候選答案來說,“芒果”是與“喜歡”存在語義關(guān)聯(lián)的第一目標(biāo)信息。c.候選答案:我吃過“吃過”在本候選答案中為謂語,表示主語“我”的一種狀態(tài);語義限制信息中的“芒果”為食物,“吃過”和“芒果”可以構(gòu)成語義關(guān)聯(lián),組合成“吃過芒果”,此時(shí)“芒果”作為賓語,起到限制“吃過”的對(duì)象的語義控制作用,因此,對(duì)于本候選答案來說,“芒果”是與“吃過”存在語義關(guān)聯(lián)的第一目標(biāo)信息。d.候選答案:我們?nèi)コ园 俺浴痹诒竞蜻x答案中為謂語,表示主語“我們”的動(dòng)作;語義限制信息中的“芒果”為食物,“吃”和“芒果”可以構(gòu)成語義關(guān)聯(lián),組合成“吃芒果”,此時(shí)“芒果”作為賓語,起到限制“吃”的對(duì)象的語義控制作用,因此,對(duì)于本候選答案來說,“芒果”是與“吃”存在語義關(guān)聯(lián)的第一目標(biāo)信息。在步驟s1413中,將所述第一目標(biāo)信息插入到候選答案的語義關(guān)聯(lián)位置,得到包含語義受控候選答案的第三答案集。本實(shí)施例中,根據(jù)步驟s1412中確定的第一目標(biāo)信息,以及第一目標(biāo)信息與語義信息之間的關(guān)聯(lián)關(guān)系,將第一目標(biāo)信息插入到候選答案中對(duì)應(yīng)的語義關(guān)聯(lián)位置,使第一目標(biāo)信息起到對(duì)語義信息的語義控制作用,形成語義受控的候選答案,所有語義受控的候選答案構(gòu)成了第三答案集。示例地,本實(shí)施例在執(zhí)行步驟s1413時(shí),具體插入結(jié)果如下:(其中:帶有下劃線的加粗字體為插入的第一目標(biāo)信息)本實(shí)施例中,將第一目標(biāo)信息插入到候選答案中對(duì)應(yīng)的語義關(guān)聯(lián)位置,實(shí)現(xiàn)對(duì)候選答案的語義限制處理,由于第一目標(biāo)信息來自于問題,因此在“替換”后,第一目標(biāo)信息作為候選答案中的句法成分,與問題建立了語義關(guān)聯(lián)。在步驟s150中,從第三答案集中選擇一個(gè)候選答案作為問題答案。參見圖4,本實(shí)施例中,步驟s150具體包括以下步驟:在步驟s151中,在第三答案集中,對(duì)每個(gè)候選答案分別與其他候選答案計(jì)算相似度。參見圖5,本實(shí)施例中,步驟s151由以下步驟組成:在步驟s1511中,對(duì)第三答案集中的候選答案進(jìn)行分詞,并對(duì)分詞結(jié)果做去重處理,得到包含候選答案中全部分詞的詞袋模型。示例地,本市實(shí)施例中,對(duì)第三答案集中的候選答案分詞的結(jié)果為:云南/芒果/不錯(cuò)/哦我/很/喜歡/芒果我/吃/過/芒果我們/去/吃/芒果/啊其中,重復(fù)的分詞為:我、吃;因此對(duì)分詞結(jié)果做去重處理后得到的詞袋模型為:{云南芒果不錯(cuò)哦我很喜歡吃過我們?nèi)グ在步驟s1512中,根據(jù)候選答案的分詞在詞袋模型中出現(xiàn)的次數(shù),對(duì)每個(gè)候選答案生成詞頻向量。由于,本實(shí)施例步驟s1511得到的詞袋模型中,分詞的數(shù)量為12個(gè),因此,在步驟s1512中,詞頻向量為12維向量,每一維代表詞袋模型中的一個(gè)分詞。示例地,本實(shí)例定義候選答案的分詞每在詞袋模型中出現(xiàn)1次,詞頻為1,由此得出第三答案集中候選答案的詞頻向量為:候選答案詞頻向量云南芒果不錯(cuò)哦v1=[1,1,1,1,0,0,0,0,0,0,0,0]我很喜歡芒果v2=[0,1,0,0,1,1,1,0,0,0,0,0]我吃過芒果v3=[0,1,0,0,1,0,0,1,1,0,0,0]我們?nèi)コ悦⒐4=[0,1,0,0,0,0,0,1,0,1,1,1]在步驟s1513中,對(duì)每個(gè)詞頻向量分別與其他詞頻向量計(jì)算夾角余弦值,將余弦值計(jì)算結(jié)果作為相似度。示例地,根據(jù)向量夾角余弦計(jì)算公式,本實(shí)施例中的詞頻向量夾角余弦值為:cos(v1,v2)=0.25cos(v1,v3)=0.25cos(v1,v4)=0.224cos(v2,v3)=0.5cos(v2,v4)=0.224cos(v3,v4)=0.447在計(jì)算過程中,由于cos(vn,vm)與cos(vm,vn)的值相同(m和n表示第m個(gè)向量和第n個(gè)向量),意義也相同,因此,本實(shí)施例省略了意義相同的夾角余弦值計(jì)算步驟,例如cos(v1,v4)與cos(v4,v1)意義相同,本實(shí)施例中僅計(jì)算cos(v1,v4)的值,以較少計(jì)算量。在步驟s152中,根據(jù)相似度計(jì)算結(jié)果,得到每個(gè)候選答案與其他候選答案的平均相似度。示例地,以候選答案“云南芒果不錯(cuò)哦”為例,該候選答案與其他候選答案的相似度分別為:cos(v1,v2)=0.25,cos(v1,v3)=0.25,cos(v1,v4)=0.224。因此,候選答案“云南芒果不錯(cuò)哦”與其他候選答案的平均相似度為:ave1=(0.25+0.25+0.224)÷3=0.241依次地,得到每個(gè)候選答案與其他候選答案的平均相似度,如下表:候選答案與其他候選答案的平均相似度云南芒果不錯(cuò)哦ave1=0.241我很喜歡芒果ave2=0.325我吃過芒果ave3=0.399我們?nèi)コ悦⒐ve4=0.298在步驟s153中,選擇最高平均相似度對(duì)應(yīng)的候選答案作為問題答案。示例地,在本實(shí)施例中,最高的平均相似度為ave3=0.399,該最高的相似度對(duì)應(yīng)的候選答案為“我吃過芒果”,因此將“我吃過芒果”作為問題答案。本實(shí)施例中,如果最高的平均相似度對(duì)應(yīng)多個(gè)候選答案,即多個(gè)候選答案的平均相似度相同且數(shù)值最高,則在步驟s153中,還可以包括步驟s1531。在步驟s1531中,如果最高的平均相似度對(duì)應(yīng)多個(gè)候選答案,則從中任意選擇一個(gè)候選答案,作為問題答案。本發(fā)明實(shí)施例提供的一種語義受控的答案生成方法,對(duì)于用戶提出的問題,首先,獲取問題的候選答案,提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息;其次,對(duì)問題的候選答案進(jìn)行句法分析;然后,根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)候選答案進(jìn)行語義限制處理,得到語義受控的候選答案,最后,從候選答案中產(chǎn)生與問題具有語義關(guān)聯(lián)的問題答案。實(shí)現(xiàn)了對(duì)現(xiàn)有技術(shù)的seq2seq模型生成的答案進(jìn)行語義控制,解決了seq2seq模型生成的答案與問題無語義關(guān)聯(lián)的問題。實(shí)施例二本發(fā)明實(shí)施例提供了一種語義受控的答案生成方法。圖2為本發(fā)明實(shí)施例提供的一種語義受控的答案生成方法的流程圖,如圖2所示,所述方法可以包括以下步驟:在步驟s110中,獲取問題的第一答案集,所述第一答案集包括問題對(duì)應(yīng)的至少一個(gè)候選答案。本實(shí)施例中,使用與實(shí)施例一中相同的方法生成第一答案集。示例地,將問題“我吃過芒果”輸入到seq2seq模型中,seq2seq模型返回的五個(gè)候選答案組成的第一答案集為:你也吃過水果我沒吃過香蕉我買過水果你沒見過芒果吃啊在步驟s120中,提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息。示例地,本實(shí)施例步驟s110中的問題“我吃過芒果”,結(jié)構(gòu)化的語義表示為:inform(person=我,foodtype=芒果),因此,本實(shí)施例中提取的語義限制信息為:我,芒果。在步驟s130中,對(duì)第一答案集中的全部候選答案進(jìn)行句法分析,得到包含句法分析結(jié)果的第二答案集。本實(shí)施例中,步驟s130的一種實(shí)現(xiàn)方法為:對(duì)第一答案集中的全部候選答案進(jìn)行句法分析,根據(jù)句法分析結(jié)果,去除無效答案,得到第二答案集,所述無效答案包括句法成分缺失的候選答案和句法成分冗余的候選答案。本實(shí)施例采用與實(shí)施例一相同的依存句法分析方法對(duì)第一答案集中全部的候選答案進(jìn)行句法分析,分析結(jié)果為:候選答案句法成分分析結(jié)果你也吃過水果你(主語)、吃過(謂語)、水果(賓語)主謂賓我沒吃過香蕉我(主語)、沒吃過(謂語)、香蕉(賓語)主謂賓我買過水果我(主語)、買過(謂語)、水果(賓語)主謂賓你沒見過芒果你(主語)、沒見過(謂語)、芒果(賓語)主謂賓吃啊吃啊(謂語)謂本實(shí)施例中,候選答案“吃啊”的句法分析結(jié)果為“謂”,即該候選答案中只有謂語,屬于句法成分缺失,屬于無效答案,因此在步驟s130中,此候選答案被去除,最終得到的第二答案集為:你也吃過水果我沒吃過香蕉我買過水果你沒見過芒果需要說明的是,本實(shí)施例中,與第一答案集相比,在步驟s130中得到的第二答案集,包括了第二答案集中每個(gè)候選答案的句法分析結(jié)果。在步驟s140中,根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)第二答案集中的候選答案進(jìn)行語義限制處理,得到包含語義受控候選答案的第三答案集;與實(shí)施例一不同,參見圖6,為本發(fā)明實(shí)施例提供的另一種語義受控的答案生成方法步驟s140的流程圖,包括以下步驟:在步驟s1421中,根據(jù)句法分析結(jié)果,確定每個(gè)候選答案的句法成分中包含的語義信息。本實(shí)施例中,可以通過步驟s130中的依存句法分析結(jié)果,確定語義信息。示例地,每個(gè)候選答案的句法成分中包含的語義信息的結(jié)果為:候選答案語義信息你也吃過水果你(主語,人稱代詞)吃過(謂語,狀態(tài))水果(賓語,食物)我沒吃過香蕉我(主語,人稱代詞)吃過(謂語,狀態(tài))香蕉(賓語,食物)我買過水果我(主語,人稱代詞)買過(謂語,狀態(tài))水果(賓語,食物)你沒見過芒果你(主語,人稱代詞)沒見過(謂語,狀態(tài))芒果(賓語,食物)在步驟s1422中,在語義限制信息中,查找與語義信息句法成分相同的第二目標(biāo)信息。本實(shí)施例中,句法成分相同是指語義信息和語義限制信息可以在語句中作為相同的句法成分出現(xiàn)。示例地,對(duì)于本實(shí)施例而言,語義限制信息已經(jīng)在步驟s120中提取到,包括(括號(hào)中是對(duì)語義限制信息的注釋信息):我(人稱代詞),芒果(食物)對(duì)于第二答案集中的每個(gè)候選答案,在語義限制信息中,查找第二目標(biāo)信息的具體過程為:a.候選答案:你也吃過水果“你”在本候選答案中為主語,是人稱代詞,而語義限制信息中的“我”也是人稱代詞,也可以作為主語,因此,二者的句法成分相同,語義限制信息中的“我”能起到對(duì)候選答案主語的語義控制作用;此外,“水果”在本候選答案中為賓語,表示一類食物,語義限制信息中的“芒果”屬于“水果”,也可以作為賓語,因此,二者的句法成分相同,語義限制信息中的“芒果”對(duì)“水果”做出限制,具有語義控制作用,因此,對(duì)于本候選答案來說,“我”是與“你”句法成分相同的第二目標(biāo)信息,“芒果”是與“水果”句法成分相同的第二目標(biāo)信息。b.候選答案:我沒吃過香蕉“香蕉”在本候選答案中為賓語,表示一種食物,語義限制信息中的“芒果”也是一種食物,也可以作為賓語,因此,二者的句法成分相同,語義限制信息中的“芒果”能起到對(duì)候選答案賓語的語義控制作用,因此,對(duì)于本候選答案來說,“芒果”是與“香蕉”句法成分相同的第二目標(biāo)信息。c.候選答案:我買過水果“水果”在本候選答案中為賓語,表示一類食物,語義限制信息中的“芒果”屬于“水果”,也可以作為賓語,因此,二者的句法成分相同,語義限制信息中的“芒果”對(duì)“水果”做出限制,具有語義控制作用,因此,對(duì)于本候選答案來說,“芒果”是與“水果”句法成分相同的第二目標(biāo)信息。d.候選答案:你沒見過芒果“你”在本候選答案中為主語,是人稱代詞,而語義限制信息中的“我”也是人稱代詞,也可以作為主語,因此,二者的句法成分相同,語義限制信息中的“我”能起到對(duì)候選答案主語的語義控制作用,因此,對(duì)于本候選答案來說,“我”是與“你”句法成分相同的第二目標(biāo)信息。在步驟s1423中,用第二目標(biāo)信息替換具有相同句法成分的語義信息,得到包含語義受控候選答案的第三答案集。本實(shí)施例中,根據(jù)步驟s1422中確定的第二目標(biāo)信息,用第二目標(biāo)信息替換掉候選答案中與其具有相同句法成分的語義信息,使第二目標(biāo)信息起到對(duì)候選答案的語義控制作用,形成語義受控的候選答案,所有語義受控的候選答案構(gòu)成了第三答案集。示例地,本實(shí)施例在執(zhí)行步驟s1423時(shí),具體插入結(jié)果如下:(其中:帶有下劃線的加粗字體為替換的第二目標(biāo)信息)本實(shí)施例中,用第二目標(biāo)信息替換掉候選答案中與其具有相同句法成分的語義信息,實(shí)現(xiàn)對(duì)候選答案的語義限制處理,由于第二目標(biāo)信息來自于問題,因此在“替換”后,第二目標(biāo)信息作為候選答案中的句法成分,與問題建立了語義關(guān)聯(lián)。在步驟s150中,從第三答案集中選擇一個(gè)候選答案作為問題答案。本實(shí)施例中,步驟s150中的步驟s151與實(shí)施例一有所不同,參見圖7,為本發(fā)明實(shí)施例提供的另一種語義受控的答案生成方法步驟s151的流程圖,不同之處在于,本實(shí)施例中在步驟s1512之前,添加了步驟s1514。在步驟s1514中,根據(jù)詞袋模型中分詞的句法成分,設(shè)置每個(gè)分詞的詞頻權(quán)重值。示例地,本實(shí)施例在步驟s1511中得到的詞袋模型為:{我也吃過買過芒果沒見過}本實(shí)施例的步驟s1514,根據(jù)詞袋模型中的分詞在候選答案中的句法成分不同,對(duì)每個(gè)分詞設(shè)置不同的詞頻權(quán)重。本實(shí)施例中,對(duì)可以在句法成分中做主語和賓語的分詞設(shè)置了較高的詞頻權(quán)重,由此得到的每個(gè)分詞的詞頻權(quán)重的結(jié)果為:分詞詞頻權(quán)重我1.2也1吃過1買過1芒果1.2沒1見過1本實(shí)施例中,由于對(duì)分詞設(shè)置了詞頻權(quán)重,在生成詞頻向量時(shí),每個(gè)分詞對(duì)應(yīng)的詞頻向量的標(biāo)量值為:標(biāo)量值=詞頻權(quán)重×分詞出現(xiàn)次數(shù)在步驟s1512中,根據(jù)候選答案的分詞在詞袋模型中出現(xiàn)的次數(shù),對(duì)每個(gè)候選答案生成詞頻向量。由于,本實(shí)施例步驟s1511得到的詞袋模型中,分詞的數(shù)量為7個(gè),因此,在步驟s1512中,詞頻向量為7維向量,每一維代表詞袋模型中的一個(gè)分詞。示例地,按照步驟s1514中的詞頻向量的標(biāo)量值計(jì)算公式,如果詞袋模型中的分詞“我”在語句中出現(xiàn)1次,其詞頻為1.2×1=1.2,出現(xiàn)2次,其詞頻為1.2×2=2.4,依次類推;其他分詞計(jì)算詞頻方法相同,由此得出第三答案集中候選答案的詞頻向量為:候選答案詞頻向量我也吃過芒果u1=[1.2,1,1,0,1.2,0,0]我沒吃過芒果u2=[1.2,0,1,0,1.2,1,0]我買過芒果u3=[1.2,0,0,1,1.2,0,0]我沒見過芒果u4=[1.2,0,0,0,1.2,1,1]本實(shí)施例中,步驟s1513、步驟s152和步驟s153與實(shí)施例一相同。示例地,步驟s1513得到的詞頻向量夾角余弦值為:cos(u1,u2)=0.795cos(u1,u3)=0.662cos(u1,u4)=0.59cos(u2,u3)=0.662cos(u2,u4)=0.795cos(u3,u4)=0.662示例地,步驟s152得到的每個(gè)候選答案與其他候選答案的平均相似度,如下表:候選答案與其他候選答案的平均相似度我也吃過芒果ave5=0.682我沒吃過芒果ave6=0.751我買過芒果ave7=0.662我沒見過芒果ave8=0.682示例地,在本實(shí)施例中,最高的平均相似度為ave6=0.751,所以,本實(shí)施例在步驟s153中將“我沒吃過芒果”作為問題答案。本實(shí)施例中,如果最高的平均相似度對(duì)應(yīng)多個(gè)候選答案,即多個(gè)候選答案的平均相似度相同且數(shù)值最高,則在步驟s153中,還可以包括步驟s1531。在步驟s1531中,如果最高的平均相似度對(duì)應(yīng)多個(gè)候選答案,則從中任意選擇一個(gè)候選答案,作為問題答案。本實(shí)施例提供的一種語義受控的答案生成方法,對(duì)于用戶提出的問題,首先,獲取問題的候選答案,提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息;其次,對(duì)問題的候選答案進(jìn)行句法分析;然后,根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)候選答案進(jìn)行語義限制處理,得到語義受控的候選答案,最后,從候選答案中產(chǎn)生與問題具有語義關(guān)聯(lián)的問題答案。實(shí)現(xiàn)了對(duì)現(xiàn)有技術(shù)的seq2seq模型生成的答案進(jìn)行語義控制,解決了seq2seq模型生成的答案與問題無語義關(guān)聯(lián)的問題。實(shí)施例三本發(fā)明實(shí)施例提供了一種語義受控的答案生成方法,參見圖2,為本發(fā)明實(shí)施例提供的一種語義受控的答案生成方法的流程圖。本發(fā)明實(shí)施例與實(shí)施例一和實(shí)施例二的區(qū)別在于,步驟s140中包括的具體步驟不同。由于,本實(shí)施例中的步驟s110-步驟s130與實(shí)施例一、實(shí)施例二相同,本實(shí)施例對(duì)步驟s110-步驟s130不做詳述,僅給出示例。示例地,在步驟s110中,將問題“我想吃云南的芒果”輸入到seq2seq模型中,可能會(huì)得到以下第一答案集:我也想吃,我芒果不錯(cuò)哦我很喜歡我吃過水果你沒見過芒果示例地,本實(shí)施例在步驟s120中,提取的語義限制信息的提取結(jié)果為:我,云南,芒果。示例地,本實(shí)施例在步驟s130中,對(duì)第一答案集中的候選答案使用依存句法分析的結(jié)果為:候選答案句法成分分析結(jié)果我也想吃,我我(主語)、吃(謂語)主謂,主芒果不錯(cuò)哦芒果(主語)、不錯(cuò)(謂語)主謂我很喜歡我(主語)、喜歡(謂語)主謂我吃過水果我(主語)、吃過(謂語)、水果(賓語)主謂賓你沒見過芒果你(主語)、沒見過(謂語)、芒果(賓語)主謂賓因此,在步驟130中,去除無效答案,最終得到的第二答案集為:芒果不錯(cuò)哦我很喜歡我吃過水果你沒見過芒果在步驟s140中,根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)第二答案集中的候選答案進(jìn)行語義限制處理,得到包含語義受控候選答案的第三答案集。本實(shí)施例的步驟s140中包含的具體步驟與實(shí)施例一和實(shí)施例二不同,參見圖8,為本發(fā)明實(shí)施例提供的又一種語義受控的答案生成方法步驟s140的流程圖,本實(shí)施例的步驟s140包括:在步驟s1431中,根據(jù)句法分析結(jié)果,確定每個(gè)候選答案的句法成分中包含的語義信息。本實(shí)施例中,可以通過步驟s130中的依存句法分析,確定語義信息。示例地,每個(gè)候選答案的句法成分中包含的語義信息的結(jié)果為:候選答案語義信息芒果不錯(cuò)哦芒果(主語,食物)不錯(cuò)(謂語,狀態(tài))我很喜歡我(主語,人稱代詞)喜歡(謂語,狀態(tài))我吃過水果我(主語,人稱代詞)吃過(謂語,狀態(tài))水果(賓語,食物)你沒見過芒果你(主語,人稱代詞)沒見過(謂語,狀態(tài))芒果(賓語,食物)在步驟s1432中,在語義限制信息中,查找與語義信息存在語義關(guān)聯(lián)的第一目標(biāo)信息,以及,查找與語義信息句法成分相同的第二目標(biāo)信息。本實(shí)施例中,語義關(guān)聯(lián)是指語義信息和語義限制信息根據(jù)句法關(guān)系組合能形成符合邏輯的語義,句法成分相同是指語義信息和語義限制信息可以在語句中作為相同的句法成分出現(xiàn)。示例地,對(duì)于本實(shí)施例而言,語義限制信息已經(jīng)在步驟s120中提取到,包括(括號(hào)中是對(duì)語義限制信息的注釋信息):我(人稱代詞),云南(地點(diǎn)),芒果(食物)對(duì)于第二答案集中的每個(gè)候選答案,在語義限制信息中,查找第一目標(biāo)信息和第二目標(biāo)信息的具體過程為:a.候選答案:芒果不錯(cuò)哦“芒果”在本候選答案中為主語,且“芒果”為一種食物;語義限制信息中的“云南”為地點(diǎn),“云南”和“芒果”可以構(gòu)成語義關(guān)聯(lián),組合成“云南芒果”,此時(shí)“云南”作為“芒果”狀語,起到限制“芒果”產(chǎn)地的語義控制作用,因此,對(duì)于本候選答案來說,“云南”是與“芒果”存在語義關(guān)聯(lián)的第一目標(biāo)信息。b.候選答案:我很喜歡“喜歡”在本候選答案中為謂語,表示主語“我”表達(dá)出的一種狀態(tài);語義限制信息中的“芒果”為食物,“喜歡”和“芒果”可以構(gòu)成語義關(guān)聯(lián),組合成“喜歡芒果”,此時(shí)“芒果”作為賓語,起到限制“喜歡”的對(duì)象的語義控制作用,因此,對(duì)于本候選答案來說,“芒果”是與“喜歡”存在語義關(guān)聯(lián)的第一目標(biāo)信息。c.候選答案:我吃過水果“水果”在本候選答案中為賓語,表示一類食物,語義限制信息中的“芒果”屬于“水果”,也可以作為賓語,因此,二者的句法成分相同,語義限制信息中的“芒果”對(duì)“水果”做出限制,具有語義控制作用,因此,對(duì)于本候選答案來說,“芒果”是與“水果”句法成分相同的第二目標(biāo)信息。此外,語義限制信息中的“云南”為地點(diǎn),能夠與“水果”或“芒果”形成語義關(guān)聯(lián),此時(shí)“云南”作為“水果”或“芒果”的狀語,起到限制“水果”或“芒果”產(chǎn)地的語義控制作用,因此,對(duì)于本候選答案來說,“云南”是與“水果”或“芒果”存在語義關(guān)聯(lián)的第一目標(biāo)信息。d.候選答案:你沒見過芒果“你”在本候選答案中為主語,是人稱代詞,而語義限制信息中的“我”也是人稱代詞,也可以作為主語,因此,二者的句法成分相同,語義限制信息中的“我”能起到對(duì)候選答案主語的語義控制作用,因此,對(duì)于本候選答案來說,“我”是與“你”句法成分相同的第二目標(biāo)信息。此外,語義限制信息中的“云南”為地點(diǎn),能夠與“芒果”形成語義關(guān)聯(lián),此時(shí)“云南”作為“芒果”的狀語,起到限制“芒果”產(chǎn)地的語義控制作用,因此,對(duì)于本候選答案來說,“云南”是與“芒果”存在語義關(guān)聯(lián)的第一目標(biāo)信息。在步驟s1433中,將第一目標(biāo)信息插入到候選答案的語義關(guān)聯(lián)位置,以及,用第二目標(biāo)信息替換具有相同句法成分的語義信息,得到包含語義受控候選答案的第三答案集。本實(shí)施例中,根據(jù)步驟s1432中確定的第一目標(biāo)信息和第二目標(biāo)信息,將第一目標(biāo)信息插入到候選答案中對(duì)應(yīng)的語義關(guān)聯(lián)位置,并用第二目標(biāo)信息替換掉候選答案中與其具有相同句法成分的語義信息,使第一目標(biāo)信息和第二目標(biāo)信息起到對(duì)候選答案的語義控制作用,形成語義受控的候選答案,所有語義受控的候選答案構(gòu)成了第三答案集。示例地,本實(shí)施例在執(zhí)行步驟s1433時(shí),具體插入和替換結(jié)果如下:(其中:帶有下劃線的加粗字體為插入的第一目標(biāo)信息,不帶下劃線的加粗字體為替換的第二目標(biāo)信息)本實(shí)施例中的步驟s140,對(duì)候選答案進(jìn)行語義限制處理時(shí),同時(shí)使用第一目標(biāo)信息插入到候選答案的語義關(guān)聯(lián)位置的方法,以及,用第二目標(biāo)信息替換具有相同句法成分的語義信息的方法,使本實(shí)施例對(duì)候選答案的語義做到更全面的控制,提高語義限制處理后,候選答案與問題的關(guān)聯(lián)性。本實(shí)例中的步驟s150與實(shí)施例一或?qū)嵤├嗤颂幉辉儋樖?。本發(fā)明實(shí)施例提供的一種語義受控的答案生成方法,對(duì)于用戶提出的問題,首先,獲取問題的候選答案,提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息;其次,對(duì)問題的候選答案進(jìn)行句法分析;然后,根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)候選答案進(jìn)行語義限制處理,得到語義受控的候選答案,最后,從候選答案中產(chǎn)生與問題具有語義關(guān)聯(lián)的問題答案。實(shí)現(xiàn)了對(duì)現(xiàn)有技術(shù)的seq2seq模型生成的答案進(jìn)行語義控制,解決了seq2seq模型生成的答案與問題無語義關(guān)聯(lián)的問題。本發(fā)明實(shí)施例提供了一種語義受控的答案生成裝置,圖9為本發(fā)明實(shí)施例提供的一種語義受控的答案生成裝置框圖。如圖9所示,所述裝置包括:獲取模塊210,用于獲取問題的第一答案集,所述第一答案集包括問題對(duì)應(yīng)的至少一個(gè)候選答案;結(jié)構(gòu)化分析模塊220,用于提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息;句法分析模塊230,對(duì)第一答案集中的全部候選答案進(jìn)行句法分析,得到包含句法分析結(jié)果的第二答案集;語義控制模塊240,用于根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)第二答案集中的候選答案進(jìn)行語義限制處理,得到包含語義受控候選答案的第三答案集;答案生成模塊250,用于從第三答案集中選擇一個(gè)候選答案作為問題答案。本發(fā)明實(shí)施例提供的一種語義受控的答案生成裝置,能夠?qū)τ脩籼岢龅膯栴},首先,獲取問題的候選答案,提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息;其次,對(duì)問題的候選答案進(jìn)行句法分析;然后,根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)候選答案進(jìn)行語義限制處理,得到語義受控的候選答案,最后,從候選答案中產(chǎn)生與問題具有語義關(guān)聯(lián)的問題答案。實(shí)現(xiàn)了對(duì)現(xiàn)有技術(shù)的seq2seq模型生成的答案進(jìn)行語義控制,解決了seq2seq模型生成的答案與問題無語義關(guān)聯(lián)的問題。本發(fā)明實(shí)施例提供了一種語義受控的答案生成系統(tǒng),圖10是本發(fā)明實(shí)施例提供的一種語義受控的答案生成系統(tǒng)的示意圖,如圖10所示,所述系統(tǒng)包括:用戶終端310和服務(wù)器320;所述用戶終端310,用于接收問題,并發(fā)送問題到服務(wù)器320,以及,從服務(wù)器320接收問題答案;所述服務(wù)器320包括處理器321和存儲(chǔ)器322;所述存儲(chǔ)器322用于存儲(chǔ)處理器321可執(zhí)行的程序;所述處理器321被配置為:獲取問題的第一答案集,所述第一答案集包括問題對(duì)應(yīng)的至少一個(gè)候選答案;提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息;對(duì)第一答案集中的全部候選答案進(jìn)行句法分析,得到包含句法分析結(jié)果的第二答案集;根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)第二答案集中的候選答案進(jìn)行語義限制處理,得到包含語義受控候選答案的第三答案集;從第三答案集中選擇一個(gè)候選答案作為問題答案。本發(fā)明實(shí)施例提供的一種語義受控的答案生成系統(tǒng),能夠接收用戶提出的問題,獲取問題的候選答案,提取問題中的結(jié)構(gòu)化信息,所述結(jié)構(gòu)化信息至少包括語義限制信息;其次,對(duì)問題的候選答案進(jìn)行句法分析;然后,根據(jù)句法分析結(jié)果,利用語義限制信息對(duì)候選答案進(jìn)行語義限制處理,得到語義受控的候選答案,最后,從候選答案中產(chǎn)生與問題具有語義關(guān)聯(lián)的問題答案。實(shí)現(xiàn)了對(duì)現(xiàn)有技術(shù)的seq2seq模型生成的答案進(jìn)行語義控制,解決了seq2seq模型生成的答案與問題無語義關(guān)聯(lián)的問題。本發(fā)明可用于眾多通用或?qū)S玫挠?jì)算系統(tǒng)環(huán)境或配置中。例如:個(gè)人計(jì)算機(jī)、服務(wù)器計(jì)算機(jī)、手持設(shè)備或便攜式設(shè)備、平板型設(shè)備、多處理器系統(tǒng)、基于微處理器的系統(tǒng)、置頂盒、可編程的消費(fèi)電子設(shè)備、網(wǎng)絡(luò)pc、小型計(jì)算機(jī)、大型計(jì)算機(jī)、包括以上任何系統(tǒng)或設(shè)備的分布式計(jì)算環(huán)境等等。本發(fā)明可以在由計(jì)算機(jī)執(zhí)行的計(jì)算機(jī)可執(zhí)行指令的一般上下文中描述,例如程序模塊。一般地,程序模塊包括執(zhí)行特定任務(wù)或?qū)崿F(xiàn)特定抽象數(shù)據(jù)類型的例程、程序、對(duì)象、組件、數(shù)據(jù)結(jié)構(gòu)等等。也可以在分布式計(jì)算環(huán)境中實(shí)踐本發(fā)明,在這些分布式計(jì)算環(huán)境中,由通過通信網(wǎng)絡(luò)而被連接的遠(yuǎn)程處理設(shè)備來執(zhí)行任務(wù)。在分布式計(jì)算環(huán)境中,程序模塊可以位于包括存儲(chǔ)設(shè)備在內(nèi)的本地和遠(yuǎn)程計(jì)算機(jī)存儲(chǔ)介質(zhì)中。需要說明的是,在本文中,諸如“第一”和“第二”等之類的關(guān)系術(shù)語僅僅用來將一個(gè)實(shí)體或者操作與另一個(gè)實(shí)體或操作區(qū)分開來,而不一定要求或者暗示這些實(shí)體或操作之間存在任何這種實(shí)際的關(guān)系或者順序。而且,術(shù)語“包括”、“包含”或者其任何其他變體意在涵蓋非排他性的包含,從而使得包括一系列要素的過程、方法、物品或者設(shè)備不僅包括那些要素,而且還包括沒有明確列出的其他要素,或者是還包括為這種過程、方法、物品或者設(shè)備所固有的要素。本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后,將容易想到本發(fā)明的其它實(shí)施方案。本發(fā)明旨在涵蓋本發(fā)明的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本發(fā)明的一般性原理并包括本發(fā)明未公開的本
技術(shù)領(lǐng)域:
中的公知常識(shí)或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本發(fā)明的真正范圍和精神由下面的權(quán)利要求指出。應(yīng)當(dāng)理解的是,本發(fā)明并不局限于上面已經(jīng)描述并在附圖中示出的精確結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本發(fā)明的范圍僅由所附的權(quán)利要求來限制。當(dāng)前第1頁12