本發(fā)明涉及車輛領(lǐng)域,具體地,涉及一種用于車輛的問(wèn)答裝置及方法。
背景技術(shù):
問(wèn)答系統(tǒng)是自然語(yǔ)言分析和機(jī)器學(xué)習(xí)相結(jié)合的一門人工智能應(yīng)用,比如微軟的小冰機(jī)器人、iphone的siri、京東的jimi客服機(jī)器人、百度的度秘等,這些問(wèn)答系統(tǒng)在不同的領(lǐng)域均獲得了一定成果。
問(wèn)答系統(tǒng)按照使用場(chǎng)景劃分,可以分為開(kāi)放領(lǐng)域場(chǎng)景和限定領(lǐng)域場(chǎng)景,小冰、siri、度秘等,屬于開(kāi)放領(lǐng)域問(wèn)答系統(tǒng),即對(duì)問(wèn)答的內(nèi)容沒(méi)有做場(chǎng)景限制,京東的jimi屬于限定領(lǐng)域機(jī)器人,僅限定在京東的客戶服務(wù),對(duì)其他領(lǐng)域問(wèn)題不能做出友好的回答。目前,開(kāi)放領(lǐng)域的問(wèn)答系統(tǒng)相比限定領(lǐng)域?qū)崿F(xiàn)更困難,尤其是在數(shù)據(jù)不充分的情況下。
傳統(tǒng)問(wèn)答系統(tǒng)使用的主要技術(shù)包括:分詞、詞性標(biāo)注、實(shí)體識(shí)別、句法分析、語(yǔ)義分析、關(guān)鍵詞提取、相似度計(jì)算、問(wèn)題分類、問(wèn)題意圖分析、問(wèn)題檢索、答案生成等。這類技術(shù)下的問(wèn)答系統(tǒng),多以faq問(wèn)答模式為主,即以問(wèn)題相似度計(jì)算為核心,檢索出相似問(wèn)題,然后返回給用戶答案。
隨著google推出知識(shí)圖譜概念,基于知識(shí)圖譜的精準(zhǔn)問(wèn)答得到廣泛關(guān)注,也是近些年各大科技公司的主要研究熱點(diǎn)。基于知識(shí)圖譜的智能問(wèn)答系統(tǒng),主要技術(shù)包括:語(yǔ)義解析、圖譜的構(gòu)建、實(shí)體對(duì)齊、實(shí)體鏈接、關(guān)系抽取、圖譜推理等。
深度學(xué)習(xí)是目前機(jī)器學(xué)習(xí)領(lǐng)域里非常受關(guān)注的一門技術(shù),相比傳統(tǒng)的機(jī)器學(xué)習(xí)方法,它的效果更精準(zhǔn),在問(wèn)答系統(tǒng)中越來(lái)越受到青睞。京東的jimi客服機(jī)器人就應(yīng)用了深度學(xué)習(xí)技術(shù),取得了很不錯(cuò)的效果。當(dāng)然,它的學(xué)習(xí)技術(shù)更困難,需要更多的訓(xùn)練語(yǔ)料和基礎(chǔ)設(shè)備做支撐。
每一個(gè)行業(yè)都有自身的特點(diǎn),開(kāi)放領(lǐng)域的問(wèn)答技術(shù),并不能完全適用于汽車領(lǐng)域的問(wèn)題解決方法。目前,科技公司、科研院所更關(guān)注的是開(kāi)放領(lǐng)域的問(wèn)答系統(tǒng)技術(shù)研究,這類技術(shù)不能夠直接應(yīng)用到具體的垂直領(lǐng)域,例如,不能應(yīng)用于汽車領(lǐng)域,即使應(yīng)用到汽車領(lǐng)域,其效果無(wú)法滿足市場(chǎng)的需求。因?yàn)椋洪_(kāi)放領(lǐng)域的知識(shí)庫(kù)組織方式與汽車領(lǐng)域的組織方式和方法不同,無(wú)法得到復(fù)制遷移;針對(duì)汽車行業(yè)的具體業(yè)務(wù),需要定制化數(shù)據(jù)梳理流程、問(wèn)答系統(tǒng)架構(gòu)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明實(shí)施例的目的是提供一種用于車輛的問(wèn)答裝置及方法,用于解決或至少部分解決上述技術(shù)問(wèn)題。
為了實(shí)現(xiàn)上述目的,本發(fā)明實(shí)施例提供一種用于車輛的問(wèn)答裝置,該裝置包括:接收模塊,用于接收用戶提出的問(wèn)題;應(yīng)用場(chǎng)景分類模塊,用于對(duì)所述用戶提出的問(wèn)題進(jìn)行應(yīng)用場(chǎng)景分類,所分類的應(yīng)用場(chǎng)景包括以下中的一者或多者:故障類、常識(shí)類、手冊(cè)類、購(gòu)車類、保險(xiǎn)類;語(yǔ)義理解模塊,用于根據(jù)所分類的應(yīng)用場(chǎng)景對(duì)所述用戶提出的問(wèn)題進(jìn)行語(yǔ)義識(shí)別以獲得特征信息;答案確定模塊,用于根據(jù)所述特征信息確定所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案;以及答案輸出模塊,用于輸出所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案。
可選地,所述裝置還包括:意圖分類模塊,用于判斷所述用戶提出的問(wèn)題是否與車輛相關(guān),所述應(yīng)用場(chǎng)景分類模塊用于在所述用戶提出的問(wèn)題與車輛相關(guān)的情況下,對(duì)所述用戶提出的問(wèn)題進(jìn)行所述應(yīng)用場(chǎng)景分類。
可選地,所述應(yīng)用場(chǎng)景分類模塊用于使用分類模型對(duì)所述用戶提出的問(wèn)題進(jìn)行應(yīng)用場(chǎng)景分類,所述分類模型包括以下中的一者或多者:故障分類模型、常識(shí)分類模型、手冊(cè)分類模型、購(gòu)車分類模型、保險(xiǎn)分類模型。
可選地,所述答案確定模塊包括:匹配單元,用于根據(jù)所述特征信息從數(shù)據(jù)庫(kù)中確定與所述用戶提出的問(wèn)題相匹配的問(wèn)題,所述數(shù)據(jù)庫(kù)包括一個(gè)或多個(gè)問(wèn)題以及該一個(gè)或多個(gè)問(wèn)題中的每一個(gè)問(wèn)題所對(duì)應(yīng)的答案;以及檢索單元,用于從所述數(shù)據(jù)庫(kù)中檢索出與所述用戶提出的問(wèn)題相匹配的問(wèn)題所對(duì)應(yīng)的答案。
可選地,所述裝置還包括:對(duì)話管理模塊,用于:在所述匹配單元沒(méi)有從數(shù)據(jù)庫(kù)中確定出與所述用戶提出的問(wèn)題相匹配的問(wèn)題的情況下,向所述用戶發(fā)出提問(wèn);在接收到用戶反饋之后,對(duì)所述用戶所反饋的信息和所述用戶提出的問(wèn)題執(zhí)行信息合并。
可選地,在所分類的應(yīng)用場(chǎng)景為故障類的情況下,所述特征信息至少包括故障部件名稱和故障現(xiàn)象;所述答案確定模塊用于根據(jù)存儲(chǔ)的故障規(guī)則對(duì)所獲得的特征信息進(jìn)行推理來(lái)獲得所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案,所述故障規(guī)則包括故障前提和故障結(jié)論。
可選地,所述裝置還包括:抽取模塊,用于從關(guān)數(shù)據(jù)庫(kù)中抽取出所述故障規(guī)則,所述數(shù)據(jù)庫(kù)至少包括一個(gè)或多個(gè)故障現(xiàn)象以及與該一個(gè)或多個(gè)故障現(xiàn)象中的每一個(gè)故障現(xiàn)象所對(duì)應(yīng)的答案,該答案包括故障原因和/或解決方案。
相應(yīng)地,本發(fā)明實(shí)施例還提供一種用于車輛的問(wèn)答方法,所述方法包括:接收用戶提出的問(wèn)題;對(duì)所述用戶提出的問(wèn)題進(jìn)行應(yīng)用場(chǎng)景分類,所分類的應(yīng)用場(chǎng)景包括以下中的一者或多者:故障類、常識(shí)類、手冊(cè)類、購(gòu)車類、保險(xiǎn)類;根據(jù)所分類的應(yīng)用場(chǎng)景對(duì)所述用戶提出的問(wèn)題進(jìn)行語(yǔ)義識(shí)別以獲得特征信息;根據(jù)所述特征信息確定所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案;以及輸出所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案。
可選地,所述方法還包括:判斷所述用戶提出的問(wèn)題是否與車輛相關(guān);在所述用戶提出的問(wèn)題與車輛相關(guān)的情況下,對(duì)所述用戶提出的問(wèn)題進(jìn)行所述應(yīng)用場(chǎng)景分類。
可選地,所述對(duì)所述用戶提出的問(wèn)題進(jìn)行應(yīng)用場(chǎng)景分類包括:使用分類模型對(duì)所述用戶提出的問(wèn)題進(jìn)行應(yīng)用場(chǎng)景分類,所述分類模型包括以下中的一者或多者:故障分類模型、常識(shí)分類模型、手冊(cè)分類模型、購(gòu)車分類模型、保險(xiǎn)分類模型。
可選地,所述根據(jù)所述特征信息確定所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案包括:根據(jù)所述特征信息從數(shù)據(jù)庫(kù)中確定與所述用戶提出的問(wèn)題相匹配的問(wèn)題,所述數(shù)據(jù)庫(kù)包括一個(gè)或多個(gè)問(wèn)題以及該一個(gè)或多個(gè)問(wèn)題中的每一個(gè)問(wèn)題所對(duì)應(yīng)的答案;以及從所述數(shù)據(jù)庫(kù)中檢索出與所述用戶提出的問(wèn)題相匹配的問(wèn)題所對(duì)應(yīng)的答案。
可選地,所述方法還包括:在所述匹配單元沒(méi)有從數(shù)據(jù)庫(kù)中確定出與所述用戶提出的問(wèn)題相匹配的問(wèn)題的情況下,向所述用戶發(fā)出提問(wèn);以及在接收到用戶反饋之后,對(duì)所述用戶所反饋的信息和所述用戶提出的問(wèn)題執(zhí)行信息合并。
可選地,在所分類的應(yīng)用場(chǎng)景為故障類的情況下,所述特征信息至少包括故障部件名稱和故障現(xiàn)象,所述根據(jù)所述特征信息確定所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案包括:根據(jù)存儲(chǔ)的故障規(guī)則對(duì)所獲得的特征信息進(jìn)行推理來(lái)獲得所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案,所述故障規(guī)則包括故障前提和故障結(jié)論。
可選地,通過(guò)以下步驟來(lái)建立所述故障規(guī)則:從數(shù)據(jù)庫(kù)中抽取出所述故障規(guī)則,所述數(shù)據(jù)庫(kù)包括一個(gè)或多個(gè)故障現(xiàn)象以及與該一個(gè)或多個(gè)故障現(xiàn)象中的每一個(gè)故障現(xiàn)象所對(duì)應(yīng)的答案,該答案包括故障原因和/或解決方案。
相應(yīng)地,本發(fā)明實(shí)施例還提供一種機(jī)器可讀存儲(chǔ)介質(zhì),該機(jī)器可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有指令,該指令用于在被機(jī)器執(zhí)行時(shí)使得所述機(jī)器執(zhí)行上述的方法。
通過(guò)上述技術(shù)方案,提供了一種實(shí)用性很強(qiáng)且簡(jiǎn)便易行的汽車問(wèn)答裝置,其解決了以往基于faq問(wèn)答模式準(zhǔn)確度低的問(wèn)題,同時(shí),克服了開(kāi)放領(lǐng)域問(wèn)答系統(tǒng)過(guò)于復(fù)雜、開(kāi)發(fā)周期長(zhǎng)的問(wèn)題。
本發(fā)明實(shí)施例的其它特征和優(yōu)點(diǎn)將在隨后的具體實(shí)施方式部分予以詳細(xì)說(shuō)明。
附圖說(shuō)明
附圖是用來(lái)提供對(duì)本發(fā)明實(shí)施例的進(jìn)一步理解,并且構(gòu)成說(shuō)明書(shū)的一部分,與下面的具體實(shí)施方式一起用于解釋本發(fā)明實(shí)施例,但并不構(gòu)成對(duì)本發(fā)明實(shí)施例的限制。在附圖中:
圖1示出了本發(fā)明一實(shí)施例提供的用于車輛的問(wèn)答裝置的結(jié)構(gòu)框圖;
圖2示出了本發(fā)明又一實(shí)施例提供的用于車輛的問(wèn)答裝置的結(jié)構(gòu)框圖;以及
圖3示出了本發(fā)明一實(shí)施例提供的用于車輛的問(wèn)答方法的流程示意圖。
具體實(shí)施方式
以下結(jié)合附圖對(duì)本發(fā)明實(shí)施例的具體實(shí)施方式進(jìn)行詳細(xì)說(shuō)明。應(yīng)當(dāng)理解的是,此處所描述的具體實(shí)施方式僅用于說(shuō)明和解釋本發(fā)明實(shí)施例,并不用于限制本發(fā)明實(shí)施例。
圖1示出了本發(fā)明一實(shí)施例提供的用于車輛的問(wèn)答裝置的結(jié)構(gòu)框圖。如圖1所示,本發(fā)明實(shí)施例提供一種用于車輛的問(wèn)答裝置,用于為用戶解答關(guān)于車輛的各類問(wèn)題,所述裝置可以包括以下模塊:接收模塊11、應(yīng)用場(chǎng)景分類模塊12、語(yǔ)義理解模塊13、答案確定模塊14、答案輸出模塊15。
具體地,接收模塊11用于接收用戶提出的問(wèn)題。例如,所述接收模塊11可以接收用戶通過(guò)麥克風(fēng)所提出的問(wèn)題。
應(yīng)用場(chǎng)景分類模塊12用于對(duì)所述用戶提出的問(wèn)題進(jìn)行應(yīng)用場(chǎng)景分類,所分類的應(yīng)用場(chǎng)景可以包括以下中的一者或多者:故障類、常識(shí)類、手冊(cè)類、購(gòu)車類、保險(xiǎn)類??梢岳斫猓瑧?yīng)用場(chǎng)景并不局限于這幾類,其分類可以隨著實(shí)際業(yè)務(wù)的增加而增加。
可選地,應(yīng)用場(chǎng)景分類模塊12可以使用分類模型對(duì)所述用戶提出的問(wèn)題進(jìn)行應(yīng)用場(chǎng)景分類,例如,可以通過(guò)標(biāo)注數(shù)據(jù),采用機(jī)器學(xué)習(xí)分類算法進(jìn)行應(yīng)用場(chǎng)景分類。根據(jù)場(chǎng)景種類不同,準(zhǔn)備不同的標(biāo)注數(shù)據(jù),每個(gè)場(chǎng)景一個(gè)分類模型,當(dāng)有新的場(chǎng)景產(chǎn)生時(shí),易于擴(kuò)展。其中標(biāo)注的數(shù)據(jù)格式可以為:標(biāo)注\樣本。
可選地,所使用的機(jī)器學(xué)習(xí)分類算法可以是svm(supportvectormachine,支持向量機(jī))分類算法,在良好的標(biāo)注數(shù)據(jù)下,學(xué)習(xí)的svm分類模型經(jīng)過(guò)實(shí)際使用,分類精度可以達(dá)到98%??梢岳斫猓部梢允褂闷渌诸愃惴▉?lái)進(jìn)行上述分類學(xué)習(xí),例如可以使用決策樹(shù)算法、神經(jīng)網(wǎng)絡(luò)算法、貝葉斯算法、深度學(xué)習(xí)算法等。
對(duì)應(yīng)于上述應(yīng)用場(chǎng)景的分類所述分類模型可以包括以下中的一者或多者:故障分類模型、常識(shí)分類模型、手冊(cè)分類模型、購(gòu)車分類模型、保險(xiǎn)分類模型。
語(yǔ)義理解模塊13用于根據(jù)所分類的應(yīng)用場(chǎng)景對(duì)所述用戶提出的問(wèn)題進(jìn)行語(yǔ)義識(shí)別以獲得特征信息。對(duì)于不同的應(yīng)用場(chǎng)景,數(shù)據(jù)庫(kù)中的存儲(chǔ)格式可能不同,因此針對(duì)不同的應(yīng)用場(chǎng)景,語(yǔ)義理解模塊的具體執(zhí)行過(guò)程可以不同。以故障類應(yīng)用場(chǎng)景為例,當(dāng)用戶提出“冷車啟動(dòng)時(shí),發(fā)動(dòng)機(jī)不易啟動(dòng),怎么回事?”,語(yǔ)義理解模塊會(huì)分析得到如下關(guān)鍵信息:故障發(fā)生的條件“冷車、啟動(dòng)狀態(tài)”,故障發(fā)生的部件“發(fā)動(dòng)機(jī)”,故障現(xiàn)象“不易啟動(dòng)”。再舉一個(gè)例子:“汽車在高速行駛時(shí)候,車身發(fā)飄,是什么原因?”經(jīng)過(guò)語(yǔ)義理解得到,條件是“高速”,現(xiàn)象是“發(fā)飄”。針對(duì)每個(gè)場(chǎng)景,語(yǔ)義理解模塊都結(jié)合了自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、推理等技術(shù)。例如,對(duì)于故障類應(yīng)用場(chǎng)景,可以通過(guò)機(jī)器學(xué)習(xí)分類算法,識(shí)別出故障現(xiàn)象和故障部件,通過(guò)自然語(yǔ)言處理規(guī)則匹配方法,識(shí)別出各個(gè)參數(shù)條件。
以故障類應(yīng)用場(chǎng)景為例,故障類語(yǔ)義分析技術(shù)方法有:分詞、詞性標(biāo)注、句法分析、命名實(shí)體識(shí)別、svm分類、基于正則表達(dá)式特征提取等。從用戶的問(wèn)題中,經(jīng)過(guò)以上技術(shù)的分析,提取出相應(yīng)的參數(shù)。具體參數(shù)的設(shè)置,可以根據(jù)具體業(yè)務(wù)需求定制化。其它類應(yīng)用場(chǎng)景的技術(shù)分析與之類似。
答案確定模塊14用于根據(jù)所述特征信息確定所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案。所述答案輸出模塊15用于輸出所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案。本發(fā)明實(shí)施例提供的用于車輛的問(wèn)答裝置解決了以往基于faq問(wèn)答模式精度低的問(wèn)題,同時(shí),克服了開(kāi)放領(lǐng)域問(wèn)答系統(tǒng)過(guò)于復(fù)雜、開(kāi)發(fā)周期長(zhǎng)的問(wèn)題。經(jīng)過(guò)驗(yàn)證,在整個(gè)實(shí)際問(wèn)答過(guò)程中,回答的準(zhǔn)確度可達(dá)到92%。
圖2示出了本發(fā)明又一實(shí)施例提供的用于車輛的問(wèn)答裝置的結(jié)構(gòu)框圖,如圖2所示,基于上述實(shí)施例,答案確定模塊14可以包括匹配單元141以及檢索單元142。匹配單元141用于根據(jù)所述特征信息從數(shù)據(jù)庫(kù)17中確定與所述用戶提出的問(wèn)題相匹配的問(wèn)題,所述數(shù)據(jù)庫(kù)17包括一個(gè)或多個(gè)問(wèn)題以及該一個(gè)或多個(gè)問(wèn)題中的每一個(gè)問(wèn)題所對(duì)應(yīng)的答案。檢索單元142用于從所述數(shù)據(jù)庫(kù)17中檢索出與所述用戶提出的問(wèn)題相匹配的問(wèn)題所對(duì)應(yīng)的答案。
可以理解,匹配單元141也可以采用傳統(tǒng)faq問(wèn)答的方式,即基于句子相似度來(lái)從數(shù)據(jù)庫(kù)17中確定與所述用戶提出的問(wèn)題相匹配的問(wèn)題。
可選地,數(shù)據(jù)庫(kù)17中可以存儲(chǔ)有與各個(gè)應(yīng)用場(chǎng)景相關(guān)的數(shù)據(jù)和一些輔助數(shù)據(jù)。
故障類數(shù)據(jù)庫(kù)、保險(xiǎn)類數(shù)據(jù)庫(kù)以及手冊(cè)類數(shù)據(jù)庫(kù)可以由知識(shí)工程師和4s店、汽修廠、保險(xiǎn)公司合作梳理完成。開(kāi)發(fā)技術(shù)人員進(jìn)行結(jié)構(gòu)化處理。對(duì)于常識(shí)類數(shù)據(jù)庫(kù),技術(shù)人員可以通過(guò)web抓取,進(jìn)行關(guān)系抽取,得到結(jié)構(gòu)化的數(shù)據(jù)。最后,將所獲得的各類數(shù)據(jù)庫(kù)分別保存在數(shù)據(jù)庫(kù)17中。
以故障類數(shù)據(jù)的數(shù)據(jù)庫(kù)為例,實(shí)際使用中,對(duì)于故障類數(shù)據(jù)的數(shù)據(jù)庫(kù)的建立,可以從汽修廠、4s店獲取故障類問(wèn)題的數(shù)據(jù),其中故障類問(wèn)題的數(shù)據(jù)可以包括各個(gè)部件故障后產(chǎn)生的故障現(xiàn)象及其解決方案。此外,也可以通過(guò)網(wǎng)絡(luò)抓取或者專家經(jīng)驗(yàn)數(shù)據(jù)來(lái)獲得故障類問(wèn)題的數(shù)據(jù)。然后可以對(duì)所獲得的故障類數(shù)據(jù)進(jìn)行整理,得到關(guān)于車輛故障的數(shù)據(jù)庫(kù),該數(shù)據(jù)庫(kù)可以包括一個(gè)或多個(gè)問(wèn)題以及該一個(gè)或多個(gè)問(wèn)題中的每一個(gè)問(wèn)題所對(duì)應(yīng)的答案。
可選地,所述檢索單元142可以使用redis技術(shù)來(lái)提高檢索效率。
進(jìn)一步地,發(fā)明實(shí)施例提供的用于車輛的問(wèn)答裝置還可以包括對(duì)話管理模塊16。用戶一次提出的問(wèn)題的特征信息可能是不全面的,匹配單元141可能無(wú)法從數(shù)據(jù)庫(kù)中確定出與所述用戶提出的問(wèn)題相匹配的問(wèn)題,從而檢索單元142無(wú)法準(zhǔn)確檢索出答案。這時(shí),需要根據(jù)可能的意圖再次詢問(wèn)用戶相關(guān)的補(bǔ)充條件,得到用戶反饋后,要和用戶的上一句問(wèn)題做信息合并,完善提問(wèn)的信息。這個(gè)詢問(wèn)過(guò)程就是通過(guò)對(duì)話管理的模塊16執(zhí)行的,和開(kāi)放領(lǐng)域不同的是,對(duì)話管理的模塊16都是圍繞汽車領(lǐng)域進(jìn)行會(huì)話,同一個(gè)焦點(diǎn)詞、關(guān)鍵詞在開(kāi)放領(lǐng)域表述的意思和在汽車領(lǐng)域表述的意義可能會(huì)有不同。該模塊主要包括的技術(shù)是:上下文指代消解、對(duì)話管理、上下文邊界確定、自動(dòng)狀態(tài)機(jī)等。
進(jìn)一步地,本發(fā)明實(shí)施例提供的用于車輛的問(wèn)答裝置還可以包括意圖分類模塊,用于判斷所述用戶提出的問(wèn)題是否與車輛相關(guān)。用戶提出的問(wèn)題,需要判斷其問(wèn)題意圖是否與車輛相關(guān),如果相關(guān),則進(jìn)行后續(xù)與汽車相關(guān)的分析,否則,可以進(jìn)入第三方應(yīng)用接口。該模塊可以使用機(jī)器學(xué)習(xí)svm分類算法,但不限于svm,其他分類算法只要能達(dá)到分類精度要求即可。該模塊算法的訓(xùn)練數(shù)據(jù)是通過(guò)網(wǎng)絡(luò)抓取和人工標(biāo)注相結(jié)合,根據(jù)具體業(yè)務(wù)要求整理不同的訓(xùn)練數(shù)據(jù)即可。所述應(yīng)用場(chǎng)景分類模塊12用于在意圖分類模塊判斷出所述用戶提出的問(wèn)題與車輛相關(guān)的情況下,對(duì)所述用戶提出的問(wèn)題進(jìn)行所述應(yīng)用場(chǎng)景分類。
可以理解,數(shù)據(jù)準(zhǔn)備對(duì)于實(shí)現(xiàn)數(shù)據(jù)問(wèn)答是必不可少的一步。數(shù)據(jù)準(zhǔn)備可以包括采集、處理、校驗(yàn)、標(biāo)注四個(gè)過(guò)程。數(shù)據(jù)的采集包括web抓取和4s店、汽修廠反饋信息,是非常重要的一手資源。然后對(duì)采集到的數(shù)據(jù)進(jìn)行噪聲清理、不一致去除、歸一化等操作,經(jīng)過(guò)專業(yè)是汽車知識(shí)工程師校驗(yàn)后,開(kāi)始標(biāo)注工作。標(biāo)注過(guò)程由開(kāi)發(fā)人員和知識(shí)工程師一起完成,標(biāo)注完成再次校驗(yàn),從而得到優(yōu)秀的訓(xùn)練數(shù)據(jù)集和數(shù)據(jù)庫(kù)庫(kù)數(shù)據(jù)。
下文將以所分類的應(yīng)用場(chǎng)景為故障類為例,對(duì)本發(fā)明實(shí)施例進(jìn)行進(jìn)一步說(shuō)明。
在所分類的應(yīng)用場(chǎng)景為故障類的情況下,所述特征信息至少可以包括故障部件名稱和故障現(xiàn)象。語(yǔ)義理解模塊13用于從用戶提出的故障問(wèn)題中提取出特征信息,實(shí)際中,用戶所提出的故障問(wèn)題中可能會(huì)不全面,例如,可能缺少部件名稱或缺少故障現(xiàn)象,此時(shí),可以通過(guò)對(duì)話管理模塊16來(lái)詢問(wèn)用戶以進(jìn)一步完善用戶提出的故障問(wèn)題,例如,可以向用戶發(fā)出類似于“具體故障部件是哪”的問(wèn)題,在接收到用戶的進(jìn)一步反饋之后,可以從用戶的進(jìn)一步反饋中提取故障部件名稱?;蛘呖梢詫⒂脩舻倪M(jìn)一步反饋和用戶先前提出的故障問(wèn)題進(jìn)行合并,從合并后的信息中提取特征信息。
通過(guò)大量的汽車問(wèn)答語(yǔ)料進(jìn)行調(diào)研,結(jié)合汽車專家工程師人工梳理和機(jī)器學(xué)習(xí)自動(dòng)特征提取的方法,可以確定出用戶提出的故障問(wèn)題除可能包括故障部件名稱和故障現(xiàn)象之外,還可能包括以下13個(gè)特征信息中的一個(gè)或多個(gè):車輛品牌、車輛型號(hào)、燈類部件、操作信息、聲音現(xiàn)象、發(fā)動(dòng)機(jī)溫度、行駛狀態(tài)、轉(zhuǎn)向方式、車速、發(fā)動(dòng)機(jī)轉(zhuǎn)速、擋位、天氣及路況。
進(jìn)一步地,對(duì)于故障部件、故障現(xiàn)象、車輛品牌及車輛型號(hào)這些特征信息的提取,可以根據(jù)分類模型來(lái)對(duì)用戶提出的所述故障問(wèn)題進(jìn)行特征信息提取,所述分類模型包括以下中的一者或多者:部件分類模型、故障現(xiàn)象分類模型、車輛品牌分類模型、車輛型號(hào)分類模型。
可以使用svm機(jī)器學(xué)習(xí)分類器來(lái)建立上述各模型。具體地,可以首先準(zhǔn)備問(wèn)句樣本,然后對(duì)所準(zhǔn)備的問(wèn)句樣本進(jìn)行人工分類標(biāo)注,將標(biāo)注后的語(yǔ)句樣本作為svm機(jī)器學(xué)習(xí)分類器的訓(xùn)練集,從而得到上述各分類模型。
以建立部件分類模型為例,首先對(duì)收集的問(wèn)句樣本進(jìn)行人工標(biāo)注,標(biāo)注示例如下所示:
方向盤\做完四輪定位方向盤變輕
車\做完四輪定輪后車身發(fā)飄
車\做了動(dòng)平衡后,方向反而跑偏了
座椅\座椅無(wú)法調(diào)到最前面
座椅\座椅調(diào)整困難
燈\左轉(zhuǎn)向燈常亮
右前輪\左轉(zhuǎn)彎右前輪嗡嗡異響
右前輪\左轉(zhuǎn)彎右前輪咕嚕異響
左后減震\左轉(zhuǎn)彎時(shí)左后減震咯吱異響
上述標(biāo)注示例中,“\”左側(cè)是標(biāo)注的類別,“\”右側(cè)是問(wèn)句樣本。將標(biāo)注后的問(wèn)句樣本輸入給svm機(jī)器學(xué)習(xí),經(jīng)過(guò)訓(xùn)練,可得到部件分類的模型。類似地,也可以相同的方式建立故障現(xiàn)象分類模型、車輛品牌分類模型以及車輛型號(hào)分類模型。
在接收到用戶提出的故障問(wèn)題之后,可以將該故障問(wèn)題作為部件分類模型的輸入,部件分類模型的輸出就是用戶提出的故障問(wèn)題所涉及的故障部件名稱。采用十折交叉驗(yàn)證的方式對(duì)分類模型進(jìn)行驗(yàn)證,經(jīng)過(guò)實(shí)際驗(yàn)證,單獨(dú)從模型算,準(zhǔn)確度可達(dá)到98%左右。
進(jìn)一步地,對(duì)除故障部件、故障現(xiàn)象、車輛品牌及車輛型號(hào)之外的其它特征信息的提取可以利用正則表達(dá)式進(jìn)行提取。通過(guò)對(duì)大量的故障問(wèn)題進(jìn)行分析,可知除故障部件、故障現(xiàn)象、車輛品牌及車輛型號(hào)之外的其它特征信息基本上具有相對(duì)固定的結(jié)構(gòu),因此可以采用正則表達(dá)式的方式進(jìn)行提取。
以天氣特征的提取為例,所使用的正則模板可以如下所示:
pattern=“下(雨|雪)|(雨|雪|春|夏|秋|冬|冷)(天|季)|暴曬|(夜)?晚(上)?|天(冷|涼)”。
例如,如果用戶所提出的故障問(wèn)題是“冬季啟動(dòng)時(shí)發(fā)動(dòng)機(jī)加不上油熄火”,通過(guò)使用上述正則模板進(jìn)行特征信息提取可以得到天氣為“冬季”。
進(jìn)一步地,答案確定模塊15可以根據(jù)存儲(chǔ)的故障規(guī)則對(duì)所獲得的特征信息進(jìn)行推理來(lái)獲得所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案,所述故障規(guī)則包括故障前提和故障結(jié)論??蛇x地,可以使用drools規(guī)則引擎來(lái)實(shí)現(xiàn)對(duì)所提取的特征信息進(jìn)行推理,drools規(guī)則引擎是基于java語(yǔ)言的具有高伸縮性、高擴(kuò)展性的規(guī)則引擎。但是本發(fā)明實(shí)施例并不限制于此,例如,也可以使用prolog(programminginlogic,邏輯程序設(shè)計(jì))規(guī)則推理程序等來(lái)對(duì)所提取的特征信息進(jìn)行推理。
這里,故障規(guī)則可以存儲(chǔ)在規(guī)則庫(kù)中。故障規(guī)則對(duì)應(yīng)于產(chǎn)生式規(guī)則,其可以包括故障前提和故障結(jié)論。車輛領(lǐng)域的故障發(fā)生,都是由于某個(gè)部件出現(xiàn)損壞,導(dǎo)致某種故障現(xiàn)象產(chǎn)生,其中,部件損壞可以認(rèn)為是故障前提,故障現(xiàn)象產(chǎn)生可以認(rèn)為是故障結(jié)論,其符合產(chǎn)生式規(guī)則的描述方式。因此,可以首先建立并存儲(chǔ)故障規(guī)則,然后根據(jù)該存儲(chǔ)的故障規(guī)則對(duì)所提取的車輛部件名稱和故障現(xiàn)象進(jìn)行推理以獲得故障原因和/或解決方案。
進(jìn)一步地,用于車輛的問(wèn)答裝置還可以包括抽取模塊,用于從數(shù)據(jù)庫(kù)中抽取出所述故障規(guī)則,所述數(shù)據(jù)庫(kù)可以包括一個(gè)或多個(gè)故障現(xiàn)象以及與該一個(gè)或多個(gè)故障現(xiàn)象中的每一個(gè)故障現(xiàn)象所對(duì)應(yīng)的答案,該答案可以包括故障原因和/或解決方案。
可選地,可以使用關(guān)系抽取的方式來(lái)從所述數(shù)據(jù)庫(kù)中抽取出故障規(guī)則。可選地,所抽取處的故障規(guī)則的形式可以如下所示:
rule1:
ifauto_part="換擋電磁閥"andphenomenon="卡頓"
thenauto_part="d擋",phenomenon="頓挫"
rule2:
ifauto_part="d擋"andphenomenon="頓挫"
thenauto_part="車輛",phenomenon="頓挫"
通過(guò)觀察,可以發(fā)現(xiàn),rule1產(chǎn)生結(jié)論部分是rule2的條件,通過(guò)這樣類似的一系列規(guī)則推理,當(dāng)用戶提問(wèn)“車輛頓挫,怎么回事?”時(shí),經(jīng)過(guò)上述的規(guī)則,既可以推理出故障原因:部件“換擋電磁閥”出現(xiàn)了“卡頓”現(xiàn)象。這里,是以故障部件和故障現(xiàn)象為例進(jìn)行說(shuō)明,其它特征信息與之類似。
進(jìn)一步地,從關(guān)于車輛故障的數(shù)據(jù)庫(kù)中抽取出故障規(guī)則可能會(huì)出現(xiàn)一些誤差或者遺漏一些數(shù)據(jù),因此,可以采用人工校對(duì)的方式對(duì)所抽取出的故障規(guī)則進(jìn)行校對(duì)和/或者針對(duì)遺漏的數(shù)據(jù)進(jìn)行補(bǔ)充,從而可以為用戶提出的故障問(wèn)題提供更精確的故障原因和/或解決方案。
圖3示出了本發(fā)明一實(shí)施例提供的用于車輛的問(wèn)答方法的流程示意圖。如圖3所示,本發(fā)明實(shí)施例還提供一種用于車輛的問(wèn)答方法,該方法可以包括:步驟s31,接收用戶提出的問(wèn)題;步驟s32,對(duì)所述用戶提出的問(wèn)題進(jìn)行應(yīng)用場(chǎng)景分類,所分類的應(yīng)用場(chǎng)景包括以下中的一者或多者:故障類、常識(shí)類、手冊(cè)類、購(gòu)車類、保險(xiǎn)類;步驟s33,根據(jù)所分類的應(yīng)用場(chǎng)景對(duì)所述用戶提出的問(wèn)題進(jìn)行語(yǔ)義識(shí)別以獲得特征信息;步驟s34,根據(jù)所述特征信息確定所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案;以及步驟s35,輸出所述用戶提出的問(wèn)題所對(duì)應(yīng)的答案。所述方法解決了以往基于faq問(wèn)答模式精度低的問(wèn)題,同時(shí),克服了開(kāi)放領(lǐng)域問(wèn)答系統(tǒng)過(guò)于復(fù)雜、開(kāi)發(fā)周期長(zhǎng)的問(wèn)題。
本發(fā)明實(shí)施例提供的用于車輛的問(wèn)答方法的具體工作原理及益處與上述本發(fā)明實(shí)施例提供的用戶車輛的問(wèn)答裝置的具體工作原理及益處相似,這里將不再贅述。
相應(yīng)地,本發(fā)明實(shí)施例還提供一種機(jī)器可讀存儲(chǔ)介質(zhì),該機(jī)器可讀存儲(chǔ)介質(zhì)上存儲(chǔ)有指令,該指令用于在被機(jī)器執(zhí)行時(shí)使得所述機(jī)器執(zhí)行上述的方法。
以上結(jié)合附圖詳細(xì)描述了本發(fā)明例的可選實(shí)施方式,但是,本發(fā)明實(shí)施例并不限于上述實(shí)施方式中的具體細(xì)節(jié),在本發(fā)明實(shí)施例的技術(shù)構(gòu)思范圍內(nèi),可以對(duì)本發(fā)明實(shí)施例的技術(shù)方案進(jìn)行多種簡(jiǎn)單變型,這些簡(jiǎn)單變型均屬于本發(fā)明實(shí)施例的保護(hù)范圍。
另外需要說(shuō)明的是,在上述具體實(shí)施方式中所描述的各個(gè)具體技術(shù)特征,在不矛盾的情況下,可以通過(guò)任何合適的方式進(jìn)行組合。為了避免不必要的重復(fù),本發(fā)明實(shí)施例對(duì)各種可能的組合方式不再另行說(shuō)明。
本領(lǐng)域技術(shù)人員可以理解實(shí)現(xiàn)上述實(shí)施例方法中的全部或部分步驟是可以通過(guò)程序來(lái)指令相關(guān)的硬件來(lái)完成,該程序存儲(chǔ)在一個(gè)存儲(chǔ)介質(zhì)中,包括若干指令用以使得一個(gè)(可以是單片機(jī),芯片等)或處理器(processor)執(zhí)行本申請(qǐng)各個(gè)實(shí)施例所述方法的全部或部分步驟。而前述的存儲(chǔ)介質(zhì)包括:u盤、移動(dòng)硬盤、只讀存儲(chǔ)器(rom,read-onlymemory)、隨機(jī)存取存儲(chǔ)器(ram,randomaccessmemory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
此外,本發(fā)明實(shí)施例的各種不同的實(shí)施方式之間也可以進(jìn)行任意組合,只要其不違背本發(fā)明實(shí)施例的思想,其同樣應(yīng)當(dāng)視為本發(fā)明實(shí)施例所公開(kāi)的內(nèi)容。