本發(fā)明涉及語(yǔ)音交互系統(tǒng)領(lǐng)域,特別涉及電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)、語(yǔ)音識(shí)別方法和語(yǔ)音交互方法。
背景技術(shù):
:在傳統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)中,用戶與系統(tǒng)交互的方式是通過(guò)電話的鍵盤。通常,用戶在進(jìn)入語(yǔ)音導(dǎo)航系統(tǒng)后,會(huì)聽(tīng)到相關(guān)的語(yǔ)音提示選單,根據(jù)自己的需要可以按下鍵盤上相關(guān)的按鍵。系統(tǒng)通過(guò)dtmf信號(hào)傳送用戶按下的鍵,同時(shí)也將用戶的請(qǐng)求傳送給系統(tǒng),從而觸發(fā)相關(guān)的語(yǔ)音信息。然而,傳統(tǒng)的電話僅能通過(guò)dtmf信號(hào),傳送有限的幾個(gè)數(shù)字及符號(hào)按鍵。這使得用戶與系統(tǒng)的交互界面受到很大的限制,同時(shí)也就使得語(yǔ)音導(dǎo)航系統(tǒng)的信息查詢范圍變得相當(dāng)狹窄,用戶在實(shí)際使用時(shí)會(huì)感到諸多不便。隨著計(jì)算機(jī)技術(shù)和人工智能總體技術(shù)的發(fā)展,自然語(yǔ)言理解不斷取得進(jìn)展。語(yǔ)音識(shí)別系統(tǒng)已成為一個(gè)越來(lái)越廣泛的應(yīng)用方向?;趥鹘y(tǒng)聲學(xué)模型的語(yǔ)音識(shí)別技術(shù)的語(yǔ)音導(dǎo)航系統(tǒng),被應(yīng)用自動(dòng)語(yǔ)音服務(wù)系統(tǒng)(即ivr服務(wù))中,解決了菜單層級(jí)過(guò)深和業(yè)務(wù)無(wú)法拓展的問(wèn)題,隨著服務(wù)內(nèi)容日趨增多,訓(xùn)練人工投入大、語(yǔ)音識(shí)別率低和系統(tǒng)的魯棒性差等固有的缺點(diǎn)和難點(diǎn)也日益凸顯,影響客戶對(duì)自助服務(wù)的使用,從而求助人工導(dǎo)致人工話務(wù)壓力增加。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,在傳統(tǒng)的語(yǔ)音技術(shù)的基礎(chǔ)上引入深度學(xué)習(xí)技術(shù)應(yīng)經(jīng)成為了必然趨勢(shì)和解決當(dāng)下問(wèn)題的有效途徑。技術(shù)實(shí)現(xiàn)要素:針對(duì)上述現(xiàn)有技術(shù)存在的問(wèn)題,提供了電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)、語(yǔ)音識(shí)別方法和語(yǔ)音交互方法。為了實(shí)現(xiàn)上述目的,一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng),其特征在于:包括語(yǔ)音輸入模塊:客戶通過(guò)手機(jī)或者固話,利用排隊(duì)機(jī)接入呼叫中心系統(tǒng),在cti和ivr的控制下,當(dāng)用戶需要語(yǔ)音導(dǎo)航業(yè)務(wù)時(shí),通過(guò)呼叫平臺(tái)實(shí)現(xiàn)話務(wù)接入,平臺(tái)記錄下的原始語(yǔ)音信息,并進(jìn)行播報(bào)用戶確認(rèn)無(wú)誤后,將該文件作為原始的語(yǔ)音文件信息輸入;語(yǔ)音識(shí)別模塊包括語(yǔ)音識(shí)別單元和語(yǔ)音文本處理單元;語(yǔ)音識(shí)別單元:語(yǔ)音識(shí)別引擎輸入的原始的語(yǔ)音文件信息經(jīng)過(guò)語(yǔ)音識(shí)別預(yù)處理;將經(jīng)過(guò)語(yǔ)音識(shí)別預(yù)處理的語(yǔ)音文件進(jìn)行離線解碼或在線解碼、置信度處理后轉(zhuǎn)成自然語(yǔ)言文本信息;并將原始語(yǔ)音信息、原始的語(yǔ)音文件信息、語(yǔ)音特征信息存入文本/語(yǔ)音語(yǔ)庫(kù)中;語(yǔ)音文本處理單元:將自然語(yǔ)言文本信息經(jīng)過(guò)模式匹配處理、語(yǔ)法分析處理、語(yǔ)義解析處理、語(yǔ)義搜索處理、上下文管理處理以及語(yǔ)義預(yù)測(cè)處理后,將自然語(yǔ)言文本信息轉(zhuǎn)換成計(jì)算機(jī)識(shí)別的語(yǔ)音信息作為輸出物;進(jìn)行業(yè)務(wù)需求分析,為自然語(yǔ)言處理引擎提供數(shù)據(jù)輸入;作為上述方案的進(jìn)一步優(yōu)化,在語(yǔ)音識(shí)別單元中進(jìn)行的語(yǔ)音識(shí)別預(yù)處理包括特征提取處理、端點(diǎn)檢測(cè)處理和去燥處理。作為上述方案的進(jìn)一步優(yōu)化,還包括語(yǔ)音反饋模塊,用于反饋噪音或非普通話輸入的原始語(yǔ)音信息。作為上述方案的進(jìn)一步優(yōu)化,其特征在于:語(yǔ)音識(shí)別模塊中,語(yǔ)音識(shí)別處理的步驟為:(41)初始化原始的語(yǔ)音文件信息;(42)創(chuàng)建識(shí)別引擎;語(yǔ)音識(shí)別引擎用于輸入的原始的語(yǔ)音文件;(43)創(chuàng)建識(shí)別上下文接口;(44)設(shè)置識(shí)別消息;(45)設(shè)置事件;(46)創(chuàng)建語(yǔ)法規(guī)則;(47)激活語(yǔ)法規(guī)則:(48)獲取識(shí)別消息,進(jìn)行處理:本發(fā)明還公開(kāi)了電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音識(shí)別方法,其特征在于,語(yǔ)音識(shí)別單元采用深度神經(jīng)網(wǎng)絡(luò)和隱馬爾科夫(dnn-hmm)混合模型,使用hmm來(lái)描述語(yǔ)音信號(hào)的動(dòng)態(tài)變化,再使用dnn的每個(gè)輸出節(jié)點(diǎn)來(lái)估計(jì)連續(xù)密度hmm的某個(gè)狀態(tài)的后驗(yàn)概率。作為上述方案的進(jìn)一步優(yōu)化,離線解碼或在線解碼中:(61)首先將后驗(yàn)概率轉(zhuǎn)為似然度p(xt/qt):p(xt/qt=s)=p(qt=s/xt)p(xt)/p(s)(1)其中,是從訓(xùn)練集中統(tǒng)計(jì)的每個(gè)狀態(tài)的先驗(yàn)概率,ts是標(biāo)記屬于狀態(tài)s的幀數(shù),t是總幀數(shù),(62)p(xt)與字詞序列無(wú)關(guān),計(jì)算時(shí)可以忽略,忽略后得到縮放的似然度(63)在dnn-hmm模型中,解碼出的字詞序列由以下公式確定:其中p(ω)是語(yǔ)言模型(lm)概率,以及上式是聲學(xué)模型(am)概率,其中,p(qt/xt)由dnn模型計(jì)算得出,p(qt)是狀態(tài)的先驗(yàn)概率,π(q0)和分別是初始狀態(tài)概率和狀態(tài)轉(zhuǎn)移概率,(64)語(yǔ)言模型權(quán)重系數(shù)λ通常被用于平衡聲學(xué)和語(yǔ)言模型得分,最終的解碼路徑由以下公式?jīng)Q定:本發(fā)明還公開(kāi)了一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音交互方法,包括如下步驟:(101)用戶接通電話,語(yǔ)音導(dǎo)航系統(tǒng)接收到請(qǐng)求;(102)語(yǔ)音導(dǎo)航系統(tǒng)將請(qǐng)求發(fā)送給mcp(mediacontrolplatform)單元;(103)mcp單元返回給對(duì)應(yīng)的語(yǔ)音文件、提示音給語(yǔ)音導(dǎo)航系統(tǒng);(104)語(yǔ)音導(dǎo)航系統(tǒng)播報(bào)提示音給用戶;(105)用戶語(yǔ)音輸入,進(jìn)行識(shí)別請(qǐng)求;(106)語(yǔ)音導(dǎo)航系統(tǒng)將識(shí)別請(qǐng)求通過(guò)mcp單元轉(zhuǎn)發(fā)至語(yǔ)音識(shí)別引擎;引入反饋,將用戶語(yǔ)音識(shí)別的結(jié)果反饋給用戶,得到用戶的確認(rèn)后,進(jìn)行下一步;(107)語(yǔ)音識(shí)別引擎進(jìn)行語(yǔ)音識(shí)別,并將轉(zhuǎn)寫(xiě)文本發(fā)送給語(yǔ)義理解引擎;(108)語(yǔ)義理解引擎獲取語(yǔ)義上下文信息,給出語(yǔ)義識(shí)別結(jié)果,并將結(jié)果返回給語(yǔ)音識(shí)別引擎;(109)語(yǔ)音識(shí)別引擎將語(yǔ)義結(jié)果返回給語(yǔ)音導(dǎo)航系統(tǒng);(110)語(yǔ)音導(dǎo)航系統(tǒng)將語(yǔ)義結(jié)果發(fā)送至mcp單元,進(jìn)行流程跳轉(zhuǎn)控制;(111)mcp單元返回最終結(jié)果給語(yǔ)音導(dǎo)航系統(tǒng);(112)語(yǔ)音導(dǎo)航系統(tǒng)將結(jié)果通過(guò)語(yǔ)音播報(bào)給用戶。作為上述方案的進(jìn)一步優(yōu)化,對(duì)于查詢類問(wèn)題,語(yǔ)音導(dǎo)航系統(tǒng)調(diào)用webservice接口,進(jìn)行信息的查詢獲?。磺襴ebservice接口返回給語(yǔ)音導(dǎo)航系統(tǒng)對(duì)應(yīng)的客戶的信息。與現(xiàn)有技術(shù)相比,本發(fā)明的電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)、語(yǔ)音識(shí)別方法和語(yǔ)音交互方法的有益效果如下:1、本發(fā)明的一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng),在識(shí)別率、魯棒性方面比基于傳統(tǒng)模型的語(yǔ)音導(dǎo)航有很大的改善和提高。本發(fā)明的一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng),即使在有一定噪音的環(huán)境下,系統(tǒng)的識(shí)別率達(dá)也能達(dá)到95%以上。2、本發(fā)明的一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音識(shí)別方法,采用dnn-hmm模型的語(yǔ)音識(shí)別引擎,具有識(shí)別率高,識(shí)別速度快,可移植性好等優(yōu)點(diǎn)。3、本發(fā)明的一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音識(shí)別方法,,應(yīng)用電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)中,在模型的訓(xùn)練、識(shí)別率、魯棒性方面有顯著的改善,有效提高語(yǔ)音識(shí)別率,為語(yǔ)音導(dǎo)航系統(tǒng)識(shí)別提供了新的手段。附圖說(shuō)明圖1為本發(fā)明的電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的結(jié)構(gòu)框圖;圖2為本發(fā)明的語(yǔ)音識(shí)別處理的流程圖。具體實(shí)施方式為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明了,下面通過(guò)附圖及實(shí)施例,對(duì)本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說(shuō)明。但是應(yīng)該理解,此處所描述的具體實(shí)施例僅僅用以解釋本發(fā)明,并不用于限制本發(fā)明的范圍。參見(jiàn)圖1,圖1為本發(fā)明的電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的結(jié)構(gòu)框圖;一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng),包括語(yǔ)音輸入模塊、語(yǔ)音識(shí)別模塊和數(shù)據(jù)交互模塊和語(yǔ)音反饋模塊:其中,語(yǔ)音輸入模塊:客戶通過(guò)手機(jī)或者固話,利用排隊(duì)機(jī)接入呼叫中心系統(tǒng),在cti和ivr的控制下,當(dāng)用戶需要語(yǔ)音導(dǎo)航業(yè)務(wù)時(shí),通過(guò)呼叫平臺(tái)實(shí)現(xiàn)話務(wù)接入,平臺(tái)記錄下的原始語(yǔ)音信息,并進(jìn)行播報(bào)用戶確認(rèn)無(wú)誤后,將該文件作為原始的語(yǔ)音文件信息輸入。語(yǔ)音識(shí)別模塊包括語(yǔ)音識(shí)別單元和語(yǔ)音文本處理單元。語(yǔ)音識(shí)別單元:語(yǔ)音識(shí)別引擎輸入的原始的語(yǔ)音文件信息經(jīng)過(guò)語(yǔ)音識(shí)別預(yù)處理;將經(jīng)過(guò)語(yǔ)音識(shí)別預(yù)處理的語(yǔ)音文件進(jìn)行離線解碼或在線解碼、置信度處理后轉(zhuǎn)成自然語(yǔ)言文本信息;并將原始語(yǔ)音信息、原始的語(yǔ)音文件信息、語(yǔ)音特征信息存入文本/語(yǔ)音語(yǔ)庫(kù)中。在語(yǔ)音識(shí)別單元中進(jìn)行的語(yǔ)音識(shí)別預(yù)處理包括特征提取處理、端點(diǎn)檢測(cè)處理和去燥處理。其中,在語(yǔ)音識(shí)別單元中進(jìn)行的語(yǔ)音識(shí)別預(yù)處理包括特征提取處理、端點(diǎn)檢測(cè)處理和去燥處理。語(yǔ)音文本處理單元:將自然語(yǔ)言文本信息經(jīng)過(guò)模式匹配處理、語(yǔ)法分析處理、語(yǔ)義解析處理、語(yǔ)義搜索處理、上下文管理處理以及語(yǔ)義預(yù)測(cè)處理后,將自然語(yǔ)言文本信息轉(zhuǎn)換成計(jì)算機(jī)識(shí)別的語(yǔ)音信息作為輸出物;進(jìn)行業(yè)務(wù)需求分析,為自然語(yǔ)言處理引擎提供數(shù)據(jù)輸入;數(shù)據(jù)交互模塊,為用戶輸入的數(shù)據(jù)、系統(tǒng)識(shí)別的數(shù)據(jù)和反饋客戶輸出的數(shù)據(jù)提供交互。語(yǔ)音反饋模塊,用于反饋噪音或非普通話輸入的原始語(yǔ)音信息。一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音識(shí)方法,首先調(diào)用coinitialize(null)初始化com對(duì)象,然后創(chuàng)建基于dnn+hmm的語(yǔ)音識(shí)別引擎、語(yǔ)法規(guī)則上下文和識(shí)別語(yǔ)法,并調(diào)用函數(shù)loadcmdfromfile裝載文法識(shí)別規(guī)則。本發(fā)明的一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)調(diào)用setinterest來(lái)注冊(cè)需要的事件。本發(fā)明的一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音數(shù)據(jù)是從gvp取得的實(shí)時(shí)語(yǔ)音數(shù)據(jù),將其存入內(nèi)存,然后通過(guò)調(diào)用ispaudioplug的setdata方法將其送入識(shí)別引擎,調(diào)用語(yǔ)音識(shí)別引擎的處理模塊。參見(jiàn)圖2,語(yǔ)音識(shí)別處理的步驟為:(41)初始化原始的語(yǔ)音文件信息;本發(fā)明的優(yōu)選實(shí)施例中,speechapi5.1+vc6為例:在cwinapp的子類中,調(diào)用coinitializeex函數(shù)進(jìn)行com初始化,代碼如下:coinitializeex(null,coinit_apartmentthreaded);//初始化com(42)創(chuàng)建識(shí)別引擎;語(yǔ)音識(shí)別引擎用于輸入的原始的語(yǔ)音文件:本發(fā)明的優(yōu)選實(shí)施例中,使用共享型,大的服務(wù)型程序使用inproc;如下:hr=m_cprecognizer.cocreateinstance(clsid_spsharedrecognizer);//sharehr=m_cprecognizer.cocreateinstance(clsid_spinprocrecognizer);//inproc如果是share型,可直接進(jìn)到步驟3;如果是inproc型,必須使用isprecognizer::setinput設(shè)置語(yǔ)音輸入。如下:ccomptr<ispobjecttoken>cpaudiotoken;//定義一個(gè)tokenhr=spgetdefaulttokenfromcategoryid(spcat_audioin,&cpaudiotoken);//建立默認(rèn)的音頻輸入對(duì)象if(succeeded(hr)){hr=m_cprecognizer->setinput(cpaudiotoken,true);}或者:ccomptr<ispaudio>cpaudio;//定義一個(gè)音頻對(duì)象hr=spcreatedefaultobjectfromcategoryid(spcat_audioin,&cpaudio);//建立默認(rèn)的音頻輸入對(duì)象hr=m_cprecoengine->setinput(cpaudio,true);//設(shè)置識(shí)別引擎輸入源。(43)創(chuàng)建識(shí)別上下文接口;本發(fā)明的優(yōu)選實(shí)施例中,調(diào)用isprecognizer::createrecocontext創(chuàng)建識(shí)別上下文接口(isprecocontext),如下:hr=m_cprecoengine->createrecocontext(&m_cprecoctxt);(44)設(shè)置識(shí)別消息;本發(fā)明的優(yōu)選實(shí)施例中,調(diào)用setnotifywindowmessage告訴windows哪個(gè)是識(shí)別消息,需要進(jìn)行處理。如下:hr=m_cprecoctxt->setnotifywindowmessage(m_hwnd,wm_recoevent,0,0);setnotifywindowmessage定義在ispnotifysource中。(45)設(shè)置事件;本發(fā)明的優(yōu)選實(shí)施例中,其中最重要的事件是”spei_recognition“。參照speventenum。代碼如下:constulonglongullinterest=spfei(spei_sound_start)|spfei(spei_sound_end)|spfei(spei_recognition);hr=m_cprecoctxt->setinterest(ullinterest,ullinterest);(46)創(chuàng)建語(yǔ)法規(guī)則;本發(fā)明的優(yōu)選實(shí)施例中,語(yǔ)法規(guī)則兩種,一種是聽(tīng)說(shuō)式(dictation),一種是命令式(commandandcontrol---c&c)。首先利用isprecocontext::creategrammar創(chuàng)建語(yǔ)法對(duì)象,然后加載不同的語(yǔ)法規(guī)則,如下://dictationhr=m_cprecoctxt->creategrammar(giddictation,&m_cpdictationgrammar);if(succeeded(hr)){hr=m_cpdictationgrammar->loaddictation(null,splo_static);//加載詞典}//c&chr=m_cprecoctxt->creategrammar(gidcmdctrl,&m_cpcmdgrammar);然后利用isprecogrammar::loadcmdxxx加載語(yǔ)法(47)激活語(yǔ)法規(guī)則:本發(fā)明的優(yōu)選實(shí)施例中,hr=m_cpdictationgrammar->setdictationstate(sprs_active);//dictationhr=m_cpcmdgrammar->setrulestate(null,null,sprs_active);//c&c(48)獲取識(shí)別消息,進(jìn)行處理:截獲識(shí)別消息(wm_recoevent),然后處理。識(shí)別的結(jié)果放在cspevent的isprecoresult中。如下:uses_conversion;cspeventevent;switch(event.eeventid){casespei_recognition:{//識(shí)別出了語(yǔ)音輸入m_bgotreco=true;staticconstwcharwszunrecognized[]=l"<unrecognized>";cspdynamicstringdstrtext;//取得識(shí)別結(jié)果if(failed(event.recoresult()->gettext(sp_getwholephrase,sp_getwholephrase,true,&dstrtext,null))){dstrtext=wszunrecognized;}bstrsrout;dstrtext.copytobstr(&srout);cstringrecstring;recstring.empty();recstring=srout;//進(jìn)一步處理......}break;}此外,本發(fā)明還公開(kāi)了一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音識(shí)別方法,語(yǔ)音識(shí)別單元采用深度神經(jīng)網(wǎng)絡(luò)和隱馬爾科夫(dnn-hmm)混合模型,使用hmm來(lái)描述語(yǔ)音信號(hào)的動(dòng)態(tài)變化,再使用dnn的每個(gè)輸出節(jié)點(diǎn)來(lái)估計(jì)連續(xù)密度hmm的某個(gè)狀態(tài)的后驗(yàn)概率。語(yǔ)音識(shí)別過(guò)程中,離線解碼或在線解碼的步驟如下:離線解碼或在線解碼中:(61)首先將后驗(yàn)概率轉(zhuǎn)為似然度p(xt/qt):p(xt/qt=s)=p(qt=s/xt)p(xt)/p(s)(1)其中,是從訓(xùn)練集中統(tǒng)計(jì)的每個(gè)狀態(tài)的先驗(yàn)概率,ts是標(biāo)記屬于狀態(tài)s的幀數(shù),t是總幀數(shù),(62)p(xt)與字詞序列無(wú)關(guān),計(jì)算時(shí)可以忽略,忽略后得到縮放的似然度對(duì)于訓(xùn)練語(yǔ)句中包含很長(zhǎng)靜音時(shí)段效果時(shí),除以先驗(yàn)概率p(s),獲取縮放的似然度,對(duì)于緩解標(biāo)注不平衡問(wèn)題很有效。(63)在dnn-hmm模型中,解碼出的字詞序列由以下公式確定:其中p(ω)是語(yǔ)言模型(lm)概率,以及上式是聲學(xué)模型(am)概率,其中,p(qt/xt)由dnn模型計(jì)算得出,p(qt)是狀態(tài)的先驗(yàn)概率,π(q0)和分別是初始狀態(tài)概率和狀態(tài)轉(zhuǎn)移概率,各自都由hmm模型決定。(64)語(yǔ)言模型權(quán)重系數(shù)λ通常被用于平衡聲學(xué)和語(yǔ)言模型得分,最終的解碼路徑由以下公式?jīng)Q定:本發(fā)明的電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音交互方法,包括如下步驟:(101)用戶接通電話,語(yǔ)音導(dǎo)航系統(tǒng)接收到請(qǐng)求;(102)語(yǔ)音導(dǎo)航系統(tǒng)將請(qǐng)求發(fā)送給mcp(mediacontrolplatform)單元;(103)mcp單元返回給對(duì)應(yīng)的語(yǔ)音文件、提示音給語(yǔ)音導(dǎo)航系統(tǒng);(104)語(yǔ)音導(dǎo)航系統(tǒng)播報(bào)提示音給用戶;(105)用戶語(yǔ)音輸入,進(jìn)行識(shí)別請(qǐng)求;(106)語(yǔ)音導(dǎo)航系統(tǒng)將識(shí)別請(qǐng)求通過(guò)mcp單元轉(zhuǎn)發(fā)至語(yǔ)音識(shí)別引擎;引入反饋,將用戶語(yǔ)音識(shí)別的結(jié)果反饋給用戶,得到用戶的確認(rèn)后,進(jìn)行下一步;(107)語(yǔ)音識(shí)別引擎進(jìn)行語(yǔ)音識(shí)別,并將轉(zhuǎn)寫(xiě)文本發(fā)送給語(yǔ)義理解引擎;(108)語(yǔ)義理解引擎獲取語(yǔ)義上下文信息,給出語(yǔ)義識(shí)別結(jié)果,并將結(jié)果返回給語(yǔ)音識(shí)別引擎;(109)語(yǔ)音識(shí)別引擎將語(yǔ)義結(jié)果返回給語(yǔ)音導(dǎo)航系統(tǒng);(110)語(yǔ)音導(dǎo)航系統(tǒng)將語(yǔ)義結(jié)果發(fā)送至mcp單元,進(jìn)行流程跳轉(zhuǎn)控制;(111)mcp單元返回最終結(jié)果給語(yǔ)音導(dǎo)航系統(tǒng);(112)語(yǔ)音導(dǎo)航系統(tǒng)將結(jié)果通過(guò)語(yǔ)音播報(bào)給用戶。對(duì)于查詢類問(wèn)題,語(yǔ)音導(dǎo)航系統(tǒng)調(diào)用webservice接口,進(jìn)行信息的查詢獲取;且webservice接口返回給語(yǔ)音導(dǎo)航系統(tǒng)對(duì)應(yīng)的客戶的信息,如:電費(fèi)具體是多少。與現(xiàn)有的語(yǔ)音導(dǎo)航系統(tǒng)相比,通過(guò)實(shí)驗(yàn)測(cè)試本發(fā)明提供的語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音識(shí)別模塊的性能,進(jìn)行了孤立單詞識(shí)別、連續(xù)語(yǔ)音識(shí)別(連續(xù)單詞識(shí)別、連續(xù)言語(yǔ)識(shí)別與理解)、特定人語(yǔ)音識(shí)別(客服)、非特定人語(yǔ)音識(shí)別、有限詞匯識(shí)別和無(wú)限詞匯識(shí)別(全音節(jié)語(yǔ)音識(shí)別)等各種語(yǔ)音的輸入,結(jié)果參見(jiàn)表1.本發(fā)明提供的語(yǔ)音導(dǎo)航系統(tǒng)綜合識(shí)別率達(dá)到90%,其中孤立單詞識(shí)別和特定人語(yǔ)音識(shí)別的識(shí)別率達(dá)到100%。識(shí)別對(duì)象傳統(tǒng)模型的語(yǔ)音導(dǎo)航系統(tǒng)本發(fā)明的語(yǔ)音導(dǎo)航系統(tǒng)孤立單詞識(shí)別80%100%連續(xù)語(yǔ)音識(shí)別73%85%特定人語(yǔ)音識(shí)別(客服)89%100%非特定人語(yǔ)音識(shí)別82.10%94.00%有限詞匯識(shí)別85%97%無(wú)限詞匯識(shí)別80.20%89%綜合80%90%表1基于傳統(tǒng)模型的語(yǔ)音導(dǎo)航系統(tǒng)和本發(fā)明的語(yǔ)音導(dǎo)航系統(tǒng)效果對(duì)比圖本發(fā)明的一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng),在識(shí)別率、魯棒性方面比基于傳統(tǒng)模型的語(yǔ)音導(dǎo)航有很大的改善和提高。本發(fā)明的一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng),即使在有一定噪音的環(huán)境下,系統(tǒng)的識(shí)別率達(dá)也能達(dá)到95%以上。本發(fā)明的一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音識(shí)別方法,采用dnn-hmm模型的語(yǔ)音識(shí)別引擎,具有識(shí)別率高,識(shí)別速度快,可移植性好等優(yōu)點(diǎn)。本發(fā)明的一種電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)的語(yǔ)音識(shí)別方法,,應(yīng)用電力系統(tǒng)的語(yǔ)音導(dǎo)航系統(tǒng)中,在模型的訓(xùn)練、識(shí)別率、魯棒性方面有顯著的改善,有效提高語(yǔ)音識(shí)別率,為語(yǔ)音導(dǎo)航系統(tǒng)識(shí)別提供了新的手段。以上所述僅為本發(fā)明的較佳實(shí)施例而已,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換或改進(jìn)等,均應(yīng)包含在本發(fā)明的保護(hù)范圍之內(nèi)。當(dāng)前第1頁(yè)12