欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音識別方法及系統(tǒng)的制作方法

文檔序號:2833027閱讀:456來源:國知局
專利名稱:語音識別方法及系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及語音識別技術(shù)領(lǐng)域,特別涉及一種語音識別方法及系統(tǒng)。
背景技術(shù)
實(shí)現(xiàn)人機(jī)之間人性化、智能化的有效交互,構(gòu)建高效自然的人機(jī)交流環(huán)境,已經(jīng)成為當(dāng)前信息技術(shù)應(yīng)用和發(fā)展的迫切需求。近年來,隨著語音識別技術(shù)的飛速發(fā)展,語音輸入、語音搜索等各種在線語音識別應(yīng)用受到了越來越多的關(guān)注。預(yù)先基于海量數(shù)據(jù)訓(xùn)練的系統(tǒng)能滿足常用語音輸入撰寫的需要,特別當(dāng)語音輸入內(nèi)容符合原語言模型概率分布時識別準(zhǔn)確率往往較高。然而在實(shí)際應(yīng)用中,移動互聯(lián)網(wǎng)和社交網(wǎng)絡(luò)快速發(fā)展不斷產(chǎn)生著新的熱點(diǎn)話題及相應(yīng)的熱點(diǎn)詞匯,不同用戶也存在不同個性化詞匯的識別需求,如聯(lián)絡(luò)人名等, 這些熱點(diǎn)詞匯或個性化詞匯由于時效性和特異性在原始采集的語料中往往出現(xiàn)頻度較低, 因而原語言模型對該類詞匯往往覆蓋不足,進(jìn)而導(dǎo)致相應(yīng)識別系統(tǒng)不能準(zhǔn)確識別該類熱
ο為此,在現(xiàn)有技術(shù)中往往采用系統(tǒng)參數(shù)重估的方法,在將新收集的熱詞語料加入原語料庫后,重新訓(xùn)練新的語言模型以提高對新增熱詞的識別準(zhǔn)確率。然而,在實(shí)際應(yīng)用中,熱詞更新頻度往往較高,系統(tǒng)無法及時收集足夠語料參與系統(tǒng)參數(shù)重估,進(jìn)而影響對熱詞的識別效果。另一方面,語言模型的重新訓(xùn)練以及識別系統(tǒng)資源(如基于WFST(Weighted Finite-State Transducers,加權(quán)有限狀態(tài)轉(zhuǎn)換器)的解碼識別網(wǎng)絡(luò))的構(gòu)建往往費(fèi)時較多,代價較大,無法實(shí)現(xiàn)對熱詞識別的快速響應(yīng)。

發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供一種語音識別方法及系統(tǒng),以解決現(xiàn)有技術(shù)無法快速、準(zhǔn)確識別熱點(diǎn)詞匯及用戶個性化詞匯的技術(shù)問題。為此,本發(fā)明實(shí)施例提供如下技術(shù)方案一種語音識別方法,包括構(gòu)建解碼識別網(wǎng)絡(luò);對接收的語音信號,根據(jù)所述解碼識別網(wǎng)絡(luò)對其中每幀語音信號幀進(jìn)行解碼,并在解碼過程中根據(jù)熱詞對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵,以提高熱詞所在路徑的累積歷史路徑概率;在完成對最后一幀語音信號幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn);從所述最優(yōu)節(jié)點(diǎn)通過解碼狀態(tài)回溯得到最優(yōu)路徑及對應(yīng)的單詞序列。一種語音識別系統(tǒng),包括網(wǎng)絡(luò)構(gòu)建單元,用于構(gòu)建解碼識別網(wǎng)絡(luò);解碼單元,用于對接收的語音信號,根據(jù)所述解碼識別網(wǎng)絡(luò)對其中每幀語音信號幀進(jìn)行解碼;
激勵單元,用于在所述解碼單元的解碼過程中根據(jù)熱詞對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵,以提高熱詞所在路徑的累積歷史路徑概率;最優(yōu)節(jié)點(diǎn)確定單元,用于在所述解碼單元完成對最后一幀語音信號幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn);回溯單元,用于從所述最優(yōu)節(jié)點(diǎn)通過解碼狀態(tài)回溯得到最優(yōu)路徑及對應(yīng)的單詞序列。本發(fā)明實(shí)施例語音識別方法及系統(tǒng),采用基于熱詞匹配對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵,以提高熱詞所在路徑的累積歷史路徑概率,實(shí)現(xiàn)了對熱詞識別的有效激勵,提高了熱詞的識別效果。無需系統(tǒng)參數(shù)重估,即可快速、準(zhǔn)確識別熱點(diǎn)詞匯及用戶個性化詞匯,為系統(tǒng)支持用戶定制的個性化詞庫或個性化語言模型提供了一種可行的解決方案,用戶通過簡單的更新系統(tǒng)支持的熱詞詞條即可實(shí)現(xiàn)對個性化詞匯的識別支持。


為了更清楚地說明本發(fā)明實(shí)施的技術(shù)方案,下面將對實(shí)施例中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖I是本發(fā)明實(shí)施例語音識別方法的流程圖2是本發(fā)明實(shí)施例中一種基于WFST的解碼識別網(wǎng)絡(luò)的示意圖3是本發(fā)明實(shí)施例中樹形結(jié)構(gòu)的熱詞詞典的示意圖4是本發(fā)明實(shí)施例中根據(jù)熱詞集合對解碼得到的歷史路徑進(jìn)行激勵的一種流圖5是本發(fā)明實(shí)施例中根據(jù)熱詞詞典對解碼得到的歷史路徑進(jìn)行激勵的一種流
程程圖;圖6是本發(fā)明實(shí)施例中根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率的一種實(shí)現(xiàn)流程圖;圖7是本發(fā)明實(shí)施例中根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率的另一種實(shí)現(xiàn)流程圖8是本發(fā)明實(shí)施例中熱詞詞典的一種具體示意圖9是本發(fā)明實(shí)施例語音識別系統(tǒng)的結(jié)構(gòu)示意圖10是本發(fā)明實(shí)施例語音識別系統(tǒng)的一種具體應(yīng)用結(jié)構(gòu)示意圖11是本發(fā)明實(shí)施例語音識別系統(tǒng)的另一種具體應(yīng)用結(jié)構(gòu)示意圖; 圖12是本發(fā)明實(shí)施例中激勵子單元的一種結(jié)構(gòu)示意圖13是本發(fā)明實(shí)施例中激勵子單元的另一種結(jié)構(gòu)示意圖。
具體實(shí)施例方式下面將結(jié)合本發(fā)明實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
為了使本發(fā)明實(shí)施例的方案更容易理解,并且更好地體現(xiàn)與現(xiàn)有語音識別方案的區(qū)別,下面首先對現(xiàn)有技術(shù)中基本的語音識別方法做簡單說明。在現(xiàn)有技術(shù)中,通常是將語言模型的語義網(wǎng)絡(luò)通過聲學(xué)模型及字典等擴(kuò)展成基于模型狀態(tài)層的搜索網(wǎng)絡(luò),即構(gòu)建解碼識別網(wǎng)絡(luò),然后在對輸入語音信號解碼時,通過計(jì)算輸入的每一幀語音信號相對于當(dāng)前有效擴(kuò)展路徑上的每個聲學(xué)模型及語言模型的累積歷史路徑概率獲取新的有效擴(kuò)展路徑。隨后在搜索完最后一幀語音信號時,通過從具有最大累積歷史路徑概率的最優(yōu)節(jié)點(diǎn)執(zhí)行狀態(tài)回溯得到解碼最優(yōu)路徑,得到對應(yīng)的單詞序列。本發(fā)明實(shí)施例語音識別方法及系統(tǒng),針對現(xiàn)有技術(shù)采用系統(tǒng)參數(shù)重估的方式提高對新增熱詞的識別準(zhǔn)確率,無法快速、準(zhǔn)確識別熱點(diǎn)詞匯及用戶個性化詞匯的技術(shù)問題,對當(dāng)前歷史路徑基于熱詞進(jìn)行激勵,從而提高熱詞所在路徑的累積歷史路徑概率,提高了熱詞的識別效果。無需系統(tǒng)參數(shù)重估,即可快速、準(zhǔn)確識別熱點(diǎn)詞匯及用戶個性化詞匯。如圖I所示,是本發(fā)明實(shí)施例語音識別方法的流程圖,包括以下步驟步驟101,構(gòu)建解碼識別網(wǎng)絡(luò)。在本發(fā)明實(shí)施例中,所述解碼識別網(wǎng)絡(luò)可以由系統(tǒng)在線構(gòu)建,也可以通過離線方式構(gòu)建,在系統(tǒng)啟動時直接載入,以減少系統(tǒng)運(yùn)算量及所需內(nèi)存,進(jìn)一步提高解碼效率。步驟102,對接收的語音信號,根據(jù)所述解碼識別網(wǎng)絡(luò)對其中每幀語音信號幀進(jìn)行解碼,并在解碼過程中根據(jù)熱詞對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵,以提高熱詞所在路徑的累積歷史路徑概率。利用所述解碼識別網(wǎng)絡(luò)對用戶輸入的語音信號進(jìn)行解碼的過程是一個在該解碼識別網(wǎng)絡(luò)中搜索最優(yōu)路徑,實(shí)現(xiàn)語音到文本的轉(zhuǎn)換的過程。具體地,可以首先對接收的連續(xù)語音信號采樣為一系列離散能量值存入數(shù)據(jù)緩存區(qū)。當(dāng)然,為了進(jìn)一步提高系統(tǒng)的魯棒性,還可以先對接收到的連續(xù)語音信號進(jìn)行降噪處理。首先通過對語音信號的短時能量和短時過零率分析,將連續(xù)的語音信號分割成獨(dú)立的語音片斷和非語音片斷,然后對分割得到的語音片斷進(jìn)行語音增強(qiáng)處理,在進(jìn)行語音增強(qiáng)處理時,可以通過維納濾波等方法,將語音信號中的環(huán)境噪聲進(jìn)一步消除,以提高后續(xù)系統(tǒng)對該信號的處理能力??紤]到降噪處理后的語音信號中依然會存在大量語音識別無關(guān)的冗余信息,直接對其識別可能會使運(yùn)算量和識別準(zhǔn)確率降低,為此,可以從降噪處理后的語音能量信號中提取識別有效語音特征,并存入特征緩存區(qū)內(nèi)。具體地,可以提取語音的MFCC(Mel Frequency Cepstrum Coefficient,Mel頻率倒譜系數(shù))特征,對窗長25ms巾貞移IOms的每幀語音數(shù)據(jù)做短時分析得到MFCC參數(shù)及其一階、二階差分,共計(jì)39維。也就是說,將每幀語音信號量化為一 39維的特征序列。然后,根據(jù)所述解碼識別網(wǎng)絡(luò)對其中每幀語音信號進(jìn)行解碼,獲取最優(yōu)路徑,從而完成解碼識別過程。在現(xiàn)有技術(shù)中,最優(yōu)路徑的搜索過程如下按照從左到右的時間順序,計(jì)算每幀語音信號幀到達(dá)解碼識別網(wǎng)絡(luò)中每個活躍節(jié)點(diǎn)的累積歷史路徑概率。具體地,對于需要考察的每幀語音信號幀,可以首先計(jì)算當(dāng)前解碼識別網(wǎng)絡(luò)中所有活躍節(jié)點(diǎn)相對于該語音信號幀的歷史路徑和累積歷史路徑概率。
7
比如,對于當(dāng)前的一幀語音信號,對應(yīng)的語音特征序列為IO1, O2, , 0t},其中t 時刻的語音特征ot轉(zhuǎn)入活躍節(jié)點(diǎn)j的路徑概率,即從活躍節(jié)點(diǎn)i到該節(jié)點(diǎn)j的所有可
能歷史路徑的概率最大值計(jì)算如下
%⑴ ( \ )其中,i表示解碼識別網(wǎng)絡(luò)中所有與活躍節(jié)點(diǎn)j相連的活躍節(jié)點(diǎn);灼(〖-1)表示 (t-Ι)時刻特征CV1落在活躍節(jié)點(diǎn)i上的歷史路徑概率;au表示從節(jié)點(diǎn)i到節(jié)點(diǎn)j的轉(zhuǎn)移概率,而h (ot)表示第t時刻特征Ot相應(yīng)于節(jié)點(diǎn)j的似然概率。活躍節(jié)點(diǎn)j的累積歷史路徑概率為所有和活躍節(jié)點(diǎn)j相連的節(jié)點(diǎn)路徑中具有最大累積路徑概率的路徑得分。也就是說,在計(jì)算活躍節(jié)點(diǎn)j的累積路徑概率的同時,也獲知了活躍節(jié)點(diǎn)j的前一節(jié)點(diǎn),進(jìn)而獲知活躍節(jié)點(diǎn)j的歷史路徑。然后,獲取下一幀語音信號幀,并從滿足系統(tǒng)預(yù)設(shè)條件的歷史路徑向后擴(kuò)展解碼。 當(dāng)對最后一幀語音信號幀解碼后,其中具有最大累積歷史路徑概率的活躍節(jié)點(diǎn)即為最優(yōu)節(jié)點(diǎn),從該最優(yōu)節(jié)點(diǎn)通過解碼狀態(tài)回溯得到的歷史路徑即為最優(yōu)路徑,該最優(yōu)路徑上的單詞序列即為解碼結(jié)果。由于基于海量數(shù)據(jù)訓(xùn)練的語言模型能夠很好地體現(xiàn)原語料庫的詞匯分布,因而對大部分常規(guī)詞匯具有較好的識別效果。而熱點(diǎn)詞匯及用戶個性化詞匯由于具有個性化的特點(diǎn),在原有語言模型中概率較小,因而其對應(yīng)的解碼路徑得分往往偏低,導(dǎo)致不能正確識別。為此,在本發(fā)明實(shí)施中,基于熱詞對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵,保持熱詞在搜索路徑擴(kuò)展中的存活時間,從而使解碼識別網(wǎng)絡(luò)中可能和熱詞匹配的路徑得到優(yōu)化,提高熱詞匹配的成功率,熱詞識別正確性也可得到相應(yīng)提高。具體地,對解碼識別網(wǎng)絡(luò)中可能和熱詞匹配的路徑可以采用不同的激勵方式,對此將在后面詳細(xì)說明。步驟103,在完成對最后一幀語音信號幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn)。步驟104,從所述最優(yōu)節(jié)點(diǎn)通過解碼狀態(tài)回溯得到最優(yōu)路徑及對應(yīng)的單詞序列。從所述最優(yōu)節(jié)點(diǎn)通過解碼狀態(tài)回溯得到的歷史路徑即為最優(yōu)路徑。由此可見,本發(fā)明實(shí)施例語音識別方法,采用基于熱詞匹配的歷史路徑激勵處理, 使熱詞所在路徑的累積歷史路徑概率得到優(yōu)化,提高了熱詞的識別效果。利用本發(fā)明實(shí)施例語音識別方法,無需系統(tǒng)參數(shù)重估,即可快速、準(zhǔn)確識別熱點(diǎn)詞匯及用戶個性化詞匯,為系統(tǒng)支持用戶定制的個性化詞庫或個性化語言模型提供了一種可行的解決方案,用戶通過簡單的更新系統(tǒng)支持的熱詞詞庫即可實(shí)現(xiàn)對個性化詞匯的識別支持。前面提到,在本發(fā)明實(shí)施例中,所述解碼識別網(wǎng)絡(luò)可以由系統(tǒng)在線構(gòu)建,也可以通過離線方式構(gòu)建,在系統(tǒng)啟動時直接載入,以減少系統(tǒng)運(yùn)算量及所需內(nèi)存,進(jìn)一步提高解碼效率。具體地,所述解碼識別網(wǎng)絡(luò)的構(gòu)建可以利用預(yù)設(shè)的聲學(xué)模型和語言模型等構(gòu)建。其中,所述聲學(xué)模型主要用于模擬字符音特點(diǎn),具體可以采用語音識別領(lǐng)域常用的基于轉(zhuǎn)移概率和傳輸概率的HMM(Hidden Markov Model,隱馬爾可夫)模型。考慮到在大詞匯量連續(xù)語音識別中,詞匯量的數(shù)量過于龐大,若是對每個字符都構(gòu)建一個HMM模型,則模型數(shù)量太多,不利于數(shù)據(jù)存儲及計(jì)算。因此,在實(shí)際應(yīng)用中,可以僅對基本的發(fā)音單元,如音節(jié)或音素單元構(gòu)建HMM模型。顯然聲學(xué)模型還可以采用其他技術(shù)手段,比如神經(jīng)網(wǎng)絡(luò)等, 對此本發(fā)明實(shí)施例不做限定。其中,所述語言模型是為了更有效地表征語法及語義等知識,以彌補(bǔ)聲學(xué)模型的不足,提高識別率。具體可以采用語音識別領(lǐng)域常用統(tǒng)計(jì)語言模型,利用統(tǒng)計(jì)概率的方式描述詞和詞之間的關(guān)系,即假設(shè)某個詞Wk出現(xiàn)的概率僅和其前η-i個詞相關(guān),記為 p(wk|W1k-1) = p(wk|Wkk;^1)。顯然語言模型也可以采用其他技術(shù)手段,比如字詞對等,對此本發(fā)明實(shí)施例不做限定。所述解碼識別網(wǎng)絡(luò)的構(gòu)建可以采用現(xiàn)有技術(shù)中的一些構(gòu)建方法,利用聲學(xué)模型將所述語言模型擴(kuò)展成模型層的搜索網(wǎng)絡(luò)。圖2示出了一種基于WFST的解碼識別網(wǎng)絡(luò)的示意圖。當(dāng)然,還可以采用其他方式的解碼識別網(wǎng)絡(luò),如基于歷史詞樹拷貝的動態(tài)解碼識別網(wǎng)絡(luò)等。在本發(fā)明實(shí)施例中,允許用戶隨時自定義熱詞,以擴(kuò)大系統(tǒng)的識別范圍,適應(yīng)詞匯不斷變化的需求。具體地,當(dāng)用戶輸入新的熱詞后,可以將所述熱詞保存到熱詞集合。也就是說,所述熱詞集合可以是一個動態(tài)更新的熱詞詞條庫。另外,在更新所述熱詞詞庫時,還可以采用分詞算法,通過使用系統(tǒng)預(yù)置的現(xiàn)有詞典對用戶新增自定義的熱詞的文本進(jìn)行分詞,使每個熱詞詞條都表述為一個由系統(tǒng)現(xiàn)有基本字詞單元組成的序列,并將得到的分詞結(jié)果保存到熱詞詞典,該分詞結(jié)果可以由圖3所示的樹形結(jié)構(gòu)管理,每一個分支對應(yīng)一個熱詞詞條,具體如下熱詞A:Wordil Wordi2 Wordi3 ;熱詞B :Wordi I Wordi4 ;熱詞C Wordi5 ;...;熱詞N ffordi j. . . Wordik0該熱詞詞典可以是一個動態(tài)更新的熱詞分詞庫?;谏鲜鰺嵩~集合或熱詞詞典,對解碼識別網(wǎng)絡(luò)中可能和熱詞匹配的路徑可以采用不同的激勵方式,對此下面詳細(xì)說明。I.根據(jù)熱詞集合對解碼得到的歷史路徑進(jìn)行優(yōu)化如圖4所示,是本發(fā)明實(shí)施例中根據(jù)熱詞集合對解碼得到的歷史路徑進(jìn)行激勵的一種流程圖。在該流程中,在活躍節(jié)點(diǎn)的歷史路徑對應(yīng)的單詞序列可以構(gòu)成一個熱詞詞條時給予適當(dāng)?shù)牡梅旨?,以提高該歷史路徑的優(yōu)先級。該流程具體包括以下步驟步驟401,獲取對當(dāng)前語音信號幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率。步驟402,根據(jù)所述熱詞集合判斷所述歷史路徑上鄰近單詞是否構(gòu)成一條熱詞; 如果是,則執(zhí)行步驟403 ;否則,執(zhí)行步驟404。步驟403,提高所述歷史路徑的累積歷史路徑概率。
比如,可以采取固定激勵加分的方法來提高熱詞所在路徑的優(yōu)先級,以使熱詞所在路徑更容易保留。固定激勵加分的具體數(shù)值可以根據(jù)需要預(yù)先設(shè)定,一般來說,激勵加分越高,則熱詞匹配度越高,熱詞識別正確性也相應(yīng)提高。在平衡熱詞識別率和其它非熱詞識別率的基礎(chǔ)上可以設(shè)置固定激勵加分的參考值為300,當(dāng)然,也可以是其它數(shù)值,對此本發(fā)明實(shí)施例不做限定。步驟404,保持所述歷史路徑的累積歷史路徑概率。需要說明的是,步驟402至步驟404,需要對步驟401獲取的每一條歷史路徑逐一執(zhí)行,即對步驟401獲取的所有活躍節(jié)點(diǎn)的歷史路徑中不包含熱詞的歷史路徑保持其路徑概率,而對包含熱詞的歷史路徑概率進(jìn)行激勵。需要說明的是,在實(shí)際應(yīng)用中,在進(jìn)行下一幀語音信號幀解碼之前,還可以對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行優(yōu)化,刪除部分不可能的路徑以提高后續(xù)搜索效率。具體地,可以采用基于概率裁減門限的方法,首先統(tǒng)計(jì)當(dāng)前活躍節(jié)點(diǎn)累積歷史路徑概率的最高值,然后分別計(jì)算各活躍節(jié)點(diǎn)的累積歷史路徑概率與該最高值的差值,將其中差值大于預(yù)先設(shè)置的裁剪門限的活躍節(jié)點(diǎn)設(shè)為非活躍節(jié)點(diǎn),并從后續(xù)搜索路徑中剪除,中止從該節(jié)點(diǎn)開始的后續(xù)搜索。在本發(fā)明實(shí)施例中,上述過程需要在對當(dāng)前語音信號幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑按照圖4所示流程激勵之后,根據(jù)當(dāng)前所有活躍節(jié)點(diǎn)(包括激勵后的活躍節(jié)點(diǎn)和未激勵的活躍節(jié)點(diǎn))的累積歷史路徑概率確定新的活躍節(jié)點(diǎn),實(shí)現(xiàn)后續(xù)路徑的擴(kuò)展。在圖4所示流程中,通過固定激勵加分的方法來提高熱詞所在路徑的優(yōu)先級,實(shí)現(xiàn)對熱詞所在路徑的優(yōu)化。在實(shí)際應(yīng)用中,由于熱詞往往由兩個或多個分詞構(gòu)成,上述在熱詞詞條實(shí)現(xiàn)完整匹配時給予激勵的方式可能會由于熱詞詞條所在路徑過早被裁減而達(dá)不到激勵的目的,影響熱詞識別的準(zhǔn)確率。為此,在本發(fā)明實(shí)施例中,還可以采用基于預(yù)測路徑的激勵方法,通過逐步給予激勵的方式不斷提高熱詞所在路徑的優(yōu)先級。2.根據(jù)熱詞詞典對解碼得到的歷史路徑進(jìn)行優(yōu)化如圖5所示,是本發(fā)明實(shí)施例中根據(jù)熱詞詞典對解碼得到的歷史路徑進(jìn)行激勵的一種流程圖,包括以下步驟步驟501,獲取對當(dāng)前語音信號幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率。步驟502,判斷所述活躍節(jié)點(diǎn)的歷史路徑中是否出現(xiàn)新詞;如果是,則執(zhí)行步驟 503 ;否則,執(zhí)行步驟504。步驟503,根據(jù)所述新詞相對于所述歷史路徑上對應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率。步驟504,保持所述歷史路徑的累積歷史路徑概率。需要說明的是,對于每一幀語音信號幀的所有活躍節(jié)點(diǎn)的歷史路徑,都需要進(jìn)行上述步驟502至步驟504的過程。而且,在進(jìn)行下一幀語音信號幀解碼之前,還可以對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行優(yōu)化,刪除部分不可能的路徑以提高后續(xù)搜索效率。具體地,可以采用基于概率裁減門限的方法,首先統(tǒng)計(jì)當(dāng)前活躍節(jié)點(diǎn)累積歷史路徑概率的最高值,然后分別計(jì)算各活躍節(jié)點(diǎn)的累積歷史路徑概率與該最高值的差值,將其中差值大于預(yù)先設(shè)置的裁剪門限的活躍節(jié)點(diǎn)設(shè)為非活躍節(jié)點(diǎn),并從后續(xù)搜索路徑中剪除,中止從該節(jié)點(diǎn)開始的后續(xù)搜索。不同于上述在熱詞完全匹配時才對歷史路徑激勵,步驟503在解碼過程中熱詞部分匹配時即對歷史路徑實(shí)行激勵,即根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率,通過提前提高路徑累計(jì)概率,可以更好地確保熱詞所在路徑的存活概率。上述步驟503的可以采用多種不同的方法實(shí)現(xiàn),比如如圖6所示,是本發(fā)明實(shí)施例中根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率的一種實(shí)現(xiàn)流程圖,包括以下步驟步驟601,判斷新詞是否是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞;如果是, 則執(zhí)行步驟605 ;否則,執(zhí)行步驟602。步驟602,判斷所述新詞是否為所述熱詞詞典中的起始分詞;如果是,則執(zhí)行步驟 603 ;否則,執(zhí)行步驟604。步驟603,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對應(yīng)的加分。步驟604,保持所述歷史路徑的累積歷史路徑概率。步驟605,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對應(yīng)的加分。如圖7所示,是本發(fā)明實(shí)施例中根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率的另一種實(shí)現(xiàn)流程圖,包括以下步驟步驟701,判斷新詞所在歷史路徑上所述新詞之前的單詞序列是否為所述熱詞詞典中的一個完整熱詞;如果是,則執(zhí)行步驟705 ;否則,執(zhí)行步驟702。步驟702,判斷所述新詞是否是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞;如果是,則執(zhí)行步驟703 ;否則,執(zhí)行步驟704。步驟703,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對應(yīng)的加分。步驟704,撤銷之前對所述歷史路徑的累積歷史路徑概率的加分。步驟705,判斷所述新詞是否為所述熱詞詞典中的起始分詞;如果是,則執(zhí)行步驟 706 ;否則,執(zhí)行步驟707。步驟706,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對應(yīng)的加分。步驟707,保持所述歷史路徑的累積歷史路徑概率。利用圖7所示流程,可以進(jìn)一步避免錯誤地對非熱詞所在歷史路徑的激勵。另外在實(shí)際應(yīng)用中,如果對每一個活躍節(jié)點(diǎn)對應(yīng)的歷史路徑僅保留一條熱詞分詞歷史記錄,則在解碼中可能無法保證所有包含熱詞的路徑都能被發(fā)現(xiàn)。例如,熱詞A的詞序列為WordlWord2Word3,而熱詞B的詞序列為Word2Word4,當(dāng)輸入詞序列為 Wordlfford2fford4時,在對“Word2”解碼時會優(yōu)先匹配到熱詞A的Word2分詞,而忽略了熱詞B的Word2分詞,使得詞序列WordlWord2Word4最終并沒有匹配到Word2Word4的熱詞B 上。對此,在本發(fā)明實(shí)施例中,還可以采用對單個活躍節(jié)點(diǎn)的歷史路徑保留多個熱詞分詞匹配歷史的方法來提高熱詞匹配的合理性。即在對“Word2”解碼時,不僅保留“WordlWord2” 的熱詞A的部分匹配歷史,同時保留“Word2”的熱詞B的部分匹配歷史,并對同一歷史路徑相應(yīng)保存多個激勵附加值。隨后在后續(xù)解碼中當(dāng)確定某項(xiàng)熱詞分詞匹配結(jié)果不可能繼續(xù)擴(kuò)展時,再撤銷之前對所述歷史路徑的由于熱詞分詞產(chǎn)生的累積歷史路徑概率的加分。在實(shí)際應(yīng)用中,可以根據(jù)解碼所得單詞和熱詞分詞的匹配度對路徑概率進(jìn)行激勵。比如,可以在解碼獲取新詞時獲取系統(tǒng)預(yù)置的熱詞分詞權(quán)重,并對路徑進(jìn)行激勵。特別的,還可以通過設(shè)置熱詞分詞詞典的熱詞分詞首尾字符的權(quán)重,而將其他分詞權(quán)重簡單設(shè)置為O以簡化激勵過程。比如,假設(shè)當(dāng)前的熱詞詞典如圖8所示,由“中國,中華,人民,人們” 構(gòu)成。解碼識別時,若解碼得到的某個活躍節(jié)點(diǎn)的歷史路徑上出現(xiàn)“中”或者“人”時,即和熱詞詞典的首字符匹配時,對所述歷史路徑給予與對應(yīng)熱詞分詞“中”或“人”相應(yīng)的分值激勵,即對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述首字符對應(yīng)的加分。隨后,當(dāng)熱詞分詞所在路徑進(jìn)行后續(xù)擴(kuò)展時,若后續(xù)擴(kuò)展路徑上出現(xiàn)“國,華”或“民,們”,構(gòu)成“中國”,“中華”,“人民”,“人們”的熱詞或部分熱詞時,則繼續(xù)對該路徑給予與“國”,“華”,“民”,“們”相應(yīng)的分值激勵。否則當(dāng)所述熱詞分詞所在路徑擴(kuò)展為其他非熱詞字詞時,對所在路徑不給予激勵,或者刪除前面增加的激勵??梢?,該實(shí)施例的語音識別方法,采用基于預(yù)測路徑的激勵方法,通過逐步給予激勵的方式不斷提高熱詞所在路徑的優(yōu)先級,實(shí)現(xiàn)對熱詞所在路徑的優(yōu)化,提高了熱詞的識別效果。相應(yīng)地,本發(fā)明實(shí)施例還提供一種語音識別系統(tǒng),如圖9所示,是該系統(tǒng)的一種結(jié)構(gòu)示意圖。在該實(shí)施例中,所述系統(tǒng)包括網(wǎng)絡(luò)構(gòu)建單元901,用于構(gòu)建解碼識別網(wǎng)絡(luò);解碼單元902,用于對接收的語音信號,根據(jù)所述解碼識別網(wǎng)絡(luò)對其中每幀語音信號幀進(jìn)行解碼;激勵單元903,用于在所述解碼單元902的解碼過程中根據(jù)熱詞對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵,以提高熱詞所在路徑的累積歷史路徑概率;最優(yōu)節(jié)點(diǎn)確定單元904,用于在所述解碼單元902完成對最后一幀語音信號幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn);回溯單元905,用于從所述最優(yōu)節(jié)點(diǎn)通過解碼狀態(tài)回溯得到最優(yōu)路徑及對應(yīng)的單詞序列。在本發(fā)明實(shí)施例中,網(wǎng)絡(luò)構(gòu)建單元901具體可以通過在線方式構(gòu)建所述解碼識別網(wǎng)絡(luò),也可以通過離線方式構(gòu)建所述解碼識別網(wǎng)絡(luò),在系統(tǒng)啟動時直接載入已構(gòu)建的解碼識別網(wǎng)絡(luò),可以減少系統(tǒng)運(yùn)算量及所需內(nèi)存,進(jìn)一步提高解碼效率。網(wǎng)絡(luò)構(gòu)建單元901具體可以利用預(yù)設(shè)的聲學(xué)模型和語言模型等構(gòu)建,在此不再詳細(xì)描述。在本發(fā)明實(shí)施例中,解碼單元902利用所述解碼識別網(wǎng)絡(luò)對用戶輸入的語音信號進(jìn)行解碼的過程是一個計(jì)算每幀語音信號幀到達(dá)解碼識別網(wǎng)絡(luò)中每個活躍節(jié)點(diǎn)的累積歷史路徑概率的過程,當(dāng)解碼單元902對每一幀語音信號幀解碼后,可以得到當(dāng)前所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率,激勵單元903可以采用多種不同方式根據(jù)熱詞對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵,提高熱詞所在路徑的累積歷史路徑概率,具體將在后面詳細(xì)說明。需要說明的是,在實(shí)際應(yīng)用中,在解碼單元902進(jìn)行下一幀語音信號幀解碼之前, 還可以對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行優(yōu)化,刪除部分不可能的路徑以提高后續(xù)搜索效率。具體地,可以采用基于概率裁減門限的方法,首先統(tǒng)計(jì)當(dāng)前活躍節(jié)點(diǎn)累積歷史路徑概率的最高值,然后分別計(jì)算各活躍節(jié)點(diǎn)的累積歷史路徑概率與該最高值的差值,將其中差值大于
12預(yù)先設(shè)置的裁剪門限的活躍節(jié)點(diǎn)設(shè)為非活躍節(jié)點(diǎn),并從后續(xù)搜索路徑中剪除,中止從該節(jié)點(diǎn)開始的后續(xù)搜索。由此可見,本發(fā)明實(shí)施例語音識別系統(tǒng),采用基于熱詞匹配的歷史路徑激勵處理, 使熱詞所在路徑的累積歷史路徑概率得到優(yōu)化,提高了熱詞的識別效果。利用本發(fā)明實(shí)施例語音識別系統(tǒng),無需系統(tǒng)參數(shù)重估,即可快速、準(zhǔn)確識別熱點(diǎn)詞匯及用戶個性化詞匯,為系統(tǒng)支持用戶定制的個性化詞庫或個性化語言模型提供了一種可行的解決方案,用戶通過簡單的更新系統(tǒng)支持的熱詞詞庫即可實(shí)現(xiàn)對個性化詞匯的識別支持。在本發(fā)明實(shí)施例中,允許用戶隨時自定義熱詞,以擴(kuò)大系統(tǒng)的識別范圍,適應(yīng)詞匯不斷變化的需求。如圖10所示,是本發(fā)明實(shí)施例語音識別系統(tǒng)的一種具體應(yīng)用結(jié)構(gòu)示意圖。在該實(shí)施例中,所述系統(tǒng)還包括熱詞集合更新單元911,用于獲取用戶輸入的熱詞,并將所述熱詞保存到熱詞集合。該熱詞集合可以是一個動態(tài)更新的熱詞詞條庫。相應(yīng)地,激勵單元913在解碼過程中根據(jù)所述熱詞集合對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵。在該實(shí)施例中,激勵單元913具體包括獲取子單元9131,判斷子單元9132和激勵子單元9133。其中獲取子單元9131,用于獲取解碼單元702對當(dāng)前語音信號幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率;判斷子單元9132,用于根據(jù)所述熱詞集合判斷所述歷史路徑上鄰近單詞是否構(gòu)成一條熱詞;激勵子單元9133,用于在所述判斷子單元9132判斷所述歷史路徑上鄰近單詞構(gòu)成一條熱詞后,提高所述歷史路徑的累積歷史路徑概率;在所述判斷子單元9132判斷所述歷史路徑上鄰近單詞不能構(gòu)成一條熱詞后,保持所述歷史路徑的累積歷史路徑概率。在進(jìn)行激勵時,可以采取固定激勵加分的方法來提高熱詞所在路徑的優(yōu)先級,以使熱詞所在路徑更容易保留。固定激勵加分的具體數(shù)值可以根據(jù)需要預(yù)先設(shè)定,一般來說,激勵加分越高,則熱詞匹配度越高,熱詞識別正確性也相應(yīng)提高。該實(shí)施例的語音識別系統(tǒng),在活躍節(jié)點(diǎn)的歷史路徑對應(yīng)的單詞序列可以構(gòu)成一個熱詞詞條時給予適當(dāng)?shù)牡梅旨?,?shí)現(xiàn)對熱詞所在路徑的優(yōu)化,提高了熱詞的識別效果。在實(shí)際應(yīng)用中,由于熱詞往往由兩個或多個分詞構(gòu)成,上述在熱詞詞條實(shí)現(xiàn)完整匹配時給予激勵的方式可能會由于熱詞詞條所在路徑過早被裁減而達(dá)不到激勵的目的,影響熱詞識別的準(zhǔn)確率。為此,在本發(fā)明語音識別系統(tǒng)的另一實(shí)施例中,激勵單元還可以采用基于預(yù)測路徑的激勵方法,通過逐步給予激勵的方式不斷提高熱詞所在路徑的優(yōu)先級。如圖11所示,是本發(fā)明實(shí)施例語音識別系統(tǒng)的另一種具體應(yīng)用結(jié)構(gòu)示意圖。在該實(shí)施例中,所述系統(tǒng)還包括熱詞獲取單元921和切分單元922,其中,熱詞獲取單元921用于獲取用戶輸入的熱詞;切分單元922用于對所述熱詞獲取單元獲取的熱詞進(jìn)行文本分詞,并將得到的分詞保存到熱詞詞典。相應(yīng)地,激勵單元923在解碼過程中根據(jù)所述熱詞詞典對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵。在該實(shí)施例中,激勵單元923具體包括獲取子單元9231,新詞判斷子單元9232和激勵子單元9233。其中獲取子單元9231,用于獲取對當(dāng)前語音信號幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率;新詞判斷子單元9232,用于判斷所述活躍節(jié)點(diǎn)的歷史路徑中是否出現(xiàn)新詞;激勵子單元9233,用于在所述新詞判斷子單元9232判斷所述活躍節(jié)點(diǎn)的歷史路徑中出現(xiàn)新詞后,根據(jù)所述新詞相對于所述歷史路徑上對應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率;否則保持所述歷史路徑的累積歷史路徑概率。在該實(shí)施例中,不同于上述圖10中的激勵子單元9133在熱詞完全匹配時才對歷史路徑激勵,激勵子單元9233在解碼過程中熱詞部分匹配時即對歷史路徑實(shí)行激勵,即根據(jù)歷史路徑的擴(kuò)展結(jié)果更新歷史路徑的累積歷史路徑概率,通過提前提高路徑累計(jì)概率, 可以更好地確保熱詞所在路徑的存活概率。所述激勵子單元9233可以有多種實(shí)現(xiàn)方式,下面舉例詳細(xì)進(jìn)行說明。如圖12所示,是本發(fā)明實(shí)施例中激勵子單元的一種具體結(jié)構(gòu)示意圖。在該實(shí)施例中,所述激勵子單元包括第一判斷子單元121,用于判斷所述新詞是否是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞;第一處理子單元122,用于在所述第一判斷子單元121判斷所述新詞是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞后,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對應(yīng)的加分;第二判斷子單元123,用于在所述第一判斷子單元121判斷所述新詞不是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞后,判斷所述新詞是否為所述熱詞詞典中的起始分詞;第二處理子單元124,用于在所述第二判斷子單元123判斷所述新詞是所述熱詞詞典中的起始分詞后,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對應(yīng)的加分;否則保持所述歷史路徑的累積歷史路徑概率。如圖13所示,是本發(fā)明實(shí)施例中激勵子單元的另一種具體結(jié)構(gòu)示意圖。在該實(shí)施例中,所述激勵子單元包括熱詞判斷子單元131,用于判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列是否是所述熱詞詞典中的一個完整熱詞;第三判斷子單元132,用于在所述熱詞判斷子單元131判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列是所述熱詞詞典中的一個完整熱詞時,判斷所述新詞是否是所述熱詞詞典中的起始分詞;第三處理子單元133,用于在所述第三判斷子單元132判斷所述新詞是所述熱詞詞典中的起始分詞后,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對應(yīng)的加分;否則保持所述歷史路徑的累積歷史路徑概率;第四判斷子單元134,用于在所述熱詞判斷子單元131判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列不是所述熱詞詞典中的一個完整熱詞時,判斷所述新詞是否是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞;
第四處理子單元135,用于在所述第四判斷子單元134判斷所述新詞是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞后,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對應(yīng)的加分;否則撤銷之前對所述歷史路徑的累積歷史路徑概率的加分。當(dāng)然,在實(shí)際應(yīng)用中,所述激勵子單元還可以有其它實(shí)現(xiàn)方式,對此本發(fā)明實(shí)施例不做限定。比如,可以對單個活躍節(jié)點(diǎn)的歷史路徑保留多個熱詞分詞匹配歷史,在后續(xù)解碼中當(dāng)確定某項(xiàng)熱詞分詞匹配結(jié)果不可能繼續(xù)擴(kuò)展時,再撤銷之前對所述歷史路徑的由于熱詞分詞產(chǎn)生的累積歷史路徑概率的加分,以此來進(jìn)一步提高熱詞匹配的合理性。該實(shí)施例的語音識別系統(tǒng),采用基于預(yù)測路徑的激勵方法,通過逐步給予激勵的方式不斷提高熱詞所在路徑的優(yōu)先級,實(shí)現(xiàn)對熱詞所在路徑的優(yōu)化,提高了熱詞的識別效果O本說明書中的各個實(shí)施例均采用遞進(jìn)的方式描述,各個實(shí)施例之間相同相似的部分互相參見即可,每個實(shí)施例重點(diǎn)說明的都是與其他實(shí)施例的不同之處。尤其,對于系統(tǒng)實(shí)施例而言,由于其基本相似于方法實(shí)施例,所以描述得比較簡單,相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的系統(tǒng)實(shí)施例僅僅是示意性的,其中所述作為分離部件說明的單元及模塊可以是或者也可以不是物理上分開的。另外,還可以根據(jù)實(shí)際的需要選擇其中的部分或者全部單元和模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以理解并實(shí)施。以上公開的僅為本發(fā)明的優(yōu)選實(shí)施方式,但本發(fā)明并非局限于此,任何本領(lǐng)域的技術(shù)人員能思之的沒有創(chuàng)造性的變化,以及在不脫離本發(fā)明原理前提下所作的若干改進(jìn)和潤飾,都應(yīng)落在本發(fā)明的保護(hù)范圍內(nèi)。
權(quán)利要求
1.一種語音識別方法,其特征在于,包括構(gòu)建解碼識別網(wǎng)絡(luò);對接收的語音信號,根據(jù)所述解碼識別網(wǎng)絡(luò)對其中每幀語音信號幀進(jìn)行解碼,并在解碼過程中根據(jù)熱詞對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵,以提高熱詞所在路徑的累積歷史路徑概率;在完成對最后一幀語音信號幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)占.從所述最優(yōu)節(jié)點(diǎn)通過解碼狀態(tài)回溯得到最優(yōu)路徑及對應(yīng)的單詞序列。
2.如權(quán)利要求I所述的方法,其特征在于,所述方法還包括獲取用戶輸入的熱詞,并將所述熱詞保存到熱詞集合;所述在解碼過程中根據(jù)熱詞對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵包括在解碼過程中根據(jù)所述熱詞集合對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵。
3.如權(quán)利要求2所述的方法,其特征在于,所述在解碼過程中根據(jù)所述熱詞集合對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵包括獲取對當(dāng)前語音信號幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率; 根據(jù)所述熱詞集合判斷所述歷史路徑上鄰近單詞是否構(gòu)成一條熱詞;如果是,則提高所述歷史路徑的累積歷史路徑概率;如果否,則保持所述歷史路徑的累積歷史路徑概率。
4.如權(quán)利要求I所述的方法,其特征在于,所述方法還包括獲取用戶輸入的熱詞,對所述熱詞進(jìn)行文本分詞,并將得到的分詞保存到熱詞詞典;所述在解碼過程中根據(jù)熱詞對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵包括在解碼過程中根據(jù)所述熱詞詞典對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵。
5.如權(quán)利要求4所述的方法,其特征在于,所述在解碼過程中根據(jù)所述熱詞詞典對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵包括獲取對當(dāng)前語音信號幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率; 判斷所述活躍節(jié)點(diǎn)的歷史路徑中是否出現(xiàn)新詞;如果是,則根據(jù)所述新詞相對于所述歷史路徑上對應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率;如果否,則保持所述歷史路徑的累積歷史路徑概率。
6.如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述新詞相對于所述歷史路徑上對應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率包括判斷所述新詞是否是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞;如果是,則對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對應(yīng)的加分; 如果否,則判斷所述新詞是否為所述熱詞詞典中的起始分詞;如果是,則對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對應(yīng)的加分。 如果否,則保持所述歷史路徑的累積歷史路徑概率。
7.如權(quán)利要求5所述的方法,其特征在于,所述根據(jù)所述新詞相對于所述歷史路徑上對應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率包括如果所述新詞所在歷史路徑上所述新詞之前的單詞序列是所述熱詞詞典中的一個完整熱詞,則判斷所述新詞是否為所述熱詞詞典中的起始分詞;如果是,則對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對應(yīng)的加分; 如果否,則保持所述歷史路徑的累積歷史路徑概率;如果所述新詞所在歷史路徑上所述新詞之前的單詞序列不是所述熱詞詞典中的一個完整熱詞,則判斷所述新詞是否是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞;如果是,則對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對應(yīng)的加分; 如果否,則撤銷之前對所述歷史路徑的累積歷史路徑概率的加分。
8.一種語音識別系統(tǒng),其特征在于,包括網(wǎng)絡(luò)構(gòu)建單元,用于構(gòu)建解碼識別網(wǎng)絡(luò);解碼單元,用于對接收的語音信號,根據(jù)所述解碼識別網(wǎng)絡(luò)對其中每幀語音信號幀進(jìn)行解碼;激勵單元,用于在所述解碼單元的解碼過程中根據(jù)熱詞對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵,以提高熱詞所在路徑的累積歷史路徑概率;最優(yōu)節(jié)點(diǎn)確定單元,用于在所述解碼單元完成對最后一幀語音信號幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn);回溯單元,用于從所述最優(yōu)節(jié)點(diǎn)通過解碼狀態(tài)回溯得到最優(yōu)路徑及對應(yīng)的單詞序列。
9.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括熱詞集合更新單元,用于獲取用戶輸入的熱詞,并將所述熱詞保存到熱詞集合;所述激勵單元在所述解碼單元解碼過程中根據(jù)所述熱詞集合對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵。
10.如權(quán)利要求9所述的系統(tǒng),其特征在于,所述激勵單元包括獲取子單元,用于獲取對當(dāng)前語音信號幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率;判斷子單元,用于根據(jù)所述熱詞集合判斷所述歷史路徑上鄰近單詞是否構(gòu)成一條熱詞;激勵子單元,用于在所述判斷子單元判斷所述歷史路徑上鄰近單詞構(gòu)成一條熱詞后, 提高所述歷史路徑的累積歷史路徑概率;在所述判斷子單元判斷所述歷史路徑上鄰近單詞不能構(gòu)成一條熱詞后,保持所述歷史路徑的累積歷史路徑概率。
11.如權(quán)利要求8所述的系統(tǒng),其特征在于,所述系統(tǒng)還包括熱詞獲取單元,用于獲取用戶輸入的熱詞;切分單元,用于對所述熱詞獲取單元獲取的熱詞進(jìn)行文本分詞,并將得到的分詞保存到熱詞詞典;所述激勵單元在所述解碼單元解碼過程中根據(jù)所述熱詞詞典對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵。
12.如權(quán)利要求11所述的系統(tǒng),其特征在于,所述激勵單元包括獲取子單元,用于獲取對當(dāng)前語音信號幀解碼得到的所有活躍節(jié)點(diǎn)的歷史路徑和累積歷史路徑概率;新詞判斷子單元,用于判斷所述活躍節(jié)點(diǎn)的歷史路徑中是否出現(xiàn)新詞;激勵子單元,用于在所述新詞判斷子單元判斷所述活躍節(jié)點(diǎn)的歷史路徑中出現(xiàn)新詞后,根據(jù)所述新詞相對于所述歷史路徑上對應(yīng)所述熱詞詞典中的分詞的擴(kuò)展結(jié)果,更新所述歷史路徑的累積歷史路徑概率;否則保持所述歷史路徑的累積歷史路徑概率。
13.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述激勵子單元包括第一判斷子單元,用于判斷所述新詞是否是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞;第一處理子單元,用于在所述第一判斷子單元判斷所述新詞是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞后,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對應(yīng)的加分;第二判斷子單元,用于在所述第一判斷子單元判斷所述新詞不是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞后,判斷所述新詞是否為所述熱詞詞典中的起始分詞;第二處理子單元,用于在所述第二判斷子單元判斷所述新詞是所述熱詞詞典中的起始分詞后,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對應(yīng)的加分;否則保持所述歷史路徑的累積歷史路徑概率。
14.如權(quán)利要求12所述的系統(tǒng),其特征在于,所述激勵子單元包括熱詞判斷子單元,用于判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列是否是所述熱詞詞典中的一個完整熱詞;第三判斷子單元,用于在所述熱詞判斷子單元判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列是所述熱詞詞典中的一個完整熱詞時,判斷所述新詞是否是所述熱詞詞典中的起始分詞;第三處理子單元,用于在所述第三判斷子單元判斷所述新詞是所述熱詞詞典中的起始分詞后,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述起始分詞對應(yīng)的加分;否則保持所述歷史路徑的累積歷史路徑概率;第四判斷子單元,用于在所述熱詞判斷子單元判斷所述新詞所在歷史路徑上所述新詞之前的單詞序列不是所述熱詞詞典中的一個完整熱詞時,判斷所述新詞是否是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞;第四處理子單元,用于在所述第四判斷子單元判斷所述新詞是所述歷史路徑上對應(yīng)的熱詞分詞的后續(xù)分詞后,對所述歷史路徑的累積歷史路徑概率進(jìn)行與所述后續(xù)分詞對應(yīng)的加分;否則撤銷之前對所述歷史路徑的累積歷史路徑概率的加分。
全文摘要
本發(fā)明涉及語音識別技術(shù)領(lǐng)域,公開了一種語音識別方法及系統(tǒng)。該方法包括構(gòu)建解碼識別網(wǎng)絡(luò);對接收的語音信號,根據(jù)所述解碼識別網(wǎng)絡(luò)對其中每幀語音信號幀進(jìn)行解碼,并在解碼過程中根據(jù)熱詞對活躍節(jié)點(diǎn)的歷史路徑進(jìn)行激勵,以提高熱詞所在路徑的累積歷史路徑概率;在完成對最后一幀語音信號幀解碼后,選擇具有最大累積概率的活躍節(jié)點(diǎn)為最優(yōu)節(jié)點(diǎn);從所述最優(yōu)節(jié)點(diǎn)通過解碼狀態(tài)回溯得到最優(yōu)路徑及對應(yīng)的單詞序列。利用本發(fā)明,無需系統(tǒng)參數(shù)重估,即可快速、準(zhǔn)確識別熱點(diǎn)詞匯及用戶個性化詞匯,提高熱詞的識別效果。
文檔編號G10L15/28GK102592595SQ20121007341
公開日2012年7月18日 申請日期2012年3月19日 優(yōu)先權(quán)日2012年3月19日
發(fā)明者何婷婷, 劉慶峰, 潘青華, 王智國, 胡國平, 胡郁, 鹿曉亮 申請人:安徽科大訊飛信息科技股份有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
白朗县| 景宁| 石嘴山市| 邵武市| 梁河县| 中阳县| 三原县| 晋江市| 潮州市| 芜湖市| 教育| 冷水江市| 靖边县| 东丰县| 寿光市| 枣阳市| 凉城县| 红安县| 平舆县| 安图县| 富平县| 依兰县| 沛县| 东宁县| 云梦县| 山西省| 随州市| 鄢陵县| 卫辉市| 雷山县| 额敏县| 和政县| 京山县| 阳原县| 闽侯县| 泊头市| 黄山市| 淮安市| 高碑店市| 井冈山市| 萨迦县|