欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

語音識別系統(tǒng)的制作方法

文檔序號:2837692閱讀:246來源:國知局
專利名稱:語音識別系統(tǒng)的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及一種語音識別系統(tǒng),且更具體地說,本發(fā)明涉及一種語音部分的檢測精度得以改善的語音識別系統(tǒng)。
背景技術(shù)
在語音識別系統(tǒng)中,例如當(dāng)在嘈雜環(huán)境中發(fā)出的語音直接經(jīng)受語音識別時(shí),由于噪聲的影響語音識別比將惡化。因此,正確檢測語音部分以進(jìn)行語音識別是首要的。
利用矢量內(nèi)積檢測語音部分的傳統(tǒng)公知的語音識別系統(tǒng)如圖4所示構(gòu)造。
該語音識別系統(tǒng)創(chuàng)建以詞或子詞(例如因素或音節(jié))為單位的聲學(xué)樣板(語音HMM),采用一HMM(隱式馬爾可夫原型(Hidden Markov Model)),產(chǎn)生觀察值序列,該觀察值是如果要被識別的語音發(fā)出時(shí),對于輸入的信號的倒頻譜(Cepstrum)的時(shí)間序列,將觀察值序列與語音HMM對照,并選取最相象的語音HMM,其然后作為識別結(jié)果輸出。
更具體地說,采集并存儲在一訓(xùn)練語音數(shù)據(jù)庫內(nèi)的大量語音數(shù)據(jù)Sm被分隔成對于預(yù)定時(shí)間段(約10到20毫秒)幀單元,通過使倒頻譜依次在以幀為單位的每個(gè)數(shù)據(jù)上操作而得到倒頻譜的時(shí)間序列,此外,該倒頻譜的時(shí)間序列被學(xué)習(xí)為語音的特征量,并反映為聲學(xué)樣板(語音HMM)的參數(shù),從而產(chǎn)生以詞或子詞為單位的語音HMM。
同樣,用于檢測語音部分的語音部分檢測部分包括聲學(xué)分析器1、3、本征矢量產(chǎn)生部分2、內(nèi)積操作部分4、比較部分5、以及語音提取部分6。
在此,聲學(xué)分析器1在訓(xùn)練語音數(shù)據(jù)庫內(nèi)對于每個(gè)幀號n進(jìn)行語音數(shù)據(jù)Sm的聲學(xué)分析,以產(chǎn)生M維特征矢量xn=[xn1xn2xn3…xnM]T。在此,T表示轉(zhuǎn)置。
本征矢量產(chǎn)生部分2從M維特征矢量xn產(chǎn)生由下面的表達(dá)式(1)表示的相關(guān)矩陣R,且相關(guān)矩陣R通過求解以下表達(dá)式(2)而展開成本征值,以獲得一本征矢量(稱為訓(xùn)練矢量)V。R=1NΣn=1NXnXnT---(1)]]>(R-λkI)Vk=0(2)其中,k=1、2、3、…、M;I表示單位矩陣;以及0表示零矢量。
從而,訓(xùn)練矢量V先前基于訓(xùn)練語音數(shù)據(jù)Sm計(jì)算出。如果當(dāng)發(fā)出語音時(shí),真正產(chǎn)生輸入信號數(shù)據(jù)Sa,聲學(xué)分析部分4分析輸入信號Sa以產(chǎn)生特征矩陣A。內(nèi)積操作部分5計(jì)算訓(xùn)練矢量V和特征矢量A的內(nèi)積。此外,比較部分6將內(nèi)積值VTA與固定的閾值θ相比較,且如果內(nèi)積值VTA大于閾值θ時(shí),語音部分被確定。
并且,在語音部分被如上所述確定以從輸入信號Sa中提取用于語音識別的信號Svc過程中,語音提取部分6被打開(導(dǎo)通),并產(chǎn)生一系列要與語音HMM相對照的觀察值。
順便地說,通過利用矢量內(nèi)積檢測語音部分的傳統(tǒng)方法,閾值θ被固定在零(θ=0)。且如果在真實(shí)環(huán)境下獲得的輸入信號Sa的特征矢量A與訓(xùn)練矢量V之間的內(nèi)積值VTA大于固定的閾值θ,語音部分被確定。
因此,在不太嘈雜環(huán)境中產(chǎn)生語音的情況下,考慮到真實(shí)環(huán)境下獲得的輸入信號中的噪聲(噪聲矢量)的特征矢量、正確語音(語音矢量)的特征矢量、在真實(shí)環(huán)境下獲得的輸入信號的特征矢量A、以及線性譜域上的訓(xùn)練矢量V之間的關(guān)系,噪聲矢量不大,且正確語音的語音矢量占主導(dǎo)地位,如圖5A所示,從而在真實(shí)環(huán)境下獲得的輸入信號的特征矢量A指向與語音矢量和訓(xùn)練矢量V相同的方向。
于是,特征矢量A和訓(xùn)練矢量V之間的內(nèi)積值VTA為正(+)值,從而可以采用固定閾值θ(=0)作為檢測語音部分的確定標(biāo)準(zhǔn)。
然而,在較低S/N比的具有大量噪聲的地方,例如在車廂內(nèi),噪聲矢量是主要的,而語音矢量相對小,因此,在真實(shí)環(huán)境下獲得的輸入信號的特征矢量A與語音矢量和訓(xùn)練矢量V反向,如圖5B所示。于是,特征矢量A和訓(xùn)練矢量V之間的內(nèi)積值VTA為負(fù)(-)值,從而,存在固定閾值θ(=0)不能被用作正確檢測語音部分的確定標(biāo)準(zhǔn)的問題。
換句話說,如果在低S/N比的存在大量噪聲的地方進(jìn)行語音識別,即使在語音部分應(yīng)被確定時(shí),特征矢量A和訓(xùn)練矢量V之間的內(nèi)積值VTA為負(fù)值(VTA<θ),導(dǎo)致語音部分不能被正確檢測的問題,如圖5C所示。

發(fā)明內(nèi)容
已經(jīng)完成了本發(fā)明以解決上如上所述的傳統(tǒng)問題,且本發(fā)明的目的是提供一種語音識別系統(tǒng),其中語音部分的檢測精度得以改善。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明,提供了一種語音識別系統(tǒng),其具有用于檢測經(jīng)受語音識別的語音部分的語音部分檢測部分,語音部分檢測部分包括用于在先產(chǎn)生針對語音特征的訓(xùn)練矢量的訓(xùn)練矢量產(chǎn)生部分,用于基于存在于非語音聲音時(shí)段內(nèi)的聲音的特征矢量和訓(xùn)練矢量之間的內(nèi)積值產(chǎn)生第一閾值的第一閾值產(chǎn)生部分,以及如果發(fā)出語音時(shí)產(chǎn)生的輸入信號的特征矢量和訓(xùn)練矢量之間的內(nèi)積值大于或等于第一閾值時(shí)確定語音部分的第一確定部分。
通過這種結(jié)構(gòu),只用于背景聲音的特征矢量在非語音時(shí)段內(nèi)產(chǎn)生(即,對于實(shí)際未產(chǎn)生語音的時(shí)段),且第一閾值在實(shí)際環(huán)境下基于特征矢量和訓(xùn)練矢量之間的內(nèi)積值產(chǎn)生。
如果實(shí)際發(fā)出語音,即得到輸入信號的特征矢量和訓(xùn)練矢量的內(nèi)積,且如果內(nèi)積值大于或等于第一閾值,語音部分即被確定。
由于第一閾值可以在真實(shí)環(huán)境下適宜地調(diào)整,實(shí)際講話發(fā)出的輸入信號的特征矢量和訓(xùn)練矢量的內(nèi)積值基于第一閾值加以判斷,從而改善了語音部分的檢測精度。
同樣,為了實(shí)現(xiàn)上述目的,本發(fā)明提供了一種語音識別系統(tǒng),其還包括用于基于存在于非語音時(shí)段之內(nèi)的聲音的預(yù)測殘余能量產(chǎn)生第二閾值的第二閾值產(chǎn)生部分,且如果發(fā)出語音時(shí)產(chǎn)生的輸入信號的預(yù)測殘余能量大于或等于第二閾值,用于確定語音部分的第二確定部分,其中被第一確定部分即第二確定部分中一個(gè)或全部確定的語音部分中的輸入信號經(jīng)受語音識別。
通過這種結(jié)構(gòu),第一確定部分基于輸入信號的特征矢量和訓(xùn)練矢量的內(nèi)積值確定語音部分。同時(shí),第二確定部分基于輸入信號的預(yù)測殘余能量來確定語音部分。對應(yīng)于由第一確定部分和第二確定部分中至少一個(gè)確定的輸入信號經(jīng)受語音識別。尤其是,通過基于輸入信號的特征矢量和訓(xùn)練矢量之間的內(nèi)積值確定語音部分,有可能提供一種正確檢測包含非語音聲音語音部分的有效功能。同樣,通過基于輸入信號的預(yù)測殘余能量確定語音部分,有可能提供一種正確檢測包含語音聲音的語音部分的有效功能。


圖1是示出根據(jù)本發(fā)明實(shí)施例的語音識別系統(tǒng)的結(jié)構(gòu)的方塊圖;圖2是示出低S/N比訓(xùn)練矢量和輸入信號的特征矢量之間的內(nèi)積關(guān)系的視圖;圖3是示出可變閾值與內(nèi)積值之間關(guān)系的曲線;圖4是示出通過采用傳統(tǒng)矢量內(nèi)積技術(shù)檢測語音部分的語音識別系統(tǒng)的結(jié)構(gòu)的方塊圖;圖5A到5C是用于解釋通過采用傳統(tǒng)矢量內(nèi)積技術(shù)檢測語音部分的檢測方法的問題的視圖。
具體實(shí)施例方式
以下,將參照附圖詳細(xì)描述本發(fā)明優(yōu)選實(shí)施例。圖1是示出根據(jù)本發(fā)明實(shí)施例的語音識別系統(tǒng)的結(jié)構(gòu)的方塊圖。
在圖1中,該語音識別系統(tǒng)包括采用隱式馬爾可夫原型創(chuàng)建的以詞或子詞為單位的聲學(xué)樣板(音頻HMM)11、識別部分12、以及倒頻譜操作部分13,其中識別部分將作為在倒頻譜操作部分13內(nèi)產(chǎn)生的輸入聲音的倒頻譜時(shí)間序列的觀察值序列與語音HMM11相對照,并選取最相象的語音HMM,以作為識別結(jié)果將其輸出。
更具體地說,成幀(framing)部分8將試驗(yàn)采集并存儲在學(xué)習(xí)語音數(shù)據(jù)庫7中的語音數(shù)據(jù)Sm分隔對應(yīng)預(yù)定時(shí)間段(大約10到20msec)的幀單元,倒頻譜操作部分9使以幀為單位的語音數(shù)據(jù)依次倒頻譜操作,以獲得倒頻譜的時(shí)間序列,并進(jìn)一步訓(xùn)練部分10將這個(gè)倒頻譜的時(shí)間序列學(xué)習(xí)為語音的特征量,從而,制備好了以詞或子詞為單位的語音HMM11。
并且,倒頻譜操作部分13對由檢測語音部分所提取的實(shí)際數(shù)據(jù)Svc倒頻譜操作,如將要描述的一樣,以產(chǎn)生觀察值的序列,而識別部分12將觀察值的序列與以詞或子詞為單位的語音HMM11相對照,以進(jìn)行語音識別。
此外,該語音識別系統(tǒng)包括用于檢測實(shí)際講話語音(輸入信號)以提取作為語音識別目標(biāo)的輸入信號數(shù)據(jù)Svc的語音部分檢測部分。并且,語音部分檢測部分包括第一檢測部分100、第二檢測部分200、語音部分判定部分300、以及語音提取部分400。
在此,第一檢測部分100包括用于存儲事先采集的語音的非語音聲音部分的數(shù)據(jù)(非語音聲音數(shù)據(jù))Sc的訓(xùn)練非語音聲音數(shù)據(jù)庫14,LPC倒頻譜分析部分15、以及訓(xùn)練矢量產(chǎn)生部分16。
LPC倒頻譜分析部分15進(jìn)行在訓(xùn)練非語音聲音數(shù)據(jù)庫14中以幀為單位的預(yù)定時(shí)間段(約10到20msec)的非語音聲音數(shù)據(jù)Sc的LPC(線性預(yù)測譯碼(linear predictive coding))倒頻譜分析,以產(chǎn)生M維特征矢量Cn=[Cn1Cn2Cn3…CnM]T。
訓(xùn)練矢量產(chǎn)生部分16從M維特征矢量Cn中產(chǎn)生由以下表達(dá)式(3)表示的相關(guān)矩陣R,并將相關(guān)矩陣R擴(kuò)展成本征值,以獲得M本征值λk和vk。此外,訓(xùn)練矢量V被定義為對應(yīng)M本征值λk中的最大本征值的本征矢量,并從而可以很好地表示非語音聲音的特征。應(yīng)指出的是,變量n表示幀數(shù)量,而T在以下表達(dá)式(3)表示轉(zhuǎn)置。R=1NΣn=1NCnCnT---(3)]]>此外,第一檢測部分100包括用于將實(shí)際講話語音的輸入信號數(shù)據(jù)Sa成幀為對應(yīng)預(yù)定時(shí)間段(約10到20msec)的幀單元的成幀部分17、LPC倒頻譜分析部分18、內(nèi)積操作部分19、閾值產(chǎn)生部分20以及第一閾值確定部分21。
LPC倒頻譜分析部分18進(jìn)行從成幀部分17中輸出的幀單元內(nèi)的輸入信號數(shù)據(jù)Saf的LPC分析,以獲得在倒頻譜域的M維特征矢量A以及預(yù)定的殘余能量ε。
內(nèi)積操作部分19計(jì)算先前在訓(xùn)練矢量產(chǎn)生部分16中產(chǎn)生的訓(xùn)練矢量V和特征矢量A之間的內(nèi)積值VTA。
閾值產(chǎn)生部分20產(chǎn)生特征矢量A和訓(xùn)練矢量V之間的內(nèi)積,其中訓(xùn)練矢量是在從講話者打開設(shè)置在該語音識別系統(tǒng)上的講話開始開關(guān)(未示出)到實(shí)際開始講話的預(yù)定時(shí)間段(非語音時(shí)段)τ1內(nèi)在內(nèi)積操作部分19中獲得的,閾值產(chǎn)生部分20還計(jì)算在非語音聲音時(shí)間段τ1之內(nèi)對于多個(gè)幀的內(nèi)積值VTA的時(shí)間平均值G。而時(shí)間平均值G與試驗(yàn)獲得的調(diào)整值α相加,且該加法值作為第一閾值θv(=G+α)被提供給閾值確定部分21。
第一閾值確定部分21將從內(nèi)積操作部分19輸出的內(nèi)積值VTA與閾值θv相比較,在非語聲音音時(shí)間段τ1消逝后,且如果內(nèi)積值VTA大于閾值θv,語音部分即被確定,并且其確定結(jié)果D1被提供給語音部分確定部分300。
即,如果在非語音時(shí)間段τ1消逝后,實(shí)際發(fā)出語音,且成幀部分17分隔輸入信號數(shù)據(jù)Sa為以幀為單位的輸入信號數(shù)據(jù)Saf,LPC倒頻譜分析部分18進(jìn)行對于幀單元內(nèi)的輸入信號數(shù)據(jù)Saf的LPC倒頻譜分析,以產(chǎn)生輸入信號數(shù)據(jù)Saf的特征矢量A和預(yù)測殘余能量ε。此外,內(nèi)積操作部分19計(jì)算輸入信號數(shù)據(jù)Saf的特征矢量A和訓(xùn)練矢量V之間的內(nèi)積。而第一閾值確定部分21進(jìn)行內(nèi)積值VTA和閾值θv之間的比較,并且,如果內(nèi)積值VTA大于閾值θv,語音部分即被確定,且其確定結(jié)果D1被提供給語音部分確定部分300內(nèi)。
第二檢測部分200包括閾值產(chǎn)生部分22和第二閾值確定部分23。
閾值產(chǎn)生部分22計(jì)算從講話者打開講話開始開關(guān)的時(shí)刻到實(shí)際開始講話時(shí)刻的非語音聲音時(shí)間段τ1之內(nèi)的在LPS倒頻譜分析部分18內(nèi)獲得的預(yù)測殘余能量ε的時(shí)間平均值E,并進(jìn)一步將該時(shí)間平均值E與試驗(yàn)獲得的調(diào)整值β相加,以獲得閾值THD(=E+β),該閾值然后提供給閾值確定部分23。
第二閾值確定部分23將LPS倒頻譜分析部分18內(nèi)獲得的預(yù)測殘余能量ε與閾值THD相比較,在非語音聲音時(shí)間段τ1消逝后,且如果預(yù)測殘余能量ε大于或等于閾值THD,語音部分即被確定,而其確定結(jié)果D2被提供給語音部分確定部分300。
即,如果在非語音聲音時(shí)間段τ1消逝后,實(shí)際發(fā)出語音,而成幀部分17分隔輸入信號數(shù)據(jù)Sa成為以幀為單位的輸入信號數(shù)據(jù)Saf,LPC倒頻譜分析部分18進(jìn)行對于幀單元內(nèi)的輸入信號數(shù)據(jù)Saf的LPC倒頻譜分析,以產(chǎn)生輸入信號數(shù)據(jù)Saf的特征矢量A和預(yù)測殘余能量ε。此外,第二閾值確定部分23將預(yù)測殘余能量ε與閾值THD相比較,且如果預(yù)測殘余能量ε大于或等于閾值THD,語音部分即被確定,且其確定結(jié)果D2被提供給語音部分確定部分300。
語音部分確定部分300隨著確定結(jié)果D1從第一檢測部分100提供以及隨著確定結(jié)果D2從第二檢測部分200提供而確定輸入信號Sa的語音部分τ2。即,當(dāng)條件θv≤VTA及THD≤ε之一滿足,語音部分τ2即被確定,并且其確定結(jié)果D3被提供給語音提取部分400。
語音提取部分400通過最終檢測語音部分而將由成幀部分17提供的幀為單位的輸入信號數(shù)據(jù)Saf的要被識別的輸入信號數(shù)據(jù)Svc切下,在確定結(jié)果D3的基礎(chǔ)上,從而將輸入信號數(shù)據(jù)Svc提供給倒頻譜操作部分13。
且倒頻譜操作部分13產(chǎn)生倒頻譜域的提取的輸入數(shù)據(jù)Svc觀察值序列,并進(jìn)一步識別部分12將觀察值序列與語音HMM相對照,以進(jìn)行語音識別。
以這種方式,通過該實(shí)施例的語音識別系統(tǒng),第一檢測部分100主要呈現(xiàn)正確檢測非語音聲音的語音部分的有效功能,而第二檢測部分100主要呈現(xiàn)正確檢測語音聲音的語音部分的有效功能。
即,第一檢測部分100計(jì)算基于訓(xùn)練非語音聲音數(shù)據(jù)Sc而產(chǎn)生的非語音聲音的訓(xùn)練矢量V和在實(shí)際講話中產(chǎn)生的輸入信號數(shù)據(jù)Saf的特征矢量A之間的內(nèi)積,且如果所算出的內(nèi)積VTA大于閾值θv,在輸入信號Sa中的非語音聲音區(qū)域被確定。即,可以以較高精度檢測出相對小能量的非語音聲音。
第二檢測部分200包括將在實(shí)際講話中產(chǎn)生的輸入信號數(shù)據(jù)的預(yù)測殘余能量ε與事先基于非語音聲音區(qū)域的預(yù)測殘余能量獲得的閾值THD相比較,且如果預(yù)測殘余能量ε大于或等于閾值THD,在輸入信號數(shù)據(jù)Sa內(nèi)的時(shí)段的語音聲音被確定。即,可以以高精度確定相對大能量的語音聲音。
而語音部分檢測部分基于第一和第二檢測部分100和200的確定結(jié)果D1和D2最終確定語音部分(即,語音聲音和非語音聲音的時(shí)段),而要被識別的輸入信號數(shù)據(jù)Dvc基于其確定結(jié)果D3而被提取,從而,可以改善語音識別的精度。
語音部分可以基于第一檢測部分100的確定結(jié)果D1和第二檢測部分200的確定結(jié)果D2二者,或第一檢測部分100的確定結(jié)果D1和第二檢測部分200的檢測結(jié)果D2中任一個(gè)。
此外,LPC倒頻譜分析部分18產(chǎn)生僅在非語音時(shí)段τ1內(nèi)背景噪聲的特征矢量A。而非語音時(shí)段內(nèi)的特征矢量A和訓(xùn)練矢量V之間的內(nèi)積值VTA加上預(yù)定的調(diào)整值α,即VTA+α值被定義為閾值θv。因此,作為檢測語音部分的確定標(biāo)準(zhǔn)的閾值θv可以在實(shí)際發(fā)生背景噪聲的實(shí)際環(huán)境下適宜地調(diào)整,從而檢測語音部分的精度可以改善。
傳統(tǒng)地,在低S/N比的存在大量噪聲的地方,例如,在車廂內(nèi),噪聲矢量為主要的,且語音矢量相對小,因此在實(shí)際環(huán)境下獲得的輸入信號的特征矢量指向語音矢量和訓(xùn)練矢量V的相反方向,如圖5B所示。于是,存在的問題是,由于特征矢量A和訓(xùn)練矢量V之間的內(nèi)積值VTA為負(fù)(一),而不能采用固定的閾值(θ=0)作為正確檢測語音部分的確定標(biāo)準(zhǔn)。
相反,通過本實(shí)施例的語音識別系統(tǒng),即使特征矢量A和訓(xùn)練矢量V之間的內(nèi)積值VTA為負(fù)值,閾值θv可以根據(jù)背景噪聲適宜地調(diào)整,如圖2所示。從而,通過將內(nèi)積值VTA與作為確定標(biāo)準(zhǔn)的閾值θv相比較而正確檢測語音部分。
換句話說,閾值θv可以適宜地調(diào)整,因此實(shí)際講話的輸入信號的特征矢量A和訓(xùn)練矢量V之間的內(nèi)積值VTA可能高于閾值θv,如圖3所示。因此,檢測語音部分的精度可以提高。
在上述實(shí)施例中,特征矢量A和訓(xùn)練矢量V之間的內(nèi)積值可以在非語音時(shí)段τ1之內(nèi)而在內(nèi)積操作部分18之中予以計(jì)算,進(jìn)一步算出對于在非語音時(shí)段τ1之內(nèi)獲得的多個(gè)幀的內(nèi)積值VTA的時(shí)間平均值G,且閾值θv被定義為這個(gè)時(shí)間平均值G加上預(yù)定調(diào)整值α。
本發(fā)明不限于上述實(shí)施例??梢垣@得對于在非語音時(shí)段τ1之內(nèi)獲得的多個(gè)幀的內(nèi)積值VTA的最大值(VTA)max,而閾值θv被定義為該最大值(VTA)max加上試驗(yàn)確定的預(yù)定閾值α′,即,(VTA)max+α′值。
如上所述,通過本發(fā)明的語音識別系統(tǒng),第一閾值基于在非語音時(shí)段內(nèi)的信號的特征矢量和訓(xùn)練矢量之間的內(nèi)積值而產(chǎn)生,且當(dāng)實(shí)際發(fā)出語音時(shí),輸入信號的特征矢量和訓(xùn)練矢量之間的內(nèi)積值與第一閾值加以比較,以檢測語音部分,從而可以改善語音部分的檢測精度。即,由于作用為語音部分確定標(biāo)準(zhǔn)的第一閾值可以根據(jù)非語音時(shí)段內(nèi)的信號加以適應(yīng)性調(diào)整,可以通過輸入信號的特征矢量和訓(xùn)練矢量之間的內(nèi)積值與作用為檢測確定標(biāo)準(zhǔn)的第一閾值加以比較來適當(dāng)?shù)貦z測語音部分。
另外,第一確定部分基于輸入信號的特征矢量和訓(xùn)練矢量之間的內(nèi)積值確定語音部分,而第二確定部分基于輸入信號的預(yù)測殘余能量確定語音部分,而對應(yīng)于由第一和第二檢測部分任一個(gè)或是兩個(gè)所確定的語音部分的輸入信號經(jīng)受語音識別,從而,可以正確地檢測非語音聲音和語音聲音的語音部分。
權(quán)利要求
1.一種語音識別系統(tǒng),包括用于檢測要經(jīng)歷語音識別的語音部分的語音部分檢測部分,所述語音部分檢測部分包括用于先前產(chǎn)生語音特征作為訓(xùn)練矢量的訓(xùn)練矢量產(chǎn)生部分;第一閾值產(chǎn)生部分,其用于基于訓(xùn)練矢量和在非語音時(shí)段內(nèi)產(chǎn)生的聲音的特征矢量之間的內(nèi)積值產(chǎn)生第一閾值;第一確定部分,如果訓(xùn)練矢量和在發(fā)生輸入信號時(shí)產(chǎn)生的輸入信號的特征矢量之間的內(nèi)積值大于或等于第一閾值,所述第一確定部分用于確定輸入信號作為語音部分。
2.如權(quán)利要求1所述的語音識別系統(tǒng),還包括第二閾值產(chǎn)生部分,其用于基于在非語音時(shí)段內(nèi)輸入信號的預(yù)測殘余能量產(chǎn)生第二閾值;以及第二檢測部分,其用于在如果在發(fā)出聲音時(shí)產(chǎn)生的輸入信號的預(yù)測殘余能量大于或等于第二閾值情況下確定語音部分,其中,通過第一確定部分和第二確定部分任一個(gè)或二者確定的在語音部分內(nèi)的輸入信號經(jīng)受語音識別。
全文摘要
訓(xùn)練矢量產(chǎn)生部分16先前產(chǎn)生非語音聲音的訓(xùn)練矢量V。LPC倒頻譜分析部分18產(chǎn)生在非語音時(shí)段內(nèi)的語音的特征矢量A,內(nèi)積操作部分19計(jì)算特征矢量A和訓(xùn)練矢量V之間的內(nèi)積值V
文檔編號G10L15/02GK1343967SQ0113287
公開日2002年4月10日 申請日期2001年9月12日 優(yōu)先權(quán)日2000年9月12日
發(fā)明者小林載 申請人:日本先鋒公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
阿拉善左旗| 满城县| 泰兴市| 大城县| 肇东市| 璧山县| 井研县| 莒南县| 团风县| 普兰店市| 多伦县| 九江县| 三河市| 兰坪| 普洱| 铁岭市| 闽侯县| 凌海市| 旬阳县| 潍坊市| 长治县| 兴和县| 贵溪市| 勃利县| 上饶市| 客服| 凤阳县| 九龙坡区| 澄迈县| 安乡县| 滁州市| 开封县| 上犹县| 腾冲县| 通河县| 顺昌县| 廊坊市| 诏安县| 正阳县| 镇赉县| 荣昌县|