專(zhuān)利名稱(chēng):聲音激活性檢測(cè)激勵(lì)噪聲補(bǔ)償器的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字移動(dòng)無(wú)線(xiàn)系統(tǒng)。特別涉及在聲頻背景噪聲存在時(shí)改進(jìn)數(shù)字移動(dòng)無(wú)線(xiàn)電接收機(jī)的聲音質(zhì)量。
蜂窩電話(huà)系統(tǒng)包括三種主要單元,亦即一個(gè)蜂窩交換系統(tǒng),用以作為通往陸線(xiàn)(有線(xiàn))電話(huà)網(wǎng)絡(luò)的網(wǎng)間連接器;在交換系統(tǒng)的控制下的多個(gè)基站,含有在有線(xiàn)電話(huà)網(wǎng)使用的信號(hào)與無(wú)線(xiàn)通信使用的無(wú)線(xiàn)電信號(hào)之間變換的設(shè)備;以及多個(gè)移動(dòng)電話(huà)單元,用以在與基站通信所使用的無(wú)線(xiàn)電信號(hào)和與人類(lèi)用戶(hù)通信使用的可聞聲頻信號(hào)(例如,話(huà)音、音樂(lè)、等)之間變換。
只有在基站和移動(dòng)電話(huà)使用相同的無(wú)線(xiàn)調(diào)制方案、數(shù)據(jù)—編碼協(xié)議、以及控制策略(即兩個(gè)單元必須符合空中接口規(guī)范)時(shí),才有可能在一個(gè)基站與一個(gè)移動(dòng)電話(huà)之間進(jìn)行通信。美國(guó)現(xiàn)已對(duì)空中接口建立了許多標(biāo)準(zhǔn)。直到最近,美國(guó)的所有蜂窩電話(huà)都按照高級(jí)移動(dòng)電話(huà)業(yè)務(wù)(AMPS)標(biāo)準(zhǔn)操作。這個(gè)標(biāo)準(zhǔn)規(guī)定在800MHz無(wú)線(xiàn)電頻譜范圍內(nèi)使用頻率調(diào)制的模擬信號(hào)編碼。根據(jù)這個(gè)方案,在呼叫期間每個(gè)蜂窩電話(huà)對(duì)話(huà)分配一個(gè)通信信道,該信道包括上述范圍內(nèi)的兩個(gè)30KHz頻段。為了在對(duì)話(huà)之間避免干擾,兩個(gè)對(duì)話(huà)不能同時(shí)占用同一地理區(qū)域內(nèi)的同一信道。因?yàn)榉峙浣o蜂窩電話(huà)的全部無(wú)線(xiàn)電頻譜是有限的,這限制了蜂窩電話(huà)系統(tǒng)同時(shí)用戶(hù)的數(shù)目。
為了增加系統(tǒng)的容量,現(xiàn)已采用了許多替代AMPS的標(biāo)準(zhǔn)。這些標(biāo)準(zhǔn)之一是由電子工業(yè)協(xié)會(huì)和通信工業(yè)協(xié)會(huì)頒發(fā)的臨時(shí)標(biāo)準(zhǔn)54(IS-54)。這個(gè)標(biāo)準(zhǔn)使用數(shù)字信號(hào)編碼和使用時(shí)分多址(TDMA)方案調(diào)制。在TDMA方案中,每個(gè)30KHz頻段由三個(gè)同時(shí)對(duì)話(huà)共享,而且每個(gè)對(duì)話(huà)允許使用信道的三分之一時(shí)間。時(shí)間被劃分為20ms的幀,每幀再細(xì)分為三個(gè)時(shí)隙。為每個(gè)對(duì)話(huà)分配每幀一個(gè)時(shí)隙。
為了允許所述的20ms對(duì)話(huà)的所有信息在一個(gè)時(shí)隙內(nèi)傳送,利用稱(chēng)為“矢量和激勵(lì)線(xiàn)性預(yù)測(cè)(VSELP)”的數(shù)字話(huà)音壓縮方法處理語(yǔ)音和其它音頻信號(hào)。每個(gè)IS-54應(yīng)允的基站和移動(dòng)電話(huà)單元包括VSELP編碼器和解碼器。VSELP編碼器利用人類(lèi)話(huà)音產(chǎn)生的模型把數(shù)字化聲頻信號(hào)簡(jiǎn)化為一組代表在該幀中話(huà)音產(chǎn)生機(jī)制狀態(tài)的參數(shù)(例如,音調(diào)、聲域結(jié)構(gòu)、等),代替在該信道上傳送聲頻波形的數(shù)字表示物。這些參數(shù)被編碼為一個(gè)數(shù)字比特流,然后以8kb/s經(jīng)該信道傳送到接收機(jī)。這是比編碼實(shí)際聲頻波形要求的低得多的比特率。然后該接收機(jī)的VSELP解碼器利用這些參數(shù)再生該數(shù)字化聲頻波形的估計(jì)。該傳送的數(shù)字話(huà)音數(shù)據(jù)組織成為20ms的數(shù)字信息幀,每幀包含160個(gè)樣值。每個(gè)話(huà)音幀有159比特。在1990年由電氣工業(yè)協(xié)會(huì)出版的元件《TR45全速率話(huà)音編譯碼器兼容性標(biāo)準(zhǔn)PN-2972》中詳細(xì)描述了該VSELP方法,該文件列在這里供參考(下文稱(chēng)為“VSELP標(biāo)準(zhǔn)”)。
VSELP明顯地減少了在通信信道上發(fā)送聲頻信息所要求的比特?cái)?shù)。然而,它是通過(guò)繁重地依靠話(huà)音產(chǎn)生模型來(lái)實(shí)現(xiàn)這種減少的。其結(jié)果是,它使非話(huà)音的聲音變差。例如,運(yùn)動(dòng)的汽車(chē)內(nèi)部是一種固有的噪聲環(huán)境。汽車(chē)的本身聲音與外部噪聲組合,產(chǎn)生聲頻背境噪聲電平比在不運(yùn)動(dòng)環(huán)境中典型地遇到的高得多。這種情況除了組合的話(huà)音和背景噪聲此外還迫使VSELP試圖以很多的時(shí)間編碼非話(huà)音信息。
存在背景噪聲的情況下在使用VSELP編碼話(huà)音時(shí)出現(xiàn)兩個(gè)問(wèn)題。第一,不管話(huà)音是否存在,背景噪聲發(fā)聲不自然;第二,話(huà)音在特征方面失真。這些問(wèn)題不管是單獨(dú)地還是集合地統(tǒng)稱(chēng)為“漩渦”(swirl)。
通過(guò)以另一種話(huà)音壓縮算法代替VSELP算法,有可能消除這些由編碼/解碼過(guò)程引入的人為因素(artifact),那種算法不具有相同缺陷,這種策略將需要改變IS-54空中接口技術(shù)規(guī)范。因在蜂窩電話(huà)的業(yè)務(wù)提供者、制造者和用戶(hù)這部分上現(xiàn)存設(shè)備中可觀的投資故對(duì)于這種改變是不希望的。例如,在一種現(xiàn)有技術(shù)中,話(huà)音編碼器檢測(cè)何時(shí)無(wú)話(huà)音存在并編碼待發(fā)送到該接收機(jī)的特定的幀。這個(gè)特定的幀包含舒適噪聲參數(shù),這些參數(shù)指示話(huà)音解碼器將產(chǎn)生舒適噪聲,該噪聲與發(fā)送側(cè)的背景噪聲相似。這些特定的幀由發(fā)射機(jī)在無(wú)話(huà)音期間周期地發(fā)送。解決該漩渦問(wèn)題的這個(gè)提案需要改變當(dāng)前的VSELP話(huà)音算法,因?yàn)樗胩囟ǖ木幋a幀來(lái)指示何時(shí)產(chǎn)生舒適噪聲。它是在通信信道的發(fā)送側(cè)和接收側(cè)實(shí)現(xiàn)的,并需要改變當(dāng)前的空中接口技術(shù)規(guī)范標(biāo)準(zhǔn),因此它是一種不希望的解決方案。
本發(fā)明的目的是在聲頻背景噪聲存在時(shí)在無(wú)需對(duì)空中接口技術(shù)規(guī)范作任何改變的情況下來(lái)減小VSELP(或任何其它話(huà)音編碼/解碼算法)引入的人為因素嚴(yán)重程度。
業(yè)已確定,在無(wú)話(huà)音期間具有舒適噪聲插入的信號(hào)衰減與根據(jù)背景噪聲能量的估計(jì)所進(jìn)行的有選擇性的高通濾波相結(jié)合是對(duì)上面研究的“漩渦”問(wèn)題的一個(gè)有效的解決方案。
根據(jù)本發(fā)明,聲音激活性(Voice activity)檢測(cè)器使用一種能量估計(jì)來(lái)檢測(cè)在噪聲環(huán)境中在接收的話(huà)音信號(hào)中話(huà)音的存在。當(dāng)不存在話(huà)音時(shí),系統(tǒng)衰減該信號(hào)并以適當(dāng)?shù)碾娖讲迦虢?jīng)低通濾波的白噪聲(即舒適噪聲)。這種舒適噪聲模仿汽車(chē)或其它背景噪聲的典型的頻譜特性。這使漩渦平滑,使它發(fā)聲自然。當(dāng)由聲音激活性檢測(cè)器確定在該信號(hào)中存在話(huà)音時(shí),無(wú)衰減地處理合成的話(huà)音信號(hào)。
現(xiàn)已確定,當(dāng)試圖對(duì)話(huà)音和噪聲編碼時(shí),話(huà)音編碼器引入的令人煩惱的人為因素大多出現(xiàn)在低頻范圍內(nèi)。鑒此,除了話(huà)音激活性激勵(lì)衰減和舒適噪聲插入之外,根據(jù)背景噪聲電平應(yīng)用一組高通濾波器。不管話(huà)音是否存在,都將這種濾波應(yīng)用于話(huà)音信號(hào)。如發(fā)現(xiàn)噪聲電平低于-52db,則可不使用高通濾波器。如果噪聲電平在-40db和-52db之間,則將具有截止頻率為200Hz的高通濾波器應(yīng)用于合成的話(huà)音信號(hào)。如果噪聲電平大于-40db,則應(yīng)用一個(gè)具有截止頻率為350Hz的高通濾波器。使用這些高通濾波器的結(jié)果降低了背景噪聲對(duì)話(huà)音質(zhì)量影響很小。
上述的本發(fā)明應(yīng)用在接收機(jī)(在基站處、移動(dòng)單元處或在這兩處)內(nèi),而且可在無(wú)需改變當(dāng)前標(biāo)準(zhǔn)的話(huà)音編碼/解碼規(guī)程的情況下得到實(shí)施。
圖1示出結(jié)合本發(fā)明的數(shù)字無(wú)線(xiàn)電接收系統(tǒng)的方框圖。
圖2示出本發(fā)明的聲音激活性檢測(cè)激勵(lì)噪聲補(bǔ)償器(remediator)的方框圖。
圖3示出接收信號(hào)的總聲頻能量的波形。
圖4示出高通濾器激勵(lì)器的方框圖。
圖5示出執(zhí)行聲音激活性檢測(cè)器功能的流程圖。
圖6示出本發(fā)明微處理器實(shí)施例的方框圖。
圖1示出結(jié)合本發(fā)明的數(shù)字無(wú)線(xiàn)電接收系統(tǒng)10。解調(diào)器20接收與編碼話(huà)音信號(hào)相應(yīng)的發(fā)送的波形并處理該接收波形以產(chǎn)生數(shù)字信號(hào)d。將該數(shù)字信號(hào)d提供給信道解碼器30,該解碼器處理信號(hào)d以減輕信道差錯(cuò)。由該信道解碼器30產(chǎn)生的信號(hào)是編碼的話(huà)音比特流b,該比特流b根據(jù)在本發(fā)明背景部分中討論的VSELP標(biāo)準(zhǔn)組編成為數(shù)字信息幀。將該編碼的話(huà)音比特流b提供給話(huà)音解碼器40,該解碼器40處理編碼的話(huà)音比特流b以產(chǎn)生解碼的話(huà)音比特流S。設(shè)置這個(gè)話(huà)音解碼器40將已按VSELP技術(shù)編碼的話(huà)音進(jìn)行解碼。將這個(gè)解碼的話(huà)音比特流S提供給聲音激活性檢測(cè)激勵(lì)噪聲補(bǔ)償器(VADDNR)50,以除去在無(wú)話(huà)音期間信號(hào)中存在的任何背景“漩渦”。在一個(gè)實(shí)施例中,該VADDNR50還接收從信道解碼器30經(jīng)信號(hào)線(xiàn)35來(lái)的編碼話(huà)音比特流b的一部分。該VADDNR50使用VSELP編碼幀能量值r0,該值是編碼比特流b的一部分,這將在下文更詳細(xì)地討論。VADDNR50產(chǎn)生經(jīng)處理的解碼話(huà)音比特流輸出S″。然后將VADDNR 50的輸出提供給數(shù)/模變換器(D/A)60以將數(shù)字信號(hào)S″變換為模擬波形。最后將這個(gè)模擬波形發(fā)送到一個(gè)目的地系統(tǒng)(例如一個(gè)電話(huà)網(wǎng)絡(luò))。另一種可替換的方案是,將VADDNR50的輸出提供給另一個(gè)裝置,該裝置將VADDNR輸出變換為由目的地系統(tǒng)使用的某些其它數(shù)字?jǐn)?shù)據(jù)格式。
圖2示出VADDNR 50的細(xì)節(jié)。如圖1所示,VADDNR接收信號(hào)線(xiàn)35上來(lái)自編碼的話(huà)音比特流b的VSELP編碼幀能量值r0。這個(gè)能量值r0代表輸入話(huà)音在20ms幀間隔的平均信號(hào)功率。對(duì)于r0有32個(gè)可能的值,即0至31。r0=0代表幀能量為0。r0其余值的范圍從最小值-64db(相應(yīng)于r0=1)到最大值-4db(相應(yīng)于r0=31)。r0值之間的步長(zhǎng)是2db。在《VSELP標(biāo)準(zhǔn)》第16頁(yè)更詳細(xì)地描述了該幀能量值r0。將該編碼幀能量值r0提供給估計(jì)器210,以確定該平均幀能量的能量。
該能量估計(jì)器210產(chǎn)生一個(gè)平均幀能量信號(hào)e[m],它代表在m幀期間計(jì)算的平均幀能量,這里m是幀的號(hào)碼,它代表當(dāng)前的數(shù)字信息幀。e[m]被定義為 平均幀能量初始設(shè)定為一個(gè)初始的能量估計(jì)值Einit。Einit設(shè)定為大于31的一個(gè)值,對(duì)于r0它是最大可能值。例如,Einit可以設(shè)定為32。在初始化之后,按公式e[m]=α*r0[m]+(1-α)*e[m-1]計(jì)算平均幀能量e[m],這里α是平滑常數(shù),且0≤α≤1,應(yīng)選擇α提供可接受的幀平均值。我們已經(jīng)發(fā)現(xiàn),在7幀數(shù)字信息(140ms)給定有效幀平均的情況下,α=0.25最佳。還可選擇不同的α值,該值最好在0.25±0.2的范圍內(nèi)。
如上所述,并如圖1所示,在b信號(hào)由話(huà)音解碼器40解碼的之前,VADDNR 50從編碼的話(huà)音比特流信號(hào)b接收VSELP編碼的幀能量值r0。另一種可替代的方案是,這個(gè)幀能量值r0由VADDNR 50本身根據(jù)從話(huà)音解碼器40接收的解碼話(huà)音比特流信號(hào)S來(lái)計(jì)算。在該幀能量值r0由VADDNR 50計(jì)算的一個(gè)實(shí)施例中,不需要向VADDNR 50提供編碼話(huà)音比特流b的任何部分,而且圖1所示的信號(hào)線(xiàn)35也不存在。而VADDNR 50僅處理解碼話(huà)音比特流S,并且如在《VSELP標(biāo)準(zhǔn)》第16-17頁(yè)所描述的那樣,計(jì)算幀能量值r0。然而,由于從編碼的比特流b經(jīng)信號(hào)線(xiàn)35向VADDNR 50提供r0,因VADDNR 50無(wú)需計(jì)算r0能更快地處理解碼的話(huà)音比特流S。
能量估計(jì)器210產(chǎn)生的平均幀能量信號(hào)e[m]表示在接收的話(huà)音信號(hào)中存在平均總聲頻能量。這個(gè)總聲頻能量可能包括話(huà)音和噪聲二者。圖3示出在時(shí)間T內(nèi)典型的接收信號(hào)310的總聲頻能量波形的一個(gè)例子。在移動(dòng)的環(huán)境中,典型地存在一定程度的環(huán)境背景噪聲。這個(gè)噪聲的能量電平在圖3中以e1表示。當(dāng)該信號(hào)310中存在話(huà)音時(shí),聲頻的能量電平將代表話(huà)音及噪聲二者。這在圖3中表示,能量>e2的范圍內(nèi)在時(shí)間間隔t1期間,而在這個(gè)時(shí)間間隔t1期間,信號(hào)310中不存在話(huà)音,而在這個(gè)時(shí)間間隔t1期間聲頻能量?jī)H代表環(huán)境背景噪聲。在時(shí)間間隔t2期間,信號(hào)310中存在話(huà)音,而且在這個(gè)時(shí)間間隔t2期間聲頻能量代表環(huán)境背景噪聲加話(huà)音。
參見(jiàn)圖2,由能量估計(jì)器210產(chǎn)生的輸出信號(hào)e[m]提供給噪聲估計(jì)器220以確定解碼話(huà)音比特流S中的平均背景噪聲電平。該噪聲估計(jì)器220產(chǎn)生一個(gè)代表噪聲估計(jì)值的信號(hào)N[m],這里 初始時(shí),N[m]被設(shè)定為初始值Ninit,它是一個(gè)初始噪聲估計(jì)值。在下一步處理期間,N[m]值將根據(jù)解碼話(huà)音比特流S中存在的實(shí)際背景噪聲而加大或減小。Ninit設(shè)定為在適中的與嚴(yán)重的背景噪聲之間邊界上的一個(gè)電平。N[m]初始化到這個(gè)電平,以允許N[m]迅速地適應(yīng)于由實(shí)際背景噪聲確定的任一個(gè)方向。我們已發(fā)現(xiàn),在移動(dòng)的環(huán)境中,最好將Ninit設(shè)定為13這個(gè)r0值上。
信號(hào)能量的話(huà)音成分不應(yīng)包括在計(jì)算平均背景噪聲電平中。例如,參見(jiàn)圖3,在時(shí)間間隔t1期間信號(hào)310中存在的能量電平應(yīng)當(dāng)包括在計(jì)算的噪聲估計(jì)N[m]中,但是不應(yīng)當(dāng)包括在時(shí)間間隔t2期間信號(hào)310中存在的能量電平,因?yàn)闀r(shí)間間隔t2期間的能量代表背景噪聲和話(huà)音二者。
據(jù)此,從代表話(huà)音和噪聲的能量估計(jì)器210接收的任何平均幀能量e[m]應(yīng)當(dāng)從噪聲估計(jì)N[m]的計(jì)算中排除,為以防止噪聲估計(jì)N[m]不致變得偏離。為了排除代表話(huà)音和噪聲二者的平均幀能量e[m]值,使用噪聲上限閾值(Nthresh)。鑒此,如上所述,如果e[m]>N[m-1]+Nthresh,則N[m]=N[m-1]。換句話(huà)說(shuō),如果當(dāng)前幀的平均幀能量e[m]比前面幀的噪聲估計(jì)N[m-1]大了一個(gè)量值,該量值等于或大于Nthresh(即話(huà)音存在),則N[m]不從前面幀的計(jì)算中改變。據(jù)此,如果在一個(gè)短的時(shí)間期間幀能量大量增加,則可以認(rèn)為這種增加是因存在話(huà)音并且該能量不包括在噪聲估計(jì)中。我們已經(jīng)發(fā)現(xiàn),將Nthresh設(shè)定為等于幀能量r0值為2.5是最佳的。因r0以2dB為/單位標(biāo)度,故這就把噪聲估計(jì)算法的運(yùn)算范圍限于具有好于5db的聲音信號(hào)/噪聲比條件,對(duì)于噪聲估計(jì)器220的可接受的性能,Nthresh可被設(shè)定在2至4范圍內(nèi)的任何位置。
如果在短時(shí)間段內(nèi)幀能量沒(méi)有大量增加,則噪聲估計(jì)按下式N[m]=β*e[m]+(1-β)*N[m-1]來(lái)確定式中β是平滑常數(shù),應(yīng)被設(shè)定得以提供可接受的幀平均。業(yè)已發(fā)現(xiàn)β值為0.05是為最好的,β值為0.05可在25幀(500ms)內(nèi)給出幀平均。β值通常應(yīng)該被設(shè)定在0.025≤β≤0.1的范圍內(nèi)。
由噪聲估計(jì)器220計(jì)算的噪聲估計(jì)值N[m]提供給高通濾波器激勵(lì)器260,該激勵(lì)器260根據(jù)話(huà)音解碼器40提供的解碼比特流信號(hào)S來(lái)工作。如上所述,每個(gè)數(shù)字信息幀含有160個(gè)話(huà)音數(shù)據(jù)樣值。該高通濾波器激勵(lì)器260根據(jù)這些樣值s(i)的每一個(gè)樣值來(lái)工作,這里的i是取樣標(biāo)號(hào)。圖4示出該高通濾波器激勵(lì)器260的細(xì)節(jié)。由該噪聲估計(jì)器220產(chǎn)生的噪聲估計(jì)值N[m]提供到邏輯方框410,該方框內(nèi)含邏輯電路,用以確定那一組高通濾波器將被使用來(lái)對(duì)解碼話(huà)音比特流S的每個(gè)樣值S(i)進(jìn)行濾波?,F(xiàn)有兩個(gè)高通濾波器430和440。濾波器430的截止頻率是200Hz,而濾波器440的截止頻率是350Hz?,F(xiàn)已確定了這些截止頻率以提供最佳的結(jié)果,但是根據(jù)本發(fā)明,可以采用其它的值。兩濾波器截止頻率的差值最好至少100Hz。為了確定應(yīng)當(dāng)使用那個(gè)濾波器,高通濾波器激勵(lì)器260的邏輯方框410將噪聲估計(jì)值N[m]與兩個(gè)閾值比較。第一個(gè)閾值設(shè)定為相應(yīng)于幀能量值r0=7(相應(yīng)于-52db)的一個(gè)數(shù)值,第二個(gè)閾值設(shè)定為相應(yīng)于幀能量值r0=13(相應(yīng)于-40db)的一個(gè)數(shù)值。如果噪聲估計(jì)N[m]小于r0=7,則可不用高通濾波。如果噪聲估計(jì)值N[m]大于或等于r0=7和小于r0=13,則使用截止頻率為200Hz的高通濾波器430。如果噪聲估計(jì)值N[m]大于或等于r0=13,則使用截止頻率為350Hz的高通濾波器440。用以確定待使用高通濾波的邏輯可歸結(jié)為 參見(jiàn)圖4,這個(gè)邏輯由邏輯方框410來(lái)執(zhí)行。邏輯方框410將根據(jù)上述原則來(lái)確定使用哪個(gè)濾波器并C[m]向兩個(gè)縱橫接線(xiàn)器420、450提供一個(gè)控制信號(hào)。相應(yīng)于數(shù)值為0的控制信號(hào)表明不使用高通濾波器上。相應(yīng)于數(shù)值為1的控制信號(hào)表明使用200Hz高通濾波器。相應(yīng)于數(shù)值為2的控制信號(hào)表明使用350Hz的高通濾波器。
信號(hào)S[i]從話(huà)音解碼器40提供給縱橫制接線(xiàn)器420。該縱橫制接線(xiàn)器420令信號(hào)S[i]到達(dá)合適的信號(hào)線(xiàn)421、422、423來(lái)選擇適當(dāng)?shù)臑V波?!?”控制信號(hào)令信號(hào)S[i]到達(dá)信號(hào)線(xiàn)421。信號(hào)線(xiàn)421將信號(hào)S[i]提供到不使用濾波的縱橫接線(xiàn)器450?!?”控制信號(hào)令信號(hào)S[i]到信號(hào)線(xiàn)422,該信號(hào)線(xiàn)422連到高通濾波器430。該信號(hào)S[i]由高通濾波器430濾波之后經(jīng)信號(hào)線(xiàn)424提供到縱橫制接線(xiàn)器450?!?”控制信號(hào)令信號(hào)S[i]到達(dá)信號(hào)線(xiàn)423,它連到高通濾波器440。該信號(hào)由高通濾波器440濾波之后,再經(jīng)信號(hào)線(xiàn)425提供到縱橫制接線(xiàn)器450??刂菩盘?hào)C[m]也提供給縱橫制接線(xiàn)器450。根據(jù)控制信號(hào)C[m],縱橫制接線(xiàn)器450將來(lái)自信號(hào)線(xiàn)421、424、425的信號(hào)中的一個(gè)信號(hào)提供給話(huà)音衰減器270。由高通濾波器激勵(lì)器260產(chǎn)生的這個(gè)信號(hào)被識(shí)別為S′[i]。本領(lǐng)域的技術(shù)人員承認(rèn),在高通濾波器激勵(lì)器260中可使用任何數(shù)目的高通濾波器或使用具有連續(xù)可調(diào)截止頻率的一個(gè)高通濾波器,用以對(duì)解碼的比特流S濾波。使用較大量的高通濾波器或具有連續(xù)可調(diào)截止頻率的一個(gè)高通濾波器將使得濾波器選擇之間的過(guò)渡較不引人注意。
參見(jiàn)圖2,由高通濾波器激勵(lì)器260產(chǎn)生的信號(hào)S′[i]提供到一個(gè)話(huà)音衰減器/舒適噪聲插入器270。該話(huà)音衰減器/舒適噪聲插入器270處理信號(hào)S′[i],產(chǎn)生經(jīng)處理的解碼話(huà)音比特流輸出信號(hào)S″[i]。該話(huà)音衰減器/舒適噪聲插入器270還接收來(lái)自整形噪聲發(fā)生器250的輸入信號(hào)n[i]和來(lái)自衰減器計(jì)算器240的輸入信號(hào)atten[m]。下面將詳細(xì)討論話(huà)音衰減器/舒適噪聲插入器270的功能,再討論如何計(jì)算其輸入n[i]和atten[m]。
噪聲估計(jì)器220產(chǎn)生的噪聲估計(jì)N[m]和能量估計(jì)器230產(chǎn)生的平均幀能量e[m]提供給聲音激活性檢測(cè)器230。該聲音激活性檢測(cè)器230確定在話(huà)音信號(hào)的當(dāng)前幀中是否存在話(huà)音并產(chǎn)生一個(gè)聲音檢測(cè)信號(hào)V[m],該信號(hào)表明話(huà)音是否存在。V[m]的數(shù)值為0時(shí)表明在話(huà)音信號(hào)的當(dāng)前幀中沒(méi)有檢測(cè)到聲音激活性。V[m]的數(shù)值為1時(shí)表明在話(huà)音信號(hào)的當(dāng)前幀中檢測(cè)到聲音的激活性。聲音激活性檢測(cè)器230的功能結(jié)合圖5的流程圖描述。在步驟505,聲音激活性檢測(cè)器230確定是否e[m]<N[m]+Tdetect,這里Tdetect是較低的噪聲檢測(cè)閾值,該值在功能上類(lèi)似于前面結(jié)合圖3描述的Nthresh值。假定僅當(dāng)平均幀能量e[m]大于噪聲估計(jì)值N[m]某個(gè)值,即Tdetect時(shí),可能存在話(huà)音。Tdetect最好設(shè)定為r0值2.5,這就意味著只在平均幀能量e[m]比噪聲估計(jì)值N[m]大5db時(shí),可能存在話(huà)音。也可使用其它數(shù)值。Tdetect的值通常應(yīng)在2.5+/-0.5范圍內(nèi)。
為了防止話(huà)音激活性檢測(cè)器230不致申報(bào)在字內(nèi)無(wú)聲音激活性,使用一個(gè)來(lái)檢測(cè)的幀計(jì)數(shù)器Ncnt。將Ncnt初始化為零,而且置計(jì)數(shù)達(dá)到一個(gè)閾值Ncntthresh,該閾值代表含有在聲音激活性檢測(cè)器230申報(bào)不存在聲音激活性之前必定存在無(wú)聲音激活性的幀的數(shù)目。Ncntthresh可設(shè)定數(shù)值為6。據(jù)此,僅在為6幀(120ms)未檢測(cè)到話(huà)音時(shí),聲音激活性檢測(cè)器230申報(bào)無(wú)聲音。返回參照?qǐng)D5,如果在步驟505確定e[m]<N[m]+Tdetect,即平均能量e[m]小于已確定可能存在話(huà)音時(shí)的能量,則在步驟510使Ncnt加1。如果步驟515確定Ncnt≥Ncntthresh,亦即在6幀內(nèi)檢測(cè)無(wú)話(huà)音,則在步驟530將V[m]設(shè)定為0,這表明當(dāng)前的幀無(wú)話(huà)音。如果步驟515確定Ncnt<Ncntthresh,亦即不存在6幀檢測(cè)無(wú)話(huà)音,則在步驟520將V[m]設(shè)定為1,這表明在當(dāng)前的幀內(nèi)存在話(huà)音。如果步驟505確定e[m]≥N[m]+Tdetect,亦即平均能量e[m]大于或等于確定可能存在話(huà)音的平均功率,則在步驟525將Ncnt設(shè)定為0,而且將在步驟520將V[m]設(shè)定為1,這表明在當(dāng)前幀內(nèi)存在話(huà)音。
由聲音激活性檢測(cè)器230產(chǎn)生的聲音檢測(cè)信號(hào)V[m]提供給衰減器計(jì)算器240,以產(chǎn)生一個(gè)衰減信號(hào)atten[m],該信號(hào)代表當(dāng)前幀的衰減量。該衰減信號(hào)atten[m]每幀更新,而且它的值部分地取決于由聲音激活性檢測(cè)器230是否檢測(cè)到聲音激活性。信號(hào)atten[m]將代表0和1之間的某個(gè)值。越接近于1,信號(hào)的衰減越小,而越接近于0,信號(hào)衰減越大。將要應(yīng)用的最大衰減值被規(guī)定為最大衰減值(maxatten),而且現(xiàn)已確定maxatten的最佳值是0.65(即-3.7db)。可使用maxatten的其它值,但是,一般使用值的范圍為0.3至0.8。增大話(huà)音信號(hào)衰減的因數(shù)規(guī)定為衰減率(attenrate),而且現(xiàn)已發(fā)現(xiàn),衰減率的最佳值為0.98。對(duì)于衰減率可使用其它數(shù)值,通常該值的范圍為0.95+/-0.04。
在這段中,我們將描述衰減信號(hào)atten[m]的計(jì)算。在下面結(jié)合話(huà)音衰減器/舒適噪聲插入器270的討論中,衰減信號(hào)S′[i]中使用atten[m]將變得清楚了。該衰減信號(hào)atten[m]按如下方式計(jì)算。最初,該衰減信號(hào)atten[m]被設(shè)定為1。在這初始化以后,將根據(jù)由聲音激活性檢測(cè)器230確定的是否存在話(huà)音和該衰減是否達(dá)到由maxatten規(guī)定的最大衰減來(lái)計(jì)算atten[m]。如果V[m]=1亦即檢測(cè)到話(huà)音,則atten[m]設(shè)定為1。如果V[m]=0,亦即檢測(cè)無(wú)話(huà)音,而且如果施加到前一幀的衰減的衰減因數(shù)(attenrate*atten[m-1])大于最大衰減,則通過(guò)將衰減因數(shù)施加到前一幀的衰減來(lái)計(jì)算當(dāng)前幀的衰減。如果V[m]=0,亦即檢測(cè)無(wú)話(huà)音,和如果施加到前一幀衰減的衰減因數(shù)小于或等于最大衰減,則當(dāng)前幀衰減被設(shè)定為最大衰減。當(dāng)前幀衰減的這種計(jì)算概括為 據(jù)此,當(dāng)聲音激活性檢測(cè)器230檢測(cè)無(wú)話(huà)音時(shí),根據(jù)常數(shù)0.98,該衰減信號(hào)atten[m]從1減到0.65(maxatten)。衰減計(jì)算器240產(chǎn)生的當(dāng)前幀的衰減信號(hào)atten[m]被提供到話(huà)音衰減器/舒適噪聲插入器270。
該話(huà)音衰減器/舒適噪聲插入器270還接收信號(hào)n[i],該信號(hào)來(lái)自整形噪聲發(fā)生器250,代表低通濾波的白噪聲。這種低通濾波的白噪聲還稱(chēng)為“舒適噪聲”。整形噪聲發(fā)生器250從噪聲估計(jì)器220接收噪聲估計(jì)N[m]并產(chǎn)生代表如下整形噪聲的信號(hào)n[i]n[i]=ε*wn[i]+(1-ε)*n(i-1),式中wn[i]=δ*dB21in(N[m])*ran[i]這里i是如上所述的取樣標(biāo)號(hào)。據(jù)此為當(dāng)前幀的每個(gè)樣值產(chǎn)生n[i]。函數(shù)db21in使噪聲估計(jì)N[m]從db變?yōu)榫€(xiàn)性值。標(biāo)度因數(shù)δ被設(shè)定數(shù)值為1.7和濾波系數(shù)ε被設(shè)定數(shù)值為0.1。函數(shù)ran[i]產(chǎn)生在-1.0和1.0之間產(chǎn)生一個(gè)隨機(jī)數(shù)。據(jù)此,使用噪聲估計(jì)N[m]標(biāo)度該噪聲,然后由低通濾波器濾波。已經(jīng)發(fā)現(xiàn)上述的標(biāo)度因數(shù)δ和該濾波器系數(shù)ε的值是最佳值。然而,可以使用其它數(shù)值,δ值通常在1.5至2.0的范圍內(nèi)ε值通常在0.05至0.15的范圍內(nèi)。
由整形噪聲發(fā)生器220產(chǎn)生的低通濾波白噪聲n[i]和由衰減器計(jì)算器240產(chǎn)生的當(dāng)前幀的衰減atten[m]被提供到話(huà)音衰減器/舒適噪聲插入器270。該話(huà)音衰減器從高通濾波器激勵(lì)器260接收高通濾波信號(hào)S′[i]并根據(jù)下式產(chǎn)生經(jīng)處理的解碼話(huà)音比特流S″S″[i]=atten[m]*S′[i]+(1-atten[m])*n[i]i=0、1、……159這樣,對(duì)于高通濾波的話(huà)音信號(hào)S′的每個(gè)樣值S′[i],該話(huà)音衰減器/舒適噪聲插入器270根據(jù)當(dāng)前幀的衰減atten[m]來(lái)衰減樣值S′[i]。同時(shí),該話(huà)音衰減器/舒適噪聲插入器270還將根據(jù)atten[m]值插入低通濾波白噪聲n[i]。從上式可以看到,如果atten[m]=1,則沒(méi)有衰減和S″[i]=S′[i]。如果atten[m]=maxatten(0.65),則S″[i]=(0.65*經(jīng)高通濾波的話(huà)音信號(hào))+(0.35*經(jīng)低通濾液的白噪聲)。信號(hào)S′[i]的衰減加低通濾波白噪聲(舒適噪聲)的插入的結(jié)果將提供一個(gè)具有較不易覺(jué)察的漩渦的較平滑的背景噪聲。由話(huà)音衰減器/舒適噪聲插入器270產(chǎn)生的信號(hào)S″[i]提供給D/A變換器60或另外的裝置,如上所述,該裝置變換信號(hào)為某個(gè)其它數(shù)字?jǐn)?shù)據(jù)格式。
如上所述,當(dāng)在接收的信號(hào)中不存在話(huà)音時(shí),衰減器計(jì)算器240、整形噪聲發(fā)生器250和話(huà)音衰減器/舒適噪聲插入器270一起工作,以降低背景漩渦。這些單元可被認(rèn)為是“一個(gè)噪聲補(bǔ)償器”,它被示于圖2標(biāo)記為280的虛線(xiàn)內(nèi)。如上所述,這個(gè)噪聲補(bǔ)償器280從聲音激活性檢測(cè)器230接收的聲音檢測(cè)信號(hào)V[m],從噪聲估計(jì)器220接收噪聲估計(jì)N[m],還從高通濾波器激勵(lì)器260接收高通濾波信號(hào)S′[i],產(chǎn)生處理的解碼的話(huà)音比特流S″[i]。
如上所述,合適的VADDNR 50可以在如圖6所示的微處理器中實(shí)施。該微處理器(μ)60由數(shù)據(jù)線(xiàn)621和地址線(xiàn)622連接到一個(gè)非易失存儲(chǔ)器620(例如ROM)上。該非易失存儲(chǔ)器620包含實(shí)現(xiàn)上述VADDNR 50功能的程序碼。該微處理器610還通過(guò)數(shù)據(jù)線(xiàn)631和地址線(xiàn)632連接到一個(gè)易失存儲(chǔ)器630(例如RAM)上。該微處理器610從話(huà)音解碼器40接收信號(hào)線(xiàn)612上的解碼的話(huà)音比特流S,并產(chǎn)生經(jīng)處理的解碼話(huà)音比特流S″。如上所述,在本發(fā)明的一個(gè)實(shí)施例中,該VSELP編碼的幀能量值r0從編碼的話(huà)音比特流b提供到VADDNR 50。這由圖6中的信號(hào)線(xiàn)611所示。在另一個(gè)實(shí)施例中,該VADDNR從解碼的話(huà)音比特流S計(jì)算幀能量值r0,而且信號(hào)線(xiàn)611將不存在。
可以理解,這里表示和描述的實(shí)施例和變化僅僅是為了說(shuō)明本發(fā)明的原理,本領(lǐng)域的技術(shù)人員可在不脫離本發(fā)明的范圍和精神下進(jìn)行各種各樣的修改。在整個(gè)本說(shuō)明書(shū)中已經(jīng)公開(kāi)了各種優(yōu)選數(shù)值和一些數(shù)值的范圍。但是,可以理解,這些數(shù)值涉及到本發(fā)明在移動(dòng)環(huán)境中的使用。本領(lǐng)域的技術(shù)人員應(yīng)該知道,這里公開(kāi)的本發(fā)明可用于各種環(huán)境,在這種情況下的數(shù)值和數(shù)值范圍可與這里描述的不同。在各種環(huán)境下使用本發(fā)明以及數(shù)值變化都在本發(fā)明的預(yù)期范圍之內(nèi)。
權(quán)利要求
1.一種用于處理接收的編碼信號(hào)的設(shè)備,所述接收的編碼信號(hào)包括話(huà)音分量和噪聲分量,所述設(shè)備其特征在于包括一個(gè)話(huà)音解碼器,用于接收所述編碼信號(hào)和產(chǎn)生解碼信號(hào),所述解碼信號(hào)包括話(huà)音分量和噪聲分量;一個(gè)能量估計(jì)器,與上述話(huà)音解碼相連接,用于接收所述解碼信號(hào)和用于產(chǎn)生代表所述解碼信號(hào)的聲頻能量的估計(jì)的能量信號(hào);一個(gè)噪聲估計(jì)器,與上述能量估計(jì)器相連接,用于產(chǎn)生代表在所述解碼信號(hào)中平均背景噪聲電平的估計(jì)噪聲信號(hào);一個(gè)高通濾波器激勵(lì)器,與上述噪聲估計(jì)器和所述話(huà)音解碼器相連接,用于接收所述估計(jì)噪聲信號(hào)和所述解碼信號(hào),用于根據(jù)所述估計(jì)噪聲信號(hào),高通濾波所述解碼信號(hào),和用于產(chǎn)生高通濾波的輸出信號(hào);一個(gè)聲音激活性檢測(cè)器,與上述能量估計(jì)器和所述噪聲估計(jì)相連接,用于接收所述估計(jì)能量信號(hào)和所述估計(jì)噪聲信號(hào),和用于產(chǎn)生代表所述解碼信號(hào)是否包含話(huà)音分量的聲音檢測(cè)信號(hào);一個(gè)衰減器計(jì)算器,與上述聲音激活性檢測(cè)器相連接,用于接收所述聲音檢測(cè)信號(hào)和用于產(chǎn)生代表施加到所述高通濾波信號(hào)衰減的衰減信號(hào);一個(gè)噪聲發(fā)生器,與上述噪聲估計(jì)器相連接,用于接收所述估計(jì)噪聲信號(hào)和用于產(chǎn)生舒適噪聲信號(hào);及一個(gè)話(huà)音衰減器/舒適噪聲插入器,與上述高通濾波器激勵(lì)器、所述整形噪聲發(fā)生器和所述衰減器計(jì)算器相連接,用于接收所述高通濾波輸出信號(hào)、所述舒適噪聲信號(hào)和所述衰減信號(hào),用于衰減高通濾波輸出信號(hào)并且插入所述舒適噪聲信號(hào)到在所述衰減信號(hào)上的所述高通濾波輸出信號(hào),和用于產(chǎn)生處理的高通濾波信號(hào)。
2.根據(jù)權(quán)利要求1的設(shè)備,其特征在于,所述舒適噪聲信號(hào)包括低通濾波白噪聲。
3.一種用于處理接收信號(hào)的設(shè)備,其特征在于,所述信號(hào)包括話(huà)音分量和噪聲分量,所述設(shè)備還包括一個(gè)能量估計(jì)器,用于產(chǎn)生代表所述接收信號(hào)的聲頻能量的能量信號(hào);一個(gè)噪聲估計(jì)器,用于接收所述能量信號(hào)和用于產(chǎn)生代表在所述接收信號(hào)中平均背景噪聲的噪聲估計(jì)信號(hào);一個(gè)聲音激活性檢測(cè)器,用于接收所述噪聲估計(jì)信號(hào)和所述能量信號(hào),和用于產(chǎn)生代表在所述接收信號(hào)中是否存在話(huà)音的聲音檢測(cè)信號(hào);和一個(gè)噪聲補(bǔ)償器,響應(yīng)所述噪聲估計(jì)信號(hào)和所述聲音檢測(cè)信號(hào),當(dāng)所述聲音檢測(cè)信號(hào)指示在所述接收信號(hào)中沒(méi)有出現(xiàn)話(huà)音時(shí)用于處理所述接收信號(hào)和用于產(chǎn)生處理的信號(hào),其中所述處理的信號(hào)包括包括衰減接收信號(hào)的第一分量;和包括舒適噪聲信號(hào)的第二分量。
4.根據(jù)權(quán)利要求3的設(shè)備,其特征在于,所述聲音檢測(cè)器產(chǎn)生聲音檢測(cè)信號(hào),只當(dāng)在預(yù)定時(shí)間期間所述接收信號(hào)中檢測(cè)無(wú)話(huà)音時(shí),聲音檢測(cè)信號(hào)才指示話(huà)音不存在。
5.根據(jù)權(quán)利要求3的設(shè)備,其特征在于,所述舒適噪聲包括低通濾波白噪聲。
6.根據(jù)權(quán)利要求3的設(shè)備,其特征在于,所述噪聲補(bǔ)償器還包括一個(gè)衰減器計(jì)算器,用于接收所述聲音檢測(cè)信號(hào)和用于產(chǎn)生代表衰減被施加到所述接收信號(hào)的衰減信號(hào);一個(gè)整形噪聲發(fā)生器,用于接收所述噪聲估計(jì)信號(hào)和用于產(chǎn)生所述舒適信號(hào);和一個(gè)話(huà)音衰減器/舒適噪聲插入器,響應(yīng)所述舒適噪聲信號(hào)和所述衰減信號(hào)用于接收所述接收信號(hào)和用于衰減所述接收信號(hào)并插入所述舒適噪聲信號(hào)到所述接收信號(hào)。
7.根據(jù)權(quán)利要求6的設(shè)備,其特征在于,所述舒適噪聲信號(hào)代表根據(jù)所述噪聲估計(jì)信號(hào)標(biāo)度的低通濾波白噪聲。
8.一種用于處理具有話(huà)音和噪聲分量的接收信號(hào)的設(shè)備,其特征在于,所述設(shè)備包括一個(gè)能量估計(jì)器,用于產(chǎn)生代表所述接收信號(hào)的聲頻能量的能量信號(hào);一個(gè)噪聲估計(jì)器,用于接收所述能量信號(hào)和用于產(chǎn)生代表在所述接收信號(hào)中平均背景噪聲的噪聲估計(jì)信號(hào);多個(gè)高通濾波器;和一種裝置,用于將所述多個(gè)高通濾波器中的一個(gè)加到基于所述噪聲估計(jì)信號(hào)的所述接收信號(hào),和用于產(chǎn)生高通濾波信號(hào)。
9.根據(jù)權(quán)利要求8的設(shè)備,其特征在于,所述多個(gè)高通濾波器的每一個(gè)濾波器的截止頻率的差至少是100Hz。
10.一種用于處理具有話(huà)音和噪聲分量的接收信號(hào)的設(shè)備,其特征在于,所述設(shè)備包括一個(gè)能量估計(jì)器,用于產(chǎn)生代表所述接收信號(hào)的聲頻能量的能量信號(hào);一個(gè)噪聲估計(jì)器,用于接收所述能量信號(hào)和用于產(chǎn)生代表在所述接收信號(hào)中平均背景噪聲的噪聲估計(jì)信號(hào);一個(gè)高通濾波器激勵(lì)器,連接到所述噪聲估計(jì)器,基于所述噪聲估計(jì)信號(hào)用于濾波的所述接收信號(hào)和用于產(chǎn)生高通濾波信號(hào);一個(gè)聲音激活性檢測(cè)器,用于接收所述噪聲估計(jì)信號(hào)和所述能量信號(hào),和用于產(chǎn)生代表在所述接收信號(hào)中是否存在話(huà)音的聲音檢測(cè)信號(hào);和一個(gè)噪聲補(bǔ)償器,響應(yīng)所述噪聲估計(jì)信號(hào)和所述聲音檢測(cè)信號(hào),當(dāng)所述聲音檢測(cè)信號(hào)指示在所述接收信號(hào)中不存在話(huà)音時(shí),用于衰減所述高通濾波信號(hào)和插入舒適噪聲信號(hào)到所述高通濾波信號(hào)。
11.根據(jù)權(quán)利要求10的設(shè)備,所述高通濾波器激勵(lì)器進(jìn)一步包括第一高通濾波器;第二高通濾波器;和用于將所述第一高通濾波器,所述第二高通濾波器或無(wú)高通濾波器加到其于所述噪聲估計(jì)信號(hào)的所述接收信號(hào)的裝置。
12.根據(jù)權(quán)利要求11的設(shè)備,其特征在于,所述第一高通濾波器和所述第二高通濾波器的截止頻率的差至少是100Hz。
13.根據(jù)權(quán)利要求10所述的設(shè)備,其特征在于,當(dāng)所述聲音激活性檢測(cè)器產(chǎn)生聲音檢測(cè)信號(hào),只當(dāng)在預(yù)定時(shí)間期間所述接收信號(hào)中檢測(cè)無(wú)話(huà)音時(shí),聲音檢測(cè)信號(hào)才指示不存在話(huà)音。
14.根據(jù)權(quán)利要求10的設(shè)備,其特征在于,所述噪聲補(bǔ)償器還包括一個(gè)衰減器計(jì)算器,用于接收所述聲音檢測(cè)信號(hào)和用于產(chǎn)生代表衰減被加到所述接收信號(hào)的衰減信號(hào);一個(gè)整形噪聲發(fā)生器,用于接收所述噪聲估計(jì)信號(hào)和用于產(chǎn)生所述舒適噪聲信號(hào);和一個(gè)話(huà)音衰減器/舒適噪聲插入器,響應(yīng)所述舒適噪聲信號(hào)和所述衰減信號(hào),用于接收所述高通濾波信號(hào)和用于衰減所述高通濾波信號(hào)以及用于插入所述舒適噪聲給到所述高通濾波信號(hào)。
15.一種用于處理編碼信號(hào)的方法,所述編碼信號(hào)代表話(huà)音和噪聲,其特征在于,所述方法包括以下步驟接收所述編碼的信號(hào);解碼所述編碼的信號(hào)為解碼的信號(hào);產(chǎn)生代表所述解碼信號(hào)的聲頻能量的能量信號(hào);產(chǎn)生代表在所述解碼信號(hào)中平均背景噪聲電平的噪聲估計(jì)信號(hào);基于所述能量信號(hào)和所述噪聲估計(jì)信號(hào)產(chǎn)生聲音檢測(cè)信號(hào),所述聲音檢測(cè)信號(hào)指示所述解碼信號(hào)是否包含話(huà)音分量;和如果所述聲音檢測(cè)信號(hào)指示所述解碼信號(hào)不包含話(huà)音分量基于所述噪聲估計(jì)信號(hào)產(chǎn)生舒適噪聲信號(hào);衰減所述解碼信號(hào);和插入所述舒適噪聲信號(hào)到所述解碼信號(hào)。
16.根據(jù)權(quán)利要求15的方法,其特征在于,所述產(chǎn)生代表所述解碼信號(hào)的聲頻能量的能量值的步驟進(jìn)一步包括從所述編碼信號(hào)接收編碼能量值的步驟。
17.根據(jù)權(quán)利要求15的方法,其特征在于,所述產(chǎn)生舒適噪聲信號(hào)的步驟還包括步驟產(chǎn)生白噪聲信號(hào);基于所述噪聲估計(jì)信號(hào)標(biāo)度所述白噪聲信號(hào);和低通濾波所述標(biāo)度的白噪聲信號(hào)。
18.根據(jù)權(quán)利要求15的方法,其中所述產(chǎn)生聲音檢測(cè)信號(hào)的步驟進(jìn)一步包括步驟產(chǎn)生聲音檢測(cè)信號(hào),僅在預(yù)定時(shí)間期間解碼的信號(hào)中沒(méi)有檢測(cè)到話(huà)音時(shí),該聲音檢測(cè)信號(hào)才指示沒(méi)有出現(xiàn)話(huà)音。
19.用于處理代表話(huà)音和噪聲的接收編碼信號(hào)的方法,其特征在于,所述方法包括以下步驟接收所述編碼信號(hào);解碼所述編碼信號(hào)為解碼信號(hào);產(chǎn)生代表所述解碼信號(hào)的聲頻能量的能量值;產(chǎn)生代表在所述解碼信號(hào)中平均背景噪聲電平的噪聲估計(jì)值;基于所述能量值和所述噪聲估計(jì)值確定所述解碼信號(hào)是否包含話(huà)音分量;和如果所述解碼信號(hào)在預(yù)定時(shí)間期間內(nèi)不包含話(huà)音分量衰減所述解碼信號(hào);和插入舒適噪聲到所述解碼信號(hào)。
20.根據(jù)權(quán)利要求19的方法,其特征在于,所述舒適噪聲包括基于所述噪聲估計(jì)值標(biāo)度的低通濾波白噪聲。
21.一種用于處理代表話(huà)音和噪聲的接收信號(hào)的方法其特征在于,所述方法包括以下步驟產(chǎn)生代表所述接收信號(hào)的聲頻能量的能量信號(hào);產(chǎn)生代表在所述接收信號(hào)中平均背景噪聲的噪聲估計(jì)信號(hào);和基于所述噪聲估計(jì)信號(hào),通過(guò)將所述接收信號(hào)加到多個(gè)高通濾波器之一,產(chǎn)生高通濾波信號(hào)。
22.根據(jù)權(quán)利要求21的方法,其特征在于,所述的多個(gè)高通濾波器的每個(gè)高通濾波器的載止頻率的差別至少是100Hz。
23.根據(jù)權(quán)利要求21的方法,其特征在于,還包括以下步驟基于所述能源信號(hào)和所述噪聲估計(jì)信號(hào)產(chǎn)生聲音檢測(cè)信號(hào),所述聲音檢測(cè)信號(hào)指示所述接收信號(hào)是否包含話(huà)音分量;和如果所述聲音檢測(cè)信號(hào)指示所述接收信號(hào)不包含話(huà)音分量,產(chǎn)生處理的高能濾波信號(hào)。
24.根據(jù)權(quán)利要求23的方法,其特征在于,所述產(chǎn)生高通濾波信號(hào)的步驟還包括以下步驟基于所述噪聲估計(jì)信號(hào),產(chǎn)生舒適噪聲信號(hào);衰減所述高通濾波信號(hào);和把所述舒適噪聲信號(hào)插入到所述高通濾波信號(hào)中。
25.根據(jù)權(quán)利要求24的方法,其特征在于,所述舒適噪聲信號(hào)包括基于所述噪聲估計(jì)信號(hào)標(biāo)度的低通濾波白噪聲。
26.一種用于處理代表話(huà)音和噪聲接收信號(hào)的方法,其特征在于,所述方法包括以下步驟產(chǎn)生代表所述接收信號(hào)的聲頻能量的能量值;產(chǎn)生代表在所述接收信號(hào)中平均背景噪聲的噪聲估計(jì)值;基于所述噪聲估計(jì)值,通過(guò)將所述接收信號(hào)加到多個(gè)高通濾波器之一,產(chǎn)生高通濾波信號(hào);產(chǎn)生基于所述噪聲估計(jì)值的舒適噪聲;基于所述能量值和所述噪聲估計(jì)值確定所述接收信號(hào)是否包含話(huà)音分量;和如果所述接收信號(hào)不包含話(huà)音分量,產(chǎn)生處理的高通濾波信號(hào)。
27.根據(jù)權(quán)利要求26的方法,其特征在于,所述多個(gè)高通濾波器的每一個(gè)高通濾波器的截止頻率的差別至少是100Hz。
28.根據(jù)權(quán)利要求26的方法,其特征在于,所述產(chǎn)生處理的高通濾波信號(hào)的步驟還包括以下步驟衰減所述高通濾波信號(hào);和把所述舒適噪聲插入到所述高通濾波信號(hào)中。
29.一種用于處理代表話(huà)音和噪聲的接收編碼信號(hào)的設(shè)備,其特征在于,所述設(shè)備包括用于接收所述編碼信號(hào)的裝置;用于解碼所述編碼信號(hào)為解碼信號(hào)的裝置;用于產(chǎn)生代表所述解碼信號(hào)聲頻能量的能量值的裝置;用于產(chǎn)生代表在所述解碼信號(hào)中平均背景噪聲的噪聲估計(jì)值的裝置;用于基于所述能量值和所述噪聲估計(jì)確定所述解碼信號(hào)是否包含話(huà)音分量的裝置;和用于在該解碼的信號(hào)在預(yù)定的時(shí)間期間不包含話(huà)音分量時(shí)產(chǎn)生處理的解碼信號(hào)的裝置,所述處理的解碼信號(hào)包括衰減的解碼信號(hào)分量和舒適噪聲分量。
30.根據(jù)權(quán)利要求29的設(shè)備,其特征在于,所述用于產(chǎn)生代表所述解碼信號(hào)聲頻能量的能量值的裝置進(jìn)一步包括用于從所述編碼信號(hào)中接收編碼能量值的裝置。
31.一種用于處理接收信號(hào)的設(shè)備,所述接收信號(hào)包括話(huà)音分量和噪聲分量,其特征在于,所述設(shè)備包括用于產(chǎn)生代表所述接收信號(hào)的聲頻能量的能量值的裝置;用于產(chǎn)生代表在所述接收信號(hào)中平均背景噪聲的噪聲估計(jì)值的裝置;根據(jù)所述噪聲估計(jì)值、通過(guò)將所述接收信號(hào)施加到多個(gè)高通濾波器其中之一上、以產(chǎn)生高通濾波信號(hào)的裝置。
32.根據(jù)權(quán)利要求31的設(shè)備,其特征在于,所述多個(gè)高通濾波器的每個(gè)濾波器的截止頻率的差別至少是100Hz。
33.根據(jù)權(quán)利要求31的設(shè)備,其特征在于,還包括用于確定所述接收信號(hào)是否包含話(huà)音分量的裝置;和用于在所述接收信號(hào)不包含話(huà)音分量時(shí)、產(chǎn)生經(jīng)處理的高通濾波信號(hào)的裝置。
34.根據(jù)權(quán)利要求33的設(shè)備,其特征在于,所述用于產(chǎn)生處理的高通濾波信號(hào)的裝置還包括基于所述噪聲估計(jì)值、用于產(chǎn)生舒適噪聲的裝置;用于衰減所述高通濾波信號(hào)的裝置;用于把所述舒適噪聲插入到所述高通濾波信號(hào)中的裝置。
35.一種用于處理代表話(huà)音和噪聲的接收編碼信號(hào)的設(shè)備,其特征在于,所述設(shè)備包括一個(gè)話(huà)音解碼器,用于接收所述編碼信號(hào)和產(chǎn)生解碼信號(hào);一個(gè)能量估計(jì)器,用于從所述編碼信號(hào)中接收編碼能量值和用于產(chǎn)生代表所述編碼信號(hào)的聲頻能量的能量信號(hào);一個(gè)噪聲估計(jì)器,連接到所述能量估計(jì)器,用于接收所述能量信號(hào)和用于產(chǎn)生代表在所述編碼信號(hào)的平均背景噪聲電平的噪聲估計(jì)信號(hào);一個(gè)高通濾波器激勵(lì)器,連接到所述的噪聲估計(jì)器和所述話(huà)音解碼器,用于接收所述噪聲估計(jì)信號(hào)和所述解碼信號(hào),并基于所述噪聲估計(jì)信號(hào)來(lái)高通濾波所述解碼信號(hào),和產(chǎn)生高通濾波信號(hào);一個(gè)聲音激活性檢測(cè)器,連接到所述能量估計(jì)器和所述噪聲估計(jì)器,用于接收所述能量信號(hào)和所述噪聲估計(jì)信號(hào)和用于產(chǎn)生代表所述編碼信號(hào)是否包含話(huà)音分量的話(huà)音檢測(cè)信號(hào);和一個(gè)噪聲補(bǔ)償器,連接到所述聲音激活性檢測(cè)器、所述噪聲估計(jì)器和所述高通濾濾器激勵(lì)器,用于接收所述聲音檢測(cè)信號(hào)、所述噪聲估計(jì)信號(hào)和所述高通濾波信號(hào),當(dāng)所述噪聲檢測(cè)信號(hào)指示所述編碼信號(hào)不包含話(huà)音分量時(shí),用于產(chǎn)生處理的高通濾波信號(hào),其中所述處理的高通濾波信號(hào)包含一個(gè)衰減的高通濾波信號(hào);和低通濾波的白噪聲。
全文摘要
改進(jìn)數(shù)字蜂窩無(wú)線(xiàn)電系統(tǒng)接收機(jī)的聲音質(zhì)量的方法和設(shè)備。聲音激活性檢測(cè)器使用能量估計(jì)來(lái)檢測(cè)在噪聲環(huán)境下接收的話(huà)音信號(hào)中是否存在話(huà)音。若不存在話(huà)音,則該系統(tǒng)衰減信號(hào)和插入低通濾波的白噪聲。使用一組高通濾波器基于背景噪聲電平濾波該信號(hào)。對(duì)該信號(hào)高通濾波,不管是否存在話(huà)音。這樣,當(dāng)解碼已在噪聲環(huán)境中被編碼的話(huà)音時(shí),在非話(huà)期間,除了該信號(hào)的高通濾波之外,信號(hào)衰減與低通濾的波白噪聲的插入的組合改進(jìn)了聲音質(zhì)量。
文檔編號(hào)G10L19/00GK1132988SQ9510149
公開(kāi)日1996年10月9日 申請(qǐng)日期1995年1月25日 優(yōu)先權(quán)日1994年1月28日
發(fā)明者托馬斯·約翰·杰尼茲夫斯基, 邁克爾·查爾斯·雷克什奧內(nèi) 申請(qǐng)人:美國(guó)電報(bào)電話(huà)公司