專(zhuān)利名稱(chēng):選擇自適應(yīng)碼本激勵(lì)信號(hào)的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字語(yǔ)音編碼技術(shù)領(lǐng)域,特別涉及選擇自適應(yīng)碼本激勵(lì)信號(hào)的方法和裝置。
背景技術(shù):
伴隨著多媒體應(yīng)用的日益廣泛,人們對(duì)高效的寬帶數(shù)字語(yǔ)音頻編碼技術(shù)有巨大的需求。當(dāng)前的窄帶語(yǔ)音帶寬通常被限制在200Hz-3400Hz,語(yǔ)音的自然度、可理解性以及音樂(lè)處理等方面還不盡人意。近年來(lái),隨著寬帶數(shù)字網(wǎng)絡(luò)的快速發(fā)展,如第三代移動(dòng)系統(tǒng)、高速寬帶互連網(wǎng)等提供了能夠勝任更高質(zhì)量類(lèi)似面對(duì)面交流通訊質(zhì)量的網(wǎng)絡(luò)環(huán)境。因此,寬帶語(yǔ)音編解碼便具有了更為現(xiàn)實(shí)的意義。
碼激勵(lì)線性預(yù)測(cè)(CELP)由于其高效的編碼效率和其較好的編碼質(zhì)量在窄帶語(yǔ)音編碼中得到了廣泛應(yīng)用,它利用線性預(yù)測(cè)提取聲道參數(shù),用一個(gè)包含許多典型激勵(lì)矢量的碼書(shū)作為激勵(lì)參數(shù),每次編碼時(shí)都在這個(gè)碼書(shū)中搜索一個(gè)矢量作為激勵(lì)矢量,上述激勵(lì)矢量包括兩部分一部分來(lái)自于過(guò)去的激勵(lì),即自適應(yīng)碼本;另一部分來(lái)自于更新的矢量,即固定碼本。將上述激勵(lì)矢量在碼書(shū)中的序號(hào)編碼傳到解碼端,解碼端查表得到上述激勵(lì)矢量然后通過(guò)合成濾波器合成語(yǔ)音。
寬帶語(yǔ)音與窄帶語(yǔ)音相比具有更大的變化范圍,同時(shí)針對(duì)清音、過(guò)渡音等周期性不強(qiáng)的信號(hào),其周期性無(wú)法延拓到整個(gè)頻率范圍內(nèi),因而針對(duì)上述信號(hào),需要對(duì)其自適應(yīng)碼本激勵(lì)信號(hào)做適當(dāng)?shù)牡屯V波以去除周期性不強(qiáng)的高頻部分,使其更好的模擬寬帶語(yǔ)音頻譜的諧波特性,提高寬帶語(yǔ)音的編碼性能。
AMR-WB+編碼標(biāo)準(zhǔn)(3GPP TS 26.290,“Extended Adaptive Multi-Rate-Wideband(AMR-WB+)codec”,Dec 2004)中采用了美國(guó)公開(kāi)號(hào)“US20050108005”,名稱(chēng)為“Method and device for adaptive bandwidth pitchsearch in coding wideband signals”中公開(kāi)的方案,該方案公開(kāi)了一種多路閉環(huán)選擇自適應(yīng)碼本激勵(lì)信號(hào)方法,其具體的方案如下 1.計(jì)算目標(biāo)信號(hào)和脈沖響應(yīng) 對(duì)輸入的語(yǔ)音信號(hào)即輸入信號(hào)(speech(n))進(jìn)行感知加權(quán),令感知加權(quán)濾波器的響應(yīng)為w(n),計(jì)算加權(quán)域信號(hào)wsp(n) wsp(n)=speech(n)*w(n)(*表示卷積) 計(jì)算加權(quán)合成濾波器的零輸入響應(yīng)xn2(n) 令自適應(yīng)碼本搜索使用的目標(biāo)信號(hào)為xn(n) xn(n)=wsp(n)-xn2(n) 目標(biāo)信號(hào)將用于閉環(huán)基音搜索過(guò)程中對(duì)基音周期搜索的候選值進(jìn)行選擇。
令加權(quán)合成濾波器的的脈沖響應(yīng)為h(n),則h(n)=ξ-1(H(z)) 2.自適應(yīng)碼本搜索 自適應(yīng)碼本參數(shù)為基音延時(shí)和增益。在搜索階段,線性預(yù)測(cè)殘差擴(kuò)展激勵(lì)使閉環(huán)搜索簡(jiǎn)單化,每一個(gè)子幀做一次自適應(yīng)碼本搜索。
在12.65,14.25,15.85,18.25,19.85,23.05和23.85kbits/s模式下,在每幀的第一和第三子幀中,搜索的范圍為,基音延時(shí)T1在
范圍內(nèi),分辨率為
分?jǐn)?shù)延時(shí);在
范圍內(nèi),分辨率為
分?jǐn)?shù)延時(shí);在[160,231]范圍內(nèi),只進(jìn)行整數(shù)基音延時(shí)搜索。對(duì)于每幀的第二和第四子幀,基音延時(shí)T2在
中搜索,分辨率為
分?jǐn)?shù)延時(shí)。這里int(T1)是取分?jǐn)?shù)延時(shí)T1的整數(shù)部分,這個(gè)范圍適合于T1跨在延時(shí)范圍邊界的情況,并且是最臨近的第一個(gè)或第三個(gè)子幀。
對(duì)于8.85kbits/s模式,在每幀的第一和第三個(gè)子幀,基音延時(shí)T1在
范圍內(nèi),分辨率為
分?jǐn)?shù)延時(shí),在區(qū)間[92,231]中,只進(jìn)行整數(shù)基音延時(shí)搜索。對(duì)于第二和第四個(gè)子幀,基音延時(shí)T2在
中搜索,分辨率為
分?jǐn)?shù)延時(shí)。
對(duì)于最低的6.60kbit/s模式,在每幀的第一個(gè)子幀,基音延時(shí)T1在
范圍內(nèi),分辨率為
在區(qū)間[92,231]中,只進(jìn)行整數(shù)基音延時(shí)搜索。對(duì)于第二、三和四個(gè)子幀,基音延時(shí)T2在
中搜索,分辨率為
分?jǐn)?shù)延時(shí)。
閉環(huán)基音搜索的準(zhǔn)則是使原始語(yǔ)音和重構(gòu)語(yǔ)音之間均方加權(quán)誤差最小化,即使歸一化系數(shù)R(k)最大。
其中x(n)表示目標(biāo)信號(hào),yk(n)是在延時(shí)k的過(guò)去濾波激勵(lì)(即過(guò)去激勵(lì)與h(n)的卷積,yk(n)=h(n)*exc(n-k))。搜索范圍限制在預(yù)選值附近,即每幀的第一和第三子幀是開(kāi)環(huán)基音Top,第二個(gè)或第四個(gè)是最臨近的第一或第三個(gè)子幀分?jǐn)?shù)延時(shí)T1的整數(shù)部分int(T1)。計(jì)算延時(shí)tmin的卷積yk(n),對(duì)其它整數(shù)延時(shí)在搜索范圍k=tmin+1,......,tmax用下面關(guān)系修正 yk(n)=y(tǒng)k-1(n-1)+exc(-k)h(n),n=63,......,0 這里exc(n)(n=-231,......,63)是激勵(lì)緩沖器的值,yk-1(-1)=0。在搜索階段exc(n)(n=0,......,63)是未知的,而且只有基音周期小于64時(shí)才需要,為使搜索簡(jiǎn)單化,將線性預(yù)測(cè)殘差存入exc(n)使(1)式對(duì)所有整數(shù)都有效。
對(duì)于確定最佳整數(shù)閉環(huán)延時(shí)T1和T2,則在最佳整數(shù)閉環(huán)延時(shí)附近的分?jǐn)?shù)分辨率做測(cè)試。內(nèi)插歸一化系數(shù)R(k)并搜索其最大值得到的分?jǐn)?shù)基音周期。搜索用FIR濾波器b16哈明窗截取函數(shù),截?cái)嘣凇?5處,在±16處用零填充(即b16(16)=0),濾波器的截止頻率(-3dB)為5.063KHz。
確定基音延時(shí)后,在給出的整數(shù)延時(shí)k和分?jǐn)?shù)延時(shí)t處內(nèi)插過(guò)去的激勵(lì)exc(n)來(lái)計(jì)算自適應(yīng)碼本矢量v(n) n=0,......,63 t=0,1,2,3 內(nèi)插濾波器b64哈明窗截取函數(shù),截?cái)嘣凇?3處,在±64處用零填充(即b64(64)=0),濾波器的截止頻率(-3dB)為6.016KHz。
3.自適應(yīng)碼本激勵(lì)信號(hào)的選擇 參見(jiàn)圖1,本步驟分兩路搜索最佳的自適應(yīng)碼本及其增益,并通過(guò)比較,選擇最佳的一路方案,其兩路激勵(lì)信號(hào)分別為 a).步驟2中搜索計(jì)算得到的自適應(yīng)碼本v(n); b).對(duì)步驟2中搜索計(jì)算得到的自適應(yīng)碼本v(n)做低通濾波得到的新的自適應(yīng)碼本v′(n),其中低通濾波器為F(z)=0.18z-1+0.64+0.18z,v′(n)=v(n)*f(n),f(n)是F(z)的逆Z變換。
下面的過(guò)程對(duì)激勵(lì)信號(hào)v(n)和v′(n)的處理相同,本說(shuō)明書(shū)以對(duì)v(n)處理為例加以說(shuō)明 i)使用加權(quán)合成濾波器的沖擊響應(yīng)h(n)卷積激勵(lì)信號(hào)v(n),計(jì)算得到加權(quán)合成信號(hào)synth(n),如下式所示 synth(n)=v(n)*h(n) ii)計(jì)算合成信號(hào)與目標(biāo)信號(hào)的匹配的增益,增益信號(hào)的計(jì)算公式如下所示 其中,x(n)表示目標(biāo)信號(hào),synth(n)表示加權(quán)合成信號(hào),gain代表預(yù)測(cè)增益。
iii)去除目標(biāo)信號(hào)的長(zhǎng)時(shí)相關(guān)性,計(jì)算誤差的能量,使用如下的公式去除目標(biāo)信號(hào)的長(zhǎng)時(shí)相關(guān)性 error(n)=x(n)-gain×synth(n) 計(jì)算得到誤差信號(hào)error(n),并計(jì)算誤差信號(hào)的能量ener 將更新的自適應(yīng)碼本v′(n)通過(guò)上述同樣的3個(gè)處理步驟,分別得到預(yù)測(cè)增益gain′,誤差信號(hào)的能量ener′。
對(duì)于這兩路運(yùn)算過(guò)程,比較兩個(gè)誤差信號(hào)能量值,選取誤差信號(hào)能量小的一路作為激勵(lì)信號(hào)的處理方式,即 若ener≤ener′,選擇v(n)作為激勵(lì)信號(hào),并將gain傳到解碼端;若ener>ener′,則選擇v′(n)作為激勵(lì)信號(hào),并將gain′傳到解碼端,同時(shí)將選擇哪個(gè)自適應(yīng)碼本的信息傳到解碼端,在解碼端對(duì)合成的激勵(lì)信號(hào)做同樣的處理。
在上述自適應(yīng)碼本激勵(lì)信號(hào)的選擇過(guò)程中,采用了閉環(huán)的多路選擇方法,算法復(fù)雜度比較高,并且所帶來(lái)的編碼性能增益有限。
發(fā)明內(nèi)容
為了降低選擇算法的復(fù)雜性,本發(fā)明提供了選擇自適應(yīng)碼本激勵(lì)信號(hào)的方法和裝置。
一種選擇自適應(yīng)碼本激勵(lì)信號(hào)的方法,包括 計(jì)算目標(biāo)信號(hào)和脈沖響應(yīng),根據(jù)所述目標(biāo)信號(hào)和脈沖響應(yīng)搜索自適應(yīng)碼本激勵(lì)信號(hào); 計(jì)算該搜索到的自適應(yīng)碼本激勵(lì)信號(hào)的高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)之間的高頻激勵(lì)相關(guān)性,判斷該計(jì)算出的高頻激勵(lì)相關(guān)性是否大于預(yù)設(shè)的相關(guān)性閾值,若是,則選擇搜索到的自適應(yīng)碼本激勵(lì)信號(hào)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
一種選擇自適應(yīng)碼本激勵(lì)信號(hào)的裝置,包括自適應(yīng)碼本激勵(lì)信號(hào)搜索單元、處理單元和比較選擇單元,其中, 所述自適應(yīng)碼本激勵(lì)信號(hào)搜索單元,用于根據(jù)已計(jì)算出的目標(biāo)信號(hào)和脈沖響應(yīng),搜索自適應(yīng)碼本激勵(lì)信號(hào); 所述處理單元,用于計(jì)算該搜索到的自適應(yīng)碼本激勵(lì)信號(hào)的高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)之間的高頻激勵(lì)相關(guān)性,并將計(jì)算出的高頻激勵(lì)相關(guān)性值送入比較選擇單元; 所述比較選擇單元,用于確定所述計(jì)算出的高頻激勵(lì)相關(guān)性大于預(yù)設(shè)的相關(guān)性閾值后,選擇搜索到的自適應(yīng)碼本激勵(lì)信號(hào)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
上述選擇自適應(yīng)碼本激勵(lì)信號(hào)的方法和裝置,根據(jù)所搜索到的自適應(yīng)碼本的高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)計(jì)算高頻激勵(lì)相關(guān)性值,并通過(guò)比較該計(jì)算出的高頻激勵(lì)相關(guān)性與預(yù)設(shè)的相關(guān)性閾值之間的大小,來(lái)決定選擇那個(gè)信號(hào)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。即若計(jì)算出的高頻激勵(lì)相關(guān)性大于預(yù)設(shè)的相關(guān)性閾值,則選擇搜索到的自適應(yīng)碼本信號(hào)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào),否則將搜索到的自適應(yīng)碼本的低頻部分作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
圖1是現(xiàn)有技術(shù)的選擇自適應(yīng)碼本激勵(lì)信號(hào)的流程示意圖; 圖2是根據(jù)本發(fā)明一實(shí)施例的選擇自適應(yīng)碼本激勵(lì)信號(hào)的流程示意圖; 圖3是根據(jù)本發(fā)明一實(shí)施例的選擇自適應(yīng)碼本激勵(lì)信號(hào)的裝置結(jié)構(gòu)示意圖。
具體實(shí)施例方式 下面結(jié)合具體實(shí)施例對(duì)本發(fā)明技術(shù)方案進(jìn)行說(shuō)明。
1.計(jì)算目標(biāo)信號(hào)和脈沖響應(yīng) 對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行感知加權(quán),令感知加權(quán)濾波器的響應(yīng)為w(n),計(jì)算加權(quán)域信號(hào)wsp(n) wsp(n)=speech(n)*w(n)(*表示卷積) 計(jì)算加權(quán)合成濾波器的零輸入響應(yīng)xn2(n) 令自適應(yīng)碼本搜索使用的目標(biāo)信號(hào)為xn(n) xn(n)=wsp(n)-xn2(n) 目標(biāo)信號(hào)將用于閉環(huán)基音搜索過(guò)程中對(duì)基音周期搜索的候選值進(jìn)行遴選。
令加權(quán)合成濾波器的的脈沖響應(yīng)為h(n),則h(n)=ξ-1(H(z)) 2.自適應(yīng)碼本搜索 自適應(yīng)碼本參數(shù)為基音延時(shí)和增益。在搜索階段,線性預(yù)測(cè)殘差擴(kuò)展激勵(lì)使閉環(huán)搜索簡(jiǎn)單化,每一個(gè)子幀做一次自適應(yīng)碼本搜索。
在12.65,14.25,15.85,18.25,19.85,23.05和23.85kbits/s模式下,在每幀的第一和第三子幀中,搜索的范圍為,基音延時(shí)T1在
范圍內(nèi),分辨率為
分?jǐn)?shù)延時(shí);在
范圍內(nèi),分辨率為
分?jǐn)?shù)延時(shí);在[160,231]范圍內(nèi),只進(jìn)行整數(shù)基音延時(shí)搜索。對(duì)于每幀的第二和第四子幀,基音延時(shí)T2在
中搜索,分辨率為
分?jǐn)?shù)延時(shí)。這里int(T1)是取分?jǐn)?shù)延時(shí)T1的整數(shù)部分,這個(gè)范圍適合于T1跨在延時(shí)范圍邊界的情況,并且是最臨近的第一或第三個(gè)子幀。
對(duì)于8.85kbits/s模式,在每幀的第一和第三個(gè)子幀,基音延時(shí)T1在
范圍內(nèi),分辨率為
分?jǐn)?shù)延時(shí),在區(qū)間[92,231]中,只進(jìn)行整數(shù)基音延時(shí)搜索。對(duì)于第二和第四個(gè)子幀,基音延時(shí)T2在
中搜索,分辨率為
分?jǐn)?shù)延時(shí)。
對(duì)于最低的6.60kbit/s模式,在每幀的第一個(gè)子幀,基音延時(shí)T1在
范圍內(nèi),分辨率為
在區(qū)間[92,231]中,只進(jìn)行整數(shù)基音延時(shí)搜索。對(duì)于第二、三和四個(gè)子幀,基音延時(shí)T2在
中搜索,分辨率為
分?jǐn)?shù)延時(shí)。
閉環(huán)基音搜索的準(zhǔn)則是使原始語(yǔ)音和重構(gòu)語(yǔ)音之間均方加權(quán)誤差最小化,即使R(k)最大。
其中x(n)表示目標(biāo)信號(hào),yk(n)是在延時(shí)k的過(guò)去濾波激勵(lì)(即過(guò)去激勵(lì)與h(n)的卷積,yk(n)=h(n)*exc(n-k))。搜索范圍限制在預(yù)選值附近,即每幀的第一和第三個(gè)子幀是開(kāi)環(huán)基音值Top,第二個(gè)或第四個(gè)是最臨近的第一或第三個(gè)子幀分?jǐn)?shù)延時(shí)T1的整數(shù)部分int(T1)。計(jì)算延時(shí)tmin的卷積yk(n),對(duì)其它整數(shù)延時(shí)在搜索范圍k=tmin+1,.....,tmax用下面關(guān)系修正 yk(n)=y(tǒng)k-1(n-1)+exc(-k)h(n),n=63,......,0 這里exc(n)(n=-231,......,63)是激勵(lì)緩沖器的值,yk-1(-1)=0。在搜索階段exc(n)(n=0,......,63)是未知的,而且只有基音周期小于64時(shí)才需要,為使搜索簡(jiǎn)單化,將線性預(yù)測(cè)殘差存入exc(n)使(2)式對(duì)所有整數(shù)都有效。
對(duì)于確定最佳整數(shù)閉環(huán)延時(shí)T1和T2,則在最佳整數(shù)閉環(huán)延時(shí)附近的分?jǐn)?shù)分辨率做測(cè)試。內(nèi)插歸一化系數(shù)R(k)并搜索其最大值得到的分?jǐn)?shù)基音周期。搜索用FIR濾波器b16哈明窗截取函數(shù),截?cái)嘣凇?5處,在±16處用零填充(即b16(16)=0),濾波器的截止頻率(-3dB)為5.063KHz。
確定基音延時(shí)后,在給出的整數(shù)延時(shí)k和分?jǐn)?shù)延時(shí)t處內(nèi)插過(guò)去的激勵(lì)exc(n)來(lái)計(jì)算自適應(yīng)碼本矢量v(n) n=0,......,63 t=0,1,2,3 內(nèi)插濾波器b64哈明窗截取函數(shù),截?cái)嘣凇?3處,在±64處用零填充(即b64(64)=0),濾波器的截止頻率(-3dB)為6.016KHz。
3.開(kāi)環(huán)自適應(yīng)碼本激勵(lì)信號(hào)選擇 參見(jiàn)圖2,本實(shí)施例中該步驟分如下幾步 S1)獲取步驟2中計(jì)算得到的自適應(yīng)碼本激勵(lì)v(n)信號(hào)。
S2)對(duì)得到的自適應(yīng)碼本激勵(lì)v(n)做低通濾波得到其低頻部分v_low(n),其計(jì)算過(guò)程如下 其中b(-1)=b(1)=0.28 b(0)=0.44 n=0,......,m-1,m為自適應(yīng)碼本激勵(lì)信號(hào)的長(zhǎng)度,本實(shí)施例中m等于64。
其中低通濾波器的形式為F(z)=αz-1+β+az 其中2α+β=1,如F(z)=0.18z-1+0.64+0.18z。
S3)計(jì)算自適應(yīng)碼本激勵(lì)v(n)的高頻部分v_high(n) v_high(n)=v(n)-v_low(n) n=0,.....,m-1,m為自適應(yīng)碼本激勵(lì)信號(hào)的長(zhǎng)度,本實(shí)施例中m等于64。
S4)計(jì)算加權(quán)域語(yǔ)音殘差信號(hào)即輸入語(yǔ)音信號(hào)的殘差信號(hào)r(n) 其中
為分析濾波器
為量化后的線性預(yù)測(cè)系統(tǒng)(LPC系數(shù)),p為線性預(yù)測(cè)階數(shù)。
S5)計(jì)算殘差信號(hào)r(n)與自適應(yīng)碼本激勵(lì)v(n)的高頻部分v_high(n)的互相關(guān),即高頻激勵(lì)互相關(guān)corr_exc_high 上式中的63為相關(guān)長(zhǎng)度,當(dāng)然,該數(shù)值可根據(jù)不同的自適應(yīng)碼本激勵(lì)長(zhǎng)度做相應(yīng)的更改。
S6)判斷互相關(guān)corr_exc_high與給定的相關(guān)性閾值γ=0.19的大小,若corr_exc_high>γ,則執(zhí)行步驟S7),若corr_exc_high≤γ,則執(zhí)行步驟S8)。
上述給定的相關(guān)性域值γ是根據(jù)最終編碼效果確定的。
S7)corr_exc_high>γ,最終的自適應(yīng)激勵(lì)碼本信號(hào)為v(n); 令加權(quán)合成信號(hào)為synth(n),則有 synth(n)=h(n)*v(n) 之后,計(jì)算增益大小此時(shí)增益大小gain為(其中x(n)為目標(biāo)信號(hào)) S8)corr_exc_high≤γ,則最終的自適應(yīng)激勵(lì)碼本信號(hào)為v_low(n); 令加權(quán)合成信號(hào)為synth′(n),則有 synth′(n)=h(n)*v_low(n) 之后,計(jì)算增益大小此時(shí)增益大小gain′為 同樣,式(4)、(5)中的63也可以根據(jù)實(shí)際自適應(yīng)碼本激勵(lì)長(zhǎng)度做更改。
至此,以完成了自適應(yīng)碼本激勵(lì)信號(hào)的選擇,并計(jì)算出了長(zhǎng)時(shí)預(yù)測(cè)增益。
將gain或gain′編碼傳到解碼端,同時(shí)將選擇了哪個(gè)作為最終的自適應(yīng)激勵(lì)碼本信號(hào)的信息也傳到解碼端,在解碼端對(duì)合成的激勵(lì)信號(hào)做同樣的處理。
另外,上述式(3)的算法僅為一實(shí)施例,也可以按照下面式(6)的方式獲取高頻激勵(lì)互相關(guān)值corr_exc_high 這樣,corr_exc_high沒(méi)有進(jìn)行歸一化處理,m為自適應(yīng)碼本激勵(lì)信號(hào)的長(zhǎng)度。
之后的步驟仍按照S6)、S7)、S8)進(jìn)行,只是此時(shí)的給定的相關(guān)性閾值γ的大小需根據(jù)最終編碼效果的需要重新調(diào)整。
另外,對(duì)于上面的“3.開(kāi)環(huán)自適應(yīng)碼本激勵(lì)信號(hào)選擇”,還有一種可行的方案是 S1’)獲取步驟2中計(jì)算得到的自適應(yīng)碼本激勵(lì)v(n)信號(hào)。
S2’)對(duì)得到的自適應(yīng)碼本激勵(lì)v(n)做高通濾波得到其高頻頻部分v_high(n)。
之后,計(jì)算加權(quán)域語(yǔ)音殘差信號(hào)即輸入語(yǔ)音信號(hào)的殘差信號(hào)r(n),并計(jì)算殘差信號(hào)r(n)與自適應(yīng)碼本激勵(lì)v(n)的高頻部分v_high(n)的高頻激勵(lì)互相關(guān)corr_exc_high,判斷互相關(guān)corr_exc_high與給定的相關(guān)性閾值γ的大小,這些步驟與前述S4)~S6)完全相同。
若corr_exc_high>γ,則選擇最終搜索到的自適應(yīng)激勵(lì)碼本信號(hào)v(n)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào),之后可以計(jì)算增益,具體處理過(guò)程與前述的步驟S7)完全相同。
若corr_exc_high≤γ,則選擇搜索到的經(jīng)過(guò)低通濾波后的自適應(yīng)碼本激勵(lì)信號(hào)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào),之后可以計(jì)算增益,增益的算法與前述步驟8)相同,對(duì)于要選擇的自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分,有以下兩種獲取方法 一種是對(duì)搜索到的自適應(yīng)碼本激勵(lì)v(n)做低通濾波得到其低頻部分v_low(n),然后選擇低頻部分信號(hào)v_low(n)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
另一種是應(yīng)用搜索到的自適應(yīng)碼本激勵(lì)v(n)減去已計(jì)算出的高頻部分v_high(n),來(lái)獲得搜索到的自適應(yīng)碼本激勵(lì)v(n)的低頻部分,即 v_low(n)=v(n)-v_high(n) 然后再選擇然后選擇低頻部分信號(hào)v_low(n)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
本發(fā)明還公開(kāi)了一種選擇自適應(yīng)碼本激勵(lì)信號(hào)的裝置,參見(jiàn)圖3,包括自適應(yīng)碼本激勵(lì)信號(hào)搜索單元310、處理單元320和比較選擇單元330,其中, 自適應(yīng)碼本激勵(lì)信號(hào)搜索單元310用于根據(jù)已計(jì)算出的目標(biāo)信號(hào)和脈沖響應(yīng),搜索自適應(yīng)碼本激勵(lì)信號(hào); 處理單元320用于計(jì)算該搜索到的自適應(yīng)碼本激勵(lì)信號(hào)的高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)之間的高頻激勵(lì)相關(guān)性,并將計(jì)算出的高頻激勵(lì)相關(guān)性值送入比較選擇單元330; 比較選擇單元330用于確定所述計(jì)算出的高頻激勵(lì)相關(guān)性大于預(yù)設(shè)的相關(guān)性閾值后,選擇搜索到的自適應(yīng)碼本激勵(lì)信號(hào)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
上述處理單元320可以有以下兩種結(jié)構(gòu) 一種是處理單元320包括低通濾波單元和計(jì)算單元,其中, 低通濾波單元用于對(duì)接收到的自適應(yīng)碼本激勵(lì)信號(hào)進(jìn)行低通濾波; 計(jì)算單元用于應(yīng)用搜索到的自適應(yīng)碼本激勵(lì)信號(hào)減去經(jīng)低通濾波后的低頻部分,獲得自適應(yīng)碼本激勵(lì)信號(hào)的高頻部分,再應(yīng)用該高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)之間的高頻激勵(lì)相關(guān)性,并將計(jì)算出的高頻激勵(lì)相關(guān)性值送入比較選擇單元。
另一種是處理單元320還包括高通濾波單元和計(jì)算單元,其中, 高通濾波單元用于對(duì)接收到的自適應(yīng)碼本激勵(lì)信號(hào)進(jìn)行高通濾波; 計(jì)算單元應(yīng)用經(jīng)高通濾波后的自適應(yīng)碼本激勵(lì)信號(hào)高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)之間的高頻激勵(lì)相關(guān)性,并將計(jì)算出的高頻激勵(lì)相關(guān)性值送入比較選擇單元。此時(shí),該計(jì)算單元還可以用于應(yīng)用搜索到的自適應(yīng)碼本激勵(lì)信號(hào)減去經(jīng)高通濾波后的高頻部分,獲得自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分,將該自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分送入比較選擇單元。
在后一種情況下,如果計(jì)算單元不包括計(jì)算自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分的功能,則此時(shí)處理單元320內(nèi)還可以包括低通濾波單元,用于對(duì)接收到的自適應(yīng)碼本激勵(lì)信號(hào)進(jìn)行低通濾波,將該過(guò)低通濾波后的自適應(yīng)碼本激勵(lì)信號(hào)送入比較選擇單元。
比較選擇單元330還用于確定計(jì)算出的高頻激勵(lì)相關(guān)性小于等于預(yù)設(shè)的相關(guān)性閾值后,選擇搜索到的自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
上述裝置還可以進(jìn)一步包括增益計(jì)算單元340,用于根據(jù)當(dāng)前所選擇的自適應(yīng)碼本激勵(lì)信號(hào)計(jì)算增益。
上述各單元的計(jì)算方式與前述相同,不再贅述。
本發(fā)明所述方法和裝置提高了寬帶語(yǔ)音編碼性能實(shí)驗(yàn)表明,本方案相比現(xiàn)有技術(shù)提高了編碼信噪比(SNR);并且,極大降低了選擇運(yùn)算的復(fù)雜度統(tǒng)計(jì)分析表明,本算法復(fù)雜度僅為現(xiàn)有技術(shù)的60%。
以上所述僅為本發(fā)明的較佳實(shí)施例而已,并非用于限定本發(fā)明的保護(hù)范圍。凡在本發(fā)明的精神和原則之內(nèi)所作的任何修改、等同替換、改進(jìn)等,均包含在本發(fā)明的保護(hù)范圍內(nèi)。
權(quán)利要求
1.一種選擇自適應(yīng)碼本激勵(lì)信號(hào)的方法,其特征在于,包括
計(jì)算目標(biāo)信號(hào)和脈沖響應(yīng),根據(jù)所述目標(biāo)信號(hào)和脈沖響應(yīng)搜索自適應(yīng)碼本激勵(lì)信號(hào);
計(jì)算該搜索到的自適應(yīng)碼本激勵(lì)信號(hào)的高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)之間的高頻激勵(lì)相關(guān)性,判斷該計(jì)算出的高頻激勵(lì)相關(guān)性是否大于預(yù)設(shè)的相關(guān)性閾值,若是,則選擇搜索到的自適應(yīng)碼本激勵(lì)信號(hào)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,若計(jì)算出的高頻激勵(lì)相關(guān)性小于等于預(yù)設(shè)的相關(guān)性閾值,則該方法進(jìn)一步包括選擇搜索到的自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
3.根據(jù)權(quán)利要求1或2所述的方法,其特征在于,進(jìn)一步包括
根據(jù)當(dāng)前所選擇的自適應(yīng)碼本激勵(lì)信號(hào)計(jì)算增益。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述搜索到的自適應(yīng)碼本激勵(lì)信號(hào)高頻部分的獲得過(guò)程包括
i)使用低通濾波器對(duì)搜索到的自適應(yīng)碼本激勵(lì)信號(hào)作低通濾波,得到自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分v_low(n)
其中,b(-1)=b(1)=0.28 b(0)=0.44 n=0,......,m-1;v(n)是搜索得到的自適應(yīng)碼本信號(hào);m為自適應(yīng)碼本激勵(lì)信號(hào)的長(zhǎng)度;
ii)根據(jù)所述自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分v_low(n),計(jì)算自適應(yīng)碼本激勵(lì)v(n)的高頻部分v_high(n)
v_high(n)=v(n)-v_low(n)
n=0,......,m-1,m為自適應(yīng)碼本激勵(lì)信號(hào)的長(zhǎng)度。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述自適應(yīng)碼本激勵(lì)信號(hào)的高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)之間的高頻激勵(lì)相關(guān)性corr_exc_high的計(jì)算方法為
其中,r(n)為輸入語(yǔ)音信號(hào)的殘差信號(hào),v_high(n)是自適應(yīng)碼本激勵(lì)v(n)的高頻部分,m為自適應(yīng)碼本激勵(lì)信號(hào)的長(zhǎng)度。
6.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述自適應(yīng)碼本激勵(lì)信號(hào)的高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)之間的高頻激勵(lì)相關(guān)性corr_exc_high的計(jì)算方法為
其中,r(n)為輸入語(yǔ)音信號(hào)的殘差信號(hào),v_high(n)是自適應(yīng)碼本激勵(lì)v(n)的高頻部分,m為自適應(yīng)碼本激勵(lì)信號(hào)的長(zhǎng)度。
7.根據(jù)權(quán)利要求5或6所述的方法,其特征在于,所述輸入語(yǔ)音信號(hào)的殘差信號(hào)r(n)的計(jì)算方法為
其中,
為分析濾波器
為量化后的線性預(yù)測(cè)系統(tǒng),p為線性預(yù)測(cè)階數(shù)。
8.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述搜索到的自適應(yīng)碼本激勵(lì)信號(hào)高頻部分的獲得過(guò)程包括
使用高通濾波器對(duì)搜索到的自適應(yīng)碼本激勵(lì)信號(hào)作高通濾波,得到自適應(yīng)碼本激勵(lì)信號(hào)的高頻部分v_high(n)。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述選擇搜索到的自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分作為當(dāng)前自適應(yīng)碼本激勵(lì)信號(hào)的過(guò)程包括
應(yīng)用搜索到的自適應(yīng)碼本激勵(lì)v(n)減去已計(jì)算出的高頻部分v_high(n),獲得搜索到的自適應(yīng)碼本激勵(lì)的低頻部分v_low(n),然后再選擇v_low(n)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
10.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述選擇搜索到的自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分作為當(dāng)前自適應(yīng)碼本激勵(lì)信號(hào)的過(guò)程包括
使用低通濾波器對(duì)搜索到的自適應(yīng)碼本激勵(lì)信號(hào)作低通濾波,得到自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分v_low(n),再選擇該經(jīng)過(guò)低通濾波后的自適應(yīng)碼本激勵(lì)信號(hào)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
11.一種選擇自適應(yīng)碼本激勵(lì)信號(hào)的裝置,其特征在于,包括自適應(yīng)碼本激勵(lì)信號(hào)搜索單元、處理單元和比較選擇單元,其中,
所述自適應(yīng)碼本激勵(lì)信號(hào)搜索單元,用于根據(jù)已計(jì)算出的目標(biāo)信號(hào)和脈沖響應(yīng),搜索自適應(yīng)碼本激勵(lì)信號(hào);
所述處理單元,用于計(jì)算該搜索到的自適應(yīng)碼本激勵(lì)信號(hào)的高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)之間的高頻激勵(lì)相關(guān)性,并將計(jì)算出的高頻激勵(lì)相關(guān)性值送入比較選擇單元;
所述比較選擇單元,用于確定所述計(jì)算出的高頻激勵(lì)相關(guān)性大于預(yù)設(shè)的相關(guān)性閾值后,選擇搜索到的自適應(yīng)碼本激勵(lì)信號(hào)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述處理單元包括低通濾波單元和計(jì)算單元,其中,
所述低通濾波單元,用于對(duì)接收到的自適應(yīng)碼本激勵(lì)信號(hào)進(jìn)行低通濾波;
所述計(jì)算單元,用于應(yīng)用搜索到的自適應(yīng)碼本激勵(lì)信號(hào)減去經(jīng)低通濾波后的低頻部分,獲得自適應(yīng)碼本激勵(lì)信號(hào)的高頻部分,再應(yīng)用該高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)之間的高頻激勵(lì)相關(guān)性,并將計(jì)算出的高頻激勵(lì)相關(guān)性值送入比較選擇單元。
13.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述處理單元包括高通濾波單元和計(jì)算單元,
所述高通濾波單元,用于對(duì)接收到的自適應(yīng)碼本激勵(lì)信號(hào)進(jìn)行高通濾波;
所述計(jì)算單元,應(yīng)用經(jīng)高通濾波后的自適應(yīng)碼本激勵(lì)信號(hào)高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)之間的高頻激勵(lì)相關(guān)性,并將計(jì)算出的高頻激勵(lì)相關(guān)性值送入比較選擇單元。
14.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述計(jì)算單元還用于應(yīng)用搜索到的自適應(yīng)碼本激勵(lì)信號(hào)減去經(jīng)高通濾波后的高頻部分,獲得自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分,將所述計(jì)算得到的自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分送入比較選擇單元。
15.根據(jù)權(quán)利要求13所述的裝置,其特征在于,所述處理單元還包括低通濾波單元,用于對(duì)接收到的自適應(yīng)碼本激勵(lì)信號(hào)進(jìn)行低通濾波,將該過(guò)低通濾波后的自適應(yīng)碼本激勵(lì)信號(hào)送入比較選擇單元。
16.根據(jù)權(quán)利要求14或15所述的裝置,其特征在于,所述比較選擇單元還用于確定計(jì)算出的高頻激勵(lì)相關(guān)性小于等于預(yù)設(shè)的相關(guān)性閾值后,選擇搜索到的自適應(yīng)碼本激勵(lì)信號(hào)的低頻部分作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。
17.根據(jù)權(quán)利要求16所述的裝置,其特征在于,該裝置進(jìn)一步包括增益計(jì)算單元,用于根據(jù)當(dāng)前所選擇的自適應(yīng)碼本激勵(lì)信號(hào)計(jì)算增益。
全文摘要
本發(fā)明公開(kāi)了一種選擇自適應(yīng)碼本激勵(lì)信號(hào)的方法及裝置,該方法根據(jù)所搜索到的自適應(yīng)碼本的高頻部分與輸入語(yǔ)音信號(hào)的殘差信號(hào)計(jì)算高頻激勵(lì)相關(guān)性,若計(jì)算出的高頻激勵(lì)相關(guān)性大于預(yù)設(shè)的相關(guān)性閾值,則選擇搜索到的自適應(yīng)碼本信號(hào)作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào),否則將搜索到的并經(jīng)過(guò)低通濾波處理的自適應(yīng)碼本的低頻部分作為當(dāng)前的自適應(yīng)碼本激勵(lì)信號(hào)。應(yīng)用本發(fā)明可以提高寬帶語(yǔ)音編碼性能實(shí)驗(yàn)表明,本方案相比現(xiàn)有技術(shù)提高了編碼信噪比(SNR);并且,極大降低了選擇運(yùn)算的復(fù)雜度統(tǒng)計(jì)分析表明,本算法復(fù)雜度僅為現(xiàn)有技術(shù)的60%。
文檔編號(hào)G10L19/12GK101192409SQ20061014578
公開(kāi)日2008年6月4日 申請(qǐng)日期2006年11月21日 優(yōu)先權(quán)日2006年11月21日
發(fā)明者胡瑞敏, 勇 張, 霖 劉, 楊玉紅, 戈 高, 王庭紅, 馬付偉 申請(qǐng)人:華為技術(shù)有限公司, 武漢大學(xué)