欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)多級(jí)矢量量化方法

文檔序號(hào):2830881閱讀:270來源:國知局
專利名稱:帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)多級(jí)矢量量化方法
技術(shù)領(lǐng)域
帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)多級(jí)矢量量化方法屬于語音編碼技術(shù)領(lǐng)域,特別涉及多幀聯(lián)合處理低碼率參數(shù)語音編碼技術(shù)。

背景技術(shù)
語音編碼在通信系統(tǒng)、語音存儲(chǔ)回放系統(tǒng)、具有語音功能的消費(fèi)類產(chǎn)品中有廣泛的應(yīng)用。近些年來國際電信聯(lián)盟(ITU)、一些區(qū)域組織和一些國家相繼制定了一系列語音壓縮編碼標(biāo)準(zhǔn),在編碼速率為1.2kb/s到16kb/s上得到了令人滿意的語音質(zhì)量。目前國內(nèi)外的研究主要集中在1.2kb/s以下速率高質(zhì)量語音壓縮編碼上,主要用于無線通信、保密通信、大容量語音存儲(chǔ)回放等。由于編碼速率太低,必須采用多幀聯(lián)合(即超幀)處理的參數(shù)語音編碼技術(shù),其中最關(guān)鍵的是如何對(duì)聲道參數(shù)進(jìn)行量化,因?yàn)槁暤绤?shù)量化所需要的比特?cái)?shù)最高,對(duì)它量化的質(zhì)量將決定語音可懂度。
直接對(duì)聲道A參數(shù)量化效果不好,因此需要將聲道A參數(shù)轉(zhuǎn)成線譜對(duì)參數(shù),然后再進(jìn)行量化。如圖1所示,該方法包括以下步驟 步驟(1)對(duì)輸入語音信號(hào)樣點(diǎn)按時(shí)間順序分幀,將連續(xù)的若干幀組成一個(gè)超幀; 步驟(2)對(duì)當(dāng)前超幀中的每一幀提取聲道A參數(shù); 步驟(3)將當(dāng)前超幀中的每一幀聲道A參數(shù)轉(zhuǎn)換成線譜對(duì)參數(shù); 步驟(4)對(duì)當(dāng)前超幀中的每一幀提取清濁音參數(shù); 步驟(5)對(duì)當(dāng)前超幀的清濁音參數(shù)進(jìn)行矢量量化,得到當(dāng)前超幀量化后的清濁音參數(shù)量化值; 步驟(6)根據(jù)當(dāng)前超幀清濁音參數(shù)量化值確定當(dāng)前超幀模式; 步驟(7)根據(jù)當(dāng)前超幀的模式確定當(dāng)前超幀中每一個(gè)線譜對(duì)參數(shù)的直流分量,并從每一個(gè)線譜對(duì)參數(shù)中減去相應(yīng)的直流分量; 步驟(8)根據(jù)當(dāng)前超幀模式和前一個(gè)超幀的模式確定一組線譜對(duì)參數(shù)預(yù)測(cè)系數(shù); 步驟(9)利用這一組預(yù)測(cè)系數(shù)和前一超幀中最后一幀量化后的余量線譜對(duì)參數(shù)計(jì)算預(yù)測(cè)值;從當(dāng)前超幀中每一個(gè)已去直流線譜對(duì)參數(shù)中減去相應(yīng)的預(yù)測(cè)值,得到當(dāng)前超幀的余量線譜對(duì)參數(shù); 步驟(10)對(duì)當(dāng)前超幀的余量線譜對(duì)參數(shù)進(jìn)行多級(jí)矢量量化,得到當(dāng)前超幀量化后的余量線譜對(duì)參數(shù); 步驟(11)將上述步驟(7)得到的直流分量和上述步驟(9)得到的預(yù)測(cè)值加到量化后的余量線譜對(duì)參數(shù)中得到量化后的線譜對(duì)參數(shù); 步驟(12)將當(dāng)前超幀量化后的線譜對(duì)參數(shù)轉(zhuǎn)換成聲道A參數(shù),得到量化后的聲道A參數(shù)。
上述已有技術(shù)對(duì)超幀線譜對(duì)參數(shù)采用矢量量化,在矢量量化之前對(duì)線譜對(duì)參數(shù)去除直流分量,并利用已處理過的上一超幀線譜對(duì)參數(shù)對(duì)當(dāng)前超幀的線譜對(duì)參數(shù)進(jìn)行預(yù)測(cè),然后去除預(yù)測(cè)分量,再進(jìn)行多級(jí)矢量量化。但在多級(jí)矢量量化過程中,搜索上一級(jí)碼本所選定的碼矢和下一級(jí)待量化的殘差矢量之間的相關(guān)性卻沒有得到充分利用,因而量化質(zhì)量并不是最優(yōu)的。
如圖1所示,原有技術(shù)只去除了各幀之間的相關(guān)性,但在低速率參數(shù)語音編碼技術(shù)中,對(duì)各參數(shù)尤其是LSF的量化精度要求很高,僅去除幀間冗余信息,不足以達(dá)到較高的量化質(zhì)量。


發(fā)明內(nèi)容
本發(fā)明的目的是克服已有技術(shù)的不足之處,提出一種超幀聲道參數(shù)矢量量化的方法,能夠充分利用超幀之間、多級(jí)矢量量化中上一級(jí)碼本的選定碼矢和殘差矢量之間的相關(guān)性,預(yù)測(cè)效率及量化精度更高。
本發(fā)明提出的帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)量化方法,包括以下步驟 步驟(1)對(duì)輸入語音信號(hào)樣點(diǎn)按時(shí)間順序分幀,將連續(xù)的若干幀組成一個(gè)超幀; 步驟(2)對(duì)當(dāng)前超幀中的每一幀提取聲道A參數(shù); 步驟(3)將當(dāng)前超幀中的每一幀聲道A參數(shù)轉(zhuǎn)換成線譜對(duì)參數(shù); 步驟(4)對(duì)當(dāng)前超幀中的每一幀提取清濁音參數(shù); 步驟(5)對(duì)當(dāng)前超幀的清濁音參數(shù)進(jìn)行矢量量化,得到當(dāng)前超幀量化后的清濁音參數(shù)量化值; 步驟(6)根據(jù)當(dāng)前超幀清濁音參數(shù)量化值確定當(dāng)前超幀模式; 步驟(7)根據(jù)當(dāng)前超幀的模式確定當(dāng)前超幀中每一個(gè)線譜對(duì)參數(shù)的直流分量,并從每一個(gè)線譜對(duì)參數(shù)中減去相應(yīng)的直流分量; 步驟(8)根據(jù)當(dāng)前超幀模式和前一個(gè)超幀的模式確定一組線譜對(duì)參數(shù)預(yù)測(cè)系數(shù); 步驟(9)利用這一組預(yù)測(cè)系數(shù)和前一超幀中最后一幀量化后的余量線譜對(duì)參數(shù)計(jì)算預(yù)測(cè)值;從當(dāng)前超幀中每一個(gè)已去直流線譜對(duì)參數(shù)中減去相應(yīng)的預(yù)測(cè)值,得到當(dāng)前超幀的余量線譜對(duì)參數(shù)R;同時(shí),設(shè)定變量R1=R,設(shè)定變量i,令i=1; 步驟(10)對(duì)Ri進(jìn)行矢量量化,在當(dāng)前第i級(jí)碼本中搜索與待量化矢量最近的碼矢

若當(dāng)前級(jí)為最后一級(jí),跳至步驟(14); 步驟(11)根據(jù)多級(jí)矢量量化級(jí)數(shù)及當(dāng)前級(jí)數(shù)確定一組級(jí)間預(yù)測(cè)系數(shù)αn(i,i+1),利用這一組預(yù)測(cè)系數(shù)和當(dāng)前第i級(jí)已定碼矢得到級(jí)間預(yù)測(cè)值Rip,其中, 步驟(12)從第i級(jí)待量化線譜對(duì)參數(shù)Ri中減去步驟(10)中搜索所得到的碼矢

及步驟(11)得到的預(yù)測(cè)值Rip,得到第i+1級(jí)待量化的矢量參數(shù)Ri+1; 步驟(13)令i=i+1,重復(fù)(10),(11),(12)的步驟,直至完成多級(jí)矢量量化最后一級(jí); 步驟(14)將多級(jí)矢量量化各級(jí)的選定碼矢及級(jí)間預(yù)測(cè)值相加求和,得到量化后的余量線譜對(duì)參數(shù); 步驟(15)將上述步驟(7)得到的直流分量和上述步驟(9)得到的預(yù)測(cè)值加到步驟(14)量化后的余量線譜對(duì)參數(shù)中得到量化后的線譜對(duì)參數(shù); 步驟(16)將當(dāng)前超幀量化后的線譜對(duì)參數(shù)轉(zhuǎn)換成聲道A參數(shù),得到量化后的聲道A參數(shù)。
本發(fā)明的特點(diǎn)是在對(duì)線譜對(duì)參數(shù)的多級(jí)矢量量化過程中,不僅采用了幀間預(yù)測(cè),在多級(jí)矢量量化過程中也采用了級(jí)間預(yù)測(cè)。目前的語音參數(shù)編碼模型中,只考慮了超幀幀間的相關(guān)性,并利用了此相關(guān)性得到余量線譜對(duì)參數(shù),從而降低了量化的計(jì)算量和存儲(chǔ)量,并達(dá)到了較高的量化精度。本發(fā)明經(jīng)過對(duì)大量語音樣本統(tǒng)計(jì),發(fā)現(xiàn)多級(jí)矢量量化中上一級(jí)碼本搜索過程中所選定的碼矢和下一級(jí)待量化殘差矢量之間也存在一定的相關(guān)性,利用這種相關(guān)性可以提高低碼率語音編碼的性能。本發(fā)明利用余量線譜對(duì)參數(shù)多級(jí)矢量量化中,各級(jí)之間的相關(guān)性,進(jìn)一步去除冗余信息,得到新的待量化參數(shù),可以更好地完成余量線譜對(duì)的多級(jí)矢量量化。這種方法利用多級(jí)矢量量化中上一級(jí)碼本搜索過程中選定碼矢和殘差矢量之間的相關(guān)性,使得對(duì)聲道參數(shù)量化的精度得到了提高,進(jìn)而提高了低碼率語音編碼的質(zhì)量。
本方法可以提高聲道參數(shù)的量化精度,使合成語音具有更高的可懂性。該方法最適合300~2400b/s低速率參數(shù)語音編碼。



圖1為已有技術(shù)的超幀聲道參數(shù)量化方法流程框圖。
圖2為本發(fā)明提出的超幀聲道參數(shù)量化方法流程框圖。

具體實(shí)施例方式 本發(fā)明提出的超幀聲道參數(shù)矢量量化方法結(jié)合附圖及實(shí)施例進(jìn)一步說明如下 本發(fā)明的方法流程如圖2所示,包括以下步驟 步驟(1)對(duì)輸入語音信號(hào)樣點(diǎn)按時(shí)間順序分幀,將連續(xù)的若干幀組成一個(gè)超幀; 步驟(2)對(duì)當(dāng)前超幀中的每一幀提取聲道A參數(shù); 步驟(3)將當(dāng)前超幀中的每一幀聲道A參數(shù)轉(zhuǎn)換成線譜對(duì)參數(shù); 步驟(4)對(duì)當(dāng)前超幀中的每一幀提取清濁音參數(shù); 步驟(5)對(duì)當(dāng)前超幀的清濁音參數(shù)進(jìn)行矢量量化,得到當(dāng)前超幀量化后的清濁音參數(shù)量化值; 步驟(6)根據(jù)當(dāng)前超幀清濁音參數(shù)量化值確定當(dāng)前超幀模式; 步驟(7)根據(jù)當(dāng)前超幀的模式確定當(dāng)前超幀中每一個(gè)線譜對(duì)參數(shù)的直流分量,并從每一個(gè)線譜對(duì)參數(shù)中減去相應(yīng)的直流分量; 步驟(8)根據(jù)當(dāng)前超幀模式和前一個(gè)超幀的模式確定一組線譜對(duì)參數(shù)預(yù)測(cè)系數(shù); 步驟(9)利用這一組預(yù)測(cè)系數(shù)和前一超幀中最后一幀量化后的余量線譜對(duì)參數(shù)計(jì)算預(yù)測(cè)值;從當(dāng)前超幀中每一個(gè)已去直流線譜對(duì)參數(shù)中減去相應(yīng)的預(yù)測(cè)值,得到當(dāng)前超幀的余量線譜對(duì)參數(shù)R;同時(shí),設(shè)定變量R1=R,設(shè)定變量i,令i=1; 步驟(10)對(duì)Ri進(jìn)行矢量量化,在當(dāng)前第i級(jí)碼本中搜索與待量化矢量最近的碼矢

若 當(dāng)前級(jí)為最后一級(jí),跳至步驟(14); 步驟(11)根據(jù)多級(jí)矢量量化級(jí)數(shù)及當(dāng)前級(jí)數(shù)確定一組級(jí)間預(yù)測(cè)系數(shù)αn(i,i+1),利用這一組預(yù)測(cè)系數(shù)和當(dāng)前第i級(jí)已定碼矢得到級(jí)間預(yù)測(cè)值Rip,其中, 步驟(12)從第i級(jí)待量化線譜對(duì)參數(shù)Ri中減去步驟(10)中搜索所得到的碼矢

及步驟(11)得到的預(yù)測(cè)值Rip,得到第i+1級(jí)待量化的矢量參數(shù)Ri+1; 步驟(13)令i=i+1,重復(fù)(10),(11),(12)的步驟,直至完成多級(jí)矢量量化最后一級(jí); 步驟(14)將多級(jí)矢量量化各級(jí)的選定碼矢及級(jí)間預(yù)測(cè)值相加求和,得到量化后的余量線譜對(duì)參數(shù); 步驟(15)將上述步驟(7)得到的直流分量和上述步驟(9)得到的預(yù)測(cè)值加到步驟(14)量化后的余量線譜對(duì)參數(shù)中得到量化后的線譜對(duì)參數(shù); 步驟(16)將當(dāng)前超幀量化后的線譜對(duì)參數(shù)轉(zhuǎn)換成聲道A參數(shù),得到量化后的聲道A參數(shù)。
本發(fā)明上述方法各步驟的具體實(shí)施例分別詳細(xì)說明如下 上述方法步驟(1)對(duì)輸入語音信號(hào)樣點(diǎn)按時(shí)間順序分幀,將連續(xù)的若干幀組成一個(gè)超幀的實(shí)施例是按8khz頻率采樣、已經(jīng)過高通濾波去除工頻干擾的語音樣點(diǎn)。每20ms,也就是160個(gè)語音樣點(diǎn)構(gòu)成一幀,連續(xù)6幀組成一個(gè)超幀(根據(jù)編碼速率選擇一個(gè)超幀所晗幀的數(shù)目,例如編碼速率為1200b/s可以選3幀,600b/s選6幀等)。
上述方法步驟(2)的實(shí)施例為按美國政府2400b/s多帶激勵(lì)的線性預(yù)測(cè)(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法對(duì)當(dāng)前超幀中的每一幀都提取10階聲道A參數(shù)an=[a1n,a2n,…,a10n](n=0,1,…,5)。
上述方法步驟(3)的實(shí)施例為按美國政府2400b/s多帶激勵(lì)的線性預(yù)測(cè)(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法將當(dāng)前超幀中的每一幀聲道A參數(shù)轉(zhuǎn)換成線譜對(duì)參數(shù)fn=[f1n,f2n,…,f10n],(n=0,1,…,5)。
上述方法步驟(4)的實(shí)施例為按美國政府2400b/s多帶激勵(lì)的線性預(yù)測(cè)(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法對(duì)當(dāng)前超幀中的每一幀都提取5個(gè)子帶的清濁音參數(shù),子帶為清音用“0”表示,子帶為濁音用“1”表示。這樣一個(gè)超幀中6個(gè)幀總共有30個(gè)子帶清濁音參數(shù),構(gòu)成一個(gè)30維的矢量,每一維的值為“0”或“1”,記做F 上述方法步驟(5)中的實(shí)施例為對(duì)上述清濁音矢量F用4比特矢量量化,總共有16種超幀清濁音矢量量化值,每一個(gè)矢量量化值對(duì)應(yīng)一種超幀模式;本實(shí)施例的矢量量化值碼表由表1給出,對(duì)應(yīng)的超幀模式也在表1中給出。量化失真測(cè)度采用加權(quán)歐氏距離準(zhǔn)則,即使下式所示的失真D最小 D=(F-F(i))·W·(F-F(i))T 其中F(i)(i=0,1,…,15)是矢量量化碼本中的一個(gè)碼字,加權(quán)矩陣W是一個(gè)對(duì)角矩陣,其值用來表示各子帶重要性的不同。通常低帶最重要,隨著頻帶的升高重要性依次降低,對(duì)每幀的5個(gè)子帶分配不同的權(quán)重,在本實(shí)施例中,5個(gè)子帶權(quán)重的比例為16∶8∶4∶2∶1,反映了低頻子帶比高頻子帶更重要,從而加權(quán)矩陣W如下所示
每個(gè)碼字都代表了超幀的一種模式,也就是說,通過超幀清濁判決參數(shù)的量化,可以確定超幀的模式。清濁音矢量量化碼字是通過對(duì)訓(xùn)練語音樣本統(tǒng)計(jì)得到的出現(xiàn)次數(shù)最多的16種超幀清濁音矢量。
上述方法步驟(6)的實(shí)施例為通過步驟(5)的實(shí)施例中對(duì)清濁音矢量F量化的結(jié)果,利用表1確定當(dāng)前超幀的模式,記作F0,下標(biāo)“0”表示當(dāng)前超幀。
表1超幀清濁音矢量量化碼表和對(duì)應(yīng)的超幀模式 上述方法步驟(7)的實(shí)施例為使用上述步驟(5)的實(shí)施例方法得到的當(dāng)前超幀模式F0確定各幀線譜對(duì)參數(shù)的直流分量矢量n=(0,1,…,5),并從對(duì)應(yīng)的線譜對(duì)參數(shù)中減去直流分量,得到去直流分量后的線譜對(duì)參數(shù)ln=[l1n,l2n,…,l10n](n=0,1,…,5) ln=fn-dn(F0),(n=0,1,…,5) 直流分量n=(0,1,…,5)是用訓(xùn)練語音得到的。本實(shí)施例的具體做法是將訓(xùn)練語音按超幀模式分成16個(gè)子集,對(duì)每個(gè)子集的線譜對(duì)參數(shù)分別求平均值即得到線譜對(duì)參數(shù)直流分量。
上述方法步驟(8)的實(shí)施例為根據(jù)當(dāng)前超幀模式F0和前一超幀模式F-1的轉(zhuǎn)移模式(F-1,F(xiàn)0)確定一組線譜對(duì)參數(shù)預(yù)測(cè)系數(shù)矩陣αn(F-1,F(xiàn)0),(n=0,1,…,5),它是一個(gè)10×10的矩陣。
上述方法步驟(9)的實(shí)施例為利用上述步驟(8)的實(shí)施例方法得到的預(yù)測(cè)系數(shù)矩陣αn(F-1,F(xiàn)0)和前一超幀中最后一幀量化后的去直流線譜對(duì)參數(shù)矢量計(jì)算預(yù)測(cè)值,并從上述步驟(7)的實(shí)施例得到的當(dāng)前超幀中每一個(gè)已去直流線譜對(duì)參數(shù)ln=[l1n,l2n,…,l10n](n=0,1,…,5)中減去相應(yīng)的預(yù)測(cè)值,得到當(dāng)前超幀的余量線譜對(duì)參數(shù) (n=0,1,…,5), 即(n=0,1,…,5) 上式中的T代表轉(zhuǎn)置。預(yù)測(cè)系數(shù)矩陣αn(F-1,F(xiàn)0)是用訓(xùn)練語音得到的。本實(shí)施例的具體做法是按轉(zhuǎn)移模式(F-1,F(xiàn)0)將訓(xùn)練語音分集,對(duì)每個(gè)集分別求αn(F-1,F(xiàn)0),使下式最小 式中E代表求平均。
將當(dāng)前超幀中6個(gè)幀去除直流分量和預(yù)測(cè)值后的余量線譜對(duì)參數(shù)組成一個(gè)60維的矢量如下式所示, 令R1=R,i=1。
上述方法步驟(10)的實(shí)施例的具體做法為從當(dāng)前級(jí)碼本Ci中搜索與待量化矢量Ri最近的碼矢,設(shè)為

即若當(dāng)前級(jí)為多級(jí)矢量量化最后一級(jí),跳至步驟(14)。
上述方法步驟(11)的實(shí)施例的具體做法為確定一組余量線譜對(duì)參數(shù)多級(jí)矢量量化時(shí)多級(jí)間的預(yù)測(cè)系數(shù)αn(i,i+1),(n=1,...,60;i=1,..,M-1)。本實(shí)施例的具體做法是對(duì)多級(jí)量化的各級(jí)碼本與下一級(jí)待量化矢量分別求αn(i,i+1),使下式最小 上式中,Rij是第i級(jí)的待量化訓(xùn)練矢量集中的第j個(gè)矢量;

是訓(xùn)練集中第j個(gè)矢量在第i級(jí)碼本搜索時(shí)所得到的碼矢。
級(jí)間預(yù)測(cè)值Rip可以表示為, 上述方法步驟(12)的實(shí)施例的具體做法為從第i級(jí)待量化矢量中除去步驟(10)中碼本搜索得到的碼矢及步驟(11)中得到的預(yù)測(cè)值,從而得到第i+1級(jí)待量化矢量,如下 其中,Ri為多級(jí)矢量量化時(shí)第i級(jí)待量化矢量,令i=i+1。
上述方法步驟(13)的實(shí)施例的具體做法為跳至步驟(10),直至完成多級(jí)矢量量化最后一級(jí)。
上述方法步驟(14)的實(shí)施例的具體做法為將多級(jí)碼本搜索各級(jí)得到的碼矢及預(yù)測(cè)值相加,得到解碼端量化后的余量線譜對(duì)矢量,即 其中αn(M,M+1)=0,M為多級(jí)量化的級(jí)數(shù)。
上述方法步驟(15)的實(shí)施例的具體做法為將相應(yīng)的直流分量和預(yù)測(cè)值加到當(dāng)前超幀相應(yīng)的量化后的余量線譜對(duì)參數(shù)中,得到當(dāng)前超幀量化后的線譜對(duì)參數(shù),即 (n=0,1,…,5) 式中

是當(dāng)前超幀中第n幀量化后的線譜對(duì)參數(shù)矢量,

是步驟(14)中得到的當(dāng)前超幀中第n幀量化后解碼端得到的的余量線譜對(duì)參數(shù)矢量。
上述方法步驟(16)的實(shí)施例的具體做法為按照美國政府2400b/s多帶激勵(lì)的線性預(yù)測(cè)(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法將量化后的線譜對(duì)參數(shù)

轉(zhuǎn)換成聲道A參數(shù),即得到量化后的聲道A參數(shù)。
權(quán)利要求
1、帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)多級(jí)矢量量化方法,其特征在于,該方法依次按以下步驟實(shí)現(xiàn)
步驟(1)對(duì)輸入語音信號(hào)樣點(diǎn)按時(shí)間順序分幀,將連續(xù)的若干幀組成一個(gè)超幀;
步驟(2)對(duì)當(dāng)前超幀中的每一幀提取聲道A參數(shù);
步驟(3)將當(dāng)前超幀中的每一幀聲道A參數(shù)轉(zhuǎn)換成線譜對(duì)參數(shù);
步驟(4)對(duì)當(dāng)前超幀中的每一幀提取清濁音參數(shù);
步驟(5)對(duì)當(dāng)前超幀的清濁音參數(shù)進(jìn)行矢量量化,得到當(dāng)前超幀量化后的清濁音參數(shù)量化值;
步驟(6)根據(jù)當(dāng)前超幀清濁音參數(shù)量化值確定當(dāng)前超幀模式;
步驟(7)根據(jù)當(dāng)前超幀的模式確定當(dāng)前超幀中每一個(gè)線譜對(duì)參數(shù)的直流分量,并從每一個(gè)線譜對(duì)參數(shù)中減去相應(yīng)的直流分量;
步驟(8)根據(jù)當(dāng)前超幀模式和前一個(gè)超幀的模式確定一組線譜對(duì)參數(shù)預(yù)測(cè)系數(shù);
步驟(9)利用這一組預(yù)測(cè)系數(shù)和前一超幀中最后一幀量化后的余量線譜對(duì)參數(shù)計(jì)算預(yù)測(cè)值;從當(dāng)前超幀中每一個(gè)已去直流線譜對(duì)參數(shù)中減去相應(yīng)的預(yù)測(cè)值,得到當(dāng)前超幀的余量線譜對(duì)參數(shù)R;同時(shí),設(shè)定變量R1=R,設(shè)定變量i,令i=1;
步驟(10)對(duì)Ri進(jìn)行矢量量化,在當(dāng)前第i級(jí)碼本中搜索與待量化矢量最近的碼矢
若當(dāng)前級(jí)為最后一級(jí),跳至步驟(14);
步驟(11)根據(jù)多級(jí)矢量量化級(jí)數(shù)及當(dāng)前級(jí)數(shù)確定一組級(jí)間預(yù)測(cè)系數(shù)αn(i,i+1),利用這一組預(yù)測(cè)系數(shù)和當(dāng)前第i級(jí)已定碼矢得到級(jí)間預(yù)測(cè)值Rip,其中,
步驟(12)從第i級(jí)待量化線譜對(duì)參數(shù)Ri中減去步驟(10)中搜索所得到的碼矢
及步驟(11)得到的預(yù)測(cè)值Rip,得到第i+1級(jí)待量化的矢量參數(shù)Ri+1;
步驟(13)令i=i+1,重復(fù)(10),(11),(12)的步驟,直至完成多級(jí)矢量量化最后一級(jí);
步驟(14)將多級(jí)矢量量化各級(jí)的選定碼矢及級(jí)間預(yù)測(cè)值相加求和,得到量化后的余量線譜對(duì)參數(shù);
步驟(15)將上述步驟(7)得到的直流分量和上述步驟(9)得到的預(yù)測(cè)值加到步驟(14)量化后的余量線譜對(duì)參數(shù)中得到量化后的線譜對(duì)參數(shù);
步驟(16)將當(dāng)前超幀量化后的線譜對(duì)參數(shù)轉(zhuǎn)換成聲道A參數(shù),得到量化后的聲道A參數(shù)。
2、按權(quán)利要求1所述的方法,其特征在于,所述步驟(1)中每一個(gè)超幀包含6個(gè)子幀,每一個(gè)子幀包含160個(gè)語音樣點(diǎn)。
3、按權(quán)利要求1所述的方法,其特征在于,每一個(gè)超幀中包含的子幀數(shù)以及每一個(gè)子幀中包含的語音樣點(diǎn)數(shù)是設(shè)定的。
4、按權(quán)利要求1所述的方法,其特征在于,步驟(11)中的級(jí)間預(yù)測(cè)系數(shù)按均方誤差最小的原則用訓(xùn)練語音樣本提前統(tǒng)計(jì)得到。
全文摘要
帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)多級(jí)矢量量化方法涉及超幀聲道參數(shù)矢量量化方法,屬于低速率語音壓縮編碼技術(shù)領(lǐng)域,其特征在于,該方法對(duì)已有的基于模式的去直流去幀間預(yù)測(cè)的多級(jí)矢量量化方案進(jìn)行改進(jìn),多級(jí)矢量量化過程中,利用上一級(jí)碼本的選定碼矢對(duì)殘差矢量進(jìn)行預(yù)測(cè),得到預(yù)測(cè)值,下一級(jí)矢量量化的待量化值由上一級(jí)矢量量化的待量化值減去上一級(jí)的選定碼矢及預(yù)測(cè)值后得到。測(cè)試結(jié)果表明,這種帶有多級(jí)碼本級(jí)間預(yù)測(cè)的算法與無級(jí)間預(yù)測(cè)的算法相比能夠有效提高聲道參數(shù)的量化精度,使合成語音具有更高的可懂性。該方法適合300b/s-2400b/s低速率參數(shù)語音編碼。
文檔編號(hào)G10L19/00GK101295507SQ200810105138
公開日2008年10月29日 申請(qǐng)日期2008年4月25日 優(yōu)先權(quán)日2008年4月25日
發(fā)明者崔慧娟, 昆 唐, 曄 李, 坦 彭, 明 許 申請(qǐng)人:清華大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
晴隆县| 车险| 嘉荫县| 南澳县| 台东县| 东乌珠穆沁旗| 内丘县| 襄城县| 依安县| 安国市| 英德市| 东乡| 桂东县| 镇沅| 湘西| 泰顺县| 商水县| 长阳| 文山县| 综艺| 南平市| 华坪县| 襄樊市| 马鞍山市| 惠东县| 汾西县| 屏东市| 宜丰县| 历史| 寿宁县| 宜都市| 益阳市| 新营市| 永嘉县| 漠河县| 昌吉市| 永仁县| 武宣县| 板桥市| 城口县| 嘉祥县|