帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)多級(jí)矢量量化方法

文檔序號(hào)：2830881閱讀：270來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)多級(jí)矢量量化方法
技術(shù)領(lǐng)域：
帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)多級(jí)矢量量化方法屬于語音編碼技術(shù)領(lǐng)域，特別涉及多幀聯(lián)合處理低碼率參數(shù)語音編碼技術(shù)。

背景技術(shù)：
語音編碼在通信系統(tǒng)、語音存儲(chǔ)回放系統(tǒng)、具有語音功能的消費(fèi)類產(chǎn)品中有廣泛的應(yīng)用。近些年來國際電信聯(lián)盟(ITU)、一些區(qū)域組織和一些國家相繼制定了一系列語音壓縮編碼標(biāo)準(zhǔn)，在編碼速率為1.2kb/s到16kb/s上得到了令人滿意的語音質(zhì)量。目前國內(nèi)外的研究主要集中在1.2kb/s以下速率高質(zhì)量語音壓縮編碼上，主要用于無線通信、保密通信、大容量語音存儲(chǔ)回放等。由于編碼速率太低，必須采用多幀聯(lián)合(即超幀)處理的參數(shù)語音編碼技術(shù)，其中最關(guān)鍵的是如何對(duì)聲道參數(shù)進(jìn)行量化，因?yàn)槁暤绤?shù)量化所需要的比特?cái)?shù)最高，對(duì)它量化的質(zhì)量將決定語音可懂度。
直接對(duì)聲道A參數(shù)量化效果不好，因此需要將聲道A參數(shù)轉(zhuǎn)成線譜對(duì)參數(shù)，然后再進(jìn)行量化。如圖1所示，該方法包括以下步驟步驟(1)對(duì)輸入語音信號(hào)樣點(diǎn)按時(shí)間順序分幀，將連續(xù)的若干幀組成一個(gè)超幀；步驟(2)對(duì)當(dāng)前超幀中的每一幀提取聲道A參數(shù)；步驟(3)將當(dāng)前超幀中的每一幀聲道A參數(shù)轉(zhuǎn)換成線譜對(duì)參數(shù)；步驟(4)對(duì)當(dāng)前超幀中的每一幀提取清濁音參數(shù)；步驟(5)對(duì)當(dāng)前超幀的清濁音參數(shù)進(jìn)行矢量量化，得到當(dāng)前超幀量化后的清濁音參數(shù)量化值；步驟(6)根據(jù)當(dāng)前超幀清濁音參數(shù)量化值確定當(dāng)前超幀模式；步驟(7)根據(jù)當(dāng)前超幀的模式確定當(dāng)前超幀中每一個(gè)線譜對(duì)參數(shù)的直流分量，并從每一個(gè)線譜對(duì)參數(shù)中減去相應(yīng)的直流分量；步驟(8)根據(jù)當(dāng)前超幀模式和前一個(gè)超幀的模式確定一組線譜對(duì)參數(shù)預(yù)測(cè)系數(shù)；步驟(9)利用這一組預(yù)測(cè)系數(shù)和前一超幀中最后一幀量化后的余量線譜對(duì)參數(shù)計(jì)算預(yù)測(cè)值；從當(dāng)前超幀中每一個(gè)已去直流線譜對(duì)參數(shù)中減去相應(yīng)的預(yù)測(cè)值，得到當(dāng)前超幀的余量線譜對(duì)參數(shù)；步驟(10)對(duì)當(dāng)前超幀的余量線譜對(duì)參數(shù)進(jìn)行多級(jí)矢量量化，得到當(dāng)前超幀量化后的余量線譜對(duì)參數(shù)；步驟(11)將上述步驟(7)得到的直流分量和上述步驟(9)得到的預(yù)測(cè)值加到量化后的余量線譜對(duì)參數(shù)中得到量化后的線譜對(duì)參數(shù)；步驟(12)將當(dāng)前超幀量化后的線譜對(duì)參數(shù)轉(zhuǎn)換成聲道A參數(shù)，得到量化后的聲道A參數(shù)。
上述已有技術(shù)對(duì)超幀線譜對(duì)參數(shù)采用矢量量化，在矢量量化之前對(duì)線譜對(duì)參數(shù)去除直流分量，并利用已處理過的上一超幀線譜對(duì)參數(shù)對(duì)當(dāng)前超幀的線譜對(duì)參數(shù)進(jìn)行預(yù)測(cè)，然后去除預(yù)測(cè)分量，再進(jìn)行多級(jí)矢量量化。但在多級(jí)矢量量化過程中，搜索上一級(jí)碼本所選定的碼矢和下一級(jí)待量化的殘差矢量之間的相關(guān)性卻沒有得到充分利用，因而量化質(zhì)量并不是最優(yōu)的。
如圖1所示，原有技術(shù)只去除了各幀之間的相關(guān)性，但在低速率參數(shù)語音編碼技術(shù)中，對(duì)各參數(shù)尤其是LSF的量化精度要求很高，僅去除幀間冗余信息，不足以達(dá)到較高的量化質(zhì)量。

發(fā)明內(nèi)容
本發(fā)明的目的是克服已有技術(shù)的不足之處，提出一種超幀聲道參數(shù)矢量量化的方法，能夠充分利用超幀之間、多級(jí)矢量量化中上一級(jí)碼本的選定碼矢和殘差矢量之間的相關(guān)性，預(yù)測(cè)效率及量化精度更高。
本發(fā)明提出的帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)量化方法，包括以下步驟步驟(1)對(duì)輸入語音信號(hào)樣點(diǎn)按時(shí)間順序分幀，將連續(xù)的若干幀組成一個(gè)超幀；步驟(2)對(duì)當(dāng)前超幀中的每一幀提取聲道A參數(shù)；步驟(3)將當(dāng)前超幀中的每一幀聲道A參數(shù)轉(zhuǎn)換成線譜對(duì)參數(shù)；步驟(4)對(duì)當(dāng)前超幀中的每一幀提取清濁音參數(shù)；步驟(5)對(duì)當(dāng)前超幀的清濁音參數(shù)進(jìn)行矢量量化，得到當(dāng)前超幀量化后的清濁音參數(shù)量化值；步驟(6)根據(jù)當(dāng)前超幀清濁音參數(shù)量化值確定當(dāng)前超幀模式；步驟(7)根據(jù)當(dāng)前超幀的模式確定當(dāng)前超幀中每一個(gè)線譜對(duì)參數(shù)的直流分量，并從每一個(gè)線譜對(duì)參數(shù)中減去相應(yīng)的直流分量；步驟(8)根據(jù)當(dāng)前超幀模式和前一個(gè)超幀的模式確定一組線譜對(duì)參數(shù)預(yù)測(cè)系數(shù)；步驟(9)利用這一組預(yù)測(cè)系數(shù)和前一超幀中最后一幀量化后的余量線譜對(duì)參數(shù)計(jì)算預(yù)測(cè)值；從當(dāng)前超幀中每一個(gè)已去直流線譜對(duì)參數(shù)中減去相應(yīng)的預(yù)測(cè)值，得到當(dāng)前超幀的余量線譜對(duì)參數(shù)R；同時(shí)，設(shè)定變量R1＝R，設(shè)定變量i，令i＝1；步驟(10)對(duì)Ri進(jìn)行矢量量化，在當(dāng)前第i級(jí)碼本中搜索與待量化矢量最近的碼矢

若當(dāng)前級(jí)為最后一級(jí)，跳至步驟(14)；步驟(11)根據(jù)多級(jí)矢量量化級(jí)數(shù)及當(dāng)前級(jí)數(shù)確定一組級(jí)間預(yù)測(cè)系數(shù)αn(i，i+1)，利用這一組預(yù)測(cè)系數(shù)和當(dāng)前第i級(jí)已定碼矢得到級(jí)間預(yù)測(cè)值Rip，其中，步驟(12)從第i級(jí)待量化線譜對(duì)參數(shù)Ri中減去步驟(10)中搜索所得到的碼矢

及步驟(11)得到的預(yù)測(cè)值Rip，得到第i+1級(jí)待量化的矢量參數(shù)Ri+1；步驟(13)令i＝i+1，重復(fù)(10)，(11)，(12)的步驟，直至完成多級(jí)矢量量化最后一級(jí)；步驟(14)將多級(jí)矢量量化各級(jí)的選定碼矢及級(jí)間預(yù)測(cè)值相加求和，得到量化后的余量線譜對(duì)參數(shù)；步驟(15)將上述步驟(7)得到的直流分量和上述步驟(9)得到的預(yù)測(cè)值加到步驟(14)量化后的余量線譜對(duì)參數(shù)中得到量化后的線譜對(duì)參數(shù)；步驟(16)將當(dāng)前超幀量化后的線譜對(duì)參數(shù)轉(zhuǎn)換成聲道A參數(shù)，得到量化后的聲道A參數(shù)。
本發(fā)明的特點(diǎn)是在對(duì)線譜對(duì)參數(shù)的多級(jí)矢量量化過程中，不僅采用了幀間預(yù)測(cè)，在多級(jí)矢量量化過程中也采用了級(jí)間預(yù)測(cè)。目前的語音參數(shù)編碼模型中，只考慮了超幀幀間的相關(guān)性，并利用了此相關(guān)性得到余量線譜對(duì)參數(shù)，從而降低了量化的計(jì)算量和存儲(chǔ)量，并達(dá)到了較高的量化精度。本發(fā)明經(jīng)過對(duì)大量語音樣本統(tǒng)計(jì)，發(fā)現(xiàn)多級(jí)矢量量化中上一級(jí)碼本搜索過程中所選定的碼矢和下一級(jí)待量化殘差矢量之間也存在一定的相關(guān)性，利用這種相關(guān)性可以提高低碼率語音編碼的性能。本發(fā)明利用余量線譜對(duì)參數(shù)多級(jí)矢量量化中，各級(jí)之間的相關(guān)性，進(jìn)一步去除冗余信息，得到新的待量化參數(shù)，可以更好地完成余量線譜對(duì)的多級(jí)矢量量化。這種方法利用多級(jí)矢量量化中上一級(jí)碼本搜索過程中選定碼矢和殘差矢量之間的相關(guān)性，使得對(duì)聲道參數(shù)量化的精度得到了提高，進(jìn)而提高了低碼率語音編碼的質(zhì)量。
本方法可以提高聲道參數(shù)的量化精度，使合成語音具有更高的可懂性。該方法最適合300～2400b/s低速率參數(shù)語音編碼。

圖1為已有技術(shù)的超幀聲道參數(shù)量化方法流程框圖。
圖2為本發(fā)明提出的超幀聲道參數(shù)量化方法流程框圖。

具體實(shí)施例方式 本發(fā)明提出的超幀聲道參數(shù)矢量量化方法結(jié)合附圖及實(shí)施例進(jìn)一步說明如下本發(fā)明的方法流程如圖2所示，包括以下步驟步驟(1)對(duì)輸入語音信號(hào)樣點(diǎn)按時(shí)間順序分幀，將連續(xù)的若干幀組成一個(gè)超幀；步驟(2)對(duì)當(dāng)前超幀中的每一幀提取聲道A參數(shù)；步驟(3)將當(dāng)前超幀中的每一幀聲道A參數(shù)轉(zhuǎn)換成線譜對(duì)參數(shù)；步驟(4)對(duì)當(dāng)前超幀中的每一幀提取清濁音參數(shù)；步驟(5)對(duì)當(dāng)前超幀的清濁音參數(shù)進(jìn)行矢量量化，得到當(dāng)前超幀量化后的清濁音參數(shù)量化值；步驟(6)根據(jù)當(dāng)前超幀清濁音參數(shù)量化值確定當(dāng)前超幀模式；步驟(7)根據(jù)當(dāng)前超幀的模式確定當(dāng)前超幀中每一個(gè)線譜對(duì)參數(shù)的直流分量，并從每一個(gè)線譜對(duì)參數(shù)中減去相應(yīng)的直流分量；步驟(8)根據(jù)當(dāng)前超幀模式和前一個(gè)超幀的模式確定一組線譜對(duì)參數(shù)預(yù)測(cè)系數(shù)；步驟(9)利用這一組預(yù)測(cè)系數(shù)和前一超幀中最后一幀量化后的余量線譜對(duì)參數(shù)計(jì)算預(yù)測(cè)值；從當(dāng)前超幀中每一個(gè)已去直流線譜對(duì)參數(shù)中減去相應(yīng)的預(yù)測(cè)值，得到當(dāng)前超幀的余量線譜對(duì)參數(shù)R；同時(shí)，設(shè)定變量R1＝R，設(shè)定變量i，令i＝1；步驟(10)對(duì)Ri進(jìn)行矢量量化，在當(dāng)前第i級(jí)碼本中搜索與待量化矢量最近的碼矢

若當(dāng)前級(jí)為最后一級(jí)，跳至步驟(14)；步驟(11)根據(jù)多級(jí)矢量量化級(jí)數(shù)及當(dāng)前級(jí)數(shù)確定一組級(jí)間預(yù)測(cè)系數(shù)αn(i，i+1)，利用這一組預(yù)測(cè)系數(shù)和當(dāng)前第i級(jí)已定碼矢得到級(jí)間預(yù)測(cè)值Rip，其中，步驟(12)從第i級(jí)待量化線譜對(duì)參數(shù)Ri中減去步驟(10)中搜索所得到的碼矢

及步驟(11)得到的預(yù)測(cè)值Rip，得到第i+1級(jí)待量化的矢量參數(shù)Ri+1；步驟(13)令i＝i+1，重復(fù)(10)，(11)，(12)的步驟，直至完成多級(jí)矢量量化最后一級(jí)；步驟(14)將多級(jí)矢量量化各級(jí)的選定碼矢及級(jí)間預(yù)測(cè)值相加求和，得到量化后的余量線譜對(duì)參數(shù)；步驟(15)將上述步驟(7)得到的直流分量和上述步驟(9)得到的預(yù)測(cè)值加到步驟(14)量化后的余量線譜對(duì)參數(shù)中得到量化后的線譜對(duì)參數(shù)；步驟(16)將當(dāng)前超幀量化后的線譜對(duì)參數(shù)轉(zhuǎn)換成聲道A參數(shù)，得到量化后的聲道A參數(shù)。
本發(fā)明上述方法各步驟的具體實(shí)施例分別詳細(xì)說明如下上述方法步驟(1)對(duì)輸入語音信號(hào)樣點(diǎn)按時(shí)間順序分幀，將連續(xù)的若干幀組成一個(gè)超幀的實(shí)施例是按8khz頻率采樣、已經(jīng)過高通濾波去除工頻干擾的語音樣點(diǎn)。每20ms，也就是160個(gè)語音樣點(diǎn)構(gòu)成一幀，連續(xù)6幀組成一個(gè)超幀(根據(jù)編碼速率選擇一個(gè)超幀所晗幀的數(shù)目，例如編碼速率為1200b/s可以選3幀，600b/s選6幀等)。
上述方法步驟(2)的實(shí)施例為按美國政府2400b/s多帶激勵(lì)的線性預(yù)測(cè)(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法對(duì)當(dāng)前超幀中的每一幀都提取10階聲道A參數(shù)an＝[a1n，a2n，…，a10n](n＝0，1，…，5)。
上述方法步驟(3)的實(shí)施例為按美國政府2400b/s多帶激勵(lì)的線性預(yù)測(cè)(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法將當(dāng)前超幀中的每一幀聲道A參數(shù)轉(zhuǎn)換成線譜對(duì)參數(shù)fn＝[f1n，f2n，…，f10n]，(n＝0，1，…，5)。
上述方法步驟(4)的實(shí)施例為按美國政府2400b/s多帶激勵(lì)的線性預(yù)測(cè)(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法對(duì)當(dāng)前超幀中的每一幀都提取5個(gè)子帶的清濁音參數(shù)，子帶為清音用“0”表示，子帶為濁音用“1”表示。這樣一個(gè)超幀中6個(gè)幀總共有30個(gè)子帶清濁音參數(shù)，構(gòu)成一個(gè)30維的矢量，每一維的值為“0”或“1”，記做F 上述方法步驟(5)中的實(shí)施例為對(duì)上述清濁音矢量F用4比特矢量量化，總共有16種超幀清濁音矢量量化值，每一個(gè)矢量量化值對(duì)應(yīng)一種超幀模式；本實(shí)施例的矢量量化值碼表由表1給出，對(duì)應(yīng)的超幀模式也在表1中給出。量化失真測(cè)度采用加權(quán)歐氏距離準(zhǔn)則，即使下式所示的失真D最小 D＝(F-F(i))·W·(F-F(i))T 其中F(i)(i＝0，1，…，15)是矢量量化碼本中的一個(gè)碼字，加權(quán)矩陣W是一個(gè)對(duì)角矩陣，其值用來表示各子帶重要性的不同。通常低帶最重要，隨著頻帶的升高重要性依次降低，對(duì)每幀的5個(gè)子帶分配不同的權(quán)重，在本實(shí)施例中，5個(gè)子帶權(quán)重的比例為16∶8∶4∶2∶1，反映了低頻子帶比高頻子帶更重要，從而加權(quán)矩陣W如下所示
每個(gè)碼字都代表了超幀的一種模式，也就是說，通過超幀清濁判決參數(shù)的量化，可以確定超幀的模式。清濁音矢量量化碼字是通過對(duì)訓(xùn)練語音樣本統(tǒng)計(jì)得到的出現(xiàn)次數(shù)最多的16種超幀清濁音矢量。
上述方法步驟(6)的實(shí)施例為通過步驟(5)的實(shí)施例中對(duì)清濁音矢量F量化的結(jié)果，利用表1確定當(dāng)前超幀的模式，記作F0，下標(biāo)“0”表示當(dāng)前超幀。
表1超幀清濁音矢量量化碼表和對(duì)應(yīng)的超幀模式上述方法步驟(7)的實(shí)施例為使用上述步驟(5)的實(shí)施例方法得到的當(dāng)前超幀模式F0確定各幀線譜對(duì)參數(shù)的直流分量矢量n＝(0，1，…，5)，并從對(duì)應(yīng)的線譜對(duì)參數(shù)中減去直流分量，得到去直流分量后的線譜對(duì)參數(shù)ln＝[l1n，l2n，…，l10n](n＝0，1，…，5) ln＝fn-dn(F0)，(n＝0，1，…，5) 直流分量n＝(0，1，…，5)是用訓(xùn)練語音得到的。本實(shí)施例的具體做法是將訓(xùn)練語音按超幀模式分成16個(gè)子集，對(duì)每個(gè)子集的線譜對(duì)參數(shù)分別求平均值即得到線譜對(duì)參數(shù)直流分量。
上述方法步驟(8)的實(shí)施例為根據(jù)當(dāng)前超幀模式F0和前一超幀模式F-1的轉(zhuǎn)移模式(F-1，F(xiàn)0)確定一組線譜對(duì)參數(shù)預(yù)測(cè)系數(shù)矩陣αn(F-1，F(xiàn)0)，(n＝0，1，…，5)，它是一個(gè)10×10的矩陣。
上述方法步驟(9)的實(shí)施例為利用上述步驟(8)的實(shí)施例方法得到的預(yù)測(cè)系數(shù)矩陣αn(F-1，F(xiàn)0)和前一超幀中最后一幀量化后的去直流線譜對(duì)參數(shù)矢量計(jì)算預(yù)測(cè)值，并從上述步驟(7)的實(shí)施例得到的當(dāng)前超幀中每一個(gè)已去直流線譜對(duì)參數(shù)ln＝[l1n，l2n，…，l10n](n＝0，1，…，5)中減去相應(yīng)的預(yù)測(cè)值，得到當(dāng)前超幀的余量線譜對(duì)參數(shù) (n＝0，1，…，5)，即(n＝0，1，…，5) 上式中的T代表轉(zhuǎn)置。預(yù)測(cè)系數(shù)矩陣αn(F-1，F(xiàn)0)是用訓(xùn)練語音得到的。本實(shí)施例的具體做法是按轉(zhuǎn)移模式(F-1，F(xiàn)0)將訓(xùn)練語音分集，對(duì)每個(gè)集分別求αn(F-1，F(xiàn)0)，使下式最小式中E代表求平均。
將當(dāng)前超幀中6個(gè)幀去除直流分量和預(yù)測(cè)值后的余量線譜對(duì)參數(shù)組成一個(gè)60維的矢量如下式所示，令R1＝R，i＝1。
上述方法步驟(10)的實(shí)施例的具體做法為從當(dāng)前級(jí)碼本Ci中搜索與待量化矢量Ri最近的碼矢，設(shè)為

即若當(dāng)前級(jí)為多級(jí)矢量量化最后一級(jí)，跳至步驟(14)。
上述方法步驟(11)的實(shí)施例的具體做法為確定一組余量線譜對(duì)參數(shù)多級(jí)矢量量化時(shí)多級(jí)間的預(yù)測(cè)系數(shù)αn(i，i+1)，(n＝1，...，60；i＝1，..，M-1)。本實(shí)施例的具體做法是對(duì)多級(jí)量化的各級(jí)碼本與下一級(jí)待量化矢量分別求αn(i，i+1)，使下式最小上式中，Rij是第i級(jí)的待量化訓(xùn)練矢量集中的第j個(gè)矢量；

是訓(xùn)練集中第j個(gè)矢量在第i級(jí)碼本搜索時(shí)所得到的碼矢。
級(jí)間預(yù)測(cè)值Rip可以表示為，上述方法步驟(12)的實(shí)施例的具體做法為從第i級(jí)待量化矢量中除去步驟(10)中碼本搜索得到的碼矢及步驟(11)中得到的預(yù)測(cè)值，從而得到第i+1級(jí)待量化矢量，如下其中，Ri為多級(jí)矢量量化時(shí)第i級(jí)待量化矢量，令i＝i+1。
上述方法步驟(13)的實(shí)施例的具體做法為跳至步驟(10)，直至完成多級(jí)矢量量化最后一級(jí)。
上述方法步驟(14)的實(shí)施例的具體做法為將多級(jí)碼本搜索各級(jí)得到的碼矢及預(yù)測(cè)值相加，得到解碼端量化后的余量線譜對(duì)矢量，即其中αn(M，M+1)＝0，M為多級(jí)量化的級(jí)數(shù)。
上述方法步驟(15)的實(shí)施例的具體做法為將相應(yīng)的直流分量和預(yù)測(cè)值加到當(dāng)前超幀相應(yīng)的量化后的余量線譜對(duì)參數(shù)中，得到當(dāng)前超幀量化后的線譜對(duì)參數(shù)，即 (n＝0，1，…，5) 式中

是當(dāng)前超幀中第n幀量化后的線譜對(duì)參數(shù)矢量，

是步驟(14)中得到的當(dāng)前超幀中第n幀量化后解碼端得到的的余量線譜對(duì)參數(shù)矢量。
上述方法步驟(16)的實(shí)施例的具體做法為按照美國政府2400b/s多帶激勵(lì)的線性預(yù)測(cè)(MELP)語音編碼算法標(biāo)準(zhǔn)所描述的方法將量化后的線譜對(duì)參數(shù)

轉(zhuǎn)換成聲道A參數(shù)，即得到量化后的聲道A參數(shù)。
權(quán)利要求
1、帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)多級(jí)矢量量化方法，其特征在于，該方法依次按以下步驟實(shí)現(xiàn)
步驟(1)對(duì)輸入語音信號(hào)樣點(diǎn)按時(shí)間順序分幀，將連續(xù)的若干幀組成一個(gè)超幀；
步驟(2)對(duì)當(dāng)前超幀中的每一幀提取聲道A參數(shù)；
步驟(3)將當(dāng)前超幀中的每一幀聲道A參數(shù)轉(zhuǎn)換成線譜對(duì)參數(shù)；
步驟(4)對(duì)當(dāng)前超幀中的每一幀提取清濁音參數(shù)；
步驟(5)對(duì)當(dāng)前超幀的清濁音參數(shù)進(jìn)行矢量量化，得到當(dāng)前超幀量化后的清濁音參數(shù)量化值；
步驟(6)根據(jù)當(dāng)前超幀清濁音參數(shù)量化值確定當(dāng)前超幀模式；
步驟(7)根據(jù)當(dāng)前超幀的模式確定當(dāng)前超幀中每一個(gè)線譜對(duì)參數(shù)的直流分量，并從每一個(gè)線譜對(duì)參數(shù)中減去相應(yīng)的直流分量；
步驟(8)根據(jù)當(dāng)前超幀模式和前一個(gè)超幀的模式確定一組線譜對(duì)參數(shù)預(yù)測(cè)系數(shù)；
步驟(9)利用這一組預(yù)測(cè)系數(shù)和前一超幀中最后一幀量化后的余量線譜對(duì)參數(shù)計(jì)算預(yù)測(cè)值；從當(dāng)前超幀中每一個(gè)已去直流線譜對(duì)參數(shù)中減去相應(yīng)的預(yù)測(cè)值，得到當(dāng)前超幀的余量線譜對(duì)參數(shù)R；同時(shí)，設(shè)定變量R1＝R，設(shè)定變量i，令i＝1；
步驟(10)對(duì)Ri進(jìn)行矢量量化，在當(dāng)前第i級(jí)碼本中搜索與待量化矢量最近的碼矢
若當(dāng)前級(jí)為最后一級(jí)，跳至步驟(14)；
步驟(11)根據(jù)多級(jí)矢量量化級(jí)數(shù)及當(dāng)前級(jí)數(shù)確定一組級(jí)間預(yù)測(cè)系數(shù)αn(i，i+1)，利用這一組預(yù)測(cè)系數(shù)和當(dāng)前第i級(jí)已定碼矢得到級(jí)間預(yù)測(cè)值Rip，其中，
步驟(12)從第i級(jí)待量化線譜對(duì)參數(shù)Ri中減去步驟(10)中搜索所得到的碼矢
及步驟(11)得到的預(yù)測(cè)值Rip，得到第i+1級(jí)待量化的矢量參數(shù)Ri+1；
步驟(13)令i＝i+1，重復(fù)(10)，(11)，(12)的步驟，直至完成多級(jí)矢量量化最后一級(jí)；
步驟(14)將多級(jí)矢量量化各級(jí)的選定碼矢及級(jí)間預(yù)測(cè)值相加求和，得到量化后的余量線譜對(duì)參數(shù)；
步驟(15)將上述步驟(7)得到的直流分量和上述步驟(9)得到的預(yù)測(cè)值加到步驟(14)量化后的余量線譜對(duì)參數(shù)中得到量化后的線譜對(duì)參數(shù)；
步驟(16)將當(dāng)前超幀量化后的線譜對(duì)參數(shù)轉(zhuǎn)換成聲道A參數(shù)，得到量化后的聲道A參數(shù)。
2、按權(quán)利要求1所述的方法，其特征在于，所述步驟(1)中每一個(gè)超幀包含6個(gè)子幀，每一個(gè)子幀包含160個(gè)語音樣點(diǎn)。
3、按權(quán)利要求1所述的方法，其特征在于，每一個(gè)超幀中包含的子幀數(shù)以及每一個(gè)子幀中包含的語音樣點(diǎn)數(shù)是設(shè)定的。
4、按權(quán)利要求1所述的方法，其特征在于，步驟(11)中的級(jí)間預(yù)測(cè)系數(shù)按均方誤差最小的原則用訓(xùn)練語音樣本提前統(tǒng)計(jì)得到。
全文摘要
帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)多級(jí)矢量量化方法涉及超幀聲道參數(shù)矢量量化方法，屬于低速率語音壓縮編碼技術(shù)領(lǐng)域，其特征在于，該方法對(duì)已有的基于模式的去直流去幀間預(yù)測(cè)的多級(jí)矢量量化方案進(jìn)行改進(jìn)，多級(jí)矢量量化過程中，利用上一級(jí)碼本的選定碼矢對(duì)殘差矢量進(jìn)行預(yù)測(cè)，得到預(yù)測(cè)值，下一級(jí)矢量量化的待量化值由上一級(jí)矢量量化的待量化值減去上一級(jí)的選定碼矢及預(yù)測(cè)值后得到。測(cè)試結(jié)果表明，這種帶有多級(jí)碼本級(jí)間預(yù)測(cè)的算法與無級(jí)間預(yù)測(cè)的算法相比能夠有效提高聲道參數(shù)的量化精度，使合成語音具有更高的可懂性。該方法適合300b/s-2400b/s低速率參數(shù)語音編碼。
文檔編號(hào)G10L19/00GK101295507SQ200810105138
公開日2008年10月29日申請(qǐng)日期2008年4月25日優(yōu)先權(quán)日2008年4月25日
發(fā)明者崔慧娟, 昆唐, 曄李, 坦彭, 明許申請(qǐng)人:清華大學(xué)

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：崔慧娟;唐昆;李曄;彭坦;許明
技術(shù)所有人：清華大學(xué)
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

矢量控制電流環(huán)pi參數(shù)相關(guān)技術(shù)

多級(jí)離心泵參數(shù)相關(guān)技術(shù)

立式多級(jí)離心泵參數(shù)相關(guān)技術(shù)

臥式多級(jí)離心泵參數(shù)相關(guān)技術(shù)

多級(jí)壓縮機(jī)的設(shè)備參數(shù)相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

帶級(jí)間預(yù)測(cè)的超幀聲道參數(shù)多級(jí)矢量量化方法