欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

錐形矢量音頻編碼的制作方法

文檔序號(hào):2818928閱讀:278來源:國(guó)知局
專利名稱:錐形矢量音頻編碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及用于經(jīng)由傳輸介質(zhì)諸如借助于有線連接上的電子信號(hào)或者無線連接上的電磁信號(hào)進(jìn)行傳輸?shù)恼Z音的編碼。
背景技術(shù)
在圖Ia中示意性地示出了語音的聲源-濾波器模型。如所示,語音能夠被建模為包括從聲源102經(jīng)過時(shí)變?yōu)V波器104的信號(hào)。聲源信號(hào)表示聲帶的直接振動(dòng),而濾波器表示由咽喉、口部和舌頭的形狀形成的聲道的聲效。濾波器的作用是改變聲源信號(hào)的頻率分布從而增強(qiáng)或者削弱特定的頻率。語音編碼通過使用聲源-濾波器模式的參數(shù)表示語音來工作而不是試圖直接表示為實(shí)際的波形。如圖Ib中所示意性地示出的,編碼信號(hào)將被分成多個(gè)幀106,其中每個(gè)幀包括多個(gè)子幀108。例如,語音可以16kHz被采樣并且以20ms的幀被處理,其中一些處理以5ms 的子幀進(jìn)行(每幀有4個(gè)子幀)。每個(gè)幀包括標(biāo)記107,幀通過標(biāo)記107根據(jù)其各自的類型被分類。因此每個(gè)幀至少被分為“濁音的”或者“清音的”,并且清音幀不同于濁音幀地被編碼。因此每個(gè)子幀108包括一組表示在該子幀中的語音聲音的聲源-濾波器模型的參數(shù)。對(duì)于濁音聲音(諸如元音聲),聲源信號(hào)具有對(duì)應(yīng)于感知到的聲音的基音的一定程度的長(zhǎng)期周期性。在該情形中,聲源信號(hào)能夠被建模為包括準(zhǔn)周期性信號(hào),其中對(duì)應(yīng)于各自的“基音脈沖”的每個(gè)周期包括一系列不同幅度的波峰。聲源信號(hào)被稱為是“準(zhǔn)”周期性的,原因在于在至少一個(gè)子幀的時(shí)標(biāo)上,可能需要使其具有大致恒定的單個(gè)的、有針對(duì)性的(meaningful)周期;但是在多個(gè)子幀或幀上,信號(hào)的周期和形式則可改變。在任意給定點(diǎn)的大致周期可以被稱為基音滯后。在圖加中示意性地示出了被建模的聲源信號(hào)202的示例,其中逐漸變化的周期Ρ”Ρ2、Ρ3等各包括四個(gè)波峰的基音脈沖,基音脈沖從一個(gè)周期到下一個(gè)周期在形狀和幅度上逐漸變化。根據(jù)諸如使用線性預(yù)測(cè)編碼(LPC)的算法的多種語音編碼算法,使用短期濾波器來將語音信號(hào)分成兩個(gè)單獨(dú)的分量(i)表示時(shí)變?yōu)V波器104的作用的信號(hào);和(ii)去除了濾波器104的作用的剩余信號(hào),其表示聲源信號(hào)。表示濾波器104的作用的信號(hào)可以被稱為頻譜包絡(luò)線信號(hào)(spectral envelope signal),并且典型地包括一系列描述在各個(gè)階段的頻譜包絡(luò)線的LPC參數(shù)組。圖2b示出了隨時(shí)間變化的一連串頻譜包絡(luò)線204^204^ 2043等的示意性示例。如圖加示意性所示,當(dāng)去除了變化的頻譜包絡(luò)線時(shí),僅表示聲源的剩余信號(hào)可以被稱為L(zhǎng)PC殘差信號(hào)。短期濾波器通過去除短期相關(guān)性(即與基音周期相比的短期)而工作,從而產(chǎn)生具有比語音信號(hào)更少能量的LPC殘差。頻譜包絡(luò)線信號(hào)和聲源信號(hào)各自被單獨(dú)編碼以進(jìn)行傳輸。在圖示出的示例中,各個(gè)子幀106將包括(i)表示頻譜包絡(luò)線204的一組參數(shù);和(ii)表示去除了短期相關(guān)性的作用的聲源信號(hào)202的LPC殘差信號(hào)。為了改善聲源信號(hào)的編碼,可以利用其周期性。為此,使用長(zhǎng)期預(yù)測(cè)(LTP)分析來確定LPC殘差信號(hào)從一個(gè)周期到下一個(gè)周期與其自身的相關(guān)性,即在當(dāng)前基音滯后下當(dāng)前時(shí)間的LPC殘差信號(hào)與一個(gè)周期之后的LPC殘差信號(hào)之間的相關(guān)性(相關(guān)性是數(shù)據(jù)組之間的相關(guān)程度的統(tǒng)計(jì)測(cè)定結(jié)果,在該情形中是信號(hào)的部分之間的重復(fù)度)。就此而言,聲源信號(hào)可被稱為是“準(zhǔn)”周期性的,原因在于在至少一個(gè)相關(guān)性計(jì)算的時(shí)標(biāo)上,可能需要使其具有大致恒定的有針對(duì)性的周期;但是在多次的這種計(jì)算上,聲源信號(hào)的周期和形狀則可改變得更加明顯。對(duì)于每個(gè)子幀,從此相關(guān)性導(dǎo)出(derive)的一組參數(shù)被確定為至少部分地表示聲源信號(hào)。每個(gè)子幀的參數(shù)組典型地是一組系列參數(shù),該組系列系數(shù)形成各自的矢量。然后從LPC殘差中去除這個(gè)周期間相關(guān)性的作用,留下去除了基音周期之間的相關(guān)性的作用的表示聲源信號(hào)的LTP殘差信號(hào)。為了表示聲源信號(hào),LTP矢量和LTP殘差信號(hào)被單獨(dú)地編碼以進(jìn)行傳輸。LPC參數(shù)組、LTP矢量組和LTP殘差信號(hào)組在傳輸之前各自被量化(量化是將連續(xù)范圍的值轉(zhuǎn)換為一組離散值,或者將較大的大致連續(xù)的一組離散值轉(zhuǎn)換為較小的一組離散值的處理)。將LPC殘差信號(hào)分成LTP矢量和LTP殘差信號(hào)的優(yōu)點(diǎn)在于,LTP殘差典型地具有比LPC殘差小的能量,因此需要較少的比特來進(jìn)行量化。因此在圖示出的示例中,各個(gè)子幀106將包括(i) 一組量化的表示頻譜包絡(luò)線的 LPC參數(shù)(包括基音滯后);(ii) (a)與聲源信號(hào)中的基音周期之間的相關(guān)性有關(guān)的量化的 LTP矢量,和(ii) (b)去除了此周期間相關(guān)性的作用的表示聲源信號(hào)的量化的LTP殘差信號(hào)。 在傳輸之前,對(duì)量化值進(jìn)行編碼。錐形矢量編碼是為具有拉普拉斯概率分布的整數(shù)值提供有效編碼的無損枚舉編碼技術(shù),其中整數(shù)值的概率隨著其絕對(duì)值指數(shù)式地減小。錐形矢量編碼一般用于靜止圖像和活動(dòng)圖像的變換編碼和子帶編碼以及音頻轉(zhuǎn)換編碼。對(duì)于這些編碼方法,變換系數(shù)或者子帶系數(shù)大致地具有拉普拉斯概率分布,以使得錐形矢量編碼成為有效的方法。錐形矢量編碼作用于L個(gè)量化索引q(n)的塊,L個(gè)量化索引q(n)典型地由標(biāo)量、 點(diǎn)陣(lattice)或者格柵(trellis)量化變換系數(shù)生成。在錐形矢量編碼的一個(gè)實(shí)施方式中,第一步驟是將量化索引的塊轉(zhuǎn)換為符號(hào)值s (η)的塊和絕對(duì)值u(n)的塊。與非零量化索引相對(duì)應(yīng)的符號(hào)值是通過簡(jiǎn)單的二級(jí)熵編碼器進(jìn)行編碼的。將絕對(duì)值累加在一起以生成半徑K:
權(quán)利要求
1.一種對(duì)值的一個(gè)或者多個(gè)父塊進(jìn)行編碼的方法,值的數(shù)量是每個(gè)塊的長(zhǎng)度,所述方法包括對(duì)于每個(gè)父塊(a)確定所述父塊中的值的第一和;(b)將所述父塊拆分成更小的子塊;(c)對(duì)于所述子塊中的至少一個(gè),確定所述子塊中的值的第二和,基于所述父塊中的所述值的所述第一和從多個(gè)似然表中選擇似然表,并且使用所述似然表對(duì)所述第二和進(jìn)行編碼;(d)將每個(gè)子塊指定為父塊;(e)執(zhí)行步驟(a)、(b)、(c)和(d)直至至少一個(gè)父塊達(dá)到預(yù)定條件。
2.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法,其中,還基于所述父塊的長(zhǎng)度來選擇所述似然表。
3.根據(jù)權(quán)利要求1或2所述的方法,其中,在步驟(b)中所述子塊的大小相等。
4.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法,其中,對(duì)所述和進(jìn)行編碼的步驟包括熵編碼。
5.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法,其中,對(duì)所述和進(jìn)行編碼的步驟包括算術(shù)編碼。
6.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法,其用于對(duì)表示激勵(lì)量化索引的值進(jìn)行編碼以表示語音。
7.根據(jù)權(quán)利要求6所述的方法,包括將一組量化索引拆分成符號(hào)的塊和值的塊的步驟。
8.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法,其中,所述預(yù)定條件是所有子塊具有相同的長(zhǎng)度。
9.根據(jù)權(quán)利要求1至7中任一項(xiàng)所述的方法,其中,所述預(yù)定條件是第一子塊中的值的和等于零。
10.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法,其中,步驟(a)包括對(duì)于所述第一和使用已知值。
11.根據(jù)權(quán)利要求1至9中任一項(xiàng)所述的方法,其中,步驟(a)包括確定累加的值的和。
12.根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法,包括存儲(chǔ)步驟(b)的編碼結(jié)果的步驟和每個(gè)步驟(d),直至在對(duì)于塊的最終拆分和編碼步驟之后產(chǎn)生最終的結(jié)果。
13.一種根據(jù)聲源濾波器模型進(jìn)行語音編碼從而將語音建模為包括由時(shí)變?yōu)V波器濾波的聲源信號(hào)的方法,所述方法包括接收語音信號(hào);從所述語音信號(hào)中導(dǎo)出激勵(lì)量化索引的幀,每個(gè)索引由值表示并且所述幀包括多個(gè)塊;以及根據(jù)前述權(quán)利要求中任一項(xiàng)所述的方法對(duì)每個(gè)塊進(jìn)行編碼。
14.一種用于對(duì)值的父塊進(jìn)行編碼的編碼器,值的數(shù)量是塊的長(zhǎng)度,所述編碼器包括 用于將所述父塊拆分成更小的子塊的器件;用于對(duì)子塊中的值進(jìn)行累加以生成和的器件;保存似然表的存儲(chǔ)器,每個(gè)似然表為每個(gè)可能的值的和保存與所述和相關(guān)的概率;用于使用位于所述存儲(chǔ)器中的似然表對(duì)所述子塊中的值的和進(jìn)行編碼的器件;用于基于父子塊的和從似然表的所述存儲(chǔ)器中選擇似然表的器件,所述編碼器件設(shè)置為基于選擇出的似然表對(duì)從所述父塊中拆分出的子塊的和進(jìn)行編碼;以及用于保存所述編碼的結(jié)果的存儲(chǔ)器件。
15.根據(jù)權(quán)利要求12所述的編碼器,其中,所述編碼器件是算數(shù)編碼器。
16.根據(jù)權(quán)利要求14所述的編碼器,其中,所述編碼器件是熵編碼器。
17.一種用于根據(jù)聲源濾波器模型進(jìn)行語音編碼從而將語音建模為包括由時(shí)變?yōu)V波器濾波的聲源信號(hào)的系統(tǒng),所述系統(tǒng)包括用于接收語音信號(hào)的器件;用于從所述語音信號(hào)中導(dǎo)出激勵(lì)量化索引的幀的器件,每個(gè)索引由值表示并且所述幀包括多個(gè)塊;以及根據(jù)權(quán)利要求14、15或16所述的編碼器。
18.—種對(duì)表示值的一個(gè)或者多個(gè)父塊的比特流進(jìn)行解碼的方法,值的數(shù)量是每個(gè)塊的長(zhǎng)度,所述方法包括對(duì)于每個(gè)父塊(a)獲得所述父塊中的值的第一和;(b)將所述父塊拆分成更小的子塊;(c)對(duì)于所述子塊中的至少一個(gè),基于所述父塊中的所述值的所述第一和從多個(gè)存儲(chǔ)的似然表中選擇似然表,每個(gè)似然表為所述子塊中的每個(gè)可能的值的第二和保存與所述和相關(guān)的概率,并且基于所述似然表對(duì)所述比特率進(jìn)行解碼從而為所述子塊生成值的所述第二和;(d)將每個(gè)子塊指定為父塊;(e)執(zhí)行步驟(a)、(b)、(c)和(d)直至至少一個(gè)父塊達(dá)到預(yù)定條件。
19.根據(jù)權(quán)利要求18所述的方法,其中,在步驟(c)中基于子塊的長(zhǎng)度來選擇似然表。
20.一種當(dāng)執(zhí)行時(shí)實(shí)施如權(quán)利要求1至13中任一項(xiàng)所述的編碼方法的步驟或者如權(quán)利要求18或19所述的解碼方法的步驟的計(jì)算機(jī)程序產(chǎn)品。
21.一種用于對(duì)表示值的一個(gè)或者多個(gè)父塊的比特流進(jìn)行解碼的解碼器,所述解碼器包括用于獲得所述父塊中的值的第一和的器件;用于將父塊拆分成更小的子塊的器件;用于基于所述父塊中的所述值的所述第一和從多個(gè)存儲(chǔ)的似然表中選擇似然表的器件,每個(gè)似然表為所述子塊中的每個(gè)可能的值的第二和保存與所述和相關(guān)的概率;以及用于基于所述似然表對(duì)所述比特率進(jìn)行解碼從而為所述子塊生成值的所述第二和的器件。
22.一種用于根據(jù)聲源濾波器模型進(jìn)行語音解碼從而將語音建模為包括由時(shí)變?yōu)V波器濾波的聲源信號(hào)的系統(tǒng),所述系統(tǒng)包括用于接收經(jīng)編碼的語音信號(hào)的器件,所述經(jīng)編碼的語音信號(hào)包括激勵(lì)量化索引的幀, 每個(gè)索引由值表示并且所述幀包括多個(gè)塊;以及根據(jù)權(quán)利要求21所述的解碼器。
全文摘要
一種對(duì)值的一個(gè)或者多個(gè)父塊進(jìn)行編碼的系統(tǒng)和方法,值的數(shù)量是每個(gè)塊的長(zhǎng)度。所述方法包括對(duì)于每個(gè)父塊(a)確定所述父塊中的值的第一和;(b)將所述父塊拆分成更小的子塊;(c)對(duì)于所述子塊中的至少一個(gè),確定所述子塊中的值的第二和,基于所述父塊中的所述值的所述第一和從多個(gè)似然表中選擇似然表,并且使用所述似然表對(duì)所述第二和進(jìn)行編碼;(d)將每個(gè)子塊指定為父塊;(e)執(zhí)行步驟(a)、(b)、(c)和(d)直至至少一個(gè)所述父塊達(dá)到預(yù)定條件。
文檔編號(hào)G10L19/02GK102341849SQ201080010210
公開日2012年2月1日 申請(qǐng)日期2010年1月5日 優(yōu)先權(quán)日2009年1月6日
發(fā)明者科恩·貝爾納德·福斯 申請(qǐng)人:斯凱普有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
东源县| 达拉特旗| 密山市| 平顺县| 德化县| 鸡泽县| 高要市| 闵行区| 南漳县| 隆昌县| 谢通门县| 同仁县| 镇安县| 确山县| 芦溪县| 中西区| 九台市| 翁源县| 阿巴嘎旗| 柘城县| 平江县| 云霄县| 商河县| 林州市| 南雄市| 武隆县| 海南省| 宿州市| 巴林左旗| 定兴县| 咸阳市| 漳平市| 通州区| 黄山市| 台南县| 抚顺市| 乡宁县| 二手房| 鸡泽县| 嘉禾县| 陇南市|