數(shù)字信號的編碼和解碼的制作方法

文檔序號：2823206閱讀：660來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：數(shù)字信號的編碼和解碼的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及對數(shù)字信號及其數(shù)字樣本分塊(block)進(jìn)行編碼以通過分組交換網(wǎng)絡(luò)進(jìn)行傳輸。
因此，本發(fā)明還涉及對從分組交換網(wǎng)絡(luò)接收的數(shù)字信號及其數(shù)字樣本分塊進(jìn)行解碼。
背景技術(shù)：
和現(xiàn)有技術(shù)通過分組交換網(wǎng)絡(luò)如基于IP(Internet Protocol，網(wǎng)際協(xié)議)的網(wǎng)絡(luò)(主要是因特網(wǎng)或內(nèi)部網(wǎng))的電話由于很多特性而日益具有吸引力。這些特性包括諸如相對低的運(yùn)營成本、容易集成新業(yè)務(wù)以及一個網(wǎng)絡(luò)就可用于語音和數(shù)據(jù)。分組交換系統(tǒng)中的語音或音頻信號轉(zhuǎn)換為數(shù)字信號，即比特流，它分為多個具有適當(dāng)大小的部分，以通過分組交換網(wǎng)絡(luò)從發(fā)送器端傳輸?shù)浇邮掌鞫恕?br> 分組交換網(wǎng)絡(luò)最初設(shè)計為用于傳輸非實時數(shù)據(jù)，并且通過這種網(wǎng)絡(luò)傳輸語音將導(dǎo)致一些問題。因為數(shù)據(jù)分組會由于擁堵問題或傳輸錯誤而被網(wǎng)絡(luò)有意丟棄，所以它們在傳輸期間會發(fā)生丟失。在非實時應(yīng)用中，這不是問題，因為丟失的分組可以被重新傳輸。然而，重新傳輸對于實時應(yīng)用而言不是一個可能的解決方案。對于實時應(yīng)用，到達(dá)太遲的分組不能用來重構(gòu)相應(yīng)的信號，因為該信號已經(jīng)或應(yīng)該已經(jīng)被傳送到接收揚(yáng)聲器。因此，到達(dá)太遲的分組相當(dāng)于丟失的分組。
IP網(wǎng)絡(luò)的一個特性是，如果一個分組到達(dá)，則其內(nèi)容未被破壞。IP分組具有一個首標(biāo)，其中包括CRC(Cyclic Redundancy Check，循環(huán)冗余校驗)字段。CRC用來檢查分組內(nèi)容是否未被破壞。如果CRC表示一個錯誤，則丟棄該分組。換句話說，不存在比特錯誤，只有分組丟失。
丟失或延遲的數(shù)據(jù)分組所帶來的主要問題是給重構(gòu)的語音或音頻信號帶來失真。失真是由于這一事實而產(chǎn)生的不能重構(gòu)由丟失或延遲的數(shù)據(jù)分組傳達(dá)的信號段?，F(xiàn)今所使用的語音編碼器最初設(shè)計用于其信道不存在錯誤或信道具有比特錯誤特性的電路交換網(wǎng)絡(luò)。因此，這些語音編碼器的問題是它們不能很好地處理分組丟失。
鑒于上述內(nèi)容以及分組交換網(wǎng)絡(luò)的其他細(xì)節(jié)，所存在的問題就是如何在通過分組交換網(wǎng)絡(luò)的電話中提供與通過電路交換網(wǎng)絡(luò)的普通電話相同的質(zhì)量。為了解決這些問題，必須考慮分組交換網(wǎng)絡(luò)的特性。
為了克服實時傳輸期間的與丟失或延遲的數(shù)據(jù)分組相關(guān)聯(lián)的問題，為通過分組交換網(wǎng)絡(luò)的傳輸引入分集是適合的。分集是在時間上(如在移動電話的交織中)或通過一些物理實體(如當(dāng)使用多個接收天線時)對信息進(jìn)行擴(kuò)展來提高傳輸穩(wěn)健性(robustness)的方法。在分組傳輸中，最好通過找到某種方式來創(chuàng)建分組間的分集，在分組級別上引入分集。在分組交換網(wǎng)絡(luò)中創(chuàng)建分集的最簡單的方式是在兩個不同的分組中將相同的分組有效負(fù)荷傳輸兩次。采用這種方式，丟失或延遲的數(shù)據(jù)分組將不打擾有效負(fù)荷信息的傳輸，因為最可能適時地接收具有相同有效負(fù)荷的另一分組。顯然，分集系統(tǒng)中的信息傳輸與常規(guī)系統(tǒng)中的信息傳輸相比將需要更多的帶寬。
現(xiàn)有技術(shù)的很多分集方案或分集系統(tǒng)存在這樣的缺點(diǎn)聲音信號的傳輸在正常工作狀態(tài)下不受益于所傳輸?shù)娜哂嘈畔⑺璧念~外帶寬。因此，對于大部分時間，當(dāng)不存在分組丟失或延遲時，額外帶寬將只是用于傳輸開銷信息。
因為帶寬經(jīng)常是有限資源，所以如果所傳輸?shù)穆曇粜盘柲軌蛞阅撤N方式受益于分集系統(tǒng)所需的額外帶寬，將是理想的。最好，如果額外的帶寬能夠用來在接收端改善解碼聲音信號的質(zhì)量，將是理想的。
在“Design of Multiple Description Scalar Quantizers(多描述分級量化器的設(shè)計)”，V.A.Vaishampayan，IEEE Transactions on Information Theory(IEEE信息理論學(xué)報)，Vol.39，No.3，1993年5月中，公開在分集系統(tǒng)中對多描述的使用。編碼器通過兩個不同的信道發(fā)送相同源信號的兩個不同描述，并且解碼器根據(jù)從當(dāng)前工作的信道接收的信息重構(gòu)源信號。因此，如果只有一個信道工作，重構(gòu)信號的質(zhì)量將基于一個描述。如果兩個信道都工作，所再現(xiàn)的源信號將基于兩個描述，并且在接收端獲得更高的質(zhì)量。在該文章中，作者解決了索引分配問題，從而最大化分集系統(tǒng)中多個描述的好處。
在通過分組交換網(wǎng)絡(luò)傳輸數(shù)據(jù)的系統(tǒng)中，一個或多個首標(biāo)加到每個數(shù)據(jù)分組。這些首標(biāo)包含具有分組目的地、發(fā)送者地址、分組內(nèi)的數(shù)據(jù)大小信息的數(shù)據(jù)字段，以及其他與分組傳輸相關(guān)的數(shù)據(jù)字段。加到分組的首標(biāo)大小構(gòu)成必須加以考慮的開銷信息。為了保持?jǐn)?shù)據(jù)分組的分組組裝延遲小，數(shù)據(jù)分組的有效負(fù)荷具有有限大小。有效負(fù)荷是分組內(nèi)由應(yīng)用使用的信息。與包括開銷信息在內(nèi)的實際傳輸數(shù)據(jù)分組的大小相比，有效負(fù)荷的大小是一種考慮有效帶寬量時的重要尺度。傳輸若干相對小的數(shù)據(jù)分組的問題是首標(biāo)的大小與對應(yīng)用有用的信息的大小相比將是相當(dāng)大的。實際上，首標(biāo)的大小往往大于有用信息的大小。
為了減輕帶寬問題，最好通過對所要傳輸?shù)男畔⑦M(jìn)行適當(dāng)?shù)木幋a來減小比特速率。一個經(jīng)常使用的方案是使用數(shù)據(jù)預(yù)測來對信息數(shù)據(jù)進(jìn)行編碼。這些預(yù)測是根據(jù)相同信息信號的前面信息數(shù)據(jù)來生成的。然而，由于在傳輸期間分組會丟失這一現(xiàn)象，插入不同分組之間的依賴性不是一個好主意。如果分組丟失并且后面信息段的重構(gòu)依賴于包含在丟失分組中的信息，則后面信息段的重構(gòu)將出現(xiàn)問題。避免這種誤差傳播是重要的。因此這種使用預(yù)測來減小語音或音頻信號的比特速率的普通方法對于這種傳輸信道而言是無效的，因為這種預(yù)測將導(dǎo)致誤差傳播。因此，存在一個問題是，當(dāng)傳輸具有語音或音頻信號信息的數(shù)據(jù)分組時，如何在分組交換系統(tǒng)中提供預(yù)測。
使用預(yù)測是一種用于改善編碼效率即減小比特速率的常用語音編碼方法。一個例子是在“Digital Coding of WaveformsPrinciples and Applications toSpeech and Video(數(shù)字波形編碼語音和視頻的原理和應(yīng)用)”，N.S.Jayant和P.Noll，Prentice Hall，ISBN 0-13-211913-701，1984。信號樣本預(yù)測由預(yù)測器根據(jù)前面量化信號樣本進(jìn)行計算，即預(yù)測是后向適應(yīng)的。然后從所要預(yù)測的原始樣本中減去算出的預(yù)測樣本。相減結(jié)果就是使用預(yù)測器預(yù)測信號樣本時所獲得的誤差。然后將該所得到的預(yù)測誤差進(jìn)行量化并傳輸?shù)浇邮斩恕Ｔ诮邮掌?，將預(yù)測誤差加到從發(fā)送端的預(yù)測器所對應(yīng)的一個預(yù)測器重新生成的預(yù)測信號。接收預(yù)測誤差與算出的預(yù)測值之和將允許在接收器端重構(gòu)原始原始信號樣本。這種編碼將導(dǎo)致節(jié)省比特速率，因為消除了冗余，并且預(yù)測誤差信號具有比原始信號更低的功率，從而在給定噪聲電平上對于誤差信號的量化只需要更少的比特。
如上所述，如果分組丟失，這種通過分組交換網(wǎng)絡(luò)的語音或音頻編碼/解碼將導(dǎo)致誤差傳播。當(dāng)沒有接收到分組時，在解碼器中所計算的預(yù)測值將基于最后收到的分組的樣本。這將導(dǎo)致解碼器中的預(yù)測值與編碼器中的對應(yīng)預(yù)測值不同。因此，所接收的量化預(yù)測誤差將加到解碼器中的錯誤預(yù)測值。因此，丟失的分組將導(dǎo)致誤差傳播。如果考慮在每個發(fā)送/接收分組之后對預(yù)測狀態(tài)復(fù)位，將不存在誤差傳播。然而，這將導(dǎo)致低質(zhì)量的解碼信號，原因是如果預(yù)測器狀態(tài)設(shè)為零，則在編碼期間結(jié)果將是低質(zhì)量的預(yù)測值，因此，生成具有更多信息內(nèi)容的預(yù)測誤差。因為量化器不適于對具有這種高信息內(nèi)容的信號進(jìn)行量化，所以這又將導(dǎo)致具有高噪聲電平的低質(zhì)量量化信號。
如果根據(jù)多個描述實現(xiàn)分集系統(tǒng)，加入預(yù)測將面對由于聲音信號具有若干表示這一事實而產(chǎn)生的額外問題。如果與多描述量化器一起使用上述預(yù)測編碼/解碼方案，將出現(xiàn)兩個問題的其中一個。該問題將依賴于如何在發(fā)送/接收端采用預(yù)測。
如果接收端的多描述量化器中的每個供給獨(dú)立預(yù)測濾波器，則每個描述的預(yù)測值將獨(dú)立于其它多描述的到達(dá)。然而，采用這種解決方案，在不同獨(dú)立預(yù)測器輸出之間，不同編碼表示的偏移量將不同。從而，來自多個量化器的表示之間的有規(guī)則間距將喪失，并且隨之而來，由于接收多個描述的優(yōu)化改善也將喪失。
或者，可以由相同的預(yù)測器構(gòu)造所有多個描述，從而保持由于接收多個描述的優(yōu)化改善。然而，如果該預(yù)測來自預(yù)定表示，例如，通過所有描述的合并而獲得的最佳表示，則當(dāng)將來自發(fā)送端的編碼器的描述傳輸?shù)浇邮斩说慕獯a器時，如果由于分組丟失而接收不到多描述中的一個(或多個)描述，解碼器與編碼器的同步將喪失。
因此，如上所述，因為具有信號信息段的丟失分組將負(fù)面影響后面信號信息段的重構(gòu)，所以存在一個問題是如何使用預(yù)測來減小語音或音頻信號的比特速率，以通過分組網(wǎng)絡(luò)進(jìn)行傳輸。
當(dāng)使用多個描述時，聲音信號的傳輸將比使用單個描述的情況需要更多的帶寬。在這種系統(tǒng)中，使用預(yù)測從而減小所需帶寬甚至更另人感興趣。然而，如上所述，存在一個問題是如何在保持多描述量化的基本增益的同時在這種系統(tǒng)中實現(xiàn)預(yù)測編碼/解碼機(jī)制。
發(fā)明概要本發(fā)明的目的是克服使用預(yù)測編碼/解碼來減小當(dāng)通過分組交換網(wǎng)絡(luò)傳輸數(shù)字化聲音信號時所需的帶寬的上述問題中的至少某些問題。
根據(jù)本發(fā)明，通過具有如獨(dú)立權(quán)利要求1、15、29和30所限定的特性的方法，實現(xiàn)這一目的。
本發(fā)明提供一種有利的方式來對數(shù)字樣本進(jìn)行編碼/解碼以通過分組交換網(wǎng)絡(luò)進(jìn)行發(fā)送/接收。這是通過以所生成的預(yù)測樣本為條件對數(shù)字樣本進(jìn)行無損編碼和對相應(yīng)的碼字進(jìn)行無損解碼來執(zhí)行的。
因此，條件無損編碼器的輸出是兩個變量的函數(shù)量化數(shù)字樣本和預(yù)測樣本。對應(yīng)地，條件無損解碼器的輸出是兩個變量的函數(shù)碼字和預(yù)測樣本。
因為仍然繼續(xù)對數(shù)字信號本身的量化數(shù)字樣本執(zhí)行無損編碼，所以將減輕由于壞預(yù)測值，例如如果前面分組已丟失，而產(chǎn)生的邊緣效應(yīng)。相比，如果只對預(yù)測誤差執(zhí)行無損編碼，這將導(dǎo)致嚴(yán)重的邊緣效應(yīng)。這樣的原因是丟失的分組將意味著對預(yù)測器的狀態(tài)復(fù)位，或者強(qiáng)制為0，這將導(dǎo)致大的預(yù)測器誤差偏差。因此，如果在新分塊的開始時將預(yù)測器狀態(tài)強(qiáng)制為0，或者作其它的操作以避免不同數(shù)字樣本分塊之間的誤差傳播，將出現(xiàn)具有高信息內(nèi)容的信號。在這種情況下，預(yù)測誤差信號將基本上是原始數(shù)字信號。然而，采用本發(fā)明的解決方案，這一問題得以減輕，因為無損編碼和解碼將分別基于以預(yù)測值為條件的量化數(shù)字信號樣本和碼字，而不是僅基于預(yù)測誤差。
因此，使用本發(fā)明，壞預(yù)測值將仍然允許高質(zhì)量的傳輸信號樣本，而折衷在于無損編碼/解碼的比特節(jié)省將很低。
而且，本發(fā)明允許在一個實施例中當(dāng)對數(shù)字樣本分塊的開始處進(jìn)行無損編碼/解碼期間生成預(yù)測樣本時，可以將預(yù)測器狀態(tài)設(shè)為零，因此減輕當(dāng)在編碼/解碼過程中使用預(yù)測時丟失分組對誤差傳播的影響。
在編碼期間，對所生成預(yù)測樣本所執(zhí)行的任何量化獨(dú)立于對數(shù)字樣本的量化。因而，在一個實施例中，可以在數(shù)字信號編碼/解碼期間以量化索引的形式在索引域中使用預(yù)測。
以這種方式使用預(yù)測的一個優(yōu)點(diǎn)是預(yù)測器可以構(gòu)造為在接收端以與發(fā)送端相同的方式工作，并且將不需要將任何額外預(yù)測信息傳輸?shù)浇邮斩恕?br> 根據(jù)一些實施例，可以直接作為預(yù)測樣本的量化索引，或者作為在生成其之后使用與用于量化數(shù)字樣本相同的量化電平集或者完全不同的量化電平集進(jìn)行量化的樣本，生成基于量化數(shù)字樣本的預(yù)測。
在一個實施例中，無損編碼/解碼以所生成的預(yù)測樣本為條件，方式如下使用所生成的預(yù)測樣本從若干查詢表中選擇一個查詢表，其中，查詢表用于將量化數(shù)字樣本無損編碼為碼字或者將碼字無損解碼為量化數(shù)字樣本。
可以用例如信號的粗量化估計或預(yù)測誤差偏差，或者從過去信號提取的其它粗量化特性補(bǔ)充用作無損編碼/解碼條件的預(yù)測。因此，可以從過去信號中提取很多特性，對它們進(jìn)行粗量化，然后用來作為無損編碼器或解碼器的條件。因此，無損編碼器/解碼器可以獨(dú)立地進(jìn)行優(yōu)化，并且用于來自所提取特性量化的每種可能的索引組合。用于語音信號編碼的有用特性的例子是量化預(yù)測；不僅來自一個過去信號樣本而且來自若干過去信號樣本的量化器索引；信號量化估計或預(yù)測誤差偏差；以及波形方向估計；和/或語音/非語音分類。
可以在編碼器中逐樣本或逐樣本分塊地提取上述特性中的某些特性，并且將其作為副信息進(jìn)行傳輸。波形方向就是適合例如通過使用高維分塊碼作為副信息傳輸?shù)倪@種特性的一個例子。語音/非語音分類是另一個例子。副信息導(dǎo)致用于無損編碼的乘積碼(product code)。該乘積碼的編碼可以順序或分析合成的方式來進(jìn)行。
然而，通過基于預(yù)測的無損編碼/解碼減小比特速率的優(yōu)點(diǎn)不大顯著，并且如果在傳輸數(shù)據(jù)分組之前將非常大的首標(biāo)形式的開銷加到編碼信息，帶寬仍然是一個問題。如果使用數(shù)字信號的多個描述以獲得分集，將出現(xiàn)這個問題，但是，本發(fā)明將解決這一問題。
最好，本發(fā)明的編碼器/解碼器是多描述編碼器/解碼器，即生成/接收至少兩個不同的數(shù)字信號描述的編碼器/解碼器。這樣，多個描述因此為每個數(shù)字樣本分塊提供多個塊描述。
本發(fā)明通過在不同的時刻在不同的數(shù)據(jù)分組中發(fā)送/接收相同數(shù)字樣本分塊的各個不同分塊描述，提供基于多描述的分集。當(dāng)在分組交換網(wǎng)絡(luò)中發(fā)生局部時間瓶頸時，這一由分塊描述之間的延遲提供的所謂時間分集尤其有利，因為當(dāng)在不同的分組中以不同的時間點(diǎn)傳輸不同的分塊描述時，接收特定分塊的至少一個分塊描述的機(jī)會將提高。最好，引入在傳輸相同數(shù)字樣本分塊的兩個不同分塊描述之間的預(yù)定時間間隔。
最好，屬于不同數(shù)字信號描述并且與不同數(shù)字樣本分塊相關(guān)的分塊描述一起分在相同的分組中。至少兩個連續(xù)分塊用來自不同數(shù)字信號描述的各個分塊描述來表示。這是有利的，因為它避免傳輸同一數(shù)字樣本分塊的不同分塊描述的多個分組的首標(biāo)所需的額外開銷，同時當(dāng)分組丟失或延遲時，仍然只有特定數(shù)字樣本分塊的一個分塊描述丟失或延遲。
最好，對每個不同分塊描述單獨(dú)執(zhí)行無損編碼/解碼。這將降低所傳輸?shù)亩鄠€描述所需的比特速率。而且，在發(fā)送和接收端對不同的描述分別使用相同類型的各自預(yù)測器。這將消除編碼器與解碼器之間的失步問題，當(dāng)在發(fā)送/接收端使用單個預(yù)測器進(jìn)行無損編碼/解碼時，如果具有分塊描述的分組丟失，則會出現(xiàn)這一問題。
本發(fā)明適于包括數(shù)字化聲音信號的數(shù)字信號，在這種情況下，數(shù)字樣本分塊對應(yīng)于數(shù)字化聲音信號的聲音段。
根據(jù)本發(fā)明，數(shù)字信號可選地為n比特PCM編碼數(shù)字化聲音信號，最好為遵循標(biāo)準(zhǔn)G.711的64k比特/秒PCM信號。n比特PCM編碼信號描述由多描述編碼器轉(zhuǎn)換為對于它的表示使用小于n比特的至少兩個描述，例如，兩個(n-1)比特表示，三個(n-1)比特表示或四個(n-2)比特表示。在接收器端，多描述解碼器將接收描述轉(zhuǎn)換回到單個n比特PCM編碼聲音信號。碼型轉(zhuǎn)換對應(yīng)于一個描述的碼字與至少兩個不同描述的各個碼字之間的譯碼。通過將PCM編碼信號轉(zhuǎn)換為多個描述，不需要對PCM編碼信號首先進(jìn)行解碼然后進(jìn)行重新編碼，就能夠提供多個描述。
因此，本發(fā)明允許在使用多個描述時使用預(yù)測編碼/解碼，以通過分組交換網(wǎng)絡(luò)傳輸數(shù)字信號如數(shù)字化聲音信號。
需要理解的是，在此所使用的術(shù)語數(shù)字信號樣本應(yīng)解釋為實際樣本或者從一個或多個樣本中獲得或提取的任何信號表示形式。另外，預(yù)測樣本應(yīng)解釋為實際數(shù)字信號樣本的預(yù)測，或者從一個或多個數(shù)字信號樣本中獲得或提取的任何預(yù)測表示形式。最后，數(shù)字樣本的量化電平為量化數(shù)字樣本的索引或值。
附圖簡述通過下面結(jié)合附圖對本發(fā)明的多個示例性實施例進(jìn)行詳細(xì)描述，本發(fā)明的其他特性和優(yōu)點(diǎn)將會變得更加清楚，其中相同的標(biāo)號用于相同的部件，并且在其中

圖1示出根據(jù)現(xiàn)有技術(shù)實現(xiàn)多個描述的一個示例方式；圖2示出用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的發(fā)送部分的概覽；圖3示出用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的接收部分的概覽；圖4a和4b分別示出根據(jù)本發(fā)明一個實施例的用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的發(fā)送部分的聲音編碼器和接收部分的聲音解碼器的概覽；圖5a和5b分別示出根據(jù)本發(fā)明另一個實施例的用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的發(fā)送部分的聲音編碼器和接收部分的聲音解碼器的概覽；以及圖6示出根據(jù)本發(fā)明另一個實施例的用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的發(fā)送部分的一些單元。
優(yōu)選實施例在圖1中，示出實現(xiàn)源信號如聲音信號的多個描述的一個示例方式。該方法在本技術(shù)領(lǐng)域中是公知的，并且是可以由本發(fā)明使用的多個描述的一個例子。然而，實現(xiàn)多個描述的其他適當(dāng)方式可以同樣好地與本發(fā)明一起使用。在圖1中，示出分別來自兩個量化器的兩個不同描述100、110的量化電平。如圖所示，這兩個描述具有相同的量化步長Q，但是描述110的量化電平相對于描述100的量化電平偏移量化步長Q的一半。根據(jù)這兩個描述100、110，合并將導(dǎo)致具有更細(xì)量化步長Q/2的合并描述120。使用兩個粗量化器，需要2R比特速率來匹配比特速率為R+1的單個細(xì)量化器性能。例如，如果每個描述100、110具有4個量化電平，每個描述將需要2個比特來對這些電平進(jìn)行編碼，即，總共4個比特。如果對合并描述120使用更細(xì)的量化器，7個量化電平在編碼時將需要3個比特。對于大的R，當(dāng)使用兩個粗量化器來提供多個描述而不是使用一個更細(xì)的量化器來提供單個描述時，這將導(dǎo)致比特速率顯著提高。
在圖2中，示出用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的發(fā)送部分的方框圖。聲音由麥克風(fēng)210進(jìn)行拾取，以產(chǎn)生模擬電信號215，模擬電信號215由A/D轉(zhuǎn)換器220采樣并量化為數(shù)字格式。聲音信號的采樣率依賴于聲音信號的源和所需質(zhì)量。典型地，采樣率對于語音信號為8或16kHz，并且對于音頻信號，高至48kHz。數(shù)字信號的質(zhì)量還受A/D轉(zhuǎn)換器的量化器的精度的影響。對于語音信號，精度通常在每樣本8到16比特之間。在典型的系統(tǒng)中，發(fā)送端包括聲音編碼器230，以進(jìn)一步壓縮采樣數(shù)字信號。根據(jù)本發(fā)明，聲音編碼器230的一個額外目的是在傳輸之前修改聲音信號表示，從而提高對分組交換網(wǎng)絡(luò)中分組丟失和延遲的穩(wěn)健性。采樣信號225輸入到聲音編碼器230，它對采樣信號進(jìn)行編碼并且將所獲得的編碼信號組裝到數(shù)據(jù)分組中。數(shù)據(jù)分組235然后傳輸?shù)娇刂破?40，它將順序和目標(biāo)地址信息加到數(shù)據(jù)分組，從而使這些分組適于通過分組交換網(wǎng)絡(luò)進(jìn)行傳輸。數(shù)據(jù)分組245然后通過分組交換網(wǎng)絡(luò)傳輸?shù)浇邮掌鞫恕?br> 在圖3中，示出用于通過分組交換網(wǎng)絡(luò)傳輸聲音的系統(tǒng)的接收部分的方框圖?？刂破?50從分組交換網(wǎng)絡(luò)接收數(shù)據(jù)分組，剔除地址信息，并且將數(shù)據(jù)分組355放在抖動緩沖器360中。抖動緩沖器360是一個存儲介質(zhì)，典型地為RAM，它調(diào)整數(shù)據(jù)分組365離開抖動緩沖器360的速率。抖動緩沖器的物理容量是可以存儲進(jìn)入數(shù)據(jù)分組355的容量。離開抖動緩沖器360的數(shù)據(jù)分組365輸入到聲音解碼器370。聲音解碼器370將數(shù)據(jù)分組中的信息解碼為數(shù)字聲音信號的再現(xiàn)樣本。然后，數(shù)字信號375由D/A轉(zhuǎn)換器380轉(zhuǎn)換為模擬電信號385，該模擬信號驅(qū)動聲音再現(xiàn)系統(tǒng)390，例如揚(yáng)聲器，在接收器端產(chǎn)生聲音。
現(xiàn)在將參照圖4a和4b對根據(jù)本發(fā)明一個實施例的聲音編碼器和聲音解碼器的設(shè)計和操作進(jìn)行更詳細(xì)的描述。除了下面對聲音編碼/解碼塊所述之外，整體操作對應(yīng)于前面參照圖2和3所述。
在圖4a中，示出根據(jù)本發(fā)明一個實施例的用于在發(fā)送端對數(shù)字信號進(jìn)行編碼的聲音編碼器。聲音編碼器包括第一量化器400、反量化器410、延遲塊420、預(yù)測器430、第二量化器440和條件無損編碼器450。因為反量化器410和第二量化器440不是本實施例的必需單元，所以它們用虛線表示。后面將在另一實施例中描述對這些可選單元的使用。
對應(yīng)地，在圖4b中，示出根據(jù)本發(fā)明一個實施例的用于在接收端對數(shù)字信號進(jìn)行解碼的聲音解碼器。聲音解碼器包括條件無損解碼器455、量化器470、預(yù)測器480、延遲塊490以及反量化器460和463。因為量化器470和反量化器463不是本實施例的必需單元，所以它們用虛線表示。后面將在另一實施例中描述對這些可選單元的使用。
通過條件無損編碼器450和條件無損解碼器455執(zhí)行無損編碼/解碼的目的是找到一種更不浪費(fèi)比特的方式來描述從發(fā)送端傳輸?shù)浇邮斩说臄?shù)據(jù)而不損失任何信息。無損編碼使用有關(guān)輸入信號的統(tǒng)計信息來減小平均比特速率。例如采用這樣的方式來執(zhí)行在得出輸入信號中的碼字出現(xiàn)頻率之后在一個表中對這些碼字進(jìn)行排序。然后，最常用的碼字用比其他碼字更少的比特來表示。一個使用這種思想的本領(lǐng)域公知的無損編碼器的例子是Huffman(哈夫曼)編碼器。
無損編碼只在接收數(shù)據(jù)中不帶比特錯誤的網(wǎng)絡(luò)中正常工作。結(jié)合無損編碼所用的碼字具有不同的長度，并且如果發(fā)生比特錯誤，則不可能知道碼字何時結(jié)束以及新碼字何時開始。因此，單個比特錯誤不僅給當(dāng)前碼字的解碼還給整個數(shù)據(jù)塊引入錯誤。當(dāng)分組交換網(wǎng)絡(luò)為IP(網(wǎng)際協(xié)議)網(wǎng)絡(luò)時，所有被破壞的數(shù)據(jù)分組將被自動丟棄。因此，在這種分組交換網(wǎng)絡(luò)中，在接收端所接收的數(shù)據(jù)分組中將不存在比特錯誤。因此，根據(jù)本發(fā)明，無損編碼如分級或分塊Huffman編碼適用于分別對一起構(gòu)成數(shù)字信號的每個編碼數(shù)字樣本分塊進(jìn)行單獨(dú)壓縮。
圖4a和4b實施例的條件無損編碼器450和條件無損解碼器455都包括創(chuàng)建用來包括所有可能的碼字及其比特表示的表。在作為碼字通過分組交換網(wǎng)絡(luò)進(jìn)行傳輸之前，執(zhí)行表查詢以對由量化器400量化的數(shù)字樣本分塊進(jìn)行無損編碼。對應(yīng)地，在接收器端，編碼量化數(shù)字樣本分塊的碼字經(jīng)過無損解碼為量化數(shù)字樣本，然后這些量化數(shù)字樣本由反量化器460反量化為重構(gòu)的原始數(shù)字樣本分塊。
在圖4a中，從A/D轉(zhuǎn)換器接收的數(shù)字信號的數(shù)字樣本由量化器400量化為量化數(shù)字樣本。對于每個量化數(shù)字樣本，由預(yù)測器430根據(jù)一個或多個前面量化數(shù)字樣本生成一個預(yù)測樣本。預(yù)測器430根據(jù)前面量化數(shù)字樣本的量化電平即量化索引或量化值為預(yù)測樣本所生成的可能是其量化索引，其中前面量化數(shù)字樣本的電平由量化器400進(jìn)行輸出，并且由延遲塊420進(jìn)行延遲。預(yù)測樣本或其量化索引在條件無損編碼器450內(nèi)用于從若干具有碼字的查詢表中選擇一個查詢表。來自量化器400的當(dāng)前量化數(shù)字樣本的量化電平如索引用來選擇所選查詢表的特定條目。然后，條件無損編碼器將輸出所選表的該特定條目所對應(yīng)的碼字。
完整的編碼量化數(shù)字樣本分塊的碼字最終組裝到傳輸?shù)娇刂破鞯牟煌纸M?？蛇x地，編碼分塊的每個碼字由控制器集中，然后組裝到編碼分塊的不同分組?？刂破髟谕ㄟ^分組交換網(wǎng)絡(luò)傳輸數(shù)據(jù)分組之前加入首標(biāo)信息。
在圖4b中，示出對應(yīng)于圖4a的實施例的聲音解碼器。條件無損解碼器455從抖動緩沖器接收具有碼字的分組或者經(jīng)過拆卸的分組的碼字。對于每個量化數(shù)字樣本，由預(yù)測器480根據(jù)一個或多個前面量化數(shù)字樣本生成一個預(yù)測樣本。接收端的預(yù)測器480構(gòu)造為以與發(fā)送端的預(yù)測器430相同的方式工作。這些預(yù)測器的典型結(jié)構(gòu)是當(dāng)生成數(shù)字信號的開始量化數(shù)字樣本所對應(yīng)的預(yù)測樣本時，預(yù)測器的狀態(tài)為零或接近于零。采用與發(fā)送端相同的方式，預(yù)測器480可以根據(jù)前面量化數(shù)字樣本的量化電平即量化索引或量化值生成一個預(yù)測器樣本的量化索引，其中前面量化數(shù)字樣本的電平隱式地由無損解碼器455進(jìn)行輸出，并且由延遲塊490進(jìn)行延遲。在接收端生成的預(yù)測樣本在條件無損解碼器455內(nèi)用來從若干表中選擇一個查詢表。從抖動緩沖器接收的碼字用來對所選表的特定條件進(jìn)行尋址，然后，輸出對應(yīng)的量化數(shù)字樣本，以由反量化器460進(jìn)行反量化，然后，將數(shù)字信號傳輸?shù)紻/A轉(zhuǎn)換器。
在另一些實施例中，聲音編碼器包括如圖4a所示的反量化器410和/或第二量化器440。對應(yīng)地，根據(jù)這些其他實施例的聲音解碼器包括量化器470和/或反量化器463。
使用反量化器410和463，量化數(shù)字樣本的量化值而不是量化索引將輸入到預(yù)測器430和480，并且預(yù)測器將根據(jù)值而不是索引生成預(yù)測樣本。
如果預(yù)測器430和480不包括用于輸出所生成預(yù)測樣本的量化電平如索引的量化表，最好，聲音編碼器/解碼器將包括量化器440、470來提供所生成預(yù)測樣本的量化電平，例如索引。因此，使用量化器440和470，可以確定所生成預(yù)測樣本的量化電平為屬于預(yù)定電平集的合法電平，而不是落在不同合法量化電平之間的電平。
根據(jù)本發(fā)明，為了避免誤差傳播，一個數(shù)字樣本分塊的數(shù)字樣本所對應(yīng)的所生成預(yù)測樣本不應(yīng)基于前面分塊的數(shù)字樣本。根據(jù)一個實施例，這通過在對具有量化數(shù)字樣本的新分塊進(jìn)行編碼之前將預(yù)測器430的預(yù)測器狀態(tài)設(shè)為0來實現(xiàn)。對應(yīng)地，在接收端的聲音解碼器中，在對具有量化數(shù)字樣本的新分塊進(jìn)行解碼之前，將預(yù)測器480的預(yù)測器狀態(tài)設(shè)為0?？蛇x地，不同于將預(yù)測器狀態(tài)設(shè)為0，可以在每個數(shù)字樣本分塊中包含狀態(tài)信息，或者當(dāng)對分塊的開始處進(jìn)行編碼/解碼時，編碼/解碼可以遵循不使用或幾乎不使用狀態(tài)信息的方案。
因此，本發(fā)明的聲音編碼器/解碼器設(shè)計為減小通過分組交換網(wǎng)絡(luò)傳輸數(shù)字信號時所需的比特速率。聲音編碼器/解碼器所操作的數(shù)字樣本分塊最好為具有數(shù)字化聲音樣本的聲音段。
本發(fā)明沒有為任何特定類型的預(yù)測器而進(jìn)行優(yōu)化。然而，對于聲音信號，預(yù)測器的一個選擇是通過對量化信號進(jìn)行LPC分析而獲得且最終采用長期預(yù)測器進(jìn)行改進(jìn)的聲音信號，這一點(diǎn)為本領(lǐng)域的技術(shù)人員所公知。另外，非線性預(yù)測器，例如在“Time-Scale Modification of Speech Based on a Non-linearOscillator Model(基于非線性振蕩器模型的語音時標(biāo)修改)”，G.Kubin和W.B.Kleijn，Proc.Int.Conf.Acoust.Speech Sign.Process.(國際聲學(xué)語音信號處理會議論文集)，(Adelaide)，pp.I453-I456，1994中公開的通過振蕩器模型定義的非線性預(yù)測器可以用于本發(fā)明的編碼/解碼方案。
根據(jù)本發(fā)明，聲音編碼器/解碼器進(jìn)一步設(shè)計為提高對分組交換網(wǎng)絡(luò)中分組丟失和延遲的穩(wěn)健性。提高穩(wěn)健性的這一設(shè)計依賴于使用多個描述表示聲音信號或者一般情況下的任何數(shù)字信號。根據(jù)本發(fā)明的一個實施例，該設(shè)計如圖5a和5b所示。除了下面對聲音編碼/解碼塊所述之外，整體操作對應(yīng)于前面參照圖2和3所述。
在圖5a中，發(fā)送端的聲音編碼器530包括多描述編碼器510和分集控制器520。對應(yīng)地，接收端的圖5b所示的聲音解碼器570包括分集控制器550和多描述解碼器580。
現(xiàn)在參照圖5a，聲音編碼器530的多描述編碼器510以兩種不同的方式對采樣聲音信號525進(jìn)行編碼，從而獲得聲音信號的兩個不同比特流表示，即兩個不同描述。如前所述，每個描述都有其自己的一組量化電平，它是例如通過將其中一個描述的量化電平偏移一半量化步長而獲得的。對應(yīng)地，如果要提供三個描述，則第二描述的量化電平相對于第一描述偏移三分之一步長，并且第三描述相對于第二描述偏移三分之一步長。因此，如圖5a所示，可以使用多于兩個的描述對聲音信號進(jìn)行編碼，而不脫離本發(fā)明的范圍。然而，為方便描述起見，在此公開的本發(fā)明實施例中只使用兩個信號描述。
每個描述提供聲音信號的編碼聲音信號段的段描述。多描述編碼器510通過根據(jù)前面參照圖4a所述對數(shù)字化聲音樣本進(jìn)行條件無損編碼，生成每個描述及其段描述。因此，在圖5a所示的多描述編碼器510中將為所生成的每個描述提供各自的一組圖4a所示的所有單元。對應(yīng)地，在圖5b所示的多描述解碼器中將為所使用的每個描述提供各自的一組圖4b所示的所有單元。
在圖5a中，相同聲音段的不同段描述在各自的分組中傳輸?shù)椒旨刂破?20。在圖5a中，兩個描述用D1和D2表示。連續(xù)段n、n+1、n+2等用描述D1表示為段描述D1(n)、D1(n+1)、D1(n+2)…，這些段描述在各自的連續(xù)數(shù)據(jù)分組515、516和517中從多描述編碼器510傳輸?shù)椒旨刂破?20。對應(yīng)地，相同的段還用描述D2表示為段描述D2(n)、D2(n+1)、D2(n+2)…，并且也在各自的數(shù)據(jù)分組中傳輸?shù)椒旨刂破?。因此，聲音信?25的每個聲音段用每個描述的一個段描述來表示，例如，在圖5a中，聲音段n+1用描述D1的段描述D1(n+1)和描述D2的段描述D2(n+1)來表示。
分集控制器520根據(jù)所使用的分集方案調(diào)度從多描述編碼器510接收的分組。在圖5a中，分集控制器520將一個聲音段的每個段描述順序安排到不同的分組中。包含相同聲音段的不同段描述的分組在不同的時刻傳輸?shù)娇刂破?40。例如，如圖5a所示，聲音段n的兩個段描述D1(n)和D2(n)分別在不同的時間點(diǎn)t1與t2和不同的分組521與522中傳送到控制器540。因此引入t2-t1的延遲來創(chuàng)建時間分集。對于典型的聲音段長度20ms，可以使用的典型延遲t2-t1為10ms。當(dāng)從分集控制器520接收到分組時，控制器540對分組進(jìn)行格式化，如加入順序和目標(biāo)地址信息，以隨即在分組交換網(wǎng)絡(luò)上傳輸。因此，控制器540將帶信息的首標(biāo)H加到每個分組。在使用UDP(User DatagramProtocol，用戶數(shù)據(jù)報協(xié)議)和RTP(Real Time Protocol，實時協(xié)議)的IPv4傳輸?shù)那闆r下，首標(biāo)大小為320比特。對于20ms的典型語音段長度，每個描述的首標(biāo)將占用320比特/20毫秒，即16k比特/秒。如果每個語音段用兩個段描述表示，則傳輸段描述的分組的首標(biāo)一起將需要2*16＝32k比特/秒的比特速率。這可以與用于標(biāo)準(zhǔn)PCM(Pulse Code Modulation，脈沖編碼調(diào)制)電話的比特速率65k比特/秒相比。因此，開銷比特速率將為有效負(fù)荷速率的50％(32除以64)。
如前面參照圖3所述，由控制器350在接收器端接收分組?？刂破鲃h除首標(biāo)信息，并且將分組傳輸?shù)蕉秳泳彌_器360，緩沖器360又將分組傳輸?shù)铰曇艚獯a器370?，F(xiàn)在參照圖5b，聲音解碼器570的分集控制器550從抖動緩沖器接收具有不同段描述的分組。然后，分集控制器調(diào)度相同聲音段的不同段描述，以同時傳輸?shù)蕉嗝枋鼋獯a器580。因此，如圖5b所示，多描述解碼器580將例如同時接收分別具有聲音段n的段描述D1(n)和D2(n)的分組571和572，然后是分別具有聲音段n+1的段描述D1(n+1)和D2(n+1)的分組574和575，等等。多描述解碼器580從不同分組中為每個聲音段提取聯(lián)合信息(joint information)，并且對聲音信號段進(jìn)行解碼，以傳輸?shù)紻/A轉(zhuǎn)換器。如果例如段描述D1(n)沒有到達(dá)接收器端或者到達(dá)太遲，分集控制器550將只把D2(n)(如果使用兩個描述)調(diào)度到多描述解碼器580，然后多描述解碼器580從所接收的單個段描述D2(n)中以足夠的質(zhì)量對聲音信號的聲音段n進(jìn)行解碼。
在圖6中，示出本發(fā)明的另一個實施例。本實施例與前面參照圖5a和5b所述的實施例不同的方面是在由分組交換網(wǎng)絡(luò)傳輸?shù)姆纸M中對段描述的組織。因此不同之處在于由聲音編碼器/解碼器的分集控制器在發(fā)送/接收端執(zhí)行的分組組裝/拆卸。下面將描述該不同之處。
如參照圖5a和5b所述，傳輸相同聲音段的不同段描述的不同分組的首標(biāo)所導(dǎo)致的開銷相當(dāng)大。為了減輕這一問題，在通過分組交換網(wǎng)絡(luò)傳輸分組之前，將屬于不同描述且與不同聲音段相關(guān)的段描述一起分在相同的分組中。如圖6所示，發(fā)送端的聲音編碼器的分集控制器620將分別屬于兩個連續(xù)聲音段的兩個段描述一起分在每個分組中。分組的兩個段描述屬于聲音信號的不同描述。例如，一個分組將包含聲音段n-1的段描述D2(n-1)和聲音段n的段描述D1(n)?？刂破?40在通過分組交換網(wǎng)絡(luò)傳輸包含兩個段描述的分組之前，如前所述將首標(biāo)信息加到每個分組。
因此，如同圖5的實施例，本實施例的分集控制器620將聲音段的每個段描述順序安排到各自的分組中，并且如同圖5的實施例，包含相同聲音段的不同段描述的分組將在不同的時刻傳輸?shù)娇刂破?40。在圖6中，聲音段n和n+1的兩個段描述D2(n)和D1(n+1)在分組622中傳送到控制器640。因此，段n+1必須在段描述D2(n)可以傳輸?shù)娇刂破髦耙驯痪幋a。另一方面，段描述D1(n)在前一分組621中傳輸?shù)娇刂破?。如果聲音段?0ms，因為D2(n)要調(diào)度到與D1(n+1)相同的分組622中，所以D2(n)的傳輸與D1(n)的傳輸相比必須延遲20ms。因此，該方案將自動提供時間分集，因為相同聲音段的不同段描述將以20ms的間隔(假定聲音段的長度為20ms)傳輸?shù)娇刂破?40。因此，與圖5的實施例相比，使用在分組中組裝若干段描述的這一方案，將自動引入相同聲音段的兩個不同段描述之間的額外延遲。段描述之間的這一額外延遲提供額外的時間分集優(yōu)點(diǎn)，并且可以在傳輸鏈的后面進(jìn)行補(bǔ)償，例如，通過使接收端的抖動緩沖器中的延遲設(shè)置更小。
而且，根據(jù)本實施例的一個分組中的有效負(fù)荷量對應(yīng)于從一個聲音段生成的總數(shù)據(jù)量，因此，當(dāng)采用這種方案創(chuàng)建時間分集時，不增加開銷信息。
與上面所述相對應(yīng)，本實施例的接收端的分集控制器在對應(yīng)于圖5b所示將段描述傳輸?shù)蕉嗝枋鼋獯a器之前將接收分組分為它們的段描述部分。
如果一個分組在通過分組交換網(wǎng)絡(luò)進(jìn)行傳輸期間丟失或延遲，圖6所示的時間分集方案的效果是一樣的，在接收端仍然可以獲得所有聲音段的描述，并且將感覺不到任何聲音段的丟失。
根據(jù)本發(fā)明的一個實施例，聲音編碼器/解碼器對標(biāo)準(zhǔn)64k比特/秒PCM比特流的PCM索引進(jìn)行編碼/解碼。為方便描述起見，將再次參照圖4a和4b，描述本實施例。如前所述，為由聲音編碼器/解碼器生成/解碼的每個描述分別提供圖4a和4b的單元。然而，圖4a的量化器400和圖4b的反量化器460將分別替換為下面將要描述的碼型變換器。而且，如果數(shù)字信號尚不是PCM編碼信號，則聲音編碼器在它的碼型變換器之前包括PCM編碼器，并且聲音解碼器將在它的碼型變換器之后包括PCM解碼器。在本實施例中，聲音編碼器還包括向分集控制器輸入同一聲音段的多個描述的多描述編碼器。對應(yīng)地，聲音解碼器包括從接收端的分集控制器接收同一聲音段的多個描述的多描述解碼器。
聲音編碼器的多描述編碼器由普通PCM編碼器以及隨后的碼型變換器組成。因此，使用普通PCM編碼器對由聲音編碼器從A/D轉(zhuǎn)換器接收的數(shù)字信號進(jìn)行編碼。然后所獲得的PCM比特流由碼型變換器轉(zhuǎn)換，即譯碼為若干比特流，然后，每個比特流提供PCM的粗表示。接收端的對應(yīng)多描述解碼器包括碼型變換器，用于將所接收的多個比特流描述轉(zhuǎn)換為單個PCM比特流。然后，該P(yáng)CM比特流在傳輸?shù)紻/A轉(zhuǎn)換器之前由普通PCM解碼器進(jìn)行解碼。下面將舉例說明碼型轉(zhuǎn)換或譯碼方法，其中，一個64k比特/秒PCM比特流轉(zhuǎn)換為提供多個PCM信號描述的兩個比特流。
采用μ律對數(shù)壓縮的標(biāo)準(zhǔn)64k比特/秒PCM編碼器使用8比特/樣本對樣本進(jìn)行編碼。這提供256個不同碼字，但是量化器只包括255個不同的電平。零電平用兩個不同的碼字來表示以簡化硬件實現(xiàn)。根據(jù)本實施例，每個量化電平用一個整數(shù)索引表示，從用于最負(fù)電平的零開始直到用于最高電平的254。通過刪除每個整數(shù)索引的最低位比特，獲得兩個比特流中的第一比特流。該新索引表示兩個粗量化器的第一量化器中的量化電平。通過在刪除最低位比特之前對每個索引加1來獲得第二比特流。因此，從原始8比特PCM表示中獲取兩個7比特表示。對兩個表示的解碼方式是在分組丟失的情況下，可以對單個表示執(zhí)行解碼；或者對兩個表示執(zhí)行解碼，在這種情況下，原始PCM信號被重構(gòu)。解碼只是簡單地轉(zhuǎn)換回到PCM索引，然后進(jìn)行表查詢。
可選地，PCM編碼器是使用A律對數(shù)壓縮的標(biāo)準(zhǔn)64 k比特/秒PCM編碼器。在這種情況下，量化器中的電平數(shù)目為256，比μ律編碼器多一個。為使用兩個新量化網(wǎng)格表示該256個電平，并且能夠完全重構(gòu)該信號，一個網(wǎng)格需要采用128個電平，并且另一個需要采用129個電平。最好使用如同μ律情況的兩個7比特網(wǎng)格，然而必須解決額外量化電平的問題。根據(jù)本發(fā)明，每個量化電平用一個整數(shù)索引表示，從用于最負(fù)電平的零開始直到用于最高電平的255。除表示索引號255之外，使用與μ律情況完全相同的規(guī)則來形成新索引。索引號255對于第一量化器用索引號126表示，并且對于第二量化器用索引號127表示，而不是假如遵循上述規(guī)則所得到的128和127。當(dāng)將兩個比特流轉(zhuǎn)換為A律PCM比特流時，解碼器必須檢查該索引表示。如果在傳輸之后只接收到兩個描述中的第一描述并且所編碼的是第255索引，則解碼器將引入比其他索引稍高的量化誤差。
編碼PCM信號包含高度的冗余。因此，結(jié)合使用PCM信號與對從PCM聲音信號獲得的多個描述的無損編碼/解碼，是尤其有利的。
如果已經(jīng)由聲音編碼器接收的數(shù)字化聲音信號表示為64k比特/秒PCM比特流，并且如果接收部分的聲音解碼器應(yīng)輸出64k比特/秒PCM比特流，則不需要發(fā)送部分的PCM編碼器和接收部分的PCM解碼器。在這種情況下，本發(fā)明的多描述編碼器接收PCM比特流，并且將PCM索引轉(zhuǎn)換為上述0到254表示。該表示直接輸入到碼型轉(zhuǎn)換器，它使用上面給出的簡單規(guī)則將比特流轉(zhuǎn)換為兩個新比特流。在系統(tǒng)的接收器端，分集控制器集中接收分組中的信息。如果所有分組到達(dá)，則碼型轉(zhuǎn)換器合并來自多個描述的信息，并且將其轉(zhuǎn)換回到原始PCM比特流。如果一些分組丟失，則不能完全重構(gòu)原始比特流，但是從已到達(dá)的描述中獲得良好的近似。
盡管在上面本發(fā)明是參照其不同實施例來舉例描述的，但應(yīng)該理解，在不脫離由所附權(quán)利要求限定的本發(fā)明范圍的情況下，可以對其進(jìn)行各種修改和改變。
權(quán)利要求
1.一種對數(shù)字信號及其數(shù)字樣本分塊進(jìn)行編碼以通過分組交換網(wǎng)絡(luò)進(jìn)行傳輸?shù)姆椒?，所述方法包括如下步驟將數(shù)字樣本的二進(jìn)制表示量化為數(shù)字樣本的更粗表示；根據(jù)所述量化步驟的前面量化數(shù)字樣本，生成作為定點(diǎn)或浮點(diǎn)表示的預(yù)測樣本；以及以所生成預(yù)測樣本的定點(diǎn)或浮點(diǎn)表示為條件，對量化數(shù)字樣本進(jìn)行無損編碼。
2.如權(quán)利要求1所述的方法，其中，對量化數(shù)字樣本的無損編碼基于表查詢。
3.如權(quán)利要求2所述的方法，其中，根據(jù)量化數(shù)字樣本執(zhí)行表查詢，以生成量化數(shù)字樣本所對應(yīng)的兩個量化區(qū)間邊界電平，其中，所述電平根據(jù)普通生成的預(yù)測值和另一表映射到用于對量化數(shù)字樣本進(jìn)行無損編碼的一對似然值。
4.如權(quán)利要求1或2所述的方法，其中，對特定量化數(shù)字樣本的所述無損編碼步驟包括輸出具有碼字的表中的特定條目所對應(yīng)的特定碼字，所述特定條目是根據(jù)對應(yīng)于所述特定量化數(shù)字樣本的所生成預(yù)測樣本來獲得的。
5.如權(quán)利要求4所述的方法，其中，根據(jù)所述所生成預(yù)測樣本，從若干具有碼字的表中選擇所述具有碼字的表，其中，所述特定條目是作為所述量化數(shù)字樣本的所述量化索引所對應(yīng)的條目而獲得的。
6.如權(quán)利要求1-5中的任一權(quán)利要求所述的方法，其中，在所述生成預(yù)測樣本的步驟之前，對量化數(shù)字樣本進(jìn)行反量化，從而獲得所述量化數(shù)字樣本的量化值。
7.如權(quán)利要求1-6中的任一權(quán)利要求所述的方法，包括對所生成的預(yù)測樣本進(jìn)行量化的步驟，其中，所述無損編碼步驟基于具有預(yù)定量化電平集的量化電平的所生成預(yù)測樣本。
8.如權(quán)利要求1-7中的任一權(quán)利要求所述的方法，包括如下步驟在開始對一個所述數(shù)字樣本分塊進(jìn)行編碼之前，將生成所述預(yù)測樣本的預(yù)測器的狀態(tài)設(shè)為零。
9.如權(quán)利要求7或8所述的方法，其中，所述無損編碼步驟以所述所生成預(yù)測樣本的量化索引為條件。
10.如權(quán)利要求1-9中的任一權(quán)利要求所述的方法，其中，由多描述編碼器執(zhí)行所述編碼，所述多描述編碼器通過為每個所生成的分塊描述單獨(dú)執(zhí)行編碼方法步驟，根據(jù)多個分塊描述對所述數(shù)字樣本分塊的每個分塊進(jìn)行編碼。
11.如權(quán)利要求10所述的方法，包括如下附加步驟以分組之間的預(yù)定時間間隔，為所述數(shù)字樣本分塊的每個分塊，將至少兩個不同的分塊描述在各自的數(shù)據(jù)分塊中進(jìn)行傳輸。
12.如權(quán)利要求11所述的方法，包括將至少兩個不同的數(shù)字樣本分塊的各自一個分塊描述一起分在同一數(shù)據(jù)分組中進(jìn)行傳輸。
13.如權(quán)利要求10-12中的任一權(quán)利要求所述的方法，其中，所述數(shù)字信號為數(shù)字化聲音信號，并且所述數(shù)字樣本分塊為聲音段，并且其中，所述多描述編碼器中的編碼方法包括如下初始步驟將n比特PCM表示的數(shù)字化聲音信號轉(zhuǎn)換為至少兩個表示，其中每個表示用小于n比特來表示，并且分別具有所述數(shù)字化聲音信號的聲音段的段描述的各自量化電平集。
14.如權(quán)利要求1-12中的任一權(quán)利要求所述的方法，其中，所述數(shù)字信號為數(shù)字化聲音信號，并且所述數(shù)字樣本分塊為聲音段。
15.一種對從分組交換網(wǎng)絡(luò)接收的數(shù)字信號及其數(shù)字樣本分塊進(jìn)行解碼的方法，所述方法包括如下步驟根據(jù)通過對接收碼字進(jìn)行無損解碼而產(chǎn)生的所述數(shù)字信號的前面量化數(shù)字樣本，生成作為定點(diǎn)或浮點(diǎn)表示的預(yù)測樣本；以所生成預(yù)測樣本的定點(diǎn)或浮點(diǎn)表示為條件，對接收碼字進(jìn)行無損解碼；以及將通過無損解碼步驟而產(chǎn)生的量化數(shù)字樣本反量化為所述數(shù)字信號的數(shù)字樣本的二進(jìn)制表示。
16.如權(quán)利要求15所述的方法，其中，對接收碼字的無損解碼基于表查詢。
17.如權(quán)利要求16所述的方法，其中，接收碼字表示似然值，其中，兩個似然值根據(jù)所生成的預(yù)測值和一個表映射到對應(yīng)量化數(shù)字樣本的兩個量化區(qū)間邊界電平，所述電平用于通過執(zhí)行表查詢來獲得對應(yīng)的量化數(shù)字樣本。
18.如權(quán)利要求15或16所述的方法，其中，對特定量化數(shù)字樣本的所述無損解碼步驟包括輸出具有量化電平的表的特定條目所對應(yīng)的特定量化電平，所述特定條目是根據(jù)對應(yīng)于所述特定量化數(shù)字樣本的接收碼字來選擇的。
19.如權(quán)利要求18所述的方法，其中，根據(jù)所述特定量化數(shù)字樣本所對應(yīng)的所生成預(yù)測樣本，從若干具有量化電平的表中選擇所述具有量化電平的表。
20.如權(quán)利要求15-19中的任一權(quán)利要求所述的方法，其中，在所述生成預(yù)測樣本的步驟之前，對通過無損解碼步驟而產(chǎn)生的量化數(shù)字樣本進(jìn)行反量化，從而獲得所述量化數(shù)字樣本的量化值。
21.如權(quán)利要求15-20中的任一權(quán)利要求所述的方法，包括對所生成的預(yù)測樣本進(jìn)行量化的步驟，其中，所述無損解碼步驟基于具有預(yù)定量化電平集的量化電平的所生成預(yù)測樣本。
22.如權(quán)利要求15-21中的任一權(quán)利要求所述的方法，包括如下步驟在開始對一個所述數(shù)字樣本分塊進(jìn)行解碼之前，將生成所述預(yù)測樣本的預(yù)測器的狀態(tài)設(shè)為零。
23.如權(quán)利要求21或22所述的方法，其中，所述無損解碼步驟以所述所生成預(yù)測樣本的量化索引為條件。
24.如權(quán)利要求15-23中的任一權(quán)利要求所述的方法，其中，由多描述解碼器執(zhí)行所述解碼，所述多描述解碼器通過為每個所接收的分塊描述單獨(dú)執(zhí)行反量化步驟之前的解碼方法步驟，根據(jù)至少兩個不同的接收分塊描述，對所述數(shù)字樣本分塊的每個分塊進(jìn)行解碼。
25.如權(quán)利要求15-24中的任一權(quán)利要求所述的方法，包括如下步驟在預(yù)定時間周期內(nèi)等待接收至少兩個不同的分組，其中，這些分組包含同一數(shù)字樣本分塊的不同分塊描述；對在所述預(yù)定時間周期內(nèi)接收到的所述數(shù)字樣本分塊的那些不同分塊描述，一個或多個，執(zhí)行反量化步驟之前的解碼方法步驟；以及對一個分塊描述或者多個分塊描述的合并進(jìn)行反量化。
26.如權(quán)利要求25所述的方法，其中，每個接收分組包括分在一起的若干不同數(shù)字樣本分塊的若干分塊描述，所述方法包括如下步驟相對于所包含的分塊描述，連續(xù)分解接收分組，從而獲得所要解碼的每個數(shù)字樣本分塊的若干不同分塊描述。
27.如權(quán)利要求25-26中的任一權(quán)利要求所述的方法，其中，所述數(shù)字信號為數(shù)字化聲音信號，并且所述數(shù)字樣本分塊為聲音段，并且其中，所述數(shù)字化聲音信號為PCM編碼比特流，并且其中，所述反量化步驟的任何合并包括將每個均用小于n比特表示的至少兩個段表示轉(zhuǎn)換為所述相同聲音信號段的單個n比特PCM表示。
28.如權(quán)利要求15-26中的任一權(quán)利要求所述的方法，其中，所述數(shù)字信號為數(shù)字化聲音信號，并且所述數(shù)字樣本分塊為聲音段。
29.一種計算機(jī)可讀介質(zhì)，具有計算機(jī)可執(zhí)行指令，用于使數(shù)字信號及其數(shù)字樣本分塊經(jīng)過編碼以通過分組交換網(wǎng)絡(luò)進(jìn)行傳輸，所述計算機(jī)可執(zhí)行指令執(zhí)行如權(quán)利要求1-14中的任一權(quán)利要求所述的方法的步驟。
30.一種計算機(jī)可讀介質(zhì)，具有計算機(jī)可執(zhí)行指令，用于使從分組交換網(wǎng)絡(luò)接收的數(shù)字信號及其數(shù)字樣本分塊經(jīng)過解碼，所述計算機(jī)可執(zhí)行指令執(zhí)行如權(quán)利要求15-28中的任一權(quán)利要求所述的方法的步驟。
全文摘要
本發(fā)明涉及用于對通過分組交換網(wǎng)絡(luò)傳輸?shù)臄?shù)字信號進(jìn)行編碼/解碼的方法。在發(fā)送和接收端生成預(yù)測樣本。數(shù)字信號以所生成的預(yù)測樣本為條件，在發(fā)送端經(jīng)過無損編碼，并且在接收端經(jīng)過無損解碼。
文檔編號G10L19/02GK1436347SQ0181127
公開日2003年8月13日申請日期2001年5月10日優(yōu)先權(quán)日2000年5月10日
發(fā)明者蒂納·亞伯拉罕森, 索倫·旺安德森, 羅爾·哈根, W·巴斯琴·克萊吉恩申請人:環(huán)球Ip音響公司

完整全部詳細(xì)技術(shù)資料下載