專利名稱::可變規(guī)模語音編碼/解碼的方法和裝置的制作方法
技術(shù)領(lǐng)域:
:本發(fā)明屬語音編碼/解碼
技術(shù)領(lǐng)域:
,具體地說本發(fā)明涉及通過在一個比特流中表示以一個底層為基礎(chǔ)的各個增強層的數(shù)據(jù)對分層比特流進(jìn)行編碼/解碼的可變規(guī)模的(scalable)語音編碼解碼的方法和裝置。通常,含有信息的波形是一個連續(xù)的模擬信號。為了將這波形表示成離散信號,就需要進(jìn)行模擬-數(shù)字(A/D)變換。為了進(jìn)行A/D變換,需要兩個過程(1)采樣過程,將在時間上連續(xù)的信號變換成離散信號;(2)幅度量化過程,將可能的幅度數(shù)限制為一個有限值,也就是說,將輸入幅度X(n)限制為屬于t時刻可能幅度的有限集中的一個元Y(n)。由于近來數(shù)字信號處理技術(shù)的開發(fā),已經(jīng)提出和廣泛使用通過采樣和量化將模擬信號變換成數(shù)字的PCM(脈沖編碼調(diào)制)數(shù)據(jù)、將經(jīng)變換的信號存入諸如高密盤或數(shù)字語音帶那樣的記錄/存儲媒體以后根據(jù)用戶需要再重放所存儲的信號這樣的語音信號存儲/恢復(fù)方法。這種數(shù)字存儲/恢復(fù)方法解決了語音質(zhì)量降低的問題,與傳統(tǒng)的模擬方法相比大大改善了語音的質(zhì)量。然而,在有大量數(shù)字?jǐn)?shù)據(jù)的情況下,這種方法在存儲和發(fā)送數(shù)據(jù)上仍存在著問題。為了減少數(shù)字?jǐn)?shù)據(jù)量,已經(jīng)采用了DPCM(差分脈沖編碼調(diào)制)或ADPCM(自適應(yīng)差分脈沖編碼調(diào)制)來壓縮數(shù)字語音信號。然而,這種方法具有一個缺點,對于不同的信號類型效率相差非常大。最近由ISO(國際標(biāo)準(zhǔn)化組織)標(biāo)準(zhǔn)化的MPEG(動畫專家組)/語音技術(shù)和由杜比開發(fā)的AC-2/AC-3技術(shù)利用了一個人類心理聲學(xué)模型來減少數(shù)據(jù)量。在諸如MPEG-1/語音、MPEG-2/語音或AC-2/AC-3那樣的傳統(tǒng)的語音信號壓縮方法中,時域信號被變換成頻域信號,組合成一些具有恒定長度的塊。然后,經(jīng)變換的信號用人類心理聲學(xué)模型進(jìn)行標(biāo)量量化。這種量化雖然簡單,但即使輸入的樣點是統(tǒng)計獨立的情況下也并不是最佳的。當(dāng)然,如果輸入的樣點是相互統(tǒng)計相關(guān)的,這種量化就更不合適。然后,進(jìn)行編碼,包括諸如熵編碼之類的無損編碼或自適應(yīng)量化。因此,與簡單的PCM數(shù)據(jù)存儲方法相比,這種編碼過程相當(dāng)復(fù)雜。比特流包括壓縮信號用的輔助信息和經(jīng)量化的PCM數(shù)據(jù)。MPEG/語音標(biāo)準(zhǔn)或AC-2/AC-3方法提供了與高密盤幾乎相同的語音質(zhì)量,但比特率為64-384Kbps,僅是經(jīng)典數(shù)字編碼比特率的1/6-1/8。因此,MPEG/語音標(biāo)準(zhǔn)在存儲和發(fā)送諸如數(shù)字語音廣播(DAB)、互聯(lián)網(wǎng)電話或點播放音(AOD)中的語音信號上起著重要的作用。在這些傳統(tǒng)的技術(shù)中,編碼器中給定了一個固定的比特率,因此需要搜索適合給定比特率的最佳狀態(tài)再進(jìn)行量化和編碼,從而可以得到相當(dāng)好的效果。然而,隨著多媒體技術(shù)的出現(xiàn),對于具備有低比特率編碼效果的多功能編碼解碼器(Codec)的呼聲越來越高。其中之一就是可變規(guī)模語音編碼解碼器(Scalableaudiocodec)。這種可變規(guī)模語音編碼解碼器可以將在高比特率編碼的比特流變成低比特率的比特流,只恢復(fù)其中的某些部分。這樣,在網(wǎng)絡(luò)負(fù)荷過重時或者在解碼器的性能不好或用戶有所請求的情況下,可以只用部分比特流來合理恢復(fù)信號,只是在性能上由于比特率較低而稍有一些降低。按照普通的語音編碼技術(shù),為編碼裝置給定了一個固定的比特率,搜索到對于給定比特率的最佳狀態(tài)后進(jìn)行量化和編碼,從而形成符合這個比特率的比特流。一個比特流含有的只是對于一個比特率的信息。也就是說,比特率信息包含在一個比特流的頭標(biāo)中,使用的是一個固定比特率。因此,可以使用一個在規(guī)定的比特率呈現(xiàn)最佳效果的方法。例如,在一個比特流用一個工作在比特率為96Kbps的編碼器形成的情況下,用一個與這個編碼器相應(yīng)的比特率為96Kbps的解碼器可以恢復(fù)出質(zhì)量最佳的聲音。按照這種方法,形成比特流并不考慮其他比特率,所形成的比特流具有適合給定比特率的規(guī)模,而不是其他比特流。實際上,如果這樣形成的比特流要通過一個通信網(wǎng)發(fā)送,就需要將這比特流分成一系列時隙發(fā)送。在一個傳輸信道負(fù)荷過重時,由于傳輸信道帶寬狹窄接收端接收到的可能僅是傳輸發(fā)送的部分時隙,從而不能正確恢復(fù)數(shù)據(jù)。此外,由于比特流并不是按照它的重要性來形成的,因此只是恢復(fù)部分比特流會導(dǎo)致質(zhì)量嚴(yán)重下降。在語音數(shù)字?jǐn)?shù)據(jù)的情況下,可能產(chǎn)生刺耳的聲音。例如,在一個廣播臺形成比特流向各用戶廣播時,這些用戶可能請求不同的比特率?;蛘撸@些用戶可能具有不同性能的解碼器。在這種情況下,如果為了滿足用戶的請求廣播臺發(fā)送僅由一個固定比特率支持的數(shù)據(jù)流的話,就需要分別向各用戶發(fā)送比特流,這在比特流的傳輸和形成上都是相當(dāng)不經(jīng)濟的。然而,如果一個語音比特流具有一些不同層的比特率,那么就能恰當(dāng)?shù)貪M足不同的用戶請求和給定的環(huán)境。為此,如圖1所示,先對低層進(jìn)行編碼,然后再解碼。然后,將經(jīng)解碼所得信號與原信號之差再輸入下一層的編碼器進(jìn)行處理。也就是說,首先對底層編碼,產(chǎn)生一個比特流,再對原信號與編碼信號之差進(jìn)行編碼,產(chǎn)生一個下一層的比特流,這樣反復(fù)進(jìn)行。這種方法增大了編碼器的復(fù)雜程度。此外,為了恢復(fù)原信號,解碼器也要以相反的次序重復(fù)這個過程,從而增大了解碼器的復(fù)雜程度。因此,隨著層數(shù)的增多,編碼器和解碼器就越來越復(fù)雜。為了解決上述問題,本發(fā)明的一個目的就是提出一種可變規(guī)模語音編碼/解碼的方法和裝置,通過在一個比特流內(nèi)表示一些不同層比特率的數(shù)據(jù)可以按照傳輸信道的狀態(tài)、解碼器的性能或用戶的請求控制比特流的規(guī)模和解碼器的復(fù)雜程度。為了達(dá)到這個目的,所提出的將語音信號編碼成一個具有一個底層和預(yù)定數(shù)目的增強層的分層數(shù)據(jù)流的可變規(guī)模語音編碼方法包括下列步驟(a)對輸入的語音信號進(jìn)行信號處理和按各預(yù)定的編碼頻帶進(jìn)行量化;(b)在預(yù)定的層規(guī)模內(nèi)對與底層相應(yīng)的量化數(shù)據(jù)進(jìn)行編碼;(c)在預(yù)定的層規(guī)模內(nèi)對與已編碼底層的下一個增強層相應(yīng)的量化數(shù)據(jù)和屬于已編碼層而尚未編碼的剩下的量化數(shù)據(jù)進(jìn)行編碼;以及(d)相繼對所有各層執(zhí)行層編碼步驟,其中步驟(b)、(c)和(d)各包括下列步驟(e)用預(yù)定的相同數(shù)目的數(shù)字表示與一個需編碼的層相應(yīng)的量化數(shù)據(jù);以及(f)對由組成所表示的數(shù)字?jǐn)?shù)據(jù)的幅度數(shù)據(jù)的最高有效數(shù)字組成的最高有效數(shù)字序列進(jìn)行編碼。步驟(e)和(f)是從低頻率到高頻率依次執(zhí)行的。編碼步驟(b)、(c)和(d)是用一種預(yù)定的編碼方法對包括至少量化步長信息和分配給每個頻帶的量化比特信息的輔助信息以及量化數(shù)據(jù)執(zhí)行的。步驟(e)和(f)中的數(shù)字是比特,而步驟(f)中的編碼是通過以預(yù)定個數(shù)的比特為單位組合組成比特序列的各比特實現(xiàn)的。預(yù)定的編碼方法是無損編碼,而無損編碼是霍夫曼編碼或算術(shù)編碼。在量化數(shù)據(jù)是由符號數(shù)據(jù)和幅度數(shù)據(jù)組成時,步驟(f)包括下列步驟(i)用一種預(yù)定的編碼方法對由組成所表示的數(shù)字?jǐn)?shù)據(jù)的幅度數(shù)據(jù)的最高有效數(shù)字組成的最高有效數(shù)字序列進(jìn)行編碼;(ii)對與已編碼的最高有效數(shù)字序列中的非零數(shù)據(jù)相應(yīng)的符號數(shù)據(jù)進(jìn)行編碼;(iii)用一種預(yù)定的編碼方法對數(shù)字?jǐn)?shù)據(jù)的未編碼的幅度數(shù)據(jù)中的最高有效數(shù)字序列進(jìn)行編碼;(iv)對與在步驟(iii)中編碼的數(shù)字序列中的非零幅度數(shù)據(jù)相應(yīng)的符號數(shù)據(jù)中的未編碼的符號數(shù)據(jù)進(jìn)行編碼;以及(v)對數(shù)字?jǐn)?shù)據(jù)的各數(shù)字執(zhí)行步驟(iii)和(iv)。步驟(e)是將數(shù)字?jǐn)?shù)據(jù)表示為具有相同數(shù)目的比特的二進(jìn)制數(shù)據(jù),而數(shù)字都是比特。各編碼步驟是通過以預(yù)定個數(shù)的比特為單位組合組成相應(yīng)的幅度數(shù)據(jù)和符號數(shù)據(jù)的比特序列的各比特實現(xiàn)的。量化是通過下列步驟實現(xiàn)的將輸入的時域語音信號變換成頻域信號;將經(jīng)時/頻映射變換的信號組合成一些預(yù)定子頻帶的信號和計算每個子頻帶的掩蔽門限;以及量化每個預(yù)定編碼頻帶的信號,使得每個頻帶的量化噪聲都小于掩蔽門限。按照本發(fā)明的另一表現(xiàn)形態(tài),所提出的將語音信號編碼成具有預(yù)定數(shù)目的分層比特率的數(shù)據(jù)的可變規(guī)語音編碼裝置包括一個量化部,其作用是對輸入的語音信號進(jìn)行信號處理和按每個編碼頻帶進(jìn)行量化;一個比特構(gòu)組部,其作用是對與一個底層相應(yīng)的輔助信息和量化數(shù)據(jù)進(jìn)行編碼,對與這個底層的下一層相應(yīng)的輔助信息和量化數(shù)據(jù)進(jìn)行編碼,這樣依次對所有各層進(jìn)行編碼,從而產(chǎn)生相應(yīng)的比特流,其中比特構(gòu)組部通過用具有預(yù)定相同個數(shù)的比特的二進(jìn)制數(shù)據(jù)表示量化數(shù)據(jù)將它分割成一些由比特構(gòu)成的組,再用一種預(yù)定的編碼方法對比特分割的數(shù)據(jù)從最高有效比特序列到最低有效比特序列進(jìn)行編碼來實現(xiàn)編碼。在數(shù)字?jǐn)?shù)據(jù)包括符號數(shù)據(jù)和幅度數(shù)據(jù)時,比特構(gòu)組部對比特分割的數(shù)據(jù)中具有相同重要性(有效位)的比特的幅度數(shù)據(jù)進(jìn)行收集和編碼對符號數(shù)據(jù)中與非零幅度數(shù)據(jù)相應(yīng)的未編碼的符號數(shù)據(jù)進(jìn)行編碼,這樣的對幅度和符號數(shù)據(jù)的編碼都是從各MSB到較低有效比特依次進(jìn)行的。在比特構(gòu)組部按重要性對比特進(jìn)行收集和編碼時,編碼是通過以預(yù)定比特數(shù)為單位組合這些比特來實現(xiàn)的。此外,本發(fā)明還提出了一種對編碼成具有分層比特率的語音數(shù)據(jù)進(jìn)行解碼的可變規(guī)模語音解碼方法,這種方法包括下列步驟通過分析組成數(shù)據(jù)流的各比特的重要性,按照生成具有分層比特率的數(shù)據(jù)流中的各層的次序,從高位有效比特到低位有效比特對具有至少量化步驟信息和分配給每個頻帶的量化比特信息的輔助信息以及量化數(shù)據(jù)進(jìn)行解碼;將解碼得到的量化步長和量化數(shù)據(jù)恢復(fù)成具有原來幅值的信號;以及將解量化得到的信號變換成時域信號。解碼步驟中的數(shù)據(jù)都是比特,而數(shù)據(jù)流是比特流。按重要性解碼的步驟是以由預(yù)定個數(shù)的比特組成的向量為單位進(jìn)行的。在量化數(shù)據(jù)由符號數(shù)據(jù)和幅度數(shù)據(jù)組成時,解碼步驟包括下列步驟通過分析組成數(shù)據(jù)流的各比特的重要性,按照生成具有分層比特率的數(shù)據(jù)流中的各層的次序,從高位有效比特到低位有效比特對具有至少量化步長信息和分配給每個頻帶的量化比特信息的輔助信息以及量化數(shù)據(jù)進(jìn)行解碼;以及對量化數(shù)據(jù)的符號數(shù)據(jù)進(jìn)行解碼,將解碼得到的符號數(shù)據(jù)與解碼得到的幅度數(shù)據(jù)合并在一起。解碼步驟是用算術(shù)解碼或霍夫曼解碼實現(xiàn)的。相應(yīng),本發(fā)明提出了一種對編碼成具有分層比特率的語音數(shù)據(jù)進(jìn)行解碼的可變規(guī)模語音解碼裝置,這種裝置包括一個比特流分析部,其作用是通過分析組成比特流的各比特的重要性,按照生成分層比特流中的各層的次序,從高位有效比特到低位有效比特對具有至少量化步長位息和分配給每個頻帶的量化比特信息的輔助信息以及量化數(shù)據(jù)進(jìn)行解碼;一個量化部,其作用是將解碼得到的量化步長和量化數(shù)據(jù)恢復(fù)成具有原來幅度的信號;以及一個頻/時映射部,其作用是將解量化得到的信號變換成時域信號。本發(fā)明的以上目的和優(yōu)點通過以下結(jié)合附圖對本發(fā)明的優(yōu)選實施例的詳細(xì)說明就會更加清楚,在這些附圖中圖1為一個簡單的可變規(guī)模編碼/解碼裝置(codec)的方框圖;圖2為本發(fā)明所提出的編碼裝置的方框圖;圖3示出了本發(fā)明所提出的比特流結(jié)構(gòu)的示意圖;以及圖4為本發(fā)明所提出的解碼裝置的方框圖。下面將結(jié)合附圖詳細(xì)說明本發(fā)明的優(yōu)選實施例。圖2為本發(fā)明所提出的可變規(guī)模語音編碼裝置的方框圖,這個裝置包括量化部230和比特構(gòu)組部240。對輸入的語音信號進(jìn)行信號處理和按預(yù)定編碼頻帶進(jìn)行量化的量化部230包括時/頻映射部200、心理聲感部210和量化部220。時/頻映射部200將輸入的時域語音信號變換成頻域信號。人耳所感覺的信號特性差異在時域上并不很大。然而,按照人類心理聲學(xué)模型,對每個頻帶的感覺卻有很大的不同。因此,通過對于不同的頻帶分配不同的量化比特數(shù)可以增強壓縮效果。心理聲感部210將經(jīng)時/頻映射部200變換的信號用各預(yù)定子頻帶的信號組合,利用各信號之間相互作用所產(chǎn)生的掩蔽現(xiàn)象計算出每個子頻帶的掩蔽門限。量化部220量化每個預(yù)定編碼頻帶的信號,使得每個頻帶的量化噪聲都小于掩蔽門限。也就是說,對每個頻帶的各頻率信號進(jìn)行標(biāo)量量化,使得每個頻帶的量化噪聲都小于掩蔽門限而不能察覺。所執(zhí)行的是使在每個頻帶所產(chǎn)生的噪聲與由心理聲感部210計算得的掩蔽門限之比NMR(噪聲掩蔽比)小于或等于0dB的量化。NMR值小于或等于0dB意味著掩蔽門限高于量化噪聲。也就是說,聽不到量化噪聲。比特構(gòu)組部240對與具有最低比特率的底層相應(yīng)的輔助信息和量化數(shù)據(jù)進(jìn)行編碼,再對與底層的下一層相應(yīng)的輔助信息和量化數(shù)據(jù)進(jìn)行編碼,這樣對所有各層都執(zhí)行這個過程,從而產(chǎn)生相應(yīng)的比特流。對各層的量化數(shù)據(jù)和編碼是通過以下步驟實現(xiàn)的通過將每個量化數(shù)據(jù)表示為由預(yù)定相同個數(shù)的比特組成的二進(jìn)制數(shù)據(jù),將每個量化數(shù)據(jù)分割成一些比特組;以及用一種預(yù)定的編碼方法對比特分割的數(shù)據(jù)從最高有效比特序列到最低有效比特序列依次進(jìn)行編碼。在數(shù)字?jǐn)?shù)據(jù)包括符號數(shù)據(jù)和幅度數(shù)據(jù)的情況下,比特構(gòu)組部240收集比特分割的數(shù)據(jù)中具有相同重要性(即處在同一有效位)的比特的每個幅度數(shù)據(jù)加以編碼,然后對與已編碼的幅度數(shù)據(jù)中的非零幅度數(shù)據(jù)相應(yīng)的符號數(shù)據(jù)進(jìn)行編碼。這里,對符號數(shù)據(jù)和幅度數(shù)據(jù)的編碼過程都是從MSB到較低有效比特依次進(jìn)行的。下面將說明這種編碼裝置的工作情況。輸入語音信號受到編碼形成相應(yīng)的比特流。為此,在時/頻映射部200用MDCT(改進(jìn)的離散余弦變換)或子頻帶濾波將輸入信號變換成頻哉信號。心理聲感部210用一些適當(dāng)?shù)淖宇l帶組合頻率信號,得出掩蔽門限。子頻帶主要用于量化,因此稱為量化頻帶。量化部220執(zhí)行標(biāo)量量化,使得每個量化頻帶的量化噪聲幅度小于掩蔽門限,這樣的噪聲雖然是可聞的,但由于掩蔽現(xiàn)象而感覺不到。如果執(zhí)行滿足這樣條件的量化,那么就對于各頻帶就分別產(chǎn)生相應(yīng)的量化步長值和量化頻率值。就人類心理聲學(xué)來說,在較低的頻率可以容易感覺出接近的頻率分量的差異。然而,隨著頻率的增加,可感覺的頻率差異間隔越來越大。如表1所示,較低頻率的量化頻帶具有較窄的帶寬,而較高頻率的量化頻帶具有較寬的帶寬。表1</tables>然而,為了便于編碼,對于編碼來說,并不用表1中所示的量化頻帶,而是用帶寬與量化頻帶接近的編碼頻帶。換句話說,如表1所示,對于比較窄的帶寬,幾個量化頻帶合成一個編碼頻帶,而對于比較寬的帶寬,一個量化頻帶就構(gòu)成一個編碼頻帶。因此,所有編碼頻帶控制成具有差不多的帶寬。1.取決于數(shù)據(jù)重要性的編碼各量化值的符號分別存儲,而絕對值就是取為表示成正值的數(shù)據(jù)。在每個編碼頻帶的各量化頻率值中,搜索出一個具有最大絕對值的值,從而確定表示每個頻帶中的信號所需的相應(yīng)量化比特數(shù)。通常,一個1比特的MSB(最高有效比特)的重要性遠(yuǎn)大于一個1比特的LSB(最低有效比特)。然而,按照傳統(tǒng)的方法,編碼并不考慮這重要性。因此,如果只使用整個比特流中的前面那部分,那么前面這部分包含了大量重要性不如包含在沒有使用的后面那部分中的信息。由于上述原因,在本發(fā)明中,對各頻帶的量化信號從各MSB到LSB依次進(jìn)行編碼。也就是說,各量化信號用二進(jìn)制記數(shù)表示,而各頻率分量的量化值以比特組為單位從低頻分量到高頻分量依次處理。首先,得到各頻率分量的MSB,然后退一比特對次高有效比特編碼,直至LSB。這樣,最重要的信息首先編碼,安排在所產(chǎn)生的比特流的前部。假設(shè)8個用二進(jìn)制記數(shù)各由4個比特表示的量化值如下LSBMSB0100111000201013001040000510006000070100按傳統(tǒng)方法,首先對最低頻率分量的1001編碼,然后對1000、0101、0010依次編碼(也就是橫向?qū)γ總€頻率分量依次編碼)。然而,按照本發(fā)明,最低頻率分量MSB的1和其他頻率分量MSB的0,1,0,0,…依次組合成比特組加以處理。例如,在以4個比特為單位編碼的情況下,就先對1010編碼,再對0000編碼。如果各MSB都已編碼,就取各次高有效比特值0001,0000,依次直至各LSB加以編碼。這里,編碼方法可以是無損編碼,例如霍夫曼編碼或算術(shù)編碼等。2.包括符號比特的編碼通常符號比特是MSB。因此,在從MSB起進(jìn)行編碼時,符號比特就看作最重要的信息加以編碼。在這種情況下,可能會出現(xiàn)低效編碼。也就是說,由于從MSB到次高比特量化為1的值認(rèn)為是零,因此相應(yīng)的符號值是沒有意義的。例如,如果一個量化值用5個比特表示為00011,而在編碼中只用3個高位比特,那么這個量化值就恢復(fù)為00000。因此,即使這個值有一個符號比特,這個信息也是沒有用的。然而,要用到5個比特中的4個比特,這個量化值成為00010。因此,這個符值就很有意義了,因為在高位比特中首次出現(xiàn)的1這個值意味著這個量化值解碼后是一個不為零的值。在從各MSB起表示各頻率分量中,如果首次碰到的是1而不是0,就在其他值編碼前先對這個符號值編碼,決定符號值是正還是負(fù)。例如,在對MSB編碼中,首先對1010編碼,然后確定是否需要對符號比特編碼。此時,由于在第一和第三頻率分量中的非零值首先編了碼,因此依次對這兩個分量的符號比特進(jìn)行編碼,然后再對0000編碼。為了對各LSB編碼,對1100編碼后,確定是否需要對符號比特編碼。在這個情況下,由于這兩個1中的第一個1相應(yīng)的頻率分量的符號比特已經(jīng)在MSB出現(xiàn)1時編了碼,因此不需要編碼。然而這兩個1中的第二個1相應(yīng)的頻率分量在高位沒有出現(xiàn)過1,因此需要對符號比特編碼。這個符號比特編碼后,再對LSB的0100進(jìn)行編碼。3.改進(jìn)的編碼方法在應(yīng)用上述編碼方法中,在低比特率的情況下,象下面那樣改變編碼次序就更為有效。通常,人類的聽覺系統(tǒng)對頻率分量的分布情況非常敏感,無論是正的還是負(fù)的。在這里所提出的編碼方法中,只是對符號比特尚未編碼、要恢復(fù)為零的那些頻率分量進(jìn)行編碼,而推遲對符號比特編了碼的那些頻率分量的編碼。在以這種方式完成了符號編碼后,再用上面所述的編碼方法對推遲的數(shù)據(jù)進(jìn)行編碼。這種編碼方法將用前面所列舉的例子詳細(xì)說明如下。首先,由于MSB中沒有一個頻率分量是具有一個已編碼的符號比特,因此這些MSB全部加以編碼。接著的高位有效比特是0001,0000,…。其中,對于0001,第一個的0和第三個的0不用編碼,因為它們的符號比特已在MSB中編了碼,于是對第二和第四比特的0和1編碼。這里,由于在高位比特中沒有1,因此對第四比特1的頻率分量的符號比特編碼。對于0000,由于在高位比特中沒有已編碼的符號比特,這四個比特全加以編碼。以這種方式,對符號比特編碼直至各個LSB,然后再對剩下的未編碼信息用前面所述的編碼方法從高位有效比特起依次進(jìn)行編碼。4.可變規(guī)模比特流格式在本發(fā)明中,語音信號被編碼成由一個底層和幾個增強層組成的分層比特流。底層具有最低的比特率,而各增強層具有比底層高的比特率。越高的增強層,比特率也越高。在底層的前部表示的只是各個MSB,因此只是編了碼的所有各頻率分量分布概況。隨著在較低比特中表示的比特的增多,所表現(xiàn)的信息越來越詳細(xì)。由于是按照比特率增加的次序,也就是說隨著層的增強對更詳細(xì)的信息數(shù)據(jù)值編碼的,因此可以從更高的層得到更高的語音質(zhì)量。下面將說明格式化使用這種所示數(shù)據(jù)的可變規(guī)模比特流的方法。首先,在底層需要用到的輔助信息中,對每個量化頻帶的量化比特信息編碼。各量化值的信息從各MSB到LSB、從低頻分量到高頻分量依次編碼。如果某個頻帶的量化比特少于當(dāng)前正在加以編碼的頻帶的比特,就不予編碼。在頻帶的比特等于當(dāng)前正在加以編碼的頻帶的比特時,就予以編碼。這里,如果在對各層的信號編碼中沒有頻帶限制,那么就會產(chǎn)生刺耳的聲音。這是因為在不考慮頻帶從MSB到LSB進(jìn)行編碼的情況下,在恢復(fù)低比特率層信號時信號出現(xiàn)反復(fù)通斷。因此,最好按照比特率適當(dāng)限制頻帶。底層編碼后,就對下一個增強層的輔助信息和語音數(shù)據(jù)量化值進(jìn)行編碼。以這種方式對所有各層的數(shù)據(jù)進(jìn)行編碼。這樣編碼的信息集在一起,形成相應(yīng)的比特流。如上所述,用這種編碼裝置形成的比特流具有一種分層結(jié)構(gòu),較低比特率層的比特流包含在較高比特率層的比特流中,如圖3所示。傳統(tǒng)上,輔助信息首先編碼后對剩下的信息進(jìn)行編碼形成比特流。然而在本發(fā)明中,如圖3所示,每一層的輔助信息分開編碼。而且,傳統(tǒng)上所有的量化數(shù)據(jù)的樣點值為單位依次編碼,而在本發(fā)明中,量化數(shù)據(jù)用二進(jìn)制數(shù)據(jù)表示,在比特量限額內(nèi)從二進(jìn)制數(shù)據(jù)的MSB起加以編碼,形成相應(yīng)的比特流。下面將更為詳細(xì)地說明這種編碼裝置的工作情況。在本發(fā)明中,在一個具有如圖3所示的分層結(jié)構(gòu)的比特流內(nèi)列有從較重要的信號分量起對各層這些比特率的信息編碼得到的信息。利用這樣形成的比特流,可以根據(jù)用戶的請求或者按照傳輸信道的狀態(tài)通過簡單地重新排列包含在具有最高比特率的比特流中的低比特率比特流形成具有低比特率的比特流。也就是說,編碼裝置實時形成的比特流或存儲在媒體內(nèi)的比特流可以根據(jù)用戶的請求重新排列成適合所要求的比特率進(jìn)行發(fā)送。此外,如果用戶的硬件性能欠佳或者用戶希望解碼器不很復(fù)雜,那么即使是適當(dāng)?shù)谋忍亓鳎部梢灾换謴?fù)其中部分比特流,從而滿足了用戶的需要。例如,在形成一個可變規(guī)模比特流中,底層比特率為16Kbps,頂層比特率為64Kbps,而各增強層的比特率間隔為8Kbps,也就是說這個比特流具有比特率為16、24、32、40、48、56和64Kbps這七層。由于編碼裝置形成的比特流具有圖3所示的分層結(jié)構(gòu),因此頂層64Kbps的比特流含有各增強層(16、24、32、40、48、56和64Kbps)的相應(yīng)比特流。如果用戶請求的是頂層數(shù)據(jù),那么就發(fā)送頂層的比特流,不需要作任何處理。而如果用戶請求的是底層(16Kbps)數(shù)據(jù),那么只要發(fā)送前面的比特流就可以了。各層按相應(yīng)的比特率具有不同的有限帶寬,如表2所示,最終的量化頻帶是不同的。輸入數(shù)據(jù)是以48KHz采樣的PCM數(shù)據(jù),一個幀的幅度是1024。對于比特率為64Kbps的情況,一個幀的可用比特數(shù)平均為1365.333(=64000bit/s*(1024/48000))。表2類似,可以按照各比特率計算出一個幀可用的比特數(shù),如表3所示。表3量化前,利用心理聲學(xué)模型,首先根據(jù)輸入數(shù)據(jù)產(chǎn)生當(dāng)前正在處理的幀的塊類型(是長塊、起始塊、短塊還是終止塊)、各處理頻帶的相應(yīng)SMR值、短塊的劃分信息和與心理聲學(xué)模型時/頻同步的受時間延遲的PCM數(shù)據(jù),送至?xí)r/頻映射部。用ISO/IEC11172-3的模型2來計算心理聲學(xué)模型。時/頻映射部按照應(yīng)用心理聲學(xué)模型輸出的塊類型利用MDCT將時域數(shù)據(jù)變換成頻域數(shù)據(jù)。此時,在長/起始/終止塊的情況下塊長度為2048,而在短塊的情況下塊長度為256,MDCT執(zhí)行8次。上面使用的是與在傳統(tǒng)的MPEG-2NBC[13]中所用的相同的過程。變換成頻域的數(shù)據(jù)用一個增加的步長進(jìn)行量化,使得表1所示的量化頻帶的SNR值小于心理聲學(xué)模型的輸出值SMR。這里,執(zhí)行的是標(biāo)量量化,基本的量化步長為21/4。所執(zhí)行的量化使NMR等于或小于0dB。這里,所得到的輸出是各處理頻帶的相應(yīng)量化步長的信息。為了對量化信號編碼,搜索各編碼頻帶的量化信號相應(yīng)最大絕對值,然后計算編碼所需的最大量化比特。對于比特流的同步信號來說,通過在比特流前加12個比特,以產(chǎn)生比特流開始的信息。然后對所有比特流的幅值編碼。對編碼比特流中最高比特率的比特流的信息進(jìn)行編碼。這信息用來產(chǎn)生較低比特率的比特流。在請求的是較高比特率時,可以不同發(fā)送另外的比特。接著,需要對塊類型編碼。以下的編碼過程可以稍有不同,這取決于塊的類型。為進(jìn)對一個幀的輸入信號編碼,按照信號的特征,可以變換一個長塊,也可以變換八個短塊。由于塊的長度這樣改變,編碼也就稍有不同。首先,在長塊的情況下,由于底層的帶寬是4KHz,因此處理的頻帶一直包括到第12量化頻帶?,F(xiàn)在從分配給每個編碼頻帶的比特信息得出最大量化比特值,用前面所述的編碼方法從最大量化比特值起加以編碼。然后,對接著的這些量化比特依次編碼。如果某個頻帶的量化比特少于當(dāng)前正加以編碼的頻帶的比特,就不予編碼。在頻帶的量化比特等于當(dāng)前正在加以編碼的頻帶的比特時,就加以編碼。在首次對一個頻帶編碼時,對這個量化頻帶的量化步長信息進(jìn)行編碼,再對與各量化頻率分量的量化比特相應(yīng)的值進(jìn)行采樣后進(jìn)行編碼。由于底層的比特率為16Kbps,全部比特限額為336比特。因此,不斷計算所用的總比特量,一旦比特量超過336,立即終止編碼。為了對量化比特或量化步長信息編碼,求得量化比特或量化步長的最小值和最大值,再求得這兩個值之差,從而得到所需的比特數(shù)。在實際中,對輔助信息編碼前,表示各比特所需的最小值和幅度首先用算術(shù)編碼加以編碼,存入比特流。在以后真正進(jìn)行編碼時,對最小值與輔助信息之差編碼。然后,對接著的各量化信號依次編碼。類似,通過劃分一個長塊而形成的8個長度為長塊的1/8的短塊經(jīng)過時/頻映射和量化,對所得到的量化數(shù)據(jù)進(jìn)行無損編碼。這里,量化并不是對8個子塊各個分開進(jìn)行的。而是,利用心理聲感部發(fā)出的8塊為3段的信息,收集這些段中的各量化頻帶(如表2所示),象長塊中的一個頻帶那樣進(jìn)行處理。因此,可以得到這三段中的每個頻帶的量化步長信息。為了使底層的帶寬與長塊情況下一致,頻帶限制為在1/4以內(nèi)的這些頻帶。由于短塊具有8個子塊,如表2所示,因此每個子塊以4個樣點為單位劃分成一些編碼頻帶。8個子塊的這些編碼頻帶加以組合,從32個量化信號中得出量化比特信息。首先,對限用頻帶內(nèi)的量化比特信息編碼。然后,得出頻帶限制分量中的最大量化比特,象在長塊中那樣用上述編碼方法進(jìn)行編碼。如果某個頻帶的量化比特小于當(dāng)前正加以編碼的,就不予編碼。如果某個頻帶的量化比特成為等于當(dāng)前正加以編碼的,就加以編碼。在對一個頻帶編碼時,首先對這個量化頻帶的量化步長信息編碼,然后對量化頻率分量中與這些量化比特相應(yīng)的值進(jìn)行采樣,加以編碼。表4形成底層(16Kbps)的全部比特流后,就形成下一層(24Kbps)的比特流。由于這層的帶寬為8KHz,因此需要對第19頻帶以內(nèi)的各頻率分量編碼。由于第12頻帶以內(nèi)的輔助信息已經(jīng)記錄,因此只需記錄第13頻帶至第19頻帶的輔助信息。在底層中,通過將每個頻帶的尚未編碼的各量化比特與一個新增加的頻帶的各量化比特進(jìn)行比較,得到相應(yīng)的最大量化比特。以與底層中所用的相同方式從最大量化比特起依次進(jìn)行編碼。當(dāng)所用的總比特量大于在24Kbps可用的比特量時,立即終止編碼,準(zhǔn)備形成下一層比特流。以這種方式就可以相繼形成其余各層32、40、48、56和64Kbps的比特流。這樣形成的比特流具有與如圖3所示相同的結(jié)構(gòu)。下面將詳細(xì)說明一種對這種編碼裝置所產(chǎn)生的比特流進(jìn)行解碼的解碼裝置。圖4為這種解碼裝置的方框圖,這種解碼裝置包括比特流分析部400、能量化部410和頻/時映射部420。比特流分析部400通過分析組成比特流的各比特的重要性,按照產(chǎn)生具有分層結(jié)構(gòu)的比特流的次序,從最高有效比特到最低有效比特對各層的至少具有量化比特和量化步長的輔助信息以及量化數(shù)據(jù)進(jìn)行解碼。解量化部410將解碼得到的量化步長和量化數(shù)據(jù)恢復(fù)成具有原來幅度的信號。頻/時映射部420將解量化得到的信號變換成時域信號,供用戶復(fù)現(xiàn)。下面將說明這種解碼器的工作情況。對由編碼裝置產(chǎn)生的這樣的比特流的解碼次序與編碼次序相反。解碼過程簡述如下。首先,對底層輔助信息中的每個量化頻帶的量化比特信息解碼。在解碼得到的這些量化比特中,求得最大值。然后象在編碼過程中那樣,對各量化值從各MSB到LSB和從低頻分量到高頻分量依次進(jìn)行解碼。如果某個頻帶的量化比特小于當(dāng)前正加以解碼的,就不予解碼。而如果某個頻帶的量化比特成為等于當(dāng)前正加以解碼的,就加以解碼。在對量化值解碼期間首先對某個量化頻帶的信號解碼時,由于這個量化頻帶的步長信息存儲在比特流中,因此首先對這信息解碼,然后再繼續(xù)對與量化比特相應(yīng)的這些值解碼在完成對底層比特流的解碼后,對下一層的輔助信息和語音數(shù)據(jù)的量化值進(jìn)行解碼。以這種方式,可以對所有各層的數(shù)據(jù)進(jìn)行解碼。以與編碼相反的次序,解碼過程得到的經(jīng)量化的數(shù)據(jù)通過圖4中所示的解量化部410和頻/時映射部420恢復(fù)成為原來的信號。如上所述,按照本發(fā)明,為了滿足各種用戶請求,可以形成靈活的比特流。也就是說,按照用戶的請求,可以將各層這些比特率的信息合并在一個比特流中而沒有交疊冗余,從而提供具有良好語音質(zhì)量的比特流。而且在傳輸終端和接收終端之間不需要用變換器。此外,任何傳輸信道狀態(tài)和各種用戶請求都能適應(yīng)。由于比特流是可變規(guī)模的,因此一個比特流可以含有具有幾個比特率的不同比特流。這樣,很簡單就可以產(chǎn)生各層的比特流。而且,在本發(fā)明中,一旦執(zhí)行了使得NMR小于或等于0dB的量化后,就不再需要比特控制器。因此,編碼裝置并不復(fù)雜。而且,由于編碼是按量化比特的重要性進(jìn)行的,而不是對每一層先處理上一層的量化信號與原信號之差再進(jìn)行編碼,從而減小了編碼裝置的復(fù)雜程度。此外,由于各頻帶的輔助信息在整個比特流始終只使用一次,因此可以改善語音質(zhì)量。如果降低比特率,由于限用頻帶,因此大大減小了主要導(dǎo)致復(fù)雜的編碼和解碼的濾波器的復(fù)雜程度。這樣也就減小了編碼和解碼裝置的復(fù)雜程度。此外,還可以按照用戶解碼器的性能和傳輸信道的帶寬/擁塞情況或者根據(jù)用戶請求控制比特率或設(shè)備的復(fù)雜程度。權(quán)利要求1.一種將語音信號編碼成一個具有一個底層和數(shù)目預(yù)定的增強層的分層數(shù)據(jù)流的可變規(guī)模語音編碼方法,所述方法包括下列步驟(a)對輸入的語音信號進(jìn)行信號處理和按每個預(yù)定編碼頻帶進(jìn)行量化;(b)在預(yù)定的層規(guī)模內(nèi)對與底層相應(yīng)的量化數(shù)據(jù)進(jìn)行編碼;(c)在預(yù)定的層規(guī)模內(nèi)對與已編碼底層的下一個增強層相應(yīng)的量化數(shù)據(jù)和屬于已編碼層而尚未編碼的剩下的量化數(shù)據(jù)進(jìn)行編碼;以及(d)相繼對所有各層執(zhí)行編碼步驟,其中步驟(b)、(c)和(d)各包括下列步驟(e)用預(yù)定的相同數(shù)目的數(shù)字表示與一個需編碼的層相應(yīng)的量化數(shù)據(jù);以及(f)對由組成所表示的數(shù)字?jǐn)?shù)據(jù)的幅度數(shù)據(jù)的最高有效數(shù)字組成的最高有效數(shù)字序列進(jìn)行編碼。2.按權(quán)利要求1所述的可變規(guī)模語音編碼方法,其中所述步驟(e)和(f)是從低頻率到高頻率依次執(zhí)行的。3.按權(quán)利要求1所述的可變規(guī)模語音編碼方法,其中所述編碼步驟(b)、(c)和(d)是用一種預(yù)定的編碼方法對具有至少量化步長信息和分配給每個頻帶的量化比特信息的輔助信息以及量化數(shù)據(jù)執(zhí)行的。4.按權(quán)利要求1或3所述的可變規(guī)模語音編碼方法,其中所述步驟(e)和(f)中的數(shù)字都是比特。5.按權(quán)利要求4所述的可變規(guī)模語音編碼方法,其中所述步驟(f)中的編碼是通過以預(yù)定個數(shù)的比特為單位組合組成比特序列的各比特實現(xiàn)的。6.按權(quán)利要求4所述的可變規(guī)模語音編碼方法,其中所述預(yù)定編碼方法是無損編碼。7.按權(quán)利要求5所述的可變規(guī)模語音編碼方法,其中所述預(yù)定編碼方法是無損編碼。8.按權(quán)利要求6或7所述的可變規(guī)模語音編碼方法,其中所述無損編碼是霍夫曼編碼。9.按權(quán)利要求6或7所述的可變規(guī)模語音編碼方法,其中所述無損編碼是算術(shù)編碼。10.按權(quán)利要求1所述的可變規(guī)模語音編碼方法,其中所述量化數(shù)據(jù)由符號數(shù)據(jù)和幅度數(shù)據(jù)組成時,步驟(f)包括下列步驟(i)用一種預(yù)定的編碼方法對由組成所表示的數(shù)字?jǐn)?shù)據(jù)的幅度數(shù)據(jù)的最高有效數(shù)字組成的最高有效數(shù)字序列進(jìn)行編碼;(ii)對與已編碼的最高有效數(shù)字序列中的非零數(shù)據(jù)相應(yīng)的符號數(shù)據(jù)進(jìn)行編碼;(iii)用一種預(yù)定的編碼方法對數(shù)字?jǐn)?shù)據(jù)的未編碼的幅度數(shù)據(jù)中的最高有效數(shù)字序列進(jìn)行編碼;(iv)對與在步驟(iii)中編碼的數(shù)字序列中的非零幅度數(shù)據(jù)相應(yīng)的符號數(shù)據(jù)中的未編碼的符號數(shù)據(jù)進(jìn)行編碼;以及(v)對數(shù)字?jǐn)?shù)據(jù)的各數(shù)字執(zhí)行步驟(iii)和(iv)。11.按權(quán)利要求10所述的可變規(guī)模語音編碼方法,其中所述步驟(e)是將數(shù)字?jǐn)?shù)據(jù)表示為具有相同個數(shù)的比特的二進(jìn)制數(shù)據(jù),而數(shù)字都是比特。12.按權(quán)利要求10所述的可變規(guī)模語音編碼方法,其中所述編碼步驟是通過以預(yù)定個數(shù)的比特為單位組合組成相應(yīng)的幅度數(shù)據(jù)和符號數(shù)據(jù)的比特序列的各比特實現(xiàn)的。13.按權(quán)利要求11或12所述的可變規(guī)模語音編碼方法,其中所述預(yù)定編碼方法是算術(shù)編碼。14.按權(quán)利要求10所述的可變規(guī)模語音編碼方法,其中所述編碼步驟(b)、(c)和(d)是用一種預(yù)定的編碼方法對具有至少量化步長信息和分配給每個頻帶的量化比特信息的輔助信息以及量化數(shù)據(jù)執(zhí)行的。15.按權(quán)利要求1或10所述的可變規(guī)模語音編碼方法,其中所述量化通過下列步驟實現(xiàn)將輸入的時域語音信號變換成頻域信號;將經(jīng)時/頻映射變換的信號組合成一些預(yù)定子頻帶的信號,并計算出每個子頻帶的掩蔽門限;以及量化每個預(yù)定編碼頻帶的信號,使得每個頻帶的量化噪聲都小于掩蔽門限。16.一種將語音信號編碼成具有預(yù)定數(shù)目的分層比特率的數(shù)據(jù)的可變規(guī)模語音編碼裝置,所述裝置包括一個量化部,其作用是對輸入的語音信號進(jìn)行信號處理和按每個編碼頻帶進(jìn)行量化;以及一個比特構(gòu)組部,其作用是對與一個底層相應(yīng)的輔助信息和量化數(shù)據(jù)進(jìn)行編碼,對與這個底層的下一層相應(yīng)的輔助信息和量化數(shù)據(jù)進(jìn)行編碼,這樣依次對所有各層進(jìn)行編碼,從而產(chǎn)生相應(yīng)的比特流,所述比特構(gòu)組部通過用具有預(yù)定相同個數(shù)的比特的二進(jìn)制數(shù)據(jù)表示量化數(shù)據(jù),將它分割成一些由比特構(gòu)成的組,再用一種預(yù)定的編碼方法對比特分割的數(shù)據(jù)從最高有效比特序列到最低有效比特序列進(jìn)行編碼來實現(xiàn)編碼。17.按權(quán)利要求16所述的可變規(guī)模語音編碼裝置,其中所述比特構(gòu)組部在數(shù)字?jǐn)?shù)據(jù)由符號數(shù)據(jù)和幅度數(shù)據(jù)組成時,對比特分割的數(shù)據(jù)中具有相同重要性的比特的幅度數(shù)據(jù)進(jìn)行編碼,對符號數(shù)據(jù)中與非零幅度數(shù)據(jù)相應(yīng)的未編碼的符號數(shù)據(jù)進(jìn)行編碼,這樣的對幅度數(shù)據(jù)和符號數(shù)據(jù)的編碼都是從各MSB到較低有效比特依次進(jìn)行的。18.按權(quán)利要求16或17所述的可變規(guī)模語音編碼裝置,其中所述比特構(gòu)組部在按重要性對各比特進(jìn)行收集和編碼時是通過以預(yù)定個數(shù)的比特為單位組合這些比特進(jìn)行編碼的。19.按權(quán)利要求16或17所述的可變規(guī)模語音編碼裝置,其中所述比特構(gòu)組部用霍夫曼編碼或算述編碼進(jìn)行編碼。20.按權(quán)利要求16或17所述的可變規(guī)模語音編碼裝置,其中所述比特構(gòu)組部從低頻分量到高頻分量依次進(jìn)行編碼。21.按權(quán)利要求16或17所述的可變規(guī)模語音編碼裝置,其中所述量化部包括一個時/頻映射部,其作用是將輸入的時域語音信號變換成頻域信號;一個心理聲感部,其作用是將經(jīng)時/頻映射變換的信號組合成一些預(yù)定子頻帶的信號,并計算出每個子頻帶的掩蔽門限;以及一個量化部,其作用是量化每個預(yù)定編碼頻帶的信號,使得每個頻帶的量化噪聲都小于掩蔽門限。22.一種對編碼成具有分層比特率的語音數(shù)據(jù)進(jìn)行解碼的可變規(guī)模語音解碼方法,所述方法包括下列步驟通過分析組成數(shù)據(jù)流的各比特的重要性,按照生成具有分層比特率的數(shù)據(jù)流中的各層的次序,從高位有效比特到低位有效比特對具有至少量化步長信息和分配給每個頻帶的量化比特信息的輔助信息以及量化數(shù)據(jù)進(jìn)行解碼;將解碼得到的量化步長和量化數(shù)據(jù)恢復(fù)成具有原來幅值的信號;以及將解量化得到的信號變換成時域信號。23.按權(quán)利要求22所述的可變規(guī)模語音解碼方法,其中所述解碼步驟中的數(shù)據(jù)都是比特,而數(shù)據(jù)流是比特流。24.按權(quán)利要求23所述的可變規(guī)模語音解碼方法,其中所述按重要性解碼的步驟是以由預(yù)定個數(shù)的比特組成的向量為單位進(jìn)行的。25.按權(quán)利要求23或24所述的可變規(guī)模語音解碼方法,其中所述解碼步驟在量化數(shù)據(jù)由符號數(shù)據(jù)和幅度數(shù)據(jù)組成時包括下列步驟通過分析組成數(shù)據(jù)流的各比特的重要性,按照生成具有分層比特率的數(shù)據(jù)流中的各層的次序,從高位有效比特到低位有效比特對具有至少量化步長信息和分配給每個頻帶的量化比特信息的輔助信息以及量化數(shù)據(jù)進(jìn)行解碼;以及對量化數(shù)據(jù)的符號數(shù)據(jù)進(jìn)行解碼,將解碼得到的符號數(shù)據(jù)與解碼得到的相應(yīng)幅度數(shù)據(jù)合并在一起。26.按權(quán)利要求23所述的可變規(guī)模語音解碼方法,其中所述解碼步驟用算術(shù)解碼實現(xiàn)。27.按權(quán)利要求23所述的可變規(guī)模語音解碼方法,其中所述解碼步驟用霍夫曼解碼實現(xiàn)。28.一種對編碼成具有分層比特率的語音數(shù)據(jù)進(jìn)行解碼的可變規(guī)模語音解碼裝置,所述裝置包括一個比特流分析部,其作用是通過分析組成比特流的各比特的重要性,按照生成分層比特流中的各層的次序,從高位有效比特到低位有效比特對具有至少量化步長信息和分配給每個頻帶的量化比特信息的輔助信息以及量化數(shù)據(jù)進(jìn)行解碼;一個解量化部,其作用是將解碼得到的量化步長和量化數(shù)據(jù)恢復(fù)成具有原來幅度的信號;以及一個頻/時映射部,其作用是將解量化得到的信號變換成時域信號。全文摘要本發(fā)明提出了一種可變規(guī)模語音編碼/解碼方法和裝置。所提出的編碼方法包括下列步驟:(a)對輸入語音信號進(jìn)行信號處理和按每個預(yù)定編碼頻帶量化;(b)在預(yù)定層規(guī)模內(nèi)對與底層相應(yīng)的量化數(shù)據(jù)編碼;(c)在預(yù)定層規(guī)模內(nèi)對與已編碼底層的下一增強層相應(yīng)的量化數(shù)據(jù)和屬于已編碼層但尚未編碼的剩下的量化數(shù)據(jù)編碼;以及(d)相繼對所有各層執(zhí)行層編碼步驟。文檔編號G10L19/14GK1196611SQ97123480公開日1998年10月21日申請日期1997年12月30日優(yōu)先權(quán)日1997年4月2日發(fā)明者樸成熙申請人:三星電子株式會社