欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

音頻信號(hào)編碼裝置、解碼裝置及音頻信號(hào)編碼、解碼裝置的制作方法

文檔序號(hào):2820813閱讀:427來源:國知局
專利名稱:音頻信號(hào)編碼裝置、解碼裝置及音頻信號(hào)編碼、解碼裝置的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及音頻信號(hào)編碼裝置、音頻信號(hào)解碼裝置以及音頻信號(hào)編碼·解碼裝置,特別涉及高效率編碼裝置,該裝置使用通過正交變換等方式將由諸如聲音信號(hào)和音樂信號(hào)等音頻信號(hào)獲得的特征量特別是音頻信號(hào)由時(shí)域變換至頻域所獲得的信號(hào),并且將該變換后的信號(hào)與原音頻信號(hào)相比較以使用盡可能少的代碼串表示該音頻信號(hào),還特別涉及使用作為編碼后信號(hào)的全部編碼代碼串或只使用其中一部分編碼代碼串解碼出高質(zhì)量寬頻帶的音頻信號(hào)的解碼裝置。
目前已經(jīng)有了許多種對音頻信號(hào)進(jìn)行高效率編碼和解碼用的技術(shù)解決方案。在對諸如音樂信號(hào)等、頻帶為20kHz以上的音頻信號(hào)進(jìn)行壓縮編碼的方式中,包括MPEG音頻處理方式和Twin VQ(TC-WVQ)處理方式等。以MPEG方式為代表的編碼方式是一種采用余弦變換等正交變換,將時(shí)間軸的數(shù)字音頻信號(hào)變換為頻率軸的數(shù)據(jù)并利用人類聽覺敏感度特性對聽覺重要的信息進(jìn)行編碼的方式,而對聽覺不重要的信息和冗余的信息不進(jìn)行編碼的方式。另一方面,Twin VQ(TC-WVQ)方式是一種擬通過矢量量化方式使用相對于原音頻信號(hào)的信息量相當(dāng)少的信息量表示的編碼方式。關(guān)于MPEG音頻處理方式和Twin VQ(TC-WVQ)方式的具體技術(shù)內(nèi)容可分別參見ISO/IEC標(biāo)準(zhǔn)IS-11172-3,以及T.Moriya,H.SugaAn 8 Kbits transform coder fornoisy channels,Proc.ICASSP 89,pp196-199。
下面參考

圖10,對一般性的Twin VQ方式進(jìn)行概要性的說明。
將原音頻信號(hào)101輸入至解析長度判定器102,并計(jì)算出解析長度。與此同時(shí),解析長度判定器102對解析長度112量化,并輸出解析長度代碼串111。然后時(shí)間頻率變換器103根據(jù)這一解析長度112,將原音頻信號(hào)101變換為頻域中的原音頻信號(hào)104。頻域中的原音頻信號(hào)104由正規(guī)化處理器(平整處理器)106進(jìn)行正規(guī)化處理(平整處理),以獲得正規(guī)化處理后的音頻信號(hào)108。這種正規(guī)化處理可以通過由頻域中的原音頻信號(hào)104中計(jì)算出頻率概形信號(hào)105,并使用所求出的頻率概形信號(hào)105去除原音頻信號(hào)104進(jìn)行。而且正規(guī)化處理器106還對正規(guī)化處理時(shí)使用的頻率概形信號(hào)量化,并輸出正規(guī)化代碼串107。然后由矢量量化器109對正規(guī)化處理后的音頻信號(hào)108量化,獲得代碼串110。
近年來,出現(xiàn)了具有即使使用輸入至解碼器的代碼串的一部分也能再生音頻信號(hào)的結(jié)構(gòu)。把所述的這種結(jié)構(gòu)稱為標(biāo)量型結(jié)構(gòu),把為了實(shí)現(xiàn)這種標(biāo)量結(jié)構(gòu)而進(jìn)行的編碼,稱為可縮放編碼(スケ-ラブルコ-ディ)。
圖11為表示采用Twin VQ方式的固定型可縮放編碼的一個(gè)實(shí)例的圖。
根據(jù)由解析長度判定器1303從原音頻信號(hào)1301判斷出的解析長度1314,利用時(shí)間頻率變換器1302便可以獲得頻域中的原音頻信號(hào)1304。然后在將頻域中的原音頻信號(hào)1304輸入至低頻頻帶編碼器1305時(shí),由低頻頻帶編碼器1305輸出量化誤差1306和低頻頻帶代碼串1311。再將這一量化誤差1306輸入至中頻頻帶編碼器1307,由后者輸出量化誤差1308和中頻頻帶代碼串1312。當(dāng)這一量化誤差1308被輸入至高頻頻帶編碼器1309時(shí),高頻頻帶編碼器1309又將輸出量化誤差1310和高頻頻帶代碼串1313。在此,所述低頻頻帶編碼器、中頻頻帶編碼器、高頻頻帶編碼器,均具有正規(guī)化處理器和矢量量化器,它們的輸出分別為低頻頻帶編碼代碼串、中頻頻帶編碼代碼串、高頻頻帶編碼代碼串,而且其中包含有量化誤差和由正規(guī)化處理器和由矢量量化器輸出的各代碼串。
原有方式中的固定可縮放編碼如圖11所示,因?yàn)榈皖l頻帶、中頻頻帶、高頻頻帶等各頻帶量化器均是按固定方式設(shè)置的,所以如圖12所示,難以按相對于原音頻信號(hào)的分布而使量化誤差盡可能少的方式進(jìn)行編碼。因此存在有在對于具有各種各樣性質(zhì)和分布的音頻信號(hào)進(jìn)行編碼時(shí),不能發(fā)揮出良好的性能,從而難以實(shí)現(xiàn)高音質(zhì)、高效率的可縮放編碼的問題。
本發(fā)明就是為了解決上述問題而提出的,本發(fā)明在對各種各樣的音頻信號(hào)進(jìn)行編碼時(shí),如圖13所示,通過采用與各種各樣的音頻信號(hào)相對應(yīng)的可縮放編碼的方式,從而提供出一種可以高效率、低比特率和高質(zhì)量地進(jìn)行編碼的音頻信號(hào)編碼裝置、相應(yīng)的音頻信號(hào)解碼裝置和音頻信號(hào)編碼·解碼裝置。
為了解決上述問題,根據(jù)本發(fā)明構(gòu)造的音頻信號(hào)編碼裝置、音頻信號(hào)解碼裝置以及音頻信號(hào)編碼·解碼裝置,是不用固定的可縮放編碼方式的裝置,而是進(jìn)行根據(jù)原音頻信號(hào)的性質(zhì)、分布使編碼的頻率范圍變化的適應(yīng)的可縮放編碼裝置。
根據(jù)本發(fā)明第一方面的音頻信號(hào)編碼裝置,是一種接收頻率變換后的音頻信號(hào)對所述音頻信號(hào)進(jìn)行編碼并輸出音頻信號(hào)的編碼裝置,該音頻信號(hào)編碼裝置的特征在于具有對所述頻率變換后的音頻信號(hào)進(jìn)行量化的初級(jí)編碼器;對作為前級(jí)編碼器輸出的量化誤差進(jìn)行量化的第二級(jí)以后的編碼器;判定所述頻率變換后的音頻信號(hào)的特征并確定所述多個(gè)各級(jí)的各編碼器的量化音頻信號(hào)的頻帶的特性判定器;以及將所述特性判定器確定的頻帶和經(jīng)過所述頻率變換后的音頻信號(hào)作為輸入并確定所述多個(gè)各級(jí)的各編碼器的連接順序,以便將編碼器的量化頻帶和連接順序變換為代碼串的編碼頻帶控制器。從而可以根據(jù)輸入音頻信號(hào)的特性,確定若干個(gè)各編碼器的量化頻帶和各編碼器的連接順序,通過進(jìn)行適應(yīng)純可縮放編碼,便可以進(jìn)行高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第二方面的音頻信號(hào)編碼裝置,是如第一方面所述的音頻信號(hào)編碼裝置,所述多個(gè)各級(jí)的各編碼器具有根據(jù)所述頻率變換后的音頻信號(hào)計(jì)算用于進(jìn)行正規(guī)化處理的正規(guī)化系數(shù)串、并利用矢量量化方法對該正規(guī)化系數(shù)串量化、并且輸出對所述頻率變換后的音頻信號(hào)進(jìn)行過正規(guī)化處理后的正規(guī)化信號(hào)用的正規(guī)化處理器;和對于通過所述正規(guī)化處理器進(jìn)行過正規(guī)化處理的信號(hào)量化和至少一級(jí)以上矢量量化器。借此,通過在各編碼器對頻率變換后的音頻信號(hào)進(jìn)行正規(guī)化處理后進(jìn)行至少一級(jí)以上的矢量量化處理,進(jìn)行高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第三方面的音頻信號(hào)編碼裝置,是如本發(fā)明第一或二方面所述的音頻信號(hào)編碼裝置,所述編碼頻帶控制器選出量化誤差能量相加的和比規(guī)定值大的頻帶作為上述各編碼器量化的音頻信號(hào)頻帶。借此可以通過對量化誤差的能量相加值比較大的頻帶進(jìn)行選擇的量化處理,實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第四方面的音頻信號(hào)編碼裝置,是如本發(fā)明第一或二方面所述的音頻信號(hào)編碼裝置,所述編碼頻帶控制器考慮人類心理特性選出在規(guī)定的頻帶上附加大的權(quán)值的量化誤差能量相加的和比規(guī)定值大的頻帶作為上述各編碼器量化的音頻信號(hào)頻帶,借此便可以通過對在考慮到人類聽覺心理特性在規(guī)定頻帶附加大的權(quán)值的量化誤差的能量相加的和大的頻帶進(jìn)行選擇的量化處理,實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第五方面的音頻信號(hào)編碼裝置,是如第一或二方面所述的音頻信號(hào)編碼裝置,所述編碼頻帶控制器至少對所輸入的音頻信號(hào)的整個(gè)頻帶進(jìn)行一次控制。借此,可以通過采用對于輸入的音頻信號(hào)的整個(gè)頻帶進(jìn)行至少一次的量化處理,實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第六方面的音頻信號(hào)編碼裝置,所述矢量量化器通過使用編碼表的矢量量化方法計(jì)算矢量量化的量化誤差并以代碼串的方式輸出作為該矢量量化結(jié)果。借此便可以通過采用該量化處理中的編碼表的矢量量化,實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第七方面的音頻信號(hào)編碼裝置,是如第六方面的所述的音頻信號(hào)編碼裝置,所述矢量量化器為在搜索矢量量化中的最優(yōu)化的編碼時(shí),使用矢量代碼全部或部分反演后的編碼矢量。借此便可以通過采用反演后的編碼矢量,實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第八方面的音頻信號(hào)編碼裝置,是如第六方面的音頻信號(hào)編碼裝置,所述矢量量化器為在計(jì)算搜索矢量量化中最優(yōu)化的編碼時(shí)需要使用的距離時(shí),抽取由所述正規(guī)化處理器計(jì)算出的輸入信號(hào)的正規(guī)化代碼串作為權(quán)值系數(shù),出賦予最小距離的編碼。借此便可以通過采用在搜索矢量量化中的最優(yōu)化的編碼中使用距離計(jì)算時(shí),把輸入信號(hào)的正規(guī)化代碼串作為權(quán)值使用,并抽取出賦予最小距離的編碼,實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第九方面的音頻信號(hào)編碼裝置,是如第六方面所述的音頻信號(hào)編碼裝置,所述矢量量化器為在計(jì)算搜索矢量量化中最優(yōu)化的編碼時(shí)使用的距離時(shí),抽取由所述正規(guī)化處理器計(jì)算出的正規(guī)化代碼串和考慮到人類聽覺心理特性的值作為權(quán)值系數(shù),并抽取出賦予最小距離的編碼。借此便可以通過采用在搜索矢量量化中的最優(yōu)化的編碼中使用距離計(jì)算時(shí),使用輸入信號(hào)的正規(guī)化代碼串和考慮到人類聽覺心理特性用的值作為權(quán)值,并抽取出賦予最小距離的編碼,從而實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第十方面的音頻信號(hào)編碼裝置,是一種對由如第一方面所述的音頻信號(hào)編碼裝置輸出的編碼音頻信號(hào)進(jìn)行解碼并輸出音頻信號(hào)的音頻信號(hào)解碼裝置,其特征在于包括從輸入的音頻信號(hào)串再生頻率變換后的音頻輸入信號(hào)的系數(shù)串的一級(jí)或多級(jí)逆量化器組成的逆量化裝置,將作為所述逆量化裝置輸出信號(hào)的頻率變換后的輸入音頻信號(hào)的系數(shù)串變換為與初始輸入音頻信號(hào)相當(dāng)?shù)男盘?hào)的逆頻率變換器,根據(jù)在所述音頻信號(hào)的編碼裝置的所述特性判定器和由編碼的頻帶控制器確定的上述多個(gè)各級(jí)編碼器的量化頻帶和連接順序再生所述頻率變換后的音頻信號(hào)的逆量化器,將作為該逆量化器的輸出的頻率變換后的音頻輸入信號(hào)代碼串變換成相應(yīng)于原音頻信號(hào)的信號(hào)的逆頻率變換器,借此可以獲得一種可以對由如第一方面所述的編碼裝置輸出的編碼代碼串進(jìn)行解碼的解碼裝置。
根據(jù)本發(fā)明第十一方面的音頻信號(hào)編碼裝置,是如第十方面所述的音頻信號(hào)解碼裝置,其特征在于所述一級(jí)或多級(jí)的逆量化器構(gòu)成的逆量化裝置把由如第一方面所述的音頻信號(hào)編碼裝置的各頻帶的編碼器輸出的編碼代碼串作為輸入,并且依據(jù)所輸入的音頻信號(hào)編碼代碼串再生出頻率變換后的輸入音頻信號(hào)編碼代碼串;該逆量化裝置具有把作為該逆量化裝置的輸出的頻率變換后的輸入音頻信號(hào)編碼代碼串和由所述音頻信號(hào)編碼裝置的各頻帶中的編碼器輸出的正規(guī)化代碼串作為輸入以獲得與所述頻率變換后的輸入音頻信號(hào)相對應(yīng)的信號(hào)的逆正規(guī)化裝置;所述逆頻率變換器將所述逆正規(guī)化器輸出的信號(hào)變換為與初始輸入音頻信號(hào)相應(yīng)的信號(hào)。借此可以獲得一種可以對如第十方面所述的編碼裝置輸出的編碼代碼串進(jìn)行解碼的解碼裝置。
根據(jù)本發(fā)明第十二方面的音頻信號(hào)編碼裝置,是如第十或十一方面所述的音頻信號(hào)解碼裝置,其特征在于所述逆量化裝置只使用由所述音頻信號(hào)編碼裝置的若干個(gè)編碼器中的某一個(gè)編碼器輸出的編碼信號(hào)進(jìn)行逆量化。借此可以在相應(yīng)于音頻信號(hào)的特性改變?nèi)舾蓚€(gè)編碼器的量化頻帶以及連接順序并進(jìn)行編碼時(shí),僅使用位于解碼側(cè)的各編碼器中輸出的信號(hào)的一部分進(jìn)行高質(zhì)量解碼的結(jié)構(gòu)簡單的解碼裝置。
根據(jù)本發(fā)明第十三方面的音頻信號(hào)編碼裝置,是如第一方面所述的音頻信號(hào)編碼裝置,所述特征判斷器根據(jù)由低通濾波器處理過的信號(hào),適當(dāng)?shù)倪x擇出對輸入至該特征判斷器頻率變換后的音頻信號(hào)量化的頻帶。借此可以根據(jù)低通濾波器的特性,更容易地收聽低頻頻帶信號(hào),從而可以實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第十四方面的音頻信號(hào)編碼裝置,是如第一方面所述的音頻信號(hào)編碼裝置,所述特征判斷器根據(jù)通過包含對數(shù)計(jì)算的處理的信號(hào),適當(dāng)?shù)倪x擇出量化輸入至該特征判斷器的頻率變換后的音頻信號(hào)量化的頻帶。借此可以通過包含有對數(shù)計(jì)算的處理,獲得與人類的聽覺特性相吻合的和高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第十五方面的音頻信號(hào)編碼裝置,是如第三方面所述的音頻信號(hào)編碼裝置,所述特征判斷器根據(jù)由高通濾波器處理過的信號(hào),適當(dāng)?shù)倪x擇出量化輸入至該特征判斷器的頻率變換后的音頻信號(hào)的頻帶。借此可以根據(jù)高通濾波器的特性,更容易地收聽高頻頻帶信號(hào),實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第十六方面的音頻信號(hào)編碼裝置,是如第一方面所述的音頻信號(hào)編碼裝置,所述特征判斷器根據(jù)由帶通濾波器或帶阻濾波器處理過的信號(hào),適當(dāng)?shù)倪x擇出量化輸入至該特征判斷器量化頻率變換后的音頻信號(hào)的頻帶。借此可以根據(jù)帶通濾波器或帶阻濾波器的特性,更容易地收聽特定頻帶頻率內(nèi)的頻率信號(hào),或是抑制特定頻帶頻率的信號(hào),實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第十七方面的音頻信號(hào)編碼裝置,是如第一方面所述的音頻信號(hào)編碼裝置,用所述特征判斷器判定音頻信號(hào)的特征,并根據(jù)該判定結(jié)果適當(dāng)?shù)倪x擇出使所述的多個(gè)各級(jí)的各編碼器量化的頻帶。借此可以相應(yīng)于音頻信號(hào)的特性,適當(dāng)選擇出各編碼器量化的頻帶,實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第十八方面的音頻信號(hào)編碼裝置,是如第十七方面所述的音頻信號(hào)編碼裝置,用所述特征判斷器判定音頻信號(hào)的特征,并根據(jù)該判定結(jié)果限定所述的各編碼器量化的頻帶。借此可以相應(yīng)于音頻信號(hào)的特性,對各編碼器量化的頻帶進(jìn)行限制,從而可以實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第十九方面的音頻信號(hào)編碼裝置,是如第十八方面所述的音頻信號(hào)編碼裝置,所述各編碼器量化的頻帶劃分為低頻頻帶、中頻頻帶和高頻頻帶,在對所述各編碼器量化的頻帶進(jìn)行限制的情況下,如果所述輸入音頻信號(hào)具有急劇變化的特征時(shí),則限制上述各編碼器量化的頻帶,使高頻帶比其它頻帶選的更多。借此可以在所述輸入音頻信號(hào)具有急劇變化的特征時(shí),通過限制量化的頻帶,以便選擇更多的高頻帶,借此更容易地收聽變化急劇的高頻帶中的信號(hào),從而可以實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第二十方面的音頻信號(hào)編碼裝置,是如第十八方面所述的音頻信號(hào)編碼裝置,所述各編碼器量化的頻帶被劃分為低頻帶、中頻帶、高頻帶,在更多地選擇在高頻帶作為所述各編碼器量化的頻帶的場合,在由那一時(shí)刻至一定時(shí)間之內(nèi),按對所述各編碼器量化的頻帶更多地選擇在高頻帶的方式控制。借此可以在相應(yīng)于所輸入的音頻信號(hào)的特性選擇高頻帶作為更多的量化頻帶的場合,通過在由那一時(shí)刻至一定時(shí)間之內(nèi)更多地選擇高頻域作為量化的頻帶,可以防止容易收聽高頻帶狀態(tài)在瞬時(shí)變化為與此不同的狀態(tài)。
根據(jù)本發(fā)明第二十一方面的音頻信號(hào)編碼裝置,是如第十八方面所述的音頻信號(hào)編碼裝置,所述各編碼器量化的頻帶被劃分為低頻頻帶、中頻頻帶、高頻頻帶,對所述原輸入音頻信號(hào)的特性進(jìn)行判定,并且根據(jù)這一判定結(jié)果進(jìn)行控制使所述各編碼器量化的頻帶固定。借此可以根據(jù)輸入音頻信號(hào)的特性,固定各編碼器量化的頻帶,實(shí)現(xiàn)高效率的固定型可縮放編碼。
根據(jù)本發(fā)明第二十二方面的音頻信號(hào)編碼裝置,是如第一方面所述的音頻信號(hào)編碼裝置,所述各特性判別器把上述頻率變換后的音頻信號(hào)的頻率數(shù)概形與通過上述正規(guī)化處理器計(jì)算的正規(guī)化系數(shù)串的任何一方或兩方的值作為確定上述多個(gè)各級(jí)的各編碼器量化頻帶的權(quán)值。借此可以通過把用由頻率變換后的音頻信號(hào)的頻率概形和/或由正規(guī)化處理器計(jì)算出的正規(guī)化系數(shù)串作為在確定各編碼器的量化頻帶時(shí)的權(quán)值使用,實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第二十三方面的音頻信號(hào)編碼裝置,是如第一方面所述的音頻信號(hào)編碼裝置,它的進(jìn)一步特征在于具有判定所述的若干級(jí)編碼器的量化的音頻信號(hào)的聽覺和物理特性,并且確定該各編碼器量化的編碼頻帶的配置的特性判定器和根據(jù)由所述特性判定器確定的編碼頻帶配置信息控制對所述的多個(gè)各級(jí)的各編碼器,量化的編碼頻帶的配置編碼頻帶控制器;并使所述多個(gè)各級(jí)的各編碼器、所述特性判定器以及所述編碼頻帶控制器的動(dòng)作重復(fù)進(jìn)行到滿足預(yù)定的編碼條件為止。借此可以根據(jù)對音頻信號(hào)的聽覺、物理特性的判定結(jié)果,確定出各編碼器量化的編碼頻帶的配置,并且通過采用在滿足編碼條件之前一直對各編碼器量化的編碼頻帶的配置進(jìn)行調(diào)整和控制,實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第二十四方面的音頻信號(hào)編碼裝置,是如第二十三方面所述的音頻信號(hào)編碼裝置,所述特性判定器具有把預(yù)定的編碼條件作為輸入,計(jì)算出與所述的若干級(jí)編碼器的編碼頻帶有關(guān)的編碼頻帶信息的編碼頻帶計(jì)算器;把對所述編碼頻帶信息和所述頻率范圍的音頻信號(hào)或差分頻譜中的任何一個(gè)進(jìn)行預(yù)定濾波時(shí)的濾波器的輸出作為輸入,并且輸出所述編碼頻帶信息的編碼頻帶的表示聽覺重要程度的聽覺權(quán)值用的聽覺心理模式計(jì)算器;輸入該聽覺權(quán)值和作為解析長度判定器輸出信號(hào)的解析長度,確定所述編碼器的配置方式并輸出所述編碼器的頻帶序號(hào)的配置確定器;把所述編碼頻帶信息和頻帶序號(hào)作為輸入并根據(jù)預(yù)定的編碼條件輸出編碼頻帶配置信息用的編碼頻帶配置信息生成裝置。借此可以通過進(jìn)行確定考慮到表示人類聽覺重要程度的聽覺權(quán)值的各編碼器的編碼頻帶的配置進(jìn)行確定,實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第二十五方面的音頻信號(hào)編碼裝置,是如第二十三方面所述的音頻信號(hào)編碼裝置,所述編碼頻帶控制器具有所述頻率變換后的輸入音頻信號(hào)的頻譜和所述編碼頻帶配置信息作為輸入,并且使所述輸入音頻信號(hào)的頻譜在指定的頻帶進(jìn)行偏移用的頻譜偏移裝置;對于該頻譜偏移裝置的輸出進(jìn)行編碼并輸出編碼代碼串的編碼器;對于所輸入的該編碼代碼串進(jìn)行解碼并輸出解碼頻譜的解碼頻帶控制器;計(jì)算所輸入的音頻信號(hào)的頻譜與所述解碼頻譜之間的差的差分計(jì)算裝置;一直到該解碼頻帶控制器的下一動(dòng)作周期,保持由所述差分計(jì)算裝置輸出的差分信息的差分頻譜的保持裝置。借此可以利用編碼頻帶配置信息,使原音頻信號(hào)矢量在指定的頻帶進(jìn)行偏移,并進(jìn)行編碼,再計(jì)算對其解碼所得到的解碼矢量與所述原音頻信號(hào)的矢量之間的差,并且根據(jù)這個(gè)與前一差分值的過去值相對應(yīng)地確定所述原音頻信號(hào)的矢量的偏移量,對編碼的頻帶進(jìn)行各種偏移的各編碼的差分值使這時(shí)的量化誤差最小,借此可以控制下次的各編碼器的連接狀態(tài),從而實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第二十六方面的音頻信號(hào)編碼裝置,是如第二十五方面所述的音頻信號(hào)編碼裝置,所述解碼頻帶控制器具有對于所輸入的編碼代碼串進(jìn)行解碼并輸出合成頻譜用的解碼器;根據(jù)所述編碼代碼串中的編碼頻帶配置信息,使所述合成頻譜在預(yù)定的頻帶進(jìn)行偏移的頻譜偏移裝置;直到該解碼頻帶控制器的下一動(dòng)作周期,保持由所述解碼器輸出的合成頻譜并對過去的合成頻譜與當(dāng)前的合成頻譜進(jìn)行加法運(yùn)算的解碼頻譜計(jì)算器。借此可以根據(jù)過去各編碼器應(yīng)量化處理的頻帶的配置和連接狀態(tài),對當(dāng)前各編碼器應(yīng)量化的頻帶的配置和連接狀態(tài)進(jìn)行控制,從而實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第二十七方面構(gòu)造的音頻信號(hào)編碼裝置,是一種對由如第二十六方面所述的音頻信號(hào)編碼裝置輸出的編碼音頻信號(hào)進(jìn)行解碼并輸出音頻信號(hào)的音頻信號(hào)解碼裝置,它還具有與所述音頻信號(hào)編碼裝置的所述解碼頻帶控制器具有同一構(gòu)成的解碼頻帶控制器。借此可以根據(jù)過去各編碼器應(yīng)量化的頻帶的配置以及連接狀態(tài),對當(dāng)前各編碼器應(yīng)量化的頻帶的配置和連接狀態(tài)進(jìn)行控制,從而可以獲得進(jìn)行高質(zhì)量、高效率的適應(yīng)可縮放編碼用的編碼表輸出進(jìn)行解碼的音頻信號(hào)解碼裝置。
根據(jù)本發(fā)明第二十八方面構(gòu)造的音頻信號(hào)編碼·解碼裝置,是一種由如第二十六方面所述的音頻信號(hào)編碼裝置和對由該音頻信號(hào)編碼裝置輸出的編碼音頻信號(hào)進(jìn)行解碼并輸出音頻信號(hào)的音頻信號(hào)解碼裝置構(gòu)成;而且所述音頻信號(hào)解碼裝置具有與所述音頻信號(hào)編碼裝置的所述解碼頻帶控制器結(jié)構(gòu)相同的解碼頻帶控制器。借此可以根據(jù)過去各編碼器應(yīng)量化的頻帶的配置和連接狀態(tài),對當(dāng)前各編碼器應(yīng)量化的頻帶配置和連接狀態(tài)進(jìn)行控制,并且可以獲得由可以進(jìn)行高質(zhì)量、高效率的適應(yīng)可縮放編碼的音頻信號(hào)編碼裝置,以及對其編碼輸出的信號(hào)進(jìn)行解碼的音頻信號(hào)解碼裝置構(gòu)成的音頻信號(hào)編碼·解碼裝置。
根據(jù)本發(fā)明第二十九方面的音頻信號(hào)編碼裝置,是如第二十七方面所述的音頻信號(hào)解碼裝置,所述音頻信號(hào)編碼裝置的所述頻譜偏移裝置輸入所述音頻信號(hào)頻譜和所述編碼頻帶配置信息,并且輸出所述編碼頻帶信息和偏移后的頻譜。借此可以進(jìn)行高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第三十方面的音頻信號(hào)編碼裝置,是如第二十四方面所述的音頻信號(hào)解碼裝置,所述配置確定器在所述輸入音頻信號(hào)具有變化急劇的特性和所述解析長度比較小的場合,把上述多個(gè)各級(jí)的各編碼器的編碼頻帶配置為高頻帶比其它頻帶更多地被選擇的方式。借此可以在輸入音頻信號(hào)具有變化急劇的特性的場合,更容易地收聽變化急劇的高頻頻帶部分的信號(hào),從而可以進(jìn)行高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第三十一方面的音頻信號(hào)編碼裝置,是如第二十四方面所述的音頻信號(hào)編碼裝置,所述配置確定器在所述輸入音頻信號(hào)具有變化急劇的特性和所述解析長度比較小的場合,在由那一時(shí)刻至一定時(shí)間之內(nèi),把上述各編碼器的編碼頻帶配置為高頻帶比其它頻帶更多地被選擇的配置。借此可以在輸入音頻信號(hào)具有變化急劇的特性的場合,在由那一時(shí)刻至一定時(shí)間之內(nèi),防止由容易地收聽高頻頻帶信號(hào)的狀態(tài)變化為在瞬時(shí)難以收聽高頻頻帶信號(hào)狀態(tài)的出現(xiàn),從而可以進(jìn)行高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第三十二方面的音頻信號(hào)編碼裝置,是如第二十四方面所述的音頻信號(hào)編碼裝置,所述編碼頻帶計(jì)算器中,在作為輸出信號(hào)的編碼頻帶配置信息與作為輸入信號(hào)的編碼條件中的比特率、或輸入音頻信號(hào)的取樣頻率之間具有使用多項(xiàng)式函數(shù)或?qū)?shù)函數(shù)或它們的組合的函數(shù)關(guān)系。借此可以根據(jù)所述編碼條件,進(jìn)行高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第三十三方面的音頻信號(hào)編碼裝置,是如第三十二方面所述的音頻信號(hào)編碼裝置,所述編碼條件中的所述編碼器總數(shù)為三個(gè)以上時(shí),取按頻率變高的順序?yàn)榈谌齻€(gè)的編碼器的編碼頻帶的上限為原音頻信號(hào)頻帶的1/2。借此可以通過采用至少配置有三個(gè)編碼器實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第三十四方面的音頻信號(hào)編碼裝置,是如第三十二方面所述的音頻信號(hào)編碼裝置,所述編碼頻帶計(jì)算器把建立所述函數(shù)關(guān)系的函數(shù)作為附加考慮Bark率、Mel系數(shù)等的人類聽覺特性的加權(quán)。借此可以通過對人類聽覺特性加以考慮實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第三十五方面的音頻信號(hào)編碼裝置,是如第二十四方面所述的音頻信號(hào)編碼裝置,所述配置確定器確定所述的多個(gè)各級(jí)的各編碼器的編碼頻帶的配置;通過預(yù)先準(zhǔn)備所述各編碼器配置的模式,為了提高編碼效率而切換這些模式。借此可以通過簡單的結(jié)構(gòu)構(gòu)成,進(jìn)行高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第三十六方面的音頻信號(hào)編碼裝置,是如第二十四方面所述的音頻信號(hào)編碼裝置,所述配置確定器對于所述輸入音頻信號(hào)具有變化不急劇保持穩(wěn)定的特性,而所述的解析長度比較大的場合,作為所述的多個(gè)各級(jí)的各編碼器的編碼頻帶的最大值具有較小值。借此可以在輸入音頻信號(hào)具有變化不急劇的保持正常的特性的場合下,可以更容易地收聽變化不急劇的低頻頻帶音頻信號(hào)的實(shí)現(xiàn)高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第三十七方面的音頻信號(hào)編碼裝置,是如第二十四方面所述的音頻信號(hào)編碼裝置,與所述各級(jí)編碼的前級(jí)相連接的濾波器為低通濾波器、高頻通濾波器、帶通濾波器、或帶阻濾波器(Band Rejection Filter)中的一種,或?yàn)閮煞N以上的組合。借此可以考慮相應(yīng)的頻帶適合地進(jìn)行高質(zhì)量、高效率的適應(yīng)可縮放編碼。
根據(jù)本發(fā)明第三十八方面的音頻信號(hào)編碼裝置,是如第二十七方面所述的音頻信號(hào)編碼裝置,所述逆量化裝置只使用由所述音頻信號(hào)編碼裝置輸出的一部分代碼進(jìn)行逆量化處理。借此可以構(gòu)成對由進(jìn)行高質(zhì)量、高效率的適應(yīng)可縮放編碼的音頻信號(hào)編碼裝置給出的編碼輸出進(jìn)行解碼的音頻信號(hào)解碼裝置。
圖1為根據(jù)本發(fā)明第一實(shí)施方式的音頻信號(hào)編碼裝置的適應(yīng)可縮放編碼裝置的方框圖。
圖2為表示所述第一實(shí)施方式的編碼裝置的時(shí)間頻率變換器的圖。
圖3為表示所述第一實(shí)施方式的編碼裝置的編碼器的圖。
圖4為表示所述第一實(shí)施方式的編碼裝置的正規(guī)化裝置的圖。
圖5為表示所述第一實(shí)施方式的編碼裝置的頻率概形正規(guī)化裝置的圖。
圖6為表示所述第一實(shí)施方式的編碼裝置的特性判定器的圖。
圖7為表示所述第一實(shí)施方式的編碼裝置的編碼頻帶控制器的圖。
圖8為表示所述笫一實(shí)施方式的編碼裝置的量化器的圖。
圖9為表示所述第一實(shí)施方式的編碼裝置的解碼器的圖。
圖10為簡要表示一般性的Twin VQ方式的圖。
圖11為表示一般性的Twin VQ可縮放編碼的方式的圖。
圖12為表示一般的固定可縮放編碼的缺點(diǎn)的圖。
圖13為表示一般的適應(yīng)可縮放編碼的優(yōu)點(diǎn)的圖。
圖14為表示與根據(jù)本發(fā)明第二實(shí)施方式的音頻信號(hào)編碼裝置的適應(yīng)可縮放編碼裝置的方框圖。
圖15為表示所述笫二實(shí)施方式的編碼裝置的編碼器的圖。
圖16為表示所述第二實(shí)施方式的編碼裝置的特性判定器的圖。
圖17為表示所述第二實(shí)施方式的編碼裝置的編碼頻帶控制器的圖。
圖18為表示所述第二實(shí)施方式的編碼裝置的解碼器的圖。
圖19為表示所述第二實(shí)施方式的編碼裝置的解碼頻帶控制器的圖。
圖20為表示所述第二實(shí)施方式的編碼裝置的頻譜偏移裝置的圖。
附圖中代號(hào)的含義為1 編碼裝置2 解碼裝置501 原音頻信號(hào)502 解析長度判定器503 時(shí)間頻率變換器504 解析長度505 原音頻信號(hào)頻譜506 特性判定器507 編碼頻帶控制器508 頻帶控制代碼串510 解析長度代碼串511 低頻頻帶編碼器512 中頻頻帶編碼器513 高頻頻帶編碼器511b 第二級(jí)低頻頻帶編碼器518、519、520、518b 量化誤差521 低頻頻帶代碼串522 中頻頻帶代碼串523 高頻頻帶代碼串521b 第二級(jí)低頻頻帶代碼串701 濾波器5 頻率時(shí)間變換器6 加窗器7 幀疊加器8 解碼信號(hào)9 頻帶合成器1201 解碼頻帶控制器1202 低頻頻帶解碼器1203 中頻頻帶解碼器1204 高頻頻帶解碼器1202b 第二級(jí)低頻頻帶解碼器201 幀分割器202 加窗器203 MDCT器3 編碼器301 正規(guī)化裝置302 量化器303 正規(guī)化代碼串304 代碼串401 頻率概形正規(guī)化器402 頻帶振幅正規(guī)化器403 頻帶表601 線型預(yù)測分析器602 形狀量化器603 包絡(luò)特性正規(guī)化器803 頻譜冪指數(shù)計(jì)算器804 位置配置確定器517 頻帶控制權(quán)值516 編碼頻帶配置信息901 頻帶寬度計(jì)算器902 量化順序確定器903 編碼器數(shù)目確定器1001 量化器的量化頻帶中的MDCT1002 同一量化頻帶中的正規(guī)化成分1003 音源子矢量1004 權(quán)值子矢量1005 矢量量化器1006 距離計(jì)算裝置1007 編碼確定裝置1008 殘差生成裝置1009 編碼表1010 殘差子矢量1011 某量化器的量化頻帶的MDCT殘差101 原音頻信號(hào)102 解析長度判定器103 時(shí)間頻率變換器104 頻域中的原音頻信號(hào)105 頻率概形信號(hào)106 正規(guī)化處理器107 正規(guī)化代碼串108 正規(guī)化處理后的當(dāng)前音頻信號(hào)109 矢量量化器110 代碼串111 解析長度代碼串1301 原音頻信號(hào)1302 時(shí)間頻率變換器1303 解析長度判定器1304 頻域中的原音頻信號(hào)1305 低頻頻帶編碼器1306 量化誤差1307 中頻頻帶編碼器1308 量化誤差1309 高頻頻帶編碼器1310 量化誤差1311 低頻頻帶代碼串1312 中頻頻帶代碼串1313 高頻頻帶代碼串1314 解析長度代碼串2001 編碼裝置2002 解碼裝置200105 編碼條件200107 特性判定器200108 差分頻譜200109 編碼頻帶配置信息200110 編碼頻帶控制器200111 編碼代碼串200112 傳送編碼代碼串合成器200150 傳送編碼代碼串分解器200151 編碼代碼串200152 解析長度編碼代碼串200153 解碼頻帶控制器200154 解碼頻譜2003 編碼器
200305 編碼頻帶信息200601 編碼頻帶計(jì)算器200602 聽覺心理模式計(jì)算器200603 配置確定器200604 編碼頻帶配置信息生成裝置200605 聽覺權(quán)值200701 頻譜偏移裝置200702 編碼頻帶信息200703 差分計(jì)算裝置200704 差分頻譜保持裝置2004 解碼器200901 逆量化器200902 逆正規(guī)化器2001001 合成頻譜2001002 偏移后的合成頻譜2001003 解碼頻譜計(jì)算器2001101 原頻譜2001102 偏移后的頻譜下面參考附圖1至附圖9說明本發(fā)明的第一實(shí)施方式,并參考附圖14至20說明本發(fā)明的第二實(shí)施方式。
(第一實(shí)施方式)圖1為表示按照本發(fā)明第一實(shí)施方式進(jìn)行適應(yīng)可縮放編碼的音頻信號(hào)編碼裝置的方框圖。
在圖1中,1001是對原音頻信號(hào)501進(jìn)行編碼的編碼裝置。在該編碼裝置中,502是對所述原音頻信號(hào)501進(jìn)行解析時(shí)判斷解析長度504的解析長度判定器,503是以所述解析長度504為單位,將原音頻信號(hào)501從時(shí)間軸變換到頻率軸上的時(shí)間頻率變換器,504是由解析長度判定器502判定的解析長度,505是原音頻信號(hào)頻譜,701是輸入原音頻信號(hào)頻譜505的濾波器,506是判定原音頻信號(hào)頻譜505的特性并確定所述編碼裝置1001的若干級(jí)的各編碼器511、512、513、511b等的量化音頻信號(hào)的頻帶的特性判定器,507是編碼頻帶控制器,該控制器把由特性判定器506確定的各編碼器的頻帶和進(jìn)行過所述頻率變換的音頻信號(hào)作為輸入,確定若干級(jí)的各編碼器511、512、513、511b等的連接順序,以便將若干級(jí)的量化頻帶和連接順序變換為代碼串用的編碼頻帶;508是作為由該編碼頻帶控制器507輸出的所述代碼串的頻帶控制代碼串,510是將由所述解析長度判定器502輸出的所述解析長度504作為代碼串的解析長度代碼串,511、512、513分別是對低頻頻帶、中頻頻帶、高頻頻帶中的信號(hào)進(jìn)行編碼的低頻頻帶編碼器、中頻頻帶編碼器、高頻頻帶編碼器,511b是對第一級(jí)低頻頻帶編碼器511的量化誤差518進(jìn)行編碼的第二級(jí)低頻頻帶編碼器,521、522、523是作為由各編碼器511、512、513輸出的編碼信號(hào)的低頻頻帶代碼串、中頻頻帶代碼串、高頻頻帶代碼串,521b是作為第二級(jí)低頻頻帶編碼器511b的編碼輸出的第二級(jí)低頻頻帶代碼串,518、519、520是作為由所述各編碼器511、512、513輸出的編碼前的信號(hào)與所述各編碼信號(hào)之間的差的量化誤差,518b是作為第二級(jí)低頻頻帶編碼器511b的量化誤差的第二級(jí)量化誤差。
另外,1002是對由所述編碼裝置1001編碼過的編碼代碼串解碼的解碼裝置。在這一解碼裝置1002中,5是對所述編碼裝置1001中的時(shí)間頻率變換器503進(jìn)行逆變換的頻率時(shí)間變換器,6是在時(shí)間軸上乘上窗口函數(shù)進(jìn)行窗口設(shè)置的窗口設(shè)置器,7是幀疊加器,8是解碼信號(hào),9是頻帶合成器,1201是解碼頻帶控制器,1202、1203、1204分別是與所述低頻頻帶編碼器511、中頻頻帶編碼器512、高頻頻帶編碼器513相對應(yīng)進(jìn)行解碼的低頻頻帶解碼器、中頻頻帶解碼器、高頻頻帶解碼器,1202b是對第一級(jí)低頻頻帶解碼器1202的輸出進(jìn)行解碼的第二級(jí)低頻頻帶解碼器。
在此,第二級(jí)之后的編碼器、解碼器也可以使用在其它頻帶中,而且還可以根據(jù)需要,多級(jí)設(shè)置以提高編碼和解碼的精度。
下面首先對編碼裝置1001的動(dòng)作進(jìn)行說明。
假設(shè)編碼的原音頻信號(hào)501是一種在時(shí)間上連續(xù)的數(shù)字化信號(hào)串。例如,假設(shè)這種音頻信號(hào)是一種按48kHz的取樣頻率量化為16比特的數(shù)字化信號(hào)。
將所述的原音頻信號(hào)501輸入至解析長度判定器502。所述解析長度判定器502對所輸入的原音頻信號(hào)501的特性進(jìn)行判斷,確定其解析長度504,并將這一結(jié)果作為解析長度代碼串510而送入至解碼裝置1002。作為解析長度504例如可以取為256、1204、4096等。作為包含在原音頻信號(hào)501中的高頻頻帶頻率成分超過預(yù)定值的場合,解析長度504可取為256,在低頻頻帶頻率成分超過預(yù)定值、且高頻頻帶頻率成分小于預(yù)定值的場合,解析長度504可取為4096,對于除此之外的場合,解析長度504均可取為1024。
這樣確定的解析長度504可以利用時(shí)間頻率變換器503計(jì)算出原音頻信號(hào)501的頻譜505。
圖2為本發(fā)明第一實(shí)施方式的音頻信號(hào)編碼裝置的時(shí)間頻率變換器503的方框圖。
所述的原音頻信號(hào)501在其取樣值達(dá)到預(yù)定的取樣數(shù)之前,由幀分割器201進(jìn)行累積,當(dāng)所累積的取樣數(shù)達(dá)到由所述解析長度判定器502確定的解析長度504時(shí)進(jìn)行輸出。幀分割器201是一種可按某一偏移長度進(jìn)行輸出的裝置,比如解析長度504設(shè)定為4096個(gè)取樣時(shí),如果將其設(shè)定為解析長度504的取樣長度的一半,則每當(dāng)解析長度504達(dá)到與2048個(gè)取樣相當(dāng)?shù)臅r(shí)間時(shí),就輸出最新的4096個(gè)取樣。當(dāng)然該解析長度504也可以隨取樣頻率的變化而變化,同樣也可以將偏移長度設(shè)定為解析長度504的一半。
幀分割器201的輸出被輸入至后級(jí)加窗器202。加窗器202將幀分割器201的輸出乘以時(shí)間軸上的窗口函數(shù),并由加窗器202處輸出。這種狀態(tài)例如可以用數(shù)學(xué)公式(1)所示。數(shù)學(xué)公式1hxi-hi*xii-1,2,…,Nhi=sin{πN(i+0.5)}]]>其中,xi為幀分割器201的輸出,hi為窗口函數(shù),hxi為加窗器202的輸出信號(hào)。而且i為時(shí)間下標(biāo)。由數(shù)學(xué)公式1所示的窗口函數(shù)hi僅僅為一個(gè)例子,窗口函數(shù)不一定是數(shù)學(xué)公式1。
窗口函數(shù)的選擇取決于輸入至加窗器202的信號(hào)的特征、幀分割器201中的解析長度504以及在時(shí)間上位于前后位置處的幀中的窗口函數(shù)的形狀。例如,對于作為輸入至加窗器202的信號(hào)特征的、幀分割器201中的解析長度504為N的場合,則計(jì)算每輸入N/4的信號(hào)平均功率,而在這一平均功率變動(dòng)非常大的場合,也可以選擇使解析長度504比N更短、由數(shù)學(xué)公式1所示的運(yùn)算。而且最好是使前一時(shí)刻的幀窗口函數(shù)的形狀和后一時(shí)刻的幀窗口函數(shù)的形狀相對應(yīng),以便使當(dāng)前時(shí)刻的幀窗口函數(shù)的形狀不會(huì)產(chǎn)生變形,這樣的選擇是可取的。
然后將加窗器202的輸出輸入至MDCT器203,在MDCT器203中進(jìn)行變形離散余弦變換,并輸出MDCT系數(shù)。這種變形離散余弦變換的一般表達(dá)式可用數(shù)學(xué)公式2表示。
數(shù)學(xué)公式2yk=Σn=0N-1hxn*cos{2π(k+12)(n+n0)N}]]>n0=N4+12(k=0,1,···,N2-1)]]>在此,當(dāng)作為由MDCT器203輸出的MDCT系數(shù)由數(shù)學(xué)公式2中的yk表示時(shí),MDCT器203的輸出表示頻率特性,yk中的變量k越接近于0,低頻頻率成分就越遠(yuǎn)離0而增大至N/2-1附近,而高頻頻率成分成分將與線形相對應(yīng)。按這種方式計(jì)算出的MDCT系數(shù)即為原音頻信號(hào)的頻譜505。
然后將所述的原音頻信號(hào)頻譜505輸入至濾波器701。當(dāng)這一濾波器701的輸入為x701(i),輸出為y701(i)時(shí),則采用例如由數(shù)學(xué)公式3表示的濾波器。
數(shù)學(xué)公式3y701(i)=w701(i)*{x701(i)+x701(i+l)}i=0,1,…,fs-2在此,fs為解析長度504。
雖然由數(shù)學(xué)公式3表示的濾波器701是一種移動(dòng)平均濾波器,但是并不僅限于采用移動(dòng)平均濾波器,也可以采用其它的、諸如高通濾波器等濾波器,還可以采用頻阻濾波器等。
將濾波器701的輸出和由解析長度判定器502計(jì)算出的解析長度504輸入至特性判定器506。圖6詳細(xì)地示出特性判定器506的圖。特性判定器506確定原音頻信號(hào)501和原音頻信號(hào)頻譜505的有關(guān)聽覺的物理特性。所謂原音頻信號(hào)501和原音頻信號(hào)頻譜505的有關(guān)聽覺的物理特性與聲音信號(hào)或音樂信號(hào)特性有所不同。在信號(hào)為聲音信號(hào)的場合,大部分頻率成分位于低于6kHz的低頻區(qū)域中。
下面參考圖6,對特性判定器506的動(dòng)作進(jìn)行說明。
如果設(shè)輸入至特性判定器506的原音頻信號(hào)頻譜505通過濾波器701濾波后所形成的濾波信號(hào)為x506(i),則根據(jù)這一信號(hào)x506(i),利用數(shù)學(xué)公式4由頻譜功率計(jì)算器803計(jì)算出頻譜功率p506(i)。
數(shù)學(xué)公式4p506(i)=x506(i)2將頻譜功率p506(i)作為編碼頻帶控制器507輸入信號(hào)之一并作為各編碼器的頻帶控制權(quán)值517。
在解析長度504為小的場合,比如對于解析長度504為256的場合,則為了按固定方式配置各編碼器,由配置確定器804確定,編碼頻帶配置信息516作為固定配置輸入至編碼頻帶控制器507。
對于解析長度504不小的場合,比如說對于解析長度504為4096或1024的場合,為了把各編碼器按動(dòng)態(tài)方式配置,由位置配置確定器804確定,編碼頻帶配置信息516作為動(dòng)態(tài)配置輸入至編碼頻帶控制器507。
下面參考圖7,對編碼頻帶控制器507的動(dòng)作進(jìn)行說明。
輸入至編碼頻帶控制器507的信號(hào)包括作為特性判定器506輸出的頻帶控制權(quán)值517,由濾波器701對編碼頻帶配置信息516和對原音頻信號(hào)頻譜505濾波后獲得的濾波信號(hào),以及由各編碼器輸出的量化誤差518、519或520。而且根據(jù)這些輸入信號(hào),各編碼器511、512、513、511b和編碼頻帶控制器507進(jìn)行回歸操作,而且為了能消除編碼頻帶控制器507的初次動(dòng)作中的量化誤差,還需要進(jìn)行消除量化誤差用的三次輸入操作。
如上所述,在解析長度504較小和編碼頻帶配置信息516呈固定配置的場合,可以根據(jù)預(yù)先定義的頻帶的固定配置,順次由低頻頻帶向中頻頻帶、高頻頻帶進(jìn)行編碼,使用量化順序確定器902、編碼器數(shù)目確定器903和頻帶寬度計(jì)算器901確定出編碼器的量化頻帶、個(gè)數(shù)、連接順序,并且進(jìn)行編碼。換句話說,這時(shí)的頻帶控制代碼串508中把編碼器的頻帶信息、編碼器個(gè)數(shù)和它們的連接順序均作為信息編碼。
例如,可以通過把各編碼器的編碼頻帶和編碼器個(gè)數(shù)分別配置為在0Hz~4kHz時(shí)為一個(gè)、在0Hz~8kHz時(shí)為一個(gè)、在4kHz~12kHz時(shí)為一個(gè)、在8kHz~16kHz時(shí)為兩個(gè)、在16kHz~24kHz時(shí)為三個(gè)來進(jìn)行編碼。
下面對編碼頻帶控制器507在編碼頻帶配置信息516呈動(dòng)態(tài)配置信息時(shí)的動(dòng)作進(jìn)行說明。
編碼頻帶控制器507由確定各編碼器的量化頻帶的頻帶寬度計(jì)算器901、確定各編碼器的量化順序的量化順序確定器902和確定各頻帶中的編碼器個(gè)數(shù)用的編碼器數(shù)目確定器903等三個(gè)裝置構(gòu)成。根據(jù)輸入至編碼頻帶控制器507的信號(hào),便可以在確定各編碼器的頻帶寬度時(shí),使位于諸如0Hz~4kHz、0Hz~8kHz、4kHz~12kHz、8kHz~16kHz、16kHz~24kHz等各預(yù)定頻帶的頻帶控制權(quán)值517,與由各編碼器進(jìn)行編碼后的量化誤差相乘,并計(jì)算出該乘積的平均值。在此,頻帶控制權(quán)值517為weight517(i),設(shè)量化誤差為err507(i),則可以利用數(shù)學(xué)公式5計(jì)算平均值。
數(shù)學(xué)公式5Ave901(j)=1fupper(j)-flower(j)Σi=fupper(j)flower(j)weight517(i)*err507(i)2]]>在此,j為各頻帶的下標(biāo),Ave901(j)為頻帶j的平均值,fupper(j)和flower(j)分別為頻帶j的上限頻率和下限頻率。檢索出這種方式獲得的平均值A(chǔ)ve901(j)為最大時(shí)的j,并將其作為編碼器編碼的頻帶。這一檢索出的j值還被輸出至編碼器數(shù)目確定器903,按照使與j相對應(yīng)的頻帶的編碼器個(gè)數(shù)增加一的方式,存儲(chǔ)在確定的編碼頻帶中是否存在任何編碼器,并且將所儲(chǔ)存的編碼器個(gè)數(shù)相加,在達(dá)到預(yù)先確定的編碼器總數(shù)之前,重復(fù)進(jìn)行編碼。最后將編碼器的頻帶和編碼器的個(gè)數(shù)作為頻帶控制代碼串508輸出至解碼器。
下面參考圖3對編碼器3的動(dòng)作方式進(jìn)行說明。
編碼器3包括有正規(guī)化裝置301和量化器302。
正規(guī)化裝置301輸入作為幀分割器201輸出信號(hào)的時(shí)間軸信號(hào)和由MDCT部203輸出的MDCT系數(shù),并且利用任何一個(gè)參數(shù)對MDCT系數(shù)進(jìn)行正規(guī)化處理。這里的對MDCT系數(shù)進(jìn)行正規(guī)化處理,意味著對低頻頻帶成分和高頻頻帶成分具有相當(dāng)大的不同的MDCT系數(shù)的大小進(jìn)行抑制。例如,對于低頻頻帶頻率成分比高頻頻帶頻率成分大許多的場合,可以通過按使低頻頻帶頻率成分為比較大的值,高頻頻帶頻率成分為比較小的值的方式選擇參數(shù),并通過用其對所述MDCT系數(shù)進(jìn)行除法運(yùn)算的方式,對MDCT系數(shù)的大小進(jìn)行抑制。正規(guī)化裝置301還可以將表示進(jìn)行正規(guī)化處理用的參數(shù)的下標(biāo)作為正規(guī)化代碼串303編碼處理。
量化器302由正規(guī)化裝置301輸入正規(guī)化后的MDCT系數(shù),并且對MDCT系數(shù)量化。這時(shí),該量化器302按照使該量化處理后的值與作為編碼表中的編碼下標(biāo)相對應(yīng)的各量化輸出之間的差為最小的方式輸出相對應(yīng)的編碼下標(biāo)。對于這種場合,由所述量化器302進(jìn)行過量化后的值和與量化器302輸出的編碼下標(biāo)相對應(yīng)的值之間的差為量化誤差。
下面參考圖4對所述正規(guī)化裝置301的一個(gè)實(shí)例進(jìn)行詳細(xì)的說明。
在圖4中,401是接收幀分割器201和MDCT部203的輸出的頻率概形正規(guī)化裝置,402是接收所述頻率概形正規(guī)化裝置401的輸出的、并參考頻帶表403進(jìn)行正規(guī)化的頻帶振幅正規(guī)化裝置。
下面對其動(dòng)作方式進(jìn)行說明。
頻率概形正規(guī)化裝置401可利用由幀分割器201輸出的時(shí)間軸上的數(shù)據(jù)計(jì)算出作為比較大頻率概形的頻率概形,并將其除以由MDCT器203輸出的MDCT系數(shù)。在表示頻率概形上用的參數(shù)作為正規(guī)化代碼串303而進(jìn)行編碼。頻帶振幅正規(guī)化裝置402把由頻帶振幅正規(guī)化裝置402的輸入輸出信號(hào)作為輸入,并對每個(gè)由頻帶表403所示的頻帶進(jìn)行正規(guī)化。例如,當(dāng)作為頻帶表403輸出的MDCT系數(shù)為dct(i)(i=0~2047),頻帶表403如表1所示時(shí),則利用數(shù)學(xué)公式6等計(jì)算出各頻帶的振幅平均值。
表1頻帶帶域kflower(k)fupper(k)頻帶帶域kflower(k)fupper(k)
<p>數(shù)學(xué)公式6sumj=&Sigma;i=bjlowbjhighdct(i)p]]>avej=(sumjbjhigh-bjlow+1)-pbjlow&le;i&le;bjhigh]]>在此,bjlow、bjhigh分別表示由頻帶表403所示的第j個(gè)頻帶中所屬的dct(i)的最低頻帶下標(biāo)i,最高頻帶下標(biāo)i。而且p為距離計(jì)算使用的標(biāo)準(zhǔn),并且最好取為2等數(shù)字。avej為序號(hào)為j的各頻帶中的振幅平均值。頻帶振幅正規(guī)化裝置402可通過對avej進(jìn)行量化,計(jì)算出qavej,并可以利用例如數(shù)學(xué)公式7等進(jìn)行正規(guī)化。
數(shù)學(xué)公式7n_dct(i)=dct(i)/gavejbjlow≤i≤bjhigh對avej的量化處理可以為標(biāo)量量化,也可以用編碼表的矢量量化處理。頻帶振幅正規(guī)化裝置402將表示qavej用的參數(shù)中的下標(biāo)作為正規(guī)化代碼串303而進(jìn)行編碼。
編碼器中的正規(guī)化裝置301可以由如圖4所示的頻率概形正規(guī)化裝置401、頻帶振幅正規(guī)化裝置402這兩個(gè)部件構(gòu)成,也可以僅由頻率概形正規(guī)化裝置401構(gòu)成,或是僅由頻帶振幅正規(guī)化裝置402構(gòu)成。而且對于由MDCT部203輸出的MDCT系數(shù)中的低頻頻帶頻率成分并不比高頻頻帶頻率成分大許多的場合,還可以不采用如上所述這兩個(gè)構(gòu)成,而是將由MDCT部203輸出的信號(hào)直接輸入至量化器302。
下面參考圖5對如圖4所示的頻率概形正規(guī)化裝置401進(jìn)行詳細(xì)的說明。
在圖5中,601是接收幀分割器201的輸出的線型預(yù)測分析器,602是接收線型預(yù)測分析部601的輸出的形狀量化器,603是接收MDCT器203輸出的包絡(luò)特性正規(guī)化裝置。
下面參考圖5,對所述頻率概形正規(guī)化裝置401的動(dòng)作進(jìn)行說明。
所述線型預(yù)測分析部601把由幀分割器201給出的時(shí)間軸上的音頻信號(hào)作為輸入進(jìn)行線型預(yù)測分析(Linear Predictive Coding)。線型預(yù)測分析用的線型預(yù)測系數(shù)(LPC系數(shù))可以通過計(jì)算設(shè)置加權(quán)平均窗口等的信號(hào)的自相關(guān)函數(shù),并且求解正規(guī)化方程式等。將計(jì)算出的線型預(yù)測系數(shù)變換為線型頻譜對系數(shù)(LSP(Line Spectrum Pair)系數(shù)),并由形狀量化器602量化。作為這種量化方式可以用標(biāo)量量化,也可以采用代碼圖表的矢量量化。而且表示由概形量化器602進(jìn)行過量化的參數(shù)的頻率傳遞特性,由概形量化器602計(jì)算出,并且通過將其除以由MDCT部203輸出的MDCT系數(shù)進(jìn)行正規(guī)化處理。例如,設(shè)與由形狀量化器602量化處理后的參數(shù)相等價(jià)的線性預(yù)測系數(shù)為qlpc(i),則由包絡(luò)特性正規(guī)化裝置603計(jì)算出的所述頻率傳遞特性可以由數(shù)學(xué)公式8表示。
數(shù)學(xué)公式8
env(i)=1fft(li)]]>在此,ORDER最好為10~40。fft(1i)代表快速傅立葉變換。利用所計(jì)算出的頻率傳遞特性env(i),由包絡(luò)特性正規(guī)化裝置603使用下述的數(shù)學(xué)公式9進(jìn)行正規(guī)化。
數(shù)學(xué)公式9fdct(i)=mdct(i)env(i)]]>在此,mdct(i)為由MDCT部203輸出的輸出信號(hào),fdct(i)為由進(jìn)行正規(guī)化處理后的包絡(luò)特性正規(guī)化裝置603輸出的輸出信號(hào)。
下面參考圖8對所述編碼裝置1的量化器302中的量化進(jìn)行詳細(xì)說明。
輸入給量化器302的MDCT系數(shù)1001可以由該MDCT系數(shù)中取出幾個(gè)構(gòu)成為音頻子矢量1003。同樣,在正規(guī)化裝置301中在把用作為正規(guī)化裝置301輸出的MDCT系數(shù)去除作為正規(guī)化裝置301輸入的MDCT系數(shù)后所獲得的系數(shù)串作為正規(guī)化成分1002時(shí),該正規(guī)化成分1002也可以按與從MDCT系數(shù)1001中抽取音源子矢量1003相同的規(guī)則進(jìn)行從正規(guī)化成分1002中抽取子矢量,并構(gòu)成權(quán)值子矢量1004。由MDCT系數(shù)1001和正規(guī)化成分1002中抽取音頻子矢量1003和權(quán)值子矢量1004用的規(guī)則,例如可以用數(shù)學(xué)公式10所示的方法。
數(shù)學(xué)公式10
在此,第i個(gè)音頻子矢量中的第j個(gè)元素為subvectori(j),MDCT1001系數(shù)為vector(),MDCT系數(shù)1001的總元素?cái)?shù)為TOTAL,音頻子矢量1003的元素?cái)?shù)為CR,VTOTAL為與TOTAL相等或比后者更大的值,并且將VTOTAL/CR設(shè)定為正值。例如,在TOTAL為2048的條件下,如果CR為19,則VTOTAL為2052,如果CR為23,則VTOTAL為2070,如果CR為21,則VTOTAL為2079。權(quán)值子矢量1004可以按數(shù)學(xué)公式10的順序抽取。矢量量化器1005可從編碼表1009的編碼矢量中取出與音頻子矢量1003之間的距離,由權(quán)值子矢量1004進(jìn)行權(quán)值運(yùn)算后為最小的值,并且輸出與施加在該最小距離上的編碼矢量與輸入音頻子矢量1003間的量化誤差相應(yīng)的殘差子矢量1010。
下面按照矢量量化器1005由距離計(jì)算裝置1006、編碼確定裝置1007、殘差生成裝置1008三個(gè)元素構(gòu)成的實(shí)例,對實(shí)際計(jì)算順序進(jìn)行說明。
例如,距離計(jì)算裝置1006用例如數(shù)學(xué)公式11,計(jì)算第i個(gè)音頻子矢量1003與編碼表1009中的第k個(gè)編碼矢量間的距離。
數(shù)學(xué)公式11dik=&Sigma;j=0CR-1wjR(subvectori(j)-Ck(j))S]]>在此,wj為權(quán)值子矢量中的第j個(gè)元素,Ck(j)為第k個(gè)編碼矢量中的笫j個(gè)元素,R、S為距離計(jì)算用的標(biāo)準(zhǔn),而且R、S的值最好取為1、1.5、2等。標(biāo)準(zhǔn)R、S沒有必要為相同的值。dik為相對于第i個(gè)音頻子矢量的第k個(gè)編碼矢量的距離。編碼確定裝置1007用于由數(shù)學(xué)公式11計(jì)算出的距離中選擇出最小的編碼矢量,并將它的下標(biāo)作為代碼串304編碼。例如,在若干個(gè)所述dik中的diu為最小值的場合,與第i個(gè)子矢量相對應(yīng)的編碼下標(biāo)為u。殘差生成裝置1008利用由編碼確定裝置1007選擇的編碼矢量,通過數(shù)學(xué)公式12生成出殘差子矢量1010。
數(shù)學(xué)公式12
resi(j)=subvectori(j)-Cu(j)在此,第i個(gè)殘差子矢量1010中的第j個(gè)元素為resi(j),把由編碼確定裝置1007選擇的編碼矢量的第j個(gè)元素作為Cu(j)。利用所述的殘差子矢量1010對數(shù)學(xué)公式10進(jìn)行逆運(yùn)算求出矢量,把該矢量與作為該編碼器中的各編碼對象的矢量間的差作為其后各個(gè)編碼器的量化對象的MDCT系數(shù)保存。但對于某一頻帶的編碼不對后面的編碼器產(chǎn)生影響的頻帶進(jìn)行編碼的場合,即對于后面的編碼器不進(jìn)行編碼的場合,并沒有必要由殘差生成裝置1008生成殘差子矢量1010、MDCT1011。雖然編碼表1009中所具有的編碼矢量的個(gè)數(shù)可根據(jù)需要設(shè)定,但從儲(chǔ)存器容量、計(jì)算時(shí)間等等的角度考慮,最好取為64左右。
所述矢量量化器1005的另一個(gè)例子也可以采用如下所述的構(gòu)成。即由距離計(jì)算裝置1006利用數(shù)學(xué)公式13計(jì)算出距離。
數(shù)學(xué)公式13
在此,K為編碼表1009進(jìn)行編碼檢索時(shí)使用的編碼矢量的總數(shù)。
編碼確定裝置1007選擇出使通過數(shù)學(xué)公式13計(jì)算出的距離dik為最小值的k,并對它的下標(biāo)編碼。在此,k為由0至2K-1中的值。殘差生成裝置1008用數(shù)學(xué)公式14生成出殘差子矢量1010。
數(shù)學(xué)公式14
在此,雖然編碼表1009中的編碼矢量的個(gè)數(shù)可根據(jù)需要設(shè)定,但從儲(chǔ)存器容量、計(jì)算時(shí)間等的角度考慮,最好取為64左右。
如上所述,雖然就僅由正規(guī)化成分1002生成權(quán)值子矢量1004的結(jié)構(gòu)進(jìn)行了描述,然而也可以通過在權(quán)值子矢量1004上乘以根據(jù)人類聽覺特性設(shè)定的權(quán)值生成出該權(quán)值子矢量1004。
如上所述,可以動(dòng)態(tài)地設(shè)定若干級(jí)的各編碼器的頻帶寬度、編碼器的個(gè)數(shù)以及連接順序。而且可根據(jù)按這樣確定的各編碼器的信息進(jìn)行量化。
另外,解碼裝置1002使用作為各頻帶中的編碼器輸出的正規(guī)化代碼串、由與該正規(guī)化代碼串相對應(yīng)的量化器輸出的代碼串、以及作為編碼裝置的編碼頻帶控制器輸出信號(hào)的頻帶控制代碼串或作為解析長度判定器輸出信號(hào)的解析長度代碼串,進(jìn)行解碼。
圖9示出了解碼器1202、1203、…的構(gòu)成。各解碼器由再生成正規(guī)化后的MDCT系數(shù)的逆量化器1101,對正規(guī)化系數(shù)進(jìn)行解碼使所述再生的正規(guī)化MDCT系數(shù)和正規(guī)化系數(shù)相乘的逆正規(guī)化裝置1102構(gòu)成。
逆正規(guī)化裝置1102根據(jù)來自各編碼器的正規(guī)化裝置301的正規(guī)化代碼串303對由編碼裝置1在正規(guī)化處理時(shí)使用的參數(shù)進(jìn)行復(fù)原,并將逆量化器1101的輸出與該參數(shù)相乘復(fù)原MDCT系數(shù)。
解碼頻帶控制器1201利用作為編碼頻帶控制器507輸出信號(hào)的頻帶控制代碼串508,復(fù)原編碼裝置使用的編碼器的配置和編碼器的個(gè)數(shù)等信息,并根據(jù)這些信息將各解碼器1202、1203、1204、1202b配置在各頻帶中,頻帶合成部9通過按編碼裝置的各編碼器511、512、513、511b的編碼順序和逆順序合成頻帶的頻帶合成器9獲得MDCT系數(shù)。頻率時(shí)間變換器5輸入所獲得的該MDCT系數(shù),進(jìn)行逆MDCT處理,并由頻域的信號(hào)復(fù)原為時(shí)域信號(hào)。例如,所述這種逆MDCT系數(shù)的計(jì)算由例如數(shù)學(xué)公式15所示。
數(shù)學(xué)公式15xx(n)=2N&Sigma;k=0N-1yykcos{2&pi;(k+1/2)(n+n0)N}]]>n0=N4+12]]>在此,yyk為由頻帶合成部9復(fù)原后的MDCT系數(shù),xx(n)為逆MDCT系數(shù),把這兩個(gè)系數(shù)作為頻率時(shí)間變換器5輸出。
加窗器6利用由頻率時(shí)間變換器5輸出xx(i)進(jìn)行窗口相關(guān)處理。例如,窗口相關(guān)處理可以使用編碼裝置1中的時(shí)間頻率變換器503的加窗器202中所使用的窗口進(jìn)行由例如數(shù)學(xué)公式16所示的處理。
數(shù)學(xué)公式16z(i)=xx(i)*hj在此,z(i)為加窗器6的輸出信號(hào)。
幀疊加器7利用加窗器6的輸出信號(hào)再生音頻信號(hào)。因?yàn)橛杉哟捌?輸出的信號(hào)是具有時(shí)間周期的信號(hào),所以幀疊加器7可以利用數(shù)學(xué)公式17,把該輸出作為解碼裝置1002的輸出信號(hào)。
數(shù)學(xué)公式17outm(i)=zm(i)+zm-1(i+SHIFT)在此,zm(i)為第m時(shí)刻的幀中第i個(gè)加窗器6的輸出信號(hào)z(i),zm-1(i)為第m-1時(shí)刻的幀中第i個(gè)加窗器6的輸出信號(hào),SHIFT為與編碼裝置的解析長度504相當(dāng)?shù)娜訑?shù),outm(i)為幀疊加器7在第m時(shí)刻的幀中的解碼裝置1002的輸出信號(hào)。
而且在第一實(shí)施方式中,有時(shí)也如下述那樣,在所述編碼頻帶控制器507中,由解析長度504限制由頻帶寬度計(jì)算器901計(jì)算的可量化的頻域。
例如,對于解析長度504為256的場合,各編碼器的、可量化的頻域的下限為4kHz,上限為24kHz。對于解析長度為1024或2048的場合,下限為0kHz,上限為16kHz。而且當(dāng)解析長度504再次為256時(shí),在此后的一定時(shí)間里,比如在為20毫秒左右的時(shí)間里,為了固定各量化器的可量化的頻域和量化器的配置,也可以由量化順序確定器902進(jìn)行控制。通過這樣的處理,可以使經(jīng)過時(shí)的量化器的配置一定,因而可以抑制有關(guān)聽覺的頻帶的出入感發(fā)生(例如在某一瞬間高頻頻帶為中心的聲音突然又變?yōu)橐缘皖l頻帶為中心的聲音,從而使人有聲音頻帶似乎上下存放的感覺)。
按照第一實(shí)施方式的音頻信號(hào)編碼裝置和解碼裝置具有確定若干級(jí)的編碼器的量化音頻信號(hào)頻帶的特性判定器,以及把由該特性判定器確定的頻帶和經(jīng)過頻率變換后的初始音頻信號(hào)作為輸入確定所述的若干級(jí)編碼器的連接順序,再將編碼器的量化頻帶和連接順序變換為代碼串用的編碼頻帶控制器,通過這樣的適應(yīng)可縮放編碼的構(gòu)成,即使在對各種各樣的音頻信號(hào)進(jìn)行編碼時(shí),也可以獲得發(fā)揮出高質(zhì)量、高效率等良好性能的適應(yīng)可縮放編碼的音頻信號(hào)編碼裝置和對其進(jìn)行解碼的解碼裝置。
(第二實(shí)施方式)下面參考附圖14至附圖20,對如圖14所示的本發(fā)明第二實(shí)施方式進(jìn)行說明。
圖14為根據(jù)本發(fā)明第二實(shí)施方式進(jìn)行適應(yīng)可縮放編碼的編碼裝置2001和解碼裝置2002的方框圖。在如圖所示的編碼裝置2001中,200105是有關(guān)編碼器的個(gè)數(shù)、比特率、輸入音頻信號(hào)的取樣頻率、各編碼器的編碼頻帶信息等的編碼條件,200107是確定若干級(jí)編碼器的量化音頻信號(hào)的頻帶的特性判斷器,200109是編碼頻帶配置信息,200110是輸入由特性判定器200107確定的頻帶和頻率變換后的音頻輸入信號(hào),將所述的若干級(jí)的編碼器的量化頻帶和連接順序變換為代碼串的編碼頻帶控制器,200111是編碼代碼串,200112是傳送編碼代碼串合成器。
在解碼裝置2002中,200150是傳送編碼代碼串分解器,200151是編碼代碼串,200153b是輸入編碼代碼串200151并且在對其進(jìn)行解碼的過程中對各解碼器的解碼頻帶進(jìn)行控制用的解碼頻帶控制器,200154b是解碼頻譜。
雖然按照本發(fā)明第二實(shí)施方式的編碼裝置2001與如上所述的第一實(shí)施方式相類似,是進(jìn)行適應(yīng)可縮放編碼的裝置,但是和第一實(shí)施方式相比,其不同點(diǎn)在于在編碼裝置2001中還設(shè)置有包含有解碼頻帶控制器200153的編碼頻帶控制器200110,在解碼裝置2002中還增加有進(jìn)行與所述解碼頻帶控制器200153相同處理的解碼頻帶控制器200153b,而且在第二實(shí)施方式中的特性判定器200107中用設(shè)置如圖16所示的聽覺心理模式計(jì)算器200602代替設(shè)置第一實(shí)施方式中的特性判定器506的頻譜功率計(jì)算器803,,而且在特性判定器200107內(nèi)還設(shè)置有可根據(jù)編碼條件200105由編碼頻帶計(jì)算器200601計(jì)算的編碼頻帶信息200702,由配置確定器200603輸出的頻帶序號(hào)200606生成出編碼頻帶配置信息200109的編碼頻帶配置信息生成裝置200604。
在解碼裝置2002中,200150是傳送編碼代碼串分解器,200151是編碼代碼串,200153b是把編碼代碼串200151作為輸入并且對對其解碼的各解碼器的解碼頻帶進(jìn)行控制用的解碼頻帶控制器,200154b是解碼頻譜。
下面對第二實(shí)施方式的動(dòng)作進(jìn)行說明。
在第二實(shí)施方式中,要進(jìn)行編碼的原音頻信號(hào)501與上述的第一實(shí)施方式相類似,也是時(shí)間連續(xù)的數(shù)字化信號(hào)序列。
而且通過與上述的第一實(shí)施方式相同的處理,也可以獲得原音頻信號(hào)頻譜505。在第二實(shí)施方式中,相對于編碼裝置2001將例如包含編碼器個(gè)數(shù)、比特率、輸入音頻信號(hào)的取樣頻率、各編碼器的編碼頻帶信息等的編碼條件200105,均輸入至該編碼裝置2001的特性判定器200107中。特性判定器200107輸出包含有若干級(jí)編碼器的量化頻帶、個(gè)數(shù)以及連接順序的信息的編碼頻帶配置信息200109,并將它們輸入至編碼頻帶控制器200110。這一編碼頻帶控制器200110如圖17所示,除了輸入有編碼頻帶配置信息200109之外,還輸入原音頻信號(hào)頻譜505,并輸出由編碼頻帶控制器200110控制的各編碼器根據(jù)這些信息進(jìn)行編碼的編碼代碼串200111,并將它們輸入至傳送編碼代碼串合成器200112合成,合成后的輸出信號(hào)輸入至解碼裝置2002。
解碼裝置2002通過傳送代碼串分解器200150接收編碼裝置2001的傳送編碼代碼串合成器200112的輸出并分解編碼串200151和解析長度編碼串200152。編碼代碼串200151輸入至解碼頻帶控制器200153b,獲得由該解碼頻帶控制器控制的各解碼器進(jìn)行過解碼的解碼頻譜200154b。并且與所述第一實(shí)施方式相類似,通過頻率時(shí)間變換器5、加窗器6和幀疊加器7由這種解碼頻譜200154b和由所述傳送編碼代碼串分解器200150輸出的解析長度編碼代碼串200152獲得解碼信號(hào)8。
下面參考附圖15至附圖20,對特性判定器200107的動(dòng)作方式進(jìn)行說明。
該特性判定器200107包括利用編碼條件200105計(jì)算編碼頻帶信息200702的編碼頻帶計(jì)算器200601;從原音頻信號(hào)頻譜505和差分頻譜200108等頻譜信息和編碼頻帶信息200702中,根據(jù)人類的聽覺心理模式計(jì)算出聽覺權(quán)值200605的聽覺心理模式計(jì)算器200602;參照解析長度504并在響應(yīng)聽覺權(quán)值200605上加權(quán)值后確定各編碼器的頻帶配置并輸出頻帶序號(hào)200606的配置確定器200603;以及利用編碼條件200105,由編碼頻帶計(jì)算器200601計(jì)算出的編碼頻帶信息200702和由配置確定器200603輸出的頻帶序號(hào)200606生成出編碼頻帶配置信息200109的編碼頻帶配置信息生成裝置200604。
編碼頻帶計(jì)算器200601使用在編碼裝置2001開始動(dòng)作之前設(shè)定的編碼條件200105,計(jì)算出對圖15所示的編碼器2003編碼的編碼頻帶的上限fpu(k)、下限fpl(k),并將其作為編碼頻帶信息200702輸出至編碼頻帶配置信息生成裝置200604。在此,k為用于抽取編碼頻帶的數(shù)目,隨著k由0變?yōu)轭A(yù)先設(shè)定的最大數(shù)pmax時(shí),表示頻率比較大的頻帶。作為pmax的一個(gè)實(shí)例為4,在表2中示出編碼頻帶計(jì)算器200601動(dòng)作的一個(gè)實(shí)例。
表2編碼條件取樣頻率為48KHz,總計(jì)比特率為24kbps時(shí)
編碼條件取樣頻率為48KHz,總計(jì)比特率為24kbps時(shí)
聽覺心理模式計(jì)算器200602由濾波器701的輸出信號(hào)、作為編碼頻帶控制器200110輸出信號(hào)的差分頻譜200108等頻譜信號(hào)、以及作為編碼頻帶計(jì)算器200601輸出信號(hào)的編碼頻帶信息200702,根據(jù)人類聽覺心理模式計(jì)算出聽覺權(quán)值200605。該聽覺權(quán)值200605在聽覺上比較重要的頻帶為比較大的值,在聽覺上不太重要的頻帶為比較小的值。作為聽覺心理模式計(jì)算器200602的一個(gè)實(shí)例為使用計(jì)算輸入頻譜的冪指數(shù)的方法的裝置。設(shè)輸入的頻譜為x602(i)時(shí),聽覺權(quán)值wpsy(k)為數(shù)學(xué)公式18wpsy(k)=&Sigma;i=fpl(k)fpu(k){&times;602(i)2*1fpu(k)-fpl(k)}]]>按照這種方式計(jì)算出的聽覺權(quán)值200605輸入至配置確定器200603,在該配置確定器200603中邊參考解析長度504,邊在解析長度504比較小例如為128時(shí),頻帶序號(hào)200606變大,例如該頻帶中的序號(hào)為4時(shí)的聽覺權(quán)值200605變大,以便使這一頻帶序號(hào)的權(quán)值為頻帶序號(hào)為4時(shí)的聽覺權(quán)值的兩倍;在解析長度504比較小時(shí),使聽覺權(quán)值200605保持不變,計(jì)算出使該聽覺權(quán)值200605為最大的頻帶,并且將這一頻帶序號(hào)200606送入至編碼頻帶配置信息生成裝置200604中。
編碼頻帶配置信息生成裝置200604輸入所述的編碼頻帶信息200702、頻帶序號(hào)200606以及編碼條件200105,并且輸出編碼頻帶配置信息200109。即該編碼頻帶配置信息生成裝置200604邊經(jīng)常參考編碼條件200105,邊從這一編碼條件上看編碼頻帶配置信息200109達(dá)到必要的間隔時(shí),就輸出連接所述編碼頻帶信息200702和頻帶序號(hào)200606用的編碼頻帶配置信息200109,而在不需要時(shí)就停止這一輸出動(dòng)作。即在達(dá)到由編碼條件200105指定的編碼器個(gè)數(shù)之前,一直輸出頻帶序號(hào)200606。所述配置確定器200603在解析長度504比較小時(shí),也可以處于所輸出的頻帶序號(hào)200606為固定的場合。
下面參考圖17對編碼頻帶控制器200110的動(dòng)作進(jìn)行說明。
編碼頻帶控制器200110把作為所述特性判定器200107輸出信號(hào)的編碼頻帶配置信息200109和原音頻信號(hào)頻譜505作為輸入,并且分別輸出編碼代碼串200111和差分頻譜200108。在編碼頻帶控制器200110的內(nèi)部包括接收編碼頻帶配置信息200109;使原音頻信號(hào)頻譜505以及過去的原音頻信號(hào)頻譜505與對該原音頻信號(hào)頻譜505編碼和解碼所獲得的頻譜200705之間的差分頻譜200108在頻帶序號(hào)200606的頻帶進(jìn)行偏移的頻譜偏移裝置200701;編碼器2003;獲得所述原音頻信號(hào)頻譜505與解碼頻譜200705間的差分的差分計(jì)算裝置200703;差分頻譜保持裝置200704;以及對于解碼頻帶控制器200153,該控制器由解碼器2004解碼編碼代碼串200111獲得的合成頻譜2001001根據(jù)編碼頻帶信息200702偏移獲得按順序合成得到的合成頻譜,并計(jì)算出解碼頻譜200705。頻譜偏移裝置200701的結(jié)構(gòu)構(gòu)成如圖20所示,它使用偏移后的元頻譜2001101、編碼頻帶配置信息200109作為輸入。在編碼頻帶控制器200110中的頻譜偏移裝置200701的輸入中,偏移后的元頻譜2001101為原音頻信號(hào)頻譜505或?yàn)椴罘诸l譜200108,使它們在頻帶序號(hào)200606的頻帶中偏移,并且輸出偏移后的偏移后的頻譜2001102、編碼頻帶配置信息200109中的編碼頻帶信息200702。與頻帶序號(hào)200606相對應(yīng)的頻帶可以由編碼頻帶信息200702中的fpl(k)、fpu(k)求出。偏移的程序是要使所述fpl(k)和fpu(k)之間的頻譜一直移動(dòng)至由編碼器2003能處理的頻帶處。
這樣,輸入有進(jìn)行偏移后的頻譜2001102的編碼器2003如圖15所示,
這樣,輸入有進(jìn)行偏移后的頻譜2001102的編碼器2003如圖15所示,當(dāng)輸出正規(guī)化代碼串303、殘差代碼串304時(shí),對作為頻譜偏移裝置200701輸出信號(hào)的編碼頻帶信息200702進(jìn)行疊加,并作為代碼串200111輸出至傳送編碼代碼串合成器200112和解碼頻帶控制器200153中。
作為所述編碼器2003輸出信號(hào)的所述編碼代碼串200111輸入至該編碼頻帶控制器200110的解碼頻帶控制器200153。該解碼頻帶控制器200153與設(shè)置在解碼裝置2002的類似裝置(即解碼頻帶控制器200153b)的動(dòng)作相類似。
設(shè)置在解碼裝置2002內(nèi)的解碼頻帶控制器200153b的結(jié)構(gòu)構(gòu)成如圖19所示。
解碼頻帶控制器200153b把由傳送編碼代碼串分解器200150輸出的編碼代碼串200111作為輸入,輸出解碼頻譜200705b,借此在其內(nèi)部配置有解碼器2004、頻譜偏移裝置200701和解碼頻譜計(jì)算器2001003。
上述的解碼器2004的結(jié)構(gòu)構(gòu)成如圖18所示。
解碼器2004由逆量化器1101和逆正規(guī)化裝置1102構(gòu)成,逆量化器1101輸入編碼代碼串200111中的殘差代碼串304,并且將這一殘差代碼串304變換為編碼矢量,參考編碼器2003中使用的編碼表而生出該編碼。再生的編碼信號(hào)送入至逆正規(guī)化裝置1102,與由編碼代碼串200111內(nèi)的正規(guī)化代碼串303再生出的正規(guī)化代碼串303a相乘,獲得合成頻譜2001001。該合成頻譜2001001輸入至頻譜偏移裝置200701。
雖然由編碼頻帶控制器200110內(nèi)的解碼頻帶控制器200153輸出的輸出變成解碼頻譜200705,但該輸出與作為解碼裝置2002內(nèi)的解碼頻帶控制器200153b的輸出解碼頻譜200705b相類似。
由解碼器2004合成出的合成頻譜2001001經(jīng)頻譜偏移裝置200701偏移,并獲得偏移后的合成頻譜2001002,并將其輸出至解碼頻譜計(jì)算器2001003。
在解碼頻譜保存在解碼頻譜計(jì)算器2001003的內(nèi)部,預(yù)先保存輸入合成頻譜,并進(jìn)行與所保存的頻譜與最新的合成頻譜相加后作為解碼頻譜200705b輸出。
配置在編碼頻帶控制器200110內(nèi)部的差分計(jì)算裝置200703計(jì)算出原音頻信號(hào)頻譜505與解碼頻譜200705之間的差分,并輸出該差分頻譜200108,將其反饋給特性判定器200107。與此同時(shí),由差分頻譜保持裝置200704保存的所述差分頻譜200108被送入至頻譜偏移裝置200701,并且輸入下一編碼頻帶配置信息200109。特性判定器200107參考這一編碼條件,在滿足該編碼條件時(shí)就一直輸出編碼頻帶配置信息200109,在不滿足時(shí)就停止編碼頻帶控制器200110的動(dòng)作。所述編碼頻帶控制器200110為了計(jì)算差分頻譜200108,而具有差分頻譜保持裝置200704。這就是在為了保持差分頻譜所必要的儲(chǔ)存區(qū)域內(nèi)可存儲(chǔ)2048個(gè)數(shù)那樣的配置。
如上所述,為了滿足編碼條件200105,重復(fù)進(jìn)行利用特性判定器200107和與其相連接的編碼頻帶控制器200110的處理,并依次輸出編碼代碼串200111,這一編碼代碼串200111輸出至傳送編碼代碼串合成器200112,與解析長度代碼串510一并合成為傳送編碼代碼串,并輸出至解碼裝置2002。
解碼裝置2002將編碼裝置2001給出的傳送編碼代碼串,利用傳送編碼代碼串分解器200150分解成編碼代碼串200151和解析長度編碼代碼串200152。該編碼代碼串200151、解析長度編碼代碼串200152與編碼裝置2001內(nèi)的編碼代碼串200111、解析長度代碼串510相類似。
分解后的編碼代碼串200151由解碼頻帶控制器200153b變換為解碼頻譜200154b,該解碼頻譜200154b利用解析長度編碼代碼串200152的信息,通過頻率時(shí)間變換器5、加窗器6和幀疊加器7變換為時(shí)域中的信號(hào),并將其變成解碼信號(hào)8。
按照第二實(shí)施方式的音頻信號(hào)編碼裝置和解碼裝置,如第一實(shí)施方式那樣,也具有確定若干級(jí)的編碼器的量化音頻信號(hào)頻帶用的特性判定器,和編碼頻帶控制器,該控制器把由該特性判定器確定出的頻帶經(jīng)過頻率變換后的原音頻信號(hào)作為輸入,并確定所述的若干級(jí)的編碼器的連接順序,將編碼器的量化頻帶和連接順序變換為代碼串,在進(jìn)行適應(yīng)可縮放編碼的結(jié)構(gòu)構(gòu)成中,在編碼裝置中設(shè)置包含有解碼頻帶控制器的編碼頻帶控制器,在解碼裝置中設(shè)置解碼頻帶控制器,并且把在特性判定器中的頻譜冪指數(shù)計(jì)算器作為聽覺心理模式計(jì)算器,在特性判定器中還配置有編碼頻帶配置信息生成裝置,借此通過將特性判定器中的頻譜冪指數(shù)計(jì)算器替換為聽覺心理模式計(jì)算器,可以高精度地判斷有關(guān)聽覺的重要部分,并選擇出相應(yīng)的頻帶。作為本發(fā)明對象的音頻信號(hào)編碼裝置和解碼裝置在確定編碼器配置狀態(tài)的運(yùn)算時(shí),如果滿足編碼條件,則判定編碼正常,不輸出編碼頻帶配置信息,用于在確定該編碼器配置方式的運(yùn)算中,在上述第一實(shí)施方式中選擇配置編碼器時(shí)的頻帶時(shí)的各頻帶寬度和各頻帶的權(quán)值是固定的,而在第二實(shí)施方式中作為輸入還把輸入信號(hào)的取樣頻率和壓縮率即編碼的比特率作為輸入,與其相應(yīng)地改變選擇所述各編碼器的頻帶配置時(shí)的各頻帶相對應(yīng)的權(quán)值大小,用的壓縮率條件作為特性判定器判定條件,在壓縮率比較高時(shí),即在比特率比較低時(shí)使選擇所述各編碼器的頻帶配置時(shí)的各頻帶相對應(yīng)的權(quán)值程度不發(fā)生大變化,而當(dāng)壓縮率比較低高時(shí),即在比特率比較高時(shí),為了獲得更高的效率,還可以使選擇所述各編碼器的頻帶配置時(shí)的各頻帶相對應(yīng)的權(quán)值程度在聽覺上作為重要參數(shù)強(qiáng)調(diào),從而可以通過這種方式獲得壓縮率和品質(zhì)均為良好的基頻頻帶。采用這種方式,便可以獲得在對各種各樣的音頻信號(hào)編碼時(shí),都可以發(fā)揮出高質(zhì)量、高效率等優(yōu)點(diǎn)的進(jìn)行適應(yīng)可縮放編碼的音頻信號(hào)編碼·解碼裝置。
如上所述,按照本發(fā)明提供的音頻信號(hào)編碼裝置、音頻信號(hào)解碼裝置以及音頻信號(hào)編碼·解碼裝置,由于它們具有確定若干級(jí)的編碼器的量化音頻信號(hào)頻帶的特性判定器,編碼頻帶控制器,該控制器把由該特性判定器確定出的頻帶和經(jīng)過頻率變換后的各音頻信號(hào)作為輸入確定所述的若干級(jí)的編碼器的連接順序,并將編碼器的量化頻帶和連接順序變換為代碼串,通過進(jìn)行適應(yīng)可縮放編碼,對各種各樣的音頻信號(hào)編碼,可以獲得高質(zhì)量、高效率的適應(yīng)可縮放編碼的效果。
權(quán)利要求
1.一種音頻信號(hào)編碼裝置,用于接收頻率變換后的音頻信號(hào)對所述音頻信號(hào)進(jìn)行編碼并輸出,其特征在于具有對所述頻率變換后的音頻信號(hào)進(jìn)行量化的初級(jí)編碼器;對作為前級(jí)編碼器輸出的量化誤差進(jìn)行量化的第二級(jí)以后的編碼器;判定所述頻率變換后的音頻信號(hào)的特征并確定上述多個(gè)各級(jí)的各編碼器的量化音頻信號(hào)的頻帶的特性判定器;以及,將所述特性判定器確定的頻帶和經(jīng)過所述頻率變換后的音頻信號(hào)作為輸入并確定所述的多個(gè)各級(jí)的各編碼器的連接順序,并將編碼器的量化頻帶和連接順序變換為代碼串的編碼頻帶控制器。
2.如權(quán)利要求1所述的音頻信號(hào)編碼裝置,其特征在于所述的若干級(jí)編碼器具有根據(jù)所述頻率變換后的音頻信號(hào)計(jì)算用于進(jìn)行正規(guī)化處理的正規(guī)化系數(shù)串,并利用矢量量化器對該正規(guī)化系數(shù)串量化,并且輸出對所述頻率變換后的音頻信號(hào)進(jìn)行正規(guī)化處理后的正規(guī)化信號(hào)的正規(guī)化處理器;和對于通過所述正規(guī)化處理器進(jìn)行過正規(guī)化處理的信號(hào)進(jìn)行量化的至少一級(jí)以上矢量量化器。
3.如權(quán)利要求1或2所述的音頻信號(hào)編碼裝置,其特征在于所述編碼頻帶控制器選出量化誤差能量相加的和比規(guī)定值大的頻帶作為上述各編碼器量化的音頻信號(hào)頻帶。
4.如權(quán)利要求1或2所述的音頻信號(hào)編碼裝置,其特征在于所述編碼頻帶控制器考慮人類心理特性選出在規(guī)定的頻帶上附加大的權(quán)值的量化誤差能量相加的和比規(guī)定值大的頻帶作為上述各編碼器量化的音頻信號(hào)頻帶。
5.如權(quán)利要求1或2所述的音頻信號(hào)編碼裝置,其特征在于所述編碼頻帶控制器至少對所輸入的音頻信號(hào)的整個(gè)頻帶進(jìn)行一次控制。
6.如權(quán)利要求2所述的音頻信號(hào)編碼裝置,其特征在于所述矢量量化器通過使用編碼表的矢量量化方法計(jì)算矢量量化的量化誤差,并以代碼串的方式輸出該矢量量化結(jié)果。
7.如權(quán)利要求6所述的音頻信號(hào)編碼裝置,其特征在于所述矢量量化器在搜索矢量量化中的最優(yōu)化的編碼時(shí),使用矢量代碼全部或部分反演后的編碼矢量。
8.如權(quán)利要求6所述的音頻信號(hào)編碼裝置,其特征在于所述矢量量化器在計(jì)算搜索矢量量化中最優(yōu)化的編碼時(shí)所使用的距離時(shí),將由所述正規(guī)化處理器計(jì)算出的輸入信號(hào)的正規(guī)化代碼串作為權(quán)值系數(shù),抽取出賦予最小距離的編碼。
9.如權(quán)利要求6所述的音頻信號(hào)編碼裝置,其特征在于所述矢量量化器在計(jì)算搜索矢量量化中最優(yōu)化的編碼時(shí)使用的距離時(shí),將所述正規(guī)化處理器計(jì)算出的正規(guī)化代碼串和考慮到人類聽覺心理特性的值作為權(quán)值系數(shù),并抽取出賦予最小距離的編碼。
10.一種對由如權(quán)利要求1所述的音頻信號(hào)編碼裝置輸出的編碼音頻信號(hào)進(jìn)行解碼并輸出音頻信號(hào)的音頻信號(hào)解碼裝置,其特征在于包括根據(jù)由所述音頻信號(hào)編碼裝置的所述特性判定器及編碼頻帶控制部決定的上述多個(gè)的各編碼器的量化頻帶及連接順序,從輸入的音頻信號(hào)串再生頻率變換后的音頻輸入信號(hào)的系數(shù)串的一級(jí)或多級(jí)逆量化器細(xì)成的逆量化裝置;將作為該逆量化器的輸出的頻率變換后的音頻輸入信號(hào)代碼串變換成相應(yīng)于原音頻信號(hào)的信號(hào)的逆頻率變換器。
11.如權(quán)利要求10所述的音頻信號(hào)解碼裝置,其特征在于所述一級(jí)或多級(jí)的逆量化器構(gòu)成的逆量化裝置把由如權(quán)利要求2所述的音頻信號(hào)編碼裝置的各頻帶的編碼器輸出的編碼代碼串作為輸入,并且依據(jù)所輸入的音頻信號(hào)編碼代碼串再生出頻率變換后的音頻輸入信號(hào)編碼代碼串;該逆量化裝置具有把作為該逆量化裝置的輸出的頻率變換后的音頻輸入信號(hào)編碼代碼串和由所述音頻信號(hào)編碼裝置的各頻帶中的編碼器輸出的正規(guī)化代碼串作為輸入以獲得與所述頻率變換后的輸入音頻信號(hào)相對應(yīng)的信號(hào)的逆正規(guī)化裝置;所述逆頻率變換器將所述逆正規(guī)化器輸出的信號(hào)變換為與初始輸入音頻信號(hào)相應(yīng)的信號(hào)。
12.如權(quán)利要求10或11所述的音頻信號(hào)解碼裝置,其特征在于所述逆量化裝置只使用由所述音頻信號(hào)編碼裝置的若干個(gè)編碼器中的某一個(gè)編碼器輸出的編碼信號(hào)進(jìn)行逆量化。
13.如權(quán)利要求1所述的音頻信號(hào)編碼裝置,其特征在于所述特征判斷器根據(jù)由低通濾波器處理過的信號(hào),適當(dāng)?shù)倪x擇出對輸入至該特征判斷器頻率變換后的音頻信號(hào)量化的頻帶。
14.如權(quán)利要求1所述的音頻信號(hào)編碼裝置,其特征在于所述特征判斷器根據(jù)通過包含對數(shù)計(jì)算的處理的信號(hào),適當(dāng)?shù)倪x擇出量化輸入至該特征判斷器的頻率變換后的音頻信號(hào)量化的頻帶。
15.如權(quán)利要求1所述的音頻信號(hào)編碼裝置,其特征在于所述特征判斷器根據(jù)由高通濾波器處理過的信號(hào),適當(dāng)?shù)倪x擇出量化輸入至該特征判斷器的頻率變換后的音頻信號(hào)的頻帶。
16.如權(quán)利更求1所述的音頻信號(hào)編碼裝置,其特征在于所述特征判斷器根據(jù)由帶通濾波器或帶阻濾波器處理過的信號(hào),適當(dāng)?shù)倪x擇出量化輸入至該特征判斷器的頻率變換后的音頻信號(hào)的頻帶。
17.如權(quán)利要求1所述的音頻信號(hào)編碼裝置,其特征在于用所述特征判斷器判定音頻信號(hào)的特征,并根據(jù)該判定結(jié)果適當(dāng)?shù)倪x擇所述的多個(gè)各級(jí)的各編碼器量化的頻帶。
18.如權(quán)利要求17所述的音頻信號(hào)編碼裝置,其特征在于用所述特征判斷器判定音頻信號(hào)的特征,并根據(jù)該判定結(jié)果限定所述的多個(gè)各級(jí)的各編碼器量化的頻帶。
19.如權(quán)利要求18所述的音頻信號(hào)編碼裝置,其特征在于所述各編碼器量化的頻帶劃分為低頻頻帶、中頻頻帶和高頻頻帶,在對所述各編碼器量化的頻帶進(jìn)行限制的情況下,如果所述輸入音頻信號(hào)具有急劇變化的特征時(shí),則限制上述各編碼器量化的頻帶,使高頻帶比其它頻帶選的更多。
20.如權(quán)利要求18所述的音頻信號(hào)編碼裝置,其特征在于所述各編碼器量化的頻帶被劃分為低頻帶、中頻帶、高頻帶,在更多地選擇高頻帶作為所述各編碼器量化的頻帶的場合,在由那一時(shí)刻至一定時(shí)間之內(nèi),按所述各編碼器量化的頻帶更多地選擇在高頻帶的方式控制。
21.如權(quán)利要求18所述的音頻信號(hào)編碼裝置,其特征在于所述各編碼器量化的頻帶被劃分為低頻頻帶、中頻頻帶、高頻頻帶,對所述原輸入音頻信號(hào)的特性進(jìn)行判定,并且根據(jù)這一判定結(jié)果進(jìn)行控制使所述各編碼器量化的頻帶固定。
22.如權(quán)利要求1所述的音頻信號(hào)編碼裝置,其特征在于所述各特性判別器把上述頻率變換后的音頻信號(hào)的頻率數(shù)概形與通過上述正規(guī)化處理器計(jì)算的正規(guī)化系數(shù)串的任何一方或兩方的值作為確定上述多個(gè)各級(jí)的各編碼器量化頻帶的權(quán)值。
23.如權(quán)利要求1所述的音頻信號(hào)編碼裝置,其特征在于具有判定所述的各級(jí)的各編碼器的量化的音頻信號(hào)的聽覺和物理特性,并且確定該各編碼器量化的編碼頻帶的配置的特性判定器;根據(jù)由所述特性判定器確定的編碼頻帶配置信息控制所述的多個(gè)各級(jí)的各編碼器量化頻帶配置的編碼頻帶控制器;并使所述多個(gè)各級(jí)的各編碼器、所述特性判定器以及所述編碼頻帶控制器的動(dòng)作重復(fù)進(jìn)行到滿足預(yù)定的編碼條件為止。
24.如權(quán)利要求23所述的音頻信號(hào)編碼裝置,其特征在于所述特性判定器具有把預(yù)定的編碼條件作為輸入,計(jì)算出與所述的多個(gè)各級(jí)的各編碼器的編碼頻帶有關(guān)的編碼頻帶信息的編碼頻帶計(jì)算器;把對所述編碼頻帶信息和所述頻率范圍的音頻信號(hào)或差分頻譜中的任何一個(gè)進(jìn)行預(yù)定濾波時(shí)的濾波器的輸出作為輸入,并且輸出所述編碼頻帶信息的編碼頻帶的表示聽覺重要程度的聽覺權(quán)值用的聽覺心理模式計(jì)算器;輸入該聽覺權(quán)值和作為解析長度判定器輸出的解析長度,確定所述編碼器的配置方式并輸出所述編碼器的頻帶序號(hào)的配置確定器;把所述編碼頻帶信息和頻帶序號(hào)作為輸入并根據(jù)預(yù)定的編碼條件輸出編碼頻帶配置信息用的編碼頻帶配置信息生成裝置。
25.如權(quán)利要求23所述的音頻信號(hào)編碼裝置,其特征在于所述編碼頻帶控制器具有所述頻率變換后的輸入音頻信號(hào)的頻譜和所述編碼頻帶配置信息作為輸入,并且使所述輸入音頻信號(hào)的頻譜在指定的頻帶進(jìn)行偏移用的頻譜偏移裝置;對于該頻譜偏移裝置的輸出進(jìn)行編碼并輸出編碼代碼串的編碼器;對于所輸入的該編碼代碼串進(jìn)行解碼并輸出解碼頻譜的解碼頻帶控制器;計(jì)算所輸入的音頻信號(hào)的頻譜與所述解碼頻譜之間的差的差分計(jì)算裝置;一直到該解碼頻帶控制器的下一動(dòng)作周期,保持由所述差分計(jì)算裝置輸出的差分信息的差分頻譜的保持裝置。
26.如權(quán)利要求25所述的音頻信號(hào)編碼裝置,其特征在于所述解碼頻帶控制器具有對于所輸入的編碼代碼串進(jìn)行解碼并輸出合成頻譜用的解碼器;根據(jù)所述編碼代碼串中的編碼頻帶配置信息,使所述合成頻譜在預(yù)定的頻帶進(jìn)行偏移的頻譜偏移裝置;在該解碼頻帶控制器的下一動(dòng)作周期內(nèi),保持由所述解碼器輸出的合成頻譜并對過去的合成頻譜與當(dāng)前的合成頻譜進(jìn)行加法運(yùn)算的解碼頻譜計(jì)算器。
27.一種對由如權(quán)利要求26所述的音頻信號(hào)編碼裝置輸出的編碼音頻信號(hào)進(jìn)行解碼并輸出音頻信號(hào)的音頻信號(hào)解碼裝置,其特征在于還具有與所述音頻信號(hào)編碼裝置的所述解碼頻帶控制器具有同一構(gòu)成的解碼頻帶控制器。
28.一種音頻信號(hào)編碼·解碼裝置,該裝置由如權(quán)利要求26所述的音頻信號(hào)編碼裝置和對由該音頻信號(hào)編碼裝置輸出的編碼音頻信號(hào)進(jìn)行解碼并輸出音頻信號(hào)的音頻信號(hào)解碼裝置構(gòu)成,其特征在于所述音頻信號(hào)解碼裝置具有與所述音頻信號(hào)編碼裝置的所述解碼頻帶控制器結(jié)構(gòu)相同的解碼頻帶控制器。
29.如權(quán)利要求27所述的音頻信號(hào)解碼裝置,其特征在于所述音頻信號(hào)編碼裝置的所述頻譜偏移裝置輸入所述音頻信號(hào)頻譜和所述編碼頻帶配置信息,并且輸出所述編碼頻帶信息和偏移后的頻譜。
30.如權(quán)利要求24所述的音頻信號(hào)解碼裝置,其特征在于所述配置確定器在所述輸入音頻信號(hào)具有變化急劇的特性和所述解析長度比較小的場合,把上述多個(gè)各級(jí)的各編碼器的編碼頻帶配置為高頻帶比其它頻帶更多地被選擇的方式。
31.如權(quán)利要求24所述的音頻信號(hào)編碼裝置,其特征在于所述配置確定器在所述輸入音頻信號(hào)具有變化急劇的特性和所述解析長度比較小的場合,在由那一時(shí)刻至一定時(shí)間之內(nèi),把上述各編碼器的編碼頻帶配置為高頻帶比其它頻帶更多地被選擇的方式。
32.如權(quán)利要求24所述的音頻信號(hào)編碼裝置,其特征在于所述編碼頻帶計(jì)算器中,在作為輸出信號(hào)的編碼頻帶信息與作為上述輸入的編碼條件中的比特率、或輸入音頻信號(hào)的取樣頻率之間具有使用多項(xiàng)式函數(shù)或?qū)?shù)函數(shù)或它們的組合的函數(shù)關(guān)系。
33.如權(quán)利要求32所述的音頻信號(hào)編碼裝置,其特征在于所述編碼條件中的所述編碼器總數(shù)為三個(gè)以上時(shí),取按頻率變高的順序?yàn)榈谌齻€(gè)的編碼器的編碼頻帶的上限為原音頻信號(hào)頻帶的1/2。
34.如權(quán)利要求32所述的音頻信號(hào)編碼裝置,其特征在于所述編碼頻帶計(jì)算器把建立所述函數(shù)關(guān)系的函數(shù)作為附加考慮Bark率、Mel系數(shù)等的人類聽覺特性的權(quán)值。
35.如權(quán)利要求24所述的音頻信號(hào)編碼裝置,其特征在于所述配置確定器確定所述的多個(gè)各級(jí)的各編碼器的編碼頻帶的配置;通過預(yù)先準(zhǔn)備所述各編碼器配置的模式,為了提高編碼效率而切換這些模式。
36.如權(quán)利要求24所述的音頻信號(hào)編碼裝置,其特征在于所述配置確定器對于所述輸入音頻信號(hào)具有變化不急劇且保持穩(wěn)定的特性,而所述的解析長度比較大的場合,作為所述的多個(gè)各級(jí)的各編碼器的編碼頻帶的最大值具有較小值。
37.如權(quán)利要求24所述的音頻信號(hào)編碼裝置,其特征在于與所述各級(jí)編碼的前級(jí)相連接的濾波器為低通濾波器、高通濾波器、帶通濾波器、或帶阻濾波器(Band Rejection Filter)中的一種,或?yàn)閮煞N以上的組合。
38.如權(quán)利要求27所述的音頻信號(hào)編碼裝置,其特征在于所述逆量化裝置只使用由所述音頻信號(hào)編碼裝置輸出的一部分代碼進(jìn)行逆量化處理。
全文摘要
本發(fā)明提供了一種在對各種各樣的音頻信號(hào)進(jìn)行編碼時(shí),可以充分發(fā)揮性能地進(jìn)行適應(yīng)可縮放編碼的音頻信號(hào)編碼、解碼裝置。其解決方案為不再采用固定可縮放編碼方式,而是采用可以根據(jù)原音頻信號(hào)的性質(zhì)、分布的變化而改變編碼用的頻域的適應(yīng)可縮放編碼裝置。
文檔編號(hào)G10L19/02GK1240978SQ9910801
公開日2000年1月12日 申請日期1999年3月11日 優(yōu)先權(quán)日1998年3月11日
發(fā)明者石川智一, 津島峰生, 則松武志 申請人:松下電器產(chǎn)業(yè)株式會(huì)社
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會(huì)獲得點(diǎn)贊!
1
茶陵县| 青铜峡市| 闽清县| 临海市| 弥勒县| 宝山区| 齐河县| 澎湖县| 汉沽区| 武威市| 响水县| 务川| 凌海市| 即墨市| 海晏县| 水城县| 红安县| 临西县| 五常市| 喀喇| 台中县| 元谋县| 东辽县| 大丰市| 靖宇县| 望江县| 沭阳县| 衡东县| 潼关县| 缙云县| 治多县| 泉州市| 浙江省| 雷山县| 迁西县| 娱乐| 长白| 越西县| 尚义县| 五台县| 庄浪县|