用以再現(xiàn)音頻信號(hào)的裝置及方法、用以產(chǎn)生編碼的音頻信號(hào)的裝置及方法、計(jì)算機(jī)程序及 ...的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明關(guān)于一種用以再現(xiàn)音頻信號(hào)的裝置、方法及計(jì)算機(jī)程序,且具體而言,關(guān)于 一種用以在可利用的數(shù)據(jù)速率降低的情形中再現(xiàn)音頻信號(hào)的裝置、方法及計(jì)算機(jī)程序。此 夕卜,本發(fā)明關(guān)于一種用以產(chǎn)生編碼的音頻信號(hào)的裝置、方法及計(jì)算機(jī)程序以及對(duì)應(yīng)的編碼 音頻信號(hào)。
【背景技術(shù)】
[0002] 用以有效率地儲(chǔ)存及傳輸這些數(shù)據(jù)速率有所降低的信號(hào)的感知適應(yīng)性音頻信號(hào) 編碼在許多領(lǐng)域已獲接受。編碼算法是已知的,詳言之為MPEG 1/2、層3"MP3"、MPEG2/4高 級(jí)音頻編碼(AAC)或MPEG-H統(tǒng)一語(yǔ)音及音頻編碼(USAC)。基礎(chǔ)編碼技術(shù),尤其當(dāng)達(dá)到最低 位速率時(shí),導(dǎo)致音頻質(zhì)量降低。損傷通常主要由待傳輸?shù)囊纛l信號(hào)帶寬的編碼器側(cè)限制所 導(dǎo)致。
[0003] 在此情形中,習(xí)知的目前技術(shù)現(xiàn)況為:使音頻信號(hào)在編碼器側(cè)經(jīng)受頻帶限制,以及 藉由高質(zhì)量音頻編碼器來(lái)僅編碼音頻信號(hào)的下頻帶(lower band)。然而,上頻帶(upper band)僅由一組參數(shù)非常粗略地表征,這組參數(shù)例如傳達(dá)上頻帶的頻譜包絡(luò)。在譯碼器側(cè), 接著可藉由以下操作來(lái)合成上頻帶:將經(jīng)譯碼的下頻帶信號(hào)修補(bǔ)至另外為空的上頻帶中, 以及執(zhí)行后續(xù)的參數(shù)控制式調(diào)整。
[0004] 用于有限頻寬音頻信號(hào)的頻寬擴(kuò)展的標(biāo)準(zhǔn)方法使用將低頻信號(hào)部分(LF)復(fù)制至 高頻率范圍(HF)中的功能,以便估計(jì)由于頻帶限制引起的信息丟失。原則上,此復(fù)制功能 在技術(shù)上等效于藉由單邊帶(SSB)調(diào)制在時(shí)域中計(jì)算的頻譜頻移,但在計(jì)算上要簡(jiǎn)單得多。 這些方法,例如頻譜帶復(fù)制(SBR),描述于以下文獻(xiàn)中:M. Dietz, L. Liljeryd, K. KjdHing 及 0· Kunz,"Spectral Band Replication, a novel approach in audio coding'',第 112 屆 AES 大會(huì),慕尼黑,2002 年 5 月;S.Meltzer,R. B0hm 及F.Henn,"SBR enhanced audio codecs for digital broadcasting such as"Digital Radio Mondiale"(DRM)",第112屆 AES 大會(huì),慕尼黑,2002 年 5 月;T. Ziegler, A. Ehret, P. Ekstrand 及 M. Lutzky,"Enhancing mp3with SBR:Features and Capabilities of the new mp3PR0 Algorithm'',第 112 屆 AES大會(huì),慕尼黑,2002 年 5月;國(guó)際標(biāo)準(zhǔn) IS0/IEC 14496-3:2001/FPDAM l,"Bandwidth Extension",IS0/IEC,2002 年,或 Vasu Iyengar 等人的美國(guó)專利 Nr. 5, 455, 888 "Speech bandwidth extension method and apparatus''。
[0005] 在這些方法中,不進(jìn)行諧波變換,但下頻帶的連續(xù)帶通信號(hào)被引入至上頻帶的連 續(xù)濾波器組通道中。藉此實(shí)現(xiàn)音頻信號(hào)的上頻帶的粗略估計(jì)。接著在另一步驟中,藉由后 處理使用自原始信號(hào)獲得的控制信息來(lái)使該信號(hào)的此粗略估計(jì)接近于原始信號(hào)。此處,例 如,比例因子用來(lái)調(diào)整頻譜包絡(luò)、逆濾波及添加噪聲基底來(lái)調(diào)適音調(diào)及由正弦信號(hào)部分的 補(bǔ)充,如在MPEG4標(biāo)準(zhǔn)中也進(jìn)行了描述。
[0006] 自以下文獻(xiàn)中描述的諧波頻寬擴(kuò)展技術(shù)已知,在合成上頻帶時(shí),不期望的聽 覺(jué)粗糖度可能被引入信號(hào)中:Nagel,F(xiàn). ;Disch,S. A Harmonic Bandwidth Extension Method for Audio Codecs, IEEE Int.Conf.on Acoustics,Speech and Signal Processing (ICASSP), 2009 ;Nagel,F. ;Disch,S. ;Rettelbach, N. A Phase Vocoder Driven Bandwidth Extension Method with Novel Transient Handling for Audio Codecs,第126 屆 AES 大會(huì),2009 年;Zhong, H. ;Villemoes,L. ;Ekstrand,P.等人的 QMF Based Harmonic Spectral Band Replication,第 131 屆音頻工程協(xié)會(huì)大會(huì),2011 年;Villemoes, L.; Ekstrand, P. ;Hedelin, P. Methods for enhanced harmonic transposition, IEEE 的信號(hào) 處理的音頻及聲學(xué)應(yīng)用研討會(huì)(WASPAA),2011年。該粗糙度的一個(gè)原因(許多原因中的一 個(gè))是補(bǔ)?。╬atch)的頻譜未對(duì)準(zhǔn)及/或在下頻帶與第一補(bǔ)丁之間或在連續(xù)補(bǔ)丁之間的過(guò) 渡區(qū)域中的失諧效果。諧波頻寬擴(kuò)展技術(shù)經(jīng)設(shè)計(jì)來(lái)改良這兩個(gè)方面,但以計(jì)算復(fù)雜度為代 價(jià)。
[0007] 在濾波器組域中,尤其在諧波頻寬擴(kuò)展中,濾波器組計(jì)算及修補(bǔ)實(shí)際上可變成很 高的計(jì)算工作量。在WO 98/57436中描述高級(jí)修補(bǔ)技術(shù),該技術(shù)在某種有限程度上,藉由在 不同頻譜補(bǔ)丁之間引入所謂的保護(hù)頻帶及藉由進(jìn)行修改后的向上復(fù)制修補(bǔ)以減少頻譜未 對(duì)準(zhǔn),來(lái)避免失諧影響,同時(shí)使計(jì)算復(fù)雜度保持適度。
[0008] 除此之外,存在另外的方法,諸如所謂的"盲目頻寬擴(kuò)展",其描述于E. Larsen,R. Μ· Aarts 及 Μ· Danessis,"Efficient high frequency bandwidth extension of music and speech",第112屆AES大會(huì),德國(guó),慕尼黑,2002年5月,其中不使用關(guān)于原始HF范圍 的信息。此外,還存在所謂的"人工頻寬擴(kuò)展"方法,該方法描述于K. Kiiyhkd,A Robust Wideband Enhancement for Narrowband Speech Signal;赫爾辛基技術(shù)大學(xué),聲學(xué)及音頻 信號(hào)處理實(shí)驗(yàn)室,2001年的研宄報(bào)告。
[0009] 在 J. M這kinen 等人的:AMR-WB+:a new audio coding standard for 3rd generation mobile audio services Broadcasts,IEEE,ICASSP'05 中,描述一種用于頻寬 擴(kuò)展的方法,其中利用根據(jù)SBR技術(shù)的連續(xù)帶通信號(hào)的向上復(fù)制的頻寬擴(kuò)展的復(fù)制操作由 鏡像操作,例如,由向上取樣所取代。
[0010] 用于頻寬擴(kuò)展的另外的技術(shù)描述于以下文獻(xiàn)中:R. M. Aarts,E. Larsen及 0· Ouweltjes,A unified approach to low and high frequency bandwidth extension'', 第 115 屆 AES 大會(huì),美國(guó),紐約,2003 年 10 月;E. Larsen 及 R. M. Aarts,"Audio Bandwidth Extension Application to psychoacoustics,Signal Processing and Loudspeaker Design",John Wiley & Sons 公司,2004 年;E. Larsen,R.M. Aarts 及 M.Danessis, "Efficient high frequency bandwidth extension of music and speech'', 第 112 屆 AES 大會(huì),慕尼黑,2002 年 5 月;J.Makhoul,"Spectral Analysis of Speech by Linear Prediction",IEEE音頻及電聲學(xué)學(xué)報(bào),AU 21 (3),1973年6月;美國(guó)專利申請(qǐng)?zhí)?08/951,029 ;美國(guó)專利第 6, 895, 375 號(hào)。
[0011] 諧波頻寬擴(kuò)展的已知方法表現(xiàn)出高復(fù)雜度。另一方面,復(fù)雜度有所降低的頻寬擴(kuò) 展的方法展示出質(zhì)量損失。尤其在低位速率的情況下,且結(jié)合LF范圍的低頻寬,可能發(fā)生 噪聲,諸如粗糙度及感覺(jué)不好的音色。其原因主要系如下事實(shí):所估計(jì)的HF部分是基于頻 譜的LF部分的一個(gè)或多個(gè)直接復(fù)制或鏡像操作。
【發(fā)明內(nèi)容】
[0012] 本發(fā)明的一目標(biāo)在于提供一種用于以改良的方式再現(xiàn)音頻信號(hào)的裝置及方法。此 夕卜,本發(fā)明的一目標(biāo)在于提供一種用于產(chǎn)生編碼的音頻信號(hào)的裝置及方法,該編碼音頻信 號(hào)可以改良的方式再現(xiàn)。本發(fā)明的另一目標(biāo)在于提供對(duì)應(yīng)的計(jì)算機(jī)程序及對(duì)應(yīng)的編碼音頻 信號(hào)。
[0013] 此目標(biāo)是藉由以下各者來(lái)實(shí)現(xiàn)的:如權(quán)利要求1所述的用以再現(xiàn)音頻信號(hào)的裝 置,如權(quán)利要求13的用以再現(xiàn)音頻信號(hào)的方法,如權(quán)利要求12的用以產(chǎn)生編碼音頻信號(hào)的 裝置,如權(quán)利要求13的用以產(chǎn)生編碼音頻信號(hào)的方法,如權(quán)利要求14的計(jì)算機(jī)程序及如權(quán) 利要求15的編碼音頻信號(hào)。
[0014] 本發(fā)明的實(shí)施例提供一種用以基于第一數(shù)據(jù)及第二數(shù)據(jù)再現(xiàn)一音頻信號(hào)的裝置, 該第一數(shù)據(jù)表示音頻信號(hào)在第一頻帶中的第一部分的編碼版本,該第二數(shù)據(jù)表示關(guān)于音頻 信號(hào)在第二頻帶中的第二部分的邊信息,其中第二頻帶包含高于第一頻帶的頻率,該裝置 包含:
[0015