專利名稱:音頻編碼器和帶寬擴展解碼器的制作方法
技術領域:
根據(jù)本發(fā)明的實施方式涉及音頻信號處理,更具體地,涉及音頻編碼器、用來提供輸出信號的方法、帶寬擴展解碼器以及用于提供帶寬擴展音頻信號的方法。
背景技術:
對音頻信號進行聽覺適應編碼以減少數(shù)據(jù)從而有效地存儲和傳輸這些信號,在很多領域中已經得到了認可。已知的編碼算法有,例如,MPEG1/2層3“MP3”或MPEG 4 AAC0用于此(特別是當達到最低比特速率時)的編碼算法導致了音頻質量的降低,這通常主要由將被傳輸?shù)囊纛l信號帶寬的編碼器側局限性而導致。使用所謂的核心編碼器(core coder) 來編碼低通濾波信號并參數(shù)化具有較高頻率的區(qū)域,使得它們能夠根據(jù)低通濾波信號而被近似地重構。從WO 9857436可知,將音頻信號在這樣的情況下在編碼器側進行頻帶限制(band limiting)并通過高質量音頻編碼器僅對音頻信號的較低頻帶進行編碼。然而,較高頻帶例如僅通過一組參數(shù)(這些參數(shù)允許較高頻帶的原始頻譜包絡(spectral envelope) 再現(xiàn))來非常粗略地表征。在解碼器側,然后將較高頻帶進行合成。為此,提出了諧波變換(harmonic transposition),其中,將解碼的音頻信號的較低頻帶提供至濾波器組 (filterbank),將較低頻帶的濾波器組信道(channel)連接至較高頻帶的濾波器組信道, 或“暫時地連接(patched)”,并且每個暫時連接的帶通信號受到包絡調節(jié)。這里,屬于特定分析濾波組的合成濾波組接收到較低頻帶的音頻信號的帶通信號和較低頻帶的包絡調節(jié)的帶通信號(它們被協(xié)調地暫時連接至較高頻帶)。合成濾波器組的輸出信號為相對于其音頻帶寬被擴展的音頻信號,其中,該音頻信號以非常低的數(shù)據(jù)速率從編碼器側傳輸?shù)浇獯a器側。特別地,在濾波器組域中的濾波器組計算和暫時連接(patching)可以變?yōu)楦叩挠嬎愎ぷ髁?computational effort)。用于頻帶受限音頻信號(bmd-limited audio signal)的帶寬擴展的復雜性降低的方法替代地將低頻信號部分(LF)的復制功能用在高頻范圍內(HF),以近似由于頻帶限制而丟失的信息。在 M. Dietz,L. Liljeryd,K. Kjorling and 0. Kunz,“Spectral Band Replication,a novel approach in audio coding,,,in 112th AES Convention,Munich, May 2002 ;S. Meltzer, R. Bohm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as “Digital Radio Mondiale,,(DRM),” 112th AE S Convention, Munich,May2002 ;T.Ziegler,A. Ehret, P.Ekstrand and M. Lutzky,“Enhancing mp3 withSBR :Features and Capabilities of the new mp3PR0 Algorithm,,,in 112th AESConvention, Munich, May 2002 ;International Standard IS0/IEC14496-3 :2001/ FPDAM 1, "Bandwidth Extension, “ IS0/IEC, 2002, ^"Speech bandwidth extension method and apparatus,,,Vasu Iyengar et al. US Patent Nr. 5,455,888 中描述了這樣的方法。在這些方法中,沒有執(zhí)行諧波變換,但較低頻帶的相鄰帶通濾波器組信道被人工地引入到較高頻帶的相鄰濾波器組信道。這導致了音頻信號的較高頻帶的大致近似。這種信號的大致近似然后在進一步的步驟中通過定義從原始信號推導的附加控制參數(shù)被精修。 作為一個實例,MPEG-4標準使用用于調節(jié)頻譜包絡的比例因子(scale factor)、用于改寫音調的噪音基底(noise floor)的附加物和反轉過濾的組合以及用于音調分量的補充的正弦信號部分的插入。除此之外,還存在其他的方法,諸如在E. Larsen,R. Μ. Aarts, and Μ. Danessis, "Efficient high-frequency bandwidth extension of music and speech,,, In AES 112th Convention, Munich, Germany, May 2002 中描述的所謂的“盲帶寬擴展(blind bandwidth extension)”,其中,沒有使用關于原始HF范圍的信息。此外,還存在在K. Kayhko, A Robust Wideband Enhancement for Narrowband Speech Signal ;Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing,2001 中描述的所謂的“人工帶寬擴展(Artificial bandwidth extension),, 的方法。在J. Makinen等中描述了 AMR-WB+ —種用于第3代移動音頻服務廣播的新的音頻編碼標準、IEEE、ICASSP' 05、用于帶寬擴展的方法,其中,通過由例如向上采樣低通濾波信號而獲得的鏡象操作來執(zhí)行將低頻分量復制到高頻帶中的操作。作為選擇,可以采用基本上等同于濾波器組域中的復制操作的信號側頻帶調制。能夠使得諧波帶寬擴展的方法通常采用間距確定步驟(間距跟蹤)、非線性畸變 (non-linear distortion)步驟(參見,例如"U· Kornagel,Spectral widening of the excitation signal for telephone-band speech enhancement, in-Proceedings of the IWAENC, Darmstadt,Germany,September 2001,pp. 215-218”)或者使用相位音碼器(例如,如申請?zhí)枮閁S 61/0251 的美國臨時專利申請“F. Nagel,S. Disch !“Apparatus and method of harmonic bandwidth extension in audio signals,,,,所不)。例如,WO 02/41302A1披露了一種用來提高使用高頻重構方法的編碼系統(tǒng)的性能的方法。其披露了如何通過由核心編碼器編碼的低頻帶和由高頻率重構系統(tǒng)編碼的高頻帶之間的交叉頻率的時間上的調整來提高這種系統(tǒng)的整體特性。對于這種方法,核心編碼器必須能夠以不同的交叉頻率在編碼器側和解碼器側進行工作。從而,增加了核心編碼器的復雜性。例如,在"R. M· Aarts,E· Larsen,and 0. Ouweltjes, A unified approach to low—and high-frequency bandwidth extension.In AES 115th Convention, New York, USA, October 2003","E.Larsen and R. M.Aarts :Audio Bandwidth Extension-Application to psychoacoustics, Signal Processing and Loudspeaker Design. John Wiley&Sons,Ltd,2004”,‘ . Larsen,R. M. Aarts,and M. Danessis :Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich,Germany, May 2002”,“J. Makhoul :Spectral Analysis of Speech by Linear Prediction. IEEETransactions on Audio and Electroacoustics,AU-21(3), June 1973", “United States Patent Application 08/951,029, Ohmori et al. :Audio band width extending system and method”禾口“United States Patent 6895375,Malah,D&Cox,R. VS. System for bandwidth extension of Narrow-band speech,,中描述了其他的用于帶寬擴展的技術。諧波帶寬擴展方法通常表現(xiàn)出很高的復雜性,而復雜性降低的帶寬擴展方法表現(xiàn)出質量降低。在將低比特速率與低頻帶的小帶寬結合的具體情況下,則會產生諸如糙澀和令人不舒服的音色的人工產物。其原因在于,近似的HF部分基于不能保持音調信號部分之間的諧波關系的復制操作。這適用于LF和HF之間的諧波關系,還適用于HF部分自身中的連續(xù)的插入碼(patch)之間的諧波關系。例如,在SBR中,在低頻帶和高頻帶之間的邊界處出現(xiàn)的編碼分量和復制分量的毗鄰可能導致粗糙的聲音印象。在圖18中示出了原因,其中,從LF范圍復制到HF范圍內的音調部分在頻譜上很密地與LF范圍的音調部分相鄰。圖18a示出了由三個音調構成的信號的原始聲譜圖1800a。圖18b示出了對應于圖18a的原始信號的帶寬擴展信號的示圖1800b。橫坐標表示時間,縱坐標表示頻率。具體地,在最后一個音調處,可以觀察到潛在的問題1810(模糊的線1810)。如果通過已知方法來考慮諧波關系,這總是基于Fcr評估來進行。在這種情況下, 這些方法的成功主要依賴于該評估的可靠性。
發(fā)明內容
通常,已知的帶寬擴展方法以低比特速率提供音頻信號,但具有差的音頻質量或者以高比特速率而具有好的音頻質量。本發(fā)明的目標在于提供一種用于音頻信號的改善的編碼方案。該目標通過根據(jù)權利要求1的音頻編碼器,根據(jù)權利要求3和權利要求8的帶寬擴展解碼器,以及根據(jù)權利要求12、13和14的方法而實現(xiàn)。本發(fā)明的實施方式提供了一種用來使用輸入音頻信號提供輸出信號的音頻編碼器。該音頻編碼器包括插入碼生成器 (patch generator)、比較器和輸出接口。插入碼生成器被配置為生成至少一個帶寬擴展高頻信號。帶寬擴展高頻信號包括高頻帶,其中,帶寬擴展高頻信號的高頻帶基于輸入音頻信號的低頻帶。如果生成了不同的帶寬擴展高頻信號,則不同的帶寬擴展高頻信號在它們的高頻帶內包括不同的頻率。比較器被配置為計算多個比較參數(shù)?;谳斎胍纛l信號和生成的帶寬擴展高頻信號的比較來計算比較參數(shù)?;谳斎胍纛l信號和生成的帶寬擴展高頻信號之間的不同的偏移頻率(offset frequency)來計算多個比較參數(shù)的每個比較參數(shù)。此外,比較器被配置為根據(jù)多個比較參數(shù)來確定一個比較參數(shù),其中,所述確定的比較參數(shù)滿足預定標準。換句話說,例如,比較器可以被配置為在多個比較參數(shù)中確定能夠最好地滿足預定標準的比較參數(shù)。輸出接口被配置為提供用于傳輸或存儲的輸出信號。該輸出信號包括與確定的比較參數(shù)對應的基于偏移頻率的參數(shù)標識(parameter indication)。換句話說,該輸出信號可以包括所選擇的表示最佳偏移頻率的比較參數(shù)。本發(fā)明的另一個實施方式提供了一種帶寬擴展解碼器,該帶寬擴展解碼器用來基于輸入音頻信號和參數(shù)信號提供帶寬擴展音頻信號。參數(shù)信號包括偏移頻率的標識和功率密度(power density)參數(shù)的標識。帶寬擴展解碼器包括插入碼生成器、組合器和輸出接插入碼生成器被配置為生成包括高頻帶的帶寬擴展高頻信號?;谳斎胍纛l信號的頻帶的一個或多個頻移(frequency shift)來生成帶寬擴展高頻信號的高頻帶。頻移基于偏移頻率(offset frequency)。此外,插入碼生成器被配置為能夠通過等于功率密度參數(shù)的值的因子或等于功率密度參數(shù)的倒數(shù)值的因子來分別放大或衰減帶寬擴展高頻信號的高頻帶。組合器被配置為組合帶寬擴展高頻信號和輸入音頻信號以得到帶寬擴展音頻信號。輸出接口被配置為提供帶寬擴展音頻信號。本發(fā)明的再一個實施方式提供了一種帶寬擴展解碼器,該帶寬擴展解碼器用來基于輸入音頻信號提供帶寬擴展音頻信號。該帶寬擴展解碼器包括插入碼生成器、比較器、組合器和輸出接口。插入碼生成器被配置為基于輸入音頻信號生成至少一個包括高頻帶的帶寬擴展高頻信號,其中,生成的帶寬擴展高頻信號的高頻帶的下限截止頻率(cutoff frequency) 低于輸入音頻信號的上限截止頻率。如果生成了不同的帶寬擴展高頻信號,則不同的生成的帶寬擴展高頻信號在它們的高頻帶中包括不同的頻率。比較器被配置為計算多個比較參數(shù)?;谳斎胍纛l信號和生成的帶寬擴展高頻信號的比較來計算比較參數(shù)?;谳斎胍纛l信號和生成的帶寬擴展高頻信號之間的不同的偏移頻率來計算多個比較參數(shù)中的各個比較參數(shù)。此外,比較器被配置為從多個比較參數(shù)中確定一個比較參數(shù),其中,所述確定的比較參數(shù)滿足預定標準。換句話說,例如,比較器被配置為在多個比較參數(shù)中確定能夠最好地滿足預定標準的比較參數(shù)。組合器被配置為組合輸入音頻信號和帶寬擴展高頻信號以得到帶寬擴展音頻信號,其中,用來得到帶寬擴展音頻信號的帶寬擴展高頻信號是基于對應于確定的比較參數(shù)的偏移頻率的。輸出接口被配置為提供帶寬擴展音頻信號。根據(jù)本發(fā)明的實施方式基于這樣的中心思想,即,帶寬擴展高頻信號(也被稱為插入碼)可以被生成并與原始的輸入音頻信號相比較。通過使用帶寬擴展高頻信號的不同的偏移頻率或具有不同的偏移頻率的幾個頻帶擴展高頻信號,可以計算與不同的偏移頻率對應的多個比較參數(shù)。這些比較參數(shù)可以與和音頻質量相關聯(lián)的質量相關。因此,可確定一比較參數(shù),確保帶寬擴展高頻信號和輸入音頻信號的兼容性,從而使音頻質量提高。通過使用基于偏移頻率(其對應于用于原始的輸入音頻信號的高頻帶的重構的確定的比較參數(shù))的參數(shù)標識,可以降低用于編碼的音頻信號的傳輸或存儲的比特速率。 以這種方式,只需要存儲或傳輸輸入音頻信號的低頻部分和參數(shù)標識。隨后將定義術語比較參數(shù)、交叉頻率和參數(shù)標識。根據(jù)本發(fā)明的一些實施方式涉及一種使用交叉關系(cross correlation)來比較輸入音頻信號和生成的帶寬擴展高頻信號以計算比較參數(shù)的比較器。根據(jù)本發(fā)明的另外的實施方式涉及一種插入碼生成器,基于信號側頻帶調制來在時域中生成帶寬擴展高頻信號。本發(fā)明的優(yōu)選實施方式的優(yōu)點在于,提供了一種允許提高音頻質量和/或降低用于傳輸或存儲的比特速率的用于音頻信號的編碼方案。
隨后將參照附圖詳細描述根據(jù)本發(fā)明的實施方式,其中圖1是音頻編碼器的框圖;圖2是帶寬擴展高頻信號生成、輸入音頻信號和生成的帶寬擴展高頻信號的比較以及帶寬擴展高頻信號的功率自適應(power adaptation)的示意圖;圖3是帶寬擴展高頻信號生成、輸入音頻信號和帶寬擴展高頻信號的比較以及帶寬擴展高頻信號的功率自適應(power adaptation)的示意圖;圖4是帶寬擴展編碼器的框圖;圖5是帶寬擴展解碼器的框圖;圖6是帶寬擴展解碼器的框圖;圖7是用來基于輸入音頻信號提供輸出信號的方法的流程圖;圖8是用來提供帶寬擴展音頻信號的方法的流程圖;圖9是用來基于輸入音頻信號提供輸出信號的方法的流程圖;圖10是用來計算比較參數(shù)的方法的流程圖;圖11是偏移頻率的內插的示意圖;圖12是帶寬擴展解碼器的框圖;圖13是用來提供帶寬擴展音頻信號的方法的流程圖;圖14是用來提供帶寬擴展音頻信號的方法的框圖;圖15是帶寬擴展編碼器的框圖;圖16a是使用可變的交叉頻率的三個音調的聲譜圖;圖16b是三個音調的原始音頻信號的聲譜圖;圖17是原始音頻信號、使用恒定交叉頻率的帶寬擴展音頻信號和使用可變的交叉頻率的帶寬擴展音頻信號的能譜圖;圖18a是使用已知的帶寬擴展方法的三個音調的聲譜圖;以及圖18b是三個音調的原始音頻信號的聲譜圖。
具體實施例方式下面,相同的參考標號局部地用于具有相同或相似功能特性的對象和功能單元, 并且參照附圖對其的描述還應當適用于其他附圖,以減少實施方式說明的贅述。圖1示出了根據(jù)本發(fā)明實施方式的使用輸入音頻信號102提供輸出信號132的音頻編碼器100的框圖。輸出信號適于解碼器處的帶寬擴展。因此,音頻編碼器還稱為帶寬擴展編碼器。帶寬擴展編碼器100包括插入碼生成器110、比較器120以及輸出接口 130。 插入碼生成器110連接至比較器120,而比較器120連接至輸出接口 130。插入碼生成器110生成至少一個帶寬擴展高頻信號112。帶寬擴展高頻信號112 包括高頻帶,其中,帶寬擴展高頻信號112的高頻帶基于輸入音頻信號102的低頻帶。如果生成不同的帶寬擴展高頻信號112,則不同帶寬擴展高頻信號112在其高頻帶內包括不同的頻率。比較器120計算多個比較參數(shù)?;趯斎胍纛l信號102和所生成的帶寬擴展高頻信號112的比較來計算比較參數(shù)。基于輸入音頻信號102和所生成的帶寬擴展高頻信號 112之間的不同偏移頻率來計算多個比較參數(shù)中的每個比較參數(shù)。此外,比較器120從多個比較參數(shù)中確定一個比較參數(shù),其中,所確定的比較參數(shù)滿足預定標準。輸出接口 130提供用于傳輸或者存儲的輸出信號132。輸出信號132包括基于對應于所確定的比較參數(shù)的偏移頻率的參數(shù)標識。通過計算用于不同偏移頻率的多個比較參數(shù),可以找出很好地符合原始輸入音頻信號102的帶寬擴展高頻信號112。這可以通過產生均具有不同偏移頻率的多個帶寬擴展高頻信號112或者通過生成一個帶寬擴展高頻信號并將帶寬擴展高頻信號112的高頻帶移動不同的偏移頻率來實現(xiàn)。同樣,產生具有不同偏移頻率的多個帶寬擴展高頻信號112與將它們的高頻帶移動其它不同的偏移頻率的結合也是可以的。例如,生成五個不同帶寬擴展高頻信號112,并且它們中的每個都以恒定偏移頻率被移動了五次。圖2示出了在僅有一個帶寬擴展高頻信號產生并且被移動不同偏移頻率的情況下帶寬擴展高頻信號生成、帶寬擴展高頻信號和輸入音頻信號的比較以及帶寬擴展高頻信號的可選的功率自適應的示意圖200。第一示意圖“功率-頻率”示圖210示意性示出了輸入音頻信號102?;谠撦斎胍纛l信號102,例如,通過將輸入音頻信號102的低頻帶移動222至較高頻(如參考標號所示),插入碼生成器100可以生成帶寬擴展高頻信號112。例如,將低頻帶移動等于核心編碼器(圖1中未示出,其可以是帶寬擴展編碼器100的一部分)的交叉頻率的頻率或另一
預定頻率。然后可以將所生成的帶寬擴展高頻信號112移動不同的偏移頻率232,并且對于各偏移頻率232 (如參考標號230所示),可以通過比較器120來計算比較參數(shù)。例如,偏移頻率232可以相對于核心編碼器的交叉頻率或相對于另一特定頻率來定義,或者可以定義為絕對頻率值。接下來,比較器120確定滿足預定標準的比較參數(shù)值。這樣,可以確定具有對應于預定比較參數(shù)的偏移頻率M2的帶寬擴展高頻信號112(如參考標號240所示)。此外,還可以確定功率密度參數(shù)252(如參考標號250所示)。功率密度參數(shù)252 可以表示具有對應于所確定的比較參數(shù)的偏移頻率的帶寬擴展高頻信號的高頻帶與輸入音頻信號的對應頻帶的比率。例如,比率可以涉及功率密度比率、功率比率或者與頻帶的功率密度相關的量的另一比率??蛇x地,圖3示出了在生成具有不同偏移頻率的多個帶寬擴展高頻信號的情況下,帶寬擴展高頻信號生成、所生成的帶寬擴展高頻信號與輸入音頻信號的比較以及帶寬擴展高頻信號的可選的功率自適應的示意圖330。與圖2所示的順序不同,插入碼生成器110生成了具有不同偏移頻率232的多個帶寬擴展高頻信號112(如參考標號320所示)。這同樣可以通過輸入音頻信號102的低頻帶頻移222到較高的頻率來實現(xiàn)??梢酝ㄟ^恒定頻率加上各帶寬擴展高頻信號112的各偏移頻率232來移動輸入音頻信號102的低頻帶。恒定頻率可以等于核心編碼器的交叉頻率或者另一特定頻率。然后可以計算每個所生成的帶寬擴展高頻信號112的比較參數(shù),并且可以通過比較器120來確定240滿足預定標準的比較參數(shù)。
功率密度參數(shù)可以如上所述地確定250。圖2和圖3所示的概念也可以結合??梢酝ㄟ^兩個信號交叉相關來進行輸入音頻信號102與所生成的帶寬擴展高頻信號112的比較。在這種情況下,比較參數(shù)可以是例如輸入音頻信號102與所生成的帶寬擴展高頻信號112之間的特定偏移頻率的交叉相關的結果。輸出信號132的參數(shù)標識可以是偏移頻率本身、量化的偏移頻率或者是基于偏移
頻率的另一量。通過僅傳輸或者存儲參數(shù)標識,而不是輸入音頻信號102的高頻帶,可以降低傳輸或存儲的比特速率。通過基于對應于滿足預定標準的比較參數(shù)的偏移頻率來選擇參數(shù), 這可以比僅解碼頻帶受限音頻信號產生更好的音頻質量。預定標準可以確定多個比較參數(shù)的,例如,表明具有對應偏移頻率的帶寬擴展高頻信號112比具有其他偏移頻率的帶寬擴展高頻信號112與輸入音頻信號102的匹配好于 70%的一個比較參數(shù),表明具有對應偏移頻率的帶寬擴展信號112是對輸入音頻信號102 的最佳的三個匹配之一的一個比較參數(shù),或者表明具有對應偏移頻率的最佳匹配的帶寬擴展信號112的一個比較參數(shù)。這涉及到生成具有不同偏移頻率的多個帶寬擴展高頻信號 112的情況,以及僅有一個帶寬擴展高頻信號112生成并被移動不同偏移頻率的情況,或者兩種情況的結合。比較參數(shù)可以是交叉相關的結果或者表明具有特定偏移頻率的帶寬擴展高頻信號112與輸入音頻信號102匹配得有多好的另一量。帶寬擴展編碼器100可以包括用于對輸入音頻信號102的低頻帶進行編碼的核心編碼器。該核心編碼器可以包括對應于輸入音頻信號102的編碼的低頻帶的上限截止頻率 (upper cutoff frequency)的交叉頻率。核心編碼器的交叉頻率可以是恒定的或隨時間變化的。實施變化的交叉頻率會增加核心編碼器的復雜性,但也可以提高編碼的靈活性。對于較高頻帶或插入碼,可以重復圖2和/或圖3所示的處理。例如,輸入音頻信號102的低頻帶包括4kHz的上限截止頻率。因此,如果將輸入音頻信號102的低頻帶移動低頻帶的上限截止頻率,以生成帶寬擴展高頻信號112,則帶寬擴展高頻信號112包括具有 4kHz的下限截止頻率以及8kHz的上限截止頻率的高頻帶。可以通過將輸入音頻信號102 的低頻帶移動低頻帶的上限截止頻率的兩倍來重復該處理。因此,新生成的帶寬擴展高頻信號112包括具有SkHz的下限截止頻率和12kHz的上限截止頻率的高頻帶。這可以重復, 直至達到期望的最高頻率??蛇x地,這還可以通過生成具有多個不同高頻帶的一個帶寬擴展高頻信號來實現(xiàn)。如在該實例中所示,輸入音頻信號的低頻帶的帶寬和帶寬擴展高頻信號的高頻帶的帶寬可以是相同的??蛇x地,輸入音頻信號的低頻帶可以展開并且移動,以生成帶寬擴展
高頻信號。確定具有對應于所確定的比較參數(shù)的偏移頻率232的帶寬擴展高頻信號112會在輸入音頻信號102的低頻帶與帶寬擴展高頻信號112的高頻帶之間留下依賴于偏移頻率 242的間隙。該間隙可以通過生成包含例如頻帶限制噪聲的適合該間隙的頻率部分來填充。 可選地,可以將間隙保留為空的,這是因為音頻質量不會受到顯著的影響。圖4示出了根據(jù)本發(fā)明實施方式的使用輸入信號102提供輸出信號132的帶寬擴展編碼器400的框圖。帶寬擴展編碼器400包括插入碼生成器100、比較器120、輸出接口 130、核心編碼器410、帶通濾波器420以及參數(shù)提取單元430。核心編碼器410連接至輸出接口 130以及插入碼生成器110,插入碼生成器110連接至比較器120,比較器120連接至參數(shù)提取單元430,參數(shù)提取單元430連接至輸出接口 130,并且?guī)V波器420連接至比較器120。插入碼生成器110可以被實現(xiàn)為基于輸入音頻信號102來生成帶寬擴展高頻信號 112的調制器。比較器120可以通過由帶通濾波器420濾波的輸入音頻信號102與所生成的帶寬擴展高頻信號112的交叉相關來執(zhí)行它們的比較。滿足預定標準的比較參數(shù)的確定還可以被稱為滯后評估(lag estimation) 0輸出接口 130還可以包括比特流格式器的功能,并且可以包括用于組合由核心編碼器410提供的低頻信號與由參數(shù)提取單元430提供的包括基于偏移頻率的參數(shù)標識的參數(shù)信號432的組合器。此外,輸出接口可以包括熵編碼器或差分編碼器,以降低輸出信號 132的比特速率。組合器和熵或差分編碼器可以是如該實例所示的輸出接口 130的一部分, 或者可以是獨立的單元。音頻信號102可以被劃分為低頻部分和高頻部分。這可以通過核心編碼器410的低通濾波器和帶通濾波器420來完成。低通濾波器可以是核心編碼器410的一部分或者是連接至核心編碼器410的獨立的低通濾波器。低頻部分通過核心編碼器410 (其可以是例如與MPEGlA層3 “MP3”或MPEG 4AAC 標準一致的音頻編碼器或語音編碼器)來處理。低頻部分可以被移動一固定值,例如,通過頻域內的邊帶調制或快速傅里葉變換 (FFT)來移動,從而其位于對應插入碼的目標區(qū)域中的原始低頻區(qū)域以上??蛇x地,可以直接從輸入信號102獲得低頻部分。這可以通過連接至插入碼生成器110的獨立的低通濾波器來完成。以規(guī)則的時間間隔,可以計算(輸入音頻信號的)原始高頻部分和所得的高頻部分(帶寬擴展高頻信號)之間窗口化信號部分的振幅譜之間的交叉相關。這樣,可以確定最大相關的滯后(偏移頻率)。該滯后在原始單側頻帶調制(single side band modulation) 方面可以具有相關因子(correction factor)的意義,即,單側頻帶調制可以另外通過滯后來校正,以使交叉相關最大化。換言之,可以確定對應于滿足預定標準的比較參數(shù)的偏移頻率(也稱為滯后),其中,比較參數(shù)對應于交叉相關,而預定標準可以是尋找最大相關。此外,可以確定振幅譜的絕對值的比率。通過這樣做,可以推導出所獲得的高頻信號應當通過哪個因子被衰減或者放大。換言之,可以確定表示帶寬擴展高頻信號112的高頻帶和原始輸入音頻信號102的對應頻帶之間的功率比率、功率密度、振幅譜的絕對值或與功率密度比率相關的另外的值的功率密度參數(shù)。這可以通過功率密度比較器(其可以是如實例所示的參數(shù)提取單元430的一部分或者是獨立的單元)來完成。為了確定功率密度參數(shù),例如,可以使用通過將輸入音頻信號102的低頻帶移動恒定頻率而生成的帶寬擴展高頻信號112、或者對應于確定的比較參數(shù)的帶寬擴展高頻信號112或者另一個所生成的帶寬擴展高頻信號112。在這種情況下,對應頻帶意味著,例如,具有相同頻率范圍的頻帶。 例如,如果帶寬擴展高頻信號的高頻帶包括從4kHz到8kHz的頻率,則輸入音頻信號的對應頻帶也包括從4kHz到SkHz的范圍。
所獲得的對應于滯后以及對應于振幅的絕對值的校正因子(偏移頻率、功率密度參數(shù))可以隨時間進行內插。換言之,為窗口化的信號部分(為時間幀)所確定的參數(shù)可以針對信號部分的每個時間步長進行內插。該調制(控制)信號(參數(shù)信號)或其參數(shù)化的表示可以存儲或者傳輸至解碼器。 換言之,參數(shù)信號432可以與由核心編碼器410處理的輸入音頻信號102的低頻帶進行組合,以得到可以存儲或傳輸至解碼器的輸出信號132。此外,可以確定用于調節(jié)例如噪聲電平和/或音調的其他參數(shù)。這可以通過參數(shù)提取單元430來完成??梢詫⑵渌膮?shù)添加至參數(shù)信號432。圖4所示的實例示出了時變調制(time variable modulation)的編碼器側的計算。在這種情況下時變調制涉及具有不同偏移頻率的帶寬擴展高頻信號112。對應于滿足預定標準的確定的比較參數(shù)的偏移頻率可以隨時間變化。圖5示出了根據(jù)本發(fā)明實施方式的用來基于輸入音頻信號502和參數(shù)信號504提供帶寬擴展音頻信號532的帶寬擴展解碼器500的框圖。參數(shù)信號504包括偏移頻率的標識(indication)以及功率密度參數(shù)的標識。帶寬擴展解碼器500包括插入碼生成器510、 組合器520以及輸出接口 530。插入碼生成器510連接至組合器520,而組合器520連接至輸出接口 530。插入碼生成器510基于輸入音頻信號502產生包括高頻帶的帶寬擴展高頻信號 512。帶寬擴展高頻信號512的高頻帶基于輸入音頻信號502的頻帶的頻移而產生,其中, 頻移基于偏移頻率。此外,插入碼生成器510通過等于功率密度參數(shù)的值或等于功率密度參數(shù)的倒數(shù)值的因子對帶寬擴展高頻信號512的高頻帶進行放大或衰減。組合器520結合帶寬擴展高頻信號512和輸入音頻信號502,以獲得帶寬擴展音頻信號532,輸出接口 530提供帶寬擴展音頻信號532。例如,如果如上所述地確定偏移頻率,則生成基于偏移頻率的帶寬擴展高頻信號 512可以允許高頻區(qū)域中的輸入音頻信號的頻率范圍的改善的連續(xù)性。此外,通過用功率密度參數(shù)對帶寬擴展高頻信號512的高頻帶進行放大或衰減, 輸入音頻信號502的高頻連續(xù)(high-frequency continuation)的功率密度可以用非常高效的方式完成。這樣,可以不需要歸一化。插入碼生成器510通過以恒定頻率加上偏移頻率來移動輸入音頻信號512的頻帶可以生成帶寬擴展高頻信號512。如果偏移頻率表明頻移向低頻進行,則組合器可以忽略包括比輸入音頻信號502的上限截止頻率低的頻率的帶寬擴展高頻信號512的高頻帶的一部分。插入碼生成器510可以在時域或頻域中產生帶寬擴展高頻信號512。在時域中,插入碼生成器510可以基于單側頻帶調制生成帶寬擴展高頻信號512。此外,輸出接口在提供輸出信號之前可以放大輸出信號。圖6示出了根據(jù)本發(fā)明實施方式的基于輸入音頻信號502和參數(shù)信號504提供帶寬擴展音頻信號532的帶寬擴展解碼器600的框圖。帶寬擴展解碼器600包括插入碼生成器510、組合器520、輸出接口 530、核心解碼器610以及參數(shù)提取單元620。核心解碼器610 連接至插入碼生成器510和組合器520,參數(shù)提取單元620連接至插入碼生成器510和輸出接口 530,插入碼生成器510連接至組合器520,組合器520連接至輸出接口 530。核心解碼器610可以對所接收的比特流602進行解碼,并且將輸入音頻信號502 提供至插入碼生成器501和組合器520。輸入音頻信號502可以包括等于核心解碼器610 的交叉頻率的上限截止頻率。該交叉頻率可以是恒定的或者隨時間變換的。隨時間變換意味著,例如,對于不同時間間隔或時間幀是變化的,但是對于一個時間間隔或時間幀是恒定的。參數(shù)提取單元620可以將參數(shù)信號504從所接收的比特流602中分離,并且將其提供至插入碼生成器510。此外,可以將參數(shù)信號504或所提取的噪聲和/或音調參數(shù)提供至輸出接口 530。插入碼生成器510可以基于偏移頻率調制輸入音頻信號502,以獲得帶寬擴展高頻信號512,并且可以基于包含在參數(shù)信號504中的功率密度參數(shù)放大或衰減帶寬擴展高頻信號512。將該帶寬擴展高頻信號512提供至組合器520。換言之,插入碼生成器510可以基于偏移頻率和功率密度參數(shù)調制輸入音頻信號502,以獲得高頻信號。這可以通過例如在時域中利用內插和/或濾波632對每個時間步長進行單側頻帶調制634來完成。組合器520組合輸入音頻信號502和所生成的帶寬擴展高頻信號512,以獲得帶寬擴展音頻信號532。輸出接口 530提供帶寬擴展音頻信號532并且可以另外包括校正單元。校正單元可以基于由參數(shù)提取單元620提供的參數(shù)執(zhí)行音調校正和/或噪聲校正。校正單元可以是如圖6所示輸出接口 530的一部分,或者可以是獨立的單元。校正單元還可以設置在插入碼生成器與組合器520之間。這樣,校正單元可以僅校正所生成的帶寬擴展高頻信號512的音調和/或噪聲。因為輸入音頻信號502對應于原始音頻信號,所以輸入音頻信號512的音調和噪聲校正不是必需的??傊瑤挃U展解碼器600通過傳輸調制功能,可以從音頻解碼器或核心解碼器的輸出信號(輸入音頻信號)合成并頻譜地形成高頻信號。傳輸調制功能(Transmitted modulation function),例如,意味著基于偏移頻率并且基于功率密度參數(shù)的調制功能。然后可以組合高頻信號和低頻信號,并且可以施加調節(jié)噪聲電平和音調的其他參數(shù)。圖7示出了根據(jù)本發(fā)明實施方式的基于輸入音頻信號提供輸出信號的方法700的流程圖。該方法包括生成至少一個帶寬擴展高頻信號(710)、計算多個比較參數(shù)(720)、從多個比較參數(shù)確定一個比較參數(shù)(730)以及提供用于傳輸或存儲的輸出信號(740)。所生成的帶寬擴展高頻信號包括高頻帶。帶寬擴展高頻信號的高頻帶基于輸入音頻信號的低頻帶。如果生成不同的帶寬擴展高頻信號,則不同的帶寬擴展高頻信號在其高頻帶內包括不同的頻率。基于輸入音頻信號與所生成的帶寬擴展高頻信號的比較來計算比較參數(shù)?;谳斎胍纛l信號與所生成的帶寬擴展高頻信號之間的不同偏移頻率來計算多個比較參數(shù)的每個比較參數(shù)。所確定的比較參數(shù)滿足預定標準。輸出信號包括基于對應于所確定的比較參數(shù)的偏移頻率的參數(shù)標識。圖8示出了根據(jù)本發(fā)明實施方式的基于輸入音頻信號和參數(shù)信號提供帶寬擴展音頻信號的方法800的流程圖。參數(shù)信號包括偏移頻率的標識和功率密度參數(shù)的標識。該方法包括生成帶寬擴展高頻信號(810)、放大或衰減帶寬擴展高頻信號的高頻帶(820)、 組合帶寬擴展高頻信號和輸入音頻信號以獲得帶寬擴展音頻信號(830)以及提供帶寬擴展音頻信號(840)。帶寬擴展高頻信號包括高頻帶?;谳斎胍纛l信號的頻帶的頻移生成帶寬擴展高頻信號的高頻帶(810)。頻移基于偏移頻率。通過等于功率密度參數(shù)的值或者等于功率密度參數(shù)的倒數(shù)值的因子來放大或衰減帶寬擴展高頻信號的高頻帶(820)。圖9示出了根據(jù)本發(fā)明實施方式的基于輸入音頻信號提供輸出信號的方法900的流程圖。該附圖示出了編碼器中的算法的順序的一種可能性。這也可以是下述的數(shù)學形式。實時信號可以通過拉丁小寫體字母來表示,希爾伯特變換后的信號用對應的希臘字母表示,傅里葉變換后的信號用拉丁大寫字母或者可選地用希臘字母表示。輸入信號可以被稱為f(n),輸出信號0(n)./ffFi =/*月<k<kmax表示變換
后的傅里葉,j表示虛數(shù),通常將希爾伯特變換H(.)定義為
權利要求
1.一種音頻編碼器(100)、(400), (1500),所述音頻解碼器用于使用輸入音頻信號 (102)來提供輸出信號(132),包括插入碼生成器(110),被配置為生成至少一個帶寬擴展高頻信號(112),其中,帶寬擴展高頻信號(11 包括高頻帶,其中,帶寬擴展高頻信號(11 的所述高頻帶基于所述輸入音頻信號(102)的低頻帶,以及其中,如果生成不同的帶寬擴展高頻信號(112),則不同的帶寬擴展高頻信號(11 在它們的高頻帶內包括不同頻率;比較器(120),被配置為計算多個比較參數(shù),其中,基于所述輸入音頻信號(102)與所生成的帶寬擴展高頻信號(11 的比較來計算比較參數(shù),其中,基于所述輸入音頻信號 (102)與所生成的帶寬擴展高頻信號(11 之間的不同偏移頻率來計算多個比較參數(shù)中的每一個比較參數(shù),并且其中,所述比較器(120)被配置為從所述多個比較參數(shù)中確定一比較參數(shù),其中,所確定的比較參數(shù)滿足預定的標準;以及輸出接口(130),被配置為提供用于傳輸或存儲的輸出信號(132),其中,所述輸出信號(13 包括基于與所確定的比較參數(shù)對應的偏移頻率的參數(shù)標識。
2.根據(jù)權利要求1所述的音頻解碼器,包括功率密度比較器G30),被配置為基于所生成的帶寬擴展高頻信號(11 的高頻帶和所述輸入音頻信號(10 的對應的頻帶的功率密度來比較參數(shù),以獲得功率密度參數(shù),其中,功率密度參數(shù)表示基于所生成的帶寬擴展高頻信號(11 的高頻帶和所述輸入音頻信號(10 的對應的頻帶的功率密度的比率,并且其中,輸出信號(13 的參數(shù)標識基于所述功率密度參數(shù)。
3.一種帶寬擴展解碼器(500)、(600),其用于基于輸入音頻信號(50 和參數(shù)信號 (504)提供帶寬擴展音頻信號,其中,參數(shù)信號(504)包括偏移頻率的標識和功率密度參數(shù)的標識,所述帶寬擴展解碼器包括插入碼生成器(510),被配置為生成包括高頻帶的帶寬擴展高頻信號(512),其中,基于所述輸入音頻信號(50 的頻帶的頻移來生成所述帶寬擴展高頻信號(51 的所述高頻帶,其中,所述頻移基于所述偏移頻率,以及其中,所述插入碼生成器(510)被配置為通過等于所述功率密度參數(shù)值或等于所述功率密度參數(shù)的倒數(shù)值的因子分別放大或衰減所述帶寬擴展高頻帶信號(512)的所述高頻帶;組合器(5 ),被配置為組合所述帶寬擴展高頻信號(51 和所述輸入音頻信號(502) 以獲得帶寬擴展音頻信號(532);以及輸出接口(530),被配置為提供所述帶寬擴展音頻信號(532)。
4.根據(jù)權利要求3所述的帶寬擴展解碼器,其中,所述組合器(520)被配置為忽略所述帶寬擴展高頻信號(51 的所述高頻帶的一部分,其中,所述帶寬擴展高頻信號(51 的所述高頻帶的被忽略部分包括低于所述輸入音頻信號(502)的上限截止頻率的頻率。
5.根據(jù)權利要求3或4所述的帶寬擴展解碼器,包括核心解碼器(610),被配置為基于編碼的輸入音頻信號(602)生成所述輸入音頻信號(502),其中,所述核心解碼器(610)生成具有恒定的上限截止頻率的所述輸入音頻信號(502),其中,所述插入碼生成器(510)被配置為通過將所述輸入音頻信號(50 的所述頻帶移動與所述輸入音頻信號(50 的所述上限截止頻率加上所述偏移頻率相等的頻率,來生成所述帶寬擴展高頻信號(512)的所述高頻帶(510)。
6.根據(jù)權利要求3 5中的任一項所述的帶寬擴展解碼器,其中,所述插入碼生成器(510)被配置為在時域中生成所述帶寬擴展高頻信號(512)。
7.根據(jù)權利要求6所述的帶寬擴展解碼器,其中,所述插入碼生成器(510)被配置為基于單側頻帶調制來生成所述帶寬擴展高頻信號(512)。
8.一種帶寬擴展解碼器(1200),其用于基于輸入音頻信號(50 提供帶寬擴展音頻信號,包括插入碼生成器(1210),被配置為基于所述輸入音頻信號(50 生成至少一個包括高頻帶的帶寬擴展高頻信號(1212),其中,帶寬擴展高頻信號(121 的所述高頻帶的下限截止頻率低于所述輸入音頻信號(502)的上限截止頻率,并且其中,如果生成不同的帶寬擴展高頻信號(1212),則不同的帶寬擴展高頻信號在它們的高頻帶內包括不同的頻率;比較器(1220),被配置為計算多個比較參數(shù),其中基于所述輸入音頻信號(50 和所生成的帶寬擴展高頻信號(121 來計算比較參數(shù),其中,基于所述輸入音頻信號(502)和所生成的帶寬擴展高頻信號(121 之間的不同偏移頻率來計算多個比較參數(shù)中的每個比較參數(shù),并且其中,所述比較器(1220)被配置為從所述多個比較參數(shù)中確定一個比較參數(shù),其中,所確定的比較參數(shù)滿足預定的標準;組合器(1230),被配置為組合輸入音頻信號(51 和帶寬擴展高頻信號以獲得帶寬擴展音頻信號(532),其中,用于獲得所述帶寬擴展音頻信號(532)的所述帶寬擴展高頻信號基于與所確定的比較參數(shù)對應的偏移頻率;以及輸出接口(1240),被配置為提供所述帶寬擴展音頻信號(532)。
9.根據(jù)權利要求8所述的帶寬擴展解碼器,其中,所述插入碼生成器(1210)被配置為通過等于所述功率密度參數(shù)值或等于所述功率密度參數(shù)的倒數(shù)值的因子分別放大或衰減所述帶寬擴展高頻信號(121 的高頻帶;其中,所述功率密度參數(shù)的標識包含在所述輸入音頻信號(502)中。
10.根據(jù)權利要求3 9中的任一項所述的帶寬擴展解碼器,包括內插裝置,其中,時間幀包括多個時間步長,其中,每個時間幀包括對應的偏移頻率,其中,所述內插裝置被配置為對于每個時間幀的時間步長,內插時間幀的偏移頻率或不同時間幀的多個偏移頻率,以獲得每個時間步長的內插偏移頻率。
11.根據(jù)權利要求1、2、8或9所述的音頻編碼器或帶寬擴展解碼器,其中,所述比較器被配置為通過對所述輸入音頻信號和所生成的帶寬擴展高頻信號的交叉相關的結果進行計算,來執(zhí)行所述輸入音頻信號和所生成的帶寬擴展高頻信號的比較,其中,被計算的所述比較參數(shù)基于交叉相關的結果,其中,所述交叉相關的參數(shù)是所述帶寬擴展高頻信號的偏移頻率,并因此與所計算的比較參數(shù)相關聯(lián)。
12.一種用于使用輸入音頻信號來提供輸出信號的方法(700),所述方法包括生成至少一個帶寬擴展高頻信號(710),其中,帶寬擴展高頻信號包括高頻帶,其中,所述帶寬擴展高頻信號的高頻帶基于所述輸入音頻信號的低頻帶,以及其中,如果生成不同的帶寬擴展高頻信號,則不同的帶寬擴展高頻信號在它們高頻帶內包括不同的頻率;計算多個比較參數(shù)(720),其中,基于所述輸入音頻信號與所生成的帶寬擴展高頻信號的比較來計算比較參數(shù),其中,基于所述輸入音頻信號與所生成的帶寬擴展高頻信號之間的不同的偏移頻率來計算多個比較參數(shù)中的每一個比較參數(shù);從所述多個比較參數(shù)中確定一比較參數(shù)(730),其中,所確定的比較參數(shù)滿足預定的標準;以及提供用于傳輸或存儲的輸出信號(740),其中,所述輸出信號包括基于與所確定的比較參數(shù)對應的偏移頻率的參數(shù)標識。
13.一種用于基于輸入音頻信號和參數(shù)信號來提供帶寬擴展音頻信號的方法(800), 其中,所述參數(shù)信號包括偏移頻率的標識和功率密度參數(shù)的標識,所述方法包括生成包括高頻帶的帶寬擴展高頻信號(810),其中,基于所述輸入音頻信號的頻帶的頻移來生成帶寬擴展高頻信號的高頻帶,其中,所述頻移基于所述偏移頻率;通過等于所述功率密度參數(shù)值或等于所述功率密度參數(shù)的倒數(shù)值的因子來放大或衰減所述帶寬擴展高頻信號的所述高頻帶(820);組合所述帶寬擴展高頻信號和輸入音頻信號以獲得帶寬擴展音頻信號(830);以及提供所述帶寬擴展音頻信號(840)。
14.一種用于基于輸入音頻信號提供帶寬擴展音頻信號的方法(1300),所述方法包括基于所述輸入音頻信號生成至少一個包括高頻帶的帶寬擴展高頻信號(1310),其中, 所述帶寬擴展高頻信號的高頻帶的下限截止頻率低于所述輸入音頻信號的上限截止頻率, 并且其中,如果生成不同的帶寬擴展高頻信號,則不同的帶寬擴展高頻信號在它們的高頻帶內包括不同的頻率;計算多個比較參數(shù)(1320),其中,基于所述輸入音頻信號和所生成的帶寬擴展高頻信號來計算比較參數(shù),其中,基于所述輸入音頻信號和所生成的帶寬擴展高頻信號之間的不同偏移頻率來計算所述多個比較參數(shù)中的每個比較參數(shù),從所述多個比較參數(shù)中確定一個比較參數(shù)(1330),其中,所確定的比較參數(shù)滿足預定的標準;組合所述輸入音頻信號和帶寬擴展高頻信號以獲得帶寬擴展音頻信號(1340),其中, 用于獲得所述帶寬擴展音頻信號的所述帶寬擴展高頻信號基于與所確定的比較參數(shù)對應的偏移頻率;以及提供所述帶寬擴展音頻信號(1350)。
15.一種計算機程序,所述計算機程序具有用來當在計算機或微控制器上運行所述計算機程序時執(zhí)行根據(jù)權利要求12至14之一所述的方法的程序代碼。
全文摘要
一種用于使用輸入音頻信號來提供輸出信號的音頻編碼器,包括插入碼生成器、比較器以及輸出接口。插入碼生成器被配置為生成至少一個帶寬擴展高頻信號,其中,帶寬擴展高頻信號包括高頻帶。帶寬擴展高頻信號的高頻帶基于輸入音頻信號的低頻帶。比較器計算多個比較參數(shù)?;谳斎胍纛l信號與所生成的帶寬擴展高頻信號的比較來計算比較參數(shù)。基于輸入音頻信號與所生成的帶寬擴展高頻信號之間的不同偏移頻率來計算多個比較參數(shù)中的每一個比較參數(shù)。此外,比較器從多個比較參數(shù)中確定一個比較參數(shù),其中,所確定的比較參數(shù)滿足預定的標準。
文檔編號G10L19/08GK102246231SQ200980150442
公開日2011年11月16日 申請日期2009年12月11日 優(yōu)先權日2008年12月15日
發(fā)明者于爾根·赫萊, 克里斯蒂安·格里貝爾, 福雷德里克·納格爾, 紀堯姆·福奇斯, 薩沙·迪施 申請人:弗蘭霍菲爾運輸應用研究公司