專利名稱:用于音頻信號(hào)帶寬擴(kuò)展的設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號(hào)處理,具體地,涉及在可用數(shù)據(jù)速率相當(dāng)小的情況下的音頻
信號(hào)處理。
背景技術(shù):
為了音頻信號(hào)的有效存儲(chǔ)和傳送,用于數(shù)據(jù)減少的音頻信號(hào)的聽覺適配編碼已經(jīng) 在許多領(lǐng)域得到接受。編碼算法尤其以“MP3”或“MP4”而為人所知。尤其在實(shí)現(xiàn)最低比特 速率時(shí),為此而使用的編碼導(dǎo)致了音頻質(zhì)量的下降,這種下降通常主要是由要傳送的音頻 信號(hào)帶寬的編碼器側(cè)限制而導(dǎo)致的。從WO 9857436已知,在這種情況下,在編碼器側(cè)對音頻信號(hào)進(jìn)行頻帶限制,并通 過高質(zhì)量音頻編碼器來僅對音頻信號(hào)的較低頻帶進(jìn)行編碼。然而,僅非常粗略地使用用于 重現(xiàn)較高頻帶的頻譜包絡(luò)的參數(shù)集合來表征較高頻帶。然后,在解碼器側(cè)對較高頻帶進(jìn)行 合成。出于這種原因,提出了一種調(diào)和置換(harmonic transposition),其中將解碼的音頻 信號(hào)的較低頻帶提供給濾波器組。較低頻帶的濾波器組通道與較高頻帶的濾波器組通道連 接,或“拼接(patch)”,并對每個(gè)拼接的帶通信號(hào)進(jìn)行包絡(luò)調(diào)整。這里,屬于特定解析濾波 器組的合成濾波器組接收較低頻帶中的音頻信號(hào)的帶通信號(hào)和被調(diào)和拼接在較高頻帶中 的較低頻帶的包絡(luò)調(diào)整后的帶通信號(hào)。合成濾波器組的輸出信號(hào)是關(guān)于其帶寬擴(kuò)展的音頻 信號(hào),將該音頻信號(hào)以非常低的數(shù)據(jù)速率從編碼器側(cè)發(fā)送至解碼器側(cè)。特別地,在濾波器組 域中的濾波器組計(jì)算和拼接的計(jì)算代價(jià)可能較高。取而代之地,用于頻帶受限音頻信號(hào)的帶寬擴(kuò)展的復(fù)雜度降低的方法使用一種拷 貝函數(shù),該拷貝函數(shù)將低頻信號(hào)部分(LF)拷貝至高頻范圍(HF),以近似得到由于頻帶限制 而丟失的信息。在以下文獻(xiàn)中描述了這樣的方法M.Dietz,L.Liljeryd,K. Kjorling and 0.Kunz, " Spectral Band Replication, a novel approach in audio coding, " in 112th AES Convention, Munich, May 2002 ;S. Meltzer, R. Bohm and F. Henn, “ SBR enhanced audio codecs for digital broadcasting such as " Digital Radio Mondiale" (DRM), “ 112th AES Convention, Munich, May 2002 ;T.Ziegler, A. Ehret, P.Ekstrand and M. Lutzky, " Enhancing mp3with SBR :Features and Capabilities of the new mp3PR0 Algorithm, “ in 112th AES Convention, Munich, May 2002 MU 標(biāo)準(zhǔn) IS0/IEC 14496-3 :2001/FPDAM 1,“ Bandwidth Extension, “ IS0/IEC, 2002, or "Speech bandwidth extension method and apparatus" , Vasu Iyengar et al.
利 Nr. 5,455,888。在這些方法中,不執(zhí)行調(diào)和置換,而是將較低頻帶的連續(xù)的帶通信號(hào)引入較高頻 帶的連續(xù)的濾波器組通道。由此,實(shí)現(xiàn)了音頻信號(hào)的較高頻帶的粗略近似。然后,在另一步 驟中,通過使用從原始信號(hào)中得到的控制信息來進(jìn)行后處理,使該信號(hào)的粗略近似近似于 原始信號(hào)。這里,例如,如也在MPEG-4標(biāo)準(zhǔn)中描述的,縮放因子用于適配頻譜包絡(luò)、反濾波 和添加噪聲毯(noise carpet)以適配音調(diào)(tonality),以及使用正弦信號(hào)部分來進(jìn)行補(bǔ)充。除此之外,也存在其他方法,如 E. Larsen, R. M. Aarts, and Μ. Danessis, "Efficient high-frequency bandwidth extension of music and speech,,, In AES 112th Convention, Munich, Germany, May 2002中描述的所謂“盲帶寬擴(kuò)展”,其中不使用與原始 HF范圍相關(guān)的信息。此外,也存在所謂的“人工帶寬擴(kuò)展”方法,在K. Kayhko5A Robust Wideband Enhancement for Narrowband Speech Signal ;Research Report,Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001中描述了該方法。在 J. Makinen et al. :AMR-WB+ :a new audio coding standard for 3rdgeneration mobile audio services Broadcasts,IEEE,ICASSP' 05 中,描述了一禾中帶 寬擴(kuò)展方法,其中通過鏡像(例如通過上采樣)來替代根據(jù)SBR技術(shù)使用連續(xù)帶通信號(hào)的 上拷貝(up-copying)來進(jìn)行的帶寬擴(kuò)展的拷貝操作。在以下文獻(xiàn)中描述了用于帶寬擴(kuò)展的其他技術(shù)。R. M. Aarts,E. Larsen,and 0. Ouweltjes,"A unified approach to low—and high frequency bandwidth extension", AES 115th Convention, New York, USA, October 2003 ;E.Larsen and R.M. Aarts, "Audio Bandwidth Extension-Application to psychoacoustics, Signal Processing and Loudspeaker Design,,,John Wiley&Sons, Ltd. , 2004 ;E. Larsen, R. M. Aarts, and M. Danessis,"Efficient high-frequency bandwidth extension of music and speech", AES 112th Convention,Munich,May 2002 ;J. Makhoul,"Spectral Analysis of Speech by Linear Prediction,,,IEEE Transactions on Audio and Electroacoustics, AU-21 (3), June 1973 ;美國專利申請 08/951,029 ;美國專利 No. 6,895,375。調(diào)和帶寬擴(kuò)展的已知方法表現(xiàn)出較高復(fù)雜度。另一方面,復(fù)雜度降低的帶寬擴(kuò)展 方法表現(xiàn)出質(zhì)量損失。尤其在低比特率并結(jié)合LF范圍的低帶寬的情況下,可能出現(xiàn)如粗糙 和被感知為不愉悅的音色之類的偽像。其原因在于,近似的HF部分是基于拷貝操作,該操 作未注意到音調(diào)信號(hào)部分互相之間的調(diào)和關(guān)系。這適用于LF和HF之間的調(diào)和關(guān)系,也適 用于HF部分自身之內(nèi)的調(diào)和關(guān)系。例如,使用SBR,在LF范圍和產(chǎn)生的HF范圍之間的邊界 上,例如,如圖4a中所示,由于從LF范圍拷貝至HF范圍的音調(diào)部分現(xiàn)在可能在整體信號(hào)中 遇到在頻譜上緊密相鄰的LF范圍的音調(diào)部分,因此時(shí)而會(huì)出現(xiàn)粗糙的聲音印象。因此,在 圖4a中,示意了具有在401、402、403和404處的峰值的原始信號(hào),而示意的測試信號(hào)具有 在405、406、407和408處的峰值。通過將音調(diào)部分從LF范圍拷貝至HF范圍(其中,在圖 4a中,邊界在4250Hz處),測試信號(hào)中的兩個(gè)左側(cè)峰值的距離小于調(diào)和光柵的基頻,這導(dǎo)致 了粗糙感。如在 Zwicker,E. and H. Fasti (1999), Psychoacousti cs :Facts and models. Berlin-Springerverlag中所述,由于音調(diào)補(bǔ)償?shù)念l率組的寬度隨著中心頻率的增大而增 大,這里,將位于不同頻率組中的LF范圍內(nèi)的正弦部分拷貝至HF范圍,可能使其位于相同 的頻率組中,這也導(dǎo)致了粗糙的聽覺印象,從圖4b中可以看到這一點(diǎn)。這里,具體示出了, 將LF范圍拷貝至HF范圍導(dǎo)致測試信號(hào)中具有比原始信號(hào)更密的音調(diào)結(jié)構(gòu)。如在410處具 體示出的,原始信號(hào)相對均勻地分布在較高頻率范圍中的頻譜上。相反,在該較高范圍中, 測試信號(hào)411相對不均勻地分別在頻譜上,因此顯然比原始信號(hào)410具有更多音調(diào)。
發(fā)明內(nèi)容
本發(fā)明的目的是實(shí)現(xiàn)具有高質(zhì)量的帶寬擴(kuò)展,同時(shí)實(shí)現(xiàn)具有較低復(fù)雜度的信號(hào)處 理,然而,其可以很小的延遲和很小的代價(jià)來實(shí)現(xiàn),因此,也可以在處理器速度和所需存儲(chǔ) 器方面具有降低的硬件要求的處理器來實(shí)現(xiàn)。這個(gè)目的是通過根據(jù)權(quán)利要求1所述的用于帶寬擴(kuò)展的設(shè)備或根據(jù)權(quán)利要求13 所述的用于帶寬擴(kuò)展的方法、或根據(jù)權(quán)利要求14所述的計(jì)算機(jī)程序來實(shí)現(xiàn)的。本發(fā)明的用于帶寬擴(kuò)展的概念基于時(shí)間信號(hào)擴(kuò)展,用于使用大于1的擴(kuò)展因子 產(chǎn)生所述音頻信號(hào)的、作為在時(shí)間上擴(kuò)展的時(shí)間信號(hào)的版本;隨后對該時(shí)間信號(hào)進(jìn)行抽取 以獲得置換的信號(hào);然后,例如使用簡單的帶通濾波器對該置換的信號(hào)進(jìn)行濾波,以提取高 頻信號(hào)部分(可能僅在其幅度上仍分別被畸變或改變),從而獲得原始高頻部分的良好近 似??蛇x地,可以在執(zhí)行信號(hào)擴(kuò)展之前進(jìn)行帶通濾波,使得在擴(kuò)展后的擴(kuò)展信號(hào)中僅存在期 望的頻率范圍,從而可以省略擴(kuò)展之后的帶通濾波。一方面,使用調(diào)和帶寬擴(kuò)展,基于使用用于對時(shí)間信號(hào)進(jìn)行擴(kuò)展的信號(hào)擴(kuò)展器來 進(jìn)行的頻譜擴(kuò)展和調(diào)和延拓,可以防止由拷貝或鏡像操作或兩者而導(dǎo)致的問題。另一方面, 使用簡單的處理器,可以比完整的解析/合成濾波器組更簡單地執(zhí)行時(shí)間擴(kuò)展和隨后的抽 取,例如,完整的解析/合成濾波器組使用調(diào)和置換,其中必須做出額外的判決即應(yīng)當(dāng)如 何進(jìn)行濾波器組域中的拼接。優(yōu)選地,對于信號(hào)擴(kuò)展,使用相位聲碼器,其實(shí)現(xiàn)需要很小的代價(jià)。為了獲得具有 大于2的因子的帶寬擴(kuò)展,也可以并行使用若干相位聲碼器,這樣做是有利的,尤其對于在 實(shí)時(shí)應(yīng)用中必須較低的帶寬擴(kuò)展的延遲??蛇x地,可以使用用于信號(hào)擴(kuò)展的其他方法,例如 PSOLA方法(音高同步疊加)。在本發(fā)明的優(yōu)選實(shí)施例中,首先,在相位聲碼器的幫助下,在具有最大頻率LFmax 的時(shí)間方向上擴(kuò)展LF音頻信號(hào),即擴(kuò)展至信號(hào)的常規(guī)持續(xù)時(shí)間的整數(shù)倍。基于此,在下游 抽取器中,使用時(shí)間擴(kuò)展因子來進(jìn)行信號(hào)的抽取,其總的效果導(dǎo)致了頻譜的擴(kuò)展。這與音 頻信號(hào)的置換相對應(yīng)。最后,將所產(chǎn)生的信號(hào)帶通濾波至(擴(kuò)展因子-1) ^LFmax至擴(kuò)展因 子.LFmax的范圍??蛇x地,可以對通過擴(kuò)展和抽取產(chǎn)生的各個(gè)高頻信號(hào)進(jìn)行帶通濾波,使其 最終加性地覆蓋在整個(gè)高頻范圍上(即從LFmax至k*LFmax)。對于仍期望諧波的更高頻譜密 度的情況,這是明智的。在本發(fā)明的優(yōu)選實(shí)施例中,對若干不同的擴(kuò)展因子并行地執(zhí)行調(diào)和帶寬擴(kuò)展的方 法。作為并行處理的一種替代選擇,也可以是使用單個(gè)相位聲碼器,該相位聲碼器串行操 作,其中對中間結(jié)果進(jìn)行緩存。因此,可以實(shí)現(xiàn)任何帶寬擴(kuò)展的截止頻率??蛇x地,也可以 在頻率方向上直接執(zhí)行信號(hào)的擴(kuò)展,即具體地,通過與相位聲碼器的功能原理相對應(yīng)的對 偶操作來執(zhí)行擴(kuò)展。有利地,在本發(fā)明的實(shí)施例中,不需要在調(diào)和性或基頻方面對信號(hào)進(jìn)行解析。
以下,參照附圖,更詳細(xì)地解釋本發(fā)明的優(yōu)選實(shí)施例,附圖中圖1示出了本發(fā)明的用于音頻信號(hào)的帶寬擴(kuò)展的概念的框圖2a示出了根據(jù)本發(fā)明的一方面的用于音頻信號(hào)的帶寬擴(kuò)展的設(shè)備的框圖;圖2b示出了具有瞬變檢測器的圖2a的概念的改進(jìn);圖3示出了在本發(fā)明的帶寬擴(kuò)展時(shí),使用在特定點(diǎn)處的頻譜的信號(hào)處理的示意 圖;圖4a示出了原始信號(hào)和提供粗糙聲音印象的測試信號(hào)之間的比較;圖4b示出了原始信號(hào)與也導(dǎo)致粗糙聽覺印象的測試信號(hào)的比較;圖5a示出了相位聲碼器的濾波器組實(shí)現(xiàn)方式的示意圖;圖5b示出了圖5a中的濾波器的詳細(xì)圖示;圖5c示出了圖5a的濾波器通道中的幅度信號(hào)和頻率信號(hào)的操作的示意圖;圖6示出了相位聲碼器的變換實(shí)現(xiàn)方式的示意圖;圖7a示出了在帶寬擴(kuò)展環(huán)境中編碼器側(cè)的示意圖;以及圖7b示出了在音頻信號(hào)的帶寬擴(kuò)展環(huán)境中解碼器側(cè)的示意圖。
具體實(shí)施例方式圖1分別示出了用于音頻信號(hào)的帶寬擴(kuò)展的設(shè)備或方法的示意圖。僅以示例方式 將圖1描述為設(shè)備,但是圖1同時(shí)也可以被認(rèn)為是用于帶寬擴(kuò)展的方法的流程圖。這里,在 輸入100,將音頻信號(hào)饋送入該設(shè)備。將音頻信號(hào)提供給信號(hào)擴(kuò)展器102,信號(hào)擴(kuò)展器102 被實(shí)現(xiàn)為用于使用大于1的擴(kuò)展因子產(chǎn)生所述音頻信號(hào)的、作為在時(shí)間上擴(kuò)展的時(shí)間信號(hào) 的版本。在圖1所示的實(shí)施例中,經(jīng)由擴(kuò)展因子輸入104來提供該擴(kuò)展因子。在信號(hào)擴(kuò)展 器102的輸出103處出現(xiàn)的擴(kuò)展的音頻時(shí)間信號(hào)被提供給抽取器105,抽取器105被實(shí)現(xiàn) 為使用與擴(kuò)展因子104匹配的抽取因子來對時(shí)間擴(kuò)展的音頻時(shí)間信號(hào)103進(jìn)行抽取。在 圖1中使用擴(kuò)展因子輸入104以示意圖方式示出了這一點(diǎn),使用虛線來繪出擴(kuò)展因子輸入 104,并將其引至抽取器105。在一個(gè)實(shí)施例中,信號(hào)擴(kuò)展器中的擴(kuò)展因子等于抽取因子的 倒數(shù)。例如,如果在信號(hào)擴(kuò)展器102中應(yīng)用的擴(kuò)展因子為2. 0,則執(zhí)行抽取因子為0. 5的抽 取。然而,如果將抽取描述為執(zhí)行以2為因子的抽取,即每個(gè)第二采樣值被去除,那么在該 圖示中,抽取因子與擴(kuò)展因子相同。也可以根據(jù)實(shí)現(xiàn)方式來使用擴(kuò)展因子和抽取因子之間 的可選比值,例如整數(shù)比值或有理數(shù)比值。然而,當(dāng)擴(kuò)展因子分別等于抽取因子,或等于抽 取因子的倒數(shù)時(shí),實(shí)現(xiàn)最大調(diào)和帶寬擴(kuò)展。在本發(fā)明的優(yōu)選實(shí)施例中,例如,抽取器105被實(shí)現(xiàn)為去除每個(gè)第二采樣(擴(kuò)展因 子等于2),使得產(chǎn)生抽取的音頻信號(hào)具有與原始音頻信號(hào)100相同的時(shí)間長度。例如,也可 以使用例如形成加權(quán)的平均值或分別考慮到過去或未來的趨勢的其他抽取算法,然而,可 以以非常小的代價(jià),通過采樣的去除來實(shí)現(xiàn)簡單的抽取。將抽取器105產(chǎn)生的抽取的時(shí)間 信號(hào)106提供給濾波器107,其中濾波器107被實(shí)現(xiàn)為從抽取的音頻信號(hào)106中提取帶通 信號(hào),該帶通信號(hào)包含該設(shè)備的輸入處的音頻信號(hào)100中未包含的頻率范圍。在該實(shí)現(xiàn)中, 濾波器107可以被實(shí)現(xiàn)為數(shù)字帶通濾波器,例如FIR或IIR濾波器,或也可以被實(shí)現(xiàn)為模擬 帶通濾波器,但是數(shù)字實(shí)現(xiàn)是優(yōu)選的。此外,濾波器107被實(shí)現(xiàn)為使其提取操作102和105 產(chǎn)生的較高頻譜范圍,然而,其中,無論如何,對音頻信號(hào)100所涵蓋的底部頻譜范圍進(jìn)行 盡可能多的抑制。然而,在該實(shí)現(xiàn)中,濾波器107也可以被實(shí)現(xiàn)為使其也提取具有原始信號(hào) 100中包含的帶通信號(hào)的頻率的信號(hào)部分,其中,所提取的帶通信號(hào)包含原始音頻信號(hào)100中未包含的至少一個(gè)頻帶。將濾波器107輸出的帶通信號(hào)108提供給畸變器109,畸變器109被實(shí)現(xiàn)為對帶通 信號(hào)進(jìn)行畸變,使得該帶通信號(hào)包括預(yù)定包絡(luò)。可以用于進(jìn)行畸變的包絡(luò)信息可以從外部 輸入,或甚至可以來自編碼器或也可以從內(nèi)部產(chǎn)生,例如通過音頻信號(hào)100的盲外插來產(chǎn) 生,或基于解碼器側(cè)存儲(chǔ)的、使用音頻信號(hào)100的包絡(luò)作為索引的表來產(chǎn)生。最后,將畸變 器109輸出的畸變的帶通信號(hào)110提供給組合器111,組合器111被實(shí)現(xiàn)為將畸變的帶通信 號(hào)110與根據(jù)實(shí)現(xiàn)方式也被畸變的原始音頻信號(hào)100組合(在圖1中未示出延遲級),以在 輸出112處產(chǎn)生帶寬擴(kuò)展的音頻信號(hào)。在可選實(shí)現(xiàn)方式中,畸變器109和組合器111的順序與圖1所示的圖示相反。這 里,將濾波器輸出信號(hào),即帶通信號(hào)108直接與音頻信號(hào)100進(jìn)行組合,僅在進(jìn)行組合之后 才由畸變器109對從組合器111輸出的組合信號(hào)的較高頻帶進(jìn)行畸變。在這種實(shí)現(xiàn)方式中, 畸變器操作為用于對組合進(jìn)行進(jìn)行畸變的畸變器,使得組合信號(hào)包括預(yù)定包絡(luò)。因此,在該 實(shí)施例中,組合器被實(shí)現(xiàn)為使其將帶通信號(hào)108與音頻信號(hào)100進(jìn)行組合,以獲得帶寬擴(kuò)展 的音頻信號(hào)。在該實(shí)施例中,僅在組合之后才進(jìn)行畸變,優(yōu)選地,將畸變器109實(shí)現(xiàn)為使得 其分別不影響音頻信號(hào)100或音頻信號(hào)100提供的組合信號(hào)的帶寬,這是由于使用高質(zhì)量 編碼器對音頻信號(hào)的較低頻帶進(jìn)行編碼,而且該較低頻帶在解碼器側(cè)位于較高頻帶的合成 中,可以說,對所有內(nèi)容的度量不應(yīng)受到帶寬擴(kuò)展的干擾。在示意本發(fā)明的詳細(xì)實(shí)施例之前,參照圖7a和7b來示意一種帶寬擴(kuò)展的情形, 其中可以有利的實(shí)現(xiàn)本發(fā)明。在輸入700處,將音頻信號(hào)饋送入低通/高通組合。該低通 /高通組合一方面包括低通(LP),用于產(chǎn)生在圖7a中的703處所示的音頻信號(hào)700的低 通濾波版本。使用音頻編碼器704對該低通濾波的音頻信號(hào)進(jìn)行編碼。例如,該音頻編碼 器是MP3編碼器(MPEG1層3)或AAC編碼器(也稱為MP4編碼器,在MPEG4標(biāo)準(zhǔn)中對其進(jìn) 行了描述)。在編碼器704中,可以使用提供頻帶受限的音頻信號(hào)703的透明(或有利地, 在心理聲學(xué)上透明)表示的可選的音頻編碼器,以分別產(chǎn)生完整編碼的、或心理聲學(xué)編碼 的,以及優(yōu)選地,在心理聲學(xué)上透明編碼的音頻信號(hào)705。濾波器702的高通部分(標(biāo)記為 “HP”)在輸出706處輸出音頻信號(hào)的較高頻帶。將音頻信號(hào)的高通部分,即較高頻帶或HF 頻帶(也標(biāo)記為HF部分)提供給參數(shù)計(jì)算器707,參數(shù)計(jì)算器707被實(shí)現(xiàn)為計(jì)算不同參數(shù)。 例如,這些參數(shù)是以相對粗糙的分辨率來表示的較高頻帶706的頻譜包絡(luò),例如,分別使用 每個(gè)心理聲學(xué)頻率組或Bark尺度上的每個(gè)Bark頻帶的縮放因子來進(jìn)行表示。參數(shù)計(jì)算器 707可以計(jì)算的另一參數(shù)是較高頻帶中的噪聲毯,該噪聲毯的每頻帶能量可以優(yōu)選地與該 頻帶中的包絡(luò)的能量相關(guān)。參數(shù)計(jì)算器707可以計(jì)算的其他參數(shù)包括較高頻帶中的每個(gè) 部分頻帶的音調(diào)度量,該音調(diào)度量指示了頻帶中的頻譜能量是如何分布的,即頻帶中的頻 譜能量是否相對均勻地分布,則其中在該頻帶中存在非音調(diào)信號(hào),或該頻帶中的能量是否 相對強(qiáng)地集中在頻帶中的特定位置,則其中對于該頻帶更可能存在音調(diào)信號(hào)。其他參數(shù)在 于對在較高頻帶中在高度和頻率上相對強(qiáng)地凸起的峰值進(jìn)行顯式編碼,作為帶寬擴(kuò)展的 概念,在沒有這樣的對較高頻帶中的顯著的正弦部分進(jìn)行顯式編碼的情況下的重構(gòu)將只能 非常初步地將其恢復(fù),或完全不能恢復(fù)。在任何情況下,參數(shù)計(jì)算器707被實(shí)現(xiàn)為僅產(chǎn)生用于較高頻帶的參數(shù)708,可以對 該參數(shù)708進(jìn)行與編碼器704中執(zhí)行的用于量化的頻譜值的步驟類似的熵減少步驟,例如差分編碼、預(yù)測或霍夫曼編碼等。然后,將參數(shù)表示708和音頻信號(hào)705提供給下游的格式 器709,格式器709被實(shí)現(xiàn)為提供輸出側(cè)數(shù)據(jù)流710,典型地,該數(shù)據(jù)流是根據(jù)特定格式(如 在MEG4標(biāo)準(zhǔn)中規(guī)范化的格式)的數(shù)據(jù)流。以下參照圖7b來示意尤其適于本發(fā)明的解碼器側(cè)。數(shù)據(jù)流710進(jìn)入數(shù)據(jù)流解釋 器711,數(shù)據(jù)流解釋器711被實(shí)現(xiàn)為將參數(shù)部分708與音頻信號(hào)部分705分離。使用參數(shù)解 碼器712來對參數(shù)部分708進(jìn)行解碼,以獲得解碼的參數(shù)713。與此并行地,使用音頻解碼 器714來對音頻信號(hào)部分705進(jìn)行解碼,以獲得在圖1中的100處所示的音頻信號(hào)。根據(jù)該實(shí)現(xiàn)方式,可以經(jīng)由第一輸出715輸出音頻信號(hào)100。然后,可以在輸出715 處獲得具有小帶寬從而也具有低質(zhì)量的音頻信號(hào)。然而,為了提高質(zhì)量,執(zhí)行本發(fā)明的帶寬 擴(kuò)展720 (例如,如圖1所示地來執(zhí)行),以在輸出側(cè)獲得音頻信號(hào)112,音頻信號(hào)112分別 具有擴(kuò)展的或高的帶寬以及高的質(zhì)量。以下參照圖2a,示意圖1中的帶寬擴(kuò)展實(shí)現(xiàn)方式的優(yōu)選實(shí)現(xiàn)方式,優(yōu)選地,其可以 用于圖7b中的模塊712中。圖2a首先包括標(biāo)記為“音頻信號(hào)和參數(shù)”的模塊,該模塊可以 與圖7b中的模塊711、712和714相對應(yīng),并使用200來標(biāo)記該模塊。模塊200在輸出側(cè)提 供輸出信號(hào)100以及解碼的參數(shù)713,該參數(shù)可以用于不同的畸變,例如用于音調(diào)校正109a 和包絡(luò)調(diào)整109b。將音調(diào)校正109a和包絡(luò)調(diào)整109b分別產(chǎn)生或校正的信號(hào)提供給組合器 111,以在輸出側(cè)獲得具有擴(kuò)展帶寬的音頻信號(hào)112。優(yōu)選地,使用相位聲碼器202a來實(shí)現(xiàn)圖1中的信號(hào)擴(kuò)展器102。優(yōu)選地,使用簡 單的采樣率轉(zhuǎn)換器205a來實(shí)現(xiàn)圖1中的抽取器105。優(yōu)選地,使用簡單的帶通濾波器107a 來實(shí)現(xiàn)用于帶通信號(hào)的提取的濾波器107。特別地,相位聲碼器202a和采樣率抽取器205a 可以以擴(kuò)展因子=2來操作。優(yōu)選地,提供了由相位聲碼器202a、抽取器205a和帶通濾波器207b組成的另一種 “系列”,以在濾波器207b的輸出處提取另一帶通信號(hào),該帶通信號(hào)包括帶通濾波器207a的 上截止頻率與音頻信號(hào)100的最大頻率的3倍之間的頻率范圍。此外,提供了 k相位聲碼器202c,用于實(shí)現(xiàn)因子為k的音頻信號(hào)擴(kuò)展,其中k優(yōu)選 地是大于1的整數(shù)。抽取器205連接至相位聲碼器202c的下游,以k為因子來進(jìn)行抽取。 最后,將抽取的信號(hào)提供給帶通濾波器207c,帶通濾波器207c被實(shí)現(xiàn)為其下截止頻率等于 相鄰支路的上截止頻率,其上截止頻率與音頻信號(hào)100的最大頻率的k倍相對應(yīng)。組合器 209對所有帶通信號(hào)進(jìn)行組合,其中,例如,組合器209可以被實(shí)現(xiàn)為加法器??蛇x地,組合 器209也可以被實(shí)現(xiàn)為加權(quán)加法器,根據(jù)該實(shí)現(xiàn)方式,獨(dú)立于元件109a、109b進(jìn)行的下游畸 變,該加權(quán)加法器對較高頻帶的衰減比對較低頻帶的衰減更強(qiáng)。此外,圖2a所示的系統(tǒng)包 括延遲級211,延遲級211確保在組合器111中進(jìn)行同步的組合,該組合例如可以是逐采樣 相加。圖3示出了在圖1或圖2a所示的處理中可能出現(xiàn)的不同頻譜的示意圖。圖3的部 分圖像⑴示出了例如在圖1中的100處或在圖7a中的703處出現(xiàn)的頻帶受限的音頻信 號(hào)。優(yōu)選地,使用信號(hào)擴(kuò)展器102將該信號(hào)擴(kuò)展至信號(hào)的原始持續(xù)時(shí)間的整數(shù)倍,隨后以整 數(shù)因子對其進(jìn)行抽取,這導(dǎo)致了如圖3中的部分圖像(2)所示的總的頻譜擴(kuò)展。在圖3中 示意了由包括通帶300的帶通濾波器所提取的HF部分。在第三部分圖像(3)中,圖3示出 了變型,其中在帶通信號(hào)的畸變之前,已經(jīng)將該帶通信號(hào)與原始音頻信號(hào)100進(jìn)行組合。因此,產(chǎn)生了具有未畸變的帶通信號(hào)的組合頻譜,其中,如部分圖像(4)所示,然后,進(jìn)行較高 頻帶的畸變,但是,如果可能,對較低頻帶不做修改,以獲得具有擴(kuò)展帶寬的音頻信號(hào)112。部分圖像(1)中的LF信號(hào)具有最大頻率LFmax。相位聲碼器202a執(zhí)行音頻信號(hào)的 置換,使得置換后的音頻信號(hào)的最大頻率為2LFmax?,F(xiàn)在,部分圖像(2)中的所產(chǎn)生的信號(hào) 被帶通濾波至LFmax至2LFmax的范圍。一般而言,當(dāng)使用k(k > 1)來表示擴(kuò)展因子時(shí),帶通 濾波器包括(k-1) ^Fmax至k*LFmax的通帶。對不同的擴(kuò)展因子重復(fù)圖3所示的過程,直到 實(shí)現(xiàn)期望的最高頻率k · LFmax,其中k =最大擴(kuò)展因子kmax。以下,參照圖5和6來示意根據(jù)本發(fā)明的相位聲碼器202a、202b、202c的優(yōu)選實(shí)現(xiàn)方式。圖5a示出了相位聲碼器的濾波器組實(shí)現(xiàn)方式,其中,在輸入500處饋送入音頻信 號(hào),并在輸出510處獲得音頻信號(hào)。具體地,圖5a所示的示意性濾波器組的每個(gè)通道包括 帶通濾波器501和下游振蕩器502。組合器(例如被實(shí)現(xiàn)為加法器并在503處示出)將來 自每個(gè)通道的所有振蕩器的輸出信號(hào)進(jìn)行組合,以獲得輸出信號(hào)。每個(gè)濾波器501被實(shí)現(xiàn) 為使得其一方面提供幅度信號(hào),另一方面提供頻率信號(hào)。該幅度信號(hào)和頻率信號(hào)是示出濾 波器501中的幅度隨時(shí)間進(jìn)展的時(shí)間信號(hào),而頻率信號(hào)則表示由濾波器510濾波的信號(hào)的 頻率進(jìn)展。圖5b中示出了濾波器501的示意設(shè)置??梢匀鐖D5b中所示來對圖5a中的每個(gè)濾 波器501進(jìn)行設(shè)置,然而,其中,只有提供給兩個(gè)輸入混頻器551和加法器552的頻率在 每個(gè)通道中互不相同。低通553對混頻器輸出信號(hào)均進(jìn)行低通濾波,其中,低通信號(hào)與其由 本地振蕩器頻率(L0頻率)所產(chǎn)生時(shí)不同,其相位相差90°。的上方的低通濾波器553提 供了正交信號(hào)554,而下方的低通濾波器553提供了同相信號(hào)555。將這兩個(gè)信號(hào),即I和 Q提供給坐標(biāo)變換器556,坐標(biāo)變換器556從矩形表示產(chǎn)生幅度相位表示。在輸出557處分 別輸出圖5a中的基于時(shí)間的幅度信號(hào)或相位信號(hào)。將相位信號(hào)提供給相位展開器(phase ■wrapper) 558。在元件558的輸出處,不再存在始終在0和360°之間的相位值,而存在線 性增大的相位值。將該“展開”的相位值提供給相位/頻率轉(zhuǎn)換器559,相位/頻率轉(zhuǎn)換器 559例如被實(shí)現(xiàn)為簡單的相位差形成器,用于從當(dāng)前時(shí)間點(diǎn)的相位減去前一時(shí)間點(diǎn)的相位, 以獲得當(dāng)前時(shí)間點(diǎn)的頻率值。將該頻率值與濾波器通道i的常數(shù)頻率值A(chǔ)相加,以在輸出 560處獲得時(shí)變的頻率值。輸出560處的頻率值具有直接分量=和交變分量=頻率偏差, 該頻率偏差是濾波器通道中的信號(hào)的當(dāng)前頻率與平均頻率^的偏差。因此,如圖5a和5b所示,相位聲碼器實(shí)現(xiàn)了頻譜信息與時(shí)間信息的分離。頻譜信 息在專用通道中,或在為每個(gè)通道提供頻率的直接部分的頻率&中,而時(shí)間信息分別被包 含在頻率偏差或基于時(shí)間的幅度中。圖5c示出了根據(jù)本發(fā)明的被執(zhí)行用于帶寬增大的操作,具體地,在相位聲碼器 202a中,更具體地,在圖5a中以虛線繪制的所示電路的位置處執(zhí)行該操作。為了進(jìn)行時(shí)間縮放,例如,可以對每個(gè)通道中的幅度信號(hào)A(t)或每個(gè)信號(hào)中的信 號(hào)頻率f(t)分別進(jìn)行抽取或插值。為了進(jìn)行對本發(fā)明有用的置換,執(zhí)行插值,即信號(hào)A(t) 和f(t)的時(shí)間延伸或擴(kuò)展,以獲得擴(kuò)展的信號(hào)A’ (t)和f’⑴,其中,如圖1所示,由擴(kuò)展 因子104來控制該插值。通過相位變化(即在加法器552進(jìn)行與常數(shù)頻率的相加之前的 值)的插值,未改變圖5a中的每個(gè)單獨(dú)的振蕩器502的頻率。然而,總體音頻信號(hào)的時(shí)間變化放緩(即通過因子2實(shí)現(xiàn))。其結(jié)果是具有原始音高(即原始基波及其諧波)的時(shí)間 擴(kuò)展的音調(diào)。通過執(zhí)行圖5c所示的信號(hào)處理,其中在圖5中的每個(gè)濾波器頻帶通道中執(zhí)行這 種處理,然后在圖1的抽取器105或圖5a的抽取器205a中分別對產(chǎn)生的時(shí)間信號(hào)進(jìn)行抽 取,,將音頻信號(hào)收縮至其原始的持續(xù)時(shí)間,同時(shí)將所有頻率增大為兩倍。這導(dǎo)致了因子為 2的音高置換,然而,其中,所獲得的音頻信號(hào)具有與原始音頻信號(hào)相同的長度,即相同的采 樣數(shù)目。作為圖5a所示的濾波器組實(shí)現(xiàn)方式的一種替代選擇,也可以使用相位聲碼器的 變換實(shí)現(xiàn)方式。這里,將音頻信號(hào)100作為時(shí)間采樣序列饋送入FFT處理器,或者更一般地, 饋送入短時(shí)傅立葉變換處理器600。在圖6中示意性地實(shí)現(xiàn)了 FFT處理器600,用于執(zhí)行音 頻信號(hào)的時(shí)間加窗,以便接著通過FFT來計(jì)算幅度譜和相位譜,其中,這種計(jì)算是對與音頻 信號(hào)的塊相關(guān)的連續(xù)頻譜來執(zhí)行的,這些連續(xù)頻譜的交疊較強(qiáng)。在一種極端情況下,對于每個(gè)新的音頻信號(hào)采樣,可以計(jì)算新的頻譜,其中,例如, 也可以僅對每二十分之一的新采樣來計(jì)算新的頻譜。優(yōu)選地,由控制器602給出兩個(gè)頻譜 之間的采樣距離a。該控制器602還被實(shí)現(xiàn)為向IFFT處理器604進(jìn)行饋送,而該IFFT處理 器604被實(shí)現(xiàn)為在交疊操作中操作。具體地,IFFT處理器604被實(shí)現(xiàn)為使得其基于幅度譜 和相位譜,對每個(gè)頻譜執(zhí)行一次IFFT來執(zhí)行反短時(shí)傅立葉變換,以便接著執(zhí)行疊加操作, 通過該疊加操作來產(chǎn)生時(shí)間范圍。該疊加操作消除了解析窗的效果。通過使IFFT處理器604處理的兩個(gè)頻譜之間的距離b大于在FFT頻譜的產(chǎn)生時(shí) 這兩個(gè)頻譜之間的距離a,實(shí)現(xiàn)了時(shí)間信號(hào)的擴(kuò)展。其基本思想是通過簡單地使逆FFT的間 隔大于解析FFT的間隔來擴(kuò)展音頻信號(hào)。由此,在合成的音頻信號(hào)中出現(xiàn)的頻譜變化比原 始音頻信號(hào)中更慢。然而,在沒有模塊606中的相位重新縮放的情況下,這將導(dǎo)致頻率偽像。例如,當(dāng) 考慮單個(gè)頻率箱(對其實(shí)現(xiàn)了相差45°的連續(xù)相位值)時(shí),這意味著在該濾波器組內(nèi)的信 號(hào)在相位上以1/8圓周的速率增大,即每個(gè)時(shí)間間隔增大45°,其中,這里的時(shí)間間隔是連 續(xù)FFT之間的時(shí)間間隔?,F(xiàn)在,如果逆FFT要互相間隔更遠(yuǎn),則這意味著在更長的時(shí)間間隔 上出現(xiàn)45°的相位增大。這意味著,無意中減小了該信號(hào)部分的頻率。為了消除該偽像頻 率減小,使用與在時(shí)間上對音頻信號(hào)進(jìn)行擴(kuò)展所使用的完全相同的因子來對相位進(jìn)行重新 縮放。因此,以因子b/a來增大每個(gè)FFT頻譜值的相位,以消除無意的頻率減小。盡管在圖5c所示的實(shí)施例中,對圖5a中的濾波器組實(shí)現(xiàn)方式中的一個(gè)信號(hào)振蕩 器實(shí)現(xiàn)了通過幅度/頻率控制信號(hào)的插值來進(jìn)行的擴(kuò)展,但是,在圖6中,通過使兩個(gè)IFFT 頻譜之間的距離大于兩個(gè)FFT頻譜之間的距離,即b大于a來實(shí)現(xiàn)擴(kuò)展,然而,其中,為了防 止偽像,根據(jù)b/a來執(zhí)行相位的重新縮放。關(guān)于相位聲碼器的詳細(xì)描述,參照以下文獻(xiàn)“The phase Vocoder :A tutorial " , Mark Dolson, Computer Music Journal, vol.10, no.4, pp. 14—27,1986 ;或"New phase Vocoder techniques for pitch-shifting, harmonizing and other exotic effects" , L. Laroche und M. Dolson, Proceedings 1999 IEEE Workshop on applications of signal processing to audio and acoustics, New Paltz, New York, October 17—20,1999, pages 91 to 94; “ Newapproached to transient processing interphase vocoder" , A. Robel, Proceeding of the 6th international conference on digital audio effects(DAFx-03), London, UK,September 8-11,2003,pages DAFx-Ito DAFx-6 ; “ Phase-locked Vocoder" ,Meller Puckette, Proceedings 1995, IEEE AS SP, Conference on applications of signal processing to audio and acoustics ;或美國專利申請?zhí)?6,549,884。圖2b示出了圖2a所示的系統(tǒng)的改進(jìn),其中使用了瞬變檢測器250,瞬變檢測器 250被實(shí)現(xiàn)為確定音頻信號(hào)的當(dāng)前時(shí)間操作是否包含瞬變部分。瞬變部分在于以下事實(shí) 音頻信號(hào)總的變化很大,即例如,音頻信號(hào)的能量從一個(gè)時(shí)間部分至下一時(shí)間部分變化 (即增大或減小)的程度大于50%。然而,該50%的閾值僅是示例,該閾值也可以是更小或 更大的值。可選地,對于瞬變檢測,也可以考慮能量分布的改變,例如從話音至咝咝聲的轉(zhuǎn) 換。如果確定了音頻信號(hào)中的瞬變部分,則如260處所示,不進(jìn)行調(diào)和置換,而對于瞬 變時(shí)間范圍,執(zhí)行切換至非調(diào)和拷貝操作或非調(diào)和鏡像或其他一些帶寬擴(kuò)展算法。然后,如 果再次檢測到音頻信號(hào)不再是瞬變,則如圖1中的元件102、105所示,再次執(zhí)行調(diào)和置換。 在圖2b的270處示出了這一點(diǎn)。將模塊270和260的輸出信號(hào)提供給組合器280,由于音頻信號(hào)的時(shí)間部分可能是 瞬變的或非瞬變的,因此模塊270和260的輸出信號(hào)的到達(dá)在時(shí)間上具有偏移,組合器280 被實(shí)現(xiàn)為提供時(shí)間上的帶通信號(hào),例如,可以將該信號(hào)提供給圖2a中的模塊109a中的音調(diào) 校正??蛇x地,例如,也可以在加法器111之后執(zhí)行模塊280的組合。然而,這可能意味著, 對于音頻信號(hào)的整個(gè)變換塊假定了瞬變特性,或者,如果濾波器組實(shí)現(xiàn)方式也基于塊來操 作,則對整個(gè)這樣的塊,分別執(zhí)行對于瞬變或非瞬變的判決。由于如圖2a中所示并在圖5和6中更詳細(xì)解釋的相位聲碼器202a、202b、202c 在瞬變信號(hào)部分的處理中產(chǎn)生比非瞬變信號(hào)部分的處理中所產(chǎn)生的更多的偽像,因此,如 圖2b中的260處所示,執(zhí)行向非調(diào)和拷貝操作或鏡像的切換??蛇x地,例如在以上引用的 Laroche的專業(yè)出版物中或在美國專利號(hào)6,549,884中所描述的,也可執(zhí)行將相位重新設(shè) 置為瞬變。如在模塊109a、109b中已經(jīng)示出的,在產(chǎn)生頻譜的HF部分之后,執(zhí)行頻譜形成和 向噪聲的原始度量的調(diào)整。例如,在縮放因子、dB(A)加權(quán)縮放因子或線性預(yù)測的幫助下, 可以進(jìn)行頻譜形成,其中,線性預(yù)測的優(yōu)點(diǎn)在于,不需要時(shí)間/頻率轉(zhuǎn)換和后續(xù)的頻率/時(shí) 間轉(zhuǎn)換。至此,本發(fā)明的優(yōu)點(diǎn)在于,通過使用相位聲碼器,進(jìn)一步擴(kuò)展了具有增大的頻率的 頻譜,而且,該頻譜通過整數(shù)擴(kuò)展而始終正確地調(diào)和銜接。因此,排除了在LF范圍的截止頻 率處的粗糙感的產(chǎn)生,并防止了由頻譜的HF部分的過度密集的占用而導(dǎo)致的干擾。此外, 可以使用有效的相位聲碼器實(shí)現(xiàn)方式,而且可以在不需要濾波器組拼接操作的情況下而實(shí) 現(xiàn)??蛇x地,也可以使用其他信號(hào)擴(kuò)展方法,例如PSOLA方法(音高同步疊加)。音高 同步疊加,簡稱為PS0LA,是一種合成方法,其中話音信號(hào)的記錄位于數(shù)據(jù)庫中。只要它們是 周期信號(hào),就向其提供關(guān)于基頻(音高)的信息,并標(biāo)記出每個(gè)周期的起始處。在合成中, 使用特定環(huán)境,通過窗函數(shù)來截?cái)噙@些周期,并在合適的位置將其添加至要合成的信號(hào)根據(jù)期望的基頻是高于還是低于數(shù)據(jù)庫條目的基頻,相應(yīng)地,比在原始信號(hào)中更密集或更不 密集的方式對其進(jìn)行組合。為了調(diào)整可聽信號(hào)的持續(xù)時(shí)間,可以省略周期,或以雙倍方式輸 出周期。這種方法也稱為TD-PS0LA,其中TD代表時(shí)域,并強(qiáng)調(diào)該方法在時(shí)域中操作。另一 種發(fā)展是多頻帶重新合成疊加方法,簡稱為MBR0LA。這里,通過預(yù)處理使數(shù)據(jù)庫中的片段具 有均勻的基頻,并對諧波的相位位置進(jìn)行規(guī)范化。由此,在從一個(gè)片段至下一片段的轉(zhuǎn)變的 合成中,產(chǎn)生較少的感知干擾,而且所實(shí)現(xiàn)的話音質(zhì)量更高。在另一種可選方式中,在擴(kuò)展之前,已經(jīng)對音頻信號(hào)進(jìn)行了帶通濾波,使得擴(kuò)展和 抽取之后的信號(hào)已經(jīng)包含期望的部分,可以省略隨后的帶通濾波。在這種情況下,帶通濾波 器被設(shè)置為使得在帶通濾波器的輸出信號(hào)中仍然包括音頻信號(hào)中在帶寬擴(kuò)展之后可能已 被濾除的部分。因此,帶通濾波器包含在擴(kuò)展和抽取之后的音頻信號(hào)106中不包含的頻率 范圍。具有該頻率范圍的信號(hào)是形成合成的高頻信號(hào)的期望信號(hào)。在本實(shí)施例中,畸變器 109不對帶通信號(hào)進(jìn)行畸變,而對從帶通濾波后的音頻信號(hào)導(dǎo)出的擴(kuò)展和抽取后的信號(hào)進(jìn) 行畸變。還要注意,在原始信號(hào)的頻率范圍中,擴(kuò)展信號(hào)也可能是有幫助的,例如通過將原 始信號(hào)與擴(kuò)展信號(hào)混合,因此,不需要“嚴(yán)格”的通帶。然后,擴(kuò)展信號(hào)在其與原始信號(hào)在頻 率上交疊的頻帶中,可以很好地與原始信號(hào)混合,以修正原始信號(hào)在該交疊范圍中的特性。還要注意,畸變109和濾波107的功能可以在單個(gè)濾波器模塊中實(shí)現(xiàn),或可以在兩 個(gè)級聯(lián)的分離的濾波器中實(shí)現(xiàn)。由于畸變是根據(jù)信號(hào)來進(jìn)行的,因此,該濾波器模塊的幅度 特性將是可變的。然而,其頻率特性與信號(hào)無關(guān)。根據(jù)圖1所示的實(shí)現(xiàn)方式,可以首先對整體音頻信號(hào)進(jìn)行擴(kuò)展、抽取,然后進(jìn)行濾 波,其中,濾波與元件107、109的操作相對應(yīng)。因此,在濾波之后或在濾波的同時(shí)執(zhí)行畸變, 其中,出于這種目的,采取數(shù)字濾波器形式的組合的濾波器/畸變器模塊是合適的??蛇x 地,這里,當(dāng)使用兩個(gè)不同的濾波器元件時(shí),可以在(帶通)濾波(107)之前進(jìn)行畸變。再一次,可選地,可以在擴(kuò)展之前進(jìn)行帶通濾波,使得在抽取之后僅進(jìn)行畸變 (109)。為了實(shí)現(xiàn)這種功能,這里,兩個(gè)不同的元件是優(yōu)選的。再一次,可選地,在上述所有變型中,也可以在合成信號(hào)與原始音頻信號(hào)的組合之 后進(jìn)行畸變,例如,可以使用在原始濾波器的頻率范圍中對要濾波的信號(hào)沒有作用或僅有 非常小作用的濾波器,然而,該濾波器在擴(kuò)展的頻率范圍中產(chǎn)生期望的包絡(luò)。在這種情況 下,優(yōu)選地,仍使用兩個(gè)不同元件用于提取和畸變。本發(fā)明的概念適于全帶寬不可用的所有音頻應(yīng)用。在例如通過數(shù)字無線電、因特 網(wǎng)流以及在音頻通信應(yīng)用中對音頻內(nèi)容進(jìn)行傳播時(shí),可使用本發(fā)明的概念。根據(jù)環(huán)境,本發(fā)明的方法可以以硬件或軟件形式被實(shí)現(xiàn)用于分析信息信號(hào)。該實(shí) 現(xiàn)可以在數(shù)字存儲(chǔ)介質(zhì)上執(zhí)行,尤其是其上存儲(chǔ)有電子可讀控制信號(hào)的軟盤或CD,所述控 制信號(hào)可以與可編程計(jì)算機(jī)系統(tǒng)協(xié)作,以執(zhí)行本方法。一般地,因此,本發(fā)明在于具有程序 代碼的計(jì)算機(jī)程序產(chǎn)品,所述程序代碼存儲(chǔ)在機(jī)器可讀載體上,當(dāng)計(jì)算機(jī)程序產(chǎn)品在計(jì)算 機(jī)上執(zhí)行時(shí),所述程序代碼執(zhí)行本方法。換言之,因此,本發(fā)明可以被實(shí)現(xiàn)為具有程序代碼 的計(jì)算機(jī)程序,當(dāng)計(jì)算機(jī)程序在計(jì)算機(jī)上執(zhí)行時(shí),所述程序代碼執(zhí)行本方法。
權(quán)利要求
一種用于音頻信號(hào)的帶寬擴(kuò)展的設(shè)備,包括信號(hào)擴(kuò)展器(102),用于使用大于1的擴(kuò)展因子產(chǎn)生所述音頻信號(hào)的、作為在時(shí)間上擴(kuò)展的時(shí)間信號(hào)的版本;抽取器(105),用于使用與所述擴(kuò)展因子相匹配的抽取因子來對所述音頻信號(hào)的時(shí)間擴(kuò)展的版本(103)進(jìn)行抽??;濾波器(107、109),用于從所抽取的音頻信號(hào)(106)中提取包含所述音頻信號(hào)(100)中未包含的頻率范圍的畸變信號(hào),或在信號(hào)擴(kuò)展器(102)進(jìn)行擴(kuò)展之前從所述音頻信號(hào)中提取信號(hào),所述信號(hào)包含擴(kuò)展和抽取之后的音頻信號(hào)(106)中未包含的頻率范圍,其中所述畸變信號(hào)(108)被畸變?yōu)槭沟盟龌冃盘?hào)(108)、所抽取的音頻信號(hào)或組合信號(hào)包括預(yù)定包絡(luò),以及組合器(111),用于將畸變信號(hào)或未畸變信號(hào)與所述音頻信號(hào)(100)進(jìn)行組合,以獲得帶寬擴(kuò)展的音頻信號(hào)(112)。
2.如權(quán)利要求1所述的設(shè)備,其中,所述信號(hào)擴(kuò)展器被實(shí)現(xiàn)為使用大于1的整數(shù)擴(kuò)展因子,所述抽取器(105)被實(shí)現(xiàn)為使用等于擴(kuò)展因子或擴(kuò)展因子的倒數(shù)的抽取因子;以及 所述濾波器(107)被實(shí)現(xiàn)為提取帶通信號(hào),使得所述帶通信號(hào)包括由所述信號(hào)擴(kuò)展器 和所述抽取器通過擴(kuò)展和抽取而重新產(chǎn)生的頻率范圍。
3.如權(quán)利要求1或2所述的設(shè)備,其中,所述信號(hào)擴(kuò)展器(102)被實(shí)現(xiàn)為對所述音頻信 號(hào)(100)進(jìn)行擴(kuò)展,使得所述音頻信號(hào)的音高不改變。
4.如前述權(quán)利要求之一所述的設(shè)備,其中,所述信號(hào)擴(kuò)展器(102)被實(shí)現(xiàn)為對所述音 頻信號(hào)進(jìn)行擴(kuò)展,使得所述音頻信號(hào)的持續(xù)時(shí)間增加,并使得擴(kuò)展的音頻信號(hào)的帶寬等于 所述音頻信號(hào)的帶寬。
5.如前述權(quán)利要求之一所述的設(shè)備,其中,所述信號(hào)擴(kuò)展器(102)包括相位聲碼器 (202a、202b、202c)。
6.如權(quán)利要求5所述的設(shè)備,其中,以濾波器組或傅立葉變換器的實(shí)現(xiàn)方式來實(shí)現(xiàn)所 述相位聲碼器。
7.如前述權(quán)利要求之一所述的設(shè)備,其中,所述信號(hào)擴(kuò)展器(102)被實(shí)現(xiàn)為以2為因子 來擴(kuò)展信號(hào),以獲得第一擴(kuò)展信號(hào),還存在另一信號(hào)擴(kuò)展器(202b),被實(shí)現(xiàn)為以3為因子來擴(kuò)展信號(hào),以獲得第二擴(kuò)展信號(hào),所述抽取器(105)被實(shí)現(xiàn)為以2為因子來對第一擴(kuò)展信號(hào)進(jìn)行抽取, 還存在另一抽取器(205b),被實(shí)現(xiàn)為以3為因子來對第二擴(kuò)展信號(hào)進(jìn)行抽取, 所述濾波器(107)被實(shí)現(xiàn)為濾除第一抽取器輸出的信號(hào)中新產(chǎn)生的頻帶,或在擴(kuò)展之 前執(zhí)行濾波,還存在第二帶通濾波器(207b),用于從第二抽取信號(hào)中提取相對于第一抽取信號(hào)而言 新的頻帶,或在擴(kuò)展之前執(zhí)行濾波,以及存在另一組合器(209),用于將所提取的信號(hào)相加,或?qū)⒒兒蟮乃崛〉男盘?hào)相加。
8.如權(quán)利要求7所述的設(shè)備,其中,還存在由另一相位聲碼器(202c)、下游抽取器 (205c)和下游帶通濾波器(207c)組成的另一組,這一組被設(shè)置為擴(kuò)展因子(k),以產(chǎn)生向2加法器(209)提供的另一帶通信號(hào)。
9.如前述權(quán)利要求之一所述的設(shè)備,其中,所述信號(hào)擴(kuò)展器(102)被實(shí)現(xiàn)為輸出時(shí)間信號(hào)作為采樣序列,所述采樣序列具有所述 音頻信號(hào)(100)的完整帶寬,以及所述抽取器(105)被實(shí)現(xiàn)為獲得所述采樣序列作為輸入信號(hào),并對所述輸入信號(hào)進(jìn)行 抽取。
10.如前述權(quán)利要求之一所述的設(shè)備,其中,畸變器(109)被實(shí)現(xiàn)為基于傳送的參數(shù) (173)來執(zhí)行畸變。
11.如前述權(quán)利要求之一所述的設(shè)備,還包括瞬變檢測器(250),被實(shí)現(xiàn)為,當(dāng)檢測到音頻信號(hào)中的瞬變部分時(shí),控制信號(hào)擴(kuò)展器 (102)或抽取器(105)執(zhí)行(260)用于產(chǎn)生較高頻譜部分的替代方式。
12.如前述權(quán)利要求之一所述的設(shè)備,還包括音調(diào)/噪聲校正模塊(109a),被實(shí)現(xiàn)為對帶通信號(hào)或畸變的帶通信號(hào)的音調(diào)或噪聲進(jìn) 行處理。
13.如前述權(quán)利要求之一所述的設(shè)備,其中,所述信號(hào)擴(kuò)展器(102)包括多個(gè)濾波器通 道,其中,每個(gè)濾波器通道包括用于產(chǎn)生時(shí)變幅度信號(hào)(557)和時(shí)變頻率信號(hào)(560)的濾波 器和能夠由這些時(shí)變信號(hào)來控制的振蕩器(502),其中,每個(gè)濾波器通道包括用于對時(shí)變幅 度信號(hào)(A(t))進(jìn)行插值以獲得插值的時(shí)變幅度信號(hào)(A’ (t))的插值器,或包括用于使用擴(kuò) 展因子(104)對頻率信號(hào)進(jìn)行插值以獲得插值的頻率信號(hào)的插值器,以及每個(gè)濾波器通道的振蕩器(502)被實(shí)現(xiàn)為由插值的幅度信號(hào)或由插值的頻率信號(hào)來 控制。
14.如權(quán)利要求1至12之一所述的設(shè)備,其中,所述信號(hào)擴(kuò)展器(102)包括FFT處理器(600),用于產(chǎn)生所述音頻信號(hào)的時(shí)間采樣交疊塊的連續(xù)頻譜,其中,所述 交疊塊以第一時(shí)間距離(a)彼此分隔;IFFT處理器,用于將連續(xù)頻譜從頻率范圍變換至?xí)r間范圍,以產(chǎn)生以第二時(shí)間距離 (b)彼此分隔的時(shí)間采樣交疊塊,所述第二時(shí)間距離(b)大于所述第一時(shí)間距離(a);以及相位重新縮放器(606),用于根據(jù)所述第一時(shí)間距離(a)與所述第二時(shí)間距離(b)的比 值,對所產(chǎn)生的FFT頻譜序列的頻譜值的相位進(jìn)行重新縮放。
15.一種用于音頻信號(hào)的帶寬擴(kuò)展的方法,包括使用大于1的擴(kuò)展因子產(chǎn)生(102)所述音頻信號(hào)的、作為在時(shí)間上擴(kuò)展的時(shí)間信號(hào)的 版本;使用與所述擴(kuò)展因子相匹配的抽取因子來對所述音頻信號(hào)的時(shí)間擴(kuò)展的版本(103) 進(jìn)行抽取(105);從所抽取的音頻信號(hào)(106)中提取(107、109)包含所述音頻信號(hào)(100)中未包含的頻 率范圍的畸變信號(hào),或進(jìn)行擴(kuò)展(102)之前,從所述音頻信號(hào)中提取信號(hào),所述信號(hào)包含擴(kuò) 展和抽取之后的音頻信號(hào)(106)中未包含的頻率范圍,其中,所述畸變信號(hào)被畸變?yōu)槭沟?所提取的信號(hào)(108)、所抽取的音頻信號(hào)或組合信號(hào)包括預(yù)定包絡(luò),以及將畸變信號(hào)或未畸變信號(hào)與所述音頻信號(hào)(100)進(jìn)行組合(111),以獲得帶寬擴(kuò)展的 音頻信號(hào)(112)。
16. 一種具有程序代碼的計(jì)算機(jī)程序,當(dāng)所述計(jì)算機(jī)程序在計(jì)算機(jī)上執(zhí)行時(shí),所述程序 代碼用于執(zhí)行根據(jù)權(quán)利要求15所述的方法。
全文摘要
為了對音頻信號(hào)進(jìn)行帶寬擴(kuò)展,在信號(hào)擴(kuò)展器中,使用大于1的擴(kuò)展因子在時(shí)間上對音頻信號(hào)進(jìn)行擴(kuò)展。然后,將在時(shí)間上擴(kuò)展的音頻信號(hào)提供給抽取器,以使用與擴(kuò)展因子相匹配的抽取因子來對時(shí)間擴(kuò)展的版本進(jìn)行抽取。對所述抽取操作所產(chǎn)生的頻帶進(jìn)行提取和畸變,并最終與所述音頻信號(hào)進(jìn)行組合,以獲得帶寬擴(kuò)展的音頻信號(hào)。以濾波器組實(shí)現(xiàn)方式或變換實(shí)現(xiàn)方式來實(shí)現(xiàn)的相位聲碼器可以用于信號(hào)擴(kuò)展。
文檔編號(hào)G10L21/02GK101933087SQ200980103756
公開日2010年12月29日 申請日期2009年1月20日 優(yōu)先權(quán)日2008年1月31日
發(fā)明者弗雷德里克·納格爾, 薩沙·迪施, 馬克斯·諾伊恩多夫 申請人:弗勞恩霍夫應(yīng)用研究促進(jìn)協(xié)會(huì)