專利名稱:處理媒體信號的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及處理媒體信號的裝置及其方法,尤其涉及通過使用媒體信號的空間信息生成環(huán)繞信號的裝置及其方法。
背景技術(shù):
一般而言,各種類型的裝置和方法已被廣泛地用于通過使用多聲道媒體信號的空間信息以及聲道縮減混音信號來生成該多聲道媒體信號,其中聲道縮減混音信號是通過將多聲道媒體信號作聲道縮減混音成單聲道或立體聲信號而生成的。
然而,上述的方法和裝置在不適于生成多聲道信號的環(huán)境中是不可使用的。例如,它們對于僅能生成立體聲信號的設(shè)備是不可使用的。換言之,沒有任何現(xiàn)有的在不能通過使用多聲道信號的空間信息生成該多聲道信號的環(huán)境中生成環(huán)繞信號——其中該環(huán)繞信號具有多聲道特征——的方法或裝置。
所以,因為沒有任何現(xiàn)有的在僅能生成單聲道或立體聲信號的設(shè)備中生成環(huán)繞信號的方法或裝置,所以難以高效率地處理媒體信號。
發(fā)明公開 技術(shù)問題 因此,本發(fā)明涉及一種基本上消除了一個或多個由于相關(guān)技術(shù)的局限和缺點引起的問題的處理媒體信號的裝置及其方法。
本發(fā)明的一個目的是提供一種用于處理信號的裝置及其方法,藉之可通過使用媒體信號的空間信息來將該媒體信號轉(zhuǎn)換成環(huán)繞信號。
本發(fā)明的另外的特征和優(yōu)點將在以下的描述中闡述,并將從描述中部分地顯而易見,或者可從本發(fā)明的實踐中認識到。本發(fā)明的目的和其它優(yōu)點將可由書面說明書及其權(quán)利要求書和附圖中具體指出的結(jié)構(gòu)來實現(xiàn)并獲得。
技術(shù)方案 為了實現(xiàn)這些和其它優(yōu)點且根據(jù)本發(fā)明的目的,一種根據(jù)本發(fā)明的處理信號的方法包括通過使用指示多個源之間的特征的空間信息生成對應于這多個源中的每一個源的源映射信息;通過將給出環(huán)繞效果的濾波器信息按源應用于這些源映射信息來生成子渲染信息;通過整合這些子渲染信息中的至少一個生成用于生成環(huán)繞信號的渲染信息;以及通過將此渲染信息應用于通過對這多源進行聲道縮減混音處理生成的聲道縮減混音信號來生成環(huán)繞信號。
為了進一步實現(xiàn)這些和其它優(yōu)點且根據(jù)本發(fā)明的目的,一種處理信號的裝置包括源映射單元,其通過使用指示多個源之間特征的空間信息生成對應于這多個源中的每一個源的源映射信息;子渲染信息生成單元,其通過將具有環(huán)繞效果的濾波器信息按源應用于這些源映射信息來生成子渲染信息;整合單元,其通過整合這些子渲染信息中的至少一個生成用于生成環(huán)繞信號的渲染信息;以及渲染單元,其通過將渲染信息應用于通過對這多個源進行聲道縮減混音處理生成的聲道縮減混音信號來生成環(huán)繞信號。
應理解,以上的一般描述和以下的詳細描述是示例性和說明性的,并且旨在提供對主張權(quán)利的本發(fā)明的進一步解釋。
有益效果 根據(jù)本發(fā)明的信號處理裝置和方法使得接收包括通過對多聲道信號進行聲道縮減混音處理生成的聲道縮減混音信號以及該多聲道信號的空間信息的比特流的解碼器能在不能夠恢復該多聲道信號的環(huán)境中生成具有環(huán)繞效果的信號。
附圖簡述 包括于此以提供對本發(fā)明的進一步理解、并被結(jié)合在本申請中且構(gòu)成其一部分的附圖示出本發(fā)明的實施方式,其與說明書一起可用來解釋本發(fā)明的原理。
附圖中
圖1是根據(jù)本發(fā)明的一個實施例的音頻信號編碼裝置和音頻信號解碼裝置的的框圖; 圖2是根據(jù)本發(fā)明的一個實施例的音頻信號的比特流的結(jié)構(gòu)圖; 圖3是根據(jù)本發(fā)明的一個實施例的空間信息轉(zhuǎn)換單元的詳細框圖; 圖4和圖5是根據(jù)本發(fā)明的一個實施例用于源映射過程的聲道配置的框圖; 圖6和圖7是根據(jù)本發(fā)明的一個實施例用于立體聲的聲道縮減混音信號的渲染單元的詳細框圖; 圖8和圖9是根據(jù)本發(fā)明的一個實施例用于單聲道的聲道縮減混音信號的渲染單元的詳細框圖; 圖10和圖11是根據(jù)本發(fā)明的一個實施例的平滑單元和擴展單元的框圖; 圖12是用于解釋根據(jù)本發(fā)明的一個實施例的第一平滑方法的坐標圖; 圖13是用于解釋根據(jù)本發(fā)明的一個實施例的第二平滑方法的坐標圖; 圖14是用于解釋根據(jù)本發(fā)明的一個實施例的第三平滑方法的坐標圖; 圖15是用于解釋根據(jù)本發(fā)明的一個實施例的第四平滑方法的坐標圖; 圖16是用于解釋根據(jù)本發(fā)明的一個實施例的第五平滑方法的坐標圖; 圖17是用于解釋對應于每個聲道的原型濾波器信息的圖; 圖18是根據(jù)本發(fā)明的一個實施例在空間信息轉(zhuǎn)換單元中生成渲染濾波器信息的第一方法的框圖; 圖19是根據(jù)本發(fā)明的一個實施例在空間信息轉(zhuǎn)換單元中生成渲染濾波器信息的第二方法的框圖; 圖20是根據(jù)本發(fā)明的一個實施例在空間信息轉(zhuǎn)換單元中生成渲染濾波器信息的第三方法的框圖; 圖21是用于解釋根據(jù)本發(fā)明的一個實施例在渲染單元中生成環(huán)繞信號的方法的圖; 圖22是根據(jù)本發(fā)明的一個實施例的第一內(nèi)插法的圖; 圖23是根據(jù)本發(fā)明的一個實施例的第二內(nèi)插法的圖; 圖24是根據(jù)本發(fā)明的一個實施例的塊切換法的圖; 圖25是根據(jù)本發(fā)明的一個實施例應用由窗口長度決定單元決定的窗口長度的位置的框圖; 圖26是根據(jù)本發(fā)明的一個實施例在處理音頻信號中使用的具有各種長度的濾波器的圖; 圖27是根據(jù)本發(fā)明的一個實施例通過使用多個子濾波器來分開地處理音頻信號的方法的圖; 圖28是根據(jù)本發(fā)明的一個實施例向單聲道的聲道縮減混音信號渲染由多個子濾波器生成的分割渲染信息的方法的框圖; 圖29是根據(jù)本發(fā)明的一個實施例向立體聲的聲道縮減混音信號渲染由多個子濾波器生成的分割渲染信息的方法的框圖; 圖30是根據(jù)本發(fā)明的一個實施例的聲道縮減混音信號的第一域轉(zhuǎn)換方法的框圖;以及 圖31是根據(jù)本發(fā)明的一個實施例的聲道縮減混音信號的第二域轉(zhuǎn)換方法的框圖。
本發(fā)明的最佳實施方式 現(xiàn)在將詳細參考本發(fā)明的優(yōu)選實施方式,其示例圖解于附圖中。
圖1是根據(jù)本發(fā)明的一個實施例的音頻信號編碼裝置和音頻信號解碼裝置的的框圖。
參考圖1,編碼裝置10包括聲道縮減混音單元100、空間信息生成單元200、聲道縮減混音信號編碼單元300、空間信息編碼單元400、和多路復用單元500。
如果多源(X1、X2、……、Xn)音頻信號被輸入到聲道縮減混音單元100,則聲道縮減混音單元100將所輸入的信號作聲道縮減混音成聲道縮減混音信號。在這種情形中,聲道縮減混音信號包括單聲道、立體聲及多源音頻信號。
源包括聲道,且在以下的描述中方便地表示為聲道。在本說明書中,以單聲道或立體聲的聲道縮減混音信號作為參考。然而,本發(fā)明不限于單聲道或立體聲的聲道縮減混音信號。
編碼裝置10能可任選地使用從外部環(huán)境直接提供的任意性聲道縮減混音信號。
空間信息生成單元200從多聲道音頻信號生成空間信息。此空間信息可在聲道縮減混音過程中生成。所生成的聲道縮減混音信號和空間信息分別由聲道縮減混音信號編碼單元300和空間信息編碼單元400編碼,然后傳輸至多路復用單元500。
在本發(fā)明中,‘空間信息’是指由解碼裝置從對聲道縮減混音信號進行聲道擴展混音來生成多聲道信號所需的信息,其中該聲道縮減混音信號是由編碼裝置通過對該多聲道信號進行聲道縮減混音處理來生成并被傳輸?shù)皆摻獯a裝置的。空間信息包括空間參數(shù)??臻g參數(shù)包括指示聲道之間的能量差的CLD(聲道電平差)、指示聲道之間的相關(guān)性的ICC(聲道間相干性)、在從兩聲道生成三聲道時使用的CPC(聲道預測系數(shù))等。
在本發(fā)明中,‘聲道縮減混音信號編碼單元’或‘聲道縮減混音信號解碼單元’是指編碼或解碼音頻信號而不是空間信息的編解碼器。在本說明書中,以聲道縮減混音音頻信號為音頻信號而不是空間信息的例子。并且,聲道縮減混音信號編碼或解碼單元可包括MP3、AC-3、DTS、或AAC。此外,聲道縮減混音信號編碼或解碼單元可包括未來的編解碼器以及以前已經(jīng)開發(fā)出來的編解碼器。
多路復用單元500通過將聲道縮減混音信號與空間信息多路復用來生成比特流,然后將所生成的比特流傳輸?shù)浇獯a裝置20。此外,稍后將在圖2中解釋此比特流的結(jié)構(gòu)。
解碼裝置20包括多路分解單元600、聲道縮減混音信號解碼單元700、空間信息解碼單元800、渲染單元900、以及空間信息轉(zhuǎn)換單元1000。
多路分解單元600接收比特流,然后從該比特流中分離出經(jīng)編碼的聲道縮減混音信號和經(jīng)編碼的空間信息。隨后,聲道縮減混音信號解碼單元700對此經(jīng)編碼的聲道縮減混音信號進行解碼,并且空間信息解碼單元800對此經(jīng)編碼的空間信息進行解碼。
空間信息轉(zhuǎn)換單元1000利用經(jīng)解碼的空間信息和濾波器信息生成可應用于聲道縮減混音信號的渲染信息。在這種情形中,將渲染信息應用于該聲道縮減混音信號以生成環(huán)繞信號。
例如,環(huán)繞信號按以下方式生成。首先,由編碼裝置10從多聲道音頻信號生成聲道縮減混音信號的過程可包括利用OTT(一至二)框或TTT(三至三)框的若干步驟。在這種情形中,空間信息可從這些步驟中的每一個生成。空間信息被傳輸?shù)浇獯a裝置20。解碼裝置20然后通過轉(zhuǎn)換空間信息然后用聲道縮減混音信號渲染經(jīng)轉(zhuǎn)換的空間信息來生成環(huán)繞信號。本發(fā)明不是通過對聲道縮減混音信號進行聲道擴展混音處理來生成多聲道信號,而是代之以涉及包括以下步驟的渲染方法提取用于每個聲道擴展混音步驟的空間信息,并通過使用所提取的空間信息執(zhí)行渲染。例如,HRTF(頭部相關(guān)的傳遞函數(shù))濾波在該渲染方法中是可使用的。
在這種情形中,空間信息是也可應用于混合域的值。所以,可根據(jù)域?qū)秩痉诸惓梢韵碌念愋汀?br>
第一類型是通過令聲道縮減混音信號通過混合濾波器組來在混合域上執(zhí)行渲染。在這種情形中,空間信息的域轉(zhuǎn)換是不必要的。
第二類型是在時域上執(zhí)行渲染。在這種情形中,第二類型利用HRTF濾波器是被建模成時域上的FIR(有限逆響應)濾波器或IIR(無限逆響應)濾波器這一事實。所以,將空間信息轉(zhuǎn)換成時域的濾波器系數(shù)的過程是需要的。
第三類型是在不同的頻域上執(zhí)行渲染。例如,此渲染在DFT(離散傅里葉變換)域上執(zhí)行。在這種情形中,將空間信息變換至相應的域中的過程是必需的。特別是,第三類型通過將時域上的濾波替換成頻域上的運算來使快速運算能得以實現(xiàn)。
在本發(fā)明中,濾波器信息是關(guān)于處理音頻信號所需的濾波器的信息,并包括提供給特定濾波器的濾波器系數(shù)。解釋濾波器信息的例子如下。首先,原型濾波器信息是特定濾波器的原始濾波器信息,并可表示為GL_L等。經(jīng)轉(zhuǎn)換的濾波器信息指示在原型濾波器信息已被轉(zhuǎn)換后的濾波器系數(shù),并可表示為GL_L等。子渲染信息是指將原型濾波器信息空間化以生成環(huán)繞信號所得到的濾波器信息,并可表示為FL_L1等。渲染信息是指執(zhí)行渲染所需的濾波器信息,并可表示為HL_L等。經(jīng)內(nèi)插/平滑的渲染信息是指從內(nèi)插/平滑此渲染信息得到的濾波器信息,并可表示為HL-L等。在本說明書中,提到了以上的濾波器信息。然而,本發(fā)明不受濾波器信息的名稱的限制。具體地,以HRTF為濾波器信息的例子。然而,本發(fā)明不限于HRTF。
渲染單元900接收經(jīng)解碼的聲道縮減混音信號和渲染信息,然后利用經(jīng)解碼的聲道縮減混音信號和渲染信息生成環(huán)繞信息。環(huán)繞信號可以是向僅能夠生成立體聲信號的音頻系統(tǒng)提供環(huán)繞效果的信號。除了僅能夠生成立體聲信號的音頻系統(tǒng)外,本發(fā)明還可應用于各種系統(tǒng)。
圖2是根據(jù)本發(fā)明的一個實施例的音頻信號的比特流的結(jié)構(gòu)圖,其中該比特流包括經(jīng)編碼的聲道縮減混音信號和經(jīng)編碼的空間信息。
參考圖2,1幀音頻有效載荷包括聲道縮減混音信號字段和輔助數(shù)據(jù)字段。經(jīng)編碼的空間信息可存儲在此輔助數(shù)據(jù)字段中。例如,如果音頻有效載荷是48~128kbps(千比特/秒),則空間信息可具有5~32kbps的范圍。然而,對音頻有效載荷和空間信息的范圍不設(shè)限制。
圖3是根據(jù)本發(fā)明的一個實施例的空間信息轉(zhuǎn)換單元的詳細框圖。
參考圖3,空間信息轉(zhuǎn)換單元1000包括源映射單元1010、子渲染信息生成單元1020、整合單元1030、處理單元1040、以及域轉(zhuǎn)換單元1050。
源映射單元101通過利用空間信息執(zhí)行源映射來生成對應于音頻信號的每一個源的源映射信息。在這種情形中,源映射信息是指通過利用空間信息等來生成以使其對應于音頻信號的每一個源的每源的信息。源包括聲道,且在這種情形中,生成的是對應于每一聲道的源映射信息??蓪⒃从成湫畔⒈硎緸橄禂?shù)。并且,稍后將參考圖4和圖5詳細解釋源映射過程。
子渲染信息生成單元1020通過利用源映射信息和濾波器信息生成對應于每個源的子渲染信息。例如,如果渲染單元900是HRTF濾波器。則子渲染信息生成單元1020能通過利用HRTF濾波器信息生成子渲染信息。
整合單元1030通過整合子渲染信息以使其對應于聲道縮減混音信號的每一個源來生成渲染信息。通過利用空間信息和濾波器信息生成的渲染信息是指通過被應用于聲道縮減混音信號來生成環(huán)繞信號的信息。并且,渲染信息包括濾波器系數(shù)類型??墒÷哉弦詼p少渲染過程的運算量。隨后,渲染信息被傳輸給處理單元1042。
處理單元1042包括內(nèi)插單元1041和/或平滑單元1042。渲染信息由內(nèi)插單元1041內(nèi)插和/或由平滑單元1042平滑。
域轉(zhuǎn)換單元1050將渲染信息的域轉(zhuǎn)換至渲染單元900所使用的聲道縮減混音信號的域。并且,可向包括圖3中所示的位置在內(nèi)的各種位置之一設(shè)置域轉(zhuǎn)換單元1050。所以,如果渲染信息是在與渲染單元900相同的域上生成的,則可省略域轉(zhuǎn)換單元1050。經(jīng)域轉(zhuǎn)換的渲染信息隨后被傳輸給渲染單元900。
空間信息轉(zhuǎn)換單元1000可包括濾波器信息轉(zhuǎn)換單元1060。在圖3中,濾波器信息轉(zhuǎn)換單元1060被設(shè)置在空間信息轉(zhuǎn)換單元100內(nèi)。替換地,可將濾波器信息轉(zhuǎn)換單元1060設(shè)置在空間信息轉(zhuǎn)換單元100的外部。濾波器信息轉(zhuǎn)換單元1060被轉(zhuǎn)換成適用于從例如HRTF等的隨機濾波器信息生成子渲染信息或渲染信息。濾波器信息的轉(zhuǎn)換過程可包括以下步驟。
首先,包括將域匹配成可應用的步驟。如果濾波器信息的域不匹配執(zhí)行渲染的域,則需要此域匹配步驟。例如,將時域HRTF轉(zhuǎn)換到用于生成渲染信息的DFT、QMF或混合域的步驟是必需的。
第二,可包括系數(shù)約簡步驟。在這種情形中,易于保存經(jīng)域轉(zhuǎn)換的HRTF并將經(jīng)域轉(zhuǎn)換的HRTF應用于空間信息。例如,如果原型濾波器系數(shù)具有長抽頭(tap)數(shù)(長度)的響應,則在5.1聲道的情形中對應的系數(shù)必須存儲在與對應長度合計總共為10的響應相對應的存儲空間中。這增加了存儲器的負載和運算量。為了防止這一問題,可采用在域轉(zhuǎn)換過程中在維持濾波器特性的同時約簡要存儲的濾波器系數(shù)的方法。例如,HRTF響應可被轉(zhuǎn)換成少數(shù)幾個參數(shù)值。在這種情形中,參數(shù)生成過程和參數(shù)值可根據(jù)應用的域而有所不同。
聲道縮減混音信號在用渲染信息進行渲染之前通過域轉(zhuǎn)換單元1110和/或解相關(guān)單元1200。在渲染信息的域與聲道縮減混音信號的域不同的情形中,域轉(zhuǎn)換單元1110轉(zhuǎn)換聲道縮減混音信號的域以將這兩個域匹配起來。
解相關(guān)單元1200被應用于經(jīng)域轉(zhuǎn)換的聲道縮減混音信號。與將解相關(guān)器應用于渲染信息的方法相比,這可能會具有相對較高的運算量。然而,它能夠防止在生成渲染信息的過程中發(fā)生畸變。如果運算量可允許,則解相關(guān)單元1200可包括多個特性上彼此不同的解相關(guān)器。如果聲道縮減混音信號是立體聲信號,則可以不使用解相關(guān)單元1200。在圖3中,在渲染過程中使用的是經(jīng)域轉(zhuǎn)換的單聲道的聲道縮減混音信號——即頻率、混合、QMF或DFT域上單聲道的聲道縮減混音信號的情形中,在相應的域上使用解相關(guān)器。并且,本發(fā)明還包括在時域上使用的解相關(guān)器。在該情形中,是將域轉(zhuǎn)換單元1100之前的單聲道的聲道縮減混音信號直接輸入到解相關(guān)單元1200。第一階或更高階的IIR濾波器(或FIR濾波器)可作為解相關(guān)器使用。
隨后,渲染單元900利用聲道縮減混音信號、經(jīng)解相關(guān)的聲道縮減混音信號、和渲染信息生成環(huán)繞信號。如果聲道縮減混音信號是立體聲信號,則可以不使用經(jīng)解相關(guān)的聲道縮減混音信號。稍后將參考圖6至9描述渲染過程的詳情。
此環(huán)繞信號由域逆轉(zhuǎn)換單元1300轉(zhuǎn)換至時域然后被輸出。如果是這樣的話,用戶就能夠通過立體聲耳機等聽到具有多聲道效果的聲音。
圖4和圖5是根據(jù)本發(fā)明的一個實施例用于源映射過程的聲道配置的框圖。源映射過程是通過利用空間信息生成與音頻信號的每一個源相對應的源映射信息的過程。如在上面描述中提及的,源包括聲道,且可生成源映射信息以使之對應于圖4和圖5中所示的聲道。源映射信息以適用于渲染過程的類型來生成。
例如,如果聲道縮減混音信號是單聲道信號,則能夠利用諸如CLD1~CLD5、ICC1~ICC5等空間信息生成源映射信息。
可將源映射信息表示為諸如D_L(=DL)、D_R(=DR)、D_C(=DC)、D_LFE(=DLFE)、D_Ls(=DLs)、D_R(=DRs)等值。在這種情形中,生成源映射信息的過程可根據(jù)對應于空間信息的樹狀結(jié)構(gòu)、要使用的空間信息的范圍等而變。在本說明書中,聲道縮減混音信號例如是單聲道信號,它不對本發(fā)明構(gòu)成限制。
從渲染單元900輸出的右和左聲道輸出可表達為數(shù)學演算1。
數(shù)學演算1 Lo=L*GL_L′+C*GC_L′+R*GR_L′+Ls*GLs_L′+Rs*GRs_L′ Ro=L*GL_R′+C*GC_R′+R*GR_R′+Ls*GLs_R′+Rs*GRs_R′ 在這種情形中,算子‘*’指示DFT域上的乘積,且可被QMF或時域上的卷積所替代。
本發(fā)明包括由利用空間信息的源映射信息或由利用空間信息和濾波器信息的源映射信息生成L、C、R、Ls和Rs的方法。例如,可僅利用空間信息的CLD或利用空間信息的CLD和ICC來生成源映射信息。僅利用CLD生成源映射信息的方法解釋如下。
在此樹狀結(jié)構(gòu)具有圖4所示的結(jié)構(gòu)的情形中,可將僅利用CLD獲得源映射信息的第一方法表達為數(shù)學演算2。
數(shù)學演算2 在這種情形中, ,且‘m’指示單聲道的聲道縮減混音信號。
在此樹狀結(jié)構(gòu)具有圖5中所示的結(jié)構(gòu)的情形中,僅利用CLD獲得源映射信息的第二方法可表達為數(shù)學演算3。
數(shù)學演算3 如果源映射信息僅利用CLD生成,則三維效果可能下降。所以能夠利用ICC和/或解相關(guān)器來生成源映射信息。并且,通過利用解相關(guān)器輸出信號dx(m)生成的多聲道信息可表達為數(shù)學演算4。
數(shù)學演算4 在這種情形中,‘A’、‘B’和‘C’是可通過利用CLD和ICC來表示的值?!甦0’至‘d3’指示解相關(guān)器。并且,‘m’指示單聲道的聲道縮減混音信號。然而,該方法不可用于生成諸如D_L、D_R等源映射信息。
因此,利用關(guān)于聲道縮減混音信號的CLD、ICC和/或解相關(guān)器生成源映射信息的第一方法將dx(m)(x=0,1,2)視為獨立輸入。在這種情形中,‘dx’可用于根據(jù)數(shù)學演算5生成子渲染濾波器信息的過程。
數(shù)學演算5 FL_L_M=d_L_M*GL_L′(單聲道輸入→左輸出) FL_R_M=d_L_M*GL_R′(單聲道輸入→右輸出) FL_L_Dx=d_L_Dx*GL_L′(Dx輸出→左輸出) FL_R_Dx=d_L_Dx*GL_R′(Dx輸出→右輸出) 并且,渲染信息可利用數(shù)學演算5的結(jié)果根據(jù)數(shù)學演算6來生成。
數(shù)學演算6 HM_L=FL_L_M+FR_L_M+FC_L_M+FLS_L_M+FRS_L_M+FLFE_L_M HM_R=FL_R_M+FR_R_M+FC_R_M+FLS_R_M+FRS_R_M+FLFE_R_M HDx_L=FL_L_Dx+FR_L_Dx+FC_L_Dx+FLS_L_Dx+FRS_L_Dx+FLFE_L_Dx HDx_R=FL_R_Dx+FR_R_Dx+FC_R_Dx+FLS_R_Dx+FRS_R_Dx+FLFE_R_Dx 渲染信息生成過程的詳情稍后解釋。利用CLD、ICC和/或解相關(guān)器生成源映射信息的第一方法將dx輸出值即‘dx(m)’作為獨立輸入處理,這可能增加運算量。
利用CLD、ICC和/或解相關(guān)器生成源映射信息的第二方法采用在頻域上應用的解相關(guān)器。在這種情形中,可將源映射信息表達為數(shù)學演算7。
數(shù)學演算7 在這種情形中,通過在頻域上應用解相關(guān)器,就可生成與應用解相關(guān)器之前相同的諸如D_L、D_R等的源映射信息。所以,它能以簡單的方式實現(xiàn)。
利用CLD、ICC和/或解相關(guān)器生成源映射信息的第三方法采用如第二方法的解相關(guān)器那樣的具有全通特性的解相關(guān)器。在這種情形中,全通特性是指大小固定僅有相位變動。并且,本發(fā)明可采用如第一方法的解相關(guān)器那樣的具有全通特性的解相關(guān)器。
利用CLD、ICC和/或解相關(guān)器生成源映射信息的第四方法通過使用針對相應各聲道(例如,L、R、C、Ls、Rs等)的解相關(guān)器代替使用第二方法的‘d0’至‘d3’來實行解相關(guān)。在這種情形中,可將源映射信息表達為數(shù)學演算8。
數(shù)學演算8 在這種情形中,‘k’是從CLD和ICC值確定的經(jīng)解相關(guān)信號的能量值。并且‘d_L’、‘d_R’、‘d_C’、‘d_Ls’和‘d_Rs’分別指示應用于諸聲道的解相關(guān)器。
利用CLD、ICC和/或解相關(guān)器生成源映射信息的第五方法通過在第四方法中將‘d_L’和‘d_R’配置成相互對稱并在第四方法中將‘d_Ls’和‘d_Rs’配置成相互對稱來使解相關(guān)效果最大化。具體地,假設(shè)d_R=f(d_L)且d_Rs=f(d_Ls),僅需要設(shè)計‘d_L’、‘d_C’和‘d_Ls’。
利用CLD、ICC和/或解相關(guān)器生成源映射信息的第六方法是在第五方法中將‘d_L’和‘d_Ls’配置成具有相關(guān)性。且,也可將‘d_L’和‘d_C’配置成具有相關(guān)性。
利用CLD、ICC和/或解相關(guān)器生成源映射信息的第七方法是將第三方法中的解相關(guān)器用作全通濾波器的串聯(lián)或嵌套結(jié)構(gòu)。第七方法利用了即使將全通濾波器用作串聯(lián)或嵌套結(jié)構(gòu)全通特性也能維持這一事實。在將全通濾波器用作串聯(lián)或嵌套結(jié)構(gòu)的情形中,能夠獲取更多不同種類的相位響應。因此,可使解相關(guān)效果最大化。
利用CLD、ICC和/或解相關(guān)器生成源映射信息的第八方法是將相關(guān)技術(shù)的解相關(guān)器與第二方法的頻域解相關(guān)器一起使用。在這種情形中,可將多聲道信號表達為數(shù)學演算9。
數(shù)學演算9 在這種情形中,濾波器系數(shù)生成過程使用在第一方法中解釋的相同的過程——除了將‘A’改成了‘A+Kd’。
利用CLD、ICC和/或解相關(guān)器生成源映射信息的第九方法是通過在使用相關(guān)技術(shù)的解相關(guān)器的情形中將頻域解相關(guān)器應用于該相關(guān)技術(shù)的解相關(guān)器的輸出來生成經(jīng)進一步解相關(guān)的值。因此,能夠通過克服頻域解相關(guān)器的局限來以很少的運算量生成源映射信息。
利用CLD、ICC和/或解相關(guān)器生成源映射信息的第十方法表達為數(shù)學演算10。
數(shù)學演算10 在這種情形中,‘di_(m)’(i=L,R,C,Ls,Rs)是應用于聲道i的解相關(guān)器輸出值。且,該輸出值可在時域、頻域、QMF域、混合域等上處理。如果輸出值在與當前處理的域不同的域上處理的,則其可由域轉(zhuǎn)換來被轉(zhuǎn)換。能夠?qū)_L、d_R、d_C、d_Ls和d_Rs使用同一個′d。在這種情形中,能以非常簡單的方式表達數(shù)學演算10。
如果數(shù)學演算10被應用于數(shù)學演算1,則可將數(shù)學演算1表達為數(shù)學演算11。
數(shù)學演算11 Lo=HM_L*m+HMD_L*d(m) Ro=HM_R*R+HMD_R*d(m) 在這種情形中,渲染信息HM_L是從組合空間信息與濾波器信息以用輸入m生成環(huán)繞信號Lo所得到的值。且渲染信息HM_R是從組合空間信息與濾波器信息以用輸入m生成環(huán)繞信號Ro所得到的值。此外,‘d(m)’是通過將任意域上的解相關(guān)器輸出值轉(zhuǎn)為當前域上的值而生成的解相關(guān)器輸出值,或是通過在當前域上處理而生成的解相關(guān)器輸出值。渲染信息HMD_L是指示在渲染d(m)時向‘Lo’添加解相關(guān)器輸出值d(m)的程度的值,且還是將空間信息與濾波器信息組合起來得到的值。渲染信息HMD_R是指示在渲染d(m)時向‘Ro’添加解相關(guān)器輸出值d(m)的程度的值。
由此,為了對單聲道的聲道縮減混音信號執(zhí)行渲染處理,本發(fā)明提出了一種通過向聲道縮減混音信號和經(jīng)解相關(guān)的聲道縮減混音信號渲染藉由組合空間信息與濾波器信息(例如,HRTF濾波器系數(shù))而生成的渲染信息來生成環(huán)繞信號的方法。此渲染過程可不拘于域地來執(zhí)行。如果將‘d(m)’表達為在頻域上執(zhí)行的‘d*m’(乘積算子),則可將數(shù)學演算11表達為數(shù)學演算12。
數(shù)學演算12 Lo=HM_L*m+HMD_L*d*m=HMoverall_L*m Ro=HM_R*m+HMD_R*d*m=HMoveralf_R*m 由此,在頻域上對聲道縮減混音信號執(zhí)行渲染過程的情形中,能夠以將從組合空間信息、濾波器信息和解相關(guān)器組合得到的值恰當?shù)乇硎緸槌朔e形式的方式來使運算量最小化。
圖6和圖7是根據(jù)本發(fā)明的一個實施例用于立體聲的聲道縮減混音信號的渲染單元的詳細框圖。
參考圖6,渲染單元900包括渲染單元-A 910和渲染單元-B 920。
如果聲道縮減混音信號是立體聲信號,則空間信息轉(zhuǎn)換單元1000生成用于聲道縮減混音信號的左和右聲道的渲染信息。渲染單元-A 910通過向聲道縮減混音信號的左聲道渲染用于該聲道縮減混音信號的左聲道的渲染信息來生成環(huán)繞信號。并且,渲染單元-B 920通過向聲道縮減混音信號的右聲道渲染用于該聲道縮減混音信號的右聲道的渲染信息來生成環(huán)繞信號。聲道的名稱僅僅是示例性的,它不對本發(fā)明構(gòu)成限制。
渲染信息可包括遞送給同一聲道的渲染信息和遞送給另一個聲道的渲染信息。
例如,空間信息轉(zhuǎn)換單元1000能夠生成輸入至用于聲道縮減混音信號的左聲道的渲染單元的渲染信息HL_L和HL_R,其中渲染信息HL_L被遞送至對應于同一聲道的左輸出,而渲染信息HL_R被遞送至對應于另一個聲道的右輸出。并且,空間信息轉(zhuǎn)換單元1000能夠生成輸入至用于聲道縮減混音信號的右聲道的渲染單元的渲染信息HR_R和HR_L,其中渲染信息HR_R被遞送至對應于同一聲道的右輸出,而渲染信息HR_L被遞送至對應于另一個聲道的左輸出。
參考圖7,渲染單元900包括渲染單元-1A 911、渲染單元-2A 912、渲染單元-1B 921以及渲染單元-2B 922。
渲染單元900接收立體聲的聲道縮減混音信號和來自空間信息轉(zhuǎn)換單元1000的渲染信息。隨后,渲染單元900通過向此立體聲的聲道縮減混音信號渲染此渲染信息來生成環(huán)繞信號。
具體地,渲染單元-1A 911通過利用用于聲道縮減混音信號的左聲道的渲染信息當中的遞送至同一聲道的渲染信息HL_L來執(zhí)行渲染。渲染單元-2A 912通過利用用于聲道縮減混音信號的左聲道的渲染信息當中遞送至另一個聲道的渲染信息HL_R來執(zhí)行渲染。渲染單元-1B 921利用用于聲道縮減混音信號的右聲道的渲染信息當中遞送至同一聲道的渲染信息HR_R來執(zhí)行渲染。且渲染單元-2B 922通過利用用于聲道縮減混音信號的右聲道的渲染信息當中遞送至另一個聲道的渲染信息HR_L來執(zhí)行渲染。
在以下的描述中,遞送至另一個聲道的渲染信息被命名為‘交叉渲染信息’。交叉渲染信息HL_R或HR_L被應用至同一聲道然后由加法器加至另一個聲道。在這種情形中,交叉渲染信息HL_R和/或HR_L可以是0。如果交叉渲染信息HL_R和/或HR_L是0,則意味著對相應路徑?jīng)]有貢獻。
圖6或圖7中所示的環(huán)繞信號生成方法的例子解釋如下。
首先,如果聲道縮減混音信號是立體聲信號,則定義為‘x’的聲道縮減混音信號、定義為‘D’的通過利用空間信息生成的源映射信息、定義為‘G’的原型濾波器信息、定義為‘p’的多聲道信號和定義為‘y’的環(huán)繞信號可由數(shù)學演算13中所示的矩陣表示。
數(shù)學演算13 在這種情形中,如果上述值是在頻域上,則它們可如下展開。
首先,如數(shù)學演算14中所示,可將多聲道信號p表達為通過利用空間信息生成的源映射信息D與聲道縮減混音信號x之間的乘積。
數(shù)學演算14 環(huán)繞信號y如數(shù)學演算15所示可通過向多聲道信號p渲染原型濾波器信息G來生成。
數(shù)學演算15 y=G·p 在這種情形中,如果將數(shù)學演算14代入p,則可生成為數(shù)學演算16。
數(shù)學演算16 y=GDx 在這種情形中,如果將渲染信息H定義為H=GD,則環(huán)繞信號y和聲道縮減混音信號x可具有數(shù)學演算17的關(guān)系。
數(shù)學演算17 y=Hx 因此,在通過處理濾波器信息與源映射信息之積生成渲染信息H之后,將聲道縮減混音信號x乘以渲染信息H以生成環(huán)繞信號y。
根據(jù)渲染信息H的定義,可將渲染信息H表達為數(shù)學演算18。
數(shù)學演算18 H=GD 圖8和圖9是根據(jù)本發(fā)明的一個實施例用于單聲道的聲道縮減混音信號的渲染單元的詳細框圖。
參考圖8,渲染單元900包括渲染單元-A 930和渲染單元-B 940。
如果聲道縮減混音信號是單聲道信號,則空間信息轉(zhuǎn)換單元1000生成渲染信息HM_L和HM_R,其中渲染信息HM_L是在向左聲道渲染此單聲道信號時使用,而渲染信息HM_R是在向右聲道渲染此單聲道信號時使用。
渲染單元-A 930將渲染信息HM_L應用到單聲道的聲道縮減混音信號以生成左聲道環(huán)繞信號。渲染單元-B 940將渲染信息HM_R應用到單聲道的聲道縮減混音信號以生成右聲道環(huán)繞信號。
圖中的渲染單元900不使用解相關(guān)器。然而,如果渲染單元-A 930和渲染單元-B 940分別通過利用數(shù)學演算12中定義的渲染信息Hmoverall_R和Hmoverall_L執(zhí)行渲染,則能夠分別獲得應用了解相關(guān)器的輸出。
同時,在完成對單聲道的聲道縮減混音信號執(zhí)行的渲染后試圖獲得立體聲信號而不是環(huán)繞信號的輸出的情形中,以下兩種方法是可能的。
第一種方法是使用用于立體聲輸出的值來代替使用用于環(huán)繞效果的渲染信息。在這種情形中,可通過僅修改圖3中所示的結(jié)構(gòu)中的渲染信息來獲得立體聲信號。
第二方法是在利用聲道縮減混音信號和空間信息生成多聲道信號的解碼過程中,可通過將解碼過程僅執(zhí)行到獲得特定聲道數(shù)的相應步驟來獲得立體聲信號。
參考圖9,渲染單元900對應于其中經(jīng)解相關(guān)信號被表示為一個,即數(shù)學演算11的情形。渲染單元900包括渲染單元-1A 931、渲染單元-2A 932、渲染單元-1B 941、和渲染單元-2B 942。渲染單元900類似于用于立體聲的聲道縮減混音信號的渲染單元——除了渲染單元900包括用于經(jīng)解相關(guān)信號的渲染單元941和942。
在立體聲的聲道縮減混音信號的情形中,可認為兩聲道之一是經(jīng)解相關(guān)信號。所以,在不采用附加解相關(guān)器的情況下,能夠通過使用先前定義的四種渲染信息HL_L、HL_R等執(zhí)行渲染過程。具體地,渲染單元-1A 931通過將渲染信息HM_L應用于單聲道的聲道縮減混音信號來生成將被遞送至同一聲道的信號。渲染單元-2A 932通過將渲染信息HM_R應用于單聲道的聲道縮減混音信號來生成將被遞送至另一聲道的信號。渲染單元-1B 941通過將渲染信息HMD_R應用于經(jīng)解相關(guān)信號來生成將被遞送至同一聲道的信號。且渲染單元-2B 942通過將渲染信息HMD_L應用于此經(jīng)解相關(guān)信號來生成將遞送至另一聲道的信號。
如果聲道縮減混音信號是單聲道信號,則定義為x的聲道縮減混音信號、定義為D的源聲道信息、定義為G的原型濾波器信息、定義為p的多聲道信號、和定義為y的環(huán)繞信號可由數(shù)學演算19中所示的矩陣表示。
數(shù)學演算19 x=[Mi], 在這種情形中,這些矩陣之間的關(guān)系類似于聲道縮減混音信號是立體聲信號的情形中的關(guān)系。所以省略其詳情。
同時,參考圖4和圖5描述的源映射信息以及通過利用此源映射信息生成的渲染信息具有每頻帶、參數(shù)帶、和/或傳送時隙不同的值。在該情形中,如果源映射信息和/或渲染信息的值在相鄰帶之間或邊界時隙之間具有相當大的差,則在渲染過程中可能會發(fā)生畸變。為了防止此畸變,需要頻域和/或時域上的平滑過程。除了頻域平滑和/或時域平滑外,也可使用適用于渲染的其它平滑方法。并且,可使用從將源映射信息或渲染信息乘以一特定增益得到的值。
圖10和圖11是根據(jù)本發(fā)明的一個實施例的平滑單元和擴展單元的框圖。
如圖10和圖11所示,根據(jù)本發(fā)明的平滑方法可應用于渲染信息和/或源映射信息。然而,該平滑方法也可應用于其它類型的信息。在以下的描述中,描述了頻域上的平滑。然而除了頻域平滑以外,本發(fā)明也包括時域平滑。
參考圖10和圖11,平滑單元1042能夠?qū)︿秩拘畔⒑?或源映射信息執(zhí)行平滑。稍后將參考圖18至圖20描述平滑發(fā)生的位置的詳細例子。
平滑單元1042可被配置成與擴展單元1043聯(lián)用,在擴展單元中渲染信息和/或源映射信息可被擴展到比參數(shù)頻帶更寬的范圍——例如濾波器帶中。具體地,源映射信息可被擴展到與濾波器信息相對應的頻率分辨率(例如,濾波器帶)以便乘以此濾波器信息(例如,HRTF濾波器系數(shù))。根據(jù)本發(fā)明的平滑是在擴展之前或與擴展一起執(zhí)行的。與擴展一起使用的平滑可采用圖12至16中所示的方法之一。
圖12是用于解釋根據(jù)本發(fā)明的一個實施例的第一平滑方法的坐標圖。
參考圖12,第一平滑方法采用在每個參數(shù)帶中與空間信息具有相同大小的值。在這種情形中,可通過使用合適的平滑函數(shù)來實現(xiàn)平滑效果。
圖13是用于解釋根據(jù)本發(fā)明的一個實施例的第二平滑方法的坐標圖。
參考圖13,第二平滑方法是要通過連接參數(shù)帶的代表性位置獲得平滑效果。代表性位置是諸參數(shù)帶中的每一個的正中心、與對數(shù)標度、Bark標度等成比例的中心位置。最低頻率值、或由不同方法事先確定的位置。
圖14是用于解釋根據(jù)本發(fā)明的一個實施例的第三平滑方法的坐標圖。
參考圖14,第三平滑方法是要以平滑地連接參數(shù)的邊界的曲線或直線的形式執(zhí)行平滑。在這種情形中,第三平滑方法使用預設(shè)的邊界平滑曲線或由一階或更高階的IIR濾波器或FIR濾波器所作的低通濾波。
圖15是用于解釋根據(jù)本發(fā)明的一個實施例的第四平滑方法的坐標圖。
參考圖15,第四平滑方法是通過向空間信息輪廓添加諸如隨機噪聲之類的信號來實現(xiàn)平滑效果。在這種情形中,可將在聲道或頻帶中不同的值用作隨機噪聲。在頻域上添加隨機噪聲的情形中,可在保持相位值不變的同時僅添加大小值。除了頻域上的平滑效果外,第四平滑方法也可實現(xiàn)聲道間解相關(guān)效果。
圖16是用于解釋根據(jù)本發(fā)明的一個實施例的第五平滑方法的坐標圖。
參考圖16,第五平滑方法是要使用第二至第四平滑方法的組合。例如,在已連接代表性的參數(shù)帶的代表性位置之后,添加隨機噪聲并隨后應用低通濾波。這樣就可修改序列。第五平滑方法使頻域上的不連續(xù)點最小化,并可增強聲道間解相關(guān)效果。
在第一至第五平滑方法中,每聲道的相應頻域上的空間信息值(例如,CLD值)的總功率應如常數(shù)那樣是均勻的。為此,在每聲道地執(zhí)行平滑方法之后,應執(zhí)行功率歸一化。例如,如果聲道縮減混音信號是單聲道信號,則相應各聲道的電平值應滿足數(shù)學演算20的關(guān)系。
數(shù)學演算20 D_L(pb)+D_R(pb)+D_C(pb)+D_Ls(pb)+D_Rs(pb)+D_Lfe(pb)=C 在這種情形中,‘pb=0~總參數(shù)頻數(shù)1’,并且‘C’是任意常數(shù)。
圖17是用于解釋每聲道的原型濾波器信息的圖。
參考圖17,為了渲染,已經(jīng)通過用于左聲道源的GL_L濾波器的信號被發(fā)送到左輸出,而已經(jīng)通過GL_R濾波器的信號被發(fā)送到右輸出。
隨后,通過將從相應各聲道接收到的所有信號相加來生成左最終輸出(例如,Lo)和右最終輸出(例如,Ro)。具體地,所渲染的左/右聲道輸出可表達為數(shù)學演算21。
數(shù)學演算21 Lo=L*GL_L+C*GC_L+R*GR_L+Ls*GLs_L+Rs*GRs_L Ro=L*GL_R+C*GC_R+R*GR_R+Ls*GLs_R+Rs*GRs_R 在本發(fā)明中,所渲染的左/右聲道輸出可通過利用藉由利用空間信息將聲道縮減混音信號解碼成多聲道信號而生成的L、R、C、Ls和Rs來生成。并且,本發(fā)明能夠在不生成L、R、C、Ls和Rs的情況下利用渲染信息生成所渲染的左/右聲道輸出,其中渲染信息是通過利用空間信息和濾波器信息生成的。
參考圖18至20解釋利用空間信息生成渲染信息的過程如下。
圖18是根據(jù)本發(fā)明的一個實施例在空間信息轉(zhuǎn)換單元900中生成渲染信息的第一方法的框圖。
參考圖18,如在上面描述中所提及的,空間信息轉(zhuǎn)換單元900包括源映射單元1010、子渲染信息生成單元1020、整合單元1030、處理單元1040、以及域轉(zhuǎn)換單元1050。空間信息轉(zhuǎn)換單元900具有與圖3中所示相同的配置。
子渲染信息生成單元1020包括至少一個或多個子渲染信息生成單元(第1子渲染信息生成單元至第N子渲染信息生成單元)。
子渲染信息生成單元1020通過使用濾波器信息和源映射信息生成子渲染信息。
例如,如果聲道縮減混音信號是單聲道信號,則第一子渲染信息生成單元能夠生成對應于多聲道上的左聲道的子渲染信息。并且,可利用源映射信息D_L和經(jīng)轉(zhuǎn)換的濾波器信息GL_L′和GL_R′將此子渲染信息表示為數(shù)學演算22 數(shù)學演算22 FL_L=D_L*GL_L′ (單聲道輸入→至左輸出聲道的濾波器系數(shù)) FL_R=D_L*GL_R′ (單聲道輸入→至右輸出聲道的濾波器系數(shù)) 在這種情形中,D_L是通過在源映射單元1010中利用空間信息生成的值。然而,生成D_L的過程可遵循樹狀結(jié)構(gòu)。
第二子渲染信息生成單元可生成對應于多聲道上的右聲道的子渲染信息FR_L和FR_R。并且,第N子渲染信息生成單元能夠生成對應于多聲道上的右環(huán)繞聲道的子渲染信息FRs_L和FRs_R。
如果聲道縮減混音信號是立體聲信號,則第一子渲染信息生成單元可生成對應于多聲道上的左聲道的子渲染信息。并且,可通過利用源映射信息D_L1和D_L2將此子渲染信息表示為數(shù)學演算23。
數(shù)學演算23 FL_L1=D_L1*GL_L′ (左輸入→至左輸出聲道的濾波器系數(shù)) FL_L2=D_L2*GL_L′ (右輸入→至左輸出聲道的濾波器系數(shù)) FL_R1=D_L1*GL_R′ (左輸入→至右輸出聲道的濾波器系數(shù)) PL_R2=D_L2*GL_R′ (右輸入→至右輸出聲道的濾波器系數(shù)) 在數(shù)學演算23中,例如,如下解釋FL_R1。
首先,在FL_R1中,‘L’指示多聲道的位置,‘R’指示環(huán)繞信號的輸出聲道,且‘1’指示聲道縮減混音信號的聲道。即,F(xiàn)L_R1指示在從聲道縮減混音信號的左聲道生成環(huán)繞信號的右輸出聲道時使用的子渲染信息。
第二,D_L1和D_L2是通過在源映射單元1010中利用空間信息生成的值。
如果聲道縮減混音信號是立體聲信號,則能夠以與聲道縮減混音信號是單聲道信號的情形相同的方式從至少一個子渲染信息生成單元生成多個子渲染信息。由多個子渲染信息生成單元生成的子渲染信息的類型是示例性的,這不對本發(fā)明構(gòu)成限制。
由子渲染信息生成單元1020生成的子渲染信息經(jīng)由整合單元1030、處理單元1040、以及域轉(zhuǎn)換單元1050傳送至渲染單元900。
整合單元1030將每聲道生成的子渲染信息整合成用于渲染過程的渲染信息(例如,HL_L、HL_R、HR_L、HR_R)。如下解釋單聲道信號情形以及立體聲信號情形下整合單元1030中的整合過程。
首先,如果聲道縮減混音信號是單聲道信號,則渲染信息可表達為數(shù)學演算24。
數(shù)學演算24 HM_L=FL_L+FR_L+FC_L+FLs_L+FRs_L+FLFE_L HM_R=FL_R+FR_R+FC_R+FLs_R+FRs_R+FLFE_R 第二,如果聲道縮減混音信號是立體聲信號,則可將渲染信息表達為數(shù)學演算25。
數(shù)學演算25 HL_L=FL_L1+FR_L1+FC_L1+FLs_L1+FRs_L1+FLFE_L1 HR_L=FL_L2+FR_L2+FC_L2+FLs_L2+FRs_L2+FLFE_L2 HL_R=FL_R1+FR_R1+FC_R1+FLs_R1+FRs_R1+FLFE_R1 HR_R=FL_R2+FR_R2+FC_R2+FLs_R2+FRs_R2+FLFE_R2 隨后,處理單元1040包括內(nèi)插單元1041和/或平滑單元1042,并執(zhí)行針對渲染信息的內(nèi)插和/或平滑。內(nèi)插和/或平滑可在時域、頻域、或QMF域上執(zhí)行。在本說明書中,以時域為例,這不對本發(fā)明構(gòu)成限制。
如果所傳送的渲染信息在時域上具有寬間隔,則執(zhí)行內(nèi)插以獲得渲染信息之間非現(xiàn)存的渲染信息。例如,假設(shè)渲染信息分別存在于第n時隙和第(n+k)時隙中,則能夠通過使用所生成的渲染信息(例如,HL_L、HR_L、HL_R、HR_R)在未傳送的時隙上執(zhí)行線性內(nèi)插。
參考聲道縮減混音信號是單聲道信號的情形和聲道縮減混音信號是立體聲信號的情形解釋從內(nèi)插生成的渲染信息。
如果聲道縮減混音信號是單聲道信號,則可將內(nèi)插渲染信息表達為數(shù)學演算26。
數(shù)學演算26 HM_L(n+j)=HM_L(n)*(1-a)+HM_L(n+k)*a HM_R(n+j)=HM_R(n)*(1-a)+HM_R(n+k)*a 如果聲道縮減混音信號是立體聲信號,則可將經(jīng)內(nèi)插的渲染信息表達為數(shù)學演算27。
數(shù)學演算27 HL_L(n+j)=HL_L(n)*(1-a)+HL_L(n+k)*a HR_L(n+j)=HR_L(n)*(1-a)+HR_L(n+k)*a HL_R(n+j)=HL_R(n)*(1-a)+HL_R(n+k)*a HR_R(n+j)=HR_R(n)*(1-a)+HR_R(n+k)*a 在這種情形中,有0<j<k?!甹’和‘k’是整數(shù)。且,‘a(chǎn)’是與將表達為數(shù)學演算28的‘′0<a<1’相對應的實數(shù)。
數(shù)學演算28 a=j/k 如果是這樣的話,能夠根據(jù)數(shù)學演算27和數(shù)學演算28獲得與在連接這兩個時隙中的值的直線上的未傳送時隙相對應的值。稍后將參考圖22和圖23解釋內(nèi)插的詳情。
在濾波器系數(shù)值在時域上的兩相鄰時隙之間突變的情形中,平滑單元1042執(zhí)行平滑以防止由于不連續(xù)點的出現(xiàn)引起的畸變問題。可利用參考圖12至16描述的平滑方法實行時域上的平滑。平滑可與擴展一起執(zhí)行。并且,平滑可根據(jù)其所應用的位置而不同。如果聲道縮減混音信號是單聲道信號,則可將時域平滑表示為數(shù)學演算29。
數(shù)學演算29 HM_L(n)′=HM_L(n)*b+HM_L(n-1)′*(1-b) HM_R(n)′=HM_R(n)*b+HM_R(n-1)′*(1-b) 即,平滑可由按照將在前一時隙n-1中已作平滑的渲染信息HM_L(n-1)或HM_R(n-1)乘以(1-b)、將當前時隙中生成的渲染信息HM_L(n)或HM_R(n)乘以b、并將這兩個乘法結(jié)果相加的方式執(zhí)行的1-pol IIR濾波器類型來執(zhí)行。在這種情形中,‘b’是0<b<1的常數(shù)。如果‘b’變小,則平滑效果變大。如果‘b’變大,則平滑效果變小。并且,可以相同的方式應用其余的濾波器。
可通過利用針對時域平滑的數(shù)學演算29將內(nèi)插和平滑表示為數(shù)學演算30中所示的一個表達式。
數(shù)學演算30 HM_L(n+j)′=(HM_L(n)*(1-a)+HM_L(n+k)*a)*b+HM_L(n+j-1)′*(1-b) HM_R(n+j)′=(HM_R(n)*(1-a)+HM_R(n+k)*a)*b+HM_R(n+j-1)′*(1-b) 如果由內(nèi)插單元1041執(zhí)行了內(nèi)插和/或如果由平滑單元1042執(zhí)行了平滑,則可獲得具有與原型渲染信息的能量值不同的能量值的渲染信息。為了防止該問題,可另外執(zhí)行能量歸一化。
最后,域轉(zhuǎn)換單元1050對渲染信息執(zhí)行針對用于執(zhí)行渲染的域的域轉(zhuǎn)換。如果用于執(zhí)行渲染的域與渲染信息的域相同,則可不執(zhí)行此域轉(zhuǎn)換。之后,將經(jīng)域轉(zhuǎn)換的渲染信息傳輸?shù)戒秩締卧?00。
圖19是根據(jù)本發(fā)明的一個實施例在空間信息轉(zhuǎn)換單元中生成渲染信息的第二方法的框圖。
第二方法與第一方法的類似之處在于空間信息轉(zhuǎn)換單元1000包括源映射單元1010、子渲染信息生成單元1020、整合單元1030、處理單元1040、以及域轉(zhuǎn)換單元1050,并在于子渲染信息生成單元1020包括至少一個子渲染信息生成單元。
參考圖19,生成渲染信息的第二方法與第一方法的不同之處在于處理單元1040的位置。所以,可對在子渲染信息生成單元1020中每聲道地生成的子渲染信息(例如,在單聲道情形中的FL_L和FL_R或在立體聲信號情形中的FL_L1、FL_L2、FL_R1、FL_R2)每聲道地來執(zhí)行內(nèi)插和/或平滑。
隨后,整合單元1030將經(jīng)內(nèi)插和/或平滑的子渲染信息整合成渲染信息。
將所生成的渲染信息經(jīng)由域轉(zhuǎn)換單元1050傳輸?shù)戒秩締卧?00。
圖20是根據(jù)本發(fā)明的一個實施例在空間信息轉(zhuǎn)換單元中生成渲染濾波器信息的第三方法的框圖。
第三方法與第一或第二方法的類似之處在于空間信息轉(zhuǎn)換單元1000包括源映射單元1010、子渲染信息生成單元1020、整合單元1030、處理單元1040、以及域轉(zhuǎn)換單元1050,并在于子渲染信息生成單元1020包括至少一個子渲染信息生成單元。
參考圖20,生成渲染信息的第三方法與第一或第二方法的不同之處在于處理單元1040與源映射單元1010相鄰。所以,可對通過在源映射單元1010中使用空間信息生成的源映射信息每聲道地來執(zhí)行內(nèi)插和/或平滑。
隨后,子渲染信息生成單元1020通過利用經(jīng)內(nèi)插和/或平滑的源映射信息和濾波器信息生成子渲染信息。
子渲染信息在整合單元1030中被整合成渲染信息。并且,將所生成的渲染信息經(jīng)由域轉(zhuǎn)換單元1050傳輸至渲染單元900。
圖21是用于解釋根據(jù)本發(fā)明的一個實施例在渲染單元中生成環(huán)繞信號的方法的圖。圖21示出在DFT域上執(zhí)行的渲染過程。然而,該渲染過程也可按類似方式在不同域上實現(xiàn)。圖21示出輸入信號是單聲道的聲道縮減混音信號的情形。然而,圖21能以類似方式應用于包括立體聲的聲道縮減混音信號等在內(nèi)的其它輸入聲道。
參考圖21,時域上的單聲道的聲道縮減混音信號在域轉(zhuǎn)換單元中優(yōu)選地執(zhí)行具有重疊區(qū)間OL的開窗。圖21示出使用50%重疊的情形。然而,本發(fā)明包括使用其它重疊的情形。
用于執(zhí)行開窗口的窗函數(shù)可采用藉由在時域上無不連續(xù)性地無縫連接而在DFT域上具有良好頻率選擇性的函數(shù)。例如,正弦平方窗函數(shù)可用作此窗函數(shù)。
隨后,利用在域轉(zhuǎn)換單元中進行轉(zhuǎn)換的渲染信息,對具有從開窗獲取的OL*2長度的單聲道的聲道縮減混音信號執(zhí)行渲染濾波器的抽頭(tab)長度[精確地,是(抽頭長度)-1]的補零ZL。然后執(zhí)行域轉(zhuǎn)換轉(zhuǎn)為DFT域。圖20示出塊-k聲道縮減混音信號被域轉(zhuǎn)換到DFT域中。
經(jīng)域轉(zhuǎn)換的聲道縮減混音信號由使用渲染信息的渲染濾波器來渲染??蓪秩具^程表示為聲道縮減混音信號與渲染信息的乘積。經(jīng)渲染的聲道縮減混音信號在域逆轉(zhuǎn)換單元中經(jīng)歷IDFT(離散傅立葉逆變換),然后與先前以O(shè)L長度的延遲執(zhí)行的聲道縮減混音信號(圖20中的塊k-1)重疊以生成環(huán)繞信號。
可在經(jīng)歷此渲染過程的每一個塊上執(zhí)行內(nèi)插。如下解釋內(nèi)插法。
圖22是根據(jù)本發(fā)明的一個實施例的第一內(nèi)插法的圖。根據(jù)本發(fā)明的內(nèi)插可在各個位置上執(zhí)行。例如,內(nèi)插可在圖18至圖20中所示的空間信息轉(zhuǎn)換單元中的各個位置上執(zhí)行,或可在渲染單元中執(zhí)行??蓪⒖臻g信息、源映射信息、濾波器信息等用作待內(nèi)插的值。在本說明書中,空間信息示例性地用于描述。然而,本發(fā)明不限于空間信息。內(nèi)插在擴展至更寬頻帶之前或與之一起執(zhí)行。
參考圖22,從編碼裝置傳輸?shù)目臻g信息可從隨機位置傳輸而不是在每一個時隙上傳送。一個空間幀能夠攜帶多個空間信息集(例如,圖22中的參數(shù)集n和n+1)。在低比特率的情形中,一個空間幀能夠攜帶單個新的空間信息集。所以,是使用相鄰的已傳送的空間信息集的值來實行對未傳送時隙的內(nèi)插。用于執(zhí)行渲染的窗口之間的間隔并不總是與時隙匹配。所以,如圖22中所示,找出在渲染窗口的中心處(K-1、K、K+1、K+2等)的內(nèi)插出的值來使用。盡管圖22示出在存在空間信息集的時隙之間實行線性內(nèi)插,但本發(fā)明不限于該內(nèi)插法。例如,在不存在空間信息集的時隙上不實性內(nèi)插。而是可代之以采用先前的或預先設(shè)定的值。
圖23是根據(jù)本發(fā)明的一個實施例的第二內(nèi)插法的圖。
參考圖23,根據(jù)本發(fā)明的一個實施例的第二內(nèi)插法具有將采用先前值的區(qū)間、采用預先設(shè)定的缺省值的區(qū)間等相組合的結(jié)構(gòu)。例如,可通過使用維持先前值的方法、采用預先設(shè)定的缺省值的方法、以及在一個空間幀的區(qū)間里執(zhí)行線性內(nèi)插的方法中的至少一種來執(zhí)行內(nèi)插。在一個窗口中存在至少兩個新的空間信息集的情形中,可能會發(fā)生畸變。在以下的描述中,解釋用于防止畸變的塊切換。
圖24是根據(jù)本發(fā)明的一個實施例的塊切換法的圖。
參考圖24(a),因為窗口長度大于時隙長度,所以一個窗口區(qū)間中可能存在至少兩個空間信息集(例如,圖24中的參數(shù)集n和n+1)。在這種情形中,應將空間信息集中的每一個應用于不同的時隙。然而,如果應用了從內(nèi)插這至少兩個空間信息集得到的一個值,則可能發(fā)生畸變。即,可能發(fā)生歸因于根據(jù)窗口長度的時間分辨率不足的畸變。
為了解決這一問題,可使用改變窗口大小以配合時隙分辨率的切換方法。例如,如圖24(b)所示,對于要求高分辨率的區(qū)間,可將窗口大小切換成大小較短的窗口。在這種情形中,在已切換的窗口的開始部分和結(jié)束部分處,使用連接窗以防止在已切換的窗口的時域上出現(xiàn)接縫。
窗口長度可以不是作為單獨的附加信息來傳輸而是代之以通過在解碼裝置中使用空間信息來確定。例如,窗口長度可通過利用更新空間信息的時隙的區(qū)間來確定。即,如果用于更新空間信息的區(qū)間窄,則使用長度短的窗口函數(shù)。如果用于更新空間信息的區(qū)間寬,則使用長度長的窗口函數(shù)。在這種情形中,通過在渲染中使用可變長度的窗口,有利的是不單獨地使用發(fā)送窗口長度信息的比特。在圖24(b)中示出了兩種類型的窗口長度。然而,根據(jù)傳輸頻率和空間信息的關(guān)系可使用具有各種長度的窗口。所決定的窗口長度信息可應用于生成環(huán)繞信號的各個步驟,這將在以下的描述中解釋。
圖25是根據(jù)本發(fā)明的一個實施例應用由窗口長度決定單元決定的窗口長度的位置的框圖。
參考圖25,窗口長度決定單元1400可通過使用空間信息來決定窗口長度。關(guān)于所決定的窗口長度的信息可應用于源映射單元1010、整合單元1030、處理單元1040、域轉(zhuǎn)換單元1050和1100以及域逆轉(zhuǎn)換單元1300。圖25示出使用立體聲的聲道縮減混音信號的情形。然而,本發(fā)明不僅限于立體聲的聲道縮減混音信號。如上述描述中所提及的,即使窗口長度縮短,根據(jù)濾波器抽頭數(shù)決定的補零長度也是不可調(diào)節(jié)的。所以,在以下的描述中解釋該問題的解決方案。
圖26是根據(jù)本發(fā)明的一個實施例在處理音頻信號中使用的具有各種長度的濾波器的圖。如在上面描述中提及的,如果根據(jù)濾波器抽頭數(shù)決定的補零長度不作調(diào)節(jié),則實質(zhì)上發(fā)生合計達相應長度的覆蓋,從而致使時間分辨率不足。該問題的解決方案是通過限制濾波器抽頭的長度來縮短補零的長度??s短補零長度的方法可通過截斷響應的尾部(例如,對應于回響的擴散區(qū)間)來實現(xiàn)。在這種情形中,渲染過程可能比不截斷濾波器響應的尾部的情形精確度低。然而,時域上的濾波器系數(shù)值很小,從而主要影響了回響。所以,音質(zhì)沒有受到截斷的顯著影響。
參考圖26,有四種濾波器可使用。這四種濾波器可在DFT域上使用,這不對本發(fā)明構(gòu)成限制。
濾波器-N指示具有長濾波器長度FL和不受濾波器抽頭數(shù)限制的長補零長度2*OL的濾波器。濾波器-N2指示通過限制濾波器的抽頭數(shù)而具有比濾波器-N1要短的補零長度2*LO的具有相同濾波器長度FL的濾波器。濾波器-N3指示通過不限制濾波器抽頭數(shù)而具有長的補零長度2*LO的具有比濾波器-N1要短的濾波器長度FL的濾波器。并且,濾波器-N4指示通過限制濾波器的抽頭數(shù)而具有比濾波器-N1要短的窗口長度FL的具有短補零長度2*LO的濾波器。
如在以上描述中提及的,可利用以上示例性的四種濾波器來解決時間分辨率的問題。并且,對于濾波器響應的尾部,可將不同的濾波器系數(shù)用于每一個域。
圖27是根據(jù)本發(fā)明的一個實施例通過使用多個子濾波器來分開地處理音頻信號的方法的圖??蓪⒁粋€濾波器分成具有相互不同的濾波器系數(shù)的子濾波器。在通過利用子濾波器處理音頻信號之后,可使用將處理的結(jié)果相加的方法。在向具有小能量的濾波器響應尾部應用空間信息的情形中,即,在通過利用具有長濾波器抽頭的濾波器執(zhí)行渲染的情形中,該方法提供了按預定長度單位來分開地處理音頻信號的功能。例如,因為濾波器的尾部對于對應于每一個聲道的每HRTF沒有顯著變化,所以可通過提取多個窗口共有的系數(shù)來執(zhí)行渲染。在本說明書中,描述了在DFT域上執(zhí)行的情形。然而,本發(fā)明不限于DFT域。
參考圖27,在將一個濾波器FL分成多個子區(qū)后,這多個子區(qū)可有具有相互不同的濾波器系數(shù)的多個子濾波器(濾波器-A和濾波器-B)來處理。
隨后,經(jīng)濾波器-A處理的輸出和經(jīng)濾波器-B處理的輸出被組合在一起。例如,對經(jīng)濾波器-A處理的輸出和經(jīng)濾波器-B處理的輸出中的每一個執(zhí)行IDFT(離散傅立葉逆轉(zhuǎn)換)以生成時域信號。并且,將所生成的信號加起來。在這種情形中,加上了經(jīng)濾波器-B處理的輸出的位置由FL時延了比經(jīng)濾波器-A處理的輸出的位置要多的時間。這樣,經(jīng)多個子濾波器處理的信號帶來了與由單個濾波器處理該信號的情形相同的效果。
并且,本發(fā)明包括直接向聲道縮減混音信號渲染經(jīng)濾波器-B處理的輸出的方法。在這種情形中,能夠通過使用從空間信息提取的系數(shù)、部分地使用空間信息、或不使用空間信息地來向聲道縮減混音信號渲染此輸出。
該方法的特征在于可將具有長抽頭數(shù)的濾波器分開地應用,且具有小能量的濾波器尾部不利用空間信息作轉(zhuǎn)換即可應用。在這種情形中,如果不應用利用空間信息的轉(zhuǎn)換,則不將不同的濾波器應用于每一個作處理的窗口。所以,沒有必要應用與塊切換相同的方案。圖26示出分成兩個區(qū)的濾波器。然而,本發(fā)明可將濾波器分成多個區(qū)。
圖28是根據(jù)本發(fā)明的一個實施例向單聲道的聲道縮減混音信號渲染由多個子濾波器生成的分割渲染信息的方法的框圖。圖28涉及一個渲染系數(shù)。該方法可每渲染系數(shù)地來執(zhí)行。
參考圖28,圖27的濾波器-A信息對應于第一分割渲染信息HM_L_A,并且圖27的濾波器-B信息對應于第二分割渲染信息HM_L_B。圖28示出分割成兩個子濾波器的實施例。然而,本發(fā)明不限于這兩個子濾波器。這兩個子濾波器可經(jīng)由拆分單元1500利用在空間信息生成單元1000中生成的渲染信息HM_L來獲得?;蛘撸@兩個子濾波器可利用原型HRTF信息或根據(jù)用戶選擇決定的信息來獲得。根據(jù)用戶選擇決定的信息可包括例如根據(jù)用戶愛好選擇的空間信息。在這種情形中,HM_L_A是基于所接收到的空間信息的渲染信息,而HM_L_B可以是用于提供通常應用于信號的3維效果的渲染信息。
如在上面描述中提及的,利用多個子濾波器的處理不僅可應用于DFT域,還可應用于時域和QMF域。具體地,由濾波器-A和濾波器-B拆分的系數(shù)值藉由時域或QMF域渲染被應用于聲道縮減混音信號,然后被相加以生成最終信號。
渲染單元900包括第一分割渲染單元950和第二分割渲染單元960。第一分割渲染單元950利用HM_L_A執(zhí)行渲染過程,而第二分割渲染單元960利用HM_L_B執(zhí)行渲染過程。
如果如圖27所示的濾波器-A和濾波器-B是同一濾波器根據(jù)時間的拆分,則能考慮適當?shù)难舆t以對應于此時間間隔。圖28示出單聲道的聲道縮減混音信號的例子。在使用單聲道聲道縮減混音信號和解相關(guān)器的情形中,對應于濾波器-B的部分不是被應用于解相關(guān)器,而是被直接應用于此單聲道的聲道縮減混音信號。
圖29是根據(jù)本發(fā)明的一個實施例向立體聲的聲道縮減混音信號渲染利用多個子濾波器生成的分割渲染信息的方法的框圖。
圖29中所示的分割渲染過程與圖28的過程的類似之處在于通過使用由空間信息轉(zhuǎn)換單元1000生成的渲染信息、原型HRTF濾波器信息或用戶決定信息在拆分器1500中獲得兩個子濾波器。與圖28的差別在于對應于濾波器-B的分割渲染過程被共同地應用于L/R信號。
具體地,拆分器1500生成對應于濾波器-A的信息的第一分割渲染信息、第二分割渲染信息、和對應于濾波器-B的信息的第三分割渲染信息。在這種情形中,第三分割渲染信息可通過使用可共同應用于L/R信號的濾波器信息或空間信息來生成。
參考圖29,渲染單元900包括第一分割渲染單元970、第二分割渲染單元980和第三分割渲染單元990。
所生成的第三分割渲染信息在第三分割渲染單元990中被應用于L/R信號的和信號以生成一個輸出信號。將此輸出信號與L/R輸出信號相加,L/R輸出信號是分別在第一和第二分割渲染單元970和980中由濾波器-A1和濾波器-A2獨立渲染以生成環(huán)繞信號。在這種情形中,第三分割渲染單元990的輸出信號可在適當延遲后進行相加。在圖29中為了便于解釋省略了從L/R輸入向另一個聲道應用交叉渲染信息的表達。
圖30是根據(jù)本發(fā)明的一個實施例的聲道縮減混音信號的第一域轉(zhuǎn)換方法的框圖。到目前為止已經(jīng)描述了在DFL域上執(zhí)行的渲染過程。如在上面描述中提及的,除了DFL域以外,渲染過程還可在其它域上執(zhí)行。然而,圖30示出在DFT域上執(zhí)行的渲染過程。域轉(zhuǎn)換單元1100包括QMF濾波器和DFL濾波器。域逆轉(zhuǎn)換單元1300包括IDFT濾波器和IQMF濾波器。圖30涉及單聲道的聲道縮減混音信號,這不對本發(fā)明構(gòu)成限制。
參考圖30,有p樣本的時域聲道縮減混音信號通過QMF濾波器以生成P個子帶樣本。每頻帶地再采集W個樣本。在對再采集到的樣本執(zhí)行開窗之后執(zhí)行補零。然后執(zhí)行M點DFT(FFT)。在這種情形中,DFT通過上述類型的開窗實現(xiàn)處理??砂褜⒂蒑點DFT獲得的每頻帶的M/2個頻域值連接到P個頻帶的值視為由M/2*P點DFT獲得的頻譜的適當值。所以,將在M/2*P點DFT域上表示的濾波器系數(shù)乘以此頻譜以帶來與DFT域上的渲染相同的效果。
在這種情形中,已通過QMF濾波器的信號具有漏泄,例如,相鄰頻帶之間的混疊。具體地,對應于相鄰頻帶的值滲入到當前頻帶,且當前頻帶中存在的值移到相鄰的頻帶中。在這種情形中,如果執(zhí)行QMF整合,則由于QMF特性可恢復原始信號。然而,如果濾波過程是如本發(fā)明中的情形那樣在相應頻帶的信號上執(zhí)行的,則信號由于此漏泄而發(fā)生畸變。為了使該問題最小化,可通過以下方式增加用于恢復原始信號的過程令信號在域轉(zhuǎn)換單元100中的QMF之后在每頻帶地執(zhí)行DFT之前通過漏泄最小化蝴蝶濾波器并在域逆轉(zhuǎn)換單元1300中的IDFT之后執(zhí)行逆過程。
同時,為了使空間信息轉(zhuǎn)換單元1000中生成的渲染信息的生成過程與聲道縮減混音信號的生成過程匹配,可不是在開始時執(zhí)行M/2*P點DFT而是代之以對通過了QMF的信號執(zhí)行DFT以獲得原型濾波器信息。在這種情形中,可能會存在由QMF濾波器引起的延遲和數(shù)據(jù)擴展。
圖31是根據(jù)本發(fā)明的一個實施例的聲道縮減混音信號的第二域轉(zhuǎn)換方法的框圖。圖31示出在QMF域上執(zhí)行的渲染過程。
參考圖31,域轉(zhuǎn)換單元1100包括QMF域轉(zhuǎn)換單元,并且域逆轉(zhuǎn)換單元1300包括IQMF域轉(zhuǎn)換單元。圖31中示出的配置與僅利用DFT的情形相同——僅除域轉(zhuǎn)換單元是QMF濾波器。在以下的描述中,QMF指包括具有相同帶寬的QMF和混合QMF。與僅利用DFT的情形的差別在于渲染信息的生成是在QMF域上執(zhí)行的,且將此渲染過程表示為卷積而不是DFT域上的乘積,因為由渲染器-M 3012執(zhí)行的此渲染過程是在QMF域上執(zhí)行的。
假設(shè)QMF濾波器設(shè)有B個頻帶,可將濾波器系數(shù)表示為對于這B個頻帶具有不同特性(系數(shù))的一組濾波器系數(shù)。有時,如果濾波器抽頭數(shù)變?yōu)橐浑A(即,乘以一個常數(shù)),則DFT域上的具有B個頻譜的渲染過程與運算過程是匹配的。數(shù)學演算31表示針對利用渲染信息HM_L執(zhí)行渲染過程的一條路徑的一個QMF頻帶(b)上執(zhí)行的渲染過程。
數(shù)學演算31 在這種情形中,k指示QMF頻帶中的時序,即,時隙單元。在QMF域上執(zhí)行的渲染過程的優(yōu)勢在于如果傳送的空間信息是可應用于QMF域的值,則對應的數(shù)據(jù)的應用是最方便的,且可使應用期間的畸變最小化。然而,在原型濾波器信息(例如,原型濾波器系數(shù))轉(zhuǎn)換過程中的QMF域轉(zhuǎn)換的情形中,應用經(jīng)轉(zhuǎn)換的值的過程需要相當大的運算量。在這種情形中,可通過在濾波器信息轉(zhuǎn)換過程中將HRTF系數(shù)參數(shù)化的方法來使運算量最小化。
工業(yè)實用性 因此,本發(fā)明的信號處理方法和裝置使用由編碼器提供的空間信息以在能夠生成多聲道的解碼裝置中通過利用HRTF濾波器信息或是根據(jù)用戶的濾波器信息來生成環(huán)繞信號。并且,本發(fā)明很適用于僅能再現(xiàn)立體聲信號的各種解碼器。
盡管已參考本發(fā)明的優(yōu)選實施例描述并說明了本發(fā)明,但本領(lǐng)域內(nèi)技術(shù)人員可以理解,可對本發(fā)明作出各種修改和變形而不會脫離本發(fā)明的精神或范圍。因此,本發(fā)明旨在涵蓋落入所附權(quán)利要求書及其等效技術(shù)方案的范圍內(nèi)的本發(fā)明的所有這些修改和變形。
權(quán)利要求
1.一種處理信號的方法,所述方法包括
從比特流中提取聲道縮減混音信號;
通過將解相關(guān)器應用于所述聲道縮減混音信號來生成經(jīng)解相關(guān)的聲道縮減混音信號;以及
通過將用于生成環(huán)繞信號的渲染信息應用于所述聲道縮減混音信號和所述經(jīng)解相關(guān)的聲道縮減混音信號來生成環(huán)繞信號。
2.如權(quán)利要求1所述的方法,其特征在于,所述渲染信息的應用是在時域、頻域、QMF域、或混合域上進行的。
3.如權(quán)利要求2所述的方法,其特征在于,所述渲染信息是通過使用具有環(huán)繞效果的濾波器信息和從所述比特流中提取的空間信息來生成的。
4.如權(quán)利要求3所述的方法,其特征在于,所述渲染信息包括被應用于聲道縮減混音信號聲道和經(jīng)解相關(guān)的聲道縮減混音信號聲道中的一個然后在同一聲道上傳遞的第一渲染信息和被應用于所述聲道縮減混音信號聲道和所述經(jīng)解相關(guān)的聲道縮減混音信號聲道中的一個然后在另一聲道上傳遞的第二渲染信息。
5.如權(quán)利要求4所述的方法,其特征在于,所述環(huán)繞信號是通過將已應用了所述第一渲染信息的聲道信號和已應用了所述第二渲染信息的聲道信號相加而生成的。
6.如權(quán)利要求3所述的方法,其特征在于,所述濾波器信息包括HRTF濾波器信息或根據(jù)用戶的選擇決定的值。
7.如權(quán)利要求6所述的方法,其特征在于,所述濾波器信息被域轉(zhuǎn)換至在其中生成所述環(huán)繞信號的域。
8.如權(quán)利要求7所述的方法,其特征在于,所述濾波器信息是通過將所述HRTF濾波器信息轉(zhuǎn)換成參數(shù)來生成的。
9.如權(quán)利要求1所述的方法,其特征在于,還包括將所述聲道縮減混音信號的域轉(zhuǎn)換至在其中生成所述環(huán)繞信號的域。
10.如權(quán)利要求9所述的方法,其特征在于,在其中生成所述渲染信息的域等于在其中生成所述環(huán)繞信號的域。
11.如權(quán)利要求1所述的方法,其特征在于,所述解相關(guān)器具有全通特征。
12.如權(quán)利要求1所述的方法,其特征在于,所述聲道縮減混音信號是單聲道信號。
13.一種處理信號的裝置,所述裝置包括
解相關(guān)單元,其通過將解相關(guān)器應用于從比特流中提取的聲道縮減混音信號來生成經(jīng)解相關(guān)的聲道縮減混音信號;以及
渲染單元,其通過將用于生成環(huán)繞信號的渲染信息應用于所述聲道縮減混音信號和所述經(jīng)解相關(guān)的聲道縮減混音信號來生成所述環(huán)繞信號。
14.如權(quán)利要求13所述的裝置,其特征在于,還包括空間信息轉(zhuǎn)換單元,其通過使用從所述比特流中提取的所述空間信息和具有環(huán)繞效果的濾波器信息來生成所述渲染信息。
15.如權(quán)利要求14所述的裝置,其特征在于,所述空間信息轉(zhuǎn)換單元包括濾波器信息轉(zhuǎn)換單元,其將包括HRTF濾波器信息或根據(jù)用戶的選擇決定的值的所述濾波器信息的域轉(zhuǎn)換至在其中生成所述環(huán)繞信號的域。
全文摘要
本發(fā)明公開了一種用于處理媒體信號的裝置及其方法,藉之可通過使用媒體信號的空間信息來將該媒體信號轉(zhuǎn)換成環(huán)繞信號。本發(fā)明提供了一種處理信號的方法,該方法包括從比特流中提取聲道縮減混音信號;通過將解相關(guān)器應用于所述聲道縮減混音信號來生成經(jīng)解相關(guān)的聲道縮減混音信號;以及通過將用于生成環(huán)繞信號的渲染信息應用于此聲道縮減混音信號和此經(jīng)解相關(guān)的聲道縮減混音信號來生成環(huán)繞信號。
文檔編號G10L19/00GK101361117SQ200780001535
公開日2009年2月4日 申請日期2007年1月19日 優(yōu)先權(quán)日2006年1月19日
發(fā)明者吳賢午, 房熙錫, 金東秀, 林宰顯, 鄭亮源 申請人:Lg電子株式會社