一種用于處理音頻信號的方法和設備的制造方法
【技術領域】
[0001] 本發(fā)明通常設及一種對象音頻信號處理方法和設備,尤其是設及一種方法和設 備,用于編碼和解碼對象音頻信號,或用于在一=維(3D)空間內(nèi)表現(xiàn)對象的音頻信號。
【背景技術】
[0002] 3D聲音完整的體現(xiàn)了一系列的信號處理,傳輸,編碼和重現(xiàn)技術,用于在一 3D空 間內(nèi)真實的呈現(xiàn)聲音。該是通過一已存的環(huán)繞音頻技術提供的在一水平面上實現(xiàn)一聲音場 景(2D)的基礎上,提供另一軸(維度)方向上的高度空間的聲音信號來實現(xiàn)的。特別的,為 了提供3D音頻,使用了比傳統(tǒng)技術更多的大量的揚聲器,或者廣泛的使用了表現(xiàn)技術,雖 然只使用了少量的揚聲器,但表現(xiàn)技術在虛擬位置上形成了聲像,而實際上該些位置上并 沒有揚聲器。
[0003] 人們期待3D音頻將會成為一種對應于超高清電視(UHDTV)的音頻解決方案,此方 案將會在未來使用,并適用于不同的場合,如電影院音效,個人的3D電視(3DTV)音效,平 板,智能手機和云游戲,等。此方案也適用于演變成車輛中的高質(zhì)量的信息娛樂場所的聲 音。
【發(fā)明內(nèi)容】
[0004] 公開的巧術間願 =維(3D)音頻技術需要經(jīng)過比傳統(tǒng)技術的通道更多的大量通道的信號傳輸,通道最多 可達22. 2個。為此,需要適合該樣傳輸?shù)膲嚎s傳輸技術。傳統(tǒng)的高質(zhì)量編碼,例如MPEG聲 音層3 (MP3),先進的音頻編碼(AAC),數(shù)字影院系統(tǒng)(DTS),化及音頻編碼3 (AC3),都主要 適用于少于5. 1通道的信號傳輸。
[0005] 進一步的,為了重現(xiàn)22. 2通道信號,在收聽的范圍內(nèi)有一基本結(jié)構(gòu),其中安裝了 24個揚聲器,但是在短期內(nèi)通過市場傳播該樣一基本結(jié)構(gòu)是不容易的。因此,需要一種技 術,能在一空間內(nèi)布置小于22. 2通道所需的揚聲器,而能有效的重現(xiàn)22. 2通道的信號,需 要一種技術,能相反的在一具有大于現(xiàn)存的音源,而有10. 1或22. 2通道的揚聲器的環(huán)境 下,重現(xiàn)已存的立體聲或5. 1通道音源,需要一種技術,甚至能在一不具有確定的揚聲器位 置和確定的視聽室環(huán)境的場所,根據(jù)原始的音源提供音響,還需要一種技術,甚至在一耳機 收聽環(huán)境下,重現(xiàn)3D音效。該種技術在本發(fā)明中被統(tǒng)稱為"表現(xiàn)",并且被特別的稱為縮混, 上混,靈活的表現(xiàn),雙聲道的表現(xiàn),等。
[0006] 同時,作為另一種有效的傳輸音響的方法,一基于對象的信號傳輸方案是需要的。 依據(jù)音源,進行基于對象的傳輸而非基于通道的傳輸是優(yōu)選的。此外,可W基于對象的傳輸 使交互的聘聽一音源,比如允許一用戶自由的調(diào)整重制的大小和對象的位置。因此,需要一 種有效的傳輸方法,能夠在一高傳輸率下壓縮對象的信號。
[0007] 進一步的,可能出現(xiàn)具有混合形式的基于通道的信號和基于對象的信號的音源, W及由此音源提供了一種新型的聘聽體驗。因而,也需要一種技術,用于有效的同時傳輸通 道信號和對象信號,并有效的表現(xiàn)該些信號。
[000引 巧術方秦 本發(fā)明的目的是完成上述目標。因此提供了一種音頻信號處理方法,包括根據(jù)一種指 定的方法,通過分級多個對象信號,產(chǎn)生一第一對象信號和一第二對象信號,為第一對象信 號組產(chǎn)生一第一縮混信號,為第二對象信號組產(chǎn)生一第二縮混信號,為第一對象信號組內(nèi) 的對象信號產(chǎn)生第一對象抽取信息片段,W響應第一縮混信號,W及為第二對象信號組內(nèi) 的對象信號中產(chǎn)生第二對象抽取信息片段,W響應一第二縮混信號。
[0009] 本發(fā)明的另一目的是提供一音頻信號處理方法,包括接收多個縮混信號,縮混信 號包括第一縮混信號和第二縮混信號,為第一對象信號組接收對應于第一縮混信號的第一 對象抽取信息,為第二對象信號組接收對應于第二縮混信號的第二對象抽取信息,使用第 一縮混信號和第一對象抽取信息產(chǎn)生屬于第一對象信號組的對象信號,W及使用第二縮混 信號和第二對象抽取信息產(chǎn)生屬于第二對象信號組的對象信號。
[0010] 有益效果 本發(fā)明的音頻信號可有效的進行表現(xiàn),編碼,傳輸和儲存,并且在不同的重現(xiàn)環(huán)境下通 過不同設備可重新展現(xiàn)高質(zhì)量的音頻信號。
[0011] 本發(fā)明的優(yōu)點并不僅限于上述效果,從本文和附圖中本領域的技術人員可清晰的 了解那些未描述的效果。
【附圖說明】
[0012] 圖1是本發(fā)明的一示意圖,根據(jù)一幅圖像的尺寸,顯示了在相同的視距內(nèi)的視角; 圖2是本發(fā)明的一布局圖,作為一多通道環(huán)境的實例顯示了 22. 2個通道的揚聲器的分 配; 圖3是本發(fā)明的一概念圖,顯示了在一聽眾聘聽3D音頻的收聽空間內(nèi),各自的聲音對 象的位置; 圖4是本發(fā)明的一典型的布局圖,顯示了使用一種分組方法,形成的對象信號組,W用 于圖3中顯示的對象。
[0013] 圖5是本發(fā)明的一布局圖,顯示了一對象音頻信號編碼器的實施例; 根據(jù)本發(fā)明的一實施例,圖6是一解碼設備的典型的布局圖; 圖7是本發(fā)明的一布局圖,顯示了使用一種編碼方法編碼產(chǎn)生的一比特流; 圖8是本發(fā)明的一方框圖,顯示了一對象和通道信號解碼系統(tǒng)的實施例; 圖9是本發(fā)明的一方框圖,顯示了另一對象和通道信號解碼系統(tǒng)的實施例; 圖10說明了本發(fā)明的一解碼系統(tǒng)的實施例; 圖11是本發(fā)明的一示意圖,顯示了多個對象信號的掩蔽閥值; 圖12是本發(fā)明的一示意圖,顯示了一編碼器的實施例,用于對多個對象信號計算掩蔽 閥值; 圖13是一示意圖,顯示了根據(jù)ITU-R推薦的布置和隨機位置的布置,W用于5. 1通道 的設置; 圖14是一本發(fā)明的示意圖,顯示了一結(jié)構(gòu)的實施例,其中一用于對象比特流的解碼器 和一使用解碼器的靈活表現(xiàn)系統(tǒng)互相連接; 圖15是一本發(fā)明的示意圖,顯示了另一結(jié)構(gòu)的實施例,執(zhí)行了用于一對象比特流的解 碼和表現(xiàn); 圖16是一示意圖,顯示了一結(jié)構(gòu),用于在一解碼器和一表現(xiàn)器間決定一傳輸方案和傳 輸對象; 圖17是一概念圖,顯示了一概念,其中由于顯示器而移走了一些揚聲器,該些揚聲器 位于一 22. 2通道系統(tǒng)的前部位置,而音響使用自身的相鄰通道而重現(xiàn)了; 圖18是一本發(fā)明的示意圖,顯示了一處理方法的實施例,用于在缺少揚聲器的位置上 分配音源; 圖19是一示意圖,顯示了環(huán)繞一電視周圍,在各自的波段向揚聲器產(chǎn)生的信號的映像 的實施例;W及 根據(jù)本發(fā)明的一實施例,圖20是一示意圖,顯示了產(chǎn)品間一音頻信號處理設備執(zhí)行的 關系。 具體實施例
[0014] 本發(fā)明的目的是提供一種音頻信號處理方法,包括根據(jù)一種指定的方法,通過分 級多個對象信號,產(chǎn)生一第一對象信號和一第二對象信號,為第一對象信號組產(chǎn)生一第一 縮混信號,為第二對象信號組產(chǎn)生一第二縮混信號,為第一對象信號組內(nèi)的對象信號產(chǎn)生 第一對象抽取信息片段,W響應第一縮混信號,W及為第二對象信號組內(nèi)的對象信號中產(chǎn) 生第二對象抽取信息片段,W響應第二縮混信號。
[0015] 在此情況下,在音頻信號處理方法中,第一對象信號組和第二對象信號組可進一 步包括互相混合的信號,W形成一單聲音場景。
[0016] 進一步的,在音頻信號處理方法中,第一對象信號組和第二對象信號組可由同時 重現(xiàn)的信號組成。
[0017] 本發(fā)明中,第一對象信號組和第二對象信號組可編碼為一單個對象信號比特流。 [001引該里,產(chǎn)生的第一縮混信號進行如下配置配置,通過對各自對象的縮混增益信號 片段,使用包括在第一對象信號組內(nèi)的對象信號,而獲得第一縮混信號,其中對各自對象的 縮混增益信號片段包括在第一對象抽取信息內(nèi)。
[0019] 該里,音頻信號處理方法可進一步包括編碼第一對象抽取信息和第二對象抽取信 息。
[0020] 在本發(fā)明中,音頻信號處理方法可進一步包括產(chǎn)生全局增益信息,用于包括在第 一對象信號組和第二對象信號組內(nèi)的所有對象信號,其中全局增益信息可編碼為對象信號 比特流。
[0021] 本發(fā)明的另一目的是提供一種音頻信號處理方法,包括接收多個縮混信號,縮混 信號包括第一縮混信號和第二縮混信號,為第一對象信號組接收對應于第一縮混信號的第 一對象抽取信息,為第二對象信號組接收對應于第二縮混信號的第二對象抽取信息,使用 第一縮混信號和第一對象抽取信息產(chǎn)生屬于第一對象信號組的對象信號,W及使用第二縮 混信號和第二對象抽取信息產(chǎn)生屬于第二對象信號組的對象信號。
[0022] 該里,音頻信號處理方法可進一步包括使用屬于第一對象信號組的至少一對象信 號,產(chǎn)生輸出音頻信號,W及使用屬于第二對象信號組的至少一對象信號,產(chǎn)生輸出音頻信 號。
[0023] 該里,第一對象抽取信息和第二對象抽取信息可從一單個比特流中接收。
[0024] 進一步的,音頻信號處理方法可如此配置,W便于縮混增益信息從第一對象抽取 信息中獲取,其中縮混增益信息用于屬于第一對象信號組的至少一對象信號,此至少一對 象信號使用縮混增益信息產(chǎn)生。
[0025] 進一步的,音頻信號處理方法可進一步包括接收全局增益信息,其中全局增益信 息是一增益值,即應用于第一對象信號組,也應用于第二對象信號組。
[0026] 進一步的,至少一對象信號屬于第一對象信號組,至少一對象信號屬于第二對象 信號組,它們可W在相同的時隙內(nèi)重現(xiàn)。
[0027] 既然本說明書中描述的實施例意在向那些本領域的技術人員清楚的表明本發(fā)明 的精神,本發(fā)明并不僅限于那些實施例,并且應當理解本發(fā)明的范圍包括一些改變和修改, 而那些改變和修改并不背離本發(fā)明的精神。
[002引本說明書中使用的術語和附圖意在容易的描述本發(fā)明,并且附圖中顯示的形狀極 大的幫助了本發(fā)明的理解,因而本發(fā)明并不僅限于說明書中使用的術語和附圖。
[0029] 在本發(fā)明中,已知配置或功能的詳細描述已經(jīng)被認為是使本發(fā)明的要點獲得不必 要的隱藏,因此會在下面省略。
[0030] 本發(fā)明的術語可W基于W下標準翻譯,并且即使未在本文中描述的術語,也可W 根據(jù)下述要點翻譯。根據(jù)語境,代碼可翻譯成編碼或解碼,而信息是一術語,包含值,參數(shù), 系數(shù),元素等,并可依據(jù)語境翻譯,但是本發(fā)明并不僅限于上述含義。
[0031] 根據(jù)本發(fā)明的實施例,在下文中將會描述一種方法和設備,用于處理對象音頻信 號。
[003引圖1是一示意圖,根據(jù)圖像(例如,超高清電視(UHDTV)和高清晰度電視(皿TV))的 尺寸,顯示了在相同的視距內(nèi)的視角。隨著顯示器的產(chǎn)品技術的發(fā)展和消費者需求的增加, 圖像的尺寸呈一增長趨勢。如圖1所示,一幅UHDTV圖像(7680*4320像素圖像)的尺寸比 一幅皿TV圖像(1920*1080像素圖像)的尺寸大約大16倍。當一皿TV安裝于起居室的墻 面上,而觀看者W-預設的視距坐在沙發(fā)上時,視角可W為30°。然而,當一 UHDTV W相同 視距安裝時,視角可達到100°。該樣,當安裝一高質(zhì)量的和高分辨率的屏幕時,優(yōu)選的提供 高真實感的和高沉浸式的環(huán)繞聲,W便與大尺寸的視頻相一致。為提供該樣一種環(huán)境,W便 讓觀察者有身臨其境的感覺,只提供一或兩個環(huán)繞的通道揚聲器時不夠的。因而,需要一種 多通道音頻環(huán)境,具有大量的揚聲器和通道。
[0033] 如上所述,除了一家庭影院外,可能的環(huán)境還有,一個人3D TV,一智能電話TV,一 22. 2通道音頻程序,一傳播媒介,一 3D視頻,一遠程呈現(xiàn)室,基于云的游戲等。
[0034] 圖2是一示意圖,顯示了一多通道環(huán)境實例,其中說明了 22. 2通道揚聲器的配置。 22. 2通道可W是一多通道環(huán)境的實例,用于提高聲場效果,并且本發(fā)明并不僅限于特定數(shù) 據(jù)的通道或特定的揚聲器分配。參考圖2,可W為頂層1010提供總共9條通道。也就是,可