專利名稱:用于調(diào)整多通道音頻信號的空間線索信息的設(shè)備和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及被配置用于執(zhí)行音頻和語音信號編碼的設(shè)備。
背景技術(shù):
空間音頻處理是從音頻源發(fā)出的音頻信號經(jīng)由不同傳播路徑到達(dá)收聽者左耳和 右耳的效果。作為該效果的結(jié)果,左耳處的信號通常將具有與到達(dá)右耳的相應(yīng)信號不同的 到達(dá)時間和信號電平。時間和信號電平之間的差是音頻信號經(jīng)其傳播而分別到達(dá)左耳和右 耳的路徑中差的函數(shù)。收聽者的大腦繼而解釋這些差,從而給出以下感知接收的音頻信號 是由相對于收聽者而位于特定距離和方向處的音頻源產(chǎn)生的。因此,可以將聽覺場景視為同時聽到由相對于收聽者而位于各個位置處的一個或 多個音頻源所生成音頻信號的凈效果。人類大腦可以處理雙耳輸入信號從而斷定聲音源位置和方向的起碼事實(shí)可以用 于對聽覺場景進(jìn)行編碼和合成。因此,空間聽覺編碼的典型方法將尋求對音頻場景的突出 特征進(jìn)行建模。這通常需要有意地修改來自于一個或多個源的音頻信號,從而生成左音頻 信號和右音頻信號。在本領(lǐng)域中,這些信號可以統(tǒng)稱為雙耳信號。然后,可以生成最終的雙 耳信號,使得它們給出相對于收聽者位于不同位置處的變化音頻源的感知。最近,已經(jīng)結(jié)合多通道音頻重現(xiàn)來使用空間音頻技術(shù)。多通道音頻重現(xiàn)的目的在 于提供對包括五個或更多(多個)獨(dú)立音頻通道或聲音源的多通道音頻信號的有效編碼。 最近對多通道音頻信號的編碼方法已經(jīng)集中于參數(shù)立體聲(PQ和雙耳線索編碼(BCC)方 法。BCC通常通過將各種輸入音頻信號下混頻為單個(“和”)通道或傳遞“和”信號的較少 量通道來對多通道音頻信號進(jìn)行編碼。并行地,從輸入通道提取最突出的通道間線索(也 稱作空間線索,其描述多通道聲像或音頻場景)并將其編碼為邊信息。和信號和邊信息兩 者形成編碼的參數(shù)集,其繼而可以作為通信鏈的部分傳輸或存儲在存儲和轉(zhuǎn)發(fā)類型設(shè)備 中。BCC技術(shù)的大部分實(shí)現(xiàn)通常采用低比特率音頻編碼方案來對和信號進(jìn)行進(jìn)一步編碼。 最終,BCC解碼器根據(jù)傳輸或存儲的和信號和空間線索信息來生成多通道輸出信號。關(guān)于 BCC技術(shù)的其他信息可以在以下IEEE出版物中找到IEEE Transactions on Speech and Audio Processing, Vol. 11,No 6,2003 年 11 月中 Baumgarte, F 禾口 Faller,C 的 Binaural Cue Coding-Part II Schemes and Applications。通常,在空間音頻編碼系統(tǒng)中采用的下 混頻信號附加地使用低比特率感知音頻編碼技術(shù)來編碼,從而進(jìn)一步降低所需的比特率, 其中低比特率感知音頻編碼技術(shù)諸如IS0/IEC移動圖片專家組高級音頻編碼標(biāo)準(zhǔn)。在空間音頻多通道編碼的典型實(shí)現(xiàn)中,空間線索的集合包括對兩個通道間的音 頻電平中的相對差建模的通道間電平差參數(shù)(ICLD),以及表示兩個通道間信號的時差或相 移的通道間時延值(ICTD)。通常關(guān)于參考通道針對每個通道確定音頻電平差和時差。備選 地,某些系統(tǒng)可以利用頭部相關(guān)傳遞函數(shù)(HRTF)的輔助生成空間音頻線索。關(guān)于此類技術(shù) 的其他信息可以在MIT Press在 1983年出版的、J. Blaubert 的Psychoacoustics of Human Sound Localization 中 戈至Ij0
盡管ICLD和ICTD參數(shù)表示最重要的空間音頻線索,但是使用這些參數(shù)的空間表 示可以利用通道間一致性(ICC)參數(shù)的合并來進(jìn)一步增強(qiáng)。通過將此類參數(shù)合并到空間音 頻線索的集合中允許在重構(gòu)信號中表示所感知空間“擴(kuò)散(diffuseness)”或相反的空間 “壓縮(compactness),,。對于BCC而言,待解決的一個主要問題是對與編碼過程相關(guān)聯(lián)的參數(shù)的表示和有 效編碼。如上所述,可以使用傳統(tǒng)音頻源編碼技術(shù)(諸如AAC)對下混頻信號進(jìn)行有效編碼, 并且該有效編碼原理也可以應(yīng)用于空間線索參數(shù)。然而,編碼通常將誤差引入到空間線索 參數(shù)中,并且一個挑戰(zhàn)在于能夠增加收聽者的空間音頻體驗(yàn),而不必擴(kuò)展絕對需要之外的 任何其他編碼帶寬。在語音和音頻編碼中普遍使用的一個技術(shù)(其可以應(yīng)用于BCC)是增 強(qiáng)待編碼信號的特定區(qū)域,從而遮掩編碼過程引入的任何誤差,并且改進(jìn)總的所感知音頻 體驗(yàn)。
發(fā)明內(nèi)容
本發(fā)明出自以下考慮希望調(diào)整空間線索信息,從而增強(qiáng)收聽者感知的總的空間 音頻體驗(yàn)。與此相關(guān)聯(lián)的問題是如何調(diào)整空間線索,使得最終的增強(qiáng)取決于空間音頻信號 的特定特性。本發(fā)明實(shí)施方式的目的在于解決上述問題。 根據(jù)本發(fā)明的第一方面提供一種方法,包括估計(jì)表示與來自于多通道音頻信號 中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道的第二音頻信號 相關(guān)聯(lián)的到達(dá)方向的值;根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向 來確定縮放因子;以及將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之 間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。根據(jù)本發(fā)明的實(shí)施方式,該方法還包括確定表示所述第一音頻信號和所述第二 音頻信號的一致性的值。該方法還可以包括針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的 到達(dá)方向的值來確定可靠性估計(jì)值。優(yōu)選地根據(jù)以下至少一項(xiàng)將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第 二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)針對表示與所述第一音頻信號和所述第 二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的所述可靠性估計(jì)值;以及表示所述第一音頻信號和所 述第二音頻信號的一致性的值。估計(jì)表示與第一音頻信號和第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值可以包括使用 基于虛擬音頻信號的到達(dá)方向的第一模型,其中所述虛擬音頻信號與音頻信號相關(guān)聯(lián),所 述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo)出。針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確 定可靠性估計(jì)值可以包括估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到 達(dá)方向的至少一個其他值,其中估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián) 的到達(dá)方向的至少一個其他值還可以包括使用基于所述虛擬音頻信號的到達(dá)方向的第二 模型,其中所述虛擬音頻信號優(yōu)選地與音頻信號相關(guān)聯(lián),所述音頻信號從發(fā)自至少兩個音 頻信號源的至少兩個音頻信號的合并導(dǎo)出;以及優(yōu)選地確定表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值和表示與所述第一音頻信號和所述第二音頻信號 相關(guān)聯(lián)的到達(dá)方向的所述至少一個其他值之間的差是否位于預(yù)定誤差界限內(nèi)?;谒鎏摂M音頻信號的到達(dá)方向的所述第一模型優(yōu)選地取決于兩個音頻信號 之間的音頻信號電平差?;谒鎏摂M音頻信號的傳播方向的所述第一模型可以包括頭部的球模型?;谒鎏摂M音頻信號的到達(dá)方向的所述第二模型優(yōu)選地取決于兩個音頻信號 之間的到達(dá)時差。基于所述虛擬音頻信號的傳播方向的所述第二模型可以包括基于正弦波平移律 的模型。根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向確定所述縮放 因子可以包括從至少一個預(yù)定的值范圍中的第一預(yù)定的值范圍為所述縮放因子指派值, 其中可以根據(jù)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的虛擬音頻信號的傳 播方向的值來選擇所述第一預(yù)定的值范圍。將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信 號電平差相關(guān)聯(lián)的參數(shù)可以包括將所述縮放因子乘以與所述第一音頻信號和所述第二音 頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù) 優(yōu)選地是對數(shù)參數(shù)。所述多通道音頻信號優(yōu)選地是頻域信號。將所述多通道音頻信號優(yōu)選地劃分為多個子帶,并且將用于增強(qiáng)所述多通道音頻 信號的方法優(yōu)選地應(yīng)用于多個子帶中的至少一個。所述方法優(yōu)選地用于增強(qiáng)包括至少兩個通道的所述多通道音頻信號。根據(jù)本發(fā)明的第二方面,提供一種設(shè)備,所述設(shè)備被配置用于估計(jì)表示與來自于 多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道 的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值;根據(jù)與所述第一音頻信號和所述第二音頻信號相 關(guān)聯(lián)的到達(dá)方向來確定縮放因子;以及將所述縮放因子應(yīng)用于與所述第一音頻信號和所述 第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。根據(jù)本發(fā)明的一個實(shí)施方式,所述設(shè)備優(yōu)選地還被配置用于確定表示所述第一音 頻信號和所述第二音頻信號的一致性的值。所述設(shè)備還可以被配置用于針對表示與所述第一音頻信號和所述第二音頻信號 相關(guān)聯(lián)的到達(dá)方向的值來確定可靠性估計(jì)值。所述設(shè)備被配置用于可以根據(jù)以下至少一項(xiàng)將所述縮放因子應(yīng)用于與所述第一 音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)針對表示與所述第一 音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的所述可靠性估計(jì)值;以及表示所述 第一音頻信號和所述第二音頻信號的一致性的值。被配置用于估計(jì)表示與第一音頻信號和第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的 所述設(shè)備還可以被配置用于使用基于虛擬音頻信號的到達(dá)方向的第一模型,其中所述虛 擬音頻信號優(yōu)選地與音頻信號相關(guān)聯(lián),所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩 個音頻信號的合并導(dǎo)出。
被配置用于確定表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方 向的值的可靠性估計(jì)值的設(shè)備還可以被配置用于估計(jì)表示與所述第一音頻信號和所述第 二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一個其他值,其中估計(jì)表示與所述第一音頻信號和所 述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一個其他值還可以包括使用基于所述虛擬音頻 信號的到達(dá)方向的第二模型,其中所述虛擬音頻信號優(yōu)選地與音頻信號相關(guān)聯(lián),所述音頻 信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo)出;以及可以確定表示與所 述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值和可以表示與所述第一音頻 信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的所述至少一個其他值之間的差是否可以位 于預(yù)定誤差界限內(nèi)?;谒鎏摂M音頻信號的到達(dá)方向的所述第一模型可以取決于兩個音頻信號之 間的音頻信號電平差?;谒鎏摂M音頻信號的傳播方向的所述第一模型可以包括頭部的球模型?;谒鎏摂M音頻信號的到達(dá)方向的所述第二模型可以取決于兩個音頻信號之 間的到達(dá)時差?;谒鎏摂M音頻信號的傳播方向的所述第二模型可以包括基于正弦波平移律 的模型。被配置用于根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向確 定所述縮放因子的設(shè)備還可以被配置用于從至少一個預(yù)定的值范圍中的第一預(yù)定的值范 圍為所述縮放因子指派值,其中優(yōu)選地根據(jù)表示與所述第一音頻信號和所述第二音頻信號 相關(guān)聯(lián)的虛擬音頻信號的傳播方向的值來選擇所述第一預(yù)定的值范圍。被配置用于將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之 間的音頻信號電平差相關(guān)聯(lián)的參數(shù)的設(shè)備還可以被配置用于將所述縮放因子乘以與所述 第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù) 優(yōu)選地是對數(shù)參數(shù)。所述多通道音頻信號優(yōu)選地是頻域信號。可以將所述多通道音頻信號劃分為多個子帶,并且所述設(shè)備被配置用于優(yōu)選地增 強(qiáng)所述多通道音頻信號的多個子帶中的至少一個。所述設(shè)備可以用于增強(qiáng)包括至少兩個通道的所述多通道音頻信號。一種音頻編碼器可以包括上述設(shè)備。一種音頻解碼器可以包括上述設(shè)備。一種電子設(shè)備可以包括上述設(shè)備。一種芯片組可以包括上述設(shè)備。根據(jù)本發(fā)明的第三方面,提供一種被配置用于執(zhí)行包括以下內(nèi)容的方法的計(jì)算機(jī) 程序產(chǎn)品估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻 信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值;根據(jù)與所述第一音頻 信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子;以及將所述縮放因子應(yīng)用于 與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。根據(jù)本發(fā)明的第四方面,提供一種設(shè)備,包括估計(jì)裝置,用于估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道 的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值;處理裝置,用于根據(jù)與所述第一音頻信號和所述 第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子;以及其他處理裝置,用于將所述縮放因 子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。
為了更好地理解本發(fā)明,現(xiàn)在將通過示例來參考附圖,在附圖中圖1示意性地示出了采用本發(fā)明實(shí)施方式的電子設(shè)備;圖2示意性地示出了采用本發(fā)明實(shí)施方式的音頻編解碼系統(tǒng);圖3示意性地示出了部署本發(fā)明第一實(shí)施方式的音頻編碼器;圖4示出了繪出根據(jù)本發(fā)明實(shí)施方式的編碼器操作的流程圖;圖5示意性地示出了根據(jù)本發(fā)明實(shí)施方式的下混頻器;圖6示意性地示出了根據(jù)本發(fā)明實(shí)施方式的空間音頻線索分析器;圖7示出了描繪針對包括M個輸入通道的多通道音頻信號系統(tǒng)中每個信道的ICTD 和ICLD值的分布的圖示;圖8示出了描繪使用兩個聲音源的虛擬聲音源位置的示例的圖示;圖9示出了進(jìn)一步詳細(xì)繪出根據(jù)本發(fā)明實(shí)施方式的操作的流程圖;圖10示意性地示出了部署本發(fā)明第一實(shí)施方式的音頻解碼器;圖11示出了繪出根據(jù)本發(fā)明實(shí)施方式的解碼器操作的流程圖;以及圖12示意性地示出了根據(jù)本發(fā)明實(shí)施方式的雙耳線索編碼合成器。
具體實(shí)施例方式下面更詳細(xì)地描述了用于為音頻編解碼器提供增強(qiáng)空間音頻線索的可能機(jī)制。在 這點(diǎn)上,首先參考圖1,圖1是示例性電子設(shè)備10的示意框圖,其可以合并根據(jù)本發(fā)明實(shí)施 方式的編解碼器。電子設(shè)備10例如可以是無線通信系統(tǒng)的移動終端或用戶設(shè)備。電子設(shè)備10包括經(jīng)由模數(shù)轉(zhuǎn)換器14鏈接到處理器21的麥克風(fēng)11。處理器21 還經(jīng)由數(shù)模轉(zhuǎn)換器32鏈接到揚(yáng)聲器33。處理器21還鏈接到收發(fā)機(jī)(TX/RX) 13、用戶接口 (UI) 15和存儲器22。處理器21可以被配置用于執(zhí)行各種程序代碼。實(shí)現(xiàn)的程序代碼包括用于對音頻 信號的較低頻帶和音頻信號的較高頻帶進(jìn)行編碼的音頻編碼代碼。實(shí)現(xiàn)的程序代碼23還 包括音頻解碼代碼。實(shí)現(xiàn)的程序代碼23例如可以存儲在存儲器22中,以便在需要時由處 理器21獲取。存儲器22還可以提供用于存儲數(shù)據(jù)的段M,例如是根據(jù)本發(fā)明已經(jīng)編碼的 數(shù)據(jù)。編碼和解碼代碼在本發(fā)明的實(shí)施方式中可以以硬件或固件實(shí)現(xiàn)。用戶接口 15使用戶能夠例如經(jīng)由小鍵盤向電子設(shè)備10輸入命令和/或例如經(jīng)由 顯示器從電子設(shè)備10獲得信息。收發(fā)機(jī)13支持例如經(jīng)由無線通信網(wǎng)絡(luò)與其他電子設(shè)備的
ififn。應(yīng)該理解,電子設(shè)備10的結(jié)構(gòu)可以以很多方式補(bǔ)充和改變。
電子設(shè)備10的用戶可以使用麥克風(fēng)11來輸入將傳輸?shù)侥承┢渌娮釉O(shè)備的或存 儲在存儲器22的數(shù)據(jù)段M中的語音。為此,相應(yīng)應(yīng)用已經(jīng)由用戶經(jīng)由用戶接口 15激活。 可以由處理器21運(yùn)行的該應(yīng)用使得處理器21執(zhí)行存儲在存儲器22中的編碼代碼。模數(shù)轉(zhuǎn)換器14將輸入模擬音頻信號轉(zhuǎn)換為數(shù)字音頻信號并向處理器21提供該數(shù)
字音頻信號。處理器21繼而可以以與參考圖2和圖3描述的方式相同的方式來處理數(shù)字音頻信號。所得比特流被提供給收發(fā)機(jī)13用于向另一電子設(shè)備傳輸。備選地,編碼的數(shù)據(jù)可 以存儲在存儲器22的數(shù)據(jù)段對中,例如用于稍后由同一電子設(shè)備10來傳輸或呈現(xiàn)。電子設(shè)備10還可以經(jīng)由其收發(fā)機(jī)13從另一電子設(shè)備接收具有相應(yīng)編碼數(shù)據(jù)的比 特流。在該情況中,處理器21可以執(zhí)行存儲在存儲器22中的解碼程序代碼。處理器21對接收的數(shù)據(jù)進(jìn)行解碼,并且向數(shù)模轉(zhuǎn)換器32提供解碼的數(shù)據(jù)。數(shù)模 轉(zhuǎn)換器32將數(shù)字解碼數(shù)據(jù)轉(zhuǎn)換為模擬音頻數(shù)據(jù)并經(jīng)由揚(yáng)聲器33輸出它們。解碼程序代碼 的執(zhí)行也可以由用戶經(jīng)由用戶接口 15調(diào)用的應(yīng)用觸發(fā)。接收的編碼數(shù)據(jù)也可以存儲在存儲器22的數(shù)據(jù)段M中而不是經(jīng)由揚(yáng)聲器33來 立即呈現(xiàn),從而例如支持向又一電子設(shè)備稍后呈現(xiàn)或轉(zhuǎn)發(fā)。應(yīng)該理解,在圖2、圖3、圖5、圖6、圖10和圖12中描述的示意結(jié)構(gòu)以及圖4、圖9 和圖11中的方法步驟僅表示包括本發(fā)明實(shí)施方式的完整音頻編解碼器的操作的一部分, 如示例性地實(shí)現(xiàn)在圖1所示的電子設(shè)備中。如本發(fā)明實(shí)施方式采用的音頻編解碼器的一般操作在圖2中示出。一般性音頻編 碼/解碼系統(tǒng)包括編碼器和解碼器,如圖2示意性地示出。示出的是具有編碼器104、存儲 或媒體通道106和解碼器108的系統(tǒng)102。編碼器104壓縮產(chǎn)生比特流112的輸入音頻信號110,其被存儲或通過媒體通道 106傳輸。比特流112可以在解碼器108內(nèi)接收。解碼器108對比特流112解壓縮并且產(chǎn) 生輸出音頻信號114。比特流112的比特率和與輸入信號110有關(guān)的輸出音頻信號114的 質(zhì)量是主要特征,其定義了編碼系統(tǒng)102的性能。圖3示意性地示出了根據(jù)本發(fā)明第一實(shí)施方式的編碼器104。編碼器104示出為 包括劃分為M個通道的輸入302。應(yīng)該理解,輸入302可以布置為接收M個通道的音頻信 號,或備選地來自于M個獨(dú)立音頻源的M個音頻信號。輸入302的M個通道中的每個可以 連接至下混頻器303和空間音頻線索分析器305兩者。下混頻器303可以布置用于將M個通道的每個合并為和信號304,該信號304包括 獨(dú)立音頻輸入信號的和的表示。在本發(fā)明的某些實(shí)施方式中,和信號304可以包括單個通 道。在本發(fā)明的其他實(shí)施方式中,和信號304可以包括(多個)E個和信號通道。來自于下混頻器303的和信號輸出可以連接至音頻編碼器307的輸入。音頻解碼 器307可以被配置用于編碼音頻和信號并且輸出參數(shù)化的編碼音頻流306。空間音頻線索分析器305可以被配置用于從輸入302接受M個通道音頻輸入信號 并且生成作為輸出的空間音頻線索信號308。來自于空間線索分析器305的輸出信號可以 布置用于連接至比特流格式器309的輸入(在本發(fā)明的某些實(shí)施方式中其也可以稱為比特 流復(fù)用器)。
在本發(fā)明某些實(shí)施方式中,可以存在從空間音頻線索分析器305到下混頻器303 的附加輸出連接,從而諸如ICTD空間音頻線索的空間音頻線索可以被順序反饋到下混頻 器,從而移除通道之間的時差。除了從空間線索分析器305接受空間線索信息,比特流格式器309可以進(jìn)一步布 置用于接收作為附加輸入的來自于音頻編碼器307的輸出。比特流格式器309繼而可以被 配置用于經(jīng)由輸出310來輸出輸出比特流112。參考示出編碼器操作的圖4中的流程圖更詳細(xì)地描述這些組件的操作。多通道音頻信號經(jīng)由輸入302由編碼器104接收。在本發(fā)明的第一實(shí)施方式中,來 自于每個通道的音頻信號是數(shù)字化采樣信號。在本發(fā)明的其他實(shí)施方式中,音頻輸入可以 包括多個模擬音頻信號源,例如來自于分布在音頻空間內(nèi)的多個麥克風(fēng),其是經(jīng)過模數(shù)(A/ D)轉(zhuǎn)換的。在本發(fā)明的其他實(shí)施方式中,多通道音頻輸入可以從脈沖碼調(diào)制數(shù)字信號轉(zhuǎn)換 到幅度調(diào)制數(shù)字信號。處理步驟401在圖4中示出了音頻信號的接收。下混頻器303接收多通道音頻信號并且將M個輸入通道合并為減少的通道數(shù)量E, 其傳遞多通道輸入信號的和。應(yīng)該理解,M個輸入通道可以下混頻到的通道的數(shù)量E可以 包括單個通道或多個通道。在本發(fā)明的實(shí)施方式中,下混頻可以采取將所有M個輸入信號添加到包括和信號 的單個信道中的形式。在本發(fā)明實(shí)施方式的該示例中,E可以等于1。在本發(fā)明的其他實(shí)施方式中,可以通過使用合適的時頻變換(諸如離散傅里葉變 換(DFT))將每個輸入通道變換為頻域的第一變換來在頻域中計(jì)算該和信號。圖5示出了描繪根據(jù)本發(fā)明實(shí)施方式的、出于下混頻多通道輸入音頻信號的目的 而可以使用的通用M到E下混頻器的框圖。圖5中的下混頻器303示出為具有針對每個時 域輸入通道Xi (η)的濾波器組502,其中i是時刻η的輸入通道號。除了下混頻器303示出 為具有下混頻塊504之外,最終可以用于針對每個輸出下混頻的通道yi(n)生成時域信號 的逆濾波器組506。在本發(fā)明的實(shí)施方式中,每個濾波器組502可以將特定通道Xi (η)的時域輸入轉(zhuǎn) 換為κ個子帶的集合。特定通道i的子帶集合可以表示為筆二昧(0),無0),.戈(撲…1)], 其中5;(幻表示獨(dú)立子帶k。總之,可以存在K個子帶的M個集合,每個集合針對每個輸入通 道。K個子帶的M個集合可以表示為民,足,...J^_J。在本發(fā)明的實(shí)施方式中,下混頻塊504繼而可以利用來自于頻率系數(shù)的M個集合 中每個的相同索引來對特定子帶進(jìn)行下混頻,從而將子帶集合的數(shù)量從M減少到E。這可以 如下實(shí)現(xiàn)通過將承載相同索引、來自于子帶M個集合中每個的特定第k個子帶乘以下混頻 矩陣,從而針對下混頻信號的E個輸出通道生成第k個子帶。換言之,通道數(shù)量的減少可以 通過使來自于通道的每個子帶接受矩陣減少運(yùn)算來實(shí)現(xiàn)。該運(yùn)算的機(jī)制可以通過以下數(shù)學(xué) 運(yùn)算表示
權(quán)利要求
1.一種方法,包括估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號 和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值;根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子;以及將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電 平差相關(guān)聯(lián)的參數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,還包括確定表示所述第一音頻信號和所述第二音頻信號的一致性的值。
3.根據(jù)權(quán)利要求1和2所述的方法,還包括針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確定可 靠性估計(jì)值。
4.根據(jù)權(quán)利要求3所述的方法,其中根據(jù)以下至少一項(xiàng)將所述縮放因子應(yīng)用于與所述 第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的所述可 靠性估計(jì)值;以及表示所述第一音頻信號和所述第二音頻信號的一致性的值。
5.根據(jù)權(quán)利要求1至4所述的方法,其中估計(jì)表示與第一音頻信號和第二音頻信號相 關(guān)聯(lián)的到達(dá)方向的值包括使用基于虛擬音頻信號的到達(dá)方向的第一模型,其中所述虛擬音頻信號與音頻信號相 關(guān)聯(lián),所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo)出。
6.根據(jù)權(quán)利要求3、4和5所述的方法,其中針對表示與所述第一音頻信號和所述第二 音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確定可靠性估計(jì)值包括估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一個其 他值,其中估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一 個其他值還包括使用基于虛擬音頻信號的到達(dá)方向的第二模型,其中所述虛擬音頻信號與 音頻信號相關(guān)聯(lián),所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo) 出;以及確定表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值和表示與 所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的所述至少一個其他值之間的 差是否位于預(yù)定誤差界限內(nèi)。
7.根據(jù)權(quán)利要求5所述的方法,其中基于所述虛擬音頻信號的到達(dá)方向的所述第一模 型取決于兩個音頻信號之間的音頻信號電平差。
8.根據(jù)權(quán)利要求5所述的方法,其中基于所述虛擬音頻信號的傳播方向的所述第一模 型包括頭部的球模型。
9.根據(jù)權(quán)利要求6所述的方法,其中基于所述虛擬音頻信號的到達(dá)方向的所述第二模 型取決于兩個音頻信號之間的到達(dá)時差。
10.根據(jù)權(quán)利要求6所述的方法,其中基于所述虛擬音頻信號的傳播方向的所述第二 模型包括基于正弦波平移律的模型。
11.根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的方法,其中根據(jù)與所述第一音頻信號和所述 第二音頻信號相關(guān)聯(lián)的到達(dá)方向確定所述縮放因子包括從至少一個預(yù)定的值范圍中的第一預(yù)定的值范圍為所述縮放因子指派值,其中根據(jù)表 示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的虛擬音頻信號的傳播方向的值來選 擇所述第一預(yù)定的值范圍。
12.根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的方法,其中將所述縮放因子應(yīng)用于與所述第 一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)包括將所述縮放因子乘以與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平 差相關(guān)聯(lián)的參數(shù)。
13.根據(jù)權(quán)利要求1至12中任一項(xiàng)所述的方法,其中與所述第一音頻信號和所述第二 音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)是對數(shù)參數(shù)。
14.根據(jù)權(quán)利要求1至13中任一項(xiàng)所述的方法,其中所述多通道音頻信號是頻域信號。
15.根據(jù)權(quán)利要求1至14中任一項(xiàng)所述的方法,其中將所述多通道音頻信號劃分為多 個子帶,并且將用于增強(qiáng)所述多通道音頻信號的方法應(yīng)用于多個子帶中的至少一個。
16.根據(jù)權(quán)利要求1至15中任一項(xiàng)所述的方法,用于增強(qiáng)包括至少兩個通道的所述多 通道音頻信號。
17.一種設(shè)備,被配置用于估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號 和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值;根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子;以及將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電 平差相關(guān)聯(lián)的參數(shù)。
18.根據(jù)權(quán)利要求17所述的設(shè)備,還被配置用于確定表示所述第一音頻信號和所述第二音頻信號的一致性的值。
19.根據(jù)權(quán)利要求17和18所述的設(shè)備,還被配置用于針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確定可 靠性估計(jì)值。
20.根據(jù)權(quán)利要求19所述的設(shè)備,其中所述設(shè)備被配置用于根據(jù)以下至少一項(xiàng)將所述 縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián) 的參數(shù)針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的所述可 靠性估計(jì)值;以及表示所述第一音頻信號和所述第二音頻信號的一致性的值。
21.根據(jù)權(quán)利要求17至20所述的設(shè)備,其中被配置用于估計(jì)表示與第一音頻信號和第 二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的所述設(shè)備還被配置用于使用基于虛擬音頻信號的到達(dá)方向的第一模型,其中所述虛擬音頻信號與音頻信號相 關(guān)聯(lián),所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo)出。
22.根據(jù)權(quán)利要求19、20和21所述的設(shè)備,其中被配置用于針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確定可靠性估計(jì)值的設(shè)備還被配置用 于估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一個其 他值,其中估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一 個其他值還包括使用基于虛擬音頻信號的到達(dá)方向的第二模型,其中所述虛擬音頻信號與 音頻信號相關(guān)聯(lián),所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo) 出;以及確定表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值和表示與 所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的所述至少一個其他值之間的 差是否位于預(yù)定誤差界限內(nèi)。
23.根據(jù)權(quán)利要求21所述的設(shè)備,其中基于所述虛擬音頻信號的到達(dá)方向的所述第一 模型取決于兩個音頻信號之間的音頻信號電平差。
24.根據(jù)權(quán)利要求21所述的設(shè)備,其中基于所述虛擬音頻信號的傳播方向的所述第一 模型包括頭部的球模型。
25.根據(jù)權(quán)利要求22所述的設(shè)備,其中基于所述虛擬音頻信號的到達(dá)方向的所述第二 模型取決于兩個音頻信號之間的到達(dá)時差。
26.根據(jù)權(quán)利要求22所述的設(shè)備,其中基于所述虛擬音頻信號的傳播方向的所述第二 模型包括基于正弦波平移律的模型。
27.根據(jù)權(quán)利要求17至沈中任一項(xiàng)所述的設(shè)備,其中被配置用于根據(jù)與所述第一音頻 信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向確定所述縮放因子的設(shè)備還被配置用于從至少一個預(yù)定的值范圍中的第一預(yù)定的值范圍為所述縮放因子指派值,其中根據(jù)表 示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的虛擬音頻信號的傳播方向的值來選 擇所述第一預(yù)定的值范圍。
28.根據(jù)權(quán)利要求1至27中任一項(xiàng)所述的設(shè)備,其中被配置用于將所述縮放因子應(yīng)用 于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)的設(shè)備 還被配置用于將所述縮放因子乘以與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平 差相關(guān)聯(lián)的參數(shù)。
29.根據(jù)權(quán)利要求17至觀中任一項(xiàng)所述的設(shè)備,其中與所述第一音頻信號和所述第二 音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)是對數(shù)參數(shù)。
30.根據(jù)權(quán)利要求17至四中任一項(xiàng)所述的設(shè)備,其中所述多通道音頻信號是頻域信號。
31.根據(jù)權(quán)利要求17至30中任一項(xiàng)所述的設(shè)備,其中將所述多通道音頻信號劃分為多 個子帶,并且所述設(shè)備被配置用于增強(qiáng)所述多通道音頻信號的多個子帶中的至少一個。
32.根據(jù)權(quán)利要求17至31中任一項(xiàng)所述的設(shè)備,其中所述設(shè)備用于增強(qiáng)包括至少兩個 通道的所述多通道音頻信號。
33.一種包括根據(jù)權(quán)利要求17至32所述的設(shè)備的音頻編碼器。
34.一種包括根據(jù)權(quán)利要求17至32所述的設(shè)備的音頻解碼器。
35.一種包括根據(jù)權(quán)利要求17至32所述的設(shè)備的電子設(shè)備。
36.一種包括根據(jù)權(quán)利要求17至32所述的設(shè)備的芯片組。
37.一種被配置用于執(zhí)行包括以下內(nèi)容的方法的計(jì)算機(jī)程序產(chǎn)品估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號 和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值;根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子;以及將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電 平差相關(guān)聯(lián)的參數(shù)。
38.一種設(shè)備,包括估計(jì)裝置,用于估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的 第一音頻信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值;處理裝置,用于根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確 定縮放因子;以及其他處理裝置,用于將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號 之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。
全文摘要
一種用于增強(qiáng)包括至少兩個通道的多通道音頻信號的設(shè)備,其被配置用于估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值;根據(jù)與第一音頻信號和第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子;以及將縮放因子應(yīng)用于與第一音頻信號和第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。
文檔編號G10L19/00GK102084418SQ200880130197
公開日2011年6月1日 申請日期2008年7月1日 優(yōu)先權(quán)日2008年7月1日
發(fā)明者P·奧雅拉 申請人:諾基亞公司