用于調(diào)整多通道音頻信號的空間線索信息的設(shè)備和方法

文檔序號：2831931閱讀：333來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用于調(diào)整多通道音頻信號的空間線索信息的設(shè)備和方法
技術(shù)領(lǐng)域：
本發(fā)明涉及被配置用于執(zhí)行音頻和語音信號編碼的設(shè)備。
背景技術(shù)：
空間音頻處理是從音頻源發(fā)出的音頻信號經(jīng)由不同傳播路徑到達(dá)收聽者左耳和右耳的效果。作為該效果的結(jié)果，左耳處的信號通常將具有與到達(dá)右耳的相應(yīng)信號不同的到達(dá)時間和信號電平。時間和信號電平之間的差是音頻信號經(jīng)其傳播而分別到達(dá)左耳和右耳的路徑中差的函數(shù)。收聽者的大腦繼而解釋這些差，從而給出以下感知接收的音頻信號是由相對于收聽者而位于特定距離和方向處的音頻源產(chǎn)生的。因此，可以將聽覺場景視為同時聽到由相對于收聽者而位于各個位置處的一個或多個音頻源所生成音頻信號的凈效果。人類大腦可以處理雙耳輸入信號從而斷定聲音源位置和方向的起碼事實(shí)可以用于對聽覺場景進(jìn)行編碼和合成。因此，空間聽覺編碼的典型方法將尋求對音頻場景的突出特征進(jìn)行建模。這通常需要有意地修改來自于一個或多個源的音頻信號，從而生成左音頻信號和右音頻信號。在本領(lǐng)域中，這些信號可以統(tǒng)稱為雙耳信號。然后，可以生成最終的雙耳信號，使得它們給出相對于收聽者位于不同位置處的變化音頻源的感知。最近，已經(jīng)結(jié)合多通道音頻重現(xiàn)來使用空間音頻技術(shù)。多通道音頻重現(xiàn)的目的在于提供對包括五個或更多(多個)獨(dú)立音頻通道或聲音源的多通道音頻信號的有效編碼。最近對多通道音頻信號的編碼方法已經(jīng)集中于參數(shù)立體聲(PQ和雙耳線索編碼(BCC)方法。BCC通常通過將各種輸入音頻信號下混頻為單個(“和”)通道或傳遞“和”信號的較少量通道來對多通道音頻信號進(jìn)行編碼。并行地，從輸入通道提取最突出的通道間線索(也稱作空間線索，其描述多通道聲像或音頻場景)并將其編碼為邊信息。和信號和邊信息兩者形成編碼的參數(shù)集，其繼而可以作為通信鏈的部分傳輸或存儲在存儲和轉(zhuǎn)發(fā)類型設(shè)備中。BCC技術(shù)的大部分實(shí)現(xiàn)通常采用低比特率音頻編碼方案來對和信號進(jìn)行進(jìn)一步編碼。最終，BCC解碼器根據(jù)傳輸或存儲的和信號和空間線索信息來生成多通道輸出信號。關(guān)于 BCC技術(shù)的其他信息可以在以下IEEE出版物中找到IEEE Transactions on Speech and Audio Processing, Vol. 11，No 6，2003 年 11 月中 Baumgarte, F 禾口 Faller，C 的 Binaural Cue Coding-Part II Schemes and Applications。通常，在空間音頻編碼系統(tǒng)中采用的下混頻信號附加地使用低比特率感知音頻編碼技術(shù)來編碼，從而進(jìn)一步降低所需的比特率，其中低比特率感知音頻編碼技術(shù)諸如IS0/IEC移動圖片專家組高級音頻編碼標(biāo)準(zhǔn)。在空間音頻多通道編碼的典型實(shí)現(xiàn)中，空間線索的集合包括對兩個通道間的音頻電平中的相對差建模的通道間電平差參數(shù)(ICLD)，以及表示兩個通道間信號的時差或相移的通道間時延值(ICTD)。通常關(guān)于參考通道針對每個通道確定音頻電平差和時差。備選地，某些系統(tǒng)可以利用頭部相關(guān)傳遞函數(shù)(HRTF)的輔助生成空間音頻線索。關(guān)于此類技術(shù) 的其他信息可以在MIT Press在 1983年出版的、J. Blaubert 的Psychoacoustics of Human Sound Localization 中戈至Ij0
盡管ICLD和ICTD參數(shù)表示最重要的空間音頻線索，但是使用這些參數(shù)的空間表示可以利用通道間一致性(ICC)參數(shù)的合并來進(jìn)一步增強(qiáng)。通過將此類參數(shù)合并到空間音頻線索的集合中允許在重構(gòu)信號中表示所感知空間“擴(kuò)散(diffuseness)”或相反的空間 “壓縮(compactness)，，。對于BCC而言，待解決的一個主要問題是對與編碼過程相關(guān)聯(lián)的參數(shù)的表示和有效編碼。如上所述，可以使用傳統(tǒng)音頻源編碼技術(shù)(諸如AAC)對下混頻信號進(jìn)行有效編碼，并且該有效編碼原理也可以應(yīng)用于空間線索參數(shù)。然而，編碼通常將誤差引入到空間線索參數(shù)中，并且一個挑戰(zhàn)在于能夠增加收聽者的空間音頻體驗(yàn)，而不必擴(kuò)展絕對需要之外的任何其他編碼帶寬。在語音和音頻編碼中普遍使用的一個技術(shù)(其可以應(yīng)用于BCC)是增強(qiáng)待編碼信號的特定區(qū)域，從而遮掩編碼過程引入的任何誤差，并且改進(jìn)總的所感知音頻體驗(yàn)。

發(fā)明內(nèi)容
本發(fā)明出自以下考慮希望調(diào)整空間線索信息，從而增強(qiáng)收聽者感知的總的空間音頻體驗(yàn)。與此相關(guān)聯(lián)的問題是如何調(diào)整空間線索，使得最終的增強(qiáng)取決于空間音頻信號的特定特性。本發(fā)明實(shí)施方式的目的在于解決上述問題。根據(jù)本發(fā)明的第一方面提供一種方法，包括估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值；根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子；以及將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。根據(jù)本發(fā)明的實(shí)施方式，該方法還包括確定表示所述第一音頻信號和所述第二音頻信號的一致性的值。該方法還可以包括針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確定可靠性估計(jì)值。優(yōu)選地根據(jù)以下至少一項(xiàng)將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的所述可靠性估計(jì)值；以及表示所述第一音頻信號和所述第二音頻信號的一致性的值。估計(jì)表示與第一音頻信號和第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值可以包括使用基于虛擬音頻信號的到達(dá)方向的第一模型，其中所述虛擬音頻信號與音頻信號相關(guān)聯(lián)，所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo)出。針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確定可靠性估計(jì)值可以包括估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一個其他值，其中估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián) 的到達(dá)方向的至少一個其他值還可以包括使用基于所述虛擬音頻信號的到達(dá)方向的第二模型，其中所述虛擬音頻信號優(yōu)選地與音頻信號相關(guān)聯(lián)，所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo)出；以及優(yōu)選地確定表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值和表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的所述至少一個其他值之間的差是否位于預(yù)定誤差界限內(nèi)?；谒鎏摂M音頻信號的到達(dá)方向的所述第一模型優(yōu)選地取決于兩個音頻信號之間的音頻信號電平差?；谒鎏摂M音頻信號的傳播方向的所述第一模型可以包括頭部的球模型?；谒鎏摂M音頻信號的到達(dá)方向的所述第二模型優(yōu)選地取決于兩個音頻信號之間的到達(dá)時差。基于所述虛擬音頻信號的傳播方向的所述第二模型可以包括基于正弦波平移律的模型。根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向確定所述縮放因子可以包括從至少一個預(yù)定的值范圍中的第一預(yù)定的值范圍為所述縮放因子指派值，其中可以根據(jù)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的虛擬音頻信號的傳播方向的值來選擇所述第一預(yù)定的值范圍。將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)可以包括將所述縮放因子乘以與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù) 優(yōu)選地是對數(shù)參數(shù)。所述多通道音頻信號優(yōu)選地是頻域信號。將所述多通道音頻信號優(yōu)選地劃分為多個子帶，并且將用于增強(qiáng)所述多通道音頻信號的方法優(yōu)選地應(yīng)用于多個子帶中的至少一個。所述方法優(yōu)選地用于增強(qiáng)包括至少兩個通道的所述多通道音頻信號。根據(jù)本發(fā)明的第二方面，提供一種設(shè)備，所述設(shè)備被配置用于估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值；根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子；以及將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。根據(jù)本發(fā)明的一個實(shí)施方式，所述設(shè)備優(yōu)選地還被配置用于確定表示所述第一音頻信號和所述第二音頻信號的一致性的值。所述設(shè)備還可以被配置用于針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確定可靠性估計(jì)值。所述設(shè)備被配置用于可以根據(jù)以下至少一項(xiàng)將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的所述可靠性估計(jì)值；以及表示所述第一音頻信號和所述第二音頻信號的一致性的值。被配置用于估計(jì)表示與第一音頻信號和第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的所述設(shè)備還可以被配置用于使用基于虛擬音頻信號的到達(dá)方向的第一模型，其中所述虛擬音頻信號優(yōu)選地與音頻信號相關(guān)聯(lián)，所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo)出。
被配置用于確定表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的可靠性估計(jì)值的設(shè)備還可以被配置用于估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一個其他值，其中估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一個其他值還可以包括使用基于所述虛擬音頻信號的到達(dá)方向的第二模型，其中所述虛擬音頻信號優(yōu)選地與音頻信號相關(guān)聯(lián)，所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo)出；以及可以確定表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值和可以表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的所述至少一個其他值之間的差是否可以位于預(yù)定誤差界限內(nèi)?；谒鎏摂M音頻信號的到達(dá)方向的所述第一模型可以取決于兩個音頻信號之間的音頻信號電平差?；谒鎏摂M音頻信號的傳播方向的所述第一模型可以包括頭部的球模型?；谒鎏摂M音頻信號的到達(dá)方向的所述第二模型可以取決于兩個音頻信號之間的到達(dá)時差?；谒鎏摂M音頻信號的傳播方向的所述第二模型可以包括基于正弦波平移律的模型。被配置用于根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向確定所述縮放因子的設(shè)備還可以被配置用于從至少一個預(yù)定的值范圍中的第一預(yù)定的值范圍為所述縮放因子指派值，其中優(yōu)選地根據(jù)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的虛擬音頻信號的傳播方向的值來選擇所述第一預(yù)定的值范圍。被配置用于將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)的設(shè)備還可以被配置用于將所述縮放因子乘以與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù) 優(yōu)選地是對數(shù)參數(shù)。所述多通道音頻信號優(yōu)選地是頻域信號。可以將所述多通道音頻信號劃分為多個子帶，并且所述設(shè)備被配置用于優(yōu)選地增強(qiáng)所述多通道音頻信號的多個子帶中的至少一個。所述設(shè)備可以用于增強(qiáng)包括至少兩個通道的所述多通道音頻信號。一種音頻編碼器可以包括上述設(shè)備。一種音頻解碼器可以包括上述設(shè)備。一種電子設(shè)備可以包括上述設(shè)備。一種芯片組可以包括上述設(shè)備。根據(jù)本發(fā)明的第三方面，提供一種被配置用于執(zhí)行包括以下內(nèi)容的方法的計(jì)算機(jī) 程序產(chǎn)品估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值；根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子；以及將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。根據(jù)本發(fā)明的第四方面，提供一種設(shè)備，包括估計(jì)裝置，用于估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值；處理裝置，用于根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子；以及其他處理裝置，用于將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。

為了更好地理解本發(fā)明，現(xiàn)在將通過示例來參考附圖，在附圖中圖1示意性地示出了采用本發(fā)明實(shí)施方式的電子設(shè)備；圖2示意性地示出了采用本發(fā)明實(shí)施方式的音頻編解碼系統(tǒng)；圖3示意性地示出了部署本發(fā)明第一實(shí)施方式的音頻編碼器；圖4示出了繪出根據(jù)本發(fā)明實(shí)施方式的編碼器操作的流程圖；圖5示意性地示出了根據(jù)本發(fā)明實(shí)施方式的下混頻器；圖6示意性地示出了根據(jù)本發(fā)明實(shí)施方式的空間音頻線索分析器；圖7示出了描繪針對包括M個輸入通道的多通道音頻信號系統(tǒng)中每個信道的ICTD 和ICLD值的分布的圖示；圖8示出了描繪使用兩個聲音源的虛擬聲音源位置的示例的圖示；圖9示出了進(jìn)一步詳細(xì)繪出根據(jù)本發(fā)明實(shí)施方式的操作的流程圖；圖10示意性地示出了部署本發(fā)明第一實(shí)施方式的音頻解碼器；圖11示出了繪出根據(jù)本發(fā)明實(shí)施方式的解碼器操作的流程圖；以及圖12示意性地示出了根據(jù)本發(fā)明實(shí)施方式的雙耳線索編碼合成器。
具體實(shí)施例方式下面更詳細(xì)地描述了用于為音頻編解碼器提供增強(qiáng)空間音頻線索的可能機(jī)制。在這點(diǎn)上，首先參考圖1，圖1是示例性電子設(shè)備10的示意框圖，其可以合并根據(jù)本發(fā)明實(shí)施方式的編解碼器。電子設(shè)備10例如可以是無線通信系統(tǒng)的移動終端或用戶設(shè)備。電子設(shè)備10包括經(jīng)由模數(shù)轉(zhuǎn)換器14鏈接到處理器21的麥克風(fēng)11。處理器21 還經(jīng)由數(shù)模轉(zhuǎn)換器32鏈接到揚(yáng)聲器33。處理器21還鏈接到收發(fā)機(jī)(TX/RX) 13、用戶接口 (UI) 15和存儲器22。處理器21可以被配置用于執(zhí)行各種程序代碼。實(shí)現(xiàn)的程序代碼包括用于對音頻信號的較低頻帶和音頻信號的較高頻帶進(jìn)行編碼的音頻編碼代碼。實(shí)現(xiàn)的程序代碼23還包括音頻解碼代碼。實(shí)現(xiàn)的程序代碼23例如可以存儲在存儲器22中，以便在需要時由處理器21獲取。存儲器22還可以提供用于存儲數(shù)據(jù)的段M，例如是根據(jù)本發(fā)明已經(jīng)編碼的數(shù)據(jù)。編碼和解碼代碼在本發(fā)明的實(shí)施方式中可以以硬件或固件實(shí)現(xiàn)。用戶接口 15使用戶能夠例如經(jīng)由小鍵盤向電子設(shè)備10輸入命令和/或例如經(jīng)由顯示器從電子設(shè)備10獲得信息。收發(fā)機(jī)13支持例如經(jīng)由無線通信網(wǎng)絡(luò)與其他電子設(shè)備的
ififn。應(yīng)該理解，電子設(shè)備10的結(jié)構(gòu)可以以很多方式補(bǔ)充和改變。
電子設(shè)備10的用戶可以使用麥克風(fēng)11來輸入將傳輸?shù)侥承┢渌娮釉O(shè)備的或存儲在存儲器22的數(shù)據(jù)段M中的語音。為此，相應(yīng)應(yīng)用已經(jīng)由用戶經(jīng)由用戶接口 15激活。可以由處理器21運(yùn)行的該應(yīng)用使得處理器21執(zhí)行存儲在存儲器22中的編碼代碼。模數(shù)轉(zhuǎn)換器14將輸入模擬音頻信號轉(zhuǎn)換為數(shù)字音頻信號并向處理器21提供該數(shù)
字音頻信號。處理器21繼而可以以與參考圖2和圖3描述的方式相同的方式來處理數(shù)字音頻信號。所得比特流被提供給收發(fā)機(jī)13用于向另一電子設(shè)備傳輸。備選地，編碼的數(shù)據(jù)可以存儲在存儲器22的數(shù)據(jù)段對中，例如用于稍后由同一電子設(shè)備10來傳輸或呈現(xiàn)。電子設(shè)備10還可以經(jīng)由其收發(fā)機(jī)13從另一電子設(shè)備接收具有相應(yīng)編碼數(shù)據(jù)的比特流。在該情況中，處理器21可以執(zhí)行存儲在存儲器22中的解碼程序代碼。處理器21對接收的數(shù)據(jù)進(jìn)行解碼，并且向數(shù)模轉(zhuǎn)換器32提供解碼的數(shù)據(jù)。數(shù)模轉(zhuǎn)換器32將數(shù)字解碼數(shù)據(jù)轉(zhuǎn)換為模擬音頻數(shù)據(jù)并經(jīng)由揚(yáng)聲器33輸出它們。解碼程序代碼的執(zhí)行也可以由用戶經(jīng)由用戶接口 15調(diào)用的應(yīng)用觸發(fā)。接收的編碼數(shù)據(jù)也可以存儲在存儲器22的數(shù)據(jù)段M中而不是經(jīng)由揚(yáng)聲器33來立即呈現(xiàn)，從而例如支持向又一電子設(shè)備稍后呈現(xiàn)或轉(zhuǎn)發(fā)。應(yīng)該理解，在圖2、圖3、圖5、圖6、圖10和圖12中描述的示意結(jié)構(gòu)以及圖4、圖9 和圖11中的方法步驟僅表示包括本發(fā)明實(shí)施方式的完整音頻編解碼器的操作的一部分，如示例性地實(shí)現(xiàn)在圖1所示的電子設(shè)備中。如本發(fā)明實(shí)施方式采用的音頻編解碼器的一般操作在圖2中示出。一般性音頻編碼/解碼系統(tǒng)包括編碼器和解碼器，如圖2示意性地示出。示出的是具有編碼器104、存儲或媒體通道106和解碼器108的系統(tǒng)102。編碼器104壓縮產(chǎn)生比特流112的輸入音頻信號110，其被存儲或通過媒體通道 106傳輸。比特流112可以在解碼器108內(nèi)接收。解碼器108對比特流112解壓縮并且產(chǎn) 生輸出音頻信號114。比特流112的比特率和與輸入信號110有關(guān)的輸出音頻信號114的質(zhì)量是主要特征，其定義了編碼系統(tǒng)102的性能。圖3示意性地示出了根據(jù)本發(fā)明第一實(shí)施方式的編碼器104。編碼器104示出為包括劃分為M個通道的輸入302。應(yīng)該理解，輸入302可以布置為接收M個通道的音頻信號，或備選地來自于M個獨(dú)立音頻源的M個音頻信號。輸入302的M個通道中的每個可以連接至下混頻器303和空間音頻線索分析器305兩者。下混頻器303可以布置用于將M個通道的每個合并為和信號304，該信號304包括獨(dú)立音頻輸入信號的和的表示。在本發(fā)明的某些實(shí)施方式中，和信號304可以包括單個通道。在本發(fā)明的其他實(shí)施方式中，和信號304可以包括(多個)E個和信號通道。來自于下混頻器303的和信號輸出可以連接至音頻編碼器307的輸入。音頻解碼器307可以被配置用于編碼音頻和信號并且輸出參數(shù)化的編碼音頻流306。空間音頻線索分析器305可以被配置用于從輸入302接受M個通道音頻輸入信號并且生成作為輸出的空間音頻線索信號308。來自于空間線索分析器305的輸出信號可以布置用于連接至比特流格式器309的輸入(在本發(fā)明的某些實(shí)施方式中其也可以稱為比特流復(fù)用器)。
在本發(fā)明某些實(shí)施方式中，可以存在從空間音頻線索分析器305到下混頻器303 的附加輸出連接，從而諸如ICTD空間音頻線索的空間音頻線索可以被順序反饋到下混頻器，從而移除通道之間的時差。除了從空間線索分析器305接受空間線索信息，比特流格式器309可以進(jìn)一步布置用于接收作為附加輸入的來自于音頻編碼器307的輸出。比特流格式器309繼而可以被配置用于經(jīng)由輸出310來輸出輸出比特流112。參考示出編碼器操作的圖4中的流程圖更詳細(xì)地描述這些組件的操作。多通道音頻信號經(jīng)由輸入302由編碼器104接收。在本發(fā)明的第一實(shí)施方式中，來自于每個通道的音頻信號是數(shù)字化采樣信號。在本發(fā)明的其他實(shí)施方式中，音頻輸入可以包括多個模擬音頻信號源，例如來自于分布在音頻空間內(nèi)的多個麥克風(fēng)，其是經(jīng)過模數(shù)(A/ D)轉(zhuǎn)換的。在本發(fā)明的其他實(shí)施方式中，多通道音頻輸入可以從脈沖碼調(diào)制數(shù)字信號轉(zhuǎn)換到幅度調(diào)制數(shù)字信號。處理步驟401在圖4中示出了音頻信號的接收。下混頻器303接收多通道音頻信號并且將M個輸入通道合并為減少的通道數(shù)量E，其傳遞多通道輸入信號的和。應(yīng)該理解，M個輸入通道可以下混頻到的通道的數(shù)量E可以包括單個通道或多個通道。在本發(fā)明的實(shí)施方式中，下混頻可以采取將所有M個輸入信號添加到包括和信號的單個信道中的形式。在本發(fā)明實(shí)施方式的該示例中，E可以等于1。在本發(fā)明的其他實(shí)施方式中，可以通過使用合適的時頻變換(諸如離散傅里葉變換(DFT))將每個輸入通道變換為頻域的第一變換來在頻域中計(jì)算該和信號。圖5示出了描繪根據(jù)本發(fā)明實(shí)施方式的、出于下混頻多通道輸入音頻信號的目的而可以使用的通用M到E下混頻器的框圖。圖5中的下混頻器303示出為具有針對每個時域輸入通道Xi (η)的濾波器組502，其中i是時刻η的輸入通道號。除了下混頻器303示出為具有下混頻塊504之外，最終可以用于針對每個輸出下混頻的通道yi(n)生成時域信號的逆濾波器組506。在本發(fā)明的實(shí)施方式中，每個濾波器組502可以將特定通道Xi (η)的時域輸入轉(zhuǎn) 換為κ個子帶的集合。特定通道i的子帶集合可以表示為筆二昧(0)，無0)，.戈(撲…1)], 其中5；(幻表示獨(dú)立子帶k。總之，可以存在K個子帶的M個集合，每個集合針對每個輸入通道。K個子帶的M個集合可以表示為民,足，...J^_J。在本發(fā)明的實(shí)施方式中，下混頻塊504繼而可以利用來自于頻率系數(shù)的M個集合中每個的相同索引來對特定子帶進(jìn)行下混頻，從而將子帶集合的數(shù)量從M減少到E。這可以如下實(shí)現(xiàn)通過將承載相同索引、來自于子帶M個集合中每個的特定第k個子帶乘以下混頻矩陣，從而針對下混頻信號的E個輸出通道生成第k個子帶。換言之，通道數(shù)量的減少可以通過使來自于通道的每個子帶接受矩陣減少運(yùn)算來實(shí)現(xiàn)。該運(yùn)算的機(jī)制可以通過以下數(shù)學(xué) 運(yùn)算表示
權(quán)利要求
1.一種方法，包括估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值；根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子；以及將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。
2.根據(jù)權(quán)利要求1所述的方法，還包括確定表示所述第一音頻信號和所述第二音頻信號的一致性的值。
3.根據(jù)權(quán)利要求1和2所述的方法，還包括針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確定可靠性估計(jì)值。
4.根據(jù)權(quán)利要求3所述的方法，其中根據(jù)以下至少一項(xiàng)將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的所述可靠性估計(jì)值；以及表示所述第一音頻信號和所述第二音頻信號的一致性的值。
5.根據(jù)權(quán)利要求1至4所述的方法，其中估計(jì)表示與第一音頻信號和第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值包括使用基于虛擬音頻信號的到達(dá)方向的第一模型，其中所述虛擬音頻信號與音頻信號相關(guān)聯(lián)，所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo)出。
6.根據(jù)權(quán)利要求3、4和5所述的方法，其中針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確定可靠性估計(jì)值包括估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一個其他值，其中估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一個其他值還包括使用基于虛擬音頻信號的到達(dá)方向的第二模型，其中所述虛擬音頻信號與音頻信號相關(guān)聯(lián)，所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo) 出；以及確定表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值和表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的所述至少一個其他值之間的差是否位于預(yù)定誤差界限內(nèi)。
7.根據(jù)權(quán)利要求5所述的方法，其中基于所述虛擬音頻信號的到達(dá)方向的所述第一模型取決于兩個音頻信號之間的音頻信號電平差。
8.根據(jù)權(quán)利要求5所述的方法，其中基于所述虛擬音頻信號的傳播方向的所述第一模型包括頭部的球模型。
9.根據(jù)權(quán)利要求6所述的方法，其中基于所述虛擬音頻信號的到達(dá)方向的所述第二模型取決于兩個音頻信號之間的到達(dá)時差。
10.根據(jù)權(quán)利要求6所述的方法，其中基于所述虛擬音頻信號的傳播方向的所述第二模型包括基于正弦波平移律的模型。
11.根據(jù)權(quán)利要求1至10中任一項(xiàng)所述的方法，其中根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向確定所述縮放因子包括從至少一個預(yù)定的值范圍中的第一預(yù)定的值范圍為所述縮放因子指派值，其中根據(jù)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的虛擬音頻信號的傳播方向的值來選擇所述第一預(yù)定的值范圍。
12.根據(jù)權(quán)利要求1至11中任一項(xiàng)所述的方法，其中將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)包括將所述縮放因子乘以與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。
13.根據(jù)權(quán)利要求1至12中任一項(xiàng)所述的方法，其中與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)是對數(shù)參數(shù)。
14.根據(jù)權(quán)利要求1至13中任一項(xiàng)所述的方法，其中所述多通道音頻信號是頻域信號。
15.根據(jù)權(quán)利要求1至14中任一項(xiàng)所述的方法，其中將所述多通道音頻信號劃分為多個子帶，并且將用于增強(qiáng)所述多通道音頻信號的方法應(yīng)用于多個子帶中的至少一個。
16.根據(jù)權(quán)利要求1至15中任一項(xiàng)所述的方法，用于增強(qiáng)包括至少兩個通道的所述多通道音頻信號。
17.一種設(shè)備，被配置用于估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值；根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子；以及將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。
18.根據(jù)權(quán)利要求17所述的設(shè)備，還被配置用于確定表示所述第一音頻信號和所述第二音頻信號的一致性的值。
19.根據(jù)權(quán)利要求17和18所述的設(shè)備，還被配置用于針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確定可靠性估計(jì)值。
20.根據(jù)權(quán)利要求19所述的設(shè)備，其中所述設(shè)備被配置用于根據(jù)以下至少一項(xiàng)將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián) 的參數(shù)針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的所述可靠性估計(jì)值；以及表示所述第一音頻信號和所述第二音頻信號的一致性的值。
21.根據(jù)權(quán)利要求17至20所述的設(shè)備，其中被配置用于估計(jì)表示與第一音頻信號和第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值的所述設(shè)備還被配置用于使用基于虛擬音頻信號的到達(dá)方向的第一模型，其中所述虛擬音頻信號與音頻信號相關(guān)聯(lián)，所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo)出。
22.根據(jù)權(quán)利要求19、20和21所述的設(shè)備，其中被配置用于針對表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值來確定可靠性估計(jì)值的設(shè)備還被配置用于估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一個其他值，其中估計(jì)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的至少一個其他值還包括使用基于虛擬音頻信號的到達(dá)方向的第二模型，其中所述虛擬音頻信號與音頻信號相關(guān)聯(lián)，所述音頻信號從發(fā)自至少兩個音頻信號源的至少兩個音頻信號的合并導(dǎo) 出；以及確定表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值和表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向的所述至少一個其他值之間的差是否位于預(yù)定誤差界限內(nèi)。
23.根據(jù)權(quán)利要求21所述的設(shè)備，其中基于所述虛擬音頻信號的到達(dá)方向的所述第一模型取決于兩個音頻信號之間的音頻信號電平差。
24.根據(jù)權(quán)利要求21所述的設(shè)備，其中基于所述虛擬音頻信號的傳播方向的所述第一模型包括頭部的球模型。
25.根據(jù)權(quán)利要求22所述的設(shè)備，其中基于所述虛擬音頻信號的到達(dá)方向的所述第二模型取決于兩個音頻信號之間的到達(dá)時差。
26.根據(jù)權(quán)利要求22所述的設(shè)備，其中基于所述虛擬音頻信號的傳播方向的所述第二模型包括基于正弦波平移律的模型。
27.根據(jù)權(quán)利要求17至沈中任一項(xiàng)所述的設(shè)備，其中被配置用于根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向確定所述縮放因子的設(shè)備還被配置用于從至少一個預(yù)定的值范圍中的第一預(yù)定的值范圍為所述縮放因子指派值，其中根據(jù)表示與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的虛擬音頻信號的傳播方向的值來選擇所述第一預(yù)定的值范圍。
28.根據(jù)權(quán)利要求1至27中任一項(xiàng)所述的設(shè)備，其中被配置用于將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)的設(shè)備還被配置用于將所述縮放因子乘以與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。
29.根據(jù)權(quán)利要求17至觀中任一項(xiàng)所述的設(shè)備，其中與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)是對數(shù)參數(shù)。
30.根據(jù)權(quán)利要求17至四中任一項(xiàng)所述的設(shè)備，其中所述多通道音頻信號是頻域信號。
31.根據(jù)權(quán)利要求17至30中任一項(xiàng)所述的設(shè)備，其中將所述多通道音頻信號劃分為多個子帶，并且所述設(shè)備被配置用于增強(qiáng)所述多通道音頻信號的多個子帶中的至少一個。
32.根據(jù)權(quán)利要求17至31中任一項(xiàng)所述的設(shè)備，其中所述設(shè)備用于增強(qiáng)包括至少兩個通道的所述多通道音頻信號。
33.一種包括根據(jù)權(quán)利要求17至32所述的設(shè)備的音頻編碼器。
34.一種包括根據(jù)權(quán)利要求17至32所述的設(shè)備的音頻解碼器。
35.一種包括根據(jù)權(quán)利要求17至32所述的設(shè)備的電子設(shè)備。
36.一種包括根據(jù)權(quán)利要求17至32所述的設(shè)備的芯片組。
37.一種被配置用于執(zhí)行包括以下內(nèi)容的方法的計(jì)算機(jī)程序產(chǎn)品估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值；根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子；以及將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。
38.一種設(shè)備，包括估計(jì)裝置，用于估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值；處理裝置，用于根據(jù)與所述第一音頻信號和所述第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子；以及其他處理裝置，用于將所述縮放因子應(yīng)用于與所述第一音頻信號和所述第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。
全文摘要
一種用于增強(qiáng)包括至少兩個通道的多通道音頻信號的設(shè)備，其被配置用于估計(jì)表示與來自于多通道音頻信號中至少兩個通道的至少第一通道的第一音頻信號和來自于至少第二通道的第二音頻信號相關(guān)聯(lián)的到達(dá)方向的值；根據(jù)與第一音頻信號和第二音頻信號相關(guān)聯(lián)的到達(dá)方向來確定縮放因子；以及將縮放因子應(yīng)用于與第一音頻信號和第二音頻信號之間的音頻信號電平差相關(guān)聯(lián)的參數(shù)。
文檔編號G10L19/00GK102084418SQ200880130197
公開日2011年6月1日申請日期2008年7月1日優(yōu)先權(quán)日2008年7月1日
發(fā)明者P·奧雅拉申請人:諾基亞公司

完整全部詳細(xì)技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：Ｐ.奧雅拉
技術(shù)所有人：諾基亞公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點(diǎn)贊！

精彩留言，會給你點(diǎn)贊！

音頻通道相關(guān)技術(shù)

音頻通道是什么相關(guān)技術(shù)

android音頻輸出通道相關(guān)技術(shù)

音頻回傳通道相關(guān)技術(shù)

單通道音頻文件相關(guān)技術(shù)

音頻通道數(shù)相關(guān)技術(shù)

多通道音頻播放器相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于調(diào)整多通道音頻信號的空間線索信息的設(shè)備和方法