專利名稱:處理音頻信號的裝置和方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種處理音頻信號的裝置。除此以外,本發(fā)明涉及一 種處理音頻信號的方法。此外,本發(fā)明涉及一種程序元件。此外,本 發(fā)明涉及一種計算機可讀介質(zhì)。
背景技術(shù):
音頻回放裝置變得越來越重要。特別地,包括音頻操作特征的音 頻系統(tǒng)變得越來越重要。
US 5,742,687公開了一種信號組合電路,該電路具有第一輸入 端和第二輸入端,用于接收具有音頻頻鐠內(nèi)的頻率的信號,該電路還 具有輸出端。在第一輸入端和所述輸出端之間的第一信號路徑具有第 一傳輸特性。第二輸入端和所述輸出端之間的第二信號路徑具有第二 傳輸特性。這兩個傳輸特性是不同的,這使得通過第一信號路徑的信 號分量和通過第二信號路徑的信號分量之間出現(xiàn)相移。由傳輸特性確 定的振幅傳輸在預定頻率之上降低。在相位傳輸特性之間具有相位 差,其隨著頻率降低。對于低于預定頻率的頻率,由第一傳輸特性確 定的振幅傳輸超過了由第二傳輸特性確定的振幅傳輸。通過互連第一 輸入端和第二輸入端,互相連接的輸入端和輸出端之間的作為頻率函 數(shù)的振幅傳輸基本上是常數(shù)。信號組合電路用于立體聲音頻再現(xiàn)系 統(tǒng),以增強立體聲圖像。立體聲音頻再現(xiàn)系統(tǒng)可以形成音頻可視再現(xiàn) 系統(tǒng)的一部分。
然而,使用常規(guī)音頻回放系統(tǒng)會出現(xiàn)的是音頻回放質(zhì)量不令人滿意。
發(fā)明目的和內(nèi)容
本發(fā)明的目的是提供一種具有合適音頻回放質(zhì)量的音頻系統(tǒng)。 為了獲得以上目的,提供了根據(jù)獨立權(quán)利要求的一種處理音頻信 號的裝置, 一種處理音頻信號的方法, 一種程序元件和一種程序可讀介質(zhì)。根據(jù)本發(fā)明的示例性實施例,提供了 一種處理音頻信號的裝置, 其中該裝置包括檢測單元,適用于檢測音頻信號的加寬狀態(tài),和加寬 修改單元,適用于根據(jù)音頻信號的所檢測的加寬狀態(tài)修改音頻信號的 加寬特性。
根據(jù)本發(fā)明另一個示例性實施例,提供一種處理音頻信號的方 法,其中該方法包括檢測音頻信號的加寬狀態(tài),根據(jù)所檢測的音頻信 號的加寬狀態(tài)修改音頻信號的加寬特性。
根據(jù)本發(fā)明的另 一個示例性實施例,提供一種計算機可讀介質(zhì), 其中存儲了處理音頻數(shù)據(jù)的計算機程序,當處理器運行該計算機程序 時,該計算機程序適用于控制或執(zhí)行具有上述特征的方法。
根據(jù)本發(fā)明的另一個示例性實施例,提供了一種處理音頻數(shù)據(jù)的 程序元件,當處理器運行該程序元件時,該程序元件適用于控制或執(zhí) 行具有上述特征的方法。
根據(jù)本發(fā)明實施例可以執(zhí)行的用于提高音頻回放質(zhì)量的信號處 理和音頻操作可以由計算機程序?qū)崿F(xiàn),即通過軟件實現(xiàn),或通過使用 一個或多個專用的電子優(yōu)化電路,即以硬件實現(xiàn),或以混合的形式, 即通過軟件組件和硬件組件實現(xiàn)。
術(shù)語"加寬"可以特定地表示一種音頻信號處理方案,根據(jù)該方 案操作音頻信號,以便獲得特定的音效,尤其是改變的立體聲效果。 更具體而言,可以提供一種立體聲加寬器(或立體聲增強器),其可 以允許通過提取立體聲和單聲道分量來操作(尤其是加強)由人類收 聽者感受的立體聲特性,并操作例如時間和/或空間中的分量。例如, 左聲道和右聲道之間的差可以由這種操作加重。"加寬"可以表示揚
聲器低音(base)的虛擬加寬以便加重(或削弱)立體聲效果。
術(shù)語"修改加寬特性,,可以特別地表示將操作方案應用到信號中, 其選擇性地加寬或變窄(即撤銷加寬(unwiden))該信號。例如,先 前加寬的信號可以被變窄,和/或先前變窄的信號可以被加寬。通過 采取這個措施,可以恢復原始音頻信號的特性。加寬特性的修改因此 可以包括正加寬或負加寬。
術(shù)語"盲分離算法"或盲信號分離,也被稱為盲信源分離,可以 特別地表示與從一組混合(相關(guān)或不相關(guān))信號中分離一組信號相關(guān) 的任何一種算法,而不需要關(guān)于該信號特性的信息(或具有非常少的信息)的幫助。例如基本分量分析、奇異值分解,獨立分量分析,從
屬分量分析,或非負矩陣因子分解(factorisation)。
根據(jù)示例性實施例,可以提供一種音頻處理方案,其中對于可能 的先前執(zhí)行的立體聲加寬操作來分析輸入音頻信號。如果檢測到位于 信號處理部分(例如,單獨的CD播放器或遠端TV臺)上游的實例或 實體已經(jīng)執(zhí)行了信號加寬,該加寬可以部分地或全部地被補償,從而 使信號適合于另外的選擇性信號操作(例如另一個加寬過程)而不會 損壞音頻質(zhì)量。因此,可以執(zhí)行逆加寬(或逆撤銷加寬)過程,以便 允許將信號整個或部分地帶回到可以執(zhí)行另一個信號操作而不會干 擾信號質(zhì)量的狀態(tài)。
因此,本發(fā)明的示例性實施例可以允許消除立體聲低音 (Stereo-base)的加寬,以便提高音頻信號的精確性和質(zhì)量。
立體聲-低音加寬可以用于許多消費產(chǎn)品,如電視和立體聲裝置。 這樣的立體聲加寬系統(tǒng)可以使得看起來揚聲器比實際上更遠地放置。 這可以為消費者帶來更好的收聽性能。最近,媒體廣播臺已經(jīng)開始廣 播他們的已經(jīng)應用立體聲加寬的節(jié)目。如果消費者具有的TV應用了 立體聲加寬,就會導致立體聲加寬系統(tǒng)的級聯(lián)并損壞收聽性能。
根據(jù)示例性實施例,這樣的問題可以通過提供一種將原始音頻信 號分解的系統(tǒng)來克服,其中該原始音頻信號是未應用立體聲加寬的信 號。這使得可以以消費者希望的方式來應用立體聲加寬。
立體聲加寬系統(tǒng)可以是數(shù)字信號處理系統(tǒng)。其可以包括過濾原始 音頻信號的某些結(jié)構(gòu)。已經(jīng)認識到,當知道該立體聲加寬被應用到所 有更進一步信息時加寬的量,濾波器結(jié)構(gòu)和濾波器是已知,該立體 聲加寬系統(tǒng)可以被倒置。此外,已經(jīng)認識到,當已知有關(guān)加寬系統(tǒng)的 除了加寬量的所有信息時,可以分解該原始信號。但是,在只有已知 濾波器結(jié)構(gòu)的情況下原始信號被分解也是可能的。此外, 一點不了解 系統(tǒng)而分解該系統(tǒng)也是可能的。
加寬器可以一前一后地被使用,也就是說會發(fā)生加寬器構(gòu)建塊的 不希望的級聯(lián),例如如果立體聲信號已經(jīng)在TV工作室、CD上、在任 何其他存儲介質(zhì)中、或傳輸信道中被加寬,而例如在(例如便攜式) 音頻裝置或電視機中再一次使用加寬器。這些加寬器的級聯(lián)可能通常 處于不希望的場合,導致差的音頻質(zhì)量。
6為了克服這些問題,本發(fā)明的示例性實施例涉及 一 種適用于加寬 音頻輸入信號的音頻處理單元。這樣的音頻處理單元可以包括用于接 收音頻輸入信號的輸入端,適用于加寬音頻輸入信號產(chǎn)生輸出信號的 加寬單元,和適用于提供表示音頻輸入信號的加寬狀態(tài)的加寬控制信 號的控制單元。加寬單元可以適用于基于加寬控制信號而加寬音頻輸 入信號。
本發(fā)明的示例性實施例可以具有這樣的優(yōu)點,即可以檢測加寬和 (部分地或整個地)撤銷加寬,以便禁止下一個加寬器,產(chǎn)生更好的 聲音質(zhì)量。
因此,根據(jù)本發(fā)明的示例性實施例,可以進行立體聲低音寬度的 自動控制。可以允許立體聲低音加寬器的級聯(lián),而沒有信號的損壞。 使用立體聲低音加寬器。其中一個特別的形式就是已知的
Philips 司的難以置信的環(huán)繞系統(tǒng)(Incredible Surround system)。加寬器可以用于在揚聲器之間給出虛擬的加寬,如果(例 如,電視機和便攜式音頻裝置的)揚聲器靠近,這就非常重要。通常, 如果立體聲信號已經(jīng)被加寬,例如在TV工作室中或CD上,并且再次 使用加寬器,例如在音頻裝置或電視機(或者在任何其他特定便攜式 裝置中),那么就會出現(xiàn)問題。例如,TV廣播臺比他者更多地加寬 信號,這樣即使沒有級聯(lián)的第二加寬器也是令人討厭的,因為在頻道 切換(換頻道以跳過廣告節(jié)目(zapping))期間聲音圖像是以令人討 厭的方式變化的。
根據(jù)本發(fā)明的一個示例性實施例,加寬可以被改變,例如通過完 全撤銷加寬。另一個應用是改變加寬成另一種加寬效果??梢允紫瘸?銷加寬,然后通過應用新的加寬來改變它。
根據(jù)本發(fā)明的另 一 個示例性實施例,最后兩個過程可以合并為一 個??梢杂嬎闼璧臑V波器,該濾波器看起來是可靠和穩(wěn)定的。此外, 加寬和撤銷的順序可以互相交換。
接下來,將描述用于處理音頻數(shù)據(jù)的裝置的其他示例性實施例。 但是,這些實施例還適用于所述方法、所述程序元件和計算機可讀介 質(zhì)。
檢測單元可以適用于檢測音頻信號先前是否已經(jīng)被加寬(或變 窄)。換句話說,例如在音頻信號已經(jīng)被提供到設(shè)備之前,可以通過分析音頻信號來檢測加寬(或變窄)過程或算法是否預先被應用于所 述音頻信號。這可以使用簡單的"是/否"估計或者也可以用漸進的 方式來執(zhí)行。
對于后一種情況,檢測單元可以檢測加寬參數(shù),該加寬參數(shù)指示 音頻信號先前已經(jīng)被加寬的程度,例如指示位于所述裝置的上游(相 對于信號處理路徑來說)的實例。這樣的加寬參數(shù)(根據(jù)示例性實施
例其也可以被顯示為a)可以具有一個范圍的值,例如可以從0到1 的范圍,其中該參數(shù)值可以指示加寬的程度。這也可以允許使用提高 的精度來表征先前應用的加寬。
檢測單元可以適用于基于盲分離算法來檢測音頻信號的加寬狀 態(tài)。通過應用這樣的算法,利用已經(jīng)開發(fā)的、之前用于其他目的的算 法,可以以高精度和低工作量來檢測加寬狀態(tài)。
檢測單元可以適用于基于音頻信號自身的信息和/或外部信息來 檢測音頻信號的加寬狀態(tài)。換句話說,檢測單元可以(排它地)使用 音頻信號本身來獲得關(guān)于其加寬屬性的信息(例如,執(zhí)行盲信號分 離)??商鎿Q地,檢測單元可以(排它地)使用外部信息來獲得有關(guān) 音頻信號加寬屬性的信息。這樣的外部信息可以使用專業(yè)知識或?qū)嶒?知識等等從因特網(wǎng)、從音頻內(nèi)容源(例如CD)、從數(shù)據(jù)庫獲得。分 析這樣的外部信息(其中,術(shù)語"外部"可以表示不屬于音頻信號本 身的信息)可以允許提高關(guān)于幀條件的知識(例如,已經(jīng)記錄存儲在 CD上的音頻內(nèi)容的方式),這可以允許獲得音頻數(shù)據(jù)的在前加寬是 否可能的信息。此外可替換地,檢測單元可以使用音頻數(shù)據(jù)和外部信 息兩者來獲得有關(guān)音頻信號加寬屬性的信息。
當檢測的加寬狀態(tài)顯示該音頻信號先前已經(jīng)被加寬或變窄時,加 寬修改單元可以適用于以一種方式來加寬(或變窄)音頻信號,以便 至少部分地、特別是完全地,撤銷先前執(zhí)行的加寬(或變窄)。換句 話說,加寬修改單元可以將音頻信號變回其初始或原始形狀,即例如 通過該設(shè)備連接的遠端音頻組件(例如,CD播放器或連接的TV臺) 對該音頻信號應用第一加寬算法之前的形狀。在信號已經(jīng)被變回其原 始狀態(tài)之后,特殊期望的(例如用戶控制的)加寬算法可以被該裝置 應用,而不會由于兩個加寬過程非期望的級聯(lián)而損壞音頻信號。但是, 兩個獨立的單元或裝置可以執(zhí)行撤銷先前的外部加寬和執(zhí)行期望的內(nèi)部加寬的過程。替換地,兩個單獨的單元可以被適配為具有2種能 力的1個單獨的單元或裝置。
當檢測的加寬狀態(tài)指示該音頻信號先前已經(jīng)被加寬或變窄時,加 寬修改單元就可以適用于改變音頻信號的加寬或變窄屬性。因此,這 樣的實施例可以簡單地修改加寬特性,而不需要完全撤銷先前的加寬 和執(zhí)行隨后的改變的加寬。
當檢測的加寬狀態(tài)指示該音頻信號先前沒有被加寬或變窄,那么 加寬修改單元就可以適用于禁止音頻信號加寬或變窄。因此,當確定 在輸入音頻信號到裝置之前沒有執(zhí)行加寬,那么加寬修改單元僅僅不 做任何事或省略操作,也就是說允許音頻信號不做任何修改地通過。 通過采取這個措施,可以確保防止不期望的撤銷加寬過程被執(zhí)行,即 使在沒有發(fā)生前一次加寬的情況下。
該裝置可以包括另一個或附加的(單獨)加寬修改單元,其與從 上述加寬修改單元分離地提供,并且其可適用于加寬由加寬修改單元 處理的音頻信號。因此,加寬修改單元的級聯(lián)可以被實現(xiàn),但是沒有 上述問題。即,由第一加寬修改單元撤銷之前執(zhí)行的加寬(或變窄) 可以將信號變回其初始的狀態(tài),其中另一個加寬修改單元就可以執(zhí)行 任意期望的加寬過程。
加寬修改單元可以使用至少一個濾波器來實現(xiàn),即允許特定頻率 和/或振幅范圍的音頻通過的音頻組件,而其他音頻成分會被濾波抑 制或消除。
加寬修改單元可適用于選擇性地執(zhí)行包括立體聲加寬和立體聲 變窄的組中的一個。換句話說,加寬并不一定意味著音頻信號的立體 聲特征被提高,而是該特征的降低也是可能的,因此其可以表示為立 體聲變窄。
所述裝置可以包括多個(兩個或不止兩個)音頻回放裝置,適用 于回放被處理的音頻信號。這樣的音頻回放裝置可以包括揚聲器、耳 機等等,并且可以允許將所處理的音頻信號回放成人類聽眾聽得見 的。特別地,當音頻回放裝置之間的距離小時,可能會期望加寬以提 高所感受到的音頻的質(zhì)量。
音頻信號可以是多個音頻聲道信號,尤其是立體聲信號。術(shù)語"立 體聲信號"可以特別地表示音頻信號具有2個分量的事實;每個分量預定將由不同揚聲器再現(xiàn),從而產(chǎn)生立體聲效果或任何其他空間聲音 感受。當音頻信號是立體聲信號時,加寬會特別適合于改善所感受音 頻的主觀質(zhì)量。但是,多個音頻聲道信號也可以包括不止兩個音頻信
號,例如5. 1系統(tǒng),該5. 1系統(tǒng)表示一種音頻格式,該音頻格式利用 3個主聲道(左,中間,右),兩個環(huán)繞聲道(左環(huán)繞,右環(huán)繞)和 LFE聲道,即".l,,聲道,因為其可以使用大約全部頻道帶寬的十分 之一。音頻環(huán)繞系統(tǒng)可以在其中實現(xiàn)本發(fā)明的實施例。
處理音頻數(shù)據(jù)的裝置可以被實現(xiàn)為包括如下各項的組中的至少 一個便攜式音頻播放器、揚聲器、音頻環(huán)繞系統(tǒng)、移動電話、耳機、 揚聲器、助聽器、免提系統(tǒng)、電視裝置、電視機音頻播放器、視頻記 錄器、監(jiān)視器、游戲機、膝上型筆記本、音頻播放器、DVD播放器、 CD播放器、基于硬盤的媒體播放器、因特網(wǎng)無線電裝置、公共娛樂 裝置、MP3播放器、hi-fi系統(tǒng)、車載娛樂裝置、汽車娛樂裝置、醫(yī) 學通信系統(tǒng)、佩戴裝置、語音通信裝置、家庭影院系統(tǒng)、家庭劇院系 統(tǒng)、音頻服務(wù)器、音頻客戶端、平板電視設(shè)備、氛圍創(chuàng)造裝置和音樂 廳系統(tǒng)。
然而,雖然根據(jù)本發(fā)明的一個實施例的系統(tǒng)主要是想提高聲音或 音頻數(shù)據(jù)的質(zhì)量,但是也可以應用該系統(tǒng)來組合音頻數(shù)據(jù)和可視數(shù) 據(jù)。例如,本發(fā)明的實施例可以在音頻可視應用中實現(xiàn),如其中使用 了一個或多個揚聲器的視頻播放器或家庭影院系統(tǒng)。
實例中顯而易見,并通過參考這些實施例的實例得到解釋。',
以下,將參考實施例的實例來更詳細地描述本發(fā)明,但是本發(fā)明 并不限于所述實施例的實例。
圖1,圖5到圖9示出了根據(jù)本發(fā)明示例性實施例處理音頻信號 的裝置。
圖2到圖4示出了用于處理音頻信號的裝置。
圖10示出了根據(jù)本發(fā)明一個示例性實施例的相位差計算方案。
具體實施方式
附圖中的圖示是示意性的。在不同的附圖中,相似或相同的元件 被提供相同的附圖標記。
以下,參考圖1,將解釋根據(jù)本發(fā)明示例性實施例的處理音頻信
號120的裝置100。
裝置100包括音頻內(nèi)容源101,例如CD播放器、硬盤,或到提 供音頻信號120的遠端電視臺的連接。在音頻內(nèi)容源101中,可以發(fā) 生音頻數(shù)據(jù)的任何預處理,尤其是任何加寬算法可以被應用,以便例 如增強音頻信號120的立體聲效果。
正如可以從圖1中看到的,提供用戶接口 102,其使得能夠進行 與音頻數(shù)據(jù)源101的雙向通信。用戶輸入/輸出裝置102允許人類用 戶提供有關(guān)裝置100操作的指令。用戶輸入/輸出裝置102可以包括 顯示單元,如LCD, TFT或陰極射線管監(jiān)視器。此外,在用戶輸入/ 輸出裝置102中可以預見輸入元件,例如包括鍵盤、操縱桿、按鈕、 跟蹤球和/或語音識別系統(tǒng)的麥克風。
圖l還顯示了音頻處理器103(例如中央處理單元或微處理器)。 處理器103可以為裝置100的操作而執(zhí)行必要的計算程序。
裝置100包括檢測單元108,適用于檢測(例如通過盲信號分離) 音頻信號120的加寬狀態(tài)。在關(guān)于可能之前在音頻數(shù)據(jù)源101中執(zhí)行 的加寬而分析音頻信號120之后,檢測單元108產(chǎn)生控制信號121, 其控制加寬修改單元107,該加寬修改單元107適用于根據(jù)音頻信號 120的檢測的加寬狀態(tài)來加寬(或變窄)音頻信號120。
特別地,檢測單元108檢測音頻信號120是否之前在單元101中 已經(jīng)被加寬。作為對這樣的"數(shù)字"判定(換句話說,是/否)的替 換,檢測單元108也可適用于檢測加寬參數(shù)a,其指示音頻信號120 先前已經(jīng)被加寬的程度。檢測單元108也可以表示為盲分離塊108, 其執(zhí)行盲分離算法,以便確定加寬狀態(tài)。
基于控制信號121,當所檢測的加寬狀態(tài)指示該音頻信號120先 前已經(jīng)被加寬時,加寬修改單元107可以至少部分地撤銷先前執(zhí)行的 加寬(由音頻數(shù)據(jù)源IOI執(zhí)行的)??商鎿Q地,當所檢測的加寬狀態(tài) 指示該音頻信號120先前在單元101中沒有被加寬時,加寬修改單元 107可以禁止音頻信號120被單元107加寬。換句話說,單元107消 除或減小可能執(zhí)行的先前的加寬。
ii示出了另一個加寬修改單元109,向該加寬修改單元109提供中 間信號122。該中間信號122在加寬修改單元107的輸出端被提供。 另一個加寬修改單元109將由加寬修改單元處理的音頻信號122以任 何期望的方式加寬,例如根據(jù)經(jīng)由輸入/輸出裝置102的用戶定義的 調(diào)整輸入。
在另一個加寬修改單元109的輸出端,提供了輸出音頻信號123, 該輸出音頻信號123被提供到第一揚聲器104和第二揚聲器105的輸 入端,這些揚聲器將音頻波106作為立體聲信號發(fā)射。
總之,因為加寬修改單元107撤銷了先前對音頻信號120執(zhí)行的 加寬,因此產(chǎn)生了撤銷加寬的音頻信號122,做出規(guī)定,即隨后連接 的附加的加寬修改單元109可以采用任何期望的加寬算法,而不會損 壞信號122, 123的質(zhì)量。
以下,將解釋常規(guī)的系統(tǒng),以便提供對本發(fā)明示例性實施例更詳 細的理解。
使用了立體聲低音力口寬器(參見R. M. Aarts, "Phantom Sources Appl ied to Stereo-Base Widening", J. Audio Eng. Soc. , 48, 3, pages 181-189,或者參見US 5,742,687)。 一個特別的形式就是已知的 Philips公司的難以置信環(huán)繞系統(tǒng)。加寬器被用來給出揚聲器之間的 虛擬加寬,如果揚聲器靠近在一起,例如電視機和便攜式音頻裝置中, 那么這就非常有用。
圖2顯示了立體聲音樂加寬器的結(jié)構(gòu)200,其中塊201和202是 電子濾波器(模擬或數(shù)字的)。信號Li和Ri分別是是左和右輸入信 號,它們相對應的輸出信號L。和R。被發(fā)送給揚聲器(圖2中未示出)。
圖3顯示了方案200的更抽象的方案300,其中A由下面等式給
出
<formula>formula see original document page 12</formula>
換句話說,圖3的方案300顯示了圖2的(即立體聲音樂加寬器 的)結(jié)構(gòu)的抽象版本。
塊301可以表示操作單元,適用于選擇性地操作輸入信號Li和 Ri以便產(chǎn)生輸出信號L。和R。。
在該常規(guī)系統(tǒng)中,如果立體聲信號已經(jīng)被加寬就會出現(xiàn)問題,參 見圖4所示的方案400。
't 乂這樣的先前加寬可以在TV工作室、CD上、任何其他存儲介質(zhì)或 傳輸信道中執(zhí)行,并且可以使用圖4的加寬器單元401 (表示為Al ) 示意性地示出。例如在圖4的(例如便攜式)音頻裝置或電視機(表 示為A2)中可以再次使用另一個加寬器單元402。
圖5顯示了方案500,其中由加寬修改單元501執(zhí)行加寬,逆加 寬修改單元502執(zhí)行撤銷。因此,在圖5中輸出信號L。和R。等于輸 入信號Li和Ri。
可以改變圖5中塊501和502的順序。也就是說,在將已被操作 的音頻信號提供到加寬修改單元501之前,首先通過逆加寬修改單元 502來操作音頻信號。塊501和502可以具有不管它們在信號處理路 徑中的順序而提供相同輸出信號的屬性。
圖6顯示了方案600,其中除了加寬修改單元501和逆加寬修改 單元502之外,還提供了附加的加寬修改單元601。
因此,單元501和502的功能互補,因此,有效地,只發(fā)生附加 加寬修改單元601的操作。
換句話說,圖4顯示了級聯(lián),圖5顯示了撤銷,圖6顯示了立體 聲音樂加寬器的改變。
當加寬器一前一后使用時,會發(fā)生這些構(gòu)建塊的不期望的級聯(lián)。 這些加寬器的級聯(lián)通常是不希望的狀態(tài),會導致非常差的音頻質(zhì)量。 因此,本發(fā)明的示例性實施例檢測加寬并對此進行補償,或者禁止下 一個加寬器,從而產(chǎn)生好得多的聲音質(zhì)量。當一些TV廣播臺比他者 多得多地加寬它們的信號時,即使沒有級聯(lián)的第二加寬器這也可能會 令人討厭,因為在頻道切換(換頻道以跳過廣告節(jié)目)時聲音圖像以 令人討厭的方式改變。
根據(jù)本發(fā)明的示例性實施例,加寬被改變,例如通過完全撤銷加 寬,參見圖5。矩陣A〃表示Ai的逆,導致輸出等于相應的輸入(L。-Li 和R。-Ri)。在這種情況下,可以說撤銷了加寬。應該記住,在CD中 的音樂在CD錄制工作室中可以被Ai加寬,而在CD播放器或任何再 現(xiàn)裝置中的音樂可以被A「1撤銷。
根據(jù)示例性實施例的另 一 個應用是將加寬改變?yōu)榱?一 種加寬效 果??梢允褂脠D6的結(jié)構(gòu),以便執(zhí)行通過應用新的加寬A2撤銷并且然 后改變它。如果期望,最后兩個過程可以合并。圖5顯示了一個實施例,其中先前執(zhí)行的加寬被撤銷。在這種情 況下,加寬被完全撤銷,這樣用戶自己能夠決定應用加寬A2,如圖6 所示。
"難以置信聲音"情況下的矩陣A^可以容易地計算。A「'的相應 濾波器的系數(shù)然后是已知的,并且看起來是穩(wěn)定且可靠的。
圖7顯示了根據(jù)本發(fā)明一個實施例的音頻數(shù)據(jù)處理方案。
根據(jù)示例性實施例的圖7的處理音頻數(shù)據(jù)700的裝置的塊108能 夠執(zhí)行盲分離算法,并且在本領(lǐng)域中是已知的。在一個簡單的實施例 中,僅需要檢測是否存在(由A,完成的)加寬。在前一種情況中,加 寬可以被A「1撤銷,在后一種情況中不用做任何事情。
在進一步改進的實施例中,如下所述,加寬可以用參數(shù)a以參數(shù) 化的版本執(zhí)行。然后,塊108可以確定a,并計算A「S該解決方案 由參數(shù)a參數(shù)化。在本上下文中,對本說明書倒數(shù)第二個等式進行了 參考(參見下面),并且通過在該倒數(shù)第二個等式之前的兩個等式和 使用以下圖9所提到的右面板以更有效的方式來進行。
圖7顯示了 Ai的加寬由其逆A〃執(zhí)行撤銷,這可以通過盲分離塊 108來控制。輸出信號Li和Ri盡可能地類似于輸入信號Li和R"在 "難以置信的聲音"實現(xiàn)中,這似乎是完全可能的。
以下,將詳細解釋盲分離塊108如何工作的。有不同實施例是可 能的
(i)可以假設(shè)左和右信號是互相獨立的,也就是經(jīng)典的盲信源 分離問題(例如參見Hiroshi Sawada, Ryo Mukai, Shoko Araki,Shoji Makino "A Robust and Precise Method for Solving the Permutation Problem of Frequency-Domanin Blind Source Separation", IEEE TRANSACTIONS ON SPEECH AND AUDIO PROCESSING, VOL. 12, NO. 5, SEMPTEMBER 2004,第530到538頁)。作出該假設(shè)看 起來比較奇怪,但是在進一步改進的實施例中,可以僅僅取假設(shè)為真 的部分信號。此外,使用盲信源分離,可以期望分離該信號,但是本 發(fā)明的實施例可以期望分離、(撤銷)加寬和再次混合,這就可以大 大緩和該問題。在簡單的實施例中,(撤銷)加寬濾波器是已知的, 因此僅僅估計加寬因子oc、(撤銷)加寬的量可能是足夠的,也大大 緩和了該問題。(ii )可以假設(shè)信號是相關(guān)的,這與實際的情況非常接近。此夕卜, 可以考慮是這種情況的時間上僅僅部分的信號。因此,通過測量輸出 信號的相位差(該相位差會由于加寬而增大),可以估計加寬的量, 從而撤銷該加寬。
(iii)可以合并(i)和(ii)。 實際的方法是測量輸出信號之間的相關(guān)性,并且假設(shè)如果相關(guān)大
約是-1,那么a等于或接近于1。并且如果相關(guān)是適度的(就普通音 頻來說),那么a可以接近或等于0。通過讓操作加寬和撤銷加寬在 和以及差信號上操作,而不是在信號本身上操作,那么混合系統(tǒng)變得 非常簡單。這樣,可以僅僅通過在對角線而不是上述Sawada等人的 文章的圖1所示的全矩陣上進行濾波就能獲得矩陣,這樣整個分離問 題就變得比在所述文章中考慮的完整問題更簡單。
總之,同樣如Sawada等人的文章所示,所討論的部分問題在現(xiàn) 有技術(shù)中被解決,而本發(fā)明的實施例可以處理更加簡單的情況濾波 器是已知的(混合系統(tǒng)是已知的),而僅僅是混合量(a)是未知的。 "撤銷加寬器"可以放置在第二裝置中,該第二裝置接收第一裝 置的輸出信號(L。, R。)作為輸入信號。因此,第一裝置可以實際上 遠離第二裝置。當沒有第一裝置的A,的信息可用時,可以稱作盲分離。
借助于參數(shù)a,通過將圖3修改為圖8,可以使得加寬器可變或 參數(shù)化。如果a-l,那么圖8等于圖3,輸出等于輸入。
根據(jù)圖8的裝置800還具有第一加法器單元801和第二加法器單 元802。
換句話說,圖8顯示了圖3的加寬器的更一般化概念,其具有參 數(shù)a。如果a-l,那么圖8等于圖3,如果a-O,那么輸出等于輸入。 這可以寫作以下等式,其中,為了簡潔起見,使用了相同的A,
而這是上述第一等式的其中一個的參數(shù)化版本
「 crf/, + (1 — a) a//2 ) 、 《//2a仏+ (1 -
替代與濾波器H,和&一起工作(參見圖2 ),可以實現(xiàn)更有效的 可能的加寬和撤銷。前一種如圖9所示,顯示了根據(jù)本發(fā)明示例性實 施例的裝置900。
圖9顯示了右面板(為了清楚起見,路徑被顯示為"l-a",就
15好像左面板被省去了)。
在左結(jié)構(gòu)中,首先和以及差信號被確定。有兩個濾波器Ha和Hb 在該和以及差信號上操作。然后這些信號再一次被相加和相減,以便
最終獲得參數(shù)化的輸出信號L。和R。。圖9的左方案完全等于右方案。 加法單元由參考符號901到904來表示。塊Ha和Hb使用參考符
號910和911來表示。此外,和/差塊912和913被提供。
本發(fā)明的有利實施例是使用圖9的右面板。為了撤銷加寬,可以
具有Ha和Hb的逆濾波器,其可以分別顯示為Hx和Hy。
這在以下等式中顯示。在這些情況中,由于矩陣A的對稱,因此
僅僅2個濾波器Ha和Hb和兩個他們的逆濾波器Hx和Hy就是足夠的。
2
a//。+(l —a) 1
a//fc + (1 _ a)
△—, (1-a) -a//2 、
L- a//2 a//, + (1 - a)乂
w/ze/r △ = (a//! + (1 - a))2 + (a//2 )2.
總之,塊108可以估計a,因為H和Hb是已知的(系數(shù)是已知的), 上述等式給出的濾波器氐和Hy也是已知的。為了避免用于計算Hx和 Hy的兩個等式中的除法,可以用遞歸的方法來計算濾波器Hx和Hy。
在H!和&或Ha和Hb不是已知的情況下,甚至可以計算A的逆矩陣。
在信號沒有被加寬并且仍然有可能使用A的逆矩陣的情況下,這 樣做可以獲得立體聲變窄器。
顯然,2x2矩陣的實例易于推廣到nxm矩陣,例如對于5-聲道系 統(tǒng),呈現(xiàn)的是5x5矩陣。在該情況下,可以在前聲道和后聲道以獨立
仏= 付,
=
、=的方式加寬或者撤銷加寬。
以下,參考圖10,將解釋根據(jù)本發(fā)明示例性實施例的參數(shù)a的盲 估計的上下文中的相位差計算方案。a值可以在0到1之間修改。值 O表示沒有立體聲加寬,值1意味著輸出信號僅包括加寬信號。0到 1之間的任何值意味著輸出信號是原始立體聲信號和濾波信號的混 合。實際上,a的值將在O到l之間。如果所有的系統(tǒng)特性都是已知 的,除了加寬的量a,那么a需要被檢測以便使這個系統(tǒng)倒置。a的確 定是盲識別問題。原始音頻信號對于系統(tǒng)可以是未知的。此外,根據(jù) 示例性實施例,輸入信號不應當被認為是獨立的。為了估計a,要進 行以下考慮。
音頻信號的相位差可以類似于聯(lián)合分布噪聲信號的相位差。為了 將音頻信號與噪聲信號相比較,針對分布函數(shù)的數(shù)量測量可能是有利 的。音頻和噪聲信號的分布可以或多或少對稱,因此差值的平均大約 為0。這意味著方差或標準偏差,方差的平方根,可以容易地被當作 密度函數(shù)的測量。不管聯(lián)合分布噪聲源和音頻信號之間的相似性,還 有一個問題即量化a。該問題就是,每個音頻片段的相關(guān)性程度不同 的,可以對于傾角有影響。這意味著a與斜坡的陡度不直接相關(guān)。
一個表格可以用來確定加寬因子a。作為表格的替代,可以實現(xiàn) 圖10的方案。該系統(tǒng)基于這樣的假設(shè),即在未濾波的情況下,方差 的第一階近似的傾斜角可以等于0。系統(tǒng)的目的是控制傾斜角趨向于 0。發(fā)現(xiàn)第一階近似的傾斜角p的方法可以基于一階多項式擬合來執(zhí) 行。
圖10的系統(tǒng)首先使用逆加寬系統(tǒng),使用由更新塊1011提供的最 新加寬因子a對(提供到濾波器單元1000, 1001輸入端的)輸入信號 的塊進行濾波。然后基于單元1002到1008為該塊計算相位差。其結(jié) 果在單元1008的輸出端提供,該結(jié)果被輸入到任意長度的緩沖器 1009。如果該緩沖器1009滿,那么傾斜角被計算。然后,使用角度
檢測單元1010和更新塊1011,加寬因子a的值被更新
a := a _ ja
在圖10中,示出了濾波器塊1000,濾波器塊1001,加窗塊1002, 加窗塊1003,快速傅里葉變換塊1004、快速傅里葉變換塊1005,處 理塊1006,處理塊1007,合并塊1008,緩沖器1009,角度檢測塊1010,和加寬因子更新塊1011。
應當注意,術(shù)語"包括"并不排除其他元件或特征,"一"或"一 個"并不排除多個。此外,與不同實施例結(jié)合描述的元件可以被合并。
應當注意到,權(quán)利要求中的參考符號不應但解釋為限制權(quán)利要求 的范圍。
權(quán)利要求
1. 一種用于處理音頻信號的裝置(100),其中該裝置(100)包括檢測單元(108),適用于檢測音頻信號的加寬狀態(tài);加寬修改單元(107),適用于根據(jù)音頻信號的所檢測的加寬狀態(tài)來修改音頻信號的加寬特性。
2. 根據(jù)權(quán)利要求l的裝置(100),其中,檢測單元(108)適用于檢測音頻信號先前是否已經(jīng)被加 寬或變窄。
3. 根據(jù)權(quán)利要求1的裝置(100),其中,檢測單元(108)適用于檢測指示音頻信號先前已經(jīng)被加 寬或變窄的程度的加寬參數(shù)
4. 根據(jù)權(quán)利要求l的裝置(100),其中,檢測單元(108)適用于基于盲分離算法來檢測音頻信號 的加寬狀態(tài)。
5. 根據(jù)權(quán)利要求l的裝置(100),其中,檢測單元(108)適用于基于音頻信號的分量之間的相位 差的計算來檢測音頻信號的加寬狀態(tài)。
6. 根據(jù)權(quán)利要求l的裝置(100),其中,檢測單元(108)適用于基于迭代過程來檢測音頻信號的 加寬狀態(tài)。
7. 根據(jù)權(quán)利要求l的裝置(100),其中,檢測單元(108)適用于基于包括音頻信號自身和外部信 息的組中的至少一個的信息來檢測音頻信號的加寬狀態(tài)。
8. 根據(jù)權(quán)利要求l的裝置(100),其中,當檢測的加寬狀態(tài)指示該音頻信號先前已經(jīng)被加寬或變窄 時,加寬修改單元(107)適用于以一種方式來加寬或變窄音頻信號, 以便至少部分地、特別是完全地撤銷先前執(zhí)行的加寬或變窄。
9. 根據(jù)權(quán)利要求l的裝置(100),其中,當檢測的加寬狀態(tài)指示該音頻信號先前已經(jīng)被加寬或變窄 時,加寬修改單元(107)適用于改變音頻信號的加寬或變窄。
10. 根據(jù)權(quán)利要求1的裝置(100 ),其中,當檢測的加寬狀態(tài)指示該音頻信號先前沒有被加寬或變窄時,加寬修改單元(107)適用于禁止音頻信號加寬或變窄。
11. 根據(jù)權(quán)利要求1的裝置(100 ),包括另一個加寬修改單元(109),適用于加寬或變窄由加寬修改單元(107)處理的音頻信號。
12. 根據(jù)權(quán)利要求l的裝置(100),其中,加寬修改單元(107)包括濾波器。
13. 根據(jù)權(quán)利要求1的裝置(100),其中,加寬修改單元(107)適用于選擇性地執(zhí)行包括立體聲加寬和立體聲變窄的組中的一個。
14. 根據(jù)權(quán)利要求l的裝置(100),包括多個音頻回放裝置(104, 105),適用于回放處理過的音頻信號。
15. 根據(jù)權(quán)利要求l的裝置(100),其中,該音頻信號是多音頻聲道信號,尤其是立體聲信號。
16. 根據(jù)權(quán)利要求l的裝置(100),實現(xiàn)為包括如下各項的組中的至少一個便攜式音頻播放器、揚聲器、音頻環(huán)繞系統(tǒng)、移動電話、耳機、揚聲器、助聽器、免提系統(tǒng)、電視裝置、電視機音頻播放器、視頻記錄器、監(jiān)視器、游戲機、膝上型筆記本、音頻播放器、DVD播放器、CD播放器、基于硬盤的媒體播放器、因特網(wǎng)無線電裝置、公共娛樂裝置、MP3播放器、hi-fi系統(tǒng)、車載娛樂裝置、汽車娛樂裝置、醫(yī)學通信系統(tǒng)、佩戴裝置、語音通信裝置、家庭影院系統(tǒng)、家庭劇院系統(tǒng)、音頻服務(wù)器、音頻客戶端、平板電視設(shè)備、氛圍創(chuàng)造裝置和音樂廳系統(tǒng)。
17. —種處理音頻信號的方法,其中該方法包括檢測音頻信號的加寬狀態(tài);根據(jù)所檢測的音頻信號的加寬狀態(tài)修改音頻信號的加寬特性。
18. —種計算機可讀介質(zhì),其中存儲了處理音頻信號的計算機程序,當處理器(103)運行該計算機程序時,該計算機程序適用于控制或執(zhí)行根據(jù)權(quán)利要求17的方法。
19. 一種處理音頻信號的程序元件,當處理器(103)運行該程序元件時,該程序元件適用于控制或執(zhí)行根據(jù)權(quán)利要求17的方法。
全文摘要
一種處理音頻信號的裝置,其中該裝置包括檢測單元,適用于檢測音頻信號的加寬狀態(tài);和加寬修改單元,適用于根據(jù)音頻信號的所檢測的加寬狀態(tài)修改音頻信號的加寬特性。
文檔編號H04S7/00GK101502131SQ200780029773
公開日2009年8月5日 申請日期2007年8月7日 優(yōu)先權(quán)日2006年8月10日
發(fā)明者R·M·阿茨 申請人:皇家飛利浦電子股份有限公司