專利名稱:感覺噪聲替換的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種在多通道音頻編碼系統(tǒng)中使用合成噪聲源的方法,用于對其中存在相關(guān)噪聲分量的一組音頻信號(hào)進(jìn)行編碼。
通過僅對感覺上有關(guān)的噪聲源量,例如特定頻率范圍內(nèi)噪聲的總聲能進(jìn)行編碼,可以丟棄感覺上無關(guān)的音頻信息,以便可以獲得相當(dāng)大的信號(hào)壓縮。國際申請WO99/04505描述了這樣的一種方法。在該方法中,基于頻帶檢測輸入信號(hào)的類噪聲分量。對類噪聲分量進(jìn)行參數(shù)化,并且僅發(fā)送替換頻譜系數(shù)的總功率。在解碼器中,通過插入具有期望替換頻譜系數(shù)功率的隨機(jī)噪聲源來重構(gòu)編碼音頻通道。
在多個(gè)音頻通道實(shí)際上顯現(xiàn)一定程度的互相關(guān)的情況下,這種直接替換將導(dǎo)致不自然的聽覺。這種不自然的感覺是由于人耳能夠識(shí)別來自不同方向的音頻信號(hào)之間的相關(guān)這一事實(shí)。信號(hào)之間的相關(guān)確定“立體聲聲象(stero image)”即聲源的空間感覺。如果兩通道揚(yáng)聲器裝備中的左右信號(hào)完全相關(guān),則人類聽覺系統(tǒng)將感覺此為位于揚(yáng)聲器之間的單個(gè)聲源。如果信號(hào)不相關(guān),則將感覺到位于左右揚(yáng)聲器的兩個(gè)單獨(dú)聲源。部分相關(guān)的信號(hào)一般將被感覺為揚(yáng)聲器之間的廣聲源。負(fù)相關(guān)甚至?xí)?dǎo)致所感覺的聲源位于揚(yáng)聲器本部(speakerbase)之外。因此,如果左右揚(yáng)聲器中聲音的相關(guān)丟失,則預(yù)期的立體聲效果將消失,并且聽者將感覺到不自然的聽覺。
換句話說,如果從多個(gè)音頻通道產(chǎn)生的聲音反映通過所述通道記錄的單個(gè)音頻源,則使用不相關(guān)噪聲源重構(gòu)所述音頻源將顯得不自然。
在前述應(yīng)用中,通過對在有效狀態(tài)下觸發(fā)合成器對于左右通道使用相同的噪聲源的一位比特值進(jìn)行編碼來試圖補(bǔ)償上述效應(yīng)。在通常無效的狀態(tài)下,從獨(dú)立噪聲源合成左右通道。
雖然與使用內(nèi)在無關(guān)的噪聲源合成音頻通道相比,該措施提供一定的改進(jìn),但是合成聲音仍然缺乏自然度,這是因?yàn)閷?shí)際上沒有使用描述通道之間的相關(guān)度的編碼音頻通道中的信息。因此,當(dāng)使用該公知方法時(shí),原始聲音的重構(gòu)僅是部分可能的,并且耳朵仍然感覺到較不自然的聽覺。
本發(fā)明旨在消除上述問題,并且提供一種改進(jìn)型音頻編碼,其中,通過所保持的通道之間的相關(guān)度,在感覺上接近原音地重構(gòu)多音頻通道中的噪聲分量是可能的。
因此,本發(fā)明的方法包括以下步驟根據(jù)所述音頻信號(hào)之間的關(guān)系,確定噪聲源的組合(composition),該組合為所述組合中的噪聲源是相互不相關(guān)的,從而噪聲源的所述組合以保持關(guān)系的方式合成所述噪聲分量。
根據(jù)本發(fā)明方法,從合成存在于音頻信號(hào)的至少一個(gè)頻帶中的感覺上有關(guān)、保持相關(guān)的噪聲分量的噪聲源組成存在于音頻信號(hào)中的噪聲分量。這些合成噪聲源是相互不相關(guān)的。因此,這些噪聲源可以通過獨(dú)立噪聲生成器來容易地重構(gòu)。
雖然該方法可以應(yīng)用于發(fā)送不作編碼的噪聲源,但是在一個(gè)優(yōu)選實(shí)施例中,本發(fā)明方法還包括以下步驟通過為每個(gè)噪聲源確定一組用于合成所述源的噪聲參數(shù)和一組用于生成噪聲源的所述組合的變換參數(shù),對噪聲源進(jìn)行編碼。
而且,本發(fā)明的一個(gè)優(yōu)選實(shí)施例包括以下步驟發(fā)送所述多組用于合成每個(gè)噪聲源的噪聲參數(shù),并且發(fā)送所述一組用于形成所述多個(gè)噪聲源的變換參數(shù)。更具體地說,所述噪聲參數(shù)和所述變換參數(shù)通過正交化所述一組音頻通道的相關(guān)矩陣來確定。該正交化可以是逐幀執(zhí)行的音頻通道之間的時(shí)變互相關(guān)。幀的大小可以取決于通過其通道間相關(guān)可以認(rèn)為是不變的時(shí)間幀。
本發(fā)明最好適用于這樣一種情況,其中,該組音頻信號(hào)分成選定一組頻帶,其中至少一個(gè)頻帶包括類噪聲信號(hào)。存在于所述音頻信號(hào)中的非噪聲分量可以通過正弦編碼來編碼。
本發(fā)明還涉及一種用于對一組音頻通道進(jìn)行編碼的多通道音頻編碼系統(tǒng)中使用合成噪聲源的編碼方法,該方法包括以下步驟接收多組用于合成多個(gè)噪聲源的噪聲參數(shù),并且接收根據(jù)本發(fā)明方法確定的一組變換參數(shù);響應(yīng)所述噪聲參數(shù),生成一組合成噪聲源;以及通過根據(jù)所述變換參數(shù)將每個(gè)音頻信號(hào)形成為多個(gè)噪聲源來生成一組音頻信號(hào)。
這樣,可以對編碼和發(fā)送的噪聲音頻信號(hào)進(jìn)行解碼,并且可以合成對應(yīng)的保持多通道相關(guān)的音頻信號(hào)。
而且,本發(fā)明涉及一種音頻編碼器,包括用于在所述音頻信號(hào)的至少一個(gè)頻帶中檢測一組音頻信號(hào)中的每一個(gè)之間的自相關(guān)和交叉相關(guān)的裝置;以及處理裝置,用于根據(jù)所述音頻源之間的關(guān)系確定噪聲源的組合,該組合為噪聲源是相互不相關(guān)的,從而噪聲源的所述組合以保持關(guān)系的方式合成所述噪聲分量。
編碼器還可以包括用于將所述多個(gè)噪聲源編碼為多組用于合成所述噪聲源中的每一個(gè)的噪聲參數(shù)的裝置,發(fā)送裝置,用于發(fā)送所述多組噪聲參數(shù),并且發(fā)送所述一組用于形成所述多個(gè)噪聲源的變換參數(shù)。
同樣,本發(fā)明涉及一種音頻解碼器,包括接收裝置,用于接收多組用于合成多個(gè)噪聲源的噪聲參數(shù),并且用于接收一組用于形成多個(gè)所述噪聲源的變換參數(shù),一組噪聲生成器,用于響應(yīng)噪聲參數(shù),生成噪聲源;以及合成裝置,用于通過響應(yīng)該組變換參數(shù)為每個(gè)音頻信號(hào)形成所述一組噪聲源中的多個(gè),合成具有感覺上有關(guān)、保持相關(guān)的噪聲分量的音頻信號(hào)。
編碼器和解碼器可以是物理上不同的信號(hào)處理設(shè)備,或者可以作為單個(gè)信號(hào)處理設(shè)備中的一個(gè)或若干單元存在。傳輸可以是無線傳輸或者通過因特網(wǎng)的傳輸,實(shí)際上它可以是任何類型的傳輸。傳輸還可以通過物理數(shù)據(jù)載體如磁盤或CD-ROM等來完成。
本發(fā)明還涉及一種數(shù)據(jù)載體,包括一組用于合成噪聲源的噪聲參數(shù),并且包括根據(jù)上述方法的一組用于形成多個(gè)噪聲源的變換參數(shù)。
本發(fā)明的另外目的和特性將從附圖中變得清楚,其中
圖1是實(shí)現(xiàn)本發(fā)明的編碼方法的編碼設(shè)備的示意圖。
圖2是實(shí)現(xiàn)本發(fā)明的編碼方法的解碼設(shè)備的示意圖。
圖1示出用于對四通道音頻信號(hào)進(jìn)行編碼的編碼器1。音頻通道以四個(gè)復(fù)合箭頭代表,每個(gè)箭頭2代表四個(gè)通道的一個(gè)音頻通道。對于本發(fā)明,通道的實(shí)際數(shù)目是無關(guān)的,因?yàn)轱@然本發(fā)明方法可以應(yīng)用于只要存在多于1個(gè)通道的任何音頻系統(tǒng)。音頻通道2由在至少一個(gè)頻帶中包括噪聲分量的音頻信號(hào)組成。在實(shí)際實(shí)施例中,具有可聽頻率分量的音頻信號(hào)通常分成若干(通常是對數(shù)成比例的)頻帶,不過本發(fā)明的方法也可以直接在全帶寬音頻信號(hào)上執(zhí)行。對于這些頻帶中的每一個(gè)或特定個(gè)數(shù)(尤其是人耳對相關(guān)信號(hào)敏感的有關(guān)頻帶中),可以應(yīng)用本發(fā)明方法。
多通道信號(hào)2在濾波級(jí)3中濾波。濾波器3將音頻信號(hào)分成噪聲部分4和非噪聲部分5。信號(hào)2的非噪聲部分5送往正弦編碼電路6。該電路6生成壓縮編碼數(shù)據(jù)7,它代表所述音頻信號(hào)2的非噪聲音頻信息。
噪聲部分4送往根據(jù)本發(fā)明以保持相關(guān)的方式對噪聲進(jìn)行編碼的電路8。在所述電路8中,確定所述音頻信號(hào)之間的關(guān)系,并且識(shí)別噪聲源的組合,該組合為所述組合中的噪聲源是相互不相關(guān)的,以便噪聲源的所述組合以保持關(guān)系的方式合成所述噪聲分量。
所述音頻信號(hào)之間的關(guān)系通過測量音頻通道2的自相關(guān)系數(shù)和交叉相關(guān)系數(shù)來確定。該相關(guān)信息可以在表達(dá)自相關(guān)系數(shù)和互相關(guān)系數(shù)的相關(guān)矩陣中表示。在該矩陣中,系數(shù)<S(i)S(i)>表達(dá)通道S(i)的自相關(guān);系數(shù)<S(i)S(j)>表達(dá)通道S(i)與通道S(j)之間的互相關(guān);i和j是表示所述多通道系統(tǒng)的特定一個(gè)通道的某整數(shù)。
根據(jù)該相關(guān)矩陣計(jì)算一組變換參數(shù)9,變換參數(shù)9提供給發(fā)送器10。變換參數(shù)9涉及用于合成噪聲源的有關(guān)參數(shù)。這些變換參數(shù)可以包括與每個(gè)不相關(guān)噪聲信號(hào)的能量相對應(yīng)的噪聲源的自相關(guān)以及描述所述噪聲源之間的特定關(guān)系的互相關(guān)。這些參數(shù)9要由解碼器接收以對一組所生成的噪聲源執(zhí)行反變換,后面將參照圖2對此作進(jìn)一步說明。
然后,將變換參數(shù)9與經(jīng)過正弦編碼的非噪聲信號(hào)7進(jìn)行組合,并且作為編碼信號(hào)11由發(fā)送器10發(fā)送。傳輸可以是無線傳輸或者通過因特網(wǎng)的傳輸,實(shí)際上它可以是任何類型的傳輸。傳輸還可以通過物理數(shù)據(jù)載體如磁盤或CD-ROM等來完成。
在圖2中,實(shí)質(zhì)上,在用于將信號(hào)11解碼成一組音頻信號(hào)21的解碼器12中示出了圖1的方案的反面。信號(hào)11包括根據(jù)本發(fā)明方法的用于形成多個(gè)噪聲源的一組變換參數(shù)。
在第一分裂級(jí)13,從信號(hào)11中提取變換參數(shù)9和編碼非噪聲信號(hào)7。非噪聲信號(hào)7提供給正弦解碼器14,從而輸出音頻通道21的非噪聲部分51。
變換參數(shù)9提供給包括一組獨(dú)立(隨機(jī))噪聲生成器16的噪聲源生成級(jí)15。變換參數(shù)9表示每個(gè)噪聲生成器16的噪聲電平(包括可能的零電平);另外,可以為噪聲源指定其他參數(shù)例如包絡(luò)形式。噪聲生成器16生成對于每個(gè)音頻信號(hào)21響應(yīng)該組變換參數(shù)9形成為多個(gè)噪聲源的一組相互不相關(guān)的噪聲源,從而為音頻信號(hào)21合成感覺上有關(guān)、保持相關(guān)的噪聲分量41。在組合級(jí)17中,組合保持相關(guān)的噪聲分量41和非噪聲部分51,并且輸出音頻通道21,它們是圖1的音頻通道2的感覺上有關(guān)的重構(gòu)。
本領(lǐng)域的技術(shù)人員應(yīng)該清楚,本發(fā)明不限于參照附圖所述的實(shí)施例,而是可以包括各種類型的變動(dòng)。例如,雖然在所述實(shí)施例中使用正弦編碼來對信號(hào)的非噪聲部分進(jìn)行編碼,但是也可以應(yīng)用其他類型的編碼,如波形編碼或霍夫曼編碼。另外,包括非噪聲部分在內(nèi)的作為一個(gè)整體的音頻通道也可以根據(jù)上述變換參數(shù)來變換。而且,可以使用不同參數(shù)等應(yīng)用其他類型的噪聲編碼。該方法可以應(yīng)用于多通道音頻系統(tǒng)的音頻通道的單個(gè)有關(guān)頻帶。該方法也可以應(yīng)用于多通道音頻系統(tǒng)中選定個(gè)數(shù)的通道。這些和其他變動(dòng)都被認(rèn)為屬于所附權(quán)利要求的保護(hù)范圍內(nèi)。
標(biāo)號(hào)1.編碼器2.復(fù)合箭頭3.濾波級(jí)4.噪聲部分5.非噪聲部分6.正弦編碼電路7.編碼數(shù)據(jù)8.噪聲編碼電路9.變換參數(shù)10.發(fā)送器11.編碼信號(hào)12.解碼器13.分裂級(jí)14.正弦解碼器15.噪聲源生成級(jí)16.噪聲生成器17.組合級(jí)
權(quán)利要求
1.一種在多通道音頻編碼系統(tǒng)中使用合成噪聲源的方法,用于對其中存在相關(guān)噪聲分量的一組音頻信號(hào)進(jìn)行編碼,該方法包括以下步驟根據(jù)所述音頻信號(hào)之間的關(guān)系,確定一種噪聲源的組合,該組合為這樣的,即所述組合中的噪聲源互不相關(guān),從而噪聲源的所述組合以保持其相互關(guān)系的方式合成所述噪聲分量。
2.根據(jù)權(quán)利要求1所述的方法,還包括以下步驟通過為每個(gè)噪聲源確定一組用于合成所述源的噪聲參數(shù)和一組用于生成噪聲源的所述組合的變換參數(shù),對噪聲源進(jìn)行編碼。
3.根據(jù)權(quán)利要求1或2所述的方法,還包括以下步驟發(fā)送所述用于合成每個(gè)噪聲源的噪聲參數(shù)組,并且發(fā)送所述用于形成所述多個(gè)噪聲源的變換參數(shù)組。
4.根據(jù)前面權(quán)利要求中的任一項(xiàng)所述的方法,其中,逐幀地確定互不相關(guān)的噪聲源。
5.根據(jù)前面權(quán)利要求中的任一項(xiàng)所述的方法,其中,存在于所述音頻信號(hào)中的非噪聲分量通過正弦編碼方式來編碼。
6.根據(jù)前面權(quán)利要求中的任一項(xiàng)所述的方法,其中,所述變換參數(shù)通過正交化所述音頻通道組的相關(guān)矩陣來確定。
7.根據(jù)前面權(quán)利要求中的任一項(xiàng)所述的方法,其中,所述音頻信號(hào)組分成選定的一組頻帶,其中至少一個(gè)頻帶包括類噪聲信號(hào)。
8.一種在多通道音頻編碼系統(tǒng)中使用合成噪聲源的方法,用于對一組音頻通道進(jìn)行編碼的,該方法包括以下步驟接收多組用于合成多個(gè)噪聲源的噪聲參數(shù),并且接收根據(jù)權(quán)利要求1所述的方法確定的一組變換參數(shù);響應(yīng)所述噪聲參數(shù),生成一組合成噪聲源;以及通過根據(jù)所述變換參數(shù)將每個(gè)音頻信號(hào)形成為多個(gè)噪聲源來生成一組音頻信號(hào)。
9.一種編碼器,用于對根據(jù)權(quán)利要求1至6中的任一項(xiàng)所述的方法編碼的音頻信道進(jìn)行編碼,該編碼器包括用于在所述音頻信號(hào)的至少一個(gè)頻帶中檢測一組音頻信號(hào)中的每一個(gè)之間的自相關(guān)和交叉相關(guān)的裝置;以及處理裝置,用于根據(jù)所述音頻源之間的關(guān)系確定噪聲源的組合,該組合為這樣的,即所述組合中的噪聲源互不相關(guān),從而噪聲源的所述組合以保持其相互關(guān)系的方式合成所述噪聲分量。
10.如權(quán)利要求8所述的編碼器,還包括用于將所述多個(gè)噪聲源編碼為多組用于合成所述噪聲源中的每一個(gè)的噪聲參數(shù)的裝置,發(fā)送裝置,用于發(fā)送所述多組噪聲參數(shù),并且發(fā)送所述一組用于形成所述多個(gè)噪聲源的變換參數(shù)。
11.一種解碼器,用于接收根據(jù)權(quán)利要求1至6中的任一項(xiàng)編碼和變換的音頻通道,該解碼器包括接收裝置,用于接收多組用于合成多個(gè)噪聲源的噪聲參數(shù),并且用于接收一組用于形成多個(gè)所述噪聲源的變換參數(shù),一組噪聲生成器,用于響應(yīng)噪聲參數(shù),生成噪聲源;以及合成裝置,用于通過響應(yīng)該組變換參數(shù)為每個(gè)音頻信號(hào)形成所述一組噪聲源中的多個(gè),合成具有感覺上有關(guān)、保持相關(guān)的噪聲分量的音頻信號(hào)。
12.一種數(shù)據(jù)載體,包括一組用于合成不相關(guān)噪聲源的噪聲參數(shù),并且包括根據(jù)權(quán)利要求1至7中的任一項(xiàng)所述的方法的一組用于形成多個(gè)噪聲源的變換參數(shù)。
全文摘要
一種用于對其中存在相關(guān)噪聲分量的一組音頻信號(hào)進(jìn)行編碼的多通道音頻編碼系統(tǒng)中使用合成噪聲源的方法,該方法包括以下步驟根據(jù)所述音頻信號(hào)之間的關(guān)系,確定噪聲源的組合,該組合為所述組合中的噪聲源是相互不相關(guān)的,從而噪聲源的所述組合以保持關(guān)系的方式合成所述噪聲分量。該方法還可以包括以下步驟通過為每個(gè)噪聲源確定一組用于合成所述源的噪聲參數(shù)和一組用于生成噪聲源的所述組合的變換參數(shù),對噪聲源進(jìn)行編碼。
文檔編號(hào)G10L19/012GK1589467SQ02823226
公開日2005年3月2日 申請日期2002年11月4日 優(yōu)先權(quán)日2001年11月23日
發(fā)明者L·M·范德克霍夫, A·W·J·奧門 申請人:皇家飛利浦電子股份有限公司