專利名稱:使用預(yù)先存在的音頻增益元數(shù)據(jù)的信號削波保護的制作方法
技術(shù)領(lǐng)域:
本申請涉及使用嵌入數(shù)字音頻流的預(yù)先存在的音頻元數(shù)據(jù)的音頻信號的削波保護。特別地,本申請涉及將多通道音頻信號下混合為較少通道時的削波保護。
背景技術(shù):
在例如數(shù)字廣播環(huán)境中,在數(shù)字音頻流中嵌入音頻元數(shù)據(jù)是公知的概念。這種元數(shù)據(jù)是“關(guān)于數(shù)據(jù)的數(shù)據(jù)”,即,關(guān)于流中的數(shù)字音頻的數(shù)據(jù)。元數(shù)據(jù)可以給音頻解碼器提供關(guān)于如何再現(xiàn)音頻的信息。一種類型的元數(shù)據(jù)是動態(tài)范圍控制信息,其表示時變的增益包絡(luò)。這種動態(tài)范圍控制元數(shù)據(jù)可用于多個目的(1)控制被再現(xiàn)的音頻的動態(tài)范圍數(shù)字傳輸允許高動態(tài)范圍,但是收聽條件不總是允許利用高動態(tài)范圍。雖然高動態(tài)范圍是安靜的起居室條件中所希望的,它可能不適合其它條件,例如,由于高的背景噪聲電平而不適合汽車音響。為了適應(yīng)各種收聽條件,可以在數(shù)字音頻流中插入指示接收器如何減小被再現(xiàn)的音頻的動態(tài)范圍的元數(shù)據(jù),而不是在傳輸之前減小音頻的動態(tài)范圍。后一種方法不是優(yōu)選的,這是由于這可能使得接收器不能以完整動態(tài)范圍來再現(xiàn)音頻。相反,前一種方法是優(yōu)選的,這是由于它允許收聽者根據(jù)收聽環(huán)境決定是否應(yīng)用動態(tài)范圍控制。這種動態(tài)范圍控制元數(shù)據(jù)使得收聽者能夠隨意決定是否進行解碼信號的高質(zhì)量藝術(shù)動態(tài)范圍壓縮。(2)在下混合操作的情況下防止削波當下混合多通道信號(例如,5. 1通道音頻信號)時,通道數(shù)目減少,通常減少到兩個通道。在通過立體聲揚聲器再現(xiàn)包括多于兩個的通道的多通道音頻信號(例如,具有5個主通道和1個低頻效果通道的5. 1通道音頻信號) 的情況下,典型地,執(zhí)行接收器側(cè)下混合操作,其中多通道信號被混合為兩個通道?;旌喜僮骺捎上禄旌暇仃嚸枋?,例如,在將5通道信號下混合為2通道(立體聲)信號的情況下的具有2行和5列的2X5矩陣(在下混合期間通常不考慮低頻效果通道)。已知將5. 1通道信號的5個主通道混合為2個通道的不同下混合方案,例如Lo/ Ro (僅左通道,僅右通道)或Lt/Rt (左總體通道,右總體通道)。下混合步驟具有數(shù)字立體聲信號偶爾過載的風險,從而產(chǎn)生不希望的削波假信號 (clipping artifact) 0當將超出最大(或最小)可表示值的經(jīng)下混合的數(shù)字信號的幅值被局限于最大(或最小)可表示值時,可發(fā)生這種削波。例如,在簡單的無符號定點二進制表示的情況下,當計算出的經(jīng)下混合的幅值被局限為所有位相應(yīng)于1的最大值字時發(fā)生削波。在有符號的16位表示的情況下,最大值可以例如相應(yīng)于字"0111111111111111"。由于在頭端、發(fā)送器或內(nèi)容產(chǎn)生側(cè)已知用于各種下混合方案的下混合矩陣,對于在被下混合時可能導(dǎo)致削波的信號,可將指示接收器在混合之前衰減將要被下混合的信號的動態(tài)范圍控制元數(shù)據(jù)添加到音頻流,以便動態(tài)地防止削波。(3)在經(jīng)提升(boost)的輸出的情況下防止削波對于動態(tài)非常有限的通道上的重新傳輸(從機頂盒通過模擬RF鏈路到TV的RF輸入),通常將信號提升lldB,以便在該路徑上實現(xiàn)更好的信噪比。在這樣的應(yīng)用中,對于當被放大IldB時可能導(dǎo)致削波的信號, 可將指示接收器在應(yīng)用IldB放大之前衰減信號的動態(tài)范圍控制元數(shù)據(jù)添加到音頻流,以便動態(tài)地防止削波。從接收音頻流的設(shè)備的角度看,不清楚到來(incoming)的動態(tài)范圍控制元數(shù)據(jù)用于目的(1)、即控制動態(tài)范圍,目的O)、即下混合削波保護,還是目的⑴和⑵兩者。通常元數(shù)據(jù)完成這兩個任務(wù),但是情況不總是如此,所以在某些情況下,元數(shù)據(jù)可能不包括下混合削波保護。另外,在根據(jù)目的C3)元數(shù)據(jù)與RF模式相關(guān)聯(lián)的情況下(通常,對于RF模式使用不同的增益參數(shù)),元數(shù)據(jù)可被用于在額外(extra)放大的情況中(在下混合情況和無下混合情況兩者中)防止削波。另外,由于對于某些音頻編碼格式元數(shù)據(jù)是可選擇的,因此到來的音頻流可能根本不包含動態(tài)范圍控制元數(shù)據(jù)。如果動態(tài)范圍控制元數(shù)據(jù)不被壓縮的音頻流包括,或被包括但是不包含下混合削波保護,如果多通道信號被下混合為較少通道,可能在解碼信號中出現(xiàn)不希望的削波假信號。
發(fā)明內(nèi)容
本發(fā)明描述了在不能確保利用音頻元數(shù)據(jù)的削波保護時防止音頻信號的削波的方法和設(shè)備。本申請的第一方面涉及保護從數(shù)字音頻數(shù)據(jù)得出的音頻信號(例如,經(jīng)下混合的數(shù)字音頻信號)免受信號削波的方法。根據(jù)該方法,確定基于接收到的音頻元數(shù)據(jù)的第一增益值是否足夠保護音頻信號免受削波。音頻元數(shù)據(jù)被嵌入第一音頻流。例如,確定壓縮的音頻流包括的時變增益包絡(luò)元數(shù)據(jù)是否足以防止下混合削波。在第一增益值不足夠保護的情況下,以足夠保護音頻信號免受削波的增益值替代對應(yīng)的第一增益值。優(yōu)選地,在第一音頻流中不存在與動態(tài)范圍控制有關(guān)的元數(shù)據(jù)的情況下,該方法可以添加足以防止信號削波的增益值。例如,在時變增益包絡(luò)元數(shù)據(jù)不提供足夠的下混合削波保護或根本不存在的情況下,修正或添加時變增益包絡(luò)元數(shù)據(jù),從而其提供足夠的下混合削波保護。不論是否接收到對于削波保護足夠的增益值,該方法都允許削波保護,特別是下混合情況下的削波保護。根據(jù)該方法,可以盡可能如實地應(yīng)用接收到的音頻增益字(如果提供的話),但是當?shù)絹淼脑鲆孀譀]有提供足夠的衰減以便防止例如下混合中的削波時,可以不考慮接收到的音頻增益字。當用于目的⑴的動態(tài)范圍控制數(shù)據(jù)具有藝術(shù)方面時,如果到來的元數(shù)據(jù)不提供這些藝術(shù)方面,接收設(shè)備(例如,機頂盒)通常不負責引入這些藝術(shù)方面。然而目的O)的屬性可以并且因此應(yīng)由接收實體提供。這意味著接收設(shè)備應(yīng)試圖在添加削波保護的同時盡可能多地保持預(yù)期用于目的(1)的動態(tài)范圍控制的動態(tài)范圍控制數(shù)據(jù)。存在多種用于確定基于接收到的音頻元數(shù)據(jù)的第一增益值是否足以防止信號削波的方法。根據(jù)一種優(yōu)選方法,基于數(shù)字音頻數(shù)據(jù)計算第二增益值,第二增益值足夠保護音頻信號免受削波。第二增益值可以是不導(dǎo)致削波的最大允許增益值。優(yōu)選地,該方法以這樣的方式確定第一增益值是否足夠,S卩,它將基于接收到的音頻元數(shù)據(jù)的第一增益值和計算出的第二增益值進行比較。該方法可將與音頻數(shù)據(jù)的片段相關(guān)聯(lián)的一個第一值和與音頻數(shù)據(jù)的相同片段相關(guān)聯(lián)的對應(yīng)的第二增益值進行比較。依賴于此,可由第一和第二增益值產(chǎn)生適應(yīng)削波保護的增益值流。優(yōu)選地,依賴于比較操作從第一增益值和計算出的第二增益值中選擇這樣的增益值。通過選擇第二計算出的增益值而不是第一增益值,以所選擇的第二增益值替代第一增益值。優(yōu)選地,選擇一對第一增益值和第二增益值中的最小值。如果第一增益值大于對于保護足夠的計算出的第二增益值,這指示存在第一增益值對于削波保護不足夠的風險, 并且因此應(yīng)當被對應(yīng)的第二增益值替代。否則,如果第一增益值小于對于保護足夠的計算出的第二增益值,這指示不存在信號削波的風險,并且應(yīng)當保持第一增益值。可如下文解釋地執(zhí)行從第一和第二增益值中的增益值的選擇在第一增益值和第二增益值兩者提供小于或等于1的增益的情況下,采用兩者中的最小值。這意味著或者第一增益值已經(jīng)確保了削波保護,或如果不是,則用第二增益值替代第一增益值。在第二增益值的增益大于1并且第一增益值提供小于或等于1的增益的情況下,信號可被放大并且仍不會削波。然而,到來的音頻流需要衰減,例如以便滿足動態(tài)范圍限制目的,并且因此其被保持。在第一增益值提供大于1的增益并且第二增益值提供小于或等于1的增益的情況下,到來的第一增益值將破壞削波保護,因此采用第二增益值。在第一增益值和第二增益值兩者都提供大于1的增益的情況下,輸入應(yīng)被放大。 只要仍然沒有發(fā)生削波就允許此放大,并且因此使用第一增益值和第二增益值中的較小
者ο一種可替換的用于確定第一增益值是否足夠保護的方法是將第一增益值應(yīng)用于音頻數(shù)據(jù),并且確定作為結(jié)果的數(shù)字音頻信號(例如,經(jīng)下混合的信號)是否出現(xiàn)削波。在第一增益值對于保護不足夠的情況下,可從作為初始增益值的第一增益值開始迭代地確定足夠削波保護的增益值。例如,可以確定對于如下這樣的增益值音頻信號是否出現(xiàn)削波,該增益值為根據(jù)增益值的分辨率的小于第一增益值的最接近的增益值(例如, 在第一增益值是0. 8并且增益值分辨率是0. 1的情況下,最接近的較小增益值是0. 7)。如果信號仍然削波,可以確定對于下一個較小增益值(例如,增益值0.6)音頻信號是否出現(xiàn)削波。這可重復(fù)進行,直到發(fā)現(xiàn)不導(dǎo)致信號削波的增益值。優(yōu)選地,該方法被作為編碼轉(zhuǎn)換處理的一部分執(zhí)行,其中第一音頻編碼格式(例如,AAC格式和還已知為aacPlus的高效AAC (HE-AAC)格式)的第一音頻流被編碼轉(zhuǎn)換為以第二音頻編碼格式(例如,Dolby Digital格式或Dolby Digital Plus格式)編碼的第二音頻流。第二音頻流包括對于削波足夠的替代的增益值或具有從其得出的增益值。由于不能在整個傳輸鏈中直到傳輸鏈中的最終音頻解碼器(例如,直到AVR音頻 /視頻接收器的解碼器)始終保持承載音頻數(shù)據(jù)的數(shù)字壓縮格式,因此常常需要音頻編碼轉(zhuǎn)換。在廣播的情況下,這是因為,例如,對于接收設(shè)備(例如,機頂盒-STB)與傳輸鏈中的最終解碼器(例如,AVR中的解碼器或電視機內(nèi)的音頻解碼器)之間的音頻的傳輸以及無線電廣播(或通過纜線對消費者的廣播)可能使用不同編碼方案。例如,可以通過AAC 格式或HE-AAC格式進行音頻數(shù)據(jù)的無線電廣播,并且然后可將音頻數(shù)據(jù)編碼轉(zhuǎn)換為Dolby Digital格式或Dolby Digital Plus格式,以便從STB傳輸?shù)紸VR。因此,可以例如在STB 中執(zhí)行編碼轉(zhuǎn)換步驟,以便從一種格式改變?yōu)榱硪环N格式。這種編碼轉(zhuǎn)換步驟包括音頻數(shù)據(jù)自身的編碼轉(zhuǎn)換,但是理想地還包括伴隨的元數(shù)據(jù)、尤其是動態(tài)范圍控制數(shù)據(jù)的編碼轉(zhuǎn)換。根據(jù)優(yōu)選實施例,該方法在第二音頻流中提供經(jīng)編碼轉(zhuǎn)換的音頻增益元數(shù)據(jù),該增益元數(shù)據(jù)足夠防止信號削波。該方法可能在任何如下這樣的設(shè)備中非常有用,該設(shè)備將信號從一種壓縮音頻流格式編碼轉(zhuǎn)換為另一種格式,其中事先不知道由第一格式攜帶的時變增益控制元數(shù)據(jù)(如果有的話)是否包括下混合削波保護(例如,在AAC/HE-AAC到Dolby Digital編碼轉(zhuǎn)換器中,Dolby E到AAC/HE-AAC編碼轉(zhuǎn)換器中,或Dolby Digital到AAC/HE-AAC編碼轉(zhuǎn)換器中)。優(yōu)選地,為了確定第一增益值是否足夠保護,根據(jù)至少一種下混合方案(例如根據(jù)Lt/Rt下混合方案)對數(shù)字音頻數(shù)據(jù)進行下混合。下混合得到一個或多個信號,例如,得到與右通道相關(guān)聯(lián)的一個信號和與左通道相關(guān)聯(lián)的一個信號。另外,可以考慮多種下混合方案,并且根據(jù)多于一種的下混合方案來下混合數(shù)字音頻數(shù)據(jù)。優(yōu)選地,連續(xù)確定從音頻信號得出的各種信號的實際峰值,即在給定時間確定各種信號中的具有最高信號值的信號。為了計算峰值,該方法可以確定在給定時刻兩個或更多個信號的絕對值的最大值。所述兩個或更多個信號可以包括根據(jù)第一下混合方案下混合之后的一個或多個信號,例如,經(jīng)下混合的右通道信號的樣本的絕對值和同時的經(jīng)下混合的左通道信號的樣本的絕對值。另外,為了計算峰值,該方法還可以考慮根據(jù)第二(并且甚至第三)下混合方案下混合之后的一個或多個信號的絕對值。另外,峰值確定可以考慮下混合之前的一個或多個音頻信號的絕對值,例如,5. 1通道信號的5個主要通道中的每一個在相同時刻的絕對值。應(yīng)當注意,在編碼轉(zhuǎn)換的情況下,典型地不知道稍后是否在離散通道上重放多通道信號,或是否執(zhí)行根據(jù)下混合方案的下混合。峰值相應(yīng)于這些同時的信號樣本值的最大值,從而指示在特定時間實例對于所有可能情況信號可以具有的最大幅值,并且這是削波保護算法應(yīng)當考慮的最壞情況。動態(tài)范圍控制數(shù)據(jù)典型地以一定粒度時變,該粒度通常與對應(yīng)的音頻編碼格式的數(shù)據(jù)片段(例如,塊)的長度或其整數(shù)部分有關(guān)。因此,優(yōu)選地還每個數(shù)據(jù)片段計算第二增益值。因此,優(yōu)選地減小峰值或連續(xù)峰值的采樣速率(下采樣)??梢酝ㄟ^確定多個連續(xù)峰值或連續(xù)的經(jīng)濾波的峰值的最大值來實現(xiàn)。具體地,該方法可以確定與數(shù)據(jù)片段(例如數(shù)據(jù)塊或幀)相關(guān)聯(lián)的多個連續(xù)(經(jīng)過濾)峰值的最大值。在編碼轉(zhuǎn)換的情況下,該方法可以確定與第二(發(fā)出的)數(shù)據(jù)流的數(shù)據(jù)片段相關(guān)聯(lián)的多個連續(xù)(經(jīng)過濾)峰值的最大峰值。應(yīng)當注意,優(yōu)選地,不僅基于發(fā)出的片段中的信號樣本的連續(xù)峰值被考慮用于確定最大值,而且將影響數(shù)據(jù)片段的解碼的附加(在前和在后)峰值,即與解碼窗口的開始和結(jié)束處的信號樣本有關(guān)的峰值也被考慮。這些峰值也與數(shù)據(jù)片段相關(guān)聯(lián)。作為選擇最大峰值的替代,可每個數(shù)據(jù)片段計算不同的值以便減小采樣速率。
應(yīng)當注意,可以對從峰值之外的音頻數(shù)據(jù)得出的樣本進行下采樣。例如,音頻數(shù)據(jù)可被下混合為單個通道(單聲道),并且僅確定每個發(fā)出的數(shù)據(jù)片段的經(jīng)下混合的連續(xù)樣本的最大值。根據(jù)不同的示例,首先每個發(fā)出的數(shù)據(jù)片段計算各經(jīng)下混合的通道信號的各最大值(下采樣),并且然后計算這些最大值的峰值?;诖_定的最大值,可以通過對確定的最大值求倒數(shù)來計算增益值。如果1是可被表示的最大信號值,對確定的最大值求倒數(shù)直接得到增益因子。當該增益因子被應(yīng)用于 (經(jīng)濾波的)峰值的最大值時,結(jié)果值等于1,即最大信號值。這意味著應(yīng)用該增益的每個音頻樣本被保持低于或等于1,從而避免這個數(shù)據(jù)片段的削波。在1是最大信號電平的情況下,1相應(yīng)于OdBFS-相對于整個數(shù)值范圍的分貝;一般將OdBFS分配給最大可能電平。作為簡單地對確定的最大值求倒數(shù)的替代,可以通過使最大信號值(其相應(yīng)于 OdBFS)除以確定的與數(shù)據(jù)片段相關(guān)聯(lián)的最大值,計算增益值。然而,與簡單的求倒數(shù)相比, 計算成本較高。在編碼轉(zhuǎn)換的情況下,數(shù)據(jù)片段(例如,數(shù)據(jù)塊或幀)的長度對于第一音頻編碼格式(輸入流的格式)和第二音頻編碼格式(輸出流的格式)是不同的。例如,在AAC中,塊典型地包含128個樣本(在HE-AAC 每個塊256個樣本),而在Dolby Digital中,塊典型地包含256個樣本。因此,當從AAC編碼轉(zhuǎn)換到Dolby Digital時每塊的樣本數(shù)目增加。 在AAC中,幀典型地包括IOM個樣本(在HE-AAC中每幀2048個樣本),其中在Dolby Digital中,幀典型地包括1536個樣本(6個塊)。因此,當從AAC編碼轉(zhuǎn)換到Dolby Digital 時,每幀的樣本數(shù)目也增加。動態(tài)范圍控制數(shù)據(jù)的粒度主要是塊大小或幀大小。例如,用于 HE-AAC流的MPEG中的動態(tài)范圍控制元數(shù)據(jù)“DRC”的粒度和Dolby Digital中的增益元數(shù)據(jù)“dynrng”的粒度是塊大小。作為對比,Dolby Digital中的增益元數(shù)據(jù)“compr”的粒度和用于HE-AAC流的DVB(數(shù)字視頻廣播)中的增益元數(shù)據(jù)“heavy compression”的粒度是幀大小。另外,采樣速率對于輸入流(例如,32KHz或44. IKHz)和輸出流(例如,48KHz)可以不同,即音頻被重采樣。這還改變了到來的數(shù)據(jù)片段和發(fā)出的數(shù)據(jù)片段之間的長度關(guān)系。 另外,到來的和發(fā)出的數(shù)據(jù)片段可能不對齊。另外,應(yīng)當注意,以輸入數(shù)據(jù)片段(例如,塊或幀)傳輸?shù)脑獢?shù)據(jù)具有動態(tài)范圍控制影響區(qū)域(即,流中的增益值的應(yīng)用已生效的范圍), 該動態(tài)范圍控制影響區(qū)域常常不與數(shù)據(jù)片段完全一樣大,而是更大。這歸因于使用的變換的重疊添加特性,以及常常在頻譜域中應(yīng)用動態(tài)范圍控制這一事實。發(fā)出的音頻流的動態(tài)范圍控制數(shù)據(jù)也是如此。因此,為了確定哪些輸入增益值影響給定的輸出數(shù)據(jù)片段,如下面詳細解釋地,可以查看輸入和輸出影響長度的重疊(而不是考慮輸入和輸出數(shù)據(jù)片段的重疊)。由于上面討論的原因,動態(tài)范圍控制數(shù)據(jù)的編碼轉(zhuǎn)換應(yīng)當考慮到發(fā)出的動態(tài)范圍控制值可能受到多于一個到來的動態(tài)范圍控制值的影響。在此情況下,當對數(shù)據(jù)流進行編碼轉(zhuǎn)換時,可以執(zhí)行動態(tài)范圍控制數(shù)據(jù)的重采樣(重整)。因此,該方法可以包括對從第一音頻流的接收到的音頻元數(shù)據(jù)得出的增益值重采樣的步驟。當?shù)谝灰纛l流的數(shù)據(jù)片段覆蓋比第二音頻流的數(shù)據(jù)片段短的時間長度時,增益值被下采樣。可以通過計算多個連續(xù)增益值的最小值來確定經(jīng)重采樣的增益值。換言之從若干輸入動態(tài)范圍控制增益(其與發(fā)出的數(shù)據(jù)片段相關(guān))中選擇最小的一個。這樣做的動機是盡可能多地保持到來的值(在該值不導(dǎo)致信號削波的情況下)。然而,這常常是不可能的,因為必須對增益值重采樣。因此,選擇最小增益值,這趨向于減小信號幅值。然而,信號幅值的此減小被認為不太顯著或討厭。優(yōu)選地,每個輸出數(shù)據(jù)片段確定這樣的最小值。在第一音頻流中不存在與動態(tài)范圍控制有關(guān)的增益元數(shù)據(jù)的情況下,該方法優(yōu)選地在第二音頻流(發(fā)出的流)中添加足以防止削波的增益值。這些增益值應(yīng)優(yōu)選地被限制, 使得它們不超過增益1。防止增益值超過1的原因是信號不應(yīng)當被不必要地放大以接近削波邊界。因此,在對應(yīng)的計算出的第二增益值具有低于1的增益的情況下,對應(yīng)的添加的增益值相應(yīng)于計算出的第二增益值。在對應(yīng)的計算出的第二增益值大于1的情況下,對應(yīng)的添加的增益值被設(shè)為增益1。本發(fā)明的第二方面涉及用于保護從數(shù)字音頻數(shù)據(jù)得出的音頻信號免受信號削波的設(shè)備。該設(shè)備被配置為執(zhí)行上面討論的方法。該設(shè)備的特征相應(yīng)于上面討論的方法的特征。因此,該設(shè)備包括用于確定基于接收到的音頻元數(shù)據(jù)的第一增益值是否足夠保護音頻信號免受削波的裝置。另外,該裝置包括用于在第一增益值不足夠的情況下用足夠保護音頻信號免受削波的增益值替代第一增益值的裝置。優(yōu)選地,確定裝置包括用于基于數(shù)字音頻數(shù)據(jù)計算第二增益值的裝置,第二增益值對于音頻信號的削波保護是足夠的。更優(yōu)選地,確定裝置還包括比較裝置,用于比較基于接收到的音頻元數(shù)據(jù)的第一增益值和計算出的第二增益值。依賴于此,從第一增益值和計算出的第二增益值中選擇增益值。上文的關(guān)于本申請的第一方面的評述也適用于本申請的第二方面。本申請的第三方面涉及編碼轉(zhuǎn)換器,該編碼轉(zhuǎn)換器配置為將音頻流從第一音頻編碼格式編碼轉(zhuǎn)換為第二音頻編碼格式。該編碼轉(zhuǎn)換器包括根據(jù)本申請的第二方面的設(shè)備。 優(yōu)選地,編碼轉(zhuǎn)換器是接收第一音頻流的接收設(shè)備的一部分,其中第一音頻流是數(shù)字廣播信號,例如,數(shù)字電視信號(例如,DVB-T, DVB-S, DVB-C)或數(shù)字無線電信號(例如,DAB信號)的音頻流。例如,接收設(shè)備是機頂盒。還可以通過hternet廣播音頻流(例如,Internet TV或hternet無線電)??商鎿Q地,可從數(shù)字數(shù)據(jù)存儲介質(zhì),例如,DVD(數(shù)字通用盤)或藍光盤讀取第一音頻流。上文的關(guān)于本申請的第一和第二方面的評述也適用于本發(fā)明的第三方面。
下面參考附圖以示例方式解釋本發(fā)明,其中圖1示出了提供削波保護的編碼轉(zhuǎn)換器的實施例;圖2示出了元數(shù)據(jù)重整(reframing)的優(yōu)選方法;圖3示出了基于接收到的音頻數(shù)據(jù)確定峰值的實施例;圖4示出了將到來的動態(tài)范圍控制數(shù)據(jù)與計算出的足夠削波保護的增益值合并的實施例;圖5示出了輸出增益值的選擇;圖6示出了將到來的動態(tài)范圍控制數(shù)據(jù)與計算出的足夠削波保護的增益值合并的可替換實施例;圖7示出了平滑化濾波級的實施例;圖8示出了提供削波保護的另一個實施例;圖9示出了提供削波保護的還另一個實施例;以及圖10示出了接收經(jīng)編碼轉(zhuǎn)換的音頻流的接收設(shè)備。
具體實施例方式AAC/HE-AAC 和 Dolby Digital/Dolby Digital Plus 支持元數(shù)據(jù)的概念,更具體地,攜帶在解碼時將被可選擇地應(yīng)用于音頻數(shù)據(jù)的時變增益的增益字的概念。出于減少數(shù)據(jù)的目的,這些增益字典型地僅每個數(shù)據(jù)片段被發(fā)送一次,例如每個數(shù)據(jù)塊或幀被發(fā)送一次。在所述音頻格式中,這些增益字是可選擇的,即,技術(shù)上可不發(fā)送該數(shù)據(jù)。Dolby Digital/Dolby Digital Plus編碼器典型地發(fā)送增益字,而AAC和HE-AAC編碼器常常不發(fā)送增益字。然而,發(fā)送增益字的AAC和HE-AAC編碼器的數(shù)目正在增加。本申請允許接收音頻流的解碼器或編碼轉(zhuǎn)換器在兩種狀況下做“正確的事”。如果提供了增益字,“正確的事” 是盡可能如實地處理接收到的增益字,但是當例如在下混合的情況下到來的增益字不能提供足以防止信號削波的衰減時,不考慮這些增益字。如果沒有提供增益值,“正確的事1計算并且提供防止信號削波的增益值。圖1示出了編碼轉(zhuǎn)換器的實施例,該編碼轉(zhuǎn)換器提供了防止信號削波的保護,尤其是在下混合(例如,從5. 1通道信號下混合到2通道信號)情況下防止削波的保護。編碼轉(zhuǎn)換器接收包含音頻元數(shù)據(jù)的數(shù)字音頻流1。例如,數(shù)字音頻流是AAC或HE-AAC (HE-AAC version 1或HE-AAC version 2)數(shù)字音頻流。數(shù)字音頻流可以是DVB視頻/音頻流(例如DVB-T,DVB-S或DVB-C流)的一部分。編碼轉(zhuǎn)換器將接收到的音頻流1編碼轉(zhuǎn)換為輸出音頻流14,輸出音頻流14被以不同的格式(例如Dolby Digital或Dolby Digital Plus) 編碼。典型地,Dolby Digital解碼器支持多通道信號的下混合,并且假設(shè)包括在接收到的Dolby Digital元數(shù)據(jù)中的時變增益包絡(luò)包括下混合削波保護。不幸的是,比特流1(例如,AAC/HE-AAC比特流)不一定包含時變增益包絡(luò)元數(shù)據(jù),并且即使在攜帶這種數(shù)據(jù)的情況下,也不清楚該數(shù)據(jù)是否包括削波保護。編碼轉(zhuǎn)換器防止接收設(shè)備(編碼轉(zhuǎn)換器的下游) 中的解碼器(例如,Dolby Digital解碼器)在下混合信號時產(chǎn)生包含削波假信號的輸出信號。編碼轉(zhuǎn)換器確保輸出音頻流14包含包括下混合削波保護的時變增益包絡(luò)元數(shù)據(jù)。在圖1中,單元2讀出包含在音頻流1的音頻元數(shù)據(jù)中的動態(tài)范圍控制增益值 3??蛇x擇地,增益值3在單元5中被進一步處理,例如,增益值3根據(jù)經(jīng)編碼轉(zhuǎn)換的輸出音頻流14的數(shù)據(jù)片段定時被重采樣并且進行編碼轉(zhuǎn)換。文檔〃 Transcoding of dynamic range control coefficients and other metadata into MPEG-4 HE AAC“ ,Wolfgang Schildbach et al. , Audio Engineering Society Convention Paper, presented at the 123rdConvention October 5-8,2007,New York.中討論了元數(shù)據(jù)增益值的重采樣和編碼轉(zhuǎn)換。通過引用將該論文的公開、尤其是元數(shù)據(jù)增益值的重采樣和編碼轉(zhuǎn)換的概念結(jié)合在此。另外,申請人在2008年9月30曰提交了名稱為"Transcoding of Audio Metadata" 的美國臨時申請61/101497,該美國臨時申請涉及元數(shù)據(jù)增益值的重采樣和編碼轉(zhuǎn)換。通過引用將該申請的公開、尤其是元數(shù)據(jù)增益值的重采樣和編碼轉(zhuǎn)換的概念結(jié)合在此。
與重采樣并行地,音頻流1中的音頻數(shù)據(jù)典型地被解碼器6解碼為PCM (脈沖碼調(diào)制)音頻數(shù)據(jù)。經(jīng)解碼的音頻數(shù)據(jù)7包括多個并行的信號通道,例如,在5. 1通道信號情況下的6個信號通道,或在7. 1通道信號情況下的8個信號通道。計算單元8基于音頻數(shù)據(jù)7確定計算出的增益值9。計算出的增益值9對于在位于編碼轉(zhuǎn)換器下游的接收經(jīng)編碼轉(zhuǎn)換的音頻流的接收設(shè)備中尤其當在接收設(shè)備中對信號進行下混合時防止信號削波的保護是足夠的。這種設(shè)備可以是AVR或電視機。計算出的增益值應(yīng)當確保經(jīng)下混合的信號最大達到OdBFS或更小。在單元10中將從音頻流1中的元數(shù)據(jù)得出的增益值4與計算出的增益值9相互比較。單元10輸出增益值11,其中在增益值流4的增益值不足以防止接收設(shè)備中的信號削波的情況下,以從增益值流9得出的增益值替代增益值流4的對應(yīng)增益值。并行地,通過編碼器12將音頻數(shù)據(jù)7編碼為輸出音頻編碼格式,例如,Dolby Digital或Dolby Digital Plus。在單元13中組合經(jīng)編碼的音頻數(shù)據(jù)和增益值11。作為結(jié)果的音頻流提供了尤其對于信號下混合的情況防止信號削波的音頻增益元數(shù)據(jù)。一般地,只要增益元數(shù)據(jù)提供防止信號削波的保護,則應(yīng)當盡可能多地保持進入 (ingoing)的增益元數(shù)據(jù)。在大多數(shù)情況下,輸入音頻流(見圖1中的1)的數(shù)據(jù)片段(例如,數(shù)據(jù)塊或幀)的長度和輸出音頻流(見圖1中的14)的數(shù)據(jù)片段(例如,數(shù)據(jù)塊或幀) 的長度不同。另外,典型地,輸入音頻流的數(shù)據(jù)片段的開始和發(fā)出的音頻流的數(shù)據(jù)片段的開始不對齊(即使數(shù)據(jù)片段長度相同)。因此,通常需要從進入的元數(shù)據(jù)到發(fā)出的(outgoing) 元數(shù)據(jù)的映射。圖2示出了將到來的元數(shù)據(jù)映射到發(fā)出的元數(shù)據(jù)的優(yōu)選方法。如前面討論的,典型地,每個數(shù)據(jù)片段(例如,數(shù)據(jù)塊或幀)具有動態(tài)范圍控制數(shù)據(jù)的一個增益值(或多個增益值,例如,8個增益值)。然而,與輸入數(shù)據(jù)片段(例如,數(shù)據(jù)塊或幀)一起傳輸?shù)脑獢?shù)據(jù)具有動態(tài)范圍控制影響區(qū)域(即,流中的增益值的應(yīng)用具有效果的范圍),該動態(tài)范圍控制影響區(qū)域常常不正好與數(shù)據(jù)片段一樣大,而是更大。這是由于使用的變換的重疊-添加特性(即,使用大于數(shù)據(jù)片段的窗口,并且窗口重疊),以及由于常常在頻譜域中應(yīng)用動態(tài)范圍控制。發(fā)出的音頻比特流的動態(tài)范圍控制數(shù)據(jù)常常也是如此。在圖2中,實線標出輸入流中的數(shù)據(jù)片段20-23的開始和結(jié)束,以及輸出流中的數(shù)據(jù)片段M-26的開始和結(jié)束。在圖2中,增益值的各動態(tài)范圍控制影響區(qū)域30-33和34-36超出了對應(yīng)數(shù)據(jù)片段的結(jié)束和開始。各影響區(qū)域30-33和34-36由虛線指示。例如,在HE-AAC中,塊大小是256個樣本,而用于解碼的窗口具有512個樣本。全部512個樣本的窗口可被認為是影響區(qū)域;然而,增益值在窗口外緣處的影響小于在窗口中部的影響。因此,影響區(qū)域還可被認為是窗口的一部分。影響區(qū)域可以是從塊/幀大小 (此處256個樣本)直到窗口大小(此處512個樣本)中選擇的樣本數(shù)。優(yōu)選地,使用的影響區(qū)域大于數(shù)據(jù)片段(數(shù)據(jù)塊或幀)的大小。為了確定哪些輸入動態(tài)范圍控制值影響給定的輸出數(shù)據(jù)片段,優(yōu)選地查看輸入和輸出影響區(qū)域的重疊(而不是查看輸入和輸出數(shù)據(jù)片段的重疊)。在圖2中,確定輸入流中的影響區(qū)域30-33中的哪些與給定輸出數(shù)據(jù)片段M-26的影響區(qū)域34-36重疊。例如,輸出流中的數(shù)據(jù)片段M的影響區(qū)域34與區(qū)域30、31、32和33重疊。因此,優(yōu)選地,當確定示出的輸出流中的第一數(shù)據(jù)片段M的增益值時,考慮與4個數(shù)據(jù)片段20、21、22和23關(guān)聯(lián)的增益值。第一數(shù)據(jù)片段M受到4個輸入數(shù)據(jù)片段20-23的影響。可替換地,該方法可以查看輸入影響區(qū)域和輸出信號片段的重疊,或輸入數(shù)據(jù)片段和輸出數(shù)據(jù)片段的重疊。可以在圖1的單元5內(nèi)執(zhí)行這種映射或重采樣處理,單元5接收輸入流1的增益值3,并且將增益值3中的一個或多個映射到增益值4。圖3示出了用于基于接收到的音頻數(shù)據(jù)確定峰值的模塊50的實施例。這種峰值確定模塊50可以是圖1的模塊8的一部分。基于包括多個通道(此處為5. 1通道信號的 5個通道,不考慮低頻效果通道)的經(jīng)解碼的多通道音頻數(shù)據(jù)7,根據(jù)一個或多個下混合方案(即,根據(jù)一個或多個下混合矩陣)執(zhí)行下混合。應(yīng)當注意,編碼轉(zhuǎn)換器根本不知道在接收設(shè)備中是否執(zhí)行下混合以及然后在接收設(shè)備中使用哪個下混合方案。因此,不知道是否在離散通道上重放多通道信號,或是否執(zhí)行根據(jù)若干方案之一的下混合。編碼轉(zhuǎn)換器模擬所有情況并且確定最壞情況。在圖3的例子中,在模塊41中執(zhí)行根據(jù)Lo/Ro下混合方案的下混合,在模塊42 中執(zhí)行根據(jù)I^0 Logic(PL)下混合方案的下混合,以及在模塊43中執(zhí)行根據(jù)ftx) Logic II(PLII)下混合方案的下混合。PL下混合方案和PL II下混合方案是前面討論的Lt/Rt下混合方案的兩種變型。每種下混合方案輸出一右通道信號和一左通道信號。然后,計算下混合之后的信號的絕對值(見圖3的模塊44)。優(yōu)選地,還計算多通道音頻信號7的各個通道的絕對樣本值(見用于確定絕對值的模塊40)。還考慮通道(沒有下混合)的絕對值有助于在除下混合之外的其它情況中、例如在信號稍后被以額外增益(例如,如后面討論的, 在RF模式的情況下IldB增益)放大的情況中防止信號削波。在模塊45中計算在一個時刻(at a time)的絕對值的最大值(=峰值)。連續(xù)執(zhí)行最大值的計算,從而產(chǎn)生峰值46的流。各個樣本可能由于不同的信號處理具有不同的信號延遲。這樣的不同的信號延遲可被對齊(未示出)。樣本值的最大值指示信號在所有情況下可以具有的最大幅值,并且從而是削波保護算法考慮的最壞情況。因此,編碼轉(zhuǎn)換器模擬在一個時刻接收設(shè)備中的信號的最壞情況幅值。實現(xiàn)防止削波的保護的動態(tài)范圍控制值應(yīng)當以信號最大達到OdBFS的方式來衰減(或放大)信號。應(yīng)當注意,模塊50可以基于比圖3所示的絕對值少的絕對值(例如,不考慮未被下混合的通道的絕對值)或基于圖3中未示出的附加絕對值(例如,其它下混合方案的絕對值)來確定峰值。可替換地,可以下混合通道7而不確定峰值;例如,可以組合兩個作為結(jié)果的通道,并且進一步處理組合信號(而不是使用作為塊45的輸出的峰值46)。圖4示出了對峰值46的進一步處理。圖1和圖4中的被以相同附圖標記表示的附圖元件基本相同。峰值46在單元60中經(jīng)歷分塊化和最大值建立步驟。此處,對于給定輸出數(shù)據(jù)片段(例如,塊)確定最高峰值。換言之,通過從多個峰值中選擇用于輸出數(shù)據(jù)片段的最高峰值(它是最關(guān)鍵的一個)對峰值進行下采樣。應(yīng)當注意,優(yōu)選地對于確定最大值不僅僅考慮相應(yīng)于輸出片段中的信號樣本的連續(xù)峰值。而且還考慮將影響給定數(shù)據(jù)片段的附加(在前的和在后的)峰值,即,與解碼窗口的開始和結(jié)束處的信號樣本有關(guān)的峰值。 優(yōu)選地,考慮窗口的所有樣本。此采樣的結(jié)果在模塊61中被根據(jù)公式C= 1/X取倒數(shù),其中C指的是計算出的增益值9,并且X指的是輸出流14的塊的對應(yīng)最高峰值。結(jié)果C是這樣的因子(增益),即當該增益被應(yīng)用于對應(yīng)音頻樣本時,確保數(shù)據(jù)片段(例如,數(shù)據(jù)塊)的每個音頻樣本低于或等于最大信號電平1(相應(yīng)于OdBFS)。這避免了該數(shù)據(jù)片段的削波。應(yīng)當注意,最大信號電平指的是經(jīng)編碼轉(zhuǎn)換的音頻流的在接收器中的信號的最大信號電平;因此,在模塊60的輸出處,幅值可以高于1(當C< 1時)。計算出的增益C是防止削波的最大允許增益;還可以使用比計算出的增益C小的增益值(在這個情況下,作為結(jié)果的信號更小)。應(yīng)當注意,在增益C小于1的情況下,必須應(yīng)用增益c(或更小的增益),否則信號將至少在最壞情形下削波。在模塊5中,到來的來自元數(shù)據(jù)的增益值3也經(jīng)歷重采樣。從與輸出數(shù)據(jù)片段相關(guān)的多個到來的增益中,選擇最小增益并且將其用于進一步處理。優(yōu)選地,如結(jié)合圖2討論的那樣執(zhí)行重采樣為了確定哪些到來的增益值與輸出數(shù)據(jù)片段相關(guān),考慮輸入和輸出影響區(qū)域的重疊。如果到來的數(shù)據(jù)片段的影響區(qū)域和給定輸出數(shù)據(jù)片段的影響區(qū)域重疊,當確定最小增益值時考慮該到來的數(shù)據(jù)片段(并且因此考慮其增益值)。作為替代,可以使用結(jié)合圖2討論的兩種可替換的方法。這樣做的動機是保持到來的值。然而,這是不可能的,這是由于必須根據(jù)輸出流的定時對增益值重采樣,因此。使用多個連續(xù)增益值中的最小增益值有助于減小傾向于被認為不太顯著或討厭的信號幅值。在到來的數(shù)據(jù)流1中存在相關(guān)動態(tài)范圍控制數(shù)據(jù)的情況下,在模塊10中進行此增益(優(yōu)選地在塊5中的重采樣之后)與對于削波保護足夠的計算出的增益值9的比較。模塊62確定經(jīng)重采樣的增益值4和計算出的增益值9之間的最小值,并且使用該較小的增益值作為發(fā)出的增益值(模塊62形成最小值選擇器)。在不存在到來的增益值的情況下,圖4中的開關(guān)63將切換到上部位置,然后模塊 62確定增益1和計算出的增益值之間的最小值,并且使用該較小的增益值作為發(fā)出的增益值。因此,在不存在到來的增益的情況下,發(fā)出的增益值被局限于最大增益1。下表示出了比較模塊10的操作。此處,項“I”表示到來的動態(tài)范圍控制增益4(重采樣之后),并且項“C”表示計算出的增益9。
KlI>1I不存在C<1min( I,C )min( I,C ) =CCOlmin( I,C ) =Imin( I,C )I在I和C兩者都小于或等于1的情況下,采用最小值。這意味著或者I已經(jīng)確保了削波保護,或者如果不能,則其將被C替代。在C > 1并且I < 1的情況下,信號可被放大并且仍然不會出現(xiàn)削波??墒堑絹淼牧餍枰p,例如以滿足動態(tài)范圍限制目的,并且因此保持I (在此情況下,I是I和C中的最小值)。在I > 1并且C < 1的情況下,到來的值將破壞削波保護,從而采用C(在該情況下,C是I和C中的最小值)。
16
在I和C兩者都大于1的情況下,輸入應(yīng)被放大。只要仍然不出現(xiàn)削波就允許此放大,并且因此使用I和C中的較小值。在不存在到來的動態(tài)范圍值的情況下,只要C ^ 1就通過使用C來確保削波保護。 在C > 1的情況下,不應(yīng)修正信號(即,該信號不應(yīng)被不必要地放大以接近削波邊界)。因此采用1作為輸出增益。在不存在到來的增益值的兩種情況下,使用1和C中的最小值(而不是I和C之間的最小值)。圖5以流程圖形式示出了對發(fā)出的增益值11的選擇。確定是否存在增益值1(見圖5中的附圖標記130)。如果當前存在增益值I,則發(fā)出的增益值取決于到來的增益值I和計算出的增益值C的值。如果I < 1并且C < 1,則選擇的增益值相應(yīng)于I和C中的最小值 (見附圖標記131)。如果K 1并且C > 1,則選擇的增益值相應(yīng)于I (見附圖標記132)。 如果I > 1并且C彡1,則選擇的增益值相應(yīng)于C (見附圖標記133)。如果I > 1并且C > 1,則選擇的增益值相應(yīng)于I和C中的最小值(見附圖標記134)。應(yīng)當注意,在所有這四種情況中,發(fā)出的值仍相應(yīng)于I和C中的最小值。因此,不必須確定I和C是否< 1。如果當前不存在增益值I,則發(fā)出的增益值取決于計算出的增益值C的值。如果 C ( 1,發(fā)出的增益值相應(yīng)于C (見附圖標記135)。如果C > 1,發(fā)出的增益值相應(yīng)于1 (見附圖標記136)。應(yīng)當注意,在兩種情況下,輸出值仍然相應(yīng)于1和C中的最小值。因此,不必須確定C是否< 1。上面討論的實施例實現(xiàn)了保持到來的動態(tài)值并且僅在削波將發(fā)生的情況下修正該動態(tài)值以防止削波。在不存在動態(tài)范圍控制值的情況下,給流添加足夠的動態(tài)范圍控制值以防止削波。模式之間的切換瞬時地并且平滑地工作,從而防止任何假信號。圖6示出了圖4的實施例的替換方案。圖4和圖6中的被以相同附圖標記表示的附圖元件基本相同。在圖6中,用于兩種不同模式、行模式和RF模式的分離的增益元數(shù)據(jù)被接收并且編碼轉(zhuǎn)換。在圖6的實施例中,由于行模式和RF模式使用兩種不同類型的元數(shù)據(jù),計算用于行模式和RF模式的不同增益字。行模式元數(shù)據(jù)覆蓋較小的值范圍,并且被較頻繁地發(fā)送(通常每個塊一次),而RF模式元數(shù)據(jù)覆蓋較大的值范圍,并且較不頻繁地發(fā)送 (通常每幀一次)。在RF模式中,信號被提升IldB的額外增益,當在動態(tài)非常有限的通道上(例如,通過模擬RF天線鏈路從機頂盒到TV的RF輸入)傳輸信號時,這允許更高的信噪比。另外,由于與行模式的增益元數(shù)據(jù)相比RF模式增益元數(shù)據(jù)覆蓋更寬的值范圍,RF模式允許更高的動態(tài)范圍壓縮。用于行模式的增益元數(shù)據(jù)被指示為“DRC” (見附圖標記3), 而用于RF模式的增益元數(shù)據(jù)被指示為“compr”(見附圖標記3')。注意,在DVB中,RF模式的增益元數(shù)據(jù)被表示為“compression”或“heavy compression”。另外,圖6的實施例還考慮節(jié)目基準電平(PRL),其可被作為元數(shù)據(jù)的一部分傳輸。PRL指示音頻內(nèi)容的基準響度 (例如,在HE-AAC中,PRL可以在OdB和-31. 75dB之間改變)。PRL的應(yīng)用將音頻的響度降低到定義的目標基準電平。依賴于音頻編碼格式,其它基準項(例如對話電平、對話常態(tài)化或dialnorm)是常用的。在圖6中,在單元70中根據(jù)接收到的PRL對數(shù)據(jù)塊的最高峰值(由單元60產(chǎn)生) 進行電平調(diào)整(通常,使該電平減小PRL)。為了計算與行模式相關(guān)聯(lián)的增益值,在模塊61 中對經(jīng)電平調(diào)整的樣本取倒數(shù),從而產(chǎn)生計算出的增益值,該計算出的增益值確保在在接收器中以PRL調(diào)整音頻信號的情況下,該塊的每個音頻樣本低于或等于最大信號電平1。模塊5中的到來的DRC數(shù)據(jù)3的重采樣以及經(jīng)重采樣的增益值4與計算出的增益值的比較與圖4相同。為了計算與RF模式相關(guān)聯(lián)的增益值,在模塊71中將經(jīng)電平調(diào)整的樣本放大lldB, 這是因為在使用RF模式的情況下,在接收器中也將信號放大lldB。因此,編碼轉(zhuǎn)換器模擬接收設(shè)備中的信號的最壞情況的幅值。在塊61'中將經(jīng)提升的樣本取倒數(shù),從而產(chǎn)生計算出的用于RF模式的增益值,該增益值確保在音頻信號在接收器中被以PRL調(diào)整并且被提升 IldB的情況下,該塊的每個音頻信號低于或等于1(=最大信號幅值)。圖6的實施例優(yōu)選地用于輸出Dolby Digital音頻流的編碼轉(zhuǎn)換器(例如,HE-AAC 到Dolby Digital的編碼轉(zhuǎn)換器或AAC到Dolby Digital編碼轉(zhuǎn)換器)。根據(jù)Dolby Digital,在行模式中,每個編碼塊具有“DRC”(動態(tài)范圍控制)增益值,而在RF模式中,每個幀(其包括6個塊)具有“compr”增益值。然而,兩種類型的增益值涉及動態(tài)范圍控制。 計算出的RF模式的增益值在模塊73中被從塊速率下采樣到幀速率。模塊73對于總共6 個連續(xù)塊確定計算出的增益值的最小值,每個最小值被分配給用于整個幀的計算出的增益值72。模塊5'中的到來的compr增益值3'的重采樣與模塊5中的重采樣的不同之處在于確定用于輸出幀的最小值的方式。經(jīng)重采樣的增益值4'和計算出的基于幀的增益值72 的比較與前面的討論相同。圖6的實施例提供了不僅在下混合情況下防止削波、而且還當在RF模式中應(yīng)用 IldB的額外增益時防止信號削波的保護。(否則,即使當不使用信號下混合時,被提升IldB 的信號仍可能削波)。因此,在模塊50中還考慮沒有下混合的通道的絕對值是有利的。應(yīng)當注意,在未接收到PRL的情況下,優(yōu)選地,PRL被設(shè)為默認值。為了計算增益值,可以使用平滑化級。圖7示出了平滑化級80的實施例,其可被放置在模塊50的輸出與模塊61和61'的輸入之間的路徑中的任意位置。優(yōu)選地,平滑化級80被放置在模塊50的輸出處,從而基于峰值46產(chǎn)生經(jīng)平滑化的峰值46'。平滑化級 80對平滑化級的輸入信號(例如峰值信號)實施低通濾波。其目的是改進在削波保護取得效果(kick in)之后的聽覺印象在一段時間的削波保護之后限制增益(ducking gain)的立刻釋放將聽起來討厭。因此,如同在限幅器實現(xiàn)中廣泛使用的,以一階低通濾波器對峰值信號(以及由其得出的增益信號;如下)濾波,該低通濾波器優(yōu)選地以200毫秒的時間常數(shù) τ操作。當新輸入值在比經(jīng)平滑化的信號所實現(xiàn)的程度更高的程度上需要削波保護時(由于新輸入值高于經(jīng)平滑化的信號),其繞過平滑化級并且立刻實現(xiàn)。在該情況下,圖7的最大值計算塊81的上部輸入大于下部輸入。優(yōu)選地,圖3-7中的實施例是例如從AAC和/或HE-AAC到Dolby Digital,或從 Dolby E或Dolby Digital到AAC和/或HE-AAC的音頻編碼轉(zhuǎn)換器的一部分。然而,應(yīng)當注意,圖3-7中的實施例不一定是音頻編碼轉(zhuǎn)換器的一部分。這些實施例可以是接收到來的音頻流1并且應(yīng)用修正的增益值(沒有編碼轉(zhuǎn)換)的設(shè)備的一部分。修正的增益值可被直接用于調(diào)整接收到的音頻流的增益。例如,圖3-7的實施例可以是AVR或電視機的一部分。圖8示出了用于提供下混合保護的替換實施例。該裝置接收包含在音頻元數(shù)據(jù)中的或從音頻元數(shù)據(jù)得出的到來的增益字90。增益字90可以相應(yīng)于圖1和4的增益值3或 4。另外,該裝置接收音頻樣本91(例如,PCM音頻樣本)。例如,音頻樣本91可以是圖3的模塊50產(chǎn)生的峰值。如果音頻樣本91不是絕對值,可以事先確定音頻樣本91的絕對值。
在模塊92中,根據(jù)下式通過除法來計算最大允許增益值gainmax(t)
「 π · /.χ signal max,aUowed [οι 05] gainmax (t) = ^;——
signalit)此處,項Signalmaxj allowed表示最大允許信號幅值,例如,signal·, allowed = 1。項 signal (t)表示當前音頻樣本91。在模塊93中,最大允許增益值gainmax(t)被局限于最大增益1 如果值gainmax (t) 大于1,則gainmax(t)被設(shè)為1。然而,如果值gainmax(t)低于或等于1,不修正該值。模塊93的輸出被供給平滑化濾波級94。平滑化濾波級94包含低通濾波器和最小值選擇器95,最小值選擇器95選擇其兩個輸入中的最小值。該操作類似于圖7中的平滑化濾波級80。然而,由于濾波級94平滑化增益值而不是音頻樣本(通過對音頻樣本取倒數(shù)來得出增益值),此處使用最小值選擇器95而不是最大值選擇器81。平滑濾波級80當被放置在模塊92 (其通過取倒數(shù)來確定增益值)上游時可作為替代被使用。類似地,平滑化濾波級94當被放置在模塊61和/或61'下游時可以在圖4和5中使用(由于在塊61 和/或61 ‘下游增益信號被處理)。在模塊93處的增益值的突然增加的情況下平滑化濾波級94平滑化信號斜率(否則音頻可能聽起來討厭)。相反,在增益值的突然下降的情況下,平滑化濾波級94使得增益信號通過而不進行平滑化(否則信號將發(fā)生削波)。在最小值選擇器97中將平滑化濾波級95的輸出處的計算出的增益信號96和到來的增益字90進行比較。實際計算出的增益值96和實際到來的增益字90中的最小值被傳遞到最小值選擇器97的輸出。最小值選擇器97的輸出處的增益值98提供了下混合保護,并且可如前面討論的那樣被嵌入經(jīng)編碼轉(zhuǎn)換的音頻流。應(yīng)當注意,圖8中的實施例不必須是音頻編碼轉(zhuǎn)換器的一部分。輸出增益值可被直接用于調(diào)整接收到的音頻流的電平。在該情況下,圖8的裝置可以是AVR或電視機的一部分。另外,圖8中的實施例可用于在不考慮下混合的情況下防止信號削波。例如,圖8 中的實施例可以接收沒有在模塊50中進一步預(yù)處理的常規(guī)的PCM音頻樣本91。在該情況下,當以輸出增益值放大音頻樣本91時,圖8中的實施例防止削波。圖9示出了另一個替換實施例。圖8和9中的被以相同附圖標記表示的附圖元件基本相同。與圖8中的實施例成對比的,圖9中的實施例是類似圖4和6中的實施例的塊方式操作版本,其中每個信號塊(或類似幀的任意其它數(shù)據(jù)片段)僅執(zhí)行一個除法。這減少了每次的除法的數(shù)目。如已經(jīng)結(jié)合圖8討論的,可通過圖3的塊50產(chǎn)生音頻樣本91。如果音頻樣本91不是絕對值,可以事先確定音頻樣本91的絕對值(圖9中未示出)。然后音頻樣本91被供給平滑化濾波級80,平滑化濾波級80相應(yīng)于圖7中的平滑化濾波級80。與圖8成對比地,平滑化濾波級80處理音頻樣本而不是增益樣本。因此,平滑化濾波級80使用最大值選擇器81而不是最小值選擇器95。在平滑化之后,在單元100中確定每個音頻塊的樣本的最大值。然后,在塊101中對該最大值取倒數(shù),從而計算每個塊的最大允許增益。 在最小值選擇器97中將該增益值和當前增益值90比較,兩個值中的最小值被傳送到最小值選擇器97的輸出。最小值選擇器97的輸出處的增益值98提供下混合削波保護,并且可被如上面討論地嵌入經(jīng)編碼轉(zhuǎn)換的音頻流??梢孕薷膱D9的實施例,以便當不存在到來的增益值90時以類似方式產(chǎn)生增益值98 如果不存在到來的增益值90,并且計算出的增益小于或等于1,則輸出計算出的增益值。在計算出的增益值大于1的情況下(并且不存在到來的增益值90),輸出具有增益1的增益值。這可被以圖6的附加開關(guān)63實現(xiàn),該開關(guān)依賴于到來的增益值90的存在而在到來的增益值90和增益1之間切換。應(yīng)當注意,前面討論的實施例相應(yīng)于限幅器,其不干涉(respect)來自不同的壓縮器實例的增益值。圖10示出了接收由圖1的編碼轉(zhuǎn)換器產(chǎn)生的經(jīng)編碼轉(zhuǎn)換的音頻流14的接收設(shè)備。模塊121從音頻流14中分離增益值11。該接收設(shè)備還包括解碼器110,其產(chǎn)生經(jīng)解碼的音頻信號120。在模塊112中通過在圖1中得出的增益值11調(diào)整經(jīng)解碼的音頻信號120 的幅值。在模塊113中執(zhí)行可選擇的下混合的情況下,由于增益值11足以防止下混合情況下的信號削波,輸出信號114不會發(fā)生削波。還可以根據(jù)PRL(未示出)調(diào)整經(jīng)解碼的音頻信號120的幅值。在增益值11還考慮如結(jié)合圖6討論的RF模式中的IldB提升的情況下, 音頻信號120可被提升IldB而不發(fā)生削波(在信號下混合情況以及沒有信號下混合情況兩者中)。
權(quán)利要求
1.一種用于保護從數(shù)字音頻數(shù)據(jù)得出的音頻信號免受信號削波的方法,該方法包括 -確定基于接收到的音頻元數(shù)據(jù)的第一增益值是否足夠保護音頻信號免受削波,接收到的音頻元數(shù)據(jù)被嵌在第一數(shù)字音頻流中;以及-在第一增益值不足夠的情況下,用足夠保護音頻信號免受削波的增益值替代對應(yīng)的第一增益值。
2.如權(quán)利要求1所述的方法,其中確定步驟包括步驟-基于數(shù)字音頻數(shù)據(jù)計算第二增益值,第二增益值對于音頻信號的削波保護是足夠的;以及-比較基于接收到的音頻元數(shù)據(jù)的第一增益值和計算出的第二增益值。
3.如權(quán)利要求2所述的方法,其中計算第二增益值的步驟包括 -確定最大允許增益值。
4.如權(quán)利要求2-3中任一個所述的方法,其中依賴于比較步驟,從第一增益值和計算出的第二增益值中選擇增益值,其中通過選擇第二計算增益值來執(zhí)行增益值替代。
5.如權(quán)利要求4所述的方法,其中選擇第一增益值和第二增益值對中的最小值。
6.如前面任一個權(quán)利要求所述的方法,其中在將以第一音頻編碼格式編碼的第一音頻流編碼轉(zhuǎn)換為以不同于第一音頻編碼格式的第二音頻編碼格式編碼的第二音頻流期間執(zhí)行該方法,第二音頻流包括具有足夠保護音頻信號免受削波的替代的增益值或具有從其得出的增益值的音頻元數(shù)據(jù)。
7.如前面任一個權(quán)利要求所述的方法,其中音頻信號是經(jīng)下混合的音頻信號,并且該方法保護經(jīng)下混合的信號免受信號削波。
8.如前面任一個權(quán)利要求所述的方法,其中確定第一增益值是否足夠保護的步驟包括以下步驟根據(jù)至少第一下混合方案下混合數(shù)字音頻數(shù)據(jù)。
9.如權(quán)利要求8所述的方法,其中確定第一增益值是否足夠保護的步驟包括以下步驟-計算峰值,其中通過確定一個時刻的至少兩個音頻信號的絕對值的最大值來計算峰值,該至少兩個音頻信號選自包含以下的組-根據(jù)第一下混合方案下混合之后的一個或多個音頻信號,-下混合之前的一個或多個音頻信號,以及-根據(jù)第二下混合方案下混合之后的一個或多個音頻信號。
10.如前面任一個權(quán)利要求所述的方法,其中確定第一增益值是否足夠保護的步驟包括以下步驟-確定從數(shù)字音頻數(shù)據(jù)得出的多個連續(xù)信號值的最大值。
11.如權(quán)利要求10所述的方法,其中確定第一增益值是否足夠保護的步驟包括以下步驟-計算峰值,其中通過確定一個時刻的至少兩個音頻信號的絕對值的最大值來計算峰值,該至少兩個音頻信號選自包含以下的組-根據(jù)第一下混合方案下混合之后的一個或多個音頻信號, -下混合之前的一個或多個音頻信號,以及-根據(jù)第二下混合方案下混合之后的一個或多個音頻信號,以及其中該多個連續(xù)信號值相應(yīng)于連續(xù)峰值或連續(xù)的經(jīng)濾波的峰值。
12.如權(quán)利要求10-11中任一個所述的方法,其中在將以第一音頻編碼格式編碼的第一音頻流編碼轉(zhuǎn)換為以不同于第一音頻編碼格式的第二音頻編碼格式編碼的第二音頻流期間執(zhí)行該方法,第二音頻流包括具有足夠保護音頻信號免受削波的替代的增益值或具有從其得出的增益值的音頻元數(shù)據(jù),以及其中,第二音頻流被以數(shù)據(jù)片段組織,以及確定與第二音頻流的片段相關(guān)聯(lián)的多個信號值的最大值。
13.如權(quán)利要求10-12中任一個所述的方法,其中最大信號值除以所確定的最大值。
14.如權(quán)利要求10-12中任一個所述的方法,其中取所確定的最大值的倒數(shù)。
15.如前面任一個權(quán)利要求所述的方法,其中在將以第一音頻編碼格式編碼的第一音頻流編碼轉(zhuǎn)換為以不同于第一音頻編碼格式的第二音頻編碼格式編碼的第二音頻流期間執(zhí)行該方法,第二音頻流包括具有足夠保護音頻信號免受削波的替代的增益值或具有從其得出的增益值的音頻元數(shù)據(jù),以及其中第一音頻流被以數(shù)據(jù)片段組織,第一音頻流的每個數(shù)據(jù)片段接收至少一個增益值, 第二音頻流被以數(shù)據(jù)片段組織,以及該方法還包括以下步驟 重新采樣第一音頻流的增益值。
16.如前面任一個權(quán)利要求所述的方法,其中在將以第一音頻編碼格式編碼的第一音頻流編碼轉(zhuǎn)換為以不同于第一音頻編碼格式的第二音頻編碼格式編碼的第二音頻流期間執(zhí)行該方法,第二音頻流包括具有足夠保護音頻信號免受削波的替代的增益值或具有從其得出的增益值的音頻元數(shù)據(jù),并且其中第一音頻流被以數(shù)據(jù)片段組織,第一音頻流的每個數(shù)據(jù)片段接收至少一個增益值, 第二音頻流被以數(shù)據(jù)片段組織,以及該方法還包括步驟-確定第一音頻流的多個連續(xù)增益值的最小值。
17.如權(quán)利要求16所述的方法,其中該多個連續(xù)增益值中的每一個具有影響區(qū)域,并且這些增益值的影響區(qū)域與第二流中的增益值的影響區(qū)域重疊。
18.如前面任一個權(quán)利要求所述的方法,其中在第一音頻流中沒有與動態(tài)范圍控制有關(guān)的元數(shù)據(jù)的情況下,添加足夠保護音頻信號免受削波的增益值。
19.如權(quán)利要求18所述的方法,其中在將以第一音頻編碼格式編碼的第一音頻流編碼轉(zhuǎn)換為以不同于第一音頻編碼格式的第二音頻編碼格式編碼的第二音頻流期間執(zhí)行該方法,第二音頻流包括具有足夠保護音頻信號免受削波的替代的增益值或具有從其得出的增益值的音頻元數(shù)據(jù),以及其中在第一音頻流中沒有與動態(tài)范圍控制有關(guān)的元數(shù)據(jù)的情況下,在第二音頻流中添加足夠保護音頻信號免受削波的增益值。
20.如權(quán)利要求18-19中任一個所述的方法,其中添加的增益值局限于最大增益1。
21.如權(quán)利要求20所述的方法,該方法包括基于數(shù)字音頻數(shù)據(jù)計算第二增益值的步驟,第二增益值足夠保護音頻信號免受削波,其中在對應(yīng)的所計算出的第二增益值具有低于1的增益的情況下,添加的增益值相應(yīng)于所計算出的第二增益值;以及在對應(yīng)的所計算出的第二增益值具有高于1的增益的情況下,添加的增益值相應(yīng)于增益1 O
22.如權(quán)利要求2-21中任一個所述的方法,其中使用平滑化濾波器產(chǎn)生第二增益值。
23.一種用于保護從數(shù)字音頻數(shù)據(jù)得出的音頻信號免受信號削波的設(shè)備,該設(shè)備包括-確定裝置,用于確定基于接收到的音頻元數(shù)據(jù)的第一增益值是否足夠保護音頻信號免受削波,接收到的音頻元數(shù)據(jù)被嵌在第一數(shù)字音頻流中;以及-替代裝置,用于在第一增益值不足夠保護的情況下,用足夠保護音頻信號免受削波的增益值替代第一增益值。
24.如權(quán)利要求23所述的設(shè)備,其中確定裝置包括-計算裝置,用于基于數(shù)字音頻數(shù)據(jù)計算第二增益值,第二增益值足夠保護音頻信號免受削波;以及-比較裝置,用于比較基于接收到的音頻元數(shù)據(jù)的第一增益值和所計算出的第二增益值。
25.如權(quán)利要求23-24中任一個所述的設(shè)備,其中該設(shè)備是編碼轉(zhuǎn)換器的一部分,該編碼轉(zhuǎn)換器被配置用于將以第一音頻編碼格式編碼的第一音頻流編碼轉(zhuǎn)換為以不同于第一音頻編碼格式的第二音頻編碼格式編碼的第二音頻流,第二音頻流包括具有足夠保護音頻信號免受削波的替代的增益值或具有從其得出的增益值的音頻元數(shù)據(jù)。
26.如權(quán)利要求23-25中任一個所述的設(shè)備,其中音頻信號是經(jīng)下混合的音頻信號,并且該設(shè)備保護經(jīng)下混合的信號免受信號削波。
27.—種編碼轉(zhuǎn)換器,被配置用于將以第一音頻編碼格式編碼的第一音頻流編碼轉(zhuǎn)換為以第二音頻編碼格式編碼的第二音頻流,該編碼轉(zhuǎn)換器包括如權(quán)利要求23-26中任一個所述的設(shè)備。
28.如權(quán)利要求27所述的編碼轉(zhuǎn)換器,其中第一音頻流是數(shù)字廣播信號。
29.一種用于保護從數(shù)字音頻數(shù)據(jù)得出的音頻信號免受信號削波的方法,其中在將以第一音頻編碼格式編碼的第一音頻流編碼轉(zhuǎn)換為以不同于第一音頻編碼格式的第二音頻編碼格式編碼的第二音頻流期間執(zhí)行該方法,并且其中在第一音頻流中不存在與動態(tài)范圍控制相關(guān)的元數(shù)據(jù)的情況下,將足夠保護音頻信號免受削波的增益值添加到第二音頻流中。
30.如權(quán)利要求1-22中任一個所述的方法,其中在將以第一音頻編碼格式編碼的第一音頻流編碼轉(zhuǎn)換為以不同于第一音頻編碼格式的第二音頻編碼格式編碼的第二音頻流期間執(zhí)行該方法,第二音頻流包括具有足夠保護音頻信號免受削波的替代的增益值或具有從其得出的增益值的音頻元數(shù)據(jù),以及其中-第一音頻編碼格式是AAC或HE-AAC,以及 -第二音頻編碼格式是Dolby Digital。
31.如權(quán)利要求30的方法,其中第一音頻流是DVB視頻/音頻流的一部分。
32.如權(quán)利要求9所述的方法,其中在將以第一音頻編碼格式編碼的第一音頻流編碼轉(zhuǎn)換為以不同于第一音頻編碼格式的第二音頻編碼格式編碼的第二音頻流期間執(zhí)行該方法,第二音頻流包括具有足夠保護音頻信號免受削波的替代的增益值或具有從其得出的增益值的音頻元數(shù)據(jù),以及其中-第二音頻流被以數(shù)據(jù)塊組織,-嵌入第一音頻流的音頻元數(shù)據(jù)包括指示音頻內(nèi)容的響度的元數(shù)據(jù),以及 -基于數(shù)字音頻數(shù)據(jù)計算第二增益值,第二增益值對于音頻信號的削波保護是足夠的, 第二增益值的計算包括確定第二音頻流的數(shù)據(jù)塊的多個峰值的最大值;以及根據(jù)指示音頻內(nèi)容的響度的元數(shù)據(jù)對該最大值進行電平調(diào)整,以及 -比較基于接收到的音頻元數(shù)據(jù)的第一增益值和計算出的第二增益值。
33.如權(quán)利要求32所述的方法,其中指示音頻內(nèi)容的響度的元數(shù)據(jù)是節(jié)目基準電平元數(shù)據(jù)。
34.如權(quán)利要求32或33所述的方法,其中-第一音頻流包括用于第一模式的增益元數(shù)據(jù)和用于第二模式的不同的增益元數(shù)據(jù), 其中第二模式允許高于第一模式的動態(tài)范圍壓縮;-基于經(jīng)電平調(diào)整的最大值計算用于第一模式的第二增益值,用于第一模式的第二增益值對于第一模式中的削波保護是足夠的;-比較用于第一模式的基于接收到的音頻元數(shù)據(jù)的增益值和計算出的用于第一模式的第二增益值;-通過將經(jīng)電平調(diào)整的最大值放大lldB,計算用于第二模式的第二增益值,用于第二模式的第二增益值對于第二模式中的削波保護是足夠的;-比較用于第二模式的基于接收到的音頻元數(shù)據(jù)的增益值和計算出的用于第二模式的第二增益值。
35.如權(quán)利要求9所述的方法,其中在將以第一音頻編碼格式編碼的第一音頻流編碼轉(zhuǎn)換為以不同于第一音頻編碼格式的第二音頻編碼格式編碼的第二音頻流期間執(zhí)行該方法,第二音頻流包括具有足夠保護音頻信號免受削波的替代的增益值或具有從其得出的增益值的音頻元數(shù)據(jù),以及其中-第二音頻流被以數(shù)據(jù)塊組織,-第一音頻流包括用于第一模式的增益元數(shù)據(jù)和用于第二模式的不同的增益元數(shù)據(jù), 其中第二模式允許高于第一模式的動態(tài)范圍壓縮;-基于最大值計算用于第一模式的第二增益值,其中該最大值是第二音頻流的數(shù)據(jù)塊的多個峰值的最大值,并且其中用于第一模式的第二增益值對于第一模式中的削波保護是足夠的;-比較用于第一模式的基于接收到的音頻元數(shù)據(jù)的增益值和計算出的用于第一模式的第二增益值;-通過將該最大值或依賴于該最大值的值放大lldB,計算用于第二模式的第二增益值,用于第二模式的第二增益值對于第二模式中的削波保護是足夠的;和-比較用于第二模式的基于接收到的音頻元數(shù)據(jù)的增益值和計算出的用于第二模式的第二增益值。
36.如權(quán)利要求34或35所述的方法,其中通過從塊速率下采樣到幀速率,計算用于第二模式的第二增益值。
37.如權(quán)利要求36所述的方法,其中通過對于總數(shù)為6個的連續(xù)塊確定計算出的增益值的最小值,執(zhí)行下采樣。
全文摘要
本發(fā)明描述了在利用接收到的音頻元數(shù)據(jù)來保護免受信號削波不被保證時防止音頻信號的削波的方法和設(shè)備。該方法可被用于針對將多通道信號下混合為立體聲信號情況防止削波。根據(jù)該方法,確定基于接收到的音頻元數(shù)據(jù)的第一增益值(4)是否足夠保護音頻信號免受削波。音頻元數(shù)據(jù)被嵌入第一音頻流(1)。在第一增益值(4)不足夠保護的情況下,用足夠保護音頻信號免受削波的增益值替代對應(yīng)的第一增益值(4)。優(yōu)選地,在第一音頻流(1)中不存在與動態(tài)范圍控制有關(guān)的元數(shù)據(jù)的情況下,該方法可添加足夠保護信號免受削波的增益值。
文檔編號G10L19/00GK102203854SQ200980142689
公開日2011年9月28日 申請日期2009年10月26日 優(yōu)先權(quán)日2008年10月29日
發(fā)明者A·格羅舍爾, W·A·席爾德巴赫 申請人:杜比國際公司