專利名稱:音頻信號(hào)壓縮的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻信號(hào)壓縮。
背景技術(shù):
國(guó)際專利申請(qǐng)WO98/16014公布了一種用于數(shù)據(jù)壓縮音頻信號(hào)的數(shù)據(jù)壓縮裝置。該數(shù)據(jù)壓縮裝置包括用于接收音頻信號(hào)的輸入終端,用于模/數(shù)(A/D)轉(zhuǎn)換音頻信號(hào)以獲得比特流信號(hào)的一比特模/數(shù)轉(zhuǎn)換器,用于對(duì)比特流信號(hào)實(shí)施無(wú)損數(shù)據(jù)壓縮步驟以獲得數(shù)據(jù)壓縮的比特流信號(hào)的無(wú)損編碼器,以及用于提供數(shù)據(jù)壓縮的比特流信號(hào)的輸出終端。另外,還公布了包括數(shù)據(jù)壓縮裝置的記錄裝置和傳送裝置。此外,還公布了用于對(duì)該數(shù)據(jù)壓縮裝置提供的數(shù)據(jù)壓縮的比特流信號(hào)進(jìn)行數(shù)據(jù)擴(kuò)展的數(shù)據(jù)擴(kuò)展裝置,以及包括該數(shù)據(jù)擴(kuò)展裝置的復(fù)制裝置和接收裝置。
發(fā)明內(nèi)容
本發(fā)明的一個(gè)目的是在音頻壓縮中提供優(yōu)化的壓縮增益估計(jì)。為了該目的,本發(fā)明提供了如獨(dú)立權(quán)利要求中所定義的用于估計(jì)壓縮增益的方法和裝置,記錄裝置和發(fā)送器。在從屬權(quán)利要求中定義的優(yōu)選的實(shí)施例。
壓縮增益估計(jì)可以用于創(chuàng)作和/或編輯例如樂(lè)曲的音頻信號(hào)序列。它也可以用于控制信號(hào)處理參數(shù),例如通過(guò)壓縮編碼的壓縮比例的自適應(yīng)控制,從而,通過(guò)對(duì)存儲(chǔ)或記錄在存儲(chǔ)或記錄媒體上的數(shù)據(jù)量的快速估計(jì),來(lái)允許在諸如超級(jí)音頻致密光盤(pán)(SACD)這樣的最大存儲(chǔ)內(nèi)容有限的記錄媒體中記錄像樂(lè)曲這樣的內(nèi)容。
理論上,預(yù)計(jì)通過(guò)使用對(duì)像樂(lè)曲這樣的音頻信號(hào)序列的一個(gè)小片斷的平均實(shí)際壓縮比例或編碼增益作為整個(gè)序列的壓縮比例的指示,從而產(chǎn)生這樣一個(gè)估計(jì)。然而,這種方法的問(wèn)題是,樂(lè)曲形式的典型音頻信號(hào)序列的壓縮比例變化大或編碼增益變化有明顯的短時(shí)間相關(guān)性,從而必須使用該信號(hào)序列的極少部分來(lái)獲得具有所需精確度和準(zhǔn)確度的壓縮比例估計(jì)。由于計(jì)算需要時(shí)間,這樣的解決方案不適用。
根據(jù)本發(fā)明的第一方案,提取包括在音頻信號(hào)的一個(gè)選定的頻帶中的信號(hào)功率可獲得良好的壓縮增益估計(jì),并用該提取的信號(hào)功率的相關(guān)性獲得所述估計(jì)。本發(fā)明的該方案是基于洞察到使用在音頻信號(hào)的信號(hào)功率和壓縮增益之間的相關(guān)性可以得到該壓縮比例或編碼增益的快速估計(jì)。該方案在例如直接流數(shù)字格式這樣的無(wú)損壓縮一比特比特流信號(hào)中特別有益。
注意,在標(biāo)準(zhǔn)脈沖編碼調(diào)制(PCM)編碼中,眾所周知可獲得編碼增益與在該信號(hào)功率中的結(jié)構(gòu)的等級(jí)(平直度)直接相關(guān)。但是,在本發(fā)明的所述方案中,使用了信號(hào)功率自身,而不是它的結(jié)構(gòu)。
后面,參考附圖將進(jìn)一步解釋本發(fā)明,其中,圖1是一個(gè)描述在音頻信號(hào)的選定頻帶中壓縮增益和信號(hào)功率的關(guān)系曲線圖。
圖2是根據(jù)本發(fā)明的信號(hào)處理裝置的實(shí)施例的數(shù)字式音頻信號(hào)記錄或發(fā)送鏈的簡(jiǎn)化方框圖,并且圖3是在圖2的方框圖中的信號(hào)處理器中使用的一個(gè)第五級(jí)西革馬—德?tīng)査{(diào)制器的簡(jiǎn)化拓仆圖。
具體實(shí)施例方式
盡管對(duì)無(wú)損編碼器的研究已經(jīng)證明,在音頻信號(hào)頻帶自身中,例如0到20KHz,壓縮比例作為信號(hào)功率的函數(shù)存在一個(gè)相對(duì)平坦的響應(yīng)曲線,在音頻信號(hào)頻帶外的一個(gè)信號(hào)頻帶,例如圖1所說(shuō)明的從20kHz到50kHz的信號(hào)頻帶,得到壓縮增益cg與信號(hào)功率sp的關(guān)系曲線中有一個(gè)非常陡峭的響應(yīng)。
在圖2的方框圖中描述的信號(hào)處理裝置中,這個(gè)獨(dú)特的相關(guān)性被用于通過(guò)無(wú)損編碼得到的壓縮比例或編碼增益的估計(jì)。一個(gè)可以是模擬或數(shù)字式信號(hào)的輸入音頻信號(hào)提供給信號(hào)處理器1,根據(jù)由參數(shù)控制裝置2確定的至少一個(gè)可變處理參數(shù)處理在信號(hào)處理器1中的輸入音頻信號(hào)。在說(shuō)明例中,由控制裝置2產(chǎn)生的控制信號(hào)控制自適應(yīng)西革馬—德?tīng)査{(diào)制器3的適應(yīng)性,該西革馬—德?tīng)査{(diào)制器3產(chǎn)生例如一比特比特流信號(hào)的所謂的DSD(直接流數(shù)字式)格式的數(shù)據(jù)流信號(hào)作為從信號(hào)處理器1提供到無(wú)損編碼器4的輸出信號(hào)。改變用于控制信號(hào)處理器1的可變參數(shù)對(duì)從編碼器4中獲得的壓縮增益有顯著的影響,其結(jié)果是,大大影響記錄在如圖2所描述的數(shù)字視頻磁盤(pán)5(DVD)的超級(jí)音頻致密光盤(pán)(SACD)的記錄媒體所記錄或存儲(chǔ)的數(shù)據(jù)量。參見(jiàn)與同本申請(qǐng)有相同優(yōu)先權(quán)日的相同申請(qǐng)人的標(biāo)題為"音頻信號(hào)處理"的待審查專利申請(qǐng)。
根據(jù)本發(fā)明的一個(gè)實(shí)施例,如圖1所描述的在直接流數(shù)字式(DSD)格式信號(hào)中的比特流信號(hào)的信號(hào)功率同壓縮增益之間的相關(guān)性用于提供編碼增益的快速而準(zhǔn)確的估計(jì)。如圖所示,該信號(hào)功率可以用連接到信號(hào)處理器1輸出的一個(gè)提取與相關(guān)裝置6從該比特流信號(hào)中提取,并提供壓縮比例或編碼增益估計(jì)作為到參數(shù)控制裝置2的輸入控制信號(hào)。
如圖所示,該信號(hào)處理器1的參數(shù)控制組件通常是自適應(yīng)西革馬—德?tīng)査{(diào)制器3,并且可以使用幾種方式來(lái)適應(yīng)或修改該西革馬—德?tīng)査{(diào)制器的結(jié)構(gòu),例如在不同級(jí)數(shù)的西革馬—德?tīng)査{(diào)制器結(jié)構(gòu)之間或者在調(diào)制器的高頻噪聲中建立的結(jié)構(gòu)之間漂移。
這樣,通過(guò)在第3級(jí)、第5級(jí)或第7級(jí)調(diào)制器結(jié)構(gòu)之間的漂移就可以獲得的壓縮比范圍從第3級(jí)結(jié)構(gòu)的3.7到第7級(jí)結(jié)構(gòu)的2.3或更低,并且該壓縮比例可以被用于對(duì)從編碼器4出來(lái)的壓縮比特流信號(hào)中的數(shù)據(jù)量整形,以適合如DVD5這樣的記錄媒體的有限的記錄或存儲(chǔ)容量。
圖3的框圖顯示了一個(gè)在圖2中的信號(hào)處理器1使用的第五級(jí)西革馬—德?tīng)査{(diào)制器的優(yōu)選拓仆圖。該圖示的拓仆圖是基于一個(gè)多諧振器結(jié)構(gòu),其中在諧振器R1,R2,…R5的反饋回路的系數(shù)c1,c2,…c5確定該回路濾波器的極點(diǎn)(或者噪聲轉(zhuǎn)移函數(shù)的零點(diǎn))。盡管該圖示的拓仆圖是用于5級(jí)調(diào)制器,增加另一個(gè)諧振器結(jié)構(gòu),同樣的拓仆圖可以被用于7級(jí)調(diào)制器。
在這樣的一個(gè)西革馬—德?tīng)査{(diào)制器的普通設(shè)計(jì)中,極點(diǎn)通常位于音頻頻帶內(nèi),但是根據(jù)本發(fā)明推薦在音頻頻帶外有至少一個(gè)極點(diǎn),以在該西革馬—德?tīng)査l譜的高頻部分產(chǎn)生附加結(jié)構(gòu),否則該西革馬—德?tīng)査l譜的高頻部分幾乎是平的。
這樣,盡管在西革馬—德?tīng)査{(diào)制器的標(biāo)準(zhǔn)設(shè)計(jì)中極點(diǎn)通常位于8.7,15.7和19.5kHz,根據(jù)本發(fā)明,最后一個(gè)極點(diǎn)推薦從20kHz區(qū)域漂移到一個(gè)更高頻率區(qū)域,例如300kHz以上,這樣將導(dǎo)致壓縮比例的顯著增加。雖然這樣做可能伴隨有信/噪比性能的輕微減小,但是由于額外的噪聲引入到人耳敏感性差的頻帶的高端,因此,它通常是可以接受的。
將極點(diǎn)位置從20kHz區(qū)域漂移到更高頻率可以由在現(xiàn)有調(diào)制器結(jié)構(gòu)中增加單獨(dú)的額外的帶通濾波器實(shí)現(xiàn),例如與低通回路濾波器并聯(lián)。在這樣的并聯(lián)濾波器中使用一個(gè)二級(jí)巴特沃茲(Butter-Worth)帶通濾波器,可以使壓縮增益顯著增加,修改后的調(diào)制器對(duì)大輸入保持穩(wěn)定,并且,與未修改的調(diào)制器相比,在音頻頻帶的信/噪比性能幾乎保持不變。
考慮到在不同的西革馬—德?tīng)査{(diào)制器結(jié)構(gòu)之間漂移可能引起在比特流信號(hào)的特定頻帶的信號(hào)功率和壓縮比例或編碼增益之間對(duì)應(yīng)關(guān)系的變化,從而可能影響到用于作為估計(jì)壓縮比例的基礎(chǔ)的相關(guān)性這樣的事實(shí),使用一個(gè)初始校準(zhǔn)過(guò)程來(lái)固定該相關(guān)性可能有益。
為了這一目的,可以如圖2中用虛線顯示的框7所示加入一個(gè)固定的西革馬—德?tīng)査{(diào)制器作為一個(gè)在無(wú)損編碼器4前的最終處理裝置。這樣,該信號(hào)功率最好從固定的西革馬—德?tīng)査{(diào)制器7提供給無(wú)損編碼器4的信號(hào)中提取。
盡管上面描述并在圖2顯示的信號(hào)處理器實(shí)施例中使用了一個(gè)自適應(yīng)西革馬—德?tīng)査{(diào)制器,它根據(jù)從比特流信號(hào)的信號(hào)功率獲取的相關(guān)性來(lái)適應(yīng)或修改壓縮比例或編碼增益,也可以單獨(dú)或組合使用其他方法,例如在信號(hào)處理器中的自適應(yīng)或固定西革馬—德?tīng)査{(diào)制器之前加入一個(gè)有限帶寬低通濾波器,以減少信號(hào)電平。
而且,實(shí)現(xiàn)根據(jù)本發(fā)明的實(shí)施例的方法的一個(gè)信號(hào)處理裝置自身不必包括壓縮編碼裝置,因?yàn)閴嚎s比例估計(jì)從隨后的壓縮編碼可以獲得,可以單獨(dú)使用,例如在錄音室環(huán)境中純粹為了評(píng)價(jià),格式化,創(chuàng)作和/或編輯一個(gè)音頻信號(hào)序列。
注意,上面提及的實(shí)施例只是為了說(shuō)明發(fā)明而非限定本發(fā)明,并且本領(lǐng)域普通技術(shù)人員能夠沒(méi)有脫離本發(fā)明的權(quán)利要求限定的發(fā)明范圍設(shè)計(jì)許多其他實(shí)施例。在權(quán)利要求中,任何置于括號(hào)內(nèi)的參考符號(hào)不應(yīng)該被解釋為對(duì)本發(fā)明的限制。單詞"包括"不是不包括那些在權(quán)利要求書(shū)中沒(méi)列出的其他元素或步驟。本發(fā)明可以由包括幾個(gè)獨(dú)立元件的硬件實(shí)現(xiàn),也可以由合適的編程的計(jì)算機(jī)實(shí)現(xiàn)。權(quán)利要求所列舉的幾種方式的裝置中,可用一個(gè)相同的硬件單元來(lái)實(shí)施這些方式中的幾種,只有在少數(shù)情況下,不同從屬權(quán)利要求中所述的某些方法不表明不能有利地用這些方法的組合。
權(quán)利要求
1.估計(jì)在壓縮給定的音頻信號(hào)中可獲得的壓縮增益的方法,該方法包括以下步驟在給定的音頻信號(hào)的選定頻帶內(nèi)提取信號(hào)功率,并且通過(guò)與提取的信號(hào)功率的相關(guān)性獲得該壓縮增益的估計(jì)。
2.根據(jù)權(quán)利要求1所述的方法,其中,音頻信號(hào)是一比特噪聲整形數(shù)字信號(hào)。
3.根據(jù)權(quán)利要求1所述的方法,其中,壓縮是無(wú)損的。
4.根據(jù)權(quán)利要求1所述的方法,其中,所述選定的頻帶高于20kHz。
5.根據(jù)權(quán)利要求4所述的方法,其中,所述選定的頻帶是從20到50kHz。
6.在記錄媒體上記錄音頻信號(hào)的方法,該方法包括以下步驟壓縮音頻信號(hào)以獲得一個(gè)壓縮的音頻信號(hào),在記錄媒體上記錄壓縮的音頻信號(hào),該方法還包括在音頻信號(hào)的選定頻帶內(nèi)提取信號(hào)功率來(lái)估計(jì)在壓縮步驟中可獲得的一個(gè)壓縮增益,并且通過(guò)與提取的信號(hào)功率的相關(guān)性獲得壓縮增益的估計(jì),根據(jù)所述估計(jì)的壓縮增益控制所述壓縮。
7.根據(jù)權(quán)利要求6所述的方法,其中所述壓縮步驟包括響應(yīng)估計(jì)的壓縮增益通過(guò)自適應(yīng)噪音整形調(diào)制,把音頻信號(hào)轉(zhuǎn)換成為數(shù)字信號(hào),
8.發(fā)送音頻信號(hào)的方法,該方法包括以下步驟壓縮音頻信號(hào)以獲得壓縮的音頻信號(hào),通過(guò)傳送媒體傳送該壓縮的音頻信號(hào),該方法還包括通過(guò)在音頻信號(hào)的選定頻帶內(nèi)提取信號(hào)功率來(lái)估計(jì)在壓縮步驟中可獲得的壓縮增益,并且通過(guò)與提取的信號(hào)功率的相關(guān)性獲得該壓縮增益的估計(jì);根據(jù)所述估計(jì)的壓縮增益控制所述壓縮。
9.用于估計(jì)在壓縮給定音頻信號(hào)中可獲得的壓縮增益的裝置,該裝置包括在給定的音頻信號(hào)的選定頻帶內(nèi)提取信號(hào)功率的裝置,以及通過(guò)與提取的信號(hào)功率的相關(guān)性獲得該壓縮增益的估計(jì)的裝置。
10.用于在記錄媒體上記錄音頻信號(hào)的記錄裝置,該記錄裝置包括壓縮音頻信號(hào)以獲得壓縮的音頻信號(hào)的裝置,在記錄媒體上記錄該壓縮的音頻信號(hào)的裝置,記錄裝置還包括根據(jù)權(quán)利要求9所述的用于估計(jì)在壓縮中可獲得的壓縮增益的裝置,根據(jù)所述估計(jì)的壓縮增益控制所述壓縮的裝置。
11.用于傳送音頻信號(hào)的傳送器,該傳送器包括壓縮音頻信號(hào)以獲得壓縮的音頻信號(hào)的裝置,通過(guò)傳送媒體傳送壓縮的音頻信號(hào)的裝置,該傳送器還包括根據(jù)權(quán)利要求9所述的用于估計(jì)在壓縮中可獲得的壓縮增益的裝置,根據(jù)所述估計(jì)的壓縮增益控制所述壓縮過(guò)程的裝置。
全文摘要
估計(jì)在壓縮給定的音頻信號(hào)中可獲得的壓縮增益,包括提取給定音頻信號(hào)在選定頻帶上的信號(hào)功率,以及通過(guò)與提取信號(hào)功率的相關(guān)性獲取該壓縮增益的估計(jì)。
文檔編號(hào)G10L19/00GK1388965SQ01802647
公開(kāi)日2003年1月1日 申請(qǐng)日期2001年9月6日 優(yōu)先權(quán)日2000年9月8日
發(fā)明者D·雷夫曼, P·A·C·M·尼藤 申請(qǐng)人:皇家菲利浦電子有限公司