欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

雙重兼容無損音頻帶寬擴展的制作方法

文檔序號:2827192閱讀:257來源:國知局
雙重兼容無損音頻帶寬擴展的制作方法
【專利摘要】用于較高采樣率的數(shù)字音頻信號的編碼器構(gòu)建了為用戶發(fā)行的較低采樣率的流,具有用于在沒有解碼器情況下的標(biāo)準(zhǔn)PCM播放器的兼容性。結(jié)合適合的解碼器,支持兩個改進的重放選項,第一個選項允許噪聲整形的較高采樣率信號的完整無損重建,第二個選項在即使介入傳輸鏈已經(jīng)截去了編碼器的輸出信號的最不重要比特的情況下也允許有損帶寬擴展。
【專利說明】雙重兼容無損音頻帶寬擴展

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)字音頻信號,特別是提供與標(biāo)準(zhǔn)PCM重放兼容的無損帶寬擴展方 案。

【背景技術(shù)】
[0002] 許多挑剔的發(fā)燒友和音樂家需要'高分辨率'數(shù)字音頻,通常理解為以明顯高于 44.IkHz或48kHz的當(dāng)前媒體的頻率采集并以優(yōu)于16比特的分辨率量化的優(yōu)質(zhì)音頻。
[0003] 有損壓縮音頻在消費市場上是司空見慣的,但是經(jīng)驗導(dǎo)致許多人懷疑有損壓縮音 頻,甚至懷疑宣稱'透明'的系統(tǒng)。對于恒定位深,普通非適應(yīng)性的噪聲形抖動再量化是一 個例外。通過適當(dāng)?shù)念A(yù)防措施,這相當(dāng)于(根據(jù)輸入和輸出之間差別的一階和二階統(tǒng)計 量)添加恒定的噪聲(參見J.Vanderkooy和S.P.Lipshitz,"DigitalDither:Signal ProcessingwithResolutionFarbelowtheLeastSignificantBit(數(shù)字抖動:通過 遠低于最低有效位的分辨率進行的信號處理)"inProc.AES7thInt.Conf.onAudioin DigitalTimes(Toronto,Ont.,Canada, 1989),pp. 87 - 96.),以幾十年的模擬和數(shù)字媒體 的經(jīng)驗來看是"有利的"。
[0004] 兩種音樂發(fā)行媒體支配了大眾化市場:具有44.IkHz采樣頻率和16比特位深的壓 縮光盤(CD),和通常通過計算機或個人播放器收聽的網(wǎng)絡(luò)下載。雖然大多數(shù)下載是有損壓 縮的,但計算機或播放器幾乎總能夠以44.IkHz和48kHz的采樣頻率處理未壓縮的PCM(脈 沖編碼調(diào)制)信號。雖然一些個人播放器限制在16比特,但還是有不少能夠處理24比特 的位深。
[0005] 以發(fā)燒版本(通常具有96kHz的采樣頻率)和能夠在大眾市場播放器上播放 的格式發(fā)行錄音是沒有商業(yè)吸引力的。對于可在標(biāo)準(zhǔn)大眾市場播放器上播放、并且包含 允許特殊解碼器讀取額外帶寬的隱藏信息的錄音,以前已多次探索過發(fā)行的可能性,包 括KomamuraMITSUYAK0MAMURA"Wide_BandandWide-Dynamic-RangeRecordingand ReproductionofDigitalAudio(數(shù)字音頻的寬帶和寬動態(tài)范圍記錄和再現(xiàn))"J.Audio Eng.soc.Vol. 43,No. 1/2, 1995January/February)。然而,到目前為止,沒人提供過標(biāo)準(zhǔn)PCM 重放兼容性來滿足無損讀取更高采樣率的原始信號的需求,也沒人考慮過解碼器如何可以 兩個不同位深(例如兼容16-bit和24-bit的播放器)向聽眾提供最佳體驗。


【發(fā)明內(nèi)容】

[0006] 根據(jù)本發(fā)明第一方面,無損音頻編碼器適合接收第一采樣率的輸入數(shù)字音頻信 號,并且由此產(chǎn)生包括多個樣本并具有低于第一采樣率的第二采樣率的PCM數(shù)字音頻輸 出,其中:
[0007] 多個樣本的每一個都具有較重要部分和次要部分;
[0008] 較重要部分和次要部分共同包括允許第一解碼器無損還原輸入數(shù)字音頻信號的 信息;
[0009]當(dāng)解譯為標(biāo)準(zhǔn)PCM流時,較重要部分提供具有縮減的帶寬的輸入數(shù)字音頻信號版 本的有損表達;以及
[0010] 較重要部分包括允許第二解碼器還原輸入數(shù)字音頻信號的有損表達的信息,輸入 數(shù)字音頻信號的有損表達具有的帶寬大于所述的縮減的帶寬。
[0011] 未設(shè)計用于本發(fā)明的標(biāo)準(zhǔn)"傳統(tǒng)"PCM重放設(shè)備通常只接收或播放本文稱為"較重 要部分"的頂部16比特,音頻流的每個樣本以通常為44.IkHz或48kHz的第二采樣率采樣, 該設(shè)備會將有損表達提供給使用大約0-20kHz帶寬的聽眾。第二解碼器允許從同樣16-bit 的44.IkHz或48kHz流處復(fù)制擴展帶寬。第一解碼器通常期望接收24-bit流,并且這樣也 可以使用每個樣本的"次要部分",即超過第16個的比特。這個額外的信息允許無損還原以 較高的第一采樣率如88kHz或96kHz存在的輸入音頻信號,并從而具有較寬的音頻帶寬如 0-40kHz。
[0012] 優(yōu)選地,第一有損表達是輸入音頻信號的準(zhǔn)確表達,而不是非時變?yōu)V波、降低采樣 率以及強加非時變本底噪聲的再量化的效果。如果所有量化,包括那些降低采樣率的量化, 都表現(xiàn)為恒定位深并帶有適當(dāng)抖動,則"有損"表達能夠相當(dāng)于CD質(zhì)量的標(biāo)準(zhǔn),而且在幾年 前只會認(rèn)為是"發(fā)燒友"復(fù)制品。這與傳統(tǒng)的"有損編解碼"形成了鮮明對比,傳統(tǒng)有損編 解碼動態(tài)適應(yīng)頻譜本底噪聲,有時還要動態(tài)適應(yīng)帶寬以響應(yīng)輸入信號。
[0013] 優(yōu)選地,輸入數(shù)字音頻信號耦合到具有高頻輸出和低頻輸出的無損頻帶分割器。 此外,優(yōu)選地,無損頻帶分割器的高頻輸出耦合到具有壓縮輸出和修改輸出的有損壓縮單 元,根據(jù)壓縮輸出和頻帶分割器的低頻輸出導(dǎo)出較重要部分,而根據(jù)修改輸出導(dǎo)出次要部 分。
[0014] 無損頻帶分割器是分開處理通常分兩部分的原始信號頻譜的關(guān)鍵,下半部表達為 PCM而上半部表達為壓縮格式。
[0015] 在一些實施方式中,每個較重要部分包括16個二進制比特。在一些實施方式中, 每個次要部分包括8個二進制比特。
[0016] 在一些實施方式中,第二采樣率為第一采樣率的一半。特別優(yōu)選地,第二采樣率包 括 48kHz和 44.IkHz。
[0017] 在本發(fā)明的編碼器中,第二解碼器可還原與對應(yīng)第一采樣率的Nyquist頻率相等 的音頻帶寬??商鎿Q地,第二解碼器可還原與對應(yīng)第一采樣率的Nyquist頻率的四分之三 相等的帶寬。
[0018] 術(shù)語"Nyquist頻率"正常理解為數(shù)字系統(tǒng)采樣率的一半。因此通常若第一采樣率 為96kHz,第二采樣率為48kHz,則對應(yīng)第一采樣率的Nyquist頻率也為48kHz且第二解碼 器將提供不超過該Nyquist頻率的信號的有損復(fù)制,即48kHz??商娲呐渲迷试S第二解碼 器提供不超過36kHz的有損復(fù)制,優(yōu)點是在0-24kHz范圍內(nèi)稍低的本底噪聲。
[0019] 在一些實施方式中,根據(jù)由有損壓縮單元的修改輸出饋給的無損壓縮器的輸出來 導(dǎo)出次要部分。無損壓縮器優(yōu)化了在最不重要單元中的比特的使用??商娲?,如果修改 輸出已經(jīng)是壓縮的或"封包的"形式,則不需要單獨的無損壓縮器。
[0020] 也可根據(jù)頻帶分割器的低頻輸出導(dǎo)出次要部分。這允許第一解碼器無損還原與頻 帶分割器的低頻輸出完全輸送到較重要部分相比量化更細(xì)致的原始信號。
[0021] 優(yōu)選地,無損頻帶分割器的低頻輸出耦合到分割器,該分割器的第一輸出耦合到 較重要部分而第二輸出耦合到次要部分。優(yōu)選地,分割器包括噪聲整形濾波器。分割器將 頻帶分割器LF輸出的量化的且優(yōu)選地噪聲整形的表達提供給較重要部分,而其第二輸出 允許第一解碼器還原由量化去除的信息。
[0022] 在一些實施方式中,優(yōu)選地,根據(jù)減法器的輸出導(dǎo)出較重要部分中的多個比特,該 減法器具有與無損頻帶分割器低頻輸出耦合的第一輸入和與有損壓縮單元的壓縮輸出耦 合的第二輸入。為了支持第二解碼器的操作,較重要部分必須包括壓縮輸出;而壓縮輸出為 數(shù)據(jù)信號而不是音頻信號,并且減法器的目的是補償該數(shù)據(jù)信號在傳統(tǒng)設(shè)備還原的音頻信 號上的效果。
[0023] 根據(jù)本發(fā)明的第二方面,提供包括與根據(jù)第一方面的無損音頻編碼器耦合的噪聲 整形器的裝置。通常,為了允許輸入信號以48kHz采樣頻率在24-bit輸出字符的約束下無 損輸送,該噪聲整形器運行于96kHz并縮減給編碼器的輸入信號字寬。
[0024] 根據(jù)本發(fā)明的第三方面,提供包括根據(jù)第一方面的無損音頻編碼器的裝置,其中 無損音頻編碼器與提供有水印輸出的無損可逆水印編碼器耦合,該裝置根據(jù)配置參數(shù)編 碼,水印編碼器將配置參數(shù)埋入解碼器使用的有水印的輸出中。
[0025] 該裝置還可包括提供經(jīng)量化的信號至無損音頻編碼器的輸入的噪聲整形器,其中 噪聲整形器量化到位深并且配置參數(shù)包括位深。此外,裝置可還包括選擇量化位深的選擇 器單元,以最大化音頻質(zhì)量而不超出次要部分的信息傳輸能力。
[0026] 通過這種方式,本發(fā)明提供了一種系統(tǒng),通過基帶PCM傳輸通道能夠傳送高質(zhì)量 寬帶寬信號,如果傳輸通道只傳送頂部16比特也表現(xiàn)良好,當(dāng)通過將信號解譯為基帶PCM 的傳統(tǒng)設(shè)備對編碼流進行解碼時,還提供了有限帶寬音頻的合理演繹。
[0027] 根據(jù)本發(fā)明的第四方面,提供了一種音頻解碼器,其適合接收PCM輸入數(shù)字音頻 信號,該PCM輸入數(shù)字音頻信號包括由根據(jù)第一方面的對應(yīng)的音頻編碼器生成的多個第二 采樣率的輸入樣本,音頻解碼器還適合由PCM輸入數(shù)字音頻信號生成輸出數(shù)字音頻信號, 該輸出信號具有高于第二采樣率的第一采樣率,其中:
[0028] 在0_5kHz的頻率區(qū)域,輸出數(shù)字音頻信號與比較信號之間的差別為用固定統(tǒng)計 數(shù)據(jù)進行頻譜整形的噪聲,其中通過濾波和重采樣到第一采樣率的操作由輸入數(shù)字音頻信 號生成比較信號;
[0029] 在0_5kHz的頻率區(qū)域,輸出數(shù)字音頻信號與第二輸出信號之間的差別為用固定 統(tǒng)計數(shù)據(jù)進行頻譜整形的噪聲,其中除了從每個樣本去除次要部分,當(dāng)與PCM輸入數(shù)字音 頻信號相同的信號被饋給至解碼器時生成第二輸出信號;以及
[0030] 輸出數(shù)字音頻信號是提供給編碼器的數(shù)字音頻輸入信號的精確副本。
[0031] 因此,第四方面的解碼器的目的是與根據(jù)第一方面的相應(yīng)編碼器一同使用,相應(yīng) 編碼器的輸出在解譯為純PCM信號時能夠滿足發(fā)燒友的標(biāo)準(zhǔn),如可頻譜整形但不隨時間變 化的本底噪聲。為了生成輸出信號,解碼器執(zhí)行濾波、重采樣和量化的操作。通過仿效解碼 器濾波和重采樣的操作可生成比較信號,但在高精度上沒有解碼器的量化。輸出數(shù)字信號 和比較信號之間的差別由此隔離了解碼器引入的量化人工產(chǎn)物。優(yōu)選地,既然輸入解碼器 的是滿足發(fā)燒友標(biāo)準(zhǔn)的信號,由此斷定比較信號也應(yīng)該滿足發(fā)燒友的標(biāo)準(zhǔn),所以比較信號 和輸出信號之間的差別應(yīng)該只包括滿足發(fā)燒友標(biāo)準(zhǔn)的量化人工產(chǎn)物,并因此相當(dāng)于用固定 統(tǒng)計數(shù)據(jù)進行頻譜整形的噪聲。這既可通過聽也可通過頻譜分析儀來測試。
[0032] 根據(jù)本發(fā)明的第五方面,提供了一種音頻解碼器,其適合接收PCM輸入數(shù)字音頻 信號,該信號包括多個第二采樣率的輸入樣本,由此生成的輸出數(shù)字音頻信號具有高于第 二采樣率的第一采樣率,該解碼器包括:
[0033] 無損頻帶接合器,具有高頻輸入和低頻輸入,該頻帶接合器提供輸出數(shù)字音頻信 號;以及
[0034] 解壓縮單元,具有有損輸入、修改輸入和輸出,該輸出耦合到無損頻帶接合器的高 頻輸入,
[0035] 其中:
[0036] 每個輸入樣本包括較重要部分和次要部分;
[0037] 根據(jù)較重要部分導(dǎo)出頻帶接合器的低頻輸入;
[0038] 根據(jù)較重要部分、但獨立于次要部分導(dǎo)出解壓縮單元的有損輸入;并且
[0039] 根據(jù)次要部分、但獨立于較重要部分導(dǎo)出解壓縮單元的修改輸入。
[0040] 為了逆向進行在相應(yīng)的編碼器中執(zhí)行的頻帶分割和壓縮的操作,要求有頻帶接合 器和解壓縮單元。完整無損的重建需要提供完整輸入樣本給解碼器,但也需要在次要部分 缺失時支持有損重建。為此,要從流的較重要部分饋給解壓縮有損輸入,還期望至頻帶接合 器的低頻輸入應(yīng)該基本上來自較重要部分,對于次要部分的任何依賴僅僅有助于改善低頻 信號的分辨率。
[0041] 優(yōu)選地,根據(jù)較重要部分中包括的全部比特導(dǎo)出頻帶接合器的低頻輸入。較重要 部分包括的比特饋給至解壓縮單元以提供高頻輸入至無損頻帶接合器。因此,在導(dǎo)出低頻 輸入時似乎自然排除了這些比特。這些比特會影響在標(biāo)準(zhǔn)PCM解碼器中解碼較重要部分的 傳統(tǒng)聽眾收聽的信號。然而,優(yōu)選地,允許那些比特有助于低頻輸入。編碼器能夠根據(jù)"缺 損性掩埋數(shù)據(jù)"的原理通過調(diào)整其他比特來補償這些比特,某種程度上造成了本發(fā)明的解 碼器和標(biāo)準(zhǔn)PCM解碼器之間的一致。
[0042] 優(yōu)選地,頻帶接合器的低頻輸入也基于次要部分。這允許在次要部分可用于解碼 器時,改善提供給頻帶接合器低頻輸入的信號分辨率。
[0043] 更優(yōu)選地,在0_5kHz的頻率區(qū)域,輸出數(shù)字音頻信號與比較信號之間的差別為用 固定統(tǒng)計數(shù)據(jù)進行頻譜整形的噪聲,其中通過濾波和重采樣到第一采樣率的操作由PCM輸 入數(shù)字音頻信號生成比較信號。因此,就本發(fā)明的第四方面而言,上文描述的優(yōu)點之一可與 本發(fā)明的第五方面提供的優(yōu)點相結(jié)合。
[0044] 優(yōu)選地,音頻解碼器適合接收通過相應(yīng)的音頻編碼器生成的信號,其中輸出數(shù)字 音頻信號是提供至該相應(yīng)音頻編碼器的數(shù)字音頻輸入信號的精確副本。
[0045] 通過這種方式,就本發(fā)明的第四方面而言,還有上文描述的另一優(yōu)點可與本發(fā)明 的第五方面提供的優(yōu)點相結(jié)合。
[0046] 如本領(lǐng)域技術(shù)人員將會理解的那樣,本發(fā)明的無損音頻編碼器可能進行其他調(diào) 整。另外,在其他方面,相應(yīng)的解碼器被考慮為包括編碼器和解碼器的通信系統(tǒng)。

【專利附圖】

【附圖說明】
[0047] 將參照附圖對本發(fā)明的示例進行詳細(xì)說明,在附圖中:
[0048] 圖IA示出帶有簡單有損帶寬擴展的現(xiàn)有技術(shù)的編碼器,并且
[0049] 圖IB示出對應(yīng)的解碼器;
[0050] 圖2A示出帶有改進的有損帶寬擴展的編碼器,并且
[0051] 圖2B示出對應(yīng)的解碼器;
[0052] 圖3A示出帶有簡單有損帶寬擴展的噪聲整形器和編碼器,并且圖3B示出對應(yīng)的 解碼器;
[0053] 圖4A示出使用提升的無損帶寬分割,并且圖4B示出對應(yīng)的頻帶接合;
[0054] 圖5A示出帶有簡單雙重兼容無損帶寬擴展的噪聲整形器和編碼器,并且圖5B示 出對應(yīng)的解碼器;
[0055] 圖6A示出帶有改進的雙重兼容無損帶寬擴展的噪聲整形器和編碼器,并且圖6B 示出對應(yīng)的解碼器;
[0056] 圖7A示出使用噪聲整形分割器的帶有雙重兼容無損帶寬擴展的噪聲整形器和編 碼器,并且圖7B示出對應(yīng)的使用噪聲整形接合器的解碼器;
[0057] 圖8A示出噪聲整形分割器,并且圖8B示出對應(yīng)的接合器;
[0058] 圖9示出用于圖7A的編碼器的一部分和噪聲整形分割器的替代配置。

【具體實施方式】[0059]有損帶寬擴展
[0060] 在You等人的美國專利6, 226, 161 "不失去解碼器兼容性而建立的低比特率音頻 編碼系統(tǒng)的音質(zhì)(SoundQualityofEstablishedLowBit-RateAudioCodingSystems withoutlossofDecoderCompatibility)"中描述了用于消費類音頻的商業(yè)化'可擴展' 傳輸系統(tǒng)。從建立將代表有損壓縮音頻信號的數(shù)據(jù)流封包到能夠通過標(biāo)準(zhǔn)SPDIF數(shù)字音頻 接口傳輸?shù)?6-bit字符中的系統(tǒng)開始,改進的系統(tǒng)提供了以與為原系統(tǒng)設(shè)計的解碼器兼 容的方式將還的"擴展流"封包到同樣的格式中以允許更高音質(zhì)的選項。然而,雖然SPDIF 經(jīng)常用于傳輸PCM流,但本文中'兼容性'涉及建立的專用解碼器的基礎(chǔ)結(jié)構(gòu),而不是適合 在不用特殊解碼器的情況下播放PCM流的裝置,這是本發(fā)明的目的所在。
[0061] 圖IA和IB示出與在上文引用的參考文獻中由Komamura所提出的類似的PCM-兼 容帶寬擴展方案。在圖IA的編碼器中,頻帶分割器3接收例如以96kHz采樣率采樣的原始 信號2,該信號可能攜帶在0-48kHz頻率范圍內(nèi)的信息。頻帶分割器使用已知方法(如正 交鏡像濾波器)將信號2分割為低頻(LF)信號15和高頻(HF)信號28,分別攜帶0-24kHz 低頻信息和24-48kHz高頻信息,LF和HF信號都以48kHz采樣,也就是原始采樣率的一半。 然后使用已知方法將HF流有損壓縮4為具有小比特數(shù)的數(shù)據(jù)流7,例如1、2或3比特,而 LF流通過截短或噪聲整形5成為具有大比特數(shù)的信號6,例如15、14或13比特。圖IA示 出了數(shù)據(jù)流7具有3比特,而信號6具有13比特的示例。然后,如圖IA所示,將來自兩個 流的樣本封包到具有B1 -B16比特的16-bit樣本的單個復(fù)合輸出流8中。16-bit輸出流包 括較低采樣率如48kHz的樣本,并且能夠使用標(biāo)準(zhǔn)消費類裝置傳輸和儲存,該裝置也能夠 重放樣本8的流。
[0062]Komamura提出使用ADPCM(自適應(yīng)差分脈碼調(diào)制)作為有損壓縮的基礎(chǔ)。Komamura 在ADPCM單元前使用降低采樣頻率采樣器來提供24kHz采樣率的HF流的表達,然后該表達 壓縮為每樣本2比特,并將2比特序列化為48kHz的Ι-bit流。這樣,HF信息只占用最終 16-bit輸出中的1比特,而允許15比特的LF分辨率。由于降低采樣頻率本身就是有損過 程,Komamura的降低采樣頻率采樣器和ADPCM單元可一并看作為有損壓縮單元4。因為降 低了采樣頻率,解碼器不能提供頻率不超過48kHz的解模糊重建:最好限制在36kHz。
[0063] 圖IB示出與圖IA對應(yīng)的解碼器,其中流6和7分別從傳輸?shù)牧?的上部13比特 B1-MP下部3比特B14316還原而來。解壓縮單元9實質(zhì)上是壓縮單元4的逆向操作,所 以頻帶接合器10饋給有LF和HF信號,該LF和HF信號實質(zhì)上類似于頻帶分割器3產(chǎn)生的 LF信號15和HF信號28。頻帶接合器10重組這兩個信號以產(chǎn)生輸出信號11,其在頻率范 圍0-24kHz內(nèi)的音質(zhì)主要受噪聲整形器5限制,并通過壓縮單元4和解壓縮單元9的聯(lián)合 作用人為介入超聲波范圍24-48kHz。
[0064] 不用解碼器而將流8作為PCM音頻播放的"傳統(tǒng)"聽眾,聽到的主要是來自頻帶分 割器的噪聲整形(或截短)的LF輸出,其作為原始信號2的降低的采樣頻率和較低質(zhì)量的 版本應(yīng)該是可以接受的。然而,包含壓縮的HF信號7的流8的最低有效位也會有助于傳統(tǒng) 聽眾播放器的音頻輸出。理想壓縮器的輸出是類似噪聲信號,否則會包括冗余,原則上能夠 去除冗余來改進壓縮。實際上,可能有必要提供明確的擾頻處理來去除音調(diào)上的人為產(chǎn)物, 并將壓縮器輸出渲染為真正地類似噪聲信號。在本文中我們假設(shè)壓縮器4內(nèi)部包括這樣的 擾頻處理,如果必要的話,以確保其輸出壓縮為統(tǒng)計獨立的二進制代碼。
[0065] 另一個貫穿本文的假設(shè)是,如壓縮和解壓縮這樣的過程是瞬時的。實際上,這些過 程導(dǎo)致信號延遲,使得必須引入補償延遲至平行信號通路。為了清楚起見,從示意圖中省略 了該補償延遲,并且類似地,示意圖不排除將信號采樣組織到區(qū)塊中,這對于處理單元的正 確操作應(yīng)該是方便或必要的。
[0066] 使用缺損性掩埋數(shù)據(jù)的帶寬擴展
[0067]在圖2A中,有損壓縮器4輸出的是數(shù)據(jù)信號,但如圖IA所示,傳統(tǒng)聽眾聽到的也 是音頻信號。在圖2A中識別了這種雙重解譯,其中單元12可能實際上不存在,但包括在這 里以強調(diào)信號7具有數(shù)據(jù)信號和PCM音頻信號的雙重解譯。如果解譯為音頻信號,則視為 右對齊并占用16-bit字符的底部3比特,S卩比特B14到B16,而字符的其他比特為零。
[0068] 因此,解譯為音頻信號的信號7饋給至減法器15,以便噪聲整形器5接收與LF信 號反相位的信號7而產(chǎn)生更改的13-bit信號6',該信號6'置入輸出字符8的上部13比特 的B1-B13*。傳統(tǒng)聽眾會聽到解譯為PCM音頻信號的完整的輸出字符8,其為信號6'和7 的總和。傳統(tǒng)聽眾既直接通過完整字符8的下部3比特,也會以反相位通過噪聲整形器在字 符8的上部13比特聽到壓縮信號7,壓縮信號7的這兩種表達會抵消。這是在M.A.Gerzon 和P.G.Craven的"AHigh-RateBuriedDataChannelforAudioCD(用于音頻CD的高 速率掩埋數(shù)據(jù)通道)"J.AudioEng.Soc.Volume43Issue1/2ρρ· 3-22!February1995 中 描述的"缺損性掩埋數(shù)據(jù)"的實例。
[0069] 噪聲整形器5內(nèi)部包括13-bit量化器和噪聲整形濾波器。和從壓縮信號中消除 噪聲一樣,缺損性掩埋數(shù)據(jù)提供了用于13-bit量化器的缺損性抖動。量化人工產(chǎn)物不同于 添加性噪聲,目前是16-bit水平而不是13-bit水平。通過噪聲整形濾波器形成的13-bit 水平的添加性噪聲,可能提供了兩個或更多比特的感知優(yōu)勢,而缺損性抖動引入了4. 77dB 噪聲,少于傳統(tǒng)的TPDF抖動。因此,其感知表現(xiàn)可等同于使用TPDF抖動的16-bit系統(tǒng)。
[0070] 圖2B示出了對應(yīng)的解碼器。除了輸入至頻帶接合器10的LF饋給有整個16-bit 復(fù)合信號而不是只有上部13比特以外,圖2B的解碼器與圖IB中完全相同。因此,該LF信 號為信號6'和7的結(jié)合,與傳統(tǒng)聽眾聽到的相同,享有缺損性抖動相同的優(yōu)勢。
[0071]上文引用的Gerzon和Craven的文獻也描述了其他數(shù)據(jù)的非整數(shù)比特可如何"掩 埋"在PCM信號下部的比特中。特別地,將半整數(shù)的比特直接掩埋在雙通道(立體聲)流的 每一個通道中。為簡單起見,本文描述假設(shè)為整數(shù),但很清楚的是本文中描述的設(shè)計能夠用 于壓縮數(shù)據(jù)非整數(shù)的比特。
[0072] 無損帶寬擴展--一般考慮
[0073]圖3A和圖3B分別示出了用于簡單無損帶寬擴展系統(tǒng)的編碼器和解碼器。圖3A和3B與圖IA和IB之間的結(jié)構(gòu)相似性是顯而易見的,但無損重建的要求強加了額外限制, 并且要求仔細(xì)注意在有損情況下不會出現(xiàn)的量化方面。
[0074] 無損系統(tǒng)不允許丟棄信息,所以傳輸通道必須具有至少與待傳輸?shù)男盘栔行畔⑼?大量的信息攜帶能力。無損壓縮的經(jīng)驗表明16比特或更高分辨率的96kHz音頻信號中的冗 余通常大約為8比特。因此16-bit96kHz信號可壓縮為每樣本8比特的數(shù)據(jù)率,而24-bit 96kHz信號可壓縮為16比特。因此,16-bit96kHz信號通常能夠通過16-bit48kHz通道 傳輸。然而,這將會不兼容,因為如果解譯為PCM信號,最優(yōu)壓縮信號會作為滿量程白噪聲 出現(xiàn)。PCM兼容性要求將冗余強加到PCM信號中,從而需要更大的字寬。
[0075] 因此,一般不可能將16-bit96kHz信號以PCM兼容性無損封包到16-bit48kHz 通道中,一般也不可能將24-bit96kHz信號以PCM兼容性無損封包到24-bit48kHz通道 中。然而,將16-bit96kHz信號的PCM兼容無損封包到24-bit48kHz通道中通常是可行 的。
[0076] 目前"96/24"(也就是采樣率96kHz及位深24比特)被廣泛認(rèn)為是光盤"44/16" 的下一步。然而,Gerzon在1995年發(fā)現(xiàn),96kHz采樣非常有利于噪聲整形,相比于廣泛用 于⑶的44.IkHz整形器,允許感知改進更大而高頻噪聲頻譜的增加更溫和。Gerzon的 96kHz整形器提供了幾乎5比特的感知改進,該整形器系數(shù)載于AcousticRenaissancefor Audio,"AProposalforHigh-QualityApplicationofHigh-DensityCDCarriers(關(guān) 于建立高密度光盤載體的高質(zhì)量的應(yīng)用)"privatepublication(1995April);再版 于Stereophile(1995Aug.);日語版inJ.JapanAudioSoc.,vol. 35 (19950ct.) ;www. meridian-audio,com/ara可提供下載。Stuart提供了考慮人類聽覺能力的細(xì)致分析 ("CodingforHigh-ResolutionAudioSystems(用于高分辨率音頻系統(tǒng)的編碼)"J. AudioEng.Soc.,Vol. 52,No. 3, 2004March,特別參見圖 16),從中可推斷,以TPDF抖動(但 無噪聲整形)適當(dāng)量化到20. 5比特的44.IkHz采樣的數(shù)字系統(tǒng),總會提供充足的動態(tài)范圍 作為發(fā)行媒介。使用96kHz采樣時,非噪聲整形的噪聲頻譜密度被還減少3. 4dB。因此能夠 推斷,帶有適當(dāng)噪聲整形的16-bit96kHz通道足夠作為滿足發(fā)燒友要求的發(fā)行格式,甚至 還留有余地
[0077] 因此,考慮到信息理論的爭論及心理聲學(xué)的爭論,有必要且可允許將可具有大的 位深(如24比特)的96kHz輸入信號再量化為較小的位深(如16比特)。相應(yīng)地,圖3A 中所示的96kHz噪聲整形器1,將未指明分辨率的96kHz輸入信號再量化為例如17比特,提 供識別為"A"的量化信號2。頻帶分割器3是無損的,并且生成也是17比特的低頻輸出15 和分辨率標(biāo)示為18比特的高頻輸出28,盡管對于真實的音頻信號很少會用到全部18比特。 因此,低頻輸出占用了假設(shè)的24-bit輸出字符16中的17比特B1-B17,余下7比特&8324用 于高頻信號28通過無損壓縮器14生成的無損壓縮版本。
[0078] 在圖3B的解碼器中,無損解壓縮單元9將信號28a還原為高頻信號28的副本。因 此,無損頻帶接合器10接收的信號與無損頻帶分割器3生成的信號15和28相同,從而能 夠?qū)⑤敵鲂盘?1重建為信號12的無損副本。從而也將信號11識別為"A"。
[0079] 由于量化是有損過程,圖3A和圖3B所示的總處理不能為無損;而無損的是從編碼 器中信號2到解碼器的輸出11的通路。因此,圖3A和圖3B的編碼器和解碼器提供的處理 作為一個整體實現(xiàn)了輸入信號的噪聲整形版本,其中能夠選擇噪聲整形1來滿足發(fā)燒友包 括抖動并帶有恒定位深的標(biāo)準(zhǔn)。
[0080] 使用"提升"的無損頻帶分割器和接合器
[0081] 圖3A和3B的架構(gòu)需要無損頻帶分割器3和接合器10,其中"無損"是指考慮到 處理中量化錯誤的精確到bit的重建。建立這種無損頻帶分割器和頻帶接合器有多種方 式,圖4A和4B中所示的是基于"提升"原則的方式(Calderbank,Daubechies,Sweldon及 Yeo:"WaveletTransformsThatMapIntegerstoIntegers(整數(shù)至整數(shù)映射的小波變 換),'AppliedandComputationalHarmonicAnalysis,vol. 5,pp332 - 369(1998),特別 是其中的圖4和5)。
[0082] 在圖4Α的頻帶分割器中,以"2χ"采樣率如96kHz采樣的輸入流被解交織以生成 基數(shù)和偶數(shù)樣本的分離流,每個樣本采樣率為"lx"如48kHz。這兩個流幾乎但不完全共時 序:2x流中的原始低頻信號表現(xiàn)為在奇數(shù)流中相對于偶數(shù)流延遲或提前一半的Ix樣本。
[0083] 現(xiàn)在應(yīng)用兩個提升步驟。提升步驟將一個信號的函數(shù)加給另一個信號:
[0084]X' =X+f (Y)
[0085]Y,=Y
[0086] 能夠簡單倒轉(zhuǎn)為:
[0087]X=X,- f(Y,)
[0088] Y=Y'
[0089] 這是無損的,提供的函數(shù)f在兩種情況之間是完全一致的(包括狀態(tài)變量的任何 量化和初始化)。
[0090] 在圖4A的第一個提升步驟中,"X"被鑒別為奇數(shù)樣本流,而"Y"被鑒別為偶數(shù)樣 本流。如果從奇數(shù)流中減去偶數(shù)流,將大幅消除低頻,但對于最佳的消除需要校正半樣本轉(zhuǎn) 換。因此,我們想要給偶數(shù)樣本應(yīng)用半樣本延遲。這能夠通過具有偶數(shù)片的對稱FIR濾波 器接近,但這是非因果關(guān)系的,所以濾波器"f"實際上對于某些η實施了(n+1/2)個樣本延 遲,并且在奇數(shù)通路中有η個樣本的補償延遲。例如:
[0091]

【權(quán)利要求】
1. 一種無損音頻編碼器,所述無損音頻編碼器適合接收第一采樣率的輸入數(shù)字音頻信 號,并且由此產(chǎn)生包括多個樣本并具有低于所述第一采樣率的第二采樣率的PCM數(shù)字音頻 輸出,其中: 所述多個樣本中的每一個都具有較重要部分和次要部分; 所述較重要部分和所述次要部分共同包括允許第一解碼器無損還原所述輸入數(shù)字音 頻信號的信息; 當(dāng)解譯為標(biāo)準(zhǔn)PCM流時,所述較重要部分提供具有縮減的帶寬的輸入數(shù)字音頻信號版 本的第一有損表達;以及 所述較重要部分包括允許第二解碼器還原輸入數(shù)字音頻信號的第二有損表達的信息, 所述輸入數(shù)字音頻信號的第二有損表達的帶寬大于所述第一有損表達的帶寬。
2. 根據(jù)權(quán)利要求1所述的無損音頻編碼器,其中所述第一有損表達是輸入音頻信號的 準(zhǔn)確表達,而不是非時變?yōu)V波、降低采樣率以及強加非時變本底噪聲的再量化的效果。
3. 根據(jù)權(quán)利要求1或2所述的無損音頻編碼器,其中: 所述輸入數(shù)字音頻信號耦合到具有高頻輸出和低頻輸出的無損頻帶分割器。
4. 根據(jù)權(quán)利要求3所述的無損音頻編碼器,其中: 所述無損頻帶分割器的高頻輸出耦合到具有壓縮輸出和修改輸出的有損壓縮單元; 根據(jù)所述壓縮輸出和所述頻帶分割器的低頻輸出導(dǎo)出所述較重要部分;以及 根據(jù)所述修改輸出導(dǎo)出次要部分。
5. 根據(jù)前述權(quán)利要求中任一項所述的無損音頻編碼器,其中每個較重要部分包括16 個二進制比特。
6. 根據(jù)前述權(quán)利要求中任一項所述的無損音頻編碼器,其中,每個次要部分包括8個 二進制比特。
7. 根據(jù)前述權(quán)利要求中任一項所述的無損音頻編碼器,其中所述第二采樣率為所述第 一米樣率的一半。
8. 根據(jù)權(quán)利要求1至7中的任一項所述的無損音頻編碼器,其中所述第二采樣率為 48kHz。
9. 根據(jù)權(quán)利要求1至7中的任一項所述的無損音頻編碼器,其中所述第二采樣率為 44. 1 kHz。
10. 根據(jù)權(quán)利要求1至9中的任一項所述的無損音頻編碼器,其中所述第二解碼器還原 與對應(yīng)所述第一采樣率的Nyquist頻率相等的音頻帶寬。
11. 根據(jù)權(quán)利要求1至9中的任一項所述的無損音頻編碼器,其中所述第二解碼器還原 與對應(yīng)所述第一采樣率的Nyquist頻率四分之三相等的帶寬。
12. 根據(jù)權(quán)利要求4或當(dāng)權(quán)利要求5至11引用權(quán)利要求4時的權(quán)利要求5至11中的 任一項所述的無損音頻編碼器,其中根據(jù)由所述有損壓縮單元的修改輸出饋給的無損壓縮 器的輸出來導(dǎo)出所述次要部分。
13. 根據(jù)權(quán)利要求4至12中的任一項所述的無損音頻編碼器,其中根據(jù)所述頻帶分割 器的低頻輸出導(dǎo)出所述次要部分。
14. 根據(jù)權(quán)利要求4至12中的任一項所述的無損音頻編碼器,其中所述無損頻帶分割 器的低頻輸出耦合到具有第一輸出和第二輸出的分割器,所述分割器的第一輸出耦合到所 述較重要部分而所述第二輸出耦合到所述次要部分。
15. 根據(jù)權(quán)利要求14所述的無損音頻編碼器,其中所述分割器包括噪聲整形濾波器。
16. 根據(jù)權(quán)利要求4或當(dāng)權(quán)利要求5至15引用權(quán)利要求4時的權(quán)利要求5至15中 的任一項所述的無損音頻編碼器,其中根據(jù)減法器的輸出導(dǎo)出所述較重要部分中的多個比 特,所述減法器具有與所述無損頻帶分割器的低頻輸出耦合的第一輸入和與所述壓縮輸出 奉禹合的第二輸入。
17. -種包括與根據(jù)前述權(quán)利要求中任一項所述的無損音頻編碼器耦合的噪聲整形器 的裝置。
18. -種包括根據(jù)權(quán)利要求4到16中任一項所述的無損音頻編碼器的裝置,所述無 損音頻編碼器與提供水印輸出的無損可逆水印編碼器耦合,其中所述裝置根據(jù)配置參數(shù)編 碼,所述水印編碼器將配置參數(shù)埋入解碼器使用的有水印的輸出中。
19. 根據(jù)權(quán)利要求18所述的裝置,還包括提供經(jīng)量化的信號至所述無損音頻編碼器的 輸入的噪聲整形器,其中所述噪聲整形器量化到位深并且所述配置參數(shù)包括位深。
20. 根據(jù)權(quán)利要求19所述的裝置,還包括選擇器單元,所述選擇器單元選擇量化的位 深以最大化音頻質(zhì)量而不超出所述次要部分的信息承載能力。
21. -種音頻解碼器,所述音頻解碼器適合接收PCM輸入數(shù)字音頻信號,所述PCM輸入 數(shù)字音頻信號包括由根據(jù)權(quán)利要求1所述的對應(yīng)的音頻編碼器生成的多個第二采樣率的 輸入樣本,所述音頻解碼器還適合由所述PCM輸入數(shù)字音頻信號生成輸出數(shù)字音頻信號, 所述輸出數(shù)字音頻信號具有高于所述第二采樣率的第一采樣率,其中: 在0-5kHz的頻率區(qū)域,所述輸出數(shù)字音頻信號與比較信號之間的差別為用固定統(tǒng)計 數(shù)據(jù)進行頻譜整形的噪聲,其中通過濾波和重采樣到所述第一采樣率的操作由所述輸入數(shù) 字音頻信號生成所述比較信號; 在0-5kHz的頻率區(qū)域,所述輸出數(shù)字音頻信號與第二輸出信號之間的差別為用固定 統(tǒng)計數(shù)據(jù)進行頻譜整形的噪聲,其中除了從每個樣本去除次要部分,當(dāng)與所述PCM輸入數(shù) 字音頻信號相同的信號被饋給至解碼器時生成所述第二輸出信號;以及 所述輸出數(shù)字音頻信號是提供給所述編碼器的數(shù)字音頻輸入信號的精確副本。
22. -種音頻解碼器,所述音頻解碼器適合接收PCM輸入數(shù)字音頻信號,所述PCM輸入 數(shù)字音頻信號包括多個第二采樣率的輸入樣本,由此生成的輸出數(shù)字音頻信號具有高于第 二采樣率的第一采樣率,所述解碼器包括: 無損頻帶接合器,具有高頻輸入和低頻輸入,所述頻帶接合器提供輸出數(shù)字音頻信號; 以及 解壓縮單元,具有有損輸入、修改輸入和輸出,所述輸出耦合到所述無損頻帶接合器的 高頻輸入, 其中: 每個輸入樣本包括較重要部分和次要部分; 根據(jù)所述較重要部分導(dǎo)出所述頻帶接合器的低頻輸入; 根據(jù)所述較重要部分、但獨立于所述次要部分導(dǎo)出所述解壓縮單元的有損輸入;以及 根據(jù)所述次要部分、但獨立于所述較重要部分導(dǎo)出所述解壓縮單元的修改輸入。
23. 根據(jù)權(quán)利要求22所述的音頻解碼器,其中根據(jù)所述較重要部分中包括的全部比特 導(dǎo)出所述頻帶接合器的低頻輸入。
24. 根據(jù)權(quán)利要求22或23所述的音頻解碼器,其中所述頻帶接合器的低頻輸入也基于 所述次要部分。
25. 根據(jù)權(quán)利要求22至24中任一項所述的音頻解碼器,其中在0-5kHz的頻率區(qū)域,輸 出數(shù)字音頻信號與比較信號之間的差別為用固定統(tǒng)計數(shù)據(jù)進行頻譜整形的噪聲,其中通過 濾波和重采樣到第一采樣率的操作由PCM輸入數(shù)字音頻信號生成比較信號。
26. 根據(jù)權(quán)利要求22至25中任一項所述的音頻解碼器,適合接收通過相應(yīng)的音頻編碼 器生成的信號,其中所述輸出數(shù)字音頻信號是提供至相應(yīng)的音頻編碼器的數(shù)字音頻輸入信 號的精確副本。
【文檔編號】G10L19/24GK104508740SQ201380038662
【公開日】2015年4月8日 申請日期:2013年6月12日 優(yōu)先權(quán)日:2012年6月12日
【發(fā)明者】彼得·格雷厄姆·克雷文, 馬爾科姆·羅, 約翰·羅伯特·斯圖亞特 申請人:全盛音響有限公司, 彼得·格雷厄姆·克雷文, 馬爾科姆·羅
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
郸城县| 内乡县| 岳池县| 胶州市| 昌黎县| 南溪县| 棋牌| 盐亭县| 玉山县| 普安县| 久治县| 海兴县| 普洱| 北京市| 额敏县| 凤翔县| 南江县| 社旗县| 尖扎县| 乐陵市| 定襄县| 延川县| 古田县| 长武县| 保亭| 寻乌县| 平乐县| 成安县| 交城县| 扬州市| 嘉善县| 文成县| 上高县| 汉川市| 灵寿县| 江口县| 城市| 涞源县| 平阴县| 华宁县| 沧源|