欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

信息信號編碼的制作方法

文檔序號:2830477閱讀:397來源:國知局
專利名稱:信息信號編碼的制作方法
技術(shù)領(lǐng)域
本發(fā)明涉及信息信號編碼,如音頻或視頻編碼。
背景技術(shù)
在新的通信網(wǎng)絡(luò)以及在專業(yè)音頻制作中使用數(shù)字音頻編碼來進行 雙向?qū)崟r通信需要非常經(jīng)濟的算法編碼以及非常短的編碼延遲。數(shù)字 音頻編碼的應(yīng)用在延遲時間意義上變得非常關(guān)鍵的一種典型情形是同 時使用直接的(即未編碼的)和己傳送的(即己編碼和解碼的)信號
的情況。因此,示例是使用無繩麥克風和同時(在耳中(in-ear))監(jiān) 聽的直播制作,或"分散(scattered)"制作(其中藝術(shù)家在不同的演 播室中同時演奏)。在這些應(yīng)用中,可容許的總延遲時間段小于10ms。 例如,如果使用不對稱的參與者線路進行通信,則比特率是另外的限 制因素。
諸如MPEG-1 3 (MP3)、 MPEG-2 AAC和MPEG-2/4之類的標準 音頻編碼器的低延遲的算法延遲的范圍從20毫秒到數(shù)百毫秒,其中例 如參考了以下文獻M. Lutzky, G. Schuller, M. Gayer; U. Kraemer, S. Wabnik: "A guideline to audio codec delay", presented at the 116th AES Convention, Berlin, May 2004。語音編碼器操作于更低的比特率,并具
有更小的算法延遲,但僅提供有限的音頻質(zhì)量。
例如,文獻B. Edler, C. Faller and G. Schuller, "Perceptual Audio Coding Using a Time-Varying Linear Pre- and Postfilter", presented at 109th AES Convention, Los Angeles, S印tember 2000描述了一種編碼方 案,該編碼方案縮小了上述一方面的標準音頻編碼器而另一方面的語 音編碼器之間的差異,根據(jù)這一方案,在編碼器側(cè),使用掩蔽閾值的 倒數(shù)對要編碼的信號進行濾波,隨后對其進行量化以執(zhí)行不相關(guān)性減少,將量化信號提供給熵編碼以執(zhí)行與不相關(guān)性減少分離的冗余減少, 在解碼器側(cè),對經(jīng)量化和預濾波的信號進行重構(gòu),并在后濾波器中使 用標記閾值作為傳輸函數(shù)地對其進行濾波。這樣的編碼方案(以下稱
為ULD編碼方案)產(chǎn)生了可以與標準音頻編碼器(如MP3)相比的 感知質(zhì)量,其比特率約為每信道80kbit/s及更高。例如,WO 2005/078703 Al中也描述了一種這樣的編碼器。
具體地,其中所描述的ULD編碼器使用了心理聲學控制的線性 濾波器來形成量化噪聲。由于其結(jié)構(gòu),該量化噪聲總是在給定的閾值 之上,即便在給定頻域內(nèi)沒有信號時也是如此。只要噪聲與心理聲學 掩蔽閾值相對應(yīng),則該噪聲就保持為不可聽見。為了獲得甚至比該閾 值所預定的比特率更小的比特率,必須增大量化噪聲,這將使噪聲變 得可聽見。具體地,可以在沒有信號部分的域中聽見噪聲。因此,示 例是非常低或非常高的音頻。通常,在這些域中只有非常低的信號部 分,而掩蔽閾值較高。如果在整個頻域內(nèi)均勻地增大掩蔽閾值,則量 化噪聲處于該增大的閾值處(即使沒有信號),使得該量化噪聲可以被 聽覺感知為聽起來虛假的信號?;谧訋У木幋a器沒有這個問題,這 是因為該編碼器簡單地將具有比該閾值更小信號的子帶量化為零。
在所允許的比特率下降至最低比特率(所述最低比特率不會引起 虛假量化噪聲,并由掩蔽閾值確定)以下時出現(xiàn)的上述問題不是唯一 的問題。此外,在上述參考文獻中描述的ULD編碼器為了獲得恒定 的數(shù)據(jù)速率而經(jīng)受復雜的過程,尤其是由于使用了迭代環(huán),其中,為 了每個采樣塊確定用于調(diào)整解量化步長的放大因子的值,必須經(jīng)過所 述迭代環(huán)。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種信息編碼方案,能夠在低比特率和高編 碼質(zhì)量的情況下,允許ULD類型編碼器的短延時。
該目的是通過根據(jù)權(quán)利要求1或24所述的設(shè)備、根據(jù)權(quán)利要求 44或45所述的方法以及根據(jù)權(quán)利要求47所述的編碼器和根據(jù)權(quán)利要 求48所述的解碼器來實現(xiàn)的。本發(fā)明的中心思想是以下發(fā)現(xiàn),即通過不直接對預濾波信號進行 量化,而是對由預濾波信號的前向自適應(yīng)預測而獲得的預測誤差進行 量化,可以實現(xiàn)超過由掩蔽閾值所確定的度量的極粗略的量化,而不 會帶來質(zhì)量損失或僅帶來非常小的質(zhì)量損失。由于前向自適應(yīng),量化 誤差對預測系數(shù)沒有負面影響。
根據(jù)另一個實施例,以非線性方式對預濾波信號進行平滑量化或 平滑限幅,即通過量化函數(shù)來進行量化,所述量化函數(shù)將預測誤差的
未量化值映射到量化階的量化索引上,所述量化函數(shù)的過程在閾值之 下比在閾值之上更陡。因此,由于較低的可用比特率,相對于掩蔽閾
值而增大的噪聲PSD調(diào)整為信號PSD,使得在沒有信號部分的頻譜部 分中不出現(xiàn)違反掩蔽閾值的情況,盡管可用比特率降低,但這分別進 一步提高了收聽質(zhì)量或維持了收聽質(zhì)量。
根據(jù)本發(fā)明的另一個實施例,量化是分別通過限幅(即分別通過 量化至數(shù)目有限且固定的量化等級或量化階)來進行的平滑量化或平 滑限幅。通過前向自適應(yīng)預測來預測預濾波信號,粗略的量化對預測 系數(shù)本身沒有負面影響。通過量化至固定數(shù)目的量化等級,固有地避 免了用于獲得恒定比特率的迭代。
根據(jù)本發(fā)明的另一個實施例,以后向自適應(yīng)的方式,根據(jù)先前通 過量化所獲得的量化等級索引來分別確定固定數(shù)目的量化等級之間的 量化步長或階高。因此, 一方面,盡管量化等級的數(shù)目非常小,但是 可以分別獲得預測誤差或殘差信號的更好的或至少盡可能最好的量 化,而無須向解碼器側(cè)提供進一步的輔助信息。另一方面,可以確保 在向解碼器側(cè)傳輸量化后的殘差信號的過程中的傳輸誤差對于具有適 當?shù)暮笙蜃赃m應(yīng)步長調(diào)整配置的解碼器側(cè)而言僅具有短時效應(yīng)。


下面將參考附圖討論本發(fā)明的優(yōu)選實施例。附圖示出了
圖1是根據(jù)本發(fā)明的實施例的編碼器的框圖; 圖2a/b分別示例性地示出了如下圖在根據(jù)權(quán)利要求1所述的編 碼器的情況下,與掩蔽閾值和信號功率譜密度相關(guān)的噪聲頻譜的過程(圖a),或者在具有對預濾波信號的后向自適應(yīng)預測和迭代以及掩蔽 閾值逐塊量化步長調(diào)整的情況下,與掩蔽閾值和信號功率譜密度相關(guān)
的噪聲頻譜的過程(圖b);
圖3a/3b和3c分別示例性地示出如下圖在如圖1所示的編碼器 中執(zhí)行預濾波信號的前向自適應(yīng)預測以及迭代量化步長調(diào)整的情況 下,分別對于不同的限幅范圍或不同數(shù)目的量化等級的、與噪聲或誤 差功率譜密度相關(guān)的信號功率譜密度;
圖4是根據(jù)本發(fā)明的實施例的圖1的編碼器中的系數(shù)編碼器的結(jié) 構(gòu)的框圖5是根據(jù)本發(fā)明的實施例的用于對圖1中的編碼器所編碼的信 息信號進行解碼的解碼器的框圖6是根據(jù)本發(fā)明的實施例的圖1的編碼器或圖5的解碼器中的 系數(shù)編碼器的結(jié)構(gòu)的框圖7是用于例證收聽測試結(jié)果的圖;以及
圖8a至8c是可以分別用于圖1、 4、 5和6中的量化和量化/限幅 裝置中的示例性量化函數(shù)的圖。
具體實施例方式
在參照附圖更詳細地討論本發(fā)明的實施例之前,首先,為了更好 地理解這些實施例的優(yōu)點和原理,將討論ULD類型的編碼方案的可能 實現(xiàn)作為比較示例,基于該比較示例,可以更清晰地說明最終導致后 續(xù)實施例的這些實施例的潛在的實質(zhì)性優(yōu)點和考慮。
如在本說明書的介紹部分已經(jīng)描述的,需要更低比特率(例如 64kbit/s)的、具有可比感知質(zhì)量的ULD版本,以及用于獲得恒定比特 率(尤其是用于獲得所需的更低比特率)的較簡單的方案。此外,傳 輸誤差之后的恢復時間保持為較低或保持在最小值將是有利的。
為了減少經(jīng)心理聲學預處理后的信號的冗余,比較ULD編碼器使 用了一種逐樣本的后向自適應(yīng)閉環(huán)預測。這意味著,對編碼器和解碼 器中的預測系數(shù)的計算僅僅基于過去的或已經(jīng)量化和重構(gòu)的信號樣 本。為了分別獲得對信號或預濾波信號的適配,針對每個樣本再次計算新的預測器系數(shù)集合。這產(chǎn)生了以下優(yōu)點由于不需要將預測器系 數(shù)從編碼器側(cè)傳送到解碼器側(cè),因此可以使用較長的預測器或預測值 確定公式,即具體為可以使用較大數(shù)目的預測器系數(shù)。另一方面,這 意味著必須在不損失精確度的情況下將量化后的預測誤差傳送至解碼 器,以獲得與編碼過程中潛在的預測系數(shù)完全相同的預測系數(shù)。否則, 編解碼和解碼器中的預測的值彼此分別不同,這將導致不穩(wěn)定的編碼 過程。更合理地,在比較ULD編碼器中,需要在編碼器和解碼器側(cè)周 期性地復位預測器,以便能夠選擇性地訪問編碼比特流以及阻止傳輸 誤差的傳播。然而,周期性復位導致了比特率達到峰值,這對比特率 可變的信道不是問題,但對于比特率固定的信道而言,該比特率峰值 限制了恒定比特率調(diào)整的下限。
從隨后利用本發(fā)明的實施例對ULD比較編碼方案的更詳細描述
中可以得出,這些實施例與比較編碼方案的差別在于使用具有后向 自適應(yīng)量化步長調(diào)整的逐塊前向自適應(yīng)預測,來代替逐樣本的后向自 適應(yīng)預測。另一方面,其缺點在于為了限制用于向編碼器側(cè)傳送所 需預測系數(shù)的所需輔助信息量,預測器應(yīng)該更短,這還可能導致編碼 器效率降低,但是,另一方面,其優(yōu)點在于,隨后的實施例的過程對 更高的量化誤差(這是比特率減小的結(jié)果)仍能夠有效工作,因此解 碼器側(cè)的預測器可以用于對噪聲形狀進行量化。
從隨后的比較也可以得出,與比較ULD編碼器相比,通過在傳輸 之前限制預測余數(shù)值的范圍來限制比特率。與比較ULD編碼方案相 比,這導致了修正的噪聲形狀,也導致了不同且更少的虛假的收聽人 工效應(yīng)。此外,在不使用迭代環(huán)的情況下產(chǎn)生恒定比特率。此外,由 于逐塊的前向適配,對于每個樣本塊,固有地包括了 "復位"。此外, 在以下描述的實施例中,針對預濾波器系數(shù)和前向預測系數(shù)使用了一 種編碼方案,該方案對系數(shù)的LSF (線譜頻率)表示,使用了具有后 向自適應(yīng)量化步長控制的不同編碼。如以下要描述的,該方案提供了 對系數(shù)的逐塊訪問,產(chǎn)生了恒定的輔助信息比特率,并在該比特率上 對傳輸誤差具有魯棒性。
下面,將更詳細地描述比較ULD編碼器和解碼器的結(jié)構(gòu),接著描述本發(fā)明的實施例并例證其在從較高恒定比特率傳輸至較低比特率方 面的優(yōu)點。
在比較ULD編碼方案中,在編碼器側(cè),分別通過感知模型或收聽 模型來對編碼器的輸入信號迸行分析,以獲得關(guān)于信號中在感知上無 關(guān)的部分的信息。該信息用于通過時變?yōu)V波器系數(shù)來控制預濾波器。
從而,預濾波器將輸入信號相對于其掩蔽閾值進行歸一化。每128樣本 的塊計算一次濾波器系數(shù),對其進行量化,并將其傳送至編碼器側(cè)作 為輔助信息。
在通過減去后向自適應(yīng)預測信號來將預濾波信號與放大因子相 乘之后,通過均勻(uniform)量化器(即具有均勻步長的量化器)對 預測誤差進行量化。如上所述,通過逐樣本后向閉環(huán)預測來獲得該預 測信號。相應(yīng)地,不需要向解碼器傳送預測系數(shù)。隨后,對量化的預 測殘差信號進行熵編碼。為了獲得恒定比特率,提供了一種環(huán),該環(huán) 對每個預濾波樣本塊重復數(shù)次相乘、預測、量化和熵編碼的步驟。在 迭代之后,確定預定放大值集合中仍滿足恒定比特率條件的最高放大 因子。將該放大值傳送至解碼器。然而,如果確定了小于l的放大值, 則在解碼后量化噪聲是可感知的,即其頻譜被整形為與掩蔽閾值類似, 但其總功率高于預測模型所預定的功率。對于輸入信號頻譜的部分,
量化噪聲甚至可能高于輸入信號頻譜本身,由于預測編碼器的使用, 這還在該頻譜部分中產(chǎn)生了可聽見的人工效應(yīng),否則在該頻譜部分中 不會出現(xiàn)可聽見的信號。在考慮更低的恒定比特率時,量化噪聲所導 致的效應(yīng)表示了一種限制因素。
繼續(xù)描述該比較ULD方案,僅將預濾波系數(shù)作為幀內(nèi)LSF差來傳
送,而且僅當其超過特定限制時才進行傳送。為了避免非受限的時間 段的傳輸誤差傳播,時常對該系統(tǒng)進行復位。可以使用其他技術(shù)來對 傳輸誤差情況下解碼信號感知的下降進行最小化。該傳輸方案產(chǎn)生了 可變的輔助信息比特率,在上述環(huán)中通過調(diào)整上述放大因子相應(yīng)地調(diào) 節(jié)(level)該比特率。
在比較ULD編碼器的情況下,量化預測殘差信號的熵編碼包括諸 如Golomb、 Huffman或算術(shù)編碼方法之類的方法。必須時常對該熵編碼迸行復位,并且該熵編碼固有地產(chǎn)生可變比特率,該可變比特率仍 由上述環(huán)來調(diào)節(jié)的可變比特率。
在比較ULD編碼方案的情況下,根據(jù)熵編碼獲得解碼器中的量化 預測殘差信號,在其上加入預測余數(shù)和預測信號,將和與所傳送的放 大因子的倒數(shù)相乘,由此,通過其頻率響應(yīng)為一個預濾波器的倒數(shù)的 后濾波器來產(chǎn)生重構(gòu)的輸出信號,其中,該后濾波器使用傳送的預濾 波器系數(shù)。
例如,在32kHz至48kHz的釆樣頻率上,剛剛描述的類型的比較 ULD編碼器獲得5.33至8ms的總編碼器/解碼器延遲。在沒有(虛假環(huán)) 迭代的情況下,該ULD編碼器產(chǎn)生80至96kbit/s范圍內(nèi)的比特率。如上 所述,在較低恒定比特率上,由于噪聲頻譜更為均勻,該編碼器中的 收聽質(zhì)量下降。此外,由于迭代,獲得均勻比特率的代價較高。以下 描述的實施例克服或最小化了這些缺點。在恒定傳輸數(shù)據(jù)速率上,以 下描述的實施例的編碼方案在不需要任何迭代的情況下使得量化誤差 的噪聲形狀改變。更準確地,在上述比較ULD編碼方案中,在迭代過 程中具有恒定傳輸數(shù)據(jù)速率的情況下,確定了乘數(shù),在該乘數(shù)的幫助 下,在量化之前對來自預濾波器的信號進行相乘,其中量化噪聲在頻 譜上是白的,這導致解碼器中的量化噪聲被成形為類似于收聽閨值, 但根據(jù)所選擇的乘數(shù),該量化噪聲略低于或略高于該收聽閾值,如上 所述,該乘數(shù)也可以被理解為是對預定的收聽閾值的一種移位。與之 相關(guān)的是,在解碼之后產(chǎn)生量化噪聲,其功率在各頻域內(nèi)甚至可以超 過各頻域內(nèi)的輸入信號的功率??梢郧逦芈犚娝a(chǎn)生的編碼人工效 應(yīng)。以下描述的實施例對量化噪聲進行整形,以使得其功率譜密度在 頻譜上不再是白的。更合理地,對預濾波器信號的粗略量化/限制或限 幅將產(chǎn)生的量化噪聲分別整形為類似于預濾波器信號的功率譜密度。 從而,對解碼器中的量化噪聲進行整形,以使其保持在輸入信號的功 率譜密度以下。這可以被理解為是所確定的收聽閾值的變形 (deformation)。與比較ULD編碼方案相比,這樣產(chǎn)生的編碼人工效應(yīng) 不那么虛假。此外,隨后的實施例不需要迭代過程,從而降低了復雜 度。由于通過描述上述比較ULD編碼方案已經(jīng)提供了充分的基礎(chǔ),從
而將注意力轉(zhuǎn)到以下實施例中潛在的優(yōu)點和考慮,以用于描述這些實 施例,首先,下面將描述根據(jù)本發(fā)明的實施例的編碼器的結(jié)構(gòu)。
總體上由10表示的圖1中的編碼器包括用于要編碼的信息信號的 輸入12,以及用于已編碼信息信號的輸出14,其中,以下示例性地假 定該信號是音頻信號,尤其示例性地假設(shè)該信號是已采樣的音頻信號, 但是也可以在輸入12之后的編碼器中進行采樣。在圖1中,x(n)表示輸
入的輸出信號的樣本。
如圖1所示,可以將編碼器10劃分為掩蔽閾值確定裝置16、預濾 波裝置18、前向預測預測裝置20和量化/限幅裝置22以及比特流產(chǎn)生裝 置24。掩蔽閾值確定裝置16分別根據(jù)感知模型或收聽模型來操作,使 用感知模型分別確定從輸入12處輸入的音頻信號的掩蔽或收聽閾值的 表示,該表示指示了與可感知性或可聽見性分別無關(guān)的音頻信號部分, 或表示了頻率的頻譜閾值,在該頻率上,頻譜能量分別由于心理聲學 的遮蔽效應(yīng)而保持不可聽見,或不被人所感知。如以下將要描述的, 確定裝置16以逐塊的方式來確定掩蔽閾值,即該裝置針對音頻信號的 后續(xù)樣本塊中的每一塊確定掩蔽閾值。也可以進行其他過程。與隨后 的描述(尤其是關(guān)于圖4的描述)相反,從確定裝置16產(chǎn)生的掩蔽閾值
的表示也可以是頻譜掩蔽閾值的頻譜樣本的表示。
預濾波或預估計裝置18與掩蔽閾值確定裝置16和輸入12相耦合,
并對輸出信號進行濾波,以將其相對于掩蔽閾值進行歸一化,以獲得 預濾波信號f(n)。例如,預濾波裝置18基于線性濾波器,并被實現(xiàn)為 根據(jù)掩蔽閾值確定裝置16所提供的掩蔽閾值的表示來調(diào)整濾波器系 數(shù),以使得該線性濾波器的傳輸函數(shù)實質(zhì)上與掩蔽閾值的倒數(shù)相對應(yīng)。 可以逐塊地、每半塊地(例如在以下描述的在掩蔽閾值確定中塊一半 重疊的情況下)、或逐樣本地執(zhí)行濾波器系數(shù)的調(diào)整,例如通過對由逐 塊確定的掩蔽閾值表示所獲得的濾波器系數(shù)進行內(nèi)插、或者通過對跨 過塊間隔而獲得的濾波器系數(shù)進行內(nèi)插來執(zhí)行。
前向預測裝置20與預濾波裝置18相耦合,用于對預濾波信號的樣 本f(n)(通過使用心理聲學掩蔽閾值在時域中對其進行了自適應(yīng)濾波)進行前向自適應(yīng)預測,以獲得預測信號六")、表示與預濾波信號f(n) 的預測誤差的殘差信號r(n)以及預測濾波器系數(shù)的表示,基于此可以 重構(gòu)預測信號。具體地,前向自適應(yīng)預測裝置20被實現(xiàn)為直接根據(jù)預 濾波信號f來確定預測濾波器系數(shù)的表示,而不僅僅基于殘差信號r的 后續(xù)量化。如以下將參照圖4更詳細地討論的,盡管在LFS域中(尤其 采取LFS預測殘差的形式)表示預測濾波器系數(shù),但是,其他表示也 是可能的,例如線性濾波器系數(shù)整形中的中間表示。此外,根據(jù)隨后 的描述,裝置20示例性地逐塊(即對預濾波信號的樣本f(n)中的后續(xù) 塊中的每一塊)執(zhí)行預測濾波器系數(shù)的確定,然而,其中其他過程也 是可能的。然后,裝置20被實現(xiàn)為通過所確定的這些預測濾波器系數(shù) 來確定預測信號/,并將其從預濾波信號f中減去,其中,例如通過線
性濾波器來執(zhí)行該預測信號的確定,其中根據(jù)前向自適應(yīng)確定的預測 系數(shù)表示來調(diào)整該線性濾波器的濾波器系數(shù)。如以下將要更詳細地描 述的,解碼器側(cè)提供的與先前輸出的濾波器輸出信號值相加的殘差信 號(即經(jīng)量化和限幅的殘差信號Un))可以作為濾波器輸出信號。
量化/限幅裝置22與預測裝置20相耦合,用于通過量化函數(shù)對殘差 信號分別進行量化和限幅,該量化函數(shù)將殘差信號的值r(n)映射到數(shù) 目恒定且有限的量化等級,以及用于向前向自適應(yīng)預測裝置20傳送以 這種方式在量化索引的整形中獲得的如上所述的量化殘差信號ie(n)。
量化殘差信號ic(n)、裝置20所確定的預測系數(shù)的表示、以及由裝 置16確定的掩蔽閾值的表示構(gòu)成了通過編碼信號14向解碼器側(cè)提供的 信息,其中,因此在圖1中示例性提供了比特流產(chǎn)生裝置24,用于根據(jù) 串行比特流或分組傳輸,可能地通過使用其他無損編碼方式來組合該 信息。
在對圖l中的編碼器的更詳細的結(jié)構(gòu)進行討論之前,以下基于編 碼器10的上述結(jié)構(gòu)來描述編碼器1的操作模式。預濾波裝置18使用與掩
蔽閾值的倒數(shù)相對應(yīng)的傳輸函數(shù)來對音頻信號進行濾波,從而產(chǎn)生預 濾波信號f(n),該信號通過均勻量化獲得了誤差的功率譜密度,該功 率譜密度主要與白噪聲相對應(yīng),并且可能導致在解碼器側(cè)的后濾波器 中濾波得到的噪聲功率譜與掩蔽閾值類似。然而,首先,前向自適應(yīng)預測裝置20通過從殘差信號f中減去前向自適應(yīng)的預測信號/來獲得
預測誤差r。不論在編碼器還是在解碼器側(cè),量化/限幅裝置22對該預 測誤差r進行的后續(xù)的粗略量化對預測裝置20的預測系數(shù)沒有影響,這 是由于該預測系數(shù)的計算是以前向自適應(yīng)方式執(zhí)行的,因此是基于未 量化的值f(n)。不僅在使用粗略量化步長的意義上利用粗略的方式來 執(zhí)行量化,而且在僅執(zhí)行平滑量化至數(shù)目恒定且有限的量化等級的意 義上以粗略的方式來執(zhí)行量化,因此,為了表示每個量化殘差信號ic(n) 或編碼音頻信號14中的每個量化索引,僅需要固定的比特數(shù),這固有 地允許了殘差值ie(n)的恒定比特率。如以下將要描述的,主要通過量 化至固定數(shù)目的均勻間隔的量化等級來執(zhí)行量化(以下示例性地量化 至僅3個量化等級的數(shù)目),其中,例如,執(zhí)行量化以使未量化的殘差 信號值r(n)被量化至下一個量化等級,以獲得該信號值的對應(yīng)量化等 級的量化索引ie(n)。因此,將未量化殘差信號r(n)的極高或極低的值分 別映射至各自最高或最低的量化等級或各自量化等級索引(即使在具 有相同步長的均勻量化中它們也可以被映射到更高的量化等級)。自 此,裝置22也分別對殘差信號r進行"限幅"或限制。然而,如以下 將要描述的,后者具有以下效果,即預濾波信號的誤差PSD (PSD-功 率譜密度)不再是白噪聲,而是根據(jù)限幅的程度而近似于預濾波信號 的信號PSD。在解碼器側(cè),這具有以下效果,即甚至在比掩蔽閾值所 預定的比特率更低的比特率上,噪聲PSD也保持在信號PSD以下。
下面將更詳細地描述圖l的編碼器的結(jié)構(gòu)。具體地,掩蔽閾值確 定裝置16分別包括根據(jù)感知模型進行操作的掩蔽閾值確定器或感知模 型26、預濾波器系數(shù)計算模塊28和系數(shù)編碼器30, 二者以命名順序連 接在輸入12與預濾波器裝置18以及比特流產(chǎn)生器24之間。預濾波器裝 置18包括系數(shù)解碼器32,其輸入與系數(shù)編碼器30的輸出相連接;以 及預濾波器34,例如,預濾波器34是自適應(yīng)線性濾波器,其數(shù)據(jù)輸入 與輸入12相連接,其數(shù)據(jù)輸出與裝置20相連接,而其用于對濾波器系 數(shù)進行適配的適配輸入與系數(shù)解碼器32的輸出相連接。預測裝置20包 括預測系數(shù)計算模塊36、系數(shù)編碼器38、系數(shù)解碼器40、減法器42、 預測濾波器44、延遲元件46、另一加法器48和解量化器50。預測系數(shù)計算模塊46和系數(shù)編碼器38串聯(lián)在一起,其連接順序分別是在預濾器 34的輸出與系數(shù)解碼器40的輸入或比特流產(chǎn)生器24的另一個輸入之 間,并協(xié)作用于以前向自適應(yīng)方式逐塊確定預測系數(shù)的表示。系數(shù)解 碼器40連接在系數(shù)編碼器38與預測濾波器44之間,預測濾波器44是例 如線性預測濾波器。除了與系數(shù)解碼器40連接的預測系數(shù)輸入之外, 濾波器44包括數(shù)據(jù)輸入和數(shù)據(jù)輸出,該數(shù)據(jù)輸入和數(shù)據(jù)輸入將濾波器 44連接在閉環(huán)中,除了濾波器44之外,該閉環(huán)包括加法器48和延遲元 件46。具體地,延遲元件46連接在加法器48和濾波器44之間,而濾波 器44的數(shù)據(jù)輸出與加法器48的第一輸入連接。此外,濾波器44的數(shù)據(jù) 輸出也與減法器42的反相輸入連接。減法器42的非反相輸入與預濾波 器34的輸出連接,而加法器48的第二輸入與解量化器50的輸出連接。 解量化器50的數(shù)據(jù)輸入與量化/限幅裝置22連接,并與解量化器50的步 長控制輸入連接。量化/限幅裝置22包括量化器模塊52和步長適配塊 54,其中,量化模塊52還由具有均勻可控步長的均勻量化器56和限幅 器58構(gòu)成,均勻量化器56和限幅器58以命名順序串聯(lián)在減法器42的輸 出與比特流產(chǎn)生器24的另一個輸入之間,其中,步長適配塊54還包括 步長適配模塊60和延遲部件62,步長適配模塊60和延遲部件62以命名 順序串聯(lián)在限幅器58的輸出與量化器56的步長控制輸入之間。此外, 限幅器58的輸出與解量化器50的數(shù)據(jù)輸入連接,其中,解量化器50的 步長控制輸入還與步長適配模塊60連接。比特流產(chǎn)生器24的輸出還形 成了編碼器10的輸出14。
在上述詳細描述了圖l的編碼器詳細結(jié)構(gòu)之后,以下描述其操作 模式。感知模型模塊26以逐塊的方式分別根據(jù)音頻信號來確定或估計 掩蔽閾值。因此,例如,感知模型模塊26使用長度為256的DFT,即塊 長為256個樣本的x(n),塊之間存在50%的重疊,該重疊導致了編碼器 10的128個樣本的音頻信號延遲。例如,以Bark帶或線性頻率縮放的頻 譜采樣的形式來表示感知模型模塊26輸出的掩蔽閾值的估計。在系數(shù) 計算模塊24中,使用感知模型模塊26逐塊輸出的掩蔽閾值來計算預定 濾波器(即濾波器34)的濾波器系數(shù)。例如,模塊28計算的系數(shù)可以 是對掩蔽閾值進行建模的LPC系數(shù)。系數(shù)編碼器30還對每塊的預濾波器系數(shù)進行編碼,這將參照圖4更詳細地討論。系數(shù)解碼器34對編碼的 預濾波器系數(shù)進行解碼,以重新獲得模塊28的預濾波器系數(shù),其中, 預濾波器34還分別獲得這些參數(shù)或預濾波器系數(shù),并使用它們,因此 預濾波器34分別關(guān)于輸入信號x(n)的掩蔽閾值來對輸入信號x(n)進行 歸一化,或使用傳輸函數(shù)對輸入信號x(n)進行濾波,該傳輸函數(shù)本質(zhì) 上與該掩蔽閾值的倒數(shù)相對應(yīng)。與輸入信號相比,產(chǎn)生的預濾波信號 f(n)在量上明顯更小。
在預測系數(shù)計算模塊36中,以逐塊的方式來處理預濾波信號的樣 本f(n),其中,感知模型模塊26可以示例性地將逐塊劃分與音頻信號 12之一相對應(yīng),但不是必需的。對于每個預濾波樣本塊,系數(shù)計算模 塊36計算預測濾波器44所使用的預測系數(shù)。因此,例如,系數(shù)計算模 塊36執(zhí)行每個預濾波信號塊的LPC (LPO線性預測編碼)分析,以獲 得預測系數(shù)。然后,如以下將要更詳細討論的,與系數(shù)編碼器30類似, 系數(shù)編碼器38對預測系數(shù)進行編碼,并向比特流產(chǎn)生器24 (具體是系 數(shù)解碼器40)輸出該預測系數(shù)的表示,其中,系數(shù)解碼器40使用所獲 得的預測系數(shù)表示來向線性濾波器44施加系數(shù)計算模塊36在LPC分析
中獲得的預測系數(shù),使得由濾波器44、延遲部件46和加法器48的閉環(huán) 組成的閉環(huán)預測器產(chǎn)生預測信號,減法器42再次從預濾波信號f(n) 中減去六")。例如,線性濾波器44是長度為N的A(z) = 2 =1%^類型
的線性預測濾波器,其中,系數(shù)解碼器40根據(jù)系數(shù)計算模塊36所計算 的預測系數(shù)來調(diào)整值ai,即用于對先前預測值六")加上解量化后的殘
差信號值進行加權(quán)并求和以分別獲得新的或當前的預測值/的權(quán)重。
在量化器56中,對減法器42所獲得的預測余數(shù)r(n)進行均勻量化, 即具有均勻量化步長的量化,其中,步長A(n)是時變的,并由步長適 配模塊以后向自適應(yīng)方式(即從量化殘差信號到先前的殘差信號 r(m<n))分別計算或確定。更準確地,均勻量化器56對每個殘差信號 r(n)輸出量化殘差值q(n),可表示為q(n)—(n) A(n),可將其稱為具有 索引的臨時量化步長。限幅器58還將臨時量化索弓U(n)限幅至量C = [-c;c],其中c是常數(shù)c e{l,2,...}。具體地,限幅器58被實現(xiàn)為將在li(n)一 c之內(nèi)的所有臨時索引值i(n)設(shè)置為-c或c (根據(jù)哪個更接近)。僅分別通過限幅或限制,限幅器58將索引序列或系列ic(n)分別輸出至比特流 產(chǎn)生器24、解量化器50和步長適配塊54或延遲元件62,因為延遲部件 62和本實施例中的所有其他延遲部件將輸入值延遲了一個樣本。
現(xiàn)在,通過步長適配塊54來實現(xiàn)后向自適應(yīng)步長控制,其中,步 長適配塊54使用延遲部件62所延遲的過去的索引序列值ie(n)來不斷地 適配步長A(n),以將限幅器58所限制的區(qū)域(即由"允許的"量化索 引或?qū)?yīng)的量化等級分別設(shè)定的區(qū)域)設(shè)置為未量化殘差值r(n)的出 現(xiàn)統(tǒng)計概率,使得所允許的量化等級在所產(chǎn)生的限幅的量化索引序列 流ic(n)中盡可能均勻地出現(xiàn)。具體地,例如,步長適配模塊60例如使 用兩個緊接在前的限幅量化索引i。(n-l)和i2(n-2)以及前一次確定的步 長值A(chǔ)(n-l)至A(n)=卩A(n-l) + S(n)來計算當前的步長A(n),其中(3 e[O.O;l.O[, S(n) = S0, (|ic(n-l) + ie(n-2)^ I); 5(n)-S,,其中(卩c(n-l)十 ic(n-2)|>I),其中,5Q、 ^和I以及(3是適當調(diào)整的常數(shù)。
如以下參照圖5更詳細地討論的,解碼器使用所獲得的量化索引
序列ie(n)和步長序列A(n),步長序列A(n)還利用后向自適應(yīng)方式來計
算,以通過計算ic(n"A(n)來重構(gòu)解量化的殘差值序列qc(n),這也在圖
1中的編碼器10中執(zhí)行,即由預測裝置20中的解量化器50執(zhí)行。與解碼
器側(cè)類似,以逐樣本的方式,將按照該方式重構(gòu)的殘差值序列qc(n)與 預測值六")相加,其中在編碼器10中,通過加法器48來執(zhí)行該相加。
盡管被分別重構(gòu)或解量化,但是在編碼器10中,除了計算后續(xù)預測值 六n)之外,不再使用按照該方式獲得的預濾波信號,在解碼器側(cè),后
濾波器由此產(chǎn)生解碼的音頻樣本序列y(n),該后濾波器取消了預濾波 器34進行的歸一化。
由于限幅,在量化索引序列qc(n)中引入的量化噪聲不再是白噪 聲。而是其頻譜形成了預濾波信號的一個復制。為了說明這一點,現(xiàn) 在簡要地參照圖3,圖3分別在圖形a、 b和c中示出了不同數(shù)目的量化等 級或量化階的預濾波信號的PSD (上圖)和量化誤差的PSD (各下圖), 即圖形a中針對C-[-15; 15],圖形b中針對[-7; 7]的限幅器范圍,以及圖 形c中針對[-l; l]的限幅范圍。為了清楚原因,還應(yīng)注意,以-10dB的偏 移畫出了每個圖形A-C中誤差PSD的PSD過程。可以看到,預濾波信號與功率為(72= 34的有色噪聲相對應(yīng)。在步長A-1的量化中,信號位于 [-21; 21]之內(nèi),即預濾波信號的樣本分別具有位于該域之內(nèi)的出現(xiàn)分 布或形成在該域之內(nèi)的直方圖。對于圖3中的圖形a至c,如上所述,量 化范圍被限制為a)中的[-15; 15]、 b)中的[-7; 7]和c)中的[-l; l]。將量 化誤差作為未量化預濾波信號與解碼的預濾波信號之差來度量??梢?看出,通過增大限幅,或隨著對量化等級數(shù)目的限制的增加,向預濾 波信號添加量化噪聲,該量化噪聲復制了預濾波信號的PSD,其中, 復制的程度分別取決于所應(yīng)用的限幅的硬度(hardness)或程度。由 此可見,在后濾波之后,解碼器側(cè)的量化噪聲頻譜更多地復制音頻輸 入信號的PSD。這意味著,在解碼之后,量化噪聲保持在信號頻譜之 下。圖2示意了這樣的效果,在圖形a中,針對后向自適應(yīng)預測的情況, 即根據(jù)上述比較ULD方案的預測的情況,在圖形b中,針對根據(jù)圖l的 應(yīng)用了限幅的前向自適應(yīng)預測的情況,分別示出了歸一化頻域中的三 個過程,即自上而下分別為信號PSD (即音頻信號的PSD)、量化誤 差PSD或解碼后的量化噪聲(直線)以及掩蔽閾值(虛線)??梢钥闯觯?對于比較ULD編碼器(圖2a),量化噪聲被形成為類似于掩蔽閾值,并 對于信號部分超過了信號頻譜?,F(xiàn)在,圖2b中清晰地示意了分別與隨 后的量化等級數(shù)目的限幅或限制相結(jié)合的預濾波信號的前向自適應(yīng)預 測的效果,從圖2b可以看到,量化噪聲總是低于信號頻譜,其形狀表 現(xiàn)出信號頻譜和掩蔽閾值的混合。在收聽測試中,已經(jīng)發(fā)現(xiàn),根據(jù)圖 2b的編碼人工效應(yīng)不那么虛假,即所感知的收聽質(zhì)量更好。
圖l的編碼器的操作模式的上述描述集中于預濾波信號f(n)的后 處理,以用于獲得要向解碼器側(cè)發(fā)送的限幅的量化索引ic(n)。由于它 們源自索引數(shù)目恒定而有限的量,因此,在輸出14的編碼數(shù)據(jù)流中,
可以使用相同的比特數(shù)來表示它們中的每一個。因此,例如,比特流 產(chǎn)生器24使用將量化索引映射至可以由預定比特數(shù)m來表示的m個比
特字的單射(injective)映射。
以下描述討論將系數(shù)計算模塊28和36分別計算的預濾波器或預
測系數(shù)傳送至解碼器側(cè),即具體利用針對系數(shù)編碼器30和38的結(jié)構(gòu)的
實施例。如圖所示,根據(jù)圖4的實施例的系數(shù)編碼器包括LSF轉(zhuǎn)換模塊102、 第一減法器104、第二減法器106、具有均勻且可調(diào)整的量化步長的均 勻量化器108、限幅器IIO、解量化器112、第三加法器114、兩個延遲 部件116和118、分別具有固定濾波器系數(shù)或恒定濾波器系數(shù)的預測濾 波器120、以及步長適配模塊122。要編碼的濾波器系數(shù)來自輸入124, 其中,提供了輸入126用于輸出編碼表示。
LSF轉(zhuǎn)換模塊102的輸入直接跟著輸入124。減法器104使用其非反 相輸入和輸出連接在LSF轉(zhuǎn)換模塊102的輸出與減法器106的第一輸入 之間,其中,將常數(shù)le施加至減法器104的輸入。減法器106使用其非 反相輸入和輸出連接在第一減法器104與量化器108之間,其中,其反 相輸入與預測濾波器120的輸出相耦合。預測濾波器120與延遲部件118 和加法器114一起形成了閉環(huán)預測器,其中,它們串聯(lián)在具有反饋的回 路中,以使得延遲部件U8連接在加法器114的輸出與預測濾波器120 的輸入之間,預測濾波器120的輸出與加法器114的第一輸入連接。其 余結(jié)構(gòu)大體上與編碼器10的裝置22之一相對應(yīng),即量化器108連接在減 法器106的輸出與限幅器110的輸入之間,限幅器110的輸出還與輸出 126、延遲部件116的輸入以及解量化器112的輸入連接。延遲部件116 的輸出與步長適配模塊122的輸入連接,從而一起形成了步長適配塊。 步長適配模塊122的輸出與量化器108的步長控制輸入以及解量化器 112連接。解量化器112的輸出與加法器114的第二輸入連接。
在以上描述了系數(shù)編碼器的結(jié)構(gòu)之后,下面再次參照圖l,描述 其操作模式。通過使用由根據(jù)圖4的結(jié)構(gòu)實現(xiàn)的恒定比特率編碼方案, 分別執(zhí)行預濾波器和預測或預測器系數(shù)的傳送,或其者編碼。然后, 在LSF轉(zhuǎn)換模塊102中,首先將濾波器系數(shù)(即分別為預濾波器或預測 系數(shù))分別轉(zhuǎn)換為LSF值l(n),或轉(zhuǎn)移至LSF域。然后,圖4中的其余元 件如下對每個譜線頻率l(n)進行處理。這意味著,以下描述僅涉及一個 譜線頻率,其中,對所有譜線頻率執(zhí)行過程的處理。例如,模塊102 對每個表示掩蔽閾值的預濾波器系數(shù)的集合或預測預濾波信號的預測 系數(shù)塊產(chǎn)生LSF值。減法器104從計算的值l(n)中減去恒定參考值le,其 中,le的充分范圍例如從0至7T。減法器106從產(chǎn)生的差ld(n)中減去預測值/:("),該預測值由包括具有固定系數(shù)A(z)的預測濾波器120 (例如線
性濾波器)在內(nèi)的閉環(huán)預測器120、 118和114來計算。自適應(yīng)步長量化
器108對剩余值(即殘差值)進行量化,其中,限幅器U0將量化器108
輸出的量化索引限幅至由其接收的量化索引的子集,例如,對于由限
幅器110輸出的所有限幅的量化索弓Ue(n),適用以下關(guān)系V : U(n) e
{-1,0,1}。對于LSF殘差量化器108的A(n)的量化步長適配,步長適配模
塊122和延遲部件116例如利用關(guān)于參照圖1的步長適配塊54所描述的
方式來協(xié)作,然而可能利用不同的適配函數(shù)或利用不同的常數(shù)J3、 I、
5o、 5,和I。盡管量化器108使用當前步長來將當前殘差值量化為le(n),
解量化器112使用步長A,(n)再次對該索引值le(n)進行解量化,并向加法
器114提供產(chǎn)生的針對LSF殘差值的重構(gòu)值(減法器106已輸出的),加 法器114將該值與對應(yīng)的預測值&(w)相加,并將經(jīng)由延遲部件118延遲
一個樣本的預測值提供給濾波器120,用以計算下一個LSF值ld(n)的預 測LSF值i^n)。
如果利用圖4所述的方式來實現(xiàn)兩個系數(shù)編碼器30和38,則圖l中 的編碼器10滿足恒定比特率條件,而無需使用任何環(huán)。由于LPC系數(shù) 的逐塊前向適配和所應(yīng)用的編碼方案,不需要顯式地復位預測器。
在以下討論根據(jù)圖1和4的編碼器所獲得的收聽測試結(jié)果之前,下 面參照圖5和6,討論根據(jù)本發(fā)明的實施例的解碼器的結(jié)構(gòu),該結(jié)構(gòu)適 于對來自該編碼器的編碼數(shù)據(jù)流進行解碼。圖6也示出了圖1中的系數(shù) 解碼器的結(jié)構(gòu)。
在圖5中,總體上由200表示的解碼器包括輸入202,用于接收 編碼數(shù)據(jù)流;輸出204,用于輸出解碼音頻流y(n);解量化裝置206, 具有數(shù)目有限且恒定的量化等級;預測裝置208;重構(gòu)裝置210;以及 后濾波器裝置212。此外,提供了提取器214,提取器214與輸入202相 耦合,并被實現(xiàn)為從輸入的編碼比特流中提取量化并限幅的預濾波殘 差信號ic(n)、關(guān)于預濾波器系數(shù)的編碼信息以及關(guān)于預測系數(shù)的編碼 信息,因為系數(shù)編碼器30和38 (圖l)已經(jīng)產(chǎn)生了這些編碼信息,并通 過各自輸出將這些編碼信息輸出。解量化裝置206與提取器214相耦合, 以從提取器214獲得量化索引ic(n),并對這些索引執(zhí)行解量化,將這些索引解量化為有限且恒定數(shù)目的量化等級,即——放入與上述相同的
表示——{-c A(n); c A(n)},以分別獲得解量化或重構(gòu)的預濾波信號 qc(n)。預測裝置208與提取器214相耦合,以獲得預濾波信號的預測信
號,即根據(jù)關(guān)于預測系數(shù)的信息來獲得力。)。預測裝置208與提取器214
相耦合,以從關(guān)于預測系數(shù)的信息中獲得預濾波信號的預測信號,即 其中,根據(jù)圖5的實施例的預測裝置208也與重構(gòu)裝置210的輸
出連接。提供重構(gòu)裝置210用于基于預測信號/(打)和解量化殘差信號
qc(n)來重構(gòu)預濾波信號。然后,隨后的后濾波器裝置2I2使用該重構(gòu), 基于從提取器214接收的預濾波器系數(shù)信息來對預濾波信號進行濾波, 從而消除關(guān)于掩蔽閾值的歸一化,以獲得解碼的音頻信號y(n)。
在以上描述了圖5的解碼器的基本結(jié)構(gòu)之后,將更詳細地討論解 碼器200的結(jié)構(gòu)。具體地,解量化器206包括延遲部件216和步長自適配 模塊218組成的步長適配塊以及均勻解量化器220。解量化器220的數(shù)據(jù) 輸入與提取器214的輸出連接,以獲得量化索引ic(n)。此外,步長適配 模塊218經(jīng)由延遲部件216與提取器214的這個輸出連接,步長適配模塊 218的輸出還與解量化器220的步長控制輸入連接。解量化器220的輸出 與形成重構(gòu)裝置210的加法器222的第一輸入連接。預測裝置208包括系 數(shù)解碼器224、預測濾波器226以及延遲部件228。系數(shù)解碼器224、加 法器222、預測濾波器226和延遲部件228在其操作模式及其連接方面與 編碼器10的元件40、 44、 46和48相對應(yīng)。具體地,預測濾波器226的輸 出與加法器222的另一個輸入連接,加法器222的輸出還經(jīng)由延遲部件 228反饋至預測濾波器226的數(shù)據(jù)輸入,并與后濾波器裝置212相耦合。 系數(shù)解碼器224連接在提取器224的另一輸出與預測濾波器226的適配 輸入之間。該后濾波器裝置包括系數(shù)解碼器230和后濾波器232,其中, 后濾波器232的數(shù)據(jù)輸入與加法器22的輸出連接,后濾波器232的數(shù)據(jù) 輸出與輸出204連接,而后濾波器232的適配輸入與用于對濾波器232 進行適配的系數(shù)解碼器230的輸出連接,系數(shù)解碼器230的輸入還與提 取器214的另一輸出連接。
如上所述,提取器214從輸入202處的編碼數(shù)據(jù)流中提取表示量化的預濾波殘差信號的量化索引ie(n)。在均勻解量化器220中,將這些量 化索引解量化為量化殘差值qc(n)。固有地,由于在編碼器側(cè)已經(jīng)對量 化索引ic(n)進行了限幅,因此該解量化仍保持在所允許的量化等級內(nèi)。 利用與圖1的編碼器的步長適配塊54中相同的方式,利用后向適配方式 執(zhí)行步長適配。在沒有傳輸誤差的情況下,解量化器220產(chǎn)生與圖1的 編碼器的解量化器50相同的值。因此,元件222、 226、 228和224基于 編碼的預測系數(shù)來獲得與圖1的編碼器10中在加法器48的輸出處所獲 得的相同的結(jié)果,即分別獲得解量化或重構(gòu)的預濾波信號。在后濾波 器232中,使用與掩蔽閾值相對應(yīng)的傳輸函數(shù),對重構(gòu)的預濾波信號進 行濾波,其中,系數(shù)解碼器230對后濾波器232進行自適應(yīng)調(diào)整,系數(shù) 解碼器230基于預濾波器系數(shù)信息,分別適當?shù)卣{(diào)整后濾波器232或其 濾波器系數(shù)。
假定向編碼器10提供了如圖4所示地實現(xiàn)的系數(shù)編碼器30和38, 則如圖6所示地構(gòu)造編碼器200的系數(shù)解碼器224和230以及編碼器10的 系數(shù)解碼器40。可以看出,系數(shù)解碼器包括兩個延遲部件302和304、 與延遲部件302—起形成步長適配塊的步長適配模塊306、具有均勻步 長的均勻解量化器308、預測濾波器310、兩個加法器312和314、 LSF 重轉(zhuǎn)換模塊316以及用于接收具有恒定偏移-le的量化LSF殘差值le(n)的 輸入318和用于分別輸出重構(gòu)的預測或預濾波器系數(shù)的輸出320。由此, 延遲部件302連接在步長適配模塊306與輸入318之間,解量化器308的 輸入也與輸入318連接,解量化器308的步長適配輸入與步長適配模塊 306的輸出連接。元件302、 306和308的操作模式和連接與圖4中的元件 112、 U6和122相對應(yīng)。由延遲部件304、預測濾波器310和加法器312 組成的閉環(huán)預測器與解量化器308的輸出連接,其中,通過將延遲部件 304連接在加法器312的輸出與預測濾波器310的輸入之間、將加法器 312的第一輸入與解量化器308的輸出連接以及將加法器312的第二輸 入與預測濾波器310的輸出連接,將延遲部件304、預測濾波器310和加 法器312連接在公共回路中。元件304、 310和312在其操作模式和連接 方面與圖4中的元件120、 118和114相對應(yīng)。此外,加法器312的輸出與 加法器314的第一輸入連接,在加法器314的第二輸入施加常數(shù)值lc,其中,根據(jù)本實施例,常數(shù)le是一個協(xié)議量,該量被呈現(xiàn)給編碼器和 解碼器,因此不必作為輔助信息的一部分來傳送,盡管后者也是可能
的。LSF重轉(zhuǎn)換模塊316連接在加法器314的輸出與輸出320之間。
解量化器308對在輸入318處輸入的LSF殘差信號索引le(n)進行解 量化,其中,解量化器308使用后向自適應(yīng)步長值A(chǔ)(n),后向自適應(yīng)步 長值A(chǔ)(n)是由步長適配模塊306利用后向適配的方式從已經(jīng)解量化的 量化索引(即已由延遲部件302延遲一個樣本的量化索引)中確定的。 加法器312將預測信號添加到解量化的LSF殘差值中,這從加法器312 先前已經(jīng)計算的和來計算延遲部件304和預測濾波器210的組合,從而 表示了重構(gòu)的LSF值(僅由常數(shù)偏移le提供了恒定偏移)。加法器314 通過向加法器312輸出的LSF值添加le來校正該偏移。因此,在加法器 314的輸出處,產(chǎn)生了重構(gòu)的LSF值,模塊316將其從LSF域分別轉(zhuǎn)換回 重構(gòu)的預測或預濾波器系數(shù)。因此,LSF重轉(zhuǎn)換模塊316考慮了所有的 譜線頻率,而圖6中的其他元件的討論局限于對一個譜線頻率的描述。 然而,元件302-314也在其他譜線頻率處執(zhí)行上述措施。
在提供了上述編碼器和解碼器的實施例之后,下面將基于圖7來 呈現(xiàn)收聽測試結(jié)果,該結(jié)果是通過根據(jù)圖l、 4、 5和6的編碼方案而獲 得的。在所執(zhí)行的測試中,在根據(jù)省略了仲裁員的MUSHRA標準的收 聽測試中,已經(jīng)測試了根據(jù)圖l、 4和6的編碼器和根據(jù)在附圖描述的開 始處所討論的比較ULD編碼方案的編碼器。在安靜的辦公室環(huán)境中, 在具有外部數(shù)模轉(zhuǎn)換器和STAX放大器/耳機的膝上型電腦上執(zhí)行 MUSHRA測試。 一組8個測試收聽者由專家和非專家收聽者組成。在 參與者開始收聽測試之前,他們有機會收聽測試集合。使用MPEG測 試集合中的12個單聲道音頻文件來執(zhí)行測試,其中,所有文件具有 32kHz的采樣頻率,即es01 (Suzanne Vega)、 es02 (男性語音,德語)、 es03 (女性語音,英語)、sc01 (小號)、sc02 (管弦樂)、sc03 (流行 音樂)、si01 (羽管鍵琴)、si02 (響板)、si03 (律管)、sm01 (風笛)、 sm02 (鐘琴)、sm03 (彈撥樂器)。
對于比較ULD編碼方案,在實現(xiàn)中使用了長度為64的后向自適應(yīng) 預測,以及具有64kbit/s的恒定比特率的、用于熵編碼的后向自適應(yīng)Golomb編碼器。相反,為了實現(xiàn)根據(jù)圖l、 4和6的編碼器,使用了長 度為12的前向自適應(yīng)預測器,其中,將不同量化等級的數(shù)目限制為3, 即使得Vn : ic(n) e {-1,0,1}。這與編碼的輔助信息一起產(chǎn)生了64kbit/s 的恒定比特率,這意味著相同的比特率。
圖7示出了MUSHRA收聽測試的結(jié)果,其中,分別針對12個測試 片斷,并針對所有片斷上的總體結(jié)果示出了平均值和95%的置信區(qū)間。 只要置信區(qū)間重疊,則在編碼方法之間沒有統(tǒng)計上的顯著差異。
片斷es01 (Suzanne Vega)是根據(jù)圖l、 4、 5和6的編碼方案在較 低比特率下的優(yōu)越性的很好的示例。與比較ULD編碼方案相比,解碼 信號頻譜的較高部分示出了較少的可聽見人工效應(yīng)。這導致了根據(jù)圖 1、 4、 5和6的方案具有明顯更高的評級。
對于比較ULD編碼方案,片斷sm02 (鐘琴)的信號瞬變具有較高 的比特率要求。利用所使用的64kbit/s,比較ULD編碼方案在全部樣本 塊上產(chǎn)生了虛假的編碼人工效應(yīng)。相反,根據(jù)圖l、 4和6操作的編碼器 分別提供了明顯改善的收聽質(zhì)量或感知質(zhì)量。將圖7中的圖形右側(cè),根 據(jù)圖l、 4和6形成的編碼方案的總體評級獲得了比對比ULD編碼方案 明顯更好的評級??傮w而言,在給定的測試條件下,該編碼方案得到 了 "良好音頻質(zhì)量"的總體評級。
總而言之,根據(jù)上述實施例中,產(chǎn)生了具有低延遲結(jié)果的音頻編 碼方案,該方案使用逐塊前向自適應(yīng)預測以及限幅/限制來代替后向自 適應(yīng)逐樣本預測。噪聲整形不同于比較ULD編碼方案。收聽測試表明, 在較低比特率的情況下,上述實施例優(yōu)于根據(jù)比較ULD編碼方案的后 向自適應(yīng)方法。隨后,上述實施例是用于縮小高質(zhì)量語音編碼器與具 有低延遲的音頻編碼器之間的比特率差異的候選方案。總體上,對于 減小的比特率,上述實施例提供了一種具有6-8ms的非常低的延遲的音 頻編碼方案的可能性,與比較ULD編碼器相比,該音頻編碼方案具有 以下優(yōu)點。該方案相對于高量化誤差更為魯棒,具有附加的噪聲整形 能力,具有更好的獲得恒定比特率的能力,并表現(xiàn)出更好的誤差恢復 行為。實施例通過一種修正的方式,增大掩蔽閾值之上的量化噪聲, 即通過向掩蔽閾值加入信號頻譜來取代均勻地增大掩蔽閾值至某個程度,解決了在比較ULD編碼方案的情況下在沒有信號的位置處出現(xiàn)可
聽見的量化噪聲的問題。按照這種方式,在沒有信號的位置處不存在 可聽見的量化噪聲。
換言之,上述實施例與比較ULD編碼方案的不同之處在于下列方 式。在比較ULD編碼方案中,使用了后向自適應(yīng)預測,這意味著基 于逐樣本,根據(jù)先前解碼的信號值來更新預測濾波器A(z)的系數(shù)。使 用具有可變步長的量化器,其中,通過使用來自熵編碼器的信息,使 得步長適配全部128個樣本,該信息作為輔助信息被發(fā)送至解碼器側(cè)。 通過這一過程,增大了量化步長,這向預濾波信號添加了更多白噪聲, 從而均勻地增大了掩蔽閾值。在比較ULD編碼方案中,如果使用前向 自適應(yīng)逐塊預測來代替后向自適應(yīng)預測,這意味著,針對未量化預濾 波樣本中的128個樣本,計算一次預測濾波器A(z)的系數(shù),并將其作為
輔助信息來發(fā)送,此外如果通過來自熵編碼器、并作為輔助信息發(fā)送 至解碼器側(cè)的信息來使步長適配128個樣本,則如比較ULD編碼方案
的情況一樣,量化步長仍增大,但是任何量化均不影響預測器的更新。 上述實施例僅使用前向自適應(yīng)逐塊預測,其中,量化器另外僅具有給 定數(shù)目2N+1的量化階,該量化階具有固定的步長。對于具有在量化器 范圍[-NA;NA]之外的幅度的預濾波信號x(n),將量化信號限制在 [-NA;NA]。這樣產(chǎn)生其PSD不再是白的、但復制了輸入信號(預濾波 音頻信號)的PSD的量化噪聲。
作為總結(jié),在上述實施例中應(yīng)注意以下內(nèi)容。首先,應(yīng)注意,對 于發(fā)送關(guān)于掩蔽閾值的表示的信息,存在不同的可能性,該信息是由 編碼器內(nèi)的感知模型模塊26產(chǎn)生的,分別發(fā)送至預濾波器34或預測濾 波器44,并發(fā)送至解碼器,具體發(fā)送至后濾波器232和預測濾波器226。 具體地,應(yīng)注意,不要求編碼器內(nèi)的系數(shù)解碼器32和40精確地接收與 在編碼器的輸出14處輸出的、以及在解碼器的輸出202接收的掩蔽閾值 相關(guān)的信息。更合理地,例如,在根據(jù)圖4的系數(shù)編碼器30的結(jié)構(gòu)中, 所獲得索引le(n)以及預濾波殘差信號量化索引ic(n)也可以僅源自三個 值的量,即-1、 0、 1,比特流產(chǎn)生器24可以將這些索引清晰地映射至 對應(yīng)的n比特字。分別根據(jù)如圖l、 4或5、 6的實施例,將每個源自量-1、0、 l的預濾波器量化索引、預測系數(shù)量化索引和/或預濾波器量化索引,
5個一組地映射至8比特字,這與將35種可能性映射至28比特字相對應(yīng)。 由于該映射不是滿射的,因此若干8比特字保持為未使用,可以利用其 他方式來使用它們,例如用于同步等等。
在這種情況下,應(yīng)注意以下內(nèi)容。在上文中,參考圖6描述的系 數(shù)解碼器32和230的結(jié)構(gòu)是相同的。在這種情況下,預濾波器34和后濾 波器232被實現(xiàn)為使得當應(yīng)用相同的濾波器系數(shù)時,它們具有互為倒數(shù) 的傳輸函數(shù)。然而,以下過程當然也是可能的,例如,系數(shù)編碼器32 執(zhí)行附加的濾波器系數(shù)轉(zhuǎn)換,以使得該預濾波器具有大體與掩蔽閾值 的倒數(shù)相對應(yīng)的傳輸函數(shù),而該后濾波器具有大體與掩蔽閾值相對應(yīng) 的傳輸函數(shù)。
在上述實施例中,假定在模塊26中計算掩蔽閾值。然而,應(yīng)注意, 所計算的閾值不必與心理聲學閾值精確對應(yīng),而是可以表示其或多或 少精確的估計,可以不考慮全部心理聲學效應(yīng)而僅考慮其中的一些。 具體地,該閾值可以表示有意地經(jīng)過與對心理聲學的掩蔽閾值的估計 相反的修正的心理聲學引起的閾值。
此外,應(yīng)注意,在對預濾波殘差信號值進行量化中,不需要步長 的后向自適應(yīng)適配。更合理地,在特定應(yīng)用情況下,固定步長是足夠 的。
此外,應(yīng)注意,本發(fā)明不局限于音頻編碼領(lǐng)域。更合理地,要編 碼的信號也可以是用于剌激計算機空間手套中的指尖的信號,其中, 在這種情況下,感知模型26考慮人類的觸覺不再能感知到的特定的觸 覺特性。例如,要編碼的信息信號的另一個示例是視頻信號。具體地, 要編碼的信息信號可以分別是像素或圖像點的亮度信息,其中,感知 模型26也可以考慮不同的時間、位置和頻率心理視覺遮蔽效應(yīng),例如
視覺掩蔽閾值。
此外,應(yīng)注意,量化器56和限幅器58或量化器108和限幅器110分 別不必是分離的組件。更合理地,也可以由單個映射來執(zhí)行未量化值 至量化值/限幅值的映射。另一方面,可以使用除法器接著是步長均勻 且恒定的量化器的串聯(lián)來分別實現(xiàn)量化器56和量化器108,其中,該除法器可以使用從各自的步長適配模塊中獲得的步長值A(chǔ)(n)作為除數(shù), 而要編碼的殘差信號形成被除數(shù)??梢蕴峁┎介L恒定且均勻的量化器 作為簡單的舍入模塊,該模塊將除法結(jié)果舍入至下一個整數(shù),基于此, 隨后的限幅器可以如上所述地將該整數(shù)限制為具有所允許的量C的整 數(shù)。在各解量化器中,簡單地使用A(n)作為乘數(shù)來執(zhí)行均勻解量化。
此外,應(yīng)注意,上述實施例局限于具有恒定比特率的應(yīng)用。然而, 本發(fā)明不局限于此,因此,在這些實施例中使用的例如通過限幅預濾 波信號來進行量化僅是一種可能的備選??梢允褂镁哂蟹蔷€性特性曲 線的量化函數(shù)來代替限幅。為了說明這一點,參照圖8a至圖8c。圖8a 示出了上述使用的在三個量化階上產(chǎn)生限幅的量化函數(shù),即具有3個階 402a、 b、 c的階梯函數(shù),該函數(shù)將未量化值(x軸)映射至量化索引(y 軸),其中也標記了量化階高或量化步長A(n)??梢钥闯觯哂贏(n)/2 的未量化值被分別限幅至各自的下一階402a或c。圖8b總體上示出了產(chǎn) 生限幅至2n+l個量化階的量化函數(shù)。再次示出了量化步長A(n)。圖8a 和8b的量化函數(shù)表示了這樣的量化函數(shù),即其中以均勻的方式(即使 用相同的階高)進行閾值-A(n)與A(n)或-NA(n)與NA(n)之間的量化,基 于這種方式,量化階函數(shù)以平坦的方式行進,這與限幅相對應(yīng)。圖8c 示出了非線性量化函數(shù),其中,該量化函數(shù)在-N厶(n)與NA(n)之間的區(qū) 域的行進不是完全平坦的,而是與第一區(qū)域相比具有較低的傾斜,即 分別具有較大的步長或階高。如在上述實施例中的情況一樣,這種非 線性量化不固有地產(chǎn)生恒定比特率,但是也產(chǎn)生上述量化噪聲的變形, 使得量化噪聲調(diào)整為信號PSD。僅作為一種預防性措施,應(yīng)注意,參 照圖8a-c,可以使用非均勻量化取代均勻量化區(qū)域,在非均勻量化中, 例如,階高連續(xù)增大,其中,在保持其相互關(guān)系的同時,可以通過階 高調(diào)整值A(chǔ)(n)來縮放階高。因此,例如,可以在各量化器中通過非線 性函數(shù)將未量化值映射至中間值,其中,在映射之前或之后執(zhí)行與A(n) 的相乘,最終,對所產(chǎn)生的值進行均勻量化。在各解量化器中,執(zhí)行 相反的過程,即通過A(n)的均勻解量化,接著是反非線性映射,或相 反地,首先進行非線性轉(zhuǎn)換映射,接著使用A(n)進行解量化。最終, 應(yīng)注意,當階高可以被調(diào)整至足夠高,或量化足夠粗略,使得對于要量化的信號(如預濾波信號)的信號統(tǒng)計量,該量化有效地如非線性
量化一樣工作時,通過獲得上述誤差PSD的變形效果,實現(xiàn)連續(xù)均勻
(即線性)的量化也是可能的,其中,預測的前向自適應(yīng)再次使該階 高調(diào)整成為可能。
此外,在編碼比特流的處理方面,上述實施例也可以變化。
具體地,也可以分別省略比特流產(chǎn)生器和提取器214。
不同的量化索引,即預濾波信號的殘差值、預濾波器系數(shù)的殘差 值和預測系數(shù)的殘差值也可以分別通過單獨的信道,并行地互相傳送、 存儲或以其他方式為解碼所用。另一方面,在恒定比特率不是必需的 情況下,也可以對這些數(shù)據(jù)進行熵編碼。
具體地,可以單獨實現(xiàn)或以子程序過程的結(jié)合來實現(xiàn)圖l、 4、 5 和6的塊中的上述功能??蛇x地,以集成電路的形式來實現(xiàn)本發(fā)明的設(shè) 備,例如其中將這些塊實現(xiàn)為ASIC的單獨電路部分。
特別地,應(yīng)注意,根據(jù)情況,可以以軟件來實現(xiàn)本發(fā)明的方案。 實現(xiàn)方式可以是在數(shù)字存儲介質(zhì)上,尤其是具有電子可讀的控制信號 的光盤或CD上,所述控制信號可以與可編程計算機系統(tǒng)協(xié)作來執(zhí)行各 方法。 一般地,因此,本發(fā)明也在于具有程序代碼的計算機程序產(chǎn)品, 所述程序代碼存儲在機器可讀載體上,當計算機程序產(chǎn)品在計算機上 運行時,所述程序代碼執(zhí)行本發(fā)明的方法。換言之,因此,本發(fā)明可 以被認為是具有程序代碼的計算機程序,當計算機程序在計算機上運 行時,所述程序代碼執(zhí)行本方法。
權(quán)利要求
1. 一種用于將信息信號編碼為編碼信息信號的設(shè)備,包括用于確定的裝置(16),通過使用感知模型來確定心理感知引起的閾值的表示,所述表示指示了信息信號中與感知不相關(guān)的部分;用于濾波的裝置(18),對所述信息信號進行濾波,以關(guān)于所述心理感知引起的閾值來對所述信息信號進行歸一化,獲得預濾波信號;用于預測的裝置(20),用于以前向自適應(yīng)方式來預測所述預濾波信號,以獲得預測信號、預濾波信號的預測誤差以及預測系數(shù)的表示,所述預濾波信號是能夠基于預測信號、預濾波信號的預測誤差以及預測系數(shù)的表示來重構(gòu)的;以及用于量化的裝置(22),對所述預測誤差進行量化,以獲得量化預測誤差,其中,所述編碼信息信號包括關(guān)于心理感知引起的閾值的表示、預測系數(shù)的表示以及量化預測誤差的信息。
2. 如權(quán)利要求l所述的設(shè)備,其中,所述用于量化的裝置(22) 被實現(xiàn)為通過量化函數(shù)來對預測誤差進行量化,所述量化函數(shù)將預測 誤差的未量化值映射至量化階的量化索引,以及所述量化函數(shù)的過程 在閾值之下比在閾值之上更陡。
3. 如權(quán)利要求1或2所述的設(shè)備,其中,所述用于量化的裝置(22)被實現(xiàn)為以后向自適應(yīng)方式從所述量化預測誤差中獲得所述量化函數(shù) 的量化階高A(n)。
4. 如之前任一權(quán)利要求所述的設(shè)備,其中,所述用于量化預測誤 差的裝置(22)被實現(xiàn)為使得通過量化函數(shù)的限幅來對預測誤差的未 量化值進行量化,所述量化函數(shù)將預測誤差的未量化值映射至恒定且 有限的第一數(shù)目的量化階的量化索引,以獲得所述量化預測誤差。
5. 如權(quán)利要求4所述的設(shè)備,其中,所述用于量化的裝置(22)被實現(xiàn)為以后向自適應(yīng)方式,根據(jù)量化預測誤差的兩個過去的量化 索引ic(n-l)和i2(n-2),根據(jù)A(n),(n-l) + 5(n),獲得用于對預測誤差 的值(r(n))進行量化的量化函數(shù)的量化階高A(n),其中P e
,對于lic(n-l) + ic(n畫2)pl, S(n) = 5。,對于lie(n-l) + ic(n-2)| >1, S(n"5, 其中,SQ、 S!、 I是恒定參數(shù),并且A(n-l)表示所獲得的用于對量化誤 差的先前值進行量化的量化階高。
6. 如權(quán)利要求4或5所述的設(shè)備,其中,所述用于量化的裝置(22) 被實現(xiàn)為以非線性方式來對量化誤差進行量化。
7. 如權(quán)利要求4至6中任一項所述的設(shè)備,其中,所述恒定且有限 的第一數(shù)目是3。
8. 如之前任一權(quán)利要求所述的設(shè)備,其中,所述用于確定的裝置 (16)被實現(xiàn)為以逐塊的方式根據(jù)所述信息信號來確定所述心理感知引起的閾值。
9. 如之前任一權(quán)利要求所述的設(shè)備,其中,所述用于確定的裝置 (16)被實現(xiàn)為在LSF域中表示所述心理感知引起的閾值。
10. 如之前任一權(quán)利要求所述的設(shè)備,其中,所述用于確定的裝 置(16)被實現(xiàn)為以逐塊的方式確定所述心理感知引起的閾值,并將 其以濾波系數(shù)表示,對濾波器系數(shù)進行預測,并通過另一量化函數(shù)對 預測產(chǎn)生的濾波器系數(shù)殘差信號進行量化,所述另一量化函數(shù)將濾波 器系數(shù)殘差信號的未量化值映射至量化階的量化索引,以獲得量化的 濾波器系數(shù)殘差信號,所述另一量化函數(shù)的過程在另一閾值之下比在 所述另一閾值之上更陡,其中,所述編碼信息信號也包括與量化的濾 波器系數(shù)殘差信號有關(guān)的信息。
11. 如權(quán)利要求10所述的設(shè)備,其中,用于確定的裝置(16)被實現(xiàn)為通過所述另一量化函數(shù)的限幅來對濾波器系數(shù)殘差信號的未量 化值進行量化,所述另一量化函數(shù)將濾波器系數(shù)殘差信號的未量化值 映射至恒定且有限的第二數(shù)目的量化階的量化索引。
12. 如權(quán)利要求ll所述的設(shè)備,其中,所述用于確定的裝置(16) 被實現(xiàn)為使得以后向自適應(yīng)方式,基于量化的濾波器系數(shù)殘差信號的 量化索引來執(zhí)行預測。
13. 如權(quán)利要求10至12中任一項所述的設(shè)備,其中,所述用于確定的裝置(16)被實現(xiàn)為通過使用具有恒定系數(shù)的預測濾波器來執(zhí)行 對所述濾波器系數(shù)的預測。
14. 如權(quán)利要求9至13中任一項所述的設(shè)備,其中,所述用于確定的裝置(16)還被實現(xiàn)為在對表示所述心理感知引起的閾值的濾波器系數(shù)進行預測之前,將其與常數(shù)值相減。
15. 如之前任一權(quán)利要求所述的設(shè)備,其中,所述用于以前向自適應(yīng)方式來預測預濾波信號的用于預測的裝置(20)還包括用于確定預測濾波器系數(shù)的裝置(36),用于根據(jù)所述預濾波信 號確定預測濾波器系數(shù);以及用于預測預濾波信號的裝置(44、 446、 48),用于通過受控于所 述預測濾波器系數(shù)的濾波器(44)來預測所述預濾波信號。
16. 如權(quán)利要求15所述的設(shè)備,其中,所述用于確定預測濾波器 系數(shù)的裝置(36)被實現(xiàn)為以逐塊的方式,根據(jù)所述預濾波信號來確 定所述預測濾波器系數(shù)。
17. 如權(quán)利要求15或16所述的設(shè)備,其中,所述用于確定預測濾 波器系數(shù)的裝置(36)被實現(xiàn)為在LSF域中表示所述預測濾波器系數(shù)。
18. 如權(quán)利要求15至17中任一項所述的設(shè)備,其中,所述用于確 定預測濾波器系數(shù)的裝置(36)被實現(xiàn)為以逐塊的方式確定所述預測 濾波器系數(shù),對所述預測濾波器系數(shù)進行預測,并通過第三量化函數(shù) 對預測產(chǎn)生的預測濾波器系數(shù)殘差信號進行量化,所述第三量化函數(shù) 將預測濾波器系數(shù)殘差信號的未量化值映射至量化階的量化索引,以 獲得量化的預測濾波器系數(shù)殘差信號,所述第三量化函數(shù)的過程在第 三閾值之下比在所述第三閾值之上更陡,其中,所述編碼信息信號也 包括與量化的預測濾波器系數(shù)殘差信號相關(guān)的信息。
19. 如權(quán)利要求18所述的設(shè)備,其中,用于確定預測濾波器系數(shù) 的裝置(36)被實現(xiàn)為通過所述第三量化函數(shù),通過限幅來將所述 預測濾波器系數(shù)殘差信號的未量化值量化為第三數(shù)目的量化階的量化 索引,所述第三量化函數(shù)將所述預測濾波器系數(shù)殘差信號的未量化值 映射至恒定且有限的第三數(shù)目的量化階的量化索引。
20. 如權(quán)利要求18所述的設(shè)備,其中,所述用于確定預測濾波器 系數(shù)的裝置(36)被實現(xiàn)為使得以后向自適應(yīng)方式,基于所述預濾波 信號的一個或多個先前塊的量化的預測濾波器系數(shù)殘差信號的量化索引來執(zhí)行預測。
21. 如權(quán)利要求18至19中任一項所述的設(shè)備,其中,所述用于確 定預測濾波器系數(shù)的裝置(36)被實現(xiàn)為使得通過使用具有恒定系數(shù) 的預測濾波器來執(zhí)行所述預測濾波器系數(shù)的預測。
22. 如權(quán)利要求18至21中任一項所述的設(shè)備,其中,所述用于確 定預測濾波器系數(shù)的裝置(36)還被實現(xiàn)為在對所述預測濾波器系數(shù) 進行預測之前,將其與常數(shù)值相減。
23. 如之前任一權(quán)利要求所述的設(shè)備,所述設(shè)備被實現(xiàn)為將音頻 信號或視頻信號編碼為信息信號,其中,所述感知模型是心理聲學模 型,所述心理感知引起的閾值是心理聲學引起的閾值,或所述感知模 型是心理視覺模型,所述心理感知引起的閾值是心理視覺引起的閾值。
24. —種用于將編碼信息信號解碼為解碼信息信號的設(shè)備,所述 編碼信息信號包括關(guān)于心理感知引起的閾值的表示、預測系數(shù)的表示 以及量化預測誤差的信息,所述設(shè)備包括用于解量化的裝置(206),對量化預測誤差進行解量化,以獲得 解量化預測誤差;用于確定預測信號的裝置(208),基于所述預測系數(shù)來確定預測 信號;用于重構(gòu)的裝置(210),基于所述預測信號和所述解量化預測誤 差來重構(gòu)預濾波信號;以及用于對預濾波信號進行濾波的裝置(212),對所述預濾波信號進 行濾波來對關(guān)于所述心理感知引起的閾值的歸一化進行重轉(zhuǎn)換,以獲 得解碼信息信號。
25. 如權(quán)利要求24所述的設(shè)備,其中,所述用于解量化的裝置 (206)被實現(xiàn)為將所述量化預測誤差解量化至有限且恒定數(shù)目的量化階。
26. 如權(quán)利要求25所述的設(shè)備,其中,所述用于解量化的裝置 (206)被實現(xiàn)為以后向自適應(yīng)方式,從己解量化的量化預測誤差的量化索引中獲得量化階之間的量化階高A(n)。
27. 如權(quán)利要求25或26所述的設(shè)備,其中,所述用于解量化的裝置(206)被實現(xiàn)為以后向自適應(yīng)方式,根據(jù)量化預測誤差的兩個過去的量化索引ic(n-l)和i2(n-2),根據(jù)A(n"卩A(n-l) + 5(n),獲得用于對 所述量化預測誤差的量化索引進行解量化的量化階之間的量化階高 A(n),其中p e
,對于卩c(n-l) + ic(n-2)|S I, S(n) = 50,對于卩c(n-l) + ic(n-2)|>I, 5(n):Sp其中,50、 5" I是恒定參數(shù),并且A(n-l)表示 所獲得的用于對ie(n-l)進行解量化的量化階高。
28. 如權(quán)利要求25至27中任一項所述的設(shè)備,其中,所述恒定且 有限的數(shù)目小于或等于32。
29. 如權(quán)利要求25至28中任一項所述的設(shè)備,其中,所述恒定且 有限的數(shù)目是3。
30. 如權(quán)利要求24至29中任一項所述的設(shè)備,其中,所述用于對 預濾波信號進行濾波的裝置(212)包括用于確定感知閾值濾波系數(shù)的裝置(230),用于針對預濾波信號 的塊序列,以逐塊的方式,根據(jù)關(guān)于所述心理感知引起的閾值的表示 的信息來確定感知閾值濾波系數(shù);以及后濾波器(232),用于通過使用所述感知閾值濾波器系數(shù)來對所述預濾波信號進行濾波。
31. 如權(quán)利要求24至30中任一項所述的設(shè)備,其中,所述用于確 定感知閾值濾波系數(shù)的裝置(230)被實現(xiàn)為通過從LSF域的重轉(zhuǎn)換來獲得所述感知閾值濾波器系數(shù)。
32. 如權(quán)利要求24至31中任一項所述的設(shè)備,其中,所述用于確 定感知閾值濾波系數(shù)的裝置(230)被實現(xiàn)為從所述心理感知引起的 閾值的表示中獲得量化的濾波器系數(shù)殘差信號的量化索引;將其解量 化至有限且恒定的第二數(shù)目的量化等級,以獲得解量化的濾波器系數(shù) 殘差信號;預測表示所述心理感知引起的閾值的濾波器系數(shù),并將其 與解量化的濾波器系數(shù)殘差信號相加;以及通過重轉(zhuǎn)換,將所述相加 產(chǎn)生的重構(gòu)的濾波器系數(shù)殘差信號轉(zhuǎn)換為所述感知閾值濾波器系數(shù)。
33. 如權(quán)利要求32所述的設(shè)備,其中,所述用于確定感知閾值濾 波系數(shù)的裝置(230)被實現(xiàn)為使得以后向自適應(yīng)方式,基于已預測 的表示所述心理感知引起的閾值的濾波器系數(shù)來執(zhí)行所述預測。
34. 如權(quán)利要求32或33所述的設(shè)備,其中,所述用于確定感知閾 值濾波系數(shù)的裝置(230)被實現(xiàn)為使得通過使用具有恒定系數(shù)的預 測濾波器來執(zhí)行對表示所述所述心理感知引起的閾值的濾波器系數(shù)的
35. 如權(quán)利要求32至34中任一項所述的設(shè)備,其中,所述用于確 定感知閾值濾波系數(shù)的裝置(230)還被實現(xiàn)為在重轉(zhuǎn)換之前,將所 述相加產(chǎn)生的重構(gòu)的濾波器系數(shù)殘差信號與常數(shù)值相減。
36. 如權(quán)利要求24至37中任一項所述的設(shè)備,其中,所述用于確 定預測信號的裝置(208)還包括用于確定預測濾波器系數(shù)的裝置(224),用于根據(jù)所述編碼信息 信號中包括的預測系數(shù)的表示來確定預測濾波器系數(shù);以及用于預測預濾波信號的裝置(226、 228),用于通過受控于所述 預測濾波器系數(shù)的濾波器(226)來預測所述預濾波信號。
37. 如權(quán)利要求36所述的設(shè)備,其中,所述用于確定預測濾波器 系數(shù)的裝置(224)被實現(xiàn)為以逐塊的方式,針對所述預濾波信號的 塊序列中的塊,確定所述預測濾波器系數(shù)。
38. 如權(quán)利要求36或37所述的設(shè)備,其中,所述用于確定預測濾 波器系數(shù)的裝置(224)被實現(xiàn)為通過從LSF域的重轉(zhuǎn)換來獲得所述預 測濾波器系數(shù)。
39. 如權(quán)利要求36至38中任一項所述的設(shè)備,其中,所述用于確 定預測濾波器系數(shù)的裝置(224)被實現(xiàn)為從所述預測系數(shù)的表示中 獲得量化的預測系數(shù)殘差信號的量化索引;將其解量化至有限且恒定 的第三數(shù)目的量化等級,以獲得解量化的預測系數(shù)殘差信號;對預測 濾波器系數(shù)進行預測,并將其與所述解量化的預測系數(shù)殘差信號相加; 以及通過重轉(zhuǎn)換,將所述相加產(chǎn)生的重構(gòu)的預測系數(shù)殘差信號轉(zhuǎn)換為 預測濾波器系數(shù)。
40. 如權(quán)利要求39所述的設(shè)備,其中,所述用于確定預測濾波器 系數(shù)的裝置(224)被實現(xiàn)為使得以后向自適應(yīng)方式,基于己預測的預測系數(shù)來執(zhí)行所述預測。
41. 如權(quán)利要求39或40所述的設(shè)備,其中,所述用于確定預測濾波器系數(shù)的裝置(224)被實現(xiàn)為使得通過使用具有恒定系數(shù)的預測濾 波器來執(zhí)行對預測系數(shù)的預測。
42. 如權(quán)利要求39至41中任一項所述的設(shè)備,其中,所述用于確 定預測濾波器系數(shù)的裝置(224)還被實現(xiàn)為在重轉(zhuǎn)換之前,將所述 相加產(chǎn)生的重構(gòu)的預測系數(shù)殘差信號與常數(shù)值相減。
43. 如權(quán)利要求24至42中任一項所述的設(shè)備,所述設(shè)備被實現(xiàn)為 將音頻信號或視頻信號解碼為信息信號,其中,所述心理感知引起的 閾值是聲學掩蔽閾值或視覺掩蔽閾值。
44. 一種用于將信息信號編碼為編碼信息信號的方法,包括 使用感知模型來確定心理感知引起的閾值的表示,所述表示指示了信息信號中與感知不相關(guān)的部分;對所述信息信號進行濾波,以關(guān)于所述心理感知引起的閾值來對 信息信號進行歸一化,以獲得預濾波信號;以前向自適應(yīng)方式來預測所述預濾波信號,以獲得預測信號、預 濾波信號的預測誤差以及預測系數(shù)的表示,基于預測信號、預濾波信 號的預測誤差以及預測系數(shù)的表示來重構(gòu)預濾波信號;以及對所述預測誤差進行量化,以獲得量化預測誤差,其中,所述編 碼信息信號包括關(guān)于心理感知引起的閾值的表示、預測系數(shù)的表示以 及量化預測誤差的信息。
45. —種用于將編碼信息信號解碼為解碼信息信號的方法,所述 編碼信息信號包括關(guān)于心理感知引起的闞值的表示、預測系數(shù)的表示 以及量化預測誤差的信息,所述方法包括對量化預測誤差進行解量化,以獲得解量化預測誤差; 基于所述預測系數(shù)來確定預測信號;基于所述預測信號和所述解量化預測誤差來重構(gòu)預濾波信號;以及對所述預濾波信號進行濾波,以對關(guān)于所述心理感知引起的閾值 的歸一化進行重轉(zhuǎn)換,以獲得解碼信息信號。
46. —種具有程序代碼的計算機程序,當所述計算機程序在計算 機上運行時,用于執(zhí)行如權(quán)利要求44或45所述的方法。
47. —種編碼器,包括 信息信號輸入(12);感知閾值確定器(26),其根據(jù)概率模型進行操作,并具有與所 述信息信號輸入耦合的輸入以及感知閾值輸出;自適應(yīng)預濾波器(34),包括與所述信息信號輸入耦合的濾波器輸入、濾波器輸出、以及與所述感知閾值輸出耦合的適配控制輸入;前向預測系數(shù)確定器(36),包括與所述預濾波器輸出耦合的輸 入以及預測系數(shù)輸出;第一差分器(42),包括與所述預濾波器輸出耦合的第一差分器 輸入、第二差分器輸入以及差分器輸出;限幅/量化級(52),包括有限且恒定數(shù)目的量化等級、與所述 差分器輸出耦合的輸入、量化步長控制輸入、以及輸出;步長調(diào)整器(54),包括與所述限幅/量化級(52)的輸出耦合的 輸入、以及與所述限幅/量化級(52)的步長控制輸入耦合的量化步長 輸出;解量化級(50),包括與所述限幅/量化級的輸出耦合的輸入、以 及解量化器控制輸出;加法器(48),包括與所述解量化器輸出耦合的第一加法器輸入、 第二加法器輸入、以及加法器輸出;預測濾波器(44、 46),包括與所述加法器輸出耦合的預測濾波 器輸入、與所述第二差分器輸入以及第二加法器輸入耦合的預測濾波 器輸出、以及與所述預測系數(shù)輸出耦合的預測系數(shù)輸入;信息信號產(chǎn)生器(24),包括與所述感知閾值輸出耦合的第一輸 入、與所述預測系數(shù)輸出耦合的第二輸入、與所述限幅/量化級的輸出 耦合的第三輸入、以及表示編碼器輸出的輸出。
48. —種用于將編碼信息信號解碼為解碼信息信號的解碼器,所述編碼信息信號包括關(guān)于心理感知引起的閾值的表示、預測系數(shù)以及量化預測誤差的信息,所述解碼器包括 解碼器輸入;提取器(214),包括與所述解碼器輸入耦合的輸入、感知閾值輸出、預測系數(shù)輸出以及量化預測誤差輸出;解量化器(206),包括有限且恒定數(shù)目的量化等級、與所述量化 預測誤差輸出連接的解量化輸入、解量化器輸出以及量化閾值控制輸 入;后向自適應(yīng)閾值調(diào)整器,包括與所述量化預測誤差輸出耦合的輸 入和與所述量化閾值控制輸入耦合的輸出;加法器(222),包括與所述解量化器輸出耦合的第一加法器輸入、 第二加法器輸入以及加法器輸出;預測濾波器(226),包括與所述加法器輸出耦合的準確濾波器輸 入、與所述第二輸入耦合的預測濾波器輸出、以及與所述預測系數(shù)輸 出耦合的預測濾波器系數(shù)輸入;以及自適應(yīng)后濾波器(232),包括與所述加法器輸出耦合的預測濾波 器輸入、表示解碼器輸出的預測濾波器輸出、以及與所述感知閾值輸 出耦合的適配控制輸入。
全文摘要
通過不直接對預濾波信號進行量化,而是對預濾波信號的前向自適應(yīng)預測所獲得的預測誤差進行量化,在沒有或僅有非常小質(zhì)量損失的情況下,實現(xiàn)了超過掩蔽閾值所確定的度量的非常粗略的量化。由于前向自適應(yīng),量化誤差對解碼器側(cè)的預測沒有負面影響。
文檔編號G10L19/00GK101443842SQ200780017256
公開日2009年5月27日 申請日期2007年2月28日 優(yōu)先權(quán)日2006年5月12日
發(fā)明者烏爾里?!た死啄? 延斯·希斯費爾德, 斯特凡·瓦希尼克, 曼弗雷德·盧茨基, 格拉爾德·舒勒 申請人:弗勞恩霍夫應(yīng)用研究促進協(xié)會
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
阿克陶县| 建湖县| 冕宁县| 鄱阳县| 襄樊市| 绥滨县| 大洼县| 新和县| 郓城县| 余庆县| 平陆县| 余姚市| 武陟县| 泰顺县| 康保县| 盈江县| 利川市| 桐庐县| 花垣县| 泌阳县| 安平县| 宣威市| 新宾| 商河县| 江都市| 孝义市| 昔阳县| 肥城市| 岳阳县| 祁门县| 高唐县| 九龙城区| 德江县| 固镇县| 维西| 常熟市| 平顶山市| 洛南县| 二手房| 阳原县| 保定市|