對音頻信號進行編碼和解碼的方法以及用于對音頻信號進行編碼和解碼的設備的制造方法
【技術(shù)領域】
[0001] 示例性實施例設及一種對音頻信號進行編碼和解碼的方法W及一種用于對音頻 信號進行編碼和解碼的設備。更具體地講,示例性實施例設及一種用于通過將第一窗、第二 窗和第=窗應用于音頻信號的多個帖來對所述多個帖進行時頻變換的方法和設備。
【背景技術(shù)】
[0002] 現(xiàn)有技術(shù)的用于對具有高聲音質(zhì)量的音頻進行編碼的設備使用時頻變換方法?,F(xiàn) 有技術(shù)的時頻變換方法是一種對通過使用諸如修正離散余弦變換(MDCT)的變換方法將輸 入的音頻信號變換到頻率空間而獲得的系數(shù)進行編碼的方法。
[0003] 現(xiàn)有技術(shù)的時頻變換使用比時域的信號更容易進行編碼的頻域的信號。由于被應 用于音頻信號的窗形狀與頻率分辨率緊密相關(guān),因此應恰當?shù)剡x擇窗形狀。
【發(fā)明內(nèi)容】
[0004] 技術(shù)問題
[0005] 示例性實施例可提供一種對音頻信號進行編碼和解碼的方法W及一種用于對音 頻信號進行編碼和解碼的設備,W減少由于對音頻信號進行編碼和解碼而發(fā)生的延遲。
[0006] 示例性實施例可提供一種對音頻信號進行編碼和解碼的方法W及一種用于對音 頻信號進行編碼和解碼的設備,W提高音頻信號的編碼和解碼效率。
[0007] 解決方案
[000引根據(jù)示例性實施例的一方面,提供一種對音頻信號進行編碼的方法,所述方法包 括;將音頻信號分割為多個帖,其中,所述多個帖中的每一個帖包括M個樣點,并且M是大 于1的自然數(shù);將第一窗、第二窗和至少一個第S窗應用于所述多個帖,其中,第二窗的長 度比第一窗的長度長,所述至少一個第=窗的長度比第一窗的長度長并且比第二窗的長度 短;對已應用了第一窗、第二窗和所述至少一個第=窗的所述多個帖進行時頻變換;產(chǎn)生 包括時頻變換后的所述多個帖的比特流。
[0009] 將第一窗、第二窗和至少一個第S窗應用于所述多個帖的步驟可包括:將第一窗、 第二窗或所述至少一個第=窗應用于一個變換單元。
[0010] 第一窗、第二窗和所述至少一個第S窗可具有相同的除了系數(shù)為零的持續(xù)時間之 外的重疊持續(xù)時間長度,其中,在所述重疊持續(xù)時間長度中,第一窗、第二窗和所述至少一 個第=窗彼此重疊。
[0011] 將第一窗、第二窗和至少一個第S窗應用于所述多個帖的步驟可包括:將第一窗 應用于包括音頻信號的瞬態(tài)信號的瞬態(tài)持續(xù)時間;將與已被應用于所述瞬態(tài)持續(xù)時間的第 一窗重疊的所述至少一個第=窗應用于包括所述瞬態(tài)持續(xù)時間的變換單元。
[0012] 所述至少一個第=窗的帖大小可W是根據(jù)被應用于所述瞬態(tài)持續(xù)時間的第一窗 的帖大小而設置的。
[0013] 將第一窗、第二窗和至少一個第=窗應用于所述多個帖的步驟可包括:將在變化 持續(xù)時間中彼此重疊的第一窗和所述至少一個第=窗應用于包括所述變化持續(xù)時間的變 換單元,或者將所述至少一個第=窗中的在所述變化持續(xù)時間中彼此重疊的兩個第=窗應 用于包括所述變化持續(xù)時間的變換單元,其中,在所述變化持續(xù)時間中,在音頻信號中信號 特性變化。
[0014] 所述至少一個第S窗和第二窗中的每一個窗可包括系數(shù)為零的第一零持續(xù)時間 和第二零持續(xù)時間,W及系數(shù)為1的第一一致持續(xù)時間和第二一致持續(xù)時間,并且,第一零 持續(xù)時間、第二零持續(xù)時間、第一一致持續(xù)時間和第二一致持續(xù)時間的長度可被確定為滿 足理想重構(gòu)條件。
[0015] 第一零持續(xù)時間、第二零持續(xù)時間、第一一致持續(xù)時間和第二一致持續(xù)時間的長 度可被確定為(F-L) ^2,其中,F(xiàn)表示相應窗的帖大小,L表示窗之間的重疊持續(xù)時間長度。
[0016] M可W是2k,并且第一窗、第二窗和所述至少一個第S窗的長度可W是2k個樣點。
[0017] 比特流可包括關(guān)于被應用于音頻信號的所述多個帖的窗的信息。
[0018] 根據(jù)示例性實施例的另一方面,提供一種對音頻信號進行解碼的方法,所述方法 包括;從比特流提取時頻變換后的音頻信號的多個帖W及關(guān)于被應用于所述多個帖的窗的 信息;對提取的所述多個帖進行時頻逆變換;通過基于關(guān)于被應用的窗的信息來合成時頻 逆變換后的所述多個帖W產(chǎn)生音頻信號,其中,被應用于所述多個帖的窗包括第一窗、第二 窗和至少一個第=窗,其中,第二窗的長度比第一窗的長度長,所述至少一個第=窗的長度 比第一窗的長度長并且比第二窗的長度短。
[0019] 產(chǎn)生音頻信號的步驟可包括:將第一窗、第二窗或所述至少一個第S窗應用于包 括在時頻逆變換后的所述多個帖中的一個變換單元。
[0020] 第一窗、第二窗和所述至少一個第S窗可具有相同的除了系數(shù)為零的持續(xù)時間之 外的重疊持續(xù)時間長度,其中,在所述重疊持續(xù)時間長度中,第一窗、第二窗和所述至少一 個第=窗彼此重疊。
[0021] 所述至少一個第S窗和第二窗中的每一個窗可包括系數(shù)為零的第一零持續(xù)時間 和第二零持續(xù)時間,W及系數(shù)為1的第一一致持續(xù)時間和第二一致持續(xù)時間,并且,第一零 持續(xù)時間、第二零持續(xù)時間、第一一致持續(xù)時間和第二一致持續(xù)時間的長度可被確定為滿 足理想重構(gòu)條件。
[0022] 第一零持續(xù)時間、第二零持續(xù)時間、第一一致持續(xù)時間和第二一致持續(xù)時間的長 度可被確定為(F-L) ^2,其中,F(xiàn)表示相應窗的帖大小,L表示窗之間的重疊持續(xù)時間長度。 [002引M可W是2k,并且第一窗、第二窗和所述至少一個第S窗的長度可W是2k個樣點。
[0024] 根據(jù)示例性實施例的另一方面,提供一種存儲有當被計算機執(zhí)行時執(zhí)行對音頻信 號進行編碼的方法的程序指令的非暫時性計算機可讀存儲介質(zhì)。
[0025] 根據(jù)示例性實施例的另一方面,提供一種存儲有當被計算機執(zhí)行時執(zhí)行對音頻信 號進行解碼的方法的程序指令的非暫時性計算機可讀存儲介質(zhì)。
[0026] 根據(jù)示例性實施例的另一方面,提供一種用于對音頻信號進行編碼的設備,所述 設備包括;分割單元,被配置為將音頻信號分割為多個帖,其中,所述多個帖中的每一個帖 包括M個樣點,并且M是大于1的自然數(shù);窗應用單元,被配置為將第一窗、第二窗和至少一 個第=窗應用于所述多個帖,其中,第二窗的長度比第一窗的長度長,所述至少一個第=窗 的長度比第一窗的長度長并且比第二窗的長度短;變換器,被配置為對已應用了第一窗、第 二窗和所述至少一個第=窗的所述多個帖進行時頻變換;復用器,被配置為產(chǎn)生包括時頻 變換后的所述多個帖的比特流。
[0027]窗應用單元可被配置為將第一窗、第二窗或所述至少一個第=窗應用于一個變換 單元。
[002引窗應用單元可被配置為將第一窗、第二窗和所述至少一個第=窗應用于所述多個 帖,使得第一窗、第二窗和所述至少一個第=窗彼此重疊的除了系數(shù)為零的持續(xù)時間之外 的重疊持續(xù)時間具有相同長度。
[0029] 所述設備還可包括用于對音頻信號的特性進行分析的分析器,其中,窗應用單元 被配置為將第一窗應用于由分析器分析出的瞬態(tài)持續(xù)時間,并被配置為將與已被應用于所 述瞬態(tài)持續(xù)時間的第一窗重疊的至少一個第=窗應用于包括所述瞬態(tài)持續(xù)時間的變換單 JL〇
[0030]窗應用單元可被配置為根據(jù)被應用于所述瞬態(tài)持續(xù)時間的第一窗的帖大小來設 置所述至少一個第=窗的帖大小。
[0031]窗應用單元可被配置為將在變化持續(xù)時間中彼此重疊的第一窗和所述至少一個 第=窗應用于包括所述變化持續(xù)時間的變換單元,或者將所述至少一個第=窗中的在所述 變化持續(xù)時間中彼此重疊的兩個第=窗應用于包括所述變化持續(xù)時間的變換單元,其中, 在所述變化持續(xù)時間中,由分析器分析出的音頻信號的特性變化。
[0032] 所述至少一個第S窗和第二窗中的每一個窗可包括系數(shù)為零的第一零持續(xù)時間 和第二零持續(xù)時間,W及系數(shù)為1的第一一致持續(xù)時間和第二一致持續(xù)時間,并且,窗應用 單元可被配置為將第一零持續(xù)時間、第二零持續(xù)時間、第一一致持續(xù)時間和第二一致持續(xù) 時間的長度確定為滿足理想重構(gòu)條件。
[0033]窗應用單元可被配置為將第一零持續(xù)時間、第二零持續(xù)時間、第一一致持續(xù)時間 和第二一致持續(xù)時間的長度確定為(F-L) ^2,其中,F(xiàn)表示相應窗的帖大小,L表示窗之間 的重疊持續(xù)時間長度。
[0034] M可W是2k,并且第一窗、第二窗和所述至少一個第S窗的長度可W是2k個樣點。
[0035] 比特流可包括關(guān)于被應用于音頻信號的所述多個帖的窗的信息。
[0036] 根據(jù)示例性實施例的另一方面,提供一種對音頻信號進行解碼的設備,所述設備 包括;解復用器,被配置為從比特流提取時頻變換后的音頻信號的多個帖W及關(guān)于被應用 于所述多個帖的窗的信息;逆變換器,被配置為對提取的所述多個帖進行時頻逆變換;合 成器,被配置為通過基于關(guān)于被應用的窗的信息來合成時頻逆變換后的所述多個帖W產(chǎn)生 音頻信號,其中,被應用于所述多個帖的窗包括第一窗、第二窗和至少一個第=窗,其中,第 二窗的長度比第一窗的長度長,所述至少一個第=窗的長度比第一窗的長度長并且比第二 窗的長度短。
[0037] 合成器可被配置為將第一窗、第二窗或所述至少一個第=窗應用于包括在時頻逆 變換后的所述多個帖中的一個變換單元。
[003引第一窗、第二窗和所述至少一個第S窗可具有相同的除了系數(shù)為零的持續(xù)時間之 外的重疊持續(xù)時間長度,其中,在所述重疊持續(xù)時間長度中,第一窗、第二窗和所述至少一 個第=窗彼此重疊。
[0039] 所述至少一個第S窗和第二窗中的每一個窗可包括系數(shù)為零的第一零持續(xù)時間 和第二零持續(xù)時間,W及系數(shù)為1的第一一致持續(xù)時間和第