一種用于音頻信號的矢量量化編解碼方法及裝置的制造方法
【技術(shù)領(lǐng)域】
[0001 ] 本發(fā)明涉及一種用于音頻信號的矢量量化編解碼方法及裝置。
【背景技術(shù)】
[0002]在目前通用的各音頻編碼標(biāo)準(zhǔn)中,對變換域的音頻信號多采用標(biāo)量量化的方案進(jìn)行量化編碼,比如在MPEG-lLayer3 (MP3)、MPEG2/4AAC、AVS等標(biāo)準(zhǔn)中,對MDCT數(shù)據(jù)采用標(biāo)量量化的方式進(jìn)行量化,然后采用Huffman編碼來進(jìn)行熵編碼;而在AC-3編碼方案中,則將MDCT數(shù)據(jù)分解為指數(shù)和尾數(shù),對尾數(shù)部分按照比特分配模型進(jìn)行比特?cái)?shù)可變的量化編碼。由于標(biāo)量量化方案無法有效地利用變換域信號相鄰數(shù)據(jù)間存在的冗余,因此很難獲得理想的編碼效果。矢量量化是解決此問題的一個(gè)合理的方式,變換域加權(quán)交叉矢量量化(TffINVQ)方案是一種應(yīng)用了矢量量化技術(shù)的音頻編碼方法,該方法在對信號進(jìn)行MDCT變換后,通過交叉選擇信號譜參數(shù)構(gòu)造待量化的矢量,然后采用高效率的矢量量化獲得了較優(yōu)的音頻編碼質(zhì)量,但TWINVQ中沒有有效利用音頻感知特性來控制量化噪聲,而且TWINVQ中沒有充分利用信號特性來指導(dǎo)矢量的組織,因此需要進(jìn)一步改進(jìn)。
【發(fā)明內(nèi)容】
[0003]本發(fā)明的目的是提供一種能夠克服上述缺陷的用于音頻信號的矢量量化編解碼方法及裝置。
[0004]在第一方面,本發(fā)明提供了一種用于音頻信號的矢量量化編碼方法,包括:對音頻信號的變換域譜進(jìn)行音頻感知分析,根據(jù)分析結(jié)果對音頻信號的變換域譜進(jìn)行幅度調(diào)整(幅度調(diào)整后的變換域譜稱作加權(quán)譜),得到待量化的加權(quán)譜;對所述待量化的加權(quán)譜進(jìn)行組織,得到多個(gè)待量化的矢量;以及對所述多個(gè)待量化的矢量進(jìn)行量化編碼,得到矢量量化編碼數(shù)據(jù)。
[0005]優(yōu)選地,所述對所述待量化的加權(quán)譜進(jìn)行組織的步驟包括:構(gòu)造所述待量化的加權(quán)譜的時(shí)頻平面;根據(jù)所述音頻信號的類型及其音調(diào)性對所述時(shí)頻平面進(jìn)行劃分,并且根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量。
[0006]優(yōu)選地,所述根據(jù)所述音頻信號的類型及其音調(diào)性對所述時(shí)頻平面進(jìn)行劃分,并且根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量的步驟包括:基于頻率抽取進(jìn)行劃分和組織,其具體為根據(jù)所述類型及音調(diào)性判斷出所述音頻信號是具有諧波結(jié)構(gòu)的平穩(wěn)信號,然后按照時(shí)間方向?qū)λ鰰r(shí)頻平面進(jìn)行劃分,以諧波為單位對所述加權(quán)譜進(jìn)行頻率抽取,將所述加權(quán)譜組織成多個(gè)待量化的矢量;或者按時(shí)間方向進(jìn)行劃分和組織,其具體為根據(jù)所述類型和音調(diào)性判斷出所述音頻信號是平穩(wěn)信號,然后按照時(shí)間方向?qū)λ鰰r(shí)頻平面進(jìn)行劃分,根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量;或者按頻率方向進(jìn)行劃分和組織,其具體為根據(jù)所述類型和音調(diào)性判斷出所述音頻信號在時(shí)域具有快變特性,然后按照頻率方向?qū)λ鰰r(shí)頻平面進(jìn)行劃分,根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量;或者按時(shí)頻區(qū)域進(jìn)行劃分和組織,其具體為根據(jù)所述音調(diào)性和類型判斷出所述音頻信號為復(fù)雜信號,然后將所述時(shí)頻平面劃分為多個(gè)時(shí)頻區(qū)域,根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量。
[0007]優(yōu)選地,所述根據(jù)所述音頻信號的類型及其音調(diào)性對所述時(shí)頻平面進(jìn)行劃分,并且根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量的步驟還包括:按照使得編碼增益最大的規(guī)則從所述基于頻率抽取進(jìn)行劃分和組織、所述按時(shí)間方向進(jìn)行劃分和組織、所述按頻率方向進(jìn)行劃分和組織、所述按時(shí)頻區(qū)域進(jìn)行劃分和組織中選擇編碼增益最大的一種或幾種方式的組合進(jìn)行所述劃分和組織。
[0008]優(yōu)選地,所述對所述多個(gè)待量化的矢量進(jìn)行量化編碼的步驟包括:對所述多個(gè)待量化的矢量進(jìn)行矢量量化編碼;或者對所述多個(gè)待量化的矢量進(jìn)行標(biāo)量量化再進(jìn)行熵編碼。
[0009]在第二方面,本發(fā)明提供了一種用于音頻信號的矢量量化解碼方法,包括:對矢量量化編碼數(shù)據(jù)進(jìn)行解碼,得到反量化的矢量;根據(jù)矢量劃分信息對所述反量化的矢量進(jìn)行矢量重構(gòu),得到反量化的加權(quán)譜;對所述反量化的加權(quán)譜進(jìn)行幅度調(diào)整,得到解碼數(shù)據(jù)。
[0010]在第三方面,本發(fā)明提供了一種用于音頻的矢量量化編碼裝置,包括:幅度調(diào)整模塊,用于對音頻信號的變換域譜進(jìn)行音頻感知分析,根據(jù)分析結(jié)果對音頻信號的變換域譜進(jìn)行幅度調(diào)整,得到待量化的加權(quán)譜;矢量組織模塊,用于對所述待量化的加權(quán)譜進(jìn)行組織,得到多個(gè)待量化的矢量;以及量化編碼模塊,用于對所述多個(gè)待量化的矢量進(jìn)行量化編碼,得到矢量量化編碼數(shù)據(jù)。
[0011]優(yōu)選地,所述矢量組織模塊被配置用于:構(gòu)造所述待量化的加權(quán)譜的時(shí)頻平面;根據(jù)所述音頻信號的類型及其音調(diào)性對所述時(shí)頻平面進(jìn)行劃分,并且根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量。
[0012]優(yōu)選地,所述根據(jù)所述音頻信號的類型及其音調(diào)性對所述時(shí)頻平面進(jìn)行劃分,并且根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量的步驟包括:基于頻率抽取進(jìn)行劃分和組織,其具體為根據(jù)所述類型及音調(diào)性判斷出所述音頻信號是具有諧波結(jié)構(gòu)的平穩(wěn)信號,然后按照時(shí)間方向?qū)λ鰰r(shí)頻平面進(jìn)行劃分,以諧波為單位對所述加權(quán)譜進(jìn)行頻率抽取,將所述加權(quán)譜組織成多個(gè)待量化的矢量;或者按時(shí)間方向進(jìn)行劃分和組織,其具體為根據(jù)所述類型和音調(diào)性判斷出所述音頻信號是平穩(wěn)信號,然后按照時(shí)間方向?qū)λ鰰r(shí)頻平面進(jìn)行劃分,根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量;或者按頻率方向進(jìn)行劃分和組織,其具體為根據(jù)所述類型和音調(diào)性判斷出所述音頻信號在時(shí)域具有快變特性,然后按照頻率方向?qū)λ鰰r(shí)頻平面進(jìn)行劃分,根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量;或者按時(shí)頻區(qū)域進(jìn)行劃分和組織,其具體為根據(jù)所述音調(diào)性和類型判斷出所述音頻信號為復(fù)雜信號,然后將所述時(shí)頻平面劃分為多個(gè)時(shí)頻區(qū)域,根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量。
[0013]優(yōu)選地,優(yōu)選地,所述根據(jù)所述音頻信號的類型及其音調(diào)性對所述時(shí)頻平面進(jìn)行劃分,并且根據(jù)劃分結(jié)果將所述加權(quán)譜組織成多個(gè)待量化的矢量的步驟還包括:按照使得編碼增益最大的規(guī)則從所述基于頻率抽取進(jìn)行劃分和組織、所述按時(shí)間方向進(jìn)行劃分和組織、所述按頻率方向進(jìn)行劃分和組織、所述按時(shí)頻區(qū)域進(jìn)行劃分和組織中選擇編碼增益最大的一種或幾種方式的組合進(jìn)行所述劃分和組織。
[0014]優(yōu)選地,所述量化編碼模塊被配置用于:對所述多個(gè)待量化的矢量進(jìn)行矢量量化編碼;或者對所述多個(gè)待量化的矢量進(jìn)行標(biāo)量量化再進(jìn)行熵編碼。
[0015]在第四方面,本發(fā)明提供了一種用于音頻信號的矢量量化解碼裝置,包括:量化解碼模塊,用于對矢量量化編碼數(shù)據(jù)進(jìn)行解碼,得到反量化的矢量;矢量重構(gòu)模塊,用于根據(jù)矢量劃分信息對所述反量化的矢量進(jìn)行矢量重構(gòu),得到反量化的加權(quán)譜;頻譜重構(gòu)模塊,對所述反量化的加權(quán)譜進(jìn)行幅度調(diào)整,得到解碼數(shù)據(jù)。
[0016]本發(fā)明提出了一種用于音頻信號的矢量量化編解碼方案,該方案參考音頻感知特性對變換域信號進(jìn)行幅度調(diào)整,可消除感知冗余,提高編碼效率;通過信號特性分析,對音頻的時(shí)頻平面進(jìn)行合理的劃分,并將其組織成待量化矢量;可選擇使得編碼增益最大的時(shí)頻平面劃分和矢量組織方式,有利于對信號進(jìn)行高效的量化編碼。
【附圖說明】
[0017]圖1為根據(jù)本發(fā)明實(shí)施例的矢量量化編碼裝置的框圖。
[0018]圖2為根據(jù)本發(fā)明實(shí)施例的4種矢量劃分的示意圖。
[0019]圖3為根據(jù)本發(fā)明實(shí)施例的矢量量化解碼裝置的框圖。
[0020]圖4為根據(jù)本發(fā)明實(shí)施例的單聲道音頻矢量量化編碼裝置的結(jié)構(gòu)框圖。
[0021]圖5為根據(jù)本發(fā)明實(shí)施例的單聲道音頻矢量量化解碼裝置的結(jié)構(gòu)框圖。
[0022]圖6為根據(jù)本發(fā)明實(shí)施例的單聲道頻帶擴(kuò)展音頻矢量量化編碼裝置的結(jié)構(gòu)框圖。
[0023]圖7為根據(jù)本發(fā)明實(shí)施例的單聲道頻帶擴(kuò)展音頻矢量量化解碼裝置的結(jié)構(gòu)框圖。
【具體實(shí)施方式】
[0024]下面通過附圖和實(shí)施例,對本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。
[0025]圖4為根據(jù)本發(fā)明實(shí)施例的單聲道音頻矢量量化編碼裝置的結(jié)構(gòu)框圖。
[0026]如圖4所示,根據(jù)本發(fā)明實(shí)施例的單聲道音頻矢量量化編碼裝置包括:重采樣模塊401,信號類型判斷模塊402、MDCT變換模塊403、矢量量化編碼模塊404以及比特流復(fù)用模塊405。應(yīng)當(dāng)指出,雖然本實(shí)施例以MDCT為例進(jìn)行說明,但該裝置和方法也適用于其他類型數(shù)據(jù)的編碼,比如MDFT域、FFT域、QMF域等。
[0027]重采樣模塊401用于將輸入的數(shù)字聲音信號從原始采樣率變換到目標(biāo)采樣率,并將重采樣后的信號以幀為單位輸出到信號類型判斷模塊、MDCT變換模塊。應(yīng)注意,如果所輸入的數(shù)字聲音信號本身就具有目標(biāo)采樣率,則根據(jù)本發(fā)明原理的編碼裝置可以不包括該模塊。
[0028]信號類型判斷模塊402用于對重采樣后的聲音信號逐幀進(jìn)行信號類型分析,并輸出信號類型分析的結(jié)果。由于信號本身的復(fù)雜性,信號類型可以采用多種表示形式。例如,若該幀信號是緩變信號,則直接輸出表示該幀信號是緩變信號的標(biāo)識;若是快變信號,則需繼續(xù)計(jì)算快變點(diǎn)發(fā)生的位置,并輸出表示該幀信號是快變信號的標(biāo)識和快變點(diǎn)發(fā)生的位置。
[0029]MDCT變換模塊403用于根據(jù)從信號類型判斷模塊402輸出的信號類型分析結(jié)果,采用不同長度階數(shù)的MDCT變換,將重采樣后的聲音信號映射到MDCT變換域,并將聲音信號的MDCT域系數(shù)輸出到矢量量化編碼模塊404。具體地,若該幀信號是緩變信號,則以幀為單位做MDCT變換,選擇較長階數(shù)的MDCT變換;若是快變信號,則將該幀信號劃分為子幀,以子幀為單位做MDCT變換,選擇較短階數(shù)的MDCT變換。