專利名稱:利用基音延遲曲線調(diào)整對信息信號編碼的方法和裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明一般涉及通信系統(tǒng),尤其是涉及這種通信系統(tǒng)中對信息信 號進行編碼。
背景技術(shù):
數(shù)字語音壓縮系統(tǒng)通常需要估計輸入信號的基頻。基頻fo通常是根據(jù)基音延遲7"Q (或被稱為"遲滯")來估計。兩者關(guān)系由下式表達(dá)<formula>formula see original document page 5</formula>(1)其中,采樣頻率fs對于電話級別應(yīng)用而言通常為8000 Hz。由于語音信號通常為不穩(wěn)定的,因此被其劃分為被稱為幀的有限 長度矢量,每幀被假定為亞穩(wěn)態(tài)。這些幀的長度通常為10到40毫秒 的量級。然后,按照相關(guān)的幀長度間隔,對描述該語音信號的參數(shù)進 行更新。原始的碼激勵線性預(yù)測(CELP)算法按照更短的子幀間隔, 進一步更新基音周期信息(利用被稱為長期預(yù)測的方法,或稱為LTP), 因此能夠?qū)崿F(xiàn)幀到幀的更平滑過渡。還曾注意到,盡管可以使用開環(huán) 方法估計",但是使用閉環(huán)方法可以得到好得多的性能。閉環(huán)方法涉 及以子幀為基礎(chǔ),對To的不同可能值(通常為從20到147的整數(shù)值) 進行反復(fù)試驗搜索,并選擇滿足一些最低誤差標(biāo)準(zhǔn)的值。這種方法的改進方法包括允許To取整數(shù)加小數(shù)值,如美國專利 No.US5359696中給出的那樣。這種方法的實際應(yīng)用的例子能夠在GSM 半速率語音編碼器中找到,如附圖1所示,并在美國專利No.US5253269 中有說明。這里,21到22-2/3范圍內(nèi)的遲滯是允許的1/3采樣分辨率, 23到34-5/6范圍內(nèi)的遲滯是允許的1/6采樣分辨率,等等。為了保持低的搜索復(fù)雜度,使用開環(huán)方法和閉環(huán)方法的組合。開環(huán)方法涉及使 用自相關(guān)峰值拾取算法生成整數(shù)遲滯候選值列表。隨后,閉環(huán)方法在 該整數(shù)遲滯候選值附近的可允許遲滯中搜索最佳小數(shù)遲滯值。而且, 根據(jù)與前一子幀之間的差值,對子幀2、 3和4的遲滯進行編碼。由于存在遲滯參數(shù)的高幀內(nèi)相關(guān),所以這使得能夠使用更少的比特對該遲滯信息進行編碼。即使如此,GSMHR編解碼器仍然每20毫秒使用總 共8+ (3X4) =20比特來傳送該基音周期信息(l.Okbps)。在降低基音周期信息的位速率的努力中,已開發(fā)了一種插值策略, 其允許每幀僅對基音信息編碼一次(僅僅使用7比特-"50bps),而 不是使用通常的子幀解決方案。這項技術(shù)被稱為松弛碼激勵線性預(yù)測 (或者RCELP)技術(shù),并且成為用于碼分多址(CDMA)無線電話系統(tǒng) 的增強變速率編解碼器(EVRC)標(biāo)準(zhǔn)的基礎(chǔ)。其基本原理如下。為以當(dāng)前幀的終點為中心的分析窗口,估計基音周期。接著生成 遲滯(基音延遲)曲線,其由過去幀遲滯到當(dāng)前幀遲滯的線性插值構(gòu) 成。接著,借助于復(fù)雜多相濾波和偏移技術(shù)來修正該去線性預(yù)測(LP) 殘差信號,被設(shè)計用于將殘差波形與所估計的基音延遲曲線相匹配。 此殘差修正過程的主要原因是解決開環(huán)整數(shù)遲滯估計過程的精度限 制。例如,如果該整數(shù)遲滯被估計為32個樣本,當(dāng)實際上真實的遲滯 為32.5個樣本時,在單個160采樣幀中,該殘差波形可以與所估計的 延遲沖突2.5個樣本之多。這會嚴(yán)重降低LTP的性能。該RCELP算法 通過在殘差波形中的感知上不重要的情形期間(例如,低能量)對殘 差波形進行移位以與所估計的基音延遲曲線匹配,來解決這個問題。 通過修正殘差波形以與所估計的基音延遲曲線匹配,保留了 LTP的效 率,并維持了編碼增益。另外,要求可以忽略由于殘差修改引起的相 關(guān)的感知衰退。美國專利No. 6,113,653中提出了一種對處理基音延遲曲線信息的 進一步改進,其中公開了一種按照在長度上小于或等于一個塊的間隔來調(diào)整基音延遲曲線的方法。在此方法中,根據(jù)某一誤差最小標(biāo)準(zhǔn), 使用少量的比特來對基音延遲曲線的調(diào)整進行編碼。該方法描述了通 過將累積的移位參數(shù)最小化,或者將感知加權(quán)的輸入語音和通過感知 加權(quán)合成濾波器的自適應(yīng)碼本(ACB)貢獻(xiàn)率之間的互相關(guān)最大化, 來調(diào)整基音延遲曲線的技術(shù)。其他公知的基音延遲調(diào)整標(biāo)準(zhǔn)也可以包括將目標(biāo)語音和濾波后的ACB貢獻(xiàn)率之間的感知加權(quán)誤差能量最小化。盡管此方法使用了非常有效的技術(shù)來估計和編碼基音延遲曲線調(diào) 整信息,但是該低的位速率對正被編碼的基音延遲調(diào)整參數(shù)的分辨率 和/或動態(tài)范圍產(chǎn)生約束。因此,現(xiàn)在需要通過自適應(yīng)地修正預(yù)測器步 長的動態(tài)范圍和分辨率來改進低位速率長期預(yù)測器的性能,以便與現(xiàn) 有技術(shù)相比,對于給定的位速率獲得較高長期預(yù)測增益,或者替換地, 在較低的位速率上獲得相似的長期預(yù)測。
圖1為現(xiàn)有技術(shù)的語音編碼器的框圖。圖2為語音編碼器的框圖。圖3為語音解碼器的框圖。圖4圖示了在時域中顯示的信號的圖形表示。圖5為示出圖2和圖3的編碼器和解碼器的操作的流程圖。
具體實施方式
一般說來,開環(huán)基音延遲曲線估計器在對信息信號進行編碼期間 生成基音延遲信息。以子幀為基礎(chǔ)對基音延遲曲線(例如,過去幀遲 滯到當(dāng)前幀遲滯的線性插值)進行調(diào)整,這允許對真實的基音延遲曲 線作出更精確的估計?;粞舆t曲線重建模塊在重建幀間的信息信號 時,在解碼器中使用基音延遲信息。在本發(fā)明的優(yōu)選實施例中,對于 基音延遲曲線的調(diào)整是基于基音延遲(tq)中的標(biāo)準(zhǔn)偏差和/或方差。更具體來說,對信息信號進行編碼的方法包括如下步驟把信息 信號劃分成塊,估計該信息的當(dāng)前和先前塊的基音延遲,并根據(jù)"中 的過去的變化(例如,標(biāo)準(zhǔn)偏差和/或方差)來形成基音延遲的調(diào)整。 該方法進一步包括如下步驟按照在長度上小于或等于一個塊的間隔 來調(diào)整基音延遲曲線的形狀,對調(diào)整后的基音延遲曲線進行編碼,以 產(chǎn)生適于向目的地傳送的代碼。按照在長度上小于或等于一個塊的間隔來調(diào)整基音延遲曲線的形 狀的步驟進一步包括如下步驟確定在位于當(dāng)前和先前基音延遲處或 兩者之間的點處的調(diào)整后基音延遲,在先前的基音延遲點和調(diào)整后的 基音延遲點之間形成線性插值。當(dāng)確定調(diào)整后的基音延遲點時,將累 積移位的變化最小化。確定調(diào)整后的基音延遲的步驟進一步包括如下 步驟將目標(biāo)殘差信號和原始?xì)埐钚盘栔g的相關(guān)最大化。先前的基 音延遲點進一步包括先前的調(diào)整后基音延遲點。替代地,對基音延遲 曲線的形狀進行調(diào)整的步驟進一步包括如下步驟確定位于當(dāng)前和先 前基音延遲處或者兩者之間的多個調(diào)整后基音延遲點,并在調(diào)整后延 遲點之間形成線性插值。還公開了對信息信號進行編碼的系統(tǒng)。該系統(tǒng)包括編碼器,該編 碼器包括用于把該信息信號劃分成塊的裝置,以及用于估計信息中的 當(dāng)前和先前塊的基音延遲、并根據(jù)r。中的過去的變化(例如,標(biāo)準(zhǔn)偏 差和/或方差)來調(diào)整基音延遲的裝置。在該系統(tǒng)內(nèi),該信息信號進一步包括語音或者音頻信號,該信息 信號的塊進一步包括信息信號的幀?;粞舆t信息進一步包括基音延 遲調(diào)整索引。該系統(tǒng)還包括用于接收基音延遲信息、并產(chǎn)生用于重建 該信息信號的調(diào)整后基音延遲曲線7"e(n)的解碼器。附圖2概括描述了依照本發(fā)明優(yōu)選實施例的釆用自適應(yīng)步長基音延遲調(diào)整的語音壓縮系統(tǒng)200。如附圖2所示,通過把輸入語音信號s(n)的短期譜包絡(luò)變平坦的線性預(yù)測(LP)分析濾波器202,來處理該輸入語音信號s(n)。該LP分析濾波器的輸出被指定為LP殘差《n)。接著,該LP殘差e(n)被開環(huán)基音延遲估計器204用來生成該開環(huán)基音延遲力":i。(此過程的詳細(xì)內(nèi)容和下面討論的一些其他過程在TIA—127EVRC中給出。)接著,該開環(huán)基音延遲r(m)被基音延遲插值塊206用來依照下面的表達(dá)式生成子幀延遲插值端點矩陣d(m',j):<formula>formula see original document page 9</formula>其中"m;)是用于當(dāng)前幀m的估計開環(huán)基音延遲,其以端部的當(dāng)前 幀為中心,"M-l)為用于前一幀m-l的估計開環(huán)基音延遲,f(n)為一組 基音延遲插值系數(shù),其可以被定義為f= { 0.0, 0.3313, 0.6625, 1.0 } (3)這些系數(shù)例如是當(dāng)子幀的數(shù)量為3 (例如,0S,w'《3)時給出,不 過也可以為不是3的子幀值導(dǎo)出一組合適的系數(shù)。同樣將開環(huán)基音延遲^的用作輸入的還有基音延遲變率估計器 214。依照當(dāng)前發(fā)明,開環(huán)基音延遲估計的采樣標(biāo)準(zhǔn)偏差被定義為<formula>formula see original document page 9</formula>其中該采樣均值f被定義為<formula>formula see original document page 9</formula>f = (5) 當(dāng)觀測數(shù)目是二 (N-2)時,可以看出,上面的表達(dá)式就能夠被簡化為如下<formula>formula see original document page 9</formula>隨后,該變率估計 和開環(huán)基音延遲r—)被用作自適應(yīng)步長生成器215的輸入,在該自適應(yīng)步長生成器215中,作為 的函數(shù)如下計算適應(yīng)性步長^,M):<formula>formula see original document page 10</formula>(7)其中^crj為該基音延遲的變率估計的某個函數(shù)。對于本發(fā)明的優(yōu) 選實施例,這個函數(shù)如下給出<formula>formula see original document page 10</formula>(8)其中A和B可以是常數(shù),ov表示r的標(biāo)準(zhǔn)偏差,a^可以是a(ov) 的某個最大的允許值。該自適應(yīng)步長S(m)被輸入到延遲調(diào)整系數(shù)生成器216中,在該延 遲調(diào)整系數(shù)生成器216中,可以如下作為基音延遲調(diào)整索引i的函數(shù)來 計算基音延遲調(diào)整值A(chǔ)一<formula>formula see original document page 10</formula>其中M為候選基音延遲調(diào)整索引的數(shù)量。(9)從上述等式中可以看到,基音延遲調(diào)整值A(chǔ)^W可以取步長S(/70的 整數(shù)倍,其中5(m)不僅僅是基音延遲的平均值(均值)的函數(shù)(如現(xiàn)有技術(shù)中),而且還是基音延遲值r^)的變率估計 的函數(shù)。隨后, 根據(jù)某個失真度量來評估多個基音延遲調(diào)整值,并且作為結(jié)果,該基 音延遲調(diào)整值的最佳值可以在編碼過程的所有剩余部分中使用。在優(yōu) 選實施例中,該失真度量為第i個濾波后自適應(yīng)碼本貢獻(xiàn)率;i"")與加 權(quán)目標(biāo)信號^W之間的感知加權(quán)均方差。這個過程是在基音延遲調(diào)整 索引搜索218中給出的,并可以表達(dá)為<formula>formula see original document page 10</formula>其中p是與根據(jù)方括弧中的表達(dá)式獲得的最大值對應(yīng)的最佳基音(10)延遲調(diào)整索引。為了獲得在等式io中使用的信號,使用了基音延遲曲線端點修正 器20S,以依照下面的表達(dá)式將基音延遲插值曲線上下移位-<formula>formula see original document page 11</formula> (11)根據(jù)這個表達(dá)式,計算210候選基音延遲曲線^(M),以及獲得212 自適應(yīng)碼本貢獻(xiàn)率E(n)并對其濾波220,以獲得濾波后自適應(yīng)碼本貢獻(xiàn) 率/l(n),如現(xiàn)有技術(shù)中那樣。在操作期間,通過發(fā)射機200發(fā)送諸如固定碼本索引、FCB和ACB 增益索引等標(biāo)準(zhǔn)變量。連同這些值一起,與用于當(dāng)前幀r(M)的基音延 遲值的代碼一起發(fā)送每個子幀的延遲調(diào)整索引(i)。來自先前發(fā)送幀 ^m-l)中的基音延遲也被使用。該解碼器將使用i, <m;>,禾卩r(M-l)產(chǎn) 生相繼的基音延遲值之間的插值曲線。更詳細(xì)來講,接收器將按照上面討論的,作為基音延遲調(diào)整索引i的函數(shù)來計算A。J^,并根據(jù)等式 11應(yīng)用A。J/),以將基音延遲插值曲線的端點向上或向下移位。附圖3為接收器300的框圖。如圖所示,通過延遲解碼器304接 收基音延遲參數(shù)索引,以產(chǎn)生r^)。更具體來講,解碼器304接收表 示W(wǎng)m;i的索引或者"代碼",并對它們進行解碼,以產(chǎn)生r(W和"/n-l)。 基音延遲值被輸出到基音延遲變率估計器214,在該基音延遲變率估計 器214處確定基音延遲中的變化,并將其輸出到自適應(yīng)步長生成器215。 通過該生成器215計算用于^m)的值。該自適應(yīng)步長被輸出到延遲調(diào) 整系數(shù)生成器216中。按照上文所論述的,通過該生成器216作為該 基音延遲調(diào)整索引i的函數(shù)來計算用于A^(/)的值,并將其輸出到端點 修正電路308。通過發(fā)射機200,基音延遲W^被輸出到延遲插值塊307,并用于 根據(jù)等式2來生成子幀延遲插值端點矩陣Wm'』。延遲曲線端點修正電路308采用該端點矩陣,并依照rf'(,"',/)^(m',/) + A。^')來將該基音延 遲插值曲線的端點上下移位。隨后,該移位后的端點被計算電路310 用于生成調(diào)整后的延遲曲線^("),該調(diào)整后延遲曲線隨后被用于從 ACB 312中取得樣本(如現(xiàn)有技術(shù))。隨后,對ACB貢獻(xiàn)率進行調(diào)整, 并將其與縮放后的固定碼本貢獻(xiàn)率組合,以生成組合激勵信號,該組 合激勵信號被用作合成濾波器302的輸入以產(chǎn)生輸出語音信號。該組 合激勵信號還被用做反饋,以便為下一子幀更新ACB (如現(xiàn)有技術(shù))。附圖4顯示如在在時域中顯示的先前部分的信號的圖形表示。這 些信號是基于具有"kHz采樣頻率的寬帶語音編碼器結(jié)構(gòu)來采樣的。 因此,信號402 (加權(quán)語音信號、(W)包括一個1/2秒采樣(7000個 樣本)。對于這個例子而言,幀大小為280個樣本,子幀大小是70。 每個子幀使用一個樣本來顯示信號404 — 410。從該輸入信號中估計出開環(huán)基音延遲r^)404。能夠看出,該開環(huán) 基音延遲估計對于高周期性語音(樣本0 — 2000和4000 — 6500)而言 是相當(dāng)平滑的,而與之相反,在無聲和過渡期間(樣本2000-4000和 6500-7000)則是相當(dāng)無規(guī)律的。根據(jù)本發(fā)明,示出了步長5(m)406。能 夠看出,當(dāng)該基音延遲估計的變率小時,該步長也相對小,而相反的, 當(dāng)該基音延遲估計的變率大時,該步長也相對大??梢栽谧罴鸦粞?遲調(diào)整值A(chǔ)。"Z)408中進一步看出該自適應(yīng)步長的效果。此處,該最佳 基音延遲值僅僅基于4個候選值(每子幀2比特)。在高周期性區(qū)域 期間,變化很小,并且對分辨率進行強調(diào)以允許該基音延遲估計的良 好調(diào)協(xié)。在無聲和過渡區(qū)域期間,基音延遲變化很大,并隨后對寬動 態(tài)范圍進行強調(diào)以解決該基音延遲估計中的高不確定性。最后,顯示 該基音延遲調(diào)整后端點c/'(,w',1)410,以演示根據(jù)本發(fā)明的基音延遲曲線 的最終綜合估計。當(dāng)與開環(huán)基音延遲404相比時,容易看出本發(fā)明的 整體效果。附圖5是分別示出附圖2和附圖3中的編碼器和解碼器的操作的流程圖。具體來講,描述了通過編碼器200和解碼器300生成基音延 遲調(diào)整值A(chǔ)。,該邏輯流程在步驟501開始,基于輸入信號,通過延遲 估計電路204或者延遲解碼器304來估計基音延遲。在本發(fā)明的優(yōu)選 實施例中,該輸入信號優(yōu)選為語音,然而也可以設(shè)想其他音頻輸入信 號。在步驟503,基音延遲變率估計器214根據(jù)該基音延遲估計來估計基音延遲W的方差和/或標(biāo)準(zhǔn)偏差,以生成自適應(yīng)步長值^, ;>。更具體來講,分析r的過去值以確定 ,5^)是按照等式(7),根據(jù)~計算得到的。在步驟505,基音延遲調(diào)整系數(shù)生成器216使用5(, ),并為調(diào)整值(Anrf》確定值。如上面討論的 ,0')=(卜M / 2) <5(m), z' e {0, 1,…,iW -1},其中外")—;(咖)沖-1)〕。隨后,修正電路208使用用于A。《的值來 、 2 J生成第二基音延遲參數(shù),并且具體來講是編碼的基音參數(shù)(步驟507)。 在本發(fā)明的優(yōu)選實施例中,該編碼的基音參數(shù)包括基音延遲插值曲線 的端點,該基音延遲插值曲線是根據(jù)該調(diào)整值而被向上或者向下移位 的,具體來講是依照該表達(dá)式 /) = ^ ',/) + 乂^),其中/*是與根 據(jù)等式IO獲得的最大值對應(yīng)的最佳基音延遲調(diào)整索引。盡管已參考特定實施例具體示出和說明了本發(fā)明,但本領(lǐng)域技術(shù) 人員可以理解,可以在不背離本發(fā)明的精神和范圍下,在其中作出形 式和細(xì)節(jié)上的各種變化。例如,盡管在本發(fā)明的優(yōu)選實施例中,基音 延遲插值曲線的端點是根據(jù)自適應(yīng)步長而被移位的,但是本領(lǐng)域普通 技術(shù)人員應(yīng)認(rèn)識到可以根據(jù)該適應(yīng)步長生成任一編碼的基音參數(shù)。更 具體來講,通過允許搜索范圍和/或分辨率(即步長)基于基音延遲變 率的函數(shù),本發(fā)明可以應(yīng)用到傳統(tǒng)的閉環(huán)基音延遲和基音搜索方法(例 如,美國專利No. 5,253,269)。目前這些方法局限于僅僅基于正被搜 索的當(dāng)前基音值的絕對范圍的預(yù)定分辨率。在現(xiàn)有解碼過程中使用本發(fā)明對本領(lǐng)域技術(shù)人員來講也是顯而易 見的。例如,盡管在本發(fā)明的優(yōu)選實施例中,根據(jù)該自適應(yīng)步長將基 音延遲插值曲線的端點向上或者向下移位,但是本領(lǐng)域的普通技術(shù)人員將認(rèn)識到可以根據(jù)該自適應(yīng)步長來生成任一基音延遲參數(shù)。如前面討論的,諸如GSM HR之類的語音解碼器可以基于根據(jù)任意第一基音 延遲參數(shù)獲得的基音延遲中的變化,使用自適應(yīng)步長來確定該A(delta) 編碼的遲滯信息(即第二基音延遲參數(shù))的范圍和分辨率。因此,該 第二基音延遲參數(shù)可以基于該自適應(yīng)步長。另外,可以使用替代的失真度量,例如累積移位參數(shù)的最小化或 者歸一化互相關(guān)參數(shù)的最大化(如美國專利No. 6,113,653中所說明 的),來獲得根據(jù)本發(fā)明的基音延遲曲線調(diào)整。對本領(lǐng)域技術(shù)人員來 講是顯而易見的是本發(fā)明獨立于所采用的失真度量,并且可以在不 脫離本發(fā)明的精神和范圍的情況下使用任一方法。
權(quán)利要求
1.一種操作語音編碼器的方法,該方法包括步驟根據(jù)輸入信號估計基音延遲;根據(jù)該基音延遲估計來估計基音延遲中的變化;根據(jù)該基音延遲中的變化來確定自適應(yīng)步長值;和根據(jù)該自適應(yīng)步長來生成編碼的基音參數(shù)。
2. 根據(jù)權(quán)利要求l的方法,其中所述根據(jù)輸入信號估計基音延遲 的步驟包括根據(jù)語音或者音頻信號來估計該基音延遲的步驟。
3. 根據(jù)權(quán)利要求l的方法,其中所述估計基音延遲中的變化的步 驟包括估計基音延遲的方差和/或標(biāo)準(zhǔn)偏差的步驟。
4. 根據(jù)權(quán)利要求l的方法,其中所述確定自適應(yīng)步長的步驟包括 確定自適應(yīng)步長5(m)的步驟,其中5(m)能夠被表達(dá)為以及其中^ )為基音延遲的變率估計的某一函數(shù),以及r(m)是對 于幀號m的基音延遲估計。
5. 根據(jù)權(quán)利要求4的方法,其中c^Tr)-min04o"r+5,a鵬),其中A 和B為預(yù)定值, 表示T的標(biāo)準(zhǔn)偏差,以及"_是《( )的最大允許值。
6. 根據(jù)權(quán)利要求l的方法,其中所述根據(jù)該自適應(yīng)步長生成編碼 的基音參數(shù)的步驟包括確定延遲調(diào)整值A(chǔ)?!兜牟襟E,其中A。力.(z) = (/ - —), z' s {0,1,…,Af -1}其中M為候選基音延遲調(diào)整索引的數(shù)量,5(m)為是自適應(yīng)步長, 以及Ze(O,l,...,M-l)是編碼的基音參數(shù)。
7. 根據(jù)權(quán)利要求6的方法,其中延遲調(diào)整值~力.被用于根據(jù)下面 的表達(dá)式將基音延遲插值曲線的端點上下移位<formula>formula see original document page 3</formula>其中d(m',y)為子幀延遲插值端點矩陣。
8. 根據(jù)權(quán)利要求l的方法,其中所述根據(jù)該自適應(yīng)步長生成編碼 的基音參數(shù)的步驟包括評估失真標(biāo)準(zhǔn)的步驟。
9. 根據(jù)權(quán)利要求8的方法,其中所述評估失真標(biāo)準(zhǔn)的步驟包括對 將均方差參數(shù)最小化、將累積的移位參數(shù)最小化、以及將歸一化的互 相關(guān)參數(shù)最大化的其中之一進行評估的步驟。
10. —種操作語音解碼器的方法,該方法包括步驟 接收第一基音延遲參數(shù);根據(jù)該第一基音延遲參數(shù)來估計基音延遲中的變化; 根據(jù)該基音延遲中的變化來確定自適應(yīng)步長;和 根據(jù)該自適應(yīng)步長來生成第二基音延遲參數(shù)。
11. 根據(jù)權(quán)利要求10的方法,其中所述估計基音延遲中的變化的 步驟包括估計基音延遲的方差和/或標(biāo)準(zhǔn)偏差的步驟。
12. 根據(jù)權(quán)利要求10的方法,其中所述確定自適應(yīng)步長的步驟包 括確定自適應(yīng)步長5(m),其中5(w)可被表達(dá)為<formula>formula see original document page 3</formula>其中a(CTj是基音延遲的變率估計的某一函數(shù),以及r^)是對于幀號m的基音延遲估計。
13. 根據(jù)權(quán)利要求12的方法,其中a( 卜minC4 +S,a薩),其中 A和B是預(yù)定的, 表示7"的標(biāo)準(zhǔn)偏差,a^為a( )的最大允許值。
14.根據(jù)權(quán)利要求10的方法,其中所述根據(jù)該自適應(yīng)步長生成第 二基音延遲參數(shù)的步驟包括確定延遲調(diào)整值A(chǔ)一.的步驟,其中 A—.W = (/ -M/2) Z e (0,1,…,M -1}其中M為候選基音延遲調(diào)整索引的數(shù)量,J(m)為自適應(yīng)步長。
15.根據(jù)權(quán)利要求14的方法,其中延遲調(diào)整值A(chǔ)—.被用來根據(jù)下 面的表達(dá)式將基音延遲插值曲線的端點向上或者向下移位 cT(m',y') = +其中^"/,y)為子幀延遲插值端點矩陣,W^',/)為第二基音延遲參數(shù)。
16. —種裝置,包括用于估計基音延遲中的變化的變率估計器;用于根據(jù)該基音延遲中的變化確定自適應(yīng)步長的系數(shù)生成器;和 用于根據(jù)該自適應(yīng)步長修正基音參數(shù)的修正電路。
17. 根據(jù)權(quán)利要求16的裝置,其中該修正電路根據(jù)自適應(yīng)步長向 上或者向下修正基音延遲插值曲線的端點。
18. 根據(jù)權(quán)利要求16的裝置,其中該基音延遲基于語音或者音頻 信號。
19.根據(jù)權(quán)利要求16的裝置,其中基音延遲中變化包括基音延遲 的方差和/或標(biāo)準(zhǔn)偏差。
20.權(quán)利要求16的裝置,其中該自適應(yīng)步長是按照5(m) = a(crr) 某個函數(shù)。<formula>formula see original document page 4</formula>來計算的,"( )是基音延遲的變率估計的
全文摘要
在語音編碼/解碼器(200/300)中,使用基音延遲曲線端點修正器(208)來將基音延遲插值曲線的端點上下移位。尤其是,根據(jù)基音延遲的方差和/或標(biāo)準(zhǔn)偏差來將基音延遲插值曲線的端點移位。
文檔編號G10L11/04GK101228573SQ200680027207
公開日2008年7月23日 申請日期2006年6月29日 優(yōu)先權(quán)日2005年7月27日
發(fā)明者烏達(dá)·米塔爾, 詹姆斯·P·阿什利 申請人:摩托羅拉公司