用來對相位譜信息進行子抽樣的方法和設(shè)備的制作方法

文檔序號：2829318閱讀：262來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：用來對相位譜信息進行子抽樣的方法和設(shè)備的制作方法
背景技術(shù)：
I.發(fā)明領(lǐng)域本發(fā)明總體上涉及語音處理領(lǐng)域，尤其涉及用來對將由語音編碼器發(fā)送的相位譜信息進行子抽樣的方法和設(shè)備。
II.背景技術(shù)通過數(shù)字技術(shù)發(fā)送語音已變得普遍，特別是在長途和數(shù)字無線電話應(yīng)用中更是如此。這接著增加了人們對確定在維持重建語音的可感質(zhì)量的同時能在信道上發(fā)送最小信息量的興趣。如果語音只是簡單地通過抽樣和數(shù)字化來發(fā)送，需要在每秒64千比特(kbps)的數(shù)量級上的數(shù)據(jù)速率以取得傳統(tǒng)模擬電話的語音質(zhì)量。然而，通過使用語音分析，加上合適的編碼、發(fā)送及接收機端的合成，可實現(xiàn)數(shù)據(jù)速率的顯著減少。
壓縮語音的設(shè)備用于許多電信領(lǐng)域。典型的領(lǐng)域是無線通信。無線通信領(lǐng)域有許多應(yīng)用，包括，例如，無繩電話、尋呼、無線本地環(huán)路，諸如蜂窩和PCS電話系統(tǒng)、移動因特網(wǎng)協(xié)議(IP)電話和衛(wèi)星通信系統(tǒng)之類的無線電話。一種特別重要的應(yīng)用是移動用戶的無線電話。
至今，已經(jīng)為包括如頻分多址(FDMA)，時分多址(TDMA)和碼分多址(CDMA)的無線通信系統(tǒng)開發(fā)了多種空中接口。與之相關(guān)，已建立多種國內(nèi)和國際標準，包括，例如，高級移動電話業(yè)務(wù)(AMPS)、全球移動通信系統(tǒng)(GSM)和過渡標準95(IS-95)。一典型的無線電話通信系統(tǒng)是碼分多址(CDMA)系統(tǒng)。IS-95標準及其變體IS-95A、ANSIJ-STD-08、IS-95B、建議第三代標準IS-95C和IS-2000等(此處統(tǒng)稱IS-95)由電信工業(yè)協(xié)會(TIA)及其他廣為人知的標準組織分布以說明蜂窩或PCS電話通信系統(tǒng)的CDMA空中接口的使用?；旧习凑誌S-95標準的使用配置的典型無線通信系統(tǒng)在專利號為5,103,459和4,901,307的美國專利中有描述，這兩個專利已轉(zhuǎn)讓給本發(fā)明的受讓人，在此完全引述供參考。
利用通過析取涉及人類語音生成模型的參數(shù)來壓縮語音的技術(shù)的設(shè)備稱為語音編碼器。語音編碼器把輸入語音信號分成時間塊或分析幀。語音編碼器通常包括編碼器和解碼器。編碼器分析輸入語音幀以析取一些相關(guān)參數(shù)，然后把這些參數(shù)量化成二進制表示，即，一組數(shù)據(jù)位或二進制數(shù)據(jù)分組。數(shù)據(jù)分組通過通信信道發(fā)送給接收機和解碼器。解碼器處理這些數(shù)據(jù)分組，對它們進行去量化以生成參數(shù)，并用去量化參數(shù)重新合成語音幀。
語音編碼器的功能是通過去掉語音中固有的全部自然冗余而把數(shù)字化語音信號壓縮成低比特率信號。數(shù)字壓縮是通過用一組參數(shù)來代表輸入語音幀并采用量化而用一組數(shù)據(jù)位來代表這些參數(shù)而實現(xiàn)的。如果輸入語音幀有幾個比特Ni且由語音編碼器生成的數(shù)據(jù)分組有幾個比特No，則由語音編碼器取得的壓縮系數(shù)是Cr＝Ni/No。我們所面臨的挑戰(zhàn)是，在取得目標壓縮系數(shù)的同時，保持解碼語音的高語音質(zhì)量。語音編碼器的性能取決于(1)語音模型或上述分析與合成過程的組合的工作情況是否良好；以及(2)參數(shù)量化過程以每秒No比特的目標比特率執(zhí)行的情況。語音模型的目標因而是用每個幀的一小組參數(shù)來捕獲語音信號的要素或目標語音質(zhì)量。
或許語音編碼器的設(shè)計中最重要的是對描述語音信號的好參數(shù)(包括失量)組的搜索。一組好參數(shù)要求在重建感知上精確的語音信號時采用低系統(tǒng)帶寬。音調(diào)、信號功率、頻譜包絡(luò)(或其共振峰)、振幅譜和相位譜是語音編碼參數(shù)的例子。
語音編碼器可實施為時域編碼器，它試圖通過利用高時間分辨率來處理以一次對小語音段(通常為5毫秒(ms)子幀)編碼而捕獲時域語音波形。對每個子幀，來自電碼本空間的高準確度表示是通過業(yè)界已知的多種搜索算法發(fā)現(xiàn)的?；蛘撸Z音編碼器可實施為頻域編碼器，它試圖用參數(shù)(分析)組捕獲輸入語音幀的短期語音頻譜并利用相應(yīng)的合成過程以從頻譜參數(shù)重新生成語音波形。參數(shù)量化器通過用存儲碼矢量來表示它們而按照A.Gersho和R.M.Gray所著的“Vector Quantization and Signal Compression”(1992年版)中描述的已知的量化技術(shù)保存這些參數(shù)。
廣為人知的時域語音編碼器是L.B Rabiner和R.W.Schafer所著的“DigitalProcessing ofSpeech Signals”(396-453，1978年)中描述的碼激勵線性預(yù)測(CELP)編碼器，在此完全引述供參考。在CELP編碼器中，語音信號中的短期相關(guān)或冗余通過線性預(yù)測(LP)分析而去除，線性預(yù)測分析找到短期共振峰濾波器的系數(shù)。把短期預(yù)測濾波器用于輸入語音幀生成LP剩余信號，用長期預(yù)測濾波器參數(shù)和后續(xù)隨機電碼本對LP剩余信號進一步建模和量化。這樣，CELP編碼把對時域語音波形編碼的任務(wù)分成對LP短期濾波器系數(shù)編碼與對LP剩余編碼這兩個獨立的任務(wù)。時域編碼可以固定速率(即，用每個幀的相同數(shù)目的比特No)或以可變速率(不同的比特率用于不同類型的幀內(nèi)容)來執(zhí)行?？勺兯俾示幋a器試圖只使用把編譯碼器參數(shù)編碼成足夠獲得目標質(zhì)量的水平所需的比特數(shù)量。典型的可變速率CELP編碼器在專利號為5,414,796的美國專利中有描述，該專利已轉(zhuǎn)讓給本發(fā)明的受讓人，在此完全引述從參考。
諸如CELP編碼器之類的時域編碼器通常依賴于高數(shù)目的每幀比特數(shù)No，以保持時域語音波形的精準性。只要每幀的比特數(shù)No的數(shù)目相當大(例如，8kbps或以上)，這樣的編碼器通常給出非常好的語音質(zhì)量。然而，在低比特率(4kbps或以下)時，時域編碼器因可供比特數(shù)目有限而不能保持高質(zhì)量和強有力的性能。在低比特率時，有限的電碼本空間切斷普通時域編碼器的波形匹配能力，普通時域編碼器布署于較高速率商業(yè)應(yīng)用中是很成功的。因此，盡管隨時間的不斷改進，許多運行在低比特率的CELP編碼系統(tǒng)遭遇通常以噪聲為特征的感知上重大的失真。
目前對開發(fā)運行在中間至低的比特率(即，在2.4至4kbps的范圍)的高質(zhì)量語音編碼器有劇升的研究興趣和強烈的商業(yè)需求。應(yīng)用領(lǐng)域包括無線電話、衛(wèi)星通信、因特網(wǎng)電話、各種多媒體和語音流應(yīng)用、語音郵件及其他語音存儲系統(tǒng)。驅(qū)動力是分組數(shù)據(jù)丟夫情況下對高容量的需要和對健康性能的要求。各種近來的語音編碼標準化努力是推動研究和開發(fā)低速率語音編碼算法的另一直接驅(qū)動力。低速率語音編碼器按容許應(yīng)用帶寬生成更多信道或用戶，且與合適信道編碼的添加層耦合的低速率語音編碼器能適合于編碼器規(guī)格總比特預(yù)算，而在信道差錯條件下提供健全的性能。
以低比特率對語音有效率地編碼的一有效技術(shù)是多模編碼。典型的多模編碼技術(shù)在1998年12月21日申請的、序列號為09/217,341，標題為“VARIABLERATE SPEECH CODING”的美國申請中有描述，該申請書已轉(zhuǎn)讓給本發(fā)明的受讓人，在此完全引述供參考。普通多模編碼器把不同模式或編碼一解碼算法運用于不同類型的輸入語音幀。每個模式或編碼一解碼過程定制成以最有效方式最佳地表示某種類型的語音段，例如，濁語音、清語音、過渡語音(例如，清和濁之間)及背景噪聲(非話音)。外部的開環(huán)模式判定機制仔細查看輸入語音幀并就哪一種模式適用于該幀作出判定。開環(huán)模式判定通常是通過從輸入幀析取許多參數(shù)，就一些時間和頻譜特征評價這些參數(shù)，并根據(jù)評價來決定模式來進行的。
以在2.4kbps級別上的速率運行的編碼系統(tǒng)通常本質(zhì)上是參數(shù)的。也就是說，這樣的編碼系統(tǒng)通過以有規(guī)律的間隔發(fā)送描述語音信號的音節(jié)周期和頻譜包絡(luò)(或共振峰)的參數(shù)而運行。說明這些所謂參數(shù)編碼器的是LP聲碼器系統(tǒng)。
LP聲碼器采用每一音節(jié)一個脈沖，周期地對濁語音信號建模?？梢栽鰪娺@一基于技術(shù)，從而除其他事物外還包括發(fā)送有關(guān)頻譜包絡(luò)的信息。盡管LP聲碼器一般提供合理的性能，它們可帶來典型地以蜂音為特征的感知上重大的失真。
近幾年中，已出現(xiàn)是波形編碼器和參數(shù)編碼器的混合的編碼器。說明這些所謂混合編碼器的是原型波形內(nèi)插(PWI)語音編碼器。PWI編碼系統(tǒng)亦可稱為原型音節(jié)(pitch)周期(PPP)語音編碼器。PWI編碼系統(tǒng)提供一種用來對濁語音編碼的有效方法。PWI的基本概念是以固定間隔析取代表音節(jié)周期(原型波形)、發(fā)送其描述及通過在原型波形間內(nèi)插重建語音信號。PWI方法可運行在或者LP剩余信號上或者語音信號上。典型的PWI或PPP語音編碼器在1998年12月21日申請的，序列號為09/217,494、標題為“PERIODIC SPEECHCODING”的美國申請中有描述，該申請書已轉(zhuǎn)讓給本發(fā)明的受讓人，在此完全引述供參數(shù)。其他PWI或PPP語音編碼器在專利號為5,884,253的美國專利及W.Bastiaan Kleign和Wolfgang Granzow所著的“Method for WaveformInterpolation in Speech Coding”(1991年版)的215至230頁中有描述。
在許多普通語音編碼器中，給定音節(jié)原型的相位參數(shù)各自單獨由編碼器量化和發(fā)送?；蛘?，相位參數(shù)可得到矢量量化以使帶寬守恒。然而，在低比特率語音編碼器中，發(fā)送最小數(shù)目的可能維持令人滿意的語音質(zhì)量的比特是有益的。因此，在一些普通語音編碼器中，相位參數(shù)可根本不是由編碼器發(fā)送的，而解碼器可以或者不把相位用于重建，或者使用固定的存儲相位參數(shù)組。在這兩種情況的任一情況中，結(jié)果語音質(zhì)量可降低。因此，提供一種減小從編碼器向解碼器發(fā)送相位譜信息所必需的單元的數(shù)目從而發(fā)送較少的相位信息的低速率語音編碼器將是理想的。因而，需要一種每幀發(fā)送較少相位參數(shù)的語音編碼器。
發(fā)明概要本發(fā)明涉及一種每幀發(fā)送較少相位參數(shù)的語音編碼器。相應(yīng)地，在本發(fā)明的一個方面，一種在語音編碼器中處理幀的原型的方法最好包括以下步驟生成基準原型的多個相位參數(shù)、生成原型的多個相位參數(shù)，以及在多個頻帶中，使原型的相位參數(shù)和基準原型的相位參數(shù)相關(guān)聯(lián)。
在本發(fā)明的另一方面，一種在語音編碼器中處理幀的原型的方法最好包括以下步驟生成基準原型的多個相位參數(shù)、生成與該原型有關(guān)的多個線性相移植，以及在多個頻帶上從這些相位參數(shù)和這些線性相移值合成相位矢量。
在本發(fā)明的另一方面，一種在語音編碼器中處理幀的原型的方法最好包括以下步驟生成與該原型有關(guān)的多個循環(huán)旋轉(zhuǎn)值，在多個頻帶中生成多個帶通波形(多個帶通波形與基準原型的多個相位數(shù)有關(guān))及根據(jù)多個循環(huán)旋轉(zhuǎn)值修改多個帶通波形。
在本發(fā)明的另一方面，一種語音編碼器最好包括用來生成幀的基準原型的多個相位參數(shù)的裝置，用來生成當前幀的當前原型的多個相位參數(shù)的裝置及用來在多個頻帶中使當前原型的相位參數(shù)和基準原型的相位參數(shù)相關(guān)聯(lián)的裝置。
在本發(fā)明的另一方面，一種語音編碼器最好包括用來生成幀的基準原型的多個相位參數(shù)的裝置，用來生成與當前幀的當前原型關(guān)聯(lián)的多個線性相移值的裝置以及用來在多個頻帶上從這些相位參數(shù)和這些線性相移值合成相位矢量的裝置。
在本發(fā)明的另一方面，一種語音編碼器最好包括用來生成與當前幀的當前原型相關(guān)聯(lián)的多個循環(huán)旋轉(zhuǎn)值的裝置，用來在多個頻帶中生成多個帶通波形的裝置(多個帶通波形與幀的基準原型的多個相位參數(shù)有關(guān))及用來根據(jù)多個循環(huán)旋轉(zhuǎn)值修改多個帶通波形的裝置。
在本發(fā)明的另一方面，一種語音編碼器最好包括配置成從正由語音編碼器處理的當前幀析取當前原型的原型析取器，以及耦合到原型析取器并配置成生成幀的基準原型的多個相位參數(shù)，生成當前原型的多個相位參數(shù)且在多個頻帶中使當前原型的這些相位參數(shù)和基準原型的這些相位參數(shù)相關(guān)聯(lián)的原型量化器。
在本發(fā)明的另一方面，一種語音編碼器最好包括配置成從正由語音編碼器處理的當前幀析取當前原型的原型析取器，以及耦合到原型析取器并配置成生成幀的基準原型的多個相位參數(shù)，生成與當前原型有關(guān)的多個線性相移值且在多個頻帶上從這些相位參數(shù)和線性相移值合成相位矢量的原型量化器。
在本發(fā)明的另一方面，語音編碼器最好包括配置成從正由語音編碼器處理的當前幀析取當前原型的原型析取器，以及耦合到原型析取器并配置成生成與當前原型有關(guān)的多個循環(huán)旋轉(zhuǎn)值，在多個頻帶中生成多個帶通波形(多個帶通波形與幀的基準原型的多個相位參數(shù)有關(guān))且根據(jù)多個循環(huán)旋轉(zhuǎn)值修改多個帶通波形的原型量化器。
附圖簡述

圖1是無線電話系統(tǒng)的方框圖。
圖2是由語音編碼器終接在每一端的通信信道的方框圖。
圖3是編碼器的方框圖。
圖4是解碼器的方框圖。
圖5是說明語音編碼判定過程的流程圖。
圖6A是語音信號幅度對時間的曲線圖，而圖6B是線性預(yù)測(LP)剩余幅度對時間的曲線圖。
圖7是原型音節(jié)周期語音編碼器的方框圖。
圖8是可用于圖7中的語音編碼器中的原型量化器的方框圖。
圖9是可用于圖7中的語音編碼器中的原型去量化器的方框圖。
圖10是可用于圖7中的語音編碼器中的原型去量化器的方框圖。
較佳實施例的詳細描述下文中描述的示例實施例駐留于配置成利用CDMA空中接口的無線電話通信系統(tǒng)中。然而，本領(lǐng)域中的熟練人士明白，含有本發(fā)明特性的子抽樣方法和設(shè)備可駐留于利用為本領(lǐng)域中的熟練人士所知的范圍廣泛的技術(shù)的各種通信系統(tǒng)中的任一種中。
如圖1所示，CDMA無線電話系統(tǒng)通常包括多個移動用戶單元10、多個基站12、基站控制器(BSC)14及移動交換中心(MSC)16。MSC16配置成與普通公交換電話網(wǎng)(PSTN)18交接(interface)。MSC16亦配置成與BSC14交接。BSC14通過迂回線路耦合到基站12。迂回線路可配置成支持幾種已知接口包括(例如)E1/T1、ATM、IP、PPP、幀中繼、HDSL、ADSL或XDSL中的任一種。應(yīng)當理解，系統(tǒng)中可有多于兩個的BSC14。每個基站12最好包括至少一個扇區(qū)(未示出)，每個扇區(qū)包含一指向一徑向離開基站12的特定方向的全向天線或天線?；蛘撸總€扇區(qū)可包含用于分集接收的兩個天線。每個基站12最好設(shè)計成支持多個頻率分配。扇區(qū)和頻率分配的交點可稱為CDMA信道。基站12亦可稱為基站收發(fā)信機子系統(tǒng)(BTS)12?；蛘撸盎尽痹跇I(yè)界可用來統(tǒng)稱BSC14和一個或以上的BTS12。BTS12亦可表示為“區(qū)站”12。或者，給定BTS12的單獨扇區(qū)可稱為區(qū)站。移動用戶單元10通常是蜂窩或PCS電話10。系統(tǒng)最好配置成按照IS-95標準使用。
在蜂窩電話系統(tǒng)的典型運行期間，基站12接收來自幾組移動單元10的幾組反向鏈路信號。移動單元10在進行電話呼叫或其他通信。由一給定基站12接收的每個反向鏈路信號在該基站12內(nèi)處理。結(jié)果數(shù)據(jù)提交給BSC14。BSC14提供呼叫資源分配和包括基站12間軟切換的協(xié)調(diào)(orchestration)的移動性管理功能。BSC14還把接收的數(shù)據(jù)發(fā)送給MSC16，MSC16提供用于與PSTN18交接的附加的路由選擇業(yè)務(wù)。類似地，PSTN18與MSC16接口相連，而MSC16與MSC14交接，BSC14依次控制基站12向移動單元組10發(fā)送前向鏈路信號組。
在圖2中，第一編碼器100接收數(shù)字化語音樣本S(n)，并對這些樣本S(n)編碼，以在傳輸媒介102或通信信道102上向第一解碼器104發(fā)送。解碼器104對編碼語音樣本解碼，并合成輸出語音信號SSYNTH(n)。為在相反方向發(fā)送，第二編碼器106對數(shù)字化的語音樣本S(n)編碼，數(shù)字化的語音樣本S(n)在通信信道108上發(fā)送。第二解碼器110接收并對編碼語音樣本解碼，生成合成輸出語音信號SSYNTH(n)。
語音樣本S(n)表示已按照本領(lǐng)域中已知的各種方法，包括(例如)，脈碼調(diào)制(PCM)、壓擴μ律或A律中的任一種得到數(shù)字化和量化的語音信號。如本領(lǐng)域中所知，語音樣本S(n)組織到輸入數(shù)據(jù)幀中，其中，每個幀包含一預(yù)置數(shù)目的數(shù)字化的語音樣本S(n)。在一示例實施例中，利用8KHz的抽樣率，每個20ms幀包含160個樣本。在下面描述的實施例中，數(shù)據(jù)發(fā)送速率最好按幀而異從13.2kbps(全速率)到6.2kbps(半速率)到2.6kbps(1/4速率)到1kbps(1/8速率)。使數(shù)據(jù)發(fā)送速率各異是有益的，因為對含有相對較少語音信息的幀可以有選擇地利用較低比特率。如本領(lǐng)域中的熟練人員所知，可使用其他抽樣速率、幀大小和數(shù)據(jù)發(fā)送速率。
第一編碼器100與第二解碼器110一起含有一個語音編碼器或語音編譯碼器。語音編碼器可用于任一用來發(fā)送語音信號的通信設(shè)備，包括，例如，用戶單元，BTS或上面參考圖1所述的BSC中。與此類似，第二編碼器106和第一解碼器104一起含有一個第二語音編碼器。本領(lǐng)域中的熟練人士明白，語音編碼器可用數(shù)字信號處理器(DSP)、專用集成電路(ASIC)、離散門邏輯、固件或任一普通可編程軟件模塊和微處理器來實施。軟件模塊可位于RAM存儲器、按塊擦除存儲器、寄存器或本領(lǐng)域中所知的其他形式的可寫存儲介質(zhì)內(nèi)?；蛘?，可用任一普通處理器、控制器或狀態(tài)機代替微處理器。專門為語音編碼設(shè)計的示例ASIC在專利號為5,727,123的美國專利及1994年2月16日提交的序列號為08/197,417標題為“VOCODER ASIC”的美國專利申請書中有描述，二者均已轉(zhuǎn)讓給本發(fā)明的受讓人，在此引述供參考。
圖3中，可用于語音編碼器中的編碼器200包括模式判模塊202，音節(jié)估計模塊204、LP分析濾波器208、LP量化塊210及剩余量化模塊212。輸入語音幀S(n)提供給模式判定模塊202、音節(jié)估計模塊204、LP分析模塊206和LP分析濾波器208。模式判定模塊202根據(jù)每個輸入語音幀S(n)的周期性、能量、信噪比(SNR)或過零率等生成模式索引IM和模式M。按照周期性對語音幀歸類的各種方法在專利號為5,911,128的美國專利中有描述，該專利已轉(zhuǎn)讓給本發(fā)明的受讓人，在此引述供參考。這樣的方法亦被并入電信工業(yè)協(xié)會工業(yè)過渡標準TIA/EIA IS-127和TIA/EIA IS-733中。示例模式判定方案在前面所提及的序列號09/217,341的美國專利申請書中亦有描述。
音節(jié)估計模塊204根據(jù)每個輸入語音幀S(n)生成音節(jié)索引IP和滯后值Po。LP分析模塊206在每個輸入語音幀S(n)上執(zhí)行線性預(yù)測分析以生成LP參數(shù)a。LP參數(shù)a提供給LP量化模塊210。LP量化模塊210亦接收模式M，從而以取決于模式的方式執(zhí)行量化過程。LP量化模塊210生成LP索引ILP和量化的LP參數(shù)a。LP分析濾波器208除接收輸入語音幀S(n)外還接收量化的LP參數(shù)a。LP分析濾波器208生成LP剩余信號R[n]，LP剩余信號R[n]表示輸入語音幀S(n)與基于量化線性預(yù)測參數(shù)a的重建語音間的差錯。LP剩余R[n]，模式M和量化LP參數(shù)a提供給剩余量化模塊212。根據(jù)這些值，剩余量化模塊212生成剩余索引IR和量化剩余信號R[n]。
在圖4中可用于語音編碼器中的解碼器300包括LP參數(shù)解碼模塊302，剩余解碼模塊304、模式解模塊306和LP合成濾波器308。模式解碼模塊306接收并對模式索引IM解碼，從中生成模式M。LP參數(shù)解碼模塊302接收模式M和LP索引ILP。LP參數(shù)解碼模塊302對接收的值解碼，以生成量化LP參數(shù)a。剩余解碼模塊304接收剩余索引IR、音節(jié)索引IP和模式索引IM。剩余解碼模塊304對接收的值解碼，以生成量化剩余信號R[n]。量化剩余信號R[n]和量化LP參數(shù)a提供給LP合成濾波器308，LP合成濾波器308從中合成解碼輸出語音信號S[n]。
圖3的編碼器200和圖4的解碼器300的各種模塊的運行和實施為本領(lǐng)域中的人員所知，且在前文中所提及的專利號為5,414,796的美國專利及L.B.Rabiner與R.W.Schafer合著的“Digital Processing of Speech Signals“(1978年版)的396至453頁中有描述。
如圖5的流程圖所示，根據(jù)一實施例的語音編器在處理用于發(fā)送的語音樣本中遵循一組步驟。在步驟400中語音編碼器接收連續(xù)幀中語音信號的數(shù)字樣本。一旦接收一給定幀，語音編碼器進入步驟402。步驟402中語音編碼器檢測該幀的能量。能量是幀的語音活動性的量度。語音檢測是通過求數(shù)字語音樣本的幅度的平方的和及把結(jié)果能量與閾值比較執(zhí)行的。在一實施例中閾值根據(jù)背景噪聲的變化水平適配。典型的可變閾值語音活動性檢測器在前文提及的專利號為5,414,796的美國專利中有描述。一些清音可以是特別低能量的樣本，可作為背景噪聲被誤編碼。為防止此情況發(fā)生，如在前文提及的專利號為5,414,796的美國專利中所述，可使用低能量樣本的頻譜傾斜以把清音與背景噪聲區(qū)分開。
檢測幀的能量后，語音編碼器進入步驟404。步驟404中語音編碼器確定檢測幀能量是否充足到把幀分為含有語音信息。若檢測幀能量落于預(yù)置門限水平之后，語音編碼器進入步驟406。步驟406中語音編碼器把幀當作背景噪聲(即，非話或靜寂)編碼。在一實施例中，背景噪聲幀以1/8速率或1kbps編碼。若步驟404中檢測幀能量符合或超出預(yù)置門限水平，幀歸類為語音而語音編碼器進入步驟408。
步驟408中，語音編碼器確定幀是否清音，即，語音編碼器檢驗幀的周期性。周期性確定的各種已知方法包括，例如，使用過零和使用歸一化自相關(guān)函數(shù)(NACF)。特別是，使用過零和NACF檢測周期性在前文提及的專利號為5,911,128的美國專利和序列號為09/217,341的美國專利申請書中有描述。另外，以上用來區(qū)分濁音和清音的方法被并入電信工業(yè)協(xié)會過渡標準TIA/EIA IS-127和TIA/EIA IS-733中。若步驟408確定幀是清音，語音編碼器進入步驟410。步驟410中語音編碼器把幀作為清音編碼。在一實施例中，清音幀以1/4速率或2.6kbps得到編碼。若步驟408中未確定幀是清音，語音編碼器進入步驟412。
步驟412中，例如，前文提及的專利號為5,911,128的美國專利中所述，語音編碼器用本領(lǐng)域所知的周期性檢測方法確定幀是否是過渡語音。若確定幀是過渡語音，語音編碼器進入步驟414。步驟414中幀作為過渡語音(即，從清音向濁音過渡)編碼。在一實施例中，過渡語音幀是按照1999年5月7日申請的序列號為09/307,294的、標題為“MULTIPULSE INTERPOLATIVECODING OF TRANSITION SPEECH FRAMES”的美國專利申請書描述的多脈沖內(nèi)插編碼方法編碼的，該申請書已轉(zhuǎn)證給本發(fā)明的受讓人，在此完全引述供參考。在另一實施例中，過渡語音幀以全速率或13.2kbps編碼。
若步驟412中語音編碼器確定幀不是過渡語音，語音編碼器進入步驟416。步驟416中語音編碼器把幀作為濁音編碼。在一實施例中可以半速率或6.2kbps濁音幀編碼。亦可能全速率或13.2kbps(或全速率，8kbps，在8kCELP編碼器中)對濁音幀編碼。然而，本領(lǐng)域中的熟練人士明白，以半速率對濁音幀編碼能通過利用濁音幀的穩(wěn)態(tài)本質(zhì)允許編碼器存儲寶貴的帶寬。而且，不管用來對濁音編碼的速率是什么，最好用以前幀的信息對濁音編碼，因而可說成是對濁音預(yù)測編碼。
普通技術(shù)人員能夠認識到，可遵循圖5所示的步驟對語音信號或相應(yīng)的LP剩余編碼。噪聲、清音、過渡語音和濁音的濾形特點可看作是圖6A的曲線圖中時間函數(shù)。噪聲、清音LP剩余、過渡語音LP剩余和濁音LP剩余可視為圖6B的曲線圖中時間的函數(shù)。
在一種實施例中，原型音節(jié)周期(PPP)語音編碼器500包括反濾波器502，原型析取器504、原型量化器506、原型去量化508、內(nèi)插/合成模塊510和LPC合成模塊512，如圖7所示。語音編碼器500可最好是DSP的部件，并可駐留于，例如，PCS或蜂窩電話系統(tǒng)中的用戶單元或基站中，或駐留于衛(wèi)星系統(tǒng)中的用戶單元或網(wǎng)關(guān)中。
在語音編碼器500中，將數(shù)字化語音信號S(n)(其中，n是幀號)提供給反LP濾波器502。在一特定實施例中，幀長是20ms。按照下列等式計算反濾波器的傳遞函數(shù)A(2)A(z)＝1-a1z-1-a2z-2-…-apz-p(略)系數(shù)a1是具有按照已知方法選擇的預(yù)置值的濾波器抽頭，這些已知方法如專利號5,414,796的美國專利和序列號為09/217,494的美國專利申請書中所述，它們在前文中以完全引述供參考。數(shù)字P表示反LP濾波器502用于預(yù)測的前樣本的數(shù)目。在一特定實施例中，P設(shè)定為10。
反濾波器502向原型析取器504提供LP剩余信號r(n)。原型析取器504從當前幀析取原型。原型是將由內(nèi)插/合成模塊510用來自類似地定位于幀中的前幀的原型線性地內(nèi)插以在解碼器端重建LP剩余信號的當前幀的部分。
原型析取器504向原型量化器506提供原型，原型量化器506按照下面參考圖8所述的技術(shù)量化原型。量化值可從查閱表(未示出)獲得，匯編成數(shù)據(jù)分組，數(shù)據(jù)分組包括滯后和其他電碼本參數(shù)，用來通過信道發(fā)送。分組提供給發(fā)射機(未示出)并通過信道向接收機(亦未示出)發(fā)送。反LP濾波器502，原型析取器504和原型量化器506已完成對當前幀的PPP分析。
接收機接收數(shù)據(jù)分組并把數(shù)據(jù)分組提供給原型去量化器508。原型去量化器508按照下面參考圖9所述的技術(shù)去量化數(shù)據(jù)分組。原型去量化器508向內(nèi)插/合成模塊510提供去量化原型。內(nèi)插/合成模塊510用來自類似定位于幀中的前幀的原型內(nèi)插原型以重建當前幀的LP剩余信號。內(nèi)插與幀合成最好按照專利號為5,884,253的美國專利和前文提及的序列號為09/217,494的美國專利申請書中所述的已知方法來完成。
內(nèi)插/合成模塊510向LPC合成模塊512提供重建LP剩余信號r(n)。LPC合成模塊512還接收來自發(fā)送數(shù)據(jù)分組的線譜對(LSP)值，LSP值用來執(zhí)行重建LP剩余信號r(n)上的LPC濾波，以生成當前幀的重建語音信號S(n)。在一可選實施例中，可在執(zhí)行當前幀的插入/合成之前對原型執(zhí)行語音信號S(n)的LPC合成。原型去量化器508，內(nèi)插/合成模塊510和LPC合成模塊512已完成當前幀的PPP合成。
在一實施例中，原型量化器600采用有效發(fā)送的智能子抽樣，執(zhí)行原型相位的量化，如圖8所示，原型建化器600包括第一和第二離散傅里叫級數(shù)(DFS)系數(shù)計算模塊602、604、第一和第二分解模塊606、608、頻帶標識模塊610、幅度矢量量化器612、關(guān)聯(lián)模塊614和量化器616。
在原型量化器600中，基準原型提供給第一DFS系數(shù)計算模塊602。第一DFS系數(shù)計算模塊602計算基準原型的DFS系數(shù)，如下所述，并把基準原型的DFS系數(shù)提供給第一分解模塊606。第一分解模塊606把基準原型的DFS系數(shù)分解成幅度矢量和相位矢量，如下所述。第一分解模塊606向關(guān)聯(lián)模塊614提供幅度矢量和相位矢量。
把當前原型提供給第二DFS系數(shù)計算模塊602。第二DFS系數(shù)計算模塊606計算當前原型的DFS系數(shù)，如下所述，并把當前原型的DFS系數(shù)提供給第二分解模塊608。第二分解模塊608把當前原型的DFS系數(shù)分解成幅度矢量和相位矢量，如下所述。第二分解模塊608向關(guān)聯(lián)模塊614提供幅度矢量和相位矢量。
第二分解模塊608還向頻帶標識模塊610提供當前原型的幅度矢量和相位矢量。頻帶標識模塊610標識用于關(guān)聯(lián)的頻帶，如下所述，并向關(guān)聯(lián)模塊614提供頻帶標識索引。
第二分解模塊608還向幅度矢量量化器612提供當前原型的幅度矢量。幅度矢量量化器612量化當前原型的幅度矢量，如下所述，并生成幅度量化參數(shù)用于發(fā)送。在一特定實施例中，幅度矢量量化器612同頻帶標識模塊610(為求明晰這種聯(lián)系未在附圖中示出)和/或向關(guān)聯(lián)模塊614提供量化幅度值。
關(guān)聯(lián)模塊614在所有頻帶中關(guān)聯(lián)，以確定全部頻帶的最佳線性相移，如下所述，在一可選實施例中，在帶通信號上的時域中執(zhí)行互相關(guān)以確定所有頻帶的最佳循環(huán)旋轉(zhuǎn)，亦如下所述。關(guān)聯(lián)模塊614向量化器616提供線性相移值。在一可選實施例中，關(guān)聯(lián)模塊614向量化器616提供循環(huán)旋轉(zhuǎn)值。量化器616量化接收值，如下所述，生成相位量化參數(shù)用于發(fā)送。
在一實施例中原型去量化器700用DFS的組成頻帶上的線性移執(zhí)行原型相位譜的重建，如圖9所示。原型去量化器700包括DFS系數(shù)計算模塊702、反DFS計算模塊704、分解模塊706、組合模塊708、頻帶標識模塊701、幅度矢量去量化器712、合成模塊714和相位去量化器716。
在原型去量化器700中，基準原型提供給DFS系數(shù)計算模塊702。DFS系數(shù)計算模塊702計算基準原型的DFS系數(shù)，如下所述，并向分解模塊706提供基準原型的DFS系數(shù)。分解模塊706把基準原型的DFS系數(shù)分解成幅度和相位矢量，如下所述。分解模塊706向合成模塊714提供基準相位(即，基準原型的相位矢量)。
相位量化參數(shù)由相位去量化器716接收。相位去量化器716去量化接收相位量化參數(shù)，如下所述，生成線性相移值。相位去量化器716向合成模塊714提供線性相移值。
幅度矢量量化參數(shù)由幅度矢量去量化器712接收。幅度矢量去量化器712去量化接收幅度量化參數(shù)，如下所述，生成去量化幅度值。幅度矢量去量化器712向組合模塊708提供量化幅度值。幅度矢量去量化器712還向頻帶標識模塊710提供去量化幅度值。頻帶標識模塊710標識頻帶用于組合，如下所述，并向合成模塊714提供頻帶標識索引。
合成模塊714從基準相位和線性相移值合成修改的相位矢量，如下所述。合成模塊714向組合模塊708提供修改的相位矢量值。
組合模塊708將去量化幅度值和相位值組合起來，如下所述，生成重建的、修改的DFS系數(shù)矢量。組合模塊708向反DFS計算模塊704提供組合的幅度和相位矢量。反DFS計算模塊704計算重建的、修改的DFS系數(shù)矢量的反DFS，如下所述，生成重建當前原型。
在一實施例中，原型去量化器800用在編碼器端的原型波形的組成帶通波形上的時域中執(zhí)行的循環(huán)旋轉(zhuǎn)執(zhí)行原型相位譜的重建，如圖9所示。原型去量化器800包括DFS系數(shù)計算模塊802、帶通波形加法器804、分解模塊806、反DFS/帶通信號生成模塊808、頻帶標識模塊810、幅度矢量去量化器812、合成模塊814和相位去量化器816。
在原型去量化器800中，基準原型提供給DFS系數(shù)計算模塊802。DFS系數(shù)計算模塊802計算基準原型的DFS系數(shù)，如下所述，并向分解模塊806提供基準原型的DFS系數(shù)。分解模塊806把基準原型的DFS系數(shù)分解成幅度和相位矢量，如下所述。分解模塊806向合成模塊814提供基準相位(即，基準原型的相位矢量)。
相位量化參數(shù)由相位去量化器816接收。相位去量化器816去量化接收相位量化參數(shù)，如下所述，生成循環(huán)旋轉(zhuǎn)值。相位去量化器816向合成模塊814提供循環(huán)旋轉(zhuǎn)值。
幅度矢量量化參數(shù)由幅度矢量去量化器812接收。幅度矢量去量化器812去量化接收幅度量化參數(shù)，如下所述，生成去量化幅度值。幅度矢量去量化器812向反DFS/帶通信號生成模塊808提供量化幅度值。幅度矢量去量化器812還向頻帶標識模塊810提供去量化幅度值。頻帶標識模塊810標識頻帶用于組合，如下所述，并向反FDS/帶通信號生成模塊808提供頻帶標識索引。
反DFS/帶通信號生成模塊808組合去量化幅度值和每個頻帶的基準相位值，并用每個頻帶的反DFS從組合計算帶通信號，如下所述。反DFS/帶通信號生成模塊808向組成模塊814提供帶通信號。
合成模塊814用去量化循環(huán)旋轉(zhuǎn)值循環(huán)旋轉(zhuǎn)每個帶通信號，如下所述，生成修改的、旋轉(zhuǎn)的帶通信號。合成模塊814向帶通波形加法器804提供修改的、旋轉(zhuǎn)的帶通信號。帶通波形加法器804求全部帶通信號的和，以生成重建原型。
圖8的原型量化器600和圖9的原型去量化器700在正常工作中分別用來對原型音節(jié)周期波形的相位譜編碼和解碼。在發(fā)射機/編碼器(圖8)，用DFS表達式計算當前幀的原型SC(n)的相位譜kc，Ckc是當前原型的復(fù)合DFS系數(shù)而ωoc是SC(n)的歸一化基頻。相位譜kc是組成DFS的復(fù)合系數(shù)的角。用類似的方式計算基準原型的相位譜kr，以提供Ckc和kr?；蛘撸鶞试偷南辔蛔Vkr在有基準原型的幀得到處理后得到存儲，并且從存儲器只是得到檢索。在一特別實施例中，基準原型是來自前一幀的原型。來自基準幀和當前幀的兩原型的復(fù)合DFS可表示為振幅譜和相位譜的乘積，如下面的等式所示。#應(yīng)注意的是，振幅譜和相位譜是矢量，因為復(fù)合DFS亦是矢量。DFS矢量的每個單元是等于相應(yīng)原型的時長的倒數(shù)的頻率的諧波。對最大頻率為FmHz(以至少2FmHz的速率抽樣)的信號和FoHz的諧波頻率，有M個諧波。諧波的數(shù)目M等于Fm/Fo。因此，每個原型相位譜矢量和振幅譜矢量由M個單元構(gòu)成。
當前原型的DFS矢量劃分成B個頻帶而對應(yīng)每個B頻帶的時間信號是帶通信號。頻帶的數(shù)目B限于小于諧波的數(shù)目M。求全部B帶通時間信號的和會得出原始當前原型。以類似的方式，基準原型的DFS矢量亦劃分成相同的B頻帶。(kbi)]]>對每個B頻帶，在對應(yīng)基準原型的帶通信號與對應(yīng)當前原型的帶通信號間執(zhí)行互相關(guān)?；ハ嚓P(guān)可在頻域DFS矢量上執(zhí)行，其中，(kbi)是第i個頻帶bi中的諧波數(shù)集，而θi是第i個頻帶bi和可能的線性相移。互相關(guān)亦可按照下面的等式在對應(yīng)的時域帶通信號上(例如，用圖10的去量化器800)執(zhí)行 L是當前原型的樣本中的長度，而和分別是基準原型和當前原型的歸一化基頻，而ri是樣本中的循環(huán)旋轉(zhuǎn)。對應(yīng)頻帶bi的帶通時域信號sbir(n)和sbiC分別由下列表達式給出在一實施例中，用量化幅度矢量得到CkC，如下面的等式所示 ?；ハ嚓P(guān)通過基準原型的帶通DFS矢量的全部可能線性相移執(zhí)行。或者，互相關(guān)可通過基準原型的帶通FDS矢量的全部可能線性相移的子集執(zhí)行。在一可選實施例中，利用時域方法，而互相關(guān)通過基準原型的帶通時間信號的全部可能循環(huán)旋轉(zhuǎn)執(zhí)行。在一實施例中，互相關(guān)通過基準原型的帶通時間信號的全部可循環(huán)旋轉(zhuǎn)的子集執(zhí)行。互相關(guān)過程生成對應(yīng)每個B頻帶的互相關(guān)的最大值的B線性相移(或B循環(huán)旋轉(zhuǎn)，在互相關(guān)在帶通時間信號上的時域中執(zhí)行的實施例中)。然后B個線性相移(或，在可迭實施例中，B循環(huán)旋轉(zhuǎn))取代M個原始相位譜矢量單元作為相位譜的代表得到量化和發(fā)送。獨立地量化和發(fā)送振幅譜矢量。這樣，基準原型的帶通DFS矢量(或帶通時間信號)最好用作電碼本對當前幀的原型的對應(yīng)DFS矢量(或帶通信號)編碼。相應(yīng)地，需要較少單元量化和發(fā)送相位信息，從而實現(xiàn)相位信息的結(jié)果子抽樣并產(chǎn)生更有效的發(fā)送。這在低比特率語音編碼中特別有益，低比特率語音編碼中由于缺少充足的比特，要么因大量的相位單元相位信息的量化很差，要么相位信根本沒有發(fā)送，上述每種情況都導(dǎo)致低質(zhì)量。因為有較少的單元需量化，上述實施例允許低比特率編碼器維持的語音質(zhì)量。
在接收機/解碼器(圖9)(如本領(lǐng)域中的熟練人士所理解，亦在解碼器的編碼器的復(fù)制端)，B線性相移值運用到基準原型的DFS B頻帶劃分的矢量的解碼器的復(fù)制以生成修改原型DFS相位矢量。然后，修改DFS矢量作為接收和解碼振幅譜矢量與修改原型DFS相位矢量的乘積獲得。然后用修改DFS矢量上的反DFS操作構(gòu)建重建原型。在可選實施例中，其中，利用時域方法，每個B頻帶的振幅譜矢量與相同B頻帶的基準原型的相位矢量得到組合，而在組合上執(zhí)行反DFS操作以生成B帶通時間信號。然后，用B循環(huán)旋轉(zhuǎn)值循環(huán)地旋轉(zhuǎn)B帶通時間信號。把全部B帶通時間信號相加以生成重建原型。
這樣，一種新穎的，用來對相位譜信息子抽樣的方法和設(shè)備已得到描述。本領(lǐng)域中的熟練人士明白，結(jié)合此處揭示的實施例描述的各種說明性邏輯塊和算法步驟可用以下實施或執(zhí)行數(shù)字信號處理器(DSP)，專用集成電路(ASIC)，離散門或晶體管邏輯，諸如，例如，寄存器和FIFO之類的離散硬件組件，執(zhí)行一組固件指令的處理器或任一普通可編程較件模塊，及處理器。處理器最好是微處理器，但處理器也可以是任一普通處理器、控制器、微控制器或狀態(tài)機。軟件模塊可駐留于RAM存儲器、按塊擦除存儲器、寄存器或本領(lǐng)域中所知的任一其他形式的可寫存儲媒介。熟練人士會進一步認識到，在整個上面的描述中可參考的數(shù)據(jù)、指令、命令、信息、信號、數(shù)據(jù)位、碼元和碼片最好采用電壓、電流、電磁波、磁場或充粒子、光場或光粒子，或以上的任一組合。
這樣，已示出并描述本發(fā)明的較佳實施例。然而，對本領(lǐng)域有普通技能的人而言明顯的是，可不脫離本發(fā)明的精神和范圍地對此處揭示的實施例作出許多改變。因此，本發(fā)明除按照下列權(quán)利要求外將不受限制。
權(quán)利要求
1.一種處理語音編碼器中幀的原型的方法，其特征在于，它包括以下步驟生成基準原型的多個相位參數(shù)；生成所述原型的多個相位參數(shù)；以及在多個頻帶中使所述原型的相位參數(shù)與所述基準原型的相位參數(shù)相關(guān)聯(lián)。
2.如權(quán)利要求1所述的方法，其特征在于，所述生成步驟包括以下步驟計算所述基準原型的離散傅里葉級數(shù)系數(shù)，并把所述離散傅里葉級數(shù)系數(shù)分解成所述基準原型的幅度矢量和相位矢量，并且其中，所述生成步驟包括以下步驟計算所述原型的離散傅里葉級數(shù)系數(shù)，并把所述離散傅里葉級數(shù)系數(shù)分解成所述原型的幅度矢量和相位矢量。
3.如權(quán)利要求1所述的方法，其特征在于，它還包含標識在其中執(zhí)行所述關(guān)聯(lián)步驟的頻帶的步驟。
4.如權(quán)利要求1所述的方法，其特征在于，所述幀是語音幀。
5.如權(quán)利要求1所述的方法，其特征在于，所述幀是線性預(yù)測剩余的幀。
6.如權(quán)利要求1所述的方法，其特征在于，所述關(guān)聯(lián)步驟生成所述原型的多個最佳線性相移值。
7.如權(quán)利要求1所述的方法，其特征在于，所述關(guān)聯(lián)步驟生成所述原型的多個最佳循環(huán)旋轉(zhuǎn)值。
8.如權(quán)利要求6所述的方法，其特征在于，它還包含這樣兩個步驟，即，使所述線性相移值量化，以及使所述原型的多個幅度參數(shù)量化。
9.如權(quán)利要求7所述的方法，其特征在于，它還包含這樣兩個步驟，即，使所述循環(huán)旋轉(zhuǎn)值量化，以及使所述原型的多個幅度參數(shù)量化。
10.一種處理語音編碼器中的幀的原型的方法，其特征在于，它包括以下步驟生成基準原型的多個相位參數(shù)；生成與所述原型有關(guān)的多個線性相移值；以及在多個頻帶上從所述相位參數(shù)和所述線性相移值來合成相位矢量。
11.如權(quán)利要求10所述的方法，其特征在于，所述生成步驟包括以下步驟計算所述基準原型的離散傅里葉級數(shù)系數(shù)，并把所述離散傅里葉級數(shù)系數(shù)分解成所述基準原型的幅度矢量和相位矢量。
12.如權(quán)利要求10所述的方法，其特征在于，它還包含這樣一個步驟，即，標識在其中執(zhí)行合成步驟的頻帶。
13.如權(quán)利要求10所述的方法，其特征在于，所述幀是語音幀。
14.如權(quán)利要求10所述的方法，其特征在于，所述幀是線性預(yù)測剩余的幀。
15.如權(quán)利要求10所述的方法，其特征在于，所述生成步驟包含去量化與所述原型有關(guān)的多個量化相位參數(shù)，以生成多個線性相移值。
16.如權(quán)利要求12所述的方法，其特征在于，它還包含這樣一個步驟，即，去量化與所述原型有關(guān)的多個幅度量化參數(shù)，以生成多個去量化的幅度參數(shù)，其中，所述標識步驟包括根據(jù)多個去量化的幅度參數(shù)來標識頻帶。
17.如權(quán)利要求10所述的方法，其特征在于，它還包含這樣一些步驟，即，將所述合成的相位矢量與和所述原型有關(guān)的多個幅度參數(shù)組合起來，以生成一個組合矢量，并計算所述組合矢量的反離散傅里葉級數(shù)，以生成所述原型的重建版本。
18.一種處理語音編碼器中幀的原型的方法，其特征在于，它包括以下步驟生成與所述原型有關(guān)的多個循環(huán)旋轉(zhuǎn)值；生成多個頻帶中的多個帶通波形，所述多個帶通波形與一基準原型的多個相位參數(shù)有關(guān)；以及根據(jù)多個循環(huán)旋轉(zhuǎn)值，修改所述多個帶通波形。
19.如權(quán)利要求18所述的方法，其特征在于，它還包含這樣一個步驟，即，標識在其中執(zhí)行所述生成步驟的頻帶。
20.如權(quán)利要求18所述的方法，其特征在于，所述幀是語音幀。
21.如權(quán)利要求18所述的方法，其特征在于，所述幀是線性預(yù)測剩余的幀。
22.如權(quán)利要求18所述的方法，其特征在于，所述生成步驟包括使與所述原型有關(guān)的多個量化相位參數(shù)去量化，以生成所述多個循環(huán)旋轉(zhuǎn)值。
23.如權(quán)利要求19所述的方法，其特征在于，使與所述原型有關(guān)的多個幅度量化參數(shù)去量化，以生成多個去量化的幅度參數(shù)，其中，所述標識步驟包括根據(jù)所述多個去量化幅度參數(shù)來標識頻帶。
24.如權(quán)利要求23所述的方法，其特征在于，所述生成步驟包括以下步驟計算所述基準原型的離散傅里葉級數(shù)系數(shù)，把所述離散傅里葉級數(shù)系數(shù)分解成所述基準原型的幅度矢量和相位矢量，將所述相位矢量和多個去量化的幅度參數(shù)組合起來，并計算所述相位矢量的反離散傅里葉級數(shù)，以生成所述多個帶通波形。
25.如權(quán)利要求18所述的方法，其特征在于，它還包含這樣一個步驟，即，將所述多個修改的帶通波形求和，以生成所述原型的重建版本。
26.一種語音編碼器，其特征在于，它包括用來生成幀的基準原型的多個相位參數(shù)的裝置；用來生成當前幀的當前原型的多個相位參數(shù)的裝置；以及在多個頻帶中使所述當前原型的所述相位參數(shù)與所述基準原型的所述相位參數(shù)相關(guān)聯(lián)的裝置。
27.如權(quán)利要求26所述的語音編碼器，其特征在于，所述生成裝置包括計算所述基準原型的離散傅里葉級數(shù)系數(shù)的裝置，以及把所述離散傅里葉級數(shù)系數(shù)分解成所述基準原型的幅度矢量和相位矢量的裝置，并且其中，所述生成裝置包括計算所述當前原型的離散傅里葉級數(shù)系數(shù)的裝置以及把所述離散傅里葉級數(shù)系數(shù)分解成所述當前原型的幅度矢量和相位矢量的裝置。
28.如權(quán)利要求26所述的語音編碼器，其特征在于，它還包含用來標識所述多個頻帶的裝置。
29.如權(quán)利要求26所述的語音編碼器，其特征在于，所述當前幀是一語音幀。
30.如權(quán)利要求26所述的語音編碼器，其特征在于，所述當前幀是一個線性預(yù)測剩余的幀。
31.如權(quán)利要求26所述的語音編碼器，其特征在于，所述關(guān)聯(lián)裝置生成所述當前原型的多個最佳線性相移值。
32.如權(quán)利要求26所述的語音編碼器，其特征在于，所述關(guān)聯(lián)裝置生成所述當前原型的多個最佳循環(huán)旋轉(zhuǎn)值。
33.如權(quán)利要求31所述的語音編碼器，其特征在于，它還包含用來使所述線性相移值量化的裝置，以及用來使所述當前原型的多個幅度參數(shù)量化的裝置。
34.如權(quán)利要求32所述的語音編碼器，其特征在于，它還包含用來使所述循環(huán)旋轉(zhuǎn)值量化的裝置，以及用來使所述當前原型的多個幅度參數(shù)量化的裝置。
35.如權(quán)利要求26所述的語音編碼器，其特征在于，所述語音編碼器駐留于無線通信系統(tǒng)的用戶單元中。
36.一種語音編碼器，其特征在于，它包括用來生成幀的基準原型的多個相位參數(shù)的裝置；用來生成與當前幀的當前原型有關(guān)的多個線性相移值的裝置；以及用來在多個頻帶上合成所述相位參數(shù)和所述線性相移值的相位矢量的裝置。
37.如權(quán)利要求36所述的語音編碼器，其特征在于，所述生成裝置包括用來計算所述基準原型的離散傅里葉級數(shù)系數(shù)的裝置，以及用來把所述離散傅里葉級數(shù)系數(shù)分解成所述基準原型的幅度矢量和相位矢量的裝置。
38.如權(quán)利要求36所述的語音編碼器，其特征在于，它還包含用來標識所述多個頻帶的裝置。
39.如權(quán)利要求36所述的語音編碼器，其特征在于，所述當前幀是一個語音幀。
40.如權(quán)利要求36所述的語音編碼器，其特征在于，所述當前幀是一個線性預(yù)測剩余的幀。
41.如權(quán)利要求36所述的語音編碼器，其特征在于，所述生成裝置包括用來使與所述當前原型有關(guān)的多個量化相位參數(shù)去量化以生成多個線性相移值的裝置。
42.如權(quán)利要求38所述的語音編碼器，其特征在于，它還包含用來使與所述當前原型有關(guān)的多個幅度量化參數(shù)去量化以生成多個去量化的幅度參數(shù)的裝置，其中，所述標識手段包括用來根據(jù)多個去量化的幅度參數(shù)標識多個頻帶的裝置。
43.如權(quán)利要求36所述的語音編碼器，其特征在于，它還包含用來將所述合成的相位矢量與和所述當前原型有關(guān)的多個幅度參數(shù)組合起來以生成組合的矢量的裝置，以及用來計算所述組合的矢量的反離散傅里葉級數(shù)以生成所述當前原型的重建版本的裝置。
44.如權(quán)利要求36所述的語音編碼器，其特征在于，所述語音編碼器駐留于無線通信系統(tǒng)的用戶單元中。
45.一種語音編碼器，其特征在于，它包括用來生成與當前幀的當前原型有關(guān)的多個循環(huán)旋轉(zhuǎn)值的裝置；用來在多個頻帶中生成多個帶通波形的裝置，所述多個帶通波形與幀的基準原型的多個相位參數(shù)有關(guān)；以及用來根據(jù)多個循環(huán)旋轉(zhuǎn)值修改所述多個帶通波形的裝置。
46.如權(quán)利要求45所述的語音編碼器，其特征在于，它還包含用來標識所述多個頻帶的裝置。
47.如權(quán)利要求45所述的語音編碼器，其特征在于，所述當前幀是一個語音幀。
48.如權(quán)利要求45所述的語音編碼器，其特征在于，所述當前幀是一個線性預(yù)測剩余的幀。
49.如權(quán)利要求45所述的語音編碼器，其特征在于，所述生成裝置包括用來使與所述當前原型有關(guān)的多個量化相位參數(shù)去量化從而生成多個循環(huán)旋轉(zhuǎn)值的裝置。
50.如權(quán)利要求46所述的語音編碼器，其特征在于，它還包含用來使與所述當前原型有關(guān)的多個幅度量化參數(shù)去量化從而生成多個去量化的幅度參數(shù)的裝置，其中，所述標識裝置包括用來根據(jù)所述多個去量化的幅度參數(shù)標識頻帶的裝置。
51.如權(quán)利要求50所述的語音編碼器，其特征在于，所述生成裝置包括用來計算所述基準原型的離散傅里葉級數(shù)系數(shù)的裝置，用來把所述離散傅里葉級數(shù)系數(shù)分解成所述基準原型的幅度矢量和相位矢量的裝置，用來將所述相位矢量和所述多個去量化幅度參數(shù)組合起來的裝置，以及用來計算所述相位矢量的反離散傅里葉級數(shù)以生成所述多個帶通波形的裝置。
52.如權(quán)利要求45所述的語音編碼器，其特征在于，它還包含用來將所述多個修改的帶通波形求和以生成所述當前原型的重建版本的裝置。
53.如權(quán)利要求45所述的語音編碼器，其特征在于，所述語音編碼器駐留于無線通信系統(tǒng)的用戶單元中。
54.一種語音編碼器，其特征在于，它包括配制成從正由所述語音編碼器處理的當前幀析取當前原型的原型析取器；以及耦合到所述原型析取器并配置成生成幀的基準原型的多個相位參數(shù)、生成當前所述原型的多個相位參數(shù)以及在多個頻帶中使所述當前原型的相位參數(shù)和所述基準原型的相位參數(shù)相關(guān)聯(lián)的原型量化器。
55.如權(quán)利要求54所述的語音編碼器，其特征在于，所述原型量化器進一步配置成計算所述基準原型的離散傅里葉級數(shù)系數(shù)、把所述離散傅里葉級數(shù)系數(shù)分解成所述基準原型的幅度矢量和相位矢量、計算所述當前原型的離散傅里葉級數(shù)系數(shù)以及把所述離散傅里葉級數(shù)系數(shù)分解成所述當前原型的幅度矢量和相位矢量。
56.如權(quán)利要求54所述的語音編碼器，其特征在于，所述原型量化器進一步配置成標識所述多個頻帶。
57.如權(quán)利要求54所述的語音編碼器，其特征在于，所述當前幀是一個語音幀。
58.如權(quán)利要求54所述的語音編碼器，其特征在于，所述當前幀是一個線性預(yù)測剩余的幀。
59.如權(quán)利要求54所述的語音編碼器，其特征在于，所述原型量化器進一步配置成生成所述當前原型的多個最佳線性相移值。
60.如權(quán)利要求54所述的語音編碼器，其特征在于，所述原型量化器進一步配置成生成所述當前原型的多個最佳循環(huán)旋轉(zhuǎn)值。
61.如權(quán)利要求59所述的語音編碼器，其特征在于，所述原型量化器進一步配置成使所述線性相移值量化，并使所述當前原型的多個幅度參數(shù)量化。
62.如權(quán)利要求60所述的語音編碼器，其特征在于，所述原型量化器進一步配置成使所述循環(huán)旋轉(zhuǎn)值量化，并使所述當前原型的多個幅度參數(shù)量化。
63.如權(quán)利要求54所述的語音編碼器，其特征在于，所述語音編碼器駐留于無線通信系統(tǒng)的用戶單元中。
64.一種語音編碼器，其特征在于，它包括配制成從正由所述語音編碼器處理的當前幀中析取當前原型的原型析取器；以及耦合到所述原型析取器并配置成生成幀的基準原型的多個相位參數(shù)、生成與所述當前原型有關(guān)的多個線性相移值以及在多個頻帶上從所述相位參數(shù)和所述線性相移值合成相位矢量的原型量化器。
65.如權(quán)利要求64所述的語音編碼器，其特征在于，所述原型量化器進一步配置成計算所述基準原型的離散傅里葉級數(shù)系數(shù)，并把所述離散傅里葉級數(shù)系數(shù)分解成所述基準原型的幅度矢量和相位矢量。
66.如權(quán)利要求64所述的語音編碼器，其特征在于，所述原型量化器進一步配置成標識所述多個頻帶。
67.如權(quán)利要求64所述的語音編碼器，其特征在于，所述當前幀是一個語音幀。
68.如權(quán)利要求64所述的語音編碼器，其特征在于，所述當前幀是一個線性預(yù)測剩余的幀。
69.如權(quán)利要求64所述的語音編碼器，其特征在于，所述原型量化器進一步配置成使與所述當前原型有關(guān)的多個量化相位參數(shù)去量化以生成多個線性相移值。
70.如權(quán)利要求66所述的語音編碼器，其特征在于，所述原型量化器進一步配置成使與所述當前原型有關(guān)的多個幅度量化參數(shù)去量化以生成多個去量化幅度參數(shù)，并且根據(jù)去量化的幅度參數(shù)識別所述多個頻帶。
71.如權(quán)利要求64所述的語音編碼器，其特征在于，所述原型量化器進一步配置成將所述相位矢量與和所述當前原型有關(guān)的多個幅度參數(shù)組合起來以生成組合矢量，并計算所述組合矢量的反離散傅里葉級數(shù)以生成所述當前原型的重建版本。
72.如權(quán)利要求64所述的語音編碼器，其特征在于，所述語音編碼器駐留于無線通信系統(tǒng)的用戶單元中。
73.一種語音編碼器，它包括配置成從正由所述語音編碼器處理的當前幀析取當前原型的原型析取器；以及耦合到所述原型析取器并配置成生成與所述當前原型有關(guān)的多個循環(huán)旋轉(zhuǎn)值、在多個頻帶中生成多個帶通波形，所述多個帶通波形與幀的基準原型的多個相位參數(shù)有關(guān)，并根據(jù)所述多個循環(huán)旋轉(zhuǎn)值修改多個帶通波形的原型量化器。
74.如權(quán)利要求73所述的語音編碼器，其特征在于，所述原型量化器進一步配置成標識所述多個頻帶。
75.如權(quán)利要求73所述的語音編碼器，其特征在于，所述當前幀是一個語音幀。
76.如權(quán)利要求73所述的語音編碼器，其特征在于，所述當前幀是一個線性預(yù)測剩余的幀。
77.如權(quán)利要求73所述的語音編碼器，其特征在于，所述原型量化器進一步配置成使與所述當前原型有關(guān)的多個量化相位參數(shù)去量化，以生成多個循環(huán)旋轉(zhuǎn)值
78.如權(quán)利要求74所述的語音編碼器，其特征在于，所述原型量化器進一步配置成使與所述當前原型有關(guān)的多個幅度量化參數(shù)去量化，以生成多個去量化的幅度參數(shù)，并根據(jù)所述多個去量化的幅度參數(shù)來標識頻帶。
79.如權(quán)利要求78所述的語音編碼器，其特征在于，所述原型量化器進一步配置成計算所述基準原型的離散傅里葉級數(shù)系數(shù)、把所述離散傅里葉級數(shù)系數(shù)分解成所述基準原型的幅度矢量和相位矢量、將所述相位矢量和多個去量化的幅度參數(shù)組合起來，并計算所述相位矢量的反離散傅里葉級數(shù)，以生成多個帶通波形。
80.如權(quán)利要求73所述的語音編碼器，其特征在于，所述原型量化器進一步配置成將多個修改的帶通波形求和，以生成所述當前原型的重建版本。
81.如權(quán)利要求73所述的語音編碼器，其特征在于，所述語音編碼器駐留于無線通信系統(tǒng)的用戶單元中。
全文摘要
一種用來對相位譜信息進行子抽樣的方法和設(shè)備,包括用來通過使用一幀的原型的相位譜信息的智能子抽樣對該原型進行分析和重建的語音編碼器。為分析原型,語音編碼器生成一基準原型的相位參數(shù),生成一當前原型的相位參數(shù),并使當前原型的相位參數(shù)與基準原型的相位參數(shù)在多個頻帶中相關(guān)。為用線性相移值重建原型,語音編碼器生成基準原型的相位參數(shù),生成與原型相關(guān)的線性相移值集,并在多個頻帶上從相位參數(shù)和線性相移值相位失量。為用循環(huán)旋轉(zhuǎn)值重建原型,語音編碼器生成與原型有關(guān)的循環(huán)旋轉(zhuǎn)值集,生成多個頻帶中的帶通波型集,帶通波形與基準原型的相位參數(shù)有關(guān),并根據(jù)循環(huán)旋轉(zhuǎn)值修改帶通波形。
文檔編號G10L11/00GK1375095SQ00813001
公開日2002年10月16日申請日期2000年7月18日優(yōu)先權(quán)日1999年7月19日
發(fā)明者S·曼祖那什申請人:高通股份有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：S.曼祖那什
技術(shù)所有人：高通股份有限公司
我是此專利的發(fā)明人

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

相位譜相關(guān)技術(shù)

幅度譜和相位譜相關(guān)技術(shù)

matlab幅度譜和相位譜相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用來對相位譜信息進行子抽樣的方法和設(shè)備的制作方法