欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種用聲碼器收發(fā)數(shù)字信號(hào)的方法

文檔序號(hào):2823558閱讀:398來源:國(guó)知局
專利名稱:一種用聲碼器收發(fā)數(shù)字信號(hào)的方法
技術(shù)領(lǐng)域
本發(fā)明涉及通訊技術(shù)領(lǐng)域,特別是涉及一種用聲碼器收發(fā)任意數(shù)字信號(hào)并通過語(yǔ)音信道傳送的方法。
背景技術(shù)
人類的語(yǔ)音信號(hào)在現(xiàn)代電信網(wǎng)絡(luò)中經(jīng)數(shù)字化編碼后加以傳送。由于傳輸信道的帶寬限制以及語(yǔ)音通信的質(zhì)量指標(biāo)等因素,多種不同的編碼技術(shù)共存于現(xiàn)代電信網(wǎng)絡(luò)中。在固定公共電話網(wǎng)絡(luò)中,語(yǔ)音信號(hào)常以波形編碼的方式,采用脈沖編碼調(diào)制(PCM)或自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)的編碼技術(shù),經(jīng)數(shù)字化編碼后以64kbps(PCM)或32kbps(ADPCM)的碼率傳輸。然而,為實(shí)現(xiàn)更高的語(yǔ)音壓縮率,例如將語(yǔ)音信號(hào)壓縮至16kbps碼率以下,波形編碼技術(shù)已無(wú)能為力。在無(wú)線移動(dòng)電話網(wǎng)絡(luò)中,受限于可用信道帶寬,語(yǔ)音信號(hào)則以聲碼器編碼的方式,充分利用人類聲道的模型參數(shù)及發(fā)音機(jī)理,在保證一定聽覺語(yǔ)音質(zhì)量的前提下,被壓縮到16kbps碼率以下傳輸。如GSM網(wǎng)絡(luò)中全碼率模式下,語(yǔ)音信號(hào)經(jīng)RPE-LTP聲碼器編碼后,以13kbps碼率傳輸;GSM增強(qiáng)型全碼率的語(yǔ)音聲碼器與CDMA網(wǎng)絡(luò)中使用的EVRC聲碼器皆采取基于ACELP的技術(shù),在幾乎不降低通話質(zhì)量的前提下,可將語(yǔ)音信號(hào)壓縮至8-13kbps的碼率進(jìn)行傳輸;而美國(guó)國(guó)防部(DoD)使用的CELP聲碼器可將語(yǔ)音信號(hào)壓縮至4.8kbps,仍保證不錯(cuò)的通話質(zhì)量。
高度依賴于信源特性的聲碼器技術(shù)雖然實(shí)現(xiàn)了對(duì)語(yǔ)音信號(hào)的高壓縮率編碼,但是聲碼器工作原理決定了對(duì)于非語(yǔ)音信號(hào)的壓縮編碼則無(wú)能為力。眾所周知,通過語(yǔ)音信道傳送任意數(shù)字信號(hào)的調(diào)制解調(diào)技術(shù)在使用波形編碼方式(PCM或ADPCM)的固定電話網(wǎng)絡(luò)已被廣泛使用。一般地,通過更改(調(diào)制)正弦連續(xù)波的某些特性,如頻率、幅度以及相位等,可代表變化的數(shù)字信息碼流。當(dāng)前普遍使用的公共固定電話網(wǎng)(POTS)的數(shù)據(jù)調(diào)制解調(diào)器可達(dá)到56Kbps的碼率。然而,這些數(shù)據(jù)調(diào)制解調(diào)技術(shù)生成的信號(hào)不再具有人類語(yǔ)音的特性,經(jīng)聲碼器編解碼作用后波形特性如幅度、頻率和相位等無(wú)法被保存,數(shù)字信號(hào)因而無(wú)法通過基于聲碼器技術(shù)的無(wú)線移動(dòng)通信網(wǎng)絡(luò)(如GSM、CDMA)的語(yǔ)音信道傳送。
盡管無(wú)線移動(dòng)通信網(wǎng)絡(luò)(如GSM、CDMA)提供了數(shù)據(jù)信道(如CSD/HSCSD,GPRS/EDGE,UMTS等)以解決對(duì)數(shù)字信號(hào)的基本傳輸問題,但一方面由于數(shù)據(jù)信道的高傳輸延遲(0.5秒~2秒)以及傳輸抖動(dòng)等無(wú)法滿足交互式實(shí)時(shí)信號(hào)對(duì)服務(wù)質(zhì)量的要求;另一方面,電信運(yùn)營(yíng)商提供數(shù)據(jù)信道服務(wù)的范圍遠(yuǎn)不如語(yǔ)音服務(wù),且方式各異,因此跨運(yùn)營(yíng)商、跨網(wǎng)絡(luò)或跨國(guó)的使用數(shù)據(jù)信道服務(wù)存在諸多互通互聯(lián)的困難。

發(fā)明內(nèi)容
本發(fā)明的目的是提供一種用聲碼器收發(fā)數(shù)字信號(hào)的方法。
為實(shí)現(xiàn)上述目的,本發(fā)明采取以下技術(shù)方案一種用聲碼器收發(fā)數(shù)字信號(hào)的方法,其特征在于將欲傳輸?shù)脑磾?shù)字信號(hào)以參數(shù)映射的方式轉(zhuǎn)換為語(yǔ)音合成模型的關(guān)鍵語(yǔ)音特性參數(shù),在發(fā)送端通過語(yǔ)音合成處理生成語(yǔ)音信號(hào);合成的語(yǔ)音信號(hào)通過GSM或CDMA的聲碼器發(fā)送;在接收端通過語(yǔ)音分析處理提取關(guān)鍵語(yǔ)音特性參數(shù),恢復(fù)為原始的數(shù)字信號(hào)。
上述的用聲碼器收發(fā)數(shù)字信號(hào)的方法,它具體包括有以下步驟(1)對(duì)欲傳送的源數(shù)字信號(hào)分幀處理,每一幀數(shù)字信號(hào)用于合成短時(shí)語(yǔ)音信號(hào),將每一幀繼續(xù)細(xì)分為長(zhǎng)度不等的子幀,所述子幀的數(shù)量至少為三個(gè);(2)將所述子幀對(duì)應(yīng)生成線譜頻率系數(shù)(LSP)索引、廣義激勵(lì)向量參數(shù)索引以及廣義激勵(lì)參數(shù)增益索引;(3)將第(2)步中生成的索引值分別在線譜頻率系數(shù)參數(shù)表、廣義激勵(lì)向量參數(shù)表以及廣義激勵(lì)增益參數(shù)表中進(jìn)行查表依次生成線譜頻率系數(shù)參數(shù)、廣義激勵(lì)向量參數(shù)以及廣義激勵(lì)增益參數(shù);(4)將第(3)步中生成的參數(shù)按CELP聲碼器的原理合成為語(yǔ)音信號(hào);(5)將合成的語(yǔ)音信號(hào)通過CDMA或GSM聲碼器發(fā)送;(6)接收端接收到合成的語(yǔ)音信號(hào)后,對(duì)其進(jìn)行語(yǔ)音分析,提取出線譜頻率系數(shù)參數(shù)、廣義激勵(lì)向量參數(shù)以及廣義激勵(lì)增益參數(shù);(7)將第(6)步中分析出的參數(shù)在各自對(duì)應(yīng)的參數(shù)表線譜頻率系數(shù)參數(shù)表、激勵(lì)向量參數(shù)表以及激勵(lì)增益參數(shù)表中進(jìn)行查表逆向生成線譜頻率系數(shù)索引、廣義激勵(lì)參數(shù)索引以及廣義激勵(lì)參數(shù)增益索引;(8)將第(7)步中生成的索引值分別逆向還原為子幀,并將子幀重新組合為一幀,還原為最初的數(shù)字信號(hào)。所述第(1)步中,將數(shù)字信號(hào)碼流分幀處理,每一幀數(shù)字信號(hào)碼流用于產(chǎn)生10-30毫秒的短時(shí)語(yǔ)音信號(hào)。所述第(4)步中,將廣義激勵(lì)向量參數(shù)和廣義激勵(lì)增益參數(shù)首先通過激勵(lì)信號(hào)發(fā)生器合成為激勵(lì)信號(hào),并將線譜頻率系數(shù)參數(shù)經(jīng)逆矢量量化后生成一線性預(yù)測(cè)系數(shù),最后將該線性預(yù)測(cè)系數(shù)以及激勵(lì)信號(hào)發(fā)生器合成出的激勵(lì)信號(hào)一起輸入到線性預(yù)測(cè)語(yǔ)音合成濾波器合成為語(yǔ)音信號(hào)。
上述的用聲碼器收發(fā)數(shù)字信號(hào)的方法,具體包括有以下步驟(1)對(duì)欲傳送的源數(shù)字信號(hào)分幀處理,每一幀數(shù)字信號(hào)用于合成短時(shí)語(yǔ)音信號(hào),將幀長(zhǎng)為N位的一幀繼續(xù)細(xì)分為長(zhǎng)度不等的四個(gè)子幀,分別為X比特、Y比特、Z比特和G比特的碼流,形成四個(gè)子幀;(2)X比特碼流映射生成線譜頻率系數(shù)參數(shù)索引值,Y比特碼流映射生成基音參數(shù)索引值,Z比特碼流映射生成激勵(lì)向量參數(shù)索引值;G比特碼流映射生成激勵(lì)增益參數(shù)索引值;(3)將第(2)步中生成的索引值分別在線譜頻率系數(shù)參數(shù)表、基音參數(shù)表、激勵(lì)向量參數(shù)表以及激勵(lì)增益參數(shù)表中查表得到真正的向量參數(shù)線譜頻率系數(shù)參數(shù)、基音參數(shù)、激勵(lì)向量參數(shù)以及激勵(lì)增益參數(shù);(4)將第(3)步中生成的參數(shù)按CELP聲碼器的原理合成為語(yǔ)音信號(hào);(5)將合成的語(yǔ)音信號(hào)通過CDMA或GSM聲碼器發(fā)送;(6)接收端接收到合成的語(yǔ)音信號(hào)后,對(duì)其進(jìn)行語(yǔ)音分析,提取出線譜頻率系數(shù)參數(shù)、基音參數(shù)、激勵(lì)向量參數(shù)以及激勵(lì)增益參數(shù);(7)將第(6)步中提取出的參數(shù)分別在對(duì)應(yīng)的線譜頻率系數(shù)參數(shù)表、基音參數(shù)表、激勵(lì)向量參數(shù)表以及激勵(lì)增益參數(shù)表中進(jìn)行查表逆向生成線譜頻率系數(shù)參數(shù)索引、基音參數(shù)索引、激勵(lì)向量參數(shù)索引以及激勵(lì)增益參數(shù)索引;(8)將第(7)步中生成的索引值分別逆向還原為子幀,并將子幀重新組合為一幀,還原為最初的數(shù)字信號(hào)。所述第(1)步中,將數(shù)字信號(hào)碼流分幀處理,每一幀數(shù)字信號(hào)碼流用于產(chǎn)生10-30毫秒的短時(shí)語(yǔ)音信號(hào)。所述第(4)步中,將對(duì)應(yīng)X比特碼流的線譜頻率系數(shù)參數(shù)量化向量參數(shù)經(jīng)分割矢量量化的逆操作及轉(zhuǎn)換得到線性預(yù)測(cè)系數(shù)參數(shù),用于線性預(yù)測(cè)語(yǔ)音合成濾波器;將對(duì)應(yīng)Y比特碼流的基音參數(shù)向量,經(jīng)基音合成處理生成基音激勵(lì)信號(hào);將對(duì)應(yīng)Z比特碼的激勵(lì)向量參數(shù),以及對(duì)應(yīng)G比特碼流的激勵(lì)增益參數(shù),輸入到激勵(lì)信號(hào)合成模塊,生成激勵(lì)信號(hào);此激勵(lì)信號(hào)以及基音激勵(lì)信號(hào)作用于描述聲道特性的線性預(yù)測(cè)語(yǔ)音合成濾波器,產(chǎn)生人工合成的語(yǔ)音信號(hào)。
本發(fā)明由于采取以上設(shè)計(jì),其具有以下優(yōu)點(diǎn)1、本發(fā)明提出的方法以一種與電信網(wǎng)絡(luò)交換及傳輸設(shè)備無(wú)關(guān)的方式,透明地通過模擬或數(shù)字語(yǔ)音信道高質(zhì)量地傳送一定碼率的任意數(shù)字信號(hào),傳輸延遲及抖動(dòng)遠(yuǎn)低于通過數(shù)據(jù)信道的方式,保證交互式實(shí)時(shí)信息收發(fā)的服務(wù)質(zhì)量。
2、本發(fā)明由于只需使用運(yùn)營(yíng)商的語(yǔ)音服務(wù),互通互聯(lián)得到保障,使用范圍大大拓寬,用戶可在世界上任何有語(yǔ)音服務(wù)的地方保證服務(wù)質(zhì)量地傳送一定碼率的任意數(shù)字信號(hào)。
3、本發(fā)明可以應(yīng)用于無(wú)線移動(dòng)終端(GSM、CDMA手機(jī),衛(wèi)星電話等),固定電話以及計(jì)算機(jī)設(shè)備中,可實(shí)現(xiàn)多種特殊及增值服務(wù)功能(1)提高“一鍵通(PTTPush-to-Talk)”無(wú)線組群通話增值服務(wù)的語(yǔ)音傳輸質(zhì)量,并使該服務(wù)不再依賴于無(wú)線數(shù)據(jù)信道,實(shí)現(xiàn)PTT服務(wù)的獨(dú)立運(yùn)營(yíng);(2)為通過無(wú)線移動(dòng)網(wǎng)絡(luò)語(yǔ)音信道實(shí)現(xiàn)保密語(yǔ)音及數(shù)據(jù)通信提供關(guān)鍵技術(shù)支持由于語(yǔ)音信號(hào)經(jīng)高度數(shù)字化加密處理后呈現(xiàn)高度的隨機(jī)性,已不具有任何語(yǔ)音特性,此技術(shù)與裝置將使用戶在有固話網(wǎng)絡(luò)(POTS)及GSM/CDMA移動(dòng)網(wǎng)絡(luò)覆蓋的世界任何地方,進(jìn)行與現(xiàn)有網(wǎng)絡(luò)交換及傳輸設(shè)備無(wú)關(guān)的保密語(yǔ)音及數(shù)據(jù)通訊。
4、本發(fā)明的第(2)、第(3)步中,將每一子幀的數(shù)字信號(hào)碼流映射為相應(yīng)的參數(shù)索引值而非參數(shù)本身,提供了預(yù)先選取用于合成語(yǔ)音的關(guān)鍵參數(shù)的靈活性在參數(shù)的全部取值空間中選取部分相互差別大,易于提取的參數(shù)值納入相應(yīng)的參數(shù)代碼表,對(duì)應(yīng)于由子幀的數(shù)字信號(hào)碼流映射而來的索引值;這樣,以降低傳輸碼率為代價(jià)保證了相近的輸入數(shù)字信號(hào)產(chǎn)生區(qū)別足夠大的模擬連續(xù)波語(yǔ)音信號(hào),以利于接收端的語(yǔ)音分析處理得到正確的結(jié)果,有效降低誤碼率。


圖1為本發(fā)明的結(jié)構(gòu)方框示意圖。
圖2為本發(fā)明一種實(shí)施方式的結(jié)構(gòu)方框示意圖。
具體實(shí)施例方式
聲碼器是一種以人類聲道參數(shù)模型與發(fā)音機(jī)理為基礎(chǔ)的高壓縮率語(yǔ)音編碼技術(shù),廣泛應(yīng)用于無(wú)線移動(dòng)通信(GSM及CDMA)、衛(wèi)星通信等網(wǎng)絡(luò)系統(tǒng)中,在保證一定聽覺質(zhì)量的前提下,以低碼率實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的編碼收發(fā)。然而,工作原理決定了聲碼器對(duì)不具有語(yǔ)音特性的信號(hào)無(wú)法實(shí)現(xiàn)有效編碼及收發(fā)。本發(fā)明提出一種將數(shù)字信號(hào)通過語(yǔ)音聲碼器進(jìn)行收發(fā)的技術(shù),無(wú)需使用數(shù)據(jù)信道即可實(shí)現(xiàn)對(duì)任意數(shù)字信號(hào)低時(shí)延、少抖動(dòng)的高質(zhì)量傳輸。此技術(shù)可應(yīng)用于無(wú)線移動(dòng)及固定通信終端設(shè)備中,以一種與網(wǎng)絡(luò)交換與傳輸設(shè)備無(wú)關(guān)的方式,通過模擬或數(shù)字語(yǔ)音信道傳送任意數(shù)字信號(hào)。
如圖1所示,為本發(fā)明所提供的一種用聲碼器收發(fā)數(shù)字信號(hào)的方法,參考CELP聲碼器原理,將欲傳輸?shù)脑磾?shù)字信號(hào)以參數(shù)映射的方式轉(zhuǎn)換為語(yǔ)音合成模型的關(guān)鍵語(yǔ)音特性參數(shù),在發(fā)送端通過語(yǔ)音合成處理生成語(yǔ)音信號(hào);合成的語(yǔ)音信號(hào)可通過GSM、CDMA以及其它語(yǔ)音信道傳輸;在接收端通過語(yǔ)音分析處理提取關(guān)鍵語(yǔ)音特性參數(shù),恢復(fù)原始數(shù)字信號(hào),實(shí)現(xiàn)對(duì)任意數(shù)字信號(hào)的發(fā)送與接收。
具體來講,該方法包括有以下步驟(1)對(duì)欲傳送的源數(shù)字信號(hào)分幀處理,每幀用于生成長(zhǎng)度為10-30毫秒的短時(shí)語(yǔ)音信號(hào),根據(jù)語(yǔ)音合成模型的參數(shù)及合成機(jī)理,繼續(xù)將一幀細(xì)分為長(zhǎng)度不等的子幀;由于每一子幀將以參數(shù)映射的方式產(chǎn)生語(yǔ)音合成模型的關(guān)鍵參數(shù)值,所以子幀的數(shù)量及長(zhǎng)度(以比特位為單位)取決于用于合成語(yǔ)音信號(hào)而使用的模型參數(shù)種類及每一參數(shù)表中包含的表項(xiàng)數(shù)目,比如,線譜頻率系數(shù)(LSP)、廣義激勵(lì)參數(shù)、以及廣義激勵(lì)參數(shù)增益,這三類參數(shù)為各種基于CELP技術(shù)的語(yǔ)音合成模型所常用,故所述子幀的數(shù)量一般至少為三個(gè),以對(duì)應(yīng)上述三種關(guān)鍵參數(shù);(2)所述子幀以查表的方式實(shí)現(xiàn)參數(shù)映射即預(yù)先將一定數(shù)量的關(guān)鍵參數(shù)存入?yún)?shù)表,將所述子幀分別對(duì)應(yīng)成為各參數(shù)表的索引值,如線譜頻率系數(shù)(LSP)參數(shù)表索引值、廣義激勵(lì)向量表索引值以及廣義激勵(lì)參數(shù)增益表索引值;(3)將第(2)步中生成的索引值分別在線譜頻率系數(shù)(LSP)參數(shù)表、廣義激勵(lì)向量表以及廣義激勵(lì)參數(shù)增益表中進(jìn)行查表依次生成線譜頻率系數(shù)(LSP)參數(shù)、廣義激勵(lì)向量參數(shù)以及廣義激勵(lì)增益參數(shù);(4)將第(3)步中生成的參數(shù)按照CELP技術(shù)的機(jī)理合成為語(yǔ)音信號(hào);(5)將合成的語(yǔ)音信號(hào)通過聲碼器(如GSM或CDMA語(yǔ)音聲碼器)或其它語(yǔ)音信道發(fā)送;(6)接收端接收到合成的語(yǔ)音信號(hào)后,對(duì)其進(jìn)行語(yǔ)音分析,提取出線譜頻率系數(shù)(LSP)參數(shù)、廣義激勵(lì)向量參數(shù)以及廣義激勵(lì)增益參數(shù);(7)將第(6)步中分析出的參數(shù)在各自對(duì)應(yīng)的參數(shù)表線譜頻率系數(shù)(LSP)參數(shù)表、廣義激勵(lì)向量參數(shù)表以及廣義激勵(lì)增益參數(shù)表中進(jìn)行查表逆向生成線譜頻率系數(shù)(LSP)索引、廣義激勵(lì)參數(shù)索引以及廣義激勵(lì)參數(shù)增益索引;(8)將第(7)步中生成的索引值分別逆向還原為子幀,并將子幀重新組合為一幀,還原為最初的數(shù)字信號(hào)。
上述的第(4)步中,將廣義激勵(lì)向量參數(shù)和廣義激勵(lì)增益參數(shù)首先通過激勵(lì)信號(hào)發(fā)生器合成為激勵(lì)信號(hào),并將線譜頻率系數(shù)(LSP)參數(shù)經(jīng)逆矢量量化后生成線性預(yù)測(cè)系數(shù),最后將該線性預(yù)測(cè)系數(shù)以及激勵(lì)信號(hào)發(fā)生器合成的激勵(lì)信號(hào)一起輸入到線性預(yù)測(cè)(LPC)語(yǔ)音合成濾波器合成為語(yǔ)音信號(hào)。區(qū)別于通常的語(yǔ)音合成處理,此處所述的語(yǔ)音合成操作只注重于突出表述該信號(hào)所攜帶的特性參數(shù),而信號(hào)本身不必?fù)碛腥魏握Z(yǔ)言意義。
此外,上述的第(1)步中,之所以將每一幀數(shù)字信號(hào)碼流用于產(chǎn)生10-30毫秒的短時(shí)語(yǔ)音信號(hào),主要是考慮完整包括語(yǔ)音的基音頻率信息(要求大于10毫秒)并保證語(yǔ)音信號(hào)的統(tǒng)計(jì)穩(wěn)定性(要求小于30毫秒),以確保在接收端線性預(yù)測(cè)濾波器可有效描述信號(hào)的短時(shí)自相關(guān)性,即有效描述語(yǔ)音發(fā)音的聲道模型;以及,基音分析濾波器正確提取基音參數(shù);上述的廣義激勵(lì)參數(shù)通常以兩種形態(tài)存在一為具有基音周期特性的脈沖串信號(hào),用于合成濁音語(yǔ)音信號(hào);另一種為隨機(jī)信號(hào)(如高斯隨機(jī)信號(hào)等),用于合成清音語(yǔ)音信號(hào);廣義激勵(lì)參數(shù)增益相應(yīng)地包括用于調(diào)節(jié)脈沖串信號(hào)激勵(lì)以及隨機(jī)信號(hào)激勵(lì)的增益參數(shù)。為了提高傳輸碼率,可使用增加子幀的數(shù)量方法以達(dá)到增加幀長(zhǎng)(以比特位為單位)的目的,如將基音頻率特性參數(shù)(包含表達(dá)基音頻率信息的基音延遲參數(shù)以及基音增益參數(shù))作為獨(dú)立的語(yǔ)音特性參數(shù)加以映射,用于合成語(yǔ)音時(shí),可使用更多的子幀數(shù)量,相應(yīng)地,激勵(lì)參數(shù)可僅包含隨機(jī)信號(hào)(如高斯隨機(jī)信號(hào)等)激勵(lì)。因此,本發(fā)明在具體實(shí)施的時(shí)候,還可以考慮引入基音頻率參數(shù)(延遲與增益)作為獨(dú)立的激勵(lì)信號(hào)用于合成語(yǔ)音,這樣,可以將一幀細(xì)分為長(zhǎng)度不等的四個(gè)子幀,如圖2所示,在發(fā)送端,幀長(zhǎng)為N位的一幀數(shù)字碼流被分為長(zhǎng)度分別為X比特、Y比特、Z比特和G比特的碼流,形成四個(gè)子幀;X比特碼流通過線譜頻率系數(shù)參數(shù)(LSP)映射生成線譜頻率系數(shù)參數(shù)(LSP)索引值;Y比特碼流通過基音參數(shù)(基音延遲和基音增益)映射生成基音參數(shù)索引值(基音延遲索引和基音增益索引)、Z比特碼流通過激勵(lì)向量參數(shù)映射生成激勵(lì)向量參數(shù)索引值;G比特碼流通過激勵(lì)增益參數(shù)映射生成激勵(lì)增益參數(shù)索引值;依據(jù)各索引值在相應(yīng)的線譜頻率系數(shù)參數(shù)表、基音參數(shù)表、激勵(lì)向量參數(shù)表以及激勵(lì)增益參數(shù)表中查表得到真正的向量參數(shù),即線譜頻率系數(shù)參數(shù)(LSP)、基音參數(shù)(基音延遲和基音增益)、激勵(lì)向量參數(shù)以及激勵(lì)增益參數(shù);進(jìn)一步,將對(duì)應(yīng)X比特碼流的LSP量化向量參數(shù)經(jīng)分割矢量量化(Split VQ)的逆操作及轉(zhuǎn)換得到線性預(yù)測(cè)(LPC)系數(shù)參數(shù),用于線性預(yù)測(cè)(LPC)語(yǔ)音合成濾波器;將對(duì)應(yīng)Y比特碼流的基音參數(shù)向量(基音延遲/增益),經(jīng)基音合成處理生成基音激勵(lì)信號(hào);將對(duì)應(yīng)Z比特碼的激勵(lì)向量參數(shù),以及對(duì)應(yīng)G比特碼流的激勵(lì)增益參數(shù),輸入到激勵(lì)信號(hào)發(fā)生器,生成激勵(lì)信號(hào);此激勵(lì)信號(hào)以及基音激勵(lì)信號(hào)作用于描述聲道特性的線性預(yù)測(cè)(LPC)語(yǔ)音合成濾波器,產(chǎn)生人工合成的語(yǔ)音信號(hào)進(jìn)行傳輸。
此語(yǔ)音信號(hào)時(shí)域長(zhǎng)度一般取為10毫秒至30毫秒之間。如小于10毫秒時(shí),無(wú)法完整恢復(fù)基音頻率信息;而大于30毫秒時(shí),語(yǔ)音信號(hào)的統(tǒng)計(jì)穩(wěn)定性將不再存在,因而線性預(yù)測(cè)模型不再有效。通常,每一幀數(shù)字信號(hào)可用于合成20毫秒(對(duì)應(yīng)于ACELP,QCELP等)或30毫秒(對(duì)應(yīng)于FS1016 DoD CELP)的語(yǔ)音信號(hào)。當(dāng)以T表示合成語(yǔ)音信號(hào)的長(zhǎng)度時(shí),理論上可傳送的數(shù)字信號(hào)碼率R可表示為R=(N/T*1000)bps。
在信號(hào)的接收端進(jìn)行的語(yǔ)音分析處理為上述語(yǔ)音合成的逆向操作,即在最小均方差意義下分析接收信號(hào),提取線性預(yù)測(cè)濾波器的系數(shù),激勵(lì)向量參數(shù),激勵(lì)增益參數(shù)以及基音參數(shù)。具體地,輸入語(yǔ)音信號(hào)被首先輸入到線性預(yù)測(cè)(LPC)分析模塊,以20毫秒或30毫秒(對(duì)應(yīng)于發(fā)送端的設(shè)置)為取樣窗口,做自相關(guān)運(yùn)算,利用Levinson-Durbin算法得到LPC濾波器的系數(shù);LPC濾波器的系數(shù)經(jīng)切比雪夫多項(xiàng)式(Chebyshev Polynomial)運(yùn)算轉(zhuǎn)換為頻域的LSP系數(shù),經(jīng)分割矢量量化(Split VQ)算法得到量化的線譜頻率系數(shù)(LSP)參數(shù);對(duì)輸入語(yǔ)音信號(hào)的基音分析由基音分析模塊完成基音分析的方法既可使用運(yùn)算量較大的閉環(huán)搜索模型(closed-loop),也可使用簡(jiǎn)化的開環(huán)搜索模型(open-loop)。當(dāng)使用開環(huán)搜索模型(open-loop)時(shí),輸入語(yǔ)音信號(hào)經(jīng)線性預(yù)測(cè)(LPC)語(yǔ)音合成濾波器處理后的殘差信號(hào)潰入基音分析模塊的基音預(yù)測(cè)濾波器,生成基音殘差信號(hào);在此基音殘差信號(hào)最小均方差意義下,計(jì)算得到基音預(yù)測(cè)濾波器的兩個(gè)重要參數(shù)的最優(yōu)預(yù)測(cè)值,即基音延遲與基音增益;激勵(lì)信號(hào)的確定則通過對(duì)激勵(lì)參數(shù)表(codebook)的搜索匹配得到激勵(lì)信號(hào)(由激勵(lì)向量與激勵(lì)增益合成)通過線性預(yù)測(cè)濾波器與基音合成濾波器合成的語(yǔ)音信號(hào)與輸入語(yǔ)音信號(hào)形成殘差信號(hào),在此殘差信號(hào)最小均方差意義下,匹配得到最優(yōu)激勵(lì)信號(hào),此激勵(lì)信號(hào)可由激勵(lì)向量與激勵(lì)增益參數(shù)表示;而激勵(lì)向量與激勵(lì)增益參數(shù)在各自參數(shù)表中對(duì)應(yīng)的索引值即為部分源數(shù)字信號(hào);同樣之前經(jīng)線性預(yù)測(cè)語(yǔ)音分析以及基音分析得到的參數(shù)則對(duì)應(yīng)各自的參數(shù)編碼表分別得到LSP參數(shù)索引值和基音參數(shù)索引值。所述各索引值引按一定順序經(jīng)子幀匯聚處理后,得到每幀N位的輸出數(shù)字碼流。
具體實(shí)施例(1)對(duì)欲傳輸?shù)脑磾?shù)字信號(hào)分幀,每幀長(zhǎng)度為66比特位,用于合成長(zhǎng)度為30毫秒的語(yǔ)音信號(hào);每幀繼續(xù)細(xì)分為四個(gè)子幀子幀1長(zhǎng)度為16比特位,子幀2長(zhǎng)度為24比特位,子幀3長(zhǎng)度為16比特位,子幀4長(zhǎng)度為10比特位;各子幀將分別以參數(shù)映射的方式產(chǎn)生語(yǔ)音合成模型的關(guān)鍵參數(shù)值。(2)長(zhǎng)度為16比特位的子幀1作為索引值檢索一含有65536個(gè)表項(xiàng)的線譜頻率系數(shù)(LSP)參數(shù)表,每表項(xiàng)為一個(gè)34比特的線譜頻率系數(shù)(LSP)量化矢量;長(zhǎng)度為24比特位的子幀2,其高14位作為索引值檢索一含有16384個(gè)表項(xiàng)的基音延遲參數(shù)表,每表項(xiàng)為一個(gè)28比特的基因延遲參數(shù),而其低10位則作為索引值檢索一含有1024個(gè)表項(xiàng)的基音增益參數(shù)表,每表項(xiàng)為一個(gè)20比特的基因增益參數(shù);長(zhǎng)度為16比特位的子幀3為索引值檢索一含有65536個(gè)表項(xiàng)的激勵(lì)向量參數(shù)表,每表項(xiàng)為一個(gè)36比特的激勵(lì)向量參數(shù);長(zhǎng)度為10比特位的子幀4作為索引值檢索一含有1024個(gè)表項(xiàng)的激勵(lì)增益參數(shù)表,每表項(xiàng)為一個(gè)20比特的激勵(lì)增益參數(shù);(3)將第(2)步中生成的索引值分別在線譜頻率系數(shù)(LSP)參數(shù)表、基音參數(shù)表,激勵(lì)向量表以及激勵(lì)參數(shù)增益表中進(jìn)行查表生成線譜頻率系數(shù)(LSP)參數(shù)、基音參數(shù)(延遲與增益)、激勵(lì)向量參數(shù)以及激勵(lì)增益參數(shù);(4)將第(3)步中生成的參數(shù)按照CELP技術(shù)的機(jī)理合成為語(yǔ)音信號(hào)激勵(lì)向量經(jīng)激勵(lì)增益參數(shù)調(diào)節(jié)后形成的激勵(lì)信號(hào)與基音參數(shù)向量(基音延遲/增益)經(jīng)基音合成處理生成的基音激勵(lì)信號(hào)潰入線性預(yù)測(cè)(LPC)語(yǔ)音合成濾波單元,所述線性預(yù)測(cè)(LPC)濾波器的系數(shù)參數(shù)由線譜頻率系數(shù)(LSP)量化矢量經(jīng)逆矢量量化轉(zhuǎn)化得到;(5)將合成的語(yǔ)音信號(hào)通過聲碼器(如GSM或CDMA語(yǔ)音聲碼器)發(fā)送;(6)接收端接收到合成的語(yǔ)音信號(hào)后,對(duì)其進(jìn)行語(yǔ)音分析,提取出線譜頻率系數(shù)(LSP)參數(shù)、基音參數(shù)、激勵(lì)向量參數(shù)以及激勵(lì)增益參數(shù)首先,輸入語(yǔ)音信號(hào)被輸入到線性預(yù)測(cè)(LPC)分析模塊,以30毫秒(對(duì)應(yīng)于發(fā)送端的設(shè)置)為取樣窗口,做自相關(guān)運(yùn)算,利用Levinson-Durbin算法得到LPC濾波器的系數(shù);此LPC濾波器的系數(shù)經(jīng)切比雪夫多項(xiàng)式(Chebyshev Polynomial)運(yùn)算轉(zhuǎn)換為頻域的LSP系數(shù),經(jīng)分割矢量量化(Split VQ)算法得到量化的線譜頻率系數(shù)(LSP)參數(shù),長(zhǎng)度為34比特;對(duì)輸入語(yǔ)音信號(hào)的基音分析由基音分析模塊完成,基音分析的方法使用開環(huán)搜索模型(open-loop)輸入語(yǔ)音信號(hào)經(jīng)線性預(yù)測(cè)(LPC)濾波器處理后的殘差信號(hào)潰入基音分析模塊的基音預(yù)測(cè)濾波器,生成基音殘差信號(hào);在此基音殘差信號(hào)最小均方差意義下,計(jì)算得到基音預(yù)測(cè)濾波器的兩個(gè)重要參數(shù)的最優(yōu)預(yù)測(cè)值28比特位的基音延遲與20比特位的基音增益;激勵(lì)信號(hào)的確定則通過對(duì)激勵(lì)參數(shù)表(codebook)的搜索匹配得到激勵(lì)信號(hào)(由激勵(lì)向量與激勵(lì)增益合成)通過線性預(yù)測(cè)濾波器與基音合成濾波器合成的語(yǔ)音信號(hào)與輸入語(yǔ)音信號(hào)形成殘差信號(hào),在此殘差信號(hào)最小均方差意義下,匹配得到最優(yōu)激勵(lì)信號(hào),此激勵(lì)信號(hào)可用36比特位的激勵(lì)向量與20比特位的激勵(lì)增益參數(shù)表示;(7)將第(6)步中提取出的參數(shù)分別在對(duì)應(yīng)的參數(shù)表線譜頻率系數(shù)(LSP)參數(shù)表(含有65536個(gè)34比特位的量化LSP參數(shù)表項(xiàng))、基音參數(shù)表(含有16384個(gè)28比特位的基音延遲參數(shù)表項(xiàng),以及1024個(gè)20比特位的基音增益參數(shù)表項(xiàng)),激勵(lì)向量表(含有65536個(gè)36比特位的激勵(lì)向量參數(shù)表項(xiàng))以及激勵(lì)參數(shù)增益表(含有1025個(gè)20比特位的激勵(lì)增益參數(shù)表項(xiàng))中進(jìn)行查表逆向生成線譜頻率系數(shù)(LSP)參數(shù)索引、基音參數(shù)索引、激勵(lì)向量參數(shù)索引以及激勵(lì)增益參數(shù)索引;(8)將第(7)步中生成的索引值分別逆向還原為子幀,并將子幀重新組合為一幀,還原為源數(shù)字信號(hào)的一幀,長(zhǎng)度為66比特。因此本實(shí)施實(shí)例中可達(dá)到的傳輸碼率為R=66/30*1000=2200比特/秒。
本發(fā)明由于采取以上設(shè)計(jì),其具有以下特點(diǎn)1、本發(fā)明提出的方法以一種與電信網(wǎng)絡(luò)交換及傳輸設(shè)備無(wú)關(guān)的方式,透明地通過模擬或數(shù)字語(yǔ)音信道高質(zhì)量地傳送一定碼率的任意數(shù)字信號(hào),傳輸延遲及抖動(dòng)遠(yuǎn)低于通過數(shù)據(jù)信道的方式,保證交互式實(shí)時(shí)信息收發(fā)的服務(wù)質(zhì)量。
2、本發(fā)明由于只需使用運(yùn)營(yíng)商的語(yǔ)音服務(wù),互通互聯(lián)得到保障,使用范圍大大拓寬,用戶可在世界上任何有語(yǔ)音服務(wù)的地方保證服務(wù)質(zhì)量地傳送一定碼率的任意數(shù)字信號(hào)。
3、本發(fā)明可以應(yīng)用于無(wú)線移動(dòng)終端(GSM、CDMA手機(jī),衛(wèi)星電話等),固定電話以及計(jì)算機(jī)設(shè)備中,可實(shí)現(xiàn)多種特殊及增值服務(wù)功能(1)提高“一鍵通(PTTPush-to-Talk)”無(wú)線組群通話增值服務(wù)的語(yǔ)音傳輸質(zhì)量,并使該服務(wù)不再依賴于無(wú)線數(shù)據(jù)信道,實(shí)現(xiàn)PTT服務(wù)的獨(dú)立運(yùn)營(yíng);(2)為通過無(wú)線移動(dòng)網(wǎng)絡(luò)語(yǔ)音信道實(shí)現(xiàn)保密語(yǔ)音及數(shù)據(jù)通信提供關(guān)鍵技術(shù)支持由于語(yǔ)音信號(hào)經(jīng)高度數(shù)字化加密處理后呈現(xiàn)高度的隨機(jī)性,已不具有任何語(yǔ)音特性,此技術(shù)與裝置將使用戶在有固話網(wǎng)絡(luò)(POTS)及GSM/CDMA移動(dòng)網(wǎng)絡(luò)覆蓋的世界任何地方,進(jìn)行與現(xiàn)有網(wǎng)絡(luò)交換及傳輸設(shè)備無(wú)關(guān)的保密語(yǔ)音及數(shù)據(jù)通訊。
4、本發(fā)明的第(2)、第(3)步中,將每一子幀的數(shù)字信號(hào)碼流映射為相應(yīng)的參數(shù)索引值而非參數(shù)本身,提供了預(yù)先選取用于合成語(yǔ)音的關(guān)鍵參數(shù)的靈活性在參數(shù)的全部取值空間中選取部分相互差別大,易于提取的參數(shù)值納入相應(yīng)的參數(shù)代碼表,對(duì)應(yīng)于由子幀的數(shù)字信號(hào)碼流映射而來的索引值;這樣,以降低傳輸碼率為代價(jià)保證了相近的輸入數(shù)字信號(hào)產(chǎn)生區(qū)別足夠大的模擬連續(xù)波語(yǔ)音信號(hào),以利于接收端的語(yǔ)音分析處理得到正確的結(jié)果,有效降低誤碼率。
權(quán)利要求
1.一種用聲碼器收發(fā)數(shù)字信號(hào)的方法,其特征在于將欲傳輸?shù)脑磾?shù)字信號(hào)以參數(shù)映射的方式轉(zhuǎn)換為語(yǔ)音合成模型的關(guān)鍵語(yǔ)音特性參數(shù),在發(fā)送端通過語(yǔ)音合成處理生成語(yǔ)音信號(hào);合成的語(yǔ)音信號(hào)通過GSM或CDMA的聲碼器發(fā)送;在接收端通過語(yǔ)音分析處理提取關(guān)鍵語(yǔ)音特性參數(shù),恢復(fù)為原始的數(shù)字信號(hào)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于所述用聲碼器收發(fā)數(shù)字信號(hào)的方法,它具體包括有以下步驟(1)對(duì)欲傳送的源數(shù)字信號(hào)分幀處理,每一幀數(shù)字信號(hào)用于合成短時(shí)語(yǔ)音信號(hào),將每一幀繼續(xù)細(xì)分為長(zhǎng)度不等的子幀,所述子幀的數(shù)量至少為三個(gè);(2)將所述子幀對(duì)應(yīng)生成線譜頻率系數(shù)(LSP)索引、廣義激勵(lì)向量參數(shù)索引以及廣義激勵(lì)參數(shù)增益索引;(3)將第(2)步中生成的索引值分別在線譜頻率系數(shù)參數(shù)表、廣義激勵(lì)向量參數(shù)表以及廣義激勵(lì)增益參數(shù)表中進(jìn)行查表依次生成線譜頻率系數(shù)參數(shù)、廣義激勵(lì)向量參數(shù)以及廣義激勵(lì)增益參數(shù);(4)將第(3)步中生成的參數(shù)按CELP聲碼器的原理合成為語(yǔ)音信號(hào);(5)將合成的語(yǔ)音信號(hào)通過CDMA或GSM聲碼器發(fā)送;(6)接收端接收到合成的語(yǔ)音信號(hào)后,對(duì)其進(jìn)行語(yǔ)音分析,提取出線譜頻率系數(shù)參數(shù)、廣義激勵(lì)向量參數(shù)以及廣義激勵(lì)增益參數(shù);(7)將第(6)步中分析出的參數(shù)在各自對(duì)應(yīng)的參數(shù)表線譜頻率系數(shù)參數(shù)表、激勵(lì)向量參數(shù)表以及激勵(lì)增益參數(shù)表中進(jìn)行查表逆向生成線譜頻率系數(shù)索引、廣義激勵(lì)參數(shù)索引以及廣義激勵(lì)參數(shù)增益索引;(8)將第(7)步中生成的索引值分別逆向還原為子幀,并將子幀重新組合為一幀,還原為最初的數(shù)字信號(hào)。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于所述第(1)步中,將數(shù)字信號(hào)碼流分幀處理,每一幀數(shù)字信號(hào)碼流用于產(chǎn)生10-30毫秒的短時(shí)語(yǔ)音信號(hào)。
4.根據(jù)權(quán)利要求2或3所述的方法,其特征在于所述第(4)步中,將廣義激勵(lì)向量參數(shù)和廣義激勵(lì)增益參數(shù)首先通過激勵(lì)信號(hào)發(fā)生器合成為激勵(lì)信號(hào),并將線譜頻率系數(shù)參數(shù)經(jīng)逆矢量量化后生成一線性預(yù)測(cè)系數(shù),最后將該線性預(yù)測(cè)系數(shù)以及激勵(lì)信號(hào)發(fā)生器合成出的激勵(lì)信號(hào)一起輸入到線性預(yù)測(cè)語(yǔ)音合成濾波器合成為語(yǔ)音信號(hào)。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于所述用聲碼器收發(fā)數(shù)字信號(hào)的方法,它具體包括有以下步驟(1)對(duì)欲傳送的源數(shù)字信號(hào)分幀處理,每一幀數(shù)字信號(hào)用于合成短時(shí)語(yǔ)音信號(hào),將幀長(zhǎng)為N位的一幀繼續(xù)細(xì)分為長(zhǎng)度不等的四個(gè)子幀,分別為X比特、Y比特、Z比特和G比特的碼流,形成四個(gè)子幀;(2)X比特碼流映射生成線譜頻率系數(shù)參數(shù)索引值,Y比特碼流映射生成基音參數(shù)索引值,Z比特碼流映射生成激勵(lì)向量參數(shù)索引值;G比特碼流映射生成激勵(lì)增益參數(shù)索引值;(3)將第(2)步中生成的索引值分別在線譜頻率系數(shù)參數(shù)表、基音參數(shù)表、激勵(lì)向量參數(shù)表以及激勵(lì)增益參數(shù)表中查表得到真正的向量參數(shù)線譜頻率系數(shù)參數(shù)、基音參數(shù)、激勵(lì)向量參數(shù)以及激勵(lì)增益參數(shù);(4)將第(3)步中生成的參數(shù)按CELP聲碼器的原理合成為語(yǔ)音信號(hào);(5)將合成的語(yǔ)音信號(hào)通過CDMA或GSM聲碼器發(fā)送;(6)接收端接收到合成的語(yǔ)音信號(hào)后,對(duì)其進(jìn)行語(yǔ)音分析,提取出線譜頻率系數(shù)參數(shù)、基音參數(shù)、激勵(lì)向量參數(shù)以及激勵(lì)增益參數(shù);(7)將第(6)步中提取出的參數(shù)分別在對(duì)應(yīng)的線譜頻率系數(shù)參數(shù)表、基音參數(shù)表、激勵(lì)向量參數(shù)表以及激勵(lì)增益參數(shù)表中進(jìn)行查表逆向生成線譜頻率系數(shù)參數(shù)索引、基音參數(shù)索引、激勵(lì)向量參數(shù)索引以及激勵(lì)增益參數(shù)索引;(8)將第(7)步中生成的索引值分別逆向還原為子幀,并將子幀重新組合為一幀,還原為最初的數(shù)字信號(hào)。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于所述第(1)步中,將數(shù)字信號(hào)碼流分幀處理,每一幀數(shù)字信號(hào)碼流用于產(chǎn)生10-30毫秒的短時(shí)語(yǔ)音信號(hào)。
7.根據(jù)權(quán)利要求5或6所述的方法,其特征在于所述第(4)步中,將對(duì)應(yīng)X比特碼流的線譜頻率系數(shù)參數(shù)量化向量參數(shù)經(jīng)分割矢量量化的逆操作及轉(zhuǎn)換得到線性預(yù)測(cè)系數(shù)參數(shù),用于線性預(yù)測(cè)語(yǔ)音合成濾波器;將對(duì)應(yīng)Y比特碼流的基音參數(shù)向量,經(jīng)基音合成處理生成基音激勵(lì)信號(hào);將對(duì)應(yīng)Z比特碼的激勵(lì)向量參數(shù),以及對(duì)應(yīng)G比特碼流的激勵(lì)增益參數(shù),輸入到激勵(lì)信號(hào)合成模塊,生成激勵(lì)信號(hào);此激勵(lì)信號(hào)以及基音激勵(lì)信號(hào)作用于描述聲道特性的線性預(yù)測(cè)語(yǔ)音合成濾波器,產(chǎn)生人工合成的語(yǔ)音信號(hào)。
全文摘要
本發(fā)明公開了一種用聲碼器收發(fā)數(shù)字信號(hào)的方法,將欲傳輸?shù)脑磾?shù)字信號(hào)以參數(shù)映射的方式轉(zhuǎn)換為語(yǔ)音合成模型的關(guān)鍵語(yǔ)音特性參數(shù),在發(fā)送端通過語(yǔ)音合成處理生成語(yǔ)音信號(hào);合成的語(yǔ)音信號(hào)通過GSM或CDMA的聲碼器發(fā)送;在接收端通過語(yǔ)音分析處理提取關(guān)鍵語(yǔ)音特性參數(shù),恢復(fù)為原始的數(shù)字信號(hào)。本發(fā)明提出的方法以一種與電信網(wǎng)絡(luò)交換及傳輸設(shè)備無(wú)關(guān)的方式,通過模擬或數(shù)字語(yǔ)音信道高質(zhì)量地傳送一定碼率的任意數(shù)字信號(hào),傳輸延遲及抖動(dòng)遠(yuǎn)低于通過數(shù)據(jù)信道的方式,保證交互式實(shí)時(shí)信息收發(fā)的服務(wù)質(zhì)量。
文檔編號(hào)G10L19/00GK1964244SQ20051011772
公開日2007年5月16日 申請(qǐng)日期2005年11月8日 優(yōu)先權(quán)日2005年11月8日
發(fā)明者吳倩, 林伯瀚, 林 源, 范莉 申請(qǐng)人:廈門致晟科技有限公司
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
泰兴市| 醴陵市| 扎囊县| 大竹县| 龙江县| 修水县| 兴仁县| 岗巴县| 莱西市| 民勤县| 鸡西市| 南通市| 西峡县| 太保市| 天台县| 张家川| 新余市| 巨鹿县| 彰化县| 东方市| 巴东县| 漳州市| 奉贤区| 郁南县| 海原县| 金山区| 杭锦旗| 五常市| 文昌市| 丰顺县| 兴业县| 和林格尔县| 克东县| 麻栗坡县| 尼勒克县| 东乡县| 磴口县| 东辽县| 广宗县| 阿图什市| 江永县|