專利名稱:語音編碼發(fā)送和接收解碼的方法及裝置的制作方法
技術領域:
本發(fā)明涉及通信領域,特別涉及語音編解碼技術。
技術背景隨著寬帶城域網(wǎng)建設的發(fā)展,寬帶業(yè)務也越來越豐富,對寬帶高質(zhì)量語 音業(yè)務需求的也日益增長,諸如寬帶IP電話和多點視頻會議等。因此也將高質(zhì)量低復雜度的寬帶語音編解碼器提到了日程上來。而如何和目前廣泛使用 的語音編解碼器相兼容則是一個正在研究的課題。國際電"f言4關盟畫電#"才示準吾卩(International Telecommunication Union Telecommunication Standardization Sector, 簡稱"ITU-T")于2006年成功 的標準化了和G.729兼容的語音頻編解碼器。ITU-T又于2007年3月啟動的 G.711寬帶擴展(7kHz帶寬)的標準方案征集正是來解決寬帶語音和G.711 窄帶編解碼器(4kHz帶寬)兼容的問題?,F(xiàn)有的寬帶語音頻編解碼解決方案都是針對于某種具體的核心編解碼 器的,如G.729.1是針對G.729窄帶編解碼器的寬帶擴展。在現(xiàn)有技術G.729.1 中,是將信號分成兩路,窄帶語音信號和寬帶語音信號,分別對窄帶語音信 號和寬帶語音信號進行編碼,得到窄帶語音信號的編碼碼流和寬帶語音信號 的編碼碼流。解碼端分別對這兩個碼流進行解碼,得到傳輸信號。然而,本發(fā)明的發(fā)明人發(fā)現(xiàn),在對窄帶語音信號進行編碼的過程中,由 于需要對原始的窄帶語音信號進行碼本量化,因此將導致解碼端在對收到的 窄帶語音信號進行解碼后,得到的解碼信號仍是量化后的離散數(shù)值,與原始 的窄帶語音信號存在一定的量化誤差,因此,在解碼端恢復出的語音質(zhì)量不夠好。發(fā)明內(nèi)容本發(fā)明實施方式要解決的主要技術問題是提供一種語音編碼發(fā)送和接 收解碼的方法及裝置,使得語音質(zhì)量得以提高。為解決上述技術問題,本發(fā)明的實施方式提供了一種語音編碼發(fā)送方法,包含以下步驟對語音信號進行窄帶編碼,得到基本窄帶編碼信號; 對基本窄帶編碼信號進行解碼,得到解碼信號; 用語音信號和對應的解碼信號相減,得到殘差信號; 對殘差信號進行量化編碼,得到增強窄帶編碼信號; 發(fā)送基本窄帶編碼信號和增強窄帶編碼信號。 本發(fā)明的實施方式還提供了一種語音接收解碼方法,包含以下步驟 接收基本窄帶編碼信號和增強窄帶編碼信號;對收到的基本窄帶編碼信號進行窄帶解碼,得到基本窄帶解碼信號,并 對收到的增強窄帶編碼信號進行量化解碼,得到殘差信號;將得到的基本窄帶解碼信號分別與相應的殘差信號相加,得到窄帶語音 信號。本發(fā)明的實施方式還提供了一種語音編碼發(fā)送裝置,包括窄帶編碼模塊,用于對語音信號進行窄帶編碼,得到基本窄帶編碼信號;窄帶解碼模塊,用于對窄帶編碼模塊得到的基本窄帶編碼信號進行解 碼,得到解碼信號;殘差信號獲取模塊,用于將語音信號和對應的解碼信號相減,得到殘差信號;量化編碼模塊,用于對殘差信號獲取模塊得到的殘差信號進行量化編 碼,得到增強窄帶編碼信號;發(fā)送模塊,用于發(fā)送窄帶編碼模塊得到的基本窄帶編碼信號和量化編碼 模塊得到的增強窄帶編碼信號。本發(fā)明的實施方式還提供了一種語音接收解碼裝置,包括 接收模塊,用于接收基本窄帶編碼信號和增強窄帶編碼信號;窄帶解碼模塊,用于對接收模塊收到的基本窄帶編碼信號進行窄帶解 碼,得到基本窄帶解碼信號;量化解碼模塊,用于對接收模塊收到的增強窄帶編碼信號進行量化解 碼,得到殘差信號;語音信號獲取模塊,用于將窄帶解碼模塊得到的基本窄帶解碼信號分別 與相應的殘差信號相加,得到窄帶語音信號。本發(fā)明實施方式與現(xiàn)有技術相比,主要效果在于由于該增強窄帶編碼 信號中攜帶了解碼后的各解碼信號與語音信號的量化誤差信息,使得解碼端 能夠根據(jù)各解碼信號的量化誤差信息,還原出相應的語音信號,避免了在窄 帶編碼過程中各語音信號因量化編碼而導致的信息損失,從而提高了語音質(zhì) 量,增強了窄帶性能。
圖l是根據(jù)本發(fā)明第一實施方式的語音編碼發(fā)送方法示意圖; 圖2是根據(jù)本發(fā)明第一實施方式中對窄帶語音信號的處理流程圖;圖3是根據(jù)本發(fā)明第 一 實施方式中對殘差信號的絕對值進行量化編碼的 示意圖;圖4是根據(jù)本發(fā)明第 一 實施方式中對寬帶語音信號的處理流程圖;圖5是根據(jù)本發(fā)明第二實施方式的語音接收解碼方法示意圖;圖6是根據(jù)本發(fā)明第二實施方式中獲取窄帶語音信號的處理流程圖;圖7是根據(jù)本發(fā)明第二實施方式中為殘差信號添加符號信息的示意圖;圖8是根據(jù)本發(fā)明第二實施方式中獲取寬帶語音信號的處理流程圖;圖9是根據(jù)本發(fā)明第二實施方式中對MDCT系數(shù)進行精細頻i瞽結構裁減 示意圖;圖IO是根據(jù)本發(fā)明第二實施方式中的丟包補償流程圖;圖11是根據(jù)本發(fā)明第二實施方式中的復用MDCT引入的窄帶緩沖區(qū)示 意圖;圖12是根據(jù)本發(fā)明第二實施方式中的自適應網(wǎng)絡狀態(tài)比特流裁減示意圖;圖13是根據(jù)本發(fā)明第六實施方式的語音編碼發(fā)送裝置的結構示意圖; 圖14是根據(jù)本發(fā)明第七實施方式的語音接收解碼裝置的結構示意圖。
具體實施方式
為使本發(fā)明的目的、技術方案和優(yōu)點更加清楚,下面將結合附圖對本發(fā) 明的實施方式作進一步地詳細描述。本發(fā)明的第一實施方式涉及一種語音編碼發(fā)送方法,在本實施方式中,編 碼端通過分析正交鏡像濾波器,將16kHz的信號分為低頻部分的窄帶語音信號, 和高頻部分的寬帶語音信號。對窄帶語音信號進行窄帶編碼,得到基本窄帶編碼信號,并對得到的基本窄帶編碼信號進行解碼,得到解碼信號,將窄帶語音 信號與對應的解碼信號相減,得到殘差信號,通過對殘差信號進行量化編碼,得到增強窄帶編碼信號。對寬帶語音信號進行改進型離散余弦變換(Modified Discrete Cosine Transform,簡稱"MDCT")編碼的處理過程,得到寬帶編碼信 號。最后將得到的基本窄帶編碼信號、增強窄帶編碼信號、和寬帶編碼信號復 用為一個碼流后發(fā)送給解碼端,如圖1所示。由于該增強窄帶編碼信號中攜帶 了解碼后的各解碼信號與語音信號的量化誤差信息,使得解碼端能夠根據(jù)各解 碼信號的量化誤差信息,還原出相應的語音信號,避免了在窄帶編碼過程中各 語音信號因量化編碼而導致的信息損失,從而提高了語音質(zhì)量,增強了窄帶性 能。本實施方式中對經(jīng)分析正交鏡像濾波器后,得到的窄帶語音信號進行的具 體處理流程如圖2所示。在步驟210中,編碼端對得到的窄帶語音信號進行窄帶編碼,得到基本窄 帶碼流。具體地說,由于G/711技術采用脈沖編碼調(diào)制(Pulsed Code Modulation, 簡稱"PCM")的語音編解碼標準(A律或]Li律),傳輸帶寬為64kbit/s (千比特 每秒),這種方式的壓縮對語音信號的損失很小。因此,本實施方式以對窄帶語 音信號進行G.711編碼為例進行說明。G.711 A律方法將13比特的線性PCM樣 本壓縮為8比特的對數(shù)PCM格式。G.711 ju律方法將14比特的線性PCM樣本 壓縮為8比特的對數(shù)PCM格式。對窄帶語音信號進行G.711編碼后,得到基本 窄帶碼流。接著,進入步驟220,編碼端對經(jīng)G.711編碼后的基本窄帶編碼信號進行解 碼,得到解碼信號。具體地說,當G.711編碼器對N點輸入信號S(O編碼后,立 即在編碼端進行解碼,得到該N點G.711解碼后的信號S(/)。接著,進入步驟230,用未經(jīng)G711編碼的窄帶語音信號和對應的解碼信號 相減,得到殘差信號。具體地說,可以將N點輸入信號S(0分別減去相應的經(jīng)G,711解碼后的信號S(0,得到各信號的殘差信號(即量化誤差)e(/): e(/),)一柳/ = 0,D —1接著,進入步驟240,對得到的各殘差信號進行量化編碼,得到增強窄帶編 碼信號。具體地說,為了簡化對各殘差信號進行量化編碼的處理過程,可以先 取出各殘差信號的符號信息,即對各殘差信號的絕對值進行量化編碼,如圖3 所示。在量化編碼的過程中,需要先根據(jù)編碼端與解碼端均可獲知的關聯(lián)信息, 對殘差信號的絕對值進行歸一化,再對經(jīng)歸一化后的殘差信號的絕對值進行量 化。通過對殘差信號的絕對值進行歸一化,使得殘差信號的范圍被控制在預定 的范圍之內(nèi),進而節(jié)約了用于傳輸殘差信號的資源。本實施方式中的關聯(lián)信息為上述N個解碼信號的能量之和,或上述N個解 碼信號的平均能量,即每N點對應一個關聯(lián)信息。比如說,當前幀N-8,經(jīng)G.711 解碼后的輸出的N個解碼信號為(80, 150, 500, 850, 700, 550, 300, 200},則這8 個點對應的以能量之和為關聯(lián)信息的值為這8個值的平方和,即1923900;這8 個點以平均能量為關聯(lián):信息的值為能量和除以8,即240487.5。由于在解碼端也 可通過解碼信號得到該關聯(lián)信息,因此該關聯(lián)信息無需在編碼端與解碼端之間 進行傳輸,節(jié)約了傳輸資源。需要說明的是,該關聯(lián)信息可以在本步驟中進行 計算,也可以在步驟230或步驟220中進行計算。編碼端可通過以下方式,將得到的關聯(lián)信息用于對殘差信號的絕對值進行 歸一化將與N個解碼信號相對應的N個殘差信號的絕對值,分別乘以該關聯(lián) 信息的倒數(shù),得到N個歸一化后的殘差信號的絕對值。然后,通過對歸一化后的殘差信號的絕對值,進行量化,得到增強窄帶編 碼信號。本實施方式中對經(jīng)分析正交鏡像濾波器后得到的寬帶語音信號,按如圖4 所示的流程進行處理。下面對圖4中的寬帶語音信號處理方法進行說明。在步驟410中,編碼端對得到的N個寬帶語音信號進行時頻變換,得到X 個頻域變換系數(shù)。具體地說,編碼端對N個寬帶語音信號進行MDCT編碼,可 得到X個MDCT系數(shù),X的值為2/N。以N-80為例,MDCT的變換公式如下^(》、^Zw縦"")cosf^(" + 80尊+ 0.5)V"""), "0,…,39 其中 , 釘(")=si《("+ 0.5)), " = 0,…,79接著,進入步驟420,編碼端將得到的X個MDCT系數(shù)分為M個子帶,每 個子帶包含至少一個MDCT系數(shù)。然后,分別對每個子帶進行歸一化。比如說, 在每個子帶范圍內(nèi),計算絕對值最大的MDCT系數(shù),利用該絕對值最大的MDCT 系數(shù),對該每個子帶范圍內(nèi)的各MDCT系數(shù)進行歸一化。接著,進入步驟430,對各子帶的用于歸一化的歸一化因子進行量化,得到 量化后的各子帶的歸一化因子。在步驟440中,對經(jīng)歸一化后的各子帶中的MDCT系數(shù)進行量化,得到寬 帶編碼信號。在對MDCT系數(shù)進行量化的過程中,需要對相對重要的Y個MDCT 系數(shù)(如前Y個MDCT系數(shù))以第一碼本進行量化,對剩余的X-Y個MDCT 系數(shù)以第二碼本進行量化,第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量,X> Y>1。其中,相對重要的Y個MDCT系數(shù)為至少一個子帶中的所有MDCT系 數(shù)。具體地說,如果經(jīng)MDCT編碼后,得到32個MDCT系數(shù),并且將這32個 MDCT系數(shù)劃分為7個子帶,則在碼本矢量的維數(shù)為4維的情況下(即一個碼 字可對4個MDCT系數(shù)進行量化),可以將這32個MDCT系數(shù)劃分為[4, 4, 4, 4, 4, 4, 8]這樣7個子帶。^假定相對重要的Y個MDCT系數(shù)為前12個MDCT系數(shù), 則以第一碼本對第一至第三子帶中的12個歸一化后的MDCT系數(shù)進行量化,以 第二碼本對第四至第七子帶中的20個歸一化后的MDCT系數(shù)進行量化,第一碼 本的碼字數(shù)量大于第二碼本的碼字數(shù)量。由于對相對重要的MDCT系數(shù)采用包含更多的碼字數(shù)量的碼本進行量化,可使得量化后的MDCT系數(shù)更接近于原始 的MDCT系數(shù),從而提高了編碼效率,減少主觀聽覺失真。其中,第一碼本和第二碼本可以均為獨立的碼本,使得量化后的MDCT系 數(shù)可以通過碼本中的碼字索引即可表示,提高了傳輸效率。或者,第一碼本包 括至少兩個基本碼本,第二碼本包括至少一個基本碼本,第一碼本和第二碼本 共享至少一個基本碼本,比如說,選擇一個通用的碼本用于大多數(shù)MDCT系數(shù) 的量化,而對某些特定的譬如失真較大的碼字使用另外的一個或多個碼本進行 量化,從而提高編碼效率,減少主觀聽覺失真。在這種情況下,雖然量化后的 MDCT系數(shù)需要通過碼本索引以及碼字索引來共同表示,但由于第一碼本和第 二碼本能夠共享基本碼本中的碼字,因此可節(jié)約編碼端與解碼端內(nèi)的碼本存儲 空間。而且,由于第一碼本和第二碼本是對歸一化后的MDCT系數(shù)進行量化, 也就是說,需要量化的MDCT系數(shù)都被限制在一個較小的范圍內(nèi),因此,可以 進一步節(jié)約編碼端與解碼端內(nèi)的碼本存儲空間。需要說明的是,本實施方式中的寬帶語音信號的編碼是基于MDCT的,在 實際應用中,也可以是基于快速傅里葉變換(Fast Fourier Transform,簡稱"FFT,,) 的。另外,本實施方式中的步驟430和步驟440并無明確的先后關系,也就是 說,步驟430也可以在步驟440之后。編碼端在獲取到寬帶編碼信號、基本窄帶編碼信號、和增強窄帶編碼信號 后,將該寬帶編碼信號、基本窄帶編碼信號、和增強窄帶編碼信號,復用為碼 流后發(fā)送給解碼端。另外,由于在本實施方式中,在對殘差信號進行量化編碼 的過程中,是對殘差信號的絕對值進行量化編碼的;在對各子帶的MDCT系數(shù) 進行量化之前,先對各子帶的MDCT系數(shù)在子帶范圍內(nèi)進行了歸一化,因此, 編碼端還需要將各殘差信號的符號信息,以及各子帶的量化后的歸一化因子發(fā) 送給解碼端。本發(fā)明的第二實施方式涉及一種語音接收解碼方法,本實施方式對應于第一實施方式的語音編碼發(fā)送方法。在本實施方式中,解碼端將收到的碼流進行 解復用,得到基本窄帶編碼信號、增強窄帶編碼信號、和寬帶編碼信號。根據(jù) 基本窄帶編碼信號和增強窄帶編碼信號得到窄帶語音信號,根據(jù)寬帶編碼信號 得到寬帶語音信號,將得到的窄帶語音信號和寬帶語音信號進行綜合正交鏡像濾波,得到語音信號,如圖5所示。其中,在發(fā)生丟包時,利用丟包前的窄帶 語音信號預測出基音周期,根據(jù)預測的基音周期,恢復出丟失的窄帶語音信號 和寬帶語音信號,如圖5中的窄帶丟包補償模塊和寬帶丟包補償才莫塊所示。下 面分別對根據(jù)基本窄帶編碼信號和增強窄帶編碼信號得到窄帶語音信號的處理 流程,和根據(jù)寬帶編碼信號得到寬帶語音信號的處理流程進行說明。根據(jù)基本窄帶編碼信號和增強窄帶編碼信號得到窄帶語音信號的處理流程 如圖6所示。在步驟610中,解碼端對解復用出的基本窄帶編碼信號進行解碼,得到基 本窄帶解碼信號。針對第一實施方式中的案例,解碼端對解復用出的基本窄帶 編碼信號進行G,711解碼,得到基本窄帶解碼信號。在本步驟中,可以根據(jù)獲得 的基本窄帶解碼信號,計算關聯(lián)信息。解碼端計算關聯(lián)信息的方式與編碼端計 算關聯(lián)信息的方式完全相同,在此不再贅述。在步驟620中,解碼端對解復用出的增強窄帶編碼信號進行量化解碼,得 到殘差信號。具體地說,在本步驟中,需要先對收到的增強窄帶編碼信號進行 量化解碼,得到歸一化后的各殘差信號,再根據(jù)計算出的關聯(lián)信息,對歸一化 后的各殘差信號進行歸一化還原,得到各殘差信號。比如說,關聯(lián)信息為N個 解碼信號的能量之和,將與這N個解碼信號相對應的N個歸一化后的殘差信號, 分別乘以該關聯(lián)信息,得到N個歸一化還原后的殘差信號。由于編碼端在對各殘差信號進行量化編碼的處理過程中,先取出了各殘差 信號的符號信息,即對各殘差信號的絕對值進行量化編碼。因此,在解碼端中 進行量化解碼后得到的各殘差信號,實際上也是各殘差信號的絕對值。所以,解碼端還需接收來自編碼端的各殘差信號的符號信息,將歸一化還原后的殘差信號分別加上相應的符號信息,得到完整的表示量化誤差的殘差信號,如圖7 所示。接著,在步驟630中,將加上符號信息的各殘差信號分別與相應的基本窄 帶解碼信號相加,得到窄帶語音信號。根據(jù)寬帶編碼信號得到寬帶語音信號的處理流程如圖8所示,在步驟810 中,解碼端對寬帶編碼信號進行量化解碼,得到X個頻域變換系數(shù)。具體地說, 解碼端對寬帶編碼信號中對相對重要的寬帶編碼信號以第一碼本進行量化解 碼,得到Y個頻域變換系數(shù),對剩余的寬帶編碼信號以第二碼本進行量化解碼, 得到X-Y個頻域變換系數(shù),第一碼本的碼字數(shù)量大于第二碼本的碼字數(shù)量,X >Y>1。針對第一實施方式中的案例,解碼端對寬帶編碼信號中對應第一至第三子 帶的寬帶編碼信號,以與編碼端相同的第 一碼本進行量化解碼,得到12個MDCT 系數(shù);對寬帶編碼信號中對應第四至第七子帶的寬帶編碼信號,以與編碼端相 同的第二碼本進行量化解碼,得到20個MDCT系數(shù)。該第一碼本和第二碼本可 以均為獨立的碼本,此時,根據(jù)碼本中的碼字索引對寬帶編碼信號進行量化解 碼?;蛘?,第一碼本包括至少兩個基本碼本,第二碼本包括至少一個基本碼本, 第一碼本和第二碼本共享至少一個基本碼本,此時,根據(jù)碼本索引和碼字索引對寬帶編碼信號進行量化解碼。接著,在步驟820中,解碼端對量化解碼后的各子帶的頻域變換系數(shù)(即 MDCT系數(shù))分別進行歸一化還原。具體地說,由于編碼端是對經(jīng)歸一化后的 各子帶中的MDCT系數(shù)進行量化的,因此,解碼端還需要接收經(jīng)量化的各子帶 的歸一化因子,然后,在本步驟中,對經(jīng)量化的各子帶的歸一化因子進行量化 解碼,得到各子帶的歸一化因子,并根據(jù)各子帶的歸一化因子分別對各子帶中 的MDCT系數(shù)進行歸一化還原,恢復出還原后的MDCT系數(shù)。接著,在步驟830中,解碼端對還原后的MDCT系數(shù)進行自適應后濾波。 具體地說,解碼端對包括至少兩個MDCT系數(shù)的MDCT系數(shù)塊,計算平均頻語 幅度和最大頻鐠幅度的比值,根據(jù)計算出的比值大小裁減MDCT系數(shù)塊中 MDCT系數(shù)的精細頻譜結構,其中,比值越小對精細頻語結構的裁減程度越大。根據(jù)計算出的比值大小裁減MDCT系數(shù)塊中MDCT系^t的精細頻譜結構的 方式如下對MDCT系數(shù)塊中的每個MDCT系數(shù),根據(jù)該比值計算對應該MDCT 系數(shù)的調(diào)整因子,其中,該調(diào)整因子是該比值的單調(diào)函數(shù),該比值越大則該調(diào) 整因子越大。然后,對每個MDCT系數(shù)乘以該MDCT系數(shù)對應的調(diào)整因子。該調(diào)整因子的fac的計算公式如下/,6咖x 剛 +(1-6—. = 1,2,......,"。其中,Mo^雄 力,,, beta =1.2 - Avg Amp/Max Amp , MaxAmp為MDCT系數(shù)塊的最大頻鐠幅度, AvgAmp為MDCT系數(shù)塊的平均頻譜幅度,X[z']為MDCT系數(shù)塊中的MDCT系 數(shù),n為MDCT系數(shù)塊中包含的MDCT系數(shù)數(shù)目。以4個MDCT系數(shù)為一個MDCT系數(shù)塊為例進行說明,如圖9所示,計算 X( 1 )、 X( 2 )、 X( 3 )、 X( 4 )的最大頻譜幅度MaxAmp,和平均頻語幅度AvgAmp。 根據(jù)AvgAmp/MaxAmp的值,對X (i)進行精細頻語結構裁減(i = 1, 2, 3, 4 ),固如X(i) =facxX(i)。其中,/"c = 6etox 1 u +(1-』)".=i,2,......,4, beta =1.2-AvgAmp/MaxAmp 。由于正弦頻語的量化會導致正弦頻譜相鄰的頻譜產(chǎn)生較大的失真,表現(xiàn)形 式為頻譜的波谷處被提升,噪聲很容易被人察覺。因此,在本步驟中,根據(jù)每 個量化塊的平均頻譜幅度和最大頻鐠幅度的比值,來決定該量化塊中MDCT系 數(shù)的精細頻i普結構裁減的程度。平均頻語幅度和最大頻譜幅度的比值越小,則 需要加大精細頻語結構裁減的程度,平均頻譜幅度和最大頻譜幅度的比值越大, 則需要減小精細頻譜結構裁減的程度,以便達到減少量化噪聲的效果。如圖9 所示,在正弦部分占主導的信號條件下,第1, 3, 4個MDCT系數(shù)量化引入的噪聲會令人容易覺察到編碼帶來的損傷。而通過判斷平均頻鐠幅度和最大頻i普 幅度的比值來進行精細頻語結構裁減,肖M艮好的自適應不同的編碼塊特性,以 達到性能的優(yōu)化。當然,本實施方式中也可以采用固定的包絡裁減來達到優(yōu)化 性能的目的。接著,在步驟840中,將裁減后的MDCT系數(shù)進行頻時變換,即逆MDCT 變換,得到時域的語音信號,該時域的語音信號為寬帶語音信號。解碼端在得到寬帶語音信號和窄帶語音信號之后,將窄帶語音信號和寬帶 語音信號進行綜合正交鏡像濾波,得到完整的語音信號。值得一提的是,本實施方式中,可通過丟包補償來提高丟包處寬帶語音的 性能。具體地說,在發(fā)生丟包時,利用丟包前的窄帶語音預測出基音周期,根 據(jù)預測的基音周期恢復出丟失的窄帶語音信號和寬帶語音信號。由于寬帶的丟 包補償容易帶來7kHz 8kHz頻帶的失真,因此,需要加上7kHz以下的頻域低 通濾波以解決該問題,如圖IO所示。另外,為了和丟包前的信息保持連續(xù)性, 丟包前的信息需要延時一段輸出,這段時間建議是3.75ms。由于在對寬帶語音 編碼信號使用MDCT的過程中,將會帶來一個變換塊的延時,而恢復出G.711 窄帶語音是沒有延時的,因此,可以通過復用MDCT引入的窄帶緩沖區(qū),使得 丟包補償?shù)奶幚砹鞒滩粫砣魏晤~外的延時,如圖ll所示。本發(fā)明的第三實施方式涉及一種語音編碼發(fā)送方法,本實施方式與第一實 施方式大致相同,其區(qū)別在于,在第一實施方式中,編碼端在得到基本窄帶編 碼信號、增強窄帶編碼信號和寬帶編碼信號后,直接將得到的基本窄帶編碼信 號、增強窄帶編碼信號和寬帶編碼信號發(fā)送給解碼端。而在本實施方式中,在 發(fā)送基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號之前,先根據(jù)當前 網(wǎng)絡狀態(tài)判斷是否需要裁減編碼信號,如果判定為需要裁減編碼信號,則發(fā)送 基本窄帶編碼信號(如圖12中的模式1),或基本窄帶編碼信號和增強窄帶編碼 信號的組合(如圖12中的模式2),或基本窄帶編碼信號和寬帶編碼信號的組合(如圖12中的模式3);如頁果判定為不需要裁減編碼信號,則發(fā)送基本窄帶編碼 信號、增強窄帶編碼信號和寬帶編碼信號(如圖12中的模式0)。由于在本實施方式中,可根據(jù)當前網(wǎng)絡狀態(tài)裁減編碼信號,因此可以在網(wǎng) 絡狀態(tài)較差時保證基本音質(zhì)的通信,在網(wǎng)絡狀態(tài)較好時進行較高音質(zhì)的通信。相應的,在解碼端接收碼流時,同樣需要先根據(jù)當前網(wǎng)絡狀態(tài)判斷編碼信 號是否被裁減,如果判定為編碼信號被裁減,則接收窄帶編碼信號,或基本窄 帶編碼信號和增強窄帶編碼信號的組合,或基本窄帶編碼信號和寬帶編碼信號 的組合;如果判定為編碼信號未被裁減,則接收基本窄帶編碼信號、增強窄帶 編碼信號和寬帶編碼信號。另外,值得一提的是,本實施方式中對寬帶語音信號也可以按現(xiàn)有技術的 方式進行處理,比如說,在將寬帶語音信號進行時頻變換,得到X個頻域變換 系數(shù)后,以相同的碼本對這X個頻域變換系數(shù)進行量化編碼。此時,解碼端對 收到的寬帶編碼信號需要以相應的方式進行解碼(如以相同的碼本對收到的寬 帶編碼信號進行量化解碼),得到寬帶語音信號。甚至,本實施方式可以不考慮 對寬帶語音信號的處理。本發(fā)明的第四實施方式涉及一種語音編碼發(fā)送方法,本實施方式與第一實 施方式大致相同,其區(qū)別在于,在第一實施方式中,關聯(lián)信息為N個解碼信號 的能量之和,或N個解碼信號的平均能量;而在本實施方式中,關聯(lián)信息為N 個解碼信號的幅度的絕對值之和,或N個解碼信號的平均絕對值。具體實現(xiàn)方式與第一實施方式類似,在此不再贅述。由于解碼端中的關聯(lián)信息需要保證與編碼端中的關聯(lián)信息一致,因此相應 地,在解碼端中的關聯(lián)信息也為N個解碼信號的幅度的絕對值之和,或N個解 碼信號的平均絕對值。對應于第四實施方式的語音編碼發(fā)送的語音接收解碼方 法,與第二實施方式類似,在此不再贅述。本發(fā)明的第五實施方式涉及一種語音編碼發(fā)送方法,本實施方式與第一實施方式大致相同,其區(qū)別在于,在第一實施方式中,關聯(lián)信息為N個解碼信號 的能量之和,或N個解碼信號的平均能量。而在本實施方式中,每個殘差信號 對應一個關聯(lián)信息,該關聯(lián)信息為與該殘差信號相對應的解碼信號的幅度絕對 值所在值域區(qū)間內(nèi)的最大量化誤差。具體地說,由于對窄帶語音信號進行的G.711編碼,而量化產(chǎn)生的最大量化 誤差可以根據(jù)解碼信號的幅度絕對值大小有8個取值。以y律為例絕對值在(0,255)的最大量化誤差值為5;絕對值在(256,511)的最大量化誤差值為9;絕對值在(512, 1023)的最大量化誤差值為H;絕對值在(1024,2047)的最大量化誤差值為33;絕對值在(2048,4095)的最大量化誤差值為65;絕對值在(4096,8191)的最大量化誤差值為129;絕對值在(8192, 16383)的最大量化誤差為257;絕對值在(l6384,32768)的最大量化誤差為513。比如說,某個殘差信號所對應的解碼信號的幅度絕對值在(256, 511)之間, 則該殘差信號所對應的關聯(lián)信息即為9,在對該殘差信號進^f亍歸一化時,將該殘 差信號乘以對應的關聯(lián)信息的倒數(shù),即將該殘差信號乘以1/9 (約為0.1111111), 得到歸 一化后的該殘差信號。由于在對殘差信號進行歸一化時,需要將該殘差信號乘以對應的關聯(lián)信息 的倒數(shù),而關聯(lián)信息根據(jù)解碼信號的幅度絕對值大小有8個取值,即(5, 9, 17, 33, 65, 129, 257, 513)(以iLi律為例),因此,可在編碼端直接保存這8個取值的倒 數(shù),即(0.2, 0.1111111, 0.0588235, 0.0303030, 0.0153846, 0.0077519, 0.0038911, 0.0019493 ),以便在對殘差信號進行歸一化時,直接將該殘差信號乘以(0.2, 0.1111111, 0.0588235, 0,0303030, 0.0153846, 0.0077519, 0.0038911, 0.0019493 )中的某個值,從而省去了除法處理帶來的復雜度的增加,快速地得到歸一化后的 該殘差信號。當然,具體乘以其中的哪個值,還需根據(jù)該殘差信號對應的解碼 信號的幅度絕對值大小進行選擇。相應地,在解碼端中,每個歸一化后的殘差信號同樣對應一個關聯(lián)信息, 該關聯(lián)信息為與該歸 一化后的殘差信號相對應的解碼信號的幅度絕對值所在值 域區(qū)間內(nèi)的最大量化誤差。也就是說,以IU律為例時,關聯(lián)信息根據(jù)解碼信號 的幅度絕對值大小有8個取值,即(5, 9, 17,33,65, 129,257, 513 ),每個歸一化 后的殘差信號所對應的關聯(lián)信息為這8個取值中的某個取值,具體為哪個取值, 需要根據(jù)與該殘差信號相對應的解碼信號的幅度絕對值所在值域區(qū)間來決定。本實施方式中是以ju律為例進行說明的,如果是對窄帶語音信號進行 G711A律編碼時,關聯(lián)信息根據(jù)解碼信號的幅度絕對值大小有8個取值,為(9, 9, 17, 33, 65, 129, 257, 513 ),在編碼端可以保存這8個取值的倒數(shù),即(0.1111111, 0.1111111, 0.0588235, 0.0303030, 0.0153846, 0.0077519, 0.0038911, 0.0019493 ), 在解碼端可直接保存這8個取值,即(9, 9, 17, 33, 65, 129, 257, 513 )。根據(jù)大量語音音頻序列進行測試后的結果顯示,本實施方式是一種高質(zhì)量、 低復雜度的編碼方法。如表l所示,前兩列表示分別對A律和ii律的量化誤差 訓練碼本采用4比特編碼的平均失真,第三列是對A律和ja律的量化誤差訓練 碼本釆用4比特編碼的總平均失真,第四列是對A律和ju律的量化誤差訓練碼 本采用5比特編碼的總平均失真。可以發(fā)現(xiàn),A律和ju律的量化誤差分布非常 接近,因此可以對A律和n律的量化誤差采用統(tǒng)一的碼本進行量化編碼。A律(4比特)m律(4比特)A律和ja律(4比特)A律和(J律(5比特)失真0.13070.13130.13170.0950表1本實施方式的平均計算復雜度如下普通語音信號編碼復雜度為0.67900WMOPS (加權百萬操作每秒);音樂語音信號編碼復雜度為0.69511 WMOPS。 相應地,普通語音信號解碼復雜度為0.17615 WMOPS;音樂語音信號解碼復雜 度為0.17922 WMOPS。對普通語音信號而言,總體復雜度為0.85515 WMOPS; 對音樂語音信號而言,總體復雜度為0.87433 WMOPS。本發(fā)明的第六實施方式涉及一種語音編碼發(fā)送裝置,如圖13所示,包括 窄帶編碼模塊,用于對語音信號進行窄帶編碼,得到基本窄帶編碼信號;窄帶 解碼模塊,用于對該窄帶編碼模塊得到的基本窄帶編碼信號進行解碼,得到解碼信號;殘差信號獲取模塊,用于將語音信號和對應的解碼信號相減,得到殘 差信號;量化編碼模塊,用于對殘差信號獲取模塊得到的殘差信號進行量化編 碼,得到增強窄帶編碼信號;發(fā)送模塊,用于發(fā)送該窄帶編碼模塊得到的基本 窄帶編碼信號和該量化編碼模塊得到的增強窄帶編碼信號。由于在增強窄帶編 碼信號中攜帶了解碼后的各解碼信號與語音信號的量化誤差信息,使得解碼端 能夠根據(jù)各解碼信號的量化誤差信息,還原出相應的語音信號,避免了在窄帶 編碼過程中各語音信號因量化編碼而導致的信息損失,從而提高了語音質(zhì)量, 增強了窄帶性 能。其中,量化編碼模塊包含以下子模塊歸一化子模塊,用于根據(jù)編碼端與 解碼端均可獲知的關聯(lián)信息,對得到的殘差信號進行歸一化;量化模塊,用于 對經(jīng)歸一化后的殘差信號進行量化。在具體實現(xiàn)中,關聯(lián)信息可以為N個解碼 信號的能量之和,或N個解碼信號的平均能量;或者,關聯(lián)信息為N個解碼信 號的幅度的絕對值之和,或N個解碼信號的平均絕對值。歸一化子模塊進行歸 一化的方式如下將與這N個解碼信號相對應的N個殘差信號,分別乘以該關 聯(lián)信息的倒數(shù),得到N個歸一化后的殘差信號。再或者,每個殘差信號均對應 一個關聯(lián)信息,該關聯(lián)信息為與該殘差信號相對應的解碼信號的幅度絕對值所 在值域區(qū)間內(nèi)的最大量化誤差。歸一化子模塊進行歸一化的方式如下將殘差 信號乘以對應的關聯(lián)信息的倒數(shù),得到歸 一化后的該殘差信號。本實施方式中的語音編碼發(fā)送裝置還包括正交鏡像濾波分析模塊和 MDCT編碼模塊。該正交鏡像濾波分析模塊用于對原始語音信號進行分析正交 鏡像濾波,得到低頻部分的窄帶語音信號和高頻部分的寬帶語音信號,并將該 窄帶語音信號輸出到該窄帶編碼模塊和該殘差信號獲取模塊,將該寬帶語音信 號輸出到該MDCT編碼模塊。該MDCT編碼模塊用于對寬帶語音信號進行 MDCT編碼,得到寬帶編碼信號。發(fā)送模塊將該窄帶編碼模塊得到的基本窄帶 編碼信號、量化編碼模塊得到的增強窄帶編碼信號、和MDCT編碼模塊得到寬 帶編碼信號,復用為一個碼流后發(fā)送。本發(fā)明的第七實施方式涉及一種語音接收解碼裝置,如圖14所示,包括 接收模塊,用于接收基本窄帶編碼信號和增強窄帶編碼信號;窄帶解碼模塊, 用于對該接收模塊收到的基本窄帶編碼信號進行窄帶解碼,得到基本窄帶解碼 信號;量化解碼模塊,用于對該接收模塊收到的增強窄帶編碼信號進行量化解 碼,得到殘差信號;語音信號獲取模塊,用于將該窄帶解碼模塊得到的基本窄 帶解碼信號分別與相應的殘差信號相加,得到窄帶語音信號。其中,量化解碼模塊包括以下子模塊解碼子模塊,用于對收到的增強窄 帶編碼信號進行量化解碼,得到歸一化后的殘差信號;歸一化還原子模塊,用 于根據(jù)編碼端與解碼端均可獲知的關聯(lián)信息,對歸 一化后的殘差信號進行歸一 化還原,得到殘差信號。該關聯(lián)信息可以是基本窄帶編碼信號中的N個解碼信 號的能量之和,或N個解碼信號的平均能量;或者,該關聯(lián)信息可以是基本窄 帶編碼信號中的N個解碼信號的幅度的絕對值之和,或N個解碼信號的平均絕 對值。歸一化還原子模塊進行歸一化還原的方式如下將與N個解碼信號相對 應的N個歸一化后的殘差信號,分別乘以該關聯(lián)信息,得到N個歸一化還原后 的殘差信號。再或者,每個歸一化后的殘差信號對應一個關聯(lián)信息,該關聯(lián)信 息為與該歸一化后的殘差信號相對應的解碼信號的幅度絕對值所在值域區(qū)間內(nèi) 的最大量化誤差。歸一化還原子模塊進行歸一化還原的方式如下將歸一化后 的殘差信號乘以對應的關聯(lián)信息,得到歸一化還原后的該殘差信號。本實施方式的語音接收解碼裝置中,還包括逆MDCT解碼模塊和正交鏡 像濾波綜合模塊。其中,逆MDCT解碼模塊用于對寬帶編碼信號進行逆MDCT 解碼,得到寬帶語音信號。接收模塊包含以下子模塊復用碼流接收子模塊,用于接收包含基本窄帶 編碼信號、增強窄帶編碼信號、和寬帶編碼信號的復用碼流;解復用子模塊, 用于將收到的復用碼流解復用為基本窄帶編碼信號、增強窄帶編碼信號、和寬 帶編碼信號,并將該基本窄帶編碼信號輸出到該窄帶解碼模塊,將該增強窄帶 編碼信號輸出到該量化解碼模塊,將該寬帶編碼信號輸出到該逆MDCT解碼模 塊。正交鏡像濾波綜合模塊,用于將該語音信號獲取模塊得到的窄帶語音信號, 和該逆MDCT解碼模塊得到的寬帶語音信號進行綜合正交鏡像濾波,得到語音 信號。綜上所述,在本發(fā)明的實施方式中,對語音信號進行窄帶編碼,得到基本 窄帶編碼信號。對該基本窄帶編碼信號進行解碼,得到解碼信號。用語音信號 和對應的解碼信號相減,得到殘差信號,對殘差信號進行量化編碼,得到增強 窄帶編碼信號,將增強窄帶編碼信號與基本窄帶編碼信號一起發(fā)送。由于該增 強窄帶編碼信號中攜帶了解碼后的各解碼信號與語音信號的量化誤差信息,使 得解碼端能夠根據(jù)各解碼信號的量化誤差信息,還原出相應的語音信號,避免 了在窄帶編碼過程中各語音信號因量化編碼而導致的信息損失,從而提高了語 音質(zhì)量,增強了窄帶性能。在對殘差信號進行量化編碼的過程中,先根據(jù)編碼端與解碼端均可獲知 的關聯(lián)信息,對殘差信號進行歸一化,再對經(jīng)歸一化后的殘差信號進行量化。 由于對殘差信號進行了歸一化,使得殘差信號的范圍被控制在預定的范圍之 內(nèi),進而節(jié)約了用于傳輸殘差信號的資源。而且,用于歸一化的關聯(lián)信息是 解碼端可知的,因此編碼端無需再將關聯(lián)信息發(fā)送給解碼端,進一步節(jié)約了傳輸資源。關聯(lián)信息可以為N個解碼信號的能量之和,或平均能量;或者,關聯(lián)信 息可以為N個解碼信號的幅度的絕對值之和,或平均絕對值。將與該N個解 碼信號相對應的N個殘差信號,分別乘以該關聯(lián)信息的倒數(shù),得到N個歸一 化后的殘差信號。關聯(lián)信息還可以是與殘差信號相對應的解碼信號的幅度絕 對值所在值域區(qū)間內(nèi)的最大量化誤差,殘差信號與關聯(lián)信息一一對應。將殘 差信號乘以相應的關聯(lián)信息的倒數(shù),得到歸一化后的該殘差信號。使得本發(fā) 明的實施方式可靈活實現(xiàn)。殘差信號的符號單獨傳輸,在進行歸一化時只要考慮殘差的絕對值即 可,簡化了歸一化的處理。根據(jù)當前網(wǎng)絡狀態(tài)裁減編碼信號,可以在網(wǎng)絡狀態(tài)較差時保證基本音質(zhì) 的通信,在網(wǎng)絡狀態(tài)較好時進行較高音質(zhì)的通信。在發(fā)生丟包時,可利用丟包前的窄帶語音預測出基音周期,根據(jù)預測的 基音周期恢復出丟失的窄帶語音信號和寬帶語音信號,使得丟包處寬帶語音 的性能得以提高。雖然通過參照本發(fā)明的某些優(yōu)選實施方式,已經(jīng)對本發(fā)明進行了圖示和 描述,但本領域的普通技術人員應該明白,可以在形式上和細節(jié)上對其作各 種改變,而不偏離本發(fā)明的精神和范圍。
權利要求
1.一種語音編碼發(fā)送方法,其特征在于,包含以下步驟對語音信號進行窄帶編碼,得到基本窄帶編碼信號;對所述基本窄帶編碼信號進行解碼,得到解碼信號;用所述語音信號和對應的所述解碼信號相減,得到殘差信號;對所述殘差信號進行量化編碼,得到增強窄帶編碼信號;發(fā)送所述基本窄帶編碼信號和增強窄帶編碼信號。
2. 根據(jù)權利要求1所述的語音編碼發(fā)送方法,其特征在于,在對所述 殘差信號進行量化編碼的步驟中,包含以下步驟根據(jù)編碼端與解碼端均可獲知的關聯(lián)信息,對所述殘差信號進行歸一化;對經(jīng)歸 一化后的所述殘差信號進行量化。
3,根據(jù)權利要求2所述的語音編碼發(fā)送方法,其特征在于,所述關聯(lián) 信息為N個所述解碼信號的能量之和,或N個所述解碼信號的平均能量;所述進行歸一化的步驟中包含以下子步驟將與所述N個解碼信號相對應的N個殘差信號,分別乘以所述關聯(lián)信 息的倒數(shù),得到N個歸一化后的殘差信號。
4.根據(jù)權利要求2所述的語音編碼發(fā)送方法,其特征在于,所述關聯(lián) 信息為N個所述解碼信號的幅度的絕對值之和,或N個所述解碼信號的平 均絕對值;所述進行歸一化的步驟中包含以下子步驟將與所述N個解碼信號相對應的N個殘差信號,分別乘以所述關聯(lián)信息的倒數(shù),得到N個歸一化后的殘差信號。
5. 根據(jù)權利要求2所述的語音編碼發(fā)送方法,其特征在于,每個所述 殘差信號對應一個所述關聯(lián)信息,該關聯(lián)信息為與該殘差信號相對應的所述 解碼信號的幅度絕對值所在值域區(qū)間內(nèi)的最大量化誤差;所述進行歸 一化的步驟中包含以下子步驟將所述殘差信號乘以對應的所述關聯(lián)信息的倒數(shù),得到歸一化后的該殘 差信號。
6. 根據(jù)權利要求1至5中任一項所述的語音編碼發(fā)送方法,其特征在 于,在所述對語音信號進行窄帶編碼的步驟之前還包含以下步驟對原始語音信號進行分析正交鏡像濾波,得到低頻部分的窄帶語音信號 和高頻部分的寬帶語音信號;所述對語音信號進行窄帶編碼的步驟中,對所述窄帶語音信號進行窄帶 編碼;所述分析正交鏡像濾波的步驟之后還包含以下步驟對所述寬帶語音信號進行改進型離散余弦變換MDCT編碼,得到寬帶 編碼信號;在所述發(fā)送的步驟中包含以下子步驟發(fā)送所述基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號。
7. 根據(jù)權利要求6所述的語音編碼發(fā)送方法,其特征在于,在所述發(fā) 送基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號的步驟之前,還包 含以下步驟根據(jù)當前網(wǎng)絡狀態(tài)判斷是否需要裁減編碼信號;如果判定為需要裁減編 碼信號,則發(fā)送所述基本窄帶編碼信號,或所述基本窄帶編碼信號和增強窄 帶編碼信號的組合,或所述基本窄帶編碼信號和寬帶編碼信號的組合;如果判定為不需要裁減編碼信號,則執(zhí)行所述發(fā)送基本窄帶編碼信號、增強窄帶 編碼信號和寬帶編碼信號的步驟。
8. 根據(jù)權利要求1至5中任一項所述的語音編碼發(fā)送方法,其特征在 于,在對所述殘差信號進行量化編碼的步驟中,對所述殘差信號的絕對值進 行所述量化編碼;所述方法還包含以下步驟將各所述殘差信號的符號信息發(fā)送給解碼端。
9. 一種語音接收解碼方法,其特征在于,包含以下步驟 接收基本窄帶編碼信號和增強窄帶編碼信號;對收到的所述基本窄帶編碼信號進行窄帶解碼,得到基本窄帶解碼信 號,并對收到的所述增強窄帶編碼信號進行量化解碼,得到殘差信號;將得到的所述基本窄帶解碼信號分別與相應的所述殘差信號相加,得到 窄帶語音信號。
10. 根據(jù)權利要求9所述的語音接收解碼方法,其特征在于,對收到的 所述增強窄帶編碼信號進行量化解碼的步驟中,包含以下步驟對收到的所述增強窄帶編碼信號進行量化解碼,得到歸一化后的殘差信號;根據(jù)編碼端與解碼端均可獲知的關聯(lián)信息,對所述歸一化后的殘差信號 進行歸一化還原,得到所述殘差信號。
11. 根據(jù)權利要求10所述的語音接收解碼方法,其特征在于,所述關 聯(lián)信息為所述基本窄帶編碼信號中的N個所述解碼信號的能量之和,或N 個所述解碼信號的平均能量;所述進行歸一化還原的步驟中,包含以下子步驟將與所述N個解碼信號相對應的N個歸一化后的殘差信號,分別乘以 所述關聯(lián)信息,得到N個歸一化還原后的所述殘差信號。
12. 根據(jù)權利要求10所述的語音接收解碼方法,其特征在于,所述關 聯(lián)信息為所述基本窄帶編碼信號中的N個所述解碼信號的幅度的絕對值之 和,或N個所述解碼信號的幅度的平均絕對值;所述進行歸一化還原的步驟中,包含以下子步驟將與所述N個解碼信號相對應的N個歸一化后的殘差信號,分別乘以 所述關聯(lián)信息,得到N個歸一化還原后的所述殘差信號。
13. 根據(jù)權利要求10所述的語音接收解碼方法,其特征在于,每個所 述歸 一化后的殘差信號對應 一個所述關聯(lián)信息,該關聯(lián)信息為與該歸 一化后 的殘差信號相對應的所述解碼信號的幅度絕對值所在值域區(qū)間內(nèi)的最大量 化誤差;所述進行歸一化還原的步驟中,包含以下子步驟將所述歸一化后的殘差信號乘以對應的所述關聯(lián)信息,得到歸一化還原 后的該殘差信號。
14. 根據(jù)權利要求9至13中任一項所述的語音接收解碼方法,其特征 在于,在所述接收基本窄帶編碼信號和增強窄帶編碼信號的步驟中,還包含 以下子步驟接收寬帶編碼信號;在所述接收基本窄帶編碼信號和增強窄帶編碼信號的步驟之后,還包含 以下步驟對收到的所述寬帶編碼信號進行逆MDCT解碼,得到寬帶語音信號;在得到所述寬帶語音信號和所述窄帶語音信號之后,還包含以下步驟將所述窄帶語音信號和所述寬帶語音信號進行綜合正交鏡像濾波,得到 語音信號。
15. 根據(jù)權利要求14所述的語音接收解碼方法,其特征在于,還包含 以下步驟在發(fā)生丟包時,利用丟包前的所述窄帶語音信號預測出基音周期;根據(jù)預測的所述基音周期,恢復出丟失的所述窄帶語音信號和所述寬帶 語音信號。
16. 根據(jù)權利要求15所述的語音接收解碼方法,其特征在于,在所述 進行綜合正交鏡像濾波的步驟中,包含以下子步驟將所述窄帶語音信號延時一個變換塊后,和所述寬帶語音信號進行綜合 正交鏡像濾波,得到語音信號。
17. 根據(jù)權利要求14所述的語音接收解碼方法,其特征在于,在所述 接收基本窄帶編碼信號、增強窄帶編碼信號和寬帶編碼信號的步驟之前,還 包含以子步驟根據(jù)當前網(wǎng)絡狀態(tài)判斷編碼信號是否被裁減,如果判定為編碼信號被裁 減,則接收所述窄帶編碼信號,或所述基本窄帶編碼信號和增強窄帶編碼信 號的組合,或所述基本窄帶編碼信號和寬帶編碼信號的組合;如果判定為編 碼信號未被裁減,則執(zhí)行所述接收基本窄帶編碼信號、增強窄帶編碼信號和 寬帶編碼信號的步驟。
18. 根據(jù)權利要求9至13中任一項所述的語音接收解碼方法,其特征 在于,還包含以下步驟接收來自編碼端的符號信息;所述將得到的所述基本窄帶解碼信號分別與相應的所述殘差信號相加 的步驟中,包含以下子步驟為所述殘差信號加上相應的符號信息;將得到的所述基本窄帶解碼信號分別與相應的添加上符號信息的所述殘差信號相加,得到所述窄帶語音信號。
19. 一種語音編碼發(fā)送裝置,其特征在于,包括 窄帶編碼模塊,用于對語音信號進行窄帶編碼,得到基本窄帶編碼信號; 窄帶解碼模塊,用于對所述窄帶編碼模塊得到的所述基本窄帶編碼信號進行解碼,得到解碼信號;殘差信號獲取模塊,用于將所述語音信號和對應的所述解碼信號相減, 得到殘差信號;量化編碼模塊,用于對所述殘差信號獲取模塊得到的所述殘差信號進行 量化編碼,得到增強窄帶編碼信號;發(fā)送模塊,用于發(fā)送所述窄帶編碼模塊得到的所述基本窄帶編碼信號和 所述量化編碼模塊得到的增強窄帶編碼信號。
20. 根據(jù)權利要求19所述的語音編碼發(fā)送裝置,其特征在于,所述量 化編碼模塊包含以下子模塊歸一化子模塊,用于根據(jù)編碼端與解碼端均可獲知的關聯(lián)信息,對得到 的所述殘差信號進行歸一化;量化模塊,用于對經(jīng)歸一化后的所述殘差信號進行量化。
21. 根據(jù)權利要求20所述的語音編碼發(fā)送裝置,其特征在于,所述關 聯(lián)信息為N個所述解碼信號的能量之和,或N個所述解碼信號的平均能量; 或者,所述關聯(lián)信息為N個所述解碼信號的幅度的絕對值之和,或N個所述 解碼信號的平均絕對值;所述歸一化子模塊進行歸一化的方式如下將與所述N個解碼信號相 對應的N個殘差信號,分別乘以所述關聯(lián)信息的倒數(shù),得到N個歸一化后 的殘差信號。
22. 根據(jù)權利要求20所述的語音編碼發(fā)送裝置,其特征在于,每個所 述殘差信號對應一個所述關聯(lián)信息,該關聯(lián)信息為與該殘差信號相對應的所 述解碼信號的幅度絕對值所在值域區(qū)間內(nèi)的最大量化誤差;所述歸一化子模塊進行歸一化的方式如下將所述殘差信號乘以對應的 所述關聯(lián)信息的倒數(shù),得到歸一化后的該殘差信號。
23. 根據(jù)權利要求19至22中任一項所述的語音編碼發(fā)送裝置,其特征 在于,還包括正交鏡像濾波分析模塊和MDCT編碼模塊;所述正交鏡像濾波分析模塊用于對原始語音信號進行分析正交鏡像濾 波,得到低頻部分的窄帶語音信號和高頻部分的寬帶語音信號,并將該窄帶 語音信號輸出到所述窄帶編碼模塊和所述殘差信號獲取模塊,將該寬帶語音 信號輸出到所述MDCT編碼模塊;所述MDCT編碼模塊用于對所述寬帶語音信號進行MDCT編碼,得到 寬帶編碼信號;所述發(fā)送模塊將所述窄帶編碼模塊得到的所述基本窄帶編碼信號、所述 量化編碼模塊得到的增強窄帶編碼信號、和所述MDCT編碼模塊得到寬帶 編碼信號,復用為一個碼流后發(fā)送。
24. —種語音接收解碼裝置,其特征在于,包括接收模塊,用于接收基本窄帶編碼信號和增強窄帶編碼信號;窄帶解碼模塊,用于對所述接收模塊收到的所述基本窄帶編碼信號進行 窄帶解碼,得到基本窄帶解碼信號;量化解碼模塊,用于對所述接收模塊收到的所述增強窄帶編碼信號進行 量化解碼,得到殘差信號;語音信號獲取模塊,用于將所述窄帶解碼模塊得到的所述基本窄帶解碼 信號分別與相應的所述殘差信號相加,得到窄帶語音信號。
25. 根據(jù)權利要求24所述的語音接收解碼裝置,其特征在于,所述量 化解碼模塊包括以下子模塊解碼子模塊,用于對收到的所述增強窄帶編碼信號進行量化解碼,得到 歸一化后的殘差信號;歸一化還原子模塊,用于根據(jù)編碼端與解碼端均可獲知的關聯(lián)信息,對 所述歸一化后的殘差信號進行歸一化還原,得到所述殘差信號。
26. 根據(jù)權利要求25所述的語音接收解碼裝置,其特征在于,所述關 聯(lián)信息為所述基本窄帶編碼信號中的N個所述解碼信號的能量之和,或N 個所述解碼信號的平均能量;或者,所述關聯(lián)信息為所述基本窄帶編碼信號中的N個所述解碼信號的幅度 的絕對值之和,或N個所述解碼信號的平均絕對值;所述歸一化還原子模塊進行歸一化還原的方式如下將與所述N個解 碼信號相對應的N個歸一化后的殘差信號,分別乘以所述關聯(lián)信息,得到N 個歸一化還原后的所述殘差信號。
27. 根據(jù)權利要求25所述的語音接收解碼裝置,其特征在于,每個所 述歸一化后的殘差信號對應一個所述關聯(lián)信息,該關聯(lián)信息為與該歸一化后 的殘差信號相對應的所述解碼信號的幅度絕對值所在值域區(qū)間內(nèi)的最大量 化誤差;所述歸一化還原子模塊進行歸一化還原的方式如下將所述歸一化后的 殘差信號乘以對應的所述關聯(lián)信息,得到歸 一化還原后的該殘差信號。
28. 根據(jù)權利要求24至27中任一項所述的語音接收解碼裝置,其特征 在于,還包括逆MDCT解碼模塊,用于對寬帶編碼信號進行逆MDCT解碼, 得到寬帶語音信號;所述接收模塊包含以下子模塊復用碼流接收子模塊,用于接收包含基本窄帶編碼信號、增強窄帶編碼信號、和寬帶編碼信號的復用碼流;解復用子模塊,用于將收到的所述復用碼流解復用為基本窄帶編碼信 號、增強窄帶編碼信號、和寬帶編碼信號,并將該基本窄帶編碼信號輸出到 所述窄帶解碼模塊,將該增強窄帶編碼信號輸出到所述量化解碼模塊,將該 寬帶編碼信號輸出到所述逆MDCT解碼模塊;所述裝置還包括正交鏡像濾波綜合模塊,用于將所述語音信號獲取模 塊得到的所述窄帶語音信號,和所述逆MDCT解碼模塊得到的所述寬帶語 音信號進行綜合正交鏡像濾波,得到語音信號。
全文摘要
本發(fā)明涉及通信領域,公開了一種語音編碼發(fā)送和接收解碼的方法及裝置,使得語音質(zhì)量得以提高。本發(fā)明中,對語音信號進行窄帶編碼,得到基本窄帶編碼信號。對該基本窄帶編碼信號進行解碼,得到解碼信號。用語音信號和對應的解碼信號相減,得到殘差信號,對殘差信號進行量化編碼,得到增強窄帶編碼信號,將增強窄帶編碼信號與基本窄帶編碼信號一起發(fā)送。在對殘差信號進行量化編碼的過程中,先根據(jù)編碼端與解碼端均可獲知的關聯(lián)信息,對殘差信號進行歸一化,再對經(jīng)歸一化后的殘差信號進行量化。
文檔編號G10L19/00GK101325058SQ20071012670
公開日2008年12月17日 申請日期2007年6月15日 優(yōu)先權日2007年6月15日
發(fā)明者清 張, 偉 李, 杜正中, 毅 楊, 晨 胡, 磊 苗, 許麗凈, 許劍峰 申請人:華為技術有限公司