專利名稱:轉(zhuǎn)換話音重現(xiàn)速率的裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種轉(zhuǎn)換話音速率的裝置,用以在任意速率下重現(xiàn)數(shù)字化的話音信號,而無需變換(改變)話音的音調(diào)。
本說明書中,“話音”和“話音信號”用于表示儀器或其他裝置產(chǎn)生的所有的聲學信號,不僅僅是指從人發(fā)出的聲音。
背景技術(shù):
作為一種將重現(xiàn)速率轉(zhuǎn)換成任意速率而無需變換話音音調(diào)的方法,一種PICOLA(Pointer Interval Control Overlap and Add,指針間隔控制重疊和疊加)方法已為人們所知。PICOLA的原理是由Morita、Naotaka和Itakura、Fumitada在日本1-4-14全國聲學會會議(1986年10月)上撰寫的“采用指針間隔控制重疊和疊加用于話音的時標修正算法及其評估(Time-Scale Modification Algorithm forSpeech by Use of Pointer Interval Control Overlap and Add(PICOLA)and itsEvaluation)”中引入的。
同樣,日本未經(jīng)審查的專利申請8-137491中揭示了PICOLA方法將話音信號劃分成幀而用很少的緩沖存儲器轉(zhuǎn)換重現(xiàn)速率的應(yīng)用。
圖9描繪的是用PICOLA方法轉(zhuǎn)換話音重現(xiàn)速率的傳統(tǒng)裝置的方框圖。在圖9所示轉(zhuǎn)換話音重現(xiàn)速率的裝置中,數(shù)字化話音信號被記錄在記錄介質(zhì)1上,幀形成部分2從記錄介質(zhì)1獲取具有預(yù)定長度LF取樣的幀中的話音信號。將幀形成部分2獲取的話音信號提供到音調(diào)周期計算部分6中暫時存儲在緩沖存儲器3內(nèi)。音調(diào)周期計算部分6計算話音信號的音調(diào)周期Tp,并將其提供到波形重疊部分4,與此同時把處理啟動位置的指針存儲在緩沖存儲器3內(nèi)。波形重疊部分4用輸入話音的音調(diào)周期重疊緩沖存儲器3中存儲的話音信號的波形,隨后將重疊的波形輸出到波形合成部分5內(nèi)。波形合成部分5合成來自緩沖存儲器3中存儲的話音信號波形的輸出話音信號波形和在波形重疊部分4處處理的重疊波形,以提供輸出話音。
在該轉(zhuǎn)換話音重現(xiàn)速率的裝置中,按照下面的過程轉(zhuǎn)換重現(xiàn)速率而不變換音調(diào)。
首先,按照圖10和圖11說明高速率重現(xiàn)的處理方法。圖中,PO是表示波形重疊處理幀開頭的指針。在波形重疊處理中,處理幀是一個LW取樣,其長度是兩個周期的話音音調(diào)周期Tp。同時,當輸入話音的速率是1,而要求的重現(xiàn)速率是r時,L是由下面的公式給出的取樣數(shù)。
L=Tp{1/(r-1)} (1)L是與輸出波形(c)的長度對應(yīng)的取樣,并且具有Tp+L取樣的輸入話音是重現(xiàn)作為以后要說明的L取樣的輸出話音的。因此,r=(Tp+L)/L已知,則給出公式(1)。
幀形成部分2從記錄介質(zhì)1獲取的輸入話音被存儲在緩沖存儲器3內(nèi)。同時,音調(diào)周期計算部分6計算輸入話音的音調(diào)周期Tp,將其輸入到波形重疊部分4。同時,音調(diào)周期計算部分6用公式(1)計算來自音調(diào)周期Tp的L、確定下一個處理過程起始位置的PO’,并將其提供到緩沖存儲器3,作為緩沖存儲器中的指針。
波形重疊部分4從來自緩沖存儲器3的指針PO表示的處理過程起始點獲取波形重疊處理幀LW(=2Tp)取樣的波形,按照三角形窗函數(shù)沿時間軸方向降低處理幀的第一部分(波形A),而沿時間軸方向增加處理幀的后面的部分(波形B),將波形A和波形B相加,隨后計算重疊的波形C。
波形合成部分5從輸入話音波形中去除波形重疊處理幀的波形(波形A+波形B),并插入圖10所示的重疊波形(波形C)來取代去除的波形。隨后,將輸入話音波形D加到重疊的波形后,直到PO’表示(P0+Tp+L)點的位置(這是PI表示合成波形上波形C中開頭+L點的位置的點)。另外,當r>2時P1存在于波形C中,在這種情況下,輸出波形C,直到由P1表示的位置。
結(jié)果,合成輸出波形(c)的長度是L取樣,隨后重現(xiàn)Tp+L的輸入取樣作為L取樣的輸出話音。下一個波形重疊處理過程是從輸入波形上的PO’點開始的。
圖11描繪的是用圖10說明的上述處理過程中緩沖存儲器3中存儲并由幀形成部分2形成幀的話音信號間的關(guān)系。
開始,緩沖存儲器3的波形重疊處理過程所必須的緩沖長度輸入話音最大音調(diào)周期Tp最大值的兩個周期。然而,由于輸入話音被劃分成具有預(yù)定幀長度LF用以輸入的取樣,所以,處理起始位置PO位于輸入話音第一個幀中的任意位置處,并且緩沖長度應(yīng)當是輸入幀長度的整數(shù)倍。因此,緩沖長度是大于(LF+2Tp最大值)的LF倍數(shù)的最小值。例如,當輸入幀長度LF是160個取樣,并且音調(diào)周期Tp最大值的最大值是145時,緩沖長度需要3LF=480個長度。
在緩沖存儲器中的處理過程中,每次輸入LF取樣緩沖存儲器的內(nèi)容就被移位,并且只有在第一幀中進入處理起始位置PO時才處理波形重疊。在其他時候,輸入信號是提供作為輸出信號而不處理的。
下面參照圖12描述低速率重現(xiàn)的方法。低速率重現(xiàn)時,PO是表示波形重疊處理幀開頭的指針。在波形重疊處理過程中,處理幀是一個具有兩個話音音調(diào)周期Tp長度的LW取樣。同時,當輸入話音的速率是1而要求的重現(xiàn)速率是r時,L是由下面的公式給出的取樣數(shù)。
L=Tp{r/(1-r)} (2)在低速率重現(xiàn)的情況下,L取樣的輸入話音是重現(xiàn)作為后文中將述及的Tp+L取樣的輸出話音。因此,已知r=L/(Tp+L),則有公式(2)。
波形重疊部分4按照三角窗函數(shù)沿時間軸的方向增加處理幀的第一部分(波形A),而沿時間方向降低處理幀的后面的部分(波形B),將波形A和波形B相加,并計算重疊的波形c。
波形合成部分5在如圖12所示的輸入信號波形(a)的波形A和波形B之間插入重疊的波形(波形C)。隨后,將輸入話音波形B加到重疊波形上,直到PO’表示(P0+L)點的位置(P1表示合成波形上波形C的開頭的位置和L點)。當r>0.5時,P1不在輸入話音波形B上,但處在從重疊的處理幀延續(xù)的波形D上,這時,輸出波形D,直到由PO’表示的位置。
結(jié)果,合成輸出波形(C)的長度是Tp+L取樣,接著將L取樣的輸入話音重現(xiàn)為Tp+L取樣的輸出話音。同時,從輸入波形的PO’點起開始下一個波形重疊處理。
緩沖存儲器3中存儲并由幀形成部分2形成幀的話音信號之間的關(guān)系與高速率重現(xiàn)的話音信號將的關(guān)系是相同的。
順便指出,在上述轉(zhuǎn)換話音重現(xiàn)速率的裝置中,取得輸入話音的音調(diào)周期,隨后根據(jù)音調(diào)周期執(zhí)行波形的重疊。按音調(diào)周期劃分的輸入話音稱為音調(diào)波形,并且,由于音調(diào)波形相互間具有的高相似形,它們是適合于用作波形重疊處理的。
然而,如果音調(diào)周期計算中出現(xiàn)計算錯誤,則相鄰音調(diào)波形間的差別增加,從而使波形重疊以后輸出話音的質(zhì)量降低。下面諸因素考慮作為產(chǎn)生音調(diào)周期計算差錯的主要原因。通常,計算的音調(diào)周期代表輸入話音的某一時間間隔(稱為音調(diào)周期分析時間間隔)。當在音調(diào)周期分析時間間隔內(nèi)戲劇性地出現(xiàn)音調(diào)周期的變化時,計算的音調(diào)周期和實際的音調(diào)周期間的差別增加。因此,為了抑制輸出話音質(zhì)量的下降,必須在波形重疊處理位置處得到最合適的音調(diào)波形。
發(fā)明概述本發(fā)明的實施考慮到上述事實,其目的是提供一種能夠降低重疊波形以轉(zhuǎn)換話音重現(xiàn)速率所引起的失真并改進輸出話音質(zhì)量的轉(zhuǎn)換話音重現(xiàn)速率的裝置。
為了實現(xiàn)上述目的,本發(fā)明中,話音重現(xiàn)速率是這樣進行的在輸入話音信號中或輸入殘留信號中選擇兩個波形,在這些信號中,具有相同長度的兩個相鄰波形間的波形差為計算重疊波形時的最小值;隨后,用一部分輸入話音信號或輸入殘留信號取而代之,或?qū)⑵洳迦氲捷斎朐捯粜盘柣蜉斎霘埩粜盘栔小?br>
按照本發(fā)明,可以選擇精確重疊的波形,從而改進了經(jīng)速率轉(zhuǎn)換的話音的質(zhì)量。同時,在本發(fā)明中,來自話音編碼裝置的輸出信息是這樣使用的,即,組合一個話音編碼裝置的譯碼器,該話音編碼裝置通過將話音信號劃分成代表頻譜信息、音調(diào)周期信息的線性預(yù)測系數(shù)和代表預(yù)測殘留的話音源信息,對話音信號進行編碼。
按照本發(fā)明,采用來自話音編碼裝置的輸出信息,可以大大減小轉(zhuǎn)換編碼話音信號的重現(xiàn)速率的計算成本。
本發(fā)明中,轉(zhuǎn)換話音重現(xiàn)速率的裝置含有暫時存儲數(shù)字化輸入話音信號的緩沖存儲器、將緩沖存儲器中存儲的話音波形進行疊加的波形重疊部分和從緩沖存儲器中的輸入話音波形和重疊的話音波形合成輸出話音波形的波形合成部分,從緩沖存儲器獲得具有相同長度的兩個相鄰波形的波形獲取部分,以及計算波形獲取部分獲得的兩個話音波形間的波形差異的波形差計算部分,其中,波形重疊部分選擇具有波形差計算部分計算的最小波形差的兩個話音波形進行重疊。
同時,在本發(fā)明中,還配置有計算代表輸入話音信號的頻譜信息的線性預(yù)測系數(shù)的線性預(yù)測分析部分,用計算的線性預(yù)測系數(shù)從輸入話音信號計算預(yù)測殘留信號的反濾波器,以及用線性預(yù)測系數(shù)從預(yù)測殘留信號合成話音信號的合成濾波器,其中,將反濾波器計算的預(yù)測殘留信號存儲在緩沖存儲器內(nèi),將波形合成部分計算的預(yù)測殘留信號輸出到合成濾波器內(nèi)。
因此,重現(xiàn)速率轉(zhuǎn)換處理可以用預(yù)測殘留信號進行,易于決定音調(diào)波形,使得可以準確地得到音調(diào)波形。改進了經(jīng)重現(xiàn)的話音的質(zhì)量。
同時,在本發(fā)明中,還組合有通過將話音信號劃分成代表頻譜信息、音調(diào)周期信息的線性預(yù)測系數(shù)和代表預(yù)測殘留的話音源信息而對話音信號進行編碼的話音編碼裝置,其中,代表預(yù)測殘留的話音源信息暫時存儲在緩沖存儲器內(nèi),并且波形獲取部分根據(jù)音調(diào)周期信息確定從緩沖存儲器獲得的話音波形的長度。
本發(fā)明中,配置有計算輸入話音信號的頻譜信息的線性預(yù)測系數(shù)的線性預(yù)測分析部分,用計算的線性預(yù)測系數(shù)從輸入話音信號計算預(yù)測殘留信號的反濾波器,插入線性預(yù)測系數(shù)的線性預(yù)測系數(shù)插入部分以及用線性預(yù)測系數(shù)從預(yù)測殘留信號合成話音信號的合成濾波器,其中,反濾波器計算的預(yù)測殘留信號暫時存儲在緩沖存儲器內(nèi),波形合成部分將經(jīng)合成的預(yù)測殘留信號輸出到合成濾波器內(nèi),線性預(yù)測系數(shù)內(nèi)插部分內(nèi)插線性預(yù)測系數(shù)使之對于合成預(yù)測殘留信號產(chǎn)生最合適的系數(shù),并且合成濾波器用該內(nèi)插線性預(yù)測系數(shù)輸出話音信號。
因此,用內(nèi)插線性預(yù)測系數(shù)合成輸出話音信號,使之對于合成預(yù)測殘留信號產(chǎn)生最合適的系數(shù),從而使話音質(zhì)量得到改進。
附圖簡述圖1是本發(fā)明第一個實施例的轉(zhuǎn)換話音重現(xiàn)速率的裝置的方框圖;圖2是本發(fā)明第一個實施例轉(zhuǎn)換重現(xiàn)速率的對象的波形圖;圖3是本發(fā)明第二個實施例轉(zhuǎn)換話音重現(xiàn)速率的裝置的方框圖;圖4是本發(fā)明第三個實施例轉(zhuǎn)換話音重現(xiàn)速率的裝置的方框圖;圖5是本發(fā)明第四個實施例轉(zhuǎn)換話音重現(xiàn)速率的裝置的方框圖;圖6是本發(fā)明第五個實施例轉(zhuǎn)換話音重現(xiàn)速率的裝置的方框圖;圖7是描繪處理幀的位置、函數(shù)形狀和權(quán)重以及重疊處理之間的關(guān)系的圖;圖8是本發(fā)明第六個實施例轉(zhuǎn)換話音重現(xiàn)速率的裝置的方框圖;圖9是轉(zhuǎn)換話音重現(xiàn)速率的傳統(tǒng)裝置的方框圖;圖10是在高速率重現(xiàn)時輸入波形、重疊波形和輸出波形之間的關(guān)系圖;圖11是形成幀的輸入信號、緩沖存儲器中的輸入信號和緩沖存儲器中移位的輸入信號之間的關(guān)系圖;圖12是描繪在低速率重現(xiàn)時輸入波形、重疊波形和輸出波形的圖。
實施本發(fā)明的最佳模式下面參照
本發(fā)明的實施例。(第一個實施例)圖1描繪的是本發(fā)明第一個實施例中轉(zhuǎn)換話音重現(xiàn)速率的裝置的功能方框。另外,圖1中具有與圖9中描繪的每一部分裝置相同功能的部分用相同的標記表示。
在這一轉(zhuǎn)換話音重現(xiàn)速率的裝置中,波形獲取部分7向緩沖存儲器3提供波形的起始位置和波形的長度,并從緩沖存儲器3獲取具有相同長度的相鄰的兩個(多個)話音波形。波形差計算部分8計算波形獲取部分7獲取的兩個話音波形間的波形差,選擇兩個波形具有的長度使波形差為最小,并確定為用作重疊處理的幀。隨后,波形重疊部分9重疊在波形差計算部分8處確定的兩個波形。
另外,以與前述圖9中描繪的相同的方式,將數(shù)字化話音信號記錄在記錄介質(zhì)1內(nèi),幀形成部分2從記錄介質(zhì)1獲取具有預(yù)定長度LF取樣的幀的話音信號,并將幀形成部分2獲取的話音信號暫時存儲在緩沖存儲器3中。同時,波形合成部分5從緩沖存儲器3中存儲的話音信號波形和在波形重疊部分9處處理的重疊波形合成輸出話音信號波形。
該裝置中記錄介質(zhì)1、幀形成部分2、緩沖存儲器3、波形重疊部分9和波形合成部分5的功能和為轉(zhuǎn)換重現(xiàn)速率而進行的處理過程與傳統(tǒng)裝置的是相同的。所以,這些裝置的描述從略,主要說明波形獲取部分7和波形差計算部分8的功能和確定重疊處理幀的過程。
圖2所示的波形獲取部分7從緩沖存儲器3,從處理起始位置的指針PO獲取具有相同長度Tc的兩個相鄰的波形(波形A和波形B),作為用于重疊處理幀的候選波形19。
波形差計算部分8計算波形A和波形B之間的波形差。下面的公式中給出了兩個波形之間的波形差Err,其中波形A為x(n),波形B為y(n),而n是取樣位置。
Err=∑{x(n)-y(n)}2(3)(從n=0到n=Tc-1求和)波形差計算部分8從緩沖存儲器3,從固定作為處理起始位置的指針PO獲取具有不同長度(取樣數(shù))的波形A和B的其他兩個相鄰波形,并計算兩個波形之間的波形差Err。
順序取兩個具有不同長度(取樣數(shù))的波形A和B來計算多個波形差Err。并選擇具有最小波形差Err的波形A和B的組合。
這樣,由于Err是波形長度Tc處取樣的差之和,所以不可能直接比較不同Tc長度的波形差。所以,例如,采用Err被Tc中的取樣數(shù)除的值,即某一取樣的平均差Err/Tc,可以比較差值。波形長度Tc中取樣數(shù)的范圍是預(yù)先確定的,例如,對于8kHz取樣的話音信號,16到160個取樣是合適的。通過改變預(yù)定范圍內(nèi)的波形長度,計算每一Tc的平均差Err/Tc,并進行比較,將具有最小平均差的Tc確定為要獲得的波形的長度。
波形重疊部分9獲取從波形差計算部分8選擇出來的兩個波形A和B作為重疊處理幀14,按照不同的三角窗函數(shù)單獨處理處理幀(波形A)和另一個處理幀(波形B),隨后通過重疊兩個波形產(chǎn)生重疊波形15。
波形合成部分5從緩沖存儲器3獲取輸入話音波形,并用重疊的波形15取代一部分輸入話音波形16,或根據(jù)重疊速率r將重疊波形15插入到輸入話音波形16中,以產(chǎn)生經(jīng)速率轉(zhuǎn)換的輸出話音17。
按照本發(fā)明的實施例,由于波形獲取部分7從緩沖存儲器3獲取一對相鄰的波形A和B作為用于合成的候選波形、逐漸改變要獲取的波形長度、計算每一對波形中波形間的波形差的Err/Tc,并選擇用于合成的具有最小波形差Err/Tc的波形對A和B,所以降低了重疊波形A和B所引起的失真,改善了輸出話音的質(zhì)量。(第二個實施例)第二個實施例描繪的是用顯著代表音調(diào)波形的殘留信號作處理的重現(xiàn)速率的轉(zhuǎn)換的情況。
圖3描繪的是本發(fā)明第二個實施例中轉(zhuǎn)換話音重現(xiàn)速率的裝置的功能方框。另外,圖3中具有與圖1和圖9中描繪的每一部分裝置相同功能的部分用相同的標記表示。
該用于轉(zhuǎn)換話音重現(xiàn)速率的裝置包含計算代表輸入話音信號的線性預(yù)測系數(shù)的線性預(yù)測分析部分30、用從輸入話音信號計算的線性預(yù)測系數(shù)計算預(yù)測殘留信號的反濾波器31和用來自預(yù)測從略信號得到的預(yù)測系數(shù)合成話音信號的合成濾波器32。本發(fā)明實施例中轉(zhuǎn)換話音重現(xiàn)速率的裝置的其他結(jié)構(gòu)與本發(fā)明的第一個實施例中的相同。
在上述結(jié)構(gòu)的轉(zhuǎn)換話音速率的裝置中,將在幀形成部分2處獲得的幀12中的輸入話音輸入到線性預(yù)測分析部分30和反濾波器31中。線性預(yù)測系數(shù)33是在線性預(yù)測分析部分30處從幀中的輸入話音12計算得到的,而殘留信號34是用反濾波器31處的線性預(yù)測系數(shù)33從輸入話音12計算得到的。
反濾波器31處計算的殘留信號34按照本發(fā)明第一個實施例中說明的轉(zhuǎn)換話音重現(xiàn)速率的處理過程,在緩沖存儲器3、波形獲取部分7、波形差計算部分8和波形重疊部分9處進行波形合成,并從波形合成部分5輸出作為合成殘留信號35。
合成濾波器32用從線性預(yù)測分析部分30提供的線性預(yù)測系數(shù)33,從合成殘留信號35計算輸出合成的話音36,用以輸出。
在上述本發(fā)明的實施例中,從預(yù)測殘留信號中獲取兩個波形并進行波形合成,這里的預(yù)測殘留信號是去除了由線性預(yù)測系數(shù)代表的頻譜包絡(luò)信息的輸入話音信號。由于該預(yù)測殘留信號比起原始的輸入信號更代表了一個音調(diào)波形,通過用本發(fā)明實施例中的殘留信號對話音重現(xiàn)速率進行處理轉(zhuǎn)換,可以準確地得到音調(diào)波形,并且可以改善重現(xiàn)話音的質(zhì)量。(第三個實施例)在第三個實施例中,通過將轉(zhuǎn)換話音重現(xiàn)速率的裝置與話音編碼裝置組合并在速率轉(zhuǎn)換處理時采用從話音編碼裝置提供的話音編碼信息,可以減少復(fù)雜的計算。
圖4描繪的是本發(fā)明實施例中轉(zhuǎn)換話音重現(xiàn)速率的裝置的功能方框。另外,圖4中具有與圖1、圖3和圖9中描繪的每一部分裝置相同功能的部分用相同的標記表示。
在該轉(zhuǎn)換話音重現(xiàn)速率的裝置中,本發(fā)明第二個實施例中的記錄介質(zhì)1、幀形成部分2、線性預(yù)測分析部分30和反濾波器31被含有上述部件的話音編碼裝置40的譯碼器取而代之。話音編碼裝置40的譯碼器具有對話音信號進行編碼的功能,從而將話音信號劃分成代表頻譜信息、音調(diào)周期信息和代表預(yù)測殘留的話音源信息的線性預(yù)測系數(shù)。作為上述話音編碼裝置,人們主要知道的是CELP(編碼激勵線性預(yù)測編碼),并且通常在象CELP的高效話音編碼裝置中,每一編碼信息是在一個幀內(nèi)編碼的。因此,由于從譯碼器40輸出的話音源信號41是一個具有由話音編碼裝置預(yù)先確定的長度的幀的信號,所以,可以直接用作對本發(fā)明的話音重現(xiàn)速率進行轉(zhuǎn)換的裝置的輸入。
在本發(fā)明這一實施例的轉(zhuǎn)換話音重現(xiàn)速率的裝置中,從譯碼器40輸出的幀41中的話音源信號被存儲在緩沖存儲器3中,音調(diào)周期信息42被輸入到波形獲取部分43內(nèi),而線性預(yù)測系數(shù)33被輸入到合成濾波器32中。
波形獲取部分43從緩沖存儲器3獲取具有長度Tc的相鄰波形A和B,并將多對具有不同長度的波形A和B順序提供到波形差計算部分8內(nèi)。同時,由于獲取波形具有長度Tc的范圍是按照波形獲取部分43處的音調(diào)周期信息42變化的,所以可以大大減少波形差的計算復(fù)雜性。同時,從譯碼器輸出的線性預(yù)測系數(shù)33用作合成濾波器32的輸入。
這樣,通過將話音信號劃分成代表頻譜信息、音調(diào)周期信息和代表預(yù)測殘留的話音源信息而對話音信號進行編碼的話音編碼裝置的譯碼器與本發(fā)明的轉(zhuǎn)換重現(xiàn)速率的裝置組合起來,可以采用從話音編碼裝置輸出的信息,并轉(zhuǎn)換在話音編碼裝置處編碼的話音信號的重現(xiàn)速率,并使得具有較少的計算復(fù)雜性。(第四個實施例)在本發(fā)明第四個實施例的轉(zhuǎn)換話音重現(xiàn)速率的裝置中,計算復(fù)雜性是通過將該裝置與話音編碼裝置相組合并采用從話音編碼裝置提供的話音編碼信息來實現(xiàn)的。
圖5描繪的是本發(fā)明這一實施例中轉(zhuǎn)換話音重現(xiàn)速率的裝置的功能方框。另外,圖5中具有與本發(fā)明第三個實施例中描繪的每一部分裝置相同功能的部分用相同的標記表示。
在用于轉(zhuǎn)換話音重現(xiàn)速率的裝置中,在話音編碼裝置40的譯碼器和緩沖存儲器3之間配置一個具有與由本發(fā)明的第三個實施例中含有的合成濾波器32的功能相同功能的合成濾波器32’。合成濾波器32’從一個幀中的語音源信號41和線性預(yù)測系數(shù)33產(chǎn)生譯碼話音信號,并將其作為合成話音信號44存儲在緩沖存儲器內(nèi)。由于話音源信號41是從譯碼器40輸入到一個幀中的,所以,話音信號44也是一個幀中的信號。因此,它可以直接用作轉(zhuǎn)換本發(fā)明的話音重現(xiàn)速率的裝置的輸入。
如上所述,通過將話音信號劃分成代表頻譜信息、音調(diào)周期信息和代表預(yù)測殘留的話音源信息而對話音信號進行編碼的話音編碼裝置40與本發(fā)明的轉(zhuǎn)換重現(xiàn)速率的裝置組合起來,可以采用從話音編碼裝置輸出的信息,并轉(zhuǎn)換在話音編碼裝置處編碼的話音信號的重現(xiàn)速率,并使得具有較少的計算復(fù)雜性。(第五個實施例)在轉(zhuǎn)換本發(fā)明第五個實施例的話音重現(xiàn)速率的裝置中,通過內(nèi)插線性預(yù)測系數(shù)使之成為合成殘留信號的最合適的系數(shù),可以提高話音質(zhì)量。
圖6描繪的是本發(fā)明實施例中轉(zhuǎn)換話音重現(xiàn)速率的裝置的功能方框。另外,圖6中具有與本發(fā)明每一實施例中描繪的每一部分裝置相同功能的部分用相同的標記表示。
該轉(zhuǎn)換話音重現(xiàn)速率的裝置包含計算代表輸入話音信號的頻譜信息的線性預(yù)測系數(shù)的線性預(yù)測分析部分30、用從輸入話音信號計算的線性預(yù)測系數(shù)33計算預(yù)測殘留信號34的反濾波器31和用來自輸入話音信號的線性預(yù)測系數(shù)合成話音信號的合成濾波器32,以及內(nèi)插入線性預(yù)測系數(shù)33使得產(chǎn)生用于合成殘留信號的最合適的系數(shù)的線性預(yù)測系數(shù)內(nèi)插部分60。裝置的其他結(jié)構(gòu)與本發(fā)明第一個實施例中的是相同的(圖1)。
在上述轉(zhuǎn)換話音重現(xiàn)速率的裝置中,從幀形成部分2處的記錄介質(zhì)獲得的幀12中的話音輸入被輸入到線性預(yù)測分析部分30。線性預(yù)測分析部分30計算從幀12中的輸入話音到輸入反濾波器31和線性預(yù)測系數(shù)插入部分60的線性預(yù)測系數(shù)33。反濾波器31用線性預(yù)測系數(shù)33計算來自輸入話音12的殘留信號。該殘留信號34是通過對本發(fā)明第一個實施例中說明的轉(zhuǎn)換話音重現(xiàn)速率的處理而波形合成的,并從波形合成部分5輸出作為合成殘留信號35。
線性預(yù)測系數(shù)內(nèi)插部分60從波形合成部分4接收處理幀位置信息61,并內(nèi)插線性預(yù)測系數(shù)33,使之成為合成殘留信號35最合適的系數(shù)。內(nèi)插的線性預(yù)測系數(shù)62被輸入到合成濾波器32,并從合成殘留信號35合成輸出話音信號36。
下面參照圖7說明內(nèi)插線性預(yù)測系數(shù)33使之成為合成殘留信號35最合適的系數(shù)的例子。
如圖7A所示,假設(shè)計算合成殘留信號35的處理幀跨越輸入幀1、2和3。假設(shè)用于重疊波形的窗函數(shù)的波形具有如圖7B所示的波形和權(quán)重。因此,如圖7C所示,考慮到窗函數(shù)波形,重疊處理所產(chǎn)生的重疊波形中包括的數(shù)據(jù)量是由w1、w2和w3加權(quán)的時間間隔F1、F2和F3中所包括數(shù)據(jù)量。以該重疊波形中包括的原始數(shù)據(jù)量為基礎(chǔ),按照下面的公式得到內(nèi)插的線性預(yù)測系數(shù)62。
(內(nèi)插的線性預(yù)測系數(shù))=(幀1的線性預(yù)測系數(shù))×(權(quán)重w1)+(幀2的線性預(yù)測系數(shù))×(權(quán)重w2)+(幀3的線性預(yù)測系數(shù))×(權(quán)重w3)這里,w1+w2+w3=1。
另外,有關(guān)權(quán)重w1、w2和w3,要考慮的因素不僅是窗函數(shù)波形,而且是每一幀1、2和3的線性預(yù)測系數(shù)的相似形和其他的因素。并且作為要計算的內(nèi)插線性預(yù)測系數(shù),計算的不僅是一個系數(shù),而是有多個系數(shù),這些系數(shù)是通過將重疊的波形劃分成多個部分并計算每一部分的最合適的內(nèi)插線性預(yù)測系數(shù)而獲得的。同時,在處理線性預(yù)測系數(shù)的處理中,通過將每一線性預(yù)測系數(shù)轉(zhuǎn)換成適合于內(nèi)插處理的LSP等參數(shù)、對經(jīng)轉(zhuǎn)換的LSP參數(shù)進行內(nèi)插處理以及將計算結(jié)果重新轉(zhuǎn)換成線性預(yù)測系數(shù)來改善性能。(第六個實施例)在用于本發(fā)明第六個實施例中轉(zhuǎn)換重現(xiàn)速率的裝置中,通過將其與話音編碼裝置組合并采用從話音編碼裝置提供的話音編碼信息,可以使計算量減少。
圖8描繪的是本發(fā)明的實施例中轉(zhuǎn)換話音重現(xiàn)速率的裝置的功能方框。
在該轉(zhuǎn)換話音重現(xiàn)速率的裝置中,通過用本發(fā)明第五個實施例中的記錄介質(zhì)1和幀形成部分2來取代,配置用在第三個實施例中通過將話音信號劃分成代表頻譜信息、音調(diào)周期信息和代表預(yù)測殘留的話音源信息的信息預(yù)測系數(shù)來對話音信號進行編碼的話音編碼裝置(譯碼器40)。
從譯碼器40輸出的幀41中的話音源信號被輸入到緩沖處理器3,而線性預(yù)測系數(shù)33被輸入到線性預(yù)測系數(shù)內(nèi)插入部分60。同時,音調(diào)周期信息42內(nèi)插入到波形獲取部分43,并相應(yīng)于音調(diào)周期信息42轉(zhuǎn)換波形獲取部分43處獲取的波形的長度Tc的范圍。按照這樣,由于要獲取的波形的長度Tc的范圍有限,可以大大減少獲得波形差的計算復(fù)雜性。
按照上述本發(fā)明的實施例,通過將話音信號劃分成代表頻譜信息、音調(diào)周期信息和代表預(yù)測殘留的話音源信息而對話音信號進行編碼的話音編碼裝置40與本發(fā)明的轉(zhuǎn)換重現(xiàn)速率的裝置組合起來,可以采用從話音編碼裝置輸出的信息,并轉(zhuǎn)換在話音編碼裝置處編碼的話音信號的重現(xiàn)速率,并使得具有較少的計算復(fù)雜性。(第七個實施例)
本發(fā)明的轉(zhuǎn)換話音重現(xiàn)速率的裝置是用軟件來實現(xiàn)的,軟件中進行處理的算規(guī)是用編程語言來描述的。通過將程序記錄在記錄介質(zhì)(如軟盤FD)上,將記錄介質(zhì)與通用信號處理裝置如個人計算機等相連,并執(zhí)行程序,就實現(xiàn)了本發(fā)明轉(zhuǎn)換話音重現(xiàn)速率的裝置的功能。
本發(fā)明并非僅限于上述實施例,本發(fā)明也可以也可以在本發(fā)明的范圍內(nèi)用改進的實施例來實現(xiàn)。
工業(yè)應(yīng)用性如上所述,本發(fā)明轉(zhuǎn)換話音重現(xiàn)速率的裝置可以用來在任何速率下重現(xiàn)記錄介質(zhì)中記錄的話音信號而無需變換話音音調(diào),并可以用來改進輸出話音的質(zhì)量。
權(quán)利要求
1.一種轉(zhuǎn)換話音重現(xiàn)速率的裝置,其特征在于,它包含波形選擇裝置,用來從輸入話音信號的話音波形中選擇出具有相同長度和最小波形差的相鄰兩個話音波形;波形重疊裝置,用來重疊在所述波形選擇裝置處選擇的所述兩個話音波形;以及波形合成裝置,通過用所述重疊的話音波形取代所述輸入話音的所述一部分波形或?qū)⑺鲋丿B的話音波形插入到所述輸入話音的所述話音波形中來產(chǎn)生經(jīng)速率轉(zhuǎn)換的輸出話音波形。
2.如權(quán)利要求1所述的轉(zhuǎn)換話音重現(xiàn)速率的裝置,其特征在于,所述選擇裝置包括獲取裝置,用來從緩沖存儲器獲取多對具有相同長度的相鄰兩個話音波形,所述緩沖存儲器中存儲有所述輸入話音信號的話音波形數(shù)據(jù),并且每一對波形的長度是不相同的;以及從所述獲取裝置自所述緩沖存儲器獲取的多個話音波形對中檢測出具有最小波形差的一對話音波形的裝置。
3.如權(quán)利要求1所述的轉(zhuǎn)換話音重現(xiàn)速率的裝置,其特征在于,所述波形選擇裝置將顯著代表音調(diào)波形的預(yù)測殘留信號的波形數(shù)據(jù)用作所述輸入話音信號的話音波形數(shù)據(jù)。
4.如權(quán)利要求3所述的轉(zhuǎn)換話音重現(xiàn)速率的裝置,其特征在于,所述裝置包含線性預(yù)測分析裝置,用來計算所述輸入話音信號的頻譜信息的線性預(yù)測系數(shù);反濾波器,用所述計算的線性預(yù)測系數(shù)從所述輸入話音信號計算所述預(yù)測殘留信號;以及合成濾波器,用所述線性預(yù)測系數(shù),從所述波形合成裝置輸出的合成殘留信號中合成話音信號。
5.如權(quán)利要求4所述的轉(zhuǎn)換話音重現(xiàn)速率的裝置,其特征在于,所述裝置還包含線性預(yù)測系數(shù)內(nèi)插裝置,用來內(nèi)插在所述線性預(yù)測分析裝置處計算的所述線性預(yù)測系數(shù),使之成為所述合成殘留信號最合適的系數(shù);并且所述合成濾波器用所述內(nèi)插的線性預(yù)測系數(shù)合成輸出話音信號。
6.如權(quán)利要求1所述的轉(zhuǎn)換話音重現(xiàn)速率的轉(zhuǎn)換,其特征在于,所述裝置用話音編碼裝置的輸出波形進行速率轉(zhuǎn)換處理,所述話音編碼裝置通過將話音信號劃分成代表頻譜信息、音調(diào)信息的線性預(yù)測系數(shù)和代表預(yù)測殘留的話音源信息對所述話音信號進行編碼。
7.如權(quán)利要求6所述的轉(zhuǎn)換話音重現(xiàn)速率的裝置,其特征在于,所述波形選擇裝置包含獲取裝置,用來從緩沖存儲器獲取具有相同長度的多對相鄰的兩個話音波形,所述緩沖存儲器中存儲有所述輸入話音源信息,每一對二話音波形的長度是不同的;所述獲取裝置還用來根據(jù)所述音調(diào)周期信息設(shè)置要獲取的波形的長度;以及檢測出一對話音波形的裝置,所述話音波形對中,二波形間的波形差是由所述獲取裝置從所述緩沖存儲器獲取的多對話音波形中最小的。
8.如權(quán)利要求7所述的轉(zhuǎn)換話音重現(xiàn)速率的裝置,其特征在于,所述裝置包含合成濾波器,用所述線性預(yù)測系數(shù)從合成殘留信號中合成一話音信號;并且所述合成殘留信號從所述波形合成裝置輸入到所述合成濾波器。
9.如權(quán)利要求8所述的轉(zhuǎn)換話音重現(xiàn)速率的裝置,其特征在于,所述裝置包含線性預(yù)測系數(shù)內(nèi)插裝置,用來插入所述話音編碼裝置的輸出信息中包括的所述線性預(yù)測系數(shù),使之成為所述合成殘留信號最合適的系數(shù);并且所述合成濾波器用所述內(nèi)插的線性預(yù)測系數(shù)合成輸出話音信號。
10.如權(quán)利要求6所述的轉(zhuǎn)換話音重現(xiàn)速率的裝置,其特征在于,所述裝置包含合成濾波器,用于所述話音編碼裝置的所述輸出信息中包括的線性預(yù)測系數(shù),從所述話音編碼裝置的所述輸出信息中包括的話音源信息合成一個合成話音信號;并且所述合成話音信號被提供到所述波形選擇裝置。
11.如權(quán)利要求10所述的轉(zhuǎn)換話音重現(xiàn)速率的裝置,所述波形選擇部分包含獲取裝置,用來從緩沖存儲器中獲取多對具有相同長度的相鄰兩個話音波形,所述緩沖存儲器中存儲有所述輸入話音信號的話音波形數(shù)據(jù),每一對二波形的長度是不同的;所述獲取裝置還用來根據(jù)所述音調(diào)周期信息設(shè)置要獲取的波形的長度范圍;以及檢測一對話音波形的裝置,其中,二波形間的波形差是所述獲取裝置從所述緩沖存儲器獲取的多對話音波形的最小值。
12.一種轉(zhuǎn)換話音重現(xiàn)速率的方法,其特征在于,它包含下述步驟選擇具有相同長度的相鄰兩個話音波形和與輸入話音信號的話音波形的最小波形差;重疊所述選擇的兩個話音波形;以及通過用所述重疊的話音波形取代所述輸入話音的一部分所述話音波形或?qū)⑺鼋?jīng)重疊的話音波形插入到所述輸入話音的所述話音波形中來產(chǎn)生經(jīng)速率轉(zhuǎn)換的輸出話音波形。
13.如權(quán)利要求12所述的轉(zhuǎn)換話音重現(xiàn)速率的方法,其特征在于,轉(zhuǎn)換話音重現(xiàn)速率的所述方法包含下述步驟從緩沖存儲器獲取多對具有相同長度的相鄰兩個話音波形的獲取手段,所述緩沖存儲器中,存儲有所述輸入話音信號的話音波形數(shù)據(jù),每一對二波形的長度是不同的;以及檢測一對話音波形的手段,所述話音波形中二波形間的波形差是由所述緩沖存儲器獲取的多對所述話音波形的最小值。
14.一種操作計算機的計算機程序產(chǎn)品,其特征在于,所述計算機程序包含計算機可讀介質(zhì);第一程序指令裝置,用來向一計算機處理器發(fā)指令,從輸入話音信號的話音波形中選擇出具有相同長度和最小波形差的相鄰兩個話音波形;第二程序指令裝置,用來向一計算機處理器發(fā)指令,對所述選擇的兩個話音波形進行重疊處理;并且每一所述波形指令裝置以可執(zhí)行形式記錄在所述介質(zhì)上,并且可以裝入計算機存儲器內(nèi)由相關(guān)的處理器執(zhí)行。
15.如權(quán)利要求14所述的操作計算機的計算機程序產(chǎn)品,其特征在于,所述第一程序指令包含第三程序指令裝置,用來向一計算機處理器發(fā)指令,從一緩沖存儲器中獲取具有相同長度的多對相鄰二話音波形,所述緩沖存儲器中存儲有所述輸入話音信號的話音波形數(shù)據(jù),每一對二話音波形是不同的;以及第四程序指令裝置,用來向計算機處理器發(fā)指令,用以從由所述第三程序指令手段從所述緩沖存儲器獲得的多對話音波形中檢測出二波形間的波形差為最小的一對話音波形。
全文摘要
在轉(zhuǎn)換話音重現(xiàn)速率的裝置中,話音重現(xiàn)速率是這樣來轉(zhuǎn)換的:選擇具有相同長度的二相鄰波形間的波形差為最小的輸入話音信號或輸入殘留信號的兩個波形,通過將這兩個波形重疊來計算重疊的波形,隨后用其替代一部分輸入話音信號或輸入殘留信號,或?qū)⒅丿B的波形插入到輸入話音信號或輸入殘留信號中。
文檔編號G10L21/04GK1208490SQ9719166
公開日1999年2月17日 申請日期1997年11月10日 優(yōu)先權(quán)日1996年11月11日
發(fā)明者田中直也, 竹田博昭 申請人:松下電器產(chǎn)業(yè)株式會社