專利名稱:在基于修正離散余弦變換的譯碼器與異質(zhì)譯碼器間轉(zhuǎn)換的編碼設(shè)備和解碼設(shè)備的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種設(shè)備與方法,其用于在把基于修正離散余弦變換(MDCT)的音頻譯碼器和不同的語音/音頻譯碼器相結(jié)合來編解碼音頻信號時,減少在執(zhí)行不同類型譯碼器轉(zhuǎn)換時生成的扭曲(artifact)。
背景技術(shù):
當(dāng)根據(jù)輸入信號的特征而對語音和音頻相結(jié)合的輸入信號應(yīng)用不同的編碼/解碼方法時,可改善性能和音質(zhì)。例如,對具有語音信號相似特征的信號應(yīng)用基于碼激勵線性預(yù)測 CELP 的編碼器(Code Excited Linear Prediction-based encoder),而對與音頻信號相同的信號應(yīng)用基于變頻的編碼器(frequency conversion-based encoder),是有效率的。通過應(yīng)用上面所述的概念,可開發(fā)統(tǒng)一語音和音頻編碼USAC(Unified Speech and Audio Coding)。該USAC可不斷地接收輸入信號并在特定時間分析輸入信號。然后, USAC可通過根據(jù)輸入信號的特征進(jìn)行切換來應(yīng)用不同類型的編碼設(shè)備,來編碼輸入信號。USAC中的信號切換(signal switching)過程中,會生成信號扭曲(signal artifact) 0由于USAC為每個區(qū)塊編碼輸入信號,所以在應(yīng)用不同類型的編碼時會生成塊扭曲(blocking artifact) 0為了克服這種缺點(diǎn),USAC可在應(yīng)用不同編碼時對塊應(yīng)用窗口, 來執(zhí)行重疊相加操作。但是,這種情況下,可能會因?yàn)橹丿B而需要額外的比特流信息,且當(dāng)頻繁出現(xiàn)切換時,用于消除塊扭曲的額外的比特流可能會增加。當(dāng)比特流增加,編碼效率會降低。特別是,USAC可采用基于修正離散余弦變換(MDCT)的編碼設(shè)備來編碼音頻特征信號。MDCT方式可將時域的輸入信號變換為頻域的輸入信號,并在塊間執(zhí)行重疊相加操作。 MDCT方式具有即使執(zhí)行重疊相加操作,比特率也可能不會增加的優(yōu)點(diǎn),但存在可能會在時域中生成混疊的缺點(diǎn)。在這種情況下,基于MDCT方式,50 %重疊相加操作會被對相鄰塊執(zhí)行來還原輸入信號。也就是說,要被輸出的當(dāng)前塊可基于前一個塊的輸出結(jié)果被解碼。但是,當(dāng)前一個塊沒有使用MDCT方式的USAC被編碼時,使用MDCT方式編碼的當(dāng)前塊,可能無法通過重疊相加操作解碼,因?yàn)榍耙粋€塊的MDCT信息可能無法使用。因此,在切換之后使用MDCT方式編碼當(dāng)前塊時,USAC可能會額外要求前一個塊的MDCT信息。當(dāng)頻繁發(fā)生切換時,用于解碼的額外的MDCT信息比例可增加至切換量。在這種情況下,比特率會由于額外的MDCT信息而增加,而編碼效率可能會明顯降低。因此,需要一種方法,來在切換過程中去除塊扭曲并盡可能減少額外的MDCT信息。
發(fā)明內(nèi)容
本發(fā)明的一個方面,提供了一種編碼方法及設(shè)備和解碼方法及設(shè)備,其可去除塊信號扭曲并盡可能減少切換時所需的MDCT信息。根據(jù)本發(fā)明的一個方面,提供了第一編碼單元,其根據(jù)不同于基于MDCT的譯碼方式(Modified Discrete Cosine Transform-based coding scheme)白勺異質(zhì)譯石馬方式(hetero coding scheme)來編碼輸入信號的語音特征信號(speech characteristic signal);和第二編碼單元,其根據(jù)基于MDCT的譯碼方式來編碼輸入信號的音頻特征信號 (audio characteristic signal) 0當(dāng)所述輸入信號的當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點(diǎn)(folding point)時,所述第二編碼單元,可通過應(yīng)用不超過所述折點(diǎn)的分析窗口來執(zhí)行編碼。折點(diǎn)可以是當(dāng)MDCT和反MDCT(IMDCT =Inverse MDCT) 被執(zhí)行時,混疊信號被折疊處的區(qū)域。當(dāng)執(zhí)行N點(diǎn)MDCT(N-point MDCT)時,折點(diǎn)可位于Ν/4 和3Ν/4點(diǎn)處。折點(diǎn)可以是與MDCT相關(guān)的眾所周知的特征的任何一個,用于折點(diǎn)的數(shù)學(xué)基礎(chǔ)(mathematical basis)在此將不做說明。另外,MDCT和折點(diǎn)的概念的描述,將參照圖5 詳細(xì)說明。此外,為方便說明,當(dāng)前一個幀信號是語音特征信號而當(dāng)前幀是音頻特征信號時, 當(dāng)連接兩種不同類型特征的信號時使用的折點(diǎn),以下可稱為“發(fā)生切換處的折點(diǎn)”。同時,當(dāng)后一個幀信號是語音特征信號而當(dāng)前幀信號是音頻特征信號時,在連接兩個不同類型特征的信號時使用的折點(diǎn),以下可稱為“發(fā)生切換處的折點(diǎn)”。根據(jù)本發(fā)明的一個方面,提供了一種編碼設(shè)備,包括窗口處理單元,其對輸入信號的當(dāng)前幀應(yīng)用分析窗口 ;MDCT變換單元,其針對應(yīng)用了分析窗口的當(dāng)前幀執(zhí)行MDCT變換;和比特流生成單元,其編碼已進(jìn)行了 MDCT變換的當(dāng)前幀并生成輸入信號的比特流。當(dāng)所述輸入信號的當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點(diǎn)時,所述窗口處理單元應(yīng)用不超過折點(diǎn)的分析窗口。根據(jù)本發(fā)明的一個方面,提供了一種解碼設(shè)備,包括第一解碼單元,其根據(jù)不同于基于MDCT的譯碼方式的異質(zhì)譯碼方式來解碼被編碼的輸入信號的語音特征信號;第二解碼單元,其根據(jù)基于MDCT的譯碼方式來解碼被編碼的輸入信號的音頻特征信號;和塊補(bǔ)償單元,其針對第一解碼單元的結(jié)果和第二解碼單元的結(jié)果來執(zhí)行塊補(bǔ)償并還原輸入信號。當(dāng)所述輸入信號的當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點(diǎn)時,所述塊補(bǔ)償單元應(yīng)用不超過所述折點(diǎn)的合成窗口。根據(jù)本發(fā)明的一個方面,提供一種解碼設(shè)備,包括塊補(bǔ)償單元,當(dāng)輸入信號的當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點(diǎn)時,其對所述當(dāng)前幀和從語音特征信號中提取出的額外的信息分別應(yīng)用合成窗口,來還原輸入信號。技術(shù)效果根據(jù)本發(fā)明的一個方面,提供了一種編碼方法及設(shè)備和解碼方法及設(shè)備,其可減少根據(jù)輸入信號的特征在不同類型的譯碼器之間發(fā)生切換時所需的額外MDCT信息,并去除塊信號扭曲。此外,根據(jù)本發(fā)明的一個方面,提供了一種編碼方法及設(shè)備和解碼方法及設(shè)備,其可減少根據(jù)輸入信號的特征在不同類型的譯碼器之間發(fā)生切換時所需的額外MDCT信息, 并阻止比特率增加,改善編碼效率。
圖1是示出根據(jù)本發(fā)明的一實(shí)施例的編碼設(shè)備和解碼設(shè)備的框圖;圖2是示出根據(jù)本發(fā)明的一實(shí)施例的編碼設(shè)備的配置的框圖;圖3是示出根據(jù)本發(fā)明的一實(shí)施例的通過第二編碼單元來編碼輸入信號的操作的示圖;圖4是示出根據(jù)本發(fā)明的一實(shí)施例的通過窗口處理來編碼輸入信號的操作的示圖;圖5是示出根據(jù)本發(fā)明的一實(shí)施例的MDCT (Modified Discrete Cosine Transform,修正離散余弦變換)操作的示圖;圖6是示出根據(jù)本發(fā)明的一實(shí)施例的異質(zhì)譯碼操作C1、C2的示圖;圖7是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中生成比特流操作的示圖;圖8是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中通過窗口處理來編碼輸入信號的操作的示圖;圖9是示出根據(jù)本發(fā)明的一實(shí)施例的在C2中生成比特流操作的示圖;圖10是示出根據(jù)本發(fā)明的一實(shí)施例的在C2中通過窗口處理來編碼輸入信號的操作的示圖;圖11是示出根據(jù)本發(fā)明的一實(shí)施例的當(dāng)輸入信號被編碼時應(yīng)用的額外信息的示圖;圖12是示出根據(jù)本發(fā)明的一實(shí)施例的解碼設(shè)備的配置的框圖;圖13是示出根據(jù)本發(fā)明的一實(shí)施例的通過第二解碼單元來解碼比特流的操作的示圖;圖14是示出根據(jù)本發(fā)明的一實(shí)施例的通過重疊相加操作提取輸出信號的操作的示圖;圖15是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中生成輸出信號的操作的示圖;圖16是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中的塊補(bǔ)償操作的示圖;圖17是示出根據(jù)本發(fā)明的一實(shí)施例的在C2中生成輸出信號的操作的示圖;和圖18是示出根據(jù)本發(fā)明的一實(shí)施例的在C2中的塊補(bǔ)償操作的示圖。
具體實(shí)施例方式現(xiàn)在將參照附圖對本發(fā)明的實(shí)施例進(jìn)行詳細(xì)描述,所述實(shí)施例的示例在附圖中被示出,其中相同的參照數(shù)字始終表示相同的元素。下面將參照數(shù)字描述實(shí)施例,以對本發(fā)明進(jìn)行說明。圖1是示出根據(jù)本發(fā)明的一實(shí)施例的編碼設(shè)備101和解碼設(shè)備102的框圖。所述編碼設(shè)備101可通過為每個塊編碼輸入信號生成比特流。在這種情況下,編碼設(shè)備101可編碼語音特征信號和音頻特征信號。語音特征信號可具有與嗓音信號相似的特征,音頻特征信號可具有與音頻信號相似的特征。編碼結(jié)果,生成輸入信號的相關(guān)比特流,并被傳送到解碼設(shè)備102。解碼設(shè)備102可通過解碼比特流來生成輸出信號,并由此還原被編碼的輸入信號。具體來說,編碼設(shè)備101可分析不斷輸入的信號的狀態(tài),并根據(jù)分析的結(jié)果進(jìn)行切換來應(yīng)用對應(yīng)輸入信號的特征的編碼方式。由此,編碼設(shè)備101可編碼應(yīng)用了異質(zhì)譯碼方式處的塊。例如,編碼設(shè)備101可根據(jù)碼激勵線性預(yù)測CELP(Code Excited Linear Prediction)方式編碼語音特征信號并根據(jù)修正離散余弦變換MDCT方式編碼音頻特征信號。相反,解碼設(shè)備102,可通過根據(jù)CELP方式來解碼根據(jù)CELP方式編碼的輸入信號,并根據(jù)MDCT方式來解碼根據(jù)MDCT方式編碼的輸入信號,來還原輸入信號。在這種情況下,當(dāng)輸入信號被從語音特征信號切換到音頻特征信號時,編碼設(shè)備 101可通過從CELP方式切換到MDCT方式來進(jìn)行編碼。由于每個塊都進(jìn)行編碼,可能會生成塊扭曲。在這種情況下,解碼設(shè)備102可通過在塊間進(jìn)行重疊相加操作來去除塊扭曲。此外,當(dāng)輸入信號的當(dāng)前塊根據(jù)MDCT方式被編碼時,還原輸入信號需要前一個塊的MDCT信息。但是,當(dāng)前一個塊是根據(jù)CELP方式被編碼時,由于前一個塊的MDCT信息不存在,所以根據(jù)MDCT方式會無法還原當(dāng)前塊。因此,需要前一個塊的額外的MDCT信息。此外,所述編碼設(shè)備101可減少額外的MDCT信息從而可以防止比特率增加。圖2是示出根據(jù)本發(fā)明的一實(shí)施例的編碼設(shè)備的配置的框圖。參照圖2,編碼設(shè)備101可包括塊延遲單元201、狀態(tài)分析單元202、信號切割單元 203、第一編碼單元204、和第二編碼單元205。塊延遲單元201可為每個塊延遲輸入信號。輸入信號可以為每個塊被處理用來編碼。塊延遲單元201可后退延遲(_)或向前延遲(+)輸入的當(dāng)前塊。狀態(tài)分析單元202可確定輸入信號的特征。例如,狀態(tài)分析單元202可決定輸入信號是語音特征信號還是音頻特征信號。在這種情況下,狀態(tài)分析單元202可輸出控制參數(shù)。該控制參數(shù)可用于確定哪些編碼方式用于編碼輸入信號的當(dāng)前塊。例如,狀態(tài)分析單元202可分析輸入信號的特征,并將信號周期對應(yīng)下列狀態(tài)的信號確定為語音特征信號,即(1)呈現(xiàn)出清晰并穩(wěn)定諧波分量的穩(wěn)定諧波 SH(steady-harmonic)狀態(tài);( 在低頻率帶寬呈現(xiàn)出強(qiáng)大穩(wěn)定特征且呈現(xiàn)出較長周期的諧波分量的低穩(wěn)定諧波LSH(low steady harmonic)狀態(tài);(3)穩(wěn)定噪聲SN(steady-noise) 狀態(tài)。狀態(tài)分析單元202可分析輸入信號的特征,并將信號周期對應(yīng)下列狀態(tài)的信號確定為音頻特征信號,即(4)呈現(xiàn)出不同的音調(diào)分量被結(jié)合的復(fù)雜和聲結(jié)構(gòu)的復(fù)雜諧波 CH(complex-harmonic)狀態(tài);( 包括不穩(wěn)定噪聲分量的復(fù)雜噪聲狀態(tài)。在這里,所述信號周期可對應(yīng)輸入信號的塊單位。信號切割單元203可使塊單位的輸入信號成為子集。第一編碼單元204可在塊單位的輸入信號之中編碼語音特征信號。例如,第一編碼單元204可根據(jù)線性預(yù)測譯碼LPC (Linear Predictive Coding)編碼時域中的語音特征信號。在這種情況下,第一編碼單元204可根據(jù)基于CELP的譯碼方式來編碼所述語音特征信號。雖然圖3示出了單一第一編碼單元204,但也可以配置一個或多個第一編碼單元。第二編碼單元205可在塊單位的輸入信號之中編碼音頻特征信號。例如,第二編碼單元205可將音頻特征信號從時域變換到頻域以進(jìn)行編碼。這種情況下,第二編碼單元 205可根據(jù)基于MDCT方式的譯碼方式來編碼音頻特征信號。比特流中可生成第一解碼單元204的結(jié)果和第二編碼單元205的結(jié)果,且在每個編碼單元中生成的比特流可通過比特流多路復(fù)用器(MUX)被控制為單一比特流。也就是說,編碼設(shè)備101可通過根據(jù)狀態(tài)分析單元202的控制參數(shù)進(jìn)行切換,通過第一編碼單元204、第二編碼單元205中的任何一個來編碼輸入信號。同時,第一編碼單元204可根據(jù)不同于基于MDCT的譯碼方式的異質(zhì)譯碼方式,來編碼輸入信號的語音特征信號。此外,第二編碼單元205可根據(jù)基于MDCT的譯碼方式,來編碼輸入信號的音頻特征信號。圖3是示出根據(jù)本發(fā)明的一實(shí)施例的通過第二編碼單元來編碼輸入信號的操作的示圖。參照圖3,第二編碼單元205可包括窗口處理單元301、MDCT變換單元302、比特流生成單元303。在圖3中,X (b)可指輸入信號的基本塊單位。輸入信號將參照圖4和圖6來詳細(xì)說明。輸入信號可被輸入到窗口處理單元301,也可通過塊延遲單元201被輸入到窗口處理單元301。窗口處理單元301,可對輸入信號的當(dāng)前幀應(yīng)用分析窗口。具體來說,窗口處理單元301可對當(dāng)前塊X(b)和延遲的塊X(b-2)應(yīng)用分析窗口。當(dāng)前塊X(b)可通過塊延遲單元201被后退延遲到前一個塊X (b-2)。例如,當(dāng)當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點(diǎn)時, 窗口處理單元301,可對當(dāng)前幀應(yīng)用不超過折點(diǎn)的分析窗口。在這種情況下,窗口處理單元 301,可應(yīng)用所述分析窗口,所述分析窗口可基于所述折點(diǎn)被配置為具有值0并對應(yīng)第一子塊的窗口、對應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對應(yīng)第二子塊中其余區(qū)域的窗口。在這里,所述第一子塊可表示語音特征信號,且所述第二子塊可表示音頻特征信號。由塊延遲單元201執(zhí)行的塊延遲的度,可根據(jù)輸入信號的塊單位有所不同。當(dāng)輸入信號通過窗口處理單元301時,分析窗口可被應(yīng)用,且由此{(lán)X(b-2),x(b)} Wanalysis 可被提取。由此,MDCT變換單元302可針對應(yīng)用了分析窗口的當(dāng)前幀執(zhí)行MDCT。此外,比特流生成單元303可編碼當(dāng)前幀并生成輸入信號的比特流。圖4是示出根據(jù)本發(fā)明的一實(shí)施例的通過窗口處理來編碼輸入信號的操作的示圖。參照圖4,窗口處理單元301,可對輸入信號應(yīng)用分析窗口。在這種情況下,分析窗口可以是矩形或正弦形式。分析窗口的形式可根據(jù)輸入信號有所不同。當(dāng)當(dāng)前塊X(b)被輸入,窗口處理單元301可對當(dāng)前塊X(b)和前一個塊X(b_2)應(yīng)用分析窗口。在這里,前一個塊X(bl)可被塊延遲單元102后退延遲。例如,塊X(b)可按照如下給出的公式1被設(shè)置為輸入信號的基本單位。在這種情況下,兩個塊可被設(shè)置為單一的幀并被編碼。[公式1]X(b) = [s(b-l),s(b)]T在這種情況下,s (b)可指被配置為單一塊的子塊,并可被定義為[公式2]s (b) = [s ((b-Ι) · Ν/4),s ((b_l) · Ν/4+1),· · ·,s ((b_l) · N/4+N/4-1) ]τs (η)輸入信號的一個采樣。在這里,N可指輸入信號的塊的大小。也就是說,輸入信號中可包括多個塊,且每個塊可包括兩個子塊。包含在單一塊中的子塊的數(shù)目可以根據(jù)系統(tǒng)配置和輸入信號有所不同。例如,可按如下給出的公式3定義分析窗口。此外,根據(jù)公式2和公式3,對輸入信號的當(dāng)前塊應(yīng)用分析窗口的結(jié)果,可以表示為公式4。[公式3]Wanalysis = [W1, w2, W3, w4]TWi = [Wi(O),... ,Wi(N^-I)]1[公式4]Wanalysis可指分析窗口,并有對稱特征。如圖4所示,分析窗口可被應(yīng)用到兩個塊。也就是說,分析窗口可被用于四個子塊。此外,窗口處理單元301可針對輸入信號的 N-point (N點(diǎn))執(zhí)行“點(diǎn)對點(diǎn)(point by point)”乘法。N-point可表示MDCT的大小。也就是說,窗口處理單元301,可將子塊乘以對應(yīng)分析窗口的子塊的區(qū)域。MDCT變換單元302可針對分析窗口被處理處的輸入信號執(zhí)行MDCT。圖5是示出根據(jù)本發(fā)明的一實(shí)施例的修正離散余弦變換MDCT (Modified Discrete Cosine Transform)操作的不圖。配置為塊單位的輸入信號和應(yīng)用于輸入信號的分析窗口如圖5所示。如上所述, 輸入信號可包括包括有多個塊的一個幀,一個塊可包含兩個子塊。編碼設(shè)備101,可對輸入信號應(yīng)用分析窗口 Wanalysis。輸入信號可被分為四個子塊X1(Z), X2(Z), X3(Z), X4(Z)包括在當(dāng)前幀中,且分析窗口可被分為W1(Z), W2(Z), Wf(Z)9W111 (Z)。此外,當(dāng)MDCT/量化/反MDCT(IMDCT)被基于劃分子塊的折點(diǎn)應(yīng)用于輸入信號時,可發(fā)生原始區(qū)域(original area)和混疊區(qū)域(aliasing area)。解碼設(shè)備102,可對編碼的輸入信號應(yīng)用合成窗口,并通過重疊相加操作去除在 MDCT操作過程中生成的混疊(aliasing),并由此可提取出輸出信號。圖6是示出根據(jù)本發(fā)明的一實(shí)施例的異質(zhì)譯碼操作C1、C2的示圖。在圖6中,Cl (Change case 1)和C2 (Change case幻可指應(yīng)用了異質(zhì)譯碼方式的輸入信號的邊界?;贑l位于左側(cè)的子塊s(b-5)、s(b-4)、s(b-3)、s(b-2)可指語音特征信號?;?1位于右側(cè)的子塊8(13-1)、803)、803+1)、803+2)可指音頻特征信號。此外,基于C2位于左側(cè)的子塊s (b+m-1)、s (b+m)可指音頻特征信號,基于C2位于右側(cè)的子塊 s (b+m+1)、s (b+m+2)可指語音特征信號。在圖2中,語音特征信號可通過第一編碼單元204被編碼,音頻特征信號可通過第二編碼單元205來編碼。由此在Cl和C2中會出現(xiàn)切換。在這種情況下,切換可發(fā)生在子塊之間的折點(diǎn)中。另外,輸入信號的特征可能會基于Cl和C2不同,由此不同的編碼方式被應(yīng)用,可發(fā)生塊扭曲。在這種情況下,編碼根據(jù)基于MDCT的譯碼方式執(zhí)行,解碼設(shè)備102可通過重疊相加操作使用前一個塊和當(dāng)前塊兩者來去除塊扭曲。但是,當(dāng)如Cl和C2的語音特征信號和音頻特征信號之間發(fā)生切換時,會無法執(zhí)行基于MDCT的重疊相加操作。會需要額外的信息來用于基于MDCT的解碼。例如,Cl中可能會要求額外的信息、(b-l),C2中可能會要求額外的信息ShJb+m)。根據(jù)本發(fā)明的一實(shí)施例,可阻止于比特率的增加,改善譯碼效率并最大限度地減少額外信息S。Jb-l)和額外信息S1il (b+m)。當(dāng)語音特征信號和音頻特征信號之間發(fā)生切換時,編碼設(shè)備101可編碼額外信息來還原音頻特征信號。在這種情況下,額外信息可由編碼語音特征信號的第一編碼單元204 編碼。具體來說,在Cl中,在語音特征信號s (b-2)中對應(yīng)額外信息3(^03-1)的區(qū)域可被編碼為額外信息。此外,在C2中,在語音特征信號s(b+m+l)中對應(yīng)額外信息Sli(b+m)的區(qū)域可被編碼為額外信息。發(fā)生Cl和C2時的一種編碼方法將參照圖7至圖11進(jìn)行詳細(xì)說明,且一種解碼方法將參照圖15至圖18進(jìn)行詳細(xì)說明。圖7是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中生成比特流操作的示圖。當(dāng)輸入信號的塊X(b)被輸入,狀態(tài)分析單元202會分析相應(yīng)塊的狀態(tài)。在這種情況下,當(dāng)塊X (b)為音頻特征信號且塊X (b-幻為語音特征信號時,狀態(tài)分析單元202可意識到Cl在存在于塊X(b)和塊X(b-2)之間的折點(diǎn)中發(fā)生。因此,關(guān)于生成了 Cl的控制信息可被發(fā)送至塊延遲單元201、窗口處理單元301、第一編碼單元204。當(dāng)輸入信號的塊X(b)被輸入,塊X(b)和塊X(b+》可被輸入至窗口處理單元301。 塊X(b+2)可通過塊延遲單元201被向前延遲(+2)。因此,分析窗口可應(yīng)用到圖6的Cl中的塊X (b)和塊X (b+2)。在這里,塊X (b)可包括子塊s (b-Ι)和s (b),且塊X (b+2)可包括子塊s (b+Ι)和s (b+2)。可通過MDCT變換單元302針對分析窗口被應(yīng)用了的塊X (b)和塊 X(b+2)執(zhí)行MDCT。執(zhí)行了 MDCT處的塊可通過比特率生成單元303編碼,由此可生成輸入信號的比特流的塊X (b)的比特流。此外,為針對塊X (b)生成用于重疊相加操作的額外信息Sti (b-Ι),塊延遲單元201 可通過后退延遲塊X (b)來提取塊x(b-l)。塊x(b-l)可包括子塊S (b-2)和S(b-1)。此外, 信號切割單元203可通過信號切割從塊X (b-Ι)中提取額外信息S。Jb-l)。例如,額外信息S。Jb-l)可由下列公式?jīng)Q定[公式δ]Sol (b-1) = [s ((b-2) · Ν/4),· · ·,s ((b-2) · N/4+oL-l) ]τ0 < oL ^ Ν/4在這種情況下,N可指MDCT的塊的大小。第一編碼單元204可編碼語音特征信號的額外信息所對應(yīng)的區(qū)域,來基于語音特征信號和音頻特征信號之間發(fā)生切換的折點(diǎn)在塊之間重疊。例如,第一編碼單元204,可編碼在是語音特征信號的子塊s (b-2)中對應(yīng)于額外信息區(qū)域(oL)的額外信息St^ (b-Ι)。也就是說,第一編碼單元204可通過編碼由信號切割單元203提取的額外信息(b-Ι)來生成額外信息Sti(b-Ι)的比特流。也就是說,當(dāng)Cl發(fā)生時,第一編碼單元204可只生成額外信息(b-Ι)的比特流。當(dāng)Cl發(fā)生時,額外信息StJb-I)可被用作用于去除塊扭曲的額外 fn息ο再比如,在編碼塊X(b-l)時可獲得額外信息Sti(b-1)的情況下,第一編碼單元204 可不編碼額外信息St^ (b-1)。圖8是示出根據(jù)本發(fā)明的一實(shí)施例的在Cl中通過窗口處理來編碼輸入信號的操作的示圖。
在圖8,折點(diǎn)可針對Cl位于零子塊和子塊s (b-Ι)之間,零子塊可以是語音特征信號,子塊s(b-l)可以是音頻特征信號,且折點(diǎn)可以是發(fā)生從語音特征信號到音頻特征信號的切換的折點(diǎn)。如圖8所示,當(dāng)塊X(b)被輸入時,窗口處理單元301可對輸入的當(dāng)前幀應(yīng)用分析窗口。如圖8所示,當(dāng)輸入信號的當(dāng)前幀中存在語音特征信號和音頻特征信號之間發(fā)生切換的折點(diǎn)時,窗口處理單元301可通過對當(dāng)前幀應(yīng)用不超過折點(diǎn)的分析窗口來執(zhí)行編碼。例如,窗口處理單元301,可應(yīng)用分析窗口。分析窗口可基于所述折點(diǎn)被配置為 具有值0并對應(yīng)第一子塊的窗口、對應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對應(yīng)第二子塊中其余區(qū)域的窗口。在這里,所述第一子塊可表示語音特征信號,且所述第二子塊可表示音頻特征信號。在圖8中,折點(diǎn)可位于被配置為具有N/4大小的子塊的當(dāng)前幀的N/4 點(diǎn)處。在圖8中,分析窗口可包括對應(yīng)是語音特征信號的零子塊的窗口 wz,和包括對應(yīng)是音頻特征信號的s(b-l)子塊的額外信息區(qū)域(OL)的窗口及對應(yīng)是音頻特征信號的S (b-1) 子塊的其余區(qū)域(N/4-oL)的窗口的窗口 W2。在這種情況下,窗口處理單元301可以對是語音特征信號的零子塊以值0來替換所述分析窗口 wz。同時,窗口處理單元301可根據(jù)公式6決定是音頻特征信號的子塊所對應(yīng)的分析s (b-Ι)的窗口W2。[公式6I
權(quán)利要求
1.一種編碼設(shè)備,包括第一編碼單元,其根據(jù)不同于基于MDCT的譯碼方式的異質(zhì)譯碼方式來編碼輸入信號的語音特征信號;和第二編碼單元,其根據(jù)所述基于MDCT的譯碼方式來編碼所述輸入信號的音頻特征信號,其中,當(dāng)所述輸入信號的當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點(diǎn)時,所述第二編碼單元通過應(yīng)用不超過所述折點(diǎn)的分析窗口來執(zhí)行編碼。
2.如權(quán)利要求1所述的編碼設(shè)備,其中,所述第二編碼單元應(yīng)用所述分析窗口,所述分析窗口基于所述折點(diǎn)被配置為具有值 0并對應(yīng)第一子塊的窗口、對應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對應(yīng)第二子塊中其余區(qū)域的窗口,在這里所述第一子塊表示語音特征信號,且所述第二子塊表示音頻特征信號。
3.如權(quán)利要求1所述的編碼設(shè)備,其中,當(dāng)所述當(dāng)前幀被配置為具有N/4大小的子塊時,所述折點(diǎn)被設(shè)置在N/4或3N/4點(diǎn)處。
4.如權(quán)利要求2所述的編碼設(shè)備,其中,所述第一編碼單元,為了基于所述折點(diǎn)在塊之間進(jìn)行重疊而編碼第一子塊中對應(yīng)額外信息區(qū)域的部分。
5.一種編碼設(shè)備,包括窗口處理單元,其對輸入信號的當(dāng)前幀應(yīng)用分析窗口 ;MDCT變換單元,其針對應(yīng)用了分析窗口的當(dāng)前幀執(zhí)行MDCT變換;和比特流生成單元,其編碼已進(jìn)行了 MDCT變換的當(dāng)前幀并生成所述輸入信號的比特流,其中,當(dāng)所述輸入信號的當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點(diǎn)時,所述窗口處理單元應(yīng)用不超過折點(diǎn)的分析窗口。
6.如權(quán)利要求5所述的編碼設(shè)備,其中,所述窗口處理單元應(yīng)用所述分析窗口,所述分析窗口基于所述折點(diǎn)被配置為具有值 0并對應(yīng)第一子塊的窗口、對應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對應(yīng)第二子塊中其余區(qū)域的窗口,在這里所述第一子塊表示語音特征信號,且所述第二子塊表示音頻特征信號。
7.如權(quán)利要求5所述的編碼設(shè)備,其中,當(dāng)所述當(dāng)前幀被配置為具有N/4大小的子塊時,所述折點(diǎn)被設(shè)置在N/4或3N/4點(diǎn)處。
8.如權(quán)利要求6所述的編碼設(shè)備,其中,所述第一子塊中的額外信息區(qū)域,為了基于所述折點(diǎn)在塊之間進(jìn)行重疊而根據(jù)不同于基于MDCT的譯碼方式的異質(zhì)譯碼方式被編碼。
9.一種解碼設(shè)備,包括第一解碼單元,其根據(jù)不同于基于MDCT的譯碼方式的異質(zhì)譯碼方式來解碼被編碼的輸入信號的語音特征信號;第二解碼單元,其根據(jù)基于MDCT的譯碼方式來解碼被編碼的輸入信號的音頻特征信號;和塊補(bǔ)償單元,其針對第一解碼單元的結(jié)果和第二解碼單元的結(jié)果來執(zhí)行塊補(bǔ)償并還原輸入信號,其中,當(dāng)所述輸入信號的當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點(diǎn)時,所述塊補(bǔ)償單元應(yīng)用不超過所述折點(diǎn)的合成窗口。
10.如權(quán)利要求9所述的解碼設(shè)備,其中,所述塊補(bǔ)償單元,對額外信息應(yīng)用第一合成窗口,并對當(dāng)前幀應(yīng)用第二合成窗口來執(zhí)行重疊相加操作,所述額外信息通過第一解碼單元來提取,且所述當(dāng)前幀通過第二解碼單元來提取。
11.如權(quán)利要求10所述的解碼設(shè)備,其中,所述塊補(bǔ)償單元應(yīng)用第二合成窗口,所述第二合成窗口基于所述折點(diǎn)被配置為具有值0并對應(yīng)第一子塊的窗口、對應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對應(yīng)第二子塊中其余區(qū)域的窗口,在這里所述第一子塊表示語音特征信號,且所述第二子塊表示音頻特征信號。
12.如權(quán)利要求9所述的解碼設(shè)備,其中,所述第二解碼單元,解碼輸入信號的當(dāng)前幀中與折點(diǎn)不相鄰的塊,且所述塊補(bǔ)償單元, 對輸入信號的當(dāng)前幀中與折點(diǎn)相鄰的子塊應(yīng)用第二合成窗口。
13.如權(quán)利要求9所述的解碼設(shè)備,其中,所述第一解碼單元,解碼根據(jù)異質(zhì)譯碼方式編碼的額外信息,來還原輸入信號的當(dāng)前幀中的音頻特征信號。
14.如權(quán)利要求9所述的解碼設(shè)備,其中,當(dāng)所述當(dāng)前幀被配置為具有N/4大小的子塊時,所述折點(diǎn)被設(shè)置在N/4或3N/4點(diǎn)處。
15.一種解碼設(shè)備,包括塊補(bǔ)償單元,當(dāng)輸入信號的當(dāng)前幀中存在在語音特征信號和音頻特征信號之間發(fā)生切換的折點(diǎn)時,其對所述當(dāng)前幀和從語音特征信號中提取出的額外信息分別應(yīng)用合成窗口, 來還原輸入信號。
16.如權(quán)利要求15所述的解碼設(shè)備,其中,所述塊補(bǔ)償單元,通過對當(dāng)前幀和額外信息應(yīng)用不超過折點(diǎn)的合成窗口,來執(zhí)行重疊相加操作。
17.如權(quán)利要求15所述的解碼設(shè)備,其中,所述塊補(bǔ)償單元應(yīng)用合成窗口,所述合成窗口基于所述折點(diǎn)被配置為具有值0并對應(yīng)第一子塊的窗口、對應(yīng)第二子塊中額外信息區(qū)域的窗口、具有值1并對應(yīng)第二子塊中其余區(qū)域的窗口,在這里所述第一子塊表示語音特征信號,且所述第二子塊表示音頻特征信號。
18.如權(quán)利要求17所述的解碼設(shè)備,其中,所述塊補(bǔ)償單元,對與輸入信號的當(dāng)前幀中的折點(diǎn)相鄰的子塊應(yīng)用合成窗口。
19.如權(quán)利要求15所述的解碼設(shè)備,其中,當(dāng)所述當(dāng)前幀被配置為具有N/4大小的子塊時,所述折點(diǎn)被設(shè)置在N/4或3N/4點(diǎn)處。
全文摘要
本發(fā)明提供了在基于MDCT的譯碼器(205)和異質(zhì)譯碼器(204)之間轉(zhuǎn)換的編碼設(shè)備(101)和解碼設(shè)備。當(dāng)在基于MDCT的譯碼器(205)和異質(zhì)譯碼器(204)之間發(fā)生交換時,所述編碼設(shè)備(101)可編碼附加信息以還原根據(jù)基于MDCT的譯碼方式編碼的輸入信號。由此,能夠防止生成不必要的比特流,且可編碼最小限度的附加信息。
文檔編號G10L19/14GK102216982SQ200980145832
公開日2011年10月12日 申請日期2009年9月18日 優(yōu)先權(quán)日2008年9月18日
發(fā)明者姜京玉, 張大永, 樸浩綜, 樸榮喆, 李泰辰, 洪鎮(zhèn)佑, 白承權(quán), 金珉第 申請人:光云大學(xué)校 產(chǎn)學(xué)協(xié)力團(tuán), 韓國電子通信研究院