專利名稱:聲音編碼裝置、聲音譯碼裝置、記錄實(shí)現(xiàn)聲音編碼/譯碼的程序的記錄媒體和移動(dòng)通信裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及將聲音信號(hào)編碼后進(jìn)行傳送的移動(dòng)通信系統(tǒng)等的CELP(Code Excited Linear Predicion)型聲音編碼裝置和CELP型聲音譯碼裝置以及移動(dòng)通信裝置。
背景技術(shù):
CELP型聲音編碼裝置是將聲音分割為某一一定的幀長(zhǎng)、對(duì)各幀進(jìn)行聲音的線性預(yù)測(cè)、使用由已知的波形構(gòu)成的自適應(yīng)編碼矢量和噪音編碼矢量對(duì)各幀的線性預(yù)測(cè)的預(yù)測(cè)殘差(激勵(lì)信號(hào))進(jìn)行編碼的裝置。自適應(yīng)編碼矢量和噪音編碼矢量有時(shí)如圖34所示的那樣分別直接使用自適應(yīng)編碼表1和噪音編碼表2存儲(chǔ)的自適應(yīng)編碼矢量和噪音編碼矢量,有時(shí)如圖35所示的那樣使用自適應(yīng)編碼表1的自適應(yīng)編碼矢量和使噪音編碼表2的噪音編碼矢量與自適應(yīng)編碼表1的音調(diào)周期L同步的噪音編碼矢量。圖35是特開平5-19795號(hào)公報(bào)和特開平5-19796號(hào)公報(bào)所公開的CELP型聲音編碼裝置的噪音聲源矢量生成部的結(jié)構(gòu)。在圖35中,從自適應(yīng)編碼表1中選擇自適應(yīng)編碼矢量,同時(shí),輸出音調(diào)周期L,從噪音編碼表2中選擇的噪音編碼矢量由周期化器3使用音調(diào)周期L進(jìn)行周期化。周期化是通過(guò)將噪音編碼矢量從開頭分割出音調(diào)周期、并反復(fù)多次進(jìn)行連接直至使其達(dá)到子幀長(zhǎng)而進(jìn)行的。
但是,在上述先有的使噪音編碼矢量實(shí)現(xiàn)音調(diào)周期化的CELP型聲音編碼裝置中,由于是通過(guò)利用音調(diào)周期使噪音編碼矢量實(shí)現(xiàn)周期化而去除在去除自適應(yīng)編碼矢量成分之后殘留的音調(diào)周期成分的,所以,沒有積極地使用在1音調(diào)波形內(nèi)存在的相位信息、即在何處存在音調(diào)脈沖的峰值的信息,從而對(duì)于提高聲音品質(zhì)有限制。
本發(fā)明就是為了解決這種先有問題而提案的,其目的在于提供可以進(jìn)一步提高聲音品質(zhì)的聲音編碼裝置。發(fā)明的公開為了達(dá)到上述目的,本發(fā)明通過(guò)增強(qiáng)與自適應(yīng)編碼矢量的音調(diào)峰值位置對(duì)應(yīng)的噪音編碼矢量的振幅,利用在1音調(diào)波形內(nèi)存在的相位信息來(lái)提高音質(zhì)。
另外,本發(fā)明通過(guò)使用僅限于自適應(yīng)編碼矢量的音調(diào)峰值附近的噪音編碼矢量,即使在分配給噪音編碼矢量的位數(shù)少時(shí),也可以減少音質(zhì)劣化。
另外,本發(fā)明通過(guò)使用自適應(yīng)編碼矢量的音調(diào)峰值的位置和音調(diào)周期限定脈沖位置的搜索范圍,即使在表示脈沖位置的位數(shù)少時(shí),也可以減少音質(zhì)劣化,縮小搜索范圍。
另外,本發(fā)明在使用自適應(yīng)編碼矢量的音調(diào)峰值的位置和音調(diào)周期限定脈沖位置的搜索范圍時(shí),特別是通過(guò)使1~2音調(diào)波形的脈沖位置搜索精度精細(xì)化,來(lái)提高音調(diào)周期短的聲音的有聲部的音質(zhì)。
另外,本發(fā)明通過(guò)根據(jù)音調(diào)周期的值改變脈沖聲源的脈沖條數(shù),來(lái)提高音質(zhì)。
另外,本發(fā)明通過(guò)在預(yù)先確定自適應(yīng)編碼矢量的音調(diào)峰值位置附近和除此以外的部分的脈沖振幅后進(jìn)行脈沖聲源搜索,來(lái)提高音質(zhì)。
另外,本發(fā)明通過(guò)將音調(diào)增益進(jìn)行多級(jí)量化并在自適應(yīng)編碼表搜索之后進(jìn)行初級(jí)的量化信息,可以將音調(diào)增益的初級(jí)量化信息作為噪音編碼表切換用的模式信息來(lái)利用,以此提高編碼效率。
另外,本發(fā)明通過(guò)使用量化音調(diào)周期信息或此前的子幀或當(dāng)前子幀的量化音調(diào)增益信息進(jìn)行切換脈沖聲源的搜索位置的控制,來(lái)提高聲音品質(zhì)。
另外,本發(fā)明通過(guò)反向判斷子幀間的相位的連續(xù)性并僅對(duì)判定為相位連續(xù)的子幀應(yīng)用相位自適應(yīng)處理,不增加所傳送的信息量而進(jìn)行相位自適應(yīng)處理的切換,來(lái)提高聲音品質(zhì)。如果在不進(jìn)行相位自適應(yīng)處理時(shí)使用固定編碼表,還可以獲得防止傳送路線錯(cuò)誤的傳播的效果。
另外,本發(fā)明根據(jù)自適應(yīng)編碼矢量中信號(hào)功率向音調(diào)峰值位置附近的集中度確定是應(yīng)用還是不應(yīng)用相位自適應(yīng)處理,不增加所傳送的信息量而進(jìn)行相位自適應(yīng)處理的切換,來(lái)提高聲音品質(zhì)。若在不進(jìn)行相位自適應(yīng)處理時(shí)使用固定編碼表,還可以獲得防止傳送路線錯(cuò)誤傳播的效果。
另外,本發(fā)明在利用音調(diào)峰值位置的相對(duì)位置進(jìn)行聲源脈沖搜索的CELP型聲音編碼裝置中,通過(guò)從子幀的開頭一側(cè)順序加上脈沖位置的索引,防止在某一幀中發(fā)生的傳送路線錯(cuò)誤的影響傳播到后續(xù)的沒有傳送路線錯(cuò)誤的幀中。
另外,本發(fā)明在利用音調(diào)峰值位置的相對(duì)位置進(jìn)行聲源脈沖搜索的CELP型聲音編碼裝置中,通過(guò)從子幀的開頭一側(cè)順序加上脈沖位置的索引、同時(shí)即使是在相同索引的不同脈沖中、通過(guò)從子幀的開頭一側(cè)順序加上脈沖序號(hào),防止在某一幀中發(fā)生的傳送路線錯(cuò)誤的影響傳播到后續(xù)的沒有傳送路線錯(cuò)誤的幀中。
另外,本發(fā)明在利用音調(diào)峰值位置的相對(duì)位置進(jìn)行聲源脈沖搜索的CELP型聲音編碼裝置中,不是用相對(duì)位置表示全部脈沖搜索位置,而僅用相對(duì)位置表現(xiàn)音調(diào)峰值附近的一部分,通過(guò)使其余的部分成為預(yù)先確定的固定位置,防止在某一幀中發(fā)生的傳送路線錯(cuò)誤的影響傳播到后續(xù)的沒有傳送路線錯(cuò)誤的幀中。
另外,本發(fā)明在求音調(diào)峰值位置時(shí),不是對(duì)作為對(duì)象的信號(hào)全體進(jìn)行音調(diào)峰值位置的搜索,通過(guò)具有在所分割出的音調(diào)周期長(zhǎng)的信號(hào)中進(jìn)行音調(diào)峰值位置的搜索的裝置,便可更正確地抽出開頭的音調(diào)峰值位置。
另外,本發(fā)明在子幀間音調(diào)周期連續(xù)的部分即認(rèn)為是有聲定常部的部分中,使用此前的子幀中的音調(diào)峰值位置、此前的子幀中的音調(diào)周期以及當(dāng)前的子幀中的音調(diào)周期,預(yù)測(cè)當(dāng)前的子幀中的音調(diào)峰值位置,通過(guò)根據(jù)所預(yù)測(cè)的音調(diào)峰值位置限定當(dāng)前的子幀中的音調(diào)峰值位置的存在范圍,便可抽出音調(diào)峰值位置而不會(huì)發(fā)生有聲定常部的相位的不連續(xù)。
另外,本發(fā)明在子幀長(zhǎng)具有10ms左右以上并且分配給噪音編碼表信息的信息量如每1子幀約15位那樣比較少、作為噪音編碼表應(yīng)用脈沖聲源時(shí),通過(guò)采用使減少脈沖數(shù)而充分獲得各脈沖的位置信息的模式和用增加脈沖數(shù)來(lái)取代粗略地采集各脈沖的位置信息的模式分別具有至少1個(gè)模式以上(總計(jì)2個(gè)模式以上)的結(jié)構(gòu),提高聲音信號(hào)的有聲前沿部分的品質(zhì),另外,通過(guò)增加脈沖數(shù),可以抑制由于粗略地采集各脈沖的位置信息而引起的聲音品質(zhì)的劣化。
權(quán)利要求1所述的發(fā)明,是具有增強(qiáng)與自適應(yīng)編碼矢量的音調(diào)峰值位置對(duì)應(yīng)的噪音編碼矢量的振幅的聲源生成部的CELP型聲音編碼裝置,可以利用在1音調(diào)波形中存在的相位信息提高音質(zhì)。
權(quán)利要求2所述的發(fā)明,在權(quán)利要求1所述的聲音編碼裝置中,聲音生成部通過(guò)將與自適應(yīng)編碼矢量的音調(diào)周期同步的振幅增強(qiáng)窗乘以噪音編碼矢量,來(lái)增強(qiáng)與自適應(yīng)編碼矢量的音調(diào)峰值的位置對(duì)應(yīng)的噪音編碼矢量的振幅,通過(guò)與音調(diào)周期同步地增強(qiáng)噪音聲源矢量的振幅,可以提高音質(zhì)。
權(quán)利要求3所述的發(fā)明,是在權(quán)利要求2所述的聲音編碼裝置中,聲音生成部將以自適應(yīng)編碼矢量的音調(diào)峰值位置為中心的三角窗作為振幅增強(qiáng)窗使用,可以很容易地進(jìn)行振幅增強(qiáng)窗長(zhǎng)度的控制。
權(quán)利要求4所述的發(fā)明,是在CELP型聲音編碼裝置中具有使用僅限定自適應(yīng)編碼矢量的音調(diào)峰值附近的噪音編碼矢量的聲源生成部的聲音編碼裝置,通過(guò)使用僅限定自適應(yīng)編碼矢量的音調(diào)峰值附近的噪音編碼矢量,即使在分配給噪音編碼矢量的位數(shù)少時(shí),也可以減少音質(zhì)劣化,從而可以由殘差功率集中在音調(diào)脈沖附近的有聲部提高音質(zhì)。
權(quán)利要求5所述的發(fā)明,是在噪音編碼表中使用脈沖聲源的CELP型聲音編碼裝置中具有由自適應(yīng)編碼矢量的音調(diào)周期和音調(diào)峰值位置確定脈沖位置的搜索范圍的聲源生成部的聲音編碼裝置,即使在分配給脈沖位置的位數(shù)少時(shí),也可以減少音質(zhì)劣化。
權(quán)利要求6所述的發(fā)明,在權(quán)利要求5所述的聲音編碼裝置中,聲源生成部在自適應(yīng)編碼矢量的音調(diào)峰值位置附近密、而在除此之外的部分疏地確定脈沖位置的搜索范圍,由于精細(xì)地搜索產(chǎn)生脈沖的概率高的部分,所以,可以提高音質(zhì)。
權(quán)利要求7所述的發(fā)明,是根據(jù)音調(diào)周期切換脈沖位置的搜索范圍的權(quán)利要求5或權(quán)利要求6所述的聲音編碼裝置,由于根據(jù)音調(diào)周期縮放脈沖位置的搜索范圍,所以,在音調(diào)周期短時(shí),可以更精細(xì)地表現(xiàn)1~2音調(diào)的波形,從而可以提高音質(zhì)。
權(quán)利要求8所述的發(fā)明,是在自適應(yīng)編碼矢量中存在多個(gè)音調(diào)峰值時(shí)、使在搜索范圍內(nèi)包含至少2個(gè)音調(diào)峰值位置而限定脈沖位置的搜索范圍的權(quán)利要求7的聲音編碼裝置,可以緩和所檢測(cè)的開頭的音調(diào)峰值的位置錯(cuò)誤時(shí)的影響,另外,由于也可以與開頭的音調(diào)峰值附近的波形和第2個(gè)音調(diào)峰值附近的波形的形狀變化對(duì)應(yīng),所以,可以提高聲音品質(zhì)。
權(quán)利要求9所述的發(fā)明,是在CELP型聲音編碼裝置中具有根據(jù)聲音的分析結(jié)果切換噪音編碼表的聲源生成部的聲音編碼裝置,由于可以根據(jù)輸入聲音的特征切換噪音編碼表,所以,可以提高聲音品質(zhì)。
權(quán)利要求10所述的發(fā)明,是在CELP型聲音編碼裝置中具有使用在進(jìn)行噪音編碼表搜索之前抽出的傳送參量切換噪音編碼表的聲源生成部的聲音編碼裝置,由于使用確定已傳送的內(nèi)容的信息來(lái)切換噪音編碼表,所以,不增加信息量便可進(jìn)行噪音編碼表的切換。
權(quán)利要求11所述的發(fā)明,是根據(jù)聲音信號(hào)的分析結(jié)果切換脈沖條數(shù)的結(jié)構(gòu)的權(quán)利要求5~8的任一權(quán)項(xiàng)所述的聲音編碼裝置,由于根據(jù)輸入聲音的特征切換脈沖條數(shù),所以,可以提高聲音品質(zhì)。
權(quán)利要求12所述的發(fā)明,是具有使用在進(jìn)行噪音編碼表搜索眼前抽出的信息切換脈沖條數(shù)的結(jié)構(gòu)的、權(quán)利要求5~8或11的任一權(quán)項(xiàng)所述的聲音編碼裝置,由于使用確定聲音傳送的內(nèi)容的信息切換脈沖條數(shù),所以,不增加所傳送的信息量便可進(jìn)行脈沖條數(shù)的切換。
權(quán)利要求13所述的發(fā)明,是具有根據(jù)音調(diào)周期切換脈沖條數(shù)的聲源生成部的、權(quán)利要求5~8或11、12的任一權(quán)項(xiàng)所述的聲音編碼裝置,由于使用音調(diào)周期切換脈沖數(shù),所以,不增加傳送信息便可切換脈沖條數(shù)。另外,由于最佳的脈沖條數(shù)隨音調(diào)周期而不同,所以,可以提高聲音品質(zhì)。
權(quán)利要求14所述的發(fā)明,是在連續(xù)的子幀間音調(diào)周期的變化小時(shí)和不小時(shí)切換脈沖條數(shù)的、權(quán)利要求13所述的聲音編碼裝置,由于切換在聲音信號(hào)的有聲部的前沿部分和定常部分使用的脈沖的條數(shù),所以,可以提高聲音品質(zhì)。
權(quán)利要求15所述的發(fā)明,是在作為噪音聲源使用脈沖聲源的噪音編碼矢量生成部中,在脈沖位置搜索之前確定脈沖振幅的權(quán)利要求5~8、11~14的任一權(quán)項(xiàng)所述的聲音編碼裝置,由于使脈沖聲源具有振幅的變化,所以,可以提高聲音品質(zhì)。另外,由于在脈沖搜索之前確定振幅,所以,可以對(duì)其振幅確定最佳的脈沖位置。
權(quán)利要求16所述的發(fā)明,是在作為噪音聲源使用脈沖聲源的噪音編碼矢量生成部中使脈沖振幅在自適應(yīng)編碼矢量的音調(diào)峰值附近及其以外的部分改變的、權(quán)利要求15所述的聲音編碼裝置,由于使聲源信號(hào)的音調(diào)峰值附近及其以外的部分的振幅變化,所以,可以有效地表現(xiàn)聲源信號(hào)的音調(diào)結(jié)構(gòu)的形狀,從而可以提高聲音品質(zhì)和提高脈沖振幅信息的量化效率。
權(quán)利要求17所述的發(fā)明,是通過(guò)統(tǒng)計(jì)上或?qū)W習(xí)而根據(jù)音調(diào)周期確定使用的脈沖聲源的脈沖數(shù)的、權(quán)利要求13所述的聲音編碼裝置,由于根據(jù)統(tǒng)計(jì)上或其他學(xué)習(xí)方法確定對(duì)各音調(diào)周期的最佳脈沖條數(shù),所以,可以提高聲音品質(zhì)。
權(quán)利要求18所述的發(fā)明,在CELP型聲音編碼裝置中具有將音調(diào)增益進(jìn)行多級(jí)量化的聲源生成部,是在初級(jí)量化中將在自適應(yīng)編碼表搜索之后求出的值作為量化目標(biāo)、而在第2級(jí)之后的量化中將聲源搜索全部結(jié)束后由閉環(huán)搜索確定的音調(diào)增益與在初級(jí)量化中量化后的值的差分作為量化目標(biāo)的聲音編碼裝置,在利用自適應(yīng)編碼表與固定編碼表(噪音編碼表)之和生成驅(qū)動(dòng)聲源矢量的CELP型聲音編碼裝置中,由于將在固定編碼表(噪音編碼表)搜索之前得到的信息量化后進(jìn)行傳送,所以,可以不增加獨(dú)立的模式信息進(jìn)行固定編碼表(噪音編碼表)的切換等,從而可以對(duì)聲音信息高效率地進(jìn)行編碼。
權(quán)利要求19所述的發(fā)明,是權(quán)利要求18所述的聲音編碼裝置中具有使用在自適應(yīng)編碼表搜索之后求出的音調(diào)增益的量化值切換固定編碼表的結(jié)構(gòu)的、權(quán)利要求9~12、15~17的任一權(quán)項(xiàng)所述的聲音編碼裝置,利用在固定編碼表搜索之前求出的音調(diào)增益和在固定編碼表搜索之后求出的音調(diào)增益的值沒有大的不同的情況,不用附加模式信息便可進(jìn)行固定編碼表的模式切換,從而可以提高聲音品質(zhì)。
權(quán)利要求20所述的發(fā)明,是根據(jù)音調(diào)周期的子幀間變化切換固定編碼表的權(quán)利要求9~12、15~19的任一權(quán)項(xiàng)所述的聲音編碼裝置,通過(guò)利用音調(diào)周期的子幀間的連續(xù)性等判斷是否為有聲/有聲定常部、進(jìn)行有聲/有聲定常部的有效聲源和除此以外的部分(無(wú)聲/前沿部等)的有效聲源的切換,可以提高聲音品質(zhì)。
權(quán)利要求21所述的發(fā)明,是使用在此前的子幀中進(jìn)行了量化處理的音調(diào)增益切換固定編碼表的、權(quán)利要求9~12、15~17的任一權(quán)項(xiàng)所述的聲音編碼裝置,通過(guò)利用音調(diào)增益的子幀間的連續(xù)性等判斷是否為有聲/有聲定常部、進(jìn)行有聲/有聲定常部的有效聲源和除此以外的部分(無(wú)聲/前沿部等)的有效聲源的切換,可以提高聲音品質(zhì)。
權(quán)利要求22所述的發(fā)明,是根據(jù)音調(diào)周期的子幀間變化和量化音調(diào)增益切換固定編碼表的、權(quán)利要求9~12、15~17的任一權(quán)項(xiàng)所述的聲音編碼裝置,通過(guò)使用作為傳送參量的音調(diào)周期和音調(diào)增益的信息判斷是否為有聲/有聲定常部、進(jìn)行有聲/有聲定常部的有效聲源和除此以外的部分(無(wú)聲/前沿部等)的有效聲源的切換,可以提高聲音品質(zhì)。
權(quán)利要求23所述的發(fā)明,是對(duì)固定編碼表使用脈沖聲源編碼表的、權(quán)利要求19~22的任一權(quán)項(xiàng)所述的聲音編碼裝置,由于對(duì)噪音編碼表使用脈沖聲音,所以,可以減少噪音編碼表所需要的存儲(chǔ)量及噪音編碼表搜索時(shí)的運(yùn)算量,進(jìn)而可以提高有聲部的前沿的表現(xiàn)性。
權(quán)利要求24所述的發(fā)明,是在對(duì)具有指定的時(shí)間長(zhǎng)度的各子幀進(jìn)行聲音編碼處理的CELP型聲音編碼裝置中判斷當(dāng)前的子幀的相位和此前的子幀的相位是否連續(xù)、并切換在判定連續(xù)時(shí)和判定不連續(xù)時(shí)使用的聲源的聲音編碼裝置,可以實(shí)現(xiàn)區(qū)分有聲(定常)部和除此以外的部分的聲源結(jié)構(gòu),從而可以提高音質(zhì)。
權(quán)利要求25所述的發(fā)明,是使用此前的子幀的音調(diào)峰值位置、此前的子幀的音調(diào)周期以及當(dāng)前的子幀的音調(diào)周期預(yù)測(cè)當(dāng)前的子幀的音調(diào)峰值位置、根據(jù)通過(guò)該預(yù)測(cè)而得到的當(dāng)前子幀的音調(diào)峰值位置是否接近僅僅根據(jù)當(dāng)前子幀的數(shù)據(jù)所求出的音調(diào)峰值位置判斷此前的子幀的相位和當(dāng)前的子幀的相位是否連續(xù)、并根據(jù)該判斷結(jié)果切換聲源的編碼處理方法的權(quán)利要求24所述的CELP型聲音編碼裝置,由于使用已傳送的或正在傳送的信息獲得判斷結(jié)果,所以,不必使用新的傳送信息傳送判斷結(jié)果。
權(quán)利要求26所述的發(fā)明,是在判定此前的子幀的相位和當(dāng)前的子幀的相位連續(xù)時(shí)對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理、在判定此前的子幀的相位和當(dāng)前的子幀的相位不連續(xù)時(shí)對(duì)噪音編碼表不進(jìn)行相位自適應(yīng)處理的權(quán)利要求24或25所述的聲音編碼裝置,可以進(jìn)行有效的相位自適應(yīng)處理。由于反向判斷子幀間的相位的連續(xù)性,所以,也不必重新傳送應(yīng)用相位自適應(yīng)處理或不進(jìn)行相位自適應(yīng)處理的切換信息。此外,在不應(yīng)用相位自適應(yīng)處理時(shí),通過(guò)使用固定編碼表,也可以獲得抑制傳送路線錯(cuò)誤的影響的傳播的效果。
權(quán)利要求27所述的發(fā)明,是在對(duì)具有指定的時(shí)間長(zhǎng)度的各子幀進(jìn)行聲音編碼處理的CELP型聲音編碼裝置中、以當(dāng)前子幀的自適應(yīng)編碼矢量的音調(diào)峰值附近的信號(hào)功率的集中度為基準(zhǔn)切換聲源信號(hào)的編碼處理方法的聲音編碼裝置,用于聲源結(jié)構(gòu)(聲源信號(hào)的編碼處理方法)的切換不需要新的傳送信息便可自適應(yīng)地進(jìn)行聲源結(jié)構(gòu)的切換。
權(quán)利要求28所述的發(fā)明,是當(dāng)前子幀的自適應(yīng)編碼矢量的音調(diào)峰值附近的信號(hào)功率在1音調(diào)周期長(zhǎng)度的信號(hào)總體中所占的比例大于指定值時(shí)就對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理、而在不足指定值時(shí)就不對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理的、權(quán)利要求27所述的聲音編碼裝置,可以根據(jù)自適應(yīng)編碼矢量的脈沖性的強(qiáng)度自適應(yīng)地控制(切換)相位自適應(yīng)處理,從而可以提高聲音品質(zhì)。另外,也不需要用于相位自適應(yīng)處理的控制(切換)的新的傳送信息。此外,如果在不進(jìn)行相位自適應(yīng)處理時(shí)使用固定編碼表,還可以獲得抑制傳送路線錯(cuò)誤的影響傳播的效果。
權(quán)利要求29所述的發(fā)明,是作為相位自適應(yīng)處理在音調(diào)峰值附近加密地進(jìn)行脈沖位置搜索、而在音調(diào)峰值附近以外的部分稀疏地進(jìn)行脈沖位置搜索的將脈沖聲源應(yīng)用于噪音聲源的權(quán)利要求26或28所述的聲音編碼裝置,由于在噪音編碼表中使用脈沖聲源,所以,可以減少噪音編碼表所需要的存儲(chǔ)量及噪音編碼表搜索時(shí)的運(yùn)算量,進(jìn)而可以提高有聲部的前沿的表現(xiàn)性。
權(quán)利要求30所述的發(fā)明,是從子幀的開頭一側(cè)順序排列而加上表示脈沖的位置的索引的、權(quán)利要求5~8、11~17、23、29的任一權(quán)項(xiàng)所述的聲音編碼裝置,通過(guò)從子幀的開頭加上表示脈沖位置的索引以使索引的序號(hào)越小越位于子幀的開頭附近,可以減小在音調(diào)峰值位置錯(cuò)誤時(shí)發(fā)生的脈沖位置的偏離,從而可以緩和傳送路線錯(cuò)誤的影響的傳播。
權(quán)利要求31所述的發(fā)明,是在相同的索引序號(hào)時(shí)從子幀的開頭一側(cè)順序加上脈沖的序號(hào)并進(jìn)而在音調(diào)峰值位置附近加密地而在音調(diào)峰值附近以外的部分稀疏地確定各脈沖的搜索位置的、權(quán)利要求30所述的聲音編碼裝置,由于在相同的索引序號(hào)時(shí)使脈沖的序號(hào)越小越位于子幀的開頭一側(cè)來(lái)確定各脈沖的序號(hào),所以,除了脈沖的索引外,還定義了附加的脈沖序號(hào),可以進(jìn)一步減小音調(diào)峰值位置錯(cuò)誤時(shí)發(fā)生的脈沖位置的偏離,從而可以進(jìn)一步減小傳送路線錯(cuò)誤的影響的傳播。
權(quán)利要求32所述的發(fā)明,是根據(jù)音調(diào)峰值位置確定脈沖搜索位置的一部分、而其他的脈沖搜索位置是與音調(diào)峰值位置無(wú)關(guān)的預(yù)先確定的固定位置的、權(quán)利要求5~8、11~17、23、29的任一權(quán)項(xiàng)所述的聲音編碼裝置,即使在音調(diào)峰值位置錯(cuò)誤時(shí),也可以減少使聲源脈沖的位置錯(cuò)誤的概率,所以,可以抑制傳送路線錯(cuò)誤的影響的傳播。
權(quán)利要求33所述的發(fā)明,是具有在求具有指定的時(shí)間長(zhǎng)度的聲音或聲源信號(hào)的音調(diào)峰值位置時(shí)只從該信號(hào)中分離出音調(diào)周期長(zhǎng)度并在分離出的信號(hào)內(nèi)確定音調(diào)峰值位置的音調(diào)峰值位置計(jì)算單元的、權(quán)利要求1~8、11~17、19~23、25~32的任一權(quán)項(xiàng)所述的聲音編碼裝置,由于從1音調(diào)波形中選擇音調(diào)峰值,所以,可以單純地搜索振幅值(絕對(duì)值)成為最大的點(diǎn),即使在子幀中包含超過(guò)1音調(diào)周期的波形,也可以正確地求出音調(diào)峰值位置。
權(quán)利要求34所述的發(fā)明,是在從該信號(hào)中只分離出音調(diào)周期長(zhǎng)度時(shí)先不分離出1周期長(zhǎng)度而使用該信號(hào)全體確定音調(diào)峰值位置、將該確定的音調(diào)峰值位置作為分離的開始點(diǎn)分離出1音調(diào)周期長(zhǎng)度、并在分離出的信號(hào)內(nèi)確定音調(diào)峰值位置的、權(quán)利要求33所述的聲音編碼裝置,可以避免在使用該信號(hào)全體確定音調(diào)峰值位置時(shí)發(fā)生的、將1音調(diào)波形內(nèi)的次峰值作為音調(diào)峰值位置的現(xiàn)象。即,可以避免音調(diào)周期與子幀長(zhǎng)度不同步而引起的音調(diào)峰值位置的抽出錯(cuò)誤。
權(quán)利要求35所述的發(fā)明,是在對(duì)具有指定的時(shí)間長(zhǎng)度的各子幀進(jìn)行聲音編碼處理的CELP型聲音編碼裝置中計(jì)算當(dāng)前子幀的音調(diào)峰值位置時(shí)、此前的子幀的音調(diào)周期與當(dāng)前的子幀的音調(diào)周期之差在預(yù)先確定的范圍內(nèi)時(shí)就使用此前的子幀的音調(diào)峰值位置、此前的子幀的音調(diào)周期和當(dāng)前的子幀的音調(diào)周期預(yù)測(cè)當(dāng)前的子幀的音調(diào)峰值位置、使用通過(guò)該預(yù)測(cè)而得到的當(dāng)前的子幀的音調(diào)峰值位置預(yù)先限定當(dāng)前的子幀的音調(diào)峰值位置的存在范圍并在該范圍內(nèi)進(jìn)行音調(diào)峰值位置搜索的、權(quán)利要求1~8、11~17、19~23、25~32的任一權(quán)項(xiàng)所述的聲音編碼裝置,由于考慮此前的子幀的音調(diào)峰值位置來(lái)確定當(dāng)前的子幀的音調(diào)峰值位置,所以,對(duì)于僅根據(jù)當(dāng)前的子幀求音調(diào)峰值位置和錯(cuò)誤地檢測(cè)1音調(diào)峰值波形內(nèi)的次峰值位置的情況,是避免錯(cuò)誤地檢測(cè)的方法。
權(quán)利要求36所述的發(fā)明,是在對(duì)具有指定的時(shí)間長(zhǎng)度的子幀進(jìn)行聲音編碼處理的CELP型聲音編碼裝置中作為噪音編碼表使用脈沖聲源、至少具有2模式以上的噪音編碼表的模式從而可以通過(guò)切換模式而改變聲源脈沖的條數(shù)、并且至少1個(gè)模式是充分取得各脈沖的位置信息的脈沖條數(shù)少的模式而其他模式則是各脈沖的位置信息不足的脈沖數(shù)多的模式、并傳送模式的切換信息而進(jìn)行模式的切換的聲音編碼裝置,通過(guò)具有位置信息不充分的聲源脈沖數(shù)多的模式,可以提高聲音信號(hào)的有聲前沿部的品質(zhì),另外,可以有效地利用位置信息不充分的聲源脈沖數(shù)多的模式。
權(quán)利要求37所述的發(fā)明,是在音調(diào)周期短時(shí)與音調(diào)周期對(duì)應(yīng)地通過(guò)將聲源脈沖的搜索范圍限定在狹窄的范圍內(nèi)、減少聲源脈沖的位置信息增加聲源脈沖的條數(shù)的、權(quán)利要求36所述的聲音編碼裝置,對(duì)具有短音調(diào)周期的音調(diào)周期性的聲源信號(hào),可以充分保持著每1音調(diào)周期的聲源脈沖的位置信息而增加聲源脈沖的條數(shù),從而可以提高聲音品質(zhì)。
權(quán)利要求38所述的發(fā)明,是在各脈沖的位置信息不足的脈沖數(shù)多的模式中在音調(diào)峰值位置附近使聲源脈沖的搜索位置密而在除此之外的部分使聲源脈沖的搜索位置疏地確定脈沖位置的搜索范圍的、權(quán)利要求36或37所述的聲音編碼裝置,由于將聲源脈沖的位置信息集中在發(fā)生聲源脈沖的概率高的部分,所以,可以提高聲源脈沖的位置信息不充分的聲源脈沖數(shù)多的模式的利用效率。
權(quán)利要求39所述的發(fā)明,是在權(quán)利要求36~38的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置中、在脈沖數(shù)少、位置信息充分的聲源模式中將位置信息的一部分分配給表示噪音性的聲源代碼矢量的索引的聲音編碼裝置,不設(shè)置新的模式便可與無(wú)聲子音部及噪音的輸入信號(hào)對(duì)應(yīng)。
權(quán)利要求40所述的發(fā)明,是記錄用于執(zhí)行權(quán)利要求1~39的任一權(quán)項(xiàng)所述的聲音編碼裝置的功能的程序的、計(jì)算機(jī)可讀取的記錄媒體,通過(guò)用計(jì)算機(jī)讀取這種記錄媒體,可以實(shí)現(xiàn)聲音編碼裝置的功能。
權(quán)利要求41~79的發(fā)明,是與權(quán)利要求1~39的聲音編碼裝置對(duì)應(yīng)的、作為基本上相同內(nèi)容的聲音編碼方法的發(fā)明,分別具有相同的效果。
權(quán)利要求80所述的發(fā)明,是記錄用于執(zhí)行權(quán)利要求41~79的任一權(quán)項(xiàng)所述的聲音編碼方法的程序的、計(jì)算機(jī)可以讀取的記錄媒體,通過(guò)用計(jì)算機(jī)讀取這種記錄媒體,可以實(shí)現(xiàn)聲音編碼裝置的功能。
權(quán)利要求81~119的發(fā)明,是作為具有與由權(quán)利要求1~39規(guī)定的內(nèi)容基本上相同結(jié)構(gòu)的聲源生成部的聲音譯碼裝置,分別具有相同的效果。
權(quán)利要求120所述的發(fā)明,是記錄用于執(zhí)行權(quán)利要求81~119的任一權(quán)項(xiàng)所述的聲音譯碼裝置的功能的程序的、計(jì)算機(jī)可以讀取的記錄媒體,通過(guò)用計(jì)算機(jī)讀取這種記錄媒體,可以實(shí)現(xiàn)聲音編碼裝置的功能。
權(quán)利要求121~159的發(fā)明,是作為具有與權(quán)利要求41~79規(guī)定的內(nèi)容基本上相同結(jié)構(gòu)的聲源生成方法的聲音譯碼方法,分別具有相同的效果。
權(quán)利要求160的發(fā)明,是記錄用于執(zhí)行權(quán)利要求121~159的任一權(quán)項(xiàng)所述的聲音譯碼方法的程序的、計(jì)算機(jī)可以讀取的記錄媒體,通過(guò)讀取這種記錄媒體,可以實(shí)現(xiàn)聲音編碼裝置的功能。
權(quán)利要求161所述的移動(dòng)通信裝置是作為結(jié)構(gòu)要素具有權(quán)利要求1~41的任一權(quán)項(xiàng)所述的聲音編碼裝置的通信裝置,具有相同的效果。附圖的簡(jiǎn)單說(shuō)明
圖1是表示本發(fā)明實(shí)施例1的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖2是表示本發(fā)明實(shí)施例1的振幅增強(qiáng)窗的形狀與自適應(yīng)編碼矢量和音調(diào)脈沖位置的關(guān)系的模式圖。
圖3是表示本發(fā)明實(shí)施例1的變形例的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖4是表示本發(fā)明實(shí)施例2的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖5是表示本發(fā)明實(shí)施例3的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖6(a)、6(b)是表示本發(fā)明實(shí)施例3的脈沖位置附近限定矢量的配置情形的前半部的模式圖。
圖7(a)、7(b)是表示本發(fā)明實(shí)施例3的脈沖位置附近限定矢量的配置情形的后半部的模式圖。
圖8是表示本發(fā)明實(shí)施例4的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖9(a)、9(b)是表示本發(fā)明實(shí)施例4的脈沖聲源搜索范圍的模式圖的一部分。
圖10是表示本發(fā)明實(shí)施例4的脈沖聲源搜索范圍的模式圖的其余部分。
圖11(a)是表示本發(fā)明實(shí)施例5的搜索位置計(jì)算器的結(jié)構(gòu)的框圖。
圖11(b)和圖11(c)分別表示脈沖搜索位置模式的一例的模式圖。
圖12是表示本發(fā)明實(shí)施例6的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖13(a)~13(d)是表示用本發(fā)明實(shí)施例6的搜索位置計(jì)算器計(jì)算的脈沖搜索位置的一例的模式圖。
圖14是表示本發(fā)明實(shí)施例7的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖15是表示本發(fā)明實(shí)施例8的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖16(a)、16(b)是表示本發(fā)明實(shí)施例8使用的規(guī)定搜索位置模式的一例的一覽圖。
圖17是表示本發(fā)明實(shí)施例9的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖18是表示本發(fā)明實(shí)施例10的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖19是表示本發(fā)明實(shí)施例10的音調(diào)峰值位置預(yù)測(cè)器的預(yù)測(cè)原理的模式圖。
圖20是表示本發(fā)明實(shí)施例11的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖21是表示本發(fā)明實(shí)施例12的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖22是分別表示本發(fā)明實(shí)施例12的搜索位置計(jì)算器輸出的某一聲源脈沖的搜索位置模式、與不具有索引更新手段時(shí)的各位置對(duì)應(yīng)的索引和與具有索引更新手段時(shí)的各位置對(duì)應(yīng)的索引的模式圖。
圖23是表示本發(fā)明實(shí)施例13的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖24(a)是表示與本發(fā)明實(shí)施例13的搜索位置計(jì)算器輸出的聲源脈沖搜索位置的模式和各位置對(duì)應(yīng)的相對(duì)位置與絕對(duì)位置的對(duì)應(yīng)的模式圖。
圖24(b)是表示在不具有本發(fā)明實(shí)施例13的脈沖序號(hào)和索引的更新手段時(shí)分配給各聲源脈沖的脈沖序號(hào)和索引的模式圖。
圖24(c)是表示在具有本發(fā)明實(shí)施例13的脈沖序號(hào)和索引的更新手段時(shí)分配給各聲源脈沖的脈沖序號(hào)和索引的模式圖。
圖25是表示本發(fā)明實(shí)施例14的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖26(a)是表示在本發(fā)明實(shí)施例14中使用的固定搜索位置模式的一例的模式圖。
圖26(b)、26(c)分別表示用在本發(fā)明實(shí)施例14中使用的搜索位置計(jì)算器計(jì)算的聲源脈沖搜索位置的模式的一例的模式圖。
圖26(d)是表示在本發(fā)明實(shí)施例14的脈沖位置搜索器中使用的聲源脈沖搜索位置的模式的一例的模式圖。
圖27是表示本發(fā)明實(shí)施例15的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖28(a)、28(b)是分別表示在音調(diào)峰值計(jì)算器中使音調(diào)峰值和次峰值錯(cuò)誤的自適應(yīng)編碼矢量波形的一例的模式圖。
圖28(c)是表示在音調(diào)峰值位置修正器中圖示搜索音調(diào)峰值位置的范圍的、自適應(yīng)編碼矢量波形的一例的模式圖。
圖29是表示本發(fā)明實(shí)施例16的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖30是表示本發(fā)明實(shí)施例17的CELP型聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖31是與先有的聲源生成部一起示出本發(fā)明的CELP型聲音編碼裝置的優(yōu)選實(shí)施例的整體結(jié)構(gòu)的框圖。
圖32是與先有的聲源生成部一起示出本發(fā)明的CELP型聲音譯碼裝置的優(yōu)選實(shí)施例的整體結(jié)構(gòu)的框圖。
圖33是使用本發(fā)明的CELP型聲音編碼裝置的移動(dòng)通信裝置的優(yōu)選實(shí)施例的框圖。
圖34是表示先有的一般的CELP聲音編碼裝置的聲源生成部的結(jié)構(gòu)的框圖。
圖35是表示先有的具有噪音聲源的音調(diào)周期化部的CELP聲音編碼裝置的聲音生成部的結(jié)構(gòu)的框圖。用于實(shí)施發(fā)明的最佳的形式下面,通過(guò)聲音編碼裝置的聲源生成部的幾個(gè)實(shí)施例,使用圖1~圖10說(shuō)明用于實(shí)施本發(fā)明的最佳形式。如后面所述,這些聲源生成部在本發(fā)明的聲音譯碼裝置中也使用相同的結(jié)構(gòu)。
(實(shí)施例1)圖1表示本發(fā)明的實(shí)施例1,表示增強(qiáng)與自適應(yīng)編碼矢量的音調(diào)峰值位置對(duì)應(yīng)的噪音編碼矢量的振幅的聲音編碼裝置的聲源生成部。在圖1中,11是將自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器12輸出的自適應(yīng)編碼表,12是是將從自適應(yīng)編碼表11輸出的自適應(yīng)編碼矢量作為輸入而將音調(diào)峰值位置向振幅增強(qiáng)窗生成器13輸出的音調(diào)峰值位置計(jì)算器,13是將從音調(diào)峰值位置計(jì)算器12輸出的音調(diào)峰值位置作為輸入而將振幅增強(qiáng)窗向振幅增強(qiáng)加窗器16輸出的振幅增強(qiáng)窗生成器,14是存儲(chǔ)噪音編碼矢量并向周期化器15輸出的噪音編碼表,15是將從噪音編碼表14輸出的噪音編碼矢量和音調(diào)周期L作為輸入并將噪音編碼矢量進(jìn)行音調(diào)周期化處理后向振幅增強(qiáng)加窗器16輸出的周期化器,16是將從振幅增強(qiáng)窗生成器13輸出的振幅增強(qiáng)窗和從周期化器15輸出的噪音編碼矢量作為輸入、并將噪音編碼矢量乘以振幅增強(qiáng)窗而輸出最終的噪音編碼矢量的振幅增強(qiáng)加窗器。
下面,使用圖1說(shuō)明上述結(jié)構(gòu)的CELP型聲音編碼裝置的聲源生成部的動(dòng)作。音調(diào)峰值位置計(jì)算器12使用輸入的自適應(yīng)編碼矢量,確定在自適應(yīng)編碼矢量?jī)?nèi)存在的音調(diào)脈沖的位置。音調(diào)脈沖的位置可以通過(guò)使按音調(diào)周期排列的脈沖串和自適應(yīng)編碼矢量的正規(guī)化相互相關(guān)最大化而進(jìn)行確定。另外,也可以通過(guò)使按音調(diào)周期排列的脈沖串通過(guò)合成濾波器與自適應(yīng)編碼矢量通過(guò)合成濾波器的誤差最小化而進(jìn)行。
振幅增強(qiáng)窗生成器13根據(jù)由音調(diào)峰值位置計(jì)算器12確定的音調(diào)脈沖位置生成振幅增強(qiáng)窗。作為振幅增強(qiáng)窗,可以使用各種各樣的窗,例如,以音調(diào)脈沖位置為中心的三角窗在容易進(jìn)行窗長(zhǎng)度的控制這一方面是有利的。
圖2表示從振幅增強(qiáng)窗生成器13輸出的振幅增強(qiáng)窗的形狀與自適應(yīng)編碼矢量的形狀的對(duì)應(yīng)。圖中,虛線位置是由音調(diào)峰值位置計(jì)算器12確定的音調(diào)脈沖位置。
周期化器15使從噪音編碼表14輸出的噪音編碼矢量進(jìn)行音調(diào)周期化處理。音調(diào)周期化是按音調(diào)周期對(duì)噪音編碼矢量進(jìn)行周期化處理,將噪音編碼表的存儲(chǔ)矢量從開頭只分離出音調(diào)周期L部分,在達(dá)到子幀長(zhǎng)之前通過(guò)多次反復(fù)將其連接而進(jìn)行。但是,進(jìn)行音調(diào)周期化處理的只是音調(diào)周期小于子幀長(zhǎng)的情況。
振幅增強(qiáng)加窗器16將從周期化器15輸出的噪音編碼矢量乘以從振幅增強(qiáng)窗生成器13輸出的振幅增強(qiáng)窗。
這樣,按照上述實(shí)施例1,利用在1音調(diào)波形內(nèi)存在的相位信息,可以提高音質(zhì)。
以上,雖然用圖1說(shuō)明了進(jìn)行噪音編碼矢量的周期化的CELP型聲音編碼裝置的聲源部分,但是,對(duì)于直接使用圖11所示的噪音編碼表存儲(chǔ)的噪音編碼矢量的一般的CELP型聲音編碼裝置的聲源部分也可以實(shí)施,該例示于圖3。在圖3中,21是自適應(yīng)編碼表,22是音調(diào)峰值位置計(jì)算器,23是振幅增強(qiáng)窗生成器,24是噪音編碼表,25是振幅增強(qiáng)加窗器,只是不使噪音聲源與音調(diào)周期同步這一點(diǎn)與圖1的聲源生成部不同。
(實(shí)施例2)圖4表示本發(fā)明的實(shí)施例2,對(duì)于具有對(duì)聲音信號(hào)的有聲部的前沿部分應(yīng)用將脈沖串聲源與噪音聲源組合的聲源的結(jié)構(gòu)的CELP型聲音編碼裝置,示出了增強(qiáng)與脈沖串聲源的脈沖位置對(duì)應(yīng)的噪音編碼矢量的振幅的聲音編碼裝置的聲源生成部。在圖4中,31是向振幅增強(qiáng)窗生成器32和加法器33輸出的、置于音調(diào)脈沖的位置的、由按音調(diào)周期L的間隔排列的脈沖串構(gòu)成的脈沖串聲源,32是生成用于增強(qiáng)與脈沖串的脈沖位置對(duì)應(yīng)的位置的噪音編碼矢量振幅的振幅增強(qiáng)窗并向乘法器35輸出的振幅增強(qiáng)窗生成器,33是將脈沖串聲源與從乘法器35輸出的加振幅增強(qiáng)窗后的噪音編碼矢量相加并作為激勵(lì)矢量而輸出的加法器,34是用噪音編碼矢量表現(xiàn)的向乘法器35輸出的噪音聲源,35是對(duì)從噪音聲源34輸出的噪音聲源矢量乘以從振幅增強(qiáng)窗生成器32輸出的振幅增強(qiáng)窗的乘法器。
下面,對(duì)上述結(jié)構(gòu)的聲源生成部使用圖4說(shuō)明其動(dòng)作。脈沖串聲源31是根據(jù)音調(diào)周期L和初始相位P確定脈沖的位置和間隔的脈沖串,音調(diào)周期L和初相位P在聲源生成部的外部通過(guò)別的方式進(jìn)行計(jì)算。脈沖串聲源雖然可以是將脈沖排列的聲源,但是,還是可以表現(xiàn)在采樣點(diǎn)與采樣點(diǎn)之間存在的脈沖的聲源的性能為好。同樣,對(duì)于初始相位(最初的脈沖的位置),也是用可以表現(xiàn)采樣點(diǎn)與采樣點(diǎn)之間的分?jǐn)?shù)精度進(jìn)行表示的性能好,在可以分配給該信息的位數(shù)不充分時(shí),即使可以用整數(shù)精度得到良好的性能,用于位置確定的搜索也是容易的。
振幅增強(qiáng)窗生成器32是用于增強(qiáng)與脈沖串聲源矢量的脈沖的位置對(duì)應(yīng)的位置的噪音聲源矢量的振幅的窗,和在實(shí)施例1中說(shuō)明的振幅增強(qiáng)窗相同。可以使用以脈沖的位置為中心的三角窗等。
加法器33將脈沖串聲源矢量31與由乘法器35乘以振幅增強(qiáng)窗的噪音聲源矢量34相加,并作為激勵(lì)聲源矢量而輸出。
圖4中雖然未示出,但是,如果采用在輸入加法器33之前對(duì)脈沖串聲源矢量和噪音聲源矢量分別乘以適當(dāng)?shù)脑鲆娴慕Y(jié)構(gòu),將成為表現(xiàn)性更高的聲源生成部。但是,這時(shí)則需要另外傳送增益信息。另外,將脈沖串聲源矢量和噪音聲源矢量的增益固定時(shí),則必須進(jìn)行將脈沖串聲源矢量的功率調(diào)整為與噪音聲源矢量的功率相等從而使脈沖串聲源矢量不致湮沒到噪音聲源矢量中等增益調(diào)整。
這樣,按照上述實(shí)施例2,通過(guò)使噪音聲源矢量的振幅與音調(diào)周期同步地進(jìn)行增強(qiáng),可以提高音質(zhì)。
(實(shí)施例3)圖5表示本發(fā)明的實(shí)施例3,在CELP型聲音編碼裝置中,示出了使用僅限定自適應(yīng)編碼矢量的音調(diào)峰值附近的噪音編碼矢量的聲音編碼裝置的聲源生成部。
在圖5中,41是輸出自適應(yīng)編碼矢量的自適應(yīng)編碼表,42是將從自適應(yīng)編碼表41輸出的自適應(yīng)編碼矢量和音調(diào)周期L作為輸入并將音調(diào)峰值的位置(相位信息)向噪音編碼矢量生成器44輸出的相位搜索器,43是存儲(chǔ)僅在音調(diào)峰值的附近限定矢量長(zhǎng)的噪音編碼矢量并將音調(diào)脈沖位置附近的噪音編碼矢量向噪音編碼矢量生成器44輸出的音調(diào)脈沖位置附近限定型噪音編碼表,44是將從音調(diào)脈沖位置附近限定型噪音編碼表43輸出的噪音編碼矢量和從相位搜索器42輸出的相位信息以及音調(diào)周期L作為輸入、并將噪音編碼矢量向周期化器45輸出的噪音編碼矢量生成器,45是將從噪音編碼矢量生成器44輸出的噪音編碼矢量和音調(diào)周期L作為輸入并輸出最終的噪音編碼矢量的周期化器。
下面,對(duì)上述結(jié)構(gòu)的聲音編碼裝置的聲源生成部使用圖5說(shuō)明其動(dòng)作。相位搜索器42使用從自適應(yīng)編碼表41輸出的自適應(yīng)編碼矢量,確定在自適應(yīng)編碼矢量?jī)?nèi)存在的音調(diào)脈沖的位置(相位)。音調(diào)脈沖的位置可以通過(guò)使按音調(diào)周期排列的脈沖串與自適應(yīng)編碼矢量的正規(guī)化相互相關(guān)最大化而進(jìn)行確定。另外,也可以通過(guò)使按音調(diào)周期排列的脈沖串通過(guò)合成濾波器后與自適應(yīng)編碼矢量通過(guò)合成濾波器后的誤差最小化而精度更高地求出。
音調(diào)脈沖位置附近限定型噪音編碼表43存儲(chǔ)用于應(yīng)用于自適應(yīng)編碼矢量的音調(diào)峰值附近的噪音編碼矢量,矢量長(zhǎng)為固定長(zhǎng)度,與音調(diào)周期和幀(子幀)長(zhǎng)無(wú)關(guān)。作為音調(diào)峰值附近的范圍,可以是以音調(diào)峰值為中心前后相等的長(zhǎng)度的范圍,但是,將音調(diào)峰值之后的范圍取得比音調(diào)峰值之前的范圍大的音質(zhì)劣化還是少。例如,將附近的范圍取為5msec時(shí),將音調(diào)峰值之前取為0.625msec、將音調(diào)峰值之后取為4.375msec比將音調(diào)峰值前后各取為2.5msec要好。另外,作為矢量長(zhǎng),在子幀長(zhǎng)為10msec時(shí),如果是5msec左右,則可實(shí)現(xiàn)與使矢量長(zhǎng)大于10msec的情況基本上相同的音質(zhì)。
噪音編碼矢量生成器44將從音調(diào)脈沖位置限定型噪音編碼表43輸出的噪音編碼矢量配置到由相位搜索器42確定的音調(diào)脈沖的位置。
圖6(a)、6(b)和圖7(a)、7(b)是圖解將從音調(diào)脈沖位置限定型噪音編碼表43輸出的噪音編碼矢量配置到與由噪音編碼矢量生成器44確定的音調(diào)脈沖位置對(duì)應(yīng)的位置處的方法的圖。如圖6(a)所示,基本上是將音調(diào)脈沖位置限定噪音編碼矢量配置到音調(diào)脈沖位置的附近。在圖6(a)、6(b)中,表示為音調(diào)周期化范圍的部分(斜線部)是在周期化部45中進(jìn)行音調(diào)周期化處理時(shí)作為對(duì)象的部分。對(duì)于圖6(a)那樣的情況,在噪音編碼矢量生成器44中,不需要進(jìn)行音調(diào)周期化處理,但是,對(duì)于圖6(b)所示的情況,由于音調(diào)脈沖的位置位于子幀邊界的附近,所以,在周期化部45中,不能對(duì)從音調(diào)脈沖位置限定型噪音編碼表43輸出的噪音編碼矢量的前半部分(子幀邊界之前的部分)進(jìn)行周期化處理(在周期化部45中,從子幀邊界開始將只分離出音調(diào)周期長(zhǎng)的矢量按音調(diào)周期反復(fù)進(jìn)行排列),于是,在噪音編碼矢量生成器44中,便預(yù)先進(jìn)行音調(diào)周期化處理的動(dòng)作。另外,在子幀邊界之前有音調(diào)脈沖位置時(shí),如果從子幀的開頭只分離出音調(diào)周期進(jìn)行周期化處理,由于音調(diào)脈沖位置附近限定矢量的后半部分未適當(dāng)?shù)剡M(jìn)行音調(diào)周期化處理,所以,如圖7(a)所示的那樣,噪音矢量生成器44在時(shí)間軸的負(fù)方向上也進(jìn)行音調(diào)周期化處理。但是,音調(diào)脈沖位置從子幀開頭開始在音調(diào)周期長(zhǎng)的期間不存在時(shí),就不必進(jìn)行該周期化處理。這樣,通過(guò)在音調(diào)周期化部45之前預(yù)先進(jìn)行音調(diào)周期化處理,便可利用音調(diào)周期化部45進(jìn)行有效地使用音調(diào)位置附近限定矢量的所有部分的音調(diào)周期化處理。在音調(diào)周期小于限定在音調(diào)脈沖位置附近的矢量長(zhǎng)時(shí),就從限定矢量中只分離出音調(diào)周期長(zhǎng)進(jìn)行音調(diào)周期化處理。這時(shí),對(duì)于分離方式,進(jìn)行了各種各樣的考慮,分離為音調(diào)脈沖位置包含在所分離出的矢量中。例如,從音調(diào)脈沖位置開始,使用音調(diào)脈沖位置和音調(diào)周期確定分離的開始點(diǎn),以使從四分之一音調(diào)周期前的點(diǎn)開始分離出1音調(diào)周期。
圖7(b)示出了音調(diào)周期小于限定矢量長(zhǎng)時(shí)的噪音編碼矢量的分離方法的一例。這時(shí),從音調(diào)脈沖位置附近限定噪音編碼矢量的開頭分離出音調(diào)周期長(zhǎng)。這樣,就不必每次計(jì)算分離的開始點(diǎn)。即,如上所述,從音調(diào)脈沖位置開始,從四分之一音調(diào)周期前的點(diǎn)開始分離1音調(diào)周期時(shí),由于音調(diào)周期是變量,所以,必須每次計(jì)算四分之一音調(diào)周期,但是,由于音調(diào)脈沖位置附近限定噪音編碼矢量的開頭位置是固定值,所以,不必進(jìn)行計(jì)算。但是,在從音調(diào)脈沖位置附近限定噪音編碼矢量的開頭只分離出音調(diào)周期長(zhǎng)的矢量中不包含與音調(diào)脈沖位置對(duì)應(yīng)的部分時(shí),就必須錯(cuò)開開始進(jìn)行分離的位置,以使其中包含與音調(diào)脈沖位置對(duì)應(yīng)的部分。
周期化器45對(duì)從噪音編碼矢量生成器44輸出的噪音編碼矢量進(jìn)行音調(diào)周期化處理。音調(diào)周期化就是按音調(diào)周期將噪音編碼矢量進(jìn)行周期化處理,將噪音編碼矢量從開頭只分離出音調(diào)周期L的量,通過(guò)在達(dá)到子幀長(zhǎng)之前多次反復(fù)將其連接而進(jìn)行。但是,進(jìn)行音調(diào)周期化處理的只是音調(diào)周期小于子幀長(zhǎng)的情況。對(duì)于分?jǐn)?shù)精度的音調(diào)周期的情況,則連接通過(guò)內(nèi)插計(jì)算分?jǐn)?shù)精度的點(diǎn)而得到的矢量。
這樣,按照上述實(shí)施例3,通過(guò)使用只限定適應(yīng)編碼矢量的音調(diào)峰值附近的噪音編碼矢量,即使在分配給噪音編碼矢量的位數(shù)少的情況下,也可以減少音質(zhì)劣化,從而可以在殘差功率集中在音調(diào)脈沖附近的有聲部提高音質(zhì)。
(實(shí)施例4)圖8表示本發(fā)明的實(shí)施例4,示出了根據(jù)自適應(yīng)編碼矢量的音調(diào)周期和音調(diào)峰值位置確定脈沖位置的搜索范圍的聲音編碼裝置的聲源生成部。在圖8中,51是保存過(guò)去的激勵(lì)聲源矢量并將所選擇的自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器52和音調(diào)增益乘法器55輸出的自適應(yīng)編碼表,52是將從自適應(yīng)編碼表輸出的自適應(yīng)編碼矢量和音調(diào)周期L作為輸入計(jì)算音調(diào)峰值位置并向搜索范圍計(jì)算器53輸出的音調(diào)峰值位置計(jì)算器,53是將從音調(diào)峰值位置計(jì)算器52輸出的音調(diào)峰值位置和音調(diào)周期L作為輸入計(jì)算搜索脈沖聲源的范圍并向脈沖聲源搜索器54輸出的搜索范圍計(jì)算器,54是將從搜索范圍計(jì)算器53輸出的搜索范圍和音調(diào)周期L作為輸入搜索脈沖聲源并將脈沖聲源矢量向脈沖聲源增益乘法器56輸出的脈沖聲源搜索器,55是將從自適應(yīng)編碼表輸出的自適應(yīng)編碼矢量乘以音調(diào)增益并向加法器57輸出的乘法器,56是將從脈沖聲源搜索器輸出的脈沖聲源矢量乘以脈沖聲源增益并向加法器57輸出的乘法器,57是將乘法器55的輸出和乘法器56的輸出作為輸入進(jìn)行相加并作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖8說(shuō)明上述結(jié)構(gòu)的聲源生成部的動(dòng)作。在圖8中,自適應(yīng)編碼表51從在聲源生成部的外部預(yù)先計(jì)算的追溯到過(guò)去的音調(diào)周期L的點(diǎn)將自適應(yīng)編碼矢量只分離出子幀長(zhǎng),作為自適應(yīng)編碼矢量而輸出。在音調(diào)周期L不滿子幀長(zhǎng)時(shí),在達(dá)到子幀長(zhǎng)之前,將分離出的音調(diào)周期L的矢量反復(fù)連接的矢量作為自適應(yīng)編碼矢量而輸出。
音調(diào)峰值位置計(jì)算器52使用從自適應(yīng)編碼表51輸出的自適應(yīng)編碼矢量確定在自適應(yīng)編碼矢量?jī)?nèi)存在的音調(diào)脈沖的位置。音調(diào)脈沖的位置可以通過(guò)使按音調(diào)周期排列的脈沖串與自適應(yīng)編碼矢量的正規(guī)化相互相關(guān)最大化而進(jìn)行確定。另外,也可以通過(guò)使按音調(diào)周期排列的脈沖串通過(guò)合成濾波器后與自適應(yīng)編碼矢量通過(guò)合成濾波器后的誤差最小化而精度更高地求出。
搜索范圍計(jì)算器53使用輸入的音調(diào)峰值位置和音調(diào)周期L計(jì)算搜索脈沖聲源的范圍。即,根據(jù)音調(diào)峰值的位置信息計(jì)算在1音調(diào)波形中在聽覺上重要的范圍,并將該范圍確定為搜索范圍。由搜索范圍計(jì)算器53確定的具體的搜索范圍示于圖9和圖10。在圖9(a)中,示出了根據(jù)音調(diào)峰值位置從5個(gè)采樣點(diǎn)前的位置開始將32個(gè)采樣點(diǎn)的范圍確定為搜索范圍的情況。在有聲部中,如果使用預(yù)先按音調(diào)周期排列的脈沖串作為脈沖聲源,則在第2個(gè)脈沖的搜索范圍的相同位置發(fā)生脈沖,從而可以有效地表現(xiàn)聲源。圖9(b)表示音調(diào)周期大于圖9(a)時(shí)的情況所確定的搜索范圍的一例。音調(diào)周期長(zhǎng)時(shí),如圖9(a)所示的那樣,如果集中地搜索音調(diào)脈沖附近,則對(duì)1音調(diào)波形的相對(duì)的搜索范圍變窄,從而所能表現(xiàn)的頻帶狹窄,有時(shí)特定的頻帶的頻率成分的表現(xiàn)性惡化。這時(shí),如圖9(b)所示,通過(guò)設(shè)置不搜索所有的采樣點(diǎn)而搜索隔1個(gè)或隔2個(gè)的采樣點(diǎn)的部分取代根據(jù)音調(diào)周期擴(kuò)大搜索范圍,便可不增加搜索的位置的數(shù)量而避免特定頻帶的頻率成分的表現(xiàn)性惡化。
另外,在圖10中示出了使在音調(diào)脈沖位置附近加密而在除此之外的部分稀疏地限定脈沖位置搜索范圍的方法。該限定方法基于脈沖發(fā)生的概率高的位置集中在音調(diào)脈沖附近的統(tǒng)計(jì)結(jié)果。不限定脈沖位置搜索范圍時(shí),在有聲部,在音調(diào)脈沖附近脈沖發(fā)生的概率比在其他部分發(fā)生的概率高。但是,在其他部分,脈沖發(fā)生的概率并不是小到可以忽略的程度。圖10所示的脈沖位置搜索范圍限定方法可以說(shuō)是在圖9(b)所示的方法中根據(jù)脈沖發(fā)生的概率分布進(jìn)行搜索范圍限定的一例。在圖9(a)中,在音調(diào)周期短、最初的脈沖的搜索范圍與第2個(gè)脈沖的搜索范圍重合時(shí),為了不與第2個(gè)脈沖的搜索范圍重合,代之以將最初的脈沖的搜索范圍變窄的方法,有增加脈沖數(shù)的方法及在與第2個(gè)脈沖的搜索范圍重合的搜索范圍內(nèi)進(jìn)行確定的方法(和圖9(a)相同的搜索范圍確定方法)。
脈沖位置搜索器54在由搜索范圍計(jì)算器53確定的搜索范圍(位置)內(nèi)設(shè)立脈沖聲源,輸出合成聲音與輸入聲音最接近的位置。特別是在子幀長(zhǎng)為包含多個(gè)音調(diào)脈沖的長(zhǎng)度并且是有聲定常部中,將按音調(diào)周期間隔排列的脈沖串作為脈沖聲源、從搜索范圍中確定脈沖串的第1條的脈沖位置是有效的。作為脈沖的發(fā)生方法,考慮了很多種,在搜索范圍的例如32個(gè)位置的某處發(fā)生了常數(shù)條(例如4條)脈沖時(shí),則有將32個(gè)位置分為4組搜索所有的組合(8×8×8×8種)用以確定分配1條脈沖的8個(gè)位置中的1個(gè)位置的方法和對(duì)從32個(gè)位置中選擇4個(gè)位置的所有的組合進(jìn)行搜索的方法等。除了振幅1的脈沖的組合外,也可能是通過(guò)將多條(例如2條)脈沖組合的脈沖對(duì)的組合或振幅不同的脈沖的組合而發(fā)生脈沖的方法。
通過(guò)乘法器55和56相乘而得到的增益是使用從自適應(yīng)編碼表51輸出的自適應(yīng)編碼矢量和從脈沖位置搜索器54輸出的脈沖聲源矢量進(jìn)行聲音合成以使與輸入聲音的誤差為最小而對(duì)各矢量所確定的值。這里,假定乘以自適應(yīng)編碼矢量的增益為音調(diào)增益、乘以脈沖聲源矢量的增益為脈沖聲源增益,乘法器55將自適應(yīng)編碼矢量乘以音調(diào)增益并向加法器57輸出。乘法器56將脈沖聲源矢量乘以脈沖聲源增益并向加法器57輸出。
加法器57將從乘法器55輸出的最佳增益乘法運(yùn)算后的自適應(yīng)編碼矢量與從乘法器56輸出的最佳增益乘法運(yùn)算后的脈沖聲源矢量相加,作為激勵(lì)聲源矢量而輸出。
這樣,按照上述實(shí)施例4,即使分配給脈沖的位數(shù)少時(shí),也可以減少音質(zhì)劣化。
(實(shí)施例5)圖11(a)表示本發(fā)明的實(shí)施例5,示出了根據(jù)自適應(yīng)編碼矢量的音調(diào)周期和音調(diào)峰值位置確定脈沖位置的搜索范圍的聲源生成部的脈沖搜索位置確定部,是將圖8的搜索范圍計(jì)算器53進(jìn)一步詳細(xì)表示的圖。在圖11(a)中,61是將音調(diào)周期L作為輸入并將脈沖搜索位置模式向脈沖搜索位置確定器62輸出的脈沖搜索位置模式選擇器,62是分別從脈沖搜索位置模式選擇器61輸入脈沖搜索位置模式、從音調(diào)峰值位置計(jì)算器52輸入音調(diào)峰值位置并將搜索范圍(脈沖搜索位置)向脈沖位置搜索器54輸出的脈沖搜索位置確定器。
下面,使用圖11(a)、11(b)、11(c)說(shuō)明上述結(jié)構(gòu)的聲源生成部的搜索范圍計(jì)算器53的動(dòng)作。脈沖搜索位置模式選擇器61預(yù)先具有多個(gè)種類的脈沖搜索位置模式(該脈沖搜索位置模式由進(jìn)行脈沖搜索的采樣點(diǎn)的位置的集合構(gòu)成,用以音調(diào)峰值位置為0的相對(duì)位置表現(xiàn)采樣點(diǎn)),使用通過(guò)音調(diào)分析而得到的音調(diào)周期L,確定使用哪個(gè)脈沖搜索位置模式,并將脈沖搜索位置模式向脈沖搜索位置確定器62輸出。
圖11(b)、11(c)是表示脈沖搜索位置模式選擇器61預(yù)先具有的脈沖搜索位置模式的一例。圖中的標(biāo)度表示采樣點(diǎn)的位置,帶箭頭的采樣點(diǎn)是脈沖搜索位置(不帶箭頭的部分不進(jìn)行搜索)。標(biāo)度的數(shù)值是表示以根據(jù)自適應(yīng)編碼矢量求出的音調(diào)峰值位置為0的相對(duì)位置的數(shù)值。另外,在圖11(b)、11(c)中,示出了1子幀80采樣的情況。在圖11(b)中,示出了音調(diào)周期L長(zhǎng)(例如大于45采樣)時(shí)的搜索位置模式,在圖11(c)中,示出了音調(diào)周期L短(例如小于44采樣)時(shí)的搜索位置模式。音調(diào)周期L短時(shí),不進(jìn)行整個(gè)子幀的搜索,但是,通過(guò)進(jìn)行音調(diào)周期化處理,在整個(gè)子幀中可以發(fā)生脈沖。音調(diào)周期化可以通過(guò)使用下式(1)很容易地進(jìn)行(ITU-T STUDY GROUP15-CONTRIBUTION 152,“G.729-CODINGOF SPEECH AT 8 KBIT/S USING CONJUGATE-STRUCTUREALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION(CS-ACELP)”,COM15-152-E July 1995)。
code(i)=code(i)+β×code(i-L)…(1)在式(1)中,code()表示脈沖聲源矢量,i表示采樣序號(hào)(在圖11的例中,為0~79)。另外,β是表示周期化的強(qiáng)度的增益值,周期性強(qiáng)時(shí)數(shù)值大,周期性弱時(shí)數(shù)值小(通常,使用0~1.0的值)。在圖11(c)中,在(-4)~48采樣的范圍(53采樣的范圍)內(nèi)進(jìn)行脈沖搜索。因此,音調(diào)周期L小于53(或54)時(shí),也可以使用圖11(c)的搜索范圍模式。但是,通過(guò)音調(diào)周期L采用小于45采樣的情況,可以使2個(gè)音調(diào)峰值位置包含在搜索范圍內(nèi),從而可以與第1個(gè)周期的音調(diào)脈沖波形和第2個(gè)周期的音調(diào)脈沖波形變化的情況以及將所求出的音調(diào)峰值位置錯(cuò)誤地檢測(cè)為實(shí)際的音調(diào)峰值位置的1周期前的位置的情況對(duì)應(yīng)。
脈沖搜索位置確定器62使用從脈沖搜索位置模式選擇器輸出的脈沖搜索位置模式確定當(dāng)前的子幀的脈沖搜索位置,并向脈沖位置搜索器54輸出。由于從脈沖搜索位置模式選擇器62輸出的脈沖搜索位置模式使用以音調(diào)峰值位置為0的相對(duì)位置進(jìn)行表現(xiàn),所以,不能直接用于進(jìn)行脈沖搜索。因此,在變換為以子幀的開頭為0的絕對(duì)位置后,向脈沖位置搜索器54輸出。
(實(shí)施例6)圖12表示本發(fā)明的實(shí)施例6,示出了根據(jù)自適應(yīng)編碼矢量的音調(diào)周期和音調(diào)峰值位置確定脈沖位置的搜索位置、同時(shí)具有切換脈沖聲源使用的脈沖數(shù)的結(jié)構(gòu)的聲音編碼裝置的聲源生成部。在圖12中,71是將自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器72和乘法器76輸出的自適應(yīng)編碼表,72是將通過(guò)音調(diào)分析或自適應(yīng)編碼表搜索在外部求出的音調(diào)周期L和從自適應(yīng)編碼表輸出的自適應(yīng)編碼矢量作為輸入并將音調(diào)峰值位置向搜索位置計(jì)算器74輸出的音調(diào)峰值位置計(jì)算器,73是將通過(guò)音調(diào)分析或自適應(yīng)編碼表搜索在外部求出的音調(diào)周期L作為輸入并將脈沖數(shù)向搜索位置計(jì)算器74輸出的脈沖數(shù)確定器,74是將通過(guò)音調(diào)分析或自適應(yīng)編碼表搜索在外部求出的音調(diào)周期L和從脈沖數(shù)確定器73輸出的脈沖數(shù)以及從音調(diào)峰值位置計(jì)算器72輸出的音調(diào)峰值位置作為輸入、并將脈沖的搜索位置向脈沖位置搜索器75輸出的搜索位置計(jì)算器,75是將通過(guò)音調(diào)分析或自適應(yīng)編碼表搜索在外部求出的音調(diào)周期L和從搜索位置計(jì)算器74輸出的脈沖搜索位置作為輸入、確定發(fā)生在脈沖聲源中使用的脈沖的位置組合并將根據(jù)該組合而生成的脈沖聲源矢量向乘法器77輸出的脈沖位置搜索器,76是將從自適應(yīng)編碼表輸出的自適應(yīng)編碼矢量作為輸入、乘以自適應(yīng)編碼矢量增益并向加法器78輸出的乘法器,77是將從脈沖位置搜索器輸出的脈沖聲源矢量作為輸入、乘以脈沖聲源矢量增益并向加法器78輸出的乘法器,78是將從乘法器76和77輸出的矢量作為輸入進(jìn)行矢量相加并作為聲源矢量而輸出的加法器。
下面,參照?qǐng)D12說(shuō)明上述結(jié)構(gòu)的CELP型聲音編碼裝置的聲源生成部的動(dòng)作。從自適應(yīng)編碼表71輸出的自適應(yīng)編碼矢量向乘法器76輸出,乘以自適應(yīng)編碼矢量增益后向加法器78輸出。音調(diào)峰值位置計(jì)算器72根據(jù)自適應(yīng)編碼矢量檢測(cè)音調(diào)峰值,并將該位置向搜索位置計(jì)算器74輸出。音調(diào)峰值位置的檢測(cè)(計(jì)算)可以通過(guò)使按音調(diào)周期L排列的脈沖串矢量與自適應(yīng)編碼矢量的內(nèi)積最大化而進(jìn)行。另外,也可以通過(guò)使將合成濾波器的脈沖響應(yīng)卷積到按音調(diào)周期L排列的脈沖串矢量上的矢量與將合成濾波器的脈沖響應(yīng)卷積到自適應(yīng)編碼矢量上的矢量的內(nèi)積最大化而更高精度地進(jìn)行音調(diào)峰值位置的檢測(cè)。
脈沖數(shù)確定器73根據(jù)音調(diào)周期L的值確定在脈沖聲源中使用的脈沖的條數(shù),并向搜索位置計(jì)算器74輸出。脈沖數(shù)與音調(diào)周期的關(guān)系預(yù)先根據(jù)學(xué)習(xí)或統(tǒng)計(jì)進(jìn)行確定,可以根據(jù)音調(diào)周期的數(shù)值的范圍確定各范圍的脈沖條數(shù),例如音調(diào)周期小于45采樣時(shí)為5條、大于45采樣小于80采樣時(shí)為4條、大于80采樣時(shí)為3條。音調(diào)周期短時(shí),通過(guò)使用音調(diào)周期化處理,可以將脈沖搜索范圍限定為1~2音調(diào)周期,所以,可以通過(guò)增加脈沖數(shù)來(lái)取代減少位置信息。另外,在波形上,對(duì)于音調(diào)周期短的女聲和音調(diào)周期長(zhǎng)的男聲,波形的特征不同,分別存在適當(dāng)?shù)拿}沖數(shù)。
通常,用于男聲的脈沖性強(qiáng),所以,有脈沖位置比脈沖數(shù)重要的傾向,在女聲中,由于脈沖性弱,所以,有增加脈沖數(shù)避免功率集中的方法比較好的傾向。根據(jù)上述情況,在音調(diào)周期長(zhǎng)時(shí)就減少脈沖數(shù)、在音調(diào)周期短時(shí)就增多某種程度的脈沖數(shù)是有效的。此外,如果在考慮了連續(xù)的子幀間的脈沖條數(shù)的變化以及音調(diào)周期L的變化等確定脈沖數(shù),便可緩和連續(xù)的子幀間的不連續(xù)性和提高有聲部的前沿部的品質(zhì)。具體而言,在連續(xù)的子幀中,根據(jù)音調(diào)周期L確定的脈沖數(shù)從5條減少為3條時(shí),通過(guò)使脈沖數(shù)的減少具有滯后現(xiàn)象,不是從5條急劇地減少為3條而是通過(guò)使之成為4條,便可避免在子幀間脈沖數(shù)發(fā)生大的變化,或者,在連續(xù)的子幀間音調(diào)周期L大不相同時(shí),則是有聲部的前沿的可能性大,所以,減少脈沖數(shù)提高脈沖位置的精度可以提高聲音品質(zhì),因此,在前一子幀的音調(diào)周期L與當(dāng)前子幀的音調(diào)周期L大不相同時(shí),不論當(dāng)前子幀的音調(diào)周期L的值如何,通過(guò)使脈沖數(shù)成為3條等方法進(jìn)行脈沖數(shù)的確定,可以進(jìn)一步提高聲音品質(zhì)。使用這些方法時(shí),容易受音調(diào)分析的倍音調(diào)錯(cuò)誤或半音調(diào)錯(cuò)誤等的影響,所以,如果采取緩和這些要素的影響的脈沖數(shù)確定法(例如,考慮了半音調(diào)或倍音調(diào)的可能性后判斷音調(diào)周期的連續(xù)性等),或者盡可能提高音調(diào)分析的精度,是非常有效的。
搜索位置計(jì)算器74根據(jù)音調(diào)峰值位置和脈沖條數(shù)確定進(jìn)行脈沖搜索的位置。脈沖的搜索位置,在音調(diào)峰值附近分布得緊密,在除此之外的部分分布得稀疏(在沒有搜索所有的采樣點(diǎn)的足夠的位分配時(shí)是有效的)。即,在音調(diào)峰值位置附近,所有的采樣點(diǎn)都是脈沖位置搜索的對(duì)象,但是,在遠(yuǎn)離音調(diào)峰值位置的部分,則擴(kuò)大脈沖位置搜索的間隔,成為每2采樣或3采樣進(jìn)行搜索(例如,如圖11(b)、11(c)所示的那樣確定搜索位置)。另外,在脈沖數(shù)多時(shí),分配給每1條脈沖的位數(shù)少,所以,稀疏部分的間隔比脈沖數(shù)少時(shí)寬(脈沖位置的精度降低)。音調(diào)周期短時(shí),如實(shí)施例5所示的那樣,如果將搜索范圍只限定為從子幀內(nèi)的最初的音調(diào)峰值開始的1音調(diào)周期強(qiáng)的范圍內(nèi),就可以進(jìn)一步提高聲音品質(zhì)。
脈沖位置搜索器75根據(jù)由搜索位置計(jì)算器74確定的搜索位置確定發(fā)生脈沖的位置的最佳組合。脈沖搜索的方法如「ITU-T STUDYGROUP15-CONTRIBUTION 152,“G.729-CODING OF SPEECH AT 8KBIT/S USING CONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITEDLINEAR-PREDICTION(CS-ACELP)”,COM 15-152-E July 1995」所示,例如脈沖數(shù)為4條時(shí),使式(2)實(shí)現(xiàn)最大化來(lái)確定i0~i3的組合。
(DN×DN)/RRDN=dn(i0)+dn(i1)+dn(i2)+dn(i3)RR=rr(i0,i0)+rr(i1,i1)+2×rr(i0,i1)+rr(i2,i2)+2×(rr(i0,i2)+rr(i1,i2))+rr(i3,i3)+2×(rr(i0,i3)+rr(i1,i3)+rr(i2,i3))… (2)其中,dn(i)(i=0~79子幀長(zhǎng)80采樣的情況)是將脈沖聲源成分的目標(biāo)矢量x’(i)按照合成濾波器的脈沖響應(yīng)進(jìn)行反向?yàn)V波后的矢量,rr(i,i)如式(3)所示的那樣是脈沖響應(yīng)的自相關(guān)矩陣。另外,i0、i1、i2、i3所能取得的位置的范圍是由搜索位置計(jì)算器74求出的范圍。具體而言,在脈沖數(shù)為4條時(shí),就成為圖13(a)~13(d)所示的那樣(圖中帶箭頭的部分所能取得的位置,標(biāo)度的數(shù)值是以音調(diào)峰值位置為0的相對(duì)值)。如果利用脈沖位置搜索器75確定了最佳脈沖位置的組合,則由該組合生成的脈沖聲源矢量便向乘法器77輸出,進(jìn)行脈沖編碼矢量增益的乘法運(yùn)算,并向加法器78輸出。
加法器78將自適應(yīng)編碼矢量成分與脈沖聲源矢量成分相加,作為激勵(lì)聲源矢量而輸出。
(實(shí)施例7)圖14表示本發(fā)明的實(shí)施例7,具有在脈沖搜索之前確定脈沖的振幅的結(jié)構(gòu)。示出了CELP型聲音編碼裝置的聲源生成部。在圖14中,81是由過(guò)去的激勵(lì)聲源信號(hào)的緩沖器構(gòu)成的、將自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器82和乘法器88輸出的自適應(yīng)編碼表,82是將通過(guò)音調(diào)分析或自適應(yīng)編碼表搜索在外部求出的音調(diào)周期L和從自適應(yīng)編碼表81輸出的自適應(yīng)編碼矢量作為輸入、并將音調(diào)峰值位置向搜索位置計(jì)算器84和脈沖振幅計(jì)算器87輸出的音調(diào)峰值位置計(jì)算器,83是將通過(guò)音調(diào)分析或自適應(yīng)編碼表搜索在外部求出的音調(diào)周期L作為輸入、并將脈沖數(shù)向搜索位置計(jì)算器84輸出的脈沖數(shù)確定器,84是將通過(guò)音調(diào)分析或自適應(yīng)編碼表搜索在外部求出的音調(diào)周期L和從脈沖數(shù)確定器83輸出的脈沖數(shù)以及從音調(diào)峰值位置計(jì)算器82輸出的音調(diào)峰值位置作為輸入、并將脈沖的搜索位置向脈沖位置搜索器85輸出的搜索位置計(jì)算器,85是將通過(guò)音調(diào)分析或自適應(yīng)編碼表搜索在外部求出的音調(diào)周期L和從搜索位置計(jì)算器84輸出的脈沖搜索位置以及從脈沖振幅計(jì)算器87輸出的脈沖振幅作為輸入、確定發(fā)生在脈沖聲源中使用的脈沖的位置組合并將由該組合而生成的脈沖聲源矢量向乘法器89輸出的脈沖位置搜索器,86是將從乘法器88輸出的(進(jìn)行乘法增益運(yùn)算后的)自適應(yīng)編碼矢量從通過(guò)由外部的LPC分析和LPC量化器確定的線性預(yù)測(cè)濾波器而得到的預(yù)測(cè)殘差信號(hào)中減去、并將該差分信號(hào)向脈沖振幅計(jì)算器87輸出的加法器,87是將從加法器86輸出的差分信號(hào)作為輸入并將脈沖振幅信息向脈沖位置搜索器85輸出的脈沖振幅計(jì)算器,88是將從自適應(yīng)編碼表81輸出的自適應(yīng)編碼矢量作為輸入進(jìn)行自適應(yīng)編碼矢量增益運(yùn)算并向加法器90和86輸出的乘法器,89是將從脈沖位置搜索器85輸出的脈沖聲源矢量作為輸入進(jìn)行脈沖聲源矢量增益運(yùn)算并向加法器90輸出的乘法器,90是進(jìn)行從乘法器88和89輸出的矢量的加法運(yùn)算并作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖14說(shuō)明上述結(jié)構(gòu)的CELP型聲音編碼裝置的聲源生成部的動(dòng)作。從自適應(yīng)編碼表81輸出的自適應(yīng)編碼矢量向乘法器88輸出,進(jìn)行自適應(yīng)編碼矢量增益乘法運(yùn)算后向加法器90和86輸出。
音調(diào)峰值位置計(jì)算器82根據(jù)自適應(yīng)編碼矢量檢測(cè)音調(diào)峰值,并將該位置向搜索位置計(jì)算器84和脈沖振幅計(jì)算器87輸出。音調(diào)峰值位置的檢測(cè)(計(jì)算)可以通過(guò)使按音調(diào)周期L排列的脈沖串矢量與自適應(yīng)編碼矢量的內(nèi)積最大化而進(jìn)行。另外,也可以通過(guò)使將合成濾波器的脈沖響應(yīng)和按音調(diào)周期L排列脈沖串矢量卷積的矢量與將合成濾波器的脈沖響應(yīng)和自適應(yīng)編碼矢量卷積的矢量的內(nèi)積最大化而進(jìn)行更高精度的音調(diào)峰值位置的檢測(cè)。
脈沖數(shù)確定器83根據(jù)音調(diào)周期L的值確定在脈沖聲源中使用的脈沖的條數(shù),并向搜索位置計(jì)算器84輸出。脈沖數(shù)與音調(diào)周期的關(guān)系預(yù)先通過(guò)學(xué)習(xí)或統(tǒng)計(jì)進(jìn)行確定,可以根據(jù)音調(diào)周期的數(shù)值的范圍確定各范圍的脈沖條數(shù),例如,音調(diào)周期小于45采樣時(shí)為5條,大于45采樣小于80采樣時(shí)為4條,大于80采樣時(shí)為3條。此外,如果考慮了連續(xù)的子幀間的脈沖條數(shù)的變化及音調(diào)周期L的變化等確定脈沖數(shù),則可緩和連續(xù)的子幀間的不連續(xù)性和提高有聲部的前沿部的品質(zhì)。具體而言,在連續(xù)的子幀中,根據(jù)音調(diào)周期L確定的脈沖數(shù)從5條減少為3條時(shí),通過(guò)使脈沖數(shù)的減少具有滯后現(xiàn)象、不是急劇地從5條減少為3條而是成為4條來(lái)避免在子幀間脈沖數(shù)發(fā)生大的變化,或者,在連續(xù)的子幀間音調(diào)周期L大不相同時(shí),是有聲部的前沿的可能性大,所以,通過(guò)減少脈沖數(shù)提高脈沖位置的精度來(lái)提高聲音品質(zhì),于是,在前一子幀的音調(diào)周期L與當(dāng)前子幀的音調(diào)周期L大不相同時(shí),不論當(dāng)前子幀的音調(diào)周期L的值如何,利用使脈沖數(shù)成為3條的等方法來(lái)確定脈沖數(shù)可以進(jìn)一步提高聲音品質(zhì)。使用這些方法時(shí),由于容易受音調(diào)分析的倍音調(diào)錯(cuò)誤或半音調(diào)錯(cuò)誤等的影響,所以,采用緩和這些影響的脈沖數(shù)確定法(例如,在考慮了半音調(diào)或倍音調(diào)的可能性后判斷音調(diào)周期的連續(xù)性等)或者盡可能提高音調(diào)分析的精度,都是很有效的。
搜索位置計(jì)算器84根據(jù)音調(diào)峰值位置和脈沖條數(shù)確定進(jìn)行脈沖搜索的位置。脈沖的搜索位置在音調(diào)峰值附近分配得緊密,在除此之外的部分分配得稀疏(在搜索所有的采樣點(diǎn)沒有足夠的位分配時(shí)是有效的)。即,在音調(diào)峰值位置附近,所有的采樣點(diǎn)都是脈沖位置搜索的對(duì)象,但是,在遠(yuǎn)離音調(diào)峰值位置的部分,則擴(kuò)大脈沖位置搜索的間隔,成為每2采樣或3采樣進(jìn)行搜索(例如,如圖11(b)、11(c)所示的那樣確定搜索位置)。另外,在脈沖數(shù)多時(shí),分配給每1條脈沖的位數(shù)少,所以,稀疏部分的間隔比脈沖數(shù)少時(shí)寬(脈沖位置的精度降低)。音調(diào)周期短時(shí),如實(shí)施例5所示的那樣,如果將搜索范圍只限定為從子幀內(nèi)的最初的音調(diào)峰值開始的1音調(diào)周期強(qiáng)的范圍內(nèi),就可以進(jìn)一步提高聲音品質(zhì)。
脈沖位置搜索器85根據(jù)由搜索位置計(jì)算器84確定的搜索位置和由后面所述的脈沖振幅計(jì)算器87確定的脈沖振幅信息確定發(fā)生脈沖的位置的最佳組合。脈沖搜索的方法如「ITU-T STUDY GROUP15-CONTRIBUTION 152,“G.729-CODING OF SPEECH AT 8 KBIT/S USINGCONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITEDLINEAR-PREDICTION(CS-ACELP)”,COM 15-152-E July 1995」所示,例如脈沖數(shù)為4條時(shí),使式(4)實(shí)現(xiàn)最大化來(lái)確定i0~i3的組合。
DN×DN/RRDN=a0×dn(i0)+a1×dn(i1)+a2×dn(i2)+a3×dn(i3)RR=a0×a0×rr(i0,i0)+a1×a1×rr(i1,i1)+2×a0×a1×rr(i0,i1)+a2×a2×rr(i2,i2)+2×(a0×a2×rr(i0,i2)+a1×a2×rr(i1,i2))+a3×a3×rr(i3,i3)+2×(a0×a3×rr(i0,i3)+a1×a3×rr(i1,i3)+a2×a3×rr(i2,i3))…(4)其中,dn(i)(i=0~79子幀長(zhǎng)80采樣的情況)是將脈沖聲源成分的目標(biāo)矢量與合成濾波器的脈沖響應(yīng)進(jìn)行卷積后的矢量,rr(i,i)如式(3)所示的那樣是脈沖響應(yīng)的自相關(guān)矩陣。另外,i0、i1、i2、i3所能取得的位置的范圍是由搜索位置計(jì)算器84求出的范圍。具體而言,在脈沖數(shù)為4條時(shí),就成為圖13(a)~13(d)所示的那樣(圖中帶箭頭的部分所能取得的位置,標(biāo)度的數(shù)值是以音調(diào)峰值位置為0的相對(duì)值)。另外,a0、a1、a2、a3是由脈沖振幅計(jì)算器87求出的脈沖振幅。
由脈沖位置搜索器85確定了最佳脈沖位置的組合時(shí),根據(jù)該組合而生成的脈沖聲源矢量向乘法器89輸出,進(jìn)行脈沖表矢量增益乘法運(yùn)算,并向加法器90輸出。
加法器86將自適應(yīng)編碼矢量成分(將自適應(yīng)編碼矢量乘以自適應(yīng)編碼矢量增益后的矢量成分)從通過(guò)在外部進(jìn)行的LPC分析而得到的線性預(yù)測(cè)殘差信號(hào)(預(yù)測(cè)殘差矢量)中減去,并將該差分信號(hào)向脈沖振幅計(jì)算器87輸出。在CELP型聲音編碼裝置的聲源部中,通常,自適應(yīng)編碼矢量增益和噪音編碼矢量(在本發(fā)明中,相當(dāng)于脈沖聲源矢量)增益在自適應(yīng)編碼表搜索和噪音編碼表搜索都結(jié)束之后進(jìn)行確定,所以,在脈沖位置搜索之前不可能得到將自適應(yīng)編碼矢量乘以自適應(yīng)編碼矢量增益后的矢量。因此,在加法器86中進(jìn)行減法運(yùn)算使用的自適應(yīng)編碼矢量成分就是對(duì)自適應(yīng)編碼矢量乘以在進(jìn)行自適應(yīng)編碼表搜索時(shí)根據(jù)式(5)求出的自適應(yīng)編碼矢量增益(不是最終的最佳自適應(yīng)編碼矢量增益)后的矢量成分。gp=∑n=079x(n)y(n)∑n=079y(n)y(n)]]>…(5)其中,x(n)是所謂的目標(biāo)矢量,這里,就是從進(jìn)行了聽覺加權(quán)后的輸入信號(hào)中除去當(dāng)前子幀的LPC合成濾波器的零輸入響應(yīng)后的矢量。另外,y(n)是合成聲音信號(hào)中由自適應(yīng)編碼矢量生成的成分,這里,就是把將當(dāng)前子幀的LPC合成濾波器和聽覺加權(quán)濾波器縱向連接的濾波器的脈沖響應(yīng)與自適應(yīng)編碼矢量卷積后的成分。
脈沖振幅計(jì)算器87使用由音調(diào)峰值位置計(jì)算器82求出的音調(diào)峰值位置,將從加法器86輸出的差分信號(hào)分割為音調(diào)峰值位置附近和除此之外的部分,求這些部分的功率的平均值或包含在各部分的采樣點(diǎn)的信號(hào)振幅的絕對(duì)值的平均值,并將這些振幅作為音調(diào)峰值位置附近的脈沖振幅和除此之外的部分的脈沖振幅向脈沖位置搜索器85輸出。在脈沖位置搜索器85中,使用音調(diào)脈沖附近的脈沖和除此之外的部分的脈沖中不同的振幅進(jìn)行式(4)的評(píng)價(jià),從而進(jìn)行脈沖位置搜索。從脈沖位置搜索器85輸出由通過(guò)脈沖位置搜索確定的脈沖位置和分配給該位置的脈沖的脈沖振幅所表現(xiàn)的脈沖聲源矢量。
加法器90將自適應(yīng)編碼矢量成分與脈沖聲源矢量成分相加并作為激勵(lì)聲源矢量而輸出。
(實(shí)施例8)圖15表示本發(fā)明的實(shí)施例8,示出了具有根據(jù)音調(diào)周期的連續(xù)性的判斷結(jié)果切換在脈沖搜索中使用的搜索位置的結(jié)構(gòu)的CELP型聲音編碼裝置的聲源生成部。在圖15中,91是將自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器92和乘法器99輸出的自適應(yīng)編碼表,92是將從自適應(yīng)編碼表91輸出的自適應(yīng)編碼矢量和音調(diào)周期L作為輸入、并將自適應(yīng)編碼矢量?jī)?nèi)的音調(diào)峰值位置向搜索位置計(jì)算器94輸出的音調(diào)峰值位置計(jì)算器,93是將音調(diào)周期L作為輸入并將脈沖聲源的脈沖數(shù)向搜索位置計(jì)算器94輸出的脈沖數(shù)確定器,94是將音調(diào)周期L和從音調(diào)峰值位置計(jì)算器92輸出的音調(diào)峰值位置以及從脈沖數(shù)確定器93輸出的脈沖數(shù)作為輸入、并將脈沖的搜索位置通過(guò)開關(guān)98向脈沖位置搜索器97輸出的搜索位置計(jì)算器,95是將當(dāng)前子幀的音調(diào)周期L作為輸入并延遲1子幀后向判斷器96輸出的延遲器,96是將當(dāng)前子幀的音調(diào)周期L和從延遲器95輸出的前一子幀的音調(diào)周期作為輸入并將音調(diào)周期的連續(xù)性的判斷結(jié)果向開關(guān)98輸出的判斷器,97是分別將通過(guò)開關(guān)98從搜索位置計(jì)算器94輸入的脈沖的搜索位置、通過(guò)開關(guān)98輸入的固定搜索位置和通過(guò)開關(guān)98輸入的音調(diào)周期L作為輸入、使用輸入的搜索位置和音調(diào)周期L進(jìn)行脈沖位置的搜索并將脈沖聲源矢量向乘法器100輸出的脈沖位置搜索器。98是根據(jù)從判斷器96輸入的判斷結(jié)果而切換的連動(dòng)的2系統(tǒng)的開關(guān),一個(gè)系統(tǒng)的開關(guān)用于切換由搜索位置計(jì)算器94計(jì)算脈沖的搜索位置的搜索位置和預(yù)先確定的固定搜索位置,另一個(gè)系統(tǒng)的開關(guān)用于控制將音調(diào)周期L輸入還是不輸入脈沖位置搜索器97的通/斷(ON/OFF)。99是將從自適應(yīng)編碼表91輸出的自適應(yīng)編碼矢量作為輸入、乘以自適應(yīng)編碼矢量增益并向加法器101輸出的乘法器,100是將從脈沖位置搜索器97輸出的脈沖聲源矢量作為輸入、乘以脈沖聲源矢量增益并向加法器101輸出的乘法器,101是將從乘法器99和100輸出的矢量相加并作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖15說(shuō)明上述結(jié)構(gòu)的CELP型聲音編碼裝置的聲源生成部的動(dòng)作。自適應(yīng)編碼表91由過(guò)去的激勵(lì)聲源的緩沖器構(gòu)成,根據(jù)通過(guò)外部的音調(diào)分析或由自適應(yīng)編碼表搜索裝置求出的音調(diào)周期或音調(diào)延遲從激勵(lì)聲源的緩沖器中取出相應(yīng)的部分,作為自適應(yīng)編碼矢量,向音調(diào)峰值位置計(jì)算器92和乘法器99輸出。從自適應(yīng)編碼表91向乘法器99輸出的自適應(yīng)編碼矢量乘以自適應(yīng)編碼矢量增益后向加法器101輸出。
音調(diào)峰值位置計(jì)算器92根據(jù)自適應(yīng)編碼矢量檢測(cè)音調(diào)峰值,并將該位置向搜索位置計(jì)算器94輸出。音調(diào)峰值位置的檢測(cè)(計(jì)算),可以通過(guò)使按音調(diào)周期L排列的脈沖串矢量與自適應(yīng)編碼矢量的內(nèi)積最大化而進(jìn)行。另外,也可以通過(guò)使將合成濾波器的脈沖響應(yīng)和按音調(diào)周期L排列脈沖串矢量卷積的矢量與將合成濾波器的脈沖響應(yīng)和自適應(yīng)編碼矢量卷積的矢量的內(nèi)積最大化而進(jìn)行更高精度的音調(diào)峰值位置的檢測(cè)。
脈沖數(shù)確定器93根據(jù)音調(diào)周期L的值確定在脈沖聲源中使用的脈沖的條數(shù),并向搜索位置計(jì)算器94輸出。脈沖數(shù)與音調(diào)周期的關(guān)系預(yù)先通過(guò)學(xué)習(xí)或統(tǒng)計(jì)進(jìn)行確定,可以根據(jù)音調(diào)周期的數(shù)值的范圍確定各范圍的脈沖條數(shù),例如,音調(diào)周期小于45采樣時(shí)為5條,大于45采樣小于80采樣時(shí)為4條,大于80采樣時(shí)為3條。
搜索位置計(jì)算器94根據(jù)音調(diào)峰值位置和脈沖條數(shù)確定進(jìn)行脈沖搜索的位置。脈沖的搜索位置在音調(diào)峰值附近分配得緊密,在除此之外的部分分配得稀疏(在搜索所有的采樣點(diǎn)沒有足夠的位分配時(shí)是有效的)。即,在音調(diào)峰值位置附近,所有的采樣點(diǎn)都是脈沖位置搜索的對(duì)象,但是,在遠(yuǎn)離音調(diào)峰值位置的部分,則擴(kuò)大脈沖位置搜索的間隔,成為按每2采樣或3采樣進(jìn)行搜索(例如,如圖11(b)、11(c)所示的那樣確定搜索位置)。另外,在脈沖數(shù)多時(shí),分配給每1條脈沖的位數(shù)少,所以,稀疏部分的間隔比脈沖數(shù)少時(shí)寬(脈沖位置的精度降低)。音調(diào)周期短時(shí),如實(shí)施例5所示的那樣,如果將搜索范圍只限定為從子幀內(nèi)的最初的音調(diào)峰值開始的1音調(diào)周期多的范圍內(nèi),就可以進(jìn)一步提高聲音品質(zhì)。
脈沖位置搜索器97根據(jù)由搜索位置計(jì)算器94確定的搜索位置或預(yù)先確定的固定搜索位置以及音調(diào)周期L確定發(fā)生脈沖的位置的最佳的組合。脈沖搜索的方法如「ITU-T STUDY GROUP15-CONTRIBUTION 152,“G.729-CODING OF SPEECH AT 8 KBIT/S USINGCONJUGATE-STRUCTURE ALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION(CS-ACELP)”,COM 15-152-E July 1995」所示,例如脈沖數(shù)為4條時(shí),使式(2)實(shí)現(xiàn)最大化來(lái)確定i0~i3的組合。
開關(guān)98的切換根據(jù)判斷器96的判斷結(jié)果進(jìn)行。判斷器96使用當(dāng)前子幀的音調(diào)周期L和從延遲器95輸入的此前的子幀的音調(diào)周期判斷音調(diào)周期是否連續(xù)。具體而言,在當(dāng)前子幀的音調(diào)周期值與此前的子幀的音調(diào)周期值之差小于預(yù)先確定的或通過(guò)計(jì)算求出的閾值時(shí),就判定音調(diào)周期連續(xù)。判定音調(diào)周期連續(xù)時(shí),當(dāng)前子幀就被視為是有聲·有聲定常部,開關(guān)98將搜索位置計(jì)算器94與脈沖位置搜索器97連接,將音調(diào)周期L輸入脈沖位置搜索器97(開關(guān)98的一個(gè)系統(tǒng)切換為搜索位置計(jì)算器94,另一個(gè)系統(tǒng)成為接通(ON)狀態(tài),將音調(diào)周期L輸入脈沖位置搜索器97)。判定音調(diào)周期不連續(xù)時(shí)(當(dāng)前子幀的音調(diào)周期與此前的子幀的音調(diào)周期之差超過(guò)閾值),當(dāng)前子幀就被視為不是有聲·有聲定常部(是無(wú)聲部·有聲前沿部),開關(guān)98將預(yù)先確定的固定搜索位置輸入脈沖搜索器97,音調(diào)周期L不輸入脈沖位置搜索器(開關(guān)98的一個(gè)系統(tǒng)切換為固定搜索位置,另一個(gè)系統(tǒng)成為斷開(OFF)狀態(tài),音調(diào)周期L不輸入脈沖位置搜索器97)。
由脈沖位置搜索器97確定了最佳脈沖位置的組合時(shí),通過(guò)該組合而生成的脈沖聲源矢量向乘法器100輸出,乘以脈沖編碼矢量增益后向加法器101輸出。
加法器101將自適應(yīng)編碼矢量成分與脈沖聲源矢量成分相加,作為激勵(lì)聲源矢量而輸出。
圖16所示的表示出了圖15的固定搜索位置的內(nèi)容的一例。圖16(b)和圖13所示的搜索位置一樣在每1脈沖分配8個(gè)位置時(shí)將搜索位置固定為使搜索位置均等地分布在整個(gè)子幀中(不是在音調(diào)峰值附近緊密而在其他部分稀疏,在總體上以均勻的密度分布)。另外,圖16(a)是表示代之以4個(gè)脈沖中分配給2脈沖的搜索位置減少為4個(gè)的情況而將搜索位置的種類分為4種、子幀內(nèi)的所有的采樣點(diǎn)包含在某個(gè)搜索位置組中的圖(用于表現(xiàn)脈沖位置的位數(shù),圖16(a)、16(b)都和圖13完全相同)。這樣,如圖16(b)所示,由于沒有完全不搜索的位置,所以,即使位數(shù)相同,通常也是圖16(a)的性能好。
在本實(shí)施例中,示出了具有脈沖數(shù)確定器93的脈沖數(shù)可變型的聲音編碼裝置的聲源生成部,但是,在不具有脈沖數(shù)確定器93的脈沖數(shù)固定型的聲音編碼裝置的聲源生成部中,使用了音調(diào)周期的連續(xù)性的脈沖搜索位置切換也是有效的。另外,在本實(shí)施例中,只根據(jù)此前的子幀與當(dāng)前子幀的音調(diào)周期來(lái)判斷音調(diào)周期的連續(xù)性,但是,通過(guò)進(jìn)而利用過(guò)去的子幀的音調(diào)周期,也可以提高判斷的準(zhǔn)確度。
(實(shí)施例9)圖17表示本發(fā)明的實(shí)施例9,音調(diào)增益(自適應(yīng)編碼矢量增益)的量化為2級(jí)量化結(jié)構(gòu),示出了初級(jí)的目標(biāo)是在進(jìn)行自適應(yīng)編碼表搜索之后計(jì)算的音調(diào)增益、具有根據(jù)該初級(jí)的量化音調(diào)增益切換在脈沖搜索中使用的搜索位置的結(jié)構(gòu)的CELP型聲音編碼裝置的聲源生成部。在圖17中,111是將自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器112和音調(diào)增益計(jì)算器116以及乘法器123輸出的自適應(yīng)編碼表,112是將從自適應(yīng)編碼表111輸出的自適應(yīng)編碼矢量和音調(diào)周期L作為輸入并將自適應(yīng)編碼矢量?jī)?nèi)的音調(diào)峰值位置向搜索位置計(jì)算器114輸出的音調(diào)峰值位置計(jì)算器,113是將音調(diào)周期L作為輸入并將脈沖聲源的脈沖數(shù)向搜索位置計(jì)算器114輸出的脈沖數(shù)確定器,114是將音調(diào)周期L和從音調(diào)峰值位置計(jì)算器112輸出的音調(diào)峰值位置以及從脈沖數(shù)確定器113輸出的脈沖數(shù)作為輸入、并將脈沖的搜索位置通過(guò)開關(guān)115向脈沖位置搜索器119輸出的搜索位置計(jì)算器,115是根據(jù)從判斷器118輸入的判斷結(jié)果而切換的連動(dòng)的2系統(tǒng)的開關(guān),一個(gè)系統(tǒng)的開關(guān)用于切換由搜索位置計(jì)算器114計(jì)算脈沖的搜索位置的搜索位置和預(yù)先確定的固定搜索位置,另一個(gè)系統(tǒng)的開關(guān)用于將音調(diào)周期L輸入脈沖位置搜索器119還是不輸入的通/斷(ON/OFF)控制。116是將從自適應(yīng)編碼表111輸出的自適應(yīng)編碼矢量和當(dāng)前幀的目標(biāo)矢量以及脈沖響應(yīng)作為輸入、并將音調(diào)增益向量化器117輸出的音調(diào)增益計(jì)算器,117是將從音調(diào)增益計(jì)算器116輸出的音調(diào)增益量化并向判斷器118和加法器120及122輸出的量化器,118是將從量化器117輸出的初級(jí)量化音調(diào)增益作為輸入并將音調(diào)周期性的判斷結(jié)果向開關(guān)115輸出的判斷器,119是分別將通過(guò)開關(guān)115從搜索位置計(jì)算器114輸入的脈沖的搜索位置、通過(guò)開關(guān)115輸入的固定搜索位置和通過(guò)開關(guān)115輸入的音調(diào)周期L作為輸入、使用輸入的搜索位置和音調(diào)周期L進(jìn)行脈沖位置的搜索并將脈沖聲源矢量向乘法器124輸出的脈沖位置搜索器,120是將從量化器117輸出的初級(jí)量化音調(diào)增益和從差分量化器121輸出的差分量化音調(diào)增益作為輸入并將加法結(jié)果作為最佳量化音調(diào)增益(自適應(yīng)編碼矢量增益)向乘法器123輸出的加法器,121是將從加法器122輸出的差分值作為輸入并將其量化值向加法器120輸出的差分量化器,122是將在確定自適應(yīng)編碼矢量和脈沖聲源矢量后在外部計(jì)算的最佳音調(diào)增益(自適應(yīng)編碼矢量增益)和從量化器117輸出的初級(jí)量化音調(diào)增益(自適應(yīng)編碼矢量增益)作為輸入并將它們的差分向差分量化器121輸出的加法器,123是將從自適應(yīng)編碼表111輸出的自適應(yīng)編碼矢量作為輸入、乘以從加法器120輸出的量化音調(diào)增益(自適應(yīng)編碼矢量增益)并向加法器125輸出的乘法器,124是將從脈沖位置搜索器119輸出的脈沖聲源矢量作為輸入、乘以脈沖聲源矢量增益并向加法器125輸出的乘法器,125是將從乘法器123和124輸入的矢量相加并作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖17說(shuō)明上述結(jié)構(gòu)的聲音編碼裝置的聲源生成部的動(dòng)作。自適應(yīng)編碼表111由過(guò)去的激勵(lì)聲源的緩沖器構(gòu)成,根據(jù)外部的音調(diào)分析或通過(guò)自適應(yīng)編碼表搜索裝置求出的音調(diào)周期或音調(diào)延遲,從激勵(lì)聲源的緩沖器中取出相應(yīng)的部分,并作為自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器112和音調(diào)增益計(jì)算器116以及乘法器123輸出。從自適應(yīng)編碼表111向乘法器輸出的自適應(yīng)編碼矢量乘以從加法器120輸出的量化音調(diào)增益(自適應(yīng)編碼矢量增益)后向加法器125輸出。
音調(diào)峰值位置計(jì)算器112根據(jù)自適應(yīng)編碼矢量檢測(cè)音調(diào)峰值,并將該位置向搜索位置計(jì)算器114輸出。音調(diào)峰值位置的檢測(cè)(計(jì)算)可以通過(guò)使按音調(diào)周期L排列的脈沖串矢量與自適應(yīng)編碼矢量的內(nèi)積最大化而進(jìn)行。另外,也可以通過(guò)使將合成濾波器的脈沖響應(yīng)和按音調(diào)周期L排列脈沖串矢量卷積的矢量與將合成濾波器的脈沖響應(yīng)和自適應(yīng)編碼矢量卷積的矢量的內(nèi)積最大化而進(jìn)行更高精度的音調(diào)峰值位置的檢測(cè)。
脈沖數(shù)確定器113根據(jù)音調(diào)周期L的值確定在脈沖聲源中使用的脈沖的條數(shù),并向搜索位置計(jì)算器114輸出。脈沖數(shù)與音調(diào)周期的關(guān)系預(yù)先通過(guò)學(xué)習(xí)或統(tǒng)計(jì)進(jìn)行確定,可以根據(jù)音調(diào)周期的數(shù)值的范圍確定各范圍的脈沖條數(shù),例如,音調(diào)周期小于45采樣時(shí)為5條,大于45采樣小于80采樣時(shí)為4條,大于80采樣時(shí)為3條。
搜索位置計(jì)算器114根據(jù)音調(diào)峰值位置和脈沖條數(shù)確定進(jìn)行脈沖搜索的位置。脈沖的搜索位置在音調(diào)峰值附近分配得緊密,在除此之外的部分分配得稀疏(在搜索所有的采樣點(diǎn)沒有足夠的位分配時(shí)是有效的)。即,在音調(diào)峰值位置附近,所有的采樣點(diǎn)都是脈沖位置搜索的對(duì)象,但是,在遠(yuǎn)離音調(diào)峰值位置的部分,則擴(kuò)大脈沖位置搜索的間隔,成為按每2采樣或3采樣進(jìn)行搜索(例如,如圖11(b)、11(c)所示的那樣確定搜索位置)。另外,在脈沖數(shù)多時(shí),分配給每1條脈沖的位數(shù)少,所以,稀疏部分的間隔比脈沖數(shù)少時(shí)寬(脈沖位置的精度降低)。音調(diào)周期短時(shí),如實(shí)施例5所示的那樣,如果將搜索范圍只限定為從子幀內(nèi)的最初的音調(diào)峰值開始的1音調(diào)周期多的范圍內(nèi),就可以進(jìn)一步提高聲音品質(zhì)。
脈沖位置搜索器119根據(jù)由搜索位置計(jì)算器114確定的搜索位置或預(yù)先確定的固定搜索位置以及音調(diào)周期L確定發(fā)生脈沖的位置的最佳的組合。脈沖搜索的方法如「ITU-T STUDY GROUP15-CONTRIBUTION 152,“G.729-CODING OF SPEECH AT 8 KBIT/S USINGCONJUGATE-STRUCTUREALGEBRAIC-CODE-EXCITED LINEAR-PREDICTION(CS-ACELP)”,COM 15-152-E July 1995」所示,例如脈沖數(shù)為4條時(shí),使式(2)實(shí)現(xiàn)最大化來(lái)確定i0~i3的組合。
開關(guān)115的切換根據(jù)判斷器118的判斷結(jié)果進(jìn)行。判斷器118使用從量化器117輸出的初級(jí)量化音調(diào)增益判斷當(dāng)前子幀是否為音調(diào)周期性強(qiáng)的子幀。具體而言,在初級(jí)量化音調(diào)增益處于預(yù)先確定的或通過(guò)計(jì)算求出的范圍內(nèi)時(shí),就判定音調(diào)周期性強(qiáng)。判定音調(diào)周期性強(qiáng)時(shí),當(dāng)前子幀就被視為是有聲·有聲定常部,開關(guān)115將搜索位置計(jì)算器114與脈沖位置搜索器119連接,將音調(diào)周期L輸入脈沖位置搜索器119(開關(guān)115的一個(gè)系統(tǒng)切換為搜索位置計(jì)算器114,另一個(gè)系統(tǒng)成為接通(ON)狀態(tài),將音調(diào)周期L輸入脈沖位置搜索器119)。判定音調(diào)周期不連續(xù)時(shí)(當(dāng)前子幀的音調(diào)周期與此前的子幀的音調(diào)周期之差超過(guò)閾值),當(dāng)前子幀就被視為不是有聲·有聲定常部(是無(wú)聲部·有聲前沿部),開關(guān)115將預(yù)先確定的固定搜索位置輸入脈沖搜索器119,音調(diào)周期L不輸入脈沖位置搜索器(開關(guān)115的一個(gè)系統(tǒng)切換為固定搜索位置,另一個(gè)系統(tǒng)成為斷開(OFF)狀態(tài),音調(diào)周期L不輸入脈沖位置搜索器119)。
由脈沖位置搜索器119確定了最佳脈沖位置的組合時(shí),通過(guò)該組合而生成的脈沖聲源矢量向乘法器124輸出,乘以脈沖編碼矢量增益后向加法器125輸出。
音調(diào)增益計(jì)算器116使用將把當(dāng)前子幀的量化LPC合成濾波器與聽覺加權(quán)濾波器縱向連接的濾波器的脈沖響應(yīng)、目標(biāo)矢量以及從自適應(yīng)編碼表輸出的自適應(yīng)編碼矢量,利用式(5)計(jì)算音調(diào)增益(自適應(yīng)編碼矢量增益)。計(jì)算的音調(diào)增益由量化器117進(jìn)行量化,并向判斷音調(diào)周期性的強(qiáng)度的判斷器118和加法器120及122輸出。在加法器122中,計(jì)算在聲源編碼表搜索(自適應(yīng)編碼表搜索和噪音編碼表搜索(在本實(shí)施例中為脈沖位置搜索))全部結(jié)束之后計(jì)算的最佳量化音調(diào)增益與從量化器117輸出的(初級(jí))量化音調(diào)增益的差分,并向差分量化器121輸出。由加法器120將由差分量化器121所量化的差分值與從量化器117輸出的初級(jí)量化音調(diào)增益相加,作為最佳量化音調(diào)增益向乘法器123輸出。
乘法器123將從自適應(yīng)編碼表111輸出的自適應(yīng)編碼矢量乘以最佳量化音調(diào)增益并向加法器125輸出。
加法器125將自適應(yīng)編碼矢量成分與脈沖聲源矢量成分相加,并作為激勵(lì)聲源矢量而輸出。
在本實(shí)施例中,作為判斷器118的輸入,使用了當(dāng)前子幀的初級(jí)量化音調(diào)增益,但是,在使用通常的增益量化的情況下(不是使用本實(shí)施例所示的多級(jí)量化的情況),也可以將此前的子幀的量化音調(diào)增益(自適應(yīng)編碼矢量增益)作為判斷器118的輸入。另外,在本實(shí)施例中,示出了具有脈沖數(shù)確定器的脈沖數(shù)可變型的聲音編碼裝置的聲源生成部,但是,在不具有脈沖數(shù)確定器的脈沖數(shù)固定型的聲音編碼裝置的聲源生成部中,使用音調(diào)增益的值判斷周期性的強(qiáng)度進(jìn)行脈沖搜索位置切換也是有效的。
(實(shí)施例10)圖18表示本發(fā)明的實(shí)施例10,示出了利用連續(xù)的子幀間的聲源信號(hào)波形的相位的連續(xù)性反向?qū)υ胍艟幋a表進(jìn)行相位自適應(yīng)處理的切換的聲音編碼裝置的聲源生成部。在圖18中,1801是將自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器1802和乘法器1810輸出的自適應(yīng)編碼表,1802是將從自適應(yīng)編碼表1801輸出的自適應(yīng)編碼矢量和音調(diào)周期L作為輸入、并將自適應(yīng)編碼矢量?jī)?nèi)的音調(diào)峰值位置向延遲器1803和判斷器1806以及搜索位置計(jì)算器1807輸出的音調(diào)峰值位置計(jì)算器,1803是將從音調(diào)峰值位置計(jì)算器1802輸出的音調(diào)峰值位置作為輸入并延遲1子幀后向音調(diào)峰值位置預(yù)測(cè)器1805輸出的延遲器,1804是將音調(diào)周期L作為輸入并延遲1子幀后向音調(diào)峰值位置預(yù)測(cè)器1805輸出的延遲器,1805是將從延遲器1803輸出的此前的子幀的音調(diào)峰值位置和從延遲器1804輸出的此前的子幀的音調(diào)周期以及當(dāng)前的子幀的音調(diào)周期L作為輸入、并將預(yù)測(cè)音調(diào)峰值位置向判斷器1806輸出的音調(diào)峰值位置預(yù)測(cè)器,1806是將從音調(diào)峰值位置計(jì)算器1802輸出的音調(diào)峰值位置和從音調(diào)峰值位置預(yù)測(cè)器1805輸出的預(yù)測(cè)音調(diào)峰值位置作為輸入、判斷在此前的子幀與當(dāng)前的子幀中是否有相位的連續(xù)性并將判斷結(jié)果向開關(guān)1808輸出的判斷器,1807是將從音調(diào)峰值位置計(jì)算器1802輸出的音調(diào)峰值位置和音調(diào)周期L作為輸入、并將聲源脈沖的搜索位置通過(guò)開關(guān)1808向脈沖位置搜索器1809輸出的搜索位置計(jì)算器,1808是根據(jù)從判斷器1806輸出的判斷結(jié)果進(jìn)行切換的開關(guān),用于切換從搜索位置計(jì)算器輸出的搜索位置和預(yù)先確定的固定搜索位置。1809是分別將通過(guò)開關(guān)1808從搜索位置計(jì)算器1807輸出的聲源脈沖的搜索位置或通過(guò)開關(guān)1808輸入的固定搜索位置和音調(diào)周期L作為輸入、使用輸入的聲源脈沖搜索位置和音調(diào)周期L搜索聲源脈沖的位置并將脈沖聲源矢量向乘法器1812輸出的脈沖位置搜索器,1810是將從自適應(yīng)編碼表1801輸出的自適應(yīng)編碼矢量作為輸入并乘以量化自適應(yīng)編碼矢量增益后向加法器1811輸出的乘法器,1812是將從脈沖位置搜索器1809輸出的脈沖聲源矢量作為輸入并乘以量化脈沖聲源矢量增益后向加法器1811輸出的乘法器,1811是分別將從乘法器1810和1812輸出的矢量作為輸入、將輸入的矢量相加作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖18說(shuō)明上述結(jié)構(gòu)的聲音編碼裝置的聲源生成部的動(dòng)作。自適應(yīng)編碼表1801由過(guò)去的激勵(lì)聲源的緩沖器構(gòu)成,根據(jù)通過(guò)外部的音調(diào)分析或由自適應(yīng)編碼表搜索裝置求出的音調(diào)周期或音調(diào)延遲,從激勵(lì)聲源的緩沖器中取出相應(yīng)的部分,并作為自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器1802和乘法器1810輸出。從自適應(yīng)編碼表1801向乘法器1810輸出的自適應(yīng)編碼矢量乘以由外部的增益量化器所量化的量化自適應(yīng)編碼矢量增益后,向加法器1811輸出。
音調(diào)峰值位置計(jì)算器1802根據(jù)自適應(yīng)編碼矢量檢測(cè)音調(diào)峰值,并將其位置向延遲器1803和判斷器1806以及搜索位置計(jì)算器1807輸出。音調(diào)峰值位置的檢測(cè)(計(jì)算)可以通過(guò)使按音調(diào)周期L排列的脈沖串矢量與自適應(yīng)編碼矢量的內(nèi)積最大化而進(jìn)行。另外,也可以通過(guò)使將合成濾波器的脈沖響應(yīng)和按音調(diào)周期L排列脈沖串矢量卷積的矢量與將合成濾波器的脈沖響應(yīng)和自適應(yīng)編碼矢量卷積的矢量的內(nèi)積最大化而進(jìn)行更高精度的音調(diào)峰值位置的檢測(cè)。此外,如果增加將包含所檢測(cè)的音調(diào)峰值位置的1音調(diào)周期波形中振幅值最大的位置作為音調(diào)峰值的后處理,也可以避免錯(cuò)誤地檢測(cè)1音調(diào)周期波形內(nèi)的次峰值。
延遲器1803將由音調(diào)峰值位置計(jì)算器1802計(jì)算的音調(diào)峰值位置延遲1子幀后,向音調(diào)峰值位置預(yù)測(cè)器1805輸出。即,此前的子幀的音調(diào)峰值位置從延遲器1803輸入音調(diào)峰值位置預(yù)測(cè)器1805。延遲器1804將音調(diào)周期L延遲1子幀后向音調(diào)峰值位置計(jì)算器1805輸出。即,此前的子幀的音調(diào)周期從延遲器1804輸入音調(diào)峰值位置預(yù)測(cè)器1805。
音調(diào)峰值位置預(yù)測(cè)器1805將從延遲器1803輸入的此前的子幀的音調(diào)峰值位置和從延遲器1804輸入的此前的子幀的音調(diào)周期以及當(dāng)前的子幀的音調(diào)周期L作為輸入、預(yù)測(cè)當(dāng)前的子幀的音調(diào)峰值位置并將預(yù)測(cè)音調(diào)峰值位置向判斷器1806輸出。預(yù)測(cè)音調(diào)峰值位置可以根據(jù)(6)式求出(參見圖19)。
Φ(N)=Φ(N-1)+n×T(N-1)+T(N)-L,n=INT((L-Φ(N-1))/T(N-1))…(6)在上式中,Φ(k)是以該子幀的開頭為0而表示第k個(gè)子幀的最初的音調(diào)峰值位置的,T(k)是第k個(gè)子幀的聲源(聲音)信號(hào)的音調(diào)周期,L是子幀長(zhǎng)。另外,n是表示在第k個(gè)子幀中從最初的音調(diào)峰值位置(Φ(k))到第k個(gè)子幀的最后之間包含幾個(gè)音調(diào)周期長(zhǎng)(小數(shù)點(diǎn)以后舍去)的整數(shù)值(k=0,1,2,…)。
判斷器1806將從音調(diào)峰值位置計(jì)算器1802輸出的音調(diào)峰值位置和從音調(diào)峰值位置預(yù)測(cè)器1805輸出的預(yù)測(cè)音調(diào)峰值位置作為輸入,在音調(diào)峰值位置與預(yù)測(cè)音調(diào)峰值位置距離不大時(shí),就判定相位連續(xù),音調(diào)峰值位置與預(yù)測(cè)音調(diào)峰值位置大不相同時(shí),就判定相位不連續(xù)。并且,將判斷結(jié)果向開關(guān)1808輸出。將音調(diào)峰值位置與預(yù)測(cè)音調(diào)峰值位置進(jìn)行比較時(shí),音調(diào)峰值位置或預(yù)測(cè)音調(diào)峰值位置位于子幀邊界附近時(shí),也考慮1音調(diào)周期后的位置是音調(diào)峰值位置的可能性,進(jìn)行音調(diào)峰值與預(yù)測(cè)音調(diào)峰值位置的比較,來(lái)判斷相位的連續(xù)性。
搜索位置計(jì)算器1807以音調(diào)峰值位置為基準(zhǔn)確定聲源脈沖的搜索位置,并通過(guò)開關(guān)1808將搜索位置向脈沖位置搜索器1809輸出。作為搜索位置的確定方法,例如,如實(shí)施例6或?qū)嵤├?所示的那樣,搜索位置在音調(diào)峰值附近分布得緊密,在除此之外的部分分布得稀疏。如實(shí)施例6或?qū)嵤├?所示,也適用于使用音調(diào)周期信息改變聲源脈沖數(shù)或應(yīng)用限定聲源脈沖的搜索范圍的情形。
開關(guān)1808根據(jù)判斷器1806的判斷結(jié)果,切換進(jìn)行相位自適應(yīng)型的聲源脈沖搜索或進(jìn)行固定位置的聲源脈沖搜索(或一般的噪音編碼表搜索)。即,判斷器1806的判斷結(jié)果為「有相位的連續(xù)性」時(shí),就將搜索位置計(jì)算器1807與脈沖位置搜索器1809連接,將由搜索位置計(jì)算器1807計(jì)算的聲源脈沖搜索位置輸入脈沖位置搜索器1809(即,進(jìn)行相位自適應(yīng)型的聲源脈沖搜索)。相反,判斷器1806的判斷結(jié)果為「無(wú)相位的連續(xù)性」時(shí),就切換為將固定搜索位置輸入脈沖位置搜索器1809(切換為一般的噪音編碼表搜索時(shí),采用另外具有噪音編碼表搜索器的結(jié)構(gòu)或切換為脈沖位置搜索器1809而使用的結(jié)構(gòu))。
脈沖位置搜索器1809使用由搜索位置計(jì)算器1807確定的聲源脈沖搜索位置或預(yù)先確定的固定搜索位置和另外輸入的音調(diào)周期L確定發(fā)生聲源脈沖的位置的最佳的組合。脈沖搜索的方法如「ITU-T Recommendation G.729Coding of speech at 8 kbits/susing Conjugate-structure Algebraic-Code-Excited Linear-Prediction(CS-ACELP),March 1996」所示的那樣,例如,脈沖數(shù)為4條時(shí),以使在實(shí)施例6中所示的式(2)最大化那樣確定i0~i3的組合。這時(shí)的各聲源脈沖的極性在進(jìn)行脈沖位置搜索之前預(yù)先確定,以使之與噪音編碼表成分的目標(biāo)矢量(即從進(jìn)行聽覺加權(quán)后的輸入聲音中減去聽覺加權(quán)合成濾波器的零輸入響應(yīng)信號(hào)和自適應(yīng)編碼表成分的信號(hào)后的信號(hào)矢量)在各位置的極性相等。另外,音調(diào)周期小于子幀長(zhǎng)時(shí),如實(shí)施例5所示的那樣,通過(guò)加上音調(diào)周期化濾波器,使聲源脈沖不是成為脈沖而是成為音調(diào)周期的脈沖串。進(jìn)行這樣的音調(diào)周期化處理時(shí),如果預(yù)先對(duì)聽覺加權(quán)合成濾波器的脈沖響應(yīng)矢量加上音調(diào)周期化濾波器,便可和不進(jìn)行音調(diào)周期化處理的情況一樣,通過(guò)式(2)的最大化而進(jìn)行聲源脈沖的搜索。如果在這樣確定的各聲源脈沖的位置按照所確定的各聲源脈沖的極性發(fā)生脈沖,使用音調(diào)周期L加上音調(diào)周期化濾波器,便可生成脈沖聲源矢量。所生成的脈沖聲源矢量向乘法器1812輸出。從脈沖位置搜索器1809向乘法器1812輸出的脈沖聲源矢量乘以由外部的增益量化器所量化的量化脈沖聲源矢量增益后,向加法器1811輸出。
加法器1811將從乘法器1810輸出的自適應(yīng)編碼矢量成分與從乘法器1812輸出的脈沖聲源矢量成分相加,并作為激勵(lì)聲源矢量而輸出。
在本發(fā)明的聲音編碼裝置中,在有聲定常部以外的部分容易發(fā)生繼續(xù)選擇固定搜索位置的狀態(tài),所以,在傳播傳送路線錯(cuò)誤的影響時(shí),也可以獲得進(jìn)行復(fù)位的效果。(用以音調(diào)峰值位置為0的相對(duì)位置表現(xiàn)脈沖位置時(shí),一旦發(fā)生傳送路線錯(cuò)誤而使編碼器一側(cè)和譯碼器一側(cè)的自適應(yīng)編碼表的內(nèi)容大不相同時(shí),在后續(xù)的幀中即使沒有傳送路線錯(cuò)誤,有時(shí)也會(huì)發(fā)生音調(diào)峰值位置在編碼器一側(cè)和譯碼器一側(cè)繼續(xù)而不一致的現(xiàn)象,從而延長(zhǎng)錯(cuò)誤的影響。)另外,作為脈沖的發(fā)生方法,在搜索范圍例如32個(gè)位置的某個(gè)位置發(fā)生常數(shù)條例如4條脈沖時(shí),除了如上述那樣將32個(gè)位置分為4組并像分配了1條脈沖的8個(gè)位置中的1個(gè)位置確定的那樣搜索所有的組合(8×8×8×8種組合)的方法外,還有對(duì)從32個(gè)位置中選擇4個(gè)位置的全部組合進(jìn)行搜索的方法等。除了振幅1的脈沖的組合外,還可以是將多條(例如2條)脈沖組合的脈沖對(duì)的組合或振幅不同的脈沖的組合而發(fā)生脈沖的方法。
(實(shí)施例11)圖20表示本發(fā)明的實(shí)施例11,示出了根據(jù)在自適應(yīng)編碼矢量的形狀中是否存在強(qiáng)的脈沖性而切換進(jìn)行相位自適應(yīng)處理和不進(jìn)行相位自適應(yīng)處理的CELP型聲音編碼裝置的聲源生成部。在圖20中,2001是將自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器2002和脈沖性判斷器2003以及乘法器2007輸出的自適應(yīng)編碼表,2002是將從自適應(yīng)編碼表2001輸出的自適應(yīng)編碼矢量和音調(diào)周期L作為輸入、并將自適應(yīng)編碼矢量?jī)?nèi)的音調(diào)峰值位置向脈沖性判斷器2003和搜索位置計(jì)算器2004輸出的音調(diào)峰值位置計(jì)算器,2003是將從自適應(yīng)編碼表2001輸出的自適應(yīng)編碼矢量和從音調(diào)峰值位置計(jì)算器2002輸出的音調(diào)峰值位置以及從外部輸入的音調(diào)周期L作為輸入、判斷在自適應(yīng)編碼矢量中是否存在好的脈沖性并將判斷結(jié)果向開關(guān)2005輸出的脈沖性判斷器,2004是將從外部輸入的音調(diào)周期L和從音調(diào)峰值位置計(jì)算器2002輸出的音調(diào)峰值位置作為輸入并將聲源脈沖的搜索位置通過(guò)開關(guān)2005向脈沖位置搜索器2006輸出的搜索位置計(jì)算器,2005是根據(jù)從脈沖性判斷器2003輸出的判斷結(jié)果進(jìn)行切換的開關(guān),用于切換從搜索位置計(jì)算器2004輸出的搜索位置和預(yù)先確定的固定搜索位置。2006是分別將通過(guò)開關(guān)2005從搜索位置計(jì)算器2004輸入的聲源脈沖的搜索位置或通過(guò)開關(guān)2005輸入的固定搜索位置以及從外部輸入的音調(diào)周期L作為輸入、使用輸入的聲源脈沖搜索位置和音調(diào)周期L搜索聲源脈沖的位置并將脈沖聲源矢量向乘法器2009輸出的脈沖位置搜索器,2007是將從自適應(yīng)編碼表2001輸出的自適應(yīng)編碼矢量作為輸入、乘以量化自適應(yīng)編碼矢量增益后向加法器2008輸出的乘法器,2009是將從脈沖位置搜索器2006輸出的脈沖聲源矢量作為輸入、乘以量化脈沖聲源矢量增益后向加法器2008輸出的乘法器,2008是分別將從乘法器2007和2009輸出的矢量作為輸入、將輸入的矢量相加并作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖20說(shuō)明上述結(jié)構(gòu)的聲音編碼裝置的聲源生成部的動(dòng)作。自適應(yīng)編碼表2001由過(guò)去的激勵(lì)聲源的緩沖器構(gòu)成,根據(jù)通過(guò)外部的音調(diào)分析或由自適應(yīng)編碼表搜索裝置求出的音調(diào)周期或音調(diào)延遲,從激勵(lì)聲源的緩沖器中取出相應(yīng)的部分,作為自適應(yīng)編碼矢量,向音調(diào)峰值位置計(jì)算器2002和脈沖性判斷器2003以及乘法器2007輸出。從自適應(yīng)編碼表2001向乘法器2007輸出的自適應(yīng)編碼矢量乘以由外部的增益量化器所量化的量化自適應(yīng)編碼矢量增益后,向加法器2008輸出。
音調(diào)峰值位置計(jì)算器2002根據(jù)自適應(yīng)編碼矢量檢測(cè)音調(diào)峰值,并將其位置分別向脈沖性判斷器2003和搜索位置計(jì)算器2004輸出。音調(diào)峰值位置的檢測(cè)(計(jì)算)可以通過(guò)使按音調(diào)周期L排列的脈沖串矢量與自適應(yīng)編碼矢量的內(nèi)積最大化而進(jìn)行。另外,也可以通過(guò)使將合成濾波器的脈沖響應(yīng)和按音調(diào)周期L排列脈沖串矢量卷積的矢量與將合成濾波器的脈沖響應(yīng)和自適應(yīng)編碼矢量卷積的矢量的內(nèi)積最大化而進(jìn)行更高精度的音調(diào)峰值位置的檢測(cè)。此外,如果增加將包含所檢測(cè)的音調(diào)峰值位置的1音調(diào)周期波形中振幅值最大的位置作為音調(diào)峰值的后處理,也可以避免錯(cuò)誤地檢測(cè)1音調(diào)周期波形內(nèi)的次峰值。
脈沖性判斷器2003判斷自適應(yīng)編碼矢量的信號(hào)功率是否集中在由音調(diào)峰值位置計(jì)算器2002計(jì)算的音調(diào)峰值位置附近,有信號(hào)功率的集中時(shí),就將「有脈沖性」的判斷結(jié)果向開關(guān)2005輸出,看不到信號(hào)功率的集中時(shí),就將「無(wú)脈沖性」的判斷結(jié)果向開關(guān)2005輸出。作為檢查信號(hào)功率是否集中的方法,例如,可以考慮以下一些方法。首先,分離出包含音調(diào)峰值位置的1音調(diào)周期長(zhǎng)的自適應(yīng)編碼矢量,計(jì)算所分離出信號(hào)全體的功率,并設(shè)該功率為PW0。其次,分離出音調(diào)峰值位置的附近的1/2~1/3音調(diào)長(zhǎng)的自適應(yīng)編碼矢量,計(jì)算該分離出的信號(hào)功率,并設(shè)該功率為PW1。PW1/PW0的值小于指定的值(例如,約0.5~0.6)時(shí),則信號(hào)功率集中在音調(diào)峰值附近,所以,可以判定脈沖性高。另外,作為別的判斷方法,還有使用在音調(diào)峰值位置按發(fā)生最初的脈沖的音調(diào)周期間隔排列的脈沖串矢量來(lái)近似自適應(yīng)編碼矢量時(shí)的脈沖串矢量與自適應(yīng)編碼矢量的誤差進(jìn)行判斷的判斷方法。此外,還有在通過(guò)使將合成濾波器的脈沖響應(yīng)與按音調(diào)周期L排列的脈沖串矢量卷積的矢量和將合成濾波器的脈沖響應(yīng)與自適應(yīng)編碼矢量卷積的矢量的正規(guī)化相互相關(guān)函數(shù)最大化來(lái)求音調(diào)峰值位置時(shí)、使用將合成濾波器的脈沖響應(yīng)與按音調(diào)周期L排列的脈沖串矢量卷積和將合成濾波器的脈沖響應(yīng)與自適應(yīng)編碼矢量卷積的矢量的誤差進(jìn)行判斷的判斷方法。作為評(píng)價(jià)這些矢量間的誤差的方法,是利用式(7)所示的預(yù)測(cè)增益及式(8)所示的正規(guī)化相互相關(guān)函數(shù)等。在式(7)和式(8)中,x(n)是自適應(yīng)編碼矢量或?qū)⒑铣蔀V波器的脈沖響應(yīng)與自適應(yīng)編碼矢量卷積的矢量,y(n)是脈沖串矢量或?qū)⒑铣蔀V波器的脈沖響應(yīng)與脈沖串矢量卷積的矢量。不管在哪個(gè)式中,如果數(shù)值大于例如0.3~0.4,就可以判定為在自適應(yīng)編碼矢量中存在某種程度的強(qiáng)的脈沖性。(∑n=079x(n)y(n))2∑n=079x(n)x(n)×∑n=079y(n)y(n)]]>
···(8)搜索位置計(jì)算器2004以音調(diào)峰值位置為基準(zhǔn)確定聲源脈沖的搜索位置,并將搜索位置通過(guò)開關(guān)2005向脈沖位置搜索器2006輸出。作為搜索位置的確定方法,例如,如實(shí)施例6和實(shí)施例8所示的那樣,將搜索位置定為在音調(diào)峰值附近分布得緊密、在除此之外的部分分布得稀疏。如實(shí)施例6和實(shí)施例8所示,使用音調(diào)周期信息改變聲源脈沖數(shù)或應(yīng)用限定聲源脈沖的搜索范圍也是有效的。
開關(guān)2005根據(jù)脈沖性判斷器2003的判斷結(jié)果切換進(jìn)行相位自適應(yīng)型的聲源脈沖搜索或進(jìn)行利用固定位置的聲源脈沖搜索。即,脈沖性判斷器2003的判斷結(jié)果為「有脈沖性」時(shí),就將搜索位置計(jì)算器2004與脈沖位置搜索器2006連接,將由搜索位置計(jì)算器2004計(jì)算的聲源脈沖搜索位置向脈沖位置搜索器2006輸入。(即,進(jìn)行相位自適應(yīng)型的聲源脈沖搜索)。相反,脈沖性判斷器2003的判斷結(jié)果為「無(wú)脈沖性」時(shí),就切換為將固定搜索位置輸入脈沖位置搜索器2006。
脈沖位置搜索器2006使用由搜索位置計(jì)算器2004確定的聲源脈沖搜索位置或預(yù)先確定的固定搜索位置和另外輸入的音調(diào)周期L,確定發(fā)生聲源脈沖的位置的最佳組合。脈沖搜索的方法如「ITU-T Recommendation G.729Coding of Speech at 8 kbits/susing Conjugate-structure Algebraic-Code-Excited Linear-Prediction(CS-ACELP),March 1996」所示的那樣,例如,脈沖數(shù)為4條時(shí),以使在實(shí)施例6中所示的式(2)最大化那樣確定i0~i3的組合。這時(shí)的各聲源脈沖的極性在進(jìn)行脈沖位置搜索之前預(yù)先確定,以使之與噪音編碼表成分的目標(biāo)矢量(即從進(jìn)行聽覺加權(quán)后的輸入聲音中減去聽覺加權(quán)合成濾波器的零輸入響應(yīng)信號(hào)和自適應(yīng)編碼表成分的信號(hào)后的信號(hào)矢量)在各位置的極性相等。另外,音調(diào)周期小于子幀長(zhǎng)時(shí),如實(shí)施例5所示的那樣,通過(guò)加上音調(diào)周期化濾波器,使聲源脈沖不是成為脈沖而是成為音調(diào)周期的脈沖串。進(jìn)行這樣的音調(diào)周期化處理時(shí),如果預(yù)先對(duì)聽覺加權(quán)合成濾波器的脈沖響應(yīng)矢量加上音調(diào)周期化濾波器,便可和不進(jìn)行音調(diào)周期化處理的情況一樣,通過(guò)式(2)的最大化而進(jìn)行聲源脈沖的搜索。如果在這樣確定的各聲源脈沖的位置中按照所確定的各聲源脈沖的極性發(fā)生脈沖,通過(guò)使用音調(diào)周期L加上音調(diào)周期化濾波器,便可生成脈沖聲源矢量。所生成的脈沖聲源矢量向乘法器2009輸出。從脈沖位置搜索器2006向乘法器2009輸出的脈沖聲源矢量乘以由外部的增益量化器所量化的量化脈沖聲源矢量增益后,向加法器2008輸出。
加法器2008將從乘法器2007輸出的自適應(yīng)編碼矢量成分與從乘法器2009輸出的脈沖聲源矢量成分相加,并作為激勵(lì)聲源矢量而輸出。
在本發(fā)明的聲音編碼裝置中,在有聲定常部以外的部分,容易發(fā)生繼續(xù)選擇固定搜索位置的狀態(tài),所以,在傳播傳送路線錯(cuò)誤的影響時(shí),也可以獲得進(jìn)行復(fù)位的效果。(用以音調(diào)峰值位置為0的相對(duì)位置表現(xiàn)脈沖位置時(shí),一旦發(fā)生傳送路線錯(cuò)誤而使編碼器一側(cè)和譯碼器一側(cè)的自適應(yīng)編碼表的內(nèi)容大不相同時(shí),在后續(xù)的幀中即使沒有傳送路線錯(cuò)誤,有時(shí)也會(huì)發(fā)生音調(diào)峰值位置在編碼器一側(cè)和譯碼器一側(cè)繼續(xù)不一致的現(xiàn)象,從而延長(zhǎng)錯(cuò)誤的影響。)另外,作為脈沖的發(fā)生方法,在搜索范圍(例如32個(gè)位置)的某個(gè)位置發(fā)生常數(shù)條(例如4條)脈沖時(shí),除了如上述那樣將32個(gè)位置分為4組并像分配了1條脈沖的8個(gè)位置中的1個(gè)位置確定的那樣搜索所有的組合(8×8×8×8種組合)的方法外,還有對(duì)從32個(gè)位置中選擇4個(gè)位置的全部組合進(jìn)行搜索的方法等。除了振幅1的脈沖的組合外,還可以是利用多條(例如2條)脈沖組合的脈沖對(duì)的組合或振幅不同的脈沖的組合而發(fā)生脈沖的方法。
(實(shí)施例12)圖21表示本發(fā)明的實(shí)施例12,示出了具有更換脈沖搜索位置的索引的索引更新裝置、并根據(jù)自適應(yīng)編碼矢量的音調(diào)周期和音調(diào)峰值位置確定脈沖位置的搜索范圍的CELP型聲音編碼裝置的編碼器一側(cè)的聲源生成部。更具體地說(shuō),就是示出了在按照音調(diào)峰值位置的相對(duì)位置進(jìn)行聲源脈沖搜索的CELP型聲音編碼裝置中、通過(guò)從子幀的開頭一側(cè)開始順序加上脈沖位置的索引來(lái)防止在某一幀中發(fā)生的傳送路線錯(cuò)誤的影響向后續(xù)的沒有傳送路線錯(cuò)誤的幀中傳播的聲源生成部。
在圖21中,2101是保存過(guò)去的激勵(lì)聲源矢量并將所選擇的自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器2102和音調(diào)增益乘法器2106輸出的自適應(yīng)編碼表,2102是將從自適應(yīng)編碼表2101輸出的自適應(yīng)編碼矢量和音調(diào)周期L作為輸入計(jì)算音調(diào)峰值位置并向搜索位置計(jì)算器2103輸出的音調(diào)峰值位置計(jì)算器,2103是將從音調(diào)峰值位置計(jì)算器2102輸出的音調(diào)峰值位置和音調(diào)周期L作為輸入計(jì)算進(jìn)行搜索的范圍并向索引更新單元2104輸出的搜索位置計(jì)算器,2104是更換從搜索位置計(jì)算器2103輸出的各聲源脈沖的各位置的索引并向脈沖位置搜索器2105輸出的索引更新單元,2105是將從索引更新單元2104輸出的搜索位置(更新了表示脈沖位置的索引)和在聲源生成部的外部另外計(jì)算的音調(diào)周期L作為輸入搜索脈沖聲源、將脈沖聲源矢量向脈沖聲源增益乘法器2107輸出、和作為編碼輸出而將表示脈沖聲源矢量的索引向聲源生成部的外部輸出的脈沖位置搜索器,2106是將從自適應(yīng)編碼表2101輸出的自適應(yīng)編碼矢量乘以自適應(yīng)編碼矢量增益后向加法器2108輸出的乘法器,2107是將從脈沖位置搜索器2105輸出的脈沖聲源矢量乘以脈沖聲源矢量增益后向加法器2108輸出的乘法器,2108是將乘法器2106的輸出和乘法器2107的輸出作為輸入進(jìn)行矢量相加并作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖21和圖22說(shuō)明上述結(jié)構(gòu)的聲源生成部的動(dòng)作。在圖21中,自適應(yīng)編碼表2101從追溯到過(guò)去在聲源生成部的外部預(yù)先計(jì)算的音調(diào)周期L的點(diǎn)開始,將自適應(yīng)編碼矢量分離出子幀長(zhǎng),作為自適應(yīng)編碼矢量而輸出。在音調(diào)周期L不足子幀長(zhǎng)時(shí),將分離出的音調(diào)周期L的矢量反復(fù)連接直至達(dá)到子幀長(zhǎng)并作為自適應(yīng)編碼矢量而輸出。
音調(diào)峰值位置計(jì)算器2102使用從自適應(yīng)編碼表2101輸出的自適應(yīng)編碼矢量,確定在自適應(yīng)編碼矢量中存在的音調(diào)峰值的位置。音調(diào)峰值的位置可以通過(guò)使按音調(diào)周期L排列的脈沖串矢量與自適應(yīng)編碼矢量的內(nèi)積最大化而進(jìn)行檢測(cè)。另外,也可以通過(guò)使按音調(diào)周期排列的脈沖串通過(guò)合成濾波器后與自適應(yīng)編碼矢量通過(guò)合成濾波器后的誤差最小化而更高精度地求出。
搜索位置計(jì)算器2103以音調(diào)峰值位置為基準(zhǔn)確定聲源脈沖的搜索位置,并向索引更新單元2104輸出。作為搜索位置的確定方法,例如,如實(shí)施例5或?qū)嵤├?所示的那樣,將搜索位置確定為在音調(diào)峰值附近分布得緊密,在除此之外的部分分布得稀疏。如實(shí)施例6和實(shí)施例8所示,使用音調(diào)周期信息改變聲源脈沖數(shù)或應(yīng)用限定聲源脈沖的搜索范圍也是有效的。由搜索位置計(jì)算器2103確定的具體的搜索位置的例子示于圖10、圖11(b)、圖11(c)和圖13。例如,在圖10中,具體地示出了將脈沖位置搜索范圍限定為在音調(diào)脈沖位置附近分布得緊密而在除此之外的部分分布得稀疏的方法。該限定方法基于發(fā)生脈沖的概率高的位置集中在音調(diào)脈沖附近的統(tǒng)計(jì)結(jié)果。不限定脈沖位置搜索范圍時(shí),在有聲部,在音調(diào)脈沖附近發(fā)生脈沖的概率比在其他部分發(fā)生的概率高。由搜索位置計(jì)算器計(jì)算的是使用到音調(diào)峰值位置的相對(duì)位置的聲源脈沖的搜索位置,在該時(shí)刻,從以音調(diào)峰值位置為0的相對(duì)位置的數(shù)值小的位置開始順序加上索引(參見圖22,在圖22中,示出了與使脈沖數(shù)為4時(shí)的圖13(a)對(duì)應(yīng)的情況)。
索引更新單元2104將從音調(diào)峰值位置的相對(duì)位置小的位置開始順序加上了索引(圖22的相對(duì)位置)的聲源脈沖搜索位置變換為以子幀的開頭為0的絕對(duì)位置后,從絕對(duì)位置小的位置開始順序更新索引(圖22的絕對(duì)位置),并向脈沖位置搜索器2105輸出。通過(guò)這樣處理,在發(fā)生傳送路線錯(cuò)誤等而使得在編碼器一側(cè)和譯碼器一側(cè)計(jì)算的音調(diào)峰值位置不同時(shí),可以減小脈沖位置的偏離。
脈沖位置搜索器2105使用由索引更新單元2104更新了表示各搜索位置的索引的聲源脈沖搜索位置和另外輸入的音調(diào)周期L確定發(fā)生音調(diào)脈沖的位置的最佳組合。脈沖搜索的方法如「ITU-TRecommendation G.729Coding of Speech at 8 kbits/s usingConjugate-structure Algebraic-Code-Excited Linear-Prediction(CS-ACELP),March 1996」所示的那樣,例如,脈沖數(shù)為4條時(shí),以使在實(shí)施例6中所示的式(2)最大化那樣確定i0~i3的組合。這時(shí)的各聲源脈沖的極性在進(jìn)行脈沖位置搜索之前預(yù)先確定,以使之與噪音編碼表成分的目標(biāo)矢量(即從進(jìn)行聽覺加權(quán)后的輸入聲音中減去聽覺加權(quán)合成濾波器的零輸入響應(yīng)信號(hào)和自適應(yīng)編碼表成分的信號(hào)后的信號(hào)矢量)在各位置的極性相等。另外,音調(diào)周期小于子幀長(zhǎng)時(shí),如實(shí)施例5所示的那樣,通過(guò)加上音調(diào)周期化濾波器使聲源脈沖不是成為脈沖而是成為音調(diào)周期的脈沖串。進(jìn)行這樣的音調(diào)周期化處理時(shí),如果預(yù)先對(duì)聽覺加權(quán)合成濾波器的脈沖響應(yīng)矢量加上音調(diào)周期化濾波器,便可和不進(jìn)行音調(diào)周期化處理的情況一樣,通過(guò)式(2)的最大化而進(jìn)行聲源脈沖的搜索。如果在這樣確定的各聲源脈沖的位置,按照所確定的各聲源脈沖的極性發(fā)生脈沖,如果使用音調(diào)周期L加上音調(diào)周期化濾波器,便可生成脈沖聲源矢量。所生成的脈沖聲源矢量向乘法器2107輸出。從脈沖位置搜索器2105向乘法器2107輸出的脈沖聲源矢量乘以由外部的增益量化器所量化的量化脈沖聲源矢量增益后,向加法器2108輸出。在脈沖位置搜索器2105中,表示脈沖聲源矢量的各聲源脈沖的極性和索引信息與脈沖聲源矢量一起另外向聲源生成部的外部輸出。該聲源脈沖的極性和索引信息通過(guò)編碼器及多路器等變換為向傳送路線輸出的數(shù)據(jù)序列串后,向傳送路線傳出。
加法器2108將從乘法器2106輸出的自適應(yīng)編碼矢量成分和從乘法器2107輸出的脈沖聲源矢量成分進(jìn)行矢量相加,并作為激勵(lì)聲源矢量而輸出。
基于本實(shí)施例的索引的分配方法可以應(yīng)用于聲源的位置信息用相對(duì)的值表現(xiàn)的所有情況,僅僅是索引的分配方式不同,所以,對(duì)性能完全沒有影響,可以獲得抑制傳送路線錯(cuò)誤的傳播的效果。
不論譯碼器一側(cè)還是編碼器一側(cè)都具有同樣的索引更新單元。另外,作為脈沖的發(fā)生方法,在搜索范圍(例如32個(gè)位置)的某個(gè)位置發(fā)生常數(shù)條(例如4條)脈沖時(shí),除了如上述那樣將32個(gè)位置分為4組并象分配了1條脈沖的8個(gè)位置中的1個(gè)位置確定的那樣搜索所有的組合(8×8×8×8種組合)的方法外,還有對(duì)從32個(gè)位置中選擇4個(gè)位置的全部組合進(jìn)行搜索的方法等。除了振幅1的脈沖的組合外,還可以是利用多條(例如2條)脈沖組合的脈沖對(duì)的組合或振幅不同的脈沖的組合而發(fā)生脈沖的方法。
(實(shí)施例13)
圖23表示本發(fā)明的實(shí)施例13,示出了具有進(jìn)行脈沖搜索位置的索引和脈沖序號(hào)的分配的脈沖序號(hào)和索引的更新單元的、根據(jù)自適應(yīng)編碼矢量的音調(diào)周期和音調(diào)峰值位置確定脈沖位置的搜索范圍的CELP型聲音編碼裝置的編碼器一側(cè)的聲源生成部。更具體地說(shuō),就是示出了在按照離開音調(diào)峰值位置的相對(duì)位置進(jìn)行聲源脈沖搜索的CELP型聲音編碼裝置中,通過(guò)從子幀的開頭一側(cè)開始順序加上脈沖位置的索引、同時(shí)對(duì)作為相同的索引序號(hào)的不同序號(hào)的脈沖從子幀的開頭一側(cè)開始順序加上脈沖的序號(hào),即在相同的索引序號(hào)時(shí)將各脈沖的序號(hào)確定為使脈沖的序號(hào)越小越靠近子幀的開頭一側(cè),防止在某一幀中發(fā)生的傳送路線錯(cuò)誤的影響向后續(xù)的沒有傳送路線錯(cuò)誤的幀傳播的聲源生成部。
在圖23中,2301是保存過(guò)去的激勵(lì)聲源矢量并將所選擇的自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器2302和音調(diào)增益乘法器2306輸出的自適應(yīng)編碼表,2302是將從自適應(yīng)編碼表2301輸出的自適應(yīng)編碼矢量和音調(diào)周期L作為輸入計(jì)算音調(diào)峰值位置并向搜索位置計(jì)算器2303輸出的音調(diào)峰值位置計(jì)算器,2303是將從音調(diào)峰值位置計(jì)算器2302輸出的音調(diào)峰值位置和音調(diào)周期L作為輸入計(jì)算搜索脈沖聲源的范圍并向脈沖序號(hào)和索引的更新單元2304輸出的搜索位置計(jì)算器,2304是更換從搜索位置計(jì)算器2303輸出的各聲源脈沖的序號(hào)和各聲源脈沖的各位置的索引、并向脈沖位置搜索器2305輸出的脈沖序號(hào)和索引的更新單元,2305是將從脈沖序號(hào)和索引的更新單元2304輸出的搜索位置(已更新了脈沖的序號(hào)和表示脈沖位置的索引)和在聲源生成部的外部另外計(jì)算的音調(diào)周期L作為輸入、搜索脈沖聲源并將脈沖聲源矢量向脈沖聲源增益乘法器2307輸出和將表示脈沖聲源矢量的索引作為編碼輸出向聲源生成部的外部輸出的脈沖位置搜索器,2306是將從自適應(yīng)編碼表2301輸出的自適應(yīng)編碼矢量乘以自適應(yīng)編碼矢量增益后向加法器2308輸出的乘法器,2307是將從脈沖位置搜索器2305輸出的脈沖聲源矢量乘以脈沖聲源矢量增益后向加法器2308輸出的乘法器,2308是將乘法器2306的輸出和乘法器2307的輸出作為輸入進(jìn)行矢量相加并作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖23和圖24說(shuō)明上述結(jié)構(gòu)的聲源生成部的動(dòng)作。在圖23中,自適應(yīng)編碼表2301從追溯到過(guò)去在聲源生成部的外部預(yù)先計(jì)算的音調(diào)周期L的點(diǎn)將自適應(yīng)編碼矢量分離出子幀長(zhǎng)、作為自適應(yīng)編碼矢量而輸出。在音調(diào)周期L不足子幀長(zhǎng)時(shí),將分離出的音調(diào)周期L的矢量反復(fù)連接直至達(dá)到子幀長(zhǎng)并作為自適應(yīng)編碼矢量而輸出。
音調(diào)峰值位置計(jì)算器2302使用從自適應(yīng)編碼表2301輸出的自適應(yīng)編碼矢量,確定在自適應(yīng)編碼矢量中存在的音調(diào)峰值的位置。音調(diào)峰值的位置可以通過(guò)使按音調(diào)周期L排列的脈沖串矢量與自適應(yīng)編碼矢量的內(nèi)積最大化而進(jìn)行檢測(cè)。另外,也可以通過(guò)使按音調(diào)周期排列的脈沖串通過(guò)合成濾波器后與自適應(yīng)編碼矢量通過(guò)合成濾波器后的誤差最小化而更高精度地求出。
搜索位置計(jì)算器2303以音調(diào)峰值位置為基準(zhǔn)確定聲源脈沖的搜索位置并向脈沖序號(hào)和索引的更新單元2304輸出。作為搜索位置的確定方法,例如,如實(shí)施例5或?qū)嵤├?所示的那樣,將搜索位置確定為在音調(diào)峰值附近分布得緊密、在除此之外的部分分布得稀疏。如實(shí)施例6和實(shí)施例8所示,使用音調(diào)周期信息改變聲源脈沖數(shù)或應(yīng)用限定聲源脈沖的搜索范圍也是有效的。由搜索位置計(jì)算器2103確定的具體的搜索位置的例子示于圖10、圖11(b)、圖11(c)和圖13。例如,在圖10中,具體地示出了限定脈沖位置搜索范圍在音調(diào)脈沖位置附近分布得緊密而在除此之外的部分分布得稀疏的方法。該限定方法基于發(fā)生脈沖的概率高的位置集中在音調(diào)脈沖附近的統(tǒng)計(jì)結(jié)果。不限定脈沖位置搜索范圍時(shí),在有聲部中,在音調(diào)脈沖位置發(fā)生脈沖的概率比在其他部分發(fā)生的概率高。由搜索位置計(jì)算器計(jì)算的是使用到音調(diào)峰值位置的相對(duì)位置的聲源脈沖的搜索位置,在該時(shí)刻,從以音調(diào)峰值位置為0的相對(duì)位置的數(shù)值小的位置開始順序加上脈沖序號(hào)和索引(參見圖24(b))。在圖24中,示出了與令脈沖數(shù)為4條時(shí)的圖11(b)、圖13對(duì)應(yīng)的情況。圖24(a)表示令脈沖數(shù)為4條時(shí)由搜索位置計(jì)算器2103確定的聲源脈沖搜索位置,箭頭的長(zhǎng)短、向上向下表示4種各聲源脈沖搜索位置。另外,圖24(a)的相對(duì)位置以音調(diào)峰值位置為0、用-4~+75的數(shù)值表示各采樣點(diǎn),-4之前的點(diǎn)通過(guò)彎折突出到子幀邊界之后的點(diǎn),用正(+)的數(shù)值來(lái)表現(xiàn)。
脈沖序號(hào)和索引的更新單元2304在將從離開音調(diào)峰值位置的相對(duì)位置小的位置開始順序加上了索引(圖24(b))的聲源脈沖搜索位置變換為以子幀的開頭為0的絕對(duì)位置后,從絕對(duì)位置小的位置開始順序更新脈沖序號(hào)和索引(圖24(c))并向脈沖位置搜索器2305輸出。通過(guò)這樣處理后,在因發(fā)生傳送路線錯(cuò)誤等而在編碼器一側(cè)和譯碼器一側(cè)計(jì)算的音調(diào)峰值位置不同時(shí),便可減小脈沖位置的偏離。
脈沖位置搜索器2305使用由脈沖序號(hào)和索引的更新單元2304進(jìn)行了表示各搜索位置的索引更新的聲源脈沖搜索位置和另外輸入的音調(diào)周期L,確定發(fā)生聲源脈沖的位置的最佳組合。脈沖搜索的方法如「ITU-T Recommendation G.729Coding of Speech at8 kbits/s using Conjugate-structure Algebraic-Code-ExcitedLinear-Prediction(CS-ACELP),March 1996」所示的那樣,例如,脈沖數(shù)為4條時(shí),以使在實(shí)施例6中所示的式(2)最大化那樣確定i0~i3的組合。這時(shí)的各聲源脈沖的極性在進(jìn)行脈沖位置搜索之前預(yù)先確定,以使之與噪音編碼表成分的目標(biāo)矢量(即從進(jìn)行聽覺加權(quán)后的輸入聲音中減去聽覺加權(quán)合成濾波器的零輸入響應(yīng)信號(hào)和自適應(yīng)編碼表成分的信號(hào)后的信號(hào)矢量)在各位置的極性相等。另外,音調(diào)周期小于子幀長(zhǎng)時(shí),如實(shí)施例5所示的那樣,通過(guò)加上音調(diào)周期化濾波器,使聲源脈沖不是成為脈沖而是成為音調(diào)周期的脈沖串。進(jìn)行這樣的音調(diào)周期化處理時(shí),如果預(yù)先對(duì)聽覺加權(quán)合成濾波器的脈沖響應(yīng)矢量加上音調(diào)周期化濾波器,便可和不進(jìn)行音調(diào)周期化處理的情況一樣,通過(guò)式(2)的最大化而進(jìn)行聲源脈沖的搜索。如果在這樣確定的各聲源脈沖的位置按照所確定的各聲源脈沖的極性發(fā)生脈沖,通過(guò)使用音調(diào)周期L加上音調(diào)周期化濾波器,便可生成脈沖聲源矢量。所生成的脈沖聲源矢量向乘法器2307輸出。從脈沖位置搜索器2305向乘法器2307輸出的脈沖聲源矢量乘以由外部的增益量化器所量化的量化脈沖聲源矢量增益后,向加法器2308輸出。在脈沖位置搜索器2305中,表示脈沖聲源矢量的各聲源脈沖的極性和索引信息與脈沖聲源矢量一起另外向聲源生成部的外部輸出。該聲源脈沖的極性和索引信息通過(guò)編碼器及多路器等變換為向傳送路線輸出的數(shù)據(jù)系列串后,向傳送路線傳出。
加法器2308將從乘法器2306輸出的自適應(yīng)編碼矢量成分和從乘法器2307輸出的脈沖聲源矢量成分進(jìn)行矢量相加,并作為激勵(lì)聲源矢量而輸出。
基于本實(shí)施例的索引的分配方法可以應(yīng)用于聲源的位置信息用相對(duì)的值表現(xiàn)的所有的情況,僅僅是脈沖序號(hào)和索引的分配方式不同,所以,對(duì)性能完全沒有影響,可以獲得抑制傳送路線錯(cuò)誤傳播的效果。另外,如果可以與固定搜索位置的脈沖聲源切換使用,也可以進(jìn)一步抑制傳送路線錯(cuò)誤的影響的傳播。
譯碼器一側(cè)也具有同樣的脈沖序號(hào)和索引更新單元2304。另外,作為脈沖的發(fā)生方法,在搜索范圍(例如32個(gè)位置)的某個(gè)位置發(fā)生常數(shù)條(例如4條)脈沖時(shí),除了如上述那樣將32個(gè)位置分為4組并象分配了1條脈沖的8個(gè)位置中的1個(gè)位置確定的那樣搜索所有的組合(8×8×8×8種組合)的方法外,還有對(duì)從32個(gè)位置中選擇4個(gè)位置的全部組合進(jìn)行搜索的方法等。除了振幅1的脈沖的組合外,還可以是將多條(例如2條)脈沖組合的脈沖對(duì)的組合或振幅不同的脈沖的組合而發(fā)生脈沖的方法。
(實(shí)施例14)圖25是表示本發(fā)明的實(shí)施例14,示出了使用根據(jù)固定搜索位置和相位自適應(yīng)型搜索位置而生成的聲源脈沖搜索位置進(jìn)行脈沖搜索的CELP型聲音編碼裝置的聲源生成部。
在圖25中,2501是保存過(guò)去的激勵(lì)聲源矢量并將所選擇的自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器2502和音調(diào)增益乘法器2506輸出的自適應(yīng)編碼表,2502是將從自適應(yīng)編碼表2501輸出的自適應(yīng)編碼矢量和從外部輸入的音調(diào)周期L作為輸入計(jì)算音調(diào)峰值位置并向搜索位置計(jì)算器2503輸出的音調(diào)峰值位置計(jì)算器,2503是將從音調(diào)峰值位置計(jì)算器2502輸出的音調(diào)峰值位置和從外部輸入的音調(diào)周期L作為輸入計(jì)算搜索脈沖聲源的位置并向加法器2504輸出的搜索位置計(jì)算器,2504是將從搜索位置計(jì)算器2503輸出的、用以音調(diào)峰值位置為0的相對(duì)位置表示的搜索位置與按固定位置進(jìn)行搜索的搜索位置組合(不是進(jìn)行數(shù)值相加、而是求2種搜索位置的集合之和)并向脈沖位置搜索器2505輸出的加法器,2505是將從加法器2504輸出的搜索位置和在聲源生成部的外部另外計(jì)算的音調(diào)周期L作為輸入搜索脈沖聲源并將脈沖聲源矢量向脈沖聲源增益乘法器2507輸出的脈沖位置搜索器,2506是將從自適應(yīng)編碼表2501輸出的自適應(yīng)編碼矢量乘以自適應(yīng)編碼矢量增益后向加法器2508輸出的乘法器,2507是將從脈沖位置搜索器2505輸出的脈沖聲源矢量乘以脈沖聲源矢量增益后向加法器2508輸出的乘法器,2508是將乘法器2506的輸出和乘法器2507的輸出作為輸入、進(jìn)行矢量相加并作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖25和圖26說(shuō)明上述結(jié)構(gòu)的聲源生成部的動(dòng)作。在圖25中,自適應(yīng)編碼表2501從追溯到過(guò)去在聲源生成部的外部預(yù)先計(jì)算的音調(diào)周期L的點(diǎn)開始,將自適應(yīng)編碼矢量分離出子幀長(zhǎng),并作為自適應(yīng)編碼矢量而輸出。在音調(diào)周期L不足子幀長(zhǎng)時(shí),將分離出的音調(diào)周期L的矢量反復(fù)連接直至達(dá)到子幀長(zhǎng)的矢量,作為自適應(yīng)編碼矢量而輸出。
音調(diào)峰值位置計(jì)算器2502使用從自適應(yīng)編碼表2501輸出的自適應(yīng)編碼矢量,確定在自適應(yīng)編碼矢量?jī)?nèi)存在的音調(diào)峰值的位置。音調(diào)峰值的位置可以通過(guò)使按音調(diào)周期排列的脈沖串與自適應(yīng)編碼矢量的正規(guī)化相互相關(guān)最大化而進(jìn)行確定。另外,也可以通過(guò)使按音調(diào)周期排列的脈沖串通過(guò)合成濾波器后與自適應(yīng)編碼矢量通過(guò)合成濾波器后的誤差最小化(使正規(guī)化相互相關(guān)函數(shù)最大化)而更高精度地求出。
搜索位置計(jì)算器2503以音調(diào)峰值位置為基準(zhǔn)確定聲源脈沖的搜索位置,并向加法器2504輸出。作為搜索位置的確定方法,例如,如圖26所示的那樣,使用輸出與音調(diào)峰值附近的固定搜索位置不卷積的點(diǎn)的確定方法。如實(shí)施例6或?qū)嵤├?所示的那樣,使用音調(diào)周期信息改變聲源脈沖或限定聲源脈沖的搜索范圍的情況是相同的。由搜索位置計(jì)算器2503確定的具體的搜索位置的例子示于圖26(b)、26(c)。在圖26中,示出了將固定搜索位置設(shè)定為奇數(shù)采樣點(diǎn)(圖26(a))、搜索位置計(jì)算器2503將搜索位置設(shè)定在音調(diào)峰值附近的偶數(shù)采樣點(diǎn)的情形(圖26(b)、26(c))。圖26(b)表示音調(diào)峰值位置位于偶數(shù)采樣點(diǎn)(音調(diào)峰值位置不包含在固定搜索位置中)的情況,圖26(c)表示音調(diào)峰值位置位于奇數(shù)采樣點(diǎn)(音調(diào)峰值位置包含在固定搜索位置中)的情況。根據(jù)圖26(b)、26(c)的比較可知,若干搜索位置(以音調(diào)峰值位置為0的相對(duì)位置)隨音調(diào)峰值位置的場(chǎng)所而不同。
加法器2504計(jì)算從搜索位置計(jì)算器2503輸出的聲源脈沖搜索位置的集合(圖26(b)、26(c))與預(yù)先確定的固定搜索位置的集合(圖26(a))的并集(圖26(d)),并向脈沖位置搜索器2505輸出。通過(guò)這樣處理,限定聲源脈沖的搜索位置在音調(diào)峰值附近緊密、而在除此之外的部分稀疏。該限定方法基于發(fā)生脈沖的概率高的位置集中在音調(diào)脈沖附近的統(tǒng)計(jì)結(jié)果。不限定脈沖位置搜索范圍時(shí),在有聲部中,在音調(diào)脈沖附近發(fā)生脈沖的概率比在其他部分發(fā)生的概率高。由于傳送路線錯(cuò)誤等的影響而使譯碼器一側(cè)的音調(diào)峰值位置的計(jì)算發(fā)生錯(cuò)誤時(shí),由搜索位置計(jì)算器2503計(jì)算的聲源脈沖的搜索位置在編碼器一側(cè)和在譯碼器一側(cè)將不同,但由于輸入到脈沖位置搜索器2505的聲源脈沖搜索位置的一部分為固定搜索位置,所以,可以降低編碼器一側(cè)和譯碼器一側(cè)的脈沖位置不同的概率,從而可以緩和傳送路線錯(cuò)誤的影響。
脈沖位置搜索器2505使用從加法器2504輸出的聲源脈沖搜索位置和另外輸入的音調(diào)周期L,確定發(fā)生聲源脈沖的位置的最佳組合。脈沖搜索的方法如「ITU-T Recommendation G.729CodingSpeech at 8 kbits/s using Conjugate-Structure Algebraic-Code-Excited Linear-Prediction(CS-ACELP),March 1996」所示的那樣,例如,脈沖數(shù)為4條時(shí),以使在實(shí)施例6中所示的式(2)最大化那樣確定i0~i3的組合。這時(shí)的各聲源脈沖的極性在進(jìn)行脈沖位置搜索之前預(yù)先確定,以使之與噪音編碼表成分的目標(biāo)矢量(即從進(jìn)行聽覺加權(quán)后的輸入聲音中減去聽覺加權(quán)合成濾波器的零輸入響應(yīng)信號(hào)和自適應(yīng)編碼表成分的信號(hào)后的信號(hào)矢量)在各位置的極性相等。另外,音調(diào)周期小于子幀長(zhǎng)時(shí),如實(shí)施例5所示的那樣,通過(guò)加上音調(diào)周期化濾波器,使聲源脈沖不是成為脈沖而是成為音調(diào)周期的脈沖串。進(jìn)行這樣的音調(diào)周期化處理時(shí),如果預(yù)先對(duì)聽覺加權(quán)合成濾波器的脈沖響應(yīng)矢量加上音調(diào)周期化濾波器,便可和不進(jìn)行音調(diào)周期化處理的情況一樣,通過(guò)式(2)的最大化而進(jìn)行聲源脈沖的搜索。如果在這樣確定的各聲源脈沖的位置,按照所確定的各聲源脈沖的極性發(fā)生脈沖,若使用音調(diào)周期L加上音調(diào)周期化濾波器,便可生成脈沖聲源矢量。所生成的脈沖聲源矢量向法器2507輸出。從脈沖位置搜索器2505向乘法器2507輸出的脈沖聲源矢量乘以由外部的增益量化器所量化的量化脈沖聲源矢量增益后,向加法器2508輸出。在圖25中省略了,但在脈沖位置搜索器2505中,表示脈沖聲源矢量的各聲源脈沖的極性和索引信息與脈沖聲源矢量一起另外向聲源生成部的外部輸出。該聲源脈沖的極性和索引信息通過(guò)編碼器及多路器等變換為向傳送路線輸出的數(shù)據(jù)系列串后,向傳送路線傳出。
加法器2508將從乘法器2506輸出的自適應(yīng)編碼矢量成分和從乘法器2507輸出的脈沖聲源矢量成分進(jìn)行矢量相加,并作為激勵(lì)聲源矢量而輸出。
若與固定搜索位置的脈沖聲源切換使用,則可以進(jìn)一步抑制傳送路徑錯(cuò)誤影響的傳播。
作為脈沖的發(fā)生方法,在搜索范圍例如32個(gè)位置的某個(gè)位置發(fā)生常數(shù)條例如4條脈沖時(shí),除了如上述那樣將32個(gè)位置分為4組、并象分配了1條脈沖的8個(gè)位置中的1個(gè)位置確定的那樣搜索所有的組合(8×8×8×8種組合)的方法外,還有對(duì)從32個(gè)位置中選擇4個(gè)位置的全部組合進(jìn)行搜索的方法等。除了振幅1的脈沖的組合外,還可以是將多條例如2條脈沖組合的脈沖對(duì)的組合或振幅不同的脈沖的組合而發(fā)生脈沖的方法。
(實(shí)施例15)圖27表示本發(fā)明的實(shí)施例15,示出了具有音調(diào)峰值位置修正器的實(shí)施例5所述的CELP型聲音編碼裝置的聲源生成部。
在圖27中,2701是保存過(guò)去的激勵(lì)聲源矢量并將所選擇的自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器2702、音調(diào)峰值位置修正器2703以及音調(diào)增益乘法器2706輸出的自適應(yīng)編碼表,2702是將從自適應(yīng)編碼表2701輸出的自適應(yīng)編碼矢量和從外部輸入的音調(diào)周期L作為輸入計(jì)算音調(diào)峰值位置并向音調(diào)峰值位置修正器2703輸出的音調(diào)峰值位置計(jì)算器,2703是將從自適應(yīng)編碼表2701輸出的自適應(yīng)編碼矢量和從音調(diào)峰值位置計(jì)算器2702輸出的音調(diào)峰值位置以及從外部輸入的音調(diào)周期L作為輸入、修正音調(diào)峰值位置并向搜索位置計(jì)算器2704輸出的音調(diào)峰值位置修正器,2704是將從音調(diào)峰值位置修正器2703輸出的音調(diào)峰值位置和另外輸入的音調(diào)周期L作為輸入、并將聲源脈沖的搜索位置向脈沖位置搜索器2705輸出的搜索位置計(jì)算器,2705是將從搜索位置計(jì)算器2704輸出的搜索位置和在聲源生成部的外部另外計(jì)算的音調(diào)周期L作為輸入、搜索脈沖聲源并將脈沖聲源矢量向脈沖聲源增益乘法器2707輸出的脈沖位置搜索器,2706是將自適應(yīng)編碼表2701輸出的自適應(yīng)編碼矢量乘以自適應(yīng)編碼矢量增益后向加法器2708輸出的乘法器,2707是將從脈沖位置搜索器2705輸出的脈沖聲源矢量乘以脈沖聲源矢量增益后向加法器2708輸出的乘法器,2708是將乘法器2706的輸出和乘法器2707的輸出作為輸入進(jìn)行矢量相加并作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖27和圖28說(shuō)明上述結(jié)構(gòu)的聲源生成部的動(dòng)作。在圖27中,自適應(yīng)編碼表2701從追溯到過(guò)去在聲源生成部的外部預(yù)先計(jì)算的音調(diào)周期L的點(diǎn)開始將自適應(yīng)編碼矢量分離出子幀長(zhǎng),并作為自適應(yīng)編碼矢量而輸出。在音調(diào)周期L不足子幀長(zhǎng)時(shí),將分離出的音調(diào)周期L的矢量反復(fù)連接直至達(dá)到子幀長(zhǎng)后的矢量作為自適應(yīng)編碼矢量而輸出。
音調(diào)峰值位置計(jì)算器2702使用從自適應(yīng)編碼表2701輸出的自適應(yīng)編碼矢量確定在自適應(yīng)編碼矢量?jī)?nèi)存在的音調(diào)峰值的位置。音調(diào)峰值的位置可以通過(guò)使按音調(diào)周期排列的脈沖串與自適應(yīng)編碼矢量的正規(guī)化相互相關(guān)最大化而進(jìn)行確定。另外,也可以通過(guò)使按音調(diào)周期排列的脈沖串通過(guò)合成濾波器后與自適應(yīng)編碼矢量通過(guò)合成濾波器后的誤差最小化(使正規(guī)化相互相關(guān)函數(shù)最大化)而更高精度地求出。
音調(diào)峰值位置修正器2703從自適應(yīng)編碼表2701輸出的自適應(yīng)編碼矢量中分離出包含由音調(diào)峰值位置計(jì)算器2702計(jì)算的音調(diào)峰值位置的點(diǎn)的、具有1音調(diào)周期長(zhǎng)L的長(zhǎng)度的矢量,從該分離出的波形中搜索振幅值成為最大的點(diǎn),并向搜索位置計(jì)算器2704輸出。該處理僅對(duì)音調(diào)周期L比子幀長(zhǎng)短的情況進(jìn)行。音調(diào)周期L大于子幀長(zhǎng)時(shí),就將音調(diào)峰值位置計(jì)算器2702輸出的音調(diào)峰值位置直接向脈沖位置搜索器2705輸出。1子幀長(zhǎng)相當(dāng)于約1音調(diào)周期的長(zhǎng)度時(shí),從音調(diào)峰值位置計(jì)算器2702輸出的音調(diào)峰值位置有可能成為1音調(diào)波形內(nèi)的第2個(gè)振幅高的地方(圖28(a)、28(b)在1子幀內(nèi)只在1個(gè)地方存在音調(diào)峰值,但是,由于在1音調(diào)周期波形內(nèi),有第2個(gè)大的振幅值的點(diǎn)(次峰值)在1個(gè)子幀內(nèi)存在2個(gè)地方,所以,將把次峰值錯(cuò)誤地檢測(cè)為音調(diào)峰值)。因此,由音調(diào)峰值位置修正器2703根據(jù)從音調(diào)峰值位置計(jì)算器2702輸出的音調(diào)峰值位置檢查在1音調(diào)周期長(zhǎng)以內(nèi)是否存在具有更大的振幅值的點(diǎn),存在具有比從音調(diào)峰值位置計(jì)算器2702輸出的音調(diào)峰值位置附近的點(diǎn)的振幅值大的振幅值的點(diǎn)時(shí),就將具有該大的振幅值的點(diǎn)定為音調(diào)峰值位置。例如,在圖28(c)中,音調(diào)峰值位置計(jì)算器2702輸出次峰值時(shí),根據(jù)該次峰值,將在1音調(diào)周期的自適應(yīng)編碼矢量(圖28(c)的粗線部)中振幅成為最大的位置定為音調(diào)峰值。
搜索位置計(jì)算器2704以從音調(diào)峰值位置修正器2703輸出的音調(diào)峰值位置為基準(zhǔn)確定聲源脈沖的搜索位置,并向脈沖位置搜索器2705輸出。作為搜索位置的確定方法,如實(shí)施例5或?qū)嵤├?或者實(shí)施例14等那樣,有限定聲源脈沖的搜索位置在音調(diào)峰值位置附近緊密而在除此之外的部分稀疏的方法。該限定方法基于發(fā)生脈沖的概率高的位置集中在音調(diào)脈沖附近的統(tǒng)計(jì)結(jié)果。不限定脈沖位置搜索范圍時(shí),在有聲部中,是利用在音調(diào)脈沖附近發(fā)生脈沖的概率比在其他部分發(fā)生的概率高的結(jié)果。
脈沖位置搜索器2705使用從搜索位置計(jì)算器2704輸出的聲源脈沖搜索位置和另外輸入的音調(diào)周期L確定發(fā)生聲源脈沖的位置的最佳組合。脈沖搜索的方法如「ITU-T Recommendation G.729Coding of Speech at 8 kbits/s using Conjugate-structureAlgebraic-Code-Excited Linear-Prediction(CS-ACELP),March1996」所示的那樣,例如,脈沖數(shù)為4條時(shí),以使在實(shí)施例6中所示的式(2)最大化那樣確定i0~i3的組合。這時(shí)的各聲源脈沖的極性在進(jìn)行脈沖位置搜索之前預(yù)先確定,以使之與噪音編碼表成分的目標(biāo)矢量(即從進(jìn)行聽覺加權(quán)后的輸入聲音中減去聽覺加權(quán)合成濾波器的零輸入響應(yīng)信號(hào)和自適應(yīng)編碼表成分的信號(hào)后的信號(hào)矢量)在各位置的極性相等。另外,音調(diào)周期小于子幀長(zhǎng)時(shí),如實(shí)施例5所示的那樣,通過(guò)加上音調(diào)周期化濾波器使聲源脈沖不是成為脈沖而是成為音調(diào)周期的脈沖串。進(jìn)行這樣的音調(diào)周期化處理時(shí),如果預(yù)先對(duì)聽覺加權(quán)合成濾波器的脈沖響應(yīng)矢量加上音調(diào)周期化濾波器,便可和不進(jìn)行音調(diào)周期化處理的情況一樣,通過(guò)式(2)的最大化而進(jìn)行聲源脈沖的搜索。如果在這樣確定的各聲源脈沖的位置按照所確定的各聲源脈沖的極性發(fā)生脈沖,則使用音調(diào)周期L加上音調(diào)周期化濾波器,便可生成脈沖聲源矢量。所生成的脈沖聲源矢量向乘法器2707輸出。從脈沖位置搜索器2705向乘法器2707輸出的脈沖聲源矢量乘以由外部的增益量化器所量化的量化脈沖聲源矢量增益后,向加法器2708輸出。在圖27中省略了,但在脈沖位置搜索器2705中,表示脈沖聲源矢量的各聲源脈沖的極性和索引信息與脈沖聲源矢量一起另外向聲源生成部的外部輸出。該聲源脈沖的極性和索引信息通過(guò)編碼器及多路器等變換為向傳送路線輸出的數(shù)據(jù)系列串后向傳送路線傳出。
加法器2708將從乘法器2706輸出的自適應(yīng)編碼矢量成分和從乘法器2707輸出的脈沖聲源矢量成分進(jìn)行矢量相加,并作為激勵(lì)聲源矢量而輸出。
在本實(shí)施例中,如實(shí)施例12或?qū)嵤├?3或?qū)嵤├?4所示的那樣,如果將索引更新單元或脈沖序號(hào)和索引的更新單元同時(shí)取入固定搜索位置和相位自適應(yīng)搜索位置,就可以緩和傳送路線錯(cuò)誤的影響。另外,如果可以與固定搜索位置的脈沖聲源切換使用,則可進(jìn)一步抑制傳送路線錯(cuò)誤影響的傳播。
另外,本發(fā)明的音調(diào)峰值位置修正器也可以應(yīng)用于實(shí)施例3~實(shí)施例11的任意一個(gè)實(shí)施例的聲音編碼裝置。
作為脈沖的發(fā)生方法,在搜索范圍例如32個(gè)位置的某個(gè)位置發(fā)生常數(shù)條例如4條脈沖時(shí),除了如上述那樣將32個(gè)位置分為4組并像分配了1條脈沖的8個(gè)位置中的1個(gè)位置確定的那樣搜索所有的組合(8×8×8×8種組合)的方法外,還有對(duì)從32個(gè)位置中選擇4個(gè)位置的全部組合進(jìn)行搜索的方法等。除了振幅1的脈沖的組合外,還可以是將多條例如2條脈沖組合的脈沖對(duì)的組合或振幅不同的脈沖的組合而發(fā)生脈沖的方法。
(實(shí)施例16)圖29表示本發(fā)明的實(shí)施例16,示出了利用連續(xù)的子幀間的聲源信號(hào)波形的相位的連續(xù)性而在音調(diào)峰值位置計(jì)算之前預(yù)先限定音調(diào)峰值位置的存在范圍的CELP型聲音編碼裝置的聲源生成部。在圖29中,2901是將自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器2902和乘法器2908輸出的自適應(yīng)編碼表,2902是將從自適應(yīng)編碼表2901輸出的自適應(yīng)編碼矢量和從聲源生成部的外部輸入的音調(diào)周期L以及從音調(diào)峰值搜索范圍限定器2903輸出的音調(diào)峰值搜索范圍作為輸入、計(jì)算自適應(yīng)編碼矢量?jī)?nèi)的音調(diào)峰值位置并向延遲器2904和搜索位置計(jì)算器2906輸出的音調(diào)峰值位置計(jì)算器,2903是將從延遲器2904輸出的此前的子幀的音調(diào)峰值位置和從延遲器2905輸出的此前的子幀的音調(diào)周期以及從聲源生成部的外部輸入的當(dāng)前的子幀的音調(diào)周期L作為輸入、預(yù)測(cè)當(dāng)前的子幀的音調(diào)峰值位置、根據(jù)所預(yù)測(cè)的音調(diào)峰值位置限定搜索音調(diào)峰值位置的范圍并將該范圍向音調(diào)峰值位置計(jì)算器2902輸出的音調(diào)峰值搜索范圍限定器,延遲器2904是將從音調(diào)峰值位置計(jì)算器輸出的音調(diào)峰值位置作為輸入、延遲1子幀后向音調(diào)峰值搜索范圍限定器2903輸出的延遲器,2905是將從聲源生成部的外部輸入的音調(diào)周期L作為輸入、延遲1子幀后向音調(diào)峰值搜索范圍限定器2903輸出的延遲器,2906是將從音調(diào)峰值位置計(jì)算器2902輸出的音調(diào)峰值位置和從聲源生成部的外部輸入的音調(diào)周期L作為輸入、并將聲源脈沖的搜索位置向脈沖位置搜索器2907輸出的搜索位置計(jì)算器,2907是將從搜索位置計(jì)算器2906輸出的聲源脈沖的搜索位置和從聲源生成部的外部輸入的音調(diào)周期L作為輸入、使用所輸入的聲源脈沖搜索位置和音調(diào)周期L搜索聲源脈沖的位置并將脈沖聲源矢量向乘法器2909輸出的脈沖位置搜索器,2908是將從自適應(yīng)編碼表輸出的自適應(yīng)編碼矢量作為輸入、乘以量化自適應(yīng)編碼矢量增益后向加法器2910輸出的乘法器,2909是將從脈沖位置搜索器2907輸出的脈沖聲源矢量作為輸入、乘以量化脈沖聲源矢量增益后向加法器2910輸出的乘法器,2910是分別將從乘法器2908和2909輸出的矢量作為輸入、進(jìn)行所輸入的矢量相加并作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖29說(shuō)明上述結(jié)構(gòu)的聲音編碼裝置的聲源生成部的動(dòng)作。自適應(yīng)編碼表2901由過(guò)去的激勵(lì)聲源的緩沖器構(gòu)成,根據(jù)通過(guò)外部的音調(diào)分析或由自適應(yīng)編碼表搜索單元求出的音調(diào)周期或音調(diào)延遲,從激勵(lì)聲源的緩沖器中取出相應(yīng)的部分,作為自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器2902和乘法器2908輸出。從自適應(yīng)編碼表2901向乘法器2908輸出的自適應(yīng)編碼矢量乘以由外部的增益量化器所量化的量化自適應(yīng)編碼矢量增益后,向加法器2910輸出。
音調(diào)峰值位置計(jì)算器2902根據(jù)自適應(yīng)編碼矢量檢測(cè)音調(diào)峰值,并將該位置分別向延遲器2904和搜索位置計(jì)算器2906輸出。音調(diào)峰值位置的檢測(cè)(計(jì)算)可以通過(guò)使按音調(diào)周期排列的脈沖串與自適應(yīng)編碼矢量的正規(guī)化相互相關(guān)最大化而進(jìn)行。另外,也可以通過(guò)使將合成濾波器的脈沖響應(yīng)和按音調(diào)周期L排列脈沖串矢量卷積的矢量與將合成濾波器的脈沖響應(yīng)和自適應(yīng)編碼矢量卷積的矢量的內(nèi)積最大化而進(jìn)行更高精度的音調(diào)峰值位置的檢測(cè)。此外,如果增加將包含所檢測(cè)的音調(diào)峰值位置的1音調(diào)周期波形中振幅值最大的位置作為音調(diào)峰值的后處理,也可以避免錯(cuò)誤地檢測(cè)1音調(diào)周期波形內(nèi)的次峰值。
延遲器2904將由音調(diào)峰值位置計(jì)算器2902計(jì)算的音調(diào)峰值位置延遲1子幀后,向音調(diào)峰值搜索范圍限定器2903輸出。即,將此前的子幀的音調(diào)峰值位置從延遲器2904輸入音調(diào)峰值搜索范圍限定器2903。延遲器2905將從聲源生成部的外部輸入的音調(diào)周期L延遲1子幀后向音調(diào)峰值搜索范圍限定器2903輸出。即,此前的子幀的音調(diào)周期從延遲器2905輸入音調(diào)峰值搜索范圍限定器2903。
音調(diào)峰值搜索范圍限定器2903首先進(jìn)行從延遲器2905輸入的此前的子幀的音調(diào)周期與當(dāng)前的子幀的音調(diào)周期的比較,判斷當(dāng)前的子幀是否為有聲(穩(wěn)定)部。具體而言,就是在此前的子幀的音調(diào)周期與當(dāng)前的子幀的音調(diào)周期之差小時(shí)(例如,在±5個(gè)采樣以內(nèi)時(shí)),就判定為有聲(穩(wěn)定)部。增加延遲器、使用數(shù)子幀前的音調(diào)周期也可以進(jìn)行有聲判斷。判定為有聲部時(shí),音調(diào)峰值搜索范圍限定器2903將從延遲器2904輸入的此前的子幀的音調(diào)峰值位置和從延遲器2905輸入的此前的子幀的音調(diào)周期以及當(dāng)前的子幀的音調(diào)周期L作為輸入,預(yù)測(cè)當(dāng)前的子幀的音調(diào)峰值位置,并將該預(yù)測(cè)位置的前后(例如,10個(gè)采樣)假定為進(jìn)行音調(diào)峰值位置的搜索的范圍。預(yù)測(cè)的音調(diào)峰值位置位于子幀開頭附近時(shí),1音調(diào)周期后的附近也被加到搜索范圍中,預(yù)測(cè)的音調(diào)峰值位置位于從子幀的開頭開始的1音調(diào)周期后的位置附近時(shí),子幀開頭附近也加到搜索范圍中。判定不是有聲(穩(wěn)定)部時(shí),就不進(jìn)行音調(diào)峰值搜索范圍的限定,而將整個(gè)子幀作為音調(diào)峰值搜索范圍。這樣,將由音調(diào)峰值搜索范圍限定器2903求出的音調(diào)峰值搜索范圍向音調(diào)峰值位置計(jì)算器2902輸出。在開始進(jìn)行聲音編碼處理的時(shí)刻(最初的子幀),由于不存在過(guò)去輸入的(此前的子幀)音調(diào)周期L,所以,延遲器2905預(yù)先輸出適當(dāng)?shù)某?shù)(例如,音調(diào)周期的最大值、最小值或者不可能為0等的音調(diào)周期)。對(duì)于延遲器2904也一樣。預(yù)測(cè)音調(diào)峰值位置可以根據(jù)實(shí)施例10所示的式(6)求出(參見圖19)。
搜索位置計(jì)算器2906以音調(diào)峰值位置為基準(zhǔn)確定聲源脈沖的搜索位置,并將搜索位置向脈沖位置搜索器2907輸出。作為搜索位置的確定方法,例如,如實(shí)施例6或?qū)嵤├?所示的那樣,將搜索位置確定為在音調(diào)峰值附近分布得緊密、在除此之外的部分分布得稀疏。如實(shí)施例6和實(shí)施例8所示,使用音調(diào)周期信息改變聲源脈沖數(shù)或限定聲源脈沖的搜索范圍也是有效的。另外,如果像實(shí)施例12~實(shí)施例14的任一實(shí)施例所示的那樣確定搜索位置,也可以緩和傳送路線錯(cuò)誤的影響。
脈沖位置搜索器2907使用由搜索位置計(jì)算器2906確定的聲源脈沖搜索位置或預(yù)先確定的固定搜索位置以及另外輸入的音調(diào)周期L,確定發(fā)生聲源脈沖的位置的最佳組合。脈沖搜索的方法,如「ITU-T Recommendation G.729Coding of speech at 8 kbits/susing Conjugate-structure Algebraic-Code-Excited Linear-Prediction(CS-ACELP),March 1996」所示的那樣,例如,脈沖數(shù)為4條時(shí),以使在實(shí)施例6中所示的式(2)最大化那樣確定i0~i3的組合。這時(shí)的各聲源脈沖的極性在進(jìn)行脈沖位置搜索之前預(yù)先確定,以使之與噪音編碼表成分的目標(biāo)矢量(即從進(jìn)行聽覺加權(quán)后的輸入聲音中減去聽覺加權(quán)合成濾波器的零輸入響應(yīng)信號(hào)和自適應(yīng)編碼表成分的信號(hào)后的信號(hào)矢量)在各位置的極性相等。另外,音調(diào)周期小于子幀長(zhǎng)時(shí),如實(shí)施例5所示的那樣,通過(guò)加上音調(diào)周期化濾波器,使聲源脈沖不是成為脈沖而是成為音調(diào)周期的脈沖串。進(jìn)行這樣的音調(diào)周期化處理時(shí),如果預(yù)先對(duì)聽覺加權(quán)合成濾波器的脈沖響應(yīng)矢量加上音調(diào)周期化濾波器,便可和不進(jìn)行音調(diào)周期化處理的情況一樣通過(guò)式(2)的最大化而進(jìn)行聲源脈沖的搜索。如果在這樣確定的各聲源脈沖的位置按照所確定的各聲源脈沖的極性發(fā)生脈沖,則使用音調(diào)周期L加上音調(diào)周期化濾波器,便可生成脈沖聲源矢量。所生成的脈沖聲源矢量向乘法器2909輸出。從脈沖位置搜索器2907向乘法器2909輸出的脈沖聲源矢量乘以由外部的增益量化器所量化的量化脈沖聲源矢量增益后,向加法器2910輸出。
加法器2910將從乘法器2908輸出的自適應(yīng)編碼矢量成分和從乘法器2909輸出的脈沖聲源矢量成分進(jìn)行矢量相加,并作為激勵(lì)聲源矢量而輸出。
作為脈沖的發(fā)生方法,在搜索范圍例如32個(gè)位置的某個(gè)位置發(fā)生常數(shù)條例如4條脈沖時(shí),除了如上述那樣將32個(gè)位置分為4組并象分配了1條脈沖的8個(gè)位置中的1個(gè)位置確定的那樣搜索所有的組合(8×8×8×8種組合)的方法外,還有對(duì)從32個(gè)位置中選擇4個(gè)位置的全部組合進(jìn)行搜索的方法等。除了振幅1的脈沖的組合外,還可以是將多條例如2條脈沖組合的脈沖對(duì)的組合或振幅不同的脈沖的組合而發(fā)生脈沖的方法。
(實(shí)施例17)圖30表示本發(fā)明的實(shí)施例17,示出了具有使用脈沖條數(shù)少而分配給各脈沖的位置信息足夠的固定搜索位置的脈沖搜索器、使用脈沖條數(shù)多而分配各脈沖的位置信息不一定夠的聲源脈沖搜索位置的脈沖搜索器和從這些多個(gè)脈沖搜索器輸出的脈沖聲源矢量中選擇最佳的脈沖聲源矢量的選擇器的CELP型聲音編碼裝置的聲源生成部。
在圖30中,3001是保存過(guò)去的激勵(lì)聲源矢量并將所選擇的自適應(yīng)編碼矢量向音調(diào)峰值位置計(jì)算器3002和音調(diào)增益乘法器3007輸出的自適應(yīng)編碼表,3002是將從自適應(yīng)編碼表3001輸出的自適應(yīng)編碼矢量和從外部輸入的音調(diào)周期L作為輸入、計(jì)算音調(diào)峰值位置并向搜索位置計(jì)算器3003輸出的音調(diào)峰值位置計(jì)算器,3003是將從音調(diào)峰值位置計(jì)算器3002輸出的音調(diào)峰值位置和從聲源生成部的外部輸入的音調(diào)周期L作為輸入、并將聲源脈沖的搜索位置向脈沖位置搜索器3004輸出的搜索位置計(jì)算器,3004是將從搜索位置計(jì)算器3003輸出的搜索位置和在聲源生成部的外部另外計(jì)算的音調(diào)周期L作為輸入搜索脈沖聲源并將脈沖聲源矢量1向選擇器3005輸出的脈沖位置搜索器,8005是將從脈沖位置搜索器3004輸出的脈沖聲源矢量1和從脈沖位置搜索器3006輸出的脈沖聲源矢量2作為輸入選擇最佳的脈沖聲源矢量并向乘法器3008輸出的選擇器,3006是將預(yù)先確定的固定搜索位置和從聲源生成部的外部輸入的音調(diào)周期L作為輸入搜索脈沖聲源、并作為脈沖聲源矢量2向選擇器3005輸出的脈沖位置搜索器,3007是將從自適應(yīng)編碼表3001輸出的自適應(yīng)編碼矢量乘以自適應(yīng)編碼矢量增益后向加法器3009輸出的乘法器,3008是將從選擇器3005輸出的脈沖聲源矢量乘以脈沖聲源矢量增益后向加法器3009輸出的乘法器,3009是將乘法器3007的輸出和乘法器3008的輸出作為輸入進(jìn)行矢量相加并作為激勵(lì)聲源矢量而輸出的加法器。
下面,使用圖30說(shuō)明上述結(jié)構(gòu)的聲源生成部的動(dòng)作。在圖30中,自適應(yīng)編碼表3001從追溯到過(guò)去在聲源生成部的外部預(yù)先計(jì)算的音調(diào)周期L的點(diǎn)開始將自適應(yīng)編碼矢量分離出子幀長(zhǎng),并作為自適應(yīng)編碼矢量而輸出。音調(diào)周期L不足子幀長(zhǎng)時(shí),就將反復(fù)連接分離出的音調(diào)周期L的矢量直至達(dá)到子幀長(zhǎng)的矢量后,作為自適應(yīng)編碼矢量而輸出。
音調(diào)峰值位置計(jì)算器3002使用從自適應(yīng)編碼表3001輸出的自適應(yīng)編碼矢量,確定在自適應(yīng)編碼矢量?jī)?nèi)存在的音調(diào)峰值的位置。音調(diào)峰值的位置可以通過(guò)使按音調(diào)周期排列的脈沖串與自適應(yīng)編碼矢量的正規(guī)化相互相關(guān)最大化而進(jìn)行確定。另外,也可以通過(guò)使按音調(diào)周期排列的脈沖串通過(guò)合成濾波器后與自適應(yīng)編碼矢量通過(guò)合成濾波器后的誤差最小化(使正規(guī)化相互相關(guān)函數(shù)最大化)而更高精度地求出。如果具有實(shí)施例15所示的音調(diào)峰值修正器,就可以減少音調(diào)峰值位置的計(jì)算錯(cuò)誤。
搜索位置計(jì)算器3003以從音調(diào)峰值位置計(jì)算器3002輸出的音調(diào)峰值位置為基準(zhǔn),確定聲源脈沖的搜索位置并向脈沖位置搜索器3004輸出。作為搜索位置的方法,如實(shí)施例5或?qū)嵤├?或者實(shí)施例14等那樣,有限定聲源脈沖的搜索位置在音調(diào)峰值位置附近緊密而在除此之外的部分稀疏的方法。該限定方法基于發(fā)生脈沖的概率高的位置集中在音調(diào)脈沖附近的統(tǒng)計(jì)結(jié)果。不限定脈沖位置搜索范圍時(shí),在有聲部中,是利用在音調(diào)脈沖附近發(fā)生脈沖的概率比在其他部分發(fā)生的概率高的結(jié)果。如果使用實(shí)施例12~實(shí)施例14的任一實(shí)施例所示的聲源脈沖搜索位置所確定方法,還可以緩和傳送路線錯(cuò)誤的影響。
脈沖位置搜索器3004使用從搜索位置計(jì)算器3003輸出的聲源脈沖搜索位置和另外輸入的音調(diào)周期L確定發(fā)生聲源脈沖的位置的最佳組合。脈沖搜索的方法,如「ITU-T Recommendation G.729Coding of Speech 8 kbits/s using Conjugate-structureAlgebraic-Code-Excited Linear-Prediction(CS-ACELP),March1996」所示的那樣,例如,脈沖數(shù)為4條時(shí),以使在實(shí)施例6中所示的式(2)最大化那樣確定i0~i3的組合。這時(shí)的各聲源脈沖的極性在進(jìn)行脈沖位置搜索之前預(yù)先確定,以使之與噪音編碼表成分的目標(biāo)矢量(即從進(jìn)行聽覺加權(quán)后的輸入聲音中減去聽覺加權(quán)合成濾波器的零輸入響應(yīng)信號(hào)和自適應(yīng)編碼表成分的信號(hào)后的信號(hào)矢量)在各位置的極性相等。另外,音調(diào)周期小于子幀長(zhǎng)時(shí),如實(shí)施例5所示的那樣,通過(guò)加上音調(diào)周期化濾波器,使聲源脈沖不是成為脈沖而是成為音調(diào)周期的脈沖串。進(jìn)行這樣的音調(diào)周期化處理時(shí),如果預(yù)先對(duì)聽覺加權(quán)合成濾波器的脈沖響應(yīng)矢量加上音調(diào)周期化濾波器,便可和不進(jìn)行音調(diào)周期化處理的情況一樣,通過(guò)式(2)的最大化而進(jìn)行聲源脈沖的搜索。如果在這樣確定的各聲源脈沖的位置按照所確定的各聲源脈沖的極性發(fā)生脈沖,則使用音調(diào)周期L加上音調(diào)周期化濾波器,便可生成脈沖聲源矢量。所生成的脈沖聲源矢量作為脈沖聲源矢量1向選擇器3005輸出。在脈沖位置搜索器3004中使用的聲源脈沖搜索位置增多了聲源脈沖數(shù),所以,分配給各聲源脈沖的位置信息不一定夠。即,使用脈沖位置搜索器3004的模式雖然脈沖數(shù)多,但是,卻是不一定能夠嚴(yán)密地表示各脈沖的位置的模式。在這種各脈沖的位置信息不足時(shí),可以獲得使用由搜索位置計(jì)算器3003進(jìn)行的脈沖搜索位置的確定方法的效果。
脈沖位置搜索器3006使用預(yù)先確定的固定搜索位置和從聲源生成部的外部另外輸入的音調(diào)周期L確定發(fā)生聲源脈沖的位置的最佳的組合。脈沖搜索的方法,如「ITU-T Recommendation G.729Coding of Speech at 8 kbits/s using Conjugate-structureAlgebraic-Code-Excited Linear-Prediction(CS-ACELP),March1996」所示的那樣,例如,脈沖數(shù)為4條時(shí),以使在實(shí)施例6中所示的式(2)最大化那樣確定i0~i3的組合。這時(shí)的各聲源脈沖的極性在進(jìn)行脈沖位置搜索之前預(yù)先確定,以使之與噪音編碼表成分的目標(biāo)矢量(即從進(jìn)行聽覺加權(quán)后的輸入聲音中減去聽覺加權(quán)合成濾波器的零輸入響應(yīng)信號(hào)和自適應(yīng)編碼表成分的信號(hào)后的信號(hào)矢量)在各位置的極性相等。另外,音調(diào)周期小于子幀長(zhǎng)時(shí),如實(shí)施例5所示的那樣,通過(guò)加上音調(diào)周期化濾波器,使聲源脈沖不是成為脈沖而是成為音調(diào)周期的脈沖串。進(jìn)行這樣的音調(diào)周期化處理時(shí),如果預(yù)先對(duì)聽覺加權(quán)合成濾波器的脈沖響應(yīng)矢量加上音調(diào)周期化濾波器,便可和不進(jìn)行音調(diào)周期化處理的情況一樣,通過(guò)式(2)的最大化而進(jìn)行聲源脈沖的搜索。如果在這樣確定的各聲源脈沖的位置按照所確定的各聲源脈沖的極性發(fā)生脈沖,則使用音調(diào)周期L加上音調(diào)周期化濾波器,便可生成脈沖聲源矢量。所生成的脈沖聲源矢量作為脈沖聲源矢量2向選擇器3005輸出。這里,輸入脈沖位置搜索器3006的固定搜索位置必須加入聲源脈沖的數(shù)以使分配給各聲源脈沖的位置信息足夠(具體而言,就是使子幀內(nèi)的所有的點(diǎn)包含在該固定搜索位置的模式中)。通過(guò)減少脈沖數(shù)、準(zhǔn)確地表示發(fā)生該脈沖的位置,可以提高有聲前沿部分等的合成聲音品質(zhì)。另外,通過(guò)設(shè)定這種位置信息足夠的模式,也可以避免使用位置信息不足的模式時(shí)發(fā)生的劣化現(xiàn)象。
在圖30中,脈沖位置搜索器示出了2種情況,但是,增加到3種以上時(shí),還可以進(jìn)行與輸入信號(hào)的特征相應(yīng)的切換。另外,即使是將輸入到脈沖位置搜索器3004的聲源脈沖搜索位置采用預(yù)先確定的固定搜索位置取代從搜索位置計(jì)算器3003輸出的搜索位置的結(jié)構(gòu),也可以獲得具有分配給各脈沖的位置信息不足的脈沖數(shù)少的模式的結(jié)構(gòu)、提高了有聲前沿部分等的合成聲音品質(zhì)的效果和避免只在使用位置信息不足的模式時(shí)發(fā)生的合成聲音品質(zhì)劣化的效果。但是,脈沖位置搜索器3004使用由搜索位置計(jì)算器3003確定的聲源脈沖搜索位置進(jìn)行脈沖位置搜索的方式,在具有容易在音調(diào)峰值附近發(fā)生聲源脈沖的有聲部分,可以提高脈沖數(shù)多的模式的利用效率。
選擇器3005將從脈沖位置搜索器3004輸出的脈沖聲源矢量1與從脈沖位置搜索器3006輸出的脈沖聲源矢量2進(jìn)行比較,將合成聲音的失真小的一方作為最佳脈沖聲源矢量向乘法器3008輸出。從選擇器3005向乘法器3008輸出的脈沖聲源矢量乘以由外部的增益量化器所量化的量化脈沖聲源矢量增益后向加法器3009輸出。雖然在圖30中省略了,但在編碼器的脈沖位置搜索器3004和3006中,表示各脈沖聲源矢量的各聲源脈沖的極性和索引信息與脈沖聲源矢量1、2一起另外向選擇器3005輸出。此外,將表示選擇器3005選擇了脈沖聲源矢量1、2中的哪個(gè)矢量的信息、所選擇的脈沖聲源矢量的各脈沖的極性和索引向聲源生成部的外部輸出。該選擇信息和聲源脈沖的極性以及索引信息通過(guò)編碼器及多路器等變換為向傳送路線輸出的數(shù)據(jù)系列后,向傳送路線發(fā)送。
加法器3009進(jìn)行從乘法器3007輸出的自適應(yīng)編碼矢量成分與從乘法器3008輸出的脈沖聲源矢量成分的矢量相加,并作為激勵(lì)聲源矢量而輸出。
在本實(shí)施例中,如果像實(shí)施例12或?qū)嵤├?3或?qū)嵤├?4那樣,在脈沖位置搜索器3004的前級(jí)具有索引更新單元或脈沖序號(hào)和索引的更新單元、或同時(shí)使用固定搜索位置和相位自適應(yīng)搜索位置,就可以改善容易接受使用搜索位置計(jì)算器所引起的傳送路線錯(cuò)誤的影響的性質(zhì)。
另外,作為脈沖的發(fā)生方法,在搜索范圍例如32個(gè)位置的某個(gè)位置發(fā)生常數(shù)條例如4條脈沖時(shí),除了如上述那樣將32個(gè)位置分為4組并象分配了1條脈沖的8個(gè)位置中的1個(gè)位置確定的那樣搜索所有的組合(8×8×8×8種組合)的方法外,還有對(duì)從32個(gè)位置中選擇4個(gè)位置的全部組合進(jìn)行搜索的方法等。除了振幅1的脈沖的組合外,還可以是將多條例如2條脈沖組合的脈沖對(duì)的組合或振幅不同的脈沖的組合而發(fā)生脈沖的方法。
在脈沖數(shù)少、脈沖位置信息足夠的模式中,在脈沖位置信息不足的范圍內(nèi),通過(guò)將脈沖位置信息的一部分分配給表示噪音代碼矢量的索引,不僅可以提高有聲前沿部的、而且可以提高對(duì)無(wú)聲噪音部或噪音的輸入信號(hào)的性能。
另外,上述實(shí)施例1~實(shí)施例17所示的聲音編碼裝置和聲音譯碼裝置的聲源生成功能可以作為程序記錄到磁盤、光磁盤、CD及DVD等光盤、IC卡、ROM、RAM等記錄媒體或存儲(chǔ)裝置中。因此,通過(guò)由計(jì)算機(jī)從記錄媒體或存儲(chǔ)裝置中讀取記錄數(shù)據(jù),便可實(shí)現(xiàn)聲音編碼裝置的功能。
以上,說(shuō)明了本發(fā)明的聲音編碼裝置和聲音譯碼裝置的聲源生成部,該聲源生成部通過(guò)使用于如下所示的CELP型聲音編碼裝置和CELP型聲音譯碼裝置,就可以發(fā)揮其效果。
圖31是表示本發(fā)明的CELP型聲音編碼裝置的最佳的實(shí)施例的總體結(jié)構(gòu)的框圖。在該框圖中,假定在用虛線包圍的編碼表框和用點(diǎn)劃線包圍的聲源矢量框中使用上述各實(shí)施例的結(jié)構(gòu)。即,如圖1、圖3等那樣,生成自適應(yīng)編碼矢量和噪音編碼矢量的結(jié)構(gòu)的實(shí)施例可以作為圖31的編碼表框而使用,另一方面,如圖8、圖12、圖14、圖15、圖17、圖18、圖20、圖21、圖23、圖25、圖27、圖29、圖30等那樣,生成激勵(lì)聲源矢量的結(jié)構(gòu)的實(shí)施例可以作為圖31的聲源矢量框而使用。在圖31中,聲源矢量框及其一部分編碼表框本身示出了先有的結(jié)構(gòu)。
在圖31中,將自適應(yīng)編碼表3401的輸出數(shù)據(jù)即時(shí)間序列代碼輸入到矢量乘法器3403,與增益編碼G0相乘。另一方面,將噪音編碼表3402的輸出數(shù)據(jù)即時(shí)間序列代碼輸入到矢量乘法器3404,與增益編碼G1相乘。矢量乘法器3403、3404的輸出在加法器3405中相互相加,其結(jié)果通過(guò)合成濾波器3407供給加法器3410的一輸入端。輸入聲音信號(hào)被輸入線性預(yù)測(cè)分析器3406,同時(shí),被供給加法器3410的正輸入端。在線性預(yù)測(cè)分析器3406中,進(jìn)行輸入聲音的線性預(yù)測(cè)分析,進(jìn)而進(jìn)行量化處理,作為預(yù)測(cè)系數(shù)L成為編碼輸出的一部分,同時(shí)設(shè)定為合成濾波器3407的系數(shù)。加法器3410的輸出數(shù)據(jù)供給失真最小化器3409,生成控制在自適應(yīng)編碼表3401和噪聲編碼表3402的矢量分割的信號(hào),以使合成濾波器3407的合成波形失真成為最小。即,失真最小化器3409生成分別控制自適應(yīng)編碼表3401、噪音編碼表3402以及增益量化器3408的控制信號(hào),以使失真最小,并向它們的電路發(fā)送。
圖31和后面所述的圖32中表示數(shù)據(jù)的符號(hào)A、S、G、L的意義如下A指示由失真最小化器3409最終選擇的自適應(yīng)編碼矢量的索引信息(從編碼裝置向譯碼裝置傳送)S指示由失真最小化器3409最終選擇的噪音編碼矢量的索引信息(從編碼裝置向譯碼裝置傳送)G表示由失真最小化器3409最終確定的量化增益的量化信息(從編碼裝置向譯碼裝置傳送)L表示由線性預(yù)測(cè)分析器3406所量化的線性預(yù)測(cè)系數(shù)的信息(從編碼裝置向譯碼裝置傳送)在上述各實(shí)施例中,說(shuō)明了實(shí)現(xiàn)本發(fā)明的聲音編碼裝置的情況,但是,在本發(fā)明中,聲源矢量的生成方法具有特征,該特征也可以直接應(yīng)用于聲音譯碼裝置。因此,上述各實(shí)施例可以直接利用于CELP型聲音譯碼裝置的聲源矢量的生成部分。為了明白這一點(diǎn),下面,說(shuō)明本發(fā)明的CELP型聲音譯碼裝置。
圖32是表示本發(fā)明的CELP型聲音譯碼裝置的優(yōu)選實(shí)施例的總體結(jié)構(gòu)的框圖。在該框圖中,假定在用虛線包圍的編碼表框和用點(diǎn)劃線包圍的聲源矢量框中使用上述各實(shí)施例的結(jié)構(gòu)。即,如圖1、圖3等那樣,生成自適應(yīng)編碼矢量和噪音編碼矢量的結(jié)構(gòu)的實(shí)施例可以作為圖32的編碼表框而使用,另一方面,如圖8、圖12、圖14、圖15、圖17、圖18、圖20、圖21、圖23、圖25、圖27、圖29、圖30等那樣,生成激勵(lì)聲源矢量的結(jié)構(gòu)的實(shí)施例可以作為圖32的聲源矢量框而使用。在圖32中,聲源矢量框及其一部分編碼表框本身示出了先有的結(jié)構(gòu)。
在圖32中,將自適應(yīng)編碼表3501的輸出數(shù)據(jù)即時(shí)間序列代碼輸入矢量乘法器3503,與增益編碼G0相乘。另一方面,將噪音編碼表3502的輸出數(shù)據(jù)即時(shí)間序列代碼輸入矢量乘法器3404,與增益編碼G1相乘。矢量乘法器3503、3504的輸出在加法器3505中相互相加,其結(jié)果通過(guò)合成濾波器3407作為譯碼聲音而輸出。合成濾波器3507的濾波系數(shù)由對(duì)線性預(yù)測(cè)系數(shù)進(jìn)行譯碼的線性預(yù)測(cè)系數(shù)譯碼器3506生成。增益編碼G1、G0由增益譯碼器3508生成。
如上所述,本發(fā)明的CEPL型聲音編碼裝置和/或CELP型聲音譯碼裝置在進(jìn)行聲音的編碼時(shí)和/或譯碼時(shí),通過(guò)增強(qiáng)與自適應(yīng)編碼矢量的音調(diào)峰值位置對(duì)應(yīng)的噪音編碼矢量的振幅,利用在1音調(diào)波形內(nèi)存在的相位信息,可以提高音質(zhì),所以,本發(fā)明極適合于應(yīng)用于例如以數(shù)字信號(hào)進(jìn)行無(wú)線通信、光無(wú)線通信的聲音通信裝置。
圖33是表示使用本發(fā)明的CELP型聲音編碼裝置3301的移動(dòng)無(wú)線終端的概略結(jié)構(gòu)的框圖。聲音編碼裝置3301的輸出信號(hào)由調(diào)制器3302進(jìn)行例如四相差分移相鍵控(QPSK,QuadratureDifferential Phase Shift Keying)的數(shù)字調(diào)制,同時(shí)調(diào)制為適合于例如碼分多址(CDMA)方式或時(shí)分多址(TDMA)方式等指定存取方式的信號(hào)形式,最后,由放大器3303放大后,從天線3304發(fā)射出去。圖中雖然未示出,但是,本發(fā)明的聲音譯碼裝置同樣也可以在移動(dòng)無(wú)線終端應(yīng)用。
產(chǎn)業(yè)上利用的可能性根據(jù)上述實(shí)施例可知,本發(fā)明是將用于增強(qiáng)與自適應(yīng)編碼矢量的音調(diào)峰值位置對(duì)應(yīng)的噪音編碼矢量的振幅的振幅增強(qiáng)窗復(fù)合到噪音編碼矢量上,所以,利用在1音調(diào)波形內(nèi)存在的相位信息便可提高音質(zhì)。
另外,本發(fā)明使用僅限定在自適應(yīng)編碼矢量的音調(diào)峰值附近的噪音編碼矢量,所以,即使在分配給噪音編碼矢量的位數(shù)少的情況下,也可以減小音質(zhì)劣化、提高功率集中在音調(diào)峰值附近的有聲部的聲音品質(zhì)。
另外,本發(fā)明根據(jù)自適應(yīng)編碼矢量的音調(diào)峰值位置和音調(diào)周期確定脈沖位置的搜索范圍,所以,可以在1音調(diào)波形內(nèi)進(jìn)行與音調(diào)周期對(duì)應(yīng)的脈沖位置搜索,即使在分配給脈沖位置的位數(shù)少的情況下,也可以抑制聲音品質(zhì)的劣化。
另外,本發(fā)明通過(guò)將脈沖搜索的范圍限定為比1音調(diào)周期長(zhǎng)的長(zhǎng)度,可以有效地表現(xiàn)有音調(diào)周期性的聲源信號(hào)。另外,由于在搜索范圍內(nèi)包含2個(gè)音調(diào)峰值,所以,可以和第1個(gè)音調(diào)峰值與第2個(gè)音調(diào)峰值的形式不同的情況或者錯(cuò)誤地檢測(cè)了第1個(gè)音調(diào)峰值的位置的情況對(duì)應(yīng)。
另外,本發(fā)明具有根據(jù)輸入聲音信號(hào)的音調(diào)周期自適應(yīng)地改變脈沖數(shù)的結(jié)構(gòu),所以,不需要用于切換脈沖數(shù)的新的信息,便可提高聲音品質(zhì)。
另外,本發(fā)明在進(jìn)行脈沖位置搜索之前確定音調(diào)峰值附近和除此之外的部分的脈沖振幅,所以,可以有效地表現(xiàn)1音調(diào)波形的形狀。
另外,本發(fā)明通過(guò)利用音調(diào)周期的連續(xù)性切換脈沖的搜索位置,可以進(jìn)行分別適用于有聲的前沿部·無(wú)聲部和有聲定常部·有聲部的脈沖聲源搜索,所以,可以提高聲音品質(zhì)。
另外,本發(fā)明通過(guò)使用在自適應(yīng)編碼表搜索之后求出的音調(diào)增益,對(duì)當(dāng)前子幀的音調(diào)增益(自適應(yīng)編碼矢量增益)進(jìn)行初級(jí)量化處理,對(duì)在聲源搜索的最后求出的最佳音調(diào)增益與初級(jí)量化音調(diào)增益的差分進(jìn)行第2級(jí)量化處理,在利用自適應(yīng)編碼表和固定編碼表(噪音編碼表)之和生成驅(qū)動(dòng)聲源矢量的CELP型聲音編碼裝置中,將在固定編碼表(噪音編碼表)搜索之前得到的信息量化后進(jìn)行傳送,所以,不附加獨(dú)立的模式信息便可進(jìn)行固定編碼表(噪音編碼表)的切換等,從而可以有效地對(duì)聲音信息進(jìn)行編碼。
另外,本發(fā)明根據(jù)過(guò)去編碼的音調(diào)周期的連續(xù)性或過(guò)去編碼的音調(diào)增益的大小(或連續(xù)性)判斷當(dāng)前子幀的聲音信號(hào)的音調(diào)周期性,切換脈沖聲源的搜索位置,在音調(diào)周期性高的地方和低的地方的判斷中,不附加新的信息就可以進(jìn)行應(yīng)用于這些部分的脈沖聲源搜索,所以,可以提高在相同信息量下的聲音品質(zhì)。
另外,本發(fā)明通過(guò)使用此前的子幀的音調(diào)峰值位置、此前的子幀的音調(diào)周期以及當(dāng)前的子幀的音調(diào)周期,可以反向預(yù)測(cè)當(dāng)前的子幀的音調(diào)峰值位置,并使用該預(yù)測(cè)音調(diào)峰值位置切換是否進(jìn)行相位自適應(yīng)處理,所以,沒有切換信息的新的傳送就可以進(jìn)行相位自適應(yīng)處理的切換,從而可以提高相同信息量下的聲音品質(zhì)。在不進(jìn)行相位自適應(yīng)處理的模式中,可以使用固定編碼表,通過(guò)發(fā)生在無(wú)聲部繼續(xù)使用固定編碼表的狀態(tài),也可以獲得使對(duì)相位自適應(yīng)型聲源的錯(cuò)誤傳播復(fù)位的效果。
另外,本發(fā)明使用自適應(yīng)編碼矢量向音調(diào)峰值附近的信號(hào)功率集中度切換是否進(jìn)行相位自適應(yīng),所以,沒有切換信息的新的傳送便可進(jìn)行相位自適應(yīng)處理的切換,從而可以提高在相同信息量下的聲音品質(zhì)。在不進(jìn)行相位自適應(yīng)處理的模式中,可以使用固定編碼表,通過(guò)發(fā)生在無(wú)聲部等繼續(xù)使用固定編碼表的狀態(tài),也可以獲得使對(duì)相位自適應(yīng)型聲源的錯(cuò)誤傳播復(fù)位的效果。
另外,本發(fā)明在用以音調(diào)峰值位置為0的相對(duì)位置表現(xiàn)聲源脈沖的位置的CELP型聲音編碼裝置中,通過(guò)加上表示聲源脈沖的各位置的索引用以從子幀開頭開始順序排列,在由于傳送路線錯(cuò)誤的影響等而使音調(diào)峰值位置錯(cuò)誤時(shí),可以使聲源脈沖位置的偏離不太大。
另外,本發(fā)明在用以音調(diào)峰值位置為0的相對(duì)位置表現(xiàn)聲源脈沖的位置的CELP型聲音編碼裝置中,通過(guò)加上表示聲源脈沖的各位置的索引用以從子幀開頭開始順序排列,同時(shí)將加到用相同的索引序號(hào)表示的各脈沖上的序號(hào)定義為從子幀的開頭順序排列,在由于傳送路線錯(cuò)誤的影響等而使音調(diào)峰值位置錯(cuò)誤時(shí),可以使聲源脈沖位置的偏離不太大。
另外,本發(fā)明在用以音調(diào)峰值位置為0的相對(duì)位置表現(xiàn)聲源脈沖的位置的CELP型聲音編碼裝置中,通過(guò)不是用相對(duì)位置表現(xiàn)全部聲源脈沖的搜索位置而僅用相對(duì)位置表現(xiàn)一部分、其余的搜索位置則為預(yù)先確定的固定位置,在由于傳送路線錯(cuò)誤的影響等而使音調(diào)峰值位置錯(cuò)誤時(shí),通過(guò)減少聲源脈沖的位置發(fā)生偏離的概率,便可防止傳送路線錯(cuò)誤的影響傳播很長(zhǎng)。
另外,本發(fā)明將1音調(diào)波形內(nèi)的峰值位置作為音調(diào)峰值位置而搜索,所以,可以防止將由于子幀長(zhǎng)與音調(diào)周期不一致而引起的次峰值作為音調(diào)峰值的錯(cuò)誤檢測(cè)。
另外,本發(fā)明在連續(xù)的有聲定常部中使用此前的子幀中的音調(diào)峰值的位置、在此前的子幀中的音調(diào)周期以及在當(dāng)前的子幀中的音調(diào)周期的信息限定當(dāng)前的音調(diào)峰值位置的存在范圍,通過(guò)采用在該范圍內(nèi)搜索音調(diào)峰值位置,僅使用當(dāng)前的子幀的信號(hào)便可防止將在搜索音調(diào)峰值位置時(shí)發(fā)生的1音調(diào)波形內(nèi)的次峰值作為音調(diào)峰值的錯(cuò)誤檢測(cè)。
另外,本發(fā)明在將脈沖聲源應(yīng)用于噪音編碼表的CELP型聲音編碼裝置中,采用具有取代聲源脈沖數(shù)少的各聲源脈沖的位置信息充分的模式和取代各聲源脈沖的位置信息稀疏的聲源脈沖數(shù)多的模式的噪音編碼表結(jié)構(gòu),所以,可以提高有聲前沿部分的聲音品質(zhì)和有效利用聲源脈沖數(shù)多的模式。
按照本發(fā)明,利用上述結(jié)構(gòu)或單元生成聲源,所以,不僅在CELP型聲音編碼裝置、而且在CELP型聲音譯碼裝置中也可以獲得同樣的效果。另外,本發(fā)明的CELP型聲音編碼裝置和CELP型聲音譯碼裝置可以廣泛地應(yīng)用于將移動(dòng)通信裝置等的聲音進(jìn)行編碼而傳送、或?qū)⒁丫幋a的傳送的聲音譯碼、再生原來(lái)的聲音的通信裝置或聲音記錄裝置等。
權(quán)利要求
1.一種CELP型聲音編碼裝置,其特征在于具有聲源生成部,用以增強(qiáng)與自適應(yīng)編碼矢量的音調(diào)峰值位置對(duì)應(yīng)的噪音編碼矢量的振幅。
2.按權(quán)利要求1所述的CELP型聲音編碼裝置,其特征在于上述聲源生成部通過(guò)將與上述自適應(yīng)編碼矢量的音調(diào)周期同步的振幅增強(qiáng)窗復(fù)合到上述噪音編碼矢量上,增強(qiáng)與上述自適應(yīng)編碼矢量的音調(diào)峰值的位置對(duì)應(yīng)的上述噪音編碼矢量的振幅。
3.按權(quán)利要求2所述的CELP型聲音編碼裝置,其特征在于上述聲源生成部將以上述自適應(yīng)編碼矢量的音調(diào)峰值位置為中心的三角窗作為振幅增強(qiáng)窗使用。
4.一種CELP型聲音編碼裝置,其特征在于具有使用僅限定在自適應(yīng)編碼矢量的音調(diào)峰值附近的噪音編碼矢量的聲源生成部。
5.一種將脈沖聲源使用于噪音編碼表的CELP型聲音編碼裝置,其特征在于具有根據(jù)自適應(yīng)編碼表的音調(diào)周期和音調(diào)峰值位置確定脈沖位置的搜索范圍的聲源生成部。
6.按權(quán)利要求5所述的CELP型聲音編碼裝置,其特征在于上述聲源生成部將上述脈沖位置的搜索范圍確定為在上述自適應(yīng)編碼矢量的音調(diào)峰值位置附近緊密而在除此之外的部分稀疏。
7.按權(quán)利要求5或6所述的CELP型聲音編碼裝置,其特征在于根據(jù)上述音調(diào)周期切換上述脈沖位置的搜索范圍。
8.按權(quán)利要求7所述的CELP型聲音編碼裝置,其特征在于在上述自適應(yīng)編碼矢量中存在多個(gè)音調(diào)峰值時(shí),將上述脈沖位置的搜索范圍限定為在搜索范圍中至少包含兩個(gè)音調(diào)峰值的位置。
9.一種CELP型聲音編碼裝置,其特征在于根據(jù)輸入聲音的分析結(jié)果切換噪音編碼表。
10.一種CELP型聲音編碼裝置,其特征在于具有使用在進(jìn)行噪音編碼表搜索之前提取的傳送參量切換噪音編碼表的聲源生成部。
11.按權(quán)利要求5~8的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于具有根據(jù)聲音信號(hào)的分析結(jié)果切換上述脈沖的條數(shù)的聲源生成部。
12.按權(quán)利要求5~8、11的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于具有使用在進(jìn)行上述噪音編碼表的搜索之前提取的傳送參量切換上述脈沖的條數(shù)的聲源生成部。
13.按權(quán)利要求5~8、11、12的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于具有根據(jù)上述音調(diào)周期切換上述脈沖的條數(shù)的聲源生成部。
14.按權(quán)利要求13所述的CELP型聲音編碼裝置,其特征在于在上述音調(diào)周期在連續(xù)的子幀間變化小時(shí)和不小時(shí),切換上述脈沖的條數(shù)。
15.按權(quán)利要求5~8、11~14的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于作為噪音聲源而使用脈沖聲源的噪音編碼矢量生成部在搜索上述脈沖位置之前確定脈沖振幅。
16.按權(quán)利要求15所述的CELP型聲音編碼裝置,其特征在于作為噪音聲源而使用脈沖聲源的噪音編碼矢量生成部在上述自適應(yīng)編碼矢量的音調(diào)峰值附近和除此之外的部分改變上述脈沖的振幅。
17.按權(quán)利要求13所述的CELP型聲音編碼裝置,其特征在于通過(guò)統(tǒng)計(jì)或?qū)W習(xí),根據(jù)音調(diào)周期確定所使用的脈沖聲源的脈沖數(shù)。
18.一種CELP型聲音編碼裝置,其特征在于具有對(duì)音調(diào)增益進(jìn)行多級(jí)量化的聲源生成部,在初級(jí),將在自適應(yīng)編碼表搜索之后求出的值作為量化目標(biāo),在第2級(jí)以后,在聲源搜索全部結(jié)束后,將通過(guò)閉環(huán)搜索而確定的音調(diào)增益與在上述初級(jí)所量化的值的差分作為量化目標(biāo)。
19.按權(quán)利要求9~12、15~17的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于具有對(duì)音調(diào)增益進(jìn)行多級(jí)量化的聲源生成部,在初級(jí),將在自適應(yīng)編碼表搜索之后求出的值作為量化目標(biāo),在第2級(jí)以后,在聲源搜索全部結(jié)束后,將通過(guò)閉環(huán)搜索而確定的音調(diào)增益與在上述初級(jí)進(jìn)行量化的值的差分作為量化目標(biāo),使用在CELP型聲音編碼裝置的自適應(yīng)編碼表搜索之后求出的音調(diào)增益的量化值切換固定編碼表。
20.按權(quán)利要求9~12、15~19的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于根據(jù)音調(diào)周期的子幀間變化切換固定編碼表。
21.按權(quán)利要求9~12、15、17的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于使用在此前的子幀中進(jìn)行量化的音調(diào)增益切換固定編碼表。
22.按權(quán)利要求9~12和15、17的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于根據(jù)音調(diào)周期的子幀間變化和量化音調(diào)增益切換固定編碼表。
23.按權(quán)利要求19~22的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于將脈沖聲源編碼表使用于固定編碼表。
24.一種CELP型聲音編碼裝置,對(duì)具有指定的時(shí)間長(zhǎng)度的各子幀進(jìn)行聲音編碼處理,其特征在于判斷當(dāng)前子幀的相位與此前子幀的相位是否連續(xù),切換在判定為連續(xù)時(shí)和不連續(xù)時(shí)所使用的聲源。
25.按權(quán)利要求24所述的CELP型聲音編碼裝置,其特征在于使用此前子幀的音調(diào)峰值位置、此前子幀的音調(diào)周期以及當(dāng)前子幀的音調(diào)周期預(yù)測(cè)當(dāng)前子幀的音調(diào)峰值位置,根據(jù)通過(guò)該預(yù)測(cè)而得到的當(dāng)前子幀的音調(diào)峰值位置是否靠近僅根據(jù)當(dāng)前子幀的數(shù)據(jù)求出的音調(diào)峰值位置,判斷上述此前子幀的相位與上述當(dāng)前子幀的相位是否連續(xù),根據(jù)該判斷結(jié)果切換上述聲源的編碼處理方法。
26.按權(quán)利要求24或25所述的CELP型聲音編碼裝置,其特征在于在判定此前子幀的相位與當(dāng)前子幀的相位連續(xù)時(shí),就對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理;在判定上述此前子幀的相位與上述當(dāng)前子幀的相位不連續(xù)時(shí),就不對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理。
27.一種CELP型聲音編碼裝置,對(duì)各具有指定時(shí)間長(zhǎng)度的子幀進(jìn)行聲音編碼處理,其特征在于以信號(hào)功率在當(dāng)前子幀的自適應(yīng)編碼矢量的音調(diào)峰值附近的集中度為基準(zhǔn),切換聲源信號(hào)的編碼處理方法。
28.按權(quán)利要求27所述的CELP型聲音編碼裝置,其特征在于信號(hào)功率在當(dāng)前子幀的自適應(yīng)編碼矢量的音調(diào)峰值附近占1音調(diào)周期長(zhǎng)的信號(hào)全體的比例大于指定值時(shí),就對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理;小于指定值時(shí),就不對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理。
29.按權(quán)利要求26或28所述的CELP型聲音編碼裝置,其特征在于將作為上述相位自適應(yīng)處理、在音調(diào)峰值附近較密地進(jìn)行脈沖位置搜索而在音調(diào)峰值附近以外的部分稀疏地進(jìn)行脈沖位置搜索的脈沖聲源應(yīng)用于噪音聲源。
30.按權(quán)利要求5~8、11~17、23、29的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于將表示上述脈沖的位置的索引從子幀的開頭一側(cè)開始順序排列。
31.按權(quán)利要求30所述的CELP型聲音編碼裝置,其特征在于在索引序號(hào)相同時(shí),從子幀的開頭一側(cè)順序加上脈沖的序號(hào),并進(jìn)而將各脈沖的搜索位置確定為在音調(diào)峰值附近較密而在音調(diào)峰值附近以外的部分稀疏。
32.按權(quán)利要求5~8、11~17、23、29的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于根據(jù)上述音調(diào)峰值位置確定上述脈沖的搜索位置的一部分,其他的脈沖搜索位置與音調(diào)峰值位置無(wú)關(guān),是預(yù)先確定的固定位置。
33.按權(quán)利要求1~8、11~17、19~23、25~32的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于具有在求具有指定的時(shí)間長(zhǎng)度的聲音或聲源信號(hào)的上述音調(diào)峰值位置時(shí)、只從該信號(hào)中分離出1音調(diào)周期長(zhǎng)并在分離出的信號(hào)內(nèi)確定音調(diào)峰值位置的音調(diào)峰值位置計(jì)算單元。
34.按權(quán)利要求33所述的CELP型聲音編碼裝置,其特征在于在從該信號(hào)中只分離出1音調(diào)周期長(zhǎng)時(shí),首先,不分離1音調(diào)周期長(zhǎng)而使用該信號(hào)全體確定上述音調(diào)峰值位置,將該確定的音調(diào)峰值位置作為分離開始點(diǎn),分離1音調(diào)周期長(zhǎng),在分離出的信號(hào)內(nèi)確定上述音調(diào)峰值位置。
35.按權(quán)利要求1~8、11~17、19~23、25~32的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于在對(duì)各具有指定時(shí)間長(zhǎng)度的子幀進(jìn)行聲音編碼處理的CELP型聲音編碼裝置中,計(jì)算當(dāng)前子幀的上述音調(diào)峰值位置時(shí),在此前的子幀的音調(diào)周期與當(dāng)前子幀的音調(diào)周期之差在預(yù)先確定的范圍內(nèi)時(shí),就使用此前的子幀的上述音調(diào)峰值位置、此前的子幀的音調(diào)周期以及當(dāng)前子幀的音調(diào)周期預(yù)測(cè)當(dāng)前的子幀的音調(diào)峰值位置,使用通過(guò)該預(yù)測(cè)而得到的當(dāng)前子幀的音調(diào)峰值位置預(yù)先限定當(dāng)前子幀的上述音調(diào)峰值位置的存在范圍,在該范圍內(nèi)進(jìn)行音調(diào)峰值位置搜索。
36.一種CELP型聲音編碼裝置,對(duì)各具有指定時(shí)間長(zhǎng)度的子幀進(jìn)行聲音編碼處理、其特征在于作為噪音編碼表使用脈沖聲源,至少具有2個(gè)模式以上的上述噪音編碼表的模式,通過(guò)切換模式可以改變上述聲源脈沖的條數(shù),至少1個(gè)模式是各脈沖的位置信息充分的、脈沖條數(shù)少的模式,其他模式是各脈沖的位置信息不足但脈沖數(shù)多的模式,通過(guò)傳送模式的切換信息進(jìn)行模式的切換。
37.按權(quán)利要求36所述的CELP型聲音編碼裝置,其特征在于在音調(diào)周期短時(shí),與上述音調(diào)周期對(duì)應(yīng)地通過(guò)將上述聲源脈沖的搜索范圍限定在窄的范圍內(nèi),減少上述聲源脈沖的位置信息,增加上述聲源脈沖的條數(shù)。
38.按權(quán)利要求36或37所述的CELP型聲音編碼裝置,其特征在于在上述各脈沖的位置信息不足但上述脈沖數(shù)多的模式中,使在音調(diào)峰值位置附近聲源脈沖的搜索位置密、而在除此之外的部分使上述聲源脈沖的搜索位置稀疏地確定上述脈沖位置的搜索范圍。
39.按權(quán)利要求36~38的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置,其特征在于在上述脈沖數(shù)少而位置信息充分的聲源模式中,將位置信息的一部分分配給表示噪音性的聲源編碼矢量的索引。
40.一種計(jì)算機(jī)可讀取的存儲(chǔ)媒體,其特征在于記錄用于執(zhí)行權(quán)利要求1~39的任一權(quán)項(xiàng)所述的CELP型聲音編碼裝置的功能的程序。
41.一種聲音編碼方法,其特征在于具有增強(qiáng)與自適應(yīng)編碼矢量的音調(diào)峰值位置對(duì)應(yīng)的噪音編碼矢量的振幅的步驟。
42.按權(quán)利要求41所述的聲音編碼方法,其特征在于通過(guò)將與上述自適應(yīng)編碼矢量的音調(diào)周期同步的振幅增強(qiáng)窗復(fù)合到上述噪音編碼矢量上,增強(qiáng)與上述自適應(yīng)編碼矢量的音調(diào)峰值的位置對(duì)應(yīng)的上述噪音編碼矢量的振幅。
43.按權(quán)利要求42所述的聲音編碼方法,其特征在于作為振幅增強(qiáng)窗,使用以上述自適應(yīng)編碼矢量的音調(diào)峰值位置為中心的三角窗。
44.一種聲音編碼方法,其特征在于具有使用僅限定在自適應(yīng)編碼矢量的音調(diào)峰值附近的噪音編碼矢量的步驟。
45.一種將脈沖聲源應(yīng)用于噪音編碼表的聲音編碼方法,其特征在于具有根據(jù)自適應(yīng)編碼矢量的音調(diào)周期和音調(diào)峰值位置確定脈沖位置的搜索范圍的步驟。
46.按權(quán)利要求45所述的聲音編碼方法,其特征在于上述聲源生成部將上述脈沖位置的搜索范圍確定為在上述自適應(yīng)編碼矢量的音調(diào)峰值位置附近密而在除此之外的部分稀疏。
47.按權(quán)利要求45或46所述的聲音編碼方法,其特征在于根據(jù)上述音調(diào)周期切換上述脈沖位置的搜索范圍。
48.按權(quán)利要求47所述的聲音編碼方法,其特征在于在上述自適應(yīng)編碼矢量中存在多個(gè)音調(diào)峰值時(shí),將上述脈沖位置的搜索范圍限定為至少2個(gè)音調(diào)峰值的位置包含在搜索范圍中。
49.一種聲音編碼方法,其特征在于根據(jù)輸入聲音的分析結(jié)果切換噪音編碼表。
50.一種聲音編碼方法,其特征在于具有使用在進(jìn)行噪音編碼表搜索之前提取的傳送參量切換噪音編碼表的聲源生成部。
51.按權(quán)利要求45~48的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于具有根據(jù)聲音信號(hào)的分析結(jié)果切換上述脈沖的條數(shù)的聲源生成部。
52.按權(quán)利要求45~48、51的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于具有使用在進(jìn)行上述噪音編碼表的搜索之前提取的傳送參量切換上述脈沖的條數(shù)的聲源生成部。
53.按權(quán)利要求45~48、51、52的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于具有根據(jù)上述音調(diào)周期切換上述脈沖的條數(shù)的聲源生成部。
54.按權(quán)利要求53所述的聲音編碼方法,其特征在于在上述音調(diào)周期在連續(xù)的子幀間變化小時(shí)和變化不小時(shí),切換上述脈沖的條數(shù)。
55.按權(quán)利要求45~48、51~54的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于作為噪音聲源使用脈沖聲源的噪音編碼矢量生成部在進(jìn)行使脈沖位置的搜索之前確定脈沖振幅。
56.按權(quán)利要求55所述的聲音編碼方法,其特征在于作為噪音聲源使用脈沖聲源的噪音編碼矢量生成部在上述自適應(yīng)編碼矢量的音調(diào)峰值附近和除此之外的部分改變上述脈沖的振幅。
57.按權(quán)利要求53所述的聲音編碼方法,其特征在于通過(guò)統(tǒng)計(jì)或?qū)W習(xí),根據(jù)音調(diào)周期確定所使用的脈沖聲源的脈沖數(shù)。
58.一種聲音編碼方法,其特征在于使用將音調(diào)增益進(jìn)行多級(jí)量化處理的聲源生成部,在初級(jí),將自適應(yīng)編碼表搜索之后求出的值作為量化目標(biāo),在第2級(jí)以后,將聲源搜索全部結(jié)束后通過(guò)閉環(huán)搜索確定的音調(diào)增益與在上述初級(jí)所量化的值的差分作為量化目標(biāo)。
59.按權(quán)利要求49~52、55~57的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于使用將音調(diào)增益進(jìn)行多級(jí)量化處理的聲源生成部,在初級(jí),將自適應(yīng)編碼表搜索之后求出的值作為量化目標(biāo),在第2級(jí)以后,將聲源搜索全部結(jié)束后通過(guò)閉環(huán)搜索確定的音調(diào)增益與在上述初級(jí)所量化的值的差分作為量化目標(biāo),并使用在自適應(yīng)編碼表搜索之后求出的音調(diào)增益的量化值切換固定編碼表。
60.按權(quán)利要求49~52、55~59的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于根據(jù)音調(diào)周期的子幀間變化切換固定編碼表。
61.按權(quán)利要求49~52、55~57的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于使用在此前的子幀中所量化的音調(diào)增益切換固定編碼表。
62.按權(quán)利要求49~52、55~57的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于根據(jù)音調(diào)周期的子幀間變化和量化音調(diào)增益切換固定編碼表。
63.按權(quán)利要求59~62的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于將脈沖聲源編碼表應(yīng)用于固定編碼表中。
64.一種聲音編碼裝置,在對(duì)各具有指定時(shí)間長(zhǎng)度的子幀進(jìn)行聲音編碼處理的聲音編碼方法中,其特征在于判斷當(dāng)前的子幀的相位與此前的子幀的相位是否連續(xù),切換在判定連續(xù)時(shí)和判定不連續(xù)時(shí)使用的聲源。
65.按權(quán)利要求64所述的聲音編碼方法,其特征在于使用此前的子幀的音調(diào)峰值位置、此前的子幀的音調(diào)周期以及當(dāng)前子幀的音調(diào)周期預(yù)測(cè)當(dāng)前的子幀的音調(diào)峰值位置,根據(jù)通過(guò)該預(yù)測(cè)而得到的當(dāng)前子幀的音調(diào)峰值位置是否靠近僅根據(jù)當(dāng)前子幀的數(shù)據(jù)求出的音調(diào)峰值位置,判斷上述此前的子幀的相位與上述當(dāng)前子幀的相位是否連續(xù),根據(jù)該判斷結(jié)果切換上述聲源的編碼處理方法。
66.按權(quán)利要求64或65所述的聲音編碼方法,其特征在于在判定此前的子幀的相位與當(dāng)前的子幀的相位連續(xù)時(shí),就對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理;在判定上述此前的子幀的相位與上述當(dāng)前的子幀的相位不連續(xù)時(shí),就不對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理。
67.一種對(duì)各具有指定的時(shí)間長(zhǎng)度的子幀進(jìn)行聲音編碼處理的聲音編碼方法,其特征在于以信號(hào)功率在當(dāng)前子幀的自適應(yīng)編碼矢量的音調(diào)峰值附近的集中度為基準(zhǔn),切換聲源信號(hào)的編碼處理方法。
68.按權(quán)利要求67所述的聲音編碼方法,其特征在于信號(hào)功率在當(dāng)前子幀的自適應(yīng)編碼矢量的音調(diào)峰值附近占1音調(diào)周期長(zhǎng)的信號(hào)全體的比例大于指定值時(shí),就對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理;小于指定值時(shí),就不對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理。
69.按權(quán)利要求66或68所述的聲音編碼方法,其特征在于將作為上述相位自適應(yīng)處理、在音調(diào)峰值附近較密地進(jìn)行脈沖位置搜索而在音調(diào)峰值附近以外的部分稀疏地進(jìn)行脈沖位置搜索的脈沖聲源應(yīng)用于噪音聲源。
70.按權(quán)利要求45、48、51~57、63、69的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于將表示上述脈沖的位置的索引從子幀的開頭一側(cè)開始順序排列。
71.按權(quán)利要求70所述的聲音編碼方法,其特征在于在索引序號(hào)相同時(shí),從子幀的開頭一側(cè)順序加上脈沖的序號(hào),并進(jìn)而將各脈沖的搜索位置確定為在音調(diào)峰值附近密而在音調(diào)峰值附近以外的部分稀疏。
72.按權(quán)利要求45~48、51~57、63、69的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于根據(jù)上述音調(diào)峰值位置確定上述脈沖的搜索位置的一部分,其他的脈沖搜索位置與音調(diào)峰值位置無(wú)關(guān),是預(yù)先確定的固定位置。
73.按權(quán)利要求41~48、51~57、59~63、65~72的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于具有在求具有指定的時(shí)間長(zhǎng)度的聲音或聲源信號(hào)的上述音調(diào)峰值位置時(shí)、只從該信號(hào)中分離出1音調(diào)周期長(zhǎng)并在分離出的信號(hào)內(nèi)確定音調(diào)峰值位置的音調(diào)峰值位置計(jì)算步驟。
74.按權(quán)利要求73所述的聲音編碼方法,其特征在于在從該信號(hào)中只分離出1音調(diào)周期長(zhǎng)時(shí),首先,不分離1音調(diào)周期長(zhǎng)而使用該信號(hào)全體確定上述音調(diào)峰值位置,將該確定的音調(diào)峰值位置作為分離開始點(diǎn),分離1音調(diào)周期長(zhǎng),在分離出的信號(hào)內(nèi)確定上述音調(diào)峰值位置。
75.按權(quán)利要求41~48、51~57、59~63、65~72的任一權(quán)項(xiàng)所述的聲音編碼方法,對(duì)各具有指定的時(shí)間長(zhǎng)度的子幀進(jìn)行聲音編碼處理,其特征在于計(jì)算當(dāng)前子幀的上述音調(diào)峰值位置時(shí),當(dāng)此前的子幀的音調(diào)周期與當(dāng)前子幀的音調(diào)周期之差在預(yù)先確定的范圍內(nèi)時(shí),就使用此前的子幀的上述音調(diào)峰值位置、此前的子幀的音調(diào)周期以及當(dāng)前的子幀的音調(diào)周期預(yù)測(cè)當(dāng)前的子幀的音調(diào)峰值位置,使用通過(guò)該預(yù)測(cè)而得到的當(dāng)前的子幀的音調(diào)峰值位置預(yù)先限定當(dāng)前子幀的上述音調(diào)峰值位置的存在范圍,在該范圍內(nèi)進(jìn)行音調(diào)峰值位置搜索。
76.一種聲音編碼方法,對(duì)各具有指定的時(shí)間長(zhǎng)度的子幀進(jìn)行聲音編碼處理,其特征在于作為噪音編碼表使用脈沖聲源,至少具有2個(gè)模式以上的上述噪音編碼表的模式,通過(guò)切換模式,可以改變上述聲源脈沖的條數(shù),至少1個(gè)模式是各脈沖的位置信息充分的脈沖條數(shù)少的模式,其他模式是各脈沖的位置信息不足但脈沖數(shù)多的模式,通過(guò)傳送模式的切換信息進(jìn)行模式的切換。
77.按權(quán)利要求76所述的聲音編碼方法,其特征在于在音調(diào)周期短時(shí),與上述音調(diào)周期對(duì)應(yīng)地通過(guò)將上述聲源脈沖的搜索范圍限定在窄的范圍內(nèi),減少上述聲源脈沖的位置信息,增加上述聲源脈沖的條數(shù)。
78.按權(quán)利要求76或77所述的聲音編碼方法,其特征在于在上述各脈沖的位置信息不足但上述脈沖的數(shù)多的模式中,使在音調(diào)峰值位置附近聲源脈沖的搜索位置較密、而在除此之外的部分使上述聲源脈沖的搜索位置稀疏地確定上述脈沖位置的搜索范圍。
79.按權(quán)利要求76~78的任一權(quán)項(xiàng)所述的聲音編碼方法,其特征在于在上述脈沖數(shù)少而位置信息充分的聲源模式中,將位置信息的一部分分配給表示噪音性的聲源編碼矢量的索引。
80.一種計(jì)算機(jī)可讀取的存儲(chǔ)媒體,其特征在于記錄用于執(zhí)行權(quán)利要求41~79的任一權(quán)項(xiàng)所述的聲音編碼方法的程序。
81.一種CELP型聲音譯碼裝置,其特征在于具有聲源生成部,用于增強(qiáng)與自適應(yīng)編碼矢量的音調(diào)峰值位置對(duì)應(yīng)的噪音編碼矢量的振幅。
82.按權(quán)利要求81所述的CELP型聲音譯碼裝置,其特征在于上述聲源生成部通過(guò)將與上述自適應(yīng)編碼矢量的音調(diào)周期同步的振幅增強(qiáng)窗復(fù)合到上述噪音編碼矢量上,增強(qiáng)與上述自適應(yīng)編碼矢量的音調(diào)峰值的位置對(duì)應(yīng)的上述噪音編碼矢量的振幅。
83.按權(quán)利要求82所述的CELP型聲音譯碼裝置,其特征在于上述聲源生成部將以上述自適應(yīng)編碼矢量的音調(diào)峰值位置為中心的三角窗作為振幅增強(qiáng)窗使用。
84.一種CELP型聲音譯碼裝置,其特征在于具有使用僅限定在自適應(yīng)編碼矢量的音調(diào)峰值附近的噪音編碼矢量的聲源生成部。
85.一種CELP型聲音譯碼裝置,將脈沖聲源使用于噪音編碼表,其特征在于具有聲源生成部,根據(jù)自適應(yīng)編碼表的音調(diào)周期和音調(diào)峰值位置確定脈沖位置的搜索范圍。
86.按權(quán)利要求85所述的CELP型聲音譯碼裝置,其特征在于上述聲源生成部將上述脈沖位置的搜索范圍確定為在上述自適應(yīng)編碼矢量的音調(diào)峰值位置附近較密而在除此之外的部分稀疏。
87.按權(quán)利要求85或86所述的CELP型聲音譯碼裝置,其特征在于根據(jù)上述音調(diào)周期切換上述脈沖位置的范圍。
88.按權(quán)利要求87所述的CELP型聲音譯碼裝置,其特征在于在上述自適應(yīng)編碼矢量中存在多個(gè)音調(diào)峰值時(shí),將上述脈沖位置的范圍限定為在范圍中至少包含兩個(gè)音調(diào)峰值的位置。
89.一種CELP型聲音譯碼裝置,其特征在于根據(jù)輸入聲音的分析結(jié)果切換噪音編碼表。
90.一種CELP型聲音譯碼裝置,其特征在于具有使用在進(jìn)行噪音編碼表搜索之前抽出的傳送參量切換噪音編碼表的聲源生成部。
91.按權(quán)利要求85~88的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于具有根據(jù)聲音信號(hào)的分析結(jié)果切換上述脈沖的條數(shù)的聲源生成部。
92.按權(quán)利要求85~88、91的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于具有聲源生成部,使用將在進(jìn)行上述噪音編碼表的搜索之前提取的傳送參量譯碼后的結(jié)果,切換上述脈沖的條數(shù)。
93.按權(quán)利要求85~88、91、92的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于具有根據(jù)上述音調(diào)周期切換上述脈沖的條數(shù)的聲源生成部。
94.按權(quán)利要求93所述的CELP型聲音譯碼裝置,其特征在于上述音調(diào)周期在連續(xù)的子幀間變化小時(shí)和不小時(shí),切換上述脈沖的條數(shù)。
95.按權(quán)利要求85~88、91~94的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于作為噪音聲源而使用脈沖聲源的噪音編碼矢量生成部確定上述脈沖位置和脈沖振幅。
96.按權(quán)利要求95所述的CELP型聲音譯碼裝置,其特征在于作為噪音聲源而使用脈沖聲源的噪音編碼矢量生成部在上述自適應(yīng)編碼矢量的音調(diào)峰值附近和除此之外的部分改變上述脈沖的振幅。
97.按權(quán)利要求93所述的CELP型聲音譯碼裝置,其特征在于通過(guò)統(tǒng)計(jì)或?qū)W習(xí),根據(jù)音調(diào)周期確定所使用的脈沖聲源的脈沖數(shù)。
98.一種CELP型聲音譯碼裝置,其特征在于具有對(duì)音調(diào)增益進(jìn)行多級(jí)量化的聲源生成部,在初級(jí),將在自適應(yīng)編碼表搜索之后求出的值作為量化目標(biāo),將所量化的增益進(jìn)行譯碼,在第2級(jí)以后,在聲源搜索全部結(jié)束后,將通過(guò)閉環(huán)搜索而確定的音調(diào)增益與在上述初級(jí)所量化的值的差分作為量化目標(biāo),將所量化的增益進(jìn)行譯碼。
99.按權(quán)利要求89~92、95~97的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于具有對(duì)音調(diào)增益進(jìn)行多級(jí)量化的聲源生成部,在初級(jí),將在自適應(yīng)編碼表搜索之后求出的值作為量化目標(biāo),將所量化的增益進(jìn)行譯碼,在第2級(jí)以后,在聲源搜索全部結(jié)束后,將通過(guò)閉環(huán)搜索而確定的音調(diào)增益與在上述初級(jí)所量化的值的差分作為量化目標(biāo),將所量化的增益進(jìn)行譯碼,使用在CELP型聲音譯碼裝置的自適應(yīng)編碼表搜索之后求出的音調(diào)增益的量化值切換固定編碼表。
100.按權(quán)利要求89~92、95~99的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于根據(jù)音調(diào)周期的子幀間變化切換固定編碼表。
101.按權(quán)利要求89~92、95~97的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于使用在此前的子幀中所譯碼的音調(diào)增益切換固定編碼表。
102.按權(quán)利要求89~92、95~97的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于根據(jù)音調(diào)周期的子幀間變化和量化音調(diào)增益切換固定編碼表。
103.按權(quán)利要求99~102的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于將脈沖聲源編碼表使用于固定編碼表中。
104.一種CELP型聲音譯碼裝置,對(duì)具有指定的時(shí)間長(zhǎng)度的各子幀進(jìn)行聲音譯碼處理,其特征在于判斷當(dāng)前的子幀的相位與此前的子幀的相位是否連續(xù),切換在判定為連續(xù)時(shí)和不連續(xù)時(shí)所使用的聲源。
105.按權(quán)利要求104所述的CELP型聲音譯碼裝置,其特征在于使用此前的子幀的音調(diào)峰值位置、此前的子幀的音調(diào)周期以及當(dāng)前子幀的音調(diào)周期預(yù)測(cè)當(dāng)前子幀的音調(diào)峰值位置,根據(jù)通過(guò)該預(yù)測(cè)而得到的當(dāng)前子幀的音調(diào)峰值位置是否靠近僅根據(jù)當(dāng)前子幀的數(shù)據(jù)求出的音調(diào)峰值位置,判斷上述此前的子幀的相位與上述當(dāng)前子幀的相位是否連續(xù),根據(jù)該判斷結(jié)果切換上述聲源的譯碼處理方法。
106.按權(quán)利要求104或105所述的CELP型聲音譯碼裝置,其特征在于在判定此前的子幀的相位與當(dāng)前子幀的相位連續(xù)時(shí),就對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理;在判定上述此前的子幀的相位與上述當(dāng)前子幀的相位不連續(xù)時(shí),就不對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理。
107.一種CELP型聲音譯碼裝置,對(duì)各具有指定時(shí)間長(zhǎng)度的子幀進(jìn)行聲音譯碼處理,其特征在于以信號(hào)功率在當(dāng)前的子幀的自適應(yīng)編碼矢量的音調(diào)峰值附近的集中度為基準(zhǔn)切換聲源信號(hào)的譯碼處理方法。
108.按權(quán)利要求107所述的CELP型聲音譯碼裝置,其特征在于信號(hào)功率在當(dāng)前子幀的自適應(yīng)編碼矢量的音調(diào)峰值附近占1音調(diào)周期長(zhǎng)的信號(hào)全體的比例大于指定值時(shí),就對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理;小于指定值時(shí),就不對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理。
109.按權(quán)利要求106或108所述的CELP型聲音譯碼裝置,其特征在于將作為上述相位自適應(yīng)處理在音調(diào)峰值附近較密地進(jìn)行脈沖位置搜索、而在音調(diào)峰值附近以外的部分稀疏地進(jìn)行脈沖位置搜索的脈沖聲源應(yīng)用于噪音聲源。
110.按權(quán)利要求85~88、91~97、103、109的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于將表示上述脈沖的位置的索引從子幀的開頭一側(cè)開始順序排列。
111.按權(quán)利要求110所述的CELP型聲音譯碼裝置,其特征在于在索引序號(hào)相同時(shí),從子幀的開頭一側(cè)順序加上脈沖的序號(hào),并進(jìn)而將各脈沖的搜索位置確定為在音調(diào)峰值附近較密而在音調(diào)峰值附近以外的部分稀疏。
112.按權(quán)利要求85~88、91~97、103、109的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于根據(jù)上述音調(diào)峰值位置確定上述脈沖的搜索位置的一部分,其他的脈沖搜索位置與音調(diào)峰值位置無(wú)關(guān),是預(yù)先確定的固定位置。
113.按權(quán)利要求1~88、91~97、99~103、105~112的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,其特征在于具有音調(diào)峰值位置計(jì)算單元,在求具有指定的時(shí)間長(zhǎng)度的聲音或聲源信號(hào)的上述音調(diào)峰值位置時(shí),只從該信號(hào)中分離出1音調(diào)周期長(zhǎng),并在分離出的信號(hào)內(nèi)確定音調(diào)峰值位置。
114.按權(quán)利要求113所述的CELP型聲音譯碼裝置,其特征在于在從該信號(hào)中只分離出1音調(diào)周期長(zhǎng)時(shí),首先,不分離1音調(diào)周期長(zhǎng)而使用該信號(hào)全體確定上述音調(diào)峰值位置,將該確定的音調(diào)峰值位置作為分離開始點(diǎn),分離1音調(diào)周期長(zhǎng),在分離出的信號(hào)內(nèi)確定上述音調(diào)峰值位置。
115.按權(quán)利要求81~88、91~97、99~103、105~112的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置,對(duì)各具有指定時(shí)間長(zhǎng)度的子幀進(jìn)行聲音譯碼處理,其特征在于計(jì)算當(dāng)前子幀的上述音調(diào)峰值位置時(shí),當(dāng)此前的子幀的音調(diào)周期與當(dāng)前的子幀的音調(diào)周期之差在預(yù)先確定的范圍內(nèi)時(shí),就使用此前的子幀的上述音調(diào)峰值位置、此前的子幀的音調(diào)周期以及當(dāng)前的子幀的音調(diào)周期預(yù)測(cè)當(dāng)前的子幀的音調(diào)峰值位置,使用通過(guò)該預(yù)測(cè)而得到的當(dāng)前子幀的音調(diào)峰值位置,預(yù)先限定當(dāng)前子幀的上述音調(diào)峰值位置的存在范圍,在該范圍內(nèi)進(jìn)行音調(diào)峰值位置搜索。
116.一種CELP型聲音譯碼裝置,對(duì)各具有指定時(shí)間長(zhǎng)度的子幀進(jìn)行聲音譯碼處理,其特征在于作為噪音編碼表使用脈沖聲源,至少具有2個(gè)模式以上的上述噪音編碼表的模式,通過(guò)切換模式,可以改變上述聲源脈沖的條數(shù),至少1個(gè)模式是各脈沖的位置信息充分的脈沖條數(shù)少的模式,其他模式是各脈沖的位置信息不足但脈沖數(shù)多的模式,通過(guò)傳送模式的切換信息進(jìn)行模式的切換。
117.按權(quán)利要求116所述的CELP型聲音譯碼裝置,其特征在于在音調(diào)周期短時(shí),與上述音調(diào)周期對(duì)應(yīng)地通過(guò)將上述聲源脈沖的搜索范圍限定在窄的范圍內(nèi),減少上述聲源脈沖的位置信息,增加上述聲源脈沖的條數(shù)。
118.按權(quán)利要求116或117所述的CELP型聲音譯碼裝置,其特征在于在上述各脈沖的位置信息不足但上述脈沖的數(shù)多的模式中,使在音調(diào)峰值位置附近聲源脈沖的搜索位置較密、而在除此之外的部分使上述聲源脈沖的搜索位置稀疏地確定上述脈沖位置的搜索范圍。
119.按權(quán)利要求116~118的任一權(quán)項(xiàng)所述的聲音譯碼裝置,其特征在于在上述脈沖數(shù)少而位置信息充分的聲源模式中,將位置信息的一部分分配給表示噪音性的聲源編碼矢量的索引。
120.一種計(jì)算機(jī)可讀取的存儲(chǔ)媒體,其特征在于記錄用于執(zhí)行權(quán)利要求81~119的任一權(quán)項(xiàng)所述的CELP型聲音譯碼裝置的功能的程序。
121.一種聲音譯碼方法,其特征在于具有增強(qiáng)與自適應(yīng)編碼矢量的音調(diào)峰值位置對(duì)應(yīng)的噪音編碼矢量的振幅的步驟。
122.按權(quán)利要求121所述的聲音譯碼方法,其特征在于通過(guò)將與上述自適應(yīng)編碼矢量的音調(diào)周期同步的振幅增強(qiáng)窗復(fù)合到上述噪音編碼矢量上,增強(qiáng)與上述自適應(yīng)編碼矢量的音調(diào)峰值的位置對(duì)應(yīng)的上述噪音編碼矢量的振幅。
123.按權(quán)利要求122所述的聲音譯碼方法,其特征在于作為振幅增強(qiáng)窗,使用以上述自適應(yīng)編碼矢量的音調(diào)峰值位置為中心的三角窗。
124.一種聲音譯碼方法,其特征在于具有使用僅限定在自適應(yīng)編碼矢量的音調(diào)峰值附近的噪音編碼矢量的步驟。
125.一種將脈沖聲源應(yīng)用于噪音編碼表的聲音譯碼方法,其特征在于具有根據(jù)自適應(yīng)編碼矢量的音調(diào)周期和音調(diào)峰值位置確定脈沖位置的搜索范圍的步驟。
126.按權(quán)利要求125所述的聲音譯碼方法,其特征在于上述聲源生成部將上述脈沖位置的搜索范圍確定為在上述自適應(yīng)編碼矢量的音調(diào)峰值位置附近較密、而在除此之外的部分稀疏。
127.按權(quán)利要求125或126所述的聲音譯碼方法,其特征在于根據(jù)上述音調(diào)周期切換上述脈沖位置的搜索范圍。
128.按權(quán)利要求127所述的聲音譯碼方法,其特征在于在上述自適應(yīng)編碼矢量中存在多個(gè)音調(diào)峰值時(shí),將上述脈沖位置的搜索范圍限定為至少2個(gè)音調(diào)峰值的位置包含在搜索范圍中。
129.一種聲音譯碼方法,其特征在于根據(jù)輸入聲音的分析結(jié)果切換噪音編碼表。
130.一種聲音譯碼方法,其特征在于具有使用在進(jìn)行噪音編碼表搜索之前提取的傳送參量切換噪音編碼表的聲源生成部。
131.按權(quán)利要求125~128的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于具有根據(jù)聲音信號(hào)的分析結(jié)果切換上述脈沖的條數(shù)的聲源生成部。
132.按權(quán)利要求125~128、131的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于具有使用在進(jìn)行上述噪音編碼表的搜索之前提取的傳送參量切換上述脈沖的條數(shù)的聲源生成部。
133.按權(quán)利要求125~128、131、132的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于具有根據(jù)上述音調(diào)周期切換上述脈沖的條數(shù)的聲源生成部。
134.按權(quán)利要求133所述的聲音譯碼方法,其特征在于在上述音調(diào)周期在連續(xù)的子幀間變化小時(shí)和變化不小時(shí),切換上述脈沖的條數(shù)。
135.按權(quán)利要求125~128、131~134的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于作為噪音聲源使用脈沖聲源的噪音編碼矢量生成部確定上述脈沖位置和脈沖振幅。
136.按權(quán)利要求135所述的聲音譯碼方法,其特征在于作為噪音聲源而使用脈沖聲源的噪音編碼矢量生成部在上述自適應(yīng)編碼矢量的音調(diào)峰值附近和除此之外的部分改變上述脈沖的振幅。
137.按權(quán)利要求133所述的聲音譯碼方法,其特征在于通過(guò)統(tǒng)計(jì)或?qū)W習(xí),根據(jù)音調(diào)周期確定所使用的脈沖聲源的脈沖數(shù)。
138.一種聲音譯碼方法,其特征在于使用對(duì)音調(diào)增益進(jìn)行多級(jí)量化的聲源生成部,在初級(jí),將在自適應(yīng)編碼表搜索之后求出的值作為量化目標(biāo),將所量化的增益譯碼,在第2級(jí)以后,在聲源搜索全部結(jié)束后,將通過(guò)閉環(huán)搜索而確定的音調(diào)增益與在上述初級(jí)所量化的值的差分作為量化目標(biāo),將所量化的增益進(jìn)行譯碼。
139.按權(quán)利要求129~132、1313~137的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于使用對(duì)音調(diào)增益進(jìn)行多級(jí)量化的聲源生成部,在初級(jí),將在自適應(yīng)編碼表搜索之后求出的值作為量化目標(biāo),將所量化的增益進(jìn)行譯碼,在第2級(jí)以后,在聲源搜索全部結(jié)束后,將通過(guò)閉環(huán)搜索而確定的音調(diào)增益與在上述初級(jí)所量化的值的差分作為量化目標(biāo),將所量化的增益譯碼,使用在聲音譯碼方法的自適應(yīng)編碼表搜索之后求出的音調(diào)增益的譯碼值切換固定編碼表。
140.按權(quán)利要求129~132、135~139的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于根據(jù)音調(diào)周期的子幀間變化切換固定編碼表。
141.按權(quán)利要求129~132、135~137的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于使用在此前的子幀中所譯碼的音調(diào)增益切換固定編碼表。
142.按權(quán)利要求129~132、135~137的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于根據(jù)音調(diào)周期的子幀間變化和量化音調(diào)增益切換固定編碼表。
143.按權(quán)利要求139~142的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于將脈沖聲源編碼表使用于固定編碼表中。
144.一種聲音譯碼方法,對(duì)具有指定時(shí)間長(zhǎng)度的各子幀進(jìn)行聲音譯碼處理,其特征在于判斷當(dāng)前子幀的相位與此前的子幀的相位是否連續(xù),切換在判定為連續(xù)時(shí)和不連續(xù)時(shí)所使用的聲源。
145.按權(quán)利要求144所述的聲音譯碼方法,其特征在于使用此前的子幀的音調(diào)峰值位置、此前的子幀的音調(diào)周期以及當(dāng)前子幀的音調(diào)周期預(yù)測(cè)當(dāng)前子幀的音調(diào)峰值位置,根據(jù)通過(guò)該預(yù)測(cè)而得到的當(dāng)前子幀的音調(diào)峰值位置是否靠近僅根據(jù)當(dāng)前子幀的數(shù)據(jù)求出的音調(diào)峰值位置,判斷上述此前的子幀的相位與上述當(dāng)前子幀的相位是否連續(xù),根據(jù)該判斷結(jié)果切換上述聲源的譯碼處理方法。
146.按權(quán)利要求144或145所述的聲音譯碼方法,其特征在于在判定此前的子幀的相位與當(dāng)前子幀的相位連續(xù)時(shí),就對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理;在判定上述此前的子幀的相位與上述當(dāng)前子幀的相位不連續(xù)時(shí),就不對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理。
147.一種聲音譯碼方法,對(duì)各具有指定時(shí)間長(zhǎng)度的子幀進(jìn)行聲音譯碼處理,其特征在于以信號(hào)功率在當(dāng)前子幀的自適應(yīng)編碼矢量的音調(diào)峰值附近的集中度為基準(zhǔn),切換聲源信號(hào)的譯碼處理方法。
148.按權(quán)利要求147所述的聲音譯碼方法,其特征在于當(dāng)信號(hào)功率在當(dāng)前子幀的自適應(yīng)編碼矢量的音調(diào)峰值附近占1音調(diào)周期長(zhǎng)的信號(hào)全體的比例大于指定值時(shí),就對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理;小于指定值時(shí),就不對(duì)噪音編碼表進(jìn)行相位自適應(yīng)處理。
149.按權(quán)利要求146或148所述的聲音譯碼方法,其特征在于將作為上述相位自適應(yīng)處理、在音調(diào)峰值附近較密地進(jìn)行脈沖位置搜索而在音調(diào)峰值附近以外的部分稀疏地進(jìn)行脈沖位置搜索的脈沖聲源應(yīng)用于噪音聲源。
150.按權(quán)利要求125~128、131~137、143、149的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于將表示上述脈沖的位置的索引從子幀的開頭一側(cè)開始順序排列。
151.按權(quán)利要求150所述的聲音譯碼方法,其特征在于在索引序號(hào)相同時(shí),從子幀的開頭一側(cè)順序加上脈沖的序號(hào),并進(jìn)而將各脈沖的搜索位置確定為在音調(diào)峰值附近較密而在音調(diào)峰值附近以外的部分稀疏。
152.按權(quán)利要求125~128、131~137、143、149的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于根據(jù)上述音調(diào)峰值位置確定上述脈沖的搜索位置的一部分,其他的脈沖搜索位置與音調(diào)峰值位置無(wú)關(guān),是預(yù)先確定的固定位置。
153.按權(quán)利要求121~128、131~137、139~143、145~152的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于具有在求具有指定的時(shí)間長(zhǎng)度的聲音或聲源信號(hào)的上述音調(diào)峰值位置時(shí)、只從該信號(hào)中分離出1音調(diào)周期長(zhǎng)并在分離出的信號(hào)內(nèi)確定音調(diào)峰值位置的音調(diào)峰值位置計(jì)算步驟。
154.按權(quán)利要求153所述的聲音譯碼方法,其特征在于在從該信號(hào)中只分離出1音調(diào)周期長(zhǎng)時(shí),首先,不分離1音調(diào)周期長(zhǎng)而使用該信號(hào)全體確定上述音調(diào)峰值位置,將該確定的音調(diào)峰值位置作為分離開始點(diǎn),分離1音調(diào)周期長(zhǎng),在分離出的信號(hào)內(nèi)確定上述音調(diào)峰值位置。
155.按權(quán)利要求121~128、131~137、139~143、145~152的任一權(quán)項(xiàng)所述的聲音譯碼方法,對(duì)各具有指定時(shí)間長(zhǎng)度的子幀進(jìn)行聲音譯碼處理,其特征在于計(jì)算當(dāng)前子幀的上述音調(diào)峰值位置時(shí),當(dāng)此前的子幀的音調(diào)周期與當(dāng)前的子幀的音調(diào)周期之差在預(yù)先確定的范圍內(nèi)時(shí),就使用此前的子幀的上述音調(diào)峰值位置、此前的子幀的音調(diào)周期以及當(dāng)前的子幀的音調(diào)周期預(yù)測(cè)當(dāng)前子幀的音調(diào)峰值位置,使用通過(guò)該預(yù)測(cè)而得到的當(dāng)前子幀的音調(diào)峰值位置,預(yù)先限定當(dāng)前子幀的上述音調(diào)峰值位置的存在范圍,在該范圍內(nèi)進(jìn)行音調(diào)峰值位置搜索。
156.一種聲音譯碼方法,對(duì)各具有指定時(shí)間長(zhǎng)度的子幀進(jìn)行聲音譯碼處理,其特征在于作為噪音編碼表使用脈沖聲源,至少具有2個(gè)模式以上的上述噪音編碼表的模式,通過(guò)切換模式,可以改變上述聲源脈沖的條數(shù),至少1個(gè)模式是各脈沖的位置信息充分、脈沖條數(shù)少的模式,其他模式是各脈沖的位置信息不足但脈沖數(shù)多的模式,通過(guò)傳送模式的切換信息進(jìn)行模式的切換。
157.按權(quán)利要求156所述的聲音譯碼方法,其特征在于在音調(diào)周期短時(shí),通過(guò)與上述音調(diào)周期對(duì)應(yīng)地將上述聲源脈沖的搜索范圍限定在窄的范圍內(nèi),減少上述聲源脈沖的位置信息,增加上述聲源脈沖的條數(shù)。
158.按權(quán)利要求156或157所述的聲音譯碼方法,其特征在于在上述各脈沖的位置信息不足但上述脈沖的數(shù)多的模式中,使在音調(diào)峰值位置附近聲源脈沖的搜索位置較密、而在除此之外的部分使上述聲源脈沖的搜索位置稀疏地確定上述脈沖位置的搜索范圍。
159.按權(quán)利要求156~158的任一權(quán)項(xiàng)所述的聲音譯碼方法,其特征在于在上述脈沖數(shù)少而位置信息充分的聲源模式中,將位置信息的一部分分配給表示噪音性的聲源編碼矢量的索引。
160.一種計(jì)算機(jī)可讀取的存儲(chǔ)媒體,其特征在于記錄用于執(zhí)行權(quán)利要求121~159的任一權(quán)項(xiàng)所述的聲音譯碼方法的程序。
161.一種移動(dòng)通信裝置,其特征在于具有權(quán)利要求1~39的任一權(quán)項(xiàng)所述的聲音編碼裝置、調(diào)制上述聲音編碼裝置的輸出信號(hào)的調(diào)制單元和放大上述調(diào)制單元的輸出信號(hào)的放大單元。
全文摘要
本發(fā)明旨在提高CELP型聲音編碼裝置和CELP型聲音譯碼裝置的聲源生成部的音質(zhì),由音調(diào)峰值位置計(jì)算器12計(jì)算自適應(yīng)編碼矢量的音調(diào)峰值位置,由振幅增強(qiáng)窗生成器13生成用于增強(qiáng)音調(diào)峰值位置的振幅的窗,由振幅增強(qiáng)加窗器16增強(qiáng)與音調(diào)峰值位置對(duì)應(yīng)的噪音編碼矢量的振幅。將脈沖的搜索位置確定為在音調(diào)峰值位置附近密而在除此之外的部分稀疏,根據(jù)所確定的搜索位置進(jìn)行脈沖位置搜索。利用此前的子幀的音調(diào)峰值位置、音調(diào)周期信息以及當(dāng)前的子幀的音調(diào)周期信息反向自適應(yīng)地切換聲源結(jié)構(gòu),提高音質(zhì),同時(shí)抑制傳送路線錯(cuò)誤的影響的傳播。
文檔編號(hào)G10L19/12GK1205097SQ97191350
公開日1999年1月13日 申請(qǐng)日期1997年8月4日 優(yōu)先權(quán)日1996年8月2日
發(fā)明者江原宏幸, 森井利幸 申請(qǐng)人:松下電器產(chǎn)業(yè)株式會(huì)社