欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

音頻分類方法

文檔序號(hào):2829659閱讀:588來(lái)源:國(guó)知局

專利名稱::音頻分類方法
技術(shù)領(lǐng)域
:本發(fā)明涉及信息處理領(lǐng)域,尤其涉及一種音頻分類方法。
背景技術(shù)
:在擴(kuò)展寬帶自適應(yīng)多碼率(AMR-WB+,ExtendedAdaptiveMulti-Rate-Wideband)編碼標(biāo)準(zhǔn)中核心編碼有兩種模式即代數(shù)碼本激勵(lì)線性預(yù)測(cè)(ACELP,AlgebraicCodeExcitedLinearPrediction)和傳輸變換編碼激勵(lì)(TCX,TransformCodedExcitation)模式,ACELP模式比較適合語(yǔ)音信號(hào),而TCX模式對(duì)音樂(lè)信號(hào)的編碼效果比較好。在AMR-WB+標(biāo)準(zhǔn)中需要對(duì)每一幀信號(hào)進(jìn)行預(yù)先編碼,然后再選擇采用哪種最佳模式進(jìn)行編碼,但是對(duì)每幀信號(hào)都要進(jìn)行預(yù)先編碼處理,這樣會(huì)導(dǎo)致計(jì)算量非常龐大,故需要對(duì)信號(hào)進(jìn)行預(yù)先分類以減少計(jì)算量。而語(yǔ)音和音樂(lè)是音頻信號(hào)中最主要的兩類數(shù)據(jù),因此對(duì)語(yǔ)音和音樂(lè)信號(hào)進(jìn)行區(qū)分也是提取音頻內(nèi)容語(yǔ)義和結(jié)構(gòu)的重要手段之一?,F(xiàn)有技術(shù)一是采用簡(jiǎn)單決策樹分類方法對(duì)音頻信號(hào)進(jìn)行多步多層次分類,該分類方法每一步都要根據(jù)一種或者幾種音頻特征及其閾值判斷音頻所屬的類別,其中,一般選擇的特征參數(shù)包含過(guò)零率、基因周期、頻帶中心、子帶能量、頻譜平滑(SF,SpectrumFlux)、Mel頻率倒謙參數(shù)(MCFF,MelFrequencyCepstralCoefficients)等。該現(xiàn)有技術(shù)對(duì)特征參數(shù)的選擇要求比較高,選擇的特征參數(shù)除必須具有較高的有效性、合理性和分類性能較好的特點(diǎn)外,還需要能夠充分表示音頻的重要分類特性,以及對(duì)環(huán)境具有較好的魯棒性和一般性,其中,一般性是指特征參數(shù)對(duì)各種類型的距離度量方法都能取到比較好的結(jié)果。現(xiàn)有技術(shù)二是采用分類器對(duì)音頻信號(hào)進(jìn)行分類,比較常見(jiàn)的分類器包括隱馬爾可夫模型(HMM,HiddenMarkovModel)、高斯混合模型(GMM,GaussianMixtureModel)和神經(jīng)網(wǎng)絡(luò)等,例如,HMM實(shí)質(zhì)上是一種雙隨機(jī)過(guò)程的有限狀態(tài)自動(dòng)機(jī),它具有刻畫信號(hào)的時(shí)間隨機(jī)統(tǒng)計(jì)特性能力,并根據(jù)極大似然準(zhǔn)則判決音頻的類別?,F(xiàn)有技術(shù)一中每步都需要根據(jù)一種或幾種音頻特征及其閾值判斷音頻所屬的類別,因此該現(xiàn)有技術(shù)在提取性能較好的特征參數(shù)時(shí)的運(yùn)算量比較大,例如,提取MFCC參數(shù)需要進(jìn)行Mel濾波、離散余弦變換(DCT,DiscreteCosineTransform)等,故而增加了計(jì)算量,并且現(xiàn)有技術(shù)一還要受多個(gè)特征參數(shù)先后判斷順序的影響。另外,現(xiàn)有技術(shù)二中事先要對(duì)分類器進(jìn)行大量數(shù)據(jù)的訓(xùn)練,整個(gè)過(guò)程計(jì)算量較大,并且不易于硬件實(shí)現(xiàn)。因此,現(xiàn)有技術(shù)的缺陷是在音頻信號(hào)分類的過(guò)程中運(yùn)算量比較大。
發(fā)明內(nèi)容本發(fā)明要解決的技術(shù)問(wèn)題是提供一種音頻分類方法,該方法在對(duì)音頻信號(hào)進(jìn)行有效分類的同時(shí)又大大減少了運(yùn)算量。為解決上述技術(shù)問(wèn)題,本發(fā)明提供了一種音頻分類方法,該方法包括對(duì)輸入的音頻信號(hào)進(jìn)行預(yù)處理,再計(jì)算預(yù)處理過(guò)的音頻信號(hào)的線性預(yù)測(cè)編碼系數(shù);根據(jù)線性預(yù)測(cè)編碼系數(shù)得到信號(hào)的頻譜包絡(luò),再由計(jì)算得到的導(dǎo)傳對(duì)參數(shù)確定幅度差異值;根據(jù)幅度差異值的統(tǒng)計(jì)結(jié)果設(shè)置門限,再根據(jù)門限對(duì)音頻信號(hào)進(jìn)行分類。可選地,采用杜賓算法、格型算法或舒爾算法計(jì)算音頻信號(hào)的線性預(yù)測(cè)編碼系數(shù)。可選地,上述根據(jù)線性預(yù)測(cè)編碼系數(shù)得到信號(hào)的頻語(yǔ)包絡(luò)包括根據(jù)線性預(yù)測(cè)編碼系數(shù)得到線性預(yù)測(cè)誤差濾波器的傳遞函數(shù),并由傳遞函數(shù)計(jì)算得到導(dǎo)譜對(duì)參數(shù);根據(jù)導(dǎo)譜對(duì)參數(shù)設(shè)置濾波系數(shù),再由濾波系數(shù)得到信號(hào)導(dǎo)譜對(duì)頻譜包絡(luò)??蛇x地,上述根據(jù)線性預(yù)測(cè)編碼系數(shù)得到信號(hào)的頻語(yǔ)包絡(luò)包括根據(jù)線性預(yù)測(cè)編碼系數(shù)計(jì)算得到線性預(yù)測(cè)誤差濾波器的傳遞函數(shù),再由傳遞函數(shù)得到信號(hào)的線性預(yù)測(cè)編碼頻譜包絡(luò)??蛇x地,上述由計(jì)算得到的導(dǎo)譜對(duì)參數(shù)確定幅度差異值包括確定導(dǎo)譜對(duì)參數(shù)在信號(hào)頻譜包絡(luò)中對(duì)應(yīng)的幅度值,再計(jì)算導(dǎo)譜對(duì)參數(shù)對(duì)應(yīng)幅度值之間的比值就可以得到幅度差異值??蛇x地,上述由計(jì)算得到的導(dǎo)譜對(duì)參數(shù)確定幅度差異值包括選取相鄰導(dǎo)譜對(duì)參數(shù)之間的幅度值作為頻譜的代表點(diǎn),再計(jì)算代表點(diǎn)對(duì)應(yīng)幅度值之間的比值就可以得到幅度差異值。其中,根據(jù)幅度差異值的統(tǒng)計(jì)結(jié)果設(shè)置門限包括計(jì)算幅度值對(duì)應(yīng)頻率點(diǎn)之間的差值,再計(jì)算幅度差異值和該差值的比值得到幅度差異值的變化量;對(duì)幅度差異值的變化量進(jìn)行統(tǒng)計(jì),再根據(jù)統(tǒng)計(jì)結(jié)果設(shè)置門限??蛇x地,根據(jù)幅度差異值的統(tǒng)計(jì)結(jié)果設(shè)置門限包括對(duì)幅度差異值進(jìn)行統(tǒng)計(jì),再根據(jù)統(tǒng)計(jì)結(jié)果設(shè)置門限??蛇x地,在對(duì)音頻信號(hào)進(jìn)行分類之前或之后進(jìn)一步包括采用過(guò)零率或基因周期對(duì)音頻信號(hào)進(jìn)行分類。可選地,采用對(duì)信號(hào)加窗或分幀方式對(duì)音頻信號(hào)進(jìn)行預(yù)處理。以上技術(shù)方案可以看出,本發(fā)明提供的音頻分類方法具有以下有益效果首先,本發(fā)明先計(jì)算信號(hào)的頻譜包絡(luò),再根據(jù)頻譜幅度值對(duì)音頻信號(hào)進(jìn)行分類,與現(xiàn)有技術(shù)每步都要根據(jù)幾種音頻特征參數(shù)以及特征參數(shù)的闊值或者對(duì)分類器進(jìn)行大量數(shù)據(jù)的訓(xùn)練相比較,本發(fā)明在對(duì)音頻信號(hào)進(jìn)行分類的過(guò)程中大大減少了計(jì)算量。點(diǎn),再計(jì)算代表點(diǎn)所對(duì)應(yīng)幅度值之間的差異值,這樣就不需要計(jì)算頻語(yǔ)所有頻率點(diǎn)之間的幅度差異值,進(jìn)而又進(jìn)一步減少了對(duì)音頻信號(hào)進(jìn)行分類所帶來(lái)的計(jì)算量,而且也提高了分類的準(zhǔn)確性。進(jìn)一步地,如果將本發(fā)明方法嵌入AMR-WB+標(biāo)準(zhǔn)的信號(hào)處理流程中時(shí),由于導(dǎo)語(yǔ)對(duì)參數(shù)在選擇編碼模式之前就已經(jīng)計(jì)算好了,因此只需利用已求出的導(dǎo)譜對(duì)參數(shù)計(jì)算信號(hào)的頻譜包絡(luò),然后再計(jì)算相應(yīng)頻率之間的幅度差異值就可以區(qū)分音頻信號(hào)了,這樣使對(duì)音頻信號(hào)分類的計(jì)算量非常小。進(jìn)一步地,由于本發(fā)明是通過(guò)計(jì)算頻譜幅度之間的比值得到幅度差異值,這樣可以避免由幅度值大小的波動(dòng)而引起的錯(cuò)誤判斷,從而提高了對(duì)音頻信號(hào)進(jìn)行分類的準(zhǔn)確性。進(jìn)一步地,由于本發(fā)明在根據(jù)幅度差異值的門限對(duì)音頻信號(hào)分類之前或之后又采用過(guò)零率或基因周期對(duì)音頻信號(hào)分類,這樣又進(jìn)一步提高了對(duì)音頻信號(hào)進(jìn)行分類的準(zhǔn)確性。進(jìn)一步地,由于本發(fā)明是利用導(dǎo)譜對(duì)參數(shù)對(duì)應(yīng)的頻譜幅度差異值來(lái)區(qū)分語(yǔ)音和音樂(lè)信號(hào),這樣使本發(fā)明能夠提取一種容錯(cuò)性和抗噪性比較好的分類特征參數(shù)。最后,如果將本發(fā)明方法嵌入AMR-WB+標(biāo)準(zhǔn)的編碼流程之前,這樣就能夠在編碼之前就能夠較好地區(qū)分語(yǔ)音和音樂(lè)信號(hào),因而在AMR-WB+標(biāo)準(zhǔn)的處理流程中就完全可以不采用預(yù)先編碼方式,直接采用相應(yīng)的編碼模式進(jìn)行編碼,這樣可以簡(jiǎn)化信號(hào)的處理流程,同時(shí)又可以大大減少編碼的計(jì)算量,進(jìn)而提高了編碼的效率。圖1是本發(fā)明方法實(shí)施例一的流程圖;圖2是頻譜包絡(luò)和導(dǎo)譜對(duì)參數(shù)的關(guān)系示意圖;圖3是本發(fā)明方法實(shí)施例二的流程圖。具體實(shí)施例方式語(yǔ)音信號(hào)的帶寬是在0.3赫茲與3.4千赫茲之間,而音樂(lè)信號(hào)的帶寬一般在22千赫茲左右;語(yǔ)音信號(hào)的頻率中心要比音樂(lè)信號(hào)的低,語(yǔ)音信號(hào)的能量主要集中在低頻段,而音樂(lè)信號(hào)的頻域能量分布比較均勻,因此語(yǔ)音信號(hào)的頻譜平滑(SF)參數(shù)明顯地要大于音樂(lè)信號(hào)的SF參數(shù)。根據(jù)上述理論和現(xiàn)有技術(shù)的缺陷提出了一個(gè)用頻譜平滑參數(shù)判斷信號(hào)類型的構(gòu)思,利用SF參數(shù)判斷信號(hào)類型的過(guò)程如下首先,計(jì)算音頻信號(hào)的快速傅里葉變換(n'T,l;astFourierTransform)得到頻譜幅度;其次,計(jì)算相鄰兩點(diǎn)幅度值之差的絕對(duì)值;接著,計(jì)算這些幅度值之差的絕對(duì)值得平均值或者求和;最后,選擇一個(gè)恰當(dāng)?shù)拈撝狄詤^(qū)分語(yǔ)音和音樂(lè)信號(hào)。盡管這種特征參數(shù)可以較好地區(qū)分語(yǔ)音和音樂(lè)信號(hào),但是由于對(duì)頻譜相鄰之間的所有點(diǎn)都要計(jì)算幅度之差的絕對(duì)值,并且還需要進(jìn)行快速傅里葉變換,這樣會(huì)增加計(jì)算量,而且還有可能會(huì)由于幅度值大小而引起錯(cuò)誤的判斷,故而沒(méi)有解決現(xiàn)有技術(shù)所存在的問(wèn)題。針對(duì)上述構(gòu)思存在的兩個(gè)問(wèn)題,本發(fā)明對(duì)該構(gòu)思作了進(jìn)一步的改進(jìn)首先,由語(yǔ)音和音樂(lè)信號(hào)頻譜的平滑特性得知,音樂(lè)信號(hào)的頻譜包絡(luò)要比語(yǔ)音信號(hào)平坦,在中低頻段,語(yǔ)音信號(hào)的頻譜包絡(luò)起伏變化比較急劇,故可以將信號(hào)的頻譜包絡(luò)近似看作信號(hào)的頻語(yǔ),而信號(hào)的頻譜包絡(luò)可以由線性預(yù)測(cè)編碼(LPC,LinearPredictiveCoding)系數(shù)或者導(dǎo)譜對(duì)(ISP,I隨ittanceSpectralPairs)參數(shù)得到,LPC系數(shù)或ISP參數(shù)估計(jì)得到的頻譜包絡(luò)都能夠較好地反映音頻信號(hào)的頻謙包絡(luò),但是ISP頻譜包絡(luò)更能反映信號(hào)的諧振特性,另外,計(jì)算信號(hào)的LPC或ISP頻鐠包絡(luò)要比直接利用FFT得到信號(hào)頻譜的運(yùn)算量要大為減少,因此本發(fā)明利用信號(hào)的頻譜包絡(luò)代替利用FFT得到的信號(hào)頻譜可以解決計(jì)算量大的問(wèn)題。另外,頻譜包絡(luò)的峰值分布關(guān)系可以代替信號(hào)的頻譜包絡(luò),也就是可以利用頻譜包絡(luò)峰值分布特點(diǎn)代替信號(hào)的頻譜特性,因而可以利用峰值點(diǎn)之間的幅度差異值來(lái)取代相鄰兩點(diǎn)之間的幅度差異值,這樣不僅可以避免由幅度值大小的波動(dòng)而引起的錯(cuò)誤判斷,而且還可以進(jìn)一步減少計(jì)算量,因此本發(fā)明-'j用幅度差異值可以解決由幅度值大小而引起的錯(cuò)誤判斷。根據(jù)上述改進(jìn)之處,本發(fā)明提供了一種音頻分類方法,該方法的基本思想是對(duì)輸入的音頻信號(hào)進(jìn)行預(yù)處理,再計(jì)算預(yù)處理過(guò)的音頻信號(hào)的線性預(yù)測(cè)編碼系數(shù);根據(jù)線性預(yù)測(cè)編碼系數(shù)得到信號(hào)的頻譜包絡(luò),再由計(jì)算得到的導(dǎo)譜對(duì)參數(shù)確定幅度差異值;根據(jù)幅度差異值的統(tǒng)計(jì)結(jié)果設(shè)置門限,再根據(jù)門限對(duì)音頻信號(hào)進(jìn)行分類。根據(jù)上述方法的基本思想,下面結(jié)合附圖對(duì)本發(fā)明方法的具體技術(shù)方案進(jìn)4亍i羊細(xì)iJL明。參照?qǐng)D1,圖1是本發(fā)明方法實(shí)施例一的流程圖,該流程具體包括以下步驟步驟IOI、對(duì)輸入的音頻信號(hào)進(jìn)行預(yù)處理,其中,可以采用加窗函數(shù)、對(duì)信號(hào)分幀和濾波等方式對(duì)音頻信號(hào)進(jìn)行預(yù)處理。步驟102、音頻信號(hào)經(jīng)過(guò)預(yù)處理后,再按照杜賓算法、格型算法或舒爾算法等計(jì)算該音頻信號(hào)的線性預(yù)測(cè)編碼系數(shù),假設(shè)p階的線性預(yù)測(cè)誤差濾波器傳遞函數(shù)為」(2),即/lfz」二v4""(z),然后再定義兩個(gè)p階多項(xiàng)式<formula>formulaseeoriginaldocumentpage9</formula>(1)<formula>formulaseeoriginaldocumentpage9</formula>(2)從上面兩式可直接推出步驟103、根據(jù)LPC系數(shù)可以得到線性預(yù)測(cè)誤差濾波器傳遞函凄U(z),再由zlO)可以推導(dǎo)求出P(力和2(X),具體如下步驟104、令P(::)::O,2(z)=0,再按照式(4)和式(5)計(jì)算求出/-l個(gè)導(dǎo)譜對(duì)參數(shù)w,、e,,isF參數(shù)也就是零點(diǎn)頻率,其中,o,、e,按照以下方式進(jìn)行4非歹')0〈0,〈e,o^〈G2〈…〈兀。步驟i05、根據(jù)計(jì)算得到的isp參數(shù)ove,設(shè)置線性預(yù)測(cè)誤差濾波器的濾波系數(shù)。步驟106、根據(jù)計(jì)算得到的濾波系數(shù)求出線性預(yù)測(cè)誤差濾波器的頻率響應(yīng)再根據(jù)頻率響應(yīng)計(jì)算得到信號(hào)的頻譜包絡(luò)I/Z(e'"'l,具體如下〃k(6)從式(6)中可以看出,如果相鄰的isp參數(shù)03,和e,很靠近,那么w接近這些頻率時(shí),1^e'"r變小,1〃(e'"T就顯示出強(qiáng)諧振特性,相應(yīng)地,音頻信號(hào)的頻語(yǔ)包絡(luò)在這些頻率附近就會(huì)出現(xiàn)峰值,相反如果相鄰的ISP參數(shù)距離較遠(yuǎn),則頻譜包絡(luò)在該區(qū)域是相對(duì)比較平坦的,具體可參照?qǐng)D2,圖2橫坐標(biāo)的小圓圏代表ISF參數(shù),因此可以說(shuō)ISP包絡(luò)是用ISP參數(shù)co,和e,的分布密度來(lái)表示音頻信號(hào)的頻譜特性。步驟107、確定ISP參數(shù)在信號(hào)頻譜包絡(luò)中對(duì)應(yīng)的幅度值,本實(shí)施方式是直接利用isp參數(shù)o,和e,對(duì)應(yīng)的幅度值來(lái)計(jì)算幅度差異值的。步驟108、計(jì)算1sp參數(shù)對(duì)應(yīng)幅度值之間的比值得到幅度差異值,再采用求平均值、均方值或數(shù)學(xué)期望等統(tǒng)計(jì)特性對(duì)幅度差異值進(jìn)行統(tǒng)計(jì),其中,統(tǒng)計(jì)的對(duì)象可以是幅度差異值,也可以是體現(xiàn)幅度差異值的關(guān)系式,例如/1,,+/1,20一(y4^^等等。cpHl—q),cp,+l—cp,假設(shè)幅度差異值為J,+A,其中^代表幅度值,通常用丄來(lái)反映(P,+l-(P,頻譜幅度變化的快慢程度,從而更能區(qū)分語(yǔ)音和音樂(lè)信號(hào),其中cp,表示幅度值^所對(duì)應(yīng)的頻率。下面結(jié)合表l的數(shù)據(jù)來(lái)說(shuō)明語(yǔ)音和音樂(lè)信號(hào)的區(qū)別,表l的數(shù)據(jù)是按照20/og10.」,+爿計(jì)算得到,也就是將4'1+4計(jì)算得到的數(shù)據(jù)轉(zhuǎn)化為增益形式。<table>tableseeoriginaldocumentpage11</column></row><table>表l中的數(shù)據(jù)包括語(yǔ)音和音樂(lè)數(shù)據(jù),其中每個(gè)語(yǔ)音或音樂(lè)數(shù)據(jù)又包含3種不同類型的數(shù)據(jù),因?yàn)檎Z(yǔ)音信號(hào)的能量大部分集中在低頻階段并且幅度變化比較快,所以它在中低頻階段的均值要高于音樂(lè)信號(hào),另外,在計(jì)算低頻均值過(guò)程中通常會(huì)將CO;和&所對(duì)應(yīng)的幅度值的差異值去掉,這是因?yàn)闊o(wú)論是語(yǔ)音還是音樂(lè)信號(hào),O),和e,對(duì)應(yīng)的幅度差異值都是較大的,與中低頻的統(tǒng)計(jì)結(jié)果相差較大?,F(xiàn)以求平均值方式對(duì)幅度差異值進(jìn)行統(tǒng)計(jì),選取幾個(gè)中低頻幅度差異值以及如何選取幅度差異值可以根據(jù)實(shí)際情況做出選擇。下面從表l中選取第2個(gè)、第3個(gè)和第4個(gè)幅度差異值,然后分別對(duì)語(yǔ)音數(shù)據(jù)和音樂(lè)數(shù)據(jù)計(jì)算這3個(gè)值的平均值,語(yǔ)音1的平均值為27.8408,語(yǔ)音2的平均值為24.5787,語(yǔ)音3的平均值為25.6078,音樂(lè)l的平均值為16.7606,音樂(lè)2的平均值為15.5892,音樂(lè)3的平均值為18.4927,從這幾組平均值可以看出,語(yǔ)音信號(hào)的平均值要大于24,而音樂(lè)信號(hào)的平均值要小于19,這樣就可以根據(jù)中低頻差異值的平均值就可以對(duì)語(yǔ)音和音樂(lè)信號(hào)進(jìn)行分類。步驟09、根據(jù)幅度差異值的統(tǒng)計(jì)結(jié)果設(shè)置一個(gè)恰當(dāng)?shù)拈T限用以區(qū)分語(yǔ)音信號(hào)、音樂(lè)信號(hào)以及噪聲等,假設(shè)語(yǔ)音信號(hào)的平均值大于24,音樂(lè)信號(hào)的平均值小于19,噪聲的平均值大于29,可以將門限設(shè)置為區(qū)間[24,29]就可以區(qū)分音頻信號(hào)。其中,本發(fā)明方法除了利用ISP參數(shù)對(duì)應(yīng)幅度值得到幅度差異值之外,還可以利用相鄰ISP參數(shù)之間的幅度值得到幅度差異值,所述幅度值可以是最大幅度值或最小幅度值等。由圖2可知,當(dāng)相鄰ISP參數(shù)很靠近的時(shí)候,相應(yīng)地音頻信號(hào)譜包絡(luò)在這些頻率附近就會(huì)出現(xiàn)峰值,這樣選取它們相鄰ISP參數(shù)之間的最大頻譜幅度值就可以代替信號(hào)的頻譜特性。既然ISF參數(shù)能夠較好地代表頻譜特性,因而完全可以用;-l個(gè)ISP參數(shù)作為頻譜的代表點(diǎn),這樣僅僅需要計(jì)算/>1個(gè)代表點(diǎn)對(duì)應(yīng)的幅度值之間的差異,進(jìn)而大大減少了計(jì)算量。另外,為了更好地區(qū)分語(yǔ)音和音樂(lè)信號(hào)等,在采用幅度差異值區(qū)分音頻信號(hào)之前或之后可以先采取過(guò)零率、基因周期等特征參數(shù)區(qū)分語(yǔ)音和音樂(lè)信號(hào)。參照?qǐng)D3,圖3是本發(fā)明方法實(shí)施例二的流程圖,該流程具體包括以下步驟步驟301、對(duì)輸入的音頻信號(hào)進(jìn)行預(yù)處理,其中,可以采用加窗函數(shù)或?qū)π盘?hào)分幀等方式對(duì)音頻信號(hào)進(jìn)行預(yù)處理。步驟302、音頻信號(hào)經(jīng)過(guò)預(yù)處理后,按照杜賓算法、格型算法或舒爾算法等計(jì)算信號(hào)的線性預(yù)測(cè)編碼(LPC)系數(shù),假設(shè)/階的線性預(yù)測(cè)誤差濾波器傳遞函數(shù)為J(z),即/^2^二jw(z),然后再定義兩個(gè)p階多項(xiàng)式P(z)=4:)+z-從上面兩式可直接推出步驟303、根據(jù)LPC系數(shù)可以得到線性預(yù)測(cè)誤差濾波器傳遞函凄L4(z),再由/1(z)可以推導(dǎo)求出P(:r)和2(力,具體如下<formula>formulaseeoriginaldocumentpage13</formula>步驟304、根據(jù)^(z)計(jì)算線性預(yù)測(cè)誤差濾波器的頻率響應(yīng),從而得到LPC頻譜包絡(luò)。與ISP頻譜包絡(luò)相比,盡管LPC頻譜包絡(luò)不能很好地反映信號(hào)的諧振特性,但是LPC頻譜包絡(luò)也能夠較好地反映信號(hào)的頻譜特性。步驟305、根據(jù)P②和2(z)計(jì)算求出p-l個(gè)零點(diǎn)頻率也即ISP參數(shù)(0,、G,,其中,co,、e,按照以下方式進(jìn)行排列(^ff^e^m^^^.^K,步驟306、由ISP參數(shù)確定相應(yīng)頻率在信號(hào)的頻譜包絡(luò)中所對(duì)應(yīng)的幅度值,其中,相應(yīng)頻率可以是導(dǎo)譜對(duì)參數(shù)對(duì)應(yīng)的頻率,也可以是兩相鄰導(dǎo)譜對(duì)參數(shù)之間的頻率。步驟307、計(jì)算相應(yīng)頻率點(diǎn)幅度值的比值得到幅度差異值,再采用求平均值、均方值或數(shù)學(xué)期望等統(tǒng)計(jì)特性對(duì)幅度差異值進(jìn)行統(tǒng)計(jì),該步驟的實(shí)現(xiàn)方式與實(shí)施例一相同。步驟308、根據(jù)幅度差異值的統(tǒng)計(jì)特性設(shè)置一個(gè)恰當(dāng)?shù)拈T限用以區(qū)分語(yǔ)音信號(hào)、音樂(lè)信號(hào)以及噪聲等。另外,為了更好地區(qū)分語(yǔ)音和音樂(lè)信號(hào)等,在采用幅度差異值區(qū)分音頻信號(hào)之前或之后可以先采取過(guò)零率、基因周期等特征參數(shù)區(qū)分語(yǔ)音和音樂(lè)信號(hào)。由上述可知,實(shí)施例一是本發(fā)明方法的優(yōu)選實(shí)施方式,并且兩個(gè)實(shí)施例都未嵌入到AMR-WB+標(biāo)準(zhǔn)信號(hào)處理流程。如果將本發(fā)明方法嵌入到AMR-WB+標(biāo)準(zhǔn)的處理流程中,就不需要對(duì)音頻信號(hào)進(jìn)行預(yù)處理和計(jì)算每幀信號(hào)的LPC系數(shù),也不需要計(jì)算ISP參數(shù),這是因?yàn)锳MR-WB十標(biāo)準(zhǔn)在編碼模式選擇之前就已經(jīng)計(jì)算出ISP參數(shù),所以可按照以下方式來(lái)區(qū)分音樂(lè)和語(yǔ)音信號(hào)調(diào)用已計(jì)算得到的ISP參數(shù)計(jì)算頻譜包絡(luò),然后再計(jì)算相應(yīng)頻率之間的幅度差異值,再根據(jù)幅度差異值區(qū)分音頻信號(hào),這些步驟和上述兩種實(shí)施例的步驟相同。另外,上述實(shí)施方式是由幅度值之間的比值來(lái)表示幅度差異值,本發(fā)明也不排除用幅度值之間的差值等方式來(lái)表示幅度差異值。以上對(duì)本發(fā)明所提供的一種音頻分類方法進(jìn)行了詳細(xì)介紹,本文中應(yīng)用了幫助理解本發(fā)明的方法及其核心思想;同時(shí),對(duì)于本領(lǐng)域的一般技術(shù)人員,依據(jù)本發(fā)明的思想,在具體實(shí)施方式及應(yīng)用范圍上均會(huì)有改變之處,綜上所述,本說(shuō)明書內(nèi)容不應(yīng)理解為對(duì)本發(fā)明的限制。權(quán)利要求1、一種音頻分類方法,其特征在于,該方法包絡(luò)對(duì)輸入的音頻信號(hào)進(jìn)行預(yù)處理,再許算預(yù)處理過(guò)的咅頻信號(hào)的線性預(yù)測(cè)編碼系數(shù);根據(jù)線性預(yù)測(cè)編碼系數(shù)得到信號(hào)的頻譜包絡(luò),再由計(jì)算得到的導(dǎo)諳對(duì)參數(shù)確定幅度差異值;根據(jù)幅度差異值的統(tǒng)計(jì)結(jié)果設(shè)置門限,再根據(jù)門限對(duì)音頻信號(hào)進(jìn)行分類。2、如權(quán)利要求1所述的音頻分類方法,其特征在于,采用杜賓算法、格型算法或舒爾算法計(jì)算音頻信號(hào)的線性預(yù)測(cè)編碼系數(shù)。3、如權(quán)利要求1所述的音頻分類方法,其特征在于,根據(jù)線性預(yù)測(cè)編碼系數(shù)得到信號(hào)的頻語(yǔ)包絡(luò)包括根據(jù)線性預(yù)測(cè)編碼系數(shù)得到線性預(yù)測(cè)誤差濾波器的傳遞函數(shù),并由傳遞函數(shù)計(jì)算得到導(dǎo)語(yǔ)對(duì)參數(shù);根據(jù)導(dǎo)譜對(duì)參數(shù)設(shè)置濾波系數(shù),再由濾波系數(shù)得到信號(hào)的導(dǎo)譜對(duì)頻譜包絡(luò)。4、如權(quán)利要求1所述的音頻分類方法,其特征在于,根據(jù)線性預(yù)測(cè)編碼系數(shù)得到信號(hào)的頻i普包絡(luò)包括根據(jù)線性預(yù)測(cè)編碼系數(shù)計(jì)算得到線性預(yù)測(cè)誤差濾波器的傳遞函數(shù),再由傳遞函數(shù)得到信號(hào)的線性預(yù)測(cè)編碼頻譜包絡(luò)。5、如權(quán)利要求l、2、3或4所述的音頻分類方法,其特征在于,確定幅度差異值包括確定導(dǎo)譜對(duì)參數(shù)在信號(hào)頻譜包絡(luò)中對(duì)應(yīng)的幅度值,再計(jì)算導(dǎo)譜對(duì)參數(shù)對(duì)應(yīng)幅度值之間的比值就可以得到幅度差異值。6、如權(quán)利要求l、2、3或4所述的音頻分類方法,其特征在于,確定幅度差異值包括選取相鄰導(dǎo)譜對(duì)參數(shù)之間的幅度值作為頻譜的代表點(diǎn),再計(jì)算代表點(diǎn)對(duì)應(yīng)幅度值之間的比值就可以得到幅度差異值。7、如權(quán)利要其l、2、3或4所述的音頻分類方法,其特征在于,根據(jù)幅度差異值的統(tǒng)計(jì)結(jié)果設(shè)置門限包括計(jì)算幅度值對(duì)應(yīng)頻率點(diǎn)之間的差值,再計(jì)算幅度差異值和該差值的比值得到幅度差異值的變化量;對(duì)幅度差異值的變化量進(jìn)行統(tǒng)計(jì),再根據(jù)統(tǒng)計(jì)結(jié)果設(shè)置門限。8、如權(quán)利要求l、2、3或4所述的音頻分類方法,其特征在于,根據(jù)幅度差異值的統(tǒng)計(jì)結(jié)果設(shè)置門限包括對(duì)幅度差異值進(jìn)行統(tǒng)計(jì),再根據(jù)統(tǒng)計(jì)結(jié)果設(shè)置門限。9、如權(quán)利要求1所述的音頻分類方法,其特征在于,在對(duì)音頻信號(hào)進(jìn)行分類之前或之后進(jìn)一步包括采用過(guò)零率或基因周期對(duì)音頻信號(hào)進(jìn)行分類。10、如權(quán)利要求1所述的音頻分類方法,其特征在于,采用對(duì)信號(hào)加窗或分幀方式對(duì)音頻信號(hào)進(jìn)行預(yù)處理。全文摘要本發(fā)明公開了一種音頻分類方法,該方法包括對(duì)輸入的音頻信號(hào)進(jìn)行預(yù)處理,再計(jì)算預(yù)處理過(guò)的音頻信號(hào)的線性預(yù)測(cè)編碼系數(shù);根據(jù)線性預(yù)測(cè)編碼系數(shù)得到信號(hào)的頻譜包絡(luò),再由計(jì)算得到的導(dǎo)譜對(duì)參數(shù)確定幅度差異值;根據(jù)幅度差異值的統(tǒng)計(jì)結(jié)果設(shè)置門限,再根據(jù)門限對(duì)音頻信號(hào)進(jìn)行分類。利用本發(fā)明能夠大大減少對(duì)音頻信號(hào)進(jìn)行分類所帶來(lái)的計(jì)算量,同時(shí)本發(fā)明對(duì)音頻信號(hào)進(jìn)行分類的準(zhǔn)確性較高。另外,將本發(fā)明應(yīng)用到擴(kuò)展帶寬自適應(yīng)多碼率編碼標(biāo)準(zhǔn)中的信號(hào)處理流程時(shí)可以使對(duì)音頻信號(hào)分類的計(jì)算量非常小,并且可使信號(hào)處理流程不采用預(yù)先編碼方式,直接采用相應(yīng)的編碼模式進(jìn)行編碼,進(jìn)而可以提高編碼的效率。文檔編號(hào)G10L19/00GK101145345SQ20061012741公開日2008年3月19日申請(qǐng)日期2006年9月13日優(yōu)先權(quán)日2006年9月13日發(fā)明者郭利斌,馬付偉申請(qǐng)人:華為技術(shù)有限公司
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
利川市| 神池县| 湘阴县| 苍南县| 长乐市| 章丘市| 怀柔区| 菏泽市| 浦城县| 务川| 古浪县| 佛坪县| 报价| 石首市| 黄石市| 姜堰市| 阜宁县| 肥东县| 湖州市| 朝阳县| 白城市| 宣威市| 湘潭县| 克山县| 中卫市| 罗江县| 汕尾市| 安平县| 新化县| 额敏县| 遵化市| 嘉祥县| 秀山| 长葛市| 化州市| 洞头县| 鲁甸县| 铜梁县| 庐江县| 大安市| 永安市|