-音頻信號(hào)中的音頻信號(hào) 頓,例如:語音信號(hào)、鈴音信號(hào)、雙音多頻(dual-tonemulti化equency,DTM巧信號(hào)和頻移 鍵控(Frequenc廠shiftk巧ing,F(xiàn)SK)信號(hào)等等。其中,上述鈴音信號(hào)可W包括;彩鈴、標(biāo)準(zhǔn) 鈴音和異常鈴音。另外,上述音頻信號(hào)頓可W是待檢測(cè)的音頻信號(hào)中任一位置的音頻信號(hào) 頓,例如巧W是待檢測(cè)的音頻信號(hào)的起始峽,或者可W是待檢測(cè)的音頻信號(hào)的中間部位的 信號(hào)頓,或者可W是待檢測(cè)的音頻信號(hào)的結(jié)束峽。
[0204] 獲取單元122,用于獲取所述音頻信號(hào)頓的頻域能量分布,其中,所述頻域能量分 布表示所述音頻信號(hào)峽在頻域上的能量分布特性。
[020引獲得單元123,用于根據(jù)所述音頻信號(hào)頓的所述頻域能量分布,得到所述音頻信號(hào) 頓的頻域能量分布導(dǎo)數(shù)的極大值分布特征。
[0206] 集合單元124,用于將所述音頻信號(hào)幀及所述音頻信號(hào)頓預(yù)巧鄰域范圍內(nèi)的每一 峽作為一個(gè)頓集合,該頓集合包括待檢測(cè)頓。
[0207] 可選的,上述預(yù)設(shè)鄰域范圍可W是預(yù)先設(shè)置的頓數(shù)量范圍,例如,上述音頻信號(hào)頓 預(yù)設(shè)鄰域范圍內(nèi)的頓可W是指,與__t述音頻信號(hào)頓前后相鄰的特定數(shù)量的音頻信號(hào)峽,該 樣上述峽集合就包括上述音頻信號(hào)峽W及與上述音頻信號(hào)頓前后相鄰的特定數(shù)量的音頻 信號(hào)頓?;蛘呱鲜鲱A(yù)i受鄰域范圍可W是預(yù)先i受置的時(shí)間范圍,例如:上述音頻信號(hào)頓預(yù)設(shè)鄰 域范圍內(nèi)的峽可W是指,與上述音頻信號(hào)頓前后相信的特定時(shí)間接收到的音頻信號(hào)峽,該 樣上述峽集合就包括上述音頻信號(hào)峽W及與__t述音頻信號(hào)峽前后相信的特定時(shí)間接收到 的音頻信號(hào)頓。上述待檢測(cè)頓可W是上述頓集合中包括的一個(gè)或者多個(gè)音頻信號(hào)頓。
[0208] 檢測(cè)單元125,用于根據(jù)所述頓集合的頻域能量分布導(dǎo)數(shù)的極大值分布特征對(duì)所 述待檢測(cè)頓進(jìn)行檢測(cè)。
[0209] 其中,__t述峽集合的頻域能量分布導(dǎo)數(shù)的極大值分布特征可W是指,上述峽集合 中一個(gè)或者多個(gè)音頻信號(hào)峽的頻域能量分布導(dǎo)數(shù)的極大值分布特征,或者上述峽集合的頻 域能量分布導(dǎo)數(shù)的極大值分布特征可W是指,上述頓集合中各音頻信號(hào)峽的頻域能量分布 導(dǎo)數(shù)的極大值分布特征。
[0210] 在另一個(gè)實(shí)施例中,檢測(cè)單元125可W是對(duì)上述待檢測(cè)峽進(jìn)行音頻信號(hào)分類的檢 巧Ii,或者檢測(cè)單元。5可W是對(duì)上述待檢測(cè)頓進(jìn)行音頻信號(hào)特征的檢測(cè)等等。
[0211] 可選的,獲取單元122具體可W用于獲取所述音頻信號(hào)頓任- '所述設(shè)定頻域范圍 內(nèi)的能量總和與所述音頻信號(hào)頓在設(shè)定頻域范圍內(nèi)的總能量的比值,所述比值表示所述音 頻信號(hào)頓的頻域能量分布。
[0212] 其中,上述設(shè)定頻域范圍可W是預(yù)先i受定,另外,可W是預(yù)先i受定多個(gè)頻域范圍。
[0213] 該實(shí)施方式中,獲取單元122具體可W用于對(duì)所述音頻信號(hào)頓進(jìn)行傅里葉變換得 到頻域信號(hào);
[0214]W及根據(jù)
得到所述頻 域能量分布比值; 陽引引其中,f表示譜線數(shù),fe化(Fiim-U],巧FFT變換大小為F,F(xiàn)iim《F/2,Re_fft(i)表示FFT變換結(jié)果的實(shí)部,Im_fftG)表示FFT變換結(jié)果的虛部,
表示所述音頻信號(hào)頓在fe[0,(Fiim-I)]所對(duì)應(yīng)頻域范圍 內(nèi)的能量總化i(Rc_ ///2(/) +lm_於W)表示所述音頻信號(hào)峽在0~f所對(duì)應(yīng)頻域范圍內(nèi) Z=O _ 的總能量。
[0216] 在另-'個(gè)實(shí)施例中,如圖13所示,獲得單元123,可W包括:
[0217] 求導(dǎo)單元1231,用于對(duì)所述頻段能量分布比值進(jìn)行求導(dǎo),得到頻段能量分布導(dǎo) 數(shù); 陽218] 獲得子單元1232,用于根據(jù)所述頻段能量分布導(dǎo)數(shù),得到所述音頻信號(hào)頓的頻域 能量分布導(dǎo)數(shù)的極大值分布特征。
[0219] 其中,求導(dǎo)單元1231通過微分運(yùn)算對(duì)所述頻段能量分布比值進(jìn)行求導(dǎo),W得到頻 段能量分布導(dǎo)數(shù)。例如:求導(dǎo)單元1231可W通過拉格朗日(Lagrange)數(shù)值微分方法對(duì)所 述頻段能量分布比值進(jìn)行求導(dǎo)。
[0220] 可選的,求導(dǎo)單元1231執(zhí)行對(duì)所述頻段能量分布比值進(jìn)行求導(dǎo),得到頻段能量分 布導(dǎo)數(shù)具體包括:
[0222] 其中,N表示數(shù)值微分階數(shù);rat.io_energy'k(f)表示第k峽的能量分布比值的 導(dǎo)數(shù);ratio_energyk(n)表示第k峽的能量分布比值,
[0223] 通過上述公式就可W得到頻段能量分布導(dǎo)數(shù)。
[0224] 可選的,獲得子單元1232具體可W用于獲取能量分布參數(shù)的導(dǎo)數(shù)值中的至少-' 個(gè)極大值;W及根據(jù)每個(gè)所述極大值所處的譜線的位置得到所述音頻信號(hào)頓的頻域能量分 布導(dǎo)數(shù)的極大值分布特征。
[0225] 其中,上述至少一個(gè)極大值可W是上述能量分布參數(shù)的至少一個(gè)導(dǎo)數(shù)值按照數(shù)值 從高到低的順序排序中排在前面的--個(gè)或者多個(gè)導(dǎo)數(shù)值,例如:上述至少--個(gè)極大值表示 為一個(gè)極大值時(shí),那么上述至少一個(gè)極大值可W是上述能量分布參數(shù)的導(dǎo)數(shù)值中的最大 值;上述至少一個(gè)極大值表示為兩個(gè)極大值時(shí),那么上述至少一個(gè)極大值可W包括上述能 量分布參數(shù)的導(dǎo)數(shù)值中上述能量分布參數(shù)的導(dǎo)數(shù)值中的最大值和第二大值。
[0226] 由于上述得到了每個(gè)所述極大值所處的譜線的位置,那么就可W得到所述音頻信 號(hào)頓的頻域能量分布導(dǎo)數(shù)的極大值分布特征。例如:上述音頻信號(hào)峽的頻域能量分布導(dǎo)數(shù) 的極大值分布特征可W包括該音頻信號(hào)頓能量分布參數(shù)的導(dǎo)數(shù)值中的至少一個(gè)極大值所 處的譜線的位置。
[0227] 在另--個(gè)實(shí)施例中,檢測(cè)單元125具體可W用于:
[0228] 如果在所述頓集合的頻域能量分布導(dǎo)數(shù)的極大值分布參數(shù)中,位于預(yù)設(shè)的第一區(qū) 間的參數(shù)數(shù)量大于等于第一闊值,則確定待檢測(cè)幀為標(biāo)準(zhǔn)的待檢測(cè)信號(hào);
[0229] 如果待檢測(cè)峽不是標(biāo)準(zhǔn)的待檢測(cè)信號(hào),但是在所述頓集合的頻域能量分布導(dǎo)數(shù)的 極大值分布參數(shù)中,位于預(yù)設(shè)的第二區(qū)間的參數(shù)數(shù)量大于等于第二闊值,則確定待檢測(cè)頓 為異常的待檢測(cè)信號(hào)。
[0230] 可選的,所述峽集合的頻域能量分布導(dǎo)數(shù)的極大值分布參數(shù)可W是指上述頓集合 中各音頻信號(hào)峽的頻域能量分布導(dǎo)數(shù)的極大值分布參數(shù),另外,頻域能量分布導(dǎo)數(shù)的極大 值分布參數(shù)可W是用于表示該頻域能量分布導(dǎo)數(shù)的極大值分布特征的參數(shù)。另外,上述第 一區(qū)間可W是預(yù)先設(shè)定與上述標(biāo)準(zhǔn)的待檢測(cè)信號(hào)對(duì)應(yīng)的參數(shù)區(qū)間,例如:預(yù)先設(shè)定與上述 標(biāo)準(zhǔn)的待檢測(cè)信號(hào)對(duì)應(yīng)的譜線位置區(qū)間,且上述第一闊值也可W是預(yù)先設(shè)定與上述標(biāo)準(zhǔn)的 待檢測(cè)信號(hào)對(duì)應(yīng)的闊值。上述第二區(qū)間可W是預(yù)先設(shè)定與上述異常的待檢測(cè)信號(hào)對(duì)應(yīng)的參 數(shù)區(qū)間,例如:預(yù)先設(shè)定與上述異常的待檢測(cè)信號(hào)對(duì)應(yīng)的譜線位置區(qū)間,且上述第二闊值也 可W是預(yù)先設(shè)定與__t述異常的待檢測(cè)信號(hào)對(duì)應(yīng)的闊值。另外,上述第區(qū)間的區(qū)間范圍可 W是大于或者小于第一區(qū)間的區(qū)間范圍。
[0231] 該實(shí)施方式中,可W實(shí)現(xiàn)先檢測(cè)待檢測(cè)頓是否為標(biāo)準(zhǔn)的待檢測(cè)信號(hào),若是,則確定 檢測(cè)待檢測(cè)頓為標(biāo)準(zhǔn)的待檢測(cè)信號(hào),若否,則檢測(cè)檢測(cè)待檢測(cè)頓是否為異常的待檢測(cè)信號(hào)。 從而可W實(shí)現(xiàn)檢測(cè)出標(biāo)準(zhǔn)的待檢測(cè)信號(hào),W及檢測(cè)出異常的待檢測(cè)信號(hào)。
[0232] 可選的,上述裝置可W應(yīng)用于任何具體計(jì)算和播放音頻信號(hào)功能的電子設(shè)備,例 如:平板電腦、手機(jī)、電子閱讀器、遙控器、PC、筆記本電腦、車載設(shè)備、網(wǎng)絡(luò)電視、可穿戴設(shè) 備、網(wǎng)絡(luò)設(shè)備、服務(wù)器、基站和UMG等電子設(shè)備。
[0233] 本實(shí)施例中,接收音頻信號(hào)峽后,獲取所述音頻信號(hào)頓的頻域能量分布;再根據(jù)所 述音頻信號(hào)頓的所述頻域能量分布,得到所述音頻信號(hào)頓的頻域能量分布導(dǎo)數(shù)的極大值分 布特征;再將所述音頻信號(hào)峽及所述音頻信號(hào)頓預(yù)設(shè)鄰域范圍內(nèi)的每一峽作為一個(gè)頓集 合,該頓集合包括待檢測(cè)頓;該樣就可W根據(jù)所述頓集合的頻域能量分布導(dǎo)數(shù)的極大值分 布特征對(duì)所述待檢測(cè)頓進(jìn)行檢測(cè)。從而本發(fā)明可W實(shí)現(xiàn)對(duì)音頻信號(hào)進(jìn)行檢測(cè)。
[0234] 請(qǐng)參閱圖14,圖H是本發(fā)明實(shí)施例提供的另一種根據(jù)頻域能量對(duì)音頻信號(hào)進(jìn)行 檢測(cè)的裝置的結(jié)構(gòu)示意圖,如圖14所示,該裝置包括:至少--個(gè)處理器141,例如CPU,至少 一個(gè)網(wǎng)絡(luò)接口 142或者其他用戶接口 143,存儲(chǔ)器145,至少一個(gè)通信總線142。通信總線 142用于實(shí)現(xiàn)這些組件之間的連接通信。該計(jì)算節(jié)點(diǎn)140可選的包含用戶接口 143,包括 顯示器,鍵盤或者點(diǎn)擊i受備(例如,鼠標(biāo),軌跡球(trackball),觸感板或者觸感顯示屏)。 存儲(chǔ)器145可能包含高速M(fèi)M存儲(chǔ)器,也可能還包括非不穩(wěn)定的存儲(chǔ)器(non-volatile memo巧),例如至少一個(gè)磁盤存儲(chǔ)器。存儲(chǔ)器145可選的可W包含至少一個(gè)位于遠(yuǎn)離前述處 理器141的存儲(chǔ)裝置。
[0235] 在一些實(shí)施方式中,存儲(chǔ)器145存儲(chǔ)了如下的元素,可執(zhí)行模塊或者數(shù)據(jù)結(jié)構(gòu),或 者他們的子集,或者他們的擴(kuò)展集:
[0236] 操作系統(tǒng)1451,包含各種系統(tǒng)程序,用于實(shí)現(xiàn)各種基礎(chǔ)業(yè)務(wù)W及處理基于硬件的 任務(wù);
[0237] 應(yīng)用程序模塊1452,包含各種應(yīng)用程序,用于實(shí)現(xiàn)各種應(yīng)用業(yè)務(wù)。
[0238] 在本發(fā)明實(shí)施例中,通過調(diào)用存儲(chǔ)器145存儲(chǔ)的程序或指令,處理器141用于:
[0239] 接收音頻信號(hào)頓;
[0240] 獲取所述音頻信號(hào)幀的頻域能量分布,其中,所述頻域能量分布表示所述音頻信 號(hào)頓在頻域上的能量分布特性;
[0241] 根據(jù)所述音頻信號(hào)頓的所述頻域能量分布,得到所述音頻信號(hào)頓的頻域能量分布 導(dǎo)數(shù)的極大值分布特征;
[0242] 將所述音頻信號(hào)頓及所述音頻信號(hào)幀預(yù)設(shè)鄰域范圍內(nèi)的每一峽作為一個(gè)峽集合, 該峽集合包括待檢測(cè)峽;
[0243] 根據(jù)所述頓集合的頻域能量分布導(dǎo)數(shù)的極大值分布特征對(duì)所述待檢測(cè)頓進(jìn)行檢 測(cè)。
[0244] 另一個(gè)實(shí)施例中,處理器141執(zhí)行的根據(jù)權(quán)利要求1所述的對(duì)音頻信號(hào)進(jìn)行檢測(cè) 的方法,其特征在于,所述獲取所述音頻信號(hào)頓的頻域能量分布的操作,具體可W包括:
[0245] 獲取所述音頻信號(hào)峽任- '所述設(shè)定頻域范圍內(nèi)的能量總和與所述音頻信號(hào)頓在 設(shè)定頻域范圍內(nèi)的總能量的比值,所述比值表示所述音頻信號(hào)峽的頻域能量分布。
[0246] 可選的,處理器141執(zhí)行獲取所述音頻信號(hào)頓任一所述巧定頻域范圍內(nèi)的能量總 和與所述音頻信號(hào)頓在設(shè)定頻域范圍內(nèi)的總能量的比值的操作,具體可W包括:
[0247] 對(duì)所述音頻信號(hào)頓進(jìn)行傅里葉變換得到頻域信號(hào); 陽24引根據(jù)
得到所述頻 域能量分布比值;
[0249]其中,f表示譜線數(shù),fG[0,化im-U],設(shè)FFT變換大小為F,F(xiàn)iim《F/2, Re_fft(i)表示FFT變換結(jié)果的實(shí)部,表示FFT變換結(jié)果的虛部,
表示所述音頻信號(hào)頓在