本發(fā)明涉及語音信號處理領域,具體涉及一種時延檢測方法及裝置。
背景技術:
在許多音頻設備,例如視頻會議系統(tǒng)中,往往會出現(xiàn)時延大、時延不穩(wěn)定、甚至出現(xiàn)負時延現(xiàn)象,這使得遠近端信號無法對齊,從而無法更好地進行回波抵消處理。現(xiàn)有的時延檢測方法有很多,如脈沖法在本地終端預設脈沖,并通過本地播放端播放,再通過本地采集端采集,從而獲取時延。脈沖法雖簡單,但只可在語音設備對通前進行時延估計,不能在其使用過程中實時檢測時延漂移現(xiàn)象。
語音特征參數(shù),包括線性預測倒譜系數(shù)(Linear Predictive Cepstral Coefficients,LPCC)、美爾倒譜系數(shù)(Mel Frequency Cepstral Coefficients,MFCC),LPCC計算量較小,MFCC基于人耳聽覺機理,抗噪性好,穩(wěn)定性高。此外,還有一種線性預測美爾倒譜系數(shù)(LPC Mel Cepstral Coefficients,LPCMCC)融合了LPCC和MFCC的優(yōu)點,此外還具有算法復雜度低、抗噪性好、穩(wěn)定性高等優(yōu)點,適合于信號的實時處理。目前,語音特征參數(shù)往往僅被用來做語音識別、語音檢索。
本發(fā)明旨在提供一種時延檢測方法,將此類信號特征參數(shù)應用于時延檢測,能夠在設備使用過程中實時檢測時延現(xiàn)象。
技術實現(xiàn)要素:
本發(fā)明要解決的技術問題在于將信號特征參數(shù)應用于信號時延檢測。
為此,本發(fā)明實施例提供一種時延檢測方法,包括如下步驟:分別采集來自不同信號端的第一信號和第二信號,并對其分幀;計算所述第一信號從第一預定信號幀開始的預設幀數(shù)的第一信號特征參數(shù),計算所述第二信號從第二預定信號幀開始的預設幀數(shù)的第二信號特征參數(shù),計算所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的差方和;所述第一預定信號幀和所述第二預定信號幀為同一時刻的信號幀;依次循環(huán)從第二預定信號幀的下一幀開始計算預設幀數(shù)的第二信號特征參數(shù),計算所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的差方和;獲取所述差方和中的最小值;若所述最小值小于預定閾值,則獲取所述最小值對應的所述第二信號的起始幀的序號;根據(jù)所述起始幀的序號計算時延值。
優(yōu)選地,所述計算所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的差方和的公式為其中,k為所述第二信號的起始幀的序號,N為預設幀數(shù);xi為所述第一信號從第一預定信號幀開始的第i個信號幀的第一信號特征參數(shù);yi為所述第二信號從起始幀開始的第i個信號幀的第二信號特征參數(shù)。
優(yōu)選地,所述第一信號和所述第二信號為語音信號,所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的類型包括線性預測倒譜系數(shù)LPCC、美爾倒譜系數(shù)MFCC、線性預測美爾倒譜系數(shù)LPCMCC中的任一者。
優(yōu)選地,所述第一信號和所述第二信號為語音信號,所述第一信號特征參數(shù)和所述第二信號特征參數(shù)為線性預測美爾倒譜系數(shù)LPCMCC;所述計算所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的差方和的公式為其中,k為所述第二信號的起始幀的序號,N為預設幀數(shù),J為線性預測美爾倒譜系數(shù)LPCMCC的階數(shù),x(i,j)為所述第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC,y(i,j)為所述第二信號從起始幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC。
優(yōu)選地,所述第一信號和所述第二信號為語音信號,所述第一信號特征參數(shù)和所述第二信號特征參數(shù)為線性預測美爾倒譜系數(shù)LPCMCC;所述計算所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的差方和的步驟還包括:計算所述第一信號從第一預定信號幀開始的預設幀數(shù)的方差,其計算公式為其中,N為預設幀數(shù),x(i,j)為所述第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC;所述計算所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的差方和的公式為其中,k為所述第二信號的起始幀的序號,N為預設幀數(shù),J為線性預測美爾倒譜系數(shù)LPCMCC的階數(shù),x(i,j)為所述第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC,y(i,j)為所述第二信號從起始幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC。
優(yōu)選地,對所述第一信號和所述第二信號分幀時,相鄰幀重疊。
優(yōu)選地,所述根據(jù)所述起始幀的序號計算時延值的公式為其中,fsample為1ms的采樣點數(shù),Y為所述差方和中的最小值對應的所述第二信號的起始幀的序號,Y0為所述第二預定信號幀的序號,fnot-overlap為相鄰幀不重疊的點數(shù)。
相應地,本發(fā)明實施例提供一種時延檢測裝置,包括:采集分幀單元,用于分別采集來自不同信號端的第一信號和第二信號,并對其分幀;差方和計算單元,用于計算所述第一信號從第一預定信號幀開始的預設幀數(shù)的第一信號特征參數(shù),計算所述第二信號從第二預定信號幀開始的預設幀數(shù)的第二信號特征參數(shù),計算所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的差方和;所述第一預定信號幀和所述第二預定信號幀為同一時刻的信號幀;所述差方和計算單元,還用于依次循環(huán)從第二預定信號幀的下一幀開始計算預設幀數(shù)的第二信號特征參數(shù),計算所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的差方和;最小值獲取單元,用于獲取所述差方和中的最小值;序號獲取單元,用于若所述最小值小于預定閾值,則獲取所述最小值對應的所述第二信號的起始幀的序號;時延計算單元,用于根據(jù)所述起始幀的序號計算時延值。
優(yōu)選地,所述差方和計算單元計算所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的差方和的公式為其中,k為所述第二信號的起始幀的序號,N為預設幀數(shù);xi為所述第一信號從第一預定信號幀開始的第i個信號幀的第一信號特征參數(shù);yi為所述第二信號從起始幀開始的第i個信號幀的第二信號特征參數(shù)。
優(yōu)選地,所述第一信號和所述第二信號為語音信號,所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的類型包括線性預測倒譜系數(shù)LPCC、美爾倒譜系數(shù)MFCC、線性預測美爾倒譜系數(shù)LPCMCC中的任一者。
優(yōu)選地,所述第一信號和所述第二信號為語音信號,所述第一信號特征參數(shù)和所述第二信號特征參數(shù)為線性預測美爾倒譜系數(shù)LPCMCC;所述差方和計算單元包括:第一計算子單元,用于計算所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的差方和,其計算公式為其中,k為所述第二信號的起始幀的序號,N為預設幀數(shù),J為線性預測美爾倒譜系數(shù)LPCMCC的階數(shù),x(i,j)為所述第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC,y(i,j)為所述第二信號從起始幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC。
優(yōu)選地,所述第一信號和所述第二信號為語音信號,所述第一信號特征參數(shù)和所述第二信號特征參數(shù)為線性預測美爾倒譜系數(shù)LPCMCC;所述差方和計算單元包括:第二計算子單元,用于計算所述第一信號從第一預定信號幀開始的預設幀數(shù)的方差,其計算公式為其中,N為預設幀數(shù),x(i,j)為所述第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC;第三計算子單元,用于計算所述第一信號特征參數(shù)和所述第二信號特征參數(shù)的差方和,其計算公式為其中,k為所述第二信號的起始幀的序號,N為預設幀數(shù),J為線性預測美爾倒譜系數(shù)LPCMCC的階數(shù),x(i,j)為所述第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC,y(i,j)為所述第二信號從起始幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC。
優(yōu)選地,所述采集分幀單元對所述第一信號和所述第二信號分幀時,相鄰幀重疊。
優(yōu)選地,所述時延計算單元計算根據(jù)所述起始幀的序號計算時延值的公式為其中,fsample為1ms的采樣點數(shù),Y為所述差方和中的最小值對應的所述第二信號的起始幀的序號,Y0為所述第二預定信號幀的序號,fnot-overlap為相鄰幀不重疊的點數(shù)。
本發(fā)明技術方案,具有如下優(yōu)點:
1.本發(fā)明實施例提供的時延檢測方法及裝置,采集信號并分幀后,計算第一信號從第一預定信號幀開始的預設幀數(shù)的第一信號特征參數(shù),計算第二信號從第二預定信號幀開始的預設幀數(shù)的第二信號特征參數(shù),計算該第一信號特征參數(shù)和第二信號特征參數(shù)的差方和;再依次循環(huán)從第二預定信號幀的下一幀開始計算預設幀數(shù)的第二信號特征參數(shù),計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和,然后獲取差方和中的最小值,若最小值小于預定閾值,則獲取最小值對應的第二信號的起始幀的序號,根據(jù)該起始幀的序號計算時延值。該方法及裝置可以實時檢測時延現(xiàn)象并求取時延值。
附圖說明
為了更清楚地說明本發(fā)明具體實施方式或現(xiàn)有技術中的技術方案,下面將對具體實施方式或現(xiàn)有技術描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施方式,對于本領域普通技術人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1A為本發(fā)明實施例1中時延檢測方法的流程圖;
圖1B-1E為本發(fā)明實施例1中時延檢測方法計算差方和的示意圖;
圖1F為本發(fā)明實施例1中時延檢測方法幀重疊及時延值計算的示意圖;
圖2A為本發(fā)明實施例2中時延檢測裝置的原理框圖;
圖2B為本發(fā)明實施例2中時延檢測裝置的一個具體示例的原理框圖。
具體實施方式
下面將結(jié)合附圖對本發(fā)明的技術方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領域普通技術人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
在本發(fā)明的描述中,需要說明的是,術語“中心”、“上”、“下”、“左”、“右”、“豎直”、“水平”、“內(nèi)”、“外”等指示的方位或位置關系為基于附圖所示的方位或位置關系,僅是為了便于描述本發(fā)明和簡化描述,而不是指示或暗示所指的裝置或元件必須具有特定的方位、以特定的方位構(gòu)造和操作,因此不能理解為對本發(fā)明的限制。此外,術語“第一”、“第二”、“第三”僅用于描述目的,而不能理解為指示或暗示相對重要性。
在本發(fā)明的描述中,需要說明的是,除非另有明確的規(guī)定和限定,術語“安裝”、“相連”、“連接”應做廣義理解,例如,可以是固定連接,也可以是可拆卸連接,或一體地連接;可以是機械連接,也可以是電連接;可以是直接相連,也可以通過中間媒介間接相連,還可以是兩個元件內(nèi)部的連通,可以是無線連接,也可以是有線連接。對于本領域的普通技術人員而言,可以具體情況理解上述術語在本發(fā)明中的具體含義。
此外,下面所描述的本發(fā)明不同實施方式中所涉及的技術特征只要彼此之間未構(gòu)成沖突就可以相互結(jié)合。
實施例1
本實施例提供一種時延檢測方法,如圖1A所示,包括如下步驟:
S10:分別采集來自不同信號端的第一信號和第二信號,并對其分幀。
S20:計算第一信號從第一預定信號幀開始的預設幀數(shù)的第一信號特征參數(shù),計算第二信號從第二預定信號幀開始的預設幀數(shù)的第二信號特征參數(shù),計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和,該第一預定信號幀和該第二預定信號幀為同一時刻的信號幀。
第一信號特征參數(shù)和第二信號特征參數(shù)是能夠識別信號特征的信號參數(shù)。
例如,如圖1B至圖1D所示,選定預定幀數(shù)為3幀。如圖1B所示,分別計算黑色方框所示的對應信號幀的差方和。
S30:依次循環(huán)從第二預定信號幀的下一幀開始計算預設幀數(shù)的第二信號特征參數(shù),計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和。
例如,如圖1C所示,在圖1B所示的步驟之后,將第二信號的起始幀向后移動一幀,再分別計算黑色方框所示的對應信號幀的差方和。
S40:獲取該差方和中的最小值。
例如,依次執(zhí)行步驟S30,并獲取差方和中的最小值。
S50:若該最小值小于預定閾值,則獲取該最小值對應的第二信號的起始幀的序號。
當最小值小于預定閾值時,即可認為第二信號從起始幀開始的預設幀數(shù)的信號幀與第一信號從第一預定信號幀開始的預設幀數(shù)的信號幀相同。
S60:根據(jù)起始幀的序號計算時延值。
本發(fā)明實施例提供的上述時延檢測方法,采集信號并分幀后,計算第一信號從第一預定信號幀開始的預設幀數(shù)的第一信號特征參數(shù),計算第二信號從第二預定信號幀開始的預設幀數(shù)的第二信號特征參數(shù),計算該第一信號特征參數(shù)和第二信號特征參數(shù)的差方和;再依次循環(huán)從第二預定信號幀的下一幀開始計算預設幀數(shù)的第二信號特征參數(shù),計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和,然后獲取差方和中的最小值,若最小值小于預定閾值,則獲取最小值對應的第二信號的起始幀的序號,根據(jù)該起始幀的序號計算時延值。該方法可以實時檢測時延現(xiàn)象并求取時延值。
作為本實施例的一種優(yōu)選實施方式,計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和的公式為:其中,k為第二信號的起始幀的序號,N為預設幀數(shù);xi為第一信號從第一預定信號幀開始的第i個信號幀的第一信號特征參數(shù);yi為第二信號從起始幀開始的第i個信號幀的第二信號特征參數(shù)。
如圖1C所示,預設幀數(shù)為3幀,當前第二信號的起始幀的序號為2,則差方和為其中,x1至x3分別為圖中所示第一信號的第1幀至第3幀的第一信號特征參數(shù),y1至y3分別為圖中所示第二信號的第2幀至第4幀的第二信號特征參數(shù)。
需要補充說明的是,第一信號的信號幀順序編號,第二信號的信號幀順序編號,第一信號和第二信號的相同序號的信號幀可以為相同時刻的信號幀,也可以是不同時刻的信號幀。
優(yōu)選地,第一信號和第二信號為語音信號,第一信號特征參數(shù)和第二信號特征參數(shù)的類型包括線性預測倒譜系數(shù)LPCC、美爾倒譜系數(shù)MFCC、線性預測美爾倒譜系數(shù)LPCMCC中的任一者。LPCC計算量較小,MFCC基于人耳聽覺機理,抗噪性好,穩(wěn)定性高。LPCMCC融合了LPCC和MFCC的優(yōu)點,此外,由于LPCMCC計算過程無需進行傅立葉變換,因此算法復雜度低。
優(yōu)選地,第一信號和第二信號為語音信號,第一信號特征參數(shù)和第二信號特征參數(shù)為線性預測美爾倒譜系數(shù)LPCMCC。采用LPCMCC作為第一信號特征參數(shù)和第二信號特征參數(shù),算法復雜度低,計算量較小、抗噪性好、穩(wěn)定性高。
對于每幀語音信號,其包括了多個采樣點,LPCMCC采用了前面時刻的采樣點預測后面時刻的采樣點,因此,每一幀語音信號都可以有多個LPCMCC,其數(shù)量為預測的階數(shù)。
進一步地,作為本實施例的一種優(yōu)選實施方式,計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和的公式為:其中,k為第二信號的起始幀的序號,N為預設幀數(shù),J為線性預測美爾倒譜系數(shù)LPCMCC的階數(shù),x(i,j)為第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC,y(i,j)為第二信號從起始幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC。
以圖1B計算差方和的步驟為例,假設LPCMCC的階數(shù)為4,即每幀有4個LPCMCC,則其詳細步驟如圖1E所示。先求取第一信號和第二信號如圖所示的三幀的第1個LPCMCC的差方和,再求取如圖所示的三幀的第2個LPCMCC的差方和,求取如圖所示的三幀的第3個LPCMCC的差方和,求取如圖所示的三幀的第4個LPCMCC的差方和,最后將上述四個差方和相加作為圖1B所示步驟所求取的差方和結(jié)果。
作為上述優(yōu)選實施方式的并列實施方式,計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和的步驟還包括:計算第一信號從第一預定信號幀開始的預設幀數(shù)的方差,其計算公式為:其中,N為預設幀數(shù),x(i,j)為第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC。
計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和的公式為:其中,k為第二信號的起始幀的序號,N為預設幀數(shù),J為線性預測美爾倒譜系數(shù)LPCMCC的階數(shù),x(i,j)為第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC,y(i,j)為第二信號從起始幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC。
仍舊以圖1B計算差方和的步驟為例,假設LPCMCC的階數(shù)為4,即每幀有4個LPCMCC,則其詳細步驟如圖1E所示。求取第一信號如圖所示的三幀的第1個LPCMCC的方差,求取第一信號和第二信號如圖所示的三幀的第1個LPCMCC的協(xié)方差,用該協(xié)方差除以該方差;求取第一信號如圖所示的三幀的第2個LPCMCC的方差,求取第一信號和第二信號如圖所示的三幀的第2個LPCMCC的協(xié)方差,用該協(xié)方差除以該方差;求取第一信號如圖所示的三幀的第3個LPCMCC的方差,求取第一信號和第二信號如圖所示的三幀的第3個LPCMCC的協(xié)方差,用該協(xié)方差除以該方差;求取第一信號如圖所示的三幀的第4個LPCMCC的方差,求取第一信號和第二信號如圖所示的三幀的第4個LPCMCC的協(xié)方差,用該協(xié)方差除以該方差。最后將上述四個比值相加,作為圖1B所示步驟所求取的差方和結(jié)果。
上述求取第一信號和第二信號每幀的預定位置的LPCMCC的差方和之后,再比上第一信號每幀的該預定位置的LPCMCC的方差,通過第一信號的LPCMCC的方差對第一信號和第二信號LPCMCC的差方和進行歸一化,一方面減小計算結(jié)果的數(shù)量級,另一方面提高算法的準確性。
優(yōu)選地,對第一信號和第二信號分幀時,相鄰幀重疊。相鄰幀重疊使幀與幀之間特征參數(shù)過渡平緩,不會丟失邊緣信號,從而提高時延檢測的準確性。假設每幀有5個采樣點,其重疊方式如圖1F所示,相鄰幀重疊2個點,不重疊的有3個點。
通常情況下,相鄰幀重疊的點數(shù)與不重疊的點數(shù)相同。例如每幀有512個采樣點,重疊的點數(shù)為256個點,不重疊的點數(shù)也是256個點。
進一步地,步驟S60計算時延值的公式為:其中,fsample為1ms的采樣點數(shù),Y為差方和中的最小值對應的第二信號的起始幀的序號,Y0為第二預定信號幀的序號,fnot-overlap為相鄰幀不重疊的點數(shù)。時延值Tdelay的單位為ms。
由于第一預定信號幀和第二預定信號幀為同一時刻的信號幀,則認為第二信號的第Y幀開始的預定幀數(shù)與第一信號的第一預定信號幀開始的預定幀數(shù)是相同的。Y-Y0表示時延的幀數(shù)。幀重疊情況下,時延的點數(shù)為(Y-Y0)*fnot-overlap,乘以采樣間隔時間即可得上述時延值計算公式。
如圖1F所示,幀重疊存儲情況下第二信號的第二預定信號幀序號為1,差方和最小時對應的第二信號的起始幀序號為5,則時延幀數(shù)為4。相鄰幀重疊點數(shù)為2,不重疊點數(shù)為3,時延的點數(shù)為12,假設1ms的采樣點數(shù)為3,則時延值為4ms。
實施例2
本實施例提供一種時延檢測裝置,如圖2A所示,包括采集分幀單元10、差方和計算單元20、最小值獲取單元40、序號獲取單元50和時延計算單元60。
采集分幀單元10,用于分別采集來自不同信號端的第一信號和第二信號,并對其分幀。
差方和計算單元20,用于計算第一信號從第一預定信號幀開始的預設幀數(shù)的第一信號特征參數(shù),計算第二信號從第二預定信號幀開始的預設幀數(shù)的第二信號特征參數(shù),計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和。第一預定信號幀和第二預定信號幀為同一時刻的信號幀。
該差方和計算單元20,還用于依次循環(huán)從第二預定信號幀的下一幀開始計算預設幀數(shù)的第二信號特征參數(shù),計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和。
最小值獲取單元40,用于獲取差方和中的最小值。
序號獲取單元50,用于若最小值小于預定閾值,則獲取最小值對應的第二信號的起始幀的序號。
時延計算單元60,用于根據(jù)起始幀的序號計算時延值。
本發(fā)明實施例提供的上述時延檢測方法,通過采集分幀單元采集信號并分幀后,通過差方和計算單元計算第一信號從第一預定信號幀開始的預設幀數(shù)的第一信號特征參數(shù),計算第二信號從第二預定信號幀開始的預設幀數(shù)的第二信號特征參數(shù),計算該第一信號特征參數(shù)和第二信號特征參數(shù)的差方和;再依次循環(huán)從第二預定信號幀的下一幀開始計算預設幀數(shù)的第二信號特征參數(shù),計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和,然后通過最小值獲取單元獲取差方和中的最小值,若最小值小于預定閾值,則通過序號獲取單元獲取最小值對應的第二信號的起始幀的序號,通過時延計算單元根據(jù)該起始幀的序號計算時延值。該裝置可以實時檢測時延現(xiàn)象并求取時延值。
作為本實施例的一種優(yōu)選實施方式,差方和計算單元20計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和的公式為其中,k為第二信號的起始幀的序號,N為預設幀數(shù);xi為第一信號從第一預定信號幀開始的第i個信號幀的第一信號特征參數(shù);yi為第二信號從起始幀開始的第i個信號幀的第二信號特征參數(shù)。
優(yōu)選地,第一信號和第二信號為語音信號,第一信號特征參數(shù)和第二信號特征參數(shù)的類型包括線性預測倒譜系數(shù)LPCC、美爾倒譜系數(shù)MFCC、線性預測美爾倒譜系數(shù)LPCMCC中的任一者。LPCC計算量較小,MFCC基于人耳聽覺機理,抗噪性好,穩(wěn)定性高。LPCMCC融合了LPCC和MFCC的優(yōu)點,此外還具有算法復雜度低、抗噪性好、穩(wěn)定性高等優(yōu)點。
優(yōu)選地,第一信號和第二信號為語音信號,第一信號特征參數(shù)和第二信號特征參數(shù)為線性預測美爾倒譜系數(shù)LPCMCC。
進一步地,作為本實施例的一種優(yōu)選實施方式,差方和計算單元20包括第一計算子單元21。
第一計算子單元21,用于計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和,其計算公式為其中,k為第二信號的起始幀的序號,N為預設幀數(shù),J為線性預測美爾倒譜系數(shù)LPCMCC的階數(shù),x(i,j)為第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC,y(i,j)為第二信號從起始幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC。
作為上述優(yōu)選實施方式的并列實施方式,差方和計算單元20包括第二計算子單元22和第三計算子單元23。
第二計算子單元22,用于計算第一信號從第一預定信號幀開始的預設幀數(shù)的方差,其計算公式為其中,N為預設幀數(shù),x(i,j)為第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC。
第三計算子單元23,用于計算第一信號特征參數(shù)和第二信號特征參數(shù)的差方和,其計算公式為其中,k為第二信號的起始幀的序號,N為預設幀數(shù),J為線性預測美爾倒譜系數(shù)LPCMCC的階數(shù),x(i,j)為第一信號從第一預定信號幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC,y(i,j)為第二信號從起始幀開始的第i個信號幀的第j個線性預測美爾倒譜系數(shù)LPCMCC。
優(yōu)選地,采集分幀單元10對第一信號和第二信號分幀時,相鄰幀重疊。
進一步地,時延計算單元60計算根據(jù)起始幀的序號計算時延值的公式為其中,fsample為1ms的采樣點數(shù),Y為差方和中的最小值對應的第二信號的起始幀的序號,Y0為第二預定信號幀的序號,fnot-overlap為相鄰幀不重疊的點數(shù)。
顯然,上述實施例僅僅是為清楚地說明所作的舉例,而并非對實施方式的限定。對于所屬領域的普通技術人員來說,在上述說明的基礎上還可以做出其它不同形式的變化或變動。這里無需也無法對所有的實施方式予以窮舉。而由此所引伸出的顯而易見的變化或變動仍處于本發(fā)明創(chuàng)造的保護范圍之中。