列。在待識(shí)別用戶樣本特征矢量序列與指定解釋專(zhuān)家樣本特征矢量序 列之間的匹配距離計(jì)算步驟中,首先計(jì)算待識(shí)別用戶特征矢量序列中每峽特征矢量與指定 解釋專(zhuān)家特征矢量序列中所有峽特征矢量之間的峽間距離,尋找峽間距離最小的最優(yōu)匹配 對(duì),并將最優(yōu)匹配對(duì)的峽間距離入找存儲(chǔ),迭代循環(huán),直到待識(shí)別用戶特征矢量序列中所有 峽對(duì)應(yīng)的最優(yōu)匹配對(duì)的峽間距離全部入找存儲(chǔ);計(jì)算最優(yōu)匹配對(duì)峽間距離找內(nèi)所有存儲(chǔ)值 的平均值,作為待識(shí)別用戶樣本特征矢量序列與指定解釋專(zhuān)家樣本特征矢量序列之間的匹 配距離,如果該距離小于拒識(shí)闊值(經(jīng)驗(yàn)值),則判定待識(shí)別用戶為指定的解釋專(zhuān)家,識(shí)別成 功,系統(tǒng)開(kāi)放智能測(cè)井評(píng)價(jià)所用知識(shí)庫(kù),否則,拒識(shí)。
[0052] 抗干擾預(yù)處理方法的具體實(shí)施步驟如下:
[0053] (1)提取聲紋波形的濁音段;本發(fā)明首先采用倒譜法計(jì)算聲紋波形的基音頻率, 信號(hào)s[n]的實(shí)倒譜如下式計(jì)算:
[0054] (1)
[00巧]式中:
,將實(shí)倒譜C[n]的X坐標(biāo)n,通過(guò)SRreq(采樣頻率)/n, 轉(zhuǎn)換成頻率值;限定基音頻率值在7〇Hz和500Hz之間,在該限定頻率范圍內(nèi),尋找實(shí)倒譜c[n]中的最大值,如果該最大值大于0. 09,則對(duì)應(yīng)的頻率即為計(jì)算的基音頻率,否則基音 頻率為零。最后,對(duì)計(jì)算的基音頻率進(jìn)行中值濾波。將不為零的基音頻率對(duì)應(yīng)的聲紋波形 段,認(rèn)為是濁音段。
[0056] (2)對(duì)每個(gè)濁音段,進(jìn)行重疊分峽處理;語(yǔ)音信號(hào)的時(shí)變特性決定對(duì)其進(jìn)行處理 必須在一小段語(yǔ)音上進(jìn)行,因此要對(duì)其進(jìn)行分峽處理,同時(shí)為了保證語(yǔ)音信號(hào)不會(huì)因?yàn)榉?峽而導(dǎo)致信息的丟失,峽與峽之間要保證一定的重疊,即峽移,峽移與峽長(zhǎng)的比值一般在 0~1/2之間。本發(fā)明中使用的峽長(zhǎng)為256個(gè)采樣點(diǎn),峽移為128個(gè)采樣點(diǎn)。
[0057] (3)對(duì)每峽信號(hào),進(jìn)行加窗處理;對(duì)每峽數(shù)據(jù)加漢明窗,即是用有限長(zhǎng)窗口對(duì)每峽 信號(hào)進(jìn)行加權(quán)處理。漢明窗函數(shù)如下所示:
[0058]
[0059] 漢明窗的帶寬大約是矩形窗的兩倍,在通帶外,漢明窗的衰減比矩形窗大得多。漢 明窗較好的保留了高頻部分的信號(hào),更適合用于頻域分析。因此,本發(fā)明采用漢明窗,窗長(zhǎng) 即為每峽的長(zhǎng)度。
[0060] (4)對(duì)加窗后信號(hào)進(jìn)行FFT變換;本發(fā)明提取聲紋波形的頻域特征,因此對(duì)加窗后 的每峽信號(hào)進(jìn)行FFT變換,得到該峽的頻譜為:
[0061]
(3)
[0062] 對(duì)抗干擾預(yù)處理后的每峽聲紋信號(hào)頻譜,提取聲紋特征信息,本發(fā)明采用反映人 耳對(duì)不同頻率語(yǔ)音信號(hào)敏感程度的梅爾頻率倒譜系統(tǒng)(MFCC)作為聲紋特征參數(shù),具體實(shí)施 步驟如下:
[0063] (1)計(jì)算每峽頻譜X(k)幅度的平方,得到能量譜IX化)|2 ;
[0064] (2)將能量譜通過(guò)Mel頻率濾波器組,W實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的頻譜進(jìn)行平滑,并消除 諧波,凸顯原先語(yǔ)音的共振峰。
[0065]Mel頻率濾波器組是一組H角帶通濾波器,中也頻率為f(m),0《m<M,M為濾波器 組個(gè)數(shù),一般取20~28之間,本發(fā)明取M值為20。Mel濾波器Hm(k)表示如下:
[0066] (4)
[0067] (3)對(duì)Mel濾波器組的輸出取對(duì)數(shù);壓縮語(yǔ)音頻譜的動(dòng)態(tài)范圍;將頻域中的噪聲的 乘性成分轉(zhuǎn)換成加性成分,得到對(duì)數(shù)Mel頻譜S(m)如下:
[0068]
(5)
[006引(4)將對(duì)數(shù)能量譜S(m)經(jīng)過(guò)離散余弦變換(DTC)即可W得到MFCC系數(shù),第n個(gè)系 數(shù)C(n)的計(jì)算如下式:
[0070]
(6)
[0071] 式中,L為MFCC參數(shù)的維數(shù),其值通常依據(jù)實(shí)驗(yàn)情況來(lái)確定。本發(fā)明取L= 20,即 取前20維的MFCC系數(shù)。
[0072] 在待識(shí)別用戶樣本特征矢量序列與指定解釋專(zhuān)家樣本特征矢量序列之間的匹配 距離計(jì)算方法中,具體實(shí)施時(shí),對(duì)于峽間距離的計(jì)算,本發(fā)明采用歐氏距離作為峽間距離的 度量。
【主權(quán)項(xiàng)】
1. 一種基于聲紋識(shí)別的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)身份認(rèn)證方法,其特征在于包括以下步 驟: (1) 采集智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)每位解釋專(zhuān)家用戶對(duì)同一文本發(fā)音的聲紋波形,構(gòu)成 聲紋模板庫(kù); (2) 通過(guò)待識(shí)別用戶指示,得到要進(jìn)行身份認(rèn)證的解釋專(zhuān)家名; (3) 采集待識(shí)別用戶對(duì)與聲紋模板庫(kù)中構(gòu)建該解釋專(zhuān)家聲紋模板相同的文本發(fā)音的聲 紋波形; (4) 從聲紋模板庫(kù)中,提取對(duì)應(yīng)該解釋專(zhuān)家名的聲紋模板; (5) 對(duì)解釋專(zhuān)家的聲紋模板,進(jìn)行抗干擾預(yù)處理,并提取聲紋特征,形成樣本特征矢量 序列; (6) 對(duì)待識(shí)別用戶聲紋波形,進(jìn)行抗干擾預(yù)處理,并提取聲紋特征,形成待識(shí)別樣本特 征矢量序列; (7) 計(jì)算待識(shí)別用戶樣本特征矢量序列與該解釋專(zhuān)家樣本特征矢量序列之間的匹配距 離,如果該距離小于拒識(shí)閾值,則判定待識(shí)別用戶為指示的解釋專(zhuān)家,識(shí)別成功,系統(tǒng)開(kāi)放 智能測(cè)井評(píng)價(jià)所用知識(shí)庫(kù);否則,拒識(shí)。2. 如權(quán)利要求1所述基于聲紋識(shí)別的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)身份認(rèn)證方法,其特征在 于步驟(5)、(6)中的抗干擾預(yù)處理方法包括以下步驟: (a) 提取聲紋波形的濁音段; (b) 對(duì)每個(gè)濁音段,進(jìn)行重疊分幀處理; (c) 對(duì)每幀信號(hào),進(jìn)行加窗處理; (d) 對(duì)加窗后信號(hào)進(jìn)行FFT變換。3. 如權(quán)利要求2所述基于聲紋識(shí)別的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)身份認(rèn)證方法,其特征在 于, 步驟(5)、(6)中抗干擾預(yù)處理方法的具體實(shí)施步驟如下: (a) 提取聲紋波形的濁音段;首先采用倒譜法計(jì)算聲紋波形的基音頻率,信號(hào)s[η]的 實(shí)倒譜如下式計(jì)算:(1) 式中;。將實(shí)倒譜C [η]的X坐標(biāo)η,通過(guò)SFreq (采樣頻率)/η,轉(zhuǎn)換 成頻率值;限定基音頻率值在70Hz和500Hz之間,在該限定頻率范圍內(nèi),尋找實(shí)倒譜c[η] 中的最大值,如果該最大值大于〇. 09,則對(duì)應(yīng)的頻率即為計(jì)算的基音頻率,否則基音頻率為 零;最后,對(duì)計(jì)算的基音頻率進(jìn)行中值濾波,將不為零的基音頻率對(duì)應(yīng)的聲紋波形段,認(rèn)為 是池首段; (b) 對(duì)每個(gè)濁音段,進(jìn)行重疊分幀處理;幀與幀之間要保證一定的重疊,即幀移,幀移 與中貞長(zhǎng)的比值一般在〇~1/2之間; (C)對(duì)每幀信號(hào),進(jìn)行加窗處理;對(duì)每幀數(shù)據(jù)加漢明窗,即是用有限長(zhǎng)窗口對(duì)每幀信號(hào) 進(jìn)行加權(quán)處理,漢明窗函數(shù)如下所示:(d) 對(duì)加窗后信號(hào)講行FFT奪拖,得剎該幀的頗譜為: (3)步驟(5)、(6)中提取聲紋特征信息采用梅爾頻率倒譜系統(tǒng)(MFCC)作為聲紋特征參數(shù), 具體實(shí)施步驟如下: (e) 計(jì)算每幀頻譜X(k)幅度的平方,得到能量譜IX(k) I2 ; (f) 將能量譜通過(guò)Mel頻率濾波器組,以實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的頻譜進(jìn)行平滑,并消除諧 波,凸顯原先語(yǔ)音的共振峰; Mel頻率濾波器組是一組三角帶通濾波器,中心頻率為f(m),0< m〈M,M為濾波器組個(gè) 數(shù),取值20~28之間,Mel濾波器Hm (k)表示如下:(g) 對(duì)Mel濾波器組的輸出取對(duì)數(shù):壓縮語(yǔ)音頻譜的動(dòng)態(tài)范圍,將頻域中的噪聲的乘性 成分轉(zhuǎn)換成加性成分,得到對(duì)數(shù)Mel頻譜S (m)如下:(h) 將對(duì)數(shù)能量譜S (m)經(jīng)過(guò)離散余弦變換得到MFCC系數(shù),第η個(gè)系數(shù)C (η)的計(jì)算如 下式: (6)式中,L為MFCC參數(shù)的維數(shù)。4.如權(quán)利要求1或2、3所述基于聲紋識(shí)別的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)身份認(rèn)證方法,其 特征在于步驟(7)中的匹配距離計(jì)算方法,該方法包括以下步驟: (i) 計(jì)算待識(shí)別用戶樣本特征矢量序列中每幀信號(hào)的特征向量與指示解釋專(zhuān)家樣本特 征矢量序列中所有幀信號(hào)的特征向量之間的距離; (j) 尋找?guī)g距離最小值所對(duì)應(yīng)的幀對(duì)作為最優(yōu)匹配結(jié)果; (k) 計(jì)算待識(shí)別用戶樣本特征矢量序列與指示解釋專(zhuān)家樣本特征矢量序列之間的所有 最優(yōu)匹配幀對(duì),并對(duì)所有最優(yōu)匹配幀對(duì)之間的距離進(jìn)行平均,作為待識(shí)別用戶樣本特征矢 量序列與指示解釋專(zhuān)家樣本特征矢量序列之間的匹配距離。
【專(zhuān)利摘要】一種基于聲紋識(shí)別的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)身份認(rèn)證方法,采集解釋專(zhuān)家用戶對(duì)同一文本發(fā)音的聲紋波形,構(gòu)成聲紋模板庫(kù);通過(guò)待識(shí)別用戶指示,得到要進(jìn)行身份認(rèn)證的解釋專(zhuān)家名;采集待識(shí)別用戶對(duì)與聲紋模板庫(kù)聲紋波形;從聲紋模板庫(kù)中,提取對(duì)應(yīng)該解釋專(zhuān)家名的聲紋模板;分別對(duì)解釋專(zhuān)家和待識(shí)別用戶的聲紋模板,進(jìn)行抗干擾預(yù)處理,并提取聲紋特征,形成樣本特征矢量序列;計(jì)算待識(shí)別用戶樣本特征矢量序列與該解釋專(zhuān)家樣本特征矢量序列之間的匹配距離,則判定待識(shí)別用戶為指示的解釋專(zhuān)家。本發(fā)明具有認(rèn)證準(zhǔn)確率高,速度快,魯棒性強(qiáng),可準(zhǔn)確識(shí)別過(guò)慢和過(guò)快速語(yǔ)音等優(yōu)點(diǎn)。
【IPC分類(lèi)】G06F21/32, G10L17/04
【公開(kāi)號(hào)】CN104978507
【申請(qǐng)?zhí)枴緾N201410148223
【發(fā)明人】張晉言, 邢強(qiáng), 張德峰, 劉海河
【申請(qǐng)人】中國(guó)石油化工集團(tuán)公司, 中石化勝利石油工程有限公司測(cè)井公司
【公開(kāi)日】2015年10月14日
【申請(qǐng)日】2014年4月14日