一種基于聲紋識(shí)別的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)身份認(rèn)證方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于聲紋識(shí)別的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)身份認(rèn)證方法,屬于計(jì)算 機(jī)信息安全技術(shù)領(lǐng)域,應(yīng)用于測(cè)井處理解釋軟件領(lǐng)域。
【背景技術(shù)】
[0002] 國(guó)外發(fā)展了多種石油測(cè)井解釋的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng),如斯倫貝謝公司的地層 傾角解釋咨詢系統(tǒng)和巖性模式識(shí)別(UT冊(cè))專(zhuān)家系統(tǒng),殼牌石油公司的巖石物性評(píng)價(jià)知識(shí) 庫(kù)系統(tǒng)(L0GIX)。而國(guó)內(nèi)主要有華北油田和勝利油田的0WLI和LIX測(cè)井解釋智能專(zhuān)家系統(tǒng), 但該些智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)缺少用戶身份認(rèn)證和權(quán)限劃分,易造成構(gòu)建的專(zhuān)家知識(shí)庫(kù)被 非法修改和盜用。
[0003] 基于聲紋的生物特征信息識(shí)別技術(shù),利用人類(lèi)發(fā)音器官的生理差異W及后天形成 的行為差異導(dǎo)致的發(fā)音方式和說(shuō)話習(xí)慣的不同,進(jìn)行身份識(shí)別和認(rèn)證,具有安全程度高,使 用者易接受,生物特征獲取成本低廉,認(rèn)證算法復(fù)雜度低等優(yōu)勢(shì),已逐漸取代傳統(tǒng)的密碼認(rèn) 證方式。
[0004] 在已有的聲紋識(shí)別技術(shù)中,主要有基于高斯混合模型(專(zhuān)利;CN102194455A和 CN102324232A)和基于矢量量化方法(專(zhuān)利;101055718A)的兩大類(lèi)方法。
[0005] 基于高斯混合模型的方法主要包括訓(xùn)練和待識(shí)別樣本聲紋波形信息的特征提取, 構(gòu)建訓(xùn)練樣本特征向量的高斯混合模型,計(jì)算待識(shí)別樣本特征向量在高斯混合模型中的概 率分布,作為判別條件。缺點(diǎn):(1)聲紋信息特征并不完全符合高斯分布,與高斯模型不夠 吻合;(2)模型初始參數(shù)的選取比較隨機(jī),嚴(yán)重影響系統(tǒng)的識(shí)別率;(3)構(gòu)建高斯混合模型, 訓(xùn)練算法復(fù)雜程度高,迭代過(guò)程中易出現(xiàn)協(xié)方差矩陣元素小于零的情況,造成無(wú)法訓(xùn)練得 到最終模型。
[0006] 基于矢量量化的方法主要包括訓(xùn)練和待識(shí)別樣本聲紋波形信息的特征提取,構(gòu)建 訓(xùn)練樣本特征向量的矢量量化碼本,采用窮盡搜索,計(jì)算待識(shí)別樣本輸入矢量與所有訓(xùn)練 樣本碼字之間的失真,通過(guò)比較找出失真最小的碼字,作為判別結(jié)果。缺點(diǎn);(1)從碼本中 搜索訓(xùn)練矢量的最近碼字需要大量的存儲(chǔ)空間和繁瑣的計(jì)算,當(dāng)采用大碼本和高維矢量 時(shí),計(jì)算復(fù)雜度將非常大;(2)初始碼本的選擇影響碼本訓(xùn)練的收斂速度和最終碼本的性 能。
[0007] 實(shí)際應(yīng)用中還發(fā)現(xiàn)該兩種方法的魯棒性較差,對(duì)于過(guò)慢和過(guò)快速的待識(shí)別聲紋的 識(shí)別率很低。
【發(fā)明內(nèi)容】
[0008] 本發(fā)明的一種基于聲紋識(shí)別的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)身份認(rèn)證方法,目的在于使 用用戶的聲紋信息對(duì)智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)用戶進(jìn)行身份認(rèn)證,并劃分相應(yīng)的權(quán)限,避免 因智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)中的專(zhuān)家知識(shí)庫(kù)被非法修改和盜用引發(fā)的安全問(wèn)題。
[0009] 本發(fā)明的技術(shù)方案
[0010] 一種基于聲紋識(shí)別的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)身份認(rèn)證方法,其特征在于包括W下 步驟:
[0011] (1)采集智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)每位解釋專(zhuān)家用戶對(duì)同一文本發(fā)音的聲紋波形, 構(gòu)成聲紋模板庫(kù);
[001引 (2)通過(guò)待識(shí)別用戶指示,得到要進(jìn)行身份認(rèn)證的解釋專(zhuān)家名;
[0013] (3)采集待識(shí)別用戶對(duì)與聲紋模板庫(kù)中構(gòu)建該解釋專(zhuān)家聲紋模板相同的文本發(fā)音 的聲紋波形;
[0014] (4)從聲紋模板庫(kù)中,提取對(duì)應(yīng)該解釋專(zhuān)家名的聲紋模板;
[0015] (5)對(duì)解釋專(zhuān)家的聲紋模板,進(jìn)行抗干擾預(yù)處理,并提取聲紋特征,形成樣本特征 矢量序列;
[0016] (6)對(duì)待識(shí)別用戶聲紋波形,進(jìn)行抗干擾預(yù)處理,并提取聲紋特征,形成待識(shí)別樣 本特征矢量序列;
[0017] (7)計(jì)算待識(shí)別用戶樣本特征矢量序列與該解釋專(zhuān)家樣本特征矢量序列之間的匹 配距離,如果該距離小于拒識(shí)闊值,則判定待識(shí)別用戶為指示的解釋專(zhuān)家,識(shí)別成功,系統(tǒng) 開(kāi)放智能測(cè)井評(píng)價(jià)所用知識(shí)庫(kù);否則,拒識(shí)。
[0018] 上述方案中的步驟巧)、(6)抗干擾預(yù)處理方法包括W下步驟:
[0019] (a)提取聲紋波形的濁音段;
[0020] (b)對(duì)每個(gè)濁音段,進(jìn)行重疊分峽處理;
[0021] (C)對(duì)每峽信號(hào),進(jìn)行加窗處理;
[00過(guò) (d)對(duì)加窗后信號(hào)進(jìn)行FFT變換。
[0023] 針對(duì)步驟巧)、化)中抗干擾預(yù)處理方法的具體實(shí)施步驟如下:
[0024] (a)提取聲紋波形的濁音段;首先采用倒譜法計(jì)算聲紋波形的基音頻率,信號(hào) s[n]的實(shí)倒譜如下式計(jì)算:
[00巧]
(1)
[0026] 式中,
將實(shí)倒譜c[n]的X坐標(biāo)n,通過(guò)SRreq(采樣頻率)/ n,轉(zhuǎn)換成頻率值;限定基音頻率值在70化和500化之間,在該限定頻率范圍內(nèi),尋找實(shí)倒 譜C[n]中的最大值,如果該最大值大于0. 09,則對(duì)應(yīng)的頻率即為計(jì)算的基音頻率,否則基 音頻率為零;最后,對(duì)計(jì)算的基音頻率進(jìn)行中值濾波,將不為零的基音頻率對(duì)應(yīng)的聲紋波形 段,認(rèn)為是濁音段;
[0027] 化)對(duì)每個(gè)濁音段,進(jìn)行重疊分峽處理;峽與峽之間要保證一定的重疊,即峽移, 中貞移與幀長(zhǎng)的比值一般在0~1/2之間;
[0028] (C)對(duì)每峽信號(hào),進(jìn)行加窗處理;對(duì)每峽數(shù)據(jù)加漢明窗,即是用有限長(zhǎng)窗口對(duì)每峽 信號(hào)進(jìn)行加權(quán)處理,漢明窗函數(shù)如下所示:
[0029]
[0030] (d)對(duì)加窗后信號(hào)進(jìn)行FFT變換,得到該峽的頻譜為:
[0031]
(3)
[0032] 針對(duì)步驟巧)、(6)中提取聲紋特征信息采用梅爾頻率倒譜系統(tǒng)(MFCC)作為聲紋 特征參數(shù),具體實(shí)施步驟如下:
[0033] (e)計(jì)算每峽頻譜X(k)幅度的平方,得到能量譜IX化)|2;
[0034] (f)將能量譜通過(guò)Mel頻率濾波器組,W實(shí)現(xiàn)對(duì)語(yǔ)音信號(hào)的頻譜進(jìn)行平滑,并消除 諧波,凸顯原先語(yǔ)音的共振峰;
[00巧]Mel頻率濾波器組是一組H角帶通濾波器,中也頻率為f(m),0《m<M,M為濾波器 組個(gè)數(shù),取值20~28之間,Mel濾波器Hm似表示如下:
[0036]
(4)
[0037] (g)對(duì)Mel濾波器組的輸出取對(duì)數(shù);壓縮語(yǔ)音頻譜的動(dòng)態(tài)范圍,將頻域中的噪聲的 乘性成分轉(zhuǎn)換成加性成分,得到對(duì)數(shù)Mel頻譜S(m)如下:
[0038]
(句
[003引 似將對(duì)數(shù)能量譜S(m)經(jīng)過(guò)離散余弦變換得到MFCC系數(shù),第n個(gè)系數(shù)C(n)的計(jì) 算如下式:
[0040]
[00川式中,L為MFCC參數(shù)的維數(shù)。
[0042] 針對(duì)步驟(7)中的匹配距離計(jì)算方法包括W下步驟:
[0043] (i)計(jì)算待識(shí)別用戶樣本特征矢量序列中每峽信號(hào)的特征向量與指示解釋專(zhuān)家樣 本特征矢量序列中所有峽信號(hào)的特征向量之間的距離;
[0044] (j)尋找峽間距離最小值所對(duì)應(yīng)的峽對(duì)作為最優(yōu)匹配結(jié)果;
[0045] 化)計(jì)算待識(shí)別用戶樣本特征矢量序列與指示解釋專(zhuān)家樣本特征矢量序列之間的 所有最優(yōu)匹配峽對(duì),并對(duì)所有最優(yōu)匹配峽對(duì)之間的距離進(jìn)行平均,作為待識(shí)別用戶樣本特 征矢量序列與指示解釋專(zhuān)家樣本特征矢量序列之間的匹配距離。
[0046] 本發(fā)明與現(xiàn)有技術(shù)相比,具有W下優(yōu)點(diǎn):
[0047] (1)為智能測(cè)井評(píng)價(jià)系統(tǒng)增加了基于聲紋識(shí)別的用戶身份認(rèn)證和權(quán)限劃分機(jī)制, 有效保護(hù)了知識(shí)庫(kù)不被非法修改和盜用;
[0048] (2)在聲紋識(shí)別技術(shù)中,通過(guò)采用抗干擾預(yù)處理方法,只提取包含聲紋特征的濁音 段,去除清音段的干擾,解決了現(xiàn)有方法魯棒性差的問(wèn)題,極大提高了過(guò)慢和過(guò)快速聲紋波 形的識(shí)別率。
[0049] (3)在聲紋識(shí)別技術(shù)中,采用基于峽間最優(yōu)匹配對(duì)平均距離計(jì)算的模型匹配方法, 具有匹配方法簡(jiǎn)單、高效,識(shí)別準(zhǔn)確率高等優(yōu)點(diǎn),避免了現(xiàn)有方法中高斯混合模型和碼本訓(xùn) 練算法復(fù)雜,耗時(shí)、成功率低W及匹配碼字搜索計(jì)算復(fù)雜程度大等問(wèn)題。
【附圖說(shuō)明】
[0050] 圖1所示為本發(fā)明方法提出的一種基于聲紋識(shí)別的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)身份 認(rèn)證方法的系統(tǒng)流程結(jié)構(gòu)圖。
【具體實(shí)施方式】
[0051] 本實(shí)施例給出的一種基于聲紋識(shí)別的智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)身份認(rèn)證方法,首先 為智能測(cè)井評(píng)價(jià)專(zhuān)家系統(tǒng)的每位解釋專(zhuān)家用戶構(gòu)建聲紋模板庫(kù),通過(guò)采集H次每位解釋專(zhuān) 家用戶對(duì)同一文本發(fā)音的聲紋波形,經(jīng)過(guò)量化后,W解釋專(zhuān)家名字為索引,載入加密數(shù)據(jù) 庫(kù)。在系統(tǒng)身份認(rèn)證過(guò)程中,待識(shí)別用戶首先在解釋專(zhuān)家列表中,指定要進(jìn)行身份確認(rèn)的解 釋專(zhuān)家名字,再采集待識(shí)別用戶對(duì)與指定解釋專(zhuān)家的聲紋模板相同的文本進(jìn)行發(fā)音的聲紋 波形,并量化。根據(jù)待識(shí)別用戶的指示,從數(shù)據(jù)庫(kù)中提取對(duì)應(yīng)該解釋專(zhuān)家名字的H個(gè)聲紋模 板,分別進(jìn)行抗干擾預(yù)處理和聲紋特征提取,組合成包含多個(gè)峽特征向量的特征矢量序列; 對(duì)待識(shí)別用戶量化后的聲紋信號(hào),進(jìn)行抗干擾預(yù)處理和聲紋特征提取,也形成對(duì)應(yīng)每峽特 征向量的特征矢量序