一種變電設(shè)備聲音與語音的識(shí)別方法
【專利摘要】本發(fā)明提出了一種變電設(shè)備聲音與語音的識(shí)別方法,包括如下步驟:訓(xùn)練過程和識(shí)別過程;所述訓(xùn)練過程:采集變電站設(shè)備聲音和人的語音,對(duì)采集的聲音進(jìn)行預(yù)處理,對(duì)預(yù)處理之后的信號(hào)進(jìn)行時(shí)頻變換,然后進(jìn)行頻譜分析,特征提取,在設(shè)備聲音信號(hào)頻譜中提取工頻倍數(shù)和非工頻倍數(shù)處的頻譜;最后通過SVM算法進(jìn)行訓(xùn)練,最后得到SVM學(xué)習(xí)器;所述識(shí)別過程:提取待檢測(cè)聲音信號(hào)的特征向量,使用SVM學(xué)習(xí)器進(jìn)行識(shí)別,得到識(shí)別結(jié)果,即:變壓器聲音或說話聲。實(shí)驗(yàn)結(jié)果顯示,本發(fā)明能夠準(zhǔn)確的識(shí)別設(shè)備聲音和非設(shè)備聲音,算法準(zhǔn)確率高,性能穩(wěn)定。
【專利說明】一種變電設(shè)備聲音與語音的識(shí)別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種變電設(shè)備聲音與語音的識(shí)別方法。
【背景技術(shù)】
[0002] 隨著國(guó)家電網(wǎng)規(guī)模的擴(kuò)大,電網(wǎng)安全運(yùn)行越來越重要。自動(dòng)化和智能化檢測(cè)手段 已開始取代以往的人工檢測(cè)方式,這也是變電站無人值守的重要表現(xiàn)。
[0003] 聲音是有物體振動(dòng)產(chǎn)生的,作為物體振動(dòng)時(shí)發(fā)出的一種固有信號(hào),必然攜帶物體 本身的結(jié)構(gòu)信息。變電設(shè)備在發(fā)電、輸電、配電中起著至關(guān)重要的作用,變電設(shè)備在運(yùn)行過 程中也會(huì)發(fā)出自己特有的聲音。比如,變壓器在正常運(yùn)行狀態(tài)下會(huì)發(fā)出連續(xù)均勻的"嗡嗡" 聲,這是由于鐵芯中交變的磁通在鐵芯硅鋼片間產(chǎn)生一種力的振動(dòng)的結(jié)果,而人在說話時(shí) 發(fā)出的聲音則是氣流通過聲帶時(shí)引起聲帶的振動(dòng)產(chǎn)生的。同樣大自然的各種聲音都有其自 身的產(chǎn)生機(jī)理。
[0004] 一直以來,聲音信號(hào)作為大自然的一種信息載體常被人當(dāng)作"耳旁風(fēng)"。根據(jù)美 國(guó)商學(xué)院有關(guān)研究表明,人的大腦每天通過五官接受外部信息的比例為:味覺1%,觸覺 1.5%,嗅覺3.5%,聽覺11%及其視覺83%。可見聽覺得到的信息是僅次于視覺的。并且 聽覺渠道得到的信息雖然不如視覺渠道的高,但是它不僅不會(huì)造成疲勞感還可以為想象留 出充分的余地。聲音種類繁多,怎么區(qū)分不同的聲音也是目前研究的熱點(diǎn)問題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的就是為了解決上述問題,提供一種變電設(shè)備聲音與語音的識(shí)別方 法,它具有算法簡(jiǎn)單、識(shí)別正確率高的優(yōu)點(diǎn)。
[0006] 為了實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
[0007] -種變電設(shè)備聲音與語音的識(shí)別方法,包括如下步驟:
[0008] 訓(xùn)練過程和識(shí)別過程;
[0009]所述訓(xùn)練過程:采集變電站設(shè)備聲音和人的語音,對(duì)采集的聲音進(jìn)行預(yù)處理,對(duì)預(yù) 處理之后的信號(hào)進(jìn)行時(shí)頻變換,然后進(jìn)行頻譜分析,特征提取,在設(shè)備聲音信號(hào)頻譜中提取 工頻倍數(shù)和非工頻倍數(shù)處的頻譜;最后通過SVM算法進(jìn)行訓(xùn)練,最后得到SVM學(xué)習(xí)器;
[0010] 所述識(shí)別過程:提取待檢測(cè)聲音信號(hào)的特征向量,使用SVM學(xué)習(xí)器進(jìn)行識(shí)別,得到 識(shí)別結(jié)果,即:變壓器聲音或說話聲。
[0011] 所述訓(xùn)練過程的具體步驟包括:
[0012] Step(1):米集變壓器聲音和人的說話聲,將米集到聲音信號(hào)組建成樣本庫(kù);
[0013]Step(2):聲音信號(hào)進(jìn)行預(yù)加重、分巾貞和加窗處理;
[0014]St印(3):時(shí)頻變換:使用傅里葉變換將St印(2)中的聲音信號(hào)從時(shí)域轉(zhuǎn)換到頻 域,經(jīng)過傅里葉變換得到聲音信號(hào)的頻譜分布,進(jìn)而得到聲音信號(hào)頻譜圖;
[0015]f(x)的傅里葉變換F(u)定義如式(3)所示:
【權(quán)利要求】
1. 一種變電設(shè)備聲音與語音的識(shí)別方法,其特征是,包括如下步驟: 訓(xùn)練過程和識(shí)別過程; 所述訓(xùn)練過程:采集變電站設(shè)備聲音和人的語音,對(duì)采集的聲音進(jìn)行預(yù)處理,對(duì)預(yù)處理 之后的信號(hào)進(jìn)行時(shí)頻變換,然后進(jìn)行頻譜分析,特征提取,在設(shè)備聲音信號(hào)頻譜中提取工頻 倍數(shù)和非工頻倍數(shù)處的頻譜;最后通過SVM算法進(jìn)行訓(xùn)練,最后得到SVM學(xué)習(xí)器; 所述識(shí)別過程:提取待檢測(cè)聲音信號(hào)的特征向量,使用SVM學(xué)習(xí)器進(jìn)行識(shí)別,得到識(shí)別 結(jié)果,即:變壓器聲音或說話聲。
2. 如權(quán)利要求1所述的一種變電設(shè)備聲音與語音的識(shí)別方法,其特征是,所述訓(xùn)練過 程的具體步驟包括: Step(1):米集變壓器聲音和人的說話聲,將米集到聲音信號(hào)組建成樣本庫(kù); Step(2):聲音信號(hào)進(jìn)行預(yù)加重、分巾貞和加窗處理; Step(3):時(shí)頻變換:使用傅里葉變換將Step(2)中的聲音信號(hào)從時(shí)域轉(zhuǎn)換到頻域,經(jīng) 過傅里葉變換得到聲音信號(hào)的頻譜分布,進(jìn)而得到聲音信號(hào)頻譜圖; f(x)的傅里葉變換F(u)定義如式(3)所示:
Step(4):頻譜分析,特征提?。? 在聲音信號(hào)頻譜圖中分析在各頻率上聲音信號(hào)頻譜分布情況,統(tǒng)計(jì)頻譜在頻率上響應(yīng) 的頻譜值,通過計(jì)算得到的樣本特征向量(ph,nph,En,Zn,mean,S);其中,ph代表工頻倍數(shù) 為50*mHz處的頻譜相加得到頻譜和,nph代表非工頻倍數(shù)處的頻譜相加得到頻譜和,EnR 表短時(shí)能量,Zn代表短時(shí)過零率,mean代表樣本均值,S代表方差; St印(5) :SVM訓(xùn)練學(xué)習(xí); 在訓(xùn)練SVM時(shí),核函數(shù)選用Sigmoid核函數(shù),將Step⑷得到的樣本特征向量 (ph,nph,En,Zn,mean,S)送入SVM學(xué)習(xí)器,得到SVM學(xué)習(xí)器。
3. 如權(quán)利要求2所述的一種變電設(shè)備聲音與語音的識(shí)別方法,其特征是,所述Step(2) 預(yù)加重使用的是一階的數(shù)字濾波器;設(shè)聲音信號(hào)f(x)在n時(shí)刻的聲音信號(hào)采樣值為x(n), 經(jīng)過預(yù)加重后的聲音信號(hào)采樣值y(n)為:y(n) =x(n)-ax(n-l),其中0. 9〈a〈1 ;所述預(yù) 加重的目的是提升信號(hào)的高頻部分,使信號(hào)的頻譜變得平坦,保持在低頻到高頻的整個(gè)頻 帶中。
4. 如權(quán)利要求2所述的一種變電設(shè)備聲音與語音的識(shí)別方法,其特征是,所述Step(2) 分幀采用交疊分段的方法,使幀與幀之間平滑過渡,保持其連續(xù)性;設(shè)聲音信號(hào)的長(zhǎng)度為 N,分成每巾貞的長(zhǎng)度為L(zhǎng),巾貞移為M,則信號(hào)被分為的巾貞數(shù)num為:
5. 如權(quán)利要求2所述的一種變電設(shè)備聲音與語音的識(shí)別方法,其特征是,所述Step(2) 加窗處理,即對(duì)序列的邊界點(diǎn)進(jìn)行平滑處理以使得以此序列能夠進(jìn)行周期拓展;選用的窗 函數(shù)為漢明窗,公式如下:
6. 如權(quán)利要求2所述的一種變電設(shè)備聲音與語音的識(shí)別方法,其特征是,所述Step(4) 包括如下步驟: Step(4. 1):在設(shè)備聲音信號(hào)頻譜中提取工頻倍數(shù)和非工頻倍數(shù)處的頻譜; 將工頻倍數(shù)為50*mHz處的頻譜相加得到頻譜和ph;將非工頻倍數(shù)處的頻譜相加得到 頻譜和nph,其中m為自然數(shù); Step(4. 2):計(jì)算聲音信號(hào)的短時(shí)能量、短時(shí)過零率、均值和方差; Step(4. 3):組建特征向量; 將計(jì)算得到的工頻倍數(shù)為50*mHz處的頻譜相加得到頻譜和ph、非工頻倍數(shù)處的頻 譜相加得到頻譜和nph、短時(shí)能量£"、短時(shí)過零率Zn、樣本均值mean和方差S組成向量 (ph,nph,En,Zn,mean,S) 〇
7. 如權(quán)利要求6所述的一種變電設(shè)備聲音與語音的識(shí)別方法,其特征是,所述 St印(4. 2)短時(shí)能量的計(jì)算方法為: 設(shè)聲音信號(hào)時(shí)域信號(hào)為f(x),加窗分幀后得到的第n幀的聲音信號(hào)為fn(x),則fn(x) 的短時(shí)能量用En表示,計(jì)算公式如式(4)所示;式中,N為幀長(zhǎng);
En是一個(gè)度量聲音信號(hào)幅度值變化的函數(shù)。
8. 如權(quán)利要求6所述的一種變電設(shè)備聲音與語音的識(shí)別方法,其特征是,所述 Step(4. 2)短時(shí)過零率表示一幀信號(hào)中聲音信號(hào)波形穿過零電平的次數(shù); 對(duì)于連續(xù)信號(hào),過零即意味著時(shí)域波形通過時(shí)間軸; 對(duì)于離散信號(hào),如果相鄰的取樣值改變符號(hào)則稱為過零,過零率就是樣本改變符號(hào)的 次數(shù);fn(x)的短時(shí)過零率Zn如式(6)所示:
式中sgn□為符號(hào)函數(shù),如式(7)所示:
9. 如權(quán)利要求6所述的一種變電設(shè)備聲音與語音的識(shí)別方法,其特征是,所述 Step(4. 2)的均值的計(jì)算方法為: 樣本均值mean又叫樣本均數(shù),即為樣本的均值;均值是指在一組數(shù)據(jù)中所有數(shù)據(jù)之和 再除以數(shù)據(jù)的個(gè)數(shù)。
10. 如權(quán)利要求6所述的一種變電設(shè)備聲音與語音的識(shí)別方法,其特征是,所述 Step(4. 2)的方差的計(jì)算方法為: 方差,就是和中心偏離的程度;用來衡量一批數(shù)據(jù)的波動(dòng)大小,即這批數(shù)據(jù)偏離平均數(shù) 的大小,并把它叫做這組數(shù)據(jù)的方差S2:在樣本容量相同的情況下,方差越大,說明數(shù)據(jù)的 波動(dòng)越大,越不穩(wěn)定;
其中,mean表不樣本均值,S2表不方差。
【文檔編號(hào)】G10L15/06GK104409073SQ201410612145
【公開日】2015年3月11日 申請(qǐng)日期:2014年11月4日 優(yōu)先權(quán)日:2014年11月4日
【發(fā)明者】付淵, 周原, 趙小魚, 管文龍, 田月煒 申請(qǐng)人:貴陽(yáng)供電局