本發(fā)明涉及一種基于語(yǔ)音識(shí)別的動(dòng)態(tài)定位監(jiān)控方法及系統(tǒng),屬于定位監(jiān)控的技術(shù)領(lǐng)域。
背景技術(shù):
目前,據(jù)統(tǒng)計(jì)中國(guó)每年有800萬(wàn)失蹤,有近千萬(wàn)的人群在尋找中。而且失蹤和失散人口的數(shù)量還在增加。加上多年累積的失散人口,每年尋人的人口在一千萬(wàn)以上。隨著科學(xué)技術(shù)的快速發(fā)展,高科技設(shè)備應(yīng)用于解決安全問(wèn)題的手法越來(lái)越豐富,安全問(wèn)題也日益引起人們的重視。
同時(shí)GPS作為最新型的定位技術(shù)正在廣泛的應(yīng)用于軍事、科學(xué)、汽車定位、及我們生活的手機(jī)定位等,GPS的誕生使我們的生活發(fā)生了巨大的變化。GPS定位技術(shù)可以很好的應(yīng)用在防走失的情況下,當(dāng)發(fā)生異常情況時(shí),可以及時(shí)確定位置。
然而現(xiàn)有的動(dòng)態(tài)定位監(jiān)控技術(shù)中,主要利用人工控制GPS定位技術(shù)進(jìn)行位置定位,而無(wú)法根據(jù)用戶的語(yǔ)音特征進(jìn)行自動(dòng)識(shí)別和判斷,由于基于危險(xiǎn)狀況下人發(fā)出的聲音明顯與正常情況下不同,危險(xiǎn)狀況下的語(yǔ)音研究與情感有很大的關(guān)系,語(yǔ)音信號(hào)中不僅包含人表達(dá)的語(yǔ)音信息,也包含了人的情感信息,如何區(qū)分是否處在危險(xiǎn)狀況下,語(yǔ)音情感的研究顯得尤其重要。
因此,利用語(yǔ)音特征分析研究危險(xiǎn)情況下聲音的屬性特征,并將其應(yīng)用于報(bào)警系統(tǒng),提高安防智能性、實(shí)時(shí)性的特點(diǎn),具有非常重要的意義。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問(wèn)題在于克服現(xiàn)有技術(shù)的不足,提供一種基于語(yǔ)音識(shí)別的動(dòng)態(tài)定位監(jiān)控方法及系統(tǒng),解決現(xiàn)有的動(dòng)態(tài)定位監(jiān)控技術(shù)無(wú)法根據(jù)用戶的語(yǔ)音特征進(jìn)行自動(dòng)識(shí)別和判斷,無(wú)法利用語(yǔ)音特征分析研究危險(xiǎn)情況下聲音的屬性特征進(jìn)行定位監(jiān)控的問(wèn)題。
本發(fā)明具體采用以下技術(shù)方案解決上述技術(shù)問(wèn)題:
一種基于語(yǔ)音識(shí)別的動(dòng)態(tài)定位監(jiān)控方法,包括:
步驟1、實(shí)時(shí)定位獲取當(dāng)前位置數(shù)據(jù);
步驟2、輸入語(yǔ)音信號(hào),及對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理獲得語(yǔ)音數(shù)字信號(hào);
步驟3、對(duì)所述語(yǔ)音數(shù)字信號(hào)進(jìn)行基于線性預(yù)測(cè)倒譜LPCC系數(shù)的特征參數(shù)提取,獲得語(yǔ)音特征參數(shù);
步驟4、建立由目標(biāo)聲模板構(gòu)成的語(yǔ)音模板庫(kù);
步驟5、構(gòu)建人工神經(jīng)網(wǎng)絡(luò)模型,結(jié)合所建立的語(yǔ)音模板庫(kù)對(duì)步驟3所得語(yǔ)音特征參數(shù)識(shí)別判斷是否存在異常,及在判斷為存在異常時(shí)生成和發(fā)送控制信號(hào);
步驟6、根據(jù)控制信號(hào)將當(dāng)前位置數(shù)據(jù)發(fā)送,以完成動(dòng)態(tài)定位監(jiān)控。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟2對(duì)語(yǔ)音信號(hào)預(yù)處理包括濾波、預(yù)加重、分幀加窗及端點(diǎn)檢測(cè)處理。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟2中對(duì)語(yǔ)音信號(hào)預(yù)處理,包括步驟:
步驟2-1、對(duì)輸入的語(yǔ)音信號(hào)濾波后采樣,將時(shí)間上連續(xù)的語(yǔ)音信號(hào)離散化為一個(gè)樣本序列,得到離散的語(yǔ)音數(shù)字信號(hào);
步驟2-2、對(duì)所述離散的語(yǔ)音數(shù)字信號(hào)進(jìn)行預(yù)加重處理;
步驟2-3、利用交疊分段的方法對(duì)步驟2-2所得預(yù)加重處理后的語(yǔ)音數(shù)字信號(hào)進(jìn)行分幀,及選擇漢明窗對(duì)語(yǔ)音信號(hào)進(jìn)行加窗處理;
步驟2-4、利用語(yǔ)音端點(diǎn)檢測(cè)算法對(duì)步驟2-3所得加窗處理后的語(yǔ)音數(shù)字信號(hào)進(jìn)行語(yǔ)音相關(guān)。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:所述步驟5中對(duì)語(yǔ)音特征參數(shù)識(shí)別判斷是否存在異常,包括步驟:
步驟5-1、提取語(yǔ)音特征參數(shù)中的特征參數(shù)組成特征向量;
步驟5-2、將所述特征向量輸入人工神經(jīng)網(wǎng)絡(luò)模型,利用人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行非線性運(yùn)算,求得隱單元節(jié)點(diǎn)數(shù);
步驟5-3、根據(jù)所述隱單元節(jié)點(diǎn)數(shù),判斷語(yǔ)音特征參數(shù)是否異常。
本發(fā)明還提出一種基于語(yǔ)音識(shí)別的動(dòng)態(tài)定位監(jiān)控系統(tǒng),包括:
GPS模塊,用于定位獲取當(dāng)前位置數(shù)據(jù);
語(yǔ)音傳感模塊,用于輸入和傳輸語(yǔ)音信號(hào);
控制模塊,用于對(duì)接收到的語(yǔ)音信號(hào)進(jìn)行預(yù)處理獲得語(yǔ)音數(shù)字信號(hào),及對(duì)所述語(yǔ)音數(shù)字信號(hào)進(jìn)行基于線性預(yù)測(cè)倒譜LPCC系數(shù)的特征參數(shù)提取,獲得語(yǔ)音特征參數(shù);以及建立由目標(biāo)聲模板構(gòu)成的語(yǔ)音模板庫(kù),并構(gòu)建人工神經(jīng)網(wǎng)絡(luò)模型,結(jié)合所建立的語(yǔ)音模板庫(kù)對(duì)語(yǔ)音特征參數(shù)識(shí)別判斷是否存在異常,及在判斷為存在異常時(shí)生成和發(fā)送控制信號(hào);
GSM模塊,用于根據(jù)控制信號(hào)將當(dāng)前位置數(shù)據(jù)發(fā)送。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:還包括按鍵模塊,所述按鍵模塊用于控制GPS模塊獲取當(dāng)前位置數(shù)據(jù)。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:還包括距離傳感模塊,所述距離傳感模塊用于檢測(cè)和計(jì)算與GPS模塊之間距離,并在檢測(cè)所得距離超出預(yù)設(shè)距離時(shí)生成觸發(fā)信號(hào)。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:還包括聲光報(bào)警模塊,所述聲光報(bào)警模塊用于根據(jù)控制模塊的控制信號(hào)進(jìn)行聲光報(bào)警。
進(jìn)一步地,作為本發(fā)明的一種優(yōu)選技術(shù)方案:還包括接收模塊,所述接收模塊用于接收GSM模塊所發(fā)送的當(dāng)前位置數(shù)據(jù)。
本發(fā)明采用上述技術(shù)方案,能產(chǎn)生如下技術(shù)效果:
(1)本發(fā)明提供一種基于語(yǔ)音識(shí)別的動(dòng)態(tài)定位監(jiān)控方法及系統(tǒng),能夠?qū)斎氲恼Z(yǔ)音信號(hào)進(jìn)行識(shí)別和判斷,可以在嘈雜的公共場(chǎng)合辨識(shí)聲音屬性,判斷是否處于危險(xiǎn)狀況,若處于危險(xiǎn)狀況,能夠在第一時(shí)間將定位獲取的用戶的當(dāng)前位置數(shù)據(jù)發(fā)送,幫助監(jiān)控用戶發(fā)現(xiàn)危險(xiǎn)情景,提高監(jiān)控的實(shí)時(shí)性和準(zhǔn)確性,為及時(shí)報(bào)警處理提供了良好途徑,給人身安全提供更好地保護(hù)。
(2)本發(fā)明選擇的語(yǔ)音模板庫(kù)是以目標(biāo)聲模板為基礎(chǔ),建立了可以反應(yīng)危險(xiǎn)情景的聲音數(shù)據(jù)庫(kù),提高語(yǔ)音識(shí)別范圍和準(zhǔn)確度。
(3)本發(fā)明系統(tǒng)架構(gòu)清晰、簡(jiǎn)單,易于實(shí)現(xiàn),可以有效提高動(dòng)態(tài)監(jiān)控作用,尤其是可以更好地用于用戶防止走失中。
附圖說(shuō)明
圖1為本發(fā)明基于語(yǔ)音識(shí)別的動(dòng)態(tài)定位監(jiān)控方法的流程示意圖。
圖2為本發(fā)明的方法中預(yù)處理過(guò)程的示意圖。
圖3為本發(fā)明基于語(yǔ)音識(shí)別的動(dòng)態(tài)定位監(jiān)控系統(tǒng)的模塊示意圖。
圖4為本發(fā)明的系統(tǒng)中語(yǔ)音傳感模塊的工作原理。
具體實(shí)施方式
下面結(jié)合說(shuō)明書(shū)附圖對(duì)本發(fā)明的實(shí)施方式進(jìn)行描述。
如圖1所示,本發(fā)明設(shè)計(jì)了一種基于語(yǔ)音識(shí)別的動(dòng)態(tài)定位監(jiān)控方法,該方法可根據(jù)輸入的語(yǔ)音信號(hào)判斷是否處在危險(xiǎn)狀況,在判斷為危險(xiǎn)時(shí)能在第一時(shí)間確定其位置。該方法具體包括如下步驟:
步驟1、實(shí)時(shí)定位獲取當(dāng)前位置數(shù)據(jù)。
步驟2、輸入語(yǔ)音信號(hào),及對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理獲得語(yǔ)音數(shù)字信號(hào);優(yōu)選地,對(duì)語(yǔ)音信號(hào)預(yù)處理如圖2所示,包括濾波、預(yù)加重、分幀加窗及端點(diǎn)檢測(cè)等處理過(guò)程。其中,預(yù)處理過(guò)程具體步驟為:
步驟2-1、進(jìn)行反混疊濾波處理。
對(duì)輸入的語(yǔ)音信號(hào),用反混疊的帶通濾波器對(duì)300-3400Hz的頻譜分量進(jìn)行濾波,去除噪聲等的干擾,之后對(duì)提取到的模擬信號(hào)進(jìn)行采樣,將時(shí)間上連續(xù)的語(yǔ)音信號(hào)離散化為一個(gè)樣本序列,得到離散的語(yǔ)音數(shù)字信號(hào)。根據(jù)香農(nóng)采樣定理,采樣頻率為8kHz。
步驟2-2、進(jìn)行預(yù)加重處理。
對(duì)步驟2-1中獲得的待識(shí)別的離散的語(yǔ)音數(shù)字信號(hào)x(n)按一階FIR高通濾波器處理,獲得:
H(z)=1-αz-1 (1)
其中,H(z)為傳遞函數(shù),α為預(yù)加重系數(shù),0.9<α<1.0。
設(shè)n時(shí)刻的語(yǔ)音采樣值為x(n),經(jīng)過(guò)預(yù)加重處理后為:
y(n)=x(n)-αx(n-1) (2)
經(jīng)過(guò)預(yù)加重得到的是語(yǔ)音數(shù)字信號(hào)。其中n表示待識(shí)別的情感數(shù)字語(yǔ)音離散點(diǎn)序號(hào),x(n)為n時(shí)刻的聲音采樣值,y(n)為預(yù)加重處理后的結(jié)果。
步驟2-3、進(jìn)行分幀加窗處理。
采用交疊分段的方法進(jìn)行分幀,前一幀與后一幀有交疊部分,稱為幀移,在此幀移取7ms,即在8kHz采樣頻率下取80個(gè)點(diǎn),每一幀長(zhǎng)取23ms,即取256個(gè)點(diǎn)。
為了進(jìn)行短時(shí)分析必須加窗,目的是減少幀起始和結(jié)束處的信號(hào)不連續(xù)性,分幀加窗之后獲得語(yǔ)音數(shù)字信號(hào)。
選擇漢明窗對(duì)語(yǔ)音信號(hào)進(jìn)行加窗處理,窗口函數(shù)如下:
其中,m表示每一幀數(shù)字語(yǔ)音離散點(diǎn)序號(hào),N表示每一幀數(shù)字語(yǔ)音離散點(diǎn)點(diǎn)數(shù),此處N=256。
步驟2-4、進(jìn)行端點(diǎn)檢測(cè)。
由危險(xiǎn)狀況下的語(yǔ)音識(shí)別是在嘈雜的鬧市,例如火車站,商場(chǎng)等人流密集的公共場(chǎng)合,針對(duì)這一點(diǎn),采用現(xiàn)有技術(shù)基于相關(guān)性的語(yǔ)音端點(diǎn)檢測(cè)算法。因語(yǔ)音信號(hào)具有相關(guān)性而背景噪聲無(wú)相關(guān)性,可以在復(fù)雜的應(yīng)用環(huán)境下的信號(hào)流中分辨出語(yǔ)音信號(hào)和非語(yǔ)音信號(hào),并確定語(yǔ)音信號(hào)的開(kāi)始及結(jié)束。
相關(guān)分析是一種常用的時(shí)域波形分析方法,分為自相關(guān)和互相關(guān)。相關(guān)函數(shù)檢測(cè)兩個(gè)信號(hào)在時(shí)域中的相關(guān)程度。互相關(guān)函數(shù)給出了在頻域內(nèi)兩個(gè)信號(hào)是否相關(guān)的一個(gè)判斷指標(biāo),把兩測(cè)點(diǎn)之間信號(hào)的互譜與各自的自譜聯(lián)系了起來(lái)。它能用來(lái)確定輸出信號(hào)有多大程度來(lái)自輸入信號(hào),對(duì)修正測(cè)量中接入噪聲源而產(chǎn)生的誤差非常有效。
對(duì)于離散的語(yǔ)音數(shù)字信號(hào),為確定與時(shí)移副本的相似度,其自相關(guān)函數(shù)定義為:
其中,k為移位距離。短時(shí)自相關(guān)函數(shù)是在自相關(guān)函數(shù)的基礎(chǔ)上將信號(hào)加窗獲得,即:
其中,i表示窗函數(shù)是從第i點(diǎn)開(kāi)始加入。N為窗長(zhǎng),k為移位距離,w(m)是偶對(duì)稱的窗函數(shù)。
步驟3、對(duì)所述語(yǔ)音數(shù)字信號(hào)進(jìn)行基于線性預(yù)測(cè)倒譜LPCC系數(shù)的特征參數(shù)提取,獲得語(yǔ)音特征參數(shù)。具體如下:
對(duì)預(yù)處理后的信號(hào)進(jìn)行特征提取,先將語(yǔ)音信號(hào)數(shù)字化,形成矢量序列,也即特征參數(shù)分析。選擇音強(qiáng)和音高倆個(gè)要素作為聲音信號(hào)的關(guān)鍵,用共振峰(頻率、帶寬、幅度)、短時(shí)平均能量、短時(shí)幅度和基音頻率四個(gè)主要參數(shù)分別表示音強(qiáng)和音高。由于倒頻譜能將頻譜上的高低頻分開(kāi),而被廣泛使用在語(yǔ)音識(shí)別上,所以使用線性預(yù)測(cè)倒譜LPCC系數(shù),原理簡(jiǎn)單,容易實(shí)現(xiàn)。同時(shí)使用梅爾頻率倒譜系數(shù)MFCC參數(shù)與上述參數(shù)提取結(jié)果進(jìn)行對(duì)比,可以使得提取的特征更精確。
對(duì)比結(jié)果表明,基于聲音屬性的危險(xiǎn)狀況識(shí)別比僅采用MFCC參數(shù)在識(shí)別率上有很大提高,更能反映聲音的本質(zhì)。
其中線性預(yù)測(cè)倒譜系數(shù)求得方法是根據(jù)AR模型對(duì)LPC參數(shù)進(jìn)行遞推,形成LPC倒譜。LPC倒譜就是復(fù)倒譜,就是信號(hào)通過(guò)Z變換以后取對(duì)數(shù),再求反Z變換而得到。線性預(yù)測(cè)分析方法是一種譜估計(jì)的方法,其聲道模型系統(tǒng)函數(shù)H(z)反映了聲道的頻率響應(yīng)和原始信號(hào)的譜包絡(luò),用lgH(z)做反Z變換即可求得LPC倒譜系數(shù)(LPCC)。在MATLAB語(yǔ)言處理工具箱中已經(jīng)提供LPC系數(shù)的函數(shù)。從而LPC倒譜系數(shù)其推導(dǎo)公式為:
式中ak為L(zhǎng)PC系數(shù),p為其階數(shù),取8~32階。h(n)為沖激響應(yīng),其復(fù)倒譜為
其中MFCC特征提取參數(shù)時(shí)把語(yǔ)音信號(hào)從時(shí)域轉(zhuǎn)換到頻域,再對(duì)加窗后的幀做快速傅里葉變換(FFT),求出每幀的頻譜系數(shù),將其通過(guò)一組N個(gè)(N一般為20~30個(gè))三角帶通濾波器組成的梅爾頻率濾波器,將每個(gè)頻帶的輸出取對(duì)數(shù),求出每個(gè)輸出的對(duì)數(shù)能量Ek,k=1,2,3...N。將這N個(gè)參數(shù)進(jìn)行余弦變換即可求出L階的MFCC參數(shù)。
步驟4、建立由目標(biāo)聲模板構(gòu)成的語(yǔ)音模板庫(kù)。由模板庫(kù)的目標(biāo)聲同樣經(jīng)過(guò)預(yù)處理和特征提取,形成目標(biāo)聲的參數(shù)模板,為后面的識(shí)別提供參考標(biāo)準(zhǔn)。同時(shí)選擇的數(shù)據(jù)庫(kù)是以典型影視中危險(xiǎn)情景下的音頻和目前較為認(rèn)可的語(yǔ)音以及異常聲音數(shù)據(jù)庫(kù)為基礎(chǔ),建立了專門(mén)的反應(yīng)危險(xiǎn)情景的聲音數(shù)據(jù)庫(kù)。
步驟5、構(gòu)建的人工神經(jīng)網(wǎng)絡(luò)模型,結(jié)合所建立的語(yǔ)音模板庫(kù)對(duì)所得語(yǔ)音特征參數(shù)識(shí)別判斷是否存在異常,及在判斷為存在異常時(shí)生成和發(fā)送控制信號(hào)。具體如下:
步驟5-1、提取語(yǔ)音特征參數(shù)中的特征參數(shù)組成特征向量;
步驟5-2、將所述特征向量輸入人工神經(jīng)網(wǎng)絡(luò)模型,利用人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行非線性運(yùn)算,求得隱單元節(jié)點(diǎn)數(shù);
步驟5-3、根據(jù)所述隱單元節(jié)點(diǎn)數(shù),判斷語(yǔ)音特征參數(shù)是否異常。
具體而言,使用人工神經(jīng)網(wǎng)絡(luò)模型,神經(jīng)元處理單元可表示不同的對(duì)象,在這里處理共振峰、短時(shí)平均能量、短時(shí)幅度和基音頻率。網(wǎng)絡(luò)中判斷單元的類型分為三類:錄入單元、輸出單元和隱單元。
錄入單元的個(gè)數(shù)取決于數(shù)據(jù)源的輸入維數(shù),即特征向量的維數(shù),在這里提取了4個(gè)語(yǔ)音參數(shù),如共振峰、短時(shí)平均能量、短時(shí)幅度和基音頻率組成四維特征向量,所以人工神經(jīng)網(wǎng)絡(luò)的錄入單元節(jié)點(diǎn)數(shù)為4。神經(jīng)網(wǎng)絡(luò)的輸出單元節(jié)點(diǎn)數(shù)有要分類的類別數(shù)確定,本發(fā)明主要識(shí)別是否有危險(xiǎn)狀況發(fā)生,即有危險(xiǎn)狀況和無(wú)危險(xiǎn)狀況發(fā)生,所以輸出層的節(jié)點(diǎn)數(shù)為2。情況為真時(shí)記為“1”,否則記為“0”。
隱單元節(jié)點(diǎn)數(shù)的確定是由求解問(wèn)題的要求、錄入輸出單元數(shù)多少有直接的關(guān)系。隱單元節(jié)點(diǎn)數(shù)過(guò)少,則無(wú)法產(chǎn)生足夠的連接權(quán)組合數(shù)來(lái)滿足若干樣本的學(xué)習(xí);隱單元節(jié)點(diǎn)數(shù)過(guò)多,則學(xué)習(xí)以后網(wǎng)絡(luò)的泛化能力變差。在適當(dāng)?shù)姆秶鷥?nèi)增加隱單元節(jié)點(diǎn)數(shù)能夠達(dá)到提高實(shí)驗(yàn)精度的目的。隱單元節(jié)點(diǎn)數(shù)往往根據(jù)前人設(shè)計(jì)所得經(jīng)驗(yàn)來(lái)確定。
而B(niǎo)P神經(jīng)網(wǎng)絡(luò)隱單元的節(jié)點(diǎn)數(shù)可有經(jīng)驗(yàn)公式:
其中n1表示隱單元節(jié)點(diǎn)數(shù),n表述錄入單元節(jié)點(diǎn)數(shù),m表示輸出單元節(jié)點(diǎn)數(shù),α為1到10之間的常數(shù),α的目的是保證隱含單元節(jié)點(diǎn)數(shù)的可變性,通過(guò)對(duì)比誤差,得到最佳的網(wǎng)絡(luò)模型。
網(wǎng)絡(luò)初始化時(shí),選取[-1,1]作為賦值區(qū)間,學(xué)習(xí)速率為0.01,取期望誤差為0.1。
人工神經(jīng)網(wǎng)絡(luò)以一定的學(xué)習(xí)準(zhǔn)則進(jìn)行學(xué)習(xí):如果網(wǎng)絡(luò)做出錯(cuò)誤的判決,則通過(guò)網(wǎng)絡(luò)的學(xué)習(xí),應(yīng)使得網(wǎng)絡(luò)減少下次犯同樣錯(cuò)誤的可能性。首先,給網(wǎng)絡(luò)的各連接權(quán)值賦予(0,1)區(qū)間的隨機(jī)值,將步驟4模板庫(kù)訓(xùn)練里的4個(gè)語(yǔ)音參數(shù)組成的四維特征矢量(共振峰、短時(shí)平均能量、短時(shí)幅度和基音頻率)輸入給網(wǎng)絡(luò),網(wǎng)絡(luò)將輸入模式加權(quán)求和、與門(mén)限比較、再進(jìn)行非線性運(yùn)算,得到網(wǎng)絡(luò)模型的輸出。得出輸出“1”和“0”概率各位50%,其中預(yù)先設(shè)置1為真即有危險(xiǎn)狀況發(fā)生,0為假;如果輸出正確,連接權(quán)值增大,以便下次能再次做出正確的操作。如果輸出錯(cuò)誤,則把網(wǎng)絡(luò)連接權(quán)值朝著減小綜合輸入加權(quán)值的方向調(diào)整,減少犯同樣錯(cuò)誤的可能。經(jīng)過(guò)若干次訓(xùn)練,人工神經(jīng)網(wǎng)絡(luò)的識(shí)別率將提高。
由此人工神經(jīng)網(wǎng)絡(luò)模型的錄入單元利用的就是步驟3的四個(gè)特征參數(shù),根據(jù)人工神經(jīng)網(wǎng)絡(luò)本身的學(xué)習(xí)準(zhǔn)則判斷識(shí)別錄入的語(yǔ)音是否存在異常,根據(jù)判斷結(jié)果認(rèn)定屬于危險(xiǎn)狀況情況。以及利用模版庫(kù)的聲音讓人工神經(jīng)網(wǎng)絡(luò)模型進(jìn)行學(xué)習(xí),提高人工神經(jīng)網(wǎng)絡(luò)識(shí)別的正確率。
人工神經(jīng)網(wǎng)絡(luò)訓(xùn)練完成之后即可對(duì)異常聲音作為是否危險(xiǎn)的判斷,判斷為危險(xiǎn)時(shí)向控制模塊發(fā)送觸發(fā)信號(hào),控制通過(guò)GSM模塊借助GSM網(wǎng)絡(luò)向監(jiān)控用戶發(fā)送由被監(jiān)控用戶的當(dāng)前定位數(shù)據(jù)組成的報(bào)警信號(hào)。
步驟6、根據(jù)控制信號(hào)將當(dāng)前位置數(shù)據(jù)發(fā)送,以完成動(dòng)態(tài)定位監(jiān)控。
由此,本方法能夠?qū)斎氲恼Z(yǔ)音信號(hào)進(jìn)行識(shí)別和判斷,可以在嘈雜的公共場(chǎng)合辨識(shí)聲音屬性,判斷是否處于危險(xiǎn)狀況,若處于危險(xiǎn)狀況,能夠在第一時(shí)間將定位獲取的用戶的當(dāng)前位置數(shù)據(jù)發(fā)送,完成被監(jiān)控用戶的動(dòng)態(tài)監(jiān)控,提高預(yù)警功能。
在此基礎(chǔ)上,本發(fā)明還提出一種基于語(yǔ)音識(shí)別的動(dòng)態(tài)定位監(jiān)控系統(tǒng),如圖3所示,該系統(tǒng)主要包括:GPS模塊、語(yǔ)音傳感模塊、控制模塊、GSM模塊;其中,GPS模塊、語(yǔ)音傳感模塊分別與控制模塊的輸入端相連,所述控制模塊的輸出端與GSM模塊,以及該些模塊可以設(shè)置于一個(gè)用于被監(jiān)控用戶攜帶的裝置中,且由裝置內(nèi)的電源模塊供電,利用獨(dú)立的開(kāi)關(guān)控制其供電。在系統(tǒng)中,所述控制模塊可以單片機(jī),采用STC89C52單片機(jī),功耗低,功能集成度高。
對(duì)于系統(tǒng)可以利用上述方法進(jìn)行動(dòng)態(tài)定位監(jiān)控。具體而言,所述GPS模塊,用于衛(wèi)星定位功能,主要進(jìn)行定位獲取當(dāng)前位置數(shù)據(jù)。語(yǔ)音傳感模塊將自動(dòng)和實(shí)時(shí)采集獲得語(yǔ)音信號(hào),經(jīng)過(guò)內(nèi)置的音頻放大得到信號(hào),信號(hào)經(jīng)過(guò)自動(dòng)增益控制放大后再進(jìn)行A/D轉(zhuǎn)換,即得到數(shù)字化的語(yǔ)音數(shù)據(jù),實(shí)現(xiàn)輸入和傳輸語(yǔ)音信號(hào);控制模塊,主要用于對(duì)接收到的語(yǔ)音信號(hào)進(jìn)行預(yù)處理獲得語(yǔ)音數(shù)字信號(hào),及對(duì)所述語(yǔ)音數(shù)字信號(hào)進(jìn)行基于線性預(yù)測(cè)倒譜LPCC系數(shù)的特征參數(shù)提取,獲得語(yǔ)音特征參數(shù);以及建立由目標(biāo)聲模板構(gòu)成的語(yǔ)音模板庫(kù),并構(gòu)建人工神經(jīng)網(wǎng)絡(luò)模型,結(jié)合所建立的語(yǔ)音模板庫(kù)對(duì)語(yǔ)音特征參數(shù)識(shí)別判斷是否存在異常,及在判斷為存在異常時(shí)生成和發(fā)送控制信號(hào);GSM模塊,用于根據(jù)控制信號(hào)將當(dāng)前位置數(shù)據(jù)發(fā)送,其通過(guò)GSM網(wǎng)絡(luò)向監(jiān)控用戶發(fā)送位置數(shù)據(jù)實(shí)現(xiàn)通信,該監(jiān)控用戶的數(shù)據(jù)可由控制模塊預(yù)存,需要啟動(dòng)發(fā)送功能時(shí)調(diào)取該預(yù)存的監(jiān)控用戶數(shù)據(jù)。即系統(tǒng)還包括接收模塊,所述接收模塊用于接收GSM模塊所發(fā)送的當(dāng)前位置數(shù)據(jù),該接收模塊可設(shè)置于監(jiān)控用戶所持的裝置中。
進(jìn)一步地,所述控制模塊的工作原理如圖4所示,優(yōu)選地包括依次連接的輸入單元、預(yù)處理單元、特征提取單元、模板庫(kù)建立單元和判斷單元。其中輸入單元對(duì)接收到的語(yǔ)音信號(hào)進(jìn)行預(yù)處理獲得語(yǔ)音數(shù)字信號(hào);預(yù)處理單元,用于對(duì)所述語(yǔ)音數(shù)字信號(hào)進(jìn)行基于線性預(yù)測(cè)倒譜LPCC系數(shù)的特征參數(shù)提?。荒0鎺?kù)建立單元,用于構(gòu)建的人工神經(jīng)網(wǎng)絡(luò)模型;判斷單元,用于結(jié)合所建立的語(yǔ)音模板庫(kù)對(duì)語(yǔ)音數(shù)字信號(hào)的特征參數(shù)是否異常判斷識(shí)別,及在判斷為異常時(shí)生成和發(fā)送控制信號(hào)。
進(jìn)一步地,本系統(tǒng)還可以包括按鍵模塊,所述按鍵模塊與GPS模塊相連,用于控制GPS模塊獲取當(dāng)前位置數(shù)據(jù)。當(dāng)按下按鍵模塊時(shí),GPS模塊自動(dòng)獲取當(dāng)前位置傳送給控制模塊,控制模塊再通過(guò)GSM模塊向監(jiān)控用戶的手機(jī)發(fā)送當(dāng)前位置。
優(yōu)選地,本系統(tǒng)還可以包括距離傳感模塊,所述距離傳感模塊用于檢測(cè)和計(jì)算與GPS模塊之間距離。其原理是設(shè)定監(jiān)控用戶與被監(jiān)控用戶之間的安全距離,如設(shè)定離開(kāi)監(jiān)護(hù)人5m或是10m的距離時(shí)就發(fā)出警報(bào)信息,那么利用距離傳感模塊檢測(cè),當(dāng)GPS模塊的定位數(shù)據(jù)與該距離傳感模塊傳感得到的距離計(jì)算差值超出設(shè)定范圍距離時(shí),即距離傳感模塊檢測(cè)不到信號(hào)時(shí),可以生成觸發(fā)信號(hào)使得控制模塊可以向監(jiān)控用戶發(fā)出報(bào)警信息。
以及,還可以包括聲光報(bào)警模塊,所述聲光報(bào)警模塊用于根據(jù)控制模塊的控制信號(hào)進(jìn)行聲光報(bào)警。即聲光報(bào)警模塊可直接設(shè)置于被監(jiān)控用戶攜帶的裝置中,當(dāng)控制模塊獲得判斷識(shí)別結(jié)果時(shí),或由距離傳感模塊檢測(cè)到距離超出時(shí),或是按下按鍵模塊時(shí),向控制模塊發(fā)送觸發(fā)信號(hào),可以控制聲光報(bào)警模塊進(jìn)行實(shí)時(shí)語(yǔ)音和聲光報(bào)警,聲光報(bào)警模塊閃爍向周圍人發(fā)出警報(bào)信號(hào)。
本系統(tǒng)可對(duì)輸入的語(yǔ)音信號(hào)進(jìn)行識(shí)別和判斷,判斷是否處于異常,即危險(xiǎn)狀況,若處于危險(xiǎn)狀況,能夠在第一時(shí)間將定位獲取的用戶的當(dāng)前位置數(shù)據(jù)發(fā)送,幫助監(jiān)控用戶發(fā)現(xiàn)危險(xiǎn)情景。可以有效地用于用戶防走丟失的過(guò)程,由監(jiān)控用戶攜帶的裝置中語(yǔ)音傳感模塊向控制模塊發(fā)送信號(hào),將控制模塊可通過(guò)GSM網(wǎng)絡(luò)向監(jiān)護(hù)用戶報(bào)警。
綜上,本發(fā)明提供一種基于語(yǔ)音識(shí)別的動(dòng)態(tài)定位監(jiān)控方法及系統(tǒng),以目標(biāo)聲模板為基礎(chǔ),建立了可以反應(yīng)危險(xiǎn)情景的聲音數(shù)據(jù)庫(kù),提高語(yǔ)音識(shí)別范圍和準(zhǔn)確度;能夠?qū)斎氲恼Z(yǔ)音信號(hào)進(jìn)行識(shí)別和判斷,判斷是否處于危險(xiǎn)狀況,若處于危險(xiǎn)狀況,能夠在第一時(shí)間將定位獲取的用戶的當(dāng)前位置數(shù)據(jù)發(fā)送,幫助監(jiān)控用戶發(fā)現(xiàn)危險(xiǎn)情景,提高監(jiān)控的實(shí)時(shí)性和準(zhǔn)確性。系統(tǒng)架構(gòu)清晰、簡(jiǎn)單,易于實(shí)現(xiàn),可以有效提高動(dòng)態(tài)監(jiān)控作用,尤其是可以更好地用于用戶防止走失中。
上面結(jié)合附圖對(duì)本發(fā)明的實(shí)施方式作了詳細(xì)說(shuō)明,但是本發(fā)明并不限于上述實(shí)施方式,在本領(lǐng)域普通技術(shù)人員所具備的知識(shí)范圍內(nèi),還可以在不脫離本發(fā)明宗旨的前提下做出各種變化。