一種音頻識(shí)別報(bào)警系統(tǒng)及方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及安防技術(shù)領(lǐng)域,特別涉及一種音頻識(shí)別報(bào)警系統(tǒng)及方法。
【背景技術(shù)】
[0002] 生活環(huán)境中在一些偶發(fā)的事件中(如搶劫等),人受到驚嚇?biāo)查g,由于事件的突發(fā) 性及受到驚嚇,往往會(huì)手足無措,但出于本能往往會(huì)條件性的尖叫呼喊聲,而本發(fā)明技術(shù)應(yīng) 用音頻聲紋檢測(cè)技術(shù)及時(shí)的拾取加以識(shí)別,并輸出信號(hào)來對(duì)事件進(jìn)行及時(shí)的處理。
【發(fā)明內(nèi)容】
[0003] 本發(fā)明所要解決的技術(shù)問題是提供一種能采集檢測(cè)出環(huán)境音中異常的尖叫、慘叫 聲,尖叫、慘叫聲檢測(cè)精度高,并能進(jìn)行報(bào)警的音頻識(shí)別報(bào)警系統(tǒng)及方法。
[0004] 本發(fā)明解決上述技術(shù)問題的技術(shù)方案如下:一種音頻識(shí)別報(bào)警系統(tǒng),包括: 采集模塊,用于采集音頻數(shù)據(jù); 第一音頻匹配模塊,用于對(duì)音頻數(shù)據(jù)依次進(jìn)行模數(shù)轉(zhuǎn)換、初次特征選取和分析,生成第 一聲紋數(shù)據(jù),將第一聲紋數(shù)據(jù)與設(shè)定聲紋數(shù)據(jù)通過一級(jí)匹配模型進(jìn)行初次匹配,提取初次 匹配成功的音頻數(shù)據(jù); 第二音頻匹配模塊,用于對(duì)初次匹配成功的音頻數(shù)據(jù)進(jìn)行二次特征選取和分析,生成 第二聲紋數(shù)據(jù),將第二成聲紋數(shù)據(jù)與設(shè)定聲紋數(shù)據(jù)通過二級(jí)匹配模型進(jìn)行二次匹配,匹配 成功則生成報(bào)警數(shù)據(jù); 報(bào)警模塊,用于根據(jù)報(bào)警數(shù)據(jù)進(jìn)行報(bào)警。
[0005] 本發(fā)明的有益效果是:第一音頻匹配模塊對(duì)音頻數(shù)據(jù)進(jìn)行初步的匹配,將不匹配 的音頻數(shù)據(jù)進(jìn)行過濾掉,匹配的音頻數(shù)據(jù)傳送至第二音頻匹配模塊進(jìn)行二次匹配,匹配成 功后通過報(bào)警模塊進(jìn)行報(bào)警;通過兩次音頻數(shù)據(jù)匹配,能有效提升聲音檢測(cè)的精準(zhǔn)度;再者 通過采集模塊、第一音頻匹配模塊、第二音頻匹配模塊和報(bào)警模塊的協(xié)調(diào)運(yùn)作,能采集檢測(cè) 出環(huán)境音中異常的尖叫、慘叫聲,并能進(jìn)行報(bào)警。
[0006] 在上述技術(shù)方案的基礎(chǔ)上,本發(fā)明還可以做如下改進(jìn)。
[0007] 進(jìn)一步,還包括黑白名單訓(xùn)練模塊,所述黑白名單訓(xùn)練模塊用于采集第二聲紋數(shù) 據(jù),對(duì)第二聲紋數(shù)據(jù)進(jìn)行篩選和分析,將符合尖叫音頻標(biāo)準(zhǔn)的第二聲紋數(shù)據(jù)錄入白名單,將 不符合尖叫音頻標(biāo)準(zhǔn)的第二聲紋數(shù)據(jù)錄入黑名單,并將白名單內(nèi)的第二聲紋數(shù)據(jù)輸入所述 第二音頻匹配模塊內(nèi)作為設(shè)定聲紋數(shù)據(jù)。
[0008] 采用上述進(jìn)一步方案的有益效果是:黑白名單訓(xùn)練模塊能有效錄入音頻數(shù)據(jù),并 進(jìn)行篩選分析,并將篩選出的音頻數(shù)據(jù)作為設(shè)定聲紋數(shù)據(jù),第二音頻匹配模塊根據(jù)設(shè)定聲 紋數(shù)據(jù)進(jìn)行匹配,能有效提高數(shù)據(jù)處理的精確度,從而實(shí)現(xiàn)精準(zhǔn)識(shí)別尖叫求救聲,進(jìn)行報(bào) 警。
[0009] 進(jìn)一步,所述第一音頻匹配模塊包括模數(shù)轉(zhuǎn)換單元、第一聲紋數(shù)據(jù)單元和第一數(shù) 據(jù)匹配單元,所述模數(shù)轉(zhuǎn)換單元將音頻模擬數(shù)據(jù)轉(zhuǎn)換成音頻數(shù)字?jǐn)?shù)據(jù);所述第一聲紋數(shù)據(jù) 單元用于將模數(shù)轉(zhuǎn)換后的音頻數(shù)據(jù)進(jìn)行初次特征選取和分析,生成第一聲紋數(shù)據(jù);第一數(shù) 據(jù)匹配單元用于將第一聲紋數(shù)據(jù)與尖叫聲紋數(shù)據(jù)通過一級(jí)匹配模型進(jìn)行初次匹配,提取初 次匹配成功的音頻數(shù)據(jù)。
[0010] 采用上述進(jìn)一步方案的有益效果是:通過模數(shù)轉(zhuǎn)換單元、第一聲紋數(shù)據(jù)單元和第 一數(shù)據(jù)匹配單元的協(xié)調(diào)運(yùn)作,能有效實(shí)現(xiàn)對(duì)采集的音頻數(shù)據(jù)進(jìn)行一次匹配過濾,提升識(shí)別 尖叫求救聲的精準(zhǔn)度。
[0011] 進(jìn)一步,所述第二音頻匹配模塊包括數(shù)據(jù)接收單元、第二聲紋數(shù)據(jù)單元、第二數(shù)據(jù) 匹配單元和數(shù)據(jù)返回單元,所述數(shù)據(jù)接收單元用于采集初次匹配成功的音頻信號(hào);所述第 二聲紋數(shù)據(jù)單元用于將初次匹配成功的音頻數(shù)據(jù)進(jìn)行二次特征選取和分析,生成第二聲紋 數(shù)據(jù);所述第二數(shù)據(jù)匹配單元用于將第二成聲紋數(shù)據(jù)與尖叫聲紋數(shù)據(jù)通過二級(jí)匹配模型進(jìn) 行二次匹配,當(dāng)二次匹配成功時(shí),生成警報(bào)信號(hào);所述數(shù)據(jù)返回單元用于將報(bào)警數(shù)據(jù)通過所 述第一音頻匹配模塊傳輸至報(bào)警模塊。
[0012] 采用上述進(jìn)一步方案的有益效果是:通過數(shù)據(jù)接收單元、第二聲紋數(shù)據(jù)單元、第二 數(shù)據(jù)匹配單元和數(shù)據(jù)返回單元的協(xié)調(diào)運(yùn)作,能有效實(shí)現(xiàn)對(duì)音頻數(shù)據(jù)的二次檢測(cè)識(shí)別,提高 對(duì)尖叫聲的精準(zhǔn)識(shí)別,提升報(bào)警的準(zhǔn)確度。
[0013] 進(jìn)一步,所述一級(jí)匹配模型和二級(jí)匹配模型均包括高斯混合模型,高斯混合模型 具體為:
式中,1為GMM模型的參數(shù)集;〇為1(維的聲學(xué)特征矢量;i為隱狀態(tài)號(hào),也就是高斯分量 的序號(hào),Μ階GMM就有Μ個(gè)隱狀態(tài);c為第f個(gè)分量的混合權(quán)值,其值對(duì)應(yīng)為隱狀態(tài)i的先驗(yàn)概 率。
[0014]采用上述進(jìn)一步方案的有益效果是:高斯混合模型能有效對(duì)音頻信號(hào)進(jìn)行數(shù)據(jù)處 理,便于音頻數(shù)據(jù)的匹配識(shí)別,提升匹配精度。
[0015] 進(jìn)一步,所述第一音頻匹配模塊與所述第二音頻匹配模塊通過網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳 輸。
[0016] 采用上述進(jìn)一步方案的有益效果是:可以實(shí)現(xiàn)第一音頻匹配模塊和第二音頻匹配 模塊進(jìn)行遠(yuǎn)距離傳輸,擴(kuò)大了適用范圍。
[0017] 進(jìn)一步,還包括聲音強(qiáng)度檢測(cè)模塊,所述聲音強(qiáng)度檢測(cè)模塊用于對(duì)采集音頻數(shù)據(jù) 進(jìn)行聲音強(qiáng)度檢測(cè),當(dāng)聲音強(qiáng)度超過設(shè)定標(biāo)準(zhǔn),將采集音頻數(shù)據(jù)傳輸至第一音頻匹配模塊。
[0018] 采用上述進(jìn)一步方案的有益效果是:聲音強(qiáng)度檢測(cè)模塊能對(duì)聲音小的一些雜音進(jìn) 行過濾,消除干擾,保證音頻資料兩次匹配的精準(zhǔn)度。
[0019] 本發(fā)明解決上述技術(shù)問題的另一技術(shù)方案如下:一種尖叫音頻識(shí)別方法,包括 采集音頻數(shù)據(jù),第一音頻匹配模塊對(duì)音頻數(shù)據(jù)依次進(jìn)行模數(shù)轉(zhuǎn)換、初次特征選取和分 析,生成第一聲紋數(shù)據(jù),將第一聲紋數(shù)據(jù)與設(shè)定聲紋數(shù)據(jù)通過一級(jí)匹配模型進(jìn)行初次匹配, 提取初次匹配成功的音頻數(shù)據(jù); 對(duì)初次匹配成功的音頻數(shù)據(jù)進(jìn)行二次特征選取和分析,生成第二聲紋數(shù)據(jù),將第二成 聲紋數(shù)據(jù)與設(shè)定聲紋數(shù)據(jù)通過二級(jí)匹配模型進(jìn)行二次匹配,匹配成功則生成報(bào)警數(shù)據(jù),根 據(jù)報(bào)警數(shù)據(jù)進(jìn)行報(bào)警。
[0020] 本發(fā)明的有益效果是:第一音頻匹配模塊對(duì)音頻數(shù)據(jù)進(jìn)行初步的匹配,將不匹配 的音頻數(shù)據(jù)進(jìn)行過濾掉,匹配的音頻數(shù)據(jù)傳送至第二音頻匹配模塊進(jìn)行二次匹配,匹配成 功后通過報(bào)警模塊進(jìn)行報(bào)警;通過兩次音頻數(shù)據(jù)匹配,能有效提升聲音檢測(cè)的精準(zhǔn)度;再者 通過采集模塊、第一音頻匹配模塊、第二音頻匹配模塊和報(bào)警模塊的協(xié)調(diào)運(yùn)作,能采集檢測(cè) 出環(huán)境音中異常的尖叫、慘叫聲,并能進(jìn)行報(bào)警。
【附圖說明】
[0021] 圖1為本發(fā)明一種音頻識(shí)別報(bào)警系統(tǒng)的模塊框圖; 圖2為本發(fā)明一種音頻識(shí)別報(bào)警系統(tǒng)的流程圖。
[0022] 附圖中,各標(biāo)號(hào)所代表的部件列表如下: 1、 采集模塊; 2、 第一音頻匹配模塊,21、模數(shù)轉(zhuǎn)換單元,22、第一聲紋數(shù)據(jù)單元,23、第一數(shù)據(jù)匹配單 元; 3、 第二音頻匹配模塊,31、數(shù)據(jù)接收單元,32、第二聲紋數(shù)據(jù)單元,33、第二數(shù)據(jù)匹配單 元,34、數(shù)據(jù)返回單元; 4、 報(bào)警模塊,5、黑白名單訓(xùn)練模塊,6、聲音強(qiáng)度檢測(cè)模塊。
【具體實(shí)施方式】
[0023] 以下結(jié)合附圖對(duì)本發(fā)明的原理和特征進(jìn)行描述,所舉實(shí)例只用于解釋本發(fā)明,并 非用于限定本發(fā)明的范圍。
[0024] 如圖1所示,一種音頻識(shí)別報(bào)警系統(tǒng),包括: 采集模塊1,用于采集音頻數(shù)據(jù); 第一音頻匹配模塊2,用于對(duì)音頻數(shù)據(jù)依次進(jìn)行模數(shù)轉(zhuǎn)換、初次特征選取和分析,生成 第一聲紋數(shù)據(jù),將第一聲紋數(shù)據(jù)與設(shè)定聲紋數(shù)據(jù)通過一級(jí)匹配模型進(jìn)行初次匹配,提取初 次匹配成功的音頻數(shù)據(jù); 第二音頻匹配模塊3,用于對(duì)初次匹配成功的音頻數(shù)據(jù)進(jìn)行二次特征選取和分析,生成 第二聲紋數(shù)據(jù),將第二成聲紋數(shù)據(jù)與設(shè)定聲紋數(shù)據(jù)通過二級(jí)匹配模型進(jìn)行二次匹配,匹配 成功則生成報(bào)警數(shù)據(jù); 報(bào)警模塊4,用于根據(jù)報(bào)警數(shù)據(jù)進(jìn)行報(bào)警。
[0025]優(yōu)選的,還包括黑白名單訓(xùn)練模塊5,所述黑白名單訓(xùn)練模塊5用于采集第二聲紋 數(shù)據(jù),對(duì)第二聲紋數(shù)據(jù)進(jìn)行篩選和分析,將符合尖叫音頻標(biāo)準(zhǔn)的第二聲紋數(shù)據(jù)錄入白名單, 將不符合尖叫音頻標(biāo)準(zhǔn)的第二聲紋數(shù)據(jù)錄入黑名單,并將白名單內(nèi)的第二聲紋數(shù)據(jù)輸入所 述第二音頻匹配模塊3內(nèi)作為設(shè)定聲紋數(shù)據(jù);黑白名單訓(xùn)練模塊5能有效錄入音頻數(shù)據(jù),并 進(jìn)行篩選分析,并將篩選出的音頻數(shù)據(jù)作為設(shè)定聲紋數(shù)據(jù),第二音頻匹配模塊3根據(jù)設(shè)定聲 紋數(shù)據(jù)進(jìn)行匹配,能有效提高數(shù)據(jù)處理的精確度,從而實(shí)現(xiàn)精準(zhǔn)識(shí)別尖叫求救聲,進(jìn)行報(bào) 警。
[0026]優(yōu)選的,所述第一音頻匹配模塊2包括模數(shù)轉(zhuǎn)換單元21、第一聲紋數(shù)據(jù)單元22和第 一數(shù)據(jù)匹配單元23,所述模數(shù)轉(zhuǎn)換單元21將音頻模擬數(shù)據(jù)轉(zhuǎn)換成音頻數(shù)字?jǐn)?shù)據(jù);所述第一 聲紋數(shù)據(jù)單元22用于將模數(shù)轉(zhuǎn)換后的音頻數(shù)據(jù)進(jìn)行初次特征選取和分析,生成第一聲紋數(shù) 據(jù);第一數(shù)據(jù)匹配單元23用于將第一聲紋數(shù)據(jù)與尖叫聲紋數(shù)據(jù)通過一級(jí)匹配模型進(jìn)行初次 匹配,提取初次匹配成功的音頻數(shù)據(jù);通過模數(shù)轉(zhuǎn)換單元21、第一聲紋數(shù)據(jù)單元22和第一數(shù) 據(jù)匹配單元23的協(xié)調(diào)運(yùn)作,能有效實(shí)現(xiàn)對(duì)采集的音頻數(shù)據(jù)進(jìn)行一次匹配過濾,提升識(shí)別尖 口 Η、慘叫求救聲的精準(zhǔn)度。
[0027] 優(yōu)選的,所述第二音頻匹配模塊3包括數(shù)據(jù)接收單元31、第二聲紋數(shù)據(jù)單元32、第 二數(shù)據(jù)匹配單元33和數(shù)據(jù)返回單元34,所述數(shù)據(jù)接收單元31用于采集初次匹配成功的音頻 信號(hào);所述第二聲紋數(shù)據(jù)單元32用于將初次匹配成功的音頻數(shù)據(jù)進(jìn)行二次特征選取和分 析,生成第二聲紋數(shù)據(jù);所述第二數(shù)據(jù)匹配單元33用于將第二成聲紋數(shù)據(jù)與尖叫聲紋數(shù)據(jù) 通過二級(jí)匹配模型進(jìn)行二次匹配,當(dāng)二次匹配成功時(shí),生成警報(bào)信號(hào);所述數(shù)據(jù)返回單元34 用于將報(bào)警數(shù)據(jù)通過所述第一音頻匹配模塊2傳輸至報(bào)警模塊4;通過數(shù)據(jù)接收單元31、第 二聲紋數(shù)據(jù)單元32、第二數(shù)據(jù)匹配單元33和數(shù)據(jù)返回單元34的協(xié)調(diào)運(yùn)作,能有效實(shí)現(xiàn)對(duì)音 頻數(shù)據(jù)的二次檢測(cè)識(shí)別,提高對(duì)尖叫聲的精準(zhǔn)識(shí)別,提升報(bào)警的準(zhǔn)確度。
[0028] 優(yōu)選的,所述一級(jí)匹配模型和二級(jí)匹配模型均包括高斯混合模型,高斯混合模型 具體為:
式中,1為GMM模型的參數(shù)集;〇為1(維的聲學(xué)特征矢量;i為隱狀態(tài)號(hào),也就是高斯分量 的序號(hào),Μ階GMM就有Μ個(gè)隱狀態(tài);c為第f個(gè)分量的混合權(quán)值,其值對(duì)應(yīng)為隱狀態(tài)i的先驗(yàn)概 率。
[0029] 式中的料)為高斯混合分量,是巧_著心4_:的簡(jiǎn)寫形式,對(duì)應(yīng)隱狀態(tài)i的 觀察概率密度函數(shù),一般采用K維單高斯分布函數(shù),如下式所示
式中,藥為均值矢量:Σ i為協(xié)方差矩陣,i=l,2,…,M。因此該公式可以理解為,Μ階GMM 是用Μ個(gè)單高斯分布的線性組合來