專利名稱:一種基于腳步聲識(shí)別的智能門禁系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明屬于人工智能領(lǐng)域和安防領(lǐng)域,尤其涉及一種基于腳步聲識(shí) 別的智能門禁系統(tǒng)。
背景技術(shù):
近年來(lái),在生物識(shí)別技術(shù)領(lǐng)域中,聲紋識(shí)別技術(shù)以其獨(dú)特的方便性、 經(jīng)濟(jì)性和準(zhǔn)確性等優(yōu)勢(shì)受到世人矚目,并日益成為人們?nèi)粘I詈凸ぷ?中重要且普及的安全驗(yàn)證方式。
聲紋識(shí)別屬于生物識(shí)別技術(shù)的一種,是一項(xiàng)根據(jù)語(yǔ)音波形中反映說 話人生理和行為特征的語(yǔ)音參數(shù),自動(dòng)識(shí)別說話人身份的技術(shù)。與語(yǔ)音 識(shí)別不同的是,聲紋識(shí)別利用的是語(yǔ)音信號(hào)中的說話人信息,而不考慮
語(yǔ)音中的字詞意思,它強(qiáng)調(diào)說話人的個(gè)性;而語(yǔ)音識(shí)別的目的是識(shí)別出語(yǔ) 音信號(hào)中的言語(yǔ)內(nèi)容,并不考慮說話人是誰(shuí),它強(qiáng)調(diào)共性。
聲紋識(shí)別系統(tǒng)主要包括兩部分,即特征檢測(cè)和模式匹配。特征檢測(cè) 的任務(wù)是選取唯一表現(xiàn)說話人身份的有效且穩(wěn)定可靠的特征,模式匹配 的任務(wù)是對(duì)訓(xùn)練和識(shí)別時(shí)的特征模式做相似性匹配。
對(duì)聲紋識(shí)別的研究始于20世紀(jì)30年代。早期的工作主要集中在人 耳聽辨實(shí)驗(yàn)和探討聽音識(shí)別的可能性方面。隨著研究手段和工具的改 進(jìn),研究工作逐漸脫離了單純的人耳聽辨。Bdl實(shí)驗(yàn)室的L.G Kesta目 視觀察語(yǔ)譜圖進(jìn)行識(shí)別,提出了 "聲紋(voiceprint)"的概念。之后,電 子技術(shù)和計(jì)算機(jī)技術(shù)的發(fā)展,使通過機(jī)器自動(dòng)識(shí)別人的聲音成為可能。 Bdl實(shí)驗(yàn)室的S. Pruzansky提出了基于模式匹配和概率統(tǒng)計(jì)方差分析的 聲紋識(shí)別方法,而引起信號(hào)處理領(lǐng)域許多學(xué)者的注意,形成了聲紋識(shí)別 研究的一個(gè)高潮,其間的工作主要集中在各種識(shí)別參數(shù)的提取、選擇和 實(shí)驗(yàn)上,并將倒譜和線性預(yù)測(cè)分析等方法應(yīng)用于聲紋識(shí)別。
70年代末至今,聲紋識(shí)別的研究重點(diǎn)轉(zhuǎn)向?qū)Ω鞣N聲學(xué)參數(shù)的線性或 非線性處理以及新的模式匹配方法上,如動(dòng)態(tài)時(shí)間規(guī)整、主成分分析、 隱馬爾可夫模型、神經(jīng)網(wǎng)絡(luò)和多特征組合等技術(shù)。如今,聲紋識(shí)別技術(shù) 已逐漸走入實(shí)際應(yīng)用,AT&T應(yīng)用聲紋識(shí)別技術(shù)研制出了智慧卡(smart card),已應(yīng)用于自動(dòng)提款機(jī)。
門禁是安防行業(yè)重要的一個(gè)領(lǐng)域,門禁系統(tǒng)在安防行業(yè)內(nèi),其銷售 額僅次于監(jiān)控類,位居第二。目前整體市場(chǎng)規(guī)模和總體銷售額增長(zhǎng)較快, 預(yù)計(jì)在未來(lái)幾年內(nèi),門禁市場(chǎng)的需求量將呈持續(xù)增長(zhǎng)態(tài)勢(shì)。但是現(xiàn)今的 智能門禁系統(tǒng)主要是采用感應(yīng)卡,人臉識(shí)別,指紋識(shí)別,密碼等方式實(shí) 現(xiàn)身份識(shí)別。
雖然聲紋識(shí)別的技術(shù)研究和應(yīng)用開發(fā)如火如荼,但是將聲紋技術(shù)應(yīng) 用于腳步聲識(shí)別實(shí)現(xiàn)智能門禁系統(tǒng)還是一種全新的技術(shù)方案。
發(fā)明內(nèi)容
本發(fā)明的目的在于彌補(bǔ)現(xiàn)有技術(shù)的不足,提供一種對(duì)人的腳步聲進(jìn) 行特征提取、比對(duì)、識(shí)別和確認(rèn),實(shí)現(xiàn)對(duì)目標(biāo)人員的身份有效驗(yàn)證,并 進(jìn)行放行、拒絕、記錄、報(bào)警等操作的出入口控制系統(tǒng),以實(shí)現(xiàn)現(xiàn)代智 能建筑中門禁系統(tǒng)的智能化。
本發(fā)明的目的通過以下技術(shù)方案予以實(shí)現(xiàn) 本發(fā)明提供的一種基于腳步聲識(shí)別的智能門控系統(tǒng),包括
1) 用于腳步聲采集和預(yù)處理的腳步聲采集系統(tǒng),包括-用于采集聲音信息的麥克風(fēng);
用于對(duì)采集到的聲音進(jìn)行預(yù)處理,濾除不屬于腳步聲頻率范圍的噪 音的腳步聲預(yù)處理模塊,該模塊還實(shí)現(xiàn)實(shí)時(shí)控制系統(tǒng)功耗,當(dāng)長(zhǎng)時(shí)間沒 有聲音信息時(shí),該模塊將控制系統(tǒng)進(jìn)入休眠狀態(tài)以減少功耗;
2) 用于對(duì)腳步聲識(shí)別處理和特征訓(xùn)練的腳步聲識(shí)別處理系統(tǒng),包
括
通過腳步聲特征,包括頻譜、倒頻譜、共振峰、基音、反射系數(shù)、 節(jié)奏以及速度的提取、比對(duì)、識(shí)別和確認(rèn),判別來(lái)訪者的身份,并通知 識(shí)別結(jié)果處理系統(tǒng)進(jìn)行相應(yīng)操作的腳步聲識(shí)別處理模塊;
用于建立身份特征庫(kù)的腳步聲特征訓(xùn)練模塊,通過腳步聲特征訓(xùn) 練,多次采集,統(tǒng)計(jì)腳步聲特征并提取腳步聲特征,建立特征參數(shù)模型 并保存相應(yīng)的參數(shù);
3)用于對(duì)識(shí)別結(jié)果進(jìn)行處理的識(shí)別結(jié)果處理系統(tǒng),包括
用于接收來(lái)自腳步聲識(shí)別處理系統(tǒng)的結(jié)果,進(jìn)行日志記錄的識(shí)別日 志記錄模塊;
用于接收來(lái)自腳步聲識(shí)別處理系統(tǒng)的結(jié)果,控制門開關(guān)動(dòng)作的門禁 模塊,該模塊設(shè)置有定時(shí)器,如果門長(zhǎng)時(shí)間處于開放狀態(tài),將進(jìn)行報(bào)警;
當(dāng)身份驗(yàn)證不通過,開門逾時(shí)或用戶有非法操作時(shí),進(jìn)行報(bào)警的報(bào) 警模塊。
腳步聲采集系統(tǒng)與腳步聲識(shí)別處理系統(tǒng)連接;腳步聲識(shí)別處理系統(tǒng) 連接到識(shí)別結(jié)果處理系統(tǒng)上。
本發(fā)明對(duì)腳步聲的采集和預(yù)處理主要采用信號(hào)調(diào)理和信號(hào)采集,濾 波、提取語(yǔ)音特征矢量、頻譜分析技術(shù),完成將提取的腳步聲特征矢量 量化成標(biāo)準(zhǔn)腳步聲特征矢量,因此腳步聲采集系統(tǒng)主要包括聲/電轉(zhuǎn) 換、信號(hào)調(diào)理和采樣、語(yǔ)音預(yù)處理、特征提取以及矢量量化信號(hào)處理過 程。
腳步聲識(shí)別處理模塊是本發(fā)明整個(gè)系統(tǒng)的核心,由于腳步聲本身的 聲學(xué)特征,本模塊的算法在現(xiàn)有聲紋識(shí)別算法的基礎(chǔ)上進(jìn)行了優(yōu)化。基 本原理是采用端點(diǎn)檢測(cè),濾波,LPC, LPC倒譜以及模板匹配。
本發(fā)明的腳步聲特征訓(xùn)練主要采用概率統(tǒng)計(jì)技術(shù),將多次采集、提
取的腳步聲特征標(biāo)準(zhǔn)量進(jìn)行參數(shù)評(píng)估,提取最佳的腳步聲特征標(biāo)準(zhǔn)矢 量,因此腳步聲特征訓(xùn)練模塊主要包括概率統(tǒng)計(jì)、參數(shù)評(píng)估處理過程。 本發(fā)明具有以下有益效果
(1) 在日常生活及工作環(huán)境中,通過腳步聲識(shí)別進(jìn)行門禁身份驗(yàn)證, 相比感應(yīng)卡、指紋識(shí)別、密碼等識(shí)別方式,無(wú)須人工干預(yù),更加方便快 捷,節(jié)省人們的寶貴時(shí)間。
(2) 通過腳步聲識(shí)別進(jìn)行門禁身份驗(yàn)證,相比人臉識(shí)別技術(shù),系統(tǒng) 的運(yùn)算量更小,節(jié)省了系統(tǒng)的功耗,并且對(duì)系統(tǒng)的內(nèi)存等硬件要求更低。
(3) 安全智能,對(duì)于非法身份驗(yàn)證可以查到歷史記錄,并可以自動(dòng) 報(bào)警。
圖1是本發(fā)明實(shí)施例的組成框圖2是本發(fā)明腳步聲特征訓(xùn)練模塊關(guān)鍵算法的流程圖; 圖3是本發(fā)明腳步聲識(shí)別處理模塊關(guān)鍵算法的流程圖; 圖4是本發(fā)明應(yīng)用于智能控制門禁系統(tǒng)的示意圖。
具體實(shí)施例方式
下面將結(jié)合實(shí)施例和附圖對(duì)本發(fā)明作進(jìn)一步的詳細(xì)描述 本發(fā)明的結(jié)構(gòu)示意圖如附圖1所示,由麥克風(fēng),腳步聲預(yù)處理模塊, 腳步聲識(shí)別處理模塊,腳步聲特征訓(xùn)練模塊,識(shí)別日志記錄模塊,門禁 模塊以及報(bào)警模塊組成。本實(shí)施例的基于腳步聲識(shí)別的智能門禁系統(tǒng)包 括以下組件
1)用于腳步聲采集和預(yù)處理的腳步聲采集系統(tǒng),包括-用于采集聲音信息的麥克風(fēng);
用于對(duì)采集到的聲音進(jìn)行預(yù)處理,濾除不屬于腳步聲頻率范圍的噪 音,實(shí)時(shí)控制系統(tǒng)功耗的腳步聲預(yù)處理模塊;
) 用于對(duì)腳步聲識(shí)別處理和特征訓(xùn)練的腳步聲識(shí)別處理系統(tǒng),包
括
通過腳步聲特征提取,比對(duì),識(shí)別和確認(rèn),判別來(lái)訪者的身份,并 通知識(shí)別結(jié)果處理系統(tǒng)進(jìn)行相應(yīng)操作的腳步聲識(shí)別處理模塊;
用于建立身份特征庫(kù)的腳步聲特征訓(xùn)練模塊,通過腳步聲特征訓(xùn) 練,提取腳步聲特征,建立特征參數(shù)模型,并保存相應(yīng)的參數(shù);
3) 用于對(duì)識(shí)別結(jié)果進(jìn)行處理的識(shí)別結(jié)果處理系統(tǒng),包括 用于接收來(lái)自腳步聲識(shí)別處理系統(tǒng)的結(jié)果,進(jìn)行日志記錄的識(shí)別曰
志記錄模塊;
用于接收來(lái)自腳步聲識(shí)別處理系統(tǒng)的結(jié)果,控制門開關(guān)動(dòng)作的門禁 模塊;
當(dāng)身份驗(yàn)證不通過,開門逾時(shí)或用戶有非法操作時(shí),進(jìn)行報(bào)警的報(bào) 警模塊。
腳步聲采集系統(tǒng)與腳步聲識(shí)別處理系統(tǒng)連接,腳步聲識(shí)別處理系統(tǒng) 連接到識(shí)別結(jié)果處理系統(tǒng)上。如圖1所示。
所述腳步聲特征訓(xùn)練模塊的關(guān)鍵算法如圖2所示。首先進(jìn)行數(shù)據(jù)采 集,錄音數(shù)據(jù)通過音頻采樣級(jí)別12kHz、采樣精度為16bit、單聲道的A /D變換轉(zhuǎn)化成數(shù)字信號(hào)。然后對(duì)數(shù)字信號(hào)進(jìn)行分幀、加窗和端點(diǎn)檢測(cè) 和濾波。為了進(jìn)行短時(shí)分析,必須對(duì)信號(hào)進(jìn)行分幀處理,本模塊采用一 幀幀長(zhǎng)為256點(diǎn),幀移為100。為了使幀與幀之間平滑過渡,保持連續(xù) 性,可移動(dòng)的有限長(zhǎng)窗口進(jìn)行加權(quán)的方法來(lái)實(shí)現(xiàn)。窗函數(shù)的選擇對(duì)于短 時(shí)分析參數(shù)的特性影響很大.加窗則采用海明窗。端點(diǎn)檢測(cè)的目的就是 從連續(xù)的聲音中間檢測(cè)出每一段聲音數(shù)據(jù)的起始點(diǎn)和終止點(diǎn)。特征提取 時(shí)先求出IO階線性預(yù)測(cè)分析系數(shù),再遞推出15階的倒譜系數(shù)。腳步聲 特征訓(xùn)練的過程即碼本形成的過程。對(duì)輸入腳步聲所形成的所有原始特
征矢量,形成碼本并存儲(chǔ)。
所述腳步聲識(shí)別處理模塊的關(guān)鍵算法如圖3所示。識(shí)別處理的初始 過程與腳步聲特征訓(xùn)練過程相似,同樣要進(jìn)行數(shù)據(jù)采集、端點(diǎn)檢、,濾 波、LPC、 LPC倒譜的處理,由此得到原始特征矢量;然后與在特征訓(xùn) 練過程中得到的模型模板加以比較,并根據(jù)一定的相似性準(zhǔn)則進(jìn)行判 定;最后輸出是否是合法身份。
本發(fā)明應(yīng)用于智能控制門禁系統(tǒng)的一個(gè)實(shí)例的示意圖如圖4所示。 如果用戶選擇進(jìn)行腳步聲特征訓(xùn)練的操作,則進(jìn)行腳步聲特征訓(xùn)練。麥 克風(fēng)進(jìn)行聲音數(shù)據(jù)采集并進(jìn)行預(yù)處理,提取特征模板并存儲(chǔ);如果用戶 選擇系統(tǒng)識(shí)別監(jiān)控操作,則麥克風(fēng)進(jìn)行聲音數(shù)據(jù)采集并進(jìn)行預(yù)處理,如 果沒有腳步聲,則自動(dòng)降低系統(tǒng)功耗。如果有腳步聲則腳步聲識(shí)別處理 模塊工作,進(jìn)行識(shí)別處理。如果是合法身份,則控制門開放并開啟定時(shí) 器。當(dāng)用戶沒有關(guān)門并定時(shí)器超時(shí)時(shí),報(bào)警模塊報(bào)警;如果是非法身份, 則報(bào)警模塊進(jìn)行報(bào)警處理,識(shí)別日志記錄模塊記錄本次非法操作。從而 實(shí)現(xiàn)智能控制門禁系統(tǒng)。
權(quán)利要求
1、一種基于腳步聲識(shí)別的智能門禁系統(tǒng),其特征在于設(shè)置有如下模塊1)用于腳步聲采集和預(yù)處理的腳步聲采集系統(tǒng),包括用于采集聲音信息的麥克風(fēng)和負(fù)責(zé)對(duì)腳步聲進(jìn)行預(yù)處理的腳步聲預(yù)處理模塊;2)用于對(duì)腳步聲識(shí)別處理和特征訓(xùn)練的腳步聲識(shí)別處理系統(tǒng),包括用于對(duì)腳步聲進(jìn)行特征比對(duì)、識(shí)別處理的腳步聲識(shí)別處理模塊;用于建立身份特征庫(kù)的腳步聲特征訓(xùn)練模塊;3)用于對(duì)識(shí)別結(jié)果進(jìn)行處理的識(shí)別結(jié)果處理系統(tǒng),包括用于對(duì)識(shí)別結(jié)果進(jìn)行日志記錄的識(shí)別日志記錄模塊;用于在身份驗(yàn)證不通過,開門逾時(shí)或用戶有非法操作時(shí)進(jìn)行報(bào)警的報(bào)警模塊;用于接收控制信息并控制門開關(guān)動(dòng)作的門禁模塊;所述的腳步聲采集系統(tǒng)與腳步聲識(shí)別處理系統(tǒng)連接;腳步聲識(shí)別處理系統(tǒng)連接到識(shí)別結(jié)果處理系統(tǒng)上。
2、 根據(jù)權(quán)利要求1所述的基于腳步聲識(shí)別的智能門禁系統(tǒng),其 特征在于所述腳步聲預(yù)處理模塊根據(jù)腳步聲的聲紋特征濾除干擾信 號(hào),并通過預(yù)處理分析實(shí)時(shí)控制系統(tǒng)的功耗。
3、 根據(jù)權(quán)利要求1所述的基于腳步聲識(shí)別的智能門禁系統(tǒng),其 特征在于對(duì)腳步聲的采集和預(yù)處理主要采用信號(hào)調(diào)理和信號(hào)采集,濾 波、提取語(yǔ)音特征矢量、頻譜分析技術(shù),完成將提取的腳步聲特征矢量 量化成標(biāo)準(zhǔn)腳步聲特征矢量。
4、 根據(jù)權(quán)利要求1所述的基于腳步聲識(shí)別的智能門禁系統(tǒng),其 特征在于所述腳步聲識(shí)別處理模塊采用對(duì)腳步聲進(jìn)行端點(diǎn)檢測(cè),濾波,LPC, LPC倒譜以及模板匹配實(shí)現(xiàn)身份識(shí)別,并在現(xiàn)有聲紋識(shí)別算法的 基礎(chǔ)上進(jìn)行了優(yōu)化。
5、 根據(jù)權(quán)利要求1所述的基于腳步聲識(shí)別的智能門禁系統(tǒng),其特征在于所述腳步聲特征訓(xùn)練模塊采用概率統(tǒng)計(jì)、參數(shù)評(píng)估技術(shù),提取最佳的腳步聲特征標(biāo)準(zhǔn)矢量。
6、 根據(jù)權(quán)利要求1所述的基于腳步聲識(shí)別的智能門禁系統(tǒng),其特征在于所述門禁模塊設(shè)置有定時(shí)器,如果門長(zhǎng)時(shí)間處于開放狀態(tài),將進(jìn)行報(bào)警。
全文摘要
本發(fā)明公開了一種基于腳步聲識(shí)別的智能門禁系統(tǒng),包括1)負(fù)責(zé)監(jiān)控和采集腳步聲的腳步聲采集系統(tǒng);2)通過語(yǔ)音識(shí)別技術(shù)對(duì)腳步聲進(jìn)行識(shí)別處理的腳步聲識(shí)別處理系統(tǒng),包括腳步聲識(shí)別處理模塊和對(duì)系統(tǒng)進(jìn)行腳步聲特征訓(xùn)練的腳步聲特征訓(xùn)練模塊;3)接收腳步聲識(shí)別結(jié)果并按不同結(jié)果進(jìn)行指定操作的識(shí)別結(jié)果處理系統(tǒng)。腳步聲采集系統(tǒng)與腳步聲識(shí)別處理系統(tǒng)連接;腳步聲識(shí)別處理系統(tǒng)連接到識(shí)別結(jié)果處理系統(tǒng)上。本發(fā)明能夠進(jìn)行對(duì)人的腳步聲的特征提取、比對(duì)、識(shí)別和確認(rèn)等一系列程序,實(shí)現(xiàn)對(duì)目標(biāo)人員身份的有效驗(yàn)證,并進(jìn)行放行、拒絕、紀(jì)錄、報(bào)警等操作的出入口控制。
文檔編號(hào)G07C9/00GK101393660SQ200810199168
公開日2009年3月25日 申請(qǐng)日期2008年10月15日 優(yōu)先權(quán)日2008年10月15日
發(fā)明者寧 劉, 李偉釗, 羅笑南, 卓 蘇 申請(qǐng)人:中山大學(xué)