欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法

文檔序號:10688577閱讀:281來源:國知局
基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法
【專利摘要】本發(fā)明提出了一種基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法。包含以下步驟:首先,提取駕駛?cè)苏Z音樣本的線性特征和非線性特征;其次,采用基于VQ的說話人識別算法判別駕駛?cè)松矸?;隨后,根據(jù)駕駛?cè)说膫€體疲勞特征差異,采用Relief算法篩選出能夠充分反映其疲勞信息的語音特征,構(gòu)建疲勞個性特征向量;最后,采用SVM分類算法建立駕駛?cè)藗€體的自適應(yīng)疲勞檢測模型,并對模型進行樣本訓(xùn)練以及駕駛疲勞檢測。本發(fā)明將語音線性特征和非線性特征進行互補結(jié)合,同時針對駕駛?cè)说膫€體差異,從中篩選出能夠充分反映駕駛?cè)似谛畔⒌恼Z音個性特征用于駕駛疲勞檢測,有效降低了駕駛?cè)藗€體發(fā)音差異對疲勞檢測的影響,提高了檢測的準(zhǔn)確性。
【專利說明】
基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及語音處理及交通安全監(jiān)測控制領(lǐng)域,特別涉及一種應(yīng)用語音個性特征 和模型自適應(yīng)來檢測駕駛疲勞的方法。
【背景技術(shù)】
[0002] 在交通運輸領(lǐng)域,駕駛?cè)说钠诂F(xiàn)象直接危害著生命財產(chǎn)的安全。據(jù)悉,約有80% 的重大交通事故與駕駛員的疲勞駕駛有關(guān),駕駛疲勞現(xiàn)象及其所引發(fā)的交通安全隱患已然 引起社會的高度重視,圍繞其檢測手段的研究也一直是令人關(guān)注的熱門問題。
[0003] 目前對駕駛疲勞的檢測主要有主觀和客觀兩種方法,主觀檢測法主要依據(jù)主觀調(diào) 查表、自我記錄表、睡眠記錄表等來評測人體的疲勞程度。雖然這類主觀方法使用簡單,但 不具備實時性,且十分易受個體主觀評分差異的影響,其結(jié)果往往并不準(zhǔn)確??陀^檢測法是 借助儀器設(shè)備,對人體的腦電、心電等生理指標(biāo)進行測量;或?qū)θ梭w的眨眼頻率、眼睛閉合 度、點頭動作等行為特征指標(biāo)進行測量;或?qū)囕v的行車加速度、方向盤角速度、側(cè)位移等 運行特征指標(biāo)進行測量;隨后,從上述各指標(biāo)中提取出能夠反映疲勞狀態(tài)的特征量,通過分 析和實驗設(shè)定評價標(biāo)準(zhǔn),將實測數(shù)據(jù)和評價標(biāo)準(zhǔn)經(jīng)行比較,判斷疲勞狀態(tài)。從實際實施效果 來看,現(xiàn)有的這些疲勞客觀檢測方法大多難以滿足實時性、環(huán)境適應(yīng)性、非接觸性和便捷性 的要求。例如,基于生理指標(biāo)的疲勞檢測,設(shè)備昂貴,測量方法復(fù)雜,大多需要接觸式測量而 無法實際應(yīng)用;基于駕駛員行為特征的檢測方法,其圖像采集設(shè)備易受角度、光線和遮擋等 環(huán)境因素的干擾;基于車輛運行特征的疲勞檢測,受個體駕駛習(xí)慣差異及車輛道路情況等 因素影響的程度較大。因此,現(xiàn)有的這三類客觀檢測方法均因其檢測條件的限制及復(fù)雜環(huán) 境的影響,檢測效果不能完全令人滿意。
[0004] 考慮到鐵路及航空等高安全等級的交通運輸領(lǐng)域,均要求駕駛?cè)藛T采用標(biāo)準(zhǔn)作業(yè) 用語,這些語音中涵蓋著大量與人體疲勞相關(guān)的生理和心理信息,其采集手段比其他指標(biāo) 更為簡單便捷,并且語音處理系統(tǒng)的環(huán)境適應(yīng)性強,降噪技術(shù)成熟,成本低廉。近些年,應(yīng)用 語音信號來檢測人體疲勞的研究也逐漸興起,然而大多數(shù)研究或局限于部分傳統(tǒng)的語音線 性特征參數(shù),或局限于語音信號的混沌、分形等非線性特征,對語音信號中所包含的疲勞信 息體現(xiàn)得不夠全面:一方面,如果特征取得較多,會使得計算量急劇增大,乃至"維數(shù)災(zāi)難" 所引起的檢測效率低下問題,同時易受其他因素干擾的語音特征還會影響到疲勞檢測的準(zhǔn) 確性和客觀性;另一方面,較少的語音特征又難以保證疲勞檢測的全面性和普適性。更為重 要的是,說話人的個體發(fā)音差異對疲勞檢測的效果又有著較大的影響,尤其是不同說話人 的各個語音特征對其疲勞狀態(tài)的敏感性不同,如果對所有駕駛?cè)司捎孟嗤恼Z音特征組 合以及相同的疲勞檢測模型,勢必是不夠合理和客觀的。因此,現(xiàn)有同類方法在不同個體的 疲勞特征差異以及疲勞檢測模型的自適應(yīng)性方面做得還不夠理想,檢測效果也距實際應(yīng)用 存在一定差距。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明的目的就是針對現(xiàn)有方法的不足,提供一種基于語音個性特征和模型自適 應(yīng)的駕駛疲勞檢測方法,力求針對不同駕駛?cè)藗€體在疲勞時的語音特點,更加客觀準(zhǔn)確地 檢測其疲勞狀態(tài),在實現(xiàn)駕駛疲勞實時檢測的如提下,進一步提尚檢測的精度和效率。
[0006] 本發(fā)明是通過以下技術(shù)方案實現(xiàn)的:
[0007] -種基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法,包括以下四個步驟:
[0008] SI、提取駕駛?cè)苏Z音樣本的語音線性特征和語音非線性特征;
[0009] S2、采用基于VQ的說話人識別算法,得到駕駛?cè)说纳矸輼?biāo)簽,并據(jù)此從所有駕駛?cè)?的歷史語音樣本庫中檢索該名駕駛?cè)说臍v史語音樣本庫,用于后續(xù)的疲勞個性特征篩選; [0010] S3、采用Relief特征選擇算法從所提取的語音線性特征和語音非線性特征中篩選 可以充分反映該駕駛?cè)藗€體疲勞信息的語音特征參數(shù),構(gòu)建其語音疲勞個性特征向量;
[0011] S4、建立自適應(yīng)疲勞檢測模型,應(yīng)用駕駛?cè)说臍v史語音樣本對其自適應(yīng)疲勞檢測 模型進行訓(xùn)練,并將訓(xùn)練好的模型用于待測駕駛?cè)苏Z音樣本的駕駛疲勞模式識別,得出駕 駛疲勞檢測結(jié)果。
[0012] 在步驟Sl中,所述的語音線性特征包括:基音頻率、前三共振峰及其帶寬、短時能 量、短時過零率、清濁音比率、諧波噪聲比、線性預(yù)測倒譜系數(shù)、梅爾頻標(biāo)倒譜系數(shù),及上述 特征參數(shù)的均值、方差、最大值、最小值、中值、上四分位值及下四分位值。
[0013]在步驟Sl中,所述的語音非線性特征包括:李雅普諾夫指數(shù)、關(guān)聯(lián)維數(shù)、廣義赫斯 特指數(shù)、二階熵,及上述特征參數(shù)的均值、方差、最大值、最小值、中值、上四分位值及下四分 位值。
[0014] 在步驟S2中,所述的基于VQ的說話人識別算法,包括如下步驟:
[0015] a、從所有N個駕駛?cè)说臍v史語音樣本庫S= {Si,S2,···,Sn}中提取說話人特征矢量 序列,該特征矢量序列是由各語音幀的基音頻率、線性預(yù)測倒譜系數(shù)、梅爾頻標(biāo)倒譜系數(shù), 這三種能夠體現(xiàn)說話人信息的語音特征參數(shù)組合構(gòu)成;
[0016] b、采用LBG算法對每個駕駛?cè)说恼f話人特征矢量序列進行聚類,生成具有L個碼字 的VQ碼本模型
其中η為駕駛?cè)藰?biāo)簽,η= 1,2,…,N;1為碼字編號,1 = 1,2,…, L;存儲所有駕駛?cè)苏Z音的碼本模型,形成駕駛?cè)舜a本庫-
[0017] c、提取待測駕駛?cè)苏Z音樣本的特征矢量序列X1J2r^XM,其中M是特征矢量序列 的長度,也即語音樣本所包含語音幀的總數(shù);并將該特征矢量序列依次與各個碼本模型進 行失真距離測度計算,得到待測語音與各碼本間的平均量化誤差〇",如下:
[0018]
[0019]式中,代表待測矢量Xm與第η個碼本模型的第1個碼字之間的失真距離, 采用歐式距離測度計算;
[0020] d、選取平均量化誤差最小的碼本模型所對應(yīng)的說話人標(biāo)簽,即為待測駕駛?cè)说纳?份標(biāo)簽。
[0021 ]步驟S2所述的駕駛?cè)藲v史語音樣本庫5",包括了駕駛?cè)嗽谡:推跔顟B(tài)下所采 集的兩類語音樣本,其中疲勞類語音樣本3"-采集自駕駛實驗中駕駛?cè)嗽谄诎Y狀自測量表 得分和心率指標(biāo)水平均低于該次駕駛實驗平均值時所采集的語音樣本,其余實驗語音樣本 均標(biāo)記為正常類語音樣本Sn+。
[0022]在步驟S3中,所述的Relief特征選擇算法,可根據(jù)不同語音特征對疲勞的分類區(qū) 分能力而分別賦予不同的權(quán)重,其計算過程為:
[0023] a、從駕駛?cè)藲v史語音樣本庫Sn*,隨機抽取一個樣本&,然后再從兩類樣本Sn+和 Sn-中各選出一個特征空間內(nèi)距離&最近的樣本,其中與&最近的同類樣本用Hit表示,最近 的異類樣本用Miss表示;
[0024] b、根據(jù)樣本間在語音特EF1上的差異來循環(huán)迭代更新該特征的權(quán)重Wl:
[0025] Wi=Wi-diff (Fi, Sj ,Hit)/r+diff (Fi, Sj ,Miss)/r
[0026] 式中,r為抽樣迭代次數(shù),(^€的義,把〇和(^€的義,1^8)分別代表3」和!^以 及Si和Mi ss在笛i個語咅特征Fi h的相對差異,宙^為:
[00:
[0028] 式中,F(xiàn)i(Sj)為樣本Sj的第i個語音特征,F(xiàn)i(Hit)和F i(Miss)分別為樣本Hit和Miss 的第i個語音特征,max(Fi)和min(Fi)分別為特征Fi在樣本庫中的最大值和最小值;
[0029] c、對每一個語音特征,不斷重復(fù)以上步驟a的樣本抽樣和步驟b的權(quán)重更新,便可 獲得其最終的分類權(quán)重大小,并以此來量化該語音特征對駕駛?cè)似陬悇e的區(qū)分能力。
[0030] 在步驟S3中,所述的Relief特征選擇算法,可使得當(dāng)某一語音特征較為適用于疲 勞分類時,其與同類樣本在此特征上的差異會比較小而與異類樣本的差異則較大,那么在 權(quán)重的迭代更新過程中,此特征的分類權(quán)重會逐漸增高。相反,如果某一語音特征與疲勞分 類的相關(guān)性不大時,那么隨著抽樣迭代計算的進行,其權(quán)重將趨向于較小的數(shù)或零。
[0031] 步驟S3所述的疲勞個性特征向量,是指將特定駕駛?cè)说乃姓Z音特征(步驟Sl所 提取的語音線性特征和非線性特征)按Relief算法計算所得的權(quán)重大小進行降序排序,然 后選取位于前部的d個語音特征(d小于特征數(shù)),經(jīng)規(guī)整化處理后串接成d維特征向量作為 該駕駛?cè)说钠趥€性特征向量,以表征該駕駛?cè)苏Z音中所包含的疲勞信息。對每一個駕駛 人個體而言,步驟S3分別構(gòu)建相應(yīng)的語音疲勞個性特征向量。由于不同駕駛?cè)藗€體的各語 音特征對疲勞的敏感性不一定相同,因此不同駕駛?cè)藗€體的語音疲勞個性特征向量不一定 相同。
[0032] 在步驟S4中,所述的自適應(yīng)疲勞檢測模型,是根據(jù)不同駕駛?cè)说钠趥€性特征向 量,通過支持向量機(SVM)算法分別建立駕駛?cè)松矸輼?biāo)簽所對應(yīng)的SVM疲勞分類器,并且該 分類器的編號與駕駛?cè)松矸輼?biāo)簽一致。不同的駕駛?cè)藗€體的自適應(yīng)疲勞檢測模型(SVM疲勞 分類器)不一定相同。
[0033] 步驟S4所述的應(yīng)用特定駕駛?cè)说恼Z音樣本數(shù)據(jù)對其自適應(yīng)疲勞檢測模型進行訓(xùn) 練,是指通過實驗獲得該駕駛?cè)嗽谡:推跔顟B(tài)下的語音樣本(駕駛?cè)藲v史語音樣本 庫),提取這些樣本的語音特征參數(shù)組成該駕駛?cè)说钠趥€性特征向量作為自適應(yīng)疲勞檢 測模型的輸入,以k折交叉驗證的樣本訓(xùn)練方式來確定和優(yōu)化其自適應(yīng)疲勞檢測模型(相應(yīng) SVM疲勞分類器)的結(jié)構(gòu)及參數(shù)。
[0034] 步驟S4所述的將訓(xùn)練好的自適應(yīng)疲勞檢測模型用于待測駕駛?cè)苏Z音樣本的模式 識別,是指將待測駕駛?cè)?其身份標(biāo)簽由步驟S2獲得)語音樣本的疲勞個性特征向量(該疲 勞個性特征向量所包含的語音特征由步驟S3獲得)作為其訓(xùn)練好的自適應(yīng)疲勞檢測模型 (該模型編號與駕駛?cè)松矸輼?biāo)簽一致)的輸入,來計算得到該駕駛?cè)说鸟{駛疲勞檢測結(jié)果。
[0035] 在步驟S4所述的將訓(xùn)練好的自適應(yīng)疲勞檢測模型用于待測駕駛?cè)苏Z音樣本的模 式識別檢測階段,不必提取待測駕駛?cè)苏Z音樣本的所有語音特征參數(shù),只需提取其疲勞個 性特征向量中所包含的語音特征參數(shù)用于駕駛疲勞檢測。
[0036] 與現(xiàn)有技術(shù)相比,本發(fā)明充分結(jié)合了語音線性和非線性兩類特征,同時根據(jù)不同 駕駛?cè)说母髡Z音特征對疲勞的區(qū)分能力,篩選出其語音的疲勞個性特征,有效地抑制了個 體差異對駕駛疲勞檢測的影響;并且這一特征篩選過程還可以大幅降低語音特征向量的維 數(shù),使得檢測效率得到顯著提升。同時,本發(fā)明還通過SVM分類算法,針對不用的駕駛?cè)藗€體 分別搭建了自適應(yīng)疲勞檢測模型,并且應(yīng)用特定駕駛?cè)嗽谡:推跔顟B(tài)下的兩類語音樣 本數(shù)據(jù)對其自適應(yīng)疲勞檢測模型進行訓(xùn)練,可以有效提高駕駛疲勞檢測的精度和泛化能 力。
【附圖說明】
[0037]圖1是本發(fā)明的工作流程圖。
[0038] 圖2是本發(fā)明具體實施方法的結(jié)構(gòu)示意圖。
[0039] 圖3是語音信號相空間重構(gòu)方法的示意圖。
[0040] 圖4是人體疲勞對語音信號相空間運動軌跡影響的一個實例示意圖。其中,(a)為 疲勞狀態(tài)下音素/i/的時域波形;(b)為正常狀態(tài)下音素/i/的時域波形;(c)為疲勞狀態(tài)下 音素/i/的相空間軌跡;(d)為正常狀態(tài)下音素/i/的相空間軌跡。
[0041 ]圖5是本發(fā)明步驟S2所采用基于VQ的說話人識別算法的流程圖。
[0042]圖6是本發(fā)明步驟S3所采用Relief特征選擇算法的流程圖。
【具體實施方式】
[0043]為了便于本領(lǐng)域技術(shù)人員的理解,下面結(jié)合附圖和實施例對本發(fā)明作進一步的描 述,但本發(fā)明的實施和保護范圍不限于此。
[0044] 參照圖1、2所示,本發(fā)明為一種基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測 方法,具體包括以下SI、S2、S3和S4四個步驟:
[0045] (1)步驟Sl,從駕駛?cè)苏Z音樣本中提取語音線性特征和語音非線性特征。
[0046] 1)進一步的,步驟Sl中,語音線性特征的提取,首先需要對語音樣本(一維數(shù)字采 樣的語音信號)進行預(yù)處理,如圖2的步驟S101。具體的預(yù)處理包括:語音的去噪、端點檢測、 分幀、加窗,這四個經(jīng)典語音預(yù)處理過程。
[0047]隨后,在圖2的步驟S102所提取的語音線性特征,具體包括:基音頻率、前三共振峰 及其帶寬、短時能量、短時過零率、清濁音比率、諧波噪聲比、10階線性預(yù)測倒譜系數(shù)、16階 梅爾頻標(biāo)倒譜系數(shù),以及上述線性特征參數(shù)的均值、方差、最大值、最小值、中值、上四分位 值及下四分位值,共296個語音線性特征。
[0048] 2)進一步的,步驟SI中,語音非線性特征的提取,首先需要根據(jù)一維語音信號來建 立更高維度的語音非線性動力學(xué)模型。如圖2的步驟S103,其建立過程是采用延時相圖法, 對一維語音信號進行相空間重構(gòu)得到。
[0049] 下面可結(jié)合圖3來具體說明語音信號的相空間重構(gòu)方法:
[0050] 對N點采樣的一維語音信號時間序列取延時τ,隨后將連續(xù)的m個延時采樣 點進行重構(gòu)組合,可以得到m維空間中的N-m+τ個向量點集合,表示為:
[0051 ]
(1)
[0052]這些重構(gòu)所得的向量點X(i)在m維相空間中隨時間(采樣間隔i)變化的軌跡,可用 于描述語音混沌(奇異)吸引子在相空間的拓撲結(jié)構(gòu)。在這種重構(gòu)的相空間中,信號的運動 軌跡與語音非線性動力系統(tǒng)在幾何特征上是等價的,且具有相同的混沌吸引子拓撲結(jié)構(gòu), 因此可作為語音信號的非線性動力學(xué)模型。
[0053]下面具體說明人體疲勞對語音非線性動力學(xué)模型的影響。人體在疲勞時,其聲帶 張力的降低,語音氣流的平緩,同時伴隨著聲道壁熱傳導(dǎo)性和粘彈性的改變,均會對語音非 線性動力學(xué)系統(tǒng)造成較為明顯的影響。這一影響主要體現(xiàn)為語音氣流在聲道邊界層難以形 成較大能量的湍流,湍流的變化直接影響了語音信號的混沌特性。從語音非線性動力學(xué)模 型上則表現(xiàn)為人體在不同的疲勞狀態(tài)下,其濁音(元音)信號相空間運動軌跡的混沌程度明 顯不同,也即其混沌吸引子軌道的波動程度明顯不同。
[0054]再以一個實例來說明上述情況。如圖4,為人體在正常和疲勞狀態(tài)下,發(fā)出音素/i/ 的語音時域信號(采樣率為22kHz)及相應(yīng)相空間重構(gòu)軌跡(m = 3j = 10)。圖4a的疲勞語音 時域信號和圖4b的清醒語音時域信號分別采集自駕駛實驗中,被測者在疲勞量表得分最高 和最低的時刻??梢钥闯?,圖4c所示的疲勞狀態(tài)下的語音相空間軌跡,其混沌程度明顯低于 圖4d所示的清醒狀態(tài)下的相空間軌跡,直接體現(xiàn)為疲勞狀態(tài)下語音混沌吸引子軌跡的不穩(wěn) 定性和波動程度都要低于清醒狀態(tài)。
[0055]因此,在圖2的步驟S104中,本發(fā)明提取了語音非線性動力學(xué)模型下的非線性特征 來量化和評價這種人體疲勞對語音信號混沌程度的影響。具體所提取的語音非線性特征包 括:最大李雅普諾夫指數(shù)、關(guān)聯(lián)維數(shù)、廣義赫斯特指數(shù)、二階熵,及上述非線性特征的均值、 方差、最大值、最小值、中值、上四分位值及下四分位值,共40個語音非線性特征。
[0056] (2)步驟S2,采用基于VQ的說話人識別算法,得到駕駛?cè)说纳矸輼?biāo)簽,并據(jù)此檢索 該駕駛?cè)说臍v史語音樣本庫,用于后續(xù)的疲勞個性特征篩選。
[0057]進一步的,步驟S2中所述的基于VQ的說話人識別算法,可結(jié)合圖5來進行詳細說 明,該算法主要包括駕駛?cè)薞Q碼本的建本和待測語音的說話人識別兩個階段,詳細過程如 下:
[0058] 1)所述的駕駛?cè)薞Q碼本的建本階段,其具體實施過程為:
[0059] a、從所有N個駕駛?cè)说臍v史語音樣本庫S= {Si,S2,···,Sn}中提取說話人特征矢量 序列。所述的說話人特征矢量,具體是由語音樣本中各語音幀的基音頻率、線性預(yù)測倒譜系 數(shù)、梅爾頻標(biāo)倒譜系數(shù),這三種能夠體現(xiàn)說話人信息的語音特征參數(shù)組合構(gòu)成;
[0060] b、采用LBG算法為每個駕駛?cè)司垲惿删哂蠰個碼字的VQ碼本模S
其 中η為駕駛?cè)藰?biāo)簽,n = l,2,…,N;1為碼字編號,1 = 1,2,…,L;
[0061] C、存儲所有駕駛?cè)苏Z音的碼本模型,形成駕駛?cè)舜a本庫Y=IY1J2,-SYnK
[0062] 2)所述的待測語音的說話人識別階段,其具體實施過程為:
[0063] a、從待測語音樣本中提取說話人特征矢量序列X1J2r^XM, M為特征矢量序列的 長度,也即待測語音所包含語音幀的總數(shù);
[0064] b、將待測語音的說話人特征矢量依次與駕駛?cè)舜a本庫中的N個碼本模型進行失真 距離測1曾·值剄錢側(cè)?咅婦欠?太爐刑問的平均量化誤差為:
[0065] (2)
[0066] 式中,代表待測矢量I與第η個碼本模型的第1個碼字之間的失真距離, 采用歐式距離測度計算;
[0067] Α &瓜扣&|結(jié)果為最小的對應(yīng)的駕駛?cè)藰?biāo)簽,有:
[0068] (3)
[0069] 進一步的,在步驟S2中,所述的根據(jù)駕駛?cè)松矸葑R別結(jié)果η來檢索該駕駛?cè)说臍v史 語音樣本庫,是指在所有駕駛?cè)说臍v史語音樣本庫S= {&,S2,…,SN}中,選取其中特定駕駛 人η的歷史語音樣本庫5"來用于后續(xù)該駕駛?cè)说钠趥€性特征篩選。
[0070] 所述的特定駕駛?cè)说臍v史語音樣本庫5",包含了該駕駛?cè)说膬深愓Z音樣本,有Sn = {Sn+,Sn- },其中為Sn+為正常類語音樣本,Sn-為疲勞類語音樣本,這兩類樣本分別采集自實驗 過程中駕駛?cè)嗽谡:推跔顟B(tài)下的標(biāo)準(zhǔn)作業(yè)用語,實驗中駕駛?cè)似跔顟B(tài)的判別依據(jù)為 駕駛?cè)说钠谧詼y量表得分及其心率指標(biāo)。
[0071] (3)步驟S3,首先采用Relief特征選擇算法從步驟Sl所提取的所有語音特征中篩 選可以充分反映該駕駛?cè)藗€體疲勞信息的語音特征參數(shù),如圖2的步驟S301;隨后對篩選出 的語音特征進行規(guī)整化處理,構(gòu)建駕駛?cè)说钠趥€性特征向量,如圖2的步驟S302。
[0072] 1)進一步的,步驟S301中所述的Relief特征選擇算法,其計算方法為:
[0073] a、從駕駛?cè)甩堑臍v史語音樣本庫Sn*,隨機抽取一個樣本Sj,然后再從兩類樣本Sn+ 和3"_中各選出一個特征空間內(nèi)距離&最近的樣本,其中與&最近的同類樣本用Hit表示,最 近的異類樣本用Miss表示;
[0074] b、根據(jù)樣本間在語音特EF1上的差異來循環(huán)迭代更新該特征的權(quán)重Wl:
[0075] Wi=Wi-diff (Fi, Sj ,Hit)/r+diff (Fi, Sj ,Miss)/r (4)
[0076] 式中,r為抽樣迭代次數(shù),
[0078] 式中,F(xiàn)i(Sj)為樣本Sj的第i個語音特征,F(xiàn) i(Hit)和Fi(Miss)分別為樣本Hit和Miss 及Sj和Mi龍笛?木4互甚牲紅卩j l·的和姑弟ft由々士 .
[0077] (5) 的第i個語音特征,max(Fi)和min(Fi)分別為特征Fi在樣本庫中的最大值和最小值;
[0079] c、對步驟Sl所提取的每一個語音特征,不斷重復(fù)以上步驟a和步驟b,便可獲得其 分類權(quán)重大小,并以此來量化該語音特征對駕駛?cè)似陬悇e的區(qū)分能力。
[0080] 以上所述的Relief算法的詳細循環(huán)迭代處理過程,如圖6所示。可見,當(dāng)某一語音 特征較為適用于該駕駛?cè)说钠跇颖痉诸悤r,其與同類樣本在該特征的差異應(yīng)較小,而與 異類樣本的差異則應(yīng)較大。那么在Relief算法迭代更新過程中,該特征的權(quán)重會隨著樣本 訓(xùn)練而逐漸增高。相反,如果某一語音特征與疲勞分類的相關(guān)性不大時,那么它的屬性值相 當(dāng)于一系列隨機數(shù),隨著迭代計算的進行,其權(quán)重將趨向于零或較小的數(shù)。
[0081] 步驟S301中,所述的從所提取的所有語音特征中篩選可以充分反映該駕駛?cè)似?信息的語音特征參數(shù),是指將特定駕駛?cè)说乃姓Z音特征(步驟Sl所提取的296個語音線性 特征和40個語音非線性特征)按Relief算法計算所得的權(quán)重大小進行降序排序,然后選取 位于前部的d個語音特征用以表征該駕駛?cè)苏Z音中所包含的疲勞信息。優(yōu)選地,具體實施 時,在保證實時性的前提下,可取d = 64,也即從336個語音特征中篩選出64個用于駕駛疲勞 檢測。
[0082] 2)進一步的,步驟S302中所述的對篩選出的語音特征進行規(guī)整化處理,其目的是 為了減少大特征數(shù)值對小特征數(shù)值的影響,同時降低不同量綱而導(dǎo)致的數(shù)值計算困難。對 于步驟S301所篩選出的疲勞語音特征F1,i = 1,2,…,d,所述的具體規(guī)范化處理方法為:
[0083]
(6)
[0084] 式中,if即為將語音特EF1的值規(guī)整至[_1,+1]區(qū)間的特征計算結(jié)果。
[0085]步驟S302中所述的構(gòu)建駕駛?cè)说钠趥€性特征向量,是指將規(guī)整化處理后的d個 語音特征#f,i = l,2,···,d,串接成d維語音特征向量作為該駕駛?cè)说钠趥€性特征向量,并 以此作為后續(xù)駕駛疲勞檢測模型的輸入。對每一個駕駛?cè)藗€體而言,在此步驟應(yīng)分別構(gòu)建 相應(yīng)的語音疲勞個性特征向量。由于不同駕駛?cè)藗€體的各語音特征對疲勞的敏感性不一定 相同,因此不同的駕駛?cè)藗€體的語音疲勞個性特征向量不一定相同。
[0086] (4)步驟S4,針對不同駕駛?cè)藗€體分別建立相應(yīng)的自適應(yīng)疲勞檢測模型,應(yīng)用駕駛 人的語音樣本對其自適應(yīng)疲勞檢測模型進行訓(xùn)練,并將訓(xùn)練好的模型用于待測駕駛?cè)苏Z音 樣本的模式識別,得出駕駛疲勞檢測結(jié)果。
[0087] 所述的步驟S4,其目的在于:考慮到駕駛?cè)说膫€體差異雖然限制了通用駕駛疲勞 檢測模型的準(zhǔn)確性,然而對同一個體在不同時間、不同地點,其疲勞特征又能夠表現(xiàn)出相當(dāng) 的自身穩(wěn)定性。因此,可以對不同的駕駛?cè)藗€體分別建立各自的自適應(yīng)疲勞檢測模型,并應(yīng) 用該個體在不同疲勞狀態(tài)下的語音樣本對其疲勞檢測模型進行自適應(yīng)地反復(fù)訓(xùn)練,便可進 一步消除個體差異所帶來的影響,提高檢測模型的準(zhǔn)確性和泛化能力。
[0088] 進一步的,步驟S4又可劃分為圖2所示的S40US402和S403三個步驟:
[0089] 1)步驟S401,建立自適應(yīng)疲勞檢測模型,是指根據(jù)步驟S3所篩選出的不同駕駛?cè)?的疲勞個性特征向量,采用SVM分類算法分別建立其相應(yīng)的自適應(yīng)疲勞檢測模型(即SVM疲 勞分類器)。所建立的檢測模型的編號與駕駛?cè)松矸輼?biāo)簽一致,并且不同駕駛?cè)说淖赃m應(yīng)疲 勞檢測模型不一定相同。
[0090] 2)步驟S402,對自適應(yīng)疲勞檢測模型進行訓(xùn)練,是指提取特定駕駛?cè)藲v史語音樣 本的語音特征參數(shù)組成該駕駛?cè)说钠趥€性特征向量,來作為其自適應(yīng)疲勞檢測模型的輸 入,并以k折交叉驗證的樣本訓(xùn)練方式來確定和優(yōu)化該自適應(yīng)疲勞檢測模型的參數(shù)及結(jié)構(gòu) 的過程。
[0091] 所述的k折交叉驗證,是指在樣本有限的情況下,將所有樣本隨機分為k份,分別選 取其中k-Ι份作為訓(xùn)練樣本,其余1份作為測試樣本。以重復(fù)k次訓(xùn)練及測試的正確率均值, 作為考察模型分類檢測能力的指標(biāo)。優(yōu)選地,具體實施時,可取k=10,即采用十折交叉驗證 法來考察檢測模型的準(zhǔn)確性。
[0092]步驟S402中所述的確定和優(yōu)化自適應(yīng)疲勞檢測模型的參數(shù),是指通過k折交叉驗 證的反復(fù)樣本訓(xùn)練,來確定和優(yōu)化懲罰系數(shù)、核函數(shù)類型及核函數(shù)參數(shù)等SVM分類檢測模型 的各項參數(shù),以使得檢測模型的平均正確率達到最高。
[0093]步驟S402中所述的確定和優(yōu)化自適應(yīng)疲勞檢測模型的結(jié)構(gòu),是指通過k折交叉驗 證的反復(fù)樣本訓(xùn)練,從所有歷史樣本中選取可使得檢測模型平均正確率最高的支持向量樣 本,用于確定特征空間中的最優(yōu)分類面,從而得到訓(xùn)練好的自適應(yīng)疲勞檢測模型。
[0094] 3)步驟S403,將訓(xùn)練好的自適應(yīng)疲勞檢測模型用于待測駕駛?cè)苏Z音樣本的模式識 另IJ,是指將待測駕駛?cè)?其身份標(biāo)簽由步驟S2獲得)的語音疲勞個性特征向量(該特征向量 由步驟S3獲得)作為其訓(xùn)練好的自適應(yīng)疲勞檢測模型(該模型編號與駕駛?cè)松矸輼?biāo)簽一致) 的輸入,來計算得到該駕駛?cè)说鸟{駛疲勞檢測結(jié)果。
[0095]步驟S403在具體實施時,不必提取待測駕駛?cè)苏Z音樣本的所有語音特征參數(shù),只 需提取其疲勞個性特征向量中所包含的語音特征參數(shù)用于駕駛疲勞檢測,以降低運算量, 提尚檢測效率。
[0096] 本發(fā)明的效果可通過以下對比實驗進一步說明。
[0097] 實驗共招募10名身體狀況良好的測試者,其中男性和女性各5名。實驗過程為每人 單次持續(xù)6小時的模擬駕駛操作。實驗期間,要求測試者按語音采集人員的提示說出"司機 明白","車輛人員安全","黃燈減速"等5段漢語短句,語音樣本持續(xù)時間介于2至6秒,采集 參數(shù)為:22kHz采樣率,16位量化精度。實驗對所有10名測試者,共采集2600份語音樣本,其 中疲勞語音樣本431份。
[0098] 實驗對所有語音樣本分別采用了現(xiàn)有通用方法(對所有駕駛?cè)司捎孟嗤钠?特征組合及通用疲勞檢測模型)及本發(fā)明所述方法(根據(jù)不同駕駛?cè)撕Y選不同的疲勞個性 特征組合并結(jié)合相應(yīng)的自適應(yīng)疲勞檢測模型)進行了駕駛疲勞的檢測,這兩種方法的實驗 結(jié)果如表1所示。
[0099] 可以看出,由于個體差異所帶來的影響,現(xiàn)有通用方法對不同被測者的檢測效果 存在著較大的差異,尤其是第4名及第9名被測者的駕駛疲勞檢測正確率分別為69.2%和 63.1%,均難以達到實際應(yīng)用要求。而對比本發(fā)明所提供的駕駛疲勞檢測方法,第4名及第9 名被測者的駕駛疲勞檢測正確率分別達到了79.2%和77.3%,檢測效果有明顯改善。同時, 對比所有被測者的駕駛疲勞檢測正確率,本發(fā)明所述方法的平均正確率為81.4%,較現(xiàn)有 通用方法的平均正確率74.9%有大幅提升,提升效果達6.5%。
[0100]表1駕駛疲勞檢測的正確率
[0102]以上所述僅是本發(fā)明的較佳實施方式,應(yīng)當(dāng)指出:對于本領(lǐng)域的技術(shù)人員來說,在 不脫離本發(fā)明的精神實質(zhì)與原理下,所作的改變、修飾、替代、組合、簡化,均應(yīng)視為等效的 置換方式,都包含在本發(fā)明的保護范圍之內(nèi)。
【主權(quán)項】
1. 基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法,其特征在于包含以下步驟: 步驟S1、提取駕駛?cè)苏Z音樣本的語音線性特征和語音非線性特征; 步驟S2、采用基于矢量量化(VQ)的說話人識別算法,得到駕駛?cè)说纳矸輼?biāo)簽,并據(jù)此從 所有駕駛?cè)藲v史語音樣本庫中檢索該駕駛?cè)说臍v史語音樣本庫,用于后續(xù)的疲勞個性特征 篩選; 步驟S3、采用Relief特征選擇算法從所提取的語音特征中篩選可以充分反映該駕駛?cè)?個體疲勞信息的語音特征參數(shù),構(gòu)建其語音疲勞個性特征向量; 步驟S4、建立自適應(yīng)疲勞檢測模型,應(yīng)用駕駛?cè)说臍v史語音樣本對其自適應(yīng)疲勞檢測 模型進行訓(xùn)練,并將訓(xùn)練好的模型用于待測駕駛?cè)苏Z音樣本的駕駛疲勞模式識別,得出駕 駛疲勞檢測結(jié)果。2. 根據(jù)權(quán)利要求1所述的基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法,其特 征在于步驟S1中,所述的語音線性特征包括:基音頻率、前三共振峰及其帶寬、短時能量、短 時過零率、清濁音比率、諧波噪聲比、線性預(yù)測倒譜系數(shù)、梅爾頻標(biāo)倒譜系數(shù),及上述特征參 數(shù)的均值、方差、最大值、最小值、中值、上四分位值及下四分位值;所述的語音非線性特征 包括:李雅普諾夫指數(shù)、關(guān)聯(lián)維數(shù)、廣義赫斯特指數(shù)、二階熵,及上述特征參數(shù)的均值、方差、 最大值、最小值、中值、上四分位值及下四分位值。3. 根據(jù)權(quán)利要求1所述的基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法,其特 征在于步驟S2中,所述的駕駛?cè)松矸輼?biāo)簽是由基于VQ的說話人識別算法實現(xiàn)得到,包括如 下步驟: a、 從所有N個駕駛?cè)说臍v史語音樣本庫S= {Si,S2,…,Sn}中提取說話人特征矢量序列; b、 采用LBG算法對每個駕駛?cè)说恼f話人特征矢量序列進行聚類,生成具有L個碼字的VQ 碼本模型,其中η為駕駛?cè)藰?biāo)簽,n=l,2,…,N;1為碼字編號,1 = 1,2,"_,L;存 儲所有駕駛?cè)苏Z音的碼本模型,形成駕駛?cè)舜a本庫Υ= {Υ:,Υ2,…,ΥΝ}; c、 提取待測駕駛?cè)苏Z音樣本的特征矢量序列Χ^Χ%···,Χμ,Μ為矢量序列的長度,也即待 測語音所包含語音幀的總數(shù);并將該矢量序列依次與各個碼本模型進行失真距離測度計 算,得到待測語音與各碼本間的平均量化誤差為:式中,(6/(1,,,,?)代表第m個待測矢量Xm與第η個碼本模型的第1個碼字之間的失真距 離,采用歐式距離測度計算; d、 選取平均量化誤差最小的碼本模型所對應(yīng)的駕駛?cè)藰?biāo)簽,即為待測駕駛?cè)说纳矸輼?biāo) 簽。4. 根據(jù)權(quán)利要求3所述的基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法,其特 征在于:基于VQ的說話人識別算法所涉及的說話人特征矢量序列,是由說話人語音樣本中 各語音幀的基音頻率、線性預(yù)測倒譜系數(shù)、梅爾頻標(biāo)倒譜系數(shù),這三種能夠體現(xiàn)說話人信息 的語音特征參數(shù)組合構(gòu)成。5. 根據(jù)權(quán)利要求1所述的基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法,其特 征在于步驟S2中,所述的駕駛?cè)藲v史語音樣本庫Sn中包括了駕駛?cè)嗽谡:推跔顟B(tài)下所 采集的兩類語音樣本,其中疲勞類語音樣本3"-采集自駕駛實驗中駕駛?cè)嗽谄诎Y狀自測量 表得分和心率指標(biāo)水平均低于平均值時所采集的語音樣本,其余語音樣本均標(biāo)記為正常類 語音樣本S n+。6. 根據(jù)權(quán)利要求1所述的基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法,其特 征在于步驟S3中,所述的從所提取的語音特征中篩選可以充分反映該駕駛?cè)藗€體疲勞信息 的語音特征參數(shù),是由Relief特征選擇算法實現(xiàn),該算法可根據(jù)不同語音特征對疲勞的分 類區(qū)分能力而分別賦予不同的權(quán)重,其計算過程為: a、 從駕駛?cè)藲v史語音樣本庫Sn中,隨機抽取一個樣本Sj,然后再從兩類樣本Sn+和Sn-中 各選出一個特征空間內(nèi)距離&最近的樣本,其中與&最近的同類樣本用Hit表示,最近的異 類樣本用Miss表示; b、 根據(jù)樣本間在語音特征巧上的差異來循環(huán)迭代更新該特征的權(quán)重w1: wi=wi-diff (Fi, Sj ,Hit)/r+diff (Fi, Sj ,Miss)/r 式中,r為抽樣迭代次數(shù), 和Miss在第i個語音特征Fi上的相對差異,定義為:式中,F(xiàn)i(Sj)為樣本Sj的第i個語音特征,F(xiàn)i(Hit)和Fi(Miss)分別為樣本Hit和Miss的第 i個語音特征,max(Fi)和min(Fi)分別為特征Fi在樣本庫中的最大值和最小值; c、 對每一個語音特征,不斷重復(fù)以上步驟a和步驟b,便可獲得其分類權(quán)重大小,并以此 來量化各語音特征對駕駛?cè)似陬悇e的區(qū)分能力。7. 根據(jù)權(quán)利要求1所述的基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法,其特 征在于步驟S3中,所述的語音疲勞個性特征向量,是將特定駕駛?cè)说乃姓Z音特征按 Relief算法計算所得的權(quán)重大小進行降序排序,然后選取位于前部的d個語音特征,經(jīng)規(guī)整 化處理后串接成d維語音特征向量所得到的;所述的構(gòu)建語音疲勞個性特征向量,是對每一 個駕駛?cè)藗€體都分別構(gòu)建相應(yīng)的語音疲勞個性特征向量,不同駕駛?cè)藗€體的語音疲勞個性 特征向量不一定相同。8. 根據(jù)權(quán)利要求1所述的基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法,其特 征在于步驟S4中,所述的自適應(yīng)疲勞檢測模型,是根據(jù)不同駕駛?cè)说钠趥€性特征向量,通 過支持向量機分類算法分別建立駕駛?cè)松矸輼?biāo)簽所對應(yīng)的疲勞檢測分類器,該分類器即為 該駕駛?cè)说淖赃m應(yīng)疲勞檢測模型,不同的駕駛?cè)藗€體的自適應(yīng)疲勞檢測模型不一定相同。9. 根據(jù)權(quán)利要求1所述的基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法,其特 征在于步驟S4中,所述的對自適應(yīng)疲勞檢測模型進行訓(xùn)練,是通過提取駕駛?cè)藲v史語音樣 本庫的語音特征參數(shù)組成該駕駛?cè)说钠趥€性特征向量作為自適應(yīng)疲勞檢測模型的輸入, 以k折交叉驗證的樣本訓(xùn)練方式來確定和優(yōu)化其自適應(yīng)疲勞檢測模型的結(jié)構(gòu)及參數(shù)。10. 根據(jù)權(quán)利要求1所述的基于語音個性特征和模型自適應(yīng)的駕駛疲勞檢測方法,其特 征在于步驟S4中,所述的待測駕駛?cè)苏Z音樣本的駕駛疲勞模式識別,是通過步驟S2獲得待 測駕駛?cè)说纳矸輼?biāo)簽,隨后按照步驟S3所篩選的該駕駛?cè)说膁個疲勞特征來提取計算其語 音樣本的疲勞個性特征向量,作為訓(xùn)練好的該駕駛?cè)俗赃m應(yīng)疲勞檢測模型的輸入,從而計 算得到駕駛疲勞檢測結(jié)果。
【文檔編號】G10L25/93GK106057212SQ201610338429
【公開日】2016年10月26日
【申請日】2016年5月19日
【發(fā)明人】李響
【申請人】華東交通大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
康平县| 英超| 闽侯县| 黎平县| 久治县| 宁波市| 右玉县| 竹山县| 平谷区| 晋江市| 兴仁县| 兰考县| 岗巴县| 大化| 靖边县| 桦甸市| 娱乐| 清流县| 巴彦淖尔市| 德安县| 临潭县| 凤台县| 镇沅| 镇平县| 华容县| 青铜峡市| 新源县| 襄垣县| 丰顺县| 武汉市| 崇左市| 榕江县| 宁阳县| 海口市| 磴口县| 石渠县| 奈曼旗| 宁阳县| 张家界市| 柳河县| 舒城县|