本發(fā)明屬于音頻領(lǐng)域,特別是一種基于非線性動(dòng)力學(xué)的睡眠階段分期方法。
背景技術(shù):
睡眠是人體恢復(fù)精力的最好休息方式,良好的睡眠有利于提高人的生活質(zhì)量、工作效率和生活幸福感。目前國(guó)際上采用的睡眠監(jiān)測(cè)多為多導(dǎo)睡眠圖監(jiān)測(cè)(psg),它記錄并分析多種睡眠呼吸參數(shù),能夠準(zhǔn)確地判斷睡眠結(jié)構(gòu)和睡眠分期。但是psg也有很多不足之處,其中它操作復(fù)雜,需要專業(yè)人員進(jìn)行電極粘貼,只能在實(shí)驗(yàn)室或者醫(yī)院使用。而且所接電極繁多,粘貼在身體各個(gè)部位,并不適用于皮膚敏感者,這也影響了被監(jiān)測(cè)者的自然睡眠,對(duì)測(cè)試實(shí)驗(yàn)產(chǎn)生干擾。此外,psg檢測(cè)費(fèi)用高,不能作為日常監(jiān)護(hù)。
現(xiàn)有的臨床睡眠分析方法主要是穿戴式的,北京怡和嘉業(yè)醫(yī)療科技有限公司的專利《電磁式胸腹帶及多導(dǎo)睡眠監(jiān)測(cè)儀》中,提供了一種電磁式胸腹帶,包括胸帶和腹帶,其中胸帶和腹帶上均固定有磁性件和感應(yīng)設(shè)備,通過(guò)監(jiān)測(cè)胸呼吸和腹呼吸的參數(shù)來(lái)實(shí)現(xiàn)睡眠監(jiān)測(cè)。中國(guó)人民解放軍第二軍醫(yī)大學(xué)的專利《一種睡眠監(jiān)測(cè)系統(tǒng)》中,提出了一種包含了腦電波收集帽及手套的睡眠監(jiān)測(cè)系統(tǒng),它通過(guò)監(jiān)測(cè)睡眠腦電波、指氧飽和度、肌電及體動(dòng)這四項(xiàng)指標(biāo)來(lái)對(duì)睡眠進(jìn)行檢測(cè)。這兩篇專利中的電磁式胸腹帶或腦電波收集帽及手套都需固定在被監(jiān)測(cè)者的身體上,增加了被監(jiān)測(cè)者在睡眠監(jiān)測(cè)時(shí)的異物感,產(chǎn)生了心理和生理負(fù)荷,從而影響了測(cè)試結(jié)果。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的在于提供一種基于非線性動(dòng)力學(xué)的睡眠階段分期方法。
實(shí)現(xiàn)該目的的技術(shù)解決方案為:一種基于非線性動(dòng)力學(xué)的睡眠階段分期方法,包括以下步驟:
步驟1:用音頻設(shè)備采集監(jiān)護(hù)者整夜的睡眠音頻信號(hào),同時(shí)用標(biāo)準(zhǔn)psg儀對(duì)實(shí)驗(yàn)者進(jìn)行睡眠監(jiān)測(cè),得到睡眠階段標(biāo)簽;
步驟2:將步驟1采集到的音頻信號(hào)與標(biāo)準(zhǔn)psg儀采集到的睡眠階段標(biāo)簽按照對(duì)應(yīng)法則一一對(duì)應(yīng);
步驟3:對(duì)步驟1采集到的音頻信號(hào)進(jìn)行預(yù)處理,具體為:對(duì)錄取的音頻信號(hào)進(jìn)行降噪處理,得到降噪處理后的睡眠音頻,對(duì)降噪后的睡眠音頻信號(hào)進(jìn)行聲音事件檢測(cè),得到聲音事件,其中所述聲音事件具體為人體一呼一吸產(chǎn)生的音頻;
步驟4:采用非線性動(dòng)力學(xué)分析方法對(duì)檢測(cè)到的聲音事件進(jìn)行特征提取,所述特征具體為:時(shí)間延遲
步驟5:將提取得到的特征參數(shù)與對(duì)應(yīng)的標(biāo)簽輸入到機(jī)器學(xué)習(xí)中,通過(guò)機(jī)器學(xué)習(xí)方法來(lái)確定睡眠階段與特征參數(shù)之間的映射模型;
步驟6:根據(jù)步驟5得到的映射模型,對(duì)音頻設(shè)備錄取的音頻信號(hào)進(jìn)行睡眠階段分期。
本發(fā)明與現(xiàn)有技術(shù)相比,其顯著優(yōu)點(diǎn)在于:1)本發(fā)明利用音頻設(shè)備實(shí)現(xiàn)睡眠的非接觸式監(jiān)測(cè),與傳統(tǒng)的接觸式監(jiān)測(cè)相比,設(shè)備簡(jiǎn)單易操作,能減少人體的不適感,并且可以克服很多的局限性。2)本發(fā)明選擇了合適的特征參數(shù)來(lái)表征多種睡眠階段,通過(guò)機(jī)器學(xué)習(xí)方法訓(xùn)練出可以區(qū)分不同睡眠階段的模型。因此,能夠通過(guò)睡眠音頻的特征參數(shù)判決它的睡眠階段。3)本發(fā)明的方法簡(jiǎn)單有效,設(shè)備簡(jiǎn)單易實(shí)現(xiàn),低成本,易操作,性能可靠。
下面結(jié)合說(shuō)明書附圖對(duì)本發(fā)明做進(jìn)一步描述。
附圖說(shuō)明
圖1為本發(fā)明實(shí)現(xiàn)睡眠階段判決的步驟框圖。
圖2為本發(fā)明機(jī)器學(xué)習(xí)結(jié)構(gòu)圖。
圖3為原始睡眠音頻波形圖。
圖4為降噪后的睡眠音頻波形圖。
圖5為聲音事件檢測(cè)后的睡眠音頻波形圖。
圖6為機(jī)器學(xué)習(xí)分類的混淆矩陣圖。
具體實(shí)施方式
結(jié)合附圖,本發(fā)明的一種基于非線性動(dòng)力學(xué)的睡眠階段分期方法,包括以下步驟:
步驟1:用音頻設(shè)備采集監(jiān)護(hù)者整夜的睡眠音頻信號(hào),同時(shí)用標(biāo)準(zhǔn)psg儀對(duì)實(shí)驗(yàn)者進(jìn)行睡眠監(jiān)測(cè),得到睡眠階段標(biāo)簽;
步驟2:將步驟1采集到的音頻信號(hào)與標(biāo)準(zhǔn)psg儀采集到的睡眠階段標(biāo)簽按照對(duì)應(yīng)法則一一對(duì)應(yīng);
所述對(duì)應(yīng)法則為:音頻標(biāo)簽a為清醒期即入睡前的準(zhǔn)備階段,對(duì)應(yīng)psg結(jié)果的入睡期n1,音頻標(biāo)簽b為nrem期即包括輕度睡眠、中度睡眠、深度睡眠的階段,對(duì)應(yīng)psg結(jié)果的淺睡期n2和深睡期n3,標(biāo)簽c為rem期即快速眼球運(yùn)動(dòng)階段,對(duì)應(yīng)psg結(jié)果的快速眼球運(yùn)動(dòng)rem。
步驟3:對(duì)步驟1采集到的音頻信號(hào)進(jìn)行預(yù)處理,具體為:對(duì)錄取的音頻信號(hào)進(jìn)行降噪處理,得到降噪處理后的睡眠音頻,對(duì)降噪后的睡眠音頻信號(hào)進(jìn)行聲音事件檢測(cè),得到聲音事件,其中所述聲音事件具體為人體一呼一吸產(chǎn)生的音頻;其步驟為:
步驟3-1:對(duì)音頻信號(hào)se(n)進(jìn)行加窗分幀處理,計(jì)算每幀音頻信號(hào)sei(m)的能量ampi和短時(shí)譜熵h(i),能熵比eefi表示為
其中sei(m)的下標(biāo)i表示為第i幀;
步驟3-2:根據(jù)能熵比使用雙門限檢測(cè)法進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),檢測(cè)出有效的聲音事件;其中雙門限檢測(cè)法中的閾值t2=a1×det+eth,t1=a2×det+eth,det為能熵比eefi的最大值,eth為睡眠音頻信號(hào)前置無(wú)話段的能熵比均值,a1、a2為det的權(quán)重。
步驟4:采用非線性動(dòng)力學(xué)分析方法對(duì)檢測(cè)到的聲音事件進(jìn)行特征提取,所述特征具體為:時(shí)間延遲
步驟4-1:求取時(shí)間延遲
步驟4-2:求取嵌入維數(shù)
步驟4-2-1:由相空間重構(gòu)理論,根據(jù)步驟4-1得到的時(shí)間延遲τ,將一維聲音事件時(shí)間序列x(n)嵌入到m維空間y中;
步驟4-2-2:改變維數(shù)m=m+1,計(jì)算虛假鄰近點(diǎn)的個(gè)數(shù);
步驟4-2-3:當(dāng)虛假近鄰點(diǎn)個(gè)數(shù)占全部m維空間中相矢量的比例小于自定義閾值b時(shí),此時(shí)的維數(shù)m為聲音事件時(shí)間序列x(n)的最佳嵌入維數(shù);否則返回步驟4-2-2。
步驟4-2-4:將每個(gè)聲音事件時(shí)間序列x(n)的最佳嵌入維數(shù)m取平均,得到每幀內(nèi)所有聲音事件的平均嵌入維數(shù)
步驟4-3:求取近似熵
步驟4-3-1:將聲音事件的一維時(shí)間序列x(n)=(x1,x2,x3,…,xi,…,xk)按順序組成v維矢量vi=[x(i),x(i+1),...,x(i+v-1)],i=1,2,...,k,
其中k為聲音事件時(shí)間序列x(n)的長(zhǎng)度;
步驟4-3-2:對(duì)每一個(gè)i值計(jì)算相矢量vi和其余矢量vj的距離
dij=max|x(i+l)-x(j+l)|,l=0,1,...,v-1;
步驟4-3-3:給定閾值r=a3×sd,其中a3的取值范圍為0.1~0.25,sd為聲音事件時(shí)間序列x(n)的標(biāo)準(zhǔn)差;記錄每個(gè)dij小于閾值r對(duì)應(yīng)的i的個(gè)數(shù),并求出與總的v維相矢量個(gè)數(shù)(k-v+1)的比值,記為
步驟4-3-4:確定聲音事件時(shí)間序列x(n)的近似熵為apen=φv(r)-φv+1(r);
步驟4-3-5:將每個(gè)聲音事件時(shí)間序列x(n)的近似熵apen取平均,得到每幀內(nèi)所有聲音事件的平均近似熵
步驟4-4:求取高維個(gè)數(shù)n,具體為:記錄步驟4-2中每幀內(nèi)嵌入維數(shù)m≥4的聲音事件時(shí)間序列x(n)的個(gè)數(shù);
步驟4-5:求取最大李雅普諾夫指數(shù)
步驟4-5-1:根據(jù)步驟4-1求得的時(shí)間延遲τ和步驟4-2求得的嵌入維數(shù)m重構(gòu)相空間w,對(duì)每個(gè)點(diǎn)wj尋找其最近鄰點(diǎn)w′j,計(jì)算wj到w′j的距離dj(0)=|wj-w′j|;
步驟4-5-2:對(duì)每個(gè)點(diǎn)wj,計(jì)算其與最近鄰點(diǎn)w′j在第i步前向演化后的距離dj(i)=|wj+i-w′j+i|=dj(0)×eλ×i;
步驟4-5-3:由下式算得最大李雅普諾夫指數(shù),
其中p為非零的dj(i)的個(gè)數(shù);
步驟4-5-4:將每個(gè)聲音事件時(shí)間序列x(n)的最大李雅普諾夫指數(shù)λ取平均,得到每幀內(nèi)所有聲音事件的平均最大李雅普諾夫指數(shù)
步驟5:將提取得到的特征參數(shù)與對(duì)應(yīng)的標(biāo)簽輸入到機(jī)器學(xué)習(xí)中,通過(guò)機(jī)器學(xué)習(xí)方法來(lái)確定睡眠階段與特征參數(shù)之間的映射模型;具體為:
步驟5-1:將睡眠音頻信號(hào)的非線性特征數(shù)據(jù)隨機(jī)分成兩個(gè)互斥集,其中一個(gè)為訓(xùn)練集s,另一個(gè)為交叉檢驗(yàn)集cv,并將這些數(shù)據(jù)的睡眠階段進(jìn)行標(biāo)記,即標(biāo)記為a、b或c,a為清醒期,b為nrem期,c為rem期;
步驟5-2:將訓(xùn)練集s={(f1,l1),(f2,l2),...(fi,li),...,(fw,lw)}的特征矩陣輸入機(jī)器學(xué)習(xí)方法中,其中fi=(fi1,fi2,fi3,fi4,fi5)分別為步驟4中提取的5個(gè)非線性動(dòng)力學(xué)特征
步驟5-3:隨機(jī)從訓(xùn)練集取一個(gè)樣本放入采樣集中,再把該樣本放回初始訓(xùn)練集中,使得下次采樣時(shí)該樣本仍有可能被選中,經(jīng)過(guò)w次隨機(jī)采樣操作后得到w個(gè)樣本的采樣集,重復(fù)t次,得到t組含w個(gè)訓(xùn)練樣本的采樣集;
步驟5-4:基于每個(gè)采樣集的特征矩陣去訓(xùn)練出一個(gè)睡眠階段分期基學(xué)習(xí)器,得到t個(gè)睡眠階段分期基學(xué)習(xí)器,映射模型m1由這t個(gè)睡眠階段分期基學(xué)習(xí)器組成,具體采用投票法進(jìn)行輸出;
所訓(xùn)練的睡眠階段分期基學(xué)習(xí)器為決策樹,具體為:
步驟5-4-1:遍歷各個(gè)特征,計(jì)算其的基尼值,其公式為:
δgini(ac)=gini(a)-giniac(a)
第一個(gè)公式中,數(shù)據(jù)集a為步驟5-3中w個(gè)訓(xùn)練樣本的采樣集,gini(a)表示的是數(shù)據(jù)集a的基尼指數(shù),ri表示第i類樣本在數(shù)據(jù)集a中的比例,pc為睡眠階段的標(biāo)簽數(shù);第二個(gè)公式中,ac為步驟4中得到的特征
步驟5-4-2:以步驟5-4-1生成的節(jié)點(diǎn)作為根節(jié)點(diǎn),重復(fù)5-4-1的過(guò)程,選取新的材料特征作為分裂條件,數(shù)據(jù)a全部被劃分完。
或者,所訓(xùn)練的睡眠階段分期基學(xué)習(xí)器為多類別分類的svm,具體為:
步驟5-4-a:若含w個(gè)樣本的采樣集中都包含了3個(gè)睡眠階段類別的數(shù)據(jù),對(duì)3個(gè)睡眠階段類別,做q次劃分,這里q的取值必須大于3,每次隨機(jī)劃分將一部分類別劃分成正類,記為(+1),另一部分類別劃分為反類,記為(-1),這里每一組對(duì)應(yīng)的正類和負(fù)類即為一個(gè)訓(xùn)練集;共產(chǎn)生q個(gè)訓(xùn)練集;
步驟5-4-b:將5-4-a生成的q個(gè)訓(xùn)練集分別訓(xùn)練svm,得到q個(gè)svm學(xué)習(xí)器,這樣每一類的數(shù)據(jù)輸入這q個(gè)svm學(xué)習(xí)器中得到相應(yīng)的編碼,組成3*q的編碼矩陣;
步驟5-4-c:利用q個(gè)分類器分別對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),預(yù)測(cè)標(biāo)記組成一個(gè)編碼,將這個(gè)編碼與每個(gè)類別各自的編碼進(jìn)行比較,返回其中距離最小的類別作為最終預(yù)測(cè)的結(jié)果,這q個(gè)svm分類器組成了多類別分類的svm學(xué)習(xí)器。
步驟5-5:使用交叉檢驗(yàn)集cv對(duì)睡眠階段與特征參數(shù)之間的映射模型m1進(jìn)行進(jìn)一步調(diào)參優(yōu)化,得到映射模型m。具體為:
步驟5-5-1、確定睡眠階段分期基學(xué)習(xí)器的參數(shù),當(dāng)睡眠階段分期基學(xué)習(xí)器為決策樹時(shí),參數(shù)包括決策數(shù)的分裂時(shí)參與判斷的最大特征數(shù)max_feature、最大深度max_depth、分裂所需的最小樣本數(shù)min_samples_split;當(dāng)睡眠階段分期基學(xué)習(xí)器為多類別分類的svm時(shí),參數(shù)為svm的懲罰參數(shù)c、核函數(shù)參數(shù)gamma;
步驟5-5-2、對(duì)每個(gè)參數(shù)進(jìn)行一次直線搜索,具體為,利用cv集對(duì)基學(xué)習(xí)器進(jìn)行訓(xùn)練,計(jì)算模型性能與參數(shù)之間的梯度;
步驟5-5-3、根據(jù)模型性能與各個(gè)參數(shù)之間的梯度,選取梯度值最大的參數(shù)作為當(dāng)前調(diào)優(yōu)參數(shù),利用梯度下降法對(duì)當(dāng)前調(diào)優(yōu)參數(shù)進(jìn)行調(diào)優(yōu);
步驟5-5-4、重復(fù)步驟5-5-2,5-5-3,直到所有參數(shù)的梯度小于閾值threshold,這里的threshold為一個(gè)接近0的正數(shù);
步驟5-5-5、調(diào)整睡眠階段分期基學(xué)習(xí)器個(gè)數(shù)t,具體為:計(jì)算模型性能與t之間的梯度,利用梯度下降法對(duì)基學(xué)習(xí)器個(gè)數(shù)t進(jìn)行調(diào)優(yōu),得到最終的睡眠階段分期基學(xué)習(xí)器個(gè)數(shù)。
步驟6:根據(jù)步驟5得到的映射模型,對(duì)音頻設(shè)備錄取的音頻信號(hào)進(jìn)行睡眠階段分期。
本發(fā)明的方法簡(jiǎn)單有效,設(shè)備簡(jiǎn)單易實(shí)現(xiàn),低成本,易操作,性能可靠。
下面結(jié)合實(shí)施例,進(jìn)一步闡述本發(fā)明。
實(shí)施例1
一種基于非線性動(dòng)力學(xué)的睡眠階段分期方法,包括以下步驟:
步驟1:用音頻設(shè)備采集監(jiān)護(hù)者整夜的睡眠音頻信號(hào),同時(shí)用標(biāo)準(zhǔn)psg儀對(duì)實(shí)驗(yàn)者進(jìn)行睡眠監(jiān)測(cè),得到睡眠階段標(biāo)簽;
步驟2:將步驟1采集到的音頻信號(hào)與標(biāo)準(zhǔn)psg儀的睡眠階段標(biāo)簽按照對(duì)應(yīng)法則一一對(duì)應(yīng);
步驟3:對(duì)步驟1采集到的音頻信號(hào)進(jìn)行預(yù)處理,具體為:對(duì)錄取的音頻信號(hào)進(jìn)行降噪處理,得到降噪處理后的睡眠音頻,截取監(jiān)護(hù)者從清醒到深度睡眠的一個(gè)周期的降噪后的音頻信號(hào),通過(guò)能熵比法對(duì)語(yǔ)音端點(diǎn)進(jìn)行檢測(cè),從睡眠音頻信號(hào)中檢測(cè)出有效的聲音事件,其步驟為:
步驟3-1:對(duì)睡眠音頻信號(hào)x(n)進(jìn)行加窗分幀處理,計(jì)算每幀音頻信號(hào)xi(m)的能量ampi和短時(shí)譜熵h(i),能熵比eefi表示為
其中xi(m)的下標(biāo)i表示為第i幀;
步驟3-2:根據(jù)能熵比使用雙門限檢測(cè)法進(jìn)行語(yǔ)音端點(diǎn)檢測(cè),檢測(cè)出有效的聲音事件;其中雙門限檢測(cè)法中的閾值t2=a1×det+eth,t1=a2×det+eth,det為能熵比eefi的最大值,eth為睡眠音頻信號(hào)前置無(wú)話段的能熵比均值,根據(jù)實(shí)際情況,將a1取值為0.04,a2取值為0.015。
步驟4:檢測(cè)到聲音事件后,對(duì)音頻進(jìn)行分幀,幀長(zhǎng)為30s;
步驟5:采用非線性動(dòng)力學(xué)分析方法對(duì)檢測(cè)到的聲音事件進(jìn)行特征提取,提取的特征為:時(shí)間延遲
步驟5-1:求取時(shí)間延遲
步驟5-2:求取嵌入維數(shù)
步驟5-2-1:由相空間重構(gòu)理論,根據(jù)步驟5-1得到的時(shí)間延遲τ,將一維音頻時(shí)間序列x(n)嵌入到m維空間y中;
步驟5-2-2:改變維數(shù)m=m+1,計(jì)算虛假鄰近點(diǎn)的個(gè)數(shù);
步驟5-2-3:當(dāng)虛假近鄰點(diǎn)個(gè)數(shù)占全部m維空間中相矢量的比例小于自定義閾值b時(shí),此時(shí)的維數(shù)m為聲音事件的一維時(shí)間序列x的最佳嵌入維數(shù);否則返回步驟5-2-2;
步驟5-2-4:將每個(gè)聲音事件x(n)的最佳嵌入維數(shù)m取平均,得到每幀內(nèi)所有聲音事件的平均嵌入維數(shù)
步驟5-3:求取近似熵
步驟5-3-1:將聲音事件的一維時(shí)間序列x(n)=(x1,x2,x3,...,xi,...,xk)按順序組成v維矢量vi=[x(i),x(i+1),...,x(i+v-1)],i=1,2,...,k,
其中k為音頻時(shí)間序列x(n)的長(zhǎng)度,v=2;
步驟5-3-2:對(duì)每一個(gè)i值計(jì)算相矢量vi和其余矢量vj的距離dij=max|x(i+l)-x(j+l)|,l=0,1,...,v-1;
步驟5-3-3:給定閾值r=a3×sd,其中a3=0.25,sd為音頻序列x的標(biāo)準(zhǔn)差。記錄每個(gè)dij小于閾值r對(duì)應(yīng)的i的個(gè)數(shù),并求出與總的v維相矢量個(gè)數(shù)(k-v+1)的比值,記為
步驟5-3-4:確定聲音事件x(n)的近似熵為apen=φv(r)-φv+1(r);
步驟5-3-5:將每個(gè)聲音事件x(n)的近似熵apen取平均,得到每幀內(nèi)所有聲音事件的平均近似熵
步驟5-4:求取高維個(gè)數(shù)n,具體為:記錄步驟5-2中每幀內(nèi)嵌入維數(shù)m≥4的聲音事件個(gè)數(shù);
步驟5-5:求取最大李雅普諾夫指數(shù)
步驟5-5-1:根據(jù)步驟5-1求得的時(shí)間延遲τ和步驟5-2求得的嵌入維數(shù)m重構(gòu)相空間w,對(duì)每個(gè)點(diǎn)wj尋找其最近鄰點(diǎn)w′j,計(jì)算wj到w′j的距離dj(0)=|wj-w′j|;
步驟5-5-2:對(duì)每個(gè)點(diǎn)wj,計(jì)算其與最近鄰點(diǎn)w′j在第i步前向演化后的距離dj(i)=|wj+i-w′j+i|=dj(0)×eλ×i;
步驟5-5-3:由下式算得最大李雅普諾夫指數(shù),
其中p為非零的dj(i)的個(gè)數(shù)。
步驟5-5-4:將每個(gè)聲音事件x(n)的最大李雅普諾夫指數(shù)λ取平均,得到每幀內(nèi)所有聲音事件的平均最大李雅普諾夫指數(shù)
步驟6:將提取得到的特征參數(shù)與對(duì)應(yīng)的標(biāo)簽輸入到機(jī)器學(xué)習(xí)中,通過(guò)機(jī)器學(xué)習(xí)方法來(lái)確定睡眠階段與特征參數(shù)之間的映射模型,具體為:
步驟6-1:將睡眠音頻信號(hào)的非線性特征數(shù)據(jù)隨機(jī)分成兩個(gè)互斥集,其中一個(gè)為訓(xùn)練集s,另一個(gè)為交叉檢驗(yàn)集cv,并將這些數(shù)據(jù)的睡眠階段進(jìn)行標(biāo)記,即標(biāo)記為a、b或c,a為清醒期,b為nrem期,c為rem期;
步驟6-2:將訓(xùn)練集s={(f1,l1),(f2,l2),...(fi,li),...,(fw,lw)}的特征矩陣輸入機(jī)器學(xué)習(xí)方法中,其中fi=(fi1,fi2,fi3,fi4,fi5)分別為步驟5中提取的5個(gè)非線性動(dòng)力學(xué)特征
步驟6-3:隨機(jī)從訓(xùn)練集取一個(gè)樣本放入采樣集中,再把該樣本放回初始訓(xùn)練集中,使得下次采樣時(shí)該樣本仍有可能被選中,經(jīng)過(guò)w次隨機(jī)采樣操作后得到w個(gè)樣本的采樣集,重復(fù)t次,得到t組含w個(gè)訓(xùn)練樣本的采樣集;
步驟6-4:基于每個(gè)采樣集的特征矩陣去訓(xùn)練出一個(gè)睡眠階段分期基學(xué)習(xí)器,得到t個(gè)睡眠階段分期基學(xué)習(xí)器,映射模型m1由這t個(gè)睡眠階段分期基學(xué)習(xí)器組成,它采用投票法進(jìn)行輸出;這里的基學(xué)習(xí)器可以是決策樹,具體為:
步驟6-4-1:遍歷各個(gè)特征,計(jì)算其的基尼值,其公式為:
δgini(a)=gini(a)-ginia(a)
第一個(gè)公式中,數(shù)據(jù)集a為步驟6-3中w個(gè)訓(xùn)練樣本的采樣集,gini(a)表示的是數(shù)據(jù)集a的基尼指數(shù),ri表示第i類樣本在數(shù)據(jù)集a中的比例;第二個(gè)公式中,a是步驟5中得到的特征
步驟6-4-2、以步驟6-4-1生成的節(jié)點(diǎn)作為根節(jié)點(diǎn),重復(fù)6-4-1的過(guò)程,選取新的姿態(tài)特征作為分裂條件,直至數(shù)據(jù)集a全部被劃分完;
這里的基學(xué)習(xí)器也可以是多類別分類的svm,具體構(gòu)建方法為:
步驟6-4-a:若含w個(gè)樣本的采樣集中都包含了3個(gè)睡眠階段類別的數(shù)據(jù),對(duì)3個(gè)睡眠階段類別,做q次劃分,這里q的取值必須大于3,每次隨機(jī)劃分將一部分類別劃分成正類,記為(+1),另一部分類別劃分為反類,記為(-1),這里每一組對(duì)應(yīng)的正類和負(fù)類即為一個(gè)訓(xùn)練集;共產(chǎn)生q個(gè)訓(xùn)練集;
步驟6-4-b:將6-4-a生成的q個(gè)訓(xùn)練集分別訓(xùn)練svm,得到q個(gè)svm學(xué)習(xí)器,這樣每一類的數(shù)據(jù)輸入這q個(gè)svm學(xué)習(xí)器中得到相應(yīng)的編碼,組成3*q的編碼矩陣;
步驟6-4-c:利用q個(gè)分類器分別對(duì)測(cè)試樣本進(jìn)行預(yù)測(cè),預(yù)測(cè)標(biāo)記組成一個(gè)編碼,將這個(gè)編碼與每個(gè)類別各自的編碼進(jìn)行比較,返回其中距離最小的類別作為最終預(yù)測(cè)的結(jié)果,這q個(gè)svm分類器組成了多類別分類的svm學(xué)習(xí)器;
步驟6-5:使用交叉檢驗(yàn)集cv對(duì)睡眠階段與特征參數(shù)之間的映射模型m1進(jìn)行進(jìn)一步調(diào)參優(yōu)化,得到映射模型m,具體為;
步驟6-5-1、根據(jù)具體情況,確定睡眠階段分期基學(xué)習(xí)器的參數(shù),當(dāng)睡眠階段分期基學(xué)習(xí)器為決策樹時(shí),參數(shù)包括決策數(shù)的分裂時(shí)參與判斷的最大特征數(shù)max_feature、最大深度max_depth、分裂所需的最小樣本數(shù)min_samples_split;當(dāng)睡眠階段分期基學(xué)習(xí)器為多類別分類的svm時(shí),參數(shù)為svm的懲罰參數(shù)c、核函數(shù)參數(shù)gamma。
步驟6-5-2、對(duì)每個(gè)參數(shù)進(jìn)行一次直線搜索,具體為,利用cv集對(duì)基學(xué)習(xí)器進(jìn)行訓(xùn)練,計(jì)算模型性能與參數(shù)之間的梯度;
步驟6-5-3、根據(jù)模型性能與各個(gè)參數(shù)之間的梯度,選取梯度值最大的參數(shù)作為當(dāng)前調(diào)優(yōu)參數(shù),利用梯度下降法對(duì)當(dāng)前調(diào)優(yōu)參數(shù)進(jìn)行調(diào)優(yōu);
步驟6-5-4、重復(fù)步驟6-5-2,6-5-3,直到所有參數(shù)的梯度小于閾值threshold,閾值threshold取值為0.001;
步驟6-5-5、調(diào)整睡眠階段分期基學(xué)習(xí)器個(gè)數(shù)t,具體為:計(jì)算模型性能與t之間的梯度,利用梯度下降法對(duì)基學(xué)習(xí)器個(gè)數(shù)t進(jìn)行調(diào)優(yōu),得到最終的睡眠階段分期基學(xué)習(xí)器個(gè)數(shù)。
步驟7:根據(jù)機(jī)器學(xué)習(xí)確定的睡眠階段與特征參數(shù)之間的映射模型m,對(duì)音頻設(shè)備獲取的睡眠音頻信號(hào)進(jìn)行睡眠階段的分期。
實(shí)施例2
結(jié)合圖1,基于非線性動(dòng)力學(xué)的睡眠階段分期的步驟如下:
步驟1:用音頻設(shè)備采集監(jiān)護(hù)者兩整夜共841分鐘的睡眠音頻信號(hào),同時(shí)記錄psg儀所記錄的睡眠階段。將錄取的音頻信號(hào)進(jìn)行降噪處理,提取較為純凈的音頻信號(hào)。其中圖3為整夜睡眠音頻信號(hào)中的164s的音頻波形圖,圖4為將這164s睡眠音頻信號(hào)進(jìn)行降噪處理后的音頻波形圖;
步驟2:將音頻與psg的睡眠階段標(biāo)簽按照對(duì)應(yīng)法則一一對(duì)應(yīng);
步驟3:截取監(jiān)護(hù)者從清醒到深度睡眠的一個(gè)周期的降噪后的音頻信號(hào),進(jìn)行聲音事件檢測(cè),周期為90min;
步驟4:檢測(cè)到聲音事件后,對(duì)音頻進(jìn)行分幀,幀長(zhǎng)為30s,圖5為將步驟1中降噪后的睡眠音頻信號(hào)進(jìn)行聲音事件檢測(cè)后的音頻波形圖;
步驟5:提取聲音事件的非線性動(dòng)力學(xué)參數(shù),具體為:時(shí)間延遲
步驟6:將提取得到的特征參數(shù)與對(duì)應(yīng)的標(biāo)簽輸入到機(jī)器學(xué)習(xí)中,通過(guò)機(jī)器學(xué)習(xí)方法來(lái)確定睡眠階段與特征參數(shù)之間的映射模型m1:
將五整夜2101分鐘,每分鐘2幀的睡眠音頻信號(hào)通過(guò)步驟4進(jìn)行特征提取后,組成4202個(gè){(fi1,fi2,fi3,fi4,fi5),li}的特征矩陣,li為以psg結(jié)果作對(duì)比得到的標(biāo)簽。其中將2520個(gè)特征矩陣作為訓(xùn)練集s,1682個(gè)特征矩陣作為交叉檢驗(yàn)集cv。將訓(xùn)練集s的特征矩陣輸入機(jī)器學(xué)習(xí)算法中,從特征矩陣中隨機(jī)取一個(gè)樣本放入采樣矩陣中,經(jīng)過(guò)2520次隨機(jī)采樣操作得到含2520個(gè)樣本的采樣矩陣,重復(fù)20次,得20個(gè)含2520個(gè)樣本的采樣矩陣,然后基于每個(gè)采樣矩陣去訓(xùn)練出一個(gè)睡眠階段分期基學(xué)習(xí)器,這里基學(xué)習(xí)器使用的是決策樹,得到20個(gè)睡眠階段分期基學(xué)習(xí)器,利用投票法將20個(gè)基學(xué)習(xí)器所得到的結(jié)果進(jìn)行結(jié)合,當(dāng)預(yù)測(cè)出睡眠階段收到同樣的票數(shù)時(shí),隨機(jī)選擇一個(gè)睡眠階段,最后得到睡眠階段與特征參數(shù)之間的映射模型m1;
步驟7、將交叉檢驗(yàn)集cv中的1682個(gè)特征矩陣輸入姿態(tài)識(shí)別映射模型m1中通過(guò)其他基學(xué)習(xí)器參數(shù)修改t的值和進(jìn)一步優(yōu)化姿態(tài)識(shí)別映射模型的識(shí)別精度,得到姿態(tài)識(shí)別映射模型m,其中最大特征數(shù)max_feature為12,最大深度max_depth為none,分裂所需的最小樣本數(shù)min_samples_split為2。
步驟8:根據(jù)步驟7得到的映射模型m,對(duì)音頻設(shè)備錄取的音頻信號(hào)進(jìn)行睡眠階段分期。
其中圖3為機(jī)器學(xué)習(xí)分類的混淆矩陣。根據(jù)所訓(xùn)練的睡眠階段與特征參數(shù)之間的映射模型,分類準(zhǔn)確度能達(dá)到86.3%。
由此可知,基于非線性動(dòng)力學(xué)的睡眠階段分期有很高的可實(shí)施性。