專利名稱:基于語(yǔ)音端點(diǎn)檢測(cè)的人工耳蝸?zhàn)詣?dòng)增益控制方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及電子耳蝸技術(shù)領(lǐng)域,特別是指一種基于語(yǔ)音端點(diǎn)檢測(cè)的人工耳蝸?zhàn)詣?dòng)增益控制方法和系統(tǒng)。
背景技術(shù):
人的耳蝸毛細(xì)胞是接收聲音的感覺(jué)細(xì)胞。當(dāng)耳蝸毛細(xì)胞損傷嚴(yán)重時(shí),就會(huì)出現(xiàn)嚴(yán)重的聽(tīng)力損傷。電子耳蝸就是替代已損傷毛細(xì)胞,通過(guò)電刺激聽(tīng)覺(jué)神經(jīng)重新獲得聲音信號(hào)的一種電子裝置。
圖1顯示的是電子耳蝸的結(jié)構(gòu)示意圖。電子耳蝸由體外機(jī)部件和植入體部件兩部分組成,體外機(jī)部件主要包括傳聲器(如麥克風(fēng)等)、言語(yǔ)處理器和發(fā)射線圈,植入體部件主要包括接收線圈、刺激器及多通道電極陣列組成。在系統(tǒng)連接正常的情況下,麥克風(fēng)接收聲信號(hào),通過(guò)言語(yǔ)處理器,將聲信號(hào)進(jìn)行分析處理并編碼,通過(guò)頭件(發(fā)射線圈)透過(guò)皮膚傳送到植入體部件的接收線圈,經(jīng)過(guò)刺激器的解碼處理后,產(chǎn)生相應(yīng)頻率及電流強(qiáng)度的脈沖信號(hào)并傳送到各個(gè)刺激電極。通過(guò)電極刺激聽(tīng)神經(jīng),將脈沖信號(hào)傳到聽(tīng)覺(jué)中樞從而為使用者產(chǎn)生聽(tīng)覺(jué)。對(duì)于正常聽(tīng)力者而言,聲音的響度承受范圍是120dB,而對(duì)于人工耳蝸植入者,電刺激的動(dòng)態(tài)范圍僅有5-15 dB左右。設(shè)計(jì)人工耳蝸言語(yǔ)處理的一個(gè)重要指標(biāo)是輸入聲信號(hào)的動(dòng)態(tài)范圍,這決定了將多少動(dòng)態(tài)范圍的聲信號(hào)壓縮到5-15dB的電刺激動(dòng)態(tài)范圍上。一般助聽(tīng)器或人工耳蝸的自動(dòng)增益系統(tǒng)以前一段時(shí)間輸入的聲信號(hào)聲強(qiáng)作為調(diào)整增益的依據(jù),增益調(diào)整的啟動(dòng)及恢復(fù)的時(shí)間是自動(dòng)增益調(diào)整的核心參數(shù)。在助聽(tīng)器中,一般認(rèn)為20ms左右的啟動(dòng)時(shí)間,200ms左右的恢復(fù)時(shí)間會(huì)讓佩戴者最為舒適。而在人工耳蝸中200ms左右的啟動(dòng)時(shí)間,Is左右的恢復(fù)時(shí)間會(huì)讓人工耳蝸植入者較為舒適。但在復(fù)雜的聽(tīng)音環(huán)境中,或是人工耳蝸植入者自己大聲說(shuō)話時(shí),傳統(tǒng)的自動(dòng)增益系統(tǒng)可能會(huì)頻繁的啟動(dòng)及恢復(fù),會(huì)導(dǎo)致人工耳蝸植入者在聽(tīng)音時(shí)感覺(jué)聲音忽大忽小。
發(fā)明內(nèi)容
有鑒于此,本發(fā)明的目的在于提出一種基于語(yǔ)音端點(diǎn)檢測(cè)的人工耳蝸?zhàn)詣?dòng)增益控制方法和系統(tǒng),提升了人工耳蝸使用者的聽(tīng)音能力,改善植入者對(duì)聲強(qiáng)輸入波動(dòng)較大時(shí)的言語(yǔ)識(shí)別效果。基于上述目的本發(fā)明提供的一種基于語(yǔ)音端點(diǎn)檢測(cè)的人工耳蝸?zhàn)詣?dòng)增益控制方法,包括以下步驟:采集外界的聲信號(hào),并將采集的聲信號(hào)進(jìn)行放大處理;其中,放大處理的增益值設(shè)置有默認(rèn)增益和嘈雜環(huán)境默認(rèn)增益;在對(duì)初次采集的聲信號(hào)進(jìn)行放大處理時(shí),初始增益值設(shè)置成默認(rèn)增益;將放大后的聲信號(hào)轉(zhuǎn)換成數(shù)字信號(hào);計(jì)算數(shù)字信號(hào)的短時(shí)能量,然后根據(jù)短時(shí)能量計(jì)算背景噪聲值;讀取當(dāng)前增益值,若讀取的增益值為默認(rèn)增益,則設(shè)置語(yǔ)音短時(shí)能量的高門限,將輸入的短時(shí)能量與語(yǔ)音短時(shí)能量的高門限進(jìn)行比較,找出將放大處理時(shí)的初始增益值進(jìn)行調(diào)整的語(yǔ)音端點(diǎn)的幀,即增益值調(diào)整的開(kāi)始;若讀取的增益值為嘈雜環(huán)境默認(rèn)增益,則設(shè)置語(yǔ)音短時(shí)能量的低門限和過(guò)零率的高門限,將輸入的短時(shí)能量與語(yǔ)音短時(shí)能量的低門限進(jìn)行比較,再通過(guò)過(guò)零率的判斷,確定語(yǔ)音的間隙,并在語(yǔ)音間隙將放大處理的增益值恢復(fù)為初始值;對(duì)轉(zhuǎn)換的數(shù)字信號(hào)進(jìn)行分頻處理,并將處理的結(jié)果合并為N個(gè)通道;對(duì)N個(gè)通道的每個(gè)包絡(luò)能量進(jìn)行聲-電刺激壓縮并輸出??蛇x地,計(jì)算數(shù)字信號(hào)的短時(shí)能量:首先,令輸入的短時(shí)語(yǔ)音(通常取一幀20ms)信號(hào)為S(n);根據(jù)公式:Sw(n)=S(n)*G,得到放大后的語(yǔ)音信號(hào)Sw(n);其中,G為當(dāng)前放大處理時(shí)的增益值;然后,根據(jù)放大后的語(yǔ)音信號(hào)Sw(n)得到短時(shí)能量E為:
權(quán)利要求
1.一種基于語(yǔ)音端點(diǎn)檢測(cè)的人工耳蝸?zhàn)詣?dòng)增益控制方法,其特征在于,包括以下步驟: 采集外界的聲信號(hào),并將采集的聲信號(hào)進(jìn)行放大處理;其中,放大處理的增益值設(shè)置有默認(rèn)增益和嘈雜環(huán)境默認(rèn)增益;在對(duì)初次采集的聲信號(hào)進(jìn)行放大處理時(shí),初始增益值設(shè)置成默認(rèn)增益; 將放大后的聲信號(hào)轉(zhuǎn)換成數(shù)字信號(hào); 計(jì)算數(shù)字信號(hào)的短時(shí)能量,然后根據(jù)短時(shí)能量計(jì)算背景噪聲值; 讀取當(dāng)前增益值,若讀取的增益值為默認(rèn)增益,則設(shè)置語(yǔ)音短時(shí)能量的高門限,將輸入的短時(shí)能量與語(yǔ)音短時(shí)能量的高門限進(jìn)行比較,找出將放大處理時(shí)的初始增益值進(jìn)行調(diào)整的語(yǔ)音端點(diǎn)的幀,即增益值調(diào)整的開(kāi)始;若讀取的增益值為嘈雜環(huán)境默認(rèn)增益,則設(shè)置語(yǔ)音短時(shí)能量的低門限和過(guò)零率的高門限,將輸入的短時(shí)能量與語(yǔ)音短時(shí)能量的低門限進(jìn)行比較,再通過(guò)過(guò)零率的判斷,確定語(yǔ)音的間隙,并在語(yǔ)音間隙將放大處理的增益值恢復(fù)為初始值; 對(duì)轉(zhuǎn)換的數(shù)字信號(hào)進(jìn)行分頻處理,并將處理的結(jié)果合并為N個(gè)通道JiN個(gè)通道的每個(gè)包絡(luò)能量進(jìn)行聲-電刺激壓縮并輸出。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,計(jì)算數(shù)字信號(hào)的短時(shí)能量:首先,令輸入的短時(shí)語(yǔ)音(通常取一幀20ms)信號(hào)為S(n);根據(jù)公式:Sw(n)=S(n)*G,得到放大后的語(yǔ)音信號(hào)Sw(n);其中,G為當(dāng)前放大處理時(shí)的增益值; 然后,根據(jù)放大后的語(yǔ)音信號(hào)Sw(n)得到短時(shí)能量E為:
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,根據(jù)短時(shí)能量計(jì)算背景噪聲值: 首先,分別計(jì)算4個(gè)連續(xù)的20ms短時(shí)能量的均值; 然后,對(duì)此連續(xù)80ms的短時(shí)能量進(jìn)行累加平均:Εn=(Ε1+Ε2+Ε3+Ε4)/4 ;其中,El, E2,E3,E4分別為4個(gè)連續(xù)20ms短時(shí)能量的均值;根據(jù)上述方法計(jì)算8s左右的時(shí)間內(nèi),每連續(xù)80ms的短時(shí)能量的均值,即En(1)至En (100); 最后,在8s左右的時(shí)間內(nèi),找出短時(shí)能量最小值,即為En(I)至En(IOO)之間的最小值,作為聲信號(hào)背景噪聲值。
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,讀取當(dāng)前增益值,若讀取的增益值為默認(rèn)增益,則設(shè)置語(yǔ)音短時(shí)能量的高門限: 當(dāng)輸入的短時(shí)能量小于語(yǔ)音短時(shí)能量的高門限時(shí),保持當(dāng)前增益值; 當(dāng)輸入的短時(shí)能量大于語(yǔ)音短時(shí)能量的高門限時(shí),將下次對(duì)采集的聲信號(hào)進(jìn)行放大處理時(shí)的增益值調(diào)整為嘈雜環(huán)境默認(rèn)增益。
5.根據(jù)權(quán)利要求3所述的方法,其特征在于,若讀取的增益值為嘈雜環(huán)境默認(rèn)增益,則設(shè)置語(yǔ)音短時(shí)能量的低門限: 當(dāng)輸入的短時(shí)能量大于語(yǔ)音短時(shí)能量的低門限時(shí),保持當(dāng)前增益值; 當(dāng)輸入的短時(shí)能量小于語(yǔ)音短時(shí)能量的低門限時(shí),計(jì)算當(dāng)前幀信號(hào)的過(guò)零率,并且設(shè)置過(guò)零率高門限: 其中,當(dāng)所得的過(guò)零率大于過(guò)零率高門限時(shí),保持當(dāng)前增益值;其中,當(dāng)所得的過(guò)零率小于過(guò)零率高門限時(shí),保持當(dāng)前增益值;當(dāng)連續(xù)檢測(cè)到3幀信號(hào)的輸入的短時(shí)能量小于語(yǔ)音短時(shí)能量的低門限,且同時(shí)滿足得到的過(guò)零率小于過(guò)零率高門限,將放大處理的增益值恢復(fù)為初始值默認(rèn)增益。
6.一種基于語(yǔ)音端點(diǎn)檢測(cè)的人工耳蝸?zhàn)詣?dòng)增益控制系統(tǒng),其特征在于,包括: 聲信號(hào)采集單元,用于采集外界的聲信號(hào); 聲信號(hào)放大單元,與聲信號(hào)采集單元相連,用于將采集的聲信號(hào)進(jìn)行放大處理;其中,放大處理的增益值設(shè)置有默認(rèn)增益和嘈雜環(huán)境默認(rèn)增益;在對(duì)初次采集的聲信號(hào)進(jìn)行放大處理時(shí),初始增益值設(shè)置成默認(rèn)增益; 轉(zhuǎn)換單元,與聲信號(hào)放大單元相連,用于將放大后的聲信號(hào)轉(zhuǎn)換成數(shù)字信號(hào); 短時(shí)能量和背景噪聲值獲取單元,與轉(zhuǎn)換單元相連,用于計(jì)算數(shù)字信號(hào)的短時(shí)能量,然后根據(jù)短時(shí)能量計(jì)算背景噪聲值; 增益狀態(tài)讀取單元,與短時(shí)能量和背景噪聲值獲取單元相連,用于讀取當(dāng)前聲信號(hào)放大單元的增益值;若增益值為默認(rèn)增益,則增益狀態(tài)讀取單元與增益狀態(tài)I處理單元相連;若增益值為嘈雜環(huán)境默認(rèn)增,則增益狀態(tài)讀取單元與增益狀態(tài)2處理單元相連; 增益狀態(tài)I處理單元,用于設(shè)置語(yǔ)音短時(shí)能量的高門限,將輸入的短時(shí)能量與語(yǔ)音短時(shí)能量的高門限進(jìn)行比較,找出將放大處理時(shí)的初始增益值進(jìn)行調(diào)整的語(yǔ)音端點(diǎn)的幀,即增益值調(diào)整的開(kāi)始; 增益狀態(tài)2處理單元,用于設(shè)置語(yǔ)音短時(shí)能量的低門限和過(guò)零率的高門限,將輸入的短時(shí)能量與語(yǔ)音短時(shí)能量的低門限進(jìn)行比較,再通過(guò)過(guò)零率的判斷,確定即語(yǔ)音的間隙,并在語(yǔ)音間隙將放大處理的增益值恢復(fù)為初始值; 分頻和合并通道處理單元,用于對(duì)轉(zhuǎn)換的數(shù)字信號(hào)進(jìn)行分頻處理,并將處理的結(jié)果合并為N個(gè)通道; 聲-電刺激壓縮單元,與聲-電刺激壓縮單元相連,用于對(duì)N個(gè)通道的每個(gè)包絡(luò)能量進(jìn)行聲-電刺激壓縮并輸出。
7.根據(jù)權(quán)利要求6所述的系統(tǒng),其特征在于,所述的短時(shí)能量和背景噪聲值獲取單元在計(jì)算數(shù)字信號(hào)的短時(shí)能量時(shí),首先,令輸入的短時(shí)語(yǔ)音(通常取一幀20ms)信號(hào)為S(n);根據(jù)公式:Sw(n)=S(n)*G,得到放大后的語(yǔ)音信號(hào)Sw(η);其中,G為當(dāng)前放大處理時(shí)的增益值; 然后,根據(jù)放大后的語(yǔ)音信號(hào)Sw(η)得到短時(shí)能量E為:
8.根據(jù)權(quán)利要求7所述的系統(tǒng),其特征在于,所述的短時(shí)能量和背景噪聲值獲取單元在根據(jù)短時(shí)能量計(jì)算背景噪聲值時(shí),首先,分別計(jì)算4個(gè)連續(xù)的20ms短時(shí)能量的均值; 然后,對(duì)此連續(xù)80ms的短時(shí)能量進(jìn)行累加平均:Εη=(Ε1+Ε2+Ε3+Ε4)/4 ;其中,El, E2,E3,E4分別為4個(gè)連續(xù)20ms短時(shí)能量的均值;根據(jù)上述方法計(jì)算8s左右的時(shí)間內(nèi),每連續(xù)80ms的短時(shí)能量的均值,即En(I)至En (100); 最后,在8s左右的時(shí)間內(nèi),找出短時(shí)能量最小值,即為En(I)至En(IOO)之間的最小值,作為聲信號(hào)背景噪聲值。
9.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述的增益狀態(tài)I處理單元設(shè)置語(yǔ)音短時(shí)能量的高門限,當(dāng)輸入的短時(shí)能量小于語(yǔ)音短時(shí)能量的高門限時(shí),保持當(dāng)前增益值;當(dāng)輸入的短時(shí)能量大于語(yǔ)音短時(shí)能量的高門限時(shí),將下次對(duì)采集的聲信號(hào)進(jìn)行放大處理時(shí)的增益值調(diào)整為嘈雜環(huán)境默認(rèn)增益。
10.根據(jù)權(quán)利要求8所述的系統(tǒng),其特征在于,所述的增益狀態(tài)2處理單元設(shè)置語(yǔ)音短時(shí)能量的低門限: 當(dāng)輸入的短時(shí)能量大于語(yǔ)音短時(shí)能量的低門限時(shí),保持當(dāng)前增益值; 當(dāng)輸入的短時(shí)能量小于語(yǔ)音短時(shí)能量的低門限時(shí),計(jì)算當(dāng)前幀信號(hào)的過(guò)零率,并且設(shè)置過(guò)零率高門限: 其中,當(dāng)所得的過(guò)零率大于過(guò)零率高門限時(shí),保持當(dāng)前增益值; 其中,當(dāng)所得的過(guò)零率小于過(guò)零率高門限時(shí),保持當(dāng)前增益值;當(dāng)連續(xù)檢測(cè)到3幀信號(hào)的輸入的短時(shí)能量小于語(yǔ)音短時(shí)能量的低門限,且同時(shí)滿足得到的過(guò)零率小于過(guò)零率高門限,將放大處理的增益值恢復(fù)為初始值默認(rèn)增益。
全文摘要
本發(fā)明公開(kāi)了一種基于語(yǔ)音端點(diǎn)檢測(cè)的人工耳蝸?zhàn)詣?dòng)增益控制方法和系統(tǒng),包括以下步驟將采集的聲信號(hào)進(jìn)行放大處理;放大的聲信號(hào)轉(zhuǎn)換成數(shù)字信號(hào);計(jì)算數(shù)字信號(hào)的短時(shí)能量,根據(jù)短時(shí)能量計(jì)算背景噪聲值;讀取當(dāng)前增益值,若增益值為默認(rèn)增益,設(shè)置語(yǔ)音短時(shí)能量的高門限,將輸入的短時(shí)能量與語(yǔ)音短時(shí)能量的高門限進(jìn)行比較,找出增益值調(diào)整的開(kāi)始;若增益值為嘈雜環(huán)境默認(rèn)增益,則設(shè)置語(yǔ)音短時(shí)能量的低門限,將輸入的短時(shí)能量與語(yǔ)音短時(shí)能量的低門限進(jìn)行比較,找出語(yǔ)音間隙;對(duì)轉(zhuǎn)換的數(shù)字信號(hào)分頻處理,并合并為N個(gè)通道;進(jìn)行聲-電刺激壓縮并輸出。通過(guò)本發(fā)明提升了人工耳蝸使用者的聽(tīng)音能力,改善植入者對(duì)聲強(qiáng)輸入波動(dòng)較大時(shí)的言語(yǔ)識(shí)別效果。
文檔編號(hào)A61F2/18GK103190965SQ201310062108
公開(kāi)日2013年7月10日 申請(qǐng)日期2013年2月28日 優(yōu)先權(quán)日2013年2月28日
發(fā)明者平利川, 陳洪斌, 唐國(guó)芳, 王松 申請(qǐng)人:杭州諾爾康神經(jīng)電子科技有限公司