專(zhuān)利名稱(chēng):一種用數(shù)字技術(shù)實(shí)現(xiàn)聽(tīng)覺(jué)改變反饋的方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種語(yǔ)音信號(hào)處理方法,確切的說(shuō)是一種用數(shù)字技術(shù)實(shí)現(xiàn)聽(tīng)覺(jué)改變反饋的方法,適用于口吃矯正或輔助治療。
背景技術(shù):
聽(tīng)覺(jué)改變反饋(Altered auditory feedback,以下稱(chēng)AAF)是指說(shuō)話者聽(tīng)到自身經(jīng)過(guò)改變后的語(yǔ)音的方式,它是一種利用聽(tīng)覺(jué)感官的言語(yǔ)反饋方法。AAF可以有聽(tīng)覺(jué)延遲反饋(Delayed Auditory Feedback,以下稱(chēng)DAF)、頻率改4變反饋(Frequency Altered Feedback,以下稱(chēng)FAF)和掩蔽聽(tīng)覺(jué)反饋(masking auditory feedback,以下稱(chēng)MAF)三種方式??诔曰颊呤褂寐?tīng)覺(jué)改變反饋方式說(shuō)話,可以提高說(shuō)話者的流暢程度,減輕口吃癥狀。DAF和FAF,是口吃矯正儀器的理想選擇方法,MAF也對(duì)部分口吃患者有用,尤其是針對(duì)那些易于產(chǎn)生不發(fā)聲的口吃行為的人。聽(tīng)覺(jué)改變反饋本質(zhì)上是利用人體鏡像元神經(jīng)系統(tǒng)(直觀地看,是利用原本用來(lái)模仿和幫助新生兒生存的臨時(shí)適應(yīng)的、神經(jīng)的機(jī)制)在語(yǔ)言獲得和發(fā)展中的作用,除了用來(lái)改善口吃等溝通疾病,近年的研究更涉及如孤獨(dú)癥病人等鏡像系統(tǒng)功能紊亂的研究。
目前已有一些采用DAF矯正口吃的儀器,它們采用存儲(chǔ)器(如磁介質(zhì)),通過(guò)讀寫(xiě)時(shí)序的控制,來(lái)實(shí)現(xiàn)語(yǔ)音信號(hào)的延遲。該方法的缺點(diǎn)是延遲時(shí)間受存儲(chǔ)器讀寫(xiě)周期的限制,不能滿足近年來(lái)對(duì)DAF研究所提出的延遲時(shí)間短促、精確的要求。尤其對(duì)于那些易于產(chǎn)生不發(fā)聲的口吃行為和首字發(fā)聲困難的患者毫無(wú)效果。
發(fā)明內(nèi)容
本發(fā)明的目的在于針對(duì)現(xiàn)有口吃矯正方法及其設(shè)備的不足,提供一種用數(shù)字技術(shù)實(shí)現(xiàn)聽(tīng)覺(jué)改變反饋的方法,適用于口吃矯正或輔助治療。本發(fā)明采用數(shù)字技術(shù),對(duì)語(yǔ)音信號(hào)進(jìn)行聽(tīng)覺(jué)延遲反饋、頻率改變反饋和掩蔽聽(tīng)覺(jué)反饋三種反饋處理。極大地提高說(shuō)話者的發(fā)音流暢程度,減輕口吃癥狀,尤其對(duì)于易于產(chǎn)生不發(fā)聲的口吃行為和首字發(fā)聲困難的患者效果顯著。
為實(shí)現(xiàn)上述目的,本發(fā)明采用的技術(shù)方案如下一種用數(shù)字技術(shù)實(shí)現(xiàn)聽(tīng)覺(jué)改變反饋的方法,其特征在于該方法的步驟為A、信號(hào)輸入傳感器將模擬信號(hào)轉(zhuǎn)換成電平信號(hào),模/數(shù)轉(zhuǎn)換器A/D將電平信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),然后再采用傅立葉變換,時(shí)/頻域轉(zhuǎn)換器將數(shù)字信號(hào)從時(shí)域信號(hào)變換成頻域信號(hào);B、信號(hào)識(shí)別與優(yōu)化對(duì)經(jīng)轉(zhuǎn)換后的頻域信號(hào)施行算法降噪,計(jì)算頻域信號(hào)各波段的信/噪比因子,決定應(yīng)給予各頻段混噪信號(hào)的衰減量和語(yǔ)音信號(hào)的增益量,衰減各頻段的噪聲信號(hào),增益各頻段的語(yǔ)音信號(hào)。
C、信號(hào)重構(gòu)頻域信號(hào)同時(shí)經(jīng)延遲濾波器將頻域信號(hào)進(jìn)行聽(tīng)覺(jué)延遲反饋處理,經(jīng)頻率改變器將頻域信號(hào)進(jìn)行頻率改變反饋處理;D、掩蔽優(yōu)化經(jīng)聽(tīng)覺(jué)延遲反饋和頻率改變反饋處理后的頻域信號(hào)進(jìn)行反傅立葉變換,頻/時(shí)域轉(zhuǎn)換器將頻域信號(hào)轉(zhuǎn)換成時(shí)域信號(hào),時(shí)域信號(hào)經(jīng)言語(yǔ)識(shí)別器識(shí)別,控制混音器將掩蔽生成器生成的掩蔽信號(hào)與該時(shí)域信號(hào)混合輸出,完成掩蔽聽(tīng)覺(jué)反饋處理;E、信號(hào)輸出經(jīng)聽(tīng)覺(jué)延遲反饋處理、頻率改變反饋處理和掩蔽聽(tīng)覺(jué)反饋處理后的數(shù)字信號(hào)經(jīng)數(shù)/模轉(zhuǎn)換器D/A轉(zhuǎn)換成電平信號(hào),由傳感器輸出。
所述聽(tīng)覺(jué)延遲反饋處理是通過(guò)延遲濾波器對(duì)頻域信號(hào)進(jìn)行延遲處理。
所述頻率改變反饋處理是通過(guò)頻率改變器對(duì)頻域信號(hào)進(jìn)行頻率改變處理所述頻域信號(hào)的各個(gè)波段的頻域分量按照頻率高低順序排列,所述頻率改變器按指定的排列順序?qū)⑺鲱l域分量重新排列。
所述掩蔽信號(hào)為白噪聲或窄帶噪聲,所述白噪聲由隨機(jī)函數(shù)算法生成,所述窄帶噪聲為白噪聲經(jīng)過(guò)帶通濾波器后產(chǎn)生的通帶噪聲。
所述傳感器為麥克風(fēng)或揚(yáng)聲器。
本發(fā)明的優(yōu)點(diǎn)在于1、本發(fā)明采用聽(tīng)覺(jué)延遲反饋、頻率改變反饋和掩蔽聽(tīng)覺(jué)反饋三種反饋對(duì)聲音信號(hào)進(jìn)行處理,可有效提高口吃患者言語(yǔ)流暢程度、治療口吃效果更顯著、穩(wěn)定,適用范圍廣,較現(xiàn)有的僅通過(guò)延遲信號(hào)治療口吃的口吃治療儀效果更明顯、尤其對(duì)于易于產(chǎn)生不發(fā)聲的口吃行為的人和首字發(fā)聲困難的人效果顯著。
2、本發(fā)明采用數(shù)字技術(shù)處理的方式,所需元件數(shù)量少、體積小、功耗低,便于采用本發(fā)明開(kāi)發(fā)微型便攜式設(shè)備,以滿足使用者對(duì)外觀和隱蔽性的需求。
3、本發(fā)明通過(guò)將模擬信號(hào)轉(zhuǎn)換為數(shù)字信號(hào),再轉(zhuǎn)換為頻域信號(hào),再對(duì)頻域信號(hào)進(jìn)行延遲和頻率改變,在這個(gè)過(guò)程中可以方便地應(yīng)用數(shù)字信號(hào)處理的高級(jí)算法,實(shí)現(xiàn)高質(zhì)量、實(shí)時(shí)的信號(hào)重構(gòu)。
4、研究表明最低4ms的延遲聽(tīng)覺(jué)反饋就開(kāi)始對(duì)使用者提高語(yǔ)言流暢度起作用,而延遲時(shí)間越短,對(duì)使用者說(shuō)話的速率影響越小,因此,通過(guò)本發(fā)明實(shí)現(xiàn)的對(duì)信號(hào)的快速重構(gòu)、精確控制對(duì)治療口吃和用于口吃輔助治療具有重大意義。
附圖及圖面說(shuō)明
圖1為本發(fā)明的整體結(jié)構(gòu)流程示意2為本發(fā)明信號(hào)的識(shí)別優(yōu)化的流程示意3為本發(fā)明信號(hào)重構(gòu)的流程示意4為本發(fā)明信號(hào)進(jìn)行聽(tīng)覺(jué)延遲反饋處理原理示意5為本發(fā)明信號(hào)進(jìn)行頻率改變反饋處理原理示意6為本發(fā)明掩蔽信號(hào)生成器生成掩蔽信號(hào)原理示意7為本發(fā)明信號(hào)進(jìn)行掩蔽聽(tīng)覺(jué)反饋處理原理示意圖具體實(shí)施方式
如圖1所示本發(fā)明的信號(hào)流程分為下述階段輸入信號(hào)傳感器如麥克風(fēng)將模擬信號(hào)轉(zhuǎn)換成電平信號(hào),模/數(shù)轉(zhuǎn)換器A/D將電平信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)也即混噪語(yǔ)音信號(hào),然后再采用傅立葉變換,時(shí)/頻域轉(zhuǎn)換器將數(shù)字信號(hào)從時(shí)域信號(hào)變換成頻域信號(hào);信號(hào)識(shí)別與優(yōu)化對(duì)經(jīng)轉(zhuǎn)換后的頻域信號(hào)施行算法降噪,計(jì)算頻域信號(hào)各波段的信/噪比因子,決定應(yīng)給予各頻段混噪信號(hào)的衰減量和語(yǔ)音信號(hào)的增益量,衰減各頻段的噪聲信號(hào),增益各頻段的語(yǔ)音信號(hào)。
信號(hào)重構(gòu)頻域信號(hào)同時(shí)經(jīng)延遲濾波器將頻域信號(hào)進(jìn)行聽(tīng)覺(jué)延遲反饋處理,經(jīng)頻率改變器將頻域信號(hào)進(jìn)行頻率改變反饋處理;掩蔽優(yōu)化經(jīng)聽(tīng)覺(jué)延遲反饋和頻率改變反饋處理后的頻域信號(hào)進(jìn)行反傅立葉變換,頻/時(shí)域轉(zhuǎn)換器將頻域信號(hào)轉(zhuǎn)換成時(shí)域信號(hào),時(shí)域信號(hào)經(jīng)言語(yǔ)識(shí)別器識(shí)別,控制混音器將掩蔽生成器生成的掩蔽信號(hào)與該時(shí)域信號(hào)混合輸出,完成掩蔽聽(tīng)覺(jué)反饋處理;信號(hào)輸出經(jīng)聽(tīng)覺(jué)延遲反饋處理、頻率改變反饋處理和掩蔽聽(tīng)覺(jué)反饋處理后的數(shù)字信號(hào)經(jīng)數(shù)/模轉(zhuǎn)換器D/A轉(zhuǎn)換成電平信號(hào),由傳感器如揚(yáng)聲器輸出。
如圖2所示本發(fā)明信號(hào)的識(shí)別和優(yōu)化步驟為-1、時(shí)/頻域轉(zhuǎn)換采用快速傅立葉變換(FFT),將混噪語(yǔ)音從時(shí)域信號(hào)變換成頻域信號(hào),得到混噪語(yǔ)音N個(gè)波段的頻率分量(N由FFT點(diǎn)數(shù)決定)。
2、計(jì)算信/噪比因子按一定時(shí)間間隔,計(jì)算各波段瞬時(shí)能量值;按一定時(shí)間間隔(時(shí)間為前述間隔的若干倍),在若干個(gè)瞬時(shí)能量值中計(jì)算其最大值和最小值,并紀(jì)錄;根據(jù)最大值和最小值計(jì)算特征值作為信/噪比因子,即特征值=f(最大值,最小值)(特征值的計(jì)算算法有多種,如求其平均值就是其中一種,采用哪種算法可由針對(duì)的噪聲類(lèi)型,由一學(xué)習(xí)算法或根據(jù)經(jīng)驗(yàn)確定。)3、根據(jù)事先通過(guò)學(xué)習(xí)算法或經(jīng)驗(yàn)確定的信/噪比因子即衰減量關(guān)系、增益量關(guān)系,計(jì)算出對(duì)這一時(shí)間間隔內(nèi)對(duì)該波段信號(hào)的衰減量和增益量,混噪信號(hào)的信/噪比越高,信/噪比因子的數(shù)值越大,衰減量越小。(考慮的信號(hào)的變化通常是連續(xù)的、漸變的,實(shí)際應(yīng)用中,可以是計(jì)算出下一個(gè)時(shí)間間隔內(nèi)的衰減量。)4、對(duì)這一時(shí)間間隔內(nèi)的各波段信號(hào)分別進(jìn)行衰減和應(yīng)用增益(增益的大小由放大策略決定,如可以采用EDRC寬動(dòng)態(tài)范圍壓縮策略等)。從而使信號(hào)中的噪聲被抑制,語(yǔ)音的信號(hào)包絡(luò)被從噪聲中還原出來(lái),提高了信/噪比。
5、進(jìn)行其他處理如對(duì)信號(hào)進(jìn)行聽(tīng)覺(jué)延遲反饋、頻率改變反饋處理和掩蔽聽(tīng)覺(jué)反饋處理。
6、頻/時(shí)域轉(zhuǎn)換采用快速傅立葉變換(IFFT),將優(yōu)化后的信號(hào)從頻域信號(hào)變換成時(shí)域信號(hào)如圖4所示,本發(fā)明信號(hào)進(jìn)行聽(tīng)覺(jué)延遲反饋處理中延遲濾波器的工作原理為延遲濾波器以一個(gè)環(huán)形輸入輸出緩沖器為基礎(chǔ),輸入的頻域信號(hào)總是被放置在輸入指針指向的位置,而輸出信號(hào)總是從輸出指針指向的位置獲取。假設(shè)輸出指針從起始位置開(kāi)始,而輸入指針在輸出指針前,間隔N個(gè)位置(N=指定的延遲時(shí)間/一次輸入輸出的數(shù)據(jù)所代表時(shí)間間隔),輸入和輸出指針同步向前運(yùn)動(dòng),這樣,每次輸入的信號(hào),就會(huì)在指定的間隔時(shí)間后被輸出,達(dá)到信號(hào)延遲的目的,調(diào)整整個(gè)緩沖器的長(zhǎng)度、輸入指針和輸出指針的間隔,即可任意設(shè)定延遲時(shí)間。
如圖5所示各頻率分量被整體下移了一個(gè)波段,波段1的頻率分量1被移動(dòng)到波段2,原波段1填0;波段2的頻率分量2被移動(dòng)到波段3;……以此類(lèi)推,直至波段n-1的頻率分量n-1被移動(dòng)到波段n,而原波段n的頻率分量丟棄。這樣得到的新的排列與原信號(hào)頻率相比,其頻率升高了了(假設(shè)從波段1到波段n是按頻率升序排列),升高的頻率為一個(gè)波段的帶寬。假設(shè)一個(gè)波段帶寬為500Hz,原信號(hào)頻率為1000Hz信號(hào),則得到信號(hào)為頻率1500Hz的信號(hào)。
如圖6所示掩蔽信號(hào)的生成掩蔽信號(hào)是白噪聲或窄帶噪聲,白噪聲可用隨機(jī)函數(shù)生成,即均值為0,方差為1的高斯隨機(jī)噪聲??紤]到實(shí)際應(yīng)用中,數(shù)字信號(hào)處理器的運(yùn)算能力的限制,本發(fā)明中采用事先錄制好的白噪聲信號(hào)作為白噪聲聲源。窄帶噪聲是白噪聲經(jīng)過(guò)帶通濾波器產(chǎn)生的通帶噪聲。本發(fā)明中將白噪聲經(jīng)過(guò)頻率分析后,只取某一個(gè)或幾個(gè)相鄰的波段的頻率分量,而將其余波段的頻率分量置0,就可以得到窄帶噪聲。
如圖7所示掩蔽聽(tīng)覺(jué)反饋處理步驟為言語(yǔ)識(shí)別器檢查重構(gòu)后的信號(hào)是否為言語(yǔ)信號(hào),以控制混音器只在有言語(yǔ)信號(hào)輸入時(shí),將掩蔽信號(hào)與言語(yǔ)信號(hào)混合輸出,否則直接輸出重構(gòu)后的信號(hào)(即在說(shuō)話人靜默時(shí),不加掩蔽信號(hào))。言語(yǔ)識(shí)別器的識(shí)別方法除采用與前述信號(hào)優(yōu)化中提到的言語(yǔ)識(shí)別算法相近視的方法一采用計(jì)算信/噪比因子并判斷其是否超過(guò)設(shè)定的閾值。
除了由言語(yǔ)識(shí)別器來(lái)控制混音器輸出混合信號(hào)外,還可以由控制信號(hào)直接控制混音器輸出混合信號(hào)或掩蔽信號(hào)。這主要是為了讓使用者可以通過(guò)一個(gè)外部接口(如一個(gè)按鈕或遙控器),控制本方法中系統(tǒng)發(fā)一個(gè)掩蔽信號(hào),該掩蔽信號(hào)可以作為幫助使用者解決難發(fā)音的刺激信號(hào)。該刺激信號(hào)除了用掩蔽信號(hào)外,還可以采用錄制的語(yǔ)音信號(hào),如元音“a”,以達(dá)到更佳效果。
本發(fā)明不限于上述實(shí)施例,在本發(fā)明權(quán)利要求所限定的構(gòu)思范圍內(nèi),本領(lǐng)域內(nèi)的普通技術(shù)人員還可對(duì)上述實(shí)施例作一些顯而易見(jiàn)的改變,但這些改變均應(yīng)落入本發(fā)明權(quán)利要求的保護(hù)范圍之內(nèi)。
權(quán)利要求
1.一種用數(shù)字技術(shù)實(shí)現(xiàn)聽(tīng)覺(jué)改變反饋的方法,其特征在于該方法的步驟為A、輸入信號(hào)傳感器將模擬信號(hào)轉(zhuǎn)換成電平信號(hào),模/數(shù)轉(zhuǎn)換器A/D將電平信號(hào)轉(zhuǎn)換成數(shù)字信號(hào),然后再采用傅立葉變換,時(shí)/頻域轉(zhuǎn)換器將數(shù)字信號(hào)從時(shí)域信號(hào)變換成頻域信號(hào);B、信號(hào)識(shí)別與優(yōu)化對(duì)經(jīng)轉(zhuǎn)換后的頻域信號(hào)施行算法降噪,計(jì)算頻域信號(hào)各波段的信/噪比因子,決定應(yīng)給予各頻段混噪信號(hào)的衰減量和語(yǔ)音信號(hào)的增益量,衰減各頻段的噪聲信號(hào),增益各頻段的語(yǔ)音信號(hào);C、信號(hào)重構(gòu)頻域信號(hào)同時(shí)經(jīng)延遲濾波器將頻域信號(hào)進(jìn)行聽(tīng)覺(jué)延遲反饋處理,經(jīng)頻率改變器將頻域信號(hào)進(jìn)行頻率改變反饋處理;D、掩蔽優(yōu)化經(jīng)聽(tīng)覺(jué)延遲反饋和頻率改變反饋處理后的頻域信號(hào)進(jìn)行反傅立葉變換,頻/時(shí)域轉(zhuǎn)換器將頻域信號(hào)轉(zhuǎn)換成時(shí)域信號(hào),時(shí)域信號(hào)經(jīng)言語(yǔ)識(shí)別器識(shí)別,控制混音器將掩蔽生成器生成的掩蔽信號(hào)與該時(shí)域信號(hào)混合輸出,完成掩蔽聽(tīng)覺(jué)反饋處理;E、信號(hào)輸出經(jīng)聽(tīng)覺(jué)延遲反饋處理、頻率改變反饋處理和掩蔽聽(tīng)覺(jué)反饋處理后的數(shù)字信號(hào)經(jīng)數(shù)/模轉(zhuǎn)換器D/A轉(zhuǎn)換成電平信號(hào),由傳感器輸出。
2.根據(jù)權(quán)利要求1所述的一種用數(shù)字技術(shù)實(shí)現(xiàn)聽(tīng)覺(jué)改變反饋的方法,其特征在于所述聽(tīng)覺(jué)延遲反饋處理是通過(guò)延遲濾波器對(duì)頻域信號(hào)進(jìn)行延遲處理。
3.根據(jù)權(quán)利要求1所述的一種用數(shù)字技術(shù)實(shí)現(xiàn)聽(tīng)覺(jué)改變反饋的方法,其特征在于所述頻率改變反饋處理是通過(guò)頻率改變器對(duì)頻域信號(hào)進(jìn)行頻率改變處理所述頻域信號(hào)的各個(gè)波段的頻域分量按照頻率高低順序排列,所述頻率改變器按指定的排列順序?qū)⑺鲱l域分量重新排列。
4.根據(jù)權(quán)利要求1所述的一種用數(shù)字技術(shù)實(shí)現(xiàn)聽(tīng)覺(jué)改變反饋的方法,其特征在于所述掩蔽信號(hào)為白噪聲或窄帶噪聲,所述白噪聲由隨機(jī)函數(shù)算法生成,所述窄帶噪聲為白噪聲經(jīng)過(guò)帶通濾波器后產(chǎn)生的通帶噪聲。
5.根據(jù)權(quán)利要求1所述的一種用數(shù)字技術(shù)實(shí)現(xiàn)聽(tīng)覺(jué)改變反饋的方法,其特征在于所述傳感器為麥克風(fēng)或揚(yáng)聲器。
全文摘要
本發(fā)明公開(kāi)了一種用數(shù)字技術(shù)實(shí)現(xiàn)聽(tīng)覺(jué)改變反饋的方法,該方法的步驟為;使用者自己說(shuō)話的言語(yǔ)信號(hào)被傳感器采集轉(zhuǎn)換成電平信號(hào),再經(jīng)過(guò)A/D轉(zhuǎn)換成數(shù)字信號(hào),該數(shù)字信號(hào)經(jīng)傅立葉變換被分解為頻域信號(hào),頻域數(shù)據(jù)經(jīng)延遲和頻率改變后,經(jīng)反傅立葉變換重新合成為時(shí)域數(shù)據(jù),再按一定條件與掩蔽信號(hào)混合輸出,輸出的數(shù)字信號(hào)經(jīng)數(shù)/模轉(zhuǎn)換器D/A轉(zhuǎn)換為電平信號(hào),經(jīng)傳感器轉(zhuǎn)換為聲音信號(hào),輸出給使用者。本發(fā)明具有效果顯著、穩(wěn)定,適用范圍廣的優(yōu)點(diǎn)。
文檔編號(hào)A61F5/58GK1803111SQ200610020219
公開(kāi)日2006年7月19日 申請(qǐng)日期2006年1月24日 優(yōu)先權(quán)日2006年1月24日
發(fā)明者蔣一寧, 夏世雄, 蔣濤, 付曉毅, 藺君剛 申請(qǐng)人:四川微迪數(shù)字技術(shù)有限公司