一種語音中瞬態(tài)噪聲抑制的方法
【專利摘要】本發(fā)明公開了一種語音中瞬態(tài)噪聲抑制的方法,屬于信號處理【技術領域】。一種語音中瞬態(tài)噪聲抑制的方法,其特征在于:包括三個模塊:伽馬通頻率倒譜系數(shù)提取模塊、瞬態(tài)噪聲檢測模塊、語音信號重建模塊;所述的伽馬通頻率倒譜系數(shù)提取模塊輸入端接收含噪的語音信號,輸出端與瞬態(tài)噪聲檢測模塊輸入端相連,所述的瞬態(tài)噪聲檢測模塊輸出端與語音信號重建模塊的輸入端相連,所述的語音信號重建模塊的輸入端初接收含噪的語音信號外,還與所述的瞬態(tài)噪聲檢測模塊輸出端相連,語音信號重建模塊輸出為去噪后的語音。
【專利說明】一種語音中瞬態(tài)噪聲抑制的方法
【技術領域】
[0001]本發(fā)明涉及一種語音中瞬態(tài)噪聲抑制的方法,屬于信號處理【技術領域】。
【背景技術】
[0002]瞬態(tài)噪聲存在于很多應用場合中,如助聽器、免提組件、手機及視訊會議設備等語音通信終端設備中。瞬態(tài)噪聲的存在嚴重影響語音質量,使語音信號清晰度和可懂度下降,引起聽覺疲勞。語音中的瞬態(tài)噪聲通常是加性噪聲,也稱為暫態(tài)噪聲。瞬態(tài)噪聲在時域中通常具有突發(fā)性、脈沖性等特點,其能量通常集中在較短的時域區(qū)間內,而在頻域分布則很寬。典型的瞬態(tài)信號通常由一個初始的峰值和一段持續(xù)時間約為10-50ms衰減的短時振蕩過程構成,如敲門、鼠標點擊、節(jié)拍器、鍵盤敲擊、錘子擊打聲等都屬于瞬態(tài)噪聲。多數(shù)情況下,瞬態(tài)噪聲的消除比較困難,因為多數(shù)瞬態(tài)噪聲與語音信號在時頻域完全混疊,且具有非連續(xù)性等特點。目前的語音噪聲抑制算法絕大多數(shù)是針對穩(wěn)態(tài)噪聲和連續(xù)噪聲的,如譜減方法、自適應濾波方法、維納濾波方法等,此類算法對瞬態(tài)噪聲抑制效果很差。因此,有必要發(fā)明對瞬態(tài)噪聲環(huán)境下的語音噪聲抑制技術。
[0003]因為語音噪聲抑制效果的最終度量是人的主觀感受,因此有必要考慮人耳的聽覺感知特性對語音噪聲抑制性能的影響。在聽覺感知形成的過程中,人耳基底膜發(fā)揮了重要的作用,基底膜具有良好的頻率選擇和分辨特性。基于這一特性,可以通過設計帶通濾波器組來實現(xiàn)耳蝸基底膜的分頻作用,這種濾波器組就稱為人耳聽覺濾波器。Johannesma于1972年提出了伽馬通(Ga_atone,GT)濾波器模型,它是基于聽覺模型中的耳蝸基底膜模型實現(xiàn)的,最先用于描述貓的聽覺神經(jīng)的生理學沖激響應的特性。該濾波器能夠較好地模擬人耳聽覺的頻率響應,符合人耳的聽覺感知特性。其沖激響應函數(shù)的時域表達式為
[0004]g(t) = [Bntn-1e-2ltetCos (2 n fjt+ Φ) ]u (t)
[0005]B = Id1.ERB (fj)
[0006]其中,參數(shù)Bn為濾波器增益;n為濾波器階數(shù);n = 4的伽馬通濾波器就能很好地模擬基底膜的濾波特性#為初始相位,u (t)為單位階躍函數(shù)A為中心頻率;ERB(fi)為伽馬通濾波器的等價矩形帶寬,其與中心頻率fi的關系為:
[0007]ERB (fi) = 24.7+0.1OSfi
[0008]伽馬通濾波器的中心頻率決定了濾波器的等價帶寬、頻率響應等特性,而由人耳感知特性可知,各伽馬通濾波器的中心頻率滿足對數(shù)均勻分布,中心頻率可通過下式確
【權利要求】
1.一種語音中瞬態(tài)噪聲抑制的方法,其特征在于:包括三個模塊:伽馬通頻率倒譜系數(shù)提取模塊、瞬態(tài)噪聲檢測模塊、語音信號重建模塊;所述的伽馬通頻率倒譜系數(shù)提取模塊輸入端接收含噪的語音信號,輸出端與瞬態(tài)噪聲檢測模塊輸入端相連,所述的瞬態(tài)噪聲檢測模塊輸出端與語音信號重建模塊的輸入端相連,所述的語音信號重建模塊的輸入端初接收含噪的語音信號外,還與所述的瞬態(tài)噪聲檢測模塊輸出端相連,語音信號重建模塊輸出為去噪后的語音;所述的伽馬通頻率倒譜系數(shù)提取模塊從輸入可能含噪的語音信號中提取伽馬通頻率倒譜系數(shù),所述的瞬態(tài)噪聲檢測模塊根據(jù)相鄰幀伽馬通頻率倒譜系數(shù)的差別來判決當前語音幀中是否含有瞬態(tài)噪聲,若含有瞬態(tài)噪聲,則使用語音信號重建模塊重建當前語音幀,并用該重建語音幀替換當前語音幀,并輸出;若不含有瞬態(tài)噪聲,則對當前語音幀不做處理,直接輸出。
2.根據(jù)權利要求1所述的一種語音中瞬態(tài)噪聲抑制的方法,其特征在于:伽馬通頻率倒譜系數(shù)提取模塊的處理步驟如下:(a)對原始含噪語音x(n)預加重,增強高頻分量;定義原始含噪語音信號為χ(η),預加重后的語音信號為(η),xe (η) = χ (n) _ax (η_1),其中,a為預加重系數(shù),α取值為0.97 ;(b)伽馬通濾波器組濾波,使用如下伽馬通濾波器組濾波,
3.根據(jù)權利要求1所述的一種語音中瞬態(tài)噪聲抑制的方法,其特征在于:瞬態(tài)噪聲檢測模塊的檢測過程如下: 計算當前幀,即第P幀,信號的伽馬通頻率倒譜系數(shù)矢量c(p) (I)與前一幀,即第P-1幀,信號的平滑伽馬通頻率倒譜系數(shù)矢量(1=(/)的歐式距離Dis,
4.根據(jù)權利要求1所述的一種語音中瞬態(tài)噪聲抑制的方法,其特征在于:語音信號重建模塊的處理方法如下: 根據(jù)相鄰語音的波形,采用插值重建算法生成被噪聲污染的語音幀,首先對含噪語音幀的前后幀進行雙向線性預測,并根據(jù)線性預測系數(shù)設計逆濾波器,計算殘差信號;再將殘差信號通過基音周期檢測算法計算基音周期,根據(jù)相鄰幀的殘差信號及基音周期,產(chǎn)生當前含噪幀的激勵信號,根據(jù)激勵信號及前一幀的線性預測系數(shù),重建當前幀語音信號,并與相鄰幀信號進行淡入、淡出方式的數(shù)據(jù)平滑,達到抑制語音中瞬態(tài)噪聲的目的;設D表示輸出信號的延時,用于當前幀信號與相鄰幀進行邊界融合,D的取值范圍是16 < D < 48,Lev表示線性預測濾波器的階數(shù),Lev的取值范圍是10 < D < 30 ;基于雙向線性預測的語音信號重建方法通過相鄰幀的采樣點產(chǎn)生當前幀的估計值,故需要存儲與當前幀最近的B個樣點作為歷史數(shù)據(jù),用于估計前向線性預測系數(shù)及前向激勵信號,記為
【文檔編號】G10L21/003GK103440871SQ201310369986
【公開日】2013年12月11日 申請日期:2013年8月21日 優(yōu)先權日:2013年8月21日
【發(fā)明者】陳喆, 殷福亮, 張兆偉 申請人:大連理工大學