一種語音降噪方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及語音通話領(lǐng)域,尤其涉及一種語音降噪方法。
【背景技術(shù)】
[0002] 在語音業(yè)務(wù)中最常見的問題是在通話中有噪聲,目前處理噪聲最常用的技術(shù)是譜 減法。它利用語音信號的短時平穩(wěn)特性,從帶噪語音的短時譜值中減去噪聲的短時譜估計 值,從而得到較純凈語音的頻譜,達到語音降噪的目的。譜減法包括幅度譜減法和功率譜減 法:幅度譜減法就是在頻域中從帶噪語音的幅度譜上減去噪聲的幅度譜作為語音信號的幅 度譜;功率譜減法則是從帶噪語音的功率譜中減去噪聲的功率譜,得到純凈語音的功率譜, 通過開方運算得到幅度譜。由于人耳對語音頻譜分量的相位感知并不敏感,因此該些算法 都是在幅度上進行的修正,相位部分則保持不變,在處理完噪聲后,仍然使用帶噪語音的相 位來恢復降噪后的語音。在噪聲譜的估計方面,一般是使用語音未產(chǎn)生之前的噪聲譜作為 整個語音降噪?yún)^(qū)間的噪聲譜估計值。
[0003] 上述譜減法通過從帶噪語音的短時譜中減去噪聲的短時譜估計值來達到語音降 噪的目的,算法簡單且容易實現(xiàn)。由于是把語音未產(chǎn)生之前的噪聲譜作為整個語音降噪?yún)^(qū) 間的噪聲譜估計值,使得噪聲譜的估計值誤差較大,因此在減去噪聲譜后,還會有些較大功 率譜分量的剩余部分,在頻譜上呈現(xiàn)出隨機出現(xiàn)的尖峰,在聽覺上形成殘留噪聲。該種噪聲 具有一定的節(jié)奏性起伏感,被稱之為"音樂噪聲",是各峽的多種隨機頻率點上出現(xiàn)的聲調(diào) 的組合結(jié)果。聽者常常能發(fā)現(xiàn)處理后的語音中的"音樂噪聲",它比原始語音中的噪聲更為 清晰,也更易令人反感。
【發(fā)明內(nèi)容】
[0004] 為了解決目前采用譜減法處理噪聲后出現(xiàn)音樂噪聲的問題,發(fā)明提出了一種基于 譜減法改進的語音降噪方法。該方法包括W下步驟:
[0005] a,通過端點檢測將語音峽區(qū)分為靜音峽和語音峽;
[0006] b,對于靜音峽,計算當前峽的功率譜值作為噪聲功率譜估計值,對于語音峽,計算 平均噪聲功率譜作為噪聲功率譜估計值;
[0007] C,將語音峽的功率譜減去噪聲功率譜估計值,得到降噪后的語音功率譜;
[0008]d,根據(jù)降噪后的語音功率譜得出降噪后的語音峽。
[0009] 優(yōu)選的,步驟a具體為:計算每一語音峽的能量,如果大于或等于口限值,則為語 音峽,如果小于口限值,則為靜音峽。進一步的,將前30峽語音峽的平均噪聲能量作為所述 口限值。
[0010] 優(yōu)選的,步驟b中將前30峽語音峽的平均噪聲能量作為所述平均噪聲功率譜。
[0011] 優(yōu)選的,步驟b中所述噪聲譜估計值還進行平滑處理。
[0012] 優(yōu)選的,步驟d利用降噪前語音峽的相位譜,根據(jù)降噪后的語音功率譜計算出降 噪后的語音譜,進而得到降噪后的語音峽。
[0013] 本發(fā)明通過端點檢測技術(shù)減小了噪聲功率譜估計值的誤差,基本消除了音樂噪 聲,從而提高了語音降噪質(zhì)量和主觀聽覺的效果。
【附圖說明】
[0014] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作一簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā) 明的一些實施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可W根 據(jù)該些附圖獲得其他的附圖。
[0015] 圖1是本發(fā)明實施例的端點檢測流程示意圖。
【具體實施方式】
[0016] 為使本發(fā)明實施例的目的、技術(shù)方案和優(yōu)點更加清楚,下面將結(jié)合本發(fā)明實施例 中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是 本發(fā)明一部分實施例,而不是全部的實施例;需要說明的是,在不沖突的情況下,本申請中 的實施例及實施例中的特征可W相互組合?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員 在沒有作出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。
[0017] 在降噪方法中噪聲譜的估計至關(guān)重要,如果噪聲估計偏差較大的話,將毫無疑問 的影響語音降噪質(zhì)量。本實施例是在端點檢測的基礎(chǔ)上進行噪聲估計的,端點檢測是指從 一段包含語音的信號中確定出語音的起始點和終點,從而從連續(xù)記錄的帶噪語音信號中分 離出我們真正感興趣的語音信號。本實施例通過端點檢測把要降噪的語音峽區(qū)分為靜音峽 和語音峽。在靜音峽,當前的譜值就是噪聲譜,在語音峽,使用平均噪聲功率譜作為噪聲功 率譜估計值。該樣就比傳統(tǒng)的在整個降噪?yún)^(qū)間使用平均噪聲功率譜作為噪聲功率譜的估計 值誤差小很多。
[0018] 本實施例的端點檢測方法是將語音信號的短時能量與口限值比較,如果超過口限 值則表示當前為有語音的語音段,否則就表示當前為無音的靜音段。整個端點檢測流程如 圖1所示:首先設(shè)置一個經(jīng)驗值為口限值,本實施例是將前30峽語音峽的平均噪聲能量 (EMN)作為口限值。然后依次計算每一峽的能量;
【主權(quán)項】
1. 一種語音降噪方法,其特征在于,所述方法包括以下步驟: a,通過端點檢測將語音幀區(qū)分為靜音幀和語音幀; b,對于靜音幀,計算當前幀的功率譜值作為噪聲功率譜估計值,對于語音幀,計算平均 噪聲功率譜作為噪聲功率譜估計值; c,將語音幀的功率譜減去噪聲功率譜估計值,得到降噪后的語音功率譜; 山根據(jù)降噪后的語音功率譜得出降噪后的語音幀。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,步驟a具體為:計算每一語音幀的能量, 如果大于或等于門限值,則為語音幀,如果小于門限值,則為靜音幀。
3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,將前30幀語音幀的平均噪聲能量作為所 述門限值。
4. 根據(jù)權(quán)利要求1所述的方法,其特征在于步驟b,將前30幀語音幀的平均噪聲能量 作為所述平均噪聲功率譜。
5. 根據(jù)權(quán)利要求1或4所述的方法,其特征在于步驟b,所述噪聲譜估計值還進行平滑 處理。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于步驟d,利用降噪前語音幀的相位譜,根據(jù) 降噪后的語音功率譜計算出降噪后的語音譜,進而得到降噪后的語音幀。
【專利摘要】本發(fā)明提出了一種語音降噪方法,該方法包括以下步驟:a,通過端點檢測將語音幀區(qū)分為靜音幀和語音幀;b,對于靜音幀,計算當前幀的功率譜值作為噪聲功率譜估計值,對于語音幀,計算平均噪聲功率譜作為噪聲功率譜估計值;c,將語音幀的功率譜減去噪聲功率譜估計值,得到降噪后的語音功率譜;d,根據(jù)降噪后的語音功率譜得出降噪后的語音幀。本發(fā)明通過端點檢測技術(shù)減小了噪聲功率譜估計值的誤差,基本消除了音樂噪聲,從而提高了語音降噪質(zhì)量和主觀聽覺的效果。
【IPC分類】G10L21-0216
【公開號】CN104867497
【申請?zhí)枴緾N201410076957
【發(fā)明人】陳子華, 徐正春
【申請人】北京信威通信技術(shù)股份有限公司, 北京信友達視訊技術(shù)有限公司
【公開日】2015年8月26日
【申請日】2014年2月26日