基于語音通信的干擾噪聲去除方法和系統(tǒng)的制作方法

文檔序號(hào)：2832865閱讀：420來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：基于語音通信的干擾噪聲去除方法和系統(tǒng)的制作方法
技術(shù)領(lǐng)域：
本公開涉及噪聲去除方法，并且更具體地涉及基于語音通信的去除噪聲的系統(tǒng)和方法以及噪聲去除裝置和操作該噪聲去除裝置的方法，該系統(tǒng)和方法針對(duì)已經(jīng)經(jīng)過譜減法(SS:Spectral Subtraction)的信號(hào)執(zhí)行與成束的信號(hào)(tying signal)對(duì)應(yīng)的聚類以在譜圖中的頻率軸上從語音通信去除噪聲，并基于聚類通過屬于語音和音樂噪聲的特性僅提取音樂噪聲。
背景技術(shù)：
在實(shí)際生活中，背景噪聲污染純語音并使諸如移動(dòng)電話、語音識(shí)別、語音編碼、講話者識(shí)別等的語音通信系統(tǒng)的性能劣化。因此，對(duì)聲音質(zhì)量進(jìn)行改善以降低噪聲效果并增強(qiáng)系統(tǒng)性能的研究已開展了很長時(shí)間，并且其重要性當(dāng)前受到很多的關(guān)注。同時(shí)，由于成本低并且容易實(shí)現(xiàn)，在各種聲音質(zhì)量改善方法中，譜減法(SS)是在單通道中廣泛使用的典型方法。但是，譜減法具有的一個(gè)主要缺點(diǎn)在于，在由譜減法所改善的語音中殘留了與新的人為聲音(artifact sound)對(duì)應(yīng)的音樂噪聲。音樂噪聲指的是通過將估計(jì)的噪聲評(píng)價(jià)為低于原始噪聲而生成的隨機(jī)頻率分量，并還指的是由于殘留在聲譜圖中的時(shí)間軸和頻率軸上的音樂噪聲不連續(xù)地分布而在感覺上騷擾收聽者的音調(diào)。就此而論，為了抑制殘留的音樂噪聲，已經(jīng)提出了基于增益函數(shù)的譜減法。例如，存在“維納濾波”、“具有過減因子和譜基底的非線性譜減法”、“最小均方誤差短時(shí)間譜振幅估計(jì)或?qū)?shù)譜振幅”、“基于人類聽覺系統(tǒng)的屏蔽特性的過減法”、和“軟決策估計(jì)、最大似然法、信號(hào)子空間”。但是，已知多數(shù)提出的方法無法有效地在具有低的信噪比(SNR)的噪聲環(huán)境中改善聲音質(zhì)量。換言之，通過所提出的常規(guī)方法改善的語音具有以下問題。即，當(dāng)使用估計(jì)為大于實(shí)際噪聲的噪聲以及過估計(jì)的增益函數(shù)時(shí)，殘留的音樂噪聲和發(fā)散度降低，但是語音失真增加。相反，當(dāng)使用估計(jì)為低于實(shí)際噪聲的噪聲以及欠估計(jì)的增益函數(shù)時(shí)，語音失真降低，但是殘留的音樂噪聲和發(fā)散度增加。

發(fā)明內(nèi)容
技術(shù)問題做出本公開以解決上面的問題，并且本發(fā)明的一種實(shí)施方式是通過提供基于語音通信的噪聲去除系統(tǒng)和方法通過屬于語音和音樂噪聲的特性來僅提取音樂噪聲，該系統(tǒng)和方法為:借助譜減法裝置基于增益函數(shù)對(duì)語音信號(hào)執(zhí)行譜減法(SS);針對(duì)已經(jīng)執(zhí)行了譜減法的語音信號(hào)執(zhí)行在譜圖的頻率軸上連續(xù)的信號(hào)的聚類以指定一個(gè)或更多個(gè)群，并通過確定指定的群中的每一個(gè)群在頻率軸和時(shí)間軸上的連續(xù)性來提取音樂噪聲，以使用噪聲去除裝置來提取音樂噪聲。本發(fā)明的另一實(shí)施方式是通過提供噪聲去除裝置和方法并通過屬于語音和音樂噪聲的特性來僅提取音樂噪聲，該系統(tǒng)和方法為:針對(duì)已經(jīng)執(zhí)行了譜減法的語音信號(hào)執(zhí)行在譜圖的頻率軸上的信號(hào)的聚類以指定一個(gè)或更多個(gè)群；通過確定在頻率軸上的指定的群中的每一個(gè)群的連續(xù)性來提取與音樂噪聲相對(duì)應(yīng)的群；以及針對(duì)其余的群中的每一個(gè)群，基于在時(shí)間軸上交疊的群之間的相似性來提取與音樂噪聲相對(duì)應(yīng)的群。技術(shù)方案根據(jù)本發(fā)明的實(shí)施方式，提供了一種基于語音通信的噪聲去除系統(tǒng)。該系統(tǒng)包括:譜減法裝置，其配置為基于增益函數(shù)針對(duì)語音信號(hào)執(zhí)行譜減法(SS);以及噪聲去除裝置，其配置為針對(duì)已經(jīng)執(zhí)行了譜減法的語音信號(hào)執(zhí)行在譜圖的頻率軸上連續(xù)的信號(hào)的聚類以指定一個(gè)或更多個(gè)群，并且所述噪聲去除裝置配置為確定所指定的各個(gè)群在頻率軸和時(shí)間軸上的連續(xù)性以提取音樂噪聲。噪聲去除裝置可以將所指定的各個(gè)群在頻率軸上的連續(xù)長度與閾值進(jìn)行比較以提取與音樂噪聲相對(duì)應(yīng)的群，并針對(duì)其余的群中的每一個(gè)群基于在時(shí)間軸上交疊的群之間的相似性來提取與音樂噪聲相對(duì)應(yīng)的群。根據(jù)本發(fā)明的另一實(shí)施方式，提供了一種噪聲去除裝置。該裝置包括:聚類單元，其配置為針對(duì)其中已經(jīng)執(zhí)行了基于增益函數(shù)的譜減法的語音信號(hào)執(zhí)行在譜圖的頻率軸上的信號(hào)的聚類以指定一個(gè)或更多個(gè)群；第一提取器，其配置為確定所指定的群中的每一個(gè)群在頻率軸上的連續(xù)性以提取與音樂噪聲相對(duì)應(yīng)的群；以及第二提取器，其配置為針對(duì)其余的群中的每一個(gè)群基于在時(shí)間軸上交疊的群之間的相似性來提取與音樂噪聲相對(duì)應(yīng)的群。聚類單元可以通過在譜圖的頻率軸上連續(xù)的信號(hào)之間執(zhí)行聚類來指定一個(gè)或更多個(gè)群。聚類單元可以去除在譜圖上除所指定的群中的每一個(gè)群以外的殘留信號(hào)。第一提取器可以通過將在頻率軸上的所指定的群中的每一個(gè)群的連續(xù)長度與閾值進(jìn)行比較來提取與音樂噪聲相對(duì)應(yīng)的群。第一提取器可以通過預(yù)先指定的語音部提取方案將在譜圖的時(shí)間軸上所區(qū)分的每個(gè)幀劃分為噪聲類似幀和語音類似幀，并將位于所劃分的噪聲類似幀或語音類似幀上的群的長度與閾值進(jìn)行比較。第二提取器可以針對(duì)其余的群中的每一個(gè)群基于在時(shí)間軸上交疊的群之間的相似性來提取與音樂噪聲相對(duì)應(yīng)的群。針對(duì)其余的群中的每一個(gè)群，通過基于在時(shí)間軸上交疊的區(qū)域上的群長度的平均值或偏差來確定相似性，第二提取器可以提取與音樂噪聲相對(duì)應(yīng)的群。根據(jù)本發(fā)明的另一實(shí)施方式，提供了一種基于語音通信的噪聲去除方法。該方法包括:執(zhí)行譜減法(SS)的步驟，由譜減法裝置基于增益函數(shù)針對(duì)語音信號(hào)執(zhí)行譜減法；執(zhí)行聚類的步驟，由噪聲去除裝置針對(duì)其中已執(zhí)行了所述譜減法的語音信號(hào)執(zhí)行在譜圖的頻率軸上連續(xù)的信號(hào)的聚類以指定一個(gè)或更多個(gè)群；第一提取步驟，由所述噪聲去除裝置通過確定所指定的群中的每一個(gè)群在頻率軸上的連續(xù)性來提取與音樂噪聲相對(duì)應(yīng)的群；以及第二提取步驟，由所述噪聲去除裝置針對(duì)其余的群中的每一個(gè)群基于在時(shí)間軸上交疊的群之間的相似性來提取與所述音樂噪聲相對(duì)應(yīng)的群。對(duì)群的所述第一提取步驟可以包括:通過將所指定的群中的每一個(gè)群在頻率軸上的連續(xù)長度與閾值進(jìn)行比較來提取與音樂噪聲相對(duì)應(yīng)的群。對(duì)群的所述第二提取步驟可以包括:針對(duì)其余的群中的每一個(gè)群，基于在時(shí)間軸上交疊的群中的相似性來提取與音樂噪聲相對(duì)應(yīng)的群。根據(jù)本發(fā)明的另一實(shí)施方式，提供了一種基于語音通信的噪聲去除方法。該方法包括:執(zhí)行聚類的步驟，針對(duì)其中已經(jīng)執(zhí)行了基于增益函數(shù)的譜減法的語音信號(hào)執(zhí)行在譜圖的頻率軸上的信號(hào)的聚類以指定一個(gè)或更多個(gè)群；第一提取步驟，通過確定所指定的群中的每一個(gè)群在頻率軸上的連續(xù)性來提取與音樂噪聲相對(duì)應(yīng)的群；以及第二提取步驟，針對(duì)其余的群中的每一個(gè)群，基于在時(shí)間軸上交疊的群之間的相似性來提取與所述音樂噪聲相對(duì)應(yīng)的群。所述執(zhí)行聚類的步驟可以包括:在譜圖的頻率軸上連續(xù)的信號(hào)之間執(zhí)行聚類以指定一個(gè)或更多個(gè)群。所述執(zhí)行聚類的步驟可以包括:去除在譜圖上除所指定的群中的每一個(gè)群以外的
殘留信號(hào)。對(duì)群的所述第一提取步驟可以包括:通過將在頻率軸上的指定的群中的每一個(gè)群的連續(xù)長度與閾值進(jìn)行比較來提取與音樂噪聲相對(duì)應(yīng)的群。對(duì)群的所述第一提取步驟可以包括:通過預(yù)先指定的語音部提取方案，將在譜圖的時(shí)間軸上所區(qū)分的每個(gè)幀劃分為噪聲類似幀和語音類似幀；以及將位于所劃分的噪聲類似幀或語音類似幀上的群的長度與閾值進(jìn)行比較。對(duì)群的所述第二提取步驟可以包括:針對(duì)其余的群中的每一個(gè)群，基于在時(shí)間軸上交疊的群之間的相似性來提取與音樂噪聲相對(duì)應(yīng)的群。對(duì)群的所述第二提取步驟可以包括:針對(duì)其余的群中的每一個(gè)群，通過執(zhí)行基于在時(shí)間軸上交疊的區(qū)域上的群長度的平均值或偏差來確定相似性以提取與音樂噪聲相對(duì)應(yīng)的群。有利效果根據(jù)依據(jù)本發(fā)明的基于語音通信的噪聲去除系統(tǒng)和方法，通過執(zhí)行與對(duì)信號(hào)進(jìn)行分組(其中，已經(jīng)在根據(jù)在時(shí)間軸和頻率軸中的變化來對(duì)幅度上的差別進(jìn)行顯示的譜圖的頻率軸上執(zhí)行了從語音通信去除噪聲的譜減法(SS))的任務(wù)相對(duì)應(yīng)的聚類，并基于聚類通過屬于語音和音樂噪聲的特性僅提取出音樂噪聲，可以從噪聲區(qū)域提取出殘留的音樂噪聲并因而提供自然的收聽效果。此外，由于防止了在語音區(qū)域中生成的語音失真，所以可以確保語言清晰度的可靠性。另外，由于從語音區(qū)域提取出了音樂噪聲，所以可以降低噪聲的散度。

圖1是示意性地例示了根據(jù)本發(fā)明的實(shí)施方式的基于語音通信的噪聲去除系統(tǒng)的結(jié)構(gòu)圖；圖2是根據(jù)本發(fā)明的實(shí)施方式的譜圖；圖3是示意性地例示了根據(jù)本發(fā)明的實(shí)施方式的噪聲去除裝置的結(jié)構(gòu)圖；并且圖4和圖5是示意性地例示了根據(jù)本發(fā)明的實(shí)施方式的基于語音通信的噪聲去除方法的流程圖。
具體實(shí)施例方式以下，將參照附圖描述本發(fā)明的示例性實(shí)施方式。圖1是示意性地例示了根據(jù)本發(fā)明的實(shí)施方式的基于語音通信的噪聲去除系統(tǒng)的結(jié)構(gòu)圖。如圖1所示，該系統(tǒng)包括:譜減法裝置100，其被配置為針對(duì)語音信號(hào)執(zhí)行譜減法(SS);以及噪聲去除裝置200，其被配置為針對(duì)已經(jīng)執(zhí)行了譜減法的語音信號(hào)執(zhí)行聚類(clustering)并被配置為基于聚類來提取音樂噪聲。這里，語音信號(hào)指的是在流入了背景噪聲并在實(shí)際生活中污染了純語音的語音通信環(huán)境中的接收信號(hào)，并可以用在例如移動(dòng)電話、語音識(shí)別、語音編碼、講話者識(shí)別等的各種領(lǐng)域中。譜減法裝置100針對(duì)在語音通信環(huán)境中接收的語音信號(hào)基于增益函數(shù)來執(zhí)行譜減法以改善聲音質(zhì)量，并且下面將通過等式I至等式4描述譜減法裝置100的譜減法操作。也就是說，通過以加性噪聲w(n)污染純語音信號(hào)s(n)而生成的污染的語音χ(η)由以下等式I表示。[等式I]χ (n) =s (n) +w (η)在等式I中，η表示離散時(shí)間索引，并且通過傅立葉變換，χ (η)可以接近于傅立葉頻譜(FS) Xi (f),如在等式2中所示。[等式2]Xi (f) = Si (f) +Wi (f)
在等式2中，i和f分別表示在幀和頻率位置(bin)中的索引，Si (f)表示純語音的FS，并且Wi (f)表示噪聲的FS。就此而論，基于包括(為了抑制殘留的音樂噪聲而引入的)過減元素a(a彡I)的增益函數(shù)Gi (f)的譜減法是如在等式3和等式4中所限定的。[等式3]
n\lh WfM1 I
'α xm ) 9 口、 +P
I (P)ι/γ ，其它情況[等式4]Si(J)=XiGlf)在等式3和等式4中，Xi (f) I和I ftrtl分別表示Xi (f)的傅立葉幅值譜(FMS)和估計(jì)噪聲的FMS。此外，α是這樣的因子，S卩，它增加了語音失真，同時(shí)通過比估計(jì)減去更多的噪聲來減少殘留噪聲的峰值元素。此外，β (0^ β〈1)表示用于屏蔽殘留噪聲的譜平滑元素，并且一般使用接近于“O”的值。另外，r表示用于確定減法撓度(subtraction bending)的形狀的指數(shù)。噪聲去除裝置200在譜圖的頻率軸上執(zhí)行聚類以去除殘留在已由譜減法裝置100執(zhí)行了譜減法的語音信號(hào)中的音樂噪聲。更具體地，噪聲去除裝置200針對(duì)如圖2所示的在譜圖的頻率軸上連續(xù)的信號(hào)執(zhí)行聚類以指定一個(gè)或更多個(gè)群{群(i，j，f)}，并將譜圖上除指定的群以外的殘留信號(hào)確定為噪聲以去除殘留信號(hào)。這里，群{群(i，j，f)}指的是用于確定語音或音樂噪聲組的單元，并且1、j和f分別指的是幀、群和頻率索引?；谏厦娴拿枋觯肼暼コb置200確定在頻率軸上的每個(gè)群的連續(xù)性以提取與音樂噪聲相對(duì)應(yīng)的群。更具體地，噪聲去除裝置200將每個(gè)指定的群長度{clusterlength(即在頻率軸上的每個(gè)群的連續(xù)長度)與設(shè)置的閾值進(jìn)行比較以提取并去除與音樂噪聲相對(duì)應(yīng)的群。為此，通過例如語音活動(dòng)檢測(cè)器這樣的預(yù)先指定的語音部提取方案，噪聲去除裝置200將根據(jù)譜圖的時(shí)間軸所區(qū)別的幀劃分為噪聲類似幀和語音類似幀。此外，噪聲去除裝置200將位于所劃分的噪聲類似幀或語音類似幀上的每個(gè)群的長度與預(yù)設(shè)的閾值進(jìn)行比較以確定是否存在與每個(gè)群對(duì)應(yīng)的音樂噪聲。也就是說，當(dāng)群長度{cluster_length(i, j)}小于在噪聲類似幀中的第一閾值(THl)時(shí)，噪聲去除裝置200將相應(yīng)的群區(qū)分為音樂噪聲，并提取該群。此外，當(dāng)群長度{cluster_length(i, j)}小于在語音類似幀中的第二閾值(TH2)時(shí)，噪聲去除裝置200將相應(yīng)的群區(qū)分為音樂噪聲，并提取該群。作為參考，第二閾值(TH2)具有比第一閾值(THl)更大的值。此外，針對(duì)其余的群的每一個(gè)，噪聲去除裝置200基于在時(shí)間軸上交疊的群之間的相似性來提取與音樂噪聲相對(duì)應(yīng)的群。更具體地，針對(duì)其余的群的每一個(gè)，噪聲去除裝置200可以輸出已經(jīng)去除了音樂噪聲的語音信號(hào)，其中，通過基于在時(shí)間軸上交疊的區(qū)域上的群長度的平均值或偏差來確定相似性并提取出與音樂噪聲相對(duì)應(yīng)的群來去除音樂噪聲。也就是說，如圖2所示，當(dāng)信號(hào)從群(1-k，，f)到群(i，，f)在時(shí)間軸上不連續(xù)時(shí)，噪聲去除裝置200將群(i，，f)區(qū)分為音樂噪聲，并通過使用語音在時(shí)間軸上連續(xù)但音樂噪聲在時(shí)間軸上不連續(xù)的特性來提取群(i，，f)。這里，k表示過去的幀常數(shù)。此外，通過利用語音的平均值或偏差大于音樂噪聲的平均值或偏差的特性，通過將時(shí)間軸上的從群(i_k，，f)到群(i,，f)的平均值或偏差與群(i，，f)進(jìn)行比較來確定獲得的相似度，噪聲去除裝置200可以將群(i，，f)提取為音樂噪聲。以下，將參照?qǐng)D3描述根據(jù)本發(fā)明的實(shí)施方式的噪聲去除裝置200的詳細(xì)配置。也就是說，噪聲去除裝置200包括:聚類單元210，配置為針對(duì)語音信號(hào)執(zhí)行聚類；第一提取器220，配置為基于頻率軸提取音樂噪聲；以及第二提取器230，配置為基于時(shí)間軸提取音樂噪聲。聚類單元210在已經(jīng)在譜圖的頻率軸上執(zhí)行了基于增益函數(shù)的譜減法(SS)的語音信號(hào)之間執(zhí)行聚類，并指定一個(gè)或更多個(gè)群。更具體地，聚類單元210針對(duì)如圖2所示的譜圖的頻率軸上的連續(xù)的信號(hào)執(zhí)行聚類以指定一個(gè)或更多個(gè)群{群(i，j，f ) }，并將譜圖上的除指定的群以外的殘留信號(hào)確定為噪聲以去除所確定的殘留信號(hào)。這里，群{群(i，j，f)}指的是用于確定語音或音樂噪聲組的單元，并且1、j和f分別指的是幀、群和頻率索引。第一提取器220確定在頻率軸上的指定的群的連續(xù)性以提取與音樂噪聲相對(duì)應(yīng)的群。更具體地，第一提取器220將指定的群長度{ClUSter_length(i，j)} (S卩，每個(gè)群在頻率軸上的連續(xù)長度)與設(shè)置的閾值進(jìn)行比較以提取并去除與音樂噪聲相對(duì)應(yīng)的群。為此，通過例如語音活動(dòng)檢測(cè)器這樣的預(yù)先指定的語音部提取方案，第一提取器220將根據(jù)譜圖的時(shí)間軸所區(qū)分的幀劃分為噪聲類似幀和語音類似幀。此外，第一提取器220將位于所劃分的噪聲類似幀或語音類似幀上的每個(gè)群的長度與預(yù)設(shè)的閾值進(jìn)行比較以確定是否存在與每個(gè)群對(duì)應(yīng)的音樂噪聲。也就是說，如圖2所例示的，當(dāng)群長度{cluster_length(i, j)}小于在噪聲類似幀中的第一閾值(THl)時(shí)，第一提取器220將相應(yīng)的群區(qū)分為音樂噪聲，并提取該群。此外，當(dāng)群長度{cluster_length(i, j)}小于在語音類似巾貞中的第二閾值(TH2)時(shí)，第一提取器220將相應(yīng)的群區(qū)分為音樂噪聲，并提取該群。作為參考，第二閾值(TH2)具有比第一閾值(THl)更大的值。針對(duì)其余的群中的每一個(gè)群，第二提取器230基于在時(shí)間軸上交疊的群之間的相似性來提取與音樂噪聲相對(duì)應(yīng)的群。更具體地，針對(duì)其余的群中的每一個(gè)群，第二提取器230可以輸出已經(jīng)去除了音樂噪聲的語音信號(hào)，其中，通過基于在時(shí)間軸上交疊的區(qū)域上的群長度的平均值或偏差來確定相似性并提取出與音樂噪聲相對(duì)應(yīng)的群來去除音樂噪聲。也就是說，如圖2所示，當(dāng)信號(hào)從群(1-k,，f)到群(i，，f )在時(shí)間軸上不連續(xù)時(shí)，第二提取器230將群(i，，f)區(qū)分為音樂噪聲，并通過使用語音在時(shí)間軸上連續(xù)但音樂噪聲在時(shí)間軸上不連續(xù)的特性來提取群(i，，f)。這里，k表示過去的幀常數(shù)。此外，通過利用語音的平均值或偏差大于音樂噪聲的平均值或偏差的特性，通過將時(shí)間軸上的從群(i_k，，f)到群(i,，f)的平均值或偏差與群(i，，f)進(jìn)行比較來確定獲得的相似度，第二提取器230可以將群(i，，f)提取為音樂噪聲。如上所述，根據(jù)基于語音通信的噪聲去除系統(tǒng)，通過執(zhí)行與對(duì)信號(hào)進(jìn)行分組(其中，已經(jīng)在根據(jù)在時(shí)間軸和頻率軸中的變化來對(duì)幅度上的差別進(jìn)行顯示的譜圖的頻率軸上執(zhí)行了從語音通信去除噪聲的譜減法(SS))的任務(wù)相對(duì)應(yīng)的聚類，并基于聚類通過屬于語音和音樂噪聲的特性僅提取出音樂噪聲，可以從噪聲區(qū)域提取出殘留的音樂噪聲并因而提供自然的收聽效果。此外，由于防止了在語音區(qū)域中生成的語音失真，所以可以確保語言清晰度的可靠性。另外，由于從語音區(qū)域提取出了音樂噪聲，所以可以降低噪聲的散度。以下，將參照?qǐng)D4和圖5描述根據(jù)本發(fā)明的實(shí)施方式的基于語音通信的噪聲去除方法。這里，為了方便描述，將通過使用相應(yīng)的標(biāo)號(hào)來討論已經(jīng)通過圖1至圖3描述的在圖4和圖5中不出的配置。首先，將參照?qǐng)D4描述根據(jù)本發(fā)明的實(shí)施方式的對(duì)基于語音通信的噪聲去除系統(tǒng)進(jìn)行驅(qū)動(dòng)的方法。在步驟SllO至S130，譜減法裝置100針對(duì)在語音通信環(huán)境中接收的語音信號(hào)基于增益函數(shù)執(zhí)行譜減法以改善聲音質(zhì)量。通過等式I到等式4可以描述譜減法裝置100的譜減法操作。也就是說，通過以加性噪聲w(n)污染純語音信號(hào)s(n)而生成的污染的語音χ (η)由以下等式I表示。[等式I]χ (n) =s (n) +w (η)在等式I中，η表示離散的時(shí)間索引，并且通過傅立葉變換，χ (η)可以接近于傅立葉頻譜(FS) Xi (f)，如在等式2中所示。
[等式2]Xi (f) = Si (f) +Wi (f)在等式2中，i和f分別表示在幀和頻率位置(bin)中的索引，Si (f)表示純語音的FS，并且Wi (f)表示噪聲的FS。就此而論，以包括為了抑制殘留的音樂噪聲而引入的過減元素α (α彡I)的增益函數(shù)Gi (f)為基礎(chǔ)的譜減法是如在等式3和等式4中所限定的。[等式3]
權(quán)利要求
1.一種基于語音通信的噪聲去除系統(tǒng)，該系統(tǒng)包括: 譜減法裝置，其配置為基于增益函數(shù)針對(duì)語音信號(hào)執(zhí)行譜減法(SS);以及噪聲去除裝置，其配置為針對(duì)已經(jīng)執(zhí)行了所述譜減法的語音信號(hào)執(zhí)行在譜圖的頻率軸上連續(xù)的信號(hào)的聚類以指定一個(gè)或更多個(gè)群，并且所述噪聲去除裝置配置為確定所指定的各個(gè)群在頻率軸和時(shí)間軸上的連續(xù)性以提取音樂噪聲。
2.根據(jù)權(quán)利要求1所述的系統(tǒng)，其中，所述噪聲去除裝置將所指定的各個(gè)群在頻率軸上的連續(xù)長度與閾值進(jìn)行比較以提取與所述音樂噪聲相對(duì)應(yīng)的群，并針對(duì)其余的群中的每一個(gè)群基于在時(shí)間軸上交疊的群之間的相似性來提取與音樂噪聲相對(duì)應(yīng)的群。
3.一種噪聲去除裝置，該裝置包括: 聚類單元，其配置為針對(duì)其中已經(jīng)執(zhí)行了基于增益函數(shù)的譜減法的語音信號(hào)執(zhí)行在譜圖的頻率軸上的信號(hào)的聚類以指定一個(gè)或更多個(gè)群；第一提取器，其配置為確定所指定的群中的每一個(gè)群在頻率軸上的連續(xù)性以提取與音樂噪聲相對(duì)應(yīng)的群；以及第二提取器，其配置為針對(duì)其余的群中的每一個(gè)群基于在時(shí)間軸上交疊的群之間的相似性來提取與所述音樂噪聲相對(duì)應(yīng)的群。
4.根據(jù)權(quán)利要求3所述的裝置，其中，所述聚類單元通過在譜圖的頻率軸上連續(xù)的信號(hào)之間執(zhí)行聚類來指定一個(gè)或更多個(gè)群。
5.根據(jù)權(quán)利要求4所述的裝置，其中，所述聚類單元去除在譜圖上除所指定的群中的每一個(gè)群以外的殘留信號(hào)。`
6.根據(jù)權(quán)利要求3所述的裝置，其中，所述第一提取器通過將在頻率軸上的所指定的群中的每一個(gè)群的連續(xù)長度與閾值進(jìn)行比較來提取與音樂噪聲相對(duì)應(yīng)的群。
7.根據(jù)權(quán)利要求6所述的裝置，其中，所述第一提取器通過預(yù)先指定的語音部提取方案將在譜圖的時(shí)間軸上所區(qū)分的每個(gè)幀劃分為噪聲類似幀和語音類似幀，并將位于所劃分的噪聲類似幀或語音類似幀上的群的長度與閾值進(jìn)行比較。
8.根據(jù)權(quán)利要求3所述的裝置，其中，針對(duì)其余的群中的每一個(gè)群，所述第二提取器基于在時(shí)間軸上交疊的群之間的相似性來提取與所述音樂噪聲相對(duì)應(yīng)的群。
9.根據(jù)權(quán)利要求8所述的裝置，其中，針對(duì)其余的群中的每一個(gè)群，通過基于在時(shí)間軸上交疊的區(qū)域上的群長度的平均值或偏差來確定相似性，所述第二提取器提取與所述音樂噪聲相對(duì)應(yīng)的群。
10.一種基于語音通信的噪聲去除方法，該方法包括: 執(zhí)行譜減法(SS)的步驟，由譜減法裝置基于增益函數(shù)針對(duì)語音信號(hào)執(zhí)行譜減法；執(zhí)行聚類的步驟，由噪聲去除裝置針對(duì)其中已執(zhí)行了所述譜減法的語音信號(hào)執(zhí)行在譜圖的頻率軸上連續(xù)的信號(hào)的聚類以指定一個(gè)或更多個(gè)群；第一提取步驟，由所述噪聲去除裝置通過確定所指定的群中的每一個(gè)群在頻率軸上的連續(xù)性來提取與音樂噪聲相對(duì)應(yīng)的群；以及第二提取步驟，由所述噪聲去除裝置針對(duì)其余的群中的每一個(gè)群基于在時(shí)間軸上交疊的群之間的相似性來提取與所述音樂噪聲相對(duì)應(yīng)的群。
11.根據(jù)權(quán)利要求10所述的方法，其中，對(duì)群的所述第一提取步驟包括:通過將所指定的群中的每一個(gè)群在頻率軸上的連續(xù)長度與閾值進(jìn)行比較來提取與所述音樂噪聲相對(duì)應(yīng)的群。
12.根據(jù)權(quán)利要求10所述的方法，其中，對(duì)群的所述第二提取步驟包括:針對(duì)其余的群中的每一個(gè)群，基于在時(shí)間軸上交疊的群之間的相似性來提取與所述音樂噪聲相對(duì)應(yīng)的群。
13.一種基于語音通信的噪聲去除方法，該方法包括: 執(zhí)行聚類的步驟，針對(duì)其中已經(jīng)執(zhí)行了基于增益函數(shù)的譜減法的語音信號(hào)執(zhí)行在譜圖的頻率軸上的信號(hào)的聚類以指定一個(gè)或更多個(gè)群；第一提取步驟，通過確定所指定的群中的每一個(gè)群在頻率軸上的連續(xù)性來提取與音樂噪聲相對(duì)應(yīng)的群；以及第二提取步驟，針對(duì)其余的群中的每一個(gè)群，基于在時(shí)間軸上交疊的群之間的相似性來提取與所述音樂噪聲相對(duì)應(yīng)的群。
14.根據(jù)權(quán)利要求13所述的方法，其中，所述執(zhí)行聚類的步驟包括:在譜圖的頻率軸上連續(xù)的信號(hào)之間執(zhí)行聚類以指定一個(gè)或更多個(gè)群。
15.根據(jù)權(quán)利要求14所述的方法，其中，所述執(zhí)行聚類的步驟包括:去除在譜圖上除所指定的群中的每一個(gè)群以外的殘留信號(hào)。
16.根據(jù)權(quán)利要求13所述的方法，其中，對(duì)群的所述第一提取步驟包括:通過將在頻率軸上的指定的群中的每一個(gè)群的連續(xù)長度與閾值進(jìn)行比較來提取與所述音樂噪聲相對(duì)應(yīng)的群。
17.根據(jù)權(quán)利要求16所述的方法，其中，對(duì)群的所述第一提取步驟包括: 通過預(yù)先指定的語音部提取方案，將在譜圖的時(shí)間軸上所區(qū)分的每個(gè)幀劃分為噪聲類似幀和語音類似幀；以及將位于所劃分的噪聲類似幀或語音類似幀上的群的長度與閾值進(jìn)行比較。
18.根據(jù)權(quán)利要求13所述的方法，其中，對(duì)群的所述第二提取步驟包括:針對(duì)其余的群中的每一個(gè)群，基于在時(shí)間軸上交疊的群之間的相似性來提取與所述音樂噪聲相對(duì)應(yīng)的群。
19.根據(jù)權(quán)利要求18所述的方法，其中，對(duì)群的所述第二提取步驟包括:針對(duì)其余的群中的每一個(gè)群，通過執(zhí)行基于在時(shí)間軸上交疊的區(qū)域上的群長度的平均值或偏差來確定相似性以提取與所述音樂噪聲相對(duì)應(yīng)的群。
全文摘要
本發(fā)明公開了一種基于語音通信的干擾噪聲去除方法和系統(tǒng)。本發(fā)明包括譜減法裝置，其用于基于增益函數(shù)針對(duì)語音信號(hào)執(zhí)行譜減法；以及噪聲去除裝置，其用于將其中執(zhí)行了譜減法的語音信號(hào)在譜圖上聚類為頻域中的連續(xù)信號(hào)并指定至少一個(gè)群，并用于識(shí)別所指定的群中的每一個(gè)群的頻域的連續(xù)性和時(shí)域的連續(xù)性以提取音樂噪聲，由此通過有效地從噪聲域提取音樂噪聲殘留來提供自然的收聽效果，并通過防止在語音域中的語音失真的出現(xiàn)而確保了語言清晰度的可靠性。另外，通過從語音域提取出音樂噪聲，可以有效地降低語音擴(kuò)散。
文檔編號(hào)G10L21/02GK103201793SQ201180049940
公開日2013年7月10日申請(qǐng)日期2011年10月18日優(yōu)先權(quán)日2010年10月18日
發(fā)明者樸圣水, 鄭盛日, 河?xùn)|庚, 宋在勛申請(qǐng)人:Sk電信有限公司, 傳索諾公司

完整全部詳細(xì)技術(shù)資料下載