用于改進(jìn)聲頻信號(hào)的感知的設(shè)備和方法

文檔序號(hào)：9932720閱讀：528來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

用于改進(jìn)聲頻信號(hào)的感知的設(shè)備和方法
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)案涉及聲音產(chǎn)生的領(lǐng)域，且確切地說(shuō)，涉及一種用于改進(jìn)聲頻信號(hào)的感知的設(shè)備和方法。
【背景技術(shù)】
[0002]常見(jiàn)的音頻信號(hào)由多個(gè)個(gè)別聲源組成。例如，在大部分播放時(shí)間音樂(lè)錄制品包括幾種樂(lè)器。在語(yǔ)音通信的情況下，除了語(yǔ)音本身之外，聲頻信號(hào)通常包括通過(guò)同一麥克風(fēng)記錄的其它干擾聲，例如，環(huán)境噪聲或同一房間中其它人說(shuō)話聲。
[0003]在典型的語(yǔ)音通信情形中，參與者的話音使用一個(gè)或多個(gè)麥克風(fēng)俘獲且在信道上傳輸?shù)浇邮掌鳌｛溈孙L(fēng)不僅俘獲所需的話音，而且還捕獲不合需要的背景噪聲。因此，所傳輸信號(hào)是語(yǔ)音和噪聲分量的混合物。具體而言，在移動(dòng)通信中，強(qiáng)烈的背景噪聲通常會(huì)嚴(yán)重影響客戶的體驗(yàn)或聲音效果。
[0004]三十多年來(lái)口語(yǔ)交流中的噪聲抑制，也稱為“語(yǔ)音增強(qiáng)”已受到大量關(guān)注并且已提出多種方法來(lái)減小此類混合物中的噪聲級(jí)。換句話說(shuō)，此類語(yǔ)音增強(qiáng)算法用于減小背景噪聲的目標(biāo)。如圖1中所示，給定將有噪聲的語(yǔ)音信號(hào)(例如，語(yǔ)音和背景噪聲的單信道混合物)，即，信號(hào)S例如通過(guò)分離單元10分離，以便獲得兩種信號(hào):語(yǔ)音分量SC，還稱為“增強(qiáng)的語(yǔ)音信號(hào)”；以及噪聲分量Ne，還稱為“估計(jì)的噪聲信號(hào)”。增強(qiáng)的語(yǔ)音信號(hào)SC應(yīng)該含有少于有噪聲的語(yǔ)音信號(hào)S的噪聲且提供較高的語(yǔ)音清晰度。在最佳情況下，增強(qiáng)的語(yǔ)音信號(hào)SC與初始干凈的語(yǔ)音信號(hào)類似。典型的語(yǔ)音增強(qiáng)系統(tǒng)的輸出是單信道語(yǔ)音信號(hào)。
[0005]例如，現(xiàn)有技術(shù)解決方案基于在時(shí)頻域中扣除此類噪聲估計(jì)量或在頻譜域中估計(jì)過(guò)濾。可以通過(guò)對(duì)噪聲和語(yǔ)音的行為，例如，平穩(wěn)性或非平穩(wěn)性以及統(tǒng)計(jì)標(biāo)準(zhǔn)，例如，最小均方差進(jìn)行假設(shè)來(lái)作出這些估計(jì)。此外，例如，如在最新的方法中，這些估計(jì)可以通過(guò)從訓(xùn)練數(shù)據(jù)收集的知識(shí)構(gòu)造，所述方法例如，非負(fù)矩陣分解(η ο η - n e g a t i V e matrixfactorizat1n，NMF)或深度神經(jīng)網(wǎng)絡(luò)。例如，非負(fù)矩陣分解基于將混合物的功率譜分解成若干頻譜基礎(chǔ)的非負(fù)組合，每一個(gè)與當(dāng)前源中的一個(gè)相關(guān)聯(lián)。在所有這些方法中，通過(guò)從信號(hào)S中清除噪聲來(lái)實(shí)現(xiàn)語(yǔ)音信號(hào)的增強(qiáng)。
[0006]綜上所述，這些語(yǔ)音增強(qiáng)方法將語(yǔ)音和噪聲的單信道或多信道混合物轉(zhuǎn)換成具有噪聲抑制目標(biāo)的單信道信號(hào)。這些系統(tǒng)中的大部分依賴于“背景噪聲”的在線估計(jì)，所述背景噪聲假設(shè)為平穩(wěn)的，即，隨時(shí)間推移變化緩慢。然而，在現(xiàn)實(shí)有噪聲的環(huán)境的情況下，此假設(shè)不一定得到驗(yàn)證。實(shí)際上，卡車(chē)經(jīng)過(guò)、關(guān)門(mén)或例如打印機(jī)等一些種類的機(jī)器的操作是非平穩(wěn)噪聲的實(shí)例，這些噪聲在每日的語(yǔ)音通信中，具體而言在移動(dòng)情形中經(jīng)常出現(xiàn)并且會(huì)不利地影響用戶體驗(yàn)或聲音效果。
[0007]具體來(lái)說(shuō)，在非平穩(wěn)的情況下，從信號(hào)中估計(jì)此類噪聲分量是易于出錯(cuò)的步驟。由于不完全分離，因此旨在抑制信號(hào)中含有的噪聲的當(dāng)前語(yǔ)音增強(qiáng)算法通常無(wú)法引起更佳的用戶體驗(yàn)或聲音效果。

【發(fā)明內(nèi)容】

[0008]本發(fā)明的目標(biāo)是提供一種聲音產(chǎn)生的改進(jìn)技術(shù)。
[0009]此目標(biāo)通過(guò)獨(dú)立權(quán)利要求的特征實(shí)現(xiàn)。另外的實(shí)施形式通過(guò)從屬權(quán)利要求、說(shuō)明書(shū)以及圖式清楚可見(jiàn)。
[0010]根據(jù)第一方面，提供一種用于改進(jìn)聲頻信號(hào)的感知的設(shè)備，所述設(shè)備包括:分離單元，用于將聲頻信號(hào)分離成至少一個(gè)語(yǔ)音分量和至少一個(gè)噪聲分量；以及空間呈現(xiàn)單元，用于在通過(guò)變換器單元輸出時(shí)在相對(duì)于用戶的第一虛擬位置處產(chǎn)生至少一個(gè)語(yǔ)音分量的聽(tīng)覺(jué)效果且在通過(guò)變換器單元輸出時(shí)在相對(duì)于用戶的第二虛擬位置處產(chǎn)生至少一個(gè)噪聲分量的聽(tīng)覺(jué)效果。
[0011]本發(fā)明并不旨在提供常規(guī)的噪聲抑制，例如，噪聲信號(hào)的純振幅相關(guān)的抑制，而是旨在提供所估計(jì)語(yǔ)音和噪聲的空間分布。將此種空間信息添加到聲頻信號(hào)允許人類聽(tīng)覺(jué)系統(tǒng)采用空間定位線索，以便分離語(yǔ)音和噪聲源且改進(jìn)聲頻信號(hào)的感知質(zhì)量。
[0012]此外，感知質(zhì)量由于在避免噪聲的抑制時(shí)典型的語(yǔ)音增強(qiáng)偽聲，例如，音樂(lè)噪聲不太顯著而得到增強(qiáng)。
[0013]通過(guò)使用可增強(qiáng)語(yǔ)音清晰度且減少收聽(tīng)者疲勞的本發(fā)明的原理來(lái)實(shí)現(xiàn)更自然的通信方式。
[0014]給定前景語(yǔ)音和背景噪聲的混合物，例如，如在具有頻域獨(dú)立分量分析的多信道前端中呈現(xiàn)的混合物，電子電路用于使用語(yǔ)音增強(qiáng)的各種解決方案分離語(yǔ)音和噪聲以獲得語(yǔ)音和噪聲信號(hào)分量，并且進(jìn)一步用于使用空間音頻呈現(xiàn)的各種解決方案來(lái)將語(yǔ)音和噪聲分布在三維空間中的不同位置，所述空間音頻呈現(xiàn)使用多種擴(kuò)音器，S卩，兩個(gè)或兩個(gè)以上擴(kuò)音器或頭戴式耳機(jī)實(shí)現(xiàn)。
[0015]本發(fā)明有利地規(guī)定人類聽(tīng)覺(jué)系統(tǒng)可以采用空間線索分離語(yǔ)音和噪聲。此外，在更新自然空間線索時(shí)，語(yǔ)音清晰度和語(yǔ)音質(zhì)量增加并且實(shí)現(xiàn)更自然的語(yǔ)音通信。
[0016]本發(fā)明有利地恢復(fù)無(wú)法在常規(guī)的單信道通信情形下傳輸?shù)目臻g線索。人類聽(tīng)覺(jué)系統(tǒng)可以采用這些空間線索，以便分離語(yǔ)音和噪聲源。避免如通常通過(guò)當(dāng)前的語(yǔ)音增強(qiáng)方法完成的噪聲的抑制可進(jìn)一步增加語(yǔ)音通信的質(zhì)量，這是因?yàn)橐氲膫温晿O少。
[0017]本發(fā)明有利地提供抵抗不完全分離的改進(jìn)的穩(wěn)定性以及與將在使用噪聲抑制的情況下出現(xiàn)的偽聲數(shù)相比出現(xiàn)的較少偽聲。本發(fā)明可以與任何語(yǔ)音增強(qiáng)算法組合。本發(fā)明有利地可以用于語(yǔ)音和噪聲的任意混合物且不必改變通信信道和/或語(yǔ)音記錄。
[0018]本發(fā)明有利地提供甚至一個(gè)麥克風(fēng)和/或一個(gè)傳輸信道的有效利用。有利的是，許多不同的呈現(xiàn)系統(tǒng)是可能的，例如，包括兩個(gè)或兩個(gè)以上揚(yáng)聲器或立體聲頭戴式耳機(jī)的系統(tǒng)。用于改進(jìn)聲頻信號(hào)的感知的設(shè)備可以包括變換器單元或者變換器單元可以是分離單元。例如，用于改進(jìn)聲頻信號(hào)的感知的設(shè)備可以是智能手機(jī)或平板計(jì)算機(jī)，或任何其它裝置，并且變換器單元可以是集成到設(shè)備或裝置中的擴(kuò)音器，或變換器單元可以是外部擴(kuò)音器布置或頭戴式耳機(jī)。
[0019]在根據(jù)第一方面的設(shè)備的第一可能實(shí)施形式中，第一虛擬位置和第二虛擬位置是間隔開(kāi)的，相對(duì)于用戶跨越大于20度弧的平面角，優(yōu)選地跨越大于35度弧的平面角，尤其優(yōu)選地跨越大于45度弧的平面角。
[0020]這有利地允許收聽(tīng)者或用戶感知噪聲和語(yǔ)音信號(hào)的空間分離。
[0021]在根據(jù)第一方面本身或根據(jù)第一方面的第一實(shí)施形式的設(shè)備的第二可能實(shí)施形式中，分離單元用于確定聲頻信號(hào)的時(shí)頻特征并且基于所確定的時(shí)頻特征將聲頻信號(hào)分離成至少一個(gè)語(yǔ)音分量和至少一個(gè)噪聲分量。
[0022]在信號(hào)處理時(shí)，產(chǎn)生時(shí)頻特征的時(shí)頻分析包括使用各種時(shí)頻同時(shí)研究在時(shí)域和頻域兩者中的信號(hào)的那些技術(shù)。
[0023]在根據(jù)依據(jù)第一方面的設(shè)備的第二可能實(shí)施形式的設(shè)備的第三可能實(shí)施形式中，分離單元用于在時(shí)間窗期間和/或在頻率范圍內(nèi)確定聲頻信號(hào)的時(shí)頻特征。
[0024]因此，可以確定各種特征時(shí)間常數(shù)且隨后用于有利地將聲頻信號(hào)分離成至少一個(gè)語(yǔ)音分量和至少一個(gè)噪聲分量。
[0025]在根據(jù)第一方面的第三實(shí)施形式或根據(jù)依據(jù)第一方面的設(shè)備的第二可能實(shí)施形式的設(shè)備的第四可能實(shí)施形式中，分離單元用于基于非負(fù)矩陣分解確定時(shí)頻特征，從而計(jì)算至少一個(gè)語(yǔ)音分量和至少一個(gè)噪聲分量的基礎(chǔ)表示。
[0026]非負(fù)矩陣分解允許通過(guò)與顯現(xiàn)原始數(shù)據(jù)矩陣中的列相同的方式顯現(xiàn)基礎(chǔ)列。
[0027]在根據(jù)第一方面的第三實(shí)施形式或根據(jù)依據(jù)第一方面的設(shè)備的第二可能實(shí)施形式的設(shè)備的第五可能實(shí)施形式中，分離單元用于借助于時(shí)間序列分析相對(duì)于聲頻信號(hào)的平穩(wěn)性分析聲頻信號(hào)并且基于平穩(wěn)分析將聲頻信號(hào)分離成對(duì)應(yīng)于至少一個(gè)非平穩(wěn)分量的至少一個(gè)語(yǔ)音分量以及基于平穩(wěn)分析將聲頻信號(hào)分離成對(duì)應(yīng)于至少一個(gè)平穩(wěn)分量的至少一個(gè)噪聲分量。
[0028]通過(guò)時(shí)間序列分析獲得的各種特征平穩(wěn)特性可以用于有利地從非平穩(wěn)語(yǔ)音分量中分尚平穩(wěn)噪聲分量。
[0029]在根據(jù)第一方面本身或根據(jù)第一方面的以上實(shí)施形式中的任一個(gè)的設(shè)備的第六可能實(shí)施形式中，變換器單元包括相對(duì)于用戶安排在不同方位角處的至少兩個(gè)擴(kuò)音器。
[0030]這有利地為用戶提

完整全部詳細(xì)技術(shù)資料下載

當(dāng)前第1頁(yè)1 2 3 4

該技術(shù)已申請(qǐng)專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請(qǐng)聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：比約恩·舒勒;費(fèi)利克斯·威寧格;克里斯蒂安·柯斯特;彼得·格羅舍;
技術(shù)所有人：華為技術(shù)有限公司;
我是此專利的發(fā)明人

上一篇：磁記錄介質(zhì)的制造方法
上一篇：從變換編碼/解碼過(guò)渡到預(yù)測(cè)編碼/解碼的制作方法

相關(guān)技術(shù)

網(wǎng)友詢問(wèn)留言已有0條留言

還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊！

精彩留言，會(huì)給你點(diǎn)贊！

人體生物信號(hào)感知芯片相關(guān)技術(shù)

視頻全程感知速率相關(guān)技術(shù)

頻譜感知相關(guān)技術(shù)

視頻感知評(píng)估相關(guān)技術(shù)

頻譜感知技術(shù)相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于改進(jìn)聲頻信號(hào)的感知的設(shè)備和方法