欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于改進(jìn)聲頻信號(hào)的感知的設(shè)備和方法

文檔序號(hào):9932720閱讀:528來(lái)源:國(guó)知局
用于改進(jìn)聲頻信號(hào)的感知的設(shè)備和方法
【技術(shù)領(lǐng)域】
[0001]本申請(qǐng)案涉及聲音產(chǎn)生的領(lǐng)域,且確切地說(shuō),涉及一種用于改進(jìn)聲頻信號(hào)的感知的設(shè)備和方法。
【背景技術(shù)】
[0002]常見(jiàn)的音頻信號(hào)由多個(gè)個(gè)別聲源組成。例如,在大部分播放時(shí)間音樂(lè)錄制品包括幾種樂(lè)器。在語(yǔ)音通信的情況下,除了語(yǔ)音本身之外,聲頻信號(hào)通常包括通過(guò)同一麥克風(fēng)記錄的其它干擾聲,例如,環(huán)境噪聲或同一房間中其它人說(shuō)話聲。
[0003]在典型的語(yǔ)音通信情形中,參與者的話音使用一個(gè)或多個(gè)麥克風(fēng)俘獲且在信道上傳輸?shù)浇邮掌鳌{溈孙L(fēng)不僅俘獲所需的話音,而且還捕獲不合需要的背景噪聲。因此,所傳輸信號(hào)是語(yǔ)音和噪聲分量的混合物。具體而言,在移動(dòng)通信中,強(qiáng)烈的背景噪聲通常會(huì)嚴(yán)重影響客戶的體驗(yàn)或聲音效果。
[0004]三十多年來(lái)口語(yǔ)交流中的噪聲抑制,也稱為“語(yǔ)音增強(qiáng)”已受到大量關(guān)注并且已提出多種方法來(lái)減小此類混合物中的噪聲級(jí)。換句話說(shuō),此類語(yǔ)音增強(qiáng)算法用于減小背景噪聲的目標(biāo)。如圖1中所示,給定將有噪聲的語(yǔ)音信號(hào)(例如,語(yǔ)音和背景噪聲的單信道混合物),即,信號(hào)S例如通過(guò)分離單元10分離,以便獲得兩種信號(hào):語(yǔ)音分量SC,還稱為“增強(qiáng)的語(yǔ)音信號(hào)”;以及噪聲分量Ne,還稱為“估計(jì)的噪聲信號(hào)”。增強(qiáng)的語(yǔ)音信號(hào)SC應(yīng)該含有少于有噪聲的語(yǔ)音信號(hào)S的噪聲且提供較高的語(yǔ)音清晰度。在最佳情況下,增強(qiáng)的語(yǔ)音信號(hào)SC與初始干凈的語(yǔ)音信號(hào)類似。典型的語(yǔ)音增強(qiáng)系統(tǒng)的輸出是單信道語(yǔ)音信號(hào)。
[0005]例如,現(xiàn)有技術(shù)解決方案基于在時(shí)頻域中扣除此類噪聲估計(jì)量或在頻譜域中估計(jì)過(guò)濾。可以通過(guò)對(duì)噪聲和語(yǔ)音的行為,例如,平穩(wěn)性或非平穩(wěn)性以及統(tǒng)計(jì)標(biāo)準(zhǔn),例如,最小均方差進(jìn)行假設(shè)來(lái)作出這些估計(jì)。此外,例如,如在最新的方法中,這些估計(jì)可以通過(guò)從訓(xùn)練數(shù)據(jù)收集的知識(shí)構(gòu)造,所述方法例如,非負(fù)矩陣分解(η ο η - n e g a t i V e matrixfactorizat1n,NMF)或深度神經(jīng)網(wǎng)絡(luò)。例如,非負(fù)矩陣分解基于將混合物的功率譜分解成若干頻譜基礎(chǔ)的非負(fù)組合,每一個(gè)與當(dāng)前源中的一個(gè)相關(guān)聯(lián)。在所有這些方法中,通過(guò)從信號(hào)S中清除噪聲來(lái)實(shí)現(xiàn)語(yǔ)音信號(hào)的增強(qiáng)。
[0006]綜上所述,這些語(yǔ)音增強(qiáng)方法將語(yǔ)音和噪聲的單信道或多信道混合物轉(zhuǎn)換成具有噪聲抑制目標(biāo)的單信道信號(hào)。這些系統(tǒng)中的大部分依賴于“背景噪聲”的在線估計(jì),所述背景噪聲假設(shè)為平穩(wěn)的,即,隨時(shí)間推移變化緩慢。然而,在現(xiàn)實(shí)有噪聲的環(huán)境的情況下,此假設(shè)不一定得到驗(yàn)證。實(shí)際上,卡車(chē)經(jīng)過(guò)、關(guān)門(mén)或例如打印機(jī)等一些種類的機(jī)器的操作是非平穩(wěn)噪聲的實(shí)例,這些噪聲在每日的語(yǔ)音通信中,具體而言在移動(dòng)情形中經(jīng)常出現(xiàn)并且會(huì)不利地影響用戶體驗(yàn)或聲音效果。
[0007]具體來(lái)說(shuō),在非平穩(wěn)的情況下,從信號(hào)中估計(jì)此類噪聲分量是易于出錯(cuò)的步驟。由于不完全分離,因此旨在抑制信號(hào)中含有的噪聲的當(dāng)前語(yǔ)音增強(qiáng)算法通常無(wú)法引起更佳的用戶體驗(yàn)或聲音效果。

【發(fā)明內(nèi)容】

[0008]本發(fā)明的目標(biāo)是提供一種聲音產(chǎn)生的改進(jìn)技術(shù)。
[0009]此目標(biāo)通過(guò)獨(dú)立權(quán)利要求的特征實(shí)現(xiàn)。另外的實(shí)施形式通過(guò)從屬權(quán)利要求、說(shuō)明書(shū)以及圖式清楚可見(jiàn)。
[0010]根據(jù)第一方面,提供一種用于改進(jìn)聲頻信號(hào)的感知的設(shè)備,所述設(shè)備包括:分離單元,用于將聲頻信號(hào)分離成至少一個(gè)語(yǔ)音分量和至少一個(gè)噪聲分量;以及空間呈現(xiàn)單元,用于在通過(guò)變換器單元輸出時(shí)在相對(duì)于用戶的第一虛擬位置處產(chǎn)生至少一個(gè)語(yǔ)音分量的聽(tīng)覺(jué)效果且在通過(guò)變換器單元輸出時(shí)在相對(duì)于用戶的第二虛擬位置處產(chǎn)生至少一個(gè)噪聲分量的聽(tīng)覺(jué)效果。
[0011]本發(fā)明并不旨在提供常規(guī)的噪聲抑制,例如,噪聲信號(hào)的純振幅相關(guān)的抑制,而是旨在提供所估計(jì)語(yǔ)音和噪聲的空間分布。將此種空間信息添加到聲頻信號(hào)允許人類聽(tīng)覺(jué)系統(tǒng)采用空間定位線索,以便分離語(yǔ)音和噪聲源且改進(jìn)聲頻信號(hào)的感知質(zhì)量。
[0012]此外,感知質(zhì)量由于在避免噪聲的抑制時(shí)典型的語(yǔ)音增強(qiáng)偽聲,例如,音樂(lè)噪聲不太顯著而得到增強(qiáng)。
[0013]通過(guò)使用可增強(qiáng)語(yǔ)音清晰度且減少收聽(tīng)者疲勞的本發(fā)明的原理來(lái)實(shí)現(xiàn)更自然的通信方式。
[0014]給定前景語(yǔ)音和背景噪聲的混合物,例如,如在具有頻域獨(dú)立分量分析的多信道前端中呈現(xiàn)的混合物,電子電路用于使用語(yǔ)音增強(qiáng)的各種解決方案分離語(yǔ)音和噪聲以獲得語(yǔ)音和噪聲信號(hào)分量,并且進(jìn)一步用于使用空間音頻呈現(xiàn)的各種解決方案來(lái)將語(yǔ)音和噪聲分布在三維空間中的不同位置,所述空間音頻呈現(xiàn)使用多種擴(kuò)音器,S卩,兩個(gè)或兩個(gè)以上擴(kuò)音器或頭戴式耳機(jī)實(shí)現(xiàn)。
[0015]本發(fā)明有利地規(guī)定人類聽(tīng)覺(jué)系統(tǒng)可以采用空間線索分離語(yǔ)音和噪聲。此外,在更新自然空間線索時(shí),語(yǔ)音清晰度和語(yǔ)音質(zhì)量增加并且實(shí)現(xiàn)更自然的語(yǔ)音通信。
[0016]本發(fā)明有利地恢復(fù)無(wú)法在常規(guī)的單信道通信情形下傳輸?shù)目臻g線索。人類聽(tīng)覺(jué)系統(tǒng)可以采用這些空間線索,以便分離語(yǔ)音和噪聲源。避免如通常通過(guò)當(dāng)前的語(yǔ)音增強(qiáng)方法完成的噪聲的抑制可進(jìn)一步增加語(yǔ)音通信的質(zhì)量,這是因?yàn)橐氲膫温晿O少。
[0017]本發(fā)明有利地提供抵抗不完全分離的改進(jìn)的穩(wěn)定性以及與將在使用噪聲抑制的情況下出現(xiàn)的偽聲數(shù)相比出現(xiàn)的較少偽聲。本發(fā)明可以與任何語(yǔ)音增強(qiáng)算法組合。本發(fā)明有利地可以用于語(yǔ)音和噪聲的任意混合物且不必改變通信信道和/或語(yǔ)音記錄。
[0018]本發(fā)明有利地提供甚至一個(gè)麥克風(fēng)和/或一個(gè)傳輸信道的有效利用。有利的是,許多不同的呈現(xiàn)系統(tǒng)是可能的,例如,包括兩個(gè)或兩個(gè)以上揚(yáng)聲器或立體聲頭戴式耳機(jī)的系統(tǒng)。用于改進(jìn)聲頻信號(hào)的感知的設(shè)備可以包括變換器單元或者變換器單元可以是分離單元。例如,用于改進(jìn)聲頻信號(hào)的感知的設(shè)備可以是智能手機(jī)或平板計(jì)算機(jī),或任何其它裝置,并且變換器單元可以是集成到設(shè)備或裝置中的擴(kuò)音器,或變換器單元可以是外部擴(kuò)音器布置或頭戴式耳機(jī)。
[0019]在根據(jù)第一方面的設(shè)備的第一可能實(shí)施形式中,第一虛擬位置和第二虛擬位置是間隔開(kāi)的,相對(duì)于用戶跨越大于20度弧的平面角,優(yōu)選地跨越大于35度弧的平面角,尤其優(yōu)選地跨越大于45度弧的平面角。
[0020]這有利地允許收聽(tīng)者或用戶感知噪聲和語(yǔ)音信號(hào)的空間分離。
[0021]在根據(jù)第一方面本身或根據(jù)第一方面的第一實(shí)施形式的設(shè)備的第二可能實(shí)施形式中,分離單元用于確定聲頻信號(hào)的時(shí)頻特征并且基于所確定的時(shí)頻特征將聲頻信號(hào)分離成至少一個(gè)語(yǔ)音分量和至少一個(gè)噪聲分量。
[0022]在信號(hào)處理時(shí),產(chǎn)生時(shí)頻特征的時(shí)頻分析包括使用各種時(shí)頻同時(shí)研究在時(shí)域和頻域兩者中的信號(hào)的那些技術(shù)。
[0023]在根據(jù)依據(jù)第一方面的設(shè)備的第二可能實(shí)施形式的設(shè)備的第三可能實(shí)施形式中,分離單元用于在時(shí)間窗期間和/或在頻率范圍內(nèi)確定聲頻信號(hào)的時(shí)頻特征。
[0024]因此,可以確定各種特征時(shí)間常數(shù)且隨后用于有利地將聲頻信號(hào)分離成至少一個(gè)語(yǔ)音分量和至少一個(gè)噪聲分量。
[0025]在根據(jù)第一方面的第三實(shí)施形式或根據(jù)依據(jù)第一方面的設(shè)備的第二可能實(shí)施形式的設(shè)備的第四可能實(shí)施形式中,分離單元用于基于非負(fù)矩陣分解確定時(shí)頻特征,從而計(jì)算至少一個(gè)語(yǔ)音分量和至少一個(gè)噪聲分量的基礎(chǔ)表示。
[0026]非負(fù)矩陣分解允許通過(guò)與顯現(xiàn)原始數(shù)據(jù)矩陣中的列相同的方式顯現(xiàn)基礎(chǔ)列。
[0027]在根據(jù)第一方面的第三實(shí)施形式或根據(jù)依據(jù)第一方面的設(shè)備的第二可能實(shí)施形式的設(shè)備的第五可能實(shí)施形式中,分離單元用于借助于時(shí)間序列分析相對(duì)于聲頻信號(hào)的平穩(wěn)性分析聲頻信號(hào)并且基于平穩(wěn)分析將聲頻信號(hào)分離成對(duì)應(yīng)于至少一個(gè)非平穩(wěn)分量的至少一個(gè)語(yǔ)音分量以及基于平穩(wěn)分析將聲頻信號(hào)分離成對(duì)應(yīng)于至少一個(gè)平穩(wěn)分量的至少一個(gè)噪聲分量。
[0028]通過(guò)時(shí)間序列分析獲得的各種特征平穩(wěn)特性可以用于有利地從非平穩(wěn)語(yǔ)音分量中分尚平穩(wěn)噪聲分量。
[0029]在根據(jù)第一方面本身或根據(jù)第一方面的以上實(shí)施形式中的任一個(gè)的設(shè)備的第六可能實(shí)施形式中,變換器單元包括相對(duì)于用戶安排在不同方位角處的至少兩個(gè)擴(kuò)音器。
[0030]這有利地為用戶提
當(dāng)前第1頁(yè)1 2 3 4 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
淮北市| 九龙城区| 天等县| 磐石市| 阿城市| 邵东县| 苗栗市| 临海市| 白玉县| 吴堡县| 深水埗区| 伊吾县| 白河县| 顺昌县| 湘潭县| 同江市| 景德镇市| 嘉祥县| 伊宁市| 灵川县| 曲阳县| 朝阳区| 铜山县| 桑植县| 松潘县| 大名县| 奉新县| 新昌县| 清流县| 遂昌县| 秦皇岛市| 精河县| 衡南县| 灯塔市| 牡丹江市| 岑巩县| 安国市| 车险| 乌兰浩特市| 安仁县| 旌德县|