一種混合音頻的處理方法及裝置的制作方法

文檔序號(hào)：2833738閱讀：249來(lái)源：國(guó)知局

導(dǎo)航： X技術(shù)> 最新專利>樂(lè)器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

專利名稱：一種混合音頻的處理方法及裝置的制作方法
技術(shù)領(lǐng)域：
本發(fā)明涉及音頻處理領(lǐng)域，尤其涉及一種混合音頻的處理方法及裝置。
背景技術(shù)：
聲音是由于物體振動(dòng)對(duì)周圍的空氣產(chǎn)生壓力而傳播的一種壓力波，轉(zhuǎn)換成電信號(hào)后，再經(jīng)過(guò)抽樣、量化，仍然是一種連續(xù)平滑的波形信號(hào)。音調(diào)、響度和音色是聲音的三個(gè)主要特征，量化后的語(yǔ)音信號(hào)的頻率與聲音的頻率對(duì)應(yīng)，振幅與聲音的音量對(duì)應(yīng)。在自然界中，人耳聽見的語(yǔ)音則是來(lái)自四面八方聲音的疊加，量化的語(yǔ)音信號(hào)的疊加等價(jià)于空氣中聲波的疊加。所以當(dāng)各信號(hào)的抽樣率一致時(shí)，混合音頻可以實(shí)現(xiàn)為將各信號(hào)的采樣數(shù)據(jù)線性疊加。對(duì)于會(huì)議系統(tǒng)來(lái)說(shuō)，由于網(wǎng)絡(luò)帶寬的限制和網(wǎng)絡(luò)環(huán)境的多變性，人們采用降低編碼比特率和改善網(wǎng)絡(luò)條件等辦法獲取高質(zhì)量的語(yǔ)音和視頻。同時(shí)人們希望會(huì)議系統(tǒng)能夠模擬真實(shí)的會(huì)議環(huán)境，在有多人同時(shí)說(shuō)話時(shí)，終端能同時(shí)聽到每個(gè)人說(shuō)話的聲音，這就需要增加混音功能。將來(lái)自與會(huì)者的語(yǔ)音數(shù)據(jù)在時(shí)域混合成一個(gè)音頻流，這樣在播放時(shí)就達(dá)到模擬真實(shí)會(huì)議場(chǎng)景的目的。語(yǔ)音信號(hào)的抽樣及量化都在聲卡芯片上進(jìn)行，常用的聲卡為16位，量化精度多為16bit。在眾多操作系統(tǒng)中，聲卡緩沖區(qū)的數(shù)據(jù)類型通常為signed short，其值范圍在-32768 32767。多路混音后，幅值有可能超出聲卡可接受的范圍(在-32768 32767范圍之外)，從而造成聲音的失真，由此產(chǎn)生混音溢出問(wèn)題。目前對(duì)混音后采樣值溢出的處理方法較多，但基本思想基本上都是先對(duì)語(yǔ)音信號(hào)的振幅做一定的平滑處理，即可以在不破壞(或基本不破壞)語(yǔ)音信號(hào)原有頻率的基礎(chǔ)上避免溢出?，F(xiàn)有技術(shù)中對(duì)混音信號(hào)的處理方案主要有如下幾種一、直接箝位法；這種方法的思想是指定聲音幅值的最大和最小臨界值，這個(gè)由量化精度及其取值范圍確定。當(dāng)混合后語(yǔ)音樣本值超出緩沖區(qū)數(shù)據(jù)類型范圍時(shí)，溢出的樣本值用最大或最小臨界值代替，不產(chǎn)生溢出的混音樣本結(jié)果保持不變，見下式描述?？梢钥闯觯门R界值代替線性疊加值，會(huì)造成語(yǔ)音波形的人為削峰，在破壞語(yǔ)音信號(hào)特性的同時(shí)會(huì)促使噪音的產(chǎn)生。二、歸一化定標(biāo)法；歸一化定標(biāo)算法的主要思想是使用一個(gè)衰減因子對(duì)音頻數(shù)據(jù)進(jìn)行衰減。衰減因子會(huì)隨著混音后的樣本值的變化而變化。當(dāng)產(chǎn)生溢出時(shí)，衰減因子比較小，以保證溢出的樣本值經(jīng)過(guò)衰減處理后在臨界值范圍內(nèi)。沒(méi)有溢出時(shí)，衰減因子會(huì)慢慢增加，以保持?jǐn)?shù)據(jù)的平滑變化。該算法在對(duì)混音數(shù)據(jù)溢出處理時(shí)，仍然采用的是直接箝位法。若混音過(guò)程中，溢出比較頻繁，就會(huì)影響混音的質(zhì)量。另一方面，該算法中每一次衰減因子的更新，都要進(jìn)行一次浮點(diǎn)數(shù)除法操作。由此可見，現(xiàn)有技術(shù)中對(duì)混音的溢出處理不合理，會(huì)導(dǎo)致較差的混音質(zhì)量
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種混合音頻的處理方法及裝置，用以對(duì)混合音頻的溢出進(jìn)行處理，提升混合音頻的質(zhì)量。本發(fā)明實(shí)施例提供的一種混合音頻的處理方法包括對(duì)于當(dāng)前接收的混合音頻樣本，根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子，確定當(dāng)前的混合音頻樣本的第一輸出值；當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí)，根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子，并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。本發(fā)明實(shí)施例提供的一種多路音頻的混合處理裝置包括第一輸出單元，用于對(duì)于當(dāng)前接收的混合音頻樣本，根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子，確定當(dāng)前的混合音頻樣本的第一輸出值；第二輸出單元，用于當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí)，根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子，并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。通過(guò)以上技術(shù)方案可知，本發(fā)明中對(duì)于當(dāng)前接收的混合音頻樣本，根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子，確定當(dāng)前的混合音頻樣本的第一輸出值；當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí)，根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子，并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。通過(guò)可變的衰減因子使得混合音頻不會(huì)產(chǎn)生溢出的同時(shí)盡量保持較小的失真度；其中，當(dāng)確定的第一輸出值溢出時(shí)，并未采用現(xiàn)有的箝位方法，而是重新確定衰減因子，以及重新確定混合音頻樣本的輸出值；保持了混音波形的平滑，提升了混音的質(zhì)量。

圖1為本發(fā)明實(shí)施例提供的一種混合音頻的處理方法的流程示意圖；圖2為本發(fā)明具體實(shí)施例提供的一種混合音頻的處理方法的流程示意圖；圖3為本發(fā)明實(shí)施例提供的一種混合音頻的處理裝置的結(jié)構(gòu)示意圖；圖4為本發(fā)明實(shí)施例提供的一種混合音頻的處理裝置的另一結(jié)構(gòu)示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例提供了一種混合音頻的處理方法及裝置，用以對(duì)混合音頻的溢出進(jìn)行處理，提升混合音頻的質(zhì)量。參見圖1，本發(fā)明實(shí)施例提供的一種混合音頻的處理方法包括S101、對(duì)于當(dāng)前接收的混合音頻樣本，根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子，確定當(dāng)前的混合音頻樣本的第一輸出值；S102、當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí)，根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子，并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。較佳的，衰減因子的初始值為I ;即對(duì)第一個(gè)混合音頻樣本進(jìn)行處理時(shí)，衰減因子為I。較佳的，所述預(yù)設(shè)的數(shù)值集合中的各數(shù)值不大于I ;S102中，所述根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子，具體為將預(yù)設(shè)的數(shù)值集合中與所述第一輸出值的乘積在所述預(yù)設(shè)的范圍內(nèi)的最大值對(duì)應(yīng)的數(shù)值，確定為衰減因子。較佳的，所述預(yù)設(shè)的數(shù)值集合，為{i/n}，i為整數(shù)，0〈i〈n，η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。較佳的，S102重新確定當(dāng)前的混合音頻樣本的第二輸出值之后，該方法還包括判斷衰減因子是否小于預(yù)設(shè)的門限值，如果是，將衰減因子f增加一個(gè)變化步長(zhǎng)；否則，將衰減因子確定為I ;其中，一個(gè)變化步長(zhǎng)為(l-f)/n，η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。當(dāng)衰減因子非常接近于I時(shí)，將衰減因子重新置為1，以減少浮點(diǎn)數(shù)除法操作，提高運(yùn)算效率。較佳的，該方法還包括當(dāng)確定所述第一輸出值在預(yù)設(shè)的范圍內(nèi)時(shí)，判斷衰減因子是否小于預(yù)設(shè)的門限值，如果是，將衰減因子f增加一個(gè)變化步長(zhǎng)；否則，將衰減因子確定為I ;其中，一個(gè)變化步長(zhǎng)為(l-f)/n，η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。較佳的，所述預(yù)設(shè)的范圍，是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。下面是本發(fā)明的具體實(shí)施例假設(shè)共有M個(gè)輸入音頻流，每個(gè)音頻流有N個(gè)樣本，mixing [i]為將音頻流混合后當(dāng)前幀的第i個(gè)樣本的線性疊加值，output[i]為當(dāng)前混音幀的第i個(gè)樣本的輸出，input [i，j]為當(dāng)前幀的第j個(gè)音頻流的第i個(gè)樣本的輸入(其中O彡j彡M-1, O彡i彡N)，則線性疊加式如下
權(quán)利要求
1.一種混合音頻的處理方法，其特征在于，該方法包括對(duì)于當(dāng)前接收的混合音頻樣本，根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子，確定當(dāng)前的混合音頻樣本的第一輸出值；當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí)，根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子，并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。
2.權(quán)利要求1所述的方法，其特征在于，所述預(yù)設(shè)的數(shù)值集合中的各數(shù)值不大于I;所述根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子，具體為將預(yù)設(shè)的數(shù)值集合中與所述第一輸出值的乘積在所述預(yù)設(shè)的范圍內(nèi)的最大值對(duì)應(yīng)的數(shù)值，確定為衰減因子。
3.如權(quán)利要求2所述的方法，其特征在于，所述預(yù)設(shè)的數(shù)值集合，為{i/n}，i為整數(shù)，0〈i〈n，η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
4.如權(quán)利要求1所述的方法，其特征在于，所述重新確定當(dāng)前的混合音頻樣本的第二輸出值之后，該方法還包括判斷衰減因子是否小于預(yù)設(shè)的門限值，如果是，將衰減因子f增加一個(gè)變化步長(zhǎng)；否貝U，將衰減因子確定為I ; 其中，一個(gè)變化步長(zhǎng)為(1-f) /n, η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
5.如權(quán)利要求1所述的方法，其特征在于，該方法還包括當(dāng)確定所述第一輸出值在預(yù)設(shè)的范圍內(nèi)時(shí)，判斷衰減因子是否小于預(yù)設(shè)的門限值，如果是，將衰減因子f增加一個(gè)變化步長(zhǎng)；否則，將衰減因子確定為I ; 其中，一個(gè)變化步長(zhǎng)為(1-f) /n, η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
6.權(quán)利要求1所述的方法，其特征在于，所述預(yù)設(shè)的范圍，是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
7.權(quán)利要求1所述的方法，其特征在于，衰減因子的初始值為I。
8.一種混合音頻的處理裝置，其特征在于，該裝置包括第一輸出單元，用于對(duì)于當(dāng)前接收的混合音頻樣本，根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子，確定當(dāng)前的混合音頻樣本的第一輸出值；第二輸出單元，用于當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí)，根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子，并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。
9.如權(quán)利要求8所述的裝置，其特征在于，所述預(yù)設(shè)的數(shù)值集合中的各數(shù)值不大于I;所述第二輸出單元根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子，具體用于將預(yù)設(shè)的數(shù)值集合中與所述第一輸出值的乘積在所述預(yù)設(shè)的范圍內(nèi)的最大值對(duì)應(yīng)的數(shù)值，確定為衰減因子。
10.如權(quán)利要求9所述的裝置，其特征在于，所述預(yù)設(shè)的數(shù)值集合，為{i/n}，i為整數(shù)，0〈i〈n，η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
11.如權(quán)利要求8所述裝置，其特征在于，該裝置還包括衰減因子調(diào)整單元，用于在重新確定當(dāng)前的混合音頻樣本的第二輸出值之后，判斷衰減因子是否小于預(yù)設(shè)的門限值，如果是，將衰減因子f增加一個(gè)變化步長(zhǎng)；否則，將衰減因子確定為I ; 其中，一個(gè)變化步長(zhǎng)為(1-f) /n, η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
12.如權(quán)利要求8所述的裝置，其特征在于，所述衰減因子調(diào)整單元還用于當(dāng)確定所述第一輸出值在預(yù)設(shè)的范圍內(nèi)時(shí)，判斷衰減因子是否小于預(yù)設(shè)的門限值，如果是，將衰減因子f增加一個(gè)變化步長(zhǎng)；否則，將衰減因子確定為I ; 其中，一個(gè)變化步長(zhǎng)為(1-f) /n, η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
13.如權(quán)利要求8所述的裝置，其特征在于，所述預(yù)設(shè)的范圍，是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
14.如權(quán)利要求8所述的裝置，其特征在于，衰減因子的初始值為I。
全文摘要
本發(fā)明實(shí)施例提供了一種混合音頻的處理方法及裝置，用以對(duì)混合音頻的溢出進(jìn)行處理，提升混合音頻的質(zhì)量。該方法包括對(duì)于當(dāng)前接收的混合音頻樣本，根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子，確定當(dāng)前的混合音頻樣本的第一輸出值；當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí)，根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子，并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。
文檔編號(hào)G10L21/003GK103021419SQ20121057553
公開日2013年4月3日申請(qǐng)日期2012年12月26日優(yōu)先權(quán)日2012年12月26日
發(fā)明者高陸軍, 樊國(guó)棟申請(qǐng)人:大唐移動(dòng)通信設(shè)備有限公司

完整全部詳細(xì)技術(shù)資料下載