專利名稱:一種混合音頻的處理方法及裝置的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及音頻處理領(lǐng)域,尤其涉及一種混合音頻的處理方法及裝置。
背景技術(shù):
聲音是由于物體振動(dòng)對(duì)周圍的空氣產(chǎn)生壓力而傳播的一種壓力波,轉(zhuǎn)換成電信號(hào)后,再經(jīng)過(guò)抽樣、量化,仍然是一種連續(xù)平滑的波形信號(hào)。音調(diào)、響度和音色是聲音的三個(gè)主要特征,量化后的語(yǔ)音信號(hào)的頻率與聲音的頻率對(duì)應(yīng),振幅與聲音的音量對(duì)應(yīng)。在自然界中,人耳聽見的語(yǔ)音則是來(lái)自四面八方聲音的疊加,量化的語(yǔ)音信號(hào)的疊加等價(jià)于空氣中聲波的疊加。所以當(dāng)各信號(hào)的抽樣率一致時(shí),混合音頻可以實(shí)現(xiàn)為將各信號(hào)的采樣數(shù)據(jù)線性疊加。對(duì)于會(huì)議系統(tǒng)來(lái)說(shuō),由于網(wǎng)絡(luò)帶寬的限制和網(wǎng)絡(luò)環(huán)境的多變性,人們采用降低編碼比特率和改善網(wǎng)絡(luò)條件等辦法獲取高質(zhì)量的語(yǔ)音和視頻。同時(shí)人們希望會(huì)議系統(tǒng)能夠模擬真實(shí)的會(huì)議環(huán)境,在有多人同時(shí)說(shuō)話時(shí),終端能同時(shí)聽到每個(gè)人說(shuō)話的聲音,這就需要增加混音功能。將來(lái)自與會(huì)者的語(yǔ)音數(shù)據(jù)在時(shí)域混合成一個(gè)音頻流,這樣在播放時(shí)就達(dá)到模擬真實(shí)會(huì)議場(chǎng)景的目的。語(yǔ)音信號(hào)的抽樣及量化都在聲卡芯片上進(jìn)行,常用的聲卡為16位,量化精度多為16bit。在眾多操作系統(tǒng)中,聲卡緩沖區(qū)的數(shù)據(jù)類型通常為signed short,其值范圍在-32768 32767。多路混音后,幅值有可能超出聲卡可接受的范圍(在-32768 32767范圍之外),從而造成聲音的失真,由此產(chǎn)生混音溢出問(wèn)題。目前對(duì)混音后采樣值溢出的處理方法較多,但基本思想基本上都是先對(duì)語(yǔ)音信號(hào)的振幅做一定的平滑處理,即可以在不破壞(或基本不破壞)語(yǔ)音信號(hào)原有頻率的基礎(chǔ)上避免溢出?,F(xiàn)有技術(shù)中對(duì)混音信號(hào)的處理方案主要有如下幾種一、直接箝位法;這種方法的思想是指定聲音幅值的最大和最小臨界值,這個(gè)由量化精度及其取值范圍確定。當(dāng)混合后語(yǔ)音樣本值超出緩沖區(qū)數(shù)據(jù)類型范圍時(shí),溢出的樣本值用最大或最小臨界值代替,不產(chǎn)生溢出的混音樣本結(jié)果保持不變,見下式描述??梢钥闯觯门R界值代替線性疊加值,會(huì)造成語(yǔ)音波形的人為削峰,在破壞語(yǔ)音信號(hào)特性的同時(shí)會(huì)促使噪音的產(chǎn)生。二、歸一化定標(biāo)法;歸一化定標(biāo)算法的主要思想是使用一個(gè)衰減因子對(duì)音頻數(shù)據(jù)進(jìn)行衰減。衰減因子會(huì)隨著混音后的樣本值的變化而變化。當(dāng)產(chǎn)生溢出時(shí),衰減因子比較小,以保證溢出的樣本值經(jīng)過(guò)衰減處理后在臨界值范圍內(nèi)。沒(méi)有溢出時(shí),衰減因子會(huì)慢慢增加,以保持?jǐn)?shù)據(jù)的平滑變化。該算法在對(duì)混音數(shù)據(jù)溢出處理時(shí),仍然采用的是直接箝位法。若混音過(guò)程中,溢出比較頻繁,就會(huì)影響混音的質(zhì)量。另一方面,該算法中每一次衰減因子的更新,都要進(jìn)行一次浮點(diǎn)數(shù)除法操作。由此可見,現(xiàn)有技術(shù)中對(duì)混音的溢出處理不合理,會(huì)導(dǎo)致較差的混音質(zhì)量
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種混合音頻的處理方法及裝置,用以對(duì)混合音頻的溢出進(jìn)行處理,提升混合音頻的質(zhì)量。本發(fā)明實(shí)施例提供的一種混合音頻的處理方法包括對(duì)于當(dāng)前接收的混合音頻樣本,根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子,確定當(dāng)前的混合音頻樣本的第一輸出值;當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí),根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子,并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。本發(fā)明實(shí)施例提供的一種多路音頻的混合處理裝置包括第一輸出單元,用于對(duì)于當(dāng)前接收的混合音頻樣本,根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子,確定當(dāng)前的混合音頻樣本的第一輸出值;第二輸出單元,用于當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí),根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子,并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。通過(guò)以上技術(shù)方案可知,本發(fā)明中對(duì)于當(dāng)前接收的混合音頻樣本,根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子,確定當(dāng)前的混合音頻樣本的第一輸出值;當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí),根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子,并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。通過(guò)可變的衰減因子使得混合音頻不會(huì)產(chǎn)生溢出的同時(shí)盡量保持較小的失真度;其中,當(dāng)確定的第一輸出值溢出時(shí),并未采用現(xiàn)有的箝位方法,而是重新確定衰減因子,以及重新確定混合音頻樣本的輸出值;保持了混音波形的平滑,提升了混音的質(zhì)量。
圖1為本發(fā)明實(shí)施例提供的一種混合音頻的處理方法的流程示意圖;圖2為本發(fā)明具體實(shí)施例提供的一種混合音頻的處理方法的流程示意圖;圖3為本發(fā)明實(shí)施例提供的一種混合音頻的處理裝置的結(jié)構(gòu)示意圖;圖4為本發(fā)明實(shí)施例提供的一種混合音頻的處理裝置的另一結(jié)構(gòu)示意圖。
具體實(shí)施例方式本發(fā)明實(shí)施例提供了一種混合音頻的處理方法及裝置,用以對(duì)混合音頻的溢出進(jìn)行處理,提升混合音頻的質(zhì)量。參見圖1,本發(fā)明實(shí)施例提供的一種混合音頻的處理方法包括S101、對(duì)于當(dāng)前接收的混合音頻樣本,根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子,確定當(dāng)前的混合音頻樣本的第一輸出值;S102、當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí),根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子,并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。較佳的,衰減因子的初始值為I ;即對(duì)第一個(gè)混合音頻樣本進(jìn)行處理時(shí),衰減因子為I。較佳的,所述預(yù)設(shè)的數(shù)值集合中的各數(shù)值不大于I ;S102中,所述根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子,具體為將預(yù)設(shè)的數(shù)值集合中與所述第一輸出值的乘積在所述預(yù)設(shè)的范圍內(nèi)的最大值對(duì)應(yīng)的數(shù)值,確定為衰減因子。較佳的,所述預(yù)設(shè)的數(shù)值集合,為{i/n},i為整數(shù),0〈i〈n,η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。較佳的,S102重新確定當(dāng)前的混合音頻樣本的第二輸出值之后,該方法還包括判斷衰減因子是否小于預(yù)設(shè)的門限值,如果是,將衰減因子f增加一個(gè)變化步長(zhǎng);否則,將衰減因子確定為I ;其中,一個(gè)變化步長(zhǎng)為(l-f)/n,η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。當(dāng)衰減因子非常接近于I時(shí),將衰減因子重新置為1,以減少浮點(diǎn)數(shù)除法操作,提高運(yùn)算效率。較佳的,該方法還包括當(dāng)確定所述第一輸出值在預(yù)設(shè)的范圍內(nèi)時(shí),判斷衰減因子是否小于預(yù)設(shè)的門限值,如果是,將衰減因子f增加一個(gè)變化步長(zhǎng);否則,將衰減因子確定為I ;其中,一個(gè)變化步長(zhǎng)為(l-f)/n,η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。較佳的,所述預(yù)設(shè)的范圍,是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。下面是本發(fā)明的具體實(shí)施例假設(shè)共有M個(gè)輸入音頻流,每個(gè)音頻流有N個(gè)樣本,mixing [i]為將音頻流混合后當(dāng)前幀的第i個(gè)樣本的線性疊加值,output[i]為當(dāng)前混音幀的第i個(gè)樣本的輸出,input [i,j]為當(dāng)前幀的第j個(gè)音頻流的第i個(gè)樣本的輸入(其中O彡j彡M-1, O彡i彡N),則線性疊加式如下
權(quán)利要求
1.一種混合音頻的處理方法,其特征在于,該方法包括 對(duì)于當(dāng)前接收的混合音頻樣本,根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子,確定當(dāng)前的混合音頻樣本的第一輸出值; 當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí),根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子,并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。
2.權(quán)利要求1所述的方法,其特征在于,所述預(yù)設(shè)的數(shù)值集合中的各數(shù)值不大于I;所述根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子,具體為 將預(yù)設(shè)的數(shù)值集合中與所述第一輸出值的乘積在所述預(yù)設(shè)的范圍內(nèi)的最大值對(duì)應(yīng)的數(shù)值,確定為衰減因子。
3.如權(quán)利要求2所述的方法,其特征在于,所述預(yù)設(shè)的數(shù)值集合,為{i/n},i為整數(shù),0〈i〈n,η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
4.如權(quán)利要求1所述的方法,其特征在于,所述重新確定當(dāng)前的混合音頻樣本的第二輸出值之后,該方法還包括 判斷衰減因子是否小于預(yù)設(shè)的門限值,如果是,將衰減因子f增加一個(gè)變化步長(zhǎng);否貝U,將衰減因子確定為I ; 其中,一個(gè)變化步長(zhǎng)為(1-f) /n, η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
5.如權(quán)利要求1所述的方法,其特征在于,該方法還包括 當(dāng)確定所述第一輸出值在預(yù)設(shè)的范圍內(nèi)時(shí),判斷衰減因子是否小于預(yù)設(shè)的門限值,如果是,將衰減因子f增加一個(gè)變化步長(zhǎng);否則,將衰減因子確定為I ; 其中,一個(gè)變化步長(zhǎng)為(1-f) /n, η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
6.權(quán)利要求1所述的方法,其特征在于,所述預(yù)設(shè)的范圍,是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
7.權(quán)利要求1所述的方法,其特征在于,衰減因子的初始值為I。
8.一種混合音頻的處理裝置,其特征在于,該裝置包括 第一輸出單元,用于對(duì)于當(dāng)前接收的混合音頻樣本,根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子,確定當(dāng)前的混合音頻樣本的第一輸出值; 第二輸出單元,用于當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí),根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子,并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。
9.如權(quán)利要求8所述的裝置,其特征在于,所述預(yù)設(shè)的數(shù)值集合中的各數(shù)值不大于I;所述第二輸出單元根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子,具體用于 將預(yù)設(shè)的數(shù)值集合中與所述第一輸出值的乘積在所述預(yù)設(shè)的范圍內(nèi)的最大值對(duì)應(yīng)的數(shù)值,確定為衰減因子。
10.如權(quán)利要求9所述的裝置,其特征在于,所述預(yù)設(shè)的數(shù)值集合,為{i/n},i為整數(shù),0〈i〈n,η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
11.如權(quán)利要求8所述裝置,其特征在于,該裝置還包括衰減因子調(diào)整單元,用于在重新確定當(dāng)前的混合音頻樣本的第二輸出值之后,判斷衰減因子是否小于預(yù)設(shè)的門限值,如果是,將衰減因子f增加一個(gè)變化步長(zhǎng);否則,將衰減因子確定為I ; 其中,一個(gè)變化步長(zhǎng)為(1-f) /n, η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
12.如權(quán)利要求8所述的裝置,其特征在于,所述衰減因子調(diào)整單元還用于當(dāng)確定所述第一輸出值在預(yù)設(shè)的范圍內(nèi)時(shí),判斷衰減因子是否小于預(yù)設(shè)的門限值,如果是,將衰減因子f增加一個(gè)變化步長(zhǎng);否則,將衰減因子確定為I ; 其中,一個(gè)變化步長(zhǎng)為(1-f) /n, η是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
13.如權(quán)利要求8所述的裝置,其特征在于,所述預(yù)設(shè)的范圍,是根據(jù)將所述混合音頻存儲(chǔ)為數(shù)字信號(hào)時(shí)所采用的比特位數(shù)確定的。
14.如權(quán)利要求8所述的裝置,其特征在于,衰減因子的初始值為I。
全文摘要
本發(fā)明實(shí)施例提供了一種混合音頻的處理方法及裝置,用以對(duì)混合音頻的溢出進(jìn)行處理,提升混合音頻的質(zhì)量。該方法包括對(duì)于當(dāng)前接收的混合音頻樣本,根據(jù)當(dāng)前的混合音頻樣本和根據(jù)上一混合音頻樣本確定的衰減因子,確定當(dāng)前的混合音頻樣本的第一輸出值;當(dāng)確定所述第一輸出值不在預(yù)設(shè)的范圍內(nèi)時(shí),根據(jù)預(yù)設(shè)的數(shù)值集合與所述第一輸出值重新確定衰減因子,并根據(jù)所述第一輸出值和重新確定的衰減因子重新確定當(dāng)前的混合音頻樣本的第二輸出值。
文檔編號(hào)G10L21/003GK103021419SQ20121057553
公開日2013年4月3日 申請(qǐng)日期2012年12月26日 優(yōu)先權(quán)日2012年12月26日
發(fā)明者高陸軍, 樊國(guó)棟 申請(qǐng)人:大唐移動(dòng)通信設(shè)備有限公司