專利名稱:一種基于組合設(shè)計的語音冗余交織方法
技術(shù)領(lǐng)域:
本發(fā)明涉及語音數(shù)據(jù)傳輸方法領(lǐng)域,具體為一種基于組合設(shè)計的語音冗余交織方法。
背景技術(shù):
在實(shí)時語音傳輸中,由于語音要求較強(qiáng)的實(shí)時性,對少量的數(shù)據(jù)丟失不是很敏感,因此需要和一般網(wǎng)絡(luò)傳輸不同的方法。實(shí)時性使得語音傳輸不適用帶確認(rèn)和重傳的TCP協(xié)議,通常使用不可靠的UDP協(xié)議,但UDP不可避免的帶有相對較高的丟包率,如何抵抗丟包和當(dāng)發(fā)生丟包現(xiàn)象時如何處理的相關(guān)問題成為實(shí)時語音通信中研究的熱點(diǎn)。丟包處理技術(shù)主要有前向糾錯(FEC)、交織、丟包隱藏技術(shù)等。前向糾錯技術(shù)是一類信道冗余編碼的統(tǒng)稱,目的在于提高語音數(shù)據(jù)傳輸?shù)目煽啃?,?dāng)發(fā)生個別隨機(jī)丟包時能恢復(fù)丟失的包。這類編碼有簡單有復(fù)雜,簡單編碼占用額外帶寬小,恢復(fù)能力差,如奇偶校驗(yàn)等;較復(fù)雜的編碼恢復(fù)能力好,占用額外帶寬較大,如RS碼等。LDPC碼同時具有較好的編碼性能,并有較靈活的參數(shù)調(diào)整、方便的譯碼方式,目前在一些領(lǐng)域得以推廣應(yīng)用。但FEC技術(shù)都有一個特點(diǎn),在一定丟包限度內(nèi),數(shù)據(jù)可以完全恢復(fù),但超過該限度,則完全無法恢復(fù)。交織技術(shù)是一種減少丟包損失的方法。將原始數(shù)據(jù)分成更小的幀,在發(fā)送前,重排幀的順序,使每個包中的數(shù)據(jù)來自交錯的語音幀。從而在發(fā)生丟包時,丟失的是非連續(xù)的幀數(shù)據(jù),這些幀如果很少,對聽覺影響不大;并且也方便對這些較分散的丟幀數(shù)據(jù)做后續(xù)的丟包隱藏處理。但交織技術(shù)容易引起較大的傳輸時延。丟包隱藏是指接收端在已經(jīng)發(fā)生丟包或丟幀時,通過一定的算法填補(bǔ)丟失的數(shù)據(jù),減少丟失數(shù)據(jù)帶來的損失。主要包括插入和插值技術(shù),插入是指用固定的信號替代丟失的數(shù)據(jù),插值是指根據(jù)已知信號與語音的短時相關(guān)性,構(gòu)造丟失的數(shù)據(jù)。現(xiàn)有交織技術(shù)本身并不提供冗余與糾錯功能,而FEC也不支持?jǐn)?shù)據(jù)的部分恢復(fù)。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)存在的問題,本發(fā)明提供了一種基于組合設(shè)計的語音冗余交織方法。為了達(dá)到上述目的,本發(fā)明所采用的技術(shù)方案為:一種基于組合設(shè)計的語音冗余交織方法,其特征在于:將實(shí)時語音數(shù)據(jù)分解成多個較小的語音幀,然后根據(jù)語音數(shù)據(jù)傳輸要求對多個語音幀進(jìn)行重新排列與組合,從而交織成數(shù)據(jù)包,最后設(shè)定符合語音數(shù)據(jù)傳輸要求的數(shù)據(jù)包傳送順序,按傳輸順序?qū)?shù)據(jù)包分配到符合語音數(shù)據(jù)傳輸要求的傳輸通道上進(jìn)行傳輸。所述的一種基于組合設(shè)計的語音冗余交織方法,其特征在于:多個語音幀的組合方式通過簡單的組合設(shè)計確定,具有對稱冗余特性,在網(wǎng)絡(luò)上出現(xiàn)隨機(jī)丟包時,具有較高的恢復(fù)能力。
所述的一種基于組合設(shè)計的語音冗余交織方法,其特征在于:由于數(shù)據(jù)存在冗余需要額外的傳輸帶寬,故使用多個并行的傳輸通道。所述的一種基于組合設(shè)計的語音冗余交織方法,其特征在于:在丟包稍多時,可基于正常數(shù)據(jù)進(jìn)行后續(xù)丟包隱藏處理,仍可正常傳輸部分?jǐn)?shù)據(jù),提高語音傳輸質(zhì)量。本發(fā)明結(jié)合了現(xiàn)有交織技術(shù)與前向糾錯技術(shù)的特點(diǎn),以增加傳輸帶寬為代價,將數(shù)據(jù)流以分組冗余交織打包的形式傳輸,在與現(xiàn)有交織技術(shù)相比沒有引入額外時延的前提下,提高了語音傳輸?shù)目煽啃耘c質(zhì)量。
圖1為用于對比的非交織語音傳輸技術(shù)的實(shí)施例圖。圖2為用于對比的傳統(tǒng)交織語音傳輸技術(shù)的實(shí)施例圖。圖3為用于對比的偏移交織語音傳輸技術(shù)的實(shí)施例圖。圖4為本發(fā)明所公開的基于組合設(shè)計的冗余交織語音傳輸技術(shù)的實(shí)施例。
具體實(shí)施例方式首先通過附圖,展示所述技術(shù)的實(shí)施例,并將所述技術(shù)與其他傳統(tǒng)技術(shù)相對比,并說明其特點(diǎn)。應(yīng)該說明的是,本技術(shù)的范圍不局限于附圖所述實(shí)施例,實(shí)施例是用于描述目的,而不是限制目的。圖1說明了以具有五個幀的包來發(fā)送語音的一個不使用交織技術(shù)的基礎(chǔ)實(shí)施例。語音數(shù)據(jù)流102的一部分被示為將要在三個包104、105、106中發(fā)送。包104包括數(shù)據(jù)流102中的第一至第五個編碼巾貞,包105包括數(shù)據(jù)流102中的第六至第十個編碼巾貞,包106包括數(shù)據(jù)流102中的第十一至第十五個編碼幀。根據(jù)此基礎(chǔ)實(shí)施例,在數(shù)據(jù)流102中第一至第五個相繼編碼幀填滿包104后,在t5發(fā)送包104。同樣,在數(shù)據(jù)流102中第六至第十個編碼中貞填滿包106后,在t1(l發(fā)送包105 ;在1:15發(fā)送包106。不失一般性,設(shè)每個五巾貞的包從發(fā)送到接收,也需要五幀的時間,下同。在接收端,在t1(l收到包104中的所有幀,其后跟隨著剩下的幀。根據(jù)此基礎(chǔ)實(shí)施例,接收端將在t25收到數(shù)據(jù)流102中的前十五幀并予以播放。如果一個發(fā)送的包在傳輸過程中丟失,那么在接收端將表現(xiàn)為相繼五幀的丟失;因此,語音質(zhì)量將受到較大損失,即使經(jīng)過丟包隱藏技術(shù)處理,由于連續(xù)丟失數(shù)據(jù)較多,也仍會有可察覺的損失。圖2說明了以具有五個幀的包來發(fā)送語音,采用基本交織技術(shù)的一個實(shí)施例。語音數(shù)據(jù)流202的一部分被示為將要在三個包204、205、206中發(fā)送。包204包括數(shù)據(jù)流202中的第一、四、七、十、十三個編碼幀,包205包括數(shù)據(jù)流202中的第二、五、八、十一、十四個編碼幀,包206包括數(shù)據(jù)流202中的第三、六、九、十二、十五個編碼幀。根據(jù)此實(shí)施例,在包204被填滿后,在t13發(fā)送包204。然后,在包205被填滿后,由于傳輸通道被占用,在t18發(fā)送包115,同樣地,在t23發(fā)送包206。在接收端,在t18收到包204中的所有幀,其后跟隨著剩下的幀。根據(jù)此基礎(chǔ)實(shí)施例,如果一個發(fā)送的包在傳輸過程中丟失,那么在接收端將表現(xiàn)為相間隔的幀的丟失;因此,語音質(zhì)量的損失比圖1要小,如經(jīng)過丟包隱藏技術(shù)處理,損失會進(jìn)一步減小。但接收端要在t33才能接收到數(shù)據(jù)流202中的前十五幀并予以播放,在系統(tǒng)中引入了較大的附加時延。
圖3說明了以具有五個幀的包來發(fā)送語音,采用專利CN1906878所述偏移交織技術(shù)的一個實(shí)施例。語音數(shù)據(jù)流302的一部分被示為將要在三個包304、305、306中發(fā)送。包304包括數(shù)據(jù)流302中的第一、三、五、七、九個編碼幀,包305包括數(shù)據(jù)流302中的第六、八、十、十二、十四個編碼巾貞,包306包括數(shù)據(jù)流302中的第^ 、十三、十五、十七、十九個編碼幀。根據(jù)此實(shí)施例,在包304被填滿后,在t9發(fā)送包304。同樣,在包305被填滿后,在t14發(fā)送包305 ;在t19發(fā)送包306。在接收端,在t14收到包304中的所有幀,其后跟隨著剩下的幀。根據(jù)此基礎(chǔ)實(shí)施例,如果一個發(fā)送的包在傳輸過程中丟失,那么在接收端將表現(xiàn)為相間隔幀的丟失;因此,語音質(zhì)量的損失與圖2相接近。與圖2相比,接收端在t29可以接收到數(shù)據(jù)流302中的第一至十五幀并予以播放(忽略第二、四幀的邊緣效應(yīng),沒有進(jìn)入偏移交織范圍),在系統(tǒng)中引入的附加時延比圖2要小。圖4說明了以具有五個幀的包來發(fā)送語音,采用本技術(shù)的一個實(shí)施例。語音數(shù)據(jù)流402的相繼十五幀數(shù)據(jù)分為一組并被發(fā)送,在并行的兩條傳輸通道403、404上傳輸。將數(shù)據(jù)流402打包為六個包。包405包括數(shù)據(jù)流402中的第一至第五個編碼幀,于t5時刻在通道403上發(fā)送;包406包括數(shù)據(jù)流402中的第一、六、七、八、九個編碼幀,于t9時刻在通道404上發(fā)送;包407包括數(shù)據(jù)流402中的第二、六、十、i^一、十二個編碼幀,于t12時刻在通道403上發(fā)送;包408包括數(shù)據(jù)流402中的第三、·七、十、十三、十四個編碼幀,于t14時刻在通道404上發(fā)送;包409包括數(shù)據(jù)流402中的第四、八、十一、十三、十五個編碼幀,于t17時刻在通道403上發(fā)送;包410包括數(shù)據(jù)流402中的第五、九、十二、十四、十五個編碼幀,于t19時刻在通道404上發(fā)送。接收端會按同樣順序依次收到各個包中的幀,并放入緩沖區(qū)予以播放。如在沒有丟包的情況下,接收端可在t27時刻收到數(shù)據(jù)流402中的前十五幀并予以播放,比圖2、3的時延都要小;并且,根據(jù)此實(shí)施例,如發(fā)生一個包在傳輸過程中丟失,接收端最終仍可收到數(shù)據(jù)流402中全部的幀,對語音質(zhì)量不產(chǎn)生影響,僅可能引入不大的時延。例如假設(shè)包409在傳輸過程中丟失,則第十五幀的數(shù)據(jù)要依賴包410提供,將在t29時刻收至IJ,此時時延與圖3相同,并未額外再增加時延。如發(fā)生兩個包在傳輸過程中丟失,則接收端最終收到的幀將缺少一個,對語音質(zhì)量影響不大,并可以經(jīng)過丟包隱藏技術(shù)進(jìn)一步處理降低影響。如發(fā)生三個以上包在傳輸過程中丟失,對語音的影響會較大,但在一個分組只有六個包的情況下,這種情況實(shí)際發(fā)生的概率是微乎其微的,而且圖1、2、3所述實(shí)施例,在這種丟包特別多的情況下,影響將更大。由以上實(shí)施例可以看出,本技術(shù)在現(xiàn)有交織技術(shù)的基礎(chǔ)上,以增加傳輸能力為代價,進(jìn)一步提高了傳輸?shù)目煽啃?,同時并不增加額外的時延。本技術(shù)的核心內(nèi)容是交織方法的設(shè)計,其設(shè)計方法是基于組合設(shè)計的,基本原理如下:設(shè)本技術(shù)的實(shí)施例中,每個包中包含η幀數(shù)據(jù)。系統(tǒng)總共擁有k倍于直接傳輸?shù)膫鬏斖ǖ阑騻鬏攷?,需要在傳輸過程中丟包少于k個時不丟失任何幀,并以M個幀為分組單位進(jìn)行交織。因此,在這M幀中,任取一個幀,該幀都必須在k個包中出現(xiàn)。設(shè)分組所打包成的總包數(shù)為P,為使交織的效果盡量好,應(yīng)使任何一幀所分配的k個包都互不相同,因此有M=C (P, k),這里C (P, k)代表P個元素中取k個的組合數(shù)。但另一方面,M幀中每幀在P個大小為η的包中出現(xiàn)k次,因此有Mk=Pn。聯(lián)立此二方程,即可求出M和P的值。然后,在具體交織方法設(shè)計上,只需將C(P,k)的所有組合一一列出,并將每個組合分別對應(yīng)到M個包的每一個即可。在圖4所舉實(shí)施例中,n=5,k=2。依據(jù)上述設(shè)計方法有:M=C (P, 2),2M=5P,由此求得M=15,P=6。以15個幀為一組,每組數(shù)據(jù)通過對稱和冗余,打包成6個包。將C(6,2)的組合一一列出,并對應(yīng)到各幀,得出的分組交織設(shè)計方案即與圖4 一致。然后按照時延盡可能小的方式,將設(shè)計出的包分別分配在各個通道上傳輸即可。再舉一例如下:設(shè)n=10, k=3。依據(jù)上述設(shè)計方法有:M=C (P, 3),3M=10P,由此求得M=20,P=6。以20個幀為一組,每組數(shù)據(jù)通過對稱和冗余,打包成6個包。將C(6,3)的組合一一列出,并對應(yīng)到各幀,得具體分組交織設(shè)計方案如下:包1:幀 1、2、3、4、5、6、7、8、9、10包2:幀 1、2、3、4、11、12、13、14、15、16包3:幀 1、5、6、7、11、12、13、17、18、19包4:幀 2、5、8、9、11、14、15、17、18、20包5:幀 3、6、8、10、12、14、16、17、19、20包6:幀 4、7、9、10、13、15、16、18、19、20。需要補(bǔ)充說明的一點(diǎn)是,按上述設(shè)計方法,有時會出現(xiàn)P不能解得正整數(shù)的情況。通常η的最大值是受到網(wǎng)絡(luò)條件制約的,不能任意增大。此時可以將P取為較小的鄰近正整數(shù),并以此為依據(jù)計算M值,再調(diào)整η值。由組合數(shù)C(P,k)的定義可知,由正整數(shù)P計算出的M和η都是正整數(shù)。例如n=8,k=3時,可得5〈P〈6,則取P=5,然后得出M=10,再得出n=6。
權(quán)利要求
1.一種基于組合設(shè)計的語音冗余交織方法,其特征在于:將實(shí)時語音數(shù)據(jù)分解成多個較小的語音幀,然后根據(jù)語音數(shù)據(jù)傳輸要求對多個語音幀進(jìn)行重新排列與組合,從而交織成數(shù)據(jù)包,最后設(shè)定符合語音數(shù)據(jù)傳輸要求的數(shù)據(jù)包傳送順序,按傳輸順序?qū)?shù)據(jù)包分配到符合語音數(shù)據(jù)傳輸要求的傳輸通道上進(jìn)行傳輸。
2.根據(jù)權(quán)利要求1所述的一種基于組合設(shè)計的語音冗余交織方法,其特征在于:多個語音幀的組合方式通過簡單的組合設(shè)計確定,具有對稱冗余特性,在網(wǎng)絡(luò)上出現(xiàn)隨機(jī)丟包時,具有較高的恢復(fù)能力。
3.根據(jù)權(quán)利要求1所述的一種基于組合設(shè)計的語音冗余交織方法,其特征在于:由于數(shù)據(jù)存在冗余需要額外的傳輸帶寬,故使用多個并行的傳輸通道。
4.根據(jù)權(quán)利要求1所述的一種基于組合設(shè)計的語音冗余交織方法,其特征在于:在丟包稍多時,可基于正常數(shù)據(jù)進(jìn)行后續(xù)丟包隱藏處理,仍可正常傳輸部分?jǐn)?shù)據(jù),提高語音傳輸質(zhì)量。
全文摘要
本發(fā)明公開了一種基于組合設(shè)計的語音冗余交織方法,將實(shí)時語音數(shù)據(jù)分成較小的語音幀,并對這些幀進(jìn)行重新排列與組合,交織成數(shù)據(jù)包在網(wǎng)絡(luò)上傳輸。本發(fā)明結(jié)合了現(xiàn)有交織技術(shù)與前向糾錯技術(shù)的特點(diǎn),以增加傳輸帶寬為代價,將數(shù)據(jù)流以分組冗余交織打包的形式傳輸,在與現(xiàn)有交織技術(shù)相比沒有引入額外時延的前提下,提高了語音傳輸?shù)目煽啃耘c質(zhì)量。
文檔編號G10L19/008GK103078715SQ20131003020
公開日2013年5月1日 申請日期2013年1月25日 優(yōu)先權(quán)日2013年1月25日
發(fā)明者陳擁權(quán), 李梁, 張羽 申請人:合肥寰景信息技術(shù)有限公司