一種音頻合成處理方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種音頻合成處理方法及系統(tǒng)。所述方法包括:采集當前幀的多個參與方的語音數(shù)據(jù);計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值,生成所述每一參與方的當前幀的語音差值數(shù)據(jù);根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級和符號位;將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累加后,與上一幀的混音數(shù)據(jù)相加,生成當前幀的混音數(shù)據(jù)。本發(fā)明可以有效消除背景噪音的同時,也有效的消除了在語音數(shù)據(jù)中的直流偏置。并且,本發(fā)明涉及的算法簡單,控制簡單且占用資源少,可以簡單實現(xiàn)多達64個參與方的混音,方便在一些低成本的混音設(shè)計中實現(xiàn)。
【專利說明】
一種音頻合成處理方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及聲音處理領(lǐng)域,尤其涉及一種音頻合成處理方法及系統(tǒng)。
【背景技術(shù)】
[0002] 在通信過程中,常使用混音來滿足各種產(chǎn)品的設(shè)計需求。在目前的混音設(shè)計中,采 用語音數(shù)據(jù)相加、語音數(shù)據(jù)加權(quán)相加等算法來實現(xiàn)混音,也可通過采用模擬信號進行混音。 使用以上算法進行混音,算法簡單,但同時都存在參與方多情況下,背景噪音大,發(fā)言人聲 音小等不足之處也十分明顯。
[0003] 目前的混音算法普遍適用于10方以下的混音,而使用超過10方以上的混音時,又 需要采用復(fù)雜的算法,占用大量的CHJ資源進行計算。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明提出一種音頻合成處理方法及系統(tǒng),以解決現(xiàn)有技術(shù)中的混音算法復(fù)雜, 占用CHJ資源較多的問題。
[0005] 為了達到上述目的,本發(fā)明實施例提供一種音頻合成處理方法,包括:采集當前幀 的多個參與方的語音數(shù)據(jù);計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差 值,生成所述每一參與方的當前幀的語音差值數(shù)據(jù);根據(jù)參與方的數(shù)量,為所述每一參與方 的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級和符號位;將每一參與方的當前幀的設(shè)置衰減等級 和符號位后的語音差值數(shù)據(jù)進行累加后,與上一幀的混音數(shù)據(jù)相加,生成當前幀的混音數(shù) 據(jù)。
[0006] 進一步地,在一實施例中,計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音 數(shù)據(jù)的差值,生成所述每一參與方的當前幀的語音差值數(shù)據(jù),包括:當所述參與方在當前幀 剛加入混音時,差值為所述參與方在當前幀的語音數(shù)據(jù);當所述參與方在當前幀離開混音 時,差值為〇減去所述參與方在上一幀的語音數(shù)據(jù);當所述參與方繼續(xù)在混音時,差值為所 述參與方在當前幀的數(shù)據(jù)減去所述參與方在上一幀的語音數(shù)據(jù);當所述參與方在當前幀禁 止時,差值為0。
[0007] 進一步地,在一實施例中,根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語音 差值數(shù)據(jù)設(shè)置衰減等級,包括:所述衰減等級的數(shù)值根據(jù)所述參與方的數(shù)量的逐漸增多而 減小。
[0008] 進一步地,在一實施例中,根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語音 差值數(shù)據(jù)設(shè)置符號位,包括:當所述參與方為偶數(shù)時,對其兩兩設(shè)置相反的符號位。
[0009] 進一步地,在一實施例中,還包括:在進行語音差值數(shù)據(jù)的累加和上一幀的混音數(shù) 據(jù)相加時,進行溢出的控制。
[0010] 為了達到上述目的,本發(fā)明實施例還提供一種音頻合成處理系統(tǒng),包括:語音數(shù)據(jù) 采集模塊,用于采集當前幀的多個參與方的語音數(shù)據(jù);差值數(shù)據(jù)計算模塊,用于計算每一參 與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值,生成所述每一參與方的當前幀的語 音差值數(shù)據(jù);參數(shù)設(shè)置模塊,用于根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語音差 值數(shù)據(jù)設(shè)置衰減等級和符號位;混音模塊,用于將每一參與方的當前幀的設(shè)置衰減等級和 符號位后的語音差值數(shù)據(jù)進行累加后,與上一幀的混音數(shù)據(jù)相加,生成當前幀的混音數(shù)據(jù)。
[0011] 本發(fā)明實施例的音頻合成處理方法及系統(tǒng)采用了差值相加的方式進行,并通過設(shè) 定不同的符號位來消除背景噪音,通過僅僅將參與方的語音變化量,即差值添加到混音累 加值中,可以有效消除背景噪音的同時,也有效的消除了在語音數(shù)據(jù)中的直流偏置。并且, 本發(fā)明涉及的算法簡單,控制簡單且占用資源少,可以簡單實現(xiàn)多達64個參與方的混音,方 便在一些低成本的混音設(shè)計中實現(xiàn)。
【附圖說明】
[0012] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本 發(fā)明的一些實施例,對于本領(lǐng)域技術(shù)人員來講,在不付出創(chuàng)造性勞動性的前提下,還可以根 據(jù)這些附圖獲得其他的附圖。
[0013] 圖1為本發(fā)明實施例的音頻和成處理方法的處理流程圖; 圖2為本發(fā)明實施例的音頻和成處理系統(tǒng)的結(jié)構(gòu)示意圖; 圖3為本發(fā)明實施例的參數(shù)設(shè)置模塊的結(jié)構(gòu)示意圖。
【具體實施方式】
[0014] 下面將結(jié)合本發(fā)明實施例中的附圖,對本發(fā)明實施例中的技術(shù)方案進行清楚、完 整地描述,顯然,所描述的實施例僅僅是本發(fā)明一部分實施例,而不是全部的實施例?;?本發(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他 實施例,都屬于本發(fā)明保護的范圍。
[0015] 首先,本發(fā)明的音頻合成處理方法所涉及的現(xiàn)有的算法原理如下: 在現(xiàn)有技術(shù)中,很多混音算法采用方式的表達式為:
其中,m表示參與方的數(shù)量,:??表示t時刻的語音數(shù)據(jù),η表示每個參與方的權(quán)值,一 般來說η < 1。
[0016] 如果當每個參與方的語音數(shù)據(jù)XCO存在較大的噪音#的時,會導(dǎo)致參與方數(shù)量多 時,正確語音數(shù)據(jù)被淹沒在噪音中,無法獲取。
[00171 亦公忒Π )由.熄JTffi由弓丨入嚙咅徨至丨丨,
在混音過程中,認為各個參與方的語音數(shù)據(jù)中的噪音是一個變化較慢的數(shù)據(jù),可以作 為一個常暈來進行處理,因此,從公式(3)推導(dǎo)得到:
M苜昇,一取?肯/兄系B有一T現(xiàn)少M兒個參與方發(fā)言,由于需要進行取平均的算 法,避免溢出,因此必然導(dǎo)致信噪比的降低。
[0018] 針對現(xiàn)有技術(shù)中存在的上述問題,本發(fā)明采用了差值相加的方式進行,并通過設(shè) 定不同的符號位來消除背景噪音,并有效抑制了相對不進行變化的分量(例如:直流偏置)。 因此,本發(fā)明的算法簡單,控制簡單、占用資源少,方便在一些低成本的設(shè)計中應(yīng)用。
[0019] 圖1為本發(fā)明實施例的音頻和成處理方法的處理流程圖。如圖1所示,包括: 步驟S101,采集當前幀的多個參與方的語音數(shù)據(jù); 步驟S102,計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值,生成所 述每一參與方的當前幀的語音差值數(shù)據(jù); 步驟S103,根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減 等級和符號位; 步驟S104,將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累 加后,與上一幀的混音數(shù)據(jù)相加,生成當前幀的混音數(shù)據(jù)。
[0020] 具體實施時,在步驟SlOl中,采集當前幀的多個參與方的語音數(shù)據(jù),包括以下幾種 情況: (1)上一幀已經(jīng)加入了混音,當前幀也加入了混音的參與方; (2 )上一幀沒有加入混音,當前幀剛剛加入混音的參與方,即新的參與方; (3) 上一幀已經(jīng)加入了混音,當前幀也加入了混音,但是禁止參與混音的參與方; (4) 上一幀加入了混音,當前幀離開混音的參與方。
[0021] 當為第(1)種情形時,采集該種參與方的當前幀的語音數(shù)據(jù),即為當前幀的真實有 效的語音數(shù)據(jù);當為第(2)種情形時,采集該種參與方的當前幀的語音數(shù)據(jù),即為當前幀的 真實有效的語音數(shù)據(jù);當為第(3)種情形時,采集該種參與方的當前幀的語音數(shù)據(jù),即為當 前幀的真實有效的語音數(shù)據(jù),但是在計算差值數(shù)據(jù)時,不參與計算,即差值為〇;當為第(4) 種情形時,采集該種參與方的當前幀的語音數(shù)據(jù)為〇。
[0022] 具體實施時,在步驟S102中,計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語 音數(shù)據(jù)的差值,生成所述每一參與方的當前幀的語音差值數(shù)據(jù),包括以下幾種狀態(tài): (1) 當所述參與方在當前幀剛加入混音時,語音差值數(shù)據(jù)為所述參與方在當前幀的語 音數(shù)據(jù); (2) 當所述參與方在當前幀離開混音時,語音差值數(shù)據(jù)為0減去所述參與方在上一幀的 語音數(shù)據(jù); (3) 當所述參與方繼續(xù)在混音時,語音差值數(shù)據(jù)為所述參與方在當前幀的數(shù)據(jù)減去所 述參與方在上一幀的語音數(shù)據(jù); (4) 當所述參與方在當前幀被禁止混音時,語音差值數(shù)據(jù)為0。
[0023] 其中,表示為計算機程序語言如下: //禁止混音時 { 差值DIFF = 0 } //參與方剛進入混音時, { 差值 DIFF = MemberF rame(N) } //參與方離開混音時 { 差值 DIFF - O - MenibGrFrame(N-I) } //參與方在混音中時, { 差值 DIFF = MemberF rame (N) - MenibGrFrame(N-I) } 其中,MemberFrame(N)表;^該參與方在第N幀時的語音數(shù)據(jù),MemberFrame(N-I)表;^該參與 方在第N-I幀時的語音數(shù)據(jù)。
[0024] 具體實施時,在步驟S103中,根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語 音差值數(shù)據(jù)設(shè)置衰減等級,例如:當所述參與方為3個時,設(shè)置衰減等級為0.95;當所述參與 方為4個時,設(shè)置衰減等級為0.92。當然,衰減等級的設(shè)置并不限于上述數(shù)值,其根據(jù)本領(lǐng)域 技術(shù)人員的經(jīng)驗評估得到,并根據(jù)參與方的逐漸增多而逐漸減小。例如,一個較優(yōu)實施例 中,可以設(shè)置參與方為2-17時的衰減等級依次為:I,0.944,0.891,0.841,0.794,0.750, 0.708,0.668,0.631,0.596,0.562,0.531,0.501,0.473,0.447,0.422。
[0025] 具體實施時,在步驟S103中,根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語 音差值數(shù)據(jù)設(shè)置符號位,包括:當所述參與方為偶數(shù)時,對其兩兩設(shè)置相反的符號位。權(quán)重 和符號位取反都是有效降低混音的背景噪音的方法。符號位取反在偶數(shù)情況下,能最大程 度上減少背景噪音。也就說是,其中一個參與方的符號位為正,對應(yīng)另一個參與方的符號位 為負,必須這樣兩兩對應(yīng)設(shè)置相反的符號位,才能達到太#日日路低皆暑·噪音的效果。
[0026] 舉例說明,現(xiàn)有技術(shù)在實現(xiàn)方式上都是采用
原始語音數(shù)據(jù)累加 的方式進行混音。即:第t幀數(shù)據(jù),四個參與方的混音值為Y(t),第五個參與方的語音數(shù)據(jù)為 X5(t),此時五個參與方的混音值為Z(t) = Y(t) + X5(t)。
[0027] 而本發(fā)明實施例中,采用了差值相加的方式進行,即: 第t幀數(shù)據(jù),四個參與方的混音值為Y(t),第五個參與方剛參與混音中,差值為DIFF = X5(t) - 0;此時五個參與方的混音值為Z(t) = Y(t) + DIFF = Y(t) + (X5(t) - 0) = Y (t) + X5(t),從算式可以發(fā)現(xiàn)第t幀第五個參與方的語音數(shù)據(jù)存在于混音值當Z(t)中,能 實現(xiàn)混音功能。
[0028]第t+Ι幀數(shù)據(jù),第五個參與方語音的差值為:DIFF = X5(t+1) - X5(t),五個參與 方的混音值為:z(t+l) = Z(t) + DIFF = Y(t) + X5(t) + (X5(t+1) - X5(t))= Y(t) + X5(t+1),從算式可以發(fā)現(xiàn)第t+1幀第五個參與方的語音數(shù)據(jù)存在于混音值Z(t+1)當中。
[0029] 由以上的計算可以看出,在本發(fā)明的混音算法的過程中,由于借用上一次混音的 結(jié)果與差值進行累加,可以將第五個參與者的語音數(shù)據(jù)添加到累加值中,實現(xiàn)混音。
[0030] 但是,在現(xiàn)實環(huán)境中,不可不免存在有背景噪音在實際環(huán)境中不可不免存在有背 景噪音N(t),在本發(fā)明中,通過設(shè)置符號位取反和不同權(quán)重的算法,能有效消除特定環(huán)境下 的背景噪音,舉例如下: 第t幀數(shù)據(jù),四個參與方的混音值為Y(t),第五個參與方剛參與混音中,差值為DIFF5 = X5(t)+N(t)-0;設(shè)定權(quán)重為-η;第六個參與方剛參與混音中,差值為DIFF6 = X6(t)+N(t)_ 〇;設(shè)定權(quán)重為η。
[0031] 六個參與方的混音值為: Z(t) = Y(t) + DIFF5 + DIFF6 =Y(t) + n*(X5(t)+N(t)) -n*(X6(t)+N(t)) =Y(t) + n*X5(t) + n*N(t) - n*X6(t) - n*N(t) =Y(t) + n*X5(t) - n*X6(t) 從算式可以發(fā)現(xiàn)第t幀第五個參與方和第六個參與方的語音數(shù)據(jù)的存在噪音被消除 了,提高了語音信號的信噪比。
[0032] 但是該方法僅能在一定環(huán)境中有效消除背景噪音,例如同一個房間,因此本發(fā)明 實現(xiàn)的是低成本的混音方案。
[0033] 具體實施時,在步驟S104中,將每一參與方的當前幀的設(shè)置衰減等級和符號位后 的語音差值數(shù)據(jù)進行累加后,與上一幀的混音數(shù)據(jù)相加,生成當前幀的混音數(shù)據(jù),公式表達 為:
) HI幀的混音數(shù)據(jù), Y為設(shè)置的衰減等級,DIFF為語音差值數(shù)據(jù),m為參與方的數(shù)量。
[0034] 當然,這種對語音數(shù)據(jù)直接疊加的方法極易產(chǎn)生溢出,因此,在進行語音數(shù)據(jù)的累 加時,還需要進行溢出的控制。在本一實施例中,可以采用如下方法進行溢出控制: //如果存在正向溢出 If(Conf_sum(N) > Conf_max) { Conf_sum(N) = Conf_max } //如果存在負向溢出 If(Conf_sum(N) < Conf_min) { Conf_sum(N) = Conf_min } 當然,對語音數(shù)據(jù)疊加的溢出控制算法已經(jīng)是本領(lǐng)域技術(shù)人員所熟知的技術(shù)手段,這 不是本發(fā)明所要保護的創(chuàng)新點,采用其他溢出算法也不會對本發(fā)明的創(chuàng)新點造成影響,故 本發(fā)明中不再贅述。
[0035] 基于同一發(fā)明構(gòu)思,本發(fā)明實施例還提供一種音頻合成處理系統(tǒng),如圖2所示,包 括:語音數(shù)據(jù)采集模塊101,用于采集當前幀的多個參與方的語音數(shù)據(jù);差值數(shù)據(jù)計算模塊 102,用于計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值,生成所述每一 參與方的當前幀的語音差值數(shù)據(jù);參數(shù)設(shè)置模塊103,用于根據(jù)參與方的數(shù)量,為所述每一 參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級和符號位;混音模塊104,用于將每一參與方 的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累加后,與上一幀的混音數(shù)據(jù)相 加,生成當前幀的混音數(shù)據(jù)。
[0036] 具體實施時,所述差值數(shù)據(jù)計算模塊102用于計算當前幀的語音差值數(shù)據(jù),具體包 括:當所述參與方在當前幀剛加入混音時,差值為所述參與方在當前幀的語音數(shù)據(jù);當所述 參與方在當前幀離開混音時,差值為0減去所述參與方在上一幀的語音數(shù)據(jù);當所述參與方 繼續(xù)在混音時,差值為所述參與方在當前幀的數(shù)據(jù)減去所述參與方在上一幀的語音數(shù)據(jù); 當所述參與方在當前幀禁止時,差值為〇。
[0037] 具體實施時,如圖3所示,所述參數(shù)設(shè)置模塊103包括衰減等級設(shè)置模塊1031,其用 于根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級,包括:當 參與方為3個時,設(shè)置衰減等級為0.95;當參與方為4個時,設(shè)置衰減等級為0.92。
[0038] 具體實施時,如圖3所示,所述參數(shù)設(shè)置模塊103還包括符號位設(shè)置模塊1032,其用 于根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置符號位,包括:當所 述參與方為偶數(shù)時,對其兩兩設(shè)置相反的符號位。
[0039] 在本發(fā)明中,所述混音模塊104中包括有溢出控制模塊,用于在進行語音差值數(shù)據(jù) 的累加和上一幀的混音數(shù)據(jù)相加時,進行溢出的控制。
[0040] 通過實驗得到,使用本發(fā)明的音頻合成處理方法可以實現(xiàn)64方成員參與到混音 中,有一定背景噪音,但發(fā)言人的語音能被其他成員清晰接收到。而采用非本算法實現(xiàn)的混 音,在12方成員參與混音后,就出現(xiàn)背景噪音過大,將發(fā)言人語音淹沒在噪音中的情況。
[0041] 通過以上實施例可以得到,本發(fā)明實施例的音頻合成處理方法及系統(tǒng)采用了差值 相加的方式進行,并通過設(shè)定不同的符號位來消除背景噪音,通過僅僅將參與方的語音變 化量,即差值添加到混音累加值中,可以有效消除背景噪音的同時,也有效的消除了在語音 數(shù)據(jù)中的直流偏置。并且,本發(fā)明涉及的算法簡單,控制簡單且占用資源少,可以簡單實現(xiàn) 多達64個參與方的混音,方便在一些低成本的混音設(shè)計中實現(xiàn)。
[0042]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白,本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序 產(chǎn)品。因此,本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實 施例的形式。而且,本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機 可用存儲介質(zhì)(包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等)上實施的計算機程序產(chǎn) 品的形式。
[0043] 本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備(系統(tǒng))、和計算機程序產(chǎn)品的流程 圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流 程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計算機程序 指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn) 生一個機器,使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實 現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0044] 這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特 定方式工作的計算機可讀存儲器中,使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指 令裝置的制造品,該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或 多個方框中指定的功能。
[0045] 這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上,使得在計 算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理,從而在計算機或 其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一 個方框或多個方框中指定的功能的步驟。
[0046]本發(fā)明中應(yīng)用了具體實施例對本發(fā)明的原理及實施方式進行了闡述,以上實施例 的說明只是用于幫助理解本發(fā)明的方法及其核心思想;同時,對于本領(lǐng)域的一般技術(shù)人員, 依據(jù)本發(fā)明的思想,在【具體實施方式】及應(yīng)用范圍上均會有改變之處,綜上所述,本說明書內(nèi) 容不應(yīng)理解為對本發(fā)明的限制。
【主權(quán)項】
1. 一種音頻合成處理方法,其特征在于,包括: 采集當前幀的多個參與方的語音數(shù)據(jù); 計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值,生成所述每一參與 方的當前幀的語音差值數(shù)據(jù); 根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級和符號 位; 將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累加后,與上 一幀的混音數(shù)據(jù)相加,生成當前幀的混音數(shù)據(jù)。2. 根據(jù)權(quán)利要求1所述的音頻合成處理方法,其特征在于,計算每一參與方的當前幀的 語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值,生成所述每一參與方的當前幀的語音差值數(shù)據(jù),包 括: 當所述參與方在當前幀剛加入混音時,差值為所述參與方在當前幀的語音數(shù)據(jù); 當所述參與方在當前幀離開混音時,差值為〇減去所述參與方在上一幀的語音數(shù)據(jù); 當所述參與方繼續(xù)在混音時,差值為所述參與方在當前幀的數(shù)據(jù)減去所述參與方在上 一幀的語音數(shù)據(jù); 當所述參與方在當前幀禁止時,差值為0。3. 根據(jù)權(quán)利要求1所述的音頻合成處理方法,其特征在于,根據(jù)參與方的數(shù)量,為所述 每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級,包括: 所述衰減等級的數(shù)值根據(jù)所述參與方的數(shù)量的逐漸增多而減小。4. 根據(jù)權(quán)利要求1所述的音頻合成處理方法,其特征在于,根據(jù)參與方的數(shù)量,為所述 每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置符號位,包括: 當所述參與方為偶數(shù)時,對其兩兩設(shè)置相反的符號位。5. 根據(jù)權(quán)利要求1所述的音頻合成處理方法,其特征在于,還包括: 在進行語音差值數(shù)據(jù)的累加和上一幀的混音數(shù)據(jù)相加時,進行溢出的控制。6. -種音頻合成處理系統(tǒng),其特征在于,包括: 語音數(shù)據(jù)采集模塊,用于采集當前幀的多個參與方的語音數(shù)據(jù); 差值數(shù)據(jù)計算模塊,用于計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的 差值,生成所述每一參與方的當前幀的語音差值數(shù)據(jù); 參數(shù)設(shè)置模塊,用于根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語音差值數(shù)據(jù) 設(shè)置衰減等級和符號位; 混音模塊,用于將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進 行累加后,與上一幀的混音數(shù)據(jù)相加,生成當前幀的混音數(shù)據(jù)。7. 根據(jù)權(quán)利要求6所述的音頻合成處理系統(tǒng),其特征在于,所述差值數(shù)據(jù)計算模塊用于 計算當前幀的語音差值數(shù)據(jù),具體包括: 當所述參與方在當前幀剛加入混音時,差值為所述參與方在當前幀的語音數(shù)據(jù); 當所述參與方在當前幀離開混音時,差值為〇減去所述參與方在上一幀的語音數(shù)據(jù); 當所述參與方繼續(xù)在混音時,差值為所述參與方在當前幀的數(shù)據(jù)減去所述參與方在上 一幀的語音數(shù)據(jù); 當所述參與方在當前幀禁止時,差值為0。8. 根據(jù)權(quán)利要求6所述的音頻合成處理系統(tǒng),其特征在于,所述參數(shù)設(shè)置模塊包括衰減 等級設(shè)置模塊,其用于根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè) 置衰減等級,包括: 所述衰減等級的數(shù)值根據(jù)所述參與方的數(shù)量的逐漸增多而減小。9. 根據(jù)權(quán)利要求6所述的音頻合成處理系統(tǒng),其特征在于,所述參數(shù)設(shè)置模塊包括符號 位設(shè)置模塊,其用于根據(jù)參與方的數(shù)量,為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置 符號位,包括: 當所述參與方為偶數(shù)時,對其兩兩設(shè)置相反的符號位。10. 根據(jù)權(quán)利要求6所述的音頻合成處理系統(tǒng),其特征在于,所述混音模塊中包括有:溢 出控制模塊,用于在進行語音差值數(shù)據(jù)的累加和上一幀的混音數(shù)據(jù)相加時,進行溢出的控 制。
【文檔編號】G10L13/02GK106057191SQ201610334168
【公開日】2016年10月26日
【申請日】2016年5月19日
【發(fā)明人】魏天云, 張偉, 吳秋平
【申請人】廣州頤希頡信息科技有限公司