一種音頻合成處理方法及系統(tǒng)的制作方法

文檔序號：10688556閱讀：223來源：國知局

導(dǎo)航： X技術(shù)> 最新專利>樂器;聲學(xué)設(shè)備的制造及制作,分析技術(shù)

一種音頻合成處理方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種音頻合成處理方法及系統(tǒng)。所述方法包括：采集當前幀的多個參與方的語音數(shù)據(jù)；計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值，生成所述每一參與方的當前幀的語音差值數(shù)據(jù)；根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級和符號位；將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累加后，與上一幀的混音數(shù)據(jù)相加，生成當前幀的混音數(shù)據(jù)。本發(fā)明可以有效消除背景噪音的同時，也有效的消除了在語音數(shù)據(jù)中的直流偏置。并且，本發(fā)明涉及的算法簡單，控制簡單且占用資源少，可以簡單實現(xiàn)多達64個參與方的混音，方便在一些低成本的混音設(shè)計中實現(xiàn)。
【專利說明】
一種音頻合成處理方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及聲音處理領(lǐng)域，尤其涉及一種音頻合成處理方法及系統(tǒng)。
【背景技術(shù)】
[0002] 在通信過程中，常使用混音來滿足各種產(chǎn)品的設(shè)計需求。在目前的混音設(shè)計中，采用語音數(shù)據(jù)相加、語音數(shù)據(jù)加權(quán)相加等算法來實現(xiàn)混音，也可通過采用模擬信號進行混音。使用以上算法進行混音，算法簡單，但同時都存在參與方多情況下，背景噪音大，發(fā)言人聲音小等不足之處也十分明顯。
[0003] 目前的混音算法普遍適用于10方以下的混音，而使用超過10方以上的混音時，又需要采用復(fù)雜的算法，占用大量的CHJ資源進行計算。

【發(fā)明內(nèi)容】

[0004] 本發(fā)明提出一種音頻合成處理方法及系統(tǒng)，以解決現(xiàn)有技術(shù)中的混音算法復(fù)雜，占用CHJ資源較多的問題。
[0005] 為了達到上述目的，本發(fā)明實施例提供一種音頻合成處理方法，包括:采集當前幀的多個參與方的語音數(shù)據(jù);計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值，生成所述每一參與方的當前幀的語音差值數(shù)據(jù);根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級和符號位;將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累加后，與上一幀的混音數(shù)據(jù)相加，生成當前幀的混音數(shù) 據(jù)。
[0006] 進一步地，在一實施例中，計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值，生成所述每一參與方的當前幀的語音差值數(shù)據(jù)，包括：當所述參與方在當前幀剛加入混音時，差值為所述參與方在當前幀的語音數(shù)據(jù)；當所述參與方在當前幀離開混音時，差值為〇減去所述參與方在上一幀的語音數(shù)據(jù)；當所述參與方繼續(xù)在混音時，差值為所述參與方在當前幀的數(shù)據(jù)減去所述參與方在上一幀的語音數(shù)據(jù)；當所述參與方在當前幀禁止時，差值為0。
[0007] 進一步地，在一實施例中，根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級，包括:所述衰減等級的數(shù)值根據(jù)所述參與方的數(shù)量的逐漸增多而減小。
[0008] 進一步地，在一實施例中，根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置符號位，包括:當所述參與方為偶數(shù)時，對其兩兩設(shè)置相反的符號位。
[0009] 進一步地，在一實施例中，還包括:在進行語音差值數(shù)據(jù)的累加和上一幀的混音數(shù) 據(jù)相加時，進行溢出的控制。
[0010] 為了達到上述目的，本發(fā)明實施例還提供一種音頻合成處理系統(tǒng)，包括:語音數(shù)據(jù) 采集模塊，用于采集當前幀的多個參與方的語音數(shù)據(jù);差值數(shù)據(jù)計算模塊，用于計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值，生成所述每一參與方的當前幀的語音差值數(shù)據(jù);參數(shù)設(shè)置模塊，用于根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級和符號位;混音模塊，用于將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累加后，與上一幀的混音數(shù)據(jù)相加，生成當前幀的混音數(shù)據(jù)。
[0011] 本發(fā)明實施例的音頻合成處理方法及系統(tǒng)采用了差值相加的方式進行，并通過設(shè) 定不同的符號位來消除背景噪音，通過僅僅將參與方的語音變化量，即差值添加到混音累加值中，可以有效消除背景噪音的同時，也有效的消除了在語音數(shù)據(jù)中的直流偏置。并且，本發(fā)明涉及的算法簡單，控制簡單且占用資源少，可以簡單實現(xiàn)多達64個參與方的混音，方便在一些低成本的混音設(shè)計中實現(xiàn)。
【附圖說明】
[0012] 為了更清楚地說明本發(fā)明實施例或現(xiàn)有技術(shù)中的技術(shù)方案，下面將對實施例或現(xiàn) 有技術(shù)描述中所需要使用的附圖作簡單地介紹，顯而易見地，下面描述中的附圖僅僅是本發(fā)明的一些實施例，對于本領(lǐng)域技術(shù)人員來講，在不付出創(chuàng)造性勞動性的前提下，還可以根據(jù)這些附圖獲得其他的附圖。
[0013] 圖1為本發(fā)明實施例的音頻和成處理方法的處理流程圖；圖2為本發(fā)明實施例的音頻和成處理系統(tǒng)的結(jié)構(gòu)示意圖；圖3為本發(fā)明實施例的參數(shù)設(shè)置模塊的結(jié)構(gòu)示意圖。
【具體實施方式】
[0014] 下面將結(jié)合本發(fā)明實施例中的附圖，對本發(fā)明實施例中的技術(shù)方案進行清楚、完整地描述，顯然，所描述的實施例僅僅是本發(fā)明一部分實施例，而不是全部的實施例?；?本發(fā)明中的實施例，本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例，都屬于本發(fā)明保護的范圍。
[0015] 首先，本發(fā)明的音頻合成處理方法所涉及的現(xiàn)有的算法原理如下：在現(xiàn)有技術(shù)中，很多混音算法采用方式的表達式為：
其中，m表示參與方的數(shù)量，:??表示t時刻的語音數(shù)據(jù)，η表示每個參與方的權(quán)值，一般來說η < 1。
[0016] 如果當每個參與方的語音數(shù)據(jù)XCO存在較大的噪音#的時，會導(dǎo)致參與方數(shù)量多時，正確語音數(shù)據(jù)被淹沒在噪音中，無法獲取。
[00171 亦公忒Π )由.熄JTffi由弓丨入嚙咅徨至丨丨，
在混音過程中，認為各個參與方的語音數(shù)據(jù)中的噪音是一個變化較慢的數(shù)據(jù)，可以作為一個常暈來進行處理，因此，從公式(3)推導(dǎo)得到：
M苜昇，一取?肯/兄系B有一T現(xiàn)少M兒個參與方發(fā)言，由于需要進行取平均的算法，避免溢出，因此必然導(dǎo)致信噪比的降低。
[0018] 針對現(xiàn)有技術(shù)中存在的上述問題，本發(fā)明采用了差值相加的方式進行，并通過設(shè) 定不同的符號位來消除背景噪音，并有效抑制了相對不進行變化的分量(例如:直流偏置）。因此，本發(fā)明的算法簡單，控制簡單、占用資源少，方便在一些低成本的設(shè)計中應(yīng)用。
[0019] 圖1為本發(fā)明實施例的音頻和成處理方法的處理流程圖。如圖1所示，包括：步驟S101，采集當前幀的多個參與方的語音數(shù)據(jù)；步驟S102,計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值，生成所述每一參與方的當前幀的語音差值數(shù)據(jù)；步驟S103,根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級和符號位；步驟S104,將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累加后，與上一幀的混音數(shù)據(jù)相加，生成當前幀的混音數(shù)據(jù)。
[0020] 具體實施時，在步驟SlOl中，采集當前幀的多個參與方的語音數(shù)據(jù)，包括以下幾種情況： (1)上一幀已經(jīng)加入了混音，當前幀也加入了混音的參與方； (2 )上一幀沒有加入混音，當前幀剛剛加入混音的參與方，即新的參與方； (3) 上一幀已經(jīng)加入了混音，當前幀也加入了混音，但是禁止參與混音的參與方； (4) 上一幀加入了混音，當前幀離開混音的參與方。
[0021] 當為第（1)種情形時，采集該種參與方的當前幀的語音數(shù)據(jù)，即為當前幀的真實有效的語音數(shù)據(jù)；當為第(2)種情形時，采集該種參與方的當前幀的語音數(shù)據(jù)，即為當前幀的真實有效的語音數(shù)據(jù)；當為第(3)種情形時，采集該種參與方的當前幀的語音數(shù)據(jù)，即為當前幀的真實有效的語音數(shù)據(jù)，但是在計算差值數(shù)據(jù)時，不參與計算，即差值為〇;當為第(4) 種情形時，采集該種參與方的當前幀的語音數(shù)據(jù)為〇。
[0022] 具體實施時，在步驟S102中，計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值，生成所述每一參與方的當前幀的語音差值數(shù)據(jù)，包括以下幾種狀態(tài)： (1) 當所述參與方在當前幀剛加入混音時，語音差值數(shù)據(jù)為所述參與方在當前幀的語音數(shù)據(jù)； (2) 當所述參與方在當前幀離開混音時，語音差值數(shù)據(jù)為0減去所述參與方在上一幀的語音數(shù)據(jù)； (3) 當所述參與方繼續(xù)在混音時，語音差值數(shù)據(jù)為所述參與方在當前幀的數(shù)據(jù)減去所述參與方在上一幀的語音數(shù)據(jù)； (4) 當所述參與方在當前幀被禁止混音時，語音差值數(shù)據(jù)為0。
[0023] 其中，表示為計算機程序語言如下： //禁止混音時 { 差值DIFF = 0 } //參與方剛進入混音時， { 差值 DIFF = MemberF rame(N) } //參與方離開混音時 { 差值 DIFF - O - MenibGrFrame(N-I) } //參與方在混音中時， { 差值 DIFF = MemberF rame (N) - MenibGrFrame(N-I) } 其中，MemberFrame(N)表;^該參與方在第N幀時的語音數(shù)據(jù)，MemberFrame(N-I)表;^該參與方在第N-I幀時的語音數(shù)據(jù)。
[0024] 具體實施時，在步驟S103中，根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級，例如：當所述參與方為3個時，設(shè)置衰減等級為0.95;當所述參與方為4個時，設(shè)置衰減等級為0.92。當然，衰減等級的設(shè)置并不限于上述數(shù)值，其根據(jù)本領(lǐng)域技術(shù)人員的經(jīng)驗評估得到，并根據(jù)參與方的逐漸增多而逐漸減小。例如，一個較優(yōu)實施例中，可以設(shè)置參與方為2-17時的衰減等級依次為：I，0.944，0.891，0.841，0.794，0.750， 0.708,0.668,0.631，0.596,0.562,0.531，0.501，0.473,0.447,0.422。
[0025] 具體實施時，在步驟S103中，根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置符號位，包括：當所述參與方為偶數(shù)時，對其兩兩設(shè)置相反的符號位。權(quán)重和符號位取反都是有效降低混音的背景噪音的方法。符號位取反在偶數(shù)情況下，能最大程度上減少背景噪音。也就說是，其中一個參與方的符號位為正，對應(yīng)另一個參與方的符號位為負，必須這樣兩兩對應(yīng)設(shè)置相反的符號位，才能達到太#日日路低皆暑·噪音的效果。
[0026] 舉例說明，現(xiàn)有技術(shù)在實現(xiàn)方式上都是采用
原始語音數(shù)據(jù)累加的方式進行混音。即：第t幀數(shù)據(jù)，四個參與方的混音值為Y(t)，第五個參與方的語音數(shù)據(jù)為 X5(t)，此時五個參與方的混音值為Z(t) = Y(t) + X5(t)。
[0027] 而本發(fā)明實施例中，采用了差值相加的方式進行，即：第t幀數(shù)據(jù)，四個參與方的混音值為Y(t)，第五個參與方剛參與混音中，差值為DIFF = X5(t) - 0;此時五個參與方的混音值為Z(t) = Y(t) + DIFF = Y(t) + (X5(t) - 0) = Y (t) + X5(t)，從算式可以發(fā)現(xiàn)第t幀第五個參與方的語音數(shù)據(jù)存在于混音值當Z(t)中，能實現(xiàn)混音功能。
[0028]第t+Ι幀數(shù)據(jù)，第五個參與方語音的差值為:DIFF = X5(t+1) - X5(t)，五個參與方的混音值為:z(t+l) = Z(t) + DIFF = Y(t) + X5(t) + (X5(t+1) - X5(t))= Y(t) + X5(t+1)，從算式可以發(fā)現(xiàn)第t+1幀第五個參與方的語音數(shù)據(jù)存在于混音值Z(t+1)當中。
[0029] 由以上的計算可以看出，在本發(fā)明的混音算法的過程中，由于借用上一次混音的結(jié)果與差值進行累加，可以將第五個參與者的語音數(shù)據(jù)添加到累加值中，實現(xiàn)混音。
[0030] 但是，在現(xiàn)實環(huán)境中，不可不免存在有背景噪音在實際環(huán)境中不可不免存在有背景噪音N(t)，在本發(fā)明中，通過設(shè)置符號位取反和不同權(quán)重的算法，能有效消除特定環(huán)境下的背景噪音，舉例如下：第t幀數(shù)據(jù)，四個參與方的混音值為Y(t)，第五個參與方剛參與混音中，差值為DIFF5 = X5(t)+N(t)-0;設(shè)定權(quán)重為-η;第六個參與方剛參與混音中，差值為DIFF6 = X6(t)+N(t)_ 〇;設(shè)定權(quán)重為η。
[0031] 六個參與方的混音值為： Z(t) = Y(t) + DIFF5 + DIFF6 =Y(t) + n*(X5(t)+N(t)) -n*(X6(t)+N(t)) =Y(t) + n*X5(t) + n*N(t) - n*X6(t) - n*N(t) =Y(t) + n*X5(t) - n*X6(t) 從算式可以發(fā)現(xiàn)第t幀第五個參與方和第六個參與方的語音數(shù)據(jù)的存在噪音被消除了，提高了語音信號的信噪比。
[0032] 但是該方法僅能在一定環(huán)境中有效消除背景噪音，例如同一個房間，因此本發(fā)明實現(xiàn)的是低成本的混音方案。
[0033] 具體實施時，在步驟S104中，將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累加后，與上一幀的混音數(shù)據(jù)相加，生成當前幀的混音數(shù)據(jù)，公式表達為：
) HI幀的混音數(shù)據(jù)， Y為設(shè)置的衰減等級，DIFF為語音差值數(shù)據(jù)，m為參與方的數(shù)量。
[0034] 當然，這種對語音數(shù)據(jù)直接疊加的方法極易產(chǎn)生溢出，因此，在進行語音數(shù)據(jù)的累加時，還需要進行溢出的控制。在本一實施例中，可以采用如下方法進行溢出控制： //如果存在正向溢出 If(Conf_sum(N) > Conf_max) { Conf_sum(N) = Conf_max } //如果存在負向溢出 If(Conf_sum(N) < Conf_min) { Conf_sum(N) = Conf_min } 當然，對語音數(shù)據(jù)疊加的溢出控制算法已經(jīng)是本領(lǐng)域技術(shù)人員所熟知的技術(shù)手段，這不是本發(fā)明所要保護的創(chuàng)新點，采用其他溢出算法也不會對本發(fā)明的創(chuàng)新點造成影響，故本發(fā)明中不再贅述。
[0035] 基于同一發(fā)明構(gòu)思，本發(fā)明實施例還提供一種音頻合成處理系統(tǒng)，如圖2所示，包括:語音數(shù)據(jù)采集模塊101，用于采集當前幀的多個參與方的語音數(shù)據(jù);差值數(shù)據(jù)計算模塊 102,用于計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值，生成所述每一參與方的當前幀的語音差值數(shù)據(jù);參數(shù)設(shè)置模塊103，用于根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級和符號位;混音模塊104,用于將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累加后，與上一幀的混音數(shù)據(jù)相加，生成當前幀的混音數(shù)據(jù)。
[0036] 具體實施時，所述差值數(shù)據(jù)計算模塊102用于計算當前幀的語音差值數(shù)據(jù)，具體包括:當所述參與方在當前幀剛加入混音時，差值為所述參與方在當前幀的語音數(shù)據(jù)；當所述參與方在當前幀離開混音時，差值為0減去所述參與方在上一幀的語音數(shù)據(jù)；當所述參與方繼續(xù)在混音時，差值為所述參與方在當前幀的數(shù)據(jù)減去所述參與方在上一幀的語音數(shù)據(jù)；當所述參與方在當前幀禁止時，差值為〇。
[0037] 具體實施時，如圖3所示，所述參數(shù)設(shè)置模塊103包括衰減等級設(shè)置模塊1031，其用于根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級，包括:當參與方為3個時，設(shè)置衰減等級為0.95;當參與方為4個時，設(shè)置衰減等級為0.92。
[0038] 具體實施時，如圖3所示，所述參數(shù)設(shè)置模塊103還包括符號位設(shè)置模塊1032,其用于根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置符號位，包括:當所述參與方為偶數(shù)時，對其兩兩設(shè)置相反的符號位。
[0039] 在本發(fā)明中，所述混音模塊104中包括有溢出控制模塊，用于在進行語音差值數(shù)據(jù) 的累加和上一幀的混音數(shù)據(jù)相加時，進行溢出的控制。
[0040] 通過實驗得到，使用本發(fā)明的音頻合成處理方法可以實現(xiàn)64方成員參與到混音中，有一定背景噪音，但發(fā)言人的語音能被其他成員清晰接收到。而采用非本算法實現(xiàn)的混音，在12方成員參與混音后，就出現(xiàn)背景噪音過大，將發(fā)言人語音淹沒在噪音中的情況。
[0041] 通過以上實施例可以得到，本發(fā)明實施例的音頻合成處理方法及系統(tǒng)采用了差值相加的方式進行，并通過設(shè)定不同的符號位來消除背景噪音，通過僅僅將參與方的語音變化量，即差值添加到混音累加值中，可以有效消除背景噪音的同時，也有效的消除了在語音數(shù)據(jù)中的直流偏置。并且，本發(fā)明涉及的算法簡單，控制簡單且占用資源少，可以簡單實現(xiàn) 多達64個參與方的混音，方便在一些低成本的混音設(shè)計中實現(xiàn)。
[0042]本領(lǐng)域內(nèi)的技術(shù)人員應(yīng)明白，本發(fā)明的實施例可提供為方法、系統(tǒng)、或計算機程序產(chǎn)品。因此，本發(fā)明可采用完全硬件實施例、完全軟件實施例、或結(jié)合軟件和硬件方面的實施例的形式。而且，本發(fā)明可采用在一個或多個其中包含有計算機可用程序代碼的計算機可用存儲介質(zhì)（包括但不限于磁盤存儲器、CD-ROM、光學(xué)存儲器等）上實施的計算機程序產(chǎn) 品的形式。
[0043] 本發(fā)明是參照根據(jù)本發(fā)明實施例的方法、設(shè)備（系統(tǒng)）、和計算機程序產(chǎn)品的流程圖和/或方框圖來描述的。應(yīng)理解可由計算機程序指令實現(xiàn)流程圖和/或方框圖中的每一流程和/或方框、以及流程圖和/或方框圖中的流程和/或方框的結(jié)合。可提供這些計算機程序指令到通用計算機、專用計算機、嵌入式處理機或其他可編程數(shù)據(jù)處理設(shè)備的處理器以產(chǎn) 生一個機器，使得通過計算機或其他可編程數(shù)據(jù)處理設(shè)備的處理器執(zhí)行的指令產(chǎn)生用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的裝置。
[0044] 這些計算機程序指令也可存儲在能引導(dǎo)計算機或其他可編程數(shù)據(jù)處理設(shè)備以特定方式工作的計算機可讀存儲器中，使得存儲在該計算機可讀存儲器中的指令產(chǎn)生包括指令裝置的制造品，該指令裝置實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能。
[0045] 這些計算機程序指令也可裝載到計算機或其他可編程數(shù)據(jù)處理設(shè)備上，使得在計算機或其他可編程設(shè)備上執(zhí)行一系列操作步驟以產(chǎn)生計算機實現(xiàn)的處理，從而在計算機或其他可編程設(shè)備上執(zhí)行的指令提供用于實現(xiàn)在流程圖一個流程或多個流程和/或方框圖一個方框或多個方框中指定的功能的步驟。
[0046]本發(fā)明中應(yīng)用了具體實施例對本發(fā)明的原理及實施方式進行了闡述，以上實施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想；同時，對于本領(lǐng)域的一般技術(shù)人員，依據(jù)本發(fā)明的思想，在【具體實施方式】及應(yīng)用范圍上均會有改變之處，綜上所述，本說明書內(nèi) 容不應(yīng)理解為對本發(fā)明的限制。
【主權(quán)項】
1. 一種音頻合成處理方法，其特征在于，包括：采集當前幀的多個參與方的語音數(shù)據(jù)；計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值，生成所述每一參與方的當前幀的語音差值數(shù)據(jù)；根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級和符號位；將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累加后，與上一幀的混音數(shù)據(jù)相加，生成當前幀的混音數(shù)據(jù)。2. 根據(jù)權(quán)利要求1所述的音頻合成處理方法，其特征在于，計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值，生成所述每一參與方的當前幀的語音差值數(shù)據(jù)，包括：當所述參與方在當前幀剛加入混音時，差值為所述參與方在當前幀的語音數(shù)據(jù)；當所述參與方在當前幀離開混音時，差值為〇減去所述參與方在上一幀的語音數(shù)據(jù)；當所述參與方繼續(xù)在混音時，差值為所述參與方在當前幀的數(shù)據(jù)減去所述參與方在上一幀的語音數(shù)據(jù)；當所述參與方在當前幀禁止時，差值為0。3. 根據(jù)權(quán)利要求1所述的音頻合成處理方法，其特征在于，根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置衰減等級，包括：所述衰減等級的數(shù)值根據(jù)所述參與方的數(shù)量的逐漸增多而減小。4. 根據(jù)權(quán)利要求1所述的音頻合成處理方法，其特征在于，根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置符號位，包括：當所述參與方為偶數(shù)時，對其兩兩設(shè)置相反的符號位。5. 根據(jù)權(quán)利要求1所述的音頻合成處理方法，其特征在于，還包括：在進行語音差值數(shù)據(jù)的累加和上一幀的混音數(shù)據(jù)相加時，進行溢出的控制。6. -種音頻合成處理系統(tǒng)，其特征在于，包括：語音數(shù)據(jù)采集模塊，用于采集當前幀的多個參與方的語音數(shù)據(jù)；差值數(shù)據(jù)計算模塊，用于計算每一參與方的當前幀的語音數(shù)據(jù)與上一幀的語音數(shù)據(jù)的差值，生成所述每一參與方的當前幀的語音差值數(shù)據(jù)；參數(shù)設(shè)置模塊，用于根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù) 設(shè)置衰減等級和符號位；混音模塊，用于將每一參與方的當前幀的設(shè)置衰減等級和符號位后的語音差值數(shù)據(jù)進行累加后，與上一幀的混音數(shù)據(jù)相加，生成當前幀的混音數(shù)據(jù)。7. 根據(jù)權(quán)利要求6所述的音頻合成處理系統(tǒng)，其特征在于，所述差值數(shù)據(jù)計算模塊用于計算當前幀的語音差值數(shù)據(jù)，具體包括：當所述參與方在當前幀剛加入混音時，差值為所述參與方在當前幀的語音數(shù)據(jù)；當所述參與方在當前幀離開混音時，差值為〇減去所述參與方在上一幀的語音數(shù)據(jù)；當所述參與方繼續(xù)在混音時，差值為所述參與方在當前幀的數(shù)據(jù)減去所述參與方在上一幀的語音數(shù)據(jù)；當所述參與方在當前幀禁止時，差值為0。8. 根據(jù)權(quán)利要求6所述的音頻合成處理系統(tǒng)，其特征在于，所述參數(shù)設(shè)置模塊包括衰減等級設(shè)置模塊，其用于根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè) 置衰減等級，包括：所述衰減等級的數(shù)值根據(jù)所述參與方的數(shù)量的逐漸增多而減小。9. 根據(jù)權(quán)利要求6所述的音頻合成處理系統(tǒng)，其特征在于，所述參數(shù)設(shè)置模塊包括符號位設(shè)置模塊，其用于根據(jù)參與方的數(shù)量，為所述每一參與方的當前幀的語音差值數(shù)據(jù)設(shè)置符號位，包括：當所述參與方為偶數(shù)時，對其兩兩設(shè)置相反的符號位。10. 根據(jù)權(quán)利要求6所述的音頻合成處理系統(tǒng)，其特征在于，所述混音模塊中包括有:溢出控制模塊，用于在進行語音差值數(shù)據(jù)的累加和上一幀的混音數(shù)據(jù)相加時，進行溢出的控制。
【文檔編號】G10L13/02GK106057191SQ201610334168
【公開日】2016年10月26日
【申請日】2016年5月19日
【發(fā)明人】魏天云, 張偉, 吳秋平
【申請人】廣州頤希頡信息科技有限公司

完整全部詳細技術(shù)資料下載

該技術(shù)已申請專利。僅供學(xué)習(xí)研究，如用于商業(yè)用途，請聯(lián)系技術(shù)所有人。
技術(shù)研發(fā)人員：魏天云;張偉;吳秋平;
技術(shù)所有人：廣州頤希頡信息科技有限公司;
我是此專利的發(fā)明人

上一篇：一種實時語音轉(zhuǎn)換方法和裝置的制造方法
上一篇：一種計算消音微穿孔板參數(shù)的方法

相關(guān)技術(shù)

網(wǎng)友詢問留言已有0條留言

還沒有人留言評論。精彩留言會獲得點贊！

精彩留言，會給你點贊！

音頻處理方法相關(guān)技術(shù)

音頻合成軟件相關(guān)技術(shù)

音頻合成相關(guān)技術(shù)

音頻視頻合成軟件相關(guān)技術(shù)

視頻和音頻合成軟件相關(guān)技術(shù)

視頻音頻合成相關(guān)技術(shù)

欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種音頻合成處理方法及系統(tǒng)的制作方法