反饋延遲網(wǎng)絡音色優(yōu)化的方法
【專利摘要】本發(fā)明涉及一種反饋延遲網(wǎng)絡音色優(yōu)化的方法,在選擇反饋延遲網(wǎng)絡延遲線的延遲系數(shù)時通過以下步驟進行:根據(jù)預設選擇條件選擇確定多個延遲系數(shù)組合;計算多個所述延遲系數(shù)組合所分別對應的多個頻譜平整度值;比較多個所述頻譜平整度值,將其中數(shù)值最大的頻譜平整度值對應的延遲系數(shù)組合作為反饋延遲網(wǎng)絡延遲線的延遲系數(shù)組合。本發(fā)明通過比較多個延遲系數(shù)組合對應的多個所述頻譜平整度值,將其中的數(shù)值最大的頻譜平整度值對應的延遲系數(shù)組合作為反饋延遲網(wǎng)絡延遲線的延遲系數(shù)組合,可以使得輸出信號的音色高度自然。
【專利說明】
反饋延遲網(wǎng)絡音色優(yōu)化的方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于音頻信號處理技術(shù)領(lǐng)域,具體涉及一種反饋延遲網(wǎng)絡音色優(yōu)化的方 法。
【背景技術(shù)】
[0002] 基于耳機及揚聲器的音頻信號的渲染經(jīng)常會用到對于房間混響模擬。其中基于耳 機的植染包括與揚聲器同樣的方法和耳機獨有的耳機雙聲道虛擬環(huán)繞聲的方法。其應用場 景如在安靜的室內(nèi),通過新品信號處理算法,可以通過揚聲器播放進行混響處理的音頻信 號,已達到模擬劇場、山洞的效果。進行此類音頻信號處理可以使用將原信號與期望房間的 混響進行卷積的方法。但在實際應用中,由于房間混響(即沖擊響應)通常為階數(shù)極高的FIR 濾波器,應用時導致算法復雜度升高,效率降低。
[0003] 另外在很多應用中,對于房間的混響需要進行微調(diào)或?qū)崟r變換。沖擊響應卷積的 方法不能滿足此類需求。因此,在實際應用中常使用反饋延遲網(wǎng)絡(Feedback Delay Network,F(xiàn)DN)的方法進行房間混響的模擬。含有3條延遲線的反饋延遲網(wǎng)絡如圖1所示。
[0004] 其中,輸入信號為i,輸出信號為o,M為延遲線的延遲系數(shù)或參數(shù)(即延遲的采樣點 數(shù)),Z為z變換符號,g為增益項,q為反饋矩陣元素。圖2中的系統(tǒng)可以在時域或頻域中使用。 當在時域時,g、q為一實數(shù)。當在頻域時,g、q為一維向量,維度表示頻點。
[0005] 在反饋延遲網(wǎng)絡第一次有信號輸入時,輸入信號i(n)在進入反饋延遲網(wǎng)絡時將分 別輸入至若干個延遲線中。如在圖2中,延遲線的數(shù)量為3條。在經(jīng)過延遲線時輸入信號 將被延遲輸出j個采樣點。在延遲線輸出信號上將加入相應的增益值U,其取值將在后面詳 述。最后所有延遲線上的輸出信號將被疊加輸出,即O(H)。延遲線輸出信號在被疊加之前, 會被同時輸入到反饋系統(tǒng)中。在延遲線的輸出信號被反饋至輸入端之前,延遲線的輸出信 號會經(jīng)過反饋矩陣的混合處理。反饋矩陣的作用為將輸入信號進行混合,使得最終輸出結(jié) 果的隨機性增加。在房間混響模擬的應用中,這種處理將會使輸出信號更具隨機性、更像真 實房間的混響?;旌暇仃嚨妮敵鲂盘枌⒈环答佒料乱粠妮斎攵?,與下一幀的輸入進行疊 加。在疊加后的信號x(n)可以全面表征整個反饋延遲系統(tǒng)的性質(zhì):
[0006] 圖2系統(tǒng)中的X所在點的信號可用公式1表示:
[0007
[0008] 其中,x、q已知。g可由期望的房間反射時間(T60)求得(dB域):
[0009]
[0010] 其中fs為音頻信號的采樣率。
[0011] 到這里,只有M的值還未確定。M的選擇既影響反饋延遲網(wǎng)絡內(nèi)的增益,又影響延遲 時間。實際上,M的選擇最終會影響反饋延遲網(wǎng)絡在還原房間聲學特性的自然度-即人工生 成的房間混響和真實房間的混響間在音色等方面的差別。M選擇不良會導致最終結(jié)果音色 失真,雖然目前有人提出M的一些選擇條件,但根據(jù)該條件選擇M后,在實際應用中,發(fā)現(xiàn)即 使?jié)M足上述要求,最終輸出的音頻信號仍然會有一定的音色失真,嚴重影響聽感。
【發(fā)明內(nèi)容】
[0012]本發(fā)明的目的在于解決上述的技術(shù)問題而提供一種反饋延遲網(wǎng)絡音色優(yōu)化的方 法,旨在利用優(yōu)化算法得到使得輸出信號音色高度自然的延遲線參數(shù)。
[0013]為實現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
[0014] -種反饋延遲網(wǎng)絡音色優(yōu)化的方法,在選擇反饋延遲網(wǎng)絡延遲線的延遲系數(shù)時通 過以下步驟進行;
[0015] 根據(jù)預設選擇條件選擇確定多個延遲系數(shù)組合;
[0016] 計算多個所述延遲系數(shù)組合所分別對應的多個頻譜平整度值;
[0017]比較多個所述頻譜平整度值,將其中的數(shù)值最大的頻譜平整度值對應的延遲系數(shù) 組合作為反饋延遲網(wǎng)絡延遲線的延遲系數(shù)組合。
[0018] 所述根據(jù)預設選擇條件選擇確定多個延遲系數(shù)組合滿足下列條件:
[0019] EiMi彡0.15fs · T60且Max(Mi)彡2.5 · Min(Mi),
[0020] 其中,1彡i彡I,I為延遲線數(shù)量,M表示延遲線系數(shù),I條延遲線互質(zhì),T60為房間混 響,fs為音頻信號的采樣率。
[0021 ]所述頻譜平整度值的計算公式如下:
[0022]
[0023] 其中3 = -f ,Flatness為頻譜平整度,取值范圍為(0,l),fs為音頻信號的采樣率, x(k)為反饋延遲網(wǎng)絡的輸出頻率響應的幅值,k代表頻率。
[0024] 或者,所述頻譜平整度值的計算采用如下公式:
[0025]
[0026] 其中,灰,Flatness為頻譜平整度,取值范圍為(0,1),w = 2Jik,Gi(w)為延遲線的 頻率響應的幅值,f s為音頻信號的采樣率,k代表頻率,I Si < I,I為延遲線數(shù)量。
[0027] 本發(fā)明通過比較多個延遲系數(shù)組合對應的多個所述頻譜平整度值,將其中的數(shù)值 最大的頻譜平整度值對應的延遲系數(shù)組合作為反饋延遲網(wǎng)絡延遲線的延遲系數(shù)組合,可以 使得輸出信號的音色高度自然。
【附圖說明】
[0028] 圖1為含有3條延遲線的反饋延遲網(wǎng)絡的示意圖;
[0029] 圖2為含有3條延遲線的反饋延遲網(wǎng)絡的具體實施示意圖;
[0030] 圖3為滿足現(xiàn)有條件的M對應的頻率響應圖;
[0031]圖4為本發(fā)明優(yōu)化M后的頻率響應圖;
[0032]圖5為滿足現(xiàn)有條件的M對應的時間頻率響應圖;
[0033]圖6為本發(fā)明優(yōu)化M后的時間頻率響應圖。
【具體實施方式】
[0034]下面,結(jié)合實例對本發(fā)明的實質(zhì)性特點和優(yōu)勢作進一步的說明,但本發(fā)明并不局 限于所列的實施例。
[0035] 一種反饋延遲網(wǎng)絡音色優(yōu)化的方法,在選擇反饋延遲網(wǎng)絡延遲線的延遲系數(shù)時通 過以下步驟進行;
[0036] SlOl,根據(jù)預設選擇條件選擇確定多個延遲系數(shù)組合;
[0037] S102,計算多個所述延遲系數(shù)組合所分別對應的多個頻譜平整度值;
[0038] S103,比較多個所述頻譜平整度值,將其中的數(shù)值最大的頻譜平整度值對應的延 遲系數(shù)組合作為反饋延遲網(wǎng)絡延遲線的延遲系數(shù)組合。
[0039] 本發(fā)明通過比較多個延遲系數(shù)組合對應的多個所述頻譜平整度值,將其中的數(shù)值 最大的頻譜平整度值對應的延遲系數(shù)組合作為反饋延遲網(wǎng)絡延遲線的延遲系數(shù)組合,對輸 入信號按此延遲系數(shù)組合進行反饋延遲處理后輸出,從而可以使得輸出信號的音色高度自 然。
[0040] 本發(fā)明中,所述根據(jù)預設選擇條件選擇確定多個延遲系數(shù)組合滿足下列條件:
[0041] EiMi彡0.15fs · T60且Max(Mi)彡2.5 · Min(Mi),
[0042] 其中,彡I,i為正整數(shù),I為延遲線總數(shù)量,M表示延遲線系數(shù)(Delay Line Lengths),I條延遲線互質(zhì),T60為房間混響,fs為音頻信號的采樣率。
[0043] 所述I條延遲線互質(zhì)是指包括多條延遲線,如圖2所示有3條延遲線,M1,M 2,M3,它們 之間兩兩互質(zhì)I1表示第i條延遲線的延遲系數(shù)或參數(shù),即延遲的采樣點數(shù)。該預設選擇條 件是意思是多條延遲線中的延遲項M的總和大于等于0.15*f s*T60。如圖2所示,則為MdM2+ M3 大于等于 0.15*fs*T60
[0044] 通過使預先選擇的延遲線的延遲系數(shù)組合滿足上列條件,然后在利用頻譜平整度 對延遲線的延遲系數(shù)M組合進行選擇,從而在該條件下選擇計算出頻譜平整度最接近理想 狀態(tài)的頻譜平整度值所對應的延遲線的延遲系數(shù)M組合,并利用該延遲線的延遲系數(shù)M組合 作為反饋延遲網(wǎng)絡的延遲優(yōu)化參數(shù)對音色進行優(yōu)化輸出,從而使得輸出信號的音色高度自 然。
[0045] 本發(fā)明中,所述頻譜平整度值的理想的計算公式如下:
[0046]
[0047] 其中,l = f,fs為音頻信號的采樣率,F(xiàn)latness為頻譜平整度,取值范圍為(0,1), 1代表頻譜的絕對平整,X(k)為反饋延遲網(wǎng)絡的輸出頻率響應的幅值,k代表頻率。
[0048] 然而在上述優(yōu)化過程中,通過生成沖擊響應再進行優(yōu)化的方式可能導致模擬時間 變長,為縮短模擬時間,上述優(yōu)化的方法可近似通過頻率響應解析解的近似方式得到。因為 單條延遲反饋線可等效于一個梳狀濾波器,其頻率響應解析解H( z)為:
[0049]
[0050] g為增益如圖1所示,M為延遲線延遲參數(shù),故頻率響應的幅值G(W)為:
[0051]
[0052 ]其中e為自然對數(shù),j為虛數(shù)符號,w為角頻率,故系統(tǒng)總頻響X (k)可近似為:
[0053] x(k)^EiGi(w)
[0054] 其中,W = 2Jik,I<i<I,I為延遲線數(shù)量,所述頻譜平整度Flatness的優(yōu)化計算公 式可以近似為如下:
[0055]
[0056] 通過此近似的優(yōu)化公式可以大大縮短模擬時間,加快進程。
[0057] 頻率響應比較,參見圖3-6所示:
[0058] 圖3是滿足預設選擇條件下選擇的M的頻率響應,圖4是滿足預設選擇條件且使頻 譜平整度值最大條件下的頻率響應,可以看出通過頻譜平整度優(yōu)化的頻譜更平整。
[0059]圖5是滿足預設選擇條件下選擇的M的時間頻率響應,圖6是滿足預設選擇條件且 使頻譜平整度值最大條件下的時間頻率響應,可見通過頻譜平整度優(yōu)化的結(jié)果的時間頻率 譜更均勻、隨機,即更自然,像真實測量的房間Late部分頻響。
[0060]以上所述僅是本發(fā)明的優(yōu)選實施方式,應當指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人 員來說,在不脫離本發(fā)明原理的前提下,還可以做出若干改進和潤飾,這些改進和潤飾也應 視為本發(fā)明的保護范圍。
【主權(quán)項】
1. 一種反饋延遲網(wǎng)絡音色優(yōu)化的方法,其特征在于,在選擇反饋延遲網(wǎng)絡延遲線的延 遲系數(shù)時通過W下步驟進行; 根據(jù)預設選擇條件選擇確定多個延遲系數(shù)組合; 計算多個所述延遲系數(shù)組合所分別對應的多個頻譜平整度值; 比較多個所述頻譜平整度值,將其中的數(shù)值最大的頻譜平整度值對應的延遲系數(shù)組合 作為反饋延遲網(wǎng)絡延遲線的延遲系數(shù)組合。2. 根據(jù)權(quán)利要求1所述反饋延遲網(wǎng)絡音色優(yōu)化的方法,其特征在于,所述根據(jù)預設選擇 條件選擇確定多個延遲系數(shù)組合滿足下列條件: EiMi^O. 15fs ? T60且Max(Mi)《2.5 ? Min(Mi), 其中,為延遲線數(shù)量,M表示延遲線系數(shù),I條延遲線互質(zhì),T60為房間混響,fs 為音頻信號的采樣率。3. 根據(jù)權(quán)利要求1或2所述反饋延遲網(wǎng)絡音色優(yōu)化的方法,其特征在于,所述頻譜平整 度值的計算公式如下:其中natness為頻譜平整度,取值范圍為(0,l),fs為音頻信號的采樣率,X化) 為反饋延遲網(wǎng)絡的輸出頻率響應的幅值,k代表頻率。4. 根據(jù)權(quán)利要求1或2所述反饋延遲網(wǎng)絡音色優(yōu)化的方法,其特征在于,所述頻譜平整 度值的計算采用如下公式?其CFlatness為頻譜平整度,取值范圍為(0,l),w = 2址,Gi(W)為第i條延遲線 的頻率響應的幅值,fs為音頻信號的采樣率,k代表頻率,1《1《1,1為延遲線數(shù)量。
【文檔編號】H04S7/00GK105916095SQ201610374440
【公開日】2016年8月31日
【申請日】2016年5月31日
【發(fā)明人】楊維國, 侯歡, 周寅騰
【申請人】音曼(北京)科技有限公司