一種音頻信號的高頻擴(kuò)展方法和音頻播放器的制造方法
【專利摘要】本發(fā)明公開了一種音頻信號的高頻擴(kuò)展方法和音頻播放器,用于實(shí)現(xiàn)對缺失高頻部分的音頻信號進(jìn)行高頻擴(kuò)展,滿足用戶對高品質(zhì)音頻的要求。本發(fā)明實(shí)施例提供一種音頻信號的高頻擴(kuò)展方法,包括:對原始的第一音頻信號進(jìn)行上采樣,得到第二音頻信號;獲取所述第二音頻信號的低頻段頻譜,并根據(jù)所述低頻段頻譜對所述第二音頻信號進(jìn)行高頻段頻譜的估計(jì),得到高頻段頻譜包絡(luò)線;按照所述高頻段頻譜包絡(luò)線將所述低頻段頻譜拷貝到所述第二音頻信號的高頻段,得到第三音頻信號;對所述第三音頻信號進(jìn)行能量調(diào)整,得到第四音頻信號。
【專利說明】
一種音頻信號的高頻擴(kuò)展方法和音頻播放器
技術(shù)領(lǐng)域
[0001] 本發(fā)明涉及音頻處理技術(shù)領(lǐng)域,尤其涉及一種音頻信號的高頻擴(kuò)展方法和音頻播 放器。
【背景技術(shù)】
[0002] 人耳能聽到的聲音的頻率范圍大約為2-20千赫茲(Kilo Hertz,KHz),普通人對音 頻信號的高頻部分不太敏感,人耳雖然聽不到頻率超過20KHz的聲音,但有些人能感覺到。 在存儲和傳輸音頻文件時(shí),為了節(jié)約空間和提高傳輸效率,往往要去掉人耳不太敏感的高 頻成分,這雖然損失了一定的音質(zhì),但是可以大大提高音頻文件的壓縮率,這種權(quán)衡迎合了 市場的需求,例如大部分風(fēng)靡一時(shí)的MP3音頻文件就將高于16KHz的高頻部分去掉,音質(zhì)雖 然下降了一些,但并不影響普通人欣賞音頻文件,而且音頻文件占用較小的存儲空間,MP3 也趁著互聯(lián)網(wǎng)的東風(fēng)流行起來,大大滿足了普通人對音樂欣賞的需求。
[0003] 隨著人們消費(fèi)水平的提高,人們對音頻文件的品質(zhì)要求也日益提高,人們越來越 喜歡高分辨率、頻域成分完整的、高保真的高品質(zhì)音樂。但是這種高品質(zhì)的音頻文件往往收 費(fèi)昂貴,因此對大部分免費(fèi)的但缺失了高頻成分的音頻文件進(jìn)行合理擴(kuò)展以提高音頻的播 放效果就成了普通用戶的極大需求,而現(xiàn)有技術(shù)中的音頻播放器只能播放缺失高頻成分的 音頻文件,而無法對這些音頻文件進(jìn)行高頻擴(kuò)展。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明實(shí)施例提供了一種音頻信號的高頻擴(kuò)展方法和音頻播放器,用于實(shí)現(xiàn)對缺 失高頻部分的音頻信號進(jìn)行高頻擴(kuò)展,滿足用戶對高品質(zhì)音頻的要求。
[0005] 為解決上述技術(shù)問題,本發(fā)明實(shí)施例提供以下技術(shù)方案:
[0006] 第一方面,本發(fā)明實(shí)施例提供一種音頻信號的高頻擴(kuò)展方法,包括:
[0007] 對原始的第一音頻信號進(jìn)行上采樣,得到第二音頻信號;
[0008] 獲取所述第二音頻信號的低頻段頻譜,并根據(jù)所述低頻段頻譜對所述第二音頻信 號進(jìn)行高頻段頻譜的估計(jì),得到高頻段頻譜包絡(luò)線;
[0009] 按照所述高頻段頻譜包絡(luò)線將所述低頻段頻譜拷貝到所述第二音頻信號的高頻 段,得到第二首頻?目號;
[0010] 對所述第三音頻信號進(jìn)行能量調(diào)整,得到第四音頻信號。
[0011] 第二方面,本發(fā)明實(shí)施例還提供一種音頻播放器,包括:
[0012] 上采樣模塊,用于對原始的第一音頻信號進(jìn)行上采樣,得到第二音頻信號;
[0013] 高頻估計(jì)模塊,用于獲取所述第二音頻信號的低頻段頻譜,并根據(jù)所述低頻段頻 譜對所述第二音頻信號進(jìn)行高頻段頻譜的估計(jì),得到高頻段頻譜包絡(luò)線;
[0014] 頻譜拷貝模塊,用于按照所述高頻段頻譜包絡(luò)線將所述低頻段頻譜拷貝到所述第 二音頻信號的高頻段,得到第三音頻信號;
[0015] 能量調(diào)整模塊,用于對所述第三音頻信號進(jìn)行能量調(diào)整,得到第四音頻信號。
[0016] 從以上技術(shù)方案可以看出,本發(fā)明實(shí)施例具有以下優(yōu)點(diǎn):
[0017] 在本發(fā)明實(shí)施例中,首先對原始的第一音頻信號進(jìn)行上采樣,得到第二音頻信號, 然后獲取第二音頻信號的低頻段頻譜,并根據(jù)低頻段頻譜對第二音頻信號進(jìn)行高頻段頻譜 的估計(jì),得到高頻段頻譜包絡(luò)線,接下來按照高頻段頻譜包絡(luò)線將低頻段頻譜拷貝到第二 音頻信號的高頻段,得到第三音頻信號,最后對第三音頻信號進(jìn)行能量調(diào)整,得到第四音頻 信號。本發(fā)明實(shí)施例中第一音頻信號作為原始信號經(jīng)過上采樣之后,估計(jì)出了第二音頻信 號的高頻段頻譜包絡(luò)線,第二音頻信號在高頻段拷貝進(jìn)行低頻段頻譜后再進(jìn)行能量調(diào)整, 可以得到第四音頻信號,第四音頻信號中攜帶有高頻段的頻譜信息,當(dāng)音頻播放器播放該 第四音頻信號時(shí)可以提高音頻信號的播放效果。
【附圖說明】
[0018] 為了更清楚地說明本發(fā)明實(shí)施例中的技術(shù)方案,下面將對實(shí)施例描述中所需要使 用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于 本領(lǐng)域的技術(shù)人員來講,還可以根據(jù)這些附圖獲得其他的附圖。
[0019] 圖1為本發(fā)明實(shí)施例提供的一種音頻信號的高頻擴(kuò)展方法的流程方框示意圖;
[0020] 圖2為本發(fā)明實(shí)施例提供的另一種音頻信號的高頻擴(kuò)展方法的流程方框示意圖;
[0021] 圖3為本發(fā)明實(shí)施例中對第一音頻信號進(jìn)行上采樣的應(yīng)用場景示意圖;
[0022] 圖4為本發(fā)明實(shí)施例提供的另一種音頻信號的高頻擴(kuò)展方法的流程方框示意圖;
[0023] 圖5為本發(fā)明實(shí)施例提供的第二音頻信號的頻譜包絡(luò)線示意圖;
[0024] 圖6為本發(fā)明實(shí)施例提供的一種頻譜擬合過程的示意圖;
[0025] 圖7-a為本發(fā)明實(shí)施例提供的一種音頻播放器的組成結(jié)構(gòu)示意圖;
[0026] 圖7-b為本發(fā)明實(shí)施例提供的一種上采樣模塊的組成結(jié)構(gòu)示意圖;
[0027] 圖7-c為本發(fā)明實(shí)施例提供的另一種音頻播放器的組成結(jié)構(gòu)示意圖;
[0028] 圖7-d為本發(fā)明實(shí)施例提供的一種高頻估計(jì)模塊的組成結(jié)構(gòu)示意圖;
[0029] 圖7-e為本發(fā)明實(shí)施例提供的另一種音頻播放器的組成結(jié)構(gòu)示意圖。
【具體實(shí)施方式】
[0030] 本發(fā)明實(shí)施例提供了一種音頻信號的高頻擴(kuò)展方法和音頻播放器,用于實(shí)現(xiàn)對缺 失高頻部分的音頻信號進(jìn)行高頻擴(kuò)展,滿足用戶對高品質(zhì)音頻的要求。
[0031] 為使得本發(fā)明的發(fā)明目的、特征、優(yōu)點(diǎn)能夠更加的明顯和易懂,下面將結(jié)合本發(fā)明 實(shí)施例中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,下面所描述 的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而非全部實(shí)施例。基于本發(fā)明中的實(shí)施例,本領(lǐng)域的 技術(shù)人員所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
[0032] 本發(fā)明的說明書和權(quán)利要求書及上述附圖中的術(shù)語"第一"、"第二"等是用于區(qū)別 類似的對象,而不必用于描述特定的順序或先后次序。應(yīng)該理解這樣使用的術(shù)語在適當(dāng)情 況下可以互換,這僅僅是描述本發(fā)明的實(shí)施例中對相同屬性的對象在描述時(shí)所采用的區(qū)分 方式。此外,術(shù)語"包括"和"具有"以及他們的任何變形,意圖在于覆蓋不排他的包含,以便 包含一系列單元的過程、方法、系統(tǒng)、產(chǎn)品或設(shè)備不必限于那些單元,而是可包括沒有清楚 地列出的或?qū)τ谶@些過程、方法、產(chǎn)品或設(shè)備固有的其它單元。
[0033] 以下分別進(jìn)行詳細(xì)說明。
[0034] 本發(fā)明音頻信號的高頻擴(kuò)展方法的一個(gè)實(shí)施例,可應(yīng)用于音頻播放器對缺失高頻 部分的音頻信號的擴(kuò)展中,請參閱圖1所示,本發(fā)明一個(gè)實(shí)施例提供的音頻信號的高頻擴(kuò)展 方法,可以包括如下步驟:
[0035] 101、對原始的第一音頻信號進(jìn)行上采樣,得到第二音頻信號。
[0036] 在本發(fā)明實(shí)施例中,第一音頻信號是輸入到音頻播放器的原始音頻文件,該第一 音頻信號可以是缺失高頻部分的音頻信號,若音頻播放器直接播放該第一音頻信號,由于 頻域的不完整,播放效果差,因此可以根據(jù)本發(fā)明實(shí)施例提供的音頻信號的高頻擴(kuò)展方法 進(jìn)行高頻部分的擴(kuò)展。本發(fā)明實(shí)施例中,第一音頻信號為時(shí)域信號,可以對第一音頻信號進(jìn) 行上采樣,得到第二音頻信號,通過第一音頻信號的上采樣,可以在第一音頻信號上內(nèi)插一 些符號,從而可以得到第二音頻信號,該第二音頻信號相對于原始的第一音頻信號,在時(shí)域 上得到了擴(kuò)展。
[0037] 102、獲取第二音頻信號的低頻段頻譜,并根據(jù)低頻段頻譜對第二音頻信號進(jìn)行高 頻段頻譜的估計(jì),得到高頻段頻譜包絡(luò)線。
[0038] 在本發(fā)明實(shí)施例中,將第一音頻信號轉(zhuǎn)換為第二音頻信號之后,先從該第二音頻 信號中提取出低頻段頻譜,其中,低頻段頻譜是指在第二音頻信號中已經(jīng)存在的頻譜分量, 該低頻段頻譜攜帶有頻譜能量信息,通過低頻段頻譜可以播放出在第二音頻信號中攜帶的 內(nèi)容信息。通常情況下,第二音頻信號的低頻段頻譜的振幅絕對值的自然對數(shù)值從低頻率 到高頻率呈現(xiàn)出的變化規(guī)律是線性遞減,因此根據(jù)該低頻段頻譜可以對第二音頻信號進(jìn)行 高頻段頻譜的估計(jì),從而可以生成第二音頻信號的高頻段頻譜包絡(luò)線,該高頻段頻譜包絡(luò) 線是第二音頻信號中缺失的高頻部分的振幅絕對值的自然對數(shù)值隨著時(shí)間變化的曲線,通 過估計(jì)出第二音頻信號的高頻段頻譜包絡(luò)線可以確定在第二音頻信號中缺失的高頻信號 的大致區(qū)域。
[0039] 103、按照高頻段頻譜包絡(luò)線將低頻段頻譜拷貝到第二音頻信號的高頻段,得到第 三音頻信號。
[0040] 在本發(fā)明實(shí)施例中,從第二音頻信號中生成高頻段頻譜包絡(luò)線之后,可以按照該 高頻段頻譜包絡(luò)線將低頻段頻譜拷貝到第二音頻信號的高頻段中,此時(shí)高頻段中填充有頻 譜信息的第二音頻信號可以稱為第三音頻信號。因此,本發(fā)明實(shí)施例中在第二音頻信號的 高頻段中填充低頻段頻譜,可以使得第二音頻信號中缺失的高頻部分得到有效擴(kuò)展,從而 使得第三音頻信號中既包含低頻部分,也包括高頻部分,這樣的第三音頻信號在播放時(shí)可 以呈現(xiàn)出高品質(zhì)的音質(zhì)效果。
[0041] 104、對第三音頻信號進(jìn)行能量調(diào)整,得到第四音頻信號。
[0042]在本發(fā)明實(shí)施例中,獲取到第三音頻信號之后,還可以對第三音頻信號進(jìn)行能量 調(diào)整,因?yàn)橥ㄟ^前述步驟中高頻段的頻譜填充,在第三音頻信號的高頻段填充的是低頻段 頻譜,而已知的是,低頻段頻譜往往有較大的能量,若在高頻段中繼續(xù)使用大能量的頻譜, 在第三音頻信號播放時(shí)會造成刺耳聲,用戶感覺不適應(yīng),因此需要降低第三音頻信號中的 高頻部分的能量,以適應(yīng)用戶的普遍需求。其中能量調(diào)整的具體方式可以有多種,例如,直 接按照預(yù)置的比例關(guān)系降低第三音頻信號中高頻段的能量,或者設(shè)置能量調(diào)整系數(shù),按照 該能量調(diào)整系數(shù)來調(diào)整第三音頻信號,從而可以生成第四音頻信號。第四音頻信號和第三 音頻信號中都攜帶有高頻段的頻譜信息,當(dāng)音頻播放器播放該第四音頻信號時(shí)可以提高音 頻信號的播放效果,使用戶可以欣賞到高品質(zhì)的音頻文件。本發(fā)明實(shí)施例中通過音頻播放 器側(cè)的編碼技術(shù)可以實(shí)現(xiàn)缺失高頻部分的音頻信號的高頻擴(kuò)展,使用戶不需要支付昂貴的 費(fèi)用而只需要使用本發(fā)明實(shí)施例提供的音頻播放器就可以享受到高品質(zhì)的音頻文件,使得 本發(fā)明實(shí)施例提供的音頻播放器具有較高的競爭力。
[0043] 通過前述實(shí)施例對本發(fā)明的詳細(xì)說明可知,首先對原始的第一音頻信號進(jìn)行上采 樣,得到第二音頻信號,然后獲取第二音頻信號的低頻段頻譜,并根據(jù)低頻段頻譜對第二音 頻信號進(jìn)行高頻段頻譜的估計(jì),得到高頻段頻譜包絡(luò)線,接下來按照高頻段頻譜包絡(luò)線將 低頻段頻譜拷貝到第二音頻信號的高頻段,得到第三音頻信號,最后對第三音頻信號進(jìn)行 能量調(diào)整,得到第四音頻信號。本發(fā)明實(shí)施例中第一音頻信號作為原始信號經(jīng)過上采樣之 后,估計(jì)出了第二音頻信號的高頻段頻譜包絡(luò)線,第二音頻信號在高頻段拷貝進(jìn)行低頻段 頻譜后再進(jìn)行能量調(diào)整,可以得到第四音頻信號,第四音頻信號中攜帶有高頻段的頻譜信 息,當(dāng)音頻播放器播放該第四音頻信號時(shí)可以提高音頻信號的播放效果。
[0044] 前述實(shí)施例介紹了本發(fā)明提供的一種音頻信號的高頻擴(kuò)展方法,接下來以另一個(gè) 實(shí)施例介紹本發(fā)明提供的音頻信號的高頻擴(kuò)展方法,接下來請參閱如圖2所示,本發(fā)明一個(gè) 實(shí)施例提供的音頻信號的高頻擴(kuò)展方法,可以包括如下步驟:
[0045] 201、對第一音頻信號進(jìn)行分幀,得到多個(gè)幀的第一音頻信號,多個(gè)幀的第一音頻 信號中相鄰兩幀的第一音頻信號之間有重疊。
[0046]在本發(fā)明的一些實(shí)施例中,原始的第一音頻信號是時(shí)域信號,首先對該第一音頻 信號進(jìn)行分幀,例如可以將第一音頻信號每N個(gè)比特為一幀,從而可以得到多個(gè)幀的第一音 頻信號,多個(gè)幀的第一音頻信號中相鄰兩幀的第一音頻信號之間有重疊,假設(shè)相鄰兩幀的 第一音頻信號之間的重疊區(qū)域的長度為2L。
[0047] 202、對每一幀的第一音頻信號分別進(jìn)行離散余弦變換(Discrete Cosine Transf orm,DCT)處理,得到DCT處理后的第一音頻信號。
[0048]在本發(fā)明的一些實(shí)施例中,對于每一幀的第一音頻信號可以依次轉(zhuǎn)換到DCT域。例 如,對每幀進(jìn)行DCT變換時(shí),可以根據(jù)matlab進(jìn)行DCT處理。例如,可以采用如下公式進(jìn)行DCT 的計(jì)算,
[0049]
[0050] 其中:ω(1〇表示變換因子,X(k)表示第k個(gè)DCT處理后的第一音頻信號,x(n)表示 DCT處理之前的第一音頻信號,N表示每一幀的第一音頻信號的長度。
[0051] 在本發(fā)明的一些實(shí)施例中,變換因子ω(1〇可以通過如下公式計(jì)算:
[0052]
其中,對于第1個(gè)DCT處理后的第一音頻信號,變換因子ω(1〇的取值為=
在k為 其它取值的情況下,變換因子ω (k)的取值爻
[0054]不限定的是,上述變換因子還可以有其它取值實(shí)現(xiàn)方式,只要能夠用于計(jì)算出X (k)即可。
[0055] 203、根據(jù)采樣率轉(zhuǎn)換比在DCT處理后的每幀第一音頻信號的尾端添加0,得到補(bǔ)0 后的第一音頻信號,采樣率轉(zhuǎn)換比為目標(biāo)采樣率和原采樣率的比值。
[0056]在本發(fā)明的一些實(shí)施例中,得到每一幀的DCT處理后的第一音頻信號之后,可以根 據(jù)預(yù)先配置的采樣率轉(zhuǎn)換比計(jì)算需要在每幀第一音頻信號的尾端添加〇的個(gè)數(shù),從而得到 補(bǔ)0后的第一音頻信號,具體的,該采樣率轉(zhuǎn)換比可以是目標(biāo)采樣率和原采樣率的比值,例 如采樣率轉(zhuǎn)換比可以表示為V D,I表示目標(biāo)采樣率,D表示原采樣率。舉例說明如下,將采樣 率為48KHz的音頻文件上采樣至192KHz,則原采樣率為48KHz,目標(biāo)采樣率為192KHz。
[0057]在本發(fā)明的一些實(shí)施例中,DCT處理后的每幀第一音頻信號的尾端添加0可以實(shí)現(xiàn) 在DCT域?qū)Φ谝灰纛l信號的擴(kuò)展,N個(gè)樣本點(diǎn)進(jìn)行DCT變換后得到N條譜線,假設(shè)采樣率轉(zhuǎn)換 比為1A,那么在X(k)后添加N 1-N個(gè)0得到上采樣的頻譜Y(k):
[0058]
[0059] 其中NVN=VD,例如將采樣率為44. IKHz的音頻上采樣為192KHz音頻,那么Λ/Ν= 192/44.1=640/147^4.35374〇
[ΟΟ?Ο] 204、對補(bǔ)0后的第一音頻信號進(jìn)行逆離散余弦轉(zhuǎn)換(Inverse Discrete Cosine Transformation,IDCT)處理,得到IDCT處理后的第一音頻信號。
[0061 ]在本發(fā)明的一些實(shí)施例中,在第一音頻信號中補(bǔ)0之后,由于步驟202中對第一音 頻信號進(jìn)行了DCT處理,再補(bǔ)0之后還需要對第一音頻信號進(jìn)行IDCT處理,從而可以得到 IDCT處理后的第一音頻信號。
[0062] 舉例說明如下,補(bǔ)0后的第一音頻信號為Y(k),可以根據(jù)matIab進(jìn)行IDCT處理,對Y (k)用IDCT函數(shù)進(jìn)行IDCT變換,并乘以縮放系I
Γ以得到上采樣的時(shí)域信號y(n):
[0063]
[0064] 205、將所有幀的IDCT處理后的第一音頻信號按照首尾拼接的方式連接起來,得到 第二音頻信號。
[0065]在本發(fā)明的一些實(shí)施例中,通過前述方式計(jì)算出每一幀的IDCT處理后的第一音頻 信號之后,可以得到所有幀的IDCT處理后的第一音頻信號,然后可以對相鄰兩個(gè)幀的第一 音頻信號進(jìn)行首尾拼接,所有幀的IDCT處理后的第一音頻信號連接起來之后,可以得到第 二音頻信號。
[0066]需要說明的是,在本發(fā)明前述步驟中,對原始的第一音頻信號進(jìn)行上采樣得到第 二音頻信號的方式進(jìn)行了詳細(xì)說明,不限定的是,本發(fā)明實(shí)施例還可以采用其它的上采樣 方式來生成第二音頻信號。例如,在進(jìn)行高頻擴(kuò)展時(shí)首先要進(jìn)行音頻上采樣,例如把采樣率 為48KHz的音頻上采樣至192KHz的音頻,可以使用有限長單位沖激響應(yīng)濾波器(Finite Impulse Response,F(xiàn)IR)方式在時(shí)域中實(shí)現(xiàn)上采樣,但是這種方式相對于前述的本發(fā)明實(shí) 施例,會比較消耗硬件資源,而前述舉例說明中本發(fā)明則采用在DCT頻域里加0的方式進(jìn)行 上采樣,節(jié)約了硬件資源。另外在對長序列音頻信號進(jìn)行頻域上采樣時(shí)采用分幀重疊技術(shù), 接下來本發(fā)明舉例說明如何選擇合適的幀長和重疊區(qū)域長度使得序列總長誤差降為〇。
[0067]在本發(fā)明的一些實(shí)施例中,步驟204對補(bǔ)0后的第一音頻信號進(jìn)行逆離散余弦轉(zhuǎn)換 IDCT處理,得到IDCT處理后的第一音頻信號之后,本發(fā)明實(shí)施例提供的音頻信號的高頻擴(kuò) 展方法,還可以包括如下步驟:
[0068] Al、將IDCT處理后的第一音頻信號的首端和尾端剪切掉,得到剪切掉首尾端的第 一音頻信號。
[0069]其中,當(dāng)IDCT處理后的第一音頻信號的序列長度很長時(shí),為了避免重疊區(qū)域造成 的上采樣后時(shí)域信號的壓縮或者拉伸,還可以對IDCT處理后的第一音頻信號進(jìn)行首端和尾 端的剪切處理,從而可以得到剪切掉首尾端的第一音頻信號,將IDCT處理后的第一音頻信 號的首端和尾端剪切掉,可以避免音頻信號的壓縮或者拉伸。
[0070] 進(jìn)一步的,在本發(fā)明的一些實(shí)施例中,步驟Al中,IDCT處理后的第一音頻信號中剪 切掉的首端和尾端的長度均為U,其中1^的取值通過如下公式計(jì)算得到:
[0071]
[0072]其中,1^的取值為正整數(shù),多個(gè)幀的第一音頻信號中相鄰兩幀的第一音頻信號之 間的重疊區(qū)域的長度為2L,I表示目標(biāo)采樣率,D表示原采樣率。請參閱圖3所示,為本發(fā)明實(shí) 施例中對第一音頻信號進(jìn)行上采樣的應(yīng)用場景示意圖。舉例說明如下,第一音頻信號作為 原音頻序列,在幀P、幀P+1、幀P+2中,每個(gè)幀中都包括N個(gè)點(diǎn),每個(gè)幀的首端和尾端與相鄰幀 的幀間重疊區(qū)域?yàn)?L,經(jīng)過上采樣之后的第一音頻信號中包括N 1個(gè)點(diǎn),在每個(gè)幀中首端和 尾端的舍棄區(qū)域長度SL1,將每幀y(n)首尾兩端的L1個(gè)樣本去掉,該L 1 = VDXU然后各幀 首尾連接起來形成最后上采樣的長序列信號。
[0073]需要說明的是,在選擇舍棄長度L1和重疊區(qū)域2L時(shí)不允許出現(xiàn)小數(shù),即需要使I X L是D的整數(shù)倍,例如在將采樣率為44. IKHz的音頻上采樣為192KHz的音頻時(shí),因?yàn)樯喜蓸颖?例為I/D= 192/44.1 =640/147,所以為確保沁和1^為整數(shù),N和L必須為147的倍數(shù),因此可以 取幀長N = 2352,L=147作為一組合適值,如果出現(xiàn)小數(shù),則上采樣后的時(shí)域信號會有輕微 壓縮或拉伸現(xiàn)象,序列越長越嚴(yán)重。
[0074]在本發(fā)明實(shí)施例執(zhí)行步驟Al的實(shí)現(xiàn)場景下,步驟205將所有幀的IDCT處理后的第 一音頻信號按照首尾拼接的方式連接起來,得到第二音頻信號,具體為:
[0075] B1、將所有幀的剪切掉首尾端的第一音頻信號按照首尾拼接的方式連接起來,得 到第二音頻信號。
[0076] 也就是說,若對第一音頻信號的首尾端進(jìn)行了剪切,那么在所有幀的第一音頻信 號進(jìn)行首尾拼接時(shí),需要對第一音頻信號新生成的首尾端進(jìn)行拼接,相鄰幀的第一音頻信 號拼接完成后可以生成第二音頻信號。
[0077] 206、獲取第二音頻信號的低頻段頻譜,并根據(jù)低頻段頻譜對第二音頻信號進(jìn)行高 頻段頻譜的估計(jì),得到高頻段頻譜包絡(luò)線。
[0078] 207、按照高頻段頻譜包絡(luò)線將低頻段頻譜拷貝到第二音頻信號的高頻段,得到第 三音頻信號。
[0079] 208、對第三音頻信號進(jìn)行能量調(diào)整,得到第四音頻信號。
[0080] 在本發(fā)明的一些實(shí)施例中,步驟205執(zhí)行之后,可以執(zhí)行步驟206至步驟208,步驟 206至步驟208的實(shí)現(xiàn)方式與前述實(shí)施例中步驟102至步驟104的實(shí)現(xiàn)方式相類似,此處不再 贅述。
[0081] 通過前述實(shí)施例對本發(fā)明的詳細(xì)說明可知,本發(fā)明實(shí)施例中第一音頻信號作為原 始信號進(jìn)行DCT處理,然后再添加0,可以實(shí)現(xiàn)對第一音頻信號的擴(kuò)展,最后再進(jìn)行IDCT處理 后對第一音頻信號進(jìn)行首尾拼接,得到第二音頻信號,整個(gè)上采樣過程占用的硬件資源較 少,并且得到的第二音頻信號的序列總長誤差可以消減為0。估計(jì)出了第二音頻信號的高頻 段頻譜包絡(luò)線,第二音頻信號在高頻段拷貝進(jìn)行低頻段頻譜后再進(jìn)行能量調(diào)整,可以得到 第四音頻信號,第四音頻信號中攜帶有高頻段的頻譜信息,當(dāng)音頻播放器播放該第四音頻 信號時(shí)可以提高音頻信號的播放效果。
[0082] 前述實(shí)施例介紹了本發(fā)明提供的一種音頻信號的高頻擴(kuò)展方法,接下來以另一個(gè) 實(shí)施例介紹本發(fā)明提供的音頻信號的高頻擴(kuò)展方法,接下來請參閱如圖4所示,本發(fā)明一個(gè) 實(shí)施例提供的音頻信號的高頻擴(kuò)展方法,可以包括如下步驟:
[0083] 401、對原始的第一音頻信號進(jìn)行上采樣,得到第二音頻信號。
[0084]在本發(fā)明的一些實(shí)施例中,步驟401的實(shí)現(xiàn)方式與前述實(shí)施例中步驟101的實(shí)現(xiàn)方 式相類似,此處不再贅述。
[0085] 402、對第二音頻信號進(jìn)行分幀,得到多個(gè)幀的第二音頻信號。
[0086]在本發(fā)明的一些實(shí)施例中,得到第二音頻信號之后,對該第二音頻信號進(jìn)行分幀, 例如可以將第二音頻信號分為多個(gè)幀,對于每個(gè)幀的第二音頻信號分別執(zhí)行后續(xù)步驟403 至步驟405中描述的高頻段頻譜包絡(luò)線的生成方式。
[0087] 403、對每一幀的第二音頻信號進(jìn)行修正離散余弦變換(Modified Discrete Cosine Transform,MDCT)處理,得到MDCT處理后的第二音頻信號。
[0088] 在本發(fā)明的一些實(shí)施例中,每一個(gè)幀的第二音頻信號轉(zhuǎn)換到MDCT頻域,從而得到 MDCT處理后的第二音頻信號,通過MDCT的變換方式,可以實(shí)現(xiàn)從時(shí)域到頻域的轉(zhuǎn)換,MDCT處 理后的第二音頻信號是包括多個(gè)頻譜信息的頻域信號。
[0089] 404、米用隨機(jī)米樣檢驗(yàn)(RANdom Sample Consensus,RANSAC)算法對MDCT處理后 的第二音頻信號的低頻段頻譜的振幅絕對值的自然對數(shù)值進(jìn)行直線擬合,得到低頻段頻譜 包絡(luò)線,低頻段頻譜包括:處于MDCT處理后的第二音頻信號的有效截止頻率之前的頻譜段。
[0090] 在本發(fā)明的一些實(shí)施例中,得到MDCT處理后的第二音頻信號之后,可以采用 RANSAC算法對MDCT處理后的第二音頻信號的低頻段頻譜的振幅絕對值的自然對數(shù)值進(jìn)行 直線擬合,得到低頻段頻譜包絡(luò)線。其中,低頻段頻譜可以通過計(jì)算第二音頻信號的有效截 止頻率的方式來得到,處于MDCT處理后的第二音頻信號的有效截止頻率之前的頻譜段就可 以構(gòu)成低頻段頻譜。
[0091] 405、按照低頻段頻譜包絡(luò)線對應(yīng)的直線方程估計(jì)MDCT處理后的第二音頻信號的 高頻段頻譜,得到高頻段頻譜包絡(luò)線。
[0092] 在發(fā)明的一些實(shí)施例中,計(jì)算出低頻段頻譜包絡(luò)線對應(yīng)的直線方程后,根據(jù)該直 線方程可以估計(jì)出MDCT處理后的第二音頻信號的高頻段頻譜,從而生成第二音頻信號中的 高頻段頻譜包絡(luò)線,該高頻段頻譜包絡(luò)線中可以包括第二音頻信號中需要擴(kuò)展的高頻部分 分量。
[0093]舉例說明如下,在音頻編碼壓縮的方案可以基于MDCT完成,如圖5所示,圖5為本發(fā) 明實(shí)施例提供的第二音頻信號的頻譜包絡(luò)線示意圖,在MDCT頻域,頻譜的In I X[n] I包絡(luò)線 大致是線性遞減的,根據(jù)這一特征,第二音頻信號中缺失的高頻部分也遵循這一規(guī)律,具體 可以先將上采樣之后得到的第二音頻信號(為時(shí)域信號)分幀,每幀轉(zhuǎn)換到MDCT頻域得到X [n],在X[n]中,可以用較小的正值KT 9代替0,以便后續(xù)過程能夠計(jì)算出對應(yīng)的ln|X[n]|,再 求得有效截止頻率,然后選取截止頻率前的一些譜線的ln|X[n] I值進(jìn)行直線擬合作為低頻 段頻譜包絡(luò)線。在圖5中,豎直的虛線表示擴(kuò)展后的高頻段頻譜在多個(gè)頻點(diǎn)的頻譜線,每條 頻譜線的對應(yīng)值是該頻譜線的頻率點(diǎn)對應(yīng)的振幅絕對值的自然對數(shù)值,斜虛線表示直線擬 合后得到的頻譜包絡(luò)線。在擬合直線時(shí),先將ln|X[n] I曲線的有效截止頻率前的譜線分成 幾段,每段求最大值,然后用這些最大值對應(yīng)的點(diǎn)進(jìn)行直線擬合,設(shè)擬合出來的直線方程為 y = a*x+b,其中X為譜線序號,y為譜線絕對值的自然對數(shù)值,a為斜率,b為截距,大部分情況 下,擬合出來的直線斜率為逆,即a〈0。在用每段的最大值點(diǎn)進(jìn)行直線擬合時(shí),可以采用 RANSAC算法,從而有效應(yīng)付離群點(diǎn)的影響。請參閱圖6所示,為本發(fā)明實(shí)施例提供的一種頻 譜擬合過程的示意圖,圖6中,標(biāo)記為號的點(diǎn)表示在頻譜分組中的最大值點(diǎn),標(biāo)記為圓圈 的點(diǎn)為分組的邊界點(diǎn),點(diǎn)畫線表示用RANSAC方法擬合得到的直線。
[0094]在本發(fā)明的一些實(shí)施例中,步驟404采用RANSAC算法對MDCT處理后的第二音頻信 號的低頻段頻譜進(jìn)行直線擬合,得到低頻段頻譜包絡(luò)線之后,本發(fā)明實(shí)施例提供的音頻信 號的高頻擴(kuò)展方法,還可以包括如下步驟:
[0095] C1、根據(jù)預(yù)置的頻譜坐標(biāo)系中的最小值點(diǎn)、有效截止頻率在頻譜坐標(biāo)系中的有效 值點(diǎn)確定直線方程的校正參數(shù);
[0096] C2、根據(jù)校正參數(shù)對低頻段頻譜包絡(luò)線對應(yīng)的直線方程進(jìn)行參數(shù)調(diào)整。
[0097]在本發(fā)明的上述實(shí)施例中,當(dāng)?shù)皖l段頻譜包絡(luò)線對應(yīng)的直線方程中斜率為正值 時(shí),還可以對該直線方程的參數(shù)進(jìn)行校正,先通過步驟Cl的方式計(jì)算出校正參數(shù),該校正參 數(shù)由頻譜坐標(biāo)系中的最小值點(diǎn)、有效截止頻率在頻譜坐標(biāo)系中的有效值點(diǎn)這兩個(gè)點(diǎn)來確 定,通過最小點(diǎn)和有效值點(diǎn)可以計(jì)算出一個(gè)斜率值作為校正參數(shù)。舉例說明如下,若擬合出 來的直線方程為y = a*x+b,大部分情況下,擬合出來的直線斜率為負(fù),即a〈0,但有的幀中, 會存在a>0的情況,此時(shí)就需要對a、b進(jìn)行修正,修正的方式為:在頻譜坐標(biāo)系最右端設(shè)立一 個(gè)最小值點(diǎn)(kNum,In(2~ (-MBi ts))),求取該點(diǎn)與有效截止頻率點(diǎn)(k。,In IX[kc ] I )確定的 校正參數(shù),用該校正參數(shù)代替原參數(shù)a,其中kNum為譜線的總數(shù)量,MBits為采樣位數(shù),例如 一般為16或24。
[0098]進(jìn)一步的,在本發(fā)明的一些實(shí)施例中,處于MDCT處理后的第二音頻信號的有效截 止頻率可以通過如下方式獲取:
[0099] Dl、讀取預(yù)先緩沖的T個(gè)幀的第二音頻信號,并獲取T個(gè)幀中每一個(gè)幀的第二音頻 信號的對應(yīng)于多個(gè)頻率點(diǎn)的頻譜線,T的取值為自然數(shù);
[0100] D2、對于T個(gè)幀中的每一個(gè)幀都按照如下對第一幀的處理方式確定出每一個(gè)幀的 有效截止頻率:從第一幀的最后一條頻譜線往前開始搜索,找到第一頻譜線對應(yīng)的頻率作 為第一幀的有效截止頻率,第一頻譜線為第一幀的第二音頻信號的對應(yīng)于多個(gè)頻率點(diǎn)的頻 譜線中第一條其振幅絕對值的自然對數(shù)值大于一預(yù)置門限的頻譜線,第一幀為T個(gè)幀中的 任意一個(gè)幀;
[0101] D3、獲取到T個(gè)幀中每一個(gè)幀的有效截止頻率之后,確定T個(gè)幀的有效截止頻率中 的最大值作為全局截止頻率;
[0102] D4、從全局截止頻率開始往前搜索MDCT處理后的第二音頻信號的頻譜線,找到第 一條其振幅絕對值的自然對數(shù)值大于另一預(yù)置門限的頻譜線對應(yīng)的頻率點(diǎn)作為MDCT處理 后的第二音頻信號的有效截止頻率。
[0103] 其中,預(yù)先緩存T個(gè)幀的第二音頻信號,例如T為25,則可以先讀取到緩沖的25個(gè)幀 的第二音頻信號,通過MDCT處理的方式,得到25個(gè)幀中每一個(gè)幀的第二音頻信號的對應(yīng)于 多個(gè)頻率點(diǎn)頻譜線。如圖5所示,對于一個(gè)幀的第二音頻信號,每一條豎線(包括虛線和實(shí) 線)都是一條頻譜線,對于25個(gè)幀中的每一個(gè)幀都可以確定出該幀的有效截止頻率,在步驟 D2中,以第一幀的有效截止頻率的計(jì)算為例,如圖5所示,從第一幀的最后一條頻譜線往前 開始搜索,找到第一頻譜線對應(yīng)的頻率作為第一幀的有效截止頻率,第一頻譜線為第一幀 的第二音頻信號的對應(yīng)于多個(gè)頻率點(diǎn)的頻譜線中第一條其振幅絕對值的自然對數(shù)值大于 預(yù)置門限的頻譜線,也就是說對于第一幀的所有頻譜線,從后往前找,找到振幅絕對值的自 然對數(shù)值大于一預(yù)置門限的頻譜線作為第一頻譜線,該第一頻譜線的頻率點(diǎn)就是第一幀的 有效截止頻率,然后從25個(gè)幀的有效截止頻率中選擇出最大值作為全局截止頻率。其中,上 述預(yù)置門限可以通過如下方式計(jì)算:ln(2~ (-MBits) )+q,其中,q為可調(diào)整的參量,MBits為 采樣位數(shù),另外該預(yù)置門限還可以結(jié)合具體的應(yīng)用場景來確定具體取值,此處不再贅述。在 步驟D3中,舉例說明如下,計(jì)算每個(gè)幀的MDCT處理后的第二音頻信號的有效截止頻率時(shí),統(tǒng) 一從所有幀中的第一個(gè)幀開始求每幀的有效截止頻率,求取的方法是,從全局截止頻率處 往前開始搜索,找到第一條其振幅絕對值的自然對數(shù)值大于另一預(yù)置門限的頻譜線的頻率 點(diǎn)作為該幀的有效截止頻率k。,其中,上述另一預(yù)置門限可以通過如下方式計(jì)算:ln(2~(-MBits))+p其中,p為可調(diào)整的參量。這么處理的目的是避免每一個(gè)幀都從最后一條譜線往 前搜索,以節(jié)省搜索時(shí)間、提高速度。
[0104] 需要說明的是,在本發(fā)明前述步驟中,對獲取第二音頻信號的低頻段頻譜,并根據(jù) 低頻段頻譜對第二音頻信號進(jìn)行高頻段頻譜的估計(jì),得到高頻段頻譜包絡(luò)線的方式進(jìn)行了 詳細(xì)說明,不限定的是,本發(fā)明實(shí)施例還可以采用其它的方式來生成第二音頻信號的高頻 段頻譜包絡(luò)線。舉例說明,對原音頻信號進(jìn)行上采樣之后得到音頻序列X[n],再轉(zhuǎn)換到MDCT 頻域得到X[n],然后求得ln|X[n] I,將有效截止頻率k。之前的頻譜包絡(luò)線進(jìn)行分組,接著采 用最小二乘法進(jìn)行擬合直線。但是,在本發(fā)明的前述實(shí)施例中采用RANSAC算法對每組的最 大值點(diǎn)進(jìn)行直線擬合求得直線參數(shù),然后依據(jù)此參數(shù)對缺失的高頻部分進(jìn)行擴(kuò)展。由于頻 域波形變化的多樣性,最小二乘法擬合直線時(shí)容易受離群點(diǎn)影響,從而導(dǎo)致擬合的直線出 現(xiàn)較大偏差,使得高頻拓展后的音質(zhì)不佳,而采用RANSAC算法則可以有效地應(yīng)對離群點(diǎn)的 干擾,提高了音質(zhì)效果。
[0105] 406、按照高頻段頻譜包絡(luò)線將低頻段頻譜拷貝到第二音頻信號的高頻段,得到第 三音頻信號。
[0106] 407、對第三音頻信號進(jìn)行能量調(diào)整,得到第四音頻信號。
[0107] 在本發(fā)明的一些實(shí)施例中,步驟405執(zhí)行之后,可以執(zhí)行步驟406至步驟407,步驟 406至步驟407的實(shí)現(xiàn)方式與前述實(shí)施例中步驟103至步驟104的實(shí)現(xiàn)方式相類似,此處不再 贅述。
[0108] 在本發(fā)明的一些實(shí)施例中,步驟406按照高頻段頻譜包絡(luò)線將低頻段頻譜拷貝到 第二音頻信號的高頻段,得到第三音頻信號,具體可以包括如下步驟:
[0109] El、根據(jù)第二音頻信號的有效截止頻率將低頻段頻譜分為多個(gè)譜線段;
[0110] E2、將多個(gè)譜線段依次拷貝到第二音頻信號的高頻段,得到第三音頻信號。
[0111] 其中,在進(jìn)行高頻拓展時(shí)需要拷貝低頻段頻譜,本發(fā)明實(shí)施例中采用循環(huán)鏡像方 式進(jìn)行頻段拷貝,使得拷貝頻段的交界處相對平滑,有助于音質(zhì)的提升。舉例說明,拷貝低 頻段頻譜時(shí)采用鏡像拷貝,拷貝鏡像對稱譜線依次為k c+n*U(U為被拷貝的譜線條數(shù),η表示 對稱軸的標(biāo)號,η = 0/1/2/3···),例如第kc+l、kc+2、…、kc+U條譜線依次拷貝自kc-l、k c-2、kc-U,繼而第kc+U+l、kc+U+2、…、k c+2U條譜線拷貝自 kc+(U-l)、kc+(U-2)、…、k c+l、kc,依次類 推。鏡像拷貝的目的是讓拷貝段的兩邊交界處的譜線盡量不發(fā)生跳躍,以提高音質(zhì)。不限定 的是,在本發(fā)明的其它實(shí)施例中,還可以先從低頻段選取一段頻譜,然后采用平移方式多次 拷貝到高頻區(qū)域直到填滿,但是如果被拷貝頻段兩端的譜線差值較大,那么在拷貝后的頻 段交界處會產(chǎn)生跳躍現(xiàn)象,這會導(dǎo)致音質(zhì)下降,而步驟El至步驟E2提供的應(yīng)用場景中,采用 循環(huán)鏡像方式進(jìn)行頻段拷貝,使得拷貝頻段的交界處相對平滑,有助于音質(zhì)的提升。
[0112]在本發(fā)明的一些實(shí)施例中,步驟407對第三音頻信號進(jìn)行能量調(diào)整,得到第四音頻 信號,具體可以包括如下步驟:
[0113] Fl、根據(jù)第三音頻信號的有效截止頻率和信號終止頻率將第三音頻信號分為S個(gè) 譜線段,其中,每一個(gè)譜線段包括w條譜線,S和w為自然數(shù);
[0114] F2、S個(gè)譜線段中的每一條譜線通過如下方式進(jìn)行能量調(diào)整:
[0115]
[0116]
[0117]
[0118]
[0119]
[0120] 其中,X7 [η]表示第四音頻信號,X[n]表示第三音頻信號,Cti表示能量調(diào)整系數(shù),Ei 表示每段譜線調(diào)整前的能量,P1表示在第二音頻信號的高頻段中填充的偽能量,k。表示第三 音頻信號的有效截止頻率,a和b表示第三音頻信號的直線方程參數(shù)。
[0121] 具體的,在通過前述方式拷貝完譜線之后,可以將有效截止頻率k。到信號終止頻 率end分為S個(gè)譜線段,每一個(gè)譜線段包括w條譜線,每段分別進(jìn)行能量調(diào)整,需要先計(jì)算每 段譜線的調(diào)整前能量E 1、偽能量?1,然后計(jì)算每段的能量調(diào)整系數(shù)cu,最后每段譜線乘以相 應(yīng)的調(diào)整系數(shù)即可得到調(diào)整后譜線值。需要說明的是,上述實(shí)現(xiàn)方式只是能量調(diào)整的一種 具體可行的實(shí)現(xiàn)場景,不限定的是,本發(fā)明實(shí)施例中能量調(diào)整系數(shù)還可以采用其它的方式, 例如對上述能量調(diào)整系數(shù)進(jìn)行進(jìn)一步的修正,設(shè)置修正因子。另外,本發(fā)明實(shí)施例中第四音 頻信號X7 [Π]的實(shí)現(xiàn)方式也可以不局限于上述舉例方式,還可以通過對第三音頻信號按照 固定能量調(diào)整值進(jìn)行修改,具體結(jié)合應(yīng)用場景進(jìn)行詳細(xì)設(shè)置,此處不做限定。
[0122] 需要說明的是,在本發(fā)明的一些實(shí)施例中,步驟403中對每一幀的第二音頻信號進(jìn) 行MDCT處理,得到MDCT處理后的第二音頻信號,通過步驟407進(jìn)行能量調(diào)整后得到的第四音 頻信號還可以是頻域信號,該第四音頻信號還可以進(jìn)一步的進(jìn)行逆修正離散余弦變換 (Inverse Modified Discrete Cosine Transform,IMDCT)處理,并對各個(gè)幀的IMDCT處理 后的第四音頻信號進(jìn)行合幀處理,從而得到完整的時(shí)域的第四音頻信號,該第四音頻信號 可以向用戶輸出進(jìn)行音頻文件播放,使用戶體驗(yàn)到高品質(zhì)的音頻效果。
[0123] 通過前述實(shí)施例對本發(fā)明的詳細(xì)說明可知,本發(fā)明實(shí)施例中估計(jì)第二音頻信號的 高頻段頻譜包絡(luò)線時(shí),可以采用RANSAC算法,可以有效地應(yīng)對離群點(diǎn)的干擾,提高了音質(zhì)效 果。第二音頻信號在高頻段拷貝進(jìn)行低頻段頻譜后再進(jìn)行能量調(diào)整,可以得到第四音頻信 號,第四音頻信號中攜帶有高頻段的頻譜信息,當(dāng)音頻播放器播放該第四音頻信號時(shí)可以 提高音頻信號的播放效果。
[0124] 需要說明的是,對于前述的各方法實(shí)施例,為了簡單描述,故將其都表述為一系列 的動作組合,但是本領(lǐng)域技術(shù)人員應(yīng)該知悉,本發(fā)明并不受所描述的動作順序的限制,因?yàn)?依據(jù)本發(fā)明,某些步驟可以采用其他順序或者同時(shí)進(jìn)行。其次,本領(lǐng)域技術(shù)人員也應(yīng)該知 悉,說明書中所描述的實(shí)施例均屬于優(yōu)選實(shí)施例,所涉及的動作和模塊并不一定是本發(fā)明 所必須的。
[0125] 為便于更好的實(shí)施本發(fā)明實(shí)施例的上述方案,下面還提供用于實(shí)施上述方案的相 關(guān)裝置。
[0126] 請參閱圖7-a所示,本發(fā)明實(shí)施例提供的一種音頻播放器700,可以包括:上采樣模 塊701、高頻估計(jì)模塊702、頻譜拷貝模塊703、能量調(diào)整模塊704,其中,
[0127] 上采樣模塊701,用于對原始的第一音頻信號進(jìn)行上采樣,得到第二音頻信號;
[0128] 高頻估計(jì)模塊702,用于獲取所述第二音頻信號的低頻段頻譜,并根據(jù)所述低頻段 頻譜對所述第二音頻信號進(jìn)行高頻段頻譜的估計(jì),得到高頻段頻譜包絡(luò)線;
[0129] 頻譜拷貝模塊703,用于按照所述高頻段頻譜包絡(luò)線將所述低頻段頻譜拷貝到所 述第二音頻信號的高頻段,得到第三音頻信號;
[0130]能量調(diào)整模塊704,用于對所述第三音頻信號進(jìn)行能量調(diào)整,得到第四音頻信號。
[0131] 在本發(fā)明的一些實(shí)施例中,如圖7-b所示,上采樣模塊701包括:
[0132] 第一分幀模塊7011,用于對所述第一音頻信號進(jìn)行分幀,得到多個(gè)幀的第一音頻 信號,所述多個(gè)幀的第一音頻信號中相鄰兩幀的第一音頻信號之間有重疊;
[0133] DCT處理模塊7012,用于對每一幀的第一音頻信號分別進(jìn)行離散余弦變換DCT處 理,得到DCT處理后的第一音頻信號;
[0134] 擴(kuò)展模塊7013,用于根據(jù)采樣率轉(zhuǎn)換比在所述DCT處理后的每幀第一音頻信號的 尾端添加0,得到補(bǔ)0后的第一音頻信號,所述采樣率轉(zhuǎn)換比為目標(biāo)采樣率和原采樣率的比 值;
[0135] ICDT處理模塊7014,用于對所述補(bǔ)0后的第一音頻信號進(jìn)行逆離散余弦轉(zhuǎn)換IDCT 處理,得到IDCT處理后的第一音頻信號;
[0136] 拼接模塊7015,用于將所有幀的所述IDCT處理后的第一音頻信號按照首尾拼接的 方式連接起來,得到所述第二音頻信號。
[0137] 在本發(fā)明的一些實(shí)施例中,如圖7-c所示,音頻播放器700還可以包括如下模塊:
[0138] 剪切模塊705,用于IDCT處理模塊對所述補(bǔ)0后的第一音頻信號進(jìn)行逆離散余弦轉(zhuǎn) 換IDCT處理,得到IDCT處理后的第一音頻信號之后,將所述IDCT處理后的第一音頻信號的 首端和尾端剪切掉,得到剪切掉首尾端的第一音頻信號;
[0139] 在這種情況下,拼接模塊7015具體用于將所有幀的所述剪切掉首尾端的第一音頻 信號按照首尾拼接的方式連接起來,得到所述第二音頻信號。
[0140]在本發(fā)明的一些實(shí)施例中,所述IDCT處理后的第一音頻信號中剪切掉的首端和尾 端的長度均為L1,所述1^的取值通過如下公式計(jì)算得到:
[0141]
[0142] 其中,所述1^的取值為正整數(shù),所述多個(gè)幀的第一音頻信號中相鄰兩幀的第一音 頻信號之間的重疊區(qū)域的長度為2L,所述I表示目標(biāo)采樣率,所述D表示原采樣率。
[0143] 在本發(fā)明的一些實(shí)施例中,如圖7-d所示,高頻估計(jì)模塊702包括:
[0144] 第二分幀模塊7021,用于對所述第二音頻信號進(jìn)行分幀,得到多個(gè)幀的第二音頻 信號;
[0145] MDCT處理模塊7022,用于對每一幀的第二音頻信號進(jìn)行修正離散余弦變換MDCT處 理,得到MDCT處理后的第二音頻信號;
[0146] 直線擬合模塊7023,用于采用隨機(jī)采樣檢驗(yàn)算法對所述MDCT處理后的第二音頻信 號的低頻段頻譜的振幅絕對值的自然對數(shù)值進(jìn)行直線擬合,得到低頻段頻譜包絡(luò)線,所述 低頻段頻譜包括:處于所述MDCT處理后的第二音頻信號的有效截止頻率之前的頻譜段;
[0147] 包絡(luò)線生成模塊7024,用于按照所述低頻段頻譜包絡(luò)線對應(yīng)的直線方程估計(jì)所述 MDCT處理后的第二音頻信號的高頻段頻譜,得到所述高頻段頻譜包絡(luò)線。
[0148] 在本發(fā)明的一些實(shí)施例中,所述MDCT處理后的第二音頻信號的有效截止頻率通過 如下方式獲?。?br>[0149] 讀取預(yù)先緩沖的T個(gè)幀的第二音頻信號,并獲取所述T個(gè)幀中每一個(gè)幀的第二音頻 信號的對應(yīng)于多個(gè)頻率點(diǎn)的頻譜線,所述T的取值為自然數(shù);
[0150] 對于所述T個(gè)幀中的每一個(gè)幀都按照如下對第一幀的處理方式確定出每一個(gè)幀的 有效截止頻率:從所述第一幀的最后一條頻譜線往前開始搜索,找到第一頻譜線對應(yīng)的頻 率作為所述第一幀的有效截止頻率,所述第一頻譜線為所述第一幀的第二音頻信號的對應(yīng) 于多個(gè)頻率點(diǎn)的頻譜線中第一條其振幅絕對值的自然對數(shù)值大于一預(yù)置門限的頻譜線,所 述第一幀為所述T個(gè)幀中的任意一個(gè)幀;
[0151] 獲取到所述T個(gè)幀中每一個(gè)幀的有效截止頻率之后,確定所述T個(gè)幀的T個(gè)有效截 止頻率中的最大值作為全局截止頻率;
[0152]從所述全局截止頻率開始往前搜索所述MDCT處理后的第二音頻信號的頻譜線,找 到第一條其振幅絕對值的自然對數(shù)值大于另一預(yù)置門限的頻譜線對應(yīng)的頻率點(diǎn)作為所述 MDCT處理后的第二音頻信號的有效截止頻率。
[0153]在本發(fā)明的一些實(shí)施例中,如圖7-e所示,相對于如圖7-a所示,音頻播放器700還 可以包括如下模塊:
[0154] 校正模塊706,用于直線擬合模塊采用隨機(jī)采樣檢驗(yàn)算法對所述MDCT處理后的第 二音頻信號的低頻段頻譜的振幅絕對值的自然對數(shù)值進(jìn)行直線擬合,得到低頻段頻譜包絡(luò) 線之后,根據(jù)預(yù)置的頻譜坐標(biāo)系中的最小值點(diǎn)、所述有效截止頻率在所述頻譜坐標(biāo)系中的 有效值點(diǎn)確定直線方程的校正參數(shù);根據(jù)所述校正參數(shù)對所述低頻段頻譜包絡(luò)線對應(yīng)的直 線方程進(jìn)行參數(shù)調(diào)整。
[0155] 在本發(fā)明的一些實(shí)施例中,頻譜拷貝模塊703,具體用于根據(jù)所述第二音頻信號的 有效截止頻率將所述低頻段頻譜分為多個(gè)譜線段;將所述多個(gè)譜線段依次拷貝到所述第二 音頻信號的高頻段,得到所述第三音頻信號。
[0156]在本發(fā)明的一些實(shí)施例中,能量調(diào)整模塊704,具體用于根據(jù)所述第三音頻信號的 有效截止頻率和信號終止頻率將所述第三音頻信號分為S個(gè)譜線段,其中,每一個(gè)譜線段包 括w條譜線,所述S和w為自然數(shù);所述S個(gè)譜線段中的每一條譜線通過如下方式進(jìn)行能量調(diào) 整:
[0157]
[0158]
[0159]
[0160]
[0161]
[0162] 其中,所述Xln]表示所述第四音頻信號,所述X[n]表示所述第三音頻信號,所述 ai表示能量調(diào)整系數(shù),所述Ei表示每段譜線調(diào)整前的能量,所述Pi表示在所述第二音頻信號 的高頻段中填充的偽能量,所述k。表示所述第三音頻信號的有效截止頻率,所述a和所述b 表示所述第三音頻信號的直線方程參數(shù)。
[0163] 通過前述實(shí)施例對本發(fā)明的詳細(xì)說明可知,首先對原始的第一音頻信號進(jìn)行上采 樣,得到第二音頻信號,然后獲取第二音頻信號的低頻段頻譜,并根據(jù)低頻段頻譜對第二音 頻信號進(jìn)行高頻段頻譜的估計(jì),得到高頻段頻譜包絡(luò)線,接下來按照高頻段頻譜包絡(luò)線將 低頻段頻譜拷貝到第二音頻信號的高頻段,得到第三音頻信號,最后對第三音頻信號進(jìn)行 能量調(diào)整,得到第四音頻信號。本發(fā)明實(shí)施例中第一音頻信號作為原始信號經(jīng)過上采樣之 后,估計(jì)出了第二音頻信號的高頻段頻譜包絡(luò)線,第二音頻信號在高頻段拷貝進(jìn)行低頻段 頻譜后再進(jìn)行能量調(diào)整,可以得到第四音頻信號,第四音頻信號中攜帶有高頻段的頻譜信 息,當(dāng)音頻播放器播放該第四音頻信號時(shí)可以提高音頻信號的播放效果。
[0164] 需要說明的是,上述裝置各模塊/單元之間的信息交互、執(zhí)行過程等內(nèi)容,由于與 本發(fā)明方法實(shí)施例基于同一構(gòu)思,其帶來的技術(shù)效果與本發(fā)明方法實(shí)施例相同,具體內(nèi)容 可參見本發(fā)明前述所示的方法實(shí)施例中的敘述,此處不再贅述。
[0165] 另外需說明的是,以上所描述的裝置實(shí)施例僅僅是示意性的,其中所述作為分離 部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也 可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí) 際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本實(shí)施例方案的目的。另外,本發(fā)明提供的 裝置實(shí)施例附圖中,模塊之間的連接關(guān)系表示它們之間具有通信連接,具體可以實(shí)現(xiàn)為一 條或多條通信總線或信號線。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動的情況下,即可以 理解并實(shí)施。
[0166] 通過以上的實(shí)施方式的描述,所屬領(lǐng)域的技術(shù)人員可以清楚地了解到本發(fā)明可借 助軟件加必需的通用硬件的方式來實(shí)現(xiàn),當(dāng)然也可以通過專用硬件包括專用集成電路、專 用CPU、專用存儲器、專用元器件等來實(shí)現(xiàn)。一般情況下,凡由計(jì)算機(jī)程序完成的功能都可以 很容易地用相應(yīng)的硬件來實(shí)現(xiàn),而且,用來實(shí)現(xiàn)同一功能的具體硬件結(jié)構(gòu)也可以是多種多 樣的,例如模擬電路、數(shù)字電路或?qū)S秒娐返?。但是,對本發(fā)明而言更多情況下軟件程序?qū)?現(xiàn)是更佳的實(shí)施方式?;谶@樣的理解,本發(fā)明的技術(shù)方案本質(zhì)上或者說對現(xiàn)有技術(shù)做出 貢獻(xiàn)的部分可以以軟件產(chǎn)品的形式體現(xiàn)出來,該計(jì)算機(jī)軟件產(chǎn)品存儲在可讀取的存儲介質(zhì) 中,如計(jì)算機(jī)的軟盤、U盤、移動硬盤、只讀存儲器(R0M,Read-0nly Memory)、隨機(jī)存取存儲 器(RAM,Random Access Memory)、磁碟或者光盤等,包括若干指令用以使得一臺計(jì)算機(jī)設(shè) 備(可以是個(gè)人計(jì)算機(jī),服務(wù)器,或者網(wǎng)絡(luò)設(shè)備等)執(zhí)行本發(fā)明各個(gè)實(shí)施例所述的方法。
[0167] 綜上所述,以上實(shí)施例僅用以說明本發(fā)明的技術(shù)方案,而非對其限制;盡管參照上 述實(shí)施例對本發(fā)明進(jìn)行了詳細(xì)的說明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解:其依然可以對上 述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對其中部分技術(shù)特征進(jìn)行等同替換;而這些 修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。
【主權(quán)項(xiàng)】
1. 一種音頻信號的高頻擴(kuò)展方法,其特征在于,包括: 對原始的第一音頻信號進(jìn)行上采樣,得到第二音頻信號; 獲取所述第二音頻信號的低頻段頻譜,并根據(jù)所述低頻段頻譜對所述第二音頻信號進(jìn) 行高頻段頻譜的估計(jì),得到高頻段頻譜包絡(luò)線; 按照所述高頻段頻譜包絡(luò)線將所述低頻段頻譜拷貝到所述第二音頻信號的高頻段,得 到第三音頻信號; 對所述第三音頻信號進(jìn)行能量調(diào)整,得到第四音頻信號。2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對原始的第一音頻信號進(jìn)行上采樣, 得到第二音頻信號,包括: 對所述第一音頻信號進(jìn)行分幀,得到多個(gè)幀的第一音頻信號,所述多個(gè)幀的第一音頻 信號中相鄰兩幀的第一音頻信號之間有重疊; 對每一幀的第一音頻信號分別進(jìn)行離散余弦變換DCT處理,得到DCT處理后的第一音頻 信號; 根據(jù)采樣率轉(zhuǎn)換比在所述DCT處理后的每幀第一音頻信號的尾端添加0,得到補(bǔ)0后的 第一音頻信號,所述采樣率轉(zhuǎn)換比為目標(biāo)采樣率和原采樣率的比值; 對所述補(bǔ)〇后的第一音頻信號進(jìn)行逆離散余弦轉(zhuǎn)換IDCT處理,得到IDCT處理后的第一 音頻信號; 將所有幀的所述IDCT處理后的第一音頻信號按照首尾拼接的方式連接起來,得到所述 第二音頻信號。3. 根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述補(bǔ)0后的第一音頻信號進(jìn)行逆 離散余弦轉(zhuǎn)換IDCT處理,得到IDCT處理后的第一音頻信號之后,所述方法還包括: 將所述IDCT處理后的第一音頻信號的首端和尾端剪切掉,得到剪切掉首尾端的第一音 頻信號; 所述將所有幀的所述IDCT處理后的第一音頻信號按照首尾拼接的方式連接起來,得到 所述第二音頻信號,具體為: 將所有幀的所述剪切掉首尾端的第一音頻信號按照首尾拼接的方式連接起來,得到所 述第二音頻信號。4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述IDCT處理后的第一音頻信號中剪切掉 的首端和尾端的長度均為U,所述1^的取值通過如下公式計(jì)算得到:其中,所述U的取值為正整數(shù),所述多個(gè)幀的第一音頻信號中相鄰兩幀的第一音頻信號 之間的重疊區(qū)域的長度為2L,所述I表示目標(biāo)采樣率,所述D表示原采樣率。5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取所述第二音頻信號的低頻段頻 譜,并根據(jù)所述低頻段頻譜對所述第二音頻信號進(jìn)行高頻段頻譜的估計(jì),得到高頻段頻譜 包絡(luò)線,包括: 對所述第二音頻信號進(jìn)行分幀,得到多個(gè)幀的第二音頻信號; 對每一幀的第二音頻信號進(jìn)行修正離散余弦變換MDCT處理,得到MDCT處理后的第二音 頻信號; 采用隨機(jī)采樣檢驗(yàn)算法對所述MDCT處理后的第二音頻信號的低頻段頻譜的振幅絕對 值的自然對數(shù)值進(jìn)行直線擬合,得到低頻段頻譜包絡(luò)線,所述低頻段頻譜包括:處于所述 MDCT處理后的第二音頻信號的有效截止頻率之前的頻譜段; 按照所述低頻段頻譜包絡(luò)線對應(yīng)的直線方程估計(jì)所述MDCT處理后的第二音頻信號的 高頻段頻譜,得到所述高頻段頻譜包絡(luò)線。6. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述MDCT處理后的第二音頻信號的有效截 止頻率通過如下方式獲?。?讀取預(yù)先緩沖的T個(gè)幀的第二音頻信號,并獲取所述T個(gè)幀中每一個(gè)幀的第二音頻信號 的對應(yīng)于多個(gè)頻率點(diǎn)的頻譜線,所述T的取值為自然數(shù); 對于所述T個(gè)幀中的每一個(gè)幀都按照如下對第一幀的處理方式確定出每一個(gè)幀的有效 截止頻率:從所述第一幀的最后一條頻譜線往前開始搜索,找到第一頻譜線對應(yīng)的頻率作 為所述第一幀的有效截止頻率,所述第一頻譜線為所述第一幀的第二音頻信號的對應(yīng)于多 個(gè)頻率點(diǎn)的頻譜線中第一條其振幅絕對值的自然對數(shù)值大于一預(yù)置門限的頻譜線,所述第 一幀為所述T個(gè)幀中的任意一個(gè)幀; 獲取到所述T個(gè)幀中每一個(gè)幀的有效截止頻率之后,確定所述T個(gè)幀的T個(gè)有效截止頻 率中的最大值作為全局截止頻率; 從所述全局截止頻率開始往前搜索所述MDCT處理后的第二音頻信號的頻譜線,找到第 一條其振幅絕對值的自然對數(shù)值大于另一預(yù)置門限的頻譜線對應(yīng)的頻率點(diǎn)作為所述MDCT 處理后的第二音頻信號的有效截止頻率。7. 根據(jù)權(quán)利要求5所述的方法,其特征在于,所述采用隨機(jī)采樣檢驗(yàn)RANSAC算法對所述 MDCT處理后的第二音頻信號的低頻段頻譜進(jìn)行直線擬合,得到低頻段頻譜包絡(luò)線之后,所 述方法還包括: 根據(jù)預(yù)置的頻譜坐標(biāo)系中的最小值點(diǎn)、所述有效截止頻率在所述頻譜坐標(biāo)系中的有效 值點(diǎn)確定直線方程的校正參數(shù); 根據(jù)所述校正參數(shù)對所述低頻段頻譜包絡(luò)線對應(yīng)的直線方程進(jìn)行參數(shù)調(diào)整。8. 根據(jù)權(quán)利要求1至7中任意一項(xiàng)所述的方法,其特征在于,所述按照所述高頻段頻譜 包絡(luò)線將所述低頻段頻譜拷貝到所述第二音頻信號的高頻段,得到第三音頻信號,包括: 根據(jù)所述第二音頻信號的有效截止頻率將所述低頻段頻譜分為多個(gè)譜線段; 將所述多個(gè)譜線段依次拷貝到所述第二音頻信號的高頻段,得到所述第三音頻信號。9. 根據(jù)權(quán)利要求1至7中任意一項(xiàng)所述的方法,其特征在于,所述對所述第三音頻信號 進(jìn)行能量調(diào)整,得到第四音頻信號,包括: 根據(jù)所述第三音頻信號的有效截止頻率和信號終止頻率將所述第三音頻信號分為S個(gè) 譜線段,其中,每一個(gè)譜線段包括w條譜線,所述S和w為自然數(shù); 所述S個(gè)譜線段中的每一條譜線通過如下方式進(jìn)行能量調(diào)整: X7 [n]=X[n] X〇i, n = kc+i Xw~kc+(i+l) Xw_l,i = 0~S_1,其中,所述f [η]表示所述第四音頻信號,所述X[n]表示所述第三音頻信號,所述^表示 能量調(diào)整系數(shù),所述Ei表示每段譜線調(diào)整前的能量,所述Pi表示在所述第二音頻信號的高頻 段中填充的偽能量,所述k。表示所述第三音頻信號的有效截止頻率,所述a和所述b表示所 述第三音頻信號的直線方程參數(shù)。10. -種音頻播放器,其特征在于,包括: 上采樣模塊,用于對原始的第一音頻信號進(jìn)行上采樣,得到第二音頻信號; 高頻估計(jì)模塊,用于獲取所述第二音頻信號的低頻段頻譜,并根據(jù)所述低頻段頻譜對 所述第二音頻信號進(jìn)行高頻段頻譜的估計(jì),得到高頻段頻譜包絡(luò)線; 頻譜拷貝模塊,用于按照所述高頻段頻譜包絡(luò)線將所述低頻段頻譜拷貝到所述第二音 頻信號的高頻段,得到第三音頻信號; 能量調(diào)整模塊,用于對所述第三音頻信號進(jìn)行能量調(diào)整,得到第四音頻信號。11. 根據(jù)權(quán)利要求10所述的音頻播放器,其特征在于,所述上采樣模塊包括: 第一分幀模塊,用于對所述第一音頻信號進(jìn)行分幀,得到多個(gè)幀的第一音頻信號,所述 多個(gè)幀的第一音頻信號中相鄰兩幀的第一音頻信號之間有重疊; DCT處理模塊,用于對每一幀的第一音頻信號分別進(jìn)行離散余弦變換DCT處理,得到DCT 處理后的第一音頻信號; 擴(kuò)展模塊,用于根據(jù)采樣率轉(zhuǎn)換比在所述DCT處理后的每幀第一音頻信號的尾端添加 〇,得到補(bǔ)〇后的第一音頻信號,所述采樣率轉(zhuǎn)換比為目標(biāo)采樣率和原采樣率的比值; ICDT處理模塊,用于對所述補(bǔ)0后的第一音頻信號進(jìn)行逆離散余弦轉(zhuǎn)換IDCT處理,得到 IDCT處理后的第一音頻信號; 拼接模塊,用于將所有幀的所述IDCT處理后的第一音頻信號按照首尾拼接的方式連接 起來,得到所述第二音頻信號。12. 根據(jù)權(quán)利要求11所述的音頻播放器,其特征在于,所述音頻播放器還包括: 剪切模塊,用于IDCT處理模塊對所述補(bǔ)0后的第一音頻信號進(jìn)行逆離散余弦轉(zhuǎn)換IDCT 處理,得到IDCT處理后的第一音頻信號之后,將所述IDCT處理后的第一音頻信號的首端和 尾端剪切掉,得到剪切掉首尾端的第一音頻信號; 所述拼接模塊,具體用于將所有幀的所述剪切掉首尾端的第一音頻信號按照首尾拼接 的方式連接起來,得到所述第二音頻信號。13. 根據(jù)權(quán)利要求10所述的音頻播放器,其特征在于,所述高頻估計(jì)模塊包括: 第二分幀模塊,用于對所述第二音頻信號進(jìn)行分幀,得到多個(gè)幀的第二音頻信號; MDCT處理模塊,用于對每一幀的第二音頻信號進(jìn)行修正離散余弦變換MDCT處理,得到 MDCT處理后的第二音頻信號; 直線擬合模塊,用于采用隨機(jī)采樣檢驗(yàn)算法對所述MDCT處理后的第二音頻信號的低頻 段頻譜的振幅絕對值的自然對數(shù)值進(jìn)行直線擬合,得到低頻段頻譜包絡(luò)線,所述低頻段頻 譜包括:處于所述MDCT處理后的第二音頻信號的有效截止頻率之前的頻譜段; 包絡(luò)線生成模塊,用于按照所述低頻段頻譜包絡(luò)線對應(yīng)的直線方程估計(jì)所述MDCT處理 后的第二音頻信號的高頻段頻譜,得到所述高頻段頻譜包絡(luò)線。14.根據(jù)權(quán)利要求10所述的音頻播放器,其特征在于,所述音頻播放器還包括: 校正模塊,用于直線擬合模塊采用隨機(jī)采樣檢驗(yàn)算法對所述MDCT處理后的第二音頻信 號的低頻段頻譜的振幅絕對值的自然對數(shù)值進(jìn)行直線擬合,得到低頻段頻譜包絡(luò)線之后, 根據(jù)預(yù)置的頻譜坐標(biāo)系中的最小值點(diǎn)、所述有效截止頻率在所述頻譜坐標(biāo)系中的有效值點(diǎn) 確定直線方程的校正參數(shù);根據(jù)所述校正參數(shù)對所述低頻段頻譜包絡(luò)線對應(yīng)的直線方程進(jìn) 行參數(shù)調(diào)整。
【文檔編號】G11B20/10GK106057220SQ201610340304
【公開日】2016年10月26日
【申請日】2016年5月19日
【發(fā)明人】劉智成, 胡以璇
【申請人】Tcl集團(tuán)股份有限公司