欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

編碼/解碼音頻信號(hào)的設(shè)備和方法

文檔序號(hào):7619076閱讀:368來(lái)源:國(guó)知局
專利名稱:編碼/解碼音頻信號(hào)的設(shè)備和方法
技術(shù)領(lǐng)域
本發(fā)明一般涉及一種編碼音頻信號(hào)的設(shè)備和方法以及一種解碼音頻信號(hào)的設(shè)備和方法。
背景技術(shù)
圖1示出用于檢測(cè)聲音的人耳結(jié)構(gòu)。
參考圖1,當(dāng)人耳外輪廓上的耳朵基準(zhǔn)點(diǎn)(ERP)被耳機(jī)、頭戴式耳機(jī)、電話聽(tīng)筒等等蓋住之后,在ERP和人耳中部上的鼓膜基準(zhǔn)點(diǎn)(DRP)之間形成一個(gè)密封的空間。因此,當(dāng)人耳檢測(cè)到從音頻裝置輸出的音頻信號(hào)時(shí),共振效應(yīng)將聲壓在對(duì)應(yīng)于該密封空間的共振頻率的頻域內(nèi)(大約為1~10KHz頻帶)提高了15dB以上。由于該ERP-DRP共振效應(yīng),即使采用高質(zhì)量的耳機(jī)、頭戴式耳機(jī)、電話聽(tīng)筒,還是存在人耳聽(tīng)到中頻帶被放大很多的音頻信號(hào)的問(wèn)題。結(jié)果,音頻信號(hào)的聲音質(zhì)量惡化。特別是,因?yàn)槎鷻C(jī)、頭戴式耳機(jī)、電話聽(tīng)筒等等的使用隨著便攜式音頻裝置和移動(dòng)電話的廣泛使用而增加,所以該問(wèn)題變得越來(lái)越重要。

發(fā)明內(nèi)容
本一般發(fā)明構(gòu)思提供一種解碼音頻信號(hào)的設(shè)備和方法,以補(bǔ)償在音頻解碼操作中的ERP-DRP共振效應(yīng)。
本一般發(fā)明構(gòu)思還提供一種具有執(zhí)行該音頻解碼方法的可執(zhí)行代碼的計(jì)算機(jī)可讀介質(zhì)。
本一般發(fā)明構(gòu)思還提供一種在音頻編碼操作中通過(guò)考慮ERP-DRP共振效應(yīng)來(lái)以更高的壓縮率編碼音頻信號(hào)的設(shè)備和方法。
本一般發(fā)明構(gòu)思還提供一種具有執(zhí)行該音頻編碼方法的可執(zhí)行代碼的計(jì)算機(jī)可讀介質(zhì)。
本一般發(fā)明構(gòu)思的其他方面將部分在下面的描述中提出,并且部分將根據(jù)該描述而清楚,或者可以通過(guò)對(duì)本一般發(fā)明構(gòu)思的實(shí)踐而得知。
本一般發(fā)明構(gòu)思的上述和/或其它方面是通過(guò)提供一種音頻解碼方法來(lái)實(shí)現(xiàn)的,該方法包括通過(guò)解碼輸入信號(hào)而產(chǎn)生音頻信號(hào),以及將該音頻信號(hào)的原始波形變換為補(bǔ)償聲學(xué)共振效應(yīng)的補(bǔ)償波形。
本一般發(fā)明構(gòu)思的上述和/或其它方面還通過(guò)提供一種音頻解碼設(shè)備來(lái)實(shí)現(xiàn),該設(shè)備包括通過(guò)解碼輸入信號(hào)產(chǎn)生音頻信號(hào)的解碼器,以及將解碼器產(chǎn)生的音頻信號(hào)的原始波形變換為補(bǔ)償聲學(xué)共振效應(yīng)的補(bǔ)償波形的共振補(bǔ)償器。
本一般發(fā)明構(gòu)思的上述和/或其它方面還通過(guò)提供一種具有執(zhí)行該音頻解碼方法的可執(zhí)行代碼的計(jì)算機(jī)可讀介質(zhì)來(lái)實(shí)現(xiàn)。
本一般發(fā)明構(gòu)思的上述和/或其它方面還通過(guò)提供一種音頻編碼方法來(lái)達(dá)到,該方法包括根據(jù)調(diào)整為說(shuō)明聲學(xué)共振效應(yīng)的掩蔽閾值曲線來(lái)計(jì)算音頻信號(hào)的多個(gè)子帶樣本中的每一個(gè)樣本的信掩比(SMRsignal-to-mask ratio),根據(jù)所計(jì)算的信掩比將比特分配給每一子帶樣本,并在所分配的比特范圍內(nèi)量化和編碼該子帶樣本。
本一般發(fā)明構(gòu)思的上述和/或其它方面還通過(guò)提供一種音頻編碼設(shè)備來(lái)達(dá)到,該設(shè)備包括心理聲學(xué)模型單元,用于根據(jù)調(diào)整為說(shuō)明聲學(xué)共振效應(yīng)的掩蔽閾值曲線來(lái)計(jì)算音頻信號(hào)的多個(gè)子帶樣本中的每一個(gè)樣本的信掩比(SMR);比特分配器,用于根據(jù)所計(jì)算的信掩比而將比特分配給每一子帶樣本;以及量化/編碼單元,用于在所分配的比特范圍內(nèi)量化和編碼該子帶樣本。
本一般發(fā)明構(gòu)思的上述和/或其它方面還通過(guò)提供一種具有執(zhí)行該音頻編碼方法的可執(zhí)行代碼的計(jì)算機(jī)可讀介質(zhì)來(lái)達(dá)到。


通過(guò)下面結(jié)合附圖對(duì)實(shí)施例的描述,本一般發(fā)明構(gòu)思的上述和/或其它方面和優(yōu)點(diǎn)將變得更為明顯和更容易理解,在附圖中
圖1示出用于檢測(cè)聲音的人耳結(jié)構(gòu);圖2是示出人耳基準(zhǔn)點(diǎn)(ERP)和人耳的鼓膜基準(zhǔn)點(diǎn)(DRP)之間的共振波形的圖;圖3是示出通過(guò)翻轉(zhuǎn)圖2的共振波形獲得的補(bǔ)償波形的圖;圖4是示出通過(guò)將圖3的補(bǔ)償波形施加到圖2的共振波形而獲得的結(jié)果的圖;圖5是示出根據(jù)本一般發(fā)明構(gòu)思的實(shí)施例的音頻解碼設(shè)備的方框圖;圖6是示出根據(jù)本一般發(fā)明構(gòu)思的實(shí)施例的解碼音頻信號(hào)的方法的流程圖;圖7示出由圖5的音頻解碼設(shè)備所再現(xiàn)的音頻信號(hào)與傳統(tǒng)音頻解碼設(shè)備所再現(xiàn)的音頻信號(hào)的比較;圖8示出用于考慮ERP和DRP之間的共振效應(yīng)的掩蔽效果;圖9是示出根據(jù)本一般發(fā)明構(gòu)思的實(shí)施例的音頻編碼設(shè)備的方框圖;和圖10是示出根據(jù)本一般發(fā)明構(gòu)思的實(shí)施例的音頻編碼方法的流程圖。
具體實(shí)施例方式
現(xiàn)在詳細(xì)參考在附圖中示出了其示例的本一般發(fā)明構(gòu)思的實(shí)施例,其中相同的附圖標(biāo)記全部表示相同的元件。下面描述的實(shí)施例是為了在參考附圖的同時(shí)解釋本一般發(fā)明構(gòu)思。
圖2是示出人耳基準(zhǔn)點(diǎn)(ERP)和人耳的鼓膜基準(zhǔn)點(diǎn)(DRP)之間的共振波形的圖。
參考圖2,測(cè)量由于ERP和DRP之間的密封空間而使聲壓在約1~10KHz頻帶內(nèi)提高了15dB以上的共振波形。ERP-DRP共振波形可以通過(guò)將探針麥克風(fēng)插入人或人體模型頭的耳朵內(nèi)來(lái)測(cè)量。
圖3是示出通過(guò)翻轉(zhuǎn)圖2的共振波形獲得的補(bǔ)償波形的圖。
參考圖3,該補(bǔ)償波形是通過(guò)關(guān)于頻率軸翻轉(zhuǎn)圖2示出的共振波形而獲得的。
圖4是示出通過(guò)將圖3的補(bǔ)償波形施加到圖2的共振波形而獲得的結(jié)果的圖。
參考圖4,當(dāng)耳機(jī)或頭戴式耳機(jī)的用戶聽(tīng)到施加了圖3的補(bǔ)償波形的音頻信號(hào)時(shí),該用戶實(shí)際上聽(tīng)到的是具有原始波形的音頻信號(hào)。在整個(gè)詳細(xì)說(shuō)明中,為了圖示的目的,假定音頻信號(hào)的原始波形是平坦波形。但是,應(yīng)當(dāng)理解音頻信號(hào)的原始波形可以具有其它各種形狀。
參考圖2、3和4,用于補(bǔ)償ERP-DRP共振效應(yīng)的音頻解碼設(shè)備可以通過(guò)測(cè)量由ERP-DRP共振效應(yīng)產(chǎn)生的共振波形、通過(guò)翻轉(zhuǎn)所測(cè)量的共振波形來(lái)計(jì)算補(bǔ)償波形、設(shè)計(jì)一個(gè)或多個(gè)諸如有限脈沖響應(yīng)(FIR)濾波器和/或無(wú)限脈沖響應(yīng)(IIR)濾波器的數(shù)字濾波器以將計(jì)算的補(bǔ)償波形施加到測(cè)量的共振波形上、以及在音頻解碼設(shè)備中實(shí)施所設(shè)計(jì)的數(shù)字濾波器來(lái)實(shí)現(xiàn)。
圖5是示出根據(jù)本一般發(fā)明構(gòu)思的實(shí)施例的音頻解碼設(shè)備的方框圖。
參考圖5,該音頻解碼設(shè)備包括解碼器51、第一共振補(bǔ)償器52、第一數(shù)模轉(zhuǎn)換器(DAC)53、第一放大器54、第二共振補(bǔ)償器55、第二DAC 56、和第二放大器57。
解碼器51通過(guò)解碼輸入信號(hào)產(chǎn)生音頻信號(hào)。通常,該輸入信號(hào)可以是從MPEG音頻編碼設(shè)備傳輸?shù)谋忍亓鳌?br> 第一共振補(bǔ)償器52將解碼器51產(chǎn)生的音頻信號(hào)的波形變換為補(bǔ)償ERP-DRP共振效應(yīng)的第一波形。如圖3所示,用于補(bǔ)償ERP-DRP共振效應(yīng)的補(bǔ)償波形可以通過(guò)翻轉(zhuǎn)圖2所示的ERP-DRP共振波形來(lái)獲得。
第一共振補(bǔ)償器52包括第一共振頻帶提取器521和第一波形變換器522。第一共振頻帶提取器521提取受到ERP-DRP共振效應(yīng)影響的頻帶,以補(bǔ)償該ERP-DRP共振效應(yīng)。也就是說(shuō),第一共振頻帶提取器521可以從音頻信號(hào)中提取大約1~10KHz的頻帶。第一波形變換器522將第一共振頻帶提取器521提取出的頻帶變換為補(bǔ)償波形,其(在音頻信號(hào)平坦時(shí))可以具有與圖3所示的補(bǔ)償波形相同的形狀。如上所述,第一共振補(bǔ)償器52可以用一個(gè)或多個(gè)諸如FIR濾波器和IIR濾波器的數(shù)字濾波器來(lái)實(shí)現(xiàn)。
第一DAC 53將已經(jīng)由第一共振補(bǔ)償器52變換為補(bǔ)償波形的數(shù)字音頻信號(hào)轉(zhuǎn)換為模擬音頻信號(hào)。如上所述,輸入第一DAC 53的音頻信號(hào)是通過(guò)對(duì)MEPG音頻編碼設(shè)備所傳輸?shù)谋忍亓鬟M(jìn)行解碼而獲得的數(shù)字音頻信號(hào),并且可以為了再現(xiàn)而轉(zhuǎn)換為模擬音頻信號(hào)。
第一放大器54將第一DAC 53所轉(zhuǎn)換的模擬音頻信號(hào)輸出到揚(yáng)聲器。該揚(yáng)聲器可以是在人耳的ERP和DRP之間形成密封空間的音頻裝置的左揚(yáng)聲器,該音頻裝置例如是耳機(jī)、頭戴式耳機(jī)、電話聽(tīng)筒等等。
第二共振補(bǔ)償器55、第二DAC 56、和第二放大器57分別執(zhí)行與第一共振補(bǔ)償器52、第一DAC 53、和第一放大器54相同的功能。因此,將不提供對(duì)第二共振補(bǔ)償器55、第二DAC 56、和第二放大器57的描述。但是,第一共振補(bǔ)償器52、第一DAC 53、和第一放大器54可以處理輸出到左揚(yáng)聲器的音頻信號(hào),而第二共振補(bǔ)償器55、第二DAC 56、和第二放大器57可以處理輸出到右揚(yáng)聲器的音頻信號(hào)。因此,解碼器51向第一共振補(bǔ)償器52提供將要輸出到左揚(yáng)聲器的解碼數(shù)據(jù),向第二共振補(bǔ)償器55提供將要輸出到右揚(yáng)聲器的解碼數(shù)據(jù)。盡管圖5示出由兩個(gè)對(duì)應(yīng)輸出裝置(例如揚(yáng)聲器)處理和輸出兩個(gè)聲道(例如左聲道和右聲道),但是應(yīng)當(dāng)理解本一般發(fā)明構(gòu)思的實(shí)施例可以用于處理用于單聲道輸出裝置的音頻信號(hào)。例如,本一般發(fā)明構(gòu)思的實(shí)施例可以用于處理用于電話聽(tīng)筒的聲音。
圖6是示出根據(jù)本一般發(fā)明構(gòu)思的實(shí)施例的解碼音頻信號(hào)的方法的流程圖。
參考圖6,該音頻解碼方法包括操作61到66。圖6所示的音頻解碼方法包括可以由圖5所示的音頻解碼設(shè)備執(zhí)行的一系列操作。或者,圖6的方法可以由其它音頻裝置實(shí)施。
在操作61中,音頻信號(hào)通過(guò)解碼輸入信號(hào)而產(chǎn)生。
在操作62中,從音頻信號(hào)中提取出受到ERP-DRP共振效應(yīng)影響的頻帶(即由于ERP-DRP共振效應(yīng)而隨后被變換的)。
在操作63中,所提取的頻帶被變換為補(bǔ)償波形,其(在音頻信號(hào)平坦時(shí))可能具有與圖3所示的補(bǔ)償波形相同的形狀?;蛘?,當(dāng)音頻信號(hào)不平坦時(shí),補(bǔ)償波形可以具有不同的形狀。
也就是說(shuō),在操作62和63中,在操作61中產(chǎn)生的音頻信號(hào)的波形被變換為補(bǔ)償波形,其由于音頻信號(hào)中的ERP-DRP共振效應(yīng)而隨后被變換。這里,由于ERP-DRP共振效應(yīng)而隨后被變換的補(bǔ)償波形是通過(guò)翻轉(zhuǎn)ERP-DRP共振波形而獲得的。由此,在音頻信號(hào)中實(shí)際發(fā)生ERP-DRP共振效應(yīng)之前,音頻信號(hào)就被補(bǔ)償了ERP-DRP共振效應(yīng)。
在操作64,將具有在操作63中獲得的補(bǔ)償波形的數(shù)字音頻信號(hào)轉(zhuǎn)換為模擬音頻信號(hào)。如上所述,具有在操作63中獲得的補(bǔ)償波形的數(shù)字音頻信號(hào)可以是通過(guò)對(duì)MEPG音頻編碼設(shè)備所傳輸?shù)谋忍亓鬟M(jìn)行解碼而獲得的數(shù)字音頻信號(hào),并且可以為了再現(xiàn)而被轉(zhuǎn)換為模擬音頻信號(hào)?;蛘撸摂?shù)字音頻信號(hào)可以從諸如聲音文件、致密盤(CD)、或數(shù)字視頻盤(DVD)的計(jì)算機(jī)可讀介質(zhì)中獲得。
在操作65和66中,對(duì)操作64中獲得的已經(jīng)補(bǔ)償了ERP-DRP共振效應(yīng)的模擬音頻信號(hào)進(jìn)行放大并輸出到揚(yáng)聲器。然后當(dāng)通過(guò)揚(yáng)聲器輸出模擬音頻信號(hào)時(shí),發(fā)生ERP-DRP共振效應(yīng)。因此,具有原始波形的原始音頻信號(hào)被再現(xiàn)并可以由人耳檢測(cè)到,因?yàn)镋RP-DRP共振效應(yīng)將補(bǔ)償波形變換為原始音頻信號(hào)的原始波形。
圖7示出由圖5的音頻解碼設(shè)備再現(xiàn)的音頻信號(hào)與傳統(tǒng)音頻解碼設(shè)備再現(xiàn)的音頻信號(hào)的比較。用戶可以例如采用耳機(jī)、頭戴式耳機(jī)、或電話聽(tīng)筒來(lái)檢測(cè)再現(xiàn)的音頻信號(hào)。也可以采用其它可以在人耳的ERP和DRP之間創(chuàng)建密封空間的音頻裝置。
參考圖7,當(dāng)用戶采用傳統(tǒng)的音頻解碼設(shè)備收聽(tīng)到對(duì)應(yīng)于具有平坦波形的輸入音頻信號(hào)71的輸出音頻信號(hào)時(shí),由用戶實(shí)際檢測(cè)到的輸出音頻信號(hào)是具有被放大了大約15dB的中頻帶的波形的信號(hào)72。
但是,當(dāng)用戶采用根據(jù)本一般發(fā)明構(gòu)思的實(shí)施例的音頻解碼設(shè)備收聽(tīng)到對(duì)應(yīng)于具有平坦波形的輸入音頻信號(hào)73的輸出音頻信號(hào)時(shí),從根據(jù)本一般發(fā)明構(gòu)思的實(shí)施例的音頻解碼設(shè)備輸出的音頻信號(hào)是具有補(bǔ)償波形的信號(hào)74。因此,由用戶實(shí)際檢測(cè)到的輸出音頻信號(hào)是具有與輸入音頻信號(hào)73相同平坦波形的信號(hào)75。由此,輸入音頻信號(hào)73的原始波形可以通過(guò)采用補(bǔ)償波形對(duì)音頻信號(hào)的原始波形預(yù)補(bǔ)償ERP-DRP共振效應(yīng)而獲得。
因此,當(dāng)本一般發(fā)明構(gòu)思的實(shí)施例應(yīng)用于采用耳機(jī)、頭戴式耳機(jī)、電話聽(tīng)筒等等的便攜式音頻裝置、移動(dòng)電話、和個(gè)人數(shù)字助理(PDA)時(shí),可以聽(tīng)到具有極好的聲音質(zhì)量而沒(méi)有放大的中頻帶的輸出音頻信號(hào)。
圖8示出在考慮ERP和DRP共振效應(yīng)時(shí)出現(xiàn)的掩蔽效果。
大多數(shù)有損耗的音頻壓縮算法強(qiáng)調(diào)當(dāng)原始音頻信號(hào)與壓縮音頻信號(hào)進(jìn)行比較時(shí)人的主觀感覺(jué)不能將原始音頻信號(hào)與壓縮音頻信號(hào)區(qū)分開(kāi)來(lái)的最大程度,而不是強(qiáng)調(diào)原始音頻信號(hào)和壓縮音頻信號(hào)之間的最小算術(shù)誤差。在詳細(xì)壓縮處理的方面,去除了不能被人耳聽(tīng)到的聲音,并且僅分配比特來(lái)表示人能聽(tīng)到的聲音。例如,由于人耳很少聽(tīng)到非常高和非常低頻率的分量,所以非常高和非常低頻率的分量可以排除在壓縮處理之外。此外,基于人聽(tīng)力的特性而被特定掩蔽頻率掩蔽的頻率分量可以按照低于正常的精度來(lái)編碼。心理聲學(xué)模型根據(jù)人耳和大腦之間的交互來(lái)使用該掩蔽效應(yīng)。根據(jù)該心理聲學(xué)模型,由于掩蔽而使得人耳無(wú)法聽(tīng)到的頻率分量的最大聲壓被稱為掩蔽閾值。一旦該頻率分量的聲壓超過(guò)該掩蔽閾值,就能在該特定掩蔽頻率上聽(tīng)到該頻率分量。由于無(wú)法聽(tīng)到聲壓小于掩蔽閾值的音頻信號(hào),所以可以通過(guò)音頻編碼處理來(lái)去除這些音頻信號(hào)。
參考圖8,掩蔽閾值曲線的中間頻帶(即ERP-DRP共振頻帶)由于ERP-DRP共振效應(yīng)而被放大了15dB以上。如果認(rèn)為ERP-DRP共振頻帶是掩蔽頻帶,那么即使在正常狀態(tài)下能夠聽(tīng)到該掩蔽頻帶的相鄰頻帶(即沒(méi)有ERP-共振效應(yīng)),但是還是不能聽(tīng)到該掩蔽頻帶的相鄰頻帶,因?yàn)樗鼈儽谎诒晤l帶掩蔽了。因此,可以通過(guò)調(diào)整說(shuō)明對(duì)用于壓縮聲音數(shù)據(jù)的心理聲學(xué)模型的ERP-DRP共振效應(yīng)的掩蔽閾值曲線來(lái)最大化壓縮率。
圖9是示出根據(jù)本一般發(fā)明構(gòu)思的實(shí)施例的音頻編碼設(shè)備的方框圖。
參考圖9,該音頻編碼設(shè)備包括濾波器組91、心理聲學(xué)模型單元92、比特分配器93、量化/編碼單元94、以及比特流格式器95。
濾波器組91將音頻信號(hào)劃分為多個(gè)子帶樣本。輸入到濾波器組91和心理聲學(xué)模型單元92的音頻信號(hào)是脈碼調(diào)制(PCM)音頻信號(hào)。
心理聲學(xué)模型單元92根據(jù)調(diào)整為說(shuō)明ERP-DRP共振效應(yīng)的掩蔽閾值曲線來(lái)計(jì)算音頻信號(hào)的每個(gè)子帶樣本的信掩比(SMR)。也就是說(shuō),心理聲學(xué)模型單元92考慮具有由于ERP-DRP共振效應(yīng)而已經(jīng)增加的掩蔽閾值的ERP-DRP共振頻帶,來(lái)計(jì)算音頻信號(hào)的每個(gè)子帶樣本的信掩比。由于ERP-DRP共振效應(yīng)而對(duì)掩蔽閾值進(jìn)行了調(diào)整,因此可以應(yīng)用頻譜掩蔽理論和時(shí)間掩蔽理論。在此,所應(yīng)用的掩蔽理論可以包括同時(shí)掩蔽、預(yù)掩蔽、和后掩蔽,這可以用于傳統(tǒng)的感覺(jué)編碼。
心理聲學(xué)模型單元92包括FFT(快速傅立葉變換)單元921、共振頻帶計(jì)算器922、和高/低頻帶計(jì)算器923。
FFT單元921通過(guò)對(duì)音頻信號(hào)進(jìn)行快速傅立葉變換來(lái)計(jì)算頻譜波形。
共振頻帶計(jì)算器922計(jì)算由于ERP-DRP共振效應(yīng)而隨后被變換的頻帶。共振頻帶計(jì)算器922還計(jì)算ERP-DRP共振頻帶的SMR。具體地說(shuō),共振頻帶計(jì)算器922通過(guò)從FFT單元921計(jì)算的頻譜波形中確定ERP-DRP共振頻帶的掩蔽閾值和子帶樣本的聲壓級(jí),而計(jì)算ERP-DRP共振頻帶的SMR。然后,共振頻帶計(jì)算器922計(jì)算所確定的ERP-DRP共振頻帶的掩蔽閾值和子帶樣本的聲壓級(jí)之間的差值。因此,共振頻帶計(jì)算器922可以確定ERP-DRP共振頻帶對(duì)圍繞該ERP-DRP共振頻帶的子帶樣本提供的掩蔽效應(yīng)。
高/低頻帶計(jì)算器923計(jì)算與不同于ERP-DRP共振頻帶的頻帶對(duì)應(yīng)的高/低頻帶(即圍繞ERP-DRP共振頻帶的頻帶)的SMR。具體地說(shuō),高/低頻帶計(jì)算器923通過(guò)從FFT單元921計(jì)算的頻譜波形中確定高/低頻帶的掩蔽閾值和子帶樣本的聲壓級(jí)來(lái)計(jì)算高/低頻帶的SMR。然后,高/低頻帶計(jì)算器923計(jì)算所確定的掩蔽閾值和子帶樣本的聲壓級(jí)之間的差值。因此,高/低頻帶計(jì)算器923可以確定不是ERP-DRP共振頻帶的掩蔽頻帶對(duì)子帶樣本提供的掩蔽效應(yīng)。
當(dāng)根據(jù)ERP-DRP共振頻帶來(lái)實(shí)施心理聲學(xué)模型單元92時(shí),共振頻帶計(jì)算器922和高/低頻帶計(jì)算器923可以實(shí)施為單一組合單元或兩個(gè)單獨(dú)的單元。
然后,比特分配器93根據(jù)心理聲學(xué)模型單元92計(jì)算的SMR,而將比特分配給由濾波器組91劃分的每個(gè)子帶樣本。
例如,關(guān)于ERP-DRP共振頻帶的掩蔽效應(yīng),當(dāng)子帶樣本具有小于或等于ERP-DRP共振頻帶的對(duì)應(yīng)掩蔽閾值的聲壓時(shí)(也就是小于或等于1的SNR),不需要向該子帶樣本分配比特,因?yàn)樵撟訋颖居捎贓RP-DRP共振效應(yīng)而無(wú)法聽(tīng)見(jiàn)。同樣,當(dāng)子帶樣本具有超過(guò)ERP-DRP共振頻帶的對(duì)應(yīng)掩蔽閾值的聲壓時(shí)(也就是大于1的SNR),向該子帶樣本分配比特,因?yàn)椴还蹺RP-DRP共振效應(yīng)如何,該子帶樣本都是可聽(tīng)見(jiàn)的。按照類似方式,可以根據(jù)由高/低頻帶計(jì)算器923確定的其它高/低掩蔽頻帶的掩蔽效應(yīng)來(lái)將比特分配或不分配給子帶樣本。
量化/編碼單元94在所分配的比特范圍內(nèi)量化和編碼這些子帶樣本。
比特流格式器95通過(guò)向量化和編碼后的子帶樣本添加比特分配信息和附加信息,而將量化和編碼后的子帶樣本格式化為比特流。一般地,比特流格式器95根據(jù)MPEG標(biāo)準(zhǔn)來(lái)格式化所述量化和編碼后的子帶樣本。
從比特流格式器95輸出的比特流被傳輸?shù)揭纛l解碼設(shè)備。
圖10是示出根據(jù)本一般發(fā)明構(gòu)思的實(shí)施例的編碼音頻信號(hào)的方法的流程圖。
參考圖10,該音頻編碼方法包括操作101到107。圖10所示的音頻編碼方法包括可以由圖9所示的音頻編碼設(shè)備執(zhí)行的一系列操作?;蛘撸瑘D10的方法可以由其它音頻裝置執(zhí)行。
在操作101,音頻信號(hào)被劃分為多個(gè)子帶。
在操作102,通過(guò)對(duì)音頻信號(hào)執(zhí)行快速傅立葉變換而計(jì)算頻譜波形。
在操作103,計(jì)算ERP-DRP共振頻帶的SMR。具體地說(shuō),通過(guò)從在操作102所計(jì)算的頻譜波形確定ERP-DRP共振頻帶的掩蔽閾值和子帶樣本的聲壓級(jí),來(lái)計(jì)算ERP-DRP共振頻帶的SMR,并且計(jì)算所確定的ERP-DRP共振頻帶的掩蔽閾值和子帶樣本的聲壓級(jí)之間的差值。
在操作104,計(jì)算與不同于ERP-DRP共振頻帶的頻帶對(duì)應(yīng)的高/低頻帶(即圍繞ERP-DRP共振頻帶的頻帶)的SMR。具體地說(shuō),通過(guò)從在操作102所計(jì)算的頻譜波形確定高/低頻帶的掩蔽閾值和子帶樣本的聲壓級(jí),來(lái)計(jì)算高/低頻帶的SMR,并且計(jì)算所確定的高/低頻帶的掩蔽閾值和子帶樣本的聲壓級(jí)之間的差值。
也就是說(shuō),在操作103和104中,根據(jù)由于ERP-DRP共振效應(yīng)而變換的掩蔽閾值來(lái)計(jì)算音頻信號(hào)的子帶樣本的SMR。
在操作105,根據(jù)在操作103和104中計(jì)算的SMR,而將比特分配給在操作101中劃分的每個(gè)子帶樣本。
在操作106,在操作105分配的比特范圍內(nèi),對(duì)子帶樣本進(jìn)行量化和編碼。
在操作107,通過(guò)向量化和編碼后的子帶樣本添加比特分配信息和附加信息,而將操作106中量化和編碼的子帶樣本格式化為比特流。
本一般發(fā)明構(gòu)思可以實(shí)施為在包括存儲(chǔ)介質(zhì)的計(jì)算機(jī)可讀介質(zhì)中的可執(zhí)行代碼,該存儲(chǔ)介質(zhì)例如是磁存儲(chǔ)介質(zhì)(ROM、RAM、軟盤、磁帶等等)、光可讀介質(zhì)(CD-ROM、DVD等)、和載波(通過(guò)因特網(wǎng)傳輸)。
如上所述,根據(jù)本一般發(fā)明構(gòu)思的實(shí)施例,用戶利用耳機(jī)、頭戴式耳機(jī)、電話聽(tīng)筒等等,采用補(bǔ)償ERP-DRP共振效應(yīng)(這是由人耳結(jié)構(gòu)導(dǎo)致的聲學(xué)共振效應(yīng))的補(bǔ)償波形,可以聽(tīng)到中頻帶沒(méi)有放大的具有極好聲音質(zhì)量的音頻信號(hào)。特別是,可以補(bǔ)償ERP-DRP共振效應(yīng),這是隨著諸如便攜式DVD播放器、MP3播放器和移動(dòng)電話的便攜式音頻裝置的廣泛使用而變得越來(lái)越重要的問(wèn)題。
此外,根據(jù)用于以高于其他頻帶的壓縮率編碼不能被人聽(tīng)到的高/低頻帶的心理聲學(xué)模型,通過(guò)考慮由于ERP-DRP共振效應(yīng)而變換的掩蔽閾值,添加以高于其它頻帶的壓縮率來(lái)編碼被ERP-DRP共振頻帶掩蔽的頻帶的功能,可以大大改善壓縮率。
盡管已示出和描述了本一般發(fā)明構(gòu)思的若干實(shí)施例,但是本領(lǐng)域的普通技術(shù)人員可以理解,在不脫離由所附權(quán)利要求及其等價(jià)物限定其范圍的本一般發(fā)明構(gòu)思的原理和精神的情況下,可以對(duì)這些實(shí)施例做出修改。
權(quán)利要求
1.一種音頻解碼方法,包括通過(guò)解碼輸入信號(hào)而產(chǎn)生音頻信號(hào);以及將該音頻信號(hào)的原始波形變換為補(bǔ)償聲學(xué)共振效應(yīng)的補(bǔ)償波形。
2.根據(jù)權(quán)利要求1的音頻解碼方法,其中,所述音頻信號(hào)的原始波形的變換包括在聲學(xué)共振效應(yīng)發(fā)生之前對(duì)該音頻信號(hào)的原始波形進(jìn)行預(yù)補(bǔ)償。
3.根據(jù)權(quán)利要求1的音頻解碼方法,還包括輸出所述補(bǔ)償波形,使得該補(bǔ)償波形通過(guò)所述聲學(xué)共振效應(yīng)而轉(zhuǎn)換為原始波形。
4.根據(jù)權(quán)利要求1的音頻解碼方法,其中所述聲學(xué)共振效應(yīng)包括在人耳基準(zhǔn)點(diǎn)(ERP)和鼓膜基準(zhǔn)點(diǎn)(DRP)之間產(chǎn)生的ERP-DRP共振效應(yīng)。
5.根據(jù)權(quán)利要求1的音頻解碼方法,其中所述音頻信號(hào)的原始波形的變換包括通過(guò)翻轉(zhuǎn)由于所述聲學(xué)共振效應(yīng)而獲得的共振波形來(lái)獲得補(bǔ)償波形。
6.根據(jù)權(quán)利要求5的音頻解碼方法,其中所述共振波形是利用人體模型頭用實(shí)驗(yàn)方法而獲得的。
7.根據(jù)權(quán)利要求1的音頻解碼方法,其中所述原始波形的變換包括從所述音頻信號(hào)中提取由于聲學(xué)共振效應(yīng)而隨后被變換的頻帶;以及將所提取的頻帶變換為補(bǔ)償波形。
8.根據(jù)權(quán)利要求1的音頻解碼方法,其中所述音頻信號(hào)是數(shù)字音頻信號(hào),并且該方法還包括將具有補(bǔ)償波形的數(shù)字音頻信號(hào)轉(zhuǎn)換為模擬音頻信號(hào)。
9.一種補(bǔ)償音頻信號(hào)中的聲學(xué)共振效應(yīng)的方法,該方法包括確定由該聲學(xué)共振效應(yīng)引起的共振波形;通過(guò)確定該共振波形的翻轉(zhuǎn)而計(jì)算補(bǔ)償波形;將該補(bǔ)償波形施加到音頻信號(hào);以及輸出向其施加了補(bǔ)償波形的音頻信號(hào)。
10.根據(jù)權(quán)利要求9的方法,其中將該補(bǔ)償波形施加到音頻信號(hào)包括提取被聲學(xué)共振效應(yīng)影響的頻帶;以及將提取出的頻帶變換為補(bǔ)償波形。
11.根據(jù)權(quán)利要求9的方法,其中施加所述補(bǔ)償波形包括將音頻信號(hào)的原始波形變換為該補(bǔ)償波形;并且輸出該音頻信號(hào)包括創(chuàng)建聲學(xué)共振效應(yīng),以便將該補(bǔ)償波形向回變換為原始波形。
12.根據(jù)權(quán)利要求9的方法,還包括從解碼器接收音頻信號(hào),該音頻信號(hào)包括左聲道信號(hào)和右聲道信號(hào)。
13.根據(jù)權(quán)利要求12的方法,其中確定共振波形包括確定由用戶左耳內(nèi)的聲學(xué)共振效應(yīng)引起的第一共振波形,并確定由用戶右耳內(nèi)的聲學(xué)共振效應(yīng)引起的第二共振波形;計(jì)算該補(bǔ)償波形包括通過(guò)確定該第一共振波形的翻轉(zhuǎn)來(lái)計(jì)算第一補(bǔ)償波形,并通過(guò)確定該第二共振波形的翻轉(zhuǎn)來(lái)計(jì)算第二補(bǔ)償波形;以及將該補(bǔ)償波形施加到音頻信號(hào)包括將第一和第二補(bǔ)償波形分別施加到左聲道信號(hào)和右聲道信號(hào)。
14.一種音頻解碼設(shè)備,包括解碼器,用于通過(guò)解碼輸入信號(hào)而產(chǎn)生音頻信號(hào);以及共振補(bǔ)償器,用于將解碼器產(chǎn)生的音頻信號(hào)的原始波形變換為補(bǔ)償聲學(xué)共振效應(yīng)的補(bǔ)償波形。
15.根據(jù)權(quán)利要求14的音頻解碼設(shè)備,其中該共振補(bǔ)償器在聲學(xué)共振效應(yīng)發(fā)生之前對(duì)該音頻信號(hào)的原始波形進(jìn)行預(yù)補(bǔ)償。
16.根據(jù)權(quán)利要求14的音頻解碼設(shè)備,還包括揚(yáng)聲器,用于輸出所述補(bǔ)償波形,使得該補(bǔ)償波形通過(guò)該聲學(xué)共振效應(yīng)而轉(zhuǎn)換為原始波形。
17.根據(jù)權(quán)利要求16的音頻解碼設(shè)備,其中該揚(yáng)聲器形成與人耳的密封空間,并輸出補(bǔ)償波形,使得該補(bǔ)償波形在該密封空間內(nèi)共振。
18.根據(jù)權(quán)利要求16的音頻解碼設(shè)備,其中該揚(yáng)聲器包括頭戴式耳機(jī)、耳機(jī)、和電話聽(tīng)筒之一。
19.根據(jù)權(quán)利要求14的音頻解碼設(shè)備,其中所述聲學(xué)共振效應(yīng)包括在人耳基準(zhǔn)點(diǎn)(ERP)和鼓膜基準(zhǔn)點(diǎn)(DRP)之間產(chǎn)生的ERP-DRP共振效應(yīng)。
20.根據(jù)權(quán)利要求14的音頻解碼設(shè)備,其中該補(bǔ)償波形是通過(guò)翻轉(zhuǎn)由于所述聲學(xué)共振效應(yīng)獲得的共振波形而獲得的。
21.根據(jù)權(quán)利要求14的音頻解碼設(shè)備,其中該共振補(bǔ)償器包括共振頻帶提取器,用于從所述音頻信號(hào)中提取由于聲學(xué)共振效應(yīng)而隨后被變換的頻帶;以及波形變換器,用于將提取的頻帶變換為補(bǔ)償波形。
22.一種補(bǔ)償音頻信號(hào)中的聲學(xué)共振效應(yīng)的設(shè)備,該設(shè)備包括解碼器,用于接收音頻信號(hào)并解碼所接收的音頻信號(hào);至少一個(gè)波形變換器,用于將補(bǔ)償波形施加到該音頻信號(hào);以及至少一個(gè)揚(yáng)聲器單元,用于輸出向其施加了補(bǔ)償波形的音頻信號(hào),其中該補(bǔ)償波形包括由聲學(xué)共振效應(yīng)引起的共振波形的反轉(zhuǎn)。
23.一種在其上具有執(zhí)行音頻解碼方法的可執(zhí)行代碼的計(jì)算機(jī)可讀介質(zhì),該介質(zhì)包括通過(guò)解碼輸入信號(hào)而產(chǎn)生音頻信號(hào)的第一可執(zhí)行代碼;以及將該音頻信號(hào)的原始波形變換為補(bǔ)償聲學(xué)共振效應(yīng)的補(bǔ)償波形的第二可執(zhí)行代碼。
24.一種音頻編碼方法,包括根據(jù)調(diào)整為說(shuō)明聲學(xué)共振效應(yīng)的掩蔽閾值曲線來(lái)計(jì)算音頻信號(hào)的多個(gè)子帶樣本中的每一個(gè)樣本的信掩比(SMR);根據(jù)所計(jì)算的信掩比而將比特分配給每個(gè)子帶樣本;以及在所分配的比特范圍內(nèi)對(duì)這些子帶樣本進(jìn)行量化和編碼。
25.根據(jù)權(quán)利要求24的音頻編碼方法,其中該聲學(xué)共振效應(yīng)包括在人耳基準(zhǔn)點(diǎn)(ERP)和鼓膜基準(zhǔn)點(diǎn)(DRP)之間產(chǎn)生的ERP-DRP共振效應(yīng)。
26.根據(jù)權(quán)利要求24的音頻編碼方法,其中計(jì)算音頻信號(hào)的多個(gè)子帶樣本中的每一個(gè)樣本的SMR包括根據(jù)具有由于ERP-DRP共振效應(yīng)而增加的掩蔽閾值的ERP-DRP共振頻帶,來(lái)計(jì)算音頻信號(hào)的每個(gè)子帶樣本的信掩比。
27.根據(jù)權(quán)利要求24的音頻編碼方法,其中計(jì)算音頻信號(hào)的多個(gè)子帶樣本中的每一個(gè)樣本的SMR包括通過(guò)以下步驟來(lái)計(jì)算SMR確定由于聲學(xué)共振效應(yīng)而隨后被變換的掩蔽閾值,從音頻信號(hào)的波形來(lái)確定子帶樣本的對(duì)應(yīng)聲壓級(jí),以及計(jì)算所確定的掩蔽閾值和所確定的對(duì)應(yīng)聲壓級(jí)之間的差。
28.根據(jù)權(quán)利要求24的音頻編碼方法,其中計(jì)算音頻信號(hào)的多個(gè)子帶樣本中的每一個(gè)樣本的SMR包括計(jì)算與由于聲學(xué)共振效應(yīng)而隨后被變換的頻帶對(duì)應(yīng)的共振頻帶的SMR;以及計(jì)算與不是該共振頻帶的頻帶對(duì)應(yīng)的高和低頻帶的SMR。
29.一種增加音頻編碼設(shè)備中的壓縮率的方法,該方法包括當(dāng)再現(xiàn)具有多個(gè)子帶的音頻信號(hào)時(shí),確定通過(guò)聲學(xué)共振效應(yīng)放大的聲學(xué)共振頻帶;確定該音頻信號(hào)中的多個(gè)子帶中的任一個(gè)子帶是否被聲學(xué)共振頻帶掩蔽;以及用分配給沒(méi)有被聲學(xué)共振頻帶掩蔽的子帶的信號(hào)信息的第一比特量和分配給被聲學(xué)共振頻帶掩蔽的子帶的信號(hào)信息的第二比特量來(lái)編碼音頻信號(hào)。
30.根據(jù)權(quán)利要求29的方法,其中所述第一比特量大于第二比特量。
31.根據(jù)權(quán)利要求30的方法,其中確定所述聲學(xué)共振頻帶包括調(diào)整該聲學(xué)共振頻帶附近的預(yù)定掩蔽閾值曲線,以補(bǔ)償聲學(xué)共振效應(yīng)。
32.根據(jù)權(quán)利要求31的方法,其中確定該音頻信號(hào)中的多個(gè)子帶中的任一個(gè)子帶是否被掩蔽包括將該多個(gè)子帶的每一個(gè)子帶的信號(hào)電平與來(lái)自經(jīng)過(guò)調(diào)整的掩蔽閾值曲線的對(duì)應(yīng)掩蔽閾值進(jìn)行比較,以確定該多個(gè)子帶中的每一個(gè)子帶的信號(hào)信息在聲學(xué)共振效應(yīng)的情況下是否能聽(tīng)得見(jiàn)。
33.根據(jù)權(quán)利要求29的方法,其中所述聲學(xué)共振頻帶約為1至10KHz,并且所述聲學(xué)共振效應(yīng)是由于在至少一個(gè)人耳中由至少一個(gè)揚(yáng)聲器形成密封空間而引起的。
34.一種音頻編碼設(shè)備,包括心理聲學(xué)模型單元,用于根據(jù)調(diào)整為說(shuō)明聲學(xué)共振效應(yīng)的掩蔽閾值曲線來(lái)計(jì)算音頻信號(hào)的多個(gè)子帶樣本中的每一個(gè)樣本的信掩比;比特分配器,用于根據(jù)所計(jì)算的信掩比而將比特分配給每個(gè)子帶樣本;以及量化/編碼單元,用于在所分配的比特范圍內(nèi)對(duì)這些子帶樣本進(jìn)行量化和編碼。
35.根據(jù)權(quán)利要求34的音頻編碼設(shè)備,其中所述聲學(xué)共振效應(yīng)包括在人耳基準(zhǔn)點(diǎn)(ERP)和鼓膜基準(zhǔn)點(diǎn)(DRP)之間產(chǎn)生的ERP-DRP共振效應(yīng)。
36.根據(jù)權(quán)利要求34的音頻編碼設(shè)備,其中所述心理聲學(xué)模型單元根據(jù)具有由于ERP-DRP共振效應(yīng)而增加的掩蔽閾值的ERP-DRP共振頻帶,來(lái)計(jì)算音頻信號(hào)的每個(gè)子帶樣本的信掩比。
37.根據(jù)權(quán)利要求36的音頻編碼設(shè)備,其中所述心理聲學(xué)模型單元包括共振頻帶計(jì)算器,用于計(jì)算與由于聲學(xué)共振效應(yīng)而隨后被變換的頻帶對(duì)應(yīng)的共振頻帶的SMR;以及高/低頻帶計(jì)算器,用于計(jì)算與不是該共振頻帶的頻帶對(duì)應(yīng)的高和低頻帶的SMR。
38.一種增加音頻信號(hào)信息的壓縮率的編碼設(shè)備,包括共振頻帶計(jì)算器,用于當(dāng)再現(xiàn)具有多個(gè)子帶的音頻信號(hào)時(shí),確定通過(guò)聲學(xué)共振效應(yīng)放大的聲學(xué)共振頻帶,并確定該音頻信號(hào)中的多個(gè)子帶中的任一個(gè)是否被聲學(xué)共振頻帶掩蔽;以及比特分配單元,用于給沒(méi)有被聲學(xué)共振頻帶掩蔽的子帶的信號(hào)信息分配比特、和不給被聲學(xué)共振頻帶掩蔽的子帶的信號(hào)信息分配比特。
39.根據(jù)權(quán)利要求38的編碼設(shè)備,其中所述共振頻帶計(jì)算器調(diào)整預(yù)定掩蔽閾值曲線以補(bǔ)償聲學(xué)共振效應(yīng)。
40.根據(jù)權(quán)利要求39的編碼設(shè)備,其中所述共振頻帶計(jì)算器將該多個(gè)子帶中的每一個(gè)子帶的信號(hào)電平與來(lái)自經(jīng)過(guò)調(diào)整的掩蔽閾值曲線的對(duì)應(yīng)掩蔽閾值進(jìn)行比較,以確定該多個(gè)子帶中的每一個(gè)子帶的信號(hào)信息在聲學(xué)共振效應(yīng)的情況下是否能聽(tīng)得見(jiàn)。
41.根據(jù)權(quán)利要求38的編碼設(shè)備,還包括量化/編碼單元,用于根據(jù)比特分配單元分配的比特來(lái)編碼所述多個(gè)子帶的信號(hào)信息。
42.根據(jù)權(quán)利要求38的編碼設(shè)備,其中所述共振頻帶約為1至10KHz,所述聲學(xué)共振效應(yīng)是由于在至少一個(gè)人耳中由至少一個(gè)揚(yáng)聲器形成密封空間而引起的。
43.根據(jù)權(quán)利要求38的編碼設(shè)備,還包括高/低頻帶計(jì)算器,用于確定音頻信號(hào)中多個(gè)子帶中的任一個(gè)是否被音頻信號(hào)的其它頻帶掩蔽,并將該確定提供給比特分配單元。
44.一種在其上具有執(zhí)行音頻編碼方法的可執(zhí)行代碼的計(jì)算機(jī)可讀介質(zhì)。該介質(zhì)包括第一可執(zhí)行代碼,根據(jù)調(diào)整為說(shuō)明聲學(xué)共振效應(yīng)的掩蔽閾值曲線,來(lái)計(jì)算音頻信號(hào)的多個(gè)子帶樣本中的每一個(gè)樣本的SMR;第二可執(zhí)行代碼,根據(jù)所計(jì)算的信掩比而將比特分配給每個(gè)子帶樣本;以及第三可執(zhí)行代碼,在所分配的比特范圍內(nèi)對(duì)這些子帶樣本進(jìn)行量化和編碼。
全文摘要
一種編碼音頻信號(hào)的設(shè)備和方法以及一種解碼音頻信號(hào)的設(shè)備和方法。該音頻解碼方法包括通過(guò)解碼輸入信號(hào)而產(chǎn)生音頻信號(hào);以及將所產(chǎn)生的音頻信號(hào)的原始波形變換為補(bǔ)償音頻信號(hào)中的聲學(xué)共振效應(yīng)的補(bǔ)償波形。因此,通過(guò)利用翻轉(zhuǎn)的補(bǔ)償波形來(lái)補(bǔ)償作為由于人耳的結(jié)構(gòu)而產(chǎn)生的聲學(xué)共振效應(yīng)的ERP-DRP共振效應(yīng),可以經(jīng)由耳機(jī)、頭戴式耳機(jī)、或電話聽(tīng)筒等等聽(tīng)到中頻帶沒(méi)有放大的具有極好聲音質(zhì)量的音頻信號(hào)。
文檔編號(hào)H04N5/76GK1707955SQ20051007557
公開(kāi)日2005年12月14日 申請(qǐng)日期2005年6月6日 優(yōu)先權(quán)日2004年6月4日
發(fā)明者李俊弦, 張成哲 申請(qǐng)人:三星電子株式會(huì)社
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
湟中县| 溧水县| 武宣县| 孟津县| 屏边| 扬州市| 保定市| 随州市| 丰台区| 镇江市| 文安县| 长沙市| 平塘县| 宜良县| 黄冈市| 阿拉善左旗| 无棣县| 陈巴尔虎旗| 定日县| 福清市| 朝阳区| 酉阳| 新建县| 乐都县| 石泉县| 会理县| 化隆| 进贤县| 大丰市| 灵璧县| 武陟县| 临沂市| 黄浦区| 无为县| 江达县| 昌乐县| 敦煌市| 视频| 钟祥市| 贵港市| 纳雍县|