欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于控制平均編碼率的系統(tǒng)和方法

文檔序號:9278246閱讀:228來源:國知局
用于控制平均編碼率的系統(tǒng)和方法
【專利說明】
[0001] 相關(guān)申請案
[0002] 本申請案與2013年2月21日申請的美國臨時專利申請案第61/767, 439號"用于 控制平均速率的系統(tǒng)和方法(SYSTEMSANDMETHODSFORCONTROLLINGANAVERAGERATE) " 有關(guān)且主張其優(yōu)先權(quán)。
技術(shù)領(lǐng)域
[0003] 本發(fā)明大體上涉及電子裝置。更具體地說,本發(fā)明涉及用于控制平均編碼率的系 統(tǒng)和方法。
【背景技術(shù)】
[0004] 最近幾十年中,電子裝置的使用已變得普遍。明確地說,電子技術(shù)的進(jìn)展已降低了 愈加復(fù)雜且有用的電子裝置的成本。成本降低和消費(fèi)者需求已使電子裝置的使用劇增,使 得其在現(xiàn)代社會中幾乎隨處可見。由于電子裝置的使用已推廣開來,因此具有對電子裝置 的新的且改善的特征的需求。更具體地說,人們常常尋求執(zhí)行新功能和/或更快、更高效且 以更高質(zhì)量執(zhí)行功能的電子裝置。
[0005] 一些電子裝置(例如,移動電話、智能型手機(jī)、音頻記錄器、攝錄影機(jī)、計算機(jī)等) 利用音頻信號。這些電子裝置可編碼、存儲和/或發(fā)射音頻信號。例如,智能型手機(jī)可獲得、 編碼和發(fā)射用于電話呼叫的語音信號,同時另一智能型手機(jī)可接收所述語音信號并對其進(jìn) 行解碼。
[0006] 然而,在音頻信號的編碼、發(fā)射和/或解碼中存在特定挑戰(zhàn)。例如,電子裝置可能 以非所要速率對音頻信號進(jìn)行編碼,此可占用過多的傳輸頻寬。從此論述可了解,改善編碼 的系統(tǒng)和方法可為有益的。

【發(fā)明內(nèi)容】

[0007] 本發(fā)明描述一種用于通過電子裝置控制平均編碼率的方法。所述方法包含獲得語 音信號。所述方法也包含確定第一平均速率。所述方法進(jìn)一步包含基于所述第一平均速率 確定第一閾值。所述方法額外包含通過基于所述第一閾值確定至少一個其它閾值而控制所 述平均編碼率。所述方法也包含發(fā)送經(jīng)編碼語音信號。所述第一閾值可將幀分類為清潔幀 或有噪聲幀。所述至少一個其它閾值可為閾值組。
[0008] 控制所述平均編碼率也可包含確定幀型樣。第一幀型樣可需要低速率幀之間的最 小數(shù)目個高速率幀,且第二幀型樣可僅允許高速率幀之間的最大數(shù)目個低速率幀。
[0009] 確定所述至少一個其它閾值可進(jìn)一步基于度量。確定所述至少一個其它閾值可包 含在所述度量不大于所述第一閾值的情況下選擇第一閾值組,且在所述度量大于所述第一 閾值的情況下選擇第二閾值組。所述第一閾值組可為第一幀調(diào)整閾值組,且所述第二閾值 組可為第二幀調(diào)整閾值組。
[0010] 控制所述平均編碼率可包含基于所述第一平均速率調(diào)整所述第一閾值。控制所述 平均編碼率可包含基于所述第一平均速率調(diào)整至少一個發(fā)聲閾值。調(diào)整所述至少一個發(fā)聲 閾值可包含選擇一發(fā)聲閾值組。
[0011] 還描述一種用于控制平均編碼率的電子裝置。所述電子裝置包含平均速率確定電 路,所述平均速率確定電路確定第一平均速率。所述電子裝置也包含閾值確定電路,所述閾 值確定電路基于所述第一平均速率確定第一閾值。所述電子裝置進(jìn)一步包含編碼率控制器 電路,所述編碼率控制器電路包含所述平均速率確定電路和所述閾值確定電路。所述編碼 率控制器通過基于所述第一閾值確定至少一個其它閾值而控制所述平均編碼率。
[0012] 還描述一種用于控制平均編碼率的計算機(jī)程序產(chǎn)品。所述計算機(jī)程序產(chǎn)品包含具 有指令的非暫時性有形計算機(jī)可讀媒體。所述指令包含用于使電子裝置獲得語音信號的代 碼。所述指令也包含用于使所述電子裝置確定第一平均速率的代碼。所述指令進(jìn)一步包含 用于使所述電子裝置基于所述第一平均速率確定第一閾值的代碼。所述指令額外包含用于 使所述電子裝置通過基于所述第一閾值確定至少一個其它閾值而控制所述平均編碼率的 代碼。所述指令也包含用于使所述電子裝置發(fā)送經(jīng)編碼語音信號的代碼。
[0013] 也描述一種用于控制平均編碼率的設(shè)備。所述設(shè)備包含用于獲得語音信號的裝 置。所述設(shè)備也包含用于確定第一平均速率的裝置。所述設(shè)備進(jìn)一步包含用于基于所述第 一平均速率確定第一閾值的裝置。所述設(shè)備額外包含用于通過基于所述第一閾值確定至少 一個其它閾值而控制所述平均編碼率的裝置。所述設(shè)備也包含用于發(fā)送經(jīng)編碼語音信號的 裝置。
【附圖說明】
[0014] 圖1為說明編碼器和解碼器的通用實例的框圖;
[0015] 圖2為說明編碼器和解碼器的基本實施方案的實例的框圖;
[0016] 圖3為說明電子裝置的一個配置的框圖,在所述電子裝置中可實施用于控制平均 編碼率的系統(tǒng)和方法;
[0017] 圖4為說明用于控制平均編碼率的方法的一個配置的流程圖;
[0018] 圖5為說明用于基于第一閾值和度量確定至少一個其它閾值的方法的一個配置 的流程圖;
[0019] 圖6為說明用于控制平均編碼率的方法的更特定配置的流程圖;
[0020] 圖7為說明用于減小平均編碼率的方法的一個配置的流程圖;
[0021] 圖8為說明用于增大平均編碼率的方法的一個配置的流程圖;
[0022] 圖9為說明發(fā)聲閾值組的實例的圖;
[0023] 圖10為說明編碼率控制器的一個配置的框圖;
[0024] 圖11為說明用于控制平均編碼率的方法的另一更特定配置的流程圖;
[0025] 圖12為說明無線通信裝置的一個配置的框圖;和
[0026] 圖13說明可用于電子裝置中的各種組件。
【具體實施方式】
[0027] 現(xiàn)參考諸圖描述各種配置,在諸圖中,相似參考數(shù)字可指示功能上類似的元件???以多種不同配置來布置和設(shè)計如諸圖中所大體描述和說明的系統(tǒng)和方法。因此,對如諸圖 中所表示的若干配置的以下更詳細(xì)描述并不希望限制如所主張的范圍,而僅表示系統(tǒng)和方 法。
[0028] 圖1為說明編碼器104和解碼器108的通用實例的框圖。編碼器104接收語音信 號102。語音信號102可為在任何頻率范圍中的語音信號。例如,語音信號102可為具有0 千赫茲(kHz)到24kHz的大致頻率范圍的全頻帶信號、具有0kHz到16kHz的大致頻率范圍 的超寬帶信號、具有0kHz到8kHz的大致頻率范圍的寬帶信號或具有0kHz到4kHz的大致 頻率范圍的窄頻信號。語音信號102的其它可能頻率范圍包含300Hz到3400Hz(例如,公 眾交換電話網(wǎng)絡(luò)(PSTN)的頻率范圍)、14kHz到20kHz、16kHz到20kHz和16kHz到32kHz。 在一些配置中,語音信號102可按16kHz進(jìn)行采樣,且可具有0kHz到8kHz的大致頻率范圍。
[0029] 編碼器104對語音信號102進(jìn)行編碼以產(chǎn)生經(jīng)編碼語音信號106。大體來說,經(jīng)編 碼語音信號106包含表示語音信號102的一或多個參數(shù)。所述參數(shù)中的一或多者可經(jīng)量化。 所述一或多個參數(shù)的實例包含濾波參數(shù)(例如,加權(quán)因數(shù)、線譜頻率(LSF)、線譜對(LSP)、 導(dǎo)抗譜頻率(ISF)、導(dǎo)抗譜對(ISP)、部分相關(guān)性(PARC0R)系數(shù)、反射系數(shù)和/或?qū)?shù)面積 比率值(log-area-ratiovalue)等),和包含于經(jīng)編碼激發(fā)信號中的參數(shù)(例如,增益因 數(shù)、音調(diào)滯后、(經(jīng)量化)振幅信息、(經(jīng)量化)相位信息、自適應(yīng)性碼本索引、自適應(yīng)性碼本 增益、固定碼本索引和/或固定碼本增益等)。所述參數(shù)可對應(yīng)于一或多個頻帶。解碼器 108對經(jīng)編碼語音信號106進(jìn)行解碼以產(chǎn)生經(jīng)解碼語音信號110。例如,解碼器108基于包 含于經(jīng)編碼語音信號106中的一或多個參數(shù)而構(gòu)建經(jīng)解碼語音信號110。經(jīng)解碼語音信號 110可為原始語音信號102的大致重現(xiàn)。
[0030] 編碼器104可以硬件(例如,電路)、軟件或兩者的組合加以實施。例如,編碼器 104可實施為專用集成電路(ASIC)或具有指令的處理器。類似地,解碼器108可以硬件(例 如,電路)、軟件或兩者的組合加以實施。例如,解碼器108可實施為專用集成電路(ASIC) 或具有指令的處理器。編碼器104與解碼器108可實施于單獨電子裝置上或相同電子裝置 上。
[0031] 在一些配置中,編碼器104和/或解碼器108可包含于語音譯碼系統(tǒng)中,在所述語 音譯碼系統(tǒng)處,通過使激發(fā)信號傳遞經(jīng)過合成濾波器以產(chǎn)生經(jīng)合成語音輸出(例如,經(jīng)解 碼語音信號110)而進(jìn)行語音合成。在此類系統(tǒng)中,編碼器104接收語音信號102,接著將語 音信號102開窗成幀(例如,20毫秒(ms)幀),并產(chǎn)生合成濾波參數(shù)和產(chǎn)生對應(yīng)激發(fā)信號 所需的參數(shù)。這些參數(shù)可作為經(jīng)編碼語音信號106而傳輸?shù)浇獯a器108。解碼器108可使 用這些參數(shù)來產(chǎn)生合成濾波器(例如,1/A(z))和對應(yīng)激發(fā)信號,且可將所述激發(fā)信號傳遞 經(jīng)過合成濾波器以產(chǎn)生經(jīng)解碼語音信號110。圖1可為此類語音編碼器/解碼器系統(tǒng)的簡 化框圖。
[0032] 圖2為說明編碼器204和解碼器208的基本實施方案的實例的框圖。編碼器204 可為結(jié)合圖1描述的編碼器104的一個實例。編碼器204可包含分析模塊212、系數(shù)變換 214、量化器A216、反量化器A218、反系數(shù)變換A220、分析濾波器222和量化器B224。編 碼器204和/或解碼器208的組件中的一或多者可以硬件(例如,電路)、軟件或兩者的組 合加以實施。
[0033] 編碼器204接收語音信號202。應(yīng)注意,語音信號202可包含如上文結(jié)合圖1所描 述的任何頻率范圍(例如,語音頻率的整個頻帶或語音頻率的子頻帶)。
[0034] 在此實例中,分析模塊212將語音信號202的頻譜包封編碼為一組線性預(yù)測(LP) 系數(shù)(例如,分析濾波器系數(shù)A(z)、其可應(yīng)用于產(chǎn)生全極濾波器1/A(z),其中z為復(fù)數(shù) (complexnumber))。分析模塊212通常將輸入信號作為語音信號202的一系列非重疊幀 處理,其中針對每一幀或子幀計算一組新系數(shù)。在一些配置中,幀周期可為可預(yù)期語音信號 202在其內(nèi)在本地靜止的周期。幀周期的一個常見實例為20ms(例如,在8kHz的采樣率下 等效于160個樣本)。在一個實例中,分析模塊212經(jīng)配置以計算一組十個線性預(yù)測系數(shù)來 表征每一 20ms幀的共振峰結(jié)構(gòu)。也有可能實施分析模塊212以將語音信號202作為一系 列重疊幀處理。
[0035] 分析模塊212可經(jīng)配置以直接分析每一幀的樣本,或可首先根據(jù)開窗函數(shù)(例如, 漢明窗(Hammingwindow))來對樣本進(jìn)行加權(quán)。也可在大于幀的窗(例如30ms窗)內(nèi)執(zhí) 行分析。此窗可為對稱的(例如,5-20-5,使得其緊接20ms幀之前和之后包含5毫秒)或 不對稱的(例如,10-20,使得其包含前一幀之后10ms)。分析模塊212通常經(jīng)配置以使用列 文遜-杜賓(Levinson-Durbin)遞回或勒魯-蓋恩(Leroux-Gueguen)算法來計算線性預(yù) 測系數(shù)。在另一實施方案中,分析模塊212可經(jīng)配置以針對每一幀計算一組倒頻譜系數(shù)而 非一組線性預(yù)測系數(shù)。
[0036] 通過量化所述系數(shù),編碼器204的輸出速率可顯著減小,而對重現(xiàn)質(zhì)量具有相對 較小的影響。線性預(yù)測系數(shù)難以高效地量化,且通常映射到例如LSF的另一表示以用于量 化和/或熵編碼。在圖2的實例中,系數(shù)變換214將系數(shù)的集合變換成對應(yīng)LSF向量(例 如,一組LSF)。系數(shù)的其它一對一表示包含LSP、PARCOR系數(shù)、反射系數(shù)、對數(shù)面積比率值、 ISP和ISF。例如,ISF可用于GSM(全球移動通信系統(tǒng))、AMR-WB(自適應(yīng)性多速率寬帶) 編解碼器中。為方便起見,術(shù)語"線譜頻率"、"LSF"、"LSF向量"和相關(guān)術(shù)語可用以指LSF、 LSP、ISF、ISP、PARC0R系數(shù)、反射系數(shù)和對數(shù)面積比率值中的一或多者。通常,一組系數(shù)與 對應(yīng)LSF向量之間的變換是可逆的,但一些配置可包含其中變換不可逆而無錯誤的編碼器 204的實施方案。
[0037] 量化器A216經(jīng)配置以量化LSF向量(或其它系數(shù)表示)。編碼器204可輸出此 量化的結(jié)果作為濾波參數(shù)228。量化器A216通常包含向量量化器,所述向量量化器將輸入 向量(例如,LSF向量)編碼為對表或碼本中的對應(yīng)向量條目的索引。
[0038] 如圖2中所見,編碼器204也通過使語音信號202傳遞經(jīng)過根據(jù)系數(shù)的集合加以 配置的分析濾波器222(也稱為白化或預(yù)測錯誤濾波器)而產(chǎn)生殘余信號。分析濾波器222 可實施為有限脈沖響應(yīng)(FIR)濾波器或無限脈沖響應(yīng)(IIR)濾波器。此殘余信號將通常含 有未表示于濾波參數(shù)228中的語音幀的對感知重要的信息,例如與音調(diào)相關(guān)的長期結(jié)構(gòu)。 量化器B224經(jīng)配置以計算此殘余信號的經(jīng)量化表示用于作為經(jīng)編碼激發(fā)信號226而輸 出。在一些配置中,量化器B224包含向量量化器,所述向量量化器將輸入向量編碼為表或 碼本中的對應(yīng)向量條目的索引。另外或替代地,量化器B224可經(jīng)配置以發(fā)送一或多個參 數(shù),向量可在解碼器208處從所述一或多個參數(shù)動態(tài)地加以產(chǎn)生,而非如在稀疏碼本方法 中從存儲裝置檢索。此類方法用于例如ACELP(代數(shù)碼激發(fā)線性預(yù)測)的譯碼方案和例如 3GPP2(第三代合作伙伴2)EVRC(增強(qiáng)型可變速率編解碼器)的編解碼器中。在一些配置 中,經(jīng)編碼激發(fā)信號226和濾波參數(shù)228可包含于經(jīng)編碼語音信號106中。
[0039] 編碼器204根據(jù)對應(yīng)解碼器208將可獲得的相同濾波器參數(shù)值來產(chǎn)生經(jīng)編碼激發(fā) 信號226可為有益的。以此方式,所得經(jīng)編碼激發(fā)信號226可在一定程度上解決那些參數(shù) 值中的非理想性,例如量化錯誤。因此,使用將在解碼器208處可用的相同系數(shù)值來配置分 析濾波器222可為有益的。在如圖2中所說明的編碼器204的基本實例中,反量化器A218 對濾波參數(shù)228進(jìn)行解量化。反系數(shù)變換A220將所得值映射回到一組對應(yīng)系數(shù)。此組系 數(shù)用以配置分析濾波器222以產(chǎn)生由量化器B224量化的殘余信號。
[0040] 編碼器204的一些實施方案經(jīng)配置以通過識別在一組碼本向量當(dāng)中最佳地匹配 殘余信號的一個碼本向量來計算經(jīng)編碼激發(fā)信號226。然而,應(yīng)注意,編碼器204也可經(jīng)實 施以計算殘余信號的經(jīng)量化表示而不實際上產(chǎn)生所述殘余信號。例如,編碼器204可經(jīng)配 置以使用數(shù)個碼本向量產(chǎn)生對應(yīng)合成信號(例如,根據(jù)一組當(dāng)前濾波參數(shù))且選擇與最佳 地匹配感知加權(quán)域中的原
當(dāng)前第1頁1 2 3 4 5 6 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
米林县| 云霄县| 会泽县| 鄂托克前旗| 贵溪市| 商丘市| 汉中市| 金堂县| 崇明县| 潞西市| 镇赉县| 泸溪县| 静宁县| 府谷县| 恩平市| 桓台县| 鄂州市| 潮州市| 平潭县| 苏尼特左旗| 临汾市| 张北县| 安平县| 连州市| 凉山| 金乡县| 柘城县| 连州市| 禹城市| 太康县| 铜梁县| 玉溪市| 扬中市| 巴彦淖尔市| 壤塘县| 电白县| 青阳县| 天全县| 长武县| 武乡县| 昔阳县|