專利名稱:嵌入在音頻信號中的隱藏數(shù)據(jù)的恢復的制作方法
技術(shù)領(lǐng)域:
本發(fā)明涉及通信系統(tǒng)。本發(fā)明特別但不排它地涉及下述通信系統(tǒng),在所述通信系
統(tǒng)中,經(jīng)由聲音數(shù)據(jù)信道提供數(shù)據(jù)給諸如蜂窩電話之類的電話設(shè)備。 WO 02/45273描述了一種蜂窩電話系統(tǒng),其中,在電視或無線電節(jié)目的音頻之內(nèi)向蜂窩電話傳送隱藏數(shù)據(jù)。在當前的上下文中,在下述意義上對數(shù)據(jù)進行隱藏對數(shù)據(jù)進行編碼以便試圖將數(shù)據(jù)隱藏在音頻中,使得它不引起用戶注意并在一定程度上為音頻所掩蓋。如本領(lǐng)域技術(shù)人員將會意識到的那樣,可接受的數(shù)據(jù)可聽度水平會取決于所涉及的應(yīng)用和用戶而變化。在這個較早的申請中描述了用于將數(shù)據(jù)編碼在音頻之內(nèi)的各種技術(shù),包括擴展頻譜編碼、回波調(diào)制、臨界頻帶編碼等。然而,發(fā)明人發(fā)現(xiàn)應(yīng)用程序軟件不得不執(zhí)行大量處理以便能夠恢復隱藏的數(shù)據(jù)。 因此, 一個實施例的一個目標就是要減少軟件應(yīng)用程序的處理需求。 在一個實施例中,提供了一種用于從輸入的音頻信號中恢復隱藏的數(shù)據(jù)或者用于
識別輸入的音頻信號的方法,該方法使用電信設(shè)備,所述電信設(shè)備具有音頻編碼器,所述音
頻編碼器用于壓縮輸入的音頻信號以便傳送到電信網(wǎng)絡(luò),該方法特征在于,通過音頻編解
碼器傳遞輸入的音頻信號以生成壓縮的音頻數(shù)據(jù),并且處理壓縮的音頻數(shù)據(jù)以恢復隱藏的
數(shù)據(jù)或者識別輸入的音頻信號。發(fā)明人發(fā)現(xiàn)通過音頻編碼器傳遞輸入的音頻,可以顯著減
少隨后的恢復隱藏的數(shù)據(jù)或者識別輸入的音頻所需的處理量。特別地,這個處理可以被執(zhí)
行而無須重新生成音頻樣本然后再著手用于恢復隱藏的數(shù)據(jù)或者用于識別音頻信號的傳
統(tǒng)技術(shù)。 在一個實施例中,音頻編碼器對輸入的音頻執(zhí)行線性預測(LP)分析以生成表示輸入的音頻的LP數(shù)據(jù),并且其中處理步驟處理LP數(shù)據(jù)以恢復隱藏的數(shù)據(jù)或者識別輸入的音頻信號。優(yōu)選地,音頻編碼器壓縮LP數(shù)據(jù)以生成壓縮的LP數(shù)據(jù),并且處理步驟包括從壓縮的音頻數(shù)據(jù)中重新生成LP數(shù)據(jù)的步驟。 編碼器所生成的LP數(shù)據(jù)可以包括LP濾波數(shù)據(jù)如LPC濾波系數(shù)、濾波極點或線狀
譜頻率,并且處理步驟使用這種LP濾波數(shù)據(jù)來恢復隱藏的數(shù)據(jù)或者識別音頻信號。 處理步驟可以包括生成LP合成濾波器的脈沖響應(yīng)的步驟,或者包括對LP濾波數(shù)
據(jù)執(zhí)行逆萊文森-德賓(Levinson-Durbin)算法的步驟。當生成脈沖響應(yīng)時,優(yōu)選地取它
的自相關(guān),由此可以比從脈沖響應(yīng)自身更加容易地識別回波存在與否。 音頻編碼器所生成的LP數(shù)據(jù)可以包括LP激發(fā)數(shù)據(jù)(諸如碼簿索引、激發(fā)脈沖位
置、脈沖符號等),并且處理步驟可以使用這種LP激發(fā)數(shù)據(jù)來恢復隱藏的數(shù)據(jù)或者識別音
頻信號。 在大多數(shù)情況下,LP數(shù)據(jù)會包括LP濾波數(shù)據(jù)和LP激發(fā)數(shù)據(jù)兩者,并且處理步驟可以處理對應(yīng)于所述LP濾波數(shù)據(jù)和所述LP激發(fā)數(shù)據(jù)中之一 的壓縮音頻數(shù)據(jù)中的全部或其子集以恢復隱藏的數(shù)據(jù)。 可以使用若干技術(shù)將數(shù)據(jù)隱藏在音頻信號之內(nèi)。然而,在優(yōu)選實施例中,將數(shù)據(jù)作為音頻信號的一個或多個回波而隱藏在音頻中。然后可以通過檢測回波來恢復隱藏的數(shù)據(jù)。要被隱藏的數(shù)據(jù)的每個符號可以通過回波的組合來(同時)表示,也可以表示為音
5頻信號之內(nèi)的回波的序列,并且處理步驟可以包括識別回波的組合以恢復隱藏的數(shù)據(jù)的步驟,或者包括跟蹤音頻中回波的序列以恢復隱藏的數(shù)據(jù)的步驟。 在一個實施例中,音頻編碼器具有預定操作頻帶,并且回波隱藏在音頻之內(nèi)的操
作頻帶預定部分之內(nèi),優(yōu)選地隱藏在頻帶的上部,并且其中處理步驟包括濾波步驟以過濾
掉這個預定部分之外的頻率。例如,在音頻編碼器具有300Hz至3. 4kHz的操作頻帶的情況
下,回波可以僅包括在1kHz和3. 4kHz之間的頻帶內(nèi),更優(yōu)選地在2kHz和3. 4kHz之間的頻
帶內(nèi),因為這可以減少對音頻信號的影響,所述音頻信號的能量通常位于操作帶寬的下部
之內(nèi)。在另一個實施例中,遍及操作頻帶都包括回波,但是處理步驟仍然執(zhí)行濾波以減少對
音頻的影響。這并不同樣優(yōu)選,因為回波信號的一部分會在濾波時丟失。 為了幫助識別回波在音頻編碼器輸出中的存在,處理步驟可以確定一個或多個自
相關(guān)值,其有助于突出回波。還可以執(zhí)行自相關(guān)值的幀間濾波以減少對緩慢變化的音頻成
分的影響。 所使用的音頻編碼器可以是若干已知的編碼器如CELP編碼器、AMR編碼器、寬帶AMR編碼器等中的任何一種。 在一個實施例中,處理步驟可以根據(jù)從編碼器輸出的壓縮音頻數(shù)據(jù)來確定頻譜圖,然后識別頻譜圖中的特定特征(類似于指紋)。這些特定特征識別輸入的音頻并且可以用于確定輸出給用戶的音頻的軌道信息,或者其可以用于將電信設(shè)備同步到音頻信號,例如輸出與音頻相關(guān)的字幕。 另一個實施例提供了一種電信設(shè)備,其包括用于接收聲音信號并且用于將接收到的所述聲音信號轉(zhuǎn)換成相應(yīng)的音頻電信號的裝置;用于采樣所述音頻電信號以產(chǎn)生數(shù)字音頻樣本的裝置;音頻編碼裝置,用于壓縮所述數(shù)字音頻樣本以生成壓縮的音頻數(shù)據(jù)以便傳送到電信網(wǎng)絡(luò);以及數(shù)據(jù)處理裝置,其耦合到所述音頻編碼裝置,用于處理壓縮的所述音頻數(shù)據(jù),以恢復接收到的所述聲音信號之內(nèi)傳送的隱藏數(shù)據(jù),或者識別接收到的所述聲音信號。 本發(fā)明的一個實施例還提供了一種數(shù)據(jù)隱藏設(shè)備,其包括音頻編碼裝置,用于接收并壓縮表示音頻信號的數(shù)字音頻樣本以生成壓縮的音頻數(shù)據(jù);用于接收要被隱藏在所述音頻信號之內(nèi)的數(shù)據(jù)并且用于取決于接收到的所述數(shù)據(jù)而改變壓縮的所述音頻數(shù)據(jù)以生成修改的壓縮音頻數(shù)據(jù)的裝置;以及用于使用修改的所述壓縮音頻數(shù)據(jù)來生成音頻樣本的裝置,所述音頻樣本表示了原始的音頻信號并傳送隱藏的所述數(shù)據(jù)。 另一個實施例提供了一種將數(shù)據(jù)隱藏在音頻信號中的方法,該方法包括取決于要被隱藏在音頻信號中的數(shù)據(jù)而向音頻添加一個或多個回波的步驟,并且其特征在于,在將回波與音頻信號進行組合之前對所述回波進行高通濾波。發(fā)明人發(fā)現(xiàn)通過僅在音頻信號的較高頻帶中添加回波,可以更加容易地檢測回波,并且減少了在遍及音頻頻帶施加回波時浪費的能量。 從參考附圖描述的示例性實施例的以下詳細描述中,本發(fā)明的這些以及其它方面將會變得明顯,其中
圖1示意性圖示了用于經(jīng)由電視信號的音頻部分將數(shù)據(jù)傳送到蜂窩電話的信號傳輸系統(tǒng); 圖2是圖示蜂窩電話主要組成部分的示意性框圖,所述蜂窩電話包括用于恢復接
6收到的音頻信號之內(nèi)隱藏的數(shù)據(jù)的軟件應(yīng)用程序; 圖3a是圖示形成圖2所示蜂窩電話一部分的音頻編解碼器所執(zhí)行的處理的示意性框圖; 圖3b圖示了音頻信號的LP編碼之下的源濾波器模型; 圖3c圖示了其中逆LPC濾波器可以用于從輸入的音頻信號中生成激發(fā)或剩余信號的方式; 圖4是圖示對來自音頻編解碼器的輸出執(zhí)行處理以恢復音頻信號中隱藏的數(shù)據(jù)的示意性框圖; 圖5是可以從其中確定隱藏的數(shù)據(jù)的自相關(guān)曲線圖; 圖6是圖示可以被執(zhí)行以恢復隱藏數(shù)據(jù)的代替處理的示意性框圖; 圖7是圖示其中可以從來自音頻編解碼器的輸出恢復隱藏的數(shù)據(jù)的進一步代替
的方式的示意性框圖; 圖8是圖示其中可以從音頻編解碼器所輸出的激發(fā)參數(shù)恢復隱藏的數(shù)據(jù)的方式的示意性框圖; 圖9是從中可以識別隱藏數(shù)據(jù)的由形成圖8所示電路一部分的自相關(guān)部件所輸出的自相關(guān)曲線圖; 圖10是圖示對圖4所示的處理電路進行改進的示意性框圖,其中LPC合成濾波器的脈沖響應(yīng)被高通濾波以減少對低頻音頻成分的影響; 圖11是圖示對圖4所示的處理電路進行進一步改進的示意性框圖,其中LPC系數(shù)被高通濾波以去除與低頻音頻成分相關(guān)的低階系數(shù); 圖12圖示了對圖4所示的處理電路進行的進一步改進,其中圖5所示的自相關(guān)曲線圖被高通濾波以去除緩慢變化的自相關(guān); 圖13是圖示其中隱藏的數(shù)據(jù)可以在由蜂窩電話接收之前被編碼在音頻之內(nèi)的一種方式的一般示意性框圖; 圖14是圖示其中蜂窩電話恢復使用圖13所示的系統(tǒng)編碼的數(shù)據(jù)的方式的一般框圖; 圖15是圖示其中LPC編碼器所生成的參數(shù)可以被修改并與剩余信號再組合以形成修改的音頻以便傳送到蜂窩電話的一種方式的框圖; 圖16圖示了代替的方式,其中從LPC編碼器獲得的激發(fā)參數(shù)被修改,并且從中剩余信號被生成,以供將修改的音頻與從LPC編碼器獲得的LPC系數(shù)進行合成時使用;以及
圖17是圖示其中音頻編解碼器的輸出可以被處理以恢復用于輸入音頻的頻譜圖
以供識別或表征輸入的音頻信號時使用的方式的框圖。
概述 圖l圖示了本發(fā)明的第一實施例,其中數(shù)據(jù)源l所生成的數(shù)據(jù)信號F(t)由編碼器5編碼在來自音頻源3的音頻軌道之內(nèi),以形成修改的用于電視節(jié)目的音頻軌道。在這個實施例中,數(shù)據(jù)信號F (t)傳送觸發(fā)信號,以便使運行于用戶的移動電話21上的軟件應(yīng)用程序的操作與電視節(jié)目同步。如圖l所示,編碼器5所輸出的修改的音頻軌道然后在信號發(fā)生器9中與來自視頻源7的相應(yīng)視頻軌道結(jié)合,以形成傳送電視節(jié)目的電視信號。在這個實施例中,數(shù)據(jù)源1、音頻源3、視頻源7和編碼器5全都位于電視演播室中,并且電視信號由分發(fā)網(wǎng)絡(luò)11分發(fā),在這個實施例中是射頻(RF)信號13。 RF信號13由電視天線15接收, 該電視天線15將電視信號提供給傳統(tǒng)的電視17。電視17具有顯示器(未示出),用于示 出視頻軌道;以及未示出的揚聲器,用于輸出修改的音頻軌道作為聲音信號19。
如示出的那樣,在這個實施例中,蜂窩電話21使用麥克風23檢測電視17所發(fā)出 的聲音信號19,該麥克風23將檢測到的聲音信號轉(zhuǎn)換成相應(yīng)的電信號。蜂窩電話21然后 解碼該電信號以恢復數(shù)據(jù)信號F(t)。蜂窩電話21還具有傳統(tǒng)的組成部分如揚聲器25、用 于與蜂窩狀基站35通信的天線27、顯示器29、用于輸入數(shù)字和字母的小鍵盤31以及用于 訪問菜單選項的菜單鍵33。如在W0 02/45273中說明的那樣,從音頻信號中恢復的數(shù)據(jù)可 以用于若干不同目的。 一種應(yīng)用是用于運行于蜂窩電話21上的軟件應(yīng)用程序與示出在電 視17上的電視節(jié)目的同步。例如,可能會在電視17上示出測驗秀(quiz show),并且蜂窩 電話21可能布置成生成并顯示涉及與測驗秀同步地示出的測驗的問題。問題例如可以預 先存儲在蜂窩電話21上,并且當從數(shù)據(jù)信號F(t)中恢復適當?shù)耐酱a時輸出。在測驗 秀的結(jié)尾,由用戶(經(jīng)由小鍵盤31)輸入到蜂窩電話21中的答案然后可以經(jīng)由蜂窩電話基 站35和電信網(wǎng)絡(luò)39傳送到遠程服務(wù)器41。服務(wù)器41然后可以核對從大量用戶接收到的 答案,并且基于給出的正確答案的數(shù)目和輸入答案所花費的時間來對它們進行分等。這種 計時信息也可以由蜂窩電話21確定并連同用戶的答案一起傳送到服務(wù)器41。如本領(lǐng)域技 術(shù)人員將會意識到的那樣,服務(wù)器41還可以處理從不同用戶接收到的信息并核對它可以 存儲在數(shù)據(jù)庫43中的各種用戶簡檔信息。這種用戶簡檔信息然后例如可以用于目標廣告。
在服務(wù)器41已識別一個或多個"獲勝"用戶之后,可以將信息或獎賞發(fā)送給那些 用戶。例如,可以將消息連同優(yōu)惠券或其它票據(jù)一起經(jīng)由電信網(wǎng)絡(luò)39發(fā)送給他們。如圖l 中的虛線44所示,服務(wù)器41也可以向數(shù)據(jù)源1提供要被編碼在音頻之內(nèi)的數(shù)據(jù)。
如上所述,發(fā)明人認識到通過利用由專用音頻編解碼器芯片所執(zhí)行的編碼,可以 減少需要由運行于蜂窩電話21上的軟件所執(zhí)行的處理。特別地,發(fā)明人發(fā)現(xiàn)使用音頻編解 碼器中固有的編碼過程作為解碼過程的初始步驟以恢復隱藏的數(shù)據(jù),減少了軟件用于恢復 隱藏的數(shù)據(jù)所需的處理。
蜂窩電話 圖2圖示了在這個實施例中使用的蜂窩電話21的主要組成部分。如所示,蜂窩電 話21包括麥克風23,用于接收聲音信號并且用于將它們轉(zhuǎn)換成等效電信號。這些電信號 然后由濾波器51進行濾波以去除通常在300Hz至3. 4kHz的頻帶之外的不想要的頻率(如 ETSI所公布的標準文件EN300-903中定義的那樣)。濾波的音頻然后由模擬數(shù)字轉(zhuǎn)換器53 數(shù)字化,該模擬數(shù)字轉(zhuǎn)換器53以8kHz的采樣頻率對濾波的音頻進行采樣,通常用13至16 位數(shù)字值表示每個樣本。數(shù)字化的音頻流(D(t))然后被輸入到音頻編解碼器55,該音頻編 解碼器55是自適應(yīng)多速率(AMR)編解碼器,其操作在下面進行描述。AMR編解碼器55所輸 出的壓縮音頻然后被傳遞到RF處理單元57,該RF處理單元57將壓縮的音頻調(diào)制到一個 或多個RF載波信號上,以便經(jīng)由天線27傳送到基站35。類似地,經(jīng)由天線27接收的壓縮 音頻信號被饋送到RF處理單元57,該RF處理單元57解調(diào)接收的RF信號以從( 一個或多 個)RF載波信號中恢復壓縮的音頻數(shù)據(jù),其被傳遞到AMR編解碼器55。 AMR編解碼器55然 后解碼壓縮的音頻數(shù)據(jù)以重新生成由此表示的音頻樣本,其經(jīng)由數(shù)字模擬轉(zhuǎn)換器59和放 大器61被輸出到揚聲器25。
如圖2所示,從AMR編解碼器55 (或RF處理單元57)輸出的壓縮音頻數(shù)據(jù)還被傳遞到處理器63,該處理器63由存儲在存儲器65中的軟件控制。所述軟件包括操作系統(tǒng)軟件67(用于控制蜂窩電話21的一般操作);瀏覽器68,用于訪問互聯(lián)網(wǎng);以及應(yīng)用程序軟件69 ,用于提供額外的功能給蜂窩電話21 。在這個實施例中,應(yīng)用程序軟件69配置成使蜂窩電話21以上面討論的方式與電視節(jié)目交互。為了做到這一點,應(yīng)用程序軟件69布置成接收并處理從AMR編解碼器55輸出的壓縮音頻數(shù)據(jù),以恢復控制應(yīng)用程序軟件69的隱藏數(shù)據(jù)F(t)。如下面將會更加詳細地描述的那樣,處理壓縮的音頻數(shù)據(jù)以恢復隱藏的數(shù)據(jù)F(t)可以被執(zhí)行而不必重新生成數(shù)字化的音頻樣本,同時減少了軟件應(yīng)用程序69用于直接從數(shù)字音頻樣本恢復隱藏的數(shù)據(jù)所需的處理。 響應(yīng)于恢復隱藏的數(shù)據(jù),應(yīng)用程序軟件69布置成生成并在顯示器29上輸出數(shù)據(jù)(例如針對用戶的問題),并且接收用戶經(jīng)由小鍵盤31輸入的答案。軟件應(yīng)用程序69然后將用戶的答案連同指示用戶輸入每個答案所花費的時間(通過軟件應(yīng)用程序69使用內(nèi)部計時器(未示出)來計算)的計時數(shù)據(jù)一起傳送到遠程服務(wù)器41 (通過預先存儲的URL或E. 164號碼等識別)。軟件應(yīng)用程序69還可以顯示從服務(wù)器41接收回來的結(jié)果信息,該信
息指示用戶相對于參與測驗的其它用戶做得有多好。
AMR編解碼器 盡管AMR編解碼器55是眾所周知的并且由3GPP標準實體(在標準文件TS 26. 090版本3. 1. 0中)定義,現(xiàn)在仍然參考圖3給出它執(zhí)行的處理的一般描述,以便讀者可以理解隨后應(yīng)用程序軟件69所執(zhí)行的處理的描述。 AMR編解碼器55 (自適應(yīng)多速率編碼器_解碼器)以若干不同的比特率將300Hz至3. 4kHz頻帶內(nèi)的8kHz采樣數(shù)據(jù)音頻轉(zhuǎn)換成位流。編解碼器55因此非常適用于傳輸率可能需要變化的情形。它的輸出比特率可以適合于匹配盛行的傳輸狀況,因為這個原因,所以它是3G標準并且當前用在大多數(shù)的蜂窩電話21中。 盡管比特率是可變的,但是相同的基本編碼過程由編解碼器55在所有速率下使用。量化處理,其參數(shù)的選擇會被傳輸并且傳輸?shù)乃俾时桓淖円詫崿F(xiàn)八個比特率或模式下的操作12. 2、10. 2、7. 95、7. 40、6. 70、5. 90、5. 15和4. 75Kbits/s。在這個實施例中使用最高比特率模式(12. 2Kbits/s)。 在AMR編解碼器55中存在四個主要部件子系統(tǒng),下面對它們進行描述。它們是
音調(diào)預測
LPC分析
固定碼簿查找
自適應(yīng)碼簿 AMR編解碼器55按順序應(yīng)用它們,盡管對于當前的目的而言,更容易的是最后處理音調(diào)預測并作為自適應(yīng)碼簿處理的一部分。AMR編解碼器55建立在碼簿激發(fā)線性預測(CELP)編碼系統(tǒng)周圍。輸入的音頻信號被分成160個樣本幀(f),并且?guī)?jīng)歷線性預測分析以每幀提取少量系數(shù)用于編碼和傳輸。這些系數(shù)表征了信號在幀內(nèi)的短期頻譜。除了這些系數(shù)之外,AMR編解碼器55還計算LPC剩余(也被稱為激發(fā)),其使用音調(diào)預測器所輔助的自適應(yīng)和固定碼簿進行編碼。下面描述這些子系統(tǒng)。
LPC分析
9
LPC分析由圖3a所示的LPC分析部件71執(zhí)行。LPC假定了語音產(chǎn)生的經(jīng)典源濾波器模型(圖3b所示),其中,語音被認為是緩慢時變?yōu)V波器(LPC合成濾波器72)的輸出,由用于諸如元音中的有聲語音的規(guī)則聲門脈沖和用于例如/sh/的無聲語音的白噪聲或者用于像/z/的混合發(fā)聲聲音的這兩者的混合所激發(fā)(用激發(fā)塊74表示)。盡管基于語音產(chǎn)生的模型,但是還提供了用于對所有聲音進行編碼的有效模型。合成濾波器72假定為全極點,亦即它僅具有諧振。這個假定是LPC分析方法的基礎(chǔ)。在采樣數(shù)據(jù)(z平面)表示法中,它表明在傳遞函數(shù)H(z)的分母中,傳遞函數(shù)純粹是z—1的多項式。<formula>formula see original document page 10</formula> 這個濾波器對輸入激發(fā)en的時間序列響應(yīng)sn于是為
s,, = eK+ S & 5"—: (2) 這就是說系統(tǒng)的輸出sn是輸入en加上p個以前輸出的加權(quán)線性之和。這是LPC的理論基礎(chǔ)。限度p是LPC的"階",其通常是固定的并且在AMR編解碼器55中p等于10。在AMR編解碼器55(以及其它基于LPC的系統(tǒng))中,使用線性預測分析為輸入音頻的每個幀估計濾波權(quán)重或系數(shù)A —旦被估計,它們?nèi)缓缶捅晦D(zhuǎn)換成適合于量化和傳輸?shù)男问健?br>
有效地估計系數(shù)ai需要進行逼近和假定。求解系數(shù)的所有方法都旨在7使en在上述方程(2)中的貢獻最小化。AMR編解碼器55使用自相關(guān)方法,這意味著求解p個聯(lián)立
線性方程;以矩陣的形式
<formula>formula see original document page 10</formula> 或者以更簡略的形式
Ru ai = & (4) R的元素rij是用于延遲|i-j|下的輸入音頻信號的自相關(guān)值。因為R是對稱的并且每個對角線的所有元素都相等,所以它對用于求逆矩陣的快速遞歸方法開放。在AMR編碼器55中使用萊文森_德賓算法。
線狀譜頻率 系數(shù)ai實際上不容易量化。它們隨時間相當不可預測地變化,并且具有未確定范圍之上的正負值。AMR編解碼器55因此使用LSF確定部件73來將這些系數(shù)在量化之前轉(zhuǎn)換成線狀譜頻率,這去除了這些缺點并且允許LPC系數(shù)的有效編碼。系數(shù)ai是全極點合成濾波器72的權(quán)重,并且是第p階z—1多項式的系數(shù),其可以進行因式分解以求根。這些根是合成濾波器72中的諧振或極點。這些極點常常被量化以便在它們被合理排序時傳輸,具有平均值,并且從幀到幀更加可預測地變化,這給機會以節(jié)省位,其沒有編碼a,。線狀譜頻率(LSF)對這甚至比極點更好。重要的是要認識到LSF不與全極點模型的極點相同,但是它們相關(guān)。它們的導數(shù)是相關(guān)的,但是定性地涉及選擇合成濾波器的特殊表示中的兩組邊界條件,一個邊界條件對應(yīng)于當聲門完全開放時,另一個對應(yīng)于當聲門完全關(guān)閉時。這導致兩組具有零帶寬的假設(shè)極點,亦即完全諧振器。
LSF的主要優(yōu)點在于
LSF僅包括下述頻率,它們的帶寬總是零(盡管有極點兩倍多的LSF)
LSF理論上比極點更好排序 LSF因此服從非常低的比特率編碼。特別地,如圖3a所示,每個LSF的平均值(事先計算并存儲在數(shù)據(jù)存儲器75中)可以由平均值減法部件77減去。進一步,因為作為結(jié)果的增量(delta) LSF不隨時間迅速變化,所以預測器79然后可以用于預測當前的增量值,其由預測減法部件81從實際增量中減去。作為結(jié)果的數(shù)據(jù)然后由矢量量化(VQ)部件83另外編碼,該VQ部件83經(jīng)由單個索引一次性編碼兩個值,導致在某些情況下小于每值1位。AMR編解碼器55輸出如此獲得的VQ索引值用于當前幀作為編碼的LPC數(shù)據(jù),以便傳輸?shù)交?5。 LP激發(fā) 如上所述,AMR編解碼器55還編碼圖3b所示的模型的激發(fā)部分74。為了做到這一點,AMR編解碼器55生成激發(fā)信號的表示,以便它然后可以進行編碼。如圖3c所示,通過生成"逆"LPC濾波器76來做到這一點,該"逆"LPC濾波器76可以通過對輸入的音頻信號進行濾波來生成激發(fā)信號。從逆濾波器76獲得的激發(fā)信號有時也被稱為剩余。這個逆LPC濾波器76實際上從上面確定的相同系數(shù)&來定義,但是使用它們來定義具有下述傳遞函數(shù)的全零點模型 <formula>formula see original document page 11</formula>
這在時域中對應(yīng)于下述濾波器 <formula>formula see original document page 11</formula> (6)所定義的逆LPC濾波器76包括抵消(2)所定義的全極點合成濾波器72中的極點的零點。理論上,如果使用逆濾波器76對輸入的音頻信號進行濾波,然后通過合成濾波器72對生成的激發(fā)信號進行濾波,那么我們就得回了輸入的音頻信號(因此有名稱"逆"LPC濾波器)。重要的是要注意,原始音頻信號不需要是語音以進行完全重構(gòu)。如果LPC分析在表示輸入的音頻信號方面尚未做出好的工作,那么在剩余中會有更多信息。
對激發(fā)信號進行編碼是AMR編解碼器55中的固定碼簿部件87和自適應(yīng)碼簿部件89的工作。當與用于對LSF進行編碼的位的數(shù)目相比較時,在AMR編解碼器55中使用比較大量的位以對激發(fā)進行編碼在12. 2Kbits/s模式下每幀244位中的206個(84% ),在4. 75Kbits/s模式下為95中的72個(74% )。位的這種使用允許AMR編解碼器55以某種效果對非語音信號進行編碼。 有聲語音中的激發(fā)通過一系列聲音音調(diào)(在正常語音中對于成年男性為大約100Hz至130Hz,對于女性和小孩為兩倍)下的點擊(脈沖)來表征。在無聲語音中為白噪聲(或多或少)。在混合語音中是混合物。思考激發(fā)作為剩余的一種方式是認識到LPC分析在音頻的短期頻譜中取出凸起,留下具有平坦得多的頻譜的剩余。這適用于無論什么是輸入信號。 在AMR編解碼器55中,激發(fā)信號被編碼為固定碼簿和自適應(yīng)碼簿輸出的組合。自適應(yīng)碼簿并不作為任何東西存在以供查找,而只是在音調(diào)預測器所預測的時期反饋的組合碼簿輸出的以前組合的副本。
固定碼簿 固定碼簿部件87通過以下生成用于當前幀的激發(fā)信號(ef):使用用于當前幀的從LPC分析部件71輸出的LPC系數(shù)ai,以設(shè)置上面的方程(6)中所定義的逆濾波器76的權(quán)重;并且使用這個濾波器對輸入音頻的當前幀進行濾波。固定碼簿部件然后識別固定碼簿脈沖或模式(存儲在固定碼簿88中),其最佳迎合發(fā)生在激發(fā)信號中的新事物,這將會有效地修改來自自適應(yīng)碼簿部件89的以前幀的激發(fā)的滯后(延遲)副本。
每個幀再分成4個子幀,其中的每一個具有獨立編碼的固定碼簿輸出。用于一個子幀的固定碼簿激發(fā)將激發(fā)編碼為成對單一振幅脈沖的一系列5交錯鏈。針對MR122(AMR的12. 2kb/s模式的名稱)在下面的表格中示出每對脈沖的可能位置。如上面指示的那樣,
這種編碼使用了顯著數(shù)目的位。
軌道脈沖位置
10,50,5,10,15,20,25,30,35
21,61,6,11,16,21,26,31,36
32,72,7,12,17,22,27,32,37
43,83,8,13,19,23,28,33,38
54,94,9,14,19,24,29,34,39 每個軌道中的第一個脈沖的符號也被編碼;第二個脈沖的符號相同,除非當相反時它在軌道中更早下降。用于子幀的增益也被編碼。
自適應(yīng)碼簿 自適應(yīng)碼簿是組合激發(fā)的以前部分的時間延遲副本,并且在編碼有聲語音中是重要的。因為有聲語音是有規(guī)則的,所以可以使用固定碼簿輸出僅對當前音調(diào)周期和以前音調(diào)周期之間的差進行編碼。當添加到以前聲音周期的保存副本時,我們得到這個幀的激發(fā)的估計。不傳輸自適應(yīng)碼簿;編碼器和解碼器根據(jù)以前組合輸出和當前音調(diào)延遲來計算自適應(yīng)碼簿。 音調(diào)預測器 音調(diào)預測器(其形成自適應(yīng)碼簿部件89的一部分)的目的是要確定用于自適應(yīng)碼簿的最佳延遲。它是兩階段過程。第一個階段是單向開環(huán)音調(diào)預測,將語音與以前的樣本相關(guān)聯(lián),以找到有聲周期的估計(如果語音有聲的話)或者使誤差測量最小化的最佳重復率。這之后是重復的閉環(huán)預測,以在1/6的樣本之內(nèi)得到用于自適應(yīng)碼簿的最佳延遲。因為這個原因,語音預測是編碼器中的自適應(yīng)碼簿過程的一部分。計算受兩階段方法的限制,因為第二個更加詳細的搜索僅在少量樣本之上發(fā)生。AMR編解碼器55使用通過合成方法進行的分析,以便通過使針對候選延遲的輸出和輸入語音之間的均方差最小化來選擇最佳延遲。
12
因此,為了表示用于當前幀的激發(fā)信號,AMR編解碼器55輸出為當前幀確定的固定碼簿索引(每個子幀一個)、固定碼簿增益、自適應(yīng)碼簿延遲和自適應(yīng)碼簿增益。這個數(shù)據(jù)和LPC編碼的數(shù)據(jù)可用于在蜂窩電話21上運行的應(yīng)用程序軟件69,并且從中隱藏的數(shù)據(jù)必須被恢復。 數(shù)據(jù)隱藏和恢復 存在其中可以將數(shù)據(jù)F(t)隱藏在音頻信號之內(nèi)的各種方式,并且對于將數(shù)據(jù)隱藏在音頻中的不同技術(shù)的詳細討論,讀者可以參考Bender的論文"Techniques For DataHiding", IBM Systems Journal, Vol 35,no 384,1996。在當前的實施例中,通過將回波添加到音頻來將數(shù)據(jù)隱藏在音頻中,其中回波的時間延遲被改變以對數(shù)據(jù)進行編碼。例如通過使用簡單的沒有回波對應(yīng)于二進制0并且有回波對應(yīng)于二進制1的方案來執(zhí)行這種改變。代替地,二進制l可以通過在第一延遲添加回波來表示,并且二進制O可以通過在不同的第二延遲添加回波來表示?;夭ǖ姆栠€可以隨著要被隱藏的數(shù)據(jù)而變化。在更加復雜的編碼方案中,二進制1可以通過回波的第一組合或序列(同時有兩個或更多回波或者連續(xù)施加)來表示,并且二進制0可以通過不同的回波第二組合或序列來表示。
在這個實施例中,回波可以添加有0. 75ms和1. 00ms的延遲,并且二進制1通過為音頻(通常對應(yīng)于幾個AMR幀)的第一部分添加衰減的0.75ms回波繼之以在音頻的第二部分中添加衰減的1. 00ms回波來表示;并且二進制0通過為音頻的第一部分添加衰減的l.OOms回波繼之以在音頻的第二部分中添加衰減的O. 75ms回波來表示。因此,為了恢復隱藏的數(shù)據(jù),軟件應(yīng)用程序不得不處理來自AMR編解碼器55的編碼輸出,以識別音頻中接收的回波序列并從而識別音頻中隱藏的數(shù)據(jù)。 通常,通過以下在音頻信號中識別回波執(zhí)行音頻樣本的自相關(guān),以及識別對應(yīng)于任何回波的峰值。然而,如上所述,隱藏的數(shù)據(jù)將要從AMR編解碼器55的輸出中恢復。
數(shù)據(jù)恢復1 圖4圖示了其中回波可以被檢測并且隱藏的數(shù)據(jù)F(t)由應(yīng)用程序軟件69從AMR編解碼器55的輸出中恢復的一種方式。如所示,在這種技術(shù)中,應(yīng)用程序軟件單獨地從圖3所示的VQ部件83所輸出的LPC編碼信息中恢復隱藏的數(shù)據(jù)。如圖4所示,應(yīng)用程序軟件69所執(zhí)行的第一個處理由VQ部件91執(zhí)行,該VQ部件91反轉(zhuǎn)AMR編解碼器55所執(zhí)行的矢量量化。VQ部件91的輸出然后由預測加法部件93處理,該預測加法部件93將LSF增量預測(由預測器95確定)添加到來自VQ部件91的輸出。LSF平均值(從數(shù)據(jù)存儲器97獲得)然后被平均值加法部件99加回,以恢復用于當前幀的LSF。 LSF然后被LSF轉(zhuǎn)換部件101轉(zhuǎn)換回到LPC系數(shù)。由于在其它AMR處理階段中執(zhí)行的逼近和量化,如此確定的系數(shù)Si不會確切地與圖3中的LPC分析部件71所確定的系數(shù)相同。 如所示,在這個實施例中,確定的LPC系數(shù)^用于根據(jù)上述方程(2)配置LPC合成濾波器103。通過向如此配置的濾波器103施加脈沖(由脈沖發(fā)生器105生成),于是獲得這個合成濾波器103的脈沖響應(yīng)(h(n))。發(fā)明人發(fā)現(xiàn)回波存在于這個脈沖響應(yīng)(h(n))之內(nèi)并且可以從對應(yīng)于回波延遲的滯后周圍的脈沖響應(yīng)的自相關(guān)中找到。如所示,自相關(guān)部件107對在數(shù)據(jù)存儲器108中識別的滯后執(zhí)行這些自相關(guān)計算。圖5圖示了對于所有正滯后獲得的自相關(guān)。曲線圖將滯后識別為在零滯后處來自主峰值108的樣本。所以使用8kHz的采樣率,每個樣本對應(yīng)于O. 125ms的滯后。如所示,在零滯后處存在初始峰值108,繼之以在大約1. 00ms的滯后處的峰值110(對應(yīng)于離原點8個樣本)——表明當前幀具有1. 00ms回波。如本領(lǐng)域技術(shù)人員將會意識到的那樣,不需要針對所有回波都計算自相關(guān)——只需針對對應(yīng)于回波會被發(fā)現(xiàn)的那些地方的滯后周圍(亦即在0. 75ms和1. 00ms周圍)進行計算。 如圖4所示,自相關(guān)部件107所確定的自相關(guān)值被傳遞到回波識別部件109,該回波識別部件109確定在當前幀中是否存在任何回波(例如通過用適當?shù)拈撝祵ψ韵嚓P(guān)值進行設(shè)限來識別相關(guān)滯后處的任何峰值)。識別的峰值然后被傳遞到數(shù)據(jù)恢復部件111,該數(shù)據(jù)恢復部件111跟蹤相鄰幀之上的識別的回波序列,以檢測隱藏數(shù)據(jù)F(t)的二進制1或二進制O的存在。用這種方式,隱藏的數(shù)據(jù)被恢復,并且然后可以用于以上述方式控制應(yīng)用程序軟件69的操作。 發(fā)明人發(fā)現(xiàn)以這種方式恢復隱藏數(shù)據(jù)的計算需求顯著小于直接從數(shù)字化的音頻
樣本中恢復隱藏數(shù)據(jù)的計算需求。 數(shù)據(jù)恢復2 在上述實施例中,LPC合成濾波器的脈沖響應(yīng)的自相關(guān)被確定,并且從中確定回波的存在以恢復隱藏的數(shù)據(jù)。圖6圖示了可以根據(jù)用于恢復隱藏的數(shù)據(jù)的替代技術(shù)來執(zhí)行的處理。如通過比較圖4和6可以看到的那樣,這個實施例和第一個實施例之間的主要差別在于,重新生成的用于當前幀的LPC系數(shù)&被直接傳遞到自相關(guān)部件107,該自相關(guān)部件107計算LPC系數(shù)序列的自相關(guān)。這個實施例因此是第一個實施例的簡化。然而,在回波滯后處輸出的自相關(guān)中的峰值并不如同在第一個實施例中宣稱的那樣,所以因為這個原因,這個較簡單的實施例在足夠的處理能力可用的情況下不是優(yōu)選的。
數(shù)據(jù)恢復3 圖7圖示了可以在第三技術(shù)中執(zhí)行的處理,該第三技術(shù)用于識別回波的存在以及隨后恢復隱藏的數(shù)據(jù)。如通過比較圖6和7可以看到的那樣,這個實施例和第二個實施例之間的主要差別在于,重新生成的用于當前幀的LPC系數(shù)Si被施加到逆萊文森-德賓部件114,該逆萊文森_德賓部件114使用逆萊文森_德賓算法以從LPC系數(shù)中重新計算上述方程(3)的自相關(guān)矩陣Rij。所確定的值對應(yīng)于輸入的音頻信號自身的自相關(guān)值,并因此會包括與所述或每個回波的延遲相對應(yīng)的滯后處的峰值。來自逆萊文森-德賓部件114的輸出因此可以像以前一樣處理,以恢復隱藏的數(shù)據(jù)。這個實施例的主要缺點在于,逆萊文森-德賓算法在計算方面比較密集,所以在只有有限處理能力的情況下,這個實施例不是優(yōu)選的。
數(shù)據(jù)恢復4 在上述三個實施例中,通過處理從AMR編解碼器55輸出的編碼LPC濾波數(shù)據(jù)來恢復隱藏的數(shù)據(jù)。AMR編解碼器55會對LPC濾波數(shù)據(jù)中的回波進行編碼,只要回波延遲小于LPC濾波器的長度。如上所述,LPC濾波器具有十量級(p)的樣本。使用8kHz的采樣頻率,這對應(yīng)于1. 25ms的最大延遲。如果添加具有較長延遲的回波,則它不能被編碼到LPC系數(shù)中。然而它會被編碼在剩余或激發(fā)信號之內(nèi)。為了說明這一點,將會描述其中使用2ms和10ms回波將二進制1和0編碼在音頻中的實施例。 圖8圖示了在這個實施例中由應(yīng)用程序軟件69執(zhí)行以恢復隱藏數(shù)據(jù)的處理。如所示,在這個實施例中,應(yīng)用程序軟件69接收用于每個幀的當它由AMR編解碼器55輸出時的激發(fā)編碼數(shù)據(jù)。接收到的數(shù)據(jù)中的固定碼簿索引由固定碼簿部件121使用,以從固定碼簿123中識別用于當前幀的激發(fā)脈沖。這些激發(fā)脈沖然后由從AMR編解碼器55接收的編碼數(shù)據(jù)中定義的相應(yīng)固定增益放大。放大的激發(fā)脈沖然后被施加到加法器127,在那里它們被添加到通過將以前幀的激發(fā)脈沖傳遞通過增益129和自適應(yīng)碼簿延遲131而獲得的以前激發(fā)脈沖的適當放大和延遲的版本。在從AMR編解碼器55接收的編碼數(shù)據(jù)中定義所使用的自適應(yīng)碼簿增益和延遲。來自加法器127的輸出是用于當前幀的剩余或激發(fā)信號的脈沖表示。如圖8所示,激發(fā)信號的這個脈沖表示(e》然后被傳遞到自相關(guān)部件107,該自相關(guān)部件107計算在滯后數(shù)據(jù)存儲器108中定義的不同滯后的自相關(guān)。圖9圖示了當在接收到的音頻中存在2ms回波時針對所有正滯后從自相關(guān)部件107輸出的自相關(guān)。如所示,存在零滯后處的主峰值132和對應(yīng)于2ms的滯后處的另一個峰值134。因此,自相關(guān)部件107的輸出可以像以前一樣由回波識別部件109和數(shù)據(jù)恢復部件111處理以恢復隱藏的數(shù)據(jù)F(t)。
改進 現(xiàn)在參考圖10、 11和12對上述實施例進行若干改進。進行這些改進以增加隱藏數(shù)據(jù)的成功恢復,并且旨在抗擊可能掩蓋回波存在的語音或房間聲音的影響。這些改進將被施加到上述第一實施例,但是它們同樣可以很好地適用于其它實施例。
如通過比較圖4和IO可以看到的那樣,在第一個改進中,用于當前幀的LPC合成濾波器103的脈沖響應(yīng)(h(n))由高通濾波器151進行濾波,以減少脈沖響應(yīng)中的較低頻率的影響。發(fā)明人發(fā)現(xiàn)回波信息通常被編碼到脈沖響應(yīng)的較高頻帶中。這種高通濾波因此改善了用于回波的自相關(guān)峰值的銳度,使得更容易識別它們的存在。高通濾波器151優(yōu)選地過濾掉大約2kHz以下的頻率(對應(yīng)于采樣頻率四分之一的頻率),盡管通過僅過濾掉大約lkHz以下的頻率仍然可以進行某種增益。如本領(lǐng)域技術(shù)人員將會意識到的那樣,這種濾波是過濾掉脈沖響應(yīng)低頻部分的幀"內(nèi)"濾波(亦即僅在幀內(nèi)進行濾波),盡管還可以執(zhí)行幀"間"濾波(例如過濾掉發(fā)生在幀之間的脈沖響應(yīng)的緩慢變化特征)。 圖11圖示了實現(xiàn)相同結(jié)果的替換方式。具體地,在這個實施例中,用于當前幀的LPC系數(shù)Sj在用于配置LPC合成濾波器103之前被傳遞通過高通濾波器153。在這種情況下,高通濾波器153去除了與合成濾波器103的較低頻率極點相對應(yīng)的系數(shù)。這通過對LPC系數(shù)進行因式分解以識別極點頻率和帶寬來實現(xiàn)。在下限以下的頻率處的極點被丟棄,并且剩下的極點用于生成只有較高頻率的合成濾波器103。其余的處理跟以前一樣,并且進一步的描述將不再給出。如本領(lǐng)域技術(shù)人員將會意識到的那樣,這種濾波也是幀內(nèi)濾波,盡管還可以執(zhí)行幀間濾波。 圖12圖示了可以被應(yīng)用以增加恢復隱藏數(shù)據(jù)的成功率的進一步改進。如所示,這個實施例和圖4所示的實施例之間的主要差別在于提供了高通濾波器155,用于執(zhí)行幀間濾波以過濾掉通常由音頻自身和用戶的蜂窩電話21位于其中的房間的聲音造成的自相關(guān)輸出中的緩慢變化的相關(guān)性(亦即從幀到幀變化緩慢的相關(guān)性)。除了過濾掉這樣的幀間變化之外或者代替地,高通濾波器155可以執(zhí)行幀內(nèi)濾波,以從每個幀內(nèi)的自相關(guān)輸出去除低頻相關(guān)性。已發(fā)現(xiàn)這使回波造成的相關(guān)性峰值尖銳,從而使得它們更容易識別。
—般編碼方案 在上述實施例中,通過添加具有不同延遲的回波而將數(shù)據(jù)隱藏在音頻信號之內(nèi)。如本領(lǐng)域技術(shù)人員將會意識到的那樣,存在下述各種方式,其中數(shù)據(jù)可以隱藏在音頻之內(nèi)并仍然被傳遞通過AMR編解碼器55。 一般地說,可以分別用圖13和14所示的一般框圖來表示上述數(shù)據(jù)隱藏和恢復過程。如圖13所示,一般數(shù)據(jù)隱藏過程可以被認為涉及與AMR編 解碼器所執(zhí)行的類似的編碼操作161,以生成AMR參數(shù)(其可以是最終的AMR輸出參數(shù)或在 AMR處理中生成的中間參數(shù))。這些參數(shù)中的一個或多個然后取決于要被隱藏在音頻之內(nèi) 的數(shù)據(jù)而被改變163。修改的參數(shù)然后被解碼165以生成修改的音頻信號,其作為聲音信號 被傳輸并由蜂窩電話的麥克風23接收。在進行濾波和模擬數(shù)字轉(zhuǎn)換之后,音頻編碼器167 然后以上述方式處理數(shù)字化的音頻樣本以生成修改的參數(shù)。修改的參數(shù)然后由參數(shù)處理部 件169處理,以檢測對參數(shù)做出的(一個或多個)修改,并從而恢復隱藏的數(shù)據(jù)。
在將回波添加到音頻以對隱藏的數(shù)據(jù)進行編碼的情況下,這可以以上述方式容易 地進行,而不必在電視演播室中(或數(shù)據(jù)要被隱藏在音頻之內(nèi)的任何地方)執(zhí)行詳細的編 碼過程。代替地,通過操縱AMR編碼過程的輸出參數(shù)或中間參數(shù)可以添加回波。例如,通 過向上述方程(3)中定義的自相關(guān)矩陣的一個或多個條目添加常數(shù),或者通過直接操縱從 LPC分析確定的LPC系數(shù)中的一個或多個的值,可以將回波添加到音頻。
還可以通過調(diào)制音頻編碼參數(shù)的其它更多直接方式來隱藏數(shù)據(jù)。例如,可以修改 針對音頻生成的線狀譜頻率(例如通過用要被隱藏的數(shù)據(jù)來改變LSF的最低有效位),或者 可以根據(jù)要被隱藏的數(shù)據(jù)來修改從中確定LSF的極點的頻率或帶寬。代替地,可以修改激 發(fā)參數(shù)來承載隱藏的數(shù)據(jù)。例如,AMR編解碼器55使用具有可變脈沖位置和符號的定義脈 沖鏈的固定和自適應(yīng)碼簿來對激發(fā)信號進行編碼。因此,通過改變軌道或子幀中的一個或 多個之內(nèi)的脈沖位置的最低有效位,或者通過改變所選擇的軌道或子幀的符號,可以隱藏 數(shù)據(jù)。 代替施加回波以將數(shù)據(jù)隱藏在音頻中,可以取決于要被隱藏的數(shù)據(jù)而改變音頻信 號的一個或多個頻率分量的相位。在固定和自適應(yīng)碼簿所編碼的脈沖的位置中,來自音頻 的相位信息被保留到某種程度。因此,通過從碼簿重新生成激發(fā)脈沖并且檢測相關(guān)(一個 或多個)頻率分量隨時間的相位變化,可以從AMR編解碼器55的輸出中檢測這種相位編 碼。 如本領(lǐng)域技術(shù)人員將會意識到的那樣,非常不可能的是演播室系統(tǒng)會使用實際的 AMR編碼器和解碼器模型,因為電視演播室中的音頻質(zhì)量比AMR編解碼器55中使用的大得 多。充分的演播室系統(tǒng)因此會將音頻帶分成AMR帶(在300Hz和3. 4kHz之間)和這個范 圍之外的非AMR帶。然后會如上所述操縱AMR帶,但是不會使用AMR解碼器重構(gòu)AMR帶信 號。相反地,會將來自從原始音頻信號獲得的實際LPC剩余的AMR帶音頻信號與修改的LPC 數(shù)據(jù)進行合成以得到更高的音頻質(zhì)量。代替地,在用隱藏的數(shù)據(jù)修改激發(fā)參數(shù)的情況下,會 從修改的參數(shù)來構(gòu)造剩余,該修改的參數(shù)然后會由合成濾波器使用從LPC分析獲得的LPC 系數(shù)來進行濾波。修改的AMR帶然后會被添加到非AMR帶,以便作為電視信號的一部分進 行傳輸。在圖15和16中圖示了這種處理。 具體地,圖15圖示了在原始音頻已被分成AMR帶和非AMR帶之后可以在電視演播 室之內(nèi)執(zhí)行的處理。如所示,音頻AMR帶被輸入到LPC編碼器171,該LPC編碼器171執(zhí)行 上述LPC分析以生成用于當前幀的LPC系數(shù)ai。這些系數(shù)然后被傳遞到系數(shù)改變部件173, 該系數(shù)改變部件173取決于要被隱藏在音頻信號之內(nèi)的數(shù)據(jù)而改變這些系數(shù)中的一個或 多個。修改的LPC系數(shù)^然后被輸出以根據(jù)上面給出的方程(2)配置LPC合成濾波器175。 如圖15所示,LPC編碼器171所生成的LPC系數(shù)ai用于根據(jù)上面的方程(6)配置逆LPC
16濾波器177。從中生成當前LPC系數(shù)組的音頻幀然后被傳遞通過這個逆LPC濾波器以生成 LPC剩余(激發(fā))信號,其然后被施加到LPC合成濾波器175。這導致生成修改的音頻AMR 帶信號,其然后在與視頻軌道相結(jié)合以便進行分發(fā)之前與非AMR帶信號相結(jié)合。
圖16圖示了其中激發(fā)參數(shù)隨著要被隱藏的數(shù)據(jù)而改變的替換場景。具體地,如圖 16所示,音頻AMR帶初始由LPC編碼器171處理,該LPC編碼器171在這個實施例中生成并 輸出表示剩余或激發(fā)信號的固定和自適應(yīng)碼簿數(shù)據(jù)。這個碼簿數(shù)據(jù)然后被傳遞通過改變部 件181,該改變部件181改變碼簿數(shù)據(jù),以便根據(jù)要被隱藏在音頻信號之內(nèi)的數(shù)據(jù)而改變固 定碼簿數(shù)據(jù)所表示的一個或多個脈沖的位置和/或符號。修改的碼簿數(shù)據(jù)然后被輸出到剩 余發(fā)生器183,該剩余發(fā)生器183重新生成相應(yīng)的剩余信號,其在由AMR編解碼器55處理 時會重新生成修改的固定和自適應(yīng)碼簿數(shù)據(jù)。這例如可以通過以下實現(xiàn)執(zhí)行迭代程序以 適配起動剩余,直到對它的編碼導致改變部件181所輸出的修改的碼簿數(shù)據(jù)。代替地,修改 的碼簿數(shù)據(jù)可以用于生成直接用作剩余信號的脈沖鏈。脈沖之間的間隙可以填充以可以使 用用于當前幀的LPC系數(shù)和逆LPC濾波器生成的剩余信號的一部分或噪聲。不管所使用的 技術(shù),如此生成的剩余信號然后被傳遞到LPC合成濾波器175,該LPC合成濾波器175使用 LPC編碼器171所生成的LPC系數(shù)進行配置。LPC合成濾波器175然后對施加的剩余信號 進行濾波以生成修改的音頻AMR帶,其然后與非AMR帶相結(jié)合以重新生成用于與視頻軌道
相結(jié)合的音頻。
音頻識別 在上述實施例中,數(shù)據(jù)隱藏在電視節(jié)目的音頻之內(nèi),并且通過蜂窩電話中的適當 處理來恢復這個數(shù)據(jù)。為了恢復隱藏的數(shù)據(jù)而執(zhí)行的處理利用了已經(jīng)由蜂窩電話的音頻編 解碼器執(zhí)行的處理的至少一部分。如上所述,發(fā)明人發(fā)現(xiàn)這減少了恢復隱藏的數(shù)據(jù)所需的 計算開銷。類似的優(yōu)點可以在下述其它應(yīng)用中獲得沒有實際 的數(shù)據(jù)隱藏在音頻之內(nèi),但是 其中例如將要從音頻自身的聲音模式(指紋)中識別音頻?,F(xiàn)在參考音樂識別系統(tǒng)來描述 其中可以實現(xiàn)這一點的方式。 目前,存在若干音樂識別服務(wù),諸如Shazam所提供的服務(wù)。這些音樂識別服務(wù)允 許蜂窩電話21的用戶通過撥打號碼并將音樂播放到耳機來識別當前播放的音樂軌道。服 務(wù)然后將軌道的名稱返回到電話。在技術(shù)上,系統(tǒng)通過以下操作設(shè)立從蜂窩電話到遠程服 務(wù)器的電話呼叫,同時向電話播放音樂。遠程服務(wù)器在預定時期之后斷開呼叫,相對于存儲 在數(shù)據(jù)庫中的模式對接收到的聲音執(zhí)行某種匹配以識別音樂,然后以它識別的音樂軌道的 名稱的方式發(fā)送文本消息至電話。 根據(jù)來自Shazam系統(tǒng)的發(fā)明人以及其它的公布材料,用于識別軌道的一般過程 為 1.將原始音頻信號轉(zhuǎn)換成頻譜圖,這通常通過計算一系列重疊快速傅立葉變換 (FFT)來實現(xiàn)。 2.分析頻譜圖以確定特定特征——這些通常是能量峰值位置,通過它們的時間和 頻率來表征。 3.使用這些特征的散列函數(shù),并使用散列函數(shù)的結(jié)果來查找數(shù)據(jù)庫以確定可能匹 配音頻信號的一組條目。 4.針對這些潛在的匹配執(zhí)行進一步的模式匹配,以確定音頻信號是否真正匹配從數(shù)據(jù)庫中識別的那些中的任何一個。 傳統(tǒng)上,根據(jù)對用于音頻信號的數(shù)字化音頻樣本的重疊塊進行的一系列快速傅立 葉變換來確定用于音頻的頻譜圖。當在移動電話網(wǎng)絡(luò)之上進行操作時,輸入的音頻會由蜂 窩電話中的AMR編解碼器壓縮以便經(jīng)由空中接口37傳輸?shù)揭苿与娫捑W(wǎng)絡(luò)35,在那里壓縮的 音頻被解壓縮以重新生成數(shù)字音頻樣本。服務(wù)器然后對數(shù)字音頻樣本執(zhí)行傅立葉變換分析 以生成用于音頻信號的頻譜圖。 發(fā)明人已認識到,移動電話系統(tǒng)所執(zhí)行的這種編碼和解碼然后還有Shazam服務(wù) 器所執(zhí)行的隨后的頻率分析是浪費的,并且可以實施類似的系統(tǒng)而不必將壓縮的音頻解碼 回到音頻樣本。用這種方式,軌道識別處理可以整個地在蜂窩電話21之內(nèi)執(zhí)行。用戶因此 不必放置至遠程服務(wù)器的呼叫以便能夠識別正在播放的軌道?,F(xiàn)在參考圖17來描述其中 可以實現(xiàn)這一點的方式。 具體地,圖17是圖示在蜂窩電話21上運行的軌道識別軟件應(yīng)用程序(未示出) 所執(zhí)行的處理的框圖。如所示,在這個實施例中,軟件應(yīng)用程序從AMR編解碼器55接收AMR 編碼LPC數(shù)據(jù)和AMR編碼激發(fā)數(shù)據(jù)。AMR LPC編碼數(shù)據(jù)然后像以前一樣被傳遞到VQ部件 91、預測加法部件93、平均值加法部件99和LSF轉(zhuǎn)換部件101。這種處理的結(jié)果是重新生 成的LPC系數(shù)&。用于當前幀的LPC系數(shù)然后被傳遞到計算它們的快速傅立葉變換的FFT部 件201。 類似地,AMR編碼激發(fā)數(shù)據(jù)由固定碼簿部件121 、固定增益125、加法器127、自適應(yīng) 碼簿延遲121和自適應(yīng)增益129進行解碼,以重新生成表示用于輸入幀的剩余的激發(fā)脈沖。 這些解碼的脈沖然后被輸入到FFT部件203以生成激發(fā)脈沖的傅立葉變換。如圖17所示, 來自兩個FFT部件201和203的輸出由乘法器205乘在一起,以生成用于當前幀的組合頻 率表示。乘法器205所輸出的這種組合頻率表示應(yīng)當近似對應(yīng)于當前幀之內(nèi)的數(shù)字音頻樣 本的FFT。這是因為AMR編解碼器55所執(zhí)行的LPC分析之下的源濾波器模型。具體地,如 上所述,LPC分析假定語音通過以下生成通過合成濾波器對適當?shù)募ぐl(fā)信號進行濾波。換 言之,音頻通過以下生成使激發(fā)信號與合成濾波器的脈沖響應(yīng)進行巻積,或者在頻域中, 使激發(fā)信號的頻譜與LPC合成濾波器的頻譜相乘。 在當前實施例中,LPC系數(shù)的頻譜與碼簿激發(fā)脈沖的頻譜相乘。這些是分別對LPC 合成濾波器的頻譜和激發(fā)信號的頻譜的逼近。因此,從乘法器205輸出的組合頻譜會是當 前幀之內(nèi)的數(shù)字化音頻信號的頻譜的逼近。如圖17所示,這個頻譜然后被輸入到頻譜圖生 成部件207,該頻譜圖生成部件207從接收到的頻譜中生成用于輸入的音頻信號的相鄰幀 的頻譜圖。如此生成的頻譜圖然后被傳遞到模式匹配部件209,在那里使用來自頻譜圖的特 定特征來搜索存儲在模式數(shù)據(jù)庫211之內(nèi)的模式,以識別蜂窩電話的麥克風23所拾取的音 頻軌道。如本領(lǐng)域技術(shù)人員將會意識到的那樣,這種模式匹配可以使用與Shazam系統(tǒng)的服 務(wù)器中使用的那些類似的處理技術(shù),亦即首先使用散列函數(shù)來識別模式數(shù)據(jù)庫211的一部 分以與音頻的頻譜圖相匹配。模式匹配部件209所輸出的識別的軌道信息然后被輸出用于 在顯示器29上向用戶顯示。 發(fā)明人發(fā)現(xiàn)與將壓縮的音頻數(shù)據(jù)轉(zhuǎn)換回到數(shù)字化音頻樣本然后對音頻樣本采取 快速傅立葉變換相比,這種處理需要顯著更少的計算。事實上,發(fā)明人發(fā)現(xiàn)與對原始音頻樣 本采取快速傅立葉變換相比,這種處理需要更少的處理。這是因為對LPC系數(shù)采取快速傅
18立葉變換比較簡單,因為每幀只有10個系數(shù);而且對碼簿激發(fā)脈沖的快速傅立葉變換也比 較直接,因為簡單地通過區(qū)別脈沖位置或者使它們在查找表中預先計算(因為存在有限數(shù) 目的碼簿所定義的脈沖位置),可以將脈沖位置系數(shù)轉(zhuǎn)換到頻域中。 如本領(lǐng)域技術(shù)人員將會意識到的那樣,由于所進行的逼近,以這種方式獲得的作 為結(jié)果的頻譜圖無法與從音頻樣本的FFT導出的頻譜圖直接相比較。然而,該頻譜圖攜帶 了足夠的并且與傳統(tǒng)頻譜圖類似的信息,所以可以使用相同或相似的模式匹配技術(shù)用于音 頻識別。為了最佳結(jié)果,存儲在數(shù)據(jù)庫211中的模式信息優(yōu)選地從以類似方式獲得的頻譜 圖中生成(亦即根據(jù)AMR編解碼器輸出,而不是使用從音頻樣本中直接生成的那些頻譜 圖)。 修改和進一步替換 上面已描述了說明下述方式的若干實施例蜂窩電話中的音頻編解碼器可以用于 減少電話的其它部分所執(zhí)行的隨后處理,以便恢復隱藏的信息或者識別輸入的音頻片段。 如本領(lǐng)域技術(shù)人員將會意識到的那樣,可以對上述實施例進行各種修改和改進,并且現(xiàn)在 來描述這些修改中的一些修改。 在上述音頻識別實施例中,所有的模式數(shù)據(jù)庫211都存儲在蜂窩電話21之內(nèi)。在 替換實施例中,模式匹配部件209可以布置成根據(jù)為音頻生成的頻譜圖的特定特征生成散 列函數(shù),并且這個散列函數(shù)的結(jié)果然后可以被傳輸?shù)竭h程服務(wù)器,該遠程服務(wù)器下載將要 與音頻的頻譜圖相匹配的適當模式信息。以這種方式,必須存儲在蜂窩電話21上的模式數(shù) 據(jù)庫211之內(nèi)的數(shù)據(jù)量可以保持到最小,同時僅引入了在用于從遠程數(shù)據(jù)庫中檢索所選擇 的模式的處理中的比較小的延遲。 在上述音頻識別實施例中,線狀譜頻率被轉(zhuǎn)換回到LPC系數(shù),然后使用FFT將其轉(zhuǎn) 換到頻域中。在替換實施例中,可以直接根據(jù)線狀譜頻率或者根據(jù)從它們導出的極點來確 定用于LPC數(shù)據(jù)的頻譜。這會進一步減少執(zhí)行音頻識別所需的處理。 在上述較早的實施例中,數(shù)據(jù)隱藏在音頻中并且用于將電話的操作同步到用戶所 觀看的電視節(jié)目。在剛剛描述的最后實施例中,在音頻之內(nèi)沒有隱藏的數(shù)據(jù),而是代替地, 音頻的特定特征被識別并用于對音頻進行識別。如本領(lǐng)域技術(shù)人員將會意識到的那樣,可 以在同步實施例中使用類似的音頻識別技術(shù)。例如,在電話上運行的軟件應(yīng)用程序可以通 過識別音頻聲音軌道之內(nèi)的預定部分而將自身同步到電視節(jié)目。這種類型的同步還可以用 于控制電視節(jié)目字幕的輸出。 在上述較早的實施例中,通過確定合成濾波器的脈沖響應(yīng)或LPC系數(shù)的自相關(guān)值 來恢復隱藏的數(shù)據(jù)。這種相關(guān)性處理不是必要的,因為可以通過直接監(jiān)視系數(shù)或脈沖響應(yīng) 來發(fā)現(xiàn)隱藏的數(shù)據(jù)。然而,自相關(guān)處理是優(yōu)選的,因為它使得更容易識別回波。
在上述改進中,各種高通濾波技術(shù)用于過濾掉與音頻和房間聲音相關(guān)聯(lián)的低頻成 分。在優(yōu)選實施例中,在蜂窩電話中執(zhí)行這樣的高通濾波的情況下,回波信號優(yōu)選地僅被添 加到(在隱藏過程期間)AMR帶的高頻部分中的音頻。例如在lkHz以上,并且優(yōu)選地僅在 2kHz以上。這例如可以通過以下實現(xiàn)對音頻信號進行濾波以去除較低頻率AMR帶成分, 然后以需要的時間延遲將濾波的輸出添加到原始音頻。這是優(yōu)選的,因為減少了會被蜂窩 電話中執(zhí)行的高通濾波過濾掉(并因此丟失)的回波信號中的能量。 在上述實施例中,已假定蜂窩電話所使用的音頻編解碼器是AMR編解碼器。然而,
19如本領(lǐng)域技術(shù)人員將會意識到的那樣,上述原理和概念還適用于其它類型的音頻編解碼
器,并且尤其適用于依靠輸入音頻的線性預測分析的那些音頻編解碼器。 在上述實施例中,通過蜂窩電話上運行的軟件來執(zhí)行從音頻編解碼器輸出的壓縮
音頻數(shù)據(jù)的各種處理。如本領(lǐng)域技術(shù)人員將會意識到的那樣,這種處理中的一些或全部可
以由專用硬件電路執(zhí)行,盡管軟件由于其在制造之后被添加到蜂窩電話的能力以及其一旦
裝載可以被更新的能力而是優(yōu)選的。用于使蜂窩電話以上述方式操作的軟件可以作為信號
提供,或者可以提供在諸如緊致盤之類的載體或其它載體介質(zhì)上。 在上述實施例中,在蜂窩電話之內(nèi)執(zhí)行處理。然而,如本領(lǐng)域技術(shù)人員將會意識到 的那樣,益處會適用于具有內(nèi)置音頻編解碼器的任何通信裝置。 在上述早先的實施例中,數(shù)據(jù)隱藏在音頻之內(nèi)并且用于使蜂窩電話的操作與用戶
所觀看的電視秀同步。如本領(lǐng)域技術(shù)人員將會意識到的那樣,并且如WO 02/45273所述,存
在對于隱藏數(shù)據(jù)的各種其它用途。例如,隱藏的數(shù)據(jù)可以識別用于遠程位置的URL,或者可
以識別要被發(fā)送到用于說明的預先存儲的URL的代碼。這種隱藏的數(shù)據(jù)可以為用戶提供例
如關(guān)于電視節(jié)目的另外信息,并且/或者為用戶提供特別報價或其它目標廣告。 在上述實施例中,經(jīng)由RF通信鏈路13向用戶傳送電視節(jié)目。如本領(lǐng)域技術(shù)人員
將會意識到的那樣,可以經(jīng)由任何適當?shù)姆职l(fā)技術(shù)如通過有線電視、因特網(wǎng)、衛(wèi)星電視等向
用戶分發(fā)電視節(jié)目。還可以從存儲介質(zhì)如DVD獲得并通過適當?shù)腄VD播放器讀出。 在上述實施例中,蜂窩電話拾取電視節(jié)目的音頻。如本領(lǐng)域技術(shù)人員將會意識到
的那樣,在從收音機或其它揚聲器系統(tǒng)獲得音頻的情況下也可以使用上述技術(shù)。 在上述實施例中,假定在電視系統(tǒng)的電視演播室一端將數(shù)據(jù)隱藏在音頻之內(nèi)。在
替換實施例中,例如通過機頂盒可以在電視系統(tǒng)的用戶一端將數(shù)據(jù)隱藏在音頻之內(nèi)。機頂
盒可以適合于在向用戶輸出電視節(jié)目之前將適當?shù)臄?shù)據(jù)隱藏到音頻中。 在上述實施例中,軟件應(yīng)用程序處理從蜂窩電話21之內(nèi)的AMR編解碼器接收的壓
縮音頻數(shù)據(jù)。在替換實施例中,軟件應(yīng)用程序可以對經(jīng)由電話網(wǎng)絡(luò)接收的并且由RF處理單
元57提供給處理器63的壓縮音頻數(shù)據(jù)執(zhí)行類似處理。 在上述實施例中,假定音頻編解碼器的輸出不包括LPC系數(shù)自身,而是包括從它 們導出的其它參數(shù)如線狀譜頻率或LPC合成濾波器的濾波器極點。如本領(lǐng)域技術(shù)人員將會 意識到的那樣,如果蜂窩電話21中使用的音頻編解碼器使得由其導出的LPC系數(shù)可用于處 理器63,那么軟件應(yīng)用程序為了恢復LPC系數(shù)而執(zhí)行的初始處理就是不必要的,并且軟件 應(yīng)用程序可以直接對音頻編解碼器所輸出的LPC系數(shù)進行工作。這會進一步減少需要的處 理。 如本領(lǐng)域技術(shù)人員將會意識到的那樣,在上述實施例中描述的比特率、采樣率等 的精確值并不是本發(fā)明的必要特征,而是可以在不脫離本發(fā)明的情況下進行改變。
權(quán)利要求
一種用于從輸入的音頻信號中恢復隱藏的數(shù)據(jù)或者用于識別輸入的音頻信號的方法,該方法使用電信設(shè)備,所述電信設(shè)備具有音頻編碼器,所述音頻編碼器用于壓縮輸入的音頻信號以便傳送到電信網(wǎng)絡(luò),所述方法由所述電信設(shè)備執(zhí)行并且特征在于,通過音頻編解碼器傳遞輸入的音頻信號以生成壓縮的音頻數(shù)據(jù),并且處理壓縮的音頻數(shù)據(jù)以恢復隱藏的數(shù)據(jù)或者識別輸入的音頻信號。
2. 根據(jù)權(quán)利要求1所述的方法,其中,所述音頻編碼器對輸入的音頻執(zhí)行線性預測 (LP)分析以生成表示輸入的音頻的LP數(shù)據(jù),并且其中所述處理步驟處理所述LP數(shù)據(jù)以恢 復隱藏的數(shù)據(jù)或者識別輸入的音頻信號。
3. 根據(jù)權(quán)利要求2所述的方法,其中,所述音頻編碼器壓縮所述LP數(shù)據(jù)以生成壓縮的 所述LP數(shù)據(jù),并且其中所述處理步驟包括從壓縮的音頻數(shù)據(jù)中重新生成所述LP數(shù)據(jù)的步 驟。
4. 根據(jù)權(quán)利要求2或3所述的方法,其中,所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù),并且所述處 理步驟使用所述LP濾波數(shù)據(jù)來恢復隱藏的數(shù)據(jù)或者識別音頻信號。
5. 根據(jù)權(quán)利要求4所述的方法,其中,所述處理步驟包括生成合成濾波器的脈沖響應(yīng) 的步驟,或者包括對所述LP濾波數(shù)據(jù)執(zhí)行逆萊文森_德賓算法的步驟。
6. 根據(jù)權(quán)利要求2、3或4所述的方法,其中,所述LP數(shù)據(jù)包括LP激發(fā)數(shù)據(jù),并且所述 處理步驟使用所述LP激發(fā)數(shù)據(jù)來恢復隱藏的數(shù)據(jù)或者識別音頻信號。
7. 根據(jù)權(quán)利要求2或3所述的方法,其中,所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù)和LP激發(fā)數(shù) 據(jù),并且其中所述處理步驟處理對應(yīng)于所述LP濾波數(shù)據(jù)和所述LP激發(fā)數(shù)據(jù)中之一的壓縮 音頻數(shù)據(jù)的子集以恢復隱藏的數(shù)據(jù)。
8. 根據(jù)任何在先權(quán)利要求所述的方法,其中所述音頻信號包括由所述音頻信號的一個 或多個回波定義的隱藏數(shù)據(jù),并且其中所述處理步驟處理壓縮的音頻以識別所述音頻信號 之內(nèi)的回波的存在,以便恢復隱藏的數(shù)據(jù)。
9. 根據(jù)任何在先權(quán)利要求所述的方法,其中隱藏的數(shù)據(jù)的每個數(shù)據(jù)符號用所述音頻信 號之內(nèi)的回波序列或回波組合表示,并且其中所述處理步驟包括識別所述回波組合以恢復 隱藏的數(shù)據(jù)的步驟,或者包括跟蹤音頻中的回波序列以恢復隱藏的數(shù)據(jù)的步驟。
10. 根據(jù)權(quán)利要求8或9所述的方法,其中所述音頻編碼器具有預定操作頻帶,并且其 中所述回波隱藏在音頻之內(nèi)的操作頻帶預定部分之內(nèi),優(yōu)選地隱藏在頻帶的上部,并且其 中所述處理步驟包括濾波步驟以過濾掉所述預定部分之外的頻率。
11. 根據(jù)任何在先權(quán)利要求所述的方法,其中,所述處理步驟為所述音頻信號的時間 幀序列中的每一個確定一個或多個自相關(guān)值,并且使用確定的所述自相關(guān)值恢復隱藏的數(shù) 據(jù)。
12. 根據(jù)權(quán)利要求11所述的方法,其中,所述處理步驟執(zhí)行確定的所述自相關(guān)值的高 通濾波以去除緩慢變化的相關(guān)性。
13. 根據(jù)任何在先權(quán)利要求所述的方法,其中,所述處理步驟在不從壓縮的音頻數(shù)據(jù)中 重新生成數(shù)字化的音頻樣本的情況下恢復隱藏的數(shù)據(jù)或者識別音頻。
14. 一種電信設(shè)備(21),包括:麥克風(23),用于接收聲音信號并且用于將接收到的所述聲音信號轉(zhuǎn)換成相應(yīng)的音頻 電信號;模擬數(shù)字轉(zhuǎn)換器(53),用于采樣所述音頻電信號以產(chǎn)生數(shù)字音頻樣本; 音頻編碼器(55),用于壓縮所述數(shù)字音頻樣本以生成壓縮的音頻數(shù)據(jù)以便傳送到電信 網(wǎng)絡(luò)(39);以及數(shù)據(jù)處理器(115),其耦合到所述音頻編碼器(55),用于處理壓縮的所述音頻數(shù)據(jù),以 恢復接收到的所述聲音信號之內(nèi)傳送的隱藏數(shù)據(jù),或者識別接收到的所述聲音信號。
15. 根據(jù)權(quán)利要求14所述的設(shè)備,其中所述音頻編碼器可操作用于對輸入的音頻執(zhí)行 線性預測(LP)分析以生成表示輸入的音頻的LP數(shù)據(jù),并且其中所述數(shù)據(jù)處理器可操作用 于處理所述LP數(shù)據(jù)以恢復隱藏的數(shù)據(jù)或者識別輸入的音頻信號。
16. 根據(jù)權(quán)利要求15所述的設(shè)備,其中所述音頻編碼器可操作用于壓縮所述LP數(shù)據(jù)以 生成壓縮的所述LP數(shù)據(jù),并且其中所述數(shù)據(jù)處理器可操作用于從壓縮的音頻數(shù)據(jù)中重新 生成所述LP數(shù)據(jù)。
17. 根據(jù)權(quán)利要求15或16所述的設(shè)備,其中,所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù),并且所述 數(shù)據(jù)處理器可操作用于使用所述LP濾波數(shù)據(jù)來恢復隱藏的數(shù)據(jù)或者識別音頻信號。
18. 根據(jù)權(quán)利要求17所述的設(shè)備,其中,所述數(shù)據(jù)處理器可操作用于生成合成濾波器 的脈沖響應(yīng)或者對所述LP濾波數(shù)據(jù)執(zhí)行逆萊文森_德賓算法以恢復隱藏的數(shù)據(jù)。
19. 根據(jù)權(quán)利要求15、 16或17所述的設(shè)備,其中,所述LP數(shù)據(jù)包括LP激發(fā)數(shù)據(jù),并且 所述數(shù)據(jù)處理器可操作用于使用所述LP激發(fā)數(shù)據(jù)來恢復隱藏的數(shù)據(jù)或者識別音頻信號。
20. 根據(jù)權(quán)利要求15或16所述的設(shè)備,其中所述LP數(shù)據(jù)包括LP濾波數(shù)據(jù)和LP激發(fā) 數(shù)據(jù),并且其中所述數(shù)據(jù)處理器可操作用于處理對應(yīng)于所述LP濾波數(shù)據(jù)和所述LP激發(fā)數(shù) 據(jù)中之一的壓縮音頻數(shù)據(jù)的子集以恢復隱藏的數(shù)據(jù)。
21. 根據(jù)權(quán)利要求14至20中任何一項所述的設(shè)備,其中所述音頻信號包括由所述音頻 信號的一個或多個回波定義的隱藏數(shù)據(jù),并且其中所述數(shù)據(jù)處理器可操作用于處理壓縮的 音頻數(shù)據(jù)以識別所述音頻信號之內(nèi)的回波的存在,以便恢復隱藏的數(shù)據(jù)。
22. 根據(jù)權(quán)利要求14至21中任何一項所述的設(shè)備,其中隱藏的數(shù)據(jù)的每個數(shù)據(jù)符號用 所述音頻信號之內(nèi)的回波序列或回波組合表示,并且其中所述數(shù)據(jù)處理器可操作用于識別 所述回波組合以恢復隱藏的數(shù)據(jù)或者跟蹤音頻中的回波序列以恢復隱藏的數(shù)據(jù)。
23. 根據(jù)權(quán)利要求21或22所述的設(shè)備,其中所述音頻編碼器具有預定操作頻帶,并且 其中所述回波隱藏在音頻之內(nèi)的操作頻帶預定部分之內(nèi),優(yōu)選地隱藏在頻帶的上部,并且 其中所述數(shù)據(jù)處理器可操作用于過濾掉所述預定部分之外的頻率。
24. 根據(jù)權(quán)利要求14至23中任何一項所述的設(shè)備,其中,所述數(shù)據(jù)處理器可操作用于 為時間幀序列中的每一個確定一個或多個自相關(guān)值,并且可操作用于使用確定的所述自相 關(guān)值恢復隱藏的數(shù)據(jù)。
25. 根據(jù)權(quán)利要求24所述的設(shè)備,其中,所述數(shù)據(jù)處理器可操作用于執(zhí)行確定的所述 自相關(guān)值的高通濾波以去除緩慢變化的相關(guān)性。
26. 根據(jù)權(quán)利要求14至25中任何一項所述的設(shè)備,其中,所述數(shù)據(jù)處理器可操作用于 在恢復隱藏的數(shù)據(jù)時執(zhí)行幀間和/或幀內(nèi)高通濾波。
27. 根據(jù)權(quán)利要求14至26中任何一項所述的設(shè)備,其中,所述數(shù)據(jù)處理器可操作用于 在不從壓縮的音頻數(shù)據(jù)中重新生成數(shù)字化的音頻樣本的情況下恢復隱藏的數(shù)據(jù)或者識別 音頻。
28. —種數(shù)據(jù)隱藏設(shè)備(5),包括音頻編碼裝置(161),用于接收并壓縮表示音頻信號的數(shù)字音頻樣本以生成壓縮的音 頻數(shù)據(jù);用于接收要被隱藏在所述音頻信號之內(nèi)的數(shù)據(jù)并且用于取決于接收到的所述數(shù)據(jù)而 改變壓縮的所述音頻數(shù)據(jù)以生成修改的壓縮音頻數(shù)據(jù)的裝置(163);以及用于使用修改的所述壓縮音頻數(shù)據(jù)來生成音頻樣本的裝置(165),所述音頻樣本表示 了原始的音頻信號并傳送隱藏的所述數(shù)據(jù)。
29. —種將數(shù)據(jù)隱藏在音頻信號中的方法,該方法包括取決于要被隱藏在音頻信號中 的數(shù)據(jù)而向音頻添加一個或多個回波的步驟,并且其特征在于,在將回波與音頻信號進行 組合之前對所述回波進行高通濾波。
30. —種機頂盒,包括用于接收音頻信號的裝置、用于將數(shù)據(jù)隱藏在接收的所述音頻信 號中的裝置以及用于為用戶輸出具有隱藏的所述數(shù)據(jù)的所述音頻信號的裝置,其中,所述 機頂盒可操作用于用所述音頻信號之內(nèi)的回波序列或回波組合來表示要被隱藏的所述數(shù) 據(jù)的每個數(shù)據(jù)符號。
31. 根據(jù)權(quán)利要求30所述的機頂盒,可操作用于在將那些回波添加到所述音頻信號之 前對所述回波中的一個或多個執(zhí)行高通濾波。
32. —種計算機可實施指令產(chǎn)品,包括用于使可編程處理器執(zhí)行根據(jù)權(quán)利要求1至13 中任何一項所述的處理步驟的計算機可實施指令。
全文摘要
本發(fā)明提供了一種用于恢復嵌入在輸入的聲音信號之內(nèi)的隱藏數(shù)據(jù)的蜂窩電話。該電話將聲音數(shù)據(jù)傳遞通過電話的音頻編碼器,然后處理音頻編碼器所生成的壓縮音頻,以恢復隱藏的數(shù)據(jù)。本發(fā)明還提供了一種用于從音頻編碼器的壓縮輸出中識別音頻信號的類似電話。本發(fā)明還描述了用于將數(shù)據(jù)隱藏在音頻之內(nèi)的各種編碼技術(shù)。
文檔編號G10L19/06GK101715549SQ200880017878
公開日2010年5月26日 申請日期2008年5月29日 優(yōu)先權(quán)日2007年5月29日
發(fā)明者伊恩·邁克爾·霍斯金, 彼得·約翰·凱利, 約翰·賴伊, 邁克爾·雷蒙德·雷諾茲 申請人:英特拉松尼克斯有限公司