專利名稱:散置在整個(gè)壓縮信息信號(hào)中的數(shù)字消息的傳輸?shù)闹谱鞣椒?br>
技術(shù)領(lǐng)域:
本發(fā)明一般涉及電信技術(shù),更具體地講,本發(fā)明涉及一種隨信息 信號(hào)一起傳輸數(shù)字消息。
背景技術(shù):
現(xiàn)代電信系統(tǒng)具有在諸如因特網(wǎng)的 一或多個(gè)基于分組的網(wǎng)絡(luò)上 對(duì)諸如音頻或視頻的媒體信息信號(hào)進(jìn)行路由的特性。例如,在IP語(yǔ)音通信(即,"VoIP")中,對(duì)來(lái)自將加以路由的話音交談的話音信號(hào) 進(jìn)行數(shù)字化,并且將它們格式化為數(shù)據(jù)分組,然后通過(guò)網(wǎng)絡(luò)傳輸這些 數(shù)據(jù)分組。 一個(gè)基于VoIP的電信網(wǎng)絡(luò)能夠傳輸那些可接入網(wǎng)絡(luò)的電 信端點(diǎn)之間的話音交談。每一個(gè)電信端點(diǎn),無(wú)論是否具有話音能力,均為能夠與其它設(shè)備 交換信息的基于分組的設(shè)備。所述端點(diǎn)按與個(gè)人計(jì)算機(jī)如何能夠通過(guò) 因特網(wǎng)與其它計(jì)算機(jī)交換信息相類似的方式交換信息。因此,同個(gè)人計(jì)算機(jī)一樣,所述端點(diǎn)易受到許多同樣或者類似的分組攻擊,例如, "Denial-of-Service,, (DoS)攻擊。事實(shí)上,存在著來(lái)自與端點(diǎn)所使用 的網(wǎng)絡(luò)互連的各種網(wǎng)絡(luò)中任何一個(gè)網(wǎng)絡(luò)中的、瞄準(zhǔn)一個(gè)端點(diǎn)的許多潛 在的分組攻擊源。為了提高端點(diǎn)抵御分組攻擊的能力, 一些類型的驗(yàn)證是必要的。 驗(yàn)證使端點(diǎn)能夠決定哪些到達(dá)的分組是合法的、哪些到達(dá)的分組應(yīng)該 加以丟棄。 一個(gè)稱為安全實(shí)時(shí)傳輸協(xié)i義(Secure Real-time-Transport Protocol ( SRTP ))的標(biāo)準(zhǔn)協(xié)議描述了 一種用于執(zhí)行驗(yàn)證方法的規(guī)程。 然而,這一協(xié)議存在著一個(gè)缺點(diǎn)。為了驗(yàn)證一個(gè)分組,必須通過(guò)標(biāo)題 和分組的有效載荷計(jì)算一個(gè)消息摘要。這一計(jì)算要求端點(diǎn)處的大量的 處理工作,而且可能使端點(diǎn)的處理器超負(fù)荷。5存在著一些用于驗(yàn)證每一分組的較簡(jiǎn)單的、要求較少處理資源的方案。然而,由于SRTP所規(guī)定的限制以及網(wǎng)絡(luò)中防火墻的行為,附 加較簡(jiǎn)單方案所需的額外信息通常是不可能的。另外,與驗(yàn)證無(wú)關(guān)的 其它應(yīng)用可能要求補(bǔ)充信息的傳輸,例如用于傳遞針對(duì)某一具體特性 的額外控制信息的比特的傳輸。問(wèn)題在于,現(xiàn)存的消息中通常不存在 未使用的比特位置,而且,為了傳遞補(bǔ)充信息,通常不能傳輸附加的 比特。所需要的是這樣一種技術(shù)釋放一個(gè)分組流中每一分組中的額外 的比特位置,以發(fā)送包含與驗(yàn)證或者其它目的相關(guān)的補(bǔ)充信息的數(shù)字 消息,而且不具有現(xiàn)有技術(shù)中的某些缺點(diǎn)。發(fā)明內(nèi)容本發(fā)明實(shí)現(xiàn)了數(shù)字消息隨一個(gè)諸如音頻或視頻的相應(yīng)的媒體信 息信號(hào)的傳輸。具體地講, 一種正在處理來(lái)自其用戶的諸如語(yǔ)音信號(hào) 的信息信號(hào)的電信設(shè)備,通過(guò)使用一個(gè)基于模型的壓縮編碼器,對(duì)信 息信號(hào)進(jìn)行編碼。 一種這樣的設(shè)備是電信端點(diǎn)。然后,根據(jù)對(duì)每一所 編碼的比特的感知有效性的估計(jì),或者根據(jù)信號(hào)的某些其它有意義的 特征,端點(diǎn)的處理器(i)確定可以重寫(xiě)哪些所編碼的比特;以及(ii) 取代所重寫(xiě)的比特,在整個(gè)所編碼的信號(hào)中散置數(shù)字消息。接下來(lái), 端點(diǎn)把所散置的數(shù)字消息比特作為所編碼的信息信號(hào)的一部分加以 傳輸。按照這一方式,沒(méi)有把額外的比特附加于將加以傳輸?shù)姆纸M, 從而解決了與現(xiàn)存協(xié)議和防火墻的兼容的問(wèn)題。本說(shuō)明性實(shí)施例的技術(shù)與現(xiàn)有技術(shù)中的一些技術(shù)的不同之處在 于,就基于模型的壓縮編碼器而言,例如就ITUG.729協(xié)議標(biāo)準(zhǔn)集所 定義的基于模型的壓縮編碼器而言,本說(shuō)明性實(shí)施例具有比特?fù)寠Z (bit-robbing)特性。在現(xiàn)有技術(shù)中,在波形編碼器的情況下,比特 搶奪可直接(i)識(shí)別一個(gè)波形編碼的信號(hào)中的最低有效比特為直觀 地對(duì)劣化具有最小的敏感性;以及(ii)重寫(xiě)那些最低有效比特,其 中,沿波形、在時(shí)間上對(duì)所重寫(xiě)的比特充分地加以分隔,以最小化用戶所感知的劣化。相比之下,在基于模型的編碼器的情況下,要求對(duì)將加以重寫(xiě)的 比特進(jìn)行更小心的選擇,因?yàn)椴荒苤庇^看出應(yīng)該重寫(xiě)哪些比特。本說(shuō) 明性實(shí)施例的技術(shù)考慮了基于模型的編碼器的特征,例如,在用將加 以傳輸?shù)难a(bǔ)充信息替換目標(biāo)比特期間,跨越編碼器所生成的每一個(gè)幀 的每一比特的感知有效性。有利的做法是,通過(guò)對(duì)將加以重寫(xiě)的比特 的小心的選擇,本說(shuō)明性實(shí)施例技術(shù)可以在不向所傳輸?shù)谋忍亓魈砑?比特以及最小化對(duì)所感知信號(hào)質(zhì)量的影響的情況下,實(shí)現(xiàn)數(shù)字消息的 傳輸。另外,本說(shuō)明性實(shí)施例技術(shù)還提供了令人滿意的性能,甚至是 當(dāng)存在較低比特率的話音編碼器時(shí),例如,所述較低比特率的話音編碼器為那些具有每秒8K比特或低于每秒8K比特編碼率的較低比特 率的話音編碼器。根據(jù)本說(shuō)明性實(shí)施例,在整個(gè)所編碼的信息信號(hào)中散置的數(shù)字消 息包括接收端點(diǎn)可用于對(duì)相應(yīng)分組進(jìn)行驗(yàn)證的驗(yàn)證代碼信息。作為選 擇,數(shù)字消息也可用于隨諸如閉路字幕信息或者地理位置信息的相應(yīng) 編碼信息信號(hào)一起傳遞其它信息。有利的做法是,令每一個(gè)包含一個(gè) 所編碼的信息信號(hào)和數(shù)字消息的分組,在諸如音頻信號(hào)的已被編碼的 媒體信息和諸如針對(duì)音頻信號(hào)的相應(yīng)閉路字幕的散布的數(shù)字消息中 的補(bǔ)充信息之間,提供一種固有形式的同步。本發(fā)明的本說(shuō)明性實(shí)施例包含經(jīng)由一個(gè)基于模型的音頻編碼器 對(duì)一個(gè)第一音頻信號(hào)進(jìn)行編碼,從而產(chǎn)生一個(gè)長(zhǎng)度為M個(gè)比特的編 碼的音頻信號(hào);用 一數(shù)字消息的至少一部分替換所述編碼的音頻信號(hào) 的N個(gè)比特,其中N個(gè)比特基于所述基于模型的音頻編碼器的一個(gè) 第一特征,編碼的音頻信號(hào)的N個(gè)比特的替換提供了一個(gè)合成信號(hào); 以及把所述合成信號(hào)傳送給一個(gè)接收節(jié)點(diǎn),其中,M和N為正整數(shù), N小于M。
圖1描述了根據(jù)本發(fā)明的說(shuō)明性實(shí)施例的電信系統(tǒng)100的一個(gè)示意圖。圖2描述了根據(jù)本發(fā)明的說(shuō)明性實(shí)施例的電信端點(diǎn)102-m的傳 送處理路徑200的一個(gè)方框圖。圖3描述了根據(jù)本發(fā)明的說(shuō)明性實(shí)施例的電信端點(diǎn)102-m的接 收處理路徑300的一個(gè)方框圖。圖4描述了與沿傳送處理路徑200的一個(gè)信息信號(hào)的處理相關(guān)的主要任務(wù)的流程圖。圖5描述了沿與接收處理路徑300的一個(gè)信息信號(hào)的處理相關(guān)的 主要任務(wù)的流程圖。
具體實(shí)施方式
圖1描述了根據(jù)本發(fā)明的說(shuō)明性實(shí)施例的電信系統(tǒng)100的一個(gè)示 意圖。系統(tǒng)IOO在諸如電信端點(diǎn)的網(wǎng)絡(luò)元件之間路由話音交談或者諸 如視頻以及其它類型的音頻(例如,音樂(lè)等)的其它類型的媒體信息 信號(hào)。系統(tǒng)100包括分組傳輸網(wǎng)絡(luò)IOI、電信端點(diǎn)102-1 ~102-M、 以及網(wǎng)關(guān)103-1 ~103-N,其中,M和N為正整數(shù)。如圖中所示,互 連圖1中所描述的所有元件。分組傳輸網(wǎng)絡(luò)101用于向服務(wù)提供商的訂戶輸送諸如IP語(yǔ)音通 信(即,"VoIP")的一或多種類型的媒體。網(wǎng)絡(luò)IOI包括諸如路由器 的一或多個(gè)涉及傳輸?shù)墓?jié)點(diǎn),用于把載有處理的信息信號(hào)(例如,話 音分組等)的數(shù)據(jù)分組從一或多個(gè)源導(dǎo)向這些分組的正確的目的地。 網(wǎng)絡(luò)IOI能夠處理接入網(wǎng)絡(luò)IOI的諸如遍及系統(tǒng)100的各電信端點(diǎn)和 網(wǎng)關(guān)的網(wǎng)絡(luò)元件之間傳輸?shù)幕谝蛱鼐W(wǎng)協(xié)議的消息。盡管本說(shuō)明性實(shí) 施例中的網(wǎng)絡(luò)101為一個(gè)IP語(yǔ)音通信服務(wù)提供商的網(wǎng)絡(luò),然而網(wǎng)絡(luò) 101也可以為因特網(wǎng)、某些其它類型的基于因特網(wǎng)協(xié)議的網(wǎng)絡(luò)、或者 某些其它類型的基于分組的網(wǎng)絡(luò)。在某些實(shí)施例中,網(wǎng)絡(luò)101包含一或多個(gè)局域網(wǎng)(即,"LAN"), 例如在一個(gè)企業(yè)系統(tǒng)中,它們提供信號(hào)的局部分布。例如,每一個(gè)局 域網(wǎng)可以使一或多個(gè)電信端點(diǎn)接入一個(gè)更廣泛網(wǎng)絡(luò)。每一個(gè)局域網(wǎng)包含諸如集線器、橋以及交換器的網(wǎng)絡(luò)連接裝備,并且根據(jù)諸如以太網(wǎng)、IEEE 802.3、 IEEE 802.11等的網(wǎng)絡(luò)連接協(xié)議加以操作。電信端點(diǎn)102-m,其中m = l~M,為一個(gè)諸如桌上型電腦、會(huì) 議單元、無(wú)線終端、臺(tái)式機(jī)或者便攜式計(jì)算機(jī)(即,"軟電話,,)、因 特網(wǎng)電話等的通信設(shè)備。作為一個(gè)基于分組的設(shè)備,電信端點(diǎn)102-m 能夠按類似于個(gè)人計(jì)算機(jī)如何能夠與因特網(wǎng)上其它計(jì)算機(jī)交換信息 的方式,與電信系統(tǒng)100中的其它設(shè)備交換信息。端點(diǎn)102-m能夠?qū)?lái)自其用戶的話音信號(hào)進(jìn)行數(shù)字化,并且把 數(shù)字化的信號(hào)格式化成可以通過(guò)一個(gè)音頻壓縮器/解壓縮器(即, "CODEC")電路傳輸?shù)臄?shù)據(jù)分組,如以下以及針對(duì)圖2所描述的。 相類似,端點(diǎn)102-m的CODEC電路也能夠接收數(shù)據(jù)分組,并且把包 含在這些分組中的信息轉(zhuǎn)換成可由端點(diǎn)的用戶加以理解的話音信號(hào), 如以下以及針對(duì)圖3所描述的。另外,端點(diǎn)102-m還能夠根據(jù)本發(fā)明 的說(shuō)明性實(shí)施例執(zhí)行以下以及針對(duì)圖4和5所描述的任務(wù)。在閱讀了 本說(shuō)明書(shū)之后,這一技術(shù)領(lǐng)域中的熟練技術(shù)人員將會(huì)更清楚如何創(chuàng)建 和4吏用端點(diǎn)102-m。網(wǎng)關(guān)103-n,其中11 = 1~1\,為通過(guò)在兩個(gè)網(wǎng)絡(luò)之間轉(zhuǎn)發(fā)數(shù)據(jù)分 組,把分組傳輸網(wǎng)絡(luò)101和與一個(gè)特定的網(wǎng)關(guān)相關(guān)聯(lián)的網(wǎng)絡(luò)(例如公 共交換電話網(wǎng)絡(luò)等)相連的網(wǎng)絡(luò)連接設(shè)備。每一個(gè)網(wǎng)關(guān)103-n用作它 所連接到的兩個(gè)不同類型的網(wǎng)絡(luò)(即,分組網(wǎng)絡(luò)101和另一個(gè)網(wǎng)絡(luò)) 之間的一個(gè)轉(zhuǎn)發(fā)器(translator)。由于網(wǎng)關(guān)103-n把兩個(gè)不同類型的 網(wǎng)絡(luò)連接在一起,所以其主要功能之一是,在所述兩個(gè)網(wǎng)絡(luò)所使用的 不同的傳輸與編碼技術(shù)之間進(jìn)行轉(zhuǎn)換。因此,網(wǎng)關(guān)103-n還能夠在壓 縮的和解壓縮的信號(hào)之間進(jìn)行轉(zhuǎn)換(例如,經(jīng)由一個(gè)"CODEC"電路 等)。在某些實(shí)施例中,網(wǎng)關(guān)103-n能夠至少執(zhí)行以下以及針對(duì)圖4 和5所描述的某些任務(wù)。在閱讀了本說(shuō)明書(shū)之后,這一技術(shù)領(lǐng)域中的 熟練技術(shù)人員將會(huì)更清楚如何創(chuàng)建和使用網(wǎng)關(guān)103-n。根據(jù)本說(shuō)明性實(shí)施例,系統(tǒng)100的設(shè)備能夠進(jìn)行有線通信,并且 能夠在一個(gè)服務(wù)提供商環(huán)境中操作。這一技術(shù)領(lǐng)域中的熟練技術(shù)人員將會(huì)意識(shí)到,在某些可選的實(shí)施例中,系統(tǒng)100的某些或者全部設(shè)備
能夠進(jìn)行無(wú)線通信,并且能夠在各種類型的(例如,公共、專用等) 網(wǎng)絡(luò)中操作。另外,在某些可選的實(shí)施例中,除端點(diǎn)和網(wǎng)關(guān)之外的其
它設(shè)備也能夠執(zhí)行以下以及針對(duì)圖4和5所描述的任務(wù)。在閱讀了本 說(shuō)明書(shū)之后,這一技術(shù)領(lǐng)域中的熟練技術(shù)人員將會(huì)更清楚如何把本說(shuō) 明性實(shí)施例的技術(shù)施用于其它類型的設(shè)備以及其它操作環(huán)境中。
圖2描述了根據(jù)本發(fā)明的說(shuō)明性實(shí)施例的電信端點(diǎn)102-m的傳 送處理路徑200的一個(gè)方框圖。傳送路徑200處理一個(gè)信息信號(hào),例 如,來(lái)自端點(diǎn)的用戶的一個(gè)話音信號(hào),可以通過(guò)一個(gè)諸如麥克風(fēng)的換 能器采集所述信息信號(hào)。如果尚未呈數(shù)字形式,則模擬到數(shù)字的轉(zhuǎn)換 器210把信息信號(hào)從模擬形式轉(zhuǎn)換成數(shù)字形式。
在已經(jīng)進(jìn)行了數(shù)字化之后,信息編碼器211對(duì)信息信號(hào)進(jìn)行編 碼,以實(shí)現(xiàn)數(shù)據(jù)壓縮。在其中信息信號(hào)為話音信號(hào)的本說(shuō)明性實(shí)施例 中,信息編碼器211包括一個(gè)聲碼器,即,這一技術(shù)領(lǐng)域中人們所熟 悉的一種編解碼器(CODEC)類型的聲碼器,其執(zhí)行信息壓縮。聲 碼器釆集時(shí)間系列波形數(shù)據(jù),并且將所述數(shù)據(jù)轉(zhuǎn)換成相應(yīng)于語(yǔ)音模式 特征的數(shù)字符號(hào)。
根據(jù)本發(fā)明的本說(shuō)明性實(shí)施例,編碼器211根據(jù)這一技術(shù)領(lǐng)域中 人們所熟悉的ITU G.729協(xié)議標(biāo)準(zhǔn)操作。1996年3月發(fā)表的ITU-T Recommendation G.729, "Coding of Speech at 8Kbit / s using Conjugates-Structure Algebraic-Code-Excited Linear -Predication (CS-ACELP),,以及相應(yīng)的附錄(即附錄A、附錄B等)中描述了 ITU G.729協(xié)議標(biāo)準(zhǔn),特將它們?nèi)坎⑷氪颂?,以作參考。編碼器211 為一個(gè)基于模型的編解碼器,其不同于諸如基于ITUG.711的基于波 形的編解碼器。
傳送控制器213并發(fā)地確定是否需要隨所編碼的信息信號(hào)一起 把一個(gè)補(bǔ)充信號(hào)(例如,為了進(jìn)行控制等)傳送到接收節(jié)點(diǎn)。例如, 補(bǔ)充信號(hào)可能為一個(gè)驗(yàn)證代碼,接收節(jié)點(diǎn)可使用該驗(yàn)證代碼驗(yàn)證其所 接收的分組??刂破?13從一個(gè)外部源獲取補(bǔ)充信號(hào),或者自身生成所述信號(hào)。當(dāng)需要傳送一個(gè)補(bǔ)充信號(hào)時(shí),控制器213把代表補(bǔ)充信號(hào) 的數(shù)字消息寫(xiě)至存儲(chǔ)設(shè)備214。
數(shù)字信號(hào)處理器215從編碼器211接收幀形式的、壓縮的、編碼 的信息信號(hào),并且準(zhǔn)備用于傳輸?shù)男盘?hào)。處理器215還從存儲(chǔ)器214 讀取數(shù)字消息,并且用來(lái)自數(shù)字消息的比特替換所編碼的信息信號(hào)中 的一個(gè)所選擇的比特組合。根據(jù)本說(shuō)明性實(shí)施例,所選擇的比特的組 合基于現(xiàn)有分析技術(shù)。在某些可選的實(shí)施例中,處理器215通過(guò)對(duì)來(lái) 自所編碼的信息信號(hào)的數(shù)據(jù)進(jìn)行估計(jì),確定比特的組合。這樣做,處 理器215可以根據(jù)編碼器的一或多個(gè)特征,例如,所編碼的信息信號(hào) 中的每一比特的感知有效性,確定能夠用從控制器214所接收的比特 替換(即,重寫(xiě))哪些信息信號(hào)比特,如以下所描述的。因替換所產(chǎn) 生的信號(hào)為一個(gè)合成信號(hào),該合成信號(hào)包括信息信號(hào)和補(bǔ)充信號(hào)。
可以把來(lái)自數(shù)字消息的替換比特放入每一幀中,以致每一數(shù)字消 息可跨越多個(gè)幀,或者放入一個(gè)單一的幀中。根據(jù)本說(shuō)明性實(shí)施例, 數(shù)字消息的每一部分可能直接與該部分所伴隨的所編碼的信息信號(hào) 相關(guān)聯(lián)。另外,在一個(gè)幀中,每一個(gè)數(shù)字消息部分可以僅在時(shí)間上與 其伴隨的所編碼的信息信號(hào)一致。作為選擇,每一個(gè)數(shù)字消息部分的 實(shí)際內(nèi)容也可以相應(yīng)于伴隨信息信號(hào)的內(nèi)容,例如,其中,在與信息
信號(hào)中的相應(yīng)的音頻同步的數(shù)字消息中傳輸閉路字幕。
處理器215也執(zhí)行其它的功能,例如,對(duì)所述幀進(jìn)行編碼以轉(zhuǎn)發(fā) 錯(cuò)誤校正,以及對(duì)所述幀進(jìn)行格式化以加以傳輸。把合成信號(hào)發(fā)送至 傳送器216,然后傳送器216按人們十分熟悉的方式把合成信號(hào)傳送 給網(wǎng)絡(luò)101。
圖3描述了根據(jù)本發(fā)明的本說(shuō)明性實(shí)施例的電信端點(diǎn)102-m的 接收處理路徑300的一個(gè)方框圖。接收路徑300從一個(gè)傳送端點(diǎn)或者 從另一個(gè)可容納分組的設(shè)備(例如網(wǎng)關(guān)103-n等)接收分組,每一個(gè) 分組包含一或多個(gè)合成信號(hào)幀。然后,路徑300處理所接收的合成信 號(hào)幀。具體地講,接收器309按人們十分熟悉的方式從網(wǎng)絡(luò)101接收 分組信號(hào)。數(shù)字信號(hào)處理器310檢測(cè)并且校正錯(cuò)誤,然后,在每一個(gè)所接收的合成信號(hào)幀中把補(bǔ)充比特與所編碼的信息比特加以分隔,并
且將這些比特存儲(chǔ)于存儲(chǔ)器311中。當(dāng)需要時(shí),接收控制器312存取 補(bǔ)充比特。例如,如果補(bǔ)充比特代表一個(gè)驗(yàn)證代碼,則控制器312使 用該驗(yàn)證代碼確定所接收的所編碼的信息信號(hào)的真實(shí)性。
信息解碼器313對(duì)所編碼的信息信號(hào)進(jìn)行解碼(解壓縮),以得 到原始信息信號(hào)的一個(gè)重構(gòu)版本。在其中信息信號(hào)為話音信號(hào)的本說(shuō) 明性實(shí)施例中,解碼器313包含一個(gè)聲碼器,其為這一技術(shù)領(lǐng)域中人 們所熟悉的編解碼器類型的聲碼器。所述聲碼器采集所接收的所編碼 的信息信號(hào)中的數(shù)字?jǐn)?shù)據(jù),所述數(shù)據(jù)相應(yīng)于語(yǔ)音模式特征,而且所述 聲碼器還把所述數(shù)據(jù)轉(zhuǎn)換成時(shí)間系列波形數(shù)據(jù)。
根據(jù)本發(fā)明的本說(shuō)明性實(shí)施例,解碼器313才艮據(jù)ITU G.729協(xié)議 標(biāo)準(zhǔn)操作,如這一技術(shù)領(lǐng)域中人們所熟悉的。與其對(duì)應(yīng)的編碼器211 一樣,解碼器313為一種基于模型的編解碼器。
數(shù)字到模擬的轉(zhuǎn)換器314繼續(xù)沿接收路徑300把所編碼的信息信 號(hào)從數(shù)字形式轉(zhuǎn)換成模擬形式。此后,可以另行處理模擬信息信號(hào), 以最終呈現(xiàn)給接收端點(diǎn)的用戶,例如通過(guò)揚(yáng)聲器。
圖4和5描述了根據(jù)本發(fā)明的本說(shuō)明性實(shí)施例的電信端點(diǎn)102-m 所執(zhí)行的主要任務(wù)的流程圖。圖4中的主要任務(wù)與沿圖2中所描述的 傳送處理路徑200的信息信號(hào)的處理相關(guān)聯(lián)。圖5中的主要任務(wù)與沿 圖3中所描述的接收處理路徑300的信息信號(hào)的處理相關(guān)聯(lián)。出于教 授之目的,以下的例子說(shuō)明了一個(gè)進(jìn)行中的呼叫會(huì)話,在該呼叫會(huì)話 中,端點(diǎn)102-1正在向端點(diǎn)102-2發(fā)送一個(gè)音頻分組流。在這一例子 中,傳送端點(diǎn)102-1正在執(zhí)行關(guān)于圖4的任務(wù),接收端點(diǎn)102-2正在 執(zhí)行關(guān)于圖5的任務(wù)。這一技術(shù)領(lǐng)域中的熟練技術(shù)人員將會(huì)意識(shí)到, 可以并行地或者按與所描述的次序不同的次序執(zhí)行出現(xiàn)在圖4和5中 的某些任務(wù)。
在某些實(shí)施例中,這一技術(shù)領(lǐng)域中的熟練技術(shù)人員將會(huì)意識(shí)到, 端點(diǎn)102-2可能并發(fā)地向端點(diǎn)102-1發(fā)送回一個(gè)音頻分組流,在這一 情況下,端點(diǎn)102-2也執(zhí)行關(guān)于圖4的任務(wù),而端點(diǎn)102-1也執(zhí)行關(guān)于圖5的任務(wù)。這一技術(shù)領(lǐng)域中的熟練技術(shù)人員將會(huì)意識(shí)到,作為選 擇,系統(tǒng)IOO中的其它節(jié)點(diǎn)也可以執(zhí)行圖4和5中所描述的任務(wù)。
參照?qǐng)D4,在任務(wù)401處,端點(diǎn)102-1的傳送處理路徑200按人 們十分熟悉的方式接收一個(gè)音頻信號(hào)的一段。
在任務(wù)402處,傳送路徑200根據(jù)ITU G.729協(xié)議標(biāo)準(zhǔn),對(duì)音頻 信號(hào)進(jìn)行編碼,從而提供了一個(gè)編碼的音頻信號(hào)幀,該編碼的音頻信 號(hào)幀長(zhǎng)為M個(gè)比特,在這一情況下,其中M等于80。
在任務(wù)403處,傳送路徑200獲取一條將隨音頻信號(hào)一起傳輸?shù)?數(shù)字消息。例如,控制器214根據(jù)編碼的音頻信號(hào)幀的一部分、 一個(gè) 共享密鑰以及一種雜湊算法,計(jì)算一個(gè)驗(yàn)證代碼。各種其它計(jì)算驗(yàn)證 代碼的技術(shù)是這一技術(shù)領(lǐng)域中人們十分熟悉的,并且可以將它們施用 于此處。
作為第二個(gè)例子,數(shù)字消息將包含閉路字幕信息,閉路字幕信息 將與也被發(fā)送的音頻信息信號(hào)相一致。在這一情況下,路徑200對(duì)來(lái) 自音頻信息信號(hào)的閉路字幕文本進(jìn)行編碼,并且提供有利于接收端點(diǎn) 的同步化信息。在這一方式下,在播放相應(yīng)的音頻信號(hào)的同時(shí),接收 端點(diǎn)處的用戶將會(huì)看到閉路字幕文本。注意,同步化是本說(shuō)明性實(shí)施 例的合成信號(hào)幀的固有特性,其中,可以在同一幀中表示編碼的信息 信號(hào)和相應(yīng)的數(shù)字消息。
在任務(wù)404處,根據(jù)本說(shuō)明性實(shí)施例,傳送路徑200用數(shù)字消息 的至少一部分替換M個(gè)比特的編碼的音頻信號(hào)中的N個(gè)比特,從而 產(chǎn)生一個(gè)合成信號(hào)幀。結(jié)合本發(fā)明所進(jìn)行的一個(gè)試驗(yàn)性研究表明,在 從編碼器211所接收的編碼的音頻信息信號(hào)的每個(gè)80比特的幀中, 處理器215可以替換一或多個(gè)比特位置39、 40、 68、 69、 30以及41 處的比特,而且對(duì)所感知的音頻質(zhì)量具有相當(dāng)小的影響。在所述幀中, 在比特位置1和80處的比特分別為第一和最后一個(gè)將加以傳輸?shù)谋?特。例如,處理器215可以替換所述幀中的總共4個(gè)比特,比特編號(hào) 39、 40、 68以及69(即,N等于4)。又例如,處理器215可以替換 所述幀中的總共6個(gè)比特,比特編號(hào)39、 40、 68、 69、 30以及41(即,N等于6)。
在本說(shuō)明性實(shí)施例中排序的比特流中,根據(jù)ITU G.729協(xié)議標(biāo) 準(zhǔn),在每一個(gè)80比特的幀中,比特39和40為第一子幀中的第四個(gè) 電碼本(codebook)脈沖位置的最低有效比特。相類似,比特68和 69為第二子幀中的第四個(gè)電碼本脈沖位置的最低有效比特。比特30 為第一子幀中的第一個(gè)電碼本脈沖位置的最低有效比特。最后,比特 41為第一子幀中的一個(gè)電碼本脈沖的符號(hào)比特。與電碼本相關(guān)的比特 的概念和包含那些比特的所生成的子幀,是這一技術(shù)領(lǐng)域中人們十分 熟悉的。
在閱讀了本說(shuō)明書(shū)之后,這一技術(shù)領(lǐng)域中的熟練技術(shù)人員將會(huì)明 顯意識(shí)到,如何創(chuàng)建和使用其中所替換的比特為不同于本說(shuō)明性實(shí)施 例中的電碼本脈沖位置的一或多個(gè)電碼本脈沖位置中的每一個(gè)位置 的一或多個(gè)最低有效比特的可選的實(shí)施例。這一技術(shù)領(lǐng)域中的熟練技 術(shù)人員將會(huì)意識(shí)到,在某些實(shí)施例中,所替換的比特可以跨越若干個(gè) 子幀,或者跨越若干個(gè)幀,或者跨越這兩者,只要期望發(fā)現(xiàn)一條數(shù)字 消息的接收端點(diǎn)知道替換序列即可。另外,這一技術(shù)領(lǐng)域中的熟練技 術(shù)人員也將會(huì)意識(shí)到,也可以把替換一或多個(gè)最低有效比特的本說(shuō)明 性實(shí)施例的技術(shù)施用于 一個(gè)根據(jù)除ITU G.729之外的協(xié)議標(biāo)準(zhǔn)操作的 基于模型的音頻編碼器。
在任務(wù)405處,傳送路徑200把合成信號(hào)幀傳送到端點(diǎn)102-2。 在任務(wù)405后,任務(wù)執(zhí)行過(guò)程返回至任務(wù)401,以處理音頻信號(hào)的下 一個(gè)幀的價(jià)值(worth)。
參照?qǐng)D5,在任務(wù)501處,端點(diǎn)102-2的接收處理路徑300接收 端點(diǎn)102-1所傳送的合成信號(hào)幀。
在任務(wù)502處,接收路徑300試圖找到嵌入在從端點(diǎn)102-1所接 收的合成信號(hào)幀中的一條數(shù)字消息。根據(jù)本說(shuō)明性實(shí)施例,路徑300 提取一個(gè)已知模式的比特,即根據(jù)在任務(wù)404處由端點(diǎn)102-1所重寫(xiě) 的比特的同一組合。
從端點(diǎn)102-2的角度來(lái)看,在所編碼的信息比特中, 一個(gè)傳送端點(diǎn)可能嵌入了也可能未嵌入一個(gè)信號(hào)。在本說(shuō)明性實(shí)施例中,由于不 存在指示一條數(shù)字消息存在與否的專用的比特,甚至是不存在指示一 條數(shù)字消息可能處于其中的比特位置的專用的比特,所以接收路徑
300通過(guò)嘗試比特位置的多個(gè)組合以及考察所抽取的比特的每一個(gè)組 合以確定是否存在一條有效的數(shù)字消息,來(lái)試圖找到一條數(shù)字消息。 例如,如果發(fā)現(xiàn)傳送端點(diǎn)102-1所提供的為某一數(shù)字消息的一部分(例 如,檢查和)的信息是正確的,則把該數(shù)字消息視為有效的。
在任務(wù)503處,如果發(fā)現(xiàn)合成信號(hào)幀中存在一條數(shù)字消息,則任 務(wù)執(zhí)行過(guò)程前進(jìn)至任務(wù)504。否則,不存在數(shù)字消息,并且任務(wù)執(zhí)行 過(guò)程前進(jìn)至任務(wù)506。
在任務(wù)504處,接收路徑300接下來(lái)把數(shù)字消息與一個(gè)所預(yù)期的 結(jié)果進(jìn)行比較。例如,如果把數(shù)字消息用作一個(gè)驗(yàn)證代碼,則接收路 徑300把所接收的驗(yàn)證代碼與 一個(gè)所計(jì)算的驗(yàn)證代碼進(jìn)行匹配,其中, 所計(jì)算的代碼基于所接收的編碼的信息比特、 一個(gè)共享密鑰以及一種 雜湊算法。如果數(shù)字消息與所預(yù)期的結(jié)果相匹配,則任務(wù)執(zhí)行過(guò)程前 進(jìn)至任務(wù)505。否則,任務(wù)執(zhí)行過(guò)程前進(jìn)至任務(wù)508。在某些可選的 實(shí)施例中,不執(zhí)行數(shù)字消息與一個(gè)所預(yù)期的結(jié)果的匹配。
在任務(wù)505處,如果需要的話,則接收路徑300進(jìn)一步處理數(shù)字 消息。例如,數(shù)字消息可能包含與也被接收的音頻信息信號(hào)的回放相 一致的閉路字幕信息。在這一情況下,接收路徑300根據(jù)從數(shù)字消息 中所接收的數(shù)據(jù)形成可顯示的閉路字幕文本,然后把用戶將看到的閉 路字幕文本與所發(fā)送的相應(yīng)的音頻信號(hào)重新加以同步。
在任務(wù)506處,接收路徑300對(duì)來(lái)自所接收的合成信號(hào)幀的一個(gè) 音頻信號(hào)進(jìn)行解碼(即,重構(gòu))。在某些實(shí)施例中,如果相應(yīng)于一條 數(shù)字消息的比特存在于合成信號(hào)幀中,則修改這些比特的某些或者全 部比特的值,以改進(jìn)信息解碼的結(jié)果。
在任務(wù)507處,接收路徑300按人們所熟悉的方式,把所解碼的 音頻信號(hào)發(fā)送給一個(gè)音頻電路以進(jìn)行進(jìn)一步的處理。然后,任務(wù)執(zhí)行 過(guò)程返回至任務(wù)501,以處理從端點(diǎn)102-1所接收的下一個(gè)幀。在任務(wù)508處,在某些實(shí)施例中,在數(shù)字消息不與一個(gè)所預(yù)期的 結(jié)果相匹配的情況下,接收路徑300忽略所接收的合成信號(hào)幀。例如, 如果把數(shù)字消息用于對(duì)所接收的分組的驗(yàn)證,則如果驗(yàn)證過(guò)程斷定分 組不是真實(shí)的,則丟棄該分組。然后,任務(wù)執(zhí)行過(guò)程返回至任務(wù)501, 以處理從端點(diǎn)102-1所接收的下一個(gè)幀。這一技術(shù)領(lǐng)域中的熟練技術(shù)人員將會(huì)意識(shí)到,可以在接收端點(diǎn) 102-2處聚集多個(gè)數(shù)字消息,然后將它們作為一個(gè)整體,用于某一預(yù) 定的目的。應(yīng)該認(rèn)識(shí)到,所公開(kāi)的內(nèi)容僅講授了本說(shuō)明性實(shí)施例的一個(gè)例 子,在閱讀了這一公開(kāi)內(nèi)容之后,這一技術(shù)領(lǐng)域中的熟練技術(shù)人員可 以很容易地設(shè)計(jì)本發(fā)明的多種變通形式,本發(fā)明的范圍將由以下權(quán)利 要求加以確定。
權(quán)利要求
1.一種隨一個(gè)第一音頻信號(hào)傳送一個(gè)數(shù)字消息的方法,該方法包括經(jīng)由一個(gè)基于模型的音頻編碼器對(duì)所述第一音頻信號(hào)進(jìn)行編碼,從而產(chǎn)生一個(gè)長(zhǎng)度為M個(gè)比特的編碼的音頻信號(hào);用所述數(shù)字消息的至少一部分替換所述編碼的音頻信號(hào)的N個(gè)比特,其中所述N個(gè)比特基于所述基于模型的音頻編碼器的一個(gè)第一特征,所述編碼的音頻信號(hào)的所述N個(gè)比特的替換產(chǎn)生一個(gè)合成信號(hào);以及把所述合成信號(hào)傳送給一個(gè)接收節(jié)點(diǎn);其中,M和N為正整數(shù),N小于M。
2. 根據(jù)權(quán)利要求1所述的方法,其中,所述基于模型的音頻編 碼器根據(jù)ITU G.729協(xié)議標(biāo)準(zhǔn)操作。
3. 根據(jù)權(quán)利要求2所述的方法,其中,在一個(gè)M個(gè)比特的幀中, 所述N個(gè)比特包含比特位置40和69,其中M等于80,而且其中在 所述幀中比特位置1處的比特被首先傳送。
4. 根據(jù)權(quán)利要求3所述的方法,其中,所述N個(gè)比特還包含比 特位置39和68,而且其中N等于4。
5. 根據(jù)權(quán)利要求1所述的方法,還包含計(jì)算一個(gè)基于所述編碼 的音頻信號(hào)的至少 一部分的串,其中所述數(shù)字消息包含所述串。
6. 根據(jù)權(quán)利要求5所述的方法,其中,所述串向所述接收節(jié)點(diǎn) 傳遞驗(yàn)證信息。
7. 根據(jù)權(quán)利要求5所述的方法,其中,所述串傳遞元數(shù)據(jù),該 元數(shù)據(jù)描述(i)所述第一音頻信號(hào)和(ii)所述編碼的音頻信號(hào)中的 至少一個(gè)。
8. 根據(jù)權(quán)利要求5所述的方法,其中,所述串傳遞相應(yīng)于所述 第一音頻信號(hào)的閉路字幕信息。
9. 根據(jù)權(quán)利要求1所述的方法,其中,所述第一特征為來(lái)自所述基于模型的音頻編碼器的每一輸出比特的感知有效性水平,其中所 述基于模型的音頻編碼器根據(jù)至少兩個(gè)感知有效性水平輸出比特。
10. 根據(jù)權(quán)利要求l所述的方法,其中N與M的比率基于所述 基于模型的音頻編碼器的輸出速率。
11. 一種隨一個(gè)第一音頻信號(hào)傳送一個(gè)數(shù)字消息的方法,該方法包括經(jīng)由一個(gè)根據(jù)ITU G.729協(xié)議標(biāo)準(zhǔn)操作的音頻編碼器對(duì)所述第 一音頻信號(hào)進(jìn)行編碼,從而產(chǎn)生一個(gè)長(zhǎng)度為M個(gè)比特的編碼的音頻 信號(hào);用所述數(shù)字消息的至少一部分替換所述編碼的音頻信號(hào)的N個(gè) 比特,其中所述N個(gè)比特基于來(lái)自所述音頻編碼器的每一輸出比特的 感知有效性水平,所述編碼的音頻信號(hào)的所述N個(gè)比特的替換產(chǎn)生一 個(gè)合成信號(hào);以及把所述合成信號(hào)傳送給一個(gè)接收節(jié)點(diǎn);其中所述音頻編碼器根據(jù)至少兩個(gè)感知有效性水平來(lái)輸出比特;以及其中M和N為正整數(shù),N小于M。
12. 根據(jù)權(quán)利要求11所述的方法,其中所述N個(gè)比特包含在一 個(gè)M個(gè)比特的幀中的比特位置40和69,其中M等于80,而且其中, 在所述幀中比特位置1處的比特被首先傳送。
13. 根據(jù)權(quán)利要求12所述的方法,其中所迷N個(gè)比特還包含比 特位置39和68,而且其中N等于4。
14. 根據(jù)權(quán)利要求11所述的方法,還包含計(jì)算一個(gè)基于所述編 碼的音頻信號(hào)的至少一部分的串,其中所述數(shù)字消息包含所述串。
15. 根據(jù)權(quán)利要求14所述的方法,其中所述串向所述接收節(jié)點(diǎn) 提供驗(yàn)證信息。
16. 根據(jù)權(quán)利要求14所述的方法,其中,所述串傳遞元數(shù)據(jù),該元數(shù)據(jù)描述(i)所述第一音頻信號(hào)和(ii)所述編碼的音頻信號(hào)中 的至少一個(gè)。
17. 根據(jù)權(quán)利要求14所述的方法,其中,所迷串傳遞相應(yīng)于所 述第一音頻信號(hào)的閉路字幕信息。
18. —種隨一個(gè)第一音頻信號(hào)傳送一個(gè)驗(yàn)證的方法,該方法包括 經(jīng)由一個(gè)根據(jù)ITU G.729協(xié)議標(biāo)準(zhǔn)操作的音頻編碼器對(duì)所述第一音頻信號(hào)進(jìn)行編碼,從而產(chǎn)生一個(gè)長(zhǎng)度為M個(gè)比特的編碼的音頻 信號(hào);計(jì)算一個(gè)驗(yàn)證代碼,該驗(yàn)證代碼基于所述編碼的音頻信號(hào)的至少一部分;用所述驗(yàn)證代碼的至少一部分替換所述編碼的音頻信號(hào)的N個(gè) 比特;所述編碼的音頻信號(hào)的所述N個(gè)比特的替換產(chǎn)生一個(gè)合成信 號(hào);以及把所述合成信號(hào)傳送給一個(gè)接收節(jié)點(diǎn);其中,所述音頻編碼器根據(jù)至少兩個(gè)感知有效性水平輸出比特;以及其中,M和N為正整數(shù),N小于M。
19. 根據(jù)權(quán)利要求18所述的方法,其中,所述N個(gè)比特包含在 一個(gè)M個(gè)比特的幀中的比特位置40和69,其中M等于80,而且其 中,在所迷幀中比特位置l處的比特被首先傳送。
20. 根據(jù)權(quán)利要求19所述的方法,其中,所述N個(gè)比特還包含 比特位置39和68,而且其中N等于4。
21. 根據(jù)權(quán)利要求18所述的方法,其中,所述N個(gè)比特基于來(lái) 自所述音頻編碼器的每一輸出比特的感知有效性水平。
全文摘要
公開(kāi)了一種使一個(gè)數(shù)字消息隨一個(gè)諸如音頻或視頻的相應(yīng)的媒體信息信號(hào)加以傳送的方法。正在處理來(lái)自其用戶的諸如語(yǔ)音信號(hào)的信息信號(hào)的電信設(shè)備通過(guò)使用一個(gè)基于模型的壓縮編碼器對(duì)信息信號(hào)進(jìn)行編碼。一種這樣的設(shè)備是電信端點(diǎn)。然后,根據(jù)對(duì)每一所編碼的比特的感知有效性的估計(jì),或者根據(jù)信號(hào)的某些其它有意義的特征,端點(diǎn)的處理器(i)確定可以重寫(xiě)哪些所編碼的比特;以及(ii)取代所重寫(xiě)的比特在整個(gè)編碼的信號(hào)中散置數(shù)字消息。接下來(lái),端點(diǎn)把這些數(shù)字消息比特作為編碼的信息信號(hào)的一部分加以傳送。按照這一方式,沒(méi)有把額外的比特附加于將加以傳送的分組,從而解決了與現(xiàn)存協(xié)議和防火墻的兼容的問(wèn)題。
文檔編號(hào)H04L12/56GK101262418SQ20081000564
公開(kāi)日2008年9月10日 申請(qǐng)日期2008年2月14日 優(yōu)先權(quán)日2007年2月15日
發(fā)明者安朱爾·森達(dá)雷?!た死锵<{庫(kù)馬爾, 納維卓特·辛, 薩辛·加格, 阿克莎·阿得赫卡里 申請(qǐng)人:阿瓦雅技術(shù)有限公司