欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用編解碼器強(qiáng)制的幀大小進(jìn)行音頻分割的制作方法

文檔序號(hào):11961302閱讀:255來(lái)源:國(guó)知局
用編解碼器強(qiáng)制的幀大小進(jìn)行音頻分割的制作方法與工藝

本案是分案申請(qǐng)。該分案的母案是申請(qǐng)日為2010年12月21日、申請(qǐng)?zhí)枮?01080061488.9、發(fā)明名稱為“用編解碼器強(qiáng)制的幀大小進(jìn)行音頻分割”的發(fā)明專利申請(qǐng)案。

技術(shù)領(lǐng)域

本發(fā)明的實(shí)施例涉及在因特網(wǎng)上遞送媒體內(nèi)容的領(lǐng)域;且更具體來(lái)說(shuō),涉及在不引入邊界假象的情況下將媒體內(nèi)容的音頻分割成單獨(dú)內(nèi)容文件。



背景技術(shù):

因特網(wǎng)正變?yōu)橛糜谙蜃罱K用戶分配媒體內(nèi)容(例如,視頻及音頻或音頻)及其它信息的主要方法。當(dāng)前,可將音樂(lè)、視頻、游戲及其它媒體信息下載到計(jì)算機(jī)、蜂窩電話及實(shí)際上任何具有網(wǎng)絡(luò)能力的裝置。接入因特網(wǎng)以尋找媒體內(nèi)容的人的百分比正在快速增長(zhǎng)。觀看者體驗(yàn)的質(zhì)量是在線視頻觀看的增長(zhǎng)的主要障礙。對(duì)在線視頻的消費(fèi)者預(yù)期由其電視及電影觀看體驗(yàn)設(shè)定。

在web上流式傳輸視頻的觀眾數(shù)目正在快速增長(zhǎng),且存在對(duì)在因特網(wǎng)上觀看視頻的正在增長(zhǎng)的興趣及需求。數(shù)據(jù)文件的流式傳輸或“流式傳輸媒體”是指以足以在最初預(yù)計(jì)的回放速度下向用戶呈現(xiàn)順序媒體內(nèi)容而不具有顯著中斷的速率遞送所述媒體的技術(shù)。不同于媒體文件的經(jīng)下載數(shù)據(jù),經(jīng)流式傳輸數(shù)據(jù)可存儲(chǔ)于存儲(chǔ)器中直到回放所述數(shù)據(jù),且隨后接著在已過(guò)去規(guī)定的時(shí)間量之后刪除所述數(shù)據(jù)。

與在空中、在衛(wèi)星或電纜上的正規(guī)廣播相比,在因特網(wǎng)上流式傳輸媒體內(nèi)容具有一些挑戰(zhàn)。在編碼媒體內(nèi)容的音頻的背景中出現(xiàn)的一個(gè)擔(dān)憂問(wèn)題是在將視頻及音頻分段成固定時(shí)間部分時(shí)引入邊界假象。在一種常規(guī)方法中,將音頻分段成具有匹配對(duì)應(yīng)視頻的固定持續(xù)時(shí)間的固定持續(xù)時(shí)間(舉例來(lái)說(shuō),兩秒)的若干部分。在此方法中,音頻邊界始終與視頻邊界對(duì)準(zhǔn)。常規(guī)方法開(kāi)始音頻編解碼器的新編碼會(huì)話以(舉例來(lái)說(shuō))使用低復(fù)雜性高級(jí)音頻編碼(AAC LC)編碼每一內(nèi)容文件的每一音頻部分。通過(guò)針對(duì)音頻的每一部分使用新的編碼會(huì)話,音頻編解碼器將波形的開(kāi)頭及結(jié)尾解釋為從零的轉(zhuǎn)變,從而在經(jīng)編碼部分的回放中在部分邊界處產(chǎn)生噼噗或咔嗒噪聲,例如圖1中所圖解說(shuō)明。噼噗或咔嗒噪聲稱作邊界假象。此外,音頻編解碼器根據(jù)編解碼器強(qiáng)制的幀大小編碼固定持續(xù)時(shí)間的音頻。此還在由音頻編解碼器產(chǎn)生的樣本的數(shù)目不能由編解碼器強(qiáng)制的幀大小整除時(shí)引入邊界假象。

圖1是圖解說(shuō)明使用常規(guī)方法的兩個(gè)音頻部分的示范性音頻波形100的圖示。音頻波形100圖解說(shuō)明視頻的第一與第二部分之間從零的轉(zhuǎn)變102。當(dāng)音頻編解碼器具有固定幀大小(本文中稱作編解碼器強(qiáng)制的幀大小)時(shí),經(jīng)編碼的音頻要求在所述部分的樣本的數(shù)目不能由根據(jù)編解碼器強(qiáng)制的幀大小每幀樣本的數(shù)目整除時(shí)用零填補(bǔ)最后一個(gè)幀104。舉例來(lái)說(shuō),當(dāng)使用48kHz的取樣速率時(shí),存在針對(duì)兩秒的音頻段產(chǎn)生的96,000個(gè)樣本。當(dāng)將樣本的數(shù)目96,000除以每幀樣本的數(shù)目(例如,針對(duì)AAC LC為1024個(gè)樣本且針對(duì)高效率AAC(HE AAC)為2048個(gè)樣本)時(shí),結(jié)果為93.75個(gè)幀。由于數(shù)目93.75并非整數(shù),因此音頻編解碼器用零填補(bǔ)最后一個(gè)幀104。在此實(shí)例中,為最后一個(gè)幀的最后256個(gè)樣本賦予零值。雖然零值表示靜默音頻,但用零填補(bǔ)最后一個(gè)幀在音頻的經(jīng)編碼部分的回放期間在部分邊界處產(chǎn)生噼噗或咔嗒噪聲。從零的轉(zhuǎn)變102及最后一個(gè)幀中的經(jīng)填補(bǔ)零104引入邊界假象。邊界假象的引入可降低音頻的總體質(zhì)量,從而在媒體內(nèi)容的回放期間影響用戶的體驗(yàn)。

另一常規(guī)方法嘗試通過(guò)使用具有較長(zhǎng)持續(xù)時(shí)間以便與幀邊界對(duì)準(zhǔn)的音頻部分來(lái)限制邊界假象的數(shù)目。然而,通過(guò)使用音頻的較大持續(xù)時(shí)間部分,可需要單獨(dú)地封裝音頻及視頻。此可呈現(xiàn)流式傳輸具有音頻及視頻的媒體內(nèi)容的缺陷,尤其是在以不同質(zhì)量等級(jí)編碼同一媒體內(nèi)容時(shí),舉例來(lái)說(shuō),所述不同質(zhì)量等級(jí)在允許在媒體內(nèi)容的回放期間在不同質(zhì)量等級(jí)之間變換的自適應(yīng)流式傳輸?shù)谋尘爸惺褂谩?/p>



技術(shù)實(shí)現(xiàn)要素:

在一方面中,本發(fā)明涉及一種由計(jì)算系統(tǒng)實(shí)施以流式傳輸包含音頻和視頻的媒體內(nèi)容的方法。所述方法包括:由所述計(jì)算系統(tǒng)接收多個(gè)內(nèi)容文件,其中所述多個(gè)內(nèi)容文件中的每一者包括所述視頻的根據(jù)幀速率編碼的且具有固定持續(xù)時(shí)間的經(jīng)編碼部分及所述音頻的根據(jù)編解碼器強(qiáng)制的幀大小編碼的且具有多個(gè)全音頻幀的經(jīng)編碼部分,所述多個(gè)全音頻幀具有所述編解碼器強(qiáng)制的幀大小,其中所述多個(gè)內(nèi)容文件中的一者或多者的所述音頻的所述經(jīng)編碼部分的持續(xù)時(shí)間大于或小于所述固定持續(xù)時(shí)間;以及由所述計(jì)算系統(tǒng)分級(jí)所述多個(gè)內(nèi)容文件的所述音頻的所述經(jīng)編碼部分以作為連續(xù)流呈現(xiàn)。

在另一方面中,本發(fā)明涉及一種上面存儲(chǔ)指令的非暫時(shí)計(jì)算機(jī)可讀存儲(chǔ)媒體。所述指令在由計(jì)算裝置執(zhí)行時(shí)致使所述計(jì)算裝置執(zhí)行方法。所述方法包括:接收與包括音頻和視頻的媒體內(nèi)容相對(duì)應(yīng)的多個(gè)內(nèi)容文件,其中所述多個(gè)內(nèi)容文件中的每一者包括所述視頻的根據(jù)幀速率編碼的且具有固定持續(xù)時(shí)間的經(jīng)編碼部分及所述音頻的根據(jù)編解碼器強(qiáng)制的幀大小編碼的且具有多個(gè)全音頻幀的經(jīng)編碼部分,所述多個(gè)全音頻幀具有所述編解碼器強(qiáng)制的幀大小,其中所述多個(gè)內(nèi)容文件中的一者或多者的所述音頻的所述經(jīng)編碼部分的持續(xù)時(shí)間大于或小于所述固定持續(xù)時(shí)間;以及分級(jí)所述多個(gè)內(nèi)容文件的所述音頻的所述經(jīng)編碼部分以作為連續(xù)流呈現(xiàn)。

在另一方面中,本發(fā)明涉及一種計(jì)算裝置。所述計(jì)算裝置包括:解碼器;以及媒體播放器。所述媒體播放器耦合至內(nèi)容遞送網(wǎng)絡(luò)以從所述內(nèi)容遞送網(wǎng)絡(luò)請(qǐng)求與包括音頻和視頻的媒體內(nèi)容相對(duì)應(yīng)的多個(gè)內(nèi)容文件,從所述內(nèi)容遞送網(wǎng)絡(luò)接收所述多個(gè)內(nèi)容文件,且將所述多個(gè)內(nèi)容文件的所述音頻作為連續(xù)流呈現(xiàn)給所述解碼器,其中,所述多個(gè)內(nèi)容文件中的每一者包括所述視頻的根據(jù)幀速率編碼的且具有固定持續(xù)時(shí)間的經(jīng)編碼部分及所述音頻的根據(jù)編解碼器強(qiáng)制的幀大小編碼的且具有多個(gè)全音頻幀的經(jīng)編碼部分,所述多個(gè)全音頻幀具有所述編解碼器強(qiáng)制的幀大?。磺宜龆鄠€(gè)內(nèi)容文件中的一者或多者的所述音頻的所述經(jīng)編碼部分的持續(xù)時(shí)間大于或小于所述固定持續(xù)時(shí)間。

附圖說(shuō)明

參考以下說(shuō)明及附圖可最佳地理解本發(fā)明,所述附圖用于圖解說(shuō)明本發(fā)明的實(shí)施例。在圖式中:

圖1是圖解說(shuō)明使用常規(guī)方法的兩個(gè)音頻部分的示范性音頻波形的圖示。

圖2是圖解說(shuō)明其中可采用本發(fā)明實(shí)施例的編碼器的計(jì)算環(huán)境的一個(gè)實(shí)施例的示意性框圖。

圖3A是圖解說(shuō)明其中可采用包含多個(gè)主機(jī)(每一主機(jī)均采用圖2的編碼器)的編碼系統(tǒng)的計(jì)算環(huán)境的另一實(shí)施例的示意性框圖。

圖3B是圖解說(shuō)明根據(jù)一個(gè)實(shí)施例并行編碼細(xì)流的一個(gè)實(shí)施例的示意性框圖。

圖4是根據(jù)編解碼器強(qiáng)制的幀大小編碼媒體內(nèi)容的音頻以在具有所述媒體內(nèi)容的固定時(shí)間視頻部分的內(nèi)容文件之間分割全音頻幀的方法的一個(gè)實(shí)施例的流程圖。

圖5A到5C是產(chǎn)生具有固定時(shí)間視頻部分及具有編解碼器強(qiáng)制的幀大小的全音頻幀的內(nèi)容文件的一個(gè)實(shí)施例的流程圖。

圖6A是根據(jù)音頻分割的一個(gè)實(shí)施例的音頻部分、視頻部分及細(xì)流的圖示表示。

圖6B是圖解說(shuō)明使用音頻分割的音頻的四個(gè)部分的音頻波形一個(gè)實(shí)施例的圖示。

圖7圖解說(shuō)明根據(jù)一個(gè)實(shí)施例用于音頻分割的呈計(jì)算機(jī)系統(tǒng)的示范性形式的機(jī)器的圖示表示。

具體實(shí)施方式

本發(fā)明描述一種用于在不引入邊界假象的情況下將媒體內(nèi)容的音頻分割成單獨(dú)內(nèi)容文件的方法及設(shè)備。在一個(gè)實(shí)施例中,一種由經(jīng)編程以執(zhí)行操作的計(jì)算系統(tǒng)實(shí)施的方法包含:接收包含音頻及視頻的媒體內(nèi)容;根據(jù)幀速率編碼所述視頻;根據(jù)編解碼器強(qiáng)制的幀大小(即,固定幀大小)編碼所述音頻;及產(chǎn)生若干內(nèi)容文件,所述內(nèi)容文件中的每一者包含所述視頻的具有固定持續(xù)時(shí)間的經(jīng)編碼部分及所述音頻的具有全音頻幀的經(jīng)編碼部分,所述全音頻幀具有所述編解碼器強(qiáng)制的幀大小。在一個(gè)實(shí)施例中,并不像常規(guī)所做的那樣用零填補(bǔ)所述音頻幀中的最后一者。

本發(fā)明的實(shí)施例提供一種用以流式傳輸音頻的經(jīng)改進(jìn)方法。不同于針對(duì)媒體內(nèi)容的每一音頻部分使用新編碼會(huì)話的常規(guī)方法,本文中所描述的實(shí)施例允許在不引入邊界假象的情況下將媒體內(nèi)容分段成若干小部分。本文中所描述的實(shí)施例使用全音頻幀對(duì)所述音頻進(jìn)行分段。當(dāng)所述音頻經(jīng)分級(jí)以用于回放時(shí),將所述音頻作為單個(gè)流而非具有邊界假象的許多小段呈現(xiàn)給解碼器。在本文中所描述的實(shí)施例中,編碼器知曉編解碼器幀大小(例如,針對(duì)AAC-LC為1024個(gè)樣本或針對(duì)HE AAC為2048個(gè)樣本)及借助編解碼器的每一調(diào)用產(chǎn)生多少音頻幀。編碼器存儲(chǔ)多達(dá)可裝配到一經(jīng)編碼細(xì)流(即,內(nèi)容文件)中的音頻幀,所述經(jīng)編碼細(xì)流基于固定持續(xù)時(shí)間而具有所述視頻的一部分。并非用零填補(bǔ)最后一個(gè)音頻幀,而是編碼下一音頻部分的全幀并將其加到當(dāng)前細(xì)流。此產(chǎn)生原本將在代替地正寫入到當(dāng)前細(xì)流的后續(xù)細(xì)流中的小音頻量。接著賦予后續(xù)細(xì)流所述音頻流的時(shí)間偏移以指示間隙,使得可在回放時(shí)將所述音頻作為連續(xù)流呈現(xiàn)給解碼器。從此細(xì)流的音頻的目標(biāo)持續(xù)時(shí)間扣除此相同時(shí)間量。如果此后續(xù)細(xì)流的音頻的末端不落在幀邊界上,那么再次從后續(xù)細(xì)流借用音頻以填充最終的幀。此過(guò)程重復(fù)直到到達(dá)媒體內(nèi)容的流的末端為止??稍诮獯a及回放之前消除當(dāng)將細(xì)流的音頻部分分級(jí)時(shí)在細(xì)流的開(kāi)頭處從中借用音頻的地方插入的間隙。當(dāng)尋找到隨機(jī)細(xì)流時(shí),可在間隙的持續(xù)時(shí)間內(nèi)播放靜默音頻以便維持音頻/視頻同步。

如本文中所描述的音頻分割的實(shí)施例提供使用具有大的編解碼器強(qiáng)制的幀大小(AAC、AC3等)的音頻編解碼器編碼媒體內(nèi)容的音頻而不引入邊界假象同時(shí)仍維持視頻的相同固定持續(xù)時(shí)間的能力。

在以下說(shuō)明中,闡述了眾多細(xì)節(jié)。然而,受益于本發(fā)明的所屬領(lǐng)域的技術(shù)人員將明了,可在無(wú)這些特定細(xì)節(jié)的情況下實(shí)踐本發(fā)明的實(shí)施例。在一些實(shí)例中,以框圖形式展示眾所周知的結(jié)構(gòu)及裝置,以避免使本發(fā)明的實(shí)施例模糊。

以下詳細(xì)說(shuō)明的一些部分是依據(jù)對(duì)計(jì)算機(jī)存儲(chǔ)器內(nèi)的數(shù)據(jù)位的操作的算法及符號(hào)表示來(lái)呈現(xiàn)的。這些算法說(shuō)明及表示是數(shù)據(jù)處理領(lǐng)域的技術(shù)人員用來(lái)最有效地向所屬領(lǐng)域的其他技術(shù)人員傳達(dá)其工作的實(shí)質(zhì)的手段。算法在此處且大體地設(shè)想為能達(dá)到所期望結(jié)果的自相容步驟序列。所述步驟是需要對(duì)物理量進(jìn)行物理操縱的步驟。通常(但未必),這些量采取能夠存儲(chǔ)、傳送、組合、比較及以其它方式加以操縱的電信號(hào)、磁信號(hào)的形式。已證實(shí),主要出于常用的原因,將這些信號(hào)稱作位、值、元素、符號(hào)、字符、項(xiàng)、數(shù)字等有時(shí)比較方便。

然而,應(yīng)記住,所有這些術(shù)語(yǔ)及類似術(shù)語(yǔ)均與適當(dāng)?shù)奈锢砹肯嚓P(guān)聯(lián),且僅僅為應(yīng)用于這些物理量的方便標(biāo)記。除非具體陳述,否則從以下論述顯而易見(jiàn),應(yīng)了解在本說(shuō)明通篇中,利用例如“接收”、“編碼”、“產(chǎn)生”、“分割”、“處理”、“計(jì)算”、“運(yùn)算”、“確定”、“顯示”等術(shù)語(yǔ)的論述是指計(jì)算機(jī)系統(tǒng)或類似電子計(jì)算系統(tǒng)的行動(dòng)及過(guò)程,其操縱并將表示為計(jì)算機(jī)系統(tǒng)的寄存器及存儲(chǔ)器內(nèi)的物理(例如,電子)量的數(shù)據(jù)變換成類似地表示為計(jì)算機(jī)系統(tǒng)存儲(chǔ)器或寄存器或其它此類信息存儲(chǔ)、傳輸或顯示裝置內(nèi)的物理量的其它數(shù)據(jù)。

本發(fā)明的實(shí)施例還涉及用于執(zhí)行本文中的操作的設(shè)備。此設(shè)備可針對(duì)所需目的專門構(gòu)造,或其可包括通用計(jì)算機(jī)系統(tǒng),所述通用計(jì)算機(jī)系統(tǒng)由存儲(chǔ)于所述計(jì)算機(jī)系統(tǒng)中的計(jì)算機(jī)程序具體配置。此計(jì)算機(jī)程序可存儲(chǔ)于計(jì)算機(jī)可讀存儲(chǔ)媒體中,例如但不限于任何類型的磁盤(包含軟盤、光盤、CD-ROM及磁光盤)、只讀存儲(chǔ)器(ROM)、隨機(jī)存取存儲(chǔ)器(RAM)、EPROM、EEPROM、磁卡或光卡或適合于存儲(chǔ)電子指令的任何類型的媒體。

如本文中所使用,術(shù)語(yǔ)“經(jīng)編碼細(xì)流”是指媒體內(nèi)容的一部分的單個(gè)經(jīng)編碼表示。每一細(xì)流可為包含媒體的一部分的個(gè)別內(nèi)容文件,且可封裝為獨(dú)立媒體對(duì)象,從而允許個(gè)別地高速緩存且可獨(dú)立請(qǐng)求并可通過(guò)媒體播放器獨(dú)立播放所述細(xì)流。這些個(gè)別文件在本文中還稱作QSS文件。在一個(gè)實(shí)施例中,細(xì)流為可由非專門服務(wù)器而非專門媒體服務(wù)器服務(wù)的靜態(tài)文件。在一個(gè)實(shí)施例中,細(xì)流中的媒體內(nèi)容可具有預(yù)定回放時(shí)間長(zhǎng)度(也稱作固定持續(xù)時(shí)間)。舉例來(lái)說(shuō),所述預(yù)定時(shí)間長(zhǎng)度可在介于大約0.1秒與8.0秒之間的范圍中?;蛘?,可使用其它預(yù)定長(zhǎng)度。細(xì)流中的媒體內(nèi)容可具有相對(duì)于流中所含有的媒體內(nèi)容的開(kāi)頭的唯一時(shí)間索引。文件名可包含所述時(shí)間索引的一部分?;蛘撸筛鶕?jù)文件大小而非時(shí)間索引來(lái)劃分細(xì)流。如本文中所使用,術(shù)語(yǔ)“流”可指媒體內(nèi)容的通過(guò)相同視頻質(zhì)量簡(jiǎn)檔編碼的細(xì)流的集合,舉例來(lái)說(shuō),視頻的已以相同視頻位速率編碼的部分。流表示原始媒體內(nèi)容的副本。細(xì)流可作為單獨(dú)的文件存儲(chǔ)于內(nèi)容服務(wù)器、web服務(wù)器、高速緩沖存儲(chǔ)器服務(wù)器、代理高速緩沖存儲(chǔ)器或網(wǎng)絡(luò)上(例如存在于內(nèi)容遞送網(wǎng)絡(luò)(CDN)中)的其它裝置中的任何一者或一者以上上??蛻舳搜b置可使用HTTP向web服務(wù)器請(qǐng)求所述單獨(dú)的文件(例如,細(xì)流)。使用例如HTTP的標(biāo)準(zhǔn)協(xié)議會(huì)消除對(duì)網(wǎng)絡(luò)管理員配置防火墻以辨識(shí)并使例如實(shí)時(shí)流式傳輸協(xié)議(RTSP)的新專門協(xié)議的網(wǎng)絡(luò)業(yè)務(wù)通過(guò)的需要。另外,由于媒體播放器起始請(qǐng)求,因此僅需要(舉例來(lái)說(shuō))web服務(wù)器檢索并服務(wù)所請(qǐng)求細(xì)流而非整個(gè)流。媒體播放器也可從一個(gè)以上web服務(wù)器檢索細(xì)流。這些web服務(wù)器可不具有專門的服務(wù)器側(cè)智能來(lái)檢索所請(qǐng)求部分。在另一實(shí)施例中,將所述細(xì)流作為單獨(dú)文件存儲(chǔ)于網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)運(yùn)營(yíng)商(例如,ISP)的高速緩沖存儲(chǔ)器服務(wù)器或CDN的其它組件上。雖然本發(fā)明實(shí)施例中的一些實(shí)施例描述細(xì)流的使用,但本文中所描述的實(shí)施例并不限于在使用細(xì)流的計(jì)算系統(tǒng)中使用,而是也可在使用其它技術(shù)在因特網(wǎng)上遞送實(shí)況媒體內(nèi)容的其它系統(tǒng)中實(shí)施。舉例來(lái)說(shuō),在另一實(shí)施例中,將媒體內(nèi)容存儲(chǔ)于單個(gè)文件中,所述單個(gè)文件被劃分成可使用HTTP范圍請(qǐng)求而請(qǐng)求并高速緩存于CDN中的若干部分。

存在兩種一般類型的媒體流式傳輸,即基于推送的流式傳輸及基于拉取的流式傳輸。推送技術(shù)描述一種其中例如發(fā)行者的內(nèi)容服務(wù)器的服務(wù)器起始對(duì)給定事務(wù)的請(qǐng)求的基于因特網(wǎng)的通信的方法。相比之下,拉取技術(shù)描述一種其中對(duì)信息傳輸?shù)恼?qǐng)求由客戶端裝置起始且接著由服務(wù)器做出響應(yīng)的基于因特網(wǎng)的通信的方法。拉取技術(shù)中的一種類型的請(qǐng)求為HTTP請(qǐng)求(例如,HTTP GET請(qǐng)求)。相比之下,在基于推送的技術(shù)中,通常專門服務(wù)器使用例如RTSP的專門協(xié)議將數(shù)據(jù)推送到客戶端裝置?;蛘撸恍┗谕扑偷募夹g(shù)可使用HTTP來(lái)遞送媒體內(nèi)容。在基于拉取的技術(shù)中,可使用CDN將媒體遞送到多個(gè)客戶端裝置。

應(yīng)注意,雖然本文中所描述的各種實(shí)施例是針對(duì)基于拉取的模型,但所述實(shí)施例可在其它配置(例如基于推送的配置)中實(shí)施。在基于推送的配置中,編碼器所做的音頻分割的實(shí)施例可以類似于關(guān)于圖2所描述的基于拉取的配置的方式進(jìn)行,且經(jīng)編碼內(nèi)容文件可存儲(chǔ)于內(nèi)容服務(wù)器(例如媒體服務(wù)器)上以使用基于推送的技術(shù)將媒體內(nèi)容遞送到客戶端裝置以用于回放。還應(yīng)注意,這些實(shí)施例可用于提供不同質(zhì)量等級(jí)的媒體內(nèi)容且允許在不同質(zhì)量等級(jí)之間切換,此通常稱作自適應(yīng)流式傳輸。一個(gè)差異可為,在基于推送的模型中,媒體服務(wù)器確定哪一(些)內(nèi)容文件將發(fā)送到客戶端裝置,而在基于拉取的模型中,客戶端裝置確定將向內(nèi)容服務(wù)器請(qǐng)求哪一(些)內(nèi)容文件。

圖2是圖解說(shuō)明其中可采用本發(fā)明實(shí)施例的編碼器220的計(jì)算環(huán)境200的一個(gè)實(shí)施例的示意性框圖。計(jì)算環(huán)境200包含源205、編碼器220、內(nèi)容遞送網(wǎng)絡(luò)240的原始內(nèi)容服務(wù)器210(也稱作媒體服務(wù)器或原始服務(wù)器)及各自在客戶端裝置204上操作的媒體播放器200。內(nèi)容服務(wù)器210、編碼器220及客戶端裝置204可通過(guò)數(shù)據(jù)通信網(wǎng)絡(luò)耦合。所述數(shù)據(jù)通信網(wǎng)絡(luò)可包含因特網(wǎng)?;蛘?,內(nèi)容服務(wù)器210、編碼器220及客戶端裝置204可位于共用局域網(wǎng)絡(luò)(LAN)、個(gè)人區(qū)域網(wǎng)絡(luò)(PAN)、校園區(qū)域網(wǎng)絡(luò)(CAN)、城域網(wǎng)絡(luò)(MAN)、廣域網(wǎng)絡(luò)(WAN)、無(wú)線局域網(wǎng)絡(luò)、蜂窩式網(wǎng)絡(luò)、虛擬局域網(wǎng)絡(luò)等上??蛻舳搜b置204可為客戶端工作站、服務(wù)器、計(jì)算機(jī)、便攜式電子裝置、經(jīng)配置以在網(wǎng)絡(luò)上通信的娛樂(lè)系統(tǒng),例如機(jī)頂盒、數(shù)字接收器、數(shù)字電視或其它電子裝置。舉例來(lái)說(shuō),便攜式電子裝置可包含但不限于蜂窩式電話、便攜式游戲系統(tǒng)、便攜式計(jì)算裝置等。客戶端裝置204可經(jīng)由防火墻、路由器或其它包交換裝置接入因特網(wǎng)。

在所描繪的實(shí)施例中,源205可為發(fā)行者服務(wù)器或發(fā)行者內(nèi)容存儲(chǔ)庫(kù)。源205可為媒體內(nèi)容的創(chuàng)建者或分配者。舉例來(lái)說(shuō),如果待流式傳輸?shù)拿襟w內(nèi)容為電視節(jié)目的廣播,那么源205可為例如頻道或頻道的電視或有線電視網(wǎng)絡(luò)頻道的服務(wù)器。發(fā)行者可在因特網(wǎng)上將媒體內(nèi)容傳送到編碼器220,編碼器220可經(jīng)配置以接收并處理媒體內(nèi)容且將所述媒體內(nèi)容的內(nèi)容文件存儲(chǔ)于原始內(nèi)容服務(wù)器210中。在一個(gè)實(shí)施例中,內(nèi)容服務(wù)器210將媒體內(nèi)容遞送到客戶端裝置204,客戶端裝置204經(jīng)配置以在正在客戶端裝置204上操作的媒體播放器上播放所述內(nèi)容。內(nèi)容服務(wù)器210通過(guò)將媒體內(nèi)容流式傳輸?shù)娇蛻舳搜b置204來(lái)遞送所述媒體內(nèi)容。在另一實(shí)施例中,客戶端裝置204經(jīng)配置以同時(shí)或并發(fā)地從多個(gè)位置接收媒體內(nèi)容的不同部分,如下文更詳細(xì)地描述。

可將存儲(chǔ)于內(nèi)容服務(wù)器210處的媒體內(nèi)容復(fù)制到其它web服務(wù)器;或替代地,復(fù)制到CDN 240的代理高速緩沖存儲(chǔ)器服務(wù)器。復(fù)制可通過(guò)從內(nèi)容服務(wù)器210人為轉(zhuǎn)發(fā)或通過(guò)在內(nèi)容服務(wù)器210之外的web、高速緩沖存儲(chǔ)器或代理服務(wù)器代表客戶端裝置204請(qǐng)求內(nèi)容而發(fā)生。舉例來(lái)說(shuō),客戶端裝置204可向多個(gè)web服務(wù)器、邊緣高速緩沖存儲(chǔ)器或代理高速緩沖存儲(chǔ)器服務(wù)器中的任一者請(qǐng)求并接收內(nèi)容。在所描繪的實(shí)施例中,web服務(wù)器、代理高速緩沖存儲(chǔ)器、邊緣高速緩沖存儲(chǔ)器及內(nèi)容服務(wù)器210組織于CDN 240的一層次中以將媒體內(nèi)容遞送到客戶端裝置204。CDN為跨越因特網(wǎng)連網(wǎng)在一起的計(jì)算機(jī)系統(tǒng),其透明地協(xié)作以遞送內(nèi)容且可包含(舉例來(lái)說(shuō))一個(gè)或一個(gè)以上原始內(nèi)容服務(wù)器、web服務(wù)器、高速緩沖存儲(chǔ)器服務(wù)器、邊緣服務(wù)器等。通常,CDN配置于一層次中使得客戶端裝置向(舉例來(lái)說(shuō))邊緣高速緩沖存儲(chǔ)器請(qǐng)求數(shù)據(jù),且如果邊緣高速緩沖存儲(chǔ)器不含有所請(qǐng)求數(shù)據(jù),那么將所述請(qǐng)求發(fā)送到父高速緩沖存儲(chǔ)器等等直到原始內(nèi)容服務(wù)器。所述CDN還可包含經(jīng)互連的計(jì)算機(jī)網(wǎng)絡(luò)或節(jié)點(diǎn)以遞送媒體內(nèi)容。CDN的一些實(shí)例將為由阿卡邁技術(shù)公司(Akamai Technologies)、等級(jí)3通信公司(Level3Communications)或灰光網(wǎng)絡(luò)公司(Limelight Networks)開(kāi)發(fā)的CDN?;蛘撸墒褂闷渌愋偷腃DN。在其它實(shí)施例中,原始內(nèi)容服務(wù)器210可使用受益于本發(fā)明的所屬領(lǐng)域的技術(shù)人員將了解的其它配置將媒體內(nèi)容遞送到客戶端裝置204。

在一個(gè)實(shí)施例中,發(fā)行者將媒體內(nèi)容存儲(chǔ)于待從源205分配的原始內(nèi)容文件中。所述內(nèi)容文件可包含對(duì)應(yīng)于視頻及/或音頻(對(duì)應(yīng)于電視廣播、體育賽事、電影、音樂(lè)、演奏會(huì)等)的數(shù)據(jù)。原始內(nèi)容文件可包含未經(jīng)壓縮視頻及音頻;或替代地,未經(jīng)壓縮視頻或音頻?;蛘撸瑑?nèi)容文件可包含使用標(biāo)準(zhǔn)或?qū)S芯幋a方案的經(jīng)壓縮內(nèi)容(例如,視頻及/或音頻)。來(lái)自源205的原始內(nèi)容文件可為數(shù)字形式且可包含具有高位速率(舉例來(lái)說(shuō),大約5Mbps或更大)的媒體內(nèi)容。

在所描繪的實(shí)施例中,舉例來(lái)說(shuō),編碼器220通過(guò)接收原始內(nèi)容文件、來(lái)自實(shí)況事件廣播的直接饋送的信號(hào)、實(shí)況電視事件廣播的流等而從源205接收原始媒體內(nèi)容231。編碼器220可實(shí)施于包含一個(gè)或一個(gè)以上服務(wù)器計(jì)算機(jī)、網(wǎng)關(guān)或其它計(jì)算裝置的一個(gè)或一個(gè)以上機(jī)器上。在一個(gè)實(shí)施例中,編碼器220從發(fā)行系統(tǒng)(未圖解說(shuō)明)(例如,發(fā)行者的服務(wù)器或發(fā)行者的內(nèi)容存儲(chǔ)庫(kù))將原始媒體內(nèi)容231接收為一個(gè)或一個(gè)以上內(nèi)容文件。或者,編碼器220在原始媒體內(nèi)容231被捕獲時(shí)接收原始媒體內(nèi)容231。舉例來(lái)說(shuō),編碼器220可以流或信號(hào)的形式接收實(shí)況電視廣播的直接饋送,例如經(jīng)捕獲廣播。原始媒體內(nèi)容231可由捕獲卡捕獲、經(jīng)配置以用于電視及/或視頻捕獲,舉例來(lái)說(shuō),可從加拿大安大略省(Ontario,Canada)的Digital Rapids公司購(gòu)得的DRC-2600捕獲卡?;蛘?,能夠捕獲音頻及視頻的任何捕獲卡可與本發(fā)明一起使用。所述捕獲卡可位于與編碼相同的服務(wù)器上;或替代地,位于單獨(dú)服務(wù)器上。原始媒體內(nèi)容231可為經(jīng)捕獲廣播(例如正同時(shí)經(jīng)由空中傳輸、在電纜及/或衛(wèi)星上廣播的廣播)或經(jīng)調(diào)度以根據(jù)實(shí)況事件的時(shí)間表在特定時(shí)間點(diǎn)播放的經(jīng)預(yù)先記錄廣播。編碼器220可利用編碼方案,例如編解碼器、Windows Media Video系列編解碼器、Sorenson3視頻編解碼器、來(lái)自O(shè)n2的TrueMotion VP7編解碼器、MPEG-4視頻編解碼器、H.263視頻編解碼器、RealVideo 10編解碼器、OGG Vorbis、MP3等?;蛘?,可采用定制編碼方案。

在另一實(shí)施例中,編碼器220將原始媒體內(nèi)容231接收為固定持續(xù)時(shí)間的視頻及音頻,舉例來(lái)說(shuō),兩秒組塊(本文中稱作媒體內(nèi)容的部分)。兩秒組塊可包含原始音頻及原始視頻?;蛘?,兩秒組塊可為經(jīng)編碼音頻及原始視頻。在此些情況下,編碼器220解壓縮媒體內(nèi)容。在另一實(shí)施例中,編碼器220將原始媒體內(nèi)容221接收為多個(gè)原始細(xì)流,每一原始細(xì)流含有媒體內(nèi)容的固定時(shí)間部分(例如,多個(gè)兩秒原始細(xì)流含有原始音頻及視頻)。如本文中所使用,術(shù)語(yǔ)“原始細(xì)流”是指未經(jīng)壓縮或經(jīng)輕壓縮以實(shí)質(zhì)上減小大小而不具有顯著質(zhì)量損失的細(xì)流??奢^快地傳輸經(jīng)輕壓縮原始細(xì)流。在另一實(shí)施例中,編碼器220將原始媒體內(nèi)容231接收為流或信號(hào)并將媒體內(nèi)容分段成所述媒體內(nèi)容的固定時(shí)間部分,例如原始細(xì)流。

在所描繪的實(shí)施例中,編碼器220包含分割器222、固定幀音頻編碼器224、音頻幀緩沖器225、固定時(shí)間視頻編碼器226、視頻幀緩沖器227及音頻分割多路復(fù)用器228。分割器222將原始媒體內(nèi)容231接收為(舉例來(lái)說(shuō))連續(xù)音頻與視頻流,并將媒體內(nèi)容231分割成原始音頻233及原始視頻235。在一個(gè)實(shí)施例中,固定幀音頻編碼器224為音頻編解碼器。在一個(gè)實(shí)施例中,分割器222將連續(xù)音頻與視頻流分割成兩秒音頻與視頻組塊。編解碼器(也稱作壓縮器-解壓縮器或編碼器-解碼器)為能夠編碼及/或解碼數(shù)字?jǐn)?shù)據(jù)流或信號(hào)的裝置或計(jì)算機(jī)程序。在一個(gè)實(shí)施例中,固定幀音頻編解碼器224為由編碼器220的一個(gè)或一個(gè)以上計(jì)算裝置執(zhí)行以編碼原始音頻233的軟件?;蛘?,固定幀音頻編解碼器224可為用于編碼原始音頻233的硬件邏輯。特定來(lái)說(shuō),固定幀音頻編碼器224接收原始音頻233并根據(jù)編解碼器強(qiáng)制的幀大小編碼所述音頻,舉例來(lái)說(shuō),針對(duì)AAC-LC為1024個(gè)樣本或針對(duì)HE AAC為2048個(gè)樣本。固定幀音頻編碼器224將經(jīng)編碼音頻幀237輸出到音頻幀緩沖器225。類似地,固定時(shí)間視頻編碼器226從分割器220接收原始視頻235,但根據(jù)固定持續(xù)時(shí)間編碼視頻,舉例來(lái)說(shuō),每?jī)擅?0個(gè)幀(30幀/秒(fps))。固定時(shí)間視頻編碼器226將經(jīng)編碼視頻幀239輸出到視頻幀緩沖器227。在一個(gè)實(shí)施例中,固定時(shí)間視頻編解碼器226為由編碼器220的一個(gè)或一個(gè)以上計(jì)算裝置執(zhí)行以編碼原始視頻235的軟件?;蛘?,固定時(shí)間視頻編解碼器226可為用于編碼原始視頻235的硬件邏輯。

音頻分割多路復(fù)用器228使用經(jīng)編碼音頻幀237及經(jīng)編碼視頻幀239產(chǎn)生經(jīng)編碼媒體內(nèi)容文件232(本文中稱作QSS文件)。如上文所描述,常規(guī)編碼器產(chǎn)生具有視頻部分及音頻部分的內(nèi)容文件,每一部分為固定持續(xù)時(shí)間,其中用零填補(bǔ)最后一個(gè)音頻幀,因?yàn)樗霾糠值臉颖镜臄?shù)目不能由根據(jù)音頻編解碼器所使用的編解碼器強(qiáng)制的幀大小每幀樣本的數(shù)目整除。不同于填補(bǔ)最后一個(gè)幀的常規(guī)編碼器,音頻分割多路復(fù)用器228使用全音頻幀來(lái)產(chǎn)生具有固定時(shí)間視頻部分及具有全音頻幀的音頻部分的內(nèi)容文件,所述全音頻幀具有編解碼器強(qiáng)制的幀大小。由于音頻分割多路復(fù)用器228使用全音頻幀來(lái)填充內(nèi)容文件232,因此音頻分割多路復(fù)用器228并不像常規(guī)所做的那樣將幀的最后幾個(gè)樣本填補(bǔ)為零,而是編碼音頻的后續(xù)部分以便將全幀添加到當(dāng)前內(nèi)容文件232。

在一個(gè)實(shí)施例中,音頻分割多路復(fù)用器228追蹤表示從后續(xù)部分使用的樣本的量的樣本偏移以便確定多少幀將用于后續(xù)內(nèi)容文件。音頻分割多路復(fù)用器228還追蹤指示音頻回放中的間隙的呈現(xiàn)偏移。由于原本將作為后續(xù)內(nèi)容文件的一部分回放的樣本為當(dāng)前內(nèi)容文件的一部分,因此后續(xù)內(nèi)容文件的呈現(xiàn)偏移指示音頻回放中的間隙使得將當(dāng)前及后續(xù)內(nèi)容文件的音頻部分作為連續(xù)流呈現(xiàn)給解碼器。本質(zhì)上,在音頻的回放期間,可在解碼及回放之前消除當(dāng)將內(nèi)容文件的音頻部分分級(jí)時(shí)在內(nèi)容文件的開(kāi)頭處插入的間隙。呈現(xiàn)偏移允許將音頻作為連續(xù)流而非具有邊界假象的許多小段呈現(xiàn)給解碼器。在一個(gè)實(shí)施例中,當(dāng)尋找到視頻的隨機(jī)部分時(shí),可在間隙的持續(xù)時(shí)間內(nèi)播放靜默音頻以便維持音頻/視頻同步。

在一個(gè)實(shí)施例中,音頻分割多路復(fù)用器228通過(guò)用具有固定持續(xù)時(shí)間(例如,2秒)的第一視頻部分(例如,60個(gè)幀)及具有若干個(gè)經(jīng)緩沖全音頻幀的第一音頻部分填充第一內(nèi)容文件來(lái)產(chǎn)生所述第一內(nèi)容文件。經(jīng)緩沖音頻幀的持續(xù)時(shí)間大于固定持續(xù)時(shí)間。

在一個(gè)實(shí)施例中,音頻分割多路復(fù)用器228通過(guò)確定填充當(dāng)前內(nèi)容文件所需要的經(jīng)編碼音頻幀237的數(shù)目來(lái)產(chǎn)生內(nèi)容文件232。在一個(gè)實(shí)施例中,幀的數(shù)目為不小于填充當(dāng)前內(nèi)容文件所需要的樣本的數(shù)目除以編解碼器強(qiáng)制的幀大小(例如,樣本/幀)的最小整數(shù)。在一個(gè)實(shí)施例中,可使用將實(shí)數(shù)映射到下一最大整數(shù)的上整數(shù)函數(shù)來(lái)計(jì)算此數(shù)目,舉例來(lái)說(shuō),ceiling(x)=[x]為不小于x的最小整數(shù)。在以下方程式(1)中表示上整數(shù)函數(shù)的一個(gè)實(shí)例:

ceil((samplesPerStreamlet-offsetSamples)/samplesPerFrame) (1)

或者,可使用其它方程式。

音頻分割多路復(fù)用器228確定音頻幀緩沖器225中是否存在足夠的經(jīng)編碼音頻幀237來(lái)填充當(dāng)前內(nèi)容文件。如果存在足夠的經(jīng)緩沖的經(jīng)編碼幀,那么音頻分割多路復(fù)用器228用經(jīng)確定數(shù)目個(gè)幀來(lái)填充當(dāng)前內(nèi)容文件。如果不存在足夠的經(jīng)緩沖的經(jīng)編碼幀,那么音頻分割多路復(fù)用器228等待直到緩沖器225中存儲(chǔ)有足夠的經(jīng)編碼幀并用存儲(chǔ)于緩沖器225中的經(jīng)確定數(shù)目個(gè)經(jīng)編碼幀來(lái)填充當(dāng)前內(nèi)容文件。在一個(gè)實(shí)施例中,音頻分割多路復(fù)用器228通過(guò)以下操作來(lái)確定是否存在足夠的經(jīng)緩沖的經(jīng)編碼幀:1)將經(jīng)緩沖幀的數(shù)目乘以樣本/幀,2)如果有的話,那么將來(lái)自先前內(nèi)容文件的樣本偏移與所述乘法的積相加,及3)確定和是否大于或等于填充當(dāng)前內(nèi)容文件所需要的樣本的數(shù)目。在以下方程式(2)中表示此運(yùn)算的一個(gè)實(shí)例:

numBufferedFrames*samplesPerFrame+offsetSamples>=samplesPerStreamlet(2)

如果有的話,那么音頻分割多路復(fù)用器228確定后續(xù)內(nèi)容文件的樣本偏移。在一個(gè)實(shí)施例中,音頻分割多路復(fù)用器228通過(guò)將經(jīng)編碼幀的數(shù)目乘以編解碼器強(qiáng)制的幀大小(即,樣本/幀)減去填充當(dāng)前內(nèi)容文件所需要的樣本的數(shù)目且如果有的話那么加上來(lái)自先前內(nèi)容文件的樣本偏移來(lái)確定所述樣本偏移。在以下方程式(3)及(4)中表示此運(yùn)算的一個(gè)實(shí)例:

offestSamples=framesToSend*samplesPerFrame-samplesPerStreamlet-offsetSamples(3)

其中framesToSend=ceil((samplesPerStreamlet-offsetSamples)/samplesPerFrame)(4)

在另一實(shí)施例中,音頻分割多路復(fù)用器228通過(guò)計(jì)算填充當(dāng)前內(nèi)容文件所需要的樣本的數(shù)目(例如,96,000)來(lái)產(chǎn)生內(nèi)容文件221。音頻分割多路復(fù)用器228計(jì)算當(dāng)前內(nèi)容文件所需要的幀的數(shù)目(例如,針對(duì)兩秒部分的48K取樣速率為93個(gè)幀)并在樣本的數(shù)目除以樣本/幀為不能整除時(shí)將一幀與所述數(shù)目個(gè)幀相加(例如,總計(jì)94個(gè)幀)。實(shí)際上,此將幀的數(shù)目上舍入到下一最大整數(shù)。音頻分割多路復(fù)用器228用經(jīng)舍入數(shù)目個(gè)幀填充當(dāng)前內(nèi)容文件。

在另一實(shí)施例中,音頻分割多路復(fù)用器228通過(guò)經(jīng)由將取樣速率(例如,48K)乘以固定持續(xù)時(shí)間的持續(xù)時(shí)間(例如,2秒)計(jì)算填充當(dāng)前內(nèi)容文件所需要的樣本的數(shù)目(例如,96,000)來(lái)產(chǎn)生內(nèi)容文件221。音頻分割多路復(fù)用器228通過(guò)將樣本的數(shù)目除以編解碼器強(qiáng)制的幀大小(例如,1024樣本/幀)來(lái)計(jì)算當(dāng)前內(nèi)容文件所需要的幀的數(shù)目。如果除法的余數(shù)為零,那么音頻分割多路復(fù)用器228用所述數(shù)目個(gè)幀填充當(dāng)前內(nèi)容文件。然而,如果除法的余數(shù)大于零,那么音頻分割多路復(fù)用器228將幀的數(shù)目遞增1且用經(jīng)遞增數(shù)目個(gè)幀來(lái)填充當(dāng)前內(nèi)容文件。

在另一實(shí)施例中,音頻分割多路復(fù)用器228通過(guò)以下操作來(lái)產(chǎn)生內(nèi)容文件221:將幀的數(shù)目乘以編解碼器強(qiáng)制的幀大小以轉(zhuǎn)換回到填充當(dāng)前內(nèi)容文件所需要的樣本的數(shù)目,并通過(guò)將樣本的數(shù)目除以取樣速率計(jì)算當(dāng)前內(nèi)容文件的音頻的持續(xù)時(shí)間(例如,StreamletDuration=samplesPerStreamlet/取樣速率)。音頻分割多路復(fù)用器228通過(guò)從固定持續(xù)時(shí)間減去所述持續(xù)時(shí)間來(lái)確定后續(xù)內(nèi)容文件的呈現(xiàn)偏移。音頻分割多路復(fù)用器228通過(guò)將幀的數(shù)目乘以編解碼器強(qiáng)制的幀大小減去用于填充當(dāng)前內(nèi)容文件的樣本的數(shù)目且如果有的話那么加上來(lái)自先前內(nèi)容文件的樣本偏移(例如,方程式(3))來(lái)更新后續(xù)內(nèi)容文件的樣本偏移。

返回參考圖2,在一個(gè)實(shí)施例中,當(dāng)分割器222將原始媒體內(nèi)容231接收為原始細(xì)流時(shí),分割器222接收第一及第二原始細(xì)流并分割第一及第二原始細(xì)流的音頻及視頻。固定時(shí)間視頻編碼器226編碼第一及第二原始細(xì)流的視頻,且音頻分割多路復(fù)用器228將第一原始細(xì)流的經(jīng)編碼視頻存儲(chǔ)于第一內(nèi)容文件中并將第二原始細(xì)流的經(jīng)編碼視頻存儲(chǔ)于第二內(nèi)容文件中。固定幀音頻編碼器224將第一原始細(xì)流的音頻的編碼成第一組音頻幀并將所述第一組存儲(chǔ)于音頻幀緩沖器225中。音頻分割多路復(fù)用器228確定是否存在足夠的經(jīng)緩沖幀來(lái)填充第一內(nèi)容文件。如果否,那么固定幀音頻編碼器224將第二原始細(xì)流的音頻編碼成第二組音頻幀并將所述第二存儲(chǔ)于音頻幀緩沖器225中。當(dāng)存在足夠的經(jīng)緩沖幀(在一些情況下,當(dāng)多出一個(gè)全幀存儲(chǔ)于緩沖器225中時(shí))來(lái)填充第一內(nèi)容文件時(shí),音頻分割多路復(fù)用器228將經(jīng)緩沖音頻幀存儲(chǔ)到第一內(nèi)容文件中。編碼器220繼續(xù)此過(guò)程直到媒體內(nèi)容結(jié)束為止。

此外,由于音頻分割多路復(fù)用器228使用全音頻幀,因此一個(gè)內(nèi)容文件232中的音頻幀未必與視頻部分邊界對(duì)準(zhǔn),如圖6A及6B中所圖解說(shuō)明。舉例來(lái)說(shuō),內(nèi)容文件232的音頻部分的持續(xù)時(shí)間可為2.0053秒,而內(nèi)容文件232的視頻部分的固定持續(xù)時(shí)間可為2.00秒。在此實(shí)例中,編解碼器強(qiáng)制的幀大小為1024樣本/幀,且音頻的取樣速率為48K,且存儲(chǔ)于內(nèi)容文件232中的音頻部分中存儲(chǔ)有94個(gè)幀的96256個(gè)樣本。由于內(nèi)容文件232中存在額外的53毫秒(ms),因此音頻分割多路復(fù)用器228賦予下一內(nèi)容文件53ms的呈現(xiàn)偏移,因?yàn)楫?dāng)前內(nèi)容文件232使用具有在使用固定持續(xù)時(shí)間音頻編碼方案時(shí)原本將在下一內(nèi)容文件中的53ms的持續(xù)時(shí)間的樣本。音頻分割多路復(fù)用器228還追蹤樣本偏移以確定填充下一內(nèi)容文件需要多少音頻幀。在一個(gè)實(shí)施例中,音頻分割多路復(fù)用器228用具有固定持續(xù)時(shí)間(例如,在幀速率為30幀/秒時(shí)針對(duì)60個(gè)視頻幀為2秒)的一個(gè)經(jīng)編碼視頻部分填充內(nèi)容文件中的每一者。音頻分割多路復(fù)用器228用若干個(gè)經(jīng)緩沖音頻幀填充內(nèi)容文件中的一些內(nèi)容文件,所述經(jīng)緩沖音頻幀的持續(xù)時(shí)間可大于固定持續(xù)時(shí)間、小于固定持續(xù)時(shí)間或等于固定持續(xù)時(shí)間,此取決于按音頻分割多路復(fù)用器228的確定音頻幀是否與視頻部分邊界對(duì)準(zhǔn)。

參考圖6A,在一個(gè)實(shí)施例中,音頻分割多路復(fù)用器228通過(guò)以下操作產(chǎn)生第一細(xì)流(即內(nèi)容文件)601:用具有大約60個(gè)視頻幀的第一視頻部分611(其持續(xù)時(shí)間等于兩秒的固定持續(xù)時(shí)間)且用具有94個(gè)音頻幀(每一音頻幀具有1024樣本/幀,總計(jì)96,256個(gè)樣本)的第一音頻部分621填充第一細(xì)流601。第一音頻部分621的持續(xù)時(shí)間為大約2.0053秒。音頻分割多路復(fù)用器228確定第一細(xì)流603的第一音頻部分631的呈現(xiàn)偏移為零,因?yàn)榈谝患?xì)流601的音頻邊界652與視頻邊界654經(jīng)對(duì)準(zhǔn)以用于回放。

音頻分割多路復(fù)用器228通過(guò)用第二視頻部分612(60個(gè)幀及兩秒)且用具有94個(gè)音頻幀的第二音頻部分622填充第二細(xì)流602來(lái)產(chǎn)生第二細(xì)流602。第二音頻部分622的持續(xù)時(shí)間為大約2.0053秒。音頻分割多路復(fù)用器228確定第二細(xì)流602的第二音頻部分632的呈現(xiàn)偏移為大約5.3毫秒(ms),因?yàn)榈谝患?xì)流601的第一音頻部分621的持續(xù)時(shí)間為大約2.0053秒。呈現(xiàn)偏移指示音頻中的在第一細(xì)流601與第二細(xì)流602之間的間隙。如圖6B中所展示,第二細(xì)流602的音頻邊界652與視頻邊界654未經(jīng)對(duì)準(zhǔn)以用于回放??墒褂贸尸F(xiàn)偏移以允許將第一細(xì)流601及第二細(xì)流602的音頻部分分級(jí)以用于作為連續(xù)流呈現(xiàn)給解碼器。

音頻分割多路復(fù)用器228通過(guò)用第三視頻部分613(60個(gè)幀及兩秒)且用具有94個(gè)音頻幀的第三音頻部分623填充第三細(xì)流603來(lái)產(chǎn)生第三細(xì)流603。第三音頻部分623的持續(xù)時(shí)間為大約2.0053秒。音頻分割多路復(fù)用器228確定第三細(xì)流603的第三音頻部分633的呈現(xiàn)偏移為大約10.66ms,因?yàn)榈诙?xì)流602的第二音頻部分622的持續(xù)時(shí)間為大約2.0053秒。呈現(xiàn)偏移指示音頻中的在第二細(xì)流602與第三細(xì)流603之間的間隙。如圖6B中所展示,第三細(xì)流603的音頻邊界652與視頻邊界654未經(jīng)對(duì)準(zhǔn)以用于回放??墒褂贸尸F(xiàn)偏移以允許將第二細(xì)流602及第三細(xì)流603的音頻部分分級(jí)以用于作為連續(xù)流呈現(xiàn)給解碼器。

音頻分割多路復(fù)用器228通過(guò)用第四視頻部分614(60個(gè)幀及兩秒)且用具有94個(gè)音頻幀的第四音頻部分624填充第四細(xì)流604來(lái)產(chǎn)生第四細(xì)流604。第四音頻部分624的持續(xù)時(shí)間為大約1.984秒。音頻分割多路復(fù)用器228確定第四細(xì)流604的第四音頻部分634的呈現(xiàn)偏移為大約16ms,因?yàn)榈谌?xì)流603的第三音頻部分623的持續(xù)時(shí)間為大約2.0053秒。呈現(xiàn)偏移指示音頻中的在第三細(xì)流603與第四細(xì)流604之間的間隙。如圖6B中所展示,第四細(xì)流603的音頻邊界652與視頻邊界654未經(jīng)對(duì)準(zhǔn)以用于回放??墒褂贸尸F(xiàn)偏移以允許將第三細(xì)流603及第四細(xì)流604的音頻部分分級(jí)以用于作為連續(xù)流呈現(xiàn)給解碼器。然而,在第四細(xì)流604之后,音頻邊界652與視頻邊界654經(jīng)對(duì)準(zhǔn),此意味著第五細(xì)流(未圖解說(shuō)明)將具有零呈現(xiàn)偏移。應(yīng)注意,圖6A及6B的實(shí)施例假定取樣速率為48kHz,固定持續(xù)時(shí)間為兩秒,且編解碼器強(qiáng)制的幀大小為1024樣本/幀。

在上文所描述的實(shí)施例中,前三個(gè)細(xì)流601到603的音頻部分具有94個(gè)音頻幀,且第四細(xì)流604的音頻部分具有93個(gè)音頻幀。在此實(shí)施例中,當(dāng)以30幀/秒編碼視頻時(shí),四個(gè)內(nèi)容文件601到604的視頻部分中的每一者具有大約60個(gè)視頻幀。此模式重復(fù)直到已到達(dá)媒體內(nèi)容的末端為止。應(yīng)注意,在此實(shí)施例中,在每四個(gè)內(nèi)容文件之后,呈現(xiàn)偏移及樣本偏移為零,此意味著音頻邊界652與視頻邊界654在每四個(gè)內(nèi)容文件之后對(duì)準(zhǔn)。

如在圖6B中可見(jiàn),在八秒的媒體內(nèi)容之后,視頻邊界與音頻邊界對(duì)準(zhǔn)。如此,用以減小邊界假象頻率并對(duì)準(zhǔn)AAC幀大小的另一方法將為使用八秒作為固定持續(xù)時(shí)間。然而,此方法具有以下缺點(diǎn):1)此方法需要大的視頻組塊大小,例如8秒、16秒或32秒。2)此方法將實(shí)施方案約束為特定幀大小,即,1024樣本/幀。假如幀大小將改變,例如改變到(舉例來(lái)說(shuō))2048,則此方法將必須切換到具有不同幀大小的音頻編解碼器且還將必須改變視頻的組塊持續(xù)時(shí)間。3)此方法需要音頻取樣速率始終為48kHz。其它常見(jiàn)取樣速率(例如44.1kHz)將需要不同的且可能大得多的組塊大小?;蛘?,源音頻將必須增加取樣到48kHz。然而,增加取樣可能引入假象且可降低音頻編解碼器的效率。然而,本文中所描述的實(shí)施例具有使用具有大的幀大小(AAC、AC3等)的音頻編解碼器進(jìn)行編碼而不引入組塊邊界假象同時(shí)仍維持相同組塊持續(xù)時(shí)間的能力。

或者,可使用其它取樣速率(例如,44.1kHz)、固定持續(xù)時(shí)間(例如,0.1秒到5.0秒)、視頻幀速率(例如,24fps、30fps等)及/或編解碼器強(qiáng)制的幀大小(例如,2048)。不同源視頻使用不同幀速率。美國(guó)的大多數(shù)空中傳輸信號(hào)為30幀/秒(實(shí)際上為29.97)。一些HD信號(hào)為60幀/秒(59.94)?;谖募膬?nèi)容中的一些內(nèi)容為24幀/秒。在一個(gè)實(shí)施例中,編碼器220不增加視頻的幀速率,因?yàn)樵黾右曨l的幀速率將需要編碼器220產(chǎn)生額外幀。然而,產(chǎn)生額外幀并不因?yàn)榇祟~外負(fù)擔(dān)而提供許多益處。因此,舉例來(lái)說(shuō),如果原始媒體內(nèi)容具有24fps的幀速率,那么編碼器220使用24fps的幀速率而非增加取樣到30fps。然而,在一些實(shí)施例中,編碼器220可減少取樣幀速率。舉例來(lái)說(shuō),如果原始媒體內(nèi)容具有60fps的幀速率,那么編碼器220可減少取樣到30fps。此可完成是因?yàn)槭褂?0fps使需要以目標(biāo)位速率進(jìn)行編碼的數(shù)據(jù)量加倍,此可使質(zhì)量受損。在一個(gè)實(shí)施例中,一旦編碼器220確定將接收的幀速率或在減少取樣(通常為30fps或24fps)之后,編碼器220便針對(duì)大部分質(zhì)量簡(jiǎn)檔使用此幀速率。質(zhì)量簡(jiǎn)檔中的一些質(zhì)量簡(jiǎn)檔(例如最低質(zhì)量簡(jiǎn)檔)可使用較低幀速率。然而,在其它實(shí)施例中,編碼器220可針對(duì)不同質(zhì)量簡(jiǎn)檔使用不同幀速率,以便將移動(dòng)電話及具有有限資源(例如較低計(jì)算能力)的其它裝置作為目標(biāo)。在這些情況下,具有幀速率較低的較多簡(jiǎn)檔可為有利的。

應(yīng)注意,當(dāng)使用這些參數(shù)的其它值時(shí),音頻邊界652及視頻邊界654可不同于圖6B的所圖解說(shuō)明實(shí)施例。舉例來(lái)說(shuō),當(dāng)使用44.1kHz取樣速率、1024編解碼器強(qiáng)制的幀大小及兩秒固定持續(xù)時(shí)間時(shí),第一內(nèi)容文件的音頻部分將具有87個(gè)音頻幀,且第二到第七內(nèi)容文件將具有86個(gè)音頻幀。此模式自身重復(fù)直到媒體內(nèi)容中不剩余足夠的視頻為止。應(yīng)注意,在此實(shí)施例中,在每128個(gè)內(nèi)容文件之后,呈現(xiàn)偏移及樣本偏移為零,此意味著音頻邊界652與視頻邊界654在每128個(gè)內(nèi)容文件之后對(duì)準(zhǔn),如簡(jiǎn)縮表1-1中所圖解說(shuō)明。

表1-1

應(yīng)注意,為便于圖解說(shuō)明,上表中的樣本偏移是以樣本而非秒或毫秒為單位進(jìn)行圖解說(shuō)明的。為了將樣本偏移轉(zhuǎn)換為呈現(xiàn)偏移,可將樣本偏移除以44,100以得到以秒為單位的呈現(xiàn)偏移并乘以1,000以得到以毫秒為單位的呈現(xiàn)偏移。在一個(gè)實(shí)施例中,可將以毫秒為單位的呈現(xiàn)偏移存儲(chǔ)于細(xì)流標(biāo)頭中。或者,可將以其它單位的呈現(xiàn)偏移或樣本偏移存儲(chǔ)于細(xì)流標(biāo)頭中。

在另一實(shí)施例中,音頻分割多路復(fù)用器228通過(guò)用具有固定持續(xù)時(shí)間的經(jīng)編碼視頻幀239(例如,固定持續(xù)時(shí)間部分)填充內(nèi)容文件232中的每一者來(lái)產(chǎn)生經(jīng)編碼內(nèi)容文件232,且用若干個(gè)全音頻幀237填充內(nèi)容文件232,其中音頻幀237的持續(xù)時(shí)間小于或大于固定持續(xù)時(shí)間以適應(yīng)正在內(nèi)容文件232中使用的全音頻幀。舉例來(lái)說(shuō),可用具有固定持續(xù)時(shí)間(例如兩秒)的視頻部分且用具有多個(gè)全音頻幀(具有大于固定持續(xù)時(shí)間的持續(xù)時(shí)間)的音頻部分填充第一內(nèi)容文件。最終,樣本偏移將足夠大使得可使用較少音頻幀,在此情況下,音頻幀的持續(xù)時(shí)間可小于固定持續(xù)時(shí)間。有時(shí),音頻的音頻邊界可匹配視頻的視頻邊界。

在另一實(shí)施例中,音頻分割多路復(fù)用器228通過(guò)產(chǎn)生具有第一視頻部分的視頻幀及來(lái)自音頻的第一部分的音頻幀以及來(lái)自第二部分的音頻幀的第一內(nèi)容文件來(lái)產(chǎn)生經(jīng)編碼內(nèi)容文件232。音頻分割多路復(fù)用器228產(chǎn)生具有視頻的第二部分的視頻幀的第二內(nèi)容文件。針對(duì)音頻,音頻分割多路復(fù)用器228確定音頻邊界是否落在視頻邊界上。如果音頻邊界落在視頻邊界上,那么音頻分割多路復(fù)用器228用第二部分的剩余音頻幀填充第二內(nèi)容文件。然而,如果音頻邊界不落在視頻邊界上,那么音頻分割多路復(fù)用器228編碼媒體內(nèi)容的第三部分的音頻幀并用第二部分的剩余音頻幀及來(lái)自第三部分的音頻幀填充第二內(nèi)容文件。此過(guò)程重復(fù)直到到達(dá)媒體內(nèi)容的末端為止。

返回參考圖2,一旦編碼器220編碼原始媒體內(nèi)容231,編碼器220便將經(jīng)編碼媒體內(nèi)容文件232發(fā)送到原始內(nèi)容服務(wù)器210,原始內(nèi)容服務(wù)器210在網(wǎng)絡(luò)連接241上將經(jīng)編碼媒體內(nèi)容232遞送到媒體播放器200。當(dāng)媒體播放器200接收到具有固定持續(xù)時(shí)間的視頻及可變持續(xù)時(shí)間的音頻的內(nèi)容文件時(shí),媒體播放器200使用內(nèi)容文件的呈現(xiàn)偏移將音頻分級(jí)以作為連續(xù)流呈現(xiàn)給解碼器,從而消除或減少由邊界假象呈現(xiàn)的噼噗或咔嗒噪聲。本質(zhì)上,在音頻的回放期間,媒體播放器200在解碼及回放之前移除當(dāng)將內(nèi)容文件的音頻部分分級(jí)時(shí)在內(nèi)容文件的開(kāi)頭處插入的間隙。在另一實(shí)施例中,如果未執(zhí)行如本文中所描述的音頻分割且用零填補(bǔ)最后一個(gè)幀,那么媒體播放器200可經(jīng)配置以在將音頻發(fā)送到解碼器之前移除最后一個(gè)幀的經(jīng)填補(bǔ)樣本。然而,此方法在某些情形中可能并不實(shí)際,舉例來(lái)說(shuō),當(dāng)媒體播放器由第三方提供時(shí)或當(dāng)在解碼之后對(duì)音頻幀的數(shù)據(jù)的接入受限制時(shí)。

應(yīng)注意,雖然已針對(duì)每一媒體播放器200圖解說(shuō)明了一條線,但每一線241可表示到CDN 240的多個(gè)網(wǎng)絡(luò)連接。在一個(gè)實(shí)施例中,每一媒體播放器200可建立到CDN 240的多個(gè)輸送控制協(xié)議(TCP)連接。在另一實(shí)施例中,媒體內(nèi)容存儲(chǔ)于多個(gè)CDN中,舉例來(lái)說(shuō),存儲(chǔ)于與多個(gè)CDN中的每一者相關(guān)聯(lián)的原始服務(wù)器中。CDN 240可用于通過(guò)降低帶寬成本并增加內(nèi)容的全局可用性而改進(jìn)性能、可縮放性及最終用戶(例如,觀看者)的成本效率的目的??梢愿鞣N方式實(shí)施CDN,且所屬領(lǐng)域的技術(shù)人員將了解關(guān)于其操作的細(xì)節(jié)。如此,尚未包含關(guān)于其操作的額外細(xì)節(jié)。在其它實(shí)施例中,可使用其它遞送技術(shù)將媒體內(nèi)容從原始服務(wù)器遞送到媒體播放器,例如同級(jí)網(wǎng)絡(luò)等。

在上文所描述的實(shí)施例中,內(nèi)容文件232表示原始媒體內(nèi)容流231的一個(gè)副本。然而,在其它實(shí)施例中,可將原始媒體內(nèi)容231的每一部分編碼成同一內(nèi)容部分的多個(gè)經(jīng)編碼表示。多個(gè)經(jīng)編碼表示可根據(jù)不同質(zhì)量簡(jiǎn)檔進(jìn)行編碼且存儲(chǔ)為可由客戶端裝置204獨(dú)立請(qǐng)求并獨(dú)立播放的單獨(dú)文件。所述文件中的每一者可存儲(chǔ)于一個(gè)或一個(gè)以上內(nèi)容服務(wù)器210中、CDN 240的web服務(wù)器、代理高速緩沖存儲(chǔ)器、邊緣高速緩沖存儲(chǔ)器上,且可單獨(dú)地請(qǐng)求并遞送到客戶端裝置204。在一個(gè)實(shí)施例中,編碼器220同時(shí)以數(shù)個(gè)不同質(zhì)量等級(jí)(舉例來(lái)說(shuō),10個(gè)或13個(gè)此種等級(jí))編碼原始內(nèi)容媒體231。每一質(zhì)量等級(jí)稱作質(zhì)量簡(jiǎn)檔或簡(jiǎn)檔。舉例來(lái)說(shuō),如果媒體內(nèi)容具有一小時(shí)的持續(xù)時(shí)間且媒體內(nèi)容被分段成具有兩秒持續(xù)時(shí)間的QSS文件,那么媒體內(nèi)容的每一經(jīng)編碼表示存在1800個(gè)QSS文件。如果根據(jù)10個(gè)不同質(zhì)量簡(jiǎn)檔編碼媒體內(nèi)容,那么媒體內(nèi)容存在18,000個(gè)QSS文件。質(zhì)量簡(jiǎn)檔可指示將如何編碼流,舉例來(lái)說(shuō),質(zhì)量簡(jiǎn)檔可規(guī)定若干參數(shù),例如圖像的寬度及高度(即,圖像大小)、視頻位速率(即,編碼視頻的速率)、音頻位速率、音頻取樣速率(即,在捕獲時(shí)對(duì)音頻進(jìn)行取樣的速率)、音軌的數(shù)目(例如,單聲道、立體聲等)、幀速率(例如,幀/秒)、分級(jí)大小等。舉例來(lái)說(shuō),媒體播放器200可個(gè)別地請(qǐng)求不同質(zhì)量等級(jí)的相同媒體內(nèi)容232;舉例來(lái)說(shuō),每一媒體播放器200可請(qǐng)求媒體內(nèi)容232的相同(例如,相同時(shí)間索引)的但處于不同質(zhì)量等級(jí)的部分。舉例來(lái)說(shuō),一個(gè)媒體播放器可請(qǐng)求具有HD質(zhì)量視頻的細(xì)流,因?yàn)檎?qǐng)求媒體播放器的計(jì)算裝置具有充足計(jì)算能力及充足網(wǎng)絡(luò)帶寬,而另一媒體播放器可請(qǐng)求具有較低質(zhì)量的細(xì)流,因?yàn)?舉例來(lái)說(shuō))其計(jì)算裝置可能不具有充足網(wǎng)絡(luò)帶寬。在一個(gè)實(shí)施例中,媒體播放器200通過(guò)請(qǐng)求來(lái)自媒體內(nèi)容的不同副本(例如,不同質(zhì)量流)的部分而在部分邊界處在質(zhì)量等級(jí)之間變換,如2005年4月28日提出申請(qǐng)的第2005/0262257號(hào)美國(guó)專利申請(qǐng)公開(kāi)案中所描述?;蛘?,媒體播放器200可使用受益于本發(fā)明的所屬領(lǐng)域的技術(shù)人員將了解的其它技術(shù)請(qǐng)求所述部分。

舉例來(lái)說(shuō),使用QMX文件,編碼器220還可規(guī)定哪些質(zhì)量簡(jiǎn)檔可用于媒體內(nèi)容的特定部分,且可規(guī)定媒體內(nèi)容中有多少可用于遞送。QMX文件指示由可用QSS文件表示的媒體內(nèi)容的當(dāng)前持續(xù)時(shí)間。QMX文件可作為媒體內(nèi)容的內(nèi)容表操作,從而指示哪些QSS文件可用于遞送及可從何處檢索所述QSS文件。舉例來(lái)說(shuō),可經(jīng)由CDN 240將QMX文件發(fā)送到媒體播放器200。或者,媒體播放器200可請(qǐng)求特定媒體內(nèi)容的可用質(zhì)量簡(jiǎn)檔。在其它實(shí)施例中,可使用CDN的縮放能力來(lái)縮放此配置以將HTTP業(yè)務(wù)遞送到多個(gè)媒體播放器200。舉例來(lái)說(shuō),存儲(chǔ)經(jīng)編碼媒體內(nèi)容的數(shù)據(jù)中心可具有原始內(nèi)容服務(wù)器210的群集以服務(wù)向數(shù)據(jù)中心請(qǐng)求經(jīng)編碼媒體內(nèi)容的多個(gè)媒體播放器?;蛘?,可使用受益于本發(fā)明的所屬領(lǐng)域的技術(shù)人員將了解的其它配置。

在一個(gè)所預(yù)期實(shí)施例中,媒體播放器200通過(guò)請(qǐng)求個(gè)別細(xì)流文件(例如,QSS文件)來(lái)請(qǐng)求媒體內(nèi)容的部分。媒體播放器200根據(jù)元數(shù)據(jù)描述符文件(例如,QMX文件)請(qǐng)求QSS文件。媒體播放器200(舉例來(lái)說(shuō))響應(yīng)于用戶選擇用于呈現(xiàn)的媒體內(nèi)容而提取QMX文件,且媒體播放器200讀取所述QMX文件以確定何時(shí)開(kāi)始回放使用當(dāng)前持續(xù)時(shí)間的媒體內(nèi)容及在何處請(qǐng)求QSS文件。QMX文件包含指示編碼過(guò)程何時(shí)開(kāi)始(例如,媒體內(nèi)容的開(kāi)始時(shí)間)的QMX時(shí)間戳(例如UTC(協(xié)調(diào)世界時(shí))指示符)以及指示媒體內(nèi)容中有多少可用于遞送的當(dāng)前持續(xù)時(shí)間。舉例來(lái)說(shuō),QMX時(shí)間戳可指示編碼過(guò)程在6:00pm(MDT)開(kāi)始,且媒體內(nèi)容的4,500個(gè)QSS文件可用于遞送。媒體播放器200可確定內(nèi)容持續(xù)時(shí)間(實(shí)況播出)為大約15分鐘,且決定在進(jìn)入節(jié)目15分鐘時(shí)或在所述點(diǎn)稍前開(kāi)始請(qǐng)求對(duì)應(yīng)于節(jié)目的回放的QSS文件。在一個(gè)實(shí)施例中,媒體播放器200可通過(guò)將所述偏移處的對(duì)應(yīng)細(xì)流提取到媒體內(nèi)容中來(lái)確定媒體內(nèi)容中的媒體播放器200應(yīng)開(kāi)始播放所述內(nèi)容的點(diǎn)。每當(dāng)編碼器將另一組QSS文件存儲(chǔ)于內(nèi)容服務(wù)器上(例如,表示處于10個(gè)不同質(zhì)量簡(jiǎn)檔的下兩秒的媒體內(nèi)容的10個(gè)QSS文件的組)時(shí),就更新QMX文件,且可由媒體播放器200提取QMX文件以指示又兩秒可用于在因特網(wǎng)上遞送。媒體播放器200可周期性地檢查以找出經(jīng)更新的QMX文件?;蛘撸蓪MX文件及任何更新推送到媒體播放器200以指示媒體內(nèi)容何時(shí)可用于在因特網(wǎng)上遞送。

應(yīng)注意,雖然已將原始內(nèi)容服務(wù)器210圖解說(shuō)明為是在CDN 240內(nèi),但原始內(nèi)容服務(wù)器210可駐存于CDN 240外部且仍與CDN 240相關(guān)聯(lián)。舉例來(lái)說(shuō),一個(gè)實(shí)體可擁有并操作存儲(chǔ)細(xì)流的內(nèi)容服務(wù)器,但其裝置可由一個(gè)或一個(gè)以上單獨(dú)實(shí)體擁有并操作的CDN 240遞送所述細(xì)流。

應(yīng)注意,媒體內(nèi)容為在由媒體播放器200(在電子裝置(即,客戶端裝置)上操作)處理時(shí)允許媒體播放器200將事件的視覺(jué)及/或音頻表示呈現(xiàn)給媒體播放器200的觀看者的數(shù)據(jù)。媒體播放器200可為播放媒體內(nèi)容(例如,顯示視頻并播放音頻)的一件軟件,且可為獨(dú)立的軟件應(yīng)用程序、web瀏覽器插件、web瀏覽器插件與支持網(wǎng)頁(yè)邏輯的組合等。舉例來(lái)說(shuō),所述事件可為例如體育賽事、實(shí)況或經(jīng)記錄表演、實(shí)況或經(jīng)記錄新聞報(bào)道等的電視廣播。在此上下文中,實(shí)況事件或經(jīng)調(diào)度電視事件是指經(jīng)調(diào)度以按時(shí)間表的規(guī)定在特定時(shí)間點(diǎn)回放的媒體內(nèi)容。實(shí)況事件還可具有與實(shí)況媒體內(nèi)容混在一起的在實(shí)況電視廣播中間播放的經(jīng)預(yù)先記錄內(nèi)容,例如實(shí)況事件內(nèi)的重要事件的慢鏡頭剪輯(例如,重放)。應(yīng)注意,本文中所描述的實(shí)施例也可用于流式傳輸視頻點(diǎn)播(VOD)。

圖3A是圖解說(shuō)明其中可采用包含多個(gè)主機(jī)314(每一主機(jī)均采用編碼器220)的編碼系統(tǒng)320的計(jì)算環(huán)境300的另一實(shí)施例的示意性框圖。在一個(gè)實(shí)施例中,編碼系統(tǒng)320包含主控模塊322及多個(gè)主機(jī)計(jì)算模塊(下文中稱“主機(jī)”)314。主機(jī)314中的每一者均采用如上文關(guān)于圖2所描述的編碼器220。主機(jī)314可實(shí)施于一個(gè)或一個(gè)以上個(gè)人計(jì)算機(jī)、服務(wù)器等上。在另一實(shí)施例中,主機(jī)314可為專用硬件,舉例來(lái)說(shuō),插入到單個(gè)計(jì)算機(jī)中的若干卡。

在一個(gè)實(shí)施例中,主控模塊(下文中稱“主控器”)322經(jīng)配置以從細(xì)流產(chǎn)生系統(tǒng)301接收原始細(xì)流312,細(xì)流產(chǎn)生系統(tǒng)301包含從發(fā)行者310接收媒體內(nèi)容的接收模塊302及將媒體內(nèi)容分段成原始細(xì)流312的細(xì)流模塊303。主控模塊322將原始細(xì)流312分級(jí)以用于處理。在另一實(shí)施例中,主控器322可接收經(jīng)編碼及/或經(jīng)壓縮的源細(xì)流,且主控器322解壓縮每一源細(xì)流以產(chǎn)生原始細(xì)流。如本文中所使用,術(shù)語(yǔ)“原始細(xì)流”是指未經(jīng)壓縮或經(jīng)輕壓縮以實(shí)質(zhì)上減小大小而不具有顯著質(zhì)量損失的細(xì)流312??奢^快地傳輸經(jīng)輕壓縮原始細(xì)流且將其傳輸?shù)捷^多主機(jī)。每一主機(jī)314與主控器322耦合且經(jīng)配置以從主控器322接收原始細(xì)流以用于編碼。在一個(gè)實(shí)例中,主機(jī)314產(chǎn)生具有等同時(shí)間索引及固定持續(xù)時(shí)間以及變化的位速率的多個(gè)細(xì)流。在一個(gè)實(shí)施例中,每一主機(jī)314經(jīng)配置以根據(jù)從主控器322發(fā)送的原始細(xì)流312產(chǎn)生一組306經(jīng)編碼細(xì)流,其中組306的經(jīng)編碼細(xì)流表示媒體內(nèi)容的處于受支持位速率中的每一者的相同部分(即,每一細(xì)流是根據(jù)可用質(zhì)量簡(jiǎn)檔中的每一者進(jìn)行編碼的)?;蛘?,每一主機(jī)314可專用于產(chǎn)生處于受支持位速率中的一者的單個(gè)經(jīng)編碼細(xì)流以便減少編碼所需的時(shí)間。

在編碼完成之后,主機(jī)314即刻將組306傳回到主控器322使得編碼系統(tǒng)320可將組306存儲(chǔ)于細(xì)流數(shù)據(jù)庫(kù)308中。主控器322進(jìn)一步經(jīng)配置以給主機(jī)314指派編碼工作。在一個(gè)實(shí)施例中,每一主機(jī)314經(jīng)配置以將編碼工作完成投標(biāo)(下文中稱“投標(biāo)”)提交給主控器322。主控器322依據(jù)來(lái)自主機(jī)314的投標(biāo)而指派編碼工作。每一主機(jī)314依據(jù)可包含但不限于當(dāng)前編碼工作完成百分比、平均工作完成時(shí)間、處理器速度、物理存儲(chǔ)器容量等的多個(gè)計(jì)算變量而產(chǎn)生投標(biāo)。

舉例來(lái)說(shuō),主機(jī)314可提交基于過(guò)去的性能歷史而指示主機(jī)314將能夠在15秒內(nèi)完成編碼工作的投標(biāo)。主控器322經(jīng)配置以從多個(gè)投標(biāo)當(dāng)中選擇最佳投標(biāo)且隨后將編碼工作提交給具有最佳投標(biāo)的主機(jī)314。如此,所描述的編碼系統(tǒng)320并不要求每一主機(jī)314具有等同硬件,而是有益地利用主機(jī)314的可用計(jì)算能力?;蛘?,主控器322基于先到先服務(wù)的基礎(chǔ)或認(rèn)為適合于特定編碼工作的某一其它算法而選擇主機(jī)314。

編碼一個(gè)細(xì)流所需的時(shí)間取決于主機(jī)314的計(jì)算能力及原始媒體內(nèi)容的內(nèi)容文件的編碼要求。編碼要求的實(shí)例可包含但不限于兩遍或多遍編碼及不同位速率的多個(gè)流。本發(fā)明的一個(gè)益處為對(duì)實(shí)況內(nèi)容文件執(zhí)行兩遍編碼的能力。通常,為了執(zhí)行兩遍編碼,現(xiàn)有技術(shù)系統(tǒng)必須等待完成內(nèi)容文件后才編碼。然而,可多達(dá)認(rèn)為是必需的次數(shù)地編碼細(xì)流。由于細(xì)流為小持續(xù)時(shí)間(例如,2秒)的經(jīng)封裝媒體對(duì)象,因此一旦捕獲第一細(xì)流便可對(duì)實(shí)況事件開(kāi)始多遍編碼。

舉例來(lái)說(shuō),在一個(gè)實(shí)施例中,編碼器220將原始內(nèi)容文件分段成若干源細(xì)流并對(duì)每一對(duì)應(yīng)原始細(xì)流312執(zhí)行多個(gè)副本(例如,流)的兩遍編碼而無(wú)需等待TV秀結(jié)束。如此,web服務(wù)器316能夠在細(xì)流產(chǎn)生系統(tǒng)301開(kāi)始捕獲原始內(nèi)容文件之后不久在因特網(wǎng)上流式傳輸細(xì)流。從發(fā)行者310傳輸?shù)膶?shí)況廣播與內(nèi)容的可用性之間的延遲取決于主機(jī)314的計(jì)算能力。

圖3B是圖解說(shuō)明根據(jù)一個(gè)實(shí)施例并行編碼細(xì)流312的一個(gè)實(shí)施例的示意性框圖。在一個(gè)實(shí)例中,細(xì)流產(chǎn)生系統(tǒng)301開(kāi)始捕獲原始內(nèi)容文件、產(chǎn)生第一細(xì)流312a并將所述細(xì)流傳遞到編碼系統(tǒng)320。編碼系統(tǒng)320可花費(fèi)(舉例來(lái)說(shuō))10秒來(lái)產(chǎn)生第一組306a細(xì)流304a(304a1、304a2、304a3等表示不同位速率的細(xì)流304)。圖3B將編碼過(guò)程類屬地圖解說(shuō)明為框308以用圖表圖解說(shuō)明如上文參考編碼系統(tǒng)320所描述處理原始或經(jīng)輕編碼細(xì)流312所需的持續(xù)時(shí)間。編碼系統(tǒng)320可同時(shí)處理一個(gè)以上細(xì)流312,且細(xì)流的處理將在細(xì)流從細(xì)流產(chǎn)生模塊301抵達(dá)之后即刻開(kāi)始。

在編碼第一細(xì)流312a所需的10秒期間,細(xì)流模塊404已產(chǎn)生五個(gè)額外2秒細(xì)流312b、312c、312d、312e、312f以用于編碼,且主控器322已準(zhǔn)備并將對(duì)應(yīng)原始細(xì)流分級(jí)。在第一組306a可用之后兩秒,下一組306b可用,等等。如此,以不同質(zhì)量等級(jí)編碼原始內(nèi)容文件以用于在因特網(wǎng)上流式傳輸且所述內(nèi)容文件顯現(xiàn)為實(shí)況的。本文中僅以實(shí)例方式給出10秒延遲??山o編碼系統(tǒng)320添加多個(gè)主機(jī)314以便增加編碼系統(tǒng)320的處理容量??赏ㄟ^(guò)添加具有高CPU能力的系統(tǒng)或替代地多個(gè)低能力的系統(tǒng)而將延遲縮短為幾乎感知不到的水平。

應(yīng)用于細(xì)流的任何特定編碼方案可花費(fèi)比細(xì)流自身的持續(xù)時(shí)間更長(zhǎng)的時(shí)間來(lái)完成。舉例來(lái)說(shuō),2秒細(xì)流的極高質(zhì)量編碼可花費(fèi)5秒來(lái)完成?;蛘?,每一細(xì)流所需的處理時(shí)間可小于細(xì)流的持續(xù)時(shí)間。然而,由于連續(xù)細(xì)流的偏移并行編碼是由編碼系統(tǒng)320以規(guī)則間隔(匹配將那些細(xì)流提交給編碼系統(tǒng)320的間隔,例如2秒)進(jìn)行編碼,因此編碼系統(tǒng)320的輸出時(shí)序并不落后于未經(jīng)編碼細(xì)流312的實(shí)時(shí)提交速率。

現(xiàn)在返回到圖3A,如所描繪,主控器322及主機(jī)314可位于單個(gè)局域網(wǎng)絡(luò)內(nèi),或換句話說(shuō),主機(jī)314物理上可非常接近于主控器322?;蛘撸鳈C(jī)314可在因特網(wǎng)或其它通信網(wǎng)絡(luò)上從主控器322接收編碼工作。舉例來(lái)說(shuō),考慮在其中將難以設(shè)置多個(gè)主機(jī)的遠(yuǎn)程位置中的實(shí)況體育賽事。在此實(shí)例中,主控器于在線發(fā)行細(xì)流之前不執(zhí)行編碼或替代地執(zhí)行輕編碼。主機(jī)314將接著檢索那些細(xì)流并將所述細(xì)流編碼成多個(gè)位速率組306,如上文所描述。

此外,可在不重新開(kāi)始編碼工作及/或中斷細(xì)流的發(fā)行的情況下動(dòng)態(tài)地向編碼系統(tǒng)320添加主機(jī)314或從編碼系統(tǒng)320移除主機(jī)314。如果主機(jī)314經(jīng)歷損毀或某一故障,那么簡(jiǎn)單地將其編碼工作重新指派給另一主機(jī)。

在一個(gè)實(shí)施例中,編碼系統(tǒng)320還可經(jīng)配置以產(chǎn)生特定回放平臺(tái)特有的細(xì)流。舉例來(lái)說(shuō),針對(duì)單個(gè)原始細(xì)流,單個(gè)主機(jī)314可產(chǎn)生用于個(gè)人計(jì)算機(jī)回放的不同質(zhì)量等級(jí)的細(xì)流、用于在具有不同專有編解碼器的蜂窩電話上回放的細(xì)流、當(dāng)僅僅播放流的縮略視圖(像在節(jié)目編排指南中)時(shí)的僅有小視頻的細(xì)流及供在歸檔時(shí)使用的極高質(zhì)量細(xì)流。

在所描繪的實(shí)施例中,計(jì)算環(huán)境300包含內(nèi)容管理系統(tǒng)(CMS)340。CMS 340為(舉例來(lái)說(shuō))使用細(xì)流數(shù)據(jù)庫(kù)308管理經(jīng)編碼媒體內(nèi)容220且允許發(fā)行者產(chǎn)生并修改時(shí)間線(本文中稱作虛擬時(shí)間線(QVT))以調(diào)度媒體內(nèi)容232的回放的發(fā)行系統(tǒng)。QVT為可定義用于觀看者的播放列表、可指示媒體播放器200應(yīng)何時(shí)播放媒體內(nèi)容的元數(shù)據(jù)。舉例來(lái)說(shuō),時(shí)間線可規(guī)定媒體內(nèi)容232的開(kāi)始時(shí)間及媒體內(nèi)容232的當(dāng)前持續(xù)時(shí)間(例如,可用于遞送的媒體內(nèi)容的可用部分的量)以允許根據(jù)時(shí)間表回放媒體事件。在以上實(shí)例中,編碼器220用關(guān)于流(例如,媒體內(nèi)容232的副本)的信息更新CMS 240以指示已將所述流的某些部分(例如,細(xì)流)發(fā)送到與CDN 240相關(guān)聯(lián)的原始內(nèi)容服務(wù)器210。在此實(shí)施例中,CMS 340從編碼器220接收信息,舉例來(lái)說(shuō),以下各項(xiàng)中的任一者:加密密鑰;可用性信息,其指示所述組的編碼器220已將經(jīng)編碼媒體內(nèi)容232的若干部分發(fā)送到原始內(nèi)容服務(wù)器210;指示何種質(zhì)量等級(jí)可用于媒體內(nèi)容232的特定部分的信息;元數(shù)據(jù),舉例來(lái)說(shuō),包含內(nèi)容的播送日期、標(biāo)題、女演員、男演員、開(kāi)始索引、結(jié)束索引、專有發(fā)行者數(shù)據(jù)、加密等級(jí)、內(nèi)容持續(xù)時(shí)間、情節(jié)或節(jié)目名稱、發(fā)行者;最終用戶導(dǎo)航環(huán)境的可用工具,例如可用菜單、縮略圖、工具條、廣告、快進(jìn)、后退、暫停及播放等;或位速率值,包含幀大小、音頻通道信息、編解碼器、取樣速率及幀剖析器信息?;蛘撸幋a器220可發(fā)送比上文所描述的信息更多或更少的信息。

在所描繪的實(shí)施例中,計(jì)算環(huán)境300包含給系統(tǒng)提供數(shù)字版權(quán)管理能力的數(shù)字版權(quán)管理服務(wù)器(DRM)350。DRM服務(wù)器350進(jìn)一步經(jīng)配置以在驗(yàn)證最終用戶之后即刻將加密密鑰供應(yīng)給最終用戶。在一個(gè)實(shí)施例中,DRM服務(wù)器350經(jīng)配置以基于登錄憑證而驗(yàn)證用戶。所屬領(lǐng)域的技術(shù)人員將認(rèn)識(shí)到DRM服務(wù)器350可驗(yàn)證最終用戶的各種不同方式,包含但不限于經(jīng)加密網(wǎng)絡(luò)跟蹤器(cookies)、用戶簡(jiǎn)檔、地理位置、源網(wǎng)站等。

在其它實(shí)施例中,計(jì)算環(huán)境300可包含其它裝置,例如目錄服務(wù)器、管理服務(wù)器、消息接發(fā)服務(wù)器、統(tǒng)計(jì)服務(wù)器、網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)運(yùn)營(yíng)商(例如,ISP)的裝置等。

圖4是根據(jù)編解碼器強(qiáng)制的幀大小編碼媒體內(nèi)容的音頻以在具有所述媒體內(nèi)容的固定時(shí)間視頻部分的內(nèi)容文件之間分割全音頻幀的方法400的一個(gè)實(shí)施例的流程圖。通過(guò)可包含硬件(電路、專用邏輯等)、軟件(例如在通用計(jì)算機(jī)系統(tǒng)或?qū)S脵C(jī)器上運(yùn)行)、固件(例如,嵌入式軟件)或其任何組合的處理邏輯來(lái)執(zhí)行方法400。在一個(gè)實(shí)施例中,通過(guò)圖2及3A的編碼器220來(lái)執(zhí)行方法400。在另一實(shí)施例中,可通過(guò)圖2的固定幀音頻編碼器224及音頻分割多路復(fù)用器228來(lái)執(zhí)行所述方法的操作中的一些操作。

在圖4中,處理邏輯通過(guò)將樣本偏移初始化為零(框402)而開(kāi)始,且接收媒體內(nèi)容的原始音頻部分(框404)。處理邏輯使用固定幀音頻編解碼器編碼原始音頻部分(框406)并緩沖由音頻編解碼器輸出的經(jīng)編碼音頻幀(框408)。處理邏輯確定是否存在足夠的音頻幀來(lái)填充細(xì)流(框410)。在此實(shí)施例中,每一細(xì)流還包含其持續(xù)時(shí)間固定的視頻幀,如本文中所描述。如果不存在足夠的音頻幀來(lái)填充細(xì)流,那么處理邏輯返回以在框404處接收后續(xù)原始音頻部分、編碼所述原始音頻部分并在框408處緩沖經(jīng)編碼音頻幀。當(dāng)在框410處處理邏輯確定存在足夠的音頻幀來(lái)填充細(xì)流時(shí),所述處理邏輯將音頻幀發(fā)送到音頻分割多路復(fù)用器并從緩沖器移除經(jīng)發(fā)送幀(框412)。所述處理邏輯更新樣本偏移(框414),并確定媒體內(nèi)容是否在末端(框416)。如果在框416處媒體內(nèi)容不在末端,那么處理邏輯返回到框404以接收另一原始音頻部分。否則,所述方法結(jié)束。

如上文關(guān)于圖2所描述,處理邏輯可經(jīng)配置以執(zhí)行編碼器220的組件的各種操作。舉例來(lái)說(shuō),方法400可由固定幀音頻編碼器224執(zhí)行,固定幀音頻編碼器224從分割器222接收原始音頻233、編碼所述音頻幀并將經(jīng)編碼音頻幀237存儲(chǔ)于音頻幀緩沖器225中。在此實(shí)施例中,框402到408處的操作可由固定幀音頻編碼器224執(zhí)行,而框410到416處的操作可由音頻分割多路復(fù)用器228執(zhí)行。或者,所述操作可由編碼器220的組件的其它組合執(zhí)行。

圖5A到5C是產(chǎn)生具有固定時(shí)間視頻部分及具有編解碼器強(qiáng)制的幀大小的全音頻幀的內(nèi)容文件的一個(gè)實(shí)施例的流程圖。通過(guò)可包含硬件(電路、專用邏輯等)、軟件(例如在通用計(jì)算機(jī)系統(tǒng)或?qū)S脵C(jī)器上運(yùn)行)、固件(例如,嵌入式軟件)或其任何組合的處理邏輯來(lái)執(zhí)行方法500、550及570。在一個(gè)實(shí)施例中,通過(guò)圖2及3A的編碼器220來(lái)執(zhí)行方法500、550及570。在另一實(shí)施例中,通過(guò)固定幀音頻編碼器224來(lái)執(zhí)行方法500,通過(guò)固定時(shí)間視頻編碼器226來(lái)執(zhí)行方法550,且通過(guò)音頻分割多路復(fù)用器228來(lái)執(zhí)行方法570?;蛘?,可通過(guò)編碼器220的組件的其它組合來(lái)執(zhí)行方法500、550及570的操作。

在圖5A中,方法500的處理邏輯通過(guò)接收原始音頻部分(框502)而開(kāi)始。處理邏輯根據(jù)編解碼器強(qiáng)制的幀大小編碼所述原始音頻部分(框504),并緩沖經(jīng)編碼音頻幀(框506)。所述處理邏輯確定媒體內(nèi)容是否在末端(框508)。如果在框508處媒體內(nèi)容不在末端,那么處理邏輯返回到框502以接收另一原始音頻部分。否則,所述方法結(jié)束。

在圖5B中,方法550的處理邏輯通過(guò)接收原始視頻部分(框552)而開(kāi)始。處理邏輯根據(jù)幀速率編碼所述原始視頻部分(框554),并緩沖經(jīng)編碼視頻幀(框556)。所述處理邏輯確定媒體內(nèi)容是否在末端(框558)。如果在框558處媒體內(nèi)容不在末端,那么處理邏輯返回到框552以接收另一原始視頻部分。否則,所述方法結(jié)束。

在圖5C中,方法570的處理邏輯通過(guò)從緩沖器接收經(jīng)編碼音頻幀(框572)并從緩沖器接收視頻幀(框574)而開(kāi)始。處理邏輯產(chǎn)生細(xì)流(框576)并將所述細(xì)流發(fā)送到原始內(nèi)容服務(wù)器(框578)。所述處理邏輯確定媒體內(nèi)容是否在末端(框580)。如果在框580處媒體內(nèi)容不在末端,那么處理邏輯返回到框572。否則,所述方法結(jié)束。

在一個(gè)實(shí)施例中,處理邏輯在框576處確定填充細(xì)流需要多少視頻幀及填充細(xì)流需要多少音頻幀。在一個(gè)實(shí)施例中,根據(jù)固定持續(xù)時(shí)間,用于每一細(xì)流的視頻幀的數(shù)目為大概固定的。舉例來(lái)說(shuō),如果幀速率為30fps,那么兩秒細(xì)流中將存在60個(gè)幀。然而,應(yīng)注意,實(shí)際上視頻并非始終確切地為30fps,而是為29.97fps。因此,一些兩秒細(xì)流可能具有59個(gè)幀,一些可能具有60個(gè)幀,且一些甚至具有61個(gè)幀。細(xì)流中的每一幀具有相對(duì)于細(xì)流的開(kāi)始的呈現(xiàn)時(shí)間。因此,如果細(xì)流表示秒30到32,那么所述細(xì)流中的第一幀可具有6ms而非0的呈現(xiàn)時(shí)間。將在從流的開(kāi)始30006ms處顯示所述幀。在實(shí)況的情況下,如果計(jì)算資源有限且編碼器不能夠跟上實(shí)況視界,那么編碼器可丟掉若干幀以便趕上。因此,一些細(xì)流可在視頻中具有間隙,此可為每細(xì)流幀的數(shù)目的變化的另一原因。或者,可使用除30fps以外的幀速率,例如24fps等。用于每一細(xì)流的音頻幀的數(shù)目并非固定的。音頻幀的數(shù)目通過(guò)上文關(guān)于音頻分割多路復(fù)用器228所描述的操作來(lái)確定。處理邏輯確定緩沖器中是否存儲(chǔ)足夠的全幀來(lái)填充當(dāng)前細(xì)流。如果不存在足夠的音頻幀,那么處理邏輯接收并編碼音頻的后續(xù)部分,舉例來(lái)說(shuō),來(lái)自后續(xù)部分的一個(gè)全音頻幀,如本文中所描述。在一些情況下,細(xì)流中的音頻幀的持續(xù)時(shí)間可大于固定持續(xù)時(shí)間,且在其它情況下,音頻幀的持續(xù)時(shí)間可小于固定持續(xù)時(shí)間。

圖7圖解說(shuō)明用于音頻分割的呈計(jì)算機(jī)系統(tǒng)700的示范性形式的機(jī)器的圖示表示。在計(jì)算機(jī)系統(tǒng)700內(nèi)具有、可執(zhí)行用于致使所述機(jī)器執(zhí)行本文中所論述的音頻分割方法中的任何一者或一者以上的一組指令。在替代實(shí)施例中,所述機(jī)器可連接(例如,連網(wǎng))到LAN、內(nèi)聯(lián)網(wǎng)、外聯(lián)網(wǎng)或因特網(wǎng)中的其它機(jī)器。所述機(jī)器可在客戶端-服務(wù)器網(wǎng)絡(luò)環(huán)境中以服務(wù)器或客戶端機(jī)器的能力操作或者在同級(jí)(或分布式)網(wǎng)絡(luò)環(huán)境中作為同級(jí)機(jī)器操作。所述機(jī)器可為PC、平板PC、STB、PDA、蜂窩式電話、web用具、服務(wù)器、網(wǎng)絡(luò)路由器、交換機(jī)或橋接器或者能夠執(zhí)行規(guī)定將由所述機(jī)器采取的行動(dòng)的一組指令(順序或相反)的任何機(jī)器。此外,盡管僅圖解說(shuō)明單個(gè)機(jī)器,但術(shù)語(yǔ)“機(jī)器”還應(yīng)視為包含個(gè)別地或共同地執(zhí)行一組(或多組)指令以執(zhí)行本文中所論述的用于音頻分割的操作的方法(例如上文所描述的方法400、500、550及570)中的任何一者或一者以上的任何機(jī)器集合。在一個(gè)實(shí)施例中,計(jì)算機(jī)系統(tǒng)700表示可實(shí)施于如上文所描述的編碼器220或編碼系統(tǒng)320中的各種組件?;蛘撸幋a器220或編碼系統(tǒng)320可包含更多或更少的如計(jì)算機(jī)系統(tǒng)700中所圖解說(shuō)明的組件。

示范性計(jì)算機(jī)系統(tǒng)700包含處理裝置702、主存儲(chǔ)器704(例如,只讀存儲(chǔ)器(ROM)、快閃存儲(chǔ)器、動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器(DRAM),例如同步DRAM(SDRAM)或DRAM(RDRAM)等)、靜態(tài)存儲(chǔ)器706(例如,快閃存儲(chǔ)器、靜態(tài)隨機(jī)存取存儲(chǔ)器(SRAM)等)及數(shù)據(jù)存儲(chǔ)裝置716,所述裝置中的每一者經(jīng)由總線730彼此通信。

處理裝置702表示一個(gè)或一個(gè)以上通用處理裝置,例如微處理器、中央處理單元等。更特定來(lái)說(shuō),處理裝置702可為復(fù)雜指令集計(jì)算(CISC)微處理器、精簡(jiǎn)指令集計(jì)算(RISC)微處理器、超長(zhǎng)指令字(VLIW)微處理器或?qū)嵤┢渌噶罴奶幚砥骰驅(qū)嵤┤舾芍噶罴慕M合的若干處理器。處理裝置702也可為一個(gè)或一個(gè)以上專用處理裝置,例如專用集成電路(ASIC)、場(chǎng)可編程門陣列(FPGA)、數(shù)字信號(hào)處理器(DSP)、網(wǎng)絡(luò)處理器等。處理裝置702經(jīng)配置以執(zhí)行用于執(zhí)行本文中所論述的操作及步驟的處理邏輯(例如,音頻分割726)。

計(jì)算機(jī)系統(tǒng)700可進(jìn)一步包含網(wǎng)絡(luò)接口裝置722。計(jì)算機(jī)系統(tǒng)700還可包含視頻顯示單元710(例如,液晶顯示器(LCD)或陰極射線管(CRT))、字母數(shù)字輸入裝置712(例如,鍵盤)、光標(biāo)控制裝置714(例如,鼠標(biāo))及信號(hào)產(chǎn)生裝置720(例如,揚(yáng)聲器)。

數(shù)據(jù)存儲(chǔ)裝置716可包含計(jì)算機(jī)可讀存儲(chǔ)媒體724,計(jì)算機(jī)可讀存儲(chǔ)媒體724上存儲(chǔ)有體現(xiàn)本文中所描述的方法或功能中的任何一者或一者以上的一組或多組指令(例如,音頻分割726)。音頻分割726也可在其由計(jì)算機(jī)系統(tǒng)700的執(zhí)行期間完全或至少部分地駐存于主存儲(chǔ)器704內(nèi)及/或處理裝置702內(nèi),主存儲(chǔ)器704及處理裝置702還構(gòu)成計(jì)算機(jī)可讀存儲(chǔ)媒體??蛇M(jìn)一步經(jīng)由網(wǎng)絡(luò)接口裝置722在網(wǎng)絡(luò)上傳輸或接收音頻分割726。

盡管在示范性實(shí)施例中將計(jì)算機(jī)可讀存儲(chǔ)媒體724展示為單個(gè)媒體,但術(shù)語(yǔ)“計(jì)算機(jī)可讀存儲(chǔ)媒體”應(yīng)視為包含存儲(chǔ)一組或一組以上指令的單個(gè)媒體或多個(gè)媒體(例如,集中式或分布式數(shù)據(jù)庫(kù)及/或相關(guān)聯(lián)高速緩沖存儲(chǔ)器及服務(wù)器)。術(shù)語(yǔ)“計(jì)算機(jī)可讀存儲(chǔ)媒體”還應(yīng)視為包含能夠存儲(chǔ)由機(jī)器執(zhí)行的一組指令且致使所述機(jī)器執(zhí)行本發(fā)明實(shí)施例的方法中的任何一者或一者以上的任何媒體。術(shù)語(yǔ)“計(jì)算機(jī)可讀存儲(chǔ)媒體”應(yīng)相應(yīng)地視為包含但不限于固態(tài)存儲(chǔ)器、光學(xué)媒體、磁性媒體或用于存儲(chǔ)指令的其它類型的媒體。術(shù)語(yǔ)“計(jì)算機(jī)可讀傳輸媒體”應(yīng)視為包含能夠傳輸由所述機(jī)器執(zhí)行以致使所述機(jī)器執(zhí)行本發(fā)明實(shí)施例的方法中的任何一者或一者以上的一組指令的任何媒體。

音頻分割模塊732、組件及本文中所描述(例如關(guān)于圖2及3A)的其它特征可實(shí)施為離散硬件組件或集成于硬件組件的功能中(例如ASICS、FPGA、DSP或類似裝置)。另外,音頻分割模塊732可實(shí)施為固件或硬件裝置內(nèi)的功能電路。此外,音頻分割模塊732可以任何組合硬件裝置及軟件組件來(lái)實(shí)施。

出于解釋目的,已參考特定實(shí)施例描述了前文說(shuō)明。然而,以上說(shuō)明性論述并非打算為窮盡性或?qū)⒈景l(fā)明限制于所揭示的精確形式??筛鶕?jù)上文的教示內(nèi)容做出眾多種修改及變化形式。選擇并描述所述實(shí)施例以便最佳地解釋本發(fā)明的原理及其實(shí)際應(yīng)用,以借此使得所屬領(lǐng)域的技術(shù)人員能夠利用本發(fā)明及具有可適合于所涵蓋的特定用途的各種修改的各種實(shí)施例。

當(dāng)前第1頁(yè)1 2 3 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
岑溪市| 三台县| 金湖县| 岳阳县| 越西县| 含山县| 盈江县| 朝阳区| 荥阳市| 三穗县| 阜城县| 定兴县| 吉安市| 黄石市| 虎林市| 汾西县| 怀仁县| 铜川市| 夏津县| 新和县| 栾川县| 闻喜县| 盐津县| 青冈县| 夏津县| 新蔡县| 平南县| 石台县| 修武县| 通榆县| 五大连池市| 靖西县| 东乌珠穆沁旗| 长阳| 海南省| 左权县| 荣成市| 边坝县| 凤山市| 潞西市| 张家界市|