專利名稱:一種基于自適應(yīng)冗余片嵌入的容錯(cuò)性視頻轉(zhuǎn)碼方法
技術(shù)領(lǐng)域:
本發(fā)明涉及視頻轉(zhuǎn)碼領(lǐng)域,具體涉及一種基于自適應(yīng)冗余片嵌入的容錯(cuò)性視頻轉(zhuǎn) 碼方法。
背景技術(shù):
在多媒體應(yīng)用中,存在著各種各樣的網(wǎng)絡(luò)、設(shè)備、內(nèi)容表現(xiàn)形式和標(biāo)準(zhǔn)等,這些 要素之間的互通與互相適應(yīng)是非常重要的。視頻轉(zhuǎn)碼就是完成這項(xiàng)任務(wù)的非常重要一 環(huán),現(xiàn)已成為十分活躍的研究領(lǐng)域。因?yàn)閭鬏數(shù)牟豢煽浚蒎e(cuò)性轉(zhuǎn)碼(Error-resilient transcoding)成為視頻轉(zhuǎn)碼中一個(gè)急需解決的重要課題。一切有利于增強(qiáng)視頻流的容錯(cuò)性 的視頻轉(zhuǎn)碼都屬于容錯(cuò)性轉(zhuǎn)碼,其在移動(dòng)娛樂、移動(dòng)監(jiān)控等領(lǐng)域具有十分廣泛的應(yīng)用價(jià)值?,F(xiàn)有的容錯(cuò)性轉(zhuǎn)碼方法雖然可以取得較好的容錯(cuò)效果,但它們的一個(gè)主要缺點(diǎn)是 容錯(cuò)強(qiáng)度變更的靈活性不夠。它們作用的結(jié)果會(huì)導(dǎo)致原始視頻流發(fā)生了實(shí)質(zhì)變化。一旦網(wǎng) 絡(luò)情況發(fā)生變化或者不再需要容錯(cuò)時(shí),無法快速有效地形成新視頻流或者恢復(fù)成原始視頻 流,甚至根本無法完全恢復(fù)成原始視頻流。冗余片或冗余圖像技術(shù)是H. 264/AVC標(biāo)準(zhǔn)中引入的一種新穎且十分有效的視頻 容錯(cuò)技術(shù)。在編碼主圖像的基礎(chǔ)上再增添相應(yīng)的冗余編碼可以顯著提高視頻流的容錯(cuò)性。 增添的冗余內(nèi)容既可以是對圖像整體編碼的冗余圖像,也可以是針對某一特定區(qū)域或某些 宏塊編碼的冗余片。現(xiàn)有利用冗余片機(jī)制進(jìn)行容錯(cuò)編碼的方法還存在著以下一些問題產(chǎn) 生冗余圖像或冗余片的機(jī)制較為單一,對每一幀或者指定幀進(jìn)行冗余編碼,自適應(yīng)性不強(qiáng); 對整幀圖像進(jìn)行總體評估,而沒有區(qū)分圖像內(nèi)部性質(zhì)的差異(感興趣區(qū)域);只能針對冗余 碼率和主圖像碼率固定的情況,而不是自適應(yīng)分配;計(jì)算復(fù)雜度高,應(yīng)用難度大;未考慮傳 輸狀況。同時(shí),現(xiàn)有方法也都是應(yīng)用在編碼環(huán)節(jié)中的,不能完全適用于容錯(cuò)性轉(zhuǎn)碼中的冗余 片嵌入或變更。
發(fā)明內(nèi)容
本發(fā)明提供了一種基于自適應(yīng)冗余片嵌入的容錯(cuò)性視頻轉(zhuǎn)碼方法,解決了容錯(cuò)性 視頻轉(zhuǎn)碼過程中的冗余片嵌入技術(shù),包括以下步驟(1)輸入原始無容錯(cuò)處理的視頻流并對視頻流進(jìn)行解碼;(2)利用解碼后的像素信息,在色度空間中對當(dāng)前解碼幀進(jìn)行膚色檢測,提取出該 幀圖像的膚色宏塊;(3)對當(dāng)前解碼幀進(jìn)行運(yùn)動(dòng)分析,區(qū)分出每個(gè)宏塊的相對運(yùn)動(dòng)強(qiáng)度,并根據(jù)運(yùn)動(dòng)強(qiáng) 度對膚色宏塊進(jìn)行運(yùn)動(dòng)修正,得到新的膚色宏塊標(biāo)識;然后經(jīng)過形狀調(diào)整,確定最終的感興 趣區(qū)域宏塊;(4)按照對當(dāng)前幀視頻流嵌入與不嵌入冗余片兩種情況,分別估計(jì)在傳輸丟包條 件下感興趣區(qū)域的失真值;(5)統(tǒng)計(jì)嵌入與不嵌入冗余片兩種情況下編碼感興趣區(qū)域的比特資源消耗,計(jì)算
4感興趣區(qū)域冗余片的率失真性能,決策是否對當(dāng)前幀嵌入感興趣區(qū)域冗余片,即選出率失 真性能較佳的情況;(6)針對新的片組結(jié)構(gòu),對需要嵌入冗余片的視頻流進(jìn)行宏塊間依賴性分析和感 興趣區(qū)域擴(kuò)大,然后進(jìn)行熵編碼形成感興趣區(qū)域冗余片并嵌入原始視頻流當(dāng)中。本發(fā)明中,產(chǎn)生的冗余片只針對感興趣區(qū)域,不包括其它非感興趣區(qū)域,且生成冗 余片視頻流過程只在熵編碼層次上進(jìn)行。本發(fā)明中,產(chǎn)生的感興趣區(qū)域冗余片與其在主圖像中對應(yīng)位置的像素重建值完全 相同,即不改變相關(guān)宏塊的預(yù)測模式和量化參數(shù)等。本發(fā)明的轉(zhuǎn)碼方法能夠顯著增強(qiáng)原有視頻流的容錯(cuò)性能,改善不可靠傳輸時(shí)視頻 的質(zhì)量,實(shí)現(xiàn)較好的率失真性能,并與人的視覺保持了良好的一致性。同時(shí),還具有復(fù)雜度 較小、圖像存儲(chǔ)空間要求較少和容錯(cuò)強(qiáng)度變更靈活等特點(diǎn)。
圖1為本發(fā)明自適應(yīng)冗余片嵌入的容錯(cuò)性視頻轉(zhuǎn)碼方法的流程圖;圖2為本發(fā)明中圖像中心區(qū)域劃分圖;圖3為本發(fā)明中感興趣區(qū)域擴(kuò)大示意圖;圖4為采用本發(fā)明方法對Carphone測試序列進(jìn)行仿真實(shí)驗(yàn)結(jié)果圖。
具體實(shí)施例方式下面結(jié)合實(shí)施例和附圖來詳細(xì)說明本發(fā)明,但本發(fā)明并不僅限于此。如圖1所示,一種基于自適應(yīng)冗余片嵌入的容錯(cuò)性視頻轉(zhuǎn)碼方法,包括以下步驟(1)輸入原始無容錯(cuò)處理的視頻流并對視頻流進(jìn)行解碼;(2)提取出當(dāng)前解碼幀圖像的膚色宏塊;直接從顏色判斷出發(fā)去檢測膚色具有較高的效率,一個(gè)坐標(biāo)為(X,y)的像素點(diǎn)是 否屬于膚色區(qū)域通過式(I)來判斷 式(I)中,C;表示像素點(diǎn)的一個(gè)色度值;Vio表示像素點(diǎn)RGB值的方差;R。為檢測 膚色的色度區(qū)間,其上下限分別為173和133 J1和T2分別表示RGB方差判斷的下限和上 限;式(I)中,S為1時(shí)表示該像素為膚色像素??紤]到觀眾對中心區(qū)域更為關(guān)注,因此,本發(fā)明采取差別化的檢測限值,對不同的 區(qū)域采用不同的檢測限值T1和1~2。對區(qū)域的劃分如圖2所示(QCIF格式,圖中寬度與高度 數(shù)字均以宏塊為單位),圖2中由內(nèi)至外的區(qū)域分別是禮、R2和民。對于這三個(gè)區(qū)域,區(qū)間 [T1, T2]的取值分別為[50,4000]、[50,2200]和[50,1600]。定義具有140個(gè)以上膚色像素的宏塊為膚色宏塊,宏塊級膚色標(biāo)識(膚色宏塊檢 測標(biāo)識)為Smb,膚色宏塊的Smb置為1,否則為0。(3)對膚色宏塊進(jìn)行運(yùn)動(dòng)修正,然后經(jīng)過形狀調(diào)整,確定最終的感興趣區(qū)域宏塊;對于個(gè)別背景來說其顏色仍然十分接近膚色,因此通過運(yùn)動(dòng)修正來對膚色檢測進(jìn) 行完善。接近膚色的背景往往處于非運(yùn)動(dòng)或輕微運(yùn)動(dòng)狀態(tài),所以可以據(jù)此剔除掉一些誤判
膚色宏塊。設(shè)一個(gè)宏塊的運(yùn)動(dòng)強(qiáng)度為Imb,其取值范圍為0、1或2,取值為2時(shí)表示運(yùn)動(dòng)強(qiáng)度 大。運(yùn)動(dòng)強(qiáng)度通過計(jì)算錯(cuò)誤恢復(fù)失真值來確定,因?yàn)樵撝悼梢苑从尺B續(xù)兩幀之間的差 異。同時(shí)該錯(cuò)誤恢復(fù)失真值也將會(huì)用在后續(xù)的率失真計(jì)算過程中,可以減少計(jì)算量。一個(gè)像素點(diǎn)的錯(cuò)誤恢復(fù)失真值4。定義如式(II)所示dec(x,y) = [F(x, y)-F' (x,y)]2(II)式(II)中,F(xiàn)和F'分別為當(dāng)前幀和前一幀的解碼重建像素值。一個(gè)宏塊的錯(cuò)誤恢復(fù)失真值定義為其所有組成像素的錯(cuò)誤恢復(fù)失真值之和。設(shè)一 幀圖像所有宏塊的平均錯(cuò)誤恢復(fù)失真值為Davg。當(dāng)宏塊的錯(cuò)誤恢復(fù)失真值大于3Davg時(shí),其 運(yùn)動(dòng)強(qiáng)度Imb置為2。當(dāng)處于
區(qū)間時(shí),Imb分別對應(yīng)0和1。設(shè)一個(gè)宏塊所處的相對于中心的區(qū)域?yàn)镽mb,那么經(jīng)過運(yùn)動(dòng)修正后的宏塊級膚色標(biāo) 識定義為
‘ Xb =Ior Zmb =2, ^mbER1 1, if^mb = land/mb>l, ^eR2 .UandU Rmb eR3 0, otherwise如上所述,式(III)中,Smb為步驟⑵中所產(chǎn)生的膚色宏塊檢測標(biāo)識;I-為宏塊運(yùn) 動(dòng)強(qiáng)度標(biāo)識,通過比較宏塊強(qiáng)度與圖像平均運(yùn)動(dòng)強(qiáng)度得到;Rmb為宏塊所屬圖像區(qū)域標(biāo)識; 隊(duì)、R2和R3為圖像不同區(qū)域,通過預(yù)先設(shè)定的中心區(qū)域劃分圖(如圖2所示)規(guī)定。由式(III)可知,越遠(yuǎn)離中心區(qū)域,運(yùn)動(dòng)修正的判斷標(biāo)準(zhǔn)越為嚴(yán)格。同時(shí),中心區(qū) 域內(nèi)運(yùn)動(dòng)強(qiáng)度大的宏塊也被納入感興趣區(qū)域中。進(jìn)一步對上述得到的膚色標(biāo)識進(jìn)行形狀調(diào)整,一方面可以使得一些重要區(qū)域納入 感興趣區(qū)域范圍,如被膚色包圍的眼睛和嘴等;另一方面也可以剔除一些孤立的噪聲宏塊。計(jì)算每個(gè)宏塊周邊上下左右四個(gè)宏塊的M值的總和,結(jié)果記為MSUffl。如果一個(gè)宏塊 的Msim大于或等于閾值Tml,那么該宏塊新的M值置為1 ;如果Msum小于或等于閾值Tm2,那么 該宏塊新的M值置為0 ;其它情況M值保持不變。按照宏塊光柵掃描次序,上述形狀調(diào)整算 法進(jìn)行兩次,從而得到最終的M值。第一次形狀調(diào)整中使用的Tml為2,Tm2為0 ;第二次形狀 調(diào)整中使用的Tml為3,Tm2為1。最終的M值為1的宏塊為感興趣區(qū)域宏塊,需要嵌入冗余片保護(hù)的感興趣區(qū)域定 義為包含了所有感興趣區(qū)域宏塊的最小矩形。本發(fā)明中產(chǎn)生的感興趣區(qū)域冗余片與其在主 圖像中對應(yīng)位置的像素重建值完全相同,即轉(zhuǎn)碼過程中不改變相關(guān)宏塊的預(yù)測模式和量化 參數(shù)等。(4)按照對當(dāng)前幀視頻流嵌入與不嵌入冗余片兩種情況,分別估計(jì)在傳輸丟包條 件下感興趣區(qū)域的失真值不嵌入冗余片的情況下,一個(gè)像素點(diǎn)的估計(jì)失真值dPH通過下式得到dPri = (l-p)dref+p(dec+dCoi)(IV)式(IV)中,ρ表示傳輸時(shí)的丟包率,cUf表示當(dāng)前像素點(diǎn)所參考的像素點(diǎn)的估計(jì)失 真值,dcol是指參考幀中相同位置像素的估計(jì)失真值。
6
在嵌入冗余片的情況下,一個(gè)像素點(diǎn)的估計(jì)失真值Cllted通過下式得到dEed = (1-p) dref+p (1-p) dref E+p2 (dec+dcol) (V)式(V)中,(^〃是指冗余片所參考的像素點(diǎn)的估計(jì)失真值。因?yàn)樵诒景l(fā)明中冗余 片與主圖像的參考幀和參考行為完全一致,即dref = dref_E,因此dEed= (l-p2)dref+p2(dec+dCoi)(VI)通過加和感興趣區(qū)域中所有像素點(diǎn)的估計(jì)失真值,可以得到在不嵌入或嵌入冗余 片兩種情況下感興趣區(qū)域整體的估計(jì)失真值,分別記作Dph和Dm。(5)統(tǒng)計(jì)嵌入與不嵌入冗余片兩種情況下編碼感興趣區(qū)域所消耗的比特?cái)?shù),計(jì)算 得到嵌入冗余片后失真值變化與所消耗比特?cái)?shù)變化之間的比值S,也就是單位比特可以減 少的感興趣區(qū)域的失真程度,如式(VII)所示 式(VII)中,Rph和Rm分別表示不嵌入和嵌入冗余片兩種情況下編碼感興趣區(qū)域 所需的比特?cái)?shù)(Rlted既包括冗余片比特?cái)?shù)也包括主圖像對應(yīng)位置比特?cái)?shù))。Rm可以直接從 解碼過程中得到??紤]到本發(fā)明中冗余片和主圖像編碼感興趣區(qū)域所需要的比特資源近似 相同(冗余片完全來自主圖像對應(yīng)區(qū)域的無損變更),所以Rm約為Rm的2倍。所以 式(VIII)中,^^和!^分別為感興趣區(qū)域中所有像素點(diǎn)的心^^和火社的 總禾口。當(dāng)比值δ大于指定閾值λ時(shí),說明對原視頻流嵌入冗余片可以取得較好的率失 真性能,反之則不應(yīng)該嵌入冗余片。借鑒H. 264/AVC宏塊率失真優(yōu)化中的拉格朗日乘數(shù),本發(fā)明中所使用的閾值為
(IX)式(IX)中,Q為原始視頻流的量化參數(shù),α為固定值參數(shù)(本發(fā)明中設(shè)為0. 01)。在確定了當(dāng)前幀是否應(yīng)該嵌入冗余片保護(hù)感興趣區(qū)域之后,相應(yīng)確定當(dāng)前幀感興 趣區(qū)域所有像素點(diǎn)的估計(jì)失真值為dPH (選擇不嵌入冗余片時(shí))還是(選擇嵌入冗余片 時(shí)),以供后續(xù)幀在估計(jì)失真值時(shí)使用。其余所有非感興趣區(qū)域的像素點(diǎn),其失真值應(yīng)全部 賦為dM。在I幀更新后,上述所有失真值全部清零。(6)對需要嵌入冗余片的當(dāng)前幀視頻流進(jìn)行宏塊間依賴性分析和感興趣區(qū)域擴(kuò)大 之后,然后進(jìn)行熵編碼形成冗余片并嵌入原始視頻流當(dāng)中。如果對當(dāng)前解碼幀嵌入冗余片,感興趣區(qū)域冗余片將以靈活宏塊次序(FMO)兩片 組類型2的一個(gè)片組的形式進(jìn)行編碼,該片組的片組號為0。其余所有非感興趣區(qū)域的宏塊 不做冗余編碼,也就是對兩片組類型2的另一個(gè)片組不進(jìn)行冗余編碼。原視頻流是不存在片組劃分的,所以冗余視頻流不能直接復(fù)制原視頻流的對應(yīng)位 置,而必須根據(jù)感興趣區(qū)域位置重新生成具有新的片組結(jié)構(gòu)的視頻流,這也就導(dǎo)致宏塊依 賴性的差異。所謂宏塊依賴性是指一個(gè)宏塊在進(jìn)行熵編碼時(shí)需要依賴于其周邊宏塊的相關(guān)信息,如運(yùn)動(dòng)矢量信息等。通常這些信息的利用不能夠跨越片和片組的邊界,即只能利用本 片和本片組的相關(guān)宏塊信息。為了實(shí)現(xiàn)主圖像與冗余片的重建值完全相同,即無損分片結(jié) 構(gòu)變更,需要對原有的宏塊依賴性進(jìn)行分析,然后根據(jù)新的宏塊依賴性進(jìn)行熵編碼、生成新 的視頻流。本發(fā)明的宏塊間依賴性主要包括運(yùn)動(dòng)矢量依賴性和系數(shù)依賴性等。對于幀內(nèi)預(yù)測 宏塊,其宏塊依賴性還包括了對周邊宏塊像素的依賴,這種依賴關(guān)系無法通過再次熵編碼 改變。為解決這一問題,本發(fā)明中的感興趣區(qū)域?qū)⑦m當(dāng)擴(kuò)大,達(dá)到所有幀內(nèi)預(yù)測宏塊需要依 賴的周邊宏塊都包括在感興趣區(qū)域內(nèi),如圖3所示。圖3(a)中的粗線內(nèi)部宏塊位置為將進(jìn) 行冗余編碼的感興趣區(qū)域,其片組號為0,其余宏塊不進(jìn)行冗余編碼(標(biāo)記為“χ”)。設(shè)其中 的豎線背景宏塊為水平預(yù)測的幀內(nèi)預(yù)測宏塊,需要依賴其左側(cè)斜線背景宏塊的像素。此種 情況下,本發(fā)明將感興趣區(qū)域擴(kuò)大至包含斜線背景宏塊,使得豎線背景宏塊的預(yù)測模式不 發(fā)生任何變化,如圖3(b)所示。通常,未經(jīng)容錯(cuò)處理的原始視頻流的幀內(nèi)預(yù)測宏塊比例很 小,因此感興趣區(qū)域擴(kuò)大所導(dǎo)致的額外比特資源消耗很少。另外,如果原有視頻流存在片結(jié) 構(gòu),則該片結(jié)構(gòu)在冗余編碼過程中保持不變。實(shí)驗(yàn)效果采用本發(fā)明方法(ARSI)對無容錯(cuò)保護(hù)的Carphone視頻流進(jìn)行容錯(cuò)性 轉(zhuǎn)碼。對比方法是H. 264/AVC模型標(biāo)準(zhǔn)參考模型JM15. 1中的HRP(Hierarchical Redundant Picture)算法(參數(shù) NumRedundantHierarchy 和 NumRefPrimary 的值分別設(shè)為 0 和 1,參 數(shù)PrimaryGOPLength的值為2、5和8,分別記為HRP2、HRP5和HRP8)。待轉(zhuǎn)碼的視頻流都 是由JM15. 1編碼器預(yù)編碼的,編碼幀數(shù)、I幀間隔和幀率分別為300幀、50幀和25幀/秒。 預(yù)編碼中所使用的量化參數(shù)為28、32和36。實(shí)驗(yàn)的網(wǎng)絡(luò)丟包率為10%。如圖4所示,曲線 1 4分別表示采取HRP2、HRP5、HRP8和本發(fā)明方法(ARSI)方法得到的感興趣區(qū)域峰值信 噪比(PSNR)質(zhì)量結(jié)果。從圖4中可以看到本發(fā)明對質(zhì)量的改善幅度可達(dá)到0. 8到1. 5dB。
8
權(quán)利要求
一種基于自適應(yīng)冗余片嵌入的容錯(cuò)性視頻轉(zhuǎn)碼方法,其特征在于,包括以下步驟(1)輸入原始無容錯(cuò)處理的視頻流并對視頻流進(jìn)行解碼;(2)利用解碼后的像素信息,在色度空間中對當(dāng)前解碼幀進(jìn)行膚色檢測,提取出該幀圖像的膚色宏塊;(3)對當(dāng)前解碼幀進(jìn)行運(yùn)動(dòng)分析,區(qū)分出每個(gè)宏塊的相對運(yùn)動(dòng)強(qiáng)度,并根據(jù)運(yùn)動(dòng)強(qiáng)度對膚色宏塊進(jìn)行運(yùn)動(dòng)修正,得到新的膚色宏塊標(biāo)識;然后經(jīng)過形狀調(diào)整,確定最終的感興趣區(qū)域宏塊;(4)按照對當(dāng)前幀視頻流嵌入與不嵌入冗余片兩種情況,分別計(jì)算在傳輸丟包條件下感興趣區(qū)域的估計(jì)失真值;(5)統(tǒng)計(jì)嵌入與不嵌入冗余片兩種情況下編碼感興趣區(qū)域的比特資源消耗,計(jì)算感興趣區(qū)域冗余片的率失真性能,決策是否對當(dāng)前幀嵌入感興趣區(qū)域冗余片;(6)針對新的片組結(jié)構(gòu),對需要嵌入冗余片的視頻流進(jìn)行宏塊間依賴性分析和感興趣區(qū)域擴(kuò)大,然后進(jìn)行熵編碼形成感興趣區(qū)域冗余片并嵌入原始視頻流當(dāng)中。
2.根據(jù)權(quán)利要求1所述的容錯(cuò)性視頻轉(zhuǎn)碼方法,其特征在于,所述的步驟(2)中,所述 的膚色檢測采用差別化的檢測限值,針對圖像的不同區(qū)域采用不同的檢測限值。
3.根據(jù)權(quán)利要求1所述的容錯(cuò)性視頻轉(zhuǎn)碼方法,其特征在于,所述的步驟(3)根據(jù)式 (III)進(jìn)行膚色宏塊的運(yùn)動(dòng)修正 式(III)中,Smb為步驟(2)中所產(chǎn)生的膚色宏塊檢測標(biāo)識;Imb為宏塊運(yùn)動(dòng)強(qiáng)度標(biāo)識, 通過比較宏塊強(qiáng)度與圖像平均運(yùn)動(dòng)強(qiáng)度得到;Rmb為宏塊所屬圖像區(qū)域標(biāo)識;禮、R2和R3為 圖像中自中心區(qū)域由內(nèi)至外的不同區(qū)域,通過預(yù)先設(shè)定的中心區(qū)域劃分圖規(guī)定。
4.根據(jù)權(quán)利要求1所述的容錯(cuò)性視頻轉(zhuǎn)碼方法,其特征在于,所述的步驟(4)中,計(jì)算 在傳輸丟包條件下感興趣區(qū)域的估計(jì)失真值的過程如下(4. 1)采用式(IV)計(jì)算不嵌入冗余片時(shí)一個(gè)像素點(diǎn)的估計(jì)失真值dPH dPri = (l-p)dref+p(dec+dcol)(IV)(4. 2)采用式(VI)計(jì)算嵌入冗余片時(shí)一個(gè)像素點(diǎn)的估計(jì)失真值Cllted: 嵌入冗余片的情況下,一個(gè)像素點(diǎn)的估計(jì)失真值通過下式得到 dEed = (1-P2) dref+p2 (dec+dcol) (VI)(4. 3)加和感興趣區(qū)域中所有像素點(diǎn)的估計(jì)失真值,分別得到在不嵌入和嵌入冗余片 兩種情況下感興趣區(qū)域整體的估計(jì)失真值Dph和Dm ;式(IV)和(VI)中,ρ表示網(wǎng)絡(luò)傳輸時(shí)的丟包率,4。當(dāng)前像素與參考幀中相同位置像 素之間差值的平方值,dref表示當(dāng)前像素點(diǎn)所參考的像素點(diǎn)的估計(jì)失真值;d-是指參考幀 中相同位置像素的估計(jì)失真值。
5.根據(jù)權(quán)利要求1所述的容錯(cuò)性視頻轉(zhuǎn)碼方法,其特征在于,所述的步驟(5)中判斷是 否對當(dāng)前幀嵌入感興趣區(qū)域冗余片,通過比較嵌入冗余片后失真值變化與所消耗比特?cái)?shù)變化之間的比值δ與指定閾值λ來實(shí)現(xiàn),當(dāng)比值δ大于指定閾值λ時(shí),對視頻流嵌入冗余 片,反之則不應(yīng)該嵌入冗余片;比值δ采取式(VIII)進(jìn)行計(jì)算 )(VIII) 式(VIII)中,D^Dral和Dref分別為感興趣區(qū)域中所有像素點(diǎn)的dec、dcol和CUf值的總 和;4。當(dāng)前像素與參考幀中相同位置像素之間差值的平方值,(1&表示當(dāng)前像素點(diǎn)所參考 的像素點(diǎn)的估計(jì)失真值;d-是指參考幀中相同位置像素的估計(jì)失真值;Rm表示不嵌入冗 余片時(shí)編碼感興趣區(qū)域所需的比特?cái)?shù),從解碼過程中獲得。
6.根據(jù)權(quán)利要求5所述的容錯(cuò)性視頻轉(zhuǎn)碼方法,其特征在于,所述的指定閾值λ由式 (IX)計(jì)算得到 式(IX)中,α為固定值參數(shù),為0.01 ;ρ表示網(wǎng)絡(luò)傳輸時(shí)的丟包率,Q為原始視頻流的量化參數(shù)。
全文摘要
本發(fā)明公開了一種基于自適應(yīng)冗余片嵌入的容錯(cuò)性視頻轉(zhuǎn)碼方法,包括以下步驟輸入原始視頻流并對視頻流進(jìn)行解碼;提取出當(dāng)前解碼幀的膚色宏塊;對膚色宏塊進(jìn)行運(yùn)動(dòng)修正,然后經(jīng)過形狀調(diào)整,確定最終的感興趣區(qū)域宏塊;按照嵌入與不嵌入冗余片兩種情況,分別計(jì)算感興趣區(qū)域的估計(jì)失真值;計(jì)算感興趣區(qū)域冗余片的率失真性能,決策是否對當(dāng)前幀嵌入感興趣區(qū)域冗余片;對需要嵌入冗余片的視頻流進(jìn)行宏塊間依賴性分析和感興趣區(qū)域擴(kuò)大之后,進(jìn)行熵編碼形成冗余片并嵌入原始視頻流當(dāng)中。本發(fā)明在無需二次編碼的情況下具有良好的容錯(cuò)效果,并與人的視覺保持了良好的一致性,且具有容錯(cuò)強(qiáng)度可以靈活更改。
文檔編號H04N7/68GK101917626SQ20101026203
公開日2010年12月15日 申請日期2010年8月20日 優(yōu)先權(quán)日2010年8月20日
發(fā)明者周怡然, 羅雷, 陳耀武 申請人:浙江大學(xué)