專利名稱::視頻場(chǎng)景切換檢測(cè)裝置及方法
技術(shù)領(lǐng)域:
:本發(fā)明涉及視頻序列分析技術(shù),尤其涉及一種視頻場(chǎng)景切換檢測(cè)裝置及方法。
背景技術(shù):
:隨著通信技術(shù)的迅速發(fā)展以及多媒體視頻數(shù)量的快速增多,產(chǎn)生了視頻摘要、視頻檢索、視頻管理等技術(shù)。這些技術(shù)主要通過(guò)對(duì)視頻序列進(jìn)行視頻場(chǎng)景切換檢測(cè)等有效分析來(lái)實(shí)現(xiàn)。視頻序列中的場(chǎng)景是表示一個(gè)攝像機(jī)拍攝的一系列連續(xù)幀,描述了一個(gè)事件或者連續(xù)的物體動(dòng)作。場(chǎng)景切換是指兩個(gè)場(chǎng)景之間發(fā)生了變化,視頻中一段連續(xù)幀圖象產(chǎn)生中斷。場(chǎng)景切換通常由影片攝像機(jī)的切換或者是影片編輯方法引起,分為突變和緩變兩種。場(chǎng)景突變(Cut)是指從一個(gè)場(chǎng)景到另一個(gè)場(chǎng)景發(fā)生突然變化,在這兩個(gè)場(chǎng)景之間存在明顯的過(guò)渡邊界。在視頻編輯中,通常用這種剪輯方式來(lái)表達(dá)視頻內(nèi)容轉(zhuǎn)變以及注意力的轉(zhuǎn)移。場(chǎng)景緩變一般由視頻編輯方法引起,是指從一個(gè)場(chǎng)景緩慢地變成另一個(gè)場(chǎng)景,其切換相對(duì)平滑而且過(guò)渡也相對(duì)較為緩慢。在視頻編輯中通常用這種手法來(lái)刻畫(huà)人物的內(nèi)心世界等。例如漸變黑是電影制作方法中常用于表達(dá)一個(gè)場(chǎng)景或者某個(gè)特殊故事情節(jié)的結(jié)束。場(chǎng)景緩變主要包括淡入淡出(Fadein/out)和消溶(Dissolve)。淡入是從一個(gè)單色幀開(kāi)始慢慢的過(guò)渡到一個(gè)畫(huà)面,淡出是從一個(gè)畫(huà)面慢慢地過(guò)渡到一個(gè)單色幀;消融是連接兩個(gè)場(chǎng)景,其中一個(gè)場(chǎng)景淡入的同時(shí)另一個(gè)場(chǎng)景淡出,是兩個(gè)場(chǎng)景的疊加。場(chǎng)景切換檢測(cè)可以是對(duì)場(chǎng)景突變的檢測(cè),也可以是對(duì)場(chǎng)景緩變的檢測(cè)。目前,場(chǎng)景突變檢測(cè)主要根據(jù)同一場(chǎng)景內(nèi)的相鄰幀相似度較高,而在發(fā)生場(chǎng)景突變時(shí),相鄰幀的相似性較低來(lái)檢測(cè)場(chǎng)景突變。檢測(cè)方法包括像素差分檢測(cè)方法和像素直方圖4企測(cè)方法。其中,像素差分4企測(cè)方法對(duì)相鄰幀之間的像素與像素的差值求和,如果此值大于一個(gè)閾值,則說(shuō)明在這兩個(gè)幀之間發(fā)生了鏡頭切換。如中國(guó)第99813804號(hào)專利申請(qǐng)《一種高清晰度電視編碼器中檢測(cè)場(chǎng)景改變與調(diào)節(jié)畫(huà)面編碼類型的方法與裝置》,就是利用相同位置的像素變化的統(tǒng)計(jì)量來(lái)進(jìn)行場(chǎng)景突變的檢測(cè)的。像素直方圖^f企測(cè)方法通過(guò)測(cè)量相鄰幀之間的顏色直方圖距離檢測(cè)場(chǎng)景是否發(fā)生緩變。檢測(cè)依據(jù)是拍攝對(duì)象運(yùn)動(dòng)時(shí)幾乎不引起直方圖差別。如中國(guó)第200610061437號(hào)專利申請(qǐng)《一種場(chǎng)景切換的^^測(cè)方法及其4全測(cè)系統(tǒng)》,首先對(duì)當(dāng)前幀和前一幀進(jìn)行運(yùn)動(dòng)估計(jì),篩選場(chǎng)景切換候選幀,然后對(duì)當(dāng)前幀和前一幀進(jìn)行直方圖比較,篩選出真正的場(chǎng)景切換幀。場(chǎng)景緩變由于相鄰幀之間的特征差值很小,很難用單個(gè)的閾值來(lái)檢測(cè),并且,逐漸改變的場(chǎng)景緩變很難從時(shí)間上或空間上分離開(kāi),很難區(qū)分場(chǎng)景緩變和運(yùn)動(dòng)場(chǎng)景。因此,場(chǎng)景緩變檢測(cè)比場(chǎng)景突變檢測(cè)更困難。場(chǎng)景緩變檢測(cè)方法有Zabih方法和RA方法。Zabih方法主要基于邊緣特征(R.Zabih,J.Miller,andK.Mai,"Afeature-basedalgorithmfordetectingandclassifyingscenebreaks,,,inProc.ACMMultimedia,SanFrancisco,pp.189-200,Nov.1995),即,首先將每幀進(jìn)行Canny算子的邊緣檢測(cè);其次將邊緣檢測(cè)的結(jié)果進(jìn)行膨脹處理;然后統(tǒng)計(jì)邊緣的變換率,主要包括新出現(xiàn)邊緣和消失邊緣;最后利用它們改變的程度來(lái)達(dá)到場(chǎng)景緩變檢測(cè)的目的。RA方法即一種基于變換幀差(DFD)的方法(R.A.Joyce,andB.Liu,"Temporalsegmentationofvideousingframeandhistogramspace,,,IEEETrans.Multimedia,vol.8,pp.130-140,F(xiàn)eb.2006)。首先求第K-L幀和第K幀的像素值差;其次求第K幀和第K+L幀的像素值差;然后利用兩個(gè)幀差求相關(guān)性,最后根據(jù)相關(guān)性進(jìn)行場(chǎng)景緩變中淡入淡出和消融的檢測(cè)。發(fā)明人在實(shí)現(xiàn)本發(fā)明的過(guò)程中,發(fā)現(xiàn)現(xiàn)有技術(shù)至少存在以下缺陷場(chǎng)景突變檢測(cè)方法只能檢測(cè)場(chǎng)景突變,并且受亮度的突然變化影響,無(wú)法區(qū)分閃光與場(chǎng)景突變,需要消除閃光(Flashlight)的影響才能對(duì)場(chǎng)景突變進(jìn)行準(zhǔn)確檢測(cè)。但是對(duì)新聞視頻進(jìn)行場(chǎng)景突變檢測(cè),由于新聞中的閃光本身對(duì)新聞視頻中故事的分類和瀏覽也提供著重要的提示信息,例如閃光總是與采訪鏡頭或者重要的國(guó)際國(guó)內(nèi)新聞報(bào)道相關(guān),因此,對(duì)閃光進(jìn)行檢測(cè)和確認(rèn)有助于新聞視頻內(nèi)容的理解和故事單元的分類,而場(chǎng)景突變檢測(cè)方法由于無(wú)法區(qū)分閃光與場(chǎng)景突變,而無(wú)法實(shí)現(xiàn)閃光檢測(cè)。并且,像素差分檢測(cè)方法對(duì)鏡頭移動(dòng)十分敏感;像素差分檢測(cè)方法和像素直方圖檢測(cè)方法不能檢測(cè)場(chǎng)景緩變。場(chǎng)景緩變檢測(cè)方法受運(yùn)動(dòng)幀的影響較大,由于運(yùn)動(dòng)幀容易引起一些新出現(xiàn)邊緣和消失邊緣的誤判斷,因而檢測(cè)效果較差;并且,RA方法無(wú)法區(qū)分淡入淡出和消融。如分別使用Zabih方法、RA方法對(duì)兩個(gè)業(yè)界公知的緩變場(chǎng)景比較多的視頻序列culture序列(共44145幀)、eyeexam序列(共40735幀)進(jìn)行檢測(cè),檢測(cè)結(jié)果如表l、表2所示。表lZabih方法的實(shí)驗(yàn)結(jié)果<table>tableseeoriginaldocumentpage11</column></row><table>其中,氣為正確檢測(cè)數(shù)目,^m為漏檢測(cè)數(shù)目,'V/為錯(cuò)誤檢測(cè)數(shù)目,〈為查全率,^"為準(zhǔn)確率。由表l、表2可知,場(chǎng)景緩變檢測(cè)方法不能精確的檢測(cè)出場(chǎng)景緩變。
發(fā)明內(nèi)容本發(fā)明實(shí)施例提出一種視頻場(chǎng)景切換檢測(cè)裝置及方法,以提高場(chǎng)景切換檢測(cè)的準(zhǔn)確率。本發(fā)明實(shí)施例提供了一種視頻場(chǎng)景切換檢測(cè)裝置,包括特征提取單元,用于通過(guò)三維小波變換提取視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征VH;場(chǎng)景切換檢測(cè)單元,用于根據(jù)所述VH檢測(cè)場(chǎng)景切換。本發(fā)明實(shí)施例還提供了一種視頻場(chǎng)景切換檢測(cè)方法,包括通過(guò)三維小波變換提取視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征VH;根據(jù)所述VH檢測(cè)場(chǎng)景切換。上述實(shí)施例通過(guò)利用視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征VH檢測(cè)場(chǎng)景切換,消除了亮度變化對(duì)場(chǎng)景切換檢測(cè)的影響,大大提高了檢測(cè)場(chǎng)景切換的準(zhǔn)確率。下面通過(guò)附圖和實(shí)施例,對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)描述。圖1為本發(fā)明視頻場(chǎng)景切換檢測(cè)裝置實(shí)施例的結(jié)構(gòu)示意圖2本發(fā)明視頻場(chǎng)景切換檢測(cè)裝置實(shí)施例中特征提取單元的結(jié)構(gòu)示意圖3為本發(fā)明視頻場(chǎng)景切換檢測(cè)方法實(shí)施例的流程圖4為本發(fā)明視頻場(chǎng)景切換檢測(cè)方法實(shí)施例中提取特征的流程圖5為本發(fā)明視頻場(chǎng)景切換檢測(cè)方法實(shí)施例中對(duì)8幀進(jìn)行小波變換后的結(jié)構(gòu)示意圖6為本發(fā)明視頻場(chǎng)景切換檢測(cè)方法實(shí)施例中獲取最優(yōu)SVM分類器的流程圖。具體實(shí)施例方式本發(fā)明實(shí)施例視頻場(chǎng)景切換檢測(cè)裝置包括特征提取單元和場(chǎng)景切換檢測(cè)單元;其中,特征提取單元用于通過(guò)三維小波變換提取視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征VH;場(chǎng)景切換檢測(cè)單元用于根據(jù)所述V檢測(cè)場(chǎng)景切換。場(chǎng)景切換檢測(cè)單元可僅檢測(cè)場(chǎng)景突變,也可僅檢測(cè)場(chǎng)景緩變,還可既檢測(cè)場(chǎng)景突變又檢測(cè)場(chǎng)景緩變。當(dāng)場(chǎng)景切換檢測(cè)單元可檢測(cè)場(chǎng)景緩變時(shí),特征提取單元還需要提取視頻場(chǎng)景中各幀的另外兩個(gè)特征高頻子帶系數(shù)的總能量EH和低頻子帶系數(shù)的變化程度Dl。特征提取單元提取取視頻場(chǎng)景中各幀的特征時(shí),假設(shè)獲取當(dāng)前幀的特征,則可通過(guò)對(duì)當(dāng)前幀及其前2N-1幀共2W幀三維小波變換獲取當(dāng)前幀的特征,并依次通過(guò)2"幀三維小波變換獲取當(dāng)前幀的下一幀特征。其中,N=2,3,4...。本實(shí)施例中,當(dāng)僅實(shí)現(xiàn)場(chǎng)景突變檢測(cè)時(shí),視頻場(chǎng)景切換檢測(cè)裝置通過(guò)場(chǎng)景切換檢測(cè)單元利用視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征VH檢測(cè)場(chǎng)景突變,消除了亮度變化對(duì)場(chǎng)景突變檢測(cè)的影響,大大提高了視頻場(chǎng)景切換檢測(cè)裝置檢測(cè)場(chǎng)景突變的準(zhǔn)確率。當(dāng)僅實(shí)現(xiàn)場(chǎng)景緩變檢測(cè)時(shí),視頻場(chǎng)景切換檢測(cè)裝置利用小波變換獲得的低頻子帶系數(shù)的變化程度Vl檢測(cè)場(chǎng)景緩變,消除了運(yùn)動(dòng)幀對(duì)于場(chǎng)景緩變檢測(cè)的影響,大大提高了視頻場(chǎng)景切換檢測(cè)裝置檢測(cè)場(chǎng)景緩變的準(zhǔn)確率。圖1為本發(fā)明視頻場(chǎng)景切換檢測(cè)裝置實(shí)施例的結(jié)構(gòu)示意圖,本實(shí)施例中,視頻場(chǎng)景切換檢測(cè)裝置包括特征提取單元11、場(chǎng)景突變檢測(cè)單元12及場(chǎng)景緩變檢測(cè)單元13,既可檢測(cè)場(chǎng)景突變又可檢測(cè)場(chǎng)景緩變。假設(shè)N=3,特征提取單元11通過(guò)對(duì)當(dāng)前輸入第i幀及其之前的幀共連續(xù)8幀,進(jìn)行三維小波變換,統(tǒng)計(jì)變換后的低頻和高頻系數(shù)得到三個(gè)特征K"G)、j&(/)、從0')作為當(dāng)前第i幀的三個(gè)特征。場(chǎng)景突變檢測(cè)單元12利用其中的一個(gè)高頻特征F"(o進(jìn)行場(chǎng)景突變的檢測(cè),包括場(chǎng)景突變和閃光的檢測(cè)。場(chǎng)景緩變檢測(cè)單元13利用^W、Ew(0、AO')在支持向量機(jī)(SupportVectorMachines,SVM)分類器中對(duì)第i幀進(jìn)行分類,將視頻場(chǎng)景中的各幀分為場(chǎng)景緩變幀和非場(chǎng)景緩變幀。SVM分類器將視頻幀劃分成場(chǎng)景緩變和非場(chǎng)景H變幀,其中SVM分類器(ChristopherJ.C.Burges."ATutorialonSupportVectorMachinesforPatternRecognition".DataMiningandKnowledgeDiscovery,vol.2,pp:121—167,1998)的訓(xùn)練和分類原理是公知的。并且,場(chǎng)景緩變檢測(cè)單元13還可利用一個(gè)低頻特征久(0將場(chǎng)景緩變中的淡入淡出和消融加以區(qū)分。本實(shí)施例中,場(chǎng)景突變檢測(cè)單元12與場(chǎng)景緩變檢測(cè)單元13可分離執(zhí)行。基于三維小波變換的特征提取單元11和場(chǎng)景突變檢測(cè)單元12可單獨(dú)組成場(chǎng)景突變和閃光檢測(cè)系統(tǒng),這種情況下,特征提取單元11可只提取特征Vll;基于三維小波變換的特征提取單元11和場(chǎng)景緩變檢測(cè)單元13可單獨(dú)組成場(chǎng)景緩變檢測(cè)系統(tǒng)。本實(shí)施例中,視頻場(chǎng)景切換檢測(cè)裝置不僅通過(guò)利用小波變換獲得的高頻子帶系數(shù)的變化程度Vu檢測(cè)場(chǎng)景突變,能夠提高檢測(cè)場(chǎng)景突變的準(zhǔn)確率。并且,視頻場(chǎng)景切換檢測(cè)裝置還利用小波變換獲得的低頻子帶系數(shù)的變化程度Vd全測(cè)場(chǎng)景緩變,能夠提高檢測(cè)場(chǎng)景緩變的準(zhǔn)確率。圖2本發(fā)明視頻場(chǎng)景切換檢測(cè)裝置實(shí)施例中特征提取單元的結(jié)構(gòu)示意圖,特征提取單元11包括援存子單元21、小波變換構(gòu)造子單元22、小波變換子單元23、提取子單元24及遍歷子單元25。本實(shí)施例中,仍然假設(shè)N=3,其中,緩存子單元21用于緩存所述視頻場(chǎng)景中當(dāng)前幀的前2N-1幀即7幀圖像。小波變換構(gòu)造子單元22用于構(gòu)造23幀三維3級(jí)小波變換結(jié)構(gòu),以保證三維小波變換固定對(duì)當(dāng)前輸入第/幀及其前面連續(xù)7幀,也就是說(shuō)固定對(duì)從第/-7幀到第/幀的共8幀圖象進(jìn)行三維小波變換。小波變換子單元23用于對(duì)當(dāng)前第/幀及前23-1幀進(jìn)行三維3級(jí)小波變換,得到高頻子帶的空間系數(shù)值;即首先,小波變換子單元23對(duì)每一幀圖象進(jìn)行二維"9/7"小波變換,變換級(jí)數(shù)為N級(jí)即3級(jí);再對(duì)已進(jìn)行二維空間小波變換后的8幀圖象,在同一個(gè)位置上的點(diǎn)在時(shí)間軸上進(jìn)行一維的"Haar"小波變換,級(jí)數(shù)同二維"9/7"小波變換,也為3級(jí)。提取子單元24用于對(duì)所述高頻子帶的空間系數(shù)值進(jìn)行統(tǒng)計(jì),得到所述當(dāng)前幀的V(i);也就是說(shuō),對(duì)三維小波變換后的系數(shù)進(jìn)行統(tǒng)計(jì),得到三個(gè)特征,分別為^(0、&(0及A0')。這三個(gè)特征表示當(dāng)前輸入第/幀的三個(gè)特征,是當(dāng)前第/幀與其相鄰幀之間的相似性的度量。遍歷子單元25用于判斷所述視頻場(chǎng)景中各幀是否均通過(guò)小波變換得到V。在所述視頻場(chǎng)景中還存在幀未提取Vh的情況下,則小波變換子單元23接著對(duì)當(dāng)前第i幀的下一幀i+l及其前7幀共8個(gè)連續(xù)幀進(jìn)行小波變換,提取子單元24提取第i+l幀的高頻子帶系數(shù)的變化程度特征VH(i+l)。從而獲得了將所述視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征VH。其中,小波變換子單元23可包括兩維變換模塊及一維變換模塊,兩維變換模塊對(duì)8幀圖像進(jìn)行兩維9/7基3級(jí)小波變換;一維變換模塊對(duì)經(jīng)過(guò)兩維變換模塊變換的8幀進(jìn)行一維Haar基3級(jí)小波變換。上述實(shí)施例中,場(chǎng)景突變檢測(cè)單元12可包括差分處理子單元及突變檢測(cè)子單元。其中,差分處理子單元對(duì)所述VH進(jìn)行一階差分處理,得到=K(0-^O'-1)|;突變檢測(cè)子單元用于通過(guò)公式<formula>formulaseeoriginaldocumentpage15</formula>及公式<formula>formulaseeoriginaldocumentpage16</formula>判斷所述視頻場(chǎng)景中是否存在場(chǎng)景突變或多幀閃光;其中,所述T為Af膽D二^-門限值,可為800-1200;"+l;MaxD為diff(i+k)中的最大值;cut表示場(chǎng)景突變;flashlights表示2"幀內(nèi)存在多幀閃光。場(chǎng)景突變檢測(cè)單元還可包括一幀閃光子單元,用于判斷diff(i+k)是否滿足公式<formula>formulaseeoriginaldocumentpage16</formula>檢測(cè)所述視頻場(chǎng)景中是否存在一幀閃光。即,在滿足公式(1)、公式(2)及公式(3)的情況下,第i幀為閃光。本實(shí)施例中,視頻場(chǎng)景切換檢測(cè)裝置通過(guò)場(chǎng)景突變檢測(cè)單元不僅能夠準(zhǔn)確地檢測(cè)場(chǎng)景突變,還能夠檢測(cè)到多幀閃光、一幀閃光,進(jìn)一步提高了視頻場(chǎng)景切換檢測(cè)裝置的性能。上述可進(jìn)行場(chǎng)景緩變檢測(cè)的視頻場(chǎng)景切換檢測(cè)裝置實(shí)施例中,場(chǎng)景緩變檢測(cè)單元可包括SVM分類器訓(xùn)練子單元及檢測(cè)子單元。SVM分類器訓(xùn)練子單元用于利用所述Vu、En及K獲得最優(yōu)的SVM分類器。檢測(cè)子單元利用SVM分類器訓(xùn)練子單元獲取的最優(yōu)SVM分類器對(duì)所述視頻場(chǎng)景中的各幀進(jìn)行場(chǎng)景緩變檢測(cè),得到檢測(cè)結(jié)果<formula>formulaseeoriginaldocumentpage17</formula>其中,/。代表第"貞進(jìn)行場(chǎng)景緩變檢測(cè)的結(jié)果,yes表示第i幀為場(chǎng)景緩變,no表示第i幀不是場(chǎng)景緩變。場(chǎng)景緩變檢測(cè)單元13還可進(jìn)一步包括濾波子單元及種類檢測(cè)子單元,判斷場(chǎng)景緩變屬于淡入淡出還是消融。濾波子單元對(duì)所述檢測(cè)結(jié)果進(jìn)行半徑為N的中值濾波,濾除誤檢幀,得到從時(shí)刻^到時(shí)刻t2的一段場(chǎng)景緩變的持續(xù)幀;種類檢測(cè)子單元通過(guò)公式(i/wo/ve,min(Z^(/))〉r"/ade,min(D丄(/))<判斷對(duì)得到的所述持續(xù)幀的場(chǎng)景緩變種類;其中,S(Lt2)表示從所述持續(xù)幀為場(chǎng)景緩變,dissolve表示消融,fade表示淡入淡出,T「d為門限值,可取0.8~0.95。上述實(shí)施例中,視頻場(chǎng)景切換檢測(cè)裝置通過(guò)場(chǎng)景緩變檢測(cè)單元不僅準(zhǔn)確地檢測(cè)場(chǎng)景緩變,還能夠區(qū)分場(chǎng)景緩變中的淡入淡出和消融,更進(jìn)一步的提高了視頻場(chǎng)景切換檢測(cè)裝置的檢測(cè)性能。本發(fā)明視頻場(chǎng)景切換檢測(cè)方法實(shí)施例可通過(guò)上述裝置實(shí)施例實(shí)現(xiàn),包括通過(guò)三維小波變換提取視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征Vu;根據(jù)所述Vu檢測(cè)場(chǎng)景切換。其中,檢測(cè)場(chǎng)景切換可僅檢測(cè)場(chǎng)景突變,也可僅檢測(cè)場(chǎng)景緩變,還可既檢測(cè)場(chǎng)景突變又檢測(cè)場(chǎng)景緩變。檢測(cè)場(chǎng)景緩變的情況下,還需要提取各幀的Eu、D"圖3為本發(fā)明視頻場(chǎng)景切換;險(xiǎn)測(cè)方法實(shí)施例的流程圖。本實(shí)施例既一僉測(cè)場(chǎng)景突變又檢測(cè)場(chǎng)景緩變,包括步驟31、特征提取單元11提取待檢測(cè)的視頻場(chǎng)景中各幀的三個(gè)特征^、£、A。如圖4所示,具體可包括步驟41、緩存與第i幀連續(xù)的前2N-1幀,當(dāng)N=3時(shí),緩存前7幀;步驟42、構(gòu)造2N幀三維小波變換結(jié)構(gòu),步驟43、執(zhí)行三維小波變換得到高、低頻子帶的系數(shù)值,以8幀三維小波變換為例,變換后的結(jié)構(gòu)示意圖如圖5所示。其中,^,"X,^)代表小波變換后在時(shí)間方向上第A個(gè)、空間方向第/個(gè)子帶在位置",力的系數(shù)值。e"(X,^、;/",力、、/",力、、/",力為高頻子帶系數(shù)圖象。步驟44、提取子單元24分別對(duì)圖4中高頻和低頻的子帶進(jìn)行統(tǒng)計(jì),得到特征^(z')、£"(0、AO')。這三個(gè)代表當(dāng)前輸入第z'幀的三個(gè)特征(其中^8),是當(dāng)前第z幀與其相鄰幀之間的相似性的度量。其中,高頻子帶系數(shù)的變化程度F"。的計(jì)算方法為<formula>formulaseeoriginaldocumentpage18</formula>高頻子帶系數(shù)的總能量&(0的計(jì)算方法為<formula>formulaseeoriginaldocumentpage18</formula>低頻子帶系數(shù)的變化程度DJz')的計(jì)算方法為ZZ卜i,i(x,力卜ZS|c2,iO,力步驟45、遍歷子單元25判斷整個(gè)視頻序列是否都完成了三維小波特征提取,若否,則輸入下一幀,執(zhí)行步驟43;若是,則結(jié)束特征提取。步驟場(chǎng)景突變檢測(cè)單元12根據(jù)高頻子帶系數(shù)的變化程度^(0來(lái)檢測(cè)場(chǎng)景突變和閃光。首先,對(duì)相鄰幀的特征「"按照如下公式得到一階差分處理得到<formula>formulaseeoriginaldocumentpage19</formula>然后,判斷"場(chǎng)景突變"或"短時(shí)間內(nèi)有多幀閃光",如滿足以下兩個(gè)條件<formula>formulaseeoriginaldocumentpage19</formula>2)<formula>formulaseeoriginaldocumentpage19</formula>本實(shí)施例中,T取1000;如果"=2〃-1,則第/幀為"場(chǎng)景突變";如果"〉2W-1,則第/幀到第/+"幀之內(nèi)發(fā)生了"多幀閃光,,。還可進(jìn)一步判斷"短時(shí)間內(nèi)只有一幀閃光",即判斷詢^o'+"是否滿足以下三個(gè)條件1)<formula>formulaseeoriginaldocumentpage19</formula>2)<formula>formulaseeoriginaldocumentpage19</formula>3)<formula>formulaseeoriginaldocumentpage19</formula>若同時(shí)滿足,則第/幀為閃光。步驟33、場(chǎng)景緩變檢測(cè)單元13檢測(cè)場(chǎng)景緩變。首先獲得最優(yōu)SVM分類器,如圖6所示,獲取過(guò)程包括步驟61、創(chuàng)建初始訓(xùn)練數(shù)據(jù),選取一定數(shù)目的場(chǎng)景緩變視頻片段中的幀,分別作為正面樣本(+1類數(shù)據(jù))和非場(chǎng)景緩變幀作為負(fù)面樣本(-l類數(shù)據(jù))。步驟62、訓(xùn)練SVM分類器的參數(shù),分別對(duì)上述所有的預(yù)選訓(xùn)練幀提取三維小波變換后的三個(gè)特征VH、Eh及Dl,用來(lái)訓(xùn)練SVM分類器。步驟63、利用SVM分類器分類其它數(shù)據(jù),如選取其它負(fù)面樣本(只含有-1類數(shù)據(jù)),利用已經(jīng)訓(xùn)練好的SVM分類器對(duì)其進(jìn)行分類;步驟64、判斷分類結(jié)果是否有+1類數(shù)據(jù),若判斷的結(jié)果有+1類數(shù)據(jù),則判斷錯(cuò)誤,執(zhí)行步驟65;若判斷的結(jié)果都是-1類數(shù)據(jù),則判斷正確,執(zhí)行步驟66。步驟65、如果判斷錯(cuò)誤,將被判斷錯(cuò)誤的幀作為負(fù)面樣本(-1類數(shù)據(jù))填充到原來(lái)的負(fù)面樣本中,作為新的負(fù)面樣本,執(zhí)行步驟62,即,再執(zhí)行步驟63,對(duì)SVM分類器的參數(shù)進(jìn)行重新分類。再選取其他樣本進(jìn)行如此循環(huán),直到?jīng)]有錯(cuò)誤分類的情況發(fā)生。步驟66、如判斷正確,則得到了最優(yōu)的場(chǎng)景緩變檢測(cè)的SVM分類器。然后,用獲取的最優(yōu)SVM分類器檢測(cè)各待檢測(cè)的幀是否為場(chǎng)景緩變,得到檢測(cè)結(jié)果。若進(jìn)一步判斷檢測(cè)結(jié)果為場(chǎng)景緩變的幀是淡入淡出還是消融,場(chǎng)景緩變才企測(cè)還可進(jìn)一步包括對(duì)整個(gè)視頻序列中場(chǎng)景緩變幀的判斷結(jié)果,G)序列進(jìn)行半徑為N的中值濾波,通過(guò)中值濾波可以將誤檢幀等噪聲濾除,得到場(chǎng)景緩變的一段持續(xù)幀。利用低頻子帶系數(shù)特征"力')來(lái)分辨此段場(chǎng)景緩變是淡入淡出(Fade)或者消融(Dissolve)。判斷任何一段場(chǎng)景緩變持續(xù)幀從f'到^時(shí)刻是Fade或者Dissolve的方法^口下由上式可以看出,若在一段場(chǎng)景緩變的持續(xù)幀中所有的"力:b^,則此場(chǎng)景緩變是由消融引起的;若在一段場(chǎng)景緩變持續(xù)幀中有一個(gè)D力')〈;',則此場(chǎng)景緩變是由淡入淡出引起的。其中^可為Q.93。上述裝置及方法實(shí)施例,通過(guò)基于小波變換對(duì)場(chǎng)景切換進(jìn)行檢測(cè),大tfeo/ve,min(A(/))>5Je,min(I\"))<T",大提高了檢測(cè)場(chǎng)景切換的準(zhǔn)確率。為了詳細(xì)說(shuō)明上述裝置及方法實(shí)施例檢測(cè)視頻場(chǎng)景突變和閃光檢測(cè)的優(yōu)越性,發(fā)明人用上述裝置及方法實(shí)施例中的技術(shù)方案對(duì)兩個(gè)業(yè)界7>知的#見(jiàn)頻序列newsl序列和culture序列作了抬r測(cè)試-瞼。其中,newsl序列共57461幀,包含了大量的突變和閃光;culture序列共44145幀。試驗(yàn)結(jié)果如表3所示。表3基于三維小波變換的視頻突變和和閃光檢測(cè)的實(shí)驗(yàn)結(jié)果<table>tableseeoriginaldocumentpage21</column></row><table>由表3可以看出,上述可進(jìn)行場(chǎng)景突變檢測(cè)的裝置及方法實(shí)施例消除了閃光給場(chǎng)景突變檢測(cè)帶來(lái)的誤檢,對(duì)突變和閃光的檢測(cè)都達(dá)到了比較好的效果。其中,乂是正確檢測(cè)數(shù)目,7人是漏檢測(cè)數(shù)目,#/是錯(cuò)誤檢測(cè)數(shù)目,查全率&和準(zhǔn)確率P"的定義如下為了詳細(xì)說(shuō)明上述裝置及方法實(shí)施例檢測(cè)視頻場(chǎng)景緩變檢測(cè)的優(yōu)越性,發(fā)明人用上述裝置及方法實(shí)施例中的技術(shù)方案對(duì)culture序列以及另一個(gè)業(yè)界公知的緩變場(chǎng)景比較多的視頻序列即eyeexam序列做了檢測(cè)試驗(yàn)。其中,eyeexam序列共40735幀。試驗(yàn)結(jié)果如表4所示。表4基于三維小波變換的緩變檢測(cè)的實(shí)驗(yàn)結(jié)果<table>tableseeoriginaldocumentpage22</column></row><table>由表3可以看出,上述可進(jìn)行場(chǎng)景緩變檢測(cè)的裝置及方法實(shí)施例消除了運(yùn)動(dòng)幀給場(chǎng)景突變檢測(cè)帶來(lái)的誤檢,檢測(cè)的準(zhǔn)確率達(dá)到了80°/。以上,大大提高了場(chǎng)景緩變檢測(cè)的精確性。本領(lǐng)域普通技術(shù)人員可以理解實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過(guò)程序指令相關(guān)的硬件來(lái)完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括R0M、RAM、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。最后應(yīng)說(shuō)明的是以上實(shí)施例僅用以說(shuō)明本發(fā)明的技術(shù)方案,而非對(duì)其限制;盡管參照前述實(shí)施例對(duì)本發(fā)明進(jìn)行了詳細(xì)的說(shuō)明,本領(lǐng)域的普通技術(shù)人員應(yīng)當(dāng)理解其依然可以對(duì)前述各實(shí)施例所記載的技術(shù)方案進(jìn)行修改,或者對(duì)其中部分技術(shù)特征進(jìn)行等同替換;而這些修改或者替換,并不使相應(yīng)技術(shù)方案的本質(zhì)脫離本發(fā)明各實(shí)施例技術(shù)方案的精神和范圍。權(quán)利要求1、一種視頻場(chǎng)景切換檢測(cè)裝置,其特征在于,包括:特征提取單元,用于通過(guò)三維小波變換提取視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征VH;場(chǎng)景切換檢測(cè)單元,用于根據(jù)所述VH檢測(cè)場(chǎng)景切換。2、根據(jù)權(quán)利要求1所述的視頻場(chǎng)景切換檢測(cè)裝置,其特征在于,所述特征提取單元包括緩存子單元,用于緩存所述視頻場(chǎng)景中當(dāng)前第i幀的前2tl幀圖像;小波變換構(gòu)造子單元,用于構(gòu)造2^貞三維N級(jí)小波變換結(jié)構(gòu);小波變換子單元,用于對(duì)所述當(dāng)前幀及前2N-1幀進(jìn)行三維N級(jí)小波變換,得到高頻子帶的空間系數(shù)值;提取子單元,用于對(duì)所述高頻子帶的空間系數(shù)值進(jìn)行統(tǒng)計(jì),得到所述當(dāng)前第i幀的高頻子帶系數(shù)的變化程度特征VH(i);遍歷子單元,用于判斷所述視頻場(chǎng)景中各幀是否均通過(guò)小波變換得到VH;所述小波變換子單元及提取子單元還用于在所述視頻場(chǎng)景中還存在幀未提取Vh的情況下,提取所述當(dāng)前第i幀的下一幀第i+l幀的高頻子帶系數(shù)的變化程度特征VH(i+l)。3、根據(jù)權(quán)利要求2所述的視頻場(chǎng)景切換檢測(cè)裝置,其特征在于,所述小波變換子單元包括兩維變換模塊,用于對(duì)所述當(dāng)前幀及前2N-1幀分別進(jìn)行兩維9/7基N級(jí)小波變換;一維變換模塊,用于對(duì)所述兩維變換模塊變換后的幀在同空間位置的點(diǎn)進(jìn)行時(shí)間軸上的一維Haar基N級(jí)小波變換,得到所述高頻子帶的空間系數(shù)值。4、根據(jù)權(quán)利要求1-3中任一項(xiàng)所述的視頻場(chǎng)景切換檢測(cè)裝置,其特征在于,所述場(chǎng)景切換;險(xiǎn)測(cè)單元為場(chǎng)景突變;f企測(cè)單元和/或場(chǎng)景緩變^r測(cè)單元;所述場(chǎng)景突變檢測(cè)單元用于根據(jù)所述VH檢測(cè)場(chǎng)景突變或閃光;所述場(chǎng)景緩變檢測(cè)單元用于根據(jù)所述Vn檢測(cè)場(chǎng)景緩變。5、根據(jù)權(quán)利要求4所述的視頻場(chǎng)景切換檢測(cè)裝置,其特征在于,所述場(chǎng)景突變>^測(cè)單元包括差分處理子單元,用于對(duì)所述VH進(jìn)行一階差分處理,得到柳H^(0-^(z.-l)l;突變檢測(cè)子單元,用于通過(guò)公式鄉(xiāng)(/+*)>7\(^二0,1,2,...,")<formula>formulaseeoriginaldocumentpage3</formula>判斷所述視頻場(chǎng)景中是否存在場(chǎng)景突變或多幀閃光;其中,所述T為門限值;"+l;MaxD為diff(i+k)中的最大值;cut表示場(chǎng)景突變;flashlights表示2"幀內(nèi)存在多幀閃光。6、根據(jù)權(quán)利要求5所述的視頻場(chǎng)景切換檢測(cè)裝置,其特征在于,所述T的取值范圍為800~1200。7、根據(jù)權(quán)利要求5所述的視頻場(chǎng)景切換檢測(cè)裝置,其特征在于,所述場(chǎng)景突變^r測(cè)單元還包括一幀閃光子單元,用于判斷diff(i+k)是否滿足公式<formula>formulaseeoriginaldocumentpage4</formula>及公式檢測(cè)所述視頻場(chǎng)景中2"幀內(nèi)是否存在一幀閃光。8、根據(jù)權(quán)利要求4所述的視頻場(chǎng)景切換檢測(cè)裝置,其特征在于,所述場(chǎng)景切換檢測(cè)單元包括所述場(chǎng)景緩變檢測(cè)單元;所述特征提取單元還用于通過(guò)三維小波變換提取所述視頻場(chǎng)景中各幀的高頻子帶系數(shù)總能量E和低頻子帶系數(shù)的變化程度Dl;所述場(chǎng)景緩變檢測(cè)單元包括支持向量機(jī)SVM分類器訓(xùn)練子單元,用于通過(guò)更新樣本庫(kù)得到最優(yōu)的SVM分類器;檢測(cè)子單元,用于通過(guò)利用所述最優(yōu)的SVM分類器對(duì)所述V、En、A分類,檢測(cè)場(chǎng)景緩變,得到檢測(cè)結(jié)果。9、根據(jù)權(quán)利要求8所述的視頻場(chǎng)景切換檢測(cè)裝置,其特征在于,所述特征提取單元還用于通過(guò)構(gòu)造8幀三維小波變換結(jié)構(gòu)獲取所述En、D"10、根據(jù)權(quán)利要求8所述的視頻場(chǎng)景切換檢測(cè)裝置,其特征在于,所述場(chǎng)景緩變檢測(cè)單元還包括濾波子單元,用于對(duì)所述檢測(cè)結(jié)果進(jìn)行半徑為N的中值濾波,得到從時(shí)刻t,到時(shí)刻t2的一段場(chǎng)景緩變的持續(xù)幀;種類檢測(cè)子單元,用于通過(guò)公式<formula>formulaseeoriginaldocumentpage4</formula>判斷對(duì)得到的所述持續(xù)幀的場(chǎng)景緩變種類;其中,S(t:t2)表示從所述持續(xù)幀為場(chǎng)景緩變,dissolve表示消融,fade表示淡入淡出,匸為門限值。11、根據(jù)權(quán)利要求10所述的視頻場(chǎng)景切換檢測(cè)裝置,其特征在于,所述Tfd的取值范圍為0.8~0.95。12、一種視頻場(chǎng)景切換檢測(cè)方法,其特征在于,包括通過(guò)三維小波變換提取視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征VH;根據(jù)所述VK檢測(cè)場(chǎng)景切換。13、根據(jù)權(quán)利要求12所述的視頻場(chǎng)景切換檢測(cè)方法,其特征在于,通過(guò)三維小波變換提取視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征Vh包括緩存所述視頻場(chǎng)景中當(dāng)前第i幀的前2W-l幀圖像;構(gòu)造2^貞三維N級(jí)小波變換結(jié)構(gòu);對(duì)所述當(dāng)前幀及前2N-1幀進(jìn)行三維N級(jí)小波變換,得到高頻子帶的空間系數(shù)值;對(duì)所述高頻子帶的空間系數(shù)值進(jìn)行統(tǒng)計(jì),得到所述當(dāng)前幀的VH(i);判斷所述視頻場(chǎng)景中各幀是否均通過(guò)小波變換得到VK;在所述視頻場(chǎng)景中還存在幀未提取Vh的情況下,繼續(xù)對(duì)第i+l幀進(jìn)行三維N級(jí)小波變換,并提取所述第i+l幀的V(i+1),直至所述視頻場(chǎng)景中的所有幀均通過(guò)小波變換得到各自的V。14、根據(jù)權(quán)利要求13所述的視頻場(chǎng)景切換檢測(cè)方法,其特征在于,對(duì)所述當(dāng)前幀及前2N-1幀進(jìn)行三維N級(jí)小波變換,得到高頻子帶的空間系數(shù)值包括對(duì)所述當(dāng)前幀及前2N-1幀分別進(jìn)行兩維9/7基N級(jí)小波變換;對(duì)變換后的幀在同空間位置的點(diǎn)進(jìn)行時(shí)間軸上的一維Haar基N級(jí)小波變換,得到所述高頻子帶的空間系數(shù)值。15、根據(jù)權(quán)利要求12-14中任一項(xiàng)所述的視頻場(chǎng)景切換檢測(cè)方法,其特征在于,根據(jù)所述Vu檢測(cè)場(chǎng)景切換包括場(chǎng)景突變檢測(cè)和/或場(chǎng)景緩變檢測(cè);所述場(chǎng)景突變檢測(cè)包括根據(jù)所述VH檢測(cè)場(chǎng)景突變或閃光;所述場(chǎng)景緩變檢測(cè)包括根據(jù)所述VH檢測(cè)場(chǎng)景緩變。16、根據(jù)權(quán)利要求15所述的視頻場(chǎng)景切換檢測(cè)方法,其特征在于,根據(jù)所述VH檢測(cè)場(chǎng)景突變或閃光包括對(duì)所述VH進(jìn)行一階差分處理,得到=h(/)-Fw(/-1)|;+A:)>r,(A=0,1,2,...,Mea"D八,->0.7及公式c《^w=_1yZay緒g/^;i/"w〉—1判斷所述視頻場(chǎng)景中是否存在場(chǎng)景突變或多幀閃光;其中,所述T為似函/)=^-門限值;"+l;MaxD為diff(i+k)中的最大值;cut表示場(chǎng)景突變;flashlights表示2"幀內(nèi)存在多幀閃光。17、根據(jù)權(quán)利要求16所述的視頻場(chǎng)景切換檢測(cè)方法,其特征在于,所述T的:f又值范圍為800-1200。18、根據(jù)權(quán)利要求16所述的視頻場(chǎng)景切換檢測(cè)方法,其特征在于,根據(jù)所述VH檢測(cè)場(chǎng)景突變或閃光還包括判斷diff(i+k)是否滿足公式柳""〉r,(々二o,2w)柳/+&)<7\(&=12"—1)及公式<formula>formulaseeoriginaldocumentpage7</formula>檢測(cè)所述視頻場(chǎng)景中2"幀內(nèi)是否存在一幀閃光。19、根據(jù)權(quán)利要求15所述的視頻場(chǎng)景切換檢測(cè)方法,其特征在于,根據(jù)所述VH檢測(cè)場(chǎng)景切換包括所述場(chǎng)景緩變檢測(cè);通過(guò)三維小波變換提取視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征VH還包括通過(guò)三維小波變換提取所述視頻場(chǎng)景中各幀的高頻子帶系數(shù)總能量EH和低頻子帶系數(shù)的變化程度Dl;根據(jù)所述Vn檢測(cè)場(chǎng)景緩變包括通過(guò)更新樣本庫(kù)得到最優(yōu)的SVM分類器;通過(guò)利用所述最優(yōu)的SVM分類器對(duì)所述V、EH及D^分類,檢測(cè)場(chǎng)景緩變,得到檢測(cè)結(jié)果。20、根據(jù)權(quán)利要求19所述的視頻場(chǎng)景切換檢測(cè)方法,其特征在于,通過(guò)更新樣本庫(kù)得到最優(yōu)的SVM分類器包括步驟1、通過(guò)三維小波變換提取選取樣本的V、Ei'及D。用所述選取樣本的V、E"及Dt訓(xùn)練SVM分類器;步驟2、用經(jīng)過(guò)訓(xùn)練的SVM分類器判斷選取的樣本;步驟3、判斷錯(cuò)誤的情況下,將所述選取的樣本填充到SVM分類器的樣本庫(kù)中;步驟4、利用經(jīng)過(guò)填充的樣本庫(kù)對(duì)SVM分類器的參數(shù)進(jìn)行重新分類;步驟5、用經(jīng)過(guò)重新分類的SVM分類器判斷再次選取的樣本;循環(huán)執(zhí)行所述步驟3、步驟4、步驟5,直至SVM分類器判斷正確,得到所述最優(yōu)的SVM分類器。21、根據(jù)權(quán)利要求19所述的視頻場(chǎng)景切換檢測(cè)方法,其特征在于,通過(guò)三維小波變換提取所述視頻場(chǎng)景中各幀的高頻子帶系數(shù)總能量E和低頻子帶系數(shù)的變化程度K還包括通過(guò)構(gòu)造8幀三維小波變換結(jié)構(gòu)獲取所述Vh、eh、d"22、根據(jù)權(quán)利要求19所述的視頻場(chǎng)景切換檢測(cè)方法,其特征在于,根據(jù)所述VH檢測(cè)場(chǎng)景緩變還包括對(duì)所述檢測(cè)結(jié)果進(jìn)行半徑為n的中值濾波,得到從時(shí)刻L到時(shí)刻t2的一段場(chǎng)景緩變的持續(xù)幀;通過(guò)公式<formula>formulaseeoriginaldocumentpage8</formula>判斷對(duì)得到的所述持續(xù)幀的場(chǎng)景緩變種類;其中,S(t,t2)表示從所述持續(xù)幀為場(chǎng)景緩變;dissolve表示消融,fade表示淡入淡出,L為門限值。23、根據(jù)權(quán)利要求22所述的視頻場(chǎng)景切換檢測(cè)方法,其特征在于,所述Tfd的取值范圍為0.8~0.95。全文摘要本發(fā)明涉及一種視頻場(chǎng)景切換檢測(cè)裝置及方法,裝置包括特征提取單元及場(chǎng)景切換檢測(cè)單元;方法包括通過(guò)三維小波變換提取視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征V<sub>H</sub>;根據(jù)所述V<sub>H</sub>檢測(cè)場(chǎng)景切換。通過(guò)利用視頻場(chǎng)景中各幀的高頻子帶系數(shù)的變化程度特征V<sub>H</sub>檢測(cè)場(chǎng)景切換,消除了亮度變化對(duì)場(chǎng)景切換檢測(cè)的影響,大大提高了檢測(cè)場(chǎng)景切換的準(zhǔn)確率。文檔編號(hào)G06K9/62GK101382998SQ20081011853公開(kāi)日2009年3月11日申請(qǐng)日期2008年8月18日優(yōu)先權(quán)日2008年8月18日發(fā)明者劉貴忠,智李,楊錦春,錢學(xué)明申請(qǐng)人:華為技術(shù)有限公司;西安交通大學(xué)