基于視頻的鐵路線小目標(biāo)檢測(cè)方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供了一種基于視頻的鐵路線小目標(biāo)檢測(cè)方法及系統(tǒng),通過在視頻檢測(cè)中采用神經(jīng)元模擬方式,進(jìn)一步增加了基于幀級(jí)的前景分割,從而應(yīng)對(duì)因劇烈光照變化而造成的大面積鬼影的情況。當(dāng)場(chǎng)景中有多于占比閾值的像素被判定為前景,則認(rèn)為基于顏色前景分割獲得的前景已經(jīng)不再可靠,轉(zhuǎn)而采用梯度特征值進(jìn)行分割便能夠獲得前景的輪廓,從而確保輪廓內(nèi)的像素填充即可獲得完整的前景。
【專利說明】基于視頻的鐵路線小目標(biāo)檢測(cè)方法及系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及視頻檢測(cè)處理方法,尤其是指一種基于視頻的鐵路線小目標(biāo)檢測(cè)方法及系統(tǒng)。
【背景技術(shù)】
[0002]隨著視頻檢測(cè)技術(shù)的發(fā)展,其在時(shí)下各領(lǐng)域中得到了廣泛應(yīng)用。而基于視頻的鐵路線目標(biāo)檢測(cè)在發(fā)現(xiàn)對(duì)列車運(yùn)行存在危害的目標(biāo)和及時(shí)偵測(cè)穿越鐵道線的行人以避免人員傷亡和事故具有重要的意義。
[0003]然而,現(xiàn)有基于視頻的鐵路線目標(biāo)檢測(cè)技術(shù)的特點(diǎn)是檢測(cè)視場(chǎng)大,但視場(chǎng)中真正需要檢測(cè)的目標(biāo)卻很小,由于大視場(chǎng)中系統(tǒng)大小的目標(biāo)存在不同距離上的成像差異大的特點(diǎn);同時(shí)行人這樣的目標(biāo)往往表現(xiàn)為小目標(biāo);從而一般的目標(biāo)檢測(cè)難以取得較好檢測(cè)效果。因此對(duì)于鐵路線的視頻檢測(cè)而言,小目標(biāo)檢測(cè)是視頻檢測(cè)的重大難點(diǎn)。
【發(fā)明內(nèi)容】
[0004]本發(fā)明所要解決的技術(shù)問題是:
[0005]為了解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為:一種基于視頻的鐵路線小目標(biāo)檢測(cè)方法,包括步驟,
[0006]SI)輸入視頻的第一幀圖像;
[0007]S2)建模,為視頻的幀圖像中每個(gè)像素建立nXn個(gè)神經(jīng)元,得到幀圖像的MAP結(jié)構(gòu),而后將幀圖像中像素均作為背景分布的由神經(jīng)元集合中的神經(jīng)元進(jìn)行模擬;
[0008]S3)輸入視頻的下一幀圖像;
[0009]S4)遍歷當(dāng)前幀圖像,對(duì)幀圖像中的每一個(gè)像素進(jìn)行基于顏色的前景分割;
[0010]S5)判斷當(dāng)前幀圖像中,屬于前景的像素占比是否大于占比閾值。是則執(zhí)行步驟S6,否則執(zhí)行步驟S7 ;
[0011]S6)利用場(chǎng)景梯度值重新分割前景
[0012]S7)輸出標(biāo)出前景的圖像,返回步驟S3。
[0013]本發(fā)明的有益效果在于:在視頻檢測(cè)中增加了基于幀級(jí)的前景分割,從而應(yīng)對(duì)因劇烈光照變化而造成的大面積鬼影的情況。通過增加相應(yīng)判斷步驟,當(dāng)場(chǎng)景中有多于占比閾值的像素被判定為前景,則認(rèn)為基于顏色前景分割獲得的前景已經(jīng)不再可靠,轉(zhuǎn)而采用梯度特征值進(jìn)行分割便能夠獲得前景的輪廓,從而確保輪廓內(nèi)的像素填充即可獲得完整的前景。
【專利附圖】
【附圖說明】
[0014]下面結(jié)合附圖詳述本發(fā)明的具體結(jié)構(gòu)
[0015]圖1為本發(fā)明方法的流程圖;
[0016]圖2為本發(fā)明方法的顏色前景分割的流程圖;[0017]圖3(a)為本發(fā)明的Sobel算子的垂直方向算子;
[0018]圖3(b)為本發(fā)明的Sobel算子的水平方向算子。
【具體實(shí)施方式】
[0019]為詳細(xì)說明本發(fā)明的技術(shù)內(nèi)容、構(gòu)造特征、所實(shí)現(xiàn)目的及效果,以下結(jié)合實(shí)施方式并配合附圖詳予說明。
[0020]本發(fā)明最關(guān)鍵的構(gòu)思在于:在視頻檢測(cè)中增加了基于幀級(jí)的前景分割,從而應(yīng)對(duì)因劇烈光照變化而造成的大面積鬼影的情況。通過增加相應(yīng)判斷步驟,當(dāng)場(chǎng)景中有多于占比閾值的像素被判定為前景,則認(rèn)為基于顏色前景分割獲得的前景已經(jīng)不再可靠,但由于開關(guān)燈所引起光照變化是連續(xù)的,因此這種情況并不會(huì)造成場(chǎng)景中梯度值的明顯變化。因此此時(shí)采用梯度特征值進(jìn)行分割便能夠獲得前景的輪廓。最后將輪廓內(nèi)的像素填充即可獲得完整的如景。
[0021]此外,在基于顏色前景分割涉及了自學(xué)習(xí)、自適應(yīng)的控制流程,從而確保視頻的前景、背景的準(zhǔn)確識(shí)別。
[0022]請(qǐng)參閱圖1,一種基于視頻的鐵路線小目標(biāo)檢測(cè)方法,包括步驟,
[0023]SI)輸入視頻的第一幀圖像。
[0024]S2)建模,為視頻的幀圖像中每個(gè)像素建立nXn個(gè)神經(jīng)元,得到幀圖像的MAP結(jié)構(gòu),而后將幀圖像中像素均作為背景分布的由神經(jīng)元集合中的神經(jīng)元進(jìn)行模擬。
[0025]此處的nXn中,η最佳取單數(shù),由此可使得視頻幀所有像素的神經(jīng)元組成一個(gè)單整數(shù)的平方倍于原視頻幀大小的MAP結(jié)構(gòu),便于運(yùn)算。
[0026]而神經(jīng)元進(jìn)行模擬則除了會(huì)將視頻幀像素的信息映射外,還會(huì)進(jìn)行神經(jīng)元控制參數(shù)和相關(guān)標(biāo)記的建立。
[0027]S3)輸入視頻的下一幀圖像。
[0028]S4)遍歷當(dāng)前幀圖像,對(duì)幀圖像中的每一個(gè)像素進(jìn)行基于顏色的前景分割。
[0029]S5)判斷當(dāng)前幀圖像中,屬于前景的像素占比是否大于占比閾值。是則執(zhí)行步驟S6,否則執(zhí)行步驟S7。
[0030]S6)利用場(chǎng)景梯度值重新分割前景。
[0031]S7)輸出標(biāo)出前景的圖像,返回步驟S3。
[0032]從上述描述可知,本發(fā)明的有益效果在于:在視頻檢測(cè)中增加了基于幀級(jí)的前景分割,從而應(yīng)對(duì)因劇烈光照變化而造成的大面積鬼影(例如室內(nèi)開關(guān)燈情況中尤為常見)的情況。通過增加相應(yīng)判斷步驟,當(dāng)場(chǎng)景中有多于占比閾值的像素被判定為前景,則認(rèn)為基于顏色分割獲得的前景已經(jīng)不再可靠,但由于開關(guān)燈所引起光照變化是連續(xù)的,因此這種情況并不會(huì)造成場(chǎng)景中梯度值的明顯變化。因此此時(shí)采用梯度特征值進(jìn)行分割便能夠獲得前景的輪廓。最后將輪廓內(nèi)的像素填充即可獲得完整的前景。
[0033]實(shí)施例1:
[0034]上述占比閾值取50%,由此當(dāng)場(chǎng)景中有50%以上的像素被判定為前景,則認(rèn)為基于顏色分割獲得的前景已經(jīng)不再可靠,轉(zhuǎn)而采用梯度特征值進(jìn)行分割便能夠獲得前景的輪廓。
[0035]實(shí)施例2:[0036]如圖2所示,所述步驟S4具體包括步驟,
[0037]S41)、輸入當(dāng)前幀中第一個(gè)像素;
[0038]S42)、在神經(jīng)元集合中搜索是否有與之距離小于閾值的神經(jīng)元,若不存在則轉(zhuǎn)到步驟S43 ;存在則選出該神經(jīng)元作為最佳匹配神經(jīng)元后轉(zhuǎn)到步驟S45 ;
[0039]S43)、將該像素標(biāo)出為前景,而后轉(zhuǎn)到步驟S44 ;
[0040]S44)、輸入下一個(gè)像素后轉(zhuǎn)回步驟S42 ;
[0041]S45)、降低該最佳匹配神經(jīng)元的更新率;
[0042]在上述S42步驟中,如果待測(cè)像素能夠在與之對(duì)應(yīng)的神經(jīng)元集合中尋找到最佳匹配神經(jīng)元,則本步驟中將調(diào)整該最佳匹配神經(jīng)元的更新率控制器,使更新率控制器的值增大。根據(jù)最佳匹配神經(jīng)元更新率控制器的變化,動(dòng)態(tài)地調(diào)整最佳匹配神經(jīng)元的更新率,使得當(dāng)一個(gè)神經(jīng)元持續(xù)作為最佳匹配神經(jīng)元時(shí),其更新率也會(huì)隨之減小。與此同時(shí),控制神經(jīng)元的變化速率,使得當(dāng)神經(jīng)元與當(dāng)前像素的擬合度越高,相應(yīng)的更新率控制器的值增長(zhǎng)得越快,神經(jīng)元的收斂也越快,反之,如果神經(jīng)元不能很好擬合當(dāng)前像素,其更新率控制器的增長(zhǎng)將趨于緩慢。通過這種調(diào)節(jié)方式,一個(gè)收斂的神經(jīng)元將逐漸進(jìn)入穩(wěn)定狀態(tài)。
[0043]進(jìn)一步的,在一實(shí)施例中,為了防止神經(jīng)元更新率不斷下降使得神經(jīng)元的更新陷入完全停滯狀態(tài),可用一個(gè)動(dòng)態(tài)的更新率為神經(jīng)元的更新率規(guī)定了下界,這個(gè)動(dòng)態(tài)更新率和神經(jīng)元的更新率一同控制更新模型的學(xué)習(xí)能力。
[0044]S46)、計(jì)算神經(jīng)元集合內(nèi)各神經(jīng)元的鬼影參數(shù),所述鬼影參數(shù)包括神經(jīng)元在其鄰域內(nèi)的權(quán)值比重與局部梯度變化量。
[0045]若原有背景從場(chǎng)景中離開,則過期的神經(jīng)元的更新率控制器會(huì)被重置,從而獲得較大的更新率,這有助于神經(jīng)元主動(dòng)地從鄰域已經(jīng)收斂的神經(jīng)元中獲取上下文,并隨著更新率控制器的不斷調(diào)整重新到達(dá)收斂狀態(tài)。
[0046]在更新的過程中,由兩個(gè)參數(shù)控制神經(jīng)元的重建,分別為該神經(jīng)元在其鄰域內(nèi)的權(quán)值比重和局部梯度變化量。
[0047]如果神經(jīng)元持續(xù)被訪問,則其權(quán)值不斷增大。但若神經(jīng)元長(zhǎng)期不能成為最佳匹配神經(jīng)元,那么該神經(jīng)元的權(quán)值會(huì)持續(xù)衰減。一個(gè)神經(jīng)元的權(quán)值越低,其可信度越差。對(duì)于處于鬼影輪廓上的像素值,由于其周圍將存在背景像素,因此該像素的神經(jīng)元具有較低的權(quán)值比重。
[0048]神經(jīng)元梯度的提取分別采用了垂直和水平方向的Sobel梯度算子。每個(gè)神經(jīng)元將第一幀圖像的梯度值作為初始時(shí)刻的梯度特征。各個(gè)神經(jīng)元的梯度特征隨模型一起更新,其更新方式與顏色向量的更新方式相似,唯一的不同在于像素在更新最佳匹配神經(jīng)元的同時(shí)也更新鄰域神經(jīng)元的顏色向量,而梯度特征則從不進(jìn)行鄰域傳播更新。在最佳匹配神經(jīng)元梯度更新的同時(shí),最佳匹配神經(jīng)元鄰域內(nèi)神經(jīng)元的梯度特征值保持不變。
[0049]S47)、對(duì)神經(jīng)元集合中神經(jīng)元分類處理,對(duì)非最佳匹配神經(jīng)元執(zhí)行步驟S48,對(duì)最佳匹配神經(jīng)元執(zhí)行步驟S50 ;
[0050]S48)、當(dāng)非最佳匹配神經(jīng)元的梯度變化量是否小于第一閾值且權(quán)值小于第二閾值時(shí)候執(zhí)行步驟S49 ;
[0051]S49)、重置該神經(jīng)元的更新率;
[0052]S50)、判斷最佳匹配神經(jīng)元的梯度變化量是否不小于第一閾值,否則轉(zhuǎn)到步驟S43,是則轉(zhuǎn)到步驟S51 ;
[0053]S51)、更新最佳匹配神經(jīng)元領(lǐng)域,轉(zhuǎn)到步驟S52 ;
[0054]最佳匹配神經(jīng)元的更新率對(duì)其鄰域內(nèi)的神經(jīng)元的更新過程產(chǎn)生影響。當(dāng)最佳匹配神經(jīng)元收斂到背景時(shí),其更新率具有很小的值,使得其鄰域信息對(duì)其的干擾減小。反之,初始狀態(tài)的神經(jīng)元能夠通過鄰域上下文的傳播實(shí)現(xiàn)快速收斂。
[0055]S52)、將更新最佳匹配神經(jīng)元領(lǐng)域內(nèi)神經(jīng)元標(biāo)出為背景,轉(zhuǎn)回步驟S44。
[0056]上述步驟S48與S50均為鬼影驗(yàn)證,是基于局部梯度變化檢測(cè)的自適應(yīng)方法根據(jù)神經(jīng)元在其鄰域內(nèi)的權(quán)值比重和局部梯度變化量的變化情況對(duì)兩類神經(jīng)元進(jìn)行了特殊處理。
[0057]對(duì)于最佳匹配神經(jīng)元,如果該神經(jīng)元的梯度局部變化量不小于既定閾值,則認(rèn)為該神經(jīng)元鄰接于前景。因此,為了保護(hù)靜態(tài)的前景目標(biāo)不受到錯(cuò)誤的腐蝕,此時(shí)并不對(duì)該最佳神經(jīng)元的鄰域進(jìn)行更新。
[0058]對(duì)于非最佳匹配神經(jīng)元,如果其梯度局部變化量小于既定閾值,且其權(quán)值比重小于另一既定閾值,則認(rèn)為該神經(jīng)元位于鬼影輪廓之上,算法將該神經(jīng)元的更新率控制器進(jìn)
行重置。
[0059]具體示例:
[0060]1、輸入視頻的第一幀圖像
[0061]2、建模
[0062]2.1 構(gòu)造 MAP
[0063]以該巾貞圖像為準(zhǔn),為其每個(gè)像素建立nXn個(gè)神經(jīng)元C = (C1, c2,..., cN) (N =η X η),則視頻幀所有像素的神經(jīng)元組成了 一個(gè)η X η倍于原視頻幀大小的MAP結(jié)構(gòu)。記任一像素為a,則像素a的焉景分布由神經(jīng)兀集合St (a) = {a1; a2,...,aj (i = I, 2,..., η X η)中的神經(jīng)元進(jìn)行模擬。視頻幀中其他像素也遵循相同的建模方式。
[0064]將t時(shí)刻MAP中的每個(gè)神經(jīng)元表示為Mt (i, j)。其中,(i, j)代表該神經(jīng)元在MAP
中的坐標(biāo)。對(duì)于原始視頻幀中任意像素Pt (x,y),與其對(duì)應(yīng)的最佳匹配神經(jīng)元為
[0065]2.2建立神經(jīng)元控制參數(shù)
[0066]Mt (i, j):t時(shí)刻MAP中的每個(gè)神經(jīng)元,(i, j)代表該神經(jīng)元在MAP中的坐標(biāo);
[0067]Mt(Xj):與Mt (i,j)對(duì)應(yīng)的最佳匹配神經(jīng)元;
[0068]pt (X,y):原始視頻幀中任意像素;
[0069]ε:占比閾值;
[0070]U:第一閾值;
[0071]R:第二閾值;
[0072]a t(i,j):神經(jīng)元 Mt(i,j)的更新率;
[0073]β t(i, j):與 a t(i, j)有關(guān)的參數(shù),β 0(i, j) = I ;
[0074]ht(i, j):神經(jīng)元 Mt(i, j)的更新率控制器,h。(i, j) = I ;
[0075]vt (i, j):神經(jīng)元Mt(i,j)的特征向量,由HSV空間的色度值H,亮度值S及飽和度值 V 組成。v0(i, j) = O。
[0076]τ (i,j):與鬼影驗(yàn)證相關(guān)的神經(jīng)元Mt (i,j)的相對(duì)權(quán)值;[0077]δ (i, j):與鬼影驗(yàn)證相關(guān)的神經(jīng)元Mt (i,j)的局部梯度變化量;
[0078]Vt (i,j):神經(jīng)元的梯度特征;
[0079]cot(i,j):神經(jīng)元Mt(i,j)的鬼影權(quán)值
[0080]3、輸入視頻的下一幀圖像
[0081]4、對(duì)每一個(gè)像素進(jìn)行前景分割
[0082]4.1輸入當(dāng)前幀中第一個(gè)像素
[0083]4.2尋找最佳匹配神經(jīng)元
[0084]記位于視頻幀a位置上的待測(cè)像素為Pt,在集合St (a)中搜索與之距離最近的神經(jīng)元,如果該神經(jīng)元與待測(cè)像素的距離不超過閾值ε,則稱其為最佳匹配神經(jīng)元。若St (a)中存在最佳匹配神經(jīng)元,則進(jìn)入步驟2.2,做進(jìn)一步判斷,反之將Pt判定為前景。
[0085]4.3更新最佳匹配神經(jīng)元的更新率
[0086]在自適應(yīng)模型中,如果Pt (X, y)能夠在與之對(duì)應(yīng)的神經(jīng)元集合St (X, y)中尋找到最佳匹配神經(jīng)元,且該神經(jīng)元具有特征向量則增加的大小:
【權(quán)利要求】
1.一種基于視頻的鐵路線小目標(biāo)檢測(cè)方法,其特征在于:包括步驟, 51)輸入視頻的第一巾貞圖像; 52)建模,為視頻的幀圖像中每個(gè)像素建立nXn個(gè)神經(jīng)元,得到幀圖像的MAP結(jié)構(gòu),而后將幀圖像中像素均作為背景分布的由神經(jīng)元集合中的神經(jīng)元進(jìn)行模擬; 53)輸入視頻的下一巾貞圖像; 54)遍歷當(dāng)前幀圖像,對(duì)幀圖像中的每一個(gè)像素進(jìn)行基于顏色的前景分割; 55)判斷當(dāng)前幀圖像中,屬于前景的像素占比是否大于占比閾值。是則執(zhí)行步驟S6,否則執(zhí)行步驟S7 ; 56)利用場(chǎng)景梯度值重新分割前景; 57)輸出標(biāo)出前景的圖像,返回步驟S3。
2.如權(quán)利要求1所述的基于視頻的鐵路線小目標(biāo)檢測(cè)方法,其特征在于:所述占比閾值為50%。
3.如權(quán)利要求1所述的基于視頻的鐵路線小目標(biāo)檢測(cè)方法,其特征在于:所述步驟S4具體包括步驟, 541)、輸入當(dāng)前幀中第一個(gè)像素; 542)、在神經(jīng)元集合中搜索是否有與之距離小于閾值的神經(jīng)元,若不存在則轉(zhuǎn)到步驟S43 ;存在則選出該神經(jīng)元作為最佳匹配神經(jīng)元后轉(zhuǎn)到步驟S45 ; 543)、將該像素標(biāo)出為前景,而后轉(zhuǎn)到步驟S44; 544)、輸入下一個(gè)像素后轉(zhuǎn)回步驟S42; 545)、降低該最佳匹配神經(jīng)元的更新率; 546)、計(jì)算神經(jīng)元集合內(nèi)各神經(jīng)元的鬼影參數(shù),所述鬼影參數(shù)包括神經(jīng)元在其鄰域內(nèi)的權(quán)值比重與局部梯度變化量; 547)、對(duì)神經(jīng)元集合中神經(jīng)元分類處理,對(duì)非最佳匹配神經(jīng)元執(zhí)行步驟S48,對(duì)最佳匹配神經(jīng)元執(zhí)行步驟S50 ; 548)、當(dāng)非最佳匹配神經(jīng)元的梯度變化量是否小于第一閾值且權(quán)值小于第二閾值時(shí)候執(zhí)行步驟S49 ; 549)、重置該神經(jīng)元的更新率; 550)、判斷最佳匹配神經(jīng)元的梯度變化量是否不小于第一閾值,否則轉(zhuǎn)到步驟S43,是則轉(zhuǎn)到步驟S51 ; 551)、更新最佳匹配神經(jīng)元領(lǐng)域,轉(zhuǎn)到步驟S52; 552)、將更新最佳匹配神經(jīng)元領(lǐng)域內(nèi)神經(jīng)元標(biāo)出為背景,轉(zhuǎn)回步驟S44。
【文檔編號(hào)】G06T7/00GK104008554SQ201410270128
【公開日】2014年8月27日 申請(qǐng)日期:2014年6月17日 優(yōu)先權(quán)日:2014年6月17日
【發(fā)明者】林必毅, 陳敏, 劉文昌, 吳悅, 汪永強(qiáng) 申請(qǐng)人:深圳市賽為智能股份有限公司