專利名稱:一種基于單目視覺的人數(shù)統(tǒng)計方法
技術(shù)領(lǐng)域:
本發(fā)明屬于視頻圖像處理及識別技術(shù)領(lǐng)域,特別涉及一種基于單目視覺的人數(shù)統(tǒng)計方法。
背景技術(shù):
人數(shù)統(tǒng)計是運動目標檢測與跟蹤技術(shù)的一個重要應(yīng)用,也是當今智能視覺系統(tǒng)研究中一個十分活躍的新領(lǐng)域。傳統(tǒng)的人數(shù)統(tǒng)計方法是利用人工計數(shù)或人工電子設(shè)備觸發(fā)計數(shù),隨著信息化時代的到來,發(fā)展一種智能化的人數(shù)統(tǒng)計顯得十分必要。智能化的人數(shù)統(tǒng)計就是利用計算機視覺和圖像處理的方法,建立一個智能管理系 統(tǒng)。在不需要人的干預(yù)、或者只需要很少干預(yù)的情況下,通過對攝像機拍錄的視頻流圖像進行分析,以實現(xiàn)行人的定位、跟蹤,并在此基礎(chǔ)上進行精確的人數(shù)統(tǒng)計,進一步判定人流量的動向。做到了既能完成日常管理,又能在發(fā)生異常情況時及時做出反應(yīng),從而提供了一種加先進和可行的智能處理方案。由于應(yīng)用場所各異、環(huán)境復(fù)雜,加之行人具有的服飾變化、姿態(tài)變化、人體運動的隨意性和隨機性、遮擋等方面特點,使現(xiàn)有技術(shù)中的智能化的人數(shù)統(tǒng)計方法具有一定的局限性。有鑒于此,有必要對現(xiàn)有技術(shù)中的人數(shù)統(tǒng)計方法予以改進。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于單目視覺的人數(shù)統(tǒng)計方法,其可有效地提高單目視覺下行人數(shù)量統(tǒng)計的正確率,改善行人目標跟蹤的準確性,解決復(fù)雜場景下多行人目標的人數(shù)統(tǒng)計的難題。為實現(xiàn)上述目的,本發(fā)明提供了一種基于單目視覺的人數(shù)統(tǒng)計方法,包括以下步驟
51、獲取監(jiān)控區(qū)域的視頻流圖像作為輸入圖像;
52、對輸入圖像中的連續(xù)三幀圖像進行差分法處理,以獲取運動目標像素點;
53、通過數(shù)學(xué)形態(tài)學(xué)方法去除運動目標像素點中的干擾噪音點,以獲取完整的運動目標像素點;
54、對步驟S3中所獲取的完整的運動目標像素點進行基于發(fā)色特征的頭部分割法處理,以獲取頭部區(qū)域的像素點;
55、將若干圓形模板對步驟S4中獲取的頭部區(qū)的域像素點進行掃描,并進行頭部緊密度計算,以提取出人頭區(qū)域;
56、對人頭區(qū)域計數(shù),以得到人數(shù)。作為本發(fā)明的進一步改進,所述步驟SI具體為
通過攝像機獲取監(jiān)控區(qū)域的視頻流圖像作為輸入圖像,所述監(jiān)控區(qū)域位于攝像機的正下方。
作為本發(fā)明的進一步改進,所述步驟S2中的圖像差分法處理具體為
通過對輸入圖像中的連續(xù)三幀圖像中的相鄰幀進行差分運算,然后對差分運算結(jié)果進行與運算,以獲取運動目標像素點。作為本發(fā)明的進一步改進,所述步驟S3中的數(shù)學(xué)形態(tài)學(xué)方法具體為
對步驟S2中所獲取的運動目標像素點首先進行腐蝕平滑運算,然后進行膨脹運算。作為本發(fā)明的進一步改進,所述步驟S4中的基于發(fā)色特征的頭部分割法具體為 根據(jù)頭部發(fā)色的聚類性特征,選擇YCbCr彩色空間作為發(fā)色像素點的表示空間,頭部
發(fā)色在YCbCr彩色空間的聚類區(qū)域為
Rcb= [RCb min, Rcb maJ = [121,141];
Rcr [Rcr min, Ecr max] [125, 143] 作為本發(fā)明的進一步改進,所述步驟S5還包括將頭部緊密度計算結(jié)果J與設(shè)定閾值T進行比較,若頭部緊密度計算結(jié)果J大于或者等于設(shè)定閾值T,則提取人頭區(qū)域;若頭部緊密度計算結(jié)果J小于設(shè)定閾值T,則不提取人頭區(qū)域。作為本發(fā)明的進一步改進,所述頭部緊密度計算公式為J = P/A,
其中,P為連通域內(nèi)物體的面積;A為連通域的面積。作為本發(fā)明的進一步改進,所述設(shè)置閾值T為0. 6。與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果是通過基于發(fā)色特征的頭部分割法所獲取頭部區(qū)域的像素點,并與若干圓形模板進行頭部緊密度計算,可有效地提取出人頭區(qū)域并計數(shù)。從而有效地提高了單目視覺下行人數(shù)量統(tǒng)計的正確率,改善行人目標跟蹤的準確性,解決了復(fù)雜場景下多行人目標的人數(shù)統(tǒng)計的難題。
圖I為本發(fā)明一種基于單目視覺的人數(shù)統(tǒng)計方法一具體實施方式
中的流程示意 圖2為圖I所示的獲取監(jiān)控區(qū)域的視頻流圖像的工作原理示意 圖3為圖I所示的對連續(xù)三幀圖像進行差分法處理的示意 圖4為圖I所示的腐蝕平滑運算的工作原理示意 圖5為圖4所示的腐蝕平滑算子示意 圖6為圖I所示的膨脹運算的原理示意 圖7為圖I所示的圓形模板與頭部區(qū)域像素點進行掃描,并進行頭部緊密度計算的原理示意圖。
具體實施例方式下面結(jié)合附圖所示的各實施方式對本發(fā)明進行詳細說明,但應(yīng)當說明的是,這些實施方式并非對本發(fā)明的限制,本領(lǐng)域普通技術(shù)人員根據(jù)這些實施方式所作的功能、方法、或者結(jié)構(gòu)上的等效變換或替代,均屬于本發(fā)明的保護范圍之內(nèi)。參圖I所示,圖I為本發(fā)明一種基于單目視覺的人數(shù)統(tǒng)計方法一具體實施方式
中的流程示意圖。在本實施方式中,一種基于單目視覺的人數(shù)統(tǒng)計方法,該人數(shù)統(tǒng)計方法包括以下步驟
SI、獲取監(jiān)控區(qū)域的視頻流圖像作為輸入圖像。關(guān)于像頭安裝位置和拍攝方式,常用的有水平拍攝方式、傾斜拍攝方式、垂直拍攝方式。在單目視覺垂直拍攝方式下,獲取的行人頭部區(qū)域不會互相遮擋,而且頭頂部區(qū)域特征較為明顯,便于頭部檢測、跟蹤與識別。參圖2所示,本發(fā)明一種基于單目視覺的人數(shù)統(tǒng)計方法是一種基于攝像機垂直拍攝,適用于多行人擁擠的情況。在本實施方式中,攝像機10設(shè)置在出入口 20的正上方,行人可沿著箭頭201的方向上在出入口 20中來回走動。攝像機10所獲取的監(jiān)控區(qū)域30可完全覆蓋出入口 20的全部區(qū)域。在本實施方式中,該監(jiān)控區(qū)域30為一矩形,當然也可以為正方形,或圓形或者其他形狀。攝像機10位于監(jiān)控區(qū)域30的中心點301的垂直正上方,由此我們可以推導(dǎo)出該監(jiān)控區(qū)域30位于攝像機10的正下方。 S2、對輸入圖像中的連續(xù)三幀圖像進行差分法處理,以獲取運動目標像素點。如圖3所示,相鄰幀的差分法處理是通過計算相鄰兩幀圖像之間的差值來獲得運動區(qū)域。通過差值能快速地檢測出相鄰幀圖像中運動目標所引起的運動范圍。但是它提取的運動范圍比實際的運動范圍要大。由于檢測出來的物體是前后兩幀圖像中的相對變化的部分,因此無法檢測到重疊部分。而連續(xù)三幀圖像的差分法處理是在幀間差分運算的基礎(chǔ)上的一種改進。其將連續(xù)三幀圖像作為一組,以進行差分法處理。其能較好的檢測出中間幀圖像中的運動目標的形狀輪廓。在對連續(xù)三幀圖像進行差分法處理后,通過將第k_l幀與第k幀、第k幀與第k+1幀的兩個差分結(jié)果做與運算,獲取共同部分,從而取得更準確的運動目標像素點。與運算是一種邏輯乘法運算規(guī)則,它表示只當參與運算的邏輯變量都同時取值為I時,其邏輯乘積才等于I。在本實施方式中,設(shè)f ( X,y, t -I)、f ( X,y, t)、f ( x, y, t+1)為輸入圖像中的連續(xù)三幀圖像,用三幀差分法處理后得到的差分圖像D (x,y,At)為
/取 3'. A/) = |/{ .1; /) — /(.I; .r, f - I)卜 |/( Jr, )■, t) — /(.I、.r, /+-I)]
其中,D(x,y,At)為連續(xù)三幀圖像的差分法處理結(jié)果。具體的,相鄰幀中的像素差的設(shè)定閾值K為20。S3、通過數(shù)學(xué)形態(tài)學(xué)方法去除運動目標像素點中的干擾噪音點,以獲取完整的運動目標像素點。差分法處理只能提取出運動目標的邊界,但運動實體內(nèi)部容易產(chǎn)生空洞現(xiàn)象,因此不能提取出完整的運動目標像素點,且容易產(chǎn)生獨立的干擾噪音點。優(yōu)選的,該數(shù)學(xué)形態(tài)學(xué)方法為,先進行腐蝕平滑運算,以消除獨立的干擾噪音點;再進行膨脹運算,以消除部分空洞及邊緣斷裂現(xiàn)象。參圖4與圖5所示,在本實施方式中,腐蝕平滑運算是檢查3 X 3窗口內(nèi)圖像結(jié)構(gòu)的細節(jié),其中P為當前點,Ptl-P7為其8個鄰接點。腐蝕平滑運算的準則為當P=255 (即P為白色像素),如果^^、^、^、^、^、^、匕都等于。(即都為黑色像素),則P變?yōu)? (即變成黑色像素)。圖6為圖I所示的膨脹運算的原理示意圖。在本實施方式中,該膨脹運算的計算公式為
權(quán)利要求
1.一種基于單目視覺的人數(shù)統(tǒng)計方法,其特征在于,包括以下步驟 51、獲取監(jiān)控區(qū)域的視頻流圖像作為輸入圖像; 52、對輸入圖像中的連續(xù)三幀圖像進行差分法處理,以獲取運動目標像素點; 53、通過數(shù)學(xué)形態(tài)學(xué)方法去除運動目標像素點中的干擾噪音點,以獲取完整的運動目標像素點; 54、對步驟S3中所獲取的完整的運動目標像素點進行基于發(fā)色特征的頭部分割法處理,以獲取頭部區(qū)域的像素點; 55、將若干圓形模板對步驟S4中獲取的頭部區(qū)的域像素點進行掃描,并進行頭部緊密度計算,以提取出人頭區(qū)域; 56、對人頭區(qū)域計數(shù),以得到人數(shù)。
2.根據(jù)權(quán)利要求I所述的基于單目視覺的人數(shù)統(tǒng)計方法,其特征在于,所述步驟SI具體為 通過攝像機獲取監(jiān)控區(qū)域的視頻流圖像作為輸入圖像,所述監(jiān)控區(qū)域位于攝像機的正下方。
3.根據(jù)權(quán)利要求I所述的基于單目視覺的人數(shù)統(tǒng)計方法,其特征在于,所述步驟S2中的圖像差分法處理具體為 通過對輸入圖像中的連續(xù)三幀圖像中的相鄰幀進行差分運算,然后對差分運算結(jié)果進行與運算,以獲取運動目標像素點。
4.根據(jù)權(quán)利要求I所述的基于單目視覺的人數(shù)統(tǒng)計方法,其特征在于,所述步驟S3中的數(shù)學(xué)形態(tài)學(xué)方法具體為 對步驟S2中所獲取的運動目標像素點首先進行腐蝕平滑運算,然后進行膨脹運算。
5.根據(jù)權(quán)利要求I所述的基于單目視覺的人數(shù)統(tǒng)計方法,其特征在于,所述步驟S4中的基于發(fā)色特征的頭部分割法具體為 根據(jù)頭部發(fā)色的聚類性特征,選擇YCbCr彩色空間作為發(fā)色像素點的表示空間,頭部發(fā)色在YCbCr彩色空間的聚類區(qū)域為 Rcb= [RCb min,Rcb maJ = [121,141]; Rcr= [Rcr min, Ecr max] = [125,143]。
6.根據(jù)權(quán)利要求I所述的基于單目視覺的人數(shù)統(tǒng)計方法,其特征在于,所述步驟S5還包括將頭部緊密度計算結(jié)果J與設(shè)定閾值T進行比較,若頭部緊密度計算結(jié)果J大于或者等于設(shè)定閾值T,則提取人頭區(qū)域;若頭部緊密度計算結(jié)果J小于設(shè)定閾值T,則不提取人頭區(qū)域。
7.根據(jù)權(quán)利要求6所述的基于單目視覺的人數(shù)統(tǒng)計方法,其特征在于,所述頭部緊密度計算公式為J = P/A, 其中,P為連通域內(nèi)物體的面積;A為連通域的面積。
8.根據(jù)權(quán)利要求6所述的基于單目視覺的人數(shù)統(tǒng)計方法,其特征在于,所述設(shè)置閾值T為 0. 6。
全文摘要
本發(fā)明提供了一種基于單目視覺的人數(shù)統(tǒng)計方法,其通過基于發(fā)色特征的頭部分割法所獲取頭部區(qū)域的像素點,并與若干圓形模板進行頭部緊密度計算,可有效地提取出人頭區(qū)域并計數(shù)。從而有效地提高了單目視覺下行人數(shù)量統(tǒng)計的正確率,改善行人目標跟蹤的準確性,解決了復(fù)雜場景下多行人目標的人數(shù)統(tǒng)計的難題。
文檔編號G06M11/00GK102831473SQ201210274839
公開日2012年12月19日 申請日期2012年8月3日 優(yōu)先權(quán)日2012年8月3日
發(fā)明者呂楠, 瞿研, 楊京雨 申請人:無錫慧眼電子科技有限公司