一種人數(shù)統(tǒng)計系統(tǒng)的制作方法
【專利摘要】本發(fā)明涉及一種人數(shù)統(tǒng)計系統(tǒng),其特征在于:包括人體目標檢測模塊和人體目標跟蹤計數(shù)模塊,其中人體目標檢測模塊包括:Kinect深度傳感器,感興趣目標檢測模塊,人臉目標檢測模塊;人體目標跟蹤計數(shù)模塊包括:目標模型集合,第一匹配模塊,二匹配模塊,和計數(shù)模塊,用于對目標模型集合中的人體目標輪廓進行計數(shù)。與現(xiàn)有技術(shù)相比,本發(fā)明的優(yōu)點在于:采用基于Kinect深度傳感器進行人數(shù)統(tǒng)計的系統(tǒng),統(tǒng)計結(jié)果比較精確,能適用于任何受控環(huán)境的場景,并能實時統(tǒng)計檢測空間內(nèi)的人數(shù)。
【專利說明】一種人數(shù)統(tǒng)計系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及一種人數(shù)統(tǒng)計系統(tǒng)。
【背景技術(shù)】
[0002]近些年,隨著我國經(jīng)濟的快速發(fā)展和人民生活水平的提高,人們在公共場所的活動正在不斷增加。一方面,商場、娛樂場所和服務場所等公共環(huán)境由于人數(shù)的增加而變得擁堵,這極易造成踩踏等事故的發(fā)生。另一方面,作為商場、娛樂場所和服務場所的經(jīng)營方,為了在激烈的市場競爭中生存,需要根據(jù)人數(shù)分布的情況,對自己的經(jīng)營策略進行調(diào)整。由此可見,統(tǒng)計公共場所中的人數(shù)信息具有越來越重的意義。
[0003]為了獲得公共場所中的人數(shù)信息,我們常采用人工計數(shù)的方法,或者根據(jù)簽到、售票等信息推測公共場所中的人數(shù)。而這些方法都有著自己的缺點和局限性。對于人工計數(shù)的方法,首先,該方法需要耗費大量的人力;其次,由于人數(shù)分布是動態(tài)的,而人工計數(shù)往往是在一端時間內(nèi)進行的,這樣我們就無法獲得所有時間段內(nèi)人數(shù)的分布情況。而對于根據(jù)其他信息推測人數(shù)的方法,只有少數(shù)公共場所存在簽到和售票等與人數(shù)相關(guān)等信息,其他的開放式公共場所,并不存在這種信息,這就是的該方法具有很大的局限性。因此可見,我們急需要一種自動的人數(shù)統(tǒng)計系統(tǒng)。
[0004]近年來,隨著視頻監(jiān)控計數(shù)的快速發(fā)展,視頻監(jiān)控系統(tǒng)的應用場所正在變得越來越廣泛——公交、海關(guān)、機場、車站、商場以及營業(yè)廳。在這些需求各不相同的應用場景中,視頻監(jiān)控系統(tǒng)通過獲取監(jiān)控目標的視頻信息,對視頻進行記錄、回溯和監(jiān)視,并根據(jù)視頻信息自動或人工地做出相應動作,以實現(xiàn)對監(jiān)控目標地控制、監(jiān)視、智能管理和安全防范。
[0005]在視頻監(jiān)控系統(tǒng)紛繁復雜地監(jiān)控目標中,人體目標是重要的組成部分。在很多視頻監(jiān)控系統(tǒng)的應用場景入商場和營業(yè)廳中,統(tǒng)計人體目標數(shù)目是系統(tǒng)最重要的功能之一。也正是因此,基于視頻監(jiān)控技術(shù)的人數(shù)統(tǒng)計系統(tǒng)成為目前發(fā)展最為迅速。性能最為可靠的人數(shù)統(tǒng)計系統(tǒng)。
[0006]目前,常見的基于視頻監(jiān)控的人數(shù)統(tǒng)計方法可以分為三類:
[0007]1、基于底層特征的擬合法
[0008]該方法通過提取圖像的底層統(tǒng)計特征并對其進行函數(shù)擬合來計算圖像中的人體目標數(shù)目。在圖像的底層統(tǒng)計特征中,像素的統(tǒng)計特征能夠較好地反映圖像中人體目標地分布情況。因此,像素的統(tǒng)計特征常被用作底層特征的擬合參數(shù)。常用的像素統(tǒng)計特征包括全局特征和內(nèi)部邊緣特征兩類。全局特征包括前景圖像當中分割出來的人體目標團塊的幾何信息、位置信息以及團塊內(nèi)像素數(shù)目。而內(nèi)部邊緣特征包括邊緣像素數(shù)目、邊緣方向以及Minkowski維度等特征。
[0009]基于底層特征擬合的方法將圖像中人體目標的數(shù)目看作統(tǒng)計信息,而忽略掉了單個人體目標的意義,并未對每個單獨的人體目標進行跟蹤。這使得這種方法簡單易用,但也使其計數(shù)精度下降,該方法常用語粗略估計人數(shù)的場合。
[0010]2、基于特征點的跟蹤法[0011]該方法可以分為基于光流的方法和基于描述模型的方法?;诠饬鞯姆椒ㄊ紫冗x擇一組在幀間紋理特征保持不變的特征點,之后通過局部匹配搜索完成跟蹤。常見的基于光流的方法包括Lucas和Kanade基于平面位移運動模型匹配立體視覺中對應圖像的方法以及采用圖像灰度差平方和作為特征點匹配準則的KLT算法?;诿枋瞿P偷姆椒ㄊ紫葘λ刑卣鼽c進行描述建模,之后通過在每一幀圖像中選取模型具有對應關(guān)系的特征點集合以實現(xiàn)對目標的跟蹤。
[0012]基于特征點的跟蹤方法有效地描述了人體目標的運動,使得人數(shù)統(tǒng)計系統(tǒng)計數(shù)更加準確,但同時計算復雜度也相應提高。同時,基于光流但方法在紋理特征變化復雜的情況下常由于出現(xiàn)誤匹配而導致跟蹤失敗。而基于模型的方法由于模型獲取的繁瑣學習過程以及模型搜索中高時間復雜度的計算,使其常難以滿足系統(tǒng)的實時性要求。
[0013]3、基于目標檢測跟蹤的方法
[0014]該方法首先進行背景建模提取視頻中的前景目標(通常是運動目標),并通過連通域分析活著模板匹配獲取到前景目標中到人體目標,然后采用跟蹤算法對檢測到的人體目標進行跟蹤以實現(xiàn)人數(shù)統(tǒng)計。該方法精度高、性能可靠,但是無法克服實時性問題。
【發(fā)明內(nèi)容】
[0015]本發(fā)明所要解決的技術(shù)問題是針對上述現(xiàn)有技術(shù)提供一種實時的、統(tǒng)計精確的人數(shù)統(tǒng)計系統(tǒng)。
[0016]本發(fā)明解決上述技術(shù)問題所采用的技術(shù)方案為:一種人數(shù)統(tǒng)計系統(tǒng),其特征在于:包括人體目標檢測模塊和人體目標跟蹤計數(shù)模塊,其中人體目標檢測模塊包括:
[0017]Kinect深度傳感器,Kinect深度傳感器對準檢測空間,用于實時拍攝檢測空間的現(xiàn)場圖像,Kinect深度傳感器能輸出針對同一幅現(xiàn)場圖像對齊后的深度圖像和彩色圖像;
[0018]感興趣目標檢測模塊,Kinect傳感器輸出的深度圖像作為感興趣目標檢測模塊的輸入,通過對深度圖像做感興趣目標檢測處理,得到一副矩形形狀的感興趣目標圖像;
[0019]人臉目標檢測模塊,感興趣目標檢測模塊輸出的感興趣目標圖像和Kinect深度傳感器輸出的彩色圖像作為人臉目標檢測模塊的兩個輸入?yún)?shù),用于檢測所述感興趣目標圖像中是否有人臉目標;
[0020]人體目標跟蹤計數(shù)模塊包括:
[0021]目標模型集合,用于保存人體目標輪廓,目標模型集合的初始值為零;
[0022]第一匹配模塊,當所述人臉目標檢測模塊檢測出所述感興趣目標圖像中有人臉目標時,將所述感興趣目標圖像通過第一匹配模塊與目標模型集合中的人體目標輪廓進行匹配,如果匹配成功,則所述感興趣目標圖像為非新目標,用該非新目標更新目標模型集合中與之匹配的人體目標輪廓;如果匹配不成功,則所述感興趣目標圖像為新目標,將該新目標添加入目標模型集合;
[0023]第二匹配模塊,當所述人臉目標檢測模塊沒有檢測出所述感興趣目標圖像中有人臉目標時,將所述感興趣目標圖像通過第二匹配模塊與目標模型集合中的人體目標輪廓進行匹配,如果匹配成功,則所述感興趣目標圖像為非新目標,用該非新目標更新目標模型集合中與之匹配的人體目標輪廓;如果匹配不成功,則所述感興趣目標圖像為新目標,將該新目標添加入目標模型集合;[0024]計數(shù)模塊,用于對目標模型集合中的人體目標輪廓進行計數(shù)。
[0025]作為改進,對深度圖像做感興趣目標檢測處理的過程為:
[0026]根據(jù)深度圖像的坐標系,在檢測空間內(nèi)預先劃分出一個感興趣空間,該感興趣空間投影在深度圖像中成為一塊矩形范圍,該矩形范圍稱為投影矩形;
[0027]假設(shè)某一幀深度圖像為D(x,y),感興趣空間在深度圖像中的投影矩形左上點坐標為(?, Yo),投影矩形的像素寬度和高度分別為w和h,感興趣空間距離Kinect深度傳感器的最近距離和最遠距離分別為Clmin和dmax,根據(jù)下式將深度圖像進行二值化:
【權(quán)利要求】
1.一種人數(shù)統(tǒng)計系統(tǒng),其特征在于:包括人體目標檢測模塊和人體目標跟蹤計數(shù)模塊,其中人體目標檢測模塊包括: Kinect深度傳感器,Kinect深度傳感器對準檢測空間,用于實時拍攝檢測空間的現(xiàn)場圖像,Kinect深度傳感器能輸出針對同一幅現(xiàn)場圖像對齊后的深度圖像和彩色圖像; 感興趣目標檢測模塊,Kinect傳感器輸出的深度圖像作為感興趣目標檢測模塊的輸入,通過對深度圖像做感興趣目標檢測處理,得到一副矩形形狀的感興趣目標圖像; 人臉目標檢測模塊,感興趣目標檢測模塊輸出的感興趣目標圖像和Kinect深度傳感器輸出的彩色圖像作為人臉目標檢測模塊的兩個輸入?yún)?shù),用于檢測所述感興趣目標圖像中是否有人臉目標; 人體目標跟蹤計數(shù)模塊包括: 目標模型集合,用于保存人體目標輪廓,目標模型集合的初始值為零; 第一匹配模塊,當所述人臉目標檢測模塊檢測出所述感興趣目標圖像中有人臉目標時,將所述感興趣目標圖像通過第一匹配模塊與目標模型集合中的人體目標輪廓進行匹配,如果匹配成功,則所述感興趣目標圖像為非新目標,用該非新目標更新目標模型集合中與之匹配的人體目標輪廓;如果匹配不成功,則所述感興趣目標圖像為新目標,將該新目標添加入目標模型集合; 第二匹配模塊,當所述人臉目標檢測模塊沒有檢測出所述感興趣目標圖像中有人臉目標時,將所述感興趣目標圖像通過第二匹配模塊與目標模型集合中的人體目標輪廓進行匹配,如果匹配成功,則所述感興趣目標圖像為非新目標,用該非新目標更新目標模型集合中與之匹配的人體目標輪廓;如果匹配不成功,則所述感興趣目標圖像為新目標,將該新目標添加入目標模型集合; 計數(shù)模塊,用于對目標模型集合中的人體目標輪廓進行計數(shù)。
2.根據(jù)權(quán)利要求1所述的人數(shù)統(tǒng)計系統(tǒng),其特征在于:對深度圖像做感興趣目標檢測處理的過程為: 根據(jù)深度圖像的坐標系,在檢測空間內(nèi)預先劃分出一個感興趣空間,該感興趣空間投影在深度圖像中成為一塊矩形范圍,該矩形范圍稱為投影矩形; 假設(shè)某一幀深度圖像為D(x,y),感興趣空間在深度圖像中的投影矩形左上點坐標為(X。,Y0),投影矩形的像素寬度和高度分別為w和h,感興趣空間距離Kinect深度傳感器的最近距離和最遠距離分別為dmin和dmax,根據(jù)下式將深度圖像進行二值化:
3.根據(jù)權(quán)利要求1所述的人數(shù)統(tǒng)計系統(tǒng),其特征在于:所述人臉目標檢測模塊采用基于Adaboost的人臉檢測算法檢測所述感興趣目標圖像中是否有人臉目標。
4.根據(jù)權(quán)利要求1所述的人數(shù)統(tǒng)計系統(tǒng),其特征在于:所述第一匹配模塊或/和第二匹配模塊采用下述方法對感興趣目標圖像與目標模型集合中的人體目標輪廓進行匹配:當所述人臉目標檢測模塊檢測出所述感興趣目標圖像中有人臉目標時,先將所述感興趣目標圖像與目標模型集合中的所有人體目標輪廓進行運動關(guān)系匹配,如果運動關(guān)系匹配成功,則表明所述感興趣目標圖像為非新目標,用該非新目標更新目標模型集合中與之匹配的人體目標輪廓;如果運動關(guān)系匹配不成功,再將所述感興趣目標圖像與目標模型集合中的所有人體目標輪廓進行直方圖匹配,如果直方圖匹配成功,則表明所述感興趣目標圖像為非新目標,用該非新目標更新目標模型集合中與之匹配的人體目標輪廓;如果直方圖匹配不成功,則表明所述感興趣目標圖像為新目標,將該新目標添加入目標模型集合中;當所述人臉目標檢測模塊檢測出所述感興趣目標圖像中有沒有人臉目標時,將所述感興趣目標圖像與目標模型集合中的所有人體目標輪廓進行運動關(guān)系匹配,如果運動關(guān)系匹配成功,則表明所述感興趣目標圖像為非新目標,用該非新目標更新目標模型集合中與之匹配的人體目標輪廓;如果運動關(guān)系匹配不成功,放棄該感興趣目標圖像。
5.根據(jù)權(quán)利要求1所述的人數(shù)統(tǒng)計系統(tǒng),其特征在于:所述第一匹配模塊或/和第二匹配模塊采用下述方法對感興趣目標圖像與目標模型集合中的人體目標輪廓進行匹配: 當所述人臉目標檢測模塊檢測出所述感興趣目標圖像中有人臉目標時,先將所述感興趣目標圖像與目標模型集合中的所有人體目標輪廓進行運動關(guān)系匹配,如果運動關(guān)系匹配成功,則表明所述感興趣目標圖像為非新目標,用該非新目標更新目標模型集合中與之匹配的人體目標輪廓;如果運動關(guān)系匹配不成功,再將所述感興趣目標圖像與目標模型集合中的所有人體目標輪廓進行特征點匹配,如果特征點匹配成功,則表明所述感興趣目標圖像為非新目標,用該非新目標更新目標模型集合中與之匹配的人體目標輪廓;如果特征點匹配不成功,則表明所述感興趣目標圖像為新目標,將該新目標添加入目標模型集合中;當所述人臉目標檢測模塊檢測出所述感興趣目標圖像中有沒有人臉目標時,將所述感興趣目標圖像與目標模型集合中的所有人體目標輪廓進行運動關(guān)系匹配,如果運動關(guān)系匹配成功,則表明所述感興趣目標圖像為非新目標,用該非新目標更新目標模型集合中與之匹配的人體目標輪廓;如果運動關(guān)系匹配不成功,放棄該感興趣目標圖像。
6.根據(jù)權(quán)利要求4或5所述的人數(shù)統(tǒng)計系統(tǒng),其特征在于:所述運動關(guān)系匹配方法如下: 假設(shè)當前感興趣目標圖像為tjx。,nkz。),其中,(Xc;,y。)為當前感興趣目標圖像矩形范圍左上點的像素坐標,Wc和h。分別為目標當前感興趣目標圖像t。的像素寬度和高度,Zc表示當前感興趣目標圖像是否含有人臉目標,zc e {O,1},z。為O表示當前感興趣目標圖像中無人臉目標,而z。為I表示當前感興趣目標圖像中有人臉目標; 假設(shè)當前已發(fā)現(xiàn)的目標集合為T =目標集合中的元素MxiJi, Wi,e {I, 2, 3, -η},其中為目標集合中目標\的像素坐標,Wi和比分別為目標\的像素寬度和高度,Zi表示目標\是否含有人臉目標,Zi e {O,1},Zi為O表示當前目標\中無人臉目標,而ZiS I表示目標\中有人臉目標; 當前感興趣目標圖像t。與目標\的參數(shù)滿足下式時,判斷當前感興趣目標圖像t。與目標\的運動關(guān)系匹配成功:
【文檔編號】G06T7/20GK103971103SQ201410220291
【公開日】2014年8月6日 申請日期:2014年5月23日 優(yōu)先權(quán)日:2014年5月23日
【發(fā)明者】盧朝陽, 李靜, 高遠 申請人:西安電子科技大學寧波信息技術(shù)研究院