本發(fā)明主要涉及圖像處理技術領域,具體涉及一種自適應深度空間特征的行人識別方法和系統(tǒng)。
背景技術:
隨著計算機的普及、智能設備的出現(xiàn),科技對人們的影響越來越大,在全球化加劇的現(xiàn)在,人們對于身份鑒別的需求越來越強烈。傳統(tǒng)的個人識別碼、密碼、IC卡、密??ǖ葌鹘y(tǒng)的身份鑒別技術由于操作不變、難以記憶等原因和信息時代的需求存在不小的差距。人臉識別是生物特征識別領域十分熱門的課題,是繼指紋識別之后,有希望廣泛應用于社會經(jīng)濟活動和人們?nèi)粘I钪械囊环N生物特征識別技術。行人識別是一種利用人臉進行身份鑒別的生物特征識別技術。然而,在近代特別是隨著計算機技術的發(fā)展,行人識別通常是指基于計算機技術的人臉特征信息的識別技術。
隨著社會的發(fā)展,技術的進步,科技對人們的影響越來越大,人們對于身份鑒別的需求越來越強烈,然而在不同場景下,角度不同,攝像機分辨率不同以及不同場景下光照也不一致等問題,導致同一個行人很容易被誤判為同一行人。以往經(jīng)常采用對整張圖像直接進行提取特征的方式,往往并沒有提取到足夠多更細致的特征信息。
技術實現(xiàn)要素:
本發(fā)明所要解決的技術問題是提供一種自適應深度空間特征的行人識別方法和系統(tǒng),能夠有效提取到行人更多的信息,尤其是局部信息,而采用損失值反饋的形式自適應的行人特征分類,最終趨于最優(yōu)解,能夠指引行人特征提取模型提取到更多深度空間的行人特征信息。
本發(fā)明解決上述技術問題的技術方案如下:一種自適應深度空間特征的行人識別方法,包括如下步驟:
步驟S1:獲取行人圖像,并根據(jù)預設的分割數(shù)目n將所述行人圖像進行分割,得到n塊行人圖像分塊;
步驟S2:建立與行人圖像分塊數(shù)目相同的n組特征提取模型,所述n組特征提取模型一一對應的從所述n塊行人圖像分塊中提取特征信息,得到n組特征信息;一一對應為一個特征提取模型對應一個行人圖像分塊進行特征信息的提??;
步驟S3:建立與特征信息組別數(shù)目相同的n組特征分類器,所述n組特征分類器一一對應的對所述n組特征信息進行特征分類;一一對應為一個特征分類器對應一組特征信息進行特征分類;
步驟S4:根據(jù)反向傳播算法分別計算每組特征分類過程中所產(chǎn)生的損失值,得到n組損失值;
步驟S5:將n組損失值分別返回對應的特征提取模型和特征分類器中,得到優(yōu)化后的特征提取模型和特征分類器。
本發(fā)明的有益效果是:采用將行人圖像分塊的方式去提取行人特征,每塊行人圖像分塊分別對應一特征提取模型和特征分類器,能夠有效提取到行人更多的信息,尤其是局部信息,而采用損失值反饋的形式自適應的行人特征分類,最終趨于最優(yōu)解,能夠指引行人特征提取模型提取到更多深度空間的行人特征信息。
在上述技術方案的基礎上,本發(fā)明還可以做如下改進。
進一步,實現(xiàn)步驟S5的具體方法為:將n組損失值分別返回對應的特征提取模型和特征分類器中,所述特征提取模型根據(jù)返回的損失值來調(diào)整各自的配置參數(shù),得到優(yōu)化后的特征提取模型,所述特征分類器根據(jù)返回的損失值來調(diào)整各自的配置參數(shù),得到優(yōu)化后的特征分類器。
采用上述進一步方案的有益效果是:通過損失值使特征提取模型和特征分類器最終趨于最優(yōu)解。
進一步,所述步驟S5后還包括步驟S6:通過n個優(yōu)化后的特征提取模型和特征分類器來得到優(yōu)化后的n組特征分類。
進一步,實現(xiàn)步驟S6的具體方法為:將n塊行人圖像重新輸入n個已優(yōu)化的特征提取模型中,得到優(yōu)化后的n組特征信息,并將n組特征信息輸入n個已優(yōu)化的特征分類器,得到優(yōu)化后的n組特征分類。
采用上述進一步方案的有益效果是:通過已優(yōu)化的特征提取模型和特征分類器來得到更好的特征提取及特征分類訓練。
進一步,得到優(yōu)化后的n組特征分類后還包括步驟:將優(yōu)化后的n組特征分類進行特征融合,得到行人圖像的特征融合數(shù)據(jù)。
采用上述進一步方案的有益效果是:能夠獲取到特征融合數(shù)據(jù)進行行人識別。
進一步,得到行人圖像的特征融合數(shù)據(jù)后還包括步驟:對行人圖像的特征融合數(shù)據(jù)設置標簽。
采用上述進一步方案的有益效果是:便于辨認和區(qū)分多個識別后的行人圖像。
進一步,所述特征提取模型包括參數(shù)配置模塊、多層卷積層、池化層和多層全連接層,
所述參數(shù)配置模塊,用于對多層卷積層、池化層和多層全連接層進行參數(shù)配置,并根據(jù)損失值更新各個所述參數(shù)配置;
所述多層卷積層,用于對行人圖像分塊進行多層卷積運算,并根據(jù)神經(jīng)元激活函數(shù)計算多層卷積的輸出值來提取特征信息;
所述池化層,用于對提取到的特征信息進行最大池化處理來減小行人圖像分塊的尺寸;
所述多層全連接層,用于對最大池化處理后的行人圖像分塊進行多層神經(jīng)元節(jié)點的連接運算。
采用上述進一步方案的有益效果是:可以兼顧局部特征與整體特征,能在保證特征提取效果的基礎上含有較少的網(wǎng)絡參數(shù),可以達到效率和準確率的最優(yōu)。
進一步,所述特征分類器為Softmax分類器。
采用上述進一步方案的有益效果是:可自主學習特征,將各車臉特征分類識別,得到較高的準確率。
本發(fā)明解決上述技術問題的另一技術方案如下:一種自適應深度空間特征的行人識別系統(tǒng),包括:
分割模塊,用于獲取行人圖像,并根據(jù)預設的分割數(shù)目n將所述行人圖像進行分割,得到n塊行人圖像分塊;
特征信息提取模塊,用于建立與行人圖像分塊數(shù)目相同的n組特征提取模型,所述n組特征提取模型一一對應的從所述n塊行人圖像分塊中提取特征信息,得到n組特征信息;
特征信息分類模塊,用于建立與特征信息組別數(shù)目相同的n組特征分類器,所述n組特征分類器一一對應的對所述n組特征信息進行特征分類;
損失值模塊,用于根據(jù)反向傳播算法分別計算每組特征分類過程中所產(chǎn)生的損失值,得到n組損失值;
優(yōu)化模塊,用于將n組損失值分別返回對應的特征提取模型和特征分類器中,得到優(yōu)化后的特征提取模型和特征分類器。
所述優(yōu)化模塊中,將n組損失值分別返回對應的特征提取模型和特征分類器中,所述特征提取模型根據(jù)返回的損失值來調(diào)整各自的配置參數(shù),得到優(yōu)化后的特征提取模型,所述特征分類器根據(jù)返回的損失值來調(diào)整各自的配置參數(shù),得到優(yōu)化后的特征分類器。
采用將行人圖像分塊的方式去提取行人特征,每塊行人圖像分塊分別對應一特征提取模型和特征分類器,能夠有效提取到行人更多的信息,尤其是局部信息,而采用損失值反饋的形式自適應的行人特征分類,最終趨于最優(yōu)解,能夠指引行人特征提取模型提取到更多深度空間的行人特征信息。
附圖說明
圖1為本發(fā)明自適應深度空間特征的行人識別方法實施例的方法流程圖;
圖2為本發(fā)明自適應深度空間特征的行人識別系統(tǒng)實施例的模塊框圖;
圖3為本發(fā)明具體實施例中特征提取及特征分類的數(shù)據(jù)結(jié)構(gòu)圖;
圖4為本發(fā)明具體實施例中頭部數(shù)據(jù)的特征提取及特征分類的數(shù)據(jù)結(jié)構(gòu)圖。
具體實施方式
以下結(jié)合附圖對本發(fā)明的原理和特征進行描述,所舉實例只用于解釋本發(fā)明,并非用于限定本發(fā)明的范圍。
如圖1所示的一種自適應深度空間特征的行人識別方法,包括如下步驟:
步驟S1:獲取行人圖像,并根據(jù)預設的分割數(shù)目n將所述行人圖像進行分割,得到n塊行人圖像分塊;
步驟S2:建立與行人圖像分塊數(shù)目相同的n組特征提取模型,所述n組特征提取模型一一對應的從所述n塊行人圖像分塊中提取特征信息,得到n組特征信息;一一對應為一個特征提取模型對應一個行人圖像分塊進行特征信息的提??;
步驟S3:建立與特征信息組別數(shù)目相同的n組特征分類器,所述n組特征分類器一一對應的對所述n組特征信息進行特征分類;一一對應為一個特征分類器對應一組特征信息進行特征分類;
步驟S4:根據(jù)反向傳播算法分別計算每組特征分類過程中所產(chǎn)生的損失值,得到n組損失值;
步驟S5:將n組損失值分別返回對應的特征提取模型和特征分類器中,得到優(yōu)化后的特征提取模型和特征分類器。
采用將行人圖像分塊的方式去提取行人特征,每塊行人圖像分塊分別對應一特征提取模型和特征分類器,能夠有效提取到行人更多的信息,尤其是局部信息,而采用損失值反饋的形式自適應的行人特征分類,最終趨于最優(yōu)解,能夠指引行人特征提取模型提取到更多深度空間的行人特征信息。
具體的,在該實施例中,實現(xiàn)步驟S5的具體方法為:將n組損失值分別返回對應的特征提取模型和特征分類器中,所述特征提取模型根據(jù)返回的損失值來調(diào)整各自的配置參數(shù),得到優(yōu)化后的特征提取模型,所述特征分類器根據(jù)返回的損失值來調(diào)整各自的配置參數(shù),得到優(yōu)化后的特征分類器。
上述實施例中,通過損失值使特征提取模型和特征分類器最終趨于最優(yōu)解。
具體的,在該實施例中,所述步驟S5后還包括步驟S6:通過n個優(yōu)化后的特征提取模型和特征分類器來得到優(yōu)化后的n組特征分類。
實現(xiàn)步驟S6的具體方法為:將n塊行人圖像重新輸入n個已優(yōu)化的特征提取模型中,得到優(yōu)化后的n組特征信息,并將n組特征信息輸入n個已優(yōu)化的特征分類器,得到優(yōu)化后的n組特征分類。
上述實施例中,通過已優(yōu)化的特征提取模型和特征分類器來得到更好的特征分類。
具體的,在該實施例中,得到優(yōu)化后的n組特征分類后還包括步驟:將優(yōu)化后的n組特征分類進行特征融合,得到行人圖像的特征融合數(shù)據(jù)。
上述實施例中,能夠獲取到特征融合數(shù)據(jù)進行行人識別。
在該實施例中,得到行人圖像的特征融合數(shù)據(jù)后還包括步驟:對行人圖像的特征融合數(shù)據(jù)設置標簽。
上述實施例中,便于辨認多個識別后行人圖像。
具體的,在該實施例中,所述特征提取模型包括參數(shù)配置模塊、多層卷積層、池化層和多層全連接層,
所述參數(shù)配置模塊,用于對多層卷積層、池化層和多層全連接層進行參數(shù)配置,并根據(jù)損失值更新各個所述參數(shù)配置;
所述多層卷積層,用于對行人圖像分塊進行多層卷積運算,并根據(jù)神經(jīng)元激活函數(shù)計算多層卷積的輸出值來提取特征信息;
所述池化層,用于對提取到的特征信息進行最大池化處理來減小行人圖像分塊的尺寸;
所述多層全連接層,用于對最大池化處理后的行人圖像分塊進行多層神經(jīng)元節(jié)點的連接運算。
具體的,所述卷積層,可訓練的卷積核對圖像做卷積運算,并使用神經(jīng)元激活函數(shù)計算卷積的輸出值,卷積公式為:
其中,xi為第i層輸入圖像,yj為第j層輸出圖像,相應的,ki,j是連接第i層輸入圖像與第j層輸出圖像的卷積核,bj是第j層輸出圖像的偏置,是卷積運算符,f(x)是神經(jīng)元激活函數(shù)。本實施例使用relu非線性函數(shù)作為激活函數(shù),即f(x)=max(0,x),該函數(shù)可以加快深度網(wǎng)絡的收斂速度。公式(1)中的卷積核ki,j與偏置bj是卷積網(wǎng)絡的訓練參數(shù),通過大量的迭代訓練得到較優(yōu)取值。
所述池化層,該層對卷積層的輸出圖做下采樣,減小特征圖尺寸,增強特征對旋轉(zhuǎn)和形變的魯棒性,常見的池化方法有平均池化與最大池化,其中最大池化可以表示為:
其中為池化層的第i層輸出圖在(j,k)位置的值,l為池化的步長,m為池化尺寸。
所述多層全連接層,在多層全連接層當中,上一層的任何一個神經(jīng)元節(jié)點都與下一層的所有神經(jīng)元節(jié)點連接。全連接層的參數(shù)由節(jié)點權重矩陣W和偏置b構(gòu)成,全連接層的運算可以表示為:
y=f(W·x+b) (3)
其中,x、y分別是為輸入、輸出數(shù)據(jù),f是激活函數(shù)。
上述實施例中,可以兼顧局部特征與整體特征,能在保證特征提取效果的基礎上含有較少的網(wǎng)絡參數(shù),可以達到效率和準確率的最優(yōu)。
具體的,在該實施例中,所述特征分類器為Softmax分類器。
所述Softmax分類器,連接最后一層全連接層,使用公式(4)計算得到每一類的概率輸出。
其中,xi為Softmax分類器第i個節(jié)點值,yi為第i個輸出值,n為Softmax分類器的節(jié)點個數(shù)。
上述實施例中,可自主學習特征,將各車臉特征分類識別,得到較高的準確率。
如圖2所示,本發(fā)明實施例還提供一種自適應深度空間特征的行人識別系統(tǒng),包括:
分割模塊,用于獲取行人圖像,并根據(jù)預設的分割數(shù)目n將所述行人圖像進行分割,得到n塊行人圖像分塊;
特征信息提取模塊,用于建立與行人圖像分塊數(shù)目相同的n組特征提取模型,所述n組特征提取模型一一對應的從所述n塊行人圖像分塊中提取特征信息,得到n組特征信息;
特征信息分類模塊,用于建立與特征信息組別數(shù)目相同的n組特征分類器,所述n組特征分類器一一對應的對所述n組特征信息進行特征分類;
損失值模塊,用于根據(jù)反向傳播算法分別計算每組特征分類過程中所產(chǎn)生的損失值,得到n組損失值;
優(yōu)化模塊,用于將n組損失值分別返回對應的特征提取模型和特征分類器中,得到優(yōu)化后的特征提取模型和特征分類器。
所述優(yōu)化模塊中,將n組損失值分別返回對應的特征提取模型和特征分類器中,所述特征提取模型根據(jù)返回的損失值來調(diào)整各自的配置參數(shù),得到優(yōu)化后的特征提取模型,所述特征分類器根據(jù)返回的損失值來調(diào)整各自的配置參數(shù),得到優(yōu)化后的特征分類器。
具體的,特征提取及特征分類的數(shù)據(jù)結(jié)構(gòu)如圖3所示,將整體的行人圖像分割為三部分:頭部數(shù)據(jù)、身體數(shù)據(jù)和腿部數(shù)據(jù),其中,Data為整體行人圖像,Data_head為頭部數(shù)據(jù),Data_body為身體數(shù)據(jù),Data_leg為腿部數(shù)據(jù);CNN_head為頭部特征提取數(shù)據(jù),CNN_body為身體特征提取數(shù)據(jù),CNN_leg為腿部特征提取數(shù)據(jù);Softmax為Softmax分類器的數(shù)據(jù),Concat為特征融合數(shù)據(jù),PersonID為行人標簽數(shù)據(jù)。
具體的,對頭部數(shù)據(jù)特征提取及特征分類的數(shù)據(jù)結(jié)構(gòu)如圖4所示,其中,
Data_head為頭部數(shù)據(jù),conv1為卷積層1,pool1為池化層1,relu1為激活函數(shù)1,Conv2為卷積層2,relu2為激活函數(shù)2,Conv3為卷積層3relu3為激活函數(shù)3,Conv4為卷積層4,pool4:池化層4,relu4:激活函數(shù)4,ip1為全連接層1,relu5為激活函數(shù)5,dropout1為輟學層1,ip2為全連接層2,relu6為激活函數(shù)6,dropout2為輟學層2,ip3為全連接層3。
需理解的,Dropout是指在模型訓練時隨機讓網(wǎng)絡某些隱含層節(jié)點的權重不工作,不工作的那些節(jié)點可以暫時認為不是網(wǎng)絡結(jié)構(gòu)的一部分,但是它的權重得保留下來,因為下次樣本輸入時它可能又得工作了。
relu激活函數(shù)把輸入值歸約到一個區(qū)間內(nèi),線性方程的線性組合也只有線性表達的能力,這遠遠不夠,所以我們要用relu非線性的組合,使得表達能力更加強大,relu的梯度大多數(shù)情況下是常數(shù),有助于解決深層網(wǎng)絡的收斂問題,relu的另一個優(yōu)勢是在生物上的合理性,它是單邊的。
上述實施例中,采用將行人圖像分塊的方式去提取行人特征,每塊行人圖像分塊分別對應一特征提取模型和特征分類器,能夠有效提取到行人更多的信息,尤其是局部信息,而采用損失值反饋的形式自適應的行人特征分類,最終趨于最優(yōu)解,能夠指引行人特征提取模型提取到更多深度空間的行人特征信息。
以上所述僅為本發(fā)明的較佳實施例,并不用以限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所作的任何修改、等同替換、改進等,均應包含在本發(fā)明的保護范圍之內(nèi)。