本發(fā)明涉及一種融合顏色特征與詞匯樹的車輛圖像檢索方法,屬于圖像處理與分析在智能交通系統(tǒng)上的應(yīng)用。
背景技術(shù):
車輛圖像檢索是智能交通系統(tǒng)的重要組成部分,是公安系統(tǒng)破獲車輛被盜等相關(guān)案件的重要手段。所以面對城市交通中的海量卡口高清圖像,車輛圖像檢索的準(zhǔn)確性和高效性對及時破案極為關(guān)鍵?;谠~袋模型的圖像檢索機制是近幾年來圖像檢索領(lǐng)域的主流方法,該方法將大量訓(xùn)練圖像特征(通常是SIFT特征)通過k-means聚類映射為視覺單詞的集合,構(gòu)成視覺單詞詞典。然后將測試圖像的特征逐個匹配量化到視覺單詞詞典中,得到了圖像的視覺單詞直方圖。由于將大量特征量化到視覺單詞這個過程時間耗損過大,為此,Nistér等人提出了利用分層k-means聚類的方法生成視覺單詞詞匯樹,有效解決了搜索非層次化單詞帶來的量化過程太慢的問題,生成的視覺單詞由TF-IDF模型(詞頻-逆文檔頻率)加權(quán)。由于視覺詞匯樹模型采用的SIFT特征只采用了灰度信息,而忽略了圖像的全局顏色特征,因此,本發(fā)明將車輛圖像的顏色信息作為圖像全局權(quán)值融入到視覺單詞匹配模型中去,從而提高車輛圖像的檢索精度,同時本發(fā)明引入感知哈希算法原理,能有效節(jié)約大規(guī)模車輛圖像檢索時間。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種融合顏色特征與詞匯樹的車輛圖像檢索方法,本發(fā)明檢索時間縮短,并在一定程度上提高檢索精度,能夠滿足現(xiàn)實使用中對準(zhǔn)確性和實時性的要求。
為解決上述技術(shù)問題,本發(fā)明所采用的技術(shù)方案是:一種融合顏色特征與詞匯樹的車輛圖像檢索方法,其特征在于,包括以下部分:
S01、詞匯樹的創(chuàng)建:對訓(xùn)練圖像庫中的每幅圖像先提取車身部分,對于剔除掉背景部分的車輛圖像提取SIFT特征,這樣就得到了一個特征集合F={f(i)}。然后對特征集合F進行分層k-means聚類。初始時,在詞匯樹的第一層上對特征集合F進行第一次k-means聚類,計算出每個聚類的中心向量Ci。類似的,對新產(chǎn)生的每個聚類再用k-means聚類聚成k個簇集,不斷地重復(fù)上述操作直到樹的深度達到預(yù)先設(shè)定的L值,每個簇集定義為一個視覺單詞,得到視覺單詞詞匯樹;
S02、用權(quán)值向量來表示圖像:提取測試圖像庫中圖像的車身部分,對于剔除掉背景部分的車輛圖像提取SIFT特征,分別將每個SIFT特征分配給詞匯樹中最為接近的視覺單詞,然后依據(jù)每幅圖像中視覺單詞出現(xiàn)的次數(shù)以及視覺單詞與圖像的相關(guān)程度來計算圖像的視覺單詞權(quán)值;
S03、顏色特征權(quán)重的計算:提取圖像車身部分HSV顏色空間模型,采用均勻分段的方法對特征進行量化,再將特征向量統(tǒng)一到一個特征度中,計算查詢圖像與待檢索圖像之間的特征度歐式距離排序并標(biāo)號,根據(jù)顏色標(biāo)號建立顏色特征權(quán)重;
S04、感知哈希進制數(shù)的選擇:為提高大規(guī)模圖像的檢索效率,本發(fā)明采用感知哈希算法原理,將視覺單詞分別量化給不同的哈希碼,在綜合考慮本發(fā)明的量化時間與檢索正確率之后,本發(fā)明的進制數(shù)選取為4;
S05、圖像相似度計算:通過漢明距離計算圖像哈希序列的感知距離,再將顏色特征權(quán)重作為漢明距離的加權(quán)系數(shù)得到最終查詢圖像與待檢索圖像的相似度sim(q,d)=CqdHqd,將最為相似圖像輸出。
作為本發(fā)明的進一步說明,所述步驟S02具體為:
(1)對測試庫中每一幅圖像首先提取車身部分,對車身部分提取SIFT特征,這樣就得到了一個特征集合F={f(i)}以及相應(yīng)的圖像ID集合imgID={id(i)};
(2)根據(jù)距離最近原則將SIFT特征分配給詞匯樹中最鄰近的視覺單詞,這樣每幅圖像的SIFT特征就轉(zhuǎn)化成了視覺單詞;
(3)wi,j則表示圖像dj中視覺單詞Fi的權(quán)值,即視覺單詞Fi與圖像dj的相關(guān)程度。權(quán)值是按照TF-IDF的原理定義的,mi,j表示視覺單詞Fi在圖像dj中出現(xiàn)的次數(shù),它可以用來衡量視覺單詞用來描述圖像的好壞程度。N表示圖像庫中圖像的總數(shù),ni表示包含視覺單詞Fi的圖像數(shù)目。逆文獻頻率定義為idfi=lg(N/ni),它表示的含義是視覺單詞對于區(qū)分相似圖像和不相似圖像的作用大小。所以,wi,j可以表示為
(4)圖像dj可以用視覺單詞的權(quán)值向量來表示為dj=[w1,j,w2,j,L,wt,j],測試圖像庫中的所有圖像可以用矩陣表示為
作為本發(fā)明的進一步改進,所述步驟S03具體為:
(1)對圖像直接提取HSV空間顏色特征向量,為了降低計算復(fù)雜程度,采用均勻分段的方法對顏色特征進行量化,為了降低計算復(fù)雜程度,采用均勻分段的方法對顏色特征進行量化,在根據(jù)公式L=HQSQV+SQV+V將特征向量統(tǒng)一到一個特征度中,其中QS、QV分別表示飽和度和亮度分量的量化級數(shù);
(2)計算查詢圖像與待檢索圖像之間的特征度歐式距離,根據(jù)歐式距離由小到大進行排序并標(biāo)號,顏色最相似的標(biāo)號為1,第二相似標(biāo)號為2,以此類推;
(3)根據(jù)顏色的標(biāo)號建立顏色特征權(quán)重,查詢圖像q和圖像d的顏色特征權(quán)重計算公式為其中Rqd表示在查詢圖像為q時,圖像d的標(biāo)號。
作為本發(fā)明的進一步說明,所述步驟S04具體為:
(1)鑒于本發(fā)明的進制數(shù)為4,計算同一視覺單詞在各個圖像中權(quán)值的和,平均將它分為四段,每一段表示一個哈希碼,得到四個哈希碼區(qū)間;
(2)將每個視覺單詞與其對應(yīng)的視覺單詞的哈希碼區(qū)間進行比較,分別將各個視覺單詞映射給哈希碼,得到圖像的哈希碼序列。
本發(fā)明的有益效果是,將圖像的顏色特征作為全局權(quán)值加入到視覺單詞的權(quán)值匹配中去,將全局特征與局部特征綜合考慮,并引入感知哈希算法原理,在有效節(jié)約檢索時間的基礎(chǔ)上,也一定程度提高了車輛圖像檢索的準(zhǔn)確率。
附圖說明
圖1為本發(fā)明所提供的一種融合顏色特征與詞匯樹的車輛圖像檢索方法流程圖。
具體實施方式
下面結(jié)合附圖所示的各實施方式對本發(fā)明進行詳細說明,但應(yīng)當(dāng)說明的是,這些實施方式并非對本發(fā)明的限制,本領(lǐng)域普通技術(shù)人員根據(jù)這些實施方式所作的功能、方法、或者結(jié)構(gòu)上的等效變換或替代,均屬于本發(fā)明的保護范圍之內(nèi)。
針對當(dāng)前基于詞袋模型以及詞匯樹的車輛圖像檢索方法采用的SIFT特征只基于灰度信息,忽略了圖像的顏色信息,本發(fā)明提出了一種融合顏色特征與詞匯樹的車輛圖像檢索方法,下面進行詳細說明:
在本實施方式中,一種融合顏色特征與詞匯樹的車輛檢索方法,其包括以下部分:
S01、詞匯樹的創(chuàng)建:對訓(xùn)練圖像庫中的每幅圖像先提取車身部分,對于剔除掉背景部分的車輛圖像提取SIFT特征,這樣就得到了一個特征集合F={f(i)}。然后對特征集合F進行分層k-means聚類。初始時,在詞匯樹的第一層上對特征集合F進行第一次k-means聚類,計算出每個聚類的中心向量Ci。類似的,對新產(chǎn)生的每個聚類再用k-means聚類聚成k個簇集,不斷地重復(fù)上述操作直到樹的深度達到預(yù)先設(shè)定的L值,每個簇集定義為一個視覺單詞,得到視覺單詞詞匯樹;
S02、用權(quán)值向量來表示圖像:提取測試圖像庫中圖像的車身部分,對于剔除掉背景部分的車輛圖像提取SIFT特征,分別將每個SIFT特征分配給詞匯樹中最為接近的視覺單詞,然后依據(jù)每幅圖像中視覺單詞出現(xiàn)的次數(shù)以及視覺單詞與圖像的相關(guān)程度來計算圖像的視覺單詞權(quán)值;
所述步驟S02具體為:
(1)對測試庫中每一幅圖像首先提取車身部分,對車身部分提取SIFT特征,這樣就得到了一個特征集合F={f(i)}以及相應(yīng)的圖像ID集合imgID={id(i)};
(2)根據(jù)距離最近原則將SIFT特征分配給詞匯樹中最鄰近的視覺單詞,這樣每幅圖像的SIFT特征就轉(zhuǎn)化成了視覺單詞;
(3)wi,j則表示圖像dj中視覺單詞Fi的權(quán)值,即視覺單詞Fi與圖像dj的相關(guān)程度。權(quán)值是按照TF-IDF的原理定義的,mi,j表示視覺單詞Fi在圖像dj中出現(xiàn)的次數(shù),它可以用來衡量視覺單詞用來描述圖像的好壞程度。N表示圖像庫中圖像的總數(shù),ni表示包含視覺單詞Fi的圖像數(shù)目。逆文獻頻率定義為idfi=lg(N/ni),它表示的含義是視覺單詞對于區(qū)分相似圖像和不相似圖像的作用大小。所以,wi,j可以表示為
(4)圖像dj可以用視覺單詞的權(quán)值向量來表示為dj=[w1,j,w2,j,L,wt,j],測試圖像庫中的所有圖像可以用矩陣表示為
S03、顏色特征權(quán)重的計算:提取圖像車身部分HSV顏色空間模型,采用均勻分段的方法對特征進行量化,再將特征向量統(tǒng)一到一個特征度中,計算查詢圖像與待檢索圖像之間的特征度歐式距離排序并標(biāo)號,根據(jù)顏色標(biāo)號建立顏色特征權(quán)重;
所述步驟S03具體為:
(1)對圖像直接提取HSV空間顏色特征向量,為了降低計算復(fù)雜程度,采用均勻分段的方法對顏色特征進行量化,為了降低計算復(fù)雜程度,采用均勻分段的方法對顏色特征進行量化,在根據(jù)公式L=HQSQV+SQV+V將特征向量統(tǒng)一到一個特征度中,其中QS、QV分別表示飽和度和亮度分量的量化級數(shù);
(2)計算查詢圖像與待檢索圖像之間的特征度歐式距離,根據(jù)歐式距離由小到大進行排序并標(biāo)號,顏色最相似的標(biāo)號為1,第二相似標(biāo)號為2,以此類推;
(3)根據(jù)顏色的標(biāo)號建立顏色特征權(quán)重,查詢圖像q和圖像d的顏色特征權(quán)重計算公式為其中Rqd表示在查詢圖像為q時,圖像d的標(biāo)號。
S04、感知哈希進制數(shù)的選擇:為提高大規(guī)模圖像的檢索效率,本發(fā)明采用感知哈希算法原理,將視覺單詞分別量化給不同的哈希碼,在綜合考慮本發(fā)明的量化時間與檢索正確率之后,本發(fā)明的進制數(shù)選取為4;
所述步驟S04具體為:
(1)鑒于本發(fā)明的進制數(shù)為4,計算同一視覺單詞在各個圖像中權(quán)值的和,平均將它分為四段,每一段表示一個哈希碼,得到四個哈希碼區(qū)間;
(2)將每個視覺單詞與其對應(yīng)的視覺單詞的哈希碼區(qū)間進行比較,分別將各個視覺單詞映射給哈希碼,得到圖像的哈希碼序列。
S05、圖像相似度計算:通過漢明距離計算圖像哈希序列的感知距離,再將顏色特征權(quán)重作為漢明距離的加權(quán)系數(shù)得到最終查詢圖像與待檢索圖像的相似度sim(q,d)=CqdHqd,將最為相似圖像輸出。
以上已以較佳實施例公開了本發(fā)明,然其并非用以限制本發(fā)明,凡采用等同替換或者等效變換方式所獲得的技術(shù)方案,均落在本發(fā)明的保護范圍之內(nèi)。
對于本領(lǐng)域技術(shù)人員而言,顯然本發(fā)明不限于上述示范性實施例的細節(jié),而且在不背離本發(fā)明的精神或基本特征的情況下,能夠以其他的具體形式實現(xiàn)本發(fā)明。因此,無論從哪一點來看,均應(yīng)將實施例看作是示范性的,而且是非限制性的,本發(fā)明的范圍由所附權(quán)利要求而不是上述說明限定,因此旨在將落在權(quán)利要求的等同要件的含義和范圍內(nèi)的所有變化囊括在本發(fā)明內(nèi)。不應(yīng)將權(quán)利要求中的任何附圖標(biāo)記視為限制所涉及的權(quán)利要求。
此外,雖然本說明書按照實施方式加以描述,但并非每個實施方式僅包含一個獨立的技術(shù)方案,說明書的這種敘述方式僅僅是為清楚起見,本領(lǐng)域技術(shù)人員應(yīng)當(dāng)將說明書作為一個整體,各實施例中的技術(shù)方案也可以經(jīng)適當(dāng)組合,形成本領(lǐng)域技術(shù)人員可以理解的其他實施方式。