一種基于vlad雙重自適應(yīng)的圖像檢索方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明設(shè)及圖像檢索技術(shù)領(lǐng)域,特別是設(shè)及一種基于VLAD雙重自適應(yīng)的圖像檢 索方法。
【背景技術(shù)】
[0002] 隨著數(shù)字技術(shù)、傳感技術(shù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,圖像的數(shù)量和內(nèi)容越來越豐 富。面對(duì)著該樣一個(gè)巨大的、實(shí)時(shí)擴(kuò)展、時(shí)刻變化的數(shù)據(jù)庫,如何從中檢索到自己感興趣的 相關(guān)信息,就顯得尤為重要。面對(duì)該個(gè)需求研究人員開始越來越多地關(guān)注大規(guī)模圖像的有 效檢索問題。在早期的研究中,研究者們引入了視覺詞袋,增強(qiáng)了描述符的表達(dá)強(qiáng)度并減 少了量化損失,取得了顯著的效果。但是隨著研究的不斷深入和圖像規(guī)模的迅速增大,圖 像描述符所占內(nèi)存也越來越大,使得早期方法的局限性越來越明顯。
[0003]近幾年來研究者們引入了圖像局部緊致描述符向量(VLAD),該圖像描述符的維度 很低,使得非常大的圖像數(shù)據(jù)集的所有描述符仍然可W適應(yīng)內(nèi)存,由此開辟了一個(gè)權(quán)衡圖 像描述符內(nèi)存占用和檢索性能的研究主題。局部緊致描述符向量類似于視覺詞袋,它們依 賴于量化局部描述符SIFT特征為例)。但是它們又存在兩點(diǎn)不同,一方面是;視覺詞 袋記錄的是SIFT特征屬于各聚類中屯、上的投影數(shù)目,而VLAD記錄的是SIFT特征與其對(duì)應(yīng) 聚類中屯、的差值累加和。VLAD繼承了原始SIFT特征的一些不變特性,如平面旋轉(zhuǎn)不變性。 另一方面是;VLAD檢索系統(tǒng)可W不依賴于原始的局部描述符,而視覺詞袋系統(tǒng)則需要利用 原始的局部描述符進(jìn)行空間校驗(yàn)和重排序等,因此當(dāng)處理非常大的圖像數(shù)據(jù)集時(shí)需要很大 的存儲(chǔ)空間來保存該些數(shù)據(jù)。
[0004] VLAD檢索系統(tǒng)對(duì)特征的聚類中屯、有很強(qiáng)的依賴性,通過利用好的聚類中屯、計(jì)算得 到的VLAD進(jìn)行檢索可W得到較高的精確度,反之,當(dāng)聚類中屯、不好時(shí)精確度較低。聚類中 屯、的好壞取決于聚類中屯、能否恰當(dāng)?shù)拿枋鰴z索圖像庫中描述符分布的情況。面對(duì)大規(guī)模的 圖像數(shù)據(jù)集檢索需求,如何快速自適應(yīng)的計(jì)算出好的聚類中屯、并提高檢索精確度成為一個(gè) 亟待解決的問題。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明為了解決大規(guī)模圖像數(shù)據(jù)集檢索中如何快速自適應(yīng)的計(jì)算聚類中屯、并提 高檢索精確度的問題,提出了一種基于VLAD雙重自適應(yīng)的圖像檢索方法。
[0006] 上述發(fā)明目的是通過W下技術(shù)方案實(shí)現(xiàn)的:
[0007] 步驟1 ;利用待檢索的大規(guī)模圖像數(shù)據(jù)庫和粗趟的聚類中屯、Z,計(jì)算并保存分配到 每一個(gè)聚類中屯、的所有描述符之和W及描述符的個(gè)數(shù)。
[0008] 步驟2 ;通過上述保存的數(shù)據(jù)計(jì)算新的聚類中屯、f。
[0009]步驟3 ;利用步驟1中保存的數(shù)據(jù)和新的聚類中屯、f,針對(duì)每一個(gè)查詢圖像重新計(jì) 算聚類中屯、Z',然后求得VLAD。
[0010] 步驟4 ;對(duì)VLAD進(jìn)行兩次歸一化,利用余弦距離計(jì)算查詢圖像與待檢索數(shù)據(jù)庫中 圖像的相似距離,排序后取前N幅圖像作為檢索結(jié)果圖像集合。
[0011] 所述步驟1的具體步驟為;對(duì)待檢索大規(guī)模圖像數(shù)據(jù)庫A中的每幅圖像提取SIFT 特征,粗趟聚類中屯、是由圖像數(shù)據(jù)庫B通過K-均值聚類得到的,圖像數(shù)據(jù)庫B與圖像數(shù)據(jù) 庫A相關(guān)但不一致。假設(shè)聚類中屯、個(gè)數(shù)為k,每一個(gè)SIFT描述符被分配到距其最近的聚類 中屯、,保存分配到每一個(gè)聚類中屯、的描述符之巧
j = 1,2…k W及其對(duì)應(yīng)的 描述符的個(gè)數(shù)rv其中Xii表示的是屬于第j個(gè)聚類中屯、的第i個(gè)SIFT描述符。
[0012] 所述步驟2的具體步驟為:分配到每一個(gè)聚類中屯、的描述符之和Sj.是一個(gè)128 維的向量,利用與其對(duì)應(yīng)的描述符個(gè)數(shù)rij.求平均向量,即得新的k個(gè)聚類中屯、,表達(dá)式為: ?二;?/二1,2'?,其中f .表示第j個(gè)新的聚類中屯、。
[0013] 所述步驟3的具體步驟為;在檢索過程中,針對(duì)每一個(gè)查詢圖像提取其SIFT特征, 并將SIFT特征分配給最近鄰的由步驟2得到的聚類中屯、f,保存查詢圖像中每個(gè)聚類中 屯、的描述符之和
,j = l,2,一k W及其對(duì)應(yīng)的描述符個(gè)數(shù)巧其中表示 查詢圖像根據(jù)新的聚類中屯、重新分配到第j個(gè)聚類中屯、的第i個(gè)描述符。重新計(jì)算新的描 述符之和5^^二^"^. ^及其對(duì)應(yīng)描述符個(gè)數(shù),然后通過^;二^ :得 到最終的自適應(yīng)聚類中屯、Z',并根據(jù)Z'計(jì)算每幅圖像的VLAD。
[0014] VLAD的構(gòu)造過程是將一幅圖像的所有描述符分配到k個(gè)聚類中屯、的最近鄰類別 中,計(jì)算描述符與其聚類中屯、的殘差,屬于同一聚類中屯、的殘差被累加起來,k個(gè)128維的 殘差之和被連接成為一個(gè)單獨(dú)的k*128維度的描述符,即為未歸一化的VLAD。具體計(jì)算公 式如下:
[0015]
[0016]其中Vj.表示每幅圖像分配到第j個(gè)聚類中屯、Z'J的殘差之和,X' 表示每幅 圖像分配到第j個(gè)聚類中屯、Z' J的第i個(gè)描述符。
[0017] 所述步驟4的具體步驟;對(duì)每一個(gè)VLAD中分配到每一個(gè)聚類中屯、的殘差之和Vj進(jìn) 行L2范數(shù)歸一化,然后再對(duì)拼接后的向量V進(jìn)行L2范數(shù)歸一化。利用余弦距離計(jì)算查詢 圖像與待檢索數(shù)據(jù)庫中圖像的相似距離,排序后返回前N幅圖像作為檢索結(jié)果圖像集合。 [001引傳統(tǒng)的檢索技術(shù)僅適用于檢索與自適應(yīng)聚類中屯、對(duì)應(yīng)的一致性數(shù)據(jù)庫,當(dāng)加入新 的圖像時(shí),則自適應(yīng)性無法生效。而本發(fā)明基于VLAD雙重自適應(yīng)的圖像檢索方法則可W在 已知聚類中屯、的基礎(chǔ)上快速自適應(yīng)的得到一個(gè)較好的聚類中屯、,而針對(duì)具體的查詢圖像, 再一次的進(jìn)行自適應(yīng)計(jì)算則可W得到一個(gè)更好的聚類中屯、,具有更強(qiáng)的適應(yīng)性,相較于僅 一次的自適應(yīng)聚類中屯、計(jì)算有更高的精確度。
【附圖說明】
[0019] 圖1是本發(fā)明基于VLAD雙重自適應(yīng)的圖像檢索方法的流程示意圖。
【具體實(shí)施方式】
[0020] 下面結(jié)合附圖和【具體實(shí)施方式】對(duì)本發(fā)明基于VLAD雙重自適應(yīng)的圖像檢索方法作 進(jìn)一步的說明:
[0021] 如圖所示,本發(fā)明首先利用待檢索的大規(guī)模圖像數(shù)據(jù)庫和粗趟的聚類中屯、,計(jì)算 并保存分配到每一個(gè)聚類中屯、的所有描述符之和W及描述符的個(gè)數(shù);然后利用保存的數(shù)據(jù) 計(jì)算第一次的自適應(yīng)聚類中屯、;再次利用描述符之和、其對(duì)應(yīng)的描述符的個(gè)數(shù)W及新的聚 類中屯、,針對(duì)每一個(gè)查詢圖像重新計(jì)算聚類中屯、,并求得VLAD ;最后對(duì)VLAD進(jìn)行兩次歸一 化,利用余弦距離計(jì)算查詢圖像與待檢索數(shù)據(jù)庫中圖像的相似距離,排序后取前N幅圖像 作為檢索結(jié)果圖像集合。
[0022] 其具體實(shí)現(xiàn)過程為:
[0023] 步驟1 ;對(duì)待檢索大規(guī)模圖像數(shù)據(jù)庫A中的每幅圖像提取SIFT特征,粗趟聚類中 屯、是由圖像數(shù)據(jù)庫B通過K-均值聚類得到的,圖像數(shù)據(jù)庫B與圖像數(shù)據(jù)庫A相關(guān)但不一致。 假設(shè)聚類中屯、個(gè)數(shù)為k,每一個(gè)SIFT描述符被分