本發(fā)明涉及一種在大規(guī)模圖片數(shù)據(jù)集中對(duì)圖片進(jìn)行近似搜索的方法,屬于機(jī)器學(xué)習(xí)技術(shù)領(lǐng)域。
背景技術(shù):
近鄰查詢中一個(gè)重要的應(yīng)用就是圖片的近似搜索。在大數(shù)據(jù)時(shí)代,圖片數(shù)據(jù)最明顯的特點(diǎn)是數(shù)據(jù)規(guī)模極大,圖片本身的特征維度很高。對(duì)于海量高維圖片高效準(zhǔn)確的近鄰查詢對(duì)計(jì)算機(jī)視覺(jué)、機(jī)器學(xué)習(xí)等前沿學(xué)科的研究有著極為重要的應(yīng)用價(jià)值。
傳統(tǒng)的近鄰查詢算法,比如基于樹的索引結(jié)構(gòu)的搜索算法,這種搜索算法都存在著維度的問(wèn)題。由于對(duì)高維圖片數(shù)據(jù)進(jìn)行近似近鄰搜索時(shí)性能急劇下滑,已不適用于當(dāng)今的大數(shù)據(jù)時(shí)代?,F(xiàn)在最為流行的方法是基于哈希技術(shù)的近似近鄰搜索,經(jīng)典的近似搜索哈希算法如局部敏感哈希算法(lsh),通過(guò)將近鄰搜索問(wèn)題轉(zhuǎn)換為尋找相似的二進(jìn)制編碼來(lái)解決?;诠<夹g(shù)的近似搜索算法具有更為簡(jiǎn)單的索引結(jié)構(gòu)和更少的存儲(chǔ)空間。但是lsh為了同時(shí)保證精度和召回率,需要構(gòu)建多個(gè)哈希表,導(dǎo)致查詢時(shí)間和存儲(chǔ)開銷的大幅增加。
隨之又出現(xiàn)了可以產(chǎn)生更為高效編碼的哈希算法,一種基于圖的哈希算法由于可以更好的度量圖片樣本之間的相似性從而能夠獲得更好的性能。比如譜哈希(sh)算法,錨哈希(agh)算法。但是這些算法在尋找近鄰圖片時(shí)過(guò)于片面,它們只考慮了圖片在數(shù)據(jù)集中的實(shí)際存儲(chǔ)位置,而沒(méi)有考慮圖片可能具有的語(yǔ)義標(biāo)記信息,這樣使得這些算法在圖片近似搜索中的性能較差。在現(xiàn)實(shí)的大規(guī)模圖片數(shù)據(jù)集中,很多圖片具有語(yǔ)義標(biāo)記信息,不同的類標(biāo)記信息代表圖片屬于不同的類別。比如兩張圖片在數(shù)據(jù)集中可能實(shí)際存儲(chǔ)距離較遠(yuǎn),但是它們具有相同的類標(biāo)記“天空”,那么這兩張圖片也是近似圖片。而且目前流行的圖片近似搜索算法應(yīng)用在大規(guī)模圖片數(shù)據(jù)集上時(shí)往往性能較差,不能很好的解決實(shí)際問(wèn)題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問(wèn)題是:提供一種應(yīng)用于大規(guī)模圖片數(shù)據(jù)集中的基于語(yǔ)義一致性的近似圖片搜索方法。主要解決圖片的近似搜索問(wèn)題并將相似的圖片通過(guò)哈希技術(shù)映射成相同或相似的二進(jìn)制編碼。
本發(fā)明為解決上述技術(shù)問(wèn)題采用以下技術(shù)方案:
本發(fā)明提出一種在大規(guī)模圖片集中基于語(yǔ)義一致性的近似搜索方法,所述方法包括如下步驟:
步驟1:輸入圖片集樣本矩陣x,并輸入圖片集對(duì)應(yīng)的語(yǔ)義類標(biāo)記矩陣y,其中x是n*d維的矩陣,y是n*c維的矩陣,n是圖片樣本的個(gè)數(shù),d是圖片特征的維度,c是類標(biāo)記的數(shù)量;
步驟2:從圖片集中隨機(jī)抽取一部分圖片作為抽樣圖片集;
步驟3:定義圖片集與抽樣圖片集中的圖片間的關(guān)系矩陣w,結(jié)合關(guān)系矩陣并引入語(yǔ)義一致性構(gòu)建目標(biāo)函數(shù)表達(dá)式,通過(guò)隨機(jī)梯度下降算法迭代求解優(yōu)化,待表達(dá)式收斂后即得到優(yōu)化完成的轉(zhuǎn)換矩陣a;
步驟4:對(duì)于每一個(gè)圖片樣本x,將轉(zhuǎn)換矩陣a代入步驟3定義的關(guān)系矩陣中,得到關(guān)系矩陣的各個(gè)元素的值;通過(guò)關(guān)系矩陣構(gòu)建出相似矩陣z,結(jié)合相似矩陣得到編碼矩陣,對(duì)大規(guī)模圖片數(shù)據(jù)集中的各圖片利用編碼矩陣進(jìn)行哈希編碼,將圖片由原始的d維特征壓縮映射成k維的二進(jìn)制編碼;
步驟5:對(duì)于一個(gè)新的查詢圖片q,通過(guò)編碼矩陣計(jì)算出查詢圖片的二進(jìn)制編碼,與圖片數(shù)據(jù)集中各圖片的二進(jìn)制編碼比較漢明距離,如果漢明距離小于設(shè)定的門限閾值r,即認(rèn)為兩圖片是近似圖片。
進(jìn)一步,本發(fā)明的近似搜索方法,轉(zhuǎn)換矩陣a的計(jì)算過(guò)程如下:
步驟(1)、定義圖片間的關(guān)系矩陣w是一個(gè)n*n維的矩陣,關(guān)系矩陣中的每一個(gè)元素定義為:
wij=exp(-||a(xi-uj)||2)(1)
上式中a表示轉(zhuǎn)換矩陣,xi表示圖片集中的第i張圖片,uj表示抽樣圖片集中的第j張圖片;
步驟(2)、定義目標(biāo)函數(shù)式為:
其中,fi表示第i個(gè)圖片樣本的類標(biāo)記向量,類標(biāo)記向量是c維的列向量,向量中元素的值為1或0,分別表示圖片屬于這個(gè)類和不屬于這個(gè)類,fj表示抽樣圖片集中圖片的類標(biāo)記向量,||fi-fj||2即是在訓(xùn)練轉(zhuǎn)換矩陣時(shí)引入的語(yǔ)義一致性質(zhì);
步驟(3)、根據(jù)隨機(jī)梯度下降算法優(yōu)化轉(zhuǎn)換矩陣a,迭代更新規(guī)則如下:
其中,γt是每次迭代過(guò)程中的優(yōu)化步長(zhǎng),轉(zhuǎn)換矩陣的初始值為i/δ,i是d*d維的單位矩陣,δ是圖片集中各圖片之間歐氏距離的中位數(shù);
步驟(4)、圖片集中所有的圖片樣本遍歷結(jié)束后,即得到最終優(yōu)化完成的轉(zhuǎn)換矩陣a。
進(jìn)一步,本發(fā)明的近似搜索方法,步長(zhǎng)γt選取以下值中的一種:1*10-5,1*10-4,1*10-3,或者1*10-2。
進(jìn)一步,本發(fā)明的近似搜索方法,步驟4具體如下:
步驟a、得到轉(zhuǎn)換矩陣a后,再通過(guò)式(1)計(jì)算出每張圖片和抽樣圖片之間的引入語(yǔ)義一致性后的優(yōu)化相似度,即得到了關(guān)系矩陣w的各個(gè)元素的值,如果抽樣圖片集中有m張圖片樣本,那么通過(guò)關(guān)系矩陣構(gòu)建出相似矩陣z,
z矩陣計(jì)算公式定義如下:
其中<i>集合代表的是抽樣圖片集,即只有當(dāng)圖片是屬于抽樣圖片集中的圖片時(shí),才計(jì)算z矩陣上對(duì)應(yīng)元素的值,否則z矩陣上對(duì)應(yīng)元素值為0;
步驟b、設(shè)抽樣圖片集合中圖片的數(shù)量為m,構(gòu)造一個(gè)m*m維的m矩陣,m矩陣定義如下:
m=λ-1/2ztzλ-1/2(5)
其中λ=diag(zt1),是一個(gè)對(duì)角矩陣,計(jì)算得到m矩陣前k個(gè)最大的特征值組成的k*k維的對(duì)角矩陣:∑=diag(δ1,...,δk)∈rk×k和前k個(gè)最大的特征值對(duì)應(yīng)的特征向量組成的m*k維的矩陣:v=[v1,...,vk]∈rm×k;
步驟c、由上式得到的各矩陣,構(gòu)造出最終的編碼矩陣y,y矩陣定義如下:
y是一個(gè)n*k維的矩陣,n代表圖片集中圖片的個(gè)數(shù),k代表映射到二進(jìn)制編碼時(shí)編碼的位數(shù),編碼矩陣y的每行就是一個(gè)編碼函數(shù),各圖片通過(guò)編碼函數(shù)計(jì)算得到一個(gè)k維的向量,再對(duì)此向量進(jìn)行二值化分割:sgn(y),就得到了圖片集中各圖片的二進(jìn)制編碼。
進(jìn)一步,本發(fā)明的近似搜索方法,r選取以下值中的一個(gè):1,2,3,或4。
本發(fā)明的關(guān)鍵技術(shù)分述如下:
(1)基于語(yǔ)義一致的近似搜索算法
基于語(yǔ)義一致的近似搜索算法是在計(jì)算圖片數(shù)據(jù)集中各圖片和抽樣圖片集中圖片的相似度時(shí)引入語(yǔ)義一致性,構(gòu)建出包含語(yǔ)義信息的目標(biāo)函數(shù)表達(dá)式。然后用隨機(jī)梯度下降算法迭代求解,表達(dá)式收斂后即得到反映圖片間內(nèi)在語(yǔ)義一致特性的轉(zhuǎn)換矩陣。再利用哈希技術(shù)把圖片映射成k位的二進(jìn)制編碼,并使相似的輸入圖片映射成漢明距離相近的二進(jìn)制編碼。
(2)隨機(jī)梯度下降(sgd)算法:
隨機(jī)梯度下降算法作為梯度下降(gradientdescent,gd)算法的改進(jìn)算法,其主要針對(duì)原始梯度下降算法收斂速度過(guò)慢和易陷入局部最優(yōu)的問(wèn)題,是一種最小化損失函數(shù)或風(fēng)險(xiǎn)函數(shù)的迭代求解方法。本發(fā)明利用隨機(jī)梯度下降算法減少了語(yǔ)義一致近似搜索方法中轉(zhuǎn)換矩陣的訓(xùn)練時(shí)間。
本發(fā)明采用以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下技術(shù)效果:
1.解決了用傳統(tǒng)的梯度下降算法收斂速度過(guò)慢的問(wèn)題。
2.使用轉(zhuǎn)換矩陣計(jì)算圖片之間的優(yōu)化相似度,解決了使用傳統(tǒng)的高斯核函數(shù)度量圖片相似度時(shí)對(duì)敏感參數(shù)過(guò)于依賴的問(wèn)題。
3.使用哈希技術(shù)把d維的原始圖片壓縮映射成k比特的二進(jìn)制編碼,極大地提高了算法的效率并且極大的縮減了對(duì)內(nèi)存空間的占用。
附圖說(shuō)明
圖1是本發(fā)明的系統(tǒng)框架圖。
圖2是本發(fā)明的方法流程圖。
具體實(shí)施方式
下面結(jié)合附圖對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)說(shuō)明:
本發(fā)明在對(duì)圖片進(jìn)行相似性度量時(shí)引入語(yǔ)義一致特性,可以更為準(zhǔn)確的度量圖片之間的相似性。并生成抽樣圖片集計(jì)算引入語(yǔ)義一致性后的優(yōu)化相似度,以及使用隨機(jī)梯度下降法來(lái)減少算法的訓(xùn)練時(shí)間,使算法能夠有效地應(yīng)用于大規(guī)模的圖片數(shù)據(jù)集中。進(jìn)而使用哈希編碼技術(shù)生成高效的二進(jìn)制編碼,在近似圖片搜索中可以獲得更好的性能。
如圖1所示,本發(fā)明提供了一種在大規(guī)模圖片集中基于語(yǔ)義一致性,并利用哈希編碼技術(shù)把圖片進(jìn)行二進(jìn)制編碼進(jìn)而通過(guò)比較圖片編碼間的漢明距離來(lái)找到近似圖片的方法。
本發(fā)明主要包括兩個(gè)部分:訓(xùn)練轉(zhuǎn)換矩陣的過(guò)程和哈希編碼的過(guò)程。
訓(xùn)練轉(zhuǎn)換矩陣的過(guò)程主要是在計(jì)算圖片集中的圖片和抽樣圖片的相似度時(shí)引入語(yǔ)義一致性,并獲得下一階段所需的轉(zhuǎn)換矩陣。
哈希編碼的過(guò)程主要是根據(jù)訓(xùn)練過(guò)程得到的轉(zhuǎn)換矩陣計(jì)算出圖片和抽樣圖片之間的優(yōu)化相似度,并根據(jù)優(yōu)化相似度構(gòu)建相似矩陣進(jìn)而利用哈希編碼技術(shù)對(duì)圖片集中的各圖片進(jìn)行二進(jìn)制編碼。然后比較新的查詢圖片和各圖片二進(jìn)制編碼的漢明距離,從而找到查詢圖片的近鄰。
一、訓(xùn)練轉(zhuǎn)換矩陣過(guò)程:
訓(xùn)練轉(zhuǎn)換矩陣的過(guò)程主要根據(jù)語(yǔ)義一致的思想建立模型并獲得編碼階段需要的轉(zhuǎn)換矩陣,轉(zhuǎn)換矩陣反映了圖片之間內(nèi)在的語(yǔ)義一致特性。在訓(xùn)練轉(zhuǎn)換矩陣的過(guò)程中本發(fā)明采用隨機(jī)梯度下降(sgd)算法減少訓(xùn)練時(shí)間。如果圖片的特征維度為d維,則經(jīng)過(guò)訓(xùn)練的轉(zhuǎn)換矩陣是d行d列的方陣。
大規(guī)模圖片集中基于語(yǔ)義一致性的近似搜索方法的基本思想是通過(guò)引入語(yǔ)義一致特性,將圖片由初始的d維壓縮映射成k維的二進(jìn)制編碼。并使相似的輸入圖片映射成漢明距離相近的二進(jìn)制編碼。
步驟1:在計(jì)算優(yōu)化相似度時(shí),若圖片數(shù)據(jù)集中包含n張圖片樣本,定義圖片間的關(guān)系矩陣w是一個(gè)n*n維的矩陣,關(guān)系矩陣中的每一個(gè)元素定義為:
wij=exp(-||a(xi-uj)||2)(1)
上式中a表示轉(zhuǎn)換矩陣,xi表示數(shù)據(jù)集中的第i張圖片,uj表示抽樣圖片集中的中的第j張圖片。
步驟2:訓(xùn)練轉(zhuǎn)換矩陣a的過(guò)程中主要引入了語(yǔ)義一致性建立目標(biāo)函數(shù),并通過(guò)隨機(jī)梯度下降(sgd)算法迭代求解,獲得編碼階段所需要的轉(zhuǎn)換矩陣。定義目標(biāo)函數(shù)式為:
上述目標(biāo)函數(shù)中的fi表示第i個(gè)圖片樣本的類標(biāo)記向量,(類標(biāo)記向量是c維的列向量,c是類的數(shù)目,向量中元素的值為1或0,分別表示圖片屬于這個(gè)類和不屬于這個(gè)類)。fj表示抽樣圖片集中圖片的類標(biāo)記向量。||fi-fj||2即是在訓(xùn)練轉(zhuǎn)換矩陣時(shí)引入的語(yǔ)義一致性質(zhì)。它結(jié)合圖片間的特征相似性可以生成更為準(zhǔn)確的二進(jìn)制編碼。
步驟3:在優(yōu)化過(guò)程中本發(fā)明采用隨機(jī)梯度下降算法以減少訓(xùn)練轉(zhuǎn)換矩陣所用的時(shí)間。轉(zhuǎn)換矩陣的初始值為1/δ,i是d*d維的單位矩陣,δ是數(shù)據(jù)集中各圖片之間歐氏距離的中位數(shù)。然后根據(jù)隨機(jī)梯度下降算法優(yōu)化轉(zhuǎn)換矩陣a,迭代更新規(guī)則如下:
其中γt是每次迭代過(guò)程中的優(yōu)化步長(zhǎng),步長(zhǎng)可選取以下值:(1*10-5,1*10-4,1*10-3,1*10-2)。圖片數(shù)據(jù)集中所有的圖片樣本遍歷結(jié)束后,即得到最終優(yōu)化完成的轉(zhuǎn)換矩陣a。此時(shí)轉(zhuǎn)換矩陣訓(xùn)練結(jié)束,輸出轉(zhuǎn)換矩陣a。
二、哈希編碼過(guò)程:
如圖2所示,哈希編碼的過(guò)程主要由上一步得到的轉(zhuǎn)換矩陣構(gòu)建出反映樣本和抽樣圖片集之間優(yōu)化后的相似性關(guān)系的相似矩陣z。然后利用哈希技術(shù)對(duì)大規(guī)模圖片數(shù)據(jù)集中的各圖片進(jìn)行哈希編碼。想要查找新的圖片在數(shù)據(jù)集中的近似圖片,比較圖片間二進(jìn)制編碼的漢明距離,若漢明距離小于設(shè)定的門限閾值r,即認(rèn)為兩圖片是近似圖片。
步驟1:得到轉(zhuǎn)換矩陣a后,再通過(guò)式(1)計(jì)算出每張圖片和抽樣圖片之間的引入語(yǔ)義一致性后的優(yōu)化相似度。即得到了關(guān)系矩陣w的各個(gè)元素的值。如果抽樣圖片集中有m張圖片樣本,那么通過(guò)關(guān)系矩陣可以構(gòu)建出使用哈希編碼技術(shù)需要用到的相似矩陣z。z矩陣計(jì)算公式定義如下:
其中<i>集合代表的是抽樣圖片集。即只有當(dāng)圖片是屬于抽樣圖片集中的圖片時(shí),才計(jì)算z矩陣上對(duì)應(yīng)元素的值,否則z矩陣上對(duì)應(yīng)元素值為0。
步驟2:設(shè)抽樣圖片集合中圖片的數(shù)量為m,構(gòu)造一個(gè)m*m維的m矩陣。m矩陣定義如下:
m=λ-1/2ztzλ-1/2(5)
其中λ=diag(zt1),是一個(gè)對(duì)角矩陣。計(jì)算得到m矩陣前k個(gè)最大的特征值組成的k*k維的對(duì)角矩陣:∑=diag(δ1,...,δk)∈rk×k和前k個(gè)最大的特征值對(duì)應(yīng)的特征向量組成的m*k維的矩陣:v=[v1,...,vk]∈rm×k。
步驟3:由上式得到的各矩陣,構(gòu)造出最終的編碼矩陣y,y矩陣定義如下:
y是一個(gè)n*k維的矩陣,n代表圖片集中圖片的個(gè)數(shù),k代表映射到二進(jìn)制編碼時(shí)編碼的位數(shù)。編碼矩陣y的每行就是一個(gè)編碼函數(shù),各圖片通過(guò)編碼函數(shù)計(jì)算得到一個(gè)k維的向量,再對(duì)此向量進(jìn)行二值化分割:sgn(y)。就得到了圖片數(shù)據(jù)集中各圖片的二進(jìn)制編碼。
步驟4:如果有新的查詢圖片要進(jìn)行近似圖片的搜索,同樣使用編碼函數(shù)計(jì)算出查詢圖片的二進(jìn)制編碼。然后比較查詢圖片的編碼和圖片數(shù)據(jù)集中所有圖片編碼的漢明距離。定義漢明距離門限閾值r(r可選取以下值:1,2,3,4),如果查詢圖片和某圖片的漢明距離小于閾值r,即認(rèn)為此圖片是查詢圖片的近似圖片。遍歷圖片數(shù)據(jù)集,即可找到查詢圖片的所有近似圖片。
本發(fā)明的整體方法流程如下:
步驟1:輸入圖片數(shù)據(jù)集樣本矩陣x(x是n*d維的矩陣,n是圖片的個(gè)數(shù),n的取值可以很大,d是圖片特征的維度),并輸入圖片集對(duì)應(yīng)的語(yǔ)義類標(biāo)記矩陣y(y是n*c維的矩陣,n是樣本個(gè)數(shù),c是類標(biāo)記的數(shù)量)。
步驟2:從圖片集中隨機(jī)抽取一部分圖片作為抽樣圖片集,選取抽樣圖片集的目的是通過(guò)計(jì)算圖片和抽樣圖片之間的相似度,可以大大減少計(jì)算時(shí)間開銷,提高算法的效率。
步驟3:對(duì)于圖片數(shù)據(jù)集中的每一張圖片,引入語(yǔ)義一致性構(gòu)建目標(biāo)函數(shù)表達(dá)式o(a),其中a(a是d*d維的矩陣,d是圖片特征的維度)是在編碼階段需要的轉(zhuǎn)換矩陣。通過(guò)隨機(jī)梯度下降算法迭代求解,表達(dá)式收斂后即得到優(yōu)化完成的轉(zhuǎn)換矩陣a。
步驟4:對(duì)于每一個(gè)圖片樣本x,用轉(zhuǎn)換矩陣a乘上圖片樣本x和抽樣圖片之間的相似度。得到了引入語(yǔ)義一致性之后的優(yōu)化相似度。然后再利用哈希技術(shù)進(jìn)行編碼,將圖片由原始的d維特征壓縮映射成k維的二進(jìn)制編碼。
步驟5:對(duì)于一個(gè)新的查詢圖片q,要找到它的近似圖片。首先用步驟3中訓(xùn)練得到的轉(zhuǎn)換矩陣a乘上圖片q和抽樣圖片之間的相似度。得到了引入語(yǔ)義一致性之后的優(yōu)化相似度。再通過(guò)編碼函數(shù)計(jì)算出查詢圖片的二進(jìn)制編碼。與圖片數(shù)據(jù)集中各圖片的二進(jìn)制編碼比較漢明距離。如果漢明距離小于設(shè)定的門限閾值r,即認(rèn)為兩圖片是近似圖片。
本發(fā)明采用以上技術(shù)實(shí)施方案,與現(xiàn)有技術(shù)相比所解決的問(wèn)題如下:
(1)傳統(tǒng)近似搜索算法訓(xùn)練過(guò)程中沒(méi)有引入語(yǔ)義一致性導(dǎo)致性能不佳的問(wèn)題:很多傳統(tǒng)的用于圖片近鄰搜索的算法在尋找查詢圖片近鄰的時(shí)候過(guò)于片面,在尋找查詢圖片的近鄰時(shí)沒(méi)有考慮圖片可能具有的語(yǔ)義信息,使得這些算法在圖片近似搜索的實(shí)際應(yīng)用中性能不佳。本發(fā)明在對(duì)圖片進(jìn)行相似性度量時(shí)引入語(yǔ)義一致特性,可以更為準(zhǔn)確的度量圖片之間的相似性。使算法能夠有效地應(yīng)用在現(xiàn)實(shí)的圖片近似搜索中。
(2)使用抽象圖片集計(jì)算優(yōu)化相似度。解決了大規(guī)模圖片數(shù)據(jù)集中計(jì)算相似度過(guò)慢的問(wèn)題:在大規(guī)模圖片數(shù)據(jù)集中,如果使用傳統(tǒng)的計(jì)算圖片和圖片兩兩之間相似度的這種度量方法,會(huì)使時(shí)間開銷非常大,現(xiàn)實(shí)應(yīng)用中不可行。本發(fā)明從海量圖片集中隨機(jī)抽取很少的一部分圖片作為抽樣圖片集,只計(jì)算圖片和抽樣圖片集之間的優(yōu)化相似度。大大減少了算法的時(shí)間開銷,提高了算法效率。
(3)使用隨機(jī)梯度下降算法解決了目標(biāo)函數(shù)式收斂過(guò)慢的問(wèn)題:原始的梯度下降算法稱為批量梯度下降算法,此算法的做法是最小化所有訓(xùn)練數(shù)據(jù)的損失函數(shù),使得最終求解的是全局的最優(yōu)解,即求解的參數(shù)是使得損失函數(shù)值最小的參數(shù)。但是批量梯度算法每迭代一步,都要用到訓(xùn)練集所有的數(shù)據(jù),如果數(shù)據(jù)集中圖片數(shù)量很大,那么使用批量梯度算法是非常慢的。隨機(jī)梯度下降算法在迭代更新一次時(shí)只用到一個(gè)數(shù)據(jù)樣本,速度較快。特別是對(duì)于大規(guī)模圖片數(shù)據(jù)集而言,速度的優(yōu)勢(shì)更為明顯。而且對(duì)目標(biāo)損失函數(shù)來(lái)說(shuō),使用隨機(jī)梯度下降算法不需要完遍歷整個(gè)數(shù)據(jù)集就可以達(dá)到收斂。本發(fā)明用隨機(jī)梯度下降算法取代批量梯度算法來(lái)迭代求解算法的目標(biāo)函數(shù),解決了算法收斂過(guò)慢的問(wèn)題。
綜上所述,本發(fā)明使用反映了圖片間內(nèi)在語(yǔ)義一致性的轉(zhuǎn)換矩陣來(lái)計(jì)算圖片間的優(yōu)化相似度。為了提高搜索效率,從大規(guī)模圖片集中隨機(jī)選取一部分圖片作為抽樣圖片集來(lái)度量圖片間的相似性,并在訓(xùn)練轉(zhuǎn)換矩陣時(shí)采用隨機(jī)梯度下降法減少算法的訓(xùn)練時(shí)間。通過(guò)圖片間的優(yōu)化相似度得到用于編碼的相似矩陣后,使用哈希編碼技術(shù)把原始圖片映射為k比特的二進(jìn)制編碼。在搜索新的查詢圖片的近鄰時(shí),首先通過(guò)模型的編碼函數(shù)得到查詢圖片的二進(jìn)制編碼,再和圖片集中的所有圖片比較編碼間的漢明距離。當(dāng)某些圖片和查詢圖片的漢明距離小于給定的漢明距離門限閾值時(shí),即認(rèn)為是查詢圖片的近似圖片。
以上所述僅是本發(fā)明的部分實(shí)施方式,應(yīng)當(dāng)指出,對(duì)于本技術(shù)領(lǐng)域的普通技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明原理的前提下,還可以做出若干改進(jìn)和潤(rùn)飾,這些改進(jìn)和潤(rùn)飾也應(yīng)視為本發(fā)明的保護(hù)范圍。