本發(fā)明涉及圖像檢索技術(shù)領(lǐng)域,特別是涉及一種圖像檢索方法及裝置。
背景技術(shù):
近三十年來,多媒體技術(shù)快速發(fā)展,許多圖像數(shù)據(jù)庫被建立,例如外觀設(shè)計(jì)專利數(shù)據(jù)庫、人臉識別數(shù)據(jù)庫、虹膜識別數(shù)據(jù)庫、指紋識別數(shù)據(jù)庫、車輛登記號碼數(shù)據(jù)庫等。從這些數(shù)據(jù)庫中尋找圖像實(shí)際上就是一個(gè)圖像檢索問題,因此如何快速有效地從數(shù)據(jù)庫中檢索出圖像一直是圖像檢索技術(shù)的研究熱點(diǎn)。
為了提高圖像檢索的速度,尋找最能表達(dá)圖像特征的描述子尤為重要。因?yàn)殡x散傅里葉變換描述子的不變性特征,對圖像邊緣的描述具有魯棒性,所以人們廣泛地使用基于離散傅里葉變換描述子的方法來尋找圖像邊緣特征,并獲得不錯的效果。然而離散傅里葉變換描述子也有缺陷。每幅圖像的邊緣特征都包含x坐標(biāo)和y坐標(biāo),由于傳統(tǒng)的離散傅里葉變換描述子只能應(yīng)用單個(gè)方向的信息,為了有效地構(gòu)建字典,這種方法需要更多的訓(xùn)練圖片。然而像人臉識別這樣的數(shù)據(jù)庫,能用來作為訓(xùn)練的圖像不多,因此往往不能滿足實(shí)際訓(xùn)練的要求。除此以外,傳統(tǒng)的離散傅里葉變換描述子只能反映圖像的頻域特征,能用于圖像檢索的信息十分有限。尋找一種具有傳統(tǒng)離散傅里葉變換描述子優(yōu)點(diǎn)的更廣泛的特征描述子將成為近年來研究的重點(diǎn)。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是提供一種圖像檢索方法及裝置,目的在于解決現(xiàn)有表達(dá)圖像特征的描述子特征信息不充分,表達(dá)能力不強(qiáng),導(dǎo)致檢索能力較低的問題。
為解決上述技術(shù)問題,本發(fā)明提供一種圖像檢索方法,包括:
獲取待檢索圖像;
對所述待檢索圖像進(jìn)行預(yù)處理操作;
采用離散分?jǐn)?shù)階傅里葉變換作為描述子,計(jì)算得到所述待檢索圖像的邊緣特征;
調(diào)用預(yù)先構(gòu)建的字典,所述字典中包括多幅采用離散分?jǐn)?shù)階傅里葉變換描述子進(jìn)行邊緣特征提取的訓(xùn)練圖像;
利用預(yù)設(shè)分類器對所述待檢索圖像進(jìn)行分類,得到檢索結(jié)果。
可選地,所述采用離散分?jǐn)?shù)階傅里葉變換作為描述子,計(jì)算得到所述待檢索圖像的邊緣特征包括:
采用使費(fèi)希爾判別最小的方法確定離散分?jǐn)?shù)階傅里葉變換描述子的最優(yōu)旋轉(zhuǎn)角度;
采用一范數(shù)來定義目標(biāo)函數(shù),并分離不可導(dǎo)點(diǎn)和穩(wěn)定點(diǎn)集,使用非凸優(yōu)化技術(shù)來求解問題獲得圖像的邊緣特征。
可選地,所述利用預(yù)設(shè)分類器對所述待檢索圖像進(jìn)行分類的步驟包括:
利用1-NN分類器對所述待檢索圖像進(jìn)行分類。
可選地,所述字典預(yù)先構(gòu)建的步驟包括:
對每一幅訓(xùn)練圖像提取邊緣點(diǎn);
每幅進(jìn)行邊緣點(diǎn)提取的步驟為:
采用離散余弦變換的方法對原始邊緣點(diǎn)進(jìn)行處理;
將所有訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)的平均值作為目標(biāo)值,若當(dāng)前訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)大于所述目標(biāo)值,則對邊緣點(diǎn)進(jìn)行離散余弦變換,保留低頻所對應(yīng)的離散余弦變換系數(shù),去除高頻系數(shù),若當(dāng)前訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)小于所述目標(biāo)值,則對邊緣點(diǎn)進(jìn)行離散余弦變換后在高頻對應(yīng)的系數(shù)位置補(bǔ)零;
將所得到的離散余弦變換系數(shù)進(jìn)行反離散余弦變換得到個(gè)數(shù)相同的邊緣點(diǎn)。
本發(fā)明還提供了一種圖像檢索裝置,包括:
獲取模塊,用于獲取待檢索圖像;
預(yù)處理模塊,用于對所述待檢索圖像進(jìn)行預(yù)處理操作;
計(jì)算模塊,用于采用離散分?jǐn)?shù)階傅里葉變換作為描述子,計(jì)算得到所述待檢索圖像的邊緣特征;
調(diào)用模塊,用于調(diào)用預(yù)先構(gòu)建的字典,所述字典中包括多幅采用離散分?jǐn)?shù)階傅里葉變換描述子進(jìn)行邊緣特征提取的訓(xùn)練圖像;
分類模塊,用于利用預(yù)設(shè)分類器對所述待檢索圖像進(jìn)行分類,得到檢索結(jié)果。
可選地,所述計(jì)算模塊具體用于:
采用使費(fèi)希爾判別最小的方法確定離散分?jǐn)?shù)階傅里葉變換描述子的最優(yōu)旋轉(zhuǎn)角度;采用一范數(shù)來定義目標(biāo)函數(shù),并分離不可導(dǎo)點(diǎn)和穩(wěn)定點(diǎn)集,使用非凸優(yōu)化技術(shù)來求解問題獲得圖像的邊緣特征。
可選地,所述分類模塊具體為:利用1-NN分類器對所述待檢索圖像進(jìn)行分類的模塊。
可選地,調(diào)用模塊具體為:對每一幅訓(xùn)練圖像提取邊緣點(diǎn);每幅進(jìn)行邊緣點(diǎn)提取的步驟為:采用離散余弦變換的方法對原始邊緣點(diǎn)進(jìn)行處理;將所有訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)的平均值作為目標(biāo)值,若當(dāng)前訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)大于所述目標(biāo)值,則對邊緣點(diǎn)進(jìn)行離散余弦變換,保留低頻所對應(yīng)的離散余弦變換系數(shù),去除高頻系數(shù),若當(dāng)訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)小于所述目標(biāo)值,則對邊緣點(diǎn)進(jìn)行離散余弦變換后在高頻對應(yīng)的系數(shù)位置補(bǔ)零;將所得到的離散余弦變換系數(shù)進(jìn)行反離散余弦變換得到個(gè)數(shù)相同的邊緣點(diǎn)。
本發(fā)明所提供的圖像檢索方法及裝置,通過獲取待檢索圖像;對待檢索圖像進(jìn)行預(yù)處理操作;采用離散分?jǐn)?shù)階傅里葉變換作為描述子,計(jì)算得到待檢索圖像的邊緣特征;調(diào)用預(yù)先構(gòu)建的字典,字典中包括多幅采用離散分?jǐn)?shù)階傅里葉變換描述子進(jìn)行邊緣特征提取的訓(xùn)練圖像;利用預(yù)設(shè)分類器對待檢索圖像進(jìn)行分類,得到檢索結(jié)果。本發(fā)明所提供的圖像檢索方法及裝置,通過擴(kuò)展傳統(tǒng)離散傅里葉變換描述子為離散分?jǐn)?shù)階傅里葉變換描述子來表達(dá)圖像的邊緣特征,對圖像數(shù)據(jù)獲得的邊緣特征具有時(shí)域以及頻域的描述性能,且離散分?jǐn)?shù)階傅里葉變換描述子具有不變形特征,同時(shí)訓(xùn)練能夠融合兩維的特征信息,提升了圖像的檢索效果。
附圖說明
為了更清楚的說明本發(fā)明實(shí)施例或現(xiàn)有技術(shù)的技術(shù)方案,下面將對實(shí)施例或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單的介紹,顯而易見地,下面描述中的附圖僅僅是本發(fā)明的一些實(shí)施例,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。
圖1為本發(fā)明所提供的圖像檢索方法的一種具體實(shí)施方式的流程圖;
圖2為本發(fā)明實(shí)施例提供的圖像檢索裝置的結(jié)構(gòu)框圖。
具體實(shí)施方式
為了使本技術(shù)領(lǐng)域的人員更好地理解本發(fā)明方案,下面結(jié)合附圖和具體實(shí)施方式對本發(fā)明作進(jìn)一步的詳細(xì)說明。顯然,所描述的實(shí)施例僅僅是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。
本發(fā)明所提供的圖像檢索方法的一種具體實(shí)施方式的流程圖如圖1所示,該方法包括:
步驟S101:獲取待檢索圖像;
步驟S102:對所述待檢索圖像進(jìn)行預(yù)處理操作;
步驟S103:采用離散分?jǐn)?shù)階傅里葉變換作為描述子,計(jì)算得到所述待檢索圖像的邊緣特征;
步驟S104:調(diào)用預(yù)先構(gòu)建的字典,所述字典中包括多幅采用離散分?jǐn)?shù)階傅里葉變換描述子進(jìn)行邊緣特征提取的訓(xùn)練圖像;
步驟S105:利用預(yù)設(shè)分類器對所述待檢索圖像進(jìn)行分類,得到檢索結(jié)果。
本發(fā)明所提供的圖像檢索方法,通過獲取待檢索圖像;對待檢索圖像進(jìn)行預(yù)處理操作;采用離散分?jǐn)?shù)階傅里葉變換作為描述子,計(jì)算得到待檢索圖像的邊緣特征;調(diào)用預(yù)先構(gòu)建的字典,字典中包括多幅采用離散分?jǐn)?shù)階傅里葉變換描述子進(jìn)行邊緣特征提取的訓(xùn)練圖像;利用預(yù)設(shè)分類器對待檢索圖像進(jìn)行分類,得到檢索結(jié)果。本發(fā)明所提供的圖像檢索方法,通過擴(kuò)展傳統(tǒng)離散傅里葉變換描述子為離散分?jǐn)?shù)階傅里葉變換描述子來表達(dá)圖像的邊緣特征,對圖像數(shù)據(jù)獲得的邊緣特征具有時(shí)域以及頻域的描述性能,且離散分?jǐn)?shù)階傅里葉變換描述子具有不變形特征,同時(shí)訓(xùn)練能夠融合兩維的特征信息,提升了圖像的檢索效果。
在上述實(shí)施例的基礎(chǔ)上,本發(fā)明所提供的圖像檢索方法中,所述采用離散分?jǐn)?shù)階傅里葉變換作為描述子,計(jì)算得到所述待檢索圖像的邊緣特征的步驟可以具體包括:
采用使費(fèi)希爾判別最小的方法確定離散分?jǐn)?shù)階傅里葉變換描述子的最優(yōu)旋轉(zhuǎn)角度;
采用一范數(shù)來定義目標(biāo)函數(shù),并分離不可導(dǎo)點(diǎn)和穩(wěn)定點(diǎn)集,使用非凸優(yōu)化技術(shù)來求解問題獲得圖像的邊緣特征。
所述利用預(yù)設(shè)分類器對所述待檢索圖像進(jìn)行分類的步驟包括:
利用1-NN分類器對所述待檢索圖像進(jìn)行分類。
進(jìn)一步地,在上述任意實(shí)施例的基礎(chǔ)上,本申請所提供的圖像檢索方法中,字典預(yù)先構(gòu)建的步驟包括:
對每一幅訓(xùn)練圖像提取邊緣點(diǎn);
每幅進(jìn)行邊緣點(diǎn)提取的步驟為:
采用離散余弦變換的方法對原始邊緣點(diǎn)進(jìn)行處理;
將所有訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)的平均值作為目標(biāo)值,若當(dāng)前訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)大于所述目標(biāo)值,則對邊緣點(diǎn)進(jìn)行離散余弦變換,保留低頻所對應(yīng)的離散余弦變換系數(shù),去除高頻系數(shù),若當(dāng)前訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)小于所述目標(biāo)值,則對邊緣點(diǎn)進(jìn)行離散余弦變換后在高頻對應(yīng)的系數(shù)位置補(bǔ)零;
將所得到的離散余弦變換系數(shù)進(jìn)行反離散余弦變換得到個(gè)數(shù)相同的邊緣點(diǎn)。
下面對本發(fā)明所提供的圖像檢索方法的具體實(shí)施過程進(jìn)行進(jìn)一步詳細(xì)闡述。
首先對每一幅訓(xùn)練圖像提取邊緣點(diǎn)。由于每幅圖的邊緣點(diǎn)個(gè)數(shù)不相同,為了統(tǒng)一邊緣點(diǎn)個(gè)數(shù),使用基于離散余弦變換(DCT)的方法對原始邊緣點(diǎn)進(jìn)行處理。將所有訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)的平均值作為目標(biāo)個(gè)數(shù),若當(dāng)前訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)大于目標(biāo)值,對邊緣點(diǎn)進(jìn)行DCT,保留低頻所對應(yīng)的DCT系數(shù),去除多出的高頻系數(shù),若前訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)小于目標(biāo)值,對邊緣點(diǎn)進(jìn)行DCT后在高頻對應(yīng)的系數(shù)位置補(bǔ)零。最后將所得到的DCT系數(shù)進(jìn)行反離散余弦變換(IDCT)得到個(gè)數(shù)相同的邊緣點(diǎn)。
為了運(yùn)用離散分?jǐn)?shù)階傅里葉變換(DFrFTs)作為描述子,關(guān)鍵是確定描述子的最優(yōu)旋轉(zhuǎn)角度。對于圖像檢索問題,屬于同一類的圖像其在旋轉(zhuǎn)時(shí)頻域的特征應(yīng)該是聚集在一起的,而不同類的圖像會相隔很遠(yuǎn)。換句話說,描述子的類內(nèi)間距要盡可能小,類外間距要盡可能大。為了綜合這兩個(gè)判據(jù),一般的方法是費(fèi)希爾(Fisher)判別法,即類內(nèi)間距和類外間距比值要最小。本申請決定最優(yōu)旋轉(zhuǎn)角度的方法就是使Fisher判別最小。
假設(shè)有C種不同類型的圖像,Nc表示c類圖像的訓(xùn)練數(shù)目,其中c=0,…,C-1。N表示圖像邊緣點(diǎn)的數(shù)目。是一個(gè)復(fù)值向量,和分別表示邊緣點(diǎn)的x坐標(biāo)和y坐標(biāo),其中nc=0,…,Nc-1,c=0,…,C-1。Re(z)和分別表示向量z的實(shí)部和虛部。Ca×b表示a×b的復(fù)值矩陣。Fα∈CN×N是分?jǐn)?shù)階傅里葉變換矩陣,其中旋轉(zhuǎn)角度α∈[-π,π)。讓Jintra和Jinter分別表示DFrFTs描述子基于二范測度的類內(nèi)間距和類外間距。
和
這里表示第c類圖像邊緣點(diǎn)向量的平均值,即
值得注意的是,F(xiàn)α是埃爾米特矩陣,Jintra和Jinter與Fα獨(dú)立。因此Jintra和Jinter都不能用于決定DFrFTs的旋轉(zhuǎn)角度。實(shí)際上,包含有x坐標(biāo)和y坐標(biāo)的信息,為了不失去任何信息,的實(shí)部和虛部都必須保留用于檢索。因?yàn)橛靡环稖y度的目標(biāo)函數(shù)可以將優(yōu)化問題重新定義為一個(gè)線性約束的線性目標(biāo)函數(shù),其解很容易找到,所以我們將類內(nèi)間距和類外間距分別重新定義為和其中
和
按照DFrFTs矩陣的定義,
Fα≡Ediag(e-jαβ)ET, (6)
其中E是與α無關(guān)的實(shí)值酉矩陣,diag(z)表示以z的元素為對角線的對角矩陣,
β≡[0 … N-1]T, (7)
和
對于
z≡[z0 … zN-1]T, (9)
上表T表示轉(zhuǎn)置操作。定義
和
其中c=0,…,C-1,nc=0,…,Nc-1。
相似的可以定義
和
其中c=0,…,C-1,d=0,…,C-1。
讓類內(nèi)間距和類外間距的比值為即
從上面的推導(dǎo)可以看出和α有關(guān)。讓α0表示最優(yōu)的旋轉(zhuǎn)角度。值得注意的是,因?yàn)槭莻€(gè)連續(xù)函數(shù),所以在α0周圍的小區(qū)域內(nèi)的點(diǎn)具有近似的函數(shù)值。換句話說,我們也只能近似求得的全局最優(yōu)值。實(shí)際上,一般會要求有一系列不同的旋轉(zhuǎn)角度能局部最小化為了解決這個(gè)問題,可以注意到局部最小化的值α不僅會落在目標(biāo)函數(shù)的穩(wěn)定點(diǎn)處,還有可能落在不可導(dǎo)點(diǎn)處。因?yàn)榘豢蓪?dǎo)的一范數(shù),所以字典的設(shè)計(jì)問題就變成尋找一系列旋轉(zhuǎn)角度,使得局部最小。用表示一系列旋轉(zhuǎn)角度,開始時(shí)是一個(gè)空集,定義最優(yōu)化問題P:
要求:
滿足(17), (28b)
有可能是穩(wěn)定的,有可能是不可導(dǎo)的,(28c)
同時(shí)
通過尋找問題P的局部解,將解加到中,然后迭代L次,接著獲得L個(gè)能局部最小化的不同旋轉(zhuǎn)角度。
尋找的所有不可導(dǎo)點(diǎn),讓A和的維數(shù)分別為M1×2N和M2×2N。這里
和
M2=2NC2。 (30)
定義A的第m1行和的第m2分別為
其中m1=1,…,M1 (31)
和
其中m2=1,…,M2, (32)
里面有
其中m1=1,…,M1, (33)
其中m1=1,…,M1, (34)
其中m2=1,…,M2, (35)
和
其中m2=1,…,M2。 (36)
讓表示DFrFTs的旋轉(zhuǎn)角度,其中k=0,…,K1-1,于是有
對于m1=1,…,M1,或
對于m2=1,…,M2。這里K1是(37)或(38)的全部根的數(shù)目。因?yàn)榻^對值函數(shù)|z|的不可導(dǎo)點(diǎn)值出現(xiàn)在z=0,所以的不可導(dǎo)點(diǎn)只落在其中k=0,…,K1-1。不是一般性,假設(shè)序列以升序排列,即其中k=0,…,K1-2。
為尋找的穩(wěn)定點(diǎn),定義
其中m1=1,…,M1 (39)
和
其中m2=1,…,M2。 (40)
接著,
這里,
注意到在是可導(dǎo)的,其中k=0,…,K1-2。也有,
和
對于所有其中k=0,…,K1-2。假設(shè)有Pk個(gè)穩(wěn)定點(diǎn)在讓這些點(diǎn)表示為其中p=0,…,Pk-1和k=0,…,K1-2。于是有,
其中p=0,…,Pk-1和k=0,…,K1-2。換句話,我們有
其中p=0,…,Pk-1和k=0,…,K1-2。
(43)和(44)暗示著
其中p=0,…,Pk-1和k=0,…,K1-2。對于k=0,…,K1-2都是已知的。因此,(37),(38)和(47)是傳統(tǒng)的三角等式。通過二倍角公式,可以將上述等式表示為多項(xiàng)式,這些等式的解將很容易找到。顯然,獲得的解就是對應(yīng)的不可導(dǎo)點(diǎn)和穩(wěn)定點(diǎn)的解。
最后,通過在集合識別出L個(gè)最小函數(shù)值,對應(yīng)的DFrFTs角度就找到了。
定義其中δ是變換矩陣的列數(shù)和行數(shù)的比值。如果δ去得很小,就會產(chǎn)生很少的描述子,也就是說還沒有足夠的信息去進(jìn)行圖像檢索,否則δ過大,就會出現(xiàn)過擬合現(xiàn)象。
讓表示最優(yōu)旋轉(zhuǎn)角度,其中l(wèi)=0,…,L-1。將作為列向量可以構(gòu)成字典,其中c=0,…,C-1,nc=0,…,Nc-1,l=0,…,L-1。
假設(shè)有M個(gè)測試圖像,讓ym∈CN×1表示一個(gè)復(fù)值向量,其中m=0,…,M-1。Re(ym)和Im(ym)分別是測試圖像邊緣點(diǎn)的x坐標(biāo)向量和y坐標(biāo)向量。為了進(jìn)行圖像檢索,需要使用1-NN分類規(guī)則。也就是找在旋轉(zhuǎn)時(shí)頻域中使ym和距離最小的那個(gè)類。將目標(biāo)類定義為對應(yīng)最近的測試邊緣特征向量為使用一范數(shù)作為距離度量,將作為目標(biāo)函數(shù),即測試圖像所屬的類由以下優(yōu)化問題表達(dá):
遍歷查找得到該問題的解,即檢索到同一類的圖像。
下面對本發(fā)明實(shí)施例提供的圖像檢索裝置進(jìn)行介紹,下文描述的圖像檢索裝置與上文描述的圖像檢索方法可相互對應(yīng)參照。
圖2為本發(fā)明實(shí)施例提供的圖像檢索裝置的結(jié)構(gòu)框圖,參照圖2圖像檢索裝置可以包括:
獲取模塊100,用于獲取待檢索圖像;
預(yù)處理模塊200,用于對所述待檢索圖像進(jìn)行預(yù)處理操作;
計(jì)算模塊300,用于采用離散分?jǐn)?shù)階傅里葉變換作為描述子,計(jì)算得到所述待檢索圖像的邊緣特征;
調(diào)用模塊400,用于調(diào)用預(yù)先構(gòu)建的字典,所述字典中包括多幅采用離散分?jǐn)?shù)階傅里葉變換描述子進(jìn)行邊緣特征提取的訓(xùn)練圖像;
分類模塊500,用于利用預(yù)設(shè)分類器對所述待檢索圖像進(jìn)行分類,得到檢索結(jié)果。
作為一種具體實(shí)施方式,本發(fā)明所提供的圖像檢索裝置中,計(jì)算模塊具體用于:
采用使費(fèi)希爾判別最小的方法確定離散分?jǐn)?shù)階傅里葉變換描述子的最優(yōu)旋轉(zhuǎn)角度;采用一范數(shù)來定義目標(biāo)函數(shù),并分離不可導(dǎo)點(diǎn)和穩(wěn)定點(diǎn)集,使用非凸優(yōu)化技術(shù)來求解問題獲得圖像的邊緣特征。
作為一種具體實(shí)施方式,本發(fā)明所提供的圖像檢索裝置中,分類模塊具體為:利用1-NN分類器對所述待檢索圖像進(jìn)行分類的模塊。
在上述任一實(shí)施例的基礎(chǔ)上,本發(fā)明所提供的圖像檢索裝置中,調(diào)用模塊具體為:對每一幅訓(xùn)練圖像提取邊緣點(diǎn);每幅進(jìn)行邊緣點(diǎn)提取的步驟為:采用離散余弦變換的方法對原始邊緣點(diǎn)進(jìn)行處理;將所有訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)的平均值作為目標(biāo)值,若當(dāng)前訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)大于所述目標(biāo)值,則對邊緣點(diǎn)進(jìn)行離散余弦變換,保留低頻所對應(yīng)的離散余弦變換系數(shù),去除高頻系數(shù),若當(dāng)訓(xùn)練圖像的邊緣點(diǎn)個(gè)數(shù)小于所述目標(biāo)值,則對邊緣點(diǎn)進(jìn)行離散余弦變換后在高頻對應(yīng)的系數(shù)位置補(bǔ)零;將所得到的離散余弦變換系數(shù)進(jìn)行反離散余弦變換得到個(gè)數(shù)相同的邊緣點(diǎn)。
本實(shí)施例的圖像檢索裝置用于實(shí)現(xiàn)前述的圖像檢索方法,因此圖像檢索裝置中的具體實(shí)施方式可見前文中的圖像檢索方法的實(shí)施例部分,例如,獲取模塊100,預(yù)處理模塊200,計(jì)算模塊300,調(diào)用模塊400,分類模塊500,分別用于實(shí)現(xiàn)上述圖像檢索方法中步驟S101,S102,S103,S104和S105,所以,其具體實(shí)施方式可以參照相應(yīng)的各個(gè)部分實(shí)施例的描述,在此不再贅述。
本發(fā)明所提供的圖像檢索裝置,通過獲取待檢索圖像;對待檢索圖像進(jìn)行預(yù)處理操作;采用離散分?jǐn)?shù)階傅里葉變換作為描述子,計(jì)算得到待檢索圖像的邊緣特征;調(diào)用預(yù)先構(gòu)建的字典,字典中包括多幅采用離散分?jǐn)?shù)階傅里葉變換描述子進(jìn)行邊緣特征提取的訓(xùn)練圖像;利用預(yù)設(shè)分類器對待檢索圖像進(jìn)行分類,得到檢索結(jié)果。本發(fā)明所提供的圖像檢索裝置,通過擴(kuò)展傳統(tǒng)離散傅里葉變換描述子為離散分?jǐn)?shù)階傅里葉變換描述子來表達(dá)圖像的邊緣特征,對圖像數(shù)據(jù)獲得的邊緣特征具有時(shí)域以及頻域的描述性能,且離散分?jǐn)?shù)階傅里葉變換描述子具有不變形特征,同時(shí)訓(xùn)練能夠融合兩維的特征信息,提升了圖像的檢索效果。
本說明書中各個(gè)實(shí)施例采用遞進(jìn)的方式描述,每個(gè)實(shí)施例重點(diǎn)說明的都是與其它實(shí)施例的不同之處,各個(gè)實(shí)施例之間相同或相似部分互相參見即可。對于實(shí)施例公開的裝置而言,由于其與實(shí)施例公開的方法相對應(yīng),所以描述的比較簡單,相關(guān)之處參見方法部分說明即可。
專業(yè)人員還可以進(jìn)一步意識到,結(jié)合本文中所公開的實(shí)施例描述的各示例的單元及算法步驟,能夠以電子硬件、計(jì)算機(jī)軟件或者二者的結(jié)合來實(shí)現(xiàn),為了清楚地說明硬件和軟件的可互換性,在上述說明中已經(jīng)按照功能一般性地描述了各示例的組成及步驟。這些功能究竟以硬件還是軟件方式來執(zhí)行,取決于技術(shù)方案的特定應(yīng)用和設(shè)計(jì)約束條件。專業(yè)技術(shù)人員可以對每個(gè)特定的應(yīng)用來使用不同方法來實(shí)現(xiàn)所描述的功能,但是這種實(shí)現(xiàn)不應(yīng)認(rèn)為超出本發(fā)明的范圍。
結(jié)合本文中所公開的實(shí)施例描述的方法或算法的步驟可以直接用硬件、處理器執(zhí)行的軟件模塊,或者二者的結(jié)合來實(shí)施。軟件模塊可以置于隨機(jī)存儲器(RAM)、內(nèi)存、只讀存儲器(ROM)、電可編程ROM、電可擦除可編程ROM、寄存器、硬盤、可移動磁盤、CD-ROM、或技術(shù)領(lǐng)域內(nèi)所公知的任意其它形式的存儲介質(zhì)中。
以上對本發(fā)明所提供的圖像檢索方法以及裝置進(jìn)行了詳細(xì)介紹。本文中應(yīng)用了具體個(gè)例對本發(fā)明的原理及實(shí)施方式進(jìn)行了闡述,以上實(shí)施例的說明只是用于幫助理解本發(fā)明的方法及其核心思想。應(yīng)當(dāng)指出,對于本技術(shù)領(lǐng)域的普通技術(shù)人員來說,在不脫離本發(fā)明原理的前提下,還可以對本發(fā)明進(jìn)行若干改進(jìn)和修飾,這些改進(jìn)和修飾也落入本發(fā)明權(quán)利要求的保護(hù)范圍內(nèi)。