專利名稱:基于先驗(yàn)知識的圖像檢索方法
技術(shù)領(lǐng)域:
本發(fā)明涉及一種圖像檢索方法,特別涉及一種基于先驗(yàn)知識的圖像檢索方法,屬于基于內(nèi)容的圖像檢索領(lǐng)域。
背景技術(shù):
隨著計(jì)算機(jī)和互聯(lián)網(wǎng)的普及,多媒體技術(shù)的迅速發(fā)展,網(wǎng)絡(luò)上涌現(xiàn)出大量的圖像、音頻和視頻資源。這些在給人們提供便利和豐富人們精神生活的同時(shí),也給人們提出了新的研究課題如何從浩繁的多媒體資源中快速準(zhǔn)確地查找出用戶請求的資源。目前,常用的圖像檢索技術(shù)是基于內(nèi)容的圖像檢索。在基于內(nèi)容的圖像檢索領(lǐng)域中,圖像特征度量作為衡量圖像相似度的關(guān)鍵步驟,對最終圖像檢索結(jié)果的好壞起著至關(guān)重要的作用。因此,尋找一個(gè)好的距離度量方法對于研究基于內(nèi)容的圖像檢索來說意義重大。由于圖像背景千差萬別,特別是柔性物體的結(jié)構(gòu)容易發(fā)生形變,這些都會(huì)影響到從圖像中提出的特征向量,在此基礎(chǔ)上進(jìn)行距離度量就會(huì)降低圖像的檢索精度?;趦?nèi)容的圖像檢索方法,首先是分析圖像庫中圖像的特征,提取能反映該圖像內(nèi)容的特征向量,存入相應(yīng)的特征庫中。在進(jìn)行圖像檢索時(shí),對每一幅給定的測試圖像,分析圖像特征并提取能反映該圖像內(nèi)容的特征向量;然后將提取到的特征向量與特征庫中的特征向量進(jìn)行匹配,根據(jù)匹配結(jié)果到圖像庫中搜索,就可以得到與之最相似的圖像。其中特征向量匹配的過程常利用特征向量之間的距離來進(jìn)行相似性度量,而常用的距離有歐式距離、加權(quán)歐式距離、明氏距離等等。這些距離函數(shù)的優(yōu)點(diǎn)在于所有的參數(shù)和數(shù)據(jù)都是提前設(shè)定或從圖像中直接提取得到,因此使用方便、計(jì)算簡單。但是它們的缺點(diǎn)也同樣明顯由于未考慮先驗(yàn)知識,檢索結(jié)果往往會(huì)不盡如人意。目前的基于內(nèi)容的圖像特征檢索與相似度量算法都很難在效率和效果中取得一個(gè)平衡,而這個(gè)問題又是基于內(nèi)容的圖像檢索領(lǐng)域中的一個(gè)重要的關(guān)鍵問題。由于這個(gè)問題的存在,阻礙了基于內(nèi)容的圖像檢索的廣泛應(yīng)用。
發(fā)明內(nèi)容
本發(fā)明的目的是為了克服已有圖像特征度量方法存在的不足,提出基于先驗(yàn)知識的圖像檢索方法。本發(fā)明的目的是通過下述技術(shù)方案實(shí)現(xiàn)的。一種基于先驗(yàn)知識的圖像檢索方法,其操作步驟如下包括訓(xùn)練過程和測試過程。所述訓(xùn)練過程包括步驟一至步驟三,具體為步驟一、建立視覺詞匯表。依次對訓(xùn)練數(shù)據(jù)集中的每類圖像進(jìn)行分析處理,為每類圖像建立一個(gè)視覺詞匯表。使用一個(gè)類別的圖像建立該類別圖像的視覺詞匯表的具體步驟為步驟1.1 :獲取訓(xùn)練數(shù)據(jù)集中該類別圖像中各張圖像的特征向量,用符號(fi, f2, · · · , fn)表示,其中,......、4分別表示圖像的一個(gè)特征,η表示特征向量中特
征的個(gè)數(shù);所述特征是多維的,其維度用N表示,N > 2。所述獲取訓(xùn)練數(shù)據(jù)集中的每張圖像的特征向量的方法包括surf (Speed-up
Robust Features)算法和 sift (Scale Invariant Feature Transform)算法。步驟1. 2 :對于步驟1.1得到的該類別圖像的特征向量(f\,f2,. . .,fn)中的特征f1; f2, - - - , fn進(jìn)行聚類,得到m個(gè)特征類別,m為正整數(shù);步驟1. 3 :對于步驟1. 2得到的m個(gè)特征類別,獲取每個(gè)特征類別的單詞。所述每個(gè)特征類別的單詞為該特征類別中全部特征向量聚類的中心點(diǎn)。步驟1. 4 :得到該類別圖像的視覺詞匯表。所述該類別圖像的視覺詞匯表由該類別類圖像的各特征類別的單詞組成。步驟二、在步驟一操作的基礎(chǔ)上,統(tǒng)計(jì)每類圖像的單詞分布直方圖。針對一類圖像,統(tǒng)計(jì)該類別圖像的單詞分布直方圖的具體操作步驟為步驟2.1 :為該類別圖像的視覺詞匯表中的每個(gè)單詞設(shè)定一個(gè)統(tǒng)計(jì)量,分別用符號TpTy……、Tm表示,并設(shè)置1\、T2、……、Tm的初始值均為O。步驟2. 2 :依次使用該類別中的每一張圖像的特征向量(f\,f2,. . .,fn)中的每一個(gè)特征與該類別圖像的視覺詞匯表中的單詞逐一比較,找出距離最短的單詞,并將該單詞對應(yīng)的統(tǒng)計(jì)量自增I。步驟2. 3:對統(tǒng)計(jì)量1\、T2、……、Tm進(jìn)行歸一化處理。具體為分別用統(tǒng)計(jì)量!\、T2,……、Tm除以該類別圖像的特征數(shù)總和,得到的結(jié)果分別用T'2、……、τ/。步驟2. 4 :得到該類別圖像的單詞分布直方圖。所述單詞分布直方圖由該類別圖像的視覺詞匯表中的每個(gè)單詞對應(yīng)的歸一化后的統(tǒng)計(jì)量T'1、T' 2、……、τ/組成。步驟三、在步驟二操作的基礎(chǔ)上,計(jì)算每個(gè)類別圖像特征對應(yīng)的特征權(quán)值。對于一個(gè)類別的圖像,該類別圖像特征對應(yīng)的特征權(quán)值的計(jì)算方法為步驟3.1:找出該類別圖像的單詞分布直方圖中T' ρ T' 2、……、Tm'中的最大值,用符號Tmax'表不。步驟3. 2 :在該類圖像的特征向量(f\,f2,. . .,fn)中找到M個(gè)與步驟3.1得到的Tfflax/距離最接近的特征,生成MXN的矩陣,矩陣用符號AMXN,M值由人為指定,10彡M彡200并且M < η。步驟3. 3:計(jì)算矩陣Amxn中每列數(shù)據(jù)的方差的倒數(shù),分別用符號0ι、σ2、……、 步驟3. 4 :對步驟3. 3中所述矩陣Amxn中每列數(shù)據(jù)的方差的倒數(shù)σ ρ σ 2、……、0,進(jìn)行歸一化處理,得到該類別圖像特征對應(yīng)的特征權(quán)值,分別用COi表示,I < i SN。其
權(quán)利要求
1.一種基于先驗(yàn)知識的圖像檢索方法,其特征在于其操作步驟如下包括訓(xùn)練過程和測試過程;所述訓(xùn)練過程包括步驟一至步驟三,具體為步驟一、建立視覺詞匯表;依次對訓(xùn)練數(shù)據(jù)集中的每類圖像進(jìn)行分析處理,為每類圖像建立一個(gè)視覺詞匯表;使用一個(gè)類別的圖像建立該類別圖像的視覺詞匯表的具體步驟為步驟1.1:獲取訓(xùn)練數(shù)據(jù)集中該類別圖像中各張圖像的特征向量,用符號(fi, f2) · · · , fn)表示,其中,......、fn分別表示圖像的一個(gè)特征,η表示特征向量中特征的個(gè)數(shù);所述特征是多維的,其維度用N表示,Ν^2;步驟1. 2:對于步驟1.1得到的該類別圖像的特征向量(f\,f2,. . .,fn)中的特征f1; f2, - - - , fn進(jìn)行聚類,得到m個(gè)特征類別,m為正整數(shù);步驟1. 3 :對于步驟1. 2得到的m個(gè)特征類別,獲取每個(gè)特征類別的單詞;所述每個(gè)特征類別的單詞為該特征類別中全部特征向量聚類的中心點(diǎn);步驟1. 4 :得到該類別圖像的視覺詞匯表;所述該類別圖像的視覺詞匯表由該類別類圖像的各特征類別的單詞組成;步驟二、在步驟一操作的基礎(chǔ)上,統(tǒng)計(jì)每類圖像的單詞分布直方圖;針對一類圖像,統(tǒng)計(jì)該類別圖像的單詞分布直方圖的具體操作步驟為步驟2.1 :為該類別圖像的視覺詞匯表中的每個(gè)單詞設(shè)定一個(gè)統(tǒng)計(jì)量,分別用符號!\、T2 >……、Tm表示,并設(shè)置1\、T2、……、Tm的初始值均為O;步驟2. 2 :依次使用該類別中的每一張圖像的特征向量(f\,f2,. . .,fn)中的每一個(gè)特征與該類別圖像的視覺詞匯表中的單詞逐一比較,找出距離最短的單詞,并將該單詞對應(yīng)的統(tǒng)計(jì)量自增I;步驟2. 3:對統(tǒng)計(jì)量1\、T2、……、Tm進(jìn)行歸一化處理;具體為分別用統(tǒng)計(jì)量!\、T2,……、Tm除以該類別圖像的特征數(shù)總和,得到的結(jié)果分別用T'2、……、T/ ;步驟2.4 :得到該類別圖像的單詞分布直方圖;所述單詞分布直方圖由該類別圖像的視覺詞匯表中的每個(gè)單詞對應(yīng)的歸一化后的統(tǒng)計(jì)量T' pT' 2、……、T/組成;步驟三、在步驟二操作的基礎(chǔ)上,計(jì)算每個(gè)類別圖像特征對應(yīng)的特征權(quán)值;對于一個(gè)類別的圖像,該類別圖像特征對應(yīng)的特征權(quán)值的計(jì)算方法為步驟3.1:找出該類別圖像的單詞分布直方圖中T' pT' 2、……、Tm'中的最大值,用符號Tniax'表示;步驟3. 2 :在該類圖像的特征向量(f\,f2,. . .,fn)中找到M個(gè)與步驟3.1得到的Tmax'距離最接近的特征,生成MXN的矩陣,矩陣用符號Amxn,M值由人為指定,10≤M≤200并且M≤η ;步驟3. 3:計(jì)算矩陣Amxn中每列數(shù)據(jù)的方差的倒數(shù),分別用符號0ι、σ2、……、σΝ ;步驟3. 4:對步驟3. 3中所述矩陣Amxn中每列數(shù)據(jù)的方差的倒數(shù)0ι、σ2、……、σΝ進(jìn)行歸一化處理,得到該類別圖像特征對應(yīng)的特征權(quán)值,分別用Oi表示,I≤i≤N ;其中,
2.如權(quán)利要求1所述的一種基于先驗(yàn)知識的圖像檢索方法,其特征在于其步驟一步驟1.1中所述獲取訓(xùn)練數(shù)據(jù)集中的每張圖像的特征向量的方法包括surf算法和sift算法。
全文摘要
本發(fā)明涉及一種基于先驗(yàn)知識的圖像檢索方法,屬于基于內(nèi)容的圖像檢索領(lǐng)域。本發(fā)明的圖像檢索方法使用加入維度權(quán)值的歐式距離的度量方法,把圖像中的背景部分剔除,只保留用戶關(guān)注的前景內(nèi)容;并降低背景部分的維度權(quán)值,提高前景維度權(quán)值,減少了背景的影響,增加了圖像中的前景對最后檢索結(jié)果的影響。其檢索過程為首先提取目標(biāo)圖像的局部特征,然后選取當(dāng)前比較的圖像類別下相應(yīng)的維度權(quán)值,利用加權(quán)歐式距離函數(shù)進(jìn)行相似性度量,最后根據(jù)相似度的大小返回相應(yīng)的圖片。本發(fā)明提出的基于先驗(yàn)知識的圖像檢索方法與已有基于內(nèi)容的圖像檢索方法相比較,檢索更準(zhǔn)確、效率更高。
文檔編號G06K9/62GK103064985SQ201310033058
公開日2013年4月24日 申請日期2013年1月28日 優(yōu)先權(quán)日2013年1月28日
發(fā)明者陳宇峰, 李鳳霞, 閆高潔, 楊志中, 俞文昌 申請人:北京理工大學(xué)