一種高效的圖像檢索性能預(yù)測(cè)方法
【專利摘要】本發(fā)明公開(kāi)了一種高效的圖像檢索性能預(yù)測(cè)方法,該方法包括:基于偽相關(guān)反饋技術(shù)從檢索結(jié)果中自適應(yīng)的選擇樣例圖片;基于投票決策機(jī)制,并根據(jù)所述檢索結(jié)果中每一張圖片與所述樣例圖片的視覺(jué)相似度來(lái)確定每一張圖片的投票數(shù),進(jìn)而估計(jì)所述檢索結(jié)果中每一張圖片與輸入的查詢請(qǐng)求之間的相關(guān)性概率;綜合檢索結(jié)果中所有圖片與輸入的查詢請(qǐng)求之間的相關(guān)性概率來(lái)計(jì)算本次圖像檢索的平均準(zhǔn)確率,實(shí)現(xiàn)高效的圖像檢索性能預(yù)測(cè)。本發(fā)明公開(kāi)的方法復(fù)雜度較低,便于實(shí)現(xiàn),不易受噪聲影響且能較為準(zhǔn)確的對(duì)圖像檢索性能進(jìn)行預(yù)測(cè)。
【專利說(shuō)明】-種高效的圖像檢索性能預(yù)測(cè)方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及圖像檢索【技術(shù)領(lǐng)域】,尤其涉及一種高效的圖像檢索性能預(yù)測(cè)方法。
【背景技術(shù)】
[0002] 圖像檢索技術(shù)是在給定查詢文本或者圖像的前提下,依據(jù)內(nèi)容信息或者指定查詢 標(biāo)準(zhǔn),從圖像數(shù)據(jù)庫(kù)中搜索與用戶查詢相關(guān)的圖片,并按照?qǐng)D片與查詢間的相關(guān)程度從高 到低對(duì)圖片進(jìn)行排序并將排序結(jié)果返回給用戶。圖像檢索技術(shù)的研究已經(jīng)取得了巨大的 進(jìn)展,許多檢索模型被相繼提出并在實(shí)踐中不斷得到校驗(yàn)、改進(jìn)和驗(yàn)證,但是大多數(shù)檢索系 統(tǒng)還存在嚴(yán)重的魯棒性問(wèn)題,例如,對(duì)于某些查詢,檢索結(jié)果質(zhì)量高,而對(duì)于其它查詢,檢索 結(jié)果含有很多查詢無(wú)關(guān)的圖像。針對(duì)不同查詢其檢索結(jié)果間往往存在較大的差異;更有甚 者,即使那些平均檢索性能很好的檢索系統(tǒng),但對(duì)某些查詢,它們的檢索結(jié)果也不能令人滿 意。因此,我們希望檢索系統(tǒng)能夠自動(dòng)識(shí)別那些檢索結(jié)果比較差的查詢,并對(duì)它們做相應(yīng)的 處理。
[0003] 查詢性能預(yù)測(cè)是信息檢索領(lǐng)域研究的前沿問(wèn)題。該技術(shù)嘗試在沒(méi)有相關(guān)信息(即 不知道檢索結(jié)果與查詢的相關(guān)程度)的情況下,評(píng)估檢索系統(tǒng)對(duì)某一查詢其返回結(jié)果的好 壞程度。查詢性能預(yù)測(cè)能夠同時(shí)對(duì)用戶和檢索系統(tǒng)產(chǎn)生有益的影響。從用戶的角度講,該 技術(shù)可W提供有價(jià)值的反饋信息,比如,當(dāng)檢索系統(tǒng)預(yù)測(cè)出某用戶的查詢結(jié)果比較差的時(shí) 候,可W將該信息反饋給用戶,然后用戶可W重構(gòu)他的查詢,甚至進(jìn)一步與檢索系統(tǒng)互動(dòng)W 獲得更好地檢索結(jié)果;對(duì)檢索系統(tǒng)來(lái)說(shuō),在理想情況下,如果一個(gè)檢索系統(tǒng)能夠預(yù)測(cè)某一查 詢的性能,那么它就可W自動(dòng)地調(diào)整其參數(shù)或者算法來(lái)適應(yīng)不同的查詢,從而獲得更好的 檢索性能。
[0004] 相對(duì)于長(zhǎng)期為提高檢索系統(tǒng)性能在檢索模型上的探索,圖像檢索查詢性能預(yù)測(cè)的 研究還處于初級(jí)階段。最初關(guān)于圖像檢索查詢性能預(yù)測(cè)的研究是基于文本信息的,主要通 過(guò)研究檢索返回圖片周圍的文本信息(上下文文本,圖片U化等)與輸入查詢文本之間的 相互關(guān)系,例如文本的具體性、一般性、歧義性和形象性等。該些研究主要存在兩點(diǎn)不足:1) 忽略圖像的視覺(jué)內(nèi)容僅依賴于文本信息,然而文本不足W描述豐富的視覺(jué)信息W及文本信 息往往包含很多"噪聲";2)沒(méi)有估計(jì)真實(shí)的圖像檢索結(jié)果質(zhì)量,而只是簡(jiǎn)單將查詢分為容 易和困難兩類。
[0005] 目前大部分研究是針對(duì)檢索返回圖片視覺(jué)內(nèi)容的查詢性能預(yù)測(cè)。該研究的主要 思想是首先將圖片表示成由視覺(jué)單詞組成的"文檔",然后借用文本分析的方法統(tǒng)計(jì)一些特 性,比如計(jì)算由返回圖片構(gòu)成的語(yǔ)言模型和由整個(gè)圖片集構(gòu)成的語(yǔ)言模型之間的概率分布 差異性;估計(jì)返回圖片之間的空間一致性;研究針對(duì)檢索返回列表排名靠前的圖片視覺(jué)一 致性;W及研究返回圖片的視覺(jué)相似性分布等等。該些研究先提出合理的假設(shè),然后充分利 用圖片的視覺(jué)信息,來(lái)估計(jì)檢索結(jié)果的查詢性能,推動(dòng)了圖像檢索查詢性能預(yù)測(cè)技術(shù)的發(fā) 展。但是該些方法只是給出了一個(gè)查詢性能高低的指示值,并沒(méi)有估計(jì)出檢索結(jié)果質(zhì)量的 真值。
[0006] 目前的研究方法中,除了上述方法外,還有從直接估計(jì)真實(shí)檢索性能方面研究的 方法。該方法的大致思想是,首先估計(jì)每個(gè)返回圖片與給定查詢的相關(guān)性概率,然后利用得 到的相關(guān)性概率來(lái)估計(jì)平均準(zhǔn)確率,其關(guān)鍵點(diǎn)就是如何準(zhǔn)確得估計(jì)相關(guān)性概率。由于該方 法是一種直接估計(jì)檢索結(jié)果質(zhì)量真值的方法,所W如果無(wú)法準(zhǔn)確估計(jì)出相關(guān)性概率,那么 勢(shì)必會(huì)影響最終結(jié)果的準(zhǔn)確性。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的是提供一種高效的圖像檢索性能預(yù)測(cè)方法,該方法復(fù)雜度較低,便 于實(shí)現(xiàn),不易受噪聲影響且能較為準(zhǔn)確的對(duì)圖像檢索性能進(jìn)行預(yù)測(cè)。
[0008] 本發(fā)明的目的是通過(guò)W下技術(shù)方案實(shí)現(xiàn)的:
[0009] 一種高效的圖像檢索性能預(yù)測(cè)方法,該方法包括:
[0010] 基于偽相關(guān)反饋技術(shù)從檢索結(jié)果中自適應(yīng)的選擇樣例圖片;
[0011] 基于投票決策機(jī)制,并根據(jù)所述檢索結(jié)果中每一張圖片與所述樣例圖片的視覺(jué)相 似度來(lái)確定每一張圖片的投票數(shù),進(jìn)而估計(jì)所述檢索結(jié)果中每一張圖片與輸入的查詢請(qǐng)求 之間的相關(guān)性概率;
[0012] 綜合檢索結(jié)果中所有圖片與輸入的查詢請(qǐng)求之間的相關(guān)性概率來(lái)計(jì)算本次圖像 檢索的平均準(zhǔn)確率,實(shí)現(xiàn)高效的圖像檢索性能預(yù)測(cè)。
[0013] 進(jìn)一步的,所述基于偽相關(guān)反饋技術(shù)從檢索結(jié)果中自適應(yīng)的選擇樣例圖片包括:
[0014] 利用圖像檢索重排序方法對(duì)檢索結(jié)果進(jìn)行重新排序,再基于偽相關(guān)反饋技術(shù)從重 新排序的檢索結(jié)果中自適應(yīng)的選擇樣例圖片;所述樣例圖片包括正樣例圖片集合與負(fù)樣例 圖片集合,或者僅包括正樣例圖片集合;所述正樣例圖片集合為重新排序的檢索結(jié)果中排 名為前K的圖片,所述負(fù)樣例圖片集合為重新排序的檢索結(jié)果中排名為后K的圖片;其中, K的數(shù)值通過(guò)一致性得分CoS的方法來(lái)確定,表示為:
[0015]
【權(quán)利要求】
1. 一種高效的圖像檢索性能預(yù)測(cè)方法,其特征在于,該方法包括: 基于偽相關(guān)反饋技術(shù)從檢索結(jié)果中自適應(yīng)的選擇樣例圖片; 基于投票決策機(jī)制,并根據(jù)所述檢索結(jié)果中每一張圖片與所述樣例圖片的視覺(jué)相似度 來(lái)確定每一張圖片的投票數(shù),進(jìn)而估計(jì)所述檢索結(jié)果中每一張圖片與輸入的查詢請(qǐng)求之間 的相關(guān)性概率; 綜合檢索結(jié)果中所有圖片與輸入的查詢請(qǐng)求之間的相關(guān)性概率來(lái)計(jì)算本次圖像檢索 的平均準(zhǔn)確率,實(shí)現(xiàn)高效的圖像檢索性能預(yù)測(cè)。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述基于偽相關(guān)反饋技術(shù)從檢索結(jié)果中 自適應(yīng)的選擇樣例圖片包括: 利用圖像檢索重排序方法對(duì)檢索結(jié)果進(jìn)行重新排序,再基于偽相關(guān)反饋技術(shù)從重新排 序的檢索結(jié)果中自適應(yīng)的選擇樣例圖片;所述樣例圖片包括正樣例圖片集合與負(fù)樣例圖片 集合,或者僅包括正樣例圖片集合;所述正樣例圖片集合為重新排序的檢索結(jié)果中排名為 前K的圖片,所述負(fù)樣例圖片集合為重新排序的檢索結(jié)果中排名為后K的圖片;其中,K的 數(shù)值通過(guò)一致性得分CoS的方法來(lái)確定,表示為:
其中,礦表示K的最優(yōu)值,L和M分別表示K值的最小值和最大值;CoS (K)為所選擇的 正樣例圖片中滿足一致性的圖片對(duì)所占的百分比,表示為:
上式中,S(I^P)表示圖片Ii和P之間的視覺(jué)相似度,U為預(yù)設(shè)的閾值。
3. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,計(jì)算檢索結(jié)果中每一張圖片與所述樣 例圖片的視覺(jué)相似度的步驟包括: 采用視覺(jué)詞袋模型和向量空間模型將所有圖片表示成一組向量,包括:采用密集采 樣尺度不變特征轉(zhuǎn)換技術(shù)Dense SIFT提取每一圖片的SIFT特征;然后,使用聚類算法 K-means將得到的所有SIFT特征聚成包含S個(gè)視覺(jué)單詞visual word的碼本;按照最近鄰 準(zhǔn)則將所有SIFT特征量化到對(duì)應(yīng)的visual word上;再使用TF-IDF權(quán)重機(jī)制來(lái)衡量每個(gè) visual word在每張圖片中的重要性;最后,用向量空間模型來(lái)表示每張圖片; 圖片Ii的向量表達(dá)式為f =[#¥,...,<],Xi中每維向量勺計(jì)算如下: X11 , I-1,2, ...,S ; 其中,tf\表示視覺(jué)單詞W1在圖片Ii中出現(xiàn)的頻率,Idf1表示逆文檔頻率,用于衡量視 覺(jué)單詞W1在整個(gè)圖片集中的重要性; 采用余弦函數(shù)cosine來(lái)計(jì)算檢索結(jié)果中圖片Ii和樣例圖片Dk的視覺(jué)相似度s (Ii, Dk), 表示為:
4. 根據(jù)權(quán)利要求1或2所述的方法,其特征在于,所述基于投票決策機(jī)制,并根據(jù)所述 檢索結(jié)果中每一張圖片與所述樣例圖片的相似度來(lái)確定每一張圖片的投票數(shù)包括: 將檢索結(jié)果中每一張圖片分別與樣例圖片中的正樣例圖片集合P中的每一樣例圖片 以及負(fù)樣例圖片集合N中每一樣例圖片進(jìn)行視覺(jué)相似度計(jì)算,若計(jì)算結(jié)果大于閾值,則該 圖片獲得一張相應(yīng)的初始投票,表示為:
其中,與VO^分別表示圖片Ii與正樣例圖片集合p中第k個(gè)圖片以及負(fù)樣例圖 片集合N中第k個(gè)圖片進(jìn)行視覺(jué)相似度計(jì)算后獲得的初始正負(fù)票數(shù),M表示檢索結(jié)果中的 圖片數(shù)量,U為預(yù)設(shè)的閾值; 再根據(jù)每一圖片獲得的初始投票總數(shù)確認(rèn)其最終投票數(shù),表示為:
其中,與分別表示圖片Ii最終的正投票數(shù)與負(fù)投票數(shù)。
5. 根據(jù)權(quán)利要求4所述的方法,其特征在于,所述估計(jì)所述檢索結(jié)果中每一張圖片與 輸入的查詢請(qǐng)求之間的相關(guān)性概率包括: 若所述樣例圖片包括正樣例圖片集合與負(fù)樣例圖片集合,則圖片Ii與輸入的查詢請(qǐng)求 之間的相關(guān)性概率Pi計(jì)算公式為:
若所述樣例圖片僅包括正樣例圖片集合,則將所述正樣例圖片集合中每一正樣例圖片 做為一個(gè)分類器,再利用回歸算法來(lái)整合每個(gè)分類器的分類結(jié)果,獲得圖片Ii與輸入的查 詢請(qǐng)求之間的相關(guān)性概率Pi :
其中,fkdO表示第k個(gè)分類器對(duì)圖片Ii的分類結(jié)果,當(dāng)圖片獲得一張正投票時(shí),L(Ii)=1,否貝U,4(1) = 〇。
6.根據(jù)權(quán)利要求5所述的方法,其特征在于,所述綜合檢索結(jié)果中所有圖片與輸入的 查詢請(qǐng)求之間的相關(guān)性概率來(lái)計(jì)算本次圖像檢索的平均準(zhǔn)確率包括: 對(duì)于樣例圖片包括正樣例圖片集合與負(fù)樣例圖片集合的情況,計(jì)算本次圖像檢索的平 均準(zhǔn)確率的公式為:
其中,T表示對(duì)檢索結(jié)果進(jìn)行重新排序后排名前T的所有圖片,rel(i)為一個(gè)二值函 數(shù),表示當(dāng)排名第i的圖片與輸入的查詢請(qǐng)求相關(guān),則rel (i) = 1,否則,rel (i) = 0, i屬 于[1,T],j屬于[1,i] ;ZT為一個(gè)歸一化系數(shù); 對(duì)于樣例圖片僅包括正樣例圖片集合的情況,計(jì)算本次圖像檢索的平均準(zhǔn)確率的公式 為:
其中,E表示數(shù)學(xué)期望。
【文檔編號(hào)】G06F17/30GK104331513SQ201410685896
【公開(kāi)日】2015年2月4日 申請(qǐng)日期:2014年11月24日 優(yōu)先權(quán)日:2014年11月24日
【發(fā)明者】賈強(qiáng)槐, 田新梅 申請(qǐng)人:中國(guó)科學(xué)技術(shù)大學(xué)