本發(fā)明涉及圖像的檢索方法,具體涉及一種圖像的手機在線高效檢索方法。
背景技術:
基于內容的圖像檢索(cbir)是當前一種非常流行和重要的圖像檢索技術,這種技術通過計算機對圖像進行分析,提取圖像特征,建立特征庫,然后檢索時通過特征比對確定圖像的相似度,最后根據相似度大小返回結果,這種技術不同于傳統(tǒng)的基于文本的圖像檢索,它不需要人為對圖像進行分類,標注等,圖像檢索自動化程度高,檢索的結果符合人的視覺習慣,比較令人滿意。
在現有的基于內容的圖像檢索中,主要存在以下幾個技術問題:其一,圖像特征提取技術;在圖像中能夠提取的圖像特征非常多,但針對圖像而言需要提取的特征主要是紋理特征,而常用的紋理特征常難以同時滿足旋轉不變性、尺度不變性,對明暗變化的魯棒性要求。其二,一般來說,圖像檢索時需要將參考圖像的特征與圖像庫的特征一一比對,然后按相似度排序。但在實際工作中發(fā)現,有些特征比對方便但難以滿足圖像旋轉,縮放和切割后特征基本不變等要求,影響檢索準確度;有些特征具有較好的旋轉不變性和尺度不變性(如sift特征和surf特征等),但比對效率很低,速度很慢。特別是當圖像庫很大時,常常難以到達實時性的要求。其三,現有的基于內容的特征檢索常常需要多次檢索迭代,最終才能獲得最好的檢索結果,期間常需要人為的干預。總之,現有的基于內容的檢索技術難以滿足大數據量下的手機在線檢索的實時性要求。
技術實現要素:
本發(fā)明的目的在于:針對現有技術的上述缺陷,提供一種高效圖像檢索方法;可滿足大數據量下的手機在線檢索的實時性要求。提供一種高效圖像檢索方法,包括如下步驟:
圖像入庫步驟:
用手機或其他數碼設備獲取圖像,再對圖像進行濾波去噪,均衡化及自適應灰度化等預處理操作,然后對預處理的圖像提取surf特征(surf特征向量的維數可取為64或128),對獲得的特征向量按其幅值排序,選取最大的若干個(例如100個)特征向量作為圖像特征,并生成特征串保存到數據庫中;
對所有候選圖像的特征向量進行聚類(如k-kmeans聚類等)(聚類的數量k可根據圖像數規(guī)模確定),計算并保證每個聚類中心,同時對圖像庫中每個圖像所包含的聚類進行標記;例如,如果某個候選圖像包含了某個特征類,則在數據庫中此圖像對應字段標記為1,否則標記為0;最后對圖像庫中個的聚類標記建立多維索引(如k-d-tree或kdg-tree);
圖像檢索步驟,包括兩個過程:即初選和精選;初選時,首先通過手機或其他數碼設備獲取查詢的參考圖像,并對圖像進行同樣的預處理和提取surf特征;然后計算參考圖像的每個特征所屬的類、得到包含的類標記;通過多維索引快速查找并獲得與參考圖像配配特征最多的若干個圖像(即初選圖像);在獲得若干個初選圖像后,可進行精選:精選時,將獲得的參考圖像全部特征向量與初選圖像的全部特征進行比較,找出具有相同特征的最多的n個圖像并排序,作為查詢結果返回給用戶。
在本方法中,采用surf算法提取圖像的surf特征,這些特征具有旋轉不變性和尺度不變性。采用自適應灰度化算法可以較好地避免圖像光照變化對查詢結果的影響,保證圖像提取的特征具有一致性。在本方法中,通過特征聚類,使可以方便建立特征聚類標記的索引樹,可大大提高查詢效率,解決surf特征比對效率低下的問題。此外,為了解決返回結果可能較多的問題,在查詢流程中設計了二次查找,先通過多維索引快速返回一個初選結果集,然后對初選結果集的圖像進行二次精選,使可以獲得滿意的結果。由于經過初選后,候選的圖像數比較少,此時對所有特征進行比對查找效率很高,可以實現圖像的高效檢索,特別是圖像規(guī)模較大時,更具有優(yōu)勢。
本方法具有較廣的適用性。既能用于離線圖像檢索,也能用于手機在線圖像的檢索,快速而高效。
本方法能有效消除背景噪聲的影響,能適應于不同的光照條件。對圖像的尺度變化,旋轉變化,顏色和明暗變化等都有較好的魯棒性。不同尺寸、不同角度、不同明暗及曝光條件的圖像均能獲得良好的檢索效果。并且,本方法的整個檢索過程完全可以自動完成,中間不需要人工參與和進行多次迭代查找,具有較好的準確率和速度,出錯率低。
附圖說明
圖1是本發(fā)明圖像入庫原理流程圖。
圖2是本發(fā)明圖像檢索原理流程圖
具體實施方式
如圖1、圖2所示:提供一種高效圖像檢索方法,包括如下步驟:
1、圖像入庫步驟:
用手機或其他數碼設備獲取圖像,再對圖像進行濾波去噪,均衡化及自適應灰度化等預處理操作,然后對預處理的圖像提取surf特征(surf特征向量的維數可取為64或128),對獲得的特征向量按其幅值排序,選取最大的若干個(例如100個)特征向量作為圖像特征,并生成特征串保存到數據庫中;
對所有候選圖像的特征向量進行聚類(如k-kmeans聚類等)(聚類的數量k可根據圖像數規(guī)模確定),計算并保證每個聚類中心,同時對圖像庫中每個圖像所包含的聚類進行標記;例如,如果某個候選圖像包含了某個特征類,則在數據庫中此圖像對應字段標記為1,否則標記為0;最后對圖像庫中個的聚類標記建立多維索引(如k-d-tree或kdg-tree);
2、圖像檢索步驟,包括兩個過程:即初選和精選;初選時,首先通過手機或其他數碼設備獲取查詢的參考圖像,并對圖像進行同樣的預處理和提取surf特征;然后計算參考圖像的每個特征所屬的類、得到包含的類標記;通過多維索引快速查找并獲得與參考圖像配配特征最多的若干個圖像(即初選圖像);在獲得若干個初選圖像后,可進行精選:精選時,將獲得的參考圖像全部特征向量與初選圖像的全部特征進行比較,找出具有相同特征的最多的n個圖像并排序,作為查詢結果返回給用戶。
在本方法中,采用surf算法提取圖像的surf特征,這些特征具有旋轉不變性和尺度不變性。采用自適應灰度化算法可以較好地避免圖像光照變化對查詢結果的影響,保證圖像提取的特征具有一致性。在本方法中,通過特征聚類,使可以方便建立特征聚類標記的索引樹,可大大提高查詢效率,解決surf特征比對效率低下的問題。此外,為了解決返回結果可能較多的問題,在查詢流程中設計了二次查找,先通過多維索引快速返回一個初選結果集,然后對初選結果集的圖像進行二次精選,使可以獲得滿意的結果。由于經過初選后,候選的圖像數比較少,此時對所有特征進行比對查找效率很高,可以實現圖像的高效檢索,特別是圖像規(guī)模較大時,更具有優(yōu)勢。既能用于離線圖像檢索,也能用于手機在線圖像的檢索,快速而高效。
本方法能有效消除背景噪聲的影響,能適應于不同的光照條件。對圖像的尺度變化,旋轉變化,顏色和明暗變化等都有較好的魯棒性。不同尺寸、不同角度、不同明暗及曝光條件的圖像均能獲得良好的檢索效果。并且,本方法的整個檢索過程完全可以自動完成,中間不需要人工參與和進行多次迭代查找,具有較好的準確率和速度,出錯率低。