本發(fā)明涉及模式識別技術(shù)、信息融合技術(shù)、信息編碼技術(shù)和數(shù)字圖像處理技術(shù)領(lǐng)域,具體的說是一種通過基于自適應(yīng)碼本的llc聚類圖像區(qū)域的方法。
背景技術(shù):
模式識別技術(shù)是指對表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進行處理和分析,以對事物或現(xiàn)象進行描述、辨認、分類和解釋的過程,是信息科學和人工智能的重要組成部分。顯著性檢測中的模式識別指的是對圖像中背景和目標的識別與分類。顯著目標是圖像中從背景中突出的人或事物,一般包含更多人們感興趣的、更有用的信息。顯著目標檢測的主要任務(wù)即檢測并標定出顯著目標所在的區(qū)域。由于檢測結(jié)果可以被直接使用,因此,顯著目標檢測廣泛應(yīng)用于目標識別、圖像分割、圖像檢索等領(lǐng)域。
常用的顯著目標檢測技術(shù)主要有基于局部對比的顯著區(qū)域檢測技術(shù),如:基于局部對比和模糊生長技術(shù)、多尺度中心-周圍直方圖和顏色空間分布對比技術(shù)等;以及基于全局對比的顯著區(qū)域檢測技術(shù)。顯著目標檢測技術(shù)中的關(guān)鍵是通過像素、超像素、區(qū)域塊等檢測單位間的局部或全局特征差來確定各個檢測單位的顯著值,因此,特征提取是計算特征差的基本步驟。由于顯著顏色是引起人類視覺注意的最根本特征,人們通常選取顏色計算特征差。目前許多顯著目標檢測模型雖然在單顯著目標和簡單背景場景下的性能已接近測試集的標準,但在多目標和復雜背景下,尤其是在目標相融的背景下不能取得較好的表現(xiàn)。當圖像場景復雜時,顏色特征可能不足以作為目標與背景的分類依據(jù)。這是因為場景的復雜通常表現(xiàn)為以下特性:1、場景中含有多個結(jié)構(gòu)復雜的目標,并可能部分相互重疊;2、目標區(qū)域呈不規(guī)則形狀;3、目標分布于圖像四周;4、目標與背景具有相似的色調(diào),或者二者均具有雜亂的色調(diào)。在上述特性中,最后一個特性是難以用顏色特征差將目標從背景中提取出來的,此時紋理特征差將可作為顯著目標檢測的重要依據(jù)。此外,位于圖像中心區(qū)域的事物往往被最先注意,背景常分布在圖像四周的邊界區(qū)域,這就凸顯了區(qū)域間的空間關(guān)系特征的優(yōu)勢,該特征也可為顯著性檢測提供了可參考的線索。當顏色差不足以提供顯著目標檢測的線索時,如何運用圖像的多個特征并將它們有效地融合是需要解決的關(guān)鍵問題。另一方面,由于圖像場景復雜時機器視覺難以將前景從雜亂的背景中檢測出來,造成多種先進算法生成的顯著圖中存在前景區(qū)域附近噪聲較多、甚至前景邊界模糊的現(xiàn)象,提高了進一步的前景或目標識別的難度。
基于局部性約束的線性編碼(locality-constrainedlinearcoding,簡稱llc)是一種高效且魯棒的分類技術(shù),最初主要用于圖像分類。由于強調(diào)稀疏編碼過程中的“特征局部性”,其使用促使圖像分類的正確率提高很多。同時,llc方案還具有快速性的特點,其原理簡單,大大縮短了編碼所需的時間。
特征向量模型(featurevectormodel)被廣泛使用于圖像處理領(lǐng)域。多個特征數(shù)據(jù)可按照“均一權(quán)值”或“差額權(quán)值”的方式被融合入一個向量中表示,表示方法簡單且易于參與運算。本發(fā)明僅涉及“均一權(quán)值”的向量模型來融合圖像區(qū)域的質(zhì)心、顏色、紋理和gabor特征。
簡單線性迭代聚類(simplelineariterativeclustering,簡稱slic)是一種高效的圖像分割法,該方法將圖像分割為n個超像素(n的取值一般在200左右具有最佳效果),劃分為同一個超像素的像素或圖像塊具有顏色相似性和內(nèi)部緊致性。目前,性能較好的圖像顯著性檢測方法大多基于slic超像素分割,不僅可以達到快速檢測的目標而且獲得的顯著圖也更加平滑。目前,很多高效的顯著目標檢測算法以slic超像素作為特征提取和顯著值計算的基本檢測單位。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的是提供一種通過基于自適應(yīng)碼本的llc聚類圖像區(qū)域的方法,從已分割的超像素中提取顏色、紋理、質(zhì)心等特征后,通過融合的特征聚類鄰近區(qū)域,以相似性結(jié)構(gòu)圖的形式提高鄰近的多個區(qū)域間的可辯度,為減少甚至消除生成的顯著圖中前景邊界附近的噪聲提供非常有價值的線索。
為解決上述技術(shù)問題,本發(fā)明采用的技術(shù)方案為:
一種通過基于自適應(yīng)碼本的llc聚類圖像區(qū)域的方法,包括以下步驟:
步驟一:圖像過分割及超像素區(qū)域特征提取:將原圖按照slic方法分割為n個超像素,并提取各個超像素區(qū)域的質(zhì)心、顏色、紋理及gabor特征;
步驟二:擴展llc對每個超像素圖像區(qū)域進行稀疏編碼:根據(jù)超像素特征提取結(jié)果,分別組織對應(yīng)于每個超像素的自適應(yīng)碼本,按照局部性原理進行線性編碼,獲得所有超像素圖像區(qū)域的稀疏編碼碼字;
步驟三:編碼轉(zhuǎn)換:實現(xiàn)擴展的llc編碼碼字轉(zhuǎn)換為對稱方陣以表示鄰近區(qū)域的聚類結(jié)果;
步驟四:構(gòu)建相似性結(jié)構(gòu)圖:根據(jù)編碼轉(zhuǎn)換的結(jié)果和超像素區(qū)域的特征構(gòu)建圖像超像素區(qū)域相似性結(jié)構(gòu)圖。
所述步驟一中圖像過分割及超像素區(qū)域特征提取方法為:
1)將原圖像用slic法分割成n個超像素;
2)提取原圖各超像素的質(zhì)心,用橫縱坐標表示;
3)提取原圖各超像素在lab空間下的三個顏色均值;
4)提取原圖各超像素在rgb空間下的三個顏色均值;
5)提取原圖各超像素的lbp紋理特征值,用59bins表示;
6)提取原圖各超像素的36維gabor特征。
所述步驟二中擴展llc對每個超像素圖像區(qū)域進行稀疏編碼的方法為:
1)對于每一個超像素,將其顏色、紋理、gabor特征值融合入一個特征向量以表示該超像素,用公式(1)表示并存放:
2)對每一個超像素spi,將所在圖像中除去該超像素的其他所有超像素的顏色、紋理、gabor特征值融合為一個101×(n-1)維的特征矩陣以作為該超像素進行l(wèi)lc的碼本,自適應(yīng)碼本
3)按照公式(3)-(6)進行擴展的llc編碼,得到每個超像素對應(yīng)其專屬碼本的編碼碼字,將編碼結(jié)果寫入(n-1)維的編碼指示向量,用公式(7)定義、表示:
其中,
表示spi與碼本中各元素的距離向量,
記錄llc編碼的指示向量:
其中
所述步驟三中編碼轉(zhuǎn)換的方法為:
1)將每個超像素的編碼向量按照如下公式(8)從(n-1)維擴展為n維:
2)將所有超像素擴展后的編碼向量整合為一個n×n的編碼矩陣;
3)對編碼矩陣進行對稱化處理,按照如下公式(9)轉(zhuǎn)換為對稱方陣a表示聚類結(jié)果,完成所有超像素的聚類表示:
其中
所述步驟四中構(gòu)建相似性結(jié)構(gòu)圖的方法為:
1)將用于聚類表示的對稱編碼矩陣中指示有聚類關(guān)系的位置一一找出,按照如下公式(10)計算有聚類關(guān)系的兩個結(jié)點對應(yīng)的超像素的相似度測量值:
其中,
2)初始化一個n×n的全零矩陣表示相似性結(jié)構(gòu)圖的仿射矩陣;
3)提取聚類表示的對稱編碼矩陣中指示聚類關(guān)系為1的位置,計算對應(yīng)的兩個超像素關(guān)于四個特征的四個相似度測量值,仿射矩陣對應(yīng)該位置的值被賦值為四個相似度測量值的乘積作為相似性結(jié)構(gòu)圖的邊的權(quán)值,完成相似性結(jié)構(gòu)圖的構(gòu)建。
本發(fā)明的有益效果:
(1)使用多個特征作為計算顯著圖的依據(jù),在復雜場景下,當使用顏色特征無法有效提取顯著目標時,多特征信息作為有益補充可有效提高檢測效果;
(2)擴展的llc編碼方案,將原始llc中多個特征描述子分別編碼再融入目標函數(shù)的方法擴展為先融合多個特征描述再一次性編碼,簡化了編碼過程,強調(diào)了多個特征的整體性;
(3)對每一個超像素使用一次llc,編碼過程相對獨立,不易受相鄰的其他區(qū)域干擾,自適應(yīng)碼本的設(shè)計使每次編碼圍繞一個超像素區(qū)域進行,在編碼轉(zhuǎn)換時可根據(jù)編碼時超像素出現(xiàn)的頻率自動生成聚類中心;
(4)聚類結(jié)果以相似性結(jié)構(gòu)圖的形式表出,可直接改進基于圖的流形排序(graphbasedmanifoldranking,簡稱gmr)的圖結(jié)構(gòu),獲得較為明顯的性能改進效果,生成的顯著圖中前景邊界更加清晰,噪聲更少;在sed2、ecssd和dut_omron三個具有復雜場景圖像特征的標準測試庫中,使用提供的groundtruth依次對比計算出的顯著圖,表1記載了使用基于本發(fā)明改進圖流形排序的圖結(jié)構(gòu)得到的顯著圖在平均fmeasure值(越高越好)及mae值(越低越好)等評價標準的比較結(jié)果,最好的兩個結(jié)果用加粗字體標出;表中數(shù)據(jù)表明:使用多特征及基于自適應(yīng)碼本的llc使得檢測效果得到了明顯提高。圖5展示了基于本發(fā)明構(gòu)建的圖結(jié)構(gòu)改進圖流形排序獲得的顯著性檢測圖與其他經(jīng)典算法生成的顯著圖的比較,可以看出使用本發(fā)明構(gòu)建的圖結(jié)構(gòu)改進圖流形排序之后,顯著性檢測圖中的前景邊界更加清晰,背景噪聲更少,改進效果是比較明顯的。
表1多算法性能比較(ellsc算法使用了本發(fā)明結(jié)果構(gòu)建流形排序的圖結(jié)構(gòu))
附圖說明
圖1是本發(fā)明涉及的通過基于自適應(yīng)碼本llc聚類圖像區(qū)域的方法的總流程圖;
圖2是本發(fā)明涉及的擴展llc的流程圖;
圖3是本發(fā)明涉及的編碼轉(zhuǎn)換流程圖;
圖4是本發(fā)明涉及的生成相似性結(jié)構(gòu)圖流程圖;
圖5是基于本發(fā)明構(gòu)建的圖結(jié)構(gòu)改進圖流形排序獲得的顯著性檢測圖與其他經(jīng)典算法生成的顯著圖的比較圖。
具體實施方式
下面結(jié)合具體實施方式對本發(fā)明做進一步的闡述。
本發(fā)明所涉及的通過基于自適應(yīng)碼本的llc聚類圖像區(qū)域的方法,包括:原圖像區(qū)域劃分及特征提取、擴展llc對每個超像素圖像區(qū)域進行稀疏編碼、編碼轉(zhuǎn)換以及構(gòu)建相似性結(jié)構(gòu)圖等步驟。
本發(fā)明所涉及的超像素區(qū)域分割采用目前性能較好的像素聚類技術(shù)——slic法,聚類后的超像素不僅內(nèi)部緊致,而且能夠有效保存顯著目標邊緣,保證了最后生成的顯著圖平滑和較清晰地顯示目標輪廓。
本發(fā)明所涉及的超像素特征提取選用了圖像超像素區(qū)域的lab顏色、rgb顏色、lbp紋理和gabor小波組建特征向量,使用超像素區(qū)域的質(zhì)心參與擴展llc編碼準則;lbp紋理和gabor小波在復雜背景或背景與目標色調(diào)相似的情況下能有效區(qū)分超像素之間的差異,質(zhì)心特征從空間關(guān)系方面突出了鄰近區(qū)域的特征局部性。
本發(fā)明所涉及的擴展llc方案源于常用于圖像分類的魯棒的llc,擴展方案主要體現(xiàn)在:將原始llc方案中的按多特征描述子分別編碼然后融合入目標函數(shù)的方法改進為先融合多特征描述子然后進行單次目標函數(shù)優(yōu)化,并使用自適應(yīng)碼本的方案進行編碼。
本發(fā)明所涉及的編碼轉(zhuǎn)換將(n-1)×n的編碼矩陣轉(zhuǎn)換為一個n×n的方陣,并對其進行對稱化處理,以表出圖像區(qū)域的聚類結(jié)果。
本發(fā)明所涉及的構(gòu)建相似性結(jié)構(gòu)圖為高效的顯著性檢測方法——流形排序提供了改進的圖鄰接結(jié)構(gòu),促使生成的顯著圖在鄰域顯著性光滑的基礎(chǔ)上能保證更為清晰的前景邊界并減少噪聲影響。
為說明本發(fā)明涉及的通過基于自適應(yīng)碼本的llc聚類圖像區(qū)域的方法,結(jié)合實施例及附圖闡述如下:
圖1為本發(fā)明通過基于自適應(yīng)碼本的llc聚類圖像區(qū)域的方法的總流程圖。本方法通過6個基本步驟實現(xiàn)區(qū)域特征的提取、基于自適應(yīng)碼本的llc、編碼轉(zhuǎn)換與聚類表示、相似性結(jié)構(gòu)圖的構(gòu)建等,包括:
(一)使用slic算法將原圖像分割成n個(n的值為200個左右)超像素;
(二)提取各個超像素區(qū)域的lab顏色、rgb顏色、lbp紋理和gabor小波等特征,用公式(1)表示并存放;
(三)對每一個超像素spi,創(chuàng)建其自適應(yīng)碼本
(四)按照公式(3)-(6)進行擴展的llc編碼,用公式(7)定義、表示;
(五)所有超像素的基于自適應(yīng)碼本的llc編碼完成后,將編碼矩陣按照公式(8)和公式(9)轉(zhuǎn)換為對稱方陣a表示聚類結(jié)果;
(六)按照公式(10)計算有聚類關(guān)系的超像素間的相似性度量值,創(chuàng)建以該度量值為權(quán)值的仿射矩陣;使用公式(11)通過整合四個仿射矩陣來融合四類特征,進而創(chuàng)建相似性結(jié)構(gòu)圖。
由于基于圖的流形排序結(jié)果對鄰接圖的鄰接結(jié)構(gòu)非常敏感,通過基于自適應(yīng)碼本的llc聚類圖像區(qū)域所創(chuàng)建的圖結(jié)構(gòu),可作為流形排序的輸入生成前景邊界較為精準的灰度顯著圖。
超像素區(qū)域特征向量:
超像素spi的自適應(yīng)碼本:
基于自適應(yīng)碼本的llc規(guī)則:
其中,
表示spi與碼本中各元素的距離向量,
記錄llc編碼的指示向量:
其中
擴展編碼指示向量:
對稱化處理:
其中
超像素i和j的相似性測度值:
其中,