欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于流形稀疏編碼的圖像聚類的方法

文檔序號:6334549閱讀:1352來源:國知局
專利名稱:基于流形稀疏編碼的圖像聚類的方法
技術領域
本發(fā)明涉及機器學習中的圖像稀疏編碼技術領域,特別是涉及一種基于流形稀疏 編碼的圖像聚類方法。
背景技術
圖像聚類一直是機器學習領域內(nèi)的經(jīng)典問題,所謂圖像聚類就是在給出的圖像集 合中,根據(jù)圖像的內(nèi)容,在無先驗知識的條件下,將圖像分成有意義的簇。對于圖像聚類,最 常用的特征屬性是顏色、紋理和形狀等,此外比較常用的特征是采用圖像的尺度不變特征 變換(SIFT )特征。然而很多時候這類特征都是維度較高同時又是比較稠密的表達,這往往 會影響圖像的聚類性能。

發(fā)明內(nèi)容
為克服現(xiàn)有技術的采用SIFT特征進行圖像聚類,由于特征的維度高且對圖像進 行稠密表達,造成聚在同一類的圖像之間的相似度低,聚類性能不理想的缺點,本發(fā)明提供 了一種能提高聚類性能的基于流形稀疏編碼的圖像聚類的方法?;诹餍蜗∈杈幋a的圖像聚類的方法,包括以下步驟
1)、獲取待聚類的所有圖像,將所有圖像組成數(shù)據(jù)矩陣 X , 1 = [ +、__^^、],其中,巧是第i張圖像的原始特征;獲取每張圖像中的SIFT特 征,〒ism^mFiif, SIFTU ;其中忍為組成圖像I的第η個SIFT特征;
2)、構造一個數(shù)據(jù)字典B,5= [、A,…A],其中敘為向量維度與原始數(shù)據(jù)維度相同的 基向量,利用數(shù)據(jù)矩陣X,學習數(shù)據(jù)字典B和圖像的流形稀疏編碼S,Si = [S1Jf1SfA]
;其中,巧為采用流形稀疏編碼表示的第i張圖像特征;
3)、使用K-means聚類方法,采用歐式距離計算各個圖像之間的距離,預設圖像之間的 距離閾值,將圖像之間距離小于預設的距離閾值的圖像聚為一類,使得圖像最終按類別進 行顯不。進一步,步驟1)中,提取圖像的SIFT特征的方法包括以下步驟
(1.1)獲取一張目標圖像,進行尺度空間極值檢測,即利用不同尺度的高斯差分方程同 目標圖像進行卷積,求取尺度空間極值;
(1. 2)精確定位特征點的位置,即通過擬合三維二次函數(shù)以精確確定各特征點的位置 和尺度(達到亞像素精度),同時去除低對比度的關鍵點和不穩(wěn)定的邊緣相應點、以增強匹 配穩(wěn)定性、提高抗噪聲能力;
(1. 3)確定特征點的主方向,即利用關鍵點領域像素的梯度方向分布特征為每個關鍵 點指定方向參數(shù),使算子具備旋轉不變性; (1. 4)生成特征描述符,包括以下步驟
4(1. 4. 1)將坐標軸旋轉為特征點的方向,以保證旋轉不變性;
(1. 4. 2)以特征點為中心取16X 16像素大小的窗口,但是特征點所在的行和列不??; (1.4.3)在每個4X4的圖像小塊上計算8個方向的梯度方向直方圖,繪制每個梯度方 向的累加值,形成一個種子點,每個特征點由4X4共16個種子點組成,每個種子點有8個 方向向量信息,可產(chǎn)生4X4X8共128個數(shù)據(jù),形成128維的SIFT特征向量,該SIFT特征 向量為特征描述符。進一步,步驟2)中,利用數(shù)據(jù)矩陣X,通過求解目標函數(shù) mm +OfTr(SLSr) +Si I1 ,來學習數(shù)據(jù)字典B和圖像的流形稀疏編碼S,其方法 包括以下步驟
(2. 1)初始化數(shù)據(jù)字典B,對數(shù)據(jù)字典B隨機賦值,算法將從i=l開始通過步驟(2. 2)及 (2. 3)逐個求解圖像的流形稀疏編碼A以及更新后的數(shù)據(jù)字典B,直到i=m,迭代終止;
(2. 2)將數(shù)據(jù)字典B作為已知信息,基于猜測圖像的流形稀疏編碼的符號,將原始目
標函數(shù)中的項hi中的絕對值運算去除,從而使得原始含有絕對值的不可導的問題轉換為
一個簡單的二次規(guī)劃問題進行解決;
(2. 3)將步驟(2. 2)得出的圖像的流形稀疏編碼S作為已知信息,通過使用拉格朗日對 偶法求解數(shù)據(jù)字典B,然后再次執(zhí)行步驟(2. 2)來求解下一個流形稀疏編碼。稀疏編碼是一種獲取圖像稀疏表達的方法,最早應用于模擬哺乳動物視覺系統(tǒng)主 視皮層Vl區(qū)簡單細胞感受的人工神經(jīng)網(wǎng)絡的編碼方式,后來被廣泛應用圖像處理領域,例 如圖像去噪,圖像分類等問題。稀疏編碼所獲得的稀疏表達會使得圖像特征簡單化,更有利 用圖像聚類。流形學習是機器學習近些年的一個熱門研究課題。假設數(shù)據(jù)是均勻采樣于一個高 維歐氏空間中的低維流形,流形學習就是從高維采樣數(shù)據(jù)中恢復低維流形結構,即找到高 維空間中的低維流形,并求出相應的嵌入映射,以實現(xiàn)數(shù)據(jù)的降維。它是從觀測到的現(xiàn)象中 去尋找事物的本質,找到產(chǎn)生數(shù)據(jù)的內(nèi)在規(guī)律。本發(fā)明將稀疏編碼技術應用于圖像聚類領域,同時在傳統(tǒng)的稀疏編碼方法上綜合 考慮了數(shù)據(jù)的流形結構特征,使得學習出來的稀疏編碼符合數(shù)據(jù)內(nèi)在的結構特征,利用這 種既稀疏又體現(xiàn)數(shù)據(jù)內(nèi)在結構的數(shù)據(jù)表達會使得圖像聚類效果更好。本發(fā)明具有能提高圖像聚類性能的優(yōu)點。


圖1是本發(fā)明的流程圖。圖2是步驟1的流程圖。
具體實施例方式參照附圖,進一步說明本發(fā)明
基于流形稀疏編碼的圖像聚類的方法,包括以下步驟
51)、獲取待聚類的所有圖像,將所有圖像組成數(shù)據(jù)矩陣Jf,Z= Ui,巧J ,其中,A是第i張圖像的原始特征;獲取每張圖像中的SIFT特征, a = [SWTii,SiFTi2,…,Smin];其中SIFTin為組成圖像A的第η個SIFT特征;
2)、構造一個數(shù)據(jù)字典Bj=隊知…為],其中為向量維度與原始數(shù)據(jù)維度相同的 基向量,利用數(shù)據(jù)矩陣X,學習數(shù)據(jù)字典B和圖像的流形稀疏編碼S,S = [sw",Si,···,、]
;其中 力采用流形稀疏編碼表示的第i張圖像特征;
3)、使叫K-means聚類方法,采用歐式距離計算各個圖像之間的距離,預設圖像之間的 距離閾值,將圖像之間距離小于預設的距離閾值的圖像聚為一類,使得圖像最終按類別進 行顯不。進一步,步驟1)中,提取圖像的SIFT特征的方法包括以下步驟
(1.1)獲取一張目標圖像,進行尺度空間極值檢測,即利用不同尺度的高斯差分方程同 目標圖像進行卷積,求取尺度空間極值;
(1. 2)精確定位特征點的位置,即通過擬合三維二次函數(shù)以精確確定各特征點的位置 和尺度(達到亞像素精度),同時去除低對比度的關鍵點和不穩(wěn)定的邊緣相應點、以增強匹 配穩(wěn)定性、提高抗噪聲能力;
(1. 3)確定特征點的主方向,即利用關鍵點領域像素的梯度方向分布特征為每個關鍵 點指定方向參數(shù),使算子具備旋轉不變性; (1. 4)生成特征描述符,包括以下步驟 (1. 4. 1)將坐標軸旋轉為特征點的方向,以保證旋轉不變性;
(1. 4. 2)以特征點為中心取16X 16像素大小的窗口,但是特征點所在的行和列不??; (1.4.3)在每個4X4的圖像小塊上計算8個方向的梯度方向直方圖,繪制每個梯度方 向的累加值,形成一個種子點,每個特征點由4X4共16個種子點組成,每個種子點有8個 方向向量信息,可產(chǎn)生4X4X8共128個數(shù)據(jù),形成128維的SIFT特征向量,該SIFT特征 向量為特征描述符。進一步,步驟2)中,利用數(shù)據(jù)矩陣X,通過求解目標函數(shù)
M
mm+miSL^) +P^si I1 ,來學習數(shù)據(jù)字典B和圖像的流形稀疏編碼S,其方法
包括以下步驟
(2. 1)初始化數(shù)據(jù)字典B,對數(shù)據(jù)字典B隨機賦值,算法將從i=l開始通過步驟(2. 2)及 (2. 3)逐個求解圖像的流形稀疏編碼巧以及更新后的數(shù)據(jù)字典B,直到i=m,迭代終止;
(2. 2)將數(shù)據(jù)字典B作為已知信息,基于猜測圖像的流形稀疏編碼的符號,將原始目
標函數(shù)中的項hi中的絕對值運算去除,從而使得原始含有絕對值的不可導的問題轉換為
一個簡單的二次規(guī)劃問題進行解決;
(2. 3)將步驟(2. 2)得出的圖像的流形稀疏編碼S作為已知信息,通過使用拉格朗日對 偶法求解數(shù)據(jù)字典B,然后再次執(zhí)行步驟(2. 2)來求解下一個流形稀疏編碼。
稀疏編碼是一種獲取圖像稀疏表達的方法,最早應用于模擬哺乳動物視覺系統(tǒng)主 視皮層Vl區(qū)簡單細胞感受的人工神經(jīng)網(wǎng)絡的編碼方式,后來被廣泛應用圖像處理領域,例 如圖像去噪,圖像分類等問題。稀疏編碼所獲得的稀疏表達會使得圖像特征簡單化,更有利 用圖像聚類。流形學習是機器學習近些年的一個熱門研究課題。假設數(shù)據(jù)是均勻采樣于一個高 維歐氏空間中的低維流形,流形學習就是從高維采樣數(shù)據(jù)中恢復低維流形結構,即找到高 維空間中的低維流形,并求出相應的嵌入映射,以實現(xiàn)數(shù)據(jù)的降維。它是從觀測到的現(xiàn)象中 去尋找事物的本質,找到產(chǎn)生數(shù)據(jù)的內(nèi)在規(guī)律。獲取圖像的流形稀疏編碼S時,利用數(shù)據(jù)矩陣X,通過求解目標函數(shù)(1 ),學習數(shù)據(jù) 字典B= [b1;. . . , bk]以及新的圖像數(shù)據(jù)表達S=[Sl,...,sm],其中S是圖像的稀疏表達。其 中學習數(shù)據(jù)字典B和學習稀疏圖像數(shù)據(jù)表達S是一個迭代學習的過程,每次迭代過程包括 固定B,學習S;然后固定S,更新B。在學習稀疏圖像表達的過程中考慮了數(shù)據(jù)本身的流形 結構,即在原始數(shù)據(jù)空間相似的兩張圖像Xi和\,學習出來的稀疏表達Si和~也相似,通 過目標函數(shù)(1)中的THSLSt)來保證數(shù)據(jù)本身流形結構得以保持。固定B學習S,我們采 用的方法是基于猜測圖像新的表達S的符號,來使得將原來含有絕對值的不可導的問題轉 換為一個簡單的二次規(guī)劃問題進行解決。而固定S學習B,則是一個最小二乘問題,通過使 用拉格朗日對偶法進行求解即可。本發(fā)明將稀疏編碼技術應用于圖像聚類領域,同時在傳統(tǒng)的稀疏編碼方法上綜合 考慮了數(shù)據(jù)的流形結構特征,使得學習出來的稀疏編碼符合數(shù)據(jù)內(nèi)在的結構特征,利用這 種既稀疏又體現(xiàn)數(shù)據(jù)內(nèi)在結構的數(shù)據(jù)表達會使得圖像聚類效果更好。本說明書實施例所述的內(nèi)容僅僅是對發(fā)明構思的實現(xiàn)形式的列舉,本發(fā)明的保護 范圍不應當被視為僅限于實施例所陳述的具體形式,本發(fā)明的保護范圍也及于本領域技術 人員根據(jù)本發(fā)明構思所能夠想到的等同技術手段。
權利要求
基于流形稀疏編碼的圖像聚類的方法,包括以下步驟1)、獲取待聚類的所有圖像,將所有圖像組成數(shù)據(jù)矩陣,,其中,是第i張圖像的原始特征;獲取每張圖像中的SIFT特征,;其中為組成圖像的第n個SIFT特征;2)、構造一個數(shù)據(jù)字典B,,其中為向量維度與原始數(shù)據(jù)維度相同的基向量,利用數(shù)據(jù)矩陣X,學習數(shù)據(jù)字典B和圖像的流形稀疏編碼S,;其中,為采用流形稀疏編碼表示的第i張圖像特征;3)、使用K means聚類方法,采用歐式距離計算各個圖像之間的距離,預設圖像之間的距離閾值,將圖像之間距離小于預設的距離閾值的圖像聚為一類,使得圖像最終按類別進行顯示。2010105220372100001dest_path_image001.jpg,930538dest_path_image002.jpg,2010105220372100001dest_path_image003.jpg,723045dest_path_image004.jpg,2010105220372100001dest_path_image005.jpg,876684dest_path_image003.jpg,84942dest_path_image006.jpg,2010105220372100001dest_path_image007.jpg,273216dest_path_image008.jpg,2010105220372100001dest_path_image009.jpg
2.如權利要求1所述的基于流形稀疏編碼的圖像聚類的方法,其特征在于步驟1)中, 提取圖像的SIFT特征的方法包括以下步驟(1. 1)獲取一張目標圖像,進行尺度空間極值檢測,即利用不同尺度的高斯差分方程同 目標圖像進行卷積,求取尺度空間極值;(1. 2)精確定位特征點的位置,即通過擬合三維二次函數(shù)以精確確定各特征點的位置 和尺度(達到亞像素精度),同時去除低對比度的關鍵點和不穩(wěn)定的邊緣相應點、以增強匹 配穩(wěn)定性、提高抗噪聲能力;(1. 3)確定特征點的主方向,即利用關鍵點領域像素的梯度方向分布特征為每個關鍵 點指定方向參數(shù),使算子具備旋轉不變性; (1. 4)生成特征描述符,包括以下步驟 (1. 4. 1)將坐標軸旋轉為特征點的方向,以保證旋轉不變性;(1. 4. 2)以特征點為中心取16X 16像素大小的窗口,但是特征點所在的行和列不取; (1.4.3)在每個4X4的圖像小塊上計算8個方向的梯度方向直方圖,繪制每個梯度方 向的累加值,形成一個種子點,每個特征點由4X4共16個種子點組成,每個種子點有8個 方向向量信息,可產(chǎn)生4X4X8共128個數(shù)據(jù),形成128維的SIFT特征向量,該SIFT特征 向量為特征描述符。
3.如權利要求2所述的基于流形稀疏編碼的圖像聚類的方法,其特征在于步驟2)中,利用數(shù)據(jù)矩陣X,通過求解目標函數(shù)
全文摘要
基于流形稀疏編碼的圖像聚類的方法,包括獲取待聚類的所有圖像,將所有圖像組成數(shù)據(jù)矩陣,獲取每張圖像中的SIFT特征;構造一個數(shù)據(jù)字典B,利用數(shù)據(jù)矩陣X,學習數(shù)據(jù)字典B和圖像的流形稀疏編碼S;使用K-means聚類方法,采用歐式距離計算各個圖像之間的距離,預設圖像之間的距離閾值,將圖像之間距離小于預設的距離閾值的圖像聚為一類,使得圖像最終按類別進行顯示。本發(fā)明具有能提高圖像聚類性能的優(yōu)點。
文檔編號G06F17/30GK101986295SQ20101052203
公開日2011年3月16日 申請日期2010年10月28日 優(yōu)先權日2010年10月28日
發(fā)明者卜佳俊, 吳昊, 王燦, 鄭淼, 陳純 申請人:浙江大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
鹤峰县| 海伦市| 突泉县| 巴彦县| 曲阳县| 章丘市| 巩留县| 洞口县| 荔浦县| 左贡县| 西贡区| 永昌县| 工布江达县| 延川县| 万盛区| 钟祥市| 若羌县| 阳新县| 巴彦淖尔市| 绥化市| 白沙| 古丈县| 石泉县| 巴青县| 北川| 昆明市| 得荣县| 万宁市| 奇台县| 新化县| 洛扎县| 新密市| 霸州市| 龙里县| 铅山县| 大连市| 曲阳县| 清丰县| 浏阳市| 铁岭县| 小金县|