一種基于多尺度全局特征和局部特征的圖像分類方法
【技術領域】
[0001] 本發(fā)明涉及計算機圖像分類方法,特別是一種基于多尺度全局特征和局部特征的 圖像分類方法。
【背景技術】
[0002] 圖像分類一直是計算機圖像領域的一個基本問題,特別是隨著互聯(lián)網的急速發(fā) 展,大量的無分類的圖像出現(xiàn)在網絡中,給圖像的快速檢索及建立在分類之上的應用帶來 了極大挑戰(zhàn)。
[0003] 目前為止,常見的圖像分類技術包括基于色彩特征的分類技術,基于紋理特征的 分類技術,基于形狀特征的分類技術和基于空間關系的分類技術。基于色彩特征的分類技 術假設每種物體都有其特有的色彩特征,由于顏色直方圖具有簡單且對旋轉和縮放不敏感 等特征,得到了廣泛的關注;基于紋理的圖像分類技術,經歷了從灰度共生矩陣到小波變換 的過程,達到了一定分類效果;基于形狀分析的圖像分類技術大多圍繞著形狀的輪廓特征 和形狀的區(qū)域特征,更常用的辦法是采用區(qū)域特征和邊界特征相結合的形式進行形狀相似 性分析;基于空間關系的圖像分類技術,由于利用圖像中對象間的位置空間關系區(qū)別圖像, 符合人們識別圖像的習慣,所以近些年許多研宄人員從圖像中對象空間位置關系出發(fā)著手 分析,雖然起到過一定作用,但由于它們都是采用對象的最小外接矩形來表示一個對象空 間位置,這對于矩形對象來說是比較合適的,但是當兩個對象是不規(guī)則形狀,且它們在空間 關系上是分離時,它們的外接矩形卻存在著某種包含和交疊,結果出現(xiàn)對這些對象空間關 系的錯誤表不。
[0004] 雖然目前圖像分類的方法很多,但大多沒有考慮圖像中的文本特征對分類起到的 作用。同時,對整個圖像提取特征不但不是必須的而且需要花費大量計算時間。
【發(fā)明內容】
[0005] 發(fā)明目的:本發(fā)明所要解決的問題是針對目前圖像分類技術的不足,提供一種基 于多尺度全局特征和局部特征的圖像分類方法,特別是利用圖像中的文本信息提取有效顯 著區(qū)域并計算顯著區(qū)域中的顏色特征和空間分布特征,利用小波圖像金字塔得到多尺度全 局特征,利用四分樹算法得到局部特征,最后結合多尺度全局特征和局部特征對圖像進行 分類。
[0006] 為了解決上述問題,本發(fā)明公開了一種基于多尺度全局特征和局部特征的圖像分 類方法,包括以下步驟:
[0007] 將待分類圖像數(shù)據庫中的每張原始圖像I作為輸入,執(zhí)行步驟1~步驟11 :
[0008] 步驟1 :利用MATLAB軟件提供的小波圖像金字塔算法輸入原始圖像I,輸出五種不 同尺度的圖像,每種尺度的圖像作為下一步的輸入圖像,執(zhí)行步驟2~步驟9 ;五種不同尺 度的圖像處理完畢后執(zhí)行步驟10 ;
[0009] 步驟2 :計算輸入圖像的灰度圖像。其中輸入圖像屬于RGB顏色空間,每個像素由 紅,綠,藍三個顏色值決定,每種顏色取值范圍O~255。計算后的灰度圖像每個像素由一個 灰度值決定,灰度值取值范圍〇~255 ;
[0010] 步驟3 :利用MATLAB軟件提供的Canny邊緣和Sobel邊緣計算方法,計算灰度圖 像的Canny邊緣圖像和Sobel邊緣圖像。其中,Canny邊緣圖像和Sobel邊緣圖像都屬于 二值圖像,每個像素取值〇或1 ;
[0011] 步驟4 :分別計算Canny邊緣圖像的特征向量場和Sobel邊緣圖像的特征向量 場。計算得到的特征向量場在每個像素處,其值為一個向量,表示該像素處場值的大小和方 向;
[0012] 步驟5 :分別計算Canny特征向量場的顯著區(qū)域和Sobel特征向量場的顯著區(qū)域。 其中,顯著區(qū)域表現(xiàn)為二值圖像,像素值為〇表示該像素不屬于顯著區(qū)域,像素值為1表示 該像素屬于顯著區(qū)域;
[0013] 步驟6 :計算Canny顯著區(qū)域和Sobel顯著區(qū)域的交集,得到這兩種顯著區(qū)域的重 合區(qū)域,過濾后作為最終顯著區(qū)域;
[0014] 步驟7 :提取最終顯著區(qū)域的空間分布特征;
[0015] 步驟8 :根據最終顯著區(qū)域,保留其對應位置處輸入圖像的像素值,提取這些像素 值的顏色特征。顏色特征包括RGB顏色特征,HSV顏色特征和灰度顏色特征;
[0016] 步驟9 :合并步驟7得到的空間分布特征和步驟8得到的顏色特征,得到原始圖像 的全局特征。
[0017] 步驟10 :將原始圖像I用四分樹算法四等分為四個區(qū)域,每一個區(qū)域作為輸入圖 像,執(zhí)行步驟2~步驟8,得到輸入圖像的空間分布特征和顏色特征,合并空間分布特征和 顏色特征,得到原始圖像的局部特征;
[0018] 步驟11 :整合步驟9和步驟10得到的原始圖像的全局特征和局部特征,作為圖像 的分類特征;
[0019] 步驟12 :選擇邏輯回歸分類器,對數(shù)據庫中的圖像進行分類。
[0020] 本發(fā)明步驟4中,計算Canny邊緣圖像的特征向量場和Sobel邊緣圖像的特征向 量場包括以下步驟,定義能量函數(shù)ε,通過最小化能量函數(shù) ε計算Canny邊緣圖像的特征 向量場gcanny:
【主權項】
1. 一種基于多尺度全局特征和局部特征的圖像分類方法,其特征在于,包括以下步 驟: 將待分類圖像數(shù)據庫中的每張原始圖像I作為輸入,執(zhí)行步驟1~步驟11 : 步驟1:利用小波圖像金字塔算法輸入原始圖像I,輸出五種不同尺度的圖像,每種尺 度的圖像作為下一步的輸入圖像,執(zhí)行步驟2~步驟9,五種不同尺度的圖像處理完畢后執(zhí) 行步驟10 ; 步驟2 :計算輸入圖像的灰度圖像,其中輸入圖像屬于RGB顏色空間,每個像素由紅, 綠,藍三個顏色值決定,每種顏色取值范圍0~255,計算后的灰度圖像每個像素由一個灰 度值決定,灰度值取值范圍〇~255 ; 步驟3 :計算灰度圖像的Canny邊緣圖像和Sobel邊緣圖像,其中,Canny邊緣圖像和 Sobel邊緣圖像都屬于二值圖像,每個像素取值0或1 ; 步驟4 :分別計算Canny邊緣圖像的特征向量場和Sobel邊緣圖像的特征向量場,計算 得到的特征向量場在每個像素處,其值為一個向量,表示該像素處場值的大小和方向; 步驟5 :分別計算Canny特征向量場的顯著區(qū)域和Sobel特征向量場的顯著區(qū)域,其 中,顯著區(qū)域表現(xiàn)為二值圖像,像素值為0表示該像素不屬于顯著區(qū)域,像素值為1表示該 像素屬于顯著區(qū)域; 步驟6 :計算Canny顯著區(qū)域和Sobel顯著區(qū)域的交集,得到這兩種顯著區(qū)域的重合區(qū) 域,過濾后作為最終顯著區(qū)域; 步驟7 :提取最終顯著區(qū)域的空間分布特征; 步驟8 :根據最終顯著區(qū)域,保留其對應位置處輸入圖像的像素值,提取這些像素值的 顏色特征,顏色特征包括RGB顏色特征,HSV顏色特征和灰度顏色特征,RGB顏色指紅色Red, 綠色Green和藍色Blue首字母縮寫,HSV顏色指色調Hue,飽和度Saturation和亮度Value 首字母縮寫; 步驟9 :合并步驟7得到的空間分布特征和步驟8得到的顏色特征,得到原始圖像的全 局特征; 步驟10 :將原始圖像I用四分樹算法四等分為四個區(qū)域,每一個區(qū)域作為輸入圖像,執(zhí) 行步驟2~步驟8,得到輸入圖像的空間分布特征和顏色特征,合并空間分布特征和顏色特 征,得到原始圖像的局部特征; 步驟11 :整合步驟9和步驟10得到的原