一種基于二維核熵成分分析的圖像數(shù)據(jù)降維方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種二維核賭成分分析(KECA)的圖像數(shù)據(jù)降維方法,屬于高維圖像數(shù) 據(jù)處理方法與應(yīng)用技術(shù)領(lǐng)域,適用于高維圖像數(shù)據(jù)的降維理論和應(yīng)用技術(shù)的研究。
【背景技術(shù)】
[0002] 在人臉識別、數(shù)字識別、醫(yī)學(xué)圖像識別等應(yīng)用中,由于圖像數(shù)據(jù)的高維性,常常需 要先進(jìn)行降維處理。圖像數(shù)據(jù)是用數(shù)值表示的各像素灰度值,其可有效的表示圖像的信息, 且可保留圖像數(shù)據(jù)的空間結(jié)構(gòu)信息,但是圖像數(shù)據(jù)的維數(shù)比較高且數(shù)據(jù)量大,因此如何有 效的獲取重要的信息,對圖像數(shù)據(jù)進(jìn)行降維,并降低計(jì)算的復(fù)雜度,成為圖像數(shù)據(jù)處理的關(guān) 鍵環(huán)節(jié)。
[0003] 目前針對圖像數(shù)據(jù)的降維已經(jīng)提出很多方法,圖像數(shù)據(jù)的降維方法主要有主成分 分析方法、核主成分分析方法、核賭成分分析方法,隨后,有二維主成分分析方法。主成分分 析方法是一種經(jīng)典的圖像數(shù)據(jù)變換方法,它是一種線性變換方法,而核主成分分析則是主 成分分析的非線性擴(kuò)展。W主成分分析為代表的圖像數(shù)據(jù)變換方法,首先求得圖像數(shù)據(jù)的 協(xié)方差矩陣,并求出此協(xié)方差矩陣的特征值和特征向量,然后用最大的幾個(gè)特征值所對應(yīng) 的特征向量構(gòu)建坐標(biāo)系,最后將樣本圖像數(shù)據(jù)在此坐標(biāo)系上投影,得到降維后的圖像數(shù)據(jù)。 核賭成分分析(Kernel Elntropy Component Analysis, KECA)方法是一種基于信息論的 新的圖像數(shù)據(jù)變換方法。該方法,將原始空間圖像數(shù)據(jù)二次Renyi賭值的坐標(biāo)軸作為投影 方向,該與傳統(tǒng)的數(shù)據(jù)變換譜變換方法不同,核賭成分分析(KECA)方法選擇降維的特征空 間,變換后的圖像數(shù)據(jù)具有明顯的角度結(jié)構(gòu)屬性,從而利于進(jìn)一步的處理。然而還存在如下 不足;上述主成分分析方法、核主成分分析方法、核賭成分分析方法變換降維時(shí),均先將二 維像素矩陣轉(zhuǎn)換成一維特征向量,該種數(shù)據(jù)轉(zhuǎn)換方法不僅沒有有效的利用圖像數(shù)據(jù)的空間 結(jié)構(gòu)信息,而且在后續(xù)計(jì)算協(xié)方差或計(jì)算圖像數(shù)據(jù)的核矩陣時(shí),增加了計(jì)算的復(fù)雜度;其次 是上述基于二維主成分分析的降維方法雖然利用了圖像數(shù)據(jù)的空間結(jié)構(gòu)空間信息,但是, 該種線性處理方法在應(yīng)用中仍具有局限性。
[0004] 綜上所述,目前圖像數(shù)據(jù)的降維方法主要存在的問題是;不能有效利用圖像數(shù)據(jù) 的空間結(jié)構(gòu)信息,且計(jì)算復(fù)雜度高。
【發(fā)明內(nèi)容】
[0005] 本發(fā)明的目的是針對現(xiàn)有圖像數(shù)據(jù)的降維方法不能有效利用圖像數(shù)據(jù)的空間結(jié) 構(gòu)信息、計(jì)算復(fù)雜度高等不足提出一種基于二維核賭成分分析的圖像數(shù)據(jù)降維方法。
[0006] 本發(fā)明的技術(shù)解決方案是;本發(fā)明一種基于二維核賭成分分析的圖像數(shù)據(jù)降維方 法,具體是指一種直接對二維圖像數(shù)據(jù)進(jìn)行數(shù)據(jù)變換,能夠保留了圖像數(shù)據(jù)的空間結(jié)構(gòu)信 息,提高了二維圖像數(shù)據(jù)的降維性能。該方法主要是直接按圖像的行或者列進(jìn)行核變換,而 無需將圖像轉(zhuǎn)換成向量的形式,將求得圖像數(shù)據(jù)的核矩陣的特征值和特征向量帶入到賭估 計(jì)中,選擇賭成分進(jìn)行映射,實(shí)現(xiàn)圖像數(shù)據(jù)的降維,從而提高降低數(shù)據(jù)變換的計(jì)算復(fù)雜度。 本發(fā)明一種基于二維核賭成分分析的圖像數(shù)據(jù)降維方法,其步驟如下: (1) .讀入圖像數(shù)據(jù); (2) .采用Parzen窗估計(jì)核函數(shù); (3) .設(shè)立按列計(jì)算所有圖像數(shù)據(jù)的核矩陣; (4) .計(jì)算圖像數(shù)據(jù)的相關(guān)矩陣的特征值和特征向量; 巧).計(jì)算圖像數(shù)據(jù)的Ren^賭; 化).采用二維核賭成分分析方法對圖像數(shù)據(jù)的相關(guān)矩陣的特征向量進(jìn)行映射,實(shí)現(xiàn) 圖像數(shù)據(jù)的降維; 其中,步驟(2)中所述的采用Parzen窗估計(jì)核函數(shù),記為巧虹),其中,二次Renyi賭表 達(dá)式:
【主權(quán)項(xiàng)】
1. 一種基于二維核熵成分分析的圖像數(shù)據(jù)降維方法,其特征在于,其步驟如下: (1) .讀入圖像數(shù)據(jù); (2) .采用Parzen窗估計(jì)核函數(shù); (3) .設(shè)立按列計(jì)算所有圖像數(shù)據(jù)的核矩陣; (4) .計(jì)算圖像數(shù)據(jù)的相關(guān)矩陣的特征值和特征向量; (5) .計(jì)算圖像數(shù)據(jù)的Renyi熵; (6) .采用二維核熵成分分析方法對圖像數(shù)據(jù)的相關(guān)矩陣的特征向量進(jìn)行映射,實(shí)現(xiàn)圖 像數(shù)據(jù)的降維。
2. 根據(jù)權(quán)利要求1所述的一種基于二維核熵成分分析的圖像數(shù)據(jù)降維方法,其特征 在于:上述步驟⑵所述的采用Parzen窗估計(jì)核函數(shù),記為f (p),其中,二次Renyi熵表達(dá) 式: (1) 式中,Am是皿個(gè)mx η的圖像數(shù)據(jù)矩陣;P(A)是圖像數(shù)據(jù)矩陣A= [A1Am]的 概率密度函數(shù);Η(ρ)是單調(diào)函數(shù),需分析去掉負(fù)號的二次Renyi熵,其可表示為 V(P) =/ P2⑷,為估計(jì)V〔p),引入Parzen窗密度估計(jì)器,其估計(jì)表達(dá)式:
(2) 式中,MA)是Parzen窗對p(A)進(jìn)行估計(jì)得到的估計(jì)值;M是所有的圖像數(shù)據(jù)矩陣的 個(gè)數(shù);i是M個(gè)的序號,取值范圍為1到M ;Κσ(Α,AJ是Parzen窗估計(jì)的核函數(shù),σ是窗 函數(shù)的寬度。
3. 根據(jù)權(quán)利要求1所述的一種基于二維核熵成分分析的圖像數(shù)據(jù)降維方法,其特征 在于:上述步驟(3)所述的設(shè)立按列計(jì)算所有圖像數(shù)據(jù)的核矩陣,其計(jì)算方法如下: 首先,對所有圖像數(shù)據(jù)按列向量進(jìn)行核變換,得到核矩陣,記為Φ ,其矩陣為:
(3) 式中,1"是1個(gè)mX η的圖像數(shù)據(jù)的矩陣,上標(biāo)η是圖像數(shù)據(jù)矩陣的總列數(shù);下標(biāo)M是 圖像數(shù)據(jù)矩陣的總個(gè)數(shù);是第M副圖像的數(shù)據(jù)的第η個(gè)列向量,是第M副圖像數(shù) 據(jù)按第η列進(jìn)行核變換所得到的第M副圖像數(shù)據(jù)第η列的核矩陣; 然后,圖像數(shù)據(jù)的核矩陣Φ與其轉(zhuǎn)置所得到的圖像數(shù)據(jù)的核矩陣中7相乘,所得的乘積 為核矩陣為相關(guān)矩陣,記為S :
(4) 式中,Φτ是核矩陣Φ的轉(zhuǎn)置所得的圖像數(shù)據(jù)的核矩陣;上標(biāo)T表示轉(zhuǎn)置。
4.根據(jù)權(quán)利要求1所述的一種基于二維核熵成分分析的圖像數(shù)據(jù)降維方法,其特征 在于:上述步驟(4)所述的計(jì)算圖像數(shù)據(jù)的相關(guān)矩陣的特征值和特征向量,其計(jì)算方法如 下:
首先,設(shè)圖像數(shù)據(jù)的相關(guān)矩陣的特征值λ和圖像數(shù)據(jù)的相關(guān)矩陣的投影向量V,滿足如 下關(guān)系式: (5) 然后,假定M個(gè)圖像數(shù)據(jù)的相關(guān)核矩陣,記為Φ ,其表達(dá)式為:
(6) 式中,φ〔4,〕是Im圖像數(shù)據(jù)對應(yīng)的核矩陣,是圖像數(shù)據(jù)矩陣農(nóng)兄中的m個(gè)圖像數(shù)據(jù) 的行向量的平均特征值; 如果V = ,則將上述式子(5)轉(zhuǎn)換成為下列關(guān)系式:
(7) 由上述關(guān)系式(9)求解,得到圖像數(shù)據(jù)的相關(guān)核矩陣的特征值λ和與其對應(yīng)的圖像數(shù) 據(jù)的相關(guān)核矩陣的特征向量q,其表達(dá)式分別為:
(8) (9) 式中,人5^是圖像數(shù)據(jù)的相關(guān)核矩陣的第M個(gè)特征值;qM是式子(7)的第M個(gè)圖像數(shù)據(jù) 的相關(guān)核矩陣的特征向量; 如果V= $q,則求出圖像數(shù)據(jù)的相關(guān)核矩陣的特征向量,其表達(dá)式為:
(10) 式中,%,是圖像數(shù)據(jù)的相關(guān)核矩陣的第M個(gè)特征向量。
5. 根據(jù)權(quán)利要求1所述的一種基于二維核熵成分分析的圖像數(shù)據(jù)降維方法,其特征 在于:上述步驟(5)所述的計(jì)算圖像數(shù)據(jù)的Renyi熵,記為f(p),其計(jì)算方法如下:
(11) 式中,f(.p)是Parzen窗對V(P)的估計(jì)值,即,用Parzen窗對原始空間圖像數(shù)據(jù)二次 Renyi熵的坐標(biāo)軸的方向的估計(jì)值, 將公式(2)代入到公式(11)中得到二次Renyi熵的Parzen窗估計(jì)值f (p),其估計(jì)表 達(dá)式:
(12) 式中,a和頭表示A的第i個(gè)圖像數(shù)據(jù)矩陣和第j個(gè)圖像數(shù)據(jù)矩陣,將步驟(4)中相 關(guān)核矩陣的特征值和特征向量帶入到公式(12)中即可得到fb)的等價(jià)公式:
(13) 式中,1是圖像數(shù)據(jù)的相關(guān)核矩陣mXl的單位向量;+It是圖像數(shù)據(jù)的相關(guān)核矩陣 mX 1的單位向量的轉(zhuǎn)置;M是圖像數(shù)據(jù)矩陣的個(gè)數(shù);Et是E轉(zhuǎn)置得到的圖像數(shù)據(jù)的相關(guān)核 矩陣的特征向量;ef是圖像數(shù)據(jù)的相關(guān)核矩陣第i個(gè)特征向量的轉(zhuǎn)置。
6. 根據(jù)權(quán)利要求1所述的一種基于二維核熵成分分析的圖像數(shù)據(jù)降維方法,其特征 在于:上述步驟¢)所述的采用二維核熵成分分析方法對圖像數(shù)據(jù)的相關(guān)矩陣的特征向 量進(jìn)行映射,實(shí)現(xiàn)圖像數(shù)據(jù)的降維,其具體如下:
(14) 首先,根據(jù)計(jì)算式(13)中計(jì)算得到的圖像數(shù)據(jù)的Renyi熵值,按其熵值大小進(jìn)行降序 排序,選擇前d個(gè)圖像數(shù)據(jù)的Renyi熵值向量,記為Z,其表達(dá)式為:
(15) 然后,對該熵值向量進(jìn)行映射,得到圖像數(shù)據(jù)的核矩陣的映射向量,記為 ,利用投影變換得到降維后的圖像數(shù)據(jù)的本征維數(shù),從而實(shí)現(xiàn)了圖像數(shù)據(jù)的降維。
【專利摘要】本發(fā)明公開了一種基于二維核熵成分分析的圖像數(shù)據(jù)降維方法,其步驟如下:(1)讀入圖像數(shù)據(jù);(2)采用Parzen窗估計(jì)核函數(shù);(3)設(shè)立按列計(jì)算所有圖像數(shù)據(jù)的核矩陣;(4)計(jì)算圖像數(shù)據(jù)的相關(guān)矩陣的特征值和特征向量;(5)計(jì)算圖像數(shù)據(jù)的Renyi熵;(6)采用二維核熵成分分析方法對圖像數(shù)據(jù)的相關(guān)矩陣的特征向量進(jìn)行映射,實(shí)現(xiàn)圖像數(shù)據(jù)的降維。該方法利用二維分析方法,直接對圖像的行或者列進(jìn)行核變換,對圖像數(shù)據(jù)的核矩陣估計(jì)的熵進(jìn)行排序,得到降維后的圖像數(shù)據(jù)的本征維數(shù),還能保持圖像數(shù)據(jù)的空間結(jié)構(gòu)信息;該方法由于直接按行或者按列計(jì)算圖像數(shù)據(jù)的核矩陣,無需將二維圖像數(shù)據(jù)轉(zhuǎn)換成一維矢量,進(jìn)行核變換求得相關(guān)矩陣時(shí),降低了計(jì)算的復(fù)雜度。
【IPC分類】G06K9-46, G06K9-62, G06T7-00
【公開號】CN104537377
【申請?zhí)枴緾N201410791475
【發(fā)明人】施俊, 趙攀博
【申請人】上海大學(xué)
【公開日】2015年4月22日
【申請日】2014年12月19日