基于主成分和聚類分析的高光譜信息提取方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及光譜數(shù)據(jù)分析,特別涉及一種基于主成分和聚類分析的高光譜信息提 取方法。
【背景技術(shù)】
[0002] 高光譜圖像技術(shù)結(jié)合了目標(biāo)光譜信息與目標(biāo)空間特征,獲取到的圖像立方體包含 豐富的空間和光譜信息,從而使人類的觀測和信息獲取能力向前邁進(jìn)了一大步。但是,高光 譜圖像技術(shù)還存在很多問題亟需解決,例如消除類內(nèi)和類間差異變化的影響,實(shí)現(xiàn)實(shí)時(shí)的 海量信息處理等等。
[0003] 傳統(tǒng)的分析方法包括主成分分析法。主成分分析法是一種重要的統(tǒng)計(jì)方法,其目 的是把原始變量進(jìn)行線性變換,以選出幾個重要變量的一種多元統(tǒng)計(jì)分析方法。其主要的 目的在于不失去原始數(shù)據(jù)重要信息的前提下進(jìn)行數(shù)據(jù)的降維。
[0004] 聚類分析是將一組物理的或抽象的對象按照相似程度進(jìn)行分類。其中較相似的對 象構(gòu)成一組,差異較大的對象歸為不同的組。組與組之間的差異可以用相似距離來表示,相 似距離越短,說明兩組之間差異越小,相似距離越大,說明兩組之間差異越大。聚類分析最 后得到的結(jié)果可以用分類樹形圖表示。
[0005] 傳統(tǒng)的分析方法,都存在一些弊端,比如主成分分析,雖然在可以起到降維和在向 量空間中對不同的特征進(jìn)行大致區(qū)分的作用,但降維后的信息保有量往往不穩(wěn)定,不能對 不同特征的目標(biāo)進(jìn)行分類。傳統(tǒng)的單一統(tǒng)計(jì)方法已很難滿足目前高光譜圖像信息提取的要 求,因此需要集成多種統(tǒng)計(jì)方法。
【發(fā)明內(nèi)容】
[0006] 有鑒于此,本發(fā)明提供一種基于主成分和聚類分析的高光譜信息提取法方法,該 方法包括:確定η個樣品的數(shù)據(jù)的標(biāo)準(zhǔn)化矩陣Z,每一個樣品的數(shù)據(jù)為xi = (xil,xi2,..., xip)T,其中i = 1,2,. . .,n,p為小于η的整數(shù);確定標(biāo)準(zhǔn)化矩陣Z的相關(guān)系數(shù)矩陣R,計(jì)算 相關(guān)系數(shù)矩陣R的P個特征根和與每一個特征根對應(yīng)的特征向量^/,其中,j = 1,2,..., η ;基于I11 = z,; b;將標(biāo)準(zhǔn)化后的樣品數(shù)據(jù)變量轉(zhuǎn)換為主成分,其中,j = 1,2,3, ...,p,貢獻(xiàn) 率最高的變量Ul為第一主成分,貢獻(xiàn)率第二高的變量U2為第二主成分,...,貢獻(xiàn)率排名為 P的變量為第P主成分;將貢獻(xiàn)率從高到低的m個主成分加權(quán)求和以獲取累計(jì)貢獻(xiàn)率,并將 累計(jì)貢獻(xiàn)率超過預(yù)定閾值的m個主成分作為聚類分析主成分,其中,m小于p,并且 m個主成 分中的每一個主成分的權(quán)重為與該主成分對應(yīng)的特征根;對所述聚類分析主成分進(jìn)行分類 尺度計(jì)算以確定樣品的相似性,并根據(jù)確定的樣品相似性對樣品進(jìn)行分類。
[0007] 其中,確定η個樣品的數(shù)據(jù)的標(biāo)準(zhǔn)化矩陣Z由公式1和公式2確定:
【主權(quán)項(xiàng)】
1. 一種基于主成分和聚類分析的高光譜信息提取法方法,該方法包括: 確定η個樣品的數(shù)據(jù)的標(biāo)準(zhǔn)化矩陣Z,每一個樣品的數(shù)據(jù)為Xi = (xil,Xi2,. . .,Xip) τ,其中i = 1,2, . . .,n,p為小于η的整數(shù); 確定標(biāo)準(zhǔn)化矩陣Z的相關(guān)系數(shù)矩陣R,計(jì)算相關(guān)系數(shù)矩陣R的ρ個特征根和與每一個特 征根對應(yīng)的特征向量^,其中,j = 1,2, . . .,η ; 基于U|: = K將標(biāo)準(zhǔn)化后的樣品數(shù)據(jù)變量轉(zhuǎn)換為主成分,其中,j = 1,2, 3,. . .,ρ,貢 獻(xiàn)率最高的變量Ul為第一主成分,貢獻(xiàn)率第二高的變量U2為第二主成分,...,貢獻(xiàn)率排名 為P的變量為第P主成分; 將貢獻(xiàn)率從高到低的m個主成分加權(quán)求和以獲取累計(jì)貢獻(xiàn)率,并將累計(jì)貢獻(xiàn)率超過預(yù) 定閾值的m個主成分作為聚類分析主成分,其中,m小于p,并且m個主成分中的每一個主成 分的權(quán)重為與該主成分對應(yīng)的特征根; 對所述聚類分析主成分進(jìn)行分類尺度計(jì)算以確定樣品的相似性,并根據(jù)確定的樣品相 似性對樣品進(jìn)行分類。
2. 如權(quán)利要求1所述的方法,其中,確定η個樣品的數(shù)據(jù)的標(biāo)準(zhǔn)化矩陣Z由公式1和公 式2確定:
3. 如權(quán)利要求1所述的方法,其中,根據(jù)公式3確定標(biāo)準(zhǔn)化矩陣Z的相關(guān)系數(shù)矩陣:
計(jì)算相關(guān)系數(shù)矩陣R的P個特征根是通過對樣本的相關(guān)矩陣R的特征方程IR- λ Ip I = 〇進(jìn)行求解得到的。
4. 如權(quán)利要求1所述的方法,其中,對所述聚類分析主成分進(jìn)行分類尺度計(jì)算以確定 樣品的相似性包括通過根據(jù)下述公式確定不同樣品的的m個主成分的相關(guān)系數(shù)來確定:
其中,一 1彡Rij彡1且Rij越接近1時(shí),表示兩個樣品越接近,Rij越接近-1,則兩個樣 品之間的關(guān)系越疏遠(yuǎn)。
5. 如權(quán)利要求1所述的方法,其中,對所述聚類分析主成分進(jìn)行分類尺度計(jì)算以確定 樣品的相似性包括通過根據(jù)下述公式確定不同樣品的的m個主成分的相似系數(shù)來確定:
其中,一 1彡SiP 1,且Su的值越大,越接近1,表示兩個樣品關(guān)系越相似。
6. 如權(quán)利要求1所述的方法,其中,對所述聚類分析主成分進(jìn)行分類尺度計(jì)算以確定 樣品的相似性包括通過根據(jù)下述公式確定不同樣品的的m個主成分的歐氏距離來確定:
其中,O < DuS 1,距離D ^越小,表示兩個樣品越相似。
7. 如權(quán)利要求1所述的方法,其中,對所述聚類分析主成分進(jìn)行分類尺度計(jì)算以確定 樣品的相似性包括通過根據(jù)下述公式確定不同樣品的的m個主成分的斜交空間距離來確 定:
其中,O彡Dlij彡1,距離D nj越小表示兩個樣品越相似。
【專利摘要】本發(fā)明公開了一種基于主成分和聚類分析的高光譜信息提取法方法,包括:確定n個樣品的數(shù)據(jù)的標(biāo)準(zhǔn)化矩陣Z;確定標(biāo)準(zhǔn)化矩陣Z的相關(guān)系數(shù)矩陣R,計(jì)算相關(guān)系數(shù)矩陣R的特征根和與每一個特征根對應(yīng)的特征向量將標(biāo)準(zhǔn)化后的樣品數(shù)據(jù)變量轉(zhuǎn)換為主成分,貢獻(xiàn)率最高的變量U1為第一主成分,貢獻(xiàn)率第二高的變量U2為第二主成分,…,貢獻(xiàn)率排名為p的變量為第p主成分;將貢獻(xiàn)率最高的m個主成分加權(quán)求和以獲取累計(jì)貢獻(xiàn)率,并將累計(jì)貢獻(xiàn)率超過預(yù)定閾值的m個主成分作為聚類分析主成分;對聚類分析主成分進(jìn)行分類尺度計(jì)算以確定樣品的相似性,并根據(jù)確定的樣品相似性對樣品進(jìn)行分類。本發(fā)明結(jié)合主成分分析法和聚類分析法,實(shí)現(xiàn)對高光譜圖像信息的有效提取。
【IPC分類】G06K9-62
【公開號】CN104834938
【申請?zhí)枴緾N201510213540
【發(fā)明人】陶濤, 武敬力, 王廣平, 何茜
【申請人】北京環(huán)境特性研究所
【公開日】2015年8月12日
【申請日】2015年4月30日