本發(fā)明屬于模式識別,尤其涉及一種基于因果元解耦學習的高光譜圖像分類方法。
背景技術:
1、高光譜圖像分類是遙感領域中一項重要的技術,通過分析和處理高光譜圖像,可以從中提取出豐富的光譜信息,從而實現(xiàn)對地物的精確分類。與傳統(tǒng)的多光譜圖像相比,高光譜圖像在光譜維度上具有更高的分辨率,這使得其在農業(yè)、林業(yè)、環(huán)境監(jiān)測、城市規(guī)劃等領域具有廣泛的應用前景。然而,由于高光譜圖像數(shù)據(jù)量大、維度高、噪聲多等特點,其分類任務面臨著巨大的挑戰(zhàn)。針對這些問題,研究人員提出了多種高光譜圖像分類方法,主要包括基于光譜特征的分類方法、基于空間特征的分類方法以及結合光譜-空間特征的分類方法。
2、盡管現(xiàn)有的高光譜圖像分類方法在一定程度上提升了分類精度,但這些方法也存在著諸多不足。例如,基于光譜特征的方法容易受到噪聲干擾,難以有效利用空間信息;基于空間特征的方法則在光譜信息的利用上存在局限。此外,許多方法在跨域泛化能力上表現(xiàn)欠佳,即在訓練數(shù)據(jù)與測試數(shù)據(jù)分布不一致的情況下,分類性能會顯著下降。這些不足限制了高光譜圖像分類方法在實際應用中的效果和普適性。鑒于此,一種基于因果推理機制和知識歸納機制的新方法顯得尤為重要,該方法通過因果元解耦學習,能夠更好地利用數(shù)據(jù)間的本質聯(lián)系,提升模型的跨域泛化能力。因果推理機制能夠識別并利用數(shù)據(jù)中的因果關系,而知識歸納機制則有助于從已有數(shù)據(jù)中歸納出適用于不同域的數(shù)據(jù)特征,使得模型在不同領域間具有較好的適應性和泛化能力。
3、然而,在因果元解耦學習框架下,仍然存在一些需要解決的問題。首先,如何有效地解耦數(shù)據(jù)分布中的因果關系和非因果關系,以準確捕捉數(shù)據(jù)的本質聯(lián)系,仍是一個挑戰(zhàn)。其次,雖然因果元知識歸納框架可以通過分布解耦、虛擬域生成、不變-泛化風險最小化等步驟來提升泛化能力,但在實際應用中,這些步驟的實現(xiàn)效果可能會受到數(shù)據(jù)復雜性和域間差異性的影響。例如,分布解耦在復雜數(shù)據(jù)集上可能難以實現(xiàn)高效且準確的解耦過程,而虛擬域生成在高維數(shù)據(jù)中生成效果的真實性和有效性也需進一步驗證。此外,不變因果效應損失的應用雖然能夠約束相同類別的高光譜圖像在不同領域中具有不變的因果效應,但在多樣化的高光譜圖像數(shù)據(jù)中,實現(xiàn)這一點的有效性和穩(wěn)定性仍需進一步驗證和優(yōu)化。
技術實現(xiàn)思路
1、發(fā)明目的:針對上述背景技術中存在的問題,本發(fā)明提供了一種基于因果元解耦學習的高光譜圖像分類方法,將因果元解耦學習,建立了基于分布解耦、虛擬域生成、不變-泛化風險最小化的因果元知識歸納框架,約束相同類別的hsi在不同領域具有不變的因果效應,實現(xiàn)了數(shù)據(jù)和標簽之間真實因果關聯(lián)的準確捕獲。
2、
技術實現(xiàn)要素:
為實現(xiàn)上述目的,本發(fā)明采用的技術方案為:一種基于因果元解耦學習的高光譜圖像分類方法,包括如下步驟:
3、對高光譜圖像hsi進行分割,獲得his?patch樣本,將his?patch樣本輸入特征提取器,得到空-譜特征;
4、采用瓶頸vae對空-譜特征進行重建;在分布學習中,利用b-vae將空-譜特征解耦為類分布和域分布。通過正向信息瓶頸捕獲關鍵類信息,逆向信息瓶頸捕獲類無關的域信息,最后通過解碼器重建特征,確保分布建模能力;
5、對于目標域數(shù)據(jù),提取特征后,使用訓練好的b-vae中的類編碼器獲得類分布,然后從類分布中得到類特征,基于得到的類特征對目標域進行分類。進一步的,所述特征提取器包括串接的光譜編碼器和空間譜編碼器;
6、所述將his?patch樣本輸入特征提取器,得到空-譜特征;具體包括如下步驟:
7、步驟1.1,將his?patch在光譜維度進行分割,形成光譜序列;
8、步驟1.2,將光譜序列輸入到光譜嵌入模塊中,獲得光譜特征;
9、步驟1.3,對光譜特征進行空間維度分割,分成多個空間區(qū)域,在分成的每個空間區(qū)域中均添加可學習的類token,得到含類token的空間序列;
10、步驟1.4,將包含類token的空間序列輸入到空間嵌入模塊中,進行空間特征提取,類token作為空間嵌入模塊的輸出,類token中包含了空-譜特征。
11、進一步的,所述瓶頸vae包括類編碼器、域編碼器和解碼器;
12、將空-譜特征特征輸入到類編碼器,得到類分布,從類分布中采樣類隱變量zc;
13、將空-譜特征特征輸入到域編碼器,得到域分布,從域分布中采樣域隱變量zd;
14、將類隱變量zc和域隱變量zd拼接后輸入解碼器,對空-譜特征進行重建。
15、進一步的,接著,可以利用jensens不等式表示瓶頸vae的證據(jù)下界。
16、進一步的,考慮到類分布中應該包含盡可能少的域特定信息,同時包含盡可能多的類辨識信息。構建了如下的正向信息瓶頸:
17、
18、其中,i(zc,y)表示類隱變量和標簽之間的互信息,表示類隱變量和空-譜特征之間的互信息,β為權重因子。
19、根據(jù)互信息上界和互信息下界,可以得到正向信息瓶頸的下界。
20、此外,在本發(fā)明中,用類編碼器學習后驗分布進行近似,可以得到最終的正向信息瓶頸下界。
21、考慮到域分布中一方面應該包含盡可能少的類辨識信息,另一方面要確保其與輸入具有強相關性,以防止其學習到和輸入無關的平凡解。構建了如下的逆向信息瓶頸:
22、
23、其中,表示域隱變量和空-譜特征之間的互信息,i(zd,y)表示域隱變量和標簽之間的互信息,χ為權重因子。
24、根據(jù)互信息上界和互信息下界,可以得到逆向信息瓶頸的下界
25、此外,在本發(fā)明中,用域編碼器學習后驗分布進行近似,可以得到最終的逆向信息瓶頸下界。
26、進一步的,正-逆信息瓶頸的需要計算變量之間的互信息,然而,直接計算變量間的互信息是難以實現(xiàn)的。因此,給出的互信息的上界和下界,為正-逆信息瓶頸的優(yōu)化提供基礎。
27、進一步的,從類分布采樣類隱變量,擾動域分布生成虛擬域隱變量,然后通過b-vae解碼生成虛擬域特征。利用虛擬域特征構建領域泛化元任務,包括多個虛擬域的元訓練任務和單一虛擬域的元驗證任務,以學習域不變性和驗證泛化性能;具體為:
28、首先,從源域隨機采樣一批樣本,并利用特征提取器獲得對應的空-譜特征。然后,將空-譜特征輸入b-vae的類編碼器得到類分布并從類分布中采樣得到類隱變量其中,μc和分別為類分布的均值和方差。接著,將空-譜特征輸入b-vae的域編碼器得到域分布并對域分布進行擾動得到虛擬域分布其中,μv和分別為虛擬域分布的均值和方差。
29、接著,從虛擬域分布中采樣得到虛擬域隱變量之后,將類隱藏變量和虛擬域隱變量進行拼接,輸入b-vae的解碼器decoderθ(·),生成虛擬域特征
30、接著,重復上述過程,直到獲得k組虛擬域特征。
31、最后,隨機選擇k-1組虛擬域特征作為虛擬源域構建元訓練任務,以模擬現(xiàn)實世界中可能存在的域分布變化。選擇剩余的1組虛擬域特征作為虛擬目標域構建元驗證任務,以模擬現(xiàn)實世界中未見目標域。
32、進一步的,為領域泛化元任務定制了雙層優(yōu)化機制。在內層的不變風險最小化過程中,被引導學習域不變的因果元知識。在外層的泛化風險最小化過程中,需要強化因果元知識對未見目標域的泛化能力,以確保其在領域泛化任務中的適用性;具體為:
33、將元訓練任務中各虛擬域特征輸入類編碼器得到類隱變量zc,并通過將e的各維度隨機替換為從高斯分布中采樣的隨機向量,對zc進行干預;
34、然后,將對zc各維度進行干預后得到的類別預測進行整合,得到因果效應向量π;
35、接著,將元訓練任務中的同類虛擬源域特征對應的因果效應向量視作正樣本對,異類虛擬域特征對應的因果效應向量視作負樣本對,利用因果效應損失最小化正樣本對之間的差異,同時最大化正樣本和負樣本對之間的差異提升各虛擬域特征對應的類隱變量的類內一致性和類間差異性;
36、接著,將因果效應損失和不變風險最小化結合,設計了不變因果效應損失;
37、最后,基于不變因果效應損失對類編碼器進行偽更新。
38、進一步的,計算偽更新后的模型在元驗證任務中虛擬目標域的泛化風險損失lgr;
39、然后,基于不變風險損失和泛化風險損失計算元梯度gm;
40、最后,基于元梯度,對原始類編碼器參數(shù)進行元更新。
41、有益效果:首先,本發(fā)明將元訓練任務中各虛擬域特征輸入類編碼器得到類隱變量zc,并通過將zc的各維度隨機替換為從高斯分布中采樣的隨機向量,對zc進行干預。再將對zc各維度進行干預后得到的類別預測進行整合,得到因果效應向量。之后,可將元訓練任務中的同類虛擬源域特征對應的因果效應向量視作正樣本對,異類虛擬域特征對應的因果效應向量視作負樣本對,利用因果效應損失最小化正樣本對之間的差異,同時最大化正樣本和負樣本對之間的差異提升各虛擬域特征對應的類隱變量的類內一致性和類間差異性。
42、本發(fā)明基于結構因果模型建立了基于前門調整的因果干預機制,通過切斷非因果因素和標簽之間的虛假統(tǒng)計關聯(lián),實現(xiàn)了對數(shù)據(jù)和標簽之間真實因果效應的精準捕獲。
43、然后,解耦了hsi的域分布和類分布,并通過對域分布進行擾動生成虛擬域,以模擬現(xiàn)實世界潛在的復雜域分布變化,為領域泛化情景模擬提供數(shù)據(jù)基礎。
44、接著,為領域泛化任務定制了基于因果推理機制和知識歸納機制的因果元解耦學習框架。具體而言,提出了瓶頸vae,利用正-逆信息瓶頸將hsi中緊密耦合的域分布和類分布進行剝離,并通過對域分布進行擾動模擬現(xiàn)實世界中hsi潛在的域分布變化。
45、最后,基于vae強大的數(shù)據(jù)生成能力進行虛擬域生成,為因果元知識歸納提供數(shù)據(jù)基礎。