專利名稱:基于作者-流派主題模型的遙感圖像自動(dòng)類別標(biāo)注方法
技術(shù)領(lǐng)域:
本發(fā)明涉及數(shù)字圖像技術(shù),特別涉及遙感圖像智能處理技術(shù)。
背景技術(shù):
遙感圖像標(biāo)注是遙感圖像分析和理解的重要內(nèi)容之一。遙感圖像標(biāo)注指的是以注釋的形式給遙感圖像分配數(shù)據(jù),比如,自動(dòng)標(biāo)注出圖像中的商業(yè)區(qū)、居民區(qū)、農(nóng)田等類別區(qū)域。遙感圖像標(biāo)注在遙感圖像檢索系統(tǒng)中發(fā)揮著重要作用。對(duì)遙感圖像進(jìn)行自動(dòng)類別標(biāo)注的過(guò)程就是根據(jù)預(yù)先定義的遙感圖像目標(biāo)類對(duì)圖像中的多類目標(biāo)進(jìn)行分類的過(guò)程?,F(xiàn)有遙感圖像的類別標(biāo)注方法主要分為三類(I)基于機(jī)器學(xué)習(xí)的方法;(2)基于 系統(tǒng)的方法;(3)通過(guò)挖掘多種類型的數(shù)據(jù)信息或附加的數(shù)量和種類信息來(lái)進(jìn)行圖像標(biāo)注的方法。這些方法主要結(jié)合低級(jí)別(Low-level)特征來(lái)進(jìn)行遙感圖像標(biāo)注。但是由于語(yǔ)義鴻溝(Semantic Gap)的存在,低級(jí)別特征往往不能準(zhǔn)確描述圖像語(yǔ)義。因此,人們發(fā)展了一些可以將低級(jí)語(yǔ)義特征映射到高級(jí)語(yǔ)義特征的方法,從而填補(bǔ)了語(yǔ)義鴻溝,這些方法包括概率潛在語(yǔ)義分析(Probabilistic Latent Semantic Analysis, PLSA)模型、潛在狄利克雷分配(Latent Dirichlet Allocation, LDA)模型和作者主題模型(Author TopicModel, ATM)等方法。Lienou提出了一種基于LDA模型的遙感圖像類別標(biāo)注方法。其中,作者即為類別,LDA模型可以將每一類的集合看做是潛在主題的隨機(jī)混合,每一個(gè)主題可以用視覺(jué)單詞的分布來(lái)描述。該方法主要針對(duì)QuickBird衛(wèi)星的全色圖像,采用圖像的均值和方差作為特征。但是,不同傳感器獲取的遙感圖像,其特征也存在很大的不同,對(duì)于多光譜遙感圖像,采用均值和方差來(lái)描述圖像特征是不夠的。為了克服基于LDA模型的遙感圖像類別標(biāo)注方法不能對(duì)多光譜遙感圖像進(jìn)行類別標(biāo)注的缺陷,Luo等人提出了基于作者主題模型(Author-Topic Model, ATM)的遙感圖像類別標(biāo)注方法,該方法采用了一種新的基于顏色和形狀特征的描述符,并結(jié)合ATM對(duì)遙感圖像進(jìn)行類別標(biāo)注。通過(guò)對(duì)實(shí)際的遙感圖像進(jìn)行類別標(biāo)注實(shí)驗(yàn),可以得出,提出的基于ATM的遙感圖像標(biāo)注方法在區(qū)域類別較少的情況下具有較高的分類準(zhǔn)確率。但是,在區(qū)域類別較多的情況下,由于存在特征相似的不同類區(qū)域,使得基于ATM的遙感圖像類別標(biāo)注方法的分類準(zhǔn)確率嚴(yán)重下降。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問(wèn)題是,提供一種在區(qū)域類別較多,不同區(qū)域之間特征相似情況下提高類別標(biāo)注精度的遙感圖像自動(dòng)類別標(biāo)注方法。本發(fā)明為解決上述技術(shù)問(wèn)題所采用的技術(shù)方案是,基于作者-流派主題模型的遙感圖像自動(dòng)類別標(biāo)注方法,包括以下步驟一、訓(xùn)練與作者-流派主題模型生成步驟
I)對(duì)訓(xùn)練圖像設(shè)置每個(gè)視覺(jué)單詞Wi和作者Xa、主題Zt和流派Cg的總個(gè)數(shù)以及視覺(jué)單詞Wi分別與主題Zt、流派Cg之間匹配關(guān)系;作者Xa表示圖像塊的類別標(biāo)簽,流派Cg表示圖像塊的場(chǎng)景標(biāo)簽;其中,i e {1,一,1^},1^為不同視覺(jué)單詞的個(gè)數(shù);&£ {1,···,Α},Α為作者總數(shù);t e {1,…,Τ},T為主題總數(shù);g e {I,…,G},G為流派總數(shù);2)通過(guò)吉布斯采樣得到視覺(jué)單詞Wi在主題Zt中出現(xiàn)的概率、主題Zt下的視覺(jué)單詞在作者Xa中出現(xiàn)的概率 ta、流派Cg下的視覺(jué)單詞在作者Xa中出現(xiàn)的概率Vga ;二、遙感圖像的視覺(jué)單詞計(jì)算步驟將遙感圖像分割為互不重疊的,大小相同的圖像塊Id,計(jì)算各圖像塊Id包含的各視覺(jué)單詞Wi ;所述視覺(jué)單詞Wi由各圖像塊Id進(jìn)一步劃分為均勻采樣塊,并將均勻采樣塊表示為特征描述符,通過(guò)k均值聚類方法將特征描述符量化得到;每一個(gè)圖像塊Id均映射為一系列視覺(jué)單詞;三、遙感圖像的類別判定與標(biāo)注步驟I)利用各圖像塊Id對(duì)應(yīng)的視覺(jué)單詞Wi以及作者-流派主題模型的三種概率分布對(duì)各圖像塊Id對(duì)應(yīng)的場(chǎng)景、別進(jìn)行估計(jì)
權(quán)利要求
1.基于作者-流派主題模型的遙感圖像自動(dòng)類別標(biāo)注方法,其特征在于,包括以下步驟 一、訓(xùn)練與作者-流派主題模型生成步驟 1)對(duì)訓(xùn)練圖像設(shè)置每個(gè)視覺(jué)單詞Wi和作者Xa、主題Zt和流派Cg的總個(gè)數(shù)以及視覺(jué)單詞Wi分別與主題Zt、流派Cg之間匹配關(guān)系;作者Xa表示圖像塊的類別標(biāo)簽,流派Cg表示圖像塊的場(chǎng)景標(biāo)簽;其中,i e U,一,khk為不同視覺(jué)單詞的個(gè)數(shù);a e {1,…,A},A為作者總數(shù);t e {1,…,T},T為主題總數(shù);g e {I, ...,G},G為流派總數(shù); 2)通過(guò)吉布斯采樣得到視覺(jué)單詞Wi在主題Zt中出現(xiàn)的概率、主題Zt下的視覺(jué)單詞在作者Xa中出現(xiàn)的概率 ta、流派Cg下的視覺(jué)單詞在作者Xa中出現(xiàn)的概率Vga; 二、遙感圖像的視覺(jué)單詞計(jì)算步驟將遙感圖像分割為互不重疊的,大小相同的圖像塊Id,計(jì)算各圖像塊Id包含的各視覺(jué)單詞Wi ;所述視覺(jué)單詞Wi由各圖像塊Id進(jìn)一步劃分為均勻采樣塊,并將均勻采樣塊表示為特征描述符,通過(guò)k均值聚類方法將特征描述符量化得到;每一個(gè)圖像塊Id均映射為一系列視覺(jué)單詞; 三、遙感圖像的類別判定與標(biāo)注步驟 1)利用各圖像塊Id對(duì)應(yīng)的視覺(jué)單詞Wi以及作者-流派主題模型的三種概率分布對(duì)各圖像塊Id對(duì)應(yīng)的場(chǎng)景一分別進(jìn)行估計(jì)
2.如權(quán)利要求I所述基于作者-流派主題模型的遙感圖像自動(dòng)類別標(biāo)注方法,其特征在于,所述采樣塊的特征描述符為顏色和形狀特征描述符。
3.基于作者-流派主題模型的遙感圖像自動(dòng)類別標(biāo)注方法,其特征在于,描述符和形狀特征描述符;顏色描述符用來(lái)描述采樣塊的顏色特征,形狀描述符用來(lái)描述采樣塊的形狀特征; 采樣塊的顏色特征用顏色直方圖表示,分別將紅、綠、藍(lán)三個(gè)通道的直方圖歸一化到[O,I],再將三個(gè)通道的直方圖連接起來(lái)就構(gòu)成了一個(gè)高維的顏色通道直方圖,顏色特征描述符通過(guò)該高維顏色直方圖表示; 形狀特征描述符采用歸一化到[O,I]的金字塔方向梯度直方圖表示; 將顏色特征描述符和形狀特征描述符連接起來(lái)得到的高維特征描述符為顏色和形狀描述符。
4.如權(quán)利要求I所述基于作者-流派主題模型的遙感圖像自動(dòng)類別標(biāo)注方法,其特征在于,視覺(jué)單詞Wi在主題Zt中出現(xiàn)的概率Φη為··
全文摘要
本發(fā)明提供一種在區(qū)域類別較多,不同區(qū)域之間特征相似情況下提高類別標(biāo)注精度的遙感圖像自動(dòng)類別標(biāo)注方法。基于作者-流派主題模型的遙感圖像自動(dòng)類別標(biāo)注方法,包括步驟一、訓(xùn)練與作者-流派主題模型生成步驟;二、遙感圖像的視覺(jué)單詞計(jì)算步驟;三、遙感圖像的類別判定與標(biāo)注步驟,在步驟中增加了作者的流派這個(gè)信息,使得同一個(gè)圖像塊同時(shí)具有作者和流派兩個(gè)標(biāo)注信息,再估計(jì)得到圖像塊的流派信息之后,再對(duì)估計(jì)的作者信息進(jìn)行糾正,有效地提高了類別標(biāo)注的精度。
文檔編號(hào)G06K9/62GK102819746SQ20121023666
公開(kāi)日2012年12月12日 申請(qǐng)日期2012年7月10日 優(yōu)先權(quán)日2012年7月10日
發(fā)明者李宏亮, 羅旺 申請(qǐng)人:電子科技大學(xué)