欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于最大期望參數(shù)估計的多分類器集成方法

文檔序號:6337128閱讀:663來源:國知局
專利名稱:基于最大期望參數(shù)估計的多分類器集成方法
基于最大期望參數(shù)估計的多分類器集成方法技術(shù)領域
本發(fā)明所述的基于最大期望參數(shù)估計的多分類器集成方法,屬于多媒體信息中 基于相關反饋的圖像檢索領域,主要涉及到一種對多個單一分類器用最大期望參數(shù)估計 方法進行集成的基于相關反饋的圖像檢索方法。
背景技術(shù)
目前隨著多媒體技術(shù)的快速發(fā)展及Internet技術(shù)的日益普及,數(shù)字圖像的來源 越來越廣泛,每天各個領域都會產(chǎn)生數(shù)以千兆字節(jié)的圖像信息。如何從浩瀚的圖像信息 中快速準確的查找出用戶所需要的信息成為了迫切需要解決的問題,基于內(nèi)容的圖像檢 索技術(shù)應運而生,成為信息檢索領域的研究熱點,得到了國際學術(shù)界廣泛研究。所謂基 于內(nèi)容的圖像檢索,就是根據(jù)圖像的顏色、紋理、形狀等特征,按照某種相似度計算方 法,從圖像庫中找出與用戶事先想要查詢的圖像最相似的若干幅圖像。由于圖像底層視 覺特征與圖像高級語義之間存在代溝,因此人們提出了基于反饋的圖像檢索方法來解決 這一問題。早期的相關反饋技術(shù)主要采用啟發(fā)式方法,并可大致分為兩類查詢點移動 和權(quán)值調(diào)整。前者通過修改查詢向量的方式移動查詢點,使得移動后的查詢點靠近特征 空間中正樣本集中的區(qū)域;后者通過調(diào)整特征分量權(quán)重的方式修改距離度量公制,以加 強那些能使正樣本聚攏或能把正、負樣本的特征分量。啟發(fā)式方法基于這樣一種假設 所有正樣本大致被包含在特征空間中一個超橢球區(qū)域內(nèi),但是,該假設過于理想,實際 應用中很難滿足。目前,學者們更傾向于將相關反饋過程看作機器學習問題,即系統(tǒng)根 據(jù)用戶反饋信息訓練一個學習器,然后利用學習器來預測數(shù)據(jù)庫中圖像與查詢圖像之間 的相關程度。其中,基于支持向量機6乂^1)的相關反饋方法由于支持向量機具有很好的 模式分類性能而被廣泛應用。然而,相關反饋是一種典型的小樣本學習問題,即訓練樣 本數(shù)遠遠小于特征空間維數(shù),這種情況嚴重限制了 SVM的學習性能。因此本發(fā)明提出了 一種基于最大期望參數(shù)估計的集成方法將多個學習器組合起來,皆在創(chuàng)建一個改進的復 合學習模型。
所謂最大期望參數(shù)估計方法(EM),是一種在不完全數(shù)據(jù)情況下計算極大似然估 計或者后驗分布的迭代算法,是一種針對概率模型設計的迭代優(yōu)化技術(shù)。它分為計算期 望(E)和極大化(M)兩步,這種方法主要應用于圖像分割領域。由于在本發(fā)明中,我們 需要訓練若干個分類器,然而各個分類器的樣本的分類性能不同,因此我們將最大期望 參數(shù)估計方法引入到基于反饋的圖像檢索領域,在構(gòu)造分類器時,根據(jù)每個分類器性能 的不同,用改方法為其加一個權(quán)值,最后再將各個單一分類器集成。這樣能有效的克服 單個分類器穩(wěn)定性弱,分類誤差大等問題,針對上述現(xiàn)有技術(shù)中所存在的問題,研究設 計一種新型的基于最大期望參數(shù)估計的多分類器集成方法,從而克服現(xiàn)有技術(shù)中所存在 的問題是十分必要的。發(fā)明內(nèi)容
鑒于上述現(xiàn)有技術(shù)中所存在的問題,本發(fā)明的目的是研究設計一種新型的基于 最大期望參數(shù)估計的多分類器集成方法,從而解決單個分類器穩(wěn)定性弱,分類誤差大等 問題。本發(fā)明所述的基于最大期望參數(shù)估計的多分類器集成方法包括提取單元、檢索單 元、標記單元和學習單元;
步驟一提取單元
該單元是提取圖像庫中每幅圖像的底層視覺特征,然后將提取的特征放入特征 庫中,主要提取的底層視覺特征有顏色特征、紋理特征和形狀特征;
步驟二 檢索單元
該步驟屬于一個人機交互的過程,用戶隨機從圖像庫中選取一幅示例圖像,然 后系統(tǒng)將特征庫中每幅圖像特征與該圖像進行相似度比較,最后返回給用戶與該示例圖 像最相似的N幅圖像,其中N = 10 ;
步驟三標記單元
該步驟要對進行學習訓練的樣本圖像進行標記;
步驟四學習單元
該單元主要包括三個步驟,
一構(gòu)造分類器 asymmetric bagging SVM ;
二構(gòu)造分類器 random subspace SVM ;
三為兩類分類器加權(quán)來集成為一個分類器。
本發(fā)明所述的提取單元包括如下三個步驟
步驟一、顏色的提取,用顏色直方圖作為顏色特征;首先將顏色空間由RGB轉(zhuǎn)化 到HSV空間,然后將HSV顏色空間量化成64份,最后統(tǒng)計落在每一份中像素點的個數(shù);
步驟二、紋理的提取,用離散小波變換后的均值和方差作為紋理特征;首先對 圖像進行3級小波變換,然后計算每級變換后3個高頻子帶的均值和方差;
步驟三、形狀的提取,用邊緣方向直方圖作為形狀特征;首先用Sobel算子提取 圖像邊緣,然后統(tǒng)計圖像邊緣點在水平、45°、垂直、135°方向像素點個數(shù)。
本發(fā)明所述的檢索單元是特征向量之間相似度比較,具體步驟為
步驟一、用戶任選一幅示例圖像;
步驟二、計算該示例圖像的底層視覺特征X1G= 1,2,3);
步驟三、用歐式距離方法計算X1與圖像庫中任意圖像^的相似度S1,
S1, j = exp(-|x-χ/);
步驟四、將S1, j排序并返回前10幅圖像。
本發(fā)明所述的標記單元的步驟如下
步驟一、將反饋池中圖像根據(jù)它們與用戶所選示例圖像是否同一個語義類將其 標記為正例樣本和反例樣本;
步驟二、從未標記圖像中再選取若干幅最能提供信息的圖像作為反例樣本來增 加訓練樣本數(shù)量,進而提高系統(tǒng)性能??偟挠柧殬颖緢D像的數(shù)量為300幅。
本發(fā)明所述的學習單元的策略在于構(gòu)造若干個分類器,并對各個分類器加權(quán), 其具體步驟如下
步驟一、構(gòu)造 asymmetric lagging SVM (AR-SVM)分類器
1)設置AR-SVM分類器個數(shù)Ta = 5 ;
2)構(gòu)造訓練樣本集。訓練樣本包括正例訓練樣本S+,反例訓練樣本S—;
3)用bootstrap方法從反例樣本S—隨機取樣,使得正例訓練樣本的數(shù)量和反例訓 練樣本的數(shù)量相等,即ItHh
4)將訓練樣本中的正例樣本標記為+1,反例樣本標記為-1 ;
5)構(gòu)造 asymmetric bagging SVM 分類器 Q,C1 = I(S;,S+);
步驟二、構(gòu)造random subspace SVM (RS-SVM)分類器
1)設置RS-SVM分類器個數(shù)Tr = 5 ;
2)構(gòu)造底層特征集F ;
3)用bootstrap方法從底層特征集F中隨機取樣,構(gòu)造新的底層特征F卩使得Fj 的維數(shù)大大少于F;
4)構(gòu)造訓練樣本集。訓練樣本包括正例訓練樣本巧,反例訓練樣本& ;
5)將訓練樣本中的正例樣本標記為+1,反例樣本標記為-1 ;
6)構(gòu)造 random subspace SVM 分類器 Cj,Cj = I(S] ,S)·,
步驟三、計算分類器權(quán)值(EM方法)
1)E階段,計算各個分類器權(quán)值;
W1 (X) = P(xGCl\e,p,q) =-P(x p,q)at-e C1 I p, q)at + P(x ^ C1 | p, q)Pt
其中
OC1 =尸O1 (X) = /”.., (X) = / I X e C,,凡 g) = Π ρ、‘\k\ek(x)=i
β, = P(exC1 ,p,q) = \ Π qk,
α ,和β ,是獨立于各個分類器的參數(shù);
Pkj I = P (ek (X) = i|x e C1) Qk,=尸( {x)^i\xi C1)
敏感度ρ和特異性q是表示分類器性能的兩個參數(shù);Y#{x\ek(x) = i}[。_啊—《)=在馳⑷=力
P表示樣本χ屬于分類器C1的先驗概率;
2) M階段,更新性能參數(shù)ρ和q;
piM) =q(tM) =———-ο’! Σ,^ω Σ, αω)
本發(fā)明所述的基于最大期望參數(shù)估計的多分類器集成方法…基于支持向量機 (SVM)的相關反饋方法越來越廣泛的應用到圖像檢索領域,但由于被標記的正例樣本數(shù) 量很少,造成該種方法的性能很差。為了解決這個問題,我們發(fā)明設計了一種用最大期 望參數(shù)估計參數(shù)方法來集成若干個單一的分類器的相關反饋圖像檢索方法,仿真實驗表 明,本方法可以進一步改進相關反饋性能,提高檢索效果?!景l(fā)明所述的基于最大期望參數(shù)估計的多分類器集成方法…本發(fā)明的基本工作原理為首先提取圖像庫中每幅圖 像的顏色、紋理、形狀等底層視覺特征,用戶隨機從圖像庫中選取一幅圖像,采用歐氏 距離計算方法將該圖像特征與圖像庫中所用圖像的底層特征進行相似度比對,將相似度 按大小排序并返回用戶前10幅圖像。用戶根據(jù)返回圖像與事先選取的圖像是否屬于同一 個語義類將其標記為正例圖像和反例圖像,然后將標記好的圖像放到支持向量機中進行 訓練學習,最后將學習后的結(jié)果反饋給用戶,如果用戶對反饋結(jié)果不滿意,可以繼續(xù)按 照上述過程重復進行,直到用戶滿意為止。
本發(fā)明在傳統(tǒng)基于支持向量機反饋方法的基礎上,構(gòu)造若干個分類器,然后用 最大期望參數(shù)估計方法將這些分類器進行集成。該方法不僅解決了傳統(tǒng)支持向量機由于 訓練樣本少不穩(wěn)定的問題、正例樣本遠遠少于反例樣本造成分類器最優(yōu)超平面偏移的問 題,而且解決了由于訓練樣本數(shù)量遠遠少于特征維數(shù)而造成的溢出問題。本發(fā)明大大改 進了支持向量機存在的缺陷,顯著提高了分類器的性能,對基于相關反饋的圖像檢索研 究有很好的參考和實用價值。


本發(fā)明共有七張附圖,其中,
圖1 基于最大期望參數(shù)估計的多分類器集成方法的相關反饋圖像檢索流程
圖2:基于最大期望參數(shù)估計的多分類器集成方法的相關反饋圖像檢索人機交互界面
圖3反饋前檢索結(jié)果
圖4一次反欠貴后檢索結(jié)果
圖5兩次反欠貴后檢索結(jié)果
圖6三次反欠貴后檢索結(jié)果
圖7四次反欠貴后檢索結(jié)果具體實施方式
本發(fā)明的具體實施例如附圖所示,附圖1所示基于最大期望參數(shù)估計的多分類 器集成方法…本發(fā)明的基于最大期望參數(shù)估計的多分類器集成方法的具體實現(xiàn)流程如附 圖所示,包括提取單元、檢索單元、標記單元和學習單元,其具體步驟如下
1提取單元
在該環(huán)節(jié)中,我們主要是提取圖像庫中每幅圖像的底層視覺特征,然后將提取 的特征放入特征庫中,本發(fā)明主要用的底層特征有顏色特征、紋理特征和形狀特征。
1)顏色。本發(fā)明用顏色直方圖作為顏色特征;首先將顏色空間由RGB轉(zhuǎn)化到 HSV空間,然后將HSV顏色空間量化成64份,最后統(tǒng)計落在每一份中像素點的個數(shù)。
2)紋理。本發(fā)明用離散小波變換后的均值和方差作為紋理特征;首先對圖像進 行3級小波變換,然后計算每級變換后3個高頻子帶的均值和方差。
3)形狀。本發(fā)明用邊緣方向直方圖作為形狀特征;首先用Sobel算子提取圖像 邊緣,然后統(tǒng)計圖像邊緣點在水平、45°、垂直、135°方向像素點個數(shù)。
2檢索單元
該環(huán)節(jié)屬于一個人機交互的過程,用戶隨機從圖像庫中選取一幅示例圖像,然 后系統(tǒng)返回給用戶與該示例圖像最相似的N幅圖像,其中N= 10。
1)用戶任選一幅示例圖像。
2)計算該示例圖像的底層視覺特征X1 (i = 1,2,3)。
3)用歐式距離方法計算X1與圖像庫中任意圖像、的相似度S1,
S1, j = exp (_|x「x/)。
4)將S1, j排序并返回前10幅圖像。
3標記單元
在該環(huán)節(jié)中,我們要對進行學習訓練的樣本圖像進行標記。
1)將反饋池中圖像根據(jù)它們與用戶所選示例圖像是否同一個語義類將其標記為 正例樣本和反例樣本。
2)從未標記圖像中再選取若干幅最能提供信息的圖像作為反例樣本來增加訓練 樣本數(shù)量,進而提高系統(tǒng)性能??偟挠柧殬颖緢D像的數(shù)量為300幅。
4學習單元
該環(huán)節(jié)主要包括三個步驟,一是為解決傳統(tǒng)支持向量機由于訓練樣本少不穩(wěn)定 的問題和正例樣本遠遠少于反例樣本造成分類器最優(yōu)超平面偏移的問題,構(gòu)造了分類器 asymmetric bagging SVM。二是為解決由于訓練樣本數(shù)量遠遠少于特征維數(shù)而造成的溢出 問,構(gòu)造了分類器Hffldom subspaceSVM。三是根據(jù)所構(gòu)造的分類器的性能不同,為每個 分類器加權(quán)來集成為一個分類器。
a.構(gòu)造 asymmetric bagging (AB) SVM 分類器
1)設置AR-SVM分類器個數(shù)Ta = 5。
2)構(gòu)造訓練樣本集。訓練樣本包括正例訓練樣本S+,反例訓練樣本S—。
3)用bootstrap方法從反例樣本S—隨機取樣,使得正例訓練樣本的數(shù)量和反例訓 練樣本的數(shù)量相等,即I I=I 1 °
4)將訓練樣本中的正例樣本標記為+1,反例樣本標記為-1。
5)構(gòu)造 asymmetric bagging SVM 分類器 Q,C1 = I(S;,S+)。
b.構(gòu)造 random subspace (RS) SVM 分類器
1)設置RS-SVM分類器個數(shù)Tr = 5。
2)構(gòu)造底層特征集F。
3)用bootstrap方法從底層特征集F中隨機取樣,構(gòu)造新的底層特征F卩使得Fj 的維數(shù)大大少于F。
4)構(gòu)造訓練樣本集。訓練樣本包括正例訓練樣本巧,反例訓練樣本&。
5)將訓練樣本中的正例樣本標記為+1,反例樣本標記為-1。
6)構(gòu)造 random subspace SVM 分類器 Cj,Cj = I(S] ,S])o
c.計算分類器權(quán)值(EM方法)
每個單獨分類器的性能是有限的,為了改進系統(tǒng)整體性能,本發(fā)明用最大期望 參數(shù)估計方法(EM)為每個分類器加權(quán)來集成各個獨立的若分類器。EM方法是一種在不 完全數(shù)據(jù)情況下計算極大似然估計或者后驗分布的迭代算法,是一種針對概率模型設計 的迭代優(yōu)化技術(shù)。它分為計算期望(E)和極大化(M)兩步。
1)E階段,計算各個分類器權(quán)值。
權(quán)利要求
1.一種基于最大期望參數(shù)估計的多分類器集成方法,其特征在于包括提取單元、檢 索單元、標記單元和學習單元;步驟一提取單元該單元是提取圖像庫中每幅圖像的底層視覺特征,然后將提取的特征放入特征庫 中,主要提取的底層視覺特征有顏色特征、紋理特征和形狀特征; 步驟二檢索單元該步驟屬于一個人機交互的過程,用戶隨機從圖像庫中選取一幅示例圖像,然后系 統(tǒng)將特征庫中每幅圖像特征與該圖像進行相似度比較,最后返回給用戶與該示例圖像最 相似的N幅圖像,其中N= 10; 步驟三標記單元該步驟要對進行學習訓練的樣本圖像進行標記;步驟四學習單元該單元主要包括三個步驟,一構(gòu)造分類器 asymmetric bagging SVM ;二構(gòu)造分類器 random subspace SVM ;三為兩類分類器加權(quán)來集成為一個分類器。
2.根據(jù)權(quán)利要求1所述的基于最大期望參數(shù)估計的多分類器集成方法,其特征在于所 述的提取單元包括如下三個步驟步驟一、顏色的提取,用顏色直方圖作為顏色特征;首先將顏色空間由RGB轉(zhuǎn)化到 HSV空間,然后將HSV顏色空間量化成64份,最后統(tǒng)計落在每一份中像素點的個數(shù);步驟二、紋理的提取,用離散小波變換后的均值和方差作為紋理特征;首先對圖像 進行3級小波變換,然后計算每級變換后3個高頻子帶的均值和方差;步驟三、形狀的提取,用邊緣方向直方圖作為形狀特征;首先用Sobel算子提取圖像 邊緣,然后統(tǒng)計圖像邊緣點在水平、45°、垂直、135°方向像素點個數(shù)。
3.根據(jù)權(quán)利要求1所述的基于最大期望參數(shù)估計的多分類器集成方法,其特征在于所 述的檢索單元是特征向量之間相似度比較,具體步驟為步驟一、用戶任選一幅示例圖像;步驟二、計算該示例圖像的底層視覺特征X1G= 1,2,3); 步驟三、用歐式距離方法計算X1與圖像庫中任意圖像^的相似度S1, S1, j = exp(-|x-χ/); 步驟四、將S1, J排序并返回前10幅圖像。
4.根據(jù)權(quán)利要求1所述的基于最大期望參數(shù)估計的多分類器集成方法,其特征在于所 述的標記單元的步驟如下步驟一、將反饋池中圖像根據(jù)它們與用戶所選示例圖像是否同一個語義類將其標記 為正例樣本和反例樣本;步驟二、從未標記圖像中再選取若干幅最能提供信息的圖像作為反例樣本來增加訓 練樣本數(shù)量,進而提高系統(tǒng)性能。總的訓練樣本圖像的數(shù)量為300幅。
5.根據(jù)權(quán)利要求1所述的基于最大期望參數(shù)估計的多分類器集成方法,其特征在于所 述的學習單元的策略在于構(gòu)造若干個分類器,并對各個分類器加權(quán),其具體步驟如下步驟一、構(gòu)造 asymmetric bagging SVM (AB-SVM)分類器1)設置AB-SVM分類器個數(shù)Ta= 5 ;2)構(gòu)造訓練樣本集。訓練樣本包括正例訓練樣本S+,反例訓練樣本S—;3)用bootstrap方法從反例樣本S—隨機取樣,使得正例訓練樣本的數(shù)量和反例訓練樣 本的數(shù)量相等,即ItHh4)將訓練樣本中的正例樣本標記為+1,反例樣本標記為-1;5)構(gòu)造asymmetric bagging SVM 分類器 Ci, C1 = I{S“S+); 步驟二、構(gòu)造 random subspace SVM (RS-SVM)分類器1)設置RS-SVM分類器個數(shù)乃=5;2)構(gòu)造底層特征集F;3)用bootstrap方法從底層特征集F中隨機取樣,構(gòu)造新的底層特征F”使得]^的維 數(shù)大大少于F;4)構(gòu)造訓練樣本集。訓練樣本包括正例訓練樣本巧,反例訓練樣本&;5)將訓練樣本中的正例樣本標記為+1,反例樣本標記為-1;6)構(gòu)造random subspace SVM 分類器 Cj,Cj = I(S%S); 步驟三、計算分類器權(quán)值(EM方法)1)E階段,計算各個分類器權(quán)值;
全文摘要
本發(fā)明所述的基于最大期望參數(shù)估計的多分類器集成方法,主要涉及到一種對多個單一分類器用最大期望參數(shù)估計方法進行集成的基于相關反饋的圖像檢索新方法,包括提取單元、檢索單元、標記單元和學習單元;具體流程為首先提取圖像庫中每幅圖像的顏色、紋理、形狀等底層視覺特征,用戶隨機從圖像庫中選取一幅圖像,采用歐氏距離計算方法將該圖像特征與圖像庫中所有圖像的底層特征進行相似度比對,將相似度按大小排序并返回給用戶前10幅圖像。用戶根據(jù)返回圖像與事先選取的圖像是否屬于同一個語義類將其標記為正例圖像和反例圖像,然后將標記好的圖像放到支持向量機中進行訓練學習,最后將學習后的結(jié)果反饋給用戶。
文檔編號G06K9/62GK102024030SQ20101056628
公開日2011年4月20日 申請日期2010年11月30日 優(yōu)先權(quán)日2010年11月30日
發(fā)明者王向陽, 陳景偉 申請人:遼寧師范大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
永寿县| 黄骅市| 五河县| 宜黄县| 普陀区| 永胜县| 邓州市| 刚察县| 永仁县| 连城县| 通许县| 罗山县| 淮滨县| 闽侯县| 罗城| 中山市| 尚志市| 宜宾县| 山西省| 仁化县| 阳高县| 洮南市| 东乌珠穆沁旗| 龙江县| 辉南县| 麻江县| 库车县| 福州市| 北海市| 洛阳市| 阿拉善盟| 马公市| 伊金霍洛旗| 自贡市| 永年县| 景东| 平遥县| 基隆市| 文昌市| 论坛| 靖安县|