一種基于直覺模糊c均值聚類的目標(biāo)識別方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及模式識別技術(shù),具體涉及一種基于特征加權(quán)直覺模糊c均值聚類的目 標(biāo)識別方法。
【背景技術(shù)】
[0002] 目標(biāo)識別是模式識別技術(shù)領(lǐng)域的一個研宄熱點(diǎn)問題,這一基礎(chǔ)而又重要的技術(shù)在 現(xiàn)代軍事領(lǐng)域及諸多民事領(lǐng)域中均具有重要的意義,且得到了廣泛的應(yīng)用。目標(biāo)識別是對 基于不同傳感器所得目標(biāo)屬性數(shù)據(jù)形成的一個組合目標(biāo)進(jìn)行身份說明,要求先度量目標(biāo)屬 性,根據(jù)目標(biāo)特征信息進(jìn)行融合推理,獲得對目標(biāo)的準(zhǔn)確描述。目標(biāo)識別技術(shù)是具體研宄利 用各種傳感器,從客觀世界中獲取目標(biāo)/背景信號,并使用光電及計(jì)算機(jī)信息處理手段自 動地分析場景信號,檢測、識別感興趣的目標(biāo)及獲取目標(biāo)各種定性、定量性質(zhì)的科學(xué)技術(shù)領(lǐng) 域。
[0003] 目標(biāo)識別理論經(jīng)過多年的發(fā)展,識別方法多種多樣,鑒于目標(biāo)特征值具有不完整、 不確定性及模糊性等特點(diǎn),許多專家學(xué)者提出基于不確定性理論的目標(biāo)識別方法。較為經(jīng) 典的方法有基于Dempster-Shafer推理的異源信息目標(biāo)識別方法,但這種方法由D-S方法 得到基本可信度分配后決策結(jié)果卻沒有可行的統(tǒng)一方法,必須根據(jù)具體問題進(jìn)行具體分 析,特別是存在高沖突證據(jù)時往往會得到與常理相悖的結(jié)果。盡管改進(jìn)方法很多,但這些方 法大多沒有考慮實(shí)際應(yīng)用背景和證據(jù)集特點(diǎn),因此無法保證識別結(jié)果的可靠性。另一經(jīng)典 方法是基于離散動態(tài)貝葉斯網(wǎng)絡(luò)推理的目標(biāo)識別方法,其中貝葉斯網(wǎng)絡(luò)節(jié)點(diǎn)與結(jié)構(gòu)均通過 專家知識確定,需要相應(yīng)的先驗(yàn)概率,但先驗(yàn)概率通常難以給定,所以構(gòu)建的網(wǎng)絡(luò)常與實(shí)際 數(shù)據(jù)有較大偏差。發(fā)展前期另一經(jīng)典方法是基于模糊理論的多傳感器目標(biāo)識別方法雖較其 它方法該算法簡單、可操作性強(qiáng),但Zadeh模糊集在不確定性信息的描述、推理結(jié)果可信性 等方面存在局限性。
[0004] 進(jìn)一步發(fā)展中,基于不確定性理論、各類算法的神經(jīng)網(wǎng)絡(luò)融合系統(tǒng)的研宄蓬勃發(fā) 展,它既不需要研宄對象的大量背景知識,也不需要精確的數(shù)學(xué)模型,而是根據(jù)對象的輸入 輸出數(shù)據(jù)尋找規(guī)律解決復(fù)雜的、不確定性問題。第一種經(jīng)典方法是基于神經(jīng)網(wǎng)絡(luò)的目標(biāo)識 別方法,但當(dāng)目標(biāo)數(shù)據(jù)的信噪比變化時,無法適當(dāng)?shù)馗淖兙W(wǎng)絡(luò)結(jié)構(gòu)往往導(dǎo)致識別結(jié)果不理 想。第二種經(jīng)典方法是基于證據(jù)理論與神經(jīng)網(wǎng)絡(luò)的目標(biāo)識別方法,雖可信度得到了較大的 提高,但其模型結(jié)構(gòu)隱含層的單元個數(shù)難以確定,仿真計(jì)算中重復(fù)性工作量大,且所建立的 動態(tài)網(wǎng)絡(luò)結(jié)構(gòu)尚未解決。第三種經(jīng)典方法是基于Rough集-神經(jīng)網(wǎng)絡(luò)系統(tǒng)的目標(biāo)識別方法, 該方法在一定程度上簡化了網(wǎng)絡(luò)結(jié)構(gòu),縮短了訓(xùn)練時間,提高了識別效率,但在決策表簡化 時往往丟失一些有用信息,導(dǎo)致信息表屬性約簡的計(jì)算量過大。第四種經(jīng)典方法是基于遺 傳算法和神經(jīng)網(wǎng)絡(luò)的目標(biāo)識別方法,該方法采用遺傳算法來獲取網(wǎng)絡(luò)權(quán)值的初值,然后對 神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練來得到權(quán)值的全局最優(yōu)解,克服了神經(jīng)網(wǎng)絡(luò)權(quán)值在訓(xùn)練過程中容易陷入 局部極值點(diǎn)的問題,但遺傳算法的早熟問題以及尋求最優(yōu)解時收斂速度較慢等缺陷,在一 定程度上影響了識別的效率。
[0005] 聚類分析是多元統(tǒng)計(jì)分析的方法之一,也是統(tǒng)計(jì)模式識別中非監(jiān)督模式分類的一 個重要分支。聚類是根據(jù)"物以類聚"的自然法則對數(shù)據(jù)進(jìn)行歸類的一種多元統(tǒng)計(jì)分析方 法,它按照數(shù)據(jù)對象各自的特性來進(jìn)行合理地歸類,要求同一類數(shù)據(jù)有很大的相似性,而不 同類之間的數(shù)據(jù)卻有很大的相異性。聚類分析源于很多領(lǐng)域,諸如數(shù)學(xué)、計(jì)算機(jī)科學(xué)、統(tǒng)計(jì) 學(xué)、生物學(xué)和經(jīng)濟(jì)學(xué)等,而它亦被良好地應(yīng)用于更多領(lǐng)域,比如語音識別、圖像分割、數(shù)據(jù)壓 縮等。
[0006] 在目標(biāo)識別中,通過各種傳感器所獲得的目標(biāo)特征信息進(jìn)行融合推理,得到對各 目標(biāo)屬性的準(zhǔn)確描述。通常情況下,傳統(tǒng)聚類算法往往假定待分析樣本矢量的各維特征對 分類的貢獻(xiàn)是均勻的,但由于構(gòu)成目標(biāo)特征矢量的各維特征來自不同的傳感器,因而存在 量綱差異或精度、可靠性的不同,從而導(dǎo)致各維特征對分類的作用大小不均。鑒于此,本發(fā) 明提出一種特征加權(quán)的直覺模糊C均值方法,采用特征選擇技術(shù)--Relief算法對特征屬 性進(jìn)行加權(quán)選擇,給特征集中的每一個特征賦予不同的權(quán)重,使樣本屬性值的結(jié)構(gòu)與意義 更加完善真實(shí)。
【發(fā)明內(nèi)容】
[0007] 本發(fā)明的目的是提供一種基于特征加權(quán)的直覺模糊C均值聚類算法,主要解決了 目標(biāo)識別現(xiàn)有技術(shù)中類屬型數(shù)據(jù)特征貢獻(xiàn)隱含假意均勻性這一問題。另外從技術(shù)方法上亦 能解決不確定性理論及神經(jīng)網(wǎng)絡(luò)理論等目標(biāo)識別應(yīng)用中產(chǎn)生的相關(guān)技術(shù)問題。
[0008] 本發(fā)明采用的技術(shù)方案是:一種基于特征加權(quán)直覺模糊c均值聚類的目標(biāo)識別方 法,包括以下步驟:
[0009] S1,初始化算法中的參數(shù);
[0010] S2,計(jì)算更新類屬特征的權(quán)值《i;
[0011] S3,計(jì)算機(jī)更新劃分隸屬矩陣I和劃分非隸屬矩陣UY ;
[0012] S4,更新聚類原型模式矩陣Pi(b+1);
[0013] S5,輸出數(shù)據(jù)。
[0014] 進(jìn)一步地,所述步驟S1中的參數(shù)具體包括樣本數(shù)據(jù)個數(shù)n、迭代停止閾值e、聚類 原型模式Pto)、迭代計(jì)數(shù)器b= 0。
[0015] 更進(jìn)一步地,所述步驟S2具體為:采用Relief算法計(jì)算更新類屬特征的權(quán)值《it)
[0016] 更進(jìn)一步地,所述步驟S4具體為:更新聚類原型模式矩陣Pi(b+1),并分別求得 py/b'py,+1)和pit產(chǎn)1)。
[0017] 更進(jìn)一步地,所述步驟S5具體為:輸出劃分隸屬矩陣1、劃分非隸屬矩陣UY和聚 類原型P。
[0018] 本發(fā)明具有如下優(yōu)點(diǎn):
[0019] 能夠根據(jù)目標(biāo)識別應(yīng)用中類屬型數(shù)據(jù)特征對樣本作用大小的不均勻性進(jìn)行有效 地分類識別;
[0020] 利用算法得到的劃分隸屬度矩陣及劃分非隸屬度矩陣有效克服了由于各維特征 來自于不同傳感器導(dǎo)致量綱存在的差異,有利于提高分類精度;
[0021] 利用附加特征權(quán)值對空天典型目標(biāo)進(jìn)行識別分類,利于提高分類的實(shí)用性及可靠 性。
[0022] 除了上面所描述的目的、特征和優(yōu)點(diǎn)之外,本發(fā)明還有其它的目的、特征和優(yōu)點(diǎn)。 下面將參照圖,對本發(fā)明作進(jìn)一步詳細(xì)的說明。
【附圖說明】
[0023] 構(gòu)成本申請的一部分的附圖用來提供對本發(fā)明的進(jìn)一步理解,本發(fā)明的示意性實(shí) 施例及其說明用于解釋本發(fā)明,并不構(gòu)成對本發(fā)明的不當(dāng)限定。
[0024] 圖1是本發(fā)明的一種基于特征加權(quán)直覺模糊c均值聚類的目標(biāo)識別方法流程圖;
[0025] 圖2是模糊c均值聚類算法對一組具有類屬型特征的實(shí)際樣本數(shù)據(jù)Breast CancerWisconsin的分類效果圖;
[0026] 圖3是特征加權(quán)直覺模糊c均值聚類算法對一組具有類屬型特征的實(shí)際樣本數(shù)據(jù) BreastCancerWisconsin的分類效果圖。
【具體實(shí)施方式】
[0027] 為了使本發(fā)明的目的、技術(shù)方案及優(yōu)點(diǎn)更加清楚明白,以下結(jié)合附圖及實(shí)施例,對 本發(fā)明進(jìn)行進(jìn)一步詳細(xì)說明。應(yīng)當(dāng)理解,此處所描述的具體實(shí)施例僅用以解釋本發(fā)明,并不 用于限定本發(fā)明。
[0028] 參照圖1,如圖1所示的一種基于特征加權(quán)直覺模糊c均值聚類的目標(biāo)識別方法, 包括以下步驟:
[0029] S1,初始化算法中的參數(shù);
[0030] S2,計(jì)算更新類屬特征的權(quán)值《i;
[0031] S3,計(jì)算機(jī)更新劃分隸屬矩陣I和劃分非隸屬矩陣UY ;
[0032] S4,更新聚類原型模式矩陣Pi(b+1);
[0033] S5,輸出數(shù)據(jù)。
[0034] 所述步驟S1中的參數(shù)具體包括樣本數(shù)據(jù)個數(shù)n、迭代停止閾值e、聚類原型模式 P(Q)、迭代計(jì)數(shù)器b= 0。
[0035] 所述步驟S2具體為:采用Relief算法計(jì)算更新類屬特征的權(quán)值《it)
[0036] 所述步驟S4具體為:更新聚類原型模式矩陣Pi(b+1),并分別求得pyi(b+1)、pyi(b+1) 和P31i(b+1)。
[0037] 所述步驟S5具體為:輸出劃分隸屬矩陣Up、劃分非隸屬矩陣UY和聚類原型P。
[0038] 本發(fā)明采用特征選擇技術(shù)Relief算法對特征屬性進(jìn)行加權(quán)選擇,分別給特征集 中的每一個特征賦予不同的權(quán)重。因此,本發(fā)明首先給出基于特征加權(quán)的直覺模糊c均 值聚類算法的描述形式及詳細(xì)步驟。其次以一組類屬型特征數(shù)據(jù)集樣本BreastCancer Wisconsin為例進(jìn)行實(shí)驗(yàn),并與傳統(tǒng)模糊c均值聚類算法的實(shí)驗(yàn)結(jié)果進(jìn)行比較分析。最后, 利用本發(fā)明選取20批典型空天目標(biāo)進(jìn)行識別分類的仿真實(shí)驗(yàn)。
[0039] FWIFCM算法描述:
[0040] 給定數(shù)據(jù)集X= {Xl,x2,…,xn}IRs為模式空間中n個模式的一組有限觀測樣本 集,Xi=(<xyn,xyn,xJrn>,〈xyi2,xyi2,xJri2>,〈xyis,xyis,xJris>),為觀測樣本Xj 的特征矢量,特征矢量每維特征上的賦值<xuik,xyik,xik>均為一個直覺模糊數(shù)。P= WP2,…,P。}是c個聚類原型,c為聚類類別數(shù),Pi表示第i類的聚類原型矢量,pi=(<py n,prn,p31n>,<pyi2,pri2.p31i2>.<pyis.p tis?Pis>),Pi在第k維特征上的賦值pik= <pyik,pyik,p nik>也為直覺模糊數(shù)。
[0041] 基于特征加權(quán)的直覺模糊c均值聚類方法的描述形式:
【主權(quán)項(xiàng)】
1. 一種基于特征加權(quán)直覺模糊C均值聚類的目標(biāo)識別方法,其特征在于,包括以下步 驟: Sl,初始化算法中的參數(shù); 52, 計(jì)算更新類屬特征的權(quán)值《i; 53, 計(jì)算機(jī)更新劃分隸屬矩陣U11和劃分非隸屬矩陣U Y ; 54, 更新聚類原型模式矩陣Pi(b+1); 55, 輸出數(shù)據(jù)。
2. 根據(jù)權(quán)利要求1所述的基于特征加權(quán)直覺模糊c均值聚類的目標(biāo)識別方法,其特征 在于,所述步驟Sl中的參數(shù)具體包括樣本數(shù)據(jù)個數(shù)n、迭代停止閾值e、聚類原型模式P?、 迭代計(jì)數(shù)器b = 0。
3. 根據(jù)權(quán)利要求1所述的基于特征加權(quán)直覺模糊c均值聚類的目標(biāo)識別方法,其特征 在于,所述步驟S2具體為:采用Relief算法計(jì)算更新類屬特征的權(quán)值w it)
4. 根據(jù)權(quán)利要求1所述的基于特征加權(quán)直覺模糊c均值聚類的目標(biāo)識別方法,其特征 在于,所述步驟S4具體為:更新聚類原型模式矩陣 Pi(b+1),并分別求得p y i(b+1)、p Y,+1)和 PTli(b+1)〇
5. 根據(jù)權(quán)利要求1所述的基于特征加權(quán)直覺模糊c均值聚類的目標(biāo)識別方法,其特征 在于,所述步驟S5具體為:輸出劃分隸屬矩陣U w、劃分非隸屬矩陣Uy和聚類原型P。
【專利摘要】本發(fā)明公開了一種基于特征加權(quán)直覺模糊c均值聚類的目標(biāo)識別方法,包括以下步驟:S1,初始化算法中的參數(shù);S2,計(jì)算更新類屬特征的權(quán)值ωi;S3,計(jì)算機(jī)更新劃分隸屬矩陣Uμ和劃分非隸屬矩陣Uγ;S4,更新聚類原型模式矩陣pi(b+1);S5,輸出數(shù)據(jù)。本發(fā)明能夠根據(jù)目標(biāo)識別應(yīng)用中類屬型數(shù)據(jù)特征對樣本作用大小的不均勻性進(jìn)行有效地分類識別;利用算法得到的劃分隸屬度矩陣及劃分非隸屬度矩陣有效克服了由于各維特征來自于不同傳感器導(dǎo)致量綱存在的差異,有利于提高分類精度;利用附加特征權(quán)值對空天典型目標(biāo)進(jìn)行識別分類,利于提高分類的實(shí)用性及可靠性。
【IPC分類】G06K9-62
【公開號】CN104850867
【申請?zhí)枴緾N201510315927
【發(fā)明人】雷陽, 馬婧, 周子琛
【申請人】中國人民武裝警察部隊(duì)工程大學(xué)
【公開日】2015年8月19日
【申請日】2015年6月10日