欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷方法與流程

文檔序號(hào):11518634閱讀:240來(lái)源:國(guó)知局
基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷方法與流程

本發(fā)明屬于故障檢測(cè)與診斷技術(shù)領(lǐng)域,具體涉及一種基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷方法。



背景技術(shù):

線性判別分析方法(lda)是一種常用的線性數(shù)據(jù)分類方法,主要應(yīng)用于數(shù)據(jù)降維和對(duì)線性數(shù)據(jù)的分類過(guò)程,利用類間離散度、類內(nèi)離散度,最優(yōu)分類函數(shù)的廣義特征值分解,尋求樣本的最佳分類效果。

lda與主元分析法(pca)都是降維技術(shù),但存在本質(zhì)的區(qū)別,lda是監(jiān)督類型的數(shù)據(jù)降維方法,而pca是無(wú)監(jiān)督類型的數(shù)據(jù)降維。元分析法(pca)主要用于數(shù)據(jù)降維后,尋求數(shù)據(jù)多個(gè)維度的多個(gè)主要變化方向,這些變化方向反映數(shù)據(jù)的主要信息,即用低維數(shù)據(jù)特征來(lái)代表高維數(shù)據(jù)特征。pca方法不考慮樣本類別信息,是把所有原數(shù)據(jù)映射到體現(xiàn)整體樣本方差變化比較大的方向上。而lda方法主要作用是降維分類,則考慮了數(shù)據(jù)的類別信息,即以一個(gè)類別的樣本為一個(gè)單位進(jìn)行統(tǒng)計(jì),降維過(guò)程中區(qū)分開(kāi)每類的類別信息,pca是不區(qū)分每類的類別信息的。

電熔鎂爐屬于埋弧電弧爐設(shè)備,如圖1所示,主要包括電熔鎂爐本體,主電路設(shè)備和控制設(shè)備三部分。其中,電熔鎂爐的本體主要由爐體、電極夾持器、電極升降機(jī)構(gòu)等組成。爐體由爐殼和爐底鋼板組成,爐殼一般為圓形,稍有錐形,為便于熔砣脫殼,在爐殼壁上焊有吊環(huán)。電極夾持器能夠夾持電極,便于電纜傳輸電流。在熔煉過(guò)程中,隨著爐料的熔化,爐池液位會(huì)不斷上漲,操作工人要隨時(shí)升降電極達(dá)到調(diào)整電弧長(zhǎng)度的目的。電極升降機(jī)構(gòu)可使電極沿導(dǎo)軌上下垂直移動(dòng),減少電極晃動(dòng)的情況,保持爐內(nèi)熱功率分配平衡,從而降低漏爐事故的發(fā)生。變壓器和斷網(wǎng)屬于主電路設(shè)備,而在爐子邊設(shè)有控制室,控制電極升降。爐下設(shè)有移動(dòng)小車,作用是將熔化完成的熔塊移到固定工位,冷卻出爐。

應(yīng)用pca方法,如圖2所示,數(shù)據(jù)應(yīng)該映射到方差最大的方向,即y軸方向,但是如果映射到y(tǒng)軸方向,兩個(gè)不同類別的數(shù)據(jù)將完全混合在一起,很難區(qū)分開(kāi),所以使用pca算法進(jìn)行降維后再進(jìn)行分類的效果會(huì)非常差。但是使用lda算法,數(shù)據(jù)會(huì)映射到x軸方向,兩個(gè)類別樣本很清晰的分開(kāi)了。

lda方法是在降維投影過(guò)程中會(huì)考慮到數(shù)據(jù)的類別信息,給定兩個(gè)類別樣本,我們希望找到一個(gè)向量w,當(dāng)數(shù)據(jù)映射到w的方向上時(shí),來(lái)自兩個(gè)類的數(shù)據(jù)盡可能的分開(kāi),同一個(gè)類內(nèi)的數(shù)據(jù)盡可能的緊湊。數(shù)據(jù)的映射公式為:y=wtx,其中y是數(shù)據(jù)y到w上的投影,因而也是一個(gè)高維到1維的維度歸約,即一個(gè)w為一個(gè)維度方向,得到該維度樣本值。

對(duì)于半監(jiān)督線性判別分析,進(jìn)行樣本分類的建模階段,很容易獲取大量未分類的數(shù)據(jù),而帶標(biāo)記類別的數(shù)據(jù)不是很容易獲取,或者是需要花費(fèi)很大時(shí)間才能獲取到。半監(jiān)督學(xué)習(xí)一般分為兩個(gè)方面,即半監(jiān)督的分類問(wèn)題和半監(jiān)督的聚類問(wèn)題。前者利用大量非標(biāo)簽的數(shù)據(jù)輔助監(jiān)督的學(xué)習(xí),后者則是利用少部分標(biāo)簽的數(shù)據(jù)輔助非監(jiān)督的學(xué)習(xí)。

半監(jiān)督的聚類方法大致分為以下三類:基于限制的方法,該類算法在聚類過(guò)程中,利用標(biāo)簽的數(shù)據(jù)來(lái)引導(dǎo)聚類過(guò)程,最終得到一個(gè)恰當(dāng)?shù)姆指罱Y(jié)果,具體的做法是:修改聚類的目標(biāo)函數(shù)以滿足給定的限制,在聚類過(guò)程中遵循限制條件,利用標(biāo)簽數(shù)據(jù)初始化聚類參數(shù)并在聚類過(guò)程中約束數(shù)據(jù)的劃分;

基于距離測(cè)度函數(shù)學(xué)習(xí)的方法,聚類算法必須基于某一距離測(cè)度函數(shù)進(jìn)行聚類,在該方法中所使用的距離測(cè)度函數(shù)是通過(guò)對(duì)標(biāo)簽數(shù)據(jù)學(xué)習(xí)所得到的距離測(cè)度函數(shù),其具體的方法有:利用標(biāo)簽數(shù)據(jù)基于圖的最短路方法而得到的歐氏距離,利用標(biāo)簽數(shù)據(jù)基于凸的優(yōu)化方法而得到的馬氏距離等;

集成上述兩種思想的聚類方法,bllenko等人基于k-mean算法將上述兩種思想集成于一個(gè)框架之下,上述的三大類方法,一般來(lái)說(shuō),都是基于層次的聚類算法或基于劃分的聚類算法。

lda方法的假設(shè)和局限性,lda至多可生成c-1維子空間,lda降維后的維度區(qū)間在[1,c-1],與原始特征數(shù)n無(wú)關(guān),對(duì)于二值分類,最多投影到1維;

lda不適合對(duì)非高斯分布樣本進(jìn)行降維,fisherlda對(duì)數(shù)據(jù)的分布做了一些很強(qiáng)的假設(shè),如每個(gè)類別的數(shù)據(jù)都是高斯分布,各個(gè)類的協(xié)方差相等,雖然這些強(qiáng)假設(shè)很可能在實(shí)際數(shù)據(jù)中并不滿足,但是fisherlda已經(jīng)被證明是非常有效地降維算法,其中的原因是線性模型對(duì)于噪音的魯棒性比較好,不容易過(guò)擬合,缺點(diǎn)是模型簡(jiǎn)單,表達(dá)能力不強(qiáng),為了增強(qiáng)fisherlda算法的非線性表達(dá)能力,可以引入核函數(shù);

lda在樣本分類信息依賴方差而不是均值時(shí),效果不好;

lda可能過(guò)度擬合數(shù)據(jù),準(zhǔn)確的估計(jì)數(shù)據(jù)的散布矩陣是非常重要的,很可能會(huì)有較大的偏置。往往在樣本數(shù)據(jù)比較少(相對(duì)于維數(shù)來(lái)說(shuō))時(shí)會(huì)產(chǎn)生較大的變異性。



技術(shù)實(shí)現(xiàn)要素:

針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提出一種基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷方法。

本發(fā)明的技術(shù)方案是:

一種基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷方法,包括以下步驟:

步驟1:采集電熔煤爐熔煉過(guò)程歷史工況數(shù)據(jù),并對(duì)歷史工況數(shù)據(jù)進(jìn)行預(yù)處理,得到樣本數(shù)據(jù)集x={x1,x2,...,xn}∈rm,其中,包括:l組標(biāo)記樣本類別的樣本數(shù)據(jù)和n-l組未標(biāo)記樣本類別的樣本數(shù)據(jù),m為數(shù)據(jù)維數(shù);

步驟2:將樣本數(shù)據(jù)集x映射到特征空間,得到歷史工況數(shù)據(jù)的特征空間數(shù)據(jù)集xφ=[φ(x1),φ(x2),...,φ(xl),φ(xl+1),...,φ(xn)];

步驟3:根據(jù)歷史工況數(shù)據(jù)的特征空間數(shù)據(jù)集xφ建立基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷模型;

步驟3.1:對(duì)歷史工況數(shù)據(jù)的特征空間數(shù)據(jù)集xφ=[φ(x1),φ(x2),...,φ(xl),φ(xl+1),...,φ(xn)]進(jìn)行投影,得到特征空間數(shù)據(jù)集投影矩陣w及投影矩陣的線性表出系數(shù)矩陣a;

步驟3.2:根據(jù)特征空間數(shù)據(jù)集中標(biāo)記樣本類別的樣本數(shù)據(jù)確定標(biāo)記樣本數(shù)據(jù)的類間離散度矩陣以及標(biāo)記樣本數(shù)據(jù)的類內(nèi)離散度矩陣

步驟3.3:根據(jù)特征空間數(shù)據(jù)集投影矩陣w及投影矩陣的線性表出系數(shù)矩陣a構(gòu)建基于先驗(yàn)知識(shí)的類間流形項(xiàng)p(a)和基于先驗(yàn)知識(shí)的類內(nèi)流形項(xiàng)q(a);

步驟3.4:根據(jù)標(biāo)記樣本數(shù)據(jù)的類間離散度矩陣標(biāo)記樣本數(shù)據(jù)的類內(nèi)離散度矩陣基于先驗(yàn)知識(shí)的類間流形項(xiàng)p(a)和基于先驗(yàn)知識(shí)的類內(nèi)流形項(xiàng)q(a)建立樣本數(shù)據(jù)最優(yōu)分類函數(shù)f(a);

步驟3.5:設(shè)定λ為特征值,采用廣義特征值分解法求解樣本數(shù)據(jù)最優(yōu)分類函數(shù)f(a),得到從大到小排列的d個(gè)特征值和對(duì)應(yīng)的特征向量,將求解的d個(gè)特征向量依次排列作為投影矩陣的線性表出系數(shù)矩陣a=(a1,a2,...,ad),從而確定特征空間數(shù)據(jù)集投影矩陣w=xφa;

步驟3.6:根據(jù)確定的特征空間數(shù)據(jù)集投影矩陣w計(jì)算各類樣本數(shù)據(jù)在特征空間數(shù)據(jù)集投影矩陣w上投影的樣本數(shù)據(jù)均值和各類樣本數(shù)據(jù)在特征空間數(shù)據(jù)集投影矩陣w上投影的樣本數(shù)據(jù)的方差

步驟3.7:根據(jù)各類樣本數(shù)據(jù)在特征空間數(shù)據(jù)集投影矩陣w上投影的樣本數(shù)據(jù)均值和各類樣本數(shù)據(jù)在特征空間數(shù)據(jù)集投影矩陣w上投影的樣本數(shù)據(jù)的方差建立bayes分類器,即得到基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷模型;

步驟4:實(shí)時(shí)采集電熔鎂爐熔煉過(guò)程的測(cè)試數(shù)據(jù)xnew∈rm,采用基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷模型對(duì)測(cè)試樣本數(shù)據(jù)xnew∈rm進(jìn)行故障類型診斷;

步驟4.1:實(shí)時(shí)采集電熔鎂爐熔煉過(guò)程的測(cè)試數(shù)據(jù)xnew∈rm;

步驟4.2:將測(cè)試數(shù)據(jù)xnew映射到特征空間,得到特征空間數(shù)據(jù)φ(xnew);

步驟4.3:確定特征空間數(shù)據(jù)φ(xnew)經(jīng)投影矩陣w的投影值ynew=wtφ(xnew);

步驟4.4:將特征空間數(shù)據(jù)φ(xnew)經(jīng)投影矩陣w的投影值ynew作為基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷模型的輸入,將最大輸出值對(duì)應(yīng)的類別k的樣本類型作為該測(cè)試數(shù)據(jù)的故障類型。

所述樣本數(shù)據(jù)最優(yōu)分類函數(shù)f(a)如下所示:

其中,a為投影矩陣的線性表出系數(shù)矩陣a中的系數(shù),α,β,η∈[0,1]為權(quán)重系數(shù),kl為記樣本類別的歷史工況數(shù)據(jù)的核函數(shù),k為核函數(shù),1=[1,1,...,1]t,是l×l的矩陣,j(k)是元素為的lk×lk矩陣,lk為標(biāo)記的第k類的樣本數(shù)據(jù)數(shù)目,k∈(1,2,...,c),c為標(biāo)記樣本類別總數(shù),i為n×n單位矩陣,lp=dp-mpmp為樣本數(shù)據(jù)間的相似度連接矩陣,為mp的第i行u列個(gè)元素,xi為標(biāo)記樣本數(shù)據(jù),xu為未標(biāo)記樣本數(shù)據(jù),d(xi,xu)為xi與xu間的流形距離,np(xi)為與標(biāo)記樣本數(shù)據(jù)xi不同類別的g近鄰樣本數(shù)據(jù)點(diǎn)構(gòu)成的異類點(diǎn)流形鄰域,i∈(1,2,...,l),u∈(l+1,l+2,...,n),lq=dq-mq,mq為樣本類內(nèi)的相似度連接矩陣,為mq的第i行u列個(gè)元素,nq(xi)為與標(biāo)記樣本數(shù)據(jù)xi同類別的g近鄰點(diǎn)構(gòu)成的同類點(diǎn)流形鄰域。

所述基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷模型gfk(φ(xi))如下所示:

其中,p(k)為屬于第k類樣本數(shù)據(jù)的先驗(yàn)概率。

本發(fā)明的有益效果:

本發(fā)明提出一種基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷方法,即在樣本類別硬劃分基礎(chǔ)上進(jìn)行改進(jìn),利用知識(shí)經(jīng)驗(yàn)對(duì)類內(nèi)離散度和類間離散度進(jìn)行改進(jìn)。在標(biāo)記樣本周圍進(jìn)行人工選擇,根據(jù)近鄰測(cè)度的相似度和不相似度定義本類的相似度知識(shí)流形項(xiàng),和異類不相似度知識(shí)流形項(xiàng),充分挖掘和利用標(biāo)記樣本和未標(biāo)記樣本特征信息建立故障診斷模型。同時(shí)在最后分類階段,對(duì)分類器進(jìn)行了改進(jìn),提高了分類的精度,同時(shí)對(duì)樣本的錯(cuò)分率及樣本分離度等驗(yàn)證標(biāo)準(zhǔn)都有所改進(jìn)。

附圖說(shuō)明

圖1為電熔鎂爐結(jié)構(gòu)示意圖;

其中,1為變壓器,2為短網(wǎng),3為電極夾持器,4為電極,5為爐殼,6為車體,7為電弧,8為爐料,9為控制器;

圖2為pca方法的分類效果示意圖;

圖3為本發(fā)明具體實(shí)施方式中基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷方法的流程圖;

圖4為本發(fā)明具體實(shí)施方式中電熔鎂爐訓(xùn)練樣本三維分布圖;

圖5為本發(fā)明具體實(shí)施方式中參數(shù)為α=0.43、β=0.38、τ=0.909、σ=0.13時(shí)歷史工況數(shù)據(jù)降維后在各投影方向上的效果圖;

其中,(a)為歷史工況數(shù)據(jù)訓(xùn)練樣本三維分布圖;

(b)為歷史工況數(shù)據(jù)測(cè)試樣本三維分布圖;

(c)為歷史工況數(shù)據(jù)訓(xùn)練樣本在第一二維方向上的投影圖;

(d)為歷史工況數(shù)據(jù)測(cè)試樣本在第一二維方向上的投影圖;

(e)為歷史工況數(shù)據(jù)中訓(xùn)練樣本和測(cè)試樣本在第一二維方向上的投影圖像;

(f)為歷史工況數(shù)據(jù)訓(xùn)練樣本均值在第一二維方向上的投影。

具體實(shí)施方式

考慮到實(shí)際工業(yè)生產(chǎn)過(guò)程中變量之間通常呈現(xiàn)非線性關(guān)系,本發(fā)明在傳統(tǒng)方法的基礎(chǔ)上,進(jìn)一步分析了故障數(shù)據(jù)與正常數(shù)據(jù)的關(guān)系,進(jìn)而提取出與故障相關(guān)的故障特征方向。提出了基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷方法,利用本發(fā)明提出的方法對(duì)電熔鎂熔煉過(guò)程的故障進(jìn)行檢測(cè)及故障診斷可以驗(yàn)證所提方法的有效性。

電熔鎂砂是一種廣泛應(yīng)用于化學(xué)、航天、冶金等領(lǐng)域的重要耐火材料,電熔鎂爐是用于生產(chǎn)電熔鎂砂的主要設(shè)備之一。電熔鎂爐是一種以電弧為熱源的熔煉爐,它的熱量集中,有利于熔煉電熔鎂砂。電熔鎂爐的整體設(shè)備組成主要包括:變壓器、電路短網(wǎng)、電極、電極升降裝置以及爐體等。爐邊設(shè)有控制室,可控制電極升降。

電熔鎂爐通過(guò)電極引入大電流形成弧光產(chǎn)生高溫來(lái)完成熔煉過(guò)程。目前我國(guó)多數(shù)電熔鎂爐冶煉過(guò)程自動(dòng)化程度還比較低,往往導(dǎo)致故障頻繁和異常情況時(shí)有發(fā)生,其中由于電極執(zhí)行器故障等原因?qū)е码姌O距離電熔鎂爐的爐壁過(guò)近,使得爐溫異常,可以導(dǎo)致電熔鎂爐的爐體熔化,熔爐一旦發(fā)生將會(huì)導(dǎo)致大量的財(cái)產(chǎn)損失以及危害人身安全。另外,由于爐體固定,執(zhí)行器異常等原因?qū)е码姌O長(zhǎng)時(shí)間位置不變?cè)斐蔂t溫不均,造成距離電極附近溫度高,而距離電極遠(yuǎn)的區(qū)域溫度低,一旦電極附近區(qū)域溫度過(guò)高,容易造成“燒飛”爐料;而遠(yuǎn)離電極的區(qū)域溫度過(guò)低形成死料區(qū),這將嚴(yán)重影響產(chǎn)品產(chǎn)量和質(zhì)量。這就需要及時(shí)地檢測(cè)過(guò)程中異常和故障,因此,對(duì)電熔鎂爐工作過(guò)程進(jìn)行過(guò)程監(jiān)測(cè)是十分必要和有意義的。

下面結(jié)合附圖對(duì)本發(fā)明具體實(shí)施方式加以詳細(xì)說(shuō)明。

一種基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷方法,如圖3所示,包括以下步驟:

步驟1:采集電熔煤爐熔煉過(guò)程歷史工況數(shù)據(jù),并對(duì)歷史工況數(shù)據(jù)進(jìn)行預(yù)處理,得到樣本數(shù)據(jù)集x={x1,x2,...,xn}∈rm,其中,包括:l組標(biāo)記樣本類別的樣本數(shù)據(jù)和n-l組未標(biāo)記樣本類別的樣本數(shù)據(jù),m為數(shù)據(jù)維數(shù)。

本實(shí)施方式中,歷史工況數(shù)據(jù)是熔煉階段20個(gè)批次中的采樣,隨機(jī)取3個(gè)批次中的3類數(shù)據(jù),包括噴爐故障數(shù)據(jù)類、漏爐故障數(shù)據(jù)類和正常數(shù)據(jù)類。歷史工況數(shù)據(jù)隨機(jī)分為兩個(gè)集合,對(duì)應(yīng)訓(xùn)練數(shù)據(jù)集合和測(cè)試數(shù)據(jù)集合,訓(xùn)練數(shù)據(jù)集合每類100個(gè)數(shù)據(jù)點(diǎn),測(cè)試數(shù)據(jù)集合每類100個(gè)數(shù)據(jù)點(diǎn)。采用交叉驗(yàn)證方式來(lái)進(jìn)行試驗(yàn),并且重復(fù)試驗(yàn)500次。采用隨機(jī)方式為每類選取訓(xùn)練和測(cè)試集合中的數(shù)據(jù),電熔煤爐熔煉過(guò)程歷史工況數(shù)據(jù)如表1所示。

表1電熔煤爐熔煉過(guò)程歷史工況數(shù)據(jù)

由于采樣是整個(gè)熔煉過(guò)程中的20個(gè)批次中的采樣,所以對(duì)應(yīng)的故障數(shù)據(jù)具有一定的流形特征,驗(yàn)證本發(fā)明方法的有效性。其余剩余1000個(gè)數(shù)據(jù)為未標(biāo)記數(shù)據(jù),測(cè)試樣本每類各100個(gè)。每個(gè)采樣包括3個(gè)電極電流值,即數(shù)據(jù)維數(shù)m為3。

標(biāo)記的標(biāo)簽集合為l={1,2,...,c},c為標(biāo)記樣本類別總數(shù),3類對(duì)應(yīng)標(biāo)簽矩陣l=[1,2,3]。

步驟2:將樣本數(shù)據(jù)集x映射到特征空間,得到歷史工況數(shù)據(jù)的特征空間數(shù)據(jù)集xφ=[φ(x1),φ(x2),...,φ(xl),φ(xl+1),...,φ(xn)]。

本實(shí)施方式中,采用的核函數(shù)k如式(1)所示:

其中,τ、σ為參數(shù),錯(cuò)分類率是不同的,為了最大程度將不同類分開(kāi),相同類聚合,要對(duì)參數(shù)進(jìn)行調(diào)節(jié),經(jīng)過(guò)多次嘗試和調(diào)優(yōu),得到最佳分類效果的參數(shù)值為τ=0.909和σ=0.13。xi,xi′∈x。

步驟3:根據(jù)歷史工況數(shù)據(jù)的特征空間數(shù)據(jù)集xφ建立基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷模型。

步驟3.1:對(duì)歷史工況數(shù)據(jù)的特征空間數(shù)據(jù)集xφ=[φ(x1),φ(x2),...,φ(xl),φ(xl+1),...,φ(xn)]進(jìn)行投影,得到特征空間數(shù)據(jù)集投影矩陣w及投影矩陣的線性表出系數(shù)矩陣a。

本實(shí)施方式中,歷史工況數(shù)據(jù)映射到特征空間的映射一般是很難直接給出的,由于核函數(shù)的出現(xiàn),可以不必找到具體的映射,而是找到投影矩陣w=[w1,w2,...,wd]的一種組合形式即可。由于任意特征空間內(nèi)的投影矩陣w∈rm×d都可以由映射到特征空間內(nèi)的數(shù)據(jù)組合得到,即投影矩陣w的列向量wj∈rm可由特征空間樣本φ(xi)組成,故存在一組系數(shù)矩陣a=[a1,a2,...ad],其中wj∈rm,wj∈rm的個(gè)數(shù)為降維后的數(shù)據(jù)維度d。

特征空間數(shù)據(jù)集投影矩陣w的表示形式如式(2)所示:

其中,w=[w1,w2,...,wd],a=[a1,a2,...ad],本實(shí)施方式中,d=3。

步驟3.2:根據(jù)特征空間數(shù)據(jù)集中標(biāo)記樣本類別的樣本數(shù)據(jù)確定標(biāo)記樣本數(shù)據(jù)的類間離散度矩陣以及標(biāo)記樣本數(shù)據(jù)的類內(nèi)離散度矩陣

本實(shí)施方式中,標(biāo)記樣本數(shù)據(jù)的類間離散度矩陣如式(3)所示:

其中,lk為標(biāo)記的第k類的樣本數(shù)據(jù)數(shù)目,k∈(1,2,...,c),總的標(biāo)記樣本數(shù)目為φ(xi)(k)為第k類的特征空間數(shù)據(jù),為標(biāo)記樣本的特征空間數(shù)據(jù)集,1=[1,1,...,1]t,是l×l的矩陣,j(k)是元素為的lk×lk矩陣。

標(biāo)記樣本數(shù)據(jù)的類內(nèi)離散度矩陣如式(4)所示:

其中,i為n×n單位矩陣。

步驟3.3:根據(jù)特征空間數(shù)據(jù)集投影矩陣w及投影矩陣的線性表出系數(shù)矩陣a構(gòu)建基于先驗(yàn)知識(shí)的類間流形項(xiàng)p(a)和基于先驗(yàn)知識(shí)的類內(nèi)流形項(xiàng)q(a)。

本實(shí)施方式中,基于先驗(yàn)知識(shí)的類間流形項(xiàng)p(a)如式(5)所示:

其中,a為投影矩陣的線性表出系數(shù)矩陣a中的系數(shù),k為核函數(shù),lp=dp-mp,mp為樣本數(shù)據(jù)間的相似度連接矩陣,為mp的第i行u列個(gè)元素,xi為標(biāo)記樣本數(shù)據(jù),xu為未標(biāo)記樣本數(shù)據(jù),d(xi,xu)為xi與xu間的流形距離,i∈(1,2,...,l),u∈(l+1,l+2,...,n),np(xi)為與標(biāo)記樣本數(shù)據(jù)xi不同類別的g近鄰樣本數(shù)據(jù)點(diǎn)構(gòu)成的異類點(diǎn)流形鄰域。

基于先驗(yàn)知識(shí)的類內(nèi)流形項(xiàng)q(a)如式(6)所示:

其中,lq=dq-mq,mq為樣本類內(nèi)的相似度連接矩陣,為mq的第i行u列個(gè)元素,nq(xi)為與標(biāo)記樣本數(shù)據(jù)xi同類別的g近鄰點(diǎn)構(gòu)成的同類點(diǎn)流形鄰域。

步驟3.4:根據(jù)標(biāo)記樣本數(shù)據(jù)的類間離散度矩陣標(biāo)記樣本數(shù)據(jù)的類內(nèi)離散度矩陣基于先驗(yàn)知識(shí)的類間流形項(xiàng)p(a)和基于先驗(yàn)知識(shí)的類內(nèi)流形項(xiàng)q(a)建立樣本數(shù)據(jù)最優(yōu)分類函數(shù)f(a)。

本實(shí)施方式中,為了在特征空間找到使樣本最大化類間矩和最小化類內(nèi)間距的投影矩陣,設(shè)定最優(yōu)分類函數(shù)f(a)如式(7)所示:

由于利用了基于先驗(yàn)知識(shí)的未標(biāo)記樣本的特征信息,所以在最優(yōu)分類函數(shù)中加入基于先驗(yàn)知識(shí)的類間流形項(xiàng)p(a)和基于先驗(yàn)知識(shí)的類內(nèi)流形項(xiàng)q(a),同時(shí)考慮到由于樣本數(shù)目較小時(shí),在求解過(guò)程中分母項(xiàng)矩陣可能奇異,為保證其可逆,我們?cè)谏鲜龉街屑尤胝齽t項(xiàng)ηatia,η∈[0,1],i為n×n單位矩陣,則改進(jìn)后的最優(yōu)分類函數(shù)f(a)如式(8)所示:

其中,α,β,η∈[0,1]為權(quán)重系數(shù),kl為標(biāo)記樣本類別的歷史工況數(shù)據(jù)的核函數(shù),α用于調(diào)整未標(biāo)記樣本對(duì)標(biāo)記樣本類間離散度作用,本例中取值0.43,β用于調(diào)整未標(biāo)記樣本對(duì)標(biāo)記樣本類內(nèi)離散度的作用,本例中取值0.38。

步驟3.5:設(shè)定λ為特征值,采用廣義特征值分解法求解樣本數(shù)據(jù)最優(yōu)分類函數(shù)f(a),得到從大到小排列的d個(gè)特征值和對(duì)應(yīng)的特征向量,將求解的d個(gè)特征向量依次排列作為投影矩陣的線性表出系數(shù)矩陣a=(a1,a2,...,ad),從而確定特征空間數(shù)據(jù)集投影矩陣w=xφa。

本實(shí)施方式中,設(shè)定λ為特征值,將公式(8)轉(zhuǎn)換為公式(9)形式:

其中,得到從大到小排列的d=3個(gè)特征值和對(duì)應(yīng)的特征向量,取前3個(gè)特征向量依次排列得到線性組合系數(shù)矩陣a=(a1,a2,a3),從而確定特征空間數(shù)據(jù)集投影矩陣w=xφa。

步驟3.6:根據(jù)確定的特征空間數(shù)據(jù)集投影矩陣w計(jì)算各類樣本數(shù)據(jù)在特征空間數(shù)據(jù)集投影矩陣w上投影的樣本數(shù)據(jù)均值和各類樣本數(shù)據(jù)在特征空間數(shù)據(jù)集投影矩陣w上投影的樣本數(shù)據(jù)的方差

本實(shí)施方式中,各類樣本數(shù)據(jù)在特征空間數(shù)據(jù)集投影矩陣w上投影后的矩陣為y如式(10)所示:

y=wtxφ=(xφa)txφ=atxφtxφ=atk(10)

則第k類樣本數(shù)據(jù)在特征空間數(shù)據(jù)集投影矩陣w上投影的樣本數(shù)據(jù)均值如式(11)所示:

第k類樣本數(shù)據(jù)在特征空間數(shù)據(jù)集投影矩陣w上投影的樣本數(shù)據(jù)的方差如式(12)所示:

步驟3.7:根據(jù)各類樣本數(shù)據(jù)在特征空間數(shù)據(jù)集投影矩陣w上投影的樣本數(shù)據(jù)均值和各類樣本數(shù)據(jù)在特征空間數(shù)據(jù)集投影矩陣w上投影的樣本數(shù)據(jù)的方差建立bayes分類器,即得到基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷模型。

本實(shí)施方式中,在核空間使用bayes函數(shù)如式(13)所示:

其中,為核空間第k類樣本數(shù)據(jù)的均值,為核空間第k類樣本數(shù)據(jù)的方差矩陣,p(k)為屬于第k類樣本數(shù)據(jù)的先驗(yàn)概率。

則降維后的bayes分類器,即基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷模型gfk(φ(xi))如式(14)所示:

步驟4:實(shí)時(shí)采集電熔鎂爐熔煉過(guò)程的測(cè)試數(shù)據(jù)xnew∈rm,采用基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷模型對(duì)測(cè)試樣本數(shù)據(jù)xnew∈rm進(jìn)行故障類型診斷。

步驟4.1:實(shí)時(shí)采集電熔鎂爐熔煉過(guò)程的測(cè)試數(shù)據(jù)xnew∈rm

步驟4.2:將測(cè)試數(shù)據(jù)xnew映射到特征空間,得到特征空間數(shù)據(jù)φ(xnew)。

步驟4.3:確定特征空間數(shù)據(jù)φ(xnew)經(jīng)投影矩陣w的投影值ynew=wtφ(xnew)。

步驟4.4:將特征空間數(shù)據(jù)φ(xnew)經(jīng)投影矩陣w的投影值ynew作為基于知識(shí)數(shù)據(jù)的半監(jiān)督核判別分析故障診斷模型的輸入,將最大輸出值對(duì)應(yīng)的類別k的樣本類型作為該測(cè)試數(shù)據(jù)的故障類型。

本實(shí)施方式中,電熔鎂爐訓(xùn)練樣本在普通坐標(biāo)下的三維分布如圖4所示,由圖可以看出,各類樣本數(shù)據(jù)混雜在一起,無(wú)法找到某個(gè)平面輕易將樣本進(jìn)行分類。

各類訓(xùn)練樣本和測(cè)試樣本在經(jīng)映射矩陣w降維后,在以w1,w2,w3為坐標(biāo)軸的空間上的分布如圖5所示。

圖5(a)為各類訓(xùn)練樣本在經(jīng)映射矩陣w降維后,在以w1,w2,w3為坐標(biāo)軸的空間上的分布。由圖可以看出,三類樣本經(jīng)映射后類內(nèi)間距相對(duì)類間間距足夠小,各類樣本聚集在一起,能夠清晰地分為三類。

圖5(b)為各類測(cè)試樣本在經(jīng)映射矩陣w降維后,在以w1,w2,w3為坐標(biāo)軸的空間上的分布。由圖可以看出,三類樣本經(jīng)映射后類內(nèi)間距相對(duì)類間間距足夠小,各類樣本聚集在一起,能夠清晰地分為三類。

圖5(c)為各類訓(xùn)練樣本在經(jīng)映射矩陣w降維后,在以w1,w2,w3為坐標(biāo)軸的空間上的分布,又在w1,w2方向上的投影。由圖可以看出,三類樣本經(jīng)映射后聚集為三點(diǎn),各類之間距離較大,能夠清晰地進(jìn)行分類。

圖5(d)為各類測(cè)試樣本在經(jīng)映射矩陣w降維后,在以w1,w2,w3為坐標(biāo)軸的空間上的分布,又在w1,w2方向上的投影。由圖可以看出,三類樣本經(jīng)映射后聚集為三個(gè)數(shù)據(jù)塊,各類之間距離較大,能夠清晰地進(jìn)行分類。

圖5(e)為各類訓(xùn)練樣本和測(cè)試樣本在經(jīng)映射矩陣w降維后,在以w1,w2,w3為坐標(biāo)軸的空間上的分布,又在w1,w2方向上的投影。由圖可以看出,三類樣本經(jīng)映射后聚集為三個(gè)數(shù)據(jù)塊,且各類的訓(xùn)練數(shù)據(jù)與測(cè)試數(shù)據(jù)均重合,各類之間距離較大,能夠清晰地進(jìn)行分類。

圖5(f)為各類測(cè)試樣本在經(jīng)映射矩陣w降維后的均值,在以w1,w2,w3為坐標(biāo)軸的空間上的分布,又在w1,w2方向上的投影。由圖可以看出,各類的均值距離較遠(yuǎn),區(qū)分明顯,達(dá)到了很好的分類效果。

當(dāng)前第1頁(yè)1 2 
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
雷州市| 安阳县| 开封县| 台北县| 拜泉县| 阿克苏市| 台山市| 本溪| 田阳县| 栾城县| 绥化市| 易门县| 寿宁县| 姜堰市| 滦南县| 南华县| 翁源县| 民县| 沈丘县| 苏尼特右旗| 昭觉县| 龙泉市| 乐清市| 青冈县| 甘南县| 烟台市| 义马市| 佛山市| 浦江县| 广平县| 澜沧| 沙雅县| 错那县| 西平县| 金山区| 苗栗市| 荆门市| 阜平县| 柘荣县| 界首市| 资兴市|