基于支持向量機和rbf神經網絡的退化數(shù)據缺失插補方法
【專利摘要】本發(fā)明公開了一種基于支持向量機和RBF神經網絡的退化數(shù)據缺失插補方法,包括以下幾個步驟:步驟一、利用支持向量機建立退化數(shù)據趨勢模型;步驟二、計算已觀測退化數(shù)據的殘差序列;步驟三、建立RBF神經網絡,并利用已觀測數(shù)據的殘差序列訓練網絡;步驟四、通過訓練好的RBF神經網絡估計缺失數(shù)據的殘差序列;步驟五、合并缺失數(shù)據的趨勢項與殘差序列的估計結果為退化數(shù)據插補結果。本發(fā)明將支持向量機方法和RBF神經網絡方法結合,提出了一種退化數(shù)據缺失插補方法,解決了加速退化試驗中缺失性能退化數(shù)據的插補問題。
【專利說明】基于支持向量機和RBF神經網絡的退化數(shù)據缺失插補方法
【技術領域】
[0001]本發(fā)明涉及一種基于支持向量機和RBF神經網絡的退化數(shù)據缺失插補方法,屬于加速退化試驗【技術領域】。
【背景技術】
[0002]在加速退化試驗的數(shù)據采集中,由于監(jiān)測設備發(fā)生故障或人工記錄人員過失等原因,采集到的性能退化數(shù)據經常發(fā)生有缺失的情況。數(shù)據的缺失造成了后續(xù)的性能退化數(shù)據處理的困難,在加速退化試驗的數(shù)據處理與評估、故障預測或壽命預測中,都需要完整的數(shù)據作為輸入,另外很多傳統(tǒng)的性能退化數(shù)據處理方法無法對有缺失的數(shù)據進行統(tǒng)計分析,比如一些關于時間序列的算法就要求輸入的數(shù)據為完整的等間距數(shù)據集。在壽命預測或故障預測中,性能退化數(shù)據的缺失會對預測結果造成影響,致使得到的結果不能滿足工程要求。
[0003]針對數(shù)據發(fā)生缺失的情況,最常用的處理方法有三種:(I)個案剔除法:將含有缺失的數(shù)據個案剔除,這種方法會造成數(shù)據資源的大量浪費,尤其在樣本量較小的情況下,刪除少量數(shù)據就足以嚴重影響到數(shù)據的客觀性。(2)數(shù)據挖掘法:直接在包含缺失數(shù)據的數(shù)據上進行數(shù)據挖掘,不對缺失數(shù)據進行處理,具體主要有貝葉斯網絡和人工神經網絡等方法,但這方面的方法還有待進一步展開。(3)缺失插補法:缺失插補法采用某種缺失值插補技術,把缺失值用最接近它的值來替代的方法,這種方法不必刪除不完整數(shù)據,保留了潛在的有用信息,使分析結果不易產生偏差。
[0004]缺失插補法是當前最常用的缺失數(shù)據處理方法,也是當前的研究熱點。采用有效的插補方法處理缺失數(shù)據可以提高對數(shù)據資源的有效利用,減少數(shù)據資源的浪費,并且有助于加速退化試驗的數(shù)據處理與評估等工作,甚至可能影響研究結果,減少如壽命預測結果不準確等情況所帶來的隱患。因此,對有缺失的性能退化數(shù)據采用正確和有效的處理方法是能否得出正確結論的關鍵之一。
[0005]常用的缺失數(shù)據插補法有均值插補法、熱卡插補法、冷卡插補法、最鄰近插補法、回歸插補法、EM (Expectation Maximization)算法等。但這些方法都有一些缺點,它們經常忽略缺失數(shù)據插補的不確定性,比如均值插補法只用樣本均值作為插補數(shù)據,傳統(tǒng)回歸插補法的插補數(shù)據也不考慮原始數(shù)據的離散性,這會導致插補數(shù)據的方差被低估,而不能真實地反映出原始數(shù)據。盡管后來由于回歸插補引入了隨機誤差項,能夠緩解這一問題,但是隨機誤差項的確定是比較困難的。另外,在某些復雜的情況下,對數(shù)據趨勢進行回歸建模的方法會難以應用,有時為了方便使用而采用了一些簡單的回歸方程還會導致部分趨勢信息的丟失。
[0006]支持向量機(Support Vector Machines, SVM)是由Vapnik等人提出的一種機器學習算法(參見參考文獻[I]:Vapnik V.The Nature of Statistical Learning Theory.NewYork: Springer-Verlag, 1999),其重要理論基礎是統(tǒng)計學習理論,它從觀測數(shù)據出發(fā)尋找規(guī)律,利用這些規(guī)律對未來數(shù)據或無法觀測的數(shù)據進行預測。支持向量機基于結構風險最小化原理,結構風險最小化原理不僅使經驗風險最小,還要使VC維(Vapnik-ChervonnkisDimension)盡量小以縮小置信范圍,這就取得了較小的實際風險,即對未知樣本有較好的泛化性能。相比于回歸分析的方法,支持向量機憑借較強的泛化能力同樣可以很好的擬合非線性函數(shù)。而且對于復雜的情況,支持向量機相比于回歸分析的方法使用起來更加方便。
[0007]支持向量機的基本思想是通過用內積函數(shù)定義的非線性變換將輸入空間變換到一個高維空間,在這個高維空間中尋找輸入變量和輸出變量之間的一種非線性關系。其算法是一個凸二次優(yōu)化問題,保證找到的解是全局最優(yōu)解。
[0008]隨著對支持向量機研究的深入,許多支持向量機的變形算法被提了出來,如C-SVM系列、v-SVM系列、RSVM、WSVM和LS-SVM等算法。其中由Suykens等人提出的最小二乘支持向量機(Least Squares Support Vector Machine, LS-SVM)就是一種簡潔有效的算法(參見參考文獻[2]:Suykens J.A.K., Vandewalle J.Least squares support vector machineclassifiers.Neural Processing Letter, 1999,9:293-300),其核心思想是用等式約束替換標準支持向量機中的不等式約束。由于采用等式約束,原來需要求解一個凸二次優(yōu)化的問題就轉換成了求解一個線性方程組,這樣,求解的難度大大降低,提高了算法的收斂速度。如今LS-SVM被廣泛運用于許多領域中,本發(fā)明將采用LS-SVM對退化數(shù)據的缺失進行處理。
[0009]徑向基函數(shù)(Radial Basis Function, RBF)神經網絡是目前應用最廣泛的神經網絡模型之一,它是以函數(shù)逼近理論為基礎而構造的一類前向網絡,這類網絡的學習等價于在多維空間中尋找訓練數(shù)據的最佳擬合平面。RBF神經網絡的每個隱層神經元的函數(shù)都構成了擬合平面的一個基函數(shù)。RBF神經網絡是一種局部逼近網絡,即對于輸入空間的某一個局部區(qū)域只存在少數(shù)的神經元用于決定網絡的輸出。相比于另一種應用廣泛的BP (BackPropagation)神經網絡或以BP神經網絡拓撲結構為基礎的小波神經網絡,RBF神經網絡在函數(shù)逼近能力和學習速度等方面均有優(yōu)勢。
【發(fā)明內容】
[0010]本發(fā)明的目的是為了解決性能退化數(shù)據的缺失插補問題,提出了一種通用性較強的基于支持向量機和RBF神經網絡的退化數(shù)據缺失插補方法。本發(fā)明綜合采用支持向量機方法與RBF神經網絡方法,利用已觀測退化數(shù)據的信息來實現(xiàn)缺失退化數(shù)據的插補。
[0011]本發(fā)明是一種基于支持向量機和RBF神經網絡的退化數(shù)據缺失插補方法,包括以下幾個步驟:
[0012]步驟一、利用支持向量機建立退化數(shù)據趨勢模型;
[0013]步驟二、計算已觀測退化數(shù)據的殘差序列;
[0014]步驟三、建立RBF神經網絡,并利用已觀測退化數(shù)據的殘差序列訓練網絡;
[0015]步驟四、通過訓練好的RBF神經網絡估計缺失數(shù)據的殘差序列;
[0016]步驟五、合并缺失數(shù)據的趨勢項與殘差序列的估計結果為退化數(shù)據插補結果。
[0017]本發(fā)明的優(yōu)點在于:
[0018](I)利用支持向量機對退化數(shù)據的趨勢進行建??梢允共逖a數(shù)據的趨勢與原始數(shù)據保持一致,且支持向量機使用起來十分方便。
[0019](2)使用RBF神經網絡估計缺失數(shù)據的殘差序列可以使插補數(shù)據保持原始數(shù)據的離散性,使插補數(shù)據更加接近真實。
【專利附圖】
【附圖說明】
[0020]圖1是本發(fā)明所述基于支持向量機和RBF神經網絡的退化數(shù)據缺失插補方法的流程圖;
[0021]圖2是本發(fā)明實施例有缺失的退化數(shù)據曲線;
[0022]圖3是本發(fā)明實施例缺失數(shù)據的退化趨勢估計結果;
[0023]圖4是本發(fā)明實施例缺失數(shù)據的殘差序列估計結果;
[0024]圖5是本發(fā)明實施例缺失數(shù)據的最終插補結果。
【具體實施方式】
[0025]下面將結合附圖和實施例對本發(fā)明作進一步的詳細說明。
[0026]本發(fā)明提供一種基于支持向量機和RBF神經網絡的退化數(shù)據缺失插補方法,針對有缺失的性能退化數(shù)據進行插補處理,假設完整的退化數(shù)據為Y,其對應的時間為T,記Y= (Yobs, Ymis),T= (Tobs, Tmis),其中已觀測退化數(shù)據Y-、已觀測退化數(shù)據對應的時間Ttjbs和缺失數(shù)據對應的時間Tmis為已知數(shù)據,具體為:
【權利要求】
1.一種基于支持向量機和RBF神經網絡的退化數(shù)據缺失插補方法,其特征在于,包括以下幾個步驟: 步驟一、利用支持向量機建立退化數(shù)據趨勢模型; 首先利用支持向量機建立退化數(shù)據的趨勢模型,以已觀測退化數(shù)據對應的時間Tobs- (^obs_l? t0bs—2,…,tobs_n)為知入向里,已觀測的退化數(shù)據 YQbs-(yQbs—丨,yobs_2?…,y0bs_n)為輸出向量,利用最小二乘支持向量機算法得出退化數(shù)據趨勢模型:
2.根據權利要求1所述的一種基于支持向量機和RBF神經網絡的退化數(shù)據缺失插補方法,其特征在于,步驟一中,所述的核函數(shù)有如下幾種: 1)多項式核函數(shù):
^ (x, y) = (x ? y+l)d 2)徑向基(RBF)核函數(shù):
3.根據權利要求1所述的一種基于支持向量機和RBF神經網絡的退化數(shù)據缺失插補方法,其特征在于,所述的基函數(shù)是高斯函數(shù):
【文檔編號】G06N3/02GK103810392SQ201410061308
【公開日】2014年5月21日 申請日期:2014年2月24日 優(yōu)先權日:2013年12月13日
【發(fā)明者】孫富強, 范曄, 李曉陽, 姜同敏 申請人:北京航空航天大學