] 附圖1為本發(fā)明的流程圖; 附圖2為本發(fā)明的異常測(cè)點(diǎn)識(shí)別部分的條件判斷流程圖; 附圖3為本發(fā)明的運(yùn)用插值補(bǔ)償法校準(zhǔn)評(píng)估值的運(yùn)行流程圖; 附圖4為本發(fā)明的正常測(cè)點(diǎn)與異常測(cè)點(diǎn)影響曲線示意圖; 附圖5為本發(fā)明的不同S型函數(shù)與影響曲線擬合示意圖; 附圖6為本實(shí)施例二中異常測(cè)點(diǎn)應(yīng)用本發(fā)明前后的設(shè)備預(yù)警情形對(duì)比圖; 附圖7為本實(shí)施例二中正常測(cè)點(diǎn)應(yīng)用本發(fā)明前后的設(shè)備預(yù)警情形對(duì)比圖。
[0018] (五)【具體實(shí)施方式】 附圖為本發(fā)明的一種具體實(shí)施例。
[0019] 實(shí)施例1 一種基于SVM的設(shè)備智能預(yù)警系統(tǒng)的評(píng)估值校準(zhǔn)方法,如附圖1所示,本發(fā)明整個(gè)設(shè)計(jì) 包括以下幾個(gè)過(guò)程: 過(guò)程1為設(shè)備建立設(shè)備智能預(yù)警模型,本過(guò)程主要包括四個(gè)主要步驟。
[0020] 步驟1. 1訓(xùn)練數(shù)據(jù)導(dǎo)入 現(xiàn)所選的訓(xùn)練數(shù)據(jù)為一單設(shè)備的多測(cè)點(diǎn)歷史健康數(shù)據(jù),大致操作過(guò)程為:以選定的測(cè) 點(diǎn)為準(zhǔn)從電廠數(shù)據(jù)庫(kù)中讀取該相關(guān)設(shè)備足夠時(shí)間的歷史運(yùn)行狀態(tài)數(shù)據(jù);然后利用設(shè)定的篩 選規(guī)則從所有的歷史數(shù)據(jù)中篩選出運(yùn)行狀態(tài)良好的健康設(shè)備數(shù)據(jù)作為構(gòu)建支持向量機(jī)回 歸模型的訓(xùn)練數(shù)據(jù)。
[0021] 訓(xùn)練數(shù)據(jù)的篩選規(guī)則是為了將全部的歷史數(shù)據(jù)剔除異常數(shù)據(jù)而獲取健康運(yùn)行數(shù) 據(jù),在趨勢(shì)圖中如果數(shù)據(jù)趨勢(shì)中出現(xiàn)數(shù)值超限、波動(dòng)劇烈、無(wú)波動(dòng)等現(xiàn)象,則本段數(shù)據(jù)會(huì)被 視作異常數(shù)據(jù)應(yīng)當(dāng)剔除,篩選過(guò)后剩余的數(shù)據(jù)即可作為建模的訓(xùn)練數(shù)據(jù)。
[0022] 假若從一個(gè)具有η個(gè)觀察測(cè)點(diǎn)的設(shè)備數(shù)據(jù)庫(kù)截取m個(gè)時(shí)刻的設(shè)備數(shù)據(jù)作為訓(xùn)練數(shù) 據(jù),則在j時(shí)刻的各個(gè)觀察測(cè)點(diǎn)數(shù)據(jù)可看作一個(gè)η維的向量,可表示為:
則該訓(xùn)練數(shù)據(jù)文件應(yīng)當(dāng)為mXn的矩陣形式。具體形式如下:
[0023] 步驟1. 2數(shù)據(jù)預(yù)處理 主要是對(duì)Nan數(shù)據(jù)進(jìn)行填充處理,處理后再進(jìn)行標(biāo)準(zhǔn)化處理。
[0024] 由于網(wǎng)絡(luò)或者軟件等原因獲取的原始訓(xùn)練數(shù)據(jù)不可避免會(huì)存在一些無(wú)效的空數(shù) 據(jù)即Nan (Not a number)數(shù)據(jù),如果不處理的話,含有Nan數(shù)據(jù)的時(shí)刻將無(wú)法訓(xùn)練支持向 量機(jī)回歸模型。對(duì)于此種情況,本發(fā)明采用最近鄰數(shù)據(jù)插值填充的方式來(lái)求取新數(shù)據(jù)彌補(bǔ) Nan數(shù)據(jù)的位置。所采用的公式為:
其中,Valuebmjndaryl、Valuebmjndary2為前后邊界數(shù)據(jù),Time bciundaryl、Timebciundaryl2為前后邊界 時(shí)間,Value_、Timenan為Nan數(shù)據(jù)及其時(shí)間。
[0025] 為了消除各個(gè)測(cè)點(diǎn)之間不同量綱造成的回歸評(píng)估結(jié)果不準(zhǔn)確的影響,訓(xùn)練數(shù)據(jù)處 理Nan數(shù)據(jù)之后還需要進(jìn)行標(biāo)準(zhǔn)化處理的操作,經(jīng)標(biāo)準(zhǔn)化處理的訓(xùn)練數(shù)據(jù)各個(gè)測(cè)點(diǎn)數(shù)據(jù)均 符合均值為〇方差為1的正態(tài)分布。標(biāo)準(zhǔn)化處理的過(guò)程將按照以下公式進(jìn)行:
其中,dataValue為訓(xùn)練數(shù)據(jù),meanValue為訓(xùn)練數(shù)據(jù)均值,StdValue為訓(xùn)練數(shù)據(jù)標(biāo)準(zhǔn) 差。
[0026] 步驟1. 3訓(xùn)練數(shù)據(jù)壓縮 為了節(jié)省支持向量機(jī)建模時(shí)間以及防止模型訓(xùn)練過(guò)度而出現(xiàn)過(guò)擬合,本發(fā)明采用一種 無(wú)參數(shù)的訓(xùn)練數(shù)據(jù)壓縮方式來(lái)達(dá)到以上目的。原始訓(xùn)練數(shù)據(jù)所包含的數(shù)據(jù)狀態(tài)很多,但是 周期性的數(shù)據(jù)或者相鄰的數(shù)據(jù)狀態(tài)很相似甚至是重復(fù),完全可以用其中一條數(shù)據(jù)代替所有 與其狀態(tài)相近的數(shù)據(jù)。
[0027] 本發(fā)明按以下方式進(jìn)行數(shù)據(jù)壓縮,首先人為主觀確定壓縮數(shù)據(jù)所包含的狀態(tài)個(gè)數(shù) 山然后將各個(gè)觀察測(cè)點(diǎn)下的極值狀態(tài)提取出來(lái),共包括Cl 1個(gè);若極值狀態(tài)數(shù)d i仍然小于要 求的d,便將m個(gè)時(shí)刻的訓(xùn)練數(shù)據(jù)求歐幾里得范數(shù),獲得一個(gè)m維的向量,再將m維的向量重 新升序排列,按照一定的步長(zhǎng)L從m維向量中等距抽取一定數(shù)據(jù)的狀態(tài)d 2;合并d ^d2便可 獲得壓縮數(shù)據(jù)R。步長(zhǎng)L的確定是由m與d相除取整獲得的,而壓縮數(shù)據(jù)R將包含訓(xùn)練數(shù)據(jù) 中所有的健康運(yùn)行狀態(tài),它可以代替訓(xùn)練數(shù)據(jù)用來(lái)構(gòu)建支持向量機(jī)回歸模型,以達(dá)到節(jié)省 時(shí)間與防止過(guò)擬合的目的。
[0028] 步驟1. 4構(gòu)建多輸入多輸出的SVM回歸模型 SVM回歸原理是將多個(gè)測(cè)點(diǎn)參數(shù)映射到高維的特征空間中,然后以目標(biāo)參數(shù)為輸出來(lái) 構(gòu)造強(qiáng)凸問(wèn)題,通過(guò)捕捉的特征空間邊界向量(即支持向量機(jī))不斷調(diào)整函數(shù)系統(tǒng)去逼近一 個(gè)可以解決上述問(wèn)題同時(shí)又包含輸入?yún)?shù)與輸出參數(shù)復(fù)雜非線性映射關(guān)系的完整函數(shù)表 達(dá)式。因此普通的SVM回歸模型只可能是多輸入單輸出的模式。為實(shí)現(xiàn)多測(cè)點(diǎn)參數(shù)的輸 出,本發(fā)明將以所有測(cè)點(diǎn)參數(shù)均作為輸入?yún)?shù)的同時(shí)這些測(cè)點(diǎn)參數(shù)依次作為輸出目標(biāo)參數(shù) 的方式來(lái)構(gòu)建一系列的多輸入多輸出SVM回歸模型。
[0029] 由于本發(fā)明用到建模數(shù)據(jù)是上步驟得到mXn的矩陣形式的壓縮數(shù)據(jù),最終的SVM 回歸模型會(huì)是η組均為n-1形式的多SVM回歸模型。下面以構(gòu)建一個(gè)單SVM回歸模型進(jìn)行 建模原理說(shuō)明。
[0030] 為將輸入?yún)?shù)與輸出參數(shù)之間的非線性映射關(guān)系表不出來(lái),按照一般的SVM 建模原理,通過(guò)引入核函數(shù)W(X)將非線性問(wèn)題轉(zhuǎn)化為二次規(guī)劃問(wèn)題,其目標(biāo)函數(shù)為 德,為提高SVM的泛化性能,特引入松弛變量?、誤差懲罰因子C以及判斷 函數(shù)著,從而求取最大間距超平面優(yōu)化問(wèn)題轉(zhuǎn)化為二次規(guī)劃問(wèn)題,如下所示:
為解決上述優(yōu)化問(wèn)題,需引入拉格朗日因子轉(zhuǎn)化問(wèn)題為對(duì)偶問(wèn)題,如下所示:
解上述的對(duì)偶問(wèn)題,得到最優(yōu)化的拉格朗日因 支持向量機(jī)的個(gè)數(shù),將拉格朗日因子?、支持向量機(jī)1、松弛變量|:、誤差懲罰因子c等重要 參數(shù)保存到SVM模型中,從而將回歸問(wèn)題得以解決。
[0031] η個(gè)SVM回歸模型的構(gòu)建均按照上述方式進(jìn)行構(gòu)建完成后,便可以對(duì)每條測(cè)試數(shù) 據(jù)向量的所有測(cè)點(diǎn)參數(shù)擬合出一個(gè)相對(duì)于歷史數(shù)據(jù)中的評(píng)估值向量。
[0032] 過(guò)程2為影響關(guān)系曲線擬合過(guò)程,此過(guò)程也屬于模型建立部分,主要包括以下四 個(gè)主要步驟。
[0033] 步驟2. 1,確定影響類(lèi)型 本發(fā)明需要考慮所有異常測(cè)點(diǎn)組合影響其他正常測(cè)點(diǎn)的方式,影響類(lèi)型的決定因素有 異常源數(shù)目X (即異常測(cè)點(diǎn)的多少)以及正常測(cè)點(diǎn)的偏離程度e大小。則對(duì)于一個(gè)擁有η個(gè) 測(cè)點(diǎn)的數(shù)據(jù),則應(yīng)當(dāng)有:
個(gè)影響類(lèi)型需 要進(jìn)行影響關(guān)系的挖掘。
[0034] 假設(shè)每條訓(xùn)練數(shù)據(jù)為一個(gè)η維向量,則異常源數(shù)目大小范圍在_:^:麥之內(nèi),而 正常測(cè)點(diǎn)的偏離程度e的大小應(yīng)該在(0~/)之內(nèi),如附圖4中所示某測(cè)點(diǎn)的極限偏離程度 f是指在回歸算法中隨著異常測(cè)點(diǎn)的突變程度的逐漸增加,正常測(cè)點(diǎn)參數(shù)的評(píng)估值會(huì)沿著 特定的軌跡逐漸逼近的極限值,其f值大小因訓(xùn)練數(shù)據(jù)中該正常測(cè)點(diǎn)的數(shù)值量綱不同而不 同。下面以測(cè)點(diǎn)I為例,對(duì)其f值的求取進(jìn)行一下說(shuō)明: 首先提取測(cè)點(diǎn)i的原始訓(xùn)練數(shù)據(jù)s數(shù)據(jù)的極值與電_; 然后再將兩極值的間距均分成100等分間距,并依次統(tǒng)計(jì)訓(xùn)練數(shù)據(jù)S中落在每個(gè)等分 間距內(nèi)的頻數(shù)Y1和均值:?, 最后按照以下的公式便可求得極限值f:
步驟2. 2,選取適合的匹配曲線,影響關(guān)系曲線為多參數(shù)的S型曲線; 本步驟主要是尋找適合用來(lái)表達(dá)附圖4曲線的函數(shù),求取此類(lèi)函數(shù)來(lái)代替不同異常測(cè) 點(diǎn)組合對(duì)各個(gè)正常測(cè)點(diǎn)的影響非線性關(guān)系。
[0035] 附圖4中曲線類(lèi)似于動(dòng)物種群增長(zhǎng)、細(xì)胞生長(zhǎng)繁殖等模式,查閱相關(guān)資料文獻(xiàn)可 以用來(lái)表達(dá)類(lèi)似曲線關(guān)系的有函數(shù)、繼函數(shù)以及及fen函數(shù),它們的數(shù)學(xué) 表達(dá)式如下所示:
其中重要相關(guān)系數(shù)為=A1為初始值,A 2為極限值,X。為曲線橫坐標(biāo)中心,p為坡度;
其中重要相關(guān)系數(shù)為W為補(bǔ)償值,A 振幅度1,A 2為振幅度2, t i為帶寬1,12為帶 寬2 ;
其中重要相關(guān)系數(shù)為=A1為初始值,A 2為極限值,X。為曲線橫坐標(biāo)中心,dx為坡度; 每一種影響類(lèi)型均可需按照以上三種函數(shù)進(jìn)行關(guān)系曲線的擬合,設(shè)定擬合指標(biāo)調(diào)整每 種函數(shù)的相關(guān)系數(shù)使其能準(zhǔn)確表達(dá)異常測(cè)點(diǎn)影響正常測(cè)點(diǎn)評(píng)估值的方式。
[0036] 步驟2. 3,計(jì)算曲線的擬合度,即衡量曲線預(yù)測(cè)值與實(shí)時(shí)值的偏差程度; 本步驟用于選取最能代表特定情形下測(cè)點(diǎn)影響關(guān)系曲線的函數(shù)表達(dá)式,并求解出具有 最佳擬合度的函數(shù)相關(guān)系數(shù)。
[0037] 首先,人為主觀地規(guī)定要研究的目標(biāo)測(cè)點(diǎn)的方式以及影響其評(píng)估值的異常源規(guī)模 和程度。以原始訓(xùn)練數(shù)據(jù)測(cè)點(diǎn)i的63數(shù)值、測(cè)點(diǎn)j作為人造的異常源為例,將異常測(cè)點(diǎn)龍 的異常程度從原先的正常水平2倍以0. 01的步長(zhǎng)逐步增長(zhǎng)到10倍,并記錄測(cè)點(diǎn)i的評(píng)估 值偏離程度于下表1中,以異常程度e為橫軸,正常測(cè)點(diǎn)評(píng)估值偏離程度f(wàn)為縱軸作出如附 圖4的趨勢(shì)圖。
[0038] 然后,對(duì)以步驟2. 3中三種S型曲線函數(shù)的為基準(zhǔn)函數(shù)中的相關(guān)系數(shù)進(jìn)行調(diào)整, 且以曲線擬合度指標(biāo)R2進(jìn)行評(píng)價(jià)代表測(cè)點(diǎn)影響關(guān)系曲線的性能,R 2越大表示選擇的函數(shù) 擬合性能越佳,如附圖5所函數(shù)的R2值大于其他兩個(gè)函數(shù)的R 2值,應(yīng)當(dāng)選定 .函數(shù),每種情形選擇出最佳的基準(zhǔn)函數(shù)與相關(guān)系數(shù)。下面為評(píng)價(jià)函數(shù)曲線擬合度 指標(biāo)公式:
其中,Y1為上表中的正常偏離程度,:|為上表中的正常偏離程度的均值,為選定函 數(shù)的預(yù)測(cè)值,η為異常測(cè)點(diǎn)的異常程度改變次數(shù)。
[0039] 步驟2. 4,將曲線參數(shù)保存到參數(shù)數(shù)據(jù)庫(kù)中備用; 此步驟中需要上步驟求取的所有影響類(lèi)型的擬合曲線的基準(zhǔn)函數(shù)與相關(guān)系數(shù)存儲(chǔ)到 指定的參數(shù)數(shù)據(jù)庫(kù)中,作為回歸模型的一部分。