專利名稱:基于RReliefF變量選擇的生產(chǎn)過(guò)程主導(dǎo)變量精簡(jiǎn)化軟測(cè)量方法
技術(shù)領(lǐng)域:
本發(fā)明屬于軟測(cè)量技術(shù)領(lǐng)域,具體涉及一種基于RReliefF變量選擇的生成過(guò)程主導(dǎo)變量精簡(jiǎn)化軟測(cè)量方法。
背景技術(shù):
到目前為止,在實(shí)際生產(chǎn)過(guò)程中,存在著許多因?yàn)榧夹g(shù)或經(jīng)濟(jì)原因無(wú)法直接測(cè)量的變量,在這種情況下,軟測(cè)量技術(shù)應(yīng)運(yùn)而生。軟測(cè)量就是依據(jù)可測(cè)、易測(cè)的過(guò)程變量(稱為輔助變量)與難以直接檢測(cè)的待測(cè)變量(稱為主導(dǎo)變量)的數(shù)學(xué)關(guān)系,根據(jù)某種最優(yōu)準(zhǔn)貝U,采用各種計(jì)算方法,用軟件實(shí)現(xiàn)對(duì)待測(cè)變量的測(cè)量或估計(jì)。軟測(cè)量技術(shù)是目前研究的一個(gè)熱點(diǎn),例如中國(guó)專利(專利號(hào)200410017533. 7)就提出了一種基于支持向量機(jī)的軟測(cè)量建模方法。在軟測(cè)量過(guò)程中,輔助變量的選擇是第一步。在大多數(shù)實(shí)際生產(chǎn)過(guò)程中,人們經(jīng)常不能確定哪個(gè)輔助變量與主導(dǎo)變量相關(guān),或有多大程度的相關(guān),因而導(dǎo)致參與計(jì)算的輔助變量數(shù)量眾多。將眾多輔助變量通過(guò)計(jì)算,實(shí)現(xiàn)對(duì)主導(dǎo)變量的軟測(cè)量,會(huì)帶來(lái)龐大的計(jì)算量,不僅耗時(shí)耗力,并且得到的軟測(cè)量結(jié)果也并不一定是最好的,這是在生成過(guò)程中不希望看到的事情。如何利用最少的輔助變量集對(duì)主導(dǎo)變量實(shí)現(xiàn)效果最好的的軟測(cè)量,成為人們追求的目標(biāo)。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種基于RReliefF變量選擇的生成過(guò)程主導(dǎo)變量精簡(jiǎn)化軟測(cè)量方法,能夠在建模效果最佳的準(zhǔn)則上找出含輔助變量個(gè)數(shù)最少的輔助變量集對(duì)主導(dǎo)變量進(jìn)行建模,實(shí)現(xiàn)對(duì)主導(dǎo) 變量精簡(jiǎn)化的軟測(cè)量。本發(fā)明的技術(shù)方案如下一種基于RReliefF變量選擇的生產(chǎn)過(guò)程主導(dǎo)變量精簡(jiǎn)化軟測(cè)量方法,其關(guān)鍵在于按如下步驟進(jìn)行步驟一確定與主導(dǎo)變量可能相關(guān)的η個(gè)原始輔助變量,采集η個(gè)原始輔助變量和主導(dǎo)變量的取值,組成樣本集,樣本集大小為m,樣本大小為n+1 ;所述樣每個(gè)樣本中,包含有一個(gè)主導(dǎo)變量和η個(gè)原始輔助變量共n+1個(gè)變量的取值。步驟二 利用RReliefF算法分別計(jì)算η個(gè)原始輔助變量的權(quán)重值;利用RReliefF算法計(jì)算η個(gè)原始輔助變量中任一原始輔助變量A的權(quán)重值按如下步驟進(jìn)行(一)從樣本集中選出某個(gè)樣本Di,從剩余的m-l個(gè)樣本中選出離該樣本Di距離最近的k個(gè)樣本,其中I < i < m ;k的值一般取10-20為宜。所述距離指歐式距離。(二)計(jì)算在所述樣本Di主導(dǎo)變量取值Ptl條件下的權(quán)重集化。,按下式進(jìn)行
權(quán)利要求
1.一種基于RReliefF變量選擇的生產(chǎn)過(guò)程主導(dǎo)變量精簡(jiǎn)化軟測(cè)量方法,其特征在于按如下步驟進(jìn)行步驟一確定與主導(dǎo)變量可能相關(guān)的η個(gè)原始輔助變量,采集η個(gè)原始輔助變量和主導(dǎo)變量的取值,組成樣本集,樣本集大小為m,樣本大小為n+1 ;步驟二 利用RReliefF算法分別計(jì)算η個(gè)原始輔助變量的權(quán)重值;步驟三η個(gè)原始輔助變量組成原始輔助變量序列;步驟四確定最佳輔助變量集,包括以下步驟第一步,設(shè)定循環(huán)次數(shù)Ν=η ;第二步,隨機(jī)從樣本集中選擇P個(gè)樣本作為訓(xùn)練樣本,剩下的m-p個(gè)樣本作為檢驗(yàn)樣本;第三步,根據(jù)所述訓(xùn)練樣本,利用BP神經(jīng)網(wǎng)絡(luò)建立原始輔助變量序列中所包含變量的非線性模型;第四步,將所述檢驗(yàn)樣本的原始輔助變量值輸入至所述非線性模型,得到m-p個(gè)檢驗(yàn)樣本對(duì)應(yīng)的主導(dǎo)變量預(yù)測(cè)值;第五步,計(jì)算m-p個(gè)檢驗(yàn)樣本主導(dǎo)變量預(yù)測(cè)值的均方誤差MSE ;第六步,刪除當(dāng)前原始輔助變量序列中權(quán)重值最小的原始輔助變量,組成新的原始輔助變量序列;設(shè)定N=N-1,判斷此時(shí)N是否為O :如果N古0,則回到第三步;如果N=O,則最小的MSE對(duì)應(yīng)原始輔助變量序列即為最佳輔助變量集;步驟五最佳輔助變量集在步驟四中對(duì)應(yīng)的非線性模型即為精簡(jiǎn)化軟測(cè)量模型。
2.根據(jù)權(quán)利要求1所述的基于RReliefF變量選擇的生產(chǎn)過(guò)程主導(dǎo)變量精簡(jiǎn)化軟測(cè)量方法,其特征在于利用RReliefF算法計(jì)算η個(gè)原始輔助變量中任一原始輔助變量A的權(quán)重值按如下步驟進(jìn)行(一)從樣本集中選出某個(gè)樣本Di,從剩余的m-l個(gè)樣本中選出離該樣本Di距離最近的k個(gè)樣本,其中I≤i≤m ;(二)計(jì)算在所述樣本Di主導(dǎo)變量取值Ptl條件下的權(quán)重集nd。,按下式進(jìn)行
3.根據(jù)權(quán)利要求1所述的基于RReliefF變量選擇的生產(chǎn)過(guò)程主導(dǎo)變量精簡(jiǎn)化軟測(cè)量方法,其特征在于在利用BP神經(jīng)網(wǎng)絡(luò)建立原始輔助變量序列中所包含變量的非線性模型的過(guò)程中,輸入層的節(jié)點(diǎn)個(gè)數(shù)等于當(dāng)前原始輔助變量序列中所包含的變量個(gè)數(shù),隱含層的節(jié)點(diǎn)個(gè)數(shù)通過(guò)交互驗(yàn)證法確定,輸出層的節(jié)點(diǎn)個(gè)數(shù)為1,其中,隱含層的傳遞函數(shù)為
全文摘要
本發(fā)明公開(kāi)了一種基于RReliefF變量選擇的生產(chǎn)過(guò)程主導(dǎo)變量精簡(jiǎn)化軟測(cè)量方法,其特征在于按如下步驟進(jìn)行一,確定與主導(dǎo)變量可能相關(guān)的n個(gè)原始輔助變量,采集n個(gè)原始輔助變量和主導(dǎo)變量取值數(shù)據(jù)并組成樣本集;二,利用RReliefF算法分別計(jì)算n個(gè)原始輔助變量的權(quán)重值;三,組成原始輔助變量序列;四,建模并根據(jù)最小均方誤差MSE確定最佳輔助變量;五,得到精簡(jiǎn)化軟測(cè)量模型。本發(fā)明能夠在建模效果最好的基礎(chǔ)上找出含輔助變量個(gè)數(shù)最少的輔助變量集對(duì)主導(dǎo)變量進(jìn)行建模,實(shí)現(xiàn)對(duì)主導(dǎo)變量精簡(jiǎn)化的軟測(cè)量。
文檔編號(hào)G01D21/00GK103033213SQ20121055161
公開(kāi)日2013年4月10日 申請(qǐng)日期2012年12月18日 優(yōu)先權(quán)日2012年12月18日
發(fā)明者李太福, 顏克勝, 蘇盈盈, 姚立忠, 胡文金, 王美丹 申請(qǐng)人:重慶科技學(xué)院