基于改進(jìn)dtw算法的間歇過(guò)程批次數(shù)據(jù)同步方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于間歇過(guò)程故障檢測(cè)領(lǐng)域,更為具體地講,涉及一種基于改進(jìn)DTW算法 的間歇過(guò)程批次數(shù)據(jù)同步方法。
【背景技術(shù)】
[0002] 間歇過(guò)程是現(xiàn)代流程工業(yè)最主要的生產(chǎn)方式,由于其本身的靈活性,被廣泛應(yīng)用 于多品種、高附加值產(chǎn)品的生產(chǎn)中。然而,由于其過(guò)程本身的復(fù)雜性以及其他干擾的影響, 使得實(shí)際運(yùn)行軌跡與期望軌跡間往往存在較大差異,并最終導(dǎo)致產(chǎn)品質(zhì)量顯著下降。此外, 這類系統(tǒng)一旦發(fā)生故障,不僅會(huì)造成人員和財(cái)產(chǎn)損失,而且環(huán)境污染也比其他事故嚴(yán)重得 多。因此,間歇過(guò)程的故障監(jiān)測(cè)和質(zhì)量預(yù)測(cè),一直是過(guò)程控制領(lǐng)域研宄的熱點(diǎn)之一。
[0003] 傳統(tǒng)的間歇過(guò)程故障檢測(cè)方法如MPCA((MultilinearPrincipalComponent Analysis,多線性主成分分析),進(jìn)行間歇過(guò)程故障檢測(cè)的一個(gè)重要前提是不同批次的數(shù)據(jù) 具有相同的長(zhǎng)度。而實(shí)際間歇過(guò)程具有很強(qiáng)的復(fù)雜性,這樣就導(dǎo)致同一個(gè)間歇過(guò)程的不同 批次之間不可能達(dá)到理想的重復(fù)生產(chǎn),因此過(guò)程數(shù)據(jù)的長(zhǎng)度也不可能完全相同。在多階段 間歇過(guò)程中,數(shù)據(jù)不同步問(wèn)題表現(xiàn)的相當(dāng)復(fù)雜,數(shù)據(jù)不同步現(xiàn)象在某一個(gè)或某幾個(gè)特定的 階段中都有可能發(fā)生。針對(duì)以上問(wèn)題,Lakshminarayanan等提出將所有批次軌跡都擴(kuò)至最 長(zhǎng),即選取批次中最長(zhǎng)軌跡為標(biāo)準(zhǔn),將其他批次數(shù)據(jù)擴(kuò)至標(biāo)準(zhǔn)軌跡長(zhǎng)度,人為加上測(cè)量值。 當(dāng)然還有按最短軌跡為標(biāo)準(zhǔn),人為刪除非標(biāo)準(zhǔn)長(zhǎng)度批次數(shù)據(jù)的一些數(shù)據(jù)點(diǎn),實(shí)現(xiàn)不同批次 數(shù)據(jù)等長(zhǎng)。這些方法都忽略了局部模式的特點(diǎn),即只是簡(jiǎn)單地強(qiáng)行將數(shù)據(jù)變?yōu)榈乳L(zhǎng),很可能 放大或丟失原始數(shù)據(jù)的局部特性。動(dòng)態(tài)時(shí)間規(guī)整(DynamicTimeWraping,DTW)是基于動(dòng) 態(tài)規(guī)劃(DP)的思想,是一種衡量?jī)蓚€(gè)長(zhǎng)度不同的時(shí)間序列的相似度的方法,主要用于模板 匹配中,比如語(yǔ)音識(shí)別、手勢(shì)識(shí)別、數(shù)據(jù)挖掘和信息檢索等,因而該方法可以將間歇過(guò)程各 批次數(shù)據(jù)規(guī)整到標(biāo)準(zhǔn)批次序列,實(shí)現(xiàn)各批次同步。
[0004] DTW是一種基于動(dòng)態(tài)規(guī)劃理論(DP)提出的模式匹配方法,該算法將時(shí)間規(guī)整和距 離測(cè)度計(jì)算相結(jié)合,通過(guò)搜尋兩條軌跡間的相似特征來(lái)進(jìn)行壓縮、擴(kuò)張或轉(zhuǎn)換某些向量,以 獲得兩條軌跡間的最小距離。
[0005] 以本發(fā)明所針對(duì)的間歇過(guò)程為例,設(shè)T(tXN)和R(rXN)為2條多元軌跡,分別代 表參考批次和參考批次,其中t和r分別為兩個(gè)批次的采樣點(diǎn)數(shù),也就是采樣次數(shù),N為每次 采樣所采集的變量個(gè)數(shù)。DTW運(yùn)用動(dòng)態(tài)規(guī)劃原理,非線性地錯(cuò)位2條軌跡,排列相似事件,使 其中一條軌跡的各向量與另一條軌跡的各向量相對(duì)應(yīng),以獲得兩條軌跡間的最短距離。設(shè) i和j分別為R(rXN)和T(tXN)軌跡上的關(guān)于時(shí)間的坐標(biāo),即表示第幾次采樣,取值范圍 分別為1彡i彡r,l彡j彡t,R(iXN)表示R(rXN)軌跡第i個(gè)采樣數(shù)據(jù),T(jXN)表示 T(tXN)軌跡第j個(gè)采樣數(shù)據(jù)。DTW在rXt網(wǎng)格中建立K個(gè)點(diǎn)的F*序列:
[0006] F* = {c (I),c (2),? ? ?,c (k),? ? ?,c (K)} (1)
[0007] 其中max(t,r) <K<t+r,c(k) =[i(k),j(k)],為網(wǎng)格中表示i和j匹配的每 一點(diǎn)。
[0008] 在DTW算法中,F(xiàn)*序列可看作使兩軌跡之間標(biāo)準(zhǔn)距離最短的一條處于rXt網(wǎng)格 中的最優(yōu)路徑。設(shè)d(i,j)代表R(iXN)和T(jXN)的歐氏距離值:
【主權(quán)項(xiàng)】
1. 一種基于改進(jìn)DTW算法的間歇過(guò)程批次數(shù)據(jù)同步方法,其特征在于,包括以下步驟: 51 :預(yù)設(shè)參考批次的采樣點(diǎn)數(shù)r,從正常間歇過(guò)程的批次數(shù)據(jù)中選取采樣點(diǎn)數(shù)為r的若 干批次數(shù)據(jù),對(duì)選取的批次數(shù)據(jù)進(jìn)行聚類,將得到的聚類數(shù)量記為D,從每個(gè)聚類中選擇與 聚類中心距離最近的批次數(shù)據(jù)作為參考批次數(shù)據(jù),共計(jì)D個(gè)參考批次數(shù)據(jù); 52 :對(duì)于需要進(jìn)行同步的測(cè)試批次數(shù)據(jù)批次數(shù)據(jù),分別以步驟Sl得到的D個(gè)參考批次 數(shù)據(jù)為參考軌跡,采用改進(jìn)DTW算法進(jìn)行等長(zhǎng)同步處理,得到D個(gè)采樣點(diǎn)數(shù)為r的同步數(shù) 據(jù),等長(zhǎng)同步處理的具體方法包括以下步驟: S2. 1 :計(jì)算測(cè)試批次數(shù)據(jù)T(tXN)和參考批次數(shù)據(jù)R(rXN)中各采樣數(shù)據(jù)之間的距離 矩陣d,d(i,j)表示R(iXN)和T(jXN)的歐氏距離值,R(iXN)表示參考批次數(shù)據(jù)R(rXN) 第i個(gè)采樣數(shù)據(jù),T(jXN)表示測(cè)試批次數(shù)據(jù)T(tXN)第j個(gè)采樣數(shù)據(jù),i和j的取值范圍 分別為1彡i彡r,1彡j彡t ; S2. 2 :初始化累積矩陣D# D A(l,I) = d(l,1),其余元素為正無(wú)窮; S2. 3 :令循環(huán)變量i = 2 ; S2. 4 :計(jì)算本次搜索區(qū)間[ymin,ymax],分為以下三種情況: 當(dāng)i e [1,X1],ymin、ymax的計(jì)算公式為:
&和Xr都取與計(jì)算結(jié)果最相近的整數(shù),a、b為預(yù)設(shè)的路徑限制平行四邊形相鄰兩條邊 的斜率,其中 〇<a<k,b>k,k = t/r; S2. 5 :依次對(duì)搜索區(qū)間[y^,y_]
中的每個(gè)值j,計(jì)算累積距離DA(i, j),計(jì)算公式為: S2. 6:判斷是否i <r,如果是,令i = i+Ι,返回步驟S2. 4,否則進(jìn)入步驟S2. 7; S2. 7 :回溯得到同步數(shù)據(jù)S (r XN),具體步驟包括: S2. 7. 1:令同步數(shù)據(jù)S(rXN)中的最后一個(gè)數(shù)據(jù)S(rXN) =T(tXN); S2. 7· 2 :初始化 p = r-l,q = t ; S2. 7. 3 :根據(jù)累積距離矩陣Da向前搜索D A(p, q)、DA(p, q-1)和DA(p, q-2),選擇其中最 小值,將其對(duì)應(yīng)的測(cè)試批次數(shù)據(jù)的采樣點(diǎn)序號(hào)記為V,令S(pXN) =T(q< XN); S2. 7. 4 :如果p > 1,令p = p-1,q = q',返回步驟S2. 7. 3,否則結(jié)束搜索,得到同步 數(shù)據(jù) S(rXN); S3 :將步驟S2得到的D個(gè)同步數(shù)據(jù)進(jìn)行平均,得到該測(cè)試批次數(shù)據(jù)的同步結(jié)果。
2. 根據(jù)權(quán)利要求1所述的間歇過(guò)程批次數(shù)據(jù)同步方法,其特征在于,所述步驟Sl中的 聚類方法為K均值聚類方法。
3. 根據(jù)權(quán)利要求1所述的間歇過(guò)程批次數(shù)據(jù)同步方法,其特征在于,所述步驟S2. 4中, 如果k < 1,斜率a、b的取值范圍分別為0. 2k彡a < k,k < b彡5k ;如果k > 1,斜率a、b 的取值范圍分別為〇. 5k彡a < k,k < b彡2k。
【專利摘要】本發(fā)明公開(kāi)了一種基于改進(jìn)DTW算法的間歇過(guò)程批次數(shù)據(jù)同步方法,首先從正常間歇過(guò)程的批次數(shù)據(jù)中選取相同采樣點(diǎn)數(shù)的若干批次數(shù)據(jù),采用聚類算法對(duì)這些批次數(shù)據(jù)進(jìn)行聚類后從每個(gè)聚類中選擇與聚類中心距離最近的批次數(shù)據(jù)作為參考批次數(shù)據(jù),共計(jì)D個(gè)參考批次數(shù)據(jù);對(duì)于需要進(jìn)行同步的測(cè)試批次數(shù)據(jù),分別以D個(gè)參考批次數(shù)據(jù)為參考軌跡,采用改進(jìn)DTW算法進(jìn)行等長(zhǎng)同步處理,得到D個(gè)同步數(shù)據(jù),再將D個(gè)同步數(shù)據(jù)進(jìn)行平均,得到該測(cè)試批次數(shù)據(jù)的同步結(jié)果。本發(fā)明通過(guò)采用改進(jìn)DTW算法,限制搜索面積,提高算法效率,并且由于采用多個(gè)參考批次數(shù)據(jù)作為參考軌跡,避免了單一參考樣本造成的過(guò)偏同步,提高了同步結(jié)果的穩(wěn)定性。
【IPC分類】G06F17-30
【公開(kāi)號(hào)】CN104679844
【申請(qǐng)?zhí)枴緾N201510076381
【發(fā)明人】凡時(shí)財(cái), 陳川, 鄒見(jiàn)效, 徐紅兵
【申請(qǐng)人】電子科技大學(xué)
【公開(kāi)日】2015年6月3日
【申請(qǐng)日】2015年2月13日