本發(fā)明涉及城市軌道交通故障檢測(cè)技術(shù)領(lǐng)域,具體涉及一種基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法。
背景技術(shù):
隨著國(guó)民經(jīng)濟(jì)的不斷發(fā)展,我國(guó)的城市化進(jìn)程逐步加快。城市人口的急劇增加,城市規(guī)模的擴(kuò)大,居民出行和物資交流的高度頻繁,致使城市交通系統(tǒng)面臨著嚴(yán)峻的局勢(shì)。城市軌道交通作為綜合交通體系中的關(guān)鍵運(yùn)輸方式,以其運(yùn)能大、效率高、能耗小等獨(dú)特的技術(shù)經(jīng)濟(jì)優(yōu)勢(shì),在緩解城市交通擁堵和社會(huì)經(jīng)濟(jì)發(fā)展中肩負(fù)重要使命。據(jù)近幾年地鐵運(yùn)營(yíng)過程中的故障統(tǒng)計(jì)可知,城市軌道交通作列車的車門系統(tǒng)作為其的關(guān)鍵子系統(tǒng),故障數(shù)量在列車各系統(tǒng)中排名第一,占列車總數(shù)的20%以上。
車門亞健康狀態(tài)是介于車門正常運(yùn)行和故障之間的中間狀態(tài),對(duì)其進(jìn)行識(shí)別存在著重要的意義。在車門打開和關(guān)閉運(yùn)動(dòng)過程中最重要的驅(qū)動(dòng)部件就是電機(jī)。電機(jī)工作狀態(tài)可以直接或間接反應(yīng)出車門整體的工作狀態(tài),采集到的電機(jī)數(shù)據(jù)為時(shí)間序列相關(guān)數(shù)據(jù),是我們進(jìn)行亞健康狀態(tài)識(shí)別的依據(jù)。
目前,時(shí)間序列常用的表示方法有離散小波變換、分段線性表示和符號(hào)化方法,其中,近年來最流行的方法可以說是符號(hào)聚合近似(symbolicaggregateapproximation,sax),它是由lin和keogh在2003年提出,并且在時(shí)間序列數(shù)據(jù)挖掘中得到廣泛的應(yīng)用并取得良好的效果。擴(kuò)展符號(hào)聚合近似(esax)是lkhagva等人在2006年提出,用于克服sax易丟失極值點(diǎn)的重要信息并在經(jīng)濟(jì)類時(shí)間序列挖掘中有比較好的效果。對(duì)于數(shù)據(jù)的分類識(shí)別,支持向量機(jī)(svm)在模式識(shí)別以及故障診斷等方面得到了廣泛的應(yīng)用,其本質(zhì)是采用核函數(shù)將特征映射到更高維的空間,并在高維空間中尋找最大間隔分類面。但是,時(shí)間序列符號(hào)化的缺點(diǎn)是不知道如何合理的離散序列,定義符號(hào)表示意義,和如何設(shè)計(jì)相應(yīng)的相似性度量,因此,有必要針對(duì)車門,進(jìn)行改進(jìn)處理的,是當(dāng)前需要解決的問題。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是克服現(xiàn)有的pwm轉(zhuǎn)dc(直流)電路,對(duì)rc低通濾波器的階數(shù)要求很高,且輸出的直流電壓存在較大紋波的問題。本發(fā)明的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,能夠有效的提取出車門電機(jī)時(shí)間序列數(shù)據(jù)的特征,并對(duì)車門開關(guān)門過程中出現(xiàn)的常見的亞健康準(zhǔn)確識(shí)別,具有很好的應(yīng)用前景。
為了達(dá)到上述目的,本發(fā)明所采用的技術(shù)方案是:
基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,其特征在于:包括以下步驟,
步驟(a),對(duì)軌道車輛門的亞健康及其對(duì)應(yīng)正常的數(shù)據(jù)進(jìn)行采集及預(yù)處理;
步驟(b),通過多尺度滑動(dòng)窗口方法,結(jié)合esax字符化算法對(duì)步驟(a)中所采集及預(yù)處理后的數(shù)據(jù)進(jìn)行處理,將其離散為第一字符串序列;
步驟(c),計(jì)算獲得正常開關(guān)門狀態(tài)下的模板曲線,并通過步驟(b)中相同的方法進(jìn)行離散為第二字符串序列,計(jì)算第二字符串序列與第一字符串序列之間的距離作為特征值,通過主成分分析對(duì)特征值進(jìn)行降維和特征選擇;
步驟(d),通過分層亞健康狀態(tài)識(shí)別算法由粗到細(xì)的逐步識(shí)別各種亞健康數(shù)據(jù),在第一層訓(xùn)練中,僅依據(jù)步驟(c)中的特征值判斷出ⅰ類亞健康數(shù)據(jù);在第二層訓(xùn)練中,對(duì)當(dāng)前軌道車輛門的實(shí)時(shí)數(shù)據(jù)提取基礎(chǔ)特征,并步驟(c)中所獲得的特征進(jìn)行融合,對(duì)正常數(shù)據(jù)及ⅱ類亞健康數(shù)據(jù)進(jìn)行區(qū)分。
前述的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,其特征在于:步驟(a),對(duì)軌道車輛門的亞健康及其對(duì)應(yīng)正常的數(shù)據(jù)八組,包括v型異常數(shù)據(jù)、電機(jī)組件松動(dòng)數(shù)據(jù)、對(duì)中尺寸變化小數(shù)據(jù)、對(duì)中尺寸變化大數(shù)據(jù)、上滑道外移數(shù)據(jù)、下?lián)蹁N橫向干涉數(shù)據(jù)、下?lián)蹁N縱向干涉數(shù)據(jù)、壓輪過壓數(shù)據(jù),且每組數(shù)據(jù)均包括電機(jī)轉(zhuǎn)角、轉(zhuǎn)速和電流三個(gè)參數(shù)值。
前述的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,其特征在于:步驟(a),預(yù)處理包括對(duì)八組的對(duì)齊和問題數(shù)據(jù)去除,所述問題數(shù)據(jù)包括轉(zhuǎn)速、轉(zhuǎn)角和電流數(shù)據(jù)的采樣點(diǎn)個(gè)數(shù)小于正常采樣數(shù)據(jù)一半,或者初始轉(zhuǎn)角不在正常范圍內(nèi)的數(shù)據(jù)。
前述的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,其特征在于:步驟(b),通過多尺度滑動(dòng)窗口方法,結(jié)合esax字符化算法對(duì)步驟(a)中所采集及預(yù)處理后的數(shù)據(jù)進(jìn)行處理,將其離散為第一字符串序列,包括以下步驟,
(b1),根據(jù)曲線變化的幅度原理,將開關(guān)門過程分為三個(gè)過程,包括啟動(dòng)段、勻速段和減速段;
(b2),通過多尺度滑動(dòng)窗口的重疊分割法,將采集及預(yù)處理后的數(shù)據(jù)的原始時(shí)間序列分割成若干個(gè)子時(shí)間序列,設(shè)滑動(dòng)步長(zhǎng)為1,子窗口的數(shù)量為|t|-n+1,其中,t為時(shí)間序列長(zhǎng)度,n為滑動(dòng)窗口的長(zhǎng)度;對(duì)啟動(dòng)段和減速段使用的滑動(dòng)窗口長(zhǎng)度為n1,勻速段使用的滑動(dòng)窗口長(zhǎng)度為n2,其中,n1=4*n2;
(b3),對(duì)于每個(gè)子時(shí)間序列提取各自的esax特征,首先標(biāo)準(zhǔn)化子時(shí)間序列,使其呈現(xiàn)高斯分布,使用paa(piecewiseaggregateapproximation,分段聚合近似)將每一個(gè)子時(shí)間序列分割成w個(gè)等寬度的小段,計(jì)算每小段的均值、最大值和最小值,并記錄其對(duì)應(yīng)的橫坐標(biāo),根據(jù)橫坐標(biāo)的次序?qū)ζ渌鶎?duì)應(yīng)的均值、最大值和最小值進(jìn)行排序,通過間斷點(diǎn)β={β1,β2,...,βn)等分高斯空間,并依次將排序之后的均值、最大值和最小值離散成第一字符串序列。
前述的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,其特征在于:步驟(c),計(jì)算獲得正常開關(guān)門狀態(tài)下的模板曲線,包括以下步驟,
(c1),計(jì)算各組正常數(shù)據(jù)的均值μ和標(biāo)準(zhǔn)差σ;
(c2),通過異常數(shù)據(jù)判斷公式μ±2σ確定上下邊界,去除越過邊界次數(shù)較多的正常數(shù)據(jù);
(c3),對(duì)剩下的數(shù)據(jù)進(jìn)行均值計(jì)算,將獲得正常開關(guān)門狀態(tài)下的模板曲線。
前述的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,其特征在于:步驟(c),計(jì)算第二字符串序列與第一字符串序列之間的距離,通過公式(1)計(jì)算得到,
其中,aesax={a1,...,an)為第一字符串序列;besax={b1,...,bn}為第二字符串序列;c為壓縮率,c=3*n/w,其中n為滑動(dòng)窗口的長(zhǎng)度,w為子時(shí)間序列分割的個(gè)數(shù),ai和bi是來自字符表v={v1,...,vn},如公式(2)所示,
其中,1≤i≤n,1≤j≤n,k為間斷點(diǎn)β={β1,β2,...,βn)之間的距離。
前述的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,其特征在于:步驟(c),通過主成分分析對(duì)特征值進(jìn)行降維和特征選擇,是通過計(jì)算特征值的協(xié)方差矩陣,獲得協(xié)方差矩陣的特征值以及特征向量,計(jì)算各特征值貢獻(xiàn)率,根據(jù)累計(jì)貢獻(xiàn)率組成新的特征矢量,完成降維和特征選擇。
前述的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,其特征在于:步驟(d),所述ⅰ類亞健康數(shù)據(jù)為相對(duì)易識(shí)別的亞健康,遠(yuǎn)離正常狀態(tài);ⅱ類亞健康數(shù)據(jù)為相對(duì)難識(shí)別的亞健康,靠近正常狀態(tài),各層用于訓(xùn)練識(shí)別的分類器選擇支持向量機(jī)svm分類器,其中,核函數(shù)選擇線性核,懲罰系數(shù)選擇1,在第二層訓(xùn)練中,對(duì)當(dāng)前軌道車輛門的實(shí)時(shí)數(shù)據(jù)提取基礎(chǔ)特征,基礎(chǔ)特征包括均值、歐式距離、協(xié)方差和相關(guān)系數(shù),將時(shí)間序列等間隔劃分,計(jì)算每小段的均值以及其與相對(duì)應(yīng)模板曲線的歐式距離、協(xié)方差和相關(guān)系數(shù)。
本發(fā)明的有益效果是:本發(fā)明的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,利用多尺度滑動(dòng)窗口離散字符化算法對(duì)軌道車輛門門電機(jī)的轉(zhuǎn)速、轉(zhuǎn)矩和電流進(jìn)行數(shù)據(jù)挖掘;通過計(jì)算與正常狀態(tài)下模板曲線的距離作為特征,并使用主成分分析對(duì)其降維,去除冗余信息,獲得分類性能較好的低維特征;然后使用分層亞健康狀態(tài)識(shí)別模型由粗到細(xì)對(duì)各種亞健康數(shù)據(jù)逐層進(jìn)行識(shí)別,最終實(shí)現(xiàn)開關(guān)門過程中亞健康狀態(tài)的識(shí)別,能夠有效的提取出車門電機(jī)時(shí)間序列數(shù)據(jù)的特征,并對(duì)車門開關(guān)門過程中出現(xiàn)的常見的亞健康準(zhǔn)確識(shí)別,具有很好的應(yīng)用前景。
附圖說明
圖1是本發(fā)明的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法的流程圖;
圖2是車輛門電機(jī)亞健康狀態(tài)(對(duì)中尺寸變化小)以及其對(duì)應(yīng)的正常狀態(tài)的轉(zhuǎn)角曲線圖,左為開門、右為關(guān)門;
圖3是車輛門電機(jī)亞健康狀態(tài)(對(duì)中尺寸變化小)以及其對(duì)應(yīng)的正常狀態(tài)的轉(zhuǎn)速曲線圖,左為開門、右為關(guān)門;
圖4是車輛門電機(jī)亞健康狀態(tài)(對(duì)中尺寸變化小)以及其對(duì)應(yīng)的正常狀態(tài)的電流曲線圖,左為開門、右為關(guān)門;
圖5是開門電流數(shù)據(jù)的啟動(dòng)段采用sax離散的結(jié)果示意圖;
圖6是開門電流數(shù)據(jù)的啟動(dòng)段采用esax離散的結(jié)果示意圖;
圖7是本發(fā)明的實(shí)施例前10個(gè)主成分貢獻(xiàn)率隨主成分變化趨勢(shì)圖;
圖8是本發(fā)明的實(shí)施例前四個(gè)主成分在不同的亞健康狀態(tài)下的分布示意圖一;
圖9是本發(fā)明的實(shí)施例前四個(gè)主成分在不同的亞健康狀態(tài)下的分布示意圖二;
圖10是本發(fā)明的實(shí)施例前四個(gè)主成分在不同的亞健康狀態(tài)下的分布示意圖三;
圖11是本發(fā)明的實(shí)施例前四個(gè)主成分在不同的亞健康狀態(tài)下的分布示意圖四;
圖12是的電流曲線分段示意圖,左為開門,右為關(guān)門。
具體實(shí)施方式
下面將結(jié)合說明書附圖,對(duì)本發(fā)明作進(jìn)一步的說明。
本發(fā)明的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,利用多尺度滑動(dòng)窗口離散字符化算法對(duì)軌道車輛門門電機(jī)的轉(zhuǎn)速、轉(zhuǎn)矩和電流進(jìn)行數(shù)據(jù)挖掘;通過計(jì)算與正常狀態(tài)下模板曲線的距離作為特征,并使用主成分分析對(duì)其降維,去除冗余信息,獲得分類性能較好的低維特征;然后使用分層亞健康狀態(tài)識(shí)別模型由粗到細(xì)對(duì)各種亞健康數(shù)據(jù)逐層進(jìn)行識(shí)別,最終實(shí)現(xiàn)開關(guān)門過程中亞健康狀態(tài)的識(shí)別,能夠有效的提取出車門電機(jī)時(shí)間序列數(shù)據(jù)的特征,并對(duì)車門開關(guān)門過程中出現(xiàn)的常見的亞健康準(zhǔn)確識(shí)別,如圖1所示,包括以下步驟,
步驟(a),對(duì)軌道車輛門的亞健康及其對(duì)應(yīng)正常的數(shù)據(jù)進(jìn)行采集及預(yù)處理,對(duì)軌道車輛門的亞健康及其對(duì)應(yīng)正常的數(shù)據(jù)八組,包括v型異常數(shù)據(jù)、電機(jī)組件松動(dòng)數(shù)據(jù)、對(duì)中尺寸變化小數(shù)據(jù)、對(duì)中尺寸變化大數(shù)據(jù)、上滑道外移數(shù)據(jù)、下?lián)蹁N橫向干涉數(shù)據(jù)、下?lián)蹁N縱向干涉數(shù)據(jù)、壓輪過壓數(shù)據(jù),且每組數(shù)據(jù)均包括電機(jī)轉(zhuǎn)角、轉(zhuǎn)速和電流三個(gè)參數(shù)值;預(yù)處理包括對(duì)八組的對(duì)齊和問題數(shù)據(jù)去除,所述問題數(shù)據(jù)包括轉(zhuǎn)速、轉(zhuǎn)角和電流數(shù)據(jù)的采樣點(diǎn)個(gè)數(shù)小于正常采樣數(shù)據(jù)一半,或者初始轉(zhuǎn)角不在正常范圍內(nèi)的數(shù)據(jù),本發(fā)明的具體實(shí)施例,為塞拉門,由內(nèi)置的采集設(shè)備對(duì)電機(jī)開關(guān)門過程中的各項(xiàng)數(shù)據(jù)實(shí)時(shí)采集,并通過無線傳輸?shù)姆绞?由外置監(jiān)測(cè)設(shè)備轉(zhuǎn)發(fā))將數(shù)據(jù)信息傳到數(shù)據(jù)中心服務(wù)器。主要針對(duì)實(shí)際運(yùn)行過程中軌道車輛門可能發(fā)生的各種常見亞健康進(jìn)行分析,通過對(duì)門結(jié)構(gòu)進(jìn)行微調(diào)整來模擬這些常見的亞健康狀態(tài),本發(fā)明的針對(duì)的亞健康類型主要有v型異常、電機(jī)組件松動(dòng)、對(duì)中尺寸變化小、對(duì)中尺寸變化大、上滑道外移、下?lián)蹁N橫向干涉、下?lián)蹁N縱向干涉和壓輪過壓這八種(相當(dāng)于測(cè)試樣本),由于每次的實(shí)驗(yàn)過程中軌道車輛門的調(diào)整都會(huì)對(duì)門的正常狀態(tài)造成影響,所以每一組亞健康都對(duì)應(yīng)一組正常數(shù)據(jù)(相當(dāng)于訓(xùn)練樣本);
步驟(b),通過多尺度滑動(dòng)窗口方法,結(jié)合esax字符化算法對(duì)步驟(a)中所采集及預(yù)處理后的數(shù)據(jù)進(jìn)行處理,將其離散為第一字符串序列,包括以下步驟,
(b1),根據(jù)曲線變化的幅度原理,將開關(guān)門過程分為三個(gè)過程,包括啟動(dòng)段、勻速段和減速段;
(b2),通過多尺度滑動(dòng)窗口的重疊分割法,將采集及預(yù)處理后的數(shù)據(jù)的原始時(shí)間序列分割成若干個(gè)子時(shí)間序列,設(shè)滑動(dòng)步長(zhǎng)為1,子窗口的數(shù)量為|t|-n+1,其中,t為時(shí)間序列長(zhǎng)度,n為滑動(dòng)窗口的長(zhǎng)度;對(duì)啟動(dòng)段和減速段使用的滑動(dòng)窗口長(zhǎng)度為n1,勻速段使用的滑動(dòng)窗口長(zhǎng)度為n2,其中,n1=4*n2;
(b3),對(duì)于每個(gè)子時(shí)間序列提取各自的esax特征,首先標(biāo)準(zhǔn)化子時(shí)間序列,使其呈現(xiàn)高斯分布,使用paa(piecewiseaggregateapproximation,分段聚合近似)將每一個(gè)子時(shí)間序列分割成w個(gè)等寬度的小段,計(jì)算每小段的均值、最大值和最小值,并記錄其對(duì)應(yīng)的橫坐標(biāo),根據(jù)橫坐標(biāo)的次序?qū)ζ渌鶎?duì)應(yīng)的均值、最大值和最小值進(jìn)行排序,通過間斷點(diǎn)β={β1,β2,...,βn)等分高斯空間,并依次將排序之后的均值、最大值和最小值離散成第一字符串序列;
步驟(c),計(jì)算獲得正常開關(guān)門狀態(tài)下的模板曲線,并通過步驟(b)中相同的方法進(jìn)行離散為第二字符串序列,計(jì)算第二字符串序列與第一字符串序列之間的距離作為特征值,通過主成分分析對(duì)特征值進(jìn)行降維和特征選擇,
其中,計(jì)算獲得正常開關(guān)門狀態(tài)下的模板曲線,包括以下步驟,
(c1),計(jì)算各組正常數(shù)據(jù)的均值μ和標(biāo)準(zhǔn)差σ;
(c2),通過異常數(shù)據(jù)判斷公式μ±2σ確定上下邊界,去除越過邊界次數(shù)較多的正常數(shù)據(jù);
(c3),對(duì)剩下的數(shù)據(jù)進(jìn)行均值計(jì)算,將獲得正常開關(guān)門狀態(tài)下的模板曲線。
計(jì)算第二字符串序列與第一字符串序列之間的距離,通過公式(1)計(jì)算得到,
其中,aesax={a1,...,an)為第一字符串序列;besax={b1,...,bn}為第二字符串序列;c為壓縮率,c=3*n/w,其中n為滑動(dòng)窗口的長(zhǎng)度,w為子時(shí)間序列分割的個(gè)數(shù),ai和bi是來自字符表v={v1,...,vn},如公式(2)所示,
其中,1≤i≤n,1≤j≤n,k為間斷點(diǎn)β={β1,β2,...,βn)之間的距離;
通過主成分分析(pca)對(duì)特征值進(jìn)行降維和特征選擇,是通過計(jì)算特征值的協(xié)方差矩陣,獲得協(xié)方差矩陣的特征值以及特征向量,計(jì)算各特征值貢獻(xiàn)率,根據(jù)累計(jì)貢獻(xiàn)率組成新的特征矢量,完成降維和特征選擇。
步驟(d),通過分層亞健康狀態(tài)識(shí)別算法由粗到細(xì)的逐步識(shí)別各種亞健康數(shù)據(jù),在第一層訓(xùn)練中,僅依據(jù)步驟(c)中的特征值判斷出ⅰ類亞健康數(shù)據(jù);在第二層訓(xùn)練中,對(duì)當(dāng)前軌道車輛門的實(shí)時(shí)數(shù)據(jù)提取基礎(chǔ)特征,并步驟(c)中所獲得的特征進(jìn)行融合,對(duì)正常數(shù)據(jù)及ⅱ類亞健康數(shù)據(jù)進(jìn)行區(qū)分,所述ⅰ類亞健康數(shù)據(jù)為相對(duì)易識(shí)別的亞健康,遠(yuǎn)離正常狀態(tài);ⅱ類亞健康數(shù)據(jù)為相對(duì)難識(shí)別的亞健康,靠近正常狀態(tài),各層用于訓(xùn)練識(shí)別的分類器選擇支持向量機(jī)svm分類器,其中,核函數(shù)選擇線性核,懲罰系數(shù)選擇1,在第二層訓(xùn)練中,對(duì)當(dāng)前軌道車輛門的實(shí)時(shí)數(shù)據(jù)提取基礎(chǔ)特征;
傳統(tǒng)特征通過總結(jié)時(shí)間序列中一個(gè)單一的值來描述時(shí)間序列,我們稱這些特征為基礎(chǔ)特征。常用的基礎(chǔ)特征類型包括3種:簡(jiǎn)單的靜態(tài)值、頻率主導(dǎo)特征和不同序列之間的相關(guān)特征,本發(fā)明基礎(chǔ)特征包括均值、歐式距離、協(xié)方差和相關(guān)系數(shù),將時(shí)間序列等間隔劃分,計(jì)算每小段的均值以及其與相對(duì)應(yīng)模板曲線的歐式距離、協(xié)方差和相關(guān)系數(shù),計(jì)算公式如下:
均值
歐式距離d12:
協(xié)方差cov(x,y):
相關(guān)系數(shù)r(x,y):
其中,n為x的數(shù)量,
下面根據(jù)本發(fā)明的基于時(shí)間序列數(shù)據(jù)挖掘的軌道車輛門亞健康狀態(tài)識(shí)別方法,介紹一具體實(shí)施例,如圖2-圖4所示,其中的一種亞健康狀態(tài)(對(duì)中尺寸變化小)以及其對(duì)應(yīng)的正常狀態(tài)曲線,左邊的圖為開門曲線,右邊的圖為關(guān)門曲線,從上到下分別為電機(jī)的轉(zhuǎn)角、轉(zhuǎn)速和電流曲線。開關(guān)門電流曲線的分段如圖12所示。從圖2-圖4中可以看出,亞健康曲線與正常曲線相似程度比較高,其中的轉(zhuǎn)角正常和亞健康曲線基本重合;轉(zhuǎn)速曲線和電流曲線在車門的開關(guān)門過程啟動(dòng)段和減速段有著較為明顯的差異,所以我們依據(jù)電流的曲線變化,將開門過程和關(guān)門過程分為3個(gè)階段,開關(guān)門電流曲線的分段如圖12所示。
傳統(tǒng)的時(shí)間序列符號(hào)化的方法(sax)有著很多優(yōu)勢(shì),比如快速和易于實(shí)現(xiàn),并且能夠采用現(xiàn)有的一些字符串的研究成果。但是,對(duì)于處理一些特殊的時(shí)間序列存在一些局限性,即對(duì)子序列段僅通過均值來進(jìn)行符號(hào)化難以反映子序列段內(nèi)更細(xì)微的特征,如極大值極小值、統(tǒng)計(jì)特征和趨勢(shì)特征等,其只能近似描述時(shí)間序列大致的特征;對(duì)于本發(fā)明中的軌道車輛門電機(jī)數(shù)據(jù),極值點(diǎn)的信息是進(jìn)行亞健康判斷的重要依據(jù),esax算法是對(duì)sax算法的拓展,其思想是在計(jì)算均值的時(shí)候同時(shí)引入最大值和最小值,以此來保留數(shù)時(shí)間序列數(shù)據(jù)中這些極端的模式,如圖5-圖6所示,對(duì)本發(fā)明中開門電流數(shù)據(jù)的啟動(dòng)段近似曲線使用這兩種方法分別進(jìn)行離散化,如圖6所示,為sax離散的結(jié)果,其中字符的種類數(shù)a為6,字符個(gè)數(shù)w為6,開門電流啟動(dòng)段序列被表示為“dcbcde”;如圖7所示,為esax離散的結(jié)果,其中a=6,w=6,開門電流啟動(dòng)段序列被表示為“bdfecbabbbcccdddee”。本實(shí)施例中,對(duì)于電機(jī)的轉(zhuǎn)角數(shù)據(jù)取滑動(dòng)窗口長(zhǎng)度n=120,字符個(gè)數(shù)w=5;對(duì)于電機(jī)的轉(zhuǎn)速和電流數(shù)據(jù)中的啟動(dòng)段和減速段選取滑動(dòng)窗口長(zhǎng)度n=30,字符個(gè)數(shù)w=5,勻速段選取滑動(dòng)窗口長(zhǎng)度n=120,字符個(gè)數(shù)w=5。
在以上的實(shí)施例中,通過以下步驟驗(yàn)證本發(fā)明的有效性:
首先,選取采集獲得的8種亞健康狀態(tài)下的電機(jī)數(shù)據(jù),每種亞健康狀態(tài)選取約40組數(shù)據(jù)(每組數(shù)據(jù)又分別包含開門數(shù)據(jù)和關(guān)門數(shù)據(jù)),每組正常數(shù)據(jù)也約40組分別與亞健康數(shù)據(jù)一一對(duì)應(yīng),將所有數(shù)據(jù)一半用作訓(xùn)練集,一半用作測(cè)試集,其中總訓(xùn)練集數(shù)據(jù)有330個(gè),總測(cè)試集數(shù)據(jù)有326個(gè);
其次,利用多尺度滑動(dòng)窗口的方法并結(jié)合esax算法對(duì)8種亞健康以及對(duì)應(yīng)的正常數(shù)據(jù)進(jìn)行分析,分別對(duì)每組數(shù)據(jù)的轉(zhuǎn)角、轉(zhuǎn)速和電流數(shù)據(jù)進(jìn)行特征提取,總共可以獲得600多個(gè)開門特征及關(guān)門特征,最終獲得的整體的特征已經(jīng)達(dá)到1200之多,構(gòu)成的特征空間維數(shù)很高,特征之間的相關(guān)性較大,且存在大量冗長(zhǎng)信息(主要存在于開關(guān)門過程中的均速段),直接將這些數(shù)據(jù)放入分類器進(jìn)行模式識(shí)別,不僅給分類的過程造成較大的負(fù)擔(dān),而且影響分類的準(zhǔn)確率。主成分分析(pca)通過映射的方法將特征變換維數(shù)較少的新特征,在保留主要特征的同時(shí)極大的降低特征的維數(shù);
然后,針對(duì)開關(guān)門整體特征參數(shù),通過求解協(xié)方差矩陣的特征值和對(duì)應(yīng)的特征向量,對(duì)得到的特征值做主成分分析,從而達(dá)到降維的目的,圖7列出了前10個(gè)主成分貢獻(xiàn)率隨主成分變化趨勢(shì)圖,分析圖7可知,從第5個(gè)主成分開始貢獻(xiàn)率的變化趨勢(shì)已趨于平穩(wěn)并逐漸接近于0,第一個(gè)主成分所占貢獻(xiàn)率最高,達(dá)到42%,前四個(gè)特征的累計(jì)貢獻(xiàn)率達(dá)到73%,相對(duì)的前20個(gè)累計(jì)貢獻(xiàn)率為90%。由此可見,前4個(gè)主成分可以很好的反映原本數(shù)據(jù)的大部分信息了,為了進(jìn)一步反映各主成分對(duì)軌道車輛門亞健康狀態(tài)的敏感程度,圖8-圖12給出了前四個(gè)主成分在不同的亞健康狀態(tài)下的分布,分析,圖8-圖12中的四個(gè)圖可知,第一個(gè)特征能準(zhǔn)確的區(qū)分對(duì)中尺寸變化大、對(duì)中變化大、上滑道外移和正常這四個(gè)狀態(tài),對(duì)其他幾種存在著混疊現(xiàn)象;其他3個(gè)特征僅對(duì)少部分的亞健康狀態(tài)有著很好的區(qū)分度,其他大部分的特征存在著明顯的混疊以及波動(dòng)較大。通過結(jié)合這些主要的特征,我們發(fā)現(xiàn)區(qū)分度最好的亞健康狀態(tài)為兩種對(duì)中尺寸變化、壓輪過壓和正常狀態(tài)。其次為上滑道外移、v型異常和下?lián)蹁N縱向干涉。而電機(jī)組松動(dòng)和下?lián)蹁N橫向干涉的區(qū)分度較差,綜上所述,我們將電機(jī)組松動(dòng)和下?lián)蹁N橫向干涉歸為ⅱ類亞健康,其他6種歸為ⅰ類亞健康;所以在分層識(shí)別算法的第一層中,我們首先對(duì)6種ⅰ類亞健康進(jìn)行區(qū)分,接著結(jié)合基礎(chǔ)特征,對(duì)正常數(shù)據(jù)和剩下的ⅱ類亞健康狀態(tài)做進(jìn)一步識(shí)別。
接著,通過分層識(shí)別的算法逐層對(duì)各類亞健康進(jìn)行識(shí)別,在第一層中,將ⅱ類亞健康和正常數(shù)據(jù)歸為一類,依據(jù)距離表示的特征集,選取降維后的前20個(gè)特征并通過svm對(duì)訓(xùn)練集進(jìn)行訓(xùn)練,并對(duì)測(cè)試集數(shù)據(jù)識(shí)別,目的是對(duì)區(qū)分度較好的ⅰ類亞健康進(jìn)行區(qū)分;在第二層中,提取剩余數(shù)據(jù)基礎(chǔ)特征,進(jìn)行歸一化處理后,與距離表示的特征集進(jìn)行融合,采用融合特征對(duì)正常數(shù)據(jù)和ⅱ類亞健康進(jìn)行訓(xùn)練,并對(duì)測(cè)試集剩下的數(shù)據(jù)進(jìn)行識(shí)別。通過這兩層的訓(xùn)練識(shí)別,對(duì)各種亞健康都進(jìn)行了區(qū)分。本實(shí)施例中,分別依據(jù)開門特征、關(guān)門特征和整體特征進(jìn)行亞健康狀態(tài)的識(shí)別,各層的識(shí)別結(jié)果表1所示;
表1測(cè)試樣本的分類結(jié)果
分析上表可知,開門特征識(shí)別率略高于關(guān)門特征,整體特征包含更多的特征量,其識(shí)別率明顯高于其他兩類單獨(dú)特征。在第一層中,由于將區(qū)分度較差的亞健康數(shù)據(jù)和正常數(shù)據(jù)歸為一類,先區(qū)分較為明顯的ⅰ類亞健康,故三種特征的識(shí)別率都比較高,其中整體特征在這層的識(shí)別結(jié)果全部正確;第二層中,亞健康差別較小,錯(cuò)誤明顯增多,識(shí)別率很大程度的下降。由此可見,依靠整體特征進(jìn)行亞健康狀態(tài)的識(shí)別比單個(gè)特征的識(shí)別性能好上很多。從表可知,整體特征獲得了比較好的識(shí)別結(jié)果,僅有3個(gè)測(cè)試樣本被分類錯(cuò)誤。
以上顯示和描述了本發(fā)明的基本原理、主要特征及優(yōu)點(diǎn)。本行業(yè)的技術(shù)人員應(yīng)該了解,本發(fā)明不受上述實(shí)施例的限制,上述實(shí)施例和說明書中描述的只是說明本發(fā)明的原理,在不脫離本發(fā)明精神和范圍的前提下,本發(fā)明還會(huì)有各種變化和改進(jìn),這些變化和改進(jìn)都落入要求保護(hù)的本發(fā)明范圍內(nèi)。本發(fā)明要求保護(hù)范圍由所附的權(quán)利要求書及其等效物界定。