一種時間序列語義化預(yù)測方法及系統(tǒng)的制作方法
【專利摘要】本發(fā)明提供一種時間序列語義化預(yù)測方法及系統(tǒng)。所述時間序列語義化預(yù)測方法包括:獲取一個系統(tǒng)的M個時間序列,每個時間序列包括N個數(shù)值,構(gòu)成一個M×N觀測狀態(tài)矩陣,采用預(yù)設(shè)策略將所述數(shù)值分成L個類別,每個類別分別對應(yīng)著一個語義化標(biāo)簽狀態(tài);根據(jù)數(shù)值與語義化標(biāo)簽狀態(tài)的對應(yīng)關(guān)系構(gòu)建一個與所述觀測狀態(tài)矩陣相對應(yīng)的一個M×N隱含狀態(tài)矩陣;根據(jù)所述觀測狀態(tài)矩陣以及隱含狀態(tài)矩陣計算得到相應(yīng)的隱馬爾科夫模型參數(shù);獲取系統(tǒng)的當(dāng)前時間序列的數(shù)值作為當(dāng)前觀測狀態(tài)值,根據(jù)所述隱馬爾科夫模型參數(shù)計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值概率分布。本發(fā)明可以獲得快速并直觀的預(yù)測結(jié)果。
【專利說明】
-種時間序列語義化預(yù)測方法及系統(tǒng)
技術(shù)領(lǐng)域
[0001] 本發(fā)明設(shè)及一種預(yù)測分析領(lǐng)域,特別是設(shè)及一種時間序列語義化預(yù)測方法及系 統(tǒng)。
【背景技術(shù)】
[0002] 隨著物聯(lián)傳感網(wǎng)的快速發(fā)展,越來越多工業(yè)控制系統(tǒng)接入到物聯(lián)網(wǎng)中,通過各式 各樣的傳感器,定時將系統(tǒng)的狀態(tài)傳輸?shù)椒?wù)端或云端,由此可W向用戶實時展示受控系 統(tǒng)的狀態(tài)指標(biāo)。如果將運(yùn)些數(shù)據(jù)結(jié)合對應(yīng)的時間戳存儲起來,那么運(yùn)些歷史數(shù)據(jù)就形成了 一個時間序列。人們通過分析時間序列的模式規(guī)律,能夠較精確地找出相應(yīng)系統(tǒng)的內(nèi)在統(tǒng) 計特性和發(fā)展規(guī)律,通過對運(yùn)些統(tǒng)計特性和規(guī)律建模,可W用于對系統(tǒng)未來行為進(jìn)行預(yù)報。 方便用戶及時的做出決策,能夠更快速的對受控系統(tǒng)做出調(diào)整,從而避免受控系統(tǒng)在非正 常狀態(tài)下工作而造成損失。在時間序列預(yù)測中目前使用較為廣泛的是自回歸滑動平均模型 (Auto Regressive Moving Average Model ,ARMA),模型參量法高分辨率譜分析方法之一。 運(yùn)種方法是研究平穩(wěn)隨機(jī)過程有理譜的典型方法,適用于很大一類實際問題,但其參數(shù)估 算比較繁瑣,特別是在參數(shù)估計是非線性的時候,難W求得ARMA模型參數(shù)的準(zhǔn)確估值。雖然 從理論上推出了一些ARMA模型參數(shù)的最佳估計方法,但它們存在計算量大和不能保證收斂 的缺點。
[0003] 鑒于此,如何找到一種更快捷有效的時間序列預(yù)測方案獲取用戶需要的預(yù)測結(jié)果 就成了本領(lǐng)域技術(shù)人員亟待解決的問題。
【發(fā)明內(nèi)容】
[0004] 鑒于W上所述現(xiàn)有技術(shù)的缺點,本發(fā)明的目的在于提供一種時間序列語義化預(yù)測 方法及系統(tǒng),用于解決現(xiàn)有技術(shù)中的時間序列預(yù)測方法計算量大和不能保證收斂的問題。
[0005] 為實現(xiàn)上述目的及其他相關(guān)目的,本發(fā)明提供一種時間序列語義化預(yù)測方法,所 述時間序列語義化預(yù)測方法包括:獲取一個系統(tǒng)的M個時間序列,每個時間序列包括N個數(shù) 值,構(gòu)成一個M X N觀測狀態(tài)矩陣,M與N為自然數(shù);采用預(yù)設(shè)策略將所述數(shù)值分成L個類別,L 為自然數(shù),每個類別分別對應(yīng)著一個語義化標(biāo)簽狀態(tài);根據(jù)數(shù)值與語義化標(biāo)簽狀態(tài)的對應(yīng) 關(guān)系構(gòu)建一個與所述觀測狀態(tài)矩陣相對應(yīng)的一個MXN隱含狀態(tài)矩陣;根據(jù)所述觀測狀態(tài)矩 陣W及隱含狀態(tài)矩陣計算得到相應(yīng)的隱馬爾科夫模型參數(shù),所述隱馬爾科夫模型參數(shù)包 括:與所述L個類別一一對應(yīng)的觀測狀態(tài)轉(zhuǎn)移概率矩陣、一個L X L隱含狀態(tài)轉(zhuǎn)移概率矩陣; 獲取系統(tǒng)的當(dāng)前時間序列的數(shù)值作為當(dāng)前觀測狀態(tài)值,根據(jù)所述隱馬爾科夫模型參數(shù)計算 出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值概率分布。
[0006] 可選地,所述預(yù)設(shè)策略包括:采用K均值聚類算法進(jìn)行聚類分析。
[0007] 可選地,計算觀測狀態(tài)轉(zhuǎn)移概率矩陣的具體實現(xiàn)包括:所述時間序列的數(shù)值為連 續(xù)實數(shù),分別對各個類別對應(yīng)的數(shù)值區(qū)域進(jìn)行核密度估計,得出各個類別值的概率分布函 數(shù),進(jìn)而得到各個類別的觀測狀態(tài)轉(zhuǎn)移概率矩陣。
[0008] 可選地,根據(jù)所述隱馬爾科夫模型參數(shù)計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀 態(tài)值的具體實現(xiàn)包括:將所述當(dāng)前觀測狀態(tài)值轉(zhuǎn)換成語義化標(biāo)簽狀態(tài)值,結(jié)合所述隱馬爾 科夫模型參數(shù)中的隱含狀態(tài)轉(zhuǎn)移概率矩陣計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值 的概率分布。
[0009] 可選地,所述時間序列語義化預(yù)測方法還包括:根據(jù)所述隱馬爾科夫模型參數(shù)計 算出系統(tǒng)下一個時刻的每一個數(shù)值的概率分布。
[0010] 可選地,所述隱馬爾科夫模型參數(shù)還包括一個1 XL初始狀態(tài)概率矩陣。
[0011] 本發(fā)明提供一種時間序列語義化預(yù)測系統(tǒng),所述時間序列語義化預(yù)測系統(tǒng)包括: 建模數(shù)據(jù)獲取模塊,用于獲取一個系統(tǒng)的M個時間序列,每個時間序列包括N個數(shù)值,構(gòu)成一 個M X N觀測狀態(tài)矩陣,M與N為自然數(shù);采用預(yù)設(shè)策略將所述數(shù)值分成L個類別,L為自然數(shù), 每個類別分別對應(yīng)著一個語義化標(biāo)簽狀態(tài);根據(jù)數(shù)值與語義化標(biāo)簽狀態(tài)的對應(yīng)關(guān)系構(gòu)建一 個與所述觀測狀態(tài)矩陣相對應(yīng)的一個MXN隱含狀態(tài)矩陣;模型參數(shù)計算模塊,用于根據(jù)所 述觀測狀態(tài)矩陣W及隱含狀態(tài)矩陣計算得到相應(yīng)的隱馬爾科夫模型參數(shù),所述隱馬爾科夫 模型參數(shù)包括:與所述L個類別一一對應(yīng)的觀測狀態(tài)轉(zhuǎn)移概率矩陣、一個L X L隱含狀態(tài)轉(zhuǎn)移 概率矩陣;預(yù)測結(jié)果計算模塊,用于獲取系統(tǒng)的當(dāng)前時間序列的數(shù)值作為當(dāng)前觀測狀態(tài)值, 根據(jù)所述隱馬爾科夫模型參數(shù)計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值概率分布。
[0012] 可選地,所述預(yù)設(shè)策略包括:采用K均值聚類算法進(jìn)行聚類分析。
[0013] 可選地,計算觀測狀態(tài)轉(zhuǎn)移概率矩陣的具體實現(xiàn)包括:所述時間序列的數(shù)值為連 續(xù)實數(shù),分別對各個類別對應(yīng)的數(shù)值區(qū)域進(jìn)行核密度估計,得出各個類別值的概率分布函 數(shù),進(jìn)而得到各個類別的觀測狀態(tài)轉(zhuǎn)移概率矩陣。
[0014] 可選地,根據(jù)所述隱馬爾科夫模型參數(shù)計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀 態(tài)值的具體實現(xiàn)包括:將所述當(dāng)前觀測狀態(tài)值轉(zhuǎn)換成語義化標(biāo)簽狀態(tài)值,結(jié)合所述隱馬爾 科夫模型參數(shù)中的隱含狀態(tài)轉(zhuǎn)移概率矩陣計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值 的概率分布。
[0015] 可選地,所述時間序列語義化預(yù)測方法還包括:根據(jù)所述隱馬爾科夫模型參數(shù)計 算出系統(tǒng)下一個時刻的每一個數(shù)值的概率分布。
[0016] 可選地,所述隱馬爾科夫模型參數(shù)還包括一個1 XL初始狀態(tài)概率矩陣。
[0017] 如上所述,本發(fā)明的一種時間序列語義化預(yù)測方法及系統(tǒng),具有W下有益效果:將 數(shù)據(jù)序列分段符號化后使用語義化標(biāo)簽的方式,然后對時間序列進(jìn)行預(yù)測分析,由于很多 時候,用戶真正需要的預(yù)測結(jié)果是語義化標(biāo)簽值,而本發(fā)明可W快速獲取語義化標(biāo)簽值的 預(yù)測結(jié)果,從而獲得快速并直觀的預(yù)測結(jié)果。本發(fā)明克服了傳統(tǒng)的時間序列預(yù)測方法由于 直接對原始數(shù)值數(shù)據(jù)進(jìn)行預(yù)測分析導(dǎo)致的不僅處理數(shù)據(jù)的維度較高導(dǎo)致計算開銷較大預(yù) 測成本高而且結(jié)果缺乏語義化的問題。
【附圖說明】
[0018] 圖1顯示為本發(fā)明的時間序列語義化預(yù)測方法的一實施例的流程示意圖。
[0019] 圖2顯示為本發(fā)明的時間序列語義化預(yù)測方法的一實施例的隱含狀態(tài)轉(zhuǎn)移概率矩 陣的計算原理示意圖。
[0020] 圖3顯示為本發(fā)明的時間序列語義化預(yù)測系統(tǒng)的一實施例的模塊示意圖。
[0021] 圖4顯示為本發(fā)明的時間序列語義化預(yù)測系統(tǒng)的一實施例的應(yīng)用場景示意圖。
[0022] 元件標(biāo)號說明
[0023] 1 時間序列語義化預(yù)測系統(tǒng)
[0024] 11 建模數(shù)據(jù)獲取模塊
[0025] 12 模型參數(shù)計算模塊
[00%] 13 預(yù)測結(jié)果計算模塊
[0027] Sl ~S3 步驟
【具體實施方式】
[0028] W下通過特定的具體實例說明本發(fā)明的實施方式,本領(lǐng)域技術(shù)人員可由本說明書 所掲露的內(nèi)容輕易地了解本發(fā)明的其他優(yōu)點與功效。本發(fā)明還可W通過另外不同的具體實 施方式加W實施或應(yīng)用,本說明書中的各項細(xì)節(jié)也可W基于不同觀點與應(yīng)用,在沒有背離 本發(fā)明的精神下進(jìn)行各種修飾或改變。
[0029] 需要說明的是,本實施例中所提供的圖示僅W示意方式說明本發(fā)明的基本構(gòu)想, 遂圖式中僅顯示與本發(fā)明中有關(guān)的組件而非按照實際實施時的組件數(shù)目、形狀及尺寸繪 審IJ,其實際實施時各組件的型態(tài)、數(shù)量及比例可為一種隨意的改變,且其組件布局型態(tài)也可 能更為復(fù)雜。
[0030] 本發(fā)明應(yīng)用了隱馬爾可夫模型巧idden Markov Model,HMM)來實現(xiàn)時間序列的語 義化預(yù)測。隱馬爾可夫模型化idden Markov Model,HMM)是一種統(tǒng)計模型,它用來描述一個 含有隱含未知參數(shù)的馬爾可夫過程。其難點是從可觀察的參數(shù)中確定該過程的隱含參數(shù), 然后利用運(yùn)些參數(shù)來作進(jìn)一步的分析。隱馬爾可夫模型的狀態(tài)不能直接觀察到,但能通過 觀測向量序列觀察到,每個觀測向量都是通過某些概率密度分布表現(xiàn)為各種狀態(tài),每一個 觀測向量是由一個具有相應(yīng)概率密度分布的狀態(tài)序列產(chǎn)生。所W,隱馬爾可夫模型是一個 雙重隨機(jī)過程,具有一定狀態(tài)數(shù)的隱馬爾可夫鏈和顯示隨機(jī)函數(shù)集。
[0031] 本發(fā)明提供一種時間序列語義化預(yù)測方法。在一個實施例中,如圖1所示,所述時 間序列語義化預(yù)測方法包括:
[003^ 步驟Sl,獲取一個系統(tǒng)的M個時間序列,每個時間序列包括N個數(shù)值,構(gòu)成一個M X N 觀測狀態(tài)矩陣,M與N為自然數(shù);采用預(yù)設(shè)策略將所述數(shù)值分成L個類別,L為自然數(shù),每個類 別分別對應(yīng)著一個語義化標(biāo)簽狀態(tài);根據(jù)數(shù)值與語義化標(biāo)簽狀態(tài)的對應(yīng)關(guān)系構(gòu)建一個與所 述觀測狀態(tài)矩陣相對應(yīng)的一個MXN隱含狀態(tài)矩陣。所述隱馬爾科夫模型參數(shù)還包括一個1 X L初始狀態(tài)概率矩陣。在一個實施例中,所述預(yù)設(shè)策略包括:采用K均值聚類算法進(jìn)行聚類 分析。對多個時間序列的數(shù)值,依據(jù)預(yù)測所需的精細(xì)程度,采用K均值聚類算法進(jìn)行聚類分 析。將數(shù)據(jù)分為多個類別,并對每個類別定義語義化標(biāo)簽,如:高、偏高、正常、偏低、低等。聚 類是一個將數(shù)據(jù)集中在某些方面相似的數(shù)據(jù)成員進(jìn)行分類組織的過程,聚類就是一種發(fā)現(xiàn) 運(yùn)種內(nèi)在結(jié)構(gòu)的技術(shù),聚類技術(shù)經(jīng)常被稱為無監(jiān)督學(xué)習(xí)。K均值聚類是最著名的劃分聚類算 法,由于簡潔和效率使得他成為所有聚類算法中最廣泛使用的。給定一個數(shù)據(jù)點集合和需 要的聚類數(shù)目K,K由用戶指定,K均值算法根據(jù)某個距離函數(shù)反復(fù)把數(shù)據(jù)分入K個聚類中。
[0033]步驟S2,根據(jù)所述觀測狀態(tài)矩陣W及隱含狀態(tài)矩陣計算得到相應(yīng)的隱馬爾科夫模 型參數(shù),所述隱馬爾科夫模型參數(shù)包括:與所述L個類別一一對應(yīng)的觀測狀態(tài)轉(zhuǎn)移概率矩 陣、一個LXL隱含狀態(tài)轉(zhuǎn)移概率矩陣。在一個實施例中,計算觀測狀態(tài)轉(zhuǎn)移概率矩陣(也稱 為觀測狀態(tài)轉(zhuǎn)移矩陣)的具體實現(xiàn)包括:所述時間序列的數(shù)值為連續(xù)實數(shù),分別對各個類別 對應(yīng)的數(shù)值區(qū)域進(jìn)行核密度估計,得出各個類別值的概率分布函數(shù),進(jìn)而得到各個類別的 觀測狀態(tài)轉(zhuǎn)移概率矩陣。語義化序列中狀態(tài)是HMM中實際隱含的狀態(tài),無法直接通過觀測得 到。而時間序列本身可W通過直接觀測而得到。由于本發(fā)明使用的方法,是由某一個類直接 映射到某個既定的符號,該類由類中的樣本點共同組成,并且在實際應(yīng)用中觀測值一般屬 于連續(xù)的實數(shù)。因此當(dāng)隱含狀態(tài)確定后,實際觀測的數(shù)值應(yīng)該服從該類的密度分布。不屬于 該類的數(shù)值,其概率密度應(yīng)該為O。有時觀測狀態(tài)轉(zhuǎn)移概率矩陣也稱為狀態(tài)輸出矩陣。
[0034] 在一個實施例中,當(dāng)本系統(tǒng)獲得的時間序列為實數(shù)集中的可觀測的數(shù)值時,該觀 測狀態(tài)概率矩陣不能用離散的矩陣來表示,需要使用概率密度函數(shù)來表示??蒞采用核密 度估計的方式,估計得各個類的概率密度函數(shù),即為各個語義化符號的可觀測狀態(tài)轉(zhuǎn)移概 率。在HMM中隱含狀態(tài)轉(zhuǎn)移概率矩陣A描述了 HMM模型中各個隱含狀態(tài)之間的轉(zhuǎn)移概率,其中 Aij = P(sj I Si),,j《N,N為隱藏狀態(tài)個數(shù),表示在t時刻、狀態(tài)為Si的條件下,在t+1時刻 狀態(tài)是Sj的概率。由于實施例中使用的數(shù)據(jù)集中的可觀測的數(shù)值OER,因此該觀測狀態(tài)概 率矩陣的值不能用離散的方法來計算,需要使用概率密度函數(shù)值來代替。本發(fā)明使用核密 度估計的方式,估計得各個類的概率密度函數(shù),即為各個語義化符號的可觀測狀態(tài)轉(zhuǎn)移概 率。
[0035] 在一個實施例中,對原始時間序列數(shù)據(jù)集,根據(jù)第一步定義的符號標(biāo)簽W此來減 少數(shù)據(jù)集的可能狀態(tài)值。并將新的序列作為HMM的隱藏狀態(tài)集,求得該時間序列數(shù)據(jù)集的隱 含狀態(tài)轉(zhuǎn)移矩陣A。對各個類進(jìn)行核密度估計化ernel Density Estimation,KDE),得出其 分布函數(shù),即某個符號的概率分布函數(shù),W此作為HMM的狀態(tài)轉(zhuǎn)移概率矩陣B。并求得各個序 列的初始狀態(tài)概率分布n,至此數(shù)據(jù)集的HMM可W表示為A=U,A,B)。在一個實施例中,采用 K-均值聚類算法對合成控制時間序列數(shù)據(jù)集的數(shù)值進(jìn)行聚類,得到5個類別,分別對應(yīng) r低","偏低","正常","偏高","高"}5個設(shè)定的語義化符號。使用核密度估計獲得各個語 義化字符的觀測狀態(tài)轉(zhuǎn)移概率密度。并統(tǒng)計計算出時5的隱含狀態(tài)轉(zhuǎn)移矩陣,和1巧的初始 概率矩陣,構(gòu)建成數(shù)據(jù)集的隱馬爾科夫模型。
[0036] 步驟S3,獲取系統(tǒng)的當(dāng)前時間序列的數(shù)值作為當(dāng)前觀測狀態(tài)值,根據(jù)所述隱馬爾 科夫模型參數(shù)計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值概率分布。在一個實施例中, 根據(jù)所述隱馬爾科夫模型參數(shù)計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值的具體實現(xiàn) 包括:將所述當(dāng)前觀測狀態(tài)值轉(zhuǎn)換成語義化標(biāo)簽狀態(tài)值,結(jié)合所述隱馬爾科夫模型參數(shù)中 的隱含狀態(tài)轉(zhuǎn)移概率矩陣計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值的概率分布。
[0037] 在一個實施例中,所述時間序列語義化預(yù)測方法還包括:根據(jù)所述隱馬爾科夫模 型參數(shù)計算出系統(tǒng)下一個時刻的每一個數(shù)值的概率分布。具體地,將所述當(dāng)前觀測狀態(tài)值 轉(zhuǎn)換成語義化標(biāo)簽狀態(tài)值,結(jié)合所述隱馬爾科夫模型參數(shù)中的隱含狀態(tài)轉(zhuǎn)移概率矩陣計算 出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值的概率分布;然后,再進(jìn)一步結(jié)合所述隱馬爾科 夫模型參數(shù)中的觀測狀態(tài)轉(zhuǎn)移概率矩陣計算出下一個時刻的每一個數(shù)值的概率分布。
[0038] 在一個實施例中,所述時間序列語義化預(yù)測方法包括:1,獲取一個系統(tǒng)的5個時間 序列,每個時間序列包括6個數(shù)值,構(gòu)成一個5X6觀測狀態(tài)矩陣。所述5X6觀測狀態(tài)矩陣
其中每一行代表一個時間序列)。
[0039] 2,采用預(yù)設(shè)策略將所述數(shù)值分成3個類別,每個類別分別對應(yīng)著一個語義化標(biāo)簽 狀態(tài);根據(jù)數(shù)值與語義化標(biāo)簽狀態(tài)的對應(yīng)關(guān)系構(gòu)建一個與所述觀測狀態(tài)矩陣相對應(yīng)的一個 5 X 6隱含狀態(tài)矩陣。具體地,所有數(shù)值進(jìn)行K-均值化-Means)聚類,將數(shù)值分成多個類簇。并 根據(jù)實際情況對不同的類使用不同的語義化符號,進(jìn)行標(biāo)識。語義化標(biāo)識過程使用構(gòu)造數(shù) 據(jù)集的過程如下,將矩陣的所有元素加入一個1*30(5*6 = 30)的向量Vt中,使用KMEANS(Vt, 3)中,其中3表示需要將該數(shù)據(jù)集分成3類??蒞得到3個類簇Ci(1,2,3),C2(7,8),C3(14,15, 16)。假設(shè)使用"低"、"中"、"高"來代表運(yùn)=個類的話,那么就可W把Ts也映射到隱含狀態(tài)矩 陣:
[0040]
>
[0041] 3,根據(jù)所述觀測狀態(tài)矩陣W及隱含狀態(tài)矩陣計算得到相應(yīng)的隱馬爾科夫模型參 數(shù),所述隱馬爾科夫模型參數(shù)包括:與所述3個類別一一對應(yīng)的觀測狀態(tài)轉(zhuǎn)移概率矩陣(可 W簡稱為觀測狀態(tài)轉(zhuǎn)移矩陣)、一個3 X 3隱含狀態(tài)轉(zhuǎn)移概率矩陣(也可簡稱為隱含狀態(tài)轉(zhuǎn)移 矩陣)。其中,可W知道"低"由U,2,3},"中"由{7,8},"高"由{14,15,16}等觀測狀態(tài)映射 到。對于離散序列可W使用統(tǒng)計方法求得各個實際觀測值,在他所在類的占比。比如類別 "低"中"r出現(xiàn)的次數(shù)為1、"2"出現(xiàn)次數(shù)為2,"3"出現(xiàn)的次數(shù)為6。由此可W得到"低"的觀測 狀態(tài)轉(zhuǎn)移概率矩陣為{1/9,2/9,6/9 },依次為當(dāng)隱含狀態(tài)為低時,觀測狀態(tài)為1,2,3的概率。 其他類別W此類推得到"中"和"高"的觀測狀態(tài)轉(zhuǎn)移概率矩陣。得到"中"的觀測狀態(tài)轉(zhuǎn)移概 率矩陣為{1/2,1/2},依次為當(dāng)隱含狀態(tài)為中時,觀測狀態(tài)為7,8的概率;得到"高"的觀測狀 態(tài)轉(zhuǎn)移概率矩陣為{4/9,4/9,1/9},依次為當(dāng)隱含狀態(tài)為高時,觀測狀態(tài)為14,15,16的概 率。模型中存在巧巾狀態(tài),則表示=種狀態(tài)之間的轉(zhuǎn)換關(guān)系的3X3隱含狀態(tài)轉(zhuǎn)移概率矩陣可
U而對應(yīng)得到如下的3 X 3隱含狀態(tài)轉(zhuǎn)移概率矩陣:
[0042]
[0043] 4,可W進(jìn)一步計算得到初始狀態(tài)概率矩陣,對每個時間序列的初始狀態(tài)進(jìn)行統(tǒng) 計,可W求得初始狀態(tài)(即觀測狀態(tài)矩陣中每行的第一列的值)為"低"的序列數(shù)目是3,初始 狀態(tài)為"中"的序列數(shù)目為2,初始狀態(tài)為"高"的序列數(shù)目為0。那么此時的初始狀態(tài)概率矩 陣為{3/5,2/5,0/5}。
[0044] 5,獲取系統(tǒng)的當(dāng)前時間序列的數(shù)值作為當(dāng)前觀測狀態(tài)值,根據(jù)所述隱馬爾科夫模 型參數(shù)計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值概率分布。例如,獲取得到當(dāng)前時間 序列[7,3,3,7,8,14],使用語義化規(guī)則可則央射成[中,低,低,中,中,高],那么預(yù)測下一刻 的隱含狀態(tài),即隱含狀態(tài)矩陣中從高轉(zhuǎn)化到其他狀態(tài)的概率分布。最后的狀態(tài)為高,則下一 個狀態(tài)是"低"的概率1/8,為"中"的概率3/8,為"高"的概率4/8。下兩個狀態(tài)可W分成3*2種 情況,為"低,低"的概率為1/8*2/6,為"低,中"的概率為"1/8*2/6",為"中,低"的概率為3/ 8*3/11,W此類推。還可W進(jìn)一步下一個時刻的每一個數(shù)值的概率分布,則下一個數(shù)字(觀 測狀態(tài)值)即為預(yù)測到的隱藏狀態(tài)概率與該狀態(tài)的觀測狀態(tài)轉(zhuǎn)移概率矩陣的乘積。比如下 一個狀態(tài)預(yù)測為"中"的概率是3/8,則可能值為7的概率是3/8*1/2,為8的概率是3/8*1/2, W此類推。
[0045] 本發(fā)明提供一種時間序列語義化預(yù)測系統(tǒng),所述時間序列語義化預(yù)測系統(tǒng)可W應(yīng) 用如上所述的時間序列語義化預(yù)測方法。在一個實施例中,如圖3所示,所述時間序列語義 化預(yù)測系統(tǒng)包括建模數(shù)據(jù)獲取模塊11、模型參數(shù)計算模塊12W及預(yù)測結(jié)果計算模塊13。其 中:
[0046] 建模數(shù)據(jù)獲取模塊11用于獲取一個系統(tǒng)的M個時間序列,每個時間序列包括N個數(shù) 值,構(gòu)成一個M X N觀測狀態(tài)矩陣,M與N為自然數(shù);采用預(yù)設(shè)策略將所述數(shù)值分成L個類別,L 為自然數(shù),每個類別分別對應(yīng)著一個語義化標(biāo)簽狀態(tài);根據(jù)數(shù)值與語義化標(biāo)簽狀態(tài)的對應(yīng) 關(guān)系構(gòu)建一個與所述觀測狀態(tài)矩陣相對應(yīng)的一個MXN隱含狀態(tài)矩陣。所述隱馬爾科夫模型 參數(shù)還包括一個1 X L初始狀態(tài)概率矩陣。在一個實施例中,所述預(yù)設(shè)策略包括:采用K均值 聚類算法進(jìn)行聚類分析。
[0047] 模型參數(shù)計算模塊12與建模數(shù)據(jù)獲取模塊11相連,用于根據(jù)所述觀測狀態(tài)矩陣W 及隱含狀態(tài)矩陣計算得到相應(yīng)的隱馬爾科夫模型參數(shù),所述隱馬爾科夫模型參數(shù)包括:與 所述L個類別一一對應(yīng)的觀測狀態(tài)轉(zhuǎn)移概率矩陣、一個LXL隱含狀態(tài)轉(zhuǎn)移概率矩陣。在一個 實施例中,計算觀測狀態(tài)轉(zhuǎn)移概率矩陣的具體實現(xiàn)包括:所述時間序列的數(shù)值為連續(xù)實數(shù), 分別對各個類別對應(yīng)的數(shù)值區(qū)域進(jìn)行核密度估計,得出各個類別值的概率分布函數(shù),進(jìn)而 得到各個類別的觀測狀態(tài)轉(zhuǎn)移概率矩陣。
[0048] 預(yù)測結(jié)果計算模塊13與模型參數(shù)計算模塊12相連,用于獲取系統(tǒng)的當(dāng)前時間序列 的數(shù)值作為當(dāng)前觀測狀態(tài)值,根據(jù)所述隱馬爾科夫模型參數(shù)計算出所述系統(tǒng)下一時刻的語 義化標(biāo)簽狀態(tài)值概率分布。在一個實施例中,根據(jù)所述隱馬爾科夫模型參數(shù)計算出所述系 統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值的具體實現(xiàn)包括:將所述當(dāng)前觀測狀態(tài)值轉(zhuǎn)換成語義化標(biāo) 簽狀態(tài)值,結(jié)合所述隱馬爾科夫模型參數(shù)中的隱含狀態(tài)轉(zhuǎn)移概率矩陣計算出所述系統(tǒng)下一 時刻的語義化標(biāo)簽狀態(tài)值的概率分布。
[0049] 在一個實施例中,所述預(yù)測結(jié)果計算模塊13還用于:根據(jù)所述隱馬爾科夫模型參 數(shù)計算出系統(tǒng)下一個時刻的每一個數(shù)值的概率分布。具體地,將所述當(dāng)前觀測狀態(tài)值轉(zhuǎn)換 成語義化標(biāo)簽狀態(tài)值,結(jié)合所述隱馬爾科夫模型參數(shù)中的隱含狀態(tài)轉(zhuǎn)移概率矩陣計算出所 述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值的概率分布;然后,再進(jìn)一步結(jié)合所述隱馬爾科夫模 型參數(shù)中的觀測狀態(tài)轉(zhuǎn)移概率矩陣計算出下一個時刻的每一個數(shù)值的概率分布。
[0050] 在一個實施例中,所述時間序列語義化預(yù)測系統(tǒng)的一個應(yīng)用場景如圖4所示,所述 時間序列語義化預(yù)測系統(tǒng)包括:從云端數(shù)據(jù)庫中獲取一個系統(tǒng)的時間序列,并將所述時間 序列數(shù)值進(jìn)行聚類和語義化標(biāo)簽,得到一個觀測狀態(tài)矩陣和對應(yīng)的隱含狀態(tài)矩陣(建模數(shù) 據(jù)獲取模塊11中實現(xiàn));然后,根據(jù)觀測狀態(tài)矩陣和對應(yīng)的隱含狀態(tài)矩陣構(gòu)建所述隱馬爾科 夫(HMM)模型參數(shù)(模型參數(shù)計算模塊12實現(xiàn));然后在根據(jù)所構(gòu)建的所述隱馬爾科夫(HMM) 模型參數(shù)進(jìn)行預(yù)測分析,對用戶輸出預(yù)測結(jié)果,可W包括所述系統(tǒng)下一時刻的語義化標(biāo)簽 狀態(tài)值的概率分布或/和下一個時刻的每一個數(shù)值的概率分布(預(yù)測結(jié)果計算模塊13實 現(xiàn))。將語義化的結(jié)果輸出到用戶界面,將數(shù)值型結(jié)果返回受控系統(tǒng)用于控制。并且該結(jié)果 和模型可W在相同特征的受控系統(tǒng)中復(fù)用。系統(tǒng)還可W繼續(xù)應(yīng)用得到的時間序列進(jìn)行學(xué)習(xí) 訓(xùn)練,對構(gòu)建所述隱馬爾科夫化MM)模型參數(shù)進(jìn)行調(diào)整。使用云計算的模式,對某個實例的 學(xué)習(xí)訓(xùn)練結(jié)果,可W快速的應(yīng)用到相同的應(yīng)用環(huán)境下。同時通過云計算中屯、,可W比單實例 系統(tǒng)更快的捜集到更多的樣本數(shù)據(jù)。
[0051] 綜上所述,本發(fā)明的一種時間序列語義化預(yù)測方法及系統(tǒng)將數(shù)據(jù)序列分段符號化 后使用語義化標(biāo)簽的方式,然后對時間序列進(jìn)行預(yù)測分析,從而獲得快速并直觀的預(yù)測結(jié) 果。所W,本發(fā)明有效克服了現(xiàn)有技術(shù)中的種種缺點而具高度產(chǎn)業(yè)利用價值。
[0052] 上述實施例僅例示性說明本發(fā)明的原理及其功效,而非用于限制本發(fā)明。任何熟 悉此技術(shù)的人±皆可在不違背本發(fā)明的精神及范疇下,對上述實施例進(jìn)行修飾或改變。因 此,舉凡所屬技術(shù)領(lǐng)域中具有通常知識者在未脫離本發(fā)明所掲示的精神與技術(shù)思想下所完 成的一切等效修飾或改變,仍應(yīng)由本發(fā)明的權(quán)利要求所涵蓋。
【主權(quán)項】
1. 一種時間序列語義化預(yù)測方法,其特征在于,所述時間序列語義化預(yù)測方法包括: 獲取一個系統(tǒng)的M個時間序列,每個時間序列包括N個數(shù)值,構(gòu)成一個M X N觀測狀態(tài)矩 陣,M與N為自然數(shù);采用預(yù)設(shè)策略將所述數(shù)值分成L個類別,L為自然數(shù),每個類別分別對應(yīng) 著一個語義化標(biāo)簽狀態(tài);根據(jù)數(shù)值與語義化標(biāo)簽狀態(tài)的對應(yīng)關(guān)系構(gòu)建一個與所述觀測狀態(tài) 矩陣相對應(yīng)的一個M X N隱含狀態(tài)矩陣; 根據(jù)所述觀測狀態(tài)矩陣以及隱含狀態(tài)矩陣計算得到相應(yīng)的隱馬爾科夫模型參數(shù),所述 隱馬爾科夫模型參數(shù)包括:與所述L個類別一一對應(yīng)的觀測狀態(tài)轉(zhuǎn)移概率矩陣、一個LXL隱 含狀態(tài)轉(zhuǎn)移概率矩陣; 獲取系統(tǒng)的當(dāng)前時間序列的數(shù)值作為當(dāng)前觀測狀態(tài)值,根據(jù)所述隱馬爾科夫模型參數(shù) 計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值概率分布。2. 根據(jù)權(quán)利要求1所述的時間序列語義化預(yù)測方法,其特征在于:所述預(yù)設(shè)策略包括: 采用K均值聚類算法進(jìn)行聚類分析。3. 根據(jù)權(quán)利要求1所述的時間序列語義化預(yù)測方法,其特征在于:計算觀測狀態(tài)轉(zhuǎn)移概 率矩陣的具體實現(xiàn)包括:所述時間序列的數(shù)值為連續(xù)實數(shù),分別對各個類別對應(yīng)的數(shù)值區(qū) 域進(jìn)行核密度估計,得出各個類別值的概率分布函數(shù),進(jìn)而得到各個類別的觀測狀態(tài)轉(zhuǎn)移 概率矩陣。4. 根據(jù)權(quán)利要求1所述的時間序列語義化預(yù)測方法,其特征在于:根據(jù)所述隱馬爾科夫 模型參數(shù)計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值的具體實現(xiàn)包括:將所述當(dāng)前觀測 狀態(tài)值轉(zhuǎn)換成語義化標(biāo)簽狀態(tài)值,結(jié)合所述隱馬爾科夫模型參數(shù)中的隱含狀態(tài)轉(zhuǎn)移概率矩 陣計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值的概率分布。5. 根據(jù)權(quán)利要求1所述的時間序列語義化預(yù)測方法,其特征在于:所述時間序列語義化 預(yù)測方法還包括:根據(jù)所述隱馬爾科夫模型參數(shù)計算出系統(tǒng)下一個時刻的每一個數(shù)值的概 率分布。6. -種時間序列語義化預(yù)測系統(tǒng),其特征在于:所述時間序列語義化預(yù)測系統(tǒng)包括: 建模數(shù)據(jù)獲取模塊,用于獲取一個系統(tǒng)的M個時間序列,每個時間序列包括N個數(shù)值,構(gòu) 成一個M X N觀測狀態(tài)矩陣,M與N為自然數(shù);采用預(yù)設(shè)策略將所述數(shù)值分成L個類別,L為自然 數(shù),每個類別分別對應(yīng)著一個語義化標(biāo)簽狀態(tài);根據(jù)數(shù)值與語義化標(biāo)簽狀態(tài)的對應(yīng)關(guān)系構(gòu) 建一個與所述觀測狀態(tài)矩陣相對應(yīng)的一個M X N隱含狀態(tài)矩陣; 模型參數(shù)計算模塊,用于根據(jù)所述觀測狀態(tài)矩陣以及隱含狀態(tài)矩陣計算得到相應(yīng)的隱 馬爾科夫模型參數(shù),所述隱馬爾科夫模型參數(shù)包括:與所述L個類別一一對應(yīng)的觀測狀態(tài)轉(zhuǎn) 移概率矩陣、一個L X L隱含狀態(tài)轉(zhuǎn)移概率矩陣; 預(yù)測結(jié)果計算模塊,用于獲取系統(tǒng)的當(dāng)前時間序列的數(shù)值作為當(dāng)前觀測狀態(tài)值,根據(jù) 所述隱馬爾科夫模型參數(shù)計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值概率分布。7. 根據(jù)權(quán)利要求6所述的時間序列語義化預(yù)測系統(tǒng),其特征在于:所述預(yù)設(shè)策略包括: 采用K均值聚類算法進(jìn)行聚類分析。8. 根據(jù)權(quán)利要求6所述的時間序列語義化預(yù)測系統(tǒng),其特征在于:計算觀測狀態(tài)轉(zhuǎn)移概 率矩陣的具體實現(xiàn)包括:所述時間序列的數(shù)值為連續(xù)實數(shù),分別對各個類別對應(yīng)的數(shù)值區(qū) 域進(jìn)行核密度估計,得出各個類別值的概率分布函數(shù),進(jìn)而得到各個類別的觀測狀態(tài)轉(zhuǎn)移 概率矩陣。9. 根據(jù)權(quán)利要求6所述的時間序列語義化預(yù)測系統(tǒng),其特征在于:根據(jù)所述隱馬爾科夫 模型參數(shù)計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值的具體實現(xiàn)包括:將所述當(dāng)前觀測 狀態(tài)值轉(zhuǎn)換成語義化標(biāo)簽狀態(tài)值,結(jié)合所述隱馬爾科夫模型參數(shù)中的隱含狀態(tài)轉(zhuǎn)移概率矩 陣計算出所述系統(tǒng)下一時刻的語義化標(biāo)簽狀態(tài)值的概率分布。10. 根據(jù)權(quán)利要求6所述的時間序列語義化預(yù)測系統(tǒng),其特征在于:所述時間序列語義 化預(yù)測方法還包括:根據(jù)所述隱馬爾科夫模型參數(shù)計算出系統(tǒng)下一個時刻的每一個數(shù)值的 概率分布。
【文檔編號】G06K9/62GK105956614SQ201610261255
【公開日】2016年9月21日
【申請日】2016年4月25日
【發(fā)明人】熊開玲, 楊曉飛, 吳波, 彭俊杰
【申請人】中國科學(xué)院上海高等研究院