本發(fā)明涉及一種數(shù)據(jù)共振系統(tǒng)及方法,特別是涉及一種基于時空軌跡異構(gòu)多源數(shù)據(jù)共振系統(tǒng)及方法。
背景技術(shù):
在傳統(tǒng)的歐幾里德距離函數(shù)的軌跡相似性計算過程中,要求軌跡等長且時間點對應(yīng),無法度量不等長且具有局部事件偏移的軌跡相似性。因此在發(fā)現(xiàn)異源同步軌跡集合過程中產(chǎn)生信息損失較大,影響軌跡數(shù)據(jù)的可用性。
技術(shù)實現(xiàn)要素:
本發(fā)明所要解決的技術(shù)問題是提供一種基于時空軌跡異構(gòu)多源數(shù)據(jù)共振系統(tǒng)及方法,去能夠避免歐式距離脫離實際的情況,保證數(shù)據(jù)的完整性和一致性,提高計算效率,使用范圍廣泛。
本發(fā)明是通過下述技術(shù)方案來解決上述技術(shù)問題的:一種基于時空軌跡異構(gòu)多源數(shù)據(jù)共振系統(tǒng),其特征在于,其包括:
實時序列流接收模塊,用于實時接收時序向量,并保證數(shù)據(jù)傳輸過程中的完整性,一致性;
軌跡相似度計算模塊,用于計算軌跡相似度并篩選出相似度大于一定閾值的軌跡,作為共振軌跡;
軌跡可視化模塊,用于直觀顯示目標軌跡,軌跡數(shù)據(jù)同時包含空間和時間屬性,數(shù)據(jù)量大且維度高,分析起來難度很大,可視化技術(shù)可以直觀地呈現(xiàn)多維時空軌跡數(shù)據(jù),并提供豐富的互動,以揭示數(shù)據(jù)中包含的時空規(guī)律。
優(yōu)選地,所述實時序列流接收模塊包括:
數(shù)據(jù)轉(zhuǎn)換模塊,用于將原始的軌跡數(shù)據(jù)轉(zhuǎn)換為時序向量;
消息傳輸模塊,用于將時序向量以消息的方式實時傳送到相似度計算模塊,并保證數(shù)據(jù)傳輸過程中的完整性,一致性。
優(yōu)選地,所述軌跡相似度計算模塊包括:
時序向量規(guī)則模塊,用于規(guī)則化接收到的時序向量,保證計算的一致性;
相似度篩選模塊,用于篩選出相似度大于一定閾值的軌跡,作為共振軌跡,進而大大減小計算量,提高計算效率;
軌跡缺失值補全模塊,用于補全原查詢軌跡,軌跡數(shù)據(jù)采集過程中常常會有缺失,把缺失的軌跡補全,以及經(jīng)過這個軌跡點的時間范圍的估計區(qū)域的盡量縮小,對于實際的業(yè)務(wù)應(yīng)用非常有用。
本發(fā)明還提供一種基于時空軌跡異構(gòu)多源數(shù)據(jù)共振方法,其包括以下步驟:
步驟一,將原始軌跡數(shù)據(jù)轉(zhuǎn)換為時序向量;
步驟二,時序向量規(guī)則化;
步驟三,向量時間切片;
步驟四,通過相似度計算方法計算相似度作為共振率;
步驟五,篩選共振率大于一定數(shù)值的軌跡作為共振軌跡;
步驟六,補全原查詢軌跡;
步驟七,軌跡可視化;
步驟八,結(jié)束。
優(yōu)選地,所述步驟四根據(jù)哈希區(qū)域映射的時空距離計算方法計算點與點之間的距離,把測地距離通過一定的hash算法映射為區(qū)域點之間的距離,在實際計算相似度的時候,通過hash查找對應(yīng)的測地距離作為相似度,使用hash距離通過時序偏移的時空三維向量序列的相似度計算方法計算相似度作為共振率;對于不同長度的序列向量的相似度,以及時間點不對齊的序列向量的相似度的計算,通過動態(tài)規(guī)劃考慮時間軸可能偏移的情況,重新計算相似度,得到兩個時空三維向量序列的最終相似度。
優(yōu)選地,所述步驟六使用相似軌跡來進行哈希映射的軌跡缺失值補全方法,把缺失的軌跡點盡量準確的補全和經(jīng)過時間范圍估計縮小。
優(yōu)選地,所述步驟七使用相似軌跡哈希映射的軌跡缺失值補全方法補全原查詢軌跡,進行可視化展示。
本發(fā)明的積極進步效果在于:本發(fā)明能夠在大量獲取的數(shù)據(jù)存在準確性不高以及數(shù)據(jù)碎片化的情況下,在無法通過確定手段進行關(guān)聯(lián)的情況下,通過數(shù)據(jù)共振,可以有效甄別數(shù)據(jù),并將真實的數(shù)據(jù)關(guān)聯(lián)起來;數(shù)據(jù)共振將數(shù)據(jù)上未直接反應(yīng)出來的內(nèi)在關(guān)系挖掘出來,深入揭示不同實體的時間空間關(guān)聯(lián),進而發(fā)現(xiàn)不同的獨立數(shù)據(jù)間的彼此關(guān)系。
附圖說明
圖1為本發(fā)明的結(jié)構(gòu)示意圖。
圖2為本發(fā)明的流程圖。
具體實施方式
下面結(jié)合附圖給出本發(fā)明較佳實施例,以詳細說明本發(fā)明的技術(shù)方案。
如圖1所示,本發(fā)明基于時空軌跡異構(gòu)多源數(shù)據(jù)共振系統(tǒng)包括實時序列流接收模塊、軌跡相似度計算模塊、軌跡可視化模塊,其中:
實時序列流接收模塊用于實時接收時序向量,并保證數(shù)據(jù)傳輸過程中的完整性,一致性;
軌跡相似度計算模塊用于計算軌跡相似度并篩選出相似度大于一定閾值的軌跡,作為共振軌跡;
軌跡可視化模塊用于直觀顯示目標軌跡,軌跡數(shù)據(jù)同時包含空間和時間屬性,數(shù)據(jù)量大且維度高,分析起來難度很大,可視化技術(shù)可以直觀地呈現(xiàn)多維時空軌跡數(shù)據(jù),并提供豐富的互動,以揭示數(shù)據(jù)中包含的時空規(guī)律。
所述實時序列流接收模塊包括數(shù)據(jù)轉(zhuǎn)換模塊、消息傳輸模塊,其中:
數(shù)據(jù)轉(zhuǎn)換模塊用于將原始的軌跡數(shù)據(jù)轉(zhuǎn)換為時序向量;
消息傳輸模塊用于將時序向量以消息的方式實時傳送到相似度計算模塊,并保證數(shù)據(jù)傳輸過程中的完整性,一致性。
所述軌跡相似度計算模塊包括時序向量規(guī)則模塊、相似度篩選模塊、軌跡缺失值補全模塊,其中:
時序向量規(guī)則模塊用于規(guī)則化接收到的時序向量,保證計算的一致性;
相似度篩選模塊用于篩選出相似度大于一定閾值的軌跡,作為共振軌跡,進而可以大大減小計算量,提高計算效率;
軌跡缺失值補全模塊用于補全原查詢軌跡,軌跡數(shù)據(jù)采集過程中常常會有缺失,如何把缺失的軌跡補全,以及經(jīng)過這個軌跡點的時間范圍的估計區(qū)域的盡量縮小,對于實際的業(yè)務(wù)應(yīng)用非常有用。
如圖2所示,本發(fā)明基于時空軌跡異構(gòu)多源數(shù)據(jù)共振方法包括以下步驟:
步驟一,將原始軌跡數(shù)據(jù)轉(zhuǎn)換為時序向量;
步驟二,時序向量規(guī)則化;
步驟三,向量時間切片;
步驟四,通過相似度計算方法計算相似度作為共振率;
步驟五,篩選共振率大于一定數(shù)值的軌跡作為共振軌跡;
步驟六,補全原查詢軌跡;
步驟七,軌跡可視化;
步驟八,結(jié)束。
所述步驟四根據(jù)哈希區(qū)域映射的時空距離計算方法計算點與點之間的距離,把測地距離通過一定的hash算法映射為區(qū)域點之間的距離,在實際計算相似度的時候,通過hash查找對應(yīng)的測地距離作為相似度,使用hash距離通過時序偏移的時空三維向量序列的相似度計算方法計算相似度作為共振率;對于不同長度的序列向量的相似度,以及時間點不對齊(允許各種時間不等片的偏離)的序列向量的相似度的計算,通過動態(tài)規(guī)劃考慮時間軸可能偏移的情況,重新計算相似度,得到兩個時空三維向量序列的最終相似度。
所述步驟六使用相似軌跡來進行哈希映射的軌跡缺失值補全方法,把缺失的軌跡點盡量準確的補全和經(jīng)過時間范圍估計縮小。
所述步驟七使用相似軌跡哈希映射的軌跡缺失值補全方法補全原查詢軌跡,進行可視化展示。
以上所述的具體實施例,對本發(fā)明的解決的技術(shù)問題、技術(shù)方案和有益效果進行了進一步詳細說明,所應(yīng)理解的是,以上所述僅為本發(fā)明的具體實施例而已,并不用于限制本發(fā)明,凡在本發(fā)明的精神和原則之內(nèi),所做的任何修改、等同替換、改進等,均應(yīng)包含在本發(fā)明的保護范圍之內(nèi)。