本發(fā)明屬于時(shí)空關(guān)系分析領(lǐng)域,涉及一種時(shí)空關(guān)系分析系統(tǒng),尤其涉及一種基于多源物聯(lián)網(wǎng)位置感知的時(shí)空關(guān)系分析系統(tǒng)。
背景技術(shù):
:目前絕大多數(shù)的公安機(jī)關(guān)數(shù)據(jù)應(yīng)用仍處于信息錄入、發(fā)布、統(tǒng)計(jì)、查詢等低層次、低水平的應(yīng)用階段,在數(shù)據(jù)整合以及數(shù)據(jù)挖掘和數(shù)據(jù)的關(guān)聯(lián)分析等深層次的應(yīng)用不夠。CN106257301A公開(kāi)了一種基于海量視頻的事件軌跡快速檢索平臺(tái),包括目標(biāo)軌跡時(shí)空分析模塊、綜合調(diào)度服務(wù)模塊、智能視頻分析服務(wù)模塊、資源請(qǐng)求服務(wù)模塊,以及監(jiān)控視頻網(wǎng)絡(luò)和平臺(tái)數(shù)據(jù)庫(kù),其中目標(biāo)軌跡時(shí)空分析模塊將指令發(fā)送到所述綜合調(diào)度服務(wù)模塊和資源請(qǐng)求服務(wù)模塊,綜合調(diào)度服務(wù)模塊將指令轉(zhuǎn)發(fā)到智能視頻分析服務(wù)模塊,智能視頻分析服務(wù)模塊連接所述監(jiān)控視頻網(wǎng)絡(luò),根據(jù)指令對(duì)多個(gè)視頻文件進(jìn)行智能處理并返回處理結(jié)果,資源請(qǐng)求服務(wù)模塊與所述平臺(tái)數(shù)據(jù)庫(kù)相連,為用戶提供所需資源數(shù)據(jù)的查詢及讀寫(xiě)操作。該發(fā)明基于傳統(tǒng)的單一數(shù)據(jù)源,沒(méi)有對(duì)數(shù)據(jù)進(jìn)行深度挖掘,雖然在支持個(gè)案的偵破方面發(fā)揮了巨大的作用,但對(duì)探求刑事案件的發(fā)案規(guī)律,支持領(lǐng)導(dǎo)科學(xué)決策方面仍存在不足?;谥悄懿杉W(wǎng)點(diǎn)的物聯(lián)網(wǎng)數(shù)據(jù)來(lái)源于各種各樣的物聯(lián)網(wǎng)終端設(shè)備,具體包括攝像頭、IC卡、WiFi熱點(diǎn)、停車(chē)場(chǎng)系統(tǒng)等。這些數(shù)據(jù)的數(shù)據(jù)格式、標(biāo)準(zhǔn)、結(jié)構(gòu)各異,普遍的存在著同名異意、同意異名、編碼不一致,層次劃分混亂等語(yǔ)義不一致和數(shù)據(jù)結(jié)構(gòu)混亂的問(wèn)題。如何實(shí)現(xiàn)多源、異構(gòu)數(shù)據(jù)的統(tǒng)一描述與組織,保證數(shù)據(jù)語(yǔ)義的一致性,是進(jìn)行數(shù)據(jù)深度挖掘和分析的基礎(chǔ)。關(guān)聯(lián)規(guī)則(AssociationRules)的概念首先由R.Agrawal等人于1993年提出的,是反映一個(gè)事物與其他事物之間的相互依賴性或相互關(guān)聯(lián)性。關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘(簡(jiǎn)稱關(guān)聯(lián)規(guī)則挖掘)就是從大量的數(shù)據(jù)中挖掘出有價(jià)值的描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有關(guān)知識(shí)。隨著收集和存儲(chǔ)的數(shù)據(jù)規(guī)模越來(lái)越大,特別是類似于Hadoop這樣的分布式數(shù)據(jù)處理系統(tǒng)的誕生,使得數(shù)據(jù)處理的規(guī)模呈指數(shù)及增長(zhǎng),人們對(duì)從這些數(shù)據(jù)中挖掘相應(yīng)的關(guān)聯(lián)規(guī)則越來(lái)越感興趣,關(guān)聯(lián)規(guī)則挖掘也倍受數(shù)據(jù)挖掘領(lǐng)域?qū)<业年P(guān)注,得到了深入的研究和發(fā)展。關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘可以深度分析每個(gè)人的社會(huì)關(guān)系。包括人與人的關(guān)系、人與車(chē)的關(guān)系、及人與社會(huì)環(huán)境的關(guān)系等。如何應(yīng)用這些從海量數(shù)據(jù)中挖掘出來(lái)的高價(jià)值信息輔助案件的偵破將是一個(gè)有意義的課題。通常,人們感興趣的是從一個(gè)時(shí)空序列里發(fā)現(xiàn)頻繁重復(fù)的路徑,即時(shí)空軌跡頻繁模式。這些軌跡頻繁重復(fù)模式能協(xié)助完成關(guān)于移動(dòng)對(duì)象的分析、預(yù)測(cè)等任務(wù),進(jìn)而可將其應(yīng)用于經(jīng)營(yíng)商業(yè)、旅游業(yè)和管理城市交通等方面的決策。除了對(duì)軌跡數(shù)據(jù)之外,序列挖掘?qū)ο筮€包括諸如時(shí)空事件數(shù)據(jù)集等其他時(shí)空數(shù)據(jù),在這些事件數(shù)據(jù)集中不包含對(duì)象的軌跡數(shù)據(jù),而是由不同類型事件序列組成的集合。通過(guò)掃描時(shí)空數(shù)據(jù)庫(kù)產(chǎn)生映射圖和軌跡信息列表,在映射圖上進(jìn)行深度優(yōu)先遍歷以尋找頻繁軌跡模式。許多移動(dòng)對(duì)象(包括交通工具、動(dòng)物、移動(dòng)電話用戶等),在固定的時(shí)間區(qū)間內(nèi)總是遵循相同或近似相同的路線,展現(xiàn)出一定的周期性規(guī)律,這些周期模式不僅可用于壓縮移動(dòng)數(shù)據(jù),還可用來(lái)預(yù)測(cè)對(duì)象未來(lái)的移動(dòng)方向,這種周期模式隱含在時(shí)空數(shù)據(jù)中需要挖掘才能發(fā)現(xiàn)。因此,如何針對(duì)公安刑事案件的特點(diǎn)探求在傳統(tǒng)方法基礎(chǔ)上提高數(shù)據(jù)的挖掘效率和有效性,已成為一個(gè)現(xiàn)實(shí)迫切需要且具有較高理論研究?jī)r(jià)值的熱點(diǎn)問(wèn)題。技術(shù)實(shí)現(xiàn)要素:本發(fā)明提供了一種基于多源物聯(lián)網(wǎng)位置感知的時(shí)空關(guān)系分析系統(tǒng),以解決公安機(jī)關(guān)或安防領(lǐng)域數(shù)據(jù)應(yīng)用層次低、數(shù)據(jù)挖掘效率高的不足。一種基于多源物聯(lián)網(wǎng)位置感知的時(shí)空關(guān)系分析系統(tǒng),自下而上包括感知層、數(shù)據(jù)處理層、網(wǎng)絡(luò)層、應(yīng)用層,所述感知層包括多種終端設(shè)備,所述終端設(shè)備可以采集時(shí)空數(shù)據(jù)并為數(shù)據(jù)處理層提供原始時(shí)空數(shù)據(jù);所述數(shù)據(jù)處理層包括分布式數(shù)據(jù)處理平臺(tái)、數(shù)據(jù)處理框架、關(guān)系型數(shù)據(jù)庫(kù);所述數(shù)據(jù)處理層接收來(lái)自感知層的時(shí)空數(shù)據(jù),并將所述感知層的時(shí)空數(shù)據(jù)過(guò)濾、清洗,按照時(shí)空關(guān)聯(lián)規(guī)則對(duì)數(shù)據(jù)進(jìn)行挖掘,然后存儲(chǔ)到時(shí)空數(shù)據(jù)庫(kù)中,并為網(wǎng)絡(luò)層提供訪問(wèn)接口;所述網(wǎng)絡(luò)層可訪問(wèn)數(shù)據(jù)處理層的數(shù)據(jù),并為應(yīng)用層提供傳輸通道;所述應(yīng)用層通過(guò)網(wǎng)絡(luò)層訪問(wèn)時(shí)空數(shù)據(jù)庫(kù)。作為優(yōu)選的方案,所述數(shù)據(jù)處理層還包括異構(gòu)數(shù)據(jù)轉(zhuǎn)換模塊,所述異構(gòu)數(shù)據(jù)模塊將所述感知層采集到的時(shí)空數(shù)據(jù)轉(zhuǎn)換為標(biāo)準(zhǔn)格式的數(shù)據(jù)。具體地,所述標(biāo)準(zhǔn)格式為XML。作為優(yōu)選的方案,所述數(shù)據(jù)處理層包括Hadoop分布式平臺(tái)、Spark大數(shù)據(jù)處理框架、Oracle關(guān)系型數(shù)據(jù)庫(kù);所述Hadoop分布式平臺(tái)采用HDFS文件系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行分布式存儲(chǔ),所述Spark大數(shù)據(jù)處理框架采用Hive分布式數(shù)據(jù)倉(cāng)庫(kù)對(duì)感知層的數(shù)據(jù)清洗、過(guò)濾、刪除冗余。作為優(yōu)選的方案,所述數(shù)據(jù)處理層還包括異常過(guò)濾器、業(yè)務(wù)過(guò)濾器、時(shí)間過(guò)濾器,所述異常過(guò)濾器對(duì)感知層的時(shí)空數(shù)據(jù)進(jìn)行異常冗余數(shù)據(jù)的檢驗(yàn),對(duì)重復(fù)的數(shù)據(jù)、基于服務(wù)的數(shù)據(jù)長(zhǎng)度是否一致進(jìn)行判斷;所述業(yè)務(wù)過(guò)濾器按照業(yè)務(wù)定義的規(guī)則對(duì)終端、時(shí)間、地點(diǎn)、信息中存在異常的孤立數(shù)據(jù)進(jìn)行業(yè)務(wù)判定,對(duì)于不匹配的數(shù)據(jù)進(jìn)行過(guò)濾處理;所述時(shí)間過(guò)濾器根據(jù)數(shù)據(jù)的時(shí)間記錄進(jìn)行過(guò)濾,可根據(jù)業(yè)務(wù)要求指定時(shí)間范圍,對(duì)不在該時(shí)間范圍的數(shù)據(jù)進(jìn)行過(guò)濾。根據(jù)上述過(guò)濾器本發(fā)明還提供了一種數(shù)據(jù)清洗方法,首選將數(shù)據(jù)裝載入HIVE中,然后依次經(jīng)過(guò)異常過(guò)濾器、業(yè)務(wù)過(guò)濾器、時(shí)間過(guò)濾器進(jìn)行過(guò)濾,將不符合過(guò)濾規(guī)則的數(shù)據(jù)清除并寫(xiě)入到日志中。作為優(yōu)選的方案,所述時(shí)空數(shù)據(jù)包括:網(wǎng)點(diǎn)感知時(shí)空數(shù)據(jù)、網(wǎng)點(diǎn)時(shí)空數(shù)據(jù)、時(shí)空關(guān)聯(lián)數(shù)據(jù);所述網(wǎng)點(diǎn)時(shí)空數(shù)據(jù)、時(shí)空關(guān)聯(lián)數(shù)據(jù)存儲(chǔ)于Oracle關(guān)系數(shù)據(jù)庫(kù)中;所述網(wǎng)點(diǎn)感知時(shí)空數(shù)據(jù)通過(guò)異構(gòu)數(shù)據(jù)轉(zhuǎn)換模塊導(dǎo)入HDFS分布式文件系統(tǒng)。本發(fā)明另一方面還提供了一種基于多源物聯(lián)網(wǎng)位置感知的時(shí)空關(guān)系分析系統(tǒng)的時(shí)空數(shù)據(jù)挖掘方法,依次包括數(shù)據(jù)準(zhǔn)備階段、數(shù)據(jù)的挖掘階段和數(shù)據(jù)結(jié)果的解釋和評(píng)估階段,所述數(shù)據(jù)準(zhǔn)備階段定義數(shù)據(jù)挖掘訓(xùn)練數(shù)據(jù)的信息,具體包括確定維度信息、數(shù)據(jù)均值化處理、確定交叉驗(yàn)證參數(shù);所述數(shù)據(jù)挖掘階段根據(jù)業(yè)務(wù)需求,設(shè)計(jì)數(shù)據(jù)挖掘算法然后應(yīng)用海量數(shù)據(jù),通過(guò)算法訓(xùn)練模型。作為訓(xùn)練模型的優(yōu)選方案,所述訓(xùn)練模型包括時(shí)空關(guān)聯(lián)、時(shí)空同現(xiàn)模式挖掘、時(shí)空聚類、時(shí)空分類、時(shí)空軌跡頻繁;所述時(shí)空關(guān)聯(lián)從大量的時(shí)空數(shù)據(jù)中挖掘出有價(jià)值的描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有關(guān)知識(shí);所述時(shí)空關(guān)聯(lián)規(guī)則包括空間約束又有時(shí)態(tài)約束的關(guān)聯(lián)規(guī)則;所述時(shí)空同現(xiàn)模式挖掘是對(duì)復(fù)雜時(shí)空數(shù)據(jù)提取同現(xiàn)模式的過(guò)程;所述時(shí)空同現(xiàn)模式是在同位模式的基礎(chǔ)上添加了時(shí)空符合興趣度形成的模式;所述時(shí)空同現(xiàn)模式在時(shí)空維下,不同對(duì)象類型子集的實(shí)例在一些時(shí)間段中在空間上是相互鄰近的或符合某種空間關(guān)系的;所述時(shí)空聚類指基于空間和時(shí)間相似度把具有相似行為的時(shí)空對(duì)象劃分到同一組中;所述時(shí)空分類基于時(shí)空對(duì)象的特征構(gòu)建分類模型來(lái)預(yù)測(cè)時(shí)空對(duì)象所屬類別或?qū)ο笏诰唧w空間位置;所述時(shí)空軌跡頻繁挖掘時(shí)空軌跡關(guān)聯(lián)的信息。作為優(yōu)選的方案,所述時(shí)空關(guān)聯(lián)的具體步驟為:將含有時(shí)間約束和空間約束的數(shù)據(jù)源首先按照空間位置進(jìn)行整理,生成信息/地址對(duì),然后根據(jù)Apriori算法生成侯選項(xiàng)集,由侯選項(xiàng)集生成頻繁項(xiàng)集,直到頻繁項(xiàng)集不能生成更長(zhǎng)的侯選項(xiàng)集為止;再把時(shí)間因素加入信息/地址對(duì)進(jìn)去,將時(shí)間區(qū)間用一個(gè)適宜的推廣因子進(jìn)行推廣,得出相應(yīng)的含有地址約束的項(xiàng)目與擴(kuò)展時(shí)間區(qū)間的元素對(duì),當(dāng)項(xiàng)目/地址對(duì)落入相同的推廣時(shí)間區(qū)間內(nèi),則產(chǎn)生關(guān)聯(lián)規(guī)則,即含有時(shí)空約束的關(guān)聯(lián)規(guī)則。作為優(yōu)選的方案,所述時(shí)空同位模式數(shù)據(jù)挖掘方法具體為:遍歷計(jì)算空間內(nèi)不同特征類型下,每?jī)蓚€(gè)實(shí)例之間的期望距離;若所述實(shí)例間的期望距離小于等于距離閾值,則把該實(shí)例對(duì)作為候選實(shí)例對(duì);遍歷所有類型下的所有實(shí)例對(duì),直至不再產(chǎn)生候選實(shí)例對(duì);得到所有的候選實(shí)例對(duì)之后,計(jì)算候選實(shí)例對(duì)中每種特征類型所對(duì)應(yīng)的空間參與度;在得出模式的空間參與度之后,同空間參與度閾值做比較,若前者大于等于后者,那么該模式即為空間同位模式;在確定所有的空間同位模式后,再計(jì)算時(shí)空同現(xiàn)模式;先計(jì)算空間同位模式的時(shí)間參與度,若大于等于時(shí)間參與度閾值,則該模式為時(shí)空同現(xiàn)模式。作為優(yōu)選的方案,所述時(shí)空聚類采用時(shí)空密度聚類的算法,所述時(shí)空密度聚類是空間密度聚類在時(shí)空域上的擴(kuò)展,采用密度作為實(shí)體間相似性的度量標(biāo)準(zhǔn),將時(shí)空簇視為一系列被低密度區(qū)域(噪聲)分割的高密度連通區(qū)域;具體地,所述時(shí)空密度聚類為ST-DBSCAN聚類;所述ST-DBSCAN聚類是DBSCAN聚類在時(shí)間維上的擴(kuò)展,所述擴(kuò)展包括E鄰域擴(kuò)展為時(shí)空鄰域、直接密度可達(dá)擴(kuò)展為時(shí)空直接密度可達(dá)。作為優(yōu)選的方案,所述時(shí)空分類采用BP神經(jīng)網(wǎng)絡(luò)算法,具體的步驟為:首先構(gòu)造一個(gè)包含輸入層、輸出層和隱藏層的多層網(wǎng)絡(luò)結(jié)構(gòu);其中輸入層為經(jīng)處理的智能網(wǎng)點(diǎn)時(shí)空特征數(shù)據(jù),輸出層為時(shí)空數(shù)據(jù)的目標(biāo)類別;所述網(wǎng)絡(luò)中每個(gè)神經(jīng)元包含一個(gè)連續(xù)可微的非線性激活函數(shù);所述網(wǎng)絡(luò)展示高度的連接線,其強(qiáng)度由網(wǎng)絡(luò)的突觸權(quán)值確定;接著采用BP神經(jīng)網(wǎng)絡(luò)應(yīng)用反向傳播的方法,訓(xùn)練網(wǎng)絡(luò)的各個(gè)突觸權(quán)值:所述訓(xùn)練過(guò)程包括兩個(gè)階段:前向階段:網(wǎng)絡(luò)的突觸權(quán)值是固定的,輸入信號(hào)在網(wǎng)絡(luò)中一層層傳播,直到達(dá)到突出端;反向階段:通過(guò)比較網(wǎng)絡(luò)的輸出和期望輸出產(chǎn)生的誤差信號(hào),將誤差信號(hào)再次通過(guò)網(wǎng)絡(luò)一層層傳播,并對(duì)網(wǎng)絡(luò)的突觸權(quán)值進(jìn)行不斷的修正。作為優(yōu)選的方案,所述時(shí)空軌跡頻繁采用一種基于后綴樹(shù)的時(shí)空軌跡頻繁模式挖掘算法結(jié)合DBSCAN算法。具體為,首先通過(guò)后綴樹(shù)挖掘出候選的軌跡頻繁模式,然后進(jìn)一步對(duì)產(chǎn)生的結(jié)果進(jìn)行挖掘,通過(guò)聚類的方式提取出帶有停留時(shí)間的頻繁模式。對(duì)于軌跡化,Tb定義軌跡間的距離,若二者有著不同的置序列,則距離為正無(wú)窮,若二者之間有著相同的位置序列,則計(jì)算其距離。最后通過(guò)基于密度的DBSCAN算法迸行軌跡頻繁項(xiàng)聚類。本發(fā)明的有益效果是:1、采用XML標(biāo)準(zhǔn)格式將多源、異構(gòu)的物聯(lián)網(wǎng)采集數(shù)據(jù)轉(zhuǎn)換為符號(hào)系統(tǒng)建設(shè)標(biāo)準(zhǔn)規(guī)范的數(shù)據(jù)格式,實(shí)現(xiàn)數(shù)據(jù)統(tǒng)一存儲(chǔ)、處理。2、構(gòu)建了一個(gè)分布式數(shù)據(jù)預(yù)處理平臺(tái),多層次對(duì)物聯(lián)網(wǎng)海量數(shù)據(jù)中的異常信息清洗,保證數(shù)據(jù)的有效性,降低處理的難度。3、基礎(chǔ)時(shí)空與時(shí)空關(guān)聯(lián)數(shù)據(jù)分開(kāi)存儲(chǔ),提高數(shù)據(jù)的容錯(cuò)性,關(guān)系數(shù)據(jù)庫(kù)提供WEB服務(wù)接口,更加數(shù)據(jù)訪問(wèn)的便利性。4、采用了時(shí)空關(guān)聯(lián)、時(shí)空同現(xiàn)模式挖掘、時(shí)空聚類、時(shí)空分類、時(shí)空軌跡頻繁等多種訓(xùn)練模式,多層次復(fù)用多源物聯(lián)網(wǎng)感知數(shù)據(jù),可以深度分析數(shù)據(jù)中對(duì)象的社會(huì)關(guān)系:包括人與人的關(guān)系、人與車(chē)的關(guān)系、及人與社會(huì)環(huán)境的關(guān)系等;5、可以提供個(gè)性化的警務(wù)數(shù)據(jù)服務(wù),并為上層警務(wù)應(yīng)用提供有高效、可預(yù)測(cè)的服務(wù),并可作為探求刑事案件的發(fā)案、破案規(guī)律工具,支持領(lǐng)導(dǎo)科學(xué)決策。附圖說(shuō)明圖1是本發(fā)明的時(shí)空關(guān)系分析系統(tǒng)的結(jié)構(gòu)示意圖;圖2是本發(fā)明的時(shí)空關(guān)系分析系統(tǒng)的數(shù)據(jù)處理流程圖;圖3是本發(fā)明的異構(gòu)數(shù)據(jù)轉(zhuǎn)換流程圖;圖4是本發(fā)明的數(shù)據(jù)清洗流程圖;圖5是本發(fā)明的數(shù)據(jù)挖掘流程圖;圖6是本發(fā)明時(shí)空數(shù)據(jù)存儲(chǔ)關(guān)系圖;圖7是本發(fā)明xml文件示例;圖8是本發(fā)明智能網(wǎng)點(diǎn)時(shí)空數(shù)據(jù)關(guān)系表屬性結(jié)構(gòu)圖;圖9是本發(fā)明對(duì)象時(shí)空關(guān)聯(lián)關(guān)系表屬性結(jié)構(gòu)圖;圖10是本發(fā)明對(duì)象分類關(guān)系存儲(chǔ)關(guān)系表屬性結(jié)構(gòu)圖。具體實(shí)施方式為了更好的理解本發(fā)明所提出的技術(shù)方案,下面結(jié)合附圖和具體的實(shí)施例對(duì)本發(fā)明作進(jìn)一步闡述。1系統(tǒng)組成如圖1所示,一種基于多源物聯(lián)網(wǎng)位置感知的時(shí)空數(shù)據(jù)關(guān)聯(lián)分析系統(tǒng)由以下四個(gè)層次組成:1、感知層(數(shù)據(jù)采集層):由物聯(lián)網(wǎng)的各種終端設(shè)備組成,包括監(jiān)控視頻、門(mén)禁系統(tǒng)、WiFi、IC卡、停車(chē)場(chǎng)監(jiān)控等;2、數(shù)據(jù)處理層:由Hadoop分布式平臺(tái)、spark大數(shù)據(jù)處理框架組成及oracle關(guān)系型數(shù)據(jù)庫(kù)組成。這里采用云計(jì)算中的Hadoop分布式框架進(jìn)行分布式數(shù)據(jù)處理,由于Hadoop分布式文件系統(tǒng)HDFS是以支持大數(shù)據(jù)集合為目標(biāo)的,故利用HDFS對(duì)健康物聯(lián)網(wǎng)產(chǎn)生的異構(gòu)海量數(shù)據(jù)進(jìn)行分布式存儲(chǔ);根據(jù)具體需求,采用基于Spark編程模型的Hive分布式數(shù)據(jù)倉(cāng)庫(kù)對(duì)智能終端采集的數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗過(guò)濾、刪除冗余信息;由于采集到的數(shù)據(jù)背后隱藏著大量有用的信息,希望能夠?qū)ζ涓邔哟蔚姆治?為公安警務(wù)人員提供科學(xué)的關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘模型,需要對(duì)分布式存儲(chǔ)的數(shù)據(jù)進(jìn)行分布式關(guān)聯(lián)規(guī)則等數(shù)據(jù)挖掘,為上層警務(wù)應(yīng)用提供有用、高效,具有可預(yù)測(cè)的服務(wù)。3、網(wǎng)絡(luò)層:以公安內(nèi)網(wǎng)為基礎(chǔ)。4、應(yīng)用層:應(yīng)用關(guān)聯(lián)分析的結(jié)果,實(shí)現(xiàn)各種案情分析功能。例如模型評(píng)估、在線訓(xùn)練、信息預(yù)測(cè)、服務(wù)發(fā)布。如圖2所示,描述了基于Hadoop數(shù)據(jù)處理的流程走向,通過(guò)數(shù)據(jù)加載轉(zhuǎn)換為統(tǒng)一的數(shù)據(jù)格式到分布式存儲(chǔ),然后根據(jù)數(shù)據(jù)挖掘模型的需求對(duì)數(shù)據(jù)進(jìn)行分布式數(shù)據(jù)清洗,再進(jìn)行分布式數(shù)據(jù)巧掘,然后再應(yīng)用訓(xùn)練得到的數(shù)據(jù)挖掘模型進(jìn)行分布式時(shí)空數(shù)據(jù)數(shù)據(jù)挖掘,最后將挖掘到的時(shí)空關(guān)聯(lián)數(shù)據(jù)與物聯(lián)網(wǎng)時(shí)空數(shù)據(jù)一起存儲(chǔ)到關(guān)系數(shù)據(jù)庫(kù)中,作為相關(guān)web服務(wù)接口的數(shù)據(jù)資源。對(duì)智能采集物聯(lián)網(wǎng)中的網(wǎng)點(diǎn)、時(shí)空數(shù)據(jù)以及時(shí)空數(shù)據(jù)對(duì)象間的時(shí)空關(guān)系進(jìn)行統(tǒng)一存儲(chǔ)管理。實(shí)現(xiàn)這些信息的高效的增刪改查,用以指導(dǎo)警務(wù)工作。2時(shí)空數(shù)據(jù)處理和分析2.0基于物聯(lián)網(wǎng)獲取的異構(gòu)數(shù)據(jù)加載轉(zhuǎn)換由于智能采集物聯(lián)網(wǎng)設(shè)備的多樣性,采集到的信息大多數(shù)是異構(gòu)的。結(jié)合圖2和圖3所示,本發(fā)明設(shè)置了一個(gè)異構(gòu)數(shù)據(jù)轉(zhuǎn)換加載模塊的,將多源、異構(gòu)的物聯(lián)網(wǎng)采集數(shù)據(jù)轉(zhuǎn)換為符號(hào)系統(tǒng)統(tǒng)一為標(biāo)準(zhǔn)規(guī)范的數(shù)據(jù)格式。目前在互聯(lián)網(wǎng)領(lǐng)域,已存在一個(gè)廣泛應(yīng)用的數(shù)據(jù)交換接口標(biāo)準(zhǔn)XML(ExtensibleMarkupLanguange擴(kuò)展標(biāo)記語(yǔ)言)。XML文件的可讀性極強(qiáng),可適應(yīng)于不同的平臺(tái)、編程語(yǔ)言、框架。在制定好XML文件的格式標(biāo)準(zhǔn)之后,根據(jù)不同的智能終端設(shè)備感知層協(xié)議,編寫(xiě)相應(yīng)的接口,將相應(yīng)智能終端設(shè)備的數(shù)據(jù)轉(zhuǎn)換為系統(tǒng)統(tǒng)一識(shí)別的XML文件。例如,系統(tǒng)XML文件格式規(guī)范如下:節(jié)點(diǎn)名稱說(shuō)明device設(shè)備屬性name代表名稱,coordinate代表坐標(biāo)times監(jiān)控時(shí)間表time監(jiān)控時(shí)刻INFOS獲取信息列表INFO獲取信息,屬性name為信息唯一標(biāo)識(shí)如圖7為xml文件示例:標(biāo)識(shí)位于坐標(biāo)(113,23)的A攝像頭于2015/06/1600:00:00監(jiān)控到身份證號(hào)A的人和車(chē)牌號(hào)A的車(chē)輛。2.1數(shù)據(jù)過(guò)濾清洗智能采集物聯(lián)網(wǎng)數(shù)據(jù)處理平臺(tái)從智能采集終端中接收的海量異構(gòu)數(shù)據(jù)中蘊(yùn)含了大量信息,這些信息盡管是數(shù)據(jù)關(guān)聯(lián)挖掘模型的數(shù)據(jù)基礎(chǔ),但是智能采集物聯(lián)網(wǎng)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中有可能存在著大量的臟數(shù)據(jù),由于智能采集終端協(xié)議不同等原因?qū)е碌臄?shù)據(jù)缺失屬性值、時(shí)間間隔短、采集數(shù)據(jù)異常、有效數(shù)據(jù)值重復(fù)等錯(cuò)誤。因此需要構(gòu)建一個(gè)分布式數(shù)據(jù)預(yù)處理平臺(tái),用以清洗物聯(lián)網(wǎng)海量數(shù)據(jù)中的這些異常信息。數(shù)據(jù)過(guò)濾清洗就是讀取加載的大量數(shù)據(jù),根據(jù)某種原則,過(guò)濾掉冗余的數(shù)據(jù),為數(shù)據(jù)挖掘打下基礎(chǔ)。由于數(shù)據(jù)量很大,需要在集群中部署分布式數(shù)據(jù)清洗的方案,Hadoop平臺(tái)提供了一個(gè)數(shù)據(jù)倉(cāng)庫(kù)工具Hive(包括mapreduce和spark兩個(gè)版本)。應(yīng)用Hive,可以像編寫(xiě)sql語(yǔ)句一樣方便的在分布式數(shù)據(jù)平臺(tái)HDFS上編寫(xiě)數(shù)據(jù)過(guò)濾清洗程序。本發(fā)明包括三種數(shù)據(jù)清洗過(guò)濾器(模塊):異常過(guò)濾器:對(duì)于待清洗數(shù)據(jù),首先進(jìn)行異常冗余數(shù)據(jù)的檢驗(yàn),這里主要對(duì)于數(shù)據(jù)是否完全重復(fù)且基于服務(wù)的數(shù)據(jù)長(zhǎng)度是否一致進(jìn)行判斷。業(yè)務(wù)過(guò)濾器:應(yīng)與具體支撐應(yīng)用平臺(tái)密切相關(guān),在數(shù)據(jù)挖掘模型的具體應(yīng)用中,業(yè)務(wù)需求可能只包括某一限定范圍的信息。例如可以定義以下幾個(gè)規(guī)則:只選定某個(gè)型號(hào)的智能終端的數(shù)據(jù),產(chǎn)品號(hào)及版本號(hào)等信息;限定具體時(shí)間,地點(diǎn)以及應(yīng)用人及相關(guān)信息。對(duì)于可能存在異常的孤立數(shù)據(jù)進(jìn)行業(yè)務(wù)判定。對(duì)于不匹配的數(shù)據(jù)進(jìn)行過(guò)濾處理。時(shí)間過(guò)濾器:根據(jù)數(shù)據(jù)的時(shí)間記錄進(jìn)行過(guò)濾,可以根據(jù)業(yè)務(wù)要求指定時(shí)間范圍。對(duì)不在該時(shí)間范圍的數(shù)據(jù)進(jìn)行過(guò)濾。如圖4所示,具體的清洗方法,首選將數(shù)據(jù)裝載入HIVE中,然后依次經(jīng)過(guò)異常過(guò)濾器、業(yè)務(wù)過(guò)濾器、時(shí)間過(guò)濾器進(jìn)行過(guò)濾,將不符合過(guò)濾規(guī)則的數(shù)據(jù)清除并寫(xiě)入到日志中。2.2分布式時(shí)空關(guān)聯(lián)規(guī)則模型挖掘關(guān)聯(lián)規(guī)則模型挖掘算法的是本發(fā)明的核心。時(shí)空數(shù)據(jù)挖掘是數(shù)據(jù)庫(kù)中數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)的子域,是時(shí)空數(shù)據(jù)庫(kù)、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、地理可視化和信息理論等幾個(gè)領(lǐng)域的交叉學(xué)科。通過(guò)時(shí)空數(shù)據(jù)挖掘方法,研究空間對(duì)象隨時(shí)間的變化規(guī)律,可以發(fā)現(xiàn)時(shí)空演變中隱含的知識(shí),從而為智能警務(wù)地理信息系統(tǒng)等提供有效的決策支持。如圖5所示,時(shí)空數(shù)據(jù)挖掘的過(guò)程分三個(gè)階段:時(shí)空數(shù)據(jù)的準(zhǔn)備階段、時(shí)空數(shù)據(jù)的挖掘階段和時(shí)空數(shù)據(jù)結(jié)果的解釋和評(píng)估階段。2.2.1數(shù)據(jù)準(zhǔn)備數(shù)據(jù)準(zhǔn)備階段主要是定義數(shù)據(jù)挖掘訓(xùn)練數(shù)據(jù)的相關(guān)信息。其具體步驟包括:1、確定維度信息:即訓(xùn)練樣本包含哪些屬性信息。2、數(shù)據(jù)均值化處理:一般情況下,訓(xùn)練數(shù)據(jù)的各個(gè)維度最后統(tǒng)一離散到[0,1]的取值范圍。3、確定交叉驗(yàn)證參數(shù):一般訓(xùn)練樣本分為訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)兩個(gè)部分,直接用驗(yàn)證數(shù)據(jù)去驗(yàn)證訓(xùn)練出來(lái)的模型效果。2.2.2模型訓(xùn)練根據(jù)具體業(yè)務(wù)需求,設(shè)計(jì)數(shù)據(jù)挖掘的算法,然后應(yīng)用海量數(shù)據(jù),通過(guò)算法訓(xùn)練模型。本發(fā)明的訓(xùn)練模型見(jiàn)下表:2.2.2.1時(shí)空關(guān)聯(lián)時(shí)空關(guān)聯(lián)規(guī)則的理論是在關(guān)聯(lián)規(guī)則的基礎(chǔ)之上發(fā)展而來(lái),即既有空間約束又有時(shí)態(tài)約束的關(guān)聯(lián)規(guī)則。其主要用于研究空間對(duì)象隨時(shí)間變化的規(guī)律,發(fā)現(xiàn)海量時(shí)空數(shù)據(jù)中處于一定時(shí)間間隔的空間位置的關(guān)聯(lián)規(guī)則。目前關(guān)聯(lián)規(guī)則挖掘算法中最為流行的是Apriori算法。其核心思想是通過(guò)候選集生成和情節(jié)的向下封閉檢測(cè)兩個(gè)階段來(lái)挖掘頻繁項(xiàng)集,其實(shí)現(xiàn)過(guò)程主要分為兩個(gè)步驟:1.依據(jù)支持度找出所有頻繁項(xiàng)集(頻度)2.依據(jù)置信度產(chǎn)生關(guān)聯(lián)規(guī)則(強(qiáng)度)Apriori算法的應(yīng)用非常廣泛,但其所挖掘的關(guān)聯(lián)規(guī)則一般都假定為永遠(yuǎn)有效。針對(duì)時(shí)空關(guān)聯(lián)規(guī)則挖掘,需要在算法中加入時(shí)間約束和空間約束。其基本步驟為:將含有時(shí)間約束和空間約束的數(shù)據(jù)源首先按照空間位置進(jìn)行整理,生成信息/地址對(duì),然后根據(jù)Apriori算法生成侯選項(xiàng)集,由侯選項(xiàng)集生成頻繁項(xiàng)集,直到頻繁項(xiàng)集不能生成更長(zhǎng)的侯選項(xiàng)集為止。再把時(shí)間因素加入進(jìn)去,將時(shí)間區(qū)間用一個(gè)適宜的推廣因子進(jìn)行推廣,得出相應(yīng)的含有地址約束的項(xiàng)目與擴(kuò)展時(shí)間區(qū)間的元素對(duì),當(dāng)項(xiàng)目/地址對(duì)落入相同的推廣時(shí)間區(qū)間內(nèi),則產(chǎn)生關(guān)聯(lián)規(guī)則,即含有時(shí)空約束的關(guān)聯(lián)規(guī)則。2.2.2.2時(shí)空同現(xiàn)時(shí)空同現(xiàn)模式挖掘是對(duì)復(fù)雜時(shí)空數(shù)據(jù)提取同現(xiàn)模式的過(guò)程。時(shí)空同現(xiàn)模式是在同位模式的基礎(chǔ)上添加了時(shí)空符合興趣度形成的模式??臻g同位模式是從地理空間中發(fā)現(xiàn)的那些頻繁的且緊密相鄰的空間特征的集合,同位規(guī)則試圖將關(guān)聯(lián)規(guī)則泛化為空間索引的點(diǎn)集合數(shù)據(jù)集。時(shí)空同現(xiàn)模式就是在時(shí)空維下,不同對(duì)象類型子集的實(shí)例在一些時(shí)間段中在空間上是相互鄰近的(或符合某種空間關(guān)系的)。同現(xiàn)模式是在同位模式的基礎(chǔ)上,提出時(shí)空復(fù)合興趣度的概念作為同現(xiàn)模式的判斷標(biāo)準(zhǔn)。時(shí)空復(fù)合興趣度是將空間興趣度和時(shí)間興趣度相結(jié)合。依據(jù)時(shí)空同現(xiàn)模式挖掘的基本理論,要進(jìn)行時(shí)空同現(xiàn)模式的挖掘,首先需要挖掘同一時(shí)間段內(nèi)的同位模式。時(shí)空同位模式數(shù)據(jù)挖掘方法基于Apriori算法思想,具體為:1.遍歷計(jì)算空間內(nèi)不同特征類型下,每?jī)蓚€(gè)實(shí)例(分屬于不同的特征類型)之間的期望距離(初步將期望距離定義為歐氏距離)。以任意兩個(gè)實(shí)例間的期望距離為例,可分別計(jì)算出實(shí)例一的不確定點(diǎn)群到實(shí)例二中心點(diǎn)的期望距離,和實(shí)例二的不確定點(diǎn)群到實(shí)例一中心點(diǎn)的期望距離。2.這兩個(gè)實(shí)例間的期望距離便是這兩個(gè)期望距離中的最大值。若實(shí)例間的期望距離小于等于距離閾值,則把該實(shí)例對(duì)作為候選實(shí)例對(duì)。遍歷所有類型下的所有實(shí)例對(duì),直至不再產(chǎn)生候選實(shí)例對(duì)。得到所有的候選實(shí)例對(duì)之后,便需要計(jì)算候選實(shí)例對(duì)中每種特征類型所對(duì)應(yīng)的空間參與度。在得出模式的空間參與度之后,同空間參與度閾值做比較,若前者大于等于后者,那么該模式即為空間同位模式在確定所有的空間同位模式后,再計(jì)算時(shí)空同現(xiàn)模式。先計(jì)算空間同位模式的時(shí)間參與度,若大于等于時(shí)間參與度閾值,則該模式為時(shí)空同現(xiàn)模式。2.2.2.3時(shí)空聚類時(shí)空聚類就是指基于空間和時(shí)間相似度把具有相似行為的時(shí)空對(duì)象劃分到同一組中,使組間差別盡量大,而組內(nèi)差別盡量小。時(shí)空聚類分析能夠更好地發(fā)現(xiàn)和分析地理現(xiàn)象發(fā)展變化的規(guī)律與本質(zhì)特征并預(yù)測(cè)其發(fā)展趨勢(shì)。時(shí)空聚類分析是一種非監(jiān)督分類的方法,它依據(jù)判斷相似性準(zhǔn)則將所有時(shí)空實(shí)體劃分成一系列時(shí)空簇。同一時(shí)空簇內(nèi),對(duì)象之間的差異要盡量小于不同時(shí)空簇的對(duì)象間的差異。本發(fā)明采用時(shí)空密度聚類的算法來(lái)進(jìn)行基于智能采集網(wǎng)點(diǎn)的時(shí)空聚類分析。時(shí)空密度聚類是空間密度聚類在時(shí)空域上的擴(kuò)展,其采用密度作為實(shí)體間相似性的度量標(biāo)準(zhǔn),將時(shí)空簇視為一系列被低密度區(qū)域(噪聲)分割的高密度連通區(qū)域。DBSCAN(Density-BasedSpatialClusteringofApplicationswithNoise)是一個(gè)比較有代表性的基于密度的聚類算法。與劃分和層次聚類方法不同,它將簇定義為密度相連的點(diǎn)的最大集合,能夠把具有足夠高密度的區(qū)域劃分為簇,并可在噪聲的空間數(shù)據(jù)集中發(fā)現(xiàn)任意形狀的聚類。DBSCAN中的幾個(gè)定義:E鄰域:給定對(duì)象半徑為E內(nèi)的區(qū)域稱為該對(duì)象的E鄰域;核心對(duì)象:如果給定對(duì)象E鄰域內(nèi)的樣本點(diǎn)數(shù)大于等于MinPts,則稱該對(duì)象為核心對(duì)象;直接密度可達(dá):對(duì)于樣本集合D,如果樣本點(diǎn)Q在P的E鄰域內(nèi),并且P為核心對(duì)象,那么對(duì)象Q從對(duì)象P直接密度可達(dá);密度可達(dá):對(duì)于樣本集合D,給定一串樣本點(diǎn)Pi,Pv...Pn,P=P1,假如對(duì)象Pi從Pi-l直接密度可達(dá),那么對(duì)象Q從對(duì)象P密度可達(dá);密度相連:存在樣本集合D中的一點(diǎn)0,如果對(duì)象0到對(duì)象P和對(duì)象Q都是密度可達(dá)的,那么P和Q密度相聯(lián)ST-DBSCAN(SpaceTimeDensity-BasedSpatialClusteringofApplicationswithNoise)聚類是DBSCAN聚類在時(shí)間維上的擴(kuò)展。擴(kuò)展的方面是:E鄰域擴(kuò)展為時(shí)空鄰域;直接密度可達(dá)擴(kuò)展為時(shí)空直接密度可達(dá)。除了時(shí)空鄰域定義的改變,顧及非空間屬性的ST-DBSCAN聚類還需要定義算法中的其他概念:時(shí)空對(duì)象、屬性差函數(shù)判定閾值e、時(shí)空直接密度可達(dá)、時(shí)空核心對(duì)象判定閾值MinPts等。2.2.2.4時(shí)空分類時(shí)空分類主要是基于時(shí)空對(duì)象特征構(gòu)建分類模型來(lái)預(yù)測(cè)時(shí)空對(duì)象所屬類別或所在具體空間位置。與時(shí)空聚類不同,時(shí)空分類是一種監(jiān)督分類算法,是以建立統(tǒng)計(jì)識(shí)別函數(shù)為理論基礎(chǔ),依據(jù)典型樣本訓(xùn)練方法進(jìn)行分類的技術(shù):即根據(jù)已知訓(xùn)練區(qū)提供的樣本,通過(guò)選擇特征參數(shù),求出特征參數(shù)作為決策規(guī)則,建立判別函數(shù)以對(duì)各待分類數(shù)據(jù)進(jìn)行分類。適用于監(jiān)督分類的算法很多,如SVM支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)、貝葉斯統(tǒng)計(jì)、決策樹(shù)建模等。針對(duì)智能采集網(wǎng)點(diǎn)時(shí)空數(shù)據(jù)的數(shù)值多樣性的特征,本發(fā)明采用BP神經(jīng)網(wǎng)絡(luò)算法構(gòu)建監(jiān)督分類的預(yù)測(cè)模型。BP神經(jīng)網(wǎng)絡(luò)算法具體為:首先構(gòu)造一個(gè)包含輸入層、輸出層和隱藏層的多層網(wǎng)絡(luò)結(jié)構(gòu)。其中輸入層為經(jīng)處理的智能網(wǎng)點(diǎn)時(shí)空特征數(shù)據(jù),輸出層為時(shí)空數(shù)據(jù)的目標(biāo)類別。其基本特征包括:1、網(wǎng)絡(luò)中每個(gè)神經(jīng)元包含一個(gè)連續(xù)可微的非線性激活函數(shù);2、網(wǎng)絡(luò)展示高度的連接線,其強(qiáng)度由網(wǎng)絡(luò)的突觸權(quán)值確定。BP神經(jīng)網(wǎng)絡(luò)應(yīng)用反向傳播的方法,訓(xùn)練網(wǎng)絡(luò)的各個(gè)突觸權(quán)值。訓(xùn)練過(guò)程分為如下兩個(gè)階段:前向階段:網(wǎng)絡(luò)的突觸權(quán)值是固定的,輸入信號(hào)在網(wǎng)絡(luò)中一層層傳播,直到達(dá)到突出端;反向階段:通過(guò)比較網(wǎng)絡(luò)的輸出和期望輸出產(chǎn)生的誤差信號(hào),將誤差信號(hào)再次通過(guò)網(wǎng)絡(luò)一層層傳播,并對(duì)網(wǎng)絡(luò)的突觸權(quán)值進(jìn)行不斷的修正。2.2.2.5時(shí)空軌跡頻繁根據(jù)現(xiàn)有頻繁模式挖掘的理論成果,本發(fā)明采用一種基于后綴樹(shù)的時(shí)空軌跡頻繁模式挖掘算法結(jié)合DBSCAN算法。后綴樹(shù)是一種數(shù)據(jù)結(jié)構(gòu),能快速解決很多關(guān)于字符串的問(wèn)題。時(shí)空軌跡頻繁模式挖掘可以轉(zhuǎn)換為頻繁序列模式的挖掘,而后綴樹(shù)作為一種數(shù)據(jù)結(jié)構(gòu),可以存儲(chǔ)序列數(shù)據(jù)并且其查詢性能較好。通過(guò)對(duì)后綴樹(shù)進(jìn)行改進(jìn)使其可以存儲(chǔ)興趣區(qū)域序列和時(shí)間信息,而且可以減少數(shù)據(jù)的存儲(chǔ),并可以增量挖掘軌跡模式。算法實(shí)現(xiàn)的具體步驟為:首先通過(guò)后綴樹(shù)挖掘出候選的軌跡頻繁模式,然后進(jìn)一步對(duì)產(chǎn)生的結(jié)果進(jìn)行挖掘,通過(guò)聚類的方式提取出帶有停留時(shí)間的頻繁模式。對(duì)于軌跡化,Tb定義軌跡間的距離,若二者有著不同的置序列,則距離為正無(wú)窮;若二者之間有著相同的位置序列,則計(jì)算其距離。最后通過(guò)基于密度的DBSCAN算法迸行軌跡頻繁項(xiàng)聚類。2.2.3模型測(cè)試對(duì)已保存的模型作驗(yàn)證,通常采用訓(xùn)練樣本數(shù)據(jù)集交叉驗(yàn)證的方法,驗(yàn)證數(shù)據(jù)模型是否符合訓(xùn)練數(shù)據(jù)的期望輸出。2.2.4模型運(yùn)行對(duì)測(cè)試成功的模型,設(shè)置其任務(wù)調(diào)度參數(shù),包括任務(wù)名稱、執(zhí)行方式(立即、定時(shí)、周期)、開(kāi)始執(zhí)行時(shí)間、資源占用等,保存任務(wù)列表。系統(tǒng)按照任務(wù)列表,自動(dòng)生成執(zhí)行計(jì)劃,按時(shí)運(yùn)行各模型任務(wù);支持手工運(yùn)行、定時(shí)運(yùn)行和周期性定時(shí)調(diào)度三種方式。在模型運(yùn)行過(guò)程中,對(duì)模型運(yùn)行進(jìn)行監(jiān)控,包括監(jiān)控當(dāng)前任務(wù)中的信息、當(dāng)前任務(wù)運(yùn)行狀態(tài)、反饋信息、任務(wù)運(yùn)行歷史記錄表等。2.2.5結(jié)果評(píng)價(jià)模型任務(wù)運(yùn)行結(jié)束后,可設(shè)置模型結(jié)果數(shù)據(jù)的展示方式:1、直接查看模式:數(shù)據(jù)結(jié)果將形成數(shù)據(jù)集,存儲(chǔ)在新開(kāi)辟的數(shù)據(jù)資源池中,有權(quán)限的用戶可直接到資源池中查詢查看。2、預(yù)警推送:預(yù)警推送方式通過(guò)與當(dāng)前分析總線進(jìn)行對(duì)接,將分析結(jié)果中預(yù)警信息推送封裝為預(yù)警發(fā)布服務(wù)接口,各警種業(yè)務(wù)系統(tǒng)可調(diào)用該接口,查詢數(shù)據(jù)挖掘分析推送發(fā)布的結(jié)果數(shù)據(jù)集。3時(shí)空數(shù)據(jù)及關(guān)聯(lián)規(guī)則模型存儲(chǔ)管理3.1時(shí)空數(shù)據(jù)管理概述智能物聯(lián)網(wǎng)數(shù)據(jù)分為三大部分:網(wǎng)點(diǎn)感知的時(shí)空數(shù)據(jù)、網(wǎng)點(diǎn)時(shí)空數(shù)據(jù)、時(shí)空關(guān)聯(lián)數(shù)據(jù)。其中網(wǎng)點(diǎn)時(shí)空數(shù)據(jù)和時(shí)空關(guān)聯(lián)數(shù)據(jù)(即數(shù)據(jù)挖掘模型預(yù)測(cè)結(jié)果數(shù)據(jù))存儲(chǔ)于oracle關(guān)系數(shù)據(jù)庫(kù)中,便于信息的增刪改查;每個(gè)智能物聯(lián)網(wǎng)感知的時(shí)空數(shù)據(jù)通過(guò)前文提到的異構(gòu)數(shù)據(jù)加載轉(zhuǎn)換模塊導(dǎo)入HDFS分布式文件系統(tǒng)進(jìn)行處理。3.2智能網(wǎng)點(diǎn)時(shí)空數(shù)據(jù)處理與存儲(chǔ)按照網(wǎng)點(diǎn)編號(hào),存儲(chǔ)每個(gè)網(wǎng)點(diǎn)的空間數(shù)據(jù)和屬性數(shù)據(jù)。包括網(wǎng)點(diǎn)位置、坐標(biāo)、設(shè)備類型、采集信息類型、采集信息的頻率、采集信息的空間覆蓋范圍等。同時(shí)利用空間鄰接分析,結(jié)合時(shí)間服務(wù)半徑,確定每個(gè)物聯(lián)網(wǎng)點(diǎn)間的時(shí)空依賴關(guān)系,并按其時(shí)空依賴關(guān)系存儲(chǔ)物聯(lián)網(wǎng)點(diǎn)間關(guān)系,為物聯(lián)網(wǎng)感知數(shù)據(jù)處理、數(shù)據(jù)挖掘做準(zhǔn)備。主要設(shè)計(jì)的關(guān)系表及關(guān)系表屬性結(jié)構(gòu)如圖8所示。3.2.1對(duì)象時(shí)空關(guān)聯(lián)關(guān)系存儲(chǔ)以感知對(duì)象人、車(chē)為例,從人、地、車(chē)、時(shí)間四個(gè)維度描述對(duì)象的時(shí)空關(guān)系。主要關(guān)系分為:1人員時(shí)空行為挖掘與存儲(chǔ)2車(chē)輛時(shí)空行為挖掘與存儲(chǔ)3人員與車(chē)輛時(shí)空關(guān)系挖掘與存儲(chǔ)4人員與人員時(shí)空關(guān)系挖掘與存儲(chǔ)5車(chē)輛與車(chē)輛時(shí)空關(guān)系挖掘與存儲(chǔ)主要設(shè)計(jì)的關(guān)系表及關(guān)系表屬性結(jié)構(gòu)如圖9所示。3.2.2對(duì)象分類關(guān)系存儲(chǔ)對(duì)象分類關(guān)系存儲(chǔ)主要管理某一時(shí)間段內(nèi)、針對(duì)某一具體警情時(shí)間所做的聚類分析、分類分析結(jié)果。其數(shù)據(jù)關(guān)系表及關(guān)系表屬性結(jié)構(gòu)如圖10所示。根據(jù)上述說(shuō)明書(shū)的揭示和教導(dǎo),本發(fā)明所屬領(lǐng)域的技術(shù)人員還可以對(duì)上述實(shí)施方式的相關(guān)模塊和軟件架構(gòu)做適應(yīng)性變更和修改。因此,本發(fā)明并不局限于上面揭示和描述的具體實(shí)施方式,對(duì)發(fā)明的一些修改和變更也應(yīng)當(dāng)落入本發(fā)明的權(quán)利要求的保護(hù)范圍內(nèi)。此外,盡管本說(shuō)明書(shū)中使用了一些特定的術(shù)語(yǔ),但這些術(shù)語(yǔ)只是為了方便說(shuō)明,并不對(duì)本發(fā)明構(gòu)成任何限制。當(dāng)前第1頁(yè)1 2 3