1.一種基于時空網(wǎng)絡(luò)的時空同現(xiàn)模式挖掘方法,其特征在于,包括如下步驟:
步驟1,對時空數(shù)據(jù)集進行初始化建模,建立用以表示實例及元素之間時空關(guān)系的雙層時空網(wǎng)絡(luò),并保存所述時空網(wǎng)絡(luò)對應(yīng)的鄰接矩陣;其中,所述時空網(wǎng)絡(luò)包括實例網(wǎng)絡(luò)層及元素網(wǎng)絡(luò)層,所述元素網(wǎng)絡(luò)層用于生成候選集;
步驟2,從所述實例網(wǎng)絡(luò)層中讀取相應(yīng)鄰近關(guān)系序列,計算模式支持度及空間頻繁度;
步驟3,從所述元素網(wǎng)絡(luò)層讀取模式的鄰近關(guān)系,計算模式的時間頻繁度;
步驟4,根據(jù)模式的各時間槽空間頻繁度及時間頻繁度計算模式的權(quán)重特征值;
步驟5,將所有同現(xiàn)模式按照權(quán)重特征值進行排序,根據(jù)輸入的模式比例值,輸出滿足條件的模式集。
2.根據(jù)權(quán)利要求1所述的基于時空網(wǎng)絡(luò)的時空同現(xiàn)模式挖掘方法,其特征在于,所述步驟1具體包括:
輸入時空數(shù)據(jù)集,讀取時空數(shù)據(jù)集的屬性信息,獲得各元素類型的元素周期;
將時空數(shù)據(jù)集預(yù)處理成預(yù)定格式;其中,所述預(yù)定格式的內(nèi)容包括實例編號、元素類型、位置信息、時間信息;
將時空數(shù)據(jù)集中所有數(shù)據(jù)點按時間槽劃分,計算各時間槽中元素實例的時空距離;其中,所述時空距離為曼哈頓距離;
獲取時空距離閾值D;
獲取元素實例間的時空距離小于等于閾值D,而且元素實例都處于所述元素周期的元素實例對,保存具有鄰近關(guān)系的實例對;
獲取各時間槽內(nèi)的鄰近關(guān)系;
根據(jù)獲取的各時間槽內(nèi)的鄰近關(guān)系建立實例網(wǎng)絡(luò)層,并采用鄰接矩陣保存所述實例網(wǎng)絡(luò)層;
根據(jù)所述實例網(wǎng)絡(luò)層的各實例的元素類型,建立元素網(wǎng)絡(luò)層,并采用鄰接矩陣保存所述元素網(wǎng)絡(luò)層。
3.根據(jù)權(quán)利要求2所述的基于時空網(wǎng)絡(luò)的時空同現(xiàn)模式挖掘方法,其特征在于,獲取各時間槽內(nèi)的鄰近關(guān)系包括:
當(dāng)所述具有鄰近關(guān)系的實例對首次出現(xiàn):
將鄰近關(guān)系的兩個結(jié)點連接,邊上的鄰近系列對應(yīng)的當(dāng)前時間槽位設(shè)為1;
在鄰近序列中在當(dāng)前時間槽之前的,若是在實例對應(yīng)的模式的時間框架內(nèi),設(shè)為0;
在鄰近序列中在當(dāng)前時間槽之前的,若不在模式的時間框架內(nèi),設(shè)為-1;
當(dāng)所述具有鄰近關(guān)系的實例對非首次出現(xiàn):
在實例連接的邊上,對應(yīng)的時間槽位設(shè)為1。
4.根據(jù)權(quán)利要求3所述的基于時空網(wǎng)絡(luò)的時空同現(xiàn)模式挖掘方法,其特征在于,步驟2中,所述計算模式支持度包括:
獲取未計算模式支持度的元素;
統(tǒng)計在元素網(wǎng)絡(luò)層中,與所述元素相連的實例總數(shù);
統(tǒng)計在對應(yīng)時間槽序列中為1的實例數(shù),即實例支持?jǐn)?shù);
求出實例支持?jǐn)?shù)與實例總數(shù)的比值,即所述元素的模式支持度。
5.根據(jù)權(quán)利要求4所述的基于時空網(wǎng)絡(luò)的時空同現(xiàn)模式挖掘方法,其特征在于,步驟2中,所述計算空間頻繁度包括:
獲取未計算空間頻繁度的模式;
求得所述模式中所有元素的元素框架交集,即模式的時間框架;
在時間框架下,獲取未計算空間頻繁度的時間槽;
求得所述時間槽下模式最小模式支持度,即模式的空間頻繁度;其中,所述時間槽下若沒有元素實例集在實例網(wǎng)絡(luò)層存在同現(xiàn)關(guān)系,則空間頻繁度為0。
6.根據(jù)權(quán)利要求5所述的基于時空網(wǎng)絡(luò)的時空同現(xiàn)模式挖掘方法,其特征在于,所述步驟3具體包括:
獲取未計算時間頻繁度的模式;
在元素網(wǎng)絡(luò)中,獲取所述模式所有元素之間值為1的所有時間槽,即可能同現(xiàn)的時間槽;
用同現(xiàn)的時間槽數(shù)除以模式時間框架時間槽數(shù),求得模式的時間頻繁度。
7.根據(jù)權(quán)利要求6所述的基于時空網(wǎng)絡(luò)的時空同現(xiàn)模式挖掘方法,其特征在于,所述步驟4具體包括:
獲取未計算權(quán)重特征值的模式;
將所述模式在所有時間槽的空間頻繁度作為空間特征,計算空間頻繁度均值;
計算同現(xiàn)模式的權(quán)重特征值,公式如下:
權(quán)重特征值=空間頻繁度均值×?xí)r間頻繁度。
8.根據(jù)權(quán)利要求7所述的基于時空網(wǎng)絡(luò)的時空同現(xiàn)模式挖掘方法,其特征在于,所述步驟5具體包括:
采用堆排序方法按所述權(quán)重特征值對所有模式進行排序,得到模式鏈表;
按照需求,輸入最需要的時空同現(xiàn)模式的比例值k;
按照比例值k,從模式鏈表中取排在前k的模式集,獲取時空同現(xiàn)模式集。