欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種時(shí)空規(guī)律的地鐵乘客聚類和邊緣檢測(cè)方法

文檔序號(hào):6526852閱讀:249來(lái)源:國(guó)知局
一種時(shí)空規(guī)律的地鐵乘客聚類和邊緣檢測(cè)方法
【專利摘要】本發(fā)明屬于信息數(shù)據(jù)處理【技術(shù)領(lǐng)域】,提供了一種時(shí)空規(guī)律的地鐵乘客聚類和邊緣檢測(cè)方法,包括如下步驟:S1、從包含乘客所有乘車記錄的源數(shù)據(jù)中獲取時(shí)空規(guī)律的地鐵乘客的時(shí)空規(guī)律詳細(xì)信息;S2、根據(jù)所述獲取的時(shí)空規(guī)律詳細(xì)信息,對(duì)時(shí)空規(guī)律的地鐵乘客進(jìn)行聚類;S3、對(duì)聚類后的時(shí)空規(guī)律的地鐵乘客進(jìn)行邊緣檢測(cè)及邊緣特征分析。本發(fā)明基于時(shí)空數(shù)據(jù)挖掘?qū)Φ罔F乘客分類,按照時(shí)空規(guī)律乘客的規(guī)律時(shí)段數(shù)量將時(shí)空規(guī)律乘客做聚類,并對(duì)每一類時(shí)空規(guī)律乘客作分析和邊緣檢測(cè),可以有效了解乘客的生活特征。
【專利說(shuō)明】一種時(shí)空規(guī)律的地鐵乘客聚類和邊緣檢測(cè)方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于信息數(shù)據(jù)處理【技術(shù)領(lǐng)域】,具體涉及一種時(shí)空規(guī)律的地鐵乘客聚類和邊緣檢測(cè)方法。
【背景技術(shù)】
[0002]相比傳統(tǒng)的公共交通付費(fèi)方式,如現(xiàn)金支付、年卡、月卡,智能卡具有方便性、便捷性、成本低等優(yōu)點(diǎn);相比傳統(tǒng)的公共交通數(shù)據(jù)采集、決策服務(wù)能力、生活服務(wù)能力等方面,智能卡具有數(shù)據(jù)完整性、一致性、數(shù)據(jù)采集成本低、分析結(jié)果精準(zhǔn)性、可靠等優(yōu)點(diǎn)。
[0003]綜上,智能卡的使用已經(jīng)帶來(lái)了非常明顯的方便和好處,智能卡在現(xiàn)代公共交通方面已成為不可或缺的工具,得到了快速普及和廣泛的應(yīng)用。在大數(shù)據(jù)時(shí)代,以交通智能卡消費(fèi)數(shù)據(jù)為核心,挖掘市民生活特征及規(guī)律已成為智慧城市等領(lǐng)域研究的重要方向之一,目前對(duì)智能卡消費(fèi)數(shù)據(jù)的分析主要集中在三個(gè)方面:1、基礎(chǔ)數(shù)據(jù)分析;2、乘客行為分析、乘客需求預(yù)測(cè)、個(gè)人出行模式分析;3、結(jié)合一、二兩方面做交通長(zhǎng)期規(guī)劃,策略調(diào)整,提高交通質(zhì)量、生活服務(wù)能力和數(shù)據(jù)決策服務(wù)能力。
[0004]目前,基于乘客的時(shí)空規(guī)律對(duì)乘客進(jìn)行分類的相關(guān)研究比較少,現(xiàn)有的相關(guān)研究主要集中于結(jié)合智能卡的類型對(duì)乘客做分析,并比較不同類型的乘客特征的差異性。而針對(duì)乘客的時(shí)空特征對(duì)乘客分類的相關(guān)研究比較少。

【發(fā)明內(nèi)容】

[0005]本發(fā)明要解決的技術(shù)問(wèn)題在于提供一種時(shí)空規(guī)律的地鐵乘客聚類和邊緣檢測(cè)方法,具有高穩(wěn)定性、可靠性、安全性。
[0006]本發(fā)明的技術(shù)方案包括一種時(shí)空規(guī)律的地鐵乘客聚類和邊緣檢測(cè)方法,包括如下步驟:
[0007]S1、從包含乘客所有乘車記錄的源數(shù)據(jù)中獲取時(shí)空規(guī)律的地鐵乘客的時(shí)空規(guī)律詳細(xì)信息;
[0008]S2、根據(jù)所述獲取的時(shí)空規(guī)律詳細(xì)信息,對(duì)時(shí)空規(guī)律的地鐵乘客進(jìn)行聚類;
[0009]S3、對(duì)聚類后的時(shí)空規(guī)律的地鐵乘客進(jìn)行邊緣檢測(cè)及邊緣特征分析。
[0010]進(jìn)一步地,所述源數(shù)據(jù)包括智能交通卡消費(fèi)信息表和地鐵線路表;
[0011]所述智能交通卡消費(fèi)信息表包括智能交通卡的卡號(hào)、地鐵站刷卡終端的終端號(hào)、用戶的刷卡時(shí)間、進(jìn)站或出站標(biāo)識(shí);
[0012]所述地鐵線路表包括線路名稱、途經(jīng)站點(diǎn)、線路類型,所述線路類型包括上行和下行;
[0013]所述時(shí)空規(guī)律的地鐵乘客為出行時(shí)間和出行地點(diǎn)均比較規(guī)律的乘客。
[0014]進(jìn)一步地,所述步驟SI具體包括:
[0015]S11、對(duì)包含乘客所有乘車記錄的源數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理;
[0016]S12、以智能交通卡的卡號(hào)作為唯一標(biāo)識(shí),從經(jīng)過(guò)數(shù)據(jù)預(yù)處理后的數(shù)據(jù)中讀取每張卡的乘車記錄;
[0017]S13、對(duì)乘客進(jìn)行分類,將時(shí)空規(guī)律乘客的tag值設(shè)為一預(yù)定值;
[0018]S14、對(duì)于所述步驟S13中分類后的時(shí)空規(guī)律乘客,將全天分成η個(gè)時(shí)間段,計(jì)算時(shí)
空規(guī)律乘客乘車各時(shí)間段的乘車天數(shù)
【權(quán)利要求】
1.一種時(shí)空規(guī)律的地鐵乘客聚類和邊緣檢測(cè)方法,其特征在于,包括如下步驟: S1、從包含乘客所有乘車記錄的源數(shù)據(jù)中獲取時(shí)空規(guī)律的地鐵乘客的時(shí)空規(guī)律詳細(xì)信息; S2、根據(jù)所述獲取的時(shí)空規(guī)律詳細(xì)信息,對(duì)時(shí)空規(guī)律的地鐵乘客進(jìn)行聚類; S3、對(duì)聚類后的時(shí)空規(guī)律的地鐵乘客進(jìn)行邊緣檢測(cè)及邊緣特征分析。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述源數(shù)據(jù)包括智能交通卡消費(fèi)信息表和地鐵線路表; 所述智能交通卡消費(fèi)信息表包括智能交通卡的卡號(hào)、地鐵站刷卡終端的終端號(hào)、用戶的刷卡時(shí)間、進(jìn)站或出站標(biāo)識(shí); 所述地鐵線路表包括線路名稱、途經(jīng)站點(diǎn)、線路類型,所述線路類型包括上行和下行; 所述時(shí)空規(guī)律的地鐵乘客為出行時(shí)間和出行地點(diǎn)均比較規(guī)律的乘客。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述步驟SI具體包括: S11、對(duì)包含乘客所有乘車記錄的源數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理; S12、以智能交通卡的卡號(hào)作為唯一標(biāo)識(shí),從經(jīng)過(guò)數(shù)據(jù)預(yù)處理后的數(shù)據(jù)中讀取每張卡的乘車記錄; S13、對(duì)乘客進(jìn)行分類,將時(shí)空規(guī)律乘客的tag值設(shè)為一預(yù)定值; S14、對(duì)于所述步驟S13中分類后的時(shí)空規(guī)律乘客,將全天分成η個(gè)時(shí)間段,計(jì)算時(shí)空規(guī)



律乘客乘車各時(shí)間段的乘車天數(shù)
4.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟S2具體包括:S21、以智能交通卡的卡號(hào)作為唯一標(biāo)識(shí),從規(guī)律時(shí)空詳情列表sptmList中讀取一張卡的所有時(shí)空規(guī)律詳細(xì)信息P ; S22、判斷是否有任何簇建立,若沒(méi)有,則建立新簇C,并將對(duì)象P加入簇C,將對(duì)象P標(biāo)識(shí)為已處理,簇C的中心值為對(duì)象P的峰值數(shù)量size ;若已經(jīng)有簇建立,則執(zhí)行步驟S23 ;S23、計(jì)算對(duì)象P與每個(gè)簇中心的距離;若存在某個(gè)簇Ci的中心與對(duì)象P的峰值數(shù)量size相等,則將所述對(duì)象P歸類到簇Ci ;否則,建立新簇Cj,并將對(duì)象P加入簇Cj ;S24、重復(fù)執(zhí)行步驟S21-S23,直到所有對(duì)象都被處理并歸入了某個(gè)簇,并按照簇中智能交通卡的卡號(hào)的數(shù)量對(duì)所有簇排序。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述步驟S3具體包括: 531、基于簇的大小,對(duì)所有簇分類,將簇劃分為邊緣簇abnCluster和非邊緣簇nCluster,其中所述邊緣簇abnCluster為簇的數(shù)量與平均簇的數(shù)量的比值小于設(shè)定閾值的簇,非邊緣簇nCluster為簇的數(shù)量與平均簇的數(shù)量的比值大于或等于設(shè)定閾值的簇; 532、依次讀取非邊緣簇nCluster中的每一個(gè)簇Ci,建立int[i] [η]數(shù)組Si,所述η為將全天分成η個(gè)時(shí)間段; 533、依次取出簇Ci中一位乘客的規(guī)律時(shí)空詳情列表sptmList,按高峰時(shí)段的大小對(duì)規(guī)律時(shí)空詳情列表sptmList排序和編號(hào),并將對(duì)應(yīng)的數(shù)組Si元素的η值加I ; 534、重復(fù)執(zhí)行步驟S33,直到簇Ci中所有的乘客都處理完; 535、分析所述數(shù)組Si的結(jié)果分布情況; 536、若非邊緣簇nCluster中的所有簇都分析完畢,執(zhí)行步驟S37;否則重復(fù)執(zhí)行步驟S32-S36 ; 537、依次讀取邊緣簇abnCluster中的每一個(gè)簇Ci,并按照乘客的時(shí)空特征按照步驟S32-S34進(jìn)行分析; S8:若邊緣簇abnCluster中的所有簇都分析完畢,則結(jié)束;否則重復(fù)執(zhí)行步驟S37。
6.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟Sll具體包括: SI 11、過(guò)濾缺失字段的交易記錄; 5112、將智能交通卡過(guò)濾處 理后的所有交易記錄按時(shí)間排序,并計(jì)算智能交通卡中的每一乘車記錄; 5113、計(jì)算每一智能交通卡的總刷卡天數(shù); SI 14、將步驟SI 12、SI 13中的數(shù)據(jù)結(jié)果匯總; SI 15、對(duì)每一智能交通卡執(zhí)行步驟SI I 1-Sl 14,直到全部智能交通卡均被處理; S116、對(duì)輸出結(jié)果進(jìn)行統(tǒng)計(jì),計(jì)算乘車天數(shù)概率分布。
7.根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟S13通過(guò)如下方式對(duì)乘客進(jìn)行分類: 5131、提取每一智能交通卡的交易記錄; 5132、判斷刷卡天數(shù)是否小于一預(yù)設(shè)閾值,是則輸出類別1:極少出行乘客,執(zhí)行步驟S136 ;否則執(zhí)行步驟S133 ; 5133、利用基于時(shí)間的用戶出行規(guī)律算法Tm-ODCluster,計(jì)算最密集的時(shí)間段Sm和時(shí)間密集概率Pt,并判斷是否時(shí)間規(guī)律,是則為時(shí)間規(guī)律,執(zhí)行步驟S134,否則執(zhí)行步驟S135 ; 5134、在所述時(shí)間段Sm內(nèi),利用基于空間的用戶出行規(guī)律算法Sp-ODCluster,判斷出行地點(diǎn)是否規(guī)律,是則輸出類別4:時(shí)間和空間規(guī)律性乘客,否則輸出類別2:單時(shí)間規(guī)律性乘客;之后執(zhí)行步驟S136 ; 5135、利用基于空間的用戶出行規(guī)律算法Sp-ODCluster,判斷全天時(shí)間內(nèi)出行地點(diǎn)是否規(guī)律,是則輸出類別3:單空間規(guī)律性乘客,否則輸出類別5:時(shí)間和空間均不規(guī)律乘客; 5136、判斷全部智能交通卡是否均被處理,是則結(jié)束,否則返回執(zhí)行步驟S131; 其中所述類別4:時(shí)間和空間規(guī)律性乘客為所述時(shí)空規(guī)律乘客。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述基于時(shí)間的用戶出行規(guī)律算法Tm-ODCluster 包括: Al、以天為周期、m分鐘為時(shí)段間隔,計(jì)算每一天所有時(shí)間段的乘車狀態(tài)(0,1);


A2、計(jì)算所述每一時(shí)間段的乘車天數(shù)
9.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述基于空間的用戶出行規(guī)律算法Sp-ODCluster 包括: B1、查詢時(shí)間段T內(nèi)所有乘車記錄,將所述乘車記錄以(0,D)標(biāo)記,其中,O為入口站、D為出口站,并統(tǒng)計(jì)從O進(jìn)D出的乘坐天數(shù); 形成數(shù)據(jù)記錄集ODLIST (O, D, daynum, timelst),其中,Daynum為天數(shù),timelst為時(shí)間集合; B2、采用OD-cluster算法對(duì)OD進(jìn)行聚類,判斷兩站點(diǎn)之間的相似性:若兩站點(diǎn)為相鄰站點(diǎn),則相似性為I,否則為O; B3、取出最大的簇的總天數(shù)Dmax,計(jì)算空間密集概率Ps=Dmax/Dnum,其中,Dnum為乘客刷卡總天數(shù); 若Ps大于空間密度閾值Thrs,則為空間規(guī)律性乘客;否則,為空間不規(guī)律性乘客。
10.根據(jù)權(quán)利要求9所述的方法,其特征在于,所述OD-cluster算法包括, Cl、從所述數(shù)據(jù)記錄集ODLIST中順序提取對(duì)象P,并判斷是否有簇,是則轉(zhuǎn)到步驟C2, 否則建立簇,以所述對(duì)象P為中心、總天數(shù)為所述對(duì)象P的天數(shù)建立新簇C,將所述對(duì)象P加入所述新簇C,并將所述對(duì)象P標(biāo)識(shí)為已處理; C2、計(jì)算所述對(duì)象P與每個(gè)簇中心的距離; 若某個(gè)簇Ci的中心與對(duì)象P滿足相似性標(biāo)準(zhǔn),則將所述對(duì)象P歸類到所述簇Ci,所述簇Ci的總天數(shù)=總天數(shù)+對(duì)象P的天數(shù)-(對(duì)象P的時(shí)間集與簇Ci中時(shí)間集交集的成員數(shù)量), 否則建立以對(duì)象P為中心、總天數(shù)為對(duì)象P的天數(shù)建立新簇C,并將所述對(duì)象P加入所述新簇C ; C3、重復(fù)上述步驟,直到所有記錄都被處理并歸入某個(gè)簇Ci,并按總天數(shù)對(duì)所有簇Ci從大到小排序。
【文檔編號(hào)】G06F19/00GK103699801SQ201310750251
【公開(kāi)日】2014年4月2日 申請(qǐng)日期:2013年12月31日 優(yōu)先權(quán)日:2013年12月31日
【發(fā)明者】趙娟娟, 張帆, 白雪, 須成忠, 鄒瑜斌, 田臣, 熊文 申請(qǐng)人:深圳先進(jìn)技術(shù)研究院
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
文山县| 嘉义县| 克拉玛依市| 阜宁县| 光泽县| 泊头市| 赤水市| 肥西县| 忻城县| 扬州市| 无极县| 许昌县| 崇文区| 娄烦县| 图木舒克市| 信丰县| 昂仁县| 岚皋县| 玉树县| 增城市| 仙游县| 陆良县| 寿光市| 中宁县| 临夏市| 汾阳市| 德阳市| 吉隆县| 无极县| 凤山市| 凉城县| 积石山| 西盟| 壤塘县| 济宁市| 电白县| 曲周县| 扬中市| 江安县| 乌拉特中旗| 开平市|