欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于地鐵數(shù)據(jù)進(jìn)行站點聚類的可視化方法與流程

文檔序號:12364254閱讀:516來源:國知局
一種基于地鐵數(shù)據(jù)進(jìn)行站點聚類的可視化方法與流程
本發(fā)明涉及交通數(shù)據(jù)可視化領(lǐng)域,尤其涉及一種基于地鐵數(shù)據(jù)進(jìn)行站點聚類的可視化方法。
背景技術(shù)
:隨著城市交通的快速發(fā)展,隨之產(chǎn)生了大量的交通數(shù)據(jù),這些交通數(shù)據(jù)具有時間屬性、空間屬性,通過這些屬性能夠真實的反應(yīng)交通客流狀況。地鐵為城市居民出行提供極大便利,成為公共交通的重要組成部分,每天有大量的乘客通過刷卡進(jìn)出各個地鐵站點。每個站點的客流數(shù)據(jù)與站點附近區(qū)域的功能息息相關(guān)。其中根據(jù)地鐵客流數(shù)據(jù),發(fā)現(xiàn)具有類似功能的地鐵站點,這種區(qū)域功能的發(fā)現(xiàn)對了解城市結(jié)構(gòu)有著極為重要的意義。然而地鐵數(shù)據(jù)的龐雜和抽象造成從這些數(shù)據(jù)中挖掘信息并不容易,而可視化技術(shù)結(jié)合可視圖表的展示形式和人機(jī)交互,操作簡化分析過程,用戶通過交互修改分析模型的參數(shù),從而生成新的可視化結(jié)果,經(jīng)過可視化分析,能夠從地鐵數(shù)據(jù)中得到更多有價值的信息。技術(shù)實現(xiàn)要素:本發(fā)明的目的主要針對上述數(shù)據(jù)分析的不便之處,提出一種基于地鐵數(shù)據(jù)進(jìn)行站點聚類的可視化方法,通過對地鐵刷卡數(shù)據(jù)處理,提取出能夠反映路段地鐵站點客流模式的特征值,通過交互式參數(shù)設(shè)置,對各個地鐵站點進(jìn)行聚類,并對聚類結(jié)果進(jìn)行可視化展示。為了解城市結(jié)構(gòu)提供有效信息。本發(fā)明是通過以下技術(shù)方案達(dá)到上述目的:一種基于地鐵數(shù)據(jù)進(jìn)行站點聚類的可視化方法,其包括如下步驟:S1:對地鐵數(shù)據(jù)進(jìn)行預(yù)處理;S2:對S1所述地鐵數(shù)據(jù)進(jìn)行時空探索;S3:通過聚類算法對地鐵站點進(jìn)行聚類;S4:可視化展示聚類結(jié)果。其中S1具體包含:地鐵刷卡數(shù)據(jù)的清洗,如清除缺失值、噪聲數(shù)據(jù)等,以及地鐵基礎(chǔ)數(shù)據(jù)的規(guī)范化處理。其中S2具體包含如下步驟:S2.1:將地鐵線路站點信息映射到OpenStreetMap地圖上;S2.2:用戶交互的進(jìn)行時間和空間上的過濾;S2.3:對S2.2所述過濾結(jié)果進(jìn)行可視化展示,包括顯示進(jìn)出站客流量變化情況的環(huán)形圖和折線圖。其中S3具體包含如下步驟:S3.1:時間劃分:根據(jù)地鐵站客流特征,將一天劃分成m個時間段;S3.2:空間劃分:根據(jù)所述地鐵基礎(chǔ)數(shù)據(jù),將每個地鐵站點作為一個空間單元,劃分成n個空間單元;S3.3:對于S3.2所述的每個空間單元,分別統(tǒng)計其在S3.1所述的m個時間段內(nèi)的進(jìn)站人數(shù)和出站人數(shù),形成n*2m的地鐵站點客流特征矩陣。將此矩陣記為D,它是一個包含n個對象的數(shù)據(jù)集;S3.4:接收用戶動態(tài)輸入的參數(shù)k(k≤n),并作為站點聚類算法的簇數(shù);S3.5:從D中隨機(jī)選取k個對象,作為k個簇各自的中心,初始化后的k個簇的中心分別記為:μ(0)=μ1(0),...,μk(0)]]>S3.6:分別計算D中各個對象j∈{1,...,n}到k個簇中心的相似度,將這些對象分別劃分到最接近的中心點所在的簇,公式如下:Cluster(t)(j)←argmini||μi-xj||2S3.7:根據(jù)S3.6聚類結(jié)果,重新計算k個簇各自的中心,計算公式如下:μi(t+1)←argminμΣj:Cluster(j)=i||μ-xj||2]]>S3.8:重復(fù)步驟S3.6–S3.7,直到每個簇的中心點μi不再發(fā)生變化。其中S4具體包含如下步驟:S4.1:在地鐵基礎(chǔ)數(shù)據(jù)集上,標(biāo)記每個站點所屬的簇Clusteri(0≤i<k);S4.2:通過地鐵乘客刷卡數(shù)據(jù),得到每次旅程的起始站點所屬的簇、目的站點所屬的簇和出行所屬時間段;S4.3:根據(jù)所述S4.2中的數(shù)據(jù),計算不同時間段,不同簇之間乘客的流動模式;S4.4:繪制弦圖,用戶選擇時間段,通過弦圖對比不同簇之間的客流模式,分析人類移動規(guī)律。附圖說明圖1為一種基于地鐵數(shù)據(jù)進(jìn)行站點聚類的可視化方法的流程圖;圖2為本發(fā)明實施案例利用上海市地鐵基礎(chǔ)數(shù)據(jù)可視化展示地鐵線路站點信息;圖3為本發(fā)明實施案例利用上海市2015年4月的地鐵刷卡數(shù)據(jù)做時空選擇的效果圖;圖4為本發(fā)明實施案例完成時空選擇后,展示進(jìn)出站客流量對比的環(huán)形圖;圖5為本發(fā)明實施案例完成時空選擇后,顯示不同時間點具體客流量的折線圖;圖6為本發(fā)明實施案例利用上海市2015年4月的地鐵刷卡數(shù)據(jù)聚類后得到的可視化效果圖;圖7為本發(fā)明實施案例利用上海市2015年4月的地鐵刷卡數(shù)據(jù)動態(tài)聚類后可視化不同區(qū)域乘客流動模式的弦圖。具體實施方式為了使本發(fā)明的目的、技術(shù)方案和優(yōu)點更加清楚,下面將對本發(fā)明的具體實施方式作進(jìn)一步的詳細(xì)描述。本發(fā)明實施例提供了一種基于地鐵數(shù)據(jù)進(jìn)行站點聚類的可視化方法,流程如圖1所示,該方法包括:S1:對截止2015年4月上海市已經(jīng)開通的14條地鐵線路的基礎(chǔ)數(shù)據(jù)和2015年4月上海地鐵乘客刷卡數(shù)據(jù)做預(yù)處理。地鐵線路基礎(chǔ)數(shù)據(jù)包括線路信息和站點信息,分別如下表1,表2所示。表1編號名稱注釋1線路編號取值為01-13或16,唯一標(biāo)識一條線路2線路中文名稱站點實際中文名稱3線路英文名稱站點實際英文名稱4線路類型取值為“直線”或“環(huán)線”5線路總長以“公里”為單位6線路顏色顏色的十六進(jìn)制值表2編號名稱注釋1車站編號唯一標(biāo)識一個車站2車站中文名稱站點實際中文名稱3車站英文名稱站點實際英文名稱4所述線路編號取值為1-13或16的整數(shù),標(biāo)記已開通的14條線路5車站GPS緯度以“度”為單位6車站GPS緯度以“度”為單位7換乘標(biāo)志取值為“普通站”或“換乘站”8下行序號標(biāo)記站點的連接關(guān)系9車站敷設(shè)方式取值為“地下”、“地面”、“高架”地鐵乘客刷卡數(shù)據(jù)的結(jié)構(gòu)如下表3所示。編號名稱注釋1卡號唯一標(biāo)識一張地鐵卡2刷卡日期格式為yyyy-mm-dd3刷卡時間格式為hh:mm:ss4線路站點名稱格式為x號線xx站5交易金額以“元”為單位6交易性質(zhì)取值為“優(yōu)惠”或“非優(yōu)惠”S2:根據(jù)地鐵基礎(chǔ)數(shù)據(jù),可視化展示上海地鐵14條線路291個站點的相關(guān)信息,效果圖如圖2所示,并對S1所述地鐵乘客刷卡數(shù)據(jù)進(jìn)行時空探索,步驟如下:S2.1:用戶通過交互操作,進(jìn)行時間和空間維度上的過濾。其中時間上的選擇包括起始日期、起始時間的選擇和終止日期、終止時間的選擇,可選范圍為2015年4月1日到30日;空間維度上的選擇包括在地圖上圈選區(qū)域或繪制多邊形等方式。時空過濾如圖3所示。S2.2:對S2.1所述過濾結(jié)果進(jìn)行可視化的展示,包括展示進(jìn)出站客流量對比的環(huán)形圖,如圖4所示;顯示不同時間點具體客流量的折線圖,如圖5所示。S3:使用S1所述兩類數(shù)據(jù)對地鐵站點客流特征建模,提取不同站點客流模式,用戶通過交互式操作完成參數(shù)設(shè)置后,通過提取的客流模式和用戶輸入?yún)?shù)對地鐵站點進(jìn)行聚類,步驟如下:S3.1:時間劃分:根據(jù)上海地鐵線路運營時間和乘客出行規(guī)律,將一天劃分成4個峰段,具體的劃分方式如表4所示。峰段起始時間終止時間早平峰05:00:0006:59:59早高峰07:00:0008:59:59午平峰09:00:0016:59:59晚高峰17:00:0019:29:59晚平峰19:30:0023:29:59S3.2:空間劃分:依據(jù)所述地鐵基礎(chǔ)數(shù)據(jù),將每個地鐵站點作為一個空間單元,劃分成291個空間單元;S3.3:對于每個空間單元,分別統(tǒng)計其在4個峰段內(nèi)的進(jìn)站人數(shù)ini(0≤i≤4)和出站人數(shù)outi(0≤i≤4),形成291*8的地鐵站點客流特征矩陣。將此矩陣記為D,它是一個包含291個對象的數(shù)據(jù)集。S3.4:接收用戶動態(tài)選擇的參數(shù)k(k≤n),為了使站點劃分有意義,限制k為2-10之間的整數(shù),將k作為站點聚類算法的簇數(shù);S3.5:從S3.3所述客流矩陣D中隨機(jī)選取k個對象,作為k個簇各自的中心,初始化后的k個簇的中心分別記為:μ(0)=μ1(0),...,μk(0)]]>S3.6:分別計算D中各個對象j∈{1,...,n}到k個簇中心的相似度,將這些對象分別劃分到最接近的中心點所在的簇,公式如下:cluster(t)(j)←argmini||μi-xj||2S3.7:根據(jù)S3.6所述聚類結(jié)果,重新計算k個簇各自的中心,計算公式如下:μi(t+1)←argminμΣj:Cluster(j)=i||μ-xj||2]]>S3.8:重復(fù)步驟S3.6–S3.7,直到每個簇的中心點μi不發(fā)生變化,即完成地鐵站點的劃分,各個站點被分別劃分到k個簇中。S4:根據(jù)聚類結(jié)果,可視化展示不同地鐵站點分區(qū)之間乘客流動模式;S4.1:在地鐵基礎(chǔ)數(shù)據(jù)集上,標(biāo)記每個站點所屬的區(qū)域Clusteri(0≤i<k);S4.2:處理地鐵乘客刷卡數(shù)據(jù),生成一個數(shù)據(jù)庫表,包含每次旅程的起始站點所屬區(qū)域、目的站點所屬區(qū)域和出行所屬時間峰段;S4.3:統(tǒng)計相同時間峰段內(nèi),不同區(qū)域之間乘客的流動模式。S4.4:根據(jù)S3所述聚類結(jié)果,對S2.2所述可視化展示做進(jìn)一步處理,即依據(jù)站點劃分結(jié)果將屬于同一區(qū)域的站點做相同的顏色標(biāo)記,如圖6所示;S4.5:根據(jù)S3所述聚類結(jié)果和S4.3所述乘客流動模式,對S3.1所述4個時間段分別繪制弦圖,用戶可以交互式的選擇對比不同時間段、不同區(qū)域之間客流的模式,當(dāng)發(fā)生交互事件時,弦圖將顯示不同區(qū)域之間的客流信息,如圖7所示。當(dāng)前第1頁1 2 3 
當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
二手房| 安溪县| 阿拉善左旗| 绥滨县| 温宿县| 赣榆县| 肇东市| 小金县| 龙游县| 大竹县| 清苑县| 资源县| 定州市| 青岛市| 自治县| 西乡县| 社会| 微博| 横山县| 建宁县| 邵阳市| 拜泉县| 梧州市| 陇西县| 隆回县| 孝昌县| 萍乡市| 富平县| 乐安县| 扎赉特旗| 白沙| 金秀| 紫金县| 陆丰市| 汨罗市| 明星| 南康市| 武胜县| 大英县| 四平市| 忻城县|