本發(fā)明屬于軌道交通運行領(lǐng)域,涉及一種基于軌道ic卡和手機信令數(shù)據(jù)的乘客出行路線識別方法。
背景技術(shù):
進入21世紀(jì),隨著我國城市化水平的不斷,城市人口密度將迅速加大,由此產(chǎn)生的交通擁堵問題也會越來越嚴(yán)峻,這將成為制約經(jīng)濟、社會、文化發(fā)展的重要因素之一。城市軌道交通作為公共交通的重要組成部分,將成為解決城市交通擁堵的有效交通方式。由于軌道交通具有節(jié)能、省地、運量大、全天候、準(zhǔn)點、無污染又安全等特點,可以得出這樣的結(jié)論:城市軌道交通的發(fā)展安全符合可持續(xù)發(fā)展原則。因此未來很長一段時間將會是城市軌道交通蓬勃發(fā)展的黃金時期。據(jù)資料顯示,到2016年底我國運營軌道交通的城市達(dá)到26個,運行總里程3748.67公里。其中上海運營城市軌道交通(包括城市地鐵和輕軌,下同)總長達(dá)到617公里,已成為目前世界上運營軌道交通線路最長的城市。北京運營了554公里,廣州運營了308公里,都進入了世界運營軌道交通最長的城市行列。現(xiàn)在,軌道交通已經(jīng)成為許多城市中不可或缺的、最主要的交通工具。根據(jù)遠(yuǎn)期規(guī)劃,到2020年全國城市軌道交通總里程將達(dá)到6100公里,其中北京市城市軌道交通的總里程將超過1000公里,公共交通將成為80%左右市民的主要出行交通工具,其中有50%左右的人將經(jīng)常使用城市軌道交通作為出行工具。
目前,北京市城市軌道交通路網(wǎng)的高峰日總客流達(dá)到了1100萬人次,并且伴隨著路網(wǎng)的不斷完善,客流量隨之增加,但與此同時,運營管理的問題日益凸顯,一些車主站臺的乘客滯留問題亟待解決,尤其是早晚高峰時期,對于車站站臺乘客的管理措施不夠完善,乘客滯留問題給車站管理帶來了巨大壓力,降低了乘客的出行效率。當(dāng)前,隨著人們出行水平的提高、時間觀念的增強以及對出行效率、出行安全的需求增長,研究人員對影響軌道交通運行的影響因素進行越來越多地研究。
在輕軌、地鐵車站中,上下車是主要的交通活動之一,乘客上下車的速度不僅影響著地鐵站內(nèi)人群的活動,同時也影響著列車的停車時間以及服務(wù)水平。乘客在上下車的過程中,經(jīng)常出現(xiàn)搶上搶下、秩序混亂的現(xiàn)象,不僅降低了乘客上下車的效率,也帶來了嚴(yán)重的安全隱患。這些現(xiàn)象嚴(yán)重制約了城市軌道交通的高效運行。因此,需要提供一種能夠準(zhǔn)確判斷乘客出行路線的方法,并能準(zhǔn)確的判斷乘客經(jīng)過各個站點的時間。這對于預(yù)測高峰時段和非高峰時段客流量有很大的幫助,對于軌道交通管理者對軌道交通的管理也有非常大的意義。
技術(shù)實現(xiàn)要素:
有鑒于此,本發(fā)明的目的在于提供一種基于軌道ic卡和手機信令數(shù)據(jù)的乘客出行路線識別方法,具體包括如下技術(shù)方案:
一種基于軌道ic卡和手機信令數(shù)據(jù)的乘客出行路線識別方法,該方法包括以下步驟:
s1:采集軌道交通乘客ic卡、手機信令數(shù)據(jù)信息,原始數(shù)據(jù)經(jīng)過切分整理后成為預(yù)處理數(shù)據(jù),對預(yù)處理數(shù)據(jù)進行od匹配;
s2:然后根據(jù)k(k=3)最短路徑識別算法,選出從起始站點到出站站點的3條路徑,分別為:最短路徑、次短路徑、漸短路徑;
s3:根據(jù)匹配好的od數(shù)據(jù)進行od時間訓(xùn)練,得出每個起始站點到出站站點的平均訓(xùn)練時間;
s4:然后進行路徑篩選,從步驟s2的3條路徑中根據(jù)s3訓(xùn)練好的od時間,識別出乘客最有可能的出行路徑;
s5:最后進行站點時間反推,根據(jù)最終的路徑,反推到達(dá)每個站點的時間。
進一步,在步驟s1中,所述對預(yù)處理數(shù)據(jù)進行od匹配主要以時間序列為主,對每個用戶分別按時間進行先后排序,結(jié)合進出站標(biāo)識來確定用戶的每對od;在匹配過程中要對異常數(shù)據(jù)進行處理,具體包括以下步驟:
s11:剔除只有進站記錄或只有出站記錄的數(shù)據(jù);
s12:進出站標(biāo)識與時間序列相反,將根據(jù)出站記錄中的上次進站時間信息進行修正匹配,如果修正不了則剔除;
s13:多次進站一次出站或一次進站多次出站,將進出站按最接近時間進行匹配,只需要將時間最接近的兩條數(shù)據(jù)匹配到一起即可;
s14:進進出出的情況,即單個用戶經(jīng)過時間排序后連續(xù)兩次進站連續(xù)兩次出站的情況;根據(jù)出站記錄中的上次進站時間信息進行修正匹配,如果修正不了則剔除該情況的四條數(shù)據(jù);
s15:對于每天凌晨0點前后的數(shù)據(jù)要結(jié)合后一天的數(shù)據(jù)進行匹配,如果仍然匹配不上則剔除;
s16:剔除匹配后同站進同站出的od,匹配成功的數(shù)據(jù)須作為中間結(jié)果輸出。
進一步,所述步驟s2具體包括以下步驟:
s21:求出站點之間的賦權(quán)鄰接矩陣,權(quán)值為站點之間的距離;
s22:依次求得起始站點o到各個站點的最短路,直到遍歷所有的站點;
1)令l(o0)=0,對d≠o0,令l(d)=∞,s0={o0},i=0;
2)對每個d∈si’(si’=v\si),用min{l(v),l(o)+w(od)}代替l(o);
計算min{l(v)}其中v∈si’,把達(dá)到這個最小值的一個頂點記為oi+1,令si+1=siu{di+1};
3)若i=|v|-1,停止;若i<|v|-1,用i+1代替i,轉(zhuǎn)2)。
進一步,在步驟s3中,所述根據(jù)匹配好的od數(shù)據(jù)進行od時間訓(xùn)練包括:輸入至少一個月匹配好的od結(jié)果數(shù)據(jù):卡編號;卡類型;進站站點編號;進站時間;出站站點編號;出站時間;金額;進站閘機編號;出站閘機編號;換乘標(biāo)示;輸出結(jié)果為od及訓(xùn)練好的時間:進站站點編號;出站站點編號;時間(秒)。
進一步,在步驟s4中,所述進行路徑篩選包括:輸入為:卡編號;卡類型;進站站點編號;進站時間;出站站點編號;出站時間;金額;進站閘機編號;出站閘機編號;換乘標(biāo)示;ksp路徑;輸出為:卡編號;卡類型;進站站點編號;進站時間;出站站點編號;出站時間;金額;進站閘機編號;出站閘機編號;換乘標(biāo)示;最終選擇的一條路徑。
進一步,在步驟s5中,所述的進行站點時間反推具體包括:每個出行會有兩個時間,一個是出站時間減去進站時間的實際時間,另一個是模型計算出來的路徑時間,兩者中取較小的時間作為出行的時間花費;根據(jù)時間花費,由這次出行的出站時間開始反推,依次反推到此次出行的每個站點時間。
本發(fā)明的有益效果在于:本發(fā)明提供的方法可以為正確疏導(dǎo)乘客上下車提供參考,有助于提高軌道交通的運營效率。
附圖說明
為了使本發(fā)明的目的、技術(shù)方案和有益效果更加清楚,本發(fā)明提供如下附圖進行說明:
圖1為od匹配算法流程圖;
圖2為od時間訓(xùn)練框圖;
圖3為路徑選擇流程框圖;
圖4為站點時間反推流程框圖;
圖5為本發(fā)明所述方法的流程示意圖。
具體實施方式
下面將結(jié)合附圖,對本發(fā)明的優(yōu)選實施例進行詳細(xì)的描述。
圖5為本發(fā)明所述方法的流程示意圖,如圖所示,本發(fā)明提供的一種基于軌道ic卡和手機信令數(shù)據(jù)的乘客出行路線識別方法包括以下步驟:
s1:采集軌道交通乘客ic卡、手機信令數(shù)據(jù)信息,原始數(shù)據(jù)經(jīng)過切分整理后成為預(yù)處理數(shù)據(jù),對預(yù)處理數(shù)據(jù)進行od匹配;
s2:然后根據(jù)k(k=3)最短路徑識別算法,選出從起始站點到出站站點的3條路徑,分別為:最短路徑、次短路徑、漸短路徑;
s3:根據(jù)匹配好的od數(shù)據(jù)進行od時間訓(xùn)練,得出每個起始站點到出站站點的平均訓(xùn)練時間;
s4:然后進行路徑篩選,從步驟s2的3條路徑中根據(jù)s3訓(xùn)練好的od時間,識別出乘客最有可能的出行路徑;
s5:最后進行站點時間反推,根據(jù)最終的路徑,反推到達(dá)每個站點的時間。
具體來說:
圖1為od匹配算法流程圖,在步驟s1中,所述對預(yù)處理數(shù)據(jù)進行od匹配主要以時間序列為主,對每個用戶分別按時間進行先后排序,結(jié)合進出站標(biāo)識來確定用戶的每對od;在匹配過程中要對異常數(shù)據(jù)進行處理,具體包括以下步驟:
s11:剔除只有進站記錄或只有出站記錄的數(shù)據(jù);
s12:進出站標(biāo)識與時間序列相反,將根據(jù)出站記錄中的上次進站時間信息進行修正匹配,如果修正不了則剔除;
s13:多次進站一次出站或一次進站多次出站,將進出站按最接近時間進行匹配,只需要將時間最接近的兩條數(shù)據(jù)匹配到一起即可;
s14:進進出出的情況,即單個用戶經(jīng)過時間排序后連續(xù)兩次進站連續(xù)兩次出站的情況;根據(jù)出站記錄中的上次進站時間信息進行修正匹配,如果修正不了則剔除該情況的四條數(shù)據(jù);
s15:對于每天凌晨0點前后的數(shù)據(jù)要結(jié)合后一天的數(shù)據(jù)進行匹配,如果仍然匹配不上則剔除;
s16:剔除匹配后同站進同站出的od,匹配成功的數(shù)據(jù)須作為中間結(jié)果輸出。
所述步驟s2具體包括以下步驟:
s21:求出站點之間的賦權(quán)鄰接矩陣,權(quán)值為站點之間的距離;
s22:依次求得起始站點o到各個站點的最短路,直到遍歷所有的站點;
1)令l(o0)=0,對d≠o0,令l(d)=∞,s0={o0},i=0;
2)對每個d∈si’(si’=v\si),用min{l(v),l(o)+w(od)}代替l(o);
計算min{l(v)}其中v∈si’,把達(dá)到這個最小值的一個頂點記為oi+1,令si+1=siu{di+1};
3)若i=|v|-1,停止;若i<|v|-1,用i+1代替i,轉(zhuǎn)2)。
圖2為od時間訓(xùn)練框圖,在步驟s3中,所述根據(jù)匹配好的od數(shù)據(jù)進行od時間訓(xùn)練包括:輸入至少一個月匹配好的od結(jié)果數(shù)據(jù):卡編號;卡類型;進站站點編號;進站時間;出站站點編號;出站時間;金額;進站閘機編號;出站閘機編號;換乘標(biāo)示;輸出結(jié)果為od及訓(xùn)練好的時間:進站站點編號;出站站點編號;時間(秒)。
圖3為路徑選擇流程框圖,在步驟s4中,所述進行路徑篩選包括:輸入為:卡編號;卡類型;進站站點編號;進站時間;出站站點編號;出站時間;金額;進站閘機編號;出站閘機編號;換乘標(biāo)示;ksp路徑;輸出為:卡編號;卡類型;進站站點編號;進站時間;出站站點編號;出站時間;金額;進站閘機編號;出站閘機編號;換乘標(biāo)示;最終選擇的一條路徑。
圖4為站點時間反推流程框圖,在步驟s5中,所述的進行站點時間反推具體包括:每個出行會有兩個時間,一個是出站時間減去進站時間的實際時間,另一個是模型計算出來的路徑時間,兩者中取較小的時間作為出行的時間花費;根據(jù)時間花費,由這次出行的出站時間開始反推,依次反推到此次出行的每個站點時間。
最后說明的是,以上優(yōu)選實施例僅用以說明本發(fā)明的技術(shù)方案而非限制,盡管通過上述優(yōu)選實施例已經(jīng)對本發(fā)明進行了詳細(xì)的描述,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,可以在形式上和細(xì)節(jié)上對其作出各種各樣的改變,而不偏離本發(fā)明權(quán)利要求書所限定的范圍。