一種高速鐵路余票信息及上下凈客流量的獲取方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及鐵路票務(wù)系統(tǒng)技術(shù)領(lǐng)域,特別是一種高速鐵路余票信息及上下凈客流 量的獲取方法。
【背景技術(shù)】
[0002] 目前,我國已經(jīng)進(jìn)入高鐵時代,高鐵出行客流量在2013年已達(dá)到5. 3億人次,占當(dāng) 年全國鐵路完成旅客發(fā)送量的四分之一。特別是較早建設(shè)的幾條高鐵線路,如京滬高鐵、滬 寧城際等,已成為其所在區(qū)域經(jīng)濟(jì)發(fā)展的重要推動力。高鐵不僅帶來了時空距離的壓縮,更 為重要的是改變了我們的生活與工作的空間。對于城市規(guī)劃而言,在區(qū)域?qū)用嫔?,高鐵影響 了區(qū)域格局,提升了區(qū)域可達(dá)性,加強(qiáng)了區(qū)域城市之間的聯(lián)系;在城市層面上,高鐵站點是 高鐵線路上的節(jié)點,也是城市連接高鐵的窗口。節(jié)點交通價值的重要衡量指標(biāo)是站點間的 客流量,然而怎樣去反映站點間的客流量呢?由于高鐵客流OD矩陣數(shù)據(jù)難以獲得,但高鐵 余票數(shù)據(jù)是公開數(shù)據(jù),可以通過高鐵售票網(wǎng)站查詢得到。因此,用高鐵余票去間接衡量站點 間的客流量將是一種切實可行的方法。
[0003] 由于高鐵每班列車運(yùn)能數(shù)據(jù)獲取困難,通過余票來反推實際旅客出行人數(shù)也難以 完成,也就是說,直接利用余票信息難以得出城市站點間的關(guān)系,且對于同一車次的兩個高 鐵站點間的余票信息可能會受到其他站點乘客購買車票的影響而發(fā)生變化。例如,一條高 鐵線路包含四個高鐵站點,分別為A、B、C、D,A到D的余票量會受到C到D之間乘客量的影 響,A到C的余票量會受到B到C之間乘客量的影響。簡言之,通過高鐵余票不能得出兩個 高鐵站點間實際發(fā)生的旅客出行人數(shù),且不能夠反映出高鐵旅客的出發(fā)地與目的地所在。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明所要解決的技術(shù)問題是克服現(xiàn)有技術(shù)的不足而提供一種高速鐵路余票信 息及上下凈客流量的獲取方法,本發(fā)明能夠快速查詢到高鐵站點間的余票量,并根據(jù)余票 量計算出站點在一天的上下凈客流量情況。
[0005] 本發(fā)明為解決上述技術(shù)問題采用以下技術(shù)方案: 根據(jù)本發(fā)明提出的一種高速鐵路余票信息及上下凈客流量的獲取方法,包括以下步 驟: 步驟1 ),設(shè)置要抓取余票的起始日期,且起始日期在當(dāng)前日期之后,輸入抓取線路的所 有站點名稱并查詢到所有待抓取余票信息的監(jiān)聽條件,監(jiān)聽條件保存為列表形式; 步驟2),根據(jù)監(jiān)聽條件中的抓取時間點信息自動抓取所有余票信息,當(dāng)抓取完每天全 部的余票信息后,將當(dāng)天所有抓取得到的余票信息以列表的形式保存;同時,在每天的指定 時間段內(nèi),重復(fù)步驟1),獲取到第二天所有監(jiān)聽條件; 步驟3),讀取步驟2)中所保存的余票信息,并計算出每個高鐵站點的上下凈客流量 值; 步驟4),根據(jù)步驟3)中計算出的每個高鐵站點的上下凈客流量值,統(tǒng)計并繪制出高鐵 站點每天的上下凈客流量值變化情況。
[0006] 作為本發(fā)明所述的一種高速鐵路余票信息及上下凈客流量的獲取方法進(jìn)一步優(yōu) 化方案,所述步驟1)中輸入抓取線路的所有高鐵站點名稱并查詢到所有待抓取余票信息的 監(jiān)聽條件,具體如下: 步驟1. 1),選擇鐵路線路運(yùn)行的任意一個方向,并按照此方向依次輸入線路上所有站 點的中文名稱并將其以列表形式進(jìn)行保存,形成站點名稱列表;所選擇的運(yùn)行方向記為順 向,相反的運(yùn)行方向則記為逆向; 步驟1. 2),查詢在步驟I. 1)所形成的站點名稱列表中的任意兩個不同站點所有可能 存在的車次信息,所述車次信息包括以下字段:車次名稱、車次編號、出發(fā)站名稱、到達(dá)站名 稱、出發(fā)站代碼、到達(dá)站代碼、車次從出發(fā)站發(fā)車時間、車次所對應(yīng)的始發(fā)站名稱、車次所對 應(yīng)的終點站名稱以及車次方向,其中,車次從出發(fā)站發(fā)車時間字段精確到分鐘,所有車次信 息按照列表形式保存,形成車次信息列表,所述"車次方向"記錄內(nèi)容為步驟1. 1)所述的"順 向"與"逆向"; 步驟1. 3),對步驟1. 2)中的車次信息列表進(jìn)行循環(huán)操作,判斷車次信息列表中的任意 兩個站點是否為所對應(yīng)車次中相鄰的兩個站點:如果是相鄰的兩個站點,則在列表里新增 名為"是否相鄰"的字段,并記錄為相鄰,否則記錄為不相鄰;完成循環(huán)操作后的列表為新列 表;所得新列表即為所有待抓取余票信息的監(jiān)聽條件。
[0007] 作為本發(fā)明所述的一種高速鐵路余票信息及上下凈客流量的獲取方法進(jìn)一步優(yōu) 化方案,所述步驟2)中所述根據(jù)監(jiān)聽條件中的抓取時間點信息,自動抓取所有余票信息,具 體如下: 步驟2. 1),每隔預(yù)設(shè)的時間段監(jiān)測一次計算機(jī)系統(tǒng)實時時間; 步驟2. 2),如果監(jiān)聽條件中存在車次從出發(fā)站發(fā)車時間與系統(tǒng)實時時間相同的記錄, 則查詢記錄里出發(fā)站與到達(dá)站之間存在的各類座位所剩余票數(shù),所得余票量信息記錄在相 應(yīng)的每條記錄里;如果監(jiān)聽條件中不存在車次從出發(fā)站發(fā)車時間與系統(tǒng)實時時間相同的記 錄,則不做任何處理。
[0008] 作為本發(fā)明所述的一種高速鐵路余票信息及上下凈客流量的獲取方法進(jìn)一步優(yōu) 化方案,所述預(yù)設(shè)的時間段為10秒-40秒。
[0009] 作為本發(fā)明所述的一種高速鐵路余票信息及上下凈客流量的獲取方法進(jìn)一步優(yōu) 化方案,所述步驟3)具體如下: 步驟3. 1),讀取步驟2)中所保存的余票信息,刪除所有不是相鄰站點所產(chǎn)生余票的記 錄,在計算機(jī)內(nèi)存中以列表的形式存儲,記為List ; 步驟3. 2),對List中的數(shù)據(jù)先按照"車次名稱"排序,再按照"車次從出發(fā)站發(fā)車時間" 排序; 步驟3. 3),對List中的每條記錄進(jìn)行各類座位余票量累加求和,結(jié)果保存在新加字段 "余票總數(shù)"里; 步驟3. 4),對List新建一個字段,記為"上下凈客流量",對List每個車次所有記錄 按照"車次從出發(fā)站發(fā)車時間"字段里存儲的時間先后順序排序,后一個時間點所得余票總 數(shù)值減去前一個時間點所得余票總數(shù)值,所得結(jié)果賦值給后一個時間點的"上下凈客流量" 字段中;其中,每個車次在每天首個抓取時間點的"上下凈客流量"為空; 步驟3. 5),當(dāng)List中存在只有兩個相鄰的??空军c的車次,記這兩個高鐵站點的余票 數(shù)為a,設(shè)高鐵火車票預(yù)售的天數(shù)為n,連續(xù)抓取在第(n-13)至η天內(nèi)這兩個高鐵站點每天 的余票數(shù),取其中最大的余票數(shù)b,將b減去a的差值作為在出發(fā)站的凈上客流量。
[0010] 作為本發(fā)明所述的一種高速鐵路余票信息及上下凈客流量的獲取方法進(jìn)一步優(yōu) 化方案,所述步驟4)具體如下: 步驟4. 1),刪除"上下凈客流量"為空的數(shù)據(jù); 步驟4. 2),按照"出發(fā)站名稱"和"車次從出發(fā)站發(fā)車時間"兩個字段進(jìn)行高級排序,即 先按照"出發(fā)站名稱"排序,在此排序的基礎(chǔ)上,再按照"車次從出發(fā)站發(fā)車時間"排序;按照 列車運(yùn)行方向不同進(jìn)行分組統(tǒng)計,以"車次從出發(fā)站發(fā)車時間"為橫軸,以"上下凈客流量" 為縱軸,繪制出各個站點的上下凈客流量一天內(nèi)變化情況。
[0011] 本發(fā)明采用以上技術(shù)方案與現(xiàn)有技術(shù)相比,具有以下技術(shù)效果: (1) 本發(fā)明提供了一種基于高鐵余票的數(shù)據(jù)挖掘方法,即基于余票的高鐵站點上下凈 客流量計算模型。通過此模型,可以反映出高鐵站點在兩個運(yùn)行方向上每天所產(chǎn)生的上下 凈客流量,進(jìn)而分析出高鐵站點在區(qū)域和城市中所承擔(dān)的功能,為城市規(guī)劃編制等工作提 供有效的決策支撐,由于技術(shù)方法可以對全國高鐵線路進(jìn)行分析,因此本發(fā)明方法的適用 性更強(qiáng)。這有利于通過對運(yùn)行較為成熟的高鐵線路進(jìn)行分析,總結(jié)經(jīng)驗,指導(dǎo)當(dāng)前很多新建 尚鐵線路與站點的選址; (2) 本發(fā)明還提供了一種可以按照天的變化自動抓取高鐵余票的方法,并判斷出兩個 站點間的余票是不是基于同一個車次相鄰的兩個站點,這為長期觀察高鐵客流運(yùn)行規(guī)律提 供了基礎(chǔ),也有利于快速計算出高鐵站點的上下凈客流量變化情況;同時,此方案按照天來 自動保存余票抓取的信息,提高了信息存儲與讀取的效率,由于存儲數(shù)據(jù)格式統(tǒng)一,也有利 于信息的高效處理; (3) 本發(fā)明對于某些車次只有2個??空军c的情況進(jìn)行了以下創(chuàng)造性的處理:假設(shè)高 鐵火車票預(yù)售的天數(shù)為20天,以當(dāng)前時間為第1天,那么在一般情況下,第20天購買車票 的人數(shù)很少,可以近似的認(rèn)為第20天查詢到的余票數(shù)是這次列車的最大可承載人數(shù),也就 是此列車的運(yùn)能。為避免一些特殊情況下的出現(xiàn),本發(fā)明是取一定天數(shù)內(nèi)出現(xiàn)的余票最大 值作為研究車次的運(yùn)能。那么,運(yùn)能減去當(dāng)前時間下查詢到的余票數(shù)也就是列車實際乘坐 的大概人數(shù),即凈上車的客流數(shù)。雖然這種方法所得出的運(yùn)能可能會比實際運(yùn)能有所減小, 但考慮到列車只有2個停靠站點,不存在車票在不同站點的分配問題,同時對于高鐵票不 是很緊張的情況下,所得結(jié)果是非常接