地鐵中的站距表數(shù)據(jù)。3. 根據(jù)權(quán)利要求2所述的基于公交1C卡數(shù)據(jù)的通勤乘客特征提取方法,其特征在于,所 述根據(jù)所述1C卡使用數(shù)據(jù)提取使用所述1C卡的乘客的出行0D鏈,并根據(jù)所述出行0D鏈提取 所述乘客在一天時(shí)間中首次和末次出行0D鏈的步驟中: 根據(jù)采集的公交車(chē)和地鐵中的站距表數(shù)據(jù)信息,將所述站距表中預(yù)定區(qū)域的站點(diǎn)進(jìn)行 劃分聚類(lèi); 根據(jù)所述公交1C卡使用數(shù)據(jù)基于換乘時(shí)間間隔闊值小于預(yù)定值的情況下合并生成所 述出行0D鏈; 根據(jù)所述站距表中預(yù)定區(qū)域的站點(diǎn)進(jìn)行劃分聚類(lèi)后,更新所述出行0D鏈; 根據(jù)更新后的所述出行0D鏈提取所述乘客在一天時(shí)間中首次和末次出行0D鏈。4. 根據(jù)權(quán)利要求2-3任一項(xiàng)所述的基于公交1C卡數(shù)據(jù)的通勤乘客特征提取方法,其特 征在于, 所述通勤乘客的相同出行天數(shù)為統(tǒng)計(jì)的所述通勤乘客的實(shí)際出行天數(shù); 所述通勤乘客的相同通勤時(shí)段為,首先提取所述首次和末次出行0D鏈中最頻首次出行 時(shí)段及最頻末次出行時(shí)段,然后統(tǒng)計(jì)所述最頻首次出行時(shí)段及所述最頻末次出行時(shí)段次 數(shù),最后對(duì)其進(jìn)行加和; 所述通勤乘客的相同通勤站點(diǎn)為,首先將所述首次和末次出行0D鏈中首次出行0D鏈的 起始點(diǎn)和末次出行0D鏈的終止點(diǎn)設(shè)為居住地,將所述首次出行0D鏈的終止點(diǎn)和所述末次出 行0D鏈的起始點(diǎn)設(shè)為工作地;然后統(tǒng)計(jì)最頻居住地及最頻工作地,統(tǒng)計(jì)所述最頻居住地次 數(shù)與所述最頻居住地次數(shù),最后對(duì)統(tǒng)計(jì)的次數(shù)進(jìn)行加和; 所述通勤乘客的相同通勤線(xiàn)路,首先提取所述首次和末次出行0D鏈中的最頻首次出行 線(xiàn)路及最頻末次出行線(xiàn)路,統(tǒng)計(jì)所述最頻首次出行線(xiàn)路及所述最頻末次出行線(xiàn)路次數(shù);然 后統(tǒng)計(jì)所述首次和末次出行0D鏈中非所述最頻首次出行線(xiàn)路但是起點(diǎn)為所述最頻居住地, 終點(diǎn)為所述最頻工作地的次數(shù),統(tǒng)計(jì)所述首次和末次出行0D鏈中最頻末次出行線(xiàn)路但是起 點(diǎn)為所述最頻工作地,終點(diǎn)為所述最頻居住地的次數(shù);然后對(duì)上述統(tǒng)計(jì)的次數(shù)進(jìn)行加和。5. 根據(jù)權(quán)利要求4所述的基于公交1C卡數(shù)據(jù)的通勤乘客特征提取方法,其特征在于,所 述將所述站距表中預(yù)定區(qū)域的站點(diǎn)進(jìn)行劃分聚類(lèi)的步驟中: 通過(guò)空間聚類(lèi)方法對(duì)所述站距表中預(yù)定區(qū)域的站點(diǎn)進(jìn)行劃分聚類(lèi);和/或, 所述在根據(jù)所述公交1C卡使用數(shù)據(jù)基于換乘時(shí)間間隔闊值小于預(yù)定值的情況下合并 生成所述出行0D鏈的步驟中: 換乘的方式包括地鐵換乘公交、第一公交換乘第二公交W及公交換乘地鐵; 所述地鐵換乘公交的交易時(shí)間差為所述公交下車(chē)時(shí)間減去所述地鐵下車(chē)時(shí)間,換乘時(shí) 間間隔闊值為104分鐘; 所述第一公交換乘第二公交的交易時(shí)間差為換乘后所述第二公交下車(chē)時(shí)間減去換乘 前所述第一公交下車(chē)時(shí)間,換乘時(shí)間間隔闊值為112分鐘; 所述公交換乘地鐵的交易時(shí)間差為所述地鐵上車(chē)時(shí)間減去所述公交下車(chē)時(shí)間,換乘時(shí) 間間隔闊值為20分鐘;和/或, 所述首先提取所述首次和末次出行OD鏈中最頻首次出行時(shí)段及最頻末次出行時(shí)段步 驟中:提取時(shí)段是W半小時(shí)為一個(gè)單位,時(shí)段1至24為上半天,時(shí)段25至48為下半天,時(shí)段的 劃分均基于下車(chē)時(shí)間。6. -種基于權(quán)利要求1-5任意一項(xiàng)所述的基于公交1C卡數(shù)據(jù)的通勤乘客特征的基于公 交1C卡數(shù)據(jù)的通勤乘客判定方法,其特征在于,包括: 通過(guò)優(yōu)劣解距離法對(duì)提取的所述通勤乘客的相同出行天數(shù)、所述通勤乘客的相同通勤 時(shí)段、所述通勤乘客的相同通勤站點(diǎn)、所述通勤乘客的相同通勤線(xiàn)路的數(shù)據(jù)進(jìn)行打分分析; 通過(guò)迭代自組織數(shù)據(jù)分析方法對(duì)提取的所述通勤乘客的相同出行天數(shù)、所述通勤乘客 的相同通勤時(shí)段、所述通勤乘客的相同通勤站點(diǎn)、所述通勤乘客的相同通勤線(xiàn)路的數(shù)據(jù)進(jìn) 行聚類(lèi)分析; 通過(guò)所述打分分析與所述聚類(lèi)分析判定所述乘客是否為滿(mǎn)足預(yù)定要求的通勤乘客。7. 根據(jù)權(quán)利要求6所述的基于公交1C卡數(shù)據(jù)的通勤乘客判定方法,其特征在于,所述通 過(guò)優(yōu)劣解距離法對(duì)提取的所述通勤乘客的相同出行天數(shù)、所述通勤乘客的相同通勤時(shí)段、 所述通勤乘客的相同通勤站點(diǎn)、所述通勤乘客的相同通勤線(xiàn)路的數(shù)據(jù)進(jìn)行打分分析;的步 驟包括: 步驟一:將多組(m)所述通勤乘客的相同出行天數(shù)Xii、所述通勤乘客的相同通勤時(shí)段 Xl2、所述通勤乘客的相同通勤站點(diǎn)Xl3、所述通勤乘客的相同通勤線(xiàn)路Xl4;輸入指標(biāo)矩陣:步驟二:將多組(m)所述通勤乘客的相同出行天數(shù)Xii、所述通勤乘客的相同通勤時(shí)段 Xl2、所述通勤乘客的相同通勤站點(diǎn)Xl3、所述通勤乘客的相同通勤線(xiàn)路Xl4;進(jìn)行歸一化數(shù)據(jù) (r):步驟Ξ:計(jì)算多組(m)所述通勤乘客的相同出行天數(shù)Xii、所述通勤乘客的相同通勤時(shí)段 Xl2、所述通勤乘客的相同通勤站點(diǎn)Xl3、所述通勤乘客的相同通勤線(xiàn)路Xl4的賭權(quán)值(W):其中k=l/ln m,數(shù)目m為上述已知的組數(shù),保證0<wj< 1; 通過(guò)所述賭權(quán)值對(duì)所述歸一化數(shù)據(jù)進(jìn)行加權(quán)處理(Vij),vu = ;Tij · Wj (i = 1,2,…,m; j = 1,2,...,4); 步驟四:確定正負(fù)理想解,并求出各個(gè)指標(biāo)的距離:步驟六:轉(zhuǎn)化為優(yōu)劣解距離法百分制打分3。〇的(;〇:3(3〇'日(;〇 = 50?1〇旨10(100?(:〇 + 50, (i = l ,2,... ,m)。8.根據(jù)權(quán)利要求6所述的基于公交1C卡數(shù)據(jù)的通勤乘客判定方法,其特征在于,所述通 過(guò)迭代自組織數(shù)據(jù)分析方法對(duì)提取的所述通勤乘客的相同出行天數(shù)、所述通勤乘客的相同 通勤時(shí)段、所述通勤乘客的相同通勤站點(diǎn)、所述通勤乘客的相同通勤線(xiàn)路的數(shù)據(jù)進(jìn)行聚類(lèi) 分析的步驟包括: 步驟一:輸入預(yù)選參數(shù)C、K、ON、OS、OC、IW及L,并輸入N個(gè)模式樣本{xi,i = 1,2,…,N}; 預(yù)選C個(gè)初始聚類(lèi)中屯、{Z1,Z2,'''ZC}; 步驟二:將N個(gè)樣本分給最近的聚類(lèi)Sj,如果Dj=min{ I |x-Zi| I,i = l,2,…C},即I |x-Zi| 的距離最小,則xeSj; 步驟Ξ:如果&的樣本數(shù)目小于ON,則取消該樣本子集,此時(shí)C減去1 步驟四:修正各聚類(lèi)中屯、步驟五::計(jì)算各聚類(lèi)域&中模式樣本與各聚類(lèi)中屯、間的平均距離:步驟六:計(jì)算全部模式樣本和其對(duì)應(yīng)聚類(lèi)中屯、的總平均距離:步驟屯:判別分裂、合并及迭代運(yùn)算: (1) 若迭代運(yùn)算次數(shù)已達(dá)到I次,即最后一次迭代,則置oc=o,轉(zhuǎn)至步驟十一; (2) 若即聚類(lèi)中屯、的數(shù)目小于或等于規(guī)定值的一半,則轉(zhuǎn)至步驟八; (3) 若迭代運(yùn)算的次數(shù)是偶數(shù)次,或C^2K,不進(jìn)行分裂處理,轉(zhuǎn)至步驟十一;否則,即既 不是偶數(shù)次迭代,又不滿(mǎn)足C ^ 2K,轉(zhuǎn)至步驟八; 步驟八:計(jì)算每個(gè)聚類(lèi)中樣本距離的標(biāo)準(zhǔn)差向量:〇ij = ( 〇lj,〇2j,· · ·,〇nj )Τ 其中,i = l,2,,n,n為樣本特征向量的維度,j = l,2,,C為聚類(lèi)數(shù),Nj為Sj的樣本個(gè)數(shù); 步驟九:求每一標(biāo)準(zhǔn)差向量{Oj, j = l,2,···,C}中的最大分量{Ojmax, j = l ,2,···,C}為代 表; 步驟十:在任一最大分量集{ Ojmax,j = 1,2,…,C}中,若有〇jmax>0S,同時(shí)又滿(mǎn)足如下兩 個(gè)條件之一: (1) >D和Nj>2(0N+l),即S沖樣本總數(shù)超過(guò)值的一倍W上; 爐f. 則將Zj分裂成兩個(gè)新的聚類(lèi)中屯、Zj +和Zj-,且C加1,其中Zj+對(duì)應(yīng)于Ojmax的分量加上k · 〇jmax,Zj對(duì)應(yīng)于Ojmax的分量減去k · Ojmax,其中k = 0.5; 步驟^ :計(jì)算全部聚類(lèi)中屯、的距離:Dij = I |zi-Zj| I ,i = l,2,…,C-1, j = i+l,…,C 步驟十二:比較化J與OC的值,將化J<0C的值按最小距離次序遞增排列,即 {〇"',,A如…,。心''} 式中,步驟十Ξ:將距離為的兩個(gè)聚類(lèi)中屯、今和弓.合并,得新的中屯、為:步驟十四:如果是最后一次迭代運(yùn)算,則結(jié)束;否則,若需要操作者改變輸入?yún)?shù),轉(zhuǎn)至 步驟一;若輸入?yún)?shù)不變,轉(zhuǎn)至步驟二。9.根據(jù)權(quán)利要求8所述的基于公交1C卡數(shù)據(jù)的通勤乘客判定方法,其特征在于,所述步 驟一:輸入預(yù)選參數(shù)C、K、ON、0S、0C、IW及L,的步驟中: 確定預(yù)期的類(lèi)聚中屯、數(shù)C,所述C初始類(lèi)別設(shè)為5; 確定聚類(lèi)中屯、的數(shù)目K,所述K等于3; 確定類(lèi)別至少應(yīng)該具有的樣本數(shù)目,小于此數(shù)目不作為一個(gè)獨(dú)立的聚類(lèi),ON設(shè)為50; 確定一個(gè)類(lèi)別樣本的標(biāo)準(zhǔn)差閥值0S;所述0S為0.5; 確定類(lèi)聚中屯、之間距離的閥值,即歸并系數(shù),若小于此數(shù),則兩個(gè)類(lèi)進(jìn)行合并;所述0C 為4; 確定允許迭代的最多次數(shù)I;所述I為500次; 確定在一次迭代中可W歸并的類(lèi)別的最多對(duì)數(shù)レ所述L為2。10.根據(jù)權(quán)利要求6所述的基于公交1C卡數(shù)據(jù)的通勤乘客判定方法,其特征在于, 所述通過(guò)所述打分分析與所述聚類(lèi)分析判定所述乘客是否為滿(mǎn)足預(yù)定要求的通勤乘 客的步驟中,包括: 判定高于第一預(yù)定分?jǐn)?shù)的乘客為絕對(duì)通勤乘客; 判定高于第二預(yù)定分?jǐn)?shù)并不高于第一預(yù)定分?jǐn)?shù)的乘客為普通通勤乘客; 判定不高于第二預(yù)定分?jǐn)?shù)的乘客為非通勤乘客。
【專(zhuān)利摘要】本發(fā)明公開(kāi)了一種基于公交IC卡數(shù)據(jù)的通勤乘客特征提取及判定方法,其中,該基于公交IC卡數(shù)據(jù)的通勤乘客特征提取方法包括:采集公交系統(tǒng)中公交IC卡使用數(shù)據(jù);以此提取使用所述IC卡的乘客的出行OD鏈,并根據(jù)所述出行OD鏈提取所述乘客在一天時(shí)間中首次和末次出行OD鏈,根據(jù)所述IC卡使用數(shù)據(jù)及所述首次和末次出行OD鏈提取所述通勤乘客的相同出行天數(shù)、所述通勤乘客的相同通勤時(shí)段、所述通勤乘客的相同通勤站點(diǎn)、所述通勤乘客的相同通勤線(xiàn)路,本方法具有準(zhǔn)確,直觀,可操作性強(qiáng)等優(yōu)點(diǎn),對(duì)于提高公交運(yùn)營(yíng)效率,促進(jìn)城市現(xiàn)代化,特別是為以后發(fā)展定制公交以及票制票價(jià)改革,具有重要意義。
【IPC分類(lèi)】G06F17/30
【公開(kāi)號(hào)】CN105701180
【申請(qǐng)?zhí)枴緾N201610007293
【發(fā)明人】馬曉磊, 劉從從, 陳鋒, 馬騰騰, 溫慧敏
【申請(qǐng)人】北京航空航天大學(xué)
【公開(kāi)日】2016年6月22日
【申請(qǐng)日】2016年1月6日