1.一種基于手機(jī)信令數(shù)據(jù)和導(dǎo)航路線數(shù)據(jù)的手機(jī)用戶出行方式識(shí)別方法,其特征在于:該方法包括以下步驟:
S1:獲取某手機(jī)用戶一段時(shí)間內(nèi)的手機(jī)信令數(shù)據(jù),并對(duì)手機(jī)信令數(shù)據(jù)按時(shí)間先后順序排序,形成手機(jī)用戶出行軌跡序列;
S2:根據(jù)駐留點(diǎn)將用戶出行軌跡序列切割為多個(gè)有效出行段:按照停留時(shí)間,識(shí)別出此手機(jī)用戶出行軌跡序列中的駐留點(diǎn),根據(jù)駐留點(diǎn)將出行軌跡序列切割為各有效出行段,其中駐留點(diǎn)為手機(jī)用戶停留時(shí)長超過一定閾值的單個(gè)基站或相鄰的多個(gè)基站;
S3:根據(jù)用戶出行直線距離以及直線移動(dòng)速度對(duì)其出行方式進(jìn)行初步判斷;
S4:根據(jù)步驟S3的判別結(jié)果,提取對(duì)應(yīng)的導(dǎo)航路線數(shù)據(jù);
S5:利用基于密度的聚類算法DBSCAN(Density-Based Spatial Clustering ofApplications with Noise)分析得到各導(dǎo)航路線與用戶此有效出行段的基站序列的匹配度,取匹配度最大的導(dǎo)航路線為用戶此有效出行段的出行路線,且此導(dǎo)航路線對(duì)應(yīng)的交通方式為用戶的出行方式。
2.根據(jù)權(quán)利要求1所述的一種基于手機(jī)信令數(shù)據(jù)和導(dǎo)航路線數(shù)據(jù)的手機(jī)用戶出行方式識(shí)別方法,其特征在于:所述步驟S3具體包括:獲取某有效出行段P的起點(diǎn)和終點(diǎn),計(jì)算起點(diǎn)與終點(diǎn)之間的直線距離Lp;獲取用戶通過P所花費(fèi)的時(shí)長Tp,計(jì)算用戶直線移動(dòng)速度Vp=Lp/Tp;根據(jù)用戶直線移動(dòng)速度Vp,對(duì)出行方式進(jìn)行初次判別,判別為高速出行方式和低速出行方式,其中高速出行方式包括公共交通與私人機(jī)動(dòng)車,公共交通包括公交車與軌道交通,低速出行方式包括自行車與步行。
3.根據(jù)權(quán)利要求2所述的一種基于手機(jī)信令數(shù)據(jù)和導(dǎo)航路線數(shù)據(jù)的手機(jī)用戶出行方式識(shí)別方法,其特征在于:所述步驟S4具體包括:若為高速出行方式,則提取出以駕車和公共交通的出行方式從有效出行段P的起點(diǎn)到終點(diǎn)的導(dǎo)航路線;若為低速出行方式,則提取以各種交通方式從有效出行段P的起點(diǎn)到終點(diǎn)的導(dǎo)航路線;設(shè)獲取到的導(dǎo)航路線集合為G={g1,g2,g3,…,gi,…,gn},gi表示第i個(gè)導(dǎo)航路線;其中導(dǎo)航路線數(shù)據(jù)包含從起點(diǎn)到終點(diǎn)所需要經(jīng)過的道路沿線的經(jīng)緯度坐標(biāo)點(diǎn)L={l1,l2,l3,…,li,…,ln},li表示第i個(gè)導(dǎo)航路線gi對(duì)應(yīng)的經(jīng)緯度坐標(biāo)數(shù)據(jù)集、路程S={s1,s2,s3,…,si,…,sn},S表示路程集合,si表示第i個(gè)導(dǎo)航路線gi對(duì)應(yīng)的從有效出行段P的起點(diǎn)到終點(diǎn)的路程、交通方式Y(jié)={y1,y2,y3,…yi,…yn},Y表示交通方式集合,yi表示gi對(duì)應(yīng)的交通方式,以及花費(fèi)時(shí)長D={d1,d2,d3,…di,…,dn},D表示花費(fèi)時(shí)長集合,di表示gi對(duì)應(yīng)的花費(fèi)時(shí)長。
4.根據(jù)權(quán)利要求3所述的一種基于手機(jī)信令數(shù)據(jù)和導(dǎo)航路線數(shù)據(jù)的手機(jī)用戶出行方式識(shí)別方法,其特征在于:所述步驟S5具體包括:
S51:設(shè)有效出行段P的基站坐標(biāo)集合為B,使用基于密度的聚類算法DBSCAN對(duì)li中的經(jīng)緯度坐標(biāo)點(diǎn)和B中的基站坐標(biāo)點(diǎn)進(jìn)行聚類;設(shè)聚類算法搜索領(lǐng)域半徑為Eps,最小包含點(diǎn)數(shù)為minPts;各聚類對(duì)象之間的距離為經(jīng)緯度坐標(biāo)點(diǎn)之間的距離;聚類得到m個(gè)坐標(biāo)點(diǎn)的簇C={c1,c2,c3,…,ct,…,cm},C為簇的集合,ci為第i個(gè)簇;
S52:獲取C中含有l(wèi)i坐標(biāo)點(diǎn)的簇CL={ci,cj,……,ck},其中CL包含于C,i、j、k小于m,統(tǒng)計(jì)CL各簇中B坐標(biāo)點(diǎn)的個(gè)數(shù)Nli;設(shè)B中坐標(biāo)點(diǎn)的個(gè)數(shù)為Nb,計(jì)算Nli與Nb的比率rli,rli=Nli/Nb;由此得到各導(dǎo)航路線與用戶此有效出行段的基站序列的匹配度R={rl1,rl2,rl3,…,rli,…rln};
S53:比較各導(dǎo)航路線的匹配度,若R中存在唯一的最大值,則取匹配度最大的導(dǎo)航路線grmax為用戶此有效出行段P所走路線,且其出行路線為grmax對(duì)應(yīng)的出行方式y(tǒng)rmax,路程為srmax;若R中存在多個(gè)最大值,則轉(zhuǎn)到步驟S54;
S54:將匹配度最大的導(dǎo)航路線視為觀察路線,則觀察路線集合Gd={gd1,gd2,gd3,…,gdi,…gds},Gd包含于G,ds≤n,對(duì)于某些路段可采用多種交通方式,所以存在交通方式不同但路線相同的導(dǎo)航路線;獲取Gd中g(shù)di花費(fèi)時(shí)長ddi以及用戶此有效出行段P實(shí)際花費(fèi)時(shí)長Tp,計(jì)算Tp與ddi的差值todi,todi=Tp-ddi;則TO={tod1,tod2,tod3,…todi,…tods},比較TO中各值,確定todi最小的導(dǎo)航線路為用戶所走線路gtomin,用戶所采用的出行方式為ytomin,出行路程為stomin。