本發(fā)明屬于交通規(guī)劃與管理方法技術(shù)領(lǐng)域,涉及一種基于手機(jī)信令數(shù)據(jù)和導(dǎo)航路線數(shù)據(jù)的手機(jī)用戶出行方式識別方法。
背景技術(shù):
各種交通方式的出行比例、公共交通分擔(dān)率等,一直是交通規(guī)劃與交通管理部門所關(guān)注的重要數(shù)據(jù)。在交通分析中,常用的交通信息采集手段包括線圈、微波、視頻等。不同的信息采集手段都有其優(yōu)勢與使用范圍。
由于線圈、微波、視頻等交通采集手段的使用空間范圍較小,無法對人們出行行為進(jìn)行持續(xù)且有效的追蹤,更難以獲取人們出行的OD信息。這些交通信息采集設(shè)備一般成本較高,由于成本與使用范圍的限制,無法對整個(gè)城市進(jìn)行大范圍的覆蓋。
目前,隨著手機(jī)的普及,手機(jī)用戶量龐大。運(yùn)營商為了提供優(yōu)質(zhì)的通信服務(wù),通過增加基站建設(shè)的投入,使得手機(jī)信號覆蓋范圍更廣。手機(jī)號同時(shí)又是用戶身份標(biāo)識,易于區(qū)分用戶,因此手機(jī)信令數(shù)據(jù)很適合用于分析人們出行的行為,從而優(yōu)化城市的交通規(guī)劃與管理。
目前,已有使用手機(jī)信令數(shù)據(jù)分析判斷用戶出行方式的專利。《基于手機(jī)信令數(shù)據(jù)的居民出行方式綜合判別方法》通過分析出行子鏈的平均速度、出行時(shí)長、出行距離以及與GIS線網(wǎng)匹配的方法識別用戶的出行方式。其缺點(diǎn)在于并未給出用戶出行子鏈的平均速度、出行距離以及出行路徑的獲取方法。且基于手機(jī)信令數(shù)據(jù)利用現(xiàn)有的路徑匹配方法無法獲取用戶準(zhǔn)確的出行路徑,則無法獲取用戶出行子鏈的出行路程以及平均速度,進(jìn)而不能準(zhǔn)確的識別用戶的出行方式。針對以上問題本發(fā)明提出一種基于手機(jī)信令數(shù)據(jù)和導(dǎo)航路線數(shù)據(jù)的手機(jī)用戶出行方式識別的方法。其能夠簡單且有效的分析出用戶真實(shí)的出行路徑,進(jìn)而獲取出行路程以及識別用戶的出行方式。導(dǎo)航路線是指百度地圖、搜狗地圖、谷歌地圖等為用戶規(guī)劃的以不同出行方式從某一位置到另一位置的出行路徑。導(dǎo)航路線數(shù)據(jù)為導(dǎo)航路線包含的各種信息(如路程、預(yù)計(jì)花費(fèi)時(shí)長等),此類數(shù)據(jù)能通過相應(yīng)的地圖開放API接口獲取。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明的目的在于提供一種基于手機(jī)信令數(shù)據(jù)和導(dǎo)航路線數(shù)據(jù)的手機(jī)用戶出行方式識別方法,該方法具有準(zhǔn)確度高、使用方便的優(yōu)點(diǎn)。
為達(dá)到上述目的,本發(fā)明提供如下技術(shù)方案:
一種基于手機(jī)信令數(shù)據(jù)和導(dǎo)航路線數(shù)據(jù)的手機(jī)用戶出行方式識別方法,該方法包括以下步驟:
S1:獲取某手機(jī)用戶一段時(shí)間內(nèi)的手機(jī)信令數(shù)據(jù),并對手機(jī)信令數(shù)據(jù)按時(shí)間先后順序排序,形成手機(jī)用戶出行軌跡序列;
S2:根據(jù)駐留點(diǎn)將用戶出行軌跡序列切割為多個(gè)有效出行段:按照停留時(shí)間,識別出此手機(jī)用戶出行軌跡序列中的駐留點(diǎn),根據(jù)駐留點(diǎn)將出行軌跡序列切割為各有效出行段,其中駐留點(diǎn)為手機(jī)用戶停留時(shí)長超過一定閾值的單個(gè)基站或相鄰的多個(gè)基站;
S3:根據(jù)用戶出行直線距離以及直線移動速度對其出行方式進(jìn)行初步判斷;
S4:根據(jù)步驟S3的判別結(jié)果,提取對應(yīng)的導(dǎo)航路線數(shù)據(jù);
S5:利用基于密度的聚類算法DBSCAN(Density-Based Spatial Clustering of Applications with Noise)分析得到各導(dǎo)航路線與用戶此有效出行段的基站序列的匹配度,取匹配度最大的導(dǎo)航路線為用戶此有效出行段的出行路線,且此導(dǎo)航路線對應(yīng)的交通方式為用戶的出行方式。
進(jìn)一步,所述步驟S3具體包括:獲取某有效出行段P的起點(diǎn)和終點(diǎn),計(jì)算起點(diǎn)與終點(diǎn)之間的直線距離Lp;獲取用戶通過P所花費(fèi)的時(shí)長Tp,計(jì)算用戶直線移動速度Vp=Lp/Tp;根據(jù)用戶直線移動速度Vp,對出行方式進(jìn)行初次判別,判別為高速出行方式和低速出行方式,其中高速出行方式包括公共交通與私人機(jī)動車,公共交通包括公交車與軌道交通,低速出行方式包括自行車與步行。
進(jìn)一步,所述步驟S4具體包括:若為高速出行方式,則提取出以駕車和公共交通的出行方式(公共交通包括公交車與軌道交通)從有效出行段P的起點(diǎn)到終點(diǎn)的導(dǎo)航路線;若為低速出行方式,則提取以各種交通方式(交通方式包括駕車、公共交通、自行車和步行,其中公共交通包括公交車與軌道交通)從有效出行段P的起點(diǎn)到終點(diǎn)的導(dǎo)航路線;設(shè)獲取到的導(dǎo)航路線集合為G={g1,g2,g3,…,gi,…,gn},gi表示第i個(gè)導(dǎo)航路線;其中導(dǎo)航路線數(shù)據(jù)包含從起點(diǎn)到終點(diǎn)所需要經(jīng)過的道路沿線的經(jīng)緯度坐標(biāo)點(diǎn)L={l1,l2,l3,…,li,…,ln},li表示第i個(gè)導(dǎo)航路線gi對應(yīng)的經(jīng)緯度坐標(biāo)數(shù)據(jù)集、路程S={s1,s2,s3,…,si,…,sn},S表示路程集合,si表示第i個(gè)導(dǎo)航路線gi對應(yīng)的從有效出行段P的起點(diǎn)到終點(diǎn)的路程、交通方式Y(jié)={y1,y2,y3,…yi,…yn},Y表示交通方式集合,yi表示gi對應(yīng)的交通方式,以及花費(fèi)時(shí)長D={d1,d2,d3,…di,…,dn},D表示花費(fèi)時(shí)長集合,di表示gi對應(yīng)的花費(fèi)時(shí)長。
進(jìn)一步,所述步驟S5具體包括:
S51:設(shè)有效出行段P的基站坐標(biāo)集合為B,使用基于密度的聚類算法DBSCAN對li中的經(jīng)緯度坐標(biāo)點(diǎn)和B中的基站坐標(biāo)點(diǎn)進(jìn)行聚類;設(shè)聚類算法搜索領(lǐng)域半徑為Eps,最小包含點(diǎn)數(shù)為minPts;各聚類對象之間的距離為經(jīng)緯度坐標(biāo)點(diǎn)之間的距離;聚類得到m個(gè)坐標(biāo)點(diǎn)的簇C={c1,c2,c3,…,ct,…,cm},C為簇的集合,ci為第i個(gè)簇;
S52:獲取C中含有l(wèi)i坐標(biāo)點(diǎn)的簇CL={ci,cj,……,ck},其中CL包含于C,i、j、k小于m,統(tǒng)計(jì)CL各簇中B坐標(biāo)點(diǎn)的個(gè)數(shù)Nli;設(shè)B中坐標(biāo)點(diǎn)的個(gè)數(shù)為Nb,計(jì)算Nli與Nb的比率rli,rli=Nli/Nb;由此得到各導(dǎo)航路線與用戶此有效出行段的基站序列的匹配度R={rl1,rl2,rl3,…,rli,…rln};
S53:比較各導(dǎo)航路線的匹配度,若R中存在唯一的最大值,則取匹配度最大的導(dǎo)航路線grmax為用戶此有效出行段P所走路線,且其出行路線為grmax對應(yīng)的出行方式y(tǒng)rmax,路程為srmax;若R中存在多個(gè)最大值,則轉(zhuǎn)到步驟S54;
S54:將匹配度最大的導(dǎo)航路線視為觀察路線,則觀察路線集合Gd={gd1,gd2,gd3,…,gdi,…gds},Gd包含于G,ds≤n,對于某些路段可采用多種交通方式,所以存在交通方式不同但路線相同的導(dǎo)航路線;獲取Gd中g(shù)di花費(fèi)時(shí)長ddi以及用戶此有效出行段P實(shí)際花費(fèi)時(shí)長Tp,計(jì)算Tp與ddi的差值todi,todi=Tp-ddi;則TO={tod1,tod2,tod3,…todi,…tods},比較TO中各值,確定todi最小的導(dǎo)航線路為用戶所走線路gtomin,用戶所采用的出行方式為ytomin,出行路程為stomin。
本發(fā)明的有益效果在于:與現(xiàn)有技術(shù)相比,本發(fā)明提供的方法具有實(shí)現(xiàn)簡單,識別準(zhǔn)確率高,使用方便的優(yōu)點(diǎn)。
附圖說明
為了使本發(fā)明的目的、技術(shù)方案和有益效果更加清楚,本發(fā)明提供如下附圖進(jìn)行說明:
圖1為本發(fā)明方法的流程示意圖。
具體實(shí)施方式
下面將結(jié)合附圖,對本發(fā)明的優(yōu)選實(shí)施例進(jìn)行詳細(xì)的描述。
圖1為本發(fā)明方法的流程示意圖,如圖所示,本發(fā)明提供的基于手機(jī)信令數(shù)據(jù)和導(dǎo)航路線數(shù)據(jù)的手機(jī)用戶出行方式識別方法包括以下步驟:
S1:獲取某手機(jī)用戶一段時(shí)間內(nèi)的手機(jī)信令數(shù)據(jù),并對手機(jī)信令數(shù)據(jù)按時(shí)間先后順序排序,形成手機(jī)用戶出行軌跡序列;
S2:根據(jù)駐留點(diǎn)將用戶出行軌跡序列切割為多個(gè)有效出行段:按照停留時(shí)間,識別出此手機(jī)用戶出行軌跡序列中的駐留點(diǎn),根據(jù)駐留點(diǎn)將出行軌跡序列切割為各有效出行段,其中駐留點(diǎn)為手機(jī)用戶停留時(shí)長超過一定閾值的單個(gè)基站或相鄰的多個(gè)基站;
S3:根據(jù)用戶出行直線距離以及直線移動速度對其出行方式進(jìn)行初步判斷;
S4:根據(jù)步驟S3的判別結(jié)果,提取對應(yīng)的導(dǎo)航路線數(shù)據(jù);
S5:利用基于密度的聚類算法DBSCAN(Density-Based Spatial Clustering of Applications with Noise)分析得到各導(dǎo)航路線與用戶此有效出行段的基站序列的匹配度,取匹配度最大的導(dǎo)航路線為用戶此有效出行段的出行路線,且此導(dǎo)航路線對應(yīng)的交通方式為用戶的出行方式。
其中,在本實(shí)施例中,步驟S3具體包括:獲取某有效出行段P的起點(diǎn)和終點(diǎn),計(jì)算起點(diǎn)與終點(diǎn)之間的直線距離Lp;獲取用戶通過P所花費(fèi)的時(shí)長Tp,計(jì)算用戶直線移動速度Vp=Lp/Tp;根據(jù)用戶直線移動速度Vp,對出行方式進(jìn)行初次判別,判別為高速出行方式和低速出行方式,其中高速出行方式包括公共交通與私人機(jī)動車,公共交通包括公交車與軌道交通,低速出行方式包括自行車與步行。
步驟S4具體包括:若為高速出行方式,則提取出以駕車和公共交通的出行方式(公共交通包括公交車與軌道交通)從有效出行段P的起點(diǎn)到終點(diǎn)的導(dǎo)航路線;若為低速出行方式,則提取以各種交通方式(交通方式包括駕車、公共交通、自行車和步行,其中公共交通包括公交車與軌道交通)從有效出行段P的起點(diǎn)到終點(diǎn)的導(dǎo)航路線;設(shè)獲取到的導(dǎo)航路線集合為G={g1,g2,g3,…,gi,…,gn},gi表示第i個(gè)導(dǎo)航路線;其中導(dǎo)航路線數(shù)據(jù)包含從起點(diǎn)到終點(diǎn)所需要經(jīng)過的道路沿線的經(jīng)緯度坐標(biāo)點(diǎn)L={l1,l2,l3,…,li,…,ln},li表示第i個(gè)導(dǎo)航路線gi對應(yīng)的經(jīng)緯度坐標(biāo)數(shù)據(jù)集、路程S={s1,s2,s3,…,si,…,sn},S表示路程集合,si表示第i個(gè)導(dǎo)航路線gi對應(yīng)的從有效出行段P的起點(diǎn)到終點(diǎn)的路程、交通方式Y(jié)={y1,y2,y3,…yi,…yn},Y表示交通方式集合,yi表示gi對應(yīng)的交通方式,以及花費(fèi)時(shí)長D={d1,d2,d3,…di,…,dn},D表示花費(fèi)時(shí)長集合,di表示gi對應(yīng)的花費(fèi)時(shí)長。
步驟S5具體包括:
S51:設(shè)有效出行段P的基站坐標(biāo)集合為B,使用基于密度的聚類算法DBSCAN對li中的經(jīng)緯度坐標(biāo)點(diǎn)和B中的基站坐標(biāo)點(diǎn)進(jìn)行聚類;設(shè)聚類算法搜索領(lǐng)域半徑為Eps,最小包含點(diǎn)數(shù)為minPts;各聚類對象之間的距離為經(jīng)緯度坐標(biāo)點(diǎn)之間的距離;聚類得到m個(gè)坐標(biāo)點(diǎn)的簇C={c1,c2,c3,…,ct,…,cm},C為簇的集合,ci為第i個(gè)簇;
S52:獲取C中含有l(wèi)i坐標(biāo)點(diǎn)的簇CL={ci,cj,……,ck},其中CL包含于C,i、j、k小于m,統(tǒng)計(jì)CL各簇中B坐標(biāo)點(diǎn)的個(gè)數(shù)Nli;設(shè)B中坐標(biāo)點(diǎn)的個(gè)數(shù)為Nb,計(jì)算Nli與Nb的比率rli,rli=Nli/Nb;由此得到各導(dǎo)航路線與用戶此有效出行段的基站序列的匹配度R={rl1,rl2,rl3,…,rli,…rln};
S53:比較各導(dǎo)航路線的匹配度,若R中存在唯一的最大值,則取匹配度最大的導(dǎo)航路線grmax為用戶此有效出行段P所走路線,且其出行路線為grmax對應(yīng)的出行方式y(tǒng)rmax,路程為srmax;若R中存在多個(gè)最大值,則轉(zhuǎn)到步驟S54;
S54:將匹配度最大的導(dǎo)航路線視為觀察路線,則觀察路線集合Gd={gd1,gd2,gd3,…,gdi,…gds},Gd包含于G,ds≤n,對于某些路段可采用多種交通方式,所以存在交通方式不同但路線相同的導(dǎo)航路線;獲取Gd中g(shù)di花費(fèi)時(shí)長ddi以及用戶此有效出行段P實(shí)際花費(fèi)時(shí)長Tp,計(jì)算Tp與ddi的差值todi,todi=Tp-ddi;則TO={tod1,tod2,tod3,…todi,…tods},比較TO中各值,確定todi最小的導(dǎo)航線路為用戶所走線路gtomin,用戶所采用的出行方式為ytomin,出行路程為stomin。
最后說明的是,以上優(yōu)選實(shí)施例僅用以說明本發(fā)明的技術(shù)方案而非限制,盡管通過上述優(yōu)選實(shí)施例已經(jīng)對本發(fā)明進(jìn)行了詳細(xì)的描述,但本領(lǐng)域技術(shù)人員應(yīng)當(dāng)理解,可以在形式上和細(xì)節(jié)上對其作出各種各樣的改變,而不偏離本發(fā)明權(quán)利要求書所限定的范圍。