基于快速路網(wǎng)建模的多尺度時空熱點(diǎn)路徑探測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及路網(wǎng)中熱點(diǎn)路徑搜索的技術(shù)領(lǐng)域,是一種在無路網(wǎng)地圖支持的條件 下,利用大規(guī)模時空軌跡數(shù)據(jù)先快速構(gòu)造路網(wǎng)再進(jìn)行熱點(diǎn)路徑探測的方法。
【背景技術(shù)】
[0002] 熱點(diǎn)路徑可以被定義為一段時期內(nèi)被大量移動對象頻繁經(jīng)過的路段,它能反映人 們在移動過程中對某地理區(qū)域的關(guān)注程度或依賴程度,也能一定程度地揭示人們的移動規(guī) 律。熱點(diǎn)路徑探測可用于城市規(guī)劃、交通管理、廣告投放等領(lǐng)域的決策支持。
[0003] 不同于專利文獻(xiàn)1 (專利公開號CN103323018A)中的熱點(diǎn)路徑概念,其中的熱點(diǎn)路 徑是指從源點(diǎn)到目的點(diǎn)的所有路徑中的最常使用路徑,這是一種局部流行的路徑。本發(fā)明 中的熱點(diǎn)路徑是指整個路網(wǎng)中被移動對象頻繁經(jīng)過路徑,一種全局流行的路徑。
[0004] 目前專門用于從軌跡中探測熱點(diǎn)路徑的方法并不多,在有路網(wǎng)地圖支持的情況 下,可以使用Li Xiaolei等提出FlowScan方法探測熱點(diǎn)路徑,此方法需要具有良好拓?fù)湫?的路網(wǎng)的支持,而且需要較準(zhǔn)確的地圖匹配算法,在地圖匹配算法不精確、路網(wǎng)結(jié)構(gòu)不完整 或不存在可用路網(wǎng)的情況下就無法使用該方法了。在無路網(wǎng)支持的情況下,可使用基于網(wǎng) 格劃分的方法或基于軌跡聚類的方法。然而使用網(wǎng)格地對軌跡進(jìn)行"硬劃分"的容易導(dǎo)致屬 于同一道路上的軌跡被錯分到多個不同網(wǎng)格中,最終導(dǎo)致"熱點(diǎn)路徑丟失"現(xiàn)象的出現(xiàn)。而 且,網(wǎng)格尺寸設(shè)定的越小,此問題就會越嚴(yán)重。移動對象聚類或基于軌跡聚類的方法也可以 一定程度地解決無路網(wǎng)支持下的熱點(diǎn)路徑探測問題。然而,移動對象聚類只能發(fā)現(xiàn)數(shù)量較 少的一些短路徑,因為它要求聚類中所有移動對象在某一時間間隔內(nèi)都沿同樣路線行駛, 而真正的熱點(diǎn)路徑只關(guān)注的交通流量的大小,不需要所有移動對象在行駛過程中都始終保 持聚類性,也不需要它們共同行駛一段足夠長的路程。而軌跡聚類方法無法識別熱點(diǎn)路徑 中的一些復(fù)雜耦合現(xiàn)象,如匯聚、分裂、或覆蓋等。因為,熱點(diǎn)路徑的探測過程與軌跡聚類過 程有所不同。軌跡聚類的聚類方向是向任意方向發(fā)散的,是無限制的;而熱點(diǎn)路徑探測探測 方向只能沿著道路的方向,是受限的。因此,軌跡聚類結(jié)果的通常是群簇,是任意形狀的;而 熱點(diǎn)路徑探測的結(jié)果則是一條條路徑,是"線狀"的。
【發(fā)明內(nèi)容】
[0005] 針對現(xiàn)有技術(shù)中的上述問題,本發(fā)明提供一種基于快速路網(wǎng)建模的多尺度時空熱 點(diǎn)路徑探測方法。
[0006] 本發(fā)明為實現(xiàn)上述目的所采用的技術(shù)方案是:基于快速路網(wǎng)建模的多尺度時空熱 點(diǎn)路徑探測方法,包括以下步驟:
[0007] 1)利用大規(guī)模軌跡數(shù)據(jù)構(gòu)造路網(wǎng);
[0008] 2)基于所構(gòu)造的路網(wǎng)對軌跡進(jìn)行道路匹配:將軌跡點(diǎn)序列轉(zhuǎn)化為覆蓋在道路上 的網(wǎng)格序列;
[0009] 3)進(jìn)行熱點(diǎn)路徑探測。
[0010] 所述步驟1)包括以下步驟:
[0011] 將包含有大規(guī)模軌跡的二維空間區(qū)域劃分為規(guī)則的網(wǎng)格,統(tǒng)計網(wǎng)格內(nèi)的軌跡點(diǎn)數(shù) 量;
[0012] 將網(wǎng)格視為位圖像素,以網(wǎng)格的軌跡點(diǎn)數(shù)量作為像素值,進(jìn)而將區(qū)域構(gòu)造為灰度 圖像;
[0013] 對灰度圖進(jìn)行二值化處理;
[0014] 使用數(shù)學(xué)形態(tài)學(xué)中的細(xì)化、膨脹、裁剪操作從二值圖像中提取路網(wǎng)結(jié)構(gòu)。
[0015] 所述將包含有大規(guī)模軌跡的二維空間區(qū)域劃分為規(guī)則的網(wǎng)格,具體為:按照經(jīng)緯 度方向?qū)⒍S空間區(qū)域S分別劃分為m、n等分,m>0,n>0,二維空間區(qū)域就S劃分為了 mXn 個矩形網(wǎng)格單元,若將每個網(wǎng)格視為一個像素,則S可表示為位圖Gblt = {gl,g2,…,gniXn}, 每個像素的灰度值Gray即為通過該網(wǎng)格的軌跡量,Gray (gj > 0, i>0。
[0016] 所述對灰度圖進(jìn)行二值化處理采用混合閾值策略,混合閾值公式為TH(g)= tiXAvgg^+tjjXAvgyxy (g),其中Avggklbal為全局非O像素的平均值,AvgYXY (g)為像素 g 的Y X Y鄰域內(nèi)的非O像素平均值,TH(g)為像素 g的二值化閾值為全局閾值的權(quán)重, t2為局部閾值的權(quán)重。
[0017] 所述細(xì)化操作公式為:
[0019] 即利用結(jié)構(gòu)元素序列B\B2, "·,ΒΝ迭代對圖像X進(jìn)行處理,直至X不再變化為止, 其中B1由B1 1旋轉(zhuǎn)得到,i = 1,2,…,η,X為二值圖像。
[0020] 所述膨脹操作采用定向結(jié)構(gòu)元素,即通過統(tǒng)計軌跡的方向來確定道路方向,然后 沿著道路方向?qū)Ω采w在道路上的網(wǎng)格進(jìn)行膨脹。
[0021] 所述剪裁操作只對刪除短線、孤立點(diǎn)所對應(yīng)的像素。
[0022] 所述步驟2)中的軌跡道路匹配過程為:
[0023] 將軌跡點(diǎn)序列轉(zhuǎn)化為覆蓋在道路上的網(wǎng)格序列;
[0024] 將時間域劃分為小尺度時段,統(tǒng)計"道路網(wǎng)格"在各時段各方向上的軌跡量,即流 量;
[0025] 以Traf (g)表示途經(jīng)網(wǎng)格單元g的軌跡集合,Trafstart (g)表示從g出發(fā)的軌跡集 合,Traffinish (g)表示到g終止的軌跡集合,Trafpass (g)表示穿過g的軌跡集合,則Traf (g) =Trafstart (g)+Traffinish (g)+Trafpass (g), I Traf (g) I 即為網(wǎng)格 g 的流量。
[0026] 所述步驟3)包括以下步驟:
[0027] a)對軌跡進(jìn)行道路匹配,將軌跡點(diǎn)序列轉(zhuǎn)化為"道路網(wǎng)格"序列。將時間域劃分為 小尺度時段,統(tǒng)計"道路網(wǎng)格"在各時段各方向上的軌跡量,即流量;
[0028] b)根據(jù)網(wǎng)格流量定義"道路網(wǎng)格"間的流量可達(dá)條件、熱點(diǎn)路徑起始條件、以及路 徑流量可達(dá)條件;根據(jù)流量可達(dá)定義將路網(wǎng)結(jié)構(gòu)轉(zhuǎn)化為有向圖的結(jié)構(gòu),根據(jù)熱點(diǎn)路徑起始 區(qū)域定義將圖轉(zhuǎn)化為樹的結(jié)構(gòu);
[0029] c)對每個時段的網(wǎng)格生成樹,利用路徑可達(dá)定義中的規(guī)則從樹中探測小尺度時空 熱點(diǎn)路徑;
[0030] d)將小尺度生成樹合并為大尺度生成樹,繼續(xù)使用路徑可達(dá)定義中的規(guī)則探測大 尺度時空熱點(diǎn)路徑;
[0031] e)對每一尺度下的所有熱點(diǎn)路徑根據(jù)其熱度和長度對其進(jìn)行排序。
[0032] 所述直接流量可達(dá)為:
[0033] 若從網(wǎng)格gl到鄰接網(wǎng)格g2的軌跡量達(dá)到一定閾值λ,則稱 gl直接流量可達(dá)g2 ; 根據(jù)流量可達(dá)定義將路網(wǎng)結(jié)構(gòu)轉(zhuǎn)化為有向圖的結(jié)構(gòu),G= {V(G),E(G)},頂點(diǎn)集合V(G)= Iv1, V2,…,vn} = {g!,g2,…gn},Vi = gi,η > 1,1 彡 i 彡 η,邊集合 E(G) = ((Vi, v.j) I !Traf (gl) nTraf(gj) I彡入,\£¥,^¥}。其中6為有向圖,\為有向圖中的頂點(diǎn),11表示網(wǎng)格數(shù) 量,I Traf (gi) n Traf (g.j) I表示從網(wǎng)格gi至gj的軌跡量。
[0034] 所述熱點(diǎn)路徑起始區(qū)域為:
[0035] 給定最小流量可達(dá)閾值λ,若某網(wǎng)格區(qū)域g滿足以下三種條件之一,則稱其為熱 點(diǎn)路徑起始區(qū)域。
不能直接流量可 達(dá)g ;
不能直接流量可達(dá) g ;
量可達(dá)g。
[0039] 其中,N (g)表示g的直接鄰域,Traf (g)表示途經(jīng)網(wǎng)格單元g的軌跡集 合,Trafstart (g)表示從g出發(fā)的軌跡集合,Trafpass (g)表示穿過g的軌跡集合,則Traf (g) =Trafstart (g) +Traffinish (g) +Trafpass (g), I Traf (g) I 為網(wǎng)格 g 的流量。
[0040] 所述路徑流量可達(dá)為:
[0041] 對于一條網(wǎng)格單元鏈L = (gl,g2,…,gn),若滿足以下條件,則稱gl路徑流量可達(dá) Sn :
[0042] 1)網(wǎng)格S1直接流量可達(dá)網(wǎng)格g1+1,1彡i〈n ;
[0043] 2)對于 L 的每一子鏈 Li = (g〇 gi+1,…,gi+E), !Traf^gi) Π Traf(gi+1) Π … Π Traf (gi+ Ε) I 彡 λ,1 彡 ε〈η, i 彡 I ;
T必須連續(xù)地經(jīng)過gi, gi+1,… ,gi+E ;其中,Traf (g