本發(fā)明涉及一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法,屬于城市智能交通技術(shù)領(lǐng)域。
背景技術(shù):
近年來(lái),在一些大中型城市里城市機(jī)動(dòng)車保有量和居民出行總量急劇增長(zhǎng),導(dǎo)致交通擁堵成為一個(gè)嚴(yán)重的問(wèn)題,威脅著城市環(huán)境和交通運(yùn)輸效率。為了解決這個(gè)問(wèn)題,人們使用各種數(shù)據(jù)來(lái)監(jiān)控和預(yù)測(cè)交通狀況。由于浮動(dòng)車GPS稀疏軌跡點(diǎn)數(shù)據(jù)在高覆蓋率、低成本上的優(yōu)勢(shì),因而備受人們關(guān)注。這些數(shù)據(jù)已經(jīng)被成功地運(yùn)用在很多應(yīng)用中,例如實(shí)時(shí)速度預(yù)測(cè)和預(yù)估到達(dá)時(shí)間。通常情況下,在處理稀疏軌跡點(diǎn)數(shù)據(jù)時(shí),一項(xiàng)基礎(chǔ)首要的工作是將兩個(gè)GPS點(diǎn)之間的時(shí)間分配給相鄰的路段,也就是旅行時(shí)間的分配。所以當(dāng)利用車輛的稀疏軌跡數(shù)據(jù)來(lái)進(jìn)行道路速度監(jiān)控與預(yù)測(cè)時(shí),路段的旅行時(shí)間分配是一項(xiàng)基礎(chǔ)首要的工作。
本發(fā)明利用浮動(dòng)車的稀疏軌跡點(diǎn)數(shù)據(jù)采用細(xì)粒度的方式來(lái)進(jìn)行道路旅行時(shí)間分配。為了解決間接觀察值問(wèn)題,實(shí)現(xiàn)細(xì)粒度道路配時(shí)算法,本發(fā)明建立了一個(gè)新的隱馬爾可夫模型。在此模型中,路段的隱含狀態(tài)是指車輛在通過(guò)一個(gè)路段時(shí)等待交通信號(hào)燈周期的個(gè)數(shù),相鄰交通信號(hào)間的延遲模式用相鄰路段的狀態(tài)轉(zhuǎn)移概率矩陣來(lái)表示,并且用一個(gè)帶約束的高斯混合模型來(lái)學(xué)習(xí)交通信號(hào)周期。最終,通過(guò)一個(gè)條件迭代模型算法來(lái)訓(xùn)練得到模型中所有的參數(shù),從而能夠?qū)崿F(xiàn)對(duì)路段旅行時(shí)間的細(xì)粒度分配。通過(guò)在一個(gè)為期3個(gè)月的北京路網(wǎng)車輛交通軌跡數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)表明,本發(fā)明提出的方法在絕對(duì)平均誤差上比傳統(tǒng)方法精確10%,在均方根誤差上比傳統(tǒng)方法精確8%。因此,本發(fā)明區(qū)別于以往粗粒度道路旅行時(shí)間分配方法,提出了一種新的細(xì)粒度道路旅行時(shí)間分配方法,提高了時(shí)間估算結(jié)果的精確度,從而提高新方法下的配時(shí)效果。
與本發(fā)明相關(guān)的文章共兩篇,下文分別對(duì)其進(jìn)行剖析:
文章(1):《NIPS網(wǎng)絡(luò)分析與圖形學(xué)習(xí)》2009年第12卷第1期,文章題目為:“基于全球定位系統(tǒng)探測(cè)車數(shù)據(jù)預(yù)測(cè)路徑和旅行時(shí)間”,文章中主要根據(jù)不同交通狀況下歷史旅行時(shí)間概率,提出了一個(gè)針對(duì)干線公路的多概率模型,通過(guò)一個(gè)期望最大化算法并利用稀疏GPS探測(cè)車數(shù)據(jù)來(lái)估算歷史路段旅行時(shí)間。
文章(2):《IEEE智能運(yùn)輸系統(tǒng)匯刊》2012年第13卷第4期,文章題目為:“基于一個(gè)動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)和探測(cè)車數(shù)據(jù)研究公路干線的動(dòng)態(tài)特征”,主要介紹如何利用探測(cè)車數(shù)據(jù)來(lái)預(yù)估公路干線的交通狀況。文章提出了一個(gè)概率模型框架同時(shí)利用探測(cè)車稀疏觀測(cè)數(shù)據(jù)來(lái)預(yù)估公路干線的旅行時(shí)間分布。文中基于流體力學(xué)交通理論提出一個(gè)用來(lái)描述干線公路路段上的車輛密度的模型,同時(shí),該模型也能表示一個(gè)路段上車輛延遲時(shí)間的分布狀況。該分布的特征本質(zhì)上是使用探測(cè)車輛數(shù)據(jù)進(jìn)行交通預(yù)估:探測(cè)車輛會(huì)在任意時(shí)刻報(bào)告自己的當(dāng)前具體位置,并且為了與地圖離散化相匹配,必須對(duì)報(bào)告位置點(diǎn)之間的旅行時(shí)間進(jìn)行縮放。運(yùn)用該模型中的動(dòng)態(tài)貝葉斯網(wǎng)絡(luò),不僅能夠表示出路網(wǎng)間的時(shí)空依賴性,還能通過(guò)一個(gè)復(fù)雜的框架從歷史交通數(shù)據(jù)中學(xué)習(xí)交通的動(dòng)態(tài)特征并且利用流數(shù)據(jù)能夠進(jìn)行旅行時(shí)間的實(shí)時(shí)估算。
以上文章雖然解決了利用稀疏軌跡點(diǎn)數(shù)據(jù)進(jìn)行旅行時(shí)間分配的問(wèn)題,但是,文章均是以粗粒度的方式來(lái)進(jìn)行旅行時(shí)間的分配,忽略了對(duì)相鄰交通信號(hào)間延遲模式的研究。在通過(guò)一個(gè)路段時(shí),有些車輛無(wú)需等待交通信號(hào)燈,有些車輛卻需要等待一整個(gè)交通信號(hào)周期,該文章中并沒(méi)有對(duì)上述兩種情況進(jìn)行區(qū)分,這會(huì)導(dǎo)致在一個(gè)交通信號(hào)周期內(nèi)不同車輛等待紅燈時(shí)間的差別不明顯,從而導(dǎo)致旅行時(shí)間分配結(jié)果不精確。因此,可見(jiàn)粗粒度的道路旅行時(shí)間分配方法有很大的改進(jìn)空間。本發(fā)明的目的即是致力于解決上述粗粒度的道路旅行時(shí)間分配方法的缺陷,提出一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法。
技術(shù)實(shí)現(xiàn)要素:
本發(fā)明的目的是為了克服現(xiàn)有粗粒度旅行時(shí)間分配方法存在的旅行時(shí)間分配結(jié)果不精確的問(wèn)題,提出一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法。
本發(fā)明以細(xì)粒度的方式進(jìn)行旅行時(shí)間分配,其核心思想為:分析相鄰交通信號(hào)間的延遲模式,并基于延遲模式中相鄰路段之間的延遲依賴條件,對(duì)相鄰路段之間的狀態(tài)轉(zhuǎn)移概率進(jìn)行建模,將一個(gè)交通信號(hào)周期內(nèi)不同車輛等待紅燈時(shí)間的差異區(qū)分開(kāi)來(lái),從而提高配時(shí)結(jié)果的精確度;針對(duì)細(xì)粒度旅行時(shí)間分配過(guò)程中,車輛在一個(gè)路段或是一個(gè)子路段上的旅行時(shí)間及交通信號(hào)周期也不容易直接得到的問(wèn)題,即為了解決間接觀察值的問(wèn)題,提出了一個(gè)新隱馬爾可夫模型,使得相鄰路段間的延遲模式由路段間的狀態(tài)轉(zhuǎn)移概率決定,再用條件迭代模型來(lái)計(jì)算出隱馬爾可夫模型的參數(shù),即:本發(fā)明解決了間接觀察值的問(wèn)題,實(shí)現(xiàn)了以細(xì)粒度的方式進(jìn)行旅行時(shí)間分配,從而有效提高了配時(shí)結(jié)果的精確度與正確性。
為實(shí)現(xiàn)上述目的,本發(fā)明所采用的技術(shù)方案如下:
一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法,包括以下步驟:
步驟1:定義稀疏軌跡點(diǎn)數(shù)據(jù)集和旅行時(shí)間分配結(jié)果數(shù)據(jù)集,具體為:
1.1定義稀疏軌跡點(diǎn)數(shù)據(jù)集:
所述的稀疏軌跡點(diǎn)數(shù)據(jù)集定義為{X(i),1≤i≤U};
1.2定義旅行時(shí)間分配結(jié)果數(shù)據(jù)集:
所述的旅行時(shí)間分配結(jié)果數(shù)據(jù)集定義為{Y(i),1≤i≤U};
步驟2:定義隱馬爾可夫模型變量和隱馬爾可夫模型參數(shù);
其中,隱馬爾可夫模型,即描述一個(gè)含有隱含未知參數(shù)的馬爾可夫過(guò)程的模型,Hidden Markov Model縮寫為HMM;
步驟2定義的HMM變量為Oij和Si;
其中,Oij代表子路段旅行時(shí)間,具體表示第i個(gè)路段上的第j個(gè)子路段上分配的旅行時(shí)間;
Si代表路段隱藏狀態(tài),具體表示車輛在第i個(gè)路段上等待紅燈的個(gè)數(shù);下標(biāo)i代表路段編號(hào);
步驟2所定義的隱馬爾可夫模型參數(shù),即HMM參數(shù)為以及π;
其中,代表子路段上的旅行時(shí)間分布,其中,x1代表子路段起始位置,具體表示子路段的起始點(diǎn)與所在路段i起點(diǎn)之間的距離;x2代表子路段結(jié)束位置,具體表示子路段的終點(diǎn)與所在路段i起點(diǎn)之間的距離;Si代表路段i的隱藏狀態(tài);在路段i的隱藏狀態(tài)Si已知的情況下,子路段上的旅行時(shí)間、子路段起始位置x1和子路段結(jié)束位置x2這三個(gè)變量服從于一個(gè)高斯正態(tài)分布其中,子路段上的旅行時(shí)間分布是一個(gè)概率密度函數(shù);
代表路段狀態(tài)轉(zhuǎn)移概率,具體表示第i-1個(gè)路段的隱藏狀態(tài)Si-1與第i個(gè)路段的隱藏狀態(tài)Si之間的狀態(tài)轉(zhuǎn)移概率,其中,路段i的隱藏狀態(tài)Si取決于它前一個(gè)路段i-1的隱藏狀態(tài)Si-1,我們用一階馬爾可夫性質(zhì)假設(shè)對(duì)相鄰路段i和i-1之間的狀態(tài)轉(zhuǎn)移概率進(jìn)行建模,因此,對(duì)于每個(gè)路段i,都有其特定的矩陣;
π代表路段初始狀態(tài)分布,具體表示第1個(gè)路段的初始狀態(tài)的多重分布,其中,π是一個(gè)k維向量,用來(lái)對(duì)初始路段l1的多個(gè)狀態(tài)的多重分布進(jìn)行參數(shù)化設(shè)置;
步驟3:確定步驟2中HMM參數(shù)的初始值,推導(dǎo)出HMM變量的初始值,具體為:
其中,HMM參數(shù),具體為和π;HMM變量,具體為Oij、Si;
3.1確定HMM參數(shù)的初始值,具體為:
3.1.1對(duì)大量浮動(dòng)車GPS采樣數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,得到在特定的路段i上的旅行時(shí)間觀察值集合{t(i),1≤i≤V},該數(shù)據(jù)集服從一個(gè)高斯混合模型,并且,波峰會(huì)周期性地出現(xiàn),這個(gè)周期恰好與紅燈信號(hào)周期吻合,用一組高斯分布來(lái)表示該高斯混合模型;
其中,d代表紅燈信號(hào)周期,即是高斯混合模型中波峰出現(xiàn)的周期,在一般情況下,不同等級(jí)道路的紅燈信號(hào)周期也各不相同,寬闊道路的紅燈信號(hào)周期通常比狹窄道路的更大,由于道路等級(jí)不同,所以d的取值也不盡相同;將該組高斯分布中對(duì)應(yīng)著的道路隱藏狀態(tài)Si的個(gè)數(shù)記為K+1;其中,觀測(cè)數(shù)據(jù)t(i)可以由高斯混合模型產(chǎn)生,具體為:依概率從高斯混合模型的多項(xiàng)分布中選擇一個(gè)高斯分布分模型,再依此分模型的概率分布生成觀測(cè)數(shù)據(jù)t(i);
3.1.2運(yùn)用EM算法,即期望最大化算法估計(jì)高斯混合模型的參數(shù){μ0,d,φ,σ};
其中,μ0代表高斯混合模型的均值,d代表高斯混合模型中波峰出現(xiàn)的周期,φ代表高斯分布分模型,σ代表高斯混合模型的方差;
其中,需要確定該高斯混合模型的對(duì)數(shù)似然函數(shù),其計(jì)算公式為公式(1):
其中,EM算法,包括E步和M步,具體為:
E步:計(jì)算在當(dāng)前模型參數(shù)下觀測(cè)數(shù)據(jù)t(i)來(lái)自第j個(gè)分模型的概率即計(jì)算分模型j對(duì)觀測(cè)數(shù)據(jù)t(i)的響應(yīng)度其中,計(jì)算公式為公式(2):
M步:計(jì)算新一輪迭代的模型參數(shù);即根據(jù)Jensen不等式,用梯度下降算法,求函數(shù)的極大值,從而得到一組最優(yōu)的參數(shù);其中,具體為公式(3):
其中,模型參數(shù)d的梯度值,記為計(jì)算公式為公式(4):
其中,模型參數(shù)σj的梯度值,記為計(jì)算公式為公式(5):
其中,模型參數(shù)μ0的梯度值,記為計(jì)算公式為公式(6):
其中,高斯分布分模型φ更新公式為公式(7):
重復(fù)進(jìn)行算法的E步和M步,直至公式(1)的函數(shù)值收斂,即直至對(duì)數(shù)似然函數(shù)值不再有明顯的變化為止;
3.1.3基于已知路段在每個(gè)狀態(tài)下旅行時(shí)間分布的均值μ、方差σ2計(jì)算出在每個(gè)狀態(tài)下子路段(從x1到x2)上的旅行時(shí)間分布
在交通理論中,路段上任意位置處的車輛密度滿足飽和線性函數(shù);受此理論啟發(fā),由于每單位距離長(zhǎng)度的旅行時(shí)間與道路車輛密度成正比例,定義了一個(gè)形似車輛密度線性函數(shù)的旅行時(shí)間分配概率密度函數(shù)f(x);又因?yàn)樽勇范?從x1到x2)上的旅行時(shí)間也服從高斯正態(tài)分布,所以得到每個(gè)狀態(tài)下子路段(從x1到x2)上的旅行時(shí)間分布,其計(jì)算公式為公式(8):
至此,便可確定子路段上的旅行時(shí)間分布的初始值;
3.2確定HMM參數(shù)的初始值,具體為:
根據(jù)已知的路段i-1和路段i在每個(gè)路段隱藏狀態(tài)下旅行時(shí)間的均值、方差,對(duì)大量車輛在路段i-1、路段i上的旅行時(shí)間觀察值進(jìn)行歸類統(tǒng)計(jì),從而分別得出車輛在路段i-1和路段i上的隱藏狀態(tài),從而得到路段i-1和路段i之間的狀態(tài)轉(zhuǎn)移概率矩陣由此,可以確定參數(shù)的初始值;
3.3確定HMM參數(shù)π的初始值,具體為:
根據(jù)已知的路段i在每個(gè)狀態(tài)下旅行時(shí)間的均值、方差,對(duì)大量車輛在路段i上的旅行時(shí)間觀察值進(jìn)行歸類統(tǒng)計(jì),得到在特定的路段i上的旅行時(shí)間觀察值集合{t(i),1≤i≤V},該數(shù)據(jù)集服從一個(gè)高斯混合模型,用一組高斯分布來(lái)表示該高斯混合模型,從該高斯混合模型中可以得出某一車輛在路段i上屬于哪一類隱藏狀態(tài),從而得到路段i上車輛屬于各種隱藏狀態(tài)的概率矩陣,即確定了參數(shù)π的初始值;
其中,參數(shù)π是一個(gè)k維向量,其中,k是指路段i隱藏狀態(tài)的類別總數(shù);
3.4推導(dǎo)出變量Oij、變量Si的初始值,具體為:
根據(jù)已經(jīng)確定的HMM參數(shù)π的初始值,用極大似然估計(jì)法,找到一組HMM變量{Oij,Si}的值,可以讓概率似然函數(shù)的值達(dá)到最大;
其中,概率似然函數(shù)的計(jì)算公式為公式(9):
步驟4:根據(jù)步驟3確定的HMM變量的值,更新HMM參數(shù)的值;
其中,HMM參數(shù),具體為和π;HMM變量,具體為Oij、Si;
步驟4,具體為:
在給定HMM變量的值的情況下,對(duì)大量車輛在路段i上的旅行時(shí)間觀察值進(jìn)行歸類統(tǒng)計(jì),得到在特定的路段i上的旅行時(shí)間觀察值集合{t(i),1≤i≤V},對(duì)此觀察值集合進(jìn)行分析可以直接估算出所需相應(yīng)數(shù)據(jù)出現(xiàn)的次數(shù),從而得到對(duì)應(yīng)的概率矩陣,即得到更新后的參數(shù)π的值;
步驟5:根據(jù)步驟4更新的HMM參數(shù)的值,更新HMM變量的值;
其中,HMM參數(shù),具體為和π;HMM變量,具體為Oij、Si;
步驟5,具體為:
首先,在給定參數(shù)π、變量Oij值的情況下,用標(biāo)準(zhǔn)維特比算法來(lái)解決隱馬爾可夫模型預(yù)測(cè)問(wèn)題,從而求出最有可能的對(duì)應(yīng)的隱藏狀態(tài)序列,從而更新變量Si的值;然后,在給定參數(shù)π的值以及更新后變量Si值的情況下,通過(guò)對(duì)帶約束的二次優(yōu)化問(wèn)題的求解,可以得到變量Oij的最優(yōu)解,從而更新變量Oij的值;
步驟6:重復(fù)進(jìn)行步驟4和步驟5,直至HMM變量的值不再更新;
其中,HMM變量,具體為Oij;
步驟7:根據(jù)子路段旅行時(shí)間變量值,計(jì)算得出不同路段的旅行時(shí)間分配結(jié)果數(shù)據(jù)集;
其中,不同路段的旅行時(shí)間分配結(jié)果數(shù)據(jù)集,記為:{Y(i),1≤i≤U};子路段旅行時(shí)間變量,即步驟2輸出的HMM變量Oij;
其中,計(jì)算公式為公式(10):
其中,Yj代表第j個(gè)路段的旅行時(shí)間,Oji代表第j個(gè)路段上的第i個(gè)子路段的旅行時(shí)間;
至此,從步驟1到步驟7,完成了一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法。
有益效果
本發(fā)明一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法,與現(xiàn)有技術(shù)相比,具有如下有益效果:
1.本發(fā)明提出的方法計(jì)算得到的結(jié)果比用傳統(tǒng)方法計(jì)算得到的結(jié)果更加精確,具體通過(guò)對(duì)北京道路交通網(wǎng)絡(luò)的3個(gè)月交通數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),能夠證實(shí)本發(fā)明所提出的方法在平均絕對(duì)誤差上比傳統(tǒng)方法精確10%,在均方根誤差上比傳統(tǒng)方法精確8%;
2.本發(fā)明基于隱馬爾可夫模型解決了間接觀察值的問(wèn)題,真正達(dá)到以細(xì)粒度的方式進(jìn)行旅行時(shí)間分配,從而提高新方法下配時(shí)結(jié)果的精確度與正確性。
附圖說(shuō)明
圖1是本發(fā)明一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法及實(shí)施例的流程圖;
圖2是本發(fā)明一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法及實(shí)施例中的元素定義示意圖;
圖3是本發(fā)明一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法及實(shí)施例中關(guān)于車輛密度的線性函數(shù)示意圖;
圖4是本發(fā)明一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法及實(shí)施例中關(guān)于旅行時(shí)間分配的概率密度函數(shù)示意圖。
具體實(shí)施方式
下面結(jié)合附圖和實(shí)施例對(duì)本發(fā)明作進(jìn)一步描述。以下實(shí)施例僅用于更加清楚地說(shuō)明本發(fā)明的技術(shù)方案,而不能以此來(lái)限制本發(fā)明的保護(hù)范圍。
實(shí)施例
本實(shí)施例闡述了將本發(fā)明“一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法”應(yīng)用于對(duì)道路進(jìn)行旅行時(shí)間分配下的流程。
圖1為本發(fā)明所提方法及本實(shí)施例的流程圖。
從圖1中可以看出,本方法包含如下步驟:
步驟A:定義稀疏軌跡點(diǎn)數(shù)據(jù)集{X(i),1≤i≤U}和旅行時(shí)間分配數(shù)據(jù)集{Y(i),1≤i≤U};
為了更好地說(shuō)明上述數(shù)據(jù)集的定義,我們將數(shù)據(jù)集定義與路段示意圖相結(jié)合,結(jié)果圖如圖2所示。由圖2可以看出,用一個(gè)包含n個(gè)點(diǎn)的序列{X1,X2,......,Xn}表示一段軌跡X,同時(shí),這段軌跡X也穿過(guò)了一個(gè)包含m個(gè)路段的序列{l1,l2,......,lm}。
其中,每個(gè)路段li的長(zhǎng)度是已知的,每個(gè)點(diǎn)Xi即是GPS數(shù)據(jù)采樣點(diǎn),因此,Xi包含了以下信息:Xi點(diǎn)所屬路段的ID號(hào)、Xi點(diǎn)與所屬路段起點(diǎn)之間的距離、時(shí)間戳。
具體到本實(shí)施例,用序列{Y1,Y2,......,Ym}表示在對(duì)應(yīng)路段上分配的旅行時(shí)間,用{X(i),1≤i≤U}來(lái)表示稀疏軌跡點(diǎn)數(shù)據(jù)集,用{Y(i),1≤i≤U}來(lái)表示旅行時(shí)間分配數(shù)據(jù)集;
步驟B:定義隱馬爾可夫模型的變量和參數(shù);
變量Oij的定義過(guò)程與步驟2相同,具體到本實(shí)施例,由圖2可以看出,GPS點(diǎn)把路段l1上的軌跡分成兩個(gè)子路段l11和l12,則將子路段l11上的旅行時(shí)間表示為O11,將子路段l12上的旅行時(shí)間表示為O12。路段l2上沒(méi)有GPS點(diǎn),則O21表示在整個(gè)路段l2上的旅行時(shí)間。
變量Si的定義過(guò)程與步驟2相同,具體到本實(shí)施例,如果Si=0,表示車輛在路段i上沒(méi)有等待紅燈;如果Si=2,說(shuō)明車輛在路段i上等了2個(gè)紅燈;
步驟C:確定隱馬爾可夫模型參數(shù)的初始值,推導(dǎo)出隱馬爾可夫模型變量的初始值;
具體與步驟3相同,本實(shí)施例中設(shè)置道路紅燈信號(hào)周期d的最小取值dmin=1,最大取值dmax=2,設(shè)置道路隱藏狀態(tài)的個(gè)數(shù)K=6;
其中,因?yàn)榈缆返燃?jí)不同,所以d的取值也不盡相同,但是d的取值始終在范圍[dmin,dmax]內(nèi);此外,步驟3中EM算法的M步中需要對(duì)參數(shù)d值進(jìn)行更新,如果更新的d的值超出了范圍[dmin,dmax],則不予更新;
其中,在步驟3運(yùn)用EM算法的過(guò)程中,需要確定每個(gè)路段的K值。將K值從2到10進(jìn)行遍歷,選擇其中能使AIC(赤池信息量準(zhǔn)則)的值最小的K值,本實(shí)施例中我們選擇K的值為6;
在交通理論中,路段上任意位置處的車輛密度滿足飽和線性函數(shù)。為了更好地說(shuō)明該函數(shù),我們作出函數(shù)圖像,如圖3所示。
由圖3可以看出,橫坐標(biāo)表示車輛在路段上的位置,縱坐標(biāo)的數(shù)值表示在路段上某一位置處的車輛密度,在路段起始位置處的車輛密度小于路段終點(diǎn)位置處的車輛密度,說(shuō)明通常情況下大量車輛會(huì)聚集在路段終點(diǎn)位置處等待交通信號(hào)燈,該密度函數(shù)符合飽和線性函數(shù)圖像。
為了更好地了解道路旅行時(shí)間分配,由于每單位距離長(zhǎng)度的旅行時(shí)間與道路車輛密度成正比例,我們定義了一個(gè)形似車輛密度線性函數(shù)的旅行時(shí)間分配概率密度函數(shù)f(x),如圖4所示。
由圖4可以看出,橫坐標(biāo)表示車輛在路段上的位置,縱坐標(biāo)的數(shù)值表示在路段上某一位置處的旅行時(shí)間,車輛在路段起始位置處的旅行時(shí)間小于在路段終點(diǎn)位置處的旅行時(shí)間,說(shuō)明通常情況下車輛會(huì)花更多的時(shí)間在路段終點(diǎn)位置處等待交通信號(hào)燈,該密度函數(shù)符合飽和線性函數(shù)圖像。
步驟D:根據(jù)隱馬爾可夫模型變量的值,更新隱馬爾可夫模型參數(shù)的值;
具體為:在給定變量Oij、Si值的情況下,通過(guò)對(duì)觀察值進(jìn)行歸類統(tǒng)計(jì),可以直接估算出所需相應(yīng)數(shù)據(jù)出現(xiàn)的次數(shù),從而得到對(duì)應(yīng)的概率矩陣,即得到更新后的參數(shù)π的值。
步驟E:根據(jù)隱馬爾可夫模型參數(shù)的值,更新隱馬爾可夫模型變量的值;
具體為:首先,在給定參數(shù)π、變量Oij值的情況下,用標(biāo)準(zhǔn)維特比算法來(lái)解決隱馬爾可夫模型預(yù)測(cè)問(wèn)題,從而求出最有可能的對(duì)應(yīng)的隱藏狀態(tài)序列,從而更新變量Si的值;然后,在給定參數(shù)π的值以及更新后變量Si值的情況下,通過(guò)對(duì)帶約束的二次優(yōu)化問(wèn)題的求解,可以得到變量Oij的最優(yōu)解,從而更新變量Oij的值。
步驟F:判斷隱馬爾可夫模型變量Oij的值有無(wú)更新,并進(jìn)行相應(yīng)操作:
F.1若有更新,對(duì)應(yīng)圖1中的“是否收斂”輸出的否,則跳至步驟D;
F.2若無(wú)更新,對(duì)應(yīng)圖1中的“是否收斂”輸出的是,則根據(jù)子路段旅行時(shí)間變量值,計(jì)算得出旅行時(shí)間分配結(jié)果數(shù)據(jù)集{Y(i),1≤i≤U},完成了本方法;
至此,從步驟A到F,完成了本實(shí)施例一種基于稀疏軌跡點(diǎn)數(shù)據(jù)的細(xì)粒度旅行時(shí)間分配方法。
需要說(shuō)明的是,本說(shuō)明書所述的只是本發(fā)明的較佳具體實(shí)施例,以上實(shí)施例僅用于說(shuō)明本發(fā)明的技術(shù)方案而非對(duì)本發(fā)明的限制。凡本領(lǐng)域技術(shù)人員依本發(fā)明的構(gòu)思通過(guò)邏輯分析、推理或者有限的實(shí)驗(yàn)可以得到的技術(shù)方案,皆應(yīng)在本發(fā)明的范圍之內(nèi)。