基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方法
【專利摘要】本發(fā)明針對(duì)現(xiàn)有交通信息預(yù)測方法預(yù)測精確度不高的問題,提供了一種基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方法,包括如下步驟:對(duì)原始交通信息數(shù)據(jù)進(jìn)行歸一化預(yù)處理,將數(shù)據(jù)歸一化到[0,1]區(qū)間內(nèi),生成數(shù)據(jù)集并且進(jìn)行分組,即訓(xùn)練集和測試集;選擇徑向基函數(shù)作為最小二乘支持向量機(jī)模型的核函數(shù),確定參數(shù)組合(γ,σ);采用果蠅優(yōu)化算法對(duì)最小二乘支持向量機(jī)的參數(shù)組合(γ,σ)進(jìn)行優(yōu)化,在全局范圍內(nèi)得到最優(yōu)值;代入經(jīng)過優(yōu)化的參數(shù),構(gòu)造基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測模型;輸入數(shù)據(jù)集,通過預(yù)測模型生成交通信息預(yù)測結(jié)果;進(jìn)行預(yù)測誤差評(píng)價(jià)分析。
【專利說明】基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及一種基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方法,屬于 公路網(wǎng)交通規(guī)劃系統(tǒng)領(lǐng)域。
【背景技術(shù)】
[0002] 隨著交通基礎(chǔ)設(shè)施建設(shè)和智能交通系統(tǒng)的發(fā)展,交通規(guī)劃和交通誘導(dǎo)成為交通 領(lǐng)域研究的熱點(diǎn)。對(duì)于交通規(guī)劃和交通誘導(dǎo)來說,準(zhǔn)確的交通信息預(yù)測有其重要的意義。 交通信息預(yù)測結(jié)果的好壞將直接關(guān)系到交通控制與誘導(dǎo)的效果,無論是交通控制系統(tǒng)還是 交通誘導(dǎo)系統(tǒng),實(shí)時(shí)準(zhǔn)確地對(duì)交通信息進(jìn)行預(yù)測是這些系統(tǒng)實(shí)現(xiàn)的前提與關(guān)鍵,所以交通 信息預(yù)測越來越受到重視。交通信息預(yù)測結(jié)果可以作為先進(jìn)的交通系統(tǒng)的輸入,用于制定 主動(dòng)型的交通控制策略,還可以直接用于先進(jìn)的交通管理系統(tǒng)的信息發(fā)布,為出行者提供 實(shí)時(shí)有效的信息,幫助他們更好的進(jìn)行路徑選擇,進(jìn)而提高路網(wǎng)效率。
[0003] 交通信息數(shù)據(jù)具有高度非線性和不確定性等特點(diǎn),并且與時(shí)間相關(guān)性很 強(qiáng),是一種典型的時(shí)間序列預(yù)測問題,目前,比較常見的交通網(wǎng)絡(luò)信息預(yù)測模型包括 ARIMA(Auto-Regression Intergrated Moving Average)方法、卡爾曼濾波模型(Kalman Filtering Model)和神經(jīng)網(wǎng)絡(luò)模型(Neural Network Model)。ARIMA是一種典型的時(shí)間 序列預(yù)測方法,有著良好的預(yù)測性能,是一種基于線性的模型,而交通信息具有非線性特 征,所以預(yù)測結(jié)果不理想??柭鼮V波是一個(gè)非常適用于實(shí)時(shí)動(dòng)態(tài)預(yù)測交通信息的方法, 但是由于卡爾曼濾波模型的誤差項(xiàng)不好確定,因?yàn)榻煌ㄐ畔⒌碾S機(jī)性非常大,這樣卡爾曼 濾波模型中存在著大量的矩陣運(yùn)算和復(fù)雜的參數(shù)估計(jì),在實(shí)際應(yīng)用中難以掌握,所以對(duì)于 預(yù)測結(jié)果來說還是存在很多不盡人意的地方。BP神經(jīng)網(wǎng)絡(luò)(BP Neural Network, BPNN)預(yù) 測模型存在訓(xùn)練數(shù)據(jù)需求大、收斂速度慢等問題,而RBF神經(jīng)網(wǎng)絡(luò)(RBFNN)是一種前向神經(jīng) 網(wǎng)絡(luò)模型,克服了 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練數(shù)據(jù)需求大、收斂速度太慢等缺點(diǎn),日漸取代BP神經(jīng) 網(wǎng)絡(luò)成為一種新的交通信息預(yù)測方法,然而,由于人工神經(jīng)網(wǎng)絡(luò)采用經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原理 (ERM),容易陷入局部極值,從而影響泛化能力。近年來,支持向量機(jī)(SVM)在交通信息預(yù)測 中應(yīng)用越來越廣泛,它采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,能有效解決小樣本、非線性等回歸問題, 具有全局尋優(yōu)能力與良好的泛化推廣能力,同時(shí)計(jì)算量少??朔松窠?jīng)網(wǎng)絡(luò)局部極值的難 題。目前,用遺傳算法優(yōu)化支持向量機(jī)參數(shù)的方法應(yīng)用較多,但遺傳算法復(fù)雜的遺傳操作 (如選擇、交叉、變異)使支持向量機(jī)的訓(xùn)練時(shí)間隨問題規(guī)模及復(fù)雜程度的增大而呈指數(shù)級(jí) 增長,且存在局部最優(yōu)等問題。果蠅優(yōu)化算法(Fruit Fly Optimization Algorithm, F0A) 是一種智能群體搜索方法,它不僅具有很強(qiáng)的全局搜索能力,而且容易實(shí)現(xiàn),非常適用于 最小二乘支持向量機(jī)(Least Squares Support Vector Machine, LSSVM)的參數(shù)優(yōu)化。
【發(fā)明內(nèi)容】
[0004] 本發(fā)明針對(duì)現(xiàn)有交通信息的預(yù)測模型預(yù)測精確度不高的問題,而提供一種基于果 蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方法,該方法能夠有效的提高預(yù)測精確度。
[0005] 為實(shí)現(xiàn)上述目的,本發(fā)明采用如下技術(shù)方案:
[0006] 基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方法,該預(yù)測方法包括如下步 驟:
[0007] 步驟一、對(duì)原始交通信息數(shù)據(jù)(包括交通流量、速度和占有率)進(jìn)行歸一化預(yù)處 理,將數(shù)據(jù)歸一化到[0,1]區(qū)間內(nèi),生成數(shù)據(jù)集并且進(jìn)行分組,即訓(xùn)練集和測試集;
[0008] 步驟二、選擇徑向基函數(shù),作為最小二乘支持向量機(jī)模型的核函數(shù),確定參數(shù)組合 (Y,〇),其中Y為正則化參數(shù),〇為徑向基函數(shù)的寬度參數(shù);
[0009] 步驟三、采用果蠅優(yōu)化算法對(duì)最小二乘支持向量機(jī)的參數(shù)組合(Υ,〇 )進(jìn)行優(yōu) 化,在全局范圍內(nèi)得到最優(yōu)值;
[0010] 步驟四、代入經(jīng)過優(yōu)化的參數(shù),構(gòu)造基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信 息預(yù)測模型;
[0011] 步驟五、輸入數(shù)據(jù)集,通過預(yù)測模型生成交通信息預(yù)測結(jié)果;
[0012] 步驟六、根據(jù)交通信息預(yù)測結(jié)果和實(shí)際交通信息數(shù)據(jù),進(jìn)行預(yù)測誤差評(píng)價(jià)分析。
[0013] 進(jìn)一步的技術(shù)方案如下:
[0014] 步驟一的具體過程為:
[0015] 為了加快網(wǎng)絡(luò)的收斂速度和預(yù)測模型的準(zhǔn)確率,需要對(duì)輸入輸出數(shù)據(jù)進(jìn)行歸一化 處理,即通過一定的線性變化將輸入和輸出數(shù)據(jù)統(tǒng)一限制在[0,1]或[-1,1]區(qū)間內(nèi),對(duì)數(shù) 據(jù)進(jìn)行線性歸一化處理:
[0016]
【權(quán)利要求】
1. 一種基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方法,其特征在于,包括以 下步驟: 步驟一、對(duì)原始交通信息數(shù)據(jù)進(jìn)行歸一化預(yù)處理,將數(shù)據(jù)歸一化到[〇,1]區(qū)間內(nèi),生成 數(shù)據(jù)集并且進(jìn)行分組,即訓(xùn)練集和測試集; 步驟二、選擇徑向基函數(shù),作為最小二乘支持向量機(jī)模型的核函數(shù),確定參數(shù)組合 (Y,〇),其中Y為正則化參數(shù),0為徑向基函數(shù)的寬度參數(shù); 步驟三、采用果蠅優(yōu)化算法對(duì)最小二乘支持向量機(jī)的參數(shù)組合(Υ,σ)進(jìn)行優(yōu)化,在 全局范圍內(nèi)得到最優(yōu)值; 步驟四、代入經(jīng)過優(yōu)化的參數(shù),構(gòu)造基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù) 測模型; 步驟五、輸入數(shù)據(jù)集,通過預(yù)測模型生成交通信息預(yù)測結(jié)果; 步驟六、根據(jù)交通信息預(yù)測結(jié)果和實(shí)際交通信息數(shù)據(jù),進(jìn)行預(yù)測誤差評(píng)價(jià)分析。
2. 根據(jù)權(quán)利要求1所述的一種基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方 法,其特征在于,所述步驟一的具體過程為: 通過一定的線性變化將輸入和輸出數(shù)據(jù)統(tǒng)一限制在[〇, 1]或[-1,1]區(qū)間內(nèi),對(duì)數(shù)據(jù)進(jìn) 行線性歸一化處理:
(1) 式⑴中,Xmax為原始交通信息數(shù)據(jù)的最大值,Xmin為原始交通信息數(shù)據(jù)的最小值,\為 t時(shí)刻的原始交通信息數(shù)據(jù),X/為t時(shí)刻相對(duì)應(yīng)的歸一化處理后的交通信息數(shù)據(jù)。
3. 根據(jù)權(quán)利要求1所述的一種基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方 法,其特征在于,所述步驟二的具體過程為: 采用徑向基函數(shù)作為最小二乘支持向量機(jī)的核函數(shù):
(2) 式(2)中,〇為徑向基函數(shù)的寬度參數(shù)。
4. 根據(jù)權(quán)利要求1所述的一種基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方 法,其特征在于,所述步驟三的具體過程為: 1) 讀入交通信息數(shù)據(jù)集; 2) 確定種群個(gè)體數(shù)量sizepop = 20和最大迭代次數(shù)max gen = 100,在[0, 1]范圍內(nèi), 隨機(jī)生成果蠅的初始位置; 3) 賦予果蠅個(gè)體搜尋食物的隨機(jī)飛行方向與距離區(qū)間; 4) 估計(jì)果蠅位置與原點(diǎn)之間的距離,計(jì)算味道濃度判定值Sp Si = Ι/Dp
5) 將參數(shù)組合(Y,c〇代入最小二乘支持向量機(jī)預(yù)測模型中,以預(yù)測的誤差平方和作 為味道判定函數(shù),求出該果蠅位置味道濃度Smell,,即誤差平方和; 6) 找出果蠅群體中使得誤差平方和最小的果蠅,即其味道濃度最低; 7) 保留最佳模型參數(shù)(Υ,σ)與(Xi,Yi)坐標(biāo),此時(shí)果蠅群體利用視覺往該位置飛去; 8) 迭代尋優(yōu),重復(fù)執(zhí)行以上步驟3)至步驟6),并判斷預(yù)測誤差平方和是否優(yōu)于前一迭 代預(yù)測誤差平方和,若是則執(zhí)行步驟7)。
5.根據(jù)權(quán)利要求1所述的一種基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方 法,其特征在于,所述步驟四的具體過程為: 1) 路段上的交通信息與前幾個(gè)時(shí)段的交通信息有著必然的聯(lián)系,利用路段前幾個(gè)時(shí)段 的交通信息數(shù)據(jù)去預(yù)測未來時(shí)段的交通信息:設(shè)x(t)為t時(shí)刻的交通信息數(shù)據(jù),x(t-l)為 t-Ι時(shí)刻的交通信息數(shù)據(jù),采用當(dāng)前時(shí)間段和前s個(gè)時(shí)間段的交通信息對(duì)未來時(shí)間段的交 通信息進(jìn)行預(yù)測,將X (t),X (t-Ι),…,X (t-s)作為樣本t時(shí)刻的輸入值,即Xi,X (t+Ι)作為 樣本的輸出值,即yi ; 2) 建立訓(xùn)練集{(xpyj,(x2,y2),···,(xN,yN)} e (ΧΧΥ)Ν,N為訓(xùn)練集中輸入輸出數(shù)據(jù) 對(duì)的個(gè)數(shù),以作為最小二乘支持向量機(jī)的訓(xùn)練數(shù)據(jù); 3) 通過己知數(shù)據(jù)的分析,選擇徑向基函數(shù)作為核函數(shù)以及采用經(jīng)過果蠅算法優(yōu)化的參 數(shù),根據(jù)最小二乘支持向量機(jī)的算法,構(gòu)造并求解下列問題:
(3) 式(3)中,
為核空間映射函數(shù),
是權(quán)矢量,ei e R為誤差變量,b 為偏差量,J為損失函數(shù),Y為可調(diào)常數(shù); 構(gòu)造拉格朗日函數(shù):
(4) 式⑷中,ai e R為拉格朗日乘子,分別求式⑷對(duì)ei,ai,w,b的偏導(dǎo),再消去w, ei, 可得如下方程:
(5) 式(5)中,y = [y! ; ;yN],Iv = [1 ; ;1],a = [ a 丄;...;a N],i,j = 1,2,…,N ; 根據(jù)Mercer理論,可以選擇核函數(shù)K( ·,·),使得
(6; 由式(5)可解出a i和b。 4) 構(gòu)造預(yù)測函數(shù)
(7) 式(7)即為最后的預(yù)測函數(shù),其中核函數(shù)K(x,Xi)采用徑向基函數(shù); 5) 將測試數(shù)據(jù)集構(gòu)造成上述預(yù)測函數(shù)中輸入變量的形式,代入預(yù)測函數(shù)得到交通信息 的預(yù)測結(jié)果。
6.根據(jù)權(quán)利要求1所述的一種基于果蠅優(yōu)化最小二乘支持向量機(jī)的交通信息預(yù)測方 法,其特征在于,所述步驟六的具體過程為: 1) 計(jì)算平均誤差:平均誤差
誤差(i)/n,即平均誤差是由所有誤差之和除以輸出 樣本的數(shù)量的個(gè)數(shù)得到的; 2) 計(jì)算平均相對(duì)誤差:平均相對(duì)誤差
相對(duì)誤差(i)/n,即平均相對(duì)誤差是由所有相 對(duì)誤差之和除以輸出樣本的數(shù)量的個(gè)數(shù)得到的。 3) 計(jì)算均等系數(shù):
其中,x(k)為實(shí)際交通信息數(shù)據(jù),X'(k)為預(yù)測交通信息數(shù)據(jù),η為預(yù)測個(gè)數(shù)。
【文檔編號(hào)】G06Q10/04GK104091216SQ201410367168
【公開日】2014年10月8日 申請(qǐng)日期:2014年7月29日 優(yōu)先權(quán)日:2014年7月29日
【發(fā)明者】叢玉良, 李曉雷, 郭一粟, 張書揚(yáng), 邢麗娟 申請(qǐng)人:吉林大學(xué)