一種結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法
【專利摘要】本發(fā)明提供一種結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法,該方法為:從照片共享網(wǎng)站下載歷史照片描述信息,采用DBScan聚類算法對(duì)照片進(jìn)行聚類,得到照片密度大的興趣點(diǎn),提取歷史照片描述信息的歷史旅游路線,根據(jù)歷史照片描述信息,建立各興趣點(diǎn)不同時(shí)間間隔的時(shí)間序列模型,根據(jù)該地區(qū)歷史旅游路線集合中的歷史旅游路線生成Markov模型的概率轉(zhuǎn)移矩陣,并通過(guò)用戶實(shí)時(shí)上傳的照片及照片描述信息,對(duì)Markov模型的概率轉(zhuǎn)移矩陣進(jìn)行更新,根據(jù)更新后的Markov模型的概率轉(zhuǎn)移矩陣,為用戶推薦轉(zhuǎn)移概率最大的興趣點(diǎn)。該方法結(jié)合各興趣點(diǎn)的短時(shí)游客流量做路線推薦,在景點(diǎn)內(nèi)部起到分散客流的作用。
【專利說(shuō)明】
一種結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法
技術(shù)領(lǐng)域
[0001] 本發(fā)明屬于數(shù)據(jù)挖掘技術(shù)領(lǐng)域,具體涉及一種結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦 方法。
【背景技術(shù)】
[0002] 隨著智能手機(jī)等移動(dòng)智能設(shè)備的普及,人們生活水平的日益提高。人們?cè)诼猛局?拍攝照片記錄下旅程的風(fēng)景已經(jīng)成為了一種風(fēng)尚。每年都有成千上萬(wàn)的人拍攝了大量的照 片,照片除了記錄了人們旅途的風(fēng)景,還附帶GPS信息、拍攝時(shí)間等有意義的數(shù)據(jù)。這為從照 片中挖掘旅游路線并推薦提供了很好的數(shù)據(jù)源。
[0003] 由于互聯(lián)網(wǎng)的發(fā)展,大量的社交網(wǎng)站、照片共享平臺(tái)涌進(jìn)人們的生活之中。這為旅 途照片的分享提供了良好的互聯(lián)網(wǎng)平臺(tái),使得信息的共享和傳遞得到了極大地提高。大量 社交網(wǎng)站、照片分享平臺(tái)的涌現(xiàn)還為我們獲取數(shù)據(jù)源提供了優(yōu)秀的平臺(tái)支持。
[0004]由于照片信息中包含著GPS信息、拍攝時(shí)間信息,這使得我們依據(jù)照片的拍攝時(shí) 間、照片間GPS信息的變化,提取出旅游路線成為了可能。目前,旅游大數(shù)據(jù)挖掘主要是使用 聚類、關(guān)聯(lián)分析等方法,從大量用戶的移動(dòng)軌跡中找到出現(xiàn)概率比較高的頻繁軌跡模式,進(jìn) 而為旅游行業(yè)提供有價(jià)值的信息,為決策者提供決策支持,同時(shí)也可以為用戶提供個(gè)性化 的路線推薦服務(wù)。上述方法中提出的推薦路線都是基于歷史數(shù)據(jù)提出的一個(gè)經(jīng)典路線,沒(méi) 有考慮到旅行實(shí)時(shí)過(guò)程中游客流量對(duì)路線選擇的影響,當(dāng)某些景點(diǎn)人流過(guò)大時(shí)應(yīng)采取相應(yīng) 的分流策略,對(duì)旅游路線進(jìn)行重新規(guī)劃。
【發(fā)明內(nèi)容】
[0005] 針對(duì)現(xiàn)有技術(shù)的不足,本發(fā)明提出一種結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法。
[0006] 本發(fā)明的技術(shù)方案是:
[0007] -種結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法,包括以下步驟:
[0008] 步驟1:從照片共享網(wǎng)站下載一個(gè)地區(qū)Η年的歷史照片描述信息,并將各歷史照片 描述信息存儲(chǔ)于數(shù)據(jù)庫(kù)中,所述歷史照片描述信息包括:照片ID、照片GPS信息、上傳用戶 ID、照片拍攝時(shí)間、照片主題和照片描述信息;
[0009] 步驟2:針對(duì)數(shù)據(jù)庫(kù)中歷史照片描述信息,采用DBScan聚類算法對(duì)照片GPS信息進(jìn) 行聚類,得到該地區(qū)照片密度大的興趣點(diǎn);
[0010] 步驟3:提取歷史照片描述信息中各個(gè)興趣點(diǎn)在同一天內(nèi)各上傳用戶ID的歷史旅 游路線,得到該地區(qū)的歷史旅游路線集合;
[0011]步驟3.1:提取出各個(gè)興趣點(diǎn)中同一天內(nèi)一個(gè)上傳用戶ID的照片ID,并按照片拍攝 時(shí)間進(jìn)行排序,得到該用戶的一條歷史旅游路線;
[0012]步驟3.2:重復(fù)步驟3.1提取各個(gè)興趣點(diǎn)在同一天內(nèi)各上傳用戶ID的歷史旅游路 線,將該地區(qū)內(nèi)所有人的歷史旅游路線作為歷史旅游路線集合,得到該地區(qū)的歷史旅游路 線集合;
[0013] 步驟4:根據(jù)歷史照片描述信息,建立各興趣點(diǎn)不同時(shí)間間隔的時(shí)間序列模型;
[0014] 步驟4.1:根據(jù)該地區(qū)Η年內(nèi)的照片拍攝時(shí)間,將各興趣點(diǎn)按照季節(jié)劃分為4個(gè)部 分;
[0015] 步驟4.2 :針對(duì)所述劃分的各部分,以t小時(shí)為時(shí)間間隔,統(tǒng)計(jì)出一天內(nèi)各興趣點(diǎn)各 時(shí)間間隔的照片數(shù)量,將各個(gè)時(shí)間間隔中該地區(qū)一個(gè)興趣點(diǎn)的照片數(shù)量的和作為該興趣點(diǎn) 的時(shí)間序列;得到各個(gè)部分各興趣點(diǎn)的時(shí)間序列集合;
[0016] 步驟4.3:判斷當(dāng)前興趣點(diǎn)時(shí)間序列是否平穩(wěn),若是,執(zhí)行步驟4.5,否則,執(zhí)行步驟 4.4;
[0017] 步驟4.4:對(duì)當(dāng)前興趣點(diǎn)的時(shí)間序列進(jìn)行差分處理,得到該興趣點(diǎn)的新的時(shí)間序 列,返回步驟4.3:
[0018] 步驟4.5:根據(jù)當(dāng)前興趣點(diǎn)時(shí)間序列中k時(shí)間間隔的照片數(shù)量的方差和協(xié)方差確定 該興趣點(diǎn)的時(shí)間序列的自相關(guān)系數(shù)和偏自相關(guān)系數(shù),從而確定該興趣點(diǎn)的時(shí)間序列模型; [00 19] 步驟4.6:重復(fù)步驟4.3至步驟4.5,得到各興趣點(diǎn)的時(shí)間序列模型;
[0020] 步驟5:根據(jù)該地區(qū)歷史旅游路線集合中的歷史旅游路線生成Markov模型的概率 轉(zhuǎn)移矩陣,并通過(guò)用戶實(shí)時(shí)上傳的照片及照片描述信息,對(duì)Markov模型的概率轉(zhuǎn)移矩陣進(jìn) 行更新;
[0021] 步驟5.1:根據(jù)歷史旅游路線集合中的歷史旅游路線計(jì)算各個(gè)興趣點(diǎn)間的轉(zhuǎn)移次 數(shù),得到該地區(qū)各興趣點(diǎn)狀態(tài)轉(zhuǎn)移有向圖,生成Markov模型的概率轉(zhuǎn)移矩陣;
[0022] 步驟5.2:將用戶上傳的當(dāng)前時(shí)刻的各興趣點(diǎn)照片數(shù)量和各興趣點(diǎn)對(duì)應(yīng)的時(shí)間序 列模型對(duì)Markov模型的概率轉(zhuǎn)移矩陣進(jìn)行調(diào)整;
[0023]步驟6:根據(jù)用戶上傳的當(dāng)前時(shí)刻的照片GPS信息和更新后的Markov模型的概率轉(zhuǎn) 移矩陣,為用戶推薦轉(zhuǎn)移概率最大的興趣點(diǎn)。
[0024]優(yōu)選地,所述判斷當(dāng)前興趣點(diǎn)時(shí)間序列是否平穩(wěn)的具體方法為:判斷一個(gè)興趣點(diǎn) 時(shí)間序列中照片數(shù)量的均值、方差和協(xié)方差是否與時(shí)間有關(guān),若一個(gè)興趣點(diǎn)時(shí)間序列中照 片數(shù)量的均值、方差和協(xié)方差均與時(shí)間無(wú)關(guān),則該興趣點(diǎn)的時(shí)間序列平穩(wěn)。
[0025] 優(yōu)選地,所述步驟4.5包括以下步驟:
[0026] 步驟4.5.1:根據(jù)當(dāng)前興趣點(diǎn)時(shí)間序列中k時(shí)間間隔的照片數(shù)量的方差和協(xié)方差得 到該興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)和k階滯后的偏自相關(guān)函數(shù);
[0027] 步驟4.5.2:根據(jù)當(dāng)前興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)和k階滯后的偏自相關(guān)函數(shù) 之間的關(guān)系,確定該興趣點(diǎn)的時(shí)間序列模型的形式;
[0028] 步驟4.5.3:根據(jù)當(dāng)前興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)和k階滯后的偏自相關(guān)函數(shù) 是否在置信區(qū)間內(nèi),確定該興趣點(diǎn)的時(shí)間序列模型的階數(shù);
[0029] 步驟4.5.4:采用帶遺忘因子的遞推最小二乘算法確定當(dāng)前興趣點(diǎn)的時(shí)間序列模 型的參數(shù)矩陣。
[0030] 優(yōu)選地,所述步驟5.2包括以下步驟:
[0031 ]步驟5.2.1:將用戶上傳的當(dāng)前時(shí)刻的各興趣點(diǎn)照片數(shù)量輸入對(duì)應(yīng)興趣點(diǎn)的時(shí)間 序列模型,得到各興趣點(diǎn)下一時(shí)刻游客流量的預(yù)測(cè)值,并計(jì)算該地區(qū)各興趣點(diǎn)下一時(shí)刻游 客流量預(yù)測(cè)值的平均值;
[0032]步驟5.2.2:確定各興趣點(diǎn)下一時(shí)刻游客流量預(yù)測(cè)值η」與下一時(shí)刻游客流量預(yù)測(cè) 值的平均值的差值subj,j為興趣點(diǎn);
[0033] 步驟5.2.3:根據(jù)各興趣點(diǎn)下一時(shí)刻游客流量預(yù)測(cè)值^與下一時(shí)刻游客流量預(yù)測(cè) 值的平均值的差值sub」對(duì)Markov模型的轉(zhuǎn)移概率進(jìn)行更新,得到更新后的Markov模型的概 率轉(zhuǎn)移矩陣:
[0034] 所述更新公式為:當(dāng)sub」大于0時(shí) ,其中,Pl/為更新的轉(zhuǎn)移概 率:
,Pij為原Markov模型的轉(zhuǎn)移概率,Λ<Ν為subj大于0的興趣點(diǎn)個(gè) 數(shù),PQ為概率變化的基本單位;
[0035] 當(dāng)subj小于0時(shí):< N 為 mbj 小于0的興趣點(diǎn)個(gè)數(shù)。
[0036] 本發(fā)明的有益效果:
[0037] 本發(fā)明提出一種結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法,該方法結(jié)合各興趣點(diǎn)的 短時(shí)游客流量做路線推薦,對(duì)于游客量過(guò)大或過(guò)小的興趣點(diǎn),適當(dāng)減小下一時(shí)間段到該興 趣點(diǎn)的轉(zhuǎn)移概率,從而在景點(diǎn)內(nèi)部起到分散客流的作用?,F(xiàn)在旅游業(yè)發(fā)展迅速,一些較大的 景點(diǎn)每天都要接待大量的游客,景區(qū)擁堵成了普遍現(xiàn)象,而且人流密集也存在一定的安全 隱患,因此,分散客流就更加有意義。
【附圖說(shuō)明】
[0038] 圖1為本發(fā)明實(shí)施方式中結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法流程圖;
[0039] 圖2為本發(fā)明實(shí)施方式中個(gè)景區(qū)內(nèi)的游客a和游客b的歷史旅游路線示意圖;
[0040] 圖3為本發(fā)明實(shí)施方式中建立各興趣點(diǎn)不同時(shí)間間隔的時(shí)間序列模型的流程圖;
[0041] 圖4為本發(fā)明實(shí)施方式中1-3月、4-6月、7-9月、10-12月四個(gè)部分差分前的時(shí)間序 列和差分處理后的時(shí)間序列對(duì)比示意圖;
[0042]其中,(a)為1-3月差分前的時(shí)間序列和差分處理后的時(shí)間序列對(duì)比示意圖;
[0043] (b)4_6月差分前的時(shí)間序列和差分處理后的時(shí)間序列對(duì)比示意圖;
[0044] (c)7_9月差分前的時(shí)間序列和差分處理后的時(shí)間序列對(duì)比示意圖;
[0045] (d) 10-12月差分前的時(shí)間序列和差分處理后的時(shí)間序列對(duì)比示意圖;
[0046] 圖5為本發(fā)明實(shí)施方式中得到的各興趣點(diǎn)狀態(tài)轉(zhuǎn)移有向圖;
[0047] 圖6為本發(fā)明實(shí)施方式中得到的1-3月、4-6月各興趣點(diǎn)下一時(shí)刻游客流量的預(yù)測(cè) 值與實(shí)際流量的對(duì)比圖;
[0048] 其中,(a)為傳統(tǒng)方法得到的1-3月游客流量的預(yù)測(cè)值與實(shí)際流量的對(duì)比圖;
[0049] (b)為本發(fā)明方法得到的1-3月游客流量的預(yù)測(cè)值與實(shí)際流量的對(duì)比圖;
[0050] (c)為傳統(tǒng)方法得到的4-6月游客流量的預(yù)測(cè)值與實(shí)際流量的對(duì)比圖;
[0051] (d)為本發(fā)明方法得到的4-6月游客流量的預(yù)測(cè)值與實(shí)際流量的對(duì)比圖。
【具體實(shí)施方式】
[0052] 下面結(jié)合附圖對(duì)本發(fā)明【具體實(shí)施方式】加以詳細(xì)的說(shuō)明。
[0053] -種結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法,如圖1所示,包括以下步驟:
[0054]步驟1:從Flickr網(wǎng)站下載一個(gè)地區(qū)5年的歷史照片描述信息,并將各歷史照片描 述信息存儲(chǔ)于數(shù)據(jù)庫(kù)中,所述歷史照片描述信息包括:照片ID、照片GPS信息、上傳用戶ID、 照片拍攝時(shí)間、照片主題和照片描述信息.
[0055]步驟1.1:從Flickr網(wǎng)站下載一個(gè)地區(qū)5年具有歷史照片描述信息的XML格式的照 片文本信息。
[0056]步驟1.2:解析具有歷史照片描述信息的XML格式的照片文本信息,解析出該歷史 照片描述信息:照片ID、照片GPS信息、上傳用戶ID、照片拍攝時(shí)間、照片主題和照片描述信 息,并將各歷史照片描述信息存儲(chǔ)于數(shù)據(jù)庫(kù)中。
[0057] 本實(shí)施方式中,將一張照片phv的歷史照片描述信息以五元組表示:
[0058] phv = (photoidv,ownerv,latv,lonv,datetaken v);其中,photoidv為照片phv的照片 ID,ownerv為照片phv上傳用戶ID,1 a tv為照片phv的拍攝地點(diǎn)對(duì)應(yīng)的煒度,1 onv為照片phv的 拍攝地點(diǎn)對(duì)應(yīng)的精度,datetakenv為照片ph v的拍攝時(shí)間,包含日期和時(shí)間。
[0059]步驟2:針對(duì)數(shù)據(jù)庫(kù)中歷史照片描述信息,采用DBScan聚類算法對(duì)照片GPS信息進(jìn) 行聚類,得到該地區(qū)照片密度大的興趣點(diǎn)。
[0060] 步驟2.1:對(duì)數(shù)據(jù)庫(kù)中照片的歷史照片描述信息進(jìn)行預(yù)處理,刪除信息缺失的歷史 照片描述信息:刪除照片ID、照片GPS信息、上傳用戶ID或照片拍攝時(shí)間缺失的照片信息。
[0061] 步驟2.2:采用DBScan聚類算法對(duì)照片GPS信息進(jìn)行聚類,得到各個(gè)景區(qū)照片密度 大的興趣點(diǎn)。
[0062] 本實(shí)施方式中,采用聚類半徑ε取值為lkm、聚類密度閾值MinPts取值為200的 DBScan聚類算法對(duì)照片GPS信息進(jìn)行聚類,聚類的每一個(gè)簇視為一個(gè)興趣點(diǎn)(Ρ0Ι)。
[0063] 步驟2.3:將各個(gè)興趣點(diǎn)存儲(chǔ)至數(shù)據(jù)庫(kù)中。
[0064] 本實(shí)施方式中,將興趣點(diǎn)信息做每一條數(shù)據(jù)庫(kù)記錄屬性Class_id,更新至數(shù)據(jù)庫(kù) 的每一條記錄。
[0065]步驟3:提取歷史照片描述信息中各個(gè)興趣點(diǎn)在同一天內(nèi)各上傳用戶ID的歷史旅 游路線,得到該地區(qū)的歷史旅游路線集合。
[0066]步驟3.1:提取出各個(gè)興趣點(diǎn)中同一天內(nèi)一個(gè)上傳用戶ID的照片ID,并按照片拍攝 時(shí)間進(jìn)行排序,得到該用戶的一條歷史旅游路線。
[0067]本實(shí)施方式中,一個(gè)用戶a的一條歷史旅游路線Patha表不為:
[0068] Patha= (ownera,date, {Clustero^Clusteri^---->Clusterz}),其中,ownera為用 戶已的用戶10,(^七6為?&1:11£1的發(fā)生的日期,{(]1118七61'()4(]1118七61'14---->Cluster z}為按照片 拍攝時(shí)間先后順序排列的興趣點(diǎn)的集合,在興趣點(diǎn)中一般含有多張照片。
[0069] 步驟3.2:重復(fù)步驟3.1提取各個(gè)興趣點(diǎn)在同一天內(nèi)各上傳用戶ID的歷史旅游路 線,將該地區(qū)內(nèi)所有人的歷史旅游路線作為歷史旅游路線集合,得到該地區(qū)的歷史旅游路 線集合。
[0070] 本實(shí)施方式中,得到的該地區(qū)的歷史旅游路線集合表示為:
[0071 ] PathSet= {Patha,Pathb,Pathc,· · ·}。本實(shí)施方式中,一個(gè)景區(qū)內(nèi)的游客a和游客b 的歷史旅游路線如圖2所示。
[0072] 步驟4:根據(jù)歷史照片描述信息,建立各興趣點(diǎn)不同時(shí)間間隔的時(shí)間序列模型,如 圖3所示。
[0073] 步驟4.1:根據(jù)該地區(qū)5年內(nèi)的照片拍攝時(shí)間,將各興趣點(diǎn)按照季節(jié)劃分為4個(gè)部 分。
[0074] 本實(shí)施方式中,將該地區(qū)5年內(nèi)的照片拍攝時(shí)間,各興趣點(diǎn)按照季節(jié)劃分為4個(gè)部 分為1-3月、4-6月、7-9月、10-12月四個(gè)部分。
[0075] 步驟4.2 :針對(duì)劃分的1-3月、4-6月、7-9月、10-12月四個(gè)部分,以1小時(shí)為時(shí)間間 隔,統(tǒng)計(jì)出一天內(nèi)各興趣點(diǎn)各時(shí)間間隔的照片數(shù)量,將各個(gè)時(shí)間間隔中該地區(qū)一個(gè)興趣點(diǎn) 的照片數(shù)量的和作為該興趣點(diǎn)的時(shí)間序列;得到4個(gè)部分各興趣點(diǎn)的時(shí)間序列集合。
[0076] 步驟4.3:判斷當(dāng)前興趣點(diǎn)時(shí)間序列是否平穩(wěn),若是,執(zhí)行步驟4.5,否則,執(zhí)行步驟 4.4;
[0077] 本實(shí)施方式中,判斷當(dāng)前興趣點(diǎn)時(shí)間序列是否平穩(wěn)的具體方法為:判斷一個(gè)興趣 點(diǎn)時(shí)間序列中照片數(shù)量的均值、方差和協(xié)方差是否與時(shí)間有關(guān),若一個(gè)興趣點(diǎn)時(shí)間序列中 照片數(shù)量的均值E(X t)=u是與時(shí)間t無(wú)關(guān)的常數(shù),照片數(shù)量的方差Var(Xt)=〇2是與時(shí)間t無(wú) 關(guān)的常數(shù),同時(shí)照片數(shù)量的協(xié)方差C 〇V(Xt,Xt+k)=Yk是與時(shí)間間隔k有關(guān),與時(shí)間t無(wú)關(guān)的常 數(shù),則該興趣點(diǎn)的時(shí)間序列平穩(wěn)。
[0078] 步驟4.4:對(duì)當(dāng)前興趣點(diǎn)的時(shí)間序列進(jìn)行差分處理,得到該興趣點(diǎn)的新的時(shí)間序 列,返回步驟4.3。
[0079] 本實(shí)施方式中,對(duì)當(dāng)前興趣點(diǎn)的施加序列進(jìn)行差分處理的公式如式(1)所示:
[0080] Xt7 =Xt-Xt-i (1)
[0081] 其中,X/為更新后的該興趣點(diǎn)的時(shí)間序列,得到的1-3月、4-6月、7-9月、10-12月 四個(gè)部分差分前的時(shí)間序列和差分處理后的時(shí)間序列對(duì)比示意圖如圖4所示。
[0082] 步驟4.5:根據(jù)當(dāng)前興趣點(diǎn)時(shí)間序列中k時(shí)間間隔的照片數(shù)量的方差和協(xié)方差確定 該興趣點(diǎn)的時(shí)間序列的自相關(guān)系數(shù)和偏自相關(guān)系數(shù),從而確定該興趣點(diǎn)的時(shí)間序列模型。
[0083] 步驟4.5.1:根據(jù)當(dāng)前興趣點(diǎn)時(shí)間序列中k時(shí)間間隔的照片數(shù)量的方差和協(xié)方差得 到該興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)和k階滯后的偏自相關(guān)函數(shù)。
[0084] 本實(shí)施方式中,一個(gè)興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)ACF = pk如式(2)所示:
[0086] -個(gè)興趣點(diǎn)的k階滯后的偏自相關(guān)函如式(3)所示:
[0088] 步驟4.5.2:根據(jù)當(dāng)前興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)和k階滯后的偏自相關(guān)函數(shù) 之間的關(guān)系,確定該興趣點(diǎn)的時(shí)間序列模型的形式。
[0089] 本實(shí)施方式中,根據(jù)當(dāng)前興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)和k階滯后的偏自相關(guān)函 數(shù)之間的關(guān)系,確定該興趣點(diǎn)的時(shí)間序列模型的形式具體為:
[0090] 若當(dāng)前興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)和k階滯后的偏自相關(guān)函數(shù)均為拖尾的,拖 尾即函數(shù)形狀成指數(shù)級(jí)遞減,則選取該興趣點(diǎn)的時(shí)間序列模型的形式為:ARMA(p, q)模型 (自回歸滑動(dòng)平均模型);
[0091] 若當(dāng)前興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)為拖尾的,并且當(dāng)前興趣點(diǎn)的k階滯后的偏 自相關(guān)函數(shù)為截尾的,截尾即函數(shù)在一定延遲k后趨近于0,則選取該興趣點(diǎn)的時(shí)間序列模 型的形式為:AR(p)模型(自回歸模型);
[0092] 若當(dāng)前興趣點(diǎn)的k階滯后的偏自相關(guān)函數(shù)為拖尾的,并且當(dāng)前興趣點(diǎn)的k階滯后的 自相關(guān)函數(shù)為截尾的,則選取該興趣點(diǎn)的時(shí)間序列模型的形式為:MA(q)模型(滑動(dòng)平均模 型)。
[0093]步驟4.5.3:根據(jù)當(dāng)前興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)和k階滯后的偏自相關(guān)函數(shù) 是否在置信區(qū)間內(nèi),確定該興趣點(diǎn)的時(shí)間序列模型的階數(shù)。
[0094] 步驟4.5.3.1:設(shè)定時(shí)間偏差V =0,時(shí)間序列模型的階數(shù)p = 0和q = 0。
[0095] 步驟4.5.3.2:計(jì)算當(dāng)前興趣點(diǎn)各時(shí)間序列的V階滯后的自相關(guān)函數(shù)ACF = Pk和1^ 階滯后的偏自相關(guān)函數(shù)。
[0096] 步驟4.5.3.3:判斷pk'和?U·是否都在置信區(qū)間內(nèi),若是執(zhí)行步驟4.5.3.5,否則, 執(zhí)行步驟4.5.3.4。
[0097] 本實(shí)施方式中,
,判斷Pk'和@??是否都在置信區(qū)間內(nèi)即判
[0098] 步驟4.5.3.4:
,則令q = q+ 1,同時(shí),令k7 =1^+1,返回步驟4.5.3.2。
[0099] 步驟4.5.3.5:當(dāng)前時(shí)間序列模型的階數(shù)p和q作為當(dāng)前興趣點(diǎn)的時(shí)間序列模型的 階數(shù)。
[0100] 步驟4.5.4:采用帶遺忘因子的遞推最小二乘算法確定當(dāng)前興趣點(diǎn)的時(shí)間序列模 型的參數(shù)矩陣。
[0101] 本實(shí)施方式中,令遺忘因子P = 〇.97,均方根誤差閾值為n=18.2863。
[0102] 步驟4.6:重復(fù)步驟4.3至步驟4.5,得到各興趣點(diǎn)的時(shí)間序列模型。
[0103] 步驟5:根據(jù)該地區(qū)歷史旅游路線集合中的歷史旅游路線生成Markov模型的概率 轉(zhuǎn)移矩陣,并通過(guò)用戶實(shí)時(shí)上傳的照片及照片描述信息,對(duì)Markov模型的概率轉(zhuǎn)移矩陣進(jìn) 行更新。
[0104] 步驟5.1:根據(jù)歷史旅游路線集合中的歷史旅游路線計(jì)算各個(gè)興趣點(diǎn)間的轉(zhuǎn)移次 數(shù),得到該地區(qū)各興趣點(diǎn)狀態(tài)轉(zhuǎn)移有向圖,生成Markov模型的概率轉(zhuǎn)移矩陣。
[0105] 本實(shí)施方式中,得到的各興趣點(diǎn)狀態(tài)轉(zhuǎn)移有向圖如圖5所示。
[0106] 本實(shí)施方式中,生成Markov模型的概率轉(zhuǎn)移矩陣如式(4)所示:
[0108]步驟5.2:將用戶上傳的當(dāng)前時(shí)刻的各興趣點(diǎn)照片數(shù)量和各興趣點(diǎn)對(duì)應(yīng)的時(shí)間序 列模型對(duì)Markov模型的概率轉(zhuǎn)移矩陣進(jìn)行調(diào)整。
[0109]步驟5.2.1:將用戶上傳的當(dāng)前時(shí)刻的各興趣點(diǎn)照片數(shù)量輸入對(duì)應(yīng)興趣點(diǎn)的時(shí)間 序列模型,得到各興趣點(diǎn)下一時(shí)刻游客流量的預(yù)測(cè)值^,并計(jì)算該地區(qū)各興趣點(diǎn)下一時(shí)刻 游客流量預(yù)測(cè)值的平均值
,j為興趣點(diǎn),N為該地區(qū)興趣點(diǎn)個(gè)數(shù)。
[0110] 本實(shí)施方式中,得到的1-3月、4-6月各興趣點(diǎn)下一時(shí)刻游客流量的預(yù)測(cè)值與實(shí)際 流量的對(duì)比圖如圖6所示,其中(a)和(c)為傳統(tǒng)方法得到的游客流量的預(yù)測(cè)值與實(shí)際流量 的對(duì)比圖,(b)和(d)為本發(fā)明方法得到的游客流量的預(yù)測(cè)值與實(shí)際流量的對(duì)比圖。
[0111] 步驟5.2.2:確定各興趣點(diǎn)下一時(shí)刻游客流量預(yù)測(cè)值^與下一時(shí)刻游客流量預(yù)測(cè) 值的平均值的差值SUbj。
[0112]本實(shí)施方式中,各興趣點(diǎn)下一時(shí)刻游客流量預(yù)測(cè)值11()、111、112、113、114分別為:?1〇¥ [164 150 94 221 371]〇
[0113]各興趣點(diǎn)下一時(shí)刻游客流量預(yù)測(cè)值^與下一時(shí)刻游客流量預(yù)測(cè)值的平均值的差 值 subj 分別為:subj={-36,-50,-106,21,171}〇
[0114]步驟5.2.3:根據(jù)各興趣點(diǎn)下一時(shí)刻游客流量預(yù)測(cè)值^與下一時(shí)刻游客流量預(yù)測(cè) 值的平均值的差值sub」對(duì)Markov模型的轉(zhuǎn)移概率進(jìn)行更新,得到更新后的Markov模型的概 率轉(zhuǎn)移矩陣。
[0115]本實(shí)施方式中,當(dāng)sub」大于0時(shí),更新公式如式(5)所示:
[0117] 其中,Pi/為更新的轉(zhuǎn)移概率,i
_,_Pij為原Markov模 型的轉(zhuǎn)移概率,Λ<Ν為subj大于0的興趣點(diǎn)個(gè)數(shù),po為概率變化的基本單位。
[0118] 當(dāng)sub^J、于0時(shí),更新公式如式(6)所示:
[0121 ]本實(shí)施方式中,sumi= | -36-50-106 | = 192, sum2= |21+17l|=192〇
[0122]以Markov模型的概率轉(zhuǎn)移矩陣式(4)中興趣點(diǎn)在Cl處為例,更新后的Markov模型 的概率轉(zhuǎn)移矩陣如式(7)所示:
[0124] 步驟6:根據(jù)用戶上傳的當(dāng)前時(shí)刻的照片GPS信息和更新后的Markov模型的概率轉(zhuǎn) 移矩陣,為用戶推薦轉(zhuǎn)移概率最大的興趣點(diǎn)。
[0125] 本實(shí)施方式中,根據(jù)用戶上傳的當(dāng)前時(shí)刻的照片GPS所在的興趣點(diǎn),在更新后的 Markov模型的概率轉(zhuǎn)移矩陣中找到所在興趣點(diǎn)的一行中找到概率最大的興趣點(diǎn)發(fā)送給用 戶。
【主權(quán)項(xiàng)】
1. 一種結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法,其特征在于,包括W下步驟: 步驟1:從照片共享網(wǎng)站下載一個(gè)地區(qū)Η年的歷史照片描述信息,并將各歷史照片描述 信息存儲(chǔ)于數(shù)據(jù)庫(kù)中,所述歷史照片描述信息包括:照片ID、照片GPS信息、上傳用戶ID、照 片拍攝時(shí)間、照片主題和照片描述信息; 步驟2:針對(duì)數(shù)據(jù)庫(kù)中歷史照片描述信息,采用DBScan聚類算法對(duì)照片GPS信息進(jìn)行聚 類,得到該地區(qū)照片密度大的興趣點(diǎn); 步驟3:提取歷史照片描述信息中各個(gè)興趣點(diǎn)在同一天內(nèi)各上傳用戶ID的歷史旅游路 線,得到該地區(qū)的歷史旅游路線集合; 步驟3.1:提取出各個(gè)興趣點(diǎn)中同一天內(nèi)一個(gè)上傳用戶ID的照片ID,并按照片拍攝時(shí)間 進(jìn)行排序,得到該用戶的一條歷史旅游路線; 步驟3.2:重復(fù)步驟3.1提取各個(gè)興趣點(diǎn)在同一天內(nèi)各上傳用戶ID的歷史旅游路線,將 該地區(qū)內(nèi)所有人的歷史旅游路線作為歷史旅游路線集合,得到該地區(qū)的歷史旅游路線集 合; 步驟4:根據(jù)歷史照片描述信息,建立各興趣點(diǎn)不同時(shí)間間隔的時(shí)間序列模型; 步驟4.1:根據(jù)該地區(qū)Η年內(nèi)的照片拍攝時(shí)間,將各興趣點(diǎn)按照季節(jié)劃分為4個(gè)部分; 步驟4.2:針對(duì)所述劃分的各部分,Wt小時(shí)為時(shí)間間隔,統(tǒng)計(jì)出一天內(nèi)各興趣點(diǎn)各時(shí)間 間隔的照片數(shù)量,將各個(gè)時(shí)間間隔中該地區(qū)一個(gè)興趣點(diǎn)的照片數(shù)量的和作為該興趣點(diǎn)的時(shí) 間序列;得到各個(gè)部分各興趣點(diǎn)的時(shí)間序列集合; 步驟4.3:判斷當(dāng)前興趣點(diǎn)時(shí)間序列是否平穩(wěn),若是,執(zhí)行步驟4.5,否則,執(zhí)行步驟4.4; 步驟4.4:對(duì)當(dāng)前興趣點(diǎn)的時(shí)間序列進(jìn)行差分處理,得到該興趣點(diǎn)的新的時(shí)間序列,返 回步驟4.3; 步驟4.5:根據(jù)當(dāng)前興趣點(diǎn)時(shí)間序列中k時(shí)間間隔的照片數(shù)量的方差和協(xié)方差確定該興 趣點(diǎn)的時(shí)間序列的自相關(guān)系數(shù)和偏自相關(guān)系數(shù),從而確定該興趣點(diǎn)的時(shí)間序列模型; 步驟4.6:重復(fù)步驟4.3至步驟4.5,得到各興趣點(diǎn)的時(shí)間序列模型; 步驟5:根據(jù)該地區(qū)歷史旅游路線集合中的歷史旅游路線生成Markov模型的概率轉(zhuǎn)移 矩陣,并通過(guò)用戶實(shí)時(shí)上傳的照片及照片描述信息,對(duì)Markov模型的概率轉(zhuǎn)移矩陣進(jìn)行更 新; 步驟5.1:根據(jù)歷史旅游路線集合中的歷史旅游路線計(jì)算各個(gè)興趣點(diǎn)間的轉(zhuǎn)移次數(shù),得 到該地區(qū)各興趣點(diǎn)狀態(tài)轉(zhuǎn)移有向圖,生成Markov模型的概率轉(zhuǎn)移矩陣; 步驟5.2:將用戶上傳的當(dāng)前時(shí)刻的各興趣點(diǎn)照片數(shù)量和各興趣點(diǎn)對(duì)應(yīng)的時(shí)間序列模 型對(duì)Markov模型的概率轉(zhuǎn)移矩陣進(jìn)行調(diào)整; 步驟6:根據(jù)用戶上傳的當(dāng)前時(shí)刻的照片GPS信息和更新后的Markov模型的概率轉(zhuǎn)移矩 陣,為用戶推薦轉(zhuǎn)移概率最大的興趣點(diǎn)。2. 根據(jù)權(quán)利要求1所述的結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法,其特征在于,所述判 斷當(dāng)前興趣點(diǎn)時(shí)間序列是否平穩(wěn)的具體方法為:判斷一個(gè)興趣點(diǎn)時(shí)間序列中照片數(shù)量的均 值、方差和協(xié)方差是否與時(shí)間有關(guān),若一個(gè)興趣點(diǎn)時(shí)間序列中照片數(shù)量的均值、方差和協(xié)方 差均與時(shí)間無(wú)關(guān),則該興趣點(diǎn)的時(shí)間序列平穩(wěn)。3. 根據(jù)權(quán)利要求1所述的結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法,其特征在于,所述步 驟4.5包括W下步驟: 步驟4.5.1:根據(jù)當(dāng)前興趣點(diǎn)時(shí)間序列中k時(shí)間間隔的照片數(shù)量的方差和協(xié)方差得到該 興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)和k階滯后的偏自相關(guān)函數(shù); 步驟4.5.2:根據(jù)當(dāng)前興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)和k階滯后的偏自相關(guān)函數(shù)之間 的關(guān)系,確定該興趣點(diǎn)的時(shí)間序列模型的形式; 步驟4.5.3:根據(jù)當(dāng)前興趣點(diǎn)的k階滯后的自相關(guān)函數(shù)和k階滯后的偏自相關(guān)函數(shù)是否 在置信區(qū)間內(nèi),確定該興趣點(diǎn)的時(shí)間序列模型的階數(shù); 步驟4.5.4:采用帶遺忘因子的遞推最小二乘算法確定當(dāng)前興趣點(diǎn)的時(shí)間序列模型的 參數(shù)矩陣。4.根據(jù)權(quán)利要求1所述的結(jié)合短時(shí)流量預(yù)測(cè)的旅游路線推薦方法,其特征在于,所述步 驟5.2包括W下步驟: 步驟5.2.1:將用戶上傳的當(dāng)前時(shí)刻的各興趣點(diǎn)照片數(shù)量輸入對(duì)應(yīng)興趣點(diǎn)的時(shí)間序列 模型,得到各興趣點(diǎn)下一時(shí)刻游客流量的預(yù)測(cè)值,并計(jì)算該地區(qū)各興趣點(diǎn)下一時(shí)刻游客流 量預(yù)測(cè)值的平均值; 步驟5.2.2:確定各興趣點(diǎn)下一時(shí)刻游客流量預(yù)測(cè)值W與下一時(shí)刻游客流量預(yù)測(cè)值的平 均值的差值subj,j為興趣點(diǎn); 步驟5.2.3:根據(jù)各興趣點(diǎn)下一時(shí)刻游客流量預(yù)測(cè)值W與下一時(shí)刻游客流量預(yù)測(cè)值的平 均值的差值subj對(duì)Markov模型的轉(zhuǎn)移概率進(jìn)行更新,得到更新后的Markov模型的概率轉(zhuǎn)移 矩陣; 所述更新公式為:當(dāng)subj大于0時(shí),4其中,Pi/為更新的轉(zhuǎn)移概率,Pij為原Markov模型的轉(zhuǎn)移概率,化<賦13郵大于0的興趣點(diǎn)個(gè)數(shù), P0為概率變化的基本單位; 當(dāng)subj小于0時(shí),令化<N為subj小于 0的興趣點(diǎn)個(gè)數(shù)。
【文檔編號(hào)】G06Q10/04GK106095973SQ201610442583
【公開(kāi)日】2016年11月9日
【申請(qǐng)日】2016年6月20日
【發(fā)明人】楊廣明, 劉瑩, 張賀, 尚懷軍, 張玉爽
【申請(qǐng)人】東北大學(xué)