欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

用于交通小區(qū)劃分的手機信令信息的處理方法

文檔序號:6715509閱讀:1163來源:國知局
用于交通小區(qū)劃分的手機信令信息的處理方法
【專利摘要】本發(fā)明屬于城市交通數(shù)據(jù)采集分析【技術(shù)領(lǐng)域】,尤其涉及一種用于交通小區(qū)劃分的手機信令信息的處理方法,包括:對手機信令數(shù)據(jù)進行清洗,剔除異常數(shù)據(jù);將手機數(shù)據(jù)對應(yīng)的基站位置信息與道路進行匹配;建立基于手機信令信息的交通語義分類;根據(jù)交通語義分類情況,選取手機基站特征對其進行區(qū)別;對手機信令信息進行提煉,得到手機基站的特征;通過對手機基站特征進行聚類分析,實現(xiàn)交通小區(qū)劃分。利用手機信令數(shù)據(jù)對城市進行的交通小區(qū)劃分與當(dāng)今大數(shù)據(jù)挖掘的趨勢相一致;語義劃分對于實際中基站的種類劃分起到簡化作用,并且能有效、自動的識別區(qū)域和基站的屬性;能快速直接的劃分出城市交通小區(qū),具有數(shù)據(jù)采集容易,劃分成本低廉、快速直接的優(yōu)點。
【專利說明】用于交通小區(qū)劃分的手機信令信息的處理方法

【技術(shù)領(lǐng)域】
[0001] 本發(fā)明屬于城市交通數(shù)據(jù)采集分析【技術(shù)領(lǐng)域】,尤其涉及一種用于交通小區(qū)劃分的 手機信令信息的處理方法。

【背景技術(shù)】
[0002] 目前,海量的數(shù)據(jù)的分析挖掘和管理應(yīng)用成為現(xiàn)代交通該服務(wù)的瓶頸。在這些數(shù) 據(jù)中,軌跡數(shù)據(jù)的分析與挖掘研究主要關(guān)注軌跡時態(tài)和空間分布特征的提取,由于缺乏與 應(yīng)用語義的關(guān)聯(lián),具體應(yīng)用開發(fā)方面裹足不前。
[0003] 城市道路網(wǎng)絡(luò)交通小區(qū)是為了減少交通控制和管理系統(tǒng)的復(fù)雜性,將復(fù)雜交通網(wǎng) 絡(luò)分解為若干個交通區(qū)域,對交通區(qū)域進行協(xié)調(diào)優(yōu)化。交通小區(qū)劃分最早是在交通規(guī)劃領(lǐng) 域中提出的,其目的主要是為了定義城市路網(wǎng)中交通起訖點的位置,然后使用需求預(yù)測模 型對各交通小區(qū)間的交通出行量進預(yù)測,是研究四階段法中交通生成、分布的基本空間單 位。
[0004] 目前國內(nèi)外交通小區(qū)的劃分方法主要有基于聚類分析的交通小區(qū)劃分方法、面向 控制的交通小區(qū)劃分、基于區(qū)內(nèi)出行比例的交通小區(qū)劃分方法、對手機話務(wù)量的聚類分析 方法、扇形分割方法等五種方法。其中基于手機話務(wù)量的聚類分析方法是指利用手機話務(wù) 量的時間分布特征來分析劃分城市活動及土地利用特性,從而進一步映射出交通小區(qū)。
[0005] 整個過程要綜合基站、手機與用戶使用者之間的關(guān)系從而得出各交通小區(qū)間的OD 矩陣。但利用手機話務(wù)量來進行交通小區(qū)劃分相比于利用手機信令定位數(shù)據(jù)來說精準度更 低。目前,與交通相關(guān)的交通小區(qū)劃分方法主要是通過人工調(diào)查、人工統(tǒng)計的方式進行,費 時費力,且數(shù)據(jù)的準確性無法保證。
[0006] 傳統(tǒng)的方法耗費時間和人力物力,像北京做一次起訖點調(diào)查要耗費約170萬和大 量人力,這種方法得到的數(shù)據(jù)只是現(xiàn)在的出行狀態(tài)的一個快照,并且要花費幾年的時間更 新數(shù)據(jù),而基于手機定位數(shù)據(jù)獲取OD數(shù)據(jù)的方法只需要從運營商處獲得手機移動記錄,這 些記錄的獲得不需要額外的投資(例如,升級基站或手機移動終端)。交通小區(qū)劃分的準確 性若無法保證,將會影響后續(xù)工作的研究。


【發(fā)明內(nèi)容】

[0007] 為了克服上述現(xiàn)有方法存在的缺陷,本發(fā)明提出了一種用于交通小區(qū)劃分的手機 信令信息的處理方法,包括:
[0008] 步驟1、對手機信令數(shù)據(jù)進行清洗,剔除異常數(shù)據(jù);
[0009] 步驟2、將手機數(shù)據(jù)對應(yīng)的基站位置信息與道路進行匹配;
[0010]步驟3、建立基于手機信令信息的交通語義分類;
[0011] 步驟4、根據(jù)交通語義分類情況,提取手機基站特征對其進行區(qū)別;
[0012] 步驟5、根據(jù)步驟4所提取的手機基站特征,利用聚類分析法標定出手機基站所屬 的交通語義類別;
[0013] 步驟6、通過步驟5標定出的手機基站所屬的交通語義類別再加上手機基站位置 特征作為特征量,采用聚類分析法,實現(xiàn)交通小區(qū)劃分。
[0014] 所述步驟1中的異常數(shù)據(jù)包括:數(shù)據(jù)時間、坐標及唯一標識,剔除時間異常、位置 異常、重復(fù)數(shù)據(jù)以及缺失數(shù)據(jù)。
[0015] 所述步驟2具體包括:
[0016] 步驟21、將獲得的數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫,并調(diào)整格式;
[0017] 步驟22、對手機信令數(shù)據(jù)進行過濾;
[0018] 步驟23、將連續(xù)的手機數(shù)據(jù)分割成基于隸屬基站的數(shù)據(jù);
[0019] 步驟24、結(jié)合基站位置信息,在地理信息系統(tǒng)上可視化顯示。
[0020] 所述步驟22中的過濾是指:完成數(shù)據(jù)的質(zhì)量分析、清洗、轉(zhuǎn)換、預(yù)統(tǒng)計、加載,得到 實驗所需的字段MSISDN、TimeStamp、LAC、CELLID、EventID;另外,將同一用戶在同一位置 發(fā)生的事件進行壓縮,只體現(xiàn)出移動性,不考慮用戶發(fā)生的具體業(yè)務(wù)。
[0021] 所述步驟3中的交通語義分類具體分為以下三大類:工作區(qū)、居住區(qū)和城市道路。
[0022] 所述手機基站的特征是通過分析不同語義屬性的典型基站的人流量變化來反映 基站各時段不同形式人流量的變化情況,具體為包括:1)實時人流量:是指某整點時刻向 前延長的單位時間里該區(qū)域范圍內(nèi)活動的手機用戶數(shù)量;2)時段流入量:是指在上一個時 段中不在該區(qū)域范圍內(nèi)活動但在下一個時段中在區(qū)域內(nèi)活動的手機用戶數(shù)量;3)時段流 出量:是指在上一個時段在該區(qū)域范圍內(nèi)活動但下一個時段不在該區(qū)域內(nèi)活動的手機用戶 數(shù)量;4)時段新增人流量:用指定時段前后兩個時刻的實時人流量相比較即得出時段新增 人流量。
[0023] 所述的實時人流量的算法包括:1)將目標區(qū)域的基站制作成地理信息系統(tǒng)圖層; 2)將基站圖層添加到地圖中,并將基站和目標區(qū)域地圖圖層關(guān)聯(lián);3)根據(jù)數(shù)據(jù)中移動用戶 和基站的關(guān)系,以及地圖中基站和目標區(qū)域的關(guān)聯(lián),篩選出屬于目標區(qū)域的移動用戶;4) 確定要篩選的時刻,然后選出該時刻向前延長單位時間內(nèi)出現(xiàn)過的移動用戶,排重后即為 該時刻的實時人流量。
[0024] 所述時段流入量、時段流出量以及時段新增人流量的算法步驟具體為:1)選定時 間段[a,b],時間跨度t小時;2)統(tǒng)計出時間點a對應(yīng)的集合A中的用戶,排重;3)統(tǒng)計出 時間點b對應(yīng)的集合B中的用戶,排重;4)統(tǒng)計集合A與集合B的差集中的用戶即為流出 用戶;5)統(tǒng)計集合B與集合A的差集B-A中的用戶即為流入用戶;6)B-A集合中用戶量減去 集合B-A中用戶量即為時段新增人流量。
[0025] 所述步驟4中所提取的手機基站特征包括:將手機基站實時人流量、小時流入量、 小時流出量、時段新增流量作為聚類的4個基本特征;設(shè)手機數(shù)據(jù)中全部基站為聚類樣本 數(shù)據(jù)X= {Xl,x2,…Xi···,χη},η為手機基站總數(shù),Xi為第i個手機基站;每個基站有M= 96 個特征量:24個實時人流量、24個小時流入量、24個小時流出量、24個時段新增流量,特征 具體為(4,<,…<6).由于交通語義類別共分為3類,所以在聚類開始前制定K為3,進行K 均值聚類。
[0026] 所述步驟6具體包括:將手機基站的經(jīng)度、緯度以及所屬的語義劃分類型作為聚 類特征,得到特征總數(shù)M= 3,特征具體為;預(yù)設(shè)K為任意整數(shù),進行K均值聚類, 直到標準測度函數(shù)收斂為止得到K值即為小區(qū)總數(shù)。
[0027] 所述步驟5和步驟6中的聚類分析法包括:
[0028] 步驟61、從η個手機基站中選擇k個手機基站作為初始聚類中心,其他手機基站則 根據(jù)這些手機基站與初始聚類中心的距離及相似度分別分配到最相近的小區(qū);h為第j個 聚類中心,則\與(^_的距離為
[0029]

【權(quán)利要求】
1. 一種用于交通小區(qū)劃分的手機信令信息的處理方法,其特征在于,包括: 步驟1、對手機信令數(shù)據(jù)進行清洗,剔除異常數(shù)據(jù); 步驟2、將手機數(shù)據(jù)對應(yīng)的基站位置信息與道路進行匹配; 步驟3、建立基于手機信令信息的交通語義分類; 步驟4、根據(jù)交通語義分類情況,提取手機基站特征對其進行區(qū)別; 步驟5、根據(jù)步驟4所提取的手機基站特征,利用聚類分析法標定出手機基站所屬的交 通語義類別; 步驟6、通過步驟5標定出的手機基站所屬的交通語義類別再加上手機基站位置特征 作為特征量,采用聚類分析法,實現(xiàn)交通小區(qū)劃分。
2. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟1中的異常數(shù)據(jù)包括:數(shù)據(jù)時 間、坐標及唯一標識,剔除時間異常、位置異常、重復(fù)數(shù)據(jù)以及缺失數(shù)據(jù)。
3. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟2具體包括: 步驟21、將獲得的數(shù)據(jù)導(dǎo)入數(shù)據(jù)庫,并調(diào)整格式; 步驟22、對手機信令數(shù)據(jù)進行過濾; 步驟23、將連續(xù)的手機數(shù)據(jù)分割成基于隸屬基站的數(shù)據(jù); 步驟24、結(jié)合基站位置信息,在地理信息系統(tǒng)上可視化顯示。
4. 根據(jù)權(quán)利要求3所述的方法,其特征在于,所述步驟22中的過濾是指:完成數(shù)據(jù)的 質(zhì)量分析、清洗、轉(zhuǎn)換、預(yù)統(tǒng)計、加載,得到實驗所需的字段MSISDN、TimeStamp、LAC、CELLID、 EventID;另外,將同一用戶在同一位置發(fā)生的事件進行壓縮,只體現(xiàn)出移動性,不考慮用戶 發(fā)生的具體業(yè)務(wù)。
5. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟3中的交通語義分類具體分為以 下三大類:工作區(qū)、居住區(qū)和城市道路。
6. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述手機基站特征是通過分析不同語義 屬性的典型基站的人流量變化來反映基站各時段不同形式人流量的變化情況,具體為包 括:1)實時人流量:是指某整點時刻向前延長的單位時間里該區(qū)域范圍內(nèi)活動的手機用戶 數(shù)量;2)時段流入量:是指在上一個時段中不在該區(qū)域范圍內(nèi)活動但在下一個時段中在區(qū) 域內(nèi)活動的手機用戶數(shù)量;3)時段流出量:是指在上一個時段在該區(qū)域范圍內(nèi)活動但下一 個時段不在該區(qū)域內(nèi)活動的手機用戶數(shù)量;4)時段新增人流量:用指定時段前后兩個時刻 的實時人流量相比較即得出時段新增人流量; 所述的實時人流量的算法包括:1)將目標區(qū)域的基站制作成地理信息系統(tǒng)圖層;2)將 基站圖層添加到地圖中,并將基站和目標區(qū)域地圖圖層關(guān)聯(lián);3)根據(jù)數(shù)據(jù)中移動用戶和基 站的關(guān)系,以及地圖中基站和目標區(qū)域的關(guān)聯(lián),篩選出屬于目標區(qū)域的移動用戶;4)確定 要篩選的時刻,然后選出該時刻向前延長單位時間內(nèi)出現(xiàn)過的移動用戶,排重后即為該時 刻的實時人流量。
7. 根據(jù)權(quán)利要求6所述的方法,其特征在于,所述時段流入量、時段流出量以及時段新 增人流量的算法步驟具體為:1)選定時間段[a,b],時間跨度t小時;2)統(tǒng)計出時間點a對 應(yīng)的集合A中的用戶,排重;3)統(tǒng)計出時間點b對應(yīng)的集合B中的用戶,排重;4)統(tǒng)計集合 A與集合B的差集中的用戶即為流出用戶;5)統(tǒng)計集合B與集合A的差集B-A中的用戶即 為流入用戶;6)B-A集合中用戶量減去集合B-A中用戶量即為時段新增人流量。
8. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟4中所提取的手機基站特征包 括:將手機基站實時人流量、小時流入量、小時流出量、時段新增流量作為聚類的4個基本 特征;設(shè)手機數(shù)據(jù)中全部基站為聚類樣本數(shù)據(jù)X= {Xl,x2,…Xi…,xn},n為手機基站總數(shù), Xi為第i個手機基站;每個基站有M= 96個特征量:24個實時人流量、24個小時流入量、 24個小時流出量、24個時段新增流量,特征具體為(?^,<,…^f).由于交通語義類別共分為 3類,所以在聚類開始前制定K為3,進行K均值聚類。
9. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟6具體包括:將手機基站的 經(jīng)度、緯度以及所屬的語義劃分類型作為聚類特征,得到特征總數(shù)M= 3,特征具體為 (x/,x,2,x,3);預(yù)設(shè)K為任意整數(shù),進行K均值聚類,直到標準測度函數(shù)收斂為止得到K值即為 小區(qū)總數(shù)。
10. 根據(jù)權(quán)利要求1所述的方法,其特征在于,所述步驟5和步驟6中的聚類分析法包 括: 步驟101、從n個手機基站中選擇k個手機基站作為初始聚類中心,其他手機基站則根 據(jù)這些手機基站與初始聚類中心的距離及相似度分別分配到最相近的小區(qū);h為第j個聚 類中心,則x#c」的距離為
其中,xf為第i個手機基站的第m個特征,< 為第j個聚類中心的第m個特征,m = (1,2,…,M),M為特征總量;x#c』的相似度為s(xi,Cj) = 1/d(Xi,Cj); 步驟102、計算每個更新的小區(qū)的聚類中心,用聚類中心的編號替代小區(qū)的編號,則第 j個小區(qū)的手機基站為{W7.2,丨,即該小區(qū)包含1個手機基站,則該小區(qū) 的聚類中心為, <, ? ? % % },其中為第j個小區(qū)的聚類中心a的第m個 特征,根據(jù)下式求得:
其中,x#是第j個小區(qū)中的第i個手機基站,r^_是第j個小區(qū)中的手機基站個數(shù), 是第j個小區(qū)中第i個手機基站的第m個特征; 步驟103、重復(fù)執(zhí)行步驟102,直到標準測度函數(shù)收斂為止,其形式為:
其中,J是標準值,Xcu_是第c種類別中的第j個小區(qū)的特征,c。是第c種類別中的類中 心的特征,c= (1,2, --?!(),K為類別總數(shù),h是第j個小區(qū)中的手機基站個數(shù),n為手機基 站總數(shù)。
【文檔編號】G08G1/01GK104484993SQ201410709303
【公開日】2015年4月1日 申請日期:2014年11月27日 優(yōu)先權(quán)日:2014年11月27日
【發(fā)明者】董宏輝, 賈利民, 秦勇, 武明超, 丁曉青, 單慶超, 李盼 申請人:北京交通大學(xué)
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
昔阳县| 离岛区| 永修县| 慈溪市| 莱芜市| 毕节市| 山阴县| 墨脱县| 沈阳市| 建水县| 玉田县| 绵竹市| 共和县| 崇文区| 那坡县| 方山县| 丹巴县| 南丰县| 清水县| 清新县| 西和县| 洛阳市| 静海县| 望城县| 舟曲县| 晋江市| 宜兰县| 牟定县| 乌拉特前旗| 怀化市| 昭苏县| 河南省| 惠水县| 高雄县| 阿合奇县| 海盐县| 嘉鱼县| 略阳县| 乐陵市| 沧源| 融水|