本發(fā)明涉及一種基于手機信令數(shù)據(jù)的居民出行od(交通起、終點,下同)獲取方法,用于城市居民出行研究,屬于交通大數(shù)據(jù)的分析應用技術領域。
背景技術:
交通需求分析和交通規(guī)劃制定需要獲取大范圍準確、可靠的居民出行od數(shù)據(jù)作為基礎信息。目前在交通調查中,居民出行od的獲取方法主要分為兩類:第一,傳統(tǒng)的居民出行調查往往采用路邊問卷、家庭訪查等方式,存在抽樣率低、調查成本高、數(shù)據(jù)處理周期長等問題。第二,采用感應線圈、微波檢測、視頻圖像識別等定點信息采集技術,以及gps浮動車、電子標簽等浮動信息采集技術,根據(jù)檢測到的車流信息反推居民出行od信息,準確度較差,且由于其分配算法的復雜性,難以用于較大空間范圍。因此,交通研究者與交通從業(yè)人員一直都在找尋更經濟、效率更高、精度更高的居民出行od獲取技術。
隨著移動終端的迅速普及,出行群體中手機持有率和使用率已經達到相當高的比例。手機信令數(shù)據(jù)是在手機發(fā)生信令事件時記錄在移動業(yè)務交換中心(msc)的數(shù)據(jù)字段。信令數(shù)據(jù)在手機發(fā)生位置區(qū)更新時產生,未發(fā)生位置區(qū)更新則周期性記錄,此外在開關機和發(fā)生話單業(yè)務時也會記錄。記錄的數(shù)據(jù)字段包含用戶的匿名id、時間戳、位置區(qū)編號、蜂窩小區(qū)編號以及事件類型等信息。手機信令數(shù)據(jù)所包含的時間和位置信息記錄了用戶的活動軌跡,這使得手機成為一種較為理想的交通探測器。
技術實現(xiàn)要素:
本發(fā)明的目的在于提供一種基于手機信令數(shù)據(jù)的居民出行od獲取方法。該方法的核心思想是通過分析用戶手機信令數(shù)據(jù)中的時空位置信息,識別出用戶的移動和停留行為,從而確定出行端點。
本發(fā)明解決技術問題所采取的技術方案具體是:
c1、根據(jù)交通調查要求進行手機信令數(shù)據(jù)的采集,并篩選處理成格式化數(shù)據(jù),每條數(shù)據(jù)包含經過脫敏處理的手機唯一識別號、時間戳、基站小區(qū)編號和經緯度坐標。
c2、對用戶全天的手機信令數(shù)據(jù)按時間排序得到非連續(xù)的位置點序列,設定用戶行為規(guī)則,判定位置點的運動狀態(tài),從而確定出行端點。
c3、利用gis處理建立交通分區(qū)與基站小區(qū)的對應關系,按照交通分區(qū)對所有用戶的出行端點統(tǒng)計匯總,并根據(jù)需要對結果進行適當擴樣。
步驟c1的過程包括:
c11、從運營商的移動業(yè)務交換中心抽取并保存所調查范圍內的手機信令數(shù)據(jù)。
c12、對采集的手機信令數(shù)據(jù)逐條篩選,對時間錯誤、經緯度異常的數(shù)據(jù)進行剔除,并匹配經緯度坐標,并按格式整理。
步驟c2的過程包括:
c21、追蹤用戶全天的手機信令數(shù)據(jù),提取出信令數(shù)據(jù)產生時的時空位置點序列。
c22、結合歷史運動狀態(tài)判定時刻t用戶的運動狀態(tài),分以下兩種情況:
(1)如果t-1時刻處于停留狀態(tài):
t-1時刻及之前連續(xù)時間段內為停留狀態(tài)的n個點的平均位置記作pn,計算pn的坐標
計算t時刻點pt與點pn之間的距離d1:
若d1小于給定的臨界值,則判定t時刻為停留點,并與t-1時刻在同一位置;若d1大于等于臨界值,則t時刻可能處于移動狀態(tài),這時要考慮t+1時刻的狀態(tài)。
(2)如果t-1時刻處于移動狀態(tài):
計算t時刻和t-1時刻的兩點間的距離d2:
若d2小于臨界值,則判定t和t-1時刻為停留點,并且停留在一個新的位置;若d2大于等于臨界值,則判定t-1時刻為移動點,t時刻可能處于移動狀態(tài)。
c23、計算在某一停留位置的所有停留點的平均位置為o點,下一停留位置的所有停留點的平均位置為d點,從而確定一次出行的起訖點;
步驟c3的過程包括:
c31、結合交通小區(qū)劃分地圖,通過gis匹配居民出行od所分別對應的交通小區(qū),按格式進行整理成如下格式:
c32、根據(jù)需要對各小區(qū)間出行od矩陣按比例擴樣得到總od;
其中:od為常住人口od分布;od為利用移動手機用戶數(shù)據(jù)得出的od分布;a為手機用戶的人均擁有量;p為手機滲透率;m為運營商的市場占有率;d為運營商用戶手機被檢測到概率。
本發(fā)明的有益效果:本發(fā)明提出了一種基于手機信令數(shù)據(jù)的居民出行od獲取方法。相比傳統(tǒng)的居民出行od獲取方法,本發(fā)明具有調查樣本大、實施成本低、可長期連續(xù)監(jiān)測等優(yōu)勢,可為交通需求分析和交通規(guī)劃制定中獲取大范圍準確、可靠的居民出行od數(shù)據(jù)提供技術支持。
附圖說明
圖1獲取過程流程圖;
圖2出行端點判定示意圖。
具體實施方式
本發(fā)明提出的一種基于手機信令數(shù)據(jù)的居民出行od獲取方法包括:根據(jù)調查要求采集和預處理手機信令數(shù)據(jù);位置點運動狀態(tài)判定;分區(qū)統(tǒng)計和結果擴樣。
本發(fā)明的基本步驟如下:
c1、根據(jù)交通調查要求進行手機信令數(shù)據(jù)的采集,并篩選處理成格式化數(shù)據(jù),每條數(shù)據(jù)包含經過脫敏處理的手機唯一識別號、時間戳、基站小區(qū)編號、經緯度坐標等。
c2、對用戶全天的手機信令數(shù)據(jù)按時間排序得到非連續(xù)的位置點序列,設定用戶行為規(guī)則,判定位置點的運動狀態(tài),從而確定出行端點。
c3、利用gis處理建立交通分區(qū)與基站小區(qū)的對應關系,按照交通分區(qū)對所有用戶的出行端點統(tǒng)計匯總,并根據(jù)需要對結果進行適當擴樣。
步驟c1的過程包括:
c11、從運營商的移動業(yè)務交換中心抽取并保存所調查范圍內的手機信令數(shù)據(jù)。
c12、對采集的手機信令數(shù)據(jù)逐條篩選,對時間錯誤、經緯度異常的數(shù)據(jù)進行剔除,并匹配經緯度坐標,整理成如下格式。
步驟c2的過程包括:
c21、追蹤用戶全天的手機信令數(shù)據(jù),提取出信令數(shù)據(jù)產生時的時空位置點序列。
c22、結合歷史運動狀態(tài)判定時刻t用戶的運動狀態(tài),分以下兩種情況:
(1)如果t-1時刻處于停留狀態(tài):
t-1時刻及之前連續(xù)時間段內為停留狀態(tài)的n個點的平均位置記作pn,計算pn的坐標
計算t時刻點pt與點pn之間的距離d1:
若d1小于給定的臨界值,則判定t時刻為停留點,并與t-1時刻在同一位置;若d1大于等于臨界值,則t時刻可能處于移動狀態(tài),這時要考慮t+1時刻的狀態(tài)。
(2)如果t-1時刻處于移動狀態(tài):
計算t時刻和t-1時刻的兩點間的距離d2:
若d2小于臨界值,則判定t和t-1時刻為停留點,并且停留在一個新的位置;若d2大于等于臨界值,則判定t-1時刻為移動點,t時刻可能處于移動狀態(tài)。
c23、計算在某一停留位置的所有停留點的平均位置為o點(起點,下同),下一停留位置的所有停留點的平均位置為d點(終點,下同),從而確定一次出行的起訖點。
步驟c3的過程包括:
c31、結合交通小區(qū)劃分地圖,通過gis匹配居民出行od所分別對應的交通小區(qū),整理成如下格式:
c32、根據(jù)需要對各小區(qū)間出行od矩陣按比例擴樣得到總od。
其中:od為常住人口od分布;od為利用移動手機用戶數(shù)據(jù)得出的od分布;a為手機用戶的人均擁有量,單位:部/人;p為手機滲透率;m為運營商的市場占有率;d為運營商用戶手機被檢測到概率。
實施例:以某城市為例,應用本方法獲取某日居民出行od。
步驟c1:
(1)從運營商處的移動業(yè)務交換中心抽取并保存該城市所調查范圍內3時至次日3時的手機信令數(shù)據(jù);
(2)對采集的手機信令數(shù)據(jù)逐條篩選,對時間錯誤、經緯度異常、不能有效追蹤imsi號的數(shù)據(jù)進行剔除,并整理成如下格式:
步驟c2:
(1)以某imsi編號的手機信令數(shù)據(jù)為例,提取出信令數(shù)據(jù)產生時的時空位置點序列;
(2)以第一個位置點為停留點,計算第二個位置點與之前3個停留點(可少于)平均位置之間的距離d=0,小于臨界值,亦為停留點;
計算第三個位置點與之前3個停留點(可少于)平均位置之間的距離d=0,小于臨界值,仍為停留點;
直至第10個位置點與之前3個停留點平均位置之間的距離d=279m大于臨界值200m,可能處于移動狀態(tài)。
第11個位置點與之前一個可能移動點之間的距離d=230m大于臨界值200m,則此點可能處于移動狀態(tài),且第10個位置點為移動點。
直至第13個位置點與前一個可能移動點之間的距離d=124m小于臨界值200m,則此兩點均為停留點,且停留在一個新的位置。
如此依次判別該imsi編號所有位置點的運動狀態(tài);
(3)計算各停留位置的所有停留點的平均位置為出行端點,連續(xù)兩個出行端點構成一個od對。
步驟c3:
(1)結合交通小區(qū)劃分地圖,通過gis匹配居民出行od所分別對應的交通小區(qū)。
(2)根據(jù)需要可統(tǒng)計各個小區(qū)間出行od總量,并按抽樣比擴樣得到總出行量。