欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于簽到數(shù)據(jù)的時空軌跡相似性度量方法及系統(tǒng)的制作方法_2

文檔序號:9489510閱讀:來源:國知局
圖3為本發(fā)明的基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng)的流程圖。
【具體實施方式】
[0020] 下面給出本發(fā)明的【具體實施方式】,結(jié)合附圖對本發(fā)明進行詳細說明。
[0021] 本發(fā)明提供一種基于簽到數(shù)據(jù)的時空軌跡相似性度量方法及系統(tǒng),這部分提供算 法的詳細說明,說明過程以兩個用戶的時空軌跡間的相似性度量為例,本方法可以推廣到 計算多個用戶的時空軌跡間的兩兩相似性度量。
[0022] 如圖2所示,本發(fā)明公開一種基于簽到數(shù)據(jù)的時空軌跡相似性度量方法,包括: 步驟1 :獲取用戶簽到數(shù)據(jù),包括用戶ID、簽到位置和簽到時間等; 新浪微博、街旁、人人、Foursquare、Gowalla等基于地理位置的移動社交網(wǎng)絡近年來發(fā) 展迅猛,大量用戶通過智能手機以簽到的方式記錄時空行為軌跡,因此,可以通過它們提供 的API,抓取到需要的用戶簽到數(shù)據(jù)。
[0023] 步驟2 :對用戶簽到數(shù)據(jù)進行預處理,包括無用數(shù)據(jù)過濾、類型轉(zhuǎn)換和格式統(tǒng)一; 分析表明,對位置數(shù)據(jù)中的無效用戶(即注冊后很少簽到的用戶,例如簽到次數(shù)少于5 次的用戶)進行挖掘是沒有意義的,因此,需要移除無意義點,減少數(shù)據(jù)量。同時,還要對簽 到數(shù)據(jù)進行預處理,將簽到位置的經(jīng)煒度坐標轉(zhuǎn)換為平面直角坐標以及進行格式統(tǒng)一等。
[0024] 步驟3 :用戶興趣區(qū)域的計算; 如圖1所示,用戶通過手機在社交網(wǎng)站上簽到的每一個地理位置稱作一個興趣點(PointofInterest,Ρ0Ι),把用戶簽到時間劃分成T個時間段,利用OPTICS聚類算法對 每個時間段的用戶簽到興趣點Ρ0Ι進行基于密度的分層聚類,將用戶經(jīng)常訪問的興趣點 Ρ0Ι進行分層聚集,從而得到不同時間段、不同空間劃分尺度下的用戶興趣區(qū)域(Regionof Interest,R0I),避免了單一空間劃分尺度對聚類結(jié)果的影響。同時,可以將用戶偶爾訪問 的或只有少數(shù)用戶訪問的興趣點作為噪聲過濾掉。
[0025] 步驟4 :相似興趣區(qū)域的計算; 在每一層,計算用戶在每個時間段的每個興趣區(qū)域的簽到次數(shù)與其在該時間段簽到總 次數(shù)的比值,如果兩個用戶在某個興趣區(qū)域上的比值的差值的絕對值小于設定的閾值,則 這兩個用戶在該興趣區(qū)域上相似。
[0026] 步驟5 :單層相似度的計算; 兩個用戶的時空軌跡在h層、全都時間段上的相似度定義 heH,teT,Η為OPTICS聚類的層數(shù),CM為兩個用戶在h層、t時間段的興趣區(qū)域的個 數(shù),M為兩個用戶在h層、t時間段相似興趣區(qū)域的個數(shù),α,為各個時間段的權值,
可以根據(jù)具體應用,設定各個時間段的權值。例如,在應用于交通信息服務時, 可以將早、晚高峰時段的權值加大,其余時間段的權值降低。
[0027] 步驟6 :跨層相似度的計算; 兩個用戶的時空軌跡間的跨層相似度定義
其中為各層的權
,層數(shù)越高,空間劃分尺度越小,權值越大,如果跨層相似度大于設定的閾值, 則兩個用戶的時空行為軌跡相似。
[0028] 如圖3所示,本發(fā)明還公開一種基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng),包括: 獲取用戶簽到數(shù)據(jù)模塊:用于獲取用戶簽到數(shù)據(jù),包括用戶ID、簽到位置和簽到時間 等; 預處理模塊:用于對用戶簽到數(shù)據(jù)進行預處理,包括無用數(shù)據(jù)過濾、類型轉(zhuǎn)換和格式統(tǒng) , 用戶興趣區(qū)域計算模塊:用于用戶興趣區(qū)域的計算; 相似興趣區(qū)域計算模塊:用于用戶相似興趣區(qū)域的計算; 單層相似度計算模塊:用于用戶單層相似度的計算; 跨層相似度計算模塊:用戶跨層相似度的計算。
[0029] 所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng),所述用戶興趣區(qū)域計算模塊還 包括: 把用戶簽到時間劃分成T個時間段,采用OPTICS對用戶簽到興趣點進行基于密度的分 層聚類,得到不同時間段、不同空間劃分尺度下的用戶興趣區(qū)域。
[0030] 所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng),所述相似興趣區(qū)域計算模塊還 包括: 在每一層,計算用戶在每個時間段的每個興趣區(qū)域的簽到次數(shù)與其在該時間段簽到總 次數(shù)的比值,如果兩個用戶在某個興趣區(qū)域上的比值的差值的絕對值小于設定的閾值,則 這兩個用戶在該興趣區(qū)域上相似。
[0031] 所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng),所述單層相似度計算模塊還包 括:
兩個用戶的時空軌跡在h層、全都時間段上的相似度定義 heH,teT,Η為OPTICS聚類的層數(shù),CM為兩個用戶在h層、t時間段的興趣區(qū)域的個 數(shù),M為兩個用戶在h層、t時間段相似興趣區(qū)域的個數(shù),α,為各個時間段的權值,
可以根據(jù)具體應用,設定各個時間段的權值。
[0032] 所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng),所述跨層相似度計算模塊還包 括: 兩個用戶的時空軌跡間的跨層相似度定義 ,其中為各層的權
層數(shù)越高,空間劃分尺度越小,權值越大,如果跨層相似度大于設定的閾值, 則兩個用戶的時空行為軌跡相似。
[0033] 本領域的技術人員在不脫離權利要求書確定的本發(fā)明的精神和范圍的條件下,還 可以對以上內(nèi)容進行各種各樣的修改。因此,本發(fā)明的范圍并不僅限于以上的說明,而是由 權利要求書的范圍來確定的。
【主權項】
1. 一種基于簽到數(shù)據(jù)的時空軌跡相似性度量方法,其特征在于,包括: 步驟1 :獲取簽到數(shù)據(jù),包括用戶ID、簽到位置和簽到時間等; 步驟2 :對簽到數(shù)據(jù)進行預處理,包括無用數(shù)據(jù)過濾、類型轉(zhuǎn)換和格式統(tǒng)一; 步驟3:用戶興趣區(qū)域的計算; 步驟4 :相似興趣區(qū)域的計算; 步驟5 :單層相似度的計算; 步驟6:跨層相似度的計算。2. 根據(jù)權利要求1所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量方法,其特征在于,所 述步驟3還包括: 步驟21 :把簽到時間劃分成T個時間段,采用OPTICS對簽到興趣點進行基于密度的分 層聚類,得到不同時間段、不同空間劃分尺度下的用戶興趣區(qū)域。3. 根據(jù)權利要求1所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量方法,其特征在于,所 述步驟4還包括: 步驟31 :在每一層,計算用戶在每個時間段的每個興趣區(qū)域的簽到次數(shù)與其在該時間 段簽到總次數(shù)的比值,如果兩個用戶在某個興趣區(qū)域上的比值的差值的絕對值小于設定的 闊值,則運兩個用戶在該興趣區(qū)域上相似。4. 根據(jù)權利要求1所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量方法,其特征在于,所 述步驟5還包括: 步驟41 :兩個用戶的時空軌跡在h層、全都時間段上的相似度定義為,heH,teT,Η為OPTICS聚類的層數(shù),Ch,t為兩個用戶在h層、t時間 段的興趣區(qū)域的個數(shù),C^h,t為兩個用戶在h層、t時間段相似興趣區(qū)域的個數(shù),α1為各 個時間段的權值,可W根據(jù)具體應用,設定各個時間段的權值。5. 根據(jù)權利要求1所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量方法,其特征在于,所 述步驟6還包括: 步驟51 :兩個用戶的時空軌跡間的跨層相似度定義為其中Ph為各 層的權值,層數(shù)越高,空間劃分尺度越小,權值越大,如果跨層相似度大于設定 的闊值,則兩個用戶的時空行為軌跡相似。6. -種基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng),其特征在于,包括: 獲取用戶簽到數(shù)據(jù)模塊:用于獲取用戶簽到數(shù)據(jù),包括用戶ID、簽到位置和簽到時間 等; 預處理模塊:用于對用戶簽到數(shù)據(jù)進行預處理,包括無用數(shù)據(jù)過濾、類型轉(zhuǎn)換和格式統(tǒng) * 用戶興趣區(qū)域計算模塊:用于用戶興趣區(qū)域的計算; 相似興趣區(qū)域計算模塊:用于用戶相似興趣區(qū)域的計算; 單層相似度計算模塊:用于用戶單層相似度的計算; 跨層相似度計算模塊:用戶跨層相似度的計算。7. 根據(jù)權利要求6所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng),其特征在于,所 述用戶興趣區(qū)域計算模塊還包括: 把用戶簽到時間劃分成T個時間段,采用OPTICS對用戶簽到興趣點進行基于密度的分 層聚類,得到不同時間段、不同空間劃分尺度下的用戶興趣區(qū)域。8. 根據(jù)權利要求6所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng),其特征在于,所 述相似興趣區(qū)域計算模塊還包括: 在每一層,計算用戶在每個時間段的每個興趣區(qū)域的簽到次數(shù)與其在該時間段簽到總 次數(shù)的比值,如果兩個用戶在某個興趣區(qū)域上的比值的差值的絕對值小于設定的闊值,貝U 運兩個用戶在該興趣區(qū)域上相似。9. 根據(jù)權利要求6所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng),其特征在于,所 述單層相似度計算模塊還包括: 兩個用戶的時空軌跡在h層、全都時間段上的相似度定義3,heΗ, teΤ,Η為OPTICS聚類的層數(shù),Ch,t為兩個用戶在h層、t時間段的興趣區(qū)域的個數(shù),C' Μ為兩個用戶在h層、t時間段相似興趣區(qū)域的個數(shù),αt為各個時間段的權值,,可W根據(jù)具體應用,設定各個時間段的權值。10. 根據(jù)權利要求6所述的基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng),其特征在于,所 述跨層相似度計算模塊還包括: 兩個用戶的時空軌跡間的跨層相似度定義為,其中Ph為各層的權 值層數(shù)越高,空間劃分尺度越小,權值越大,如果跨層相似度大于設定的闊值, 則兩個用戶的時空行為軌跡相似。
【專利摘要】本發(fā)明公開一種基于簽到數(shù)據(jù)的時空軌跡相似性度量方法,所述方法包括:獲取簽到數(shù)據(jù),包括用戶ID、簽到位置和簽到時間等;對簽到數(shù)據(jù)進行預處理,包括無用數(shù)據(jù)過濾、類型轉(zhuǎn)換和格式統(tǒng)一;用戶興趣區(qū)域的計算;相似興趣區(qū)域的計算;單層相似度的計算;跨層相似度的計算等步驟。本發(fā)明還公開一種基于簽到數(shù)據(jù)的時空軌跡相似性度量系統(tǒng),包括:獲取用戶簽到數(shù)據(jù)模塊;預處理模塊;用戶興趣區(qū)域計算模塊;相似興趣區(qū)域計算模塊;單層相似度計算模塊;跨層相似度計算等模塊。
【IPC分類】G06Q30/02, G06F17/30
【公開號】CN105243148
【申請?zhí)枴緾N201510694102
【發(fā)明人】劉興偉, 夏梅宸, 牟峰, 周永, 曾晟珂, 張曉麗
【申請人】西華大學
【公開日】2016年1月13日
【申請日】2015年10月25日
當前第2頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
堆龙德庆县| 五常市| 武汉市| 东安县| 枣强县| 孟州市| 盐池县| 梧州市| 乌审旗| 天门市| 新竹县| 交口县| 邹平县| 井陉县| 广德县| 兴山县| 略阳县| 泊头市| 肥乡县| 虹口区| 太原市| 广州市| 通化市| 汉源县| 天全县| 大同市| 垦利县| SHOW| 平江县| 大同市| 鹿泉市| 介休市| 阿鲁科尔沁旗| 疏勒县| 吉林省| 肃南| 潜山县| 民丰县| 潮州市| 紫阳县| 科技|