距離敏感大小可變化的最優(yōu)范圍位置查詢的計算方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及基于位置服務(wù)(LBS)的技術(shù)領(lǐng)域以及空間數(shù)據(jù)庫領(lǐng)域,具體地說是距 離敏感大小可變化的最優(yōu)范圍位置查詢(MaximumRangeSum)的計算方法。
【背景技術(shù)】
[0002] 在現(xiàn)代社會中,基于位置的服務(wù)(LBS)越來越受到重視和應(yīng)用。LBS能夠運用在 各個領(lǐng)域和各種環(huán)境中,例如航行,旅游規(guī)劃,設(shè)施建設(shè)和運輸?shù)鹊?。這些LBS應(yīng)用都需要 存儲和處理非常大量的空間數(shù)據(jù),需要運用空間數(shù)據(jù)庫技術(shù)和算法來為每個LBS應(yīng)用提供 一個正確適當(dāng)?shù)姆绞饺ソ鉀Q。在空間數(shù)據(jù)庫中有一個重要的LBS問題,稱為MaxRS問題,最 優(yōu)范圍位置查詢(MaximizingRangeSum),給定一個固定大小的范圍,在整個數(shù)據(jù)集中找 到一個最優(yōu)的位置,使得這個范圍能夠覆蓋最多的權(quán)值點。這個問題在LBS中應(yīng)用十分廣 泛,例如為一家披薩店找地址,能外送范圍覆蓋最多居民的地方;又例如為一個服務(wù)設(shè)備找 地址,能覆蓋最多用戶的地方。但這個問題有一定局限性,例如需要固定的大小范圍,而且 無法考慮離查詢點的距離。所以要在此基礎(chǔ)上提出一個新的查詢,能夠解決不固定范圍大 小,并且可以考慮與查詢點距離的遠(yuǎn)近。這樣的查詢能夠更加適應(yīng)需求多變的LBS應(yīng)用,能 夠為MaxRS問題的應(yīng)用帶來更多的可變性和易用性。
[0003]目前國內(nèi)外諸多學(xué)者在LBS的研究中發(fā)表了許多論文和期刊,其中就有不少關(guān)注 MaxRS問題的研究。主要分為兩類,包括內(nèi)存算法,以及外存算法。其中內(nèi)存算法是指所有 數(shù)據(jù)可以全部放入內(nèi)存中進行計算,衡量算法主要依靠空間復(fù)雜度,和時間復(fù)雜度,主要比 較算法之間得出結(jié)果所需要消耗的時間。例如S. C. NANDY等人就提出用掃描線與間隔樹結(jié) 合,在O(nlogn)的時間復(fù)雜度內(nèi)解決問題。外存算法是指數(shù)據(jù)量龐大至放不下內(nèi)存,這種 算法主要衡量其10的次數(shù),因為10是整個算法的最大瓶頸。其中Dong-Wan Choi等人就 用Slab-files的方式在較好的10數(shù)下解決MaxRS問題。另外陶宇飛等人,提出一種新穎 的方法,使用網(wǎng)格劃分的方式,能夠在較快時間內(nèi)得到一個MaxRS的近似解。
[0004] 但是在現(xiàn)有MaxRS問題中,范圍始終是固定不變的,因此不夠易用、靈活。面對某 些無法固定或者無需固定范圍的場景時無法有效解決。
【發(fā)明內(nèi)容】
[0005] 針對現(xiàn)有技術(shù)的不足,本發(fā)明提出一種新型的MaxRS問題稱為距離敏感大小可變 化的MaxRS問題,即范圍大小不固定,也能考慮與查詢點的距離因素,并考慮距離變遠(yuǎn)和范 圍變大所要付出的代價,使得到的結(jié)果是最優(yōu)的結(jié)果。并且為此新問題提供一種新穎的算 法,通過量化最優(yōu)解的判定,以及對所有可能解用分治法和剪枝法進行計算,另外對算法進 行網(wǎng)格優(yōu)化,能夠較好地解決本問題。
[0006] 本發(fā)明的具體技術(shù)方案是:
[0007] -種距離敏感大小可變化的最優(yōu)范圍位置查詢的計算方法,特點是:該方法包括 以下具體步驟:
[0008] 1)為整個數(shù)據(jù)集建立一個網(wǎng)格;
[0009] 2)對每個網(wǎng)格單元映射,計算score上限;
[0010] 3)對每個網(wǎng)格單元在上限不低于當(dāng)前最優(yōu)的情況下,為網(wǎng)格內(nèi)所有的數(shù)據(jù)點構(gòu)建 橫縱線;
[0011] 4)所有橫行與縱線交叉得到一個交叉點集,并除去無用的交叉點;
[0012]5)以每個交叉點為矩形遠(yuǎn)角far-corner構(gòu)造一個最大矩形_供.,并且用范圍查詢 找到在這個矩形范圍內(nèi)的所有數(shù)據(jù)點;
[0013] 6)使每個最大矩形沉慢慢回縮,回縮的同時計算優(yōu)劣值score;
[0014] 7)計算完所有網(wǎng)格單元,輸出最優(yōu)矩形的位置及其大小;其中:
[0015] 所述步驟1)中,網(wǎng)格以查詢點為中心,并且網(wǎng)格單元大小為最大矩形91 J
[0016] 所述步驟2)中,網(wǎng)格單元的映射是指每個網(wǎng)格的相鄰且離查詢點較近的三個網(wǎng) 格要為當(dāng)前網(wǎng)格提供橫線縱線以及權(quán)值;每個網(wǎng)格單元的score上限是權(quán)值之和,再減去 最小的代價得到的理論上限;
[0017] 所述步驟4)中,除去無用的交叉點是指:在交叉點的任意一條交叉線上沒有數(shù)據(jù) 點或者數(shù)據(jù)點離交叉點的距離分別大于91長和寬,則這些交叉點是沒用的,需去除;
[0018] 所述步驟5)中,以交叉點為far-corner以沉為大小構(gòu)建一個矩形,其范圍查詢 是利用Quad-tree來進行;
[0019] 所述步驟6)中,矩形回縮時保證長寬比不變,far-corner固定,由于離查詢點距 離和矩形大小在時刻變化,score值會不同,需要保留最優(yōu)的score值及此時的矩形位置和 大小。
[0020] 與現(xiàn)有技術(shù)相比,本發(fā)明有以下優(yōu)點:
[0021] 1、易用性:該查詢比現(xiàn)有技術(shù)MaxRS問題要更加靈活易用,能夠查詢不固定大小 的范圍,以及考慮到查詢點的距離,而不受范圍固定的約束和無視查詢點的距離。所以更加 易用,適用范圍更加廣泛。
[0022] 2、正確性:算法是確定性算法,能夠找到唯一的最優(yōu)結(jié)果,而不是先前最高效的近 似解算法。
[0023] 3、高效性:經(jīng)過優(yōu)化的算法,能夠在較快的時間內(nèi)得到結(jié)果。
[0024] 4、實用性:該查詢具有廣泛的實用意義,能夠為餐館,公共設(shè)施等等找到最優(yōu)的架 設(shè)位置,以及他們的服務(wù)范圍。
【附圖說明】
[0025] 圖1為本發(fā)明查詢例子不意圖;
[0026] 圖2為本發(fā)明構(gòu)建網(wǎng)格示意圖;
[0027] 圖3為本發(fā)明網(wǎng)格單元映射示意圖;
[0028] 圖4為本發(fā)明以交叉點構(gòu)建一個最大矩形示意圖;
[0029] 圖5為本發(fā)明矩形回縮示意圖。
【具體實施方式】
[0030] 本發(fā)明所述的計算方法,針對的查詢其定義:
[0031] 在二維空間R2給定一個點的集合P,在P中每個點e浐都會有一個獨立非負(fù)的值 w(p)作為這個點的權(quán)值。然后給定一個固定比例和最大大小的矩形識,以及查詢點的位置 ^及其初始大小(初始大小限制了最小矩形大小,可以為0)。其查詢問題的目標(biāo)是找到一 個位置放置這個矩形并確定其大小,使得這個矩形能夠覆蓋到的點的權(quán)值最大并且付出的 距離代價以及大小代價最小。其"覆蓋權(quán)值"為被覆蓋的點的權(quán)值之和:
[0032] covered-weight(r) =EpEpnrw(p) ?
[0033] 假設(shè)所有P中的點權(quán)值都為1,那么"覆蓋權(quán)值"就可以簡單的定義為被r所覆蓋 的點的個數(shù)。附圖1是一個簡單的查詢例子,^是初始查詢點,^14是四個候選解的集合, 他們各自的權(quán)值分別是4, 3, 4, 4。其中ri,r2,r3都擁有相同的大小,r4的大小比他們的要 大。在這個例子中,r3是最好的查詢結(jié)果,因為它比ri要更近,比r2"覆蓋權(quán)值"更多,比r4 要更小,于是^就是最優(yōu)的查詢結(jié)果。
[0034] 為了使查詢更加簡單易懂,提出以下概念。
[0035] cost(r,rD) =adist(r