欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

確定地理范圍內(nèi)興趣區(qū)域、興趣點(diǎn)的方法和裝置與流程

文檔序號:11918522閱讀:609來源:國知局
確定地理范圍內(nèi)興趣區(qū)域、興趣點(diǎn)的方法和裝置與流程

本發(fā)明涉及電子地圖的數(shù)據(jù)處理領(lǐng)域,具體涉及確定地理范圍內(nèi)興趣區(qū)域、興趣點(diǎn)的方法和裝置。



背景技術(shù):

電子地圖數(shù)據(jù)中通常會標(biāo)出地理范圍,用戶可以根據(jù)電子地圖識別出諸如省、市、區(qū)縣等地理范圍,但是現(xiàn)有的地理范圍較大,地理范圍內(nèi)通常還包括多個更具體的區(qū)域,例如對于北京市西城區(qū)而言,西城區(qū)的范圍可以根據(jù)地圖數(shù)據(jù)進(jìn)行識別,但西城區(qū)中還包括諸如西單地區(qū)等更具體的區(qū)域,用戶無法確定此類區(qū)域的范圍。

目前興趣區(qū)域劃分方法是以地圖數(shù)據(jù)中的某一個對象(例如一條道路、一個信息點(diǎn))為基礎(chǔ),向該對象周邊擴(kuò)散一定的距離作為興趣區(qū)域,或者按照預(yù)設(shè)范圍(例如預(yù)設(shè)網(wǎng)格)將地圖劃分為多個區(qū)域,每一個預(yù)設(shè)區(qū)域均可以是興趣區(qū)域,上述兩種方式適合應(yīng)用于信息點(diǎn)較少的地區(qū)或者偏遠(yuǎn)地區(qū),對于城市等信息點(diǎn)較多、排布情況復(fù)雜的地區(qū),現(xiàn)有的興趣區(qū)域劃分方法準(zhǔn)確性較差。

并且,上述信息點(diǎn)篩選方法缺乏區(qū)域性分析,通常是在地理范圍內(nèi),直接根據(jù)信息點(diǎn)的熱度進(jìn)行篩選,這會使得在非熱門區(qū)域的信息點(diǎn)缺失, 篩選效率較低。



技術(shù)實(shí)現(xiàn)要素:

鑒于此,本發(fā)明提供一種確定地理范圍內(nèi)興趣區(qū)域的方法,該方法包括:獲取地理范圍內(nèi)的信息點(diǎn);從上述信息點(diǎn)中選取包含同一關(guān)鍵詞且數(shù)量大于第一預(yù)設(shè)閾值的多個信息點(diǎn);對所述多個信息點(diǎn)間的距離計(jì)算,確定出一個位于中心位置的信息點(diǎn),記為a,并通過所述距離計(jì)算的結(jié)果確定與該信息點(diǎn)a間的距離值最大的信息點(diǎn)b;對信息點(diǎn)a和信息點(diǎn)b間的距離值進(jìn)行分段,篩選出每個段內(nèi)數(shù)量大于第二預(yù)設(shè)閾值的信息點(diǎn)c;計(jì)算上述篩選出的各信息點(diǎn)c周圍包含所述同一關(guān)鍵詞的信息點(diǎn)的數(shù)量,并保留數(shù)量大于等于第三預(yù)設(shè)閾值的信息點(diǎn)c;根據(jù)上述保留的數(shù)量大于等于第三預(yù)設(shè)閾值的信息點(diǎn)c確定興趣區(qū)域。

相應(yīng)地,本發(fā)明提供一種確定地理范圍內(nèi)興趣區(qū)域的裝置,包括:獲取單元,用于獲取地理范圍內(nèi)的信息點(diǎn);選取單元,用于從上述信息點(diǎn)中選取包含同一關(guān)鍵詞且數(shù)量大于第一預(yù)設(shè)閾值的多個信息點(diǎn);信息點(diǎn)確定單元,用于對所述多個信息點(diǎn)間的距離計(jì)算,確定出一個位于中心位置的信息點(diǎn),記為a,并通過所述距離計(jì)算的結(jié)果確定與該信息點(diǎn)a間的距離值最大的信息點(diǎn)b;第一篩選單元,用于對信息點(diǎn)a和信息點(diǎn)b間的距離值進(jìn)行分段,篩選出每個段內(nèi)數(shù)量大于第二預(yù)設(shè)閾值的信息點(diǎn)c;第二篩選單元,用于計(jì)算上述篩選出的各信息點(diǎn)c周圍包含所述同一關(guān)鍵詞的信息點(diǎn)的數(shù)量,并保留數(shù)量大于等于第三預(yù)設(shè)閾值的信息點(diǎn)c;區(qū)域確定單元,用于根據(jù)上述保留的數(shù)量大于等于第三預(yù)設(shè)閾值的信息點(diǎn)c確定興趣區(qū)域。

另外,本發(fā)明提供一種興趣點(diǎn)篩選方法,該方法包括:利用上述確定地理范圍內(nèi)興趣區(qū)域的方法確定出興趣區(qū)域;在所述興趣區(qū)域內(nèi)根據(jù)信息點(diǎn)所包含的信息篩選出至少一個信息點(diǎn),該篩選出的至少一個信息點(diǎn)為興趣點(diǎn)。

相應(yīng)地,本發(fā)明還提供一種興趣點(diǎn)篩選裝置,包括:興趣區(qū)域確定單元,用于利用上述確定地理范圍內(nèi)興趣區(qū)域的方法確定出興趣區(qū)域;篩選單元,用于在所述興趣區(qū)域內(nèi)根據(jù)信息點(diǎn)所包含的信息篩選出至少一個信息點(diǎn),該篩選出的至少一個信息點(diǎn)為興趣點(diǎn)。

本發(fā)明實(shí)施例提供的確定地理范圍內(nèi)興趣區(qū)域、興趣點(diǎn)的方法和裝置可以將地圖數(shù)據(jù)劃分為多個感興趣區(qū)域,然后在興趣區(qū)域中篩選出特征相對明顯、知名度相對較高的信息點(diǎn),該信息點(diǎn)可以作為興趣區(qū)域內(nèi)的地標(biāo)性建筑,篩選出的信息點(diǎn)可以應(yīng)用于多種場景,例如可以在某些服務(wù)類應(yīng)用程序中作為標(biāo)準(zhǔn)信息點(diǎn),或者在地圖數(shù)據(jù)中進(jìn)行突出顯示,使用戶可以更方便的查找信息點(diǎn)。

附圖說明

為了更清楚地說明本發(fā)明具體實(shí)施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對具體實(shí)施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實(shí)施方式,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。

圖1是根據(jù)本發(fā)明實(shí)施例提供的確定地理范圍內(nèi)興趣區(qū)域的方法的流程圖;

圖2是選取的多個信息點(diǎn)的排布情況示意圖;

圖3是對圖2所示信息點(diǎn)進(jìn)行處理的示意圖;

圖4是對圖3所示處理結(jié)果進(jìn)行進(jìn)一步處理的示意圖;

圖5是對圖4所示信息點(diǎn)進(jìn)行處理后確定的興趣區(qū)域示意圖;

圖6是根據(jù)本發(fā)明實(shí)施例提供的興趣點(diǎn)篩選方法的流程圖;

圖7是根據(jù)本發(fā)明實(shí)施例提供的確定地理范圍內(nèi)興趣區(qū)域的裝置的結(jié)構(gòu)圖;

圖8是根據(jù)本發(fā)明實(shí)施例提供的興趣點(diǎn)篩選裝置的結(jié)構(gòu)圖。

具體實(shí)施方式

下面將結(jié)合附圖對本發(fā)明的技術(shù)方案進(jìn)行清楚、完整地描述,顯然,所描述的實(shí)施例是本發(fā)明一部分實(shí)施例,而不是全部的實(shí)施例?;诒景l(fā)明中的實(shí)施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實(shí)施例,都屬于本發(fā)明保護(hù)的范圍。

為了描述上的簡潔和直觀,下文通過描述若干代表性的實(shí)施例來對本發(fā)明的方案進(jìn)行闡述。實(shí)施例中大量的細(xì)節(jié)僅用于幫助理解本發(fā)明的方案。但是很明顯,本發(fā)明的技術(shù)方案實(shí)現(xiàn)時(shí)可以不局限于這些細(xì)節(jié)。為了避免不必要地模糊了本發(fā)明的方案,一些實(shí)施方式?jīng)]有進(jìn)行細(xì)致地描述,而是僅給出了框架。下文中,“包括”是指“包括但不限于”,“根據(jù)……”是指“至少根據(jù)……,但不限于僅根據(jù)……”。下文中沒有特別指出一個成分的數(shù)量時(shí),意味著該成分可以是一個也可以是多個,或可理解為至少 一個。

本發(fā)明實(shí)施例中的確定地理范圍內(nèi)興趣區(qū)域的方法、信息點(diǎn)篩選方法和裝置可以由一個能夠?qū)崿F(xiàn)本發(fā)明實(shí)施例的各種方法和軟件系統(tǒng)的計(jì)算設(shè)備實(shí)現(xiàn)。該計(jì)算設(shè)備可以是能夠?qū)崿F(xiàn)本發(fā)明實(shí)施例提供的方法和軟件系統(tǒng)的計(jì)算設(shè)備。該計(jì)算設(shè)備可以是個人電腦或便攜設(shè)備,例如筆記本電腦、平板電腦、手機(jī)或智能手機(jī)等。該計(jì)算設(shè)備還可以是與上述設(shè)備通過網(wǎng)絡(luò)相連的服務(wù)器。

所述計(jì)算設(shè)備可以具有不同的性能和特征。各種可能的實(shí)現(xiàn)方式都在本文的保護(hù)范圍內(nèi)。例如,計(jì)算設(shè)備可以包括按鍵區(qū)/鍵盤,還可以包括一個顯示器,如液晶顯示器(LCRD),或者具有高級功能的顯示器,例如觸摸感應(yīng)2RD或3RD顯示器。一個例子中,一個具有web功能的計(jì)算設(shè)備可以包括一個或多個物理鍵盤或虛擬鍵盤,以及大容量存儲裝置。

計(jì)算設(shè)備也可以包括或允許各種操作系統(tǒng)、包括或運(yùn)行各種應(yīng)用程序,例如編碼/解碼應(yīng)用。應(yīng)用程序能夠通過網(wǎng)絡(luò)與其它設(shè)備進(jìn)行加密通信。

此外,計(jì)算設(shè)備還可以包括一個或多個處理器可讀的非易失性存儲介質(zhì)和一個或多個與存儲介質(zhì)通信的處理器。例如,處理器可讀的非易失性存儲介質(zhì)可以是RAM、閃存、ROM、EPROM、EEPROM、寄存器、硬盤、移動硬盤、CRD-ROM,或其它各種形式的非易失性存儲介質(zhì)。存儲介質(zhì)可以存儲一系列指令或包含指令的單元和/或模塊,用于完成本發(fā)明各種實(shí)施例的操作。處理器可以執(zhí)行上述指令,完成各種實(shí)施例中的操作。

本發(fā)明實(shí)施例提供一種確定地理范圍內(nèi)興趣區(qū)域的方法,如圖1所示,該方法包括如下步驟:

S1,獲取地理范圍內(nèi)的信息點(diǎn)。地理范圍可以是行政區(qū)劃,例如北京市朝陽區(qū)、海淀區(qū),也可以是州、鎮(zhèn)等已知邊界的區(qū)域。信息點(diǎn)數(shù)據(jù)為現(xiàn)有的且對外開放的數(shù)據(jù),每一條信息點(diǎn)數(shù)據(jù)至少包括名稱、類別、經(jīng)度緯度、附近的其他信息點(diǎn)等信息(引用信息),某些信息點(diǎn)還具有富信息,例如對于酒店信息點(diǎn),其中包括酒店的等級信息(例如0-5星級),又如對于住宅區(qū)信息點(diǎn),其包括住戶數(shù)量、房產(chǎn)價(jià)格等信息。

S2,從上述信息點(diǎn)中選取包含同一關(guān)鍵詞且數(shù)量大于第一預(yù)設(shè)閾值的多個信息點(diǎn)。具體可以利用詞匯識別技術(shù),分別從信息點(diǎn)的名稱、地址中識別出關(guān)鍵詞,然后確定哪些信息點(diǎn)包含同一關(guān)鍵詞。關(guān)鍵詞可以是不存在具體邊界的地域的名稱,例如北京市西城區(qū)內(nèi)的“西單”、東城區(qū)內(nèi)的“東單”等。針對某一個地理范圍通常會篩選出多組信息點(diǎn),每一組信息點(diǎn)均包括同一關(guān)鍵詞,但是某些組內(nèi)的信息點(diǎn)數(shù)量可能較少,此情況表示該組信息點(diǎn)包括的關(guān)鍵詞的認(rèn)知度不夠高,因此應(yīng)當(dāng)選取數(shù)量較多的信息點(diǎn)進(jìn)行后續(xù)處理。以地理范圍-北京市“西城區(qū)”為例,假設(shè)包含關(guān)鍵詞“西單”的信息點(diǎn)數(shù)量大于預(yù)設(shè)閾值,根據(jù)包含關(guān)鍵詞“西單”的信息點(diǎn)的在地圖中的排布情況可知某些信息點(diǎn)相對集中,某些信息點(diǎn)可能相對分散。假設(shè)經(jīng)過步驟S2的處理后,選取了如圖2所示的多個信息點(diǎn),直觀地根據(jù)圖2中的信息點(diǎn)排布情況可以發(fā)現(xiàn),信息點(diǎn)P1和信息點(diǎn)P2是比較分散的信息點(diǎn)。

排布分散的信息點(diǎn)將會影響最終的區(qū)域劃分結(jié)果,因此需要從上述多個信息點(diǎn)中找出并去除位置分散的信息點(diǎn)。本領(lǐng)域技術(shù)人員可以理解,確定多個點(diǎn)相互之間是否集中或分散的方法有多種,例如可以根據(jù)每兩個點(diǎn) 之間的距離,去除掉距離值較大的點(diǎn)。下面結(jié)合圖3和圖4詳細(xì)介紹去除分散信息點(diǎn)的過程。

S3,對所述多個信息點(diǎn)間的距離計(jì)算,確定出一個位于中心位置的信息點(diǎn),記為a,并通過所述距離計(jì)算的結(jié)果確定與該信息點(diǎn)a間的距離值最大的信息點(diǎn)b,信息點(diǎn)a即為所有信息點(diǎn)的中位點(diǎn)。本領(lǐng)域技術(shù)人員可以理解,在位置固定的多個點(diǎn)中尋找中位點(diǎn)的方法有多種,通過計(jì)算各點(diǎn)之間的距離值即可找出中位點(diǎn)。對于圖3所示情況而言,信息點(diǎn)P0即位于中心位置的信息點(diǎn),將其記為a;信息點(diǎn)P1距離信息點(diǎn)P0最遠(yuǎn),因此信息點(diǎn)P1與該信息點(diǎn)a間的距離值最大的信息點(diǎn),將其記為b。,

S4,對信息點(diǎn)a和信息點(diǎn)b間的距離值進(jìn)行分段,篩選出每個段內(nèi)數(shù)量大于第二預(yù)設(shè)閾值的信息點(diǎn)c。如圖3所示,本實(shí)施例將信息點(diǎn)a和信息點(diǎn)b的距離值Rmax分為5段,分段后即確定了5個距離值區(qū)間,然后則計(jì)算每個區(qū)間內(nèi)的信息點(diǎn)數(shù)量并進(jìn)行判斷,如果數(shù)量大于第二預(yù)設(shè)值則保留,否則去除。假設(shè)第二預(yù)設(shè)閾值為2,則可以判斷出信息點(diǎn)b所在的區(qū)間中只有其1個信息點(diǎn),其他區(qū)間中的信息點(diǎn)數(shù)量均大于或等于2,由此確定信息點(diǎn)b被去除,即去除圖3中的P1,其他信息點(diǎn)P0、P2、P3、P4、P5、P6、P7、P8、P9、P10暫時(shí)保留,將保留的信息點(diǎn)記為c。

S5,計(jì)算上述篩選出的各信息點(diǎn)c周圍包含所述同一關(guān)鍵詞的信息點(diǎn)的數(shù)量,如果數(shù)量較少,則表示該信息點(diǎn)周圍同樣包含該關(guān)鍵詞的信息點(diǎn)較少,該信息點(diǎn)排布比較分散,反之則表示該信息點(diǎn)排布集中,由此,可以并保留數(shù)量大于等于第三預(yù)設(shè)閾值的信息點(diǎn)c。上述“周圍”是一個范圍值,例如可以是半徑,實(shí)際使用時(shí)可以設(shè)定一個范圍值,然后在該范圍內(nèi) 判斷包含上述關(guān)鍵詞的數(shù)量。如圖4所示,假設(shè)范圍值取N*Rd、第三預(yù)設(shè)閾值取值為1,則只有信息點(diǎn)P2周圍的信息點(diǎn)數(shù)量為0,所以進(jìn)一步去除信息點(diǎn)P2,保留其他符合條件的信息點(diǎn)P0、P3、P4、P5、P6、P7、P8、P9、P10。

S6,根據(jù)上述保留的數(shù)量大于等于第三預(yù)設(shè)閾值的信息點(diǎn)c確定興趣區(qū)域。通過上述步驟S2-S5,信息點(diǎn)P1和信息點(diǎn)P2已被去除,然后例如可以根據(jù)凸包算法利用保留的信息點(diǎn)P0、P3、P4、P5、P6、P7、P8、P9、P10構(gòu)造最小外接凸邊行區(qū)域,圖5示出了根據(jù)本方法確定的興趣區(qū)域,該興趣區(qū)域中有排布密集的多個信息點(diǎn)。

根據(jù)本發(fā)明實(shí)施例提供的確定地理范圍內(nèi)興趣區(qū)域的方法,通過獲取地理范圍內(nèi)所有信息點(diǎn)并篩選出包含同一關(guān)鍵詞的多個信息點(diǎn),可以確定出含有相同關(guān)鍵詞的多個信息點(diǎn),然后對數(shù)量是否大于預(yù)設(shè)閾值的信息點(diǎn)進(jìn)行處理,去除其中位置分散的信息點(diǎn),最終根據(jù)保留的多個信息點(diǎn)確定興趣區(qū)域,可以在地理范圍中進(jìn)一步確定出更具體的興趣區(qū)域,興趣區(qū)域內(nèi)均為包括同一關(guān)鍵詞的信息點(diǎn),由此可以提高地興趣區(qū)域范圍的準(zhǔn)確性。

作為一種優(yōu)選實(shí)施方式,上述步驟S3可以包括如下子步驟:

S31,分別計(jì)算每個信息點(diǎn)與除自身之外的所有信息點(diǎn)的距離之和(優(yōu)選為直線距離,但也可以是地圖中的路線距離,下文均以直線距離為例),并確定距離之和最小的信息點(diǎn)a。

S32,分別計(jì)算除信息點(diǎn)a外的信息點(diǎn)與信息點(diǎn)a的距離,并確定具有最大距離值的信息點(diǎn)b;如圖3所示,最大距離為Rmax(信息點(diǎn)P0與信息點(diǎn)P1之間的距離)。

上述優(yōu)選方案通過計(jì)算每個信息點(diǎn)與除自身之外的所有信息點(diǎn)的距離之和,可以更準(zhǔn)確地在多個信息點(diǎn)中找到中位點(diǎn),并找到距離中位點(diǎn)最遠(yuǎn)的信息點(diǎn)。

作為一種優(yōu)選實(shí)施方式,上述步驟S4可以包括如下子步驟:

S41,對最大距離Rmax進(jìn)行分段,優(yōu)選采用等分的方法,確定分段數(shù)量N,將Rmax分為N段,Ri=i/N Rmax,本領(lǐng)域技術(shù)人員可以理解,采用其他的分段方法,例如黃金分割都是可行的。

S42,分別計(jì)算每一段內(nèi)的信息點(diǎn)的數(shù)量,即計(jì)算距離在[0,R1]之間的信息點(diǎn)的數(shù)量x1、[R1,R2]之間的信息點(diǎn)的數(shù)量x2、[R2,R3]之間的信息點(diǎn)的數(shù)量x3,直至計(jì)算出[Rn,Rmax]之間的信息點(diǎn)的數(shù)量xn,上述各個區(qū)間可以表示為[Rmax/N*(n-1),Rmax/N*(n)],其中n為正整數(shù),取值范圍是[1,n]且n≤N,N為大于1的正整數(shù),例如上述N取值為5,即可得到[0,Rmax/5]的信息點(diǎn)的數(shù)量X1、[Rmax/5,Rmax/5*2]的信息點(diǎn)的數(shù)量X2、[Rmax/5*2,Rmax/5*3]的信息點(diǎn)的數(shù)量X2、[Rmax/5*3,Rmax/5*4]的信息點(diǎn)的數(shù)量X3、[Rmax/5*4,Rmax]的信息點(diǎn)的數(shù)量X4;

S43,篩選出數(shù)量大于第二預(yù)設(shè)閾值的段內(nèi)的信息點(diǎn)。例如分別判斷X1-X4是否大于預(yù)設(shè)閾值,假設(shè)第二預(yù)設(shè)閾值取值為2,則根據(jù)判定結(jié)果可以確定信息點(diǎn)P1被去除,其他信息點(diǎn)均被保留,即保留距離為[0,Rmax/5*4]之間的信息點(diǎn),去除距離為[Rmax/5*4,Rmax]的信息點(diǎn)。

上述優(yōu)選方案對最大距離值進(jìn)行分段,并依次判斷每一分段內(nèi)的信息點(diǎn)的數(shù)量,而保留數(shù)量大于預(yù)設(shè)閾值的信息點(diǎn),由此可以去除掉分布相對分散的信息點(diǎn)。

作為一種優(yōu)選實(shí)施方式,上述步驟S5可以包括如下子步驟:

S51,計(jì)算篩選出的信息點(diǎn)之間的平均距離Rd;

S52,分別計(jì)算篩選出的信息點(diǎn)周圍N*Rd范圍內(nèi)包含所述同一關(guān)鍵詞的信息點(diǎn)的數(shù)量,如果個數(shù)較少,則表示該信息點(diǎn)周圍同樣包含該關(guān)鍵詞的信息點(diǎn)較少,該信息點(diǎn)排布比較分散,反之則表示該信息點(diǎn)排布集中;

S53,去除周圍N*Rd范圍內(nèi)包含所述同一關(guān)鍵詞的信息點(diǎn)的數(shù)量小于第三預(yù)設(shè)閾值的信息點(diǎn),如圖4所示,例如預(yù)設(shè)閾值取值為1,則只有信息點(diǎn)P2周圍N*Rd范圍內(nèi)的信息點(diǎn)數(shù)量為0,所以去除信息點(diǎn)P2,保留其他符合條件的信息點(diǎn)。

上述優(yōu)選方案首先計(jì)算出信息點(diǎn)之間的平均距離Rd,然后以平均距離Rd和系數(shù)N為依據(jù)來判斷各個信息點(diǎn)N*Rd范圍內(nèi)是否存在足夠多的信息點(diǎn),由此可以進(jìn)一步去除掉排布分散的信息點(diǎn),使最終保留下的信息點(diǎn)排布密度足夠高。

本發(fā)明另一實(shí)施例提供了一種興趣點(diǎn)篩選方法,如圖6所示該方法包括如下步驟:

S’1,采用前一實(shí)施例中的確定地理范圍內(nèi)興趣區(qū)域的方法確定興趣區(qū)域,興趣區(qū)域中通常存在較多的信息點(diǎn);

S’2,在所述興趣區(qū)域內(nèi)根據(jù)信息點(diǎn)所包含的信息篩選出至少一個信息點(diǎn),該篩選出的至少一個信息點(diǎn)為興趣點(diǎn)(Point of Interest,POI),該興趣點(diǎn)相比興趣區(qū)域中的其他信息點(diǎn),具有更高的知名度或更明顯的特征。本領(lǐng)域技術(shù)人員可以理解,篩選信息點(diǎn)的方法有多種,例如可以根據(jù) 信息點(diǎn)的熱度(在各種應(yīng)用系統(tǒng)中被用戶查詢、選擇、提交的次數(shù))進(jìn)行排序,選擇熱度較高的信息點(diǎn)。

根據(jù)本發(fā)明實(shí)施例提供的興趣點(diǎn)篩選方法,可以將地圖數(shù)據(jù)劃分為多個感興趣區(qū)域,然后在興趣區(qū)域中篩選出特征相對明顯、知名度相對較高的信息點(diǎn),篩選出的信息點(diǎn)可以作為興趣區(qū)域內(nèi)的地標(biāo)性建筑,或稱為興趣點(diǎn),篩選出的信息點(diǎn)可以應(yīng)用于多種場景,例如可以在某些服務(wù)類應(yīng)用程序中作為標(biāo)準(zhǔn)信息點(diǎn),或者在地圖數(shù)據(jù)中進(jìn)行突出顯示,使用戶可以更方便的查找信息點(diǎn)。

作為一個優(yōu)選的實(shí)施方式,本實(shí)施例中的步驟S’2具體可以包括:

S’21,確定所述興趣區(qū)域內(nèi)的所有信息點(diǎn)的特征值,本領(lǐng)域技術(shù)人員可以理解,確定信息點(diǎn)的特征值的方法有多種,例如可以根據(jù)信息點(diǎn)的受重視度等因素來確定,現(xiàn)有的特征值計(jì)算方法都是可行的;

S’22,利用支持向量機(jī)分類模型,以所述信息點(diǎn)的特征值為輸入值對信息點(diǎn)進(jìn)行篩選。支持向量機(jī)(SVM,Support Vector Machine)是與相關(guān)的學(xué)習(xí)算法有關(guān)的監(jiān)督學(xué)習(xí)模型,可以分析數(shù)據(jù),識別模式,用于分類和回歸分析。支持向量機(jī)模型可以通過給定的樣本數(shù)據(jù)進(jìn)行訓(xùn)練得到,本發(fā)明中的樣本數(shù)據(jù)可歸為兩類,一類為符合條件的目標(biāo)樣本,另一類是不符合條件的非目標(biāo)樣本。利用經(jīng)過訓(xùn)練得到的支持向量機(jī)模型即可以判斷出給定的信息點(diǎn)是否為目標(biāo)信息點(diǎn)。

本實(shí)施例優(yōu)選使用多個特征值對信息點(diǎn)進(jìn)行篩選,即信息點(diǎn)的特征值包括第一特征值、第二特征值和第三特征值,其中第一特征值的計(jì)算方法包括:

根據(jù)信息點(diǎn)的地址信息計(jì)算信息點(diǎn)被引用的類型和次數(shù),為每一種類型賦予權(quán)重,然后根據(jù)引用類型權(quán)重和引用次數(shù)計(jì)算信息點(diǎn)的第一特征值。優(yōu)選地,上述引用類型至少包括三類:

第一類是被地理位置不相同的另一信息點(diǎn)所引用。例如有兩個信息點(diǎn):信息點(diǎn)1-海淀橋、信息點(diǎn)2-中國技術(shù)交易大廈,信息點(diǎn)2的地址信息包括“海淀橋東中國技術(shù)交易大廈”,則信息點(diǎn)1-海淀橋被信息點(diǎn)2-中國技術(shù)交易大廈引用一次,該引用可以稱為外部引用;

第二類是被公交類信息點(diǎn)所引用。例如信息點(diǎn)1-海淀橋,信息點(diǎn)2-海淀橋東公交站,則信息點(diǎn)1-海淀橋被信息點(diǎn)2-海淀橋東公交站引用一次,該引用可以稱為公交引用;

第三類是被地理位置相同的另一信息點(diǎn)所引用。例如有兩個信息點(diǎn):信息點(diǎn)1-中國技術(shù)交易大廈、信息點(diǎn)2-貝塔咖啡廳,信息點(diǎn)2的地址信息包括“中國技術(shù)交易大廈B1層貝塔咖啡”,信息點(diǎn)1-中國技術(shù)交易大廈被信息點(diǎn)2-貝塔咖啡廳引用一次,該引用可以稱為內(nèi)部引用。

各個信息點(diǎn)被引用的類型和次數(shù)可能均不相同,并且某些信息點(diǎn)可能同時(shí)屬于多類引用,因此可以使用下列公式來計(jì)算第一特征值:

Y1=信息點(diǎn)AX1+BX2+CX3,

其中Y1為第一特征值,信息點(diǎn)A、B、C為三種引用類型的權(quán)重,X1、X2、X3為相應(yīng)引用類型的引用次數(shù),信息點(diǎn)A、B、C可以取任意值,該權(quán)重用于體現(xiàn)引用類型的重要性,例如可以是信息點(diǎn)A>B>C、或者信息點(diǎn)A=B=C。本領(lǐng)域技術(shù)人員可以理解,上述公式只是為了說明第一特征值的物理含義而舉出的一個具體實(shí)施方式,實(shí)際應(yīng)用時(shí),還可以通過更簡單或更 復(fù)雜的算法利用引用類型權(quán)重和次數(shù)這兩個信息計(jì)算出信息點(diǎn)的第一特征值。

上述第二特征值的計(jì)算方法包括:

根據(jù)信息點(diǎn)所包含的數(shù)值信息以及最大預(yù)設(shè)數(shù)值和最小預(yù)設(shè)數(shù)值計(jì)算信息點(diǎn)的第二特征值,本領(lǐng)域技術(shù)人員可以理解,信息點(diǎn)中,除名稱信息、地址信息、引用信息以外,還具有富信息,各類信息點(diǎn)的富信息均不相同,如酒店類、醫(yī)院類、景區(qū)類、政府機(jī)關(guān)等都有相應(yīng)的等級信息,住宅類有居住戶數(shù)、價(jià)格等信息,餐飲類有點(diǎn)評數(shù)量或點(diǎn)評分值等信息,上述富信息均為數(shù)值信息,實(shí)際應(yīng)用時(shí)可以抽取信息點(diǎn)中的數(shù)值信息,然后根據(jù)信息點(diǎn)的類型,確定該類信息點(diǎn)的數(shù)值信息的最大值和最小值。例如對于酒店類信息點(diǎn)而言,其最大值可以取5,最小值可以取0,然后可以根據(jù)該酒店信息點(diǎn)的實(shí)際等級信息與最大值、最小值的比例來確定第二特征值。對于其他類型的信息點(diǎn)也可按照此方式進(jìn)行計(jì)算。本領(lǐng)域技術(shù)人員可以理解,上述第二特征值的計(jì)算方式只是為了說明第二特征值的物理含義而舉出的一個具體實(shí)施方式,實(shí)際應(yīng)用時(shí)還可以使用更簡單或更復(fù)雜的方式進(jìn)行計(jì)算。

上述第三特征值的計(jì)算方法包括:

根據(jù)用戶使用不同應(yīng)用程序?qū)π畔Ⅻc(diǎn)的選定操作,確定用戶所使用的應(yīng)用程序及相應(yīng)的選定次數(shù),為每一種應(yīng)用程序賦予權(quán)值,然后根據(jù)權(quán)值和選定次數(shù)計(jì)算信息點(diǎn)的第三特征值。例如對于某一個信息點(diǎn),用戶使用應(yīng)用程序1選定該信息點(diǎn)X1次,用戶使用應(yīng)用程序2選定該信息點(diǎn)X2次……用戶使用應(yīng)用程序n選定該信息點(diǎn)Xn次,由此,第三特征值可以按 照下式進(jìn)行計(jì)算:

Y3=信息點(diǎn)AX1+BX2+……+NXn,

其中Y3為第三特征值,信息點(diǎn)A、B……N為n種應(yīng)用程序的權(quán)重,上述權(quán)重可以任意取值,并可以為特定的應(yīng)用程序賦予較高的權(quán)重等。本領(lǐng)域技術(shù)人員可以理解,上述公式只是為了說明第三特征值的物理含義而舉出的一個具體實(shí)施方式,實(shí)際應(yīng)用時(shí),還可以通過更簡單或更復(fù)雜的算法利用應(yīng)用程序類型權(quán)重和次數(shù)這兩個信息計(jì)算出信息點(diǎn)的第三特征值。

上述優(yōu)選方案以信息點(diǎn)被引用的情況、用戶提交情況和信息點(diǎn)的富信息為依據(jù),并利用機(jī)器學(xué)習(xí)模型對信息點(diǎn)進(jìn)行篩選,由此可以使篩選方式更有針對性,并提高篩選效率。

本領(lǐng)域技術(shù)人員可以理解,支持向量機(jī)分類模型是利用大量的樣本數(shù)據(jù)不斷訓(xùn)練而得到的。為了提高支持向量機(jī)分類模型的分類性能,作為所述支持向量機(jī)分類模型的目標(biāo)信息點(diǎn)訓(xùn)練樣本的特征值(第一特征值、第二特征值和第三特征值)均大于預(yù)設(shè)特征閾值,該預(yù)設(shè)特征閾值包括該興趣區(qū)域內(nèi)的所有信息點(diǎn)的平均特征閾值和/或該興趣區(qū)域內(nèi)的同一類別信息點(diǎn)的平均特征閾值。

由于一個興趣區(qū)域內(nèi)可能包括很多知名度較高的信息點(diǎn),例如西單區(qū)域內(nèi)有很多商場類信息點(diǎn),很多商場在使用上述模型篩選時(shí)都可能被判定為目標(biāo)信息點(diǎn),但是這不符合用戶對知名度的直觀感受。在某個區(qū)域,用戶對某一個類別的信息點(diǎn)通常只能記住前幾名,所以局部區(qū)域內(nèi)某個類別的目標(biāo)信息點(diǎn)過多是不合理的,為了進(jìn)一步對目標(biāo)信息點(diǎn)進(jìn)行篩選,本方法還可以包括如下步驟:

S’3,選取類型相同的多個信息點(diǎn);

S’4,根據(jù)上述特征值對類型相同的多個信息點(diǎn)進(jìn)行從高到低的排序,然后保留前N個同一類型的目標(biāo)信息點(diǎn),由此可以使篩選出的信息點(diǎn)的識別度更高,提高用戶的體驗(yàn)。

本發(fā)明的另一個實(shí)施例還提供一種確定地理范圍內(nèi)興趣區(qū)域的裝置,如圖7所示,該裝置包括:

獲取單元71,用于獲取地理范圍內(nèi)的信息點(diǎn);

選取單元72,用于從上述信息點(diǎn)中選取包含同一關(guān)鍵詞且數(shù)量大于第一預(yù)設(shè)閾值的多個信息點(diǎn);

信息點(diǎn)確定單元73,用于對所述多個信息點(diǎn)間的距離計(jì)算,確定出一個位于中心位置的信息點(diǎn),記為a,并通過所述距離計(jì)算的結(jié)果確定與該信息點(diǎn)a間的距離值最大的信息點(diǎn)b;

第一篩選單元74,用于對信息點(diǎn)a和信息點(diǎn)b間的距離值進(jìn)行分段,篩選出每個段內(nèi)數(shù)量大于第二預(yù)設(shè)閾值的信息點(diǎn)c;

第二篩選單元75,用于計(jì)算上述篩選出的各信息點(diǎn)c周圍包含所述同一關(guān)鍵詞的信息點(diǎn)的數(shù)量,并保留數(shù)量大于等于第三預(yù)設(shè)閾值的信息點(diǎn)c;

區(qū)域確定單元76,用于根據(jù)上述保留的數(shù)量大于等于第三預(yù)設(shè)閾值的信息點(diǎn)c確定興趣區(qū)域。

上述裝置通過獲取地理范圍內(nèi)所有信息點(diǎn)并篩選出包含同一關(guān)鍵詞的多個信息點(diǎn),可以確定出含有相同關(guān)鍵詞的多個信息點(diǎn),然后對數(shù)量是否大于預(yù)設(shè)閾值的信息點(diǎn)進(jìn)行處理,去除其中位置分散的信息點(diǎn),最終根據(jù) 保留的多個信息點(diǎn)確定興趣區(qū)域,可以在地理范圍中進(jìn)一步確定出更具體的興趣區(qū)域,興趣區(qū)域內(nèi)均為包括同一關(guān)鍵詞的信息點(diǎn),由此可以提高地興趣區(qū)域范圍的準(zhǔn)確性。

優(yōu)選地,所述信息點(diǎn)確定單元73包括:

中位點(diǎn)確定單元,用于分別計(jì)算每個信息點(diǎn)與除自身之外的所有信息點(diǎn)間的距離之和,并確定距離之和最小的信息點(diǎn)a;

最遠(yuǎn)點(diǎn)確定單元,用于分別計(jì)算除信息點(diǎn)a外的信息點(diǎn)與該信息點(diǎn)a間的距離,并確定具有最大距離值的信息點(diǎn)b。

上述優(yōu)選方案通過計(jì)算每個信息點(diǎn)與除自身之外的所有信息點(diǎn)的距離之和,可以更準(zhǔn)確地在多個信息點(diǎn)中找到中位點(diǎn),并找到距離中位點(diǎn)最遠(yuǎn)的信息點(diǎn)。

優(yōu)選地,所述第一篩選單元74包括:

分段單元,用于對所述最大距離值進(jìn)行分段;

第一數(shù)量計(jì)算單元,用于分別計(jì)算每一段內(nèi)的信息點(diǎn)的數(shù)量;

子篩選單元,用于篩選出數(shù)量大于第二預(yù)設(shè)閾值的段內(nèi)的信息點(diǎn),記為信息點(diǎn)c。

優(yōu)選地,所述分段單元包括:

分段數(shù)量確定單元,用于確定分段數(shù)量;

等分單元,用于根據(jù)所述分段數(shù)量對所述最大距離值進(jìn)行等分。

上述優(yōu)選方案對最大距離值進(jìn)行分段,并依次判斷每一分段內(nèi)的信息點(diǎn)的數(shù)量,而保留數(shù)量大于預(yù)設(shè)閾值的信息點(diǎn),由此可以去除掉分布相對分散的信息點(diǎn)。

優(yōu)選地,所述第二篩選單元75包括:

平均距離計(jì)算單元,用于計(jì)算篩選出的信息點(diǎn)c之間的平均距離Rd;

第二數(shù)量計(jì)算單元,用于分別計(jì)算篩選出的各信息點(diǎn)周圍N*Rd范圍內(nèi)包含所述同一關(guān)鍵詞的信息點(diǎn)的數(shù)量;

去除單元,用于去除周圍N*Rd范圍內(nèi)包含所述同一關(guān)鍵詞的信息點(diǎn)的數(shù)量小于第三預(yù)設(shè)閾值的信息點(diǎn)c。

上述優(yōu)選方案首先計(jì)算出信息點(diǎn)之間的平均距離Rd,然后以平均距離Rd和系數(shù)N為依據(jù)來判斷各個信息點(diǎn)N*Rd范圍內(nèi)是否存在足夠多的信息點(diǎn),由此可以進(jìn)一步去除掉排布分散的信息點(diǎn),使最終保留下的信息點(diǎn)排布密度足夠高。

本發(fā)明的另一個實(shí)施例還提供一種興趣點(diǎn)篩選裝置,如圖8所示,該裝置包括:

興趣區(qū)域確定單元81,用于利用上述第一個實(shí)施例提供的確定地理范圍內(nèi)興趣區(qū)域的方法確定出興趣區(qū)域;

篩選單元82,用于在所述興趣區(qū)域內(nèi)根據(jù)信息點(diǎn)所包含的信息篩選出至少一個信息點(diǎn),該篩選出的至少一個信息點(diǎn)為興趣點(diǎn)。

上述興趣點(diǎn)篩選裝置可以將地圖數(shù)據(jù)劃分為多個感興趣區(qū)域,然后在興趣區(qū)域中篩選出特征相對明顯、知名度相對較高的信息點(diǎn),該信息點(diǎn)可以作為興趣區(qū)域內(nèi)的地標(biāo)性建筑,篩選出的信息點(diǎn)可以應(yīng)用于多種場景,例如可以在某些服務(wù)類應(yīng)用程序中作為標(biāo)準(zhǔn)信息點(diǎn),或者在地圖數(shù)據(jù)中進(jìn)行突出顯示,使用戶可以更方便的查找信息點(diǎn)。

優(yōu)選地,上述篩選單元82可以包括:

特征值確定子單元,用于確定所述興趣區(qū)域內(nèi)的所有信息點(diǎn)的特征值;

分類子單元,用于利用支持向量機(jī)分類模型,以所述信息點(diǎn)的特征值為輸入值對信息點(diǎn)進(jìn)行篩選。

優(yōu)選地,所述特征值包括第一特征、第二特征和第三特征值,其中

所述第一特征值是根據(jù)信息點(diǎn)被引用的類型對應(yīng)的引用權(quán)值和引用次數(shù)計(jì)算得到的;

所述特征值還包括第二特征值,所述第二特征值是根據(jù)信息點(diǎn)所包含的數(shù)值信息以及最大預(yù)設(shè)數(shù)值和最小預(yù)設(shè)數(shù)值計(jì)算得到的;

所述第三特征值是根據(jù)用戶提交所述信息點(diǎn)所使用的應(yīng)用程序?qū)?yīng)的應(yīng)用權(quán)值和提交次數(shù)進(jìn)行計(jì)算得到的。

優(yōu)選地,所述被引用的類型包括被地理位置不相同的另一信息點(diǎn)所引用、被公交類信息點(diǎn)所引用、被地理位置相同的另一信息點(diǎn)所引用。

上述優(yōu)選方案以信息點(diǎn)被引用的情況、信息點(diǎn)的富信息、用戶在不同場景中選定信息點(diǎn)的情況為依據(jù),并利用機(jī)器學(xué)習(xí)模型對信息點(diǎn)進(jìn)行篩選,由此可以使篩選方式更有針對性,并提高篩選效率。

優(yōu)選地,支持向量機(jī)分類模型的符合篩選條件的訓(xùn)練樣本的信息點(diǎn)的特征值均大于預(yù)設(shè)特征閾值,預(yù)設(shè)特征閾值包括興趣區(qū)域內(nèi)的所有待篩選信息點(diǎn)的平均特征閾值和/或興趣區(qū)域內(nèi)的同一類別的待篩選信息點(diǎn)的平均特征閾值。上述訓(xùn)練樣本可以提高支持向量機(jī)分類模型的分類性能。

優(yōu)選地,上述信息點(diǎn)篩選裝置還可以包括:

選取單元83,用于選取類型相同的多個信息點(diǎn);

去除單元84,用于根據(jù)特征值對類型相同的多個信息點(diǎn)進(jìn)行從高到低 的排序,然后保留排序靠前的至少一個信息點(diǎn)。上述優(yōu)選方案可以使篩選出的信息點(diǎn)的識別度更高,提高用戶的體驗(yàn)。

顯然,上述實(shí)施例僅僅是為清楚地說明所作的舉例,而并非對實(shí)施方式的限定。對于所屬領(lǐng)域的普通技術(shù)人員來說,在上述說明的基礎(chǔ)上還可以做出其它不同形式的變化或變動。這里無需也無法對所有的實(shí)施方式予以窮舉。而由此所引伸出的顯而易見的變化或變動仍處于本發(fā)明創(chuàng)造的保護(hù)范圍之中。

當(dāng)前第1頁1 2 3 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
武强县| 平度市| 平遥县| 沅陵县| 礼泉县| 咸阳市| 富宁县| 昭通市| 马山县| 柞水县| 遵义市| 政和县| 顺义区| 米林县| 扬中市| 永平县| 安庆市| 伊春市| 合江县| 康平县| 宁强县| 巴青县| 广水市| 佛山市| 政和县| 马龙县| 宜春市| 深州市| 遂溪县| 手游| 光山县| 通州区| 芮城县| 永善县| 仁怀市| 萍乡市| 台中市| 桃源县| 稷山县| 十堰市| 潼南县|