本申請(qǐng)涉及通信技術(shù),尤其涉及一種地理圍欄類別的獲取方法、裝置及業(yè)務(wù)設(shè)備。
背景技術(shù):
隨著移動(dòng)互聯(lián)網(wǎng)業(yè)務(wù)的發(fā)展,從地理位置角度理解用戶線下消費(fèi)行為和社交行為成為用戶位置服務(wù)(locationbasedservices,lbs)數(shù)據(jù)挖掘的新熱點(diǎn),通過構(gòu)建地理圍欄和分析用戶lbs與地理圍欄的關(guān)系是挖掘用戶lbs行為語義的有效途徑之一。具有語義的地理圍欄數(shù)據(jù)在基于地理位置的用戶行為挖掘方面有重要意義。
目前,圍欄數(shù)據(jù)包括測(cè)繪圍欄數(shù)據(jù)和地理圍欄數(shù)據(jù)。其中,測(cè)繪圍欄數(shù)據(jù)由測(cè)繪機(jī)構(gòu)實(shí)地測(cè)量獲得,數(shù)據(jù)量豐富且圍欄邊界準(zhǔn)確。地理圍欄是指有邊界的地理區(qū)域,一個(gè)廠區(qū)、一所學(xué)校、一個(gè)小區(qū)等都是一個(gè)圍欄實(shí)體,因此,地理圍欄數(shù)據(jù)是指與有邊界的地理區(qū)域相關(guān)的數(shù)據(jù)。然而,測(cè)繪圍欄數(shù)據(jù)的類別采用基礎(chǔ)地理信息要素的分類標(biāo)準(zhǔn),圍欄類別通用、抽象,例如“居住地與設(shè)施”,與圍欄的實(shí)際語義存在差異,無法獲取用戶的行為信息。
為了將測(cè)繪圍欄數(shù)據(jù)轉(zhuǎn)化成可以含有語義的地理圍欄數(shù)據(jù),可以發(fā)動(dòng)用戶人工根據(jù)測(cè)繪圍欄名稱和地圖上圍欄的邊界和范圍進(jìn)行類別標(biāo)注。
但是,人工進(jìn)行類別標(biāo)注的方式所需的時(shí)間長(zhǎng)且準(zhǔn)確性差。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本申請(qǐng)?zhí)峁┮环N地理圍欄類別的獲取方法、裝置及業(yè)務(wù)設(shè)備。
根據(jù)本申請(qǐng)實(shí)施例的第一方面,提供一種地理圍欄類別的獲取方法,所述方法包括:
獲得當(dāng)前測(cè)繪圍欄數(shù)據(jù),所述當(dāng)前測(cè)繪圍欄數(shù)據(jù)包括當(dāng)前測(cè)繪圍欄名稱、當(dāng)前測(cè)繪圍欄類別和當(dāng)前測(cè)繪圍欄邊界;
將所述當(dāng)前測(cè)繪圍欄類別映射到興趣點(diǎn)poi類別;
分別根據(jù)當(dāng)前測(cè)繪圍欄類別映射結(jié)果、所述當(dāng)前測(cè)繪圍欄名稱和所述當(dāng)前測(cè)繪圍欄邊界,篩選出與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合;
獲取所述poi集合中poi數(shù)量最多且poi名稱與所述當(dāng)前測(cè)繪圍欄名稱的文本相似度之和最大的poi類別,并將獲取的poi類別作為所述當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別。
根據(jù)本申請(qǐng)實(shí)施例的第二方面,提供一種地理圍欄類別的獲取裝置,所述裝置包括:
數(shù)據(jù)獲得模塊,用于獲得當(dāng)前測(cè)繪圍欄數(shù)據(jù),所述當(dāng)前測(cè)繪圍欄數(shù)據(jù)包括當(dāng)前測(cè)繪圍欄名稱、當(dāng)前測(cè)繪圍欄類別和當(dāng)前測(cè)繪圍欄邊界;
映射模塊,用于將所述數(shù)據(jù)獲得模塊獲得的所述當(dāng)前測(cè)繪圍欄類別映射到興趣點(diǎn)poi類別;
集合篩選模塊,用于分別根據(jù)所述映射模塊映射到的當(dāng)前測(cè)繪圍欄類別映射結(jié)果、所述數(shù)據(jù)獲得模塊獲得的所述當(dāng)前測(cè)繪圍欄名稱和所述當(dāng)前測(cè)繪圍欄邊界,篩選出與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合;
類別獲取模塊,用于獲取所述集合篩選模塊篩選出的所述poi集合中poi數(shù)量最多且poi名稱與所述當(dāng)前測(cè)繪圍欄名稱的文本相似度之和最大的poi類別,并將獲取的poi類別作為所述當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別集合篩選模塊。
根據(jù)本申請(qǐng)實(shí)施例的第三方面,提供一種業(yè)務(wù)設(shè)備,包括:
處理器;用于存儲(chǔ)所述處理器可執(zhí)行指令的存儲(chǔ)器;
其中,所述處理器被配置為:
獲得當(dāng)前測(cè)繪圍欄數(shù)據(jù),所述當(dāng)前測(cè)繪圍欄數(shù)據(jù)包括當(dāng)前測(cè)繪圍欄名稱、 當(dāng)前測(cè)繪圍欄類別和當(dāng)前測(cè)繪圍欄邊界;
將所述當(dāng)前測(cè)繪圍欄類別映射到興趣點(diǎn)poi類別;
分別根據(jù)當(dāng)前測(cè)繪圍欄類別映射結(jié)果、所述當(dāng)前測(cè)繪圍欄名稱和所述當(dāng)前測(cè)繪圍欄邊界,篩選出與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合;
獲取所述poi集合中poi數(shù)量最多且poi名稱與所述當(dāng)前測(cè)繪圍欄名稱的文本相似度之和最大的poi類別,并將獲取的poi類別作為所述當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別。
在本申請(qǐng)實(shí)施例中,通過獲得當(dāng)前測(cè)繪圍欄數(shù)據(jù),并將當(dāng)前測(cè)繪圍欄數(shù)據(jù)中的當(dāng)前測(cè)繪圍欄類別映射到poi類別,然后分別根據(jù)當(dāng)前測(cè)繪圍欄類別映射結(jié)果、當(dāng)前測(cè)繪圍欄名稱和當(dāng)前測(cè)繪圍欄邊界,篩選出與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合,最后獲取poi集合中poi數(shù)量最多且poi名稱與當(dāng)前測(cè)繪圍欄名稱的文本相似度之和最大的poi類別作為當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別,實(shí)現(xiàn)過程所需時(shí)間短且準(zhǔn)確性高。
附圖說明
圖1是本申請(qǐng)一示例性實(shí)施例示出的一種地理圍欄類別的獲取方法的流程圖;
圖2a是本申請(qǐng)一示例性實(shí)施例示出的一種將當(dāng)前測(cè)繪圍欄類別映射到poi類別的流程圖;
圖2b是本申請(qǐng)一示例性實(shí)施例示出的一種將當(dāng)前測(cè)繪圍欄類別映射到poi類別的示意圖;
圖3是本申請(qǐng)一示例性實(shí)施例示出的一種獲得與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合的流程圖;
圖4是本申請(qǐng)一示例性實(shí)施例示出的一種通過類別投票獲得當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別的流程圖;
圖5是本申請(qǐng)一示例性實(shí)施例示出的一種基于圍欄邊界集合進(jìn)行圍欄分片合并得到當(dāng)前測(cè)繪圍欄數(shù)據(jù)的流程圖;
圖6是本申請(qǐng)一示例性實(shí)施例示出的另一種地理圍欄類別的獲取方法的流程圖;
圖7是本申請(qǐng)地理圍欄類別的獲取裝置所在業(yè)務(wù)設(shè)備的一種硬件結(jié)構(gòu)圖;
圖8是本申請(qǐng)一示例性實(shí)施例示出的一種地理圍欄類別的獲取裝置的框圖;
圖9是本申請(qǐng)一示例性實(shí)施例示出的另一種地理圍欄類別的獲取裝置的框圖。
具體實(shí)施方式
這里將詳細(xì)地對(duì)示例性實(shí)施例進(jìn)行說明,其示例表示在附圖中。下面的描述涉及附圖時(shí),除非另有表示,不同附圖中的相同數(shù)字表示相同或相似的要素。以下示例性實(shí)施例中所描述的實(shí)施方式并不代表與本申請(qǐng)相一致的所有實(shí)施方式。相反,它們僅是與如所附權(quán)利要求書中所詳述的、本申請(qǐng)的一些方面相一致的裝置和方法的例子。
在本申請(qǐng)使用的術(shù)語是僅僅出于描述特定實(shí)施例的目的,而非旨在限制本申請(qǐng)。在本申請(qǐng)和所附權(quán)利要求書中所使用的單數(shù)形式的“一種”、“所述”和“該”也旨在包括多數(shù)形式,除非上下文清楚地表示其他含義。還應(yīng)當(dāng)理解,本文中使用的術(shù)語“和/或”是指并包含一個(gè)或多個(gè)相關(guān)聯(lián)的列出項(xiàng)目的任何或所有可能組合。
應(yīng)當(dāng)理解,盡管在本申請(qǐng)可能采用術(shù)語第一、第二、第三等來描述各種信息,但這些信息不應(yīng)限于這些術(shù)語。這些術(shù)語僅用來將同一類型的信息彼此區(qū)分開。例如,在不脫離本申請(qǐng)范圍的情況下,第一信息也可以被稱為第二信息,類似地,第二信息也可以被稱為第一信息。取決于語境,如在此所使用的詞語“如果”可以被解釋成為“在……時(shí)”或“當(dāng)……時(shí)”或“響應(yīng)于確定”。
在本申請(qǐng)實(shí)施例中,測(cè)繪圍欄數(shù)據(jù)的類別體系采用了基礎(chǔ)地理信息要素的分類標(biāo)準(zhǔn),將地理信息要素分為水系、居民地及設(shè)施、交通、管線、境界 與政區(qū)、地貌、植被與土質(zhì)、地名等8大類,河流、湖泊、公共服務(wù)及設(shè)施、名勝古跡、城市道路、航道、行政區(qū)等46中類以及按地圖比例尺段進(jìn)行劃分的小類和子類。測(cè)繪圍欄類別與學(xué)校、商店、景區(qū)等用戶活動(dòng)場(chǎng)所存在差異,無法直接用于個(gè)性化推薦或用戶行為分析等基于語義化的區(qū)域信息的圍欄數(shù)據(jù)挖掘。為了獲取測(cè)繪圍欄的語義化信息,可以根據(jù)測(cè)繪圍欄內(nèi)的poi信息,對(duì)測(cè)繪圍欄進(jìn)行重新分類,即獲取測(cè)繪圍欄對(duì)應(yīng)的具有用戶活動(dòng)語義化信息的poi第三級(jí)類別,從而為更多上層業(yè)務(wù)及應(yīng)用服務(wù),且實(shí)現(xiàn)過程所需時(shí)間短且準(zhǔn)確性高。下面結(jié)合具體實(shí)施例對(duì)本申請(qǐng)的實(shí)現(xiàn)過程進(jìn)行詳細(xì)描述。
圖1是本申請(qǐng)一示例性實(shí)施例示出的一種地理圍欄類別的獲取方法的流程圖,該實(shí)施例從業(yè)務(wù)設(shè)備側(cè)進(jìn)行描述,該業(yè)務(wù)設(shè)備可以為處理各種業(yè)務(wù)例如口碑搜索推薦、位置圈人或用戶位置可視化業(yè)務(wù)等的設(shè)備。如圖1所示,該地理圍欄類別的獲取方法包括:
步驟s101,獲得當(dāng)前測(cè)繪圍欄數(shù)據(jù)。
其中,當(dāng)前測(cè)繪圍欄數(shù)據(jù)可以包括當(dāng)前測(cè)繪圍欄名稱、當(dāng)前測(cè)繪圍欄類別和當(dāng)前測(cè)繪圍欄邊界。而當(dāng)前測(cè)繪圍欄類別可以包括類別名稱和類別編碼。當(dāng)前測(cè)繪圍欄邊界可以包括按順時(shí)針排序的經(jīng)緯度點(diǎn)集。對(duì)于范圍較大或邊界較復(fù)雜的測(cè)繪圍欄,為了避免邊界字段過長(zhǎng),其邊界c可能被分成c1、c2、c3…cn多個(gè)點(diǎn)集,因而存在同名且邊界相鄰的圍欄分片,此處的圍欄分片是指構(gòu)成測(cè)繪圍欄的子區(qū)域,在該實(shí)施例中,可以通過合并圍欄分片來得到測(cè)繪圍欄的完整邊界。
在該實(shí)施例中,上述步驟s101可以包括:獲得與當(dāng)前測(cè)繪圍欄名稱和當(dāng)前測(cè)繪圍欄類別均相同的圍欄分片對(duì)應(yīng)的圍欄邊界集合,并基于該圍欄邊界集合進(jìn)行圍欄分片合并,得到當(dāng)前測(cè)繪圍欄數(shù)據(jù)。
例如,可以從源數(shù)據(jù)表中獲取測(cè)繪圍欄名稱fn,測(cè)繪圍欄類型bt和測(cè)繪圍欄邊界c三個(gè)字段,并以fn和bt為主鍵進(jìn)行聚合,得到與當(dāng)前測(cè)繪圍欄名稱和當(dāng)前測(cè)繪圍欄類別均相同的圍欄邊界集合(c1、c2、c3…cn),然后在該圍欄邊界集合的基礎(chǔ)上進(jìn)行圍欄合并,得到當(dāng)前測(cè)繪圍欄數(shù)據(jù)。
步驟s102,將當(dāng)前測(cè)繪圍欄類別映射到poi類別。
其中,poi是地圖上有語義的地理位置標(biāo)注點(diǎn),poi的類別體系相對(duì)于國(guó)家基礎(chǔ)地理信息要素的分類標(biāo)準(zhǔn)更加符合人們的習(xí)慣稱謂,poi類別也可以包括類別名稱和類別編碼。poi類別可以分為第一級(jí)類別、第二級(jí)類別和第三級(jí)類別三個(gè)層次,以“科教文化服務(wù)-學(xué)校-小學(xué)”為例,第一級(jí)類別的名稱為“科教文化服務(wù)”,第二級(jí)類別的名稱為“學(xué)校”,第三級(jí)類別的名稱為“小學(xué)”。其中,類別名稱的概括程度由高到低依次為:第一級(jí)類別、第二級(jí)類別和第三級(jí)類別,第三級(jí)類別最多,語義最豐富。
在該實(shí)施例中,可以利用當(dāng)前測(cè)繪圍欄類別名稱依次匹配poi的三級(jí)類別名稱,得到當(dāng)前測(cè)繪圍欄類別對(duì)應(yīng)的poi類別。由于測(cè)繪圍欄類別較為概括抽象,僅通過圍欄類別名稱進(jìn)行匹配,大部分只能匹配到poi類別的第一級(jí)類別名稱或第二級(jí)類別名稱。
步驟s103,分別根據(jù)當(dāng)前測(cè)繪圍欄類別映射結(jié)果、當(dāng)前測(cè)繪圍欄名稱和當(dāng)前測(cè)繪圍欄邊界,篩選出與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合。
該實(shí)施例中,從當(dāng)前測(cè)繪圍欄類別映射結(jié)果、當(dāng)前測(cè)繪圍欄名稱和當(dāng)前測(cè)繪圍欄邊界三個(gè)角度篩選出與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合,該poi集合中可以包含poi名稱、poi所屬的第三級(jí)類別和poi的經(jīng)緯度位置。
步驟s104,獲取poi集合中poi數(shù)量最多且poi名稱與當(dāng)前測(cè)繪圍欄名稱的文本相似度之和最大的poi類別,并將獲取的poi類別作為當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別。
在該實(shí)施例中,可以針對(duì)poi集合內(nèi)的每個(gè)第三級(jí)類別,根據(jù)當(dāng)前第三級(jí)類別對(duì)應(yīng)的poi數(shù)量以及所有poi名稱與當(dāng)前測(cè)繪圍欄名稱的相似度進(jìn)行排序,選取poi數(shù)量最多和相似度之和最大的第三級(jí)類別作為當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別。
該實(shí)施例中的業(yè)務(wù)設(shè)備可以采用分布式計(jì)算方式,且步驟s101可采用python程序?qū)崿F(xiàn),s102-104均可采用hive結(jié)構(gòu)化查詢語言(sql)程序?qū)崿F(xiàn),從而提高處理效率。
利用本實(shí)施例提供的方法對(duì)16萬個(gè)包含31種類別的測(cè)繪圍欄設(shè)施類圍欄數(shù)據(jù)進(jìn)行poi第三級(jí)類別獲取,能夠獲取poi第三級(jí)類別的圍欄覆蓋率為94.19%。抽樣住宅區(qū),學(xué)校,樓宇等類別的測(cè)繪圍欄進(jìn)行驗(yàn)證,能夠獲取“小學(xué)”,“中學(xué)”等第三級(jí)類別,類別描述的準(zhǔn)確率為90%以上,由此可見,利用本實(shí)施例可將測(cè)繪圍欄數(shù)據(jù)轉(zhuǎn)化為語義化圍欄數(shù)據(jù),從而可以為個(gè)性化推薦和基于地理位置的用戶行為挖掘等移動(dòng)互聯(lián)網(wǎng)服務(wù)提供有價(jià)值的圍欄數(shù)據(jù)。
上述實(shí)施例,通過獲得當(dāng)前測(cè)繪圍欄數(shù)據(jù),并將當(dāng)前測(cè)繪圍欄數(shù)據(jù)中的當(dāng)前測(cè)繪圍欄類別映射到poi類別,然后分別根據(jù)當(dāng)前測(cè)繪圍欄類別映射結(jié)果、當(dāng)前測(cè)繪圍欄名稱和當(dāng)前測(cè)繪圍欄邊界,篩選出與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合,最后獲取poi集合中poi數(shù)量最多且poi名稱與當(dāng)前測(cè)繪圍欄名稱的文本相似度之和最大的poi類別作為當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別,實(shí)現(xiàn)過程所需時(shí)間短且準(zhǔn)確性高。
圖2a是本申請(qǐng)一示例性實(shí)施例示出的一種將當(dāng)前測(cè)繪圍欄類別映射到poi類別的流程圖,如圖2a所示,該映射過程可以包括:
步驟s201,將當(dāng)前測(cè)繪圍欄類別名稱依次與poi的三級(jí)類別名稱進(jìn)行匹配,若匹配成功,則執(zhí)行步驟s202,若匹配失敗,則執(zhí)行步驟s203。
由于poi類別包括第一級(jí)類別、第二級(jí)類別和第三級(jí)類別,因此,可以將當(dāng)前測(cè)繪圍欄類別名稱依次與poi的三級(jí)類別名稱進(jìn)行匹配。
步驟s202,將當(dāng)前測(cè)繪圍欄類別映射到匹配成功的poi類別名稱對(duì)應(yīng)的poi類別,操作結(jié)束。
若當(dāng)前測(cè)繪圍欄類別名稱與poi的三級(jí)類別名稱中一個(gè)類別名稱匹配成功,則可以將匹配成功的poi類別名稱作為當(dāng)前測(cè)繪圍欄類別的映射結(jié)果,例如,假設(shè)當(dāng)前測(cè)繪圍欄類別名稱為“學(xué)?!保拔幕瘜m”,“科研機(jī)構(gòu)”,“喪葬設(shè)施”和“休閑場(chǎng)所”,由于在poi類別體系中存在相同或相近的名稱,因此當(dāng)前測(cè)繪圍欄可以直接映射到poi類別體系中的第二級(jí)類別,如圖2b所示。
步驟s203,接收根據(jù)預(yù)設(shè)的人工映射規(guī)則確定的poi類別,并將當(dāng)前測(cè)繪圍欄類別映射到確定的poi類別,操作結(jié)束。
若當(dāng)前測(cè)繪圍欄類別名稱與poi的三級(jí)類別名稱中的任意一個(gè)類別名稱均不匹配,則可以通過人工的方式進(jìn)行類別映射。預(yù)設(shè)的人工映射規(guī)則可以是映射后的poi類別能覆蓋當(dāng)前測(cè)繪圍欄類別下的所有測(cè)繪圍欄。由于測(cè)繪圍欄類別名稱更抽象,覆蓋圍欄數(shù)多于單個(gè)poi類別,因此,如圖2b所示,人工映射有兩種情形:一種情形是單個(gè)測(cè)繪圍欄類別對(duì)應(yīng)單個(gè)poi類別,例如,名稱為“醫(yī)院”,“商業(yè)街”和“工業(yè)園區(qū)”的測(cè)繪圍欄類別可以人工映射到“醫(yī)療保健服務(wù)”,“特色商業(yè)街”和“產(chǎn)業(yè)園區(qū)”等poi的第一級(jí)類別或第二級(jí)類別;另一種情形是單個(gè)測(cè)繪圍欄類別對(duì)應(yīng)到多個(gè)poi類別,例如,測(cè)繪圍欄類別“城市綠地”較為抽象,可以映射到“風(fēng)景名勝相關(guān)”和“度假療養(yǎng)場(chǎng)所”兩個(gè)poi的第二級(jí)類別。
由此可見,經(jīng)過測(cè)繪圍欄類別到poi類別的映射,可以獲得以poi分類標(biāo)準(zhǔn)對(duì)測(cè)繪圍欄進(jìn)行分類的第一級(jí)類別或第二級(jí)類別。
上述實(shí)施例,通過將當(dāng)前測(cè)繪圍欄類別名稱依次與poi的三級(jí)類別名稱進(jìn)行匹配,并可以根據(jù)匹配結(jié)果完成類別映射,實(shí)現(xiàn)方式簡(jiǎn)單。
圖3是本申請(qǐng)一示例性實(shí)施例示出的一種獲得與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合的流程圖,如圖3所示,該過程可以包括:
步驟s301,從當(dāng)前測(cè)繪圍欄中篩選出所有與當(dāng)前測(cè)繪圍欄類別映射結(jié)果相關(guān)的第一poi集合。
在該實(shí)施例中,可以根據(jù)當(dāng)前測(cè)繪圍欄類別映射結(jié)果gt篩選出關(guān)聯(lián)圍欄,如果gt為第三級(jí)類別,則篩選條件為poi所屬類別gtp與gt相等,如果gt為第一級(jí)類別或第二級(jí)類別,則篩選條件為gtp的第一級(jí)類別或第二級(jí)類別與gt相等,根據(jù)篩選條件獲取gtp滿足條件的第一poi集合。
例如,對(duì)于fn為xx街道xx中學(xué),gt為“學(xué)?!钡膰鷻?,通過gt匹配篩選,可以篩除掉非“學(xué)?!鳖惖膒oi點(diǎn),則第一poi集合中僅?!坝變簣@”、“小學(xué)”、“中學(xué)”、“大學(xué)”和“職業(yè)技術(shù)學(xué)?!钡阮悇e的poi。
步驟s302,從第一poi集合中篩選出位于當(dāng)前測(cè)繪圍欄邊界范圍內(nèi)的第二poi集合。
在該實(shí)施例中,可以根據(jù)當(dāng)前測(cè)繪圍欄邊界c進(jìn)行篩選,例如可以利用射線法判斷第一poi集合內(nèi)的poi經(jīng)緯度位置l是否在圍欄邊界c內(nèi),若在圍欄邊界c內(nèi),則將對(duì)應(yīng)poi加入第二poi集合。
其中,射線法的基本原理是:由poi經(jīng)緯度位置l出發(fā)畫一條與水平軸平行的射線,依次判斷該射線與圍欄邊界c每條邊的交點(diǎn),并統(tǒng)計(jì)交點(diǎn)的個(gè)數(shù),如果交點(diǎn)的個(gè)數(shù)為奇數(shù),則該poi在圍欄邊界c內(nèi),如果交點(diǎn)的個(gè)數(shù)為偶數(shù),則該poi不在圍欄邊界c內(nèi)。具體實(shí)現(xiàn)過程還要考慮交點(diǎn)在邊上以及射線與圍欄節(jié)點(diǎn)或邊重合等特殊情況。
根據(jù)圍欄邊界c進(jìn)行篩選,可以篩除圍欄邊界范圍外的poi,對(duì)于示例圍欄“xx街道xx中學(xué)”,可以篩除圍欄外“學(xué)?!鳖悇e的poi。
步驟s303,計(jì)算第二poi集合中的poi名稱與當(dāng)前測(cè)繪圍欄名稱的文本相似度,將文本相似度大于預(yù)設(shè)閾值的poi集合作為與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合。
在該實(shí)施例中,可以通過計(jì)算第二poi集合中的poi名稱pn與當(dāng)前測(cè)繪圍欄名稱fn的文本相似度,獲取pn與fn的文本相似度較高的poi集合。
其中,可以采用杰卡德(jaccard)系數(shù)來衡量pn與fn的文本相似度。jaccard系數(shù)的計(jì)算公式可以為:
其中,pn表示poi名稱的文本字符集,fn表示當(dāng)前測(cè)繪圍欄名稱的文本字符集,通過計(jì)算兩個(gè)文本字符集的交集符號(hào)數(shù)與并集符號(hào)數(shù)的比值,即可獲得jaccard系數(shù)。
當(dāng)交集和并集相等時(shí),兩個(gè)名稱相同。本實(shí)施例中可以篩選j(pn,fn)大于預(yù)設(shè)閾值例如0.3的pn對(duì)應(yīng)poi,能夠使包含fn的pn對(duì)應(yīng)的poi被獲取。對(duì)于示例圍欄“xx街道xx中學(xué)”,通過名稱篩選,可以篩除掉與fn相差較大 的poi,例如“xx職校”,同時(shí)保留包含圍欄名稱的poi,例如“xx街道xx中學(xué)正門”等。
上述實(shí)施例,從當(dāng)前測(cè)繪圍欄類別映射結(jié)果、當(dāng)前測(cè)繪圍欄名稱和當(dāng)前測(cè)繪圍欄邊界三個(gè)角度排除干擾poi,獲得與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合,為后續(xù)基于該poi集合獲得當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別提供了條件。
圖4是本申請(qǐng)一示例性實(shí)施例示出的一種通過類別投票獲得當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別的流程圖,如圖4所示,該過程可以包括:
步驟s401,統(tǒng)計(jì)poi集合中屬于每個(gè)第三級(jí)類別的poi數(shù)量。
假設(shè),poi集合中的poi點(diǎn)所屬的第三級(jí)類別分別為gtp1,gtp2,gtp3,…gtpk,k為第三級(jí)類別的個(gè)數(shù),則統(tǒng)計(jì)poi集合中屬于每個(gè)第三級(jí)類別的poi數(shù)量。
步驟s402,獲取poi數(shù)量最多的poi對(duì)應(yīng)的第三級(jí)類別,并從poi集合中刪除不屬于獲取的第三級(jí)類別的poi。
假設(shè),統(tǒng)計(jì)的poi集合中屬于每個(gè)第三級(jí)類別的poi數(shù)量分別為mg1,mg2,mg3,…mgk,其中,mgk為類別屬于gtpk的poi數(shù)量,可通過如下公式獲得數(shù)量最大poi對(duì)應(yīng)的第三級(jí)類別:
其中,g1為mgk取最大值時(shí)對(duì)應(yīng)的所有類別,同時(shí)篩除類別不在g1內(nèi)的poi。
步驟s403,分別計(jì)算當(dāng)前poi集合中屬于每個(gè)第三級(jí)類別的所有poi名稱與當(dāng)前測(cè)繪圍欄名稱的文本相似度之和。
可采用jaccard系數(shù)計(jì)算當(dāng)前poi集合中屬于每個(gè)第三級(jí)類別的所有poi名稱pn與當(dāng)前測(cè)繪圍欄名稱fn的文本相似度之和。
步驟s404,將與文本相似度之和的最大值相對(duì)應(yīng)的第三級(jí)類別作為當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別。
通過以下公式可以獲得最大相似度對(duì)應(yīng)的第三級(jí)類別:
其中,jgk為屬于類別gtpk的所有poi名稱與fn的文本相似度之和,gtf為g1內(nèi)jgk取最大值時(shí)對(duì)應(yīng)的第三級(jí)類別,即當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別。
上述實(shí)施例,通過類別投票的方式,獲得當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別,實(shí)現(xiàn)過程簡(jiǎn)單,獲得的地理圍欄類別準(zhǔn)確率高。
圖5是本申請(qǐng)一示例性實(shí)施例示出的一種基于圍欄邊界集合進(jìn)行圍欄分片合并得到當(dāng)前測(cè)繪圍欄數(shù)據(jù)的流程圖,如圖5所示,該過程可以包括:
步驟s501,從圍欄邊界集合中獲取第一個(gè)圍欄邊界和第j個(gè)圍欄邊界,j的初始值為2。
步驟s502,判斷第一個(gè)圍欄邊界和第j個(gè)圍欄邊界是否共邊,若二者共邊,則執(zhí)行步驟s503,若二者不共邊,則執(zhí)行步驟s504。
步驟s503,將二者合并為第一個(gè)圍欄邊界,從圍欄邊界集合中刪除第j個(gè)圍欄邊界,并更新當(dāng)前圍欄邊界集合中剩余圍欄邊界的標(biāo)號(hào),轉(zhuǎn)向步驟s505。
步驟s504,將j累加一。
步驟s505,判斷j是否大于n,n為當(dāng)前圍欄邊界集合中的圍欄邊界數(shù)量,若j不大于n,則轉(zhuǎn)向步驟s507,若j大于n,則執(zhí)行步驟s506。
步驟s506,輸出當(dāng)前圍欄邊界集合中的第一個(gè)圍欄邊界及其對(duì)應(yīng)的圍欄名稱和圍欄類別,從當(dāng)前圍欄邊界集合中刪除第一個(gè)圍欄邊界,并更新圍欄邊界集合中剩余圍欄邊界的標(biāo)號(hào)。
如果j增加到超出n,則表明c1與其他邊界都不共邊,則c1不是圍欄分片,故輸出圍欄數(shù)據(jù),輸出的圍欄數(shù)據(jù)即為當(dāng)前測(cè)繪圍欄數(shù)據(jù)。
步驟s507,判斷圍欄邊界集合中的圍欄邊界數(shù)量是否等于一,若不等于一,則轉(zhuǎn)向執(zhí)行步驟s502;若等于一,則執(zhí)行步驟s508。
步驟s508,輸出當(dāng)前圍欄邊界集合中的第一個(gè)圍欄邊界及其對(duì)應(yīng)的圍欄名稱和圍欄類別。
如果邊界集中邊界數(shù)量n為1,則說明初始圍欄邊界集合中的所有邊界已完成合并,不再是圍欄分片,故直接輸出圍欄數(shù)據(jù),輸出的圍欄數(shù)據(jù)即為當(dāng)前測(cè)繪圍欄數(shù)據(jù)。
假設(shè),獲得的與當(dāng)前測(cè)繪圍欄名稱fn和當(dāng)前測(cè)繪圍欄類別bt均相同的圍欄分片對(duì)應(yīng)的圍欄邊界集合為(c1、c2、c3、c4),其中,c1與c3共邊,其它圍欄邊界間均不共邊,則圍欄分片的合并過程為:
首先從該圍欄邊界集合中取出c1和c2,由于c1和c2不共邊,故j=3,由于j小于4,故判斷圍欄邊界集合中的邊界數(shù)量是否為一,由于不為一,故判斷c1和c3是否共邊,由于二者共邊,故將c1和c3合并為新的c1,并刪除c3,j=2,當(dāng)前圍欄邊界集合更新為(c1、c2、c3),由于j小于3,故判斷圍欄邊界集合中的邊界數(shù)量是否為一,由于不為一,故判斷c1和c2是否共邊,由于二者不共邊,故j=3,由于j不大于3,故判斷圍欄邊界集合中的邊界數(shù)量是否為一,由于不為一,故判斷c1和c3是否共邊,由于二者不共邊,故j=4,由于j大于3,故輸出圍欄數(shù)據(jù)(fn,bt,c1),即該圍欄數(shù)據(jù)(fn,bt,c1)為當(dāng)前測(cè)繪圍欄數(shù)據(jù)。
該實(shí)施例可以基于業(yè)務(wù)設(shè)備的分布式計(jì)算后臺(tái)的python程序?qū)崿F(xiàn),從而提高合并效率。
上述實(shí)施例,通過合并圍欄分片,輸出當(dāng)前測(cè)繪圍欄數(shù)據(jù),從而為后續(xù)獲得當(dāng)前測(cè)繪圍欄數(shù)據(jù)對(duì)應(yīng)的地理圍欄類別提供了條件。
圖6是本申請(qǐng)一示例性實(shí)施例示出的另一種地理圍欄類別的獲取方法的流程圖,如圖6所示,在上述步驟s104之后,該獲取方法還可以包括:
步驟s105,根據(jù)當(dāng)前測(cè)繪圍欄數(shù)據(jù)和當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別,向移動(dòng)終端推送業(yè)務(wù)信息。
該業(yè)務(wù)信息可以包括但不限于推薦信息和位置信息中的至少一種。
上述實(shí)施例,在獲得當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別之后,可以基于 當(dāng)前測(cè)繪圍欄數(shù)據(jù)和當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別為進(jìn)入當(dāng)前測(cè)繪圍欄的移動(dòng)終端推送各種業(yè)務(wù)信息,從而更好地為用戶提供各種業(yè)務(wù)服務(wù)。
與前述地理圍欄類別的獲取方法的實(shí)施例相對(duì)應(yīng),本申請(qǐng)還提供了地理圍欄類別的獲取裝置的實(shí)施例。
本申請(qǐng)地理圍欄類別的獲取裝置的實(shí)施例可以應(yīng)用在業(yè)務(wù)設(shè)備上。裝置實(shí)施例可以通過軟件實(shí)現(xiàn),也可以通過硬件或者軟硬件結(jié)合的方式實(shí)現(xiàn)。以軟件實(shí)現(xiàn)為例,作為一個(gè)邏輯意義上的裝置,是通過其所在業(yè)務(wù)設(shè)備的處理器將非易失性存儲(chǔ)器中對(duì)應(yīng)的計(jì)算機(jī)程序指令讀取到內(nèi)存中運(yùn)行形成的。從硬件層面而言,如圖7所示,為本申請(qǐng)地理圍欄類別的獲取裝置所在業(yè)務(wù)設(shè)備的一種硬件結(jié)構(gòu)圖,除了圖7所示的處理器、內(nèi)存、網(wǎng)絡(luò)接口、以及非易失性存儲(chǔ)器之外,實(shí)施例中裝置所在的業(yè)務(wù)設(shè)備通常根據(jù)該設(shè)備的實(shí)際功能,還可以包括其他硬件,如對(duì)于終端來說,可能包括攝像頭、觸摸屏、通信組件等,對(duì)于服務(wù)器來說,可能包括負(fù)責(zé)處理報(bào)文的轉(zhuǎn)發(fā)芯片等等。
圖8是本申請(qǐng)一示例性實(shí)施例示出的一種地理圍欄類別的獲取裝置的框圖,該裝置可應(yīng)用于業(yè)務(wù)設(shè)備上,如圖8所示,該地理圍欄類別的獲取裝置包括:數(shù)據(jù)獲得模塊81、映射模塊82、集合篩選模塊83和類別獲取模塊84。
數(shù)據(jù)獲得模塊81用于獲得當(dāng)前測(cè)繪圍欄數(shù)據(jù),當(dāng)前測(cè)繪圍欄數(shù)據(jù)包括當(dāng)前測(cè)繪圍欄名稱、當(dāng)前測(cè)繪圍欄類別和當(dāng)前測(cè)繪圍欄邊界。
映射模塊82用于將數(shù)據(jù)獲得模塊81獲得的當(dāng)前測(cè)繪圍欄類別映射到興趣點(diǎn)poi類別。
集合篩選模塊83用于分別根據(jù)映射模塊82映射到的當(dāng)前測(cè)繪圍欄類別映射結(jié)果、數(shù)據(jù)獲得模塊81獲得的當(dāng)前測(cè)繪圍欄名稱和當(dāng)前測(cè)繪圍欄邊界,篩選出與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合。
類別獲取模塊84用于獲取集合篩選模塊83篩選出的poi集合中poi數(shù)量最多且poi名稱與當(dāng)前測(cè)繪圍欄名稱的文本相似度之和最大的poi類別,并將獲取的poi類別作為當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別。
在一個(gè)可選的實(shí)現(xiàn)方式中:
數(shù)據(jù)獲得模塊81可以包括(圖8中未示出):
邊界集合獲得子模塊,用于獲得與當(dāng)前測(cè)繪圍欄名稱和當(dāng)前測(cè)繪圍欄類別均相同的圍欄分片對(duì)應(yīng)的圍欄邊界集合,圍欄分片是指構(gòu)成測(cè)繪圍欄的子區(qū)域;
合并子模塊,用于基于邊界集合獲得子模塊獲得的圍欄邊界集合進(jìn)行圍欄分片合并,得到當(dāng)前測(cè)繪圍欄數(shù)據(jù)。
在另一個(gè)可選的實(shí)現(xiàn)方式中:
poi類別包括第一級(jí)類別、第二級(jí)類別和第三級(jí)類別,映射模塊82可以包括(圖8中未示出):
匹配子模塊,用于將當(dāng)前測(cè)繪圍欄類別名稱依次與poi的三級(jí)類別名稱進(jìn)行匹配;
第一映射子模塊,用于若匹配子模塊的匹配結(jié)果為匹配成功,則將當(dāng)前測(cè)繪圍欄類別映射到匹配成功的poi類別名稱對(duì)應(yīng)的poi類別;
第二映射子模塊,用于若匹配子模塊的匹配結(jié)果為匹配失敗,則接收根據(jù)預(yù)設(shè)的人工映射規(guī)則確定的poi類別,并將當(dāng)前測(cè)繪圍欄類別映射到確定的poi類別。
在另一個(gè)可選的實(shí)現(xiàn)方式中:
集合篩選模塊83可以包括(圖8中未示出):
第一篩選子模塊,用于從當(dāng)前測(cè)繪圍欄中篩選出所有與當(dāng)前測(cè)繪圍欄類別映射結(jié)果相關(guān)的第一poi集合;
第二篩選子模塊,用于從第一篩選子模塊篩選出的第一poi集合中篩選出位于當(dāng)前測(cè)繪圍欄邊界范圍內(nèi)的第二poi集合;
計(jì)算確定子模塊,用于計(jì)算第二篩選子模塊篩選出的第二poi集合中的poi名稱與當(dāng)前測(cè)繪圍欄名稱的文本相似度,并將文本相似度大于預(yù)設(shè)閾值的poi集合作為與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合。
在另一個(gè)可選的實(shí)現(xiàn)方式中:
poi類別可以包括第三級(jí)類別,類別獲取模塊84可以包括(圖8中未示 出):
統(tǒng)計(jì)子模塊,用于統(tǒng)計(jì)poi集合中屬于每個(gè)第三級(jí)類別的poi數(shù)量;
獲取刪除子模塊,用于獲取統(tǒng)計(jì)子模塊統(tǒng)計(jì)出的poi數(shù)量最多的poi對(duì)應(yīng)的第三級(jí)類別,并從poi集合中刪除不屬于獲取的第三級(jí)類別的poi;
計(jì)算子模塊,用于分別計(jì)算獲取刪除子模塊在刪除不屬于獲取的第三級(jí)類別的poi之后的當(dāng)前poi集合中屬于每個(gè)第三級(jí)類別的所有poi名稱與當(dāng)前測(cè)繪圍欄名稱的文本相似度之和;
確定子模塊,用于將與文本相似度之和的最大值相對(duì)應(yīng)的第三級(jí)類別作為當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別。
在另一個(gè)可選的實(shí)現(xiàn)方式中:
合并子模塊可以包括(圖8中未示出):
獲取單元,用于從圍欄邊界集合中獲取第一個(gè)圍欄邊界和第j個(gè)圍欄邊界,j的初始值為2;
判斷處理單元,用于判斷第一個(gè)圍欄邊界和第j個(gè)圍欄邊界是否共邊,若二者共邊,則將二者合并為第一個(gè)圍欄邊界,從圍欄邊界集合中刪除第j個(gè)圍欄邊界,并更新當(dāng)前圍欄邊界集合中剩余圍欄邊界的標(biāo)號(hào);若二者不共邊,則將j累加一;
判斷單元,用于判斷j是否大于當(dāng)前圍欄邊界集合中的圍欄邊界數(shù)量;
確定判斷處理單元,用于若j不大于圍欄邊界數(shù)量,則判斷圍欄邊界集合中的圍欄邊界數(shù)量是否等于一,若不等于一,則通過判斷處理單元執(zhí)行判斷第一個(gè)圍欄邊界和第j個(gè)圍欄邊界是否共邊的操作,若等于一,則輸出當(dāng)前圍欄邊界集合中的第一個(gè)圍欄邊界及其對(duì)應(yīng)的圍欄名稱和圍欄類別;
確定處理單元,用于若j大于圍欄邊界數(shù)量,則輸出當(dāng)前圍欄邊界集合中的第一個(gè)圍欄邊界及其對(duì)應(yīng)的圍欄名稱和圍欄類別,從當(dāng)前圍欄邊界集合中刪除第一個(gè)圍欄邊界,并更新圍欄邊界集合中剩余圍欄邊界的標(biāo)號(hào),然后通過確定判斷處理單元執(zhí)行判斷圍欄邊界集合中的圍欄邊界數(shù)量是否等于一的操作。
在另一個(gè)可選的實(shí)現(xiàn)方式中:
如圖9所示,該裝置還可以包括:推送模塊85。
推送模塊85,用于在類別獲取模塊84將獲取的poi類別作為當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別之后,根據(jù)當(dāng)前測(cè)繪圍欄數(shù)據(jù)和當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別,向移動(dòng)終端推送業(yè)務(wù)信息,業(yè)務(wù)信息包括推薦信息和位置信息中的至少一種。
上述裝置中各個(gè)單元的功能和作用的實(shí)現(xiàn)過程具體詳見上述方法中對(duì)應(yīng)步驟的實(shí)現(xiàn)過程,在此不再贅述。
對(duì)于裝置實(shí)施例而言,由于其基本對(duì)應(yīng)于方法實(shí)施例,所以相關(guān)之處參見方法實(shí)施例的部分說明即可。以上所描述的裝置實(shí)施例僅僅是示意性的,其中作為分離部件說明的單元可以是或者也可以不是物理上分開的,作為單元顯示的部件可以是或者也可以不是物理單元,即可以位于一個(gè)地方,或者也可以分布到多個(gè)網(wǎng)絡(luò)單元上??梢愿鶕?jù)實(shí)際的需要選擇其中的部分或者全部模塊來實(shí)現(xiàn)本申請(qǐng)方案的目的。本領(lǐng)域普通技術(shù)人員在不付出創(chuàng)造性勞動(dòng)的情況下,即可以理解并實(shí)施。
上述地理圍欄類別的獲取裝置,通過獲得當(dāng)前測(cè)繪圍欄數(shù)據(jù),并將當(dāng)前測(cè)繪圍欄數(shù)據(jù)中的當(dāng)前測(cè)繪圍欄類別映射到poi類別,然后分別根據(jù)當(dāng)前測(cè)繪圍欄類別映射結(jié)果、當(dāng)前測(cè)繪圍欄名稱和當(dāng)前測(cè)繪圍欄邊界,篩選出與當(dāng)前測(cè)繪圍欄相關(guān)聯(lián)的poi集合,最后獲取poi集合中poi數(shù)量最多且poi名稱與當(dāng)前測(cè)繪圍欄名稱的文本相似度之和最大的poi類別作為當(dāng)前測(cè)繪圍欄對(duì)應(yīng)的地理圍欄類別,實(shí)現(xiàn)過程所需時(shí)間短且準(zhǔn)確性高。
本領(lǐng)域技術(shù)人員在考慮說明書及實(shí)踐這里公開的發(fā)明后,將容易想到本申請(qǐng)的其它實(shí)施方案。本申請(qǐng)旨在涵蓋本申請(qǐng)的任何變型、用途或者適應(yīng)性變化,這些變型、用途或者適應(yīng)性變化遵循本申請(qǐng)的一般性原理并包括本申請(qǐng)未公開的本技術(shù)領(lǐng)域中的公知常識(shí)或慣用技術(shù)手段。說明書和實(shí)施例僅被視為示例性的,本申請(qǐng)的真正范圍和精神由下面的權(quán)利要求指出。
應(yīng)當(dāng)理解的是,本申請(qǐng)并不局限于上面已經(jīng)描述并在附圖中示出的精確 結(jié)構(gòu),并且可以在不脫離其范圍進(jìn)行各種修改和改變。本申請(qǐng)的范圍僅由所附的權(quán)利要求來限制。