本發(fā)明涉及無(wú)線通訊領(lǐng)域,尤其涉及一種位置標(biāo)記方法。
背景技術(shù):
隨著智能設(shè)備的普及、人類生活半徑的擴(kuò)大,使得用戶需要更詳細(xì)、更準(zhǔn)確的位置信息,一些相關(guān)的應(yīng)用,比如室內(nèi)導(dǎo)航、內(nèi)容推薦等類型的應(yīng)用也都需要精確的位置信息標(biāo)記。
現(xiàn)有的位置標(biāo)記不能細(xì)粒度地描述該位置的功能,主要體現(xiàn)在以下方面:(1)傳統(tǒng)的位置標(biāo)記主要根據(jù)用戶行為進(jìn)行分析,通常是基于在線社交網(wǎng)絡(luò)用戶的定位數(shù)據(jù)來(lái)分析某個(gè)位置的用戶行為,從而根據(jù)用戶行為特點(diǎn)來(lái)判斷某個(gè)位置的功能。這種方式的數(shù)據(jù)量有限,因?yàn)橛脩舨⒉豢偸菚?huì)定位自己所在的位置,從而導(dǎo)致能提取出的用戶行為不明顯或者缺失;(2)傳統(tǒng)位置標(biāo)記也會(huì)根據(jù)地理環(huán)境來(lái)做出判斷,但這些方法都只考慮地理位置相似性或者只考慮用戶行為相似性,使得位置標(biāo)記不夠準(zhǔn)確;(3)標(biāo)記的地理范圍通常比較大,不能精細(xì)的標(biāo)記一個(gè)位置,比如一個(gè)商場(chǎng)中的某一層的某一個(gè)店鋪。
以上背景技術(shù)內(nèi)容的公開僅用于輔助理解本發(fā)明的構(gòu)思及技術(shù)方案,其并不必然屬于本專利申請(qǐng)的現(xiàn)有技術(shù),在沒有明確的證據(jù)表明上述內(nèi)容在本專利申請(qǐng)的申請(qǐng)日已經(jīng)公開的情況下,上述背景技術(shù)不應(yīng)當(dāng)用于評(píng)價(jià)本申請(qǐng)的新穎性和創(chuàng)造性。
技術(shù)實(shí)現(xiàn)要素:
為解決上述技術(shù)問題,本發(fā)明提出一種位置標(biāo)記方法,實(shí)現(xiàn)精確地對(duì)位置進(jìn)行標(biāo)記。
為了達(dá)到上述目的,本發(fā)明采用以下技術(shù)方案:
本發(fā)明公開了一種位置標(biāo)記方法,包括以下步驟:
s1:獲取待標(biāo)記位置包含的所有無(wú)線ap,所有無(wú)線ap包括未知類型的無(wú)線ap和已知類型的無(wú)線ap;
s2:分別提取各個(gè)無(wú)線ap的地理鄰域特征;
s3:分別提取各個(gè)無(wú)線ap的用戶行為特征;
s4:根據(jù)各個(gè)無(wú)線ap的地理鄰域特征和各個(gè)無(wú)線ap的用戶行為特征,預(yù)測(cè)得到未知類型的無(wú)線ap的類型;
s5:根據(jù)所有無(wú)線ap的類型來(lái)對(duì)所述待標(biāo)記位置進(jìn)行標(biāo)記。
優(yōu)選地,步驟s2中無(wú)線ap的地理鄰域特征是指在無(wú)線ap所在的預(yù)設(shè)區(qū)域內(nèi)的所有已知類型的無(wú)線ap的類型。
優(yōu)選地,其中無(wú)線ap所在的預(yù)設(shè)區(qū)域是指以所述無(wú)線ap為中心,100~200米為半徑的區(qū)域內(nèi)。
優(yōu)選地,步驟s3中無(wú)線ap的用戶行為特征是指訪問過(guò)該無(wú)線ap的所有用戶訪問過(guò)的所有已知類型的無(wú)線ap的類型。
優(yōu)選地,步驟s3具體包括:首先對(duì)所有用戶在不同時(shí)間段內(nèi)訪問過(guò)的已知類型的無(wú)線ap的類型進(jìn)行統(tǒng)計(jì),得到每個(gè)用戶的行為特征;然后提取訪問過(guò)某一無(wú)線ap的所有用戶,將訪問該無(wú)線ap的所有用戶的行為特征作為該無(wú)線ap的用戶行為特征。
優(yōu)選地,其中的不同時(shí)間段是以每?jī)尚r(shí)為一段,將時(shí)間劃分為不同時(shí)間段。
優(yōu)選地,步驟s4具體包括:將無(wú)線ap的地理鄰域特征和無(wú)線ap的用戶行為特征分別賦予預(yù)設(shè)的權(quán)重作為輸入特征,基于機(jī)器學(xué)習(xí)方法,通過(guò)學(xué)習(xí)已知類型的無(wú)線ap的特征來(lái)預(yù)測(cè)得到未知類型的無(wú)線ap的類型。
優(yōu)選地,基于所述機(jī)器學(xué)習(xí)方法具體為基于決策樹的adaboost算法。
與現(xiàn)有技術(shù)相比,本發(fā)明的有益效果在于:本發(fā)明公開了一種位置標(biāo)記方法,通過(guò)判斷該位置區(qū)域內(nèi)的無(wú)線ap的類型來(lái)詳細(xì)了解該位置的功能,無(wú)線ap的數(shù)據(jù)集比較密集,從而使得從中提取出來(lái)的用戶行為特征具有很強(qiáng)的代表性,位置標(biāo)記精確細(xì)致,并且充分利用無(wú)線ap的地理鄰域特征,提升準(zhǔn)確率;其中通過(guò)地理鄰域特征和用戶行為特征的結(jié)合,保證了無(wú)線ap類型的預(yù)測(cè)的準(zhǔn)確性,從而進(jìn)一步確保了位置標(biāo)記的準(zhǔn)確性。
在進(jìn)一步的方案中,本發(fā)明進(jìn)一步采用機(jī)器學(xué)習(xí)方法對(duì)無(wú)線ap的類型進(jìn)行預(yù)測(cè),并采用基于決策樹的adaboost算法,將該算法結(jié)合無(wú)線ap的地理鄰域特征和用戶行為特征,大大提升無(wú)線ap預(yù)測(cè)的準(zhǔn)確率。
附圖說(shuō)明
圖1是本發(fā)明優(yōu)選實(shí)施例的位置標(biāo)記方法的流程示意圖;
圖2是本發(fā)明優(yōu)選實(shí)施例的位置標(biāo)記方法中的機(jī)器學(xué)習(xí)方法的訓(xùn)練流程示意圖。
具體實(shí)施方式
下面對(duì)照附圖并結(jié)合優(yōu)選的實(shí)施方式對(duì)本發(fā)明作進(jìn)一步說(shuō)明。
如圖1所示,本發(fā)明優(yōu)選實(shí)施例公開了一種位置標(biāo)記方法,包括以下步驟:
s1:獲取待標(biāo)記位置包含的所有無(wú)線ap(acesspoint,接入點(diǎn)),所有無(wú)線ap包括未知類型的無(wú)線ap和已知類型的無(wú)線ap;
s2:分別提取各個(gè)無(wú)線ap的地理鄰域特征;
具體地,無(wú)線ap的地理鄰域特征是指在無(wú)線ap所在的預(yù)設(shè)區(qū)域內(nèi)的所有已知類型的無(wú)線ap的類型,其中無(wú)線ap所在的預(yù)設(shè)區(qū)域是指以所述無(wú)線ap為中心,100~200米為半徑的區(qū)域內(nèi),即處于無(wú)線ap的信號(hào)覆蓋范圍內(nèi)。
s3:分別提取各個(gè)無(wú)線ap的用戶行為特征;
其中無(wú)線ap的用戶行為特征是指訪問過(guò)該無(wú)線ap的所有用戶訪問過(guò)的所有已知類型的無(wú)線ap的類型;具體地,首先對(duì)所有用戶在不同時(shí)間段內(nèi)訪問過(guò)的已知類型的無(wú)線ap的類型進(jìn)行統(tǒng)計(jì),得到每個(gè)用戶的行為特征,然后提取訪問某一無(wú)線ap的所有用戶,將訪問該無(wú)線ap的所有用戶的行為特征作為該無(wú)線ap的用戶行為特征;其中不同時(shí)間段是以每?jī)尚r(shí)為一段,將時(shí)間劃分為不同時(shí)間段,以對(duì)所有用戶在每段不同時(shí)間段內(nèi)訪問過(guò)的已知類型的無(wú)線ap的類型進(jìn)行統(tǒng)計(jì)。
s4:根據(jù)各個(gè)無(wú)線ap的地理鄰域特征和各個(gè)無(wú)線ap的用戶行為特征的相似性,預(yù)測(cè)得到未知類型的無(wú)線ap的類型;
具體地,將無(wú)線ap的地理鄰域特征和無(wú)線ap的用戶行為特征分別賦予預(yù)設(shè)的權(quán)重作為輸入特征,基于機(jī)器學(xué)習(xí)方法,通過(guò)學(xué)習(xí)已知類型的無(wú)線ap的特征來(lái)預(yù)測(cè)得到未知類型的無(wú)線ap的類型;其中,基于機(jī)器學(xué)習(xí)方法為基于決策樹的adaboost算法。
在本發(fā)明實(shí)施例中,需要采用已知類型的無(wú)線ap來(lái)提前對(duì)adaboost算法進(jìn)行訓(xùn)練,結(jié)合圖2所示,訓(xùn)練的具體步驟為:
a1:數(shù)據(jù)收集步驟:首先收集poi(pointofinternet,信息點(diǎn))位置數(shù)據(jù)集和wi-fi連接數(shù)據(jù)集,將兩類數(shù)據(jù)集進(jìn)行數(shù)據(jù)整合,并進(jìn)行清洗數(shù)據(jù)等數(shù)據(jù)預(yù)處理操作,然后分為兩個(gè)子數(shù)據(jù)集,其中一個(gè)子數(shù)據(jù)集為已知類型的無(wú)線ap,另一個(gè)子數(shù)據(jù)集為未知類型的無(wú)線ap,其中在數(shù)據(jù)集中還包括經(jīng)緯度(無(wú)線ap的地理位置)、訪問用戶(訪問過(guò)無(wú)線ap的所有用戶)、訪問時(shí)間(對(duì)應(yīng)用戶訪問的時(shí)間)等信息;其中將已知類型的無(wú)線ap的子數(shù)據(jù)集用于訓(xùn)練,未知類型的無(wú)線ap的子數(shù)據(jù)集用于測(cè)試。
a2:特征提取步驟:分別從兩個(gè)子數(shù)據(jù)集中提取特征:包括無(wú)線ap的用戶訪問特征和地理鄰域特征,提取步驟同上述步驟s2和s3。
a3:類型預(yù)測(cè)步驟:采用基于決策樹的adaboost算法進(jìn)行訓(xùn)練,然后在用于測(cè)試的子數(shù)據(jù)集中進(jìn)行預(yù)測(cè),輸出最后的無(wú)線ap類型。其中在針對(duì)無(wú)線ap的類型預(yù)測(cè),可能會(huì)有多個(gè)類型的可能性,如(類型1,概率1)、(類型2,概率2)……最后選取概率最大的對(duì)應(yīng)的類型作為該無(wú)線ap的最終預(yù)測(cè)的類型。
s5:根據(jù)所有無(wú)線ap的類型來(lái)對(duì)所述待標(biāo)記位置進(jìn)行標(biāo)記,即位置標(biāo)記就是將這個(gè)位置內(nèi)的每個(gè)無(wú)線ap類型顯示出來(lái)即可。
本發(fā)明優(yōu)選實(shí)施例可以應(yīng)用于未知的地理區(qū)域,通過(guò)判斷該區(qū)域內(nèi)的無(wú)線ap類型,用戶可以詳細(xì)地連接該區(qū)域的功能。根據(jù)本發(fā)明優(yōu)選實(shí)施例,當(dāng)用戶想要了解某個(gè)區(qū)域的功能,分類系統(tǒng)首先獲取該區(qū)域內(nèi)的所有的無(wú)線ap及其相關(guān)信息;然后對(duì)每個(gè)無(wú)線ap提取其地理鄰域特征,即該無(wú)線ap周圍的無(wú)線ap類型分布,再提取每個(gè)無(wú)線ap的用戶行為特征,即訪問過(guò)該無(wú)線ap的用戶在不同時(shí)間段內(nèi)訪問過(guò)的無(wú)線ap的類型分布;再結(jié)合無(wú)線ap的地理鄰域特征和無(wú)線ap的用戶行為特征,分別賦予相應(yīng)的權(quán)重,利用機(jī)器學(xué)習(xí)方法,得出每個(gè)無(wú)線ap屬于不同類型的概率,取最大概率對(duì)應(yīng)的類型,即為相應(yīng)的無(wú)線ap的類型;最后根據(jù)該區(qū)域內(nèi)所有無(wú)線ap來(lái)綜合標(biāo)記該位置區(qū)域的功能,如娛樂、教育、購(gòu)物等等。
本發(fā)明優(yōu)選實(shí)施例的位置標(biāo)記方法基于無(wú)線ap的數(shù)據(jù)集,結(jié)合無(wú)線ap的地理鄰域特征和用戶行為特征來(lái)預(yù)測(cè)未知類型的無(wú)線ap的類型,并通過(guò)位置所在區(qū)域內(nèi)的所有無(wú)線ap的類型來(lái)對(duì)該位置進(jìn)行標(biāo)記,描述精確細(xì)致,保證了位置標(biāo)記的準(zhǔn)確性。
以上內(nèi)容是結(jié)合具體的優(yōu)選實(shí)施方式對(duì)本發(fā)明所作的進(jìn)一步詳細(xì)說(shuō)明,不能認(rèn)定本發(fā)明的具體實(shí)施只局限于這些說(shuō)明。對(duì)于本發(fā)明所屬技術(shù)領(lǐng)域的技術(shù)人員來(lái)說(shuō),在不脫離本發(fā)明構(gòu)思的前提下,還可以做出若干等同替代或明顯變型,而且性能或用途相同,都應(yīng)當(dāng)視為屬于本發(fā)明的保護(hù)范圍。