欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

基于地理位置的社交網(wǎng)絡(luò)事件分析方法及系統(tǒng)的制作方法

文檔序號:8299141閱讀:450來源:國知局
基于地理位置的社交網(wǎng)絡(luò)事件分析方法及系統(tǒng)的制作方法
【技術(shù)領(lǐng)域】
[0001] 本發(fā)明涉及數(shù)據(jù)挖掘領(lǐng)域,尤其涉及一種基于地理位置的社交網(wǎng)絡(luò)事件分析方法 及系統(tǒng)。
【背景技術(shù)】
[0002] 社交網(wǎng)絡(luò)的社會化特性及迅速、及時(shí)的傳播,吸引了大量對信息實(shí)時(shí)性有高需求 的用戶,使得世界上的每一個(gè)人都能夠成為信息源,并使之在全球傳播,這就使得社交網(wǎng)絡(luò) 事件本身所承載的信息量大大增加。社交網(wǎng)絡(luò)事件集合了海量的新聞、事件和信息,并且每 天都在更新,每天都在流傳,并對現(xiàn)實(shí)的社會產(chǎn)生巨大的影響。尤其是在突發(fā)事件的信息傳 播上,更是超越了傳統(tǒng)媒體,成為了信息快速傳播的渠道。社交網(wǎng)絡(luò)上的信息不僅發(fā)布及 時(shí),而且也是現(xiàn)實(shí)社會生活的縮影,挖掘社交網(wǎng)絡(luò)事件中的信息有利于從不同角度分析現(xiàn) 實(shí)世界的情況。
[0003] 隨著移動(dòng)互聯(lián)網(wǎng)的爆炸性發(fā)展,具有定位功能的設(shè)備也越來越普及,用戶可以方 便地獲取到更加精確的地理位置信息,這使得越來越多的數(shù)據(jù)帶有了地理的屬性。同時(shí),在 城市規(guī)劃、旅游業(yè)、安全等領(lǐng)域應(yīng)用中,對這類帶有地理位置信息的數(shù)據(jù)的分析需求也越來 越旺盛。
[0004] 以微博為代表的社交網(wǎng)絡(luò)已成為中國發(fā)展最快的互聯(lián)網(wǎng)應(yīng)用,是一個(gè)基于用戶關(guān) 系的信息分享、傳播以及獲取信息的平臺。目前在發(fā)布信息的同時(shí)可以對地理位置進(jìn)行標(biāo) 記,但是這些地理位置相對孤立,即只和本條微博存在聯(lián)系。盡管海量的微博信息之間可通 過評論、轉(zhuǎn)發(fā)、好友發(fā)生聯(lián)系,但其無法在真實(shí)的空間范圍上發(fā)生聯(lián)系,缺乏地理位置服務(wù) (LocationBasedService,簡稱LBS)相關(guān)因素。

【發(fā)明內(nèi)容】

[0005] 本發(fā)明提供一種基于地理位置的社交網(wǎng)絡(luò)事件分析方法及系統(tǒng),用于基于地理位 置分析相關(guān)的社交網(wǎng)絡(luò)事件。
[0006] 本發(fā)明的第一個(gè)方面是提供一種基于地理位置的社交網(wǎng)絡(luò)事件分析方法,包括:
[0007] 對每個(gè)社交網(wǎng)絡(luò)數(shù)據(jù)文本進(jìn)行分詞處理,獲得所述社交網(wǎng)絡(luò)數(shù)據(jù)文本的詞;
[0008] 建立所述社交網(wǎng)絡(luò)數(shù)據(jù)文本對應(yīng)的地理位置與所述社交網(wǎng)絡(luò)數(shù)據(jù)文本的映射關(guān) 系,所述社交網(wǎng)絡(luò)數(shù)據(jù)文本對應(yīng)的地理位置為所述社交網(wǎng)絡(luò)數(shù)據(jù)文本的詞中,與地理位置 相關(guān)的詞;
[0009] 根據(jù)各社交網(wǎng)絡(luò)數(shù)據(jù)文本對應(yīng)的地理位置,確定預(yù)設(shè)的各目標(biāo)地理位置對應(yīng)的社 交網(wǎng)絡(luò)數(shù)據(jù)文本;
[0010] 針對每個(gè)目標(biāo)地理位置,對所述目標(biāo)地理位置對應(yīng)的社交網(wǎng)絡(luò)數(shù)據(jù)文本的詞進(jìn)行 權(quán)重計(jì)算,獲得并將所述目標(biāo)地理位置對應(yīng)的社交網(wǎng)絡(luò)數(shù)據(jù)文本的關(guān)鍵詞,作為所述目標(biāo) 地理位置的熱門事件進(jìn)行推送。
[0011] 本發(fā)明的另一個(gè)方面是提供一種基于地理位置的社交網(wǎng)絡(luò)事件分析系統(tǒng),包括:
[0012] 分詞模塊,用于對每個(gè)社交網(wǎng)絡(luò)數(shù)據(jù)文本進(jìn)行分詞處理,獲得所述社交網(wǎng)絡(luò)數(shù)據(jù) 文本的詞;
[0013] 地理位置獲取模塊,用于建立所述社交網(wǎng)絡(luò)數(shù)據(jù)文本對應(yīng)的地理位置與所述社交 網(wǎng)絡(luò)數(shù)據(jù)文本的映射關(guān)系,所述社交網(wǎng)絡(luò)數(shù)據(jù)文本對應(yīng)的地理位置為所述社交網(wǎng)絡(luò)數(shù)據(jù)文 本的詞中,與地理位置相關(guān)的詞;
[0014] 地理位置分析模塊,用于根據(jù)各社交網(wǎng)絡(luò)數(shù)據(jù)文本對應(yīng)的地理位置,確定預(yù)設(shè)的 各目標(biāo)地理位置對應(yīng)的社交網(wǎng)絡(luò)數(shù)據(jù)文本;
[0015] 事件分析模塊,用于針對每個(gè)目標(biāo)地理位置,對所述目標(biāo)地理位置對應(yīng)的社交網(wǎng) 絡(luò)數(shù)據(jù)文本的詞進(jìn)行權(quán)重計(jì)算,獲得并將所述目標(biāo)地理位置對應(yīng)的社交網(wǎng)絡(luò)數(shù)據(jù)文本的關(guān) 鍵詞,作為所述目標(biāo)地理位置的熱門事件進(jìn)行推送。
[0016] 本發(fā)明提供的基于地理位置的社交網(wǎng)絡(luò)事件分析方法及系統(tǒng),通過對社交網(wǎng)絡(luò)數(shù) 據(jù)文本進(jìn)行研宄,分析出與地理位置關(guān)聯(lián)的社交網(wǎng)絡(luò)數(shù)據(jù)文本,并將各地理位置對應(yīng)的社 交網(wǎng)絡(luò)數(shù)據(jù)文本的關(guān)鍵詞,作為該地理位置的熱門事件進(jìn)行推送,可以幫助用戶直觀的獲 取到地理位置相關(guān)的熱門事件。
【附圖說明】
[0017] 圖1為本發(fā)明實(shí)施例一提供的基于地理位置的社交網(wǎng)絡(luò)事件分析方法的流程示 意圖;
[0018] 圖2為本發(fā)明實(shí)施例二提供的基于地理位置的社交網(wǎng)絡(luò)事件分析系統(tǒng)的結(jié)構(gòu)示 意圖。
【具體實(shí)施方式】
[0019] 為使本發(fā)明實(shí)施例的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚,下面將結(jié)合本發(fā)明實(shí)施例 中的附圖,對本發(fā)明實(shí)施例中的技術(shù)方案進(jìn)行清楚、完整地描述。
[0020] 圖1為本發(fā)明實(shí)施例一提供的基于地理位置的社交網(wǎng)絡(luò)事件分析方法的流程示 意圖,如圖1所示,所述方法包括:
[0021] 101、對每個(gè)社交網(wǎng)絡(luò)數(shù)據(jù)文本進(jìn)行分詞處理,獲得所述社交網(wǎng)絡(luò)數(shù)據(jù)文本的詞。
[0022] 實(shí)際應(yīng)用中,可以先從大數(shù)據(jù)分析平臺獲取一定時(shí)間段內(nèi)、一定數(shù)量的社交網(wǎng)絡(luò) 數(shù)據(jù)文本,例如,微博,則相應(yīng)的,在101之前,所述方法還可以包括:獲取在預(yù)設(shè)時(shí)間段內(nèi) 發(fā)布的預(yù)設(shè)數(shù)量的所述社交網(wǎng)絡(luò)數(shù)據(jù)文本。
[0023] 具體的,本實(shí)施例中的所述社交網(wǎng)絡(luò)數(shù)據(jù)文本可以來源于大數(shù)據(jù)分析平臺 ElasticSearch搜索引擎,以微博為例,所有的微博均可為原創(chuàng)微博,不包括用戶轉(zhuǎn)發(fā)的微 博。
[0024] 相應(yīng)的,獲取到一定時(shí)間段內(nèi)、一定數(shù)量的社交網(wǎng)絡(luò)數(shù)據(jù)文本后,需要對這些社交 網(wǎng)絡(luò)數(shù)據(jù)文本進(jìn)行預(yù)處理,而預(yù)處理則主要是對社交網(wǎng)絡(luò)數(shù)據(jù)文本進(jìn)行分詞。仍以微博為 例,則需對微博文本信息進(jìn)行分詞處理,具體的,這里的文本信息不包括用戶發(fā)布的圖片等 信息。
[0025] 實(shí)際應(yīng)用中,所述分詞處理可以通過多種實(shí)施方式實(shí)現(xiàn),例如,可以利用分詞器對 社交網(wǎng)絡(luò)數(shù)據(jù)文本進(jìn)行分詞處理??蛇x的,101具體可以包括:利用IKAnalyzer分詞器,對 所述社交網(wǎng)絡(luò)數(shù)據(jù)文本進(jìn)行分詞處理。具體的,以對微博文本進(jìn)行分詞為例,分詞器首先加 載詞典,分析微博文本,截取一個(gè)token,搜索關(guān)鍵詞采用從最大詞到最小詞層層迭代檢索 方式切分,到詞典中檢索該搜索詞中最大分割詞,以此類推繼續(xù)進(jìn)行迭代檢索方式切分直 到結(jié)束。
[0026] 102、建立所述社交網(wǎng)絡(luò)數(shù)據(jù)文本對應(yīng)的地理位置與所述社交網(wǎng)絡(luò)數(shù)據(jù)文本的映 射關(guān)系,所述社交網(wǎng)絡(luò)數(shù)據(jù)文本對應(yīng)的地理位置為所述社交網(wǎng)絡(luò)數(shù)據(jù)文本的詞中,與地理 位置相關(guān)的詞。
[0027] 實(shí)際應(yīng)用中,可以通過從社交網(wǎng)絡(luò)數(shù)據(jù)文本的各詞中,篩選出與地理位置相關(guān)的 詞,獲得所述社交網(wǎng)絡(luò)數(shù)據(jù)文本對應(yīng)的地理位置。具體的,可以利用搜狗的三級行政區(qū)劃地 名詞典進(jìn)行篩選,相應(yīng)的,以微博為例,如果檢測到微博文本中有上述詞典中的地理位置信 息,就結(jié)合該微博的上下文,提取出該地理位置信息。相應(yīng)的,在獲得所述社交網(wǎng)絡(luò)數(shù)據(jù)文 本對應(yīng)的地理位置后,把所述社交網(wǎng)絡(luò)數(shù)據(jù)文本和這些與地理位置相關(guān)的詞關(guān)聯(lián)起來。具 體的,可以采用命名實(shí)體識別的地理文本分析方法,利用搜狗的三級行政區(qū)劃地名詞典,如 果微博中出現(xiàn)有行政區(qū)劃地名詞典中的地理位置信息,就結(jié)合微博的上下文提取該地理位 置信息,并和該微博關(guān)聯(lián)。
[0028] 可選的,為了節(jié)省處理資源,提高處理效率,對于不包含與地理位置的詞的社交網(wǎng) 絡(luò)數(shù)據(jù)文本,則確定該社交網(wǎng)絡(luò)數(shù)據(jù)文本不含地理位置信息,相應(yīng)的,可將其丟棄不作處 理。
[0029] 103、根據(jù)各社交網(wǎng)絡(luò)數(shù)據(jù)文本對應(yīng)的地理位置,確定預(yù)設(shè)的各目標(biāo)地理位置對應(yīng) 的社交網(wǎng)絡(luò)數(shù)據(jù)文本。
[0030] 實(shí)際應(yīng)用中,根據(jù)各社交網(wǎng)絡(luò)數(shù)據(jù)文本與地理位置的映射關(guān)系,可以確定出各目 標(biāo)地理位置對應(yīng)的社交網(wǎng)絡(luò)數(shù)據(jù)文本。
[0031] 具體的,所述各目標(biāo)地理位置可以根據(jù)實(shí)際需要確定,例如,可以以可視化地圖中 的各地理位置為對象,進(jìn)行熱門事件分析,則相應(yīng)的,在103之前,所述方法還可以包括:將 可視化地圖中的地理位置作為所述目標(biāo)地理位置。舉例來說,地理位置分析的可視化可以 基于百度地圖API實(shí)現(xiàn)的Web地圖應(yīng)用。
[0032] 104、針對每個(gè)目標(biāo)地理位置,對所述目標(biāo)地理位置對應(yīng)的社交網(wǎng)絡(luò)數(shù)據(jù)文本的詞 進(jìn)行權(quán)重計(jì)算,獲得并將所述目標(biāo)地理位置對應(yīng)的社交網(wǎng)絡(luò)數(shù)據(jù)文本的關(guān)鍵詞,作為所述 目標(biāo)地理位置的熱門事件進(jìn)行推送。
[0033] 具體的,在確定各目標(biāo)地理位置對應(yīng)的社交網(wǎng)絡(luò)數(shù)據(jù)文本后,可以采用TF-IDF方 法對這些社交網(wǎng)絡(luò)數(shù)據(jù)文本的每個(gè)詞進(jìn)行權(quán)重計(jì)算,根
當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
察哈| 永登县| 石嘴山市| 和平区| 平罗县| 宁安市| 拉萨市| 翼城县| 肥东县| 商都县| 武安市| 黔南| 河津市| 三台县| 礼泉县| 大石桥市| 邵阳市| 铁岭市| 宜城市| 新巴尔虎左旗| 建水县| 富平县| 祁门县| 莎车县| 兰西县| 彭泽县| 丹江口市| 天津市| 府谷县| 淳化县| 津市市| 望城县| 峨眉山市| 安西县| 横峰县| 乡城县| 噶尔县| 阿荣旗| 肥乡县| 甘泉县| 石景山区|