欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于位置的社交大數(shù)據(jù)信息最大化方法與流程

文檔序號:11408833閱讀:165來源:國知局
一種基于位置的社交大數(shù)據(jù)信息最大化方法與流程

本發(fā)明涉及一種社交大數(shù)據(jù)影響力研究技術(shù),特別涉及基于位置信息的在線社交網(wǎng)絡(luò)信息最大化方法。



背景技術(shù):

隨著互聯(lián)網(wǎng)的發(fā)展和移動終端的普及,在線社交網(wǎng)絡(luò)得到飛速的發(fā)展與關(guān)注。社交網(wǎng)絡(luò)信息最大化的研究具有很實際的現(xiàn)實意義,利用社交大數(shù)據(jù)中的友好關(guān)系與特征來進行口碑營銷和“病毒式傳播”越來越成為研究的重點,它在市場營銷、廣告發(fā)布等方面有十分重要的應(yīng)用?,F(xiàn)有的信息傳播模型和信息最大化技術(shù)大多只針對了一般的社交網(wǎng)絡(luò)中的友好關(guān)系,而沒有與具體的實際聯(lián)系起來,只是利用了在線社交網(wǎng)絡(luò)上用戶之間的友好關(guān)系,只要激活,就會去影響周圍的好友,而沒有考慮用戶被激活后是否會和好友去分享,如果不分享那信息便不會得到傳播。



技術(shù)實現(xiàn)要素:

本發(fā)明的主要目的在于克服現(xiàn)有技術(shù)的缺點與不足,提供一種基于位置的社交大數(shù)據(jù)信息最大化方法,該方法針對基于位置的社交網(wǎng)絡(luò),挖掘社交大數(shù)據(jù)中用戶簽到的位置信息,對信息傳播過程進行建模,考慮了用戶愿意分享傳播的可能性以及距離對于用戶行為的影響,提供了一種基于位置的在線社交網(wǎng)絡(luò)中信息最大化的方法。這里的信息最大化是指,給定一個需要傳播的信息和種子節(jié)點的數(shù)目,根據(jù)所設(shè)計的方法選出種子節(jié)點激活他們(比如優(yōu)惠券或者是免費樣品),讓他們利用社交網(wǎng)絡(luò)去進行信息的傳播,去影響他們的朋友,被激活的朋友再去影響朋友的朋友,使得最后被影響的人數(shù)最多。

本發(fā)明的目的通過以下的技術(shù)方案實現(xiàn):一種基于位置的社交大數(shù)據(jù)信息最大化方法,包括如下步驟:

s1、信息傳播過程建模;給定一個目標位置,用戶被激活的概率與用戶在實際生活中去目標位置的激活概率有關(guān)系;當一個節(jié)點被激活時,它會嘗試影響未激活的鄰居節(jié)點的概率為激活概率;對于一個鄰居,一個用戶只有一次機會去影響,而且這些嘗試之間是相互獨立的,即節(jié)點對鄰居節(jié)點的激活不會受到其它節(jié)點的影響;

s2、用戶行為分析;用戶所有簽到地點去到目標位置的概率和,表示用戶去到目標位置的概率來分析用戶的行為;

s3、計算所有用戶的影響力,選出第一個種子節(jié)點;影響用戶的影響力三個因素:節(jié)點的度數(shù)、用戶從任一簽到地點去到目標位置的概率、用戶的分享概率;計算出所有的用戶的影響力之后,對所有用戶的影響力進行排序,選擇影響力最大的那個節(jié)點作為第一個種子節(jié)點;

s4、修改選中以及受影響的節(jié)點的影響力,選出所有種子節(jié)點。

優(yōu)選的,步驟s1中信息傳播過程建模:

給定一個目標位置,用戶被激活的概率與用戶在實際生活中去目標位置的概率pw有關(guān)系,當一個節(jié)點v被激活時,它會嘗試影響未激活的鄰居節(jié)點w,激活概率為pw,對于一個鄰居,一個用戶只有一次機會去影響,而且這些嘗試之間是相互獨立的,即v對w的激活不會受到其它節(jié)點的影響。信息傳播過程為:

(1)給定初始的活躍節(jié)點集合s,當在時刻t節(jié)點v被激活并成功分享后,它就獲得了一次對它的鄰居節(jié)點w產(chǎn)生影響的機會,成功的概率為pw,是用戶在實際生活中去目標位置的概率,會根據(jù)簽到的位置信息計算得到,其自身獨立不受其它節(jié)點的影響。

(2)若w有多個鄰居節(jié)點都是新近被激活并成功分享的節(jié)點,那么這些節(jié)點將以任意順序嘗試激活節(jié)點w。如果節(jié)點v成功激活節(jié)點w,那么在t+1時刻,節(jié)點w轉(zhuǎn)為活躍狀態(tài)。

(3)在t+1時刻,節(jié)點w以一定的概率去分享這個信息,若分享成功將對其它節(jié)點未激活的鄰居節(jié)點產(chǎn)生影響,重復(fù)上述過程。

在上述傳播過程中,在t時刻無論節(jié)點v是否能成功激活它的鄰居節(jié)點,在以后的時刻中,v本身雖然仍保持活躍狀態(tài),但它已經(jīng)不再具備影響力,即在t時刻被激活的節(jié)點,已經(jīng)嘗試激活它自身的鄰居節(jié)點后,在t+1時刻仍然處于活躍狀態(tài),但它本身已經(jīng)不能去激活其它任何節(jié)點,這一類節(jié)點成為無影響力的活躍節(jié)點。當網(wǎng)絡(luò)中不存在有影響力的活躍節(jié)點時,即沒有新的節(jié)點被激活,傳播過程結(jié)束。

優(yōu)選的,步驟s2中用戶行為分析具體步驟為:

s2.1、數(shù)據(jù)預(yù)處理:社交網(wǎng)絡(luò)中用戶的簽到信息中包含了用戶每次簽到的時間和位置信息,從這些數(shù)據(jù)中提取有效信息,包括用戶、時間、經(jīng)度、緯度;

s2.2、計算每個用戶相鄰兩次簽到地點的距離;將數(shù)據(jù)集中用戶的簽到數(shù)據(jù)進行預(yù)處理后,對每個用戶的簽到分別按照時間進行排序,然后計算出每個用戶每相鄰向次簽到的位置之間的距離;

s2.3、統(tǒng)計每個距離在整個用戶簽到數(shù)據(jù)中所占的比例,得到距離概率圖;

s2.4、計算所有用戶去到目的位置的概率,表示用戶去到目標位置的概率來分析用戶的行為。

優(yōu)選的,步驟s3中計算所有用戶的影響力,選出第一個種子節(jié)點具體步驟為:

從社交大數(shù)據(jù)中,對數(shù)據(jù)文本進行處理,提取出每個用戶以及相鄰的用戶,得到代表社交網(wǎng)絡(luò)中用戶之間友好關(guān)系的鄰接矩陣。一個用戶相鄰的用戶越多,即它所在的那一行元素中1的數(shù)目比較多,代表它的朋友越多,能夠去影響的人也就越多。同時,每個用戶都有一個去到目標位置的概率,代表了在距離的影響下用戶去目標位置的可能性,這個概率越大,說明這個用戶越容易被影響。一個用戶被激活后,它會以一定的概率去分享(比如發(fā)微博,或者單獨找朋友進行推薦分享),如果分享成功,才會去影響它的鄰居,如果不成功,那么后面的狀態(tài),雖然它一直處于活躍狀態(tài),但是在后面的過程中無法對它的鄰居產(chǎn)生影響。這里度量用戶的影響力主要考慮前面提到的三個因素:節(jié)點的度數(shù),所有鄰居去到目標位置的概率和用戶的分享概率。計算出所有的用戶的影響力之后,對所有用戶的影響力進行排序,選擇影響力最大的那個節(jié)點作為第一個種子節(jié)點。

優(yōu)選的,步驟s4中對于已經(jīng)選為種子節(jié)點的用戶,在后續(xù)的節(jié)點選擇中,這些節(jié)點將不會再參與,所以將它的影響力置為0。當一個節(jié)點被激活后,它的鄰居節(jié)點會被影響(可能被激活,也可能不被激活)。如果v被激活了,那么這個激活節(jié)點的鄰居w的影響力就會發(fā)生變化,因為鄰居v已經(jīng)處于激活狀態(tài),這個就不屬于節(jié)點w的影響力之內(nèi)了。所以,當一個節(jié)點被激活后,它的鄰居的影響力會發(fā)生變化,不能再包含對已經(jīng)激活節(jié)點的影響。同時,被激活節(jié)點的鄰居的鄰居的影響力也會發(fā)生變化,因為被激活節(jié)點可能改變它鄰居節(jié)點的狀態(tài)。修改了選中節(jié)點以及受影響的節(jié)點的影響力之后,重新對所有節(jié)點的影響力進行排序,選擇影響力最大的節(jié)點加入種子節(jié)點的集合,不斷重復(fù)上述步驟,知道選出指定數(shù)目的種子節(jié)點。

優(yōu)選的,社交網(wǎng)絡(luò)既可以是有向的社交網(wǎng)絡(luò),也可以是無向的社交網(wǎng)絡(luò)。當社交網(wǎng)絡(luò)中的朋友關(guān)系具有方向性時(即可能出現(xiàn)a是b的朋友,而b不是a的朋友),那么在實施時用戶的度就是用戶的出度,即他是多少人的朋友,若社交網(wǎng)絡(luò)中的朋友關(guān)系是無向的,那么就是他的朋友的數(shù)量。

本發(fā)明與現(xiàn)有技術(shù)相比,具有如下優(yōu)點和有益效果:

1、本發(fā)明主要利用了社交網(wǎng)絡(luò)中用戶的簽到的位置信息,考慮了距離對于用戶行為的影響,對于目標信息是一個具體地點時,距離對用戶的行為是有很大的影響的。在對用戶行為進行分析的時候,利用了統(tǒng)計的思想,對所有用戶的歷史簽到信息都進行了考慮。

2、本發(fā)明的社交網(wǎng)絡(luò)信息傳播模型更加的貼近具體的實際情況,對于給定一個具體位置(信息),結(jié)合了距離對于用戶行為影響的實際因素,充分挖掘了特定社交網(wǎng)絡(luò)中的有效信息來分析用戶行為。

3、本發(fā)明不僅考慮了用戶的度(即用戶所擁有朋友的數(shù)量)、愿意分享的可能性以及鄰居節(jié)點到目標位置的概率,還考慮了已經(jīng)激活的節(jié)點對其他節(jié)點的影響力的改變,每一次選出一個種子節(jié)點后都會改變受影響節(jié)點的影響力,一步一步選出所需數(shù)目的種子節(jié)點集合。所以本發(fā)明在基于位置的社交大數(shù)據(jù)信息最大化的效率和有效性方面都具有很大的優(yōu)勢。

附圖說明

圖1為本發(fā)明的信息傳播模型的傳播過程圖;

圖2為本發(fā)明的社交網(wǎng)絡(luò)數(shù)據(jù)集中簽到的距離概率的統(tǒng)計分析的流程圖;

圖3為本發(fā)明的方法的流程圖。

具體實施方式

下面結(jié)合實施例及附圖對本發(fā)明作進一步詳細的描述,但本發(fā)明的實施方式不限于此。

實施例

該方法主要針對基于位置的社交網(wǎng)絡(luò),挖掘其中用戶簽到的位置信息,對信息傳播過程進行建模,對用戶行為進行分析,選擇出有效的種子節(jié)點集合,使得信息(具體的一個位置信息)通過在線社交網(wǎng)絡(luò)得到最大化的傳播,使最多的用戶去到目標位置。該方法主要描述了對社交網(wǎng)絡(luò)信息傳播進行建模,用戶行為分析,計算影響力選出第一個種子節(jié)點和修改影響力選出所以種子節(jié)點這四個方面的流程步驟。此實施例的數(shù)據(jù)集是snap(stanfordnetworkanalysisplatform)提供的基于位置的社交網(wǎng)絡(luò)數(shù)據(jù)集brightkite。

如圖1所示,描述的是給定一個目標位置信息,信息在社交網(wǎng)絡(luò)中通過好友關(guān)系傳播的過程。對信息在社交網(wǎng)絡(luò)中的傳播過程進行建模,來模擬用戶之間是如何來相互影響進行信息的傳播。當目標信息是一個具體的位置的時候,激活的節(jié)點會以一定的概率(利用簽到的次數(shù)來計算)來選擇是否分享給朋友。如果分享成功,那就會去影響它的鄰居節(jié)點,影響成功,則會繼續(xù)前面的過程,分享不成功則節(jié)點依然處于活躍狀態(tài),但是不能再影響相關(guān)的用戶。當社交網(wǎng)絡(luò)中不再有人被激活的時候,就結(jié)束信息的傳播。信息傳播模型的傳播過程圖具體步驟如下:

1、節(jié)點被激活。社交網(wǎng)絡(luò)中的為激活狀態(tài)的用戶被選為種子節(jié)點或者被鄰居節(jié)點成功影響。被選為種子節(jié)點時商家會通過一定的手段(贈品或者優(yōu)惠的方式)去激活他們,被鄰居節(jié)點激活的則是依賴社交網(wǎng)絡(luò)中的朋友關(guān)系進行激活的。

2、用戶嘗試分享。根據(jù)用戶的簽到次數(shù)計算用戶愿意分享的概率,用戶會以這個概率去選擇將信息分享給周圍的朋友。

3、鄰居節(jié)點以一定的概率被影響。用戶分享信息給鄰居節(jié)點后,鄰居節(jié)點會根據(jù)距離的影響選擇是否被激活。

如圖2所示,描述的是對社交網(wǎng)絡(luò)數(shù)據(jù)集中用戶簽到的距離概率統(tǒng)計的流程圖。對用戶行為進行分析時,主要要利用社交網(wǎng)絡(luò)中用戶的歷史簽到信息來進行統(tǒng)計分析,主要包括以下的步驟:

1、數(shù)據(jù)預(yù)處理。一般數(shù)據(jù)集中用戶的簽到數(shù)據(jù)是以文本方式給出,同時具有一些我們不需要的信息。進行用戶的行為分析,主要需要用戶每次簽到的時間,經(jīng)度和緯度。

2、計算每個用戶相鄰兩次簽到地點的距離。將數(shù)據(jù)集中用戶的簽到數(shù)據(jù)進行預(yù)處理后,對每個用戶的簽到分別按照時間進行排序,然后計算出每個用戶每相鄰向次簽到的位置之間的距離。

3、統(tǒng)計每個距離在整個用戶簽到數(shù)據(jù)中所占的比例,得到距離概率圖。以橫軸代表距離,以縱軸代表距離在整個數(shù)據(jù)集中的比例繪制圖例。對圖中數(shù)據(jù)進行分析,得到距離與概率的數(shù)學(xué)公式。對于給定一個具體的距離,可以得到用戶是否前往的概率。

4、計算各個用戶去到目的位置的概率。給定一個具體的位置(經(jīng)度和緯度),計算用戶去到該位置的概率時,考慮用戶每次的簽到地點與目標位置的距離,根據(jù)得到的距離概率公式,計算出用戶每次簽到的地點到達目標位置的概率,那么一個用戶去到目標位置的概率就是他從每次簽到的地方去到目標位置的概率之和。最后計算出每個用戶分別去到目標位置的概率作為他們被影響時成功被激活的概率。

如圖3所示,其中描述的是選擇種子節(jié)點集合的流程圖。

1、計算所有節(jié)點的影響力。對社交網(wǎng)絡(luò)的文本進行處理,提取出社交網(wǎng)絡(luò)關(guān)系圖的鄰接矩陣,計算出每個用戶的度,即用戶在社交網(wǎng)絡(luò)中朋友的數(shù)量,再根據(jù)用戶的簽到次數(shù)來計算每個用戶愿意分享的概率(或者可以系統(tǒng)隨機產(chǎn)生)。用戶的影響力通過下面的標準來計算:度數(shù)*用戶愿意分享的概率*所有鄰居去到目標位置的概率和。

2、選出第一個種子節(jié)點。對所有節(jié)點的影響力進行降序排序,得到影響力最大的那個節(jié)點,作為第一個種子節(jié)點。

3、修改受影響的節(jié)點的影響力。當選擇了一個種子節(jié)點的時候,那么它就可能被激活,然后去影響周圍的節(jié)點,會改變相關(guān)用戶的影響力。需要改變影響力的節(jié)點的主要是被激活節(jié)點的鄰居節(jié)點以及鄰居的鄰居節(jié)點。為了排序的方便,這里把已經(jīng)選為種子節(jié)點的用戶影響力置為零,在后續(xù)所以節(jié)點排序時將不會再選到已經(jīng)被選的節(jié)點。

被激活節(jié)點鄰居節(jié)點的影響力在度數(shù)上以及所有鄰居去到目標位置的概率和中都需要減去被激活節(jié)點的那一部分。當節(jié)點被激活后,它的鄰居節(jié)點便無法再影響它并激活它,所以被激活節(jié)點的鄰居節(jié)點的影響范圍不包含被激活的節(jié)點了。

被激活的節(jié)點如果成功影響了它的朋友,那么與此朋友連接的節(jié)點就無法再去激活這個朋友,那么此朋友連接的節(jié)點的影響力就受到了影響。所以,需要計算被激活節(jié)點的鄰居節(jié)點被激活節(jié)點成功影響的概率,在所有相關(guān)的節(jié)點的影響力中減去可能的這一部分影響力。

4、選出所有的種子節(jié)點。當選中的種子節(jié)點的數(shù)目沒有達到預(yù)期時,加入新的種子節(jié)點后,不斷的修改受影響的種子節(jié)點的影響力,并對未加入種子節(jié)點集合的節(jié)點影響力進行排序,不斷選出影響力最大的加入種子節(jié)點集合,直到選出所有的種子節(jié)點。

上述實施例為本發(fā)明較佳的實施方式,但本發(fā)明的實施方式并不受上述實施例的限制,其他的任何未背離本發(fā)明的精神實質(zhì)與原理下所作的改變、修飾、替代、組合、簡化,均應(yīng)為等效的置換方式,都包含在本發(fā)明的保護范圍之內(nèi)。

當前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
赤壁市| 沅陵县| 古交市| 临沂市| 嫩江县| 聂拉木县| 苏尼特右旗| 汶上县| 綦江县| 盘锦市| 邵阳市| 册亨县| 渝中区| 金沙县| 沙坪坝区| 屏边| 铜陵市| 平安县| 上饶县| 普安县| 金沙县| 蓬莱市| 新巴尔虎左旗| 临猗县| 韶关市| 旬阳县| 九江市| 延川县| 佛教| 洪洞县| 上蔡县| 高安市| 和林格尔县| 洛阳市| 堆龙德庆县| 历史| 始兴县| 闽清县| 新疆| 徐闻县| 徐闻县|