本發(fā)明涉及網(wǎng)絡(luò)分析技術(shù)領(lǐng)域,特別涉及一種微博網(wǎng)絡(luò)中節(jié)點影響力計算方法。
背景技術(shù):
近幾年,研究學(xué)者也對社會網(wǎng)絡(luò)中的影響力進(jìn)行了研究,2010年,cha等人在《lcwsm’10proceedingsofinternationalaaaiconferenceonweblogs&social》發(fā)表的“measuringuserinfluenceintwitter:themillionfollowerfallacy”一文比較分析了按照被轉(zhuǎn)發(fā)次數(shù)、被提及(@mention)次數(shù)和關(guān)注者數(shù)量3種衡量用戶影響力的方式,并分析了影響力隨時間變化的規(guī)律.他們發(fā)現(xiàn),擁有較多關(guān)注者的用戶并不一定能引發(fā)更多的轉(zhuǎn)發(fā)和提及行為.這說明了我們不能簡單通過關(guān)注者數(shù)量等網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)特征來衡量用戶影響力,但該研究主要著重于衡量用戶歷史上某個時刻的影響力有多大,并沒有提出算法通過歷史數(shù)據(jù)來估計當(dāng)前或者未來時間內(nèi)用戶的社會影響力。
在本發(fā)明作出之前,2011年,bakshy等人在《proceedingsofthefourthacminternationalconferenceonwebsearchanddatamining》上發(fā)表的“everyone′saninfluencer:quantifyinginfluenceontwitter”一文使用回歸樹的方法估計用戶發(fā)布的含有短鏈接的微博在全局的傳播規(guī)模,并用預(yù)計的平均傳播規(guī)模大小作為用戶社會影響力大小的估計指標(biāo),取得了較好的效果。而wangxf等人在文獻(xiàn)《physicaastatisticalmechanics&itsapplications》中所發(fā)表的《pinningcontrolofscale-freedynamicalnetworks》一文采用牽制控制的策略對部分節(jié)點施加控制,驅(qū)使網(wǎng)絡(luò)從任意初始狀態(tài)到達(dá)所需的目標(biāo)狀態(tài)。然而,對于具有任意拓?fù)浣Y(jié)構(gòu)的網(wǎng)絡(luò),如何有效地選擇其牽制節(jié)點仍是一個開放問題。
以上研究成果對節(jié)點的影響力進(jìn)行計算分析,但分析過程中忽略了現(xiàn)有輿情傳播的情況和規(guī)模的分析,無法適用于某一特定信息傳播的控制。
技術(shù)實現(xiàn)要素:
本發(fā)明的目的就在于克服上述缺陷,提供一種微博網(wǎng)絡(luò)中節(jié)點影響力計算方法。
本發(fā)明的技術(shù)方案:
一種微博網(wǎng)絡(luò)中節(jié)點影響力計算方法,其主要技術(shù)特征在于,其步驟如下:
1)利用微博中的節(jié)點和關(guān)注信息構(gòu)建微博影響網(wǎng)絡(luò);
2)將微博網(wǎng)絡(luò)中的節(jié)點劃分為若干個聯(lián)通子圖;
3)在每個聯(lián)通子圖中計算節(jié)點的影響力。
所述步驟1)的進(jìn)一步步驟為:
1-1)將微博用戶作為微博影響網(wǎng)絡(luò)中的節(jié)點;
1-2)以用戶之間的關(guān)注關(guān)系構(gòu)建節(jié)點之間的邊;
1-3)根據(jù)用戶之間微博轉(zhuǎn)發(fā)情況計算節(jié)點之間的權(quán)重。
所述步驟2)的進(jìn)一步的步驟為:
2-1)在微博網(wǎng)絡(luò)中未在任何聯(lián)通子圖的節(jié)點集合中選擇一個節(jié)點a;
2-2)將所有指向節(jié)點a的節(jié)點集合與a合并形成節(jié)點集合;
2-3)重復(fù)步驟2-2),直到?jīng)]有新的節(jié)點加入,則步驟2-2)中所形成的集合為一個聯(lián)通子圖;
2-4)如果微博網(wǎng)絡(luò)中存在不包含在任何聯(lián)通子圖中的節(jié)點,則重復(fù)步驟2-1)。
所述在每個聯(lián)通子圖中計算節(jié)點的影響力的步驟是:
1)計算聯(lián)通子圖的態(tài)度影響力矩陣;
2)對影響矩陣進(jìn)行拉普拉斯變換得到影響矩陣;
3)根據(jù)節(jié)點影響力的收斂情況計算聯(lián)通網(wǎng)絡(luò)中所有節(jié)點的影響力。
本發(fā)明的優(yōu)點和效果在于能夠快速定位微博網(wǎng)絡(luò)中影響力大的節(jié)點,通過對于微博信息傳播控制節(jié)點選擇的研究以影響力矩陣為基礎(chǔ),采用拉普拉斯變換的方法,使得節(jié)點影響力的計算快速收斂,達(dá)到了令人滿意的效果。
附圖說明
圖1——本發(fā)明對不同節(jié)點進(jìn)行控制的示意圖,其中,(a)對節(jié)點2進(jìn)行控制示意圖,(b)對節(jié)點3進(jìn)行控制示意圖。
具體實施方式
本發(fā)明的技術(shù)思路是:
虛假輿情信息的產(chǎn)生和傳播對社會和國家造成很嚴(yán)重的影響,在2011年爆發(fā)的“埃及革命”中,不法分子利用twitter和facebook等社會網(wǎng)絡(luò)或媒體大肆造謠,煽動民意,傳播惡意信息并組織犯罪活動,在社交媒體的推波助瀾下,騷亂被極度放大并快速演變。在2013年4月四川“雅安地震”爆發(fā)后,微博成為最有力的信息傳播媒體,各類政務(wù)微博、意見領(lǐng)袖、草根賬號等充分利用微博的信息擴(kuò)散能力,發(fā)布地震救援提示,為抗震救災(zāi)發(fā)揮積極作用.但是另一方面,也有不法分子利用微博傳播謠言,欺騙公眾,造成社會不安和民眾恐慌,帶來極壞的后果。對于社會網(wǎng)絡(luò)中的信息傳播,如何及時發(fā)現(xiàn)虛假輿情信息并采用正向引導(dǎo)策略,切斷輿情傳播路徑,減少輿情信息的影響范圍,成為亟待解決的問題,這對于輿情監(jiān)控和維護(hù)國家公共安全具有重要意義。
本發(fā)明的主要技術(shù)特征體現(xiàn)在:
能夠快速定位微博網(wǎng)絡(luò)中影響力比較大的節(jié)點,可以為輿情控制和管理提供技術(shù)支持。
具體技術(shù)路線是:1.根據(jù)矩陣變換和計算快速得出微博網(wǎng)絡(luò)中影響力大的節(jié)點;2.通過對影響力大的節(jié)點進(jìn)行管理和控制可以實現(xiàn)在較小投入成本的情況下對微博的有效控制。影響力相關(guān)證明和計算見“圖1——本發(fā)明對不同節(jié)點進(jìn)行控制的示意圖”和定理1。
下面結(jié)合附圖舉例對本發(fā)明做更詳細(xì)地描述:
1)利用微博中的節(jié)點和關(guān)注信息構(gòu)建微博影響網(wǎng)絡(luò);
具體的步驟如下:
●微博網(wǎng)絡(luò)只一個有向圖,以微博用戶作為微博網(wǎng)絡(luò)中的節(jié)點,代表第個用戶節(jié)點;
●建立微博網(wǎng)絡(luò)中的邊的集合,如果用戶a關(guān)注了用戶b,則從用戶b到a構(gòu)建一條加權(quán)邊,邊的權(quán)重為用戶a轉(zhuǎn)發(fā)b微博次數(shù)與所有關(guān)注b的節(jié)點轉(zhuǎn)發(fā)b微博次數(shù)的比值;
●根據(jù)用戶之間微博轉(zhuǎn)發(fā)情況計算節(jié)點之間的權(quán)重,用戶b對用戶a的權(quán)重為為用戶a轉(zhuǎn)發(fā)b微博次數(shù)與所有關(guān)注b的節(jié)點轉(zhuǎn)發(fā)b微博次數(shù)的比值;
2)將微博網(wǎng)絡(luò)中的節(jié)點劃分為若干個聯(lián)通子圖;
具體步驟如下:
●在微博網(wǎng)絡(luò)中未在任何聯(lián)通子圖的節(jié)點集合中選擇一個節(jié)點a作為聯(lián)通子圖u;
●在微博網(wǎng)絡(luò)中將所有指向節(jié)點a的節(jié)點集合與a合并形成節(jié)點集合u:
●重復(fù)步驟2,直到?jīng)]有新的節(jié)點加入,則步驟2中所形成的集合為一個聯(lián)通子圖:
●如果微博網(wǎng)絡(luò)中存在不包含在任何聯(lián)通子圖中的節(jié)點,則重復(fù)步驟1,直到所有的節(jié)點都被劃分到聯(lián)通子圖中;
3)在每個聯(lián)通子圖中計算節(jié)點的影響力;
具體實現(xiàn)如下:
●根據(jù)微博網(wǎng)絡(luò)中節(jié)點之間的邊的權(quán)重在聯(lián)通子圖中構(gòu)建影響力矩陣φ。
●對影響力矩陣φt進(jìn)行拉普拉斯變化,得到令是φt的拉普拉斯矩陣,定義為影響矩陣。
●令為節(jié)點影響力。給定影響矩陣,利用公式計算,得到每個節(jié)點的影響力。
4)網(wǎng)絡(luò)影響可控性證明
定理1:在一個影響網(wǎng)絡(luò)中,給定驅(qū)動節(jié)點集合,如果對于所有節(jié)點,都存在一條從集合中的節(jié)點到的有向路徑,則網(wǎng)絡(luò)是影響可控的。
證明:假設(shè)節(jié)點為外部控制器,則節(jié)點到集合中的所有節(jié)點都存在一條有向邊。如果所有節(jié)點都存在一條從某個驅(qū)動節(jié)點到節(jié)點的路徑,則外部控制器可以到達(dá)網(wǎng)絡(luò)中的每一個節(jié)點。由于從節(jié)點到影響網(wǎng)絡(luò)的其他所有節(jié)點都存在一條有向路徑,則在對應(yīng)的markov鏈中,其他節(jié)點都有一條到節(jié)點(吸收態(tài))的有向路徑.因此,任意節(jié)點到達(dá)吸收態(tài)的概率,此markov鏈?zhǔn)且粋€吸收鏈.經(jīng)過有限的時間步驟之后,每一個暫態(tài)最終將會收斂到吸收狀態(tài).因此,節(jié)點的狀態(tài)將會和外部控制器(節(jié)點)相同。