動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)社區(qū)演化識(shí)別以及穩(wěn)定社區(qū)提取方法
【專利摘要】本發(fā)明涉及網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別是涉及一種動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)社區(qū)演化識(shí)別以及穩(wěn)定社區(qū)提取方法,方法包括:采集原始數(shù)據(jù),根據(jù)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系按照第一預(yù)定時(shí)間周期建立每個(gè)時(shí)間周期的社會(huì)網(wǎng)絡(luò),并利用派系過濾方法劃分每個(gè)時(shí)間周期的社區(qū),再獲取相鄰兩個(gè)時(shí)間周期的社區(qū)作為社區(qū)對(duì),獲取每一個(gè)社區(qū)對(duì)的相對(duì)重疊度值,比較所述相對(duì)重疊度值,將具有相對(duì)重疊度值最高的社區(qū)對(duì)作為具有繼承演化關(guān)系的社區(qū)對(duì)。應(yīng)用本發(fā)明的方法,無需將一段時(shí)間的動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)映射為一個(gè)時(shí)間點(diǎn)的靜態(tài)社會(huì)關(guān)系網(wǎng)絡(luò),而是直接對(duì)預(yù)定時(shí)間周期內(nèi)的各社會(huì)網(wǎng)絡(luò)的節(jié)點(diǎn)進(jìn)行社區(qū)提取處理,比靜態(tài)的映射方法更加準(zhǔn)確,并且能夠確定社區(qū)對(duì)之間的演化繼承關(guān)系。
【專利說明】動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)社區(qū)演化識(shí)別以及穩(wěn)定社區(qū)提取方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明涉及網(wǎng)絡(luò)【技術(shù)領(lǐng)域】,特別是涉及一種動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)社區(qū)演化識(shí)別以及穩(wěn)定社區(qū)提取方法。
【背景技術(shù)】
[0002]社會(huì)網(wǎng)絡(luò)是用來表示網(wǎng)絡(luò)中各個(gè)個(gè)體之間相互聯(lián)系的網(wǎng)絡(luò)。目前的社交網(wǎng)站、微博、論壇等都可以被看作為一個(gè)社會(huì)網(wǎng)絡(luò)。在社會(huì)網(wǎng)絡(luò)中,人與人之間關(guān)聯(lián)形成的社會(huì)網(wǎng)絡(luò)存在結(jié)構(gòu)涌現(xiàn)現(xiàn)象,即相同類型的節(jié)點(diǎn)之間存在的連接較多,不同類型節(jié)點(diǎn)之間存在的連接較少。而社區(qū)是指網(wǎng)絡(luò)中滿足同一類型的節(jié)點(diǎn)以及這些節(jié)點(diǎn)之間的連接構(gòu)成的子圖。而在網(wǎng)絡(luò)中尋找穩(wěn)定的社區(qū)具有重要的實(shí)用價(jià)值。特別是隨著微博等互聯(lián)網(wǎng)應(yīng)用的普及,如何快速找到龐大的社會(huì)關(guān)系網(wǎng)絡(luò)中的穩(wěn)定社區(qū),對(duì)于開展精準(zhǔn)廣告投放、引導(dǎo)輿論導(dǎo)向具有重要意義。
[0003]現(xiàn)有技術(shù)存在一種社區(qū)發(fā)現(xiàn)方法,其基本思想是采用靜態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)分析的方法處理動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)的問題。其將一段時(shí)間的動(dòng)態(tài)網(wǎng)絡(luò)映射到一個(gè)時(shí)間點(diǎn)上的靜態(tài)網(wǎng)絡(luò),再基于派系過濾的社區(qū)發(fā)現(xiàn)方法找出其中的社區(qū)。但實(shí)際的社會(huì)關(guān)系網(wǎng)絡(luò)是動(dòng)態(tài)的,網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)會(huì)從一種穩(wěn)定狀態(tài)達(dá)到另一種穩(wěn)定狀態(tài),如何識(shí)別當(dāng)前網(wǎng)絡(luò)中的社區(qū)是前一次穩(wěn)定狀態(tài)的社區(qū)演化而來的,利用現(xiàn)有技術(shù)是無能為力的。
【發(fā)明內(nèi)容】
[0004]為解決上述技術(shù)問題,本發(fā)明實(shí)施例提供了一種動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)社區(qū)演化以及穩(wěn)定社區(qū)的提取方法,可以確定社區(qū)的演化關(guān)系,以及提取穩(wěn)定社區(qū)。
[0005]根據(jù)本發(fā)明實(shí)施例的第一方面,公開了一種動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)社區(qū)演化識(shí)別方法,所述方法包括:
[0006]采集原始數(shù)據(jù),根據(jù)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系按照第一預(yù)定時(shí)間周期建立每個(gè)時(shí)間周期的社會(huì)網(wǎng)絡(luò);
[0007]利用派系過濾方法劃分每個(gè)時(shí)間周期的社區(qū);
[0008]獲取相鄰兩個(gè)時(shí)間周期的社區(qū)作為社區(qū)對(duì),獲取每一個(gè)社區(qū)對(duì)的相對(duì)重疊度值;比較所述相對(duì)重疊度值,獲取具有相對(duì)重疊度值最高的社區(qū)對(duì),確定所述具有相對(duì)重疊度值最高的社區(qū)對(duì)為具有繼承演化關(guān)系的社區(qū)對(duì)。
[0009]較佳地,所述獲取相鄰兩個(gè)時(shí)間周期的社區(qū)作為社區(qū)對(duì),獲取每一個(gè)社區(qū)對(duì)的相對(duì)重疊度值具體包括:
[0010]獲取相鄰兩個(gè)時(shí)間周期的社區(qū)Di和作為社區(qū)對(duì);
[0011]將相鄰兩個(gè)時(shí)間周期的社區(qū)對(duì)按照相同節(jié)點(diǎn)進(jìn)行連接關(guān)系的疊加,獲取疊加后的社會(huì)網(wǎng)絡(luò);
[0012]利用派系過濾方法劃分疊加后的社會(huì)網(wǎng)絡(luò)中的社區(qū)Vk;
[0013]根據(jù)以下公式計(jì)算每一個(gè)社區(qū)對(duì)的相對(duì)重疊度值(
【權(quán)利要求】
1.一種動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)社區(qū)演化識(shí)別方法,其特征在于,所述方法包括: 采集原始數(shù)據(jù),根據(jù)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系按照第一預(yù)定時(shí)間周期建立每個(gè)時(shí)間周期的社會(huì)網(wǎng)絡(luò); 利用派系過濾方法劃分每個(gè)時(shí)間周期的社區(qū); 獲取相鄰兩個(gè)時(shí)間周期的社區(qū)作為社區(qū)對(duì),獲取每一個(gè)社區(qū)對(duì)的相對(duì)重疊度值;比較所述相對(duì)重疊度值,獲取具有相對(duì)重疊度值最高的社區(qū)對(duì),確定所述具有相對(duì)重疊度值最高的社區(qū)對(duì)為具有繼承演化關(guān)系的社區(qū)對(duì)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述獲取相鄰兩個(gè)時(shí)間周期的社區(qū)作為社區(qū)對(duì),獲取每一個(gè)社區(qū)對(duì)的相對(duì)重疊度值具體包括: 獲取相鄰兩個(gè)時(shí)間周期的社區(qū)Di和作為社區(qū)對(duì); 將相鄰兩個(gè)時(shí)間周期的社區(qū)對(duì)按照相同節(jié)點(diǎn)進(jìn)行連接關(guān)系的疊加,獲取疊加后的社會(huì)網(wǎng)絡(luò); 利用派系過濾方法劃分疊加后的社會(huì)網(wǎng)絡(luò)中的社區(qū)Vk; 根據(jù)以下公式計(jì)算每一個(gè)社區(qū)對(duì)的相對(duì)重疊度值:
3.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 根據(jù)確定的社區(qū)演化繼承關(guān)系,對(duì)不同社區(qū)的節(jié)點(diǎn)執(zhí)行不同的處理策略。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述根據(jù)確定的社區(qū)演化繼承關(guān)系,對(duì)不同社區(qū)的節(jié)點(diǎn)執(zhí)行不同的處理策略具體包括: 對(duì)于具有繼承演化關(guān)系的社區(qū)對(duì),獲取所述社區(qū)對(duì)中的兩個(gè)社區(qū)的節(jié)點(diǎn)數(shù)量; 比較社區(qū)對(duì)中的兩個(gè)社區(qū)的節(jié)點(diǎn)數(shù)量,獲取比較結(jié)果; 當(dāng)所述比較結(jié)果表明所述具有繼承演化關(guān)系的社區(qū)對(duì)中,處于后一時(shí)間周期的社區(qū)的節(jié)點(diǎn)的數(shù)量小于處于前一時(shí)間周期的社區(qū)的節(jié)點(diǎn)的數(shù)量時(shí),獲取處于后一時(shí)間周期的社區(qū)的各節(jié)點(diǎn)的地址信息,向處于后一時(shí)間周期的社區(qū)的各節(jié)點(diǎn)發(fā)送第一內(nèi)容; 當(dāng)所述比較結(jié)果表明所述具有繼承演化關(guān)系的社區(qū)對(duì)中,處于后一時(shí)間周期的社區(qū)的節(jié)點(diǎn)的數(shù)量大于處于前一時(shí)間周期的社區(qū)的節(jié)點(diǎn)的數(shù)量時(shí),獲取處于后一時(shí)間周期的社區(qū)的各節(jié)點(diǎn)的地址信息,向處于后一時(shí)間周期的社區(qū)的各節(jié)點(diǎn)發(fā)送第二內(nèi)容; 其中,所述第一內(nèi)容和所述第二內(nèi)容不同。
5.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括: 獲取預(yù)定時(shí)間窗口內(nèi)具有繼承演化關(guān)系的社區(qū)對(duì)的相對(duì)重疊度值; 根據(jù)獲取的相對(duì)重疊度值獲取社區(qū)規(guī)模穩(wěn)定度值; 獲取社區(qū)分裂值; 根據(jù)獲取的社區(qū)規(guī)模穩(wěn)定度值和社區(qū)分裂值判斷社區(qū)是否符合預(yù)設(shè)的條件,當(dāng)判斷社區(qū)滿足預(yù)設(shè)的條件時(shí),確定所述社區(qū)為穩(wěn)定社區(qū)。
6.一種動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)穩(wěn)定社區(qū)提取方法,其特征在于,所述方法包括:將相鄰兩個(gè)時(shí)間周期的社區(qū)作為社區(qū)對(duì),獲取預(yù)定時(shí)間窗口內(nèi)各個(gè)社區(qū)對(duì)的相對(duì)重疊度值; 根據(jù)獲取的相對(duì)重疊度值獲取社區(qū)規(guī)模穩(wěn)定度值; 獲取社區(qū)分裂值; 根據(jù)獲取的社區(qū)規(guī)模穩(wěn)定度值和社區(qū)分裂值判斷社區(qū)是否符合預(yù)設(shè)的條件,當(dāng)判斷社區(qū)滿足預(yù)設(shè)的條件時(shí),確定所述社區(qū)為穩(wěn)定社區(qū)。
7.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述根據(jù)獲取的相對(duì)重疊度值獲取社區(qū)規(guī)模穩(wěn)定度值具體為: 根據(jù)以下公式獲取社區(qū)規(guī)模穩(wěn)定度值:
8.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述獲取社區(qū)分裂值具體為: 獲取社區(qū)內(nèi)各節(jié)點(diǎn)的分裂度值; 將社區(qū)內(nèi)各節(jié)點(diǎn)的分裂度值的平均值作為社區(qū)分裂值。
9.根據(jù)權(quán)利要求8所述的方法,其特征在于,所述獲取社區(qū)內(nèi)各節(jié)點(diǎn)的分裂度值具體包括: 獲取社區(qū)中各節(jié)點(diǎn)對(duì)應(yīng)的出度值和各節(jié)點(diǎn)對(duì)應(yīng)的入度值; 獲取所述各節(jié)點(diǎn)的出度值與入度值之和; 將各節(jié)點(diǎn)對(duì)應(yīng)的出度值除以所述出度值與入度值之和得到的比值作為各節(jié)點(diǎn)的分裂度值。
10.根據(jù)權(quán)利要求6所述的方法,其特征在于,所述方法還包括: 當(dāng)確定社區(qū)是穩(wěn)定社區(qū)時(shí),獲取所述社區(qū)內(nèi)各節(jié)點(diǎn)的地址,向各節(jié)點(diǎn)發(fā)送第三內(nèi)容; 當(dāng)確定社區(qū)是不穩(wěn)定社區(qū)時(shí),獲取所述社區(qū)內(nèi)各節(jié)點(diǎn)的地址,向各節(jié)點(diǎn)發(fā)送第四內(nèi)容; 其中,所述第三內(nèi)容和第四內(nèi)容不同。
11.一種動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)社區(qū)演化識(shí)別裝置,其特征在于,所述裝置包括: 數(shù)據(jù)處理模塊,用于采集原始數(shù)據(jù),根據(jù)數(shù)據(jù)之間的關(guān)聯(lián)關(guān)系按照第一預(yù)定時(shí)間周期建立每個(gè)時(shí)間周期的社會(huì)網(wǎng)絡(luò); 社區(qū)發(fā)現(xiàn)模塊,用于利用派系過濾方法劃分每個(gè)時(shí)間周期的社區(qū); 社區(qū)演化識(shí)別模塊。用于獲取相鄰兩個(gè)時(shí)間周期的社區(qū)作為社區(qū)對(duì),獲取每一個(gè)社區(qū)對(duì)的相對(duì)重疊度值;比較所述相對(duì)重疊度值,獲取具有相對(duì)重疊度值最高的社區(qū)對(duì),確定所述具有相對(duì)重疊度值最高的社區(qū)對(duì)為具有繼承演化關(guān)系的社區(qū)對(duì)。
12.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述社區(qū)演化識(shí)別模塊具體包括重疊度獲取單元和比較單元,其中,所述重疊度獲取單元具體包括: 社區(qū)對(duì)獲取子單元,用于獲取相鄰兩個(gè)時(shí)間周期的社區(qū)Di和作為社區(qū)對(duì); 疊加子單元,用于將相鄰兩個(gè)時(shí)間周期的社區(qū)對(duì)按照相同節(jié)點(diǎn)進(jìn)行連接關(guān)系的疊加,獲取置加后的社會(huì)網(wǎng)絡(luò); 劃分子單元,用于利用派系過濾方法劃分疊加后的社會(huì)網(wǎng)絡(luò)中的社區(qū)Vk; 計(jì)算子單元,用于根據(jù)以下公式計(jì)算每一個(gè)社區(qū)對(duì)的相對(duì)重疊度值(
13.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述裝置還包括: 執(zhí)行模塊,用于根據(jù)確定的社區(qū)演化繼承關(guān)系,對(duì)不同社區(qū)的節(jié)點(diǎn)執(zhí)行不同的處理策略。
14.根據(jù)權(quán)利要求11所述的裝置,其特征在于,所述裝置還包括: 穩(wěn)定社區(qū)提取模塊,用于獲取預(yù)定時(shí)間窗口內(nèi)具有繼承演化關(guān)系的社區(qū)對(duì)的相對(duì)重疊度值;根據(jù)獲取的相對(duì)重疊度值獲取社區(qū)規(guī)模穩(wěn)定度值;獲取社區(qū)分裂值;根據(jù)獲取的社區(qū)規(guī)模穩(wěn)定度值和社區(qū)分裂值判斷社區(qū)是否符合預(yù)設(shè)的條件,當(dāng)判斷社區(qū)滿足預(yù)設(shè)的條件時(shí),確定所述社區(qū)為穩(wěn)定社區(qū)。
15.一種動(dòng)態(tài)社會(huì)關(guān)系網(wǎng)絡(luò)穩(wěn)定社區(qū)提取裝置,其特征在于,所述裝置包括: 重疊度獲取模塊,用于將相鄰兩個(gè)時(shí)間周期的社區(qū)作為社區(qū)對(duì),獲取預(yù)定時(shí)間窗口內(nèi)各個(gè)社區(qū)對(duì)的相對(duì)重疊度值; 穩(wěn)定度值獲取模塊,用于根據(jù)獲取的相對(duì)重疊度值獲取社區(qū)規(guī)模穩(wěn)定度值; 分裂值獲取模塊,用于獲取社區(qū)分裂值; 判斷模塊,用于根據(jù)獲取的社區(qū)規(guī)模穩(wěn)定度值和社區(qū)分裂值判斷社區(qū)是否符合預(yù)設(shè)的條件,當(dāng)判斷社區(qū)滿足預(yù)設(shè)的條件時(shí),確定所述社區(qū)為穩(wěn)定社區(qū)。
16.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述穩(wěn)定度值獲取模塊具體用于根據(jù)以下公式獲取社區(qū)規(guī)模穩(wěn)定度值:
17.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述分裂值獲取模塊具體包括: 節(jié)點(diǎn)分裂值獲取單元,用于獲取社區(qū)內(nèi)各節(jié)點(diǎn)的分裂度值; 平均值獲取單元,用于將社區(qū)內(nèi)各節(jié)點(diǎn)的分裂度值的平均值作為社區(qū)分裂值。
18.根據(jù)權(quán)利要求15所述的裝置,其特征在于,所述裝置還包括: 第一發(fā)送單元,用于當(dāng)確定社區(qū)是穩(wěn)定社區(qū)時(shí),獲取所述社區(qū)內(nèi)各節(jié)點(diǎn)的地址,向各節(jié)點(diǎn)發(fā)送第三內(nèi)容; 第二發(fā)送單元,用于當(dāng)確定社區(qū)是不穩(wěn)定社區(qū)時(shí),獲取所述社區(qū)內(nèi)各節(jié)點(diǎn)的地址,向各節(jié)點(diǎn)發(fā)送第四內(nèi)容。
【文檔編號(hào)】G06F17/30GK103853739SQ201210501138
【公開日】2014年6月11日 申請(qǐng)日期:2012年11月29日 優(yōu)先權(quán)日:2012年11月29日
【發(fā)明者】陶振武 申請(qǐng)人:中國(guó)移動(dòng)通信集團(tuán)公司