本發(fā)明涉及信息技術(shù)領(lǐng)域,尤其涉及一種目標(biāo)對(duì)象的社交賬號(hào)挖掘方法及服務(wù)器。
背景技術(shù):
隨著移動(dòng)互聯(lián)網(wǎng)的普及,人們通過社交網(wǎng)絡(luò)進(jìn)行日常交流,信息同步,言論發(fā)表等行為已經(jīng)非常普遍。常見的可用于社交網(wǎng)絡(luò)進(jìn)行社交的社交應(yīng)用可包括微信、QQ、豆瓣等。
在社交的過程中,經(jīng)常會(huì)出現(xiàn)意見領(lǐng)袖等社交影響大的任務(wù),這些意見領(lǐng)袖利用他們的社交賬號(hào)發(fā)表觀點(diǎn)、轉(zhuǎn)發(fā)文章等,從而影響其他用戶。在具體實(shí)現(xiàn)時(shí),有時(shí)候需要挖掘出這些影響力大的社交賬號(hào),以通過利用這些賬號(hào)的影響力,在有限的資源下獲得活動(dòng)的影響最大化。例如,在廣告特定人群投放方面,特定人群挖掘的精準(zhǔn)度對(duì)于點(diǎn)擊率效果非常重要。再例如,銀行征信項(xiàng)目中,人群屬性是非常重要的參考因素;在安全方面,對(duì)于惡意用戶甚至違法分子通過社交網(wǎng)絡(luò)幫助快速定位。這些,廣告特定人群、人群屬性以及惡意用戶的定位,都涉及到目標(biāo)對(duì)象的社交賬號(hào)的挖掘?,F(xiàn)有技術(shù)中提供了多種目標(biāo)對(duì)象的社交賬號(hào)的挖掘,例如,臉書提出的相似挖掘、根據(jù)社交賬號(hào)網(wǎng)絡(luò)行為的挖掘以及基于社團(tuán)劃分的挖掘;然而實(shí)際使用過程中發(fā)現(xiàn),這些方法要么存在精確度的問題,要么就存在著計(jì)算復(fù)雜度大的問題。
技術(shù)實(shí)現(xiàn)要素:
有鑒于此,本發(fā)明實(shí)施例期望提供一種目標(biāo)對(duì)象的社交賬號(hào)挖掘方法及服務(wù)器,至少部分解決上述問題。
為達(dá)到上述目的,本發(fā)明的技術(shù)方案是這樣實(shí)現(xiàn)的:
本發(fā)明實(shí)施例一方面提供一種目標(biāo)對(duì)象的社交賬號(hào)挖掘方法,包括:
利用目標(biāo)對(duì)象的屬性信息,定位所述目標(biāo)對(duì)象所在的目標(biāo)社交群;
解析所述目標(biāo)社交群中社交賬號(hào)的預(yù)定信息,獲取所述社交賬號(hào)對(duì)應(yīng)的用戶的第一身份信息;
將所述第一身份信息與目標(biāo)對(duì)象的第二身份信息進(jìn)行匹配;
確定與所述第二身份信息匹配的所述第一身份信息的社交賬號(hào)為所述目標(biāo)對(duì)象的社交賬號(hào)。
本發(fā)明實(shí)施例另一方面提供一種服務(wù)器,包括:
定位單元,用于利用目標(biāo)對(duì)象的屬性信息,定位所述目標(biāo)對(duì)象所在的目標(biāo)社交群;
解析單元,用于解析所述目標(biāo)社交群中社交賬號(hào)的預(yù)定信息,獲取所述社交賬號(hào)對(duì)應(yīng)的用戶的第一身份信息;
匹配單元,用于將所述第一身份信息與目標(biāo)對(duì)象的第二身份信息進(jìn)行匹配;
確定單元,用于確定與所述第二身份信息匹配的所述第一身份信息的社交賬號(hào)為所述目標(biāo)對(duì)象的社交賬號(hào)。
本發(fā)明實(shí)施例提供的目標(biāo)對(duì)象的社交賬號(hào)挖掘方法及服務(wù)器,會(huì)從社交賬號(hào)的預(yù)定信息中提取出用戶的身份信息,再將該提取出的身份信息與用戶線下的身份信息匹配,就能夠精確定位出目標(biāo)用戶的社交賬號(hào),采用這種線上的身份信息和線下的身份信息的匹配,能夠提高精確度,相對(duì)于社交賬號(hào)中的海量行為等其他方法來確定目標(biāo)用戶的社交賬號(hào),直接利用身份信息的匹配,還具有需要處理的信息量少,計(jì)算復(fù)雜度低及計(jì)算簡(jiǎn)單的特點(diǎn)。
附圖說明
圖1為本發(fā)明實(shí)施例提供的一種目標(biāo)對(duì)象的社交賬號(hào)挖掘方法的流程示意圖;
圖2為本發(fā)明實(shí)施例提供的一種社區(qū)網(wǎng)絡(luò)構(gòu)建方法的流程示意圖;
圖3為本發(fā)明實(shí)施例提供的一種服務(wù)器的結(jié)構(gòu)示意圖;
圖4為本發(fā)明實(shí)施例提供的另一種服務(wù)器的結(jié)構(gòu)示意圖;
圖5本發(fā)明實(shí)施例提供的一種目標(biāo)對(duì)象的社交賬號(hào)挖掘方法的流程示意圖;
圖6為本發(fā)明實(shí)施例提供的一種備選社交群的效果示意圖;
圖7為本發(fā)明實(shí)施例提供的一種目標(biāo)社交群的效果示意圖;
圖8為本發(fā)明實(shí)施例挖掘的社交賬號(hào)的用戶信息效果示意圖之一;
圖9為本發(fā)明實(shí)施例挖掘的社交賬號(hào)的用戶信息效果示意圖之二;
圖10為本發(fā)明實(shí)施提供的目標(biāo)對(duì)象參與的其他社交群的效果示意圖;
圖11為本發(fā)明實(shí)施例提供的一種身份信息挖掘方法的流程示意圖;
圖12為本發(fā)明實(shí)施例提供的一種基于關(guān)系鏈拓展的目標(biāo)對(duì)象的社交賬號(hào)挖掘流程示意圖。
具體實(shí)施方式
以下結(jié)合說明書附圖及具體實(shí)施例對(duì)本發(fā)明的技術(shù)方案做進(jìn)一步的詳細(xì)闡述。
如圖1所示,本實(shí)施例提供一種目標(biāo)對(duì)象的社交賬號(hào)挖掘方法,包括:
步驟S110:利用目標(biāo)對(duì)象的屬性信息,定位所述目標(biāo)對(duì)象所在的目標(biāo)社交群;
步驟S120:解析所述目標(biāo)社交群中社交賬號(hào)的預(yù)定信息,獲取所述社交賬號(hào)對(duì)應(yīng)的用戶的第一身份信息;
步驟S130:將所述第一身份信息與目標(biāo)對(duì)象的第二身份信息進(jìn)行匹配;
步驟S140:確定與所述第二身份信息匹配的所述第一身份信息的社交賬號(hào)為所述目標(biāo)對(duì)象的社交賬號(hào)。
本實(shí)施例提供的目標(biāo)對(duì)象的社交賬號(hào)挖掘方法,可應(yīng)用于各種具有信息處理的電子設(shè)備中,具體應(yīng)用于分布式計(jì)算機(jī)網(wǎng)絡(luò)中,可由多臺(tái)設(shè)備來執(zhí)行。
在本實(shí)施例中所述目標(biāo)對(duì)象可為目標(biāo)用戶。所述社交群可為各種可用于網(wǎng)絡(luò)社交功能的虛擬組織,通常都至少包括兩個(gè)成員。所述社交群可包括微信群、QQ群等各種群。
所述目標(biāo)對(duì)象的屬性信息可包括身份信息、職位信息、年齡信息等各種特征信息,在步驟S110中通常選擇所述目標(biāo)對(duì)象較為獨(dú)特的屬性信息,例如可以唯一區(qū)分所述目標(biāo)對(duì)象與其他用戶的屬性信息。例如,所述目標(biāo)對(duì)象為Y企業(yè)創(chuàng)始人B先生,就可以用“Y企業(yè)”這一關(guān)鍵詞或“Y企業(yè)高管”、或者甚至“B先生”、“Y企業(yè)創(chuàng)始人”這些詞條作為B先生的屬性信息,確定出目標(biāo)社交群。例如,“Y企業(yè)高管”為目標(biāo)對(duì)象的信息,通過信息匹配就可以找到群名或群名備注為“Y企業(yè)高管”的社交群作為所述目標(biāo)社交群。通常此時(shí),目標(biāo)對(duì)象的社交賬號(hào)在目標(biāo)社交群中的概率較高。
在步驟S120中解析目標(biāo)社交群中社交賬號(hào)的預(yù)定信息。這里的預(yù)定信息可包括群昵稱、社交賬號(hào)等信息。通常為了方便社交過程中識(shí)別,有些用戶不局限于用網(wǎng)絡(luò)名稱進(jìn)行社交,還會(huì)在各種備注信息中備注自己的日常生活所用的名稱等身份信息。例如,在群昵稱字段中:李娜;該李娜是一個(gè)用戶日常生活中使用到的稱呼,甚至可能是用戶身份證或護(hù)照上使用的稱呼。所述第一身份信息可包括用戶的線下的稱呼。所述線下的稱呼,可如“李娜”等包括姓氏和名稱;也可以是包括職業(yè)稱呼,例如“北大校長(zhǎng)”等,這些信息都可以是所述第一身份信息,能夠表示用戶在線下的身份。所述第二身份信息可為執(zhí)行本實(shí)施例所述方法的電子設(shè)備從其他電子設(shè)備,或從人機(jī)交互接口接收到的信息。例如,當(dāng)前目標(biāo)對(duì)象是Y企業(yè)高管;則以Y企業(yè)高管為檢索詞條,就可能搜索到Y(jié)企業(yè)公司高管的名錄以及對(duì)應(yīng)的職位等信息。
在步驟S130中將從社交賬號(hào)中提取的第一身份信息和第二身份信息進(jìn)行匹配,若匹配成功,則表示對(duì)應(yīng)的賬號(hào)為目標(biāo)對(duì)象的社交賬號(hào)的概率非常高,就可認(rèn)為是找大了目標(biāo)對(duì)象的社交賬號(hào)。顯然就挖掘到了目標(biāo)對(duì)象的社交賬號(hào),采用這種結(jié)合用戶的線下身份信息來定位其社交賬號(hào)的方法,具有復(fù)雜度低且精確度高的特點(diǎn)。
本實(shí)施例為了更加充分的挖掘出目標(biāo)對(duì)象的社交賬號(hào),首先需要精確的定位目標(biāo)社交群,以下提供一種可選簡(jiǎn)便快捷且精確定位目標(biāo)社交群的方法,具體如,所述步驟S110可包括:
利用所述屬性信息,與備選社交群的群屬性進(jìn)行匹配;
選擇群屬性與所述屬性信息相匹配的社交群為所述目標(biāo)社交群。
通常一個(gè)社交群都會(huì)設(shè)置對(duì)應(yīng)的群名或群標(biāo)簽等。所述群名或群標(biāo)簽即為所述群屬性。這些群名等群屬性可以從一定的程度上反映該社交群內(nèi)社交賬號(hào)對(duì)應(yīng)的用戶的身份信息。在本實(shí)施例中直接通過群名的匹配,可以便捷的找到部分目標(biāo)社交群。但是有時(shí)候,有些社交群的群名并不能很好的反映社交群內(nèi)的成員的身份信息。在本實(shí)施例中將采用以下方法,來挖掘群名不能精確反映群內(nèi)成員的身份信息的方法。所述方法還包括:
構(gòu)建群社區(qū);其中,所述群社區(qū)包括至少兩個(gè)滿足預(yù)定關(guān)聯(lián)度的社交群;
對(duì)所述社交群的屬性信息進(jìn)行信息聚類,確定聚類主題并確定出與所述屬性信息滿足預(yù)設(shè)匹配度的目標(biāo)聚類主題;
過濾與所述目標(biāo)聚類主題不相關(guān)的所述群社區(qū),獲得與所述目標(biāo)聚類主題相關(guān)的目標(biāo)群社區(qū);其中,位于所述目標(biāo)群社區(qū)中的所述社交群為所述備選社交群。
若一個(gè)目標(biāo)對(duì)象位于多個(gè)社交群,則這些社交群就會(huì)有相同的社交賬號(hào),此時(shí),即可認(rèn)為這些社交群滿足預(yù)定的關(guān)聯(lián)度。
在本實(shí)施例中將構(gòu)建群社區(qū),該群社區(qū)包括至少兩個(gè)社交群。社交群里的群成員即對(duì)應(yīng)于社交賬號(hào)的用戶。
進(jìn)入對(duì)群社區(qū)內(nèi)的社交群進(jìn)行信息聚類。這里的信息聚類可包括提取每一個(gè)社交群的群名,將這群名視為文檔,采用文檔主題生成模型(Latent Dirichlet Allocation,LDA)進(jìn)行主題聚類,形成聚類結(jié)果。所述LDA也稱為一個(gè)三層貝葉斯概率模型,包含詞、主題和文檔三層結(jié)構(gòu)。所述文檔主題生成模會(huì)將文檔內(nèi)每個(gè)詞都是通過“以一定概率選擇了某個(gè)主題,并從這個(gè)主題中以一定概率選擇某個(gè)詞語(yǔ)”這樣一個(gè)過程得到。文檔到主題服從多項(xiàng)式分布,主題到詞服從多項(xiàng)式分布。同時(shí)LDA還是一種非監(jiān)督機(jī)器學(xué)習(xí)技術(shù),可以用來識(shí)別大規(guī)模文檔集或語(yǔ)料庫(kù)中潛藏的主題信息。
當(dāng)然所述群社區(qū)的屬性信息不局限于群名,還可包括群內(nèi)的聊天記錄或社交群的群空間內(nèi)存儲(chǔ)的群文檔;或社交群內(nèi)群空間內(nèi)存儲(chǔ)的群圖片中提取的信息。
總之通過主題聚類,可以確定出多個(gè)群社區(qū)的關(guān)聯(lián)度。接下來選擇與目標(biāo)對(duì)象的屬性信息相符的目標(biāo)聚類主題來過濾群社區(qū)。例如,群社區(qū)有多個(gè),通過信息聚類,發(fā)現(xiàn)有些群社區(qū)跟A大學(xué)相關(guān),有些群社區(qū)跟B大學(xué)相關(guān);而此時(shí)目標(biāo)對(duì)象是A大學(xué)的教授;接下來就選擇A大學(xué)作為所述目標(biāo)聚類主題,過濾掉與A大學(xué)不相關(guān)的群社區(qū),獲得目標(biāo)群社區(qū)。在本實(shí)施例中在進(jìn)行目標(biāo)聚類主題過濾群社區(qū)時(shí),可以利用目標(biāo)聚類主題與群社區(qū)的社區(qū)屬性進(jìn)行模糊匹配,定位出所述目標(biāo)群。所述模糊匹配不一定完全包括目標(biāo)聚類主題,可以包括目標(biāo)聚類主題的同義詞條等,以盡可能避免漏選目標(biāo)對(duì)象所在目標(biāo)群社區(qū)。位于所述目標(biāo)群社區(qū)中的社交群即為所述備選社交群。
再選擇出了所述備選社交群之后,利用精確匹配從備選社交群中選擇出與所述目標(biāo)對(duì)象的屬性信息匹配的目標(biāo)社交群。這的精確匹配通常是要求兩個(gè)匹配的詞條之間完全匹配,兩個(gè)詞條有同義都不是所述精確匹配,這樣以精確定位所述目標(biāo)社交群,減少所述目標(biāo)對(duì)象不再的社交群的個(gè)數(shù),減少后續(xù)處理的數(shù)據(jù)量,以降低處理復(fù)雜度和運(yùn)算量。在確定所述目標(biāo)社交群可包括:首先利用目標(biāo)對(duì)象的屬性信息與備選群社區(qū)中的社交群的群屬性進(jìn)行精確匹配,選擇出精確匹配成功次數(shù)大于預(yù)定次數(shù)的群社區(qū)作為目標(biāo)群社區(qū)。再將目標(biāo)群社區(qū)中的社交群作為所述目標(biāo)社交群。當(dāng)然還可以利用所述目標(biāo)用戶的群屬性與目標(biāo)群社區(qū)中的社交群進(jìn)行再次匹配,本次匹配可以上述模糊匹配,若模糊匹配成功,則模糊匹配成功的社交群即為所述目標(biāo)社交群。
當(dāng)然確定所述備選社交群的方法,除了上述方法之外,還可將直接將一中社交工具中所有的社交群視為備選社交群等。
在選擇出目標(biāo)群社區(qū)之間,需要將一個(gè)一個(gè)單獨(dú)的群社交劃分到群社區(qū)內(nèi),劃分的方法有可以群名等群信息聚類來獲得,以下提供另外一種聚類精確高的可選方法:
所述構(gòu)建群社區(qū),包括:
首先,構(gòu)建至少包括兩個(gè)所述社交群的社區(qū)網(wǎng)絡(luò);所述社交群為所述社區(qū)網(wǎng)絡(luò)中的結(jié)點(diǎn);第一結(jié)點(diǎn)和第二結(jié)點(diǎn)包含有相同社交賬號(hào),則所述第一結(jié)點(diǎn)到所述第二結(jié)點(diǎn)之間設(shè)有有向邊;所述有向邊的邊權(quán)重等于第一數(shù)值與第二數(shù)值的比值;所述第一數(shù)值為所述第一結(jié)點(diǎn)和第二結(jié)點(diǎn)包含有相同社交賬號(hào)的數(shù)目;所述第二數(shù)值為第二結(jié)點(diǎn)包含的社交賬號(hào)的數(shù)據(jù)。本實(shí)施例中所述有向邊為有向邊。所述有向邊為有方向的邊。在本實(shí)施例中所述有向邊為從一個(gè)結(jié)點(diǎn)指向另一個(gè)結(jié)點(diǎn)的邊。
在圖2中顯示有3個(gè)社交群,分別是G1、G2及G3。所述G1中包括5個(gè)成員,一個(gè)所述成員對(duì)應(yīng)一個(gè)社交賬號(hào)。所述G2中包括4個(gè)成員。所述G3包括6個(gè)成員。在圖2中填充相同陰影的小圓圈代表相同的社交賬號(hào),故由圖2可知,G1和G2有3個(gè)相同的社交賬號(hào);G2和G3有2個(gè)相同的社交賬號(hào);G1和G3有3個(gè)相同的社交賬號(hào),由兩個(gè)社交群共同包含的社交賬號(hào)可稱為共同社交賬號(hào)。
利用圖2中G1、G2及G3構(gòu)建社區(qū)如圖2中右側(cè)所示的社區(qū)網(wǎng)絡(luò)。構(gòu)建社區(qū)網(wǎng)絡(luò),具體如通過構(gòu)建社區(qū)圖來構(gòu)建所述社區(qū)網(wǎng)絡(luò)。
所述社區(qū)圖具有以下特點(diǎn):
圖類型:有向圖
圖結(jié)點(diǎn):一個(gè)社交圈應(yīng)圖的一個(gè)結(jié)點(diǎn);
圖邊:存在共同群成員的兩個(gè)結(jié)點(diǎn)之間的連接線。
在構(gòu)建完所述社區(qū)網(wǎng)絡(luò)之后,需要計(jì)算邊權(quán)重。
在計(jì)算邊權(quán)重時(shí),將共同社交賬號(hào)的第一數(shù)值與結(jié)點(diǎn)包括的社交賬號(hào)的第二數(shù)值的比較,即得到所述邊權(quán)重。例如,從G1到G2的有向邊的邊權(quán)重為可以采用如下公式計(jì)算:
WGy——→Gx=Countcom(Gy,Gx)/Count(Gx)
其中,所述WGy——→Gx表示從社交群Gy到社交群Gx的邊權(quán)重。所述Countcom(Gy,Gx)表示社交群Gy和社交群Gx的共同社交成賬號(hào);所述Count(Gx)為社交群的社交賬號(hào)。
故在圖2所示的社區(qū)圖中,顯示有從G1到G2的邊權(quán)重為:/4=0.75;從G1到G3的邊權(quán)重為:3/6=0.5;從G2到G1的邊權(quán)重為:3/5=0.6;從G2到G3的邊權(quán)重:2/6=0.33;從G3到G1的邊權(quán)重:3/5=0.6;從G3到G2的邊權(quán)重為2/4=0.5。
其次,遍歷社區(qū)網(wǎng)絡(luò),以每一個(gè)結(jié)點(diǎn)為目標(biāo)結(jié)點(diǎn),收集目標(biāo)結(jié)點(diǎn)的相鄰結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)簽及對(duì)應(yīng)的入度邊權(quán)重;其中,所述入度邊權(quán)重為從所述相鄰結(jié)點(diǎn)指向所述目標(biāo)結(jié)點(diǎn)的有向邊的邊權(quán)重;所述目標(biāo)結(jié)點(diǎn)為所述社區(qū)網(wǎng)絡(luò)中的一個(gè)結(jié)點(diǎn)。在本實(shí)施例中遍歷所述社區(qū)網(wǎng)絡(luò)為:以每一個(gè)所述結(jié)點(diǎn)為一次所述目標(biāo)結(jié)點(diǎn)。每一個(gè)所述結(jié)點(diǎn)都對(duì)應(yīng)一個(gè)結(jié)點(diǎn)標(biāo)簽,該結(jié)點(diǎn)標(biāo)簽的初始值可為對(duì)應(yīng)結(jié)點(diǎn)自身的結(jié)點(diǎn)標(biāo)識(shí)。例如,以G1為目標(biāo)結(jié)點(diǎn),則其入度邊包括兩條有向邊,分別是從G2到G1的有向邊,從G3到G1的有向邊;對(duì)應(yīng)的入度邊權(quán)重為0.5和0.6,顯然G3到G1的有向邊的邊權(quán)重最大。若所述G1為第一個(gè)進(jìn)行遍歷的目標(biāo)結(jié)點(diǎn),則此時(shí)會(huì)將G1的結(jié)點(diǎn)標(biāo)簽替換成G3的結(jié)點(diǎn)標(biāo)簽。由于G3的結(jié)點(diǎn)標(biāo)識(shí)的初始值為G3自身的結(jié)點(diǎn)標(biāo)識(shí),則G1的結(jié)點(diǎn)標(biāo)簽在被更新后為G3的結(jié)點(diǎn)標(biāo)識(shí)。
再次,將結(jié)點(diǎn)標(biāo)簽相同的所述入度邊權(quán)重相加。在遍歷開始之前,每一個(gè)結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)簽都是其自身,隨著遍歷了部分結(jié)點(diǎn)之后,有些結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)簽已經(jīng)更替為了其他結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)識(shí),這個(gè)時(shí)候目標(biāo)結(jié)點(diǎn)的有向邊中可能有多個(gè)是對(duì)應(yīng)于同一個(gè)結(jié)點(diǎn)標(biāo)識(shí)的,故此時(shí)需要將結(jié)點(diǎn)標(biāo)簽相同的所述入讀邊的權(quán)重相加。
接著,利用最大所述入度邊權(quán)重對(duì)應(yīng)的結(jié)點(diǎn)標(biāo)簽,替換所述目標(biāo)結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)簽。相加后得到了一個(gè)目標(biāo)結(jié)點(diǎn)的所有有向邊的邊權(quán)重及有向邊對(duì)應(yīng)的結(jié)點(diǎn)標(biāo)簽,選擇邊權(quán)重最大的結(jié)點(diǎn)標(biāo)簽,替換目標(biāo)結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)簽。
最后,當(dāng)遍歷完所述社區(qū)網(wǎng)絡(luò)之后,將具有相同結(jié)點(diǎn)標(biāo)簽的社交群劃分到一個(gè)群社區(qū)。當(dāng)遍歷完所有社區(qū)網(wǎng)絡(luò)中的結(jié)點(diǎn)之后,部分或全部結(jié)點(diǎn)標(biāo)簽進(jìn)行了更新。在本實(shí)施例中會(huì)將具有相同結(jié)點(diǎn)標(biāo)簽的社交群劃分到同一個(gè)群社區(qū)中。顯然這樣得到的群社區(qū)內(nèi)社交群任意兩個(gè)社交群都會(huì)有相同的社交賬號(hào)。故此處,滿足所述預(yù)設(shè)關(guān)聯(lián)度的社交群可為:群社區(qū)內(nèi)任意兩個(gè)社交群至少包括一個(gè)相同社交賬號(hào)。
所述步驟S120可包括:
提取所述目標(biāo)社交群中各所述社交賬號(hào)的備注信息;其中,所述備注信息為對(duì)用戶身份的進(jìn)行備注的信息;
從所述備注信息中提取所述第一身份信息。
圖所示為一個(gè)微信的社交賬號(hào)界面,顯然在該社交賬號(hào)的備注信息中可以看到一些社交賬號(hào)的用戶信息,這些用戶信息就包括用戶的名稱等信息。故可以從備注信息中提取出所述第一身份信息,所述第一身份信息可包括用戶名稱或昵稱等。所述備注信息可以對(duì)應(yīng)于社交賬號(hào)中能夠表明用戶身份的多個(gè)字段內(nèi)的信息。
具體地如,所述備注信息包括好友備注信息、群備注信息及賬號(hào)備注信息的至少其中之一;所述好友備注信息為第一社交賬號(hào)的好友賬號(hào)對(duì)所述第一社交賬號(hào)的備注信息;所述群備注信息為所述第一社交賬號(hào)在所述社交群的備注信息;所述賬號(hào)備注信息為所述第一社交賬號(hào)自身對(duì)用戶身份的備注信息。
在使用社交賬號(hào)時(shí),有些用戶直接會(huì)將自己的社交賬號(hào)的賬號(hào)名改成自己的名字或昵稱,當(dāng)加入一個(gè)社交群之后,在該社交群內(nèi)還會(huì)設(shè)置群昵稱或群稱呼等備注信息或標(biāo)簽信息。當(dāng)一個(gè)社交賬號(hào)被添加為其他社交賬號(hào)的好友之后,該社交賬號(hào)的備注信息可能會(huì)被好友用戶直接設(shè)置成該社交賬號(hào)的用戶的用戶名等。故在本實(shí)施例中可以從這些信息中提取所述第一身份信息,以方便在步驟S130中的匹配。在進(jìn)行第一身份信息和第二身份信息匹配時(shí),可以直接進(jìn)行匹配,在本實(shí)施例中為了避免所述第一身份信息中出現(xiàn)名字書寫錯(cuò)誤等,例如,書寫成同音字,在本實(shí)施例中所述步驟S130可包括:提取所述第一身份信息的發(fā)音信息;所述步驟S140可包括:將所述第一身份信息的發(fā)音信息與所述第二身份信息的發(fā)音信息進(jìn)行匹配。
所述發(fā)音信息可以為中文的拼音,在本實(shí)施例中通過中文拼音的匹配,可以避免有些中文漢字書寫錯(cuò)誤,導(dǎo)致的第一身份信息和第二身份信息明明指代的是同一人,而沒有匹配成功的問題,以提高匹配成功率。
當(dāng)所述目標(biāo)對(duì)象為多個(gè)且所述目標(biāo)對(duì)象具有關(guān)聯(lián)關(guān)系時(shí),所述方法還包括:
提取已確定社交賬號(hào)的所述目標(biāo)對(duì)象的好友賬號(hào);
解析所述好友賬號(hào)的預(yù)定信息,獲得待與所述第一身份信息匹配的所述第二身份信息。
所述目標(biāo)對(duì)象可能對(duì)應(yīng)多個(gè)目標(biāo)用戶,例如,目標(biāo)對(duì)象為Y企業(yè)高管,顯然可能有多個(gè),且這些多個(gè)目標(biāo)對(duì)象都是Y企業(yè)高管是有關(guān)聯(lián)關(guān)系的。那么這些目標(biāo)對(duì)象會(huì)基于這種關(guān)聯(lián)關(guān)系,可能是彼此的好友,這種好友關(guān)系會(huì)在社交賬號(hào)的好友賬號(hào)中體現(xiàn)出來。故在本實(shí)施例中會(huì)已確定社交賬號(hào)的目標(biāo)對(duì)象為種子用戶,提取種子用戶的社交賬號(hào)的好友賬號(hào),再次解析這些好友賬號(hào)的所述預(yù)定信息,這樣的話,就相當(dāng)于拓展了定位目標(biāo)對(duì)象的社交賬號(hào)的方位。例如,目標(biāo)對(duì)象A的好友包括目標(biāo)對(duì)象B;目標(biāo)對(duì)象B有可能不在目標(biāo)社交群內(nèi),通過這種好友關(guān)系鏈的解析,以目標(biāo)對(duì)象A為種子用戶,就能夠定位出目標(biāo)對(duì)象B的社交賬號(hào),從而提升了確定目標(biāo)對(duì)象的社交賬號(hào)的成功率。
如圖3所示,本實(shí)施例還提供一種服務(wù)器包括定位單元110、解析單元120、匹配單元130及確定單元140。所述定位單元110,用于利用目標(biāo)對(duì)象的屬性信息,定位所述目標(biāo)對(duì)象所在的目標(biāo)社交群;所述解析單元120,用于解析所述目標(biāo)社交群中社交賬號(hào)的預(yù)定信息,獲取所述社交賬號(hào)對(duì)應(yīng)的用戶的第一身份信息;所述匹配單元130,用于將所述第一身份信息與目標(biāo)對(duì)象的第二身份信息進(jìn)行匹配;所述確定單元140,用于確定與所述第二身份信息匹配的所述第一身份信息的社交賬號(hào)為所述目標(biāo)對(duì)象的社交賬號(hào)。
在本實(shí)施例中所述定位單元110、解析單元120、匹配單元130及確定單元140都可對(duì)應(yīng)于服務(wù)器內(nèi)信息處理結(jié)構(gòu)。所述信息處理結(jié)構(gòu)可包括中央處理器CPU、微處理器MCU、數(shù)字信號(hào)處理器DSP、可編程陣列PLC或應(yīng)用處理器AP等處理器。所述信息處理結(jié)構(gòu)還可包括專用集成電路ASIC。所述信息處理結(jié)構(gòu)可為能夠進(jìn)行信息處理的電子結(jié)構(gòu)。
本實(shí)施例中所述信息處理結(jié)構(gòu)可通過執(zhí)行預(yù)定代碼,實(shí)現(xiàn)上述單元的功能,以通過第一身份信息與線下的第二身份信息匹配,以精確確定出目標(biāo)對(duì)象的社交賬號(hào),以方面利用目標(biāo)對(duì)象的社交賬號(hào)進(jìn)行信息推廣及信息挖掘等后續(xù)操作。例如,目標(biāo)用戶由于其身份特征,可能會(huì)對(duì)某一些信息感興趣,通過社交賬號(hào)的挖掘可以實(shí)現(xiàn)有針對(duì)性的信息推廣,例如廣告發(fā)布。若目標(biāo)對(duì)象為意見領(lǐng)袖,意見領(lǐng)袖的發(fā)布或編輯或關(guān)注的信息,有非常大的概率會(huì)被以其為意見領(lǐng)袖的其他用戶所關(guān)注,故可以挖掘該社交賬號(hào)發(fā)布的信息,再發(fā)布到其他平臺(tái)或推廣給其他社交賬號(hào),以實(shí)現(xiàn)信息的精準(zhǔn)傳播等。
在一些實(shí)施例中,所述定位單元110,具體用于利用所述屬性信息,與備選社交群的群屬性進(jìn)行匹配;選擇群屬性與所述屬性信息相匹配的社交群為所述目標(biāo)社交群。例如,所述定位單元110可通過目標(biāo)用戶的屬性信息與備選社交圈的群屬性的匹配選擇出所述目標(biāo)社交群。所述群屬性可包括群名稱、群備注或群標(biāo)簽等各種能夠反映社交群內(nèi)群成員身份特征的信息。
在一些實(shí)施例中,所述服務(wù)器還包括構(gòu)建單元、聚類單元以及過濾單元。所述構(gòu)建單元,用于構(gòu)建群社區(qū);其中,所述群社區(qū)包括至少兩個(gè)滿足預(yù)定關(guān)聯(lián)度的社交群;所述聚類單元,用于對(duì)所述社交群的屬性信息進(jìn)行信息聚類,確定聚類主題并確定出與所述屬性信息滿足預(yù)設(shè)匹配度的目標(biāo)聚類主題;所述過濾單元,用于過濾與所述目標(biāo)聚類主題不相關(guān)的所述群社區(qū),獲得與所述目標(biāo)聚類主題相關(guān)的目標(biāo)群社區(qū);其中,位于所述目標(biāo)群社區(qū)中的所述社交群為所述備選社交群。本實(shí)施例所述構(gòu)建單元以、所述聚類單元及過濾單元都可對(duì)應(yīng)于上述信息處理結(jié)構(gòu),利用上述信息處理結(jié)構(gòu)的信息處理,定位出所述目標(biāo)群社區(qū),將目標(biāo)群社區(qū)中的社交群確定備選社交群,顯然大大的縮小了備選社交群的范圍,簡(jiǎn)化了后續(xù)目標(biāo)社交群的定位,提升了目標(biāo)對(duì)象的社交賬號(hào)的確定效率。
例如,所述構(gòu)建單元,具體用于構(gòu)建至少包括兩個(gè)所述社交群的社區(qū)網(wǎng)絡(luò);所述社交群為所述社區(qū)網(wǎng)絡(luò)中的結(jié)點(diǎn);第一結(jié)點(diǎn)和第二結(jié)點(diǎn)包含有相同社交賬號(hào),則所述第一結(jié)點(diǎn)到所述第二結(jié)點(diǎn)之間設(shè)有有向邊;所述有向邊的邊權(quán)重等于第一數(shù)值與第二數(shù)值的比值;所述第一數(shù)值為所述第一結(jié)點(diǎn)和第二結(jié)點(diǎn)包含有相同社交賬號(hào)的數(shù)目;所述第二數(shù)值為第二結(jié)點(diǎn)包含的社交賬號(hào)的數(shù)據(jù);遍歷社區(qū)網(wǎng)絡(luò),以每一個(gè)結(jié)點(diǎn)為目標(biāo)結(jié)點(diǎn),收集目標(biāo)結(jié)點(diǎn)的相鄰結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)簽及對(duì)應(yīng)的入度邊權(quán)重;其中,所述入度邊權(quán)重為從所述相鄰結(jié)點(diǎn)指向所述目標(biāo)結(jié)點(diǎn)的有向邊的邊權(quán)重;所述目標(biāo)結(jié)點(diǎn)為所述社區(qū)網(wǎng)絡(luò)中的一個(gè)結(jié)點(diǎn);所述結(jié)點(diǎn)標(biāo)簽的初始值為對(duì)應(yīng)結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)識(shí);將結(jié)點(diǎn)標(biāo)簽相同的所述入度邊權(quán)重相加;利用最大所述入度邊權(quán)重對(duì)應(yīng)的結(jié)點(diǎn)標(biāo)簽,替換所述目標(biāo)結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)簽;當(dāng)遍歷完所述社區(qū)網(wǎng)絡(luò)之后,將具有相同結(jié)點(diǎn)標(biāo)簽的社交群劃分到一個(gè)群社區(qū)。
通過群社區(qū)的劃分,方便后續(xù)根據(jù)目標(biāo)用戶的屬性信息,第一次篩選出目標(biāo)用戶可能大致所在的社交群,從而以減少信息處理量,提升處理效率。
在一些實(shí)施例中,所述解析單元120,具體用于提取所述目標(biāo)社交群中各所述社交賬號(hào)的備注信息;其中,所述備注信息為對(duì)用戶身份的進(jìn)行備注的信息;從所述備注信息中提取所述第一身份信息。在本實(shí)施例中實(shí)施所述解析單元120會(huì)提取社交群各個(gè)社交賬號(hào)的備注信息來獲取身份信息。這里的標(biāo)注信息可為指定字段或指定類型的信息,在這些指定字段或指定類的信息中可能出現(xiàn)用戶收入的用戶身份信息,故可以通過解析這些信息獲取所述第一身份信息。
根據(jù)所述備注信息的來源,所述備注信息可包括好友備注信息、群備注信息及賬號(hào)備注信息。故所述備注信息包括好友備注信息、群備注信息及賬號(hào)備注信息的至少其中之一;所述好友備注信息為第一社交賬號(hào)的好友賬號(hào)對(duì)所述第一社交賬號(hào)的備注信息;所述群備注信息為所述第一社交賬號(hào)在所述社交群的備注信息;所述賬號(hào)備注信息為所述第一社交賬號(hào)自身對(duì)用戶身份的備注信息。
由于網(wǎng)絡(luò)信息可能會(huì)出現(xiàn)較為隨意的現(xiàn)象,經(jīng)常會(huì)將一個(gè)用戶的名字寫成同音字的現(xiàn)象,為了避免這種現(xiàn)象導(dǎo)致的匹配失敗,在本實(shí)施例中,所述解析單元120,具體用于提取所述第一身份信息的發(fā)音信息;所述匹配單元130,具體用于將所述第一身份信息的發(fā)音信息與所述第二身份信息的發(fā)音信息進(jìn)行匹配。通過發(fā)音信息的匹配,可以提升匹配的成功率,提升所述目標(biāo)對(duì)象的社交賬號(hào)確定的成功率。
此外,所述確定單元140,還用于當(dāng)所述目標(biāo)對(duì)象為多個(gè)且所述目標(biāo)對(duì)象具有關(guān)聯(lián)關(guān)系時(shí),提取已確定社交賬號(hào)的所述目標(biāo)對(duì)象的好友賬號(hào);解析所述好友賬號(hào)的所述預(yù)定信息,獲得待與所述第一身份信息匹配的所述第二身份信息。為了再次提高目標(biāo)用戶的社交賬號(hào)的定位成功率,在本實(shí)施中,不局限于目標(biāo)社交群中的社交賬號(hào)的匹配,還會(huì)通過已確定出社交賬號(hào)的好友關(guān)系鏈來定位,以提升目標(biāo)對(duì)象的社交賬號(hào)的確定成功率。
如圖4所示,本發(fā)明實(shí)施例還提供另一種服務(wù)器,所述服務(wù)器包括處理器402、存儲(chǔ)介質(zhì)404以及至少一個(gè)外部通信接口401;所述處理器402、存儲(chǔ)介質(zhì)404以及外部通信接口401均通過總線403連接。所述處理器402可為微處理器、中央處理器、數(shù)字信號(hào)處理器或可編程邏輯陣列等具有處理功能的電子元器件。
所述存儲(chǔ)介質(zhì)404上存儲(chǔ)有計(jì)算機(jī)可執(zhí)行指令;所述處理器402執(zhí)行所述存儲(chǔ)介質(zhì)404中存儲(chǔ)的所述計(jì)算機(jī)可執(zhí)行指令可實(shí)現(xiàn)上述任意技術(shù)方案提供的目標(biāo)對(duì)象的社交賬號(hào)挖掘方法,具體可執(zhí)行如圖1所述的方法。
以下結(jié)合上述任意實(shí)施例提供幾個(gè)示例:
示例一:
如圖5所示,本示例中以微信作為社交工具,提供一種目標(biāo)對(duì)象的微信賬號(hào)挖掘方法,可包括5大步驟,分別是:
步驟S1:微信群社區(qū)發(fā)現(xiàn);
步驟S2:微信群社區(qū)LDA主題聚類;
步驟S3:微信群文本挖掘;
步驟S4:用戶實(shí)名文本挖掘;這的實(shí)名可包括用戶在線下的社交生活中所使用的名字;
步驟S5:關(guān)系鏈擴(kuò)散,以獲得目標(biāo)對(duì)象的社交賬號(hào)。
所述步驟S1可包括:
步驟S11:微信群社區(qū)構(gòu)建;
步驟S12:全量做社區(qū)發(fā)現(xiàn),獲取的社區(qū)。這里的全量做社區(qū)發(fā)現(xiàn),包括對(duì)所有的社交群形成社區(qū)網(wǎng)絡(luò),通過社區(qū)網(wǎng)絡(luò)的劃分形成包括滿足預(yù)設(shè)相關(guān)度多個(gè)社交群的群社區(qū)。
步驟S2可包括:
步驟S21:針對(duì)每一個(gè)群社區(qū)手機(jī)該社區(qū)中所有群名稱;
步驟S22:把群社區(qū)看做文章,收集到的群名稱看做文章內(nèi)容,做LDA主題聚類。
步驟S3可包括:
步驟S31:通過主題模型過濾非相關(guān)主題的群社區(qū);
步驟S32:獲取需要挖掘高管對(duì)應(yīng)的公司名稱;
步驟S33:對(duì)于每一個(gè)群社區(qū),用群名稱匹配公司名稱;
步驟S34:匹配成功次數(shù)大于3次的群社區(qū)留下,作為含有高管主體的群社區(qū);
步驟S35:獲取群成員及群成員的實(shí)名與需要挖掘高管匹配作為種子人物。
所述步驟S4可包括:
步驟S41:收集用戶之前的備注信息;
步驟S42:收集用戶本身的群備注信息;
步驟S43:挖掘用戶實(shí)名;此處的所述用戶實(shí)名對(duì)應(yīng)于的前述的第一身份信息,可包括用戶線下的名稱或稱呼或頭銜等。
步驟S44:微信號(hào)實(shí)名挖掘數(shù)據(jù)。
步驟S5可包括:
步驟S51:拉取種子人物的好友以及對(duì)應(yīng)的實(shí)名;這里的種子用戶相當(dāng)于前述實(shí)施例中已確定出社交賬號(hào)的目標(biāo)對(duì)象。
步驟S52:判斷被挖掘高管與微信號(hào)是否匹配完畢,若未匹配完畢進(jìn)入步驟S55,若匹配完成,進(jìn)入步驟S53。
步驟S53:拉取高管的微信號(hào)信息;當(dāng)然在具體的實(shí)現(xiàn)過程中,當(dāng)社交賬號(hào)還可以是QQ號(hào)、臉書賬號(hào)、推特賬號(hào)等各種社交賬號(hào)。在拉取高管的微信號(hào)信息,可包括微信號(hào)本身,還可包括高管的微信好友等各種為信息。
步驟S54:根據(jù)網(wǎng)上資料判斷匹配微信號(hào)是否正確。
示例二:
下面以查找M公司的首席執(zhí)行官CEO為例說明,定位M公司CEO所用的微信賬號(hào)。分析M公司CEO的屬性信息,可知M公司CEO是目標(biāo)用戶的一個(gè)職業(yè)身份信息,M公司是一家互聯(lián)網(wǎng)公司,可以首先通過互聯(lián)網(wǎng)這一屬性可以選擇出與互聯(lián)網(wǎng)相關(guān)聯(lián)的微信群,利用樂視為屬性信息,選擇出與樂視相關(guān)的微信群,再利用樂視CEO的線下身份信息與微信中提取的身份信息進(jìn)行匹配,確定出樂視CEO的微信號(hào);例如,所述線下身份信息可包括樂視CEO的名字A。本示例的所述方法具體操作可如下:
首先,尋找M公司的微信群社區(qū)。
1)微信群社區(qū)主題過濾互聯(lián)網(wǎng)相關(guān)行業(yè)后,再利用名稱字符匹配含有“樂視”關(guān)鍵詞的群名稱;篩選出至少包含三個(gè)群名稱匹配成功的群社區(qū)。此處的群社區(qū)的匹配采用模糊匹配,匹配的效果圖可如圖6所示。
2)繼續(xù)過濾出高管主題的群社區(qū)。通過本次篩選的留下的社交群如圖7所示;圖7所示為基于圖6所示的備選社交群進(jìn)過再次篩選之后的目標(biāo)社交群。
其次,通過備注信息的解析,獲得各個(gè)微信賬號(hào)對(duì)應(yīng)的用戶的第一身份信息。例如,用戶基本信息查找;將查找后的基本信息進(jìn)行驗(yàn)證。圖8和圖9為在確定微信賬號(hào)之后,微信賬號(hào)確定的第一身份信息。
再次,第一身份信息與其他途徑獲取的第二身份信息進(jìn)行匹配,通過匹配確定出M公司CEO使用的微信賬號(hào)。
圖10所示的為:利用A對(duì)應(yīng)的社交賬號(hào)確定出的A參與的社交群。
微信群社區(qū)網(wǎng)絡(luò)的構(gòu)造:
圖類型:有向圖
圖結(jié)點(diǎn):一個(gè)微信群對(duì)應(yīng)圖的一個(gè)結(jié)點(diǎn)
圖的邊:存在共同的群成員的兩個(gè)群結(jié)點(diǎn)
圖的有向邊權(quán)重:
EdgeWeightGroupY-GroupX=CommonUserCount(GroupY,GroupX)/UserCount(GroupX)
CommonUserCount(GroupY,GroupX)表示社交群GroupY和社交群GroupX的共同社交賬號(hào)的數(shù)量。
UserCount(GroupX)表示社交群GroupY的社交賬號(hào)的數(shù)量。
所述EdgeWeighGtroupY-GroupX為從社交群GroupY到社交群GroupX的圖的邊的有向邊權(quán)重。
通過上述社區(qū)網(wǎng)絡(luò)的構(gòu)建,可以實(shí)現(xiàn)將成員數(shù)少的小社交群與成員數(shù)較多的大社交群。例如,當(dāng)一個(gè)100人部門群與一個(gè)10人小組群有建立關(guān)系的時(shí)候,這個(gè)10人同時(shí)屬于同于包括100個(gè)的部門中,則顯然在進(jìn)行上述社區(qū)網(wǎng)絡(luò)構(gòu)造中,會(huì)使得所述該140人小群組的結(jié)點(diǎn)標(biāo)簽會(huì)被提到成該100人部門群的結(jié)點(diǎn)標(biāo)簽。
關(guān)于社區(qū)發(fā)現(xiàn)的算法很多,可使用計(jì)算簡(jiǎn)單的標(biāo)簽傳遞算法(Label Propagation Algorithm,LPA),并利用收集應(yīng)用擴(kuò)散GAS(Gather Apply Scatter)方法進(jìn)行構(gòu)建,例如,采用分布式并行計(jì)算來進(jìn)行社區(qū)網(wǎng)絡(luò)的劃分。
分布式有向圖改進(jìn)版LPA社區(qū)發(fā)現(xiàn)算法包括:
第一,初始化操作:將每一個(gè)結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)簽設(shè)置為該結(jié)點(diǎn)自身的結(jié)點(diǎn)標(biāo)識(shí)。
第二,更新結(jié)點(diǎn)標(biāo)簽,更新結(jié)點(diǎn)標(biāo)簽包括:
收集操作:針對(duì)每個(gè)目標(biāo)結(jié)點(diǎn)收集其入度鄰居結(jié)點(diǎn)結(jié)點(diǎn)標(biāo)識(shí)以及對(duì)應(yīng)入度邊權(quán)重。
應(yīng)用操作:把收集到的鄰居結(jié)點(diǎn)與入度邊權(quán)重,分別對(duì)相同結(jié)點(diǎn)標(biāo)簽的入度邊權(quán)重進(jìn)行求和,最后選擇最大求和值對(duì)應(yīng)的結(jié)點(diǎn)標(biāo)簽作為本結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)簽。如果同時(shí)出現(xiàn)多個(gè)相同入度邊權(quán)重時(shí),則隨機(jī)選擇其中一個(gè)進(jìn)行結(jié)點(diǎn)標(biāo)簽進(jìn)行替換。
擴(kuò)散操作:對(duì)比新計(jì)算的結(jié)點(diǎn)標(biāo)簽與上一輪計(jì)算的結(jié)點(diǎn)標(biāo)簽是否有變化,如果有變化,通知所有鄰居結(jié)點(diǎn),表明本結(jié)點(diǎn)的結(jié)點(diǎn)標(biāo)簽有更新,需要進(jìn)行下一輪更新計(jì)算。
在本示例中,所述收集操作和所述擴(kuò)散操作,可異步進(jìn)行,每次收集操作首級(jí)到新的信息,則必然會(huì)導(dǎo)致應(yīng)用操作和擴(kuò)散操作的執(zhí)行和結(jié)點(diǎn)標(biāo)簽的新一輪的更新。
身份信息挖掘
根據(jù)用戶的備注信息,先轉(zhuǎn)化成拼音,然后通過分別匹配統(tǒng)計(jì)高概率姓氏與名稱最終確定用戶姓名。這里的拼音即為上述發(fā)音信息的一種。
例如,如圖11所示,包括:
步驟S61:收集用戶被好友備注的備注信息;
步驟S62:收集用戶本身的群備注信息;
步驟S63:拼音處理:對(duì)于相同拼音的名字都用最高頻名稱替代;
步驟S64:提取拼音;
步驟S65:獲取形式列表;
步驟S66:匹配最有可能的姓氏;
步驟S67:微信號(hào)實(shí)名挖掘數(shù)據(jù)。在本示例中通過拼音的提取和姓氏的匹配,這樣可以實(shí)現(xiàn)書寫錯(cuò)誤的校正,最后利用匹配出的姓氏進(jìn)行第一身份信息和第二身份信息的匹配,能夠提升匹配成功率。
迭代擴(kuò)散
對(duì)于已經(jīng)獲取到的種子用戶,通過拉取種子用戶的社交賬號(hào)的關(guān)系鏈,然后抽選出能同時(shí)加N個(gè)種子用戶為好友的備選用戶,拉取上一步挖掘?qū)嵜畔?,然后進(jìn)行高管名字匹配。對(duì)于匹配正確的高管作為下一輪的種子用戶迭代。
例如,如圖12所示,包括:
步驟S71:匹配正確的高管作為下一輪好友擴(kuò)散的種子人物;
步驟S72:拉取種子人物的好友以及對(duì)應(yīng)好友的實(shí)名;
步驟S73:被挖掘高管是否匹配完畢,未匹配完畢返回步驟S71,否則停止。
在本申請(qǐng)所提供的幾個(gè)實(shí)施例中,應(yīng)該理解到,所揭露的設(shè)備和方法,可以通過其它的方式實(shí)現(xiàn)。以上所描述的設(shè)備實(shí)施例僅僅是示意性的,例如,所述單元的劃分,僅僅為一種邏輯功能劃分,實(shí)際實(shí)現(xiàn)時(shí)可以有另外的劃分方式,如:多個(gè)單元或組件可以結(jié)合,或可以集成到另一個(gè)系統(tǒng),或一些特征可以忽略,或不執(zhí)行。另外,所顯示或討論的各組成部分相互之間的耦合、或直接耦合、或通信連接可以是通過一些接口,設(shè)備或單元的間接耦合或通信連接,可以是電性的、機(jī)械的或其它形式的。
上述作為分離部件說明的單元可以是、或也可以不是物理上分開的,作為單元顯示的部件可以是、或也可以不是物理單元,即可以位于一個(gè)地方,也可以分布到多個(gè)網(wǎng)絡(luò)單元上;可以根據(jù)實(shí)際的需要選擇其中的部分或全部單元來實(shí)現(xiàn)本實(shí)施例方案的目的。
另外,在本發(fā)明各實(shí)施例中的各功能單元可以全部集成在一個(gè)處理模塊中,也可以是各單元分別單獨(dú)作為一個(gè)單元,也可以兩個(gè)或兩個(gè)以上單元集成在一個(gè)單元中;上述集成的單元既可以采用硬件的形式實(shí)現(xiàn),也可以采用硬件加軟件功能單元的形式實(shí)現(xiàn)。
本領(lǐng)域普通技術(shù)人員可以理解:實(shí)現(xiàn)上述方法實(shí)施例的全部或部分步驟可以通過程序指令相關(guān)的硬件來完成,前述的程序可以存儲(chǔ)于一計(jì)算機(jī)可讀取存儲(chǔ)介質(zhì)中,該程序在執(zhí)行時(shí),執(zhí)行包括上述方法實(shí)施例的步驟;而前述的存儲(chǔ)介質(zhì)包括:移動(dòng)存儲(chǔ)設(shè)備、只讀存儲(chǔ)器(ROM,Read-Only Memory)、隨機(jī)存取存儲(chǔ)器(RAM,Random Access Memory)、磁碟或者光盤等各種可以存儲(chǔ)程序代碼的介質(zhì)。
以上所述,僅為本發(fā)明的具體實(shí)施方式,但本發(fā)明的保護(hù)范圍并不局限于此,任何熟悉本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明揭露的技術(shù)范圍內(nèi),可輕易想到變化或替換,都應(yīng)涵蓋在本發(fā)明的保護(hù)范圍之內(nèi)。因此,本發(fā)明的保護(hù)范圍應(yīng)以所述權(quán)利要求的保護(hù)范圍為準(zhǔn)。