欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種微博輿情風(fēng)險研判的方法與流程

文檔序號:11182016閱讀:2053來源:國知局
一種微博輿情風(fēng)險研判的方法與流程

本發(fā)明涉及數(shù)據(jù)挖掘技術(shù)領(lǐng)域,尤其涉及一種微博輿情風(fēng)險研判的方法。



背景技術(shù):

在日常生活中,突然事件頻繁發(fā)生,用戶越來越習(xí)慣于利用社交網(wǎng)絡(luò)(例如微博、論壇、twitter、facebook等)來發(fā)明自己的觀點(diǎn)或情感。在某個事件發(fā)生后,廣大群眾會通過各種途徑了解到真相,隨之而來的是大量的評論,這些評論中包括支持與反對,理性與感性,熱情或冷漠,當(dāng)評論中某一種評論或者某幾種評論占據(jù)較大的比例后,這一種或幾種評論會成對大眾的觀點(diǎn)具有導(dǎo)向作用,甚至可以讓整個事件的走向起到重要作用。負(fù)面輿論在網(wǎng)上發(fā)酵連帶引發(fā)的危機(jī)和事故就是輿情風(fēng)險,互聯(lián)網(wǎng)高度發(fā)達(dá)的今天,微博已經(jīng)成為一種至關(guān)重要的社交平臺,大多數(shù)人對網(wǎng)上的信息缺乏客觀的判斷能力,常以先入為主的心態(tài)看待事物,因此,對于輿情的分析非常重要,輿情風(fēng)險一旦出現(xiàn),在短期內(nèi),將會把輿情的中心人物或者企業(yè)推向風(fēng)口浪尖,會對中心人物或企業(yè)產(chǎn)生非常不利的影響,因此,對于微博輿情風(fēng)險的研判是對避免輿情風(fēng)險發(fā)生具有決定性的作用?,F(xiàn)有的微博輿情風(fēng)險研判的方法不具有及時性,且容易將風(fēng)險較低的信息漏掉,跟進(jìn)不及時的缺點(diǎn),導(dǎo)致無法對微博輿情風(fēng)險進(jìn)行準(zhǔn)確研判。



技術(shù)實現(xiàn)要素:

本發(fā)明的目的在于:為解決現(xiàn)有方法無法準(zhǔn)確對微博輿情風(fēng)險進(jìn)行研判的問題,本發(fā)明提供一種微博輿情風(fēng)險研判的方法。

本發(fā)明的具體內(nèi)容如下:

一種微博輿情風(fēng)險研判的方法,所述方法先通過爬蟲采集大量微博數(shù)據(jù),再先后通過敏感話題的識別、情感模型、影響力模型、傳播模型的分析,根據(jù)這幾個模型的輸出情況,決定是否預(yù)警或者是進(jìn)入下一個模型進(jìn)行分析。

具體地,包括如下步驟:

s1:提取源信息話題關(guān)鍵字,若涉及敏感話題則發(fā)出預(yù)警,若不涉及敏感話題,則進(jìn)入情感模型進(jìn)行分析。

s2:通過情感模型對信息進(jìn)行情感分析,若為非負(fù)面情緒,則結(jié)束流程;若負(fù)面程度高則發(fā)出預(yù)警;若負(fù)面程度不高,則進(jìn)入影響力模型進(jìn)行分析。

s3:影響力模型首先會判斷該信息的作者是否在維護(hù)的名單中,如果在則立即預(yù)警,否則將會進(jìn)行影響力分析;進(jìn)入影響力分析后,如果輸出的影響力值大于或等于預(yù)先設(shè)定的閾值,則立即預(yù)警,否則將會進(jìn)入傳播模型進(jìn)行分析。

s4:傳播模型首先會判斷該信息已有的轉(zhuǎn)發(fā)參與者中是否有大v用戶,如果有則立即預(yù)警,否則會進(jìn)行傳播加權(quán)分析;進(jìn)行傳播加權(quán)分析后得到傳播風(fēng)險值,如果輸出的傳播風(fēng)險值大于預(yù)先設(shè)定的閾值,則立即預(yù)警,否則將會把信息輸入到動態(tài)監(jiān)控池中,動態(tài)監(jiān)控池會對信息進(jìn)行時效判斷,把當(dāng)前時間與信息爬取入庫的時間差作為條件進(jìn)行判斷,在一定時間的短周期內(nèi),將該信息重新輸入到傳播模型進(jìn)行分析;在短周期內(nèi),評論與轉(zhuǎn)發(fā)的和的絕對增量超過一定數(shù)量則預(yù)警:如果超過一定時間沒有觸發(fā)預(yù)警,則停止對其監(jiān)控,結(jié)束流程。

進(jìn)一步地,s1中,對于敏感話題的判斷是將源信息的話題關(guān)鍵字與提前建立且人工維護(hù)的一套詞庫進(jìn)行判斷。

優(yōu)選地,所述情緒分析模型為基于循環(huán)神經(jīng)網(wǎng)絡(luò)的情感模型,具體包括:訓(xùn)練數(shù)據(jù)的準(zhǔn)備、語音模型的構(gòu)造和情感的識別。

具體地,所述訓(xùn)練數(shù)據(jù)的準(zhǔn)備的具體過程為:從互聯(lián)網(wǎng)應(yīng)用爬取各類用戶的評價數(shù)據(jù),如應(yīng)用商店軟件的評價,電商網(wǎng)站購物的評價,電影的評價等,并把訓(xùn)練數(shù)據(jù)分為兩類,負(fù)面情感數(shù)據(jù)和非負(fù)面情感數(shù)據(jù)。

具體地,語言模型的構(gòu)造以大量文本作為語料,采用無監(jiān)督方式訓(xùn)練基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語言模型。

具體地,所述情感識別的具體方法為:將輸入文本以字或詞的形式表示,經(jīng)過訓(xùn)練好的模型預(yù)測,最后得到識別為負(fù)面情感和非負(fù)面情感的概率,再選擇概率值大的作為最終情感的輸出,其中,負(fù)面情緒和非負(fù)面情緒的概率加起來為1,負(fù)面程度高是指其概率超過0.8以上。

具體地,s3中,影響力分析采用組合量化的方法來量化得出影響力值,影響力=認(rèn)證占比*權(quán)重*+關(guān)注占比*權(quán)重+粉絲占比*權(quán)重+近一周微博發(fā)布數(shù)量占比*權(quán)限+近一周每條微博平均評論數(shù)占比*權(quán)重+近一周每條微博平均轉(zhuǎn)發(fā)數(shù)*權(quán)重。

具體地,s4中,傳播風(fēng)險=轉(zhuǎn)發(fā)量占比*權(quán)重*+點(diǎn)贊數(shù)占比*權(quán)重+評論數(shù)占比*權(quán)重。

具體地,s4中,動態(tài)監(jiān)控池中的具體判斷過程為:如果超過24小時沒有觸發(fā)預(yù)警,則停止對其監(jiān)控;在4小時內(nèi),每5分鐘作為周期,將該信息重新輸入到傳播模型進(jìn)行分析;在24小時內(nèi),每5分鐘時間內(nèi),評論+轉(zhuǎn)發(fā)的絕對增量超過30則預(yù)警。

采用本發(fā)明的技術(shù)方案后,有益效果如下:(1)本發(fā)明包含敏感話題的識別、情感模型、影響力模型、傳播模型,充分考慮了每一種情況,經(jīng)過模型一層一層地深入分析,保障輿情風(fēng)險高的信息立即預(yù)警;(2)設(shè)有動態(tài)監(jiān)控池對未報警的信息在有效時間內(nèi)進(jìn)行持續(xù)跟進(jìn),保證了風(fēng)險較低的信息也不漏掉,避免了風(fēng)險較低的信息隨著時間的推移風(fēng)險變大而漏掉的情況;(3)本發(fā)明在影響力模型和傳播模型中,均采用了權(quán)重的思想,考慮得較為全面,通過自行設(shè)置權(quán)值,使得數(shù)據(jù)可以隨著事件的不同而更加靈活,準(zhǔn)確性高。

附圖說明

圖1為本發(fā)明的流程框圖。

具體實施方式

本說明書中公開的所有特征,除了互相排斥的特征和/或步驟以外,均可以以任何方式組合。

下面結(jié)合附圖對本發(fā)明作詳細(xì)說明。

一種微博輿情風(fēng)險研判的方法,先通過爬蟲采集大量微博數(shù)據(jù),再先后通過敏感話題的識別、情感模型、影響力模型、傳播模型的分析,根據(jù)這幾個模型的輸出情況,決定是否預(yù)警或者是進(jìn)入下一個模型進(jìn)行分析。包括如下步驟:

s1:提取源信息話題關(guān)鍵字,將源信息的話題關(guān)鍵字與提前建立且人工維護(hù)的一套詞庫進(jìn)行判斷,若涉及敏感話題則發(fā)出預(yù)警,若不涉及敏感話題,則進(jìn)入情感模型進(jìn)行分析。

s2:通過情感模型對信息進(jìn)行情感分析,若為非負(fù)面情緒,則結(jié)束流程;若負(fù)面程度高則發(fā)出預(yù)警;若負(fù)面程度不高,則進(jìn)入影響力模型進(jìn)行分析;情緒分析模型為基于循環(huán)神經(jīng)網(wǎng)絡(luò)的情感模型,具體包括:訓(xùn)練數(shù)據(jù)的準(zhǔn)備,即從互聯(lián)網(wǎng)應(yīng)用爬取各類用戶的評價數(shù)據(jù),如應(yīng)用商店軟件的評價,電商網(wǎng)站購物的評價,電影的評價等,并把訓(xùn)練數(shù)據(jù)分為兩類,負(fù)面情感數(shù)據(jù)和非負(fù)面情感數(shù)據(jù);還包括語言模型的構(gòu)造,即以大量文本作為語料,采用無監(jiān)督方式訓(xùn)練基于循環(huán)神經(jīng)網(wǎng)絡(luò)的語言模型;還包括情感的識別,即將輸入文本以字或詞的形式表示,經(jīng)過訓(xùn)練好的模型預(yù)測,最后得到識別為負(fù)面情感和非負(fù)面情感的概率,再選擇概率值大的作為最終情感的輸出,其中,負(fù)面情緒和非負(fù)面情緒的概率加起來為1,負(fù)面程度高是指其概率超過0.8以上。

s3:影響力模型首先會判斷該信息的作者是否在維護(hù)的名單中,如果在則立即預(yù)警,否則將會進(jìn)行影響力分析;進(jìn)入影響力分析后,具體地,影響力分析采用組合量化的方法來量化得出影響力值:影響力=認(rèn)證占比*權(quán)重*+關(guān)注占比*權(quán)重+粉絲占比*權(quán)重+近一周微博發(fā)布數(shù)量占比*權(quán)限+近一周每條微博平均評論數(shù)占比*權(quán)重+近一周每條微博平均轉(zhuǎn)發(fā)數(shù)*權(quán)重,具體的權(quán)重值如表1所示,如果輸出的影響力值大于或等于預(yù)先設(shè)定閾值,則立即預(yù)警,否則將會進(jìn)入傳播模型進(jìn)行分析。

表1

s4:傳播模型首先會判斷該信息已有的轉(zhuǎn)發(fā)參與者中是否有大v用戶,如果有則立即預(yù)警,否則會進(jìn)行傳播加權(quán)分析;進(jìn)行傳播加權(quán)分析后得到傳播風(fēng)險值,傳播風(fēng)險=轉(zhuǎn)發(fā)量占比*權(quán)重*+點(diǎn)贊數(shù)占比*權(quán)重+評論數(shù)占比*權(quán)重,其中具體的權(quán)重值如表2所示。

如果輸出的傳播風(fēng)險值大于預(yù)先設(shè)定的閾值,則立即預(yù)警,否則將會把信息輸入到動態(tài)監(jiān)控池中;然后動態(tài)監(jiān)控池會對信息進(jìn)行時效判斷,把當(dāng)前時間與信息爬取入庫的時間差作為條件進(jìn)行判斷,如果超過24小時沒有觸發(fā)預(yù)警,則停止對其監(jiān)控;在4小時內(nèi),每5分鐘作為周期,將該信息重新輸入到傳播模型進(jìn)行分析;在24小時內(nèi),每5分鐘時間內(nèi),評論+轉(zhuǎn)發(fā)的絕對增量超過30則預(yù)警。

表2

本發(fā)明不局限于上述具體實施例,應(yīng)當(dāng)理解,本領(lǐng)域的普通技術(shù)人員無需創(chuàng)造性勞動就可以根據(jù)本發(fā)明的構(gòu)思做出諸多修改和變化??傊?,凡本技術(shù)領(lǐng)域中技術(shù)人員依本發(fā)明的構(gòu)思在現(xiàn)有技術(shù)的基礎(chǔ)上通過邏輯分析、推理或者有限的實驗可以得到的技術(shù)方案,皆應(yīng)在由權(quán)利要求書所確定的保護(hù)范圍內(nèi)。

當(dāng)前第1頁1 2 
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點(diǎn)贊!
1
墨玉县| 桃江县| 乌什县| 新化县| 南平市| 留坝县| 农安县| 专栏| 普兰店市| 上蔡县| 永年县| 宜城市| 措美县| 苗栗市| 达孜县| 雅安市| 娄底市| 中江县| 桃江县| 麻阳| 富阳市| 平陆县| 德格县| 金湖县| 临洮县| 辉南县| 尼木县| 宜兰县| 温宿县| 鸡东县| 四川省| 县级市| 青冈县| 肃宁县| 牡丹江市| 丰镇市| 闸北区| 上林县| 吴桥县| 永泰县| 新和县|