網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng)的制作方法
【專利摘要】本發(fā)明是一種網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng),該系統(tǒng)具有:信息融合單元,對(duì)網(wǎng)絡(luò)社會(huì)事件數(shù)據(jù)的多模態(tài)特性進(jìn)行融合,用于獲得社會(huì)事件的多模態(tài)數(shù)據(jù)的融合信息,構(gòu)建跨社會(huì)事件的多模態(tài)數(shù)據(jù)的語(yǔ)義描述模型;跟蹤單元與信息融合單元連接,基于跨社會(huì)事件的多模態(tài)數(shù)據(jù)語(yǔ)義描述模型,面對(duì)包含豐富多媒體信息的網(wǎng)絡(luò)內(nèi)容,針對(duì)網(wǎng)絡(luò)社會(huì)事件具有的跨模態(tài)屬性、跨平臺(tái)屬性和跨時(shí)空屬性,獲得社會(huì)事件在各個(gè)屬性上的語(yǔ)義關(guān)聯(lián)跟蹤數(shù)據(jù);分析與預(yù)測(cè)單元與跟蹤單元連接,基于語(yǔ)義關(guān)聯(lián)跟蹤數(shù)據(jù),獲得基于社會(huì)事件的全局態(tài)勢(shì)分析與預(yù)測(cè)數(shù)據(jù)。
【專利說(shuō)明】網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng)
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于網(wǎng)絡(luò)社會(huì)事件的關(guān)聯(lián)跟蹤與預(yù)測(cè)【技術(shù)領(lǐng)域】,涉及一種關(guān)于網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)框架體系。
【背景技術(shù)】
[0002]隨著互聯(lián)網(wǎng)的快速普及,網(wǎng)絡(luò)已經(jīng)成為大多數(shù)人生活中不可或缺的工具。網(wǎng)民數(shù)量正在快速的增長(zhǎng),逐漸成為一個(gè)龐大的群體,根據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告顯示,截至2012年12月底,中國(guó)網(wǎng)頁(yè)數(shù)量為1227億個(gè),比2011年同期增長(zhǎng)41.7%。以上統(tǒng)計(jì)數(shù)據(jù)表明,我們已經(jīng)生活在海量的網(wǎng)絡(luò)數(shù)據(jù)中。我們不僅需要對(duì)這些網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行合理的存儲(chǔ),并且還需要研究怎么處理網(wǎng)絡(luò)中海量的數(shù)據(jù),從而得到其隱藏在海量網(wǎng)絡(luò)數(shù)據(jù)后的潛在有用信息。面對(duì)互聯(lián)網(wǎng)上的海量文本,圖像,視頻數(shù)據(jù),如何對(duì)社會(huì)熱點(diǎn)事件產(chǎn)生的大規(guī)模數(shù)據(jù)進(jìn)行有效地組織、獲取、挖掘與監(jiān)控已成為一項(xiàng)迫切的應(yīng)用需求。
[0003]一個(gè)新聞熱點(diǎn)事件是隨著時(shí)間不斷發(fā)展變化的,隨著事件的發(fā)展,有新的重要的新聞故事發(fā)生,有舊的故事消亡。當(dāng)用戶搜索這個(gè)新聞事件時(shí),一個(gè)重要的任務(wù)就是發(fā)現(xiàn)新聞話題,找出各個(gè)新聞故事之間的相關(guān)性,并以此構(gòu)建一個(gè)事件發(fā)展的過(guò)程圖,將這個(gè)事件主題的發(fā)展脈絡(luò)建立起來(lái)。因此,在搜索一個(gè)熱點(diǎn)事件時(shí),用戶希望看到的搜索結(jié)果并不是僅根據(jù)文本相關(guān)性排列的一系列新聞條目,讓用戶在一堆雜亂無(wú)章的新聞條目中去尋找事件各個(gè)故事之間的關(guān)系和事件的進(jìn)展,而應(yīng)是能根據(jù)事件的發(fā)展將事件演化的關(guān)系、事件的發(fā)展、事件主題的演化過(guò)程等信息,以一種清晰的、圖形化的界面展示給用戶,讓用戶能夠快速知道整個(gè)事件的發(fā)展演變過(guò)程,并且讓用戶快速了解和分析這個(gè)事件的主題。如何迅速、準(zhǔn)確、適量地提供用戶所需信息,并在一定程度上揭示信息之間的關(guān)聯(lián),把一個(gè)熱點(diǎn)事件的完整演變過(guò)程呈現(xiàn)給用戶,為用戶提供智能的信息檢索服務(wù),并且讓用戶快速了解和分析這個(gè)事件的主題,已成為學(xué)術(shù)界和工業(yè)界共同關(guān)心的課題。
[0004]由于互聯(lián)網(wǎng)具有虛擬性、隱蔽性、發(fā)散性、滲透性和隨意性等特點(diǎn),當(dāng)一個(gè)熱點(diǎn)事件發(fā)生時(shí),越來(lái)越多的網(wǎng)民愿意通過(guò)網(wǎng)絡(luò)渠道來(lái)表達(dá)自己的觀點(diǎn)。當(dāng)今,信息傳播與意見(jiàn)交互空前迅捷,網(wǎng)絡(luò)輿論的表達(dá)訴求也日益多元。如果不能有效地進(jìn)行引導(dǎo),負(fù)面的網(wǎng)絡(luò)輿情將對(duì)社會(huì)公共安全形成較大的威脅??v觀國(guó)際大環(huán)境和我國(guó)的國(guó)情,網(wǎng)絡(luò)安全、社會(huì)穩(wěn)定以及對(duì)熱點(diǎn)事件的監(jiān)管都面臨著重大的挑戰(zhàn)。中東地區(qū)的茉莉花革命在各個(gè)國(guó)家的迅速蔓延和網(wǎng)絡(luò)信息的傳播互動(dòng),以及我國(guó)近期出現(xiàn)的“江蘇啟東728事件”、“中日釣魚島之爭(zhēng)”等一系列牽動(dòng)億萬(wàn)網(wǎng)友的熱點(diǎn)事件在網(wǎng)絡(luò)上迅速的傳播以及網(wǎng)友廣泛的參與,無(wú)不說(shuō)明了我們所面臨的社會(huì)事件分析形勢(shì)極其嚴(yán)峻。我國(guó)正處于全面建設(shè)小康與和諧社會(huì)的關(guān)鍵時(shí)期,特別需要一個(gè)安全穩(wěn)定的政治和社會(huì)環(huán)境,因此政府及相關(guān)管理者亟需對(duì)于網(wǎng)絡(luò)上輿論信息進(jìn)行有效地挖掘、分析與處理,把握處理危機(jī)事件的最佳時(shí)機(jī)。然而,僅僅依靠人工方式難以應(yīng)對(duì)海量的網(wǎng)絡(luò)信息的搜集和處理,需要融合多種信息技術(shù),通過(guò)適當(dāng)?shù)挠?jì)算機(jī)技術(shù),分析當(dāng)前的社會(huì)熱點(diǎn)事件與突發(fā)事件,對(duì)網(wǎng)絡(luò)中負(fù)面的輿情和誤導(dǎo)性言論及時(shí)、迅速做出反應(yīng),挖掘網(wǎng)絡(luò)中形成事件各個(gè)過(guò)程的緣由,將謠言和危機(jī)扼殺于無(wú)形,從而提高對(duì)熱點(diǎn)事件和突發(fā)事件的監(jiān)管和處理能力。
[0005]現(xiàn)有的社會(huì)事件的跟蹤和預(yù)測(cè)算法只是使用了單個(gè)平臺(tái)的文本信息。還在文本信息理解上,聚類技術(shù)是數(shù)據(jù)挖掘以及模式識(shí)別的基本技術(shù),通過(guò)對(duì)文本信息進(jìn)行聚類來(lái)得到社會(huì)事件的主題,傳統(tǒng)的聚類方法對(duì)于社會(huì)事件的爆發(fā)性和區(qū)域性等特性,其主題挖掘精確度不高,很難對(duì)一個(gè)完整事件進(jìn)行其語(yǔ)義描述。因?yàn)槌宋谋拘畔?,事件也有其豐富的視覺(jué)信息。對(duì)一個(gè)事件來(lái)說(shuō),其在不同的網(wǎng)站會(huì)有不同的用戶評(píng)論,然而,這兩個(gè)網(wǎng)站可能有非常相似的視覺(jué)信息,比如,圖像或者視頻,這些信息為跨時(shí)間跨網(wǎng)站構(gòu)建一個(gè)事件條目演變的橋梁是非常有用的。例如,事件“2012年美國(guó)總統(tǒng)大選”,這個(gè)事件的各個(gè)條目關(guān)于奧巴馬的圖像是很大地關(guān)聯(lián)的。因此,采用多模態(tài)信息融合更能正確地對(duì)社會(huì)事件進(jìn)行描述。并且,不同的平臺(tái)也能夠互相彌補(bǔ)和增強(qiáng)。例如,大部分事件在Google News上是來(lái)自于官方媒體,但是他們?cè)贔lickr上也有許多用戶評(píng)論。因此,信息在不同的平臺(tái)上能夠互相幫助,尤其是在一個(gè)平臺(tái)中的優(yōu)勢(shì)來(lái)補(bǔ)充另一個(gè)平臺(tái)中的弱勢(shì)更為有效。關(guān)鍵的挑戰(zhàn)是如何來(lái)找到最有效的方法來(lái)構(gòu)建兩個(gè)平臺(tái)之間的語(yǔ)義鴻溝。針對(duì)這種情況,如果能夠把視覺(jué)信息融入,對(duì)社會(huì)事件建立一個(gè)統(tǒng)一的多模態(tài)信息描述,并且在不同平臺(tái)上對(duì)社會(huì)事件進(jìn)行有效地協(xié)同關(guān)聯(lián),從而實(shí)現(xiàn)跨平臺(tái)的多模態(tài)信息融合的事件語(yǔ)義描述體系?;诳缙脚_(tái)多媒體信息的社會(huì)事件協(xié)同跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)方法能夠把多平臺(tái)的多模態(tài)信息有效地結(jié)合起來(lái),從而改善這一不足。
[0006]現(xiàn)有的針對(duì)網(wǎng)絡(luò)社會(huì)事件的跟蹤和預(yù)測(cè)方法研究還處于初始階段,至今沒(méi)有一個(gè)完整的流程和框架體系。本發(fā)明是一個(gè)基于網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤與預(yù)測(cè)的框架體系,有效地彌補(bǔ)了傳統(tǒng)方法的不足,實(shí)現(xiàn)了基于多模態(tài)信息語(yǔ)義融合的跨模態(tài)、跨平臺(tái)和跨時(shí)空的協(xié)同關(guān)聯(lián)跟蹤與全局態(tài)勢(shì)分析與預(yù)測(cè)。
【發(fā)明內(nèi)容】
[0007](一 )要解決的技術(shù)問(wèn)題
[0008]本發(fā)明的目的是提供了一種基于網(wǎng)絡(luò)社會(huì)事件協(xié)同跟蹤預(yù)測(cè)的完整框架體系。針對(duì)網(wǎng)絡(luò)社會(huì)事件數(shù)據(jù)的多模態(tài)特性,在不同模態(tài)、平臺(tái)和時(shí)空上對(duì)熱點(diǎn)社會(huì)事件進(jìn)行有效地協(xié)同關(guān)聯(lián)跟蹤;通過(guò)跟蹤多個(gè)事件之后,我們可以把整個(gè)事件的過(guò)程隨著時(shí)間的推移可視化顯示;基于跟蹤的結(jié)果,還可以得到一個(gè)社會(huì)事件的完整描述,通過(guò)這些信息的關(guān)聯(lián)分析和主題挖掘模型,可以挖掘出社會(huì)事件的主題和輿論導(dǎo)向,并利用統(tǒng)計(jì)學(xué)習(xí)的方法,獲悉這個(gè)社會(huì)事件的全局態(tài)勢(shì),能夠?qū)崿F(xiàn)基于社會(huì)事件的全局態(tài)勢(shì)分析與預(yù)測(cè),為此提出關(guān)于網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)框架。
[0009]( 二 )技術(shù)方案
[0010]為實(shí)現(xiàn)上述目的,本發(fā)明提供關(guān)于網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng),該系統(tǒng)包括:
[0011]信息融合單元,對(duì)網(wǎng)絡(luò)社會(huì)事件數(shù)據(jù)的多模態(tài)特性進(jìn)行融合,使用自然語(yǔ)言理解和圖像與視頻處理分析技術(shù),用于獲得社會(huì)事件的多模態(tài)數(shù)據(jù)的融合信息,構(gòu)建跨社會(huì)事件的多模態(tài)數(shù)據(jù)的語(yǔ)義描述模型;
[0012]跟蹤單元與信息融合單元連接,基于跨社會(huì)事件的多模態(tài)數(shù)據(jù)語(yǔ)義描述模型,面對(duì)包含豐富多媒體信息的網(wǎng)絡(luò)內(nèi)容,針對(duì)網(wǎng)絡(luò)社會(huì)事件具有的跨模態(tài)屬性、跨平臺(tái)屬性和跨時(shí)空屬性,結(jié)合協(xié)同關(guān)聯(lián)跟蹤技術(shù),獲得社會(huì)事件在各個(gè)屬性上的語(yǔ)義關(guān)聯(lián)跟蹤數(shù)據(jù);
[0013]分析與預(yù)測(cè)單元與跟蹤單元連接,基于語(yǔ)義關(guān)聯(lián)跟蹤數(shù)據(jù),得到一個(gè)社會(huì)事件隨著時(shí)間發(fā)展的整個(gè)過(guò)程信息,通過(guò)社會(huì)事件主題挖掘模型、社會(huì)事件模式預(yù)測(cè)和社會(huì)事件統(tǒng)計(jì)預(yù)測(cè)模型挖掘過(guò)程信息,挖掘出過(guò)程信息的社會(huì)事件的主題和輿論導(dǎo)向,從而知道這個(gè)社會(huì)事件的全局態(tài)勢(shì),獲得基于社會(huì)事件的全局態(tài)勢(shì)分析與預(yù)測(cè)數(shù)據(jù)。
[0014]本發(fā)明的有益效果:本發(fā)明采用了社會(huì)事件的多模態(tài)信息融合與建模,使用了基于跨平臺(tái)、跨模態(tài)和跨時(shí)空這三個(gè)不同屬性的社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤,挖掘出各個(gè)社會(huì)事件的主題和輿論導(dǎo)向,并利用統(tǒng)計(jì)學(xué)習(xí)的方法,從而預(yù)測(cè)出其后續(xù)發(fā)展的軌跡,最終提出了關(guān)于網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)框架體系,包括關(guān)于多媒體信息的社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)方法。該發(fā)明解決了網(wǎng)絡(luò)上不同的熱點(diǎn)社會(huì)事件在不同模態(tài)、平臺(tái)和時(shí)空上完整演變過(guò)程的描述以及對(duì)其跟蹤和預(yù)測(cè)問(wèn)題,其中使用提出的協(xié)同概率多假設(shè)關(guān)聯(lián)跟蹤算法可以大大提高系統(tǒng)對(duì)社會(huì)事件在各個(gè)時(shí)間段的跟蹤正確精度,從而更準(zhǔn)確的提供整個(gè)事件的發(fā)展演變過(guò)程,方便用戶的了解和輿情的分析與預(yù)測(cè)。
【專利附圖】
【附圖說(shuō)明】
[0015]圖1a和圖1b是本發(fā)明面向網(wǎng)絡(luò)社會(huì)事件協(xié)同關(guān)聯(lián)跟蹤與預(yù)測(cè)系統(tǒng)的完整框架體系;
[0016]圖2是本發(fā)明中基于文本的主題挖掘語(yǔ)義描述示意圖;
[0017]圖3是本發(fā)明中基于圖像視頻的主題挖掘語(yǔ)義描述示意圖;
[0018]圖4是本發(fā)明中跨模態(tài)語(yǔ)義關(guān)聯(lián)示意圖片;
[0019]圖5是本發(fā)明中跨平臺(tái)語(yǔ)義關(guān)聯(lián)示意圖片;
[0020]圖6是本發(fā)明中跨時(shí)空語(yǔ)義關(guān)聯(lián)示意圖片;
[0021]圖7是本發(fā)明中基于社會(huì)事件的多模態(tài)主題挖掘示意圖片;
[0022]圖8是一條公路最近幾年各個(gè)時(shí)期路面擁堵情況分布示意圖片;
【具體實(shí)施方式】
[0023]為使本發(fā)明的目的、技術(shù)方案和優(yōu)點(diǎn)更加清楚明白,以下結(jié)合具體實(shí)施例,并參照附圖,對(duì)本發(fā)明進(jìn)一步詳細(xì)說(shuō)明。
[0024]如圖1a和圖1b所示是本發(fā)明面向網(wǎng)絡(luò)社會(huì)事件協(xié)同跟蹤與預(yù)測(cè)系統(tǒng)的完整框架體系,本發(fā)明實(shí)現(xiàn)對(duì)于多媒體信息的網(wǎng)絡(luò)社會(huì)事件的協(xié)同跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè),得到各個(gè)社會(huì)事件從開始到結(jié)束一個(gè)完整的描述。這樣可以把整個(gè)事件過(guò)程隨著時(shí)間的推移可視化顯示,以一種清晰的、圖形化的界面展示給用戶,讓用戶能夠快速知道整個(gè)事件的發(fā)展演變過(guò)程,并能夠挖掘各個(gè)事件的語(yǔ)義主題,能夠知道社會(huì)事件的輿論導(dǎo)向,并利用統(tǒng)計(jì)學(xué)習(xí)的方法,獲悉這個(gè)社會(huì)事件的全局態(tài)勢(shì),能夠?qū)崿F(xiàn)基于社會(huì)事件的全局態(tài)勢(shì)分析與預(yù)測(cè)。本發(fā)明的結(jié)構(gòu)如圖1a和圖1b顯示,其包含三個(gè)組成部分該系統(tǒng)包括:信息融合單元I跟蹤單元2和分析與預(yù)測(cè)單元,實(shí)現(xiàn)所述系統(tǒng)的技術(shù)方案如下所述:
[0025]I社會(huì)事件的多模態(tài)信息融合與建模
[0026]利用信息融合單元1,對(duì)網(wǎng)絡(luò)社會(huì)事件數(shù)據(jù)的多模態(tài)特性進(jìn)行融合,使用自然語(yǔ)言理解和圖像與視頻處理分析技術(shù),用于獲得社會(huì)事件的多模態(tài)數(shù)據(jù)的融合信息,構(gòu)建跨社會(huì)事件的多模態(tài)數(shù)據(jù)的語(yǔ)義描述模型;
[0027]其中,所述構(gòu)建跨社會(huì)事件的多模態(tài)數(shù)據(jù)的語(yǔ)義描述模型,用于提取各個(gè)社會(huì)事件的文本和視覺(jué)的跨媒體信息的特征,并對(duì)各個(gè)社會(huì)事件的文本、視覺(jué)的跨媒體信息進(jìn)行語(yǔ)義層次挖掘,從而實(shí)現(xiàn)社會(huì)事件的語(yǔ)義描述,構(gòu)建基于多模態(tài)的信息融合的語(yǔ)義知識(shí)庫(kù),從而得到各個(gè)社會(huì)事件的多模態(tài)語(yǔ)義描述。
[0028]其中,所述社會(huì)事件的多模態(tài)數(shù)據(jù)融合信息包含基于自然語(yǔ)言理解的文本分析、以及基于圖像和視頻處理,實(shí)現(xiàn)多模態(tài)信息融合的事件語(yǔ)義描述體系,實(shí)現(xiàn)多模態(tài)的語(yǔ)義信息融合。
[0029]其中,基于文本分析、以及圖像和視頻的主題挖掘語(yǔ)義描述,采取提升算法選取有效的文本主題以及圖像和視頻主題。
[0030]1.1基于自然語(yǔ)言理解的文本分析
[0031]針對(duì)文本信息,考慮使用變形的主題模型(LDA, Latent Dirichlet Allocation)來(lái)獲取其各個(gè)事件的主題信息,并利用文本的上下文信息,進(jìn)一步實(shí)現(xiàn)事件文本的描述,建立以實(shí)體、事件與主題為核心的語(yǔ)義描述體系,主要從以下幾個(gè)方面進(jìn)行探討:
[0032]a)實(shí)體識(shí)別和關(guān)聯(lián)
[0033]抽取文本中的命名性提及、代詞性提及和名詞性提及,并把指稱同一實(shí)體概念的提及連接起來(lái),還將利用統(tǒng)計(jì)翻譯和文本檢索相結(jié)合的方法建立中英文實(shí)體的對(duì)應(yīng),實(shí)現(xiàn)多語(yǔ)目息的關(guān)聯(lián)和整合。
[0034]b)事件抽取和描述
[0035]考慮到事件類別識(shí)別和元素抽取是與以動(dòng)詞為中心的句法語(yǔ)義分析密切相關(guān)的,充分利用句法語(yǔ)義特征以及表層特征,進(jìn)行事件類別識(shí)別和事件元素抽取。使用變形的主題模型(LDA)來(lái)實(shí)現(xiàn)社會(huì)事件文本的描述。
[0036]1.2基于圖像視頻處理技術(shù)
[0037]通過(guò)圖像和視頻,我們能夠非常方便有效地了解各個(gè)社會(huì)事件。我們通過(guò)考慮圖像和視頻的結(jié)構(gòu)信息,利用稀疏學(xué)習(xí)和字典學(xué)習(xí),從而建立統(tǒng)一的基于詞袋模型的視覺(jué)語(yǔ)義描述體系。
[0038]1.3基于多模態(tài)的語(yǔ)義信息融合
[0039]社會(huì)事件內(nèi)容包含文本、圖像、視頻和聲音等多模態(tài)信息,對(duì)文本處理上,我們考慮使用變形的主題模型(LDA)來(lái)獲取其各個(gè)事件的描述,對(duì)圖像視頻處理,考慮其空間結(jié)構(gòu)關(guān)系,利用稀疏學(xué)習(xí)和字典學(xué)習(xí),構(gòu)建視覺(jué)主題模型,從而獲取各個(gè)事件的視覺(jué)主題,并根據(jù)視覺(jué)主題進(jìn)一步實(shí)現(xiàn)事件的語(yǔ)義描述。
[0040]如圖2本發(fā)明中基于文本的主題挖掘語(yǔ)義描述所示,給定所有的文檔集合D,我們采用變形的主題模型(LDA)挖掘事件的主題Z1,Z2...ZK;,然后基于主題Z1,Z2...ZK;建立文檔的語(yǔ)義描述的詞W1、W2…Wj…Wn。
[0041]如圖3本發(fā)明中基于圖像視頻的主題挖掘語(yǔ)義描述所示,基于圖像視頻集合i的主題挖掘語(yǔ)義描述,給定所有事件的圖片或者視頻集,挖掘出各個(gè)事件的圖片或者視頻的主題類別Cp (V..tv..ck,基于主題類別C;、(ν..(ν..(;建立圖片或者視頻的語(yǔ)義關(guān)聯(lián)的各個(gè)特征描述子n.wr.\。[0042]基于文本以及圖像和視頻的主題挖掘語(yǔ)義描述,采取提升算法選取有效的文本主題以及圖像和視頻主題,從而實(shí)現(xiàn)多模態(tài)信息融合的事件語(yǔ)義描述體系,實(shí)現(xiàn)了多模態(tài)信息融合的社會(huì)事件描述。
[0043]2社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤模型
[0044]利用跟蹤單元2與信息融合單元I連接,基于跨社會(huì)事件的多模態(tài)數(shù)據(jù)語(yǔ)義描述模型,面對(duì)包含豐富多媒體信息的網(wǎng)絡(luò)內(nèi)容,針對(duì)網(wǎng)絡(luò)社會(huì)事件具有的跨模態(tài)屬性、跨平臺(tái)屬性和跨時(shí)空屬性,結(jié)合協(xié)同關(guān)聯(lián)跟蹤技術(shù),獲得社會(huì)事件在各個(gè)屬性上的語(yǔ)義關(guān)聯(lián)跟蹤數(shù)據(jù);
[0045]其中,所述社會(huì)事件在各個(gè)屬性上的語(yǔ)義關(guān)聯(lián)跟蹤數(shù)據(jù),用于將互聯(lián)網(wǎng)中語(yǔ)義相關(guān)的網(wǎng)絡(luò)內(nèi)容聚集起來(lái),構(gòu)成一個(gè)能夠反映社會(huì)事件共同主題的集合。
[0046]其中,針對(duì)網(wǎng)絡(luò)社會(huì)事件的跨平臺(tái)屬性,提出協(xié)同概率多假設(shè)跟蹤方法,實(shí)現(xiàn)兩個(gè)平臺(tái)上多個(gè)社會(huì)事件數(shù)據(jù)的語(yǔ)義協(xié)同關(guān)聯(lián)跟蹤,用于實(shí)現(xiàn)網(wǎng)絡(luò)社會(huì)事件的跨模態(tài)及跨時(shí)空的關(guān)聯(lián)跟蹤。
[0047]社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤模型,將互聯(lián)網(wǎng)中語(yǔ)義相關(guān)的網(wǎng)絡(luò)內(nèi)容聚集起來(lái),構(gòu)成一個(gè)能夠反映社會(huì)事件共同主題的集合。面對(duì)包含豐富多媒體信息的網(wǎng)絡(luò)內(nèi)容,針對(duì)網(wǎng)絡(luò)社會(huì)事件具有跨平臺(tái)、跨模態(tài)和跨時(shí)空等屬性,結(jié)合協(xié)同學(xué)習(xí)關(guān)聯(lián)等技術(shù),實(shí)現(xiàn)社會(huì)事件在各個(gè)屬性上的協(xié)同關(guān)聯(lián)跟蹤。
[0048]2.1跨模態(tài)語(yǔ)義關(guān)聯(lián)
[0049]對(duì)于跨模態(tài)的語(yǔ)義關(guān)聯(lián),其目的是實(shí)現(xiàn)社會(huì)事件在不同模態(tài)間的關(guān)聯(lián),如圖4本發(fā)明中跨模態(tài)語(yǔ)義關(guān)聯(lián)所示,針對(duì)美國(guó)總統(tǒng)選舉和發(fā)射火星勘測(cè)軌道飛行器這兩個(gè)網(wǎng)絡(luò)社會(huì)事件,將其文本域中的多個(gè)文本與視覺(jué)域的中的多個(gè)圖像做出跨模態(tài)的語(yǔ)義關(guān)聯(lián),實(shí)現(xiàn)發(fā)生在同一段時(shí)期的相關(guān)文本和圖像進(jìn)行跨模態(tài)的語(yǔ)義關(guān)聯(lián)。
[0050]我們擬在特征層采用多媒體特征融合分析來(lái)挖掘不同模態(tài)、媒體空間的潛在語(yǔ)義相關(guān)關(guān)系,將不同媒體的信息映射到一個(gè)較高維度的公共空間中,在同一空間選取合適的測(cè)度,從而衡量信息樣本的相似性,并用跨媒體特征的隱含語(yǔ)義關(guān)聯(lián)矩陣來(lái)刻畫。在此基礎(chǔ)上構(gòu)建模態(tài)特征的隱含語(yǔ)義索引,用于將跨媒體樣本投影到一個(gè)隱含的語(yǔ)義空間,建立跨媒體內(nèi)容在不同特征空間上的映射和關(guān)聯(lián)。
[0051]2.2跨平臺(tái)語(yǔ)義關(guān)聯(lián)
[0052]這里跨平臺(tái)關(guān)聯(lián)表示多源平臺(tái)(如人民網(wǎng)和新浪微博)之間的關(guān)聯(lián)關(guān)系。社會(huì)事件的發(fā)生和發(fā)展以及所經(jīng)歷的各個(gè)子事件往往在網(wǎng)絡(luò)上同時(shí)存在于多個(gè)平臺(tái)上,例如一個(gè)事件的信息在兩個(gè)平臺(tái)(人民網(wǎng)和新浪微博)上都會(huì)有相應(yīng)的描述,并且互相補(bǔ)充,因此研究跨平臺(tái)的復(fù)雜關(guān)系是有必要的,從而發(fā)現(xiàn)和挖掘信息樣本跨平臺(tái)的語(yǔ)義關(guān)系。社會(huì)事件的跨平臺(tái)屬性通常是由社會(huì)事件的某一子事件引發(fā)而來(lái)的,然后在網(wǎng)絡(luò)空間的各個(gè)平臺(tái)上產(chǎn)生大量的網(wǎng)絡(luò)言論,因此跨平臺(tái)語(yǔ)義關(guān)聯(lián)的關(guān)鍵在于基于各個(gè)子事件通過(guò)協(xié)同互補(bǔ)關(guān)聯(lián),實(shí)現(xiàn)不同平臺(tái)上的信息對(duì)應(yīng)。圖5本發(fā)明中跨平臺(tái)語(yǔ)義關(guān)聯(lián)所示,這是“希臘抗議”和“中日釣魚島爭(zhēng)端”的社會(huì)事件,其各個(gè)子事件的演變過(guò)程在人民網(wǎng)和新浪微博上都有相應(yīng)的描述,利用我們提出的協(xié)同概率多假設(shè)關(guān)聯(lián)跟蹤模型對(duì)這兩個(gè)平臺(tái)的數(shù)據(jù)建立關(guān)聯(lián),可以把這兩個(gè)社會(huì)事件在人民網(wǎng)和新浪微博這兩個(gè)平臺(tái)上各個(gè)時(shí)刻的信息進(jìn)行相互關(guān)聯(lián)和補(bǔ)充,從而更加清楚地知道這個(gè)事件在這個(gè)時(shí)刻發(fā)生的具體信息,可以準(zhǔn)確地分析各個(gè)子事件,更好地對(duì)社會(huì)事件進(jìn)行監(jiān)控和預(yù)測(cè)。
[0053]2.3跨時(shí)空語(yǔ)義關(guān)聯(lián)
[0054]這里的跨時(shí)空是指地理位置和時(shí)間上的不同。因?yàn)橐粋€(gè)社會(huì)事件發(fā)生之后,在不同的空間上,人們對(duì)這個(gè)事件的看法是不同的,并且還會(huì)隨著時(shí)間的改變而改變。所以,我們需要建立一種跨時(shí)空語(yǔ)義關(guān)聯(lián),把一個(gè)事件在不同地域所呈現(xiàn)的不同信息所描述出來(lái),從而使決策者掌握各個(gè)地域之間的相互聯(lián)系和區(qū)別,更好地引導(dǎo)事件的輿論發(fā)展,為國(guó)家服務(wù)。我們把這個(gè)事件文本中的詞作為樣本空間,對(duì)于每個(gè)信息樣本,已知“詞-時(shí)間-地點(diǎn)”三元組,我們將首先建立時(shí)間尺度和地理空間尺度的相似性測(cè)度,計(jì)算出各個(gè)樣本間在地理位鉻和時(shí)間上的相關(guān)性,繼而對(duì)于樣本空間“詞典”中某詞,分別統(tǒng)計(jì)以下四個(gè)頻率值:同時(shí)在某個(gè)時(shí)間間隔和某個(gè)地區(qū)出現(xiàn)的頻率,不在某個(gè)時(shí)間間隔但在某個(gè)地區(qū)出現(xiàn)的頻率,在某個(gè)時(shí)間間隔但不在某個(gè)地區(qū)出現(xiàn)的頻率,以及不在某個(gè)時(shí)間間隔也不在某個(gè)地區(qū)出現(xiàn)的頻率這四個(gè)量,通過(guò)對(duì)詞基于空間與時(shí)間的頻率分析,得到每個(gè)詞在一定空間與時(shí)間的熱度系數(shù),根據(jù)這一熱度系數(shù)融合地理位置與時(shí)間上的相關(guān)性,進(jìn)而得到跨時(shí)空語(yǔ)義的關(guān)聯(lián)。如圖6本發(fā)明中跨時(shí)空語(yǔ)義關(guān)聯(lián)所示,這是事件“H7N9”蔓延的時(shí)空演變過(guò)程,其蔓延和爆發(fā)呈現(xiàn)地區(qū)性和時(shí)間性,上海和安徽是最新發(fā)現(xiàn)的,然后開始蔓延到周邊省市,一開始都是小范圍的時(shí)空擴(kuò)展,但是,中間會(huì)有一個(gè)突發(fā)時(shí)刻,比如在4月3號(hào),突然北京也發(fā)現(xiàn)H7N9感染者,H7N9的蔓延也是呈現(xiàn)時(shí)空特性,需要對(duì)這個(gè)事件建立一種跨時(shí)空語(yǔ)義關(guān)聯(lián),把一個(gè)事件在不同地域在不同時(shí)刻所呈現(xiàn)的不同信息所描述出來(lái),從而使決策者掌握各個(gè)地域之間的相互聯(lián)系和區(qū)別,更好地對(duì)事件有一個(gè)理智的分析和判斷。
[0055]3社會(huì)事件的全局態(tài)勢(shì)分析與預(yù)測(cè)
[0056]利用分析與預(yù)測(cè)單元3與跟蹤單元2連接,基于語(yǔ)義關(guān)聯(lián)跟蹤數(shù)據(jù),得到一個(gè)社會(huì)事件隨著時(shí)間發(fā)展的整個(gè)過(guò)程信息,通過(guò)社會(huì)事件主題挖掘模型、社會(huì)事件模式預(yù)測(cè)和社會(huì)事件統(tǒng)計(jì)預(yù)測(cè)模型挖掘過(guò)程信息,挖掘出過(guò)程信息的社會(huì)事件的主題和輿論導(dǎo)向,從而知道這個(gè)社會(huì)事件的全局態(tài)勢(shì),獲得基于社會(huì)事件的全局態(tài)勢(shì)分析與預(yù)測(cè)數(shù)據(jù)。
[0057]其中,所述社會(huì)事件的全局態(tài)勢(shì)分析與預(yù)測(cè)數(shù)據(jù),獲得多個(gè)事件在不同時(shí)間段的摘要細(xì)節(jié)信息和事件演變趨勢(shì),得到各個(gè)社會(huì)事件從開始到結(jié)束一個(gè)完整的描述,并把整個(gè)事件過(guò)程隨著時(shí)間的推移可視化顯示,能夠根據(jù)事件的發(fā)展將事件演化的關(guān)系、事件的發(fā)展、事件主題的演化過(guò)程信息,以一種清晰的、圖形化的界面展示給用戶;通過(guò)對(duì)這些完整社會(huì)事件信息的關(guān)聯(lián)分析,挖掘出這個(gè)社會(huì)事件的主題和輿論導(dǎo)向,并利用統(tǒng)計(jì)學(xué)習(xí)的方法,從而預(yù)測(cè)出其后續(xù)發(fā)展的軌跡,揭示傳播行為的特性,知道這個(gè)社會(huì)事件的全局態(tài)勢(shì)。
[0058]其中,所述基于社會(huì)事件的全局態(tài)勢(shì)分析與預(yù)測(cè)數(shù)據(jù)是根據(jù)跟蹤數(shù)據(jù)得到的每一個(gè)事件的所有信息,采取主題挖掘模型和統(tǒng)計(jì)學(xué)習(xí)的方法,預(yù)測(cè)出各個(gè)社會(huì)事件的主題及走勢(shì),用于準(zhǔn)確地對(duì)社會(huì)事件進(jìn)行全局態(tài)勢(shì)分析與預(yù)測(cè)。
[0059]一個(gè)社會(huì)事件的傳播是一個(gè)典型的動(dòng)態(tài)過(guò)程,是一個(gè)隨著時(shí)間隨著輿論導(dǎo)向不斷演變的過(guò)程,而且不論從時(shí)間維還是空間維,任何一個(gè)社會(huì)事件行為都不是簡(jiǎn)單孤立的,每個(gè)行為之間有著錯(cuò)綜復(fù)雜的關(guān)系,每個(gè)社會(huì)事件的發(fā)生也都有著顯性的或隱性的跡象。社會(huì)事件在網(wǎng)絡(luò)上會(huì)有大量的文本、圖像與視頻等多模態(tài)信息,使用我們提出的對(duì)社會(huì)事件的跨模態(tài)的信息融合與建模,能夠把一個(gè)社會(huì)事件的演變過(guò)程詳細(xì)的表示出來(lái),通過(guò)這些信息的關(guān)聯(lián)分析,可以挖掘出社會(huì)事件的主題和輿論導(dǎo)向,并利用統(tǒng)計(jì)學(xué)習(xí)的方法,知道這個(gè)社會(huì)事件的全局態(tài)勢(shì),我們創(chuàng)造性地提出了三種不同社會(huì)事件的預(yù)測(cè)模型。
[0060]3.1社會(huì)事件主題挖掘
[0061]社會(huì)事件在網(wǎng)絡(luò)上會(huì)有大量的文本、圖像與視頻等多模態(tài)信息,通過(guò)對(duì)社會(huì)事件的跨模態(tài)跨平臺(tái)的信息融合與建模,能夠把一個(gè)社會(huì)事件的演變過(guò)程詳細(xì)地表示出來(lái),然后對(duì)多模態(tài)的信息進(jìn)行主題建模,這樣可以把整個(gè)事件過(guò)程隨著時(shí)間的推移可視化顯示,一方面能夠根據(jù)事件的發(fā)展將事件演化的關(guān)系、事件的發(fā)展、事件主題的演化過(guò)程等信息,以一種清晰的、圖形化的界面展示給用戶,讓用戶能夠快速知道整個(gè)事件的發(fā)展演變過(guò)程,并且讓用戶快速了解和分析這個(gè)事件的主題,另一方面能夠更好地分析出社會(huì)事件的全局態(tài)勢(shì)和輿情信息,來(lái)進(jìn)行相應(yīng)的輿論導(dǎo)向和輿情監(jiān)控。
[0062]對(duì)各個(gè)社會(huì)事件跟蹤后,能夠進(jìn)行相應(yīng)的文本主題和視覺(jué)主題挖掘,最后可以得到社會(huì)事件的各個(gè)演變過(guò)程的主題信息,從而對(duì)社會(huì)事件的跟蹤防御和輿情的監(jiān)控有著顯著的幫助。如圖7示出本發(fā)明中基于社會(huì)事件的多模態(tài)主題挖掘,通過(guò)對(duì)事件(“2012年美國(guó)總統(tǒng)選舉”)進(jìn)行跨模態(tài),跨平臺(tái)和跨時(shí)空的跟蹤,得到了事件在各個(gè)時(shí)刻的演變過(guò)程,通過(guò)主題模型來(lái)對(duì)事件整個(gè)過(guò)程的文本和圖像進(jìn)行主題挖掘,得到了圖7上事件在各個(gè)時(shí)刻的文本主題和視覺(jué)主題,然后,由這些各個(gè)時(shí)刻的文本主題和視覺(jué)主題,進(jìn)行關(guān)聯(lián)和統(tǒng)計(jì),實(shí)現(xiàn)對(duì)事件主題的挖掘,最后可視化顯示,方便用戶了解和輿情分析。
[0063]3.2社會(huì)事件統(tǒng)計(jì)預(yù)測(cè)
[0064]社會(huì)事件的演變過(guò)程通過(guò)我們提出的方法可以詳細(xì)地描繪出,并且能得到這個(gè)社會(huì)事件的主題分布情況,因此我們就可以對(duì)這個(gè)社會(huì)事件進(jìn)行相應(yīng)的分析和預(yù)測(cè)。我們擬根據(jù)跟蹤的結(jié)果所得到的的每一個(gè)事件的所有信息,采取統(tǒng)計(jì)學(xué)習(xí)的方法,預(yù)測(cè)出各個(gè)社會(huì)事件的走勢(shì),這樣能夠準(zhǔn)確地對(duì)社會(huì)事件進(jìn)行分析監(jiān)控,政府決策者能夠及時(shí)地采取相應(yīng)的應(yīng)對(duì)措施來(lái)使負(fù)面的輿論遏制在萌芽之中。在整個(gè)預(yù)測(cè)周期中,會(huì)通過(guò)基礎(chǔ)數(shù)據(jù)建立一個(gè)基準(zhǔn),然后隨著時(shí)間的推移,根據(jù)跟蹤的結(jié)果所得到的事件的信息越來(lái)越豐富,從而使事件的未來(lái)趨勢(shì)越來(lái)越明顯,借助統(tǒng)計(jì)數(shù)據(jù)挖掘的方法實(shí)現(xiàn)事件的預(yù)測(cè)。
[0065]3.3社會(huì)事件模式預(yù)測(cè)
[0066]許多社會(huì)事件是有共同的時(shí)空模式,在一年的一個(gè)時(shí)間段中都會(huì)出現(xiàn),我們可以根據(jù)最近幾年社會(huì)事件的發(fā)生情況,對(duì)相同的社會(huì)事件進(jìn)行細(xì)致地分析,使用我們提出的建模方法,得出其社會(huì)事件的主題分布情況,我們就可以對(duì)這個(gè)社會(huì)事件進(jìn)行相應(yīng)的分析和預(yù)測(cè),從而知道以后這個(gè)類似社會(huì)事件最大可能在什么時(shí)間段發(fā)生,可以提前做到預(yù)防措施。
[0067]圖8為某一條公路最近幾年各個(gè)時(shí)期路面擁堵情況分布圖,公路擁堵情況在一年中是隨著時(shí)間不同而呈現(xiàn)不同的情況,但是,這個(gè)社會(huì)事件在這幾年的發(fā)展軌跡都是相似的,即共同事件,我們可以對(duì)這些共同事件建模,采用圖匹配等模式挖掘方法,可以分析和預(yù)測(cè)之后這個(gè)事件各個(gè)時(shí)期的發(fā)展軌跡,從而為決策者提供可靠地信息,可以在特定的時(shí)期進(jìn)行相應(yīng)的預(yù)防和補(bǔ)救。
[0068]4本發(fā)明的網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)方法,包括如下步驟:
[0069]步驟S1:對(duì)各個(gè)社會(huì)事件的文本和視覺(jué)信息進(jìn)行特征提取,對(duì)這些跨媒體信息進(jìn)行語(yǔ)義層次挖掘,從而實(shí)現(xiàn)社會(huì)事件的語(yǔ)義描述,構(gòu)建了基于社會(huì)事件的多模態(tài)的信息融合的語(yǔ)義知識(shí)庫(kù),從而得到各個(gè)社會(huì)事件的多模態(tài)語(yǔ)義描述模型。
[0070]步驟S2:將互聯(lián)網(wǎng)中語(yǔ)義相關(guān)的網(wǎng)絡(luò)內(nèi)容聚集起來(lái),構(gòu)成一個(gè)能夠反映社會(huì)事件共同主題的集合。面對(duì)包含豐富多媒體信息的網(wǎng)絡(luò)內(nèi)容,針對(duì)網(wǎng)絡(luò)社會(huì)事件具有跨平臺(tái)、跨模態(tài)和跨時(shí)空等屬性,結(jié)合協(xié)同學(xué)習(xí)關(guān)聯(lián)等技術(shù),實(shí)現(xiàn)社會(huì)事件在各個(gè)屬性上的協(xié)同關(guān)聯(lián)跟蹤模型。[0071]步驟S3:通過(guò)步驟2,能夠獲得多個(gè)事件在不同時(shí)間段的摘要細(xì)節(jié)信息和事件演變趨勢(shì),由此可以得到各個(gè)社會(huì)事件從開始到結(jié)束一個(gè)完整的描述。這樣可以把整個(gè)事件過(guò)程隨著時(shí)間的推移可視化顯示,能夠根據(jù)事件的發(fā)展將事件演化的關(guān)系、事件的發(fā)展、事件主題的演化過(guò)程等信息,以一種清晰的、圖形化的界面展示給用戶。通過(guò)對(duì)這些完整社會(huì)事件信息的關(guān)聯(lián)分析,可以挖掘出這個(gè)社會(huì)事件的主題和輿論導(dǎo)向,并利用統(tǒng)計(jì)學(xué)習(xí)的方法,從而預(yù)測(cè)出其后續(xù)發(fā)展的軌跡,揭示傳播行為的特性,知道這個(gè)社會(huì)事件的全局態(tài)勢(shì)。
[0072]5實(shí)施效果
[0073]為了評(píng)估本發(fā)明,我們進(jìn)行了一些實(shí)驗(yàn)研究,從谷歌新聞(Google News)和Flickr上選擇了 18個(gè)熱門主題作為研究的熱點(diǎn)社會(huì)事件,數(shù)據(jù)集如表I所示,其覆蓋政治,經(jīng)濟(jì),技術(shù),娛樂(lè),軍事,社會(huì)等主題。谷歌新聞上有3583個(gè)文檔和6742個(gè)圖像,F(xiàn)lickr上有4356個(gè)文檔和4356個(gè)圖像。
[0074]表I本發(fā)明實(shí)施效果的谷歌英文新聞和Flickr圖片信息數(shù)據(jù)集
[0075]
【權(quán)利要求】
1.一種網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng),其特征在于,該系統(tǒng)包括: 信息融合單元,對(duì)網(wǎng)絡(luò)社會(huì)事件數(shù)據(jù)的多模態(tài)特性進(jìn)行融合,使用自然語(yǔ)言理解和圖像與視頻處理分析技術(shù),用于獲得社會(huì)事件的多模態(tài)數(shù)據(jù)的融合信息,構(gòu)建跨社會(huì)事件的多模態(tài)數(shù)據(jù)的語(yǔ)義描述模型; 跟蹤單元與信息融合單元連接,基于跨社會(huì)事件的多模態(tài)數(shù)據(jù)語(yǔ)義描述模型,面對(duì)包含豐富多媒體信息的網(wǎng)絡(luò)內(nèi)容,針對(duì)網(wǎng)絡(luò)社會(huì)事件具有的跨模態(tài)屬性、跨平臺(tái)屬性和跨時(shí)空屬性,結(jié)合協(xié)同關(guān)聯(lián)跟蹤技術(shù),獲得社會(huì)事件在各個(gè)屬性上的語(yǔ)義關(guān)聯(lián)跟蹤數(shù)據(jù); 分析與預(yù)測(cè)單元與跟蹤單元連接,基于語(yǔ)義關(guān)聯(lián)跟蹤數(shù)據(jù),得到一個(gè)社會(huì)事件隨著時(shí)間發(fā)展的整個(gè)過(guò)程信息,通過(guò)社會(huì)事件主題挖掘模型、社會(huì)事件模式預(yù)測(cè)和社會(huì)事件統(tǒng)計(jì)預(yù)測(cè)模型挖掘過(guò)程信息,挖掘出過(guò)程信息的社會(huì)事件的主題和輿論導(dǎo)向,從而知道這個(gè)社會(huì)事件的全局態(tài)勢(shì),獲得基于社會(huì)事件的全局態(tài)勢(shì)分析與預(yù)測(cè)數(shù)據(jù)。
2.如權(quán)利要求1所述網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng),其特征在于,所述構(gòu)建跨社會(huì)事件的多模態(tài)數(shù)據(jù)的語(yǔ)義描述模型,用于提取各個(gè)社會(huì)事件的文本和視覺(jué)的跨媒體信息的特征,并對(duì)各個(gè)社會(huì)事件的文本、視覺(jué)的跨媒體信息進(jìn)行語(yǔ)義層次挖掘,從而實(shí)現(xiàn)社會(huì)事件的語(yǔ)義描述,構(gòu)建基于多模態(tài)的信息融合的語(yǔ)義知識(shí)庫(kù),從而得到各個(gè)社會(huì)事件的多模態(tài)語(yǔ)義描述。
3.如權(quán)利要求1所述網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng),其特征在于,所述社會(huì)事件在各個(gè)屬性上的語(yǔ)義關(guān)聯(lián)跟蹤數(shù)據(jù),用于將互聯(lián)網(wǎng)中語(yǔ)義相關(guān)的網(wǎng)絡(luò)內(nèi)容聚集起來(lái),構(gòu)成一個(gè)能夠反映社會(huì)事件共同主題的集合。
4.如權(quán)利要求1所述網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng),其特征在于,所述社會(huì)事件的全局態(tài)勢(shì) 分析與預(yù)測(cè)數(shù)據(jù),獲得多個(gè)事件在不同時(shí)間段的摘要細(xì)節(jié)信息和事件演變趨勢(shì),得到各個(gè)社會(huì)事件從開始到結(jié)束一個(gè)完整的描述,并把整個(gè)事件過(guò)程隨著時(shí)間的推移可視化顯示,能夠根據(jù)事件的發(fā)展將事件演化的關(guān)系、事件的發(fā)展、事件主題的演化過(guò)程信息,以一種清晰的、圖形化的界面展示給用戶;通過(guò)對(duì)這些完整社會(huì)事件信息的關(guān)聯(lián)分析,挖掘出這個(gè)社會(huì)事件的主題和輿論導(dǎo)向,并利用統(tǒng)計(jì)學(xué)習(xí)的方法,從而預(yù)測(cè)出其后續(xù)發(fā)展的軌跡,揭示傳播行為的特性,知道這個(gè)社會(huì)事件的全局態(tài)勢(shì)。
5.如權(quán)利要求1所述網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng),其特征在于,所述社會(huì)事件的多模態(tài)數(shù)據(jù)融合信息包含基于自然語(yǔ)言理解的文本分析、以及基于圖像和視頻處理,實(shí)現(xiàn)多模態(tài)信息融合的事件語(yǔ)義描述體系,實(shí)現(xiàn)多模態(tài)的語(yǔ)義信息融口 ο
6.如權(quán)利要求5所述網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng),其特征在于,基于文本分析、以及圖像和視頻的主題挖掘語(yǔ)義描述,采取提升算法選取有效的文本主題以及圖像和視頻主題。
7.如權(quán)利要求1所述網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng),其特征在于,針對(duì)網(wǎng)絡(luò)社會(huì)事件的跨平臺(tái)屬性,提出協(xié)同概率多假設(shè)跟蹤方法,實(shí)現(xiàn)兩個(gè)平臺(tái)上多個(gè)社會(huì)事件數(shù)據(jù)的語(yǔ)義協(xié)同關(guān)聯(lián)跟蹤,用于實(shí)現(xiàn)網(wǎng)絡(luò)社會(huì)事件的跨模態(tài)及跨時(shí)空的關(guān)聯(lián)跟蹤。
8.如權(quán)利要求1所述網(wǎng)絡(luò)社會(huì)事件的協(xié)同關(guān)聯(lián)跟蹤及全局態(tài)勢(shì)分析與預(yù)測(cè)系統(tǒng),其特征在于,所述基于社會(huì)事件的全局態(tài)勢(shì)分析與預(yù)測(cè)數(shù)據(jù)是根據(jù)跟蹤數(shù)據(jù)得到的每一個(gè)事件的所有信息,采取主題挖掘模型和統(tǒng)計(jì)學(xué)習(xí)的方法,預(yù)測(cè)出各個(gè)社會(huì)事件的主題及走勢(shì),用于準(zhǔn)確地對(duì)社會(huì)事件進(jìn)行 全局態(tài)勢(shì)分析與預(yù)測(cè)。
【文檔編號(hào)】G06F19/00GK103455705SQ201310197129
【公開日】2013年12月18日 申請(qǐng)日期:2013年5月24日 優(yōu)先權(quán)日:2013年5月24日
【發(fā)明者】徐常勝, 張?zhí)熘? 申請(qǐng)人:中國(guó)科學(xué)院自動(dòng)化研究所