欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種基于實(shí)體及特征的評(píng)論分析方法

文檔序號(hào):6540392閱讀:181來(lái)源:國(guó)知局
一種基于實(shí)體及特征的評(píng)論分析方法
【專利摘要】本發(fā)明的提出了一種基于實(shí)體及特征的評(píng)論分析方法。本發(fā)明屬于自然語(yǔ)言處理領(lǐng)域。目的是進(jìn)行評(píng)論文本分析。通過(guò)利用自然語(yǔ)言處理相關(guān)手段,對(duì)評(píng)論文本進(jìn)行處理,得到評(píng)論文本的實(shí)體樹(shù)及相關(guān)實(shí)體的特征。進(jìn)一步利用評(píng)論文本的實(shí)體及特征對(duì)文本進(jìn)行信息提取。對(duì)于輿情分析,關(guān)系提取,傾向性分析等等其他評(píng)論分析工作有著推動(dòng)作用。
【專利說(shuō)明】一種基于實(shí)體及特征的評(píng)論分析方法
【技術(shù)領(lǐng)域】
[0001]本發(fā)明屬于自然語(yǔ)言處理領(lǐng)域,更為具體地講,涉及一種基于實(shí)體及特征的評(píng)論分析方法。
【背景技術(shù)】
[0002]隨著web2.0時(shí)代的到來(lái),網(wǎng)絡(luò)的評(píng)論信息數(shù)量呈現(xiàn)爆炸式的增長(zhǎng)。假如你的公司發(fā)布了一款新的產(chǎn)品。新產(chǎn)品發(fā)布后帶來(lái)了來(lái)自不同媒體的相關(guān)報(bào)道,還有來(lái)著各大門(mén)戶網(wǎng)站的相關(guān)評(píng)論。面對(duì)著這些評(píng)論,你也許迫切的希望了解用戶究竟對(duì)產(chǎn)品的哪一些方面更為關(guān)注,用戶對(duì)這一款產(chǎn)品的評(píng)價(jià)究竟如何。當(dāng)然獲取上述的信息通過(guò)人工的方式是幾乎不可能完成。這就對(duì)計(jì)算機(jī)處理上述數(shù)據(jù)得到想要的結(jié)果提出了要求。本發(fā)明的基于實(shí)體及特征的評(píng)論文本的分析方法通過(guò)構(gòu)建實(shí)體以及相關(guān)實(shí)體特征,對(duì)上述數(shù)據(jù)進(jìn)行分析并得到的結(jié)果。

【發(fā)明內(nèi)容】

[0003]本發(fā)明的最終目的是對(duì)評(píng)論文本進(jìn)行分析。本發(fā)明通過(guò)對(duì)評(píng)論大量評(píng)論文本的實(shí)體及特征的提取,構(gòu)建自己的實(shí)體及特征框架分析結(jié)構(gòu),進(jìn)一步幫助評(píng)論文本進(jìn)行分析,進(jìn)行信息提取。
[0004]為了實(shí)現(xiàn)上述目的,本發(fā)明基于實(shí)體及特征評(píng)論文本的分析方法,其方法構(gòu)成主要由以下特征構(gòu)成:
[0005]一評(píng)論數(shù)據(jù)采集模塊。主要用于采集相關(guān)領(lǐng)域的評(píng)論數(shù)據(jù)。通過(guò)網(wǎng)絡(luò)爬蟲(chóng)或者其他方法獲取大量評(píng)論文本數(shù)據(jù)。
[0006]一數(shù)據(jù)預(yù)處理模塊。主要用于分開(kāi)評(píng)論文本的中句子。在分開(kāi)文本中句子后,使用分詞詞性標(biāo)注工具對(duì)其進(jìn)行分詞詞性標(biāo)注。
[0007]—實(shí)體提取模塊。主要用于提取評(píng)論中的實(shí)體。實(shí)體主要由名詞成分構(gòu)成。本發(fā)明使用詞頻以及人工參與的方式進(jìn)行實(shí)體名詞提取。
[0008]一實(shí)體本體樹(shù)構(gòu)建模塊。主要用于將實(shí)體中的名詞進(jìn)行本體樹(shù)構(gòu)建。本體樹(shù)上不同類別的詞被構(gòu)建到不同的分支上,同時(shí)詞與詞的層級(jí)關(guān)系也在本體樹(shù)上得到體現(xiàn)。
[0009]一實(shí)體特征提取模塊。主要用于提取相關(guān)實(shí)體的特征。實(shí)體特征主要由形容詞,動(dòng)詞,名詞構(gòu)成。本發(fā)明采用句法依存關(guān)系的方法,以及詞的同時(shí)出現(xiàn)方法進(jìn)行實(shí)體特征提取。
[0010]一評(píng)論分析模塊。主要用于利用實(shí)體及特征進(jìn)行未處理評(píng)論文本分析。并且得到相關(guān)信息提取結(jié)果。
[0011]本發(fā)明的發(fā)明目的是這樣實(shí)現(xiàn)的:本發(fā)明通過(guò)調(diào)用數(shù)據(jù)采集模塊和數(shù)據(jù)預(yù)處理模塊得到初步處理后的數(shù)據(jù),接下來(lái)通過(guò)調(diào)用實(shí)體提取模塊,實(shí)體本體樹(shù)構(gòu)建模塊,實(shí)體特征提取模塊得到相關(guān)訓(xùn)練結(jié)果,最后通過(guò)評(píng)論分析模塊對(duì)上述模塊進(jìn)行封裝,封裝完成后,當(dāng)進(jìn)入新的評(píng)論文本時(shí),由評(píng)論分析模塊對(duì)文本進(jìn)行分析得到最后結(jié)果。【專利附圖】

【附圖說(shuō)明】
[0012]圖1是本發(fā)明基于實(shí)體及特征的評(píng)論分析方法具體實(shí)施原理以及框圖。
【具體實(shí)施方式】
[0013]下面結(jié)合附圖對(duì)本發(fā)明的【具體實(shí)施方式】進(jìn)行描述,以便本領(lǐng)域的技術(shù)人員更好地理解本發(fā)明。需要特別提醒注意的是,在以下的描述中,當(dāng)已知功能和設(shè)計(jì)的詳細(xì)描述也許會(huì)淡化本發(fā)明的主要內(nèi)容時(shí),這些描述在這里將被忽略。
[0014]圖1是本發(fā)明基于實(shí)體及特征的評(píng)論分析方法具體實(shí)施原理以及框圖。
[0015]在本實(shí)施例中,如圖1所示,本發(fā)明基于實(shí)體及特征的評(píng)論分析方法數(shù)據(jù)采集模塊101,數(shù)據(jù)預(yù)處理模塊102,實(shí)體提取模塊103,實(shí)體本體樹(shù)構(gòu)建模塊104,實(shí)體特征提取模塊105,實(shí)體及特征構(gòu)建模塊201,未處理評(píng)論106,分析結(jié)果107。
[0016]在本實(shí)例中通過(guò)調(diào)用數(shù)據(jù)采集模塊101獲得相關(guān)的數(shù)據(jù)后,將其數(shù)據(jù)傳遞給數(shù)據(jù)預(yù)處理模塊102,由數(shù)據(jù)預(yù)處理模塊完成分開(kāi)段落,分開(kāi)評(píng)論中的長(zhǎng)句子,分開(kāi)評(píng)論中的短句子,分詞以及詞性標(biāo)注后經(jīng)數(shù)據(jù)預(yù)處理模塊102數(shù)據(jù)傳遞給實(shí)體提取模塊103,實(shí)體特征提取模塊105,由實(shí)體標(biāo)注模塊103提取實(shí)體后將數(shù)據(jù)傳遞給實(shí)體本體樹(shù)構(gòu)建模塊104。同時(shí)利用實(shí)體特征提取模塊104提取相應(yīng)的特征。實(shí)體提取模塊103,實(shí)體本體樹(shù)構(gòu)建模塊104,實(shí)體特征提取模塊105均屬于實(shí)體及特征構(gòu)建模塊201。在完成實(shí)體及特征構(gòu)建模塊201后將利用201處理未處理評(píng)論106。處理后得到分析結(jié)果107。
[0017]盡管上面對(duì)本發(fā)明說(shuō)明性的【具體實(shí)施方式】進(jìn)行了描述,以便于本技術(shù)領(lǐng)的技術(shù)人員理解本發(fā)明,但應(yīng)該清楚,本發(fā)明不限于【具體實(shí)施方式】的范圍,對(duì)本【技術(shù)領(lǐng)域】的普通技術(shù)人員來(lái)講,只要各種變化在所附的權(quán)利要求限定和確定的本發(fā)明的精神和范圍內(nèi),這些變化是顯而易見(jiàn)的,一切利用本發(fā)明構(gòu)思的發(fā)明創(chuàng)造均在保護(hù)之列。
【權(quán)利要求】
1.一種基于實(shí)體及特征的評(píng)論分析方法由以下特征構(gòu)成: 一評(píng)論數(shù)據(jù)采集模塊。主要用于采集相關(guān)領(lǐng)域的評(píng)論數(shù)據(jù)。通過(guò)網(wǎng)絡(luò)爬蟲(chóng)或者其他方法獲取大量評(píng)論文本數(shù)據(jù)。 一數(shù)據(jù)預(yù)處理模塊。主要用于分開(kāi)評(píng)論文本的中句子。在分開(kāi)文本中句子后,使用分詞詞性標(biāo)注工具對(duì)其進(jìn)行分詞詞性標(biāo)注。 一實(shí)體提取模塊。主要用于提取評(píng)論中的實(shí)體。實(shí)體主要由名詞成分構(gòu)成。本發(fā)明使用詞頻以及人工參與的方式進(jìn)行實(shí)體名詞提取。 一實(shí)體本體樹(shù)構(gòu)建模塊。主要用于將實(shí)體中的名詞進(jìn)行本體樹(shù)構(gòu)建。本體樹(shù)上不同類別的詞被構(gòu)建到不同的分支上,同時(shí)詞與詞的層級(jí)關(guān)系也在本體樹(shù)上得到體現(xiàn)。 一實(shí)體特征提取模塊。主要用于提取相關(guān)實(shí)體的特征。實(shí)體特征主要由形容詞,動(dòng)詞,名詞構(gòu)成。本發(fā)明采用句法依存關(guān)系的方法,以及詞的同時(shí)出現(xiàn)方法進(jìn)行實(shí)體特征提取。 一評(píng)論分析模塊。主要用于利用實(shí)體及特征進(jìn)行未處理評(píng)論文本分析。并且得到相關(guān)信息提取結(jié)果。
【文檔編號(hào)】G06F17/30GK103886051SQ201410093275
【公開(kāi)日】2014年6月25日 申請(qǐng)日期:2014年3月13日 優(yōu)先權(quán)日:2014年3月13日
【發(fā)明者】秦志光, 周爾強(qiáng), 羅熹 申請(qǐng)人:電子科技大學(xué)
網(wǎng)友詢問(wèn)留言 已有0條留言
  • 還沒(méi)有人留言評(píng)論。精彩留言會(huì)獲得點(diǎn)贊!
1
清水河县| 徐汇区| 江安县| 边坝县| 海伦市| 高台县| 安平县| 鹤壁市| 太原市| 象山县| 无为县| 米泉市| 五大连池市| 饶平县| 澳门| 敦化市| 平舆县| 城口县| 西宁市| 大化| 页游| 绍兴县| 巨野县| 正宁县| 周口市| 彭山县| 邮箱| 万盛区| 河池市| 屯昌县| 双流县| 县级市| 子洲县| 海淀区| 巴东县| 保定市| 千阳县| 高尔夫| 延川县| 广元市| 茶陵县|