欧美在线观看视频网站,亚洲熟妇色自偷自拍另类,啪啪伊人网,中文字幕第13亚洲另类,中文成人久久久久影院免费观看 ,精品人妻人人做人人爽,亚洲a视频

一種應用于搜索引擎的情感映射方法與情感句型分析方法

文檔序號:6375707閱讀:310來源:國知局
專利名稱:一種應用于搜索引擎的情感映射方法與情感句型分析方法
技術領域
本發(fā)明涉及ー種應用于搜索引擎的多情感傾向度映射方法與情感句型結構分析方法,屬于計算機科學技術與語言學的交叉領域。
背景技術
搜索引擎作為用戶與海量網(wǎng)絡數(shù)據(jù)交互的中間站,使用戶能快速準確地獲取有用信息,在當今的網(wǎng)絡技術發(fā)展中占據(jù)著非常重要的角色。近幾年興起的情感分析領域,正是搜索引擎的ー個重要發(fā)展分支。情感分析通過分析自然語言的語義可以確定用戶的情感傾向度,搜索引擎利用情感分析,可以獲取用戶的情感傾向度,為用戶提供個性優(yōu)化的搜索結 果O國內(nèi)關于情感分析的研究主要集中在傾向度分析,這其中又包括兩個重要的方向。ー類是基于大規(guī)模情感語料庫的,計算詞匯與上下文的統(tǒng)計特性,并將其作為情感傾向度的特征。較為著名的有中科院譚松波博士文本情感傾向度分析方法。另ー類是基于語義網(wǎng)的結構的,根據(jù)概念的上下位、同義反義等關系,獲得概念距離,作為情感傾向度的特征。較為著名的有中科院董振東教授提出的知網(wǎng)體系(Hownet)。心理學家Robert Plutchik認為情緒是心理演化的綜合體,他提出了八種兩兩相對的基本情感,即(Anger)憤怒、(Fear)害怕、(Anticipation)希望、(Surprise)驚奇、(Disgust)綠棄、(Trust)信任、(Joy)快樂、(Sadness)悲哀,并以情感模型的形式將這八種情感及它們的混合情感呈現(xiàn)出來。然而,他沒有給出情感的定量表達,這給其情感模型的應用造成諸多不便。J. R. Martin與P. R. R. White所著的《英語評價系統(tǒng)》在鑒別句子語義方面享有極高的地位。他們將語篇語義的評價系統(tǒng)分為三個子系統(tǒng),即態(tài)度(attitude)、介入(engagement)、極差(graduation)。態(tài)度即人的態(tài)度,介入即語句中如何通過詞體現(xiàn)態(tài)度,極差即態(tài)度的真?zhèn)?、強弱。通過分析句子的態(tài)度、介入、極差三個方面,即可得到說話者想要表達的態(tài)度。其標注體系為情感持有者(emotion holder),情感受體(ob ject),受體特征(object feature),情感傾向度(emotions),情感詞(emotion word)。為了簡化系統(tǒng),我們只選取了情感傾向度和情感詞進行了標注。在中文文本情感分析領域,大部分的情感分析研究局限在兩種(正面、負面)或者三種(正面、中性、負面)情感分析,而準確把握一般人的情感態(tài)度需要更為細致的情感分析。本發(fā)明正是針對目前情感分析領域中存在的情感傾向度分析不夠豐富、準確度不高的問題,提出了ー種應用于搜索引擎的多情感傾向度映射方法與情感句型結構分析方法,量化情感傾向度,發(fā)掘隱含情感傾向,有效地解決上述問題。

發(fā)明內(nèi)容
本發(fā)明提出了ー種應用于搜索引擎的多情感傾向度映射方法與情感句型結構分析方法,結合心理學與語言學針對情感進行分析,計算情感句的情感傾向度。本發(fā)明包括多情感傾向度映射方法和情感句型結構分析方法兩部分,其中,多情感傾向度映射方法包括情感分詞模塊、情感詞庫和多傾向度映射模塊三個部分,情感句型結構分析方法包括句型結構模版庫和句型結構分析模塊兩個部分。它們之間的關系如說明書附圖
I所示。下面對多情感傾向度映射方法的三個部分進行說明。I.情感分詞標注模塊。該模塊完成的功能包括情感句斷句、分詞,根據(jù)情感詞典標注情感詞及程度副詞三個部分。下面詳細介紹情感標注的標準。(I)斷句的標注符。我們將句號“?!薄⒎痔枴?;”作為判斷ー個句子結束的標志,標注符為/wsg,其他標點符號參考ICTCLAS進行標注。(2)基礎情感詞的標注符。參考情感詞庫中的情感詞,將基礎情感詞的情感傾向度進行情感標注,使用@作為標示符。定義強化基礎情感的強度為I. 5,基礎情感的強度為1,弱化基礎情感的強度為O. 5。標注時并不標注情感強度,任情感向量映射時根據(jù)標注符判斷情感詞的情感強度,并將其映射為情感傾向度向量的模值。表I基礎情感標注表(24類)
權利要求
1.ー種應用于搜索引擎的多情感傾向度映射方法與情感句型結構分析方法,其特點是量化情感,將情感傾向映射為ー個情感傾向度向量,通過分析情感句句型結構,對情感傾向度向量進行運算,最終確定句子的情感傾向度向量。
2.根據(jù)權利要求I所述的多情感傾向度映射方法,其特征在于對情感詞的映射規(guī)則依據(jù)Emotion Wheel及情感標注將情感詞映射到Emotion Wheel的相應位置,情感強弱的大小和傾向通過極坐標向量的形式表示。
3.根據(jù)權利要求I所述情感句句型結構分析方法,其特征在于識別四種情感句型否定句、轉(zhuǎn)折句、并列遞進句的結構,分析簡化句型結構,得到句子語義的計算方法。其中識別方法如下所述a)并列、遞進句判斷依據(jù),作為并列、遞進句判斷依據(jù)的連接詞有和、與、同、及、而、況且、何況、乃至,不但、而且、并、并且等。判斷依據(jù)有兩個有無連接詞出現(xiàn);小句的結構是否相似。若有連接詞出現(xiàn)則將該句子判斷為并列、遞進句;若沒有連接詞出現(xiàn),但是句子中小句的結構相似,則將該句子判斷為并列、遞進句; b)否定句判斷依據(jù),否定句一般含有否定副詞,常見的否定副詞有不、甭、別、沒有、沒、不要等。只要句子分詞后含有否定副詞,我們就將該句子識別為否定句進行處理; c)轉(zhuǎn)折句判斷依據(jù),轉(zhuǎn)折句一般含有轉(zhuǎn)折連詞,常見的轉(zhuǎn)折連詞有卻、雖然、但、但是、然而、而、偏偏、只是、不過、至于、致、不料、豈知等。只要句子分詞后含有轉(zhuǎn)折連詞,我們就將該句子識別為否定句進行處理。
4.根據(jù)權利要求I所述情感句句型結構分析方法,其特征在于根據(jù)句子語義計算句子情感傾向度。其中計算方法如下所述 a)并列、遞進句計算方法,在計算并列、遞進句的情感傾向度時,若多個詞語的傾向度向量的方向相同,取模值大的詞語的傾向度向量作為句子的傾向度向量。若它們的傾向度向量方向不同,又分為兩種情況,第一,若是ー階混合,句子情感傾向度向量的方向取向量和的方向,句子情感傾向度向量的大小取模值最大的情感詞傾向度向量的模值;第二,若是ニ階或者三階混合,只做情感傾向度向量標注,其大小取情感詞情感傾向度向量模值最大的模值; b)否定句計算方法,分為兩種第一,若句子中所有的情感詞都是由否定副詞修飾著,句子的情感傾向度取情感詞傾向度的反向;第二,若句子中有情感詞不是由否定副詞修飾的,則句子的情感傾向度與被否定副詞修飾的情感詞無關,由其他的沒有否定副詞修飾的情感詞決定; c)轉(zhuǎn)折句計算方法,轉(zhuǎn)折句中一般句子結構分為兩個部分,只計算后句的情感傾向度作為整句的情感傾向度向量,后句的情感傾向度向量按一般句進行處理; d)一般句的計算方法不能判斷為上述三類句子的即為一般句,其情感傾向度由其句子中詞的情感傾向度向量ei歐式和的平均決定
5.根據(jù)權利要求I所述的情感傾向度向量運算,其規(guī)則遵循基礎情感與混合情感之間的關系,如表I所不 表I混合規(guī)則
全文摘要
本發(fā)明提出一種應用于搜索引擎的多情感傾向度映射方法與情感句型結構分析方法,屬于計算機科學技術與語言學的交叉學科。其中,多情感傾向度映射方法包括情感分詞模塊、情感詞庫和多傾向度映射模塊三個模塊;情感句型結構分析模塊包括句型結構分析模塊和句型結構模版庫兩個模塊。本發(fā)明結合心理學的Emotion Wheel方法、語言學中的評價系統(tǒng)方法,能夠定量分辨情感詞的情感傾向,定量計算句子的情感傾向度,且能發(fā)現(xiàn)句子中的隱含情感傾向。
文檔編號G06F17/27GK102867028SQ20121030844
公開日2013年1月9日 申請日期2012年8月28日 優(yōu)先權日2012年8月28日
發(fā)明者張鈁煒, 劉浩, 陸月明 申請人:北京郵電大學
網(wǎng)友詢問留言 已有0條留言
  • 還沒有人留言評論。精彩留言會獲得點贊!
1
莒南县| 齐河县| 湘阴县| 枣阳市| 罗江县| 天津市| 江华| 苗栗市| 游戏| 常熟市| 建宁县| 榆社县| 大竹县| 利辛县| 余干县| 香港 | 杭锦后旗| 建阳市| 姜堰市| 西城区| 和龙市| 普兰店市| 黄骅市| 绍兴市| 睢宁县| 云南省| 雅江县| 汽车| 洛隆县| 凤凰县| 澳门| 开原市| 若羌县| 桂林市| 黄骅市| 宁晋县| 仲巴县| 荥阳市| 溧水县| 攀枝花市| 宁津县|