一种基于上下文语境的中文分句情感极性判别方法

文档序号:6378745阅读:599来源:国知局
专利名称:一种基于上下文语境的中文分句情感极性判别方法
技术领域
本发明涉及中文分句情感计算领域,具体涉及一种基于上下文语境的中文分句情感极性判别方法。
背景技术
随着Web2. O时代的到来,互联网交互技术取得迅猛发展,网络上出现了大量带有主观情感的评论信息。这些评论信息往往反映了人们对事物或事件的观点和看法。例如在电子商务平台上,一笔交易可能会对应一条文字评论,这些评论通常表明了买家对产品质量、卖家服务、物流速度等多个方面的看法,因此这些评论中包含了大量有用的信息,对商家的广告投放、市场营销、商业决策以及买家的购物选择都具有重要的参考价值和实际意义。目前单纯采用人工分析筛选的方法已经无法满足海量数据处理的需求,因此利用计算机进行情感分析的技术应运而生。
面向文本的情感极性判别通常可被划分为四个级别词语级情感极性判别、分句级情感极性判别、篇章级情感极性判别以及海量数据级的情感极性判别。
申请号为201010238370. O的发明公开了一种汉语文本情感识别方法,包括下列步骤1)使用自然语言处理工具对汉语文本进行预处理,得到句子成分之间的依存关系; 2)根据情感识别变量的确定方法确定句子所包含的情感识别变量并将句子成分赋值给情感识别变量;3)根据情感识别变量的赋值方法确定情感识别变量的取值;4)根据情感规则确定句子表达的情感类型。
目前学术界关于词语级、篇章级和海量数据级的情感极性判别研究较多,但是分句级的情感判别研究则很少有人涉及。而目前现有的分句级情感极性判别多采用基于词表的严格匹配算法、统计预测或机器学习等方法,而很少关注中文语法规则在情感计算当中的作用,特别是缺少基于上下文语境判别情感极性的方法。发明内容
本发明提供了一种基于上下文语境的中文分句情感极性判别方法,综合竞拍规则和上下文语境判别中文分句的情感极性,提高中文分句情感极性判断的准确性。
一种中文分句的情感极性判别方法,包括如下步骤
(I)对中文分句进行中文分词和词性的标注,获取每个中文分句中各自的特征值、 否定词、副词和情感词,将中文分句的情感词与情感词表进行匹配,确定情感词的情感极性,得到中文分句的情感极性;
(2)根据中文分句中的副词计算每个中文分句的情感强烈程度;
(3)提取中文分句中的连接词,对于相邻的三个中文分句,根据连接词以及与其相邻的中文分句的情感强烈程度修正步骤(I)中获得的中文分句情感极性。
通常情况下,中文分词的准确率与所处的领域密切相关,因此,先建立领域专有词汇表,在中文分词过程时,执行专有词汇优先结合原则,提高中文分词的准确率和精度,确3保中文分词的正确性。
依据词性可以将中文分句划分为名词、动词、形容词、副词以及代词等,根据情感极性判别的需求,依据词性对中文分词结果进行筛选,去掉停用词以及无用词,从而获得精简的中文分词序列。
对中文分句进行中文分词和词性标注后,每个分句都被降维映射为一个四维向量,该四维向量包括特征值、否定词、副词以及情感词。
其中,特征值用于确定所关注对象的特征;否定词用于实现语义的翻转;副词用于描述情感的强烈程度;情感词用语确定情感极性。
将四维向量中的情感词与情感词表进行匹配,确定该情感词的情感极性,从而得到中文分句的情感极性。
如果中文分句中出现否定词,则该中文分句的情感极性反转。例如依据情感词的情感极性判断中文分句情感极性为正面,如果分句中存在一个否定词,则相应的中文分句情感极性变为负面。
由于中文分句的情感极性除了与中文分句自身所表达的内容有关,大多情况下, 还与其上下文的情感语境有关,因此,若要准确判别中文分句的情感极性,还需要考虑与其相邻的中文分句的情感语境。
本发明中依据相邻三个中文分句各自的情感极性以及中文分句间的连接词综合确定中文分句的情感极性。
依据获得的每个中文分句的副词计算每个中文分句的情感强烈程度。
连接词的上下文关系可以分为两种承上和启下。承上表明该连接词所在的中文分句与前一分句有语义上的关联,启下表明该连接词所在的中文分句与后一分句有语义上的关联。
连接词情感极性关系可以分为两种转折和顺承。转折表明利用该连接词连接的两中文分句的情感极性相反,顺承表明利用该连接词连接的两中文分句的情感极性相同。
对连接词分别进行上下文关系以及情感极性关系的标注。
相邻三个中文分句分别记为第一分句、第二分句以及第三分句,基于上下文关系以及情感极性修正中文分句情感极性有以下几种情况
(I)若第一个分句与第二个分句存在明显的上下文关系,而第二个分句与第三个分句不存在明显的上下文关系,则第二个分句的情感极性只根据第一个分句进行判别;
(2)若第一个分句与第二个分句存不在明显的上下文关系,而第二个分句与第三个分句存在明显的上下文关系,则第二个分句的情感极性只根据第三个分句进行判别;
(3)若第一个分句与第二个分句存在明显的上下文关系,第二个分句与第三个分句也存在明显的上下文关系,则第二个分句的情感极性判别细分为以下两种情况
3-1、若依据第一分句和第三分句判别得到的第二分句的情感极性结果一致,则该情感极性结果即为第二分句的情感极性;
3-2、若依据第一分句和第三分句判别得到的第二分句的情感极性结果不一致, 则依据第一分句和第三分句中情感强烈程度更强的确定第二分句的情感极性。
本发明中文分句的情感极性判别方法,能够显著降低人工参与的工作量,在复杂的语言环境中能够有效地提高中文分句情感判别的准确性。


图I为本发明一种基于上下文语境的中文分句情感极性判别方法流程图2为本发明一种基于上下文语境的中文分句情感极性判别方法示意图。
具体实施方式
下面结合附图,对本发明一种中文分句的情感极性判别方法做详细说明。
原始中文分句文本
“非常的喜欢,但是你确定你的技术部不是花瓶吗? ”
“冏,不过真的已经很好啦。”
如图I所示,(I)对中文分句进行中文分词和词性的标注;
“非常/d的/u喜欢/V,/w但是/c你/r确定/V你/r的/u技术部/n不/d是/ V花瓶/n吗/y /w”
“固/x,/w不过/c真/a的/u已经/d很/d好/a啦/y。/V,
(2)根据情感极性判别的需求,依据词性对中文分词结果进行筛选,去掉停用词和无用词,获得精简的分词序列;
“非常/d喜欢/V,/w但是/c确定/V技术部/n不/d是/V花瓶/n /V,
“冏/x,/w不过/c真/a已经/d很/d好/a”。
(3)将上述获得的分词结果序列按照词性和语法降维映射得到四维向量{特征值、否定词、副词、情感词},并标记每个中文分句中的连接词,结果见表I ;
表I
权利要求
1.一种基于上下文语境的中文分句情感极性判别方法,其特征在于,包括如下步骤 (1)对中文分句进行中文分词和词性的标注,获取每个中文分句中各自的特征值、否定词、副词和情感词,将中文分句的情感词与情感词表进行匹配,确定情感词的情感极性,得到中文分句的情感极性; (2)根据中文分句中的副词计算每个中文分句的情感强烈程度; (3)提取中文分句中的连接词,对于相邻的三个中文分句,根据连接词以及与其相邻的中文分句的情感强烈程度修正步骤(I)中获得的中文分句情感极性。
2.如权利要求I所述的基于上下文语境的情感极性判别方法,其特征在于,所述步骤(I)中,建立领域专有词汇表,在中文分词时执行专有词汇优先结合原则。
3.如权利要求2所述的基于上下文语境的情感极性判别方法,其特征在于,所述步骤(I)中,依据词性对中文分词结果进行筛选,去掉停用词以及无用词。
4.如权利要求3所述的基于上下文语境的情感极性判别方法,其特征在于,所述步骤(I)中,如果中文分句中出现否定词,则中文分句的情感极性反转。
5.如权利要求4所述的基于上下文语境的情感极性判别方法,其特征在于,所述步骤(3)中,对连接词分别进行上下文关系以及情感极性关系的标注。
6.如权利要求5所述的基于上下文语境的情感极性判别方法,其特征在于,依据连接词的上下文关系以及情感极性关系判断与相邻中文分句的关系, (1)若第一个分句与第二个分句存在明显的上下文关系,而第二个分句与第三个分句不存在明显的上下文关系,则第二个分句的情感极性只根据第一个分句进行判别; (2)若第一个分句与第二个分句不存在明显的上下文关系,而第二个分句与第三个分句存在明显的上下文关系,则第二个分句的情感极性只根据第三个分句进行判别; (3)若第一个分句与第二个分句存在明显的上下文关系,第二个分句与第三个分句也存在明显的上下文关系,则第二个分句的情感极性判别细分为以下两种情况 3-1、若依据第一分句和第三分句判别得到的第二分句的情感极性结果一致,则该情感极性结果即为第二分句的情感极性; 3-2、若依据第一分句和第三分句判别得到的第二分句的情感极性结果不一致,则依据第一分句和第三分句中情感强烈程度更强的确定第二分句的情感极性。
全文摘要
本发明公开了一种基于上下文语境的中文分句情感极性判别方法,包括如下步骤(1)对中文分句进行中文分词和词性的标注,获取每个中文分句中各自的特征值、否定词、副词以及情感词,将中文分句的情感词与情感词表进行匹配,确定情感词的情感极性,得到中文分句的情感极性;(2)根据中文分句中的副词计算每个中文分句的情感强烈程度;(3)提取中文分句中的连接词,对于相邻的三个中文分句,根据连接词以及与其相邻的中文分句的情感强烈程度修正步骤(1)中获得的中文分句情感极性。本发明基于上下文语境的中文分句情感极性判别方法,能够显著降低人工参与的工作量,在复杂的语言环境中有效地提高中文分句情感判别的准确性。
文档编号G06F17/27GK102929860SQ201210388149
公开日2013年2月13日 申请日期2012年10月12日 优先权日2012年10月12日
发明者张宇, 朱卫祥 申请人:浙江理工大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1