微博情感演化分析方法及系统的制作方法

文档序号:6516640阅读:611来源:国知局
微博情感演化分析方法及系统的制作方法
【专利摘要】本发明公开了一种微博情感演化分析方法,及时发现对突发事件的情感演化。采用基于大规模微博语料库构造的多元化情感模型实时对用户情感状态进行监测,分析情感模式的时序变化特征,准确快速的发现情感演化模式。该方法可实时监测微博流上公众的情感的演化状态,从而对于舆情监控和引导具有十分重要的意义。
【专利说明】微博情感演化分析方法及系统
【技术领域】
[0001]本发明属于数据挖掘领域,尤其涉及针对微博数据流进行情感演化分析技术。
【背景技术】
[0002]在日常生活中,突发事件频繁发生,用户越来越习惯于利用社交网络(例如博客、论坛、twitter, Facebook等)来发表自己的观点和情感。然而,用户对事件的情感并非保持一成不变,而是随着时间的变化或者事件的发展而不断演化,逐渐变强或者变弱,甚至从一种情感转化到另一种情感。例如,在2011年日本大地震中,当地震发生初期,部分用户持有“幸灾乐祸”的态度,然而随着政府救援工作的开展及遇难人民群众面对灾害的坚强意志,这部分用户的情感态度由“幸灾乐祸”转变为“敬佩”。同样,在“韩寒与方舟子大战”中,很大一部分用户由开始支持方舟子到最后转变为支持韩寒。如何实时在线检测用户对突发事件的情感演化过程具有十分重要的意义。对于企业而言,可以通过对消费者购买产品后情感的持续跟进,及时发现产品的缺点及不足。对于社会和政府工作者而言,通过分析用户对事件的情感变化情况,可对突发事件及时做出回应,甚至预测事件的发展趋势,从而快速发现不良苗头,并进行合理引导,将不良信息的影响程度降低到最小。
[0003]情感分析,又称意见挖掘,是对有情感倾向的文本进行处理归纳的过程,因其巨大的应用价值而得到广泛的研究,现在已经普遍应用于评价用户对产品的满意程度、预测大选结果、预测金融走势等领域。针对文章倾向性方面的研究已经存在大量的工作,但这些已有方法大多集中于从静态的角度对文本倾向性的研究,重点关注单个文本的情感倾向性,将文本情感分析看作是一个三元分类过程(如,积极/中立/消极),并未动态地将文章串联起来研究情感的演化趋势。另外,这些方法只是从文本内容的角度进行分析,并未针对突发事件,发现社交网络上群体情感随时间的动态变化趋势。
[0004]用户对突发事件的情感态度是多元化、动态化的。传统的三元分类模型并不能很好的刻画这种性质。而且随着微博的迅速发展,文本数据流产生速度非常快,快速准确地发现用户对突发事件的情感变化趋势,实时监测微博流上公众的情感状态,对于舆情引导具有十分重要的意义。

【发明内容】

[0005]因此,本发明的目的在于克服上述现有技术的缺陷,提供一种微博情感演化分析方法,以实时检测微博用户情感变化趋势。
[0006]本发明的目的是通过以下技术方案实现的:
[0007]一方面,本发明提供了一种微博情感演化分析方法,该方法包括:
[0008]步骤I)基于包含多种情感类型的情感模型来确定每条微博消息的情感向量;其
中,对于任意博文d,其情感向量
【权利要求】
1.一种微博情感演化分析方法,包括: 步骤I)基于包含多种情感类型的情感模型来确定每条微博消息的情感向量;其中,对于任意博文d,其情感向量
2.根据权利要求1所述的方法,还包括构建所述情感模型的步骤,该构建所述情感模型的步骤包括: 步骤a)抽取能够表达用户情感的多个情感词; 步骤b)构建情感词相似性矩阵,该矩阵中的元素为情感词间的相似性; 步骤c)基于情感词相似性矩阵,采用聚类算法将所抽取的情感词聚合为多个情感类型,从而得到包含多种情感类型的情感模型。
3.根据权利要求2所述的方法,所述步骤b)中情感词间的相似性是基于情感词间知网语义相似性和/或检索相似性而得到的。
4.根据权利要求3所述的方法,其中,以Wl,W2表示两个情感词,则二者间的知网语义相似性为:
5.根据权利要求4所述的方法,其中,两个情感词Wl,W2间的相似性为:

6.根据权利要求1所述的方法,所述步骤2还包括采用下列步骤来检测不同时刻对突发事件的情感是否发生了变化: 获取不同时刻的情感向量;其中对于任意时刻t,该时刻t的情感向量E(t)为在该时刻内发表的博文的情感向量的总和; 计算任意两个时刻的情感向量之间的KL距离,如果这两个时刻的情感向量之间KL距离大于给定阈值,则确定在这两个时刻间对突发事件的O整体情感发生了演化。
7.根据权利要求6所述的方法,所述步骤2还包括 对于所获取的任一时刻的情感向量进行归一化处理;其中,对于任意时刻t的情感向量E (t)中的每个元素ei (t),令:
8.根据权利要求7所述的方法,其中任意两个时刻t1;t2,ti < t2,ti与t2时刻的情感向量之间的KL距离为:
9.根据权利要求6所述的方法,所述步骤2还包括检测任意两个时刻的情感向量的某元素之间是否存在明显差异,来判断某种情感是否发生了变化步骤,其包括: 计算情感ei从h时刻到t2时刻的提升度Iii = (ejtj + a )/(ei(t2) + a ),其中,a为非常小的正常数,用于对提升度进行平滑处理; 若、> 1,则确定用户对突发事件的情感^加强,反之若Iii < 1,则确定用户对突发事件的情感ei减弱;若Iii = 1,则确定两个时刻情感ei强度未发生变化。
10.根据权利要求1所述的方法,所述步骤2还包括: 按时间粒度t对博文的情感向量进行聚合,得到情感向量E (t),情感向量E (t)为在该时刻内发表的博文的情感向量的总和; 按从大到小的次序从情感向量E(t)的元素中选择K个元素对应的情感类型作为主流情感来构造情感演化图; 其中,该情感演化图横向表示时间,以时间粒度t为单位,纵向为每个时间段所选择的K个主流情感。
11.一种微博情感演化分析系统,包括: 情感向量确定模块,用于基于包含多种情感类型的情感模型来确定每条微博消息的情感向量;其中,对于任意博文d,其情感向量
【文档编号】G06F17/27GK103559176SQ201310512078
【公开日】2014年2月5日 申请日期:2013年10月25日 优先权日:2012年10月29日
【发明者】张鲁民, 贾焰, 杨树强, 周斌, 韩伟红, 李爱平, 韩毅, 李莎莎 申请人:中国人民解放军国防科学技术大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1