社交网络的用户情感分析方法及装置与流程

文档序号：11199196阅读：774来源：国知局

本发明涉及计算机网络领域，尤其涉及一种社交网络的用户情感分析方法及装置。

背景技术：

近些年来，情感分析技术已成为自然语言处理研究领域的热门话题，情感分析的目标是从文本中挖掘用户表达的观点以及情感极性，挖掘文本中情感倾向可用于帮助其他用户做决定。因此情感分析技术在自然语言处理研究领域得到了广大研究者的关注，具有很大的应用价值。目前，根据训练文本中出现的所有词作为特征进行情感分析，而通过词特征进行的情感分析仅仅考虑句子的词信息，没有考虑句子本身的语义信息，这样会造成情感分析的结果不准确。例如，通过词特征计算句子“alibaba真有钱”和句子“马云发财啦”的相似度为0，但是实际上两个句子的语义是非常相近的。因此现有情感分析的准确率较低。

技术实现要素：

本发明实施例的目的是提供一种社交网络的用户情感分析方法及装置，能有效解决现有情感分析的准确率较低的问题。

为实现上述目的，本发明实施例提供了一种社交网络的用户情感分析方法及装置，包括步骤：

采集社交网络的用户数据；

分析所述用户数据的发表内容，通过lda技术抽取参与的主要话题，并获取正负面词集；

分析用户对每一主要话题的主观情感集；

根据所述正负面词集和主观情感集获得情感值；

与现有技术相比，本发明公开的社交网络的用户情感分析方法通过先采集社交网络的用户数据，再分析所述用户数据的发表内容，抽取参与的主要话题，并获取正负面词集，接着分析用户对每一主要话题的主观情感集，然后根据所述正负面词集和主观情感集获得情感值技术方案，解决了现有情感分析的准确率较低问题，获得量化的情感值，利于将情感值整合进关系分析网络中获得社交网络的关系层次。

作为上述方案的改进，所述社交网络为微博或微信。

作为上述方案的改进，还包括步骤：

根据所述情感值向所述社交网络的用户推荐内容。

作为上述方案的改进，采集所述社交网络的用户数据具体为：

利用大规模并行技术采集所述社交网络的用户数据。

作为上述方案的改进，采集所述社交网络的用户数据具体为：

接收大量所述社交网络的用户数据，将所述社交网络的用户数据分发到多台服务器，进入消息队列系统后快速写入硬盘进行存储和备份。通过上述方案，解决了数据的消费差问题，既能快速的接收海量的数据,从而又保证数据的完整性.存储上采用hadoop系统进行存储和备份,保证了数据的可靠性。

本发明实施例还提供了一种社交网络的用户情感分析装置，包括：

采集模块，用于采集社交网络的用户数据；

正负面词集获取模块，用于分析所述用户数据的发表内容，抽取参与的主要话题，获取正负面词集；

主观情感集获取模块，用于分析用户对每一主要话题的主观情感集；

情感值获取模块，用于根据所述正负面词集和主观情感集获得情感值。

与现有技术相比，本发明公开的社交网络的用户情感分析装置通过采集模块先采集社交网络的用户数据，再通过正负面词集获取模块分析所述用户数据的发表内容，抽取参与的主要话题，并获取正负面词集，接着通过主观情感集获取模块分析用户对每一主要话题的主观情感集，然后通过情感值获取模块根据所述正负面词集和主观情感集获得情感值技术方案，解决了现有情感分析的准确率较低问题，获得量化的情感值，利于将情感值整合进关系分析网络中获得社交网络的关系层次。

作为上述方案的改进，所述社交网络为微博或微信。

作为上述方案的改进，还包括：

推荐模块，用于根据所述情感值向所述社交网络的用户推荐内容。

作为上述方案的改进，所述收集模块具体用于利用大规模并行技术采集所述社交网络的用户数据。

作为上述方案的改进，所述收集模块具体用于接收大量所述社交网络的用户数据，将所述社交网络的用户数据分发到多台服务器，进入消息队列系统后快速写入硬盘进行存储和备份。

附图说明

图1是本发明实施例1提供的一种社交网络的用户情感分析方法的流程示意图。

图2是本发明实施例2提供的一种社交网络的用户情感分析方法的流程示意图。

图3是本发明实施例3提供的一种社交网络的用户情感分析装置的结构示意图。

具体实施方式

下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

参见图1，是本发明实施例1提供的一种社交网络的用户情感分析方法的流程示意图，包括步骤：

s1、采集社交网络的用户数据；其中，所述用户数据包括发表内容；

优选地，利用大规模并行技术采集所述社交网络的用户数据，既能快速的接收海量的数据,从而又保证数据的完整性。

s2、分析所述用户数据的发表内容，通过lda技术抽取参与的主要话题，并获取正负面词集；

其中，所述lda是一种非监督机器学习技术，可以用来识别大规模文档集(documentcollection)或语料库(corpus)中潜藏的主题信息。它采用了词袋(bagofwords)的方法，这种方法将每一篇文档视为一个词频向量，从而将文本信息转化为了易于建模的数字信息。但是词袋方法没有考虑词与词之间的顺序，这简化了问题的复杂性，同时也为模型的改进提供了契机。每一篇文档代表了一些主题所构成的一个概率分布，而每一个主题又代表了很多单词所构成的一个概率分布。

s3、分析用户对每一主要话题的主观情感集；

s4、根据所述正负面词集和主观情感集获得情感值。

具体实施时，先采集社交网络的用户数据，再分析所述用户数据的发表内容，抽取参与的主要话题，并获取正负面词集，接着分析用户对每一主要话题的主观情感集，然后根据所述正负面词集和主观情感集获得情感值技术方案，解决了现有情感分析的准确率较低问题，获得量化的情感值，利于将情感值整合进关系分析网络中获得社交网络的关系层次。

优选地，在另一实施例中，如图2所示，在实施例1的基础上还包括步骤：

s5、根据所述情感值向所述社交网络的用户推荐内容。

通过上述步骤，可通过量化的情感值向所述社交网络的用户推荐个性化的内容，更加智能化，实现信息的自动化筛选。

步骤s1采集所述社交网络的用户数据具体为：

接收大量所述社交网络的用户数据，将所述社交网络的用户数据分发到多台服务器，进入消息队列系统后快速写入硬盘进行存储和备份。

通过上述方案，解决了数据的消费差问题，既能快速的接收海量的数据,从而又保证数据的完整性.存储上采用hadoop系统进行存储和备份,保证了数据的可靠性。

参见图3，是本发明实施例3提供的一种社交网络的用户情感分析装置的结构示意图,包括:

采集模块101，用于采集社交网络的用户数据；

正负面词集获取模块102，用于分析所述用户数据的发表内容，抽取参与的主要话题，获取正负面词集；

主观情感集获取模块103，用于分析用户对每一主要话题的主观情感集；

情感值获取模块104，用于根据所述正负面词集和主观情感集获得情感值。

具体实施时，采集模块先采集社交网络的用户数据，再通过正负面词集获取模块分析所述用户数据的发表内容，抽取参与的主要话题，并获取正负面词集，接着通过主观情感集获取模块分析用户对每一主要话题的主观情感集，然后通过情感值获取模块根据所述正负面词集和主观情感集获得情感值技术方案，解决了现有情感分析的准确率较低问题，获得量化的情感值，利于将情感值整合进关系分析网络中获得社交网络的关系层次。

在一优选实施例中，所述社交网络的用户情感分析装置还包括：

推荐模块，用于根据所述情感值向所述社交网络的用户推荐内容。

在一优选实施例中，作为上述方案的改进，所述收集模块具体用于利用大规模并行技术采集所述社交网络的用户数据。

作为上述方案的改进，所述收集模块具体用于接收大量所述社交网络的用户数据，将所述社交网络的用户数据分发到多台服务器，进入消息队列系统后快速写入硬盘进行存储和备份，解决了数据的消费差问题.既能快速的接收海量的数据,从而又保证数据的完整性.存储上采用hadoop系统进行存储和备份,保证了数据的可靠性。

综上，本发明公开的社交网络的用户情感分析方法通过先采集社交网络的用户数据，再分析所述用户数据的发表内容，抽取参与的主要话题，并获取正负面词集，接着分析用户对每一主要话题的主观情感集，然后根据所述正负面词集和主观情感集获得情感值技术方案，解决了现有情感分析的准确率较低问题，获得量化的情感值，利于将情感值整合进关系分析网络中获得社交网络的关系层次。

以上所述是本发明的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本发明原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也视为本发明的保护范围。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：晋彤
技术所有人：广州特道信息科技有限公司
我是此专利的发明人

上一篇：一种基于翻译笔的翻译方法、装置及系统与流程
上一篇：微博微信文本中地名识别方法与流程

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。