网络情绪的确定方法和装置的制造方法_2

文档序号：9375801阅读：来源：国知局

的程度。
[0028]以每种情绪的网络信息的条数和网络信息所赋予的权重为基础，来计算相应的网络情绪对所有情绪的量化值。其中，量化值可以表示与其对应的网络情绪的表现的程度，该值越大，其对应的网络情绪越强烈；网络信息所赋予的权重则表示网络信息对网络情绪的量化值的影响力，如果网络信息的权重越大，该网络信息对其相应的网络情绪的影响越大。
[0029]本发明实施例中，按照预先设定的网络情绪类型(包括第一情绪、第二情绪、第三情绪、第四情绪和第五情绪)进行训练，得到训练模型，通过该训练模型可以识别用户发布的网络信息中所包含的网络情绪，也即是网络信息对应的网络情绪，从而确定用户的情绪是第一情绪，或者第二情绪，或者第三情绪，或者第四情绪，或者第五情绪。
[0030]通过获取目标事件的关键词，获取与该关键词关联的网络信息，利用预先建立的分类模型确定网络信息对应的网络情绪，根据第一情绪、第二情绪、第三情绪、第四情绪和第五情绪中每一种情绪对应的网络信息的条数和赋予的权重分别计算每一种情绪的量化值，由于经过训练得到的分类模型可以识别出网络信息中所包含的网络情绪包括多种，从而解决了由于对网络情绪的分类比较单一造成的无法准确地反映网络情绪的问题，识别出的网络情绪更加多样化，从而准确地反映出用户对目标事件的网络情绪。进一步地，对各类型的情绪的量化值进行计算，可以得到网络上对目标事件的情绪的倾向性。
[0031]优选地，上述第一情绪、第二情绪、第三情绪、第四情绪和第五情绪可以依次为愤怒、厌恶、高兴、悲伤和恐惧。
[0032]优选地，可以根据每条网络信息的来源确定其权值，再使用计算模型来计算得到每种情绪的量化值。其中，不同来源的网络信息计算时，由于其权重不同，相应的权值不同，例如，来自网络媒体的网络信息的权重会比来自个人的网络信息的权重要高，不同来源的权值可以在训练过程中确定，从而可以在计算时由训练模型来确定每一条网络信息的权值。
[0033]例如，对于指定时间段内的，目标时间相关的网络信息，先用分类模型对其做情绪分析，确定每条信息对应的网络情绪，然后按照如下公式计算得到各情绪的量化值:
[0034]Z = a0*b0+ al*bl+ a2*b2+ a2*b2+ a3*b3......
[0035]其中，Z表示量化值，a0、al、a2、a3等表示相应来源的网络信息条数，b0、bl、b2、b3等表示不同来源的权值。
[0036]以“愤怒”的情绪为例，可以先按信息来源进行统计。比如:官方媒体100条，微博大V 200条，普通网民300条。再从分类模型里，读出每种来源的权重数据。比如:官方媒体0.8，微博大V 0.5，普通网民0.2。然后，对于上述的信息，进行加权汇总。“愤怒”情绪的量化值为:100*0.8+200*0.5+300*0.2 = 240。其他的情绪可以采用上述相同的方式，计算得到量化值。最终得到的是在指定时间段内，对该时间的各种情绪量化值，比如:愤怒240，厌恶200，高兴100，悲伤50，恐惧300。
[0037]需要说明的是，本发明实施例中的情绪还可以包括第六情绪和/或第七情绪等。另外，再计算每一种情绪的量化值时，也可以认为所有网络信息的权值都为1，那么每一种情绪的量化值则可以是该情绪对应的网络信息的条数。上述示例仅仅是为了描述本发明实施例的技术原理，并不对本发明有不当限定。
[0038]优选地，本发明实施例中，还可以结合地区、性别、认证身份等指标计算得到相应的量化值，这样，可以通过这些指标来对网络情绪进行分析。
[0039]优选地，本发明实施例中的网络信息可以是用户在网络上发布的博客、微博、朋友圈消息、应用社区消息(如QQ空间)、论坛上的帖子、评论等等。网络信息可以通过网络爬虫、自动脚本、手工输入等方式获取。网络信息的具体形式可以是文本信息，也可以是音频信息，还可以是视频信息等。
[0040]本发明实施例中，用户发布的网络信息可以是针对用户当前时刻的情绪的，也可以是针对某个事件、某个事物的情绪。因此，本发明实施例的方案可以用于网络中对目标事件或者事物的网络情绪，具体可以获取与目标事件或者事物相关的网络信息，利用分类模型对获取到的网络信息进行识别，确定出该网络信息对应的网络情绪，从而可以统计出网络用户对目标事件或者事物的各种不同的情绪。
[0041]优选地，在利用预先建立的分类模型确定网络信息对应的网络情绪之前，方法还包括:获取用于建立分类模型的网络信息；提取用于建立分类模型的网络信息中用于表达情感的关键词；按照预设的网络情绪类型对用于表达情感的关键词进行训练，得到分类模型。
[0042]用于建立分类模型的网络信息可以通过网络爬虫、自动脚本、手工输入等方式获取，由于该网络信息用于建立分类模型，因此，获取的该网络信息的数据量相对较大，以便于训练出识别准确性较高的分类模型。
[0043]在获取到大量的网络信息之后，从该网络信息中提取用于表达情感的关键词，或者关键信息，例如“哈哈”，“哎”，“难过”等等，然后按照预设的网路情绪分类(包括愤怒、厌恶、高兴、悲伤和恐惧)对关键词进行训练，得到上述分类模型。在得到分类模型之后，可以利用该分类模型对新输入的网络信息进行情绪识别或者分类。
[0044]优选地，在获取用于建立分类模型的网络信息之后，以及提取用于建立分类模型的网络信息中的用于表达情感的关键词之前，方法还包括:判断网络信息是否为可识别的文本信息；如果判断出网络信息不是可识别的文本信息，则将网络信息转化为可识别的文本信息，对转化后的可识别的文本信息进行分词；如果判断出网络信息是可识别的文本信息，则直接对网络信息进行分词。
[0045]本实施例中，由于获取到的网络信息可以是多种形式的信息(包括文本信息、音频信息、视频信息)，而通常关键词的提取是从可识别的文本信息中提取，因此，在获取到用于建立分类模型的网络信息之后，以及提取用于建立分类模型的网络信息中的用于表达情感的关键词之前，可以先判断获取到的网络信息是否为可识别的文本信息，如果是，则可以直接对该网络信息进行分词，以便于从中提取关键词；如果否，则将该网络信息转化为可识别的文本信息，再进行分词，以便于从转化后的文本信息中提取关键词。
[0046]需要说明的是，本发明实施例中，在得到分类模型之后，对新输入的网络信息进行分类或者识别时，也可以先判断该网络信息是否为可识别的文本信息，以便于快速确定网络信息对应的网络情绪。
[0047]进一步地，如果判断出网络信息不是可识别的文本信息，则将网络信息转化为可识别的文本信息包括:如果网络信息为音频信息，则利用语音识别将音频信息转化为可识别的文本信息；如果网络信息为视频信息，则从视频信息中提取音频信息，利用语音识别将提取的音频信息转化为可识别的文本信息。
[0048]本实施例中，对于音频信息，可以识别语音识别技术，将语音信息转化为文本信息再从文本信息中提取关键词；对于视频信息，则可以先提取出该视频信息中的音频信息，再采用针对音频信息的转化方式进行处理。
[0049]需要说明的是，本发明实施例中，各种网络信息可以是采用各种语言的信息，例如，中文、英文、日文等等，对于不同的语言，可以转化为相同的可识别的文本信息。
[0050]优选地，在利用预先建立的分类模型确定网络信息对应的网络情绪之后，方法还包括:获取网络信息发布时的位置信息；基于位置信息确定网络信息所在的地区；根据网络信息对应的网络情绪确定各地区的网络情绪。
[0051]由于用户发布的网络信息中通常都会携带有其所在的位置信息，获取该位置信息，并确定其所在的地区，该地区可以是以省、市等为单位划分的行政区域，然后根据确定出的网络信息对应的网络情绪来确定各地区的网络情绪。优选地，如果在某个地区的网络情绪包括上述网络情绪(包括愤怒、厌恶、高兴、悲伤和恐惧)中的多种，可以将所占比重最大的情绪作为该地区的网络情绪。
[0052]例如，对于某一条购房政策，全国各地区的人们会存在不同的情绪，将每个地区的主导情绪作为该地区的情绪，从而可以确定出各地区对该条政策的倾向性情绪。
[0053]本发明实施例中，对于与关键词关联的网络信息，可以利用网络信息与目标事件的关联度来确定，具体可以计算网络信息与目标事件的关键词的关联度，其关联度超过预设阈值，则确定该网络信息为与关键词关联的网络信息。
[0054]例如，“钓鱼岛事件”，以“钓鱼岛”为关键词，获取相关联的网络信息，“岛屿主权纠纷”等类似信息与其关联度较高，可以作为

完整全部详细技术资料下载

当前第2页1 2 3 4