智能识别情绪的方法及装置与流程

文档序号:12121009阅读:443来源:国知局
智能识别情绪的方法及装置与流程

本发明涉及智能识别术领域,具体涉及一种智能识别情绪的方法及装置。



背景技术:

现有的文本情感分析是提取文本内的关键词,根据关键词的字面意思进行情绪识别,但由于每个人对于每个主题或话题的喜好程度不同,因此单就文字的字面意思而忽略个人的喜好与偏好而进行情绪情感识别往往由于信息较少而导致判断结果不精确。



技术实现要素:

针对现有技术中的缺陷,本发明提供了一种智能识别情绪的方法及装置,在情绪判断中加入了话题特征值,提高了情绪辨识的准确度。

第一方面,本发明提供的一种智能识别情绪的方法,包括:接收用户输入的文本语句;从所述文本语句中提取文本信息特征值;从所述文本语句中提取当前话题特征值;将所述文本信息特征值和所述当前话题特征值输入情绪识别模型得到用户情绪值。

优选地,所述从所述文本语句中提取文本信息特征值,包括:对所述文本语句进行分词处理得到单词,对各个所述单词进行词性标注,根据所述单词的词性提取所述文本语句中的动词,识别与所述动词有语意关联的单词,并标注所述动词和识别的单词的语意关系,得到单词关系特征值;对所述文本语句进行句型句法分析,得到句型特征值。

优选地,所述从所述文本语句中提取文本信息特征值,包括:根据前文文意改写所述文本语句得到改写语句;对所述改写语句进行分词处理得到单词,对各个所述单词进行词性标注,根据所述单词的词性提取所述改写语句中的动词,识别与所述动词有语意关联的单词,并标注所述动词和识别的单词的语意关系,得到单词关系特征值;对所述改写语句进行句型句法分析,得到句型特征值。

优选地,所述从所述文本语句中提取当前话题特征值,包括:提取所述文本语句中的关键词;对所述关键词进行分类;根据分类后的关键词得到当前话题特征值。

优选地,所述当前话题特征值包括:当前主要话题和当前次要话题。

优选地,所述接收用户输入的文本语句,包括:接收用户输入的文本语句和用户ID;在进行情绪识别前,还包括:根据所述用户ID获取所述用户的话题历史数据;所述将所述文本信息特征值和当前话题特征值输入预先训练的情绪识别模型得到用户情绪值,包括:将所述文本信息特征值、当前话题特征值、话题历史数据输入预先训练的情绪识别模型得到用户情绪值。

优选地,所述话题历史数据包括过去话题特征值、用户的常聊话题和每个话题对应的话题喜好程度。

优选地,还包括:通过网络获取时下热门话题;所述将所述文本信息特征值、所述当前话题特征值、所述话题历史数据、所述时下热门话题输入预先训练的情绪识别模型得到用户情绪值。

优选地,所述情绪识别模型的训练步骤包括:将预先搜集的用户的文本语句作为测试语句,并为每个所述测试语句标注用户情绪值;提取每个所述测试语句的话题特征值与文本信息特征值;将所述测试语句的话题特征值与文本信息特征值输入情绪识别模型得到用户情绪预测值,根据所述用户情绪预测值和标注的用户情绪值调整情绪识别模型的参数;继续训练所述情绪识别模型,直到所述情绪识别模型输出的用户情绪预测值达到要求。

第二方面,本发明实施例提供的一种智能识别情绪的装置,包括:接收模块,用于接收用户输入的文本语句;文本信息特征值提取模块,用于从所述文本语句中提取文本信息特征值;话题特征值提取模块,用于从所述文本语句中提取当前话题特征值;情绪识别模块,用于将所述文本信息特征值和所述当前话题特征值输入情绪识别模型得到用户情绪值。

附图说明

图1示出了本发明实施例所提供的智能识别情绪的方法的流程图;

图2示出了本发明实施例所提供的智能识别情绪的装置的结构框图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只是作为示例,而不能以此来限制本发明的保护范围。

需要注意的是,除非另有说明,本申请使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。

如图1所示,本发明实施例提供的一种智能识别情绪的方法,包括:

步骤S1,接收用户输入的文本语句。

步骤S2,从文本语句中提取文本信息特征值。

步骤S3,从文本语句中提取当前话题特征值。

步骤S4,将文本信息特征值和当前话题特征值输入情绪识别模型得到用户情绪值。

本实施例提供的智能识别情绪的方法,在情绪判断中加入了话题特征值,提高了情绪辨识的准确度。根据没有加入话题特征值方法,得到的情绪预测的准确度约为83%,而依据本实施例的方法,情绪预测的准确度能提升至93%。

文本信息特征值包括单词关系特征值和句型特征值,步骤S2的具体实现方式为:

步骤S21,对文本语句进行分词处理得到单词,对各个单词进行词性标注,根据单词的词性提取文本语句中的动词,识别与动词有语意关联的单词,并标注动词和识别的单词的语意关系,得到单词关系特征值。

其中,单词的词性包括:动词、名词、形容词、副词、连接词、定位词、代词、限定词&数词、量词、副词、介词、感叹词等。例如:输入的文本语句为:“我肚子饿了”,分词处理后的结果为“我”“肚子”“饿”“了”,然后对各个单词进行标注,“我”和“肚子”标注为名词,“饿”标注为动词,“了”标注为副词,提取出的动词为“饿”,与动词“饿”有语意关联的单词为“我”和“肚子”,根据单词间的语意关系,得到单词关系特征值为“我肚子->饿”。

步骤S22,对文本语句进行句型句法分析,得到文本语句的句型特征值。

其中,句型特征值包括:肯定句、否定句、疑问句等。

考虑到有些文本语句信息不足,无法提取出准确地文本信息特征值,步骤S2的另一种具体实现方式为:

步骤S201,根据前文文意改写文本语句得到改写语句。

其中,改写句子是为了解决文本语句信息不足的现象,例如,A:“你喜欢看电影吗?”B:“喜欢”。根据B输入的文本语句只能提取到“喜欢”,此时信息量不足。如果根据前文“你喜欢看电影吗?”做改写,B输入的文本语句就会变成“喜欢看电影”,此时就能提取到关键词“电影”。可见,原始的文本语句都需要保存下来,以便能够根据前文文意进行句子的改写。

步骤S202,对改写语句进行分词处理得到单词,对各个单词进行词性标注,根据单词的词性提取文本语句中的动词,识别与动词有语意关联的单词,并标注动词和识别的单词的语意关系,得到单词关系特征值。步骤S202与步骤S21的处理方式相同。

步骤S203,对改写语句进行句型句法分析,得到句型特征值。步骤S203与步骤S22的处理方式相同。

因此,文本信息特征值包括:单词关系特征值、句型特征值、改写语句、文本语句。

如果单词关系特征值、句型特征值、改写语句、文本语句都存在的话,就都会输入情绪识别模型。如果有些信息是不存在的,就不输入。例如,输入的文本语句为“篮球赛好看”,文本信息特征值为:“篮球赛,肯定句,篮球赛好看,这场篮球赛好看”,对应“单词关系特征值、句型特征值、原始句子、改写语句”。

其中,步骤S3,从文本语句中提取当前话题特征值,具体包括:

步骤S31,提取文本语句中的关键词。

步骤S32,对关键词进行分类。

步骤S33,根据分类后的关键词得到当前话题特征值。

通过把大量的同义词和日常生活经验结合,得到多种类别。例如:篮球,棒球,足球,都被分类成“球类运动”,花式滑板、花式单车、花式滑浪、花式滑雪、滑翔、跑酷、攀岩等都被分类成“极限运动”,而“球类运动”和“极限运动”都包含在“运动”类别下。步骤S3中,对关键词进行分类,可以提高提取当前话题特征值的准确率。

其中,当前话题特征值包括:当前主要话题和当前次要话题。例如:输入的文本语句为“我想出去运动,可是外面在下雨。”,提取到当前主要话题为“运动”,当前次要话题为“天气”,文本信息特征值中的单词关系特征值为:“想要->运动”和“天气->下雨”,将当前主要话题、当前次要话题、文本信息特征值输入情绪识别模型,输出结果有较高的机率是“轻微难过”。当然,当前话题特征值也可以只包含当前主要话题。

步骤S3可以采用机器学习或深度学习方法实现。先建立基于机器学习或深度学习的话题特征值提取模型,具体包括:搜集用户日常生活中的聊天内容,获得文本语句;对文本语句中的词语做分类,并标注文本语句包含的话题;将标注好的文本语句输入基于机器学习或深度学习的话题特征值提取模型,将文本语句标注的话题当作反馈,以更新话题特征值提取模型的参数,并且根据经验与实验的反馈来设定迭代的次数,不断优化模型参数,得到最终的话题特征值提取模型。在测试的阶段当中,当用户输入一个本文句子时,通过话题特征值提取模型即可提取出话题特征值。

为了进一步提高情绪预测的准确率,情绪识别模型的输入还包括话题历史数据,话题历史数据包括过去话题特征值、用户的常聊话题和每个话题对应的话题喜好程度,过去话题特征值包括过去主要话题、过去次要话题。每个用户自己的账户,用来存储话题历史数据,需要时只需根据用户ID从历史数据库中提取即可。则智能识别情绪的方法的具体步骤为:

步骤S10,接收用户输入的文本语句和用户ID。

步骤S20,从文本语句中提取文本信息特征值。

步骤S30,从文本语句中提取当前话题特征值。

步骤S40,根据用户ID获取用户的话题历史数据;

步骤S50,将文本信息特征值、当前话题特征值、话题历史数据输入预先训练的情绪识别模型得到用户情绪值。

其中,用户每一次的当前话题特征值都会存储在历史数据库中,形成过去话题特征值。过去话题特征值,可以包含上一轮会话,但是也会是包含上几轮会话的话题。例如:

A:你喜欢运动吗?B:不讨厌啊。你有看MLB吗?

A:有啊,最近很精彩。B:小熊赢了总冠军。

A:你支持小熊吗?B:对啊。

根据前几轮谈论对话,可以知道B喜欢运动,且有关注棒球,支持小熊,小熊赢了总冠军。根据这些就可以推测目前B是喜悦情绪的概率较高。

其中,常聊话题和话题喜好程度则是根据历史数据库中的数据统计得到,常聊话题和话题喜好程度是分析用户的大量文本语句得到的结构,一定程度上反应了用户的情绪,有助于提高识别情绪的准确度。

情绪识别模型的输入还包括时下热门话题,时下热门话题通过网络获取,加入时下热门话题有助于提高识别情绪的准确度。

情绪识别模型可以采用逻辑判断、机器学习、深度学习等算法训练得到,情绪识别模型的训练步骤包括:

步骤S51,将预先搜集的用户的文本语句作为测试语句,并为每个测试语句标注用户情绪值。

步骤S52,提取每个测试语句的话题特征值与文本信息特征值。

步骤S53,将测试语句的话题特征值与文本信息特征值输入情绪识别模型得到用户情绪预测值,根据用户情绪预测值和标注的用户情绪值调整情绪识别模型的参数。

步骤S54,继续训练情绪识别模型,直到情绪识别模型输出的用户情绪预测值达到要求。

基于与上述智能识别情绪的方法相同的发明构思,本实施例提供了一种智能识别情绪的装置,包括:接收模块101,用于接收用户输入的文本语句;文本信息特征值提取模块102,用于从文本语句中提取文本信息特征值;话题特征值提取模块103,用于从文本语句中提取当前话题特征值;情绪识别模块104,用于将文本信息特征值和当前话题特征值输入情绪识别模型得到用户情绪值。

本发明实施例提供的智能识别情绪的装置,在情绪判断中加入了话题特征值,提高了情绪辨识的准确度。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1