基于非线性特征的情绪识别方法及系统与流程

文档序号：16047311发布日期：2018-11-24 10:58阅读：219来源：国知局

本发明涉及情绪识别方法技术领域，具体为基于非线性特征的情绪识别方法及系统。

背景技术

情绪是一种综合了人的感觉、思想和行为的状态，它包括人对外界或自身刺激的心理反应，也包括伴随这种心理反应的生理反应。人类的情绪与身心健康密切关系，如果人类长期处于焦虑、忧愁、悲伤、恼怒、压抑等状态下，可能导致神经分裂、高血压、心脏病、溃疡、胃病和癌症等多种疾病，一般称为心因性疾病，因此掌握一个人，特别是老人的情绪情况，对于掌握身心状况非常有利。

情绪识别分析，对于老人，特别是失能和空巢老人，具有很大的价值。随着中国社会老龄化的加剧，以及大城市对年轻人就业、教育等方面的吸引力，空巢老人这一特殊群体势必会成为社会的普遍现象。但这一群体虽然正逐渐受到社会的关注，却依然缺乏有效的方式来为空巢老人提供及时的健康监管以及心理慰藉。通过情绪分析，能够实时反映出老人的情绪状况，并及时反馈给相关医务人员和子女，让他们更能了解父母的情绪，从而增加对老人的关心和及时的治疗。而在这一领域，我国市场上还没有相应成熟完善的产品和服务。

因此，如何提供一种更加客观、准确的老年人的情绪识别方法和系统，成为本领域亟需解决的问题。

技术实现要素：

本发明意在提供基于非线性特征的情绪识别方法及系统，能够根据用于的语音输入从多角度、多方面对用户情绪进行全面准确的分析识别。

为了解决上述技术问题，本专利提供如下技术方案：

基于非线性特征的情绪识别方法，包括以下步骤：

语音采集步骤，采集用户说话的语音；

特征提取步骤，对用户的语音进行处理分析，提取匹配特征；所述匹配特征包括音频特征、非线性特征以及语义特征；

模型匹配步骤，根据特征提取步骤提取到的匹配特征与预设的情绪模型进行匹配，找出匹配程度最高的情绪模型作为情绪识别结果。

本发明技术方案中，匹配特征包括音频特征、非线性特征以及语义特征三种，对音频数据进行综合性的分析，音频特征为传统的线性特征，通过其可以分析较为平稳的语音信号，而针对于不平稳的、变化较大的语音信号，通过非线性特征可以解决非特定人连续语音分析、高质量低速率语音编码等传统音频特征所不能解决的问题，弥补音频特征的不足，而通过语义特征分析用户讲话的具体内容，从宏观的角度分析用户的情绪状态，有助于进一步精准的判断用户的情绪状态。本申请的技术方案中，通过结合这三个方面的特征全面、准确的识别用户的情绪。

进一步，所述特征提取步骤包括：

步骤一：根据采集到的语音计算非线性特征；

步骤二：将采集到的语音分割成多个片段；

步骤三：计算每一个片段的音频特征；

步骤四：对采集到的语音进行语义识别；

步骤五：从识别到的语义内容中提取语义特征。

音频特征的提取基于线性系统理论,需要将语音信号分割为一些短段再加以处理，以保证每一个片段视为确定的平稳信号，进而在经过处理以后计算生成音频特征。

进一步，所述语义特征包括关键词特征，所述特征提取步骤的步骤五具体包括：

关键词提取步骤，根据预设的关键词库提取语义内容中的所有关键词以及出现的频率。

通过提取关键词来分析用户的情绪，例如“生气”、“高兴”、“难受”等，通过统计关键词出现的频率可以进一步确认用户是否是偶然说到某个关键词，减小偶然因素带来的误差。

进一步，情绪模型中包含每一个匹配特征的权重，所述模型匹配步骤包括：

步骤一：对于每一个预设的情绪模型，根据各个匹配特征的权重值计算每个匹配特征的得分；

步骤二：将匹配特征的得分进行求和，得到匹配程度得分；

步骤三：根据匹配程度得分对每个情绪模型进行比较，选取匹配程度得分最高的情绪模型所对应的情绪作为情绪识别结果。每一个情绪模型有不同的权重分配比例，通过加权求和计算匹配程度得分，生成当前语音相对于每一个情绪模型的匹配程度得分，根据该分值即可得出情绪识别结果。

进一步，所述音频特征包括音高、能量、共振峰、过零率、teager能量运算子以及梅尔倒频谱系数。这些音频特征是音频分析过程中最为重要的一些特征，通过这些特征可以实现对平稳语音的识别、分析和处理。

进一步，所述非线性特征包括赫斯特指数、曲率指标、香农熵、lempel-ziv复杂度、交互信息、关联维度以及李亚普诺夫指数。通过这些参数可以对音频的噪音、波动等进行处理，提高情绪分析准确性。

进一步，本申请中还公开了一种使用了上述方法的基于非线性特征的情绪识别系统，该系统包括：

语音采集模块，用于采集用户说话的语音；

特征提取模块，用于从采集到的语音中提取匹配特征；

模型匹配模块，用于根据匹配特征与预设的情绪模型进行匹配，筛选出匹配程度最高的情绪模型作为情绪识别结果；

其中特征提取模块包括：

非线性特征提取子模块，用于从采集到的语音中提取非线性特征；

音频特征提取子模块，用于从采集到的语音中提取音频特征；

语义特征提取子模块，用于对采集到的语音进行语义识别并提取语义特征。

进一步，所述音频特征提取子模块包括音频切割单元和音频特征计算单元，所述音频切割单元用于对采集到的语音切割成为多个片段，所述音频特征计算单元用于计算每个片段音频特征。

进一步，所述语义特征提取子模块包括语义识别单元、关键词提取单元和频率记录单元，所述语音识别单元用于对采集到的语音进行语义识别，所述关键词提取单元用于根据预设的关键词库从语义内容中提取关键词，所述频率记录单元用于记录每个关键词出现的次数。

进一步，所述模型匹配模块包括模型存储子模块、匹配程度计算子模块以及匹配程度比较子模块，所述模型存储子模块用于存储情绪模型，所述匹配程度计算子模块用于根据情绪模型计算各个匹配特征的得分并计算匹配程度得分，所述匹配程度比较子模块用于对各个情绪模型的匹配程度得分进行比较，筛选出匹配程度得分最高的情绪模型并以该情绪模型对应的情绪作为识别结果。

附图说明

图1为本发明基于非线性特征的情绪识别系统实施例中的逻辑框图。

具体实施方式

下面通过具体实施方式进一步详细说明：

本实施例的基于非线性特征的情绪识别方法基于非线性特征的情绪识别方法，包括以下步骤：

语音采集步骤，采集用户说话的语音。本实施例中通过陪伴老人的智能终端，在获得老人授权的情况下采集老人与其他老人交谈的对话语音以及智能终端与老人对话的语音。

特征提取步骤，对用户的语音进行处理分析，提取匹配特征；匹配特征包括音频特征、非线性特征以及语义特征。

具体的，特征提取步骤包括：

步骤一：根据采集到的语音计算非线性特征；

步骤二：将采集到的语音分割成多个片段；

步骤三：计算每一个片段的音频特征；

步骤四：对采集到的语音进行语义识别；

步骤五：从识别到的语义内容中提取语义特征。

音频特征包括音高、能量、共振峰、过零率、teager能量运算子以及梅尔倒频谱系数。非线性特征包括赫斯特指数、曲率指标、香农熵、lempel-ziv复杂度、交互信息、关联维度以及李亚普诺夫指数。通过这些参数可以对音频的噪音、波动等进行处理，提高情绪分析准确性。语义特征包括关键词特征。

特征提取步骤的步骤五包括：关键词提取步骤，根据预设的关键词库提取语义内容中的所有关键词以及出现的频率。

音频特征的提取分析基于线性系统理论,将语音信号分割为一些短段再加以处理，可以保证每一个片段视为确定的平稳信号，进而在经过处理以后计算生成音频特征，同时将一段语音改变为多个片段进行更微观的分析和处理，可以进一步增加处理精度。音高、能量、共振峰、过零率、teager能量运算子以及梅尔倒频谱系数等音频特征是音频分析过程中最为重要的一些特征，通过这些特征可以实现对平稳语音的识别、分析和处理。

语音信号是一个复杂的非线性过程。用声学和空气动力学理论分析,语音不仅有声门的非线性振动过程,受舌、声道形状的变化,语音信号(特别是摩擦音、爆破音等)会在声道边界层产生涡流,并最终形成湍流,发其它音时,声门喷出的气流仍有湍流存在,而湍流本身就是一种混沌。语音时域波形具有自相似性,且表现出周期性和随机性。本实施例中，通过赫斯特指数、曲率指标、香农熵、lempel-ziv复杂度、交互信息、关联维度以及李亚普诺夫指数等参数可以对音频的噪音、波动、周期性等进行处理，提高情绪分析准确性。

模型匹配步骤，根据特征提取步骤提取到的匹配特征与预设的情绪模型进行匹配，找出匹配程度最高的情绪模型作为情绪识别结果。本实施例中，情绪模型包括生气、开心、厌恶、害怕、中性和伤心六种，每一个情绪模型中均包含所有的匹配特征的权重，不同的情绪模块的权重分配不同，模型匹配步骤包括：

步骤一：对于每一个预设的情绪模型，根据各个匹配特征的权重值计算每个匹配特征的得分；具体的，对于非线性特征，直接按照权重乘以特征值得到得分，对于音频特征，则首先计算某一个音频特征在各个片段的平均值，然后再以平均值乘以权重得到评分，对于关键词，则以关键词乘以权重乘以频率来计算得分。

步骤二：将匹配特征的得分进行求和，得到匹配程度得分；

步骤三：根据匹配程度得分对每个情绪模型进行比较，选取匹配程度得分最高的情绪模型所对应的情绪作为情绪识别结果。

还包括数据记录步骤，所述数据记录步骤用于根据情绪识别的结果和语义内容，将情绪与事件关联起来，并根据后台服务器的大数据事件关联规则将事件进行关联，然后将事件与事件以及事件与情绪的这种关系进行存储，构建用户情绪事件库；例如当老人谈起自己的孩子的工作时的情绪是开心的，则将孩子工作这个事件与开心相关联起来，当老人谈到自己孩子过年回家的事情时是伤心的，则将孩子过年回家这个事件与伤心的情绪关联起来，而再根据后台服务器预设的关联规则，将孩子工作和孩子过年回家这两个事情关联起来，这些关联规则由管理人员根据大数据分析得到，也可以由管理人员人工制定。

还包括情绪处理步骤，所述情绪处理步骤包括：

步骤一：根据当前用户的情绪，判断当前用户情绪是否处于消极状态，生气、厌恶、害怕和伤心都属于消极状态，如果是，则执行步骤二，如果否，则结束运行；

步骤二：根据之前采集的对话的语音内容，判断消极状态的关联事件，将其作为老人情绪波动的原因发送给用户的亲人或者监管人员；

步骤三：在用户的用户情绪事件库中寻找关联情绪为开心情绪的且与当前引发老人消极情绪的事件相关联的事件，并通过语音、视频等形式呈现给用户，进而达到劝阻效果。例如老人因为孩子过年不回家而伤心，则自动关联到孩子工作这个事件，进而向老人播放孩子事业成功等事情，引导老人就相关的事情从积极的方面来考虑，达到安慰效果。通过该步骤，可以就同一事件或者相关事件，在用户心情不好时，使用户能够从积极的方面来看待事件，实现情绪安慰的效果。

本实施例的技术方案中，匹配特征包括音频特征、非线性特征以及语义特征三种，对音频数据进行综合性的分析，音频特征为传统的线性特征，通过其可以分析较为平稳的语音信号，而针对于不平稳的、变化较大的语音信号，通过非线性特征可以解决非特定人连续语音分析、高质量低速率语音编码等传统音频特征所不能解决的问题，弥补音频特征的不足，而通过语义特征分析用户讲话的具体内容，从宏观的角度分析用户的情绪状态，有助于进一步精准的判断用户的情绪状态。本申请的技术方案中，通过结合这三个方面的特征全面、准确的识别用户的情绪。每一个情绪模型有不同的权重分配比例，通过加权求和计算匹配程度得分，生成当前语音相对于每一个情绪模型的匹配程度得分，根据该分值即可得出情绪识别结果。

如图1所示，本实施例中还公开了一种使用了上述方法的基于非线性特征的情绪识别系统，该系统包括：

语音采集模块，用于采集用户说话的语音；

特征提取模块，用于从采集到的语音中提取匹配特征；特征提取模块包括：非线性特征提取子模块、音频特征提取子模块和语义特征提取子模块，非线性特征提取子模块用于从采集到的语音中提取非线性特征；音频特征提取子模块用于从采集到的语音中提取音频特征；语义特征提取子模块用于对采集到的语音进行语义识别并提取语义特征。音频特征提取子模块包括音频切割单元和音频特征计算单元，音频切割单元用于对采集到的语音切割成为多个片段，音频特征计算单元用于计算每个片段音频特征。语义特征提取子模块包括语义识别单元、关键词提取单元和频率记录单元，语音识别单元用于对采集到的语音进行语义识别，关键词提取单元用于根据预设的关键词库从语义内容中提取关键词，频率记录单元用于记录每个关键词出现的次数。

模型匹配模块，用于根据匹配特征与预设的情绪模型进行匹配，筛选出匹配程度最高的情绪模型作为情绪识别结果；模型匹配模块包括模型存储子模块、匹配程度计算子模块以及匹配程度比较子模块，模型存储子模块用于存储情绪模型，匹配程度计算子模块用于根据情绪模型计算各个匹配特征的得分并计算匹配程度得分，匹配程度比较子模块用于对各个情绪模型的匹配程度得分进行比较，筛选出匹配程度得分最高的情绪模型并以该情绪模型对应的情绪作为识别结果。

数据记录模块，所述数据记录模块用于根据情绪识别的结果和语义内容，将情绪与事件关联起来，并根据后台服务器的大数据事件关联规则将事件进行关联，然后将事件与事件以及事件与情绪的这种关系进行存储，构建用户情绪事件库；例如当老人谈起自己的孩子的工作时的情绪是开心的，则将孩子工作这个事件与开心相关联起来，当老人谈到自己孩子过年回家的事情时是伤心的，则将孩子过年回家这个事件与伤心的情绪关联起来，而再根据后台服务器预设的关联规则，将孩子工作和孩子过年回家这两个事情关联起来，这些关联规则由管理人员根据大数据分析得到，也可以由管理人员人工制定。

还包括情绪处理模块，所述情绪处理模块用于根据当前用户的情绪，判断当前用户情绪是否处于消极状态，生气、厌恶、害怕和伤心都属于消极状态，如果是，则根据之前采集的对话的语音内容，判断消极状态的关联事件，将其作为老人情绪波动的原因发送给用户的亲人或者监管人员；同时在用户的用户情绪事件库中寻找关联情绪为开心情绪的且与当前引发老人消极情绪的事件相关联的事件，并通过语音、视频等形式呈现给用户，进而达到劝阻效果。例如老人因为孩子过年不回家而伤心，则自动关联到孩子工作这个事件，进而向老人播放孩子事业成功等事情，引导老人就相关的事情从积极的方面来考虑，达到安慰效果。通过该步骤，可以就同一事件或者相关事件，在用户心情不好时，使用户能够从积极的方面来看待事件，实现情绪安慰的效果。

以上的仅是本发明的实施例，方案中公知的具体结构及特性等常识在此未作过多描述，所属领域普通技术人员知晓申请日或者优先权日之前发明所属技术领域所有的普通技术知识，能够获知该领域中所有的现有技术，并且具有应用该日期之前常规实验手段的能力，所属领域普通技术人员可以在本申请给出的启示下，结合自身能力完善并实施本方案，一些典型的公知结构或者公知方法不应当成为所属领域普通技术人员实施本申请的障碍。应当指出，对于本领域的技术人员来说，在不脱离本发明结构的前提下，还可以作出若干变形和改进，这些也应该视为本发明的保护范围，这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准，说明书中的具体实施方式等记载可以用于解释权利要求的内容。

完整全部详细技术资料下载

当前第1页1 2

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：潘晓明
技术所有人：重庆柚瓣家科技有限公司
我是此专利的发明人

上一篇：一种鱼肉饼及其制备方法与流程
上一篇：一种天然气管道铺设的防护型辅助装置的制作方法