一种基于自适应模糊支持向量机的情绪识别方法与流程

文档序号:15001704发布日期:2018-07-24 20:16阅读:377来源:国知局

本发明涉及信号处理和模式识别,特别涉及一种基于自适应模糊支持向量机的情绪识别方法。



背景技术:

情绪是人类的一项重要本能,它同人类语音和身体形态一样,在人们日常生活、工作、交流以及处理事务中扮演着重要的角色。利用计算机技术进行情绪识别是实现高级人机交互的关键技术,对于实现人机交互、人—计算机接口以及智能计算机等有重要意义。情绪识别主要通过面部表情、语音、人体姿态以及生理信号等实现。基于面部表情和语音等外在信号的研究由来已久,但其结果往往具备主观性。人体的生理变化主要受自主神经系统和内分泌系统支配,而很少受人的主观控制,因此应用生理信号进行情绪识别所得到的结果会更加客观、公正。目前国内外采用的生理信号主要有脑电(eeg)、心电(ecg)、肌电(emg)、血容量脉搏(bvp)、皮肤电反应(gsp)和眼动(eog)等,本专利仅研究基于脑电信号的情绪识别。

脑电是通过在大脑皮层表层的电极记录下来的脑细胞群的自发性、节律性电活动。其中,将时间作为横轴,脑细胞的活动电位作为纵轴,这样把时间与电位的相互关系记录下来就是脑电图,简称eeg。通过采用适当的方法提取与情绪相关的特征,在经过数据将为处理之后,便需要根据已知的脑电信号特征对情绪进行学习和分类。主要的学习方法可以分为无监督学习方法和有监督的学习方法。

情绪的无监督学习:无监督学习是指在对样本进行模式训练时,不需要对其制定类别信息,而是由样本自身向彼此特征相近的样本靠近,与特征相异的样本远离,从而达到同类样本聚集,异类样本彼此分离的效果,实现模式的分类。常见的无监督学习方法有模糊聚类、k-均值聚类、自组织映射等。

情绪的有监督学习:有监督学习在对样本进行训练时会加入样本的类别信息。在类别信息的指导下不断修正模型的参数从而得到最佳的训练结果,再将训练好的模型用于测试样本的分类识别中。常见的监督学习方法有支持向量机,神经网络、决策树、贝叶斯网络等。

aftanas等利用傅里叶变换将脑电信号映射到各频率上,将各点的功率谱作为特征,取得了较好的分类效果;khosrowabadi等采用图片对4个基本情绪进行试验,采用自组织的映射方法对样本情绪分类,取得了较好的分类结果。支持向量机作为目前应用最为广泛的分类方法以其优异的性能已被应用到情绪识别中。神经网络也是一种常用的分类方法,它是通过模拟人类真实神经网络而抽象出来的数学模型,在分类工作中也取得了不错的成绩。aspiras和asari相关的研究中就利用多层感知器模型对8种不同的情感进行分类,并取得了较好的结果。tal-ahashi也做了相关研究,建立了一个基于3个干电极的实验环境,多个生理信号(包括egg,脉搏信号一级皮肤阻抗)来分类5种情绪(情绪包含了兴奋、生气、难过、恐惧以及放松)。

然而,在利用机器提取的生理信号中存在诸多模糊不确定的情况,如信号在获取时受到周边环境的干扰形成噪声污染、各类情绪生理信号的相互重叠等。所以,情绪分类识别面临的是信息的不确定性和界限不明确的问题。针对不同生理信号容易受到噪声干扰并且不同情绪之间的生理信号往往相互交叠的特点,提出一种基于自适应模糊支持向量机的情绪识别方法。



技术实现要素:

本发明所要解决的技术问题是针对现有技术方法的不足,本发明提出一种基于自适应模糊支持向量机的情绪识别方法,以解决背景技术中的问题。

本发明为解决上述技术问题采用以下技术方案

一种基于自适应模糊支持向量机的情绪识别方法,具体包括以下步骤:

步骤1,提取患者的情绪生理信号,进而选取情绪的训练样本集s,且si={s1,s2,s3},其中,si是第i类情绪样本集,其中i=1,2,3;

步骤2,采用自适应模糊支持向量机对训练集样本进行分类和识别;

步骤3,对未识别情绪样本集进行情绪的分类识别。

作为本发明一种基于自适应模糊支持向量机的情绪识别方法的进一步优选方案,在步骤1中,提取患者的情绪生理信号具体包括如下步骤:

步骤1.1,对采集患者的生理信号进行信号预处理;

步骤1.2,对预处理后的生理信号进行特征提取并分类。

作为本发明一种基于自适应模糊支持向量机的情绪识别方法的进一步优选方案,所述步骤2具体包含以下步骤:

步骤2.1,根据训练集中的数据,通过利用支持向量数据描述方法,找到包围有效样本的最小超球半径r来度量样本间的紧密度;

步骤2.2,结合自适应模糊隶属度函数和支持向量机对训练集样本进行训练,并得到自适应模糊支持向量机分类器。

作为本发明一种基于自适应模糊支持向量机的情绪识别方法的进一步优选方案,

在步骤1.2中,对预处理后的生理信号进行提取五种生理信号在时域频域的特征值。

作为本发明一种基于自适应模糊支持向量机的情绪识别方法的进一步优选方案,五种生理信号在时域频域的特征值具体包含心电信号时域特征值、心电信号频域特征值、肌电信号时域特征值、肌电信号频域特征值、皮电活动时域特征值、呼吸信号时域特征值、脉搏信号时域特征值、脉搏信号频域特征值。

作为本发明一种基于自适应模糊支持向量机的情绪识别方法的进一步优选方案,所述心电信号时域特征值包括心率平均值、心率标准差、全部窦性心搏rr间期、全部窦性心搏rr间期的标准差、相邻rr间期差值的均方根、全程相邻rr间期长度之差的标准差、rr间期最大值与最小值的差值、最大rr间期与最小rr间期的比值、全部rr间期中相邻的rr间期之差大于50ms的心搏数与其所占比例、多尺度熵。

作为本发明一种基于自适应模糊支持向量机的情绪识别方法的进一步优选方案,其中,心电信号频域特征值包括超低频段功率、低频段功率、高频段功率、三个频段功

率之和;

肌电信号时域特征值包括积分肌电值、过零点数、瞬间肌电振幅均方根值、肌电信号均值、平均绝对值,以及一阶差分均值、标准差、中值;

肌电信号频域特征值,包括功率频率平均值和功率频率中值;

皮电活动时域特征值,包括均值、标准差、最大值、最小值、最大值与最小值之差、全部信号中皮肤电导响应峰值的次数、全部信号中皮肤电导响应峰值的均值,以及一阶差分和二阶差分的均值、标准差、最大值、最小值、最大值与最小值之差;

呼吸信号时域特征值,包括平均呼吸速率、呼吸变异性、均值、标准差、最大值、最小值、最大值与最小值之差,以及一阶差分和二阶差分的均值、标准差、最大值、最小值、最大值与最小值之差;

脉搏信号时域特征值,包括脉搏主波间期的均值、脉搏主波间期的标准差、相邻脉搏主波间期差值的均方根、脉搏主波间期的最大值与最小值之差、脉搏主播间期的最大值与最小值之比、脉搏主波间期中相邻的主波间期之差大于50ms的脉搏数与其所占比例、脉搏主波上升阶段时间均值、脉搏主波上升阶段时间标准差、脉搏主波下降阶段时间均值、脉搏主波下降阶段时间标准差;

脉搏信号频域特征值,包括超低频段功率、低频段功率、高频段功率、三个频段功率之和、低频段和高频段的功率比值。

本发明采用以上技术方案与现有技术相比,具有以下技术效果:

(1)本发明有效的剔除了信号在获取时收到周边化境的干扰形成噪声污染和各类情绪生理信号获取时相互重叠的影响等,增加了信号的质量,使信号的特性更加明显,最终促使识别率的提高;

(2)本发明改进了隶属度函数的表现形式,而且通过定义控制临界隶属度和隶属度衰减趋势的参数,使隶属度能根据不同情绪生理信号的具体分布特性自适应调整使隶属度变化与实际情况更加吻合。

附图说明

图1是一种基于自适应模糊支持向量机的情绪识别方法的基本流程图;

图2(a)是类别1样本的紧密度情况;

图2(b)是类别2样本的紧密度情况;

图3是不同最小超球半径r对应的隶属度函数曲线;

图4是不同最小超球半径r对应的隶属度函数曲线;

图5是基于传统支持向量机情绪识别结果图;

图6是基于模糊支持向量机的情绪识别结果图;

图7是基于自适应模糊支持向量机的情绪识别结果图。

具体实施方式

下面结合附图对本发明的技术方案做进一步的详细说明:

以下将结合附图,对本发明的技术方案进行详细说明。

如图1所示,自适应模糊支持向量机(adaptivefuzzysupportvectormachine,afsvm)是通过引入自适应模糊隶属度μi表示样本属于该类别的不同可能性。对于样本集:(l为样本数目)和核函数k(xi,xj),其中:类别标签yi∈{-1,+1},隶属度μi∈(0,1],afsvm优化问题和约束条件如下:

s.t.yi[(w·x)+b]≥1-ξi,ξi≥0(i=1,2,...,l)

其中,w为权重向量,b为偏置,ξi为松弛变量,c为惩罚因子。将上式转化为其对偶问题:

求得拉的朗日乘子αi和偏置b,得到最优分类超平面决策函数为:

如图2(a)和图2(b)所示,样本x到各自所属类别中的距离相等,若以此进行判断,则这两类中x的隶属度相同。但事实情况并非如此,由分布情况可知:2(b)中样本更可能为非有效值,因此其隶属度应较小。

对于上述问题,通过利用支持向量数据描述(supportdatadescription,svdd)方法,找到包围有效样本的最小超球半径r来度量样本间的紧密度。

s.t.||xi-o||≤r2+ζi,ζi≥0(i=1,2,...,l)

其中,r为最小超球半径;o为球心;d>0为惩罚因子,用来控制球的体积与球外面样本个数间的折衷;ζi为松弛变量。然后利用上式计算各样本的隶属度。

其中,d(xi)为样本xi到所在类中心o的欧氏距离:d(xi)=||xi-o||2。当d(xi)≤r时,说明xi属于该类的可能性大,赋予较大的隶属度;反之,当d(xi)>r时,说明xi属于非有效样本的可能性大,赋予较小的隶属度,这样能较好地对有效样本和非有效样本加以区分。下图3则给出了对于不同r,隶属度函数变化曲线。

如图3所示,超球内、外样本隶属度阈值为μi=0.4。随着r的增加,超球外样本的隶属度(μi<0.4部分)衰减速度不断加快,超球内样本的隶属度(μi>0.4部分)衰减则逐渐减缓。但是当r<3时,超球内隶属度较超球外隶属度变化趋势较快,这与实际情况不符。实际情况中,为了区分有效样本和非有效样本,应尽量保持有效样本的隶属度,而减小非有效样本的隶属度,这就要求超球外样本具有更高的衰减速率。

由以上分析,本专利设计一种自适应隶属度函数来分配情绪对类别的隶属程度,进而通过支持向量机实现情绪分类识别工作。

其中,参数ρi(0<ρi<1),ρo(ρo>1)是分别用来控制超球内、外样本的隶属度衰减率,是用于控制临界隶属度,r为最小超球半径。

如图4所示,分别取ρi=0.5,ρo=10,时,改进后的隶属度函数不仅具有基于紧密度函数的优点(通过确定最小超球获得有效样本和非有效样本的分界),而且兼具s型隶属度函数的长处(有效样本隶属度衰减速度较慢,非有效样本隶属度衰减速度较快),使隶属度变化与实际情况更加吻合。

根据分析,定义超球内、外样本距中心的平均距离分别为di(di≤r)和do(do>r),以此表示超球内、外样本的整体分布情况。di越大,表示球内样本的整体分布越接近球面;do越小,表示球外样本的整体分布越接近球面。

其中,ni、no分别表示超球内、外样本的数目。根据超球内、外样本整体分布情况与隶属度变化趋势之间的关系,定义:

临界隶属度表示超球内样本的最小隶属度,超球外的最大隶属度。由分析可知,当超球外样本的整体分布越靠近球面时,超球外样本属于该类的可能性越大,则超球外样本的最大隶属度应越大,及临界隶属度越大,反之越小。而且,若r越大,说明球内、外样本的差别越小,超球外的样本越靠近球面,则越大。

综上说述,与do成反比,与r成正比。依次,定义临界隶属度:

由以上分析,最终确定自适应隶属度函数为:

如图5、图6、图7所示,通过实验来验证本发明所提出的情绪识别方法的有效性,实验中采用的生理情绪信号数据均在安静的实验室中采集得到。数据来源:患者在玩设计好的虚拟现游戏过程中采集的生理信号,包含挫败、兴奋和厌烦等三种情绪。

本实验是在3.1ghz,4g内存,64位win7的计算机系统下进行。实验识别测试结果如图2、图3和图4所示。传统支持向量机用于3种情绪识别获得了的76.57%平均识别率;模糊支持向量机的平均情绪识别率为78.8%,而自适应模糊支持向量机的平均识别率达到了83.5%。实验结果表明,基于自适应模糊支持向量机的情绪识别能力明显优于传统支持向量机和模糊支持向量机方法。且对提高情绪识别系统的性能和鲁棒性有很大的帮助。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1