一种用于皮肤电反应信号特征选择的禁忌搜索方法

文档序号:6368013阅读:247来源:国知局
专利名称:一种用于皮肤电反应信号特征选择的禁忌搜索方法
技术领域
本发明涉及一种生理信号情感识别方法,尤其涉及皮肤电反应信号的特征选择。
背景技术
情感识别是情 感计算领域中的一个重要组成部分,如果要让计算机具有情感,首先要让它能识别情感,情感识别显得尤为重要。情感识别(Emotion Recognition)是通过观察人的表情、行为和情感产生的前提环境来推断情感状态。只有将情感识别看作一种模式识别问题,情感表达看作模式合成问题,计算机进行情感交流才具有可行性。情感识别研究的对象主要有人脸表情、语音语调、人体姿势、文本(心理学上常用的问卷调查法)和生理信号五种。前四种研究对象比较直观,都是以身体和行为的方式表现出来自愿或不自愿信号的复杂模式,无法观测到潜在的情感状态。而生理变化不受人的主观控制,它是由身体客观表现出来的,因而采用生理信号所得的数据更能客观地反应被试的真实情感,它更有鲁棒性和客观性,但是基于生理信号情感识别的研究是最困难的。在本发明之前,美国MIT实验室的Picard教授在1998年为其实验室做技术报告“Affective Pattern Classification. Perceptual Computing Section TechnicalReport (Elias Vyzas and Rosalind W. Picard, 1998,473),,中第一次证明了米用生理信号的特征为情感识别载体的方法是行之有效的,并通过提取皮肤电反应信号(GSR)、呼吸信号(RSP)、肌电信号(EMG)和血容量搏动(BVP)四种生理信号的40个信号特征来识别演员的8种不同情感状态,采用SFFS(序列前向选择算法)和Fisher这两种特征选择方法,并选择了多种分类器,得到的识别率为81. 25% ;在“Emotion Recognition UsingPhysiological and Speech Signal in Short-Term Observation(Jonghwa Kim andElisabeth An dr. 2006, LNAI 4021, pp. 53-64) ” 中,Jonghwa 米取生理信号与语音信号结合的方法识别4种极端情绪的识别率为55%,在该文中,作者提取了生理信号和语音信号共138个特征,并用SBS (序列后向选择算法)进行特征选择,所用的分类器为LDA (线性判别分类器);在 “Emotion Recognition Using Physiological Signals (Lan Li and Ji-huaChen, ICAT 2006. LNCS 4282,2006 :437 446) ”中,Lan Li 等人提取了 GSR、SKT、RSP 和ECG四种生理信号的22个特征来识别高兴、恐惧和平静(无任何情绪)这三种状态时,识别率高达86.7%。在特征选择中,研究者都是采用传统的特征选择方法,有的甚至没有特征选择,直接将提取的特征用于情感分类;分类器的选择也不同,都是根据经验选择认为分类效果好的分类器。由于每个研究者采用的生理信号和情感类型的差别,导致识别结果不同。在研究者采用的生理信号中,均有GSR信号,他们提取的GSR特征,通常是时域上的一阶差分、均值等几个统计特征,但是最后没有总结出具体哪些特征对识别情感有很大的贡献。

发明内容
本本发明的目的是提供一种有效的识别率高的用于皮肤电反应信号特征选择的禁忌搜索方法。
为了实现上述目的,采用以下技术方案一种用于皮肤电反应信号特征选择的禁忌搜索方法,其特征在于所述方法包括如下步骤采用序列后向算法,形成一个N-I行,N列的二维表L,其中N为选择的特征总维数,每一列代表一个特征,每一行称为一个空间,其中第η个空间选择有η个特征,I彡η彡N-I ;表内每个元素的值用“O”或“I”表示,“O”代表在进行特征选择时该元素没有被选中,“I”代表该元素被选中;对每一空间内的选中的特征采用禁忌搜索算法进行求解,得到每个空间的解组成的表S ;选择各个空间中适应度函数最大的作为最终特征选择结果。其中每个空间中禁忌搜索算法的步骤为SI :初始设禁忌表T = Φ,设置禁忌长度,设置最大迭代步数;将此空间内通过序列后向算法得到的值作为初始解,并把它作为该空间的暂定全局最优解Bestsofar和迭代
搜索的起点,即当前局部最优解cand,计算初始解的适应度函数/ = ^iratA2+ratB ;
其中ratA和ratB分别代表目标情感的正确识别率和非目标情感的正确识别率。S2:判断是否满足最大迭代步数的停止准则,如满足则终止该空间的计算,将把Bestsofar放入表S中,结束此空间计算;如不满足,则将当前局部最优解cand为下次的迭代起点;S3 :生成N个与该空间具有相同特征选择个数的候选解集;S4 :寻优计算出每个候选解的适应度函数f的值,从候选解集中选出适应度函数值最大的解,将该解与禁忌表中的解比较;如果该解不在禁忌表中,将其中较大的值作为当前局部最优解和Bestsofar的值;则转S5 ;如果该解在禁忌表中,且不满足特赦准则,将适应度函数值第二大的解作为局部最优解;如果该解在禁忌表中,且满足特赦准则,将禁忌表中的该解提前释放,并作为局部最优解,并将该解的适应度函数值与Bestsofar的适应度函数值比较,如大于,则用该解作为Bestsofar ;其中特赦准则指的是,禁忌表中的某个值在迭代过程中作为局部最优解出现规定次数;S5 :更新禁忌表将当如局部最优解与入禁忌表,转S2。所述S3步骤中生成候选解集的方法为分别将cand的第i位cand(i)值变为l-cand(i),从第i位的下一位开始查找,遇到值等于l_cand(i)的p位,将其值变为l-cand(p)后结束;若P = N,则P从I开始继续查,遇到值等于l_cand(i)的p位,将其值变为l-cand(p)后结束;其中I≤i≤N,I≤P≤N,N为特征总维数。本发明采用智能优化算法中改进的禁忌搜索算法结合Fisher分类器完成选择过程,不仅得出了对情感识别贡献较大的皮肤电信号的有效特征,而且克服了基本禁忌搜索算法容易陷入局部最优的缺点。实验仿真结果表明,将改进的智能优化算法用于生理信号的情感识别领域是完全可行的。说明书附图

图I为Fisher分类器中中间数据分布图;图2为Fisher分类器中最终测试数据分布图。
具体实施例方式下面结合附图和实施例对本发明做进一步的阐述。
一种基于皮肤电反应信号的情感识别特征选择方法,包括下列步骤I.情感激发素材库的建立有效激发被试的情感,得到有效的情感生理信号是做后续研究的前提条件,所以选取的情感激发素材极为重要。(I)中性素材采用轻音乐和风景图片相结合的方式制作七个中性素材,每个中性素材长2分钟,目的是让被试的情绪在激发情感前处于平静状态,此时记录的被试的生理信号,作为该被试其他情感激发信号的基准。(2)情感素材针对中国青年人的爱好和兴趣,精心挑选能分别诱发被试的高兴、惊奇、厌恶、悲伤、愤怒和恐惧六种情感的高收视率的中文电影或电视剧,剪辑出100多个片段作为情感激发视频备选,然后通过多人、多次反复验证其唤起情感的可靠性,最终从中确定出相应的六个情感激发素材,并且在各个情感激发素材开始之前加入适当文字作为素材的背景说明。每个情感素材长约5分钟,其中,高兴的情感激发素材来自于《武林外史》的片段剪辑,惊奇来自于《魔术》,厌恶来自于《胭脂雪》,悲伤来自于《暖春》,愤怒来自于《东京审判》,恐惧来自于《午夜凶铃》。(3)素材整合将7个中性素材放置于六个情感素材开始之前和结束,作为过渡调节,按照高兴、惊奇、厌恶、悲伤、愤怒、恐惧的顺序整合成一套实验素材。素材结构顺序为实验指导语(2分钟一中性素材丨(2分钟)一素材I背景介绍(30秒)一情感激发素材I (5分钟左右)一
填写问卷I指导语(30秒)一中性素材2 (2分钟)一素材2背景介绍(30秒)一......一填
写问卷6指导语(30秒),整套素材大约50分钟。2. GSR信号的情感数据采集实验采用美国Biopac公司生产的多导生理记录仪MP150采集被试在各个情感(包括中性)激发状态下的原始GSR信号。由于GSR的有用信号频率范围主要集中在O. 2Hz以下,根据奈奎斯特采样定理,将采集过程中的采样频率设为20Hz。连接仪器采用TSD203指头电极,在其凹槽内注入导电膏,以非侵入的方式接触到被试的身上。实验中还将给被试提供一张情绪主观报告表,报告表中有七种情绪(平静、高兴、惊奇、厌恶、悲伤、愤怒、恐惧)和情绪的强度(I-很弱,I-较弱,3- —般,4-较强,5-很强),在每个情感激发素材播放结束后,素材自动提示让被试填写自己此时真实的情绪及其强弱程度。根据被试填写的情感问卷筛选有效唤起的数据,每个情感截取80秒长度的GSR信号作为后阶段的原始数据,共计342个数据样本。3.原始数据的预处理对于得到的原始数据可能存在两个问题一是可能夹杂了其他生理信号的噪声干扰或MP150机器本身固有的噪声干扰;二是由于存在个体差异性,不同被试的情感标准不同,针对同一个素材的GSR反应信号不一致。针对以上两个问题,对原始数据进行平滑、滤波去噪、去除基线等操作,然后各个样本的情感信号相对于其中性情感信号做标准化处理。首先,采集到的皮肤电反应信号是微弱的生物电信号,采集过程中的干扰主要有基线漂移、其他生理信号干扰、电极接触噪声、电磁干扰及运动伪差等。由于皮肤电反应信号的有用频率段主要在O. 2Hz以下,其干扰信号和皮肤电反应信号的频带是不重叠的,因此可以采用巴特沃斯滤波器滤除带外噪声、去除高频干扰,对于信号完全被噪声淹没的情况,则截取丢弃这些没有价值的数据。其次,由于招募的被试者不同,其GSR信号存在着个体差异性,这种差异性体现在不同的人在同一个时间面对相同的环境,以及同一个人在不同时间面对不同环境下。为了建立通用的基于GSR信号的情感识别系统,必须去除这种个体差异性后,得到的模型才可能被推广,所以需要对数据做标准化处理,规则如下
_2] D0 = Demotion-Dcalm(I)其中,D_tim为降噪后的原始情感数据,DMlm为同一个被试在中性剪辑下记录的GSR反应数据,得到的Dtl即为经过标准化之后的数据。具体操作时,因为原数据长度为80s,采样频率为20Hz,所以按照数据点数为1600点的形式存储数据,则只需要把情感数据和该被试的平静数据的每个点对应相减即可得到标准数据。4. GSR信号的情感特征提取及处理不同的情感状态下,皮肤电水平值有所差别,并且变化幅度也有不同,特别是恐惧的情感最为明显,其次是高兴。从视觉上很容易辨别出皮肤电反应信号随情感的变化,因此不需要进行更加复杂的分析。针对GSR信号自身特点,直接从时域和频域信号,以及对时域信号进行一阶差分、二阶差分计算后的信号上提取计算某些统计值形成原始特征集合,包括均值、中值、标准差、最小值、最大值、最大最小值之差、最小值比率和最大值比率,共计30个特征。其中,一阶差分可以体现信号的变化趋势和变化快慢,如果对一阶差分取了绝对值,就忽略了变化的趋势,而只考虑变化快慢。一阶差分可以用来检测信号局部的极值点,二阶差分可以用来检测信号局部的拐点。从GSR信号提取的30特征中,时域特征24个,频域特征6个。所提取的特征均由 “Name-英文缩写”构成,如sclDiff-median> sc2Diff-std> sc-mean、sc-minRatio、scfft-mean、sc2gDiff_mean、sc2aDiff-mean 等。提取出的详细特征如表 I 所示表IGSR信号的统计特征描述
特征名表示意义计算公式(N表示数据长度)
I N
sc-mean均值u - = τ^Σ χ η
N η = I
sc-median中值特征数据的中值
权利要求
1.一种用于皮肤电反应信号特征选择的禁忌搜索方法,其特征在于所述方法包括如下步骤 采用序列后向算法,形成一个N-I行,N列的二维表L,其中N为选择的特征总维数,每一列代表一个特征,每一行称为一个空间,其中第η个空间选择有η个特征,I ^ n ^ N-I ;表内每个元素的值用“O”或“I”表示,“O”代表在进行特征选择时该元素没有被选中,“I”代表该元素被选中; 对每一空间内的选中的特征采用禁忌搜索算法进行求解,得到每个空间的解组成的表S; 选择各个空间中适应度函数最大的作为最终特征选择结果。
2.如权利要求I所述的用于皮肤电反应信号特征选择的禁忌搜索方法,其特征在于 其中每个空间中禁忌搜索算法的步骤为 51:初始设禁忌表T = Φ,设置禁忌长度,设置最大迭代步数;将此空间内通过序列后向算法得到的值作为初始解,并把它作为该空间的暂定全局最优解Bestsofar和迭代搜索的起点,即当前局部最优解cand,计算初始解的适应度函数/ = ^iratA2+rat B) ^ ;其中ratA和ratB分别代表目标情感的正确识别率和非目标情感的正确识别率; 52:判断是否满足最大迭代步数的停止准则,如满足则终止该空间的计算,将把Bestsofar放入表S中,结束此空间计算; 如不满足,则将当前局部最优解cand为下次的迭代起点; 53:生成N个与该空间具有相同特征选择个数的候选解集; 54:寻优计算出每个候选解的适应度函数f的值,从候选解集中选出适应度函数值最大的解, 将该解与禁忌表中的解比较;如果该解不在禁忌表中,将其中较大的值作为当前局部最优解和Bestsofar的值;则转S5 ; 如果该解在禁忌表中,且不满足特赦准则,将适应度函数值第二大的解作为局部最优解; 如果该解在禁忌表中,且满足特赦准则,将禁忌表中的该解提前释放,并作为局部最优解,并将该解的适应度函数值与Bestsofar的适应度函数值比较,如大于,则用该解作为Bestsofar ;其中特赦准则指的是,禁忌表中的某个值在迭代过程中作为局部最优解出现规定次数; 55:更新禁忌表将当如局部最优解与入禁忌表,转S2。
3.如权利要求2所述的用于皮肤电反应信号特征选择的禁忌搜索方法,其特征在于 所述S3步骤中生成候选解集的方法为分别将cand的第i位cand(i)值变为l-cand(i),从第i位的下一位开始查找,遇到值等于l_cand(i)的p位,将其值变为l-cand(p)后结束;若P = N,则P从I开始继续查,遇到值等于l_cand(i)的p位,将其值变为l-cand(p)后结束; 其中I彡i彡N,I彡P彡N,N为特征总维数。
全文摘要
本发明公开了一种用于皮肤电反应信号特征选择的禁忌搜索方法,包括如下步骤采用序列后向算法,形成一个N-1行,N列的二维表L,其中N为选择的特征总维数,每一列代表一个特征,每一行称为一个空间,其中第n个空间选择有n个特征,1≤n≤N-1;表内每个元素的值用“0”或“1”表示,“0”代表在进行特征选择时该元素没有被选中,“1”代表该元素被选中;对每一空间内的选中的特征采用禁忌搜索算法进行求解,得到每个空间的解组成的表S;选择各个空间中适应度函数最大的作为最终特征选择结果。本发明不仅得出了对情感识别贡献较大的皮肤电信号的有效特征,而且克服了基本禁忌搜索算法容易陷入局部最优的缺点。
文档编号G06K9/62GK102622527SQ20121010928
公开日2012年8月1日 申请日期2012年4月13日 优先权日2012年4月13日
发明者刘光远, 邱红, 陈红 申请人:西南大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1