一种基于遗传算法降维的脑电身份识别方法与流程

文档序号:11323591阅读:425来源:国知局
一种基于遗传算法降维的脑电身份识别方法与流程
本发明属于身份识别领域,具体涉及一种基于遗传算法降维的脑电身份识别方法。
背景技术
:现有的利用脑电信号作身份识别的方法仍然较少,基本是在频域内对脑电数据进行分析,提取某一波段的脑电信号,利用时间序列模型(ar、bl)拟合脑电数据,将拟合后的模型参数提取作为脑电信号的特征参数,之后经过pca降维处理或挑选数个电极,直接简单地使用支持向量机或神经网络等单一结构的学习机来进行脑电身份识别。现有技术存在以下的缺点:1、对于ar或bl模型阶数的估计,当前普遍使用aic准则或经验估计。虽然aic准则在模型定阶方面有诸多优点,但模型研究结果表明如果对数据进行自回归模型拟合,它可能会使阶数p估计过高,同时,aic准则得到的阶数不是相容的。2、传统方法中,由于pca降维和降维后的特征识别是两步分开进行的,pca没有很好地和特征识别紧密联系在一起,导致脑电数据在pca降维过程中可能舍去了真正有益于身份识别的特征,可能使得脑电数据的身份识别效果降低。3、脑电信号中噪声大小不一,虽然对脑电数据滤波后进行特征参数提取能较好地识别个体的脑电数据,但是正确识别率大多为85%~90%。如专利号cn201010193832.1中提出的脑电身份识别方法,其最高识别率为86.7%。4、当前多数方法在经过降维处理后数据的运算量仍然很大。挑选数个与刺激事件较为相关的电极的信号进行处理虽然能有效降低运算量同时保持有较好的识别效果,但是这样人工挑选出来的电极信号不一定能使分类器的训练效果达到最好,从而其识别率不一定达到最优。5、现有方法在测试识别率时为闭集验证,现有方法在测试在闭集验证时准确率较高,但是对于开集验证,要么错误率过大,要么就是完全不适用。6、当对识别率要求较高时,现有技术对于脑电信号的采集要求很高,如2015年论文《基于fawell范式诱发erp的身份识别研究》,其最高识别率可达98%,但是采集脑电时受试者需专心注视屏幕上多个字符,并且在心中默数目标字符闪烁的次数。为了克服上述现有技术的不足,本发明的目的是:提供一种具有选择目的、有效降维的脑电身份识别方法。该方法在有效降低数据维度的同时又能保留对脑电识别有利的信息,使得其保持有更高的识别率。该方法对于未曾识别过的个体的脑电数据同样适用,即其在开集验证中仍然保有很高的识别率。并且其脑电信号采集对于受试者的动作行为要求较低,受试者只需要静坐于屏幕前观察显示屏即可。同时利用了bic准则估计ar模型的阶数,使得阶数p的估计较低,有效地降低了运算量。技术实现要素:该发明方法具体内容步骤如下:1脑电数据的采集1.1采集的脑电数据是受试者在感知颜色时的脑电信号。受试者静坐在电脑屏幕前,观察电脑所显示的布满整个屏幕的颜色图片,一次至少采集一个图案显示周期的时间长度的数据。采集环境控制光照亮度为适中。其中颜色图片采用以下方案进行提供:红色t1——过渡图片组合t2——绿色t1——过渡图片组合t2——蓝色t1——过渡图片组合t2;过渡图片组合是三原色相等的插图t2/3、黑色t2/3、白色t2/3,其目的是消除观察rgb颜色切换时视野中的颜色残留。2脑电数据的预处理2.1利用fir滤波器将采集的脑电原始信号截取出α波段(8~12hz)。2.2对于采集到的脑电信号,通过eeglab观察其波形,将其中信号波形过于紊乱的电极剔除,设剩余电极数目为k。3利用ar模型提取脑电特征参数3.1对每个试验者的每个电极通道的脑电数据,使用最小二乘估计法得到匹配的ar模型。3.2以匹配的ar模型的参数作为该段脑电信号数据的特征参数来表征这段脑电信号。说明:ar模型的表示如式(1):其中是εt零均值,方差σ2的平稳白噪声过程。ar模型的阶数p由bic准则确定。bic准则函数定义如式(2):bic(p)=nlnσ2+plnn(2)n是样本数据的长度,p是最优阶数。与aic准则相比,bic准则确保了估计的阶具有相容性。设剩余的每个电极数据的最优阶数为pi(1≤i≤k),取估计的阶p=min(pi)。εt和各阶系数ai就是所要提取的脑电特征参数,提取后得到的脑电特征参数ei是一个向量数据,其中1≤i≤k×(p+1)。4建立bp神经网络的分类器对提取的脑电特征参数ei建立bp神经网络(如下图1所示),输入层的节点数等于向量ei中元素的个数,为k×(p+1)个,输出层节点1个,输出为“1”时代表识别为“本人”,输出为“0”时代表识别为“他人”。对于bp分类器的身份识别,每份数据的识别都是输出一个[0,1]的结果。定义当输出结果不接近于1或不接近于0时,若输出结果大于0.5,认为识别为“1”,若小于等于0.5,认为识别为“0”。5利用遗传算法(ga)对脑电参数进行降维5.1利用遗传算法(ga)对脑电参数降维:对已经建立的bp网络,使用遗传算法优化其输入节点,即筛选参与训练的脑电特征参数,使得bp神经网络的分类误差最小,以提高身份识别正确率。其流程图如下图2所示。5.2ga中产生的初始种群中个体采用二进制编码,长度为k×(p+1)位。对于种群个体的编码,其编码为1的位置对应输入节点在训练bp神经网络时被保留,编码为0的位置对应输入节点被舍去,不参与bp网络的训练。5.3个体的适应度函数为以该个体编码对应的输入节点所训练的bp神经网络预测结果的均方误差的倒数,即f=1/mse,f是个体适应度,mse是该个体的编码对应输入节点所训练的bp网络的均方误差。5.4由ga得到的最优个体,其编码为0的位置对应输入节点舍去,编码为1的位置对应输入节点保留。用保留下来的输入节点建立bp神经网络,以此优化后的bp神经网络进行脑电身份识别。6身份识别情况6.1训练数据与测试数据的情况对于bp网络的训练数据集的组成,50%是“本人”的脑电数据,50%是“他人”的脑电数据;测试的时候,测试数据是“本人”脑电数据和“他人”脑电数据中没有参与训练的那部分数据和开集数据组成。6.2分类识别验证:将“本人”脑电数据输入到优化后的bp神经网络进行识别,若识别输出值大于0.5,则识别成功,确定是本人;若输出值小于等于0.5,则识别失败。将“他人”脑电数据和开集数据输入到优化后的bp神经网络进行识别,若识别输出值小于等于0.5,则识别成功,确定不是本人;若输出值大于0.5,则识别失败。以上步骤的流程图如图3所示。与现有技术相比,本发明的有益效果是:1、相比于pca降维和降维后的特征识别是两步分开进行的,pca没有很好地和特征识别紧密联系在一起,导致脑电数据在pca降维过程中可能舍去了真正有益于身份识别的特征,利用遗传算法(ga)的降维是优化筛选bp分类器的输入层节点,能在有效降低数据维度的同时又保留对脑电识别有利的信息,因而识别率更高;2、此方法对未曾训练学习过的个体的脑电数据(即开集)仍然适用。实验结果显示,对于样本数据没有参与训练集的受试者,利用ga降维后的bp分类器对这些受试者的数据的识别正确率显著提高。这也表明了此种脑电身份识别方法更具适用性。3、bic准则的定阶能给出相容估计,估计的阶数p不会过高可以有效降低运算量。4、脑电信号的采集对于受试者的动作行为要求较低,受试者只需要静坐于屏幕前观察显示屏即可。附图说明图1是本发明中的bp神经网络分类器原理图。图2是本发明利用遗传算法ga对参与bp网络训练的脑电参数进行降维的示意图。图3是本发明的种基于遗传算法降维的脑电身份识别方法流程图。图4是屏幕颜色图片显示方案。图5是过渡图片组合的显示方案示意图。图6是对ei建立的bp神经网络分类器原理图。图7是利用遗传算法ga对参与bp网络训练的脑电参数进行降维的示意图。具体实施方式需要结合所提供的说明书附图对本发明做进一步的说明。1脑电数据的采集a.实验仪器为brainproduct,brainampmrplus型放大器,采用64导电极帽连续记录脑电。b.采集的脑电数据是试验者在感知颜色时的脑电信号:试验者静坐在电脑屏幕前,观察电脑所显示的布满整个屏幕的颜色图片,一次至少采集一个图案显示周期的时间长度的数据,采集环境控制光照亮度为适中。c.屏幕上颜色图片的显示方案是:(1)红色6s——过渡图片组合3s——绿色6s——过渡图片组合3s——蓝色6s——过渡图片组合3s。一个周期长度为27s;(2)其中实验时一个周期中红色、绿色和蓝色图片出现的顺序是随机的;(3)过渡图片组合是三原色相等的插图1s、黑色1s、白色1s,这样做的目的是消除观察rgb颜色切换时视野中的颜色残留。屏幕颜色的显示如图5所示(红绿蓝的顺序是随机的):过渡图片组合的显示如图6(图片显示顺序是固定的):2脑电信号预处理2.1利用fir滤波器将采集的脑电原始信号截取出α波段(8~12hz)。2.2对于采集到的脑电信号,通过eeglab对波形进行分析,将其中信号波形过于紊乱的电极剔除,总计剔除eeg电极o1、o2、fz、veou、heol、heor和m2这7个通道的数据。3利用ar模型提取脑电特征参数3.1自回归(ar)模型是常用的时间序列模型,对每个试验者的每个电极通道的脑电数据,使用最小二乘估计法得到匹配的ar模型。3.2以匹配的ar模型的参数作为该段脑电信号数据的特征参数来表征这段脑电信号。ar模型的表示如下:其中是εt零均值,方差σ2的平稳白噪声过程。ar模型的阶数由bic准则确定。bic准则函数定义为:bic(p)=nlnσ2+plnnn是样本数据的长度,p是最优阶数。与aic准则相比,bic准则确保了估计的阶具有相容性。设剩余的每个电极数据的最优阶数为pi(1≤i≤57),取估计的阶p=min(pi)。εt和各阶系数ai就是所要提取的脑电特征参数,提取后得到的脑电特征参数ei是一个向量数据,其中1≤i≤57×(p+1)。,如下所示:(e1e2…e57×(p+1))实验验证中,对于采集到的样本,由bic准则得到的阶数p=4,所以每个份数据提取的脑电特征参数有5个。至此,对于某个采集者的一份样本数据,经过提取后的脑电特征参数ei构成一个长度为285的向量:(e1e2…e285)4建立bp神经网络的分类器对提取的脑电特征参数ei建立bp神经网络(如下图6所示),输入层的节点数等于向量ei中元素的个数,为285个,输出层节点1个,输出为“1”时代表识别为“本人”,输出为“0”时代表识别为“他人”。5利用遗传算法(ga)对脑电参数进行降维5.1利用遗传算法(ga)对脑电参数降维:对上面已经建立的bp网络,使用遗传算法优化其输入节点,即筛选参与训练的脑电特征参数,使得bp神经网络的分类误差最小,以提高身份识别正确率。其流程图如下图7所示。5.2ga中产生的初始种群中个体采用二进制编码,长度为285位。对于种群个体的编码,其编码为1的位置对应输入节点在训练bp神经网络时被保留,编码为0的位置对应输入节点被舍去,不参与bp网络的训练。5.3个体的适应度函数为以该个体编码对应的输入节点所训练的bp神经网络预测结果的均方误差的倒数,即f=1/mse,f是个体适应度,mse是该个体的编码对应输入节点所训练的网络的均方误差。5.4由ga得到的最优个体,其编码为0的位置对应输入节点舍去,编码为1的位置对应输入节点保留,以保留下来的输入节点建立bp神经网络,以此优化后的bp神经网络进行脑电身份识别。5.5实验中,通过遗传算法优化得到一个含148个元素的特征参数向量。以筛选出来的148个输入节点建立优化的bp神经网络,隐含层节点取15个,输出层节点1个,输出为“1”时代表识别为“本人”,输出为“0”时代表识别为“他人”。其中,当输出结果大于0.5时,视为输出“1”,当输出结果小于或等于0.5时,视为输出“0”。利用遗传算法(ga)优化bp神经网络的输入层节点,使得(1)输入层节点数减少,降低了运算量;(2)bp网络拟合的误差降低。实验结果表示,对于样本数据没有参与训练集的受试者,利用ga降维后的bp分类器对这些受试者的数据的识别正确率显著提高。6以优化后的bp网络进行身份识别a.对于bp网络的训练数据集的组成,50%是“本人”的脑电数据,50%是“他人”的脑电数据;实验测试的时候,测试数据是“本人”脑电数据和“他人”脑电数据中没有参与训练的那部分和开集数据组成。b.每个样本有59份数据。实验重复进行多次,样本每次分配为训练集和测试集的数据是随机的。每次实验中训练集与测试集情况如下表1和表2:表1.训练集情况数据样本份数总占比(%)第一号样本40份50%第二号~第五号样本各10份50%表2.测试集情况数据情况份数总占比(%)第一号样本19份5.71%第二号~第五号样本各49份58.86%六号、七号样本各59份35.43%实验验证情况:可以看出经过ga优化后,对“他人”的数据识别率有效地提高了。由验证情况,可以看出经过ga优化后的bp神经网络能有效提高对于未曾学习训练过的样本的数据的识别率(由64.69%提高至90.49%),从而提高了总体的识别率。同样验证了此种脑电身份识别方法能有效地识别未曾学习过的个体的脑电数据,适用性更强。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1