基于OpenBCI的特征集优化在线训练方法与流程

文档序号:15387293发布日期:2018-09-08 00:43阅读:493来源:国知局

本发明涉及生物医学信号处理技术领域,具体来说,本发明涉及一种基于openbci的特征集优化在线训练方法。



背景技术:

脑—机接口是一种非传统的人机交互方式,它基于大脑皮层的电位信号,而不依赖人类的正常输出通路(外周神经系统和肌肉组织),因而该技术可以为那些患有神经系统以及运动系统疾病的病人提供与外界环境进行交互的方式,使得他们有机会通过该技术去控制机械设备,同时该技术在机体康复和神经疾病诊断领域有着大量的应用前景。近年来,脑—机接口技术在离线系统上研究有了很大的突破,在系统的可靠性以及识别准确度上都有大量的成果与进展,同时,为了更好的使用脑—机接口设备,需要用户进行必要的训练与学习,最终才能通过脑—机接口系统从新获取与外界交流的通路。脑—机接口技术作为一个科技前沿技术,有着非常广阔的应用市场,但是鉴于目前的技术特点,脑—机接口也有着如下的不足需要改进:

(1)在线程度低:虽然目前有大量的研究员投入到脑—机接口领域,但是这些研究的侧重点仍然是在离线实验上。这些研究通过研究离线数据,设计相应算法,再得到仿真实验结果。然而脑—机接口系统的应用是在线环境,因此设计基于在线环境的脑—机接口算法拥有更广阔的前景。

(2)数据采集繁琐:虽然目前的脑—机接口系统在识别准确率上有了一定的发展,但是这需要花费大量的训练时间,用户需要一遍遍的采集训练数据,因而快速获取大量的训练样本很有必要。

(3)特征集冗余度高:特征的选择对于模型的训练至关重要,由于个体差异,每个人的脑电活跃区域以及频域有所不同,因而需要区别对待,采集通道以及信号频域均需要进行特定的优化,所以,通道筛选与特征集优化对脑—机接口系统的准确性有很大作用。



技术实现要素:

本发明所要解决的技术问题是提供一种基于openbci的特征集优化在线训练方法,训练速度更快,同时针对冗余的特征提供了优化方法,以快速得到准确的脑电信号识别模型,以解决现有的在线脑机接口技术存在的训练时间长,在线结果输出慢的问题。

为实现上述目的,本发明提供以下的技术方案:

该基于openbci的特征集优化在线训练方法包括以下步骤:

步骤1:试验者带上头盔,屏幕显示运动想象提示信息,试验者开始想象肢体运动;

头盔为openbci软性头盔,该头盔一共有八个电极头模块;

运动想象提示信息,包括开始想象提醒信号以及上下左右四个方向的提示箭头,对应着舌头、脚、左右手的运动想象活动,开始想象提醒信号在提示箭头前1秒出现,提示箭头一共展示10秒时长;

步骤2:采集试验者根据提示信号所产生的脑电信号,并对该信号进行时域分割,将分割之后得到的信号作为模型的训练集;

时域分割是将采集的信号以2秒的矩形时间窗进行提取,窗每次向前移动0.1秒的时长,每个通道可得到81个时长为2秒的信号,从中随机选择80个时间窗的信号当作80个样本,作为训练集,因此每个类别的运动想象行为均有80个样本;

步骤3:根据相关熵原则对脑电采集电极进行筛选;

由步骤2得到的81个时间窗信号(时间片段),计算每个时间片段的能量值,通过对能量值的概率分布的差异,来得到相关熵值。

(1)首先计算出每个通道上的每一个时间片段的能量值:

pch,t=log2(var(xch,t))

其中,pch,t表示频道ch,时间片段t的能量值,xch,t表示频段ch,时间片段t的原始信号值,var()表示求方差,log2()表示以2为底的对数。

(2)然后计算每个类别的高斯概率分布值:

其中,表示类别i,频道ch,时间片段t的平均值;表示类别i,频道ch,时间片段t的方差,ki(j)表示类别i中第j个样本的概率分布值。

(3)再计算每个通道中每个时间片段的相关熵值:

其中,rech,t表示频道ch,时间片段t的相关熵,s表示所有训练样本。

(4)最后计算每个通道的平均相关熵值:

按平均相关熵值进行降序排列,选择前6个通道作为该试验者的最佳识别通道。

步骤4:对筛选出的若干通道的脑电信号,进行频域上的处理,分离出不同频率的信号分量;

把步骤3中所选出的最好的6个通道的信号,分别使用8-14hz、14-30hz和8-30hz的带通滤波器进行滤波,即可得到3中频率的信号分量,每个时间片段包含有18个信号序列。

步骤5:使用特征提取算法进行特征提取,然后使用遗传算法10倍交叉验证方法对特征集进行优化选择,得到最优特征选择因子;

首先对每个信号序列进行特征提取,在本发明中使用能量值作为特征值,称为能量特征:

f=log∑x2

其中f为特征值,x为信号序列,∑x2表示对序列x的每一个采样点取平方,然后求和,再对求和之后的值求对数,log表示求以2为底的对数,因此可以得到18个特征,即每个样本拥有18个特征。

对该特征进行特征优化选择,使用遗传算法作为特征优化选择的工具,使用一个18位的二进制数来对特征进行选择,该数称为选择因子,选择因子的18位对应18个特征,为0代表不选择,为1代表选择,选择因子作为遗传算法中的染色体,通过比较适应值的大小,选出每一代的最优个体,然后进行基因的交叉和变异操作,通过重复以上操作,得到全局最优个体,作为在线测试时的特征选择因子。

适应值是10折交叉验证所获得的平均分类精度,这里使用10折交叉验证的方式来减轻过拟合风险,10折交叉验证即是将样本集顺序打乱,再样本集分成十份,其中九份为训练样本,一份为测试样本,以上操作重复十次,即一共100次分类精度。

步骤6:对样本集中的所有样本提取特征,并使用步骤5得到最优特征选择因子对每个样本的特征进行特征选择,再用选择优化之后的特征去训练分类器(不限定分类器的种类),得到该试验者的脑电信号模型。

采用以上技术方案的有益效果是:该基于openbci的特征集优化在线训练方法提出了一种在线数据的训练方法,使用该方法去训练脑—机接口模型,无需再花费大量的精力去获取训练样本集,这可以节约许多数据采集的时间,提高设备的使用效率。该基于openbci的特征集优化在线训练方法为运动想象脑电信号的特征集的优化,提供了一种选择和方法,这可以提高对有效特征的利用,减轻无效特征的影响,另外使用10折交叉验证的方式,更能降低模型过拟合的风险,有利于提高脑—机接口的系统性能。

附图说明

下面结合附图对本发明的具体实施方式作进一步详细的描述。

图1是本发明实例的结构框图;

图2是本发明中训练数据的采集时序图;

图3是本发明的中脑-机接口设备的采集电极分布图。

具体实施方式

下面结合附图详细说明本发明基于openbci的特征集优化在线训练方法的优选实施方式。

图1、图2和图3出示本发明基于openbci的特征集优化在线训练方法的具体实施方式:

结合图1、图2和图3,该基于openbci的特征集优化在线训练方法包括以下步骤:

步骤1:试验者带上头盔,屏幕显示运动想象提示信息,试验者开始想象肢体运动;

头盔为openbci软性头盔,该头盔一共有八个电极头模块;

运动想象提示信息,包括开始想象提醒信号以及上下左右四个方向的提示箭头,对应着舌头、脚、左右手的运动想象活动,开始想象提醒信号在提示箭头前1秒出现,提示箭头一共展示10秒时长;

步骤2:采集试验者根据提示信号所产生的脑电信号,并对该信号进行时域分割,将分割之后得到的信号作为模型的训练集;

时域分割是将采集的信号以2秒的矩形时间窗进行提取,窗每次向前移动0.1秒的时长,每个通道可得到81个时长为2秒的信号,从中随机选择80个时间窗的信号当作80个样本,作为训练集,因此每个类别的运动想象行为均有80个样本;

步骤3:根据相关熵原则对脑电采集电极进行筛选;

由步骤2得到的81个时间窗信号(时间片段),计算每个时间片段的能量值,通过对能量值的概率分布的差异,来得到相关熵值。

(1)首先计算出每个通道上的每一个时间片段的能量值:

pch,t=log2(var(xch,t))

其中,pch,t表示频道ch,时间片段t的能量值,xch,t表示频段ch,时间片段t的原始信号值,var()表示求方差,log2()表示以2为底的对数。

(2)然后计算每个类别的高斯概率分布值:

其中,表示类别i,频道ch,时间片段t的平均值;表示类别i,频道ch,时间片段t的方差,ki(j)表示类别i中第j个样本的概率分布值。

(3)再计算每个通道中每个时间片段的相关熵值:

其中,rech,t表示频道ch,时间片段t的相关熵,s表示所有训练样本。

(4)最后计算每个通道的平均相关熵值:

按平均相关熵值进行降序排列,选择前6个通道作为该试验者的最佳识别通道。

步骤4:对筛选出的若干通道的脑电信号,进行频域上的处理,分离出不同频率的信号分量;

把步骤3中所选出的最好的6个通道的信号,分别使用8-14hz、14-30hz和8-30hz的带通滤波器进行滤波,即可得到3中频率的信号分量,每个时间片段包含有18个信号序列。

步骤5:使用特征提取算法进行特征提取,然后使用遗传算法10倍交叉验证方法对特征集进行优化选择,得到最优特征选择因子;

首先对每个信号序列进行特征提取,在本发明中使用能量值作为特征值,称为能量特征:

f=log∑x2

其中f为特征值,x为信号序列,∑x2表示对序列x的每一个采样点取平方,然后求和,再对求和之后的值求对数,log表示求以2为底的对数,因此可以得到18个特征,即每个样本拥有18个特征。

对该特征进行特征优化选择,使用遗传算法作为特征优化选择的工具,使用一个18位的二进制数来对特征进行选择,该数称为选择因子,选择因子的18位对应18个特征,为0代表不选择,为1代表选择,选择因子作为遗传算法中的染色体,通过比较适应值的大小,选出每一代的最优个体,然后进行基因的交叉和变异操作,通过重复以上操作,得到全局最优个体,作为在线测试时的特征选择因子。

适应值是10折交叉验证所获得的平均分类精度,这里使用10折交叉验证的方式来减轻过拟合风险,10折交叉验证即是将样本集顺序打乱,再样本集分成十份,其中九份为训练样本,一份为测试样本,以上操作重复十次,即一共100次分类精度。

步骤6:对样本集中的所有样本提取特征,并使用步骤5得到最优特征选择因子对每个样本的特征进行特征选择,再用选择优化之后的特征去训练分类器(不限定分类器的种类),得到该试验者的脑电信号模型。

在线测试步骤如图1右侧所示,试验者进行运动想象活动,系统实时对采集的信号进行预处理,然后从信号序列中提取出最新的2秒时长的信号,然后根据训练时得到的最优通道选择6个通道的信号,再对这个2秒的信号进行信号分离,得到3中频率的信号序列,再对这18个序列进行特征提取,然后使用训练时得到的最有特征选择因子,对特征集进行优化,最后将优化后的特征集放入分类器,得到分类结果。以上的仅是本发明的优选实施方式,应当指出,对于本领域的普通技术人员来说,在不脱离本发明创造构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1