一种基于改进自训练学习的脑电信号识别方法

文档序号：9787831阅读：462来源：国知局

一种基于改进自训练学习的脑电信号识别方法
【技术领域】
[0001] 本发明属于脑-机接口领域，涉及一种基于改进自训练学习的脑电信号识别方法。
【背景技术】
[0002] 脑-机接口技术(BCI)作为一种新型的人机交互技术，通过采集人的大脑信号，经预处理、特征提取和模式识别等对大脑信号进行建模，生成控制指令，实现大脑对外部设备的控制。由于其在医学、军事、娱乐等领域具有广泛的应用前景，BCI已成为神经康复、信息科学等领域的研究热点。在现有基于EEG的BCI系统中，运动想象作为一种自发EEG，不需要肌肉和肢体的真实参与，想象运动也能产生同样的脑电节律调制现象，还可以实现异步通信等特点，目前已成为BCI领域研究的热点之一。
[0003] 提高对运动想象模式的识别率是BCI系统的核心所在，要获得高性能的识别算法需要用户长时间的训练，以获取充足的标记样本。而长时间的训练给用户带来很大的工作量及精神负担，也给BCI系统使用带来了不便。为此如何减少用户的训练时间是BCI系统实际应用中面临的问题之一。李远清等人于2008年首次将半监督学习算法引入EEG信号识别中，用于识别右手/脚两类运动想象任务(数据集Iva)，获得了良好的效果。半监督学习算法通常包含自训练学习算法、协同训练学习算法、基于图的学习算法、半监督支持向量机 (TSVM)等，其中自训练学习算法由于其使用简便，已广泛应用于基于半监督学习算法的脑电信号识别中。龙锦益等人于2010年提出了一种结合特征提取的自训练学习算法，在自训练迭代过程中加入了参数选择(通道、波段），在两类运动想象任务识别中取得98.4%的识别率。朱向阳等人于2014年提出了一种结合特征提取的协同训练半监督分类算法，迭代更新共空间模式(CSP)特征和训练线性判别/贝叶斯判别两个分类器，在两类运动想象任务中获得了81.9%的识别率。但在自训练学习算法框架中，初始的标记样本通常较少，如果采用监督特征提取算法，将导致初始提取的特征性能较差，从而降低自训练学习算法的性能。而如果采用无监督特征提取算法，由于无监督特征提取算法没有很好地考虑样本的判别信息，不具有判别能力，也很难达到预期效果。

【发明内容】

[0004] 本发明针对如何减少BCI系统对用户的训练时间，提出一种改进自训练学习的脑电信号识别方法。基本思路是首先利用半监督extreme energy ratio(EER)算法提取标记和未标记样本的特征向量，然后利用标记样本训练SVM分类器，识别未标记样本，选择具有高置信度的样本及其预测标签，加入标记样本集中，并相应地从未标记样本集中删除，依次循环迭代，最后完成对所有未标记样本的标注，并获得最终支持向量机(SVM)分类器。本方法能够更为有效而充分地挖掘未标记样本的信息，提高了 BCI系统的识别性能和鲁棒性。
[0005] 技术方案:一种基于改进自训练学习的脑电信号识别方法，包含以下步骤：
[0006] 步骤一:输入标记和未标记EEG信号；
[0007]设有两类想象任务，标记样本分别为XA和XB，标签为yie{-l，l}，样本数量分别为 πα和πβ，未标记样本为Xu，样本数量为u，Xi e RNXT，Xi为单个的EEG信号，i = {1，…，πα，…，πα+ ηΒ，···，nA+nB+u}，其中Ν为通道数量，Τ为米样时间；
[0008] 步骤二:对EEG信号进行预处理；
[0009]步骤三:利用半监督特征提取算法提取标记和未标记样本的特征向量；
[0010] 步骤四：利用标记样本训练SVM分类器，对未标记样本进行预测；
[0011]步骤五:利用SVM的预测结果，选择高置信度的样本及其预测标签加入标记样本集中，并从对应的未标记样本集中删除；
[0012]步骤六:如果未标记样本全部已被标记，则可利用原标记样本和新增的标记样本训练SVM，对未知样本进行识别;如果未标记样本不为空，则返回步骤三。
[0013] 与现有的基于半监督学习的脑电信号识别算法相比，本发明充分挖掘了未标记样本的信息，利用半监督EER算法提取特征向量，提高了系统识别率和鲁棒性。
【附图说明】
[0014] 图1为本发明具体实施流程图；
【具体实施方式】
[0015] 下面结合说明书附图进一步阐明本发明，应理解这些实施例仅用于说明本发明而不用于限制本发明的范围，在阅读了本发明之后，本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
[0016] 如图1所示，本发明的实施主要包含三个步骤：（1)采用半监督EER算法在标记和未标记样本上计算映射矩阵，提取特征向量；（2)利用标记样本训练SVM，对未标记样本进行预测；（3)利用SVM的预测结果，将高置信度的未标记样本及其预测标签加入标记样本集中，并从相应的未标记样本集中删除。
[0017] 步骤1，输入标记和未标记EEG信号
[0018] 设有两类想象任务，标记样本分别为ΧΑ和ΧΒ，标签为yi e {-1，1}，样本数量分别为 για和ΠΒ，未标记样本为Xu，样本数量为u，Xi e RNXT，Xi为单个的EEG信号，i = {1，…，για，…，πα+ ΠΒ，···，nA+nB+u}，其中N为通道数量，T为米样时间；
[0019] 步骤2,对EEG信号进行预处理；
[0020] 步骤3,利用半监督EER算法提取标记和未标记样本的特征向量；
[0021 ]首先利用两类标记样本计算协方差矩阵：
[0024]然后，计算样本Xi的时域邻接矩阵1，其定义如下：
[0026] k、t为采样时刻，r为阈值；
[0027] 依据邻接矩阵Wi计算样本Xi的Laplacian矩阵Li = Di-Wi，其中Di为对角阵，
[0028]计算未标记样本的正则项R
[0030] 最终可得到最优空域滤波器由（（1 -a) CB+aRpCA的前m个特征向量和（（1 -a)CA+a RPCb的前m个特征向量组成;a e [ 0，1 ]
[0031] 利用该空域滤波器对标记和未标记样本进行映射，提取Xdt应的特征向量Xl。
[0032] 步骤4,利用标记样本训练SVM分类器，对未标记样本进行预测；
[0033] SVM通过最小化如下目标函数获得最优判别面：
[0038] C为惩罚因子，为松弛变量，(w，b)为判别面；
[0039] 求取最优判别面(w，b)后，可通过判决函数f (X) = sign(〈w，x>+b)预测未标记样本的标签。
[0040] 步骤5,利用SVM的预测结果，选择高置信度的样本及其预测标签加入标记样本集中，并从对应的未标记样本集中删除。
[0041] 通过判别函数f(x)可得到未标记样本的标签，但还需要求出未标记样本属于各类的置信度，以便对未标记样本进行筛选。
[0042]未标记样本属于某一类的置信度(或可能性)可由未标记样本到判别面的距离确定，距离公式如下：
[0044]距离cU越大，未标记样本Xl属于某一类的可能性越高，置信度也就越高，所以未标记样本^的置信度输出为：
[0046] 在得到未标记样本的置信度后，选择前s个置信度最高的样本及其预测标签加入标记样本集中，并从未标记样本集中删除。
[0047] 步骤6，如果未标记样本全部已被标记，则可利用原标记样本和新增的标记样本训练SVM，对未知样本进行识别；如果未标记样本不为空，则转至步骤3，依次迭代提取特征和更新分类器。
【主权项】
1. 一种改进自训练半监督学习的脑电信号识别方法，其特征在于，该方法包含W下步骤：步骤一:输入标记和未标记邸G信号；设有两类想象任务，标记样本分别为χΑ和χΒ，标签为yie {-1，1}，样本数量分别为nA和邮，未标记样本为X。，样本数量为U，Xi erNxt,Xi为单个的趾G信号，i = {1,…，ηΑ,…，ΠΑ+ ΠΒ,··· ,ΠΑ+邮+u}，其中Ν为通道数量，Τ为义样时间；步骤二:对邸G信号进行预处理；步骤Ξ:利用半监督特征提取算法提取标记和未标记样本的特征向量；步骤四：利用标记样本训练SVM分类器，对未标记样本进行预测；步骤五:利用SVM的预测结果，选择高置信度的样本及其预测标签加入标记样本集中，并从对应的未标记样本集中删除；步骤六:如果未标记样本全部已被标记，则可利用原标记样本和新增的标记样本训练 SVM，对未知样本进行识别;如果未标记样本不为空，则返回步骤Ξ。2. 根据权利要求1所述的一种改进自训练半监督学习的脑电信号识别方法，其特征在于:步骤Ξ中，利用半监督特征提取算法提取标记和未标记样本的特征向量;具体如下：首先利用两类标记样本计算协方差矩阵：然后，计算样本Xi的时域邻接矩阵Wi，其定义如下：(3； k、t为采样时刻，r为阔值；依据邻接矩阵Wi计算样本Xi的Laplacian矩阵Li = Di-Wi，其中Di为对角阵，计算未标记样本的正则项R(4) 最终可得到最优空域滤波器由（（l-a)CB+aR)-iCA的前m个特征向量和（（l-c〇CA+aR)-iCB 的前m个特征向量组成;ae[〇，l] 利用该空域滤波器对标记和未标记样本进行映射，提取Xi对应的特征向量XI。3. 根据权利要求1所述的一种改进自训练半监督学习的脑电信号识别方法，其特征在于:步骤四中，利用标记样本训练SVM分类器，对未标记样本进行预测;具体如下： SVM通过最小化如下目标函数获得最优判别面：c为惩罚因子，ξι为松弛变量，(w，b)为判别面，其中w为变量系数，b为常量；求取最优判别面(w，b)后，可通过判决函数^义）=31旨11(<巧，於+6)预测未标记样本的标签。4.根据权利要求1所述的一种改进自训练半监督学习的脑电信号识别方法，其特征在于:步骤五中，利用SVM的预测结果，选择高置信度的样本及其预测标签加入标记样本集中，并从对应的未标记样本集中删除;具体如下：未标记样本属于某一类的置信度可由未标记样本到判别面的距离确定，距离公式如下：(6) 距离di越大，未标记样本XI属于某一类的可能性越高，置信度也就越高，所W未标记样本XI的置信度输出为：(7) 在得到未标记样本的置信度后，选择前S个置信度最高的样本及其预测标签加入标记样本集中，并从未标记样本集中删除。
【专利摘要】本发明公开一种改进自训练半监督学习的脑电信号识别方法。首先对采集到的EEG信号进行预处理，利用半监督extreme？energy？ratio算法提取标记和未标记样本的特征向量，然后利用标记样本训练支持向量机(SVM)，并对未标记样本进行预测，再选择具有高置信度的未标记样本及其对应的预测标签，加入标记样本集中，并相应地从未标记样本集中删除，依次循环迭代，最后完成对所有未标记样本的标注。本发明不仅大大减少了用户在使用BCI系统之前的训练时间，而且有效地提高了识别精度和鲁棒性。
【IPC分类】G06K9/62
【公开号】CN105550705
【申请号】CN201510922194
【发明人】甘海涛, 罗志增, 范影乐, 高发荣
【申请人】杭州电子科技大学
【公开日】2016年5月4日
【申请日】2015年12月11日

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：甘海涛;罗志增;范影乐;高发荣;
技术所有人：杭州电子科技大学;
我是此专利的发明人

上一篇：一种2d图像与3d图像的识别方法
上一篇：基于混合公共因子分析器的分布式高维数据分类方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。