基于运动想象分类的结合类内距和类间距的迁移学习方法与流程

文档序号:19420078发布日期:2019-12-14 01:19阅读:654来源:国知局
基于运动想象分类的结合类内距和类间距的迁移学习方法与流程
本发明涉及运动想象分类和迁移学习的
技术领域
,尤其是指一种基于运动想象分类的结合类内距和类间距的迁移学习方法。
背景技术
:已有的研究结果已经表明,bci(脑机接口)系统的使用必须要有足够量可利用的训练样本,才能够学习到一个高效的特征提取和分类模型,而大量的训练样本的获取势必导致长时间的数据采集过程而且耗费资源,会严重影响到系统使用的便捷性。因而,在当前受试者仅有少量甚至是没有训练集的情况下,如果能够利用其它受试者的数据进行特征提取和分类具有非常重大的意义,而这正是迁移学习所要解决的问题。csp(共同空间模式)是在运动想象中使用最为广泛的特征提取方法,它能够增强两类运动想象任务之间的能量差异,非常适合用于区分由运动想象诱导的不同状态。虽然csp已经取得了巨大的成功,但是csp仍然存在容易对训练数据造成过拟合的问题,特征的稳定性也难以保证。其主要的原因在于,csp作为一种数据驱动的算法,空域滤波器的求解基于对两类任务的协方差矩阵的估计。而在样本数比较少时,估计不准确的协方差矩阵不能很好的代表基本的神经生理过程,这将直接影响空域滤波器设计的准确性。再者,后续分类器的设计也会直接影响分类结果。技术实现要素:本发明的目的在于克服现有技术的缺点与不足,提出了一种基于运动想象分类的结合类内距和类间距的迁移学习方法,通过融合其他受试者的数据,并结合分布自适应、类内距和类间距做特征迁移,解决了运动现象数据稀缺导致的过拟合问题,此外使用集成学习方法提高了分类准确率。为实现上述目的,本发明所提供的技术方案为:基于运动想象分类的结合类内距和类间距的迁移学习方法,包括以下步骤:1)利用除当前受试者以外的其它受试者的跨session数据作为训练集,当前受试者的跨session数据作为测试集;其中,每个受试者具有两个会话session的数据,分别采集于不同的时间,需要把同一个受试者的两个session的数据合并,这样得到的就是一个受试者的跨session数据;2)利用巴特沃斯带通滤波器提取目标信号,去除噪声信号对结果的干扰;3)对训练集和测试集使用共同空间模式csp提取特征,csp的公式如下:式中,fi表示第i个受试者的特征,wi表示对第i个受试者所使用的空域滤波器,表示第i个受试者所使用的空域滤波器的转置,x表示原始输入,xt表示原始输入的转置,wk表示所有受试者中第k个受试者的空域滤波器,表示所有受试者中第k个受试者的空域滤波器的转置;4)对经过csp提取得到的特征,使用分布自适应、类内距和类间距做特征迁移;5)使用集成学习方法对已做特征迁移的训练集上的特征训练出一个分类器,然后把该分类器用于已做特征迁移的测试集上的特征进行分类,得到分类准确率。在步骤4)中,所谓分布自适应就是虽然源域和目标域的数据概率分布不同,但是通过变换,能够把不同的数据分布的距离拉近,其中,采用的变换方法有条件概率分布和联合分布;条件概率分布是指对于两个已知的相关随机变量a和y,随机变量y在条件{a=a}下的概率分布,即当已知a的取值为某个特定值a时,y的概率分布;联合分布是指同时对于两个随机变量a和y的概率分布;如果采用的变换是条件概率分布称为条件分布自适应,如果采用的变换是联合分布称为联合分布自适应,条件分布自适应的目标是减小源域与目标域之间的条件分布的距离,从而完成迁移学习;联合分布自适应的目标是减小源域与目标域之间的联合分布的距离,从而完成迁移学习;另外,使用类内距和类间距做特征迁移就是在损失函数中加入类内距和类间距的比值,在最小化类内距的同时最大化类间距,其中损失函数是一个用来评估模型预测值与真实值之间不一致程度的函数。在步骤5)中,集成学习是使用一个或多个学习器进行学习,并使用规则把各个学习结果进行整合,从而获得比单个学习器更好的学习效果的一种机器学习方法;在这里使用集成的规则是bagging算法,bagging算法对于一个给定大小为n的训练集d,从中均匀、有放回地选出m个大小为q的子集作为新的训练集,在这m个训练集上使用分类、回归算法,则能够得到m个模型,再通过取平均值或者取多数票的方法,即可得到bagging的结果。本发明与现有技术相比,具有如下优点与有益效果:1、本发明首次实现了跨session(会话)和跨受试者的迁移,解决了运动想象数据稀缺的问题。2、本发明首次将分布自适应、类内距和类间距结合的迁移学习方法应用于运动想象数据集上,解决了不同受试者间特征不匹配的问题。3、本发明将集成学习方法应用于运动想象数据集上,使得分类结果具有更高的准确性。4、本发明方法计算量小,训练时间短,在实时系统中有广阔的应用前景。5、本发明可以扩展应用于图像处理、文本分析等诸多领域,具有普适性。附图说明图1为本发明逻辑流程示意图。具体实施方式下面结合具体实施例对本发明作进一步说明。如图1所示,本实施例所提供的基于运动想象分类的结合类内距和类间距的迁移学习方法,包括以下步骤:1)利用除当前受试者以外的其它受试者的跨session(会话)数据作为训练集,当前受试者的跨session数据作为测试集;其中,每个受试者具有两个session的数据,分别采集于不同的时间,需要把同一个受试者的两个session的数据合并,这样得到的就是一个受试者的跨session数据。2)利用巴特沃斯带通滤波器提取目标信号,去除其它噪声信号对结果的干扰。由于运动想象信号主要发生在8~30hz,因此巴特沃斯带通滤波器的频带也选择此范围。3)对训练集和测试集使用csp(共同空间模式)提取特征,其中csp的具体公式如下:式中,fi表示第i个受试者的特征,wi表示对第i个受试者所使用的空域滤波器,表示第i个受试者所使用的空域滤波器的转置,x表示原始输入,xt表示原始输入的转置,wk表示所有受试者中第k个受试者的空域滤波器,表示所有受试者中第k个受试者的空域滤波器的转置。4)结合分布自适应、类内距和类间距做特征迁移,传统的迁移学习方法在做特征迁移的时候只考虑到了分布自适应,但却忽视了类内距和类间距的影响,本发明方法将它们结合起来进行特征迁移。所谓分布自适应就是虽然源域和目标域的数据概率分布不同,但是通过变换,能够把不同的数据分布的距离拉近,其中,采用的变换方法有条件概率分布和联合分布。条件概率分布是指对于两个已知的相关随机变量a和y,随机变量y在条件{a=a}下的概率分布,即当已知a的取值为某个特定值a时,y的概率分布。联合分布是指同时对于两个随机变量a和y的概率分布。如果采用的变换是条件概率分布称为条件分布自适应,如果采用的变换是联合分布称为联合分布自适应,条件分布自适应的目标是减小源域与目标域之间的条件分布的距离,从而完成迁移学习;联合分布自适应的目标是减小源域与目标域之间的联合分布的距离,从而完成迁移学习。另外,使用类内距和类间距做特征迁移就是在损失函数中加入类内距和类间距的比值,在最小化类内距的同时最大化类间距,其中损失函数是一个用来评估模型预测值与真实值之间不一致程度的函数。5)使用集成学习方法对做了特征迁移的训练集上的特征训练出一个分类器,然后把该分类器用于做了特征迁移的测试集上的特征进行分类,得到分类准确率,如表1所示。其中,集成学习是使用一个或多个学习器进行学习,并使用某种规则把各个学习结果进行整合,从而获得比单个学习器更好的学习效果的一种机器学习方法;在这里使用集成的规则是bagging算法,bagging算法对于一个给定大小为n的训练集d,从中均匀、有放回地选出m个大小为q的子集作为新的训练集,在这m个训练集上使用分类、回归算法,则能够得到m个模型,再通过取平均值或者取多数票的方法,即可得到bagging的结果。表1受试者编号subject1subject2subject3subject4subject5分类准确率74.01%78.82%70.26%76.26%58.28%综上所述,在采用以上方案后,本发明为运动想象分类提供了一种新的方法,将结合分布自适应、类内距和类间距的迁移学习方法应用于不同受试者的数据中实现特征迁移,而后利用集成学习方法进行分类,可以获得更高的分类准确率,而且由于本系统计算量小,训练时间短,具有很强的实用性,非常具有推广价值。以上所述实施例只为本发明之较佳实施例,并非以此限制本发明的实施范围,故凡依本发明之形状、原理所作的变化,均应涵盖在本发明的保护范围内。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1