脑电信号分类方法及系统与流程

文档序号:20352602发布日期:2020-04-10 23:06阅读:557来源:国知局
脑电信号分类方法及系统与流程

本发明涉及生理信息检测技术领域,特别涉及一种脑电信号分类方法及系统。



背景技术:

脑电信号可用于反应某些生理与心理状态,因此对脑电信号进行分析是及早发现脑部疾病的一种重要手段。但由于其作为一种神经电生理信号具有复杂性,且脑电信号是一种随机非平稳信号,因此采用常规的信号分析方法不易获取与生理、心理状态相关的特征。如在心理问题过程中对掩饰行为的检测问题,由于在整个测试过程中,受试者的掩饰行为与正常的认知活动是同时发生的,是一个复杂的过程,因此使用常规的时域、频域,时频域方法无法对不同状态下的脑电信号进行分类。例如,时域法分析处理脑电信号的方法就是直接将经过预处理后的信号的最大值、最小值、平均值标准差作为特征提取,这样的分析过于粗糙。频域法是将随时间变化的脑电波转换为脑电功率随频率变化的谱图,传统的频域法是通过加窗函数的形式来计算功率谱,虽然具有一定的计算优势,但其方差性能较差,分辨率也比较低。时频域中的小波变换可以将信号进行局部分解,有很好的局部性,但小波变换的分辨率随频率高而降低,也有一定的缺陷。



技术实现要素:

本发明的目的在于改善现有技术中所存在的上述不足,提供一种脑电信号分类方法及系统,以进一步提高分类结果的准确性及处理效率。

为了实现上述发明目的,本发明实施例提供了以下技术方案:

一种脑电信号分类方法,包括以下步骤:

对获得的脑电信号进行预处理;

从预处理后的脑电信号中提取出非线性模糊熵作为脑电信号的特征;

对提取出的非线性模糊熵进行降维处理;

向预先训练的分类模型中输入降维处理后的非线性模糊熵,输出得到分类结果。

上述方法中,先通过预处理操作将脑电信号中的干扰去除以及分段处理,可以提高后续特征提取的准确性;以非线性模糊熵作为脑电信号的特征,相比于小波包熵、排列熵等更具代表性,即更能体现脑电信号的真实状态;然后再对模糊熵进行降维处理,使得最终分类得到的结构的准确性更高,具有更好的识别效果。

在进一步优化的方案中,采用拉普拉斯特征映射降维方法对提取的非线性模糊熵进行降维处理。

另一方面,本发明实施例同时提供了一种脑电信号分类系统,包括:

预处理模块,用于对获得的脑电信号进行预处理;

特征提取模块,用于从预处理后的脑电信号中提取出非线性模糊熵作为脑电信号的特征;

降维模块,用于对提取出的非线性模糊熵进行降维处理;

分类模块,用于向预先训练的分类模型中输入降维处理后的非线性模糊熵,输出得到分类结果。

再一方面,本发明实施例还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现本发明实施例中任一实施方式所述方法的步骤。

再一方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现本发明实施例中任一实施方式所述方法的步骤。

与现有技术相比,采用本发明上述方法或系统对脑电信号进行分类,既可以提高分类效率,也可以提高分类结果的准确性,解决常规的时域、频域、,时频域方法所存在的技术缺陷。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为本实施例中提供的脑电信号分类方法的流程图。

图2为不同特征和降维方式组合下的平均精度对比图。

图3为实施例中提供的脑电信号分类系统的组成框图。

图4为实施例中所述电子设备的示意框图。

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,本实施例中提供的脑电信号分类方法包括以下步骤:

s10,采集得到脑电信号,并对得到的脑电信号进行预处理。

基于不同的目的,对脑电信号可以有不同的预处理操作,本实施例中,为了提高运算速率,以及去除噪声、伪迹等对脑电信号的影响,将进行如下三个步骤的预处理:

第一步:为了提高运算速度,将采集到的信号频率进行降采样,例如从1000hz降到500hz,并去除掉脑电信号采集设备产生的基线漂移,使用陷波滤波器去除交流电产生的50hz工频干扰。

第二步:使用独立成分分析法(ica)去除脑电信号中的眼电伪迹。

第三步:根据分类需求(如按照不同的刺激源等)对脑电信号(eeg信号)进行分段,为后面的特征提取做准备。

s20,提取脑电信号中的非线性模糊熵作为脑电信号的特征。

大脑活动是一个复杂的过程,而脑电信号可以在一定程度上反应大脑的活动过程。由于脑电信号具有非平稳随机的特性,因此本方法中,采用非线性模糊熵(fe)作为脑电信号的特征。

非线性模糊熵的提取过程如下:

第1步:使用相空间重构法对预处理后的信号序列进行重构,得到m个n维矢量。如公式(1)所示:

xi=[x(i),x(i+1),...x(i+m-1)](1),i=0,1,2……,向量集就用xi表示,x(i)表示第i个向量。

第2步:计算任意两个向量x(i)和x(j)之间的距离,向量x(i)和x(j)之间的距离为两者对应元素中差的绝对值的最大值,计算公式如公式(2)所示:

dmij=d[x(i),x(j)]=max{|u(i+k)-u(j+k)|}(2)u(i+k)表示向量x(i)中第k个元素,u(j+k)表示向量x(j)中第k个元素,k=0,1,2……

第3步:通过模糊函数定义向量x(i)和x(j)之间的相似度即公式(3)。

公式(3)中的n和r分别为边界梯度和宽度。

第4步:定义函数公式(4)

n为原始序列的序列个数。

第5步:将维数加1,维数变为m+1,重复2到4步骤,得到

第6步:定义模糊熵

fe=lnφm(n,r)-lnφm+1(n,r)(5)

s30,利用拉普拉斯特征映射降维方法对提取的非线性模糊熵进行降维处理。

拉普拉斯特征映射降维的思想是从局部的角度去构建数据之间的关系,即,如果数据实例i和j很相似,那么数据i和j在降维之后在目标空间中应该尽量接近。拉普拉斯特征映射降维可以反映出数据结构内部的流形结构。在高维空间中有关系的点在降维之后的低维空间中仍然保持相应的关系。拉普拉斯特征映射降维方法的具体步骤如下:

第1步:构建近邻图。例如使用k近邻算法(knn)将k个点构建成一个图,计算两个点之间的欧式距离,通过判断欧式距离的大小,将k个与基准点最近的点相连接,从而构建成近邻图。

第2步:确定两点连线的权重。本方法中采用核函数法确定两点连线的权重,若点相连,则这条边的权重为wij=exp(-||xi-xj||22),否则权重为0。σ2为两个向量的方差。

第3步:计算出数据的多维嵌入,嵌入维数为m(m<n),接着计算拉普拉斯矩阵l的特征值和特征向量:

ly=λdy(6)

其中d为对角权重矩阵,d=的定义为拉普拉斯矩阵的定义为l=d-w,并且拉普拉斯矩阵是一个对称半正定矩阵。设y0,…,yn-1为公式(6)得出的特征值,从而得到

s40,基于遗传算法的支持向量机(ga-svm)进行分类,也就是说,分类模型采用支持向量机模型,且支持向量机模型预先基于遗传算法进行优化训练得到,将降维处理后的非线性模糊熵,输入基于遗传算法优化的支持向量机模型,输出结果即为分类结果。

支持向量机(svm)的基本思想是将原始数据映射到高维空间中。在该空间中,寻求可以正确区分两个类别并且类别之间的间隔最大的最优超平面作为区分类别的关键。svm的具体方法描述如下:

对于两个类别来说,在给定数据(xi,yi)的情况下是可以线性分开的。其中x∈rn,yi∈{+1,-1},i=1,2,…,m,m是样本数,n是样本向量的位数。yi是分类类别。超平面可以描述为:

(ω·x)+b=0(8)

如果样本被正确无误地划分,并且超平面到这两个类别的距离最大,则将此超平面称为最优超平面。寻找最优超平面可以变成二次规划问题。找到权重和偏移量b的最佳值将使权重成本函数最小化:

s.t.yi(ω·xi)≥1,i=1,2,…,m(9)

优化函数是二次且线性约束的,因此可以使用拉格朗日法来解决该问题。

从而使问题变成二次问题:

上述二次问题必有一个解令:

因此决策函数可以构造为:

f(x)=sgn((ω*·x)+b*)(12)

对于无法进行线性分离的两个类别,使用核函数法可以进行支持向量机的非线性分类:

相应的决策函数也变为:

其中k(xi,xj)是用于非线性映射的核函数。选择适合的核函数是解决问题的关键,在本方法中选用了高斯径向基函数(rbf)。

在本方法中,采用遗传算法来对支持向量机的输出精度进行优化。遗传算法是一种全局优化的自适应概率搜索算法。其原理是利用了生物的自然选择和遗传机制故称作遗传算法。在优化过程中应用选择、交叉、变异等操作不断进化,从而在规定的范围内得出最优解。

第一步:设置最大进化代数t(例如本实施例中取50),随机生成m个(例如20个)个体作为初始群体。

第二步:选择适应函数,适应函数与目标函数相关联,用于计算个体适应度。

第三步:将选择算子作用于群体。选择的目的是把优化的个体直接遗传到下一代或通过配对交叉产生新的个体再遗传到下一代。选择操作是建立在群体中个体的适应度评估基础上的。

第四步:将交叉算子作用于群体,遗传算法的核心就在于交叉算子。

第五步:将变异算子作用于群体。即是对群体中的个体串的某些基因座上的基因值作变动。群体p(t)经过选择、交叉、变异运算之后得到下一代群体p(t+1)。

第六步:达到设置的代数,得出具有最大适应度的个体作为最优解输出,并终止计算。

实验例:

本方法以模糊熵(fe)为特征值,经过拉普拉斯特征映射降维(le)最后采用基于遗传算法的支持向量机(ga-svm)进行脑电信号分类。通过与其他的特征以及分类方法相比,总共进行36组实验。

提取的特征有小波包熵(wpe)、排列熵(pe)、模糊熵(fe)。

采用的降维方法包括主成分分析法(pca)、拉普拉斯特征映射降维(le)、局部切线空间对准(ltsa)。

使用的分类器包括随机森林(rf),朴素贝叶斯(nb)、k-最近邻(knn)和支持向量机(svm)。

以上的特征、降维方法、分类器的不同组合对数据分类的效果如图2和表1所示。

从图2可以看出:

a、当采用拉普拉斯映射降维(le)时,选模糊熵为特征值的分类精度最高,高达78.55%,而选取置换熵的精度最低,仅有59.23%。

b、当采用主成分分析法(pca)时,选取模糊熵为特征值也是三种特征中最高的,达75.33%,但仍然略低于le+fe这一组合方法。

c、采用局部切线空间对准(ltsa)这一降维方法时,无论与哪一种特征组合,精度均未超过60%。故ltsa这一降维方法不适合处理脑电数据。

表1三十六组合实验结果

由表1数据可知fe+le+svm这一组合方法的准确度最高,高达85.43%,而fe+le+nb这一组合方法仅有67.14%。这一对比表明支持向量机(svm)在处理小样本和非线性问题方面具有明显的优势。

根据表1结果可知,在只变换降维方法,其他阶段方法不变的情况下,使用主成分分析法pca得到的分类效果仅次于使用拉普拉斯特征映射降维(le)方法得到的分类效果。主成分分析法是一种常见的特征降维方法,常用于非线性随机信号的处理中,其主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。因此,主成分分析法更适用于大量高维数据的处理,在处理少量低维数据时效果不佳。而le方法是一种非线性的降维方法,其原理是流型学习,主要思想是将高维数据映射到低维空间,在低维空间仍然能反映高维数据的本质结构特征。le方法可以在降维的同时仍然保留局部近邻节点的信息,因此对孤立点和噪声不会过于敏感,并且由于le方法是基于流型的内在几何结构,故只要嵌入是等度量的,在低维空间就可以保留其原来的结构特征。因此在进行脑电信号分析的过程中,le算法比pca算法更具有一定优势。

在一些非线性信号的数据分析当中,有些方法选择对信号进行多尺度变换,使多尺度熵作为特征值进行分类,传统的多尺度熵是将原始时间序列根据不同的多尺度因子划分成新的粗粒序列,再进行熵值计算。这样做的目的是考虑时间序列中可能存在的不同时间尺度,为了计算不同时间尺度下信号的复杂性。但是这一方法需要原始数据是时间尺度因子的整倍数,才能保证数据不被丢失。因此往往计算较复杂,且不够准确。故在本发明中直接使用原始数据(即脑电信号没有经过多尺度变换)进行模糊熵计算,更能保证数据完整性和分析准确性。

请参阅图3,基于相同的发明构思,本实施例中还提供了一种脑电信号分类系统,包括:

预处理模块,用于对获得的脑电信号进行预处理。更具体地,预处理模块在进行预处理操作时,先将采集到的信号频率进行降采样,并去除基线漂移、坏点以及眼电伪迹,然后进行分段处理。

特征提取模块,用于从预处理后的脑电信号中提取出非线性模糊熵作为脑电信号的特征。从上述表1和图3中可以得出,采用非线性模糊熵作为脑电信号的特征,可以提高分类结果的准确性。

降维模块,用于对提取出的非线性模糊熵进行降维处理。更具体地,本实施例中降维模块采用拉普拉斯特征映射降维方法对提取的非线性模糊熵进行降维处理。

分类模块,用于向预先训练的分类模型中输入降维处理后的非线性模糊熵,输出得到分类结果。本实施例中,分类模型采用支持向量机模型,且支持向量机模型采用遗传算法进行训练优化。

分类系统与分类方法是基于相同的发明构思,因此,此处未详细描述之处,还请参见前述方法实施例中的相应描述。

如图4所示,本实施例同时提供了一种电子设备,该电子设备可以包括处理器51和存储器52,其中存储器52耦合至处理器51。值得注意的是,该图是示例性的,还可以使用其他类型的结构来补充或替代该结构,实现数据提取、报告生成、通信或其他功能。

如图4所示,该电子设备还可以包括:输入单元53、显示单元54和电源55。值得注意的是,该电子设备也并不是必须要包括图4中显示的所有部件。此外,电子设备还可以包括图4中没有示出的部件,可以参考现有技术。

处理器51有时也称控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该处理器51接收输入并控制电子设备的各个部件的操作。

其中,存储器52例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其他合适装置中的一种或多种,可存储上述处理器51的配置信息、处理器51执行的指令、记录的表格数据等信息。处理器51可以执行存储器52存储的程序,以实现信息存储或处理等。在一个实施例中,存储器52中还包括缓冲存储器,即缓冲器,以存储中间信息。

输入单元53例如用于向处理器51提供各个文本报告。显示单元54用于显示处理过程中的各种结果,该显示单元例如可以为lcd显示器,但本发明并不限于此。电源55用于为电子设备提供电力。

本发明实施例还提供一种计算机可读指令,其中当在电子设备中执行所述指令时,所述程序使得电子设备执行本发明方法所包含的操作步骤。

本发明实施例还提供一种存储有计算机可读指令的存储介质,其中所述计算机可读指令使得电子设备执行本发明方法所包含的操作步骤。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-onlymemory)、随机存取存储器(ram,randomaccessmemory)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1