一种脑电波信号特征获取方法与流程

文档序号:19069803发布日期:2019-11-08 20:03阅读:807来源:国知局
一种脑电波信号特征获取方法与流程
本发明涉及数据处理
技术领域
,特别涉及一种脑电波信号特征获取方法。
背景技术
:脑电波信号指通过专业仪器记录下来的人类脑细胞群及神经元的活动产生的自发的节律性的生物电信号,其英文描述为electroencephalogram,缩写eeg。脑电波反应了大脑内进行的各种活动以及大脑的功能状态,包含大量的信息。通常,可以在大脑的不同位置放置多个电极来采集十几个甚至上百个频道的脑电波信号。这些脑电波信号存在着零点漂移、工频干扰等噪声,且数据点多、冗余复杂,需要通过降噪预处理、特征提取、特征选择等步骤进行处理后才能作为其他应用场景的输入。传统的降噪方法有带通滤波器和带阻滤波器等,但对于脑电波信号处理而言,目前尚无统一的通频带范围。传统的脑电波信号特征提取方法大多只是对时域信号提取统计特征,例如信号的最大值、最小值、均值、中值等,并没有对频域信号进行提取,然而研究表明,脑电波的频域信号特征更值得挖掘。脑电波信号特征选择方法包括主成分分析法等,但这些方法并不能保证选出来的特征子集在下游应用领域能取得最佳效果。由于传统的处理方式中,降噪预处理、特征提取、特征选择等步骤均有较大的缺陷,导致脑电波信号特征的获取存在有效性差等问题。因此,需要一种目标自适应的有效获取脑电波信号特征的获取方法。技术实现要素:为解决上述技术问题,本发明的目的在于提供一种脑电波信号特征获取方法。本发明技术方案如下:一种脑电波信号特征获取方法,包括如下步骤:(1)对脑电波信号的每个频道分别做时域信号到频域信号的转换;(2)对转换后的每个频道分别进行带通滤波降噪;(3)对降噪后的每个频道的有效频段分别计算统计特征;(4)根据应用目标,对经过步骤(3)处理的脑电波信号进行频道、频段和统计特征三个维度的特征评估,根据评估结果选出每个维度的最优取值组合;(5)将频道、频段和统计特征三个维度的最优取值组合进行特征聚合,得到脑电波信号的最优特征集。基础方案原理及有益效果如下:本方案的方法为一个包含信号降噪、频域信号转换、统计特征计算、三个维度特征评估和特征选择以及特征聚合在内的一个框架。本方法首次提出了三个维度特征评估和选择方法。从频道、频段、统计特征三个维度分别评估特征,选出各个维度的最优取值组合,并聚合为一个最优特征集。本方法可以分别排除在频道、频道和统计特征三个维度的冗余特征,并且具有物理可解释性,能有效获取脑电波信号的特征。进一步,所述步骤(1)中,通过一维平稳小波变换将脑电波信号的每个频道分别从时域信号变换为频域信号。通过将时域信号转换为频域信号有助于后续的计算。进一步,所述步骤(2)中,带通滤波降噪的通频带为0.5hz~32hz,滤波之后,将0.5~1hz,1~2hz,2~4hz三个频段的信号合成一个0~4hz的频域信号。通过滤波,能有效消除原始信号中的零点漂移和工频干扰。进一步,所述步骤(3)中,计算统计特征时,需要对脑电波信号的nch个频道,每一个频道的nfb个频段分别计算ns个统计特征;计算得到的统计特征总数量为n=nch×nfb×ns;计算得到的统计特性形成一个离散的三维特征空间f,其中,ch、fb和s分别表示该三维特征空间f的三个维度:频道、频段和统计特征;该三维特征空间中的任何一个点都是从脑电波信号中计算得到的一个特征,用f(i,j,k)表示,其中,i∈{1,2,…,nch},j∈{1,2,…,nfb},k∈{1,2,…,ns};在该三维特征空间f中,任何一个平面都可以用f(i,:,:)、f(:,j,:)或者f(:,:,k)表示,其中,符号“:”表示对应维度下的所有取值。通过f(i,:,:)可以表示在第i个频道的所有频段上提取的所有统计特征构成的集合,同理,通过f(:,j,:)可以表示在所有频道的第j个频段上提取的所有统计特征构成的集合;通过f(:,:,k)可以表示在所有频道的所有频段上提取的第k个统计特征构成的集合。进一步,所述步骤(3)中,有效频段个数nfb=4,包括频率取值范围为0~4hz,4~8hz,8~16hz,16~32hz的4个频段;统计特征个数ns=9,包括:中值、标准差、均值、众数、四分位距、偏度、峰度、第一四分位数和第三四分位数。与现有技术相比,通过增加统计特征的个数,可以扩大进行特征评估和特征选择的特征空间搜索范围,有助于最后获取到的脑电波信号的最优特征子集。进一步,所述步骤(4)中,应用目标类别包括二分类问题或多分类问题;所述特征评估是在数据集(x,y)上进行的,其中其中m表示样本数量,c由应用目标类别确定,如果是二分类问题,c=1,如果是多分类问题,c=类别的数量,x是由m个样本构成的经过步骤(3)处理的脑电波信号。通过对不同应用目标的分别设置,能使得该脑电波信号特征获取方法应用范围更广。进一步,所述步骤(4)中,在频道维度上的特征评估的步骤为:(a)将数据集(x,y)按照一定的样本比例划分为训练集、验证集和测试集;(b)逐一对由单个频道和逐渐增加的多个频道对应的特征子集:f(1,:,:),f(2,:,:),…,f(i,:,:),…,f(nch,:,:),f(1:2,:,:),…,f(1:i,:,:),…,f(1:nch,:,:)进行评估;其中,1:i是指在频道维度上第1个频道和第i个频道之间的所有频道;其中,步骤(b)中的评估过程为,用待评估的特征子集在训练集上预训练一个支持向量机分类器,然后在验证集上计算该预训练好的支持向量机的分类准确率,将分类准确率最高的特征子集记为fsub_ch;将fsub_ch在频道维度上包含的所有频道记为chopt,chopt就是在频道维度上选出来的最佳频道集合。通过支持向量机分类器在训练集的预训练和在验证集上的性能比较,能准确筛选出最佳频道集合。进一步,所述步骤(4)中,在频段维度上的特征评估的步骤为:(a)将数据集(x,y)按照一定的样本比例划分为训练集、验证集和测试集;(b)逐一对由单个频段和逐渐增加的多个频段对应的特征子集:f(:,1,:),f(:,2,:),…,f(:,j,:),…,f(:,nfb,:),f(:,1:2,:),…,f(:,1:j,:),…,f(:,1:nfb,:)进行评估;其中,1:j是指在频段维度上第1个频段和第j个频段之间的所有频段;其中,步骤(b)中的评估过程为,用待评估的特征子集在训练集上预训练一个支持向量机分类器,然后在验证集上计算该预训练好的支持向量机的分类准确率,将分类准确率最高的特征子集记为fsub_fb;将fsub_fb在频段维度上包含的所有频段记为fbopt,fbopt就是在频段维度上选出来的最佳频段集合。通过支持向量机在训练集的预训练和在验证集上的性能比较,分类器能准确筛选出最佳频段集合。进一步,所述步骤(4)中,在统计特征维度上的特征评估的步骤为:(a)将数据集(x,y)按照一定的样本比例划分为训练集、验证集和测试集;(b)逐一对由单个的统计特征和逐渐增加的多个统计特征对应的特征子集:f(:,:,1),f(:,:,2),…,f(:,:,j),…,f(:,:,ns),f(:,:,1:2),…,f(:,:,1:k),…,f(:,:,1:ns)进行评估;其中,1:k是指在统计特征维度上第1个统计特征和第k个统计特征之间的所有统计特征;其中,步骤(b)中的评估过程为,用待评估的特征子集在训练集上预训练一个支持向量机分类器,然后在验证集上计算该预训练好的支持向量机的分类准确率,将分类准确率最高的特征子集记为fsub_s;将fsub_s在统计特征维度上包含的所有统计特征记为sopt,sopt就是在统计特征维度上选出来的最佳统计特征集合。通过支持向量机分类器在训练集的预训练和在验证集上的性能比较,能准确筛选出最佳统计特征集合。进一步,所述步骤(5)中,特征聚合是指,将最佳频道集合chopt,最佳频段集合fbopt以及最佳统计特征集合sopt聚合在一起,从三维特征空间全集中获取一个最佳特征子集fopt,其中fopt=f(chopt,fbopt,sopt),该最优特征子集fopt包含的特征数量为chopt,fbopt,sopt这3个维度的最优子集所含元素数量的乘积。通过将最佳频道集合chopt,最佳频段集合fbopt以及最佳统计特征集合sopt聚合在一起,能保证最后得到的最优特征子集的分类准确性高。附图说明图1为一种脑电波信号特征获取方法实施例一的流程图;图2为一种脑电波信号特征获取方法实施例二的三维特征空间示意图。具体实施方式下面通过具体实施方式进一步详细说明:实施例一如图1所示,一种脑电波信号特征获取方法,包括如下步骤:(1)对脑电波信号的每个频道分别做时域信号到频域信号的转换。根据脑电波信号获取时所使用的电极数量及放置位置,脑电波信号可以包含一个或者多个甚至数百个频道(channel)。用nch表示脑电波信号的频道数量,nch为大于等于1的整数。时域信号到频域信号的转换是通过一维平稳小波变换将脑电波信号的每个频道分别从时域信号变换为频域信号。其中,一维平稳小波变换的阶数是根据奈奎斯特采样定理和脑电波信号的采样频率共同确定的。该阶数应确保变换后的频域信号至少包含0~0.5hz,0.5~1hz,1~2hz,2~4hz,4~8hz,8~16hz,16~32hz,>32hz这8个频段。其中,本实施例中一维平稳小波变换所采用的小波函数为:symlets9。(2)对转换后的每个频道分别进行带通滤波降噪。带通滤波降噪的通频带为0.5hz~32hz,滤波之后,将0.5~1hz,1~2hz,2~4hz三个频段的信号合成一个0~4hz的频域信号。(3)对降噪后的每个频道的有效频段分别计算统计特征。有效频段是指频率取值范围为0~4hz,4~8hz,8~16hz,16~32hz的这4个频段,用nfb表示频域信号的有效频段个数,nfb=4。9个统计特征是指:中值、标准差、均值、众数、四分位距、偏度、峰度、第一四分位数和第三四分位数。用ns表示频域信号的统计特征个数,ns=9。在计算统计特征时,需要对脑电波信号的nch个频道,每一个频道的nfb个频段分别计算ns个统计特征。所以,计算得到的特征总数量为n=nch×nfb×ns,这些特性形成了一个离散的三维特征空间f,其中,该三维特征空间f的三个维度分别表示频道、频段和统计特征。该三维特征空间中的任何一个点都是从脑电波信号中计算得到的一个特征,用f(i,j,k)表示,其中,i∈{1,2,…,nch},j∈{1,2,…,nfb},k∈{1,2,…,ns}。f(i,j,k)的物理含义为脑电波信号第i个频道上的第j个频段上提取的第k个统计特征。在该三维特征空间f中,任何一个平面都可以用f(i,:,:)、f(:,j,:)或者f(:,:,k)表示,其中,符号“:”表示对应维度下的所有取值。f(i,:,:)表示在第i个频道的所有频段上提取的所有统计特征构成的集合,同理,f(:,j,:)表示在所有频道的第j个频段上提取的所有统计特征构成的集合;f(:,:,k)表示在所有频道的所有频段上提取的第k个统计特征构成的集合。(4)根据应用目标,对经过步骤(3)处理的脑电波信号进行频道、频段和统计特征三个维度的特征评估,根据评估结果选出每个维度的最优取值组合。应用目标是指,由基于脑电波信号的人脑状态辨识和人机交互指令辨识等应用场景抽象而成的类别包括二分类或者多分类问题。特征评估是数据集(x,y)上进行的,其中其中m表示样本数,c由应用目标的类别确定,如果,是二分类问题,c=1,如果是多分类问题,c=类别的数量,x是由m个样本构成的进过步骤(3)处理的脑电波信号。在频道维度上的特征评估的步骤为:(a)数据集(x,y)按照一定的样本比例划分为训练集、验证集和测试集。(b)逐一对由单个频道和逐渐增加的多个频道对应的特征子集:f(1,:,:),f(2,:,:),…,f(i,:,:),…,f(nch,:,:),f(1:2,:,:),…,f(1:i,:,:),…,f(1:nch,:,:)进行评估。其中,1:i是指在频道维度上第1个频道和第i个频道之间的所有频道。具体评估过程为,用待评估的特征子集在训练集上预训练一个支持向量机分类器,然后在验证集上计算该预训练好的支持向量机的分类准确率,将分类准确率最高的特征子集记为fsub_ch。将fsub_ch在频道维度上包含的所有频道记为chopt,chopt就是在频道维度上选出来的最佳频道集合,chopt可能是某个单一的频道,也可能是某几个频道,还有可能是所有的频道。同理,分别获取在频段维度上选出来的最佳频段集合fbopt以及在统计特征维度上选出来的最佳统计特征集合sopt。(5)将频道、频段和统计特征三个维度的最优取值组合进行特征聚合,得到脑电波信号的最优特征集。将最佳频道集合chopt,最佳频段集合fbopt以及最佳统计特征集合sopt聚合在一起,从三维特征空间全集中获取一个最佳特征子集fopt=f(chopt,fbopt,sopt)。该最优特征子集fopt包含的特征数量为chopt,fbopt,sopt这3个维度的最优子集所含元素数量的乘积。最优特征子集fopt的性能将在测试集中进行独立验证,不受在步骤(4)中用训练集和测试集做特征评估和选择的影响。本方法为一个包含信号降噪、频域信号转换、统计特征计算、三维特征评估和特征选择以及特征聚合在内的一个框架。该方法明确了脑电波信号降噪的通频范围为0.5hz~32hz。本方法明确了脑电波信号的频域信号的4个有效频段为:0~4hz,4~8hz,8~16hz,16~32hz。本方法明确了频域信号的9个可计算统计特征为:中值、标准差、均值、众数、四分位距、偏度、峰度、第一四分位数和第三四分位数。本方法首次提出了三维特征评估和选择方法。本方法首次提出根据特征的物理含义,从频道、频段、统计特征三个维度分别评估特征,选出各个维度的最优子集,并聚合为一个最优特征集。本方法提出的脑电波信号特征获取方法可以分别排除在频道、频道和统计特征三个维度的冗余特征,并且具有物理可解释性。本方法可应用于基于脑电波信号的人脑状态辨识和人机交互指令辨识等能够抽象为二分类或者多分类问题的领域。实施例二本实施例是一个二分类的大脑状态辨识问题,脑电波信号采集自22个人,这22个人共分为两个组,每组11人。共采集到22组时长为30分钟的脑电波信号,采样频率为256hz。采集脑电波信号时,电极放置位置遵循国际脑电图学会规定的10-20系统标准电极放置法,每组脑电波信号都包含19个频道,即nch=19,这19个频道分别标记为:t5,t6,t4,o2,o1,pz,p3,p4,fp1,cz,c4,t3,fp2,c3,f8,f4,fz,f3,f7.每一组时长为30分钟的脑电波信号,可以切分为900个时长为2秒的脑电波信号片段,每一个片段都是一个样本,则这22组脑电波信号一共可以切割得到19800个时长为2秒的脑电波信号片段,所以,该数据集一共包含m=19800个样本。本实施例以每个时长为2秒的脑电波信号样本为例进行说明。一种脑电波信号特征获取方法,包括如下步骤:(1)对脑电波信号的每个频道分别做时域信号到频域信号的转换。通过一维平稳小波变换将脑电波信号的19个频道分别从时域信号变换为频域信号。其中,根据奈奎斯特采样定理,由于此实施例中脑电波信号的采样频率是256hz,为了获得0~0.5hz的频域信号,一维平稳小波变换的阶数为8,所采用的小波函数为:symlets9。经过一维平稳小波变换,每一个频道的脑电波信号都被分解为:0~0.5hz,0.5~1hz,1~2hz,2~4hz,4~8hz,8~16hz,16~32hz,32~64hz,64~128hz,128~256hz,这10个频段。(2)对转换后的每个频道分别进行带通滤波降噪;将脑电波信号的19个频道的频域信号进行带通滤波降噪,分别删除<0.5hz及大于32hz的频率分量,即删除0~0.5hz,32~64hz,64~128hz,128~256hz这四个频段的信号。将0.5~1hz,1~2hz,2~4hz这三个频段的信号组合为频段为0~4hz频段的频域信号。降噪之后,每个频道的有效频段有4个,即nfb=4,分别为:0~4hz,4~8hz,8~16hz,16~32hz。(3)对降噪后的每个频道的有效频段分别计算统计特征。在本实施例中,每个脑电波信号样本分别含有nch=19个频道,每个频道含有nfb=4个有效频段,因此一共有19×4=76个有效频域信号。接下来,对每一个有效频段的时域信号按照定义分别计算ns=9个统计特征:中值、标准差、均值、众数、四分位距、偏度、峰度、第一四分位数和第三四分位数。完成计算之后,得到的特征总数量为n=nch×nfb×ns=19×4×9=684。这些特征形成了一个离散的三维特征空间f,其中,该三维特征空间f的三个维度分别表示频道(记为:ch)、频段(记为:fb)和统计特征(记为:s)。该三维特征空间中的任何一个点都是从脑电波信号中计算得到的一个特征,用f(i,j,k)表示,其中,i∈{1,2,…,nch},j∈{1,2,…,nfb},k∈{1,2,…,ns}。f(i,j,k)的物理含义为脑电波信号第i个频道上的第j个频段上提取的第k个统计特征。在该三维特征空间f中,任何一个平面都可以用f(i,:,:)、f(:,j,:)或者f(:,:,k)表示,其中,符号“:”表示对应维度下的所有取值。f(i,:,:)表示在第i个频道的所有频段上提取的所有统计特征构成的集合,同理,f(:,j,:)表示在所有频道的第j个频段上提取的所有统计特征构成的集合;f(:,:,k)表示在所有频道的所有频段上提取的第k个统计特征构成的集合。该三维特征空间f的示意图如图2所示。(4)根据应用目标,对经过步骤(3)处理的脑电波信号进行频道、频段和统计特征三个维度的特征评估,根据评估结果选出每个维度的最优取值组合。在本实施例中,应用目标为二分类问题,通过信号切割,获得m=19800个样本,其中9900个样本为正样本,另外9900个样本为负样本。按照步骤(1)、(2)、(3)每一个样本做时频转换、滤波、计算统计特征后,可得到数据集(x,y),其中将数据集(x,y)按照一定的样本比例(此测试例为60%:20%:20%)划分为训练集、验证集和测试集。(a)在频道维度上进行特征评估和选择:逐一对由单个频道和逐渐增加的多个频道对应的特征子集:f(1,:,:),f(2,:,:),…,f(i,:,:),…,f(nch,:,:),f(1:2,:,:),…,f(1:i,:,:),…,f(1:nch,:,:)进行评估。其中,1:i是指在频道维度上第1个频道和第i个频道之间的所有频道。具体评估过程为,用待评估的特征子集在训练集上预训练一个支持向量机分类器,然后在验证集上计算该预训练好的支持向量机的分类准确率,将分类准确率最高的特征子集记为fsub_ch。将fsub_ch在频道维度上包含的所有频道记为chopt,chopt就是在频道维度上选出来的最佳频道集合,chopt可能是某个单一的频道,也可能是某几个频道,还有可能是所有的频道。频道维度上各个特征子集在验证集上的评估结果如附表1所示:附表1频道维度上各个特征子集在验证集上的评估结果由附表1可见,在频道维度上最优特征集为fsub_ch=f(1:19,:,:),在验证集上取得了94.74%的分类准确率,chopt=1:19,即全部频道,这说明对于二分类问题而言,每一个频道都能提供独一无二的信息,无冗余频道。此外,根据评估结果,可以对频道维度单个频道的重要性排序,在本测试例中最重要的频道为第13个频道,在验证集上取得了75.28%的分类准确率;最不重要的频道是第3号频道,在验证集上取得了63.52%的分类准确率。同理,可得,频段维度上各个特征子集在验证集上的评估结果如附表2所示。附表2频段维度上各个特征子集在验证集上的评估结果特征子集分类准确率特征子集分类准确率f(:,1,:)75.53%f(:,1,:)75.53%f(:,2,:)79.90%f(:,1:2,:)82.86%f(:,3,:)83.37%f(:,1:3,:)89.13%f(:,4,:)88.62%f(:,1:4,:)94.62%由附表2可见,在频段维度上最优特征集为fsub_fb=f(:,1:4,:),在验证集上取得了94.62%的分类准确率,fbopt=1:4,即全部频段,这说明对于二分类问题而言,每一个频段都能提供独一无二的信息,无冗余频段。此外,基于根据评估结果,可以很容易对频道维度单个频段的重要性排序,最重要的频道为第4个频段,即16~32hz,在验证集上取得了88.62%的分类准确率;其次依次为,第3,2,1个频段,即8~16hz,4~8hz,0~4hz频段。同理,在统计特征维度上各个特征子集在验证集上的评估结果如附表3所示:附表3统计特征维度上各个特征子集在验证集上的评估结果特征子集分类准确率特征子集分类准确率f(:,:,1)68.30%f(:,:,1)68.30%f(:,:,2)96.94%f(:,:,1:2)89.79%f(:,:,3)64.61%f(:,:,1:3)88.47%f(:,:,4)91.94%f(:,:,1:4)90.34%f(:,:,5)97.45%f(:,:,1:5)94.41%f(:,:,6)66.56%f(:,:,1:6)93.20%f(:,:,7)64.11%f(:,:,1:7)92.75%f(:,:,8)97.14%f(:,:,1:8)93.63%f(:,:,9)96.79%f(:,:,1:9)94.69%由附表3可见,在统计特征上最优特征集为fsub_ch=f(:,:,5),在验证集上取得了97.45%的分类准确率,甚至超过了在特征全集上94.74%的分类准确率,sopt=5,即第五个统计特征:四分位距,这说明对于二分类问题而言,四分位距是最重要的统计特征,且不需要其他统计特征作为辅助,因此可以排除掉冗余的统计特征。此外,根据评估结果,可以很容易对统计特征维度单个统计特征的重要性排序,最重要的统计特征为第5个统计特征,在验证集上取得了97.45%的分类准确率;最不重要是第7个统计特征,在验证集上取得了64.11%的分类准确率。经过三维特征评估与选择,得出的结论是:chopt=1:19,fbopt=1:4,sopt=5。(5)将频道、频段和统计特征三个维度的最优取值组合进行特征聚合,得到脑电波信号的最优特征集。根据步骤(4)的结论,三维特征空间全集中获取的最佳特征子集fopt=f(chopt,fbopt,sopt)=f(1:19,1:4,5)=f(:,:,5)。该最优特征子集fopt包含的特征数量为chopt,fbopt,sopt这3个维度的最优子集所含元素数量的乘积,即19×4×1=76。可见,在本实施例中,根据本发明提出的方法,可以从脑电波信号中提取684个特征,经过特征评估、选择去冗余之后,最终获取了一个包含76个特征的最优特征子集。通过在测试集上进行测试,该最优特征子集取得了96.94%的分类准确性。以上所述的仅是本发明的实施例,方案中公知的具体结构及特性等常识在此未作过多描述。应当指出,对于本领域的技术人员来说,在不脱离本发明结构的前提下,还可以作出若干变形和改进,这些也应该视为本发明的保护范围,这些都不会影响本发明实施的效果和专利的实用性。本申请要求的保护范围应当以其权利要求的内容为准,说明书中的具体实施方式等记载可以用于解释权利要求的内容。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1