1.本发明属于特征提取、信号分类及信号识别领域,尤其涉及一种基于时间尺度信号分解及熵特征的信号分类方法。
背景技术:2.肌电图(electromyogram,emg)包含了肌肉收缩时产生的电信号,由于其具有采集无创、直接等优势,是手势预测以及人机交互等领域的研究热点。但是由于手势模式多样,以及测量环境噪声较多,提取出有效的特征较为困难。
3.由于采集信号存在的噪声较为复杂,目前的降噪方法大多都是以一些低通、带通和高通滤波器为主,而在肌电领域使用类似于emd等时间尺度信号分解的方法则很少被应用,并且目前常用的特征提取方法大多较为复杂,需要较高算力支持。例如卷积神经网络识别算法需要经过几十层网络提取特征,而且会出现训练过程原始信息丢失等问题。而本文首先对电信号提取了熵特征等基本特征,在此基础上,对电信号采用时间尺度信号分解,计算分解分量的均方根特征,最后将全部特征放入分类算法中进行分类,得到了较高的分类准确度。
技术实现要素:4.本发明的目的在于针对现有降噪方法的缺陷,有效特征提取不足以及识别准确率不高的技术缺陷,提出了一种基于时间尺度信号分解及熵特征的信号分类方法。
5.为了达到上述目的,本发明采取如下技术方案:所述基于时间尺度信号分解及熵特征的信号分类方法,包括如下步骤:s1、获取多通道电信号,将多通道电信号中的各通道电信号分别进行预处理,得到多通道有效数据;所述预处理包括同步、放大和滤波;所述同步,具体为:对多通道信号进行线性插值,使线性插值后的信号达到最大采样率;s2、选取时间窗口对多通道有效数据进行划分,并基于划分后的多通道有效数据提取基本特征;所述基本特征,包括时域特征、频域特征以及熵特征;s3、将s2提取的基本特征进行组合并保存在特征矩阵中;s4、对特征矩阵进行时间尺度信号分解,得到信号分解后特征矩阵;s5、将信号分解后特征矩阵进行分类,得到分类结果。
6.s1所述获取多通道电信号,具体包括从公开数据集中获取或通过硬件设备采集得到。
7.s1所述最大采样率,记为m1赫兹,且所述m1的取值范围为100到2000。
8.s1所述放大,具体为:对滤波后信号进行a倍的放大且a的取值范围为2000到
100000。
9.所述滤波,包括带通滤波和低通滤波,得到滤波后信号;所述滤波后信号即预处理后得到的多通道有效数据;所述带通滤波后信号的频率在m2‑ꢀ
m3赫兹的信号;所述m2的取值范围为0到30;所述m3的取值范围为20到200。
10.所述低通滤波为巴特沃斯低通滤波。
11.s2所述时间窗口的取值范围为大于等于0.5秒小于等于3秒;时间窗口的增量为时间窗口大小的q%,q的范围为20到50。
12.所述时域特征,为方差、过零率、均方根、均值、幅值极差以及波形长度中的一种或组合;所述频域特征,为峰值频率、平均频率、总功率以及中值频率中的一种或组合;所述熵特征,为信息熵、条件熵、联合熵、相对熵、交叉熵以及排列熵中的一种或组合。
13.s3所述组合包括串联和并联;s5所述分类,为随机森林、knn及逻辑回归中的一种。
14.s4所述时间尺度信号分解,包括但不限于小波变换、小波包分解、emd分解、lmd分解以及改进的emd及lmd分解;s4提取出多通道信号imf分量的均方根特征,保存在特征矩阵f中,得到原信号以及各级本征模函数的特征矩阵。
15.有益效果本发明所述的一种基于时间尺度信号分解及熵特征的信号分类方法,与现有分类方法相比,具有如下有益效果:1、所述时间尺度信号分解及熵特征的信号分类方法中采用的信号分解为emd分解时,按照高频至低频的顺序分解信号,使用了一组自适应的基函数,这些基函数只与信号特征有关,能随着信号的改变而改变,有利于提取出信号的主要分量,从而提高分类的准确率;2、所述信号分类方法,同时包含熵特征和基本特征,特征明确直观,同时不会出现现有提取特征解释性较差的问题。
附图说明
16.图1是本发明一种基于时间尺度信号分解及熵特征的信号分类方法及实施例的整体流程图;图2是本发明一种基于时间尺度信号分解及熵特征的信号分类方法及实施例中采用emd分解时分解出来的六个本征模函数;图3是本发明一种基于时间尺度信号分解及熵特征的信号分类方法及实施例采用的随机森林分类结构。
具体实施方式
17.下面结合附图和实施例对本发明所述一种基于时间尺度信号分解及熵特征的信号分类方法做进一步说明和详细描述。
18.实施例1本发明基于时间尺度信号分解及熵特征,可应用于多种场景下的特征提取及后续信号分类,尤其适用于复杂环境下采集的信号及数据的特征提取。
19.具体实施时,本发明所述二维时间序列进行预处理,得到多通道有效数据;然后提
取出信号的均方根特征和熵特征,建立特征矩阵;之后对信号的每一个通道进行emd分解,得到相应前六个的imf分量。在对应的imf分量上同样求相应的均方根特征,保存在特征矩阵中,最后将该结果送到随机森林分类器中进行分类,得到分类结果。
20.通过本方法,能够提取出信号的有效特征,提高信号分类识别的准确率。
21.本发明使用ninapro数据库中的db1数据集来进行特征提取与分类。db1数据集中包含的肌电信号采集者数量为27,每个测试者记录的肌电信号平均长度为100000,包含10个通道,数据维度是100000x10,采用肌电手环记录的手势类别数量为12种(加上休息状态为13种)。表1的结果表明,采用该种时间尺度信号分解以及特征提取的分类方法,可以提高对手势的识别准确率。结合图1基于时间尺度信号分解及熵特征的信号分类方法的整体流程图,本实施例阐述如何实施。
22.如图1所示,本发明所述一种基于时间尺度信号分解及熵特征的信号分类方法,包括如下步骤:s1、获取多通道电信号,将多通道电信号中的各通道电信号分别进行预处理,得到多通道有效数据,具体实施时,获取公开数据集ninapro中的肌电数据,将数据集中的二维肌电时间序列进行预处理,得到多通道有效数据,包括如下子步骤:s11、对多通道肌电信号进行线性插值,使信号插值到最大采样率的多通道肌电信号;所述最大采样率,记为m1赫兹,具体实施时,m1为100赫兹;s12对s11得到的多通道肌电信号进行带通滤波,得到带通滤波后的肌电信号,滤波后信号频率在0-25hz;s13、对带通滤波后的肌电信号进行放大;具体实施时,放大倍数大于等于10000倍;s14、对信号进行1hz的巴特沃斯低通滤波,得到预处理后的肌电数据;所述预处理后肌电数据的维度为100000*10,记为emg(t,n),t为时间,n为通道数,1≤t≤100000; 1≤n≤10。
23.s2、选取时间窗口对多通道有效数据进行划分,并基于划分后的多通道有效数据提取基本特征;所述基本特征,包括时域特征、频域特征以及熵特征;所述时域特征,为方差、过零率、均方根、均值、幅值极差以及波形长度中的一种或组合;所述频域特征,为峰值频率、平均频率、总功率以及中值频率中的一种或组合;所述熵特征,为信息熵、条件熵、联合熵、相对熵、交叉熵以及排列熵中的一种或组合。
24.具体实施时,s2包括如下子步骤:s21、使用1s时间长度的窗口提取对信号emg(t,n)进行划分,时间窗口的增量为0.25s;所述时间窗口的取值范围为大于等于0.5秒小于等于3秒,具体到本实施例为1s;时间窗口的增量为时间窗口大小的q%,q的范围为20到50,具体到本实施例为25,对应0.25s;接着,提取信号emg(t,n)各通道的基本特征,包含如下步骤:s22、计算提取出的时间窗口的均方根;
s23、计算提取出的时间窗口信息熵;s22即s23表明:具体实施时,基本特征选取时域特征的均方根以及熵特征中的信息熵;s3、将s2提取的基本特征组合保存在特征矩阵f中;s3所述组合包括串联和并联,具体到本实施例,采用串联;s4、对特征矩阵进行时间尺度信号分解,得到信号分解后特征矩阵;所述时间尺度信号分解,包括但不限于小波变换、小波包分解、emd分解、lmd分解以及改进的emd及lmd分解;s4提取出多通道信号imf分量的均方根特征,保存在特征矩阵f中,得到原信号以及各级本征模函数的特征矩阵。
25.具体到本实施例为:对信号emg(t,n)进行改进的emd分解,即emd自适应分解,包含如下步骤:s41、检索到信号所有的极大值点和极小值点;s42、根据信号的的极大值点,通过三次样条函数对其进行插值,获得上包络线e1(t,n) ;s43、根据信号的的极小值点,通过三次样条函数对其进行插值,获得下包络线e2(t,n) ;s44、计算上包络线和下包络线的均值aver (t,n)=1/2(e1(t,n)+ e2(t,n));s45、将原信号减去包络线的均值得到h(t);h(t,n)= emg(t,n)
‑ꢀ
aver(t,n);s46、判断h(t,n)的极值点和过零点数目是否满足相等或者两者差值为1的条件,如果不满足,则跳至步骤s41,重新对h(t,n进行计算,如果满足,则继续执行s47;s47、判断h(t,n)由所有极大值点形成的包络线的由所有极小值点形成的包络是否满足相等条件,如果不满足,则跳至步骤s41重新对h(t,n)进行计算,如果满足,则继续执行s48;s48、得到同时满足步骤s46和步骤s47条件的h(t,n),即为本征模函数imf(t,n);s49、将imf1从原始信号中去除:h(t,n) = emg(t,n)
ꢀ‑
imf(t,n)从s41重新开始,不断得到分解分量imf2,imf3,imf4,imf5,imf6,分解出的信号如图2所示;s410、针对信号的多通道,跳至步骤s41,对不同通道进行emd分解,重复次数为10次,最后得到10个通道各自对应的6个imf分量。
26.s411、对多通道信号的imf分量提取出均方根特征,保存在特征矩阵f中,得到原信号以及各级本征模函数的特征矩阵。
27.s5、将特征矩阵送入分类算法中,进行手势识别,得到分类结果;s5所述分类算法,为随机森林、knn及逻辑回归中的一种,具体到本实施例,采取如图3所示的随机森林分类方法;包含如下步骤:s51、从特征矩阵f(83494*100)的83494个样本中,随机有放回的选择83494个样本,作为决策树根节点处的样本;
s52、在特征矩阵f(83494*100)的100个特征中,随机地从100个特征中选取k个特征,k的大小远远小于100;s53、计算所有k个特征和对应特征的所有切分点对样本数据的基尼系数,选择基尼系数最小的特征和切分点作为最优特征和最优切分点,在此基础上,将目前节点分为两个子节点,将样本数据集按照特征划分到对应的子节点数据集中;s54、选择出子节点的最优特征和最优切分点。如果该节点选出来的最优特征是上一个节点最优特征,则停止分裂,建立出一个决策树,转至步骤s55,否则跳至步骤s53;s55、跳至步骤s51,直到建立100个决策树,构成随机森林;s56、将100个决策树得到的结果,按照投票最多类别为预测类别的原则,预测出对应特征的手势标签,得到分类结果如表1所示。
28.表1原始数据在使用该专利特征提取方法和未使用情况下进行分类的准确率对比上所述为本发明的较佳实施例而已,本发明不应该局限于该实施例和附图所公开的内容。凡是不脱离本发明所公开的精神下完成的等效或修改,都落入本发明保护的范围。