一种用于ECG身份识别的特征学习方法和系统与流程

文档序号:11216740阅读:966来源:国知局
一种用于ECG身份识别的特征学习方法和系统与流程

本发明涉及生物特征身份识别领域的方法和系统,尤其涉及一种用于ecg身份识别的特征学习方法和系统。



背景技术:

随着互联网热潮的冲击,信息技术的快速发展,人们对信息安全以及财产安全的重视不断提高,而身份识别又是信息安全最重要的环节。生物特征识别一般是指根据人类的生理特征(如指纹、虹膜和面部特征等)和行为特征(如眨眼、点头和摇头等)来进行个人身份的鉴定。由于人类的生理特性是独一无二的,所以采用生物特性识别比传统的身份认证方式更具有安全性和可靠性。传统的身份认证方式比较容易出校丢失、遗忘或者毁坏的情况,而个人身份识别技术不会出现这些情况。

心电信号(ecg信号)是一种活体生理信号,主要描绘心脏起搏的电活动过程,反映了人体潜在的生理特征。由于它不仅蕴涵了个体丰富生理信息还包括个体差异性信息。因此心电信号可以作为身份识别的生物特征。

很多学者对ecg信号用于身份识别进行了探讨,早期的研究工作主要围绕健康人群开展,在身体安静的状态下采集心电信号,然后提取特征,采用pca进行特征降维,将降维后的特征进行身份识别,并且取得了很高的识别准确率。然而,现实生活中采集时个体的身体(例如心律失常,剧烈运动)心理和情绪状态各不相同,以上这些方法在心电异常状态下的效果并不好;并且采用pca需要求训练集和测试集组成特征矩阵的协方差矩阵,而测试集需要现场采集才能获得,因此传统方法在实际应用中具有局限性。

此外,特征学习法算法通常需要较大的运算量开销,实时性差,并不适合直接应用在对实时性和便携性有着较高要求身份识别领域。



技术实现要素:

本发明结合ecg身份识别实际应用场景,采集的过程中每个个体的心率、身体健康状况和情绪状态不受限制,采用形态学和小波的组合特征作为系统的初始特征,虽然提高了身份识别的准确率,但同时也造成特征维度急剧增加从而引入了过多特征冗余,导致身份识别模型的计算复杂度高、存储空间消耗大,识别效率低下,因此结合特征学习的方法从冗余特征中自动学习具有个体身份鉴别性的的特征,从而解决传统心电信号身份识别算法无法应用于实际场景,自动分类运算量过大的问题,提供了一种低维形态学特征向量以及基于这种特征向量的心电图特征提取方法。关键技术包括心电信号预处理、提取形态学和小波的组合特征,构建心拍数据库及标准化处理、特征学习模型初始参数选取,识别模型全局参数反向微调、识别模型参数寻优,最终身份识别模块。

根据本发明的一个方面,提供了一种用于ecg身份识别的特征学习方法,包括以下步骤:获取个体的心电信号;对该个体的心电信号进行滤波处理;提取滤波后的该心电信号的形态学特征和小波特征;基于个体的心电信号的该形态学特征和小波特征,建立稀疏自编码识别神经网络。

优选地,该对该个体的心电信号进行滤波处理的步骤,包括以下子步骤:利用九层小波变换的方式去除测得该个体的心电信号的噪声,其中小波类型为db4。

优选地,该提取个体的心电信号的形态学特征和小波特征的步骤,包括以下子步骤:利用差分阈值法获取该心电信号的r波的波峰位置;以一r波的波峰值点为基准,在一个心动周期之内分别向前截取70个点以及向后截取180个点,以作为该心电信号的形态学特征。

优选地,该提取个体的心电信号的形态学特征和小波特征的步骤,还包括以下子步骤:以该心电信号的r波为基准点,截取包括了多个心动周期的心拍信号数据点;对截取的心拍信号数据点进行九层小波分解,然后提取3、4、5、6层的高频系数作为小波特征;对该形态学特征和小波特征的每一维度特征进行去极化处理。

优选地,该基于个体的心电信号的该形态学特征和小波特征,建立稀疏自编码识别神经网络的步骤,包括以下子步骤:设置特征学习稀疏因子和稀疏化惩罚系数,稀疏因子=0.1,惩罚系数为=5;设置隐含层的个数本文设置为50,隐含层神经元的个数小于输入层神经元的个数。

优选地,该基于个体的心电信号的该形态学特征和小波特征,建立稀疏自编码识别神经网络的步骤,还包括以下子步骤:利用bp算法全局反向微调该稀疏自编码识别神经网络;利用l-bfgs拟牛顿算法优化该稀疏自编码识别神经网络中参数。

优选地,还包括步骤:获取待测用户的心电信号,根据稀疏自编码识别神经网络,识别对应该待测用户的心电信号的个体。

根据本发明的另一方面,提供了一种用于ecg身份识别的特征学习系统,包括:获取信号模块,用于获取个体的心电信号;去噪处理模块,用于对该个体的心电信号进行滤波处理;特征提取模块,用于提取滤波后的该心电信号的形态学特征和小波特征;识别模块,基于个体的心电信号的该形态学特征和小波特征,建立稀疏自编码识别神经网络。

本发明的有益效果为:利用根据个体的心电信号形态学特征和小波特征来建立识别神经网络,在降低特征维度的同时提高了身份识别的精度;采用特征学习算法相对于传统的识别算法,能够提供更高的实时性高和实用性;稀疏自编码识别神经网络能够降低心电信号特征的维度,降低运算量;本发明采用l-bfgs拟牛顿算法来避免求hessian矩阵的逆矩阵,用于优化特征学习网络中参数,提高运算速度,降低存储开销,提高身份识别的实时性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1所示为根据本发明一实施例的用于ecg身份识别的特征学习方法的示意图;

图2所示为检测r波的流程图;

图3所示为自编码神经网络的示意图;

图4所示为特征学习网络的示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

下面结合附图1-4对本发明作详细的描述:

步骤一,获取个体的心电信号,即获取用于建立特征网络的个体的原始ecg数据:

在本实施例中,示例性地采用ecg-id数据库中的心电数据作为实验数据,ecg-id采集了90个体共310段心电信号,在采集的过程中每个个体的心率、身体健康状况和情绪状态不受限制。每个人至少采集两段心电信号,每段心电信号采集20秒,各段信号采集间隔在6个月之内,采样频率为500hz,采集电压范围为-10mv-10mv,分辨率为12bit。90个个体包括44个男性,46个女性,年龄在13-75周岁之间。以上数据涵盖了心电正常状态和心电异常状态下的心电信号。本领域技术人员应当理解,亦可以利用心电监测仪器,从实际的试验对象身上提取符合上述要求的心电信号。

步骤二,对个体的心电信号进行滤波处理,从而对心电信号去噪

由于心电信号为弱生物电信号容易受各种低频高频噪声干扰,因此需要对心电信号进行预处理。噪声主要来源分别是:基线漂移其主要频率分布在0.1hz左右;工频干扰其主要频率在50hz;肌电干扰等噪声其主要频率在30-300hz。根据噪声的频段,和信号的采用频率,确定采用九层小波变换进行噪声去除,采用的小波类型为db4;方法为加权软阈值法,具体过程如图2的流程图所示:

软阈值的阈值的设计公式

权重设计为:

在去除基线漂移时把小波第九层的低频系数(频率在0-0.5hz)置零,把第一层的高频系数(频率在125-250hz)置零,其他层系数采用加权阈值法进行剔除噪声。

小波去噪的参考伪代码如下:

输入:含噪声的原始信号x

过程:

1:选择小波类型lsdb4=liftwave('db4');

2:进行第一层小波变换[ca{1,1},cd{1,1}]=lwt(x,lsdb4);

3:进行2到layer层小波分解:采用加权阈值法进行去噪

4:将大于125hz系数置零

cd{1,1}=zeros(1,length(cd{1,1}));

5:小于0.5hz置零

ca{layer,1}=zeros(1,length(ca{layer,1}));

6:小波重构

fori=1:layer-1

ca{layer-i,1}=ilwt(ca{layer-i+1,1},cd{layer-i+1,1},lsdb4);

end

输出:去噪后信号

denoise_ecg=ilwt(ca{1,1},cd{1,1},lsdb4)

步骤三,提取滤波后的心电信号的形态学特征和小波特征

在提取滤波后的心电信号的形态学特征和小波特征前,需先对滤波后的心电信号做以下预处理:

(一)采用二阶差分阈值法进行r波监测;

(1)判断r波是否倒置:将去噪后的信号平均分成若干份(本例中分每段信号为20分),对每一份分别求出该片段的最大值和最小值,然后在分别求该段信号全部最大值和最小值的平均值,最后分别对最大值和最小值的平均值求绝对值,如果最大值的绝对值小于最小值的绝对值者r波倒置,反之r波正常。

(2)四点平滑求二阶差分:先将原信号x(n)进行四点平滑消除高频噪声影响,得到平滑后信号y(n),再对平滑后的原始信号y(n)进行一阶差分得到d(n),然后同样的对一阶差分信号d(n)进行四点平滑处理,得到平滑后的一阶差分信号d1(n),再对平滑后的一阶差分信号d1(n)进行差分处理,求二阶差分得到e(n),最后对二阶差分信号e(n)进行相同的进行四点平滑处理得到e1(n)

(3)获得阈值:以信号的采样频率大小的0.75倍为窗口将二阶平滑后信号e1(n)分割成k段,如果r波正常者分别求出每个窗口内e1(n)片段的最小值,然后将上部最小值取均值,将均值的0.5倍作为阈值,如果r波倒置者求取各个窗口的最大值,然后同样的将最大值均值的0.5倍设为阈值。以下以r波正常为例其阈值为:

幅值阈值以信号的采样频率大小为窗口将y(n)分割成k段,求出每个窗口的最大值和最小值的差值,然后将差值的均值作为阈值,其表达式为:

(4)r波检测:r波正常时如果同时满足阈值e1(i)<th1且0.5th2<y(i)<1.5th2判断此点为r波峰值点,记录下此点的位置,r波倒置时情况相反。

(5)漏检多检检查:根据不应期和幅值条件进行多检和漏检检查,具体操作为在正常一个心拍周期的0.5倍时间内如果检测到由两个或两个以上的r波位置,者判断为r波多检,此时根据幅值条件(如果小于幅值的一半这认为此点不是r波)进行多检剔除,如果检测到相邻的两个r波位置之差大于正常一个心拍周期的2.5倍以上者认为此处可能有漏检的r波,此时应以根据幅值条件的0.3倍从新对该段区域进行搜索,看看是否有漏检的r波存在,如果有者补上。

(6)r波调整:由于用了平滑会带来延时,导致r波波峰检测不准,故需要进行r波波峰调整,具体操作是在平滑后的原始信号以初始检测的r波位置为中心加一个很小的窗口,然后在这个窗口内搜索r波的极值点,者该点的位置就是r波波峰的位置。

(二)形态学特征提取

以r波波峰位置为基准,在一个心动周期内分别向前截取70个心拍数据点和向后截取180个心拍数据点,以此做为形态学特征,形态学特征为250维。

当根据数据集的采样频率500hz时,这些点都在一个心动周期之内,从形态学波形看这个区域比较集中体现了良好的差异性。

(三)提取小波特征

1)以r波为基准点前后截取600个心拍数据点(采样率为500hz的情况下大约包含为3-4个心拍)

2)对截取的心拍进行九层小波分解,然后提取3、4、5、6层的高频系数作为小波特征,小波特征为280维

(四)构造心拍特征数据库模块

1)将提取的形态学特征和小波特征组合在一起形成组合特征(组合特征为530维)构成心拍特征数据库,此初始特征数据库比单一的特征展现更好的完整性。

2)对心拍特征数据库的每一维度特征进行去极化处理,然后将其大小放缩在[-1,1]之间防止后续处理过程中进行迭代运算时造成数值溢出

步骤四,基于个体的心电信号的所述形态学特征和小波特征,建立稀疏自编码识别神经网络

特征学习方法可以从原始心拍中自动学习利于分类的特征,既保证了分类的准确性又去除了没有分类贡献征,降低特征维度,从而提高提高系统的时效性。并且特征学习属于无监督学习,不需要先验知识,因此适用面广。特别地,当有标签数据相对缺乏时,心拍的无监督学习算法可以同样表达出图像视觉层次的特征学习能力,并且对于心拍的急剧变化,尺度平移等有着很好的鲁棒性。

稀疏自编码神经网络是一种典型的特征学习模型,其特点是经过学习其输入层等于输出层,然后取其隐含层作为学习得到的特征。当隐含层的神经元个数多余输入层相当于把原始特征映射到高维空间,当隐含层的神经元个数少于输入特征维度相当于获得原始信号的压缩表示。在特征学习模块处理之后,表达的特征展现了更好的稳定性,可以为后期的分类提供良好的特征输入。

4.1首先,关于特征学习模型初始参数选取,

1)设置特征学习稀疏因子和稀疏化惩罚系数,稀疏因子ρ=0.1,惩罚系数为β=5;

(1)设置隐含层的个数本文设置为50,为了获得特征的压缩表示隐含层神经元的个数要小于输入层神经元的个数。

(2)采用训练稀疏自编码网络如图3所示得到的参数,作为特征学习的初始参数其中其损失函数为

残差为:

损失函数的关于权重项偏导数为

损失函数的关于偏置项偏导数为

4.2识别模型全局参数反向微调;

1)利用bp算法(即backpropagation算法,也称为反向传播算法)对特征网络如图4所示进行全局反向微调

(1)采用随机初始化神经网络参数,打破网络的对称性,然后逐层计算各层上的激活度(激励响应)。

(2)对输出层(n1层),令

因为分类层采用的是softmax分类器,所以其中i为类别标签,而p为求得的归为该类概率。

(3)对l=ni-1,n2-2,nl-3,…,2令

δ(t)=((w(l)tδ(i+1))·f′(z(l))

(4)计算所需的偏导数:

4.3识别模型参数寻优模块

1)特征学习网络为无约束优化问题,在本领域通常采用梯度下降法和牛顿法进行参数寻优,相较于一次收敛速率的梯度下降法,牛顿法为二次收敛,收敛速度特别快,但牛顿法需要求取hessian矩阵及其逆矩阵,该运算不仅带来巨大的时间开销,在存储hessian上还会引入大量的空间复杂度。基于以上考虑并针对身份识别应用强调实时性的特点,本文采取收敛速度介于梯度下降法与牛顿法之间的l-bfgs拟牛顿算法来避免求hessian矩阵的逆矩阵的问题,用于优化特征学习网络中参数,提高运算速度,降低存储开销,以提高身份识别的实时性。

牛顿法迭代规则如下:

上式中要求hessian矩阵的逆,过程复杂使得计算量增大,采用一个正定的近似矩阵来代替hessian矩阵的逆矩阵,则拟牛顿法迭代规则变换为:

需要求取每一步的bi+1,假设si=xi+1-xi,则迭代规则为:

其中,

上式为bfgs算法的迭代规则。但是由于心拍数据量过多导致sae模型中参数规模较大,进而采用l-bfgs减少存储空间。在l-bfgs算法中,每次迭代无需存储当前矩阵bk,而是存储最近m次迭代的曲率信息构成的向量,即sk和tk。利用前m次的曲率信息来估算真实hessian矩阵的大小,调整当前寻优搜索方向,使其搜索方向沿着正确的方向进行。则l-bfgs算法中迭代更新规则如下:

其中,每次迭代在实践中常用的初始值设定方法为:

其中

步骤五,身份识别

1)获取待测用户的心电信号,根据该心电信号构建心拍数据库并标准化处理;

2)处理后的心电信号输入训练好的识别网络;

3)如果用于预测的同一个体心拍数据库中一半以上的心拍分到同一个类别(假设分到类别i)上,则认为此待测用户的类别为个体i;反之则认为无此个体。

采用本方法带来的有益效果

为了检验本发明提出的一种特征学习ecg身份识别方法的性能,采用ecg-id数据作为实验仿真的数据来源,对90个个体采用广泛使用的k最近邻分类器(knn)、支持向量机分类器(svm)、softmax分类器、bp神经网络(bp)、梯度下降法(g-d)特征学习网络和拟牛顿法(l-bfgs)特征学习网络多种分类器对本方法进行分类性能测试。如表1所示可以发现采用特征学网络心拍识别准确率提高了10%左右,身份识别准确率也有了明显提高。采用l-bfgs算法的时间比g-d算法所用运行时间明显降低。

表1特征学习网络与其他分类算法效果对比图

下面给出带参数微调和不带参数微调的仿真实验结果如表2所示,通过对比可以发现不带参数调整的特征学习网络在特征维度降到100维以下后,网络的识别性急剧下降,而带参数调整的特征学习网络在特征维度降到50维后还具有较强的识别精度,在相同维度下带参数微调的特征学习网络比不带参数微调的特征学习网络心拍分类准确率要提高20%左右。综上可知带参数调整的特征学习网络无论在健壮性还是在识别效果上都比不带参数调整的实现效果好。因此,本发明能够显著改善在现实生活中采集心电信号时,因个体的身体(例如心律失常,剧烈运动)心理和情绪状态等心电异常状态导致的身份识别精度下降的问题。

表2特征学习网络有无参数调整的识别性能对比

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。例如本公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接相合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本发明各个实施例中的各功能单元可以集成在二个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在二个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom)、随机存取存储器(ram)、磁碟或者光盘等各种可以存储程序代码的介质。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1