一种基于时频分析和循环神经网络的心电图波形分割方法与流程

文档序号:26139478发布日期:2021-08-03 14:23阅读:212来源:国知局
本发明涉及心电图波形分割相关领域,具体讲是一种基于时频分析和循环神经网络的心电图波形分割方法。
背景技术
::心电图(electrocardiogram,ecg)是人体心肌细胞膜两侧电位信号的反应,其可以反应人体心脏的健康状态,是医生进行心脏疾病诊断治疗的重要依据之一。对于单个正常的心跳周期,ecg信号可分为以下几种波形形态:p波(表示心房去极化的qrs复波前的小偏移)、qrs复波(心跳的最大幅值部分)、t波(表示心室复极化的qrs复波后的小偏移)。医生在拿到患者的心电图之后,首先便是对各个波形趋于进行标注(即波形分割),以便根据波形的变化趋势判断心脏的状态。然而,对于一段采样时间十分钟左右的ecg信号,其心跳周期便达数千个,靠医生手动注释ecg信号的每个区域便是一项非常耗时乏味的任务,且有可能标注错误。虽然随着人工智能技术的发展,出现了ecg信号自动分析、分类的装置,但也需要对原始ecg信号进行波形分割等预处理,以提高ecg信号分类的效率和准确率。技术实现要素:本发明的目的在于提供一种基于时频分析和循环神经网络的心电图波形分割方法,有助于简化并自动对ecg信号区域的波形标注,以便提高医生和ecg信号自动分类装置的效率和准确率。实现本发明目的的技术解决方案为:一种基于时频分析和循环神经网络的心电图波形分割方法,包括以下步骤:步骤1,获取经标注的原始ecg数据集,将每组ecg数据划分为多个包含5000个采样点的时序数据段,丢弃其余采样段,并将数据集转换为元胞数组;考虑到将非常长的数据序列传递到循环神经网络将影响模型的标注性能,同时将占用过多计算内存,影响神经网络模型的训练效率,因此将每组ecg数据划分为多个包含5000个采样点的时序数据段,余下的数据段便丢弃。为了便于神经网络的读取,将数据集转化为元胞数组。步骤2,设计一个带通带频率范围为[0.540]hz的带通滤波器,并将其应用于ecg数据集;ecg中三种典型心跳波形占据不同的频带,其中:qrs复波的典型频谱以大约10-25hz为中心频率,并且其分量低于40hz,发生p波和t波的频率甚至更低,p波分量低于20hz,t波分量低于10hz。由患者呼吸运动引起的基线漂移是一种低频(<0.5hz)振荡,这种振荡与心跳形态无关,不会对ecg波形分割及分类提供有意义的信息。因此,设计一个通带频率范围为[0.540]hz的带通滤波器,以消除基线漂移和任何高频噪声,消除这些分量可改进循环神经网络的训练,因为网络不会学习不相关特征。步骤3,对ecg数据集进行傅里叶同步压缩变换,将经傅里叶同步压缩变换后的实部和虚部视为单独的特征;ecg数据是一组组前后联系紧密的时间序列,针对时序数据的分类,比较成功的方法是提取时序数据的时频特征将其送入网络进行训练而不是原始数据,然后,网络同时从时间和频率两个维度学习数据的特征。因此,本发明使用傅里叶同步压缩变换处理ecg数据集,采样频率fs为原始ecg数据的采样频率,kaiser窗设为128,频率显示轴设为’yaxis’。步骤4,将ecg数据集中的每组数据顺序打乱,按预设比例划分为训练集和测试集,并标准化训练集和测试集;为了获得更优的网络模型,将ecg数据集的顺序打乱,让循环神经网络充分学习ecg数据的内在联系;同时为了更好地评价训练所得的网络,将数据集按7:3的比例划分为训练集和测试集。为了提升网络的训练效率,对训练集和测试集进行标准化,使所有数据落在[01],标准化公式为:式中,x表示样本值,μ表示样本均值,σ表示样本标准差。步骤5,构建循环神经网络模型,将训练集送入该网络进行训练,得到训练好的循环神经网络;循环神经网络模型依次包括:序列数据输入层、循环单元层、全连接层、softmax层、分类输出层;序列输入层设为40,循环单元层的神经元个数设为200、激活函数选择relu、序列输出设为’sequence’,全连接层的神经元个数设为4;优化器选择’adam’、梯度下降法中的学习率调整策略使用分段常数衰减。步骤6,将测试集送入训练好的循环神经网络,输出对ecg波形的分割结果,结合评价指标得到测试通过的ecg波形分割模型。从分类模型的评价指标中选择混淆矩阵和准确率(accuracy)作为ecg分割模型的评价指标。本发明与现有技术相比,其显著优点为:1)本发明充分利用ecg波形数据是前后联系紧密的时间序列的特点,根据信号处理和深度学习的方法对ecg信号区域进行自动注释,避免了人工手动标注的枯燥和耗时;2)本发明基于时频分析和循环神经网络技术对ecg波形进行分割,减轻了医生依据ecg诊断患者心脏健康状态的工作量,提高了ecg自动分类装置分类的效率和准确率。附图说明图1为本发明基于时频分析和循环神经网络的心电图波形分割方法流程图。图2为实施例中对本发明进行评价的混淆矩阵。图3为实施例中对ecg波形分割结果示意图。具体实施方式下面结合附图对本发明作进一步详细描述。结合图1,本发明提供一种基于时频分析和循环神经网络的心电图波形分割方法,包括以下步骤:步骤1,获取经标注的原始ecg数据集,将每组ecg数据划分为多个包含5000个采样点的时序数据段,丢弃其余采样段,并将数据集转换为元胞数组;步骤2,设计一个带通带频率范围为[0.540]hz的带通滤波器,并将其应用于ecg数据集;步骤3,对ecg数据集进行傅里叶同步压缩变换,将经傅里叶同步压缩变换后的实部和虚部视为单独的特征;步骤4,将ecg数据集中的每组数据顺序打乱,按预设比例划分为训练集和测试集,并标准化训练集和测试集;步骤5,建循环神经网络模型,将训练集送入该网络进行训练,得到训练好的循环神经网络;步骤6,将测试集送入训练好的循环神经网络,输出对ecg波形的分割结果,结合评价指标得到测试通过的ecg波形分割模型。进一步地,在其中一个实施例中,步骤1所述的经标注的ecg原始数据集是指:对于数据集中的每一位患者的心电图波形,都对其波形形态进行了标注,主要有4种波形形态:p波、qrs复波、t波和n/a(其他波形)。考虑到将非常长的数据序列传递到循环神经网络将影响模型的标注性能,同时将占用过多计算内存,影响神经网络模型的训练效率,因此将每组ecg数据划分为多个包含5000个采样点的时序数据段(也可以划分为包含其他数量的采样点的数据段,具体数量视模型训练的硬件配置而定),余下的数据段便丢弃。为了便于神经网络的读取,将数据集转化为元胞数组。进一步地,在其中一个实施例中,步骤2所述的带通滤波器的通频带范围主要考虑心电图中三种典型心跳波形的频率,其中:qrs复波的典型频谱以大约10-25hz为中心频率,并且其分量低于40hz,发生p波和t波的频率甚至更低,p波分量低于20hz,t波分量低于10hz。由患者呼吸运动引起的基线漂移是一种低频(<0.5hz)振荡,这种振荡与心跳形态无关,不会对ecg波形分割及分类提供有意义的信息。因此,设计一个通带频率范围为[0.540]hz的带通滤波器,以消除基线漂移和任何高频噪声,消除这些分量可改进循环神经网络的训练,因为网络不会学习不相关特征。进一步地,在其中一个实施例中,步骤3所述傅里叶同步压缩变换,其kaiser窗设置视具体的频率分辨率而定,在实施例中设为128。采样频率fs为原始ecg数据的采样频率,频率显示轴设为’yaxis’。进一步地,在其中一个实施例中,步骤4所述的数据集划分预设比例视数据集及模型的训练效果而定,本实施例比例为7:3。为了提升网络的训练效率,对训练集和测试集进行标准化,使所有数据落在[01],标准化公式为:式中,x表示样本值,μ表示样本均值,σ表示样本标准差。进一步地,在其中一个实施例中,步骤5所述的循环神经网络模型由以下网络层组成:序列数据输入层、循环单元层、全连接层、softmax层、分类输出层;序列输入层设为40,循环单元层的神经元个数设为200、激活函数选择relu、序列输出设为’sequence’,全连接层的神经元个数设为4;优化器选择’adam’、梯度下降法中的学习率调整策略使用分段常数衰减。进一步地,在其中一个实施例中,步骤6所述的评价指标指混淆矩阵和准确率(accuracy)。为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅用以解释本申请,并不用于限定本申请。实施例本实施例对本发明提出的基于时频分析和循环神经网络的心电图波形分割方法进行验证,具体内容如下:ecg原始数据集来自于qt数据库,这些数据总共由105名患者大约15分钟的ecg记录片段组成,采样率为250hz,双通道信号。ecg数据集的标签表前几行如表1所示,该表的每行对应一个患者,每列对应一个通道。第一位患者第一个通道第150个样本附近的标签值如表2所示,该区域标志着qrs复波的结束以及向n/a的过渡。表1waveformlabels_chan1waveformlabels_chan2member1225000×2table225000×2tablemember2225000×2table225000×2tablemember3225000×2table225000×2tablemember4225000×2table225000×2tablemember5225000×2table225000×2table表2步骤1,将每组ecg数据划分为多个包含5000个采样点的时序数据段,丢弃其余采样段,并将数据集转换为元胞数组;在将时间序列数据输入到网络前,要使用辅助函数创建尽可能多的包含5000个采样的信号段,并丢弃其余采样,以避免过多的内存使用,将非常长的输入信号传入循环神经网络会导致其预测性能下降和内存使用量过多。此辅助函数还要将ecg数据转换神经网络能够读取的元胞阵列。步骤2,设计一个通带频率范围为[0.540]hz的带通滤波器,并将其应用于ecg数据集;使用滤波器消除低频基线漂移和任何高频噪声,消除这些噪声可改进网络模型的训练,因为网络不会学习不相关的特征。步骤3,对ecg数据集进行傅里叶同步压缩变换,将经傅里叶同步压缩变换后的实部和虚部视为单独的特征;ecg数据是一组组前后联系紧密的时间序列,针对时序数据的分类,比较成功的方法是提取时序数据的时频特征将其送入网络进行训练而不是原始数据,然后,网络同时从时间和频率两个维度学习数据的特征。因此,本实施例使用傅里叶同步压缩变换处理ecg数据集,采样频率fs为原始ecg数据的采样频率,kaiser窗设为128,频率显示轴设为’yaxis’。步骤4,将ecg数据集中的每组数据顺序打乱,按预设比例划分为训练集和测试集,并标准化训练集和测试集;为了获得更优的网络模型,将ecg数据集的顺序打乱,让循环神经网络充分学习ecg数据的内在联系;同时为了更好地评价训练所得的网络,将数据集按7:3的比例划分为训练集和测试集。为了提升网络的训练效率,对训练集和测试集进行标准化,使所有数据落在[01],标准化公式为:式中,x表示样本值,μ表示样本均值,σ表示样本标准差。步骤5,构建循环神经网络模型,将训练集送入该网络进行训练,得到训练好的循环神经网络;循环神经网络模型依次包括:序列数据输入层、循环单元层、全连接层、softmax层、分类输出层;序列输入层设为40,循环单元层的神经元个数设为200、激活函数选择relu、序列输出设为’sequence’,全连接层的神经元个数设为4;优化器选择’adam’、梯度下降法中的学习率调整策略使用分段常数衰减。训练过程中准确率he损失率参数的变化如表3所示,可以看出ecg数据经时频特征处理后,训练准确度以超过95%。表3epochiterationaccuracyloss110084.29%0.3852230089.97%0.2436350091.91%0.2022470090.72%0.2461590092.43%0.20496110093.62%0.17147130094.13%0.15998160091.83%0.21359180093.03%0.194310210095.44%0.1608步骤6,将测试集送入训练好的循环神经网络,输出对ecg波形的分割结果,结合评价指标得到测试通过的ecg波形分割模型。从分类模型的评价指标中选择混淆矩阵和准确率(accuracy)作为ecg分割模型的评价指标。测试集的混淆矩阵如图2所示,从测试集中选出了12组循环神经网络模型预测的波形分割结果和真实的波形分割结果进行对比,如图3所示。综上,本发明从时频分析的角度对ecg原始进行处理,再结合深度学习框架—循环神经网络对心电图波形进行波形分割,实施例结果显示使用本发明提出的基于时频分析和循环神经网络的心电图波形分割方法对心电图波形进行标注的准确率很高且用时极短。本发明与现有技术相比,其显著优点为:本发明充分利用ecg波形数据是前后联系紧密的时间序列的特点,根据信号处理和深度学习的方法对ecg信号区域进行自动注释,避免了人工手动标注的枯燥和耗时;本发明基于时频分析和循环神经网络技术对ecg波形进行分割,减轻了医生依据ecg诊断患者心脏健康状态的工作量,提高了ecg自动分类装置分类的效率和准确率。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1