一种心电分类方法及装置、设备、存储介质

文档序号:26050764发布日期:2021-07-27 15:25阅读:113来源:国知局
一种心电分类方法及装置、设备、存储介质

本文涉及数据处理技术,尤指一种心电分类方法及装置、设备、存储介质。



背景技术:

目前心血管疾病(cvd)仍然是全球非传染性死亡的主要原因之一。心律失常是心血管疾病中重要的一组疾病。心律失常是由于窦房结激动异常或激动产生于窦房结以外,激动的传导缓慢、阻滞或经异常通道传导,即心脏活动的起源和传导障碍导致心脏搏动的频率和(或)节律异常。它可单独发病,亦可与其他心血管病伴发。其预后与心律失常的病因、诱因、演变趋势、是否导致严重血流动力障碍有关,可突然发作而致猝死,亦可持续累及心脏而致其衰竭。为了对心血管疾病进行诊断,需要对心电图进行分类。



技术实现要素:

本申请提供了一种心电分类方法及装置、设备、存储介质,实现对心电图的分类。

本申请实施例提供了一种心电分类方法,包括:

对心电数据集中已标注类型的心电数据以预设长度进行切片,获得切片数据;

基于所述切片数据对基于深度残差网络的初始分类模型进行训练,获得分类模型;

对待分类的心电数据,使用所述分类模型进行心电分类。

在一示例性实施例中,所述对心电数据集中已标注类型的心电数据以预设长度进行切片包括:

将所述心电数据集中相同类型的心电数据进行拼接,以所述预设长度对拼接后的心电数据进行切片,且第j类心电数据其相邻切片重叠长度dj为:

其中,j=1,...,n,n为所述心电数据集中包括的心电数据类型数量,x为所述预设长度,q为n类心电数据中拼接后长度最大的心电数据的长度,lj为第j类心电数据拼接后的长度。

在一示例性实施例中,所述基于所述切片数据对基于深度残差网络的初始分类模型进行训练包括:

对所述切片数据进行滤波和标准化,使用所述进行滤波和标准化后的切片数据对所述基于深度残差网络的初始分类模型进行训练。

在一示例性实施例中,所述滤波为小波变换滤波,所述标准化为z分数标准化。

在一示例性实施例中,所述对待分类的心电数据,使用所述分类模型进行心电分类包括:

将所述待分类的心电数据按照所述预设长度进行切片,且相邻切片彼此无重叠,将切片所得的心电数据输入所述分类模型,获得分类结果。

在一示例性实施例中,所述初始分类模型包括依次设置的下述各层:卷积层、批标准化层、激活层、多个残差块、全连接层和输出层。

本公开实施例提供一种心电分类装置,包括:

训练模块,用于对心电数据集中已标注类型的心电数据以预设长度进行切片,获得切片数据;基于所述切片数据对基于深度残差网络的初始分类模型进行训练,获得分类模型;

分类模块,用于对待分类的心电数据,使用所述分类模型进行心电分类。

在一示例性实施例中,所述训练模块对心电数据集中已标注类型的心电数据以预设长度进行切片包括:

将所述心电数据集中相同类型的心电数据进行拼接,以所述预设长度对拼接后的心电数据进行切片,且第j类心电数据其相邻切片重叠长度dj为:

其中,j=1,...,n,n为所述心电数据集中包括的心电数据类型数量,x为所述预设长度,q为n类心电数据中拼接后长度最大的心电数据的长度,lj为第j类心电数据拼接后的长度。

本公开实施例提供一种心电分类设备,包括存储器和处理器,所述存储器存储有程序,所述程序在被所述处理器读取执行时,实现上述心电分类方法。

本公开实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现上述心电分类方法。

与相关技术相比,本申请实施例提供一种心电分类方法,包括:对已标注类型的心电数据集中的心电数据以预设长度进行切片,获得切片数据;基于所述切片数据对基于深度残差网络的初始分类模型进行训练,获得分类模型;对待分类的心电数据,使用所述分类模型进行心电分类。本实施例提供的方案,使用预设长度的切片数据进行训练,减少了对于qrs波定位算法的依赖。另外,采用深度残差网络进行训练,提高了分类准确率。

本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的其他优点可通过在说明书、权利要求书以及附图中所描述的方案来实现和获得。

附图说明

附图用来提供对本申请技术方案的理解,并且构成说明书的一部分,与本申请的实施例一起用于解释本申请的技术方案,并不构成对本申请技术方案的限制。

图1为本申请一实施例提供的心电分类方法流程图;

图2位本申请一实施例提供的心拍类型确定方法流程图;

图3为本申请一实施例提供的心电分类装置框图;

图4为本申请一实施例提供的心电分类方法流程图;

图5为本申请一实施例提供的基于深度残差网络的分类模型示意图;

图6为本申请一实施例提供的心电分类设备框图;

图7为本申请一实施例提供的计算机可读存储介质框图。

具体实施方式

本申请描述了多个实施例,但是该描述是示例性的,而不是限制性的,并且对于本领域的普通技术人员来说显而易见的是,在本申请所描述的实施例包含的范围内可以有更多的实施例和实现方案。尽管在附图中示出了许多可能的特征组合,并在具体实施方式中进行了讨论,但是所公开的特征的许多其它组合方式也是可能的。除非特意加以限制的情况以外,任何实施例的任何特征或元件可以与任何其它实施例中的任何其他特征或元件结合使用,或可以替代任何其它实施例中的任何其他特征或元件。

本申请包括并设想了与本领域普通技术人员已知的特征和元件的组合。本申请已经公开的实施例、特征和元件也可以与任何常规特征或元件组合,以形成由权利要求限定的独特的发明方案。任何实施例的任何特征或元件也可以与来自其它发明方案的特征或元件组合,以形成另一个由权利要求限定的独特的发明方案。因此,应当理解,在本申请中示出和/或讨论的任何特征可以单独地或以任何适当的组合来实现。因此,除了根据所附权利要求及其等同替换所做的限制以外,实施例不受其它限制。此外,可以在所附权利要求的保护范围内进行各种修改和改变。

此外,在描述具有代表性的实施例时,说明书可能已经将方法和/或过程呈现为特定的步骤序列。然而,在该方法或过程不依赖于本文所述步骤的特定顺序的程度上,该方法或过程不应限于所述的特定顺序的步骤。如本领域普通技术人员将理解的,其它的步骤顺序也是可能的。因此,说明书中阐述的步骤的特定顺序不应被解释为对权利要求的限制。此外,针对该方法和/或过程的权利要求不应限于按照所写顺序执行它们的步骤,本领域技术人员可以容易地理解,这些顺序可以变化,并且仍然保持在本申请实施例的精神和范围内。

当前对于心律失常的分类主要流程为对采集到的心电数据进行预处理,设计网络结构将处理好的数据或数据特征进行输入训练模型,模型训练完成后,基于训练好的模型进行心律失常的分类。

发明专利cn107811626a公开了一种基于一维卷积神经网络和s变换的心律失常分类方法,利用一维卷积神经网络提取心电信号的深度非线性特征,利用s变换提取心电信号的时频域特征,将心电信号的深度非线性特征和心电信号的时频域特征融合到一起,经过全连接层继续进行特征学习,得到全连接层输出特征,全连接层输出特征接到一维卷积神经网络的softmax层进行分类,输出分类结果。

该方案中,在对信号进行预处理后,需要进行相应的手动特征提取,即需要对ecg(electrocardiography,心电图)信号的形态特征进行选取,如qrs持续时间、rr间隔、t波持续时间等。这就需要先对ecg信号的r峰进行定位检测,在具体操作中,心拍的定位要么直接使用数据库中的人工位置标记,这样在实际应用中等同于加入了人工干预,自动化的程度不够;要么使用一些经典的qrs波检测算法如pan-tompkins算法,而这样的定位方式依赖于qrs波检测算法的准确度。不同的qrs波检测算法在同等准确度情况下的定位结果会存在一定的差异,例如有的qrs定位点偏左,有的则偏右,这就导致哪怕是处理相同的数据,最终的定位结果会存在明显的偏差,截取心拍的波形表现也会有不同,这也就进一步导致后面网络的学习过程对qrs定位算法也会产生依赖,两个模块间会产生一定程度的耦合。

而对于网络结构的设计,由于卷积神经网络(convolutionalneuralnetworks,cnn)的局部连接、权值共享等特点对ecg信号分类具有更好的效果,所以目前的心律失常自动分类诊断方法经常采用卷积神经网络结构。cnn能够提取从低级到高级的各种特征,网络的层数越多,意味着能够提取到不同级别的特征就越丰富,并且,越深层的网络提取的特征越抽象,越具有语义信息。但对于卷积神经网络来说,如果简单地增加深度,会导致梯度弥散或梯度爆炸。目前的解决方法是加入正则化层(batchnormalization),但这时会出现退化问题,随着网络层数增加,训练集上的准确率却饱和甚至下降了,这说明深度网络不能很简单地被很好地优化。

基于上述原因,本发明实施例提出的方案基于对心电数据的切片处理以及深度残差网络(deepresidualnetwork)对心电进行分类。具体的,首先对不同长度的心电数据记录进行切片处理以代替传统的每个心拍的划分,再将数据输入到基于深度残差网络的初始分类模型中进行训练,得到训练好的分类模型,最终由训练好的分类模型进行分类。

如图1所示,本发明一实施例提供一种心电分类方法,包括:

步骤101,对心电数据集中已标注类型的心电数据以预设长度进行切片,获得切片数据;

其中,所标注的类型即心电数据的类型,心电数据比如分为5类,包括n、v(veb)、s(sveb)、f、q。具体分类的种类可以根据需要设定。

步骤102,基于所述切片数据对基于深度残差网络的初始分类模型进行训练,获得分类模型;

步骤103,对待分类的心电数据,使用所述分类模型进行心电分类。

本实施例提供的方案,采用基于切片的数据处理方式,减少了对于qrs波定位算法的依赖。另外,采用深度残差网络进行训练,提高了分类准确率。

在一实施例中,为了保证各分类数据平衡性,采取一种有重叠的自适应切分方式,所述对已标注类型的心电数据集中的心电数据以预设长度进行切片包括:

将所述心电数据集中相同类型的心电数据进行拼接,以所述预设长度对拼接后的心电数据进行切片,且第j类心电数据其相邻切片重叠长度dj为:

其中,j=1,...,n,n为所述心电数据集中包括的心电数据类型数量,x为所述预设长度,q为n类心电数据中拼接后长度最大的心电数据的长度,lj为第j类心电数据拼接后的长度。本实施例提供的方案,采取该切分方式可以保证各类别最终数据量大致相同,以得到更好的训练效果。另外,也可以增大样本量。需要说明的是,在其他实施例中,相邻切片也可以无重叠。

其中,n可以根据需要设定,比如心电数据需要粗分为5类时,n为5,心电数据需要细分为15类时,n为15,等等。切片长度x具有包含1个完整心拍以上的长度。对于将要分为共n类的心电数据,先进行第一次粗切片,即对于原始心电记录数据按照每片长度为x进行等长度切分,再对切分好的切片进行判别,本实施例中所采取的判别规则为:

①当一个切片中所有心拍为正常时,则该切片判定为正常类别;

②当一个切片中同时存在正常和某一种异常心拍,则该切片判定为该异常类型;

③当一个切片中同时存在多类异常心拍,以切片中出现次数最多的异常类型作为该切片类型;

④当一个切片中的存在多类且相同数目的异常心拍,以最先出现的异常类型作为该切片类型。

具体判别流程如图2所示,包括:

步骤201,对任一切片,判断是否该切片中所有心拍为正常,如果是,执行步骤202,否则,执行步骤203;

步骤202,判定该切片为正常类型,结束;

步骤203,判断该切片中是否只存在一种异常心拍,如果是,执行步骤204,如果该切片中存在不止一种异常心拍,执行步骤205;

步骤204,判定该切片为该异常类型(即切片中存在的异常心拍的类型),结束;

步骤205,判断该切片是否存在多种异常心拍,且其中一种异常心拍出现的类型最多,如果是,执行步骤206,否则,执行步骤207;

步骤206,判断该切片为出现次数最多的异常心拍的异常类型,结束;

步骤207,如果该切片中存在多个出现次数最多的异常心拍,则出现次数最多也最先出现的异常心拍的异常类型作为该切片的异常类型,结束。

需要说明的是,上述分类方法仅为示例,可以根据需要使用其他方法进行各类心拍的分类。

(2)将所有粗切片进行分类判别后,将各同类别的切片按照时间顺序首尾相接进行汇总。则所有第j类心拍粗切片总长度为lj,最终得到拼接后的切片总长度中的最短长度p与最长长度q。于是为了保证各分类数据平衡性,进一步采取一种有重叠的自适应切分方式,对于第j类数据切分时重叠部分的长度

采取这种切分方式可以保证各类别最终数据量大致相同,以得到更好的训练效果。

在一实施例中,所述基于所述切片数据对基于深度残差网络的初始分类模型进行训练包括:

对所述切片数据进行滤波和标准化,使用所述进行滤波和标准化后的切片数据对所述基于深度残差网络的初始分类模型进行训练。

在一实施例中,所述滤波为小波变换滤波,所述标准化为z分数(z-score)标准化。需要说明的是,也可使用其他滤波方法和标准化方法,比如低通滤波、带通滤波及其组合等,min-max标准化、log函数标准化、arctan函数标准化方法等。

在一实施例中,使用所述进行滤波和标准化后的切片数据对所述基于深度残差网络的初始分类模型进行训练前,还将切片数据按预设比例划分为训练集与测试集,使用训练集中的切片数据对初始分类模型进行训练,使用测试集中的切片数据对分类模型进行测试。

具体的,包括:

将训练集中的切片数据送入深度残差网络构成的初始分类模型中进行特征的选取与学习。

传统的卷积网络或者全连接网络在信息传递的时候或多或少会存在信息丢失,损耗等问题,同时还有导致梯度消失或者梯度爆炸,导致很深的网络无法训练。

如果深层网络的后面那些层是恒等映射,那么模型就退化为一个浅层网络。那需要解决的就是学习恒等映射函数问题。但直接让一些层去拟合一个潜在的恒等映射函数h(x)=x比较困难,这也就是深层网络难以训练的原因。但是,本方案中把网络设计为h(x)=f(x)+x,可以转换为学习一个残差函数f(x)=h(x)-x.只要f(x)=0,就构成了一个恒等映射h(x)=x。而且拟合残差更加容易。残差网络(residualnetwork,简称resnet)在一定程度上解决了这个问题,通过直接将输入信息绕道传到输出,保护信息的完整性,整个网络只需要学习输入、输出差别的那一部分,简化学习目标和难度。resnet有很多的旁路将输入直接连接到后面的层,这种结构也被称为捷径连接(shortcutconnections)。

所述resnet的学习过程通过前向神经网络与捷径连接相结合的方式实现,捷径连接相当于简单执行了同等映射,不会产生额外的参数,也不会增加计算复杂度。而且整个网络可以依旧通过端到端的反向传播训练。

残差结构可表示为xl+1=xl+f(xl,wl),通过递归,可以得到任意深层单元l特征的表达:即对于任意深的单元l的特征xl可以表达为浅层单元1的特征xl加上一个形如的残差函数,这表明了任意单元l和1之间都具有残差特性。对于反向传播,假设损失函数为e,根据反向传播链式法则可以得到:不通过权重层的传递保证了信号能够传回到任意的浅层xl,同时这个公式也保证了不会出现梯度消失的现象,因为不可能为-1。

在模型训练完成后,使用测试集中的切片数据测试模型分类效果,分类效果满足要求时,训练完毕,后续使用训练好的模型进行心电分类;分类效果不满足要求时,可以重新对模型进行训练。

在一实施例中,所述对待分类的心电数据,使用所述分类模型进行心电分类包括:

将所述待分类的心电数据按照所述预设长度进行切片,且相邻切片彼此无重叠,将切片所得的心电数据输入所述分类模型,获得分类结果。

在一实施例中,所述初始分类模型包括依次设置的下述各层:卷积层、批标准化层、激活层(比如为relu激活层)、多个残差块、全连接层和输出层。

本发明一实施例提供一种心电分类装置,如图3所示,包括:

训练模块301,用于对已标注类型的心电数据集中的心电数据以预设长度进行切片,获得切片数据;基于所述切片数据对基于深度残差网络的初始分类模型进行训练,获得分类模型;

分类模块302,用于对待分类的心电数据,使用所述分类模型进行心电分类。

在一实施例中,所述训练模块301对已标注类型的心电数据集中的心电数据以预设长度进行切片包括:

将所述心电数据集中相同类型的心电数据进行拼接,以所述预设长度对拼接后的心电数据进行切片,且第j类心电数据其相邻切片重叠长度dj为:

其中,j=1,...,n,n为所述心电数据集中包括的心电数据类型数量,x为所述预设长度,q为n类心电数据中拼接后长度最大的心电数据的长度,lj为第j类心电数据拼接后的长度。

分类模块302的具体技术细节请参考方法实施例,此处不再赘述。

本发明实施例提供的方案可以应用于临床患者心电数据的自动检测,实现对于心律失常症状的计算机辅助自动诊断,从而提高医生诊断的敏感性和特异性,最终实现心血管疾病诊断医疗的智能化发展。另一方面,本发明实施例所提出的心律失常自动诊断方法,适合于应用在便携式心电记录设备中。在医疗设施和条件不高的地区,可以实现大范围的推广应用,以节约人力成本,能够让更多的患者得到快速有效的诊断预防与治疗。

下面对于本发明所提出方案给出具体实施例。

本实施例中采用公开心律失常心电数据库mit-bih的ecg信号数据进行训练,该数据包括48名患者每人半小时的360hz动态心电图记录。

如图4所示,本发明一实施例提供一种心电分类方法,包括:

步骤401,对心电数据进行切片处理;

根据aami协会的提议,mit-bih数据库中的心律失常类型共分为5类,包括n、v(veb)、s(sveb)、f、q,即n=5,mit-bih数据库中的心电数据均已标注其所属的类型。

首先设定固定切片长度为5s,对原始的心电数据进行粗切片处理并按照之前所述判定规则进行标签的划分,得到了五类心拍的粗切片,个数分别为n:5907,v:1633,s:344,f:54,q:4。然后将五类心拍粗切片按照时间出现顺序进行首尾拼接,得到了五类心拍数据的总长度(单位为秒):类型n:29535;类型v:8165;类型s:1720;类型f:270,类型q:20。可见其中类型n的心电数据总长度最长,本实施例中,需要对除n类型外的其他四种类型进一步进行有重叠的再切片,n类型进行无重叠的切片。根据前述公式此时x=5,q=29535,可算得其他四种类型的切片重叠部分长度(秒)分别为:

类型v的切片重叠长度:

类型s的切片重叠长度:

类型f的切片重叠长度:

类型q的切片重叠长度:

接下来根据算得的重叠长度进行各类型的心电数据进行切分,保证了各类型数据量的平衡性。

步骤402,对切片后的心电数据进行小波变换滤波去噪以及z-score标准化,将滤波及标准化后的切片数据整合到一起,随机划分为1∶1的训练集与测试集以供后续使用。

步骤403,将训练集中的切片数据馈送入一个34层的残差网络构成的初始分类模型中进行训练,得到分类模型。

该网络由16个残差块组成,每个残差块有2个卷积层。卷积层都具有64k个长度为16的一维卷积核,其中k从1开始并且每第4个残差块递增。每个残差块对其输入进行因子为2的子采样,因此原始输入最终被进行了因子为28的子采样。当残差块对输入进行子采样时,相应的捷径连接也使用具有相同因子的最大池化操作对其输入进行子采样。

在每个卷积层之前,采用批标准化(batchnormalization)和整流线性激活(relu)。同时在卷积层和非线性之后应用dropout操作。最终的全连接层和softmax激活在每个切片上产生5个输出类别的分布。具体的网络结构如图5所示。需要说明的是,该深度残差网络仅为示例,可以根据需要使用其他结构和参数的残差网络,比如,改变网络层数,卷积核大小,池化方式等等。

使用测试集中的切片数据对训练好的分类模型进行测试,判断是否满足要求,如果不满足,则继续进行训练,如果满足,则训练完毕。

后续即可根据训练好的分类模型进行心电分类。

如图6所示,本发明一实施例提供一种心电分类设备60,包括存储器610和处理器620,所述存储器610存储有程序,所述程序在被所述处理器620读取执行时,实现任一实施例所述的心电分类方法。

如图7所示,本发明一实施例提供一种计算机可读存储介质70,所述计算机可读存储介质70存储有一个或者多个程序710,所述一个或者多个程序可被一个或者多个处理器执行,以实现任一实施例所述的心电分类方法。

本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些组件或所有组件可以被实施为由处理器,如数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读介质上,计算机可读介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1