基于栈式自编码器和支持向量机的无创心脏梗死分类模型构建方法与流程

文档序号：15739364发布日期：2018-10-23 22:01阅读：151来源：国知局

本发明属于医学图像分析技术领域，具体涉及一种基于栈式自编码器和支持向量机的无创心脏梗死分类模型构建方法。

背景技术：

心肌梗死(myocardial infarction，MI)是临床常见的心血管系统疾病，是冠心病的危重类型，死亡率高。心肌坏死后将进一步引起心脏重构，导致心律失常和心力衰竭，心脏重构包括心室重构、血管重构、神经重构及电重构，临床表现为心肌质量、心腔容量及形态结构的改变，心脏负荷增加，顺应性降低，内膜下心肌灌注减少，心肌耗氧量增加，代偿机制启动障碍，心肌电-机械失同步；形态学上表现为心肌细胞肥大、心肌细胞凋亡、间质纤维母细胞增生及间质纤维化。上述一系列表现造成心功能的进行性下降，增加心律失常的发生，最终导致心力衰竭，因此有效地控制心肌梗死后心脏重构对改善患者预后有重要的意义。

在此之前，已经提出了许多检测心肌梗塞的方法，如JW van Oorschot等人已经证明了在没有使用外源造影剂的情况下检测慢性心肌梗塞患者的可行性；然而，该方法的灵敏度和特异性较低，并且不能提供关于心肌组织特征的足够信息；Asha等人使用三个分类器决策树，朴素贝叶斯和神经网络开发了一个智能心脏疾病预测系统来预测心脏病；Anbarasi M等提出了使用遗传算法对特征子集选择的心脏疾病的增强预测，从原来的预测心脏疾病的十三个属性降到六个属性；然而，他们都没有直接和准确地预测MI的位置和面积。Carloz Ordonez等人提出了四个约束来减少规则的数量：项目过滤，属性分组，最大项目集大小和先行/后续规则过滤；但是，将关联规则应用于医疗数据集时，将会生成大量的规则，这些规则大部分在医学上是微不足道的，找到他们所需要的时间是不切实际的。

MI患者的症状因人而异，患者可能会出现症状多样性；另外，没有任何症状的人也可能是心肌梗塞的患者。因此，MI的早期预测将在诊断中起关键作用，通过早期识别症状，可以得到最有效的临床治疗。近年来，常常使用计算机辅助检测(CAD)系统来自动分析心脏左心室(LV)心肌功能，这些系统将在病人没有痛苦的情况下帮助心脏病专家检测心肌梗死。当然，CAD系统并不是要取代心脏病专家，而是为医生提供建议。

技术实现要素：

鉴于上述，本发明提供了一种基于栈式自编码器和支持向量机的无创心脏梗死分类模型构建方法，在只得到病人的心脏磁共振电影序列的情况下，利用该方法构建得到的模型能够很好地检测出心肌梗死的位置及区域大小。

一种基于栈式自编码器和支持向量机的无创心脏梗死分类模型构建方法，包括如下步骤：

(1)获取受试者的完整心脏磁共振图像序列及其对应的延迟增强图像；

(2)通过对完整心脏磁共振图像序列进行筛选，只选取其中心脏短轴图像，从而得到对应的心脏短轴电影序列，进而利用optical flow计算出心脏短轴电影序列中与延迟增强图像所对应的一张心脏短轴图像M的运动信息；

(3)从心脏短轴图像M中提取心肌区域对应的图像信息和运动信息，遍历心肌区域中所有n×n大小的图像块并利用延迟增强图像标记每个图像块的类别，即心肌梗死与否，n为大于1的自然数；

(4)对图像块的图像信息和运动信息进行融合，将得到的融合信息以及图像块的类别信息组合成一个样本；

(5)根据步骤(1)～(4)遍历一定数量的受试者，得到大量的样本，这些受试者中包含了心肌梗死患者以及正常人；

(6)构建栈式自编码器，利用样本对该栈式自编码器进行训练，进而将栈式自编码器中的最深隐藏层作为支持向量机的输入，从而训练得到由栈式自编码器和支持向量机所组成的无创心脏梗死分类模型。

进一步地，所述步骤(1)的具体实现方法为：利用磁共振仪器对受试者同时做冠、矢、轴三个方向的定位扫描，成像范围从心底及大血管根部到心尖部，从而得到受试者的完整心脏磁共振图像序列；同时，给受试者注射一定剂量的造影剂，通过扫描成像获得对应的一张延迟增强图像。

进一步地，所述步骤(4)中对图像块的图像信息和运动信息进行融合，即将图像块的图像信息和运动信息进行归一化，进而使图像块中每一像素点归一化后的像素值和速度值相加。

进一步地，所述步骤(5)中得到大量样本后，将所有样本分为训练集、验证集和测试集，其中训练集的样本用于训练栈式自编码器，验证集的样本用于对训练完成的栈式自编码器进行验证微调以确立最终的分类模型，测试集的样本用于对最终确立的分类模型进行测试验证。

优选地，在训练集样本的融合信息中加入高斯噪声后作为训练栈式自编码器的输入，以使得模型具有抗噪能力，因为实际输入数据是采集到的真实磁共振图像，存在噪声，有必要在其训练过程中进行去噪。

进一步地，所述步骤(6)中构建及训练栈式自编码器的具体方法如下：

首先，训练多个级联的自编码器，所述自编码器由输入层、隐藏层和输出层组成，且前一个自编码器的隐藏层为后一个自编码器的输入层；

对于第一个自编码器，使训练集样本的融合信息作为该自编码器的输入层，以该自编码器输出层与输入层的损失函数最小为目标，通过反向传播和梯度下降法不断计算更新该自编码器中的权重参数和偏置参数，直至第一个自编码器训练完成；

对于第二个自编码器，使其前一个自编码器的隐藏层作为该自编码器的输入层，以该自编码器输出层与输入层的损失函数最小为目标，通过反向传播和梯度下降法不断计算更新该自编码器中的权重参数和偏置参数，直至第二个自编码器训练完成；

以此类推，完成所有自编码器的训练后，将各自编码器的隐藏层依次堆叠在一起形成所述栈式自编码器，进而利用训练集样本的融合信息和类别信息分别作为栈式自编码器的输入以及输出真值并再次进行训练。

进一步地，所述自编码器的函数模型如下：

h＝g(wt+b)

z＝f(w'h+b')

其中：t、h和z分别为自编码器的输入层、隐藏层和输出层，w和b为输入层与隐藏层之间的权重参数和偏置参数，w'和b'为隐藏层与输出层之间的权重参数和偏置参数，g()为输入层与隐藏层之间的激活函数，f()为隐藏层与输出层之间的激活函数。

本发明将深度学习的思想引入到心肌梗死分类中，其过程主要分为训练和预测两个阶段：在训练阶段先由采集到的心脏磁共振图像求得心脏的运动信息，将n×n的图像信息与运动信息融合的图像块作为输入，对应的梗死状况作为标签训练自编码器，利用降噪自编码器对输入数据做预处理，在学习高维信息过程中利用了上一层所有的变量因素，最终学得输入数据的深层特征；之后，以学得的深层特征作输入加上对应标签，利用支持向量机对样本分类；在测试阶段，将测试集中的数据X输入到堆栈式自编码器，提取隐层的深层特征，将深层特征输入到支持向量机，最终得到分类结果。因此，本发明从数据驱动的角度实现心肌梗死分类预测，有效地解决了临床上通过注射造影剂预测梗死费时费力问题。

附图说明

图1为本发明方法的整体框架示意图。

图2为采集到的心脏磁共振电影序列。

图3(a)为采集到的心脏磁共振延迟增强图像。

图3(b)为心肌梗死区域的标注示意图。

图4为第一个自编码器的结构示意图。

图5为第二个自编码器的结构示意图。

图6为栈式自编码器的结构示意图。

具体实施方式

为了更为具体地描述本发明，下面结合附图及具体实施方式对本发明的技术方案进行详细说明。

本发明基于栈式自编码器和支持向量机的无创心脏梗死分类模型构建方法，整体框架如图1所示，具体实施步骤如下：

S1.从医院获得受试者完整心脏磁共振图像(如图2所示)以及延迟增强图像(如图3(a)所示)，该方法是目前检测心肌梗死的金标准。

通过磁共振仪器对受试者同时做冠、矢、轴三方向定位图，成像范围从心底及大血管根部到心尖部；在获取延迟增强前会给受试者注射一定剂量的造影剂，此步骤对人体有一定的伤害，在未来可以避免此伤害。本发明总计受试者73例，其中心肌梗死患者57例，正常病人16例。

S2.筛选磁共振图像。

对受试者的心脏磁共振图像做筛选，本实施方式只采用心脏短轴图像，包括电影序列短轴图像和对应的延迟增强图像。一般是提取心脏舒张初期到收缩末期的一个完整周期，大概是11～12张有效图像(心肌部分较为明显清晰)，然后从中选取部分图像，利用optical flow计算其运动信息，获得每个像素的运动信息。

具体通过观察，选取受试者短轴图像中心肌部位相对较为清晰明显的电影序列，并在该序列中选取相邻的两个图像，利用optical flow计算心脏的运动信息，也因此获得心肌上每个位置的运动信息。

S3.提取心肌图像块。

对筛选到的图像心肌部位，分别从原始图像和运动信息图上手动提取该区域对应的图像信息和运动信息，本实施方式通过10×10的图像块完成提取，并通过对应的延迟增强序列确定每个心肌块的类别(梗死与否)，作为样本的标签。

具体操作过程中，在原始的电影图像和其运动信息图上，手动提取10×10方块，方块间可以有重叠，找到对应延迟增强图像的位置，如图3(b)所示，确定每个块的标签(1表示梗死，0表示正常)。

S4.图像块信息融合。

将每个10×10区域的图像信息与运动信息融合，首先对心肌块的图像信息和运动信息各自做归一化，再将两者相加，此步骤利于后期分类，本实施方式采用融合算法进行融合，提取更有价值的信息，进而将所有融合后的样本数据及对应的标签按照大致为6:1:1的比例划分为训练集(42个受试者3734组数据)、验证集(6个受试者523组数据)和测试集(9个受试者820组数据)。

训练神经网络(自编码器)提取融合后图像块的深层特征，主要是起到降维去燥的效果，之后对得到的心肌块深层特征，利用支持向量机对其做二分类，具体操作过程为：

S5.训练第一个隐藏层。

5.1本实施方式训练过程中使用了降燥自编码器：因为记录得到的输入数据是采集到的真实磁共振图像，存在噪声，而且数据存在冗余，有必要在其训练过程中进行去燥，可以使用降燥自编码器；首先在训练集中的输入数据x∈R^d上加入高斯噪声得到然后将作为该自编码器的输入，然后由得到隐藏层y∈[0,1]^d'，再由z＝gθ'(w'^Ty+b')隐藏层得到输出z∈R^d，最后利用下式的目标函数优化模型：

其中：θ＝{w,b}，w和b是输入层与隐藏层间的模型参数，θ'＝{w',b'}，w'和b'是隐藏层和输出层间的模型参数，n是训练集的数量，Lr是损失函数，x⁽ⁱ⁾和z⁽ⁱ⁾分别是第i个输入数据和对应的输出数据，f和g是激活函数，另外我们采用随机梯度下降法得到最优解，即得到最优的模型参数。

5.2训练栈式自编码器中的第一个自编码器：如图4所示，将训练集中的输入数据x(融合后的信息)作为该自编码器的输入，按5.1中提到的目标函数，通过反向传播算法和梯度下降法不断地计算和更新该自编码器中的权重和偏置参数，直到目标函数的值小于设定的阈值时，该自编码器训练完成。

S6.训练第二个隐藏层。

按照训练第一个自编码器的方式，训练第二个栈式自编码器；如图5所示，将前一个自编码器的隐藏层作为下一个自编码器的输入层，以该自编码器的输入量和输出量之差优化目标函数，通过反向传播算法和梯度下降法不断地计算和更新该自编码器中的权重和偏置参数。

S7.训练堆栈式自编码器。

将第一隐藏层和第二隐藏层堆叠在一起，然后将训练集中的输入数据x和训练集中的真值标签(梗死与否)作为堆栈式自编码器的输入数据的真值，再次进行训练，得到完善的栈式自编码器模型，如图6所示，最后由验证集的数据对模型再进行微调，得到最优的模型。

S8.学习支持向量机。

提取栈式自编码器第二隐层的特征，该特征是在去除噪声和冗余后的深层次特征，然后将该深层特征作为支持向量机的输入，线性支持向量机如下所示：

s.t. yi(wxi+b)≥1, i＝1,2,........N

ξi≥0, i＝1,2,........N

式中：w，b是需要学习的权重和偏置，C是惩罚项，C>0，ξ是松弛变量，y是标签，N是样本数量；考虑到计算复杂性，本实施方式将问题转换为等价的对偶问题：

其中，α＞0,μ＞0；另外考虑到本实施方式中的数据是非线性特性，特采用带核函数的支持向量机，实现非线性分类，具体是将输入空间X映射到特征空间H。

最后，通过学习确定最终的整个网络框架，将测试集输入到自编码器中，提取其隐层的特征，将该特征作为支持向量机的输入，得到测试结果(梗死与否)，并与真实标签作比较；网络还可以识别全新心肌块，实现在没有延迟增强图像的情况下检测梗死位置及区域大小。

上述对实施例的描述是为便于本技术领域的普通技术人员能理解和应用本发明。熟悉本领域技术的人员显然可以容易地对上述实施例做出各种修改，并把在此说明的一般原理应用到其他实施例中而不必经过创造性的劳动。因此，本发明不限于上述实施例，本领域技术人员根据本发明的揭示，对于本发明做出的改进和修改都应该在本发明的保护范围之内。

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：刘华锋;陈明强
技术所有人：浙江大学
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、司老师：1.制浆造纸 2.植物资源精细化工与化学 3.生物质精炼 4.天然产物化学
2、薛老师：1.CRISPR-Cas系统 2.基因编辑 3.基因修复 4.天然产物合成 5.单分子技术开发与应用
3、戴老师：1.天然药物（中药）合成生物学研究 2.酵母生物学与工程化研究
4、孟老师：1. 基于糖类的抗肿瘤药物的合成和活性评价及糖类疫苗的研制 2.功能糖类的化学酶法合成及构效关系研究 3.多糖及仿生材料功能的开发及应用
5、满老师：1.天然产品的提取分离与活性研究 2.天然产物活性与安全性评价 3.中药组方配伍机制研究
如您是高校老师，可以点此联系我们加入专家库。