基于二维斑点追踪技术冠心病筛查的集成机器学习方法与流程

文档序号:26638051发布日期:2021-09-14 23:54阅读:371来源:国知局
基于二维斑点追踪技术冠心病筛查的集成机器学习方法与流程

1.本发明涉及计算机图形学下的医学成像分析、机器学习技术领域,具体涉及一种基于二维斑点追踪技术冠心病筛查的集成机器学习方法。


背景技术:

2.冠心病是席卷全球的疾病,每年死亡人数上千万。对冠心病进行早期筛查并给与控制,可显著降低患者死亡率,改善预后。现临床上已经有不少对冠心病早期筛查的检查方法,但仍有冠心病患者被遗漏,除了心电图外,仍然缺乏简单高效的辅助筛查方法。冠脉造影或者冠脉cta是诊断冠心病的金标准,这些方法可以直观显示冠脉管腔狭窄情况。但是此方法属于有创性检查,操作成本高、设备仪器昂贵、对医生资质要求高及潜在的放射性副作用等。因此,这种检查方法在临床实践中受到严重限制,在级别较低的医院或者社区门诊等难以开展。心电图运动负荷试验作为排查冠心病的另外一种检查手段,属于无创性的检查手段,虽然在临床上广泛应用,但不适用于高龄或者运动障碍人群。
3.基于心动超声的斑点追踪用于观察心肌运动,已经有越来越多的研究证明可以预测冠心病。二维斑点追踪技术的整体长轴应变及峰值应变时间,在冠心病患者与正常对照组之间存在显著的差异。二维斑点追踪技术对冠心病筛查已经提供了良好前景。然而,目前仍然缺乏有效的评估模型,具有足够的敏感度和特异度筛查出早期冠心病。二维斑点追踪技术包含很多参数,尚不清楚那一组基于超声心动图的参数特征可以有效量化心肌受损,特别是轻度受损。近年来,机器学习(包括计算机视觉)技术的发展引发了一场医学技术革命。gabriele提出的第一个临床级病理机器算法,用于三种类型癌症的诊断,平均准确率达到98%。深度学习算法已经开始在超声心动图中应用。应用机器学习算法很有可能在未来超声心动图诊断中发挥关键的作用。
4.现有筛选人群中的冠心病患者的方法都是基于各种模型假设。当建模数据存在高度异质性和噪音时,不同的方法结果有所差异。因为潜在的假设通常很难验证,因此很难判断哪种方法最为恰当。此外,并没有一种单一的分类方法可以提供令人满意的结果。


技术实现要素:

5.本发明提供一种基于二维斑点追踪技术冠心病筛查的集成机器学习方法,采用集成机器学习的方法,将19种流行的分类方法整合后,建立模型,以提供最佳诊断预测效果。
6.为了达到上述目的,本发明提供如下技术方案:一种基于二维斑点追踪技术冠心病筛查的集成机器学习方法,其包括以下步骤:
7.步骤一、入选多个可疑冠心病对象:
8.步骤二、对各个所述对象进行超声检查,并一一留存对应的切面图像;
9.步骤三、通过echopac对各个所述切面图像进行离线分析;
10.步骤四、从二维斑点追踪心动图得出特征定量和临床特征分类;
11.步骤五、应用t检验比较病例组中冠心病阳性与对照组冠心病阴性各定量特征的
差异;将主成分分析pca应用于峰值收缩应变pss、应变率ssr和达峰时间tp的17个片段;
12.步骤六、通过两步堆叠法减少分类误差导致的结果错误放大。
13.优选的,所述步骤一种,各个所述对象均符合:存在心肌缺血相关症状;年龄≥18岁;窦性心律患者。
14.优选的,所述步骤一中,所述窦性心律患者,排除标准为:st段抬高型心肌梗死患者;患有中到重度瓣膜病、恶性心律失常、肥厚型心肌病或者扩张性心肌病的严重心脏病患者;预期寿命不足1年的终末期疾病患者;冠脉造影结果提示心肌桥,而无冠状动脉粥样硬化的患者;超声心动图质量不佳患者。
15.优选的,所述步骤二中,超声检查包括利用多普勒超声经心尖四腔心切面,二尖瓣瓣尖下1cm处记录二尖瓣前向血流频谱,记录舒张早期血流频谱e峰及舒张晚期a峰,得出e/a值;利用组织多普勒测量二尖瓣环舒张早期e’峰,得出e/e’值;应用双平面simpson法于心尖四腔心及两腔心切面算出左室射血分数lvef。
16.优选的,所述步骤二中,各个所述对象的切面图像包括:左室短轴基底切面,左室短轴乳头肌切面,左室短轴心尖切面,左室长轴两腔心切面,左室长轴三腔心切面和左室长轴四腔心切面,并且保证每个切面留存至少连续3个心动周期图像,且帧频在45

75帧/秒。
17.优选的,所述步骤三中,echopac离线分析的斑点追踪超声参数包括:整体长轴峰值应变glps,应变率ssr和达峰时间tp,分层长轴峰值应变,及峰值应变离散psd参数。
18.优选的,所述步骤六中,所述两步堆叠法包括先堆叠提高个体的预测能力,再通过对训练集进行多次随机划分进行第二部堆叠。
19.本发明有益效果为:本部分的研究基于斑点追踪超声心动图,利用模型集成法得到的预测模型有效的诊断冠心病,可为冠心病筛查提供简便、快捷及高效的检查工具。其借从多个分类模型获取的优势,本模型诊断冠心病将精度从70%左右提高到87.7%。本研究模型最终敏感性为0.903,特异性为0.843,auc为0.904,显著高于单个的分类模型。
20.本发明在斑点追踪超声心动图的原始数据基础上进行开发,提升诊断效能,此外,本基于2d

ste的方法也可以帮助重新评估冠心病患者缺血保守治疗或者手术治疗后的恢复情况。
21.本发明采用的方法为集成机器学习方法。集成机器学习方法可以分为三类:bagging、boosting和stacking。bagging的目的是减少方差,boosting的目的是减少偏差,stacking的目的是提高预测精度。由于本发明的目标是减少方法的误差,提高预测能力,因此使用堆叠方法来充分利用了流行的机器学习方法的优势。我们将传统的堆叠方法推广为两步堆叠方法。第一步堆叠可以提高个体的预测精度。通过对训练集进行多次随机划分进行第二步堆叠,可以减少由于错误的模型聚合而导致的分类错误。
附图说明
22.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
23.图1为本发明两步堆叠方法流程图;
24.图2为本发明特性之间的相关性;
25.图3为本发明收缩期峰值应变、收缩期应变率和达峰时间主成分碎石图
26.图4为本发明收缩期峰值应变、收缩期应变率和达峰时间前三个pcs中17节段的贡献热图;
27.图5为本发明堆叠模型和单个模型的roc曲线。
具体实施方式
28.下面将结合本发明的附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
29.一种基于二维斑点追踪技术冠心病筛查的集成机器学习方法,其包括以下步骤:
30.步骤一、入选多个可疑冠心病对象:各个所述对象均符合:存在心肌缺血相关症状;年龄≥18岁;窦性心律患者。所述窦性心律患者,还需排除标准为:st段抬高型心肌梗死患者;患有中到重度瓣膜病、恶性心律失常、肥厚型心肌病或者扩张性心肌病的严重心脏病患者;预期寿命不足1年的终末期疾病患者;冠脉造影结果提示心肌桥,而无冠状动脉粥样硬化的患者;超声心动图质量不佳患者。
31.步骤二、对所有入选患者都在冠脉造影术前均采用超声仪器ge vivid e9进行常规的超声心动图检查。使用频率为3.5赫兹m5sc探头进行常规检查。静息状态下,取左侧卧位,同步连接心电图。二维超声经胸骨旁左室长轴切面测量室间隔厚度ivs、左室后壁厚度lvpw及左心室舒张末内径lvedd。利用多普勒超声经心尖四腔心切面,二尖瓣瓣尖下1cm处记录二尖瓣前向血流频谱,记录舒张早期血流频谱e峰及舒张晚期a峰,得出e/a值。利用组织多普勒测量二尖瓣环舒张早期e’峰,得出e/e’值。应用双平面simpson法于心尖四腔心及两腔心切面算出左室射血分数lvef。
32.每位患者均留存以下切面图像:左室短轴基底切面、左室短轴乳头肌切面、左室短轴心尖切面、左室长轴两腔心切面、左室长轴三腔心切面和左室长轴四腔心切面。保证每个切面留存至少连续3个心动周期图像,且帧频在45

75帧/秒。
33.步骤三、将所有切面图像通过软件echopac v201进行echopac离线分析。在收缩末期,手动追踪每个图像的心内膜及外膜边缘。如果对心内膜边缘跟踪不满意,则重新手动调整兴趣区域roi,直至满意为止。如果经过多次调整,仍有无法识别区域的图像予以剔除。分析的斑点追踪超声参数包括:整体长轴峰值应变glps,应变率ssr和达峰时间tp,分层长轴峰值应变,及峰值应变离散psd等相关参数。
34.根据既往研究,在某些情形下应变参数的改变对冠心病的判断预测价值有可能高于心电图和肌钙蛋白。在心肌缺血发生时,纵向走向的心肌最容易受到影响,因此整体长轴应变最容易表现出受损。既往研究发现glps可以在可以人群中预测急性非st段抬高冠脉综合征。整体长轴应变已经被推荐为协助诊断的重要指标,本研究中也纳入了整体长轴应变作为主要参数之一。由于心脏血管存在左冠状动脉和右冠状动脉双重灌注的区域,单纯依靠单一指标确定病因判定哪支冠脉狭窄有可能出现不准确的情况。既往研究发现径向应变、圆周应变、收缩期峰值应变、应变率以及达峰时间等多个参数在冠心病患者出现显著变
化。因此,本研究中同时纳入了以上多个参数。心肌组织有三层不均匀的肌纤维组成,不同层心肌对心肌缺血敏感性不一样。因此本研究也纳入不同心肌层的分层应变参数。
35.步骤四、从二维斑点追踪心动图得出特征定量和临床特征分类。
36.如图1所示,本研究构建机器学习模型诊断冠心病风险的预测因子包含71个特征,其中,从二维斑点追踪心动图得出的64个特征定量,7个临床特征分类本研究大多数患者年龄在50

80岁之间,平均年龄在64岁左右。
37.步骤五、应用t检验比较病例组冠心病阳性与对照组冠心病阴性各定量特征的差异。测试结果定性地显示了每个特征对冠心病的影响。为减少特征维数,将主成分分析pca应用于峰值收缩应变pss、应变率ssr和达峰时间tp的17个片段。
38.步骤六、通过两步堆叠法减少分类误差导致的结果错误放大。该两步堆叠法包括先堆叠提高个体的预测能力,再通过对训练集进行多次随机划分进行第二部堆叠。从而减少分类误差导致的结果错误放大。以超声心动图的特征作为输入对是否患有冠心病进行分类。由于超声心动图参数具有高度异质性和噪声,单个分类方法不能提供令人满意的结果。本研究结合多个分类方法,进行堆叠,结合所有分类的优势来获得更精确的结果。应用双样本t检验比较病例组和对照组在三层心肌中分层glps的差异。p值≤0.1表示显著差异。
39.下表所示冠心病诊断模型选择的因子特征:
[0040][0041][0042]
某一特征在病例组和对照组之间的差异越显著,冠心病对该特征的影响就更大。glps在t检验中的p值如表2

2所示。结果证实冠心病对glps值有影响。此外,对pss、ssr和tp进行了双样本t检验。由测试结果可知,pss,ssr和tp也可作为冠心病诊断的重要特征。
[0043]
测试集例数64,用来评价所提出的方法。验证集例数为72,用于训练第二步堆叠权
值。剩下288例数的集合随机分到230例的第一步训练集。第一步验证集包含58例,分别训练19个单独分类器。第一步堆叠权重10次。
[0044]
下表所示2d

ste特征t检验:
[0045][0046]
如图2所示,面板(a)显示了心尖水平、乳头肌水平和二尖瓣水平的整体长轴应变与径向应变的相关矩阵,结果显示长轴应变与径向应变之间存在较弱的相关性。图2的面板(b)显示了17个片段在pss、ssr和tp上的相关性。从相关矩阵可以看出,pss与ssr相关性较好,而tp与pss和ssr均呈弱相关。分析pss、ssr和tp的17个片段之间的相关性。
[0047]
图3显示了pss、ssr和tp中主成分的碎石图。在每个plot中,可以发现明显的“肘部”,根据这个“肘部”选择适当数量的主成分保留在模型中。
[0048]
图4分别显示了pss、ssr和tp的前3个主成分的热图。从图4还可看出(1)对于pss、ssr和tp,第一个主成分大致代表17节段的总体平均值。(2)第二个主成分代表基底/中下间隔,基底/中下,基底/中下外侧;第三个pc代表基底/中前和基底/中前外侧。(3)对于ssr,第二个pc代表基底/前中隔和基底/中下外侧;第三个pc代表基底。(4)tp第二pc代表基底/中前、基底/中前外侧、基底/中下外侧;第三个pc与第二个类似。因此,我们选择前3个pc用于pss和ssr分析,前2个用于tp分析。
[0049]
基于美国心脏学会的心脏17段模型,如图4(b)所示:(1)心尖与心尖水平高度相关;(2)对于pss,中间段的6个节段与其相邻的基底段节段高度相关;(3)对于ssr,乳头肌水平与基底水平呈弱相关;(4)tp的17个片段之间的相关性均高于pss和ssr。根据相关性研究的结果,选择分别对pss、ssr和tp进行主成分分析。
[0050]
如图4所示,(a):收缩期峰值应变、收缩期应变率和达峰时间前三个pcs中17节段的贡献热图。从左到右的列分别表示第一个pc到第三个pc,顶部行表示pss,中间行表示ssr,底部行表示tp。(b):aha17节段模型的牛眼图。
[0051]
在两步分类堆叠中,使用r

package caret构建19个分类器,每个分类器在测试集上的准确率都在70%左右。下表报告了所有分类器的准确率,其中准确率最高为71%。每个分类模型的所有参数都设置为r

package中的默认值。通过两步分类器的堆叠,利用不同机器学习模型的优势,将测试集的分类准确率从71%提高到87.7%,灵敏度为0.903,特异性为0.843,测试精度优于71%。图5显示了每个个体模型和堆叠模型的roc曲线。结果表明,个体模型的auc在0.503~0.773之间,而堆叠模型的auc为0.904,显著高于单个模型。
[0052]
下表为分类模型的准确性测试:
[0053][0054]
如图5所示,实黑线代表堆叠模型,其他彩色线分别代表上表中的每个单独的模型。对于单个模型,最高的auc是0.773,而堆叠的模型达到了0.904。
[0055]
在众多的影像技术中,超声心动图无创、方便、安全、有效,是心血管领域最有发展前途的技术之一。本发明的斑点追踪技术心动图作为一种新型的超声心动图技术,与传统的超声心动图和其他方法相比有特殊的优势。
[0056]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1