基于深度学习和放射组学的食管静脉曲张分类预测系统

文档序号:31126457发布日期:2022-08-13 03:37阅读:135来源:国知局
基于深度学习和放射组学的食管静脉曲张分类预测系统

1.本公开涉及医学图像处理相关技术领域,具体的说,是涉及基于深度学习和放射组学的食管静脉曲张分类预测系统。


背景技术:

2.本部分的陈述仅仅是提供了与本公开相关的背景技术信息,并不必然构成在先技术。
3.目前临床在鉴别有无食管静脉曲张时,主要使用内镜检查,属于有创方法。内镜检查侵袭性强,好多病人对其并不耐受。相比之下,无创检查包括磁共振成像、计算机断层扫描(computed tomography,ct)等方法。无创可减少患者的痛苦、安全、可重复性好。在目前的医学图像分类领域中,针对食管静脉曲张风险等级分类的研究较少,并存在着一些问题。
4.目前关于食管静脉曲张的分类与预测主要是利用放射组学的方法提取特征。包括三个部分,首先是特征提取得到非纹理特征和纹理特征。其次是特征选择,使用lasso、过滤式选择(relief方法)等对提取的特征降维,防止出现维度灾难。最后是分类及预测,使用多变量logistic回归、随机森林(rf)、支持向量机(svm)、xgboost和决策树等分类模型。shimaa m.abd el-salam等人提出了6种机器学习算法,包括bayes(nb)、决策树(dt)、贝叶斯网(bns)、多层感知器(mlp)、支持向量机(svm)和随机森林(rf),用于预测慢性丙型肝炎患者的静脉曲张,其中贝叶斯网络效果更准确,使用贝叶斯网算法的精度达到了68.9%。qi等人提供了一种基于放射组学的肝静脉压力梯度(hepatic venous pressure gradient,hvpg)计算模型的构建方法,为计算门脉高压患者的早期无创指标提供一种新的途径。liu等人利用肝脏和脾脏的ct和mr图像,放入已建立的cnn模型中对肝静脉压力梯度计算,通过肝脾通道加权计算csph风险,并使用网格搜索法搜索最优加权系数。但是,上述的这些方法都存在着准确率不高的问题。


技术实现要素:

5.本公开为了解决上述问题,提出了基于深度学习和放射组学的食管静脉曲张分类预测系统,将深度学习和放射组合方法结合应用到食管静脉曲张图像分类中。提取食管、脾、肝三个部位的深度特征和放射特征,得到特征后,将融合的深度特征和放射特征放入特征选择算法中,在选出各部位的最优子集后进行分类预测,大大提高了分类预测的准确性。
6.为了实现上述目的,本公开采用如下技术方案:
7.本公开第一方面提供了基于深度学习和放射组学的食管静脉曲张分类预测系统,包括:
8.分割模块,被配置为用于对获取的待测食管ct图像,按照部位对感兴趣区域分别进行逐层分割提取,获得每个部位的感兴趣区域图像;
9.特征提取模块,被配置为用于对得到的每个部位的感兴趣区域图像,分别进行深度特征和放射组学特征提取;
10.特征选择模块,被配置为用于将提取的各部位的深度特征和放射特征,采用至少两种特征选择算法进行特征选择,得到各部位的最优子集;
11.分类模块,用于将特征选择后得到的最优子集输入至多个训练好的分类模型中,融合多个分类模型的分类结果,得到图像的分类结果。
12.本公开的第二方面提供了一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成以下步骤:
13.对获取的待测食管ct图像,按照部位对感兴趣区域分别进行逐层分割提取,获得每个部位的感兴趣区域图像;
14.对得到的每个部位的感兴趣区域图像,分别进行深度特征和放射组学特征提取;
15.将提取的各部位的深度特征和放射特征,采用至少两种特征选择算法进行特征选择,得到各部位的最优子集;
16.将特征选择后得到的最优子集输入至多个训练好的分类模型中,融合多个分类模型的分类结果,得到图像的分类结果。
17.与现有技术相比,本公开的有益效果为:
18.本公开采用多个特征选择算法以及多个分类模型,形成多个分类模型来对待测ct图像进行处理,融合多个分类模型的结果,得到图像的处理结果,从而能够提高分类的准确性。
19.本公开的优点以及附加方面的优点将在下面的具体实施例中进行详细说明。
附图说明
20.构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的限定。
21.图1是根据本公开实施例1的系统框图;
22.图2是本公开实施例2的电子设备的处理器的处理方法流程图;
具体实施方式:
23.下面结合附图与实施例对本公开作进一步说明。
24.应该指出,以下详细说明都是示例性的,旨在对本公开提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本公开所属技术领域的普通技术人员通常理解的相同含义。
25.需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本公开的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。需要说明的是,在不冲突的情况下,本公开中的各个实施例及实施例中的特征可以相互组合。下面将结合附图对实施例进行详细描述。
26.实施例1
27.在一个或多个实施方式公开的技术方案中,如图1所示,基于深度学习和放射组学的食管静脉曲张分类预测系统,包括:
28.分割模块,被配置为用于对获取的待测食管ct图像,按照部位对感兴趣区域分别进行逐层分割提取,获得每个部位的感兴趣区域图像;
29.特征提取模块,被配置为用于对得到的每个部位的感兴趣区域图像,分别进行深度特征和放射组学特征提取;
30.特征选择模块,被配置为用于将提取的各部位的深度特征和放射特征,采用至少两种特征选择算法进行特征选择,得到各部位的最优子集;
31.分类模块,用于将特征选择后得到的最优子集输入至多个训练好的分类模型中,融合多个分类模型的分类结果,得到图像的分类结果。
32.本实施例中,采用多个特征选择算法以及多个分类模型,形成多个分类模型来对待测ct图像进行处理,融合多个分类模型的结果,得到图像的处理结果,从而能够提高分类的准确性。
33.进一步的技术方案,特征选择算法可以包括lasso算法、xgboost算法。
34.lasso(the least absolute shrinkage and selectionatoroperator)算法。这种算法通过构造一个惩罚函数获得一个精炼的模型:通过最终确定一些指标的系数为零,lasso算法实现了指标集合精简的目的。
35.训练分类模型,以训练后的svm、rf、xgboost分类模型对待测ct图像进行分类。
36.xgboost(xtreme gradient boosting的简称)是将许多弱分类器集成在一起形成一个强分类器,是一种提升树模型,将许多树模型集成在一起,形成一个很强的分类器。树模型具体为cart回归树模型。
37.进一步的技术方案,分类模块中的分类模型可以包括svm、rf、xgboost分类模型。
38.svm:支持向量机(英文全称:support vector machine)是一个分类算法,通过找到一个分类平面,将数据分隔在平面两侧,从而达到分类的目的。
39.rf:(random forest,简称rf)随机森林算法。rf分类模型包括多个使用了cart决策树,在决策树节点上所有的n个样本特征中选择一个最优的特征来做决策树的左右子树划分,增强了模型的泛化能力。
40.本实施例中,共有六种模型用来对食管静脉曲张进行预测:lasso+svm、xgboost+svm、lasso+rf、xgboost+rf、lasso+xgboost、xgboost+xgboost。通过多种选择算法和多种分类算法,对多个分类结果进行融合处理,能够得到更加准确的分类结构,从而能够提高分类的准确性。
41.可选的,分割模块中,获取待测的ct图像中肝、脾、食管三个部位的dicom格式图像,将图像导入影像控制软件并对图像进行逐层分割,获得食管、脾和肝每个部位的roi图像。
42.在本实施例中,所述影像控制软件可以为itk-snap 3.xteam;
43.在一些实施例中,特征提取模块包括深度学习特征提取模块和放射组学特征提取模块。
44.深度学习特征提取模块,可以采用卷积神经网络,具体的,可采用微调的resnet-50卷积神经网络。
45.所述特征选择模块中,在得到提取的深度学习特征和放射组学特征后,使用特征选择算法对提取的特征进行最优子集的选择,防止出现维度灾难。
46.其中,放射组学特征提取模块被配置为用于提取图像的纹理特征和非纹理特征。
47.分类模块中,融合方法具体为:
48.按照不同部位特征分类的准确率,分别设置不同部位特征数据分类后的分类结果的权重,加权融合每个部位分类模型的分类结果分别得到最终的分类结果。
49.具体的,按照准确率分别赋予食管、脾、肝部位的特征分类后的分类结果的权重为0.6,0.2和0.1。
50.肝脏特征的准确率(acc)《脾脏特征的准确率(acc)《食管特特征的准确率(acc),从而基于肝脏特征的分类结果的权重《基于脾脏特征的分类结果的权重《食管特特征的分类结果的权重。因此,在实施例中设置的权重分别为0.6,0.2和0.1。
51.在本实施例中,深度学习法所用软件为python软件,机器学习算法所用软件为r软件和matlab软件。
52.进一步的,还包括分类模型训练的步骤,具体如下:
53.s1、获取ct图像数据集;ct图像为dicom格式。
54.本实施例中,获取247例(115个0,132个1)的食管静脉ct图像组成的数据集;
55.s2、对获取的待测食管ct图像,按照部位对感兴趣区域分别进行逐层分割提取,获得每个部位的感兴趣区域图像。
56.具体的,可以将ct图像导入到itk-snap 3.xteam中对图像中的食管、脾和肝三个部位的区域分别进行逐层提取,得到每个部位的感兴趣区域图像;
57.s3、将得到的每个部位的感兴趣区域图像进行深度学习特征提取和放射组学特征提取。
58.可选的,深度学习特征提取使用微调的resnet-50卷积神经网络,放射组学特征提取包括纹理特征和非纹理特征的提取。深度学习特征提取从食管、脾脏和肝脏三个感兴趣区域中各提取了2048维的特征,放射组学特征提取食管、脾脏和肝脏三种图片类型的三个roi中各提取了1*1288维行向量的特征。
59.s4、将深度学习特征和放射组学特征进行特征选择,得到的最优子集并进行简单串联的特征融合,即食管、脾脏和肝脏三个部位各1288+2048=3336个特征。
60.本实施例中,利用lasso以及xgboost对3336个特征进行选择,在特征选择过程中,可以发现在筛选最优子集时,食管有效特征被保留的较多,依次是脾脏、肝脏。在分类过程中食管特征贡献有效特征多,使用食管的有效特征进行预测相较于其他两部位的准确度也会更高;
61.s5、将特征选择后得到的最优子集分别输入到xgboost特征选择方法和支持向量机(support vector machine,svm)、随机森林(random forests,rf)中进行分类预测,并确定各个分类模型的参数。
62.s6、分析各个部位特征以及组合模型分类的得到准确率,按照准确率确定各个分类模型的权重。
63.在6种模型中,如表1-3所示为三个部位特征单独输入到模型以及所有特征输入到模型中的特异性(spe)、敏感性(sen)、曲线下面积(auc)和准确率(acc)的结果对比;
64.从分类特征的部位比较:食管特征的诊断准确率高于肝、脾特征。其中,如食管平均acc为0.91,肝平均acc为0.80,肝平均acc为0.68。可以看出,食管特征比脾脏和肝脏部位
特征对食管静脉曲张的分类准确率更好,即肝脏特征的准确率(acc)《脾脏特征的准确率(acc)《食管特特征的准确率(acc)。
65.表1食管特征在6种模型中的sp、se、auc和acc
[0066][0067][0068]
表2脾特征在6种模型中的sp、se、auc和acc
[0069][0070]
表3肝特征在6种模型中的sp、se、auc和acc
[0071][0072]
表40.6:0.2:0.1权重下6种模型的sp、se、auc和acc
[0073][0074]
可以看出,从模型角度,xgboost+xgboost和其他多种机器学习方法建立的模型(lasso+svm、xgboost+svm、lasso+rf、xgboost+rf、lasso+xgboost)相比,acc、特异性、敏感性、auc优于其他模型;使用xgboost进行特征选择和分类预测的关于食管部位获得了最高的准确率为0.94,auc为0.98。因此,基于xgboost方法建立的模型得到的分类性能优于其他方法。同时在其他模型下,本实施例提出的融合策略也取得了不错的分类结果,由此可见,本研究提出的分类模型在食管静脉曲张分类方面是有效的。
[0075]
实施例2
[0076]
基于实施例1,如图2所示,本实施例提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成以下步骤:
[0077]
对获取的待测食管ct图像,按照部位对感兴趣区域分别进行逐层分割提取,获得
每个部位的感兴趣区域图像;
[0078]
对得到的每个部位的感兴趣区域图像,分别进行深度特征和放射组学特征提取;
[0079]
将提取的各部位的深度特征和放射特征,采用至少两种特征选择算法进行特征选择,得到各部位的最优子集;
[0080]
将特征选择后得到的最优子集输入至多个训练好的分类模型中,融合多个分类模型的分类结果,得到图像的分类结果。
[0081]
进一步地,特征选择算法包括lasso算法和xgboost算法。
[0082]
进一步地,分类模块中的分类模型包括支持向量机、随机森林算法模型和xgboost分类模型。
[0083]
进一步地,融合多个分类模型的分类结果的方法具体为:
[0084]
按照不同部位特征分类的准确率,分别设置不同部位特征数据分类后的分类结果的权重,加权融合每个部位分类模型的分类结果,得到最终的分类结果。
[0085]
按照不同部位特征分类的准确率,分别赋予食管、脾、肝的权重为0.6,0.2和0.1。然后加权融合每个部位分类器的分类结果分别得到六种模型的最终的分类结果。
[0086]
具体地,由于肝脏特征的准确率(acc)《脾脏特征的准确率(acc)《食管特特征的准确率(acc),从而基于肝脏特征的分类结果的权重《基于脾脏特征的分类结果的权重《食管特特征的分类结果的权重。可选的,在本实施例中设置的权重分别为0.6,0.2和0.1。
[0087]
以上所述仅为本公开的优选实施例而已,并不用于限制本公开,对于本领域的技术人员来说,本公开可以有各种更改和变化。凡在本公开的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本公开的保护范围之内。
[0088]
上述虽然结合附图对本公开的具体实施方式进行了描述,但并非对本公开保护范围的限制,所属领域技术人员应该明白,在本公开的技术方案的基础上,本领域技术人员不需要付出创造性劳动即可做出的各种修改或变形仍在本公开的保护范围以内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1