本发明涉及一种乳腺良恶性肿瘤鉴别的放射组学技术领域,特别是涉及一种基于深度学习的全数字乳腺成像图像放射组学方法。
背景技术:
近年来,大数据技术和医学影像辅助诊断的有机融合产生了新的放射组学方法,通过从医学影像中提取高维的定量特征来量化肿瘤等重大疾病,可以有效地解决难以定量评估肿瘤异质性的问题,具有重要的临床价值。
放射组学的处理流程归纳为以下部分:(1)影像数据的获取;(2)肿瘤区域的标定;(3)肿瘤区域的分割;(4)特征的提取和量化;(5)特征提取;(6)训练和测试分类器。
当前,放射组学特征种类繁多,传统的特征总体可以分为三类,即一阶,二阶及高阶特征。一阶特征通常是基于直方图分析,二阶特征描述空间分布复杂性,高阶特征常用的是小波分析等。这些传统特征虽然从影像中挖掘到很多信息来进行分析,但这只是影像中的一部分信息。因此,更准确和更科学的特征提取方法和挖掘各层信息的手段是研究的重点。
自2006年提出“深度学习”的概念以来,医疗行业对深度学习技术的使用频率显著上升。深度学习是一种数据驱动型模型,能够模拟人脑视觉机理自动学习到数据各个层次的抽象特征,从而更好地反映数据的本质特征。目前,在医学影像领域深度学习主要用于计算机辅助诊断,图像分割和特性提取等方面。
因此,针对放射组学在乳腺肿瘤鉴别方面定量图像特征涵盖信息不足,提供一种基于深度学习的全数字乳腺成像图像放射组学方法,得到肿瘤各层次的抽象特征并加入到放射组学分类器中学习,以克服现有传统特征的局限性。该方法在使用新型定量特征的同时,能保证分类器有较高的肿瘤鉴别性能和泛化能力。
因此,针对现有技术不足,提供一种基于深度学习的全数字乳腺成像图像放射组学方法以解决现有技术不足甚为必要。
技术实现要素:
本发明的目的在于避免现有技术的不足之处而提供一种基于深度学习的全数字乳腺成像图像放射组学方法,本发明充分考虑了传统特征不能完全包含各层次的乳腺良恶性肿瘤信息,通过深度学习网络,提取出包含各层次信息的特征,最终实现肿瘤良恶性鉴别。
同时,本发明使用了深度学习网络alexnet框架提取出鉴别肿瘤的图像特征,并与放射组学结合,采用随机森林中对提取出的特征进行学习,实现基于深度学习的全数字乳腺成像图像放射组学的研究。
本发明的上述目的通过如下技术手段实现。
提供一种基于深度学习的全数字乳腺成像图像放射组学方法,其特征在于:具体步骤如下:
s1、获取全数字乳腺成像图像数据μdatset;
s2、通过对全数字乳腺成像图像数据μdatset进行预处理,得到预处理数据μhdf5;
s3、将预处理数据μhdf5输入至深度学习网络alexnet中进行训练,并建立分类网络模型malexnet;
s4、再将预处理数据μhdf5输入至分类网络模型malexnet中进行特征提取,获得高维特征向量featuremap;
s5、将高维特征向量featuremap输入至随机森林rf中进行训练,得到高性能的肿瘤鉴别分类器。
具体而言的,步骤s2中的具体步骤如下:
s21、对全数字乳腺成像图像数据μdatset进行分割,得到分割后数据μpatch;
s22、对数据μpatch进行扩增操作,得到n个扩增数据μ1expand、......、μiexpand、......、μnexpand,其中1≤i≤n,i、n均为整数;
s23、对扩增数据μiexpand进行肿瘤类别标识;
s24、转换扩增数据μiexpand格式,得到预处理数据μihdf5。
优选的,步骤s3的操作方法具体如下:
将预处理数据μihdf5输入到深度学习网络alexnet中进行训练,获得包含肿瘤信息的分类模型malexnet。
具体而言的,步骤s4的具体操作方法如下:
提取预处理数据μihdf5中最后一个卷积层的高维特征向量featuremapi,将n个高维特征向量进行整合获得高维特征向量featuremap。
进一步的,步骤s5中将高维特征向量featuremap输入至随机森林rf中进行训练,获得肿瘤鉴别分类器。
进一步的,步骤s21中以全数字乳腺成像图像数据μdatset的病灶点为中心进行分割,分割出大小为572×572的分割后数据μpatch。
优选的,扩增操作是对分割后数据μpatch进行i次旋转或翻转操作,即得到扩增数据μiexpand。
进一步的,所述预处理数据的格式为hdf5格式。
具体而言的,所述深度学习网络alexnet包含5个卷积层和3个全连接层。
优选的,进行步骤s5中的随机森林rf训练后,再通过留一交叉验证法进行验证,最终获得肿瘤鉴别分类器。
本发明充分考虑了传统特征不能完全包含各层次的乳腺良恶性肿瘤信息,通过深度学习网络,提取出包含各层次信息的特征,最终实现肿瘤良恶性鉴别。
同时,本发明使用了深度学习网络alexnet框架提取出鉴别肿瘤的图像特征,并与放射组学结合,采用随机森林中对提取出的特征进行学习,实现基于深度学习的全数字乳腺成像图像放射组学的研究。
附图说明
利用附图对本发明作进一步的说明,但附图中的内容不构成对本发明的任何限制。
图1为本发明方法的流程示意图。
图2为随机森林的roc曲线和三个性能评价指标结果图。
具体实施方式
结合以下实施例对本发明作进一步描述。
实施例1。
如图1-2所示,一种基于深度学习的全数字乳腺成像图像放射组学方法,具体步骤如下:
s1、获取全数字乳腺成像图像数据μdatset。
s2、通过对全数字乳腺成像图像数据μdatset进行预处理,得到预处理数据μhdf5。
步骤s2中的具体步骤如下:
s21、对全数字乳腺成像图像数据μdatset进行分割,得到分割后数据μpatch。
步骤s21中以全数字乳腺成像图像数据μdatset的病灶点为中心进行分割,分割出大小为572×572的分割后数据μpatch。
s22、对数据μpatch进行扩增操作,得到n个扩增数据μ1expand、......、μiexpand、......、μnexpand,其中1≤i≤n,i、n均为整数。
扩增操作是对分割后数据μpatch进行i次旋转或翻转操作,即得到扩增数据μiexpand。
s23、对扩增数据μiexpand进行肿瘤类别标识。
s24、转换扩增数据μiexpand格式,得到预处理数据μihdf5。
预处理数据的格式为hdf5格式。
s3、将预处理数据μihdf5输入至深度学习网络alexnet中进行训练,并建立分类网络模型malexnet。
步骤s3的操作方法具体如下:
将预处理数据μihdf5输入到深度学习网络alexnet中进行训练,获得包含肿瘤信息的分类模型malexnet。
深度学习网络alexnet包含5个卷积层和3个全连接层,卷积层的组合形式有3种,全连接层的组合形式有2种。
s4、再将预处理数据μihdf5输入至分类网络模型malexnet中进行特征提取,获得高维特征向量featuremap。
步骤s4的具体操作方法如下:
提取预处理数据μihdf5中最后一个卷积层的高维特征向量featuremapi,将n个高维特征向量进行整合获得高维特征向量featuremap。
s5、将高维特征向量featuremap输入至随机森林rf中进行训练,得到高性能的肿瘤鉴别分类器。
步骤s5中将高维特征向量featuremap输入至随机森林rf中进行训练,获得肿瘤鉴别分类器。
进行步骤s5中的随机森林rf训练后,再通过留一交叉验证法进行验证,最终获得高性能的肿瘤鉴别分类器,以实现乳腺良恶性肿瘤的分类。
如图2所示,实验用auc、敏感性和特异性三个评价指标来评估分类器性能。图2为随机森林的roc曲线和三个性能评价指标结果。可以看出,本发明在使用基于深度学习的新型特征的同时,能得到高性能的乳腺良恶性肿瘤分类器。
经过多次验证,本发明操作简单,能够有效的解决放射组学传统的特征不能完全包含肿瘤各层次信息的问题,实现高性能的乳腺良恶性肿瘤分类器的设计。
需要说明的是,本发明所公开的模型,还可以为其他类型肿瘤鉴别所用。
本发明充分考虑了传统特征不能完全包含各层次的乳腺良恶性肿瘤信息,通过深度学习网络,提取出包含各层次信息的特征,最终实现肿瘤良恶性鉴别。
同时,本发明使用了深度学习网络alexnet框架提取出鉴别肿瘤的图像特征,并与放射组学结合,采用随机森林中对提取出的特征进行学习,实现基于深度学习的全数字乳腺成像图像放射组学的研究。
最后应当说明的是,以上实施例仅用以说明本发明的技术方案而非对本发明保护范围的限制,尽管参照较佳实施例对本发明作了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或者等同替换,而不脱离本发明技术方案的实质和范围。