一种能谱CT增强碘水图影像组学术前预测肾透明细胞癌WHO/ISUP分级方法与流程

文档序号:20192944发布日期:2020-03-27 19:50阅读:1030来源:国知局
一种能谱CT增强碘水图影像组学术前预测肾透明细胞癌WHO/ISUP分级方法与流程

本发明涉及影像医学与核医学、影像组学技术领域,具体而言,尤其涉及一种能谱ct增强碘水图影像组学术前预测肾透明细胞癌who/isup分级方法。



背景技术:

肾透明细胞癌是肾脏最常见的恶性肿瘤,其who/isup分级与预后和治疗密切相关,因此探索一种能够准确区分肿瘤核分级的方法尤其重要。目前对who/isup分级的判断依赖于术后病理组织检测,但考虑到医疗设备的限制以及手术对患者造成的创伤,术前寻找无创方法获取who/isup分级是十分必要的。既往对于肾透明细胞癌分级的影像研究常用于fuhrman分级,然而此分级系统会导致评级可重复差,且ii级与iii级的患者长期存活率没有显著性差异。既往有研究利用常规ct增强图像,通过使用机器方法预测肾透明细胞癌who/isup分级,但更多定量的影像特征尚未被充分挖掘。

能谱ct作为临床常用的影像检查手段,能够通过碘水浓度图反映组织的血供状态,但常规浓度测量忽略了肿瘤内血供的分布状态。影像组学分析是基于像素强度和空间分布特点,定量描述了组织异质性,一定程度上可作为肿瘤分子状态的潜在影像学标记物。

肾透明细胞癌who/isup分级与其疗效及预后密切相关,但其分级的检测依赖于侵入性手术或活组织检查所获取的组织样本,而肿瘤异质性限制了该样本的有效性,因为小组织样本不可能代表整个肿瘤。影像检查能够直观地涵盖整个肿块的信息,避免了因肿瘤异质性造成的差异。



技术实现要素:

根据上述提出的技术问题,而提供一种能谱ct增强碘水图影像组学术前预测肾透明细胞癌who/isup分级方法。本发明将高通量的影像组学特征与who/isup核分级信息相关联,为肾透明细胞癌分级提供一种基于放射影像组学特征的非侵袭性的可视化方法。

本发明采用的技术手段如下:

一种能谱ct增强碘水图影像组学术前预测肾透明细胞癌who/isup分级方法,包括如下步骤:

s1、收集肾癌样本图像,所述肾癌样本图像为高级别肾癌能谱ct碘水图像和低级别肾癌能谱ct碘水图像;

s2、对所述肾癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;

s3、对所述步骤s2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;

s4、计算spearman相关系数以0.95为阈值去除高相关性特征,再使用基于决策树模型的信息增益算法方法进行特征选择;

s5、构建k近邻分类器模型,采用roc方法对模型进行评价。

进一步地,所述步骤s3中的哑变量处理过程具体为:

s31、假设所述肾癌样本图像的数量为n,所述高级别肾癌能谱ct碘水图像的数量为n1,低级别肾癌能谱ct碘水图像的数量为n2,提取的图像特征为p;

s32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn;

s33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;

s34、将所述肾癌样本图像的类别与新特征相匹配,得到混淆矩阵ti;其中,高级别肾癌能谱ct碘水图像的类别为1类,低级别肾癌能谱ct碘水图像的类别为0类;

s35、根据混淆矩阵ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;

s36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk。

进一步地,所述步骤s4的具体过程如下:

s41、采用相关性分析方法降低特征之间的冗余性,引用spearman相关性分析,计算相关性系数corxy,当|corxy|≥0.95时,剔除卡方检验p值较大特征;所述计算相关性系数corxy的公式如下:

其中,numberofconcordantpairs表示在混淆矩阵tk中主对角线的和;numberofdisconcordantpairs表示在混淆矩阵tk中副对角线的和;

s42、采用基于决策树模型的信息增益算法对影像组学特征进行降维;针对肾癌样本图像的训练数据集,计算每个影像组学特征的信息增益,比较大小选择信息增益大的特征。

进一步地,所述信息增益算法具体为:

s421、计算肾癌样本图像数据集d的经验熵h(d):

其中,k表示该数据集的类别数,此处k=2;|ck|表示该属于该类ck的病例个数;

s422、根据特征a的取值将d划分为n个子集d1,d2,…,dn,计算影像组学特征a对数据集d的经验条件熵h(d|a):

其中,i表示序数号,di表示第i个子集,dik表示子集di中属于类ck的样本的集合;

s423、计算信息增益g(d,a),针对每个影像组学的信息增益,对其进行降序排列,逐步选取前m个特征,m最大值为提取的影像组学特征数

g(d,a)=h(d)-h(d|a)。

进一步地,所述步骤s5的具体过程如下:

s51、构建k近邻分类器模型,将肾癌样本图像的训练数据集输入到模型内;所述训练数据集如下:

t={(x1,y1),(x1,y1),...,(xi,yi),...,(xn,yn)}

其中,xi∈rn,为患者的影像组学特征,yi∈{c1,c2,...,ck},为肾透明细胞癌患者级别,n为样本量,xi为第i个样本,i=1,2,...,n,影像组学特征向量x;

s52、根据已经设置好的距离度量,在肾癌样本图像的训练数据集t中找出与x最邻近的k个点,设定包含该k个点的x的邻域记作nk(x);

s53、在nk(x)中根据分类决策定律决定x的类别y:

其中,i为指示函数,即当yi=cj时,i为1,否则i为0;

s54、采用roc方法进行模型评价,得出auc值。

较现有技术相比,本发明具有以下优点:

1、本发明提供的能谱ct增强碘水图影像组学术前预测肾透明细胞癌who/isup分级方法,将高通量的影像组学特征与who/isup核分级信息相关联,为肾透明细胞癌分级提供一种基于放射影像组学特征的非侵袭性的可视化方法。

2、本发明提供的能谱ct增强碘水图影像组学术前预测肾透明细胞癌who/isup分级方法,对影像组学特征进行哑变量处理后模型的效果较优,具有较高的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明方法流程图。

图2为本发明实施例提供的roc曲线图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例

如图1所示,本发明提供了一种能谱ct增强碘水图影像组学术前预测肾透明细胞癌who/isup分级方法,包括如下步骤:

s1、收集肾癌样本图像,所述肾癌样本图像为高级别肾癌能谱ct碘水图像和低级别肾癌能谱ct碘水图像;

s2、对所述肾癌样本图像进行感兴趣区域勾画,提取感兴趣区域的图像特征;

s3、对所述步骤s2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;

进一步地,作为本发明优选的实施方式

步骤s3中的哑变量处理过程具体为:

s31、假设所述肾癌样本图像的数量为n,所述高级别肾癌能谱ct碘水图像的数量为n1,低级别肾癌能谱ct碘水图像的数量为n2,提取的图像特征为p;

s32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn;

s33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;

s34、将所述肾癌样本图像的类别与新特征相匹配,得到混淆矩阵ti;其中,高级别肾癌能谱ct碘水图像的类别为1类,低级别肾癌能谱ct碘水图像的类别为0类;

s35、根据混淆矩阵ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;

s36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk。

s4、计算spearman相关系数以0.95为阈值去除高相关性特征,再使用基于决策树模型的信息增益算法方法进行特征选择;

进一步地,作为本发明优选的实施方式

步骤s4的具体过程如下:

s41、采用相关性分析方法降低特征之间的冗余性,引用spearman相关性分析,计算相关性系数corxy,当|corxy|≥0.95时,剔除卡方检验p值较大特征;所述计算相关性系数corxy的公式如下:

其中,numberofconcordantpairs表示在混淆矩阵tk中主对角线的和;numberofdisconcordantpairs表示在混淆矩阵tk中副对角线的和;

s42、采用基于决策树模型的信息增益算法对影像组学特征进行降维;针对肾癌样本图像的训练数据集,计算每个影像组学特征的信息增益,比较大小选择信息增益大的特征。

进一步地,作为本发明优选的实施方式

所述信息增益算法具体为:

s421、计算肾癌样本图像数据集d的经验熵h(d):

其中,k表示该数据集的类别数,此处k=2;|ck|表示该属于该类ck的病例个数;

s422、根据特征a的取值将d划分为n个子集d1,d2,…,dn,计算影像组学特征a对数据集d的经验条件熵h(d|a):

其中,i表示序数号,di表示第i个子集,dik表示子集di中属于类ck的样本的集合;

s423、计算信息增益g(d,a),针对每个影像组学的信息增益,对其进行降序排列,逐步选取前m个特征,m最大值为提取的影像组学特征数

g(d,a)=h(d)-h(d|a)。

s5、构建k近邻分类器模型,采用roc方法对模型进行评价。

进一步地,作为本发明优选的实施方式

步骤s5的具体过程如下:

s51、构建k近邻分类器模型,将肾癌样本图像的训练数据集输入到模型内;所述训练数据集如下:

t={(x1,y1),(x1,y1),...,(xi,yi),...,(xn,yn)}

其中,xi∈rn,为患者的影像组学特征,yi∈{c1,c2,...,ck},为肾透明细胞癌患者级别,n为样本量,xi为第i个样本,i=1,2,...,n,影像组学特征向量x;

s52、根据已经设置好的距离度量,在肾癌样本图像的训练数据集t中找出与x最邻近的k个点,设定包含该k个点的x的邻域记作nk(x);

s53、在nk(x)中根据分类决策定律决定x的类别y:

其中,i为指示函数,即当yi=cj时,i为1,否则i为0;

s54、采用roc方法进行模型评价,得出auc值,随后采用delong’stest对roc进行显著性检验以评价auc统计学意义。如图2所示,为本实施例提供的roc曲线图,进而得出roc曲线下面积auc值;与表1roc曲线下auc值及其诊断效果做对比。

表1roc曲线下auc值及其诊断效果

研究的结论为对影像组学特征进行哑变量化后模型的效果较优,具有较高的准确性。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1