一种基于前列腺癌和前列腺增生的磁共振扩散加权图像影像组学特征处理方法与流程

文档序号:20191977发布日期:2020-03-27 19:45阅读:287来源:国知局
一种基于前列腺癌和前列腺增生的磁共振扩散加权图像影像组学特征处理方法与流程

本发明涉及影像医学与核医学、影像组学技术领域,具体而言,尤其涉及一种基于前列腺癌和前列腺增生的磁共振扩散加权图像影像组学特征处理方法。



背景技术:

前列腺癌(prostaticcarcinoma,pca)是男性第二常见的肿瘤,也是男性癌症死亡的主要原因,常合并前列腺增生(benignprostatichyperplasia,bph),在临床上,二者早期临床症状往往相似,而治疗及预后却完全不同,因此,早期发现和诊断有很重要的临床意义。mr因其具有较高的软组织分辨率、多参数及多平面成像、无创等优点,已成为前列腺检查的首选方法。常规前列腺mr成像对于诊断pca有提示作用,但易受出血、坏死等影响,逐渐被功能成像所替代。磁共振扩散加权成像(diffusion-weightedimaging,dwi)在前列腺占位病变诊断与鉴别诊断、治疗及预后方面都有很好的应用。影像组学是利用自动化高通量的数据特征提取算法将影像数据转化为具有高分辨率的可挖掘的影像特征数据。目前研究发现,影像组学数据可以判断组织特性、对治疗的反应,并预测患者的预后。

pca自然病程长,个体间特性差异大,其预后及治疗主要取决于早期诊断及分期。临床实践中,患者本身存在个体化差异,肿瘤又存在异质性,为了取得临床疗效、不良反应和治疗成本之间的平衡,通过基因组学、蛋白组学的各项技术在基因、分子、蛋白层面分析肿瘤的生物学特征,从而来指导临床个体化治疗得到了广泛应用。但是,这些技术的金标准检测往往需要穿刺活检或侵入性操作,而得到的组织只是肿瘤的小部分,不能实时地、完整地反应肿瘤全貌,同时也不宜反复操作。影像学检查方法贯穿了临床病例的诊断、治疗、随诊等全过程,是一种无创的、可多次使用的手段,并且它可以提供人体组织器官的整体特点。影像组学是在已有的影像学资料基础上,应用软件进行计算、分析,进而为临床诊断及治疗提供更多的参考信息。



技术实现要素:

根据上述提出的技术问题,而提供一种基于前列腺癌和前列腺增生的磁共振扩散加权图像影像组学特征处理方法。本发明基于前列腺dwi影像组学方法提取的特征,能够很好地鉴别pca与bph,可以客观、定量评估肿瘤的异质性,成为一种非侵袭性且有效的诊断工具。

本发明采用的技术手段如下:

一种基于前列腺癌和前列腺增生的磁共振扩散加权图像影像组学特征处理方法,包括如下步骤:

s1、收集前列腺疾病的磁共振扩散加权样本图像,包括前列腺癌的磁共振扩散加权图像和前列腺增生的磁共振扩散加权图像;

s2、对所述前列腺癌和前列腺增生的磁共振扩散加权图像进行感兴趣区域勾画,提取区域内的图像特征;

s3、对所述步骤s2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;

s4、计算spearman相关系数以0.95为阈值去除高相关性特征,再采用支持向量机递归特征消除方法进行特征选择;

s5、采用logisticsregression分类器对所述步骤s4中的组学特征选择的方式进行组合,将选择后的特征输入模型构建l1正则化logistic回归模型,通过5折交叉验证技术进行参数调整,得到l1正则化logistic回归模型的损失函数,当所述损失函数最小时,由于是l1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;

s6、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过最小化模型损失函数原则,最优化得到l2正则化logistic回归模型,并采用roc方法对l2正则化logistic回归模型进行评价。

进一步地,所述步骤s3中的哑变量处理过程具体为:

s31、假设所述前列腺疾病的磁共振扩散加权样本图像的数量为n,所述前列腺癌的磁共振扩散加权图像的数量为n1,前列腺增生的磁共振扩散加权图像的数量为n2,提取的图像特征为p;

s32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn;

s33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;

s34、将所述前列腺疾病的磁共振扩散加权样本图像的类别与新特征相匹配,得到混淆矩阵ti;其中,前列腺癌的磁共振扩散加权图像的类别为1类,前列腺增生的磁共振扩散加权图像的类别为0类;

s35、根据混淆矩阵ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;

s36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk。

进一步地,所述步骤s4的具体过程如下:

s41、采用相关性分析方法降低特征之间的冗余性,引用spearman相关性分析,计算相关性系数corxy,当corxy≥0.95时,剔除卡方检验p值较大的特征;所述计算相关性系数corxy的公式如下:

其中,numberofconcordantpairs表示在混淆矩阵tk中主对角线的和;numberofdisconcordantpairs表示在混淆矩阵tk中副对角线的和;

s42、采用支持向量机递归特征消除方法进行特征选择,具体如下:

s421、假设前列腺疾病的磁共振扩散加权样本图像数据集为:

t={(x1,y1),(x1,y1),...,(xi,yi),...,(xn,yn)}

其中,xi∈rd,yi∈{-1,+1},n为样本量,xi为第i个样本,d为影像组学特征数,s={1,2,...,d}为原始特征集合,svm模型的切分面为:

ω·x+b=0

其中,ω为法向量,b为截距;

s422、优化svm模型:

s.t.yi(ω·xi+b)≥1-ξi,i=1,2,...,n

ξi≥0,i=1,2,...,n

其中,c为惩罚参数,b为截距,ξi为松弛变量;

s423、将原始问题转化为对偶问题:

0≤αi≤c,i=1,2,...,n

其中,αi为拉格朗日乘子,解出:

第i个影像组学特征的排序准则得分的定义为:

s424、循环执行ci过程直到s为空集,再找出排序最小的组学特征p=argminkck后,更新特征集r={p,r},在原始特征集合中删去该特征p,剩下的s`=s/p即为新的特征集合。

进一步地,所述l1正则化logistic回归模型的损失函数具体为:

其中,n为前列腺疾病的磁共振扩散加权样本图像的个数,β为具有统计学意义的组学特征的权重,||β||1为其l1范数,即||β||1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,x(i)为第i个前列腺疾病的磁共振扩散加权样本图像的特征组,y(i)为第i个前列腺疾病的磁共振扩散加权样本图像的前列腺疾病类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。

进一步地,所述采用roc方法对l2正则化logistic回归模型进行评价的具体过程如下:

s61、假设所述前列腺疾病的磁共振扩散加权样本图像的数量为n,所述前列腺癌的磁共振扩散加权图像的数量为n1,前列腺增生的磁共振扩散加权图像的数量为n2,降维处理后的组学特征数量为m;

s62、根据m个降维处理后的组学特征,构建l2正则化logistic回归模型并对其进行内部验证,得到每个前列腺疾病的磁共振扩散加权样本图像中属于前列腺癌的磁共振扩散加权图像的概率p;

s63、对p中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;

s64、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;

s65、将所述前列腺疾病的磁共振扩散加权样本图像的类别与新特征p”相匹配,得到混淆矩阵ti’;其中,前列腺癌的磁共振扩散加权图像的类别为1类,前列腺增生的磁共振扩散加权图像的类别为0类;

s66、根据混淆矩阵ti’,计算出与其对应的敏感度sensitivityi’、特异度specificityi’以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);

s67、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;

s68、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到roc曲线,进而得出roc曲线下面积auc值;

s69、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。

较现有技术相比,本发明具有以下优点:

1、本发明提供的基于前列腺癌和前列腺增生的磁共振扩散加权图像影像组学特征处理方法,基于前列腺dwi影像组学方法提取的特征,能够很好地鉴别pca与bph,可以客观、定量评估肿瘤的异质性,成为一种非侵袭性且有效的诊断工具。

2、本发明提供的基于前列腺癌和前列腺增生的磁共振扩散加权图像影像组学特征处理方法,对影像组学特征进行哑变量处理后模型的效果较优,具有较高的准确性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明方法流程图。

图2为本发明实施例提供的roc曲线图。

具体实施方式

为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。

需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

实施例

如图1所示,本发明提供了一种基于前列腺癌和前列腺增生的磁共振扩散加权图像影像组学特征处理方法,包括如下步骤:

s1、收集前列腺疾病的磁共振扩散加权样本图像,包括前列腺癌的磁共振扩散加权图像和前列腺增生的磁共振扩散加权图像;

s2、对所述前列腺癌和前列腺增生的磁共振扩散加权图像进行感兴趣区域勾画,提取区域内的图像特征;

s3、对所述步骤s2中提取的图像特征进行哑变量处理,生成一个取值为0或1的哑变量特征;

进一步地,作为本发明优选的实施方式

所述步骤s3中的哑变量处理过程具体为:

s31、假设所述前列腺疾病的磁共振扩散加权样本图像的数量为n,所述前列腺癌的磁共振扩散加权图像的数量为n1,前列腺增生的磁共振扩散加权图像的数量为n2,提取的图像特征为p;

s32、对p中的n个取值p1,...,pn进行由小至大排序,得到q1,...,qn;

s33、设置普通阈值cutoffi,且令cutoffi=qi;对qi进行离散化,令大于cutoffi的取值为1;反之,小于cutoffi的取值为0,得到新特征p’;

s34、将所述前列腺疾病的磁共振扩散加权样本图像的类别与新特征相匹配,得到混淆矩阵ti;其中,前列腺癌的磁共振扩散加权图像的类别为1类,前列腺增生的磁共振扩散加权图像的类别为0类;

s35、根据混淆矩阵ti,计算出与其对应的敏感度sensitivityi、特异度specificityi以及和值senspei,且令:和值=敏感度+特异度;

s36、计算所有和值中的最大值,即senspek=maxsenspei,得出对应的k值、混合矩阵tk、cutoffk、sensitivityk、specificityk以及取值为0或1的哑变量特征qk。

s4、计算spearman相关系数以0.95为阈值去除高相关性特征,再采用支持向量机递归特征消除方法进行特征选择;

进一步地,作为本发明优选的实施方式

所述步骤s4的具体过程如下:

s41、采用相关性分析方法降低特征之间的冗余性,引用spearman相关性分析,计算相关性系数corxy,当|corxy|≥0.95时,剔除卡方检验p值较大的特征;所述计算相关性系数corxy的公式如下:

其中,numberofconcordantpairs表示在混淆矩阵tk中主对角线的和;numberofdisconcordantpairs表示在混淆矩阵tk中副对角线的和;

s42、采用支持向量机递归特征消除方法进行特征选择,具体如下:

s421、假设前列腺疾病的磁共振扩散加权样本图像数据集为:

t={(x1,y1),(x1,y1),...,(xi,yi),...,(xn,yn)}

其中,xi∈rd,yi∈{-1,+1},n为样本量,xi为第i个样本,d为影像组学特征数,s={1,2,...,d}为原始特征集合,svm模型的切分面为:

ω·x+b=0

其中,ω为法向量,b为截距;

s422、优化svm模型:

s.t.yi(ω·xi+b)≥1-ξi,i=1,2,...,n

ξi≥0,i=1,2,...,n

其中,c为惩罚参数,b为截距,ξi为松弛变量;

s423、将原始问题转化为对偶问题:

0≤αi≤c,i=1,2,...,n

其中,αi为拉格朗日乘子,解出:

第i个影像组学特征的排序准则得分的定义为:

s424、循环执行ci过程直到s为空集,再找出排序最小的组学特征p=argminkck后,更新特征集r={p,r},在原始特征集合中删去该特征p,剩下的s`=s/p即为新的特征集合。

s5、采用logisticsregression分类器对所述步骤s4中的组学特征选择的方式进行组合,将选择后的特征输入模型构建l1正则化logistic回归模型,通过5折交叉验证技术进行参数调整,得到l1正则化logistic回归模型的损失函数,当所述损失函数最小时,由于是l1正则化,则部分过滤后的组学特征的权重将降至0值,将其剔除得出特征降维结果;

进一步地,作为本发明优选的实施方式

所述l1正则化logistic回归模型的损失函数具体为:

其中,n为前列腺疾病的磁共振扩散加权样本图像的个数,β为具有统计学意义的组学特征的权重,||β||1为其l1范数,即||β||1=|β1|+|β2|+...+|βp|,lnl为对数似然函数,x(i)为第i个前列腺疾病的磁共振扩散加权样本图像的特征组,y(i)为第i个前列腺疾病的磁共振扩散加权样本图像的前列腺疾病类别,λ为联系惩罚项与损失数的权重参数,λ的不同取值将产生不同的损失值。

s6、基于机器学习方法的最优化理论,引入5折交叉验证技术,通过最小化模型损失函数原则,最优化得到l2正则化logistic回归模型,并采用roc方法对l2正则化logistic回归模型进行评价。

进一步地,作为本发明优选的实施方式

所述采用roc方法对l2正则化logistic回归模型进行评价的具体过程如下:

s61、假设所述前列腺疾病的磁共振扩散加权样本图像的数量为n,所述前列腺癌的磁共振扩散加权图像的数量为n1,前列腺增生的磁共振扩散加权图像的数量为n2,降维处理后的组学特征数量为m;

s62、根据m个降维处理后的组学特征,构建l2正则化logistic回归模型并对其进行内部验证,得到每个前列腺疾病的磁共振扩散加权样本图像中属于前列腺癌的磁共振扩散加权图像的概率p;

s63、对p中的n个取值p1’,...,pn’进行由小至大排序,得到q1’,...,qn’;

s64、设置普通阈值cutoffi’,且令cutoffi'=q'i;令大于cutoffi’的取值为1;小于cutoffi’的取值为0,得到新特征p”;

s65、将所述前列腺疾病的磁共振扩散加权样本图像的类别与新特征p”相匹配,得到混淆矩阵ti’;其中,前列腺癌的磁共振扩散加权图像的类别为1类,前列腺增生的磁共振扩散加权图像的类别为0类;

s66、根据混淆矩阵ti’,计算出与其对应的敏感度sensitivitiy'、特异度specificityi’以及和值senspei’,且令:和值=敏感度+特异度,同时得到n个敏感度与特异度的组合点(sensitivityi’,specificityi’);

s67、根据所述的n个敏感度与特异度的组合点,以1-specificityi’为横坐标,sensitivityi’为纵坐标,勾画散点图;

s68、将n个敏感度与特异度的组合点与端点(0,0)、(1,1)依次连接,得到roc曲线,如图2所示,为本实施例提供的roc曲线图,进而得出roc曲线下面积auc值;与表1roc曲线下auc值及其诊断效果做对比。

s69、计算所有和值中的最大值,即senspek'=maxsenspei',得出对应的k值、混合矩阵tk'、cutoffk'、sensitivityk'、specificityk'以及取值为0或1的哑变量特征qk'。

本实施例中,分别对训练数据集、验证集进行模型构建、验证。采用roc方法对上述模型进行评价,得出auc值,随后采用delong’stest对roc进行显著性检验以评价auc统计学意义。

表1roc曲线下auc值及其诊断效果

研究的结论为对影像组学特征进行哑变量化后模型的效果较优,具有较高的准确性。

最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的范围。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1