一种宫颈麟癌影像组学分析方法及预测模型的构建与流程

文档序号:26050673发布日期:2021-07-27 15:25阅读:220来源:国知局
一种宫颈麟癌影像组学分析方法及预测模型的构建与流程

本发明涉及影像技术领域,具体为一种宫颈麟癌影像组学分析方法及预测模型的构建。



背景技术:

宫颈癌是临床常见的恶性肿瘤之一,近年来其发病率和死亡率迅速上升,发病率居妇科恶性肿瘤第四位,严重威胁妇女的生命安全。国际癌症研究机构估计,2018年全球新发宫颈癌病例57万和死亡31.1万余。宫颈癌最常见的病理类型是鳞癌(cervicalsquamouscellcarcinoma),约占75%-80%。分化不良的鳞状细胞癌具有高度侵袭性特征,易发生局部浸润和远处转移,随着肿瘤病理学分级的增加,患者的复发率和死亡率明显上升。目前国际上对于宫颈癌分期主要采用figo分期系统,分期iib以上的肿瘤多采用非手术治疗无法获取其全面的病理结果,另外该评分系统存在主观性强的局限性,影响肿瘤分期评估。临床上亦采用阴道镜下多次穿刺活检来确诊宫颈癌病理分化,该方法容易受到病灶大小、操作经验等因素的影响,导致穿刺的病理结果与手术切除的结果存在一定差异。

核磁共振成像(mri)是宫颈癌诊断、分期和评估治疗效果的主要检查方式。常规的mr序列包括t2加权成像(t2weightedimaging,t2wi)和扩散加权成像(diffusionweightedimaging,dwi)成像,它们只能反映病变的形态学特征和水分子的运动情况,无法对肿瘤的分化程度进行评估。可见,目前临床上常规mri成像存在一定的短板。因此,构建一种客观、高效的宫颈癌术前分化程度评估方法,对于患者治疗方案的制定和预后评估均具有重要的指导意义。



技术实现要素:

本发明的目的在于提供一种宫颈麟癌影像组学分析方法及预测模型的构建,以解决上述背景技术中提出的常规的mr序列包括t2加权成像和扩散加权成像成像,它们只能反映病变的形态学特征和水分子的运动情况,无法对肿瘤的分化程度进行评估的问题。

为实现上述目的,本发明提供如下技术方案:一种宫颈麟癌影像组学分析方法及预测模型的构建,该宫颈麟癌影像组学分析方法及预测模型的构建包括如下步骤:

s1:纳入排除研究对象:纳入宫颈鳞癌患者为研究对象,年龄27-70岁,中位年龄50岁,按照一定的标准对研究对象进行纳入以及排除,分为高低两个分化组,再按照7:3比例随机分配到训练组和测试组;

s2:图像勾画:采用ge磁共振扫描仪检查,行mr平扫、dwi及增强检查,并对扫描图像进行处理后导入图像处理软件,由放射科医师医生a在不知道病理结果情况下对肿瘤区域进行逐层手动勾勒,再由医生b进行手动勾画,相隔两周后,医生a再次进行图像分割、特征提取;

s3:纹理特征提取及标签建立:将原始图像和分割后的肿瘤roi文件同时导入ak软件,提取图像特征参数并分类,进行z-score归一化处理,以消除每个特性的单元限制,标准化处理后进行降维筛选,最终得到与宫颈鳞癌分化程相关影像组学纹理特征;

s4:统计分析:采用r软件进行最小绝对收缩和选择算子计算,建立预测模型,按7:3的比例病灶作为训练组和试验组,在训练组中进行特征选择和模型构建。

优选的,所述步骤s1中的纳入标准为

a1:经手术病理确诊为宫颈鳞状细胞癌;

a2:mr检查前未接受过宫颈癌治疗;

a3:肿瘤直径>0.5cm。

优选的,所述步骤s1中的排除标准为

b1:术前行放疗、化疗、激素治疗等患者;

b2:因运动伪影导致图像质量差或磁共振扫描参数不一致者;

b3:有肝脏、肺、脑、骨等远隔脏器转移者。

优选的,所述步骤s3中的图像处理以dicom格式导入图像处理软件itk-snap。

优选的,所述步骤s3图像特征参数分类可分为一阶直方图特征、灰度共生矩阵、运行长度矩阵和灰度区域矩阵。

优选的,所述步骤s4中的特征选择和模型构建的方法为:首先使用spearman的方法计算特征参数之间的冗余度,如果相关性大于0.9,则保留其中一个特征参数,随后,利用套索对特征进行了降维,所选特征参数基于logistic回归方法建立预测模型,得到放射组学特征,根据训练组和试验组的lasso系数对所选特征进行加权,定义为低分化宫颈癌的风险评分,roc曲线分析的曲线下面积来量化rad-score的预测准确性,准确度、特异性、灵敏度和曲线下面积等参数评价模型的预测性能,roc曲线越接近左上角,auc值越大,该分类器预测效果越好,采用箱式图观察训练组和测试组宫颈癌低分化和高分化两组影像组学标签分数值分布的差异性。

与现有技术相比,本发明的有益效果是:本发明基于磁共振序列构建的影像组学模型能预测宫颈鳞癌的组织分化程度,且联合多序列的预测模型预测效能最佳,可为cscc个性化治疗和预后评价提供客观依据。

附图说明

图1为本发明分析方法及预测模型的构建流程框图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供一种宫颈麟癌影像组学分析方法及预测模型的构建,基于磁共振序列构建的影像组学模型能预测宫颈鳞癌的组织分化程度,且联合多序列的预测模型预测效能最佳,可为cscc个性化治疗和预后评价提供客观依据,请参阅图1,

该宫颈麟癌影像组学分析方法及预测模型的构建包括如下步骤:

s1:纳入排除研究对象:纳入宫颈鳞癌患者为研究对象,年龄27-70岁,中位年龄50岁,按照一定的标准对研究对象进行纳入以及排除,分为高低两个分化组,再按照7:3比例随机分配到训练组和测试组;

纳入标准为

a1:经手术病理确诊为宫颈鳞状细胞癌;

a2:mr检查前未接受过宫颈癌治疗;

a3:肿瘤直径>0.5cm;

排除标准为

b1:术前行放疗、化疗、激素治疗等患者;

b2:因运动伪影导致图像质量差或磁共振扫描参数不一致者;

b3:有肝脏、肺、脑、骨等远隔脏器转移者

s2:图像勾画:采用ge磁共振扫描仪检查,行mr平扫、dwi及增强检查,并对扫描图像进行处理后导入图像处理软件,由放射科医师医生a在不知道病理结果情况下对肿瘤区域进行逐层手动勾勒,再由医生b进行手动勾画,相隔两周后,医生a再次进行图像分割、特征提取,图像处理以dicom格式导入图像处理软件itk-snap;

s3:纹理特征提取及标签建立:将原始图像和分割后的肿瘤roi文件同时导入ak软件,提取图像特征参数并分类,进行z-score归一化处理,以消除每个特性的单元限制,标准化处理后进行降维筛选,最终得到与宫颈鳞癌分化程相关影像组学纹理特征,图像特征参数分类可分为一阶直方图特征、灰度共生矩阵、运行长度矩阵和灰度区域矩阵;

s4:统计分析:采用r软件进行最小绝对收缩和选择算子计算,建立预测模型,按7:3的比例病灶作为训练组和试验组,在训练组中进行特征选择和模型构建,特征选择和模型构建的方法为,首先使用spearman的方法计算特征参数之间的冗余度,如果相关性大于0.9,则保留其中一个特征参数,随后,利用套索对特征进行了降维,所选特征参数基于logistic回归方法建立预测模型,得到放射组学特征,根据训练组和试验组的lasso系数对所选特征进行加权,定义为低分化宫颈癌的风险评分,roc曲线分析的曲线下面积来量化rad-score的预测准确性,准确度、特异性、灵敏度和曲线下面积等参数评价模型的预测性能,roc曲线越接近左上角,auc值越大,该分类器预测效果越好,采用箱式图观察训练组和测试组宫颈癌低分化和高分化两组影像组学标签分数值分布的差异性。

实施例

该宫颈麟癌影像组学分析方法及预测模型的构建包括如下步骤:

s1:纳入排除研究对象:纳入排除研究对象:纳入宫颈鳞癌患者为研究对象,年龄27-70岁,中位年龄50岁,按照一定的标准对研究对象进行纳入以及排除,最终纳入宫颈鳞癌患者104例,其中低分化组52例,高分化组52例,将纳入研究的病例按照7:3比例随机分配到训练组和测试组,基线资料包括年龄、性别、身高、体重和术前1周内的肿瘤指标ca125、癌胚抗原、角蛋白抗原,纳入标准为a1:经手术病理确诊为宫颈鳞状细胞癌;a2:mr检查前未接受过宫颈癌治疗;a3:肿瘤直径>0.5cm;排除标准为b1:术前行放疗、化疗、激素治疗等患者;b2:因运动伪影导致图像质量差或磁共振扫描参数不一致者;b3:有肝脏、肺、脑、骨等远隔脏器转移者;

s2:检查:所有患者均采用ge磁共振扫描仪检查,行mr平扫、dwi及增强检查,图像处理以dicom格式导入图像处理软件,由1名有10年盆腔影像诊断经验的放射科医师(医生a)在不知道病理结果情况下对肿瘤区域(regionofinterst,roi)进行逐层手动勾勒,roi应尽可能包括整个肿瘤,同时避开周边水肿区域,为验证影像组学特征提取的再现性及重复性,随机选取30例训练集数据由另一名12年盆腔影像诊断经验的医生b进行手动勾画,相隔两周后,医生a对上述30例病例再次进行图像分割、特征提取,计算组内相关系数(interclasscorrelationcoef'ficient,icc),评价同一医生不同时间以及两名医生测量结果的一致性,icc>=0.81时认为一致性好;

s3:纹理特征提取及标签建立:将原始图像和分割后的肿瘤roi文件同时导入ak软件(人工智能),工具包v3.0.0r,(gehealthcare)(12,13),共提取396个定量图像特征参数,包括4类:一阶直方图特征(包括均值、方差、均匀性、偏度、峰度、能量熵)、灰度共生矩阵(glcm)、运行长度矩阵(rlm)和灰度区域矩阵(glszm),对所有患者的组学特征进行z-score归一化处理,以消除每个特性的单元限制在使用机器学习模型用于分类统计分析,标准化处理后应用最小绝对收缩与选择子算法(leastabsoluteshrinkageandselectionoperator,lasso)与10折交叉法进行降维筛选,最终得到与宫颈鳞癌分化程相关(系数非0)影像组学纹理特征,分别为1个直方图特征、5个灰度共生矩阵、7个灰度游程矩阵和1个灰度区域大小矩阵,f(x)=(xm/s),其中x是功能的价值,m表示这个特性的平均值为所有病人群,和s代表相应的标准差;

s4:统计分析:所有统计分析均采用r(版本:3.4.4)软件,采用r软件中的“glmmet”软件包进行最小绝对收缩和选择算子(lasso)计算,使用“stats”软件包进行logistic回归来建立预测模型,按7:3的比例选取74个病灶作为训练组,30个病灶作为试验组,在训练组中进行特征选择和模型构建,首先使用spearman的方法计算特征参数之间的冗余度,如果相关性大于0.9,则保留其中一个特征参数,随后,利用套索对特征进行了降维,所选特征参数基于logistic回归方法建立预测模型,得到放射组学特征(rad-score),根据训练组和试验组的lasso系数对所选特征进行加权,定义为低分化宫颈癌的风险评分,roc曲线分析的曲线下面积(areaunderthecurve,auc)来量化rad-score的预测准确性,准确度、特异性、灵敏度和曲线下面积等参数评价模型的预测性能),roc曲线越接近左上角,auc值越大,该分类器预测效果越好,采用箱式图观察训练组和测试组宫颈癌低分化和高分化两组影像组学标签分数值分布的差异性。

将纳入研究的52例低分化宫颈鳞癌和52例高分化宫颈鳞癌患者按照7:3比例随机被分成在训练组和测试组。训练组共74例,其中低分化37例、高分化37例,测试组30例,其中低分化15例、高分化15例患者。训练组和测试组临床基线资料包括年龄、ca125、癌胚抗原(cea)、角蛋白抗原(scc)和淋巴结有无转移无统计学差异(p均>0.05),a医生两次分割结果的icc为0.820-0.915;a、b两个医生组间icc值为0.850-0.925;可见图像分割在组内及组间具有较好的一致性;其重复性及再现性能满足研究需要,利用ak影像组学软件共提取396个特征,运用lasso与10折交叉验证法进行降维筛选,最终得到15个与宫颈鳞癌分化程度相关的(系数非0)的影像组学纹理特征,包括1个直方图特征、6个灰度共生矩阵、7个灰度游程矩阵和1个灰度区域大小矩阵,通过对15个特征进行线性组合,构建出影像组学标签,采用logistic回归分析方法建立预测术前宫颈癌分化程度的模型。每一例患者影像组学标签分数值的分布状态显示在训练组和测试组中的低分化和高分化的差异具有统计学意义(p均<0.001),t2模型在训练组和测试组中的曲线下面积为分别为0.810和0.791,准确率分别为77.0%和76.7%;敏感度分别为72.9%和73.3%;特异性分别为81.1%和80.0%;dwi模型在训练组和测试组中的曲线下面积为分别为0.732和0.724,准确率分别为71.6%和73.3%;敏感度分别为89.2%和86.7%;特异性分别为54.1%和76.7%;联合t2和dwi模型在训练组和测试组中的曲线下面积为分别为0.841和0.822,准确率分别为79.7%和80.0%,敏感度分别为62.2%和73.3%;特异性分别为97.3%和80.0%;因此模型在训练组和测试组中都表现出了良好的预测性能。随后我们使用delong检验对三种预测模型预测性能进行了两两比较,结果显示三种预测模型各自的预测性能之间并不具有明显的差异(p>0.05)。在训练组和测试组中,联合t2和dwi模型在训练组和测试组中的曲线下面积为分别为0.841和0.822,准确性分别为79.7%和76.7%,特异度分别为97.3%和80.0%,均高于t2模型、dwi模型。综合而言,无论是使用t2模型还是dwi,对高低分化程度宫颈鳞癌都能预测,将两种模型联合起来进行预测则能够进一步提高预测模型的预测准确度和特异度,鳞癌是宫颈癌最常见的病理类型,而不同的宫颈鳞癌病理分级的治疗方法选择和治疗疗效不同。本次研究构建了四种模型预测宫颈癌病理分化程度。基于年龄、ca125,cea、scc、ln建立的临床模型对鉴别宫颈鳞癌高、低分化无统计学差异,但基于t2wi和dwi影像构建的三种mri组学模型(t2wi模型、dwi模型和t2wi+dwi联合模型)在宫颈鳞癌的分化程度的鉴别中均具有良好的鉴别性能,其预测模型的公式为radscore=0.033*t2_longrunhighgreylevelemphasis_alldirection_offset7_sd+1.542*t2_clustershade_angle45_offset7+-0.309*dwi_haralickcorrelation_alldirection_offset7+-0.894*t2_percentile15+-0.321*dwi_haralickcorrelation_alldirection_offset7_sd+-0.614*dwi_shortrunhighgreylevelemphasis_alldirection_offset4_sd+0.538*dwi_longrunhighgreylevelemphasis_angle135_offset7+0.947*dwi_clustershade_angle45_offset7+-0.431*t2_shortrunhighgreylevelemphasis_alldirection_offset7_sd+0.257*t2_shortrunhighgreylevelemphasis_angle0_offset7+-0.059*t2_glcmenergy_angle90_offset7+-0.146*dwi_correlation_alldirection_offset7_sd+-0.617*t2_highgreylevelrunemphasis_alldirection_offset4_sd+-0.823*dwi_shortrunhighgreylevelemphasis_alldirection_offset7_sd+-1.355*dwi_smallareaemphasis+0.464,其中联合模型在训练集和验证集的auc值最高,分别为0841和0.822;此外,联合模型在训练组和测试组中的预测准确性、特异度、阳性预测值亦高于其它两种模型(训练组:79.7%、97.3%、95.8%;测试组76.7%、80.0%、78.6%),表现出良好且较全面的预测性能。t2wi和dwi是宫颈癌诊断和分级的重要序列,t2wi可提供解剖学特征,而dwi可以反映组织中水分子的微观运动,从分子层面早期显示病理变化,两者互相补充。以往研究表明,使用多参数肿瘤图像的高通量特征可以提高放射组学模型的性能。因此,结合t2wi和dwi结合来提取的特征可能可以获得更精确、更具体的肿瘤信息。然而,我们使用delong检验对三种预测模型预测性能进行了两两比较,t2wi模型、dwi模型和联合t2wi+dwi构建的模型的预测性能并没有明显的差异(p>0.05),可能与病例样本量小、患者年龄相对集中有关。既往也有类似研究基于t2加权、t2脂肪抑制及动态增强图像的影像组学预测宫颈鳞癌的分化程度,其研究发现多序列图像可以区分低分化和中分化的子宫颈鳞癌,auc值为0.802,但入组病例未包括高分化的宫颈鳞癌,同时也未在独立测试集中进行检验。我们的研究纳入高分化的子宫鳞癌,预测效能(训练组auc0.841,测试组auc0.822)相对较好。原因可能是高、低分化程度的宫颈癌的异质性差别较大。wu等对56例经病理证实为宫颈鳞癌的患者行dce-mri扫描,分别从ktrans、kep及ve图上获得4类共66个影像组学特征,4类分别为直方图、一阶纹理、灰度共生矩阵(gray-level-co-occurencematrix,glcm)和灰度行程矩阵(run-lengthmatrix,rlm),分析这些影像组学特征在评估宫颈鳞癌分级的价值。结果表明在鉴别肿瘤分级时,ve显示出最佳的判别效能,准确性分别为81.1%和75.3%。诊断效能不及联合模型。本次研究建立的模型可以为临床提供一定辅助信息行精准的诊断。

虽然在上文中已经参考实施例对本发明进行了描述,然而在不脱离本发明的范围的情况下,可以对其进行各种改进并且可以用等效物替换其中的部件。尤其是,只要不存在结构冲突,本发明所披露的实施例中的各项特征均可通过任意方式相互结合起来使用,在本说明书中未对这些组合的情况进行穷举性的描述仅仅是出于省略篇幅和节约资源的考虑。因此,本发明并不局限于文中公开的特定实施例,而是包括落入权利要求的范围内的所有技术方案。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1