基于医学图像的肝脏储备功能量化评估方法和装置

文档序号:30332466发布日期:2022-06-08 06:00阅读:404来源:国知局
1.本发明涉及基于影像组学开发的肝脏储备功能量化评估领域。
背景技术
::2.迄今为止,肝切除术是根治各种原发性和继发性肝脏肿瘤的重要方法。然而,虽然围手术期管理和肝切除术技术已得到长足的进步,但是肝切除术后仍会发生多种危及生命安全的并发症,其中尤以肝切除术后肝功能衰竭(phlf)最为严重。phlf是指肝切除术术后多种原因引起的严重肝脏损害,肝脏合成、解毒、排泄和生物转化等功能发生严重障碍或失代偿,患者术后出现以凝血功能障碍、黄疸、肝性脑病、腹腔积液等为主要表现的一组临床症候群。2011年国际肝脏外科研究小组(isgls)在归纳总结了几十项关于phlf研究的基础上,提出了phlf的统一定义和严重程度分级标准。isgls小组将phlf定义为术后肝脏合成、分泌、解毒等功能受损,主要以总胆红素(tb)和国际标准化比值(inr)作为评估标准,即术后第5天或之后tb和inr升高且大于正常值上限。值得注意的是,胆道梗阻引起的临床症状和实验室检查指标的改变应该被剔除。此外,isgls小组将phlf严重程度共分为3个等级,phlfa级被定义为肝功能暂时性、小范围恶化,在常规治疗中不需要任何特殊处理。phlfb级被定义为偏离了术后常规临床管理,患者病情仍处于可控范围,需要借助非侵入性手段进行治疗,phlfc级被定义为患者出现严重的肝衰竭或多器官功能衰竭,需要侵入性治疗进行干预。phlf是肝切除术后患者死亡的主要原因,phlf的发生会延长患者住院时间,影响患者的远期预后。术前准确评估肝癌患者的肝脏储备功能,制定完善的手术方案,慎重进行手术决策,这对于预防phlf的发生具有重要意义。3.虽然近年来不断涌现出多种评估肝脏储备功能的方法,例如,以往采用的肝脏储备功能评分包括child-pugh评分、meld评分和albi评分等评分系统来计算肝脏储备功能,但吲哚菁绿(icg)清除率试验仍然是目前使用最广泛的方法。icg清除率检测是一种可以有效评估肝脏有效血流量和肝细胞功能的定量测试,具有排泄速度快、不参与体内化学反应、不进入肠肝循环、不存在淋巴逆流和不从肾等其他肝外脏器排泄等诸多优点,该方法技术成熟,被广泛应用于手术决策。4.然而,icg清除率测试需要依赖昂贵的检测设备和专用检测试剂,难以在基层医院推广普及,例如,日本研发的ddg-3300k肝功能分析仪是开展icg清除试验的一个价格昂贵的设备,仅需15分钟即可获得icgr15的数值,该仪器采用的检测方法为pdd法,pdd法的原理为当血液中存在两个不同的吸光物质时,用两个不同的波长照射组织获得透过光的脉冲,可以求出血液中的这两个吸光物质的浓度比,这称为脉搏分光光度测定法,简称为脉搏光度法。除此以外,静脉注射icg光敏染料可能引起不良反应,例如恶心、发热和过敏反应。因此,我们迫切需要开发一种简化的替代工具,以帮助临床医生在日常工作中快速且安全地获取icgr15的数值。5.肝脏储备功能是指肝脏受到创伤和打击时维持正常生理功能的代偿能力,准确评估肝脏储备功能是指导外科医生进行精准肝切的必要手段。临床上主要采用吲哚菁绿(icg)清除率检测定量评价肝脏储备功能,但是icg清除率检测需要依赖特殊的设备和检测试剂,还可能发生过敏反应。技术实现要素:6.为了克服现有技术中的icg清除测试存在设备依赖,检查繁琐,且可能发生不良反应,不易于普及推广的问题。本技术的第一个方面提供一种基于影像组学的肝脏储备功能量化评估方法,包括:7.步骤s1:构建肝脏储备功能预测模型,其包括:8.步骤s1.1:获取若干肝癌患者的术前上腹部增强ct门脉期医学图像上的感兴趣区域的影像组学特征数据和术前临床生化检测指标数据;本步骤中的所述肝癌患者为已经确诊为患有肝癌的患者。9.步骤s1.2:采用spearman相关分析筛选出与icgr15高度相关的影像组学特征和临床变量;10.步骤s1.3:对于筛选出的与icgr15高度相关的影像组学特征和临床变量,基于五折交叉验证获取xgboost机器学习算法的最佳参数组合,即完成肝脏储备功能预测模型的构建;11.步骤s2:将肝癌患者的术前上腹部增强ct门脉期图像上的感兴趣区域的影像组学特征数据和术前临床生化检测指标数据输入肝脏储备功能预测模型,肝脏储备功能预测模型自动利用xgboost机器学习算法,自动将当前筛选出的ct影像组学特征和临床检测变量进行联合分析,即可自动输出icgr15数值。耗时短且准确度高。本步骤中的所述肝癌患者为已经确诊为患有肝癌的患者。icgr15数值《10的患者可以耐受三个肝段以上的肝切除(即该患者肝脏可切除体积更多,不至于术后发生因肝脏剩余体积过少而出现肝功能衰竭)。12.本专利使用肝脏门脉期图像的优势如下:13.(1)从上腹部增强ct门脉期图像中可以很好区分出肝脏组织和其他周围组织,使得肝实质区域标注和后续特征提取的结果更为准确;14.(2)已有研究证实,与其他扫描时相相比,从上腹部增强ct门脉期图像数据中提取的图像特征在更为标准、稳定,符合imagingbiomarkerstandardizationinitiative(ibsi)影像成像协议(一种公认的成像标准),有利于研究结果在不同医疗中心的推广使用;15.(3)目前有大量的研究都选择了增强ct门脉期图像进行研究。16.进一步地,步骤s1.1包括:(1)采用手工勾画的方式借助3dslicer软件对术前上腹部增强ct门脉期医学图像进行感兴趣区域的分割和标注;(2)使用log过滤器进行图像处理;(3)使用pyradiomics提取出影像组学特征。17.进一步地,所述影像组学特征选自肝组织一阶特征、形状特征、大小特征、灰度共生矩阵特征、灰度大小区域矩阵特征、灰度运行长度矩阵特征、相邻灰度差异矩阵特征、灰度依赖矩阵特征中的一种或多种。18.进一步地,步骤s1.2包括:(1)基于获取的所有影像组学特征,计算组内和组间的icc数值;(2)选择组间和组内的icc数值均大于0.75的影像组学特征,进一步评估任意两个影像组学特征之间的相关性,如果两个影像组学特征之间的相关性|rho|》0.9,则排除两个影像组学特征中的任意一个;(3)采用spearman相关性分析评估icgr15与所有参数之间的相关性,其中,所有参数包括术前临床生化检测指标和(2)中筛选出的影像组学特征;(4)筛选出|rho|》0.3的影像组学特征和|rho|》0.3的临床生化检测指标,即得与icgr15高度相关的影像组学特征和临床变量。19.进一步地,基于影像组学的肝脏储备功能量化评估方法进一步包括步骤s3:当输入数据异常时,发出异常预警,并根据数据类型追溯数据异常的输入数据;当运行状态异常时,输出异常值并分析异常原因。20.本技术的第二个方面提供一种基于影像组学的肝脏储备功能量化评估装置,包括:数据获取模块、数据筛选模块、模型构建模块、输入模块、分析模块和输出模块;21.数据获取模块用于获取若干肝癌患者的术前上腹部增强ct门脉期医学图像上的感兴趣区域的影像组学特征数据和术前临床生化检测指标数据;22.数据筛选模块用于采用spearman相关性分析筛选出与icgr15高度相关的影像组学特征和临床变量;23.模型构建模块用于对于筛选出的与icgr15高度相关的影像组学特征和临床变量,基于五折交叉验证获取xgboost机器学习算法的最佳参数组合,即完成肝脏储备功能预测模型的构建;24.输入模块用于将肝癌患者的术前上腹部增强ct门脉期图像上的感兴趣区域的影像组学特征数据和术前临床生化检测指标数据输入肝脏储备功能预测模型;25.输出模块用于输出icgr15数值。26.进一步地,数据获取模块包括分割标注模块、图像处理模块和图像特征提取模块,分割标注模块用于采用手工勾画的方式借助3dslicer软件对术前上腹部增强ct门脉期医学图像进行感兴趣区域的分割和标注;图像处理模块用于使用log过滤器进行图像处理;图像特征提取模块用于使用pyradiomics提取出影像组学特征。27.进一步地,数据筛选模块包括计算模块、评估模块和筛选模块,计算模块用于基于获取的所有影像组学特征,计算组内和组间的icc数值;评估模块用于选择组间和组内的icc数值均大于0.75的影像组学特征,进一步评估任意两个影像组学特征之间的相关性,如果两个影像组学特征之间的相关性|rho|》0.9,则排除两个影像组学特征中的任意一个;评估模块还用于采用spearman相关性分析评估icgr15与所有参数之间的相关性,其中,所有参数包括术前临床生化检测指标和筛选出的影像组学特征;筛选模块用于筛选出|rho|》0.3的影像组学特征和|rho|》0.3的临床生化检测指标,即得与icgr15高度相关的影像组学特征和临床变量。28.本技术的第三个方面提供一种电子设备,包括:存储器、处理器以及存储于所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述基于医学图像的肝脏储备功能量化评估方法中的步骤。29.本技术的第四个方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于医学图像的肝脏储备功能量化评估方法中的步骤。30.采用了上述技术方案后,与现有技术相比,具有以下有益效果:31.本发明专利首次提出基于影像组学技术并通过机器学习开发一个预测icgr15数值的人工智能模型,模型亮点在于创新性地使用了ct图像特征用于icgr15的预测。本专利主要应用于量化评估肝脏储备功能,为外科医生的手术决策提供依据。本专利可以基本替代现有的icg清除率检测,不依赖特殊检测设备和检测试剂,为未来普及应用奠定了基础。使用本技术的预测模型耗时短、准确度高、不用购买数百万的仪器和不存在试剂过敏风险。32.我们采用了肝癌患者术前上腹部增强ct中肝脏门脉期图像,结合患者的临床生化检测数据,经机器学习分析处理后,可自动输出吲哚菁绿第15分钟滞留率(icgr15)数值(机器学习预测值)。预测值与实测值(设备测量值)的相关性r值可达到0.9,模型的准确性在一个独立的验证集中得到了验证,具有临床转化应用价值。33.将患者上腹部增强ct中肝脏横断面面积最大的门脉图像和临床检测数据输入人工智能系统,经计算后该系统可以自动输出icgr15预测值。34.本专利使用的机器学习方法为极限梯度提升模型(xgboost)。在常用的多种集成算法中,xgboost模型的性能更加优越,应用更加广泛,和传统的梯度提升算法相比,xgboost进行了许多改进,它的计算速度更加快速,是一个在分类和回归上都拥有超高性能的先进评估器。35.该方法通过影像组学技术对患者上腹部增强ct门脉期图像进行特征提取,并结合临床生化检测数据,采用统计学方法筛选出有效变量,之后采用网格搜索(五折交叉验证)的方法获取机器学习算法的最佳参数组合,从而得到icgr15的预测值,为临床医生的手术决策提供依据,因此具有良好的实际应用之价值。附图说明36.图1为本技术一实施例的基于影像组学的肝脏储备功能量化评估方法的流程图;37.图2为roi分割获得的图片示例,图中的虚线框选区域即为标注出的肝脏实质区域;38.图3中的a~j为本发明专利中纳入的ct图像特征与icgr15的相关性(散点图),散点图所示为从ct图像上提取到的特征(筛选后)与icgr15的相关性分析,纵轴为图像特征值,横轴为icgr15的数值,rho为相关性系数;39.图4为本发明专利中纳入的临床生化检测指标与icgr15的相关性(散点图),散点图所示为筛选出来的临床检测指标与icgr15的相关性分析,纵轴为检测值,横轴为icgr15的数值,rho为相关性系数。a为白蛋白-胆红素评分(albi)与icgr15的相关性散点图;b为总胆汁酸(tba)与icgr15的相关性散点图;c为直接胆红素(dbil)与icgr15的相关性散点图;d为前白蛋白(pa)与icgr15的相关性散点图;40.图5为本发明一实际应用例中的预测组和实测组的结果对比图,图中的虚线框选区域即为标注出的肝脏实质区域。具体实施方式41.以下结合附图与具体实施例进一步阐述本发明的优点。本领域技术人员应当理解,下面所具体描述的内容是说明性的而非限制性的,不应以此限制本发明的保护范围。42.这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例slicer软件进行肝实质的2droi标注。3dslicer软件是一个免费开源的医学影像分析和可视化软件平台,它的功能多样,广泛用于医学、生物医学和相关成像研究,为影像组学(radiomics)研究的发展做出了重要贡献。3dslicer软件提供了非常丰富的用户交互和可视化界面,研究者们可以首先导入医学影像,然后进行影像的分割、重建、标记点选择、测量等操作。与此同时,该软件本身也提供了非常多的模块,例如优秀且齐全的交互分割和重建模块,研究者所需要的图像重采样、裁剪、滤波等各种操作均可在该软件中完成。此外,如果3dslicer软件自带的功能模块满足不了研究者的多样需求,研究者们还可以根据自身需求自主选择安装插件,该软件的插件安装平台上提供了上百个开源插件供研究者们选择,同时也支持各种高级数据处理。如果在插件安装平台上研究者们仍然找不到研究所需要的功能和内容,那么研究者们还可以自己编写代码,生成插件,从而满足研究者们的个体化需求,这大大提高了radiomics研究的便捷性。3dslicer软件在医学影像领域具有非常广泛的应用,为临床手术方案的制定提供了一定参考,例如在基于医学影像的手术规划和手术导航中的应用,在手术方案制定前,将手术部位等进行3d图像分割和图像重建,临床医生可在经过重建的组织结构上进行手术规划与模拟,为精准手术切除提供可靠依据。57.在roi分割中,我们选择了肝脏横断面面积最大的门脉期图像,在该图像内,沿着肝实质轮廓勾勒出肝脏部分,然后进行图像的进一步处理分析,示例地,如图2所示为分割获得的图片。为了保证roi分割的准确性和可重复性,我们计算了组间和组内的相关性系数(inter-andintraclasscorrelationcoefficient,icc),icc常用于评价具有确定亲属关系(如双胞胎、兄弟姐妹等)的个体间某种定量属性的相似程度,也应用于评价不同测定方法或评定者对同一定量测量结果的可重复性或一致性。在诊断试验中,我们也常常使用icc指标评价不同研究者对同一组试验结果进行诊断的可重复性。一般来说,icc值介于0到1之间。在诊断试验中,如果icc值小于0.4,我们认为诊断试验的可重复性较差;如果icc值大于0.75,那么诊断试验的可重复性较好。在本发明专利中,我们随机选择了45例患者的ct图像,由两位经验丰富的医生分别进行roi的标注,从而进行组间相关性系数的计算。此外,其中一位在腹部成像方面拥有丰富工作经验的医学影像科医生在第一次roi标注后,间隔2周,重复进行roi的标注过程,从而进行组内相关性系数的计算。剩余的305例患者的roi分割全部交由这一位具有丰富工作经验的影像学医生继续完成。通过上述roi分割过程,我们最终获得了全部患者的肝脏组织区域标注。58.3)影像学特征提取方法:59.本发明专利使用了pyradiomics(版本3.0.1)从每个roi(原始图像、小波滤波器图像和拉普拉斯高斯(log)滤波器图像)中提取了影像学特征。此外,我们使用log过滤器进行图像处理,其sigma值分别设置为2和4毫米。我们使用了四种不同的频带组合(高-高[hh]、高-低[hl]、低-高[lh]和低-低[ll])生成基于小波的纹理特征。[0060]我们使用了pyradiomics软件包提取了2dct图像特征,定义的大多数特征均符合imagingbiomarkerstandardizationinitiative(ibsi)成像协议中所描述的特征定义。各种特征的定义可细分为多个类别,具体信息见表1。[0061]表1.影像组学特征[0062]table1.radiomicfeatures[0063][0064]缩略词:glcm,graylevelcooccurrencematrix,灰度共生矩阵;gldm,grayleveldependencematrix,灰度依赖矩阵;glrlm,graylevelrunlengthmatrix,灰度运行长度矩阵;glszm,graylevelsizezonematrix,灰度大小区域矩阵;ngtdm,neighborhoodgrayleveldifferentmatrix,相邻灰度差异矩阵。[0065]<1>肝组织一阶特征(firstorderfeatures)[0066]该一阶特征描述了由掩模(mask)定义的图像区域内体素强度的分布。该特征集合可细分为以下子特征:(1)能量(energy):能量是图像中体素值大小的度量,较大的值代表着这些值的平方和较大。(2)总能量(totalenergy):总能量是能量特征的值,通过体素体积(单位:立方毫米)来度量。(3)熵(entropy):熵特指的是图像值的不确定性/随机性,它衡量了编码图像值所需的平均信息量。(4)最小值(minimum)(5)第10百分位数(10thpercentile)(6)第90百分位数(90thpercentile)(7)最大(maximum):roi内的最大灰度强度。(8)平均数(mean):roi内的平均灰度强度。(9)中位数(median):roi内的中等灰度强度。(10)四分位数间距(interquartilerange)(11)范围(range):roi中的灰度值范围。(12)平均绝对偏差(meanabsolutedeviation(mad)):所有强度值与图像阵列平均值的平均距离。(13)鲁棒的平均绝对偏差(robustmeanabsolutedeviation(rmad)):所有强度值与在灰度级介于或等于第10个和第90个百分位数之间的图像阵列子集上计算的平均值的平均距离。(14)均方根(rootmeansquared(rms)):所有平方强度值的均值的平方根,它是图像值大小的另一种度量。(15)标准差(standarddeviation)(16)偏斜度(skewness):关于平均值分布的不对称性。(17)峰度(kurtosis):roi测量值分布的“峰值”。(18)方差(variance):每个强度值与平均值的平方距离的平均值。(19)均匀性(uniformity):每个强度值的平方和的度量。[0067]<2>形状和大小特征shapefeatures(2d)[0068]这一组图像特征包含了对2droi形状和大小的描述,这些特征独立于roi中的灰度强度分布[0069](1)网格面(meshsurface)[0070](2)像素面(pixelsurface)[0071](3)周长(perimeter)[0072](4)周长与表面积比(perimetertosurfaceratio)[0073](5)球形程度(sphericity)[0074](6)球形不均衡性(sphericaldisproportion)[0075](7)最大2d直径(maximum2ddiameter)[0076](8)长轴长度(majoraxislength)[0077](9)短轴长度(minoraxislength)[0078](10)延伸率(elongation)[0079]<3>灰度共生矩阵graylevelco-occurrencematrix(glcm)特征[0080](1)自相关(autocorrelation):对纹理细度和粗糙度大小的度量[0081](2)联合平均(jointaverage):测量平均灰度强度[0082](3)突出聚类(clusterprominence):测量偏度和不对称性[0083](4)聚类阴影(clustershade):测量偏度和均匀度[0084](5)聚类趋势(clustertendency):具有相似灰度值的体素分组的一种度量方法[0085](6)对比度(contrast):测量局部强度变化,倾向于远离对角线的值[0086](7)相关性(correlation):[0087](8)平均差异(differenceaverage):测量有相似强度值的对的出现次数和有不同强度值的对的出现次数之间的关系。[0088](9)差异熵(differenceentropy):邻域强度值差异的随机性/可变性的度量。[0089](10)差别方差(differencevariance):异质性的度量[0090](11)联合能量(jointenergy):图像中同质模式的度量[0091](12)联合熵(jointentropy):邻域强度值随机性/可变性的度量[0092](13)相关性的信息测量1(informationalmeasureofcorrelation(imc)1):评估1类概率分布间的相关性[0093](14)相关性的信息测量2(imc2):评估2类概率分布间的相关性[0094](15)反差矩(inversedifferencemoment(idm)):图像中局部同质性的度量[0095](16)最大相关系数(maximalcorrelationcoefficient(mcc)):纹理复杂性的量度[0096](17)反差矩归一化(inversedifferencemomentnormalized(idmn)):图像局部不均匀性的度量[0097](18)逆差(inversedifference(id)):图像局部同质性度量的另一种方法[0098](19)逆差归一化(inversedifferencenormalized(idn)):图像局部同质性度量的另一种方法(数据归一化后)[0099](20)逆方差(inversevariance):[0100](21)最大概率(maximumprobability):有相邻强度值最主要的对的出现的次数[0101](22)和平均(sumaverage):测量具有较低强度值的对的出现次数与具有较高强度值的对的出现次数之间的关系[0102](23)和熵(sumentropy):邻域强度值差异的总和。[0103](24)平方和(sumofsquares):测量glcm中平均强度水平的相邻强度水平对的分布[0104]<4>灰度大小区域矩阵graylevelsizezonematrix(glszm)特征[0105](1)小范围重点(smallareaemphasis(sae)):小面积区域分布的度量[0106](2)大范围重点(largeareaemphasis(lae)):大面积区域分布的度量[0107](3)灰度不均匀(graylevelnon-uniformity(gln)):测量图像中灰度强度值的可变性[0108](4)灰度级不均匀性归一化(graylevelnon-uniformitynormalized(glnn)):测量图像中灰度强度值的可变性(归一化后)[0109](5)大小-区域不均匀性(size-zonenon-uniformity(szn)):测量图像中大小-区域体积的可变性[0110](6)大小-区域不均匀性归一化(size-zonenon-uniformitynormalized(sznn)):测量图像中大小-区域体积的可变性(归一化后)[0111](7)区域百分比(zonepercentage(zp)):测量纹理的粗糙程度[0112](8)灰度差异(graylevelvariance(glv)):测量区域灰度强度的变化[0113](9)区域差异(zonevariance(zv)):测量区域大小体积的差异[0114](10)区域熵(zoneentropy(ze)):测量区域大小和灰度级分布的不确定性/随机性[0115](11)低灰度区域重点(lowgraylevelzoneemphasis(lglze)):测量低灰度大小区域的分布[0116](12)高灰度区域重点(highgraylevelzoneemphasis(hglze)):测量高灰度大小区域的分布[0117](13)小范围区域低灰度重点(smallarealowgraylevelemphasis(salgle)):测量小面积区域与低灰度值的联合分布在图像中的比例[0118](14)小范围区域高灰度重点(smallareahighgraylevelemphasis(sahgle)):测量小面积区域与高灰度值的联合分布在图像中的比例[0119](15)大范围区域低灰度重点(largearealowgraylevelemphasis(lalgle)):测量大面积区域与低灰度值的联合分布在图像中的比例[0120](16)大范围区域高灰度重点(largeareahighgraylevelemphasis(lahgle)):测量大面积区域与高灰度值的联合分布在图像中的比例[0121]<5>灰度运行长度矩阵graylevelrunlengthmatrix(glrlm)特征[0122](1)短行程重点(shortrunemphasis(sre)):测量短行程长度[0123](2)长行程重点(longrunemphasis(lre)):测量长行程长度[0124](3)灰度不均匀性(graylevelnon-uniformity(gln)):测量图像中灰度强度值的相似度[0125](4)灰度不均匀性归一化(graylevelnon-uniformitynormalized(glnn)):测量图像中灰度强度值的相似度(归一化后)[0126](5)行程长度不均匀性(runlengthnon-uniformity(rln)):测量图像行程长度的相似性[0127](6)行程长度不均匀性归一化(runlengthnon-uniformitynormalized(rlnn)):测量图像行程长度的相似性(归一化后)[0128](7)行程百分比(runpercentage(rp)):测量纹理的粗糙程度[0129](8)灰度差异(graylevelvariance(glv)):测量行程的灰度强度的方差[0130](9)行程差异(runvariance(rv)):测量行程长度的方差[0131](10)行程熵(runentropy(re)):测量行程长度和灰度级分布的不确定性/随机性[0132](11)低灰度行程重点(lowgraylevelrunemphasis(lglre)):测量低灰度值的分布[0133](12)高灰度行程重点(highgraylevelrunemphasis(hglre)):测量高灰度值的分布[0134](13)短行程低灰度重点(shortrunlowgraylevelemphasis(srlgle)):测量低灰度值的短行程长度的联合分布[0135](14)短行程高灰度重点(shortrunhighgraylevelemphasis(srhgle)):测量高灰度值的短行程长度的联合分布[0136](15)长行程低灰度重点(longrunlowgraylevelemphasis(lrlgle)):测量低灰度值的长行程长度的联合分布[0137](16)长行程高灰度重点(longrunhighgraylevelemphasis(lrhgle)):测量高灰度值的长行程长度的联合分布[0138]<6>相邻灰度差异矩阵neighbouringgraytonedifferencematrix(ngtdm)特征[0139]量化一个灰度值与其相邻区域的平均灰度值之间的差异[0140]<7>灰度依赖矩阵grayleveldependencematrix(gldm)特征[0141](1)弱相关优势(smalldependenceemphasis(sde)):测量弱相关的分布[0142](2)强相关优势(largedependenceemphasis(lde)):测量强相关的分布[0143](3)灰度水平不均匀性(graylevelnon-uniformity(gln)):测量图像中灰度强度值的相似性[0144](4)相关不均匀性(dependencenon-uniformity(dn)):测量图像相关的相似性[0145](5)相关不均匀性归一化(dependencenon-uniformitynormalized(dnn)):测量图像相关的相似性(归一化)[0146](6)灰度变化(graylevelvariance(glv)):测量图像灰度的方差[0147](7)相关性变化(dependencevariance(dv)):测量图像相关大小的方差[0148](8)相关性熵(dependenceentropy(de))[0149](9)低灰度重点(lowgraylevelemphasis(lgle)):测量低灰度值的分布[0150](10)高灰度重点(highgraylevelemphasis(hgle)):测量高灰度值的分布[0151](11)弱相关低灰度重点(smalldependencelowgraylevelemphasis(sdlgle)):测量低灰度值弱相关性的联合分布[0152](12)弱相关高灰度重点(smalldependencehighgraylevelemphasis(sdhgle)):测量高灰度值弱相关性的联合分布[0153](13)强相关低灰度重点(largedependencelowgraylevelemphasis(ldlgle)):测量低灰度值强相关性的联合分布[0154](14)强相关高灰度重点(largedependencehighgraylevelemphasis(ldhgle)):测量高灰度值强相关性的联合分布[0155]步骤1.2:采用spearman相关性分析筛选出与icgr15高度相关的影像组学特征和临床变量;[0156]在每一个术前的上腹部增强ct门脉期图像中(模型开发队列),本发明专利从标注后的每一个肝脏roi内总共提取了660个radiomics特征,但是并非所有的ct图像特征均具有可重复性,因此为了评估影像组学特征的观察者内和观察者间的可重复性,我们首先计算了组内和组间的icc数值。本发明专利仅选择组内和组间icc数值均大于0.75的ct图像特征进行进一步分析。接下来,为了筛选出本发明专利所需要的有效影像组学(radiomics)特征,我们采用spearman相关性分析(相关性系数为rho)来评估任意两个ct图像特征之间的相关性。rho的绝对值(|rho|)》0.9则表示两个radiomics特征高度相关。如果两个radiomics特征之间的相关性|rho|》0.9,那么我们就排除两个特征中任意一个。[0157]最后,如图3-图4所示,我们采用spearman相关分析评估了icgr15与所有参数间(包括上述筛选出的radiomics特征和已收集的临床参数)的相关性。由于|rho|≤0.3通常代表着两个变量间不存在相关性,因此最终|rho|》0.3的变量将会被用于预测模型的开发。[0158]本发明专利采用spss(版本22.0,spss,inc.,chicago,il)和graphpadprism(版本8.0)软件对所有数据进行统计分析。[0159]为了评估icgr15和ct影像学特征、临床参数之间的相关性,我们采用了spearman相关性分析(相关性系数为rho),|rho|》0.3的变量将会被挑选出来。所有显著性检验均为双侧检验,p值小于0.05代表存在显著统计学意义。[0160]步骤1.3:对于筛选出的与icgr15高度相关的影像组学特征和临床变量,基于五折交叉验证获取xgboost机器学习算法的最佳参数组合,即完成肝脏储备功能预测模型的构建;[0161]示例地,模型建立过程的代码如下:[0162]1.导库[0163]#windows[0164]pipinstallxgboost#安装xgboost库[0165]pipinstall‑‑upgradexgboost#更新xgboost库[0166]fromsklearn.preprocessingimportstandardscaler[0167]importxgboostasxgb[0168]fromxgboostimportxgbregressorasxgbr[0169]fromsklearn.ensembleimportrandomforestregressorasrfr[0170]fromsklearn.linear_modelimportlinearregressionaslinearr[0171]fromsklearn.datasetsimportload_boston[0172]fromsklearn.model_selectionimportkfold,cross_val_scoreascvs[0173]fromsklearn.metricsimportmean_squared_errorasmse[0174]importpandasaspd[0175]importnumpyasnp[0176]importmatplotlib.pyplotasplt[0177]fromtimeimporttime[0178]importdatetime[0179]fromsklearn.preprocessingimportstandardscaler[0180]fromsklearn.model_selectionimportcross_val_score[0181]fromsklearn.model_selectionimporttrain_test_split[0182]fromsklearnimportmetrics[0183]fromsklearn.metricsimportr2_score[0184]2.导入数据[0185]dataset=pd.read_csv('e:\\modelconstruction.csv')[0186]print(dataset.head())[0187]x=dataset.iloc[:,1:15].values[0188]y=dataset['icg'].values[0189]x=pd.dataframe(x)[0190]y=pd.dataframe(y)[0191]x[0192]x.shape[0193]y.shape[0194]x.head()[0195]3.建模[0196]x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.3,random_state=50)[0197]#标准化[0198]sc=standardscaler()[0199]x_train=sc.fit_transform(x_train)[0200]x_test=sc.transform(x_test)[0201]defplot_learning_curve(estimator,title,x,y,[0202]ax=none,#选择子图[0203]ylim=none,#设置纵坐标的取值范围[0204]cv=none,#交叉验证[0205]n_jobs=none#设定索要使用的线程[0206]):[0207]clf=xgbr(n_estimators=10,max_depth=7,subsample=0.8,learning_rate=0.3)[0208]x_train=x_train[0209]x_test=x_test[0210]clf.fit(x_train,y_train)[0211]4.模型预测(测试组)[0212]train_predict=clf.predict(x_train)[0213]test_predict=clf.predict(x_test)[0214]5.利用r2评估模型效果[0215]print('ther2ofmodelis:',metrics.r2_score(y_train,train_predict))[0216]print('ther2ofthemodelis:',metrics.r2_score(y_test,test_predict))[0217]6.特征重要性评估[0218]clf.feature_importances_[0219]7.网格搜索相关参数[0220]#在确定n_estimator的情况下进行网格搜索[0221]##从sklearn库中导入网格调参函数[0222]fromsklearn.model_selectionimportgridsearchcv[0223]##定义参数取值范围[0224]learning_rate=[0.01,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9][0225]subsample=[0.4,0.5,0.6,0.7,0.8,0.9][0226]colsample_bytree=[0.5,0.6,0.7,0.8,0.9][0227]max_depth=[5,6,7,8,9][0228]parameters={'learning_rate':learning_rate,[0229]'subsample':subsample,[0230]'colsample_bytree':colsample_bytree,[0231]'max_depth':max_depth[0232]}[0233]model=xgbr()[0234]##进行网格搜索[0235]clf=gridsearchcv(model,parameters,cv=5,scoring='r2',verbose=1,n_jobs=-1)[0236]clf=clf.fit(x_train,y_train)[0237]##网格搜索后的最佳参数组合为[0238]clf.best_params_[0239]步骤2:将肝癌患者的术前上腹部增强ct门脉期图像上的感兴趣区域的影像组学特征数据和术前临床生化检测指标数据输入肝脏储备功能预测模型,即可自动输出icgr15数值。[0240]图5为预测组和实测组的结果对比图。[0241]1.预测组:[0242](1)输入上腹部增强ct中肝脏横断面面积最大的门脉期图像至肝脏储备功能预测模型[0243]将一位患者的上腹部增强ct门脉期图像输入至人工智能系统后,系统自动采用radiomics中featureextractor模块进行特征提取,自动选取数个有效的ct图像特征。[0244](2)输入临床检测数据至肝脏储备功能预测模型[0245]将患者术前临床检测数据输入至人工智能系统,系统自动筛选并选取数个有效的临床指标。[0246](3)肝脏储备功能预测模型自动输出icgr15预测值[0247]经人工智能系统处理分析上述筛选出的ct图像特征数值和临床数据,系统输出icgr15预测值。[0248]实际使用本技术的预测模型时,仅需15秒~30秒即可获得icgr15数值。[0249]2.实测组:[0250]使用日本生产的ddk300肝功能分析仪,需要耗时15分钟才能获得icgr15数值。[0251]通过上述预测组和实测组的对比可知,使用本技术的预测模型耗时短、准确度高、不用购买数百万的仪器和不存在试剂过敏风险。[0252]本技术的另一实施例可以为一种电子设备,包括存储器、处理器以及存储于所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述基于医学图像的肝脏储备功能量化评估方法中的步骤。电子设备包括但不限于用户设备、网络设备或用户设备与网络设备通过网络相集成所构成的设备。[0253]本技术的另一实施例可以为一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于医学图像的肝脏储备功能量化评估方法中的步骤。计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备,使得在计算机、其他可编程数据处理装置或其他设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其他可编程数据处理装置、或其他设备上执行的指令实现流程图中的一个或多个方框中规定的功能/动作。[0254]应当注意的是,本发明的实施例有较佳的实施性,且并非对本发明作任何形式的限制,任何熟悉该领域的技术人员可能利用上述揭示的技术内容变更或修饰为等同的有效实施例,但凡未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何修改或等同变化及修饰,均仍属于本发明技术方案的范围内。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1