妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用与流程

文档序号:31601449发布日期:2022-09-21 09:00阅读:214来源:国知局
妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用与流程

1.本发明涉及人工智能应用技术领域,具体而言,涉及一种妇科肿瘤预后模型的构建方法、妇科肿瘤预后模型和应用。


背景技术:

2.女性生殖系统肿瘤又称妇科肿瘤,宫颈癌、子宫内膜癌和卵巢癌是妇科肿瘤中最常见的三大恶性肿瘤。
3.宫颈癌患病的高峰年龄为40-60岁,近年来大量研究表明,宫颈癌的发病年龄呈年轻化趋势,是妇科肿瘤中发生频率最高的恶性肿瘤,治疗预后差、易复发和转移、总生存率低。
4.子宫内膜癌是发生于子宫内膜的上皮性恶性肿瘤,又称子宫体癌。子宫内膜癌是一种高度异质性的肿瘤。根据其临床病理特征,建立了多种预后系统来指导治疗,包括portec-1(子宫内膜癌术后放射治疗)、gog-99(妇科肿瘤组-99)、sepal(主动脉旁淋巴结清扫术的生存效应)、esmo(欧洲肿瘤内科学会)。然而,以病理诊断为基础的esmo风险分层对判断预后和指导治疗不够精准,易导致部分内膜癌患者的过度治疗或治疗不足。
5.卵巢癌死亡率位于女性生殖道恶性肿瘤之首,是严重威胁女性健康的恶性肿瘤。卵巢恶性肿瘤包括多种病理类型,其中最常见的是上皮性癌,约占卵巢恶性肿瘤的70%,其次是恶性生殖细胞肿瘤和性索间质肿瘤,各约占20%和5%。卵巢深处盆腔,当卵巢病变处于早期时常无特异临床症状,当因出现症状而就诊时,70%的患者已处于晚期。晚期卵巢癌患者往往预后不佳,且卵巢癌患者初诊时即为晚期的情形较多,5年生存率不足30%。
6.目前,如何提高预测妇科肿瘤预后的准确度是研究妇科肿瘤的难点。


技术实现要素:

7.为了解决上述问题,提高预测妇科肿瘤预后的准确度,本发明的第一目的在于提供一种妇科肿瘤预后模型构建方法,构建方法具体包括:
8.获取第一预设数据集,第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
9.根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
10.根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
[0011][0012]
其中,rs表示铁死亡风险评分,ei为各目标铁死亡调控基因的表达量,coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
[0013]
本发明的一种实现方式中,妇科肿瘤包括宫颈癌、卵巢癌、子宫内膜癌和子宫肉瘤中的至少一种。
[0014]
本发明的一种实现方式中,目标铁死亡调控基因包括acsf2、ifng、ano6、slc1a4、xbp1、vegfa、gdf15、drd4、nnmt、aurka和plin2基因中的至少一种。
[0015]
本发明的一种实现方式中,获取第一预设数据集之前还包括:
[0016]
获取多个妇科肿瘤患者的基因表达数据和临床生存预后数据;
[0017]
对多个妇科肿瘤患者的基因表达数据和临床生存预后数据进行预处理及合并后筛选出第一预设数据集。
[0018]
本发明的一种实现方式中,第一预设数据集按照预设比例分成训练数据集和测试数据集。
[0019]
本发明的一种实现方式中,根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集具体包括:
[0020]
将第一预设数据集按照预设比例划分成训练数据集和测试数据集;
[0021]
根据第一预设数据集中的训练数据集,采用单基因cox分析在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因;
[0022]
通过lasso cox回归分析在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集。
[0023]
本发明的一种实现方式中,方法还包括使用第一预设数据集评估妇科肿瘤预后模型的预测性能。
[0024]
本发明的一种实现方式中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能具体包括:
[0025]
基于妇科肿瘤预后模型计算训练数据集中的各受试者的铁死亡风险评分;
[0026]
使用训练数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能;
[0027]
和/或
[0028]
基于妇科肿瘤预后模型计算验证数据集中的各受试者的铁死亡风险评分;
[0029]
使用验证数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能。
[0030]
本发明的一种实现方式中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能还包括:
[0031]
依据第一预设数据集的时间依赖的受试者工作特征曲线分析确定分组截断值,并根据分组截断值将第一预设数据集中的受试者分为高风险组与低风险组;
[0032]
分析高风险组或低风险组与不同免疫细胞或免疫功能的相关性;和/或
[0033]
根据第一预设数据集的kaplan-meier曲线分析高风险组或低风险组与受试者生存率的相关性。
[0034]
本发明的一种实现方式中,方法还包括:
[0035]
获取第二预设数据集,第二预设数据集包括癌症细胞系基因表达数据及相应的药物敏感性数据;
[0036]
根据第二预设数据集计算第一预设数据集中受试者的药物敏感性值,根据各受试者的药物敏感性值分析高风险组或低风险组与药物敏感性的相关性。
[0037]
本发明的一种实现方式中,预设准则为aic信息准则。
[0038]
本发明的第二目的在于公开一种妇科肿瘤预后模型构建装置,包括:
[0039]
数据获取模块:用于获取第一预设数据集,第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
[0040]
目标铁死亡调控基因筛选模块:用于根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
[0041]
妇科肿瘤预后模型构建模块:用于根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
[0042][0043]
其中,rs表示铁死亡风险评分,ei为各目标铁死亡调控基因的表达量,coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
[0044]
本发明的第三目的在于公开一种妇科肿瘤预后模型,采用目标铁死亡调控基因构建而成:
[0045][0046]
其中,rs表示铁死亡风险评分,ei为各目标铁死亡调控基因的表达量,coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数;
[0047]
目标铁死亡调控基因包括acsf2、ifng、ano6、slc1a4、xbp1、vegfa、gdf15、drd4、nnmt、aurka和plin2基因中的至少一种。
[0048]
本发明的一种实现方式中,各目标铁死亡调控基因及其对应的权重系数如下所示:
[0049]
序号基因权重系数1acsf20.199462ifng-0.112713ano60.465764slc1a4-0.162095xbp1-0.115556vegfa0.142787gdf15-0.118168drd40.091239nnmt0.0571610aurka0.1456411plin20.18353
[0050]
本发明的第四目的在于公开一种根据上述妇科肿瘤预后模型在预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种的应用。
[0051]
本发明的第五目的在于公开一种妇科肿瘤预后模型的应用方法,应用方法包括:
[0052]
获取待测妇科肿瘤患者目标铁死亡调控基因的表达数据;
[0053]
将待测妇科肿瘤患者目标铁死亡调控基因的表达数据输入上述构建方法构建的妇科肿瘤预后模型或者上述妇科肿瘤预后模型,计算待测妇科肿瘤患者的铁死亡风险评分。
[0054]
本发明的一种实现方式中,还包括:
[0055]
根据妇科肿瘤患者的铁死亡风险评分预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种。
[0056]
本发明还涉及一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,其特征在于,处理器执行计算机程序时实现上述应用方法的步骤。
[0057]
本发明还涉及一种计算机可读存储介质,其上存储有计算机程序,其特征在于,计算机程序被处理器执行时实现上述应用方法的步骤。
[0058]
本发明还涉及一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求上述应用方法的步骤。
[0059]
本发明提供了一种妇科肿瘤预后模型的构建方法,首先筛选与妇科肿瘤预后显著相关的基因,从而从与妇科肿瘤预后显著相关的基因中过滤共线性特征得到妇科肿瘤预后基因集,结合aic信息准则筛选妇科肿瘤预后基因集中用于构建最优风险评分模型的目标铁死亡调控基因,进而构建更精简的妇科肿瘤预后模型,减少模型的过拟合程度,提高预测妇科肿瘤患者生存率准确度,同时还能预测妇科肿瘤患者的免疫疗效和药物敏感性,为患者的个性化治疗提供指导。
附图说明
[0060]
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0061]
图1为本发明提供的一种妇科肿瘤预后模型构建方法的流程图;
[0062]
图2为本发明提供的一种妇科肿瘤预后模型构建装置的结构框图;
[0063]
图3为本发明实施例提供的计算机设备的内部结构图;
[0064]
图4为本发明实施例1构建的妇科肿瘤预后模型在妇瘤队列的训练数据集中建模的roc曲线图,其中,横坐标表示真正率,纵坐标表示假正率;
[0065]
图5为本发明实施例1中妇科肿瘤预后模型在妇瘤队列的测试数据集中建模的roc曲线图,横坐标表示真正率,纵坐标表示假正率;
[0066]
图6为本发明实施例2中妇科肿瘤预后模型在妇瘤队列的测试数据集中建模的混淆矩阵,actual表示真实分类,predicted表示预测分类,sensitivity表示敏感度,specificity表示特异度,precision表示精确度,recall表示召回率,accurancy表示准确度,f1表示f1分数,kappa表示kappa系数;
[0067]
图7为本发明实施例2中妇科肿瘤预后模型在妇瘤队列的测试数据集中建模的roc曲线图,横坐标表示真正率,纵坐标表示假正率;
[0068]
图8为本发明实施例3中妇瘤患者铁死亡高低风险组的pca示意图;
[0069]
图9为本发明实施例3中妇瘤患者铁死亡高低风险组与不同免疫功能的相关性评
价示意图,横坐标表示不同免疫功能,纵坐标表示不同免疫功能的免疫打分;
[0070]
图10~14为本发明实施例3中不同免疫功能的生存分析示意图,横坐标表示生存时间(月),纵坐标survival probability表示生存率,图10中check-point high/low表示免疫检查点的免疫评分高低分组,图11~图14以此类推,表示不同免疫细胞或免疫功能的免疫评分高低分组;
[0071]
图15为本发明实施例4中铁死亡风险评分与药物半数最大抑制浓度的相关性示意图,横坐标表示不同药物,纵坐标表示预估的ic50值;
[0072]
图16为本发明实施例5中不同细胞系中目标铁死亡调控基因与药物半数最大抑制浓度的spearman相关性分析示意图,每个spearman相关性分析图的横坐标表示目标铁死亡调控基因的表达水平,纵坐标表示药物半数最大抑制浓度;
[0073]
图17为本发明实施例6中妇科肿瘤预后模型用于以os为结局的妇瘤患者生存分析曲线图,横坐标表示生存时间(月),纵坐标survival probability表示生存率,strara表示分组;
[0074]
图18为本发明实施例6中妇科肿瘤预后模型用于以pfs为结局的妇瘤患者生存分析曲线图,横坐标表示生存时间(月),纵坐标survival probability表示生存率,strara表示分组;
[0075]
图19为本发明实施例6中妇科肿瘤预后模型对以os为结局的妇瘤患者生存评价的roc曲线,横坐标表示真正率,纵坐标表示假正率;
[0076]
图20为本发明实施例6中妇科肿瘤预后模型对以pfs为结局的妇瘤患者生存评价的roc曲线,横坐标表示真正率,纵坐标表示假正率。
具体实施方式
[0077]
现将详细地提供本发明实施方式的参考,其一个或多个实例描述于下文。提供每一实例作为解释而非限制本发明。实际上,对本领域技术人员而言,显而易见的是,可以对本发明进行多种修改和变化而不背离本发明的范围或精神。例如,作为一个实施方式的部分而说明或描述的特征可以用于另一实施方式中,来产生更进一步的实施方式。
[0078]
因此,旨在本发明覆盖落入所附权利要求的范围及其等同范围中的此类修改和变化。本发明的其它对象、特征和方面公开于以下详细描述中或从中是显而易见的。本领域普通技术人员应理解本讨论仅是示例性实施方式的描述,而非意在限制本发明更广阔的方面。
[0079]
研究表明,铁死亡与代谢、神经退行性疾病和肿瘤等多种疾病密切相关,并且可以通过激活或抑制铁死亡来干预疾病的发展。铁死亡(ferroptosis)是一种铁依赖性的,区别于细胞凋亡、细胞坏死、细胞自噬的新型的细胞程序性死亡方式。铁死亡是一个复杂的生物学过程,受到多种分子的调控,而调控分子之间也存在着相互作用。因此,铁死亡调控分子表达模式的差异决定了不同肿瘤组织的铁死亡状态,进而造成了肿瘤生物学行为的差异。
[0080]
目前,尚未有报道提出利用铁死亡调控分子的相关消息研究妇科肿瘤预后。
[0081]
此外,传统方法采用构建妇科肿瘤预后模型的方式研究其他类型癌症的预后,但也存在模型易出现过拟合,进而导致模型预测能力不佳的问题。
[0082]
为了至少部分解决上述技术问题,本发明的第一方面提供了一种妇科肿瘤预后模
型构建方法,构建方法具体包括:
[0083]
s10:获取第一预设数据集,第一预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
[0084]
具体地,妇科肿瘤包括宫颈癌(cesc)、卵巢癌(ov)、子宫内膜癌(ucec)和子宫肉瘤(ucs)中的至少一种。
[0085]
铁死亡调控基因是指参与铁死亡调控机制的基因,铁死亡调控基因的表达数据集可以从患者的基因表达数据中根据已知报道的铁死亡调控基因筛选。
[0086]
一些实施方案中,获取第一预设数据集之前还包括:
[0087]
获取多个妇科肿瘤患者的基因表达数据和临床生存预后数据;
[0088]
对多个妇科肿瘤患者的基因表达数据和临床生存预后数据进行预处理及合并后筛选出第一预设数据集。
[0089]
一些具体实施方案中,妇科肿瘤患者的基因表达数据和临床生存预后数据来自于tcga数据库,用于筛选妇科肿瘤预后基因集,以构建妇科肿瘤预后模型。
[0090]
具体地,预处理筛选既有临床信息又有对应的基因表达数据的患者样本,通过“sva”(r包)的“combat”算法去除队列之间的批次效应,进而将数据合并,根据已报道的259个铁死亡调控基因,具体见表1,从合并数据中筛选出铁死亡调控基因的表达数据集,以及表达数据集对应患者的预后数据集。
[0091]
表1
[0092]
[0093]
[0094][0095]
一些实施方案中,第一预设数据集按照预设比例随机分为训练数据集和测试数据集,训练数据集或测试数据集分别包括一定比例的妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集,用于后续步骤筛选妇科肿瘤预后基因集。
[0096]
s20:根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
[0097]
具体地,cox比例风险模型(proportional hazards model,简称cox模型),是由英国统计学家d.r.cox(1972)年提出的一种半参数回归模型。该模型以生存结局和生存时间为应变量,可同时分析单因素或者多因素对生存期的影响,能分析带有截尾生存时间的资料,且不要求估计资料的生存分布类型。
[0098]
本发明通过单基因cox回归分析,根据妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集,可以筛选出与妇科肿瘤患者预后显著相关的基因。
[0099]
lasso回归是一种处理具有复共线性数据的有偏估计,通过构造一个惩罚系数,强制系数绝对值之和小于某个固定值,同时可以设定一些回归系数为零,保留子集收缩的优点,实现对自变量特征中共线性因素的过滤。
[0100]
本发明采用lasso cox回归对与妇科肿瘤预后显著相关的基因进行筛选,从而过滤与妇科肿瘤预后显著相关的基因中的共线性基因,进而获得更精简的妇科肿瘤预后模型,能够减少模型的过拟合程度,提高妇科肿瘤预后预测的准确度,进一步还能预测妇科肿瘤免疫疗效和药物敏感性,为患者的个性化治疗提供指导。
[0101]
因此,根据第一预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集具体包括:
[0102]
s201:根据第一预设数据集中的训练数据集,采用单基因cox分析在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因;
[0103]
s202:通过lasso cox回归分析在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;具体地,本发明采用单基因cox分析在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因过程中,筛选标准为pvalue《0.05。
[0104]
进一步,通过lasso cox回归分析,过滤与妇科肿瘤预后显著相关的基因集中的共线性特征,进而结合aic信息准则筛选最优风险评分模型作为妇科肿瘤预后模型,以获得更精简的妇科肿瘤预后模型,减少模型的过拟合程度,提高预测妇科肿瘤患者的生存率,进一步还能预测妇科肿瘤免疫疗效和药物敏感性,为患者的个性化治疗提供指导。
[0105]
s30:根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
[0106][0107]
其中,rs表示铁死亡风险评分,ei为各目标铁死亡调控基因的表达量,coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数,即n=11。其中,各目标铁死亡调控基因及其对应的权重系数如表2所示。
[0108]
表2
[0109]
序号基因权重系数1acsf20.199462ifng-0.112713ano60.465764slc1a4-0.162095xbp1-0.115556vegfa0.142787gdf15-0.118168drd40.091239nnmt0.0571610aurka0.1456411plin20.18353
[0110]
具体地,目标铁死亡调控基因用于构建妇科肿瘤预后模型的铁死亡调控基因,可根据基于妇科肿瘤预后基因集中的基因构建的风险评分模型,通过aic信息准则筛选最优风险评分模型而确定。
[0111]
aic信息准则即akaike information criterion,是衡量统计模型拟合优良的一种标准,又称赤池信息量准则。本发明中,aic可以表示为:
[0112]
aic=(2k-2l)/n,其中:n是样本量,k是拟合模型中参数的数量,l是对数似然值。
[0113]
根据aic信息准则寻找可以最好地解释数据但包含最少自由参数的模型,从而进一步精简模型,减少模型的过拟合程度。具体地,按照aic信息准筛选最优风险评分模型则是指找出最小aic值相对应的模型作为最优模型。
[0114]
当对妇科肿瘤患者进行分析时,首先获取妇科肿瘤患者的目标铁死亡调控基因,并统计基因的表达量,采用上述铁死亡风险评分计算公式计算铁死亡风险评分。
[0115]
一些实施方案中,方法还包括:
[0116]
s40:使用第一预设数据集评估妇科肿瘤预后模型的预测性能。
[0117]
具体地,可以使用第一预设数据集的时间依赖的roc曲线(receiver operating characteristic curve,受试者工作特征曲线)分析评估妇科肿瘤预后模型的预测性能。例如,可以使用roc曲线下面积(area under curve,auc)这个指标评估风险评分模型的预测性能,auc值的取值范围在0.5和1之间,auc值越接近于1.0,风险评分模型的可靠性越高,模型的预测性能越好;auc值越接近于0.5时,风险评分模型的可靠性越低,模型的预测性能则越差。
[0118]
因此,一些实施方案中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能具体包括:
[0119]
s401:基于妇科肿瘤预后模型计算训练数据集中的各受试者的铁死亡风险评分;
[0120]
使用训练数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型的预测性能;
[0121]
和/或
[0122]
s402:基于妇科肿瘤预后模型计算验证数据集中的各受试者的铁死亡风险评分;
[0123]
使用验证数据集的时间依赖的受试者工作特征曲线分析评估妇科肿瘤预后模型
的预测性能;
[0124]
具体地,若验证数据集的时间依赖的受试者工作特征曲线的预测性能和训练数据集趋于一致,则能够说明风险评分模型的可靠性较高,模型的预测性能较好。
[0125]
一些实施方案中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能还包括:
[0126]
s403:依据训练数据集或者验证数据集的时间依赖的受试者工作特征曲线分析确定分组截断值,并根据分组截断值将相应数据集中的受试者分为高风险组与低风险组;
[0127]
s404:分析高风险组或低风险组与不同免疫细胞或免疫功能的相关性;和/或
[0128]
s405:根据第一预设数据集的kaplan-meier曲线分析高风险组或低风险组与受试者生存率的相关性。
[0129]
具体地,通过训练数据集或者验证数据集的时间依赖的受试者工作特征曲线分析确定分组截断值,可以将训练数据集中的受试者分为铁死亡高风险组和铁死亡低风险组,或者将验证数据集中的受试者分为铁死亡高风险组和铁死亡低风险组,或者将预设数据集中所有受试者分为铁死亡高风险组和铁死亡低风险组。
[0130]
进一步,对铁死亡高低风险组与不同免疫细胞或免疫功能的相关性进行分析,可以根据铁死亡高风险组或铁死亡低风险组和免疫细胞或免疫功能的相关性预测患者的生存率。研究表明免疫检查点的高表达及相关通路高度活化是预测免疫治疗疗效的重要指标,进而根据铁死亡高低风险组和免疫检查点分子的相关性预测高风险组或者低风险组的免疫检查点分子的免疫疗效。
[0131]
具体地,kaplan-meier曲线(生存曲线)以生存时间为横轴,生存率s(tk)为纵轴,绘制而成的连续型的阶梯形曲线,用以说明生存时间与生存率之间的关系。根据高风险组或低风险组的生存率曲线是否存在显著差异可以评估妇科肿瘤预后模型的预测性能。若根据高风险组或低风险组的生存率曲线存在显著差异,则说明铁死亡风险评分对妇科肿瘤预后有很好的预测能力。
[0132]
一些实施方案中,使用第一预设数据集评估妇科肿瘤预后模型的预测性能还包括还包括:
[0133]
s407:获取第二预设数据集,第二预设数据集包括癌症细胞系基因表达数据及相应的药物敏感性数据;
[0134]
s408:根据第二预设数据集计算第一预设数据集中各受试者的药物敏感性值;
[0135]
s409:根据各受试者的药物敏感性值分析高风险组或低风险组与药物敏感性的相关性。
[0136]
具体地,第二预设数据集可以从gdsc数据库中获取,具体获取方式不作限制。药物敏感性值是指衡量药物敏感性高低的度量,例如,可以是药物半数最大抑制浓度ic50,ic50越低,则表明药物敏感性越高。
[0137]
一些具体实施方案中,第二预设数据集作为prropheticpredict函数的训练数据集,通过回归分析,实现根据受试者的基因表达数据预测受试者的药物敏感性值。
[0138]
一些实施方案中,方法还包括:
[0139]
s410:获取第三预设数据集,第三预设数据集包括癌症细胞系基因表达数据及相应的药物敏感性数据;
[0140]
s411:计算第三预设数据集中癌症细胞系的目标铁死亡调控基因的表达水平和药物敏感性值的spearman相关系数;
[0141]
s412:根据spearman相关系数判断目标铁死亡调控基因的表达水平和药物敏感性的相关性。
[0142]
具体地,第三预设数据集可以从cellminer数据库中获取,具体获取方式不作限制。在统计学中,以查尔斯
·
爱德华
·
斯皮尔曼命名的斯皮尔曼等级相关系数,即spearman相关系数。经常用希腊字母ρ表示。它是衡量两个变量的依赖性的非参数指标。它利用单调方程评价两个统计变量的相关性。如果数据中没有重复值,并且当两个变量完全单调相关时,斯皮尔曼相关系数则为+1或-1。根据cellminer数据库可以分析目标铁死亡基因的表达水平和药物敏感性的相关性,进一步可以根据患者对药物的敏感性对患者的个性化治疗提供相应指导。
[0143]
本发明的第二方面提供了一种妇科肿瘤预后模型构建装置,包括:
[0144]
数据获取模块100:用于获取预设数据集,预设数据集包括多个妇科肿瘤患者的铁死亡调控基因的表达数据集和预后数据集;
[0145]
目标铁死亡调控基因筛选模块200:用于根据预设数据集在铁死亡调控基因中筛选与妇科肿瘤预后显著相关的基因,在与妇科肿瘤预后显著相关的基因中过滤共线性基因得到妇科肿瘤预后基因集;
[0146]
妇科肿瘤预后模型构建模块300:用于根据妇科肿瘤预后基因集构建风险评分模型,按照预设准则筛选目标铁死亡调控基因构建的最优风险评分模型,最优风险评分模型即为妇科肿瘤预后模型:
[0147][0148]
其中,rs表示铁死亡风险评分,ei为各目标铁死亡调控基因的表达量,coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数。
[0149]
本发明的第三方面提供了一种妇科肿瘤预后模型,采用目标铁死亡调控基因构建而成:
[0150][0151]
其中,rs表示铁死亡风险评分,ei为各目标铁死亡调控基因的表达量,coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数;
[0152]
目标铁死亡调控基因包括acsf2、ifng、ano6、slc1a4、xbp1、vegfa、gdf15、drd4、nnmt、aurka和plin2基因中的至少一种。
[0153]
一些实施方案中,各目标铁死亡调控基因及其对应的权重系数如下所示:
[0154]
序号基因权重系数1acsf20.199462ifng-0.112713ano60.465764slc1a4-0.162095xbp1-0.115556vegfa0.14278
7gdf15-0.118168drd40.091239nnmt0.0571610aurka0.1456411plin20.18353
[0155]
本发明的第四方面提供了上述妇科肿瘤预后模型在预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种的应用。
[0156]
本发明的第五方面公开了一种妇科肿瘤预后模型的应用方法,应用方法包括:
[0157]
获取待测妇科肿瘤患者目标铁死亡调控基因的表达数据;
[0158]
将待测妇科肿瘤患者目标铁死亡调控基因的表达数据输入上述构建方法构建的妇科肿瘤预后模型或者上述妇科肿瘤预后模型,计算待测妇科肿瘤患者的铁死亡风险评分。
[0159]
一些实施方案中,还包括:
[0160]
根据妇科肿瘤患者的铁死亡风险评分预测妇科肿瘤患者的生存率、免疫疗效以及药物敏感性中的至少一种。
[0161]
如本文,术语“免疫治疗(immunotherapy)”是指针对机体低下或亢进的免疫状态,人为地增强或抑制机体的免疫功能以达到治疗疾病目的的治疗方法。免疫治疗的方法有很多,适用于多种疾病的治疗。肿瘤的免疫治疗旨在激活患者的免疫系统,依靠自身免疫机能杀灭癌细胞和肿瘤组织。与以往的手术、化疗、放疗和靶向治疗不同的是,免疫治疗针对的靶标不是肿瘤细胞和组织,而是患者自身的免疫系统。
[0162]
本发明的免疫疗法包括使用免疫检查点抑制剂的免疫疗法。
[0163]
如本文所用,术语“免疫检查点”是指免疫系统中存在的一些抑制性信号通路。机体在正常情况下,免疫检查点可以通过调节自身免疫反应的强度来维持免疫耐受,然而机体在受到肿瘤侵袭时,免疫检查点的激活会抑制自身免疫,有利于肿瘤细胞的生长和逃逸。通过使用免疫检查点抑制剂,可以恢复机体正常的抗肿瘤免疫反应,从而控制和清除肿瘤。本领域已知多种可用于肿瘤治疗的免疫检查点抑制剂。例如,本发明免疫检查点抑制剂包括但不限于pd1抑制剂或pd-l1抑制剂,例如国内的特瑞普利单抗、信迪利单抗、卡瑞利珠单抗,以及派姆单抗、纳武单抗、阿特珠单抗、avelumab以及durvalumab。
[0164]
关于妇科肿瘤预后模型构建装置的具体限定可以参见上文中对于妇科肿瘤预后模型构建方法的限定,在此不再赘述。上述妇科肿瘤预后模型构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0165]
在一些实施方案中,提供了一种计算机设备,该计算机设备可以是服务器104,也可以是终端102,其内部结构图可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器和通信接口。当该计算机设备为终端时,还包括与系统总线连接的显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备
的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种表情识别模型的处理方法和图像处理方法中的至少一种。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
[0166]
本领域技术人员可以理解,图3中示出的结构,仅仅是与本技术方案相关的部分结构的框图,并不构成对本技术方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
[0167]
本技术还提供了一种计算机设备。计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述妇科肿瘤预后模型构建方法的步骤。
[0168]
本技术还提供了一种计算机可读存储介质。计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述妇科肿瘤预后模型构建方法的步骤。
[0169]
本技术还提供了一种计算机程序产品。计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述妇科肿瘤预后模型构建方法的步骤。
[0170]
需要说明的是,本技术所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
[0171]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-onlymemory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic randomaccess memory,dram)等。本技术所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本技术所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
[0172]
下面将结合实施例对本发明的实施方案进行详细描述。
[0173]
实施例1
[0174]
获取tcga数据库中宫颈癌(cesc)、卵巢癌(ov)、子宫内膜癌(ucec)和子宫肉瘤(ucs)的妇瘤队列的基因表达数据和临床信息数据并进行预处理后合并,获得合并队列数据包含共计1116例妇瘤患者的基因表达数据和对应的生存预后数据;并从合并队列数据中筛选出259个铁死亡相关调控分子的表达矩阵和预后信息集作为模型构建的输入文件。将
上述合并队列1116例妇瘤患者的基因表达数据和临床信息数据按照预设比例随机拆分为训练集和测试集,在训练数据集中建立妇科肿瘤预后模型,并在测试集中进行验证,最后通过roc曲线对模型的预测性能进行综合评价,其中,在妇瘤队列的训练集建模评价的roc曲线图如图4所示(auc:0.77),在妇瘤队列的测试集建模评价的roc曲线图如图5所示(auc:0.70)。本实施例构建的妇科肿瘤预后模型:
[0175][0176]
其中,rs表示铁死亡风险评分,ei为各目标铁死亡调控基因的表达量,coefi为各目标铁死亡调控基因对应的权重系数,n为目标铁死亡调控基因的个数,即n=11。其中,各基因及其对应的权重系数如表2所示。
[0177]
实施例2
[0178]
本实施例基于上述测试集,利用现有的单因素或lasso算法建模,得到相应的模型评价,发现根据混淆矩阵和受试者工作特征曲线(roc)评估现有算法建模可靠性较差,准确性为0.599,具体如图6所示,auc为0.65,具体如图7所示,远低于新算法建模的auc水平。
[0179]
实施例3
[0180]
本实施例建立了铁死亡高低风险组妇科肿瘤患者铁死亡高低风险组在免疫检查点和免疫细胞中的相关性评估,在主成分分析pca中发现铁死亡高低风险组铁死亡高低风险组可以很好的对妇瘤患者进行风险分层,具体如图8所示。
[0181]
进一步,对高风险组和低风险组中免疫功能的差异进行研究,利用铁死亡高低风险组可以实现在1116例妇瘤患者的妇瘤队列中,采用ssgsea对多种免疫细胞或者免疫功能相关的基因集进行富集评分,分析结果如图9所示。其中,巨噬细胞(macrophages)、中心粒细胞(neutrophil)、th1细胞、瘤浸润淋巴细胞(til)、调节性t细胞(treg)、趋化因子受体(ccr)、检查点(checking point)、炎症促进(inflammation-promoting)和副炎症(parainflammation)的免疫评分在铁死亡高低风险组中存在显著差异。不同免疫评分分组的妇瘤患者生存分析结果如图10~14所示,结合图9可知,在低风险组中肿瘤浸润淋巴细胞(til)、检查点、炎症促进和副炎症免疫评分显著高于高风险组,铁死亡低风险组患者具有更好的生存率;在低风险组中中性粒细胞免疫评分显著高于高风险组,铁死亡低风险组患者具有更高的存活率。这些结果表明,铁死亡高低风险组和免疫功能的相关性有助于评估患者的预后并辅助指导个体化免疫治疗。
[0182]
实施例4
[0183]
在本实施例中,从gdsc数据库中下载癌症细胞系芯片表达数据及相应的药物敏感性数据。使用prropheticpredict函数预测常见抗癌药物治疗实施例1中妇科肿瘤患者的药物敏感性值,即ic50,以分析预估的抗癌药物ic50值与铁死亡高低风险组的相关性,具体结果如图15所示,图15中的纵坐标ic50是指使用prropheticpredict函数预估的ic50。其中有90种药物的ic50与铁死亡高低风险组显著相关,不同药物在铁死亡高低风险组中表现出不同的敏感性。当铁死亡高风险组的药物敏感性值(ic50)小于铁死亡低风险分组时,表明高风险组对该药物的敏感性越强,当铁死亡高风险组的药物敏感性值(ic50)大于铁死亡低风险组时,表明铁死亡低风险组对该药物的敏感性越强,反之则相反。根据图15可知,本实施例中30种药物在妇科肿瘤患者铁死亡高风险组中表现更高的敏感性,60种药物在妇科肿瘤患者铁死亡低风险组中表现更高的敏感性。
[0184]
实施例5
[0185]
在本实施例中,从cellminer数据库中下载癌症细胞系基因表达数据及相应的药物敏感性数据,根据上述数据计算实施例1中构建模型使用的目标铁死亡调控基因在细胞系的表达水平与细胞系的药物敏感性值(ic50)的spearman相关系数,具体如图16所示。本实施例中,当|spearman相关系数|≥0.4和p《0.001,被认为该种药物的抑瘤效果与目标铁死亡调控基因的表达水平相关。当相关系数小于0时,该药物的ic50值随目标铁死亡调控基因表达水平的增加而降低,说明铁死亡调控基因高表达的患者对该药物更敏感,反之则相反。本实施例中相关性分析结果显示,总共有25种药物的抑瘤效果与铁死亡调控基因的表达水平相关,铁死亡调控基因高表达的患者对图16中包括它莫西芬、长春碱等在内的15种药物更敏感,铁死亡调控基因低表达的患者对图16中包括异维a酸等在内的10种药物更敏感。
[0186]
实施例6
[0187]
本实施例通过生存曲线(kaplan-meier)分析,分别以os和pfs为结局在妇瘤数据集中建立了铁死亡生存分析曲线,具体如图17和图18所示。进一步,通过时间依赖性的roc曲线来判断铁死亡风险模型对妇瘤患者生存的预测价值。本实施例构建的妇瘤患者的妇科肿瘤预后模型的分数用于预测患者3年、5年、8年和10年的以os为结局的总体生存情况的效率为0.71、0.76、0.80、0.78,具体如图19所示,用于预测患者3年、5年、8年和10年的以pfs为结局的总体生存情况的效率为0.77、0.77、0.80、0.80,具体如图20所示,该结果表明铁死亡风险评分可以很好的预测妇瘤患者总体生存率。
[0188]
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
[0189]
以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1