一种急性髓系白血病患者铜死亡相关预后模型构建方法

文档序号:35064121发布日期:2023-08-09 03:06阅读:61来源:国知局
一种急性髓系白血病患者铜死亡相关预后模型构建方法

本发明涉及生物信息,特别是涉及一种急性髓系白血病患者铜死亡相关预后模型构建方法。


背景技术:

1、急性骨髓性白血病(acute myeloid leukemia,aml)是一种分子和细胞遗传学异质性疾病,以髓系前体的克隆性扩展为特征。在所有白血病亚型中,aml的死亡率为44.3%。到目前为止,化疗仍然是aml患者的常规治疗方法。然而,传统的强化化疗的治愈率只有30~50%。随着基础医学研究的进展,对aml有了更深入的了解,尤其是在aml的潜在机制、环境和遗传风险因素以及新的治疗方法方面。新的疗法(尤其是靶向疗法和免疫疗法)和新的临床研究对于改善aml患者的预后至关重要。新预后标志物的确定对于指导白血病相关研究和推进临床治疗非常重要。

2、铜死亡是一种新型的细胞死亡,被定义为细胞内铜积累引发线粒体脂酰化蛋白的聚集和铁硫簇蛋白的不稳定,而导致一种独特的细胞死亡。仅有的两项研究(zhu, y., he,j., li, z. & yang, w. cuproptosis-related lncrna signature for prognosticprediction in patients with acute myeloid leukemia. bmc bioinformatics 24,37, doi:10.1186/s12859-023-05148-9 (2023); li, p. et al. a novel cuproptosis-related lncrna signature: prognostic and therapeutic value for acute myeloidleukemia. front oncol 12, 966920)使用了tcga数据库来构建aml中与铜死亡相关的基因模型,这些研究在研究过程和结果上存在问题。首先,建模的样本量不够充足,这两项研究中使用的数据集的数据量约为150,其中用于建模的数据量更少,这可能会导致模型的代表性不强,以及外推结果不稳健,在李等人的研究中,模型在验证数据集中表现并不理想;其次,这些被报道的模型没有经过外部数据集的验证,这些模型的验证集均是通过原始数据集随机拆分得到,而通过随机拆分数据集得到的验证集来验证模型往往会得到良好的验证结果。基于这样的研究现状,有必要进行研究来填补该领域的研究空缺,并提高今后研究的质量和标准。

3、堆叠策略对处理复杂问题有很强的预测能力。近年来,堆叠在医学领域堆叠得到发展并应用于临床实践。王等人利用cfdna片段组学特征建立了一个堆叠集合模型,并在检测早期肺癌方面取得了很高的灵敏度。carina albuquerque等人建立了一个基于堆叠的人工智能框架,用于有效检测和定位结肠息肉。因此,堆叠策略在整合模型方面具有相当的潜力,并在推进模型的应用方面具有重要临床实践意义。但几乎没有研究来探讨堆叠策略在血液学方向的研究潜力。

4、基于上述研究现状,构建一个新的铜死亡相关特征来预测aml患者的预后情况,并探索堆叠策略在血液学方向的可能性成为重要的研究课题。


技术实现思路

1、本发明提供了一种急性髓系白血病患者铜死亡相关预后模型构建方法,利用堆叠策略,结合两个高质量的基因模型来扩展所构建的铜死亡相关预后特征,提高模型的预测效能。

2、为实现上述目的,本发明提供了如下方案:

3、一种急性髓系白血病患者铜死亡相关预后模型构建方法,该方法包括以下步骤:

4、构建铜死亡相关预后特征初步模型:

5、以gse37642数据集为训练集,以gse12417和tcga-laml队列为验证集,结合多个已知的铜死亡相关基因,确定新的铜死亡相关基因集;

6、在新的铜死亡相关基因集中,通过单因素cox回归获得与预后相关的铜死亡相关基因,随后,通过spike-and-slab lasso对预后相关的铜死亡相关基因进行降维,最后,通过逐步回归获取最佳的基因组合及其回归系数,构建铜死亡相关预后特征初步模型;

7、扩展铜死亡相关预后特征初步模型:

8、基于堆叠策略,将铜死亡相关预后特征初步模型与若干基因模型进行拟合,得到扩展后的堆叠模型,作为最终的急性髓系白血病患者铜死亡相关预后模型。

9、进一步地,所述多个已知的铜死亡相关基因,包括:

10、cdkn2a、fdx1、dld、dlat、lias、gls、lipt1、mtf1、pdha1和pdhb。

11、进一步地,所述以gse37642数据集为训练集,以gse12417和tcga-laml队列为验证集,结合多个已知的铜死亡相关基因,确定新的铜死亡相关基因集,包括:

12、将多个已知的铜死亡相关基因与gse37642、gse12417和tcga-laml三个数据集的共有基因做spearman秩相关,得到每个基因的相关系数与p值;

13、将相关系数的绝对值大于0.4,且p值小于0.05的基因作为新的铜死亡相关基因,得到新的铜死亡相关基因集。

14、进一步地,所述在新的铜死亡相关基因集中,通过单因素cox回归获得与预后相关的铜死亡相关基因,包括:

15、通过单因素cox回归,从新的铜死亡相关基因集中选择p值小于0.01的基因作为与预后相关的铜死亡相关基因。

16、进一步地,所述铜死亡相关预后特征初步模型的公式表示为:

17、,

18、其中, n为最终建模基因数, exp i为基因的表达量,β i为逐步回归的回归系数。

19、进一步地,所述若干基因模型包括4-mrna模型以及24gene模型。

20、进一步地,基于堆叠策略,将铜死亡相关预后特征初步模型与若干基因模型进行拟合,得到扩展后的堆叠模型,作为最终的急性髓系白血病患者铜死亡相关预后模型,包括:

21、第一步,将gse37642数据集作为训练数据,随机分成均匀的10组,称为 “折”;

22、第二步,通过多因素cox回归,使用10折中的9折来拟合铜死亡相关预后特征初步模型、4-mrna模型以及24gene模型三个子模型,并在另外一个折中计算每个子模型的风险评分,重复此过程10次后,所有的折均可获得三个子模型的风险评分;

23、第三步,将每个子模型的风险评分与训练数据的生存结局进行整合;

24、第四步,采用加性线性模型,整合子模型的风险评分,随机生存森林被用于拟合整合的风险评分和生存结局,采用限制性最小二乘法获得每个子模型风险评分的权重;

25、第五步,重新在全部训练数据中通过多因素cox回归得到各子模型的风险评分,并根据第四步中的权重,获得最终的整合风险评分;

26、第六步,利用随机生存森林方法拟合第五步中的风险评分和生存结局之间的关系,得到扩展后的堆叠模型,作为最终的急性髓系白血病患者铜死亡相关预后模型。

27、进一步地,所述方法还包括:

28、验证铜死亡相关预后特征初步模型:

29、通过时依roc曲线、校准图评估铜死亡相关预后特征初步模型的预测效能;同时,根据风险评分的最佳截断值将患者分为高危组和低危组,并比较两组之间的生存差异,log-rank检验的p值小于0.05被认为是两组之间的生存情况存在差异。

30、进一步地,所述方法还包括:

31、验证扩展后的堆叠模型:

32、通过时依roc曲线比较堆叠模型和各子模型之间的区分度,同时,使用beataml队列来验证堆叠模型的风险分类结合欧洲白血病网风险分类的预测效果;

33、根据堆叠模型的风险评分的最佳截断值,将患者分为低危组和高危组,在欧洲白血病网风险分类中,患者被分为不利、中等和有利组;

34、对低危组和高危组两种分组标准进行重新组合,低风险组以欧洲白血病网风险分类为准,在剩余人群中,中风险以及高风险组以堆叠模型的分类标准为准,堆叠模型中的低危组被重新分为中风险组,堆叠模型中的高危组被重新分为高风险组;

35、使用log-rank检验来比较各组生存曲线之间的差异,组间比较时,log-rank检验的p值小于0.017被认为两组之间存在差异。

36、根据本发明提供的具体实施例,本发明公开了以下技术效果:本发明提供的急性髓系白血病患者铜死亡相关预后模型构建方法,利用堆叠策略,结合另外两个发表在高质量期刊上的基因模型来扩展所构建的铜死亡相关预后特征初步模型,堆叠可以结合不同算法和模型的优势,以此提高预测性能,并且堆叠策略对复杂问题有很强的预测能力。扩展后的模型在预测效能方面优于该方向的其他模型,具体来说,铜死亡相关预后特征的区分度相较于其他模型高,模型评价指标完善,模型泛化能力强。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1