一种用于预测子宫颈癌患者预后情况的分子标记组合及其应用

文档序号:30702018发布日期:2022-07-09 20:11阅读:297来源:国知局
一种用于预测子宫颈癌患者预后情况的分子标记组合及其应用

1.本发明属于医学检测领域,具体涉及了一种用于预测子宫颈癌患者预后情况的分子标记组合及其应用。


背景技术:

2.子宫颈癌是常见的妇科疾病,也是女性癌症死亡的主要原因之一。目前,子宫颈癌的主要治疗方法是子宫根治术结合放疗和顺铂化疗,但是一些患者在手术或放疗后仍会复发,且复发患者治疗预后较差。为了进一步提高子宫颈癌的治疗效果和制定精确的治疗策略,肿瘤学家需要对子宫颈癌患者的预后进行预测。
3.目前临床上常用figo(federation international of gynecology and obstetrics)分期系统预测子宫颈癌患者预后效果。对于手术患者,figo分期系统主要基于影像学或病理检查;对于部分非手术患者,figo分期则是基于医生对患者影像学和体检结果的主观判断。但是,如果患者伴有盆腔炎、子宫内膜异位症或肥胖,则会导致诊断失误。此外,由于临床确定的分期与手术病理结果存在显著差异,导致figo分期患者的预后存在显著差异。
4.近年来,多项研究证实了基因在肿瘤预后中的预测作用,从分子层面对癌症进行研究更有利于个体化的治疗和预后的评估。目前子宫颈癌的发病机制尚不完全清楚,临床上也并没有用于子宫颈癌诊治有效的分子标志物。因此,发现新的预后标志物、构建新的预测模型对于子宫颈癌的机制研究以及临床应用都具有重要的意义。


技术实现要素:

5.本发明旨在至少解决上述现有技术中存在的技术问题之一。为此,本发明提出了一种用于预测子宫颈癌患者预后情况的分子标记组合及其应用。本发明中建立了具有chmp4c、slc25a5、vdac1人类坏死性凋亡相关基因(nrgs)组合物的风险预测模型,并依据风险评分将子宫颈癌患者分为高、低风险组,在训练集中子宫颈癌患者的风险评分与患者总体生存率显著相关(p《0.05)。本发明中的风险预测模型的受试者工作特征曲线(roc)曲线分析显示,在1年、3年和5年随访中,auc分别为0.694、0.703和0.664。均高于单独使用chmp4c、slc25a5和vdac1建立的风险预测模型的auc值,与figo分期相比,本发明中的风险预测模型具有更好的准确性和特异性,进而实现子宫颈癌的早干预早治疗,并为子宫颈癌提供了一个有价值的nrgs靶向治疗途径。
6.本发明的第一方面,提供了一种分子标志物组合,所述分子标志物组合为chmp4c、slc25a5和vdac1的组合。
7.本发明第二方面的内容,提供了一种本发明第一方面所述的分子标志物组合在制备子宫颈癌预后风险预测和/或诊断产品中的应用。
8.根据本发明第二方面的内容,在本发明的一些实施方式中,所述产品包括试剂、试
剂盒等。
9.本发明的第三方面,提供了一种本发明第一方面所述的分子标志物组合在构建子宫颈癌患者预后风险预测模型中的应用。
10.根据本发明第三部分的内容,在本发明的一些实施方式中,所述子宫颈癌患者预后风险预测模型的构建方法包括以下步骤:
11.(1)收集子宫颈癌样本和正常样本的基因表达数据,以及对应患者的临床信息数据,并将其纳入训练集,随后对训练集中的基因表达数据进行标准化处理,以获得基因表达矩阵;
12.(2)使用r包limma对步骤(1)中基因表达矩阵中的人类坏死性凋亡相关基因进行差异表达分析,筛选获得差异表达的人类坏死性凋亡相关基因的基因表达谱,设定筛选的标准为p《0.05且差异倍数的绝对值》2;
13.(3)对步骤(2)中获得的差异表达的人类坏死性凋亡相关基因表达谱与对应患者的临床信息数据中的生存数据进行合并,进行单因素cox回归分析,筛选出与子宫颈癌预后相关的人类坏死性凋亡相关基因,筛选的标准为p《0.05;再进行lasso cox回归模型构建,得到本发明的子宫颈癌患者预后风险预测模型,所述风险预测模型的计算公式如下:
[0014][0015]
其中,n为预后基因数,expi为基因i的表达值,βi为基因i的回归系数。
[0016]
在本发明的一些更优选实施方式中,所述子宫颈癌样本和正常样本的基因表达数据从tcga数据库下载。
[0017]
在本发明的一些更优选实施方式中,从kegg数据库和相关文献中下载人类坏死性凋亡相关基因集。
[0018]
在本发明的一些优选实施方式中,所述方法还包括:基于所述训练集数据,评估所述风险预测模型的预测性能。
[0019]
在本发明的一些更优选实施方式中,基于所述训练集数据,评估所述风险预测模型的预测性能包括以下步骤:
[0020]
基于所述风险预测模型风险评分计算公式计算步骤(1)中的训练集中的每个子宫颈癌患者的风险评分;
[0021]
基于所获得的风险评分,依据风险评分的中位数将训练集中的子宫颈癌样本分为高风险组和低风险组;
[0022]
使用所述训练集数据的kaplan-meier曲线评估所述高风险组和低风险组在生存情况方面是否具有显著差异。
[0023]
使用所述训练集数据的roc曲线分析评估风险预测模型的拟合优度。
[0024]
在本发明的一些优选实施方式中,所述roc曲线采用r软件“survival”“timeroc”包软件进行绘制。
[0025]
在本发明的一些优选实施方式中,本发明中所述的子宫颈癌患者预后风险预测模型可以用于对患者的1年、3年和5年预后。
[0026]
在本发明的一些更优选实施方式中,本发明中所述的子宫颈癌患者预后风险预测模型可以用于对患者的3年预后。
[0027]
在本发明的一些优选实施方式中,所述方法还包括:获取验证集数据,基于所述验
证集数据,评估所述风险预测模型的效能。
[0028]
在本发明的一些更优选实施方式中,所述验证集是从geo数据库下载,并从中提取已经标准化的基因表达谱数据及临床信息,最终有300个样本被纳入验证集。
[0029]
在本发明的一些更优选实施方式中,所述基于所述验证集数据,评估所述风险预测模型的效能包括以下步骤:
[0030]
基于所述风险评分计算公式计算验证集中的每个子宫颈癌患者的风险评分;
[0031]
基于所获得的风险评分,依据训练集风险评分的中位数将验证集中的样本分为高风险组和低风险组;
[0032]
使用所述验证集数据的kaplan-meier曲线评估所述高风险组和低风险组在生存情况方面是否具有显著差异。
[0033]
使用所述验证数据集的roc曲线分析评估所述风险预测模型的拟合优度。
[0034]
在本发明的一些优选实施方式中,步骤(3)中差异表达的nrgs具体包括1dh1、tnfrsf10b、chmp4c、pgam5、ezh2、stat5b、tradd、il33、klf9、axl、hsp90aa1、slc25a5、cdkn2a、idh2、vdac1、capn1、parp1。
[0035]
在本发明的一些更优选实施方式中,步骤(4)中筛选出的与子宫颈癌预后相关的nrgs为chmp4c、slc25a5、vdac1。
[0036]
在本发明的一些优选实施方式中,步骤(3)中所述风险预测模型的风险评分公式为:风险评分=0.0659
×
chmp4c基因表达水平-0.0030
×
slc25a5基因表达水平+0.0102
×
vdac1基因表达水平。
[0037]
本发明的有益效果是:
[0038]
(1)本发明中建立了具有chmp4c、slc25a5、vdac1组合的风险预测模型,并依据风险评分将子宫颈癌患者分为高、低风险组,在训练集中子宫颈癌患者的风险评分与患者总体生存率显著相关(p《0.05)。roc曲线分析显示,本发明中的风险预测模型的1年、3年和5年随访中,auc分别为0.694、0.703和0.664。均高于单独使用chmp4c、slc25a5和vdac1建立的风险预测模型的auc值,与figo分期相比,本发明中的风险预测模型具有更好的准确性和特异性;
[0039]
(2)本发明中的风险预测模型的预测性能已在验证集中得到验证。该风险预测模型可以有效预测子宫颈癌患者的预后,这有助于临床治疗方案的选择,进而实现子宫颈癌的早干预早治疗;
[0040]
(3)本发明中的风险预测模型首次系统地研究了子宫颈癌中nrgs的表达模式与患者预后的关系,为nrgs在子宫颈癌发生和发展中的作用提供了新的见解,并为子宫颈癌患者提供了一个有价值的nrgs靶向治疗途径。
附图说明
[0041]
图1为17个差异表达nrgs的热图;
[0042]
图2为训练集中的高风险组和低风险组的子宫颈癌患者的kaplan-meier生存分析曲线;
[0043]
图3为训练集中1年、3年、5年的风险预测模型时间依赖性roc曲线;
[0044]
图4为验证集geo44001中的高风险组和低风险组的子宫颈癌患者的kaplan-meier
生存分析曲线;
[0045]
图5为验证集中1年、3年、5年的风险预测模型时间依赖性roc曲线;
[0046]
图6为cox回归分析评估风险预测模型在子宫颈癌患者的独立预后价值图(分别对年龄(age)、组织学分级(grade)、临床阶段(stage)、t分期和风险分数(risk score)进行单因素和多因素cox回归分析),其中,图6a是单因素cox回归分析;图6b是多因素cox回归分析;
[0047]
图7为子宫颈癌患者的预后风险预测模型及临床相关病理信息进行roc比较分析的结果图,其中,age为患者年龄,grade为组织学分级,stage为临床阶段,t代表t分期,risk score代表风险评分;
[0048]
图8为结合临床特征和风险评分构建的诺模图及诺模图校正曲线,其中,图8a结合了风险评分和临床信息特征的列线图,图8b校准图显示列线图预测的3年生存概率与实际观察到的3年生存概率相对应,图8c校准图显示列线图预测的5年生存概率与实际观察到的5年生存概率相对应;
[0049]
图9为基因chmp4c构建的风险预测模型的1年、3年、5年的roc曲线;
[0050]
图10为基因slc25a5构建的风险预测模型的1年、3年、5年的roc曲线;
[0051]
图11为基因vdac1构建的风险预测模型的1年、3年、5年的roc曲线。
具体实施方式
[0052]
下面结合具体实施例来进一步描述本发明,本发明的优点和特点将会随着描述而更为清楚。但这些实施例仅是范例性的,并不对本发明的范围构成任何限制。本领域技术人员应该理解的是,在不偏离本发明的精神和范围下可以对本发明技术方案的细节和形式进行修改或替换,但这些修改和替换均落入本发明的保护范围内。
[0053]
实施例1
[0054]
子宫颈癌预后风险预测模型的构建
[0055]
1、数据下载和整理
[0056]
从tcga数据库下载子宫颈癌样本和正常样本的基因表达数据,以及对应子宫颈癌患者的临床信息数据,其中,共包括306个癌组织样本和3个正常组织样本,作为训练集。
[0057]
从kegg(kyoto encyclopedia of genes and genomes)下载nrgs(hsa04217),并结合文献报道,最终有211个nrgs被纳入进行后续分析。使用perl脚本从训练集表达谱数据中提取nrgs的表达量数据,并对基因表达的数据进行标准化处理,以获得nrgs表达矩阵;使用r包limma分析训练集中nrgs的差异表达,以p《0.05且差异倍数的绝对值》2作为筛选差异基因的截止值,最终共获得17个差异表达的nrgs,并通过r语言heatmap包对差异表达nrgs进行可视化,结果如图1所示,从图1中可以看出,tradd、tnfrsf10b、pgam5、parp1、idh1、hsp90aa1、vdac1、capn1、ezh2、chmp4c、slc25a5、idh2和cdkn2a在癌组织中表达显著上调,而klf9、il33、stat5b和axl在癌组织中表达显著下调。
[0058]
2、单因素cox及lasso cox回归分析
[0059]
对筛选的17个差异表达nrgs进行单因素cox分析,筛选出与子宫颈癌患者生存相关的基因,其中,p《0.05的基因被认为是对子宫颈癌患者的生存有影响,最终,共筛选出3个与子宫颈癌预后相关的基因,如表1中所示,分别为chmp4c、slc25a5和vdac1。随即进行
lasso cox回归分析,构建lasso cox回归模型。利用lasso cox回归模型回归系数与基因表达矩阵表达水平的线性组合构建预后gene signature,形成风险评分公式。计算每个基因的风险评分,根据风险评分的中位数,将所有的子宫颈癌样本分为高风险组与低风险组。
[0060]
其中,风险评分的计算公式为:
[0061]
其中,n为预后基因数,expi为基因i的表达值,βi为基因i的回归系数。
[0062]
即:风险评分=0.0659
×
chmp4c基因表达水平-0.0030
×
slc25a5基因表达水平+0.0102
×
vdac1基因表达水平。
[0063]
表1风险预测模型筛选出的3个nrgs
[0064][0065]
单因素cox分析中的hr用于表征相对危险度,其中,hr值大于1表示对应的基因的表达值与风险评分呈正相关关系,从而相应的lasso cox回归系数大于0,hr值小于1表示对应的基因的表达值与风险评分呈负相关关系,从而相应的lasso cox回归系数小于0。另外,hr.95l和hr.95h表示95%的置信区间。
[0066]
子宫颈癌预后风险预测模型的验证
[0067]
从geo数据库获取子宫颈癌的系列矩阵文件(series matrix file),从中提取已经标准化的基因表达谱数据及临床信息,最终有300个样本被纳入验证集。
[0068]
1、生存曲线分析
[0069]
采用r软件“survival”、“survminer”包对训练集中的高风险组和低风险组的子宫颈癌患者进行生存分析并绘制生存曲线,通过log-rank检验进行组间差异比较。结果表明,训练组中,高风险组患者的生存时间显著短于低风险组,如图2所示。同样,在验证集geo44001中也是高风险组患者的生存时间显著短于低风险组,如图4所示。
[0070]
2、roc曲线分析
[0071]
为了评估风险预测模型在预测子宫颈癌预后的准确性,采用r软件“survival”“timeroc”包使用roc曲线检测本发明实施例中的子宫颈癌预后风险预测模型的1年、3年、5年的预后效能。结果表明,本发明实施例中的子宫颈癌预后风险预测模型在1年,3年和5年随访中,auc分别是0.694、0.703、0.664,如图3所示。auc值表明,由3个nrgs组成的风险预测模型对子宫颈癌患者的预后具有较好的区分性能。同样,在验证集中由3个nrgs组成的风险预测模型对子宫颈癌患者的预后同样具有较好的区分性能,如图5所示。
[0072]
3、多因素回归分析风险评分的预后价值
[0073]
从tcga数据库中收集子宫颈癌患者的临床特征,包括生存时间、生存状态、年龄(age)、组织学分级(grade)、临床阶段(stage)和t分期。使用临床数据和风险评分进行单因素cox和多因素cox回归分析,评估风险评分是否是子宫颈癌患者的独立预后因素。p《0.05的值被认为具有统计学意义。结果表明,风险评分是子宫颈癌患者的独立预后因素(p《0.001),如图6a(单因素cox回归分析结果)和6b(多因素回归cox分析结果)所示。图7是风险预测模型和其他临床病理特征的roc曲线对比图,从图中可以看出本发明实施例中的子宫
颈癌预后风险预测模型对应的auc值为0.713,高于figo分期(也即stage,auc值=0.654)及其他临床病理特征。因此,综合来说,本发明实施例中的risk score在预测生存期时具有一定的优势,与figo分期相比,本发明实施例中的基于3个nrgs构建的风险预测模型具有更好的准确性和特异性。
[0074]
4、构建诺模图
[0075]
使用r包“rms”根据年龄、组织学分级、临床阶段、t分期和风险评分构建诺模图,如图8a所示,其中年龄、组织学分级、临床阶段、t分期是各种临床参数中最重要的因素。然后绘制校准曲线,如图8b和图8c所示,以评估实际的生存结果和预期的生存结果之间的一致性,可用于预测子宫颈癌患者的生存可能性。研究发现校准曲线显示,实际的生存率和预期的生存率具有较高的一致性,说明本发明实施例中的风险预测模型具有较高的可信度。
[0076]
对比例1
[0077]
对比例1中使用实施例1中相同的模型构建方法,构建了chmp4c基因的子宫颈癌患者预后风险预测模型,构建的预后风险预测模型预测1年生存期时对应的auc值为0.632,预测3年生存期时对应的auc值为0.619,预测5年生存期时对应的auc值为0.587,如图9所示。
[0078]
对比例2
[0079]
对比例2中使用实施例1中相同的模型构建方法,构建了slc25a5基因的子宫颈癌患者预后风险预测模型,构建的预后风险预测模型预测1年生存期时对应的auc值为0.341,预测3年生存期时对应的auc值为0.417,预测5年生存期时对应的auc值为0.391,如图10所示。
[0080]
对比例3
[0081]
对比例3中使用实施例1中相同的模型构建方法,构建了vdac1基因的子宫颈癌患者预后风险预测模型,构建的预后风险预测模型预测1年生存期时对应的auc值为0.503,预测3年生存期时对应的auc值为0.67,预测5年生存期时对应的auc值为0.574,如图11所示。
[0082]
由此,本实施例中考虑到nrgs在子宫颈癌生物学中的重要意义,确定了一个与nrgs相关的风险预测模型来预测子宫颈癌患者的预后,为子宫颈癌患者的预后和治疗提供理论依据,且预后结果更加准确。
[0083]
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1