一种用于胃癌患者的预后风险评估系统的制作方法

文档序号:25312104发布日期:2021-06-04 15:51阅读:248来源:国知局
一种用于胃癌患者的预后风险评估系统的制作方法

1.本发明涉及医学领域,具体而言,涉及一种用于胃癌患者的预后风险评估系统。


背景技术:

2.根据世界卫生组织于发布的2018年最新全球癌症统计数据显示,胃癌的发病率与死亡率分别位居第五位和第三位,是东亚地区的特色癌症,发病率可达32.1/10万人,死亡率为13.2/10万人,其中,日本、韩国、中国的发病率与死亡率高居世界前列[1],因此,胃癌的预防与治疗应引起高度重视。胃癌的诊断常常较晚,尽管手术、放化疗、分子靶向及免疫治疗的进展改善了其总体预后,但仍不令人满意[2

4],探索有效的生物标记物,以对胃癌患者进行早期诊断及预后预测是迫在眉睫的。
[0003]
dna序列在很多疾病中不一定发生变化,大部分疾病中发生的变化是在表观遗传学水平,其次,与特定基因的广泛突变变异相比,启动子高甲基化发生在所有形式的癌症中的相同基因定义区域中[5]。所以采用表观遗传学水平中最常见的dna甲基化差异表达对胃癌患者进行预后预测是比较可靠的。dna甲基化是一个主要的表观遗传修饰,参与细胞增殖、分化,发育,凋亡,肿瘤以及其他疾病的发生等众多重要生命活动,也是最早被发现的dna修饰类型之一。已有研究表明dna甲基化能引起染色质结构和dna稳定性等发生改变,从而调控基因的表达[6]。位于启动子区域的异常dna甲基化通常导致抑癌基因的沉默或原癌基因的高表达,从而促进肿瘤的进展[7],其中抑癌基因甲基化最为常见,可作为早期的肿瘤标志物。目前有多项研究表明一些特定的dna甲基化位点与胃癌密切相关,例如抑癌基因中细胞周期相关基因p16、mdga2[8,9],细胞凋亡相关基因pcdh10、bcl6b[10,11]、信号转导相关基因foxf2、runx3[12,13],以及原癌基因中ras、c

myc[14,15]等。这些dna甲基化位点的发现使其在胃癌的预后甚至治疗方面具有广阔的应用价值。然而,只有少量的dna甲基化位点作为基础肿瘤标记物(ndrg4、bmp3和septin9)被批准纳入指南,转化成功率较低值得我们反思,这个问题的答案是多方面的,主要原因与测试样本小,病人选择存在偏差,研究设计与数据分析方法滞后,缺乏实质性的临床价值等因素有关,妨碍了我们彻底评估生物标志物的临床价值。随着生物信息学的发展,通过大数据、合理、科学的建立胃癌预后模型能够很好地解决上述问题。
[0004]
申请号为201811346520.2的中国专利公开了“胶质母细胞瘤危险分层模型及其在临床预后评估的应用”,其是通过dna甲基化特征的识别,构建胶质母细胞瘤预后模型。该技术在dna甲基化层面对胶质母细胞瘤的特征进行整合,而dna序列在胃癌中不一定发生变化,大部分疾病中发生的变化是在表观遗传学水平,其次,与特定基因的广泛突变变异相比,启动子高甲基化发生在所有形式的癌症中的相同基因定义区域中。所以采用表观遗传学水平中最常见的dna甲基化差异表达对胃癌患者进行预后预测是比较可靠的。但该模型设计的dna甲基化位点较多,成本较高,需要找到更合理的、更具代表性的dna甲基化位点构建模型。
[0005]
背景技术部分的引用文件如下:
expression of r

ras by cancer

linked dna hypomethylation in gastric cancer using microarrays[j].cancer res,65(6):2115

2124
[0020]
[15]licchesi j d,van neste l,tiwari v k,et al.2010.transcriptional regulation of wnt inhibitory factor

1by miz

1/c

myc[j].oncogene,29(44):5923

5934


技术实现要素:

[0021]
本发明提供一种用于胃癌患者的预后风险评估系统,用以解决上述现有技术存在的问题。
[0022]
为达到上述目的,本发明提供了一种用于胃癌患者的预后风险评估系统,其包括:
[0023]
胃癌甲基化数据获取模块,用于从ucsc xena数据库中获取tcga胃癌甲基化谱以及从geo数据库中获取胃癌甲基化谱数据集gse30601,其中,tcga胃癌甲基化谱包括第一甲基化数据集和第二甲基化数据集,第一甲基化数据集为illumina humanmethylation450 beadchip并且包含2个正常样本和395个胃癌样本,第二甲基化数据集为illumina humanmethylation27beadchip并且包含25个正常样本和48个胃癌样本,胃癌甲基化谱数据集gse30601包含94个正常样本和203个胃癌样本;
[0024]
差异甲基化位点获取模块,其用于执行以下操作:将tcga胃癌甲基化谱作为训练集,将胃癌甲基化谱数据集gse30601作为验证集,对训练集中的27个正常样本和443个胃癌样本中的甲基化数据进行背景校正和归一化处理,以|logfc|>m,fdr<n为阈值,利用wilcox.test筛选胃癌样本中显著差异甲基化位点,在胃癌样本中筛选出多个高甲基化位点和多个低甲基化位点,其中,fc为差异倍数,fdr为错误发现率,再利用r软件包pheatmap绘制胃癌中差异甲基化位点的甲基化热图;
[0025]
预后模型构建模块,将多个高甲基化位点和多个低甲基化位点分别对应的甲基化值与对应患者的生存数据进行合并,以p<0.01为阈值,p为对患者进行分类的阈值,进行单变量cox比例风险回归分析,得到能够显著影响胃癌患者生存的甲基化位点,通过lasso回归分析去除冗余甲基化位点后进行t次模拟,通过交叉验证获取去除重叠后的甲基化位点,得到剩余的n个预后相关的差异甲基化位点,对n个预后相关的差异甲基化位点利用多变量cox回归分析构建每个患者的11

dna甲基化位点风险评分公式:
[0026]
riskscore=[cg07990939甲基化水平*(

8.908)]+[cg08317263甲基化水平*(

1.739)]+[cg10301990甲基化水平*(

4.088)]+[cg10968649甲基化水平*(

20.267)]+[cg13801416甲基化水平*(

1.009)]+[cg19614321甲基化水平*(

1.779)]+[cg20074795甲基化水平*(12.778)]+[cg21052164甲基化水平*(

0.941)]+[cg26069252甲基化水平*(7.734)]+[cg26089280甲基化水平*(

8.569)]+[cg27662379甲基化水平*(

7.672)],
[0027]
riskscore为患者的11

dna甲基化位点风险评分,上式中的甲基化标记物的特征及其相关系数如下表:
[0028][0029]
在本发明的一实施例中,m为1,n为0.01。
[0030]
在本发明的一实施例中,t为10000。
[0031]
本发明提供的用于胃癌患者的预后风险评估系统具有以下有益技术效果:
[0032]
1.从tcga、geo数据库中下载了大量的胃癌甲基化谱、表达谱及临床数据;构建了胃癌预后模型,为筛选胃癌预后预测分子标志物提供了新的理论依据;
[0033]
2.构建的胃癌预后模型能够很好的预测胃癌及胃癌患者的预后生存,敏感性与特异性优于其他同类型模型;
[0034]
3.筛选的甲基化位点比较新颖,后续对这些甲基化位点的研究将具有重要的意义。
[0035]
4.据查证,该模型为首个11

差异甲基化位点胃癌预后模型,位点少,成本低。
附图说明
[0036]
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0037]
图1为胃癌的临床病例特征;
[0038]
图2为胃癌中差异甲基化位点的甲基化热图;
[0039]
图3为单变量cox比例风险回归分析结果中最显著差异的前20个甲基化位点的森林图;
[0040]
图4为lasso回归分析,进行10000次模拟的结果;
[0041]
图5为lasso回归分析中每个甲基化位点对应的coefficients值;
[0042]
图6为tcga胃癌数据集中预后模型所含的差异甲基化位点在低风险组和高风险组中甲基化热图;
[0043]
图7为预后模型的roc分析;
[0044]
图8为预后模型相关差异甲基化位点的kaplan

meier生存分析;
[0045]
图9为通过r软件包survival进行单因素独立预后分析的森林图;
[0046]
图10为通过r软件包survival进行多因素独立预后分析的森林图;
[0047]
图11为对胃癌中11个差异甲基化位点的预后模型进行roc分析的结果图。
具体实施方式
[0048]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有付出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0049]
本发明公开了一种用于胃癌患者的预后风险评估系统,其包括:
[0050]
胃癌甲基化数据获取模块,用于从ucsc xena数据库中获取tcga胃癌甲基化谱以及从geo数据库中获取胃癌甲基化谱数据集gse30601,其中,tcga胃癌甲基化谱包括第一甲基化数据集和第二甲基化数据集,第一甲基化数据集为illumina humanmethylation450 beadchip并且包含2个正常样本和395个胃癌样本,第二甲基化数据集为illumina humanmethylation27beadchip并且包含25个正常样本和48个胃癌样本,胃癌甲基化谱数据集gse30601包含94个正常样本和203个胃癌样本;
[0051]
ucsc xena数据库的网址为https://xena.ucsc.edu/,geo数据库的网址为https://www.ncbi.nlm.nih.gov/geo/,该两个数据库中的数据均是公开的,故本发明涉及的研究不需要道德批准或知情同意,可以参考文献[16]和[17]。如图1所示为胃癌的临床病例特征。
[0052]
差异甲基化位点获取模块,其用于执行以下操作:将tcga胃癌甲基化谱作为训练集,将胃癌甲基化谱数据集gse30601作为验证集,对训练集中的27个正常样本和443个胃癌样本中的甲基化数据进行背景校正和归一化处理,以|logfc|>m,fdr<n为阈值,利用wilcox.test筛选胃癌样本中显著差异甲基化位点,在胃癌样本中筛选出多个高甲基化位点和多个低甲基化位点,其中,fc为差异倍数,fdr为错误发现率,再利用r软件包pheatmap绘制胃癌中差异甲基化位点的甲基化热图;
[0053]
本实施例中,取m为1,n为0.01,在胃癌样本中筛选出高甲基化位点的个数为1842,低甲基化位点的个数为899,如图2所示为胃癌中差异甲基化位点的甲基化热图。
[0054]
预后模型构建模块,将多个高甲基化位点和多个低甲基化位点分别对应的甲基化值与对应患者的生存数据进行合并,以p<0.01为阈值,p为对患者进行分类的阈值,进行单变量cox比例风险回归分析,得到能够显著影响胃癌患者生存的甲基化位点,通过lasso回归分析去除冗余甲基化位点后进行t次模拟,通过交叉验证获取去除重叠后的甲基化位点,得到剩余的n个预后相关的差异甲基化位点,对n个预后相关的差异甲基化位点利用多变量cox回归分析构建每个患者的11

dna甲基化位点风险评分公式:
[0055]
riskscore=[cg07990939甲基化水平*(

8.908)]+[cg08317263甲基化水平*(

1.739)]+[cg10301990甲基化水平*(

4.088)]+[cg10968649甲基化水平*(

20.267)]+[cg13801416甲基化水平*(

1.009)]+[cg19614321甲基化水平*(

1.779)]+[cg20074795甲基化水平*(12.778)]+[cg21052164甲基化水平*(

0.941)]+[cg26069252甲基化水平*(7.734)]+[cg26089280甲基化水平*(

8.569)]+[cg27662379甲基化水平*(

7.672)],
[0056]
riskscore为患者的11

dna甲基化位点风险评分,上式中的甲基化标记物的特征及其相关系数如下表:
[0057][0058]
上表中,hr为危险比;ci为95.0%置信区间;se为系数标准误差;z值为wald z

统计值。
[0059]
本实施例中,能够显著影响胃癌患者生存的甲基化位点共有137个,其中,最显著差异的前20个甲基化位点的森林图如图3所示,t取值为10000,n为25。图4为lasso回归分析,进行10000次模拟的结果;图5为lasso回归分析中每个甲基化位点对应的coefficients值,图6为tcga胃癌数据集中预后模型所含的差异甲基化位点在低风险组和高风险组中甲基化热图。图7为预后模型的roc分析,由图7可知,所构建的预后模型auc值为0.747,这表明基于胃癌中差异表达甲基化位点的预后模型在生存预测中具有一定潜力。图8为预后模型相关差异甲基化位点的kaplan

meier生存分析,横坐标为生存时间,纵坐标为生存率,图形底部轴线上每个时间点高低风险的病人数目,由图8可以确定构建的差异甲基化位点相关的预后模型在预测胃癌患者临床预后中的作用,以得知高危和低危人群之间的不同生存时间,kaplan

meier分析显示,高危组的患者生存率明显低于低危组。
[0060]
本案发明人还进行了以下研究:
[0061]
为了解预后模型以及胃癌患者的不同临床特征对预后生存的影响,从tcga数据库胃癌临床数据中获得了所有样本的表型信息,并单独提取风险模型样本,以及对应的年龄,性别等表型及临床信息,对风险模型中这些信息与患者的生存状况进行合并,最后剩余315
breast cancer[j].frontiers in pharmacology,10:140
[0069]
[17]kurashige j,hasegawa t,niida a,et al.2016.integrated molecular profiling of human gastric cancer identifies ddr2 as a potential regulator of peritoneal dissemination[j].scientific reports,6:22371
[0070]
[18]zhang c,zhang b,meng d,et al.2019.comprehensive analysis of dna methylation and gene expression profiles in cholangiocarcinoma[j].cancer cell international,19:352
[0071]
[19]xu r,wei w,krawczyk m,et al.2017.circulating tumour dna methylation markers for diagnosis and prognosis of hepatocellular carcinoma[j].nature materials,16(11):1155

1161
[0072]
[20]n,ahmad a,thorat m,et al.2014.dna methylation gene

based models indicating independent poor outcome in prostate cancer[j].bmc cancer,14:655
[0073]
本发明提供的用于胃癌患者的预后风险评估系统具有以下有益技术效果:
[0074]
1.从tcga、geo数据库中下载了大量的胃癌甲基化谱、表达谱及临床数据;构建了胃癌预后模型,为筛选胃癌预后预测分子标志物提供了新的理论依据;
[0075]
2.构建的胃癌预后模型能够很好的预测胃癌及胃癌患者的预后生存,敏感性与特异性优于其他同类型模型;
[0076]
3.筛选的甲基化位点比较新颖,后续对这些甲基化位点的研究将具有重要的意义。
[0077]
4.据查证,该模型为首个11

差异甲基化位点胃癌预后模型,位点少,成本低。
[0078]
本案涉及的部分英文缩写及其对应的中文含义如下:
[0079]
tcga:《癌症基因组图集》;geo:基因表达综合;lasso:最小绝对收敛和选择算子;fdr:错误发现率;gsea:基因集富集分析;riskscore:胃癌预后风险评分;roc:受试者工作特征;cep290:中央体蛋白290;ccdc69:包含69的螺旋线圈域;ubxn8:ubx结构域蛋白8;kdm4a:赖氨酸脱甲基酶4a;akr1b:醛酮还原酶家族1部件b;rassf2:ras相关域家族成员2;kdelr3:kdel内质网的蛋白受体3;chrnb2:胆碱能受体烟碱β2亚基;egr1:早期生长反应1;armc9:犰狳重复包含9;rpn1:核黄素1。
[0080]
本领域普通技术人员可以理解:附图只是一个实施例的示意图,附图中的模块或流程并不一定是实施本发明所必须的。
[0081]
本领域普通技术人员可以理解:实施例中的装置中的模块可以按照实施例描述分布于实施例的装置中,也可以进行相应变化位于不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
[0082]
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明实施例技术方案的精神和范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1