基于COX比例风险模型的十二指肠腺癌预后预测系统的制作方法

文档序号:15148033发布日期:2018-08-10 20:41阅读:283来源:国知局

本发明涉及一种基于cox比例风险模型的十二指肠腺癌预后预测系统。



背景技术:

原发性十二指肠腺癌是一种罕见但极具侵袭性的恶性肿瘤,占胃肠恶性肿瘤的0.5%以下,尽管十二指肠占小肠长度的10%以下,但约占小肠肿瘤的45%。因涉及胆、胰、门静脉和肠系膜血管等脏器及组织,导致十二指肠腺癌解剖部位的特殊性以及临床症状的非特异性,往往引起诊断延迟,预后不佳等后果。目前临床上主要运用tnm分期对十二指肠腺癌进行预后评估。tnm分期主要考察肿瘤的对十二指肠腺癌的侵犯深度、淋巴结转移和远端转移状情况,然而由于没有纳入患者年龄、性别、分化、肿瘤大小等影响预后的危险因素,所以尚无法准确评估、预测临床上肿瘤病人的预后。

近年来各种生物信息挖掘技术的出现导致大数据时代应运而生,各种复杂系统方法的运用,使疾病变量间相互关系得到充分体现。但目前尚未建立基于临床特征的十二指肠腺癌术后预后预测系统。



技术实现要素:

本发明要克服现有技术上的缺点,提供一种基于cox比例风险模型的十二指肠腺癌术后预后预测系统。

本发明根据对十二指肠腺癌数据进行特征筛选,对筛选出的多个特征进行cox多元回归模型建立十二指肠腺癌术后预后预测系统,实现对十二指肠腺癌术后预后精准预测,用于评估患者的术后3年以及5年的生存率,为临床决策提供支持。

本发明通过系统考察影响十二指肠腺癌患者预后状态的临床病理特点,评价影响十二指肠腺癌患者生存预后的关键因素,建立用于十二指肠腺癌患者生存预后的可视化列线图,用于评估患者的术后3年以及5年的生存率,筛选出高危人群进行干预,提高患者的生存预后。

基于cox比例风险模型的用于十二指肠腺癌患者术后预后预测系统,包括存储器和信息处理模块、预测结果显示器,其中,所述信息处理模块配置用于执行以下计算,并将计算结果与,所述的存储器预存的十二指肠腺癌术后预后预测指标进行比较,向预测结果显示器输出预测结果:

(i)根据以下关系计算各风险因子的分数:

(1)年龄分数:

年龄x小于等于58岁,分数为0;

年龄x在59岁至75岁之间,分数为31;

年龄x大于等于75,分数为70;

(2)肿瘤分化程度:

高分化,0分;

中分化,5分;

低分化,16分;

未分化,49分;

(3)肿瘤t分期:

t1,0分;

t2,54分;

t3,82分;

t4,100分;

(4)淋巴结转移:

无淋巴结转移,0分;

1-3个区域淋巴结转移,15分;

≥4个区域淋巴结转移,39分;

(5)远处转移:

无远处转移,0分;

有远处转移,44分;

(ii)对(i)所获得的全部分数求和,计算得到总体分数z;和

(iii)根据以下关系计算患者3年生存率(y3)或5年生存率(y5):

如下计算3年生存率:

总体分数z≤40分,则3年生存率y3≥90%;

40<总体分数z<213分,则3年生存率y3=1.192-z/200;

总体分数≥213,则3年生存率y3<10%;

如下计算5年生存率:

总体分数z≤25分,则5年生存率y5≥90%;

97<总体分数z<17分,则5年生存率y5=1.116-z/200;

总体分数z>197分,则59年生存率y5<10%。

本发明系统还包括一个十二指肠腺癌术后预后预测指标构建模块,十二指肠腺癌术后预后预测指标构建模块包括:

数据收集子模块:在seer数据库中,通过perl程序抓取得到十二指肠腺癌数据,对十二指肠腺癌数据进行筛选,并对筛选结果进行下载和提取;

数据预处理子模块:与所述数据收集子模块相连,用于对高通量数据进行预处理,包括缺失删除,使用特征二值化进行标准化处理,使用excel表进行数据汇总;得到预处理后数据;

数据转换子模块:与所述筛选子模块相连,用于对十二指肠腺癌术后预后不良的数据集进行,随机分配,形成训练数据集和内部验证数据集;

特征筛选子模块:对训练数据集进行特征筛选,选出使预测准确度达到最高的最少特征的集合,即用于模型构建的特征集合;所述特征筛选为:使用spss程序中的cox比例风险模型,构造特征排序系数,每次迭代去掉一个排序系数最小的特征,最终得到所有特征的递减排序;选出使预测准确度达到最高的最少特征的集合,即用于十二指肠腺癌术后预后预测指标建立的特征集合;预后相关因素判定标准为:死亡组与存活组的临床特征预后相关性的p值<0.05的因素;

指标建立子模块:使用所述特征集合和训练数据集,采用cox回归模型,使用r程序中的cph程序包构建十二指肠腺癌术后预后预测指标。

seer(surveillance,epidemiology,andendresultsdatabase)数据源是美国国立癌症研究所建立的大型肿瘤登记注册数据库,收集了大量循证医学的相关数据。官网网址如下:https://seer.cancer.gov/

本发明所用的样本数据为年龄范围在18岁以上的样本数据;本发明所用的样本数据十二指肠腺癌作为原发肿瘤存在的样本数据;

死亡组与存活组的临床特征预后相关性的p值<0.05的因素,例如可以是0.04、0.03、0.02、0.01或0.005以及上述数值之间及更低的具体点值,限于篇幅及出于简明的考虑,本发明不再穷尽列举所述范围包括的具体点值。

本发明有益效果是:通过系统考察影响十二指肠腺癌患者预后状态的临床病理特点,评价影响十二指肠腺癌患者生存预后的关键因素,建立用于十二指肠腺癌患者生存预后的可视化列线图,用于评估患者的术后3年以及5年的生存率,筛选出高危人群进行干预,提高患者的生存预后。

附图说明

图1:根据十二指肠腺癌患者预后和临床特征建立的可视化列线图。

图2a~图2d是来自seer数据库的训练集以及137例来浙江大学附属第二医院及邵逸夫医院的十二指肠腺癌患者组成的外部验证集的3年及5年预测生存率和实际无病生存率对比图,其中图2a是seer数据库训练集实际与预测系统预测的三年无病生存率对比图,图2b是外部验证集实际与预测系统预测的三年无病生存率对比图,图2c是seer数据库训练集实际与预测系统预测的五年无病生存率对比图,图2d是外部验证集实际与预测系统预测的五年无病生存率对比图。

具体实施方式

下面结合附图进一步说明本发明的技术方案。

一种基于cox比例风险模型十二指肠腺癌术后预后预测系统。

下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结果。本文中,“系统”指载有本文所述信息(例如下文所述的列线图)或执行本文所述功能以获得本文所述分数和生存率信息的制品。

因此,作为一个例子,系统可以是其上设置有列线图的印刷品,例如卡片。本文中,“卡片”通常指片状的制品,其材质可以是纸质或塑料或其它材料。卡片的厚度不限,但从方便使用的角度考虑,卡片不宜太厚。例如,卡片可以是常规的打印用纸张,或者为塑料薄片,其厚度可以是例如1mm到1cm或更薄。可用常规的印刷技术将列线图印刷到卡片(例如纸张上),以不易涂抹、洗脱为宜。列线图通常至少包括与分数行并排的风险因子行,和与总体分数行并排的3年生存率行和/或5年生存率行。

其中,分数行与风险因子行的排列满足以下关系:

(1)患者年龄:

年龄x小于等于58岁,分数为0;

年龄x在59岁至75岁之间,分数为31;

年龄x大于等于75,分数为70;

(2)肿瘤分化程度:

高分化,0分;

中分化,5分;

低分化,16分;

未分化,49分;

(3)肿瘤t分期:

t1,0分;

t2,54分;

t3,82分;

t4,100分;

(4)淋巴结转移:

无淋巴结转移,0分;

1-3个区域淋巴结转移,15分;

≥4个区域淋巴结转移,39分;

(5)远处转移:

无远处转移,0分;

有远处转移,44分;

其中,3年生存率行与总体分数行之间的排列满足以下关系:

总体分数z≤40分,则3年生存率y3≥90%;

40<总体分数z<213分,则3年生存率y3=1.192-z/200;

总体分数≥213,则3年生存率y3<10%;

年生存率行与总体分数行之间的排列满足以下关系:

总体分数z≤25分,则5年生存率y5≥90%;

97<总体分数z<17分,则5年生存率y5=1.116-z/200;

总体分数z>197分,则59年生存率y5<10%;

列线图中,分数行中分数的范围通常为0-100分,总体分数行的分数范围通常为0-300分。

图1显示了本发明列线图的一个具体实施例。如图1所示,列线图包括并排的分数行、患者年龄行、肿瘤的分化程度行、肿瘤t分期行、淋巴结侵犯行、远处转移状态行、总体分数行、3年生存率行和5年生存率行,其中,与分数行并排的患者年龄行、肿瘤的分化程度行、肿瘤t分期行、淋巴结侵犯行、远处转移状态行、总体分数行以满足前文所述的对应关系的方式并排,而与总体分数行并排的3年生存率行和5年生存率行则以满足前文所述的对应关系的方式并排。使用该列线图时,可按照患者年龄、肿瘤的分化程度、肿瘤t分期、淋巴结侵犯及远处转移状态等相关指标所对应的风险分数,计算各项风险因子分数之和,然后对照着总体分数行,按照总体分数向下画垂直线即可得到患者3年和5年的生存率值。生存率值越低,则预后越差。

由于风险因子患者年龄、肿瘤的分化程度、肿瘤t分期、淋巴结侵犯及远处转移状态的每一种检测/检查结果都仅对应一个确定的分数,因此,如前文所述,列线图中可不包括患者年龄行、肿瘤的分化程度行、肿瘤t分期行、淋巴结侵犯行、远处转移状态行,或仅包括其中的一种或数种。对于列线图中不包括的行,可以其它合适的方式提供在印刷品如卡片上,例如以文字描述的方式提供,或者不提供在印刷品如卡片上,但提供在例如使用手册上,以使使用者能够容易地知晓该风险因子的每一种检测/检查结果所对应的分数。

优选的实施例中,前文所述各项风险因子及其对应的分数都提供到同一张印刷品(如同一张卡片)上,不论以图表的方式还是以文字描述的方式。因此,在某些优选的实施例中,本发明的卡片上印刷有图1所示的列线图。但是,应理解的是,例如,总体分数行和3年生存率行和/或5年生存率行可提供在不同的印刷品(如卡片)上。因此,在本文中,“印刷品”和“卡片”本身可以是一张,也可以是两张或多张。

应理解,印刷品(如卡片)的尺寸应足以使得使用者能清晰辨认列线图中的各文字和数值。当印刷品(如卡片)上印刷有图1所示的列线图时,列线图的大小可根据卡片的尺寸等比例放大或缩小。

此外,应理解的是,列线图中的相应文字,可以图1所示的方式呈现,也可以本领域周知的具有相同含义的方式呈现。例如,可以不同的语言(中文、英文、日文等)形式提供。

系统也可以是一种信息处理设备,包括例如存储器和处理器,其中,所述处理器配所述信息处理设备还可包括本领域周知的其它部件,包括但不限于输入装置、显示装置、识别装置等。

载体还可以是其它合适的制品形式,例如,可以是除卡片以外的其它各种形式的印刷品,只要其能允许本领域技术人员根据本文所述方法容易地计算患者各风险因子的分数以及3年生存率和5年生存率即可。在某些实施方案中,载体不包括所述信息处理设备。

实施例1

本实施例提供了基于十二指肠腺癌患者预后预测系统的一种技术方案,本实施例提供的系统可以由系统装置来执行,该装置集成在一台计算机设备中,所述方法具体包括以下步骤:

数据收集

选择数据源:选用seer(surveillance,epidemiology,andendresultsdatabase)数据库作为数据源。698例十二指肠腺癌患者符合入组标准成为本文构建预后预测系统的数据集。

自2006年1月至2012年12月,发明人回顾性的收集了在浙江大学附属第二医院以及邵逸夫医院接受手术治疗的十二指肠腺癌患者,并用和seer数据集相类似的入组和排除标准进行了筛查,共得到137例符合标准的十二指肠腺癌患者,成为研究的外部验证集。

基本信息收集

针对外部验证入组的每个患者,发明人利用电子病例系统收集并整理其基本人特征信息。临床诊断信息来自患者的疾病诊断纪录和临床检测、病理检测纪录。治疗方案来自病人手术记录,并由相关医生对患者疾病史和手术方案进行仔细再评价。随访每半年进行一次,随访信息包括患者转移、复发、死亡等,采取电话或信件随访。

十二指肠腺癌临床分期系统

针对每个十二指肠腺癌患者,发明人利用低7版ajcc-tnm分期对其临床分析进行了定性。

统计建立系统和验证方法

主要考察的十二指肠腺癌患者的预后指标为(disease-freesurvival,dfs),定义为手术日期至疾病复发或疾病进展导致患者死亡的时间。首先利用kaplan-meier图和log-rank检验考察患者临床病理特征和dfs之间的关系,并利用cox比例风险回归模型考察影响患者dfs的独立风险因素。

基于多元回归模型结果,发明人利用逐步回归模型选择了用于预后预测的最佳统计模型,并利用akaikeinformationcriterion(aic)参数考察了模型的效能。进一步利用c-index考察了该模型再预后预测中的准确性,并利用1000次自举抽样法对模型进行模拟验证。为了比较不同分期模型在肿瘤病人预后预测中的准确性,发明人一方面比较不同模型的c-index值来比较不同时间点的模型预测准确性。

研究数据结果

训练集发现显著影响十二指肠腺癌患者预后的关键因素

利用seer数据集样本,发明人通过统计分析发现患者年龄、肿瘤粉分化程度、肿瘤t分期、淋巴结侵犯及远处转移状态和患者预后显著相关(表1)。

表1

表1:多因素cox比例回归模型发现患者年龄、肿瘤分化程度、肿瘤浸润程度、淋巴结侵犯及远处转移状态是影响十二指肠腺癌患者预后的独立因素。

通过统计模型计算,本发明人利用上述风险因素构建了影响十二指肠腺癌患者的列线图模型(图1)。该列表的使用方法为:第一行为不同风险因子在不同分组时的分数,按照患年龄、肿瘤分化程度、肿瘤t分期、淋巴结侵犯及远处转移状态等相关指标所对应的风险分数之和对应着总体分数行,按照总体风险分数向下画垂直线即可得到患者3年和5年的生存率值。

本发明验证了该预后预测系统在训练集中的预测准确性,发现预测和观察到的十二指肠腺癌患者的3年和5年无病生存率比较一致,c-index为(0.693;95%ci,0.673-0.710)。

本发明中的列线图相对于传统模型的优势比较本发明中构建的预后预测系统和传统预测模系统在预后预测中的价值和差异发现,本发明所构建的预后预测系统显著优于第7版ajcc-tnm分期。

seer数据集内部验证数据对列线图的预测验证

我们利用140例同样来seer数据集的十二指肠腺癌患者临床特征数据和预后数据对其进行分析和验证,发现该列线表能够较好的预测患者3年及5年无病生存率,c-index(0.681;95%ci,0.642-0.719),与传统分期系统相比,该风险值能够更好的预测十二指肠腺癌患者的生存预后。

不同医院来源的病人对列线图预后预测的验证

我们利用137例同样来自浙江大学附属第二医院及邵逸夫医院的十二指肠腺癌患者临床特征数据和预后数据对其进行分析和验证,同样发现该列线图能够较好的预测患者3年及5年无病生存率,c-index(0.677;95%ci,0.634-0.719),与传统分期系统相比,该风险值能够更好的预测十二指肠腺癌患者的生存预后。

总结:综上所述,本发明利用训练集设计一套对十二指肠腺癌预后进行预测的列线图用于患者3年和5年的生存预后预测,该风险预测系统相对于传统分期系统能够更加准确的对患者的死亡风险进行预测,具有临床应用价值。

注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求书决定。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1