用于预测胰腺癌患者预后系统

文档序号:32524101发布日期:2022-12-13 20:31阅读:30来源:国知局
用于预测胰腺癌患者预后系统

1.本发明涉及生物医药领域,尤其涉及一种用于预测胰腺癌患者预后系统。


背景技术:

2.胰腺癌(paad)是总体肿瘤类型中最致命的癌症之一。由于paad发病隐匿、异质性强,在早期不易发现,仅在疾病晚期出现,导致5年生存率极低,仅为~10%。有机会接受手术切除的患者比例不到20%。此外,接受完全肿瘤切除的paad患者通常会在2年内出现局部或远处复发。因此,paad治疗仍然是一个重大挑战,
3.paad的不良预后可能是由于其侵袭转移、对治疗产生耐药,缺乏早期筛查标志物和诊断方法所致。传统的预后预测方法是基于患者年龄、一般健康状况、合并症和耐受治疗的能力,还包括组织学分级、淋巴结或远处转移、血管和血管周围浸润和ca199等临床病例特征。然而,由于paad的肿瘤异质性和恶性程度之高,迄今为止几乎没有临床益处。
4.目前已有一些研究人员提出了胰腺癌的预后标志物模型。如:窦等人构建了一个8-mirna特征来预测早期胰腺癌的预后;冯等人构建了胰腺腺癌预后的癌症干细胞相关特征;吴等人报道了基于tcga和geo队列的9基因特征的胰腺癌预测模型。但上述预测模型的特异性和敏感性仍不足,有待进一步提升。


技术实现要素:

5.针对上述技术中存在的不足之处,本发明提供一种用于预测胰腺癌患者预后系统,通过结合了多个独立的预后变量,建立相关的列线图,稳健地预测了风险和基于临床分期、年龄和其他因素,以及mirna表达,改善胰腺癌患者的的临床管理,允许更多个性化的治疗选择。
6.为实现上述目的,本发明提供一种用于预测胰腺癌患者预后系统,包括以下步骤:
7.基因候选:利用r包从数据库中下载胰腺癌的mirna和mrna和临床数据,并且对这些数据进行处理,构建cox候选模型,筛选得到mirna;
8.预后模型构建:以胰腺癌患者相关信息和3年生存概率进行录入从而构建预后模型,得到列线图;
9.模型验证:将组织样本代入预后模型中,计算相关基因表达评分,验证是否满足设定需求。
10.作为优选,在基因候选步骤中,处理过程如下:
11.a1:在癌症基因组图谱中下载胰腺癌的mirna和mrna和临床数据;
12.a2:通过归一化处理后,利用r软件中的deseq2筛选出mrna差异基因;
13.a3:利用3个r包mirnatap,multimir和hoarder找到差异mirna的靶基因,并且根据该靶基因进行go注释和kegg途径进行分析;
14.a4:使用r包中的edger包进行分析,通过经验贝叶斯方法调整过度分散的程度,使用limma计算cpm,只考虑cpm大于1的基因;使用广义线性模型和似然比检验来确定显着性
和倍数变化;
15.a5:利用lasso回归从差异mirna构建cox模型,获得了mir-934及其组合基因mir-4444-2、mir-1301和mir-3655用于随后分析胰腺癌预后预测。
16.作为优选,基于一致性指数和校准曲线,利用cox模型分析评估胰腺癌数据集中四种mirna特征的预后能力。
17.作为优选,在预后模型构建的过程中,将胰腺癌患者的临床特点以及4个mirna特制的预后能力相结合,通过“rms”r包构建列线图;设置数据输入模块和模型计算模块,数据输入模块用于将胰腺癌患者的年龄、性别、肿瘤分期、风险评分的检测结果及3年生存概率输入模型计算模块。
18.作为优选,在模型计算模块中,性别得分的规则为男性为0分,女性为22.4138分;年龄得分的规则:年龄小于40为0分,年龄超过40岁为46.3126分;肿瘤分期得分的规则:低级别为0分,高级别为27.3199分;转移情况:远距离转移为0分,复发为100分;风险评分:低风险为0分,高风险为90分。
19.作为优选,在风险评分的计算过程中,根据胰腺癌患者的mirna的表达量来进行计算,当计算结果,当结果小于0.05时,认定为低风险,否则为高风险。
20.作为优选,风险值的计算公式为:风险值公式:风险值=0.264381*(mir-934表达量)+2.425911*(mir-4444-2表达量)-0.89247*(mir-1301表达量)-4.10131*(mir-3655表达量)。
21.作为优选,将所有的指标在计分条上的分数相加,得到的总分最终确认用于根据胰腺癌患者预后情况;得到的总分越低,胰腺癌患者的生存概率越高,则提示该胰腺癌患者预后良好、生存期长的可能性越大。
22.作为优选,在模型验证步骤中,通过原位杂交对多名胰腺癌患者进行4种mirna的表达分析,然后通过模型进行打分并与预后信息相结合,验证模型是否符合设定需求。
23.本发明的有益效果是:与现有技术相比,本发明提供的用于预测胰腺癌患者预后系统,首先通过建立相关模型进行筛选和计算,得到符合要求的四种mirna,并且分析评估胰腺癌数据集中四种mirna特征的预后能力,根据预后能力和多个独立的预后变量,建立相关的列线图;然后通过建立相关的计算公式,根据胰腺癌患者预后变量进行分数相加,最终利用得到的总分来确认胰腺癌患者预后情况,经过验证本模型的预测精度可达到0.823,明显超过最新的第七版tnm分期的预测精确度(0.784),具有精确度高、个体化预测的优势,对于临床工作中患者个体化治疗策略的选择具有很好的指导作用。
附图说明
24.图1为本发明的deseq2筛选出的差异mirna基因图;
25.图2为本发明的3个r包筛选处理靶基因图;
26.图3为本发明的风险预测模型图;
27.图4为本发明的绘制校准图;
28.图5为本技术的模型特征图;
29.图6为本技术的列线图;
30.图7为本技术的荧光信号图。
具体实施方式
31.为了更清楚地表述本发明,下面结合附图和具体实施例对本发明作进一步地描述,当然本发明的技术方案不仅仅于此,在不付出创造性劳动前提下对本技术进行的改进,都属于本发明的保护范围。
32.请参阅图1至图6,本发明公开了一种用于预测胰腺癌患者预后系统,包括以下步骤:基因候选:利用r包从数据库中下载胰腺癌的mirna和mrna和临床数据,并且对这些数据进行处理,构建cox候选模型,筛选得到mirna;预后模型构建:以胰腺癌患者相关信息和3年生存概率进行录入从而构建预后模型,得到列线图;
33.模型验证:将组织样本代入预后模型中,计算相关基因表达评分,验证是否满足设定需求。在本实施例中,首先通筛选得到相关的mirna,利用该mirna来实现对列线图的构建数据之一,从而使得预后模型能对胰腺癌的患者进行准确的预测,对于临床工作中患者个体化治疗策略的选择具有很好的指导作用。
34.更为具体的是,在基因候选步骤中,处理过程如下:a1:在癌症基因组图谱中下载胰腺癌的mirna和mrna和临床数据;a2:通过归一化处理后,利用r软件中的deseq2筛选出mrna差异基因;a3:利用3个r包mirnatap,multimir和hoarder找到差异mirna的靶基因,并且根据该靶基因进行go注释和kegg途径进行分析;a4:使用r包中的edger包进行分析,通过经验贝叶斯方法调整过度分散的程度,使用limma计算cpm,只考虑cpm大于1的基因;使用广义线性模型和似然比检验来确定显着性和倍数变化;a5:利用lasso回归从差异mirna构建cox模型,获得了mir-934及其组合基因mir-4444-2、mir-1301和mir-3655用于随后分析胰腺癌预后预测。在具体的实施过程中,首先在癌症基因组图谱数据库中,利用tcgabiolinks r包下载胰腺癌mirnamrna的rpkm和count数据;共纳入169例(其中转移性n=28;非转移性n=141)具有表达数据的病例,基因表达谱通过log2归一化以供进一步分析,然后利用r软件中的deseq2筛选出mrna差异基因abs(logfc)》1&padj《0.05,其中abs(logfc)》1&padj《0.05的含义是:差异基因表达量的差异倍数绝对值大于2且校正后的差异显著性概率小于0.05;采用本差异基因的筛选方法,最终获得11个差异mirna,上调2个,下调9个;然后根据差异筛选的3个r包mirnatap,multimir以及hoarder找到差异mirna的靶基因,差异mirna442个,其中上调基因82个,下调基因360个;在获得差异mirna后,通过生存预后分析,发现只有mirna934高表达与胰腺癌预后不良显著相关,因此进一步,基于mirna934,我们通过tcga rna-seq和mirna illuminahiseq进行差异表达分析。使用r中的edger包进行分析,通过经验贝叶斯方法调整过度分散的程度。使用limma计算cpm,只考虑cpm大于1的基因。使用广义线性模型和似然比检验来确定显着性和倍数变化(fc)。当调整后的p值(通过benjamini-hochberg方法)小于0.05且fc大于1.5时,差异表达基因被筛选为具有统计学意义,通过上面的方法,利用lasso回归从差异mirna构建cox模型。消除了系数为零的mirna,获得了mir-934、及其组合基因mir-4444-2、mir-1301和mir-3655用于随后分析胰腺癌预后预测。
35.请参阅图3,采用单变量和多变量cox回归分析以在验证队列中生成和验证4-mirna(mir-934、mir-4444-2、mir-1301和mir-3655)风险预测模型。然后,将训练集和测试集中的胰腺癌患者按照中位风险评分临界值分为高危组和低危组,其中a为训练集分析结果,b为验证集验证结果。利用cox分析评估胰腺癌数据集中四种mirna特征的预后能力,其结果用于构建r中带有“rms”包的多个列线图。模型的判别是基于一致性指数(c-index)和
校准曲线(p《0.05)。此外,进行kaplan-meier生存分析以评估两组的差异。同时,对数秩检验用于计算统计学显着性,p《0.05为显著性。
36.请参阅图4,在预后模型构建的过程中,将胰腺癌患者的临床特点以及4个mirna特制的预后能力相结合,通过“rms”r包构建列线图;设置数据输入模块和模型计算模块,数据输入模块用于将胰腺癌患者的年龄、性别、肿瘤分期、风险评分的检测结果及3年生存概率输入模型计算模块。在本实施例中,通过绘制校准来评估列线图的准确性和判别力。
37.更为具体的是,在模型计算模块中,性别得分的规则为男性为0分,女性为22.4138分;年龄得分的规则:年龄小于40为0分,年龄超过40岁为46.3126分;肿瘤分期得分的规则:低级别为0分,高级别为27.3199分;转移情况:远距离转移为0分,复发为100分;风险评分:低风险为0分,高风险为90分。其中在风险评分的计算过程中,根据胰腺癌患者的mirna的表达量来进行计算,当计算结果,当结果小于0.05时,认定为低风险,否则为高风险。其中风险值的计算公式为:风险值公式:风险值=0.264381*(mir-934表达量)+2.425911*(mir-4444-2表达量)-0.89247*(mir-1301表达量)-4.10131*(mir-3655表达量)。将所有的指标在计分条上的分数相加,得到的总分最终确认用于根据胰腺癌患者预后情况;得到的总分越低,胰腺癌患者的生存概率越高,则提示该胰腺癌患者预后良好、生存期长的可能性越大。
38.在模型验证步骤中,通过原位杂交对多名胰腺癌患者进行4种mirna的表达分析,然后通过模型进行打分并与预后信息相结合,验证模型是否符合设定需求。更为具体的是,利用胰腺癌患者临床队列的组织样本(90例样本,含有完整的临床病理信息和随访信息),以验证本发明的模型预后能力。通过原位杂交对90名胰腺癌患者进行4中mirna(mir934,mir4444-2,mir3655,mir1301)的表达分析。荧光信号代表mirna的阳性表达。分数代表组织样本中mirna的表达(即25%阳性表达率=1分,50%阳性表达率=2分,75%阳性表达率=3分,100阳性表达率=4分)。我们计算了基于4种mirna表达评分,发现高危人群(即mir-934、mir-4444-2高表达、mir-1301、mir-3655低表达),进一步结合患者的性别,年龄,分期及转移情况,通过我们的模型进行打分并与预后信息相结合,发现高风险组患者生存预后显着(p《0.05)低于低风险组。这个结果证实了构建的模型的预后价值。
39.以上公开的仅为本发明的几个具体实施例,但是本发明并非局限于此,任何本领域的技术人员能思之的变化都应落入本发明的保护范围。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1