本发明涉及医药生物,具体涉及一种肿瘤生物标志物功能预测分析系统。
背景技术:
1、随着生物信息学技术的发展,研究人员倾向于利用rna-seq或微阵列数据来探索肿瘤生物标志物,这使得数据挖掘成为肿瘤研究的重要组成部分。然而,这些工作对没有编程技能的临床医生和生物学家来说是困难和不便的。目前,一些允许用户直接在线分析和可视化基因表达的网络服务器正在兴起,如gepia、xena、expressionatlas和hpa等。尽管这些网站已被广泛使用,但由于它们的数据源大多只来自于tcga数据库,且每种肿瘤类型大多只有一个队列,这使得来自单一队列的分析结果单薄且不稳定,很难获得高可信度和稳定的结果。此外,现有肿瘤生物标志物探索工具缺乏对特异性生物标志物的潜在机制、肿瘤微环境和药物适应症的进一步探索。
2、为了解决“如何帮助没有编程技能的临床医生和生物学家识别出稳定的生物标志物并多角度探索其潜在科研价值”这一技术问题,本发明开发出了一种用于实体肿瘤生物标志物探索和分析工具。
技术实现思路
1、针对现有技术中存在的问题和不足,本发明目的旨在提供一种肿瘤生物标志物功能预测分析系统。
2、为实现发明目的,本发明采用的技术方案如下:
3、一种肿瘤生物标志物功能预测分析系统,包括快速启动模块、临床关联分析模块、生存分析模块、富集分析模块、细胞浸润分析模块、免疫调节剂分析模块、免疫治疗分析模块、潜在药物相关性分析模块;所述快速启动模块用于选择肿瘤类型、生物标志物类别,并输入待分析的生物标志物;所述临床关联分析模块用于分析输入的生物标志物与临床特征、治疗反应之间的关联,并输出对应的分析结果;所述生存分析模块用于分析输入的生物标志物与肿瘤患者生存期之间的相关性,并输出对应的分析结果;所述富集分析模块用于分析分析输入的生物标志物的功能(所述功能是指生物标志物在生物学进程中发挥的作用),并输出对应的分析结果;所述细胞浸润分析模块用于分析输入的生物标志物与肿瘤免疫细胞浸润之间的相关性,并输出对应的分析结果;所述免疫调节剂分析模块用于分析输入的生物标志物与免疫调节剂之间的相关性,并输出对应的分析结果;所述免疫治疗分析模块用于评估输入的生物标志物对肿瘤患者的免疫治疗应答和预后的预测价值,并输出对应的分析结果;所述潜在药物相关性分析模块用于分析输入的生物标志物与现有肿瘤治疗药物之间的相关性,并输出对应的分析结果。
4、根据上述的肿瘤生物标志物功能预测分析系统,优选地,肿瘤生物标志物功能预测分析系统是通过对tcga(the cancer genome atlas program)数据库(https://portal.gdc.cancer.gov)、geo(gene expression omnibus)数据库(https://www.ncbi.nlm.nih.gov/geo/)、icgc(international cancer genome consortium)数据库(https://dcc.icgc.org)、cgga(chinese glioma genome atlas)数据库(http://www.cgga.org.cn/)和array express数据库(https://www.ebi.ac.uk/arrayexpress/)中记载的包含生物标志物表达数据、临床信息、治疗信息的肿瘤数据进行数据预处理、计算、存储后构建得到。更加优选地,所述数据注释预处理包括基因注释、去除未表达基因、统一临床数据格式、数据归一化处理;其中,所述基因注释是基于grch38和gencode数据库进行基因注释。
5、根据上述的肿瘤生物标志物功能预测分析系统,优选地,所述临床特征包括临床一般特征、组织学特征、分子特征;所述一般特征包括年龄、性别、饮酒、吸烟;所述组织学特征包括组织类型、肿瘤部位、肿瘤分期;所述分子特征包括明星基因突变、微卫星不稳定;所述治疗反应包括化疗、抗血管生成治疗的反应。
6、根据上述的肿瘤生物标志物功能预测分析系统,优选地,所述细胞浸润分析模块分析评估免疫细胞浸润丰度采用的算法为cibersort、cibersort abs、epic、estimate、mcp-counter、quantiseq、timer、xcell中的至少一种。
7、根据上述的肿瘤生物标志物功能预测分析系统,优选地,所述免疫调节剂分析模块包含五种免疫调节剂,五种免疫调节剂分别为:抗原呈递、免疫抑制剂、免疫刺激剂、趋化因子和受体。
8、根据上述的肿瘤生物标志物功能预测分析系统,优选地,所述药物相关性分析模块是基于gdsc_v1、gdsc_v2、ctrp和prism数据库中记载的癌细胞系的药物反应和生物标志物的表达数据进行药物评估。更加优选地,所述药物相关性分析模块可计算不同队列中所有药物与输入的生物标志物之间的相关性。
9、根据上述的肿瘤生物标志物功能预测分析系统,优选地,所述肿瘤生物标志物功能预测分析系统还包括基因组改变分析模块,所述基因组改变分析模块用于分析输入的生物标志物与基因组变化之间的关系。
10、根据上述的肿瘤生物标志物功能预测分析系统,优选地,快速启动模块输入的生物标志物为单基因或基因列表。所述基因列表包含多个基因;基因列表包括两种形式,一种为已经定义好功能基因集,用户可以直接选择,另一种是自定义基因集,用户可以输入多个基因,二者的本质都是多个基因的组合。所述生物标志物类别为单基因时,可以输入该单基因名称符号或该基因的ensemble id。所述生物标志物类别为基因列表时,输入基因列表后需要选择一种方法来计算每个样本的基因集得分。更加优选地,所述基因集得分的计算方法包括gene set variation analysis(gsva)、single sample gene set enrichmentanalysis(ssgsea)、z-score、pathway-level analysis of gene expression(plage)和mean value。
11、根据上述的肿瘤生物标志物功能预测分析系统,优选地,所述富集分析模块包含过表达分析(ora,over-representation analysis)子模块和基因集富集分析(gsea,geneset enrichment analysis)子模块;其中,过表达分析子模块采用的分析方法包括go分析和kegg分析。
12、根据上述的肿瘤生物标志物功能预测分析系统,优选地,所述生存期包括总生存期(os)、无病生存期(dfs)、无复发生存期(rfs)、无进展生存期(pfs)和疾病特异性生存期(dss)。更加优选地,生存分析模块的输出的分析结果为kanplan-meier曲线和/或cox森林图;所述kanplan-meier曲线是通过对数秩和检验生成的,所述cox森林图是通过cox比例风险比和95%置信区间信息生成的。
13、根据上述的肿瘤生物标志物功能预测分析系统,优选地,细胞浸润分析模块、免疫调节剂分析模块的分析结果均通过热图和/或散点图来呈现;热图表示输入的生物标志物与所有队列中免疫细胞或免疫调节剂的相关性,散点图表示某个特定队列中输入的生物标志物与免疫细胞或免疫调节剂的相关性。
14、根据上述的肿瘤生物标志物功能预测分析系统,优选地,所述免疫治疗分析模块通过受试者操作特征曲线和/或生存分析来评估输入的生物标志物对免疫治疗的预后价值。
15、与现有技术相比,本发明取得的积极有益效果为:
16、(1)利用本发明肿瘤生物标志物功能预测分析系统的临床关联分析模块、生存分析模块能够分析生物标志物与肿瘤关键临床特征、免疫治疗及预后的关系;利用富集分析模块、细胞浸润分析模块、免疫调节剂分析模块、免疫治疗分析模块能够进一步探索生物标志物的功能及在肿瘤中的潜在作用机制;利用潜在药物相关性分析模块能够探索分析与肿瘤生物标志物相关的敏感或耐受性药物;因此,利用本发明肿瘤生物标志物功能预测分析系统不仅能够分析生物标志物与肿瘤关键临床特征、免疫治疗及预后的关系,同时还能探索生物标志物在肿瘤中的潜在作用机制,功能分析多样化,能实现生物标志物的功能的全面探索研究;而且,即便使用者不具备计算机编程技能,不具备生物信息学数据挖掘背景知识,也能够利用本发明系统全面、系统地探索肿瘤生物标志物的临床意义和生物学功能,有望成为肿瘤研究领域一个重要的分析工具。
17、(2)本发明肿瘤生物标志物功能预测分析系统是通过对tcga数据库、geo数据库、icgc数据库、cgga数据库和array express数据库中记载的包含生物标志物表达数据和临床信息的肿瘤数据进行数据注释、预处理、计算、存储后构建得到,拥有更多的数据集,肿瘤数据来源丰富,使得各分析模块的分析结果稳定、可信度高。