前列腺相关癌基因信息收集及分析方法_2

文档序号:9489640阅读:来源:国知局
模块对数据进行加工分析后通过 数据显示模块显示,其中,数据采集模块包括DNA数据采集模块、RNA数据采集模块和蛋白 数据采集模块。
[0041] 实施例5
[0042] -种前列腺相关癌基因信息收集分析系统(见图5),包括数据采集模块、数据预 处理模块、数据分析模块和数据显示模块,数据采集模块收集数据后通过数据预处理模块 进行背景校正和标准化后传送给数据分析模块,数据分析模块对数据进行加工分析后通过 数据显示模块显示,其中,数据采集模块包括DNA数据采集模块、RNA数据采集模块和蛋白 数据采集模块。其中,DNA数据采集模块包括突变位点采集模块、甲基化位点采集模块、SNP 位点采集模块;RNA数据采集模块包括mRNA表达采集模块、miRNA表达采集模块、IncRNA表 达采集模块;蛋白数据采集模块包括蛋白表达谱数据采集模块。数据分析模块包括差异表 达基因分析模块、预测革E点分析模块、生物信息网分析模块、G0分析模块、pathway分析模 块。
[0043] 实施例6数据的收集
[0044] 收集GE0数据库中部分前列腺癌数据,具体数据见表1所示。
[0045]表1. 3套前列腺癌高通量mRNA及miRNA数据集的基本情况
[0048] 实施例7数据的处理
[0049] 通过转录组数据分析软件对3套miRNA及mRNA原始数据进行背景校正和标准化 后进行t-test得到P值,计算效应量,然后利用Fisher检验合并P值,采用随机效应模型 合并效应量,筛选差异表达miRNA及mRNA,设定P值< 0.01,效应量> 0.8,共筛选出29个 miRNA,其中表达水平上调的基因10个,表达水平下调的基因19个。如表2所示,其中左侧 为表达上调的miRNA,右侧为表达下调的miRNA。分析过程中设定P值<0.01,效应量> 1, 共筛选出946个mRNA,其中表达水平上调的基因177个,表达水平下调的基因769个,列举 其上调或下调排名前20的mRNA(见表3)。
[0050] 表2.前列腺癌表达显著上调及下调的miRNA
[0051]

[0054] 实施例8前列腺癌差异表达的miRNA靶基因的识别
[0055] 识别miRNA靶基因是研究特定组织和细胞miRNA功能的非常重要的步骤。利用 包括DIANAmT,miRanda,miRDB,miRWalk,PICTAR5 及Targetscan这些算法预测差异表达 miRNA的靶基因,选取多4个算法预测出来的靶基因,并在miRWalk数据库查找已验证的差 异表达的miRNA的靶基因,然后将所有靶基因与mRNA芯片中与miRNA表达负相关的基因进 行整合分析,我们共得到751个靶基因,通过预测得到574个上调miRNA的靶基因,128个下 调miRNA的靶基因,并且通过miRWalk数据库得到24个已验证的表达上调的miRNA的靶基 因,35个已验证的表达下调的miRNA的靶基因。
[0056] 实施例9前列腺癌差异表达miRNA及差异表达的靶基因组成的生物信息网络图
[0057] 利用Cytoscape软件构建由前列腺癌差异表达miRNA及差异表达的靶基因组成的 生物?目息网络图。图中显不的miRNAs和mRNAs均在前列腺癌中差异表达。若中心点为显 著上调的miRNAs,围绕中心点的是显著下调的mRNAs,若中心点为显著下调的miRNAs,围绕 中心点的是显著上调的mRNAs。
[0058] 实施例10前列腺癌差异表达的靶基因的功能注释
[0059] 为了更好的研究差异表达靶基因的功能,我们通过DAVID对差异表达的基因进行 G0功能富集和KEGG通路富集,前15个显著富集的G0功能和KEGG通路见表4和表5。KEGG 通路富集的结果显示188个差异表达的靶基因能够在KEGG库中筛出,集中在癌症通路,粘 着斑,黑素生成,谷氨酸能突触,Wnt信号通路,小细胞肺癌,嘌呤代谢,轴突导向,磷酸戊糖 途径,肌动蛋白细胞骨架调节等30个信号通路。
[0060] 表4.前15个差异表达靶基因显著富集的GO功能


【主权项】
1. 一种前列腺相关癌基因信息收集及分析系统,其特征在于,包括数据采集模块、数 据分析模块和数据显示模块,数据采集模块收集数据后传送给数据分析模块,数据分析模 块对数据进行加工分析后通过数据显示模块显示,所述数据采集模块包括DNA数据采集模 块、RNA数据采集模块和蛋白数据采集模块。2. 根据权利要求1所述的系统,其特征在于,所述DNA数据采集模块包括突变位点采集 模块、甲基化位点采集模块、SNP位点采集模块;所述RNA数据采集模块包括mRNA表达采集 模块、miRNA表达采集模块、IncRNA表达采集模块;蛋白数据采集模块包括蛋白表达谱数据 采集模块。3. 根据权利要求1所述的系统,其特征在于,所述数据分析模块包括差异表达基因分 析模块、预测祀点分析模块、生物信息网分析模块、GO分析模块、pathway分析模块。4. 根据权利要求1所述的系统,其特征在于,所述前列腺相关癌基因信息收集及分析 系统还包括数据预处理模块,数据采集模块收集数据后通过数据预处理模块进行背景校正 和标准化后传送给数据分析模块。5. -种前列腺相关癌基因信息收集及分析方法,包括: (1) 从已有数据库中下载前列腺癌样本测序原始数据及对照样本测序原始数据; (2) 对下载的原始数据进行背景校正和标准化; (3) 对数据进行分析; (4) 显示分析结果。6. 根据权利5所述的方法,其特征在于,对数据进行差异表达基因分析、预测靶点分 析、生物信息网分析、GO分析、pathway分析。7. 根据权利6所述的方法,其特征在于,所述生物信息网分析包括差异表达miRNA和 靶基因建立的生物信息网络、基因和基因之间的生物信息网络、基因和蛋白之间的生物 信息网络;所述预测靶点分析利用包括DIANAmT,miRanda,miRDB,miRWalk,PICTAR5及 Targetscan这些算法预测差异表达miRNA的革El点,优选多4个算法预测出来的革巴点。8. 根据权利5所述的方法,其特征在于,从已有数据库中下载前列腺癌相关的突变位 点数据、甲基化位点数据、SNP位点数据、mRNA表达数据、miRNA表达数据、IncRNA表达数据、 蛋白表达谱数据。9. 一组前列腺癌诊疗标志物,包括 miRNA :hsa-miR_183、hsa-miR-153、hsa-miR-96、 hsa-miR-25、hsa-miR-93、hsa-miR-182、hsa-miR-663、hsa_miR-106b、hsa_miR-130b、 hsa-miR-18a ;和 / 或 mRNA :SIM2、HPN、AMACR、MYC、0R51E2、BICD1、DNAH5、PCA3、ARHGEF38、 TRIBl、REPS2、GJBl、EPCAM、PCSK6、CAMKK2、STIL、SLC12A8、GNPNAT1、PVTl、TMTC4 ;其特征 在于,上述基因的上调与患前列腺癌风险正相关。10. 一 组前列腺癌标志物,包括 miRNA :hsa-miR_222、hsa-miR-224、hsa-miR_99b、 hsa-miR-221、hsa-miR-204、hsa_miR-181c、hsa-miR-378、hsa-miR-452、hsa-miR-378、 hsa-miR-31、hsa-miR-139_5p、hsa-miR-505、hsa_miR-133a、hsa-miR-328、hsa_miR-27b、 hsa-miR-154、hsa-miR-324_5p、hsa_miR-487b、hsa-miR-502_5p ;和 / 或 mRNA :TCEAL2、 CPA6、C15orf41、VSNLl、KANKl、NYNRIN、NAV2、ZNF185、STARD5、GSTPl、R0R2、DUOXl、ALAD、 ST5、DBNDD2、SEMA6D、BCL2、D0K4、ST6GALNAC2、ACACB ;其特征在于,上述基因的下调与患前 列腺癌风险正相关。
【专利摘要】本发明涉及前列腺相关癌基因信息收集及分析方法。发明提供一种前列腺相关癌基因信息收集及分析系统,通过对现有数据库中所有涉及前列腺癌的数据进行收集,利用生物信息学方法对收集的前列腺癌的mRNA和miRNA高通量转录组数据进行整合分析,基于大样本大数据处理得到适用于临床应用的前列腺癌诊断标志物。
【IPC分类】G06F19/16
【公开号】CN105243293
【申请号】CN201510752792
【发明人】吴志宏
【申请人】吴志宏
【公开日】2016年1月13日
【申请日】2015年11月6日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1