基于基因共表达网络分析的癌症转录组数据处理方法与流程

文档序号:29706470发布日期:2022-04-16 15:50阅读:来源:国知局

技术特征:
1.基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,包括以下步骤:步骤一、获取原始数据集;步骤二、原始数据的预处理;步骤三、识别差异表达基因;步骤四、构建基因共表达网络;步骤五、挖掘基因模块;步骤六、基因模块与临床指标的关联分析;步骤七、基因模块的富集分析;步骤八、识别关键基因;步骤九、探究关键基因的功能;步骤十、关键基因的生存分析。2.根据权利要求1所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤一中,所述原始数据集来源于tcga数据库或geo数据库;所述原始数据集包括癌症组织样本中的基因表达数据、癌旁组织样本中的基因表达数据和每个样本对应的临床数据。3.根据权利要求2所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤二中,首先过滤掉低表达基因,然后对样本进行层次聚类,删除离群样本。4.根据权利要求3所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤三中,利用fc-t算法识别出满足限定条件的所有差异表达基因。5.根据权利要求4所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤四中,以差异表达基因在样本中的基因表达数据为基础,进行两两基因的皮尔森相关分析;设置限定条件对得到的所有关系进行筛选,将满足限定条件的两个基因视为存在共表达关系;将所有存在共表达关系的基因及其关系用一张图进行表示,即得到基因共表达网络。6.根据权利要求5所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤五中,利用4种社团检测算法对基因共表达网络中的结点进行网络聚类,得到由功能相似的基因组成的社团即基因模块;使用“模块度”作为评价标准,选择最优的模块挖掘结果。7.根据权利要求6所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤六中,对一个基因模块中所有的基因表达数据进行主成分分析,并将第一主成分定义为该基因模块的模块特征基因;将各基因模块的模块特征基因与不同的临床指标进行皮尔森相关分析,得到该基因模块与临床指标的关联矩阵。8.根据权利要求7所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤七中,将感兴趣的基因模块中的基因与go数据库提供的生物过程、细胞成分和分子功能进行富集分析,同时将该基因与reactome数据库提供的信号通路进行富集分析。9.根据权利要求8所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤八中,利用pagerank算法对基因共表达网络中所有结点的重要性进行打分,打分标准基于拓扑学原理,进而识别出在基因共表达网络中较为重要的结点,这些结点对应的基因即为关键基因。
10.根据权利要求9所述的基于基因共表达网络分析的癌症转录组数据处理方法,其特征在于,步骤九中,利用disgenet数据库检索与关键基因有关的疾病,对关键基因的功能进行探究;步骤十中,利用在线软件onclnc对关键基因进行生存分析,并绘制生存曲线。

技术总结
基于基因共表达网络分析的癌症转录组数据处理方法,涉及数据处理领域,包括获取原始数据集;原始数据的预处理;识别差异表达基因;构建基因共表达网络;挖掘基因模块;基因模块与临床指标的关联分析;基因模块的富集分析;识别关键基因;探究关键基因的功能;关键基因的生存分析。由富集分析结果可知,使用该方法划分的基因模块具有显著的生物学意义;由Disgenet数据库对于关键基因的验证结果可知,使用该方法识别出的关键基因大部分均与肿瘤疾病有关。该方法在基因模块的挖掘及关键基因的识别方面具有良好的效果。该方法可作为癌症疾病转录组数据的一个重要工具,其应用也为进一步了解癌症疾病的患病机制提供了新的方向。一步了解癌症疾病的患病机制提供了新的方向。一步了解癌症疾病的患病机制提供了新的方向。


技术研发人员:付聪 梁磊 张彦 易星丞 许彤
受保护的技术使用者:吉林省蒲川生物医药有限公司
技术研发日:2022.01.14
技术公布日:2022/4/15
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1