一种基于功能网络多疾病变异位点分析平台的制作方法

文档序号:10655790阅读:334来源:国知局
一种基于功能网络多疾病变异位点分析平台的制作方法
【专利摘要】本发明提供了一种基于功能网络多疾病变异位点分析平台,包括变异基因测序检测模块,用于完成对测序数据的基础分析;功能富集分析模块,用于利用功能富集分析工具分析变异基因功能;功能网络构建模块,用于根据功能富集分析结果构建功能网络;功能网络挖掘模块,用于从功能网络中筛选出稳定的网络模块;共享分子网络识别模块,用于根据网络模块识别不同疾病共享的分子模块。本发明通过剖析不同疾病间基因组水平上的差异,从分子功能角度建立疾病间的关联关系,可以更加系统地识别不同疾病间共享的分子功能模块,有效的分析相似表型疾病的致病机理,从基因组层面揭示疾病间的差异,增加对疾病的全面理解,有助于临床诊断和治疗。
【专利说明】
一种基于功能网络多疾病变异位点分析平台
技术领域
[0001]本发明属于生物信息技术领域,尤其是涉及一种基于功能网络多疾病变异位点分析平台。【背景技术】
[0002]由于许多疾病在致病机理和临床表征上都具有高度相似性,这种相似性不仅有助于研究某类疾病的共同致病机制,同时也在某种程度上增加了疾病诊断和治疗过程中的难度,易造成误诊,从而延误病情的治疗。相似临床表征不仅仅存在于不同疾病之间,也可能体现在相同疾病的不同亚型之间,因此,对于这种临床表征相似、易造成混淆诊断的疾病或疾病亚型的联合研究,将成为克服上述困难的有效方法。
[0003]近些年来,随着测序技术的不断发展和价格下降,使得疾病的诊断和治疗已经进入了一个崭新的时期,尤其是具有较全面基因组覆盖度的全基因组测序技术和高测序深度的外显子捕获技术,作为辅助临床检验的新技术手段,逐渐赢得广泛关注。同时,DNA测序技术诞生也为个性化精准医疗提供了可能,使得临床治疗过程中可以有针对性地选择药物、 治疗方式以及预防措施。
[0004]然而,先前研究往往针对单一疾病,刻画其基因组变异情况,忽略了疾病间可能存在的潜在联系,而基于功能网络的方法,可以更加系统地识别不同疾病间共享的分子功能模块,有效的分析相似表型疾病的致病机理。因此,整合测序技术和功能网络分析,将从基因组层面揭示疾病间的差异,增加对疾病的全面理解,有助于临床诊断和治疗。
【发明内容】

[0005]有鉴于此,本发明旨在提出一种基于功能网络多疾病变异位点分析平台,剖析不同疾病间基因组水平上的差异,同时从分子功能角度建立疾病间的关联关系。[〇〇〇6]为达到上述目的,本发明的技术方案是这样实现的:
[0007]—种基于功能网络多疾病变异位点分析平台,包括依次相连接的
[0008]变异基因测序检测模块,用于完成对测序数据的基础分析;
[0009]功能富集分析模块,用于利用功能富集分析工具分析变异基因功能;
[0010]功能网络构建模块,用于根据功能富集分析结果,构建功能网络;[〇〇11]功能网络挖掘模块,用于从功能网络中筛选出稳定的网络模块;
[0012]共享分子网络识别模块,用于根据网络模块识别不同疾病共享的分子模块,挖掘疾病间潜在的共同致病机理。
[0013]进一步的,所述变异基因测序检测模块完成对测序数据的样本信息统计、基因组变异位点(或变异基因)的样本信息统计,以及变异的样本聚类和样本间相似性等基础分析,包括位点变异矩阵生成模块、基因变异矩阵生成模块、基因提取模块。
[0014]进一步的,所述功能富集分析工具包括DAVID。
[0015]进一步的,所述功能网络构建模块包括功能注释模块、功能富集模块、网络构建模块。
[0016]进一步,所述功能网络挖掘模块包括最大网络子图获取模块、筛选模块。
[0017]进一步的,所述共享分子网络识别模块包括超几何富集分析模块、阈值分析模块、 识别t吴块。
[0018]相对于现有技术,本发明所述的一种基于功能网络多疾病变异位点分析平台具有以下优势:本发明通过剖析不同疾病间基因组水平上的差异,从分子功能角度建立疾病间的关联关系,可以更加系统地识别不同疾病间共享的分子功能模块,有效的分析相似表型疾病的致病机理,从基因组层面揭示疾病间的差异,增加对疾病的全面理解,有助于临床诊断和治疗。【附图说明】
[0019]构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
[0020]图1为本发明实施例所述的一种基于功能网络多疾病变异位点分析平台的结构示意图;[0021 ]图2为本发明实施例所述的样本列表实例;
[0022]图3为本发明实施例所述的不同疾病样本变异位点和变异基因数目统计表;
[0023]图4为本发明实施例所述变异位点矩阵;
[0024]图5为本发明实施例所述基因变异矩阵文件;
[0025]图6为本发明创造实施例所述的分子功能网络模块图;
[0026]图7为本发明创造实施例所述的疾病间共享分子网络模块图。【具体实施方式】
[0027]需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。[〇〇28]在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“上”、“下”、 “前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”等的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,除非另有说明,“多个” 的含义是两个或两个以上。[〇〇29]在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以通过具体情况理解上述术语在本发明中的具体含义。
[0030]下面将参考附图并结合实施例来详细说明本发明。
[0031]如图1所示,一种基于功能网络多疾病变异位点分析平台,包括依次相连接的变异基因测序检测模块、功能富集分析模块、功能网络构建模块、功能网络挖掘模块、共享分子网络识别t吴块;
[0032]变异基因测序检测模块,用于完成对测序数据的基础分析;所述变异基因测序检测模块完成对测序数据的样本信息统计、基因组变异位点(或变异基因)的样本信息统计, 以及变异的样本聚类和样本间相似性等基础分析;首先读取注释后基因变异文件,统计不同疾病样本变异位点和变异基因数目,通过位点变异矩阵生成模块产生位点变异矩阵,得到基于变异位点的基因样本聚类结果;其次,读取位点变异矩阵,通过基因变异矩阵生成模块产生基因变异矩阵,统计变异位点和变异基因在不同疾病样本中出现的次数;最后,读取基因变异矩阵,通过基因提取模块提取不同疾病样本具有较高变异频率的基因;
[0033]变异基因测序检测模块对应的程序为:[〇〇34] snvStatistic.r:读取注释后基因变异文件(目前只使用于SNV或INDEL的检测注释结果),统计不同疾病样本变异位点和变异基因数目;[0〇35] sampleCluster.r:读取注释后基因变异文件,产生位点变异矩阵(位点变异矩阵: 行为变异位点,列为样本,矩阵中数据值为变异位点在对应样本中的变异频率);
[0036]sampleClusterAnalysis ? r:读取sampleCluster.r产生的变异矩阵,产生基因变异矩阵(行为变异基因,列为样本,矩阵中数据值为变异基因在对应样本中的变异频率);
[0037]smapleCorrelat1n ? r:读取 sampleCluster ? r 产生的位点变异矩阵;
[0038]8}01113〇18.1':读取8311^)16(]1118七6^的15^18.1'产生的基因变异矩阵,提取不同疾病样本具有较高变异频率的基因。
[0039]功能富集分析模块,用于利用功能富集分析工具分析变异基因功能,所述功能富集分析工具包括DAVID。[〇〇4〇]功能网络构建模块,用于根据功能富集分析结果,构建功能网络;所述功能网络构建模块包括功能注释模块、功能富集模块、网络构建模块;首先,通过功能注释模块将变异基因进行DAVID功能注释;其次,通过功能富集模块获得功能富集GO term及该term对应的基因集合;最后,通过网络构建模块构建节点表示为GO term、边表示为节点间共享基因数目的功能网络。
[0041]功能网络挖掘模块,用于从功能网络中筛选出稳定的网络模块;所述功能网络挖掘模块包括最大网络子图获取模块、筛选模块;首先,通过最大网络子图获取模块根据导出的功能网络数据,采用贪婪算法,逐一在种子节点中加入节点,使得构建的子网具有最大得分,当再次加入新节点得分不变时,停止迭代;其次,通过筛选模块从功能网络中筛选出稳定的网络t吴块;
[0042]功能网络挖掘模块对应的程序为:[0〇43] module.r:根据Cytoscape导出的功能网络数据,读取经预处理过的边属性文件 (edge.csv文件),通过迭代寻找最大网络子图,进而挖掘分子功能网络模块;
[0044]共享分子网络识别模块,用于根据网络模块识别不同疾病共享的分子模块,挖掘疾病间潜在的共同致病机理;所述共享分子网络识别模块包括超几何富集分析模块、阈值分析模块、识别模块;首先通过超几何富集分析模块计算疾病基因与功能网络模块中基因的超几何富集显著性;其次,通过阈值分析模块据超几何显著性阈值(pvalUe〈0.05),获得与不同疾病显著富集的功能模块;最后通过识别模块获得疾病间共享的分子网络模块;
[0045]共享分子网络识别模块对应的程序为:[0〇46]term-term_cy t0.r:根据Cy toscape导出的功能网络数据,读取经预处理过的点属性文件(node, csv文件),结合module.r得到的分子功能网络模块信息,计算不同疾病的已知疾病基因与分子网络模块基因的超几何富集分析结果,显著富集到已知的多种疾病基因列表的网络模块。[〇〇47]详细运行说明[〇〇48]下面以五种疾病(Diseasel-5)的外显子捕获测序为例,详细阐述本平台的具体使用方法和运行结果。首先,构建样本列表实例,如图2所示,对于识别的变异位点,要求提取经ANN0VAR注释后的结果,作为后续脚本的输入文件;
[0049]首先,使用snvStati stic.r对不同样本的变异位点和变异基因数目进行统计,结果如图3所示(第一列为"疾病类型_样本编号",第二列为检测到的变异数目,第三列为检测到的变异基因数目)。[0〇5〇]以注释后基因组变异文件作为输入,使用sampleCluster.r得到变异位点矩阵,如图4所示;
[0051]将上述过程中产生的变异位点矩阵作为数据的输入,使用 sampleClusterAnalysis.r得到基因变异矩阵文件,如图5所示;
[0052]根据sampleCluster.r产生的变异位点矩阵,使用smapleCorrelat1n.r计算不同疾病样本间变异位点相似性;
[0053]根据sampleClusterAnalysis.r产生的基因变异矩阵,使用symbols.r提取不同疾病样本变异频率排秩在前10 %的基因;[〇〇54] 经过上述对变异位点和变异基因的基础分析之后,使用DAVID来刻画变异基因的功能富集分析,并将富集分析结果导入Cytoscape中,使用EnrichmentMap插件,建立功能网络,导出功能网络的边属性和点属性,作为疾病功能网络模块挖掘过程中的输入文件,使用 module.r构建的功能网络中挖掘分子功能网络模块,如图6所示,最后使用term-term_ cy t0.r识别疾病共享分子网络模块,如图7所示。
[0055]以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种基于功能网络多疾病变异位点分析平台,其特征在于:包括依次相连接的变异基因测序检测模块,用于完成对测序数据的基础分析;功能富集分析模块,用于利用功能富集分析工具分析变异基因功能;功能网络构建模块,用于根据功能富集分析结果,构建功能网络;功能网络挖掘模块,用于从功能网络中筛选出稳定的网络模块;共享分子网络识别模块,用于根据网络模块识别不同疾病共享的分子模块,挖掘疾病 间潜在的共同致病机理。2.根据权利要求1所述的一种基于功能网络多疾病变异位点分析平台,其特征在于:所 述变异基因测序检测模块完成对测序数据的样本信息统计、基因组变异位点(或变异基因) 的样本信息统计,以及变异的样本聚类和样本间相似性等基础分析,包括位点变异矩阵生 成模块、基因变异矩阵生成模块、基因提取模块。3.根据权利要求1所述的一种基于功能网络多疾病变异位点分析平台,其特征在于:所 述功能富集分析工具包括DAVID。4.根据权利要求1所述的一种基于功能网络多疾病变异位点分析平台,其特征在于:所 述功能网络构建模块包括功能注释模块、功能富集模块、网络构建模块。5.根据权利要求1所述的一种基于功能网络多疾病变异位点分析平台其特征在于:所 述功能网络挖掘模块包括最大网络子图获取模块、筛选模块。6.根据权利要求1所述的一种基于功能网络多疾病变异位点分析平台其特征在于:所 述共享分子网络识别模块包括超几何富集分析模块、阈值分析模块、识别模块。
【文档编号】G06F19/00GK106021981SQ201610318328
【公开日】2016年10月12日
【申请日】2016年5月13日
【发明人】薛成海, 关晋霞, 李阳, 侯婷婷
【申请人】万康源(天津)基因科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1