一种预测两种疾病共同致病基因的方法

文档序号:9865968阅读:1438来源:国知局
一种预测两种疾病共同致病基因的方法
【技术领域】
[0001] 本发明设及致病基因预测技术领域,特别设及一种预测两种疾病共同致病基因的 方法。
【背景技术】
[0002] 目前在疾病治疗及预测领域,有些病患会同时患有一种W上的疾病,运种情况会 带给患者极大痛苦,现代精准医学提出疾病诊断和治疗需要了解疾病的遗传物质基础,W 开展针对个体遗传差异的诊断和治疗。但现实当中某两种特定的疾病发生在某个个体上的 几率是比较低的,而一旦发生带来的疾病负担又是非常重的,例如有研究发现精神分裂症 病人患结核病的比率为1.33~2.30%,与2010年第五次全国结核病流调抽样调查报告的普 通人群中活动性结核病的患病率459/10万比较,精神分裂症患者运一特殊群体,结核病的 患病率为普通人群的2.9~5.5倍。所W如何找到一种方法,能够预测两种疾病的共同致病 基因,实现精准医疗,就显得非常关键。
[0003] 现有技术中进行研究两种疾病的共同致病基因的方法主要有:1、基于相互作用网 络的致病基因预测方法;2、基于PPI网络的疾病候选基因排名方法;3、基于协同过滤的疾病 基因预测方法;4、基于复杂网络的症状基因预测方法等等。运些方法均属于W因果关系推 理的方式进行预测的,因而运些方法存在天然的偏倚,且依赖临床病例,推广难度较大。

【发明内容】

[0004] 本发明的目的在于提供一种预测两种疾病共同致病基因的方法,W解决现有技术 由于W因果关系推理的方式进行预测所造成的存在偏倚且依赖临床数据推广难度大的问 题。
[0005] 本发明的第二目的在于提供一种预测两种疾病共同致病基因的方法,W实现找到 两种疾病共同的致病遗传物质基础的目标。
[0006] 为实现上述目的,本发明提供了一种预测两种疾病共同致病基因的方法,包括W 下步骤:
[0007] S1:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;
[0008] S2:寻找上述两种疾病的致病基因对应的蛋白在所述蛋白网络中的位置;
[0009] S3:基于所述位置进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病 的共同致病基因。
[0010] 较佳地,所述步骤S1具体包括:分别选取两种疾病的已知致病基因作为种子基因 集a和b,种子基因集a内包含若干个疾病A的种子基因,种子基因集b内包含若干个疾病B的 种子基因;
[0011] 所述步骤S2具体包括:根据两种疾病已知的蛋白作用网络绘制W所述种子基因集 a和b为核屯、的蛋白作用网络图;
[0012] 所述步骤S3具体包括:
[0013] S31:W每个所述种子基因为起点,在所述蛋白作用网络中进行基因扩展W得到扩 展基因,并赋予每个所述扩展基因一个分值,所述分值与其所属的扩展基因对应的疾病相 关性的强弱相关;
[0014] S32:将所述扩展基因依据分值大小进行由高到低的排序;
[0015] S33:从所述排序中的最大值开始依次计算每个扩展基因的加和,如对任意一个扩 展基因 i,其为种子基因集a中的种子基因扩展得到的,且其计算加和时,加和中包括任意一 个种子基因集b的扩展基因,则对扩展基因 i进行加分,否则减分;
[0016] S34:依据分值的预设阔值分别选取加和后的两种疾病的扩展基因;
[0017] S35:选取步骤S34中得到的两种疾病的扩展基因中的重叠基因;
[0018] S36:对所述重叠基因进行筛选,得到两种疾病的共同致病基因。
[0019] 较佳地,所述步骤S31中,采用重起始的随机游走方法在所述蛋白作用网络中进行 基因扩展W得到扩展基因。
[0020] 较佳地,设任意一个扩展基因 j的分值为Vj,若j属于种子基因集a中的种子基因扩 展得到的,则每次加和时,加分时得到的分值为
减分时得到的分值为
;若^'属于种子基因集b中的种子基因扩展得到的,则每次加和时,加分时得到 的分值为
庚中,N为蛋白作用网络图中所 有蛋白/基因的数量,Ga为疾病A的种子基因集a中的基因数量,姑为疾病B的种子基因集b中 的基因数量。
[0021] 较佳地,所述步骤S33中计算每个扩展基因的加和时,采用基因集富集分析法进行 计算。
[0022] 较佳地,所述步骤S36中采用超几何学方法计算所述重叠基因及其在蛋白作用网 络中相邻基因的P值,依据该P值对重叠基因进行筛选,其中,P值按下式计算:
[0023]
[0024] N为蛋白作用网络图中所有蛋白/基因的数量,Μ是共同蛋白/基因数目,η是相邻蛋 白/基因的数目,m是相邻蛋白/基因中共同蛋白/基因数目。
[0025] 本发明提供的预测两种疾病共同致病基因的方法通过在两种疾病的基因对应的 蛋白作用网络图中进行基因扩展,并在扩展基因中的共同基因中选取两种疾病的共同致病 基因,并在预测过程中应用了随机游走方法、基因集富集分析法及超几何检验法,使得共同 致病基因的选取更加准确。本发明方法能够预测可能影响到两种疾病的关键驱动基因,可 实现精准医疗,其中两种疾病的类型可为任何已知病症,特别是可为较少发生的病例,只要 具备两种疾病分别的基因数据即可。
【附图说明】
[0026] 图1为本发明提供的预测两种疾病共同致病基因的方法流程图;
[0027] 图2为本发明方法中的寻找得到两种疾病的共同致病基因的方法流程图;
[0028] 图3A为本发明优选实施例的W种子基因集为核屯、的蛋白作用网络示意图;
[0029] 图3B为本发明优选实施例的基因扩展后共有基因的蛋白作用网络示意图;
[0030] 图3C为本发明优选实施例的找到了两种疾病的共同致病基因的蛋白作用网络示 意图。
【具体实施方式】
[0031] 为更好地说明本发明,兹W-优选实施例,并配合附图对本发明作详细说明,具体 如下:
[0032] 如图1所示,为本发明提供的预测两种疾病共同致病基因的方法,包括W下步骤S1 ~S3:
[0033] S1:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;
[0034] 具体包括:分别选取两种疾病的已知致病基因作为种子基因集a和b,种子基因集a 内包含若干个疾病A的种子基因,种子基因集b内包含若干个疾病B的种子基因;
[0035] S2:寻找上述两种疾病的致病基因对应的蛋白在蛋白网络中的位置;
[0036] 具体包括:根据两种疾病A和B已知的蛋白作用网络绘制W种子基因集a和b为核屯、 的蛋白作用网络图。该蛋白作用网络图如图3A所示,该图中包括基因 G1~G12共12个基因, 分别对应12种蛋白,其中,G2~G4(图中的G2a~G4a)为疾病A所对应的种子基因集a中的种子 基因;G11、G12(图中的Glib~G12b)为疾病B所对应的种子基因集b中的种子基因。
[0037] S3:基于上述的位置在蛋白网络中进行基因扩展后从扩展基因中的重叠基因中寻 找得到两种疾病的共同致病基因。
[003引如图2所示,步骤S3具体包括:
[0039] S31:W每个所述种子基因为起点,在上述的蛋白作用网络中进行基因扩展W得到 扩展基因,并赋予每个扩展基
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1