一种预测两种疾病共同致病基因的方法_2

文档序号:9865968阅读:来源:国知局
因一个分值。设分值为V,则该分值V与其所属的扩展基因对应 的疾病相关性的强弱相关;
[0040] 其中,本步骤采用重起始的随机游走方法在蛋白作用网络中进行基因扩展W得到 扩展基因,即每次进行基因括展时均采用由种子基因开始进行的随机游走方法进行扩展, W得到种子基因的扩展基因,且可根据需要自由选择初始赋予的分值。
[0041] S32:将所述扩展基因依据分值大小进行由高到低的排序;
[0042] S33:从所述排序中的最大值开始依次计算每个扩展基因的加和,如对任意一个扩 展基因 i,其为种子基因集a中的种子基因扩展得到的,且其计算加和时,加和中包括任意一 个种子基因集b的扩展基因,则对扩展基因 i进行加分,否则减分;
[0043] 步骤S33中计算每个扩展基因的加和时,采用基因集富集分析法进行计算。
[0044] 本实施例中,具体地,设任意一个扩展基因 j的分值为Vj,若j属于种子基因集a中 的种子基因扩展得到的,则每次加和时,加分时得到的分值为
即每次增加分 值时的增量为
减分时得到的分值为
即每次减少分值时的减少量 为
若j属于种子基因集b中的种子基因扩展得到的,则每次加和时,加分时得到的 分值3
或分时得到的分值为
其中,N为蛋白作用网络图中所有 蛋白/基因的数量,Ga为疾病A的种子基因集a中的基因数量,(ib为疾病B的种子基因集b中的 基因数量。
[0045] S34:依据分值的预设阔值分别选取加和后的两种疾病的扩展基因;
[0046] S35:选取步骤S34中得到的两种疾病的扩展基因中的重叠基因;
[0047] 如图3B所示,其中的G5c、G6c、G9c即为疾病A的种子基因 G2a~G4aW及疾病B的种子 基因 Gllb、G12b进行基因扩展后的扩展基因中的重叠基因,也即两种疾病扩展基因中的共有 基因。
[004引 S36:对所述重叠基因进行筛选,得到两种疾病的共同致病基因。
[0049]本步骤中采用超几何学方法计算所述重叠基因及其在蛋白作用网络中相邻基因 的P值,并依据该P值对重叠基因进行筛选,其中,P值按下式计算:
[(K)加]
[0051] N为蛋白作用网络图中所有蛋白/基因的数量,Μ是共同蛋白/基因数目,η是相邻蛋 白/基因的数目,m是相邻蛋白/基因中共同蛋白/基因数目。
[0052] 进行筛选后,如图3C所示,G9cz即为根据P值所选取的两种疾病的共同致病基因。本 步骤中,若得到的P值小于0.05,则表明步骤S34中所选的预设阔值过大,则将该阔值进行适 当调整,如减少一定的步长,直至P值大于0.05,则表明根据该P值可W选取得到合适的两种 疾病的共同致病基因。
[0053] 上述的蛋白质网络仅为示例使用,且W种子基因集为核屯、的蛋白作用网络图根据 不同的疾病类型可W进行适应性调整,此外,本发明中设及的两种疾病可W为任意两种疾 病,本发明对疾病具体种类不做限制。本领域技术人员可根据本
【发明内容】
进行适应性调整, 其均包含在本发明的范围之内。
[0054] W上所述,仅为本发明的【具体实施方式】,但本发明的保护范围并不局限于此,任何 本领域的技术人员在本发明掲露的技术范围内,对本发明所做的变形或替换,都应涵盖在 本发明的保护范围之内。因此,本发明的保护范围应W所述的权利要求的保护范围为准。
【主权项】
1. 一种预测两种疾病共同致病基因的方法,其特征在于,包括以下步骤: S1:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络; S2:寻找上述两种疾病的致病基因对应的蛋白在所述蛋白网络中的位置; S3:基于所述位置进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病的共 同致病基因。2. 根据权利要求1所述的预测两种疾病共同致病基因的方法,其特征在于, 所述步骤S1具体包括:分别选取两种疾病的已知致病基因作为种子基因集a和b,种子 基因集a内包含若干个疾病A的种子基因,种子基因集b内包含若干个疾病B的种子基因; 所述步骤S2具体包括:根据两种疾病已知的蛋白作用网络绘制以所述种子基因集a和b 为核心的蛋白作用网络图; 所述步骤S3具体包括: S31:以每个所述种子基因为起点,在所述蛋白作用网络中进行基因扩展以得到扩展基 因,并赋予每个所述扩展基因一个分值,所述分值与其所属的扩展基因对应的疾病相关性 的强弱相关; S32:将所述扩展基因依据分值大小进行由高到低的排序; S33:从所述排序中的最大值开始依次计算每个扩展基因的加和,如对任意一个扩展基 因i,其为种子基因集a中的种子基因扩展得到的,且其计算加和时,加和中包括任意一个种 子基因集b的扩展基因,则对扩展基因i进行加分,否则减分; S34:依据分值的预设阈值分别选取加和后的两种疾病的扩展基因; S35:选取步骤S34中得到的两种疾病的扩展基因中的重叠基因; S36:对所述重叠基因进行筛选,得到两种疾病的共同致病基因。3. 根据权利要求2所述的预测两种疾病共同致病基因的方法,其特征在于,所述步骤 S31中,采用重起始的随机游走方法在所述蛋白作用网络中进行基因扩展以得到扩展基因。4. 根据权利要求2所述的预测两种疾病共同致病基因的方法,其特征在于,设任意一个 扩展基因j的分值为Vj,若j属于种子基因集a中的种子基因扩展得到的,则每次加和时,加 分时得到的分值为^ _,减分时得到的分值戈若j属于种子基因集b 中的种子基因扩展得到的,则每次加和时,加分时得到的分值为】减分时得到的分值) 其中,N为蛋白作用网络图中所有蛋白/基因的数量,Ga为疾病A的种 子基因Ifia个tfJ整囚mm,Gb为疾病B的种子基因集b中的基因数量。5. 根据权利要求2所述的预测两种疾病共同致病基因的方法,其特征在于,所述步骤 S33中计算每个扩展基因的加和时,采用基因集富集分析法进行计算。6. 根据权利要求2所述的预测两种疾病共同致病基因的方法,其特征在于,所述步骤 S36中采用超几何学方法计算所述重叠基因及其在蛋白作用网络中相邻基因的p值,依据该 P值对重叠基因进行筛选,其中,P值按下式计算:N为蛋白作用网络图中所有蛋白/基因的数量,Μ是共同蛋白/基因数目,η是相邻蛋白/ 基因的数目,m是相邻蛋白/基因中共同蛋白/基因数目。
【专利摘要】本发明提供了一种预测两种疾病共同致病基因的方法,包括以下步骤:分别收集已知的两种疾病的致病基因,及获取该两种疾病的蛋白作用网络;寻找上述两种疾病的致病基因对应的蛋白在蛋白网络中的位置;基于位置进行基因扩展后从扩展基因中的重叠基因中寻找得到两种疾病的共同致病基因。该方法通过在两种疾病的基因对应的蛋白作用网络图中进行基因扩展,并在扩展基因中的共同基因中选取两种疾病的共同致病基因,并在预测过程中应用了随机游走方法、基因集富集分析法及超几何检验法,使得共同致病基因的选取更加准确。本发明方法能够预测可能影响到两种疾病的关键驱动基因,可实现精准医疗。
【IPC分类】G06F19/18
【公开号】CN105631244
【申请号】CN201511024251
【发明人】宋月红, 黄涛, 蔡雷, 陈文忠, 贺林
【申请人】上海交通大学
【公开日】2016年6月1日
【申请日】2015年12月30日
当前第2页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1