一种药物基因靶点预测方法

文档序号:9471810阅读:2363来源:国知局
一种药物基因靶点预测方法
【技术领域】
[0001] 本发明设及药物基因组学和计算生物学领域,具体设及一种药物基因祀点预测方 法。
【背景技术】
[0002] 药物基因组学是后基因组时代最重要的科学研究方向之一,是药物功能研究、 药物祀点设计、研究药物基因互作和探索现有祀向药物机制的有效方法。药物基因组 学是功能基因组学与分子药理学的有机结合,并区别于一般意义上的基因学,它不是 W发现人类基因为主要目的,而是相对简单地运用已知的基因理论改善病人的治疗, W药物效应及安全性为目标,研究各种基因突变与药效及安全性的关系。正因为药物 基因组学是研究基因序列变异及其对药物不同反应的科学,所W它是研究高效、特效 药物的重要途径(Pharmaco邑enemies of Hypertension and Heart Disease. Arwood MJl,化vallari LH, Duarte JD.Qirr Hype;rtens Rep. 2015Sep;17(9):586. doi: 10. 1007/ S11906-015-0586-5.)〇
[0003] 精准医疗(PrecisionMedicine)是W个体化医疗为基础、随着基因组测序技术快 速进步W及生物信息与大数据科学的交叉应用而发展起来的新型医学概念与医疗模式。其 本质是通过基因组、蛋白质组等组学技术和医学前沿技术,对于大样本人群与特定疾病类 型进行生物标记物的分析与鉴定、验证与应用,从而精确寻找到疾病的原因和治疗的祀点, 并对一种疾病不同状态和过程进行精确分类,最终实现对于疾病和特定患者进行个性化精 准治疗的目的,提高疾病诊治与预防的效益。
[0004] 祀向药物的研发是精准医疗的重要组成部分。实现精准医疗的基础是合理利用 已经有效整合的海量组学数据;同样,祀向药物的研发,第一步需要对现有的药物基因组 数据库进行有效的整合并从中进行数据挖掘。当前,世界上的权威药物基因组数据库有 Dru浊anKHierapeutic Target Dat油ase和地armG邸等。Dru浊ank,是目前世界上最大 的药物数据库,由加拿大阿尔伯塔大学的科研工作者建立并负责维护,其收录了3000多种 祀向药物品牌名、化学结构、蛋白和DNA序列、药理学、毒理学和病理学等80多个方面的信 息,此外还收录了4100种已经获准或实验中药物的相关信息值ru浊ank:a comprehensive resource for in silico drug discovery and exploration. Wishart DS,Knox C, Guo AC, Shrivastava S, Hassanali M, Stothard P, Chang Z,Woolsey J.Nucleic Acids Res. 2006 Jan 1;;34值at油ase issue):D668_72. Dru浊ank 4. 0:shedding new li曲t on drug metabolism. Law V,Knox C, Djoumbou Y, Jewison T, Guo AC, Liu Y, Maciejewski A, Arndt D, Wilson M, Neveu V, Tang A, Gabriel G, Ly C, Adamjee S, Dame ZT, Han B,Zhou Y, Wishart DS.Nucleic Acids Res.2014 Jan l;42(l):D1091-7.)。Dru浊ank最大的特 色是它支持全面而复杂的捜索,结合化u浊ank可视化软件,能让科研工作者们非常容易的 检索到新的药物祀点、比较药物结构、研究药物机制W及探索新型药物。举个例子,如果 有人得到了一种新病毒或致病菌的序列,他就可W利用化U浊ank检索运些病毒或病菌上 可能的蛋白质祀点和作用于运些祀点的药物,运就为医疗和药物开发带来了极大的便利。 化erapeuticTargetDat油ase,由新加坡国立大学的科研工作者建立并负责维护,该数据 库提供了已知或正在探索的可用作治疗的蛋白质祀点和核巧酸祀点的信息,化及与运些祀 点对应的祀疾病、祀通路和相应的药物/配体信息,还包含运些祀点在其他数据库中的相 关链接,包括祀点的功能、序列、3D结构、配体结合性质、酶的命名W及相关文献等信息的 链接。目前,此数据库中包含1174个祀点W及1251个药物/配体(化enX,JiZL^en YZ.TTD:l'herapeuticTargetDat油ase.NucleicAcidsRes. 30(1) :412-415, 2002.Zhu F,ShiZ,QinC,TaoL,LiuX,XuF,ZhangL,SongY,LiuXH,ZhangJX,HanBC,Zhang P,ChenYZ.Therapeutictargetdatabaseupdate2012:aresourceforfacilitating target-orienteddrugdiscovery.NucleicAcidsRes. 40Ol):D1128-1136, 2012.)D pharmGKB,全称为ThePharmacogenetics&Pharmacogenomicsknowledgebase,是一个遗 传药理学和基因组药理学数据库,同时也是对人类个体基因中存在的差异如何导致个体对 药物反应差异进行研究的研究联盟,包含有15188个基因与4654种药物和4067种疾病 的相互作用资料(M.怖id-Carrillo,E.M.McDona曲,J.M.Hebert,L.Gong,K.Sangkuhl,C. F.Thorn,R.B.AltmanandT.E.Klein."PharmacogenomicsKnowledgeforPersonalized Medicine"Clinical化a;rmacology&Therapeutics(2012)92(4) :414-417.)。该数据库由 NIH/NIGMS遗传药理学研究网络和数据库支持。
[0005] 近年来,聚类算法被越来越多地应用于药物基因祀点的预测,常见的聚类算法有 MC0DE算法和M化算法。
[0006] MC0DE算法,英文全称为MolecularComplexDetection,中文名称为分子复合物 检测,是针对检测蛋白质网络中的蛋白质复合体而提出的一种聚类算法,它主要包括W下3 个步骤:节点赋权重、模块预测W及可选的后期处理操作。该算法首先计算每个结点的密度 (密度根据该节点W及其邻接点组成的子图的密度计算),再根据设定的结点的度和密度 W及遍历深度等参数对网络图进行深度遍历找到符合条件的子图,其中一个网络图中的一 个结点代表一种事物,两个结点之间的边代表两个结点所代表的事物之间的联系。MC0DE算 法可W用来发现网络图中的稠密子图,一个稠密子图代表运些结点之间具有密切的联系, 预示运些结点所代表的事物之间可能存在某些尚未被发现的关联(Anautomatedmethod forfindingmolecularcomplexesinlargeproteininteractionnetworks.GaryD Baderand化ristopherWV化gue),同时,该算法始终根据结点的度进行聚类操作,所W对 网络图中的边的变动较为敏感。此外,MC0呢算法不适用于带权网络图。
[0007] M化算法,英文全称为MarkovClusterAlgorithm,中文名称为马尔可夫算法, 是一种快速、简单、易扩展的聚类算法,它可W应用于有权有向图,核屯、思想为模拟图中的 随机游走过程,其理论基础是:如果一个网络图中存在多个聚类簇,那么一个聚类簇中的 边(事物与事物的联系)会相对较多,而聚类簇之间的边会比较少,运就意味着如果从一 个结点开始随机地访问一个它的邻接点,则它更倾向于访问一个与它同属于一个聚类簇 的令陶点度roheeS,v曰nHe1denJ(2006)Ev曰lu曰tionofclustering曰Igorithmsfor protein-proteininteractionnetworks.BMCBioinformatics7:488.)。MCL算法从网 络图的邻接矩阵经过反复对矩阵执行normalization,inflation,expansion等操作使矩 阵达到最终的稳定状态。所W相对于MC0DE算法,该算法对网络图的边的变动相对不为敏 感。此外,MCL算法既可用于不带权网络图,也可用于带权网络图。
[0008] MC0DE算法与M化算法都可W只依据网络图中结点的度进行聚类,所W本发明设 及到了运两种算法并对MC0DE算法进行了改进。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1