基于蛋白质网络的药物靶标确定和/或药物功能确定方法

文档序号:6605369阅读:1443来源:国知局
专利名称:基于蛋白质网络的药物靶标确定和/或药物功能确定方法
技术领域
本发明涉及一种新的确定药物靶标和/或确定药物新功能的方法,即 基于蛋白质相互作用网络的药物靶标确定和/或药物功能确定方法。
背景技术
近些年来,虽然在药物开发中投入的经费越来越多,但每年由美国食品及药物管理局(FDA)批准的新药物个数一直没有增加。不仅如此,人类基因组的全部测序也没有像预期那样给药物开发带来一个飞跃,每年只有2 3个新的基因被确定为药物的靶标,而大多数的药物还都是针对已有的药物靶标基因而设计。同时,每年又都会有很多药物因临床上出现的各种各样非预期的问题被回收。这种高投入,低产出的问题一直是新药物开发中的一个难题。针对已有的知识对药物潜在的靶标进行预测是解决这一难题的一个很好途径。通过对药物潜在的靶标进行定位,我们可以深入理解药物作用的机制,预测药物的潜在功能、 副作用等关键信息,并为我们研发新药物提供帮助。以往对药物靶标进行预测的研究主要可以分为两类。一类是基于药物的药理作用或治疗作用,简称药物作用;另一类是基于药物本身的化学结构特点。基于药物作用的方法认为如果药物具有相似的作用,那它们可能有相同的靶标,从而通过已有靶标的药物来推断未知靶标的药物。基于结构的方法认为药物如果结构类似,那么它们有可能与相似的蛋白质绑定、有相似的靶标。目前研究的局限主要在于1.以上两种假设并不是总是成立。众多研究已经发现,药物可能会由于干预相同信号转导通路(pattway)的不同功能蛋白而产生相似的作用。因而,简单认为具有相似的作用就有相同的靶标是不完全合理的。而基于结构的预测方法也有局限,因为已知某些药物虽然结构差异很大,但作用机理和靶标完全相似。2.以往的研究往往是将这两种预测思路分开,而没有同时利用药物作用和结构信肩、ο3.更重要的是,以上研究只能在小规模上展开,而且没有充分利用药物靶标的相互作用等多种信息。本发明人的前期研究工作发现利用基因在生物网络上的距离能够有效地解释疾病表型的相似性,在此基础上通过建立特定的回归模型,能够实现在全基因组水平上对于致病基因的大规模预测,并达到了目前最高的致病基因预测精度(发章发表于mi X, Jiang R, Zhang MQ, Li S. Network-based global inferenceof human disease genes. Molecular Systems Biology 2008 ;4 :189)。本论文发表后在国际上取得了较大影响,例如Nature出版集团的四个领域选为重要文章,NatureChina作为亮点专题报道;美国医学信息学会“转化生物信息学(TranslationalBioinformatics) 2009峰会”将本文作为年度选评论文之一,评价本成果“基于分子数据,创建了一种新的疾病分类方法(create a new classification of diseasebased on molecular (1已七8),,,等。
以上研究积累,为我们突破当前药物靶标研究的局限,提出并建立新的药物靶标确定、药物功能发现方法,奠定了很好的基础。

发明内容
根据本发明的一个方面,提供了一种药物靶标确定方法,其特征在于包括确定一个已知药物集中的一个第一药物和一个第一蛋白质之间的相互作用关系评价指标,所述评价指标综合了所述第一药物和所述第一蛋白质之间在药物作用相似度的权重系数估计值和和药物结构相似度的权重系数估计值;所述第一药物到所述药物集中的其他所有药物的作用相似度的分布;所述第一药物到所述药物集中的其他所有药物的结构相似度的分布;所述蛋白质到所述药物集中的所有药物的亲近度的分布。


图1显示了一个ATC编码树状示例的结构示意图。图2示意显示了药物-蛋白质的亲近度9W。
具体实施例方式本发明人在研究中发现1.具有相似治疗作用的药物,它们在靶标上的相关性可以体现在存在同一条生物通路的基因产物、或者在蛋白质网络(即蛋白质相互作用网络,Protein-Protein Interaction Network,简称为PPI网络)中紧密联系的蛋白等。正是由于它们靶标在生物过程中的相关性及模块性,导致了它们治疗作用上的相似性。2.结构上相似的药物可能会作用于具有相似4级结构的蛋白质上。而这种三维中的蛋白结构的相似性往往与其功能的相关性有直接的关系,例如在蛋白质相互作用网络上具有紧密联系。基于以上分析,本发明人认为,药物治疗作用的相似性(TherapeuticSimilarity, 下文简称为TS)以及药物化学结构上的相似性(Chemical Similarity,下文简称为CS),以上二者是与药物作用的靶标在PPI网络中的模块性相关的。这种“模块性”可以体现为PPI 网络中的紧密连接的子聚团,或者为最短距离非常接近的多个蛋白质。基于这个理解,本发明人建立了一种基于蛋白质相互作用网络的药物靶标预测方法,称之为drugCIPHER。根据本发明的一个实施例的基于蛋白质网络的药物靶标预测方法(drugCIPHER) 包括1.提出新的衡量药物作用相似性的方法——基于语义网络的药物作用相似性衡量,用于计算药物作用相似性(TS);2.综合药物作用相似性、化学结构相似性,构成药物相似性网络,同时利用药物靶标所构成的靶标网络,建立药物网络与靶标网络这两层网络关联的回归模型,从而利用靶标网络的相互作用信息来解释药物的相似性。如果某一靶标在网络中的相互作用信息,与药物的相似性信息吻合的越好,那么这个靶标就越可能是这个药物作用的靶标。本发明的药物靶标确定方法可以对这种吻合程度进行量化(即下文公式4定义的“亲近度Φ^”),从而确定药物的靶标,如果出现亲近度很高的靶标,而这个靶标目前并没有报道,则成为药物的新靶标。3.利用药物靶标所组成的特征向量的相似性,发现药物的新功能或副作用。按照该方法,发明人对7 种药物组成的一个药物集中的所有药物靶标进行了预测。同时,发明人发现将药物作用信息和自身的化学结构信息结合起来能够起到更好的效果,并能够预测出药物的新功能和副作用。本方法适用于药物靶标预测、药物新功能发现、 组合药物发现、药物副作用发现等多个领域。值得注意的是,本方法不仅限于将药物作用相似度(TS)和结构相似度(CS)作为输入的实施例中。用drugBank等其它各种数据库中记载的有关药物治疗作用、药理作用、毒理作用、副作用等信息,都可以用于本方法计算相似度的依据,也均属于本专利的保护范围。药物作用的相似度(TS)为了衡量药物作用上的相似度,发明人利用了世界卫生组织药物统计中心编制的解剖-治疗-化学的药物分类编码系统(Anatomic Therapeutic Chemicalclassification system,下文简称 ATC。见http://www. whocc. no/atcddd/)。ATC 分类系统是一个 5 层的编码系统,各称为大类码、亚类码、一级次亚类码、二级次亚类码和品名码。其中大类码按解剖学分类方法进行分类,亚类码和一级次亚类码按治疗学分类方法进行分类,二级次亚类码则按化学品和治疗学混合分类法进行分类。药品ATC码分别记录了药物不同层次的特点。 每一个药物被分配给一个或多个ATC编码,而同一个ATC编码又有可能对应多个药物。ATC 编码共有5部分,分别记录了对应ATC分类系统的5层信息。例如,ATC编码为A10BA02代表着如表1所示的含义。表IATC编码示例
权利要求
1.药物靶标确定方法,其特征在于包括确定一个已知药物集中的一个第一药物(d)和一个第一蛋白质(P)之间的相互作用关系评价指标,所述评价指标综合了 所述第一药物(d)和所述第一蛋白质(P)之间在药物作用相似度(化)的权重系数估计值(《W)和和药物结构相似度(CS)的权重系数估计值(^piO;所述第一药物(d)到所述药物集中的其他所有药物的作用相似度(TSd)的分布;所述第一药物(d)到所述药物集中的其他所有药物的结构相似度(CSd)的分布;所述蛋白质(P)到所述药物集中的所有药物的亲近度(φρ)的分布。
2.根据权利要求1所述的方法,其特征在于所述作用相似度0 )由作用相似度向量 (TSd= ITSddl,TSdd2...TSddnD表征,所述作用相似度向量的每个分量为所述第一药物与另一药物所对应的ATC编码的一个相似度的最大值。
3.根据权利要求2所述的方法,其特征在于所述ATC编码的相似度为所述第一药物与所述另一药物所分别对应ATC编码的两个叶节点(i,j)在所述药物集中分别出现的频率和它们最长前缀出现的频率的函数,该函数可以由下式表征
4.根据权利要求2或3所述的方法,其特征在于所述结构相似度(CSd)由结构相似度向量为(C&= ICSddl,CSdd2... CSddnD表征,该结构相似度向量的每个分量为所述第一药物与另一药物的分子子结构的交集与这两个药物子结构的并集之比。
5.根据权利要求4所述的方法,其特征在于所述亲近度(Φρ)由所述蛋白质(ρ)到所述药物集中的所有药物的亲近度向量为
6.根据权利要求5所述的方法,其特征在于所述亲近度((Py)由下式表征
7.根据权利要求6的方法,其特征在于药物作用相似度(TS)的权重系数估计值彳《W) 和药物结构相似度(CS)的权重系数估计值(^pO是从回归模型
8.根据权利要求1的方法,其特征在于为了将( 式简化,根据本发明的一个实施例,那些对所述式( 贡献最大的药物能够很好地拟合下式的情况下
9.根据权利要求8的方法,根据(7)式,任意一个药物都得到一个对应所有蛋白质的特征向量,即药物靶标特征向量。利用这一药物靶标特征向量的相似度,可以进行药物新功能和副作用的预测。
全文摘要
药物靶标确定方法,其特征在于包括确定一个已知药物集中的一个第一药物(d)和一个第一蛋白质(p)之间的相互作用关系评价指标,所述评价指标综合了所述第一药物(d)和所述第一蛋白质(p)之间在药物作用相似度(TS)的权重系数估计值和和药物结构相似度(CS)的权重系数估计值所述第一药物(d)到所述药物集中的其他所有药物的作用相似度(TSd)的分布;所述第一药物(d)到所述药物集中的其他所有药物的结构相似度(CSd)的分布;所述蛋白质(p)到所述药物集中的所有药物的亲近度(Φp)的分布。以上药物靶标确定方法还可有效发现药物的新功能或副作用。
文档编号G06F19/18GK102298674SQ201010218468
公开日2011年12月28日 申请日期2010年6月25日 优先权日2010年6月25日
发明者李梢, 赵世文 申请人:清华大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1