获得改善的治疗性配体的制作方法

文档序号:9553250阅读:414来源:国知局
获得改善的治疗性配体的制作方法
【专利说明】获得改善的治疗性配体
[0001] 本发明涉及获得改善的治疗性配体,特别是通过确定现有或候选配体可如何被修 饰以改善该配体在靶蛋白质上的结合位点处的结合或者通过帮助将作为前体的候选配体 从头设计成治疗剂来获得。
[0002] 治疗性分子(配体)分成2种不同的类别:化学实体(或新型化学实体,NCE)和生 物制品。前者为低分子量有机化合物,其分子量通常为500道尔顿或更低,并且是化学合成 的或分离自天然产物。这些化合物通常衍生自通过筛选化学或天然产物文库而发现的起始 化学物质或"苗头化合物"。这样的苗头化合物通常对靶具有亚最佳的结合亲和性,并且需 要在化学修饰中大量的反复试验以获得针对靶的较好的亲和性(通常具有低微摩尔或更 低的亲和常数(K d))。优选的是,苗头化合物具有较低的分子量(例如,300道尔顿或更低), 以便随后的化学修饰不会超过500道尔顿的界限。这些苗头化合物通常被称为"片段"。用 以获得候选治疗性分子或前导分子的苗头化合物优化通过结构信息而大幅增强;例如通过 获得与苗头分子或片段共复合的蛋白质的X射线晶体结构。这样的数据提供了对于小分子 在靶蛋白质上的结合位置的洞察,并且重要的是表明了该两者之间的原子相互作用如何导 致结合。此外,揭示了紧紧围绕所结合的苗头化合物的蛋白质表面的拓扑性质;具体而言, 如果其为裂沟或口袋,则该结构将表明所述苗头化合物可如何经过精细的加工以更好地填 充口袋内的空间以及如何与蛋白质进一步相互作用并由此改善结合亲和性和特异性。
[0003] 有大量的基于计算机的算法可以用来帮助医药药剂师对苗头化合物的化学精细 加工进行合理的选择。这些是基于物理学的方法(其试图根据第一原理来计算小分子与蛋 白质之间的结合自由能)(例如Schrodinger(RTM)软件套件)或统计势方法(其依赖于从 蛋白质-小分子结构的集合提取的原子相互作用的数据库)(例如SuperStar)。
[0004] 生物制品为大的肽或蛋白质分子(其分子量超过1000道尔顿)。它们通常为识别 并结合靶分子的抗体或抗体样分子,其通常具有比NCE更好的亲和性和特异性(低纳摩尔 或更低的K d)。它们还可以为其它类型的蛋白质分子,例如激素、细胞因子、生长因子或可溶 性受体。
[0005] 候选生物治疗性分子与结合位点的结合可以通过使该候选治疗性分子突变来修 饰。这可被需要来改善结合亲和性或改变结合特异性。然而,实施突变以及检验突变分子 的结合效率是相对耗时的。在得到结合效率的改善之前可能需要许多不同的突变。
[0006] 已知使用计算机来预测可能是最有效的修饰类型。然而,给定的分子可以以巨大 量的方式修饰,并且难以配置计算机以使得预测可以在实用的时间段内可靠地实现。
[0007] Laskowski R A, Thornton J M,Humblet C&Singh J (1996) "X-SITE: use of empirically derived atomic packing preferences to identify favourable interaction regions in the binding sites of proteins",Journal of Molecular Biology, 259, 175-201公开了基于计算机的方法,其用于鉴定针对蛋白质表面上(例 如在二聚体界面上或在分子识别或结合位点上)不同原子类型的有利相互作用区域。 Laskowski等人的预测基于关于在高分辨率蛋白质结构中所观察到的非键合的分子内接触 的经验数据的数据库。
[0008] 在Laskowski等人的方法中,20种氨基酸被打碎以产生总计488种可能的3原子 片段。考虑到化学相似性,这些片段减少至一组163种片段类型(其将数据库细分)。每个 片段均包含第一原子(被称为"位置3"),其与2个其它原子定义了三角测量(或空间标准 化)位置。通过记录其中原子(其可被称为"第二原子")被发现与3原子片段中的第一原 子形成非键合分子内接触的各个位置而衍生密度函数。
[0009] Laskowski等人通过将密度函数植入结合位点而获得针对给定原子类型的预测的 有利相互作用区域。植入各密度函数以使得与密度函数相应的3原子片段的3个原子的坐 标被迭加至结合位点中相应的3原子片段的坐标上。当来自结合位点中不同的3原子片段 的密度函数重叠时,使用平均"密度"来预测有利的相互作用区域。
[0010] Laskowski等人的方法是相对复杂的,并丢弃了潜在有用的数据。Laskowski等人 通过利用针对各片段类型的第二原子接触的位置填充3D网格来获得密度函数。不同的网 格用于163种片段类型的每一种。然后,将各第二原子类型的数据进行数学转换以给出密 度函数。通过使用Laskowski等人的片段定义,片段类型可以由相同残基上的不同原子和 由不同残基上的原子所共有。当Laskowski等人的数据库在这些片段类型上建立时,存在 主链片段过剩,这需要在将密度函数植入结合位点的阶段进行权重下调。此外,给定的片段 类型可包括数个实际片段,其在键长和键角中具有微小差异、以及在第二原子分布中具有 伴随差异,当在这些标度(division)中结合时,这些差异将被掩盖。
[0011] Laskowski等人用于获得经验数据的蛋白质短程二级结构可导致偏倚并降低经验 数据指示有利相互作用区域的效率。
[0012] 本发明的目的是解决上文讨论的现有技术的至少一个问题。
[0013] 根据本发明的方面,提供了用于从头设计将与大分子靶的结合位点结合的配体或 者鉴定用于改善配体对大分子靶的结合位点的亲和性的配体修饰的方法,其包括:
[0014] a)鉴定形成靶结合位点的表面的原子的靶列表;
[0015] b)将靶列表中的各原子(下文被称为Θ原子)鉴定为特定的Θ原子类型;
[0016] c)从生物大分子的结构数据库中提取关于非键合的分子内或分子间原子与原子 接触的信息,其中原子的接触对中的第一原子为特定的Θ原子类型,并且该接触对中相对 的第二原子(下文被称为t原子)为特定的t原子类型,所述信息包括关于t原子相对 于Θ原子的空间和/或上下文数据,并且针对给定Θ原子类型的多个接触从所述数据库 收集的所述数据在下文中被称为Θ接触集;
[0017] d)对于在步骤b)中在靶列表中鉴定的每个Θ原子,根据在步骤c)中提取的相应 Θ接触集,将关于给定t原子类型或预定的相关t原子类型组的数据在靶结合位点中或 其周围进行迭加;
[0018] e)以预测结合位点的一个或多个有利区域的方式组合和/或解析迭加的数据,在 所述有利区域中给定的I原子类型或预定的相关I原子类型组具有高的理论倾向性;以 及
[0019] f)通过使用理论上对接至结合位点中的候选配体,将候选配体的一个或多个原子 的类型和位置与针对各自t原子类型所预测的有利区域相比较,以就备选的和/或额外的 候选配体原子而言鉴定候选配体的修饰,所述修饰将在备选的和/或额外的候选配体原子 与各自I原子类型有利区域之间产生更大的交叉,从而使得修饰的候选配体对结合位点 的亲和性相较于未修饰的候选配体得到改善;
[0020] 其中数据库中的每个非键合的分子内或分子间接触被定义为蛋白质折叠的相对 残基之间或者大分子折叠的相对单体单元之间或者2个相互作用的大分子伴侣之间的接 触,并且特别是折叠的一侧上或第一相互作用伴侣上的Θ原子与相对一侧上或第二相互 作用伴侣上的I原子之间的接触;在该情形中,满足以下条件:
[0021 ] S-Rw彡t,其中s为所述接触的2个原子之间的间隔,Rw为所述接触的2个原子 的范德华半径的总和,而t为预定的阈值距离;以及
[0022] 其中在步骤b)中独特地鉴定Θ原子类型,使得在针对给定的Θ原子类型在步骤 c)中提取的Θ接触集的数据与针对任何其它Θ原子类型在步骤c)中提取的任何其它Θ 接触集的数据之间不存在交叉,除了关于涉及作为I原子的给定Θ原子的接触的数据以 外。
[0023] 因此,结合位点中的各靶原子类型被独特地分类,并且与关于从结构数据库提取 的接触集(其是独特的,并且不与与任何其它原子类型有关的接触集重叠,除了涉及本身 作为I原子的靶原子类型的那些接触以外)的信息有关。这意味着基于结合位点中的一 个靶原子测定的针对给定I原子类型或预定的相关I原子类型组的理论位置的分布可以 更有效地(例如不进行加权)与基于结合位点中的另一个靶原子测定的针对I原子类型 或预定的相关I原子类型组的理论位置的分布结合(例如通过总和),例如以提供针对I 原子类型或预定的相关I原子类型组的一个或多个有利区域的改善的预测。并且由于结 合位点中的各靶原子被独特地分类,故不存在要考虑的键长或键角变化,因此给定I原子 的理论位置更精确。
[0024] 在实施方案中,利用简单的规则来为三角测量的目的独特地鉴定相邻的原子。不 需要关于相邻原子的化学性质进行假设,这例如在根据Laskowski等人的163个3原子片 段类型来表征接触类型时是必需的。
[0025] 在实施方案中,在步骤c)中提取的空间数据通过几何参照Θ原子的位置和第三 及第四原子的位置而定义了 Θ接触集中指定的各t原子的位置,其中第三原子与Θ原子 共价键合,并且第四原子与第三原子共价键合。在这样的实施方案的实例中,对于Θ接触 集中指定的各个I原子,在步骤c)中提取的所述空间数据还通过几何参照Θ原子的位置 和第三及第四原子的位置而定义了第五和第六原子的位置,其中第五原子与I原子共价 键合,并且第六原子与第五原子或I原子共价键合。
[0026] 在实施方案中,步骤d)的靶位点中或其周围的迭加包括:解析Θ接触集以提取针 对包含给定的I原子类型或一种或多种预定的相关I原子类型组的接触的空间数据;和 标绘此空间数据以测定理论位置,其代表了其中如果:i)该接触的Θ原子定位于靶结合位 点中的相应Θ原子的位置;以及ii)该接触的第三和第四原子定位于靶结合位点中的相应 Θ原子的第三和第四原子的位置,则各t原子类型或一种或多种预定的相关t原子类型 组的每一种会定位于的位置。在实施方案中,在标绘步骤之前针对上下文数据对空间数据 进行解析。
[0027] 在实施方案中,其中针对t原子类型(或者一种或多种预定的相关t原子类型 组)的理论位置的密度高于预定阈值的区域被鉴定为有利区域之一。在这样的实施方案的 实例中,针对靶列表上的多个Θ原子测定针对给定t原子类型或一种或多种预定的相关 I原子类型组的理论位置,并且其中累积理论位置的密度高于预定阈值的区域被鉴定为有 利区域之一。
[0028] 因此,将来自结合位点中不同原子的理论位置累积结合起来,随后为预测有利区 域的目的获得理论位置的密度。这导致更准确地统计学表示给定I原子类型或在相关I 原子类型的给定组中,位于给定位置处的概率,因为其以成比例且无偏的方式考虑了结合 位点所有相关原子类型的贡献。相反,在Laskowski等人的方法中,密度函数衍生自3原子 片段的组。每个原子可以与几个不同的3原子片段组关联,因此不可能简单地以与本发明 的实施方案相当的方式将密度函数加算在一起。实际上,在组合密度函数之前必须进行加 权和/或平均,这增加了复杂性和/或降低了准确性。
[0029] 在实施方案中,仅将彼此间隔4个或更多残基的原子之间的接触用于鉴定有利区 域。这显著减少或避免了由于短程二级结构所导致的偏倚。在实施方案中,接触数据主要 代表了远程的交叉折叠的蛋白质数据。
[0030] 根据本发明的另一个方面,提供了生成数据库的方法,所述数据库用于从头设计 将与大分子靶的结合位点结合的配体或者鉴定用于改善配体对大分子靶的结合位点的亲 和性的配体修饰的方法,所述生成数据库的方法包括:
[0031] 分析多个蛋白质或其它生物学大分子的每一个中原子的相对位置,以鉴定所述蛋 白质或大分子的第一原子(被称为Θ原子)与第二原子(被称为t原子)之间的非键合 分子内接触的情形;以及
[0032] 生成数据库,对于各个鉴定的接触,所述数据库指定:Θ原子的类型,t原子的类 型,以及I原子相对于Θ原子的位置;
[0033] 其中非键合的分子内接触被定义为满足以下条件的情形:
[0034] S-Rw < t,其中s为Θ原子和I原子之间的间隔,Rw为Θ原子和I原子的范 德华半径的总和,而t为预定的阈值距离,其通常为2. 5埃,优选为0. 8埃;以及
[0035] 其中在蛋白质的情况下,Θ原子和t原子在线性多肽上彼此间隔至少4个残基 的氨基酸残基上,或者在分开的多肽链上。
[0036] 根据本发明的另一个方面,提供了生成数据库的方法,所述数据库用于从头设计 将与大分子靶的结合位点结合的配体或者鉴定用于改善配体对大分子靶的结合位点的亲 和性的配体修饰的方法,所述生成数据库的方法包括:
[0037] 分析多个蛋白质或其它生物学大分子的每一个中原子的相对位置,以鉴定所述蛋 白质或大分子的第一原子(被称为Θ原子)与第二原子(被称为t原子)之间的非键合 分子内接触的情形;以及
[0038] 生成数据库,对于各个鉴定的接触,所述数据库指定:Θ原子的类型,t原子的类 型,以及I原子相对于Θ原子的位置;
[0039] 生成数据库,对于各个鉴定的接触而言,数据库指定:θ原子的类型,t原子的类 型,以及I原子相对于Θ原子的位置;
[0040] 其中非键合的分子内接触被定义为满足以下条件的情形:
[0041] s-Rw < t,其中s为Θ原子和I原子之间的间隔,Rw为Θ原子和I原子的范 德华半径的总和,而t为预定的阈值距离,其通常为2. 5埃,优选为0. 8埃;以及
[0042] 其中该方法包括将数据库细分以形成鉴定的接触的组,其中Θ原子为蛋白质的 20种天然氨基酸中存在的167种非氢原子的一种且仅一种,并且t原子在通过基于化学相 似性将蛋白质的20种天然氨基酸中存在的167种非氢原子分选成组而获得的多个非重叠 组中的一种且仅一种中。
[0043] 现将参照附图,仅以举例的
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1