流感病毒神经氨酸酶晶体结构和其用途的制作方法

文档序号:6455397阅读:735来源:国知局
专利名称:流感病毒神经氨酸酶晶体结构和其用途的制作方法
技术领域
本发明涉及流感病毒神经氨酸酶蛋白晶体及其结构和其用途。
背景技术
流感病毒
A型流感病毒是毒力能够变化的RNA病毒。流感病毒的两种主要 表面糖蛋白是血凝素(HA)和神经氨酸酶(NA)。 HA介导细胞表面的唾 液酸受体结合以启动病毒感染。病毒复制后,NA移除病毒和细胞糖 蛋白上的唾液酸以促进病毒释放以及促进感染向新细胞的传播。使用 不同的HA和NA分子的独特的抗原性将A型流感病毒分为如下亚型: 根据HA分为16种亚型(H1-H16),根据NA分为9种亚型(N1-N9)。 在禽类发现了 HA和NA亚型的不同组合,二十世纪发生在人类的三 次大范围的流行在1918年由含有H1N1的病毒、在1957年由含有 H2N2的病毒以及在1968年由含有H3N2的病毒导致。Nl和N2NAs 属于系统发育明显不同的组,组-l包含Nl、 N4、 N5和N8亚型,而 组-2包含N2、 N3、 N6、 N7和N9。
NA已经在基于结构的酶抑制剂设计程序中被作为靶点,并已经产 生了两种药物Relenza (扎那米韦(zanamivir))和达菲(Tamiflu)(奥塞米 韦(oseltamivir))。这些开发的成功部分归因于酶的催化部位是可以被用 于独立于亚型的治疗的不变特征的提议,以及它们是相对刚性的,在 抑制剂结合部位只有较小的构象变化的观测。支持这些结论的X-射线 晶体学结构信息仅可用于组-2 NA的N2和N9,但组-1酶的活性部位 会是相似的这一概念受到更远关系的B型流感NA的结构与组-2酶的 结构相似的观测支持。然而,用达菲治疗感染包含不同NA亚型的病 毒的人类后,产生了不同的耐药NA突变病毒。也有抑制剂结构/活性 关系不适用于跨亚型的指征。禽流感病毒的高致病形式,H5N1,在二十世纪末出现在远东地区,
且其在全球范围内的持续传播已引起恐慌,该病毒可能获得了其在人 类之间有效传播所需的遗传改变,引发新的大范围流行。在有效的疫
苗开发之前,緩解这种爆发的影响的主要希望寄于NA的抑制剂。 发明公开
本发明涉及三种Nl组NA,即Nl 、 N4和N8的晶体和晶体结构。 已经发现,尽管这三种蛋白的活性部位彼此基本相似,但在这些活性 部位和N2组的NA成员的活性部位之间存在显著的构象差异。这些 差异导致Nl组的神经氨酸酶的结合袋的变化,从基于目前可用的组-2 NA结构的同源建模(homology modelling)(或使用相似的技术)来看, 这些变化并不明显。
更具体地,本发明人已经获得了 Nl、 N4和N8的脱辅基晶体, 以及这些蛋白与一个或多个NA抑制剂的共结晶体。因而, 一方面, 本发明提供了表1至4中任一表中列出的Nl组神经氨酸酶的三维结 构和其用途,本文下面还描述了表1至3中任一表中列出的Nl组神 经氨酸酶的三维结构。
因而,本文提及的表1至3的结构或表1至3中的任一表中的结 构包括独立的表1、 2和3。
在总的方面,本发明与Nl组神经氨酸酶结构的提供及其在建模 分子结构的相互作用中的用途有关,例如,具有该结构的潜在和已存 在的药学上的化合物(包括前药、抑制剂或底物),或这样的化合物的 片段。
下文讨论了本发明的这些和其它方面及实施方案。 附表简述
表1 (图l)列出了神经氨酸酶N1的结构的坐标数据。 表2 (图2)列出了神经氨酸酶N4的结构的坐标数据。 表3 (图3)列出了神经氨酸酶N8的结构的坐标数据。附图简述


图1如表1所示。
图2如表2所示。 图3如表3所示。
图4是图1-3的Nl、 N4和N8蛋白的比对,根据表l-3使用的共 有编号系统编号。该共有编号包括命名为A、 B等的残基169、 330、 342和412后的插入,以使在插入后连续的编号(170, 331, 343, 413)继 续。其共有编号是10的倍数的残基由比对上方的星号指示。本文提及 的氨基酸数目是比对的编号,而不是个别序列SEQ ID NO:l、 2和3 的数目,除非有明确相反的说明。
图5显示了 Nl (深灰)和N9 (浅灰)NA的活性部位的重叠。诸如 Glu-276, Glu-119, Asp-151的残基以及采用组1和组2之间的不同构象 的149位的疏水残基以棒状表示法显示。
序列简述
SEQ ID NO:l是用于产生晶体的Nl神经氨酸酶的序列。所述蛋 白从61位后裂解,以使所述晶体的第一个氨基酸是SEQ ID N0:1的 Ser62。
SEQ ID N0:2是用于产生晶体的N4神经氨酸酶的序列。所述蛋 白从78位后裂解,以使所述晶体的第一个氨基酸是SEQ ID NO:2的 Ser79。
SEQIDNO:3是用于产生晶体的N8神经氨酸酶。该蛋白从72位 后裂解,以使所述晶体的第一个氨基酸是SEQIDNO:3的Tyr73。
发明详述
A.蛋白晶体
本发明提供了 Nl组神经氨酸酶蛋白的晶体。所用"N1组神经氨 酸酶蛋白"是指A型流感病毒神经氨酸酶蛋白的Nl组成员。这些是 Nl、 N4、 N5和N8蛋白。来自三种野生型病毒的Nl、 N4和N8蛋白的序列分别如SEQID N0s:l-3所示。
为了产生晶体,通过本领域已知的手段分离所述蛋白,所述手段 包括如附随的实施例描述的那样将该蛋白从实验室生长的病毒表面裂 解。这导致了所述蛋白在N-末端区的裂解,以使被结晶的SEQ ID NOs: 1 -3的实际部分如上面"序列简述"部分所说明的那样。
可选4奪地,所述蛋白可以被重组产生并以类似的方式加工以提供 相同体积和形式的晶体。
A型流感病毒具有RNA基因组,且已知自然界存在Nl至N4蛋 白的变异体。可以修饰SEQIDNO:l-3的序列以反映在自然界发现的 该型的变异体,所述变异体的晶体也在本发明的范围之内。已知对于 许多蛋白,可以对一级氨基酸序列进行限定数量的变化,而基本上不 改变蛋白结晶的能力。因此,例如1至10个,诸如1至7个,例如多 达l、 2、 3、 4、 5或6个氨基酸可以被替换、删除或插入以形成SEQ IDNOs: l-3序列的晶体形成部分,而不改变晶体大小或晶型,或基本 上不改变晶体形成的条件。
其中所述替换、删除或插入发生在如在图4的比对中所示的Nl、 N4和N8蛋白所有三者之间非保守的(也就是三个序列中的至少一个 是不同的)位置尤其如此。因此,本发明的一个方面扩展到晶体,其中 一个或多个(优选如上所说明的)替换、删除或插入发生在N1组蛋白的 非保守位置。因而提及的Nl组神经氨酸酶蛋白(且特别是N1、 N4或 N8蛋白)应被理解为包括这种变异。
本发明的晶体可以是脱辅基晶体或如上所说明的Nl组神经氨酸 酶蛋白与配体的共晶体。因此在另一方面,本发明提供了 Nl组神经 氨酸酶蛋白与配体的共晶体,所述配体诸如选自奥塞米韦、扎那米韦、 DANA (2-脱氧-2,3-双脱氢-N-乙酰神经氨酸)和帕拉米韦(peramivir)或 其衍生物的化合物。
可选4奪地,所述配体可以是与Nl组神经氨酸酶蛋白的相互作用 未知的化合物。这种共晶体可以由共结晶或浸泡获得。产生晶体或共晶体的方法 在附随的实施例中进一步被说明。
本文描述的方法学可以被广泛用于提供在至少3.0 A、且优选至少 约2.2至2.8 A的分辨率时可分辨的Nl组神经氨酸酶蛋白晶体。
因此,本发明还提供了具有至少3.0 A、优选至少2.8A的分辨率 的Nl组神经氨酸酶蛋白晶体。
在更为具体的实施方案中,本发明提供了具有C-正交空间群 C222i和晶胞大小为a=201.74, b=201.51,c=212.43,且在所有方位的晶 胞变异率为5%的Nl晶体。
在另 一 个实施方案中,本发明涉及具有上述提及的空间群和晶胞 大小的Nl与配体的共晶体。这种共晶体的特定实施方案是具有C-正
交空间群C222!和晶胞大小为a=200.62, b=200.70, c=210.48的Nl与奥
塞米韦的共晶体。
Nl蛋白优选是SEQ ID NO:l的62-449残基或其具有1至10个氨 基酸替换、删除或插入的变异体。
在另一实施方案中,本发明提供了具有立方空间群P432和晶胞大 小为a=b=c=193.79 A,且在所有方位的晶胞的变异率为5%的N4晶体。
在另外的实施方案中,本发明提供了具有立方空间群1432及晶胞 大小为a=b = c=193.44 A,且在所有方位的晶胞变异率为5%的N4与 配体的共晶体。特定的配体是DANA。
N4蛋白可以是SEQ ID N0:2的79-470残基的蛋白或其具有1至 IO个氨基酸替换、删除或插入的变异体。
在另一方面,本发明提供了具有四方空间群I4的N8晶体,其晶 月包大小为a=b=90.67 A、 c= c=109.4 A、 a = 90卩=90 y = 90,且在所有 尺度的晶胞变异率为5%。
在另一实施方案中,本发明涉及具有上述提及的空间群及晶胞大 小的N8和配体的共晶体。这种共晶体的实施方案是具有四方空间群 14及具有晶胞大小a=b,.38, c=111.49的N8与DANA的共晶体;具 有四方空间群14及具有晶胞大小a=b=90.58, c=110.78或a=b=90.42, c=109.71的N8与奥塞米韦的共晶体;以及具有四方空间群14及具有
10晶胞大小a=b=90.41, c=109.30的N8与扎那米韦的共晶体。所有所述 的共晶体在所有尺度都具有5%的晶胞变异率。
本发明也提供了 N8与帕拉米韦的共晶体,其具有四方空间群I4 及具有晶胞大小a=b=89.78, c=93.23,且在所有尺度的晶胞变异率为 5%。
N8蛋白可以是SEQ ID N0:3的残基73-470或其具有1至IO个氨 基酸替换、删除或插入的变异体。 B.晶体坐标
在另一方面,本发明也提供了 Nl组神经氨酸酶蛋白的晶体,其 具有表1至3的任一表中的三维原子坐标。
由表1和表1至3的原子坐标确定的结构的有利特征是它们具有 高于约3.0 A的分辨率。
表1至3的Nl组神经氨酸酶蛋白结构的另外优点是它们是未结 合配体的脱辅基结构。这使它们尤其适合浸泡于配体,并因此确定共 复合物结构,因为没有来自配体的构象偏差,这对于建模目的也是理 想的。
表1至3分别给出了 Nl组神经氨酸酶蛋白Nl、 N4和N8的原子 坐标数据。在这些表中,第3列代表原子的名称,第4列是残基类型, 第5列是链的标识,第6列是残基的数目(与图4比对有关的原子编号), 第7、 8和9列分别是正在谈论的原子的X、 Y、 Z坐标,第IO列代表 原子的占位,第11列是原子的温度因子,第12列是链的标识符。
每一表还包括命名为"TIP"的众多水分子;命名为"NAG 146x"的通 过N-连接与146位天冬酰胺连接的N-乙酰D-葡糖胺簇,其中x是对
应于与其连接的蛋白链标识符的字母;以及与每一条链结合的钙离子。
表1至3以内部一致的格式显示。例如(除了表1和2的第一个残 基),这样列出了每一个氨基酸残基的原子坐标骨架氮原子是第一个, 随后是C-a骨架碳原子,命名为CA,接着是侧链残基(根据一个标准 惯例命名),最后是蛋白骨架的碳和氧。可选择的文件格式(例如,诸 如与EBI大分子结构数据库(Hinxton, UK)的才各式一致的格式)可以由 本领域其他技术人员使用或优选,所述文件格式可以包括这些原子不
ii同的排序,或侧链残基不同的命名。然而显而易见的是,使用不同文 件格式呈现或处理表的坐标在本发明的范围之内。
表1包括N1蛋白的8个蛋白单位,表2包括2个N4蛋白单位。 在本文描述的使用本发明的晶体结构的本发明的实施方案中,应该明 白提及的"N1组神经氨酸酶结构,,应该被解释为任一独立蛋白链的结 构。多于两个单位的使用(或在N1的情况下)并不被排除,但对于实践 本发明不是必需的。同样,提及的"N1组神经氨酸酶结构,,不包括溶剂、 糖或钙离子坐标,尽管如果这些坐标对本发明的特定申请是有益的或 必需的,并不排除其使用。
蛋白结构相似性通常通过均方根偏差(r.m.s.d.)表达或测量,其测 量两套原子空间定位差异。r.m.s.d.测量等价原子最佳重叠后,它们的 间距。可以计算所有原子、残基骨架原子(即蛋白氨基酸残基的氮-碳-碳骨架原子)、仅主链原子(即蛋白氨基酸残基的氮-碳-氧-碳骨架原子)、 仅侧链原子或更通常仅C-a原子的r.m.s.d.。为了实现本发明的目的, 使用下面所列的任一种方法,可以计算这些中的任一种的r.m.s.d.。
优选地,可以通过参照C-a原子计算rmsd,前提是如果使用了选 择的坐标,且这些坐标包括至少约5%,优选至少约10%的这种原子。 如果所选4奪的坐标不包括所述的至少约5% C-a原子,可以通过参照 所有四个骨架原子计算rmsd,前提是这些包括至少约10%,优选至少 约20%且更优选至少约30%的所选择的坐标。如果所选择的坐标包括 90%或更多的侧链原子,可以通过参照所有选择的坐标来计算rmsd。
因此,表1至3的坐标提供了原子位置的量度,以给出3个小数 位的埃表示。所述坐标是一套确定三维形状的相对位置,但技术人员 会理解,具有不同原点和/或轴的完全不同套的坐标能够确定相似或相 同的形状。此外,技术人员会理解,当表1至3中提供的残基骨架原 子坐标重叠时,改变所述结构的原子的相对原子位置使残基骨架原子 (即,蛋白氨基酸残基的氮-碳-碳骨架原子)的均方根偏差小于0.75 A, 优选小于0.6A,更优选小于0.5A,更优选小于0.3A,诸如小于0.25 A,或小于0.2 A,且最优选小于O.l A,通常会导致在其结构的特征
12和Nl组神经氨酸酶蛋白的基于结构的分析的有效性以及其与分子结 构的相互作用方面与表1至3的结构基本相同的结构。
同样,技术人员会理解,改变表中水分子的数目和/或位置通常不 会影响用于Nl组神经氨酸酶蛋白相互作用结构的基于结构分析的结 构的有效性。因此对于本文描述的作为本发明方面的目的,下述在本
发明的范围之内如果表1至3的任一表中的坐标调换到不同的原点 和/或轴;当表1至3中的任一表提供的残基骨架原子坐标重叠时,改 变该结构的原子的相对原子位置以使残基骨架原子的均方根偏差低于 0.75 A,优选低于0.6 A,更优选低于0.5 A,更优选低于0.3 A,诸如 低于0.25 A,或低于0.2 A,且最优选低于0.1 A;和/或改变水分子的 数目和/或位置。
就表1和表2而言,如果所述晶体形式分别包括8个Nl和N4的 拷贝,可以仅使用该蛋白的任一拷贝进行rmsd的计算。
因而本文提及的表1至3中的或来自表1至3的坐标数据、其用 途等等包括坐标数据,其中表中的一个或多个单独的值以该方式变化, 且将被理解为表示同样的意义,除非有相反的明确规定。
确定rmsd的程序包括MNYFIT (称为COMPOSER的程序库的部 分,Sutcliffe, M. J., Haneef, I" Carney, D.和Blundell, T丄.(1987), Protein Engineering (蛋白质工程),1, 377-384), MAPS (Lu, G. An Approach for Multiple Alignment of Protein Structures (蛋白结构多重比对的方法) (1998,以原稿形式在http:〃bioinfol.mbfys.lu.se/TOP/maps.htm1))。
通常考虑C-a原子,然后使用诸如LSQKAB (Collaborative Computational Project 4 (协作计算计划4). The CCP4 Suite: Programs for Protein Crystallography (CCP4套件用于蛋白晶体学的程序),爿cto C,to〃ogm卢^, D50, (1994), 760-763)、 QUANTA (Jones et al" Acta Crystallography A47 (1991), 110-119,且可/人Accelerys, San Diego, CA 商购)、Insight (可从Accelerys, San Diego, CA商购)、Sybyl (可从 Tripos, Inc., St Louis商购)、O (Jones et al., CV7加〃ograp/7/ca, A47, (1991), 110-119)以及其它坐标适宜程序来计算rmsd。在例如程序LSQKAB和0中,使用者可以确定两个蛋白中的残 基,其将被配对用于计算目的。可选择地,可以通过产生两个蛋白的 序列比对来确定残基的配对,在本文下面更为详细地讨"i仑了用于序列 比对的程序。然后可以根据该比对和计算的r.m.s.d.值将原子坐标重 叠。程序Sequoia (C.M. Bmns, I. Hubatsch, M. Ridderstrdm, B. Mannervik: 和 J.A. Tainer (1999) Human Glutathione Transferase A4-4 Crystal Structures and Mutagenesis Reveal the Basis of High Catalytic Efficiency with Toxic Lipid Peroxidation Products (人类谷月光甘肽寿争移酶A4-4晶 体结构和诱变揭示与毒性脂过氧化作用产物有关的高催化效率的基 础),Jowwfl/ o/Mofecw/w 288(3): 427-439)进行同源蛋白序列的
比对以及同源蛋白原子坐标的重叠。 一旦比对,可以使用上面详述的
程序来计算r.m.s.d.。对于相同或高度相同的序列,蛋白的结构比对可 以手工完成或如上面所述的自动完成。另一方法会产生蛋白原子坐标
的重叠,而不考虑序列。
它在比较明显不同套的坐标以计算只基于C-a原子的rmsd值时更 为标准。在分析侧链移动以计算所有原子的rmsd时尤其有用,可以使 用LSQKAB和其它的程序完成计算。
因而,例如,改变表1的结构的原子的原子位置直到任一方位约 为0.5A,优选直到约为0.3A,会在其结构特征和例如用于基于分子 结构的分析的效用方面产生基本上与表1的结构相同的结构。这同样 可应用于表2和3。
本领域的技术人员会明白,在本发明的许多应用中,并不是必须 利用表1至3的所有坐标,而仅是它们的一部分。例如,如下文所描 述的,在建模Nl组神经氨酸酶蛋白的分子结构方法中,可以使用本 文涉及到的选才奪的坐标。
所用"选择的坐标"是指例如至少5个,优选至少10个,更优选至 少50个,更优选至少100个,例如至少500个或至少1000个Nl组 神经氨酸酶蛋白结构的原子。同样,本文描述的本发明的其它应用, 包括同源建模和结构解析,以及数据存储和计算机辅助的坐标处理, 也可以利用表1至3的全部或部分坐标(即,选择的坐标)。所述选择的坐标可以包括或可以由如本文下面所述的在结合环中发现的原子或
与配体结合有关的Nl组神经氨酸酶蛋白的残基包括Glu-119, Val-149, Asp-151, Arg-156, Arg-224, Tyr-252, His-274,Glu-276, Arg-292, Tyr-347和Arg-371。在本发明的优选方面,如果使用本发明的结构所 选择的坐标,这些包括一个或多个这些残基中的 一个或多个原子。
优选地,所述选4奪的坐标包括来自至少两个,例如至少3、 4、 5、 6、 7、 8或9个上述残基的原子。在一个实施方案中,可以使用这些 残基中的每一个的至少一个原子。
可选择地或另外地,可以使用结合环149-153中的一个或多个残 基的一个或多个原子。因此选择的坐标可以包括来自该环至少2个例 如至少3、 4或所有5个残基的至少一个原子。
在一个实施方案中,所述选择的坐标可以包括来自上述环的至少 一个原子(如上述的原子的优选数目)以及来自选自Glu-119、 Glu-276 和Tyr-347的残基的至少 一个原子。
C.同源建模
本发明也提供了其它蛋白(下面称为革巴神经氨酸酶蛋白)同源建模 的方法。所用"同源建模"是指相关神经氨酸酶蛋白结构的预测,其基 于X-线晶体学数据或计算机辅助的结构的从头预测、基于从表1至3 中的任一表或其选才奪的部分导出的坐标数据的处理。
术语"同源区"描述相同的或具有相似的侧链化学基团(例如脂肪 族的、芳香族的、极性的、负电荷的或正电荷的)的两序列中的氨基酸 残基。同源区相同的和相似的残基有时被本领域的技术人员分别描述 为"不变的"和"保守的"。
通常,所述方法包括通过比对氨基酸序列将SEQ ID NOs: 1至3 的任一个的Nl组神经氨酸酶蛋白的氨基酸序列与靶神经氨酸酶蛋白 比较。然后比较序列中的氨基酸,并将同源的氨基酸簇(通常称为"对 应区")集合在一起。该方法识别多肽的保守区并说明了氨基酸的插入 或删除。
15氨基酸序列间的同源性可以使用商购的算法确定。程序5丄Asr、空《SZ^(6T、 SZ^6T7V"、 /IS7-5i^Sr和B^45T 2 (由国立生物技术信息中心提供)被广泛用于本领域的该目的,且能够比对两个氨基酸序列的同源区。这些可以用缺省参数使用以确定SEQ ID NOs: 1 -3蛋白和欲被建模的其它靶神经氨酸酶蛋白之间的同源度。
靶蛋白包括N1组蛋白的其它成员,例如N5,以及N1、N4或N8蛋白的突变体或等位体。在后者的情况下,所述方法可以用于追踪发生在与增加的致病性有关的流感病毒隔离群的神经氨酸酶蛋白的变化或病毒感染的宿主种类的变化。
一旦具有已知和未知结构的多肽的氨基酸序列被比对,在计算机表示的具有已知结构的多肽中,保守氨基酸的结构被转移到其结构未知的多肽的对应氨基酸。例如,已知结构的氨基酸序列中的酪氨酸可以被未知结构的氨基酸序列中对应的同源氨基酸苯丙氨酸取代。
可以通过使用标准的肽几何学或通过诸如分子动力学的分子模拟技术手动设置位于非保守区的氨基酸的结构。该过程的最后步骤通过使用分子动力学和/或能量最低化精化整个结构来完成。
同源建模本身是本领域的技术人员公知的技术(参见,例如Greer,Sc/e"ce, Vol. 228, (1985), 1055,和Blundell W a/.,五w. / 5z.oc/zem, Vol.172,(1988), 513)。这些参考文献中描述的技术,以及通常本领域可用到的其它同源建模技术可以用于完成本发明。
因此,本发明提供了同源建模方法,其包括下述步骤
(a) 将未知三维结构的靶神经氨酸酶蛋白的代表性氨基酸序列与SEQ ID NOs: 1-3中的任一个的神经氨酸酶蛋白的氨基酸序列进行比对以匹配所述氨基酸序列的同源区。
(b) 在来自表1至3的任一表的神经氨酸酶蛋白结构或其选择的坐标的对应区上建模所述未知结构的耙蛋白的匹配同源区的结构;以及
(c) 确定基本上保存了所述匹配同源区结构的所述未知结构的靶蛋白的构象(例如,以便在未知结构的靶蛋白内形成良好的相互作用和/或以便形成低能构象)。
优选地,步骤(a)至(c)的一个或全部由计算机建模完成。本文描述了本发明利用借助计算机(in silico)的Nl组神经氨酸酶
同源物^t型,且这种应用形成了本发明的另外方面。因此,已经通过上述方法确定了靶神经氨酸酶蛋白的构象,这种构象可以用于基于计算机的方法,例如本文所述的合理药物设计的方法。
D.结构解析
Nl组神经氨酸酶的原子坐标数据也可以用于解析其它耙神经氨酸酶蛋白的晶体结构,包括Nl组神经氨酸酶蛋白的其它晶体形式,Nl组神经氨酸酶蛋白的共复合物,其中已经产生了这些耙N1组神经氨酸酶蛋白的X-射线衍射数据或核磁共振光谱数据,并需要解释以提供结构。
例如,Nl组神经氨酸酶蛋白可以以多种晶型结晶。由本发明所提供的表1至3的数据,或其选择的坐标对于解析那些其它晶型的结构尤其有用。这些数据也可以用于解析Nl组神经氨酸酶蛋白共复合物的结构。
因此,如果提供了未知三维结构的耙N1组神经氨酸酶蛋白的X-射线晶体学或核磁共振光谱数据,来自表1至3的任一表的原子坐标数据可以用于解释那些数据以通过本领域已知的技术提供耙标可能的结构,所述技术例如,X-射线晶体学中的定相以及核》兹共振(NMR)光谱中的辅助峰归属。
可以用于这些目的的一个方法是分子取代。在该方法中,无论未知的晶体结构是Nl组神经氨酸酶蛋白的另一种晶型或其共复合体,可以使用本发明的表1至3的任一表中的全部或部分的结构坐标来确定。该方法会提供未知晶体的精确的结构形式,比试图从头开始确定这种信息更为迅速和有效。
用于完成分子取代的本领域已知的计算机程序的实例是CNX(Bmnger AT.; Adams P. D.; Rice L.M., Current Opinion in StructuralBiology (现代结构生物学评论),Volume 8, Issue 5, October 1998, Pages606-611 (也可从Accelrys San Diego, CA商购)、MOLREP (A.Vagin,A.Teplyakov, MOLREP: an automated program for molecular replacement(MOLREP:用于分子取代的自动化程序),J. Appl. Cryst. (1997) 30,1022-1025, CCP4套件的部分)或AMoRe (Navaza, J. (1994). AMoRe: anautomated package for molecular replacement (AMoRe:用于分子耳又代的自动化程序包).Acta Cryst. A50, 157-163)。
因此,本发明的另一方面提供了用于确定蛋白结构的方法,所述方法包4舌
提供表1至3中的任一表的Nl组神经氨酸酶蛋白结构的坐标(或其选择的坐标),
定位所述蛋白的晶体晶胞的坐标以提供所述蛋白的结构。
通过处理表1至3的任一表的数据,本发明也可以用于归属这种蛋白的核磁共振光谱峰。
E.计算机系统
在另一方面,本发明提供了系统,特别是计算机系统,所述系统包含下述中的一个(a)表1至3的任一表的坐标数据,所述数据确定了 Nl组神经氨酸酶蛋白的三维结构或至少其选择的坐标;(b)基于来自表1至3的任一表的坐标数据,通过耙标的同源建模产生的耙神经氨酸酶蛋白的原子坐标数据,或(c)参照来自表1至3的任一表的坐标数据,通过解释X-射线晶体学数据或核磁共振数据产生的靶神经氨酸酶蛋白的原子坐标数据。
例如,所述计算机系统可以包括(i)包含由计算机可读数据编码的数据存储物质的计算机可读的数据存储介质;(ii)用于存储处理所述计算机可读数据的指令的工作存储器;以及(iii)与所述工作存储器以及与用于处理所述计算机可读数据的计算机可读数据存储介质偶联的中央处理器,并由此产生结构和/或进行合理药物设计。所述计算机系统还可以包括与所述中央处理器偶联的显示器以显示所述结构。
本发明还提供了包含上文提及的靶蛋白的原子坐标数据,其中这些数据已经依据本文描述的本发明的方法,基于起始数据提供的表1至3的任一表或其选择的坐标的数据被产生。
这些数据可以用于许多目的,包括产生结构以分析神经氨酸酶蛋白的作用机制和/或进行化合物的合理药物设计,所述化合物与Nl组神经氨酸酶蛋白相互作用,例如是Nl组神经氨酸酶蛋白抑制剂或潜在抑制剂的化合物。
在另一方面,本发明提供了计算机可读的介质,带有下述数据中
的至少一种(a)表1至3的任一表的坐标数据,所述数据确定了 Nl组神经氨酸酶蛋白的三维结构或至少其选择的坐标;(b)基于来自表1至3的任一表的坐标数据,通过把标的同源建模产生的把神经氨酸酶蛋白的原子坐标数据,或(c)参照来自表1至3的任一表的坐标数据,通过解释X-射线晶体学数据或NMR数据产生的耙Nl组神经氨酸酶蛋白的原子坐标数据。
如本文所使用的,"计算机可读的介质"指任何一种或多种介质,其可以通过计算机被直接读取和获得。这样的介质包括,但不限于诸如软盘、硬盘存储介质和磁带的磁存储介质;诸如光盘或只读光盘(CD-ROM)的光存储介质;诸如RAM和ROM的电存储介质;以及诸如磁/光存储介质的这些种类的混合。
通过提供这样的计算机可读介质,本发明的原子坐标数据可以被常规使用以建模Nl组神经氨酸酶蛋白或其选择的坐标。例如,RASMOL (Sayle et al., J7朋,Vol. 20, (1995), 374)是可被公共利用的计算机软件包,其允许获得和分析原子坐标数据用于确定结构和/或合理药物设计。
如本文所使用的,"计算机系统"指用于分析本发明的原子坐标数据的硬件装置、软件装置和数据存储装置。本发明的基于计算机系统的最小硬件装置包括中央处理器(CPU)、输入装置、输出装置和数据存储装置。理想地,提供监视器以使结构数据可视化。所述数据存储装置可以是RAM或用于访问本发明的计算机可读介质的装置。所述系统的实例是可从石圭谷图形公司(Silicon Graphics Incorporated)得到的微型计算机工作站和基于Unix运行的太阳微系统(Sun Microsystems)、Windows NT或IBM OS/2操作系统。
本发明的另外方面提供了方法,所述方法提供用于生成结构和/或进行化合物最优化的数据,所述化合物与Nl组神经氨酸酶蛋白相互作用,所述方法包括
19(i) 建立与远程装置通信,所述远程装置包含
(a)计算机可读的数据,其包含来自表1至3的任一表的Nl组神经氨酸酶结构或其选择的坐标,任选地在不超过0.75 A的Ca原子的均方根偏差内变化。
(ii) 从所述远程装置接收所述计算机可读的数据。
因此,所述远程装置可以包括例如本发明的一个前述方面的计算机系统或计算机可读的介质。所述装置可以在接收到计算机可读数据的不同国家或管辖区。
通信可以借助广域网、局域网、电子邮件等,通过电线或通过诸如地面无线电或卫星等无线装置传送。通常,所述通信其本质是电子的,但通信通^各的一些或全部可以是光学的,例如,通过光缆。
一旦从所述装置接收到数据,本发明可以包括使用在本文描述的本发明的建模系统中的数据的另外步骤。
F.本发明结构的用途
依照本发明获得的晶体结构以及依照本文描述的方法获得的靶神经氨酸酶蛋白的结构,可以以几种方式用于药物设计。例如,为了更充分地理解流感病毒对目前抗病毒药物产生抗性的机制,本发明的结构可以用于分析抗病毒药物与突变酶的相互作用,以及被修饰为把向针对N1组蛋白的变化的药物的结构。
关于这种药物或潜在药物的结合的信息可以通过共结晶、浸泡或将药物通过计算对接在结合袋中来获得。这会指导对化学结构的特定修饰,所述化学结构被设计为介导或调控药物与蛋白的相互作用。可以设计这种修饰以提高其治疗和/或预防的作用。
本文描述的有和没有结合抑制剂的组-1 NA晶体结构,揭示了形成所述酶活性部位的一角的150-环能够在至少两个稳定的构象中存在。组-1 NA结合如奥塞米韦的与组-2酶有相似亲和力的药物,这一事实表明这两个构象之间的能量差异不是很大。流感病毒神经氨酸酶的或至少组-2酶的活性部位的结构具有可塑度,该》见念有些意想不到。尽管我们没有直接的证据,但从序列的观点来看,如果组-2NA的150-环也具有相似的灵活度是不会令人惊讶的。显然,在现有抑制剂缺乏和存在两种情况下,"闭合的"构象在组-2 NA都是能量优选的,但是
考虑到抑制剂与"开放的"构象而不是与"闭合的"构象在能量上有利的相互作用,有充分的理由得到更高能量的"开放的"构象。
例如,基于我们结构的观测,我们建议可以通过向已存在的抑制剂骨架添加额外的耳又代部分来设计新药。在第一个实例中,可以进行
针对组-1 NA的这些分子的设计和精化,如本文下面进一步讨论的。尽管制备针对所有病毒亚型起作用的流感药物看上去是理想的,但有效的组-1特异性抑制剂在现在或将来不会有重要的价值,这对我们来说不是显而易见的。在任一情况下,被设计为开发与组-1 NA的150-环的开放形式的其它相互作用的新抑制剂能够选择组-2 NA中在该环的相似构象是很有可能的。
依然可能的情况是任何新药的临床应用最终都会导致抵抗突变的出现。来自治疗逆转录病毒的教训表明克服该问题的一个策略是应用联合药物疗法。
W获谬和为V,4谬!合務。
在一种方法中,结合到Nl组神经氨酸酶蛋白的化合物的结构可以通过试验确定。这会提供分析结合到Nl组神经氨酸酶蛋白的化合物的起点,因此使本领域的技术人员对于该特定的化合物如何与Nl组神经氨酸酶蛋白相互作用以及其起作用的机制有了详细的了解。
上文描述的基于结构的药物设计的许多技术和方法在一定程度上都依赖于X-射线分析来确定配体在配体-蛋白复合物中的结合位置。X-射线分析的通常方式是对复合物进行X-射线晶体分析,产生差异傅里叶(Fourier)电子密度图,并将特定模式的电子密度与所述配体结合。然而,为了产生所述图谱(例如由Bhmdell et al., in /VoW"
Q7加〃ogra/ /2少卩蛋^4沐釣,Academic Press, New York, London and San
Francisco, (1976)所解释的),必须事先已知所述蛋白的3D结构(或至少所述蛋白结构因子)。因此,Nl组神经氨酸酶蛋白结构的确定也能够产生蛋白-化合物复合物的差异傅里叶电子密度图,确定药物的结合部位并由此可以大大加速合理药物设计的过程。
因此,本发明提供了确定结合到Nl组神经氨酸酶蛋白的化合物
21的结构的方法,所述方法包括
提供本发明的Nl组神经氨酸酶蛋白的晶体;将该晶体与所述化合物浸泡;以及
通过应用表1至3的任一表的坐标数据或其选择的坐标确定所述Nl组神经氨酸酶蛋白化合物复合物的结构。
可选择地,Nl组神经氨酸酶蛋白和化合物可以共结晶。因此,本发明提供了确定结合到Nl组神经氨酸酶蛋白的化合物的结构的方法,所述方法包括将蛋白与化合物混合,结晶蛋白-化合物复合物;以及通过参照表1至3的任一表中的坐标数据或其选择的坐标确定所述蛋白-化合物复合物的结构。
分析所述结构可以利用(i)来自复合物的X-射线晶体衍射数据以及(ii) Nl组神经氨酸酶蛋白的三维结构,或至少其选择的坐标,来产生所述复合物的差异傅里叶电子密度图,所述三维结构由表1至3的任一表中的原子坐标数据或其选择的坐标确定。然后可以分析差异傅里叶电子密度图。
因此,所述复合物可以使用X-射线衍射方法来结晶和分析,例如,依据由Greer et al / o/M^//c/"a/ Cfew/Wo;, Vol. 37, (1994), 1035-1054描述的方法,且差异傅里叶电子密度图可以基于浸泡的或共结晶的蛋白的X-射线衍射模式以及非复合蛋白的解析结构来计算。然后可以分析这些图i普,例如,以确定特定化合物是否以及在何处与Nl组神经氨酸酶蛋白结合和/或改变所述蛋白的构象。
使用诸如来自CCP4计算包的程序的程序可以计算电子密度图谱(Collaborative Computational Project 4 (协作计算计划4). The CCP4Suite: Programs for Protein Crystallography (CCP4套件:用于蛋白晶体学的程序),爿cto 0^to/fogra/ /w'ca, D50, (1994), 760-763.)。对于图i普可视化和建模,可以使用诸如"O" (Jones et al., Xcto 0"to/fograp/nca, A47,(1991), 110-119)的程序。
上文提及的所有复合物都可以使用已知的X-射线衍射技术来研咒,'并可以使用诸如CNX (Brunger et al" CWre" Qp/m'o" 5Vn/c加ra/所o/ogy, Vol. 8, Issue 5, October 1998, 606-611,且可/人Accelrys, SanDiego, CA商购)的计算机软件将1.5至3.5 A分辨率的X-射线数据精化 到R值为约0.30或更小,正如由Blundell et al, (1976)和Methods in Enzymology (酶学方法),vol. 114 & 115, H. W. Wyckoff et al., eds" Academic Press (1985)所描述的。
""^#欢f7" w7/co」为N^f和遂^
尽管本发明会促进包含Nl组神经氨酸酶蛋白和与所述蛋白相互 作用的化合物的实际晶体结构的确定,目前的计算技术对产生所述晶 体以及产生和分析衍射数据的需要提供了有力的选择。因此,本发明 的特定优选方面涉及针对与本发明的Nl组神经氨酸酶蛋白结构相互 作用的化合物的分析和开发的计算机方法。
Nl组神经氨酸酶蛋白的三维结构的确定提供了关于该蛋白的结 合部位的重要信息,特别是当与相似蛋白进行比较时。如附随的实施 例显示的,我们已经在149-150环中的Nl蛋白的结合袋内鉴定出令人 惊讶和显著的差异,导致了该口袋中的一些残基与N2组的神经氨酸 酶蛋白比较发生了明显的替代。另外,Nl组中的347位向酪氨酸的改 变导致了 N2组中没有发现的另外配体的相互作用。因此,在下一代 神经氨酸酶抑制剂的设计中,注意力应该集中到这些新鉴定的差异以 提供改善的化合物,其可以克服观察到的对目前可利用的药物的抗性。
然后可以将该信息用于合理设计以及神经氨酸酶抑制剂的修饰, 例如,通过鉴定结合部位的可能的结合配体的计算技术,通过使连接 的片段方法用于药物设计,以及通过使用X-线晶体分析使结合配体(例 如,包括本文上述的那些配体)的鉴定和定位成为可能。在下文更为详 细地讨论了这些技术。
因此,作为Nl组神经氨酸酶蛋白的三维结构的测定结果,用于 合理药物设计的更为纯粹的计算技术也可以用于设计其与蛋白的这些 组的相互作用被更好地理解的结构(对于这些技术的概述参见,例如, Walters et al (Dn/g Z)&c0ve7 7b^3_y卩冷"秀參发'现人Vol.3, No.4, (1998), 160-178; Abagyan, R,; Totrov, M. Cmat. C(pz力.C/zem. B/o/. 2001, 5, 375-382)。例如,可以使用自动化的配体-受体对接程序(例如由Jones et al. 在Cwre"f (9; /m'ow z力万/otec/mo/ogy 「應/t'/^一夕^:參夢7一7会,,Vol.6,(1995), 652-656和Halperin, I.; Ma, B.; Wolfson, H.; Nussinov, R. 尸ra化zVw 2002, 47, 409-443中所讨论的),其需要关于原子坐标的精确 信息。
本文描述了利用借助计算机的Nl组神经氨酸酶蛋白结构的本发 明的方面,该方面同样可以应用于表1至3的任一表中的结构或其选 择的坐标,以及通过本发明的其它方面获得的耙神经氨酸酶蛋白的模 型。因此通过上文描述的方法已经确定了神经氨酸酶蛋白的构象,在 本文描述的基于计算机的合理药物设计的方法中可以使用这种构象。 此外,Nl组神经氨酸酶蛋白的结构的可用性允许了高预测性的药效团 模型的产生以用于病毒库筛选或化合物设计。
因此,本发明提供了基于计算机的方法用于分析分子结构与Nl 组神经氨酸酶蛋白结构的相互作用,其包括
提供来自表1至3中任一表的Nl组神经氨酸酶蛋白结构或其选 择的坐标,任选地在不超过0.75 A的Ca原子的均方根偏差内变化;
提供将与所述Nl组神经氨酸酶结构或其选择的坐标匹配的分子 结构;以及
将该分子结构与所述Nl组神经氨酸酶结构匹配(fitting)。 实际上,建模由表1至3的任一表的坐标或其选择的坐标确定的 Nl组神经氨酸酶结构的足够数量的原子是理想的,其代表结合袋,例 如,原子的数目或来自上文B部分确定的优选残基的原子。因此,在 本发明的一个方面,所述选4奪的坐标可以包括上述残基的一些或全部 的坐标。
将分子结构匹配后,本领域的技术人员可以寻求使用分子建模以 确定所述结构彼此相互作用的程度(例如,通过氢键合、其它非共价相 互作用、或通过反应以提供所述结构部分之间的共价键)。
本领域的技术人员可以使用计算机建模方法来改变所述结构的一 个或多个,以设计以不同方式与Nl组神经氨酸酶结构相互作用的新 结构。
可以合成新设计的结构,且可以确定它们与Nl组神经氨酸酶^ 相互作用或预测该新设计的结构如何被所述Nl组神经氨酸酶结构结
24合。该过程可以;故重复以进一步改变它与Nl组神经氨酸酶结构之间 的相互作用。
所用"匹配"是指通过自动化或半自动化的装置确定分子结构的至
少一个原子和本发明的Nl组神经氨酸酶结构的至少一个原子之间的
至少一种相互作用,并且计算这种相互作用稳定的程度。相互作用包 括由电荷、空间因素等引起的吸引力和排斥力。本文还描述了各种用 于匹配的基于计算机的方法。
更具体地, 一种化合物或多种化合物与Nl组神经氨酸酶结构的相 互作用可以通过使用诸如GOLD (Jones et al" ■/ Mo/.所o/., 245, 43-53 (1995), Jones et al" / Mo/说o/" 267, 727-748 (1997))、 GRAMM (Vakser, I.A.,尸ratom, Suppl" 1:226-230 (1997))、 DOCK (Kuntz et al, JMo/.肠/. 1982 , 161, 269-288, Makino et al, JComp虹C/^m. 1997, 18, 1812-1825)、 AUTODOCK(Goodsell et al, iVofez'ra 19卯,8, 195-202, Morris et al, JOw2;w/.C7ze附.1998, 19, 1639-1662.)、 FlexX、 (Rarey et al, JMo/.历o/. 1996 261, 470-489)或ICM (Abagyan et al, j:Cow/^.C72em. 1994, 15, 488誦506)的 对接程序应用计算机建模来4全测。该步骤可以包括化合物与Nl组神 经氨酸酶结构的计算机匹取以确定所述化合物的形状和化学结构如何 很好地与Nl组神经氨酸酶结构结合。
同样,可以进行Nl组神经氨酸酶的活性部位结构的计算机辅助 的人工检测。诸如GRID (Goodford, / MW. C/2ew., 28, (1985), 849-857) (一种确定具有各种功能基团的分子与酶表面之间可能的相互作用部 位的程序)的程序也可以用于分析所述活性部位,例如,来预测改变化 合物代谢率的修饰类型。
可以应用计算机程序来评估两个结合伴侣的吸引力、排斥力和位阻。
随后可以获得关于化合物与Nl组神经氨酸酶结构结合的详细的 结构信息,并且可以根据该信息,对所述化合物的结构或功能作出调 整,例如,改变其与Nl组神经氨酸酶结构的相互作用。如果需要,
可以重复再重复上述步骤。
可以用于本发明的分子结构通常会是开发中的用于药物用途的化
25合物。通常,所述化合物会是有机分子,通常分子量是从约100至2000 Da,更优选是从约100至1000 Da。这种化合物包括肽和其衍生物, 以及包括奥塞米韦、扎那米韦、DANA和帕拉米韦衍生物的唾液酸衍 生物。原则上,为了促进药学领域中处于开发中的任何化合物的开发 或为了提供另外的合理药物设计以改善其特性,所述化合物可以用于 本发明。
在另一个实施方案中,本发明提供了修饰化合物结构的方法,以 改变其与Nl组神经氨酸酶的相互作用,所述方法包括
将起始化合物与本发明的Nl组神经氨酸酶结构的配体结合区的 至少一个氨基酸残基的一个或多个坐标匹配;
修饰所述起始化合物结构以增加或减少其与配体结合区的相互作
用;
其中所述配体结合区被定义为包括Glu-119, Val-149, Asp-151, Arg-156, Arg國224, Tyr-252, His-274, Glu-276, Arg-292, Tyr-347以及 Arg-371中的至少一个、优选多个和/或氨基酸149-152。本文上面描述 了残基的优选数目和组合。
为了避免疑义,术语"修饰,,如在前述部分中所定义的被使用,且 一旦开发出这种化合物,它也可以如上所述地净皮合成和检测。
卩方度遂凝/f^长r,W"g」
本发明的晶体结构的提供也允许根据片段连接或片段延长方法,
开发与Nl组神经氨酸酶的结合袋区相互作用的化合物(例如,作为该
蛋白的抑制剂)。
例如,通过X-射线晶体分析可以确定蛋白结合袋内的一个或多个 分子片段的结合。分子片段通常是具有IOO至200Da的分子量的化合 物(Carr et al, 2002)。这可以使用基于结构的方法提供药物化学的起点 以最优化相互作用。所述片段可以被合并在模板上或用作"延长出,,进 入该蛋白的其它口袋的抑制剂的起点(Blundell et al, 2002)。所述片段 可以被定位于Nl组神经氨酸酶结构的结合袋内,且随后"延长"以填 充可利用的空间,探测与分子识别相关的静电的、范德华(van der Waals) 或氢键的相互作用。因此使用基于结构的迭代化学合成可以迅速改善
26初始弱结合片段的效力。
在片段延长方法中的 一个或多个阶段,可以在生物系统内合成所 述化合物并检测其活性。这可以用于指导所述片段的另外的延长。
如果两个片段结合区被鉴定,为了获得可能具有理想特性的更大 的连接的结构,可以根据连接的片段方法努力将所述两个片段直接相 连、或以上述的方式延长一个或两个片段。
如果两个或多个配体的结合部位被确定,使用例如Grew等的迭 代技巧,可以将它们连接以形成可以被进一步改善的潜在先导化合物。 对于虚拟的连接片段法,参见Verlinde et al., / o/Cowpwter-JWed Mo/ecw/ar 6, (1992), 131-147,对于NMR和X-射线法,参见
Shuker et al" 5W麵e, 274, (1996), 1531-1534和Stout et al" lw"匿,6, (1998), 839-848。通过确定神经氨酸酶的结构,^使用这些方法以设计神 经氨酸酶抑制剂是可能的。
"yj本发'效^必合參。
如果通过匹配起始化合物与本发明的Nl组神经氨酸酶结构以及 从中预测具有改变的作用率(包括较慢的、较快的或零速率)已经开发 出潜在的修饰的化合物,本发明还包括如下步骤合成所述修饰的化 合物,且在体内或体外生物系统中检测所述修饰的化合物,以确定其 活性和/或其发挥作用(例如抑制病毒生长或扩散)的速率。
在另一方面,本发明包括化合物,其通过本发明上述的方法被鉴定。
这种化合物被鉴定后,可以被生产和/或在诸如药剂、药物組合物 或药品的组合物的制备,即生产或配制中使用。这些可以给予个体。
因此,本发明括延到各方面,不仅括延到由本发明提供的化合物 物,也括延到药物组合物、药剂、药品或包含所述化合物的其他组合 物。所述组合物可以用于治疗(可以包括预防性治疗)疾病,特别是A 或B型流感。这种治疗可以包括将所述组合物向患者的给药,例如 用于治疗疾病;这种抑制剂在生产用于给药的组合物中的用途,例如 用于治疗疾病;以及制备药物组合物的方法,包括将这种抑制剂与药 学上可接受的赋形剂、媒介或载体以及任选的其它成分混合。因此,本发明的另外方面提供了制备药剂、药物组合物或药品的 方法,所述方法包括(a)通过本文公开的本发明的其它方面的任一方面
的方法鉴定或修饰化合物;(b)最优化所述分子的结构;以及(c)制备包 含最优化的化合物的药剂、药物组合物或药品。
本发明的上述过程可以迭代,因为修饰的化合物本身可以作为另 外的化合物设计的基础。
我们用"最优化结构,,意指例如添加分子骨架,添加或改变功能基 团,或将所述分子与其它分子连接(例如,使用片段连接法)以使所述 调节分子的化学结构被改变,而其初始调节功能被保持或增强。在药 物开发程序中经常进行这种最优化以,例如,增加先导化合物的效力、 促进其药理学上的可接受性、增加其化学稳定性等。
修饰是熟练的药剂师已知的本领域常规的那些修饰,且包括,例 如,包含与本发明的Nl组神经氨酸酶结构的氨基酸侧链基团相互作 用的残基的基团的替换或去除。例如,为了减少或增加测试化合物中 的基团的电荷,取代可以包括基团的添加或去除,用带相反电荷的基 团取代带电基团,或者用亲水基团取代疏水基团或者反之。应该理解 这些仅是在新的药物化合物开发中由药剂师考虑的替换类型的实例, 依赖于起始化合物的性质及其活性,可以作出其它的修饰。
可以配制用于任何适合的给药途径和方法的组合物。药学上可接 受的载体或稀释剂包括那些在制剂中使用的、适用于口服、直肠、鼻 腔、局部(包括颊的和舌下的)、阴道或肠胃外(包括皮下的、肌内的、 静脉内的、真皮内的、硬膜内的和硬膜外的)给药的载体或稀释剂。通 常所述制剂可以以单位剂型存在,且可以由药学领域已知的任何方法 来制备。
对于固体组合物,常规的无毒固体载体包括,例如,药用级别的 甘露醇、乳糖、纤维素、纤维素衍生物、淀粉、硬脂酸镁、糖精钠、 滑石粉、葡萄糖、蔗糖、碳酸镁,且可以使用其类似物。可给予的液 体药学上的组合物能够,例如,通过在诸如例如水、葡萄糖盐水、甘 油、乙醇等载体内溶解、分散等上述确定的活性化合物以及任选的药 物佐剂来制备,以由此形成溶液或悬液。如果需要,欲给药的药物组合物还可以包含诸如湿润剂或乳化剂、pH緩沖剂及其类似物的少量无 毒辅助物质,例如乙酸钠、月桂山梨坦、三乙醇胺乙酸钠、月桂山梨 坦、三乙醇胺油酸盐等。对本领域的技术人员而言,制备这些剂型的
实际方法是已知的,或者是显而易见的。例如,参见Remington's Pharmaceutical Sciences (雷明顿药物科学),Mack Publishing Company, Eastern, Pennsylvania,第15版,1975。 本发明可由下述的实施例来阐释
实施例
Nl组神经氨酸酶的结晶
乂人生长于鸡卵中的A/越南/1203/04病毒来制备SEQ ID NO:l的 Nl蛋白。通过菠萝蛋白酶消化从所述病毒中释放出NA,并如以前所 述将其进一步纯化(Ha Y, Stevens DJ, Skehel JJ & Wiley DC (2001) Proc Natl Acad Sci Sep 25;98(20) 11181-6)以制备SEQ ID NO:l的残基 62-449的可结晶蛋白。
蛋白在三种条件下结晶(1) 20% PEG 3350, 0.2 M乙酸铵,0.1 M MES pH 6.0; (2) 20% PEG 3350, 0.2 M乙酸铵,0.1 M PIPES pH 6.8; (3) 20% PEG 3350, 0.2M硫酸锂,0.1 M TrisCl pH 8.5。
因此,本发明在一方面提供了在条件(1)至(3)的任一条件下结晶本 发明的Nl蛋白的方法,其中每种试剂的浓度、pH或分子量(就PEG 而言)可以独立变化高达5%。
来自条件1的结晶被衍射,这些条件用于随后的大范围的优化。 使用1 plNl蛋白(9A28o/ml)加上1 pl用18-23% PEG 3350、 0.2 M乙酸 铵、0.1 MMES pH6.0平衡的适宜溶液建立悬滴。来自包含20%或21% PEG的滴剂的晶体^:用于收集天然^:据且用20 nM或0.5 mM达菲⑧ (奥塞米韦)浸泡。
用于晶体的抗冻剂溶液是21% PEG 3500, 0.2 M乙酸铵,0.1 M MES pH6.0, 15%乙二醇。
N4和N8神经氨酸酶的结晶方法
从生长于鸡卵中的A/貂/瑞典/E12665/84 (H10N4)和A/鸭/乌克兰 /1/63 (H3N8)病毒中制备N4 (SEQ ID NO:2)和N8 (SEQ ID NO:3)NA通 过菠萝蛋白酶消化从所述病毒中释放出NA以提供N4 79-470和N8 73-470,并如前所述将其进一步纯化。回收的蛋白浓度为10 mg/ml, 溶于10 mM Tris-HCl, pH 8.0。
通过蒸汽扩散,N4 NA晶体生长于由2 )il的储存液(O.l M Hepes, pH 7.5, 5 mM氯化钴,5 mM氯化镍,5 mM氯化镉,5 mM氯化镁以及 12% w/v PEG 3350)和2的浓缩蛋白溶液组成的悬滴中。
因此,本发明在一方面提供了在上述条件下结晶本发明的N4蛋 白的方法,其中每种试剂的浓度、pH或分子量(就PEG而言)可以独立 变化高达5%。
通过蒸汽扩散,N8 NA晶体生长于由2 pl的储存液(O.l M咪唑,pH 8.0和35% MPD)和2 |il的浓缩蛋白溶液(IO mg/ml,溶于10 mM Tris-HCl, pH 8.0)组成的悬滴中。
因此,本发明在一方面提供了在上述条件下结晶本发明的N8蛋 白的方法,其中每种试剂的浓度、pH或分子量(就PEG而言)可以独立 变化高达5%。
晶体在配制于结晶緩冲液中的20 mM抑制剂中浸泡30分钟(就 N4而言,增加20%的甘油用于防冻保护)。此外,N8NA晶体浸泡于 20 mM奥塞米韦三天。在与Raxisllc探测器偶联的实验室Rigaku-MSC RU200旋转阳极上的IOOK处收集数据。衍射数据使用Denzo来整合 并用Scalepack来测量。使用相位器(Phaser),用N9NA作为检索模型 通过分子取代来解析N4和N8 NA结构。进行使用CNS的标准精化以 及使用O的手动建模。表4中给出了结晶的统计数据,所有的图用 Pymol产生。
Nl、 N4和N8的晶体结构通过分子取代来解析,相关的晶体数据 在表4中显示。表5显示了获得的晶体的形式、大小和分辨率。在表 1至3中分别列出了未与配体结合的Nl、 N4和N8的结构。表4
NA亚型Rwork(%)Rfree(%)B因子躺(A2)B因刊每2)
未结合的Nl23226226.3一
+奥塞米韦23.727.321.425.1
未结合的N422227.3242一
+ DANA21.729.516.020.0
未结合的N821.726.131.6一
+奥塞米韦(30分)22.928.622.833.3
+奥塞米韦(3天)25227329.831.6
+DANA21.726.715.616.8
+扎那米韦27.133.427.1272
+帕拉米韦23.428.619.015.6
表4:晶体学统计。
Rw。rk = S I IFo卜|Fc| |/,。
Rfree = ST I |Fo| - |Fc| |/ST |Fo|,其中T是随机选择的总反射的5%的
测试数据集且精化前被预留出。
表5
晶体空间群晶胞大小(A)Z分辨率(A)
NlC222!a=201.74, b=20L51, c=212.4382.5
Nl +奥塞米韦C222!a=200.62, b=200.70, c=210.4882.5
N4P432a=193.7922.8
N4 + DANA1432a=193.4413.5
N814a=b=90.67, c=109.412.4
N8 + DANA14a=b=90.38,c=111.4912.5
N8 +奥塞米韦(浸 泡30分)14a=b=90.58, c=l 10.7812.6
N8 +奥塞米韦(浸 泡3天)14a=b=90.42, c=l09.7112.4
N8 +扎那米韦14a=b=90.41,c=l 09.3012.2
N8+帕拉米韦14a=b=89.78, c=93.2312.2
活性部位比较
Nl、 N4和N8组-lNA的结构的重叠揭示了它们的活性部位实质 上是相同的。然而,组1和组2之间重要的构象差异集中在毗邻所述 活性部位的150环(147-152残基)和150-腔上。所述环的构象使组-1特 异性Val-149的C-a位置距离组-2中的等价的异亮氨酸残基约7A。而且,149位的疏水侧^l伸向远离组1的活性部位,但朝向组2中的活 性部位。在150环最靠近所述活性部位的点,组1和组2在151位具 有催化重要性的天冬氨酸残基的侧链位置有L5A的差异。150环中的 氨基酸残基的比较为组1和组2内而不是组1和组2之间的环结构的 强保守没有提供明显的解释。
显而易见,该环构象是组1的固有特征,而不是偶然的晶格接触, 因为本文中本发明的所有三种在不同条件下结晶,且处于不同空间群 的组-l的酶结构,显示了相似的结构。
这些结构上的不同的主要结果是在毗邻组1而不是组2的活性部 位存在大的腔。因为在上述的Asp-151和Glu-119位置的差异,该腔接 近所述活性部位。这两个酸性残基位置的差异的结合效应是增加了所 述活性部位腔约5A的宽度。其侧链大约位于所述两个酸性残基中间 位置的保守的Arg-156,在组1和组2结构中采用了大致相同的位置, 并确定了从所述活性部位进入150-腔的入口。然后通过150-环的构象 差异以及Gln-136的位置确定150-腔的宽度。在组-2蛋白中,该残基 氲与该环150残基的主链羰基键合。在组1结构中,可能作为不同环 结构的结果,不能形成该氢键的Gln-136采用导致其侧链位于低于所 述腔底部约3.5A的构象。因此,150-腔约10A长以及5A宽和深。该 腔及它与所述活性部位的可接近性对于开发对组-1蛋白更特异的药物 具有重要意义。
这种不同的存在从基于目前可得到的组-2 NA结构的同源建模或 相似技术来看不是显而易见的。
在组1和组2未与配体结合的结构之间的另外两个显著差异包括 Glu-276和Glu-119的侧链构象。Glu-276的构象特別受到关注,因为 它在药物结合到来自B型流感和组2的NA时经历了最显著的重排。 例如,在未与配体结合的组-2(N9)中,Glu-276的羧基朝入所述活性部 位,但在奥塞米韦结合时,它采取远离所述活性部位的构象,以使此 时的羧基与Arg-224的胍基形成二齿状的相互作用。与此同时,Glu-276 疏水的CB和CG移向C6连^^妄的奥塞米韦的疏水:取代基。在未与配体 结合的组-1 NA中,Glu-276的构象更像在组2中观察到的配体结合构
32象。因此,尽管未与配体结合的Nl中的Glu-276的CD原子距离结合 奥塞米韦的N9中的等价原子的位置约1A,其羧基仍然能够与Arg-224 形成相同的二齿状的相互作用。Glu-119采用组1中的构象,以致它的 羧基指向其在组2中指向的大致相反方向。 抑制剂结合
我们已经确定了与表4中总结的组1的Nl、 Nl和N8结合的各 种抗神经氨酸酶抑制剂的晶体结构。值得注意地,我们发现依赖于浸 泡条件,组-1 NA能够在150-环的"开放的,,或"闭合的,,构象中结合奥 塞米韦。因此,由将抑制剂浸泡入预成形的晶体30分钟而形成的与奥 塞米韦络合的N8NA的结构揭示出没有发生大范围的构象变化,150-环仍保持与其在未结合配体的结构中的构象相同的构象。作为150-环 的构象的大概结果,酸性残基Asp-151和Glu-119距离结合到所述抑 制剂的C4的氮比它们在N9的复合物中更远。奥塞米韦和N8 NA之 间的其它相互作用与在N9中观察到的相似,除了 Cl羧基与Arg-371 的通常的二齿状相互作用外,另外的例外是Tyr-347与奥塞米韦的C1 羧基形成氢键相互作用。在组2中,347位残基是谷氨酰胺,而不是 不能形成这种氲键的酪氨酸。
奥塞米韦可以与带有开放构象的150环的N8结合的观察看起来 是重要的。如果配体在晶体中有低的占位,获得这种结果是可能的。 然而,X-射线数据和模型精化的质量使我们确信这不是实情。相反, 看起来可能奥塞米韦与N8的结合,至少在晶体状态下是两步过程。 首先,抑制剂结合到N8的"开放"形式,然后发生緩慢的构象变化, 形成所述酶的"闭合"形式,实现了更多的与配体相互作用的能量。我 们对结构的观察表明这种类型的抑制剂能够结合到组1 NA的"开放" 构象。
当N8晶体在奥塞米韦中孵育3天时,或Nl晶体在更高浓度的抑 制剂中孵育时,150-环改变其构象以使它与在抑制剂存在和不存在时 观察到N2组中的构象及其相似。这种构象的变化有两种主要结果。 其一是Glu-119和Asp-151都朝向了结合的奥塞米韦,其二是结合药 物的组1中的活性部位腔的大小与组2 NA中的腔的大小基本相同。我们也已经确定了三种其它的神经氨酸酶抑制剂的结构结合到组1
的DANA、扎那米韦和帕拉米韦。总体来说,这些结构表明药物结合 的组1的复合物与观察到的组2的那些复合物非常相似。在所有三种 情形下,组1的150环在药物结合时改变了它的构象,使Asp-151与 所述抑制剂更接近,且在该过程中,靠近所述150-腔。
组1结构中的150环的"开放"构象的发现表明,对于这些酶,该 构象比这种环的"闭合"构象本质上能量更低。组1 (N8)最初与"开放,, 构象中的奥塞米韦结合,但最终采用所述闭合构象。因此,看起来, 结合到组1的奥塞米韦顺从更高的能量或可能通过相对慢的构象变化 得到的150环的"闭合"构象异构体。因此,设计组1的新型抑制剂是 可能的,所述抑制剂选择性针对"开放,,150-环构象的并会由此具有比 奥塞米韦或扎那米韦更强的结合能力。
我们对结构的检测表明,例如,从奥塞米韦的4-氨基团或扎那米 韦相应的胍盐阳离子将侧链开发为150-腔,并由此增强新型抑制剂与 组1神经氨酸酶(相对于组2神经氨酸酶)的结合,这是可能的。所述 腔在奥塞米韦或扎那米韦的C-4附近打开并且在它的底部包含保守的 Arg-156的突出的胍盐侧链,所述侧链是新抑制剂的内部盐桥或氢键 对的预期伴侣。
抑制剂结合
邀/和* 2 W 7VA Wi^^塞^4戎嫂
从达菲治疗流感感染的人类后分离的A型流感病毒中已经表征三 种抗奥塞米韦和/或扎那米韦的突变NAs。来自H5N1感染的一种包含 氨基酸替换His-274->Tyr。另两种来自感染H3N2病毒的患者,且包 含Glu-119->Val或Arg-292->Lys替换。组1和组2 NAs的结构的比较 揭示了活性部位内的组特异性差异,所述差异可能解释了为什么这些 突变引起了抑制剂抗性。
His-274->Tyr的突变引起了组1 NA对奥塞米韦的高抵抗性,但对 组2NA几乎没有影响。组1 NA与奥塞米韦络合的结构的检测以及与 等价的组2复合物的比较提出了这种组特异性行为的理由并指示了抗性如何可能由突变体Tyr-224对Glu-276的定位的影响来介导。Glu-276 的构象对组2 NA的奥塞米韦结合的重要性已经被牢固确立。看起来, 至少有两种因素促成了组1 NA不能适应所述的His-274Tyr替换。首先, 组1 NA中接近273位残基的270-环与组2中的等价的环相比形成了 更为紧密的转角。其次,在组l中,而不是在组2中,在252位存在 保守的酪氨酸残基,其与273位的主链羰基、与250位的肽酰胺以及 与274位的组氨酸侧链形成了氬键。His-274也通过它的其它侧链氮与 Glu-276形成氢键。看起来,在组1酶的274位引入较庞大的酪氨酸残 基只能被朝Glu-276移动并部分取代Glu-276的新侧链适应。相反, 在组2酶中,252位较小的残基为在不扰乱Glu-276的前提下引入274 位酪氨酸留出了空间。这种突变的组特异性效应的解释与先前报道的 来自突变研究的观测是一致的。
Arg-292->Lys突变在抗奥塞米韦的组-2 NAs中是最常见的替换。 在N9 NA中,显示抗性部分来自氢键从奥塞米韦的Arg-292至羧基的 缺失,这已经是详细的晶体学分析的主题。替换的Lys-292也与Glu-276 相互作用,阻碍其适应连接到奥塞米韦的C6的疏水取代基的运动。 组1 NAs的结构以及它们与奥塞米韦的复合物,揭示了所述突变对组 1酶有较小影响的可能理由。组1的347位保守的酪氨酸残基与所述 抑制剂的羧基形成了额外的氢键,所述氬键不能由组2中的等价残基 形成。这样,看起来,Tyr-347和所述抑制剂的羧基之间的额外氢键相 互作用补偿了所述羧基与292位替换的赖氨酸残基之间的较弱的、水 介导的相互作用。
并入本文。对本领域技术人员显而易见的是,所述发明的各种修饰和 变化都不背离本发明的范围和精神。尽管结合特定的优选实施方案描 述了本发明,但应当理解所要求保护的本发明不应不恰当地受到这些 特定实施方案的限制。
3权利要求
1.用于分析分子结构与N1组神经氨酸酶结构的相互作用的基于计算机的方法,所述方法包括提供来自表1至3中的任一表的N1组神经氨酸酶结构或其选择的坐标,任选地在不超过 id="icf0001" file="A2007800251410002C1.tif" wi="13" he="4" top= "55" left = "81" img-content="drawing" img-format="tif" orientation="portrait" inline="yes"/>的Cα原子的均方根偏差内变化;提供欲与所述N1组神经氨酸酶结构或其选择的坐标匹配的分子结构;以及将所述分子结构与所述N1组神经氨酸酶结构匹配。
2. 如权利要求l所述的方法,其中所述选择的坐标包括来自如下一 个或多个残基的原子Glu-119、 Val-149、 Asp-151、 Arg-156、 Arg-224、 Tyr-252、 His-274、 GIu-276、 Arg-292、 Tyr-347和Arg-371 。
3. 如权利要求1或2所述的方法,其还包括下述步骤 获得或合成具有所述分子结构的化合物;以及 将所述化合物与Nl组神经氨酸酶蛋白接触以确定所述化合物与Nl组神经氨酸酶相互作用的能力。
4. 如权利要求1或2所述的方法,其还包括下述步骤 获得或合成具有所述分子结构的化合物;形成N1组神经氨酸酶蛋白与所述化合物的复合物;以及 通过X-射线晶体学分析所述复合物以确定所述化合物与Nl组神经 氨酸酶相互作用的能力。
5. 如权利要求1所述的方法,其还包括下述步骤 获得或合成具有分子结构的化合物;以及确定或预测所述化合物如何与所述Nl组神经氨酸酶结构相互作用;以及修饰所述化合物结构以改变它与Nl组神经氨酸酶间的相互作用。
6.化合物,其具有使用权利要求6所述的方法筌定的修饰的结构。
7. 如前述权利要求中的任一项所述的方法,其中所选4奪的坐标是至少5、 10、 50、 100、 500或1000个原子。
8. 如前述权利要求中的任一项所述的方法,其中表1至3中任一表中所述选择的坐标代表残基147-152的每一个的至少一个侧链原子。
9. 如权利要求8所述的方法,其中所述选择的坐标还包括选自Glu-l 19、 Glu-276和Tyr-347的氨基酸的至少一个侧4迮残基。
10. 确定结合到Nl组神经氨酸酶蛋白的化合物的结构的方法,所述方法包括提供所述Nl组神经氨酸蛋白的晶体;将所述晶体与所述化合物浸泡以形成复合物;以及通过应用来自表1至3中任一表的数据或其选择的坐标来确定所述复合物的结构,所述数据任选地在不超过0.75 A的Ca原子的均方根偏差内变化。
11. 确定结合到Nl组神经氨酸酶蛋白的化合物的结构的方法,所述方法包括将N1组神经氨酸酶蛋白与所述化合物混合;结晶蛋白-化合物复合物;以及通过应用来自表1至3中任一表的数据或其选择的坐标来确定所述复合物的结构,所述数据任选地在不超过0.75 A的Ca原子的均方根偏差内变化。
12. 提供数据的方法,所述数据用于产生结构和/或进行与Nl组神经氨酸酶蛋白相互作用的化合物的最优化,所述方法包括(i) 建立与远程装置的通信,所述远程装置包含(a)计算机可读的数据,其包括来自表1至3中任一表的Nl组神经氨酸酶结构或其选择的坐标,任选地在不超过0.75 A的Ca原子的均方根偏差内变化;以及(ii) 从所述远程装置接受所述计算机可读的数据。
13. 如权利要求12所述的方法,其还包括用所述数据实施权利要求1至11中的任一项的方法。
14. Nl组神经氨酸酶蛋白的晶体。
15. Nl组神经氨酸酶蛋白和配体的共晶体。
16. 如权利要求15所述的共晶体,其中所述配体选自奥塞米韦、扎那米韦、DANA和帕拉米韦,或者其衍生物。
17. 如权利要求14至16中的任一项所述的晶体或共晶体,其中所述Nl组神经氨酸酶蛋白选自Nl 、 N4和N8。
18. 如权利要求14至17中的任一项所述的晶体或共晶体,其中所述神经氨酸酶N1组蛋白是SEQ ID N0:1的残基62-449的Nl蛋白或是其具有1至IO个氨基酸替换、删除或插入的变异体。
19. 如权利要求14至18中的任一项所述的晶体或共晶体,其中所述神经氨酸酶N1组蛋白是具有C-正交空间群C222!的Nl蛋白。
20. 如权利要求19所述的晶体或共晶体,其晶胞大小为a= 200.21 A,b= 200.77 A, c= 211.68 A, a= 90卩=90 y= 90,所有尺度的晶胞变异率为5%。
21. 如权利要求14至17中的任一项所述的晶体或共晶体,其中所述神经氨酸酶Nl组蛋白是SEQ ID NO:2的残基79-470的N4蛋白或是其具有1至10个氨基酸替换、删除或插入的变异体。
22. 如权利要求14至17中的任一项或权利要求21所述的晶体或共晶体,其中所述神经氨酸酶N1组蛋白是具有立方空间群P432或1432的N4蛋白。
23. 如权利要求22所述的晶体或共晶体,其晶胞大小为a = b = c =193.79 A,所有尺度的晶胞变异率为5%。
24. 如权利要求14至17中的任一项所述的晶体或共晶体,其中所述神经氨酸酶Nl组蛋白是SEQ ID NO:3的残基73-470的N8蛋白,或是其具有1至10个氨基酸替换、删除或插入的变异体。
25. 如权利要求14至17中的任一项或权利要求23所述的晶体或共晶体,其中所述神经氨酸酶N1组蛋白是具有四方空间群I4的N8蛋白。
26. 如权利要求25所述的晶体或共晶体,其晶胞大小为a = b = 90.67A, c= c=109.4 A, a= 90 (3= 90 y= 90,且所有尺度的晶胞变异率为5%。
27. N8与帕拉米韦的共晶体,其具有四方空间群14,晶胞大小为a=b=89.78,c=93.23,且所有尺度的晶胞变异率为5%。
全文摘要
本发明涉及流感病毒神经氨酸酶蛋白晶体及其结构和其用途。
文档编号G06F19/16GK101496014SQ200780025141
公开日2009年7月29日 申请日期2007年6月6日 优先权日2006年6月6日
发明者乔治·迈克尔·布莱克伯恩, 史蒂文·约翰·甘姆波林, 大卫·约翰·史蒂文斯, 帕特里克·詹姆士·柯林斯, 林一普, 约翰·詹姆士·斯格海尔, 艾伦·詹姆士·海, 莱斯利·芬德利·海瑞, 鲁珀特·拉塞尔 申请人:医疗研究局
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1