Ump激酶的晶体结构及其应用的制作方法

文档序号:6657103阅读:1795来源:国知局
专利名称:Ump激酶的晶体结构及其应用的制作方法
技术领域
本发明涉及UMP激酶的晶体以及筛选、鉴定和设计UMP激酶的抑制剂和别构调节物的计算机辅助方法。
背景技术
UMP激酶催化磷酸基团从ATP到UMP的可逆转移,产生UDP,这是导致UTP产生的嘧啶核苷酸合成途径中的必需步骤。细菌UMP激酶的一级结构与其它的细菌和真核生物核苷一磷酸激酶差别很大(Serina等,1995,Biochemistry,345066-5074;Brzu等,1999,Paths toPyrimidines,786-95;Labesse等,2002,Biochem.Biophys.Res.Commun.,294173-179;Gagyi等,2003,Eur.J.Biochem.,2703196-3204),因此它们作为设计或鉴定抗菌药物的靶标具有重要意义。真核生物UMP-CMP激酶在溶液中是单体。已测定了几种来自真核生物的UMP-CMP激酶的结构(Mueller-Dieckmann等,1994,J.Biol.,236362-367;Scheffzek等,1996,Biochemistry,359716-9727;Schlichting等,1999,Nature Struct.Biol.,6721-723)。来自细菌的UMP激酶(pyrH基因的产物)在溶液中是同型六聚体,其活性由GTP(激活剂)和UTP(抑制剂)进行别构调控。序列比对证实,细菌UMP激酶在序列的有限区域范围内显示与N-乙酰谷氨酸激酶、氨基甲酸激酶、天冬氨酸激酶、谷氨酸5-激酶和吡咯啉-5-甲酸合酶的同源性(Labesse等,2002,出处同上;Gagyi等,2003,出处同上)。
已描述了激烈热球菌(P.furiosus)氨基甲酸激酶样氨基甲酰磷酸合成酶的晶体结构(CK-like CPS,蛋白质数据库(pdb)条目1e19;Ramón-Maiques等,2000,J.Mol.Biol.,299463-476)。已描述了大肠杆菌(E.coli)N-乙酰谷氨酸激酶的晶体结构(NAGK,pdb条目1gs5、1gsj、1oh9、1oha和1ohb;Ramón-Maiques等,2002,Structure,10329-342;Gil-Ortiz等,2003,J.Mol.Biol.,331231-244)。Labesse等(2002,出处同上)提出了大肠杆菌UMP激酶(pyrH)的同源性模型。Gagyi等(2003,出处同上)提出了枯草芽胞杆菌(B.subtilis)UMP激酶(pyrH)的同源性模型。WO 03/025004描述了致病细菌的多肽靶标。
发明概述本文公开的是与GTP和磷酸复合的细菌UMP激酶(pyrH)的三维结构;pyrH的结合位点;鉴定和/或设计能结合PyrH的化合物或物质(agent)的方法,所述化合物或物质包括部分或完全抑制pyrH活性的配体、药物或抑制剂,结合pyrH的蛋白质和有机小分子;使pyrH结晶的方法;鉴定、筛选和/或设计能结合pyrH的物质的计算机辅助方法;确认提出可结合pyrH的物质的核磁共振波谱学辅助方法。
附图简述

图1描绘了一个分子的pyrH同型六聚集合体(homohexamericassembly)的三维结构,绘出了pyrH折叠的结构元件和拓扑结构。α螺旋由A至H标示,β折叠链由1至11标示。
图2和3是描绘pyrH六聚体的两个正交视图的草图(cartoondepiction),显示了活性位点(六聚体的外表面,由X标示)和别构结合位点(六聚体的中央腔,由A标示)。在预测的活性中心的结合磷酸根离子和在别构结合位点的GTP分子(模型标示为GDP)在全图中用球-棍表示。
图4描绘了以pyrH晶体不对称单元存在的八个分子当中观察到的构象柔性。
图5显示了在1mM UTP存在下0.4mM2H/15N/13C标记的流感嗜血杆菌(H.influenzae)的核磁共振(NMR)TROSY-HSQC谱。y轴和x轴分别表示在氮和质子维度(dimension)的化学位移,单位ppm。
图6描绘了来自以下的pyrH的氨基酸序列的比对肺炎链球菌(Streptococcus pneumoniae)(SPN;SEQ ID NO1);酿脓链球菌(Streptococcus pyogenes)(SPY;SEQ ID NO2);金黄色葡萄球菌(Staphylococcus aureus)(SAU;SEQ ID NO3);表皮葡萄球菌(Staphylococcus epidermidis)(SEP;SEQ ID NO4);枯草芽胞杆菌(Bacillus subtilis)(BSU;SEQ ID NO5);脑膜炎奈瑟氏菌(Neisseriameningitides)(NME;SEQ ID NO6);大肠杆菌(Escherichia coli)(ECO;SEQ ID NO7);流感嗜血杆菌(Haemophilus influenzae)(HIN;SEQ IDNO8);肺炎衣原体(Chlamydia pneumoniae)(CPN;SEQ ID NO9)和肺炎支原体(Mycoplasma pneumoniae)(MPN;SEQ ID NO10)。
图7是来自流感嗜血杆菌的与GTP和磷酸复合的pyrH的晶体结构的三维原子坐标列表。
发明详述本发明基于流感嗜血杆菌pyrH的结晶和流感嗜血杆菌pyrH与GTP和磷酸的复合物的晶体结构(三维结构)的测定。
PyrH多肽、晶体和空间群本发明提供有关pyrH的分离多肽或pyrH多肽的一部分的信息,所述多肽当在正确的三维方向上折叠时起到结合位点的作用。本文所用的指向多肽的术语“分离的”,指这样的多肽或其部分,由于其来源或经过操作的原因,已脱离其天然状态,或者以别的方式不处在其天然状态。所谓“分离的”还指这样的蛋白质,其(i)是化学合成的;(ii)在宿主细胞中表达并从结合的蛋白质和污染性蛋白质中纯化出来;或者(iii)从结合的蛋白质和污染性蛋白质中纯化出来。该术语通常指这样的多肽,其已与天然伴随出现的其它蛋白质和核酸分离。在本发明的一些实施方案中,多肽还与用以纯化它的物质如抗体或凝胶基质(例如聚丙烯酰胺)分离。
各分离的多肽序列都可以是pyrH的天然序列,或者是与SEQ IDNO14表示的氨基酸序列有至少40%、45%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或99%同源性的序列。
分离的pyrH可以是pyrH的变体。在一个实例中,变体的氨基酸序列与SEQ ID NO14公开序列的差别在一个或多个氨基酸置换。还设想了包含氨基酸缺失和/或添加的实施方案。变体可具有保守变化(氨基酸相似性),其中置换氨基酸的结构或化学特性与它所取代的氨基酸残基类似(例如用异亮氨酸取代亮氨酸)。根据本公开内容,可合理地推断出有关指导原则,来确定可进行哪些和多少氨基酸残基的置换、插入和缺失,而不破坏生物或药学活性,用本领域公知的计算机程序如DNAStar软件还可进一步得到有关指导原则。
可例如根据各残基在极性、电荷、溶解性、疏水性、亲水性和/或两亲特性方面的相似性,作出氨基酸置换,只要能保持天然分子的生物和/或药学活性即可。
置换的实例在下表1中列出表1
在本发明中,“氨基酸同源性”是一级氨基酸序列的同一性的度量。为表征同源性,将主题序列进行比对以获得最高同源性(匹配)百分比,必要时引入空位以便达到最大同源性百分比。N或C末端突出端不应认为影响同源性。“同一性”本身有本领域公认的含义,可用公开的技术进行计算。用以测定两个序列之间的同一性的计算机程序方法包括例如DNAStar软件(DNAStar Inc.,美国威斯康星州麦迪逊市);GCG程序包(Devereux等,1984,Nucl.Acids Res.,12387);BLASTP、BLASTN、FASTA(Altschul等,1990,J.Mol.Biol.,215403)。本文定义的同源性(同一性或相似性)测定如下用BLAST 2Sequences计算机程序(Tatusova和Madden,1999,FEMS Microbiol.Lett.174247-250;可获自NCBI),采用所有参数的默认设置值,以在进行比对序列的全长范围内计算同一性和/或相似性百分比,允许同源性空位最多占参考序列核苷酸或氨基酸总数的约90%。
本发明还包括pyrH的晶体。在一个实施方案中,所述晶体是pyrH与磷酸和三磷酸鸟苷(GTP)的复合物。pyrH可来自任何细菌,包括流感嗜血杆菌。
在另一个实施方案中,本发明包括与磷酸和GTP复合的结晶流感嗜血杆菌pyrH,其特征在于原子坐标如图7所示。在本发明中,晶体可衍射至约2.3。
结晶复合物的一个实例被表征为属于斜方六面体空间群R32,晶胞参数为a=b=c=(146.5+/-0.7),α=β=γ=(97.38+/-0.07)°。本领域技术人员会认识到,斜方六面体空间群的六角形等同物方便操作,其中本发明的pyrH晶体的晶胞参数是a=b=(215+/-1.0),c=(233.6+/-1.5)和α=β=90°,γ=120°。
本发明的pyrH晶体具有含八个分子的pyrH的不对称单元,所述不对称单元包含同型六聚集合体和另外的同型二聚集合体,本领域技术人员会认识到,应用斜方六面体空间群固有的晶体学对称性操作,可从所述同型二聚集合体产生六聚集合体。每个同型六聚集合体可描述为二聚体的三聚体。在一个实施方案中,每个二聚体包含分子间二聚体界面,所述界面包含SEQ ID NO14的氨基酸残基Ile25、Pro27、Leu30、Asp31、Phe57、Lys61、Leu62、Ala65、Gly66、Met67、Asn68、Arg69、Val71、His74、Met75、Gly76、Leu78、Ala79、Val81、Met82、Leu85、Ala86、Arg87、Asp88、Arg89、Phe104、Gln105、Leu106、Asn107、Gly108和Ile109。
制造晶体的方法是本领域公知的。在一个实例中,上述晶体复合物可用以下方法生产在适当的缓冲液(例如50mM Tris-HCl pH8.5)中制备含有足够纯度(例如>95%)的流感嗜血杆菌pyrH的第一溶液;制备含有合适的沉淀剂(例如盐或聚乙二醇)的第二溶液;将第一溶液和第二溶液组合,从而产生组合溶液;用结晶方法从组合溶液形成液滴,使得pyrH进入过饱和状态,由此产生pyrH的晶体。
PyrH晶体结构pyrH晶体的不对称单元由八个拷贝的pyrH多肽链组成,其特征在于原子坐标由图7列表所示,对应于一个同型六聚集合体和一个二聚体,通过结晶学对称性转化操作从所述二聚体可产生六聚集合体。流感嗜血杆菌pyrH的活性形式是同型六聚体。每个pyrH分子由单一结构域组成,所述结构域包含由九个β折叠链(在图1中由1至6和9至11标示)组成的中央β片层,其两侧翼上各有四个α螺旋(图1一边由D、E、F和G标示的α螺旋和图1另一边由A、B、C和H标示的α螺旋)。磷酸根离子的结合可识别出活性位点(图2中由X标示),所述活性位点跨越被环区包围的宽阔而暴露于溶剂的腔中β折叠链的C末端边缘。六个活性位点位于六聚集合体的外表面上。在pyrH分子的另一个表面(图2中由A标示)上,接近六聚集合体的中央,在三个pyrH分子的界面处,是别构效应物(例如激活剂如GTP)的结合位点。
流感嗜血杆菌pyrH六聚集合体可描述为二聚体的三聚体。二聚体是通过稳定、保守的疏水核心维持在一起的,所述疏水核心由顺着两个伸展反向平行α螺旋的表面的甲硫氨酸残基(残基68至95,螺旋C,参见图1)之间的互锁产生。另外的相互作用发生在反向平行定向各pyrH分子的保守β3-β4环(包含残基104至109)之间。在一个pyrH分子中β1-αA环的残基25、27、30和31和αA螺旋的N末端(参见图1)与另一个分子中短螺旋区域(螺旋B,参见图1)的残基57、61、62和65之间,也存在稳定化接触。因此分子间二聚体界面包括SEQ ID NO14的氨基酸残基Ile25、Pro27、Leu30、Asp31、Phe57、Lys61、Leu62、Ala65、Gly66、Met67、Asn68、Arg69、Val71、His74、Met75、Gly76、Leu78、Ala79、Val81、Met82、Leu85、Ala86、Arg87、Asp88、Arg89、Phe104、Gln105、Leu106、Asn107、Gly108和Ile109。
三个二聚体集合在一起,通过相互作用形成六聚集合体,所述相互作用涉及来自第一二聚体的第一分子的残基Asn68、Arg69、Val70、Val71、His74、Arg88、Phe92、Lys99、Gln105、Leu106、Asn107、Gly108、Ile109、Cys110、Asp111、Thr112、Tyr113、Asn114、Trp115、Glu117、Thr134、Asn136、Pro137、Phe138、Phe139、Leu147、Arg148、Ile150、Glu151、Glu153、Leu198、Ser199、Thr202、Leu203和His207,来自第二二聚体的第二分子的残基Asn68、Arg69、Val70、Val71、His74、Thr134、Asn136、Pro137、Phe138、Phe139、Leu147、Arg148、Ile150、Glu151、Glu153、Leu198、Ser199、Thr202、Leu203和His207,来自所述第二二聚体的第三分子的残基Arg88、Phe92、Lys99、Asn107、Gly108、Ile109、Cys110和Asp111以及来自第三二聚体的第四分子的残基Gln105、Leu106、Thr112、Tyr113、Asn114、Trp115和Glu117。接触情况用Contact程序(CCP4,1994,Acta Cryst.,D50760-763)按5半径进行测定。因此,分子间二聚体-二聚体界面包含SEQ ID NO14的氨基酸残基Asn68、Arg69、Val70、Val71、His74、Arg88、Phe92、Lys99、Gln105、Leu106、Asn107、Gly108、Ile109、Cys110、Asp111、Thr112、Tyr113、Asn114、Trp115、Glu117、Thr134、Asn136、Pro137、Phe138、Phe139、Leu147、Arg148、Ile150、Glu151、Glu153、Leu198、Ser199、Thr202、Leu203和His207。
结合位点术语“结合位点”指pyrH上与结合pyrH的分子发生相互作用的特定区域(或原子)。结合位点可以是例如保守结构元件或几个保守结构元件的组合、底物结合位点、激活剂结合位点、抑制剂结合位点、别构结合位点或分子间界面。
底物结合位点包括pyrH上与底物如三磷酸腺苷(ATP)或一磷酸尿苷(UMP)发生相互作用的特定区域(或原子)。底物结合位点可包含折叠多肽当中的一个或多个氨基酸残基的三维排列,或者由所述三维排列定义。在本发明中,底物可以是诸如ATP或UMP的化合物,pyrH可将它们分别可逆转化为二磷酸腺苷(ADP)或二磷酸尿苷(UDP)。因此,产物也可作为底物。底物可以是天然或人造化合物。两种底物,例如UMP和ATP,可同时或分别结合到单独但邻近的结合位点上。因此,确定每个这些邻近结合位点的残基子集也可能涵括在其它结合位点的定义中。
在本发明的一个实施方案中,流感嗜血杆菌pyrH的底物结合位点包括SEQ ID NO14的氨基酸Lys11、Leu12、Ser13、Gly14、Glu15、Ala16、Leu17、Val50、Leu51、Gly52、Gly53、Gly54、Asn55、Arg58、Thr80、Asn83、Thr140、Thr141、Asp142、Ser143、Ala145、Lys159、Ala160、Thr161、Lys162、Val163、Gly165、Val166、Tyr167、Asp168、Cys169、Asp170、Pro171、Lys173、Asp174、Ala177、Lys178、Tyr180、Lys191、Glu192、Leu193、Lys194、Val195、Met196、Asp197、Val213和Phe214。在本发明的另一个实施方案中,流感嗜血杆菌pyrH的底物结合位点另外包括SEQ ID NO14的氨基酸Phe57、Gly59、Arg69、Val70、Val71、Gly72、Asp73、His74、Met75、Gly76、Met77、Leu78、Ala79、Ala103、Phe104、Ser131、Ala132、Gly133、Thr134、Gly135、Asn136、Pro137、Phe138、Phe139、Thr144、Leu147和Arg148。在本发明的又一个实施方案中,流感嗜血杆菌pyrH的底物结合位点包括SEQ ID NO14的氨基酸Lys11、Leu12、Ser13、Gly14、Glu15、Val50、Leu51、Gly52、Gly53、Gly54、Asn55、Phe57、Arg58、Gly59、Arg69、Val70、Val71、Gly72、Asp73、His74、Met75、Gly76、Met77、Leu78、Ala79、Thr80、Asn83、Ala103、Phe104、Ser131、Ala132、Gly133、Thr134、Gly135、Asn136、Pro137、Phe138、Phe139、Thr140、Thr41、Asp142、Ser143、Thr144、Ala145、Leu147和Arg148。在又一个实施方案中,流感嗜血杆菌pyrH的底物结合位点包括氨基酸Lys11、Leu12、Ser13、Gly14、Glu15、Ala16、Leu17、Val50、Leu51、Gly52、Gly53、Gly54、Asn55、Phe57、Arg58、Gly59、Arg69、Val70、Val71、Gly72、Asp73、His74、Met75、Gly76、Met77、Leu78、Ala79、Thr80、Asn83、Ala103、Phe104、Ser131、Ala132、Gly133、Thr134、Gly135、Asn136、Pro137、Phe138、Phe139、Thr140、Thr141、Asp142、Ser143、Thr144、Ala145、Leu147、Arg148、Lys159、Ala160、Thr161、Lys162、Val163、Gly165、Val166、Tyr167、Asp168、Cys169、Asp170、Pro171、Lys173、Asp174、Ala177、Lys178、Tyr180、Lys191、Glu192、Leu193、Lys194、Val195、Met196、Asp197、Val213和Phe214。
抑制剂结合位点包括pyrH上与起到防止pyrH活性的作用的抑制剂(如5’-腺苷酰亚胺二磷酸(AMP-PNP))发生相互作用的特定区域(原子)。抑制剂结合位点可包含折叠多肽当中的一个或多个氨基酸残基的三维排列,或者由所述三维排列定义。在本发明中,抑制剂可以是能进行催化反应,结合到pyrH上的底物结合位点或另一位点如别构结合位点的化合物,其可竞争ATP和/或UMP底物周转,或者以别的方式防止pyrH活性。本发明的抑制剂可以是在底物结合位点结合的化合物如AMP-PNP,或者是在别构结合位点结合的UTP。抑制剂可以是天然或人造化合物。
“别构结合位点”包括pyrH上与别构效应物如GTP或UTP发生相互作用的特定区域(原子)。别构结合位点可包含折叠多肽当中的一个或多个氨基酸残基的三维排列,或者由所述三维排列定义。别构效应物可以是激活剂如GTP。别构效应物可以是天然或人造化合物。
在本发明的一个实施方案中,流感嗜血杆菌pyrH的别构结合位点包括SEQ ID NO14的氨基酸Arg7、Gly66、Met67、Asn68、Arg69、Val70、Val71、Gly72、His74、Gly84、Leu85、Ala86、Met87、Arg88、Asp89、Ser90、Leu91、Phe92、Arg93、Asp95、Val96、Asn97、Ala98、Lys99、Leu100、Met101、Ile109、Cys110、Asp111、Asn114、Trp115、Ser116、Glu117、Ala118、Ile119、Lys120、Met121、Arg123、Glu124、Arg126、Val127、Ile129、Glu151、Ile152和Glu153。
机器可读数据存储介质确定pyrH晶体结构的原子坐标列表可以以电子方式存储,例如在机器可读存储介质如磁盘上存储,以便计算机可访问和操纵所述坐标。例如,使用3D可视化软件,有可能在计算机图形屏幕上描绘出原子坐标所表示的结构,研究与候选抑制剂的假设相互作用。这样,本发明的原子坐标是设计作为新抗菌药物候选者的新型抑制剂的有用工具。
鉴定pyrH结合物质的计算机辅助方法本发明包括用以鉴定潜在的pyrH结合物质如调节物,特别是潜在的pyrH活性抑制剂的计算机辅助方法。
本领域技术人员会理解到,可通过数学方法(例如通过旋转或平移)来操纵一组原子坐标(如图7列表所示的原子坐标),使得与图7列表所示的原子坐标完全不同的一组原子坐标,也能确定相似或完全相同的形状,因此该组原子坐标代表了同样的发明。
本文描述的pyrH晶体结构和结合位点用于设计能抑制pyrH,从而可用作抗菌药物的物质特别是选择性抑制物质。在相关的实施方案中,本发明涵括抑制pyrH活性的物质的基于结构的药物设计方法。
更具体的说,本发明抑制pyrH的化合物的设计通常要考虑两个因素。首先,所述化合物必须能够通过共价和/或非共价相互作用与pyrH在物理上或结构上发生缔合。在pyrH与其底物、别构效应物或抑制剂的缔合中重要的非共价分子相互作用,包括氢键键合、范德华力和疏水相互作用。
其次,所述化合物必须能够呈现能让其与pyrH发生缔合的构象。虽然所述化合物的某些部分不会直接参与这一与pyrH的缔合,但这些部分仍可影响到分子的总体构象。而这又会对功效具有显著的影响。这种构象要求包括化学实体(chemical entity)或化合物涉及全部或一部分结合位点(例如底物结合位点、别构结合位点)的总体三维结构和方向、pyrH的分子间界面或者包含几个直接与pyrH发生相互作用的化学实体的化合物其各官能团之间的间距。
在合成和测试某化学化合物之前,可用计算机建模技术先对其对pyrH的潜在抑制作用进行估计。如果给定的化合物的理论结构提示其与pyrH的相互作用和缔合作用不足,则可避免该化合物的合成和测试。但是,如果计算机建模结果表明存在强相互作用,则可合成该分子并用合适的测定法测试其结合pyrH的能力。这样,就可避免合成无活性的化合物。
本发明的一个实施方案涉及任何用已知的pyrH结合物质如ATP、ADP、UTP、UMP、UDP或GTP来确定用于与候选抑制剂作比较的已知物质的拟合情况的计算机辅助方法。
在一个具体的实施方案中,鉴定某种物质是否是pyrH的结合物质的计算机辅助方法包括以下步骤(1)给计算机建模应用程序提供已知物质的原子坐标,所述已知物质如结合pyrH的结合位点的pyrH别构效应物和/或底物;(2)给计算机建模应用程序提供图7所提供的pyrH原子坐标,或者所列氨基酸序列的保守骨架原子方面与图7原子坐标的均方根偏差不超过1.0的原子坐标,或所述均方根偏差不超过1.5的原子坐标;(3)对结合pyrH的结合位点的物质与pyrH的拟合情况进行定量;(4)给计算机建模应用程序提供待评估物质的一组原子坐标,以确定它是否能结合pyrH的结合位点;(5)用拟合函数对受试物质在所述结合位点中的拟合情况进行定量;(6)将已知物质的拟合计算结果与受试物质的拟合计算结果进行比较;和(7)选出拟合情况好于或接近已知物质的拟合情况的受试物质。例如,用于上述方法的已知结合物质的原子坐标可以是结合本发明pyrH的GDP分子的原子坐标,由图7列表所示的原子坐标定义。GDP分子与pyrH的结合位点的拟合情况可通过例如用诸如Areaimol的程序(CCP4,1994,出处同上),计算GDP与所述结合位点结合时GDP分子和pyrH分子上去除溶剂的表面积(内埋表面积)来进行定量。由这两种分子的计算值之比可估计GDP与pyrH结合位点的表面或形状互补性。然后可将受试物质如UTP(其结合的pyrH结合位点与GDP相同或相似)的拟合情况与GDP的拟合情况例如如下进行比较将UTP对接(docking)到观察发现GDP能结合的pyrH结合位点中,并再次进行计算以比较UTP结合时UTP分子和pyrH分子上去除溶剂的表面积。两个内埋表面积之比越接近1,则表明拟合情况越好。
本发明行得通的另一个方法,是用计算方法筛选小分子数据库,寻找能全部或部分结合pyrH的结合位点的化学实体或化合物。在这个筛选中,这种化学实体或化合物与所述结合位点的拟合的质量,可通过形状互补性(DesJarlais等,1988,J.Med.Chem.31722-729)或者通过估计的相互作用能量(Meng等,1992,J.Comp.Chem.,13505-524)来判断。
筛选化学实体或片断与pyrH,更具体的说与pyrH的单个结合位点发生缔合的能力的方法,是本领域公知的。这种方法可包括将计算机应用于称为对接的过程中。可用诸如Quanta和Sybyl的软件实现对接,然后用诸如CHARMM和AMBER的软件以标准分子动力学力场进行能量最小化和分子动力学。
专门的计算机程序在选择片断或化学实体的过程中也可起到帮助作用。这些程序包括1.GRID(Goodford,1985,J.Med.Chem.,28849-857)。GRID可获自英国牛津大学;2.MCSS(1991,Miranker和Karplus,ProteinsStructure,Function andGenetics,1129-34)。MCSS可获自美国马萨诸塞州Burlington市的Molecular Simulations公司;3.AUTODOCK(Goodsell和Olsen,1990,ProteinsStructure,Functionand Genetics,8195-202)。AUTODOCK可获自美国加州La Jolla市的Scripps研究所;4.DOCK(Kuntz等,1982,J.Mol.Biol.,161269-288)。DOCK可获自美国加州大学旧金山分校。
另外的市售的小分子化合物计算机数据库包括CambridgeStructural Database和Fine Chemical Database(Rusinko,1993,Chem.Des.Auto.News,844-47)。
一旦选出了合适的化学实体或片断,可将它们装配成单一化合物或抑制剂。可这样进行装配相对pyrH的结构/原子坐标目视检查计算机屏幕上显示的3D图像上各片断相互间的关系。然后用诸如Quanta或Sybyl的软件进行手工建模。
帮助本领域技术人员将各单个化学实体或片断连接起来的有用程序包括1.CAVEAT(Bartlett等,1989,Molecular Recognition in Chemical andBiological Problems,Special Pub.,Royal Chem.Soc.,78182-196)。CAVEAT可获自美国加州大学伯克利分校;2.3D数据库系统如MACCS-3D(MDL Information Systems,美国加州San Leandro市)。这个领域在Martin,1992,Med.Chem.,352145-2154中有综述;3.HOOK(可获自美国马萨诸塞州Burlington市MolecularSimulations公司)。
可使用空活性位点或者任选包括已知抑制剂的一些部分,将抑制性或其它类型的结合成分作为一个整体或“从头”来设计,而不是如上所述以逐步方式每次一个片断或化学实体继续进行pyrH抑制剂的构建。这些方法包括1.LUDI(Bohm,J.Comp.Aid.Molec.Design 661-78,1992)。LUDI可获自美国加州San Diego市Biosym Technologies公司;2.LEGEND(Nishibata和Itai,Tetrahedron,478985,1991)。LEGEND可获自美国马萨诸塞州Burlington市Molecular Simulations公司;3.LeapFrog(可获自美国密苏里州St.Louis市Tripos Associates公司)。
对候选抑制剂对pyrH活性的潜在干扰能力进行评估,并按需对候选抑制剂进行结构修饰,产生出修饰候选抑制剂的一组原子坐标。使用计算机辅助技术和任选的体外和/或体内测试,对修饰候选抑制剂进行进一步的评估,且如有必要作进一步的修饰,以产生性能增强(例如抑制活性比起始候选抑制剂更大)的修饰候选抑制剂。有多种常规技术可用来执行每个上述评估以及筛选候选化合物抑制pyrH的能力所必须进行的评估。一般这些技术涉及确定给定部分(moiety)的位置和结合接近度、结合抑制剂所占据的空间、抑制剂与蛋白质之间的互补接触表面的量、给定化合物的结合的变形能,和对氢键键合强度和/或静电相互作用能的某些估计。可用于上述评估的技术的实例包括量子力学、分子力学、分子动力学、Monte-Carlo抽样、系统搜索和距离几何的方法(Marshall,Ann.Rev.Pharmacol.Toxicol.,27193,1987)。已开发出具体的计算机软件供用于执行这些方法。为这种用途而设计的程序的实例包括Gaussian 92[美国宾夕法尼亚州匹兹堡市M.J.Frisch,Gaussian,Inc.公司,1993];AMBER[P.A.Kollman,美国加州大学旧金山分校,1993];QUANTA/CHARMM[美国加州San Diego市Molecular Simulations,Inc.公司,1992]。也可应用其它的分子建模技术来筛选pyrH的抑制剂。参见例如Cohen等,1990,J.Med.Chem.,33883-894;Navia和Murcko,1992,Curr.Opin.Struct.Biol.,2202-210。本文描述的建模技术和计算机评估系统对本发明来说不是限制因素,但它们的及时执行都依赖于如图7所提供的pyrH原子坐标的有效性。
其它的硬件系统和软件包对于本领域技术人员来说是公知的和明显适用的。
因此,使用这些计算机评估系统,可既快速又容易地检查大量的化合物,避免昂贵费时的生化测试。此外,实际合成许多化合物的需要也有效地得到排除。
在另一个实施方案中,本发明涉及通过化学方法、酶学方法或其它合成方法产生pyrH的候选调节物的方法。按本文所描述进行鉴定或设计的候选调节物可用本领域技术人员公知的技术来产生。
抑制剂一旦用本文描述的建模技术进行了鉴定,就可用标准的技术来测试其pyrH结合和抑制生物活性。例如,pyrH可用于使用常规方式(format)的结合测定法中来筛选抑制剂。适用的测定法包括但不限于酶联免疫吸附测定(ELISA)或荧光猝灭测定。也可使用其它测定方式,例如产物的产生可用分光光度法检测的偶联测定法;这些测定方式对于本发明来说不是限制因素。
体外和体内结合分析本发明的方法包括用本文描述的晶体结构和新型结合位点鉴定pyrH抑制剂的方法。包括在本发明中的抑制剂包括任何能结合pyrH的整体或结合位点的抑制剂,可以是竞争性抑制剂或非竞争性抑制剂。这些抑制剂一旦得到鉴定和筛选了生物活性,就可作治疗性或预防性使用,以阻断细菌生长和传播。
一种设计方法是用由多种不同化学实体组成的分子探查本发明的pyrH,以确定候选pyrH结合物质和pyrH之间的相互作用的最佳位点。用含有目的化合物的溶液浸泡晶体,从晶体收集到的高分辨率X射线衍射数据为确定每种类型的分子在哪里结合提供了可能。本文所用的术语“浸泡”指将晶体转移到含有目的化合物、抑制剂、底物或别构调节物的溶液(例如有机溶剂)中的过程。然后可设计、合成能紧密结合这些位点的小分子,并测试它们的pyrH抑制活性(Bugg等,1993,Scientific American,Dec92-98;West等,1995,TIPS,1667-74)。
本发明的pyrH也可用来确认结合情况和提供有关所鉴定出的物质的结合模式的信息,所述物质例如通过本文描述的任何计算机建模方法、体外结合测定法或高通量筛选来鉴定。例如,可将从在提议结合物质存在下生长的pyrH晶体收集到的高分辨率衍射数据与图7列表所示的pyrH原子坐标组合使用,来用下文描述的分子置换方法获得pyrH和提议结合物质之间的复合物的结构。或者,可将图7所列的pyrH分子原子坐标直接与实验X射线衍射数据组合使用,产生差值傅里叶电子密度图,由该图可鉴定出所述物质的结合情况。或者可将预先存在的pyrH晶体转移到含有提议结合物质的溶液中,保持足以让所述物质扩散穿过晶体点阵而结合pyrH的结合位点的时间。然后可从这些晶体收集X射线衍射数据,如上所述用以确定所述物质与pyrH的结合的性质。这些方法能确认所述物质与pyrH的结合,另外还能阐明pyrH与结合物质之间的任何相互作用的性质,使得可以对结合物质再作多轮最优化。
本发明的pyrH还可例如与NMR波谱学实验的数据组合使用,以确认所鉴定出的物质的结合情况,所述物质例如通过上述任何计算机建模方法,或者通过任何其它方法如体外结合测定法或高通量筛选来鉴定。例如,测量在存在或不存在结合物质下进行分析的pyrH样品的NMR化学位移变化,可测定出所述物质对pyrH的结合亲和力(KD)。此外,将引起化学位移变化的残基映射到本发明pyrH的结构上,可以鉴定目的物质的结合位点。参见例如Otting,1993,CurrentOpinion in Structural Biology,3760-768;Hensmann等,1994,ProteinScience,31020-1030;Craik等,1990,Annual Reports on NMRSpectroscopy,2261-128。
本发明涵括用以鉴定pyrH抑制剂的体外生物测定法。该测定法可以是如2004年5月19日提交的PCT/GB2004/002158(通过引用整体结合到本文中)所详细描述的单酶或双酶活性测定法,或者是等同的体外测定系统,在这种系统中先将小分子、蛋白质或其片断加入到细菌中,然后再加入别构效应物和/或底物。当细菌与对照(缺乏抑制剂)相比其生长受到抑制时,就鉴定出pyrH的抑制剂。
本发明还包括受试结合物质的抗菌活性的体内分析。该方法包括用足以在哺乳动物受试对象(优选非人灵长类动物或啮齿动物)中引起感染的临床相关量的细菌感染所述受试对象。细菌引起感染后,就可将受试抑制剂(例如抗菌结合物质)给予受试对象。单独的对照组可给予安慰剂。可在不同的时间点收集组织、血液和血制品,以确定感染进程,将能减少(部分上或全部)感染程度的物质确定为感染的有效抑制剂(参见例如Sande等,1988,Reviews of Infectious Diseases,10 Suppl.1S113-6或者Jacobs,2003,International Journal of InfectiousDiseases,7 Suppl 1S13-20)
同源建模在某些实施方案中,本发明涉及用图7所描述的流感嗜血杆菌pyrH的原子坐标,产生流感嗜血杆菌pyrH蛋白质同系物或变体的3D原子坐标的方法,所述方法包括a.鉴定出一个或多个与流感嗜血杆菌pyrH同源的多肽序列;b.将所述序列与包含具有SEQ ID NO14氨基酸序列的多肽的流感嗜血杆菌pyrH的序列进行比对;c.鉴定出同源序列和流感嗜血杆菌pyrH之间的结构保守区和结构可变区;d.用流感嗜血杆菌pyrH的原子坐标如图7所列的原子坐标,产生流感嗜血杆菌pyrH同源序列的结构保守残基的3D原子坐标;e.产生同源序列的结构可变区中的螺旋、链、环和/或转角的构象;f.建立同源序列的侧链构象;g.将保守残基、环和侧链构象的3D原子坐标进行组合,产生同源序列的完全或部分3D原子坐标。
因此,本文描述的pyrH结构为实验结构信息不容易获得的同源蛋白质的结构建模提供了可能。
分子置换pyrH可以以不止一种形式结晶。因此,本文描述的pyrH原子坐标对于解析pyrH另外的晶型或pyrH另外的晶型的结合结构域的结构特别有用。本发明的pyrH的某些部分起到活性位点(底物结合位点)的作用。它们也可用来解析pyrH突变体、pyrH复合物、pyrH同工酶的结构,或者与pyrH功能域有显著氨基酸序列同源性或结构同源性的其它蛋白质的晶型的结构。在一个实施方案中,显著的氨基酸序列同源性包括与pyrH的任何功能域有至少40%、45%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%或99%的同一性。
为此目的可采用的一种方法是分子置换。用这种方法,未知的晶体结构,无论它是流感嗜血杆菌pyrH的另一种晶型、pyrH同工酶或pyrH共复合物,还是与任何pyrH功能域有显著氨基酸序列同源性的某些其它蛋白质的晶体,都可用本发明的pyrH原子坐标进行确定。用这种方法为未知晶体提供准确的结构形式,比试图从头开始确定这种结构信息要快得多和有效得多。
可用于执行分子置换的各步骤的程序的实例包括MOLREP(Vagin和Teplyakov,1997,J.Appl.Cryst.,301022-1025)、AMoRe(Navaza,2001,Acta Cryst.,D57(10)1367-1372)、Beast(Read,2001,ActaCryst.,D57(10)1373-1382)、GLRF(Tong和Rossmann,1990,ActaCryst.,A46783-792)、COMO(Jogl等,2001,Acta Cryst.,D57(8)1127-1134)、EPMR(Kissinger等,1999,Acta Cryst.,D55(2)484-491)。MOLREP、AmoRe和Beast软件是作为CCP4软件包(CCP4,Acta Cryst.,D50760-763,1994)的一部分来分销的。举例说,MOLREP是一种集成的分子置换软件,用以下两步程序寻找分子置换解决方案(1)旋转函数(RF)搜索,以鉴定模型的方向;(2)交叉平移函数(TF)和堆积函数(packing function,PF)搜索,以鉴定定向模型的位置。平移函数通过给旋转函数的各个峰计算相关系数并对结果进行排序,来检核这几个峰。堆积函数在排除对应于重叠对称性的不正确解决方案方面很重要。可将MOLREP设定成可搜索每个不对称单元任何数量的分子,且可在添加另外的分子也不能实现解决方案的进一步改进时自动停止运行。
在另一个方面,本发明提供涉及分子置换的方法,其用上述软件程序或本领域公知的等同程序以及本文描述和图7列表所示的原子坐标,来获得结构未知的分子或分子复合物的结构信息。
本发明的实施除非另外指明,本发明的实施可采用细胞生物学、细胞培养、分子生物学、微生物学和重组DNA操作、X射线晶体学、核磁共振波谱学和分子建模的常规技术,这些技术是在本领域技术范围内的。这种技术在文献中有充分的说明。参见例如Molecular CloningALaboratory Manual,第2版,Sambrook,Fritsch和Maniatis编辑(ColdSpring Harbor Laboratory Press1989);DNA Cloning,第I和II卷(D.N.Glover编辑,1985);Oligonucleotide Synthesis(M.J.Gait编辑,1984);Mullis等,美国专利第4,683,195号;Nucleic Acid Hybridization(B.D.Hames和S.J.Higgins编辑.1984);Transcription And Translation(B.D.Hames和S.J.Higgins编辑.1984);B.Perbal,A Practical Guide ToMolecular Cloning(1984);论文集,Methods In Enzymology(AcademicPress,Inc.,美国纽约州);Methods In Enzymology,第154和155卷(Wu等编辑),Crystallography made crystal cleara guide for users ofmacromolecular models(Gale Rhodes,第2版,San DiegoAcademicPress,2000)。
等同方案对本领域技术人员来说显而易见的是,可不背离本发明的范围和精神,作出本发明的各种修改和变化。本领域技术人员通过考虑本说明书和实施本文描述的本发明,会明白本发明的其它实施方案。我们的意图是,应认为说明书和实施例只是示例性的,本发明的真正范围和精神由权利要求书来指明。
本发明通过以下实施例作进一步的说明,这些实施例旨在详细阐述本发明的几个实施方案。这些实施例不意在或不应被解释为限制本发明的范围。
实施例实施例1流感嗜血杆菌pyrH的克隆、纯化和表征流感嗜血杆菌pyrH UMP激酶基因(HI-1065)克隆自由已测序RdKW20株提取(Fleischmann等,1995 Science,269496-512)的基因组DNA。克隆是用专门设计的引物扩增HI-1065的蛋白质编码序列来实现的。将NcoI限制酶(RE)位点工程改造到5’引物中,SalI RE位点工程改造到3’引物中,以促进亚克隆到pET28b中进行过表达。5’引物包括ATG起始密码子上游的9bp,3’引物包括TAG终止密码子下游的16bp(包括SalI)。当引入NcoI位点时,pyrH第二密码子的第一个核苷酸从A(GC)变成G(GC),导致由丝氨酸(在HI1065编码蛋白质序列中)向甘氨酸(在pSM143编码蛋白质序列中)的置换。
用于扩增的两个引物如下5′HI1065-NcoI5’GAAAAAACCATGGGCCAACCAATTTATAAACG 3’SEQ ID NO113′HI1065R-SalI5’TTCTTGTCGACATTCACTAACAAATAGTGGTGCC 3’SEQ ID NO12用上述引物进行pyrH的PCR扩增后,将所得DNA凝胶纯化,并克隆到pGEM-T(Promega)中。此克隆(pSM143)中的DNA插入物经分析确认存在正确的序列,没有非预计的错误。它经测序发现3’SalIRE位点没有按设计那样存在(极有可能由于引物合成中的错误)。但是,蛋白质编码序列却是正确的,因此将pyrH基因首先作为PstI-SacII片断(pSM144)从pSM143亚克隆到pUC128中(Keen等,1988,Gene,70(1)191-197),随后作为NcoI-EcoRI片断克隆到pET28b中,产生pSM145。将pSM145转化到大肠杆菌BL21(DE3)株中进行过表达。表达在30℃下进行。当细胞密度达到OD600在0.35-0.5之间时,用1mM IPTG诱导生长中的培养物。细胞再生长2小时后,离心收集细胞,冷却至4℃。将所得细胞团(cell paste)冻藏。硒代甲硫氨酸(SeMet)标记的pyrH的生产如下实现使大肠杆菌BL21(DE3)/pSM145细胞在补加0.05mg/ml SeMet和40μg/ml卡那霉素的2L M9基本培养基中室温下生长5.5小时,然后用1mM IPTG室温下过夜诱导pyrH表达。2H13C15N标记的pyrH的生产如下实现使大肠杆菌BL21(DE3)/pSM145细胞在补加40μg/ml卡那霉素的1L Silante大肠杆菌OD2 CDN培养基(VLI Research)中30℃下生长6.5小时,然后用1mM IPTG 30℃下过夜诱导pyrH表达。
pSM145中的克隆插入物的核苷酸序列ATGGGCCAACCAATTTATAAACGTATTTTATTGAAATTAAGCGGTGAAGCATTACAAGGAGAAGATGGTCTTGGTATCGATCCTGCGATTCTCGATCGTATGGCTGTTGAAATTAAAGAATTAGTGGAGATGGGTGTGGAAGTCAGTGTCGTTCTCGGTGGTGGCAACTTATTCCGTGGCGCAAAACTAGCAAAAGCGGGGATGAATCGCGTGGTGGGCGATCATATGGGAATGCTTGCTACTGTGATGAATGGTTTGGCAATGCGTGATTCTTTATTCCGTGCTGATGTGAACGCAAAATTAATGTCCGCTTTCCAATTAAATGGTATTTGCGATACTTATAACTGGTCTGAAGCTATCAAAATGTTACGCGAAAAACGCGTAGTCATTTTCTCTGCGGGAACGGGAAATCCATTCTTTACCACTGATTCTACCGCTTGTTTGCGTGGTATTGAAATTGAAGCTGATGTTGTGTTGAAAGCGACTAAAGTTGATGGTGTGTATGATTGTGATCCTGCGAAAAATCCTGATGCAAAACTTTATAAAAATTTAAGTTATGCAGAAGTGATCGATAAAGAATTAAAAGTGATGGACTTATCGGCGTTTACTTTAGCTCGCGATCATGGCATGCCGATTAGAGTGTTCAATATGGGTAAACCTGGAGCATTACGTCAAGTAGTGACTGGTACTGAAGAAGGCACCACTATTTGTTAG(SEQ ID NO13)pSM145中的克隆插入物的氨基酸序列MGQPIYKRILLKLSGEALQGEDGLGIDPAILDRMAVEIKELVEMGVEVSVVLGGGNLFRGAKLAKAGMNRVVGDHMGMLATVMNGLAMRDSLFRADVNAKLMSAFQLNGICDTYNWSEAIKMLREKRVVIFSAGTGNPFFTTDSTACLRGIEIEADVVLKATKVDGVYDCDPAKNPDAKLYKNLSYAEVIDKELKVMDLSAFTLARDHGMPIRVFNMGKPGALRQVVTGTEEGTTIC(SEQ ID NO14)
用于结晶的流感嗜血杆菌pyrH的纯化将冰冻的细胞团悬浮于40ml的裂解缓冲液[50mM Tris-HCl,pH8.0,2mM EDTA,2mM DTT,2mM UTP,1mM PMSF,1片蛋白酶抑制剂混合物片剂(Roche Molecular Biochemical)]中。使细胞两次通过在18,000psi下操作的法式压滤器(French press)进行破裂,粗提取物在4℃下25,000rpm(45Ti rotor,Beckman)离心30分钟。上清液以1.5ml/min的流速加样到用缓冲液A(50mM Tris-HCl,pH 8.0,2mMEDTA,2mM DTT,2mM UTP)预平衡的20ml Q-Sepharose HP(HR16/10)柱(Amersham Biosciences)上。然后用缓冲液A洗涤该柱,蛋白质以缓冲液A中0-1M NaCl的线性梯度洗脱。集中含有pyrH的级分,加入固体(NH4)2SO4(0.4g/ml)使所有的蛋白质沉淀,并在冰上混合1小时。将样品在4℃下11,000rpm(JA12 rotor,Beckman)离心30分钟。将沉淀溶于7ml的缓冲液A中。将该7ml样品以1.0ml/min的流速加样到用缓冲液B(50mM Tris-HCl,pH 8.0,2mM EDTA,2mM DTT,2mM UTP,150mM NaCl)预平衡的320ml Sephacryl S-300(HR 26/60)柱(Amersham Biosciences)上。集中含有pyrH的级分,对1L储存缓冲液(50mM Tris-HCl,pH 8.0,0.1mM EDTA,1mM UTP,150mM NaCl,2mM DTT,20%甘油)进行透析。
蛋白质用SDS-PAGE分析和分析型LC-MS进行表征。测定出的蛋白质质量表明,从DNA序列预测出的多肽的N末端甲硫氨酸不存在[预期分子量=25569.0Da(-N末端Met),观测分子量=25565Da(-N末端Met)]。将该蛋白质在193K下保藏。
用于结晶的SeMet标记流感嗜血杆菌PyrH的纯化将冰冻的细胞团悬浮于40ml的裂解缓冲液[50mM Tris-HCl,pH8.0,2mM EDTA,2mM DTT,2mM UTP,1mM PMSF,1片蛋白酶抑制剂混合物片剂(Roche Molecular Biochemical)]中。使细胞两次通过在18,000psi下操作的法式压滤器进行破裂,粗提取物在4℃下25,000rpm(45Ti rotor,Beckman)离心30分钟。上清液以1.5ml/min的流速加样到用缓冲液A(50mM Tris-HCl,pH 8.0,2mM EDTA,2mM DTT,2mM UTP)预平衡的20ml Q-Sepharose HP(HR16/10)柱(AmershamBiosciences)上。然后用缓冲液A洗涤该柱,蛋白质以缓冲液A中0-1M NaCl的线性梯度洗脱。集中含有pyrH的级分,加入固体(NH4)2SO4(0.4g/ml)以使所有的蛋白质沉淀,并在冰上混合1小时。将样品在4℃下11,000rpm(JA12 rotor,Beckman)离心30分钟。将沉淀溶于6ml的缓冲液A中。将该6ml样品以1.0ml/min的流速加样到用缓冲液B(50mM Tris-HCl,pH 8.0,2mM EDTA,2mM DTT,2mM UTP,150mM NaCl)预平衡的320ml Sephacryl S-300(HR 26/60)柱(AmershamBiosciences)上。集中含有pyrH的级分,对1L储存缓冲液(50mMTris-HCl,pH 8.0,0.1mM EDTA,1mM UTP,150mM NaCl,2mM DTT,20%甘油)进行透析。
蛋白质用SDS-PAGE分析和分析型LC-MS进行表征。测定出的蛋白质质量表明,从DNA序列预测出的多肽的N末端甲硫氨酸不存在,且所有其它甲硫氨酸都被硒代甲硫氨酸(SeMet)正确置换[预期分子量=26127.6Da(-N末端SeMet),观测分子量=26126.0Da(-N末端SeMet)]。将该蛋白质在193K下保藏。
用于核磁共振波谱学实验的同位素标记流感嗜血杆菌pyrH的纯化2H13C15N标记流感嗜血杆菌pyrH的纯化按对SeMet标记pyrH的描述来进行。
实施例2流感嗜血杆菌pyrH的结晶将纯化的流感嗜血杆菌pyrH以约10mg/ml的蛋白质浓度在288K温度下和在核苷酸(1mM UMP,1mM UTP,1mM GTP和1mM ATP)存在下进行稀疏矩阵结晶筛选。筛选先导物(lead)用标准技术进行优化。
具有图7的原子坐标的晶体用悬滴法(参见例如“ProteinCrystallization”,Terese M.Bergfors(编辑),International University Line,第7-15页,1999)通过蒸汽扩散来获得。纯化的SeMet标记流感嗜血杆菌pyrH已经以93mg/ml的浓度在储存缓冲液(50mM Tris-HCl pH8.0,0.1mM EDTA,1mM UTP,150mM氯化钠,2mM DTT,20%甘油)中193K下保藏。将含有大约2.3mg蛋白质的单一等分试样从冷藏中解冻出来,并在以下缓冲液中充分洗涤50mM Tris-HCl pH 8.5,50mMNaCl,10mM DTT,0.1mM EDTA,1mM ATP,1mM GTP,1mM UMP,1mM UTP。将最终蛋白质浓度调整至10mg/ml。晶体也可用约5至约20mg/ml的最终蛋白质浓度来获得。在最终蛋白质溶液中AMP-PNP、2’-BrATP或2’-IATP都成功地代替了ATP。池液(reservoirsolution)通常含有22-27%(w/v)聚乙二醇(PEG)1000、100mM硫酸锂和100mM磷酸-柠檬酸缓冲液pH 5.0。磷酸-柠檬酸缓冲液是通过用柠檬酸滴定磷酸氢二钠至达到所需的pH来制备的。PEG1000在池液中的浓度可在约15%(w/v)至约30%(w/v)之间,而晶体通过相应调整蛋白质溶液中的pyrH浓度或者悬滴中的蛋白质溶液与池液之比来获得。晶体也可用其中多种不同分子量的PEG(PEG600至PEG8000)代替了PEG1000,且其中多种其它盐类(例如硫酸钠、氯化钠、氯化锂)代替了硫酸锂的池液来获得。硫酸锂在池液中的浓度可在约50mM至约400mM之间,约100至约250mM硫酸锂时观察到最佳结果。
悬滴是如下建立的将2微升的蛋白质溶液与2微升的池液混合,并将该液滴悬浮在500微升的池液的上面。观察到在288K的环境温度下5天内有尺寸最大至400×200×100微米的晶体生长出来。在更宽的温度范围内(约285K至约295K)也获得晶体。悬滴的大小和蛋白质与池液之比都可加以改变。未标记pyrH在类似于SeMet标记蛋白质的条件下结晶,例外的是蛋白质溶液中用2mM DTT代替10mMDTT。
按以下方式将冷冻保护剂引入到含有选定晶体的液滴中。制备含有池液的储备溶液(stock solution),该池液对应于补加5、10、15和20%(v/v)乙二醇的选定液滴。假定如上所述建立(即将2微升的蛋白质溶液与2微升的池液混合)的含有晶体的完全平衡液滴的名义(nominal)液滴体积是2微升。将一名义液滴体积(即2微升)的补加5%(v/v)乙二醇的池液加入到含有晶体的选定液滴中,轻轻混合,让其平衡30秒。将一名义液滴体积(即2微升)的补加10%(v/v)乙二醇的池液加入到该液滴中,轻轻混合,让其平衡30秒。然后将两名义液滴体积(即4微升)的补加15%(v/v)乙二醇的池液加入到含有晶体的该液滴中,轻轻混合,让其平衡30秒。然后用晶体支撑环(mounting loop)(美国加州Hampton Research公司)吸取该液滴溶液的样品,在冷(100K)氮气流中快速冷却进行测试。如果该溶液形成透明玻璃状物,则从该液滴取出选定的晶体,同样进行快速冷却。如果该溶液形成不透明的冰状物,则将两名义液滴体积(即4微升)的补加20%(v/v)乙二醇的池液加入到含有晶体的该液滴中,轻轻混合,让其平衡30秒,然后再用晶体支撑环从该液滴移取选定的晶体,并在冷(100K)氮气流中快速冷却。快速冷却的晶体通常先在公司内(in-house)的Mar345监测器(MarResearch,德国汉堡市)上进行测试,然后再在同步加速器辐射源进行数据收集。
实施例3X射线衍射数据收集用公司内的X射线源(MarResearch 345mm成像板探测器系统,X射线在以45kV和90mA操作的Bruker-Nonius FR591旋转阳极上产生)使晶体衍射至约3.2分辨率。晶体属于斜方六面体空间群R32,晶胞参数为a=b=c=(146.5+/-0.7),α=β=γ=(97.38+/-0.07)°。本领域技术人员会认识到,斜方六面体空间群的六角形等同物方便操作,其中本发明的pyrH晶体的晶胞参数是a=b=(215+/-1.0),c=(233.6+/-1.5)和α=β=90°,γ=120°。这一晶型为图7的原子坐标所涵括。完全数据集在英国Daresbury PX14.2 SRS(同步辐射源)收集至2.3分辨率(参见表2峰1)。
MAD(多波长反常散射法)数据在英国Daresbury PX14.2 SRS从SeMet标记流感嗜血杆菌pyrH的单晶收集得到。在三个不同波长下(0.9600、0.9794和0.9797)收集了四个数据集。数据分别用以下程序进行自动索引和集中(autoindexed and integrated)、定标和归并(scaled and merged)及舍项(truncated)MOSFLMv6.2.3(Leslie,JntCCP4/ESF EACMB Newslett.Protein Crystallogr.,26,1992;Powell,1999,Acta Cryst.D55(10)1690-1695)、SCALA和TRUNCATE(CollaboratiVe Computational Project,Number 4(CCP4),Acta Cryst.,D50760-763,1994)。MAD数据收集的统计资料在表2中显示。
表2.在PX14.2 SRS收集的MAD数据;最大分辨率2.3
Rfac=Sum|<I>-Ij|/Sum|Ij|R反常=Sum|<I+>-<I->|/Sum|<I+>-<I->|实施例4使用MAD数据的相位测定用Xprep程序(Bruker,Madison,USA)从表1描述的四个数据集分析、定标和计算deltaF值(deltaF=|F+-F-|)。
晶胞含量的分析表明,晶体不对称单元可能含有6-12个分子的pyrH。鉴于已知流感嗜血杆菌pyrH在溶液中作为同型六聚体存在,我们起初设想不对称单元会含有单一的六聚集合体(即六个pyrH分子,因此72硒原子(Se))。将Xprep的deltaF值输出用作ShelxD程序(Schneider等,2002,Acta Cryst.,D581772-1779)的输入,要求ShelxD程序寻找72个Se位点。最高等级解决方案(CC=59.4%)含有101个潜在的Se位点,在第70个位点后占有率(occupancy)明显下降。对这头72个Se位点进行核实,并用ShelxE程序(Sheldrick,2002,Zeitschriftfur Kristallographie,217(12)644-650)确定其正确的对映体对比度值(0.46,这个值可指示实验电子密度图中的大波动区域(在蛋白质包膜当中)和小波动区域(在溶剂当中)的存在)和连通度值(0.91,这个值是电子密度图中分别被归为溶剂和非溶剂的相邻像素的分数)高,表明是正确的溶液。用溶剂翻转法(solvent flipping)(一种密度修饰方法)对这72个Se位点进行精修、相位计算和改进,并用以下程序自动建立和精修多肽骨架的部分模型SHARP(La Fortelle等,1997,MethodsEnzymol.,276472-494)、SOLOMON(Abrahams等,1996.Acta Cryst.,D5230-42,1996;CCP4,1994,出处同上)、ARP/wARP(Perrakis等,1999,Nature Struct.Biol.,6(5)458-463)和Refmac(Murshudov等,1997,Acta Cryst.,D53(3)240-255;CCP4,1994,出处同上),这些程序是在AutoSHARP程序集(Bricogne等,2003,Acta Cryst.,D59(11)2023-2030)中执行的。四个数据集之中的三个——峰1(用作天然的)、弯曲和远程(参见表2)用作AutoSHARP的输入。ARP/wARP的部分模型输出含有1236个残基,归类为70个单独的链。对这个部分模型和相关的电子密度图进行检查,确认晶体不对称单元中存在pyrH分子的六聚集合体。但是,还鉴定出pyrH分子的另外的二聚体。这个二聚体靠近晶体三重轴,其结果是可通过晶体学对称性操作从晶体点阵当中的二聚体产生六聚体。因此,所述晶体在不对称单元中具有八个分子的pyrH。
重复运行ShelxD定位出96个可能的Se位点中的87个。再次对这些位点进行核实,并用ShelxE程序确定正确的对映体。对比度值(0.60)和连通度值(0.93)高,表明是正确的溶液。定位出了另外5个Se位点,用溶剂翻转法对总共92个Se位置进行精修、相位计算和改进,并用AutoSHARP程序集里的各程序如前自动建立和精修多肽骨架的部分模型。ARP/wARP的部分模型输出含有1888个可能残基中的1244个,归类为65个单独的链。用SHARP、SOLOMON和DM进行的相位测定统计资料在表3中给出。
表3.用SHARP、SOLOMON和DM进行的相位测定统计资料(2.3)
FOM(密度修饰前)非中0.314,中心0.147FOM(溶剂扁平化(solvent flattening)后(SOLOMON))0.710FOM(作ncs平均(DM)密度修饰后)0.769实施例5流感嗜血杆菌pyrH晶体结构的建模和精修AutoSHARP的电子密度图输出通过按DM程序(CCP4,1994,出处同上)作八重非晶体学对称性(ncs)平均进行密度修饰有少量改进。多肽链可容易地通过组合使用得自AutoSHARP的溶剂扁平化图和得自DM的密度修饰图来追踪,并由所述部分模型和所述92个SeMet位点来指引。建立了pyrH的单个分子(单体)的初始模型除两个环区(SEQ ID NO14的氨基酸残基18-24和氨基酸残基168-179)外,整个主链和大部分的侧链都是明确界定的。由残基168-179组成的后一环区的电子密度在晶体不对称单元中的分子子集中可见,这使得可以以一定的置信度建立这个区的模型。观察到差值傅里叶(mFo-DmFc)电子密度图中对应于结合磷酸根离子的主要峰,接近保守的富甘氨酸区(SEQ ID NO14的Gly52-Gly53-Gly54)。所述磷酸极有可能衍生自结晶池液中存在的磷酸-柠檬酸缓冲液。
然后用来自部分模型的非晶体对称性操作,从初始单体模型产生晶体不对称单元中的八个分子。
用Refmac5程序(CCP4,1994,出处同上)使含有八个分子的这个模型进行20循环的刚体精修(每个分子被定义为单个刚体)。这样获得一组改进的ncs算子(operator),供用于随后各轮ncs限制精修(ncsconstrained refinement)中。使用CNX程序(Accelrys),实施主体溶剂(bulk solvent)和总体(overall)各向异性B因子修正,继续进行精修。针对从模型计算的相位,进行两轮ncs限制模拟扭转角动力学退火(ncsconstrained simulated annealing with torsion angle dynamics)(起始温度2500K),接着进行20循环的能量最小化,最后进行15循环的单个各向同性B因子精修。然后用QUANTA程序(Accelrys;Oldfield,ActaCryst.,D57(1)82-94,2001)执行一轮交互式建模。此时发现差值傅里叶电子密度图中不属于任何蛋白质侧链的另一组主要峰,接近界定二聚体界面的长螺旋(αC,参见图1-3)C末端近旁的Arg88残基。这一密度被解释为由结合的核苷酸引起。在精修的后面各阶段,这个区域中的电子密度变得充分透明,足以将七个分子的别构效应物GTP放入不对称单元中存在的八个潜在的结合位点。结合的GTP分子的三磷酸部分有序性欠佳,其中β-磷酸采取至少三个不同的构象。γ-磷酸的位置没有得到完全确定,因此在最终模型中将它省略掉。再作一轮交互式重建后,用CNX程序使单体模型再进行一轮ncs限制精修。然后和前面一样通过应用ncs算子从精修的单体模型再产生不对称单元的整个内容。使用QUANTA程序的交互式建模和使用CNX程序的ncs限制精修(随着模型质量的改进而逐步放开ncs限制)再交替进行几轮,产生R值为0.25和R-free值为0.28的模型。用Refmac5程序再作两轮精修,不应用ncs限制对TLS(平移、摆动(libration)和转动(screw))、位置和各向同性B参数进行精修,得出R值为0.22和R-free值为0.25的最终模型。
R值描述观察数据与从模型计算的合成数据之间的差异。R-free值也一样,但从通常占总数5%的反射测试组(test set of reflection)计算,所述反射在精修开始时留出来充当无偏参考(unbiased reference)以避免数据的过度拟合。R值不依赖于分辨率,但通常应等于或小于0.25,R-free值通常比R值高出不到0.05。
最终模型由最多达236个氨基酸(SEQ ID NO14和图7所定义的分子A的氨基酸残基1-20、23-168和179-236,分子B的氨基酸残基1-18和24-236,分子C、D、F、G和H的氨基酸残基1-236以及分子E的氨基酸残基1-18和23-236)的八个多肽链、七个分子的GDP、八个磷酸根离子、一个硫酸根离子和358个有序水分子组成。尽管结晶溶液中存在1mM ATP、1mM UMP和1mM UTP,但在流感嗜血杆菌pyrH晶体结构中没有观察到这些核苷酸。最终模型的统计资料在表4中给出。
表4.流感嗜血杆菌pyrH最终模型的精修统计资料
图7是与GTP和磷酸复合的流感嗜血杆菌pyrH的晶体结构的三维原子坐标列表。所给出的原子坐标是晶体非对称单元的所有八个多肽链的原子坐标。C、D、E、F、G和H链构成一个六聚集合体。本领域技术人员可用晶体学对称性操作,从由A和B链组成的二聚集合体产生类似的六聚集合体。在图中,原子列表的前面是标题CRYST1和紧跟其后的晶胞三维度。接着的三个数字定义将原子坐标从正交ngstrm坐标转换成晶胞分数坐标的矩阵。标注ATOM的每一行给出了(假定)原子数、给予每条氨基酸主链的标示、每种原子类型、氨基酸残基类型、蛋白质链标示(A包含第一个分子(链),B包含第二个分子(链),C包含第三个分子(链),D包含第四个分子(链),E包含第五个分子(链),F包含第六个分子(链),G包含第六个分子(链),H包含第六个分子(链))以及氨基酸残基数。各行中的头三个数字给出了原子的正交X、Y、Z坐标。接着的数字是占有数(occupancynumber),如果该原子在不止一个位置被看见(氨基酸可在不止一个方向看见),则该数字小于1.0。最后一个数字是与该原子的热振幅有关的温度因子。列表末尾的各行数据表明包括在模型中的结合GTP分子(GDP)、磷酸根离子(PO4)、硫酸根离子(SO4)和有序水分子(HOH)。
实施例6界定流感嗜血杆菌pyrH的结合位点pyrH晶体的不对称单元由八个拷贝的pyrH多肽链(对应于同型六聚集合体)和同型二聚体组成,所述同型二聚体通过结晶学对称性转化操作可产生六聚集合体。流感嗜血杆菌pyrH六聚集合体可描述为二聚体的三聚体。二聚体是通过稳定、保守的疏水核心维持在一起的,所述疏水核心由顺着两个伸展反向平行α螺旋的表面的甲硫氨酸残基(残基68至95,螺旋C,参见图1)之间的互锁产生的。另外的相互作用发生在反向平行定向的各pyrH分子的保守β3-β4环(包含残基104至109)之间。一个pyrH分子中β1-αA环的残基25、27、30和31以及αA螺旋的N末端(参见图1)与另一个分子中短螺旋区域(螺旋B,参见图1)的残基57、61、62和65之间也存在稳定化接触。因此分子间二聚体界面包括SEQ ID NO14的氨基酸残基Ile25、Pro27、Leu30、Asp31、Phe57、Lys61、Leu62、Ala65、Gly66、Met67、Asn68、Arg69、Val71、His74、Met75、Gly76、Leu78、Ala79、Val81、Met82、Leu85、Ala86、Arg87、Asp88、Arg89、Phe104、Gln105、Leu106、Asn107、Gly108和Ile109。
三个二聚体集合在一起,通过相互作用形成六聚集合体,所述相互作用涉及来自第一二聚体的第一分子(链)的残基Asn68、Arg69、Val70、Val71、His74、Arg88、Phe92、Lys99、Gln105、Leu106、Asn107、Gly108、Ile109、Cys110、Asp111、Thr112、Tyr113、Asn114、Trp115、Glu117、Thr134、Asn136、Pro137、Phe138、Phe139、Leu147、Arg148、Ile150、Glu151、Glu153、Leu198、Ser199、Thr202、Leu203和His207,来自第二二聚体的第二分子(链)的残基Asn68、Arg69、Va170、Val71、His74、Thr134、Asn136、Pro137、Phe138、Phe139、Leu147、Arg148、Ile150、Glu151、Glu153、Leu198、Ser199、Thr202、Leu203和His207,来自所述第二二聚体的第三分子(链)的残基Arg88、Phe92、Lys99、Asn107、Gly108、Ile109、Cys110和Asp111以及来自第三二聚体的第四分子(链)的残基Gln105、Leu106、Thr112、Tyr113、Asn114、Trp115和Glu117。所有的接触情况用Contact程序(CCP4,1994,出处同上)按5半径进行测定。因此,分子间二聚体-二聚体界面包含SEQ IDNO14的氨基酸残基Asn68、Arg69、Val70、Val71、His74、Arg88、Phe92、Lys99、Gln105、Leu106、Asn107、Gly108、Ile109、Cys110、Asp111、Thr112、Tyr113、Asn114、Trp115、Glu117、Thr134、Asn136、Pro137、Phe138、Phe139、Leu147、Arg148、Ile150、Glu151、Glu153、Leu198、Ser199、Thr202、Leu203和His207。
别构结合位点别构效应物GTP在两个二聚体的界面结合,所述界面靠近六聚集合体中央。每个结合的GTP分子在对应于一个二聚体的第一分子的残基88-99和126、该相同二聚体的第二分子的残基68-71和相邻另一二聚体的第三分子的残基115-123的序列中的位点结合,而与三个pyrH分子的残基接触(参见图2-3)。因此,GTP结合既依赖于也有助于六聚体形成。六聚体在UTP存在下得到稳定化,所述UTP可在相邻二聚单元的界面在与GTP相同的位点结合。
蛋白质和结合的GTP之间形状匹配良好。嘌呤环夹在第一分子的Phe92侧链、第二分子的Val71侧链和第三分子的Trp115侧链中间。结合并不是完全由有利的范德华相互作用驱动的。有多种极性相互作用存在,例如第一分子的Arg88的侧链胍基与鸟嘌呤环的N7和O6原子之间,以及第一分子的Asp89的骨架氨基和侧链羧基与鸟嘌呤环的N1原子和2-NH2基团之间的极性相互作用。核糖羟基通过与第三分子的Arg123胍基之间的二齿合相互作用(bidentate interaction)而得到稳定化。另外,第三分子的Ser116和核糖环之间也存在接触。结合的GTP分子的三磷酸部分有序性欠佳,其中β-磷酸采取至少三个不同的构象。α-磷酸通过与第一分子的Arg126侧链和第三分子的Ser116侧链的相互作用而得到稳定化。在一个观测到的构象中,β-磷酸通过与第一分子的Asn97和Arg126的侧链的相互作用而得到稳定化。在另一个构象中,β-磷酸通过与第三分子的Ser116的侧链和第一分子的Ala98的骨架羰基的相互作用而得到稳定化。在第三个构象中,β-磷酸通过与第一分子的Lys99和Arg126的侧链和第三分子的Lys120的侧链的相互作用而得到稳定化。γ-磷酸的位置没有得到完全确定,因此在最终模型中将它省略掉。对晶体不对称单元中的八个分子的相对构象(参见图4)的分析提示,GTP在别构结合位点的结合可通过调节螺旋B(残基60-65)和其后连接螺旋B与螺旋C(残基66-69)的环(αB-αC)(参见图1)的位置来调节活性。我们主张这些残基形成UMP结合位点的一部分。
位于结合GTP分子的5半径内的残基包括SEQ ID NO14的Gly66、Asn68、Val71、Leu85、Arg88、Asp89、Phe92、Arg93、Asn97、Ala98、Lys99、Leu100、Asp111、Asn114、Trp115、Ser116、Glu117、Ile119、Lys120、Met121、Arg123和Arg126。在其侧链与结合GTP发生显著的极性或疏水接触的残基当中,Val71、Asp89、Asn97、Lys99、Lys120和Arg126在10种细菌UMP激酶(pyrH)中相当保守(参见图6)。因此,pyrH的别构效应物结合位点最低限度地包含SEQ IDNO14的残基Asn68、Val71、Arg88、Asp89、Phe92、Asn97、Lys99、Trp115、Ser116、Ile119、Lys120、Arg123和Arg126,或者在更为扩大的定义中包含SEQ ID NO14的残基Gly66、Asn68、Val71、Leu85、Arg88、Asp89、Phe92、Arg93、Asn97、Ara98、Lys99、Leu100、Asp111、Asn114、Trp115、Ser116、Glu117、Ile119、Lys120、Met121、Arg123和Arg126,或者在使用8测头半径得到的还更为扩大的定义中,包含残基Arg7、Gly66、Met67、Asn68、Arg69、Val70、Val71、Gly72、His74、Gly84、Leu85、Ala86、Met87、Arg88、Asp89、Ser90、Leu91、Phe92、Arg93、Asp95、Val96、Asn97、Ala98、Lys99、Leu100、Met101、Ile109、Cys110、Asp111、Asn114、Trp115、Ser116、Glu117、Ala118、Ile119、Lys120、Met121、Arg123、Glu124、Arg126、Val127、Ile129,Glu151、Ile152和Glu153。
磷酸结合位点用TOP程序(CCP4,Acta Cryst.,D50760-763,1994;Lu,ProteinData Bank Quarterly Newsletter,7810-11,1996)将最终模型叠置在粪肠球菌(E.faecalis)氨基甲酸激酶(pdb条目1b7b,Marina等,Protein Sci.,8934-940,1999)的晶体结构上。TOP是一种基于原子坐标定义的蛋白质三级结构比较蛋白质结构对的自动程序。当有具有共同二级结构元件的同源蛋白质时,TOP程序能自动叠置三维模型,检测所有结构中结构上等同的残基,并提供残基对残基的比对。该程序可计算出拓扑和结构多样性的分数,并可产生目的结构在参考结构上的覆盖。这个方法可用来对尽管显示有限的一级序列同源性,但却表现出结构相似性的结构进行鉴定、比对和比较。这表明流感嗜血杆菌pyrH晶体结构中的结合磷酸根近乎精确地覆盖在粪肠球菌氨基甲酸激酶结构中观察到的硫酸分子上。我们主张粪肠球菌氨基甲酸激酶结构中的结合硫酸根离子占据了从ATP转移到底物氨基甲酸盐的γ-磷酸基团的位点。这个假设由与MgADP复合的激烈热球菌(P.furiosus)CK样CPS的晶体结构(Ramón-Maiques等,2000,出处同上)及与底物和过渡态类似物复合的大肠杆菌NAGK的晶体结构(Ramón-Maiques等,2002,出处同上;Gil-Ortiz等,2003,出处同上)所证实。因此我们主张,流感嗜血杆菌pyrH晶体结构中的结合磷酸根离子占据了从ATP转移到UMP的磷酸基团的位点。两个与流感嗜血杆菌pyrH中接触磷酸根离子的残基对等的残基,在大肠杆菌pyrH中已被突变(Bucurenci等,J.Bacteriol.,180(3)473-477,1998)。突变Arg62His和Asp146Asn(分别与流感嗜血杆菌残基Arg58和Asp142对等)导致催化作用的速度下降。因此,包围着磷酸根离子的区域可能对应于pyrH酶的活性中心。位于结合磷酸根分子的5半径内的残基包括SEQ ID NO14的Lys11、Ser13、Gly14、Glu15、Gly52、Gly53、Gly54、Thr141和Asp142。所有这些残基在10种细菌UMP激酶当中是完全保守的,例外的是Glu15在肺炎支原体(Mycoplasma pneumoniae)的pyrH中是丙氨酸(参见图6)。更具体的说,磷酸根离子通过与Gly14、Gly53和Gly54的骨架氨基和与Thr141的侧链羟基形成氢键而得到稳定化。在晶体中的磷酸结合位点子集中,Glu15的侧链羟基也接触到磷酸氧原子。因此,pyrH的磷酸结合位点最低限度地包含SEQ IDNO14的残基Ser13、Gly14、Gly52、Gly53、Gly54和Thr141,或者在更为扩大的定义中包含SEQ ID NO14的残基Lys11、Ser13、Gly14、Glu15、Gly52、Gly53、Gly54、Thr141和Asp142,或者在使用8测头半径得到的还更为扩大的定义中包含SEQ ID NO14的残基Lys11、Leu12、Ser13、Gly14、Glu15、Ala16、Gln18、Val50、Leu51、Gly52、Gly52、Gly53、Gly54、Asn55、Leu56、Phe57、Asn58、Gly76、Met77、Ala79、Thr80、Asn83、Phe139、Thr140、Thr141、Asp142、Ile159和Ala160。
推定的ATP结合位点在与激烈热球菌(P.furiosus)CK样CPS-ADP复合物(Ramón-Maiques等,2000,出处同上)和大肠杆菌NAGK-底物复合物(Ramón-Maiques等,2002,出处同上;Gil-Ortiz等,2003,出处同上)的叠加的基础上,使用TOP程序(CCP4,(1994,出处同上),提出了ATP结合位点。这个位点包括SEQ ID NO14的氨基酸残基Lys11、Leu12、Ser13、Gly14、Glu15、Ala16、Leu17、Val50、Leu51、Gly52、Gly53、Gly54、Asn55、Arg58、Thr80、Asn83、Thr140、Thr141、Asp142、Ser143、Ala145、Lys159、Ala160、Thr161、Lys162、Val163、Gly165、Val166、Tyr167、Asp168、Cys169、Asp170、Pro171、Lys173、Asp174、Ala177、Lys178、Tyr180、Lys191、Glu192、Leu193、Lys194、Val195、Met196、Asp197、Val213和Phe214。在这些残基当中,Lys11、Ser13、Gly14、Gly52、Gly53、Gly54、Asn55、Thr80、Asn83、Thr141、Asp142、Val163、Gly165、Val166、Asp170、Pro171、Ala177、Leu193、Met196、Asp197和Phe214在10种细菌UMP激酶(pyrH)中完全保守。Leu12、Glu15、Ala16、Leu17、Val50、Leu51 Arg58、Ser143、Ala145、Tyr167、Val195和Val213也显示出高水平的保守性(参见图6)。通过与粪肠球菌CK(Marina等,1999,出处同上)、激烈热球菌(P.furiosus)CK样CPS-ADP复合物(Ramón-Maiques等,2000,出处同上)和大肠杆菌NAGK-底物复合物(Ramón-Maiques等,2002,出处同上;Gil-Ortiz等,2003,出处同上)的结构的类比发现,ATP结合有可能得到包含残基168-176的柔性环的构象变化的配合(accommodate)。Tyr167骨架羰基和氨基分别与腺嘌呤的6-NH2和N1之间形成两个氢键,这与腺嘌呤环向Pro171侧链和Cys169-Asp170肽键的堆积(packing)相结合,可能有助于这个位点对ATP的特异性。Asp170的侧链可能接触结合ATP核糖的2’-羟基,而核糖与Gly14、Gly53、Gly54和Thr161的骨架氨基及Lys11、Ser13和Lys159的侧链原子的极性相互作用可能有助于三磷酸部分的结合。残基Lys11、Asp142和Lys159的三联体(triad)(结构上分别与激烈热球菌(P.furiosus)CK-样CPS残基的Lys215,Asp216和Lys277及大肠杆菌NAGK的Lys8、Asp162和Lys217对等)很可能在催化磷酸转移反应中起到重要的作用。Lys11的位置被安排至使过渡态的五价磷稳定化,而Lys159的位置被安排至使反应产物ADP的β-磷酸上发展中的负电荷稳定化。Asp142使两个赖氨酸侧链保持在适当的位置,且可参与配合将与结合底物ATP的三磷酸部分复合的镁离子。
已证明pyrH中与激烈热球菌(P.furiosus)CK样CPS和大肠杆菌NAGK中接触结合腺嘌呤核苷酸的残基对应的残基,其突变会降低催化作用的速度,这进一步证实了所提出的ATP结合位点。这些突变在大肠杆菌pyrH中是Arg62His、Asp146Asn和Asp174Asn(Bucurenci等,1998,出处同上)。在流感嗜血杆菌pyrH中对应的残基是Arg58、Asp142和Asp170。因此,所提出的pyrH ATP结合位点的最低限度定义包含SEQ ID NO14的残基Lys11、Ser13、Gly14、Glu15、Gly53、Gly54、Asp142、Lys159、Thr161、Val166、Tyr167、Cys169、Asp170和Pro171,更为扩大的定义包含SEQ ID NO14的残基Lys11、Leu12、Ser13、Gly14、Glu15、Ala16、Gly52、Gly53、Gly54、Arg58、Thr141、Asp142、Lys159、Ala160、Thr161、Lys162、Val163、Gly165、Val166、Tyr167、Asp168、Cys169、Asp170、Pro171、Lys191、Glu192、Leu193、Lys194、Val195和Val213,使用8测头半径得到的还更为扩大的定义包含SEQ ID NO14的残基Lys11、Leu12、Ser13、Gly14、Glu15、Ala16、Leu17、Val50、Leu51、Gly52、Gly53、Gly54、Asn55、Arg58、Thr80、Asn83、Thr140、Thr141、Asp142、Ser143、Ala145、Lys159、Ala160、Thr161、Lys162、Val163、Gly165、Val166、Tyr167、Asp168、Cys169、Asp170、Pro171、Lys173、Asp174、Ala177、Lys178、Tyr180、Lys191、Glu192、Leu193、Lys194、Val195、Met196、Asp197、Val213和Phe214。
推定的UMP结合位点在表面残基的保守性和与大肠杆菌NAGK-底物复合物pdblohb(Ramón-Maiques等,2002,出处同上;Gil-Ortiz等,2003,出处同上)的叠加的基础上,用TOP程序(CCP4,(1994,出处同上)提出了UMP结合位点。这个位点包括SEQ ID NO14的氨基酸残基Lys11、Leu12、Ser13、Gly14、Glu15、Val50、Leu51、Gly52、Gly53、Gly54、Asn55、Phe57、Arg58、Gly59、Arg69、Val70、Val71、Gly72、Asp73、His74、Met75、Gly76、Met77、Leu78、Ala79、Thr80、Asn83、Ala103、Phe104、Ser131、Ala132、Gly133、Thr134、Gly135、Asn136、Pro137、Phe138、Phe139、Thr140、Thr141、Asp142、Ser143、Thr144、Ala145、Leu147和Arg148。所有这些残基在10种细菌UMP激酶(pyrH)中高度保守(参见图6)。对晶体不对称单元中的八个分子的构象进行比较,证明某些包围所提出的UMP结合位点的二级结构元件即螺旋B(残基60-65)和其后连接螺旋B和螺旋C的环(αB-αC)(残基66-69)的位置具有柔性。有可能UMP结合得到这些柔性区域的构象变化的配合,因此UMP的结合可能受别构调节物在别构结合位点的结合的影响。已证明所提出的结合位点当中的残基突变会降低催化作用的速度,这进一步证实了所提出的UMP结合位点。这些突变在大肠杆菌pyrH中是Arg62His、Asp73Asn和Asp142Asn(Bucurenci等,1998,出处同上)。在流感嗜血杆菌pyrH中对应的残基是Arg58、Asp73和Asp142。因此,所提出的pyrH UMP结合位点的最低限度定义包含SEQ ID NO14的残基Gly52、Gly53、Asp73、Gly76、Met77、Thr134、Asn136、Pro137、Phe139、Thr141和Thr144,更为扩大的定义包含SEQ ID NO14的残基Ser13、Gly14、Gly52、Gly53、Gly54、Gly72、Asp73、His74、Gly76、Met77、Thr80、Gly133、Thr134、Asn136、Pro137、Phe138、Phe139和Thr140,使用8测头半径得到的的还更为扩大的定义包含SEQ ID NO14的残基Lys11、Leu12、Ser13、Gly14、Glu15、Val50、Leu51、Gly52、Gly53、Gly54、Asn55、Phe57、Arg58、Gly59、Arg69、Val70、Val71、Gly72、Asp73、His74、Met75、Gly76、Met77、Leu78、Ala79、Thr80、Asn83、Ala103、Phe104、Ser131、Ala132、Gly133、Thr134、Gly135、Asn136、Pro137、Phe138、Phe139、Thr140、Thr141、Asp142、Ser143、Thr144、Ala145、Leu147和Arg148。
实施例7流感嗜血杆菌PyrH的核磁共振波谱学研究核磁共振(NMR)波谱学提供了在氨基酸水平上监测溶液中蛋白质的结构和构象的方法。波谱中信号的位置对氨基酸的环境极其敏感,可将这些信号位置的变化与蛋白质和另一个分子之间的相互作用关联起来。
对流感嗜血杆菌pyrH的NMR波谱学实验是在装备有三共振(1H/13C/15N)单梯度5mm冷探头的Bruker Avance 600MHz系统上在298K下进行的。蛋白质用2H、15N和13C作三重标记,并于缓冲液B(50mM Tris/HCl,pH 8.0,2mM EDTA,2mM UTP,150mM NaCl和2mM DTT)中提供。在进行HNMR波谱学实验之前,先用Millipore的Amicon Ultra-15离心过滤装置(Billerica,MA,USA)将蛋白质样品充分透析到NMR缓冲液(50mM HEPES,pH 7.8,1mM DTT和1mMUTP或1mM GTP)中。蛋白质单体浓度是0.4mM。TROSY-HSQC(Pervushin等,J.Biomol.NMR,12345-348,1998)实验以85毫秒的质子维度演化时间(evolution time)和32毫秒的氮维度演化时间进行记录。总取数据时间是15小时。数据集用nmrPipe程序(Delaglio等,J.Biomol.NMR,6277-293,1995)进行处理,用SPARKY程序(Goddard和Kneller,美国加州大学旧金山分校)进行分析。
用这个方案获得的流感嗜血杆菌pyrH的波谱的质量非常高,这样大小的蛋白质的预期峰数是明显的。这个测定对于检测NMR缓冲液中UTP被GTP替换时蛋白质环境的变化来说是足够灵敏的。因此,NMR可用来确认旨在发现pyrH特异性抑制剂的高通量和虚拟筛选活动的命中结果(hit)。此外,NMR可与高分辨率X射线数据组合用于基于结构的药物设计中。NMR可用来确认抑制剂与pyrH的结合。
上述实施例意在说明本发明,不应被解释为以任何方式限制本发明。本领域技术人员应了解落入本发明精神和范围内的修改方案。
序列表<110>AstraZeneca AB<120>激酶的晶体结构及其应用<130>101364<150>US 60/601,765<151>2004-08-16<160>14<170>PatentIn version 3.3<210>1<211>237<212>PRT<213>肺炎链球菌(Streptococcus pneumoniae)<400>1Met Ala Asn Pro Lys Tyr Lys Arg Ile Leu Ile Lys Leu Ser Gly Glu1 5 10 15Ala Leu Ala Gly Glu Arg Gly Val Gly Ile Asp Ile Gln Thr Val Gln20 25 30Thr Ile Ala Lys Glu Ile Gln Glu Val His Ser Leu Gly Ile Glu Ile35 40 45Ala Leu Val Ile Gly Gly Gly Asn Leu Trp Arg Gly Glu Pro Ala Ala50 55 60Glu Ala Gly Met Asp Arg Val Gln Ala Asp Tyr Thr Gly Met Leu Gly65 70 75 80Thr Val Met Asn Ala Leu Val Met Ala Asp Ser Leu Gln Gln Val Gly85 90 95Val Asp Thr Arg Val Gln Thr Ala Ile Ala Met Gln Gln Val Ala Glu100 105 110
Pro Tyr Val Arg Gly Arg Ala Leu Arg His Leu Glu Lys Gly Arg Ile115 120 125Val Ile Phe Gly Ala Gly Ile Gly Ser Pro Tyr Phe Ser Thr Asp Thr130 135 140Thr Ala Ala Leu Arg Ala Ala Glu Ile Glu Ala Asp Ala Ile Leu Met145 150 155 160Ala Lys Asn Gly Val Asp Gly Val Tyr Asn Ala Asp Pro Lys Lys Asp165 170 175Lys Thr Ala Val Lys Phe Glu Glu Leu Thr His Arg Asp Val Ile Asn180 185 190Lys Gly Leu Arg Ile Met Asp Ser Thr Ala Ser Thr Leu Ser Met Asp195 200 205Asn Asp Ile Asp Leu Val Val Phe Asn Met Asn Gln Ser Gly Asn Ile210 215 220Lys Arg Val Val Phe Gly Glu Asn Ile Gly Thr Thr Val225 230 235<210>2<211>238<212>PRT<213>酿脓链球菌(Streptococcus pyogenes)<400>2Glu Pro Lys Tyr Gln Arg Ile Leu Ile Lys Leu Ser Gly Glu Ala Leu1 5 10 15Ala Gly Glu Lys Gly Val Gly Ile Asp Ile Pro Thr Val Gln Ala Ile20 25 30
Ala Lys Glu Ile Ala Glu Val His Val Ser Gly Val Gln Ile Ala Leu35 40 45Val Ile Gly Gly Gly Asn Leu Trp Arg Gly Glu Pro Ala Ala Asp Ala50 55 60Gly Met Asp Arg Val Gln Ala Asp Tyr Thr Gly Met Leu Gly Thr Val65 70 75 80Met Asn Ala Leu Val Met Ala Asp Ser Leu Gln His Tyr Gly Val Asp85 90 95Thr Arg Val Gln Thr Ala Ile Pro Met Gln Asn Val Ala Glu Pro Tyr100 105 110Ile Arg Gly Arg Ala Leu Arg His Leu Glu Lys Asn Arg Ile Val Val115 120 125Phe Gly Ala Gly Ile Gly Ser Pro Tyr Phe Ser Thr Asp Thr Thr Ala130 135 140Ala Leu Arg Ala Ala Glu Ile Glu Ala Asp Ala Ile Leu Met Ala Lys145 150 155 160Asn Gly Val Asp Gly Val Tyr Asn Ala Asp Pro Lys Lys Asp Ala Asn165 170 175Ala Val Lys Phe Asp Glu Leu Thr His Gly Glu Val Ile Lys Arg Gly180 185 190Leu Lys Ile Met Asp Ala Thr Ala Ser Thr Leu Ser Met Asp Asn Asp195 200 205Ile Asp Leu Val Val Phe Asn Met Asn Glu Ala Gly Asn Ile Gln Arg210 215 220Val Val Phe Gly Glu His Ile Gly Thr Thr Val Ser Asn Lys
225 230 235<210>3<211>233<212>PRT<213>金黄色葡萄球菌(Staphylococcus aureus)<400>3Lys Tyr Lys Arg Val Val Leu Lys Leu Ser Gly Glu Ala Leu Ala Gly1 5 10 15Glu Lys Gly Phe Gly Ile Asn Pro Val Ile Ile Lys Ser Val Ala Glu20 25 30Gln Val Ala Glu Val Ala Lys Met Asp Cys Glu Ile Ala Val Ile Val35 40 45Gly Gly Gly Asn Ile Trp Arg Gly Lys Thr Gly Ser Asp Leu Gly Met50 55 60Asp Arg Gly Thr Ala Asp Tyr Met Gly Met Leu Ala Thr Val Met Asn65 70 75 80Ala Leu Ala Leu Gln Asp Ser Leu Glu Gln Leu Asp Cys Asp Thr Arg85 90 95Val Leu Thr Ser Ile Glu Met Lys Gln Val Ala Glu Pro Tyr Ile Arg100 105 110Arg Arg Ala Ile Arg His Leu Glu Lys Lys Arg Val Val Ile Phe Ala115 120 125Ala Gly Ile Gly Asn Pro Tyr Phe Ser Thr Asp Thr Thr Ala Ala Leu130 135 140Arg Ala Ala Glu Val Glu Ala Asp Val Ile Leu Met Gly Lys Asn Asn145 150 155 160
Val Asp Gly Val Tyr Ser Ala Asp Pro Lys Val Asn Lys Asp Ala Val165 170 175Lys Tyr Glu His Leu Thr His Ile Gln Met Leu Gln Glu Gly Leu Gln180 185 190Val Met Asp Ser Thr Ala Ser Ser Phe Cys Met Asp Asn Asn Ile Pro195 200 205Leu Thr Val Phe Ser Ile Met Glu Glu Gly Asn Ile Lys Arg Ala Val210 215 220Met Gly Glu Lys Ile Gly Thr Leu Ile225 230<210>4<211>240<212>PRT<213>表皮葡萄球菌(Staphylococcus epidermidis)<400>4Met Ala Gln Thr Ser Lys Tyr Lys Arg Val Val Leu Lys Leu Ser Gly1 5 10 15Glu Ala Leu Ala Gly Asp Lys Gly Phe Gly Ile Asn Pro Ile Ile Ile20 25 30Lys Ser Val Ala Gln Gln Val Ala Glu Val Ala Lys Met Asp Cys Glu35 40 45Ile Ala Val Ile Val Gly Gly Gly Asn Ile Trp Arg Gly Lys Thr Gly50 55 60Ser Asp Leu Gly Met Asp Arg Gly Thr Ala Asp Tyr Met Gly Met Leu65 70 75 80Ala Thr Val Met Asn Ala Leu Ala Leu Gln Asp Ser Leu Glu Gln Leu
85 90 95Asp Cys Asp Thr Arg Val Leu Thr Ser Ile Glu Met Lys Gln Val Ala100 105 110Glu Pro Tyr Ile Arg Arg Arg Ala Ile Arg His Leu Glu Lys Lys Arg115 120 125Val Val Ile Phe Ala Ala Gly Ile Gly Asn Pro Tyr Phe Ser Thr Asp130 135 140Thr Thr Ala Ala Leu Arg Ala Ala Glu Val Glu Ala Asp Val Ile Leu145 150 155 160Met Gly Lys Asn Asn Val Asp Gly Val Tyr Ser Ala Asp Pro Lys Val165 170 175Asp Ala Asn Ala Ile Lys Tyr Glu His Leu Thr His Ile Gln Met Leu180 185 190Gln Glu Gly Leu Gln Val Met Asp Ser Thr Ala Ser Ser Phe Cys Met195 200 205Asp Asn Asn Ile Pro Leu Asn Val Phe Ser Ile Met Glu Glu Gly Asn210 215 220Ile Lys Arg Ala Val Met Gly Glu Lys Ile Gly Thr Leu Ile Thr Lys225 230 235 240<210>5<211>240<212>PRT<213>枯草芽胞杆菌(Bacillus subtilis)<400>5Met Glu Lys Pro Lys Tyr Lys Arg Ile Val Leu Lys Leu Ser Gly Glu1 5 10 15
Ala Leu Ala Gly Glu Gln Gly Asn Gly Ile Asn Pro Thr Val Ile Gln20 25 30Ser Ile Ala Lys Gln Val Lys Glu Ile Ala Glu Leu Glu Val Glu Val35 40 45Ala Val Val Val Gly Gly Gly Asn Tyr Gly Ala Glu Lys Thr Gly Ser50 55 60Asp Leu Gly Met Asp Arg Ala Thr Ala Asp Tyr Met Gly Met Leu Ala65 70 75 80Thr Val Met Asn Ser Leu Ala Leu Gln Asp Ser Leu Glu Thr Leu Gly85 90 95Ile Gln Ser Arg Val Gln Thr Ser Ile Glu Met Arg Gln Val Ala Glu100 105 110Pro Tyr Ile Arg Arg Lys Ala Ile Arg His Leu Glu Lys Lys Arg Val115 120 125Val Ile Phe Ala Ala Gly Thr Gly Asn Pro Tyr Phe Ser Thr Asp Thr130 135 140Thr Ala Ala Leu Arg Ala Ala Glu Ile Glu Ala Asp Val Ile Leu Met145 150 155 160Ala Lys Asn Asn Val Asp Gly Val Tyr Asn Ala Asp Pro Arg Lys Asp165 170 175Glu Ser Ala Val Lys Tyr Glu Ser Leu Ser Tyr Leu Asp Val Leu Lys180 185 190Asp Gly Leu Glu Val Met Asp Ser Thr Ala Ser Ser Leu Cys Met Asp195 200 205
Asn Asp Ile Pro Leu Ile Val Phe Ser Ile Met Glu Glu Gly Asn Ile210 215 220Lys Arg Ala Val Ile Gly Glu Ser Ile Gly Thr Ile Val Arg Gly Lys225 230 235 240<210>6<211>239<212>PRT<213>脑膜炎奈瑟氏菌(Neisseria meningitides)<400>6Met Thr Gln Gln Ile Lys Tyr Lys Arg Val Leu Leu Lys Leu Ser Gly1 5 10 15Glu Ser Leu Met Gly Ser Asp Pro Phe Gly Ile Asn His Asp Thr Ile20 25 30Val Gln Thr Val Gly Glu Ile Ala Glu Val Val Lys Met Gly Val Gln35 40 45Val Gly Ile Val Val Gly Gly Gly Asn Ile Phe Arg Gly Val Ser Ala50 55 60Gln Ala Gly Ser Met Asp Arg Ala Thr Ala Asp Tyr Met Gly Met Met65 70 75 80Ala Thr Val Met Asn Ala Leu Ala Leu Lys Asp Ala Phe Glu Thr Leu85 90 95Gly Ile Lys Ala Arg Val Gln Ser Ala Leu Ser Met Gln Gln Ile Ala100 105 110Glu Thr Tyr Ala Arg Pro Lys Ala Ile Gln Tyr Leu Glu Glu Gly Lys115 120 125Val Val Ile Phe Ala Ala Gly Thr Gly Asn Pro Phe Phe Thr Thr Asp130 135 140
Thr Ala Ala Ala Leu Arg Gly Ala Glu Met Asn Cys Asp Val Met Leu145 150 155 160Lys Ala Thr Asn Val Asp Gly Val Tyr Thr Ala Asp Pro Lys Lys Asp165 170 175Pro Ser Ala Thr Arg Tyr Glu Thr Ile Thr Phe Asp Glu Ala Leu Leu180 185 190Lys Asn Leu Lys Val Met Asp Ala Thr Ala Phe Ala Leu Cys Arg Glu195 200 205Arg Lys Leu Asn Ile Val Val Phe Gly Ile Ala Lys Glu Gly Ser Leu210 215 220Lys Arg Val Ile Thr Gly Glu Asp Glu Gly Thr Leu Val His Cys225 230 235<210>7<211>241<212>PRT<213>大肠杆菌(Escherichia coli)<400>7Met Ala Thr Asn Ala Lys Pro Val Tyr Lys Arg Ile Leu Leu Lys Leu1 5 10 15Ser Gly Glu Ala Leu Gln Gly Thr Glu Gly Phe Gly Ile Asp Ala Ser20 25 30Ile Leu Asp Arg Met Ala Gln Glu Ile Lys Glu Leu Val Glu Leu Gly35 40 45Ile Gln Val Gly Val Val Ile Gly Gly Gly Asn Leu Phe Arg Gly Ala50 55 60
Gly Leu Ala Lys Ala Gly Met Asn Arg Val Val Gly Asp His Met Gly65 70 75 80Met Leu Ala Thr Val Met Asn Gly Leu Ala Met Arg Asp Ala Leu His85 90 95Arg Ala Tyr Val Asn Ala Arg Leu Met Ser Ala Ile Pro Leu Asn Gly100 105 110Val Cys Asp Ser Tyr Ser Trp Ala Glu Ala Ile Ser Leu Leu Arg Asn115 120 125Asn Arg Val Val Ile Leu Ser Ala Gly Thr Gly Asn Pro Phe Phe Thr130 135 140Thr Asp Ser Ala Ala Cys Leu Arg Gly Ile Glu Ile Glu Ala Asp Val145 150 155 160Val Leu Lys Ala Thr Lys Val Asp Gly Val Phe Thr Ala Asp Pro Ala165 170 175Lys Asp Pro Thr Ala Thr Met Tyr Glu Gln Leu Thr Tyr Ser Glu Val180 185 190Leu Glu Lys Glu Leu Lys Val Met Asp Leu Ala Ala Phe Thr Leu Ala195 200 205Arg Asp His Lys Leu Pro Ile Arg Val Phe Asn Met Asn Lys Pro Gly210 215 220Ala Leu Arg Arg Val Val Met Gly Glu Lys Glu Gly Thr Leu Ile Thr225 230 235 240Glu<210>8
<211>237<212>PRT<213>流感嗜血杆菌(Haemophilus influenzae)<400>8Met Ser Gln Pro Ile Tyr Lys Arg Ile Leu Leu Lys Leu Ser Gly Glu1 5 10 15Ala Leu Gln Gly Glu Asp Gly Leu Gly Ile Asp Pro Ala Ile Leu Asp20 25 30Arg Met Ala Val Glu Ile Lys Glu Leu Val Glu Met Gly Val Glu Val35 40 45Ser Val Val Leu Gly Gly Gly Asn Leu Phe Arg Gly Ala Lys Leu Ala50 55 60Lys Ala Gly Met Asn Arg Val Val Gly Asp His Met Gly Met Leu Ala65 70 75 80Thr Val Met Asn Gly Leu Ala Met Arg Asp Ser Leu Phe Arg Ala Asp85 90 95Val Asn Ala Lys Leu Met Ser Ala Phe G1n Leu Asn Gly Ile Cys Asp100 105 110Thr Tyr Asn Trp Ser Glu Ala Ile Lys Met Leu Arg Glu Lys Arg Val115 120 125Val Ile Phe Ser Ala Gly Thr Gly Asn Pro Phe Phe Thr Thr Asp Ser130 135 140Thr Ala Cys Leu Arg Gly Ile Glu Ile Glu Ala Asp Val Val Leu Lys145 150 155 160Ala Thr Lys Val Asp Gly Val Tyr Asp Cys Asp Pro Ala Lys Asn Pro165 170 175
Asp Ala Lys Leu Tyr Lys Asn Leu Ser Tyr Ala Glu Val Ile Asp Lys180 185 190Glu Leu Lys Val Met Asp Leu Ser Ala Phe Thr Leu Ala Arg Asp His195 200 205Gly Met Pro Ile Arg Val Phe Asn Met Gly Lys Pro Gly Ala Leu Arg210 215 220Gln Val Val Thr Gly Thr Glu Glu Gly Thr Thr Ile Cys225 230 235<210>9<211>248<212>PRT<213>肺炎衣原体(Chlamydia pneumoniae)<400>9Met Ala Lys Gln Thr Arg Arg Val Leu Phe Lys Ile Ser Gly Glu Ala1 5 10 15Leu Ser Lys Asp Ser Ser Asn Arg Ile Asp Glu Met Arg Leu Ser Arg20 25 30Leu Val Ser Glu Leu Arg Ala Val Arg Asn Asn Asp Ile Glu Ile Ala35 40 45Leu Val Ile Gly Gly Gly Asn Ile Leu Arg Gly Leu Ala Glu Gln Lys50 55 60Glu Leu Gln Ile Asn Arg Val Ser Ala Asp Gln Met Gly Met Leu Ala65 70 75 80Thr Leu Ile Asn Gly Met Ala Val Ala Asp Ala Leu Lys Ala Glu Asp85 90 95Ile Pro Cys Leu Leu Thr Ser Thr Leu Ser Cys Pro Gln Leu Ala Asp
100 105 110Leu Tyr Thr Pro Gln Lys Ser Ile Glu Ala Leu Asp Gln Gly Lys Ile115 120 125Leu Ile Cys Thr Thr Gly Ala Gly Ser Pro Tyr Leu Thr Thr Asp Thr130 135 140Gly Ala Ala Leu Arg Ala Cys Glu Leu Asn Val Asp Val Leu Ile Lys145 150 155 160Ala Thr Met His Val Asp Gly Val Tyr Asp Lys Asp Pro Arg Leu Phe165 170 175Pro Asp Ala Val Lys Tyr Asp Phe Val Ser Tyr Lys Asp Phe Leu Ser180 185 190Asn Gln Leu Gly Val Met Asp Ala Ser Ala Ile Ser Leu Cys Met Asp195 200 205Ser His Ile Pro Ile Arg Val Phe Ser Phe Leu Gln His Ser Leu Glu210 215 220Lys Ala Leu Phe Asp Pro Thr Ile Gly Thr Leu Val Ser Glu Asp Val225 230 235 240Asn His Val Cys Ser Pro Arg His245<210>10<211>235<212>PRT<213>肺炎支原体(Mycoplasma pneumoniae)<400>10Met Arg Leu Lys Ile Leu Ile Lys Leu Ser Gly Ala Gly Met Ser Ala1 5 10 15
Asp Ser Ser Glu Pro Phe Ser Asn Gln Phe Leu Glu Thr Val Ile Ala20 25 30Gln Leu Lys Gln Leu Val Pro Asn Tyr Gln Ile Gly Ile Val Ile Gly35 40 45Gly Gly Asn Ile Met Arg Gly Lys Ser Cys Ser Asp Tyr Asn Ile Thr50 55 60Glu Ile Ala Gly His His Leu Gly Ile Met Ala Thr Val Ile Asn Gly65 70 75 80Ala Phe Leu Lys Ala Lys Phe Asp Ser His Lys Leu Asn Ser Thr Leu85 90 95Leu Ser Ala Val Ser Cys Pro Ser Leu Ala Thr His Ile Val Ser Gln100 105 110Thr Thr Ile Asp Asp Ala Phe Lys Asn His Asp Ile Val Ile Phe Ala115 120 125Gly Gly Thr Gly Asn Pro Tyr Phe Ser Thr Asp Thr Ala Val Ala Leu130 135 140Arg Ala Thr Gln Met Gln Ala Asp Ile Ile Leu Ile Gly Lys Asn Gly145 150 155 160Val Asp Gly Val Tyr Thr Ala Asp Pro Lys Lys Asp Lys His Ala Lys165 170 175Phe Leu Ala Ser Leu Thr Tyr Ala Glu Ala Ile Lys Asn Asp Leu Gln180 185 190Ile Met Asp Ile Thr Ala Phe Thr Met Cys Lys Glu Asn Asn Leu Lys195 200 205
Val Ile Ile Phe Asn Ile Asn Ala Glu His Ala Ile Ile Lys Ala Leu210 215 220Ser Lys Gln Gly Lys Tyr Thr Leu Ile Glu Lys225 230 235<210>11<211>32<212>DNA<213>人工<220>
<223>引物1<400>11gaaaaaacca tgggccaacc aatttataaa cg 32<210>12<211>34<212>DNA<213>人工<220>
<223>引物2<400>12ttcttgtcga cattcactaa caaatagtgg tgcc34<210>13<211>714<212>DNA<213>流感嗜血杆菌(Haemophilus influenzae)<400>13atgggccaac caatttataa acgtatttta ttgaaattaa gcggtgaagc attacaagga 60gaagatggtc ttggtatcga tcctgcgatt ctcgatcgta tggctgttga aattaaagaa 120ttagtggaga tgggtgtgga agtcagtgtc gttctcggtg gtggcaactt attccgtggc 180gcaaaactag caaaagcggg gatgaatcgc gtggtgggcg atcatatggg aatgcttgct 240actgtgatga atggtttggc aatgcgtgat tctttattcc gtgctgatgt gaacgcaaaa 300ttaatgtccg ctttccaatt aaatggtatt tgcgatactt ataactggtc tgaagctatc 360
aaaatgttac gcgaaaaacg cgtagtcatt ttctctgcgg gaacgggaaa tccattcttt 420accactgatt ctaccgcttg tttgcgtggt attgaaattg aagctgatgt tgtgttgaaa 480gcgactaaag ttgatggtgt gtatgattgt gatcctgcga aaaatcctga tgcaaaactt 540tataaaaatt taagttatgc agaagtgatc gataaagaat taaaagtgat ggacttatcg 600gcgtttactt tagctcgcga tcatggcatg ccgattagag tgttcaatat gggtaaacct 660ggagcattac gtcaagtagt gactggtact gaagaaggca ccactatttg ttag714<210>14<211>237<212>PRT<213>流感嗜血杆菌(Haemophilus influenzae)<400>14Met Gly Gln Pro Ile Tyr Lys Arg Ile Leu Leu Lys Leu Ser Gly Glu1 5 10 15Ala Leu Gln Gly Glu Asp Gly Leu Gly Ile Asp Pro Ala Ile Leu Asp20 25 30Arg Met Ala Val Glu Ile Lys Glu Leu Val Glu Met Gly Val Glu Val35 40 45Ser Val Val Leu Gly Gly Gly Asn Leu Phe Arg Gly Ala Lys Leu Ala50 55 60Lys Ala Gly Met Asn Arg Val Val Gly Asp His Met Gly Met Leu Ala65 70 75 80Thr Val Met Asn Gly Leu Ala Met Arg Asp Ser Leu Phe Arg Ala Asp85 90 95Val Asn Ala Lys Leu Met Ser Ala Phe Gln Leu Asn Gly Ile Cys Asp100 105 110
Thr Tyr Asn Trp Ser Glu Ala Ile Lys Met Leu Arg Glu Lys Arg Val115 120 125Val Ile Phe Ser Ala Gly Thr Gly Asn Pro Phe Phe Thr Thr Asp Ser130 135 140Thr Ala Cys Leu Arg Gly Ile Glu Ile Glu Ala Asp Val Val Leu Lys145 150 155 160Ala Thr Lys Val Asp Gly Val Tyr Asp Cys Asp Pro Ala Lys Asn Pro165 170 175Asp Ala Lys Leu Tyr Lys Asn Leu Ser Tyr Ala Glu ValIle Asp Lys180 185 190Glu Leu Lys Val Met Asp Leu Ser Ala Phe Thr Leu Ala Arg Asp His195 200 205Gly Met Pro Ile Arg Val Phe Asn Met Gly Lys Pro Gly Ala Leu Arg210 215 220Gln Val Val Thr Gly Thr Glu Glu Gly Thr Thr Ile Cys225 230 23权利要求
1.一种pyrH的晶体。
2.一种与别构调节物复合的pyrH的晶体。
3.权利要求2的晶体,其中所述晶体进一步与磷酸根复合。
4.一种与底物复合的pyrH的晶体。
5.权利要求4的晶体,其中所述底物是ATP。
6.权利要求1-5中任一项的晶体,其中所述pyrH来自细菌。
7.权利要求6的晶体,其中所述pyrH来自流感嗜血杆菌(Haemophilus influenzae)。
8.权利要求2的晶体,其中所述别构调节物在包含SEQ ID NO14的氨基酸残基Arg7、Gly66、Met67、Asn68、Arg69、Val70、Val71、G1y72、His74、G1y84、Leu85、Ala86、Met87、Arg88、Asp89、Ser90、Leu91、Phe92、Arg93、Asp95、Val96、Asn97、Ala98、Lys99、Leu100、Met101、Ile109、Cys110、Asp111、Asn114、Trp115、Ser116、Glu117、Ala118、Ile119、Lys120、Met121、Arg123、Glu124、Arg126、Val127、Ile129、Glu151、Ile152和Glu153的全部或任何组合的结合位点结合。
9.权利要求4的晶体,其中所述底物在包含SEQ ID NO14的氨基酸残基Lys11、Leu12、Ser13、Gly14、Glu15、Ala16、Leu17、Val50、Leu51、Gly52、Gly53、Gly54、Asn55、Arg58、Thr80、Asn83、Thr140、Thr141、Asp142、Ser143、Ala145、Lys159、Ala160、Thr161、Lys162、Val163、Gly165、Val166、Tyr167、Asp168、Cys169、Asp170、Pro171、Lys173、Asp174、Ala177、Lys178、Tyr180、Lys191、Glu192、Leu193、Lys194、Val195、Met196、Asp197、Val213和Phe214的全部或任何组合的结合位点结合。
10.权利要求4的晶体,其中所述底物在包含SEQ ID NO14的氨基酸残基Lys11、Leu12、Ser13、Gly14、Glu15、Val50、Leu51、Gly52、Gly53、Gly54、Asn55、Phe57、Arg58、Gly59、Arg69、Val70、Val71、Gly72、Asp73、His74、Met75、Gly76、Met77、Leu78、Ala79、Thr80、Asn83、Ala103、Phe104、Ser131、Ala132、Gly133、Thr134、Gly135、Asn136、Pro137、Phe138、Phe139、Thr140、Thr141、Asp142、Ser143、Thr144、Ala145、Leu147和Arg148的全部或任何组合的结合位点结合。
11.权利要求4的晶体,其中所述底物在包含SEQ ID NO14的氨基酸残基Lys11、Leu12、Ser13、Gly14、Glu15、Ala16、Leu17、Val50、Leu51、Gly52、Gly53、Gly54、Asn55、Phe57、Arg58、Gly59、Arg69、Val70、Val71、Gly72、Asp73、His74、Met75、Gly76、Met77、Leu78、Ala79、Thr80、Asn83、Ala103、Phe104、Ser131、Ala132、Gly133、Thr134、Gly135、Asn136、Pro137、Phe138、Phe139、Thr140、Thr141、Asp142、Ser143、Thr144、Ala145、Leu147、Arg148、Lys159、Ala160、Thr161、Lys162、Val163、Gly165、Val166、Tyr167、Asp168、Cys169、Asp170、Pro171、Lys173、Asp174、Ala177、Lys178、Tyr180、Lys191、Glu192、Leu193、Lys194、Val195、Met196、Asp197、Val213和Phe214的全部或任何组合的结合位点结合。
12.权利要求4的晶体,其中所述底物在包含SEQ ID NO14的氨基酸残基Lys11、Ser13、Gly14、Glu15、Gly52、Gly53、Gly54、Thr141和Asp142的全部或任何组合的结合位点结合。
13.权利要求1的晶体,其中所述晶体包含三个二聚体,每个二聚体包含分子间二聚体界面,所述界面包含SEQ ID NO14的氨基酸残基Ile25、Pro27、Leu30、Asp31、Phe57、Lys61、Leu62、Ala65、Gly66、Met67、Asn68、Arg69、Val71、His74、Met75、Gly76、Leu78、Ala79、Val81、Met82、Leu85、Ala86、Arg87、Asp88、Arg89、Phe104、Gln105、Leu106、Asn107、Gly108和Ile109的全部或任何组合。
14.一种鉴定结合pyrH的分子的方法,所述方法包括a)将三维分子建模算法应用于pyrH的原子坐标;b)以电子方式针对pyrH的原子坐标筛选所储存的一组候选化合物的原子坐标,以鉴定结合pyrH的化合物。
15.权利要求14的方法,其中所述原子坐标是pyrH的分子界面的原子坐标。
16.权利要求14的方法,其中所述原子坐标在图7中给出。
17.一种鉴定作为pyrH抑制剂的物质的计算机辅助方法,所述方法包括(a)向计算机建模应用程序提供pyrH晶体的一组原子坐标;(b)向计算机建模应用程序提供待评估物质的一组原子坐标,以确定其是否结合pyrH的分子界面;(c)对两组原子坐标进行比较;(d)确定该物质是否预期结合pyrH;其中如果该物质预期结合pyrH,则该物质是pyrH的抑制剂。
18.权利要求17的方法,其中所述原子坐标组在图7中给出。
16.一种设计pyrH活性抑制剂的计算机辅助方法,所述方法包括(a)向计算机建模应用程序提供pyrH的一组原子坐标;(b)用计算方法建立由一组原子坐标代表的物质;(c)确定该物质是否预期结合pyrH,其中如果该物质预期结合pyrH,则该物质是pyrH的抑制剂。
19.权利要求18的方法,其中所述原子坐标组在图7中给出。
20.一种鉴定作为pyrH别构调节物的物质的计算机辅助方法,所述方法包括(a)向计算机建模应用程序提供pyrH晶体或其别构调节物结合位点的一组原子坐标;(b)向计算机建模应用程序提供待评估物质的一组原子坐标,以确定其是否结合pyrH的分子界面;(c)对两组原子坐标进行比较;(d)确定该物质是否预期结合pyrH;其中如果该物质预期结合pyrH的别构调节物结合位点,则该物质是pyrH的别构调节物。
21.权利要求20的计算机辅助方法,其中所述原子坐标组在图7中给出。
22.一种获得未知结构的分子或分子复合物的结构信息的方法,所述方法使用图7给出的原子坐标,包括以下步骤a)从结晶的分子或分子复合物产生X射线衍射数据;b)将图7给出的原子坐标的至少一部分与X射线衍射数据组合使用,产生分子或分子复合物的至少一部分的三维电子密度图;c)使用图7给出的原子坐标的全部或一部分,并任选与三维电子密度图组合,产生所述分子或分子复合物的模型。
23.一种获得pyrH活性测试抑制剂或别构调节物的结合位点的结构信息的方法,所述方法包括以下步骤a)分析抑制剂与同位素标记pyrH蛋白的样品的组合所导致的NMR化学位移变化;b)将产生这些变化的残基映射到图7给出的原子坐标上,其中预期这些残基界定抑制剂或调节物结合位点。
全文摘要
本发明涉及UMP激酶的晶体以及筛选、鉴定和设计UMP激酶的抑制剂和别构调节物的计算机辅助方法。
文档编号G06F19/00GK101048499SQ200580035167
公开日2007年10月3日 申请日期2005年8月15日 优先权日2004年8月16日
发明者J·布里德, P·多伊格, C·埃弗曼, R·鲍普蒂特, J·图克克 申请人:阿斯利康(瑞典)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1