人可溶性腺苷酸环化酶的晶体结构的制作方法

文档序号:432285阅读:1459来源:国知局

专利名称::人可溶性腺苷酸环化酶的晶体结构的制作方法
技术领域
:本发明涉及人可溶性腺苷酸环化酶(solubleadenylatecyclase,solAC)的催化结构域、其结晶方法、solAC的晶体及其三维结构、在存在配体的情况下solAC的晶体、及其用途。
背景技术
:腺苷酸环化酶环磷酸腺苷(Cyclicadenosine3’,5’-monophosphate,cAMP)是一种遍在性第二信使,其调节多种重要的生理学过程,包括基因表达、细胞生长、心脏功能、染色体分离和细胞代谢(Robison,G.A.Butcher,R.W.andSutherland,E.W.(1968)Annu.Rev.Biochem.37,149-174;Rodbell,M.(1980)Nature,284,17-22)。其通过6种不同家族的酶自ATP合成而来,其中之一是腺苷酸环化酶或腺苷酰环化酶(AC)。尽管这些家族都能够自ATP产生cAMP,但它们之间没有序列相似性。I类存在于肠道细菌中并调节代谢物抑制,而II类存在于病原体如炭疽杆菌(Bacillusanthracis)、铜绿假单胞菌Pseudomonasaeruginosa)和百日咳博得特氏菌(Bordetellapertusis)中。IV、V和VI类分别存在于嗜水气单胞菌(Aeromonashydrohila)、栖瘤胃普雷沃氏菌(Prevotellaruminicola)和艾特利根瘤菌(Rhhizobiumetil)。III类环化酶也称为通用类型,是唯一既见于真核细胞也存在于细菌和古细菌中的类型。哺乳动物细胞表达两种不同类型的这些酶已经被充分表征的跨膜腺苷酸环化酶(tmAC)和最近才发现的可溶性腺苷酸环化酶(solAC)(Shenoy,A.V.andVisweswariah,S.S(2004)FEBSLett.561,11-21)。tmAC是质膜结合蛋白质。所有9个被鉴定的tmAC异构体(I-IX)均被激素和神经递质刺激并被Gs蛋白的α亚基活化,且除了IX型以外,均被二萜类福司柯林(forskolin)刺激。通过它们对Gi、Go和Gzα-亚基以及Gβ,γ亚基、PKC和Ca2+/钙调蛋白的不同应答可对它们加以区分。正是这种调节多样性使得不同的tmAC在细胞内正确地应答于来自神经递质和激素的细胞间信号。tmAC类具有的共同结构的组成为一个短的细胞质N-末端,随后为疏水性区域串联重复,其通常为6个跨膜螺旋的形式,以及一细胞浆区域。两个细胞浆结构域分别称为C1和C2,它们之间(~50%相同性)以及与tmAC家族的9种不同成员之间(~50-90%相同性)具有很大程度的同源性。酶活性需要C1和C2结合形成互补的异二聚体。由于难以纯化到具有活性的蛋白质,在很长的时间内一直不知道这些酶的机制和调节的生物化学特征。一个重要的突破来自于开发了可溶性tmAC系统,其中细胞浆结构域的节段被独立地表达为可溶性重组蛋白。在体外,C1和C2均倾向于以头尾界面发生自结合,产生无活性的(C1)和低活性的(C2)同二聚体,但当它们混合后产生具有完全活性的、保留其调节特性的异二聚体。因此,C2同二聚体和CiC2异二聚体应答于福司柯林刺激,而C1同二聚体是无活性的。可溶性tmAC系统使得能够对酶进行X线晶体研究,由此得知了与牛Gsα形成复合物的大鼠II型C2同二聚体和犬V型C1/大鼠II型C2异二聚体的结构(Zhang,G.Liu,Y.Ruoho,A.E.andHurley,J.H.(1997)Nature,386,247-253;Tesmer,J.J.G,Sunahara,R.K.Gilman,A.G.andSprang,S.R.(1997)Science278,1907-1916;Tesmer,J.J.G,Sunahara,R.K.Johnson,R.A.Gosselin,G.Gilman,A.G.andSprang,S.R(1999)Science,285,756-760)。此类系统的构建一直很困难,其中主要的挑战之一是确定C1和C2构建体的起始点。尽管该家族之间具有显著的序列同源性,且仅仅基于序列同源性的构建体设计是一个有用的起始点,但要获得对蛋白酶裂解作用具有稳定性的、可溶性的和功能性的蛋白质绝不仅仅是常规的工作(Beeler,J.A.andTang,W-J.(2004)MethodsinMol.Biol,237,39-53)。可溶性腺苷酸环化酶功能、表征和纯化最早于1975年报道,在来自大鼠睾丸的细胞质级分中存在新的可溶形式的腺苷酸环化酶(“solAC”)。其与tmAC类不同的是,其对Mn2+离子存在特异性的需求,且其活性不受黄体生成素(LH)或卵泡刺激素(FSH)的刺激(Braun,T.andDods,R.F.(1975)Proc.Natl.Acad.Sci.USA,72,1097-1101)。由于Mn2+离子能够活化该酶且该酶对G蛋白调节表现出不敏感,这促使Buck及其同事在1999年采用生化方法和色谱方法来表征该酶。他们鉴定了一种可溶性蛋白质,分子量为48kDa,不过以PCR分离的全长solAC基因显示,其读码框编码一种分子量为187KDa的更大的酶。该48kD的具有酶活性的分子被发现位于该全长蛋白质的N端部分内,提示其可能是该蛋白质的蛋白酶裂解片段。PCR和RNase保护分析研究发现了在啮齿类胚系中两种替代性剪接转录物产生所述短的和全长的酶的证据(Jaiswal,B.S.andConti,M.(2001)J.Biol.Chem.276,31698-31708)。将solAC读码框与其他序列比较发现,该48KDa分子含有两个区域,它们与各种腺苷酸环化酶催化结构域具有显著的氨基酸同源性,而最密切相关的序列是来自蓝细菌(cyanobacteria)(Anabaenaspirulensis的cyaB1、cyaB2和cyaA,以及钝顶螺旋藻(Spirulinaplatensis)的cyaC)和粘菌(橙色标桩菌(Stigmatellaaurantiaca)的cyaA和cyaA)的那些序列(Buck,J.Sinclair,M.L.Schapal,L.Cann,M.J.andLevin,L.R.(1999)Proc.Natl.Acad.Sci.USA,96,79-84)。进一步的分析发现,solAC的催化结构域仅与tmAC的催化结构域C1和C2具有15至25%的序列相同性。逆转录酶PCR证实solAC在绝大多数检测的组织中表达,包括眼睫状突、角膜内皮、脉络丛、肾脏和附睾(Mittag,T.W,Guo,W-BandKobayashi(1993)Am.J.Physiol264,F1060-F1064;Zippin,J.HLevin,L.R.andBuck(2001)TrendsEndocrinolMetab,12366-370)。不过,Northern印记分析和原位杂交提示,高度表达仅存在于雄性生殖细胞(Sinclair,M.L.Wang,X-Y,Matia,M.Conti,M.Buck,J.Wolgemuth,D.J.andLevin,L.R.(2000)Mol.Reprod.Dev.56,6-11)。已经证实,solAC不仅是一种可溶性酶,还特异性定向于细胞器,包括线粒体、中心体、有丝分裂纺锤体、中间体和细胞核,因此认为其与cAMP信号传导的效应物关系密切(Zippin,J.H.Chen,Y.Nahirney,P.Kamenetsky,M.Wuttke,M.S.Fishman,D.A.Levin,L.RandBuck,J.(2003)FasebJournal,17,82-84;Litvin,T.N.Kamenetsky,M,Zarifyan,A.Buck,J.andLevinL.R.(2003)J.Biol.Chem.278,15922-15926)。可溶性AC受到Ca2+和HCO3-的调节,提示通过这些细胞内信号分子的调变导致solAC介导针对细胞内在事件的cAMP依赖性应答。作为迄今在哺乳动物中鉴定到的唯一一种作为碳酸氢根/二氧化碳化学感受器的酶,solAC被认为不仅在精子获能超活化运动性和顶体反应中,也在肾脏液体重吸收、睫状体和脉络丛的液体分泌、以及应答于营养信号的代谢调节中发挥关键作用(Litvin,T.N.Kamenetsky,M,Zarifyan,A.Buck,J.andLevinL.R.(2003)J.Biol.Chem.278,15922-15926)。阐明一种蛋白质的结构需要有足量的纯化蛋白质的来源以便能够产生晶体。许多蛋白质,既便是在重组生产系统中表达时,也很难以可溶性、具有活性且非聚集蛋白质的形式得以纯化。多种不同的细菌腺苷酸环化酶已经以可溶性形式在大肠杆菌中表达。具体而言,细菌腺苷酸环化酶鱼腥藻属(Anabaena)cyaB、分枝杆菌Rv1264和标桩菌属(Stigmatella)cyaB已经以可溶性形式表达于大肠杆菌(Cannetal.(2003),J.Biol.Chem,278,35033-35038;Kanacheret.Al.(2002)EMBOJ.21,-3672-3680;Linderetal.(2002)J.Biol.Chem,277,15271-15276)。大肠杆菌已经被用于表达布鲁斯锥虫(Trypanosomabrucei)腺苷酸环化酶,形式为包涵体(Bieger,B.andEssen,L-O.(2000)ActaCryst.D56,359-362)。大肠杆菌也被用于表达N端以His标记的大鼠跨膜腺苷酸环化酶的C2结构域。所述蛋白质以可溶性形式表达(Yan,S-Zetal.(1996)J.Biol.Chem,271,10941-10945)。Sunahara,R.K等还以N端His标记的融合蛋白的形式表达了犬的V型腺苷酸环化酶C1结构域((1997)J.Biol.Chem.272,22265-22271)。阐明solAC的机制和生物化学特性的障碍在于难以获得足量的纯度足够高的材料。表达和收集以上提及的其他形式的腺苷酸环化酶的条件均各不相同,提示不同形式的腺苷酸环化酶需要精确而不同的条件才能产生显著量的蛋白质。在重组表达之前,一种纯化solAC的方法需要处理数百个大鼠的睾丸(950)才能获得足够的蛋白质(~3μg)用于研究该酶的性质(Buck,J.Sinclair,M.L.andLevin,L.R.(2003)MethodsinEnzymol.345,95-105)。纯化过程涉及多个步骤,起始于细胞裂解物,其包括20mMTris-HCl,pH7.5,1mMDTT和蛋白酶抑制剂。经过6个不同的柱纯化后,该酶的浓缩级分被加到HPLC柱上,并以20mMTris-HCl,pH6.8,1mMDTT洗脱,洗脱梯度为0-0.1MNaCl。曾认为降低pH—这是在这一时期首次进行的—引起了显著的富集(约60倍)活性增强。回收的solAC蛋白质的最终产量为大约3μg,不过其中包括一种62KDa的无关的污染蛋白质,因此,这种制备方法即使扩大规模仍然不太可能适合于产生晶体。也已经在HEK293细胞中表达了重组的全长和催化结构域大鼠solAC。这些构建体被用于确定由所述两种替代性转录物编码的酶的特性以及它们彼此之间的相对活性和与来源于组织的等价物之间的相对活性。通过离心使重组细胞裂解物澄清,随后上样于SephacrylS-200柱。尽管没有报道产量,但它们足以确认所述重组物在活性、大小和免疫反应性方面与表达于睾丸的solAC是相当的(Jaiswal,B.S.andConti,M.(2001)J.Biol.Chem.276,31698-31708)。重组表达方法允许对表达的蛋白质进行标记以便于回收。Litvin等((2003)J.Biol.Chem.278,15922-15926)公开了在杆状病毒Hi5细胞中产生具有GST标记的重组人solAC催化结构域。将产生所述蛋白质的细胞裂解于PBS,pH7.4,1mMEDTA,1mMDTT和蛋白酶抑制剂混合物中。将裂解物上样于谷胱甘肽琼脂糖4B柱,并以50mMTrisHClpH8.0、10mM还原型谷胱甘肽、10μg/ml抑肽酶和10ug/ml亮抑蛋白酶肽洗脱。将裂解物上样于Superdex200HR10/30柱,并将样品储存于50%甘油中。终样品含有额外的GST带,感兴趣的蛋白质没有自标记物裂解下来。作者没有指明产量,尽管它们足以用于酶学研究,但产量似乎很低。另一种标记物是6组氨酸标记物,Chen等((2000)Science289,625-628)使用其表达solAC催化结构域(氨基酸1至469位)。该标记物被融合于C端。使用Bac-to-BacTM杆状病毒ExpressionSystem(LifeTechnologies)将所述蛋白质异源性表达于昆虫HiFive细胞,并在Ni2+-NTA琼脂糖树脂(Qiagen)上通过层析纯化蛋白质。没有公开条件和蛋白质的产量,但其量足以确定碳酸氢根对重组酶活性的影响不是由于pH的影响。他们还发现亚硫酸氢根离子能够模拟solAC碳酸氢根的刺激,而氯化物或硫酸根或磷酸根则不能。尽管对solAC已经有了这些以往的研究,但纯的重组哺乳动物蛋白质的终产量仍然很低,因此无法进行结构研究。SolAC同源物结构已经报道了在存在或不存在HCO3-时与ATP类似物、Mg2+或Ca2+相复合的来自钝顶螺旋藻的solAC同源物CyaC一系列结构。他们发现钙离子占据了第一个金属结合位点,且似乎介导核苷酸在该活性位点的开放构象中的结合。碳酸氢根的存在引起该活性位点关闭,尽管其也募集了一第二金属离子。底物类似物的磷酸根基团在该活性位点内重排它们的构象,这可能有助于产物的形成和释放。由于该酶的apo形式还没有解决,有可能该酶还存在其他的构象,且有可能那些观察到的构象代表了反应途径中俘获的分子(Steegborn,C.Litvin,T.Levin,L.R.Buck,J.andWu,H.(2005)Nat.Struc.AndMol.Biol.12,32-37,Tesmer,J.J.G(2005)Nat.Struc.AndMol.Biol.12,7-8)。SolAC和雄性避孕细胞cAMP浓度的改变已经被认为与精子对受孕过程的调节有关,特别是与成熟、获能、运动性以及与配子的融合有关。尽管这些事件是相关的,但对其中潜在的机制所知甚少。为确定不同腺苷酸环化酶在调变这些过程中的具体作用,对精子的研究提示,solAC即使不是起着关键作用,也是起着重要的作用(deLamirande,E.LeClerc,P.andGagnon,C.(1997)Mol.Hum.Reprod.3,175-194;Jaiswal,B.J.andConti,M.(2003)Proc.Natl.Acad.Sci.USA,100,10676-10681;Xie,F.andConti,M.(2004)DevelopmentalBiol.265,196-206;Chen,Y.Cann,M.J.Litvin,T.N.Iourgenko,V.Sinclair,M.L.Levin,L.R.andBuck,J.(2000)Science289,625-628)。solAC在受孕中的作用的明确证据来自于在小鼠中破坏solAC基因导致精子活动力严重受损而造成其不育这一情况。SolAC缺陷型雄性动物的睾丸和附睾的发育正常,且其他已知表达solAC的器官未显示明显的异常。雌性solAC缺陷型小鼠不出现表型,并产生正常大小的幼仔,幼仔是野生型的或者是杂合子小鼠。SolAC缺陷型雄性可正常交配,但由于精子缺乏前向运动而不能生育。对突变精子的体外研究发现,给精子加载cAMP可使之恢复正常活动力,不过突变的精子还是不能使卵母细胞受孕(Esposito,G.Jaiswal,B.S.Xie,F.Krajnc-Franken,M.A.M.Robben,T.J.A.A,Strik,A.M.Kuil,C,Philipsen,R.L.A.vanDuin,M.Conti,M.andGossen,J.A.(2004)Proc.Natl.Acad.Sci.USA,101,2993-2998)。尽管solAC在受孕中起着关键的作用,但有证据表明一些tmAC也可能参与这一过程。完好的小鼠精子的免疫定位化显示顶体区域和鞭毛区域富含tmACII、III和VIII,而tmACI和IV以较低的程度存在于中段和顶体。由于IVF基质中的一些成分已知可通过G-蛋白偶联的受体起作用,因此很可能它们的作用是通过tmAC而调变的(Baxendale,R.W.andFraser,L(2003)Mol.Reprod.andDev.66,181-189)。solAC、肿瘤学、炎症和其他过程cAMP参与影响细胞增殖、细胞分化和细胞凋亡的信号转导途径。已知这些途径的异常可导致一些病理情况例如癌症。可以提及的多种癌症包括下文G(vii)节所列出的那些。因此,可以将通过升高或降低solAC的活性而调变cAMP的浓度视为一种治疗性或预防性杠杆。最近的研究提示solAC通过cAMP依赖性的鸟苷三磷酸酶类Rap-1的调变而参与TNF诱导的中性粒细胞活化和NGF介导的神经突发生(neuritogenesis)(Han,H.Stessin,A.M.Roberts,J.Hess,K.C.Gautam,N.Kamenetsky,M.Lou,O.Hyde,E.Nathan,N.Muller,W.A.Buck,J.Levin,L.R.andNathan,C.(2005)J.Exp.Med.202,353-361;Stessin,A.M.Zippin,J.H.Kamenetsky,M.Hess,K.C.Buck,J.andLevin,L.R.(2006).J.Biol.Chem.10,1074)。因此,通过活化或者抑制solAC而对这些过程进行下游调节可能具有治疗用途。TNF的过量产生或者不受调节的产生被认为介导或者加重了多种炎症性疾病和病症,包括类风湿性关节炎(Mainietal.APMIS,105(4)257-263)、类风湿性脊柱炎、骨关节炎、痛风性关节炎及其他关节炎病症;败血症、感染性休克、内毒素性休克、革兰氏阴性败血症、中毒性休克综合征、成人呼吸窘迫综合征、脑型疟疾、慢性肺部炎症性疾病、慢性阻塞性肺疾病(COPD)、急性呼吸窘迫综合征(ARDS)、哮喘、肺纤维化和细菌性肺炎、矽肺、肺结节病、骨重吸收疾病、再灌注损伤、移植物抗宿主反应、同种异体移植排异反应、感染引起的发热和肌痛感染(例如流感)引起的发热和肌痛、1型单纯疱疹病毒(HSV-1)、HSV-2、巨细胞病毒(CMV)、水痘带状疱疹病毒(VZV)、Epstein-Barr病毒(EBV)、人类疱疹病毒-6(HHV-6)、HHV-7、HHV-8、假性狂犬病、鼻气管炎和继发于感染或恶性疾病的恶病质、继发于获得性免疫缺陷综合征(AIDS)的恶病质、AIDS、ARC(AIDS相关症候群)、疤痕形成、疤痕组织形成、Crohn氏病、溃疡性结肠炎、或pyresis。由于solAC抑制剂抑制TNF所引起的效应,因此可以预见solAC抑制剂可用于治疗上述列举的疾病。还已知cAMP刺激房水形成(青光眼)和自胰腺的胰岛分泌胰岛素(糖尿病)。这两个过程均受到碳酸氢根浓度的调节,这将它们与solAC直接联系起来。蛋白质结晶化蛋白质化学领域已知,使蛋白质形成结晶是一个不确定的和困难的过程,是否会成功是无法预料的。显然,蛋白质结晶化是目前确定蛋白质结构的主要障碍。为此,蛋白质结晶化本身已经成为一个研究学科,而非仅仅是蛋白质晶体实验室的延伸。许多文献均描述了与产生蛋白质晶体有关的困难(KierzekAM.andZielenkiewiczP.(2001)BiophysicalChemistry,91,1-20Modelsofproteincrystalgrowth;WiencekJM(1999)AnnuRevBiomedEng.1,505-534NewStrategiesforcrystalgrowth;Service,R.Science(2002)Nov1;298,948-50Structuralgenomics.TappingDNAforstructuresproducesatrickle;ChayenN.JStructFunctGenomics(2003)4(2-3)115-20Proteincrystallizationforgenomicsthroughputversusoutput)。Wiencek强调需要合理的方法学和方案以产生适合用于确定蛋白质结构的单一的、高质量的蛋白质晶体,并提及缺乏蛋白质结晶化的基本方法,而蛋白质结晶化对于确定结构而言通常是关键步骤。对于合理的方法的需求,讨论了影响蛋白质溶解度、成核作用和晶体生长的各种变量,包括温度、压力、pH、电解质、反抽提溶剂(antisolvents)和可溶性合成聚合物对蛋白质溶解度的影响。还描述了多种物理化学技术(包括激光散射、X-线散射和X-线衍射以及原子力显微镜检查)及其在研究晶体生长和成核作用速度中的用途,以及多种晶体生长技术,例如蒸汽扩散(vapourdiffusion)、自由界面扩散、透析、批生长(batchgrowth)和引晶(seeding)等技术。还讨论了测量蛋白质晶体质量及其影响因素。Wiencek的结论是,蛋白质结晶化仍有很多方面是不清楚的,而我们在理解蛋白质结晶化方面的重大进展将会对基于蛋白质结晶学本身的各方面应用产生显著的影响,这是因为结构生物学很大程度上取决于对蛋白质分子进行结晶的能力。类似地,Kierzek等也承认,产生大而高度有序的蛋白质晶体仍然是通过X线结晶学来确定蛋白质结构的主要障碍,这是因为对于蛋白质结晶化的物理化学方面还不了解。他们对形成用于解释迄今收集到的有关蛋白质晶体生长的实验数据的模型的各种尝试进行了综述,但却指出还没有任何令人满意的蛋白质结晶化的模型,其原因在于该问题极为复杂,结晶化过程在时间和大小尺度上均横跨多个数量级的范围,这对于绝大多数计算机模拟方法来说是难以做到的。Kierzek等的结论是,对当前晶体生长领域中正在测试的范围广泛的各种方法进行某种整合有赖于实验方法和理论方法方面都有进一步的进展。Service(ibid)讨论了与蛋白质结晶化和结构确定相关的问题。其给出的实例之一是美国的一个探索性课题,该课题的目的是通过对蛋白质结晶化中涉及的大量步骤进行自动化而加快确定结构的过程。据记载,这一课题在其过程的各个阶段均遭遇各种困难在经鉴定用于确定结构的1870种蛋白质靶中,仅仅产生了23个完整的蛋白质结构。Service称其他课题的结果与此相近,因此在全世界范围内的各种结构基因组学课题所研究的大约18,000种蛋白质中,仅获得了大约200蛋白质的结构。该文章于是给出了结构确定过程中一些不同的点,所有这些点均引起一些问题。起始点,即诱使大肠杆菌和其他宿主细胞以表达正确的蛋白质并使它们成为可溶形式,被认为是最大的问题的之一。然后讨论了与使得蛋白质形成适合用于X线研究的晶体有关的持续存在的问题结晶化以及随后晶体的最佳化被认为是这个过程中的主要困难。实际上,该文章称每一个步骤的损失均很严重。即使能够得到晶体,还需要解决晶体的结构,而这并不是一个常规的过程,也无法预期其是否会成功。NISGC联盟的文章对此进行了阐述。与用于结晶化和结构确定的大量靶蛋白相比,被克隆并随后以可溶性蛋白质的形式被表达的数目实际上很低。并不总是能够进行进一步纯化,且既便是在纯化后,所纯化的蛋白质也只有一小部分被结晶化。即使如此,仅仅一部分这些蛋白质结晶化产生适合用于通过X线结晶学进行蛋白质结构确定单一的、高质量的蛋白质晶体。在5187种靶蛋白中,联盟成员克隆了其中的1675种,并将1295种表达为蛋白质,而其中只有773种是可溶性的。其中被纯化的蛋白质为719种,但被结晶化的仅有94种。他们目前已经确定了50种的结构,其中仅有22种是通过X线分析确定的。Chayen(ibid)的图1给出了相似的图示。Chayen将其注意力放在结构基因组学所涉及的众多步骤中的结晶化步骤上,并讨论了产生用于通过X线结晶学进行结构确定的高质量蛋白质晶体的困难。这种困难造成在所产生的蛋白质中目前仅有一小部分进行了结构确定这一事实。通常认为蛋白质分子在溶液中的结晶化是确定蛋白质结构过程的障碍,其中的原因很多蛋白质是复杂的分子,而其与溶液中的其他蛋白质分子以及小分子的特异性和非特异性相互作用的微妙平衡是难以预测的。每种蛋白质均在一组独特的条件下发生结晶,而这是难以事先预测的。简单地使得蛋白质过饱和以便将其自溶液中分离的方法是行不通的,在绝大多数情况下,这样做得到的是无定型沉淀物。目前使用的沉淀剂有很多,一般是不同的盐、以及聚乙二醇,但其他的也是已知的。此外,还可加入例如金属和去垢剂等添加剂以调变溶液中的蛋白质的行为。已知有多种试剂盒,如来自HamptonResearch的那些,它们试图尽可能多地覆盖结晶化领域的各种参数,不过在大多数情况下它们仅仅是用于优化结晶的沉淀物和晶体的起始点,并不适合于衍射分析。有关溶解性、为实现正确的折叠或活性而对金属离子的依赖性、与其他分子的相互作用以及其他已知信息等蛋白质行为的知识有助于实现成功的结晶化。既便如此,蛋白质的结晶化通常仍然被认为是一个耗时的过程,其中下一步的实验要建立在以往的尝试所获得的结果上。在获得了蛋白质晶体的情况下,它们也不一定总是适合用于衍射分析它们的分辨率(resolution)可能有限,而且随后可能难以对其进行改进以使其达到按分析所需的分辨率发生衍射的程度。造成晶体内分辨率有限的因素有多种。可以是因为晶体内部蛋白质固有的运动,即使形成其他的晶体,这一问题也是很难克服的。也可以是因为晶体内溶剂含量太高,结果导致弱的散射。或者,也可能是因为晶格内部的缺陷,这意味着衍射的X线在晶格内部的单元至单元之间不能完全同相。这些问题中的任何一个或它们的组合均意味着晶体并不适合用于结构确定。一些蛋白质从未结晶化,在进行了合理的尝试之后,有必要检查蛋白质本身,并考虑是否可以制备各个结构域、不同的N或C端截短形式、或点突变。通常很难预测如何以此方式对蛋白质进行再遗传工程化以改善其结晶化能力。有时,在结晶化混合物中加入配体对于产生合适的晶体十分关键。我们对结晶化机制的理解仍然是不完善的,而且参与结晶化过程的蛋白质结构的因素还不很清楚。
发明内容本发明涉及人可溶性腺苷酸环化酶催化结构域的晶体结构,其使得能够对底物和辅因子在酶中的结合位置进行研究和确定。因此,在一个方面,本发明提供表1所示的可溶性腺苷酸环化酶的三维apo(即无配体形式的)结构及其用途。在第二个方面,本发明提供表2以及表3、4和5所示的在存在配体情况下可溶性腺苷酸环化酶的三维结构。在广泛的方面,本发明提供solAC的结构及其在对配体与所述solAC结构的相互作用进行建模中的用途,所述配体例如为潜在的已有的药用化合物或其他分子结构、前体药物、solAC调变剂或底物、或此类化合物、调变剂或底物的片段。以下将讨论这些和其他方面以及本发明的实施方式。本发明的上述方面,无论是单独地还是组合地,均构成本发明的优势特征。图1显示了三种化合物,它们均结合solAC。该图显示了表3-5所用的源自变好系统。图2显示了碳酸氢根与solAC的三个残基的结合相互作用。表格说明表1给出了solAC的结构的坐标数据。表2给出了与AMPCPP形成复合物的solAC的结构的坐标数据。表3给出了与碳酸氢根形成复合物的solAC的结构的坐标数据。表4给出了与5-苯基-2H-[1,2,4]三唑-3-巯基(化合物1)形成复合物的solAC的结构的坐标数据。表5给出了与N-(3-苯氧基-苯基)-草酰酸形成复合物的solAC的结构的坐标数据。表6solAC的活性位点残基。表7solAC的与腺苷部分相互作用的活性位点残基。表8solAC的碳酸氢根结合位点。表9solAC的通道(Channel)结合位点。表10solAC的亚袋结合位点(Sub-pocketbindingsite)。表11替代性solAC结合位点残基。表12哺乳动物可溶性腺苷酸环化酶的完整序列之间的百分比相同性。表13哺乳动物可溶性腺苷酸环化酶的催化结构域之间的百分比相同性。表14solAC表达构建体。表15solAC裂解缓冲液。表16用于解析solAC结构的重原子衍生物。发明详述定义选定的坐标在此所述的本发明的各个方面(如配体适配、同源性建模和结构解析、数据存储装置、计算机辅助操作坐标等等)均使用了表1、表2、表3、表4或表5给出的solAC结构坐标、或衍生自表1、表2、表3、表4或表5的solAC结构坐标、或参照表1、表2、表3、表4或表5的坐标而得到的solAC结构坐标。在本发明的所有方面,本领域人员能够理解的是,在本发明的许多应用中,不一定需要使用表1、表2、表3、表4或表5中的所有坐标,而是仅使用他们的一部分,例如代表与特定用途有关的特别感兴趣的原子的一组坐标。这样的一部分坐标被称为“选定的坐标”。在提及本发明的选定的坐标时,其是指例如所述solAC结构的至少5个、优选地至少10个、更优选地至少50个、以及甚至更优选地至少100个、例如至少500个或者至少1000个蛋白质原子。优选地所述选定的坐标涉及至少30个不同的氨基酸残基(即可以存在来自30个不同残基的至少一种原子)、更优选地涉及至少60个残基、且甚至更优选地涉及至少100个或150个残基。任选地,所述选定的坐标包括表1、表2、表3、表4或表5所示的一或多个配体或水分子的原子。腺苷酸环化酶总体而言具有一种双结构域结构,这两个结构域彼此具有相当程度的结构同源性,并类似于一种假二聚体。可溶性腺苷酸环化酶与蓝细菌的III型腺苷酸环化酶关系最密切,后者以对称同二聚体的形式发挥功能。所述同二聚体中的2个单体,或者所述假二聚体中的2个结构域,彼此可具有不同的方向,这取决于它们的活性中心的成分。因此,选定的坐标可以仅仅是N端结构域(残基1-246)的那些坐标或者仅仅是C端结构域(残基247-468)的那些坐标。另一方面,选定的坐标可以包括一或多个氨基酸残基的原子或由其组成,所述原子是我们已经鉴定为构成如下文所述的solAC活性位点的主链或侧链原子,且特别是表6中的那些(更特别地是表7中的那些)。在优选的实施方式中,当选定的坐标包括来自表6中所鉴定的残基组、且更优选地来自表7中所鉴定的残基组的至少一种原子时,所述选定的坐标包括来自这些优选组的至少2个、例如至少3个、更优选地至少4个、甚至更优选地至少5个、且最优选地所有氨基酸的至少一种原子。更优选地,所述选定的坐标包含来自这些残基组的至少10个、更优选地25个、更优选地50个原子,其中至少一种原子来自所述组的每一成员。在另一方面,选定的坐标可以包括在表8、9、10、或11中所示的一或多个氨基酸残基的原子或者由其组成。在另一个实施方式中,当选定的坐标包括来自表8、9、10、或11中所鉴定的残基组的至少一种原子时,所述选定的坐标包括来自各表的至少2个、例如至少3个、更优选地至少4个、甚至更优选地至少5个、且最优选地所有氨基酸的至少一种原子。更优选地,选定的坐标包括来自这些残基组的至少10个、更优选地25个、更优选地50个原子,其中至少一种原子来自这些表格中的任一表格所示的组的各个成员。或者,选定的坐标可以包括来自表6至11中的任一或者全体的至少10个、更优选地25个、更优选地50个原子,例如至少100个原子。在一个方面,选定的坐标可包括选自表6的氨基酸残基(例如表7的残基)的一或多个坐标和选自表8、9、10、或11的氨基酸残基的一或多个坐标。在一个方面,选定的坐标至少来自表6(优选地表7)和表8。这些选定的坐标组在设计、开发和分析那些占据ATP和碳酸氢根结合位点的配体中可能特别具有优势。在另一方面,表8的优选残基亚组是Lys95、Val167和Arg176。在此所述的本发明涉及表8残基的氨基酸坐标的用途的方面中,也预期了来自这一亚组残基的坐标的用途。此外,还预期了被鉴定为具有特异性配体相互作用的原子的坐标的用途(表1的原子1525,2585,2600,2729;表2的1525,2588,2603和2732;表3的937,1505,1508和1578;表4的1516,2678,2692和2821;表5的1516,2670,2684和2813)。在另一方面,表9的优选残基亚组是His164、Phe165和Val335。在此所述的本发明涉及表9残基的氨基酸坐标的用途的方面中,也预期了来自这一亚组残基的坐标的用途。此外,还预期了被鉴定为具有特异性配体相互作用的原子的坐标的用途(表1的原子2536,2546,2565和5295;表2的原子2539,2549,2568和5298;表3的原子1482,1486,1489和2866;表4的原子2628,2639,2657和5413;表5的原子2620,2631,2649和5392)。在又一方面,选定的坐标可包括solAC的额外的部分螺旋结构域的一或多个氨基酸残基的原子或者由其组成,与tmAC相比,该结构域似乎是solAC所独有的。因此选定的坐标可包括残基Met1至Tyr26或Lys219至Gly284的至少一种原子。优选地,选定的坐标包括残基Ile13至His19、Phe226至Phe236、Asp258至Tyr268或Glu271至Ile277的至少一种原子。在这种情况中,更优选地,选定的坐标包括来自这些优选坐标的至少2个、例如至少3个、更优选地至少4个、甚至更优选地至少5个、例如至少10个以及最优选地所有氨基酸的至少一种原子。更优选地,选定的坐标包括来自这一组残基的至少10个、更优选地25个、更优选地50个原子,其中所述原子来自不同氨基酸的前述优选值。选定的坐标优选地包括至少大约5%、更优选地至少大约10%的Cα原子。或者,或额外地,选定的坐标包括至少大约10%、更优选地至少大约20%、甚至更优选地至少大约30%的选自氮原子、Cα原子、C端氧原子和羰基氧原子的任意组合的主链原子。因此,下文所有提及“选定的坐标”之处,除非明确另外指出,均应按照如上所述进行理解。均方根差(rmsd)蛋白质结构相似性常规使用均方根差(rmsd)来表示和测量,其测量的是两组原子之间空间定位的差异。均方根差测量的是最佳重叠之后等价的原子之间的距离。均方根差可基于所有原子、基于残基主链原子(即蛋白质氨基酸残基的氮-碳-碳主链原子)、仅基于主链原子(即蛋白质氨基酸残基的氮-碳-氧-碳主链原子)、仅基于基因侧链原子、或者更加常见的是仅基于Cα原子来计算。比较蛋白质结构的方法可参见MethodsofEnzymology,vol115,pg397-420。Rossman和Argos给出了计算均方根差的必要的最小二乘法代数(J.Biol.Chem.vol250,pp7525(1975)),不过现在已经有了更快的方法,见Kabsch(ActaCrystallogr.SectionA,A92,922(1976));ActaCryst.A34,827-828(1978)),Hendrickson(ActaCrystallogr.SectionA,A35,158(1979));McLachan(J.Mol.Biol.vol128,pp49(1979))和Kearsley(ActaCrystallogr.SectionA,A45,208(1989))。一些算法使用的是一种重复运算,其中将一个分子相对于其他分子进行移动,例如参见Ferro和Hermans(FerroandHermans,ActaCrystallographic,A33,345-347(1977))。其他方法则直接定位最佳适配,例如Kabsch的算法。用于确定均方根差的程序包括MNYFIT(其是一种称为COMPOSER的程序集合的一部分,Sutcliffe,M.J.Haneef,I.Carney,D.andBlundell,T.L.(1987)ProteinEngineering,1,377-384)、MAPS(Lu,G.AnApproachforMultipleAlignmentofProteinStructures(1998,inmanuscriptandonhttp://bioinfo1.mbfys.lu.se/TOP/maps.html))。当比较明显不同的坐标组时,更常见的是仅基于Cα原子计算均方根差值。但是,在分析侧链运动时,也可基于所有原子计算均方根差。例如LSQKAB(CollaborativeComputationalProject4.TheCCP4SuiteProgramsforProteinCrystallography,ActaCrystallographica,D50,(1994),760-763)、QUANTA(Jonesetal.ActaCrystallographyA47(1991),110-119,并可购自Accelrys,SanDiego,CA)、Insight(可购自Accelrys,SanDiego,CA)、Sybyl_(可购自Tripos,Inc.StLouis)、O(Jonesetal.ActaCrystallographica,A47,(1991),110-119)等程序以及其他一些坐标适配程序也可用于计算均方根差值。在例如LSQKAB和O程序中,用户可定义为进行计算而配对的两种蛋白质的残基。或者,可通过产生两种蛋白质的序列比对而确定残基的配对,序列比对的程序详见D节。然后根据这一比对和计算的均方根差值可重叠原子坐标。程序Sequoia(C.M.Bruns,I.Hubatsch,M.Ridderstr_m,B.Mannervik,andJ.A.Tainer(1999)HumanGlutathioneTransferaseA4-4CrystalStructuresandMutagenesisRevealtheBasisofHighCatalyticEfficiencywithToxicLipidPeroxidationProducts,JournalofMolecularBiology288(3)427-439)进行同源性蛋白质序列的比对并重叠同源性蛋白质原子坐标。比对之后可采用上述的程序计算均方根差。对应相同或者高度相同的序列,可采用人工方法或者如上所述的自动方法进行蛋白质结构比对。另一种方法可以不必考虑序列而产生蛋白质原子坐标重叠。在此所述的本发明的各个方面公开了表1、表2、表3、表4或表5中所有的或选定的坐标。类似地也公开了使用表1、表2、表3、表4或表5中所有的或选定的坐标而得到的结构及其用途,或者衍生自表1、表2、表3、表4或表5中所有的或选定的坐标的结构及其用途。在这些方面,表中的坐标可以变化,但均方根差不超过1.5_、优选地不超过1.4_、更优选地不超过1.2_、更优选地不超过1.0_、例如优选地不超过0.7_、更优选地不超过0.5_、更优选地不超过0.2_、甚至更优选地不超过0.1_。因此,除非另有指明,否则本文中所有对表1、表2、表3、表4或表5的坐标的引用均应被理解为包括不超过1.5_的均方根差变化,且变化的优选值已经在前面一段中给出。类似地,引用数值小于不超过1.5_的均方根差变化同样应该理解为包括前面句子中给出的优选的、更窄的界限。为了避免歧义,在此对小于所述不超过1.5_的具体_数值以下的均方根差值的引用,应该被理解为包括不超过所述具体数值的上述优选的、更窄的界限。优选地,参照Cα原子计算均方根差,条件是在使用选定的坐标的情况下,它们包括至少大约5%、优选地至少大约10%的此类原子。如果选定的坐标不包括所述至少大约5%,可参照所有4种主链原子计算均方根差,条件是它们包括至少大约10%、优选地至少大约20%、且更加优选地至少大约30%的所述选定的坐标。如果选定的坐标包括90%或更多的侧链原子,可以参照所有选定的坐标计算均方根差。配体在此,配体是一种虚拟的或者物理的结构,包括一或多个原子,能够结合或者相互作用于本发明的solAC结构。此类原子包括有机分子中的那些原子,例如碳、氧、氢、氮、磷和硫,以及常见于生物学系统的金属离子,例如铁、钙、镁、锰、硒等等。用于本发明的配体可以是小的化学分子,它们的三维结构是现有技术中已知的,例如见于CambridgeStructuralDatabase(www.ccdc.cam.ac.uk),其中有超过250,000种分子的结构,或者可以是基于特定的结构或其他标准已经设计或者选定其结构的配体。这些以及其他结构可用于例如目的在于筛选配体本发明的多个方面,用于开发与solAC相互作用的新的化合物,以调变例如活化或抑制其功能。对本领域人员显而易见的是,尽管虚拟分子形式的配体可以做到与本发明的solAC结构的一或多个蛋白质原子相互作用,但这种相互作用在物理化合物本身与solAC之间可能并不发生。与solAC的催化结构域的一或多个原子结合或相互作用的配体特别有价值。配体可以是酶或者所述酶的底物的调变剂(如活化剂或抑制剂)。一种这样的底物可以是前体药物,通过腺苷酸环化酶的作用可将其转化为活性药物。配体结合通常通过非共价相互作用(但不排除其他方式),例如通过氢键或类似方式。对本领域人员显而易见的是,在基于计算机的分析方法或类似方法的情况中提及配体时,其指的是虚拟的分子结构,而在其他情况中(例如浸渗(soaking)solAC晶体等等),配体是化合物。在本发明的一些方面中,通过计算机建模技术鉴定配体,然后再以化合物的形式提供,用于进一步分析。对化合物的分析,例如通过浸渗实验或共结晶化实验,通常会导致产生更多的配体,然后可通过本发明的基于计算机的方法对它们进行分析。可自多种来源获得用于浸渗或共结晶化的候选配体。例如,可使用作为潜在的腺苷酸环化酶抑制剂而开发的化合物,以便证实其与solAC的相互作用,并由此改进配体以增强或者调变其活性。此类配体可包括下文会提到的腺嘌呤核苷酸类似物。或者,许多合成化合物文库可购自不同的公司,包括MaybridgeChemicalCo.(Trevillet,Cornwall,UK)、Comgenex(Princeton,N.J.)、BrandonAssociates(Merrimack,N.H.)、和Microsource(NewMilford,Conn.),而稀有化合物文库可自Aldrich(Milwaukee,Wis.)获得。组合文库也是已知的并可制备。或者,也有细菌、真菌、植物和动物提取物形式的天然化合物的文库,例如PanLaboratories(Bothell,Wash.)或MycoSearch(N.C.),其也可以通过本领域熟知的方法容易地制备。建议将分离自天然来源例如动物、细菌、真菌、包括叶子和树皮的植物来源以及海洋样品的化合物作为候选物,分析是否存在潜在的可药用物质。可以理解,待筛选的药用物质也可以自化学组合物或者人造化合物中衍生或合成而得到。特别有价值的配体是那些为制药用途而开发的化合物。此类配体通常是有机分子,其分子量典型地为大约100至2000Da、更优选地为大约100至1000Da。此类配体包括肽及其衍生物、类固醇类化合物、抗炎药物、抗癌药物、抗菌或者抗病毒药物、神经科药物等等。原则上制药领域正在开发的任何化合物均可用于本发明,以便促进其开发或进行进一步合理性药物设计以改进其特性。其他有价值的配体是腺嘌呤核苷酸及其类似物。腺嘌呤核苷酸是腺苷的任何磷酸酯,即一磷酸腺苷(AMP)、ADP和ATP中的任一种。腺嘌呤核苷酸的类似物是保留腺嘌呤核苷酸的特征性结构的任何化合物,例如核苷酸的片段或者核苷酸的分子变体,其能够结合solAC的ATP结合袋。特征性结构指的是所述类似物包含一或多个的嘌呤碱基结构、糖残基、以及单、二或三磷酸酯结构或其类似物。腺嘌呤核苷酸的片段包括任何一种腺苷磷酸酯的任何分子片段,所述片段能够结合solAC的ATP结合袋。因此,腺嘌呤核苷酸的片段的实例为腺嘌呤(碱基)、腺苷(核苷)、核糖(糖)、以及任何一种核糖磷酸酯(如核糖5’单磷酸酯、核糖5’二磷酸酯和核糖5’三磷酸酯中的任一种)。在腺嘌呤核苷酸的分子变体中,嘌呤碱基结构可以是腺嘌呤衍生物,例如在8位发生取代的腺嘌呤(例如以卤素原子取代,产生8-溴ATP或8-溴AMP,或者以烷基取代),或其中的环含有杂原子,或其中的碱基是开环类似物,例如在ZMP(AICA核糖单磷酸酯)中。或者,或额外地,糖残基结构可包括,例如,2’或3’羟基的修饰,例如被其他基团取代或基团的环化。此外,类似物的磷酸酯部分可以被修饰,例如以便为γ和β磷酸酯之间(例如腺苷-5′-[(β,γ)-亚氨基]三磷酸酯,AMPPNP)或为β和α磷酸酯之间(例如腺苷-5′-[(α,β)-亚甲基]三磷酸酯,AMPCPP)提供非水解基团。许多销售商提供大量的类似物,例如JenaBioscienceGmbH(Jena,Germany)。此外,临床上也在使用大量的腺嘌呤核苷类似物,也不是在抗病毒领域。例如,阿糖腺苷(也称为腺嘌呤阿糖胞苷,或ara-A)是一种用于通过导向病毒聚合酶来治疗疱疹病毒的腺嘌呤核苷类似物,而9-(3-羟基-2-膦酰基-甲氧基丙基)-腺嘌呤(也称为HPMPA)是一种具有抗HIV活性的腺嘌呤衍生物(Pauwels,R.Balzarini,J.Schols,D.Baba,M.Desmyter,J.Rosenberg,I.Holy,A.DeClercq,E.PhosphonylmethoxyethylPurineDerivatives,ANewClassOfAnti-HumanImmunodeficiencyVirusAgents.AntimicrobAgentsChemother32(7)1025-1030(1988))。这些衍生物中有一些在体内被磷酸化成为三磷酸酯。腺嘌呤核苷酸及其类似物可用作配体,可对其进一步修饰以增强或降低它们与solAC的相互作用,例如用于开发新的药物化合物。配体还可以是具有碳酸氢根或亚硫酸根类似物部分的化合物,这样所述部分能够与一或多个参与碳酸氢根结合的solAC原子配位。A.蛋白质晶体本发明提供人可溶性腺苷酸环化酶催化结构域的晶体。在又一方面,本发明提供可溶性腺苷酸环化酶催化结构域的晶体,所述晶体包含SEQIDNO3的第1至468位残基或其具有1至10个氨基酸的取代、缺失或插入的变体。所述晶体可具有SEQIDNO3,任选地不包括His6标签(即SEQIDNO3的1至469位)或其中His6标签被具有4至20个氨基酸的标签取代。所述标签可包含更少或更多数量的组氨酸残基,例如可以是His4、His5、His7或His8标签。晶体可包含SEQIDNO3的1-468位残基的等位基因或变体,仍保留在如本文所述的条件下形成晶体的能力。此类变体包括那些具有大量氨基酸取代的变体,例如将1、2、3、4、5、6、7、8、9或10个氨基酸以等量或者更少数量的氨基酸取代。下文进一步讨论了包括突变体在内的变体的更多实例。在一个实施方式中,在此所述的本发明的晶体具有空间群P63,晶胞尺度为a=b=99.5_、c=97.4_、和α=β=90.0°,γ=120.0°。晶胞尺度可有5%的可变性。因此,具体的实例为a=b=99.51_、c=97.13_;a=b=99.424_、c=97.390_(如表1所示);a=b=99.651_、c=96.522(如表2所示);a=b=99.673_、c=96.824(如表3所示);a=b=99.569_、c=98.470(如表4所示);a=b=99.291_、c=97.753(如表5所示)。更通常而言,晶胞晶体尺度可在如下范围104.475_>a=b>94.525_,102.27_>c>92.53_。可采用所附实施例中描述的方法获得此类晶体。本发明提供在没有任何活性位点结合配体情况下生长成的solAC催化结构域晶体。因此本发明也包括solAC催化结构域的apo晶体。在此举例说明的用于提供solAC晶体或共结晶通常可以提供可以大约3.5_或更好的分辨率而分辨的solAC催化结构域晶体或共结晶。本发明因此还提供具有3.5_或更好的分辨率的solAC催化结构域晶体或共结晶。在又一方面,本发明提供制备solAC催化结构域蛋白质晶体、特别是包含solAC的催化结构域或其变体的序列的solAC蛋白的方法,所述方法包括通过悬滴蒸汽扩散而生长晶体。本发明另一方面提供其中已经浸渗了配体的solAC催化结构域。此外,本发明提供用于制备solAC催化结构域与配体形成的复合体的晶体的方法,所述方法包括取得solAC催化结构域的晶体并将配体浸渗于其中。(i)突变体突变体是这样一种solAC催化结构域蛋白,其特征为在野生型solAC中进行至少一种氨基酸的取代、插入或缺失。此突变体可通过例如定点诱变或者掺入天然或非天然氨基酸而制备。本发明包括“突变体”,其中“突变体”指的是通过将天然或合成的solAC中的至少一个氨基酸残基以不同的氨基酸残基取代和/或通过在天然多肽内部或相应于solAC的多肽的N端和/或C端添加和/或缺失氨基酸残基而获得的多肽,且所述多肽与其所来源于的solAC具有基本上相同的三维结构。具有基本上相同的三维结构指的是具有一组原子结构坐标,所述原子结构坐标与表1、表2、表3、表4或表5的坐标的均方根差(rmsd)小于大约1.5_。突变体可以具有但不必需具有酶活性或催化活性。为了产生同源物或突变体,可将所述蛋白质中的氨基酸用特性相似的其他氨基酸取代,所述特性例如是疏水性、疏水运动、抗原性、形成或打开α-螺旋或β-折叠结构的倾向性等等。在蛋白质的取代变体中,蛋白质序列中的至少一个氨基酸已经被去除,并在该位置插入了不同的残基。氨基酸取代典型地涉及单个残基,但也可以是成簇的,这取决于功能上的约束,例如晶体接触的约束。优选地,氨基酸取代包括保守性氨基酸取代。在插入性氨基酸变体中,引入了一或多个氨基酸。这可以是氨基端和/或羧基端融合体,也可以是内部序列。氨基端和/或羧基端融合体的实例是亲和标签(如MBP或GST标签)或表位标签。不明显干扰solAC的三维结构的氨基酸取代、缺失和添加部分取决于solAC中发生取代、添加或缺失的区域。在分子的高度可变区域中,非保守性取代以及保守性取代均是可以的,而不会明显破坏分子的三维结构。在高度保守的区域或者含有明显的二级结构的区域中,保守性氨基酸取代是优选的。保守性氨基酸取代是本领域熟知的,包括基于有关氨基酸残基在极性、电荷、溶解性、疏水性、亲水性和/或两亲性上的相似性而作出的取代。例如,带负电荷的氨基酸包括天冬氨酸和谷氨酸;带正电荷的氨基酸包括赖氨酸和精氨酸;具有相似的亲水性值的不带电极性首基的氨基酸包括亮氨酸、异亮氨酸、缬氨酸;甘氨酸、丙氨酸;天冬酰胺、谷氨酰胺;丝氨酸、苏氨酸;苯丙氨酸、酪氨酸。其他保守性氨基酸取代是本领域熟知的。在一些情况下,为了在编码所述多肽的cDNA中产生方便的克隆位点以有助于纯化所述多肽等而取代、缺失和/或添加氨基酸残基可以是特别有利或方便的。此类不明显改变solAC的三维结构的取代、缺失和/或添加对于本领域人员是显然的。如上所述,本发明预期的突变体不必显示出酶活性。实际上,干扰solAC的催化活性但不明显改变催化区域的三维结构的氨基酸取代、添加或缺失是本发明所特别预期的。此类结晶的多肽或自其获得的原子结构坐标可用于鉴定那些与所述蛋白质结合的配体。本领域人员能够容易地鉴定那些用于突变的残基,并可通过定点诱变引入这些突变,例如采用Stratagene的QuikChangeTM定点诱变试剂盒或者盒诱变方法(见例如Ausubeletal.eds.CurrentProtocolsinMolecularBiology,JohnWiley&Sons,Inc.NewYork,andSambrooketal.MolecularCloningaLaboratoryManual,2nded.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY,(1989))。(ii)等位基因本发明预期“等位基因”,其中等位基因是由Bateson和Saunders于1902年为孟德尔遗传学中彼此并列的性状而创造的术语。现在该术语等位基因用于一种基因的两种或者多种并列形式,它们导致产生不同的基因产物,且因此产生不同的表型。等位基因含有核苷酸改变,这些改变已经被发现可影响转录、剪接、翻译、转录后修饰或翻译后修饰,或者导致至少一个氨基酸改变。典型地,solAC的等位基因变体与相应的具体举例说明的solAC蛋白将具有至少75%的序列相同性(更优选地,至少80%、85%、90%或95%的序列相同性),其中序列相同性通过将所述多核苷酸的核苷酸序列对齐以达到最大的重叠和相同且序列缺口最少时比较所述核苷酸序列而确定的。更通常地,等位基因形式包含在野生型蛋白质中发生1-10个氨基酸改变、特别是1或2个氨基酸改变,或在DNA序列中发生1-30个核苷酸改变。在本发明所涉及的solAC-配体复合体以及solAC的突变体、同源物、类似物、等位基因形式、物种变体蛋白质的范围内,可以形成此类蛋白质的晶体。本领域人员能够认识到,在此提供的使solAC结晶化的条件可用于形成此类晶体。或者,本领域人员能够基于这些条件来鉴定用于形成晶体的改良的条件。因此本发明涉及solAC晶体的各个方面可扩展至产生同源物、等位基因形式和物种变体的solAC突变体的晶体。(iii)solAC的纯化为了获得用于结晶化的足量蛋白质,有必要建立用于高水平表达和回收solAC的方案。在一个实施方式中,本发明提供用于产生solAC(例如包含SEQIDNO3的1-469位残基的solAC或其突变体或变体)的方法,所述solAC任选地融合于C端或N端的标签,所述方法包括在真核细胞培养物中表达所述solAC;在缓冲液中裂解培养物中的细胞,所述缓冲液包括10-100mMTrispH7.4-8.0(4℃),0.3-0.5MNaCl,0-20%(v/v)甘油和2-5mMβ-巯基乙醇;和自培养物中回收solAC。更优选地,所述方法包括在缓冲液中裂解培养物中的细胞,所述缓冲液包括40-60mMTrispH7.4-7.6(4℃),0.3-0.4MNaCl,5-15%(v/v)甘油和2-5mMβ-巯基乙醇;和自培养物中回收solAC。甚至更优选地,在所述培养物细胞中表达后,所述方法包括在缓冲液中裂解培养物中的细胞,所述缓冲液包括50mMTrispH7.5(4℃),0.3MNaCl,10%(v/v)甘油和2-5mMβ-巯基乙醇;和自培养物中回收solAC。在上述方法中,真核细胞培养物可以使哺乳动物或昆虫细胞培养物,特别是昆虫细胞培养物。在一个实施方式中,solAC包含组氨酸标签(例如包括大约4-10个、如6个组氨酸标签)残基,且回收solAC的步骤包括使solAC与螯合柱在用于所述标签与柱结合的条件下结合,然后自所述柱洗脱所述蛋白质。在另一个实施方式中,所述solAC可包含GST标签。本发明还提供组合物,其包含位于缓冲液中的solAC,特别是SEQIDNO3的solAC或其突变体或变体,所述缓冲液包括50mMTrispH7.5(4℃),330mMNaCl,10%(v/v)甘油和1mMβ-巯基乙醇。在优选的实施方式中,所述solAC的浓度为10至40mg/ml,例如20至40mg/ml。优选地,所述solAC在这些优选的浓度仍保留单体形式。(iv)solAC的结晶化为了产生solAC催化结构域蛋白晶体,将最终的蛋白质在缓冲液中浓缩至~8-15mg/ml,所述缓冲液例如包括50mMTris,pH7.5,330mM氯化钠,1mMβ-巯基乙醇和10%甘油,可使用商品化的浓缩装置。通过悬滴或沉滴方法开始蛋白质结晶化,并通过针对多种蒸汽扩散缓冲组合物在4℃进行蒸汽扩散而使蛋白质结晶化。可采用微引晶(Microseeding)。在悬滴或沉滴中常规使用1∶1的蛋白质溶液和蒸汽扩散缓冲液,本发明也使用这一比率,除非另有指明。悬滴或沉滴的体积通常为大约0.5至2μl、例如大约1至2μl、优选地1μl。也可采用微批量(microbatch)方法进行结晶化。典型地,蒸汽扩散缓冲液包含100mM醋酸钠pH4.8,200mM柠檬酸三钠,14-17%PEG4000,10%甘油和3mMβ-巯基乙醇。可使用HamptonResearchScreening试剂盒、聚乙二醇(PEG)/离子筛、PEG栅、硫酸铵栅、PEG/硫酸铵栅或等等来准备结晶化的尝试条件。可在结晶化条件中加入经确定可影响结晶化的添加剂。可在优化初步结晶化条件过程中使用添加剂筛,其中存在的添加剂可有助于样品的结晶化,且所述添加剂可改善晶体的质量,例如在蛋白质结晶化中使用甘油、多元醇和其他蛋白质稳定剂的HamptonResearch添加剂筛(R.Sousa.Acta.Cryst.(1995)D51,271-277)或者二价阳离子(Trakhanov,S.andQuiocho,F.A.ProteinScience(1995)4,9,1914-1919)。此外,可在结晶化条件中加入去垢剂以改善结晶化表现,例如HamptonResearch的去垢剂筛中的离子型、非离子型以及兼性离子去垢剂(McPherson,A.etal.Theeffectsofneutraldetergentsonthecrystallizationofsolubleproteins,J.CrystalGrowth(1986)76,547-553)。此外还可使用引晶方法改善晶体质量。这些包括微引晶、条纹引晶(streakseeding)和大引晶(macroseeding)。可使用商品化引晶制备试剂盒,例如HamptonResearch的那些。B.晶体坐标在又一方面,本发明还提供可溶性腺苷酸环化酶催化结构域的晶体,其具有表1所示的三维原子坐标。表1给出了非对称单元形式的、鉴定为包括原子1至7273的分子A的可溶性腺苷酸环化酶的催化结构域的原子坐标数据。在该表格的各行中,第二列表示原子编号,第三列表示原子,第四列为残基类型,第五列为链别(chainidentification)(A或B),第六列为残基编号,第七、八和九列分别是所考虑的原子的X、Y、Z坐标,第十列是该原子的占用(occupancy),第十一列为该原子的温度因子,第十二列为原子类型。表格中其余的原子(7274-8726)是水,其原子以上述相同的格式鉴定。表1的原子坐标所定义的结构的优势特征在于它们具有大约1.7_的分辨率。表2的原子坐标所定义的结构的优势特征在于它们具有大约1.9_的分辨率。表3和表4的原子坐标所定义的结构的优势特征在于它们具有大约2.0_的分辨率。表5的原子坐标所定义的结构的优势特征在于它们具有大约2.05_的分辨率。表1的原子坐标所定义的结构的特别优势在于它们描绘出一个具有未被配体占据的活性位点的结构。在另一个方面,本发明还提供与分子AMPCPP形成复合体的可溶性腺苷酸环化酶催化结构域的晶体,其具有表2所示的三维结构。表2给出了solAC与AMPCPP的复合体的原子坐标,其中所述蛋白质被鉴定为包括编号为1-7289的原子的分子A,AMPCPP分子包括编号为7291-7339的原子,一个钙离子被编号为7340,其余的原子编号为7341-8307,它们均为水分子。在该表格的各行中,第二列表示原子编号,第三列表示原子,第四列为残基类型,第五列为链别(chainidentification)(A或B),第六列为残基编号,第七、八和九列分别是所考虑的原子的X、Y、Z坐标,第十列是该原子的占用,第十一列为该原子的温度因子,第十二列为原子类型。表3给出了solAC与碳酸氢根的复合体的原子坐标数据。所述蛋白质被鉴定为包括编号为171-3909的原子的分子A。在该表格中,上述原子的前面是水分子(1-87和92-170)和碳酸氢根的原子(88-91)。表4给出了solAC与5-苯基-2H-[1,2,4]-三唑-3-硫醇(化合物1)的复合体的原子坐标数据,其中所述蛋白质被鉴定为包括编号为1-7499的原子的分子A,化合物1分子是原子7516-7534,而其后的分子是水。结构中还存在一个甘油分子,即原子7502至7514。表5给出了solAC与N-(3-苯氧基-苯基)-草酰酸(化合物2)的复合体的原子坐标数据,其中所述蛋白质被鉴定为包括编号为1-7478的原子的分子A,化合物2分子是原子7495-7523,而其后的分子是水。结构中还存在一个甘油分子,即原子7481至7493。关于solAC蛋白结构,表3-5各列的顺序与表2一样。表1、表2、表3、表4和表5均具有内部一致的格式。例如表1、2、4和5中,列出了各氨基酸残基的原子的坐标,使得主链氮原子在第一,随后是Cα主链碳原子,称为CA,随后是侧链残基的原子(根据标准的传统方式命名),而最后是蛋白质主链的碳和氧。表3中,蛋白质主链的碳和氧在侧链残基之前。表3还含有solAC结构的连续原子编号,而其他各表的编号采用计数蛋白质分子的氢原子的传统方式。本领域人员也可采用或者偏好其他的文件格式,所述格式可包括这些原子的不同顺序,或侧链残基和配体分子原子的不同命名。不过,采用不同文件格式来表示或者操作所述表格的坐标显然属于本发明的范围。表1、表2、表3、表4或表5的坐标提供了以埃(Angstrom)为单位的原子位置测量值,保留3位小数。坐标是一组相关的位置,定义了一个三维的形状,但本领域人员能够理解的是,具有不同原点和/或坐标轴的一组完全不同的坐标却可以定义相似的或相同的形状。此外,如前面在“定义”部分所述,本领域人员能够理解,改变所述结构的原子的相对原子位置使得均方根差小于1.5_,通常会得到与表1、表2、表3、表4或表5的结构基本相同的结构,无论是就其结构特征而言,还是就其用于对solAC与配体之间的相互作用性进行基于结构的分析的用途而言。类似地,本领域人员能够理解,改变各表中的水分子和/或配体分子的数量和/或位置一般不会影响所述结构用于对solAC与配体的相互作用进行基于结构的分析的用途。因此,对于在此所述的本发明个方面的目的,以下情况仍属于本发明的范围将表1、表2、表3、表4或表5的坐标转移至不同的原点和/或坐标轴;所述结构的原子的相对原子位置或其选定的坐标发生变化,但使得所得到的改变的结构当重叠于表1、表2、表3、表4或表5所提供的坐标时,其均方根差小于1.5_;和/或水分子和/或配体分子的数目和/或位置发生变化。如上所述,表1、表2、表3、表4或表5的solAC结构的优选的选定的坐标可以是如下所述的已经被我们鉴定为构成solAC的活性位点的主链或侧链原子的一或多个氨基酸残基的原子。此类原子包括那些存在于表6、7、8、9、10或11(如表6、7或11)中所示的氨基酸中的原子的一或多个。各个表的优选的选定的坐标、或来自两个或多个表的坐标的组合如在本申请其他部分所述一样。通过表1或表2的坐标来描述可溶性腺苷酸环化酶的催化结构域结构。残基Met1是在电子密度中能够观察到的第一个残基,而Lys468是最后一个。靠近Met1的主链氮原子的电子密度峰可能是乙酰化引起的,没有被建模。表1中不具有可判断的主链密度的残基是Trp135,Glu136,Glu137,Gly138,Leu139,Asp140,Phe350,Pro351,Gly352,Glu353,Lys354,Val355和Pro356。残基Val469和C端His标签在电子密度中是不可见的。靠近134位的首个断点(firstbreak)的主链定义不清楚,而残基132-134具有不均匀的(patchy)主链电子密度。残基304-306和451-455的电子密度的定义不清楚。此外,模型周边的一些残基的侧链被主观放置,因为它们没有可判断的密度。Phe350在表2中是可见的。进一步解析了可溶性腺苷酸环化酶的催化结构域的结构,并且对于表1中的未被解析的残基,这些结构中有一些也具有可判断的密度,使得能够获得更加完整的表3,表4或表5的坐标数据。为了将本发明解决的哺乳动物可溶性腺苷酸环化酶的结构与以往发表的细菌可溶性腺苷酸环化酶的结构进行比较,计算了可溶性腺苷酸环化酶与钝顶螺旋藻腺苷酸环化酶(PDBcode1wc1)(Steegborn,C.Litvin,T.Levin,L.R.Buck,J.andWu,H.(2005)Nat.Struc.AndMol.Biol.12,32-37)结构之间的均方根差。采用Comparer(SaliandBlundell(1990)JMolBiol.212,403-428)进行计算,以使所述结构和MNYFIT(Sutcliffeetal.1987)重叠,以使得重叠更加精确并计算均方根差。仅使用Cα原子的位置计算均方根差。将各个结构分解成其组成结构域以便进行重叠。这否定了结构域运动引起结构之间均方根差出现大的差异的问题。因此将可溶性腺苷酸环化酶的第一结构域(残基36-216)重叠于钝顶螺旋藻结构的B链,而将第二结构域(残基287-465)重叠于C链。采用2.5_的截断值来定义等价性(equivalence)(一个结构的Cα原子在被重叠的结构的Cα原子2.5_的范围内即是等价的)。对于可溶性腺苷酸环化酶第一结构域,181个残基中的116个被定义为与钝顶螺旋藻结构的残基等价,均方根差为1.2_。对于第二结构域,179个残基中的127个被定义为与钝顶螺旋藻结构的残基等价,均方根差为1.4_。引起这些均方根差值以及以2.5_截断值所鉴定到的低数目的等价残基的原因在于连接二级结构元件的序列中有多个区域在长度和方向上有差异。对重叠的研究还发现螺旋α3的长度的差异,哺乳动物环化酶的螺旋α3要短几个残基,而这些分子的核心β-折叠部分则很好地重叠,螺旋α2和α3的重叠差一些。因此,总体上,本发明的solAC结构的两个结构域与钝顶螺旋藻结构1wc1相比,总Cα原子的均方根差值明显超过1.5_。这些酶的二级结构有一些不同,例如人可溶性腺苷酸环化酶与tmAC或钝顶螺旋藻酶相比具有较短的β1链和较长的α1螺旋。solAC与tmAC类和钝顶螺旋藻solAC两者之间的主要区别在于存在一个额外的部分螺旋型结构域,其靠在假二聚体N端结构域的基底上。其由N端的残基1-26组成,残基1-12具有伸展的构象,13-19采用的是螺旋构象,其余的残基20-26与25-27延伸形成螺旋的一个转弯。该结构域的其余部分由残基219-284形成。这包括将形成N端结构域中的β8、形成C端结构域中的β1、以及形成C端结构域中的α1的残基。在残基219-284中,残基226-236、258-268和271-277形成3个螺旋。我们已经在solAC内部鉴定了若干个结合配体的区域。我们还发现,这些区域具有形成扩充的(expanded)配体结合位点的潜力,所述配体结合这些区域中的两个或多个。我们鉴定区域为(a)ATP结合位点、(b)碳酸氢根结合位点、(c)通道结合位点、和(d)亚袋结合位点。此外,我们还鉴定了(e),替代性的、潜在的别构位点。随后的实施例中将对这些位点给出更加详细的说明。(A)ATP结合位点此位点更多地被称为solAC的活性位点,由活性位点残基排列而成。下面的表6和7以单字母代码的形式给出了本发明鉴定到的SolAC的活性位点残基。表6solAC的活性位点残基表7与腺苷部分相互作用的solAC的活性位点残基。将与腺嘌呤基团形成氢键的残基自排列成疏水袋侧方的那些残基中区分出来。(B)碳酸氢根结合位点我们对solAC结构的分析发现了一个碳酸氢根结合区域。SolAC的三个残基与碳酸氢根离子相互作用,即Lys95、Val167和Arg176。使用一种具有带负电荷的硫原子(该硫原子与HCO3-离子位于几乎相同的位置)的化合物(5-苯基-2H-[1,2,4]-三唑-3-硫醇;″化合物1″),我们鉴定到一个扩充的碳酸氢根结合位点,其形成一个大的袋,与ATP结合位点邻近。该扩充的HCO3-结合位点指明了在设计solAC抑制剂或活化剂时可供开发的solAC结构的区域。表8给出了该扩充位点的残基。表8碳酸氢根结合位点残基在这些残基中,我们发现1)Lys95的NZ与HCO3-的O1形成盐桥(saltbridge);2)Val167的主链NH与HCO3-的O1形成带电氢键;3)Val167的主链羰基与HCO3-的OH形成氢键;4)Arg176的侧链NH2与HCO3-的O3形成盐桥;和5)Arg176的侧链NH2与HCO3-的OH形成带电氢键。在该扩充的碳酸氢根位点内,5-苯基-2H-[1,2,4]-三唑-3-硫醇的硫原子位于袋底部,并与Lys95的NZ形成盐桥,且与Val167的主链NH和Phe336的主链NH形成带电氢键。三唑的N6也与位于袋底部的Met337的主链羰基形成氢键。此外,三唑的N5与Arg176的NH2形成带电氢键。化合物1的苯基伸入由Phe45、Lys95、Ala97、Ala100、Leu102和Phe336的侧链所形成的化合物袋的主要为亲脂性的区域内。在该化合物的苯基之后,该袋在敞开进入ATP结合位点之前轻度缩小。该扩充的HCO3-结合位点的形状和在该化合物solAC复合体中所观察到的相互作用的性质提示该位点适合于多种配体。(C)通道结合位点结合于solAC的N-(3-苯氧基-苯基)-草酰酸(″化合物2″)的晶体结构揭示了可能被开发用于药物设计的solAC结构中的其他区域。化合物2的结合位点与化合物1中描述的扩充的HCO3-袋重叠,其使得化合物2的苯氧基占据了与化合物1的苯基非常相似的位置。然而,化合物2诱导了位于HCO3-结合位点底部的Lys95的大的侧链运动。该Lys95运动打开了HCO3-结合袋,形成一并入大的充水腔(cavity)的通道,然后开口于蛋白质表面与ATP结合位点相对的点上。以下残基(表9)排列成这一新发现的通道表9通道结合位点化合物2的草酰酸基团最大程度地伸入该通道,与所述蛋白质形成若干相互作用1)化合物2的O3与His164的ND形成带电氢键;2)化合物2的O1与Phe165的主链NH形成带电氢键;3)化合物2的O5氢键结合于Val335的主链NH;和4)化合物2的酰胺N6氢键结合于Phe165的主链羰基。Lys95、Phe165、Leu166、Val167和Phe336的侧链形成围绕化合物2的中心苯胺基芳族环的亲脂性环境。尽管化合物2的末端苯氧基结合于为化合物1所描述的相同的亲脂性袋内,但由于化合物2引起包含Met337、Phe338、Asp339、Lys340和Gly341的环发生运动,该袋的环境被轻度改变。该环的运动将Phe338拖离ATP位点,到达化合物2的末端苯氧基的范德瓦耳斯距离范围内。在apo、AMP-PNP和结合化合物1的solAC的结构中均没有观察到Phe338的这种运动。(D)亚袋结合位点对AMP-PNP复合体结构的进一步分析揭示,Phe338形成ATP位点的一端,靠近AMP-PNP核糖的羟基。Phe338的重新定位形成了与ATP结合位点邻近的新的亚袋。该新的亚袋由以下残基(表10)排列而成。表10亚袋残基(E)solAC上的替代性结合位点solAC分子表面的疏水性裂缝形成了对称相关分子N-末端的结合位点。N端甲硫氨酸的侧链切入(slotinto)由Phe89、Phe230和Phe226的侧链形成的疏水袋中。残基1-4的主链则切入一沟槽中,该沟槽的一侧由螺旋2末端的残基形成,而另一侧由来自包括残基编号Lys246、Asn247、Leu248和Leu249的环的残基形成,相对于钝顶螺旋藻腺苷酸环化酶而言,这些残基位于solAC的一个额外的结构域中。尽管无意于受到任何理论的局限,表11所示的上述这些残基可形成别构位点,且因此这可以成为solAC的配体的进一步的靶点。表11替代性结合位点残基复合体结构浸渗了AMPCPP的可溶性腺苷酸环化酶的结构为该蛋白质的核苷酸结合袋提供了结构信息,特别是为核苷酸的腺苷部分的核苷酸结合袋。该结构于是可用于构建类似的结构与solAC的相互作用模型,用于设计更加有效的调变剂,例如抑制剂或活化剂。更一般性而言,浸渗了其他配体的可溶性腺苷酸环化酶的结构提供了该蛋白质的其他结合袋的结构信息。solAC残基的鉴定和用途solAC的晶体结构已经使得能够精确鉴定所有在ATP结合袋区域内排列成该酶结合位点的残基(表6)。因此,在本发明的一个优选的方面,其中本发明预期了选定的坐标在本发明的方法中用途,此类选定的坐标将包括选自表6的氨基酸残基的至少一个坐标、优选地至少一个侧链坐标。更优选地,所述选定的坐标包括选自表7的氨基酸残基的至少一个坐标、优选地至少一个侧链坐标。表6的残基特别适合于设计小分子配体。同样优选的是,无论是选定特定氨基酸的所有原子还是仅仅某些原子,所述选定的坐标的至少5个、更优选地至少10个、且最优选地至少50个来自相应数目的不同氨基酸残基的侧链残基。这些可以排他性地选自表6、7或11。在其他实施方式中,其中本发明预期选定的坐标在本发明的方法中的用途,此类选定的坐标将包括选自表6、7或11中的氨基酸残基的至少一个坐标、优选地至少一个侧链坐标。C.嵌合体使用嵌合蛋白来实现所需的特性在科技文献中是常见的。因此,solAC的变体可以是嵌合体。特别相关的情况是改进活性位点以便提供代用系统以获得结构信息。例如,Ikuta等(JBiolChem(2001)276,27548-27554)改进了cdk2的活性位点,这样他们便能够获得其结构数据,以模拟目前尚无任何X线结构的cdk4的结构。以这种方式,他们能够自嵌合蛋白获得蛋白质/配体结构,用于设计cdk4抑制剂。以类似的方式,基于比较有关solAC异构体的一级序列,可以改进本发明的solAC的结合位点以模拟那些异构体。可使用嵌合蛋白的蛋白质结构或蛋白质/配体结构,基于结构筛选出作为该有关的solAC异构体的配体的化合物。即使在此所述的solAC与其他异构体之间的氨基酸序列相同性百分比在20至80%的范围,solAC蛋白的总体折叠仍然可以预期是非常相似的,结构元件具有相同的空间分布。D.同源性建模本发明还提供对其他蛋白质(下文称为靶腺苷酸环化酶蛋白)进行同源性建模的手段。“同源性建模”指的是采用计算机辅助从头预测结构的方法,基于处理来自表1、表2、表3、表4或表5的坐标数据或其选定的坐标,来预测有关的腺苷酸环化酶结构。“同源性建模”延及靶腺苷酸环化酶蛋白,它们是经所附实施例已经确定其结构的solAC蛋白的类似物或同源物。其也延及solAC蛋白本身的蛋白质突变体。术语“同源性区域”描述的是两个序列中那些相同的或者具有相似的(例如脂肪族、芳香族、极性、带负电荷的或带正电荷的)侧链化学基团的氨基酸残基。同源性区域中相同的和相似的残基有时被本领域人员分别描述为是“不变的”和“保守的”。总体而言,所述方法涉及通过氨基酸序列比对而比较solAC蛋白与靶蛋白的氨基酸序列。然后比较序列中的氨基酸并汇总具有同源性的氨基酸群体(方便地称为“相应区域”)。该方法检测多肽的保守区域并考虑氨基酸插入和或缺失。可采用商品化的算法确定氨基酸序列之间的同源性。算法BLAST、缺口BLAST、BLASTN、PSI-BLAST、BLAST2和WU-BLAST(由NationalCenterforBiotechnologyInformation提供)被广泛用于此目的,并可比对两种或更多的氨基酸序列的同源性区域。可使用这些方法的默认参数来确定solAC和待建模的其他靶蛋白的氨基酸序列之间的同源性程度。优选地用于本发明的是WU-BLAST(WashingtonUniversityBLAST)版本2.0软件。用于若干UNIX平台的WU-BLAST版本2.0可执行程序可自ftp://blast.wustl.edu/blast/executables下载。该程序基于WU-BLAST版本1.4,后者则基于公共领域NCBI-BLAST版本1.4(AltschulandGish,1996,Localalignmentstatistics,Doolittleed.MethodsinEnzymology266460-480;Altschuletal.1990,Basiclocalalignmentsearchtool,JournalofMolecularBiology215403-410;GishandStates,1993,Identificationofproteincodingregionsbydatabasesimilaritysearch,NatureGenetics3266-272;KarlinandAltschul,1993,Applicationsandstatisticsformultiplehigh-scoringsegmentsinmolecularsequences,Proc.Natl.Acad.Sci.USA905873-5877;allofwhichareincorporatedbyreferenceherein)。在所有成套的搜索程序中,缺口比对常规对于数据库搜索本身而言是完整的。如果需要可关闭缺口。对于长度1的缺口的默认罚分(Q)为,对于蛋白质和BLASTP,Q=9;对于BLASTN,Q=10;但可以变为任何整数。对于缺口延伸的默认的每残基罚分(R)为,对于蛋白质和BLASTP,R=2;而对于BLASTN,R=10,但可以变为任何整数。为了比对序列,可使用Q和R的任何组合值,以便使得重叠和相同性最大化,而使得序列缺口最小化。默认氨基酸比较矩阵是BLOSUM62,但也可采用其他氨基酸比较矩阵,例如PAM。类似物被定义为具有相似的三维结构和/或功能的蛋白质,在序列水平极少有共同始祖的证据。同源物是具有共同始祖证据的蛋白质,即很可能是进化趋异的产物,并基于序列相同性的程度(通常表示为百分数)而分为远、中和近亚组(sub-divisions)。同源物在此的定义为与人solAC具有至少大约20%、例如至少25%、至少30%、至少35%、至少40%、至少50%、优选地至少60%、更优选地至少70%、更优选地至少80%、更优选地至少90%且更优选地至少95%序列相同性的蛋白质。这包括solAC的多态性形式和物种形式,包括下文表12和13中提及的那些物种。表12和13显示哺乳动物可溶性腺苷酸环化酶之间的百分比相同性。表12哺乳动物可溶性腺苷酸环化酶之间的百分比相同性。在整个序列上进行比较。表13哺乳动物可溶性腺苷酸环化酶之间的百分比相同性。仅在催化结构域序列之间进行比较。有两种类型的同源物直系同源物(orthologues)和平行进化同源物(paralogues)。直系同源物被定义为不同生物体内的同源性基因,即所述基因具有与产生它们的物种形成事件同时存在的共同始祖。平行进化同源物被定义为相同生物体内的、源自基因/染色体/基因组复制的同源性基因,即基因的共同始祖出现于最近的物种形成事件之后。同源物还可以是solAC的多态性形式,例如(A)部分所述的等位基因或突变体或(D)部分所述的嵌合体。一旦将结构已知和结构未知的多肽的氨基酸序列进行比对,便将结构已知的多肽的计算机图象中的保守氨基酸的结构转移至结构未知的多肽的相应的氨基酸。例如,结构已知的氨基酸序列中的酪氨酸可以被替换为苯丙氨酸,即结构未知的氨基酸序列内相应的同源性氨基酸。可以采用标准的肽几何学或者通过分子模拟技术如分子动力学来人工指定位于非保守区域的氨基酸的结构。通过采用分子动力学和/或能量最小化使得整个结构更加精确,从而完成方法的最后步骤。这样的同源性建模本领域人员熟知的技术(见例如Greer,(Science,Vol.228,(1985),1055)和Blundelletal.(Eur.J.Biochem,Vol.172,(1988),513)。可采用这些参考文献所公开的技术以及通常现有技术中存在的其他同源性建模技术实施本发明。因此,本发明提供同源性建模的方法,包括以下步骤(a)将三维结构未知的靶solAC蛋白的氨基酸序列的图象与表1、表2、表3、表4或表5或其选定的坐标的solAC的氨基酸序列进行比对,以匹配氨基酸序列的同源性区域,所述表1、表2、表3、表4或表5任选地有变化,但均方根差不超过1.5_;(b)在表1、表2、表3、表4或表5或其选定的坐标所定义的solAC结构的相应区域上构建所述结构未知的靶solAC的相匹配的同源性区域的结构的模型,所述表1、表2、表3、表4或表5任选地有变化,但均方根差不超过1.5_;和(c)确定所述结构未知的靶solAC的构象,所述靶solAC基本上保留所述相匹配的同源性区域的结构。所述结构未知的靶solAC的构象例如是在结构未知的靶腺苷酸环化酶内部形成有利的相互作用的构象和/或形成低能量构象的构象。优选地通过计算机建模进行步骤(a)至(c)的一个或所有步骤。表1、表2、表3、表4或表5的坐标数据或其选定的坐标对其他腺苷酸环化酶的同源性建模是特别有利的。在此所述的在硅片上(insilico)使用solAC结构的本发明的各个方面可同等地应用于通过本发明的上述方面获得的腺苷酸环化酶的同源物模型,并且这一用途形成本发明的另一个方面。因此,采用上述方法确定腺苷酸环化酶的构象后,该构象可用于在此所述的基于计算机的合理性药物设计方法中。E.结构解析solAC的原子坐标数据也可用于解析其他靶腺苷酸环化酶蛋白的晶体结构,包括solAC的其他晶体形式、solAC的突变体、共复合体,其中这些靶腺苷酸环化酶蛋白的X线衍射数据或NMR谱数据已经产生,需要解释以提供结构。对于solAC,该蛋白质可以一种以上的晶体形式结晶化。本发明提供的表1、表2、表3、表4或表5的数据或其选定的坐标特别有助于解析solAC的其他晶体形式。其还可用于解析solAC突变体、solAC共复合体、或与solAC的任何功能结构域具有显著氨基酸序列同源性的任何其他蛋白质的晶体形式的结构。对于其他靶腺苷酸环化酶蛋白,特别是同源性哺乳动物可溶性腺苷酸环化酶,例如来自表12和13中提及的物种的那些,在产生了最初的X线衍射数据的情况下,本发明使得能够更容易地获得此类靶的结构。因此,在提供了靶蛋白质腺苷酸环化酶或三维结构未知的solAC的X线晶体学数据或NMR谱数据的情况下,来自表1、表2、表3、表4或表5的原子坐标数据可用于解释上述数据,通过本领域熟知的技术,例如X线结晶学中的定相(phasing)以及NMR谱中的辅助峰分配,为其他腺苷酸环化酶提供可能的结构。可用于这些目的的一个方法是分子置换。在该方法中,可采用本发明的表1、表2、表3、表4或表5的所有或部分solAC结构坐标来确定未知的晶体结构,无论其是另一种晶体形式的solAC、solAC突变体、solAC嵌合体或solAC共复合体、或与solAC的任何功能结构域具有氨基酸序列同源性的靶腺苷酸环化酶蛋白的晶体。与试图从头开始确定这些结构相比,该方法可更快地且更高效地为未知晶体提供准确的结构形式。本领域已知的用于进行分子置换的计算机程序是CNX(BrungerA.T.AdamsP.D.RiceL.M.CurrentOpinioninStructuralBiology,Volume8,Issue5,October1998,Pages606-611(也可购自AccelrysSanDiego,CA),MOLREP(A.Vagin,A.Teplyakov,MOLREPanautomatedprogramformolecularreplacement,J.Appl.Cryst.(1997)30,1022-1025,partoftheCCP4suite)或AMoRe(Navaza,J.(1994)。AMoReanautomatedpackageformolecularreplacement.ActaCryst.A50,157-163)。因此,本发明的另一个方面提供与确定蛋白质结构的方法,该方法包括提供表1、表2、表3、表4或表5的坐标或其选定的坐标,所述表1、表2、表3、表4或表5的坐标任选地有变化,但均方根差小于1.5_;和或者(a)使所述坐标在所述蛋白质的晶体晶胞中定位以便提供所述蛋白质的结构,或者(b)通过操作所述坐标来分配所述蛋白质的NMR谱峰。优选地,表1、表2、表3、表4或表5的坐标或其选定的坐标,包括表6至11中任一(例如表6、7或11)所示的氨基酸残基的原子坐标。各表中优选的选定的坐标或来自两个或多个表的坐标组合如本申请其他部分所述。本发明还可用于通过操作表1、表2、表3、表4或表5的数据而分配此类蛋白质的NMR谱峰。在本发明的一个优选的方面,所述坐标用于解析靶腺苷酸环化酶的结构,特别是solAC的同源物,例如其他腺苷酸环化酶,且特别是来自不同物种的solAC异构体。F.计算机系统在另一方面,本发明提供系统,特别是计算机系统,用于产生以下各项的结构和/或对其进行优化与solAC、solAC同源物或类似物相互作用的配体、solAC与配体的复合体、或solAC同源物或类似物与配体的复合体,所述系统含有计算机可读数据,所述数据包含以下一或多项(a)表1、表2、表3、表4或表5的solAC坐标数据或其选定的坐标,所述数据定义solAC催化结构域的三维结构;(b)基于表1、表2、表3、表4或表5的坐标数据通过对所述靶进行同源性建模而产生的靶腺苷酸环化酶蛋白的原子坐标数据;(c)通过参照表1、表2、表3、表4或表5的坐标数据解释X线晶体学数据或NMR数据而产生的靶腺苷酸环化酶蛋白的原子坐标数据;(d)可自(b)或(c)的原子坐标数据导出的结构因素数据;和(e)表1、表2、表3、表4或表5的原子坐标数据或其选定的坐标,所述原子坐标数据任选地有变化,但均方根差小于1.5_。例如,所述计算机系统可包括(i)计算机可读数据存储介质,其包括编码有所述计算机可读数据的数据存储材料;(ii)工作内存,用于存储处理所述计算机可读数据的指令;和(iii)中央处理器,其偶联于所述工作内存并偶联于所述计算机可读数据存储介质,用于处理所述计算机可读数据并由此产生结构和/或进行合理性药物设计。所述计算机系统可进一步包括偶联于所述中央处理器的、用于显示所述结构的显示装置。本发明还提供含有靶腺苷酸环化酶蛋白的原子坐标数据的此类系统,其中基于表1、表2、表3、表4或表5的数据或其选定的坐标所提供的初始数据,根据在此所述的本发明的方法已经产生了此类数据。此类数据有多种用途,包括产生结构以分析腺苷酸环化酶蛋白的作用机制和/或进行与solAC相互作用的配体的合理性药物设计,例如被腺苷酸环化酶代谢的化合物。在另一方面,本发明提供计算机可读存储介质,包括编码有计算机可读数据的数据存储材料,其中所述数据通过表1、表2、表3、表4或表5或其选定的坐标的solAC蛋白或solAC的同源物的结构坐标而定义,其中所述同源物包含的主链原子与来自所述表1、表2、表3、表4或表5或其选定的坐标的主链原子的均方根差小于1.5_。在又一方面,提供了计算机可读存储介质,其包括编码有第一组计算机可读数据的数据存储材料,所述第一组计算机可读数据包括由表1、表2、表3、表4或表5的结构或其选定的坐标所定义的solAC蛋白的结构坐标的至少一部分的傅里叶分析变换,所述表1、表2、表3、表4或表5的结构任选地有变化,但均方根差小于1.5_;所述数据当与包括结构未知的分子或分子复合体的X线衍射模式(pattern)的第二组机读数据相组合时,利用由使用所述第一组数据和所述第二组数据的指令程序化的机器,可确定相应于第二组机读数据的至少一部分结构坐标。在此,“计算机可读介质”指的是计算机能够直接阅读或者存取的任何介质。此类介质包括但不限于磁性存储介质如软盘、硬盘存储介质和磁带;光学存储介质例如光盘或CD-ROM;电存储介质例如RAM和ROM;和上述类别的混合例如磁性/光学存储介质。通过提供计算机可读介质,可常规获取到本发明的原子坐标数据以构建腺苷酸环化酶或其选定的坐标的模型。例如,RASMOL(Sayleetal.TIBS,Vol.20,(1995),374)是一种公用计算机软件包,其能够用于获取并分析原子坐标数据,用于结构确定和/或合理性药物设计。在此,“计算机系统”指的是用于分析本发明的原子坐标数据的硬件、软件和数据存储装置。本发明的基于计算机的系统的最少硬件包括中央处理器(CPU)、输入装置、输出装置和数据存储装置。希望提供显示器以便显示结构数据。数据存储装置可以是RAM或用于读取本发明的计算机可读介质的装置。此类系统的实例是微电脑工作站。可来自SiliconGraphicsIncorporated和SunMicrosystems,运行Unixbased、WindowsXP或IBMOS/2操作系统。本发明还提供计算机可读数据存储介质,其包括编码有第一组计算机可读数据的数据存储材料,所述第一组计算机可读数据包括表1、表2、表3、表4或表5的solAC坐标或其选定的坐标;所述数据当与包括结构未知的分子或分子复合体的X线衍射模式的第二组机读数据相组合时,利用由使用所述第一组数据和所述第二组数据的指令程序化的机器,可确定相应于第二组机读数据的至少一部分电子密度。本发明的另一方面提供为产生与solAC、solAC同源物或类似物相互作用的配体、solAC与配体的复合体、或solAC同源物或类似物与配体的复合体的结构和/或对与solAC、solAC同源物或类似物相互作用的配体、solAC与配体的复合体、或solAC同源物或类似物与配体的复合体进行优化而提供数据的方法,所述方法包括(i)与远程装置建立通讯,所述远程装置含有(a)计算机可读数据,包括表1、表2、表3、表4或表5的原子坐标数据或其选定的坐标,所述原子坐标数据任选地有变化,但均方根差小于1.5_,所述数据定义solAC催化结构域的三维结构或其选定的坐标;(b)基于(a)的数据通过对所述靶进行同源性建模而产生的靶腺苷酸环化酶同源物或类似物的原子坐标数据;(c)通过参照表1、表2、表3、表4或表5的数据来解释X线晶体学数据或NMR数据而产生的蛋白质的原子坐标数据;和(d)可自(a)或(c)的原子坐标数据导出的结构因素数据;和(ii)接收来自所述远程装置的所述计算机可读数据。在又一方面,本发明提供计算机用于产生solAC结构或solAC-配体复合体的三维图象的用途,其中所述solAC结构来自表1、表2、表3、表4或表5或其选定的坐标,所述表1、表2、表3、表4或表5任选地有变化,但均方根差不超过1.5_,其中所述计算机包括(i)计算机可读数据存储介质,其包括编码有计算机可读数据的数据存储材料,其中所述数据包括表1、表2、表3、表4或表5的结构或其选定的坐标,所述表1、表2、表3、表4或表5任选地有变化,但均方根差不超过1.5_;(ii)将所述计算机可读数据处理成所述三维图象的指令。计算机还可包括用于显示所述三维图象的显示装置。接收自所述远程装置的计算机可读数据,特别是当所述数据的形式为表1、表2、表3、表4或表5的原子坐标数据或其选定的坐标,且所述原子坐标数据任选地有变化,但均方根差小于1.5_时,可用于在此所述的本发明的方法,例如用于分析配体结构和solAC结构。因此,远程装置可包括例如本发明签署各方面之一的计算机系统或计算机可读介质。装置可以在不同的国家或行政区,自该处收到计算机可读数据。通讯可以通过互联网、内部网、电子邮件等等,可通过有线或无线方式传输,例如地面电台或卫星。典型地,通讯是电子的,但部分或全部通讯途径可以是光学的,例如,通过光纤。G.本发明分结构的用途根据本发明获得的晶体结构以及根据在此所述的方法获得的靶腺苷酸环化酶蛋白的结构可用于多种药物设计途径。例如,可通过参照表1、表2、表3、表4或表5的坐标数据或其选定的坐标设计对solAC具有选择性的配体,例如对solAC的核苷酸结合区域具有选择性的配体。在一个方面,非环化核苷酸类似物AMPCPP能够结合至多种不同腺苷酸环化酶的核苷酸结合袋中。使用本发明的solAC催化结构域的结构能够设计出一些结构,与其他腺苷酸环化酶相比,它们对solAC具有更高的特异性。更通常地,本发明的结构可用于提供、设计、修饰或者分析solAC的调变剂。在此,solAC的“调变剂”指的是一种配体,其引起solAC蛋白的生物学活性水平的变化(即调变)。因此,调变涵盖引起solAC活性升高或降低的生理学改变。在前一种情况中,调变可以称为活化;对于后一种情况则是抑制。调变可以作为配体结合于solAC的ATP结合位点的结果而直接产生,或者可以间接地产生,例如通过配体结合于solAC的任何位点,由此影响solAC的活性或其与其他蛋白质的相互作用。所述相互作用可以包括与其他基因产物或蛋白质的相互作用,它们将solAC酶定位于特定的细胞器(例如线粒体、中心体、有丝分裂纺锤体、细胞核),或引起solAC与效应分子(例如PKA)之间的相互作用,或者是酶活性的水平(例如通过别构机制、竞争抑制、活性位点失活、干扰反馈抑制途径等等)。因此,调变可以是由此类机制导致的solAC的过表达或低表达,以及配体结合于ATP结合位点、或碳酸氢根结合位点、或任何其他在此所述的位点所引起的高(或者低)活性。可相应地解释所用的与solAC有关的术语“调变剂”、“调变作用”和“调变”。例如,可通过共结晶化、浸渗或计算配体对接而确定配体在结合袋中的结合方向的信息。这可指导对所设计的化学结构进行特定的修饰,以介导或控制配体与所述蛋白质的相互作用。此类修饰的目的可以是改进配体与solAC的相互作用,以便改善其治疗作用。因此,确定solAC的三维结构为设计新的配体(例如与solAC相互作用的化合物)提供了基础。例如,知道了solAC的三维结构,即可使用计算机建模程序设计不同的分子,用于与solAC的可能的或确定的活性位点相互作用,例如结合位点或solAC的其他结构或功能特征。(i)获得和分析晶体复合体在一种方法中,可通过实验确定结合于solAC的配体的结构。这将是分析结合于solAC的配体的出发点,由此使得本领域人员能够详细了解特定的配体如何与solAC相互作用以及,例如,其与ATP竞争结合袋的机制。上述许多用于基于结构的药物设计的技术和方法在一定阶段依赖于X线分析以鉴定配体-蛋白质复合体中的配体的结合位置。这样做的一个常规途径是对复合体进行X线结晶学分析,产生差异傅里叶分析电子密度图,并将特定的电子密度模式与配体相关联。不过,为了产生所述的图(有关解释例如可见Blundelletal.inProteinCrystallography,AcademicPress,NewYork,LondonandSanFrancisco,(1976)),有必要事先知道蛋白质的3D结构(或者至少是蛋白质晶体的一组结构因子)。因此,确定solAC结构也使得能够产生solAC-配体复合体的差异傅里叶分析电子密度图,确定药物的结合位置,并因此可极大地帮助合理性药物设计的过程。因此,本发明提供用于确定结合于solAC的配体的结构的方法,所述方法包括提供solAC蛋白的晶体;以配体浸渗所述晶体以形成复合体;和采用表1、表2、表3、表4或表5的数据或其选定的坐标确定所述复合体的结构,所述数据任选地有变化,但均方根差不超过1.5_。或者,solAC和催化结构域与配体可以共结晶化。将纯化的蛋白质样品与潜在的配体温育一段时间(通常>1hr)。然后可筛选蛋白质配体复合体的结晶化条件。或者,可通过将晶体放入不含有配体的稳定化溶液中,对含有一个配体的蛋白质晶体进行反向浸渗(back-soak),以去除配体。所得晶体然后可转移至含有不同配体的第二溶液中。因此本发明提供用于确定结合于solAC的配体的结构的方法,所述方法包括将solAC蛋白与配体混合;使solAC蛋白-配体复合体结晶化;和采用表1、表2、表3、表4或表5的数据或其选定的坐标确定复合体的结构,所述数据任选地有变化,但均方根差小于1.5_。可用化合物的混合物浸渗晶体或与晶体共结晶,其中这些化合物中仅有一种或者一些预期可结合于solAC。所述化合物的混合物可包括已知结合于solAC的配体。与复合体的结构一样,然后确定复合的化合物的性质。所述方法还可包括进一步的步骤(a)获得或合成所述候选配体;(b)形成solAC与所述候选配体的复合体;和(c)通过X线结晶学或NMR谱来分析所述复合体,以确定所述候选配体与solAC相互作用的能力。对此类结构的分析可采用(i)来自所述复合体的X线结晶学衍射数据,和(ii)solAC的三维结构或至少其选定的坐标,以产生复合体的差异傅里叶分析电子密度图,三维结构通过表1、表2、表3、表4或表5的原子坐标数据或其选定的坐标而定义。差异傅里叶分析电子密度图随后可用于分析。因此,此类复合体可结晶化并采用X线衍射方法进行分析,例如根据Greeretal.(J.ofMedicinalChemistry,Vol.37,(1994),1035-1054)的方法,而差异傅里叶分析电子密度图可基于浸渗的或共结晶的solAC的X线衍射模式以及已解析的非复合的solAC的结构而计算。然后可对这些图进行分析,例如用于确定特定配体是否以及在何处结合于solAC和/或改变solAC的构象。电子密度图可通过程序进行计算,例如来自CCP4计算软件包(CollaborativeComputationalProject4.TheCCP4SuiteProgramsforProteinCrystallography,ActaCrystallographica,D50,(1994),760-763.)的那些程序。对于显示图以及建模而言,可使用例如“O”(Jonesetal.ActaCrystallographica,A47,(1991),110-119)的程序。此外,根据本发明,solAC突变体可与已知的solAC配体或新的配体共结晶化于共复合体中。然后可通过分子置换解析一系列此类复合体的晶体结构,并与表1、表2、表3、表4或表5的solAC结构或其选定的坐标相比较。由此可以鉴定所述酶的不同结合位点内的用于修饰的潜在位点。这一信息为确定solAC和配体之间最高效的结合相互作用,例如,增强的疏水性相互作用,提供了一种额外的工具。可采用熟知的X线衍射技术来研究上述所有的复合体,并对照1.5至3.5_分辨率的X线数据使其更加精确,达到R值为大约0.30,或者可采用较少使用的计算机软件,例如CNX(Brungeretal.CurrentOpinioninStructuralBiology,Vol.8,Issue5,October1998,606-611,且可购自Accelrys,SanDiego,CA),andasdescribedbyBlundelletal,(1976)andMethodsinEnzymology,vol.114&115,H.W.Wyckoffetal.eds.AcademicPress(1985)。这一信息因此可用于优化已知类型的solAC配体,且更重要的是,用于设计并合成新类型的solAC配体,特别是抑制剂或活化剂,以及用于设计具有改善的solAC相互作用的药物。(ii)硅片上分析和设计尽管本发明有助于确定包含solAC催化结构域和与所述solAC催化结构域相互作用的配体的真实晶体结构,但目前的计算技术提供了一种强有力的替代方法来满足产生此类晶体和分析衍射数据的需求。因此,本发明的一个特别优选的方面涉及基于计算机(“硅片上(insilico)”)的方法,其目的在于分析和开发与本发明的solAC结构相互作用的配体。确定solAC催化结构域的三维结构提供了关于solAC的结合位点的重要信息,当与相似的酶进行比较时尤为如此。随后,例如通过为结合位点鉴定可能的结合配体的计算技术、通过实现药物设计的连接片段方法(linked-fragmentapproaches)、以及通过采用X线晶体学分析实现所结合的配体的鉴定和定位,这种信息可用于solAC配体的合理性设计和改进。下文对这些技术进行更加详细的讨论。因此,作为确定solAC三维结构的结果,也可使用更纯粹的合理性药物设计计算技术来设计那些对其与solAC的相互作用有了更多了解的结构。关于这些技术的综述请参见例如Waltersetal(DrugDiscoveryToday,Vol.3,No.4,(1998),160-178;Abagyan,R.Totrov,M.Curr.Opin.Chem.Biol.2001,5,375-382)。例如,可运用自动化配体-受体对接程序(见例如Jonesetal.inCurrentOpinioninBiotechnology,Vol.6,(1995),652-656andHalperin,I.Ma,B.Wolfson,H.Nussinov,R.Proteins2002,47,409-443),其需要靶受体的原子坐标的精确信息。在此所述的在硅片上利用solAC结构的本发明的各个方面可同等适用于表1、表2、表3、表4或表5的solAC结构或其选定的坐标以及通过本发明的其他方面获得的靶腺苷酸环化酶蛋白模型。因此,通过上述方法确定了solAC的构象之后,该构象即可用于在此所述的基于计算机的合理性药物设计方法中。此外,得到solAC的结构将允许产生用于虚拟文库筛选或配体设计的具有高度预测性的药效团模型。因此,本发明提供用于分析配体与solAC结构的相互作用的方法,其包括提供表1、表2、表3、表4或表5的solAC结构或其选定的坐标,所述solAC结构任选地有变化,但均方根差不超过1.5_;提供待与所述solAC结构或其选定的坐标相适配的配体;和使所述配体与所述solAC结构相适配。本发明的这一方法广泛适用于对已知的solAC配体进行分析、开发或发现solAC配体、修饰solAC的配体,例如提高或改进它们的一或多个特性,等等。实施本发明的方法时,可根据本领域已知的标准技术在计算机模型中再现表1、表2、表3、表4或表5的solAC结构或其选定的坐标。本领域人员熟习在这些方法中提供蛋白质三维图象的方法。合适的模型包括(a)线框模型(wire-framemodel);(b)网状模型(chicken-wiremodel);(c)球棍模型;(d)空间填充模型;(e)棍状模型(stick-model);(f)带状模型;(g)活动轮廓模型(snakemodel);(h)箭头圆柱模型(arrowandcylindermodel);(i)电子密度图;或(j)分子表面模型。选定的坐标可来自表6至11中任一(例如表6、7或11)所列出的一些或全部氨基酸的一或多个侧链或主链原子,其中这些坐标的优选的数目和组合在本文其他部分描述。在另一个方面,本发明的方法可利用solAC配体结合区域的感兴趣的原子的坐标,这些原子邻近推定的配体结构,例如位于催化区域的10-25_范围内,或位于结合的配体的5-10_范围内,以便构建所述结构结合于其中的袋的模型。这些坐标可用于定义一个空间,随后如上所述在硅片上对其进行分析。实践中,希望构建的模型有足够数目的由表1、表2、表3、表4或表5的坐标或其选定的坐标所定义的solAC的原子,所述原子代表结合袋,例如表6至11中任一(例如表6、7或11)所鉴定的残基的原子。各表的优选的选定的坐标或来自两个或多个表的坐标的组合在本文其他部分描述。结合袋以及solAC与配体相互作用的其他特征在所附实施例中描述。尽管solAC结合的每一种不同配体可与该蛋白质的结合袋的不同部分相互作用,但solAC的结构允许鉴定多个特定位点,它们可能参与solAC与候选药物之间相互作用的多个方面。表6至11,例如表6、7、或11,给出了所述残基。因此,在本发明的这一方面,选定的坐标可包括这些残基的一些或全部残基的坐标。各表的优选的选定的坐标或来自两个或多个表的坐标的组合在本文其他部分描述。为了提供待与本发明的solAC结构相适配的配体的三维结构,可使用用于此目的的商品化软件来构建三维的配体结构,或者如果已经有了其晶体结构,可使用所述结构的坐标来提供用来与本发明的solAC结构进行适配的配体的图象。可合成新设计的配体结构,可确定或预测它们与solAC的相互作用,这些新设计的结构如何被所述solAC结构结合。可重复这一方法以便进一步改变其与solAC的相互作用。“适配(fitting)”指的是以自动或者半自动的方式确定候选分子的一或多个原子与本发明的solAC结构的至少一个原子之间的相互作用,并计算此类相互作用的温度程度。相互作用包括吸引和排斥、由电荷、空间、亲脂性等因素引起的,等等。可提供计算来构建此类电荷和空间相互作用的模型。此类计算的实例可通过力场,例如Amber(Cornelletal.ASecondGeneration力场fortheSimulationofProteins,NucleicAcids,andOrganicMolecules,JournaloftheAmericanChemicalSociety,(1995),117(19),5179-97),其能够将部分电荷分配给蛋白质和配体上的原子,并使用Coulomb电势评价蛋白质和配体原子之间的静电相互作用能。Amber力场还可分配范德瓦耳斯能以评价两个原子之间的吸引性和排斥性空间相互作用。可采用多种方式构建亲脂性相互作用模型。例如,ChemScore功能(EldridgeMD;MurrayCW;AutonTR;PaoliniGV;MeeRPEmpiricalscoringfunctionsI.Thedevelopmentofafastempiricalscoringfunctiontoestimatethebindingaffinityofligandsinreceptorcomplexes,Journalofcomputer-aidedmoleculardesign(1997Sep),11(5),425-45)将蛋白质和配体原子分为疏水性或极性,两个疏水性原子之间的相互作用具有有利的能量期。评价疏水性对配体结合的作用的其他方法是本领域人员已知的。评价相互作用的其他方法是分子设计领域的人员已知的。在此将进一步描述基于计算机的适配方法。更具体地,可通过使用计算机建模来检测配体与本发明的solAC结构的相互作用,使用的对接软件例如为GOLD(Jonesetal.J.Mol.Biol.245,43-53(1995),Jonesetal.J.Mol.Biol.267,727-748(1997)),GRAMM(Vakser,I.A.Proteins,Suppl.1226-230(1997)),DOCK(Kuntzetal,(1982)J.Mol.Biol.161,269-288;Makinoetal,(1997)J.Comput.Chem.18,1812-1825),AUTODOCK(Goodselletal,(1990)Proteins,8,195-202,Morrisetal,(1998)J.Comput.Chem.19,1639-l662.),FlexX,(Rareyetal,(1996)J.Mol.Biol.261,470-489)或ICM(Abagyanetal,(1994)J.Comput.Chem.15,488-506)。这一过程可包括用计算机将配体与solAC进行适配,以证实怎样的配体形状和化学结构将结合于solAC。还可对solAC的活性位点结构进行计算机辅助的人工检测。可使用的软件例如为GRID(Goodford,(1985)J.Med.Chem.28,849-857),该程序确定具有不同官能团的分子与酶表面之间的可能的相互作用位点,该程序也可用于分析活性位点以预测,例如,可能改变配体代谢率的修饰类型。可使用计算机程序来估计两个结合配偶体(即solAC结构和配体)的吸引、排斥、和空间位阻。如果表征了一个以上的solAC活性位点袋,并设计或选定了多个相应的较小的配体,则可通过将相应的小配体连接成更大的配体而形成配体,而其仍然保持各个配体在其活性位点的相应的位置和方向。可作为真实的分子或通过计算机建模而形成所述更大的配体。然后可获得关于配体与solAC结合的更详细的结构信息,且基于这些信息可对配体的结构或功能性进行调整,例如改变其与solAC的相互作用。必要时,上述步骤可以重复并再重复。在另一方面,本发明提供用于鉴定调变solAC活性的配体的方法,包括以下步骤(a)使用表1、表2、表3、表4或表5的三维原子坐标数据或其选定的坐标,所述三维原子坐标数据任选地有变化,但均方根差不超过1.5_,以表征至少一种solAC结合位点且优选地多个solAC结合位点;(b)提供候选配体的结构;(c)将候选配体与所述一或多个结合位点进行适配;和(d)选择与所述一或多个位点适配的候选配体。在一个实施方式中,筛选或探查多个候选配体与结合位点的相互作用。在一个实例中,步骤(b)包括提供候选配体的结构,然后将其中的每一个在步骤(c)中适配,以便在数据库中(如CambridgeStructuralDatabase)以计算方式筛选与结合位点相互作用的化合物,即可通过以计算方式筛选数据库中与结合位点相互作用的配体而选择候选配体(见Martin,J.Med.Chem.vol35,2145-2154(1992))。在另一个实例中,产生了配体的3-D描述符,该描述符包括例如来自结构以及结合腔的化学特性的几何学和功能约束。该描述符随后可用于探查化合物数据库,鉴定的配体是与该描述符的特征相匹配的化合物。实质上,该描述符是一类虚拟药效团。如上所述,可与本发明的solAC结构适配的配体包括正在开发作为潜在药用物质的化合物。可适配这些物质以确定solAC的作用如何修饰该物质并提供用于候选配体建模的基础,所述候选配体例如与ATP竞争结合于solAC。获得并表征本发明的配体化合物之后,本发明还提供调变solAC活性的方法,该方法包括(a)在如下条件下提供solAC,所述条件为在无配体的情况下,所述solAC能够结合于ATP;(b)提供配体化合物;和(c)确定在存在所述化合物的情况下,solAC结合ATP的能力(例如通过竞争)被改变的程度。(iii)分析和修饰配体如果已知配体调变或疑似调变solAC的作用,则可对配体的结构进行建模以更好地确定与配体相互作用的solAC的残基。本发明还提供预测可作用为solAC配体的其他配体的方法,该方法包括将所述配体与solAC催化结构域的三维结构或其选定的坐标相适配,所述三维结构由表1、表2、表3、表4或表5的坐标或其选定的坐标定义,所述坐标任选地有变化,但均方根差小于1.5_;确定或预测所述配体结合于所述催化结构域的情况;和修饰配体结构以便增强或降低其与催化结构域的相互作用。典型地,修饰配体的目的是产生相对于初始配体更加有效的配体,或是产生具有更好药用可接受性的配体。本领域人员能够理解,对结构的修饰将通常在硅片上发生,以允许对所修饰的结构与solAC相互作用的情况进行预测。Greeretal.(Greeretal.(1994),J.ofMedicinalChemistry,37,1035-1054)公开了一种配体设计的重复方法,其基于计算机建模的重复序列、蛋白质-配体复合体形成以及X线晶体学或NMR谱分析。由此Greeretal从头设计出了胸核苷酸合酶抑制剂,solAC配体也可以这种方式设计或修饰。更具体而言,在已解析的solAC结构上使用例如GRID,可设计互补solAC结合位点的功能性的solAC配体。或者,可修饰solAC配体以便其更好地或差一些地互补solAC结合位点的功能性。然后可以合成配体,与solAC形成复合体,然后提供X线结晶学分析复合体以鉴定所结合的配体的真实位置。必要时根据X线分析结果可随后调整配体的结构和/或官能团,然后重复合成和分析序列直至获得优化的配体。相关的基于结构的药物设计方法也可参见Bohaceketal.(1996)MedicinalResearchReviews,16,3-50。采用基于结构的药物设计来设计具有替代性solAC特性的配体也可考虑对第二种靶蛋白具有高亲和力的需求。Gschwendetal.(Gschwendetal.(1999),.Bioorganic&MedicinalChemistryLetters,9,307-312)和Bayleyetal.(Bayleyetal.(1997)ProteinsStructure,FunctionandGenetics,29,29-67)描述了采用基于结构的药物设计方法来降低与一种蛋白质的亲和力而保持与靶蛋白的亲和力。所述修饰对于本领域人员是常规的,并包括例如,取代或去除含有与本发明的solAC结构的氨基酸侧链基团相互作用的基团的残基。例如,置换可包括添加或去除基团以降低或提高测试化合物中基团的电荷,置换基团以增加或减小测试化合物中基团的大小,以带相反电荷的基团置换带电荷基团,或以亲水基团置换疏水基团或者反之亦然。可以理解这些仅仅是这一类型取代的实例,新药化合物研发中的医药化学家会对此加以考虑,根据初始化合物的特性和活性,也可进行其他修饰。如果通过将初始配体适配于本发明的solAC结构并由此预测修饰的配体已经开发出一种有潜力的修饰配体,则本发明还包括合成所述修饰的配体以及在体内或体外生物学系统中对其进行测试的步骤,以便确定其活性和/或作为solAC配体的有效性。本发明的上述方法可重复,因为修饰的配体本身可作为进一步配体设计的基础。上述方法还可用于修饰在solAC结合袋中与第二配体相互作用的配体。(iv)分析结合袋区域内的配体在一个实施方式中,本发明提供用于修饰配体结构的方法,所述方法包括将所述配体与solAC催化结构域三维结构或其选定的坐标进行适配,所述三维结构由表1、表2、表3、表4或表5的坐标或其选定的坐标定义,所述坐标任选地有变化,但均方根差小于1.5_;和修饰配体结构以便增强或降低其与催化结构域的相互作用,其中所述适配是针对配体结合区域,其被定义为包括表6至11中任一(例如表6、7、或11)给出的氨基酸残基的至少一个坐标。各表的优选的选定的坐标或来自两个或多个表的坐标的组合在本申请其他部分描述。典型地,修饰配体的目的是改善其抑制的有效性或药用可接受性。为避免误解,术语“改善”的定义如前所述,而当这种配体开发出来之后,可如上所述合成并测试。(vi)片段连接和生长提供本发明的晶体结构还可允许基于片段连接或片段生长方法而开发出与solAC催化结构域的结合袋区域相互作用的配体(例如作为配体,特别是solAC的抑制剂或活化剂)。例如,一或多个配体片段的结合可通过X线结晶学在蛋白质结合袋中确定。配体片段典型地是分子量在100和200Da之间的化合物(Carretal,(2002)DrugDiscovToday.May1;7(9)522-7)。这些可作为医药化学的起始点,用于采用基于结构的方法优化相互作用。这些片段可在模板上组合或用作使配体“长出”进入蛋白质的袋内的起始点(Blundelletal;NatRevDrugDiscov.(2002)Jan;1(1)45-54)。片段可放置于solAC的结合袋内,然后“长成”充满可达到的空间,揭示静电、范德瓦耳斯或氢键相互作用参与分子识别。因此,采用重复性基于结构的化学合成法,原本仅微弱结合的片段的效力被迅速提高。在片段生长方法的一或多个阶段,可合成配体并在生物学系统内测试其活性。这可用于指导片段的进一步长出。如果鉴定了两个片段结合区域,可基于连接片段方法试图直接连接两个片段,或如上所述生长一个或两个片段以获得更长的、连接的结构,其可具有所需的特性。连接片段方法可用于例如设计占据ATP结合位点和碳酸氢根结合位点的配体。该配体占据至少两个位点的部分,与仅占据ATP结合位点的配体相比,其对solAC可具有更好的选择性。如果确定了两个或多个配体的结合位点,可将它们连接以形成潜在的前导化合物,可使用例如Greeretal的重复技术使其进一步精确。虚拟的连接片段方法可参见Verlindeetal.(Verlindeetal.(1992)J.ofComputer-AidedMolecularDesign,6,131-147),而NMR和X线方法可参见Shukeretal.(Shukeretal.(1996)Science,274,1531-1534)和Stoutetal.(Stoutetal.(1998)Structure,6,839-848)。solAC结构的确定使得采用这些方法来设计solAC配体成为可能。(vii)本发明的化合物如果根就本发明的方法鉴定到了本发明的solAC催化结构域结构的潜在配体,则本发明还包括合成所鉴定的配体并在体内和体外生物学系统中对其进行测试,以确定其活性和/或有效性。本发明在这一方面优选地还包括以下步骤获得或合成配体;和使候选配体与solAC接触以确定候选配体与solAC相互作用的能力。例如,在上述的接触步骤中,使候选配体与solAC在存在底物(通常是ATP)以及典型地缓冲剂的条件下接触,以确定所述候选配体结合solAC,例如抑制solAC的能力。此类方法之一是基于免疫分析的HTRF,其中solAC产生的cAMP和XL-665-标记的cAMP竞争性结合抗cAMP抗体,其标记了Eu-cryptate(http://www.htrf-assays.com;GabrielD,VernierM,PfeiferMJ,DasenB,TenaillonL,BouhelalR.(2003)Assay&DrugDev.Techno1.2291-303)。因此,例如,可产生solAC的分析混合物,其包括候选配体、底物和缓冲剂。更优选地,在后面的步骤中,将候选配体与solAC在用于确定其功能的条件下接触。或者,或额外地,所述方法还可包括以下步骤获得或合成所述配体;形成solAC蛋白或其催化结构域与所述配体的复合体;和提供X线结晶学分析所述复合体以确定所述配体与solAC相互作用的能力或其催化结构域。这些步骤可用于在导致设计进一步的配体的重复方法中鉴定能够适配于本发明的结构的配体。例如,在上述接触步骤中,使候选配体与solAC在存在底物以及典型地缓冲剂的条件下接触,以确定所述候选配体结合solAC,例如抑制solAC的能力。因此,例如,可产生solAC的分析混合物,其包括候选配体、底物和缓冲剂。在另一方面,本发明包括化合物,其是通过在此所述的本发明的方法鉴定的solAC配体。鉴定这种化合物后,可生产和/或将其用于制备,即制造或者配制,组合物,例如药剂、药物组合物或药物。这些可施用于个体。因此,本发明在各方面不仅延伸至本发明的化合物,也延伸至药物组合物、药物、药剂或其他包含该化合物的组合物。所述组合物可用于治疗(其可以包括预防性治疗)疾病例如癌症、炎症、骨质疏散症、糖尿病、青光眼或不育症。该组合物也可用于避孕方法,例如用于抑制精子运动或受孕过程。术语“治疗”在此就治疗疾病或病症而言,广泛涉及处理和治疗,无论是人还是动物(例如在兽医学中),在其中达到了某种所需的治疗效果,例如,抑制病症的进展、且包括进展速度降低、中断其进展、病症减轻、以及疾病或病症的治愈。本发明还包括作为预防措施的治疗(即预防)。术语“治疗有效量”在此涉及一种活性化合物或者物质、组合物或包括活性化合物的剂量形式的量,当以合适的治疗方案施用时,其能够有效产生某些所需的治疗效果,相称的合理的获益/风险比。术语“治疗”包括治疗的组合,其中两个或多个处理或治疗相组合,例如,贯序地或同时地。本发明的化合物或者根据本发明获得的化合物包括作为solAC活性的抑制剂的化合物。因此,预期它们可用于提供防止和/或实现精子运动和运动过度(hypermotility)获能和顶体反应。因此预期所述化合物可被证实可用于治疗一些形式的雄性不育或无精和/或防止卵母细胞受孕和怀孕。可治疗的癌症的实例包括但不限于癌,例如膀胱、乳腺、结肠(例如结直肠癌如结肠腺癌和结肠腺瘤)、肾脏、表皮(epidermus)、肝脏、肺例如腺癌、小细胞肺癌和非小细胞肺癌、食道、胆囊、卵巢、胰腺例如外分泌胰腺癌、胃、宫颈、甲状腺、前列腺或者皮肤例如鳞状细胞癌;淋巴系造血系统肿瘤,例如白血病、急性淋巴细胞白血病、B细胞淋巴瘤、T细胞淋巴瘤、霍奇金淋巴瘤、非霍奇金淋巴瘤、毛细胞淋巴瘤或Burkett淋巴瘤;髓系造血系统肿瘤,例如急性和慢性髓性白血病、骨髓异常增生综合征、或前髓性白血病;多发性骨髓瘤;甲状腺滤泡癌;间充质来源的肿瘤,例如纤维肉瘤或habdomyosarcoma;中枢或外周神经系统肿瘤,例如星形细胞瘤、神经母细胞瘤、胶质瘤或许旺细胞瘤;黑素瘤;精原细胞瘤;畸胎癌;骨肉瘤;xenoderomapigmentoum;角质囊肿(keratoctanthoma);或Kaposi肉瘤。可通过抑制solAC而减轻的炎性疾病或病症包括但不限于类风湿性关节炎、骨关节炎、类风湿性脊柱炎、痛风性关节炎、创伤性关节炎、风疹性关节炎、牛皮癣关节炎以及其他关节疾病;Alzheimer病;中毒休克综合征、外毒素引起的炎性反应或炎性肠病;结核、动脉硬化肌肉萎缩、Reiter综合征、痛风、急性滑膜炎、败血症、败血症休克、内毒素休克、革兰氏阴性细菌败血症、成人呼吸窘迫综合征、脑型疟疾、慢性肺炎症疾病、矽肺、肺结节病、骨重吸收疾病、再灌注损伤、移植物抗宿主病、同种异体移植排斥反应、感染例如流感引起的发热和肌痛、恶病质、特别是继发于感染或恶性疾病的恶病质、继发于获得性免疫缺陷综合征(AIDS)的恶病质、AIDS、ARC(AIDS相关复合体)、疤痕形成、疤痕组织形成、Crohn氏病、溃疡性结肠炎、pyresis、慢性阻塞性肺疾病(COPD)、急性呼吸窘迫综合征(ARDS)、哮喘、肺纤维化和细菌性肺炎。特别有价值的是用于治疗或预防炎性疾病和病症,类风湿性关节炎和骨关节炎的化合物。因此本发明提供对上述疾病的治疗,其中所述治疗可包括给患者施用一组合物,所述组合物包含根据本发明获得的化合物,例如用于治疗疾病;提供了所述化合物,例如solAC抑制剂,在制备组合物中的用途,所述组合物用于施用,例如用于治疗疾病;和制备药物组合物的方法,所述方法包括将该化合物与药用可接受的稀释剂、运载体或载体、以及任选地其他成分混合。因此,本发明另一方面提供制备药剂、药物组合物或药物的方法,所述方法包括(a)通过在此所述的本发明的其他方面之任一的方法鉴定或修饰化合物;(b)优化所述化合物的结构;和(c)制备含有所述优化的化合物的药剂、药物组合物或药物。本发明的上述方法可以重复,因为修饰的化合物本身可以作为进一步设计化合物的起始点。“优化结构”指的是例如添加分子构架、添加或改变官能团、或连接分子与其他分子(例如采用片段连接方法),由此使得配体分子的化学结构发生改变但其最初的调变功能性得以保留或增强。此类优化在药物研发过程中是常规进行的,以便使得前导化合物例如增强效力、提高药用可接受性、增强化学稳定性等等。修饰对于本领域人员是常规的,并包括例如,取代或去除含有与本发明的solAC结构的氨基酸侧链基团相互作用的基团的残基。例如,置换可包括添加或去除基团以降低或提高测试化合物中基团的电荷,置换基团以增加或减小测试化合物中基团的大小,以带相反电荷的基团置换带电荷基团,或以亲水基团置换疏水基团或者反之亦然。可以理解这些仅仅是这一类型取代的实例,新药化合物研发中的医药化学家会对此加以考虑,根据初始化合物的特性和活性,也可进行其他修饰。组合物可配制为用于任何合适的施用途径和方式。药用可接受载体或稀释剂包括那些适合于口服、直肠内、鼻内、局部(包含服和舌下)、阴道内或胃肠外(包括皮下、肌肉、静脉、皮内、鞘内和硬膜外)施用的制剂中使用的那些。这些制剂可以是剂量单位的形式,并可以通过药学领域熟知的任何方法制备。对于固体组合物,常规的无毒固相载体包括,例如,可使用药用级甘露醇、乳糖、纤维素、纤维素衍生物、淀粉、硬脂酸镁、糖精钠、滑石粉、葡萄糖、蔗糖、碳酸镁等等。液体药用可施用组合物可,例如,通过将上述活性化合物和任选的药用佐剂溶解、分散于载体,例如,水、糖盐水、甘油、乙醇等等,由此形成溶液或悬液。需要的话,待施用的药物组合物还可含有少量的无毒性辅助物质,例如湿化剂或乳化剂、pH缓冲剂等等,例如,醋酸钠、月桂山梨坦、三羟乙基胺醋酸钠、月桂山梨坦、三乙醇胺油酸酯等等。制备此类剂量形式的实际方法是本领域人员已知的,或者是显而易见的;例如,见RemingtonTheScienceandPracticeofPharmacy”,20thEdition,2000,pub.Lippincott,Williams&Wilkins。通过以下实施例举例说明本发明实施例为了获得能够用于确定solAC三维结构的多肽(或蛋白质),可通过总基因合成或者克隆而获得编码solAC的DNA。然后将该DNA在合适的表达系统中表达以获得能够用于确定其三维结构的技术中的多肽。SolAC的克隆、表达和纯化概述为了表达纯化solAC用于结构研究,制备了大量不同的构建体,用于在大肠杆菌和昆虫细胞中表达。在下面的具体实施例中描述了优选构建体(即2056)的表达。经过对大量构建体和表达及纯化条件的深入研究,获得了该构建体的表达和回收条件。该构建体包括1和469位残基之间的solAC蛋白的全部或部分以及N端或C端标签。C端标签为TobaccoEtchVirus(TEV)Protease-cleavable-GST或TEV-cleavable-His6标签。在一些构建体中,His6标签也用于C端。表14给出了经分析的构建体。表14构建体1-8用于在杆状病毒表达系统中表达,而9-15用于在大肠杆菌中表达。大肠杆菌构建体诱导后,当温度维持于30至37℃之间时,所有构建体均表达为包涵体。诱导后将温度降低直至15℃试图达到可溶性表达,这产生了一些可溶性表达,但使用抗SAC抗体的western印记分析发现所有构建体均有严重的蛋白酶降解。使用Bieger(Bieger,B.andEssen,L-O.(2000)ActaCryst.D56,359-362)的布鲁斯锥虫AC方案作为初始点获得构建体2033的包涵体制备物。简言之,悬浮细胞(主要为构建体2033),超声裂解并离心澄清。重悬包涵体沉淀并充分洗涤,然后重新溶解于6MGuHCl或8M尿素。所有缓冲液主要为TrisHClpH8.0,Hepes,pH8.0或PBS,pH7.6。用于洗涤的去垢剂为Triton100。使用Ni-NTA和无镍固定化金属亲和层析(IMAC)树脂TALONTM(Clontech,MountainView,CA)柱,在变性条件下捕获感兴趣的蛋白质。使变性的稳定化蛋白质相对于10mMNaH2PO4/Na2HPO4pH7.6,0.3MNaCl,0.4M精氨酸,10%甘油透析2小时,使得大部分污染物留在溶液中,而感兴趣的蛋白质自溶液中沉淀出。再溶解的solAC蛋白被用于8×96条件下的再折叠筛中。确定了一组产生再折叠的活性蛋白质的条件,例如50mMHEPESpH7.2,0.5M精氨酸,0.3MNaCl,5mMBME和10%甘油。这产生了折叠的活性蛋白质,然后其被施加于Ni-NTA柱,用于进一步纯化。蛋白质的产率很低,因此进一步研究主要集中在昆虫细胞表达。杆状病毒构建体由于其在试验中有活性并且有能力,因此工作主要集中围绕着文献中的构建体。然而,也大量关注着发表的低表达产量和缺乏纯化先例。在Sf9和HighFiveTM细胞中测试solAC构建体的表达,并显示在后者中更佳。N端GST标签solAC构建体(2022)在GST和solAC结构域之间的连接子中包含工程化的TEV切割位点。首先在PBS、10%甘油、2mMBME中悬浮细胞,在冰上超声裂解,并通过离心进行澄清。通过离心再次澄清上清液,在集中管几分钟内它变得半透明或不透明。沉淀物的SDSPAGE和蛋白质印记分析表明完整的和蛋白水解切割的sAC占据沉淀物的大部分。通过在4℃和室温(约20℃)两个温度时检测缓冲液的范围来寻求稳定裂解物的策略。这些缓冲液列在下表15中。表15对于所有的缓冲液,将~2g细胞悬浮于5ml的各缓冲液,并传过一冷冻解冻循环以将其碎裂。记录悬浮液“阴沉”或沉淀的倾向。当pH在7.5-8.5、温度保持在4℃并存在0.3M或0.5MNaCl时,得到最佳结果。观察到去垢剂具有有害的作用。以PBS进行的单独的实验表明这种缓冲液的稳定性问题。发现最佳条件为50mMTrispH7.5(4℃时测得);0.3MNaCl;10%甘油;和2-5mMBME。构建体2056既有C端六组氨酸标签,这允许使用Ni-NTA树脂来捕获蛋白质。使用TALONTM柱未改进捕获。虽然选择缓冲液显著第帮助稳定裂解物,然而需要慢流速以允许足够的与树脂的接触时间仍然引起困难,导致通过DEAE柱执行预清除步骤。为此,将细胞悬浮于极低盐缓冲液,裂解,并澄清和施用于DEAE柱。裂解物的传导率必须保持在很低,因为目标蛋白微弱地结合基体。不能做到这一点会引起不良的捕获。在第一步,通过两级梯度、以构建体2022和2056进行洗脱。多数容易沉淀的污染物不能结合该柱。聚集流分,并在应用于Ni-NTA柱或谷胱甘肽琼脂糖4b柱前,将NaCl浓度调节至300mM。加入该步骤实现了在后续步骤中的慢流速,这导致酶的较高回收。稍后,我们也能够在高盐缓冲液中澄清、裂解细胞后直接地成批结合Ni-NTA快流树脂。从含流分的solAC-2056除去咪唑是成功回收蛋白质的关键部分。一旦建立了Ni-NTA洗脱的重现性,蛋白质池就会缓冲交换成50mMTrispH7.5(4℃)、30mMNaCl、10%甘油和1mMBME以应用于资源Q柱。在低盐中的蛋白质的滞留期保持在最小,因为在该步骤中经历最高的蛋白质产量的损失,即高达50%的蛋白质损失。观察到通过pH资源Q步骤进行良好,并且发现在该步骤中缓冲液的传导性极其重要。如果这些参数之一改变,那么蛋白质不能结合,或者凝胶上的纯化谱显示没有改进。纯化的最后步骤起到将蛋白质置于我们发现的最稳定的缓冲液中的作用,所述缓冲液为50mMTrispH7.5(4℃)、330mMNaCl、10%甘油、1mMBME。尽管结晶化设定为10mg/ml,蛋白质可以没有任何超过40mg/ml的聚集的迹象进行浓缩。令人惊奇的是,尽管2022和2056构建体具有相似性(TEV裂解后2022仅在N末端差几个氨基酸残基,并且在C端没有His6标签),2022在5mg/ml或更高的浓度时寡聚,而2056在高达40mg/ml时仍为单体。solAC-2056的克隆、表达和纯化编码全长solAC(核苷酸NM018417SwissProt)的表达载体pCDNA3.1用作PCR扩增的模板。solAC-2056的克隆使用PCR扩增构建体M1-V469。5’引物5’GGGGACAAGTTTGTACAAAAAAGCAGGCTCCATGAACACTCCAAAAGAAGAATTCCAGGACTGG3’(SEQIDNO1)携带attB1识别序列,序列对应于碱基1-11。3’引物5’GGGGACCACTTTGTACAAGAAAGCTGGGTTCAGTGGTGGTGGTGGTGGTGGACTTTCTCAGTACGGCCC3’(SEQIDNO2)引入对应于碱基463-469的序列,一个6hisc端标签、一个终止密码子和attB2识别位点。PCR反应试剂10μlThermopol缓冲液10X,2μldNTP混合物,1μlDNA模板,1μl5’引物,1μl3’引物,1μlVent。反应加入H2O定为100μl。PCR循环25个循环的94℃30秒、55℃1分钟、72℃3分钟,然后在72℃延伸10分钟。使用Gateway克隆技术的BP反应,将1407-bp片段重组到进入载体pDONR中。将部分产物转化到DH5α能细胞中。从在卡那霉素选择平板上培养的细菌中提取质粒。在通过Gateway克隆技术的LR反应将所述克隆转移到目的载体pDEST8之前,通过DNA测序证实序列。将部分产物转化到DH5α能细胞中。从在羧苄青霉素选择平板上培养的细菌中提取质粒。在开始表达蛋白质之前,通过DNA测序证实序列。solAC-2056的蛋白质序列为MNTPKEEFQDWPIVRIAAHLPDLIVYGHFSPERPFMDYFDGVLMFVDISGFTAMTEKFSSAMYMDRGAEQLVEILNYHISAIVEKVLIFGGDILKFAGDALLALWRVERKQLKNIITVVIKCSLEIHGLFETQEWEEGLDIRVKIGLAAGHISMLVFGDETHSHFLVIGQAVDDVRLAQNMAQMNDVILSPNCWQLCDRSMIEIESVPDQRAVKVNFLKPPPNFNFDEFFTKCTTFMHYYPSGEHKNLLRLACTLKPDPELEMSLQKYVMESILKQIDNKQLQGYLSELRPVTIVFVNLMFEDQDKAEEIGPAIQDAYMHITSVLKIFQGQINKVFMFDKGCSFLCVFGFPGEKVPDELTHALECAMDIFDFCSQVHKIQTVSIGVASGIVFCGIVGHTVRHEYTVIGQKVNLAARMMMYYPGIVTCDSVTYNGSNLPAYFFKELPKKVMKGVADSGPLYQYWGRTEKVHHHHHH(SEQIDNO3)6His标签在该构建体中是不可裂解的。solAC-2056的蛋白质制备以下列方式制备solAC-2056的重组病毒。简言之,将编码相关基因的pDEST8载体转化到含杆状病毒基因组(BacmidDNA)的大肠杆菌DH10BAC细胞中。通过细胞中的转座事件,将包含所述基因和包含杆状病毒多角体启动子的庆大霉素抗性基因的pDEST8载体直接转座到BacmidDNA中。通过在庆大霉素、卡那霉素、四环素和Bluo-gal上进行筛选,所得的白色集落应含有编码相关基因的重组bacmidDNA。从白色DH10BAC细胞培养物提取BacmidDNA,并按照制造商的说明书转染到培养于SF900II无血清培养基中的草地贪夜蛾(Spodopterafrugiperda)Sf9细胞中。感染后72小时收集病毒粒子。将1ml部分收集的病毒粒子用于感染含1×106细胞/ml的100mlsf9细胞。在感染后72小时收集细胞培养物培养基。在EX-Cell405(JRH)无血清培养基中将Hi5昆虫细胞培养至密度为1×106细胞/ml。将5ml部分病毒原液加入各升Hi5细胞。将培养物在27℃温育48-72小时。通过在4000rpm离心8分钟收集细胞。在-80℃冷冻沉淀物。solAC-2056的蛋白质纯化除非另有说明,在4℃进行所有步骤。细胞沉淀物在冰上解冻,并重悬浮于裂解缓冲液(50mMTrispH7.5,300mMNaCl,10%甘油,2mMBME,蛋白酶抑制剂cocktail(Calbiochem)。超声裂解细胞,并在4℃用Dnase温育裂解物1小时。以14,000或25,000rpm离心1小时澄清裂解物。按照前述步骤通过离心进一步澄清已澄清的裂解物,然后在应用于以批量结合模式以Ni2+预荷电的金属螯合基体(GEHealthcare)之前,通过0.45μm过滤器。将所述树脂或基体倾注到柱中,并通过加入含250mM咪唑的裂解缓冲液洗脱solAC蛋白。通过SDSPAGE分析流分,富集含solAC蛋白的流分。通过应用于在50mMTrispH7.5,30mMNaCl,10%甘油,5mMBME中平衡的G25-脱盐柱,将富集的蛋白质缓冲交换至低盐中。然后将缓冲交换的solAC蛋白施加到6mlResourceQ阳离子交换(GEHealthcare)柱,并使用0-30%1MNaCl的梯度在20个柱提及上进行洗脱。通过SDSPAGE分析流分,富集含solAC蛋白的流分,并施加到在50mMTris、pH7.5、330mMNaCl、10%甘油、5mMBME中预平衡的26/60superdex-75凝胶过滤柱。通过SDSPAGE分析流分。富集SolAC流分,并使用vivaspin2离心浓缩器(HY)将其浓缩至终浓度为~10mg/ml。solAC-2056的替代性纯化除非另有说明,所有步骤均在4℃进行。在冰上解冻细胞沉淀物,并重悬浮于裂解缓冲液(50mMTrispH7.5,10%甘油,2mMBME,蛋白酶抑制剂cocktail(Calbiochem)。超声裂解细胞,并在4℃用Dnase温育裂解物1小时。以14,000或25,000rpm离心1小时澄清裂解物。按照前述步骤通过离心进一步澄清已澄清的裂解物,然后在施加到DEAE阳离子交换树脂之前,通过0.45μm过滤器。通过15和30%级梯度的NaCl洗脱所述蛋白质。富集15%峰,将富集的蛋白质的NaCl浓度提高到300mM,然后应用于以Ni2+预荷电,并在50mMTispH7.5、300mMNaCl、10%甘油、2mMBME中平衡的金属螯合的、通常5mlHi-trap柱(GEHealthcare)。通过加入含250mM咪唑的平衡缓冲液洗脱solAC蛋白。通过SDSPAGE分析流分,并富集含solAC蛋白的流分。通过应用于在50mMTrispH7.5、30mMNaCl、10%甘油、5mMBME中平衡的G25-脱盐柱,将富集的蛋白质缓冲交换到低盐中。然后将缓冲交换的solAC蛋白应用于6mlResourceQ阳离子交换(GEHealthcare)柱,并使用0-30%1MNaCl的梯度在20个柱体积上进行洗脱。通过SDSPAGE分析流分,富集含solAC蛋白的流分,并施加到在50mMTris、pH7.5、330mMNaCl、10%甘油、5mMBME中预平衡的26/60superdex-75凝胶过滤柱。通过SDSPAGE分析流分。富集SolAC流分,并使用vivaspin2离心浓缩器(HY)将其浓缩至终浓度为~10mg/ml。可溶性腺苷酸环化酶的蛋白质结晶化使用市售微批量(microbatch)结晶化筛通过坐式生长或悬滴蒸汽扩散法生长人类solAC的警惕。对于一定范围的条件,发现晶体从200mM柠檬酸盐(例如,钠、钾、铵)和20%PEG3350生长。这些晶体形状矮胖,但很小。从这些晶体的衍射不良,并达到最大分辨率为6.0埃。因此,有必要发现不同的条件来得到可以尺寸和分辨率可接受的晶体。在初筛中获得的晶体从没有缓冲的溶液生长。在进一步各轮筛选中,使用悬滴蒸汽扩散法,发现使用pH4.6-5.2的缓冲液改进了晶体生长。对于晶体平衡的溶液的最终的pH在pH6.0-6.4变化。在另一轮筛选中,柠檬酸盐的浓度保持恒定于0.2M柠檬酸三钠,同事改变PEG的浓度和分子量。发现使用浓度在10-20%之间的PEG4000改进了结晶化。最佳晶体出现在16%PEG4K,然而,其质量不一致,并且其尺寸在最长尺度上在0.05mM至0.2mM之间变化。这些晶体中最佳者衍射至分辨率为2.3埃。因此需要进一步忧患。在50mMTris/HCl、pH7.5、330mMNaCl、2mMβ巯基乙醇和10%甘油将蛋白质浓缩至~10mg/ml。以1∶1体积混合物,将蛋白质溶液与0.1M醋酸钠、pH4.8、0.2M柠檬酸三钠、16-18%PEG4K和10%甘油的储备液混合。通过悬滴蒸汽扩散在4℃生长晶体。3-6天后晶体以液滴出现,并在14天后达到最大尺寸0.5×0.1×0.1mm。使用微引晶方法进一步改进晶度和质量的抑制性。通过在0.1M醋酸钠、pH4.8,0.2M柠檬酸三钠、14%PEG4K、2mMβ巯基乙醇和10%甘油的溶液中粉碎solAC晶体制备种子储备。通过试行结晶化运转(trialcrystallizationrun),达到种子储备的最佳稀释,其中使用1/100、1/10000、1/100,000和1/1000,000稀释的种子储备设立盘。通过在滑盖上混合等体积(通常1μl+1μl)的蛋白质溶液和种子储备设立结晶化的盘。将其置于含0.1M醋酸钠、pH4.8、0.2M柠檬酸三钠、14%PEG4K和10%甘油的孔上。所需的稀释依蛋白质批次变化。晶体在空间群P63内生长,晶胞大小为a=b=99.15_,c=97.51_。为了在低温时收集数据期间保存晶体,简单地将solAC的晶体转移到含0.1M醋酸钠、pH4.8、0.2M柠檬酸三钠、30%PEG4K和10%甘油的低温缓冲液。将晶体由该溶液投入液氮中,并储存,用于后续的数据收集。数据收集和处理使用JupiterCCD探测器或RAXISHTC图象平板探测器收集用于解析solAC结构的衍射数据。两者均放置于Rigaku旋转阳极发生器上。在EuropeanSynchrotronRadiationfacility的BeamlineID29-1上收集用于将solAC结构精确至1.7_的高分辨率数据,使用的是ADSCQuantum4CCD探测器,波长为0.934_,并以MOSFLM(Leslie,A.G.W.(1992).InJointCCP4andEESF-EACMBNewsletteronProteinCrystallography,vol.26,Warrington,DaresburyLaboratory)处理数据。使用SCALA(CCP4-CollaborativeComputationalProject4.(1994)TheCCP4SuiteProgramsforProteinCrystallography.ActaCrystallographicaD50,760-763)对数据进行评级,使用TRUNCATE(Evans,P.R.(1997).ScalingofMADdata.InRecentAdvancesinPhasing(ed.K.S.Wilson,G.Davies,A.W.AshtonandS.Bailey),pp.97-102.CouncilfortheCentralLaboratoryoftheResearchCouncilsDaresburyLaboratory,Daresbury,UK)从CCP4程序组(CCP4-CollaborativeComputationalProject4.(1994)TheCCP4SuiteProgramsforProteinCrystallography.ActaCrystallographicaD50,760-763)将强度转化为结构因子幅度。确定结构和精确化采用多种同晶置换来解析可溶性腺苷酸环化酶的结构。通过将含重金属的化合物溶解于溶液(溶液的组成为0.1M醋酸钠,pH4.8,0.2M柠檬酸三钠,16%PEG4K和10%甘油)中制备多种重金属溶液。然后将solAC晶体置于溶液中,平衡不同长度的时间(2分钟至5天)。许多这些溶液损害晶体,导致浸渗的晶体完全丧失衍射至与原晶体缺乏同晶型性等效应。在大量浸渗(>100)中,31个晶体得到了可用数据,其中的5个得到能够用于分析并解析重原子的位置和占用的衍生物。采用差异模式方法获得重原子最初的位置,将其用于以MLPHARE的初步定相(CCP4程序组),采用差异傅里叶分析图定位额外的位点。对5个可用衍生物重复这些步骤,然后采用差异傅里叶分析对它们进行交叉验证,以确保所有重原子溶液均为相同来源。因此,使用5个衍生物获得了相(见表16),然后采用溶剂平化(Solomon)和ARP/WARP循环对它们进行改进。然后将可溶性腺苷酸环化酶的序列构建为所得到的电子密度图。经过多轮重建和精确化(采用QUANTA,REFMAC和CNX),最初在2.3_,使用的是内部数据,最后在1.7_,使用的是同步加速器数据,最终的可溶性腺苷酸环化酶模型由1-468位残基组成,具有2个缺口(残基135-140和350-356)。所得结构见表1。表16用于解析solAC结构的重原子衍生物描述apo可溶性腺苷酸环化酶的结构可溶性腺苷酸环化酶的催化结构域的结构如表1的坐标所示。残基Met1是在电子密度中能够观察到的第一个残基,而Lys468是最后一个。靠近Met1的主链氮原子的电子密度峰可能是乙酰化引起的,没有被建模。不具有可判断的主链密度的残基是Trp135,Glu136,Glu137,Gly138,Leu139,Asp140,Phe350,Pro351,Gly352,Glu353,Lys354,Val355和Pro356。残基Val469和C端His6-标签在电子密度中是不可见的。靠近134位的首个断点的主链定义不清楚,而残基132-134具有不均匀的主链电子密度。残基304-306和451-455的电子密度的定义不清楚。此外,模型周边的一些残基的侧链被主观放置,因为它们没有可判断的密度。solAC的活性位点solAC与来自钝顶螺旋藻的酶相比强烈提示solAC仅具有一个活性位点,其相应于由来自钝顶螺旋藻B单体的A-链残基1140、含环的B-链残基1061和形成螺旋α1的残基形成的位点。可能相应于钝顶螺旋藻的A单体的第二个位点不存在螺旋α1。相应于A单体的2和3的β-链在solAC中更长,且部分遮掩腺苷结合位点,其开口显著小于对称相关的相应位点。表6给出了活性位点区域的残基,它们被认为与底物相互作用。制备与配体相复合的solAC晶体在浸渗溶液中制备200mMα-β-亚甲基腺苷5’-三磷酸酯,40mMCaCl2和40mMMnCl2溶液。浸渗溶液的组成为0.1M醋酸钠,pH4.8,0.2M柠檬酸三钠,16%PEG4K和10%甘油。将先前生长的solAC催化结构域晶体置于20μL的配体浸渗溶液中并平衡3天。然后将晶体移至防冻液中并在液氮中冷冻,准备用于收集数据。配体复合体的数据收集、结构解析和精确化采用设置于自制X线源上的RAXISHTC收集solAC催化结构域/配体复合体的衍射数据。将先前解析的solAC催化结构域结构作为用于精确化的初始模型。进行刚体和受约束的精确化并计算差异图谱。将配体分子,即α-β-亚甲基腺苷5’-三磷酸酯,构建到差异密度中,随后进行数轮精确化。solAC配体复合体的描述与solAC相复合的α,β-亚甲基ATP的结构显示出一种相互作用的模式,这与在钝顶螺旋藻中所见的极为相似。大部分相互作用出现在磷酸根基团、金属离子和所述蛋白质之间。腺嘌呤基团在Val406的N6氨基和主链羰基之间形成氢键,在Asn412的N7和OD1形成水介导的相互作用。核糖基团不与蛋白质形成氢键。大部分相互作用出现于磷酸根基团、推定的金属结合位点和蛋白质之间。残基Asp99、Asp47的侧链、Ile48的羰基、β和γ磷酸根的氧原子和水分子与金属离子相互作用。Arg416与来自α磷酸根的氧相互作用。来自γ磷酸根的氧原子与Thr52的OG和Thr52及Phe51的主链氮原子相互作用。结合配体后,发现残基48-58的区域出现某种重排,该区域相应于螺旋α1以及连接β1和α1的环。含有残基96至101的该环发生了一种协调运动,使得残基99的Cα移动了3.5_。其他solAC-配体复合体solAC的HCO3-结合位点SolAC是唯一已知的其活性被HCO3-直接调节的蛋白质。以碳酸氢钠浸渗solAC晶体发现了HCO3-结合位点的位置。HCO3-离子的结合由氢键和静电相互作用的网络介导,如图2所示1)Lys95的NZ与HCO3-的O1形成盐桥,2)Val167的主链NH与HCO3-的O1形成带电氢键,3)Val167的主链羰基与HCO3-的OH形成氢键,4)Arg176的侧链NH2与HCO3-的O3形成盐桥,而5)Arg176的侧链NH2与HCO3-的OH形成带电氢键。Lys95参与与的HCO3-配位与已发表的碳酸氢根反应性腺苷酸环化酶的研究(Cann,M.J.eta1.(2003)JournalofBiologicalChemistry278,35033-35038)所得结论相一致。5-苯基-2H-[1,2,4]-三唑-3-硫醇与的solAC碳酸氢根位点结合结合于solAC的5-苯基-2H-[1,2,4]-三唑-3-硫醇(化合物1,购自LancasterSynthesis,UK)的结构显示,其他小分子配体可到达HCO3-结合位点。化合物1的带负电的硫原子与HCO3-离子位于几乎相同的位置,而连接苯基的化合物1的三唑基团打开HCO3-结合位点成为一个与ATP结合位点邻近的大袋。这一扩充的HCO3-结合位点揭示了一个solAC结构的区域,其可用于设计solAC抑制剂或活化剂。Arg176自HCO3-袋中运动出来以及包括Ala97、Gly98、Asp99和Ala100的环的运动使得化合物1介导的HCO3-结合位点的扩充成为可能。化合物1结合还诱导Val335-Cys343序列的协调运动。solAC的这一区域构成沿碳酸氢根结合位点底部走行的β链和环结构的一部分。该序列中的Phe336、Met337和Phe338构成化合物1结合位点的一部分。化合物1的扩充的HCO3-结合位点由以下残基排列而成Phe45、Leu94、Lys95、Ala97、Ala100、Leu102、Phe165、Leu166、Val167、Ile168、Val172、Arg176、Val335、Phe336、Met337和Phe338。化合物1的硫原子位于袋的底部并与Lys95的NZ形成盐桥以及与Val167的主链NH和Phe336的主链NH形成带电氢键。三唑的N6也与Met337的主链羰基在袋的底部形成氢键。此外,三唑的N5与Arg176的NH2形成带电氢键。化合物1的苯基延伸进入由Phe45,Lys95,Ala97,Ala100,Leu102和Phe336的侧链形成的化合物1袋的显著亲脂性区域。在化合物1的苯基之后,该袋在敞开进入ATP结合位点之前轻度缩小。该扩充的HCO3-结合位点的形状和在化合物1solAC复合体中所观察到的相互作用的性质提示该位点适合于多种配体。尽管哺乳动物跨膜腺苷酸环化酶异构体之间存在高度的序列和结构的相似性,但solAC是这类酶中唯一由HCO3-调节的成员。因此,在此所述的solACHCO3-结合位点的结构信息为设计相对于tmAC具有高度选择性的solAC靶向药物提供了指导。与药物设计有关的结合化合物1的结构的另一个关键的特征是化合物1显示出离开solAC的HCO3-位点并进入ATP结合位点的明显生长载体机会。在药物研发中,导向蛋白质的ATP结合位点的化合物有很多先例。在此给出的结构确立了这样一点,即可以设计出同时占据solAC的HCO3-和ATP结合位点的化合物。额外的solAC化合物结合位点-N-(3-苯氧基-苯基)-草酰酸结合于solAC的N-(3-苯氧基-苯基)-草酰酸(化合物2)晶体结构发现solAC结构的其他区域可开发用于药物设计。化合物2的结合位点与就化合物1所描述的扩充的HCO3-袋重叠,由此化合物2的苯氧基占据了与化合物1的苯基的极为相似的位置。不过,化合物2诱导位于HCO3-结合位点底部的Lys95的大的侧链运动。该Lys95运动打开了HCO3-结合袋,形成一并入大的充水腔的通道,然后开口于蛋白质表面与ATP结合位点相对的点上。以下残基排列成这一新发现的通道His164,Phe165,Tyr268,Asn333,Lys334和Val335。化合物2的草酰酸基团最大程度地伸入该通道,与所述蛋白质形成若干相互作用1)化合物2的O3与His164的ND形成带电氢键;2)化合物2的O1与Phe165的主链NH形成带电氢键;3)化合物2的O5氢键结合于Val335的主链NH;和4)化合物2的酰胺N6氢键结合于Phe165的主链羰基。Lys95、Phe165、Leu166、Val167和Phe336的侧链形成围绕化合物2的中心苯胺基芳族环的亲脂性环境。尽管化合物2的末端苯氧基结合于为化合物1所描述的相同的亲脂性袋内,但由于化合物2引起包含Met337、Phe338、Asp339、Lys340和Gly341的环发生运动,该袋的环境被轻度改变。该环的运动将Phe338拖离ATP位点,到达化合物2的末端苯氧基的范德瓦耳斯距离范围内。在apo、AMP-PNP和结合化合物1的solAC的结构中均没有观察到Phe338的这种运动。实际上,AMP-PNP复合体的结构显示,Phe338形成ATP位点的一端,靠近AMP-PNP核糖的羟基。Phe338的重新定位形成了与ATP结合位点邻近的新的亚袋。该新的亚袋由以下残基排列而成Phe296,Met418,N298,Ser343,Phe336,Met337,Gly341,Asp339,Met419,Cys342,Ala415,Arg416,Met300和Lys340。引起形成这一ATP亚袋的化合物成为了solAC活性位点内部的额外的药物设计机会。该ATP亚袋是由结合于扩充的HCO3-位点内部的化合物引起的这一事实,再次强调了这样一种观点,即HCO3-位点在开发相对于非碳酸氢根反应性tmAC而言具有高水平选择性的药物中具有巨大的潜在用途。重要的是,在此所述的这4个结合位点不是相互无关的,而是形成了连续的solAC结合位点,诱导所述的扩充的ATP和HCO3-袋。整个结合位点代表了开发小分子solAC药物的诱人靶点。制备N-(3-苯氧基-苯基)-草酰酸在呋喃(3ml)中的3-苯氧基苯胺(276mg,1.4毫摩尔)和三乙胺(0.2ml,1.4毫摩尔)溶液中逐滴加入氯-氧-乙酸乙酯(0.175ml,1.5毫摩尔)。在环境温度中搅拌所得溶液40分钟。向反应混合物中加水(1.5ml)和氢氧化钠(72mg,1.8毫摩尔)。环境温度下再搅拌反应混合物24小时。反应混合物在二氯甲烷和盐酸(2N)之间出现分区。以二氯甲烷洗涤水相。将二氯甲烷层混合然后以盐酸(2N)和水洗涤。将有机相干燥(MgSO4)、过滤,真空去除溶剂,得到N-(3-苯氧基-苯基)-草酰酸白色固体(286mg,74%)。制备与HCO3-复合的solAC晶体在由0.1M醋酸钠,pH4.8,0.2M柠檬酸三钠,16%PEG4000和10%甘油组成的浸渗溶液中制备50mM碳酸氢钠溶液。将先前生长的solAC催化结构域晶体置于20μl的所述碳酸氢根浸渗溶液中,平衡3小时。然后将晶体移至防冻液中并在液氮中冷冻,以备收集数据。制备与化合物复合的solAC晶体制备占终体积90%的浸渗溶液储存液,其组成为200mMNaCl,200mM柠檬酸三钠(pH6.4),15%w/vPEG4000和15%v/v甘油。剩余的10%体积1)以水补平,产生收集溶液,或2)以化合物储存溶液(于DMSO中)补平,成为终浸渗溶液。收集溶液用于在自悬滴中回收solAC晶体之后临时储存solAC晶体,并作为浸渗过程中的储备溶液以免浸渗溶液蒸发。在DMSO中制备0.25M的化合物1和化合物2储存溶液。化合物1的储存90%浸渗溶液的pH调至pH7.3以有助于该化合物的结合。通过混合36μl的“90%储存溶液”和4μl的化合物储存溶液而制备化合物1和2的终浸渗溶液。这样得到25mM的化合物终浓度。化合物的浸渗/冷冻过程将晶体自悬滴中收集到10μl新鲜的收集溶液中。储备池中也添加50-100μl收集溶液。在孔中放入浸渗溶液(6μl),相应的储备池中添加50μl收集溶液。将晶体分布到浸渗溶液中(1晶体/化合物)。将孔封闭并进行浸渗,对于化合物1,在20C浸渗6分钟,对应化合物2,在20C浸渗4.5小时。打开封闭,将晶体置于显微载片上,置液氮中冷冻。化合物编号在描述solACHCO3-、solAC化合物1和solAC化合物2复合体时,采用的原子的编号表(如所附pdb文件所示s)显示于图1。没有显示化合物1和化合物2的氢原子。显示了HCO3-的氢原子,因为该氢原子在定义solACHCO3-的相互作用中特别重要。表1CRYST199.42499.42497.39090.0090.00120.00P63SCALE10.0100580.0058070.0000000.00000SCALE20.0000000.0116140.0000000.00000SCaLE30.0000000.0000000.0102680.00000表2CRYST199.65199.65196.52290.0090.00120.00P63SCALE10.0100350.0057940.0000000.00000SCALE20.0000000.0115870.0000000.00000SCALE30.0000000.0000000.0103600.00000表3CRYST199.67399.67396.82490.0090.00120.00P63SCALE10.0100330.0057920.0000000.00000SCALE20.0000000.0115850.0000000.00000SCALE30.0000000.0000000.0103280.00000表4CRYST199.56999.56998.47090.0090.00120.00P63SCALE10.0100430.0057980.0000000.00000SCALE20.0000000.011597O.0000000.00000SCALE30.0000000.0000000.0101550.00000CONECT751675177529CONECT75177516752175187518CONECT7518751775177519CONECT75197518752075207523CONECT7520751975197521CONECT7521751775207522CONECT75227521CONECT75237519752875287524CONECT75247523752575257530CONECT75257524752475267531CONECT75267525752775277532CONECT75277526752675287533CONECT75287523752375277534CONECT75297516CONECT75307524CONECT75317525CONECT75327526CONECT75337527CONECT75347528END表5CRYST199.29199.29197.75390.0090.00120.00P63SCALE10.0100710.0058150.0000000.00000SCALE20.0000000.0116290.0000000.00000SCALE30.0000000.0000000.0102300.00000CONECT74957496CONECT74967495749774977498CONECT749774967496CONECT74987496749974997500CONECT749974987498CONECT7500749875017514CONECT75017500751375137502CONECT75027501750375037515CONECT75037502750275047516CONECT75047503750575057517CONECT75057504750475067513CONECT750675057507CONECT75077506751275127508CONECT75087507750975097518CONECT75097508750875107519CONECT75107509751175117520CONECT75117510751075127521CONECT75127507750775117522CONECT75137501750175057523CONECT75147500CONECT75157502CONECT75167503CONECT75177504CONECT75187508CONECT75197509CONECT75207510CONECT75217511CONECT75227512CONECT75237513END权利要求1.一种基于计算机的用于分析配体与solAC结构的相互作用的方法,其包括提供表1、表2、表3、表4或表5的solAC结构或其选定的坐标,所述表1、表2、表3、表4或表5任选地有变化,但均方根差不超过1.5_;提供待与所述solAC结构或其选定的坐标相适配的配体;和使所述配体与所述solAC结构相适配。2.权利要求1的方法,其中所述选定的坐标包括来自表6、7、8、9、10或11中所示的残基组的一或多个残基的原子。3.权利要求1的方法,其中所述选定的坐标包括来自残基组Met1至Tyr26或Lys219至Gly284的一或多个氨基酸的原子。4.权利要求2或3的方法,其中所述配体与来自所述组的至少2个、优选地至少5个成员的至少一种原子相适配。5.前述权利要求中任一项的方法,其中所述配体与至少10个原子、优选地至少100个原子相适配。6.前述权利要求中任一项的方法,其中所述选定的坐标是至少500个、优选地至少1000个原子的坐标。7.前述权利要求中任一项的方法,其中使多个分子片段相适配并将所述片段组装成单个分子以形成配体。8.前述权利要求中任一项的方法,还包括以下步骤获得或合成所述配体;和使所述配体与solAC蛋白相接触以确定所述配体与solAC相互作用的能力。9.权利要求1至7中任一项的方法,还包括以下步骤获得或合成所述配体;形成solAC蛋白和所述配体的复合体;和通过X线结晶学分析所述复合体以确定所述配体与solAC相互作用的能力。10.权利要求1至7中任一项的方法,还包括以下步骤获得或合成所述配体;和确定或预测所述配体如何与所述solAC结构相互作用;和修饰所述配体以改变其与solAC之间的相互作用。11.前述权利要求中任一项的方法,其中所述solAC结构是自表1、表2、表3、表4或表5的全部或部分坐标或其选定的坐标而构建的模型,所述表1、表2、表3、表4或表5的坐标任选地有变化,但均方根差不超过0.5_。12.权利要求11的方法,其中所述模型是(a)线框模型;(b)网状模型;(c)球棍模型;(d)空间填充模型;(e)棍状模型;(f)带状模型;(g)活动轮廓模型;(h)箭头圆柱模型;(i)电子密度图;(j)分子表面模型。13.前述权利要求中任一项的方法,还包括以下步骤(a)获得或合成所述配体;和(b)使所述配体与solAC相接触以确定所述配体与solAC相互作用的能力。14.评估配体与solAC蛋白相互作用的能力的方法,包括获得或合成所述配体;形成solAC蛋白和所述配体的结晶化复合体,所述复合体使用于确定所述复合体的原子坐标的X线发生衍射,达到优于3.5_的分辨率;和采用表1、表2、表3、表4或表5的数据或其选定的坐标通过X线结晶学分析所述复合体以确定所述配体与solAC蛋白相互作用的能力,所述数据任选地有变化,但均方根差不超过1.5_。15.权利要求14的方法,其包括提供solAC蛋白的晶体;用配体浸渗晶体以形成复合体;和采用表1、表2、表3、表4或表5的数据或其选定的坐标确定所述复合体的结构,所述数据任选地有变化,但均方根差不超过1.5_。16.权利要求14的方法,其包括使solAC蛋白与配体混合;使solAC蛋白-配体复合体结晶化;和采用表1、表2、表3、表4或表5的数据或其选定的坐标确定所述复合体的结构,所述数据任选地有变化,但均方根差不超过1.5_。17.权利要求14的方法,还包括确定所述配体的结构。18.权利要求14或17的方法,还包括以下步骤获得或合成所述配体;和修饰所述配体以改变其与solAC之间的相互作用。19.用于确定蛋白质结构的方法,其包括提供表1、表2、表3、表4或表5的坐标或其选定的坐标,所述表1、表2、表3、表4或表5的坐标任选地有变化,但均方根差不超过1.5_,和(a)使所述坐标在所述蛋白质的晶体晶胞中定位以便提供所述蛋白质的结构,或(b)通过操作所述坐标来分配所述蛋白质的NMR谱峰。20.预测结构未知的solAC蛋白同源物或类似物的三维结构的方法,所述方法包括以下步骤将三维结构未知的靶solAC蛋白的氨基酸序列的图象与表1、表2、表3、表4或表5或其选定的坐标的solAC的氨基酸序列进行比对,以便所述氨基酸序列的同源性区域相匹配,所述表1、表2、表3、表4或表5任选地有变化,但均方根差不超过1.5_;在表1、表2、表3、表4或表5或其选定的坐标所定义的solAC结构的相应区域上构建所述结构未知的靶solAC的相匹配的同源性区域的结构的模型,所述表1、表2、表3、表4或表5任选地有变化,但均方根差不超过1.5_;和确定所述结构未知的靶solAC的构象,所述靶solAC基本上保留所述相匹配的同源性区域的结构。21.为产生与solAC、solAC同源物或类似物相互作用的配体、solAC与配体的复合体、或solAC同源物或类似物与配体的复合体的结构和/或对与solAC、solAC同源物或类似物相互作用的配体、solAC与配体的复合体、或solAC同源物或类似物与配体的复合体进行优化而提供数据的方法,所述方法包括(i)与远程装置建立通讯,所述装置含有(a)计算机可读数据,包括表1、表2、表3、表4或表5的原子坐标数据或其选定的坐标,所述原子坐标数据任选地有变化,但均方根差小于1.5_,所述数据定义solAC催化结构域的三维结构或其选定的坐标;(b)基于(a)的数据通过对所述靶进行同源性建模而产生的靶腺苷酸环化酶同源物或类似物的原子坐标数据;(c)通过参照表1、表2、表3、表4或表5的数据来解释X线晶体学数据或NMR数据而产生的蛋白质的原子坐标数据;和(d)可自(a)或(c)的原子坐标数据导出的结构因素数据;和(ii)接收来自所述远程装置的所述计算机可读数据。22.权利要求21的方法,其中所述计算机可读数据是表1、表2、表3、表4或表5的solAC原子坐标数据或其选定的坐标,所述solAC原子坐标数据任选地有变化,但均方根差不超过1.5_,且其中所述方法还包括提供待与表1、表2、表3、表4或表5的solAC原子坐标数据或其选定的坐标相适配的配体,所述solAC原子坐标数据任选地有变化,但均方根差不超过1.5_;和使所述配体与solAC结构相适配。23.前述权利要求中任一项的方法,其中所述选定的坐标包括至少5%、优选地至少10%的Cα原子。24.权利要求23的方法,其中参照所述Cα原子计算所述均方根差。25.一种计算机系统,用于产生与solAC、solAC同源物或类似物相互作用的配体、solAC与配体的复合体、或solAC同源物或类似物与配体的复合体的结构和/或对与solAC、solAC同源物或类似物相互作用的配体、solAC与配体的复合体、或solAC同源物或类似物与配体的复合体进行优化,所述系统含有计算机可读数据,所述数据包括以下一或多项(a)表1、表2、表3、表4或表5的solAC坐标数据或其选定的坐标,所述数据定义solAC催化结构域的三维结构;(b)基于表1、表2、表3、表4或表5的坐标数据通过对靶进行同源性建模而产生的靶腺苷酸环化酶蛋白的原子坐标数据;(c)通过参照表1、表2、表3、表4或表5的坐标数据解释X线晶体学数据或NMR数据而产生的靶腺苷酸环化酶蛋白的原子坐标数据;(d)可自(b)或(c)的原子坐标数据导出的结构因素数据;和(e)表1、表2、表3、表4或表5的原子坐标数据或其选定的坐标,所述原子坐标数据任选地有变化,但均方根差小于1.5_。26.权利要求25的计算机系统,其中所述选定的坐标包括来自表6、7、8、9、10或11中所示的残基组的一或多个残基的原子。27.权利要求26的计算机系统,其中所述选定的坐标是来自所述组的至少2个、优选地至少5个成员的至少一种原子的坐标。28.权利要求25至27中任一项的计算机系统,其中所述配体与至少10个原子、优选地至少100个原子相适配。29.权利要求25至28中任一项的计算机系统,包括(i)计算机可读数据存储介质,其包括编码有所述计算机可读数据的数据存储材料;(ii)工作内存,用于存储处理所述计算机可读数据的指令;和(iii)中央处理器,其偶联于所述工作内存并偶联于所述计算机可读数据存储介质,用于处理所述计算机可读数据并由此产生结构和/或进行合理性药物设计。30.权利要求29的计算机系统,还包括偶联于所述中央处理器用于显示所述结构的显示装置。31.计算机用于产生solAC结构或solAC-配体复合体的三维图象的用途,其中所述solAC结构来自表1、表2、表3、表4或表5或其选定的坐标,所述表1、表2、表3、表4或表5任选地有变化,但均方根差不超过1.5_,其中所述计算机包括(i)计算机可读数据存储介质,其包括编码有计算机可读数据的数据存储材料,其中所述数据包括表1、表2、表3、表4或表5的结构或其选定的坐标,所述表1、表2、表3、表4或表5任选地有变化,但均方根差不超过1.5_;(ii)将所述计算机可读数据处理成所述三维图象的指令。32.权利要求31的用途,其中所述选定的坐标是表6、7、8、9、10或11中所示的一或多个残基的原子。33.制备组合物的方法,包括根据权利要求1至18中任一项的方法鉴定配体,并将所述分子与载体混合。34.用于制备药剂、药物组合物或药物的方法,所述方法包括(a)根据权利要求1至18中任一项的方法鉴定配体;和(b)制备含有所述配体的药剂、药物组合物或药物。35.权利要求34的方法,其包括(a)根据权利要求1至18中任一项的方法鉴定配体;(b)优化所述配体的结构;和(c)制备含有所述优化的配体的药剂、药物组合物或药物。36.solAC催化结构域的晶体。37.solAC催化结构域和配体的共结晶。38.solAC催化结构域与配体的共结晶,其具有空间群P63。39.权利要求32或33的共结晶,其具有如下晶胞尺度a=b=99.5_、c=97.4_、且α=β=90.00、γ=120.00,所有尺度的晶胞可变性为5%。40.solAC蛋白的晶体,其具有3.5_或更佳的分辨率。41.solAC蛋白的晶体,其具有由表1、表2、表3、表4或表5的坐标所定义的结构,所述坐标任选地有变化,但均方根差小于1.5_。全文摘要本发明提供solAC催化结构域的晶体结构。所述结构在表1至5中给出。所述结构可用于建立配体例如药用化合物与该蛋白质的相互作用的模型,以及用于确定相关的腺苷酸环化酶分子的结构。文档编号C12N9/88GK101228270SQ200680026621公开日2008年7月23日申请日期2006年7月21日优先权日2005年7月21日发明者S·M·萨劳-贝瑟尔,A·克利斯毕,T·A·萨姆布鲁克,J·科伊尔,M·温科维奇申请人:拜耳先灵医药股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1