将氧化还原活性氨基酸位点特异地掺入蛋白质的制作方法

文档序号:3555993阅读:818来源:国知局
专利名称:将氧化还原活性氨基酸位点特异地掺入蛋白质的制作方法
技术领域
本发明属于翻译生物化学领域。本发明涉及产生和使用正交tRNA、正交氨酰tRNA合成酶及正交tRNA/正交氨酰tRNA合成酶对的组合物和方法,这种对中的蛋白质掺入有氧化还原活性氨基酸。本发明还涉及利用这种对及相关组合物在细胞内产生蛋白质的方法。
背景技术
在20种常见的遗传编码的氨基酸中只有半胱氨酸已被氧化还原,其结果是它可参与各种各样酶催化的氧化还原反应(Surdhar和Armstrong(1987)J.Phys.Chem.,916532-6537;Licht等,(1996)Science 271477-481)。因此,大多数生物氧化还原过程需要诸如黄素、烟酰胺和金属离子之类的辅因子。少数情况下,酪氨酸和色氨酸侧链翻译后修饰所产生的醌类被用作氧化还原辅因子(Stubbe和Van der Donk(1998)Chem.Rev.,98705-762)。例如,牛血浆铜胺氧化酶可利用3,4,6-三羟基-L-苯丙氨酸(TOPA)将伯胺和分子氧分别转化成醛和过氧化氢(Janes等,(1990)Science248981-987)。这些氨基酸衍生的氧化还原催化剂是由自由基介导的反应和酶反应产生的(Rodgers和Dean(2000)Int.J.Biochem.Cell Biol.,32945-955)。毫无疑问,遗传编码其它氧化还原活性氨基酸而并非通过复杂的翻译后机制产生它们的能力将显著增强对蛋白质研究和工程构建电子传递过程的能力。本发明满足了这些要求和其它要求,且通过以下描述这将是显而易见的。
发明概述本发明提供了制造正交组分的组合物和方法,所述正交组分用于例如在体内响应选择者密码子(selector codon),例如,终止密码子、无义密码子、四碱基或多碱基密码子等,将氧化还原活性氨基酸掺入到正在延伸的多肽链中。例如,本发明提供了正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)和它们组成的对。这些对可用来将氧化还原活性氨基酸掺入到正在延伸的多肽链中。
一些实施方案中,本发明的组合物可包括正交氨酰tRNA合成酶(ORS),该O-RS能优先用氧化还原活性氨基酸氨酰化O-tRNA。在某些实施方案中,所述O-RS包括含有SEQ ID NO1所示氨基酸序列或其保守变体。在本发明的某些实施方案中,所述O-RS能优先氨酰化O-tRNA,其效率为含有SEQ ID NO1所示氨基酸序列多肽的效率的至少50%。
含有O-RS的组合物还可任选含有正交tRNA(O-tRNA),其中O-tRNA能识别选择者密码子。通常,与含有SEQ ID NO2所示多核苷酸序列的O-tRNA或由该多核苷酸序列编码的O-tRNA相比,在存在相关合成酶时,本发明的O-tRNA响应选择者密码子的抑制效率至少约为,例如,45%、50%、60%、75%、80%或90%或者更高。一实施方案中,O-RS和O-tRNA的抑制效率加在一起比缺乏O-RS时O-tRNA的抑制效率高例如5倍、10倍、15倍、20倍、25倍或更高。一方面,O-RS和O-tRNA的抑制效率加在一起为衍生自詹氏甲烷球菌(Methanococcus jannaschii)的正交酪氨酰tRNA合成酶对的抑制效率的至少45%。
含有O-tRNA的组合物可任选包括细胞(例如,非真核细胞,如大肠杆菌(E.coli)细胞等,或真核细胞),和/或翻译系统。
本发明也提供了包含翻译系统的细胞(例如,非真核细胞或真核细胞),所述翻译系统包含正交tRNA(O-tRNA);正交氨酰tRNA合成酶(O-RS);和氧化还原活性氨基酸。O-RS通常可优先氨酰化O-tRNA,其效率为含有SEQ ID NO1所示氨基酸序列多肽的至少50%。O-tRNA能识别第一选择者密码子,而O-RS能优先用氧化还原活性氨基酸氨酰化O-tRNA。一实施方案中,所述O-tRNA包含SEQ ID NO2所示多核苷酸序列或其互补性多核苷酸序列,或由它们编码。一实施方案中,所述O-RS包含SEQ ID NO1中任一所示氨基酸序列或其保守变体。
本发明的细胞还可任选包含其它不同的O-tRNA/O-RS对和第二非天然氨基酸,例如,该O-tRNA能识别第二选择者密码子而O-RS能优先用第二非天然氨基酸氨酰化O-tRNA。任选地,本发明的细胞包括含有编码感兴趣多肽的多核苷酸的核酸,所述多核苷酸包含O-tRNA可识别的选择者密码子。
一些实施方案中,本发明的细胞包括大肠杆菌细胞,所述细胞包含正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)、氧化还原活性氨基酸以及含有编码感兴趣多肽的多核苷酸的核酸,所述多核苷酸包括O-tRNA可识别的选择者密码子。在本发明的某些实施方案中,所述O-RS优先氨酰化O-tRNA,其效率为含有SEQ IDNO1所示氨基酸序列的多肽的至少50%。
在本发明的某些实施方案中,本发明的O-tRNA包含SEQ ID NO2所示多核苷酸序列或其互补性多核苷酸序列,或由它们编码。在本发明的某些实施方案中,O-RS包含SEQ ID NO1所示的氨基酸序列或其保守变体。一实施方案中,所述O-RS或其一部分由编码SEQ ID NO1所示氨基酸的多核苷酸序列或其互补多核苷酸序列编码。
本发明的O-tRNA和/或O-RS可衍生自多种生物体中的任何一种(例如,真核和/或非真核生物)。
多核苷酸也是本发明的一个特征。本发明的多核苷酸包括人造(例如,人造或非天然产生的)多核苷酸,其含有编码SEQ ID NO1所示氨基酸的核苷酸序列和/或与上述多核苷酸序列互补或编码上述多核苷酸序列的核苷酸序列。本发明的多核苷酸还包括能在高度严格条件下以基本全长的核酸与上述多核苷酸杂交的核酸。本发明的多核苷酸还包括,例如与天然产生的tRNA至少有75%、至少80%、至少90%、至少95%、至少98%或更高相同性的多核苷酸(但本发明的多核苷酸不是天然产生的tRNA)。例如,与上述任何一种和/或含有上述任何一种的保守变体的多核苷酸至少有80%、至少90%、至少95%、至少98%或更高相同性的人造多核苷酸也包括在本发明的多核苷酸之内。
含有本发明多核苷酸的载体也是本发明的一个特征。例如,本发明的载体可包括质粒、粘粒、噬菌体、病毒、表达载体等。含有本发明载体的细胞也是本发明的一个特征。
产生O-tRNA/O-RS对诸组分的方法也是本发明的特征。用这些方法产生的组分也是本发明的特征。例如,产生至少一种能与细胞正交的tRNA(O-tRNA)的方法包括产生突变型tRNA文库;使突变型tRNA文库每个成员的反密码子环突变以识别选择者密码子,从而提供潜在O-tRNA文库,并对第一物种的第一细胞群进行负选择,其中所述细胞含有潜在O-tRNA文库的成员。负选择可消除潜在O-tRNA文库中的含有可被该细胞内源性氨酰tRNA合成酶(RS)氨酰化的成员。这提供了对第一物种的细胞为正交性的tRNA库,从而提供至少一种O-tRNA。还提供了用本发明方法产生的O-tRNA。
在某些实施方案中,所述方法还包括对第一物种的第二细胞群进行正选择,其中所述细胞含有对第一物种的细胞为正交性的tRNA库的成员、相关氨酰tRNA合成酶和正选择标记。使用正选择可选出或筛选到含有可被相关氨酰tRNA合成酶氨酰化并在正选择标记存在时显示出所需反应的tRNA库成员的细胞,从而提供O-tRNA。在某些实施方案中,第二细胞群包括未被负选择去除的细胞。
还提供了鉴定与O-tRNA一起使用的氧化还原活性氨基酸的正交氨酰tRNA合成酶的方法。例如,所述方法包括选择第一物种的细胞群,该群中的细胞各包含1)多种氨酰tRNA合成酶(RS)中的一个成员,(例如,所述多种RS可包括突变型RS、衍生自第一物种之外的物种的RS,或突变型RS和衍生自第一物种之外的物种的RS两者);2)正交tRNA(O-tRNA)(例如,来自一个或多个物种);和3)编码正选择标记并含有至少一个选择者密码子的多核苷酸。
选出或筛选到的细胞(例如,宿主细胞)与缺乏所述多种RS中的一个成员或含有减少数目的该成员的细胞相比,显示出增强的抑制效率。这些选出/筛选到的细胞含有能氨酰化O-tRNA的活性RS。用这种方法鉴定正交氨酰tRNA合成酶也是本发明的一个特征。
在细胞(例如,非真核细胞,如大肠杆菌细胞等,或真核细胞)内特定位置制造含氧化还原活性氨基酸的蛋白质的方法也是本发明的一个特征。例如,一种方法包括使细胞在合适的培养基中生长,其中所述细胞含有包含至少一个选择者密码子并编码蛋白质的核酸,提供氧化还原活性氨基酸,和在含有至少一个选择者密码子的核酸翻译过程中将氧化还原活性氨基酸掺入该蛋白质的特定位置,从而产生该蛋白质。所述细胞还包含在细胞中具有功能和识别选择者密码子的正交tRNA(O-tRNA);和能优先用氧化还原活性氨基酸氨酰化O-tRNA的正交氨酰tRNA合成酶(O-RS)。用这种方法产生的蛋白质也是本发明的一个特征。
本发明还提供含有蛋白质的组合物,其中所述蛋白质包含氧化还原活性氨基酸(例如,3,4-二羟基-L-苯丙氨酸(phenyalanine)(DHP)、3,4,5-三羟基-L-苯丙氨酸、3-硝基-酪氨酸、4-硝基-苯丙氨酸、3-硫醇-酪氨酸等)。在某些实施方案中,所述蛋白质含有的氨基酸序列与治疗蛋白、诊断蛋白、工业用酶或其部分至少75%相同。任选地,所述组合物包含药学上可接受的载体。
定义在详细描述本发明前,需要说明本发明并不局限于某些特定的生物系统,本发明可以有各种变化。还应当说明本文所用的术语是为了描述特定的实施方案,并不意味着对本发明的限制。如本发明的说明书和附属权利要求中使用,除非特别指明,单数形式“一个”、“一种”和“这种”也包括复数。因此,“一种细胞”包括两个或多个细胞;“细菌”也包括细菌的混合物等。
除了在此处和说明书的其余部分所定义的,本文所用的所有技术术语和科学术语都与本发明所属领域技术人员共同理解的意义相同。
正交本文所用的术语“正交”指一种分子(如正交tRNA(O-tRNA)和/或正交氨酰tRNA合成酶(O-RS))具有细胞内源性组分的功能,但其效力与细胞或翻译系统内的相应内源性分子相比降低,或者不具有细胞内源性组分的功能。就tRNA和氨酰-tRNA合成酶而言,正交是指正交的tRNA具有内源性tRNA合成酶的功能但其效率与内源性tRNA和内源性tRNA合成酶相比降低,如低于20%、10%、5%或1%。正交分子缺乏细胞内内源性互补分子的正常功能。例如,与内源性的tRNA被内源性RS氨酰化相比,细胞内的正交tRNA被细胞的内源性RS氨酰化时其效率降低,甚至为零。在另外一个实施例中,与内源性的RS氨酰化内源性的tRNA相比,正交的RS在感兴趣细胞内氨酰化任何内源性的tRNA时其效率降低,或者甚至为零。第二正交分子可以被引入到细胞内和第一正交分子一起发挥功能。例如,正交tRNA/RS对包括引入的互补组分,在细胞内一起行使功能时其效率与对照,如相应的内源性tRNA/RS对或活性正交对(如酪氨酰正交tRNA/RS对)相比可以达到45%、50%、60%、70%、75%、80%、90%、95%、99%或更高。
正交酪氨酰-tRNA本文所用的术语正交酪氨酰-tRNA(酪氨酰-O-tRNA)是与感兴趣翻译系统正交的tRNA,其中tRNA(1)与天然产生的酪氨酰tRNA相同或基本类似,(2)来源于发生天然突变或人工诱变的天然酪氨酰tRNA,(3)由考虑到(1)或(2)的野生型或突变型酪氨酰tRNA序列的方法所产生,(4)与野生型或突变型酪氨酰tRNA同源,(5)与表1中所列称为酪氨酰tRNA合成酶底物的典型tRNA同源,或(6)表1中称为酪氨酰tRNA合成酶底物的典型tRNA的保守变体。酪氨酰tRNA可以携带一个氨基酸,或者处于非负载状态。还需要说明“酪氨酰-O-tRNA”可以被相关的合成酶加载(氨酰化)赖氨酸之外的氨基酸,如高谷氨酰胺。应理解本发明的酪氨酰-O-tRNA确实可用于将任何必需的氨基酸,无论是天然的或是人工合成的,掺入到正在延伸的多肽内,如翻译期间,以响应选择者密码子。
正交酪氨酰氨基酸合成酶本文所用的正交酪氨酰氨基酸合成酶(酪氨酰-O-RS)是一种可以在感兴趣翻译系统内优先用氨基酸氨酰化酪氨酰-O-tRNA的合成酶。被酪氨酰-O-RS加载到酪氨酰-O-tRNA上的氨基酸可以是任何氨基酸,无论是天然的还是人工合成的,不限于本文所述的。该合成酶还任选可以与天然的酪氨酰氨基酸合成酶相同或同源,或者与表1中称为酪氨酰-O-RS的合成酶相同或同源。例如,酪氨酰-O-RS可以是表1所列的酪氨酰-O-RS的保守变体,和/或与表1所列的酪氨酰-O-RS的序列至少有50%、60%、70%、80%、90%、95%、98%、99%或更高的相同性。
同源术语“同源”指能联合发挥功能的组分,如正交tRNA和正交氨酰-tRNA合成酶。此种组分也称为互补组分。
优先氨酰化术语“优先氨酰化”是指,与O-RS氨酰化天然产生的tRNA或氨酰化用于产生O-tRNA的原料的效率相比,O-RS用氧化还原活性氨基酸氨酰化O-tRNA的效率为,例如70%、75%、85%、90%、95%、99%或更高。
选择者密码子术语“选择者密码子”指在翻译过程中能被O-tRNA识别但通常不被内源性tRNA识别的密码子。O-tRNA反密码子环能识别mRNA上的选择者密码子并能在多肽的该位点掺入此氨基酸,例如非天然氨基酸,如氧化还原活性氨基酸。选择者密码子包括无义密码子,如终止密码子,例如琥珀密码子、赭石密码子和乳白密码子;四碱基或多碱基密码子;稀有密码子;天然或非天然碱基对产生的密码子等。
抑制型tRNA抑制型tRNA是一种可在给定的翻译系统内改变信使RNA(mRNA)的阅读的tRNA,例如通过将氨基酸掺入到多肽链内以响应选择者密码子的机制。例如,抑制型tRNA可通读终止密码子、四碱基密码子、稀有密码子等。
抑制活性如本文采用的,术语“抑制活性”通常指tRNA(如抑制型tRNA)翻译阅读通过某密码子(如为琥珀密码子或四碱基或多碱基密码子的选择者密码子)的能力,如果阅读不通过则翻译终止或产生错译(如移码突变)。抑制型tRNA的抑制活性可以表示为与第二抑制型tRNA或与对照系统如缺乏O-RS的对照系统相比所观察到的翻译通读活性的百分数。
本发明提供了定量测定抑制活性的各种方法。一种特定O-tRNA和ORS对在对感兴趣的选择者密码子(如琥珀密码子)反应时的抑制百分率,指一种位于编码可表达检测标记的核酸中的某给定表达检测标记(如LacZ),包括选择者密码子,在感兴趣翻译系统内的活性与阳性对照构建物活性相比的百分数,其中的感兴趣的翻译系统含有O-RS和O-tRNA,而阳性对照不含O-tRNA、O-RS和选择者密码子。因此,如果某缺乏选择者密码子的活性阳性对照标记构建物在一个给定翻译系统内的活性是X,那么含有选择者密码子的被检测构建物的抑制百分率为被检测构建物在与阳性对照标记基本相同的表达环境条件下所显示的X的百分比,其中该被检测标记构建物所表达的翻译系统也含有O-tRNA和O-RS。一般来说,表达被检测标记的翻译系统还包含能被O-RS和O-tRNA识别的氨基酸。任选地,抑制百分率的测定可以通过将该被检测标记与“背景”或“阴性”对照标记构建物比较而精细确定,后者含有与被检测标记相同的选择者密码子,但是该系统中不包含O-tRNA、O-RS和/或能被O-tRNA和/或O-RS识别的相关氨基酸。这种阴性对照可用于对该标记在感兴趣翻译系统中所产生的背景信号进行处理使抑制百分率测定标准化。
抑制效率可通过本领域熟知的多种方法测定。例如,可利用β半乳糖苷酶报告分子试验,如将衍生的lacZ质粒(该构建物在lacZ核酸序列中含有选择者密码子)和含有本发明的O-tRNA的质粒一起导入到合适生物(如可利用此正交组分的生物)的细胞内。也可导入相关合成酶(或者以多肽或编码相关合成酶的多核苷酸形式)。将这些细胞在培养基内培养到所需的密度,如OD600达到约0.5时,采用BetaFluorTMβ-半乳糖苷酶检测试剂盒(Novagen)进行β半乳糖苷酶试验。抑制百分率可以计算为样品相对于可比较对照,如衍生的lacZ构建物所显示的活性的百分比,其中所述构建物在所需位置上含有相应的有义密码子而不是选择者密码子。
翻译系统术语“翻译系统”指可以将氨基酸掺入到正在延伸的多肽链(蛋白)中的各组分。翻译系统的各组分包括核糖体、tRNA、合成酶、mRNA等。本发明的O-tRNA和/或O-RS也可以加入到体外或体内的翻译系统中,或者作为翻译系统的一部分,如非真核细胞如细菌(如大肠杆菌)或真核细胞如酵母细胞、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞等的翻译系统。
非天然氨基酸本文所用术语“非天然氨基酸”指20个常见天然氨基酸或硒代半胱氨酸或吡咯赖氨酸之外的任何氨基酸、修饰的氨基酸和/或氨基酸类似物,如氧化还原活性氨基酸。
衍生于本文所用的术语“衍生于”指从特定分子或生物、或者根据该特定分子或生物的信息分离的组分,或者利用该特定分子或生物、或者根据该特定分子或生物的信息产生的组分。
阳性选择或筛选标记本文所用的术语“阳性选择标记”指当一种标记存在时,可被表达、活化等,会导致含有该标记相应性状的细胞得以鉴定,如可以将含有该阳性选择标记的细胞与无此性状的细胞相区别。
阴性选择或筛选标记本文所用的术语“阴性选择标记”指当一种标记存在时,如被表达、活化等,可以鉴定不含有所选特性或性状的细胞(如,与具有该特性或性状的细胞相比较)。
报告分子本文所用的术语“报告分子”是指可用于鉴定和/或筛选感兴趣系统内靶组分的组分。例如,报告分子可以包括蛋白质,如能赋予抗生素抗性或敏感性的酶(如β-内酰胺酶、氯霉素乙酰转移酶(CAT)等)、荧光选择标记(如绿色荧光蛋白(如GFP)、YFP、EGFP、RFP等)、冷光标记(如萤火虫荧光素酶蛋白)、亲和力选择标记,或者正或负选择标记基因如lacZ、β-gal/lacZ(β-半乳糖苷酶)、Adh(乙醇脱氢酶)、his3、ura3、leu2、lys2等。
真核生物本文所用的术语“真核生物”指在系统进化树内属于真核生物域的生物,如动物(如哺乳动物、昆虫、爬行动物、鸟类等)、纤毛虫、植物(如单子叶植物、双子叶植物、藻类等)、真菌、酵母、鞭毛虫、微孢子虫、原生生物等。
非真核生物本文所用的术语“非真核生物”指非真核生物。例如,非真核生物可能属于真细菌系统发育区(如大肠杆菌、嗜热栖杆菌、嗜热脂肪芽孢杆菌等)或古细菌(如詹氏甲烷球菌(Methanococcus jannaschii)(Mj)、马氏微球菌(Methanosarcina mazei)(Mm)、热自养甲烷球菌(Methanobacterium thermoautotrophicum)(Mt)、海沼甲烷球菌(Methanococcus maripaludis)、坎氏甲烷嗜热菌(Methanopyrus kandleri)、盐杆菌属如沃氏盐杆菌(Haloferax volcanii)和嗜盐菌NRC-1(Halobacterium species NRC-1)、闪烁古生球菌(Archaeoglobus fulgidus)(Af)、激烈火球菌(Pyrococcus furious)(Pf)、超嗜热古菌(Ph)、超耐高温热棒菌(Pyrobaculum aerophilum)、火球菌(Pyrococcus abyssi)、硫磺矿硫化叶菌(Sulfolobus solfataricus)(Ss)、硫化叶菌(Sulfolobus tokodaii)、Aeuropyrumpernix(Ap)、噬酸热原体(Thermoplasma acidophilum)、火山热原体(Thermoplasmavolcanium)等)系统发育区。
保守变体本文所用术语“保守变体”就翻译组分而言指一种翻译组分,如保守变体O-tRNA或保守变体O-RS,其功能特性与基本组分O-tRNA或O-RS相似,但是在序列上与参照O-tRNA或O-RS相比有些不同。例如,O-RS可用非天然氨基酸,例如3,4-二羟基-L-苯丙氨酸(DHP)等的氧化还原活性氨基酸,氨酰化互补的O-tRNA或保守变体O-tRNA,但是O-tRNA和保守变体O-tRNA的序列不相同。保守变体的序列可含有一个、两个、三个、四个、五个或更多突变,只要保守变体与相应的O-tRNA或O-RS互补。
选择或筛选试剂本文所用的术语“选择或筛选试剂”指当一种试剂存在时可以从一群组分中选出或筛选出某种特定组分。例如,选择或筛选试剂包括但不限于营养素、抗生素、光的波长、抗体、表达的多核苷酸等。筛选试剂可以使用不同的浓度、强度等。
响应本文所用的术语“响应”指本发明的tRNA识别选择者密码子并介导将结合于tRNA的氧化还原活性氨基酸掺入正在衍生的多肽链的过程。
编码本文所用的术语“编码”指利用多聚大分子或序列符号串上的信息指导产生第二分子或序列符号串的过程,所述第二分子或序列符号串与第一分子或序列符号串不同。如本文所描述,该术语的使用范围很宽,可用于许多方面。一方面,术语“编码”描述DNA的半保守性复制过程,其中双链DNA分子的一条链作为DNA依赖的DNA聚合酶的模板编码出新合成的一条互补姊妹链。
另一方面,术语“编码”指利用一个分子中的信息指导产生化学性质与第一分子不同的第二分子的过程。例如,DNA分子可编码RNA分子(如通过DNA依赖的RNA聚合酶参与的转录过程)。另外,RNA分子也可以编码多肽,例如在翻译过程中。当该术语用于描述翻译过程时,该术语也可以扩展到编码氨基酸的三联密码子。在某些方面,RNA分子也可编码DNA分子,例如通过RNA依赖的DNA聚合酶参与的反转录过程。在另一个方面,DNA分子可编码多肽,应当理解的是,在这种情况下,术语“编码”是指转录和翻译两个过程。
附图简述

图1提供了从3,4-二羟基-L-苯丙氨酸(DHP;结构1)的氧化产物到DHP-半醌基2,其易被氧化成DHP-醌3的示意图。
图2A和2B提供了抹香鲸肌红蛋白响应Mb基因第4位的琥珀密码子的DHP依赖性表达。图2A提供了银染胶和western印迹。图2B提供了DHPMb的ESI-QqTOF质谱分析。
图3A和3B提供了循环伏安图。图3A提供了wtMb和DHPMb中的血红素组的循环伏安图。图3B提供了不同溶液中的DHP的循环伏安图,所述溶液含有100μMDHP、wtMb或DHPMb。所有伏安图在pH 7.4的0.1M磷酸缓冲液中在氩气下记录;扫描速度1V s-1对SCE。
图4提供了用电化学方法氧化蛋白质中DHP的示意图。
图5提供了詹氏甲烷球菌酪氨酰tRNA合成酶(MjTyrRS)的核苷酸序列和氨基酸序列。
图6提供了3,4-羟基-L-苯丙氨酸(DHP)-tRNA合成酶(DHPRS)的核苷酸序列和氨基酸序列,基于詹氏甲烷球菌酪氨酰tRNA合成酶(MjTyrRS)具有以下氨基酸改变Tyr32→Leu、Ala67→Ser、His70→Asn和Ala167→Gln。改变的氨基酸和相应的三联密码子(相对野生型序列)被框出。
发明详述为了能在体内将其他合成的氨基酸如氧化还原活性氨基酸掺入到遗传密码内,需要一个能在翻译系统中发挥正常功能但是对组织翻译系统来说是“正交的”的新型氨酰-tRNA合成酶和tRNA的正交对,也就是说该正交对对内源翻译系统而言可独立地行使合成酶和tRNA的功能。该正交对所需要的特性包括tRNA只能解码或识别一个特异性的新密码,如选择者密码子,该密码子不能被任何内源性tRNA所解码,而氨酰-tRNA合成酶只能用特异性的氧化还原活性氨基酸优先氨酰化(或加载)其相关tRNA。O-tRNA通常也不能被内源性合成酶氨酰化。例如,在大肠杆菌内,一个正交对包含一个不能与任何内源性tRNA(大肠杆菌内有40种)发生交叉反应的氨酰tRNA合成酶和一个不能被任何内源性合成酶(大肠杆菌内有21种)氨酰化的正交tRNA。
本发明提供了鉴定和产生其它正交tRNA-氨酰tRNA合成酶对(例如可用来掺入氧化还原活性氨基酸的O-tRNA/O-RS对)的组合物和方法。本发明的O-tRNA能够介导将氧化还原活性氨基酸掺入到含有例如在体内可被O-tRNA识别的选择者密码子的多核苷酸所编码的蛋白质中。O-tRNA的反密码子环可识别mRNA上的选择者密码子并能在多肽的该位点掺入氨基酸,如氧化还原活性氨基酸。本发明的正交氨酰tRNA合成酶能只用特异性的氧化还原活性氨基酸优选氨酰化(或加载)其相关O-tRNA。
例如,氧化还原活性氨基酸3,4-羟基-L-苯丙氨酸(DHP)有两个电子可被氧化成为醌而可响应选择者密码子(例如TAG密码子)被选择性地且有效地掺入到大肠埃希杆菌(大肠杆菌)生物体的蛋白质中。参见图1。蛋白质内的DHP可用电化学方法氧化。若能将氧化还原活性氨基酸位点特异性掺入蛋白质中将有助于研究蛋白质内的电子传递,并能工程构建具有新特性的氧化还原蛋白质。见图4。例如,氧化还原活性蛋白质的表达有助于研究并能够改变蛋白质内电子传递途径、改变酶的催化功能、将蛋白质与小分子和生物分子交联等。
正交tRNA/正交氨酰-tRNA合成酶及它们组成的对适于产生含有一个或多个非天然氨基酸,例如氧化还原活性氨基酸的蛋白质的翻译系统描述于题为“METHODS AND COMPOSITION FOR THE PRODUCTION OFORTHOGANOL tRNA-AMINOACYL-tRNA SYNTHETASE PARIS”(产生正交tRNA-氨酰-tRNA合成酶对的方法和组合物)的国际专利申请WO2002/086075和题为“INVIVO INCORPORATION OF UNNATURALAMINO ACIDS”(非天然氨基酸的体内掺入)的WO2002/085923。另外,还可以参见2004年4月16日提交的国际专利PCT/US2004/011786。这些专利申请都已完整纳入本文作为参考。这种翻译系统一般都包括含有正交tRNA(O-tRNA)、正交氨酰tRNA合成酶(O-RS)以及氧化还原活性氨基酸的细胞(例如非真核细胞或真核细胞),其中O-RS可用氧化还原活性氨基酸氨酰化O-tRNA。本发明的正交对包括O-tRNA,如抑制型tRNA、移码tRNA等,以及O-RS。本发明还提供了其他各组分。
O-tRNA可识别选择者密码子,与包含或编码于SEQ ID NO2所示多核苷酸序列的O-tRNA相比,在相关合成酶存在时,本发明的O-tRNA为了响应选择者密码子而产生的抑制效率至少可达45%、50%、60%、75%、80%、90%或更高。O-RS可用氧化还原活性氨基酸氨酰化O-tRNA。细胞利用该组分对将氧化还原活性氨基酸掺入到正在延伸的多肽链内,例如通过包含编码感兴趣多肽的多核苷酸的核酸,该多核苷酸含有能被O-tRNA识别的选择者密码子。在本发明的某些实施方案中,细胞如大肠杆菌细胞包含正交tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、氧化还原活性氨基酸,和含有编码感兴趣多肽的多核苷酸的核酸,该多核苷酸含有能被O-tRNA识别的选择者密码子。翻译系统也可以是体外系统。
在一个实施方案中,O-RS和O-tRNA联合在一起的抑制效率至少是缺少O-RS时O-tRNA的抑制效率的5倍、10倍、15倍、20倍、25倍或更高。在一方面,O-RS和O-tRNA联合在一起的抑制效率是衍生自詹氏甲烷球菌的正交酪氨酰tRNA合成酶对抑制效率的至少约35%、40%、45%、50%、60%、75%、80%、90%或更高。
本发明任选可在细胞内包括多个O-tRNA/O-RS对,从而可以掺入一个以上的非天然氨基酸,如氧化还原活性氨基酸和其他的非天然氨基酸。例如,细胞还可以包含其他不同的O-tRNA/O-RS对和第二种非天然氨基酸,此另一种O-tRNA可识别第二选择者密码子,此另一种O-RS可用第二种非天然氨基酸优选氨酰化O-tRNA。例如,含有一种O-tRNA/O-RS对(其中O-tRNA可识别琥珀选择者密码子)的细胞还可以含有第二种正交对,如亮氨酰、赖氨酰、谷氨酰对等(其中第二O-tRNA可识别不同的选择者密码子,如乳白密码子、四碱基密码子等)。
O-tRNA和/或O-RS可以是天然产生的,或可通过突变天然的tRNA和/或RS而产生,例如这可从各种生物体产生tRNA文库和/或RS文库。例如,一种产生正交tRNA/氨酰-tRNA合成酶对的策略涉及输入宿主细胞之外生物体或多种生物体来源的异源性(相对于该宿主细胞而言)tRNA/合成酶对到宿主细胞内。该候选异源合成酶的特性包括不能加载宿主细胞的任何tRNA,该候选异源tRNA的特性包括不能被宿主细胞的任何合成酶氨酰化。另外,该异源tRNA对于宿主细胞的合成酶而言是正交的。
产生正交对的第二种策略是产生突变文库,然后从中筛选出O-tRNA或O-RS。这些策略也可联合使用。
正交tRNA(O-tRNA)正交tRNA(O-tRNA)可以在体内和体外介导将氧化还原活性氨基酸掺入蛋白质内,所述蛋白质是由含选择者密码子的多核苷酸编码的,这种选择者密码子可被O-tRNA识别。在某些实施方案中,本发明的O-tRNA与包含或编码于SEQ ID NO2所列多核苷酸序列的O-tRNA相比,在相关合成酶存在的条件下,为了响应选择者密码子而产生的抑制效率至少可达45%、50%、60%、75%、80%、90%或更高。
抑制效率可通过本领域熟知的多种试验检测。例如,可以利用β半乳糖苷酶报告分子试验,如将衍生的lacZ质粒(该构建物含有选择者密码子和lacZ核酸序列)和含有本发明O-tRNA的质粒一起导入到含合适生物(如可利用正交组分的生物)的细胞内。也要导入相关合成酶(或者以多肽或编码该相关合成酶的多核苷酸形式)。将细胞在培养基内培养到所需密度,如OD600约0.5时,采用BetaFluorTMβ-半乳糖苷酶检测试剂盒(Novagen)进行β半乳糖苷酶试验。抑制百分率可以计算为样品相对于可比较对照(如衍生的lacZ构建物所显示的活性值)的活性百分数,所述构建物在所需位置上含有有义密码子而不是选择者密码子。
本发明的O-tRNA的例子是SEQ ID NO2。可参见本文的表1和实施例2中所显示的典型O-tRNA和O-RS分子的序列。还可参见本文的“核酸和多肽序列及其变体”部分。该tRNA分子中的胸腺嘧啶(T)被尿嘧啶(U)替换。也可以有其他的碱基修饰。本发明还包括O-tRNA的保守变体。例如,O-tRNA的保守变体包括的那些与SEQ IDNO2的O-tRNA功能类似并保留tRNA的L型结构,但不含有相同序列(且不同于野生型tRNA分子)的变体。也可参见本文的“核酸和多肽序列及其变体”部分。
含O-tRNA的组合物还可以包含正交氨酰-tRNA合成酶(O-RS),其中的O-RS优先用氧化还原活性氨基酸氨酰化O-tRNA。在某些实施方案中,含有O-tRNA的组合物还可以包含翻译系统(如在体外或体内)。含有编码感兴趣多肽的多核苷酸的核酸,或者这些物质的一种或多种组合也可以存在于所述细胞内,其中所述多核苷酸含有能被O-tRNA识别的选择者密码子。参见本文的“正交氨酰-tRNA合成酶”部分。
产生正交tRNA(O-tRNA)的方法也是本发明的特征。用该方法产生的O-tRNA也是本发明的特征。在本发明的某些实施方案中,O-tRNA可通过构建突变体文库来产生。突变体tRNA文库可用本领域已知的各种诱变技术构建。例如,突变体tRNA可通过位点特异性突变、随机位点诱变、同源重组、DNA改组技术或其他重复诱变(recursive mutagenesis)方法、嵌合体构建、或者它们的组合来产生。
也可将其他的突变引入到特定位置上,如tRNA环或区域中的非保守区、保守区、随机区或者混合区,如反密码子环、接受臂、D臂或环、可变环、TΨC臂或环、tRNA分子的其他区域或其组合。一般来说,tRNA分子中的突变包括突变tRNA突变体文库内各成员的反密码子环以使其能够识别选择者密码子。该方法还可包括将一个额外的序列(CCA)加到O-tRNA的末端。一般来说,O-tRNA对感兴趣生物的正交性相比起始材料(如tRNA序列群)有所改进,但保留了对所需RS的亲和力。
本发明的方法任选包括分析tRNAs和/或tRNA合成酶序列的同源性以确定对特定生物具有正交性的潜在候选O-tRNA、O-RS和/或O-tRNA/O-RS对。可利用本领域已知的和本文所描述的计算机程序都进行这种分析,如BLAST和pileup程序。在一个实施例中,为了筛选潜在的正交翻译组分用于原核生物大肠杆菌,可选择不显示与原核生物具有罕见同源性的合成酶和/或tRNA。
一般来说,可以通过负选择第一物种的细胞群来获得O-tRNA,该细胞可能含有O-tRNA群的成员。负选择可去除含有可被细胞内源性氨酰-tRNA合成酶(RS)氨酰化的O-tRNA文库的成员细胞。这样就可以得到对第一物种细胞具有正交性的tRNA库。
在某些实施方案中,进行负选择时需要将选择者密码子引入到编码负选择标记的多核苷酸中,所述负选择标记例如有能赋予抗生素抗性的酶如β内酰胺酶,能产生可检测产物的酶如β半乳糖苷酶、氯霉素乙酰转移酶(CAT),毒性产物如芽孢杆菌RNA酶引入到非必须位置上(还能产生功能性的芽孢杆菌RNA酶)等选择。筛选还可任选通过在存在选择试剂(比如抗生素,如氨苄青霉素)的培养基中培养细胞群来完成。在一个实施方案中,选择试剂的浓度是变化的。
例如,为了测定抑制型tRNA的活性,根据选择者密码子如无义密码子或移码突变在体内的抑制使用一个选择系统,将选择者密码子引入到编码负性选择标记的多核苷酸(如β半乳糖苷酶基因(bla))内。例如,构建在某个位置上含有选择者密码子的多核苷酸变体如bla变体。用这些多核苷酸转化细胞,如细菌。如果存在无法被大肠杆菌内源性合成酶不能有效加载的正交tRNA,这种抗生素抗性如氨苄青霉素抗性应当或多或少使质粒不含转化细菌。如果该tRNA不是正交的,或者能加载tRNA的异源合成酶在此系统内共表达,应可观察到更高水平的抗生素抗性,如氨苄青霉素抗性。挑出那些无法在抗生素浓度约等于未用质粒转化的细胞的LB琼脂平板上生长的细胞,如细菌。
如果存在毒性产物(如RNA酶或芽孢杆菌RNA酶),当一群候选tRNA的成员被宿主(如大肠杆菌)的内源性合成酶氨酰化时(即对于宿主如大肠杆菌的合成酶来说不是正交的),选择者密码子被抑制,所产生的毒性多核苷酸产物可导致细胞死亡。而含有正交tRNA或非功能性tRNA的细胞存活下来。
在一个实施方案中,对能与所需生物正交的tRNA库进行正选择时,将选择者密码子置于正选择标记中,例如抗药性基因(如β内酰胺酶基因)编码的正选择标记中。在含有编码或包含能与细胞正交的tRNA库某成员的多核苷酸、编码正选择标记的多核苷酸和编码同源性RS的多核苷酸的细胞内进行正选择。在某些实施方案中,第二群细胞含有负选择不能去除的细胞。由于该多核苷酸在细胞内表达,使细胞可在含选择试剂(如氨苄青霉素)的培养基内生长。然后选出能被共表达的相关合成酶氨酰化以及响应其选择者密码子而掺入氨基酸的tRNA。一般来说,这些细胞与含有非功能性tRNA或不能被感兴趣合成酶有效识别的tRNA的细胞相比,抑制效应显示升高。含有非功能性的tRNA或不能被感兴趣合成酶有效识别的tRNA的细胞对该抗生素敏感。因此那些(i)不是宿主(如大肠杆菌)内源性合成酶的底物;(ii)能被感兴趣合成酶氨酰化;以及(iii)在翻译过程中具有功能的tRNA可在两种筛选中保留下来。
在上面所描述的方法中,所述选择(如正选择、负选择或者正负选择)的严格程度还包括改变筛选的严格条件。例如,由于芽孢杆菌RNA酶是毒性很高的蛋白质,负选择条件的严格程度可通过将不同数感兴趣选择者密码子引入到该酶基因内和/或通过使用可诱导启动子来加以调控。在另一个实施例中,选择试剂的浓度是可以改变的(如氨苄青霉素的浓度)。在本发明的一个方面,筛选条件的严格程度是随时变化的,因为在前几轮筛选中感兴趣活性较低。因此,在前几轮中筛选标准的严格程度较低,而在后几轮筛选中需要更严格的筛选标准。在某些实施方案中,负选择、正选择或者正负选择可重复多次。也可以使用多个不同的负选择标记、正选择标记或正负选择标记。在某些实施方案中,正选择标记和负选择标记可以相同。
其他类型的选择/筛选方法也可用于本发明中以产生正交性翻译组分,如O-tRNA、O-RS和能利用氧化还原活性氨基酸的O-tRNA/O-RS对。例如,负选择标记、正选择标记或正负选择标记可以是在适当反应物存在时能发荧光或催化发光反应的标记。在另一个实施方案中,标记的产物可通过荧光激活的细胞分选法(FACS)或发光检测技术检测。另外,标记还可以是亲和选择标记。参见Francisco,J.A.等,(1993)Production and fluorescence-activated cell sorting of Escherichia coli expressing afunctional antibody fragement on the external surface.Proc Natl Acad Sci USA.9010444-8。
产生重组正交tRNA的其他方法见于题为“Methods and compositions for theproduction of orthogonal tRNA-aminoacyl tRNA synthetase paris”(用于产生正交tRNA-氨酰-tRNA合成酶对的方法和组合物)的国际专利申请WO 2002/086075和题为“EXPANDING THE EUKARYOTIC GENETIC CODE”(扩充真核遗传密码)的USSN60/479,931及60/496,548。还见于Forster等,(2003)Programming peptidomimeticsynthetases by translating genetic codes designed de novoPNAS100(11)6353-6357;和Feng等,(2003),Expanding tRNA recognition of a tRNA synthetase by a single amino acidchange,PNAS100(10)5676-5681。
正交氨酰-tRNA合成酶(O-RS)本发明的O-RS在体外或体内能用氧化还原活性氨基酸优选氨酰化O-tRNA。可通过含O-RS的多肽或编码O-RS或O-RS片段的多核苷酸将本发明的O-RS提供给翻译系统。例如,O-RS包含SEQ ID NO1所列的氨基酸序列或其保守变体。在另一个实施例中,O-RS或O-RS片段是由多核苷酸或其互补序列编码的,该多核苷酸编码含有SEQ ID NO1的氨基酸序列。参见本文表1和实施例2中所列的典型O-RS分子的序列。也可参见本文的“核酸和多肽序列及其变体”部分。
鉴定可与O-tRNA一起应用的正交氨酰-tRNA合成酶(O-RS)的方法也是本发明的特征。例如,该方法包括选择,如正选择,第一物种的细胞群,该群中的个别细胞含有1)一组氨酰-tRNA合成酶(RS)的一个成员(如这组RS可包括突变体RS、第一物种之外物种来源的RS,或包括这二者);2)正交tRNA(O-tRNA)(如一个或多个物种来源的);以及3)编码选择标记(如正选择标记)并含有至少一个选择者密码子的多核苷酸。筛选出那些与缺乏该组RS成员或RS成员数目少的细胞相比抑制效率升高的细胞。抑制效率可用本领域已知的和本文所描述的方法测定。抑制效率升高的细胞所包含的活性RS可氨酰化O-tRNA。将来自第一物种的第一组tRNA被活性RS氨酰化的水平(体外或体内),与来自第二物种的第二组tRNA被活性RS氨酰化的水平相比较。氨酰化水平可通过检测底物(标记的氨基酸或非天然氨基酸,例如,诸如DHP等氧化还原活性氨基酸)来确定。通常选出氨酰化第二组tRNA的效率比氨酰化第一组tRNA更高的活性RS,从而获得能与O-tRNA一起应用或更有效(优化)的正交氨酰-tRNA合成酶。利用这种方法鉴定出的O-RS也是本发明的特征。
许多试验可用于确定氨酰化效率。这些方法可在体外或体内进行。例如,体外氨酰化试验的描述可见Hoben和Soll(1985)Methods Enzymol.11355-59中。氨酰化效率还可利用一个与正交翻译组分相连的报告分子,和检测能表达含有一个选择者密码子的多核苷酸编码的蛋白质的细胞在该报告分子的水平来确定。见题为“IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS(非天然氨基酸的体内掺入)”的WO 2002/085923和2004年4月16日提交的国际专利申请PCT/US2004/011786。
O-RS可以被进一步修饰以改变该合成酶的底物特异性,以使该O-RS只能将所需要的非天然氨基酸(如DHP等的氧化还原活性氨基酸)而不是其他任何常见的20种氨基酸加载到O-tRNA上。产生对非天然氨基酸具有底物特异性的正交氨酰tRNA合成酶的方法包括突变该合成酶,例如在该合成酶的活性位点、编辑机制位点上突变合成酶,在不同的位点上组合合成酶的不同结构域等,然后通过筛选过程进行选择。可用的一种策略是依据联用正选择然后负选择。在正选择过程中,抑制引入到正选择标记非必需位置上的选择者密码子,可使细胞在正选择压力下存活下来。在同时存在天然氨基酸和非天然氨基酸时,存活细胞编码的活性合成酶可利用天然或非天然氨基酸氨酰化正交的抑制型tRNA。在负选择过程中,抑制引入到负选择标记非必需位置的选择者密码子,可去除具有天然氨基酸特异性的合成酶。经过负选择和正选择存活的细胞所编码的合成酶只能用非天然氨基酸来氨酰化(加载)正交的抑制型tRNA。然后对这些合成酶进行进一步的诱变,如DNA改组或其他重复诱变方法。
突变体O-RS文库可利用本领域已知的各种诱变技术来构建。例如,可通过位点特异性突变、随机位点突变、同源重组、DNA改组或其他重复诱变方法、嵌合构建、或者它们的组合来制备。例如,可从两个或多个其它较小的趋异性较低的“亚文库”来构建突变体RS文库。本发明还包括RS的嵌合文库。应注意可任选构建各种生物(例如微生物如真细菌或古细菌)的tRNA合成酶文库,如具有天然多样性的文库(见Short等人的美国专利No.6,238,884;Schallenberger等人的美国专利No.5,756,316;Petersen等人的美国专利No.5,783,431;Thompson等人的美国专利No.5,824,485;Short等人的美国专利No.5,958,672)并筛选其中的正交对。
合成酶一旦通过正选择和负选择过程,可对这些合成酶进一步诱变。例如,分离编码O-RS的核酸;从该核酸产生一组编码突变的O-RS(如通过随机诱变、位点特异性诱变、重组或它们的组合)的多核苷酸;这些步骤的每一步或者这些步骤的组合都可以重复进行直到获得能够优先用非天然氨基酸(如氧化还原活性氨基酸)氨酰化O-tRNA的突变体O-RS。在本发明的一个方面,这些步骤可进行多次,如至少两次。
其他严格程度的选择/筛选条件也可用于本发明的方法中以产生O-tRNA、O-RS或O-tRNA/O-RS对。选择或筛选条件的严格程度在产生O-RS的一个步骤或两个步骤中可以不同。这包括改变所用选择/筛选试剂的浓度等。还可以进行额外轮次的正选择和/或负选择。选择或筛选还可以包括氨基酸渗透性的一种或多种改变,翻译效率的改变、翻译精确度的改变等。一般来说,所述一种或多种改变的基础是能利用正交的tRNA-tRNA合成酶对产生蛋白质的生物体的一种或多种基因中的突变。
产生O-RS以及改变该合成酶的底物特异性的其他通用细节可参见题为Methodsand compositions for the production of orthogonal tRNA-aminoacyltRNA synthetaseparis”(产生正交tRNA-氨酰-tRNA合成酶对的方法和组合物)的国际专利申请WO2002/086075和2004年4月16日提交的国际专利申请PCT/US2004/011786。
来源和宿主生物本发明的翻译组分可衍生自非真核生物。例如,正交的O-tRNA可衍生自非真核生物(或生物组合),例如古细菌,如詹氏甲烷球菌、热自养甲烷球菌,嗜盐菌如沃氏盐杆菌和盐杆菌NRC-1,闪烁古生球菌,激烈火球菌,超嗜热古菌,Aeuropyrum pernix,海沼甲烷球菌,坎氏甲烷嗜热菌,马氏微球菌(Mm),超耐高温热棒菌,火球菌(Pyrococcus abyssi),硫磺矿硫化叶菌(Ss),硫化叶菌(Sulfolobus tokodaii),噬酸热原体,火山热原体等,或者真细菌,如大肠杆菌、嗜热栖热菌(Thermus thermophilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermphilus)等,正交的O-RS可衍生自非真核生物(或生物混合物),例如古细菌,如詹氏甲烷球菌、热自养甲烷球菌,嗜盐菌属如沃氏盐杆菌和盐杆菌NRC-1,闪烁古生球菌,激烈火球菌,超嗜热古菌,Aeuropyrum pernix,海沼甲烷球菌,坎氏甲烷嗜热菌,马氏微球菌,超耐高温热棒菌,火球菌(Pyrococcusabyssi),硫磺矿硫化叶菌,硫化叶菌(sulfolobus tokodaii),噬酸热原体,火山热原体等,或者真细菌,如大肠杆菌、嗜热栖热菌、嗜热脂肪芽孢杆菌等。在一个实施方案中,真核生物如植物、藻类、原生生物、真菌、酵母、动物(如哺乳动物、昆虫、节肢动物等)等也可作为O-tRNA和O-RS的来源。
O-tRNA/O-RS对的各个组分可以衍生自同一生物,也可以衍生自不同生物。在一个实施方案中,O-tRNA/O-RS对衍生自同一生物。或者O-tRNA/O-RS对的O-tRNA和O-RS也可以衍生自不同生物。
可在体内或体外,或所用的细胞(如非真核细胞或真核细胞)中选择或筛选O-tRNA、O-RS或O-tRNA/O-RS对以产生出含氧化还原活性氨基酸的多肽。非真核细胞可以是各种来源的,如真细菌,如大肠杆菌、嗜热栖热菌、嗜热脂肪芽孢杆菌等,或者古细菌,如詹氏甲烷球菌、热自养甲烷球菌,嗜盐菌属如沃氏盐杆菌和盐杆菌NRC-1,闪烁古生球菌,激烈火球菌,超嗜热古菌,Aeuropyrum pernix,海沼甲烷球菌,坎氏甲烷嗜热菌,马氏微球菌,超耐高温热棒菌,火球菌(Pyrococcus abyssi),硫磺矿硫化叶菌,硫化叶菌(Sulfolobus tokodaii),噬酸热原体,火山热原体等。真核细胞也可以是各种来源的,如植物(如复杂植物,如单子叶植物或双子叶植物)、藻类、原生生物、真菌、酵母(如酿酒酵母)、动物(如哺乳动物、昆虫、节肢动物等)等。含本发明的翻译组分的细胞组合物也是本发明的特征。
筛选一个物种中的O-tRNA和/或O-RS用于另外一个物种的描述见2004年4月16日提交的国际专利申请PCT/US2004/011786。
选择者密码子本发明的选择者密码子扩大了蛋白质生物合成机的遗传密码框架。例如,选择者密码子包括独特的三碱基密码子,无义密码子如终止密码子,例如琥珀密码子(UAG)、或乳白密码子,非天然密码子,至少一个四碱基密码子,稀有密码子等。可将一些选择者密码子导入到所需基因内,如一个、两个、三个或三个以上选择者密码子。通过采用不同的选择者密码子,可利用多个正交tRNA/合成酶对同时将多个氧化还原活性氨基酸(例如非天然氨基酸)同时掺入到特定位点上。
在一个实施方案中,本发明的方法包括利用终止密码子作为选择者密码子在体内将氧化还原活性氨基酸引入到细胞内。例如,产生可识别该终止密码子的O-tRNA,然后被O-RS用氧化还原活性氨基酸氨酰化。这种O-tRNA不能被天然产生的宿主氨酰-tRNA合成酶所识别。可利用常规的定点诱变技术将终止密码子引入到编码感兴趣多肽的多核苷酸的感兴趣位点上。参见Sayers,J.R.等,(1988),″5′,3′Exonucleasein phosphorothioate-based oligonucleotide-directed mutagenesis.″Nucleic Acids Res,791-802。当O-RS、O-tRNA和编码感兴趣多肽的核酸在体内组合时,氧化还原活性氨基酸因响应终止密码子而被掺入,产生在该特定位置上含氧化还原活性氨基酸的多肽。本发明的一个实施方案中,用作选择者密码子的终止密码子不是琥珀密码子UAG和/或乳白密码子UGA。一实施例中,将UAG和UGA都用作选择者密码子的遗传密码可编码22个氨基酸,同时保留赭石无义密码子UAA,UAA是最丰富的终止信号。
体内掺入氧化还原活性氨基酸对宿主细胞不会产生显著影响。例如,在非真核细胞如大肠杆菌内,由于UAG密码子的抑制效率依赖于O-tRNA(如琥珀抑制型tRNA)和释放因子1(RF1)(RF1可结合UAG密码子,而引起正在延伸的肽链从核糖体上释放下来)之间的竞争,因此可通过提高O-tRNA(如抑制型tRNA)的表达水平,或利用RF1缺陷株来调节抑制效率。在真核细胞内,由于UAG密码子的抑制效率依赖于O-tRNA(如琥珀抑制型tRNA)和真核释放因子(如eRF)(eRF可结合终止密码子,引起正在延伸的肽链从核糖体上释放下来)之间的竞争,因此可通过提高O-tRNA(如抑制型tRNA)的表达水平来调节抑制的效率。另外,也可存在其他化合物,例如还原剂二硫苏糖醇(DTT)。
氧化还原活性氨基酸也可以由稀有密码子编码。例如,当体外蛋白合成反应中的精氨酸浓度下降时,稀有的精氨酸密码子AGG被证实可通过丙氨酸酰化的合成tRNA有效地将丙氨酸掺入到多肽链内。见Ma等,Biochemistry,327939(1993)。在这种情况下,合成的tRNA可与天然的tRNAArg竞争,后者作为稀有成分存在于大肠杆菌内。另外,某些生物不能利用所有的三联密码子。藤黄微球菌(Micrococcus luteus)内的独立密码子AGA可用于在体外将氨基酸插入到转录/翻译提取物内。见Kowal和Oliver,Nucl.Acid.Res.,254685(1997)。体内利用这些稀有密码子可以产生出本发明的各组分。
选择者密码子还包括扩充的密码子,例如四碱基或多碱基密码子,如四碱基、五碱基、六碱基或多碱基密码子。四碱基密码子的例子包括AGGA、CUAG、UAGA、CCCU等。五碱基密码子的例子包括AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本发明的方法包括利用基于移码抑制的扩充密码子。四碱基或多碱基密码子可用于将一个或多个非天然氨基酸如氧化还原活性氨基酸掺入到同一个蛋白质内。在其他的实施方案中,反密码子环可以解码至少一个四碱基密码子、至少一个五碱基密码子、至少一个六碱基密码子等。由于有256个可能的四碱基密码子,因此,利用四碱基或多碱基密码子可在同一个细胞内编码多个非天然氨基酸。见Anderson等,(2002)Exploring the Limits of Codon and Anticodon Size,Chemistry andBiology,9237-244;以及Magliery,(2001)Expanding the Genetic CodeSelection ofEfficient Suppressors of Four-base Codons and Identification of″Shifty″Four-baseCodons with a Library Approach in Escherichia coli,J.Mol.Biol.307755-769。
例如,用体外生物合成方法利用四碱基密码子将非天然氨基酸掺入到蛋白质内。见Ma等,(1993)Biochemistry,327939;和Hohsaka等,(1999)J.Am.Chem.Soc.,12134。利用CGGG和AGGU与两个用化学方法酰化的移码抑制型tRNA,将赖氨酸的2-萘基丙氨酸和NBD衍生物同时掺入到链亲和素内。见Hohsaka等,(1999)J.Am.Chem.Soc.,12112194。在一个体内研究中,Moore等人检查了tRNALeu衍生物和NCUA反密码子能否抑制UAGN密码子(N可以是U、A、G或C),结果发现四联密码子UAGA可被含UCUA反密码子的tRNALeu解码,其效率为13~26%,在0或-1框架处几乎不解码。见Moore等,(2000)J.Mol.Biol.298195。在一个实施方案中,基于稀有密码子或无义密码子的扩充密码子可用于本发明中,这些密码子可降低在其他不需要位点发生错义通读和移码抑制。
在一个给定的系统中,选择者密码子还包括一个天然的三碱基密码子,该内源系统不能利用(或很少利用)这种天然的三碱基密码子。例如,包括缺乏能识别天然三碱基密码子的tRNA的系统和/或三碱基密码子是稀有密码子的系统。
选择者密码子任选包括非天然碱基对。这些非天然碱基对进一步扩充了现有的遗传字母表。一种额外的碱基对可将三联密码子的数目从64个增加到125个。三碱基对的特性包括稳定的选择性碱基配对、可有效地被聚合酶高度精确地掺入到DNA内、以及在新生非天然碱基对合成后继续有效地引物延伸。适合本发明方法和组合物的非天然碱基对的描述见Hirao等,(2002)An unnatural base pair for incorporatingamino acid analogues into protein,Nature Biotechnology,20177-182和Wu,Y.等,(2002)J.Am.Chem.Soc.12414626-14630。其他相关文献将在下文列出。
非天然核苷在用于体内时可以穿透生物膜,被磷酸化后形成相应的三磷酸盐形式。另外,所增加的遗传信息是稳定的,不含被细胞的酶破坏。Benner及其同事在先前`尝试利用与经典的Watson-Crick碱基对不同的氢键模式,最值得注意的是iso-Ciso-G对。见Switzer等,(1989)J.Am.Chem.Soc.,1118322和Piccirilli等,(1990)Nature,34333;Kool,(2000)Curr.Opin.Chem.Biol.,4602。一般来说,这些碱基会与天然碱基发生某种程度的错配,并且不能用酶学方法复制。Kool及其同事的研究证明碱基之间的疏水性包裹相互作用可代替氢键,驱使碱基对的形成。见Kool,(2000)Curr.Opin.Chem.Biol.,4602,Guckian和Kool,(1998)Angew.Chem.Int.Ed.Engl.,36,2825。为尝试开发出能满足上述所有要求的非天然碱基对,Schultz、Romesberg及其同事系统地合成和研究了一系列的非天然疏水碱基。发现PICS∶PICS自身配对比天然碱基对更稳定,可被大肠杆菌DNA聚合酶I的Klenow片段(KF)有效掺入到DNA内。见McMinn等,(1999)J.Am.Chem.Soc.,12111586和Ogawa等,(2000)J.Am.Chem.Soc.,1223274。3MN∶3MN自身配对可由KF合成,其活性和选择性足以使其行使生物学功能。见Ogawa等,(2000)J.Am.Chem.Soc.1228803。但是,这两个碱基的作用是进一步复制的链末端。最近已开发了一种可用于复制PICS自身对的突变型DNA聚合酶。另外,7AI自身对也可被复制。见Tae等,(2001)J.Am.Chem.Soc.,1237439。一种新型的金属碱基对Dipic:Py也被开发出来,该碱基对在结合Cu(II)时可形成稳定的碱基对。见Meggers等,(2000)J.Am.Chem.Soc.,1221071。由于扩充的密码子和非天然密码子本来就是与天然密码子正交的,因此本发明的方法可利用这一特性来产生这些密码子的正交tRNA。
一种翻译旁路系统也可用于将氧化还原活性氨基酸掺入到所需多肽内。在翻译旁路系统中,可将一个大序列插入到基因内不能翻译成蛋白质。该序列含有一种可作为提示信号的结构,诱导核糖体跳过该序列恢复掺入序列的下游翻译。
非天然氧基酸如本文所述,非天然氨基酸指除硒氨酸和/或吡咯赖氨酸和下列20种遗传密码编码的α氨基酸之外的所有氨基酸、修饰氨基酸或氨基酸类似物α氨基酸是丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。α氨基酸的通用结构可用结构式I表示 非天然氨基酸一般都具有结构式I的结构,其中R基团代表20种天然氨基酸中所用基团之外的任何取代基。见L.Stryer编的《生物化学》(Biochemistry)(第三版,1988,Freeman and Company,New York)以了解20种天然氨基酸的结构。注意,本发明的非天然氨基酸可以是上述20种α氨基酸之外的天然化合物。
一般来说,因为本发明的非天然氨基酸在侧链上与天然氨基酸不同,因此非天然氨基酸可以与其他氨基酸(如天然或天然的)形成酰胺键,形成的方式与天然蛋白中的酰胺键一样。但是,非天然氨基酸含有与天然氨基酸可区别的侧链基团。
在将非天然氨基酸掺入到蛋白质中时特别令人感兴趣的是能否将氧化还原活性氨基酸(例如含有可将分子中的电子和/或质子传递入或传递出结构部分的非天然氨基酸)掺入到蛋白质中。例如,在一类氧化还原活性氨基酸中,式I中的R包括但不限于酮基-、叠氮基-、羟基-、卤代-(例如碘代-)、硝基-、硫醇基-、硒基-、磺酰基-、杂环、醛(aldelhyde)、硫代酸等,或它们的任何组合。本发明的氧化还原活性氨基酸的例子包括但不限于3,4-羟基-L-苯丙氨酸(DHP)、3,4,6-三羟基-L-苯丙氨酸、3,4,5-三羟基-L-苯丙氨酸、3-硝基-酪氨酸、4-硝基-苯丙氨酸、3-硫醇-酪氨酸等。也可参见图1。
在其他的非天然氨基酸中,式I中的R基团可以是烷基-、芳基-、酰基-、肼、氰基-、卤代-、酰肼、烯基、炔基、醚、硼酸基、磷、膦酰基、膦、烯酮、亚胺、酯、羟胺、胺等,或上述基团的组合。我们感兴趣的其他非天然氨基酸包括但不限于含光活化交联接头的氨基酸、自旋-标记氨基酸、荧光标记氨基酸、金属结合氨基酸、含金属的氨基酸、放射性氨基酸、含有新官能团的氨基酸、能与其他分子共价或非共价结合的氨基酸、光陷阱(photocaged)和/或光促异构(photoisomerizable)氨基酸、含生物素或生物素类似物的氨基酸、含酮基氨基酸、糖基化氨基酸、侧链连有糖部分的氨基酸、含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、化学方法可裂解或光解的氨基酸、与天然氨基酸相比侧链延长的氨基酸(如超过约5个、约10个碳原子的聚醚或长链烃)、含碳连接糖的氨基酸、含氨基硫代酸的氨基酸、以及含一个或多个毒性结构部分的氨基酸。
非天然氨基酸除了可含新型侧链以外,还任选可含有经修饰的骨架结构,如结构式II和III所示的结构 式中,Z一般为OH、NH2、SH、NH-R′或S-R′;X和Y可以相同或不同,一般包括S或O,R和R′可相同也可不同,一般选自与上述结构式I所示的非天然氨基酸的R基团相同的组成物以及氢。例如,本发明的非天然氨基酸还可以在结构式II和III所示的氨基或羧基上含有取代基。这种类型的非天然氨基酸包括但不限于带20个常见氨基酸相应的侧链或非天然侧链的α-羟酸、α-硫代酸、α-氨基硫代羧酸。另外,α碳原子上的取代基还包括L,D或α-α-双取代的氨基酸,如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其他的结构形式包括环形氨基酸,如脯氨酸类似物以及3、4、6、7、8和9元环脯氨酸类似物,β和γ氨基酸,如取代的β丙氨酸和γ-氨基丁酸。
例如,许多非天然氨基酸衍生自天然氨基酸,如酪氨酸、谷氨酰胺、苯丙氨酸等。酪氨酸类似物包括对位取代的酪氨酸、正位取代的酪氨酸和间位取代的酪氨酸,这些酪氨酸取代基团包括乙酰基、苯甲酰基、氨基、肼、羟氨基、巯基、羧基、异丙基、甲基、C6-C20直链或支链烷基、饱和或不饱和烷基、O-甲基、聚醚基等。另外,也可考虑多个取代的芳环。本发明的谷氨酰胺类似物包括但不限于α-羟基衍生物、γ-取代衍生物、环状衍生物和酰胺基取代的谷氨酰胺衍生物。苯丙氨酸类似物的例子包括但不限于对位取代的苯丙氨酸、正位取代的苯丙氨酸和间位取代的苯丙氨酸,这些取代基包括羟基、甲氧基、甲基、丙稀基、醛基、硝基、硫醇基或酮基等。非天然氨基酸的具体例子包括但不限于3,4-羟基-L-苯丙氨酸(DHP)、3,4,6-三羟基-L-苯丙氨酸、3,4,5-三羟基-L-苯丙氨酸、4-硝基-苯丙氨酸、p-乙酰基-L-苯丙氨酸、p-炔丙氧基苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、O-4-丙稀基-L-酪氨酸、4-丙基-L-酪氨酸、3-硝基-酪氨酸、3-硫醇-酪氨酸、三-O-乙酰基-GlcNAcβ-丝氨酸、L-多巴、含氟苯丙氨酸、异丙基-L-苯丙氨酸、p-叠氮基-L-苯丙氨酸、p-酰基-L-苯丙氨酸、p-苯甲酰基-L-苯丙氨酸、L-磷丝氨酸、膦酰基丝氨酸、膦酰基酪氨酸、p-碘代-苯丙氨酸、p-溴代苯丙氨酸、p-氨基-L-苯丙氨酸以及异丙基-L-苯丙氨酸等。各种非天然氨基酸的结构显示在本文的图1和题为“非天然氨基酸的体内掺入”的WO 2002/085923的图16、17、18、19、26和29中。
非天然氨基酸的化学合成上述许多非天然氨基酸都可以从Sigma(USA)或Aldrich(Milwaukee,WI,USA)等公司购买到。那些不能从市场上购买到的非天然氨基酸可任选按照各种发表的或本领域技术人员已知的方法合成。见Fessendon和Fessendon的《有机化学》(OrganicChemistry)(1982,第二版,Willard Grant Press,Boston Mass.);March的《高级有机化学》(Advanced Organic Chemistry)(第三版,1985,Wiley and Sons,New York);以及Carey和Sundberg的《高级有机化学》(Advanced Organic Chemistry)(第三版,A和B部分,1990,Plenum Press,New York)。其他描述非天然氨基酸合成的文献包括题为“非天然氨基酸的体内掺入”的国际专利申请WO 2002/085923;Matsoukas等,(1995)J.Med.Chem.,38,4660-4669;King,F.E.和Kidd,D.A.A.(1949)A NewSynthesis of Glutamine and of γ-Dipeptides of Glutamic Acid from PhthylatedIntermediates.J.Chem.Soc.,3315-3319;Friedman,O.M.和Chatterrji,R.(1959)Synthesisof Derivatives of Glutamine as Model Substrates for Anti-tumor Agents.J.Am.Chem.Soc.81,3750-3752;Craig,J.C.等(1988)Absolute Configuration of the Enantiomers of7-Chloro-4[[4-(diethylamino)-l-methylbutyl]amino]quinoline(Chloroquine).J.Org.Chem.53,1167-1170;Azoulay,M.,Vilmont,M.和Frappier,F.(1991)Glutamine analogues asPotential Antimalarials,Eur.J.Med.Chem.26,201-5;Koskinen,A.M.P.和Rapoport,H.(1989)Synthesis of 4-Substituted Prolines as Conformationally Constrained Amino AcidAnalogues.J.Org.Chem.54,1859-1866;Christie,B.D.和Rapoport,H.(1985)Synthesisof Optically Pure Pipecolates from L-Asparagine.Application to the Total Synthesis of(+)-Apovincamine through Amino Acid Decarbonylation and Iminium Ion Cyclization.J.Org.Chem.19891859-1866;Barton等,(1987)Synthesis of Novelα-Amino-Acids andDerivatives Using Radical ChemistrySynthesis of L-and D-α-Amino-Adipic Acids,L-α-aminopimelic Acid and Appropriate Unsaturated Derivatives.Tetrahedron Lett.434297-4308;以及Subasinghe等,(1992)Quisqualic acid analoguessynthesis ofbeta-heterocyclic 2-aminopropanoic acid derivatives and their activity at a novelquisqualate-sensitized site.J.Med.Chem.354602-7。还可参见2003年12月22日提交的题为“Protein Arrays(蛋白质阵列)”的国际专利申请PCT/US03/41346。
非天然氨基酸的细胞摄取一般认为在设计和选择非天然氨基酸,如用于掺入到蛋白质中的非天然氨基酸时要考虑的一个问题是细胞对非天然氨基酸的摄取。例如,带高密度电荷α氨基酸的化合物不可能透过细胞膜。天然氨基酸通过蛋白质转运系统的收集摄入到细胞内,但是这些转运系统一般都有不同程度的氨基酸特异性。可进行一种快速筛选来评价哪种非天然氨基酸可被细胞摄取。见下列文献中的毒性试验2003年12月22日提交的题为“Protein Arrays(蛋白质阵列)”的国际专利申请PCT/US03/41346;以及Liu和Schultz(1999)Progress toward the evolution of an organism with an expanded geneticcode.PNAS964780-4785。虽然用各种方法不难分析摄取情况,但是,设计能利用细胞摄取通路的非天然氨基酸的另外一种方法是在体内提供生物合成通路所产生的氨基酸。
非天然氧基酸的生物合成细胞内已经存在许多生物合成通路可产生氨基酸和其他化合物。虽然某种具体非天然氨基酸的生物合成方法在自然界中如在细胞内可能不存在,但本发明提供了这样的方法。例如,可以通过加入新的酶或者修饰现有的宿主细胞通路来产生非天然氨基酸的生物合成通路。加入的新酶可以是天然产生的酶,也可以是人工改造的酶。例如,p-氨基苯丙氨酸(如上述WO 2002/085923实施例中提到的)的生物合成依赖于加入其他生物的已知酶的组合物。可以通过用含这些酶的基因的质粒转化细胞而将这些酶的基因导入到细胞内。这些基因在细胞内表达时即提供了酶催化通路来合成所需要的化合物。可任选加入的这类酶的例子见下面实施例的描述。加入的酶的序列可在Genbank中找到。也可以同样方式将人工修饰的酶加入到细胞内。以这种方式操纵细胞内的合成机制和物质来产生非天然氨基酸。
许多方法确实都可用于在体外或体内产生生物合成通路所用的新型酶、改造现有的通路来产生非天然氨基酸。许多修饰酶的方法和生物合成通路的其他组分都可用于本发明来产生非天然氨基酸(或者修饰酶使其具有新的底物特异性或其他感兴趣的活性)。例如,DNA改组可用于产生新的酶和/或这种酶的通路以在体外或体内产生非天然氨基酸(或产生新的合成酶)。见Stemmer(1994),Rapid evolution of a protein invitro by DNA shuffling,Nature370(4)389-391;以及Stemmer,(1994),DNA shufflingby random fragmentation and reassemblyIn vitro recomb ination for molecular evolution,Proc.Natl.Acad.Sci.USA.,9110747-10751。一种改组相关基因(如同源的基因)家族的方法可快速地修改酶使其具有所需特性。这种“家族基因改组”方法的一个例子见Crameri等(1998)DNA shuffling of a family of genes from diverse species acceleratesdirectedevolutionNature,391(6664)288-291中的描述。新型酶(不论生物合成通路的组分或合成酶)也可以通过DNA重组方法产生,这种方法被称为“产生杂交酶的渐进式截断技术”(ITCHY),如Ostermeier等,(1999)″A combinatorial approach to hybridenzymes independent of DNA homology″Nature Biotech171205中所描述的。这种方法也可用于产生酶或其他通路变体的文库,这些酶或通路变体可作为一种或多种体外或体内重组方法的底物。见Ostermeier等(1999)″Combinatorial Protein Engineering byIncremental Truncation,″Proc.Natl.Acad.Sci.USA,963562-67,和Ostermeier等(1999),″Incremental Truncation as a Strategy in the Engineering of Novel Biocatalysts,″Biological and Medicinal Chemistry,72139-44。另外一种方法采用指数整体诱变来产生酶或其他通路变体的文库,选出文库中能够催化生物合成反应产生非天然氨基酸(或新的合成酶)的酶和通路变体。在这种方法中,感兴趣序列中的小簇残基被用于随机地平行鉴定位置发生改变从而导致产生功能性蛋白的每一个氨基酸。能用于本发明来产生可生产非天然氨基酸的新酶(或新的合成酶)的这种方法的例子见于Delegrave和Youvan(1993)Biotechnology Research111548-1552的描述。在另一种方法中,利用掺入的(doped)或退化的寡核苷酸进行随机或半随机诱变来改造酶和/或通路组分,例如采用Arkin和Youvan(1992)″Optimizing nucleotide mixtures to encodespecific subsets of amino acids for semi-random mutagenesis″Biotechnology10297-300或Reidhaar-Olson等,(1991)″Random mutagenesis of protein sequences usingoligonucleotide cassettes″Methods Enzymol.208564-86所描述的通用诱变方法。通常称为“非随机”诱变的另一种利用多核苷酸重新组装和位点饱和诱变方法可用来产生酶和/或通路组分,然后筛选能够自行一种或多种合成酶或生物合成通路的能(如在体内产生非天然氨基酸)的那些酶或组分。见Short的题为“基因疫苗和酶的非随机产生”的专利申请WO 00/46344。
这种突变方法的一种替代方法包括重组生物的整个基因组并选择产生的具有特定通路功能的子代(通常称为“全基因组改组”)。这种方法也可用于本发明,如通过基因组重组和选择能够产生出非天然氨基酸(或其中间体)的生物(如大肠杆菌或其他细胞)。例如,下列文献中所描述的方法可用来设计通路以修饰细胞内现有的和/或新的通路,在体内产生非天然氨基酸Patnaik等(2002)″Genome shuffling of lactobacillusfor improved acid tolerance″Nature Biotechnology,20(7)707-712;以及Zhang等(2002)″Genome shuffling leads to rapid phenotypic improvement in bacteria″Nature,02-7,415(6872)644-646。
现在已有一些其他技术可用来改造生物和代谢通路来产生所需化合物,这些方法也可用于产生非天然氨基酸。描述这种通路改造方法的文献包括Nakamura和White(2003)″Metabolic engineering for the microbial production of 1,3propanediol″Curr.Opin.Biotechnol.14(5)454-9;Berry等(2002)″Application of Metabolic Engineering toimprove both the production and use of Biotech Indigo″J.Industrial Microbiology andBiotechnology28l27-133;Banta等(2002)″Optimizing an artificial metabolic pathwayEngineering the cofactor specificity of Corynebacterium 2,5-diketo-D-gluconic acidreductase for use in vitamin C biosynthesis″Biochemistry,41(20),6226-36;Selivonova等,(2001)″Rapid Evolution of Novel Traits in Microorganisms″Applied andEnvironmental Microbiology,673645等等。
一般来说,无论用什么方法,用本发明的经改造的生物合成通路所产生出的非天然氨基酸的浓度足以有效的生物合成蛋白质,例如可达到细胞内的天然含量,但该浓度对细胞内的其他氨基酸的浓度不会产生显著影响,或者耗竭掉细胞内的资源。以这种方法在体内产生的浓度一般约为10mM到0.05mM。一旦细胞经过改造产生了可用于特异性通路和非天然氨基酸制备的酶后,任选进行体内选择以进一步优化用于核糖体蛋白合成和细胞生长的非天然氨基酸的产量。
用于掺入3,4-二羟基-L-苯丙氨酸(DHP)的正交组分本发明提供了在体内产生能将氧化还原活性氨基酸,例如3,4-二羟基-L-苯丙氨酸(DHP)掺入到正在合成的多肽链中以响应选择者密码子,如终止密码子、无义密码子、四碱基或多碱基密码子等的正交组分的产生方法和组合物。例如,本发明提供了正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)及两者组成的对。这些正交对可用于将DHP掺入到正在延伸的多肽链中。
本发明的组合物包括正交氨酰-tRNA合成酶(O-RS),其中的O-RS优先用DHP氨酰化O-tRNA。在某些实施方案中,O-RS含有SEQ ID NO1所示的氨基酸序列或其保守变体。在本发明的某些实施方案中,O-RS优先用氧化还原活性氨基酸氨酰化O-tRNA,其效率至少是含氨基酸序列SEQ ID NO1多肽的50%。
含有O-RS的组合物还可以任选含有正交tRNA(O-tRNA),该O-tRNA可识别选择者密码子。一般来说,与包含或编码于本文序列表和实施例所列的多核苷酸序列的O-tRNA相比,在相关合成酶存在的条件下,本发明的O-tRNA为了响应选择者密码子而产生的抑制效率至少可达45%、50%、60%、75%、80%、90%或更高。在一个实施方案中,O-RS联合O-tRNA所产生的抑制效率至少比缺少O-RS的O-tRNA所产生的抑制效率高5倍、10倍、15倍、20倍、25倍或更高。一方面,O-RS联合O-tRNA所产生的抑制效率至少是詹氏甲烷球菌来源的正交酪氨酰-tRNA合成酶对所产生的抑制效率的45%。
包含O-tRNA的组合物还可以包含细胞(例如非真核细胞如大肠杆菌等,或真核细胞)和/或翻译系统。
包含翻译系统的细胞(如非真核细胞或真核细胞)也是本发明的内容,其中的翻译系统包括正交-tRNA(O-tRNA);正交氨酰-tRNA合成酶(O-RS)和氧化还原活性氨基酸,例如3,4-二羟基-L-苯丙氨酸(DHP)。一般来说,O-RS优先氨酰化O-tRNA,其效率至少是含氨基酸序列SEQ ID NO.1多肽的50%。O-tRNA可识别第一选择者密码子,O-RS优先用3,4-二羟基-L-苯丙氨酸(DHP)氨酰化O-tRNA。在一个实施方案中,O-tRNA含有SEQ ID NO.2所示的序列或其互补多核苷酸序列,或者被该序列编码。在一个实施方案中,O-RS含有任何一个SEQ ID NO.1或其保守变体所示的氨基酸序列。
本发明的细胞还可以包含其他的O-tRNA/O-RS对和第二种非天然氨基酸,例如,其中的这个O-tRNA可识别第二选择者密码子,这个O-RS优选用第二种非天然氨基酸氨酰化O-tRNA。另外,本发明的细胞还可以包含含有感兴趣多肽编码多核苷酸的核酸,其中的多核苷酸含有能被O-tRNA识别的选择者密码子。
在某些实施方案中,本发明的细胞包括大肠杆菌细胞,细胞内含有正交-tRNA(O-tRNA)、正交氨酰-tRNA合成酶(O-RS)、氧化还原活性氨基酸和含有感兴趣多肽编码多核苷酸的核酸,其中的多核苷酸含有能被O-tRNA识别的选择者密码子。
在本发明的某些实施方案中,本发明的O-tRNA含有本文列表中和实施例中所示的多核苷酸序列或其互补的多核苷酸序列,或者被这些序列编码。在本发明的某些实施方案中,O-RS含有序列表中所示的氨基酸序列或其保守变体。在一个实施方案中,O-RS或其片段被编码本文列表中和实施例中所示的氨基酸序列的多核苷酸序列或其互补的多核苷酸序列编码。
本发明的O-tRNA和/或O-RS可衍生自各种生物(如真核和/或非真核生物)。
多核苷酸也是本发明的特征。本发明的多核苷酸包括人工的(如人造的和非天然产生的)多核苷酸,其中含有编码本文列表所示多肽的核苷酸序列,和/或与该多核苷酸序列互补的多核苷酸序列。本发明的多核苷酸还包括在较严格的条件下能与上述多核苷酸在核酸全长上杂交的核酸。本发明的多核苷酸还包括与天然tRNA或其相应编码核酸的序列具有至少75%、80%、90%、95%、98%或更高相同性的多核苷酸(但是本发明的多核苷酸不是天然tRNA或其相应的编码核酸),其中的tRNA可识别选择者密码子,如四碱基密码子。与上述任何多核苷酸序列至少有80%、90%、95%、98%或更高相同性的人工多核苷酸序列,和/或含上述序列保守变体的多核苷酸也包括在本发明的多核苷酸中。
含本发明的多核苷酸的载体也是本发明的特征。例如,本发明的载体可以是质粒、粘粒、噬菌体、病毒、表达载体等。含本发明的载体的细胞也是本发明的特征。
O-tRNA/O-RS对的组分的产生方法也是本发明的特征。利用这些方法产生出的组分也是本发明的特征。例如,至少产生一个与细胞正交的tRNA(O-tRNA)的方法包括产生突变的tRNA文库;突变tRNA突变文库内每一个成员的反密码子环使其能识别选择者密码子,从而形成一个O-tRNA文库,负选择第一物种的第一细胞群,其中的细胞含有O-tRNA文库的成员。负选择可去除含O-tRNA文库的成员的细胞,其中的O-tRNA可被细胞内源性的氨酰-tRNA合成酶(RS)氨酰化。这样就形成一个与第一物种的细胞正交的tRNA库,从而至少可以获得一个O-tRNA。利用本发明的方法产生出的O-tRNA也包括在本发明之内。
在某些实施方案中,本发明的方法还包括正选择第一物种的第二细胞群,其中的细胞含有与第一物种的细胞正交的tRNA库的成员、同源的氨酰-tRNA合成酶和正选择标记。通过正选择筛选出的那些细胞含有能被同源氨酰-tRNA合成酶氨酰化的tRNA库的成员,在正选择标记存在的情况下可出现预期的反应,从而可以获得O-tRNA。在某些实施方案中,第二细胞群含有没有被负选择去除的细胞。
本发明还提供了能用氧化还原活性氨基酸加载O-tRNA的正交-氨酰-tRNA合成酶的鉴定方法。例如,该方法包括筛选第一物种的细胞群,其中的细胞都含有1)一组氨酰-tRNA合成酶(RS)的成员(如一组RS可包括突变的RS、第一物种之外的物种来源的RS、或者二者都包括);2)正交-tRNA(O-tRNA)(如衍生自一个或多个物种);以及3)编码正选择标记并且至少包含一个选择者密码子的多核苷酸。
筛选细胞(如宿主细胞)以挑出与不含RS群的成员或含量较少的细胞相比抑制效率升高的那些细胞。这些被筛选出的细胞含有能氨酰化O-tRNA的有活性的RS。利用这种方法鉴定出的正交氨酰-tRNA合成酶也是本发明的特征。
在细胞(例如非真核细胞如大肠杆菌细胞等,或者真核细胞)内产生特定位置上为3,4-二羟基-L-苯丙氨酸(DHP)的蛋白质的方法也是本发明的特征。例如,一种方法是在适当的培养基内培养细胞,其中的细胞含有核酸,该核酸至少含有一个选择者密码子,编码一个蛋白,加入DHP,在至少含有一个选择者密码子的核酸的翻译过程中DHP被掺入到蛋白质的特定位置上,生成蛋白质。细胞还含有在细胞内有功能并且能识别选择者密码子的正交-tRNA(O-tRNA);以及优先用DHP氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。利用这种方法产生的蛋白质也是本发明的特征。
本发明还提供了包含蛋白质的组合物,其中的蛋白质含有DHP。在某些实施方案中,蛋白质的氨基酸序列与已知蛋白如治疗蛋白、诊断蛋白、工业用酶的氨基酸序列或其部分至少75%相同性。另外,组合物还可以包含药学上可接受的载体。
核酸和多肽序列及其变体如上文和下文所描述,本发明提供了编码例如O-tRNA和O-RS的核酸的多核苷酸序列和多肽的氨基酸序列,例如O-RS,以及包含所述序列的组合物、系统和方法。所述序列的例子,如O-tRNA和O-RS的氨基酸和核苷酸序列也在本文中列出(见表1,例如SEQ ID NO1-3)。但是,本领域的技术人员应该了解本发明并不仅仅局限于这些序列,如实施例和列表中的序列。本领域的技术人员应当了解本发明还包括具有本文所描述的功能如编码合适O-tRNA或O-RS的许多相关和不相关序列。
本发明提供了多肽(O-RS)和多核苷酸,如O-tRNA、编码O-RS或其片段的多核苷酸,用于分离氨酰-tRNA合成酶克隆的寡核苷酸等。本发明的多核苷酸包括那些编码本发明的感兴趣蛋白或多肽的多核苷酸,其中的蛋白或多肽含有一个或多个选择者密码子。另外,本发明的多核苷酸还包括含有SEQ ID NO2中所列核苷酸序列的多核苷酸;与多核苷酸序列互补的多核苷酸或者编码多核苷酸序列的多核苷酸。本发明的多核苷酸还可以编码包含SEQ ID NO1的氨基酸序列。本发明的多核苷酸还包括编码本发明的多肽的多核苷酸。同样,在高严格条件下,可与上述多核苷酸在全长核酸序列上杂交的人工核酸也包括在本发明的多核苷酸范围内。在一个实施方案中,组合物包含本发明的多肽和各种赋形剂(如缓冲液、水、药学上可接受的赋形剂等)。本发明还提供了可与本发明的多肽发生特异性免疫反应的抗体或抗血清。人工多核苷酸是由人产生的,不是天然发生的。
本发明的多核苷酸还包括人工的多核苷酸,这种多核苷酸与天然tRNA(但是天然tRNA除外)至少有75%、80%、90%、95%、98%或更高的相同性。多核苷酸还包括与天然tRNA的多核苷酸至少有75%、80%、90%、95%、98%或更高相同性的人工多核苷酸。
在某些实施方案中,载体(如质粒、粘粒、噬菌体、病毒等)含有本发明的多核苷酸。在一个实施方案中,载体是表达载体。在另一个实施方案中,表达载体包含与本发明的一个或多个多核苷酸功能相连的启动子。在另一个实施方案中,细胞包含携带本发明的多核苷酸的载体。
本领域的技术人员还应该理解的是本发明还包括公开序列的多种变体。例如,可形成功能相同序列的公开序列的保守变体也包含在本发明的范围内。核酸多核苷酸序列的变体也被认为包括在本发明的范围之内,其中的变体可与至少一个公开序列杂交。本文公开的序列的独特序列,例如通过标准序列比较技术确定的独特序列,也包括在本发明的范围之内。
保守变体由于遗传密码的简并性,“静默替代”(即核酸序列中不会导致其编码多肽改变的替代)是每个编码氨基酸的核酸所具有的特性。同样,氨基酸序列中的一个或几个氨基酸发生“保守氨基酸替代”是指被具有高度相似性能的不同氨基酸的替代,也很容易鉴定为与公开的构建物高度相似。每一个公开序列的这种保守变体也是本发明的特征。
特定核酸序列的“保守变体”是指那些编码一样或基本一样的氨基酸序列的核酸,或者是指虽然不编码氨基酸序列、但序列基本相同的核酸。本领域的技术人员应该认识到导致编码序列上单个氨基酸或一小部分氨基酸(一般少于5%,更常见的是少于4%、2%或1%)发生改变、添加或删除的单个替代、缺失或掺入是“保守修饰的变体”,其中的改变可导致氨基酸的删除、氨基酸的添加或以化学相似的氨基酸替代原来的氨基酸。因此,本发明所列出的多肽序列的“保守变体”包括用具有相同保守取代基的保守氧化还原活性氨基酸替代一小部分氨基酸,一般低于多肽氨基酸总数的5%,更常见的是低于2%或1%。最后,不改变核酸分子编码活性的序列添加,如添加非功能序列,被称为基础氨基酸的保守变体。
可提供功能相似氨基酸的保守替代表是本领域熟知的,其中一个氨基酸残基被另一个具有相似化学特性(芳香族侧链或带正电荷的侧链)的氨基酸替代,因此不会在实质上改变多肽分子的功能。下面列出了几组具有相似化学特性的天然氨基酸,其中每一组内的互相替代都是“保守替代”。
核酸杂交对比杂交可用于鉴定本发明的核酸,如SEQ ID NO2,包括本发明的核酸的保守变体,这种对比杂交方法是一种区分本发明核酸的优选方法。另外,能在高、超高、超超高严格条件下与SEQ ID NO2所代表的那些核酸杂交的靶核酸也是本发明的特征。这类核酸的典型例子包括那些与一个给定核酸序列相比发生一个或几个静默核酸替代或保守核酸替代的核酸。
如果一个被检测核酸被说成可与一个核酸探针特异性杂交,那么这个被检测核酸与探针的匹配程度至少相当于与完全匹配的互补靶核酸匹配程度的1/2,即信噪比至少是探针与靶核酸杂交的1/2,杂交的条件为完全匹配的探针与完全匹配的互补靶核酸结合所产生的信噪比至少等于与任何不匹配的靶核酸杂交所产生的信噪比的约5倍到10倍。
当核酸相遇时发生杂交,一般是在溶液中。核酸之所以可以发生杂交是由各种已知的物理-化学作用力造成的,如氢键、溶剂排斥、碱基堆积等。较全面的有关核酸杂交的指导手册是Tijssen(1993)的《生物化学和分子生物学实验技术-与核酸探针杂交》(Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization withNucleic Acid Probes)中第I部分第2章,“杂交原理和核酸探针分析策略概述(Overviewof principles of hybridization and the strategy of nucleic acid probe assays)”,(Elsevier,New York),以及上述Ausubel的文献。Hames和Higgins(1995)编辑的Gene Probes 1(基因探针1》,牛津大学出版社IRL出版社,英国牛津(Hames和Higgins 1)以及Hames和Higgins(1995)编辑的Gene Probes 2(基因探针2),牛津大学出版社IRL出版社,英国牛津(Hames和Higgins 2)详细描述了DNA和RNA,其中包括寡核苷酸的合成、标记、检测和定量方法。
在DNA印迹或RNA印迹中,含有超过100个互补残基的互补核酸杂交到滤膜上的一个典型杂交条件是50%甲醛、1mg肝素、42℃杂交过夜。严格洗涤条件的例子是65℃用0.2×SSC洗涤15分钟(见上述文献Sambrook有关SSC缓冲液的描述)。一般情况下先用低严格条件再用高严格条件洗涤以去除背景探针信号。低严格洗涤条件的一个例子是40℃用2×SSC洗涤15分钟。如果所检测到的信噪比比不相关探针在特定杂交试验中所产生的信噪比高5倍(或更高),就说明这是一个特异性杂交。
“严格的杂交洗涤条件”用于核酸杂交试验如DNA印迹和RNA印迹时是指序列依赖性的,但是在不同的环境参数下该条件是不同的。较全面的有关核酸杂交的指导手册是上述的Tijssen(1993)和Hames和Higgins,1和2。任何被检测核酸所用的杂交和洗涤条件的严格程度可以根据经验很容易地确定。例如,在确定杂交和洗涤条件的严格程度时,可以逐渐提高杂交和洗涤条件的严格程度(如,在杂交或洗涤过程中通过升高温度、降低盐浓度、增加洗涤剂的浓度和/或增加有机溶剂如甲醛的浓度),直到满足了所选择的一组标准。例如,在高严格杂交和洗涤条件下,逐渐增加杂交和洗涤条件直到探针与互补靶核酸完全匹配,所产生的信噪比至少是探针与不匹配靶核酸杂交所产生的信噪比的5倍。
对于一个特定探针来说,十分严格的条件等于其热熔点(Tm)。Tm是指50%的被检测核酸与完全匹配的探针杂交时的温度。一般来说,在一定的离子强度和pH条件下,本发明所选择的“高严格”杂交和洗涤条件比一个特定序列的Tm约低5℃。
“超高严格程度”的杂交和洗涤条件是指杂交和洗涤条件的严格程度逐渐升高,直到探针与完全匹配的互补靶核酸结合所产生的信噪比至少达到探针与不匹配核酸杂交所产生的信噪比的10倍。靶核酸在这种条件下与探针杂交,如果所产生的信噪比至少是完全匹配的互补靶核酸所产生的信噪比的1/2,那么就可以说靶核酸可以在超高严格条件下与探针结合。
同样可以通过逐渐提高预杂交试验的杂交和/或洗涤条件的严格程度来确定更高严格程度的杂交条件。例如,逐渐升高杂交和洗涤条件的严格程度,直到探针与完全匹配的互补靶核酸结合所产生的信噪比至少达到探针与不匹配核酸杂交所产生的信噪比的10倍、20倍、50倍、100倍、500倍或更高。靶核酸在这种条件下与探针杂交,如果所产生的信噪比至少是完全匹配的互补靶核酸所产生的信噪比的1/2,那么就可以说靶核酸可以在超超高严格条件下与探针结合。
如果核酸编码的多肽是基本相同的,那么即使核酸不能彼此杂交,这两个核酸也是基本相同的。这种情况发生在核酸的拷贝是充分利用遗传密码所允许的最大简并性来产生的时候。
独特的亚序列一方面,本发明提供了含独特亚序列的核酸,这些亚序列位于选自本文所描述的O-tRNA和O-RS序列的核酸内。与任何已知的O-tRNA或O-RS核酸序列相应的核酸相比,独特亚序列都是独特的。可利用BLAST进行核酸的排列,使用默认参数。任何独特亚序列都可作为探针用于鉴定本发明的核酸。
同样,本发明还包括含独特亚序列的多肽,这些独特亚序列位于选自本文所描述的O-RS序列的多肽内。在这里,与任何已知的多肽序列相应的多肽相比,独特亚序列都是独特的。
本发明还提供了能在严格条件下与独特编码寡核苷酸杂交的靶核酸,该寡核苷酸编码选自O-RS序列的多肽内的独特亚序列,其中的独特亚序列与任何对照多肽(如本发明的合成酶来源的亲本序列,如通过突变获得)相应的多肽相比都是独特的。独特序列可通过上述方法确定。
序列比较、相同性和同源性术语“相同的”或“百分相同性”用于两个或多个核酸或多肽序列的比较时是指两个或多个序列或亚序列排列对比并比较其最大相似性时,这两个或多个序列或亚序列是相同的,或者有特定百分比的氨基酸残基或核苷酸是相同的,这种比较可利用下面所描述的一种序列比较算法(或本领域技术人员所熟知的其他算法)或通过肉眼观察来完成。
术语“基本相同的”用于两个或多个核酸或多肽(如编码O-tRNA或O-RS的DNA,O-RS的氨基酸序列)的比较时是指两个或多个序列或亚序列排列对比并比较其最大相似性时,这两个或多个序列或亚序列至少有约60%、80%、90-95%、98%、99%或更多的核苷酸或氨基酸残基是相同的,这种比较可利用序列比较算法或通过肉眼观察来完成。无论实际衍生自何种家系,这种“基本相同的”序列一般被认为是“同源的”。“基本上相同”指在序列的一个区域内的比较,这个区域长度宜至少约为50个残基,更优选至少约100个残基,最优选二序列至少约含150个残基基本上相同,或者在两个序列的全长上进行比较。
当蛋白和/或蛋白序列衍生自共同的亲代蛋白或蛋白序列时,不论是天然的还是人造的,这些蛋白和/或蛋白序列是“同源的”。同样,当核酸和/或核酸序列衍生自共同的亲代核酸或核酸序列时,不论是天然的还人造的,这些核酸和/或核酸序列是“同源的”。例如,任何天然核酸都可用现有的诱变方法修饰使其包含一个或多个选择者密码子。当该突变的核酸表达时,其编码的多肽含有一个或多个非天然氨基酸,如氧化还原活性氨基酸。当然,该突变过程可能改变一个或多个标准密码子,从而使产生的突变蛋白中发生一个或多个标准氨基酸的改变。同源性一般是根据两个或多个核酸或蛋白质(或其序列)的序列相同性推算出来的。用于确定序列之间同源性的精确百分相同性根据所要比较的蛋白质和核酸而不同,但是一般来说至少要有25%的序列相同性才能建立同源性。更高的序列类似性,如30%、40%、50%、60%、70%、80%、90%、95%、99%或更高,也可用于建立同源性。确定序列相同性百分比的方法(如BLASTP和BLASTN,使用默认参数)见本文的描述,这些方法都是现有的。
为了进行序列比较并确定其同源性,一般需要把一个序列看作参考序列,被检测序列与之比较。在使用序列比较算法时,将被测序列与参考序列输入到计算机内,如果需要,设定亚序列匹配值和序列算法程序的参数。序列比较算法就可以根据设定的程序参数计算出被测序列相对于参考序列的序列相同性百分比。
进行序列比较的理想序列排列对比方法可用下列算法完成局部同源性算法,Smith & Waterman,Adv.Appl.Math.2482(1981);同源性排列对比算法,Needleman&Wunsch,J.Mol.Biol.48443(1970);相似性检索方法,Pearson & Lipman,Proc.Nat′l.Acad.Sci.USA852444(1988),以及这些算法的计算机程序(Wisconsin GeneticsSoftware Package内的GAP、BESTFIT、FASTA和TFASTA,Genetics Computer Group,575Science Dr.,Madison,WI),或者通过肉眼检查(见下面Ausubel等的文献)。
适于确定序列相同性和序列相似性百分比的算法的一个例子是BLAST算法,该算法的描述见Altschul等,J.Mol.Biol.215403-410(1990)。执行BLAST分析的软件公众可通过国家生物技术信息中心的网站(www.ncbi.nlm.nih.gov/)下载。这种算法包括先通过鉴定查询序列中长度为W的短字符来确定高评分序列对(HSP),所述短字符在与序列数据库中相同长度的字符排列对比时可匹配或满足某些正阈值评分T。T称为相邻字符评分阈值(Altschul等,同上)。这些初始的相邻字符采样数(hits)作为种子启动检索来寻找含有这些字符的HSP。然后字符采样数在每一序列的两个方向上扩展,直到累积排列对比评分升高。用参数M(匹配残基对的奖赏分数;总是大于0)和N(错配残基的惩罚分数;总是小于0)来计算核苷酸序列的累积评分。对于氨基酸来说,可利用计分矩阵来计算累积评分。字符采样数在每个方向上的延伸停止于下列时刻累积排列对比评分从其曾达到的最大数值开始回落时;由于累积了一个或多个负评分残基排列对比使累积评分达到0或0以下时;或者达到序列的末端时。BLAST算法的参数W、T和X决定了算法的灵敏度和速度。BLASTN程序(用于核苷酸序列)的默认参数为字长(W)=11,期望值(E)=10,终止值=100,M=5,N=-4,两条链进行比较。对于氨基酸序列来说,BLASTP程序的默认参数为字长(W)=3,期望值(E)=10,使用BLOSUM62计分矩阵(见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA8910915)。
除了能够计算序列相同性百分比以外,BLAST算法还可以进行两个序列之间相似性的统计分析(见Karlin和Altschul,Proc.Nat′l.Acad.Sci.USA905873-5787(1993))。BLAST算法所提供的一个相似性数据是最小总概率(P(N)),这一数据说明了两个核苷酸或氨基酸序列之间相匹配的可能性。例如,如果将被测核酸与参考核酸比较后得到的最小总概率约在0.1以下、优选约0.01以下、最优选的是约0.001以下,则这个核酸被认为与参考序列是相似的。
诱变和其他分子生物学技术本发明的和用于本发明的多核苷酸和多肽可以用分子生物学技术进行操纵。描述分子生物学技术的综合性教科书包括Berger和Kimmel的《分子克隆技术指南》(Guide to Molecular Cloning Techniques)第152卷“酶学方法”,Academic Press,Inc.,San Diego,CA(Berger);Sambrook等人的《分子克隆实验手册》(Molecular Cloning-ALaboratory Manual)(第三版)l-3卷,冷泉港实验室,纽约冷泉港,2001(″Sambrook″)和《现代分子生物学操作指南》(Current Protocols in Molecular biology),F.M.Ausubel等人编辑,《现代操作指南》(Current Protocols),Greene Publishing Associates,Inc.和John Wiley&Sons,Inc.,共同投资出版,(2003年增补)(″Ausubel″)。这些教科书描述了诱变、载体的使用、启动子以及许多其他相关主题,如与基因产生有关的主题,包括可用于制备含有氧化还原活性氨基酸(例如DHP)的蛋白质、正交tRNA、正交合成酶和它们组成的正交对的选择者密码子。
各种突变技术都可用于本发明中进行tRNA分子的突变、tRNA文库的产生、合成酶文库的产生、编码氧化还原活性氨基酸的选择者密码子向感兴趣蛋白或多肽内的掺入。这些技术包括但不限于位点定向诱变、随机位点诱变、同源重组、DNA重组或其他的重复诱变方法、嵌合体构建、利用含尿嘧啶的模板进行诱变、寡核苷酸定向突变、硫代磷酸修饰的DNA突变、利用带缺口的双链DNA进行的突变等。其他合适的方法包括点错配修复、利用修复缺陷宿主系进行的突变、限制性筛选和限制性纯化、缺失突变、通过总基因合成的诱变、双链断裂修复等。利用嵌合体构建进行的诱变也包括在本发明中。在一个实施方案中,可以利用已知的有关天然分子或者改变的或突变的天然分子的信息指导诱变,如序列、序列比较、物理特性、晶体结构等。
宿主细胞可用本发明的多核苷酸或包含本发明多核苷酸的构建物进行遗传改造(如转化、转导或转染),如本发明的载体,这些载体可以是克隆载体,也可以是表达载体。例如,正交tRNA、正交tRNA合成酶及其衍生的蛋白质的编码区可以被可操控地连接到能在感兴趣宿主细胞内发挥功能的基因表达调节元件上。典型的载体都包含转录和翻译终止子、转录和翻译起始序列和用于调节特定靶核酸表达的启动子。载体还可以包含基因表达盒,其中至少含有一个独立的终止子序列,允许表达盒在真核或原核宿主、或者二者内(如穿梭载体)复制的序列以及用于原核和真核系统内的选择标记。载体可以在原核或真核宿主内表达和/或整合,最好是既可在真核宿主内又可在原核宿主内表达和/或整合。见Giliman和Smith,Gene881(1979);Roberts等,Nature,328731(1987);Schneider,B.等,Protein Expr.Purif.643510(1995);Ausubel,Sambrook,Berger(这三篇文献同上)。载体可以是质粒、细菌、病毒、裸多核苷酸或共轭多核苷酸的形式。可用标准方法将载体导入到细胞和/或微生物内,如电穿孔(From等,Proc.Natl.Acad.Sci.USA82,5824(1985));用病毒载体感染;用含核酸的小粒子高压渗透,其中核酸位于小珠或离子的基质内或表面上(Klein等,Nature327,70-73(1987))。
ATCC提供了可用于克隆的细菌和噬菌体的目录,如ATCC出版的《细菌和噬菌体的ATCC目录》(The ATCC Catalogue of Bacteria and Bacteriophage)(1996),Ghema等(编)。用于测序、克隆和分子生物学其他方面的其他基础方法及其理论阐述见于Sambrook(同上)、Ausubel(同上)和Watson等(1992)科学美国人丛书第二版重组DNA(Recombinant DNA Second Edition Scientific American Books),NY。另外,几乎所有核酸(以及几乎所有的标记核酸,无论是标准的还是非标准的)都可以从各个公司里购买或订购,如Midland Certified Reagent Company(Midland,TX mcrc.com)、The GreatAmerican Gene Company(Ramona,CA,网址是www.genco.com)、ExpressGen Inc.(Chicago,IL,网址是www.expressgen.com)、Operon Technologies Inc.(Alameda,CA)等。
经遗传改造的宿主细胞可用经过适当改变以便于进行下列操作的常规营养培养基进行培养筛选、活化启动子或筛选转化子。这些细胞还可以培养成转基因生物。有关细胞分离和培养(如用于亚序列核酸分离)的其他有用文献包括Freshney(1994)《动物细胞培养一基本操作技术》(Culture of Animal Cells,a Manual of BasicTechnique),第三版,Wiley-Liss,New York及其引用的参考文献;Payne等(1992)《在液体系统中进行植物细胞培养和组织培养》(PIant Cell and Tissue Culture inLiquid Systems),John Wiley & Sons,Inc.,New York,NY;Gamborg和Phillips(编)(1995)《植物细胞、组织和器官培养》(Plant Cell,Tissue and Organ Culture),FundamentalMethods Springer Lab Manual,Springer-Verlag(Berlin Heidelberg New York)以及Atlas和Parks(编)《微生物学培养基手册》(The Handbook of Microbiological Media)(1993),CRC Press,Boca Raton,FL。
感兴趣的蛋白和多肽氧化还原活性氨基酸的一个优点是它们可被用来改造蛋白质中的电子传递过程。其它优点包括但不限于,氧化还原活性蛋白质的表达有助于研究和能够改变蛋白质电子传递途径、改变酶的催化功能、使蛋白质与小分子和生物分子交联等。含有至少一种氧化还原活性氨基酸的感兴趣蛋白或多肽是本发明的一个特征。本发明还包括含有至少用本发明的组合物和方法制造的氧化还原活性氨基酸的多肽或蛋白质。赋形剂(如药学上可接受的赋形剂)也可以和蛋白质一起存在。另外,本发明的蛋白还可以进行翻译后修饰。
在细胞内产生特定位置上为氧化还原活性氨基酸的蛋白质的方法也是本发明的特征。例如,一种方法是在适宜的培养基内培养细胞,其中的细胞含有至少包含一个选择者密码子并能编码一个蛋白质的核酸;提供氧化还原活性氨基酸;其中的细胞还包含在细胞内有功能并能识别选择者密码子的正交-tRNA(O-tRNA)和优先用氧化还原活性氨基酸氨酰化O-tRNA的正交氨酰-tRNA合成酶(O-RS)。在某些实施方案中,与包含或编码于SEQ ID NO2所列多核苷酸序列的O-tRNA相比,在相关合成酶存在的条件下,这种O-tRNA为了响应选择者密码子而产生的抑制效率至少可达45%、50%、60%、75%、80%、90%或更高。利用这种方法产生的蛋白也是本法发明的特征。
本发明还提供了含有蛋白的组合物,其中的蛋白包含氧化还原活性氨基酸。在某些实施方案中,蛋白所包含的氨基酸序列与治疗蛋白、诊断蛋白、工业用酶或其片段的序列至少有75%的相同性。
本发明的组合物和利用本发明的方法产生出的组合物也可以存在于细胞内。因此本发明的O-tRNA/O-RS对或其单个组分可被用于宿主系统的翻译机器中,从而将氧化还原活性氨基酸掺入到蛋白质内。国际专利申请PCT/US2004/011786(申请日为2004年4月16日,名称为“IN VIVO INCORPORATION OF UNNATURAL AMINOACIDS(扩充真核遗传密码”)和WO 2002/085923(题为“非天然氨基酸的体内掺入”)描述了这一过程,本文已纳入作为参考。例如,当O-tRNA/O-RS对被引入到宿主如大肠杆菌细胞内后,O-tRNA/O-RS对在体内响应选择者密码子后可将氧化还原活性氨基酸如DHP,例如一种合成的氨基酸,掺入到蛋白质内,如酪氨酸或苯丙氨酸衍生物,这是作为外源性物质加入到培养基内的。另外,本发明的组合物既可以用于体内翻译系统,也可以用于体外翻译系统。
利用本发明的细胞可以大规模地合成含非天然氨基酸的蛋白质。一方面,组合物可以包含至少l0μg、50μg、75μg、100μg、200μg、250μg、500μg、1mg、10mg或更多含氧化还原活性氨基酸的蛋白质,或者含有蛋白质的量能够达到体内蛋白合成方法的要求(本文提供了重组蛋白产生和纯化方法的详细描述)。另一方面,组合物中所含的蛋白质浓度可以是每升细胞裂解物、缓冲液、药学上可接受的缓冲液或其他液体悬液中至少含10μg、50μg、75μg、100μg、200μg、250μg、500μg、1mg、l0mg或更高(如以lnL到100L的体积)。在细胞内大量产生(例如大于其他方法,如体外翻译,在一般情况下所能达到的规模)至少含至少一个氧化还原活性氨基酸的蛋白质也是本发明的特征。
掺入氧化还原活性氨基酸可导致蛋白质结构和/或功能的变化,如大小、酸性、亲核性、氢键、疏水性、蛋白酶靶位点的易接近性、对基序的靶向性(如用于蛋白芯片时)等。含有氧化还原活性氨基酸的蛋白质的催化活性或物理特性可能会得以改善,或者获得全新的催化活性或物理特性。例如,下列特性可通过在蛋白质内掺入氧化还原活性氨基酸加以改变毒性、生物分布、结构特性、分光光度特性、化学和/或光化学特性、催化能力、半衰期(如血清半衰期)、与其他分子相互作用的能力(共价的或非共价的)。包含至少携带一个氧化还原活性氨基酸的蛋白质的组合物可用作新型的治疗蛋白、诊断蛋白、催化酶、工业用酶、结合蛋白(如抗体)以及可用于蛋白质结构和功能的研究。见Dougherty,(2000)Unnatural Amino Acids as Probes of ProteinStructure and Function,Current Opinion in Chemical Biology,4645-652。
在本发明的一个方面,组合物包含至少一个蛋白质,其中的蛋白质至少含有1、2、3、4、5、6、7、8、9、10或更多个非天然氨基酸,如氧化还原活性氨基酸和/或其他非天然氨基酸。这些非天然氨基酸可以是相同的,也可以是不同的,如在蛋白质的1、2、3、4、5、6、7、8、9、10或更多个不同的位点上含有1、2、3、4、5、6、7、8、9、10或更多个不同的非天然氨基酸。另一方面,组合物包含一个蛋白质,这个蛋白质至少有一个但不是全部的特定氨基酸被氧化还原活性氨基酸替代。对于一个给定的含多个非天然氨基酸的蛋白质来说,其中的非天然氨基酸可以是相同的,也可以是不同的(如蛋白质包含两个或多个不同类型的非天然氨基酸,或者包含两个相同的非天然氨基酸)。对于一个给定的含两个以上非天然氨基酸的蛋白质来说,其中的非天然氨基酸可以是相同的,也可以是不同的,或者其中有多个非天然氨基酸是相同的,但是至少有一个不同非天然氨基酸。
一般来说,包含氧化还原活性氨基酸(及任何相应的编码核酸,如包含一个或多个选择者密码子的核酸)都可用本发明的组合物和方法产生。无需将已知的成千上万个蛋白质都一一鉴定,其中的任何一个都可以被修饰成含一个或多个非天然氨基酸的形式,如通过任何已知的突变方法将一个或多个适宜的选择者密码子掺入到相关的翻译系统内。已知蛋白序列的常用数据库包括GenBank EMBL、DDBJ和NCBI。其他数据库通过搜索互联网也可以很容易地找到。
一般来说,本发明的蛋白质与已知的蛋白(如治疗蛋白、诊断蛋白、工业用酶,或其片段等)至少有60%、70%、75%、80%、90%、95%、99%或更高的相同性,其中包含一个或多个非天然氨基酸。可被修饰使其包含一个或多个氧化还原活性氨基酸的治疗蛋白、诊断蛋白以及其他蛋白可在下列文献中找到,但是又不仅仅局限于这些文献2004年4月16日提交的题为“Expanding the Eukaryotic Genetic Code(扩充真核遗传密码)”的国际专利申请PCT/US2004/011786;以及WO 2002/085923,题为“非天然氨基酸的体内掺入”。可被修饰使其包含一个或多个氧化还原活性氨基酸的治疗蛋白、诊断蛋白以及其他蛋白包括但不限于α-1抗胰蛋白酶、血管他丁、抗溶血因子、抗体(有关抗体的详细描述见下文)、载脂蛋白、脱辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子(如T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG)、降钙素、CC趋化因子(如单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-1α、单核细胞炎症蛋白-1β、RANTES、I309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配基、C-kit配基、胶原蛋白、集落刺激因子(CSF)、补体因子5a、补体抑制因子、补体受体1、细胞因子(如上皮细胞中性粒细胞活化肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-1δ、MCP-1)表皮生长因子(EGF)、红细胞生成素(EPO)、剥脱毒素A和B、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤连蛋白、G-CSF、GM-CSF、葡萄糖脑苷脂酶、绒毛膜促性腺激素、生长因子、Hedgehog蛋白(如Sonic、Indian、Desert)、血红素、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、胰岛素、胰岛素样生长因子(IGF)、干扰素(如IFN-α、IFN-β、IFN-γ)、白细胞介素(如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12等)、角质化细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、荧光素酶、Neurturin、中性粒细胞抑制因子(NIF)、抑瘤素M、骨生成蛋白、甲状旁腺激素、PD-ECSF、PDGF、肽类激素(如人生长激素、Pleiotropin、蛋白A、蛋白G、热原性外毒素A、B和C、松弛素、肾素、SCF、可溶性补体受体1、可溶性I-CAM1、可溶性白细胞介素受体(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超抗原即葡萄球菌肠毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE)、超氧化物歧化酶(SOD)、中毒性休克综合征毒素TSST-1)、胸腺素α1、组织纤溶酶原激活因子、肿瘤坏死因子β(TNFβ)、肿瘤坏死因子受体(TNFR)、肿瘤坏死因子-α(TNFα)、血管内皮生长因子(VEGEF)、尿激酶等。
可以利用本发明的组合物和方法在体内产生出的含本文所描述的氧化还原活性氨基酸的一类蛋白质是转录调节因子或其片段。转录调节因子的例子包括能调节细胞生长、分化、调控等的基因和转录调节蛋白。转录调节因子存在于原核细胞、病毒和真核生物如真菌、植物、酵母、昆虫和动物如哺乳动物,提供了一个大范围的治疗靶位。应当理解的是表达和转录活化因子调节转录的机制很多,如与受体结合、刺激信号转导级联、调节转录因子的表达、与启动子和增强子结合、与启动子和增强子结合的蛋白结合、解链DNA、剪接mRNA前体、多聚腺苷酸化RNA和降解RNA。
本发明的一类蛋白质(如携带一个或多个氧化还原活性氨基酸的蛋白质)是表达活化因子,包括细胞因子、炎症分子、生长因子及其受体、以及癌基因产物,如白细胞介素(如IL-1、IL-2、IL-8等)、干扰素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-α、TGF-β、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1和hyalurin/CD44;信号转导分子及其相应的癌基因产物,如Mos、Ras、Raf和Met;以及转录活化因子和抑制因子,如p53、Tat、Fos、Myc、Jun、Myb、Rel,以及类固醇激素受体,如雌激素、孕酮、睾丸酮、醛固酮、LDL受体的配基和皮质酮。
本发明还提供了至少携带一个氧化还原活性氨基酸的酶(如工业用酶)或其片段。酶的例子包括但不限于酰胺酶、氨基酸消旋酶、酰基转移酶、脱氢酶、二氧合酶、二芳基丙烷过氧化物酶、表位酶、环氧化物水解酶、酯酶、异构酶、激酶、葡萄糖异构酶、糖苷酶、葡萄糖酰基转移酶、卤代过氧化物酶(haloperoxidase)、单加氧酶(如p450)、脂肪酶、木素过氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酯酶、枯草杆菌蛋白酶、转氨酶和核酶。
这些蛋白中有许多是可以从公司购买到的(见Sigma BioSciences的2002年产品目录和价目表),其相应的蛋白序列和基因及其变体通常都是已知的(见Genbank)。它们都可以按照本发明的方法通过掺入一个或多个氧化还原活性氨基酸或其他非天然氨基酸来加以修饰,例如改变蛋白质的一种或多种治疗、诊断或酶催化特性。与治疗相关的特性包括血清半衰期、保存半衰期、稳定性、免疫原性、治疗活性、可检测性(如通过在非天然氨基酸如氧化还原活性氨基酸上掺入报告基团(如标记物或标记结合位点))、LD50或其他负效应的降低、通过胃肠道进入体内的能力(如口服利用度)等。诊断特性包括保存半衰期、稳定性、诊断活性、可检测性等。相关的酶催化特性包括保存半衰期、稳定性、酶活性、生产能力等。
其他的多种蛋白也可加以修饰使其包含一个或多个本发明的氧化还原活性氨基酸或其他非天然氨基酸。例如,本发明包含的蛋白质可以是用氧化还原活性氨基酸替代一个或多个天然氨基酸的疫苗蛋白,这些蛋白来自于感染性真菌,如曲霉属、念珠菌属的真菌;细菌,特别是大肠杆菌,可以作为致病菌的模型,和医学上有重要影响的细菌如葡萄球菌属(如金黄色葡萄糖球菌)或链球菌属(如肺炎链球菌)的细菌;原虫如孢子虫(如刚地弓形虫)、根足虫(如内阿米巴原虫)和鞭毛虫(锥形虫、利什曼原虫、毛滴虫、鞭毛虫等);病毒如(+)RNA病毒(例子包括痘病毒类如痘苗病毒;细小核糖核酸病毒如脊髓灰质炎病毒;披膜病毒如风疹病毒;黄病毒如HCV;以及冠状病毒),(-)RNA病毒(如弹状病毒如VSV;副黏液病毒如RSV;正粘病毒如流感病毒;布亚病毒;以及沙粒病毒),dsDNA病毒(如呼肠孤病毒),RNA到DNA的病毒,即逆转录病毒如HIV和HTLV,以及某些DNA到RNA的病毒如乙肝病毒。
与农业有关的蛋白质如昆虫抗性蛋白(如Cry蛋白)、淀粉和脂质生成酶、植物和昆虫毒素、毒素抗性蛋白、霉菌毒素解毒蛋白、植物生长酶(如核酮糖1,5-二磷酸羧化酶/氧合酶,″RUBISCO″)、脂肪加氧酶(LOX)、以及磷酸烯醇丙酮酸(PEP)羧化酶也是氧化还原活性氨基酸修饰的适宜靶标。
在某些实施方案中,本发明的方法和/或组合物内的感兴趣蛋白或多肽(或其片段)是由核酸编码的。一般来说,这种核酸至少含有1、2、3、4、5、6、7、8、9、10或更多个选择者密码子。
感兴趣蛋白或多肽的编码基因可用本领域技术人员熟知的方法以及本文“突变和其他分子生物学技术”部分描述的方法加以突变使其携带用于掺入氧化还原活性氨基酸的一个或多个选择者密码子。例如,感兴趣蛋白的编码核酸可被突变使其携带一个或多个选择者密码子,因而可以掺入一个或多个氧化还原活性氨基酸。本发明包括任何蛋白的这种突变版本,比如至少含有一个氧化还原活性氨基酸。同样,本发明还包括相应的核酸,即含有一个或多个编码一个或多个氧化还原活性氨基酸的选择者密码子的任何核酸。
为了使蛋白包含氧化还原活性氨基酸,需要使用适于通过正交tRNA/RS对在体内掺入氧化还原活性氨基酸的宿主细胞和生物。宿主细胞用一种或多种载体进行遗传改造(如转化、转导或转染),这些载体表达正交tRNA、正交tRNA合成酶和编码衍生蛋白的载体。这些组分可以位于同一个载体上,或者位于不同的载体上,或者两个组分位于一个载体上而第三个组分位于第二个载体上。载体可以是质粒、细菌、病毒、裸多核苷酸或共轭多核苷酸。
根据免疫活性定义多肽由于本发明的多肽提供了多种新的多肽序列(如在本文的翻译系统中合成的蛋白中含有氧化还原活性氨基酸或者在新型合成酶、标准氨基酸的新型序列中含有氧化还原活性氨基酸),因此多肽可能会提供能被免疫分析方法识别的新型结构特征。能特异性结合本发明多肽的抗血清的产生以及能被这些抗血清结合的多肽也是本发明的特征。本文所用的术语“抗体”包括但不限于免疫球蛋白基因或其片段编码的多肽,这些多肽可特异性识别并结合分析物(抗原)。例子包括多克隆抗体、单克隆抗体、嵌合抗体和单链抗体等。免疫球蛋白的片段,其中包括Fab片段和表达文库如噬菌体展示文库产生的片段,也包括在本文所用的术语“抗体”之中。见Paul编辑的《基础免疫学》(Funcamental Immunology),第四版,1999,Raven Press,New York,中关于抗体结构和方法学的描述。
为了产生用于免疫分析中的抗血清,可按照本文所描述的方法产生和纯化一种或多种免疫原性多肽。例如,用重组细胞产生重组蛋白。纯系小鼠(用于此分析中,因为纯系小鼠具有遗传相同性,因此得到的结果重复性更高)用含标准佐剂如福氏完全佐剂的免疫原性蛋白按照标准的免疫方法免疫(见Harlow和Lane(1988),《抗体-实验室操作手册》(Antibodies,ALaboratory Manual)(冷泉港出版社,纽约)中关于抗体产生、用于确定特异性免疫反应的免疫分析方法和条件的描述)。关于蛋白、抗体、抗血清等的其他详细描述见USSN 60/479,931、60/463,869和60/496,548,题为“扩充真核遗传密码”(Expanding the Eukaryotic Genetic Code);WO 2002/085923,题为“非天然氨基酸的体内掺入”;专利申请USSN 60/441,450,名称为“糖蛋白合成”,申请日为2003年1月16日;以及专利申请“蛋白质芯片”,代理人备案号为P1001US00,申请日为2002年12月22日。
O-tRNA和O-RS以及O-tRNA/O-RS对的应用本发明的组合物以及用本发明的方法产生的组合物存在于细胞内。因而本发明的O-tRNA/O-RS对或其各个组分可用于宿主系统的翻译机器中,结果导致氧化还原活性氨基酸被掺入到蛋白质内。相应的Schultz等人的专利申请“非天然氨基酸的体内掺入”(WO2002/085923)描述了这一过程,本文已纳入作为参考。例如,当O-tRNA/O-RS对被导入到宿主如大肠杆菌内时,O-tRNA/O-RS对就可在体内将氧化还原活性氨基酸掺入到蛋白质如肌红蛋白或治疗蛋白内以响应选择者密码子如琥珀无义密码子,其中的氧化还原活性氨基酸可外源性地加入到培养基中。另外,本发明的组合物既可用于体外翻译系统中,也可用于体内系统中。含氧化还原活性氨基酸的蛋白质可用作治疗蛋白,并可用来在蛋白质内改变酶的催化功能和/或电子传递途径、将蛋白质与小分子和/或生物分子交联,并且有助于研究蛋白质的结构、与其他蛋白质的相互作用、蛋白质内的电子传递过程等。
试剂盒试剂盒也是本发明的特征。例如,本发明提供了用于在细胞内产生至少含一个氧化还原活性氨基酸的蛋白质的试剂盒,其中的试剂盒包括一个盛有O-tRNA和/或O-tRNA编码多核苷酸序列、和/或O-RS编码多核苷酸序列、和/或O-RS的容器。在一个实施方案中,试剂盒还包括氧化还原活性氨基酸。在另一个实施方案中,试剂盒还包括关于产生蛋白质的说明书。
实施例下面所提供的实施例是为了说明本发明,并不意味着对本发明权利要求的限制。本领域的技术人员应该知道在不偏离本发明权利要求范围的情况下可以对各种非关键性的参数做出修改。
实施例1将氧化还原活性氨基酸位点特异性掺入蛋白质中最近的报道显示,可用正交tRNA-氨酰tRNA合成酶对将许多非天然氨基酸被选择性地掺入到大肠杆菌和酵母的蛋白质中(Wang等,(2001)Science 292498-500;Zhang等,(2003)Biochemistry 426735-6746;Chin等,(2003)Science 301964-967)。这些正交对不与宿主细胞翻译机制的内源组分发生交叉反应,但能识别所需的非天然氨基酸并响应琥珀无义密码子TAG将其掺入蛋白质中(Wang等,(2000)J.Am.Chem.Soc.,1225010-5011;Wang和Schultz(2001)Chem.Biol.,8883-890)。为在大肠杆菌内遗传编码3,4-二羟基-L-苯丙氨酸(DHP;见图1的化合物1),正交詹氏甲烷球菌tRNA-合成酶(MjTyrRS;提供在图5和表1中,其氨基酸序列提供于SEQ IDNO4,核苷酸序列提供于SEQ ID NO5)的特异性被改变,以使该合成酶用DHP而非任何20种常见氨基酸来氨酰化突变型酪氨酸tRNA琥珀抑制基因(mutRNACUATyr)。这些突变型合成酶选自两种突变型MiTyrRS文库(Wang等,(2001)Science 292498-500;Zhang等,(2002)Angew.Chem.Int.Ed.,412840-2842)。在基于嗜热脂肪芽孢杆菌的同源TyrRS晶体结构的分析的第一文库中(Brick等,(1989)J.Mol.Biol.,20883-98),位于酪氨酸芳环对位6.5内的MjTyrRS活性位点中的5个残基(Tyr32、Glu107、Asp158、Ile159和Leul62)被随机突变(在质粒pBK-lib上编码)。在第二文库中,使位于酪氨酸芳环间位6.5内的6个残基(Tyr32、Ala67、His70、Gln155、Asp158、Ala167)随机突变(在质粒pBK-lib-m上编码)。
为改变TyrRS的特异性,以使能特异性掺入DHP而非其它天然氨基酸,采用由若干轮正选择和负选择构成的遗传选择。在正选择中,根据对氯霉素乙酰转移酶(CAT)基因(pRep(2)/YC)中非必需位置(Asp112)的琥珀密码子的抑制,选出两个突变型TyrRS文库。将用突变型TyrRS文库、mutRNACUATyr基因和琥珀突变型CAT基因转化的细胞在厌氧条件下培育在含有1mM DHP和70μg/ml氯霉素的基础培养基中以避免氧化DHP。存活的细胞含有用DHP或内源氨基酸氨酰化mutRNACUATyr的突变型TyrRS。然后根据对引入在毒性芽孢杆菌RNA酶基因(pLWJ17B3)中非必需位置(Gln2、Asp44、Gly55)的三个琥珀密码子的抑制,用负选择除去含有天然氨基酸的突变型TyrRS。将含有得自先前正选择的突变型TyrRS、mutRNACUATyr和琥珀突变型芽孢杆菌RNA酶基因的细胞培养在不含DHP的Luria-Bertani(LB)培养基中。在这些条件下,编码对内源氨基酸具有特异性的突变型TyrRS的细胞将产生全长的芽孢杆菌RNA酶并死亡。只有那些含有对DHP具有特异性的突变型TyrRS的细胞可存活。交替进行三轮正选择和两轮负选择后,得到能在高浓度氯霉素(90mg/L)下存活并依赖于DHP存在、含有所选突变型TyrRS基因(DHPRS)、mutRNACUATyr和Asp112TAG CAT基因的克隆。然而,在缺乏DHP时,同样的细胞仅在20mg/L氯霉素中存活。这一结果说明,所选DHPRS酶对DHP的特异性高于天然氨基酸。测序显示所选DHPRS中存在以下突变Tyr32→Leu、Ala67→Ser、His70→Asn、Ala167→Gln。所述DHPRS合成酶示于图6和表1。同时,其氨基酸序列提供于SEQ ID NO1,核苷酸序列提供于SEQ ID NO3。
为测定用所选pDHPRS克隆掺入DHP的保真性和效率,我们响应琥珀密码子在C末端用六组氨酸标记的突变型抹香鲸肌红蛋白(Mb;见Chin等,(2002)Proc.Natl.Acad.Sci.U.S.A.,9911020-11024)暴露于表面的第4个残基处掺入DHP。含有DHP的全长肌红蛋白(DHPMb)用GMML(含有亮氨酸的甘油基础培养基)作为生长培养基在还原条件(100μM二硫苏糖醇(DTT))下表达以防止DHP在掺入蛋白质之前被氧化。突变蛋白质的产率约为1毫克/升(相同条件下野生型Mb(wtMb)的产率不可测)。非全长Mb在不存在DHP时表达;在不存在DTT时大多数细胞由于氧化的醌(见图1的化合物3)的毒性而死亡。全长DHPMb用钴基IMAC(固定的金属亲和层析)树脂纯化。将存在和不存在DHP时表达的突变蛋白质的纯化产物加样到SDS-PAGE凝胶上,银染并对凝胶进行western印迹。采用抗His6-tag抗体,非全长Mb在不存在DHPRS或mutRNACUATyr时表达(示于图2A)。用带有四极-四极飞行时间(QqTOF)的电喷雾电离(ESI)质谱仪来测量蛋白质的分子量。图2B显示了质量为18,448.5道尔顿的DHPMb的ESI-QqTOF质谱。含有Mb的DHP该值在70ppm之内,计算得到的质量为18447.2道尔顿(相邻峰的质量为18,432.3道尔顿,根据对照试验用测量技术得到,由于失去氧或失去氧和质子所致)。
用循环伏安法来确定当将裸金电极浸入含有DHPMb的溶液时是否可观察到氧化的氢醌的氧化还原波。图3A显示在厌氧条件下含有wtMB和DHPMb的溶液不可逆的伏安应答(Bard和Faulkner,见《电化学方法》(Electrochemical Methods);John W.Wiley & Sons,Inc.New York,1980;第213-248、429-487和675-698页)。在E=-320mV时观察到wtMbFe(III)产生的还原峰电位,而该突变蛋白的还原峰电位迁移到更低的负电位E=-400mV。这种迁移是由于存在DHP,DHP在比缺乏DHP时低得多的电位上促进了Fe(III)的还原。观察到的不可逆的伏安数是由于电子传递速率慢,这可能是由于电子接近电极有限所造成的。图3B显示了含有100μM DEP、wtMb和DHPMb的溶液的伏安反应。DHP氧化产生的电流只在存在突变的Mb时或在不含DHP的溶液中可见,分别为E=580mV和E=385mV。这些结果清楚显示,Mb中存在DHP对Fe(III)-血红素基团的氧化还原电位有显著影响,反之亦然。
这里的描述证明,氧化还原活性氨基酸(例如DHP)可被有效和选择性地掺入到大肠杆菌之类生物体的蛋白质中。这些氨基酸可在蛋白质中通过电化学方法氧化。这种将氧化还原活性氨基酸位点特异性掺入蛋白质的能力有助于研究蛋白质中的电子传递,并能基因改造产生具有新特性的氧化还原蛋白。将DHP等氧化还原活性氨基酸位点特异性掺入到模型蛋白如Mb和其它蛋白质的各个位点可用来研究这种蛋白质和其它蛋白质中的电子传递途径(Mayo等,(196)Science 233948-952;Gray和Malmstrom(1989)Biochemistry 287499-7505)。
实施例4用来掺入氧化还原活性氨基酸的示例性O-RS和O-tRNA一种示例性O-tRNA包含SEQ ID NO.2(见表1)。实施例O-RS包含SEQ ID NO1(见表1)和图6提供的氨基酸序列。编码O-RS或其一部分的多核苷酸的例子包括编码含有SEQ ID NO1氨基酸序列的多核苷酸。例如,图6和SEQ ID NO3提供的多核苷酸可编码示例性O-RS。
应当理解的是本文所描述的实施例和实施方案只是为了说明的目的,本领域的技术人员可以对这些实施例和实施方案进行各种修改或改变,这些经修改的实施例或实施方案也包括在本申请的精神和范围之内以及本发明附属权利要求的范围之内。
虽然为了便于理解本发明,在上文已经对本发明做了某种程度的详细描述,但是应该清楚的是,只要不偏离本发明的范围,本领域的技术人员通过阅读本说明书就可以对本发明的形式和细节作出各种修改。例如,上面所描述的各种技术方法和装置都可以不同组合的方式加以使用。出于所有目的,本申请所引用的所有文献、专利、专利申请和/或其他文献都已完整纳入本文作为参考,这就好比各个文献、专利、专利申请和/或其他文献都被单独纳入本文作为参考。
表1序列
权利要求
1.一种含有正交氨酰tRNA合成酶(O-RS)的组合物,其中,所述O-RS能优先用氧化还原活性氨基酸氨酰化O-tRNA。
2.如权利要求1所述的组合物,其特征在于,所述O-RS包含含有SEQ ID NO1的氨基酸序列或其保守变体。
3.如权利要求1所述的组合物,其特征在于,所述O-RS能优先氨酰化O-tRNA,其效率为含有SEQ ID NO1所示氨基酸序列多肽效率的至少50%。
4.如权利要求1所述的组合物,其特征在于,所述O-RS衍生自詹氏甲烷球菌。
5.如权利要求1所述的组合物包括细胞。
6.如权利要求5所述的组合物,其特征在于,所述细胞是大肠杆菌细胞。
7.如权利要求1所述的组合物包含翻译系统。
8.一种包含翻译系统的细胞,其中,所述翻译系统含有正交tRNA(O-tRNA);正交氨酰tRNA合成酶(O-RS);和氧化还原活性氨基酸;其中所述O-tRNA能识别第一选择者密码子,而所述O-RS能优先用第一氧化还原活性氨基酸氨酰化O-tRNA。
9.如权利要求8所述的细胞,其特征在于,所述O-RS优先氨酰化O-tRNA,其效率为含有SEQ ID NO1所示氨基酸序列多肽效率的至少50%。
10.如权利要求8所述的细胞,其特征在于,所述O-tRNA包含或编码于SEQ IDNO2所示的多核苷酸序列或其互补多核苷酸序列,且其中所述O-RS包含含有SEQID NO1的氨基酸序列或其保守变体。
11.如权利要求8所述的细胞,其特征在于,所述细胞还包含其它不同的O-tRNA/O-RS对和非天然氨基酸,其中所述O-tRNA识别第二选择者密码子而所述O-RS优先用第二非天然氨基酸氨酰化O-tRNA。
12.如权利要求8所述的细胞,其特征在于,所述细胞是非真核细胞。
13.如权利要求12所述的细胞,其特征在于,所述非真核细胞是大肠杆菌细胞。
14.如权利要求8所述的细胞,还包含含有编码感兴趣多肽的多核苷酸的核酸,其中所述多核苷酸包含被O-tRNA识别的选择者密码子。
15.一种大肠杆菌细胞,其包含正交tRNA(O-tRNA);正交氨酰tRNA合成酶(O-RS),其中所述O-RS优先用氧化还原活性氨基酸氨酰化O-tRNA;氧化还原活性氨基酸;和编码感兴趣多肽的核酸,其中所述核酸包含被O-tRNA识别的选择者密码子。
16.如权利要求15所述的大肠杆菌细胞,其特征在于,所述O-RS优先氨酰化O-tRNA,其效率为含有SEQ ID NO1所示氨基酸序列多肽效率的至少50%。
17.一种含有SEQ ID NO1的人造多肽。
18.一种编码如权利要求17所述多肽的人造多核苷酸。
19.一种包含或编码如权利要求18所述多核苷酸的载体。
20.如权利要求19所述的载体,其特征在于,所述载体包括质粒、粘粒、噬菌体或病毒。
21.如权利要求19所述的载体,其特征在于,所述载体是表达载体。
22.一种含有如权利要求19所述载体的细胞。
23.一种鉴定与O-tRNA一起使用的利用氧化还原活性氨基酸的正交氨酰tRNA合成酶的方法,所述方法包括选择第一物种的细胞群,此群细胞各包含1)多种氨酰tRNA合成酶(RS)中的一个成员;2)来自一个或多个物种的正交tRNA(O-tRNA);和3)编码一选择标记并含有至少一个选择者密码子的多核苷酸。其中,与缺乏所述多种RS中的一个成员或含有减少数目的该成员的细胞相比,抑制效率增强的细胞含有氨酰化O-tRNA的活性RS;和选择用氧化还原活性氨基酸氨酰化O-tRNA的活性RS,从而提供与O-tRNA一起使用的正交氨酰tRNA合成酶。
24.如权利要求23所述的方法,其特征在于,所述选择包括正选择,所述选择标记包括正选择标记。
25.如权利要求23所述的方法,其特征在于,所述多种RS包括突变型RS、衍生自第一物种之外的一个或多个物种的RS,或突变型RS和衍生自第一物种之外某物种的RS两者。
26.一种可用权利要求23所述方法鉴定的正交氨酰tRNA合成酶。
27.一种在细胞内产生特定位置含有氧化还原活性氨基酸的蛋白质的方法,所述方法包括在合适的培养基中培养细胞,所述细胞含有包含至少一个选择者密码子并编码蛋白质的核酸;和提供氧化还原活性氨基酸;其中所述细胞还包含在细胞中具有功能并识别该选择者密码子的正交tRNA(O-tRNA);和优先用氧化还原活性氨基酸氨酰化O-tRNA的正交氨酰tRNA合成酶(O-RS);和在含有至少一个选择者密码子的核酸翻译时将氧化还原活性氨基酸掺入蛋白质的特定位置,从而产生该蛋白质。
28.如权利要求27所述的方法,其特征在于,所述O-RS包含含有SEQ ID NO1的氨基酸序列。
29.如权利要求27所述的方法,其特征在于,所述细胞是非真核细胞。
30.如权利要求29所述的方法,其特征在于,所述非真核细胞是大肠杆菌细胞。
31.一种含有蛋白质的组合物,其特征在于,所述蛋白质含有氧化还原活性氨基酸。
32.如权利要求31所述的组合物,其特征在于,所述氧化还原活性氨基酸选自3,4-二羟基-L-苯丙氨酸(DHP)、3,4,5-三羟基-L-苯丙氨酸、3-硝基-酪氨酸、4-硝基-苯丙氨酸和3-硫醇-酪氨酸。
33.如权利要求31所述的组合物,其特征在于,所述蛋白质含有的氨基酸序列与野生型治疗蛋白、诊断蛋白、工业用酶或其部分至少75%相同。
34.如权利要求31所述的组合物,其特征在于,所述组合物含有药学上可接受的载体。
全文摘要
本发明提供了产生蛋白生物合机制各组分的组合物和方法,所述蛋白生物合成机制包含正交tRNA、正交氨酰tRNA合成酶和tRNA/合成酶正交对,该生物合成机制可将氧化还原活性氨基酸掺入到蛋白质中。还提供了鉴定这些正交对的方法以及利用这些正交对产生含氧化还原活性氨基酸的蛋白质的方法。
文档编号C07H21/04GK1942579SQ200480030137
公开日2007年4月4日 申请日期2004年10月13日 优先权日2003年10月14日
发明者L·阿方达, P·G·舒尔茨, 张致文 申请人:斯克利普斯研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1