tRNA组合物和其用途的制作方法

文档序号:411014阅读:806来源:国知局
专利名称:tRNA组合物和其用途的制作方法
技术领域
本发明涉及翻译生物化学领域。本发明涉及制造tRNA的方法和tRNA组合物以及其用途。本发明还涉及使用所述tRNA和相关组合物在细胞中制造蛋白质的方法。
背景技术
从细菌到人类,每一种已知有机体的遗传密码都编码相同的二十种常见氨基酸。这二十种相同天然氨基酸的不同组合形成进行几乎所有生命复杂过程(从光合作用到信号转导和免疫反应)的蛋白质。为研究和改变蛋白质结构和功能,科学家们已尝试操纵蛋白质的遗传密码和氨基酸序列。然而,难以去除由遗传密码所强加的将蛋白质局限于二十种遗传编码的标准结构单元(building block)(其中极少见的特例为,硒代半胱氨酸(selenocysteine)(例如参看 A. Bock 等人,(1991), Molecular Microbiology5:515-20)和卩比咯赖氨酸(pyrrolysine)(例如参看 G. Srinivasan 等人,(2002), Science296:1459-62))的约束。已取得一些进展来去除这些约束,但这一进展受到限制并且合理地控制蛋白质结构和功能的能力仍不成熟。举例来说,化学家们已开发出合成并且操纵小分子结构的方法和策略(例如参看 E. J. Corey, & X. -M. Cheng, The Logic of Chemical Synthesis(Wiley-Inter science, New York, 1995))。全合成(例如参看 B. Merri fie Id, (1986), Science232:341-7 (1986))和半合成方法(例如参看 D. Y. Jackson 等人,(1994) Science266:243-7 ; 和 P.E. Dawson, & S. B. Kent, (2000), Annual Review of Biochemistry69:923-60)使得合成肽和小蛋白质成为可能,但这些方法限制了 10千道尔顿(kiloDalton, kDa)以上蛋白质的效用。诱变方法尽管有效,但也局限于有限数量的结构改变。在多种情况中,在整个蛋白质中竞争性并入常见氨基酸的结构极其接近的类似物已成为可能。例如参看 R. Furter, (1998), Protein Science 7:419-26 ;K. Kirshenbaum 等人,(2002). ChemBioChem3:235-7 ;和 V. Poring 等人,(2001). Science 292:501-4。化学肽连接和天然化学连接描述于美国专利第6,184,344号、美国专利公开案第2004/0138412号、美国专利公开案第2003/0208046号、WO 02/098902和WO 03/04223中,这些专利都是以引用的方式并入本文中。Lu等人于Mol Cell. 2001 Oct;8 (4) :759-69中描述一种以化学方式将蛋白质与含有非天然氨基酸的合成肽连接的方法(称为蛋白质连接)。早期的工作证实,大肠杆菌(E. coli)的翻译机器将容纳结构与常见二十种氨基酸类似的氨基酸。参看 Hortin, G.和 Boime, I. (1983) Methods Enzymol. 96:777-784。通过放宽内源性大肠杆菌合成酶的特异性从而使其活化非天然氨基酸以及其同类天然氨基酸,使这项工作得以进一步扩充。此外,经证实,也可以使用编辑域的突变来扩充内源性合成酶的底物范围。参看Doring,V.等人,(2001) Science 292:501-504。然而,这些策略局限于重新编码遗传密码而非扩展遗传密码,并且产生非天然氨基酸对常见二十种氨基酸中的一种的不同程度的取代。随后证实,可通过将以化学方式氨酰基化的正交琥珀抑制性tRNA加到活体外转录/翻译反应中而在活体外将非天然氨基酸位点特异性地并入蛋白质中。例如参看 Noren,C.J.等人(1989) Science 244:182-188 ;Bain, J. D.等人,(1989) T. Am.Chem.Soc. 111:8013-8014 ;Dougherty,D.A. (2000)Curr.Opin. Chem. Biol. 4, 645-652 ;Cornish, V. ff.等人(1995) Angew. Chem. Int. Ed. 34 : 621-633 I. A. Ellman 等人,(1992). Science255:197-200 和 D. Mendel 等人,(1995). Annual Review ofBiophysics and Biomolecular Structure 24:435-462。这些研究表明,核糖体和翻译因子可与大量非天然氨基酸、甚至具有不常见结构的氨基酸相容。不幸的是,tRNA的化学氨 酰基化很难,并且这种方法的化学计量特性极大限制了能够产生的蛋白质的量。已将非天然氨基酸显微注射到细胞中。举例来说,通过显微注射以化学方式错酸基化的嗜热四膜虫(Tetrahymena thermophila) tRNA (例如,M. E. Saks 等人(1996), Anengineered Tetrahymena tRNA Gln for in vivo incorporation of unnatural aminoacids into proteins by nonsense suppression, J. Biol. Chem. 271:23169-23175)和相关mRNA而将非天然氨基酸引入爪蟾卵母细胞(Xenopus oocyte)中的烟碱型乙酰胆碱受体中(例如,M. ff. Nowak 等人(1998), In vivo incorporation of unnatural amino acids intoion channels in Xenopus oocyte expression system,Method EnzymoI. 293:504-529)。还参看 D. A. Dougherty (2000), Unnatural amino acids as probes of proteinstructure and function, Curr. Opin. Chem. Biol. 4:645-652 和 M. ff. Nowak, P. C. Kearney,J. R. Sampson, M. E. Saks, C. G. Labarca, S. K. Silverman, ff. G. Zhong, J. Thorson, J.N. Abelson, N. Davidson, P. G. Schultz, D. A. Dougherty 和 H. A. Lester, Science, 268:439 (I995)。将爪蟾卵母细胞与活体外制得的以下两种RNA物质共注射编码在所关注的氨基酸位置处具有UAG终止密码子的靶蛋白的mRNA,和经所需非天然氨基酸氨酰基化的琥珀抑制性tRNA。随后所述卵母细胞的翻译机器将非天然氨基酸插入UAG指定的位置处。不幸的是,这种方法局限于细胞中可进行显微注射的蛋白质,并且由于相关tRNA是在活体外以化学方式酰基化并且无法再酰基化,故蛋白质的产率极低。为克服这些缺点,将新颖组件(例如,正交tRNA、正交氨酰基tRNA合成酶和正交tRNA/正交氨酰基tRNA合成酶对)加到原核生物大肠杆菌(Escherichia coli,E. coli)(例如参看 L. Wang 等人,(2001),Science 292:498-500)和真核生物酿酒酵母(Sacchromycescerevisia, S. cerevisiae)(例如 J. Chin 等人,Science 301:964-7 (2003))的蛋白质生物合成机器中,所述蛋白质生物合成机器能够在活体内将非遗传编码的氨基酸并入蛋白质中。已使用这种方法响应(例如)琥珀密码子(TAG)以高保真度将多种具有新颖化学、物理或生物特性的新颖氨基酸有效地并入大肠杆菌和酵母中的蛋白质中,所述新颖氨基酸包括光亲和标记和光致异构化氨基酸、光交联氨基酸(例如参看Chin,J.W.等人(2002)Proc. Natl. Acad. ScL U. S. A. 99:11020-11024 ;和 Chin, J. W.等人,(2002) T. Am. Chem.Soc. 124:9026-9027)、酮某氡某酸(例如参看 Wang, L.等人,(2003)Proc. Natl. Acad. Sci.U. S. A. 100:56-61 和 Zhang, Z.等人,Biochem. 42 (22) : 6735-6746 (2003))、含有重原子的氨基酸和糖基化氨基酸。例如参看J. W. Chin, & P. G. Schultz, (2002), ChemBioChem3(11) : 1135-1137 和 L. Wang, & P. G. Schultz, (2002),Chem. Comm. . 1:1—11。已报导若干其它正交对。已针对大肠杆菌中非天然氨基酸并入的可能性描述自酿酒酵母tRNA和合成酶获得的谷氨酰胺酰基(例如参看Liu,D. R.和Schultz,P. G. (1999)Proc. Natl. Acad. ScL U. S. A. 96:4780-4785)、天冬氨酸基(例如参看 Pastrnak, M.等人,(2000) Helv. Chim. Acta 83:2277-2286)和酪氨酰基(例如参看 Ohno, S.等人,(1998)I. Biochem. (Tokyo, Tpn. ) 124:1065-1068 ;和 Kowal,A. K.等人(2001)Proc. Natl. Acad.Sci. U. S. A. 98:2268-2273)系统。也已描述自大肠杆菌谷氨酰胺酰基(例如参看Kowal,A.K.等人,(2001) Proc. Natl. Acad. Sci. U. S. A. .98:2268-227)和酪氨酰基(例如参看Edwards, H.和 Schimmel, P. (1990)Mol. Cell. Biol. 10:1633-1641)合成酶获得的系统以用于酿酒酵母中。已使用大肠杆菌酪氨酰基系统在活体内将3-碘-L-酪氨酸并入哺乳动物细胞中。参看 Sakamoto, K.等人,(2002)Nucleic Acids Res. 30:4692-4699。通常,这些系统都利用琥珀终止密码子。为进一步扩展遗传密码,需要开发生物合成机器(例如,tRNA)的经改进和/或额外组件。如在评估以下揭示内容后将显而易见,本发明满足这些要求和其它要求。

发明内容
为扩展遗传密码,本发明提供制造正交tRNA的组合物和方法。氨酰基tRNA合成酶利用非天然编码的氨基酸使本发明的tRNA氨酰基化。可使用这些翻译组件响应tRNA所识别的选择性密码子将所选氨基酸并入正在生长的多肽链(在核酸翻译的过程中)的特定位置中。在细胞中制造在特定位置处具有所选氨基酸的蛋白质的方法也为本发明的特征。举例来说,一种方法包括在适当的培养基中使细胞生长,其中所述细胞包含包括至少一个选择性密码子并且编码蛋白质的核酸;和提供所选氨基酸。所述细胞另外包含正交tRNA(0-tRNA),其在细胞中起作用并且识别选择性密码子;和正交氨酰基tRNA合成酶(O-RS),其优先利用所选氨基酸使0-tRNA氨酰基化。通常,0-tRNA在存在同类合成酶的情况下包含抑制活性。由本方法制造的蛋白质也为本发明的特征。


图I一绘示具有TVC茎干突变位点的J17 tRNA的三叶草结构;图2-绘示使用J17或J17突变体(F12、F13、F14)进行的人生长激素中琥珀突变的抑制。通过SDS PAGE分析各样本的全细胞溶解产物;图3-绘示在不同细胞系中使用F13进行的人生长激素中琥珀突变的抑制。
具体实施方式
定义
在详细描述本发明之前,应了解,本发明不限于特定生物系统,其当然可以变化。还应了解,本文所使用的术语只是出于描述特定实施例的目的,并且不打算限制仅受随附权利要求限制的本发明的范围。除非另作明确指示,否则如本文和随附权利要求中所使用,单数形式“一”和“所述”包括多个参考物。因此,例如提及“一细胞”包括两个或两个以上细胞的组合并且包括所属领域技术人员已知的其等效物等。对“细菌”的提及包括细菌的混合物等。除非本文和下文说明书的剩余部分中另作定义,否则本文所使用的所有科技术语都具有与本发明所属领域技术人员通常所了解相同的含义。本文所提及的所有公开案和专利都是以引用的方式并入本文中以达到描述和揭示(例如)所述公开案中所述的可能与当前所述的发明结合使用的构筑体和方法的目的。仅提供本文所讨论的公开案在本申请案申请日期之前的揭示内容。本文在任何方面都不应解释为承认本发明者无权由于现有发明或任何其它原因使所述揭示案的日期提前。MM :当蛋白质和/或蛋白质序列是天然或以人工方式从共同的祖先蛋白质或蛋 白质序列得到时,其为“同源”的。类似地,当核酸和/或核酸序列是天然或以人工方式从共同的祖先核酸或核酸序列得到时,其为“同源”的。举例来说,可通过任何可用的诱变方法来修饰任何天然存在的核酸以使其包括一个或一个以上选择性密码子。当表达时,这一经诱变核酸将编码包含一个或一个以上所选氨基酸(例如,非天然氨基酸)的多肽。当然,突变方法可另外改变一个或一个以上标准密码子,借此也使所得突变蛋白质中的一个或一个以上标准氨基酸改变。可将所述一个或一个以上标准氨基酸变为非天然氨基酸或天然氨基酸。同源性一般是从两种或两种以上核酸或蛋白质(或其序列)之间的序列相似性推断得出。可用于确定同源性的序列之间相似性的确切百分比随所讨论的核酸和蛋白质而变化,但通常使用仅25%的序列相似性确定同源性。较高的序列相似性水平(例如,30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或99%,或99%以上)也可用于确定同源性。测定序列相似性百分比的方法(例如,使用默认参数的BLASTP和BLASTN)在本文中加以描述并且一般可用。正交如本文所使用,术语“正交”是指以降低的效率被所关注的系统(例如,翻译系统,例如细胞)使用的分子(例如,正交tRNA (0-tRNA)和/或正交氨酰基tRNA合成酶(O-RS)).正交是指正交tRNA和/或正交RS无法在所关注的翻译系统中起作用或以降低的效率(例如,低于20%的效率、低于10%的效率、低于5%的效率或例如低于1%的效率)在所关注的翻译系统中起作用。举例来说,当与通过内源性RS使内源性tRNA氨酰基化相比较时,所关注的翻译系统中的任何内源性RS以降低的效率或甚至为零的效率使所关注的翻译系统中的正交tRNA氨酰基化。在另一个实例中,当与通过内源性RS使内源性tRNA氨酰基化相比较时,正交RS以降低的效率或甚至为零的效率使所关注的翻译系统中的任何内源性tRNA氨酰基化。可将第二正交分子引入细胞中从而与第一正交分子一起作用。举例来说,正交tRNA/RS对包括所引入的在细胞中相对于相应内源性tRNA/RS对以一定效率(例如,约50%效率、约60%效率、约70%效率、约75%效率、约80%效率、约85%效率、约90%效率、约95%效率或约99%或更高效率)一起作用的互补组件。“正交性的改进”是指与原材料或天然存在的tRNA或RS相比正交性增强。同类物:术语“同类物”是指一起作用的组件,例如tRNA和氨酰基tRNA合成酶。所述组件也可称为互补体。优先氨酰基化:术语“优先氨酰基化”是指与O-RS使天然存在的tRNA或用于产生0-tRNA的原材料氨酰基化相比,O-RS利用所选氨基酸(例如,非天然氨基酸)使0-tRNA氨酰基化的效率,例如约70%效率、约75%效率、约80%效率、约85%效率、约90%效率、约95%效率或约99%或更高效率。随后将非天然氨基酸以高保真度(例如)以对指定选择性密码子大于约70%的效率、对指定选择性密码子大于约75%的效率、对指定选择性密码子大于约80%的效率、对指定选择性密码子大于约85%的效率、对指定选择性密码子大于约90%的效率、对指定选择性密码子大于约95%的效率或对指定选择性密码子大于约99%的效率并入正在生长的多肽链中。诜择件密码子:术语“选择性密码子”是指在翻译过程中由0-tRNA识别且不被内源性tRNA识别的密码子。0-tRNA反密码子环识别mRNA上的选择性密码子并且在多肽中的这一位点并入其氨基酸,例如所选氨基酸,诸如非天然氨基酸。选择性密码子可例如包括 (但不限于)无义密码子,诸如终止密码子,包括(但不限于)琥珀密码子、赭石密码子和蛋白石密码子;四个或四个以上碱基密码子;稀有密码子;自天然或非天然碱基对获得的密码子等。对于指定系统来说,选择性密码子也可以包括天然的三碱基密码子中的一种,其中内源性系统不使用(或极少使用)所述天然的三碱基密码子。举例来说,这包括缺乏识别天然的三碱基密码子的tRNA的系统,和/或天然的三碱基密码子为稀有密码子的系统。抑制件tRNA :抑制性tRNA是(例如)通过提供响应选择性密码子将氨基酸并入多肽链的机制来改变指定翻译系统中信使RNA(mRNA)的阅读的tRNA。举例来说,抑制性tRNA可通读包括(但不限于)终止密码子、四碱基密码子或稀有密码子的密码子。抑制活件:术语“抑制活性”是指tRNA (例如,抑制性tRNA)通读选择性密码子的能力。活性可以当与对照(例如缺乏同类合成酶)相比时所观察到的活性百分比表示。翻译系统:术语“翻译系统”是指将天然存在的氨基酸并入正在生长的多肽链(蛋白质)所需的组件。翻译系统的组件可包括(例如)核糖体、tRNA、合成酶、mRNA等。本发明的组件可加到活体外或活体内翻译系统中。翻译系统的实例包括(但不限于)非真核细胞,例如细菌(诸如,大肠杆菌);真核细胞,例如酵母细胞、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞;无细胞翻译系统,例如细胞溶解产物等。翻译系统可为细胞翻译系统或无细胞翻译系统,且可为原核细胞或真核细胞翻译系统。细胞翻译系统包括(但不限于)所需核酸序列可转录成mRNA且所述mRNA可经翻译的全细胞制剂,诸如透性化细胞或细胞培养物。无细胞翻译系统可为市售,且众所周知许多不同的类型和系统。无细胞系统的实例包括(但不限于)原核生物溶解产物(诸如大肠杆菌溶解产物)和真核生物溶解产物(诸如麦芽提取物)、昆虫细胞溶解产物、兔网织红细胞溶解产物、兔卵母细胞溶解产物和人类细胞溶解产物。当所得蛋白质经糖基化、磷酸化或另外经修饰时,由于许多所述修饰仅可能在真核生物系统中,故可优选真核生物提取物或溶解产物。这些提取物和溶解产物中的一些可为市售(Promega ;Madison, Wis. ;Stratagene ;LaJolla, Calif. ;Amersham ;Arlington Heights, 111. ;GIBC0/BRL ;Grand Island, N. Y. X 可用于翻译分泌型蛋白质的膜提取物(诸如含有微粒体膜的犬胰腺提取物)也可用。也可使用重建的翻译系统。也已成功地使用纯翻译因子的混合物将mRNA翻译成蛋白质以及溶解产物或补充有纯翻译因子的溶解产物的组合,所述纯翻译因子诸如起始因子-I (IF-l)、IF-2、IF-3 (a或¢)、延长因子T (EF-Tu)或终止因子。还可使无细胞系统与转录 / 翻译系统偶联,其中如 Current Protocols in Molecular BiologyCF. M. Ausubel等人编,Wiley Interscience, 1993)(其是以引用的方式清楚地并入本文)中所述,将DNA弓I入所述系统中,转录成mRNA且翻译所述mRNA。在真核转录系统中转录的RNA可为异核RNA ChnRNA)或5’端帽子(7-甲基鸟苷)和3’端聚A尾成熟mRNA的形式,此可为某些翻译系统的优势。举例来说,在网织红细胞溶解系统中以高效率翻译经封端mRNA。所选氨基酸:术语“所选氨基酸”是指任何所需的天然存在的氨基酸或非天然氨基酸。如本文所使用,术语“非天然氨基酸”或“非天然编码的氨基酸”是指不为20种常见的天然存在的氨基酸中的一种或硒代半胱氨酸或吡咯赖氨酸的任何氨基酸、经修饰氨基酸和/或氨基酸类似物。可以与术语“非天然编码的氨基酸”和“非天然氨基酸(unnatural aminoacid)”以相同意义使用的其它术语为“非天然氨基酸(“non-natural amino acid”)”、“非天然存在的氨基酸”和其各种以连字符连接和不以连字符连接的型式。术语“非天然编码的氨基酸”还包括(但不限于)通过对天然编码的氨基酸(包括但不限于,20种常见氨基酸或吡咯赖氨酸和硒代半胱氨酸)进行修饰(例如,翻译后修饰)而产生但其本身未通过翻译复 合物天然并入到正在生长的多肽链中的氨基酸。所述非天然存在的氨基酸的实例包括(但不限于)N-乙酰葡糖胺基-L-丝氨酸、N-乙酰葡糖胺基-L-苏氨酸和0-磷酸酪氨酸。自……获得:如本文所使用,术语“自……获得”是指从特定分子或有机体分离或使用来自特定分子或有机体的信息制得的组件。阳性选择或筛选标记如本文所使用,术语“阳性选择或筛选标记”是指当存在(例如,经表达、经活化等)时导致鉴别具有阳性选择标记的细胞与不具有阳性选择标记的细胞的标记。阴性选择或筛选标记:如本文所使用,术语“阴性选择或筛选标记”是指当存在(例如,经表达、经活化等)时允许鉴别不具有所需特性(例如,当与具有所需特性的细胞相比较时)的细胞的标记。报告基因如本文所使用,术语“报告基因”是指可用于选择所关注的系统中的革巴组件的组件。举例来说,报告基因可包括蛋白质,例如赋予抗生素抗性或敏感性的酶(包括但不限于,¢-内酰胺酶、氯霉素乙酰转移酶(CAT)等)、荧光筛选标记(包括但不限于,绿色荧光蛋白质(例如GFP)、YFP、EGFP, RFP)、发光标记(包括但不限于,萤火虫荧光素酶蛋白)、基于亲和力的筛选标记或阳性或阴性选择标记基因(诸如lacZ、^ -gal/lacZ ( ^ -半乳糖苷酶)、ADH (醇脱氢酶)、his3、ura3、leu2、lys2 等)。直孩生鹽如本文所使用,术语“真核生物”是指属于系统发育真核生物领域的有机体,诸如动物(包括但不限于,哺乳动物、昆虫、爬行动物、鸟类等)、纤毛虫、植物(包括但不限于,单子叶植物、双子叶植物、藻类等)、真菌、酵母、鞭毛虫、小孢子虫、原生生物等。非真核生物如本文所使用,术语“非真核生物”是指非真核有机体。举例来说,非真核有机体可属于系统发育真细菌领域(包括但不限于,大肠杆菌、极端嗜热细菌(Thermus thermophilus)、嗜热脂肪芽抱杆菌(Bacillus stearothermophilus)、突光假单胞菌(Pseudomonas fluorescens)、铜绿假单胞菌(Pseudomonas aeruginosa)、恶臭假单胞菌(Pseudomonas putida)等)或系统发育古细菌领域(例如詹氏甲烧球菌(Methanococcusjannaschii);嗜热自养甲烧杆菌(Methanobacterium thermoautotrophicum);嗜盐古菌(Halobacterium),诸如沃氏嗜盐富饶菌(Haloferax volcanii)和嗜盐古菌NRC-1(Halobacterium species NRC-1);闪烁古生球菌(Archaeoglobus fulgidus);强烈火球菌(Pyrococcus furiosus);掘越氏热球菌(Pyrococcus horikoshii);嗜热泉生古细菌(Aeuropyrum pernix)等)。保守变异体:术语“保守变异体”是指在功能上与得到保守变异体的组件(例如0-tRNA或0-RS)类似但序列变异的翻译组件,例如保守变异体0-tRNA或保守变异体0-RS。举例来说,O-RS将利用所选氨基酸(例如,非天然氨基酸)使互补0-tRNA或保守变异体0-tRNA氨酰基化,但所述0-tRNA和所述保守变异体0-tRN A不具有相同序列。类似地,可通过互补O-RS或保守变异体O-RS利用所选氨基酸(例如,非天然氨基酸)使tRNA氨酰基化,但所述O-RS和所述保守变异体O-RS不具有相同序列。保守变异体的序列可具有(例如)一处变异、两处变异、三处变异、四处变异或五处或五处以上变异,只要保守变异体与相应0-tRNA或O-RS互补即可。选择或筛选剂:如本文所使用,术语“选择或筛选剂”是指当存在时允许从群体中选择/筛选某些组件的试剂。举例来说,选择或筛选剂例如包括(但不限于)养分、抗生素、光波长、抗体、经表达聚核苷酸等。选择剂的(例如)浓度、强度等可变化。术语“未有效识别”是指来自一种有机体的RS使0-tRNA氨酰基化的效率(例如)小于约10%、小于约5%或小于约1%。适于制造包括一个或一个以上所选氨基酸(例如,非天然氨基酸)的蛋白质的翻译系统已描述于名称为 “METHODS AND COMPOSITION FOR THE PRODUCTION OF ORTHOGONALtRNA-AMINOACYL tRNA SYNTHETASE PAIRS” 的美国专利申请案 10/126,931 和名称为 “INVIVO INCORPORATION OF UNNATURAL AMINO ACIDS. ”的 10/126, 927 中。此外,参看名称为“EXPANDING THE EUKARYOTIC GENETIC CODE”的USSN 10/825,867。这些申请案的每一个都是以全文引用的方式并入本文。所述翻译系统一般包含包括正交tRNA(0-tRNA)、正交氨酰基tRNA合成酶(O-RS)和所选氨基酸(例如,非天然氨基酸)的细胞,其中O-RS利用所选氨基酸使0-tRNA氨酰基化。本发明的正交对由0-tRNA (例如,抑制性tRNA、移码tRNA等)和O-RS构成。0-tRNA识别第一选择性密码子并且在存在同类合成酶的情况下响应选择性密码子而具有抑制活性。细胞使用所述组件将所选氨基酸并入正在生长的多肽链中。举例来说,也可存在包含编码所关注的多肽的聚核苷酸的核酸,其中所述聚核苷酸包含由0-tRNA识别的选择性密码子。翻译系统也可以是活体外系统。本发明的tRNA分子可用于任何翻译系统中,包括在翻译中利用核糖体的系统。翻译系统也可为无细胞(活体外)翻译系统。在可包括mRNA作为模板(活体外翻译)或DNA作为模板(活体外转录与翻译的组合)的这些系统中,活体外合成是由核糖体指导。已将相当多的努力用于开发无细胞蛋白质表达系统中。例如参看Kim, D. M. 和 J. R. Swartz, Biotechnology and Bioengineering,74:309-316 (2001);Kim, D. M.和 J. R. Swartz, Biotechnology Letters, 22, 1537-1542,(2000) ;Kim, D.M.和 J. R. Swartz, Biotechnology Progress, 16, 385-390,(2000) ;Kim, D. M.和J. R. Swartz, Biotechnology and Bioengineering,66,180-188, (1999);和 Patnaik, R.和 J. R. Swartz, Biotechniques 24,862-868,(1998);美国专利第 6,337,191 号;美国专利公开案第2002/008 1660号;W000/55353 ;W0 90/05785,所述专利文献都是以引用的方式并入本文。可应用的另一种方法包括mRNA-肽融合技术。例如参看R. Roberts和 J.Szostak,Proc. Natl Acad.Sci. (USA)94:12297-12302 (1997) ;A.Frankel 等人,Chemistry & Biology 10:1043-1050 (2003)。以本方法,在核糖体上将与嘌呤霉素连接的mRNA模板翻译成肽。如果已对一个或一个以上tRNA分子进行修饰,那么也可将非天然氨基酸并入肽中。阅读最后一个mRNA密码子后,嘌呤霉素将俘获肽的C端。如果在活体外检定中发现所得mRNA-肽连结物具有引人关注的特性,那么可轻易地从mRNA序列揭示其身份。以此方式,可筛选包含一个或一个以上非天然编码的氨基酸的多肽的文库以鉴别具有所需特性的多肽。目前,据报导,以纯组件进行的活体外核糖体翻译将允许合成经非天然编码的氨基酸取代的妝。例如参看A. Forster 等人,Proc. Natl Acad. Sci. (USA) 100:6353 (2003)。在某些实施例中,包含本发明的tRNA的大肠杆菌细胞包括所述翻译系统。举例来说,本发明的大肠杆菌细胞包括正交tRNA(0-tRNA),其中所述0-tRNA在存在同类合成酶的 情况下响应选择性密码子而包含抑制活性;正交氨酰基tRNA合成酶(O-RS);所选氨基酸;和核酸,其包含编码所关注的多肽的聚核苷酸,其中所述聚核苷酸包含由0-tRNA识别的选择性密码子。本发明还在细胞中提供多个0-tRNA/0-RS对,其允许并入一个以上所选氨基酸。在某些实施例中,细胞可另外包括另一不同的0-tRNA/0-RS对和第二所选氨基酸,其中所述0-tRNA识别第二选择性密码子并且所述O-RS优先利用第二所选氨基酸使0-tRNA氨酰基化。举例来说,细胞可另外包含(例如)自詹氏甲烷球菌的酪氨酰基tRNA合成酶获得的琥珀抑制性tRNA-氨酰基tRNA合成酶对。0-tRNA和/或O-RS可天然存在或者可通过来自多种有机体的天然存在的tRNA和/或RS的突变(例如,其产生tRNA文库和/或RS文库)得到。举例来说,制造正交tRNA/氨酰基tRNA合成酶对的一种策略涉及将来自(例如)除宿主细胞外的其它来源或多种来源的异源tRNA/合成酶对输入宿主细胞中。异源合成酶候选物的特性包括(例如)其不负载任何宿主细胞tRNA,并且异源tRNA候选物的特性包括(例如)其不经任何宿主合成酶氨酰基化。此外,异源tRNA与所有宿主细胞合成酶正交。产生正交对的另一种策略涉及产生突变体文库以筛选和/或选择0-tRNA或O-RS。这些策略也可以组合。在各种实施例中,0-tRNA和O-RS是自至少一种有机体获得。在另一个实施例中,0-tRNA是自第一有机体的天然存在或突变的天然存在的tRNA获得,并且O-RS是自第二有机体的天然存在或突变的天然存在的RS获得。在一个实施例中,第一有机体与第二有机体不同。举例来说,正交对可包括自嗜热自养甲烷杆菌获得的tRNA合成酶和自古细菌tRNA(例如,自嗜盐古菌NRC-I)获得的tRNA。或者,第一有机体与第二有机体相同。参看本文中标题为“来源和宿主有机体”的章节以得到额外信息。在本发明的某些实施例中,本发明的0-tRNA包含如SEQ ID NO. :1、2或3中所述的聚核苷酸序列或其互补聚核苷酸序列或其保守变异体,或由所述聚核苷酸序列或其互补聚核苷酸序列或其保守变异体编码。也参看本文中标题为“核酸和多肽序列和变异体”的早下。tRNA (0-tRNA)正交tRNA (0-tRNA)介导(例如)活体内或活体外将所选氨基酸并入由包含经0-tRNA识别的选择性密码子的聚核苷酸编码的蛋白质。可通过任何方法或技术(包括但不限于,化学或酶促氨酰基化方法)利用所需氨基酸使本发明的0-tRNA氨酰基化。本发明的氨酰基化0-tRNA可直接加到翻译系统中。可在活体外或活体内利用所选氨基酸通过RS使本发明的0-tRNA氨酰基化。此外,RS可为O-RS。可将本发明的0-tRNA直接提供到翻译系统(例如,活体外翻译组件,或细胞)中,或通过提供编码0-tRNA或其部分的聚核苷酸将其提供到翻译系统中。举例来说,0-tRNA或其部分是由如SEQ IDN0. : 1、2、3中所述的聚核苷酸序列或其互补聚核苷酸序列或其保守变异体编码。本发明的0-tRNA在存在同类合成酶的情况下响应选择性密码子而包含抑制活性。抑制活性可通过所属领域中已知的多种检定中的任一种来测定。举例来说,可使用
半乳糖苷酶报告基因检定。使用在启动子控制下表达IacZ基因的质粒的衍生物,例如,其中IacZ的肽VVLQRRDWEN中的Leu_25经选择性密码子(例如,TAG、TGA、AGGA等密码子,或酪氨酸、丝氨酸、亮氨酸等的有义密码子(作为对照))置换。将衍生化的IacZ质粒以及包含本发明的0-tRNA的质粒引入来自适当有机体(例如,可使用正交组件的有机体)的细胞 中。还可引入同类合成酶(当表达时作为编码同类合成酶的多肽或聚核苷酸)。使细胞在培养基中生长到所需密度(例如,达到约0. 5的0D_),并且例如使用BetaFluor ^ -半乳糖苷酶检定试剂盒(Novagen)进行P _半乳糖苷酶检定。以样本相对于可比较对照(例如,由衍生化IacZ构筑体观察得到的值)的活性百分比计算抑制百分比,其中所述构筑体在所需位置处具有相应的有义密码子而非选择性密码子。在tRNA分子中,胸腺嘧啶(T)经尿嘧啶(U)置换。此外,可存在对碱基的其它修饰。本发明还包括0-tRNA的保守变异体。举例来说,0-tRNA的保守变异体包括与0-tRNA功能类似并且保持tRNA的L形结构但不具有相同序列的分子(且为除野生型tRNA分子之外的分子)。也参看本文中标题为“核酸和多肽序列以及变异体”的章节。包含0-tRNA的组合物可另外包括正交氨酰基tRNA合成酶(0-RS),其中所述O-RS优先利用所选氨基酸(例如,非天然氨基酸)使0-tRNA氨酰基化。在某些实施例中,包括0-tRNA的组合物可另外包括翻译系统(例如,活体外或活体内翻译系统)。细胞或其它翻译系统中也可存在包含编码所关注的多肽的聚核苷酸的核酸,其中所述聚核苷酸包含一个或一个以上由0-tRNA识别的选择性密码子,或一个或一个以上所述密码子的组合。也参看本文中标题为“正交氨酰基tRNA合成酶(O-RS) ”的章节。制造正交tRNA (0-tRNA)(例如,0-tRNA)的方法也为本发明的特征。由所述方法制造的tRNA (例如,0-tRNA)也为本发明的特征。制造正交tRNA的方法包括使tRNA池中的每一 tRNA的反密码子环突变以允许识别选择性密码子(例如,琥珀密码子、蛋白石密码子、四碱基密码子等),借此提供多个潜在的0-tRNA ;并且分析所述多个潜在0-tRNA的成员的二级结构以鉴别二级结构中的非规范碱基对;且视情况使所述非规范碱基对突变(例如,使非规范碱基对突变为规范碱基对)。非规范碱基对可位于二级结构的茎干区中。0-tRNA可具有一种或一种以上特征或活性的改进(诸如与原材料(例如,多个tRNA序列)相比对于所需有机体的正交性的改进),而同时保持其对所需RS的亲和力。或者,可通过使已知tRNA突变以调节其与一个或一个以上影响翻译或作为翻译机器组件的分子的相互作用或与所述分子的结合亲和力来产生0-tRNA。所述组件包括(但不限于)延长因子。细菌延长因子EF-Tu对于蛋白质合成中的延长步骤起到关键作用。在tRNA合成酶使tRNA氨酰基化后,EF-Tu结合氨酰基化的tRNA并且将其带到核糖体的A位点。带电氨基酸与tRNA之间的酯键因EF-Tu与氨酰基化tRNA之间的结合而避免发生自发水解。Stortchevoi等人已对大肠杆菌起始tRNAfMet的T VC茎干中的U50:G64摆动碱基对的突变体进行研究,这是因为已发现这一碱基对是在延长过程中阻断tRNA活性的二级负决定因子(secondary negative determinant),推测这是由EF_Tu. GTP与氨酸基化tRNA之间减弱的相互作用引起(JBC 2003 278(20) : 17672-17679)。同样,LaRiviere等人于Science, 2001年10月5日;294 (5540) : 165-8中描述氨基酸和tRNA主体对与EF-Tu的总结合亲和力的热动力学贡献。其表明,tRNA主体和氨基酸的贡献彼此无关,并且当tRNA经正确酰基化时,所述tRNA主体与所述氨基酸彼此补偿。EF-Tu. GTP与经非天然氨基酸氨酰基化的tRNA之间相互作用的改变可能影响将tRNA负载到核糖体A位点的效率。也可以通过分析tRNA与翻译机器其它组件(诸如EF-Tu)的复合物的晶体结构来发现潜在的突变位点。举例来说,Nissen等人已指出,EF-Tu. GTP与酵母苯丙氨酰基转移RNA (Phe-tRNA)的T VC 茎干的磷酸主链直接结合(Science 1995270 (5241) : 1464-1472)。所述方法视情况包括分析tRNA和/或氨酰基tRNA合成酶的序列的同源性以确定 似乎对于特定有机体正交的0-tRNA、0-RS和/或0-tRNA/0-RS对的潜在候选物。所属领域中已知并且本文描述的计算机程序可用于所述分析。在一个实例中,为选择用于原核有机体中的潜在正交翻译组件,选择不显示与原核有机体的异常同源性的合成酶和/或tRNA。还可以通过一致性策略制造tRNA池。举例来说,通过比对多个tRNA序列;确定一致序列;并且使用所述一致序列的至少一部分、大部分或全部产生tRNA文库来制造tRNA池。举例来说,可用计算机程序(例如,GCG程序pileup)来编译一致序列。视情况,将由所述程序所测定的简并位置变为所述位置处的最常见碱基。文库是通过所属领域中已知的技术使用一致序列合成。举例来说,可使用寡核苷酸的重叠延伸提供基于一致序列的文库,其中tRNA基因的各个位点可合成为90%—致序列与10%其它三碱基混合物的掺杂混合物。也可以使用其它混合物,例如75% —致序列和25%其它三碱基混合物;80% —致序列和20%其它三碱基混合物;95%—致序列和5%其它三碱基混合物等。突变体tRNA文库可使用所属领域中已知的各种诱变技术产生。举例来说,可通过位点特异性突变、随机点突变、同源重组、DNA改组或其它递归式诱变方法、嵌合构建或其任何组合产生突变体tRNA。可将其它突变引入tRNA的所需环或区域(例如,反密码子环、受体茎干、D臂或环、可变环、TurC臂或环、tRNA分子的其它区域或其组合)中的特定位置(例如,非保守性位置或保守性位置、随机位置或其组合)处。突变可包括在茎干区中相配的碱基对。通常,通过使第一物种的细胞群体经历阴性选择来获得0-tRNA,其中所述细胞包含多个潜在0-tRNA中的成员。阴性选择将除去包含经细胞内源性氨酰基tRNA合成酶(RS)氨酰基化的多个潜在0-tRNA的成员的细胞。这提供与第一物种的细胞正交的tRNA池。在阴性选择的某些实施例中,将选择性密码子弓I入编码阴性选择标记(例如,赋予抗生素抗性的酶,例如¢-内酰胺酶;赋予可检测的产物的酶,例如¢-半乳糖苷酶、氯霉素乙酰转移酶(CAT);例如在非必需位置处的有毒产物,诸如barnase等)的聚核苷酸中。筛选/选择可通过使细胞群体在存在选择剂(例如,抗生素,诸如氨比西林(ampicillin))的情况下生长来进行。在一个实施例中,选择剂的浓度可变化。举例来说,为测量抑制性tRNA的活性,使用基于选择性密码子的活体内抑制(例如,引入编码阴性选择标记(例如,¢-内酰胺酶的基因(bla))的聚核苷酸中的无义或移码突变)的选择系统。举例来说,构建在一定位置(即某一位置)处具有(例如)TAG、AGGA和TGA的聚核苷酸变异体,例如bla变异体。用这些聚核苷酸转化细胞(例如,细菌)。在无法被内源大肠杆菌合成酶有效负载的正交tRNA的情况中,抗生素抗性(例如,氨比西林抗性)应与不经质粒转化的细菌的抗性类似或比不经质粒转化的细菌的抗性低。如果tRNA不为正交tRNA,或者如果在所述系统中共表达能够负载tRNA的异源合成酶,那么将观察到较高水平的抗生素(例如,氨比西林)抗性。选择在与不经质粒转化的细胞大致相同的抗生素浓度下无法在LB琼脂平板上生长的细胞,例如细菌。在有毒产物(例如,核糖核酸酶barnase)的情况中,当通过内源宿主(例如,大肠杆菌)合成酶(即,其不与宿主正交,例如大肠杆菌合成酶)使多个潜在tRNA中的成员氨酰基化时,选择性密码子受抑制并且所产生的有毒的聚核苷酸产物导致细胞死亡。具有正交tRNA或非功能性tRNA的细胞存活。 在一个实施例中,随后使与所需有机体正交的tRNA池经历阳性选择,其中选择性密码子放入(例如)由药物抗性基因(诸如¢-内酰胺酶基因)编码的阳性选择标记中。阳性选择是对包含编码或包含tRNA池的成员的聚核苷酸、编码阳性选择标记的聚核苷酸和编码同类RS的聚核苷酸的细胞进行。这些聚核苷酸都在所述细胞中表达,并且所述细胞是在存在选择剂(例如,氨比西林)的情况下生长。随后,针对tRNA经共表达的同类合成酶氨酰基化并且响应此选择性密码子插入氨基酸的能力来选择tRNA。通常,与具有非功能性tRNA或无法被所关注的合成酶有效识别的tRNA的细胞相比,这些细胞展现出抑制效率的增强。具有非功能性tRNA或不被所关注的合成酶有效识别的tRNA的细胞对抗生素敏感。因此,以下tRNA在两种选择下都存活(i)不为内源宿主(诸如,大肠杆菌)合成酶的底物的tRNA ;
(ii)可经所关注的合成酶氨酰基化的tRNA jP(iii)在翻译过程中起作用的tRNA。在上述方法中,选择(例如,阳性选择、阴性选择或阳性选择与阴性选择)的严格度视情况可变化。举例来说,由于barnase为剧毒蛋白质,故阴性选择的严格度可通过将不同数量的选择性密码子引入barnase基因中和/或通过使用可诱导启动子来控制。在另一个实例中,选择剂或筛选剂(例如氨比西林)的浓度可变化。一方面,由于在早期回合中所需活性较低,故严格度是变化的。因此,在早期回合中应用较低严格度的选择标准并且在随后的选择回合中应用较高严格度的标准。在某些实施例中,阴性选择、阳性选择或阴性选择和阳性选择可重复多次。可使用多种不同的阴性选择标记、阳性选择标记或阴性选择和阳性选择标记。在某些实施例中,阳性选择标记与阴性选择标记可相同。可将其它类型的选择/筛选用于本发明中以制造正交翻译组件,例如0-tRNA、O-RS和0-tRNA/0-RS对。举例来说,阴性选择标记、阳性选择标记或阳性选择标记和阴性选择标记可包括发荧光或在存在适当反应物的情况下催化发光反应的标记。在另一实施例中,标记的产物是通过荧光活化细胞拣选(FACS)或通过发光来检测。视情况,标记包括基于亲和力的筛选标记。参看Francisco, J. A.等人,(1993)Production andfluorescence-activated cell sorting of Escherichia coli expressing a functionalantibodyfragment on the external surface.Proc Natl Acad Sci USA. 90:10444-8。
制造重组正交tRNA的其它方法可见于(例如)名称为“Methods and Compositionsfor the Production of Orthogonal tRNA-Aminoacyl tRNA Synthetase Pairs,, 的美国专利申请案 10/126,93 和名称为 “In vivo Incorporation of Unnatural AminoAcids” 的 10/126,127 以及名称为 “EXPANDING THE EUKARYOTIC GENETIC CODE. ”的 USSN10/825,867 中。也参看 Forster 等人,(2003) Programming peptidomimetic synthetasesby translating genetic codes designed de novo. PNAS 100(11):6353-6357 ;和 Feng等人,(2003),Expanding tRNA recognition of a tRNA synthetase by a single aminoacid change, PNAS 100 (10):5676-5681。可通过任何方法或技术(包括但不限于,化学 或酶促氨酰基化方法)利用所需氨基酸使本发明的tRNA氨酰基化。氨酰基化可通过氨酰基tRNA合成酶或其它酶分子(包括但不限于,核糖酶)实现。术语“核糖酶”可与“催化性RNA”互换使用。Cech和同事(Cech, 1987,Science, 236:1532-1539 ;McCorkle等人,1987, Concepts Biochem. 64:221-226)证实可充当催化剂的天然存在的RNA (核糖酶)的存在。然而,尽管仅已证实这些天然RNA催化剂对裂解和剪接的核糖核酸底物起作用,但近期有关人工核糖酶进展的研究已扩展对各种化学反应的催化作用的型式。相关研究已鉴别出可催化自身(2’)3’末端的氨酰基RNA键的RNA分子(Illangakekare等人,1995 Science 267:643-647)和可将氨基酸从一个RNA分子转移到另一 RNA分子的RNA 分子(Lohse 等人,1996, Nature 381:442-444)。美国专利申请公开案2003/0228593 (其是以引用的方式并入本文)描述构建核糖酶的方法和其对于用天然编码的氨基酸和非天然编码的氨基酸氨酰基化tRNA的用途。可使tRNA氨酰基化的基质固定形式的酶分子(包括但不限于,核糖酶)能够有效地亲和纯化氨酰基化产物。适当基质的实例包括琼脂糖、琼脂糖凝胶和磁珠。供氨酰基化作用的基质固定形式的核糖酶的制造和用途已描述于Chemistry and Biology 2003, 10:1077-1084和美国专利申请公开案2003/0228593中,所述专利文献是以引用的方式并入本文。化学氨酰基化方法包括(但不限于)由Hecht和同事(Hecht, S. M. Ace.Chem. Res. 1992, 25, 545 ;Heckler, T. G. ; Roesser, J. R. ; Xu, C; Chang, P. ; Hecht, S.M. Biochemistry 1988, 27, 7254 ;Hecht, S. M. ; Alford, B. L. ; Kuroda, Y. ; Kitano, S. J. Biol.Chem.1978,253,4517)和 Schultz, Chamberlin, Dougherty 等(Cornish, V. W. ; Mendel,D.;Schultz, P. G. Angew. Chem. Int. Ed. Engl. 1995, 34, 621 ;Robertson, S. A. ; Ellman, J.A. ; Schultz, P. G. J. Am. Chem. Soc. 1991, 113, 2722 ;Noren, C. J. ; Anthony-Cahi 11, S. J.;Griffith, M. C; Schultz, P. G. Science 1989,244,182 ;Bain, J. D. ; Glabe, C. G. ; Dix, T. A.;Chamberlin, A. R. J. Am. Chem. Soc. 1989, 111, 8013 ;Bain, J. D.等人 Nature 1992, 356, 537 ;Gallivan, J. P. ; Lester, H. A. ;Dougherty, D. A. Chem. Biol. 1997, 4, 740 ;Turcatti 等人J. Biol. Chem. 1996,271,19991 ;Nowak, M. ff.等人 Science, 1995,268,439 ;Saks, M. E.等人J. Biol. Chem. 1996,271,23169 ;Hohsaka, T.等人 J. Am. Chem. Soc. 1999,121,34)提出的方法以避免在氨酰基化过程中使用合成酶。所述方法或其它化学氨酰基化方法可用于使本发明的tRNA分子氨酰基化。已使用利用以化学方式修饰的氨酰基tRNA的生物合成方法将数个生物物理探针并入活体外合成的蛋白质中。参看本文所引用的以下公开案和参考文献Brunner,J. NewPhotolabeling and crosslinking methods, Annu. Rev Biochem,62:483-514(1993);和Krieg,U. C. , Walter, P. , Hohnson, A. E. Photocrosslinldng of the signal sequence ofnascent preprolactin of the 54-kilodalton polypeptide of the signal recognitionparticle, Proc. Natl. Acad. Sci, 83 (22) : 8604-8608 (1986)。先前已证实,可通过将经化学方法氨酰基化的抑制性tRNA加入经含有所需琥珀无义突变的基因程式设计的蛋白质合成反应中,在活体外将非天然氨基酸位点特异性地并入蛋白质中。使用这些方法,使用特定氨基酸的营养缺陷型菌株,可以结构类似的同源物取代20种常见氨基酸中的多种氨基酸,例如以氟代苯丙氨酸取代苯丙氨酸。例如参看 Noren, C. J. , Anthony-Cahillj Griffith, M. C. , Schultz, P. G. A general method forsite-specific incorporation of unnatural amino acids into proteins. Science,244:182-188 (1989) ;M. ff. Nowak 等人,Science 268:439-42(1995) ;Bain, J. D. , Glabe, C.G. , Dix, T. A. , Chamberlin, A. R. , Diala, E. S. Biosynthetic site-specific Incorporationof a non-natural amino acid into a polypeptide, I. Am Chem Soc,111:8013—8014(1989) ;N. Budisa 等人,FASEB T. 13:41-51 (1999) Ellman. T. A. . Mendel. D. . Anthony-Cahill, S. , Noren, C. J. , Schultz,P.G.Biosynthetic method for introducingunnatural amino acids site-specifically into proteins. Methods in Enz., 第202 卷,301-336(1992);和 Mendel,D.,Cornish, V. ff. &Schultz, P. G. Site-DirectedMutagenesis with an Expanded Genetic Code, Annu Rev Biophys. Biomol Struct. 24,435-62(1995)。举例来说,制备识别终止密码子UAG的抑制性tRNA,并且用非天然氨基酸以化学方法使其氨酰基化。使用常规定点诱变将终止密码子TAG引入蛋白质基因中的所需位点处。例如参看 Sayers, J. R.,Schmidt, W. Eckstein, F. 5’_3’ Exoniicleases inphosphorothioate-based olignoucleotide-directed mutaRensis, Nucleic AcidsRes, 16 (3) : 791-802 (1988)。当将酰基化抑制性tRNA和突变体基因组合于活体外转录/翻译系统中时,响应UAG密码子而并入非天然氨基酸,此提供在特定位置处含有所述氨基酸的蛋白质。使用[3H]-Phe进行的实验和以a羟基酸进行的实验证实,仅所需氨基酸被并入UAG密码子指定的位置处,且并未将这一氨基酸并入蛋白质中的任何其它位点。例如参看Noren等人,同上文;Kobayashi 等人,(2003)Nature Structural BiologylO (6) :425-432 ;和 Ellman,J.A.,Mendel, D.,Schultz, P. G. Site-specific incorporation of novelbackbone structures into proteins, Science,255 (5041):197-200 (1992)。产生催化性RNA的方法可涉及产生单独随机核糖酶序列池;对所述池进行定向进化;针对所需氨酰基化活性筛选所述池;和选择那些展现所需氨酰基化活性的核糖酶的序列。核糖酶可包含有利于酰基化活性的基序和/或区域,诸如GGU基序和富集U的区域。举例来说,据报导,富集U的区域可有利于识别氨基酸底物,且GGU基序可与tRNA 3’末端形成碱基对。总的说来,GGU和基序以及富集U的区域有利于同时识别氨基酸与tRNA,且由此有利于使tRNA 3’末端氨酰基化。 可通过使用与tRNAAsn CCCG连结的部分随机化r24mini进行活体外选择,随后系统性工程设计见于活性克隆中的一致序列来产生核糖酶。由本方法获得的例示性核糖酶称为“Fx3核糖酶”且描述于美国公开申请案第2003/0228593号中,所述专利的内容是以引用的方式并入本文,所述核糖酶充当合成载有同类非天然氨基酸的各种氨酰基tRNA的通用催化剂。可使用在基质上固定以能够有效亲和纯化氨酰基化tRNA。适当基质的实例包括(但不限于)琼脂糖、琼脂糖凝胶和磁珠。可利用RNA的化学结构将核糖酶固定于树脂上,诸如,可以高碘酸盐氧化RNA的核糖上的3’-顺-二醇以得到相应二醛以有利于将RNA固定于树脂上。可使用各类树脂,包括廉价酰肼树脂,其中还原氨化使得树脂与核糖酶之间以不可逆连接相互作用。可通过柱上氨酰基化技术显著有利于氨酰基tRNA的合成。Kourouklis等人Methods 2005;36:239-4描述基于柱的氨酰基化系统。可以多种方式实现氨酰基化tRNA的分离。一种适当方法为用缓冲液从柱中洗提出氨酰基化tRNA,所述缓冲液诸如含有IOmM EDTA的乙酸钠溶液;含有50mM N_(2_羟乙基)哌嗪-N,-(3-丙烷磺酸)、12. 5mM KCl (pH 7. O)、IOmM EDTA的缓冲液;或简单地为经EDTA 缓冲的水(pH 7.0)。
可将本发明的氨酰基化tRNA加入翻译反应中以便将使tRNA氨酰基化的氨基酸并入翻译反应所制造的多肽中选择的位置中。可使用本发明的氨酰基化tRNA的翻译系统的实例包括(但不限于)细胞溶解产物。细胞溶解产物提供从输入的mRNA活体外翻译多肽必需的反应组件。所述反应组件的实例包括(但不限于)核糖体蛋白、rRNA、氨基酸、tRNA、GTP、ATP、翻译起始因子和延长因子以及与翻译有关的其它因子。此外,翻译系统可为批量翻译或区域化翻译。批量翻译系统将反应组件组合于单一隔室中,而区域化翻译系统使翻译反应组件与可抑制翻译效率的反应产物分离。所述翻译系统均有市售。另外,可使用偶联转录/翻译系统。偶联转录/翻译系统允许将输入DNA转录成对应的mRNA,其接着经反应组件翻译。市售偶联转录/翻译的实例为快速翻译系统(RapidTranslation System) (RTS, Roche Inc.)。所述系统包括含有提供翻译组件(诸如核糖体和翻译因子)的大肠杆菌溶解产物的混合物。此外,还包括RNA聚合酶以将输入DNA转录成供翻译使用的mRNA模板。RTS可使用借助插入到反应隔室(包括供应/废物隔室和转录/翻译隔室)之间的膜区域化反应组件。tRNA的氨酰基化可以其它试剂进行,所述试剂包括(但不限于)转移酶、聚合酶、催化抗体、多功能蛋白等。iH交氨酿基tRNA合成酶(O-RS)O-RS优先利用所选氨基酸在活体外或活体内使本发明的0-tRNA氨酰基化。可通过包括O-RS的多肽和/或通过编码O-RS或其部分的聚核苷酸将本发明的O-RS提供到翻译系统(例如,活体外翻译组件,或细胞)中。O-RS或其部分是由聚核苷酸序列或其互补聚核苷酸序列或其保守变异体编码。可通过多种不同的O-RS分子(包括但不限于,本文所述的分子)将本发明的0-tRNA氨酰基化。鉴别与0-tRNA (例如,0-tRNA) 一起使用的正交氨酰基tRNA合成酶(O-RS)(例如,0-RS)的方法也为本发明的特征。举例来说,方法包括使第一物种的细胞群体经历阳性选择,其中所述细胞各自包含1)多种氨酰基tRNA合成酶(RS)的成员,其中所述多种RS包含突变体RS、从除第一物种以外的物种得到的RS或突变体RS和从除第一物种以外的物种得到的RS ;2)来自第二物种的正交tRNA (0-tRNA);和3)编码阳性选择标记并且包含至少一个选择性密码子的聚核苷酸。选择或筛选细胞中与缺乏多种RS中的成员或具有减少量的多种RS中的成员的细胞相比展示增强的抑制效率的细胞。抑制效率增强的细胞包含使O-tRNA氨酰基化的活性RS。将活性RS使来自第一物种的第一组tRNA氨酰基化的水平(活体外或活体内)与活性RS使来自第二物种的第二组tRNA氨酰基化的水平(活体外或活体内)相比较。氨酰基化水平可通过可检测物质(例如,经标记氨基酸或非天然氨基酸)测定。选择与第一组tRNA相比使第二组tRNA更有效氨酰基化的活性RS,借此提供与O-tRNA一起使用的正交氨酰基tRNA合成酶。由所述方法鉴别的O-RS (例如,0-RS)也为本发明的特征。可使用多种检定中的任一种测定氨酰基化。这些检定可在活体外或活体内进行。举例来说,活体外氨酰基化检定描述于例如Hoben, P.和Soil, D. (1985)MethodsEnzymoI. 113:55-59以及美国专利申请公开案第2003/0228593号中。也可通过使用报告基因和正交翻译组件,并且检测表达包含至少一个选择性密码子且编码蛋白质的聚核苷酸的 细胞中的报告基因来测定氨酰基化。也参看名称为“IN VIVO INCORPORATION OF UNNATURALAMINO ACIDS” 的美国专利申请案 10/126,927 ;和名称为 “EXPANDING THE EUKARYOTICGENETIC CODE” 的 USSN 10/825,867。可进一步对经鉴别的O-RS进行操纵以改变合成酶的底物特异性,从而仅所需非天然氨基酸而非常见20种氨基酸中的任一种载到O-tRNA上。产生对非天然氨基酸具有底物特异性的正交氨酰基tRNA合成酶的方法包括使合成酶(例如)在合成酶的活性位点处、合成酶的编辑机制位点处、通过组合合成酶不同域得到的不同位点处等突变,和应用选择方法。使用基于阳性选择随后阴性选择的组合的策略。在阳性选择中,对阳性标记的非必需位置处引入的选择性密码子的抑制使细胞在阳性选择压力下存活。因此,在存在天然和非天然氨基酸的情况下,存活者编码使正交抑制性tRNA载上天然或非天然氨基酸的活性合成酶。在阴性选择中,对阴性标记的非必需位置处引入的选择性密码子的抑制将去除具有天然氨基酸特异性的合成酶。阴性选择和阳性选择的存活者编码仅利用非天然氨基酸使正交抑制性tRNA氨酰基化(装载)的合成酶。随后,可使这些合成酶经历进一步的诱变,例如DNA改组或其它递归式诱变方法。可使用所属领域中已知的各种诱变技术产生突变体O-RS文库。举例来说,可通过位点特异性突变、随机点突变、同源重组、DNA改组或其它递归式诱变方法、嵌合构建或其任何组合产生突变体RS。举例来说,可由两种或两种以上其它(例如)较小、较少不同的“子文库”来产生突变体RS文库。RS的嵌合文库也包括在本发明中。应注意,视情况构建来自各种有机体(例如,微生物,诸如真细菌或古细菌)的tRNA合成酶文库,诸如,包含天然多样性的文库(例如参看Short等人的美国专利第6,238,884号;Schallenberger等人的美国专利第5,756,316号;Petersen等人的美国专利第5,783,431号!Thompson等人的美国专利第5,824,485号;Short等人的美国专利第5,958,672号);并且筛选正交对。使合成酶经历阳性和阴性选择/筛选策略后,随后可使这些合成酶经历进一步诱变。举例来说,可分离编码O-RS的核酸;可由所述核酸产生(例如,通过随机诱变、位点特异性诱变、重组或其任何组合)一组编码突变O-RS的聚核苷酸;并且可重复这些个别步骤或这些步骤的组合直到获得优先利用非天然氨基酸使O-tRNA氨酰基化的突变0-RS。在本发明一个方面中,进行所述步骤多次,例如至少2次。
还可将不同程度的选择/筛选严格度用于本发明的方法中,以用于产生O-tRNA、O-RS或0-tRNA/0-RS对。所述方法的一个或两个步骤的选择或筛选严格度可变化以产生O-RS0这可包括(例如)改变所使用的选择剂/筛选剂的量等。也可进行其它回合的阳性选择和/或阴性选择。选择或筛选也可包含一次或一次以上阳性或阴性选择或筛选,所述选择或筛选包括(例如)氨基酸渗透性的改变、翻译效率的改变、翻译保真度的改变等。通常,一种或一种以上改变是基于使用正交tRNA-tRNA合成酶对制造蛋白质的有机体中一个或一个以上基因的突变。可将针对(例如)O-RS、O-tRNA和0-tRNA/0-RS对的其它类选择用于本发明中。阳性选择标记可为多种分子中的任一种,包括(但不限于)提供营养补充以供生长的产物,并且在缺乏营养补充的培养基上进行选择。编码阳性选择标记的聚核苷酸的实例包括(但不限于)例如基于补充细胞的氨基酸营养缺陷型的报告基因、his3基因(例如,其中his3基因编码通过提供3-氨基三唑(3-AT)检测的咪唑甘油磷酸脱氢酶)、ura3基因、leu2基因、lys2 基因、IacZ基因、adh基因等。例如参看G. M. Kishore, & D. M. Shah, (1988), Amino acidbiosynthesis inhibitors as herbicides, Annual Review of Biochemistry57:627—663。 在一个实施例中,IacZ的产生是通过邻硝基苯基-β-D-吡喃半乳糖苷(ONPG)水解检测。例如参看 I. G. Serebriiskii, & E. A. Golemis, (2000), Uses of IacZ to studygene function: evaluation of beta-galactosidase assays employed in the yeasttwo-hybrid system, Analytical Biochemistry 285:1-15。其它阳性选择标记包括(例如)荧光素酶、绿色荧光蛋白质(GFP)、YFP、EGFP, RFP、抗生素抗性基因的产物(例如,氯霉素乙酰转移酶(CAT))、转录调节蛋白(例如,GAL4)等。视情况,编码阳性选择标记的聚核苷酸包含选择性密码子。可将编码阳性选择标记的聚核苷酸可操作地连接到反应元件。还可存在编码调节反应元件转录的转录调节蛋白且包含至少一个选择性密码子的额外聚核苷酸。通过经非天然氨基酸氨酰基化的O-tRNA将非天然氨基酸并入转录调节蛋白中将引起编码阳性选择标记的聚核苷酸(例如,报告基因)的转录。视情况,选择性密码子位于编码转录调节蛋白的DNA结合域的一部分聚核苷酸中或实质上临近编码转录调节蛋白的DNA结合域的一部分聚核苷酸。也可将编码阴性选择标记的聚核苷酸可操作地连接到转录调节蛋白介导转录的反应元件。例如参看 A. J. DeMaggio 等人,(2000),The yeast split-hybridsystem, Method Enzymol. 328:128-137 ;H. M. Shih 等人,(1996),A positive geneticselection for disrupting protein-protein interactions:identification ofCREB mutations that prevent association with the coactivator CBP, Proc. Natl.Acad.Sci.U. S. A. 93:13896-13901 ;M. Vidal 等人,(1996),Genetic characterizationof a mammalian protein-protein interaction domain by using a yeast reversetwo-hybrid system, Proc. Natl. Acad. Sci. U. S. A. 93: 10321-10326 ;和 M. Vidal 等人,(1996), Reverse two-hybrid and one-hybrid systems to detect dissociationof protein-protein and DNA-protein interactions (Proc.Natl.Acad. Sci.U. S. A. 93:10315-10320)。通过经天然氨基酸氨酰基化的O-tRNA将天然氨基酸并入转录调节蛋白中将引起阴性选择标记的转录。视情况,阴性选择标记包含选择性密码子。本发明的阳性选择标记和/或阴性选择标记可包含至少两个选择性密码子,所述标记各自或都可包含至少两个不同的选择性密码子或至少两个相同的选择性密码子。转录调节蛋白为与核酸序列(例如,反应元件)(直接或间接)结合并且调节可操作地连接到反应元件的序列的转录的分子。转录调节蛋白可为转录活化蛋白(例如,GAL4、核激素受体、APU CREB, LEF/tcf家族成员、SMAD, VP16、SPl等)、转录阻遏蛋白(例如,核激素受体、Groucho/tle家族、Engrailed家族等)或可视环境而具有两种活性的蛋白质(例如,LEF/tcf、同源盒蛋白等)。反应元件通常为由转录调节蛋白识别的核酸序列或与转录调节蛋白协同作用的额外试剂。转录调节蛋白的另ー实例为转录活化蛋白GAL4。例如參看A. Laughon等人,(1984), Identification of two proteins encoded by the Saccharomycescerevisiae GAL4 gene, Molecular & Cellular Biology 4:268-275 ;A. Laughonj &R. F.Gestelandj (1984),Primary structure of the Saccharomyces cerevisiae GAL4gene,Molecular & Cellular Biology4:260-267 ;L Keegan 等人,(1986),Separation of DNA binding from the transcription-activating function of a eukaryoticregulatory protein, Science 231:699-704 ;和 Μ· Ptashne,(1988), How eukaryotictranscriptional activators work, Nature 335:683-689。这ー具有 881 个氨基酸的蛋白质的N末端147个氨基酸形成特异性结合DNA序列的DNA结合域(DBD)。例如参看M. Carey 等人,(1989),An amino-terminal fragment of GAL4binds DNA as a dimer, J.Mol. Biol. 209:423-432 ;和 E. Giniger 等人,(1985),Specific DNAbinding of GAL4, apositive regulatory protein of yeast, Cell 40:767-774。DBD 是通过插入的蛋白质序列连接到当与DNA结合时可活化转录的C末端113个氨基酸活化域(AD)。例如参看J. Maj & M. Ptashnej (1987),Deletion analysis of GAL4 defines two transcriptionalactivating segments,Cell 48:847-853;和 J. Ma,& M. Ptashne, (1987),Thecarboxy-terminal 30 amino acids of GAL4 are recognized by GAL80,Cell50:137-142。通过将琥珀密码子朝向(例如)含有GAL4的N末端DBD和其C末端AD的单一聚核苷酸的N末端DBD放置,可将0-tRNA/0-RS对的琥珀抑制连接到GAL4进行的转录活化。可使用GAL4活化的报告基因进行利用所述基因进行的阳性选择和阴性选择。用于阴性选择的培养基可包含转化成通过阴性选择标记可检测的物质的选择剂或筛选剂。在本发明ー个方面中,可检测物质为有毒物质。编码阴性选择标记的聚核苷酸可为(例如)ura3基因。举例来说,可将URA3报告基因放在含有GAL4 DNA结合位点的启动子的控制下。当例如通过翻译具有选择性密码子的编码GAL4的聚核苷酸来制造阴性选择标记时,GAL4将活化URA3的转录。阴性选择是在包含5-氟乳清酸(5-F0A)的培养基上实现,所述5-F0A转化成通过ura3基因的基因产物可检测的物质(例如,杀死細胞的有毒物质) 例如参看 J. D. Boeke 等人,(1984),Apositive selection for mutantslacking orotidine—5 -phosphate decarboxylase activity in yeast:5-fluorooroticacid resistance,Molecular & General Genetics 197:345-346) ;M.Vidal 等人,、1996),Genetic characterization of a mammalian protein-proteininteraction domain by using a yeast reverse two-hybrid system. , Proc. Natl.Acad. Sci. U. S. A. 93:10321—10326 ;和 M. Vidal 等人,(1996), Reverse two-hybrid andone-hybrid systems to detect dissociation of protein-protein and DNA-proteininteractions.,Proc. Natl. Acad. Sci. U. S. A. 93:10315-10320。如同阳性选择标记一祥,阴性选择标记也可为多种分子中的任ー种。阳性选择标记和/或阴性选择标记可为发荧光或在存在适当反应物的情况下催化发光反应的多肽。举例来说,阴性选择标记包括(但不限于)例如荧光素酶、绿色荧光蛋白质(GFP)、YFP、EGFP、RFP、抗生素抗性基因的产物(例如,氯霉素こ酰转移酶(CAT))、IacZ基因的产物、转录调节蛋白等。阳性选择标记和/或阴性选择标记可通过荧光活化细胞拣选(FACS)或通过发光来检测。阳性选择标记和/或阴性选择标记可包含基于亲 和力的筛选标记。同一聚核苷酸可编码阳性选择标记和阴性选择标记。举例来说,阳性选择步骤、阴性选择步骤或阳性选择和阴性选择步骤可包括使用报告基因,其中所述报告基因是通过荧光活化细胞拣选(FACS)检测。举例来说,阳性选择可首先用阳性选择标记(例如,氯霉素こ酰转移酶(CAT)基因)进行,其中所述CAT基因在所述CAT基因中包含选择性密码子(例如,琥珀終止密码子);随后进行阴性选择筛选,其是基于无法抑制阴性选择标记(例如,T7RNA聚合酶基因)内各位置处的(例如,两个或两个以上)选择性密码子。阳性选择标记和阴性选择标记可见于同一载体(例如质粒)上。阴性标记的表达将驱动报告基因(例如,绿色荧光蛋白质(GFP))的表达。选择和筛选的严格度可变化,例如使报告基因发荧光所需的光強度可变化。阳性选择可利用通过FACS筛选随后阴性选择筛选的报告基因作为阳性选择标记进行,所述阴性选择筛选是基于无法抑制阴性标记(例如,barnase基因)内各位置处的(例如,两个或两个以上)选择性密码子。视情况,报告基因是在细胞表面(例如,噬菌体呈现等)上呈现。细胞表面呈现(例如,基于OmpA的细胞表面呈现系统)取决于大肠杆菌细胞表面上特定抗原决定基(例如,融合到外膜孔蛋白OmpA的脊髄灰质炎病毒C3肽)的表达。所述抗原决定基仅在翻译期间抑制蛋白质信使中的选择性密码子时呈现于细胞表面上。随后所呈现的肽含有由文库中的一个突变体氨酰基tRNA合成酶所识别的氨基酸,并且含有相应合成酶基因的细胞可利用针对含有特定非天然氨基酸的肽所产生的抗体分离。基于OmpA的细胞表面呈现系统经Georgiou等人研发并且优化以作为曬菌体呈现的替代选择。參看Francisco, J.A.,Campbell, R.,丄verson,B. L. & beorgoiu, G. Production ana fluorescence-activatedcell sorting oi Escherichia coli expressing a functional antibody fragment onthe external surface. Proc. Natl. Acad. Sci. USA 90:10444-8(1993)。本发明的其它实施例包括在活体外执行ー个或ー个以上选择步骤。随后可将所选组件(例如,合成酶和/或tRNA)引入細胞中以用于活体内并入非天然氨基酸。制造O-RS并且改变合成酶的底物特异性的其它细节可见于名称为“Methods andCompositions for the Production of Orthogonal tRNA-Aminoacyl tRNA SynthetasePairs” 的美国专利申请案 10/126,931 和名称为 “EXPANDING THE EUKARYOTIC GENETICCODE”的USSN 10/825,867中,所述文献都是以引用的方式并入本文中。制造O-RS的其它细节可见于 Hamano-Takaku 等人,(2000) A mutant Escherichia coli Tyrosyl-tRNASyntnetase Utilizes the Unnatural Amino Acid Azatyrosine More Efficientlythan Tyrosine,Journal of Biological Chemistry,275(51):40324-40328 ;Kiga 等人(2002),An engineered Escherichia coli tyrosyl-tRNA synthetase for site-specificincorporation of an unnatural amino acid into proteins in eukaryotictranslation and its application in a wheat germ cell-free system,PNAS99(15) :9715-9723 ;和 Francklyn 等人,(2002),Aminoacyl-tRNA synthetases: Versatileplayers in the changing theater of translation;RNA,8:1363-1372 中,各文献都是以引用的方式并入本文中。来源和宿主有机体本发明的翻译组件通常是从非真核有机体得到。举例来说,正交Ο-tRNA可从非真核有机体得到,例如古细菌,诸如詹氏甲烷球菌、嗜热自养甲烷杆菌、嗜盐古菌(诸如沃氏嗜盐富饶菌和嗜盐古菌NRC-I )、闪烁古生球菌、强烈火球菌、掘越氏热球菌、嗜热泉生古细菌等;或真细菌,诸如大肠杆菌、极端嗜热细菌、嗜热脂肪芽孢杆菌等,而正交O-RS可从非真核有机体得到,例如嗜热自养甲烷杆菌、嗜盐古菌(诸如沃氏嗜盐富饶菌和嗜盐古菌NRC-1)、闪烁古生球菌、强烈火球菌、掘越氏热球菌、嗜热泉生古细菌等;或真细菌,诸如大肠杆菌、极端嗜热细菌、嗜热脂肪芽孢杆菌等。在一个实施例中,也可使用真核来源,包括(但不限干)植物、藻类、原生生物、真菌、酵母、动物(例如,哺乳动物、昆虫、节肢动物等)等。0-tRNA/0-RS对的个别组件可从相同有机体或不同有机体得到。在一个实施例中,0-tRNA/0-RS对是来自相同有机体。或者,0-tRNA/0-RS对中的Ο-tRNA和O-RS是来自不同有机体。举例来说,Ο-tRNA可从(例如)嗜盐古菌NRC-I得到,并且O-RS可从(例如)嗜热自养甲烷杆菌得到。可在活体内或活体外选择或筛选0-tRNA、O-RS或0-tRNA/0-RS对和/或将其用于细胞(例如,非真核细胞(诸如大肠杆菌细胞)或真核细胞)中以产生具有所选氨基酸(例如,非天然氨基酸)的多肽。非真核细胞可来自各种来源,诸如古细菌系统发育领域,包括(但不限干)詹氏甲烷球菌、嗜热自养甲烷杆菌、嗜盐古菌(诸如沃氏嗜盐富饶菌和嗜盐古菌NRC-1)、闪烁古生球菌、强烈火球菌、掘越氏热球菌、嗜热泉生古细菌等;或可属于真细菌系统发育领域(包括但不限于,大肠杆菌、极端嗜热细菌、嗜热脂肪芽孢杆菌、荧光假单胞菌、铜绿假单胞菌、恶臭假单胞菌等)等。真核细胞可来自各种来源,包括(但不限干)植物(例如,复杂植物,诸如单子叶植物或双子叶植物)、藻类、原生生物、真菌、酵母(包括但不限干,酿酒酵母)、动物(包括但不限于,哺乳动物、昆虫、节肢动物等)等。具有本发明的翻译组件的细胞组合物也为本发明的特征。有关筛选一种物种中的Ο-tRNA和/或O-RS供另一物种使用,也參看名称为“Expanding the Eukaryotic Genetic Code” 的 USSN 10/825,867。 为了在宿主细胞中表达具有所选氨基酸的所关注的多肽,可将编码所关注的多肽的聚核苷酸亚克隆到表达载体中,所述表达载体含有用于指导转录的启动子、转录/翻译終止子,且如果针对编码蛋白质的核酸,那么还含有用于翻译起始的核糖体结合位点。适当的细菌启动子已为所属领域众所周知并且描述于(例如)Sambrook等人和Ausubel等人中。表达所关注的多肽的细菌表达系统可用于(包括但不限干)大肠杆菌、枯草杆菌(Bacillus sp.)、突光假单胞菌、铜绿假单胞菌、恶臭假单胞菌和沙门氏菌(Salmonella)中(Palva 等人,Gene 22:229-235(1983) ;Mosbach 等人,Nature 302:543-545 (1983))。所述表达系统的试剂盒在市面有售。哺乳动物细胞、酵母和昆虫细胞的真核表达系统已为所属领域技术人员众所周知且也在市面有售。可将本发明的tRNA和/或RS和/或所关注的多肽用于多种适当的表达系统(例如包括,酵母、昆虫細胞、哺乳动物細胞和细菌冲和/或在所述系统中表达。有关例示性表达系统的描述将于下文中提供。璧里如本文所使用,术语“酵母”包括能够表达所关注的多肽的多种酵母中的任ー种。所述酵母包括(但不限于)产子囊(ascosporogenous)酵母(内孢霉目(Endomycetales ))λ产担抱子(basidiosporogenous)酵母和属于半知菌类(芽抱纲(Blastomycetes))的酵母。产子囊酵母分为两个家族,即蚀精霉科(Spermophthoraceae)和酵母科(Saccharomycetaceae )。酵母科是由四个亚家族构成,即裂埴酵母亚科(Schizosaccharomycoideae)(例如,裂通酵母属(genus Schizosaccharomyces))Λ拿逊酵母亚科(Nadsonioideae)、油脂酵母亚科(Lipomycoideae)和酵母菌亚科(Saccharomycoideae)(例如,毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)和酵母菌属(Saccharomyce))。产担孢子酵母包括白冬孢酵母属(Leucosporidium)、红冬孢酵母属(Rhodosporidium)、锁掷抱酵母属(Sporidiobolus)、线黑粉酵母属(Filobasidium)和拟线黑粉酵母属(Filobasidiella)。属于半知菌类(芽孢纲)的酵母分为两个家族,即掷 (Bullera))和隐球酵母科(Cryptococcaceae)(例如假丝酵母属(Candid))。 用于本发明的特別值得关注的为毕赤酵母属、克鲁维酵母属、酵母菌属、裂殖酵母属、(Hansenula)、汉逊酵母属(Hansenula)、球拟酵母属(Torulopsis)和假丝酵母属(Candida)内的种,包括(但不限于)巴氏毕赤酵母(P. pastoris)、季氏毕赤酵母(P. guiIlerimondii)、酿酒酵母(S. cerevisiae)、卡尔斯伯酵母(S. carlsbergensis)、糖化酵母(S. diastaticus)、道格拉斯酵母(S. douglasii)、克氏酵母(S. kluyveri)、诺氏酵母(S. norbensis)、卵形酵母(S. oviformis)、乳酸克鲁维斯酵母(K. Iactis)、脆壁克鲁维斯酵母(K. fragilis)、白假丝酵母(C. albicans)、麦芽假丝酵母(C. maltosa)和多形汉逊酵母(H.p0lymOTpha)。酵母一般可从各种来源得到,包括(但不限干)加州大学(Berkeley,CA)生物物理学和医学物理学系酵母基因储备中心(Yeast Genetic Stockしenter,Department of Biophysics and Medica丄 Physics,University of Californiaノ和美国典型微生物菌种保藏中心(American Type Culture Collection,“ATCC”)(Manassas, VA)。术语“酵母宿主”或“酵母宿主細胞”包括可用作重组载体或其它转移DNA的受体或已用作重组载体或其它转移DNA的受体的酵母。所述术语包括已接收重组载体或其它转移DNA的原始酵母宿主細胞的子代。应了解,由于存在偶发突变或有意突变,単一亲代細胞的子代的形态或基因组或总DNA补体可不必与原始亲本完全相同。与亲本足够相似以通过相关特性(诸如,编码所关注的多肽的核苷酸序列的存在)表征的亲本细胞子代包括在本定义所预期的子代中。已研发表达和转化载体(包括染色体外复制子或整合载体)以用于转化到许多酵母宿主中。举例来说,已研发针对下述的表达载体酿酒酵母(SikOTski等人,Genetics (1989) 122:19 ;Ito 等人,J.Bacteriol. (1983) 153:163 ;Hinnen 等人,Proc. Natl. Acad. Sci. USA (1978) 75:1929);白假丝酵母(Kurtz 等人,Mol. CELL.Biol. (1986)6:142);麦芽假丝酵母(Kunze 等人,J. BASIC MICROBIOL (1985)25:141);多形汉逊酵母(Gleeson 等人,J. Gen. Microbiol. (1986) 132:3459 ; Roggenkamp 等人,Mol. Genetics and genomics (1986) 202:302);脆壁克鲁维斯酵母(Das 等人,J.Bacteriol. (1984) 158:1165);乳酸克鲁维斯酵母(De Louvencourt 等人,J. Bacteriol.(1983) 154:737 ;Van den Berg 等人,Biotechnology (ny) (1990) 8:135);李氏毕赤酵母(Kunze 等人,J. Basic Microbiol. (1985)25:141);巴氏毕赤酵母(美国专利第 5,324,639号;第4,929,555 号;和第4,837,148 号;Cregg 等人,Mol. Cell. Biol. (1985) 5:3376);粟酒裂殖酵母(Beach等人,NATURE (1982) 300:706);和耶罗威亚解脂酵母((Y. lipolytics)、构巢曲霉(A. nidulans) (Balance 等人,BIOCHEM. BIOPHYS. RES. Commun. (1983) 112:284-89 ;Tilburn 等人,Gene (1983)26:205-221 ;和 Yelton 等人,Proc.Natl. Acad.SCI.USA(1984)81:1470-74);黑曲霉(A. niger) (Kelly 和 Hynes, EMBO J. (1985)4:475-479);木霉(T.reesia) (EP 0 244 234);和丝状真菌,诸如土壤真菌(Neurospora)、青霉属(PeniciIlium)、弯颈霉(Tolypocladium) (W091/00357)。酵母载体的控制序列已为所属领域技术人员所知并且包括(但不限干)来自下述基因的启动子区诸如醇脱氢酶(ADH)(EP O 284 044);烯醇化酶;葡糖激酶;葡萄糖-6-磷酸异构酶;甘油醛-3-磷酸脱氢酶(GAP或GAPDH);己糖激酶;磷酸果糖激酶;3_磷酸甘油 酸变位酶;和丙酮酸激酶(PyK) (EP O 329 203)。编码酸性磷酸酶的酵母PH05基因也可提供有用的启动子序列(Miyanohara 等人,PROC. Natl. Acad. Sci. USA(1983)80:1)。用于酵母宿主的其它适当的启动子序列可包括3-磷酸甘油酸激酶(Hitzeman等人,J. BI0L.Chem. (1980) 255:12073)和其它糖酵解酶(诸如丙酮酸脱羧酶、磷酸丙糖异构酶和磷酸葡萄糖异构酶)(Holland 等人,BIOCHEMISTRY(1978) 17:4900 ;Hess 等人,J. Adv. Enzyme Reg.(1969)7:149)的启动子。具有受生长条件所控制的其它转录优点的可诱导酵母启动子可包括醇脱氢酶2、异细胞色素C、酸性磷酸酶、金属硫蛋白、甘油醛-3-磷酸脱氢酶、与氮代谢相关的降解酶和负责麦芽糖和半乳糖利用的酶的启动子区。用于酵母表达的适当载体和启动子进ー步描述于EP O 073 657中。酵母增强子还可与酵母启动子合用。此外,合成启动子也可用作酵母启动子。举例来说,可将酵母启动子的上游活化序列(UAS)与另ー酵母启动子的转录活化区连接,从而产生合成杂合启动子。所述杂合启动子的实例包括连接到GAP转录活化区的ADH调控序列。參看美国专利第4,880,734号和第4,876,197号,其是以引用的方式并入本文中。杂合启动子的其它实例包括由ADH2、GAL4、GALlO或PH05基因的调控序列与糖酵解酶基因(诸如GAP或PyK)的转录活化区组成的启动子。參看EP O 164 556。此外,酵母启动子可包括具有结合酵母RNA聚合酶并且起始转录的能力的非酵母来源的天然存在的启动子。可组成部分酵母表达载体的其它控制元件包括(例如)来自GAPDH或烯醇化酶基因的终止子(Holland等人,J.BI0L. Chem. (1981)256:1385)。此外,2μ质粒来源的复制起点适用于酵母。用于酵母中的适当选择基因为存在于酵母质粒中的trpl基因。參看Tschumper 等人,Gene (1980) 10:157 ;Kingsman 等人,Gene (1979) 7:141。trpl 基因提供针对缺乏在色氨酸中生长的能力的酵母突变菌株的选择标记。类似地,Leu2缺陷型酵母菌株(ATCC 20, 622或38,626)通过具有Leu2基因的已知质粒补充。将外源DNA引入酵母宿主中的方法已为所属领域技术人员所知,并且通常包括(但不限干)原生质球的转化或经碱阳离子处理的完整酵母宿主细胞的转化。举例来说,酵母的转化可根据 Hsiao 等人,Proc. Natl. Acad. Sci. USA (1979) 76:3829 和 Van Solingen 等人,J. Bact. (1977) 130:946中所述的方法进行。然而,也可如Sambrook等人,MolecularCloningiA Lab. Manual (2001)中一般所述,使用将DNA引入细胞的其它方法,诸如细胞核注射、电穿孔或原生质体融合。随后可使用所属领域技术人员已知的标准技术培养酵母宿主细胞。在酵母宿主细胞中表达异源蛋白质的其它方法已为所属领域技术人员所知。一般參看美国专利公开案第20020055169号;美国专利第6,361,969号;第6,312,923 号;第 6,183,985 号;第 6,083,723 号;第 6,017,731 号;第 5,674,706 号;第5,629,203号;第5,602,034号;和第5,089,398号;美国再审专利第RE37, 343号和第 RE35, 749 号;PCT 公开专利申请案 WO 99/07862 ;W0 98/37208 ;和 WO 98/26080 ;欧洲专利申请案 EP O 946736 ;EP O 732 403 ;EP O 480 480 ;W0 90/10277 ;EP 0 340986 ;EP 0 329 203 ;EP 0 324274 ;和 EP 0 164 556。也參看 Gellissen 等人,AntonieVan Leeuwenhoek(1992)62(1-2) :79-93 ;Romanos 等人,Yeast(1992) 8(6) :423-488 ;Goedde I ,METHODS IN ENZYM0L0GY (1990) 185:3-7,各文献都是以引用的方式并入本文中。
在扩增阶段,酵母宿主菌株可使用所属领域技术人员已知的标准补料分批发酵方法在发酵罐中生长。所述发酵方法可用于说明特定酵母宿主的碳利用路径或表达控制模式的差异。举例来说,酵母菌属(Saccharomyces)酵母宿主的发酵可能需要单ー葡萄糖原料、复合氮源(例如,酪蛋白水解物)和多种维生素补充。相比之下,甲醇酵母巴氏毕赤酵母可能需要甘油、甲醇和痕量矿物原料,但仅简单铵(氮)盐以供最佳生长和表达。例如參看美国专利第 5, 324, 639 号;Elliott 等人,J. Protein Chem. (1990)9:95 ;和 Fieschko 等人,Biotech. Bioeng. (1987) 29:1113,各文献都是以引用的方式并入本文中。然而,所述发酵方法可具有与所使用的酵母宿主菌株无关的某些常见特征。举例来说,可在扩增阶段将限制生长的养分(通常为碳)加到发酵罐中以允许最大生长。此外,发酵方法一般使用经设计以含有足量的碳、氮、基础盐(basal salt)、磷和其它微量养分(维生素、痕量矿物和盐等)的发酵培养基。适用于毕赤酵母属的发酵培养基的实例描述于美国专利第5,324, 639号和第5,231,178号中,其是以引用的方式并入本文中。 感染杆状病毒的昆虫细胞术语“昆虫宿主”或“昆虫宿主细胞”是指可用作重组载体或其它转移DNA的受体或已用作重组载体或其它转移DNA的受体的昆虫。所述术语包括已经转染的原始昆虫宿主细胞的子代。应了解,由于存在偶发突变或有意突变,単一亲代细胞的子代的形态或基因组或总DNA补体可不必与原始亲本完全相同。与亲本足够相似以通过相关特性(诸如,编码所关注的多肽的核苷酸序列的存在)表征的亲本细胞的子代包括在本定义所预期的子代中。表达所关注的多肽的适当昆虫细胞的选择已为所属领域技术人员所知。数种昆虫物种已在所属领域中进行充分描述并且在市面有售,包括埃及斑蚊(Aedes aegypti)、家香(Bombyx mori)、黑腹果妮(Drosophila meIanogaster)、草地贪夜蛾(Spodopterafrugiperda)和粉纹夜蛾(Trichoplusia ni)。在选择供表达的昆虫宿主的过程中,适当的宿主可包括经证实尤其具有良好的分泌能力、低的蛋白水解活性和整体稳定性的宿主。昆虫一般可从各种来源得到,包括(但不限干)加州大学(Berkeley,CA)生物物理学和医学物理学系昆虫基因储备中心(Insect Genetic Stock Center, Department of Biophysicsand Medical Physics, University of California)和美国典型微生物菌种保藏中心(“ATCC”)(Manassas, VA)。一般说来,感染杆状病毒的昆虫表达系统的组件包括转移载体,通常为细菌质粒,其含有杆状病毒基因组的片段和插入欲表达的异源基因的便利限制性位点;具有与转移载体中的杆状病毒特异性片段同源的序列(这允许将异源基因同源重组到杆状病毒基因组中)的野生型杆状病毒;和适当的昆虫宿主细胞和生长培养基。用于构建载体、转染细胞、拣选斑块、使细胞在培养基中生长等的材料、方法和技术已为所属领域技术人员所知并且可使用描述这些技术的手册。将异源基因插入转移载体中后,将载体和野生型病毒基因组转染到昆虫宿主细胞中,其中载体与病毒基因组重组。表达经包装的重组病毒并且对重组斑块进行鉴别和纯化。用于杆状病毒/昆虫细胞表达系统的材料和方法是从(例如)Invitrogen Corp.(Carlsbad,CA)以试剂盒形式购得。这些技术一般为所属领域技术人员所知并且充分地描述于以弓I 用方式并入本文的 Summers and Smith, Texas Agricultural ExperimentStation Bulletin No. 1555 (1987)中。也參看 Richardson, 39 Methods in MolecularBiology: Baculovirus Expression Protocols (1995) ;ausubel 等人,current protocolsin molecular biology 16.9-16. 11(1994) ;king 和 Possee, The Baculovirus System:ALaboratory Guide(1992);矛ロ O’Reilly 等人,Baculovirus Expression Vectors:ALaboratory Manual(1992)。事实上,所属领域技术人员已知使用杆状病毒/昆虫细胞表达系统进行的各种异源蛋白质的制造。例如,參看美国专利第6,368,825号、第6,342,216号、第6,338,846号、第 6,261,805 号、第 6,245,528 号、第 6,225,060 号、第 6,183,987 号、第 6,168,932 号、第 6,126,944 号、第 6,096,304 号、第 6,013,433 号、第 5,965,393 号、第 5,939,285 号、第 5,891,676 号、第 5,871,986 号、第 5,861,279 号、第 5,858,368 号、第 5,843,733 号、第5,762,939 号、第 5,753,220 号、第 5,605,827 号、第 5,583,023 号、第 5,571,709 号、第5,516,657 号、第 5,290,686 号、WO 02/06305、WO 01/90390、WO 01/27301、W001/05956、WO 00/55345、WO 00/20032、WO 99/51721、WO 99/45130、WO 99/31257、WO 99/10515、WO 99/09193、WO 97/26332、WO 96/29400、WO 96/25496、WO 96/06161、WO 95/20672、WO 93/03173、WO 92/16619、WO 92/02628、WO 92/01801、WO 90/14428、WO 90/10078、WO90/02566、WO 90/02186,WO 90/01556、WO 89/01038,WO 89/01037、WO 88/07082,所述专利都是以引用的方式并入本文中。可用于杆状病毒/昆虫细胞表达系统的载体已为所属领域中所知并且包括(例如)自杆状病毒苜猜尺蠖(Autographacalifornica)核型多角体病毒(AcNPV)获得的昆虫表达和转移载体,其为非辅助依赖性病毒表达载体(helper-independent viral expressionvector)。源自这一系统的病毒表达载体通常使用强的病毒多角体蛋白基因启动子来驱动异源基因的表达。一般參看O’Reilly等人,Baculovirus Expression Vectors: ALaboratory Manual(1992)。在将外来基因插入杆状病毒基因组之前,通常将上述组件(包含启动子、前导序 列(视需要)、所关注的编码序列和转录终止序列)组装成中间移位构筑体(intermediatetransplacement construct)(转移载体)。中间移位构筑体通常保持在复制子中,诸如能够在宿主(诸如细菌)中稳定保持的染色体外元件(例如,质粒)。复制子将具有复制系统,因此使其能够保持在适当宿主中以供克隆和扩増。更具体地说,质粒可含有多角体蛋白聚腺苷酸化信号(Miller, Ann. Rev. Microbiol. (1988)42:177)和原核生物氨比西林(ampicillin)抗性(amp)基因和复制起点以在大肠杆菌中选择和繁埴。将外来基因引入AcNPV的ー种常用转移载体为pAc373。也已设计出许多所属领域技术人员已知的其它载体,包括(例如)PVL985,其将多角体蛋白起始密码子从ATG变为ATT并且在ATT下游32个碱基对处引入BamHI克隆位点。參看Luckow和Summers, VIROLOGY170:31(1989)。其它市售载体包括(例如)PBlueBac4. 5/V5_His、pBlueBacHis2、pMelBac、pBiueBac4. 5 (Invitrogen Corp. , Carlsbad, CA)。插入异源基因后,将转移载体和野生型杆状病毒基因组共转染到昆虫细胞宿主中。将异源DNA引入杆状病毒中所需位点中的方法已为所属领域所知。參看Summers和Smith, Texas Agricultural Experiment Station Bulletin No. 1555 (1987) ;Smith 等人,MOL. CELL. Biol. (1983) 3:2156 ;Luckow和 Summers, VIROLOGY(1989) 170:31。举例来说,可通过同源双交換重组插入到基因(诸如多角体蛋白基因)中;也可插入到工程设计于所需 杆状病毒基因中的限制性酶位点中。參看Miller等人,BIOESSAYS (1989) 11 (4) : 91。转染可通过电穿孔实现。參看Trotter和Wood, 39 Methods INMolecular Biology (1995) ;Mann 和 King, J. Gen. Virol. (1989)70:3501。 或者,可使用脂质体利用重组表达载体和杆状病毒转染昆虫细胞。例如參看Liebman等人,Biotechniques(1999)26(I) :36 ;Graves 等人,Biochemistry(1998) 37:6050 ;Nomura等人,J. Biol. Chem. (1998)273(22):13570 ;Schmidt 等人,Protein Expression andPurification(1998)12:323 ;SifTert 等人,Nature Genetics(1998)18:45 ;Tilkins 等A, Cell Biology :A Laboratory Handbookl45-154 (1998) ;Cai 等人,Protein Expressionand Purification(1997) 10:263 ;Dolphin 等人,Nature Genetics (1997) 17:491 ;Kost 等人,Gene (1997) 190:139 Jakobsson 等人,J. Biol. Chem. (1996)271:22203 ;Rowles 等人,J. Biol. Chem. (1996) 271 (37) : 22376 ;Reverey 等人,J. Biol. Chem.(1996)271(39) :23607-10 !Stanley 等人,J. Biol. Chem. (1995)270:4121 ;Sisk 等人,J.VIROL. (1994) 68 (2) : 766 ;和 Peng 等人,BIOTECHNIQUES (1993) 14 (2) : 274。市售脂质体包括(例如)Cellfectin 和 Lipofectin (Invitrogen, Corp.,Carlsbad, CA)。此外,还可使用憐酸I丐转染法。參看 Trotter 和 Wood, 39 Methods in Molecular Biology (1995);Kitts, NAR(1990) 18 (19):5667 ;和 Mann 和 King, J. Gen. Virol. (1989)70:3501。杆状病毒表达载体通常含有杆状病毒启动子。杆状病毒启动子是能够结合杆状病毒RNA聚合酶并且起始编码序列(例如,结构基因)下游(3’)转录成mRNA的任何DNA序列。启动子将具有通常放在接近编码序列5’端的转录起始区。所述转录起始区通常包括RNA聚合酶结合位点和转录起始位点。杆状病毒启动子也可具有称为增强子的第二域,如果存在,那么其通常在结构基因的远端。此外,表达可为经调控表达或组成性表达。在感染循环的后期大量转录的结构基因提供特别有用的启动子序列。实例包括从编码病毒多角体蛋白的基因(Friesen等人,The Regulation of Baculovirus GeneExpression,在 THE MOLECULAR Biology OF Baculoviruses (1986)中;EP 0 127 839 和 0155 476)和编码plO蛋白的基因(Vlak等人,J. Gen. Virol. (1988)69:765)得到的序列。将新近形成的杆状病毒表达载体包装于感染性重组杆状病毒中并且随后可通过所属领域技术人员已知的技术对所生长的斑块进行纯化。參看Miller等人,BIOESSAYS(1989) 11 (4):91 ;Summers 和 Smith, Texas Agricultural ExperimentStation Bulletin No. 1555(1987)。已研发出重组杆状病毒表达载体以感染到若干昆虫细胞中。举例来说,已研发出重组杆状病毒用于(尤其)埃及斑蚊(ATCC第CCL-125号)、家蚕(ATCC第CRL-8910号)、黑腹果蝇(ATCC第1963号)、草地贪夜蛾和粉纹夜蛾。參看Wright, Nature (1986) 321:718 ;Carbonell 等人,J. VIROL. (1985) 56:153 ;Smith 等人,Mol. Cell. Biol. (1983) 3:2156。一般參看Fraser等人,In Vitro Cell. Dev. Biol. (1989) 25:225。更具体来说,用于杆状病毒表达载体系统的细胞系通常包括(但不限于)Sf9 (草地贪夜蛾)(ATCC第CRL-1711号)、Sf21 (草地贪夜蛾)(Invitrogen Corp.,目录号 11497-013 (Carlsbad, CA))、Tri_368 (粉纹夜蛾)和 High-Five BTI-TN-5B1-4 (粉纹夜蛾)。细胞和培养基可为市售以用于在杆状病毒/表达中直接表达和融合表达异源多肽,并且细胞培养技术一般为所属领域技术人员所知。 大肠杆菌、假单胞菌属和其它原核生物所属领域技术人员已知细菌表达技木。多种载体可用于细菌宿主中。所述载体可以为单一拷贝或者低或高多拷贝载体。载体可用于克隆和/或表达。鉴于存在有关载体、许多载体市面有售以及甚至描述载体和其限制性图谱与特征的手册的大量文献,此处就不需要多加论述。众所周知,载体通常涉及允许选择的标记,这些标记可提供细胞毒性剂抗性、原养性或免疫性。通常,存在将提供不同特征的多种标记。细菌启动子是能够结合细菌RNA聚合酶并且起始编码序列(例如,结构基因)下游(3’)转录成mRNA的任何DNA序列。启动子将具有通常放在接近编码序列5’端的转录起始区。所述转录起始区通常包括RNA聚合酶结合位点和转录起始位点。细菌启动子也可具有称为操纵子的第二域,其可与开始RNA合成的相邻RNA聚合酶结合位点重叠。当基因阻遏蛋白可结合操纵子并且由此抑制特定基因的转录时,操纵子允许负调控(可诱导)转录。组成性表达可在不存在负调控元件(诸如操纵子)的情况下发生。此外,可通过基因活化蛋白结合序列(如果存在,则通常邻近(5’)RNA聚合酶结合序列)实现正调控。基因活化蛋白的实例为分解代谢物活化蛋白(CAP),其帮助起始大肠杆菌中Iac操纵子的转录[Raibaud等人,Annu. Rev. Genet. (1984) 18:173]。因此,调控表达可为正或负调控表达,由此增强或减弱转录。编码代谢路径酶的序列提供特别有用的启动子序列。实例包括自糖代谢酶获得的启动子序列,诸如,半乳糖、乳糖(lac) [Chang等人,NATURE(1977) 198:1056]和麦芽糖。其它实例包括自生物合成酶获得的启动子序列,诸如色氨酸(trp) [Goeddel等人,Nuc.ACIDS RES. (1980)8:4057 ;Yelverton 等人,Nucl. Acids Res. (1981)9:731 ;美国专利第4,738,921号;EP公开案第036 776号和第121 775号,其是以引用的方式并入本文中]ο β -半乳糖苷酶(bla)启动子系统[Weissmann (1981) “The cloning of interferonand other mistakes.,,In Interferon 3 (Ed. I. Gresser)λ PL[Shimatake 等人,Nature (1981) 292:128]和T5 [美国专利第4,689,406号,其是以引用的方式并入本文]启动子系统也提供有用的启动子序列。可使用强启动子(诸如Τ7启动子)以高水平诱导所关注的多肽。所述载体的实例已为所属领域技术人员所知并且包括来自Novagen的ρΕΤ29系列和W099/05297 (其是以引用的方式并入本文)中所述的pPOP载体。所述表达系统在不损害宿主细胞的活力或生长參数的情况下于宿主中产生高水平的多肽。PET19 (Novagen)为所属领域已知的另ー载体。此外,自然界中不存在的合成启动子也可充当细菌启动子。举例来说,可将ー种细菌或噬菌体启动子的转录活化序列与另ー种细菌或噬菌体启动子的操纵子序列连接,从而产生合成杂合启动子[美国专利第4,551,433号,其是以引用的方式并入本文中]。举例来说,tac启动子为由trp启动子与Iac操纵子序列构成的杂合trp-lac启动子,其受到 Iac 阻遏子调控[Amann 等人,Gene (1983) 25:167 ;de Boer 等人,Proc. Natl. Acad. Sci.(1983)80:21]。此外,细菌启动子可包括具有结合细菌 RNA聚合酶并且起始转录的能力的非细菌来源的天然存在启动子。也可将非细菌来源的天然存在的启动子与可相容的RNA聚合物偶联以使ー些基因在原核生物中高水平表达。噬菌体T7 RNA聚合酶/启动子系统为偶联启动子系统的实例[Studier 等人,J. Mol. BIOL. (1986) 189:113 ;Tabor 等人,Proc Natl.Acad. Sci. (1985)82:1074]。此外,杂合启动子也可由噬菌体启动子和大肠杆菌操纵子区构成(EP公开案第267 851号)。除起作用的启动子序列外,有效的核糖体结合位点对于原核生物中外来基因的表达也有用。在大肠杆菌中,核糖体结合位点被称为Shine-Dalgarno (SD)序列并且包括起始密码子(ATG)和位于起始密码子上游3-11个核苷酸处3-9个核苷酸长的序列[Shine等人,Nature (1975) 254:34]。认为SD序列通过SD序列与大肠杆菌16S rRNA的3’端之间的喊基配对来促进mRNA与核糖体的结合[Steitz等人“Genetic signals and nucleotidesequences in messenger RNA,,,In Biological Regulation and Development: GeneExpression (R. F. Goldberger编,1979)]。为表达具有弱核糖体结合位点的真核基因和原核達因[Sambrookせ人‘‘Expression of cloned genes in Escherichia coli,,,MolecularCloning:A Laboratory Manual, 1989]。术语“细菌宿主”或“细菌宿主细胞”是指可用作重组载体或其它转移DNA的受体或已用作重组载体或其它转移DNA的受体的细菌。所述术语包括已经转染的原始细菌宿主细胞的子代。应了解,由于存在偶发突变或有意突变,単一亲代细胞的子代的形态或基因组或总DNA补体可不必与原始亲本完全相同。与亲本足够相似以通过相关特性(诸如,编码所关注的多肽的核苷酸序列的存在)表征的亲本细胞的子代包括在本定义所预期的子代中。表达多肽的适当宿主细菌的选择已为所属领域技术人员所知。在选择供表达的细菌宿主的过程中,适当的宿主可包括经证实尤其具有良好的包涵体形成能力、低的蛋白水解活性和整体稳定性的宿主。细菌宿主一般可从各种来源得到,包括(但不限干)加州大学(Berkeley,CA)生物物理学和医学物理学系细菌基因储备中心和美国典型微生物菌种保藏中心(“ATCC”)(Manassas, VA)。エ业/药物发酵一般使用自K菌株获得的细菌(例如W3110)或自B菌株获得的细菌(例如,BL21)。由于这些菌株的生长參数众所周知并且相当稳定,故其特别有用。此外,这些菌株为非病原性菌株,出于安全和环境原因,其在商业上也极为重要。适当大肠杆菌宿主的其它实例包括(但不限干)菌株BL21、DH10B或其衍生物。在本发明方法的另ー个实施例中,大肠杆菌宿主为负蛋白酶菌株(protease minus strain),包括(但不限干)OMP-和L0N-。宿主细胞株可为假单胞菌属,包括(但不限干)荧光假单胞菌、铜绿假单胞菌和恶臭假单胞菌。已知荧光假单胞菌生物型1(称为菌株MBlOl)对于重组制造有用并且可用于治疗性蛋白质的制造过程中。假单胞菌表达系统的实例包括购自TheDow Chemical Company的系统作为宿主菌株(Midland, Ml,可在国际互联网dow. com上获得)。美国专利第4,755,465号和第4,859,600号(以引用的方式并入本文中)中描述假单胞菌菌株作为宿主细胞用于hGH制造的用途。在产生重组宿主细胞株(B卩,已将表达构筑体引入宿主细胞中并且将具有适当表达构筑体的宿主细胞分离)后,在适于制造所关注的多肽的条件下培养所述重组宿主细胞株。如所属领域技术人员显而易见,重组宿主细胞株的培养方法将视所利用的表达构筑体的性质和宿主细胞的身份而定。通常使用所属领域众所周知的方法来培养重组宿主菌株。重组宿主细胞通常是在含有可吸收的碳源、氮源和无机盐源并且视情况含有维生素、氨基酸、生长因子和所属领域技术人员已知的其它蛋白质培养补充物的液体培养基中培养。培养宿主细胞的液体培养基可视情况含有用于防止不需要的微生物生长的抗生素或抗真菌齐U,和/或用于选择含有表达载体的宿主细胞的化合物,包括(但不限干)抗生素。可以分批或连续方式培养重组宿主细胞,且以分批或连续方式进行细胞采集(在所关注的多肽在细胞内积累的情况中)或进行培养物上清液的采集。对于在原核宿主细胞 中制造来说,优选分批培养和细胞采集。诜择件密码子本发明的选择性密码子扩展蛋白质生物合成机器的遗传密码子框架。举例来说,选择性密码子包括(例如)独特的三碱基密码子;无义密码子,诸如终止密码子,包括(但不限干)琥珀密码子(UAG)、赭石密码子或蛋白石密码子(UGA);非天然密码子;四碱基(或更多碱基)密码子;稀有密码子等。可将多个(例如ー个或ー个以上、两个或两个以上、三个或三个以上等)选择性密码子引入所需基因或多肽中。在一个实施例中,所述方法涉及使用为终止密码子的选择性密码子以在活体内并入所选氨基酸(例如,非天然氨基酸)。举例来说,制造识别终止密码子并且通过O-RS用所选氨基酸氨酰基化的Ο-tRNA。天然存在的宿主氨酰基tRNA合成酶不识别所述Ο-tRNA。可使用常规定点诱变将終止密码子引入所关注的多肽中的所关注的位点处。例如參看 Sayers, J. R.等人(1988), 5 ' -3,Exonucleases in phosphorotnioate—basedoligonucleotide-directed mutaRenesis. Nucleic Acids Res. 16:791-802。当例如在活体内将0-RS、Ο-tRNA和编码所关注的多肽的核酸组合吋,响应终止密码子而并入所选氨基酸从而得到在特定位置处含有所选氨基酸(例如,非天然氨基酸)的多肽。在本发明的ー个实施例中,用作选择性密码子的终止密码子为琥珀密码子UAG和/或蛋白石密码子UGA。举例来说,有关识别琥珀密码子的Ο-tRNA的实例參看SEQ ID NO. :6,并且有关识别蛋白石密码子的Ο-tRNA的实例參看SEQ ID NO. :7。将UAG和UGA用作选择性密码子的遗传密码可在保留赭石无义密码子UAA (其为最丰富的終止信号)的同时编码22个氨基酸。在活体内并入所选氨基酸(例如,非天然氨基酸)可在不显著干扰宿主细胞的情况下进行。举例来说,在非真核细胞(诸如大肠杆菌)中,由于UAG密码子的抑制效率视0-tRNA(例如,琥珀抑制性tRNA)与释放因子I (RFl)(其与UAG密码子结合并且起始正在生长的肽从核糖体释放)之间的竞争而定,故所述抑制效率可(例如)通过增加Ο-tRNA (例如,抑制性tRNA)的表达水平或使用RFl缺陷型菌株来加以调节。在真核细胞中,由于UAG密码子的抑制效率视Ο-tRNA (例如,琥珀抑制性tRNA)与真核释放因子(例如,eRF)(其结合终止密码子并且起始正在生长的肽从核糖体释放)之间的竞争而定,故所述抑制效率可(例如)通过增加Ο-tRNA (例如,抑制性tRNA)的表达水平来加以调节。非天然氨基酸也可用稀有密码子来编码。举例来说,当活体外蛋白质合成反应中精氨酸的浓度降低吋,经证实,稀有的精氨酸密码子AGG对于通过经丙氨酸酰基化的合成tRNA插入Ala有效。例如参看Ma等人,Biochemistry, 32:7939(1993)。在这一情况中,合成tRNA与在大肠杆菌中作为少量物质存在的天然存在的tRNAArg竞争。ー些有机体不使用所有三联体密码子。已将藤黄微球菌(Micrococcus Iuteus)中的未指定密码子AGA用于在活体外转录/翻译提取物中插入氨基酸。例如參看Kowal和Oliver, Nucl. Acid.Res. .25:4685(1997)。可产生本发明的组件以在活体内使用这些稀有密码子。选择性密码子也包含扩充的密码子,例如四个或四个以上碱基的密码子,诸如四 碱基密码子、五碱基密码子、六碱基密码子或更多个碱基的密码子。四碱基密码子的实例包括(但不限于)AGGA, CUAG, UAGA, CCCU等。五碱基密码子的实例包括(但不限于)AGGAC,CCCCU、CCCUC、CUAGA, CUACU、UAGGC等。特征可包括基于移码抑制使用扩充的密码子。四个或四个以上碱基的密码子可将(例如)一个或多个所选氨基酸(包括但不限于,非天然氨基酸)插入同一蛋白质中。举例来说,在存在具有反密码子环、例如具有CU(X)nXXXAA序列(其中n=l)的突变Ο-tRNA (例如,特定移码抑制性tRNA)的情况下,将四个或四个以上碱基的密码子读作单ー氨基酸。举例来说,有关识别四碱基密码子的Ο-tRNA參看PCT/US04/22061的SEQ ID NO. :6、12。在其它实施例中,反密码子环可解码(例如)至少四碱基密码子、至少五碱基密码子或至少六碱基密码子或更多碱基的密码子。由于存在256个可能的四碱基密码子,故可在同一细胞中使用四个或四个以上碱基的密码子编码多个非天然氨基酸。參看 Anderson 等人,(2002) Exploring the Limits of Codon and AnticodonSize, Chemistry and BioIory,9:237-244 MaRliery, (2001) Expanding the GeneticCode:Selection of Efficient Suppressors of Four-base Codons and Identiiicationof ^Shifty Four-base Codons with a Library Approach in Eschericma coil,J. Mol.Biol.307:755-769o举例来说,已使用四碱基密码子使用活体外生物合成方法将非天然氨基酸并入蛋白质中。例如參看 Ma 等人,(1993) Biochemistry, 32:7939 :和 Hohsaka 等人,(1999) .1. Am.Chem. Soc. 121:34。使用CGGG和AGGU利用两个以化学方式酰基化的移码抑制性tRNA在活体外将2-萘基丙氨酸和赖氨酸的NBD衍生物同时并入抗生蛋白链菌素中。例如參看Hohsaka等人,(1999) .1. Am. Chem. Soc, 121:12194。在活体内研究中,Moore等人检查具有NCUA反密码子的tRNALeu衍生物抑制UAGN密码子(N可为U、A、G或C)的能力,并且发现四联体UAGA可以通过具有UCUA反密码子的tRNALeu以13%到26%的效率解码且在O或-1框内极少解码。參看Moore等人,(2000)1. Mol. Biol, 298:195。在一个实施例中,可将基于稀有密码子或无义密码子的扩充的密码子用于本发明中,其可减少错义通读和其它不合需要的位点处的移码抑制。对于指定系统来说,选择性密码子也可包括ー个天然三碱基密码子,其中内源系统不使用(或极少使用)天然碱基密码子。举例来说,这包括缺乏识别天然三碱基密码子的tRNA的系统和/或三碱基密码子为稀有密码子的系统。选择性密码子视情况包括非天然碱基对。这些非天然碱基对使现有的遗传代码进ー步扩展。ー种额外的碱基对使三联体密码子的数量从64増加到125。第三碱基对的特性包括稳定且具选择性的碱基配对、通过聚合酶以高保真度有效酶促并入DNA中和合成新的非天然碱基对之后有效的持续引物延伸。可用于方法和组合物的非天然碱基对的描述包括(例如)Hirao %=人,(2002)An unnatural base pair for incorporating amino acidanalogues into protein. Nature Biotechnology, 20:177-182。还参看Wu, Y.等人,(2002)T. Am. Chem. Soc. 124:14626-14630。其它相关公开案列于下文中。对于活体内使用来说,非天然核苷可渗透膜并且磷酸化形成相应的三磷酸盐。此外,増加的遗传信息稳定并且不被细胞酶所破坏。Benner和其它人先前的工作利用不同于规范Watson-Crick配对的氢键模式,最值得关注的实例为iso_C: iso_G配对。例如參看 Switzer 等人,(1989) T. Am. Chem. Soc, 111:8322 ;和 Piccirilli 等人,(1990)Nature, 343:33 Kool, (2000) Curr. Opin. Chem. Biol. , 4:602。一般说来,这些喊基以某种程度与天然碱基错配并且无法酶促复制。Kool和同事证实,碱基之间的疏水堆积相互作用可替代氢键以驱动碱基对的形成。參看Kool, (2000)Curr. Opin. Chem. Biol. 4:602 :和Guckian 和 Kool, (1998) Angew. Chem. Int. Ed. Engl, 36, 2825。在研发满足所有上述需求的 非天然碱基对的工作中,Schultz、Romesberg和同事已系统地合成一系列非天然疏水碱基并且对其进行研究。已发现,PICS:PICS自身配对比天然碱基对稳定,并且能够通过大肠杆菌DNA聚合酶I的Klenow片段(KF)有效地并入DNA中。例如參看McMinn等人,(1999)T. Am. Chem. Soc. 121:11585—6 ;和Ogawa等人,(2000) T. Am. Chem. Soc. 122:3274。3MN:3MN 自身配对可通过KF以足以用于生物功能的效率和选择性合成。例如參看Ogawa等人,(2000)J. Am. Chem. Soc, 122:8803。然而,两种碱基都充当用于进ー步复制的链终止子。近来已开发出可用于复制PICS自身配对的突变体DNA聚合酶。此外,可复制7AI自身配对。例如參看Tae等人,(2001) .1. Am. Chem. Soc, 123:7439。也已开发出新颖的金属碱基对Dipic: Py,其在结合 Cu(II)后形成稳定的配对。參看 Meggers 等人,(2000) .1. Am. Chem. Soc, 122:10714。由于扩充的密码子和非天然密码子内在地与天然密码子正交,故本发明的方法可利用这ー特性产生正交tRNA供其使用。也可使用翻译旁路系统将所选氨基酸(例如,非天然氨基酸)并入所需多肽中。在翻译旁路系统中,将较大序列插入基因中但并不被翻译成蛋白质。所述序列含有充当诱导核糖体越过所述序列并且在插入下游重新开始翻译的线索的结构。经选择目.非天然的氨基酸如本文所使用,所选氨基酸是指任何所需的天然存在的氨基酸或非天然氨基酸。天然存在的氨基酸包括二十种遗传编码的α-氨基酸中的任ー种丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。在一个实施例中,将所选氨基酸以高保真度(例如)以对指定的选择性密码子大于约70%的效率、对指定的选择性密码子大于75%的效率、对指定的选择性密码子大于约80%的效率、对指定的选择性密码子大于约85%的效率、对指定的选择性密码子大于约90%的效率、对指定的选择性密码子大于约95%的效率或对指定的选择性密码子大于约99%或更高的效率并入正在生长的多肽链中。如本文所使用,非天然氨基酸是指任何氨基酸、经修饰氨基酸或除硒代半胱氨酸和/或吡咯赖氨酸和以下二十种遗传编码的α-氨基酸外的氨基酸类似物丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。α -氨基酸的通用结构如式I中所示
权利要求
1.一种组合物,其具有tRNA,前述tRNA或其部分是由SEQ ID NO: 1、3中所述的聚核苷酸序列或其互补聚核苷酸序列编码。
2.根据权利要求I所述的组合物,其中所述tRNA经氨酰基化。
3.根据权利要求2所述的组合物,其中所述tRNA经非天然编码的氨基酸氨酰基化。
4.根据权利要求3所述的组合物,其中所述非天然编码的氨基酸为对乙酰基苯丙氨酸。
5.根据权利要求2所述的组合物,其中所述tRNA以化学方式经氨酰基化。
6.根据权利要求2所述的组合物,其中所述tRNA以酶方式经氨酰基化。
7.根据权利要求6所述的组合物,其中所述tRNA经tRNA合成酶(RS)或经核糖体以酶方式氨酰基化。
8.根据权利要求I所述的组合物,其另外包含tRNA合成酶(RS),其中所述tRNA经氨基酸氨酰基化。
9.根据权利要求8所述的组合物,其中所述氨基酸为非天然编码的氨基酸。
10.根据权利要求9所述的组合物,其中所述非天然编码的氨基酸为对乙酰基苯丙氨酸。
11.根据权利要求I所述的组合物,其中所述tRNA自古细菌tRNA得到。
12.根据权利要求I所述的组合物,其中所述tRNA自詹氏甲烧球菌(M.janneschii)得到。
13.根据权利要求I所述的组合物,其另外包含翻译系统。
14.根据权利要求13所述的组合物,其中所述翻译系统为无细胞翻译系统。
15.根据权利要求13所述的组合物,其中所述翻译系统为细胞溶解产物。
16.根据权利要求13所述的组合物,其中所述翻译系统为重建的系统。
17.根据权利要求13所述的组合物,其中所述翻译系统为细胞翻译系统。
18.一种细胞,其包含翻译系统,其中所述翻译系统包含权利要求I的tRNA。
19.根据权利要求18所述的细胞,其中所述细胞是真核细胞。
20.根据权利要求19所述的细胞,其中所述真核细胞是酵母细胞、真菌细胞、哺乳动物细胞、昆虫细胞或植物细胞。
21.根据权利要求18所述的细胞,其中所述细胞是非真核细胞。
22.根据权利要求21所述的细胞,其中所述非真核细胞是大肠杆菌(E.coli)细胞。
23.根据权利要求18所述的细胞,其另外包含编码所关注的多肽的聚核苷酸,其中所述聚核苷酸包含由所述tRNA识别的选择性密码子。
24.根据权利要求23所述的细胞,其中所述所关注的多肽为人生长激素。
25.一种细胞,其包含权利要求I的tRNA :其中所述细胞是大肠杆菌细胞、酵母细胞、真菌细胞、哺乳动物细胞、昆虫细胞或植物细胞。
26.—种载体,其具有tRNA,所述tRNA或其部分是由SEQ ID NO: 1、3中所述的聚核苷酸序列或其互补聚核苷酸序列编码。
27.根据权利要求26所述的载体,其中所述载体包含质粒或病毒。
28.根据权利要求27所述的载体,其中所述载体包含柯斯质粒(cosmid)或噬菌体。
29.根据权利要求26所述的载体,其中所述载体为表达载体。
30.一种细胞,其包含权利要求26的载体。
31.一种在细胞中制造在特定位置处具有所选氨基酸的多肽的方法,所述方法包含 使所述细胞在适当培养基中生长,其中所述细胞包含核酸,所述核酸包含至少一个选择性密码子并且编码多肽;和提供所述所选氨基酸; 其中所述细胞另外具有 正交tRNA (O-tRNA),其在所述细胞中起作用并且识别具有选自由SEQ ID NO:l、3、其互补聚核苷酸序列编码的序列组成的群组的核酸序列的选择性密码子;和 正交氨酰基tRNA合成酶(0-RS),其中所述O-RS利用所述所选氨基酸使所述0-tRNA氨酰基化。
32.根据权利要求31所述的方法,其中所述所选氨基酸为对乙酰基苯丙氨酸。
33.根据权利要求31所述的方法,其中所述多肽为人生长激素。
全文摘要
本发明提供制造蛋白质生物合成机器的组件的组合物和方法,所述组合物和方法包括正交tRNA、正交氨酰基tRNA合成酶和正交tRNA/合成酶对。本发明还提供鉴别这些正交对的方法以及使用这些正交对制造蛋白质的方法。
文档编号C12N15/63GK102703446SQ201210175059
公开日2012年10月3日 申请日期2005年12月1日 优先权日2005年8月18日
发明者芬·蒂昂 申请人:Ambrx公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1