tRNA组合物和其用途的制作方法

文档序号:440860阅读:1435来源:国知局

专利名称::tRNA组合物和其用途的制作方法
技术领域
:本发明涉及翻译生物化学领域。本发明涉及制造tRNA的方法和tRNA组合物以及其用途。本发明还涉及使用所述tRNA和相关组合物在细胞中制造蛋白质的方法。
背景技术
:从细菌到人类,每一种已知有机体的遗传密码都编码相同的二十种常见氨基酸。这二十种相同天然氨基酸的不同组合形成进行几乎所有生命复杂过程(从光合作用到信号转导和免疫反应)的蛋白质。为研究和改变蛋白质结构和功能,科学家们已尝试操纵蛋白质的遗传密码和氨基酸序列。然而,难以去除由遗传密码所强加的将蛋白质局限于二十种遗传编码的标准结构单元(buildingblock)(其中极少见的特例为,硒代半胱氨酸(selenocysteine)(<列J(口参看A.Bock等人,(1991),MolecularMicrobiology5:515-20)和p比咯赖氨酸(pyrrolysine)(例如参看G.Srinivasan等人,(2002),Science296:1459-62))的约束。已取得一些进展来去除这些约束,但这一进展受到限制并且合理地控制蛋白质结构和功能的能力仍不成熟。举例来说,化学家们已开发出合成并且操纵小分子结构的方法和策略(例如参看E.J.Corey,&X,M.Cheng,TheLogicofChemicalSynthesis(Wiley-Interscience,NewYork,1995))。全合成(例如参看B.Merrifield,(1986),Science232:341-7(1986))和半合成方法(例如参看D.Y.Jackson等人,(1994)Science266:243-7;和P.E.Dawson,&S.B.Kent,(2000),AnnualReviewofBiochemistry69:923-60)使得合成肽和小蛋白质成为可能,但这些方法限制了10千道尔顿(kiloDalton,kDa)以上蛋白质的效用。诱变方法尽管有效,但也局限于有限数量的结构改变。在多种情况中,在整个蛋白质中竟争性并入常见氨基酸的结构极其接近的类似物已成为可能。例如参看R.Furter,(1998),ProteinScience7:419-26;K.Kirshenbaum等人,(2002),ChemBioChem3:235-7;和V.Doring等人,(2001),Science292:501-4。化学肽连接和天然化学连接描述于美国专利第6,184,344号、美国专利公开案第2004/0138412号、美国专利公开案第2003/0208046号、WO02/098902和WO03/04223中,这些专利都是以引用的方式并入本文中。Lu等人于MolCell.2001Oct;8(4):759-69中描述一种以化学方式将蛋白质与含有非天然氨基酸的合成肽连接的方法(称为蛋白质连接)。早期的工作证实,大肠杆菌(£.co/O的翻译机器将容纳结构与常见二十种氨基酸类似的氨基酸。参看Hortin,G.和Boime,I.(1983)MethodsE歸mol.96:777-784。通过放宽内源性大肠杆菌合成酶的特异性从而使其活化非天然氨基酸以及其同类天然氨基酸,使这项工作得以进一步扩充。此外,经证实,也可以使用编辑域的突变来扩充内源性合成酶的底物范围。参看Doring,V.等人,(2001)Science292:501-504。然而,这些策略局限于重新编码遗传密码而非扩展遗传密码,并且产生非天然氨基酸对常见二十种氨基酸中的一种的不同程度的取代。随后证实,可通过将以化学方式氨酰基化的正交琥珀抑制性tRNA加到活体外转录/翻译反应中而在活体外将非天然氨基酸位点特异性地并入蛋白质中。例如参看Noren,C.J.等人(1989)Science244:182-188;Bain,J.D.等人,(1989)J.Am.Chem.Soc.111:8013-8014;Dougherty,D.A.(2000)Curr.Opin.Chem.Biol.4,645-652;Cornish,V.W.等人(1995)Aneew.Chem.Int.Ed.34:621-633;J.A.Ellman等人,(1992),Science255:197-200;和D.Mendel等人,(1995),AnnualReviewofBiophysicsandBiomolecularStructure24:435-462。这些研究表明,核糖体和翻译因子可与大量非天然氨基酸、甚至具有不常见结构的氨基酸相容。不幸的是,tRNA的化学氨酰基化很难,并且这种方法的化学计量特性极大限制了能够产生的蛋白质的量。已将非天然氨基酸显微注射到细胞中。举例来说,通过显微注射以化学方式错酰基化的嗜热四膜虫(Tetrahymenathermophila)tRNA(例如,M.E.Saks等人(1996),爿"/roto>wsM/7pms^z'0",J.Biol.Chem.271:23169-23175)和相关mRNA而将非天然氨基酸引入爪蟾卵母细胞(Xenopusoocyte)中的烟碱型乙酰胆碱受体中(例如,M.W.Nowak等人(1998),/"v/vofwcor/ora"cmtm福wra/歸/"o/wto/owc/zflfw"s,"Xe"o/附ooc,ex/my57'o"MethodEnzymol.293:504-529)。还参看D.A.Dougherty(2000),t/朋她m/"c/tfeow;ra6e51o/;ra/W"/ww"/ow,Curr.Opin.Chem.Biol.4:645-652和M.W.Nowak,P.C.Kearney,J.R.Sampson,M.E.Saks,C.G.Labarca,S.K.Silverman,W.G.Zhong,J.Thorson,J.N.Abelson,N.Davidson,P.G.Schultz,D.A.Dougherty和H.A.Lester,Science,268:439(1995)。将爪蟾卯母细胞与活体外制得的以下两种RNA物质共注射编码在所关注的氨基酸位置处具有UAG终止密码子的靶蛋白的mRNA,和经所需非天然氨基酸氨酰基化的琥珀抑制性tRNA。随后所述卵母细胞的翻译机器将非天然氨基酸插入UAG指定的位置处。不幸的是,这种方法局限于细胞中可进行显微注射的蛋白质,并且由于相关tRNA是在活体外以化学方式酰基化并且无法再酰基化,故蛋白质的产率极低。为克服这些缺点,将新颖组件(例如,正交tRNA、正交氨酰基tRNA合成酶和正交tRNA/正交氛酰基tRNA合成酶对)加到原核生物大肠杆菌(E^c/^n'c/z/aco//,五.co/z')(例如参看L.Wang等人,(2001),Science292:498-500)和真核生物酿酒酵母(Sacc/jra附少cesc,v/57'a,51.cwi^z'ae)(例如J.Chin等人,Science301:964-7(2003))的蛋白质生物合成机器中,所述蛋白质生物合成机器能够在活体内将非遗传编码的氨基酸并入蛋白质中。已使用这种方法响应(例如)琥珀密码子(TAG)以高保真度将多种具有新颖化学、物理或生物特性的新颖氨基酸有效地并入大肠杆菌和酵母中的蛋白质中,所述新颖氨基酸包括光亲和标记和光致异构化氨基酸、光交联氨基酸(例如参看Chin,J.W.等人(2002)Proc.Natl.Acad.Sci.U.S.A.99:11020-11024;和Chin,J.W.等人,(2002)J.Am.Chem.Soc.124:9026-9027)、酮基氨基酸(例如参看Wang,L.等人,(2003)Proc.Natl.Acad.Sci.U.S.A.100:56-61和Zhang,Z.等人,5/oc/e附.42(22):6735-6746(2003))、含有重原子的氨基酸和糖基化氨基酸。例如参看J.W.Chin,&P.G.Schultz,(2002),ChemBioChem3(11):1135-1137和L.Wang,&P.G.Schultz,(2002),Chem.Comm.,1:1-11。已报导若千其它正交对。已针对大肠杆菌中非天然氨基酸并入的可能性描述自酿酒酵母tRNA和合成酶获得的谷氨酰胺酰基(例如参看Liu,D.R.和Schultz,P.G.(1999)Proc.Natl.Acad.Sci.U.S.A.96:4780-4785)、天冬氨酰基(例如参看Pastrnak,M.等人,(2000)Helv.Chim.Acta83:2277-2286)和酪氨酰基(例如参看Ohno,S.等人,(1998)J.Biochem.(Tokvo,Jpn.)124:1065-1068;和Kowal,A.K.等人,(2001)Proc.Natl.Acad.Sci.U.S.A.98:2268-2273)系统。也已描述自大肠杆菌谷氨酰胺酰基(例如参看Kowal,A.K.等人,(2001)Proc.Natl.Acad.Sci.U.S.A.98:2268-227)和酪氨酰基(例如参看Edwards,H.和Schimmel,P.(19卯)Mol.Cell.Biol.10:1633-1641)合成酶获得的系统以用于酿酒酵母中。已使用大肠杆菌酪氨酰基系统在活体内将3-碘-L-酪氨酸并入哺乳动物细胞中。参看Sakamoto,K.等人,(2002)NucleicAcidsRes.30:4692-4699。通常,这些系统都利用琥珀终止密码子。为进一步扩展遗传密码,需要开发生物合成机器(例如,tRNA)的经改进和/或额外组件。如在评估以下揭示内容后将显而易见,本发明满足这些要求和其它要求。
发明内容为扩展遗传密码,本发明提供制造正交tRNA的组合物和方法。氨酰基tRNA合成酶利用非天然编码的氨基酸使本发明的tRNA氨酰基化。可使用这些翻译组件响应tRNA所识别的选择性密码子将所选氨基酸并入正在生长的多肽链(在核酸翻译的过程中)的特定位置中。在细胞中制造在特定位置处具有所选氨基酸的蛋白质的方法也为本发明的特征。举例来说,一种方法包括在适当的培养基中使细胞生长,其中所述细胞包含包括至少一个选择性密码子并且编码蛋白质的核酸;和提供所选氨基酸。所述细胞另外包含正交tRNA(O-tRNA),其在细胞中起作用并且识别选择性密码子;和正交氨酰基tRNA合成酶(O-RS),其优先利用所选氨基酸使O-tRNA氨酰基化。通常,O-tRNA在存在同类合成酶的情况下包含抑制活性。由本方法制造的蛋白质也为本发明的特征。图1—绘示具有T>C茎干突变位点的J17tRNA的三叶草结构;图2—绘示使用J17或J17突变体(F12、F13、F14)进行的人生长激素中琥珀突变的抑制。通过SDSPAGE分析各样本的全细胞溶解产物;图3—绘示在不同细胞系中使用F13进行的人生长激素中琥珀突变的抑制。具体实施方式定义在详细描述本发明之前,应了解,本发明不限于特定生物系统,其当然可以变化。还应了解,本文所使用的术语只是出于描述特定实施例的目的,并且不打算限制仅受随附权利要求限制的本发明的范围。除非另作明确指示,否则如本文和随附权利要求中所使用,单数形式"一"和"所述"包括多个参考物。因此,例如提及"一细胞,,包括两个或两个以上细胞的组合并且包括所属领域技术人员已知的其等效物等。对"细菌,,的提及包括细菌的混合物等。除非本文和下文说明书的剩余部分中另作定义,否则本文所使用的所有科技术语都具有与本发明所属领域技术人员通常所了解相同的含义。本文所提及的所有公开案和专利都是以引用的方式并入本文中以达到描述和揭示(例如)所述公开案中所述的可能与当前所述的发明结合使用的构筑体和方法的目的。仅提供本文所讨论的公开案在本申请案申请日期之前的揭示内容。本文在任何方面都不应解释为承认本发明者无权由于现有发明或任何其它原因使所述揭示案的日期提前。同源:当蛋白质和/或蛋白质序列是天然或以人工方式从共同的祖先蛋白质或蛋白质序列得到时,其为"同源"的。类似地,当核酸和/或核酸序列是天然或以人工方式从共同的祖先核酸或核酸序列得到时,其为"同源"的。举例来说,可通过任何可用的诱变方法来修饰任何天然存在的核酸以使其包括一个或一个以上选择性密码子。当表达时,这一经诱变核酸将编码包含一个或一个以上所选氨基酸(例如,非天然氨基酸)的多肽。当然,突变方法可另外改变一个或一个以上标准密码子,借此也使所得突变蛋白质中的一个或一个以上标准氨基酸改变。可将所述一个或一个以上标准氨基酸变为非天然氨基酸或天然氨基酸。同源性一般是从两种或两种以上核酸或蛋白质(或其序列)之间的序列相似性推断得出。可用于确定同源性的序列之间相似性的确切百分比随所讨论的核酸和蛋白质而变化,但通常使用仅25%的序列相似性确定同源性。较高的序列相似性水平(例如,30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%,或99%以上)也可用于确定同源性。测定序列相似性百分比的方法(例如,使用默认参数的BLASTP和BLASTN)在本文中加以描述并且一般可用。正交:如本文所使用,术语"正交,,是指以降低的效率被所关注的系统(例如,翻译系统,例如细胞)使用的分子(例如,正交tRNA(O-tRNA)和/或正交氨酰基tRNA合成酶(O-RS))。正交是指正交tRNA和/或正交RS无法在所关注的翻译系统中起作用或以降低的效率(例如,低于20%的效率、低于10%的效率、低于5%的效率或例如低于1%的效率)在所关注的翻译系统中起作用。举例来说,当与通过内源性RS使内源性tRNA氨酰基化相比较时,所关注的翻译系统中的任何内源性RS以降低的效率或甚至为零的效率使所关注的翻译系统中的正交tRNA氨酰基化。在另一个实例中,当与通过内源性RS使内源性tRNA氨酰基化相比较时,正交RS以降低的效率或甚至为零的效率使所关注的翻译系统中的任何内源性tRNA氨酰基化。可将第二正交分子引入细胞中从而与第一正交分子一起作用。举例来说,正交tRNA/RS对包括所引入的在细胞中相对于相应内源性tRNA/RS对以一定效率(例如,约50%效率、约60%效率、约70%效率、约75%效率、约80%效率、约85%效率、约卯%效率、约95%效率或约99%或更高效率)一起作用的互补组件。"正交性的改进"是指与原材料或天然存在的tRNA或RS相比正交性增强。同类物:术语"同类物"是指一起作用的组件,例如tRNA和氨酰基tRNA合成酶。所述组件也可称为互补体。优先氨酰基化:术语"优先氨酰基化"是指与O-RS使天然存在的tRNA或用于产生O-tRNA的原材料氨酰基化相比,O-RS利用所选氨基酸(例如,非天然氨基酸)使O-tRNA氨酰基化的效率,例如约70%效率、约75%效率、约80%效率、约85%效率、约卯%效率、约95%效率或约99%或更高效率。随后将非天然氨基酸以高保真度(例如)以对指定选择性密码子大于约70%的效率、对指定选择性密码子大于约75%的效率、对指定选择性密码子大于约80%的效率、对指定选择性密码子大于约85%的效率、对指定选择性密码子大于约90%的效率、对指定选择性密码子大于约95%的效率或对指定选择性密码子大于约99%的效率并入正在生长的多肽链中。选择性密码子:术语"选择性密码子"是指在翻译过程中由O-tRNA识别且不被内源性tRNA识别的密码子。O-tRNA反密码子环识别mRNA上的选择性密码子并且在多肽中的这一位点并入其氨基酸,例如所选氨基酸,诸如非天然氨基酸。选择性密码子可例如包括(但不限于)无义密码子,诸如终止密码子,包括(但不限于)琥珀密码子、赭石密码子和蛋白石密码子;四个或四个以上碱基密码子;稀有密码子;自天然或非天然碱基对获得的密码子等。对于指定系统来说,选择性密码子也可以包括天然的三碱基密码子中的一种,其中内源性系统不使用(或极少使用)所述天然的三碱基密码子。举例来说,这包括缺乏识别天然的三碱基密码子的tRNA的系统,和/或天然的三碱基密码子为稀有密码子的系统。抑制性tRNA:抑制性tRNA是(例如)通过提供响应选择性密码子将氨基酸并入多肽链的机制来改变指定翻译系统中信使RNA(mRNA)的阅读的tRNA。举例来说,抑制性tRNA可通读包括(但不限于)终止密码子、四碱基密码子或稀有密码子的密码子。抑制活性:术语"抑制活性"是指tRNA(例如,抑制性tRNA)通读选择性密码子的能力。活性可以当与对照(例如缺乏同类合成酶)相比时所观察到的活性百分比表示。翻译系统:术语"翻译系统,,是指将天然存在的氨基酸并入正在生长的多肽链(蛋白质)所需的组件。翻译系统的组件可包括(例如)核糖体、tRNA、合成酶、mRNA等。本发明的组件可加到活体外或活体内翻译系统中。翻译系统的实例包括(但不限于)非真核细胞,例如细菌(诸如,大肠杆菌);真核细胞,例如酵母细胞、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞;无细胞翻译系统,例如细胞溶解产物等。翻译系统可为细胞翻i奪系统或无细胞翻译系统,且可为原核细胞或真核细胞翻译系统。细胞翻i奪系统包括(但不限于)所需核酸序列可转录成mRNA且所述mRNA可经翻译的全细胞制剂,诸如透性化细胞或细胞培养物。无细胞翻译系统可为市售,且众所周知许多不同的类型和系统。无细胞系统的实例包括(但不限于)原核生物溶解产物(诸如大肠杆菌溶解产物)和真核生物溶解产物(诸如麦芽提取物)、昆虫细胞溶解产物、兔网织红细胞溶解产物、兔卵母细胞溶解产物和人类细胞溶解产物。当所得蛋白质经糖基化、磷酸化或另外经修饰时,由于许多所述修饰仅可能在真核生物系统中,故可优选真核生物提取物或溶解产物。这些提取物和溶解产物中的一些可为市售(Promega;Madison,Wis.;Stratagene;LaJolla,Calif.;Amersham;ArlingtonHeights,111.;GIBCO/BRL;GrandIsland,N.Y.)。可用于翻译分泌型蛋白质的膜提取物(诸如含有微粒体膜的犬胰腺提取物)也可用。也可使用重建的翻译系统。也已成功地使用纯翻译因子的混合物将mRNA翻译成蛋白质以及溶解产物或补充有纯翻译因子的溶解产物的组合,所述纯翻译因子诸如起始因子-1(IF-l)、IF-2、IF-3(a或p)、延长因子T(EF-Tu)或终止因子。还可使无细胞系统与转录/翻i爭系统偶联,其中如Cwrre"r尸ra/oco/sZ"Mo/ea//ar历o/ogy(RM.Ausubel等人编,WileyInterscience,1993)(其是以引用的方式清楚地并入本文)中所述,将DNA引入所述系统中,转录成mRNA且翻译所述mRNA。在真核转录系统中转录的RNA可为异核RNA(hnRNA)或5'端帽子(7-甲基鸟苷)和3'端聚A尾成熟mRNA的形式,此可为某些翻译系统的优势。举例来说,在网织红细胞溶解系统中以高效率翻译经封端mRNA。所选氨基酸:术语"所选氨基酸"是指任何所需的天然存在的氨基酸或非天然氨基酸。如本文所使用,术语"非天然氨基酸"或"非天然编码的氨基酸"是指不为20种常见的天然存在的氨基酸中的一种或硒代半胱氨酸或吡咯赖氨酸的任何氨基酸、经修饰氨基酸和/或氨基酸类似物。可以与术语"非天然编码的氨基酸"和"非天然氨基酸(unnaturalaminoacid),,以相同意义4吏用的其它术语为"非天然氨基酸("non-naturalaminoacid")"、"非天然存在的氨基酸,,和其各种以连字符连接和不以连字符连接的型式。术语"非天然编码的氨基酸"还包括(但不限于)通过对天然编码的氨基酸(包括但不限于,20种常见氨基酸或吡咯赖氨酸和硒代半胱氨酸)进行修饰(例如,翻译后修饰)而产生但其本身未通过翻译复合物天然并入到正在生长的多肽链中的氨基酸。所述非天然存在的氨基酸的实例包括(但不限于)N-乙酰葡糖胺基-L-丝氨酸、N-乙酰葡糖胺基-L-苏氨酸和O-磷酸酪氨酸。自......获得:如本文所使用,术语"自......获得,,是指从特定分子或有机体分离或使用来自特定分子或有机体的信息制得的组件。阳性选择或筛选标记:如本文所使用,术语"阳性选择或筛选标记"是指当存在(例如,经表达、经活化等)时导致鉴别具有阳性选择标记的细胞与不具有阳性选择标记的细胞的标记。阴性选择或筛选标记:如本文所使用,术语"阴性选择或筛选标记"是指当存在(例如,经表达、经活化等)时允许鉴别不具有所需特性(例如,当与具有所需特性的细胞相比较时)的细胞的标记。报告基因:如本文所使用,术语"报告基因,,是指可用于选择所关注的系统中的靶组件的组件。举例来说,报告基因可包括蛋白质,例如赋予抗生素抗性或敏感性的酶(包括但不限于,(3-内酰胺酶、氯霉素乙酰转移酶(CAT)等)、焚光筛选标记(包括但不限于,绿色荧光蛋白质(例如GFP)、YFP、EGFP、RFP)、发光标记(包括但不限于,萤火虫荧光素酶蛋白)、基于亲和力的筛选标记或阳性或阴性选择标记基因(诸如lacZ、p-gal/lacZ(p-半乳糖苷酶)、ADH(醇脱氢酶)、his3、ura3、leu2、lys2等)。真核生物:如本文所使用,术语"真核生物"是指属于系统发育真核生物领域的有机体,诸如动物(包括但不限于,哺乳动物、昆虫、爬行动物、鸟类等)、纤毛虫、植物(包括但不限于,单子叶植物、双子叶植物、藻类等)、真菌、酵母、鞭毛虫、小孢子虫、原生生物等。非真核生物:如本文所使用,术语"非真核生物"是指非真核有机体。举例来说,非真核有机体可属于系统发育真细菌领域(包括但不限于,大肠杆菌、极端嗜热细菌(77iemm"/erwop/2//i^)、嗜热月旨肪芽孢杆菌(j5"c/〃mWearof/zermop/^7i^)、荧光假单胞菌(i^ei/ifomowawy/i/orescews)、铜纟录4艮单月包菌(i^ewt/owowasaerwg/"oyfl)、,恶臭JFi单月包菌(尸"wdowomw)等)或系统发育古细菌领域(例如詹氏曱烷球菌(Mw/w"ococcw;y_/a7wasc/7);嗜热自养曱烷杆菌(JW""/a"o6a"en'wwAer附oaw/Wra/)/z/c"w);嗜盐古菌(//a/o6acren'wm),-诸如沃氏嗜盐富饶菌(//a/o/emxvo/cam7)和嗜盐古菌NRC-1(//a/o6a"en'w附speciesiViC-J);闪烁古生3求菌(v4rc/aeog/oZ)Ms/"/g/dws);强,劲、火5求菌(尸戶cocc"51/w〃'osi^);掘越氏热球菌(户戸coccw);嗜热泉生古细菌(_perw/jc)等)。保守变异体:术语"保守变异体"是指在功能上与得到保守变异体的组件(例如O-tRNA或O-RS)类似但序列变异的翻译组件,例如保守变异体O-tRNA或保守变异体O-RS。举例来说,O-RS将利用所选氨基酸(例如,非天然氨基酸)使互补O-tRNA或保守变异体O-tRNA氨酰基化,但所述O-tRNA和所述保守变异体O-tRNA不具有相同序列。类似地,可通过互补O-RS或保守变异体O-RS利用所选氨基酸(例如,非天然氨基酸)使tRNA氨酰基化,但所述O-RS和所述保守变异体O-RS不具有相同序列。保守变异体的序列可具有(例如)一处变异、两处变异、三处变异、四处变异或五处或五处以上变异,只要保守变异体与相应O-tRNA或O-RS互补即可。选择或筛选剂:如本文所使用,术语"选择或筛选剂"是指当存在时允许从群体中选择/筛选某些组件的试剂。举例来说,选择或筛选剂例如包括(但不限于)养分、抗生素、光波长、抗体、经表达聚核苷酸等。选择剂的(例如)浓度、强度等可变化。术语"未有效识别,,是指来自一种有机体的RS使O-tRNA氨酰基化的效率(例如)小于约10%、小于约5%或小于约1%。适于制造包括一个或一个以上所选氨基酸(例如,非天然氨基酸)的蛋白质的翻译系统已描述于名称为"METHODSANDCOMPOSITIONFORTHEPRODUCTIONOFORTHOGONALtRNA-AMINOACYLtRNASYNTHETASEPAIRS"的美国专利申请案10/126,931和名称为"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS.,,的10/126,927中。此外,参看名称为"EXPANDINGTHEEUKARYOTICGENETICCODE"的USSN10/825,867。这些申请案的每一个都是以全文引用的方式并入本文。所述翻i奪系统一般包含包括正交tRNA(O-tRNA)、正交氨酰基tRNA合成酶(O-RS)和所选氨基酸(例如,非天然氨基酸)的细胞,其中O-RS利用所选氨基酸使O-tRNA氨酰基化。本发明的正交对由O-tRNA(例如,抑制性tRNA、移码tRNA等)和O-RS构成。O-tRNA识别第一选择性密码子并且在存在同类合成酶的情况下响应选择性密码子而具有抑制活性。细胞使用所述组件将所选氨基酸并入正在生长的多肽链中。举例来说,也可存在包含编码所关注的多肽的聚核苦酸的核酸,其中所述聚核苷酸包含由O-tRNA识别的选择性密码子。翻译系统也可以是活体外系统。本发明的tRNA分子可用于任何翻译系统中,包括在翻译中利用核糖体的系统。翻译系统也可为无细胞(活体外)翻译系统。在可包括mRNA作为模板(活体外翻译)或DNA作为模板(活体外转录与翻译的组合)的这些系统中,活体外合成是由核糖体指导。已将相当多的努力用于开发无细胞蛋白质表达系统中。例如参看Kim,D.M.禾口J.R.Swartz,5z'o&c/mo/ogyawJ5/oewg/ween.wg,74:309-316(2001);Kim,D.M.和J.R.Swartz,说她c/mo/ogy丄",eny,22,1537-1542,(2000);Kim,D.M.和J.R.Swartz,B/o&c/mo/ogy尸ragrew,16,385-390,(2000);Kim,D.M.禾口J.R.Swartz,5〖o&c/mo/ogy万/画g/廳"'wg,66,180-188,(1999);和Patnaik,R.和J.R.Swartz,飾/e由z々腦24,862-868,(1998);美国专利第6,337,191号;美国专利公开案第2002/0081660号;WO00/55353;WO卯/05785,所述专利文献都是以引用的方式并入本文。可应用的另一种方法包括mRNA-肽融合技术。例如参看R.Roberts和J.Szostak,户rac.Ato/^cad(T7&4)94:12297-12302(1997);A.Frankel等人,C/^附&^ycfe祝o/ogy10:1043-1050(2003)。以本方法,在核糖体上将与噤呤霉素连接的mRNA模板翻译成肽。如果已对一个或一个以上tRNA分子进行修饰,那么也可将非天然氨基酸并入肽中。阅读最后一个mRNA密码子后,噤呤霉素将俘获肽的C端。如果在活体外检定中发现所得mRNA-肽连结物具有引人关注的特性,那么可轻易地从mRNA序列揭示其身份。以此方式,可筛选包含一个或一个以上非天然编码的氨基酸的多肽的文库以鉴别具有所需特性的多肽。目前,据报导,以纯组件进行的活体外核糖体翻译将允许合成经非天然编码的氨基酸取代的肽。例如参看A.Forster等人,Prac.iVa"爿co^.Sc/.(77&i)100:6353(2003)。在某些实施例中,包含本发明的tRNA的大肠杆菌细胞包括所述翻译系统。举例来说,本发明的大肠杆菌细胞包括正交tRNA(O-tRNA),其中所述O-tRNA在存在同类合成酶的情况下响应选择性密码子而包含抑制活性;正交氨酰基tRNA合成酶(O-RS);所选氨基酸;和核酸,其包含编码所关注的多肽的聚核苷酸,其中所述聚核苷酸包含由O-tRNA识别的选择性密码子。本发明还在细胞中提供多个O-tRNA/0-RS对,其允许并入一个以上所选氨基酸。在某些实施例中,细胞可另外包括另一不同的O-tRNA/0-RS对和第二所选氨基酸,其中所述O-tRNA识别第二选择性密码子并且所述O-RS优先利用第二所选氨基酸使O-tRNA氨酰基化。举例来说,细胞可另外包含(例如)自詹氏曱烷球菌的酪氨酰基tRNA合成酶获得的琥珀抑制性tRNA-氨酰基tRNA合成酶对。O-tRNA和/或O-RS可天然存在或者可通过来自多种有机体的天然存在的tRNA和/或RS的突变(例如,其产生tRNA文库和/或RS文库)得到。举例来说,制造正交tRNA/氨酰基tRNA合成酶对的一种策略涉及将来自(例如)除宿主细胞外的其它来源或多种来源的异源tRNA/合成酶对输入宿主细胞中。异源合成酶候选物的特性包括(例如)其不负载任何宿主细胞tRNA,并且异源tRNA候选物的特性包括(例如)其不经任何宿主合成酶氨酰基化。此外,异源tRNA与所有宿主细胞合成酶正交。产生正交对的另一种策略涉及产生突变体文库以筛选和/或选择O-tRNA或O-RS。这些策略也可以组合。在各种实施例中,O-tRNA和O-RS是自至少一种有机体获得。在另一个实施例中,O-tRNA是自第一有机体的天然存在或突变的天然存在的tRNA获得,并且O-RS是自第二有机体的天然存在或突变的天然存在的RS获得。在一个实施例中,第一有机体与第二有机体不同。举例来说,正交对可包括自嗜热自养曱烷杆菌获得的tRNA合成酶和自古细菌tRNA(例如,自嗜盐古菌NRC-1)荻得的tRNA。或者,第一有机体与第二有机体相同。参看本文中标题为"来源和宿主有机体,,的章节以得到额外信息。在本发明的某些实施例中,本发明的O-tRNA包含如SEQIDNO.:1、2或3中所述的聚核苷酸序列或其互补聚核苷酸序列或其保守变异体,或由所述聚核苷酸序列或其互补聚核脊酸序列或其保守变异体编码。也参看本文中标题为"核酸和多肽序列和变异体"的章节。正交tRNA(O-tRNA)正交tRNA(O-tRNA)介导(例如)活体内或活体外将所选氨基酸并入由包含经O-tRNA识别的选择性密码子的聚核普酸编码的蛋白质。可通过任何方法或技术(包括但不限于,化学或酶促氨酰基化方法)利用所需氨基酸使本发明的O-tRNA氨酰基化。本发明的氨酰基化O-tRNA可直接加到翻译系统中。可在活体外或活体内利用所选氨基酸通过RS使本发明的O-tRNA氨酰基化。此外,RS可为O-RS。可将本发明的O-tRNA直接提供到翻i奪系统(例如,活体外翻译组件,或细胞)中,或通过提供编码O-tRNA或其部分的聚核普酸将其提供到翻译系统中。举例来说,O-tRNA或其部分是由如SEQIDNO.:l、2、3中所述的聚核苷酸序列或其互补聚核苷酸序列或其保守变异体编码。本发明的O-tRNA在存在同类合成酶的情况下响应选择性密码子而包含抑制活性。抑制活性可通过所属领域中已知的多种检定中的任一种来测定。举例来说,可使用P-半乳糖苷酶报告基因检定。使用在启动子控制下表达lacZ基因的质粒的衍生物,例如,其中lacZ的肽VVLQRRDWEN中的Leu-25经选择性密码子(例如,TAG、TGA、AGGA等密码子,或酪氨酸、丝氨酸、亮氨酸等的有义密码子(作为对照))置换。将衍生化的lacZ质粒以及包含本发明的O-tRNA的质粒引入来自适当有机体(例如,可使用正交组件的有机体)的细胞中。还可引入同类合成酶(当表达时作为编码同类合成酶的多肽或聚核苷酸)。使细胞在培养基中生长到所需密度(例如,达到约0.5的OD600),并且例如使用BetaFluorp-半乳糖苷酶检定试剂盒(Novagen)进行p-半乳糖苷酶检定。以样本相对于可比较对照(例如,由衍生化lacZ构筑体观察得到的值)的活性百分比计算抑制百分比,其中所述构筑体在所禽位置处具有相应的有义密码子而非选择性密码子。在tRNA分子中,胸腺嘧啶(T)经尿嘧啶(U)置换。此外,可存在对碱基的其它修饰。本发明还包括O-tRNA的保守变异体。举例来说,O-tRNA的保守变异体包括与O-tRNA功能类似并且保持tRNA的L形结构但不具有相同序列的分子(且为除野生型tRNA分子之外的分子)。也参看本文中标题为"核酸和多肽序列以及变异体"的章节。包含O-tRNA的组合物可另外包括正交氨酰基tRNA合成酶(O-RS),其中所述O-RS优先利用所选氨基酸(例如,非天然氨基酸)使O-tRNA氨酰基化。在某些实施例中,包括O-tRNA的组合物可另外包括翻译系统(例如,活体外或活体内翻译系统)。细胞或其它翻译系统中也可存在包含编码所关注的多肽的聚核苷酸的核酸,其中所述聚核苷酸包含一个或一个以上由O-tRNA识别的选择性密码子,或一个或一个以上所述密码子的组合。也参看本文中标题为"正交氨酰基tRNA合成酶(O-RS)"的章节。制造正交tRNA(O-tRNA)(例如,O-tRNA)的方法也为本发明的特征。由所迷方法制造的tRNA(例如,O-tRNA)也为本发明的特征。制造正交tRNA的方法包括使tRNA池中的每一tRNA的反密码子环突变以允许识别选择性密码子(例如,琥珀密码子、蛋白石密码子、四碱基密码子等),借此提供多个潜在的O-tRNA;并且分析所述多个潜在O-tRNA的成员的二级结构以鉴别二级结构中的非规范碱基对;且视情况使所述非规范碱基对突变(例如,使非规范碱基对突变为规范碱基对)。非规范碱基对可位于二级结构的茎干区中。O-tRNA可具有一种或一种以上特征或活性的改进(诸如与原材料(例如,多个tRNA序列)相比对于所需有机体的正交性的改进),而同时保持其对所需RS的亲和力。或者,可通过使已知tRNA突变以调节其与一个或一个以上影响翻译或作为翻译机器组件的分子的相互作用或与所述分子的结合亲和力来产生O-tRNA。所述组件包括(但不限于)延长因子。细菌延长因子EF-Tu对于蛋白质合成中的延长步骤起到关键作用。在tRNA合成酶使tRNA氨酰基化后,EF-Tu结合氨酰基化的tRNA并且将其带到核糖体的A位点。带电氨基酸与tRNA之间的酯键因EF-Tu与氨酰基化tRNA之间的结合而避免发生自发水解。Stortchevoi等人已对大肠杆菌起始tRNA舰et的T^/C茎千中的U50:G64摆动碱基对的突变体进行研究,这是因为已发现这一碱基对是在延长过程中阻断tRNA活性的二级负决定因子(secondarynegativedeterminant),推测这是由EF-Tu.GTP与氨酰基化tRNA之间减弱的相互作用引起(JBC2003278(20):17672-17679)。同样,LaRiviere等人于Science,2001年10月5日;294(5540):165-8中描述氨基酸和tRNA主体对与EF-Tu的总结合亲和力的热动力学贡献。其表明,tRNA主体和氨基酸的贡献彼此无关,并且当tRNA经正确酰基化时,所述tRNA主体与所述氨基酸彼此补偿。EF-Tu.GTP与经非天然氨基酸氨酰基化的tRNA之间相互作用的改变可能影响将tRNA负载到核糖体A位点的效率。也可以通过分析tRNA与翻译冲几器其它组件(诸如EF-Tu)的复合物的晶体结构来发现潜在的突变位点。举例来说,Nissen等人已指出,EF-Tu.GTP与酵母苯丙氨酰基转移RNA(Phe-tRNA)的TyC茎干的磷酸主链直接结合(Science1995270(5241):1464-1472)。所述方法;现情况包括分析tRNA和/或氨酰基tRNA合成酶的序列的同源性以确定似乎对于特定有机体正交的O-tRNA、O-RS和/或O-tRNA/O-RS对的潜在候选物。所属领域中已知并且本文描述的计算机程序可用于所述分析。在一个实例中,为选择用于原核有机体中的潜在正交翻译组件,选择不显示与原核有机体的异常同源性的合成酶和/或腦A。还可以通过一致性策略制造tRNA池。举例来说,通过比对多个tRNA序列;确定一致序列;并且使用所述一致序列的至少一部分、大部分或全部产生tRNA文库来制造tRNA池。举例来说,可用计算机程序(例如,GCG程序/z7ew/)来编译一致序列。视情况,将由所述程序所测定的简并位置变为所述位置处的最常见碱基。文库是通过所属领域中已知的技术使用一致序列合成。举例来说,可使用寡核苷酸的重叠延伸提供基于一致序列的文库,其中tRNA基因的各个位点可合成为卯%—致序列与10%其它三碱基混合物的掺杂混合物。也可以使用其它混合物,例如75%—致序列和25%其它三碱基混合物;80%—致序列和20%其它三碱基混合物;95%—致序列和5%其它三碱基混合物等。突变体tRNA文库可使用所属领域中已知的各种诱变技术产生。举例来说,可通过位点特异性突变、随机点突变、同源重组、DNA改组或其它递归式诱变方法、嵌合构建或其任何组合产生突变体tRNA。可将其它突变引入tRNA的所需环或区域(例如,反密码子环、受体茎干、D臂或环、可变环、Tv)/C臂或环、tRNA分子的其它区域或其组合)中的特定位置(例如,非保守性位置或保守性位置、随机位置或其组合)处。突变可包括在茎千区中相配的碱基对。通常,通过使第一物种的细胞群体经历阴性选择来获得O-tRNA,其中所述细胞包含多个潜在O-tRNA中的成员。阴性选择将除去包含经细胞内源性氨酰基tRNA合成酶(RS)氨酰基化的多个潜在O-tRNA的成员的细胞。这提供与第一物种的细胞正交的tRNA池。在阴性选择的某些实施例中,将选择性密码子引入编码阴性选择标记(例如,赋予抗生素抗性的酶,例如p-内酰胺酶;赋予可检测的产物的酶,例如J3-半乳糖苷酶、氯霉素乙酰转移酶(CAT);例如在非必需位置处的有毒产物,诸如bamase等)的聚核苷酸中。筛选/选择可通过使细胞群体在存在选择剂(例如,抗生素,诸如氨比西林(ampicillin))的情况下生长来进行。在一个实施例中,选择剂的浓度可变化。举例来说,为测量抑制性tRNA的活性,使用基于选择性密码子的活体内抑制(例如,引入编码阴性选择标记(例如,)3-内酰胺酶的基因(Wa))的聚核香酸中的无义或移码突变)的选择系统。举例来说,构建在一定位置(即某一位置)处具有(例如)TAG、AGGA和TGA的聚核苷酸变异体,例如Wa变异体。用这些聚核苷酸转化细胞(例如,细菌)。在无法被内源大肠杆菌合成酶有效负载的正交tRNA的情况中,抗生素抗性(例如,氨比西林抗性)应与不经质粒转化的细菌的抗性类似或比不经质粒转化的细菌的抗性低。如果tRNA不为正交tRNA,或者如果在所述系统中共表达能够负载tRNA的异源合成酶,那么将观察到较高水平的抗生素(例如,氨比西林)抗性。选择在与不经质粒转化的细胞大致相同的抗生素浓度下无法在LB琼脂平板上生长的细胞,例如细菌。在有毒产物(例如,核糖核酸酶barnase)的情况中,当通过内源宿主(例如,大肠杆菌)合成酶(即,其不与宿主正交,例如大肠杆菌合成酶)使多个潜在tRNA中的成员氨酰基化时,选择性密码子受抑制并且所产生的有毒的聚核苷酸产物导致细胞死亡。具有正交tRNA或非功能性tRNA的细胞存活。在一个实施例中,随后使与所需有机体正交的tRNA池经历阳性选择,其中选择性密码子放入(例如)由药物抗性基因(诸如(3-内酰胺酶基因)编码的阳性选择标记中。阳性选择是对包含编码或包含tRNA池的成员的聚核苷酸、编码阳性选择标记的聚核普酸和编码同类RS的聚核苷酸的细胞进行。这些聚核苷酸都在所述细胞中表达,并且所述细胞是在存在选择剂(例如,氨比西林)的情况下生长。随后,针对tRNA经共表达的同类合成酶氨酰基化并且响应此选择性密码子插入氨基酸的能力来选择tRNA。通常,与具有非功能性tRNA或无法被所关注的合成酶有效识别的tRNA的细胞相比,这些细胞展现出抑制效率的增强。具有非功能性tRNA或不被所关注的合成酶有效识别的tRNA的细胞对抗生素敏感。因此,以下tRNA在两种选择下都存活(i)不为内源宿主(诸如,大肠杆菌)合成酶的底物的tRNA;(ii)可经所关注的合成酶氨酰基化的tRNA;和(iii)在翻译过程中起作用的tRNA。在上述方法中,选择(例如,阳性选择、阴性选择或阳性选择与阴性选择)的严格度视情况可变化。举例来说,由于barnase为剧毒蛋白质,故阴性选择的严格度可通过将不同数量的选择性密码子引入barnase基因中和/或通过使用可诱导启动子来控制。在另一个实例中,选择剂或筛选剂(例如氨比西林)的浓度可变化。一方面,由于在早期回合中所需活性较低,故严格度是变化的。因此,在早期回合中应用较低严格度的选择标准并且在随后的选择回合中应用较高严格度的标准。在某些实施例中,阴性选择、阳性选择或阴性选择和阳性选择可重复多次。可使用多种不同的阴性选择标记、阳性选择标记或阴性选择和阳性选择标记。在某些实施例中,阳性选择标记与阴性选择标记可相同。可将其它类型的选择/筛选用于本发明中以制造正交翻译组件,例如O-tRNA、O-RS和0-tRNA/O-RS对。举例来说,阴性选择标记、阳性选择标记或阳性选择标记和阴性选择标记可包括发荧光或在存在适当反应物的情况下催化发光反应的标记。在另一实施例中,标记的产物是通过焚光活化细胞拣选(FACS)或通过发光来检测。视情况,标记包括基于亲和力的筛选标记。参看Francisco,J.A.等人,(1993)/V(k/wc"(W朋dT^ag附e"/1o"*gx&r""/ProcNatlAcadSciUSA.90:10444-8。制造重组正交tRNA的其它方法可见于(例如)名称为"MethodsandCompositionsfortheProductionofOrthogonaltRNA-AminoacyltRNASynthetasePairs,,的美国专利申i青案10/126,93和名称为"InvivoIncorporationofUnnaturalAminoAcids"的10/126,127以及名称为"EXPANDINGTHEEUKARYOTICGENETICCODE."的USSN10/825,867中。也参看Forster等人,(2003)iVogra附w/wgpe/7/7V/o附/we"csyw^e/ases6>>frcms/a^/"ggewef/ccod"c^一c/tfe腳o.PNAS100(11):6353-6357;和Feng等人,(2003),五;c,必wg爵jrecogmY/cmo/"^/iV/4>syw*toeZy"w'"g/e"w/woc/wnge,PNAS100(10):5676-5681。可通过任何方法或技术(包括但不限于,化学或酶促氨酰基化方法)利用所需氨基酸使本发明的tRNA氨酰基化。氨酰基化可通过氨酰基tRNA合成酶或其它酶分子(包括但不限于,核糖酶)实现。术语"核糖酶"可与"催化性RNA"互换使用。Cech和同事(Cech,1987,Science,236:1532-1539;McCorkle等人,1987,ConceptsBiochem.64:221-226)证实可充当催化剂的天然存在的RNA(核糖酶)的存在。然而,尽管仅已证实这些天然RNA催化剂对裂解和剪接的核糖核酸底物起作用,但近期有关人工核糖酶进展的研究已扩展对各种化学反应的催化作用的型式。相关研究已鉴别出可催化自身(2')3'末端的氨酰基RNA键的RNA分子(Illangakekare等人,1995Science267:643-647)和可将氨基酸从一个RNA分子转移到另一RNA分子的RNA分子(Lohse等人,1996,Nature381:442-444)。美国专利申请公开案2003/0228593(其是以引用的方式并入本文)描述构建核糖酶的方法和其对于用天然编码的氨基酸和非天然编码的氨基酸氨酰基化tRNA的用途。可使tRNA氨酰基化的基质固定形式的酶分子(包括但不限于,核糖酶)能够有效地亲和纯化氨酰基化产物。适当基质的实例包括琼脂糖、琼脂糖凝胶和磁珠。供氨酰基化作用的基质固定形式的核糖酶的制造和用途已描述于ChemistryandBiology2003,10:1077-1084和美国专利申请公开案2003/0228593中,所述专利文献是以引用的方式并入本文。化学氨酰基化方法包括(但不限于)由Hecht和同事(Hecht,S.M.Ace.Chem.Res.1992,25,545;Heckler,T.G.;Roesser,J.R.;Xu,C;Chang,P.;Hecht,S.M.Biochemistry1988,27,7254;Hecht,S.M.;Alford,B.L.;Kuroda,Y.;Kitano,S.J.Biol.Chem.1978,253,4517)和Schultz,Chamberlin,Dougherty等(Cornish,V.W.;Mendel,D.;Schultz,P.GAngew.Chem.Int.Ed.Engl.1995,34,621;Robertson,S.A.;Ellman,J.A.;Schultz,P.G.J.Am.Chem.Soc.1991,113,2722;Noren,C.J.;Anthony-Cahill,S.J.;Griffith,M.C;Schultz:P.G.Science1989,244,182;Bain,J.D.;Glabe,C.G;Dix,T.A.;Chamberlin,A.R.J.Am.Chem.Soc.1989,111,8013;Bain,J.D.等人Nature1992,356,537;Gallivan,J.P.;Lester,H.A.;Dougherty,D.A.Chem.Biol.1997,4,740;Turcatti等人J.Biol.Chem.1996,271,19991;Nowak,M.W.等人Science,1995,268,439;Saks,M.E.等人J.Biol.Chem.1996,271,23169;Hohsaka,T.等人J.Am.Chem.Soc.1999,121,34)提出的方法以避免在氨酰基化过程中使用合成酶。所述方法或其它化学氨酰基化方法可用于使本发明的tRNA分子氨酰基化。已使用利用以化学方式修饰的氨酰基tRNA的生物合成方法将数个生物物理探针并入活体外合成的蛋白质中。参看本文所引用的以下公开案和参考文献Bru皿er,J.JV20to/a6e/z薩wgfirmscrossZ/wA/wg附e/7w(jfe,Annu.RevBiochem,62:483-514(1993);和Krieg,U.C.,Walter,P.,Hohnson,A.E./VzotocraM/z'wWwgo/w'gwa/segwewceo/wowcewf/re/ra/flf"/wo/_po(y_pe/"£feo/s/g"a/recogwY/ow/w"'c/e'Proc.Natl.Acad.Sci,83(22):8604-8608(1986)。先前已证实,可通过将经化学方法氨酰基化的抑制性tRNA加入经含有所需琥珀无义突变的基因程式设计的蛋白质合成反应中,在活体外将非天然氨基酸位点特异性地并入蛋白质中。使用这些方法,使用特定氨基酸的营养缺陷型菌抹,可以结构类似的同源物取代20种常见氨基酸中的多种氨基酸,例如以氟代苯丙氨酸取代苯丙氨酸。例如参看Noren,C.J.,Anthony-Cahill,Griffith,M.C.,Schultz,P.G.爿gewem/w"/zod>57Ye-577e"yc/wcor/7on^/owwww"^^"/"/w/woa"Viy/wfoScience,244:182-188(1989);M.W.Nowak等人,Science268:439-42(1995);Bain,J.D.,Glabe,C.G.,Dix,T.A.,Chamberlin,A.R.,Diala,E.S.别os7"/e"cs"e邵ec(/c/wcorpora/iowo/awow-"afwra/a附z'wo/齒a/o(y/e/"We,J.AmChemSoe,111:8013-8014(1989);N.Budisa等人,FASEBJ.13:41-51(1999);Ellman,J.A.,Mendel,D.,Anthony-Cahill,S.,Noren,C丄,Schultz,P.G5/o"W/Wcwe/7odybrz'w的t/w"'"gw朋afwm/(3附z'wo57'/e-印eci(/cfl〃;v/w/o/ra^7w,MethodsinEtiz.,第202巻,301-336(1992);和Mendel,D.,Cornish,V.W.&Schultz,P.G.幼e-Z)/re"et/M/togewe57'51aw■Expawtfe^/Gewe"'cCWe,A皿uRevBiophvs.BiomolStruct.24,435-62(1995)。举例来说,制备识别终止密码子UAG的抑制性tRNA,并且用非天然氨基酸以化学方法使其氨酰基化。使用常规定点诱变将终止密码子TAG引入蛋白质基因中的所需位点处。例i口参看Sayers,J.R.,Schmidt,W.Eckstein,F.5'隱3'_Exom7c/ease>yp/ws//2ora//n'oa/"e-6oyedo//gwowc/eo/7<ie-fifz>*e"e<iNucleicAcidsRes,16(3):791-802(1988)。当将酰基化抑制性tRNA和突变体基因组合于活体外转录/翻译系统中时,响应UAG密码子而并入非天然氨基酸,此提供在特定位置处含有所述氨基酸的蛋白质。使用I^H]-Phe进行的实验和以a羟基酸进行的实验证实,仅所需氨基酸被并入UAG密码子指定的位置处,且并未将这一氨基酸并入蛋白质中的任何其它位点。例如参看Noren等人,/^_i:X;Kobayashi等人,(2003)NatureStructuralBiology10(6):425-432;和Ellman,J.A.,Mendel,D.,Schultz,P.G.幼e邻ec折c/wcor/wWowo/wove/6ac幼owe5fn/"wm1/"toprato7w,Scisncc,255(5041):197-200(1992)。产生催化性RNA的方法可涉及产生单独随机核糖酶序列池;对所迷池进行定向进化;针对所需氨酰基化活性筛选所述池;和选择那些展现所需氨酰基化活性的核糖酶的序列。核糖酶可包含有利于酰基化活性的基序和/或区域,诸如GGU基序和富集U的区域。举例来说,据报导,富集U的区域可有利于识别氨基酸底物,且GGU基序可与tRNA3'末端形成碱基对。总的说来,GGU和基序以及富集U的区域有利于同时识别氨基酸与tRNA,且由此有利于使tRNA3'末端氨酰基化。可通过使用与tRNAAsnCCCG连结的部分随机化r24mini进行活体外选择,随后系统性工程设计见于活性克隆中的一致序列来产生核糖酶。由本方法获得的例示性核糖酶称为"Fx3核糖酶"且描述于美国公开申请案第2003/0228593号中,所述专利的内容是以引用的方式并入本文,所述核糖酶充当合成载有同类非天然氨基酸的各种氨酰基tRNA的通用催化剂。可使用在基质上固定以能够有效亲和纯化氨酰基化tRNA。适当基质的实例包括(但不限于)琼脂糖、琼脂糖凝胶和磁珠。可利用RNA的化学结构将核糖酶固定于树脂上,诸如,可以高不爽酸盐氧化RNA的核糖上的3'-顺-二醇以得到相应二醛以有利于将RNA固定于树脂上。可使用各类树脂,包括廉价酰肼树脂,其中还原氨化使得树脂与核糖酶之间以不可逆连接相互作用。可通过柱上氨酰基化技术显著有利于氨酰基tRNA的合成。Kourouklis等人Methods2005;36:239-4描述基于柱的氨酰基化系统。可以多种方式实现氨酰基化tRNA的分离。一种适当方法为用緩冲液从柱中洗提出氨酰基化tRNA,所述緩冲液诸如含有10mMEDTA的乙酸钠溶液;含有50mMN-(2-羟乙基)哌漆-N'-(3-丙烷磺酸)、12.5mMKC1(pH7.0)、10mMEDTA的緩冲液;或简单地为经EDTA緩冲的水(pH7.0)。可将本发明的氨酰基化tRNA加入翻译反应中以便将使tRNA氨酰基化的氨基酸并入翻译反应所制造的多肽中选择的位置中。可使用本发明的氨酰基化tRNA的翻译系统的实例包括(但不限于)细胞溶解产物。细胞溶解产物提供从输入的mRNA活体外翻译多肽必需的反应组件。所述反应组件的实例包括(但不限于)核糖体蛋白、rRNA、氨基酸、tRNA、GTP、ATP、翻译起始因子和延长因子以及与翻译有关的其它因子。此外,翻译系统可为批量翻译或区域化翻译。批量翻译系统将反应组件组合于单一隔室中,而区域化翻译系统使翻译反应组件与可抑制翻译效率的反应产物分离。所述翻译系统均有市售。另外,可使用偶联转录/翻译系统。偶联转录/翻译系统允许将输入DNA转录成对应的mRNA,其接着经反应组件翻译。市售偶联转录/翻译的实例为快速翻译系统(RapidTranslationSystem)(RTS,RocheInc.)。所述系统包括含有^是供翻译组件(诸如核糖体和翻译因子)的大肠杆菌溶解产物的混合物。此外,还包括RNA聚合酶以将输入DNA转录成供翻译使用的mRNA模板。RTS可使用借助插入到反应隔室(包括供应/废物隔室和转录/翻译隔室)之间的膜区域化反应组件。tRNA的氨酰基化可以其它试剂进行,所述试剂包括(但不限于)转移酶、聚合酶、催化抗体、多功能蛋白等。正交氨酰基tRNA合成酶(O-RS)O-RS优先利用所选氨基酸在活体外或活体内使本发明的O-tRNA氨酰基化。可通过包括O-RS的多肽和/或通过编码O-RS或其部分的聚核脊酸将本发明的O-RS提供到翻译系统(例如,活体外翻译组件,或细胞)中。O-RS或其部分是由聚核苷酸序列或其互补聚核苷酸序列或其保守变异体编码。可通过多种不同的O-RS分子(包括但不限于,本文所述的分子)将本发明的O-tRNA氨酰基化。鉴别与O-tRNA(例如,O-tRNA)—起使用的正交氨酰基tRNA合成酶(O-RS)(例如,O-RS)的方法也为本发明的特征。举例来说,方法包括使第一物种的细胞群体经历阳性选择,其中所述细胞各自包含1)多种氨酰基tRNA合成酶(RS)的成员,其中所述多种RS包含突变体RS、从除第一物种以外的物种得到的RS或突变体RS和从除第一物种以外的物种得到的RS;2)来自第二物种的正交tRNA(O-tRNA);和3)编码阳性选择标记并且包含至少一个选择性密码子的聚核苷酸。选择或筛选细胞中与缺乏多种RS中的成员或具有减少量的多种RS中的成员的细胞相比展示增强的抑制效率的细胞。抑制效率增强的细胞包含使O-tRNA氨酰基化的活性RS。将活性RS使来自第一物种的第一组tRNA氨酰基化的水平(活体外或活体内)与活性RS使来自第二物种的第二组tRNA氨酰基化的水平(活体外或活体内)相比较。氨酰基化水平可通过可检测物质(例如,经标记氨基酸或非天然氨基酸)测定。选择与第一组tRNA相比使第二组tRNA更有效氨酰基化的活性RS,借此提供与O-tRNA—起使用的正交氨酰基tRNA合成酶。由所述方法鉴别的O-RS(例如,O-RS)也为本发明的特征。可使用多种检定中的任一种测定氨酰基化。这些检定可在活体外或活体内进行。举例来说,活体外氨酰基化4全定描述于例如Hoben,P.和Soil,D.(1985)MethodsEnzvmol.113:55-59以及美国专利申请公开案第2003/0228593号中。也可通过使用报告基因和正交翻译组件,并且检测表达包含至少一个选择性密码子且编码蛋白质的聚核苷酸的细胞中的报告基因来测定氨酰基化。也参看名称为"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS"的美国专利申请案10/126,927;和名称为"EXPANDINGTHEEUKARYOTICGENETICCODE,,的USSN10/825,867。可进一步对经鉴别的O-RS进行操纵以改变合成酶的底物特异性,从而仅所需非天然氨基酸而非常见20种氨基酸中的任一种载到O-tRNA上。产生对非天然氨基酸具有底物特异性的正交氨酰基tRNA合成酶的方法包括使合成酶(例如)在合成酶的活性位点处、合成酶的编辑机制位点处、通过组合合成酶不同域得到的不同位点处等突变,和应用选择方法。使用基于阳性选择随后阴性选择的组合的策略。在阳性选择中,对阳性标记的非必需位置处引入的选择性密码子的抑制使细胞在阳性选择压力下存活。因此,在存在天然和非天然氨基酸的情况下,存活者编码使正交抑制性tRNA载上天然或非天然氨基酸的活性合成酶。在阴性选择中,对阴性标记的非必需位置处引入的选择性密码子的抑制将去除具有天然氨基酸特异性的合成酶。阴性选择和阳性选择的存活者编码仅利用非天然氨基酸使正交抑制性tRNA氨酰基化(装载)的合成酶。随后,可使这些合成酶经历进--步的诱变,例如DNA改组或其它递归式诱变方法。可使用所属领域中已知的各种诱变技术产生突变体O-RS文库。举例来说,可通过位点特异性突变、随机点突变、同源重组、DNA改组或其它递归式诱变方法、嵌合构建或其任何组合产生突变体RS。举例来说,可由两种或两种以上其它(例如)较小、较少不同的"子文库"来产生突变体RS文库。RS的嵌合文库也包括在本发明中。应注意,视情况构建来自各种有机体(例如,微生物,诸如真细菌或古细菌)的tRNA合成酶文库,诸如,包含天然多样性的文库(例如参看Short等人的美国专利第6,238,884号;Schallenberger等人的美国专利第5,756,316号;Petersen等人的美国专利第5,783,431号;Thompson等人的美国专利第5,824,485号;Short等人的美国专利第5,958,672号);并且筛选正交对。使合成酶经历阳性和阴性选择/篩选策略后,随后可使这些合成酶经历进一步诱变。举例来说,可分离编码O-RS的核酸;可由所述核酸产生(例如,通过随机诱变、位点特异性诱变、重组或其任何组合)一组编码突变O-RS的聚核苷酸;并且可重复这些个別步骤或这些步骤的组合直到获得优先利用非天然氨基酸使O-tRNA氨酰基化的突变O-RS。在本发明一个方面中,进行所述步骤多次,例如至少2次。还可将不同程度的选择/筛选严格度用于本发明的方法中,以用于产生O-tRNA、O-RS或0-tRNA/0-RS对。所述方法的一个或两个步骤的选择或筛选严格度可变化以产生O-RS。这可包括(例如)改变所使用的选择剂/筛选剂的量等。也可进行其它回合的阳性选择和/或阴性选择。选择或筛选也可包含一次或一次以上阳性或阴性选择或筛选,所述选择或筛选包括(例如)氨基酸渗透性的改变、翻译效率的改变、翻译保真度的改变等。通常,一种或一种以上改变是基于使用正交tRNA-tRNA合成酶对制造蛋白质的有机体中一个或一个以上基因的突变。可将针对(例如)O-RS、O-tRNA和0-tRNA/0-RS对的其它类选择用于本发明中。阳性选择标记可为多种分子中的任一种,包括(但不限于)提供营养补充以供生长的产物,并且在缺乏营养补充的培养基上进行选择。编码阳性选择标记的聚核苦酸的实例包括(但不限于)例如基于补充细胞的氨基酸营养缺陷型的报告基因、his3基因(例如,其中his3基因编码通过提供3-氨基三唑(3-AT)检测的咪唑甘油磷酸脱氩酶)、ura3基因、leu2基因、lys2基因、lacZ基因、adh基因等。例如参看G.M.Kishore,&D.M.Shah,(1988),Aminoacidbiosynthesisinhibitorsasherbicides,AnnualReviewofBiochemistry57:627-663。在一个实施例中,IacZ的产生是通过邻硝基苯基-卩-D-p比喃半乳糖苷(ONPG)水解斗全测。例如参看I.G.Serebriiskii,&E.A.Golemis,(2000),UsesoflacZtostudygenefunction:evaluationofbeta-galactosidaseassaysemployedintheyeasttwo-hybridsystem,AnalyticalBiochemistry285:1-15。其它阳性选择标记包括(例如)焚光素酶、绿色焚光蛋白质(GFP)、YFP、EGFP、RFP、抗生素抗性基因的产物(例如,氯霉素乙酰转移酶(CAT))、转录调节蛋白(例如,GAL4)等。视情况,编码阳性选择标记的聚核苷酸包含选择性密码子。可将编码阳性选择标记的聚核苷酸可操作地连接到反应元件。还可存在编码调节反应元件转录的转录调节蛋白且包含至少一个选择性密码子的额外聚核苷酸。通过经非天然氨基酸氨酰基化的O-tRNA将非天然氨基酸并入转录调节蛋白中将引起编码阳性选择标记的聚核苷酸(例如,报告基因)的转录。视情况,选择性密码子位于编码转录调节蛋白的DNA结合域的一部分聚核苷酸中或实质上临近编码转录调节蛋白的DNA结合域的一部分聚核苷酸。也可将编码阴性选择标记的聚核苷酸可操作地连接到转录调节蛋白介导转录的反应元件。例如参看A.J.DeMaggio等人,(2000),Theyeastsplit-hybridsystem,MethodEnzymol.328:128-137;H.M.Shih等人,(1996),Apositivegeneticselectionfordisruptingprotein-proteininteractions:identificationofCREBmutationsthatpreventassociationwiththecoactivatorCBP,Proc.Natl.Acad.Sci.U.S.A.93:13896-13901;M.Vidal等人,(1996),Geneticcharacterizationofamammalianprotein-proteininteractiondomainbyusingayeastreversetwo-hybridsystem,Proc.Natl.Acad.Sci.U.S.A.93:10321-10326;和M.Vidal等人,(1996),Reversetwo-hybridandone-hybridsystemstodetectdissociationofprotein-proteinandDNA-proteininteractions(Proc.Natl.Acad.Sci.U.S.A.93:10315-10320)。通过经天然氨基酸氨酰基化的O-tRNA将天然氨基酸并入转录调节蛋白中将引起阴性选择标记的转录。视情况,阴性选择标记包含选择性密码子。本发明的阳性选择标记和/或阴性选择标记可包含至少两个选择性密码子,所述标记各自或都可包含至少两个不同的选择性密码子或至少两个相同的选择性密码子。转录调节蛋白为与核酸序列(例如,反应元件)(直接或间接)结合并且调节可操作地连接到反应元件的序列的转录的分子。转录调节蛋白可为转录活化蛋白(例如,GAL4、核激素受体、AP1、CREB、LEF/tcf家族成员、SMAD、VP16、SP1等)、转录阻遏蛋白(例如,核激素受体、Groucho/tle家族、Engrailed家族等)或可视环境而具有两种活性的蛋白质(例如,LEF/tcf、同源盒蛋白等)。反应元件通常为由转录调节蛋白识别的核酸序列或与转录调节蛋白协同作用的额外试剂。转录调节蛋白的另一实例为转录活化蛋白GAL4。例如参看A.Laughon等人,(1984),IdentificationoftwoproteinsencodedbytheSaccharomycescerevisiaeGAL4gene,Molecular&CellularBiology4:268-275;A.Laughon,&R.F.Gesteland,(1984),PrimarystructureoftheSaccharomycescerevisiaeGAL4gene,Molecular&CellularBiology4:260-267;L.Keegan等人,(1986),SeparationofDNAbindingfromthetranscription-activatingfunctionofaeukaryoticregulatoryprotein,Science231:699-704;和M.Ptashne,(1988),Howeukaryotictranscriptionalactivatorswork,Nature335:683-689。这一具有881个氨基酸的蛋白质的N末端147个氨基酸形成特异性结合DNA序列的DNA结合域(DBD)。例如参看M.Carey等人,(1989),Anamino-terminalfragmentofGAL4bindsDNAasadimer,J.Mol.Biol.209:423-432;和E.Giniger等人,(1985),SpecificDNAbindingofGAL4,apositiveregulatoryproteinofyeast,Cell40:767-774。DBD是通过4#入的蛋白质序列连接到当与DNA结合时可活化转录的C末端113个氨基酸活化域(AD)。例如参看J.Ma,&M.Ptashne,(1987),DeletionanalysisofGAL4definestwotranscriptionalactivatingsegments,Cell48:847-853;和J.Ma,&M.Ptashne,(1987),Thecarboxy-terminal30aminoacidsofGAL4arerecognizedbyGAL80,Cell50:137-142。通过将琥珀密码子朝向(例如)含有GAL4的N末端DBD和其C末端AD的单一聚核苦酸的N末端DBD放置,可将O-tRNA/O-RS对的琥珀抑制连接到GAL4进行的转录活化。可使用GAL4活化的报告基因进行利用所述基因进行的阳性选择和阴性选择。用于阴性选择的培养基可包含转化成通过阴性选择标记可检测的物质的选择剂或筛选剂。在本发明一个方面中,可检测物质为有毒物质。编码阴性选择标记的聚核苷酸可为(例如)ura3基因。举例来说,可将URA3报告基因放在含有GAL4DNA结合位点的启动子的控制下。当例如通过翻译具有选择性密码子的编码GAL4的聚核苦酸来制造阴性选择标记时,GAL4将活化URA3的转录。阴性选择是在包含5-氟乳清酸(5-F0A)的培养基上实现,所述5-FOA转化成通过ura3基因的基因产物可^r测的物质(例如,杀死细胞的有毒物质)。例如参看J.D.Boeke等人,(1984),Apositiveselectionformutantslackingorotidine-5'-phosphatedecarboxylaseactivityinyeast:5-fluorooroticacidresistance,Molecular&GeneralGenetics197:345-346);M.Vidal等人,(1996),Geneticcharacterizationofamammalianprotein-proteininteractiondomainbyusingayeastreversetwo-hybridsystem.,Proc.Natl.Acad.Sci.U.S.A.93:10321-10326;和M.Vidal等人,(1996),Reversetwo-hybridandone-hybridsystemstodetectdissociationofprotein-proteinandDNA-proteininteractions.,Proc.Natl.Acad.Sci.U.S.A.93:10315-10320。如同阳性选择标记一样,阴性选择标记也可为多种分子中的任一种。阳性选择标记和/或阴性选择标记可为发焚光或在存在适当反应物的情况下催化发光反应的多肽。举例来说,阴性选择标记包括(但不限于)例如荧光素酶、绿色荧光蛋白质(GFP)、YFP、EGFP、RFP、抗生素抗性基因的产物(例如,氯霉素乙酰转移酶(CAT))、lacZ基因的产物、转录调节蛋白等。阳性选择标记和/或阴性选择标记可通过萸光活化细胞拣选(FACS)或通过发光来检测。阳性选择标记和/或阴性选择标记可包含基于亲和力的筛选标记。同一聚核普酸可编码阳性选择标记和阴性选择标记。举例来说,阳性选择步骤、阴性选择步骤或阳性选择和阴性选择步骤可包括使用报告基因,其中所述报告基因是通过荧光活化细胞拣选(FACS)检测。举例来说,阳性选择可首先用阳性选择标记(例如,氯霉素乙酰转移酶(CAT)基因)进行,其中所述CAT基因在所述CAT基因中包含选择性密码子(例如,琥珀终止密码子);随后进行阴性选择筛选,其是基于无法抑制阴性选择标记(例如,T7RNA聚合酶基因)内各位置处的(例如,两个或两个以上)选择性密码子。阳性选择标记和阴性选择标记可见于同一载体(例如质粒)上。阴性标记的表达将驱动报告基因(例如,绿色焚光蛋白质(GFP))的表达。选择和筛选的严格度可变化,例如使报告基因发荧光所需的光强度可变化。阳性选择可利用通过FACS筛选随后阴性选择筛选的报告基因作为阳性选择标记进行,所述阴性选择筛选是基于无法抑制阴性标记(例如,barnase基因)内各位置处的(例如,两个或两个以上)选择性密码子。视情况,报告基因是在细胞表面(例如,噬菌体呈现等)上呈现。细胞表面呈现(例如,基于OmpA的细胞表面呈现系统)取决于大肠杆菌细胞表面上特定抗原决定基(例如,融合到外膜孔蛋白OmpA的脊髓灰质炎病毒C3肽)的表达。所述抗原决定基仅在翻译期间抑制蛋白质信使中的选择性密码子时呈现于细胞表面上。随后所呈现的肽含有由文库中的一个突变体氨酰基tRNA合成酶所识别的氨基酸,并且含有相应合成酶基因的细胞可利用针对含有特定非天然氨基酸的肽所产生的抗体分离。基于OmpA的细胞表面呈现系统经Georgiou等人研发并且优化以作为噬菌体呈现的替代选择。参看Francisco,J.A.,Campbell,R.,Iverson,B.L.&Georgoiu,G.Productionandfluorescence-activatedcellsortingofEscherichiacoliexpressingafunctionalantibodyfragmentontheexternalsurface.Proc.Natl.Acad.Sci.USA90:10444-8(1993)。本发明的其它实施例包括在活体外执行一个或一个以上选择步骤。随后可将所选组件(例如,合成酶和/或tRNA)引入细胞中以用于活体内并入非天然氨基酸。制造O-RS并且改变合成酶的底物特异性的其它细节可见于名称为"MethodsandCompositionsfortheProductionofOrthogonaltRNA-AminoacyltRNASynthetasePairs"的美国专利申请案10/126,931和名称为"EXPANDINGTHEEUKARYOTICGENETICCODE"的USSN10/825,867中,所迷文献都是以引用的方式并入本文中。制造O-RS的其它细节可见于Hamano-Takaku等人,(2000)AmutantEscherichiacoliTyrosyl-tRNASynthetaseUtilizestheUnnaturalAminoAcidAzatyrosineMoreEfficientlythanTyrosine,JournalofBiologicalChemistry,275(51):40324-40328;Kiga等人(2002),AnengineeredEscherichiacolityrosyl-tRNAsynthetaseforsite-specificincorporationofanunnaturalaminoacidintoproteinsineukaryotictranslationanditsapplicationinawheatgermcell-freesystem,PNAS99(15):9715-9723;和Francklyn等人,(2002),Aminoacyl-tRNAsynthetases:Versatileplayersinthechangingtheateroftranslation;RNA,8:1363-1372中,各文献都是以引用的方式并入本文中。来源和宿主有机体本发明的翻"^组件通常是从非真核有机体得到。举例来说,正交O-tRNA可从非真核有机体得到,例如古细菌,诸如詹氏甲烷球菌、嗜热自养曱烷杆菌、嗜盐古菌(诸如沃氏嗜盐富饶菌和嗜盐古菌NRC-1)、闪烁古生球菌、强烈火球菌、掘越氏热球菌、嗜热泉生古细菌等;或真细菌,诸如大肠杆菌、极端嗜热细菌、嗜热脂肪芽孢杆菌等,而正交O-RS可从非真核有机体得到,例如嗜热自养甲烷杆菌、嗜盐古菌(诸如沃氏嗜盐富饶菌和嗜盐古菌NRC-1)、闪烁古生球菌、强烈火球菌、掘越氏热球菌、嗜热泉生古细菌等;或真细菌,诸如大肠杆菌、极端嗜热细菌、嗜热脂肪芽孢杆菌等。在一个实施例中,也可使用真核来源,包括(但不限于)植物、藻类、原生生物、真菌、酵母、动物(例如,哺乳动物、昆虫、节肢动物等)等。O-tRNA/0-RS对的个别组件可从相同有机体或不同有机体得到。在一个实施例中,O-tRNA/0-RS对是来自相同有机体。或者,O-tRNA/0-RS对中的O-tRNA和O-RS是来自不同有机体。举例来说,O-tRNA可从(例如)嗜盐古菌NRC-1得到,并且O-RS可从(例如)嗜热自养曱烷杆菌得到。可在活体内或活体外选择或筛选O-tRNA、O-RS或O-tRNA/0-RS对和/或将其用于细胞(例如,非真核细胞(诸如大肠杆菌细胞)或真核细胞)中以产生具有所选氨基酸(例如,非天然氨基酸)的多肽。非真核细胞可来自各种来源,诸如古细菌系统发育领域,包括(但不限于)詹氏曱烷球菌、嗜热自养曱烷杆菌、嗜盐古菌(诸如沃氏嗜盐富饶菌和嗜盐古菌NRC-1)、闪烁古生球菌、强烈火球菌、掘越氏热球菌、嗜热泉生古细菌等;或可属于真细菌系统发育领域(包括但不限于,大肠杆菌、极端嗜热细菌、嗜热脂肪芽孢杆菌、荧光假单胞菌、铜绿假单胞菌、恶臭假单胞菌等)等。真核细胞可来自各种来源,包括(但不限于)植物(例如,复杂植物,诸如单子叶植物或双子叶植物)、藻类、原生生物、真菌、酵母(包括但不限于,酿酒酵母)、动物(包括但不限于,哺乳动物、昆虫、节肢动物等)等。具有本发明的翻译组件的细胞组合物也为本发明的特征。有关筛选一种物种中的O-tRNA和/或O-RS供另一物种^f吏用,也参看名称为"ExpandingtheEukaryoticGeneticCode,,的USSN10/825,867。为了在宿主细胞中表达具有所选氨基酸的所关注的多肽,可将编码所关注的多肽的聚核苷酸亚克隆到表达载体中,所述表达载体含有用于指导转录的启动子、转录/翻译终止子,且如果针对编码蛋白质的核酸,那么还含有用于翻译起始的核糖体结合位点。适当的细菌启动子已为所属领域众所周知并且描述于(例如)Sambrook等人和Ausubel等人中。表达所关注的多肽的细菌表达系统可用于(包括但不限于)大肠杆菌、枯草杆菌(5ac///^印,)、荧光假单胞菌,铜绿假单胞菌,恶臭假单胞菌和沙门氏菌(Sa/wowe〃a)中(Palva等人,22:229-235(1983);Mosbach等人,A^wre302:543-545(1983))。所述表达系统的试剂盒在市面有售。哺乳动物细胞、酵母和昆虫细胞的真核表达系统已为所属领域技术人员众所周知且也在市面有售。可将本发明的tRNA和/或RS和/或所关注的多肽用于多种适当的表达系统(例如包括,酵母、昆虫细胞、哺乳动物细胞和细菌)中和/或在所述系统中表达。有关例示性表达系统的描述将于下文中提供。酵母如本文所使用,术语"酵母"包括能够表达所关注的多肽的多种酵母中的任一种。所述酵母包括(但不限于)产子囊(ascosporogenous)酵母(内孢霉目(五/w/o附戸fa/ej1))、产担孑包子(basidiosporogenous)酵母和属于半知菌类(芽孑包纲(5/aWomj;cetey))的酵母。产子囊酵母分为两个家族,即蚀精霉科(5^WJ叩/^/zoraceae)和酵母科(SacctoTOmycWaceae)。酵母科是由四个亚家族构成,即裂殖酵母亚科(5"c/^mracc/zaro附;;co/c/eae)(例如,裂殖酵母属(genusScWmya"/ara,c^))、拿逊酵母亚科(A^c^om'o/i/efle)、油月旨酵母亚科(ZipowycoWeae)和酵母菌亚科(S"cc/"w附jcozWew)(例如,毕赤酵母属(户/cW")、克鲁维酵母属(f/j^veromycey)和酵母菌属(Sacc/zara附少ce))。产担孢子酵母包括白冬孢酵母属(丄ewawjW〃W/ww)、红冬孢酵母属(及/wcfo印onW/ww)、锁掷孢酵母属(印w!W/o&o/附)、线黑粉酵母属("/okwWwm)和拟线黑粉酵母属(Ff/oftawW/e//")。属于半知菌类(芽孢纲)的酵母分为两个家族,即掷孢酵母科(S;wra6o/ow;;ce^(ceae)(例如掷孢酵母属(S/wro6o/om;K^)和布勒掷孢酵母属(Bw〃era))和隐球酵母科(Co^ococcweae)(例如假丝酵母属(OmAW))。用于本发明的特别值得关注的为毕赤酵母属、克鲁维酵母属、酵母菌属、裂殖酵母属、(^m;ye"w/a)、汉逊酵母属(/fo附emz/a)、球拟酵母属(7bnz/o/w^)和假丝酵母属(Ca"AWa)内的种,包括(但不限于)巴氏毕赤酵母(P;^WoWs)、季氏毕赤酵母(gm7/en'wow(i")、酿酒酵母(S.cerev/w'ae)、卡尔斯伯酵母(S.car/Aergem/s)、糖化酵母(S.WaWa"cws)、道格拉斯酵母(S.dowg/a;y〃)、克氏酵母(S,A:/w,yven')、诺氏酵母(S."w6e"w'j)、卵形酵母(Sov(/brw/_y)、乳酸克鲁维斯酵母(〖脆壁克鲁维斯酵母(L/mgz7h)、白假丝酵母(C.a/6/cww)、麦芽假丝酵母(Cwa/tosa)和多形汉逊酵母(if.pofy;nof77/7a)。酵母一般可从各种来源得到,包括(但不限于)加州大学(Berkeley,CA)生物物理学和医学物理学系酵母基因储备中心(YeastGeneticStockCenter,DepartmentofBiophysicsandMedicalPhysics,UniversityofCalifornia)和美国典型孩吏生物菌种保藏中心(AmericanTypeCultureCollection,"ATCC")(Manassas,VA)。术语"酵母宿主"或"酵母宿主细胞"包括可用作重组载体或其它转移DNA的受体或已用作重组栽体或其它转移DNA的受体的酵母。所述术语包括已接收重组栽体或其它转移DNA的原始酵母宿主细胞的子代。应了解,由于存在偶发突变或有意突变,单一亲代细胞的子代的形态或基因组或总DNA补体可不必与原始亲本完全相同。与亲本足够相似以通过相关特性(诸如,编码所关注的多肽的核苦酸序列的存在)表征的亲本细胞子代包括在本定义所预期的子代中。已研发表达和转化载体(包括染色体外复制子或整合载体)以用于转化到许多酵母宿主中。举例来说,已研发针对下述的表达载体酿酒酵母(Sikorski等人,Genetics(1989)122:19;Ito等人,J.Bacteriol.(1983)153:163;Hinnen等人,Proc.Natl.Acad.Sci.USA(1978)75:1929);白假丝酵母(Kurtz等人,Mol.CELL.Biol.(1986)6:142);麦芽假丝酵母(Kunze等人,J.BASICMICROBIOL.(1985)25:141);多形汉逊酵母(Gleeson等人,J.Gen.Microbiol.(1986)132:3459;Roggenkamp等人,Mol.Geneticsandgenomics(1986)202:302);脆壁克鲁维斯酵母(Das等人,J.Bacteriol.(1984)158:1165);乳酸克鲁维斯酵母(DeLouvencourt等人,J.Bacteriol.(1983)154:737;VandenBerg等人,Biotechnology(ny)(1990)8:135);季氏毕赤酵母(Kunze等人,J.BasicMicrobiol.(1985)25:141);巴氏毕赤酵母(美国专利第5,324,639号;第4,929,555号;和第4,837,148号;Cregg等人,Mol.Cell.Biol.(1985)5:3376);粟酒裂殖酵母(Beach等人,NATURE(1982)300:706);和耶罗威亚解脂酵母(/*o(K/")、构巢曲霉(AmWw/"朋)(Balance等人,BIOCHEM.BIOPHYS.RES.Commun.(1983)112:284-89;Tilburn等人,Gene(1983)26:205-221;和Yelton等人,Proc.Natl.Acad.SCI.USA(1984)81:1470-74);黑曲霉(A"一)(Kelly和Hynes,EMBOJ.(1985)4:475-479);木霉(Z證/a)(EP0244234);和丝状真菌,诸如土壤真菌(A^wraspora)、青霉属(Pew/c/仏'ww)、弯颈霉(7b〖y;oc/aWww)(WO91/00357)。酵母载体的控制序列已为所属领域技术人员所知并且包括(但不限于)来自下述基因的启动子区诸如醇脱氢酶(ADH)(EP0284044);烯醇化酶;葡糖激酶;葡萄糖-6-磷酸异构酶;甘油醛-3-嶙酸脱氢酶(GAP或GAPDH);己糖激酶;磷酸果糖激酶;3-磷酸甘油酸变位酶;和丙酮酸激酶(PyK)(EP0329203)。编码酸性磷酸酶的酵母PH05基因也可提供有用的启动子序列(Miyanohara等人,PROC.Natl.Acad.Sci.USA(1983)80:1)。用于酵母宿主的其它适当的启动子序列可包括3-磷酸甘油酸激酶(Hitzeman等人,J.BIOL.Chem.(1980)255:12073)和其它糖酵解酶(诸如丙酮酸脱羧酶、磷酸丙糖异构酶和磷酸葡萄糖异构酶)(Holland等人,BIOCHEMISTRY(1978)17:4卯0;Hess等人,J.Adv.EnzymeReg.(1969)7:149)的启动子。具有受生长条件所控制的其它转录优点的可诱导酵母启动子可包括醇脱氢酶2、异细胞色素C、酸性磷酸酶、金属硫蛋白、甘油醛-3-磷酸脱氲酶、与氮代谢相关的降解酶和负责麦芽糖和半乳糖利用的酶的启动子区。用于酵母表达的适当栽体和启动子进一步描述于EP0073657中。酵母增强子还可与酵母启动子合用。此外,合成启动子也可用作酵母启动子。举例来说,可将酵母启动子的上游活化序列(UAS)与另一酵母启动子的转录活化区连接,从而产生合成杂合启动子。所述杂合启动子的实例包括连接到GAP转录活化区的ADH调控序列。参看美国专利第4,880,734号和第4,876,197号,其是以引用的方式并入本文中。杂合启动子的其它实例包括由ADH2、GAL4、GAL10或PH05基因的调控序列与糖酵解酶基因(诸如GAP或PyK)的转录活化区组成的启动子。参看EP0164556。此外,酵母启动子可包括具有结合酵母RNA聚合酶并且起始转录的能力的非酵母来源的天然存在的启动子。可组成部分酵母表达载体的其它控制元件包括(例如)来自GAPDH或烯醇化酶基因的终止子(HoIland等人,J.BIOL.Chem.(1981)256:1385)。此外,2fi质粒来源的复制起点适用于酵母。用于酵母中的适当选择基因为存在于酵母质粒中的";7/基因。参看Tschumper等人,Gene(1980)10:157;Kingsman等人,Gene(1979)7:141。fr^基因提供针对缺乏在色氨酸中生长的能力的酵母突变菌抹的选择标记。类似地,Leu2缺陷型酵母菌林(ATCC20,622或38,626)通过具有丄ew2基因的已知质粒补充。将外源DNA引入酵母宿主中的方法已为所属领域技术人员所知,并且通常包括(但不限于)原生质球的转化或经碱阳离子处理的完整酵母宿主细胞的转化。举例来说,酵母的转化可根据Hsiao等人,Proc.Natl.Acad.Sci.USA(1979)76:3829和VanSolingen等人,J.Bact.(1977)130:946中所述的方法进行。然而,也可如Sambrook等人,MolecularCloning:ALab.Manual(2001)中一般所述,使用将DNA引入细胞的其它方法,诸如细胞核注射、电穿孔或原生质体融合。随后可使用所属领域技术人员已知的标准技术培养酵母宿主细胞。在酵母宿主细胞中表达异源蛋白质的其它方法已为所属领域技术人员所知。一般参看美国专利公开案第20020055169号;美国专利第6,361,969号;第6,312,923号;第6,183,985号;第6,083,723号;第6,017,731号;第5,674,706号;第5,629,203号;第5,602,034号;和第5,089,398号;美国再审专利第RE37,343号和第RE35,749号;PCT公开专利申请案WO99/07862;WO98/37208;和WO98/26080;欧洲专利申请案EP0946736;EP0732403;EP0480480;WO90/10277;EP0340986;EP0329203;EP0324274;和EP0164556。也参看Gellissen等人,AntonieVanLeeuwenhoek(1992)62(1隱2):79-93;Romanos等人,Yeast(1992)8(6):423-488;Goeddel,METHODSINENZYMOLOGY(19卯)185:3-7,各文献都是以引用的方式并入本文中。在扩增阶段,酵母宿主菌林可使用所属领域技术人员已知的标准补料分批发酵方法在发酵罐中生长。所述发酵方法可用于说明特定酵母宿主的碳利用路径或表达控制模式的差异。举例来说,酵母菌属(Sacc/wramycM)酵母宿主的发酵可能需要单一葡萄糖原料、复合氮源(例如,酪蛋白水解物)和多种维生素补充。相比之下,曱醇酵母巴氏毕赤酵母可能需要甘油、曱醇和痕量矿物原料,但仅简单铵(氮)盐以供最佳生长和表达。例如参看美国专利第5,324,639号;Elliott等人,J.ProteinChem.(1990)9:95;和Fieschko等人,Biotech.Bioeng.(1987)29:1113,各文献都是以引用的方式并入本文中。然而,所述发酵方法可具有与所使用的酵母宿主菌抹无关的某些常见特征。举例来说,可在扩增阶段将限制生长的养分(通常为碳)加到发酵罐中以允许最大生长。此外,发酵方法一般使用经设计以含有足量的碳、氮、基础盐(basalsalt)、磷和其它微量养分(维生素、痕量矿物和盐等)的发酵培养基。适用于毕赤酵母属的发酵培养基的实例描述于美国专利第5,324,639号和第5,231,178号中,其是以引用的方式并入本文中。感染杆状病毒的昆虫细胞术语"昆虫宿主"或"昆虫宿主细胞"是指可用作重组载体或其它转移DNA的受体或已用作重组载体或其它转移DNA的受体的昆虫。所述术语包括已经转染的原始昆虫宿主细胞的子代。应了解,由于存在偶发突变或有意突变,单一亲代细胞的子代的形态或基因组或总DNA补体可不必与原始亲本完全相同。与亲本足够相似以通过相关特性(诸如,编码所关注的多肽的核苷酸序列的存在)表征的亲本细胞的子代包括在本定义所预期的子代中。表达所关注的多肽的适当昆虫细胞的选择已为所属领域技术人员所知。数种昆虫物种已在所属领域中进行充分描述并且在市面有售,包括埃及斑蚊(Xe&s)、家蚕(5om6yxwoW)、,繁、腹果虫1XZ>oso//7a附e/a"og"Wer)、草i也贪夜蛾(Spoi/o//ena(々wg/peraa)和粉紋夜蛾(7Wc/zo;/^/am')。在选择供表达的昆虫宿主的过程中,适当的宿主可包括经证实尤其具有良好的分泌能力、低的蛋白水解活性和整体稳定性的宿主。昆虫一般可从各种来源得到,包括(但不限于)加州大学(Berkeley,CA)生物物理学和医学物理学系昆虫基因储备中心(InsectGeneticStockCenter,DepartmentofBiophysicsandMedicalPhysics,UniversityofCalifornia)和美国典型微生物菌种保藏中心("ATCC")(Manassas,VA)。一般说来,感染杆状病毒的昆虫表达系统的组件包括转移载体,通常为细菌质粒,其含有杆状病毒基因组的片段和插入欲表达的异源基因的便利限制性位点;具有与转移载体中的杆状病毒特异性片段同源的序列(这允许将异源基因同源重组到杆状病毒基因组中)的野生型杆状病毒;和适当的昆虫宿主细胞和生长培养基。用于构建载体、转染细胞、拣选斑块、使细胞在培养基中生长等的材料、方法和技术已为所属领域技术人员所知并且可使用描述这些技术的手册。将异源基因插入转移栽体中后,将载体和野生型病毒基因组转染到昆虫宿主细胞中,其中载体与病毒基因组重组。表达经包装的重组病毒并且对重组斑块进行鉴别和纯化。用于杆状病毒/昆虫细胞表达系统的材料和方法是从(例如)InvitrogenCorp.(Carlsbad,CA)以试剂盒形式购得。这些技术一般为所属领域技术人员所知并且充分地描述于以引用方式并入本文的SummersandSmith,TexasAgriculturalExperimentStationBulletinNo.1555(1987)中。也参看Richardson,39MethodsinMolecularBiology:BaculovirusExpressionProtocols(1995);ausubel等人,currentprotocolsinmolecularbiology16.9-16.11(1994);king和Possee,TheBaculovirusSystem:ALaboratoryGuide(1992);禾口O'Reilly等人,BaculovirusExpressionVectors:ALaboratoryManual(1992)。事实上,所属领域技术人员已知使用杆状病毒/昆虫细胞表达系统进行的各种异源蛋白质的制造。例如,参看美国专利第6,368,825号、第6,342,216号、第6,338,846号、第6,261,805号、第6,245,528号、第6,225,060号、第6,183,987号、第6,168,932号、第6,126,944号、第6,096,304号、第6,013,433号、第5,965,393号、第5,939,285号、第5,891,676号、第5,871,986号、第5,861,279号、第5,858,368号、第5,843,733号、第5,762,939号、第5,753,220号、第5,605,827号、第5,583,023号、第5,571,709号、第5,516,657号、第5,2卯,686号、WO02/06305、WOOl簡卯、WO01/27301、WO01/05956、WO00/55345、WO00/20032、WO99/51721、WO99/45130、WO99/31257、WO99/10515、WO99/09193、WO97/26332、WO96/29400、WO96/25496、WO96/06161、WO95/20672、WO93/03173、WO92/16619、WO92/02628、WO92/01801、WO90/14428、WO90/10078、WO90/02566、WO90/02186、WO卯/01556、WO89/01038、WO89/01037、WO88/07082,所述专利都是以引用的方式并入本文中。可用于杆状病毒/昆虫细胞表达系统的载体已为所属领域中所知并且包括(例如)自杆状病毒苜蓿尺蠖(^w"gra//wca/zybr"/ca)核型多角体病毒(AcNPV)获得的昆虫表达和转移载体,其为非辅助依赖性病毒表达载体(helper-independentviralexpressionvector)。源自这一系统的病毒表达载体通常使用强的病毒多角体蛋白基因启动子来驱动异源基因的表达。一般参看O'Reilly等人,BaculovirusExpressionVectors:ALaboratoryManual(1992)。在将外来基因插入杆状病毒基因组之前,通常将上述组件(包含启动子、前导序列(视需要)、所关注的编码序列和转录终止序列)组装成中间移位构筑体(intermediatetransplacementconstruct)(转移载体)。中间移位构筑体通常保持在复制子中,诸如能够在宿主(诸如细菌)中稳定保持的染色体外元件(例如,质粒)。复制子将具有复制系统,因此使其能够保持在适当宿主中以供克隆和扩增。更具体地说,质粒可含有多角体蛋白聚腺苦酸化信号(Miller,Ann.Rev.Microbiol.(1988)42:177)和原核生物氨比西林(ampicillin)抗性(aw/7)基因和复制起点以在大肠杆菌中选择和繁殖。将外来基因引入AcNPV的一种常用转移载体为pAc373。也已设计出许多所属领域技术人员已知的其它载体,包括(例如)pVL985,其将多角体蛋白起始密码子从ATG变为ATT并且在ATT下游32个碱基对处引入BamHI克隆位点。参看Luckow和Summers,VIROLOGY170:31(1989)。其它市售载体包括(例如)PBlueBac4.5/V5-His、pBlueBacHis2、pMelBac、pBlueBac4.5(InvitrogenCorp.,Carlsbad,CA)。插入异源基因后,将转移栽体和野生型杆状病毒基因组共转染到昆虫细胞宿主中。将异源DNA引入杆状病毒中所需位点中的方法已为所属领域所知。参看Suimners和Smith,TexasAgriculturalExperimentStationBulletinNo.1555(1987);Smith等人,MOL.CELL.Biol.(1983)3:2156;Luckow和Summers,VIROLOGY(1989)170:31。举例来说,可通过同源双交换重组插入到基因(诸如多角体蛋白基因)中;也可插入到工程设计于所需杆状病毒基因中的限制性酶位点中。参看Miller等人,BIOESSAYS(1989)11(4):91。转染可通过电穿孔实现。参看Trotter和Wood,39MethodsINMolecularBiology(1995);Mann和King,J.Gen.Virol.(1989)70:3501。或者,可使用脂质体利用重组表达载体和杆状病毒转染昆虫细胞。例如参看Liebman等人,Biotechniques(1999)26(l):36;Graves等人,Biochemistry(1998)37:6050;Nomura等人,J.Biol.Chem.(1998)273(22):13570;Schmidt等人,ProteinExpressionandPurification(1998)12:323;Siffert等人,NatureGenetics(1998)18:45;Tilkins等人,CellBiology:ALaboratoryHandbook145-154(1998);Cai等人,ProteinExpressionandPurification(1997)10:263;Dolphin等人,NatureGenetics(1997)17:491;Kost等人,Gene(1997)1卯:139;Jakobsson等人,J.Biol.Chem.(1996)271:22203;Rowles等人,J.Biol.Chem.(1996)271(37):22376;Reverey等人,J.Biol.Chem.(1996)271(39):23607-10;Stanley等人,J.Biol.Chem.(1995)270:4121;Sisk等人,J.VIROL.(1994)68(2):766;和Peng等人,BIOTECHNIQUES(1993)14(2):274。市售脂质体包括(例如)Cellfecti禱和Lipofectin(Invitrogen,Corp.,Carlsbad,CA)。此外,还可使用磷酸钓转染法。参看Trotter和Wood,39MethodsinMolecularBiology(1995);Kitts,NAR(1990)18(19):5667;和Mann和King,J.Gen.Virol.(1989)70:3501。杆状病毒表达载体通常含有杆状病毒启动子。杆状病毒启动子是能够结合杆状病毒RNA聚合酶并且起始编码序列(例如,结构基因)下游(3')转录成mRNA的任何DNA序列。启动子将具有通常放在接近编码序列5'端的转录起始区。所述转录起始区通常包括RNA聚合酶结合位点和转录起始位点。杆状病毒启动子也可具有称为增强子的第二域,如果存在,那么其通常在结构基因的远端。此外,表达可为经调控表达或组成性表达。在感染循环的后期大量转录的结构基因提供特别有用的启动子序列。实例包括从编石马病毒多角体蛋白的基因(Friesen等人,J7/eiegw/af/owo/Sacw/ov/nwGewe五x/^esi7.ow,在THEMOLECULARBiologyOFBaculovi腦s(1986)中;EP0127839和0155476)和编码p10蛋白的基因(Vlak等人,J.Gen.Virol.(1988)69:765)得到的序列。将新近形成的杆状病毒表达载体包装于感染性重组杆状病毒中并且随后可通过所属领域技术人员已知的技术对所生长的斑块进行纯化。参看Miller等人,BIOESSAYS(1989)11(4):91;Summers和Smith,TexasAgriculturalExperimentStationBulletinNo.1555(1987)。已研发出重组杆状病毒表达载体以感染到若干昆虫细胞中。举例来说,已研发出重组杆状病毒用于(尤其)埃及斑蚊(ATCC第CCL-125号)、家蚕(ATCC第CRL-8910号)、黑腹果蝇(ATCC第1963号)、草地贪夜蛾和粉紋夜蛾。参看Wright,Nature(1986)321:718;Carbonell等人,J.VIROL.(1985)56:153;Smith等人,Mol.Cell.Biol.(1983)3:2156。一般参看Fraser等人,/"附raCe止Dev.Biol.(1989)25:225。更具体来说,用于杆状病毒表达载体系统的细胞系通常包括(但不限于)Sf9(草地贪夜蛾)(ATCC第CRL-1711号)、Sf21(草地贪夜蛾)(InvitrogenCorp"目录号11497-013(Carlsbad,CA))、Tri-368(粉紋夜蛾)和High-FiveBTI-TN-5B1-4(粉紋夜蛾)。细胞和培养基可为市售以用于在杆状病毒/表达中直接表达和融合表达异源多肽,并且细胞培养技术一般为所属领域技术人员所知。义應^麥、疯卓^霧^;^^&^核##所属领域技术人员已知细菌表达技术。多种载体可用于细菌宿主中。所述载体可以为单一拷贝或者低或高多拷贝载体。载体可用于克隆和/或表达。鉴于存在有关载体、许多载体市面有售以及甚至描述载体和其限制性图语与特征的手册的大量文献,此处就不需要多加论述。众所周知,载体通常涉及允许选择的标记,这些标记可提供细胞毒性剂抗性、原养性或免疫性。通常,存在将提供不同特征的多种标记。细菌启动子是能够结合细菌RNA聚合酶并且起始编码序列(例如,结构基因)下游(3')转录成mRNA的任何DNA序列。启动子将具有通常放在接近编码序列5'端的转录起始区。所述转录起始区通常包括RNA聚合酶结合位点和转录起始位点。细菌启动子也可具有称为操纵子的第二域,其可与开始RNA合成的相邻RNA聚合酶结合位点重叠。当基因阻遏蛋白可结合操纵子并且由此抑制特定基因的转录时,操纵子允许负调控(可诱导)转录。组成性表达可在不存在负调控元件(诸如操纵子)的情况下发生。此外,可通过基因活化蛋白结合序列(如果存在,则通常邻近(5')RNA聚合酶结合序列)实现正调控。基因活化蛋白的实例为分解代谢物活化蛋白(CAP),其帮助起始大肠杆菌中lac操纵子的转录[Raibaud等人,Annu.Rev.Genet.(1984)18:173]。因此,调控表达可为正或负调控表达,由此增强或减弱转录。编码代谢路径酶的序列提供特别有用的启动子序列。实例包括自糖代谢酶获得的启动子序列,诸如,半乳糖、乳糖(lac)[Chang等人,NATURE(1977)198:1056]和麦芽糖。其它实例包括自生物合成酶获得的启动子序列,诸如色氨酸(trp)[Goeddel等人,Nuc.ACIDSRES.(1980)8:4057;Yelverton等人,Nucl.AcidsRes.(1981)9:731;美国专利第4,738,921号;EP公开案第036776号和第121775号,其是以引用的方式并入本文中〗。P-半乳糖苷酶(bla)启动子系统[Weissmann(1981)"Thecloningofinterferonandothermistakes."InInterferon3(Ed.I.Gresser)]、噬菌体XPL[Shimatake等人,Nature(1981)292:128]和T5[美国专利第4,689,406号,其是以引用的方式并入本文]启动子系统也提供有用的启动子序列。可使用强启动子(诸如T7启动子)以高水平诱导所关注的多肽。所述载体的实例已为所属领域技术人员所知并且包括来自Novagen的pET29系列和WO99/05297(其是以引用的方式并入本文)中所述的pPOP载体。所述表达系统在不损害宿主细胞的活力或生长参数的情况下于宿主中产生高水平的多肽。pET19(Novagen)为所属领域已知的另一载体。此外,自然界中不存在的合成启动子也可充当细菌启动子。举例来说,可将一种细菌或噬菌体启动子的转录活化序列与另一种细菌或噬菌体启动子的操纵子序列连接,从而产生合成杂合启动子[美国专利第4,551,433号,其是以引用的方式并入本文中]。举例来说,tac启动子为由trp启动子与lac操纵子序列构成的杂合trp-lac启动子,其受到lac阻遏子调控[Amann等人,Gene(1983)25:167;deBoer等人,Proc.Natl.Acad.Sci.(1983)80:21]。此外,细菌启动子可包括具有结合细菌RNA聚合酶并且起始转录的能力的非细菌来源的天然存在启动子。也可将非细菌来源的天然存在的启动子与可相容的RNA聚合物偶联以使一些基因在原核生物中高水平表达。噬菌体T7RNA聚合酶/启动子系统为偶联启动子系统的实例[Studier等人,J.Mol.BIOL.(1986)189:113;Tabor等人,ProcNatl.Acad.Sci.(1985)82:1074]。此外,杂合启动子也可由噬菌体启动子和大肠杆菌操纵子区构成(EP公开案第267851号)。除起作用的启动子序列外,有效的核糖体结合位点对于原核生物中外来基因的表达也有用。在大肠杆菌中,核糖体结合位点被称为Shine-Dalgarno(SD)序列并且包括起始密码子(ATG)和位于起始密码子上游3-11个核苷酸处3-9个核苷酸长的序列[Shine等人,Nature(1975)254:34]。认为SD序列通过SD序列与大肠杆菌16SrRNA的3'端之间的碱基配对来促进mRNA与核糖体的结合[Steitz等人"GeneticsignalsandnucleotidesequencesinmessengerRNA",InBiologicalRegulationandDevelopment:GeneExpression(R.F.Goldberger编,1979)]。为表达具有弱核糖体结合位点的真核基因和原核基因[Sambrook等人"ExpressionofclonedgenesinEscherichiacoli",MolecularCloning:ALaboratoryManual,1989]。术语"细菌宿主"或"细菌宿主细胞"是指可用作重组载体或其它转移DNA的受体或已用作重组载体或其它转移DNA的受体的细菌。所述术语包括已经转染的原始细菌宿主细胞的子代。应了解,由于存在偶发突变或有意突变,单一亲代细胞的子代的形态或基因組或总DNA补体可不必与原始亲本完全相同。与亲本足够相似以通过相关特性(诸如,编码所关注的多肽的核苷酸序列的存在)表征的亲本细胞的子代包括在本定义所预期的子代中。表达多肽的适当宿主细菌的选择已为所属领域技术人员所知。在选择供表达的细菌宿主的过程中,适当的宿主可包括经证实尤其具有良好的包涵体形成能力、低的蛋白水解活性和整体稳定性的宿主。细菌宿主一般可从各种来源得到,包括(但不限于)加州大学(Berkeley,CA)生物物理学和医学物理学系细菌基因储备中心和美国典型微生物菌种保藏中心("ATCC,,)(Manassas,VA)。工业/药物发酵一^:使用自K菌抹获得的细菌(例如W3110)或自B菌抹获得的细菌(例如,BL21)。由于这些菌林的生长参数众所周知并且相当稳定,故其特别有用。此外,这些菌林为非病原性菌林,出于安全和环境原因,其在商业上也极为重要。适当大肠杆菌宿主的其它实例包括(但不限于)菌抹BL21、DH10B或其衍生物。在本发明方法的另一个实施例中,大肠杆菌宿主为负蛋白酶菌林(proteaseminusstrain),包括(但不限于)OMP-和LON-。宿主细胞抹可为假单胞菌属,包括(但不限于)荧光假单胞菌、铜绿假单胞菌和恶臭假单胞菌。已知焚光假单胞菌生物型1(称为菌林MB101)对于重组制造有用并且可用于治疗性蛋白质的制造过程中。假单胞菌表达系统的实例包括购自TheDowChemicalCompany的系统作为宿主菌抹(Midland,MI,可在国际互联网dow.com上获得)。美国专利第4,755,465号和第4,859,600号(以引用的方式并入本文中)中描述假单胞菌菌抹作为宿主细胞用于hGH制造的用途。在产生重组宿主细胞林(即,已将表达构筑体引入宿主细胞中并且将具有适当表达构筑体的宿主细胞分离)后,在适于制造所关注的多肽的条件下培养所述重组宿主细胞林。如所属领域技术人员显而易见,重组宿主细胞抹的培养方法将视所利用的表达构筑体的性质和宿主细胞的身份而定。通常使用所属领域众所周知的方法来培养重组宿主菌林。重组宿主细胞通常是在含有可吸收的碳源、氮源和无机盐源并且视情况含有维生素、氨基酸、生长因子和所属领域技术人员已知的其它蛋白质培养补充物的液体培养基中培养。培养宿主细胞的液体培养基可视情况含有用于防止不需要的微生物生长的抗生素或抗真菌剂,和/或用于选择含有表达载体的宿主细胞的化合物,包括(但不限于)抗生素。可以分批或连续方式培养重组宿主细胞,且以分批或连续方式进行细胞采集(在所关注的多肽在细胞内积累的情况中)或进行培养物上清液的采集。对于在原核宿主细胞中制造来说,优选分批培养和细胞采集。选择性密码子本发明的选择性密码子扩展蛋白质生物合成机器的遗传密码子框架。举例来说,选择性密码子包括(例如)独特的三碱基密码子;无义密码子,诸如终止密码子,包括(但不限于)琥珀密码子(UAG)、赭石密码子或蛋白石密码子(UGA);非天然密码子;四碱基(或更多碱基)密码子;稀有密码子等。可将多个(例如一个或一个以上、两个或两个以上、三个或三个以上等)选择性密码子引入所需基因或多肽中。在一个实施例中,所述方法涉及使用为终止密码子的选择性密码子以在活体内并入所选氨基酸(例如,非天然氨基酸)。举例来说,制造识别终止密码子并且通过O-RS用所选氨基酸氨酰基化的O-tRNA。天然存在的宿主氨酰基tRNA合成酶不识别所述O-tRNA。可使用常规定点诱变将终止密码子引入所关注的多肽中的所关注的位点处。侈']:ft口参看Sayers,J.R.等人(1988),5'-3'五xowwc/eosesp^os/Aon3f/n'oflfe-6oset/o//gowwc/eo^fe-A>e"ed附wtogewes/s.NucleicAcidsRes.16:791-802。当例^口在活体内^夸O-RS、O-tRNA和编码所关注的多肽的核酸组合时,响应终止密码子而并入所选氨基酸从而得到在特定位置处含有所选氨基酸(例如,非天然氨基酸)的多肽。在本发明的一个实施例中,用作选择性密码子的终止密码子为琥珀密码子UAG和/或蛋白石密码子UGA。举例来说,有关识别琥珀密码子的O-tRNA的实例参看SEQIDNO.:6,并且有关识别蛋白石密码子的O-tRNA的实例参看SEQIDNO.:7。将UAG和UGA用作选择性密码子的遗传密码可在保留赭石无义密码子UAA(其为最丰富的终止信号)的同时编码22个氨基酸。在活体内并入所选氨基酸(例如,非天然氨基酸)可在不显著干扰宿主细胞的情况下进行。举例来说,在非真核细胞(诸如大肠杆菌)中,由于UAG密码子的抑制效率视O-tRNA(例如,琥珀抑制性tRNA)与释放因子1(RF1)(其与UAG密码子结合并且起始正在生长的肽从核糖体释放)之间的竟争而定,故所述抑制效率可(例如)通过增加O-tRNA(例如,抑制性tRNA)的表达水平或使用RF1缺陷型菌抹来加以调节。在真核细胞中,由于UAG密码子的抑制效率视O-tRNA(例如,琥珀抑制性tRNA)与真核释放因子(例如,eRF)(其结合终止密码子并且起始正在生长的肽从核糖体释放)之间的竟争而定,故所述抑制效率可(例如)通过增加O-tRNA(例如,抑制性tRNA)的表达水平来加以调节。非天然氨基酸也可用稀有密码子来编码。举例来说,当活体外蛋白质合成反应中精氨酸的浓度降低时,经证实,稀有的精氨酸密码子AGG对于通过经丙氨酸酰基化的合成tRNA插入Ala有效。例如参看Ma等人,Biochemistry.32:7939(1993)。在这一情况中,合成tRNA与在大肠杆菌中作为少量物质存在的天然存在的tRNAArg竟争。一些有机体不使用所有三联体密码子。已将藤黄微球菌(M/ctococcm/w^m)中的未指定密码子AGA用于在活体外转录/翻译提取物中插入氨基酸。例如参看Kowal和Oliver,Nucl.Acid.Res..25:4685(1997)。可产生本发明的组件以在活体内使用这些稀有密码子。选择性密码子也包含扩充的密码子,例如四个或四个以上碱基的密码子,诸如四碱基密码子、五碱基密码子、六碱基密码子或更多个碱基的密码子。四碱基密码子的实例包括(但不限于)AGGA、CUAG、UAGA、CCCU等。五碱基密码子的实例包括(但不P艮于)AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。特征可包括基于移码抑制使用扩充的密码子。四个或四个以上石咸基的密码子可将(例如)一个或多个所选氨基酸(包括但不限于,非天然氨基酸)插入同一蛋白质中。举例来说,在存在具有反密码子环、例如具有CU(X)nXXXAA序歹'J(其中n=l)的突变O-tRNA(例如,特定移码抑制性tRNA)的情况下,将四个或四个以上碱基的密码子读作单一氨基酸。举例来说,有关识别四碱基密码子的O-tRNA参看PCT/US04/22061的SEQIDNO.:6、12。在其它实施例中,反密码子环可解码(例如)至少四碱基密码子、至少五碱基密码子或至少六碱基密码子或更多碱基的密码子。由于存在256个可能的四碱基密码子,故可在同一细胞中使用四个或四个以上碱基的密码子编码多个非天然氨基酸。参看Anderson等人,(2002)f/eo/CWow^""'codo"57ze,ChemistryandBiology,9:237-244;Magliery,(2001)五xp朋WwgGewWcCWe:5We"/o"o/^c/eWSw/;pr咖oryJ/praac/^sc/zm'c/n'aco//,J.Mol.Biol.307:755-769。举例来说,已使用四碱基密码子使用活体外生物合成方法将非天然氨基酸并入蛋白质中。例如参看Ma等人,(1993)Biochemistry,32:7939;和Hohsaka等人,(1999)J.Am.Chem.Soc.121:34。使用CGGG和AGGU利用两个以化学方式酰基化的移码抑制性tRNA在活体外将2-萘基丙氨酸和赖氨酸的NBD衍生物同时并入抗生蛋白链菌素中。例如参看Hohsaka等人.(1999、J.Am.Chem.Soc.121:12194。在活体内研究中,Moore等人检查具有NCUA反密码子的tRNALeu衍生物抑制UAGN密码子(N可为U、A、G或C)的能力,并且发现四联体UAGA可以通过具有UCUA反密码子的tRNALeu以13%到26%的效率解码且在0或-1框内极少解码。参看Moore等人,(2000)J.Mol.Biol.298:195。在一个实施例中,可将基于稀有密码子或无义密码子的扩充的密码子用于本发明中,其可减少错义通读和其它不合需要的位点处的移码抑制。对于指定系统来说,选择性密码子也可包括一个天然三碱基密码子,其中内源系统不使用(或极少使用)天然碱基密码子。举例来说,这包括缺乏识别天然三碱基密码子的tRNA的系统和/或三碱基密码子为稀有密码子的系统。选择性密码子视情况包括非天然碱基对。这些非天然碱基对使现有的遗传代码进一步扩展。一种额外的碱基对使三联体密码子的数量从64增加到125。第三碱基对的特性包括稳定且具选择性的碱基配对、通过聚合酶以高保真度有效酶促并入DNA中和合成新的非天然碱基对之后有效的持续引物延伸。可用于方法和组合物的非天然碱基对的描述包括(例如)Hirao等人,(2002)w朋她ra/6cwe/or/"corpora/iwgoww'wofl朋/ogwes/咖/rato'",NatureBiotechnology,20:177-182。还参看Wu,Y.等人,(2002)J.Am.Chem.Soc.124:14626-14630。其它相关公开案列于下文中。对于活体内使用来说,非天然核苷可渗透膜并且磷酸化形成相应的三磷酸盐。此外,增加的遗传信息稳定并且不^t细胞酶所^:坏。Benner和其它人先前的工作利用不同于规^范Watson-Crick配对的氢键:才莫式,最值得关注的实例为iso-C:iso-G配对。例如参看Switzer等人,(1989)J.Am.Chem.Soc,111:8322;和Piccirilli等人,(19卯)Nature,343:33;Kool,(2000、Curr.Opin.Chem.Biol..4:602。一般说来,这些碱基以某种程度与天然碱基错配并且无法酶促复制。Kool和同事证实,碱基之间的疏水堆积相互作用可替代氢键以驱动碱基对的形成。参看Kool,(2000)Curr.Opin.Chem.Biol.4:602:和Guckian和Kool,(1998)Angew.Chem.Int.Ed.Engl.36,2825。在研发满足所有上述需求的非天然碱基对的工作中,Schultz、Romesberg和同事已系统地合成一系列非天然疏水碱基并且对其进行研究。已发现,PICS:PICS自身配对比天然碱基对稳定,并且能够通过大肠杆菌DNA聚合酶I的Klenow片段(KF)有效地并入DNA中。例如参看McMinn等人,(1999)J.Am.Chem.Soc.121:11585-6;和Ogawa等人,(2000)J.Am.Chem.Soc,122:3274。3MN:3MN自身配对可通过KF以足以用于生物功能的效率和选择性合成。例如参看Ogawa等人,(2000)J.Am.Chem.Soc,122:8803。然而,两种碱基都充当用于进一步复制的链终止子。近来已开发出可用于复制PICS自身配对的突变体DNA聚合酶。此外,可复制7AI自身配对。例如参看Tae等人,(2001)J.Am.Chem.Soc,123:7439。也已开发出新颖的金属碱基对Dipic:Py,其在结合Cu(II)后形成稳定的配对。参看Meggers等人,(2000)J.Am.Chem.§^122:10714。由于扩充的密码子和非天然密码子内在地与天然密码子正交,故本发明的方法可利用这一特性产生正交tRNA供其使用。也可使用翻译旁路系统将所选氨基酸(例如,非天然氨基酸)并入所需多肽中。在翻译旁路系统中,将较大序列插入基因中但并不被翻译成蛋白质。所述序列含有充当诱导核糖体越过所述序列并且在插入下游重新开始翻译的线索的结构。经选择且非天然的氨基酸如本文所使用,所选氨基酸是指任何所需的天然存在的氨基酸或非天然氨基酸。天然存在的氨基酸包括二十种遗传编码的a-氨基酸中的任一种丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲疏氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。在一个实施例中,将所选氨基酸以高保真度(例如)以对指定的选择性密码子大于约70%的效率、对指定的选择性密码子大于75%的效率、对指定的选择性密码子大于约80%的效率、对指定的选择性密码子大于约85%的效率、对指定的选择性密码子大于约90%的效率、对指定的选择性密码子大于约95%的效率或对指定的选择性密码子大于约99%或更高的效率并入正在生长的多肽链中。如本文所使用,非天然氨基酸是指任何氨基酸、经修饰氨基酸或除硒代半胱氨酸和/或吡咯赖氨酸和以下二十种遗传编码的a-氨基酸外的氨基酸类似物丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、曱硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。a-氨基酸的通用结构如式I中所示非天然氨基酸通常为具有式I的任何结构,其中R基团为除二十种天然氨基酸中所用基团外的任何取代基。有关二十种天然氨基酸的结构例如参看L.Stryer的说oc/2e/m'sfr乂第3版1988,FreemanandCompany,NewYork。应注意,本发明的非天然氨基酸可为除上述二十种a-氨基酸外的天然存在的化合物。由于本发明的非天然氨基酸与天然氨基酸的不同之处通常仅在于侧链的结构,故非天然氨基酸与其它氨基酸(包括(但不限于)天然或非天然)以与其在天然存在的蛋白质中形成酰胺键相同的方式形成酰胺键。然而,非天然氨基酸具有使其与天然氨基酸相区别的侧链基团。举例来说,式I的R可包含烷基-、芳基-、酰基-、酮基-、叠氮基-、羟基-、肼、氰基-、面基-、酰肼、烯基、炔基、醚、硫醇、励基-、磺酰基-、硼酸酯基(borate)、硼酸酯基(boronate)、磷酸基、膦酰基、膦、杂环、烯酮、亚胺、醛、酉旨、硫代酸、羟胺、胺等,或其任何组合。其它非天然存在氨基酸包括(但不限于)包含感光交联剂的氨基酸、自旋标记的氨基酸、荧光氨基酸、结合金属的氨基酸、含金属的氨基酸、放射性氨基酸、具有新颖官能团的氨基酸、与其它分子共价或非共价相互作用的氨基酸、光笼锁(photocaged)和/或光致异构化氨基酸、包含生物素或生物素类似物的氨基酸、糖基化氨基酸(诸如经糖取代的丝氨酸)、其它碳水化合物修饰的氨基酸、含酮基氨基酸、包含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、可化学裂解和/或可光裂解的氨基酸、与天然氨基酸相比具有较长侧链(包括但不限于,聚醚或长链烃,包括但不限于,大于约5个或大于约10个碳原子)的氨基酸、含碳连接的糖的氨基酸、具有氧化还原活性的氨基酸、含有氨基硫代酸的氨基酸和包含一个或一个以上有毒部分的氨基酸。也参看美国专利申请公开案2003/0082575和2003/0108885,其是以引用的方式并入本文中。非天然氨基酸可具有用于(例如)将蛋白质与固体支撑物连接的感光交联剂。非天然氨基酸可具有连接到氨基酸侧链的糖部分。除含有新颖侧链的非天然氨基酸外,非天然氨基酸还视情况包含经修饰的主链结构,例如,如式II和III的结构所示<formula>formulaseeoriginaldocumentpage44</formula>其中Z通常包含OH、NH2、SH、NH-R'或S-R';X和Y可相同或不同且通常包含S或0;且R和R'视情况相同或不同且通常选自与上文关于具有式I的非天然氨基酸所述的R基的组分相同的列表以及氢。举例来说,如式II和III所示,非天然氨基酸可在氨基或羧基上包含取代。此类非天然氨基酸包括(但不限于)(例如)具有与常见二十种天然氨基酸相对应的侧链或非天然侧链的a-羟基酸、a-硫代酸、a-氨基硫代羧酸酯。此外,a-碳的取代视情况包括L、D或a-a双取代氨基酸,诸如D-谷氨酸、D-丙氨酸、D-曱基-O-酪氨酸、氨基丁酸等。其它结构替代选择包括环状氨基酸,诸如脯胺酸类似物以及3、4、6、7、8和9元环脯胺酸类似物;(3和y氨基酸,诸如经取代p-丙氨酸和y-氨基丁酸。许多非天然氨基酸都是建立在天然氨基酸(诸如酪氨酸、谷氨酰胺、苯丙氨酸等)的基础上。酪氨酸类似物包括对位取代的酪氨酸、邻位取代的酪氨酸和间位取代的酪氨酸,其中所述经取代酪氨酸包含酮基(包括但不限于,乙酰基)、苯曱酰基、氨基、肼、羟胺、硫醇基、羧基、异丙基、曱基、Cs-C2o直链或支链烃、饱和或不饱和烃、O-曱基、聚瞇基、硝基等。此外,也涵盖多取代的芳环。谷氨酰胺类似物包括(但不限于)a-羟基衍生物、y取代的衍生物、环状衍生物和酰胺取代的谷氨酰胺衍生物。苯丙氨酸类似物的实例包括(但不限于)对位取代的苯丙氨酸、邻位取代的苯丙氨酸和间位取代的苯丙氨酸,其中所述取代基包含羟基、曱氧基、曱基、烯丙基、醛、叠氮基、碘基、溴基、酮基(包括但不限于,乙酰基)等。非天然氨基酸的特定实例包括(但不限于)对乙酰基-L-苯丙氨酸、对炔丙基-苯丙氨酸、O-曱基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-曱基-苯丙氨酸、0-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙酰基-GlcNAcp-丝氨酸、L-多巴(L-Dopa)、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对叠氮基-L-苯丙氨酸、对酰基-L-苯丙氨酸、对苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、膦酰基丝氨酸、膦酰基酪氨酸、对碘-苯丙氨酸、对溴苯丙氨酸、对氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸和对炔丙基氧基-苯丙氨酸等。多种非天然氨基酸的结构的实例提供于(例如)名称为"Invivoincorporationofunnaturalaminoacids,,的WO2002/085923中,其是以引用的方式并入本文中。关于其它曱石危氨酸类似物参看Kiick等人,(2002)/"corpom"owo/az/c/es/WorecomWwaW/7r0e/ws/orc/ewcwe/ec"ve附odzycaf/ow6少5^awfi/wger//gaf/ow,PNAS99:19-24,其是p乂引用的方式并入本文中。并入多肽的氨基末端处的非天然氨基酸可由除二十种天然氨基酸中所使用的取代基以外的任何取代基R基和不同于通常存在于a-氨基酸中的NH2基团的第二反应性基团(参看式I)构成。具有不同于通常存在于a-氨基酸中的COOH基团的第二反应性基团(参看式I)的类似非天然氨基酸可并入羧基末端处。本发明的非天然氨基酸可经选择或经设计以提供二十种天然氨基酸不可得的额外特征。举例来说,可视情况对非天然氨基酸进行设计或选择以改变(例如)并入所迷氨基酸的蛋白质的生物特性。举例来说,可视情况通过将非天然氨基酸包涵于蛋白质中来改变以下特性毒性、生物学分布、溶解性、稳定性(例如,热稳定性、水解稳定性、氧化稳定性、对酶降解的抗性等)、纯化和加工的便利性、结构特性、光谱特性、化学和/或光化学特性、催化活性、氧化还原电位、半衰期、与其它分子(例如)共价或非共价反应的能力等。多种非天然氨基酸的结构提供于(例如)名称为"Invivoincorporationofunnaturalaminoacids"的WO2002/085923的图16、17、18、19、26和29中,其是以引用的方式并入本文中。所述实例不打算以任何方式限制可与本发明的tRNA连接的氨基酸。非天然氨基酸的一个优势在于,其提供可用于加入额外分子的额外化学部分。这些修饰可在活体内于真核或非真核细胞中或活体外进行。因此,在某些实施例中,翻译后修饰是通过非天然氨基酸进行。多肽中的非天然氨基酸可用于将另一分子与所述多肽连接,所述分子包括(但不限于)标记、染料、聚合物、水溶性聚合物、聚乙二醇衍生物、光交联剂、放射性核、细胞毒性化合物、药物、亲和标记、光亲和标记、反应性化合物、树脂、第二蛋白或多肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅助因子、脂肪酸、碳水化合物、聚核苦酸、DNA、RNA、反义聚核苷酸、糖类、水溶性树枝状高分子、环糊精、抑制性核糖核酸、生物材料、纳米颗粒、自旋标记、荧光团、含金属部分、放射性部分、新颖官能团、与其它分子共价或非共价相互作用的基团、光笼锁部分(photocagedmoiety)、光化辐射可激发部分、光致异构化部分、生物素、生物素衍生物、生物素类似物、并入重原子的部分、化学方式可裂解基团、光可裂解基团、延长的侧链、经碳连接的糖、氧化还原活性剂、氨基硫代酸、有毒部分、经同位素标记部分、生物物理学探针、发磷光基团、化学发光基团、电子致密基团、磁性基团、插入基团、发色团、能量转移剂、生物活性剂、可检测标记、小分子、量子点、纳米传导物或上述物质的任何组合或任何其它所需化合物或物质;所述连接包含利用所属领域技术人员已知的适用于特定反应性基团的化学方法将第二反应性基团与至少一个包含第一反应性基团的非天然氨基酸连接。举例来说,翻译后修饰可通过亲核-亲电反应进行。目前用于选择性修饰蛋白质的大部分反应都涉及在亲核与亲电反应搭配物之间形成共价键,包括(但不限于)a-囟酮与组氨酸或半胱氨酸侧链的反应。在这些情况下,选择性是通过蛋白质中亲核残基的数量和可接近性决定。在本发明的蛋白质中,可使用其它更具选择性的反应,诸如非天然酮基氨基酸与酰肼或氨基氧基化合物于活体外和活体内进行的反应。例如参看Comish等人,(1996)J.Am.Chem.Soc.118:8150-8151;Mahal等人,(1997)Science.276:1125-1128;Wang等人,(2001)Science292:498-500;Chin等人,(2002)J.Am.Chem.Soc.124:卯26-9027;Chin等人,(2002)Proc.Natl.Acad.Sci.,99:11020-11024:Wang等人,(2003)Proc.Natl.Acad.Sci.,100:56-61;Zhang等人,(2003)Biochemistry,42:6735-6746;和Chin等人.(2003)Science,301:964-7,所有参考文献都是以引用的方式并入本文中。这使得能够用包括荧光团、交联剂、糖衍生物和细胞毒性分子的大量试剂选择性标记几乎任何蛋白质。也参看名称为"Glycoproteinsynthesis"的美国专利第6,927,042号,其是以引用的方式并入本文中。翻译后修饰(包括但不限于,通过叠氮基氨基酸进行的修饰)也可通过施陶丁格连接(Staudingerligation)(包括但不限于,利用三芳基膦试剂)进行。例如参看Kiick等人,(2002)/wcorpora"owo/az/cfes/wforeco附6她w/"/>rafez>w/orc/2e,se/e"/ve,i/zyc加'ow6少AeS似w&wger//ga/7'ow,PNAS99:19-24。非天然氨基酸的化学合成许多非天然氨基酸都是购自(例如)Sigma-Aldrich(St.Louis,MO,USA)、Novabiochem(EMDBiosciences的分公司,Darmstadt,Germany)或Peptech(Burlington,MA,USA)。非市售的非天然氨基酸是视情况如本文所提供或使用所属领域技术人员已知的标准方法合成。有关有冲几合成技术,例如参看Fessendon和Fessendon的OrganicChemistry,(1982,第2版,WillardGrantPress,BostonMass.);March的AdvancedOrganicChemistry(第3版,1985,WileyandSons,NewYork);以及Carey和Sundberg的AdvancedOrganicChemistry(第3版,第A和B部分,19卯,PlenumPress,NewYork)。描述非天然氨基酸的合成的其它公开案包括(例如)名称为"InvivoincorporationofUnnaturalAminoAcids,,的WO2002/085923;Matsoukas等人,(1995)J.Med.Chem..38,4660-4669;King,F.E.&Kidd,D.A.A.(1949)JiView5^w/力es"o/G7w,a;w/wecr/w/0/y-Dz》ep"V/eso/G7"Z"w/cJc/d々ow户/^/2y/a^ec//w"rwed/fl&s.j.Chem.Soc,3315-3319;Friedman,O.M.&Chatterrji,R.(1959)Sy"^2e57.51o/Z)en'va/7veso/G/w^wi/weasMoJe/SwZ)Wraf/e51/orJw/i-Tlwworj.Am.Chem.Soc.81,3750-3752;Craig,j.C.等人(1988)愈o/w/eC—g固"owo/Ae(ICTz/orogMz'wej.j.Org.Chem.53,1167-1170;Azoulay,M.,Vilmont,M.&Frappier,F.G/w^/w/wetma/ogwesas_PoZew/ia/Jwf/wa/aWa/s,Eur.J.Med.Chem.26,201-5;Koskinen,A.M.P.&Rapoport,H.(1989)外威e^o/4-SW65f/加eciVo/fwesas1Co"/or附加'owa〃yCow欲cn'we"/m-""c7'"wa/ogwes.J.Org.Chem.54,1859-1866;Christie,B.D.&Rapoport,H.(1985)0/Pp/ica〃y_Pwe尸z》eco/fl/e51女om丄-爿5^flrflg/"e.J/Tp/Zcaf/owJ.Org.Chem.50:1239-1246;Barton等人,(1987)外w&e;^o/iVove/—/m-J/m'wo-Jc/AawfiZ)er/vWvej[Zs7wgicrc//cfl/C77em/价乂'5^"//^/51o/丄-awe/Dm'vWves.Tetrahedron43:4297-4308;和Subasinghe等人,Qw/wwa//cac/c/flwa/ogww5^w/72e57'so/2-a附z.Mo/^o/7flMo/caddt/m.vWvesa"/v//yawove/—5^w/她-5^w础zedWe.J.Med.Chem.35:4602-7。还参看名称为"ProteinArrays,,的美国专利公开案第US2004/0198637号,其是以引用的方式并入本文中。非天然氨基酸的细胞吸收细胞对非天然氨基酸的吸收是在设计和选择(例如)并入蛋白质中的非天然氨基酸时通常考虑的一个问题。举例来说,a-氨基酸的高电荷密度表明这些化合物可能无法渗透细胞。天然氨基酸是通过基于蛋白质的转运系统的收集而吸收到细胞中。可进行评定何种非天然氨基酸(如果存在)被细胞吸收的快速筛选。例如参看,例如名称为"ProteinArrays"的美国专利公开案第US2004/0198637号中的毒性检定,所述专利是以引用的方式并入本文中;和Liu,D.R.&Schultz,P.G.(1999)/Vogre^"wardevo/w"owo/cmorgam'57wawex/flwtfefigewedccocfe.PNASUnitedStates96:4780-4785。尽管易于利用多种检定分析吸收,但设计可用于细胞吸收路径的非天然氨基酸的替代选择在于提供生物合成路径以在活体内产生氨基酸。非天然氨基酸的生物合成许多生物合成路径已存在于细胞中以制造氨基酸和其它化合物。尽管自然界(包括但不限于,细胞)中可能不存在有关特定非天然氨基酸的生物合成方法,但本发明将提供此类方法。举例来说,视情况通过加入新酶或改变现有的宿主细胞路径在宿主细胞中产生非天然氨基酸的生物合成路径。额外的新酶为视情况天然存在的酶或人工开发的酶。举例来说,对氨基苯丙氨酸的生物合成方法(如名称为"Invivoincorporationofunnaturalaminoacids,,的WO2002/085923中的实例所提出)取决于加入来自其它有机体的已知酶的组合。可通过用包含这些酶的基因的质粒转化细胞来将所述基因引入细胞中。当在细胞中表达时,所述基因将提供合成所需化合物的酶促路径。视情况加入的此类酶的实例将提供于下文的实例中。其它酶序列(例如)见于基因库(Genbank)中。也^见情况以相同方式将人工开发的酶加到细胞中。以此方式,对细胞机器和细胞资源加以操纵以制造非天然氨基酸。多种方法可用于制造新颖的酶以用于生物合成路径中或用于发展现有路径。举例来说,视情况使用(例如,如Maxygen,Inc所开发)的递归式重组(可于国际互联网maxygen.com获得)来开发新颖的酶和路径。例如参看Stemmer(1994),iaj!Wevo/w"owo/a戸Wmv"ro房jNature370(4):389-391;和Stemmer,(1994),ev由z》",Proc.Natl.Acad.Sd.USA.,91:10747-10751。类似地,视情况将Genencor(可于国际互联网genencor.com获得)开发的DesignPathTMM于代谢路径工程设计中(例如)工程设计在细胞中产生O-甲基-L-酪氨酸的路径。这一技术使用新基因(包括但不限于,通过功能性基因组鉴别的基因)的组合以及分子进化和设计在宿主有机体中重建现有路径。DiversaCorporation(可于国际互联网diversa.com获得)也提供快速筛选基因文库和基因路径(包括但不限于)以产生新路径的技术。通常,利用本发明的经工程设计的生物合成路径制造的非天然氨基酸是以足以有效细胞资源的程度的浓度产生。活体内以此方式产生的典型浓度为约10mM到约0.05mM。在利用包含用于制造特定路径所需的酶的基因的质粒转化细胞并且产生非天然基酸之后,视情况使用活体内选择以使用于核糖体蛋白质合成和细胞生长的非天然氨基酸的制造进一步优化。核酸和多肽序列以及变异体如上下文所述,本发明提供核酸聚核苷酸序列和多肽氨基酸序列,例如tRNA和RS,以及(例如)包含所迷序列的组合物和方法。所述序列(例如,tRNA和RS)的实例揭示于本文中。然而,所属领域技术人员将了解本发明不限于本文(例如,实例)所揭示的序列。所属领域技术人员将了解,本发明还提供许多具有本文所述的功能(例如,编码O-tRNA或O-RS)的相关和不相关序列。本发明提供多肽(O-RS)和聚核苷酸(例如O-tRNA)、编码O-RS或其部分的聚核苷酸、用于分离氨酰基tRNA合成酶克隆的寡核普酸等。本发明的聚核普酸包括利用一个或一个以上选择性密码子编码本发明的所关注蛋白质或多肽的聚核普酸。此外,本发明的聚核苷酸包括(例如)包含如SEQIDNO.:1、2、3中任一者所述的核苦酸序列的聚核苷酸、与其互补的聚核苷酸或其保守变异体。类似地,在高严格度条件下与实质上超过核酸全长的上文所述的聚核苷酸杂交的核酸为本发明的聚核普酸。在某些实施例中,载体(例如,质粒、柯斯质粒(cosmid)、噬菌体、细菌、病毒、棵聚核苷酸、连结的聚核苷酸等)包含本发明的聚核脊酸。在一个实施例中,载体为表达载体。在另一个实施例中,表达载体包括可操作地连接到一个或一个以上本发明的聚核苷酸的启动子。在另一个实施例中,细胞包含包括本发明的聚核苦酸的载体。所属领域技术人员还将了解,所揭示序列的许多变异体包括在本发明中。举例来说,本发明包括得到在功能上相同的序列的所揭示序列的保守变异体。认为核酸聚核普酸序列的变异体(其中所述变异体与至少一个所揭示序列杂交)包括在本发明中。如通过(例如)标准序列比较技术测定的本文所揭示的序列的独特子序列也包括在本发明中。保守变异体归因于遗传密码的简并性,"沉默取代(silentsubstitution),,(即,不会引起所编码的多肽改变的核酸序列的取代)为编码氨基酸的各核酸序列所暗含的特征。类似地,"保守氨基酸取代"(即,氨基酸序列中一个或数个氨基酸经具有高度相似性的不同氨基酸取代)也易于鉴别为与所揭示的构筑体高度相似。所述各所揭示的序列的保守变异体为本发明的特征。特定核酸序列的"保守变异体"是指编码相同或基本上相同的氨基酸序列的核酸,或当所述核酸不编码氨基酸序列时是指基本上相同的序列。所属领域技术人员将认识到,改变、添加或缺失经编码序列中的单一氨基酸或少量氨基酸的个别取代、缺失或添加为"保守性修饰变异"或"保守性修饰变异体",其中所述改变将导致氨基酸的缺失、氨基酸的添加或化学上类似的氨基酸对氨基酸的取代。因此,本发明所列多肽序列的"保守变异"包括少量、通常小于5%、更通常小于4%、2%或1%的多肽序列的氨基酸经具有相同保守取代基团的保守性所选氨基酸取代。不改变核酸分子的编码活性的序列的添加(诸如,非功能性序列的添加)为基本核酸的保守变异。所属领域技术人员已知提供功能类似的氨基酸的保守取代表。以下八个群组各含有彼此互为保守取代的氨基酸1)丙氨酸(A)、甘氨酸(G);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、赖氨酸(K);5)异亮氨酸(1)、亮氨酸(L)、曱硫氨酸(M)、缬氨酸(V);6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);7)丝氨酸(S)、苏氛酸(T);和8)半胱氨酸(C)、甲硫氨酸(M)(例如参看Creighton,iVoto'朋dMo/ecw/flr/Vo/eWes(WHFreeman&Co.;第2版(1993年12月))。核酸杂交可使用比较杂交来鉴别本发明的核酸,诸如SEQIDNO.:1-3,包括本发明核酸的保守变异体,并且所述比较杂交方法是区别本发明的核酸的优选方法。此外,与SEQIDNO:l-3所示的核酸在高、超高和/或极高严格度条件下杂交的靶核酸为本发明的特征。所述核酸的实例包括与指定的核酸序列相比具有一个或数个沉默或保守核酸取代的核酸。当测试核酸以其与最佳匹配的互补靶杂交的至少1/2水平与探针杂交时,也就是说,以高达探针与靶在最佳匹配的探针以高达关于与不匹配靶核酸所观察的信杂比的至少约5x-10x的信杂比与最佳匹配的互补耙结合的条件下杂交的信杂比的至少1/2信杂比杂交时,认为所述测试核酸与探针核酸特异性杂交。当核酸通常在溶液中締合时,其"杂交"。核酸因存在多种良好表征的物理化学力(诸如氢键、溶剂排斥、碱基堆叠等)而杂交。短语"严格杂交条件"是指如所属领域技术人员所知的低离子强度和高温条件。通常,在严格条件下,探针将与其在核酸复杂混合物(包括但不限于,全细胞或者DNA或RNA文库)中的靶子序列杂交,但不与所述复杂混合物中的其它序列杂交。核酸杂交的广泛指导见于Tijssen(1993)丄Worator少第2章第I部分,"Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays,"(Elsevier,NewYork),以及Ausubel等人,Ci^reWiVotoco/sMo/ecw/ar5Zo/ogy(7P95)中。Hames和Higgins(1995)GeneProbes1IRLPressatOxfordUniversityPress,Oxford,England,(HamesandHigginsl)以及Hames和Higgins(1995)GeneProbes2IRLPressatOxfordUniversityPress,Oxford,England(HamesandHiggins2)中提供有关合成、标记、检测和量化DNA和RNA(包括寡核苷酸)的细节。一般来说,在指定离子强度和pH值下,选择比特定序列的热熔点(Tm)低约5-10。C的严格条件。Tm为与靶互补的50%的探针在平衡状态下与靶序列杂交(当在Tm下靶序列过量存在时,在平衡状态时占据50%探针)的温度(在指定离子强度、pH值和核酸浓度下)。严格条件可为在pH7.0到8.3下盐浓度小于约l.OM钠离子、通常为约0.01到l.OM钠离子浓度(或其它盐)以及温度对于短探针(包括但不限于,10到50个核苦酸)为至少约30。C且对于长探针(包括但不限于,大于50个核苷酸)为至少约6(TC的条件。严格条件也可通过加入去稳定剂(诸如曱酰胺)实现。对于选择性或特异性杂交,正信号可为背景的至少两倍,视情况为背景杂交的10倍。例示性严格杂交条件可如下50%曱酰胺、5xSSC和1。/。SDS,在42。C下培养;或5xSSC、1%SDS,在65。C下培养,且在65。C下于0.2xSSC和0.1%SDS中洗涤。所述洗涤可进行5、15、30、60、120或更多分钟。在Southern印迹或Northern印迹中于过滤器上具有超过100个互补残基的互补核酸杂交的严格杂交条件的实例为42°C,50%福尔马林和1mg肝素,且进行杂交整夜。严格洗涤条件的实例为65°CT0.2xSSC洗涤15分钟(关于SSC緩冲液的描述参看Sambrook等人,M/ecM/arC7om'wg,Z^6ora/wyMa肌a/(第3版2001))。通常,高严格度洗涤是通过低严格度洗涤去除背景探针信号进行。例示性低严格度洗涤是在40。C下以2xSSC洗涤15分钟。一般来说,5x(或更高)于在特定杂交检定中关于不相关探针所观察的信杂比的信杂比指示对于特异性杂交的检测。在有关核酸杂交实验(诸如Southern和Northern杂交)的上下文中,"严格杂交洗涤条件"为序列依赖性,并且在不同环境参数下不同。较长的序列在较高温度下特异性杂交。有关核酸杂交的广泛指导见于Tijssen(1993),河J:X以及Hames和Higgins,1和2,河J:X。任何测试核酸的严格杂交和洗涤条件可易于依经验确定。举例来说,在测定高度严格杂交和洗涤条件的过程中,将杂交和洗涤条件逐渐增加(例如,通过增加温度、降低盐浓度、增加清洁剂浓度和/或增加杂交或洗涤中有机溶剂(诸如福尔马林)的浓度),直到满足所选择的标准规定。举例来说,逐渐增加杂交和洗涤条件,直到探针与最佳匹配的互补靶以高达对于探针与不匹配靶杂交所观察的至少5倍的信杂比结合。选择与特定探针的热熔点(Tm)相等的"极严格"条件。Tm为50%的测试序列与最佳匹配的探针杂交的温度(在指定离子强度和pH值下)。出于本发明的目的,一般地说,选择在指定离子强度和pH值下比特定序列的Tm低约5。C的"高度严格"杂交和洗涤条件。"超高严格度"杂交和洗涤条件为增加杂交和洗涤条件的严格度,直到探针与最佳匹配的互补靶核酸结合的信杂比为高达对于任何不匹配輩巴核酸所观察的至少10倍的条件。据悉,在所述条件下以最佳匹配的互补靶核酸的至少1/2的信杂比与探针杂交的輩巴核酸在超高严格度条件下与所述探针结合。类似地,可通过逐渐增加相关杂交检定的杂交和/或洗涤条件来确定甚至较高水平的严格度。举例来说,增加杂交和洗涤条件的严格度,直到探针与最佳匹配的互补把核酸结合的信杂比为高达对于任何不匹配靶核酸所观察的至少10x、20x、50x、100x或500x或更高倍数。据悉,在所述条件下以最佳匹配的互补靶核酸的至少1/2的信杂比与探针杂交的靶核酸在极高严格度条件下与所述探针结合。如果在严格条件下彼此不杂交的核酸编码的多肽实质上相同,那么所述核酸也实质上相同。例如当使用遗传密码所允许的最大密码子简并性产生核酸拷贝时,出现此情形。独特子序列一方面,本发明提供一种核酸,其包含选自本文所揭示的O-tRNA和O-RS序列的核酸中的独特子序列。独特子序列相比与任何已知的O-tRNA或O-RS核酸序列相对应的核酸为独特的。可使用(例如)设置为默认参数的BLAST进行比对。任何独特子序列都(例如)可用作鉴别本发明的核酸的探针。类似地,本发明包括一种多肽,其包含选自本文所揭示的O-RS序列的多肽中的独特子序列。在本文中,独特子序列相比与已知多肽序列相对应的多肽为独特的。本发明还提供靶核酸,其在严格条件下与编码选自O-RS的序列的多肽中的独特子序列的独特编码寡核苦酸杂交,其中所述独特子序列相比与任何对照多肽相对应的多肽为独特的(例如,通过突变得到本发明的合成酶的亲本序列)。独特子序列是如上文所述确定。序列比较、一致性和同源性在关于两个或两个以上核酸或多肽序列的上下文中,术语"相同,,或"一致性"百分比是指当在比较窗或指定区中比较和比对最大对应性时,如使用下文所述的序列比较算法中的一种(或所属领域技术人员可用的其它算法)或通过手工比对和目测所测量,相同或具有特定的相同氨基酸残基或核苷酸百分比的两个或两个以上序列或子序列。在关于两个核酸或多肽(例如,编码O-tRNA或O-RS的DNA,或O-RS的氨基酸序列)的上下文中,短语"实质上相同"是指当在比较窗或指定区中比较和比对最大对应性时,如使用序列比较算法(或所属领域技术人员可用的其它算法)或通过手工比对和目测所测量,具有至少约60%、约80%、约90-95%、约98%、约99%或更高百分比的核苦酸或氨基酸残基一致性的两个或两个以上序列或子序列。在不提及实际祖先的情况下,通常认为所述"实质上相同"的序列"同源"。"实质一致性"可存在于至少约50个残基长的序列区、至少约100个残基的区域或至少约150个残基的区域,或超过欲比较的两个序列的全长的区域内。为进行序列比较和同源性测定,通常一种序列充当与测试序列相比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机内,视需要指定子序列坐标,并且指定序列算法程序参数。随后序列比较算法基于指定的程序参数计算测试序列相对于参考序列的序列一致性百分比。比对供比较的序列的方法已为所属领域技术人员所知。可(例如)通过Smith&Waterman,Adv.Appl.Math.2:482c(1981)的局部同源性算法、Needleman&Wunsch,LMol.Biol.48:443(1970)的同源性比对算法、Pearson&Lipman,Proc.Nafl.Acad.Sci.USA85:2444(1988)的相似性搜索方法、这些算法的计算机实施(WisconsinGeneticsSoftwarePackage,GeneticsComputerGroup,575ScienceDr.,Madison,WI中的GAP、BESTFIT、FASTA和TFASTA)或通过手工比对和目测(例如参看Ausubel等人,CwreWPrafoco/s/"Mo/ecw/w所o/ogy(1995增补))进行供比较序列的最佳比对。适于测定序列一致性百分比和序列相似性的算法的一个实例为BLAST算法和BLAST2.0算法,其描述于Altschul等人.(1997)M/c.Jcz'Ai仏25:3389-3402;和Altschul等人,J.Mol.Biol.215:403-410(19卯)中。进行BLAST分析的软件可通过可于国际互联网ncbi.nlm.nih.gov访问的美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation)公开获得。所述算法涉及首先通过鉴别询问序列中长度W的短字来鉴别高得分的序列对(highscoringsequencepair,HSP),当与数据库序列中相同长度的字比对时,所述HSP匹配或满足一些正值临界得分T。T是指邻近字的临界分值(neighborhoodwordscorethreshold)(Altschul等人,同上文)。这些初始邻近字匹配(wordhit)充当起始搜索以发现含有其的较长HSP的种子。随后使字匹配沿各序列的两个方向延伸直到可增加累积比对的分值。对核苷酸序列使用参数M(—对匹配残基的奖励分值;通常>0)和N(错配残基的处罚分值,通常<0)计算累积分值。对于氨基酸序列,使用得分矩阵计算累积分值。当累积比对分值比其所得到的最大值低数量X;累积分值因一个或一个以上负得分残基比对的积累而为零或更低;或到达各序列的末端时,在各个方向上的字匹配延伸停止。BLAST算法参数W、T和X将决定比对的敏感性和速度。BLASTN程序(对于核苷酸序列)使用11的字长(W)、10的期望值(expectation,E)、100的截止值、M=5、N;4和两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用3的字长(W)、10的期望值(E)和50的BLOSUM62得分矩阵(参看Henikoff&Henikoff(1992)Proc.Natl.Acad.Sci.USA89:10915)比对(B)、IO的的期望值(E)、M=5、N=-4和两条链的比较作为默认值。BLAST算法通常在"低复杂性"过滤器关闭的情形下进行。除计算序列一致性百分比外,BLAST算法还进行两个序列之间相似性的统计学分析(例如参看Karlin&Altschul,Proc.Nat'l.Acad.Sci.USA90:5873-5787(1993))。BLAST算法所提供的一种相似性量度为最小和概率(smallestsumprobability,P(N)),其提供对于两个核苦酸或氨基酸序列之间偶然出现匹配的概率的指示。举例来说,如果在将测试核酸与参考核酸相比较时,最小和概率小于约0.2、小于约0.01或小于约0.001,那么可认为所述核酸与参考序列相似。诱变和其它分子生物学技术本发明和用于本发明中的聚核苷酸和多肽可使用分子生物学技术进行操纵。可根据常规方法通过定点诱变便利地修饰核普酸序列。另外,可通过化学合成(包括但不限于,使用寡核苦酸合成仪)来制备核苷酸序列,其中根据所需多肽的氨基酸序列且优选选择将产生重组多肽的宿主细胞所青睐的密码子来设计寡核苷酸。举例来说,可合成编码所需多肽的部分的若干小寡核苷酸并且通过PCR、连接或连接链反应加以组装。例如参看Barany等人,尸rac.淑/.^cadSc/.88:189-193(1991);美国专利6,521,427,其是以引用的方式并入本文中。本发明利用重组遗传学领域中的常规技术。揭示用于本发明中的通用方法的基本文本包括Sambrook等人,M9/ecw/"rC/ow/wg,J丄a60m/107Maw認/(第3版2001);Kriegler,Gewe7><ms/er」丄a60m"ryM朋wa/(1990);和Cwrre"//Vofoco/sMo/ecw/w历o/ogy(Ausubel等编,1994))。描述分子生物学技术的通用文本包括Berger和Kimmel,GuidetoMolecularCloningTechniques,MethodsinEnzvmologvvolume152AcademicPress,Inc.,SanDiego,CA(Berger);Sambrook等人,MolecularCloning國ALaboratoryManual(第2版),第1-3巻,ColdSpringHarborLaboratory,ColdSpringHarbor,NewYork,1989("Sambrook,,)和CurrentProtocolsinMolecularBiology,F.M.Ausubel等人编,CurrentProtocols,ajointventurebetweenGreenePublishingAssociates,Inc.和JohnWiley&Sons,Inc.,(1999增补)("Ausubel"))。这些文本描述诱变、载体的使用、启动子和许多其它相关课题,所述课题与(例如)包括用于制造包括所选氨基酸(例如,非天然氨基酸)的蛋白质的选择性密码子的基因或聚核苷酸、正交tRNA、正交合成酶和正交tRNA/正交合成酶对的产生相关。将多类诱变方法用于本发明中以达到多个目的,包括(但不限于)制造新颖的合成酶或tRNA、使tRNA分子突变、制造tRNA文库、使RS分子突变、制造合成酶文库、制造选择性密码子、插入在所关注的蛋白质或多肽中编码所选氨基酸的选择性密码子。其包括(但不限于)定点资变、随机点诱变、同源重组、DNA改组或其它递归式诱变方法、嵌合构建、使用含有尿嘧啶的模板进行的诱变、寡核香酸定向诱变、经硫代磷酸酯修饰的DNA诱变、使用有缺口的双链体DNA等进行的诱变或其任何组合。其它适当的方法包括点错配修复、使用修复缺陷型宿主菌抹进行的诱变、限制性选择和限制性纯化、缺失诱变、通过全基因合成进行的诱变、双链断裂修复等。(包括但不限于)涉及嵌合构筑体的诱变也包括在本发明中。在一个实施例中,可通过天然存在的分子或者改变或突变的天然存在的分子的已知信息(包括但不限于,序列、序列比较、物理特性、二级结构、三级结构或四级结构、晶体结构等)指导诱变。本文中所见的文本和实例描述这些程序。额外信息见于本文所引用的以下公开案和参考文献Ling等人,^ppra^/zes*M"崩扁fagewd'"wovem,,AnalBiochem.254(2》157-178(1997);Dale等人,0//gowwc/eWcfe-<iz>^"e<iram/cw附她ge/^kws/wgj^oyp/2oro^u'o她膨/Zzc^,MethodsMol.Biol,57:369-374(1996);Smith,/"v/加腦/Ggewe57.51,Ann.Rev.Genet.19:423-462(1985);Botstein&Shortle,5^她g7'^anda;Wca"(msW加聽啤ewe减Science229:1193-1201(1985);Carter,57&-A>e"^/附t^"gew^s7XBiochem.J.237:1-7(1986);Kunkel,772e孝c/ewc^0//gowwc/eo"Wec/z>"/^t/附齒ge"e57XNucleicAcids&MolecularBiology(Eckstein,F.andLilley,D,M.J,编,SpringerVerlag,Berlin)(1987);Kunkel,ia;/(ia/d孝c/ew/57Ye-5pe"ye附wfagewe^p/2歸妙/cProc.Natl,Acad.Sci.USA82:488-492(1985);Kunkel等人,"wc/e^"'ew/1s7/^->S7e"yc*附wf"gewes/sw/f/ow///ze/o/y//cse/eCz'ow,MethodsinEnzvmol.154,367-382(1987);Bass等人,她她/Trpw,£>M4-6zW/wg5/7e"ykr//^,Science242:240-245(1988);Zoller&Smith,/rac/w"/ow/ww/附w加/omawyZWJ々ag歸w/,NucleicAcidsRes.10:6487-6500(1982);Zoller&Smith,0//gowwc/eo"'^:>e"eJmw/agewe*0/DiV/ic/owec/MJ雨塗'MethodsinE野mol.100:468-500(1983);Zoller&Smith,am/aW一e-欲flTO^dDA^4fe,/她,MethodsinEnzymol.154:329-350(1987);Taylor等人,£W^,Nucl,AcidsRes,13:8749-8764(1985);Taylor等人,77^rapW^wwa"owNucl.AcidsRes.13:8765-8785(1985);Nakamaye&Eckstein,7w緣她wmy/W"/owo//gowwc/eo/7U^"e<iNucl.AcidsRes.14:9679-9698(1986);Sayers等人,AcidsRes,16:791-802(1988);Sayers等人,5Vm"d^e"ycc/e"v"ge。/e,/z/(i/訓6to附/叔(1988)Nucl.AcidsRes,16:803-814;Kramer等人,77zegoppec/c/w—a:ZWJflj^raac/o//gowwc/eo"c/e-<iz>^"e<i附w加/owco/欲wc"'ow,Nucl,AcidsRes,12:9441-9456(1984》Kramer&FritzO/z'gowwc/eWtfe-^ec/Wcow欲w"/owo/附w励'ow51vz'ago/^edt/w//e;ciM4,MethodsinEnzvmol.154:350-367(1987);Kramer等人,/mpravedcoww"/ow'ora,Nucl.AcidsRes.16:7207(1988);Fritz等人,enz>7naf/cre"cffosfvffro,Nucl.AcidsRes.16:(1988);Kramer等人,Z)(^ferewf6a5^/&a<yem&mafc/zesarecorrectedwz7ftd(j^^fe^7c'ecfes6f/zee^y^-dfrec&c/DiV^4/m'5a/z-rezV,towcj/E'co//,Cell38:879-887(1984);Carter等人,TmpravWs/z^-iec/Wwf"gewe^s7'5"ve加ny,Nucl,AcidsRes.13:4431-4443(1985);Carter,Tw^raved,ewes7、,'wg3ve"ors,MethodsinEnzvmol.154:382-403(1987);Eghtedarzadeh&Henikoff,C/m0//gowwc/eo"Wesgewer/arge^fe/e"》叫Nucl.AcidsRes.14:5115(1986);Wells等人,7m/o/t"wce/y;(irogew-Z)(wdybrwa/iowWaft/Z/z/wg/7zefraws/"》wsw&"7/s/w,Phil.Trans.R.Soc.Lond.A317:415-423(1986);Nambiar等人,7b/"/""/Amzj"w"0/"/or〃6owwc/^xyeS/rato>7,Science223:1299-1301(1984);Sakmar和Khorana,7b/^/"w/7^z'51awe/ex/ms^/ow"geweybr^p/z"-<sw6wmY0/6ov/werodow&r5^ge"Zgwam'wewwc/eo"V/e-6/wgpro/e/w(^nmy^/wcz77人Nucl.AcidsRes.14:6361-6372(1988);AVells等人,Casse"ew/"gewe57'5..awe^c/ewfe/Z;oJybrgewe/y/"owa/1cfeyw^/57to,Getic34:315-323(1985);Grundstrom等人,0//gowwc/eo/We-(i/rec/^w&gewe57、6/crasc"/eS/zW-gww'gewe^e^,Nucl,AcidsRes,13:3305-3316(1985);Mandecki,Wgowwe/eo"We-c/z>e"ec/Jow6/e-awd6""A:mV//as/c/51o/£^/zm'c/n'"co//.'af/zc^/orsz7^-5^c(/cProc.Natl.Acad.Sci.USA,83:7177-7181(1986);Arnold,iV他/wewg/wem'wgybrwwwswa/ew/w,eCurrentOpinioninBiotechnology4:450-455(1993);Sieber,等人,NatureBiotechnology,19:456-460(2001);W.RC.Stemmer,Nature370,389-91(1994);和LA.Lorimer,I.Pastan,NucleicAcidsRes.23,3067-8(1995)。有关许多上述方法的其它细节可见于MethodsinEnz簡logv第154巻中,其也描述针对各种诱变方法中难以解决的问题的有用控制方法。通常根据如Beaucage和Caruthers,TetrahedronLetts.22(20):1859-1862,(1981)中所述的固相亚磷酰胺三酯方法,(例如)使用如Needham-VanDevanter等人,NucleicAcidsRes,,12:6159-6168(1984)中所述的自动化合成仪以化学方式合成(例如)用于本发明的诱变(例如,使合成酶文库突变或改变tRNA)中的寡核苷酸。此外,基本上任何核酸都可为从多种商业来源中的任一种订购的定制品或标准品,戶斤述商业来源诸:i口TheMidlandCertifiedReagentCompany(mcrc@oligos.com)、TheGreatAmericanGeneCompany(www.genco.com)、ExpressGenInc.(www.expressgen.com)、OperonTechnologiesInc.(Alameda,Calif.)和许多其它来源。本发明还涉及真核宿主细胞、非真核宿主细胞和在活体内经由正交tRNA/RS对并入非天然氨基酸的有机体。利用本发明的聚核苷酸或包括本发明的聚核苷酸的构筑体(包括但不限于,本发明的载体,其例如可为克隆载体或表达载体)对宿主细胞进行基因工程(包括但不限于,转化、转导或转染)。举例来说,将正交tRNA的编码区、正交tRNA合成酶和欲衍生化的蛋白质可操作地连接到在所需宿主细胞中起作用的基因表达控制元件。载体可(例如)为质粒、柯斯质粒、噬菌体、细菌、病毒、棵聚核普酸或连结的聚核苦酸的形式。通过标准方法将载体引入细胞和/或微生物中,所述标准方法包括电穿孔(F画m等人,Proc.Natl.Acad.Sci.USA82,5824(1985))、用病毒栽体感染、用在小珠粒或颗粒基质内或表面上具有核酸的小颗粒进行高速弹道穿透(Klein等人,Nature327,70-73(1987))等。将靶核酸引入细胞中的若干种众所周知的方法都可用;所述方法的任一种都可用于本发明中。这些方法包括受体细胞与含有DNA的细菌原生质体融合、电穿孔、基因枪法(projectilebombardment)和用病毒载体感染(将于下文中进一步论述)等。可使用细菌细胞扩大含有本发明的DNA构筑体的质粒的数量。使细菌生长到对数生长期并且通过所属领域已知的多种方法(例如参看Sambrook)分离细菌内的质粒。此外,用于从细菌中纯化质粒的试剂盒为市售(例如参看,EasyPrep、FlexiPrep,二者都是购自PharmaciaBiotech;StrataClean,购自Stratagene;和QIAprepTM,购自Qiagen)。随后进一步操纵经分离和纯化的质粒以制造用于转染细胞或并入相关载体中以感染有机体的其它质粒。典型载体含有转录和翻译终止子、转录和翻译起始序列和可用于调控特定靶核酸的表达的启动子。载体视情况包含基因表达盒,其含有至少一个独立的终止子序列、允许所述盒在真核生物或原核生物或二者(包括但不限于,穿梭载体)中复制的序列和用于原核生物系统和真核生物系统的选择标记。载体适于在原核生物、真核生物或二者中复制和/或整合。参看Gillam&Smith,Gene8:81(1979);Roberts等人,Nature.328:731(1987);Schneider,E.等人,ProteinExpr.Purif.6(1)10-14(1995);Ausubel,(例如,由ATCC出片反的77^^rCCO^a/ogwe。/5a"e〃"tmd5a"en'op/zage(1992)Gherna等人(编))所提供。用于测序、克隆和分子生物学其它方面的其它基本程序和基础理论考yit-也见于Watson等人(1992)"A^4Seco"d£d//7owSciew/zycJwer/c""丑ooib,iv;r中。此外,基本上任何核酸(和实际上任何经标记的核酸,无论标准还是非标准核酸)都可为从多个商业来源中的任一个订购的定制品或标准品,所述商业来源诸如MidlandCertifiedReagentCompany(国际互耳关网mcrc.com可见,Midland,TX)、TheGreatAmericanGeneCompany(国际互耳关网genco.com可见,Ramona,CA)、ExpressGenInc.(国际互耳关网expressgen.com可见,Chicago,IL)、OperonTechnologiesInc.(Alameda,CA)和许多其它商业来源。可将经工程设计的宿主细胞培养于修饰为适于诸如筛选步骤、活化启动子或选择转化体的活性的常规营养培养基中。可将这些细胞视情况培养于转基因有机体中。举例来说,有关细胞分离和培养(例如,有关随后的核酸分离)的其它有用参考文献包括Freshney(1994)CultureofAnimalCells,aManualofBasicTechnique,第3版,Wiley-Liss,NewYork和其中所引用的参考文献;Payne等人(1992)PlantCellandTissueCultureinLiquidSystemsJohnWiley&Sons,Inc.NewYork,NY;GamborgandPhillips(编)(1995)PlantCellTissueandOrganCulture;FundamentalMethodsSpringerLabManual,Springer-Verlag(BerlinHeidelbergNewYork)和AtlasandParks(编)TheHandbookofMicrobiologicalMedia(1993)CRCPress,BocaRaton,FL。在活体内将非天然氨基酸直接并入蛋白质中的能力将提供多种优势,包括(但不限于)突变体蛋白的高产量、技术简便性、研究细胞或可能的活有机体中突变体蛋白的潜力和这些突变体蛋白于治疗性治疗和诊断使用中的用途。将具有各种尺寸、酸度、亲核性、疏水性和其它特性的非天然氨基酸包括于蛋白质中的能力可极大扩展合理且系统性操纵蛋白质结构以探查蛋白质功能并产生具有新颖特性的新颖蛋白质或有机体的能力。所关注的蛋白质和多肽可并入非天然氨基酸以达成各种目的,包括(但不限于)修整蛋白质结构和/或功能的改变;改变尺寸、酸度、亲核性、氢键、疏水性、蛋白酶目标位点的可接近性;靶向部分(包括但不限于用于蛋白质阵列);加入生物活性分子;连接聚合物;连接放射性核;调节血清半衰期;调节组织渗透性(例如肿瘤);调节活性转运体;调节组织、细胞或器官特异性或分布;调节免疫原性;调节蛋白酶抗性等。包括非天然氨基酸的蛋白质可具有增强的或甚至完全新颖的催化或生物物理特性。举例来说,可通过将非天然氨基酸包括于蛋白质中来视情况改变以下特性毒性、生物分布、结构特性、光谱特性、化学和/或光化学特性、催化能力、半衰期(包括但不限于,血清半衰期)、与其它分子反应(包括但不限于共价或非共价反应)的能力等。包括包含至少一个非天然氨基酸的蛋白质的组合物可用于(包括但不限于)新颖的治疗法、诊断法、催化酶、工业酶、结合蛋白(包括但不限于抗体)和(包括但不限于)有关蛋白质结构和功能的研究中。例^口,参看Dougherty,(2000)f/wwa^wa/J附/woJc/c&os/Vo6ey/Vwe/wS&Mc/weof"d尸w"c"o",CurrentOpinioninChemicalBiology,4:645-652。蛋白质可具有至少一个、包括(但不限于)至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个或十个以上非天然氨基酸。非天然氨基酸可相同或不同,包括(但不限于)蛋白质中可存在包含1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或10个以上不同非天然氨基酸的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或10个以上不同位点。蛋白质可具有至少一个(但少于全部)存在于所迷蛋白质中的经非天然氨基酸取代的特定氨基酸。对于具有一个以上非天然氨基酸的指定蛋白质来说,非天然氨基酸可相同或不同(包括但不限于,所述蛋白质可包括两种或两种以上不同类型的非天然氨基酸,或可包括相同非天然氨基酸中的两个)。对于具有两个以上非天然氨基酸的指定蛋白质来说,非天然氨基酸可相同、不同或为多种相同种类的非天然氨基酸与至少一种不同非天然氨基酸的組合。通过在真核细胞中制造具有至少一个非天然氨基酸的所关注的蛋白质或多肽,蛋白质或多肽通常将包括真核翻译后修饰。在某些实施例中,蛋白质包括至少一个非天然氨基酸和至少一个于活体内由真核细胞所作的翻译后修饰,其中所述翻译后修饰不是通过原核细胞进行。举例来说,翻译后修饰包括(但不限于)乙酰化、酰基化、脂质修饰、棕榈酰化、棕榈酸盐添加、磷酸化、糖酯键联修饰、糖基化等。另一方面,翻译后修饰包括前体(包括但不限于,降钙素前体、降钙素基因相关的肽前体、前曱状旁腺激素原、前胰岛素原、胰岛素原、前阿皮黑素原、阿黑皮素原等)的蛋白水解加工;组装成多亚基蛋白质或大分子组装;翻译到细胞(包括但不限于,细胞器,诸如内质网、高尔基体(Golgiapparatus)、核、溶酶体、过氧化物酶体、线粒体、叶绿体、液泡等;或通过分泌路径)中的另一位点。在某些实施例中,蛋白质包含分泌或定位序列、抗原决定基标签、FLAG标签、聚组氨酸标签、GST融合物等。在细胞中制造在指定位置处具有所选氨基酸的蛋白质的方法也为本发明的特征。举例来说,方法包括使细胞在适当培养基中生长,其中所述细胞包含核酸,所述核酸包含至少一个选择性密码子并且编码蛋白质;和提供所选氨基酸,其中所述细胞另外包含在细胞中起作用并且识别选择性密码子的正交tRNA(O-tRNA);和优先利用所选氨基酸使O-tRNA氨酰基化的正交氨酰基tRNA合成酶(O-RS)。通常,O-tRNA在存在同类合成酶的情况下响应选择性密码子包含抑制活性。由本发明的方法制造的蛋白质也为本发明的特征。本发明的组合物和由本发明的方法制造的组合物视情况处于细胞中。随后可将本发明的O-tRNA/O-RS对或个别组件用于宿主系统的翻译机器中,这导致所选氨基酸(例如,非天然氛基酸)并入蛋白质中。名称为"ExpandingtheEukaryoticGeneticCode,,的专利申请案USSN10/825,867和名称为"TNVIVOINCORPORATIONOFUNNATURALAMINOACIDS"的10/126,927中描述此方法并且所述专利文献是以引用的方式并入本文中。举例来说,当将O-tRNA/O-RS对引入宿主(例如,大肠杆菌)中时,所迷对在活体内响应选择性密码子导致将可外源地加到生长培养基中的所选氨基酸(诸如非天然氨基酸,例如合成氨基酸,诸如亮氨酸衍生物)并入蛋白质中。视情况,本发明的组合物可处于活体外翻译系统中或处于活体内系统中。可使用本文的组合物和方法制造任何蛋白质(或其部分),所迷蛋白质包括所选氨基酸,例如非天然氨基酸(和任何相应的编码核酸,例如其包括一个或一个以上选择性密码子)。任何多肽都适于并入一个或一个以上所选氨基酸。尚未尝试鉴别数十万已知蛋白质,所述蛋白质中的任一种可经修饰以包括一个或一个以上非天然氨基酸,例如通过改编任何可用突变方法经修饰而在相关翻译系统中包括一个或一个以上适当选择性密码子。已知蛋白质的常见序列镨系包括GenBankEMBL、DDBJ和NCBI。其它语系可易于通过搜索互联网来鉴别。通常,蛋白质与任何可用蛋白质(例如,治疗性蛋白质、诊断用蛋白质、工业酶或其部分等)(例如)至少60%、至少70%、至少75%、至少80%、至少90%、至少95%或至少99%或99%以上相同,并且其包含一个或一个以上所选氨基酸。可经修饰以包含一个或一个以上所选氨基酸(例如非天然氨基酸)的治疗性蛋白质、诊断用蛋白质和其它蛋白质的实例可见于(但不限于)名称为"ExpandingtheEukaryoticGeneticCode"的USSN10/825,867和名称为"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS"的美国专利申请案第10/126,927号中。在某些实施例中,本发明的方法和/或组合物中所关注的蛋白质或多肽(或其部分)是由核酸编码。通常,核酸包含至少一个选择性密码子、至少两个选择性密码子、至少三个选择性密码子、至少四个选择性密码子、至少五个选择性密码子、至少六个选择性密码子、至少七个选择性密码子、至少八个选择性密码子、至少九个选择性密码子、十个或十个以上选择性密码子。可使用所属领域技术人员众所周知且本文在"诱变和其它分子生物学技术"章节中所述的方法诱变编码所关注的蛋白质或多肽的基因,以使其包括(例如)一个或一个以上选择性密码子以供并入所选氨基酸,例如非天然氨基酸。举例来说,诱变用于所关注的蛋白质的核酸以使其包括一个或一个以上选择性密码子,从而使一个或一个以上所选氨基酸(例如,非天然氨基酸)插入。本发明包括任何蛋白质的任何所述变异体(例如突变体)型式,例如包括至少一个所选氨基酸。类似地,本发明还包括相应核酸,即具有一个或一个以上编码一个或一个以上所选氨基酸的选择性密码子的任何核酸。为制造包括所选氨基酸的蛋白质,可使用适于在活体内经由正交tRNA/RS对并入所选氨基酸的宿主细胞和有机体。利用一个或一个以上表达正交tRNA、正交tRNA合成酶的载体和编码欲衍生化的蛋白质的载体对宿主细胞进行基因工程(例如,转化、转导或转染)。这些组件中的每一个都可在相同载体上,或各自可在单独载体上,两个组件可在一个载体上且第三组件在第二载体上。载体可(例如)为质粒、柯斯质粒、噬菌体、细菌、病毒、棵聚核苷酸或连结的聚核普酸的形式。替换系统已使用数种策略将非天然氨基酸引入非重组宿主细胞、诱变的宿主细胞或无细胞系统中的蛋白质中。使具有反应性侧链的氨基酸(诸如Lys、Cys和Tyr)衍生化将导致赖氨酸转化成N、乙酰基-赖氨酸。化学合成也提供一种并入非天然氨基酸的简单方法。随着肽片段的酶连接和天然化学连接的最新发展,可能制造出较大蛋白质。例如参看P.E.Dawson和S.B.H.Kent,A匪.Rev.Biochem.69:923(2000)。化学肽连接和天然化学连接已描述于美国专利第6,184,344号、美国专利公开案第2004/0138412号、美国专利公开案第2003/0208046号、WO02/098902和WO03/042235中,所述专利都是以引用的方式并入本文中。已使用通用活体外生物合成方法将超过100个非天然氨基酸位点特异性地并入实际上任何尺寸的多种蛋白质中,在所述方法中将经所需非天然氨基酸化学酰基化的抑制性tRNA加入能够支持蛋白质生物合成的活体外提取物中。例如参看V.W.Cornish,D.Mendel和P.G.Schultz,Angew.Chem.Int.Ed.Engl..1995,34:621(1995);CJ.Noren,SJ.Anthony國Cahill,M.C.Griffith,P.G.Schultz,ge"em/膨《/jod/ors"e邻e"》c/wcorpom/iowo/wmza/wa/a/m'wo/齒/ra/z>is'Science244:182-188(1989);和J.D.Bain,C.G.Glabe,T.A.Dix,A.R.Chamberlin,E.S.Diala,祝0,f/2"/c,c(/c/wcorpora/iowo/awow-wa^ra/am/woz'她a/o(yj3eWcfe,J.Am.Chem.Soc.111:8013-8014(1989)。已将广泛多种官能团引入蛋白质中以用于研究蛋白质稳定性、蛋白质折叠、酶机制和信号转导。已研究出一种被称为选择性压力并入的活体内方法来开发混杂的野生型合成酶。例如参看N.Budisa,C.Minks,S.Alefelder,W.Wenger,F.M.Dong,L.Moroder和R.Huber,FASEBJ.,13:41(1999)。使向细胞供应特定天然氨基酸的相关代谢路径已切断的营养缺陷型菌林生长于含有有限浓度的天然氨基酸的基本培养基中,同时阻遏靶基因的转录。稳定生长期开始时,耗尽天然氨基酸并以非天然氨基酸类似物加以置换。裔导重组蛋白的表达将导致含有非天然类似物的蛋白质的积累。举例来说,使用这一策略,已将邻、间和对氟苯丙氨酸并入蛋白质中并且在UV光语中展现出易于鉴别的两个特征性峰肩,例如参看C.Minks,R.Huber,L.Moroder和N.Budisa,Anal.Biochem..284:29(2000);已使用三氟曱疏氨酸置换噬菌体T4溶菌酶中的曱硫氨酸,以通过19FNMR研究其与壳低聚糖配体的相互作用,例如参看H.Duewel,E.Daub,V.Robinson和J.F.Honek,Biochemistry,36:3404(1997);并且已并入三氟亮氨酸替代亮氨酸,从而使亮氨酸拉链蛋白的热稳定性和化学稳定性增加。例如参看Y.Tang,G.Ghirlanda,W.A.Petka,T.Nakajima,W.F.DeGrado和D.A.Tirrell,Ansew.Chem.Int.Ed.Enel..40:1494(2001)。此外,将竭代曱硫氨酸和碲代曱疏氨酸并入各种重组蛋白中以有利于对X射线晶体学中各相的解析。例如参看W.A.Hendrickson,J.R.Horton和D.M.Lemaster,EMBOJ.,9:1665(1990);J.O.Boles,K.Lewinski,M.Kunkle,J.D.Odom,B.Dunlap,L.Lebioda和M.Hatada,Nat.Struct.Biol..1:283(1994);N.Budisa,B.Steipe,P.Demange,C.Eckerskorn,,J.Kellermann和R.Huber,Eur.J.Biochem.,230:788(1995);和N.Budisa,W.Karnbrock,S.Steinbacher,A.Humm,L.Prade,T.Neuefeind,L.Moroder和R.Huber,J.Mol.Biol.'270:616(1997)。也已有效地并入具有烯或炔官能团的曱硫氨酸类似物,从而允许通过化学方式对蛋白质进行额外修饰。例如参看J.C.vanHest和D.A.Tirrell,FEBSLett..428:68(1998);J.C..vanHest,K.L.Kiick和D.A.Tirrell,J.Am.Chem.Soc.122:1282(2000);和K.L.KiickandD.A.Tirrell,Tetrahedron,56:9487(2000);美国专利第6,586,207号;美国专利公开案2002/0042097,所述专利文献都是以引用的方式并入本文中。本方法的成功视氨酰基tRNA合成酶对非天然氨基酸类似物的识别而定,总的说来,这需要高选择性以确保蛋白质翻译的保真性。一种扩展本发明方法的范围的方式为放宽氨酰基tRNA合成酶的底物特异性,这已在有限数量的情况下实现。举例来说,在大肠杆菌苯丙氨酰基tRNA合成酶(PheRS)的情况下以Gly置换Ala^将增加底物结合口袋的尺寸,并且引起对氯苯丙氨酸(p-Cl-Phe)对tRNAPhe的酰基化作用。参看M.Ibba,P.Kast和H.Hennecke.Biochemistry,33:7107"994)。具有此突变体PheRS的大肠杆菌菌抹允许并入对氯苯丙氨酸或对溴苯丙氨酸来替代苯丙氨酸。例如参看M.Ibba和H.Hennecke,FEBSLett.,364:272(1995);和N.Sharma,R.Furter,P.Kast和D.A.Tirrell,FEBSLett..467:37(2000)。类似地,已证实邻近大肠杆菌酪氨酰基tRNA合成酶的氨基酸结合位点的点突变Phel30Ser使重氮酪氨酸(azatyrosine)能够比酪氨酸更有效地并入。参看F.Hamano-Takaku,T.Iwama,S.Saito-Yano,K.Takaku,Y.Monden,M.Kitabatake,D.Soil和S.Nishimura,J.Biol.Chem.,275:40324(2000)。在活体内将非天然氨基酸并入蛋白质中的另一种策略为修饰具有校对机制的合成酶。这些合成酶无法区分且因此活化在结构上与同类天然氨基酸类似的氨基酸。这一错误在单独位点处经校正,其使来自tRNA的错载氨基酸脱酰基化以保持蛋白质翻译的保真度。如果丧失合成酶的校对活性,那么错误活化的结构类似物可逃避编辑功能并且被并入。近来已以缬氨酰基tRNA合成酶(ValRS)证实这一方法。参看V.Doring,H.D.Mootz:L.A.Nangle,T.L.Hendrickson,V.deCrecy-Lagard,P.Schimmel和P.Marliere;Scicnc6,292:501(2001)。ValRS可以Cys、Thr或氨基丁酸(Abu)错误氨酰基化tRNAVal;随后,这些非同类的氨基酸经编辑域水解。在随机诱变大肠杆菌染色体后,选择在ValRS的编辑位点中具有突变的突变体大肠杆菌菌抹。这一编辑缺陷型ValRS错误地将Cys装载于tRNAVal上。由于Abu在空间上与Cys类似(Cys的-SH基团在Abu中经-CH3置换),故当这一突变体大肠杆菌菌林在存在Abu的情况下生长时,突变体ValRS也将Abu并入蛋白质中。质谱分析表明,在天然蛋白质的各缬氨酸位置处约24%的缬氨酸经Abu置换。固相合成和半合成方法也已允许合成大量含有新颖氨基酸的蛋白质。举例来说,参看本文所引用的以下公开案和参考文献Crick,F.H.C.,Barrett,L.Brenner,S.Watts-Tobin,R.Ge"era/贈weo/f/zecocfe,/ra/e/肌Naturs,192:1227-1232(1961);Hofmann,K.,Bohn,H.5V"J/eso"/o(y"ep"cfe51.XQTZ7Teej^ecfo//7>razo/e-//w/(/azo/erep/ace附ew^yo"S-jcvo/"'""c/iv"""g/o/e"c少o/a"S-p印"We女ag膨"/,J.AmChem,88(24):5914-5919(1966);Kaiser,E.T.Syw/TjWcap/7raac/^/oWo/og/ca〃少a"/ve/ep/escmd/ra/"e/"51/"cW/"g,zs'AccChsmRcs,22:47-54(1989);Nakatsuka,T.,Sasaki,T.,Kaiser,E.T.e/OWesegew/1cowp//wgca^3f(yzet/6>>f/ese/5^w^ze"c/7/0^"6"7/57>7,JAmChemSoc,109:3808-3810(1987);Schnolzer,M.,Kent,SBH.CfrW/wg戸如7wZ)_ycove加7/wgw"/ra&"ed5^"/7Wc,/70Ww6acowe-ewg/weerei////Fprafease,Science,256(5054):221-225(1992);Chaiken,I.M.S',/7e"c血CRCCritRevBiochem.11(3):255-301(1981);Offord,R.E.尸ro/Wwewg/wem'wgc/e/ca/ProteinEng..1(3):151-157(1987);和Jackson,D.Y.,Burnier,J.,Q,C,Stanley,M.,Tom,J.,Wells,J.A.Z)es/g"ec/尸e/7/"/t/eZ/gose7b^/Syw/^e^o/iz'6owwc/eawe爿W/zf/"na加ra/Cato(y/7'cieses,Science,266(5183V-243(1994)。已使用化学修饰在活体外将包括辅助因子、自旋标记和寡核苷酸的多种非天然侧链引入蛋白质中。例如参看Corey,D.R.,Schultz,P.G.o/a/^6〃Wse《wewce邵e"ycw'wg/e-欲aw^/Aax7r/Z)0wwc/eaye'Science,238(4832):1401-1403(1987);Kaiser,E.T.,LawrenceD.S.,Rokita,S.E.7Tzec/e附/ca/mcu/(/c"f/o"o/ew27ma"c印ecj[/d/y,AnnuRevBiochem,54:565-595(1985》Kaiser,E.T.,Lawrence,D.S.C7ze'ca/w"'owc^,ea"/ves/加,Sci6nc6,226(4674):505-511(1984);Neet,K.E.,NanciA,Koshland,D.E.iVo^o/JBiol.Chem,243(24):6392-6401(1968);Polgar,L.etM丄.Bender.coz'm'wga5^w^Wcfl〃少ybreda"/ves"e.77"。/-^6"7/^".J.AmChemSoc.88:3153-3154(1966);和Pollack,SJ"Nakayama,G.Schultz,P.G.Twc"'ow0/wwc/eo//n7e51de",(wco//c/,o6e《/咖朋"'6o办cow6/w/"gs船'Science,242(4881):1038-1040(1988)。通过免疫反应性确定多肽由于本发明的多肽提供多种新颖的多肽序列(例如,在本文的翻译系统中所合成的蛋白质的情况下,包含所选氨基酸(例如非天然氨基酸);或例如在新颖合成酶的情况下,包含标准氨基酸的新颖序列),故所述多肽也提供可(例如)在免疫检定中识别的新颖结构特征。特异性结合本发明的多肽的抗血清的产生以及由所述抗血清结合的多肽也为本发明的特征。如本文所使用,术语"抗体"包括(但不限于)实质上由一个或一个以上特异性结合并识别分析物(抗原)的免疫球蛋白基因或其片段所编码的多肽。实例包括多克隆抗体、单克隆抗体、嵌合抗体和单链抗体等。如本文所使用的术语"抗体"中也包括免疫球蛋白的片段,包括Fab片段和由表达文库(包括噬菌体呈现)所产生的片段。有关抗体结构和技术例如参看Paul,Fw她附e幽//画謙/柳第4版,1999,RavenPress,NswYork。举例来说,本发明包括利用特异性结合针对包含免疫原的氨基酸序列所产生的抗体或抗血清或与针对包含免疫原的氨基酸序列所产生的抗体或抗血清具有特异性免疫反应性的本发明的tRNA和/或RS制造的蛋白质。为消除与其它同源物的交叉反应性,将抗体或抗血清用可用蛋白质(诸如,野生型多肽,例如"对照"多肽)扣除。当野生型蛋白质与核酸对应时,产生由所述核酸编码的多肽并且将其用于抗体/抗血清扣除的目的。在一种典型形式中,免疫检定使用针对一个或一个以上多肽或其实质子序列(即,所提供的全长序列的至少约30%)产生的多克隆抗血清。从蛋白质得到的潜在多肽免疫原组在下文中统称为"免疫原性多肽"。视情况选择对对照合成酶同源物具有低的交叉反应性的所得抗血清,并且在将多克隆抗血清用于免疫检定之前(例如)通过免疫吸附利用一种或一种以上对照同源物去除任何所述交叉反应性。为制造用于免疫检定中的抗血清,制造一个或一个以上免疫原性多肽并且如本文所述对其进行纯化。举例来说,重组蛋白可在重组细胞中制造。利用免疫原性蛋白以及标准佐剂(诸如弗氏佐剂(Freund'sadjuvant))和标准小鼠免疫方案使小鼠近交系(由于因小鼠的实际遗传一致性而使结果更具重现性,故将其用于本检定中)免疫(有关抗体产生、免疫检定形式和可用于测定特异性免疫反应性的条件的标准描述,例如参看Harlow和Lane(1988)Antibodies,ALaboratoryManual,ColdSpringHarborPublications,NewYork)。应性确定多肽。或者,将从本文所揭示的序列得到的一个或一个以上合成或重组多肽与载体蛋白连结并且将其用作免疫原。收集多克隆血清并且在免疫检定(例如固相免疫检定)中利用固定于固体支撑物上的一种或一种以上免疫原性蛋白对免疫原性多肽进行滴定。选择滴度为106或更高的多克隆抗血清,汇集并且用对照合成酶多肽将其扣除以产生已扣除的汇集的经滴定多克隆抗血清。在比较免疫检定中测试已扣除的汇集的经滴定多克隆抗血清对对照同源物的交叉反应性。在所述比较检定中,测定已扣除的经滴定多克隆抗血清的差别结合条件,当与经滴定多克隆抗血清和对照合成酶同源物结合相比较时,其导致比经滴定多克隆抗血清与免疫原性蛋白结合高至少约5-10倍的信杂比。也就是说,通过加入非特异性竟争剂(诸如白蛋白或脱脂奶粉)和/或通过调节盐条件、温度等来调节结合反应的严格度。将这些结合条件用于随后的检定中以测定测试多肽(与免疫原性多肽和/或对照多肽相比较的多肽)是否通过所汇集的已扣除的多克隆抗血清特异性结合。在另一个实例中,将竟争性结合形式的免疫检定用于检测测试多肽。举例来说,如所述,利用对照多肽通过免疫吸附将交叉反应性抗体从所汇集的抗血清混合物中去除。随后将免疫原性多肽固定于暴露于所汇集的已扣除的抗血清的固体支撑物上。将测试蛋白加到检定中以竟争与所汇集的已扣除的抗血清的结合。将当与固定蛋白质相比较时测试蛋白竟争与所汇集的已扣除的抗血清结合的能力与加到检定中的免疫原性多肽竟争结合的能力相比较(免疫原性多肽与固定免疫原性多肽有效竟争与所汇集的抗血清的结合)。使用标准计算方法计算测试蛋白的交叉反应性百分比。在平行检定中,视情况测定当与免疫原性多肽竟争与所汇集的已扣除的抗血清结合的能力相比较时,对照蛋白竟争与所述抗血清结合的能力。同样,使用标准计算方法计算对照多肽的交叉反应性百分比。当与对照多肽相比时,交叉反应性百分比高达测试多肽的至少5-10倍时,和/或当测试多肽的结合大致在免疫原性多肽结合的范围内时,认为测试多肽与所汇集的已扣除的抗血清特异性结合。一般来说,可将经免疫吸附并且汇集的抗血清用于如本文所述的竟争性结合免疫检定中以将任何测试多肽与免疫原性多肽和/或对照多肽相比较。为进行所述比较,分别检定多种浓度的免疫原性多肽、测试多肽和对照多肽,并且使用标准技术测定抑制已扣除的抗血清与(例如)固定对照蛋白、测试蛋白或免疫原性蛋白50%结合所需的各多肽的量。如果在竟争性检定中结合所需的测试多肽的量比所需的免疫原性多肽的量少两倍,那么认为测试多肽与产生免疫原性蛋白的抗体特异性结合,条件是所述量高达对照多肽的至少约5-10倍。作为特异性的另一测定方法,视情况利用免疫原性多肽(而非对照多肽)完全免疫吸附所汇集的抗血清,直到可检测到极少所得免疫原性多肽已扣除的汇集抗血清与用于免疫吸附中的免疫原性多肽的结合或检测不到所述结合。随后利用测试多肽测试所述完全免疫吸附的抗血清的反应性。如果观察到极少或未观察到反应性(即,所观察的完全免疫吸附的抗血清与免疫原性多肽的结合不超过2倍的信杂比),那么测试多肽与由免疫原性蛋白所引起的抗血清特异性结合。有关蛋白质、抗体、抗血清等的其它细节可见于名称为"ExpandingtheEukaryoticGeneticCode"的USSN10/825,867;名称为"INVIVOINCORPORATIONOFUNNATURALAMINOACIDS"的WO2002/085923;名称为"Glycoproteinsynthesis"的美国专利第6,927,042号;和名称为"ProteinArrays,,的美国专利公开案第US2004/0198637号,所述专利文献是以引用的方式并入本文中。试剂盒试剂盒也为本发明的特征。举例来说,提供在细胞中制造包含至少一个所选氨基酸(例如非天然氨基酸)的蛋白质的试剂盒,其中所述试剂盒包括含有编码O-tRNA的聚核苷酸序列和/或O-tRNA和/或编码O-RS的聚核苷酸序列和/或O-RS的容器。在一个实施例中,试剂盒另外至少包括所选氨基酸。在另一个实施例中,试剂盒包括本发明的氨酰基化tRNA。在另一个实施例中,试剂盒另外包含制造蛋白质的说明材料。另一实例为在无细胞翻译系统中制造包含至少一个所选氨基酸(例如非天然氨基酸)的蛋白质的试剂盒,其中所述试剂盒包括含有编码O-tRNA的聚核苷酸序列和/或O-tRNA和/或编码O-RS的聚核苷酸序列和/或O-RS的容器。在一个实施例中,试剂盒另外包括所选氨基酸。在另一个实施例中,试剂盒包括本发明的氨酰基化tRNA。在另一个实施例中,试剂盒另外包含制造蛋白质的说明材料。实例提供以下实例进行说明,但并非限制本发明。所属领域技术人员将认识到,在不偏离本发明的范围的情况下,可改变多个不重要的参数。实例1:针对对乙酰基苯丙氨酸选择氨酰基tRNA合成酶在两个DNA文库中筛选针对对乙酰基苯丙氨酸(即,非天然编码的氨基酸)的氨酰基tRNA合成酶。这些文库都是由pBK质粒中来自詹氏甲烷球菌的酪氨酰基tRNA合成酶基因的六种突变组成。执行选择程序,其是由五轮交替选择(三轮阳性选择、两轮阴性选择)组成。将文库以1:1的比率组合并且将其电穿孔到阳性选择细胞系(具有阳性选择质粒pREP的GeneHog)中,并且将所述细胞系接种到含有适当抗生素和非天然编码的氨基酸对乙酰基苯丙氨酸(pAF)的基本培养基平板(GMML)中。将平板在37。C下培养约40小时,此时通过刮擦采集细胞。使用QiagenMini-Prep程序提取DNA,且随后进行琼脂糖凝胶纯化以分离文库质粒DNA。接着,将所述DNA电穿孔到阴性选择细胞系(具有阴性选择质粒pBAD衍生物的GeneHog)中。将这些转化体接种到含有适当抗生素而无非天然编码的氨基酸(pAF)的LB平板上。约17小时后,通过刮擦采集这些细胞,并且使用QiagenMini-Prep程序和琼脂糖纯化来纯化质粒DNA。利用相同的电穿孔、接种、采集和DNA纯化方法进行随后的多轮选择。在最后一轮(第五轮)选择中,制得经转化阳性选择细胞的连续稀释液,将其接种于基本培养基平板上。随后,拣取个别集落并且使其在96孔板上生长整夜。随后,将所述板复制接种于含有不同浓度的氯霉素(阳性选择抗生素)且含有或不含有非天然氨基酸pAF的基本培养基平板上。在37。C下生长约40小时后,目视比较平板以确定哪些集落在最高氯霉素浓度下生长但在不存在非天然编码的氨基酸pAF的情况下不生长或生长较弱。使满足这些标准的集落生长整夜。通过Mini-Prep和琼脂糖凝胶纯化将DNA从培养物中分离并且测序。从所述对于pAF的选择看,发现13个克隆具有独特的氨基酸序列并且经历进一步表征以确定pAF-tRNA合成酶的保真度和加工性。为表征这些合成酶,进行小范围的琥珀抑制以表明已将非天然编码的氨基酸pAF并入多肽中,并且通过SDS-PAGE检验结果。拣取单一集落并且使其在LB肉汤中生长整夜,随后使用所述集落接种50mLLB。使细胞生长到0.3-0.4的OD,此时将1.5mL等分试样视为预先诱导点并且将培养物分到两个烧瓶中。将1mMpAF加到一个分离烧瓶中并且使两个烧瓶都生长30分钟。30分钟生长后,用0.2。/。L-阿拉伯糖诱导两个培养物(+/-pAF)并且使其生长4.5小时,并记录OD麵。随后从+ApAF烧瓶中取出1.5mL等分试样以供SDS-PAGE分析。将1.5mL等分试样(预先诱导,+pAF、-pAF)以10,000xg离心10分钟以使细胞粒化。随后将细胞悬浮于相对于其在采集时的OD,成比例的量的细菌蛋白提取试剂(BacterialProteinExtractionReagent)(BPER,Pierce)中。将DNaseI加到溶解的细胞中并且在4。C下培养20分钟。随后,将所述样本与还原剂和装载染料组合并且在MES緩冲液中的4-12%Bis-TRIS凝胶上跑胶30分钟。将凝胶在DIH20中洗涂两次达10分钟并且用考马斯蓝(coommassieblue)染料染色。针对导致并入pAF的pAF-tRNARS的保真度比较+/-pAF谱带,并且将+pAF谱带与先前选择的pAF-tRNARS相比较。为检查RS的加工性,利用含有C-H6S4am肌红蛋白(S4am-Myo)的质粒执行相同程序。随后通过IMAC纯化S4amMyo并且将其用于蛋白质测序以测定pAF并入的量。在由所述选择鉴别的pAF-tRNARS中,发现一种合成酶(E9)以大于95%的pAF并入效率将pAF有效并入S4am-Myo中。在通过比较SDS-PAGE凝胶上蛋白质谱带展现加工性的同时,通过氨基酸测序测定并入。E9的核苷酸序列展示于SEQIDNO:4中并且E9的氨基酸序列展示于SEQIDNO:5中。对与E9具有类似活性的其它突变体进行鉴别,并且其具有SEQIDNO:17中所示的氨基酸序列。实例2:tRNA资变产生三种tRNAJ17的突变体。野生型J17的DNA序列如SEQIDNO:8和美国专利公开案第2003/0108885号中SEQIDNO:1以及US2003/0082575中SEQIDNO:l(分别为美国专利申请案第10/126,931号和第10/126,927号)所示,所述专利都是以引用的方式并入本文中。如图l所示,J17tRNA在T\|/C茎干中具有U51:G63摆动配对。产生三种J17突变体(F12、F13和F14)以在Tv|/C茎干的51位和63位产生Watson-Crick碱基对。通过重叠PCR进行诱变,并且将最终构筑体克隆到包含编码氨酰基tRNA合成酶E9的聚核苷酸序列(SEQIDNO:4)和编码人生长激素(hGH)且具有琥珀密码子取代的聚核苷酸序列(SEQIDNO:16)的pET19质粒中的EcoRI和Ndel位点中。hGH表达是在T7启动子的控制下进行。产生两个片段以用于重叠PCR。通过引物延伸获得第一个片段。用于产生三种突变体中的每一种的正向引物的序列为TCCGCATGGCGC(FTamll;SEQIDNO:9)。为产生F12突变体(51C:63G),使用以下反向引物GTCCGCCGTTCTGC(FTaml2;SEQIDNO:10)。为产生F13突变体(51U:63A),使用以下反向引物GTCCGCCGTTCTGC(FTaml3;SEQIDNO:11)。为产生F14突变体(51A:63U),使用以下反向引物GTCCGCCGTTCTGC(FTaml4;SEQIDNO:12)。为产生第二个片段,将包含J17tRNA的聚核香酸序列(SEQIDNO:8)、编码tRNA合成酶E9的聚核香酸序列(SEQIDNO:4)和编码人生长激素且具有琥珀密码子取代的聚核苦酸序列(SEQIDNO:16)的质粒pET19J17E9hGH用作利用以下引物组扩增的模板(正向引物,FTaml5;SEQIDNO:13)和CAAATTCGTCCATATGGGATTCC(FTam16;SEQIDNO:14)。使用正向引物将序列从tRNA的3'端延伸到质粒的Ndel位点。将所得产物凝胶纯化。重叠PCR的最后步骤涉及正向引物GTAACGCTGAATTCCCGGCG(FTaml7,SEQIDNO:15)、反向引物FTaml6(SEQIDNO:14)、第一个片段和第二个片段。将组装的产物用EcoRI和NdeI消化并且将其连接到经EcoRI和NdeI消化的质粒pET19J17E9hGH中。通过测序确认各构筑体的序列,并且各J17突变体tRNA的DNA序列如SEQIDNO:1(F12)、SEQIDNO:2(F13)和SEQIDNO:3(F14)所示。将tRNA按照其相应的反向引物命名。蛋白质表达通过化学方式将编码tRNA(J17、F12、F13或F14)的质粒各自转化到大肠杆菌菌抹1和菌抹2细菌宿主细胞中并且将其接种于含有50叫/ml羧节西林(carbenicillin)的LB琼脂平板上。将平板在37。C下培养整夜。对于各tRNA,拣取单一集落以开始在37°C下于1ml含有50pg/ml羧千西林的2xYT中进行的整夜培养。在37。C下,使用所述1ml培养物接种两份10ml含有50吗/ml羧千西林的2xYT培养物。对一份10ml培养物补充4mM对乙酰基苯丙氨酸。OD6of0.7时,用0.4mMIPTG诸导hGH的表达。在37°C下以250rpm将细胞培养4小时后,通过以5000xg离心5分钟来采集细胞。将细胞用补充有5ng/mlDNAseI的B-PER试剂(Pierce,Rockford,IL)溶解。通过4-12°/。SDSPAGE分析全细胞溶解产物。图2绘示通过SDSPAGE进行的大肠杆菌菌林1全细胞溶解产物的分析。使用J17或J17突变体(F12、F13、F14)tRNA和氨酰基tRNA合成酶E9进行人生长激素中选择性密码子的抑制。具有J17突变体的细胞比具有J17的细胞生长略慢。在不存在4mM对乙酰基苯丙氨酸的情况下,通过SDS-PAGE对于tRNA突变体未观察到全长hGH产物。在存在4mM对乙酰基苯丙氨酸的情况下,利用各tRNA突变体产生全长产物,表明这些tRNA突变体-RSE9对与大肠杆菌机器正交。根据SDS-PAGE,J17突变体的经抑制hGH的产率比大肠杆菌菌才朱1中J17的hGH的产率高约1.5到2倍。如图3所示,在大肠杆菌菌抹2细菌细胞系中进一步测试一种J17突变体F13的琥珀抑制。在大肠杆菌菌抹2中,表达以及琥珀抑制的产率比大肠杆菌菌抹1中的情形有所降低。在不存在对乙酰基苯丙氨酸的情况下,通过SDS-PAGE未观察到全长hGH产物。在存在4mM对乙酰基苯丙氨酸的情况下,对于两种tRNA都观察到全长hGH。根据SDS-PAGE,F13的经抑制hGH的产率比J17的hGH的产率高约3倍。利用约1.5L的最终体积进行比较J17和F13的发酵试验。将编码J17tRNA的质粒和编码F13tRNA的质粒各自转化到大肠杆菌菌抹1中。其各自的最终细胞密度为约190克湿细胞/升。J17克隆的hGH滴度为347mg/L,并且F13克隆的hGH滴度为542mg/L。尽管已出于清楚和理解的目的相当详细地描述本发明,但在阅读本发明后所属领域技术人员将了解,在不偏离本发明的真实范围的情况下,可对形式和细节进行各种修改。举例来说,上述所有技术和设备可以各种组合使用。本申请案中所引用的所有公开案、专利、专利申请案和/或其它文献都是以全文引用的方式并入本文中用于所有目的,所引用的程度就如同将各个别公开案、专利、专利申请案和/或其它文献个别地以引用的方式并入本文中用于所有目的一般。表1<table>tableseeoriginaldocumentpage73</column></row><table><table>tableseeoriginaldocumentpage74</column></row><table>权利要求1.一种组合物,其包含具有选自由SEQIDNO1、2、3、其互补聚核苷酸序列和其保守变异体组成的群组的核酸序列的tRNA。5.根据权利要求2所述的组合物,其中所述tRNA以化学方式经氨酰基化。6.根据权利要求2所述的组合物,其中所述tRNA以酶方式经氨酰基化。7.根据权利要求6所述的组合物,其中所述tRNA经RS以酶方式氨酰基化。8.根据权利要求6所述的组合物,其中所述tRNA经核糖体以酶方式氨酰基化。9.根据权利要求1所述的组合物,其另外包含RS,其中所述tRNA经氨基酸氨酰基化。10..根据权利要求9所述的组合物,其中所述氨基酸为非天然编码的氨基酸。11.根据权利要求10所述的组合物,其中所述非天然编码的氨基酸为对乙酰基苯丙氨酸。12.,根据权利要求1所述的组合物,其中所迷tRNA自古细菌tRNA得到。13.,根据权利要求1所述的组合物,其中所述tRNA自詹氏曱烷球菌(M7a朋^c/z)得到。14.,根据权利要求1所述的组合物,其另外包含翻译系统。15.,根据权利要求14所述的组合物,其中所述翻译系统为无细胞翻译系统。16..根据权利要求14所述的组合物,其中所述翻译系统为细胞溶解产物。17,,根据权利要求14所述的组合物,其中所述翻译系统为重建的系统。18..根据权利要求14所述的组合物,其中所述翻译系统为细胞翻译系统。19.,一种细胞,其包含翻译系统,其中所述翻译系统包含权利要求1的tRNA。20..根据权利要求19所述的细胞,其中所述细胞是真核细胞。21..根据权利要求20所述的细胞,其中所述真核细胞是酵母细胞。22..根据权利要求20所述的细胞,其中所述真核细胞是真菌细胞。23.,根据权利要求20所述的细胞,其中所述真核细胞是哺乳动物细胞。24.根据权利要求20所述的细胞,其中所述真核细胞是昆虫细胞。25.根据权利要求20所述的细胞,其中所述真核细胞是植物细胞。26.根据权利要求19所述的细胞,其中所述细胞是非真核细胞。27.根据权利要求26所述的细胞,其中所述非真核细胞是大肠杆菌(£.co/O细胞。28.根据权利要求19所述的细胞,其另外包含编码所关注的多肽的聚核苷酸,其中所述聚核普酸包含由所述tRNA识别的选择性密码子。29.根据权利要求28所述的细胞,其中所述所关注的多肽为人生长激素。30.—种大肠杆菌细胞,其包含权利要求1的tRNA。31.—种酵母细胞,其包含权利要求1的tRNA。32.—种真菌细胞,其包含权利要求1的tRNA。33.—种哺乳动物细胞,其包含权利要求1的tRNA。34.—种昆虫细胞,其包含权利要求1的tRNA。35.—种植物细胞,其包含权利要求1的tRNA。36.—种载体,其包含编码tRNA的聚核苦酸,所述tRNA具有选自由SEQIDNO:1、2、3、其互补聚核苷酸序列和其保守变异体组成的群组的核酸序列。37.根据权利要求36所述的载体,其中所述载体包含质粒、柯斯质粒(cosmid)、噬菌体或病毒。38.根据权利要求36所述的载体,其中所述载体为表达载体。39.—种细胞,其包含权利要求36的载体。40.—种在细胞中制造在特定位置处具有所选氨基酸的多肽的方法,所述方法包含使所述细胞在适当培养基中生长,其中所述细胞包含核酸,所述核酸包含至少一个选择性密码子并且编码多肽;和提供所述所选氨基酸;其中所述细胞另外包含正交tRNA(O-tRNA),其在所述细胞中起作用并且识别具有选自由SEQIDNO:1、2、3、其互补聚核普酸序列和其保守变异体组成的群组的氨基酸序列的选择性密码子;和正交氨酰基tRNA合成酶(O-RS),其中所述O-RS利用所述所选氨基酸使所述O-tRNA氨酰基化。41.根据权利要求40所述的方法,其中所述所选氨基酸为对乙酰基苯丙氨酸。42.—种多肽,其是由权利要求40的方法制造。43.根据权利要求40所述的多肽,其中所述所选氨基酸为对乙酰基苯丙氨酸。44.根据权利要求40所述的方法,其中所述多肽为人生长激素。45.—种聚核苷酸,其具有选自由SEQIDNO:1、2、3、其互补聚核苷酸序列和其保守变异体组成的群组的核酸序列。全文摘要本发明提供制造蛋白质生物合成机器的组件的组合物和方法,所述组合物和方法包括正交tRNA、正交氨酰基tRNA合成酶和正交tRNA/合成酶对。本发明还提供鉴别这些正交对的方法以及使用这些正交对制造蛋白质的方法。文档编号C12N15/12GK101273140SQ200580051325公开日2008年9月24日申请日期2005年12月1日优先权日2005年8月18日发明者芬·蒂昂申请人:Ambrx公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1