用于脊椎动物细胞的杂合抑制tRNA的制作方法

文档序号:438907阅读:508来源:国知局

专利名称::用于脊椎动物细胞的杂合抑制tRNA的制作方法
技术领域
:本发明涉及脊椎动物细胞中的翻译生物化学领域。本发明涉及在脊椎动物细胞中产生正交tRNA、正交合成酶和其对的方法以及正交tRNA、正交合成酶与其对的组合物。本发明还涉及非天然氨基酸组合物、包括非天然氨基酸的蛋白质以及在脊椎动物细胞中产生包括非天然氨基酸的蛋白质的方法。
背景技术
:从细菌到人类,每一种已知生物体的遗传密码都编码相同的二十种常见氨基酸。这二十种相同天然氨基酸的不同组合形成实质上进行生命的所有复杂过程(光合作用到信号转导和免疫反应)的蛋白质。为研究和修饰蛋白质的结构和功能,科学家们曾尝试操纵蛋白质的遗传密码和氨基酸序列。然而,难以去除由遗传密码所强加的将蛋白质局限于二十种基因编码的标准结构单元(其中极少见的特例为,硒代半胱氨酸(例如参看A.Bock等人、(1991),MolecularMicrobiology5:515-20)和吡咯赖氨酸(例如参看G.Srinivasan等人,(2002),Science296:1459-62))的约束。已取得一些进展来去除这些约束,但这一进展受到限制并且合理控制蛋白质结构和功能的能力仍不成熟。举例来说,化学家们已开发出合成和操纵小分子结构的方法和策略(例如参看E.J.Corey和X.-M.Cheng,TheLogicofChemicalSynthesis(Wiley-Interscience,NewYork,1995))。全合成(例如参看B.Merrifield,(1986),Science232:341-7(1986))和半合成方法(例如参看D.Y.Jackson等人,(1994)Science266:243-7;以及P.E.Dawson和S.B.Kent,(2000),AnnualReviewofBiochemistry69:923-60)使得合成肽和小蛋白质成为可能,但这些方法限制了超过10千道尔顿(kil0Dalton,kDa)的蛋白质的效用。诱变方法尽管有效,但也局限于有限数量的结构改变。在多种情况下,在整个蛋白质中竞争性并入常见氨基酸的极其接近的结构类似物已成为可能。例如参看R.Furter,(1998),ProteinScience7:419-26;K.Kirshenbaum等人,(2002),ChemBioChem3:235-7;和V.Doring等人,(2001),Scie腦292:501-4。在尝试扩大操纵蛋白质结构和功能的能力的过程中,开发出使用经化学酰化的正交tRNA的活体外方法,其使得能在活体外响应无义密码子选择性并入非天然氨基酸(例如参看,J.A.Ellman等人,(1992),Science255:197-200)。将具有新颖结构和物理特性的氨基酸选择性并入蛋白质中,来研究蛋白质折叠和稳定性以及生物分子识别和催化。例如参看,D.Mendel等人(1995),AnnualReviewofBiophysicsandBiomolecularStructure24:435-462;禾nV.W.Cornish等人(1995年3月31、日),AngewandteChemie-InternationalEditioninEnglish34:621-633。然而,这一方法的化学计量性质极大限制了能产生的蛋白质的量。已将非天然氨基酸显微注射到细胞中。举例来说,通过显微注射以化学方式错酰化的嗜热四膜虫(Tetrahymenathermophila)tRNA(例如,M.E.Saks等人(1996),/Wo/ro/^/m15w/7pms;s7'o",J.Biol.Chem.271:23169-23175)禾口相关mRNA而将非天然氨基酸引入爪蟾卵母细胞(Xenopusoocyte)中的烟碱型乙酰胆碱受体中(例如,M.W.Nowak等人(1998),/"w'vo/"cor/ora"o"o/w朋她m/a7m'朋鏡.(is"z'o"c/2a朋e/sz'wZewopiwooc,expmwz'ows,em,MethodEnzymol.293:504-529)。这允许通过引入具有独特物理或化学特性的含侧链氨基酸来对卵母细胞中的受体进行详细生物物理研究。例如参看,D.A.Dougherty(2000),[/朋<^画/画'"o<xs"戶h。/.profe/"WmCi/re朋(i細"/ow,Curr.Opin.Chem.Biol.4:645-652。不幸的是,这禾中方法局限于细胞中可进行显微注射的蛋白质,并且由于相关tRNA是在活体外以化学方式酰化并且无法再酰化,故蛋白质的产率极低。为克服这些缺点,将新组件添加到原核生物大肠杆菌(&c/2en'c/n'flcW,五.cw7)的蛋白质生物合成机器中(参看L.Wang等人,(2001),Science292:498-500),这允许在活体内基因编码非天然氨基酸。已使用这种方法响应琥珀密码子TAG将多种具有新颖化学、物理或生物特性的新氨基酸有效且高保真地并入大肠杆菌的蛋白质中,所述新氨基酸包括光亲和标记和光致异构化氨基酸、酮基氨基酸和糖基化氨基酸。例如参看J.W.Chin等人,(2002),JournaloftheAmericanChemicalSociety124:9026-9027;J.W.Chin,&P.G.Schultz,(2002),ChemBioChem11:1135-1137;J.W.Chin等人,(2002),PNASUnitedStatesofAmerica99:11020-11024;和L,Wang,&P,G.Schultz,(2002),Chem.Comm.,1-10。然而,原核生物和真核生物的翻译机器并不高度保守;因此,添加到大肠杆菌中的生物合成机器的组件通常无法用于将非天然氨基酸位点特异性并入脊椎动物细胞中的蛋白质中。举例来说,用于大肠杆菌中的詹氏甲垸球菌(ikfeA朋ococcM/amKwcM)酪氨酰-tRNA合成酶/tRNA对在脊椎动物细胞中并不正交。此外,真核生物而非原核生物中tRNA的转录是通过RNA聚合酶III进行,并且这会限制能在脊椎动物细胞中转录的tRNA结构基因的一级序列。而且,与原核生物细胞相比,脊椎动物细胞中的tRNA都是从转录tRNA的细胞核输出到细胞质,以进行翻译。最后,脊椎动物的80S核糖体与70S原核生物核糖体截然不同。因此,需要开发出经改进的生物合成机器组件以扩充脊椎动物遗传密码。如在仔细查看以下公开内容后将显而易见,本发明满足这些要求和其它要求。
发明内容本发明对脊椎动物细胞提供翻译组件,例如正交氨酰基-tRNA合成酶(O-RS)与正交tRNA(O-tRNA)对和其个别组件,所述翻译组件可用于脊椎动物蛋白质生物合成机器中以将非天然氨基酸并入脊椎动物细胞中正在生长的多肽链中。本发明的组合物包括包含正交氨酰基-tRNA合成酶(O-RS)(例如,得自非脊椎动物生物体,诸如大肠杆菌、嗜热脂肪芽孢杆菌(5ac/〃wWearo快e,印/n7w)等)的脊椎动物细胞(例如,哺乳动物细胞、禽类细胞、鱼细胞、爬行动物细胞、两栖动物细胞、得自非哺乳动物的细胞等),其中O-RS优先在脊椎动物细胞中利用至少一个非天然氨基酸将正交tRNA(O-tRNA)氨酰化。可任选将指定脊椎动物细胞中的两个或两个以上OtRNA氨酰化。一方面,O-RS利用非天然氨基酸将0-tRNA氨酰化,这与具有(例如)如SEQIDNO.:86或45中所述的氨基酸序列的O-RS例如至少40%、至少45%、至少50%、至少60%、至少75%、至少80%或者甚至90%或90%以上有效。在一个实施例中,本发明的O-RS利用非天然氨基酸将O-tRNA氨酰化,这比0-RS利用天然氨基酸将O-tRNA氨酰化有效例如至少10倍、至少20倍、至少30倍等。在一个实施例中,O-RS或其部分是由如SEQIDNO.:3-35中任一序列所述的多聚核苷酸序列或其互补多聚核苷酸序列编码。在另一实施例中,O-RS包含如SEQIDNO.:36-63和/或86中任一序列所述的氨基酸序列,或其保守变异体。在另一实施例中,O-RS包含例如与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列至少卯%、至少95%、至少98%、至少99%或至少99.5%或99.5%以上一致并且包含两个或两个以上来自A-E组的氨基酸的氨基酸序列。A组包括在与大肠杆菌TyrRS的Tyr37对应的位置的缬氨酸、异亮氨酸、亮氨酸、甘氨酸、丝氨酸、丙氨酸或苏氨酸。B组包括在与大肠杆菌TyrRS的Asnl26对应的位置的天冬氨酸。C组包括在与大肠杆菌TyrRS的Aspl82对应的位置的苏氨酸、丝氨酸、精氨酸、天冬酰胺或甘氨酸。D组包括在与大肠杆菌TyrRS的Phel83对应的位置的甲硫氨酸、丙氨酸、缬氨酸或酪氨酸;并且E组包括在与大肠杆菌TyrRS的Leu186对应的位置的丝氨酸、甲硫氨酸、缬氨酸、半胱氨酸、苏氨酸或丙氨酸。在另一实施例中,O-RS具有一种或多种相比天然氨基酸改进或增强的针对非天然氨基酸的酶特性。举例来说,相比天然氨基酸,改进或增强的针对非天然氨基酸的特性包括例如较高Km、较低Km、较高kcat、较低kcat、较低kcat/km、较高kcat/km等。脊椎动物细胞还任选包括非天然氨基酸。脊椎动物细胞任选包括正交tRNA(O-tRNA)(例如,得自非脊椎动物生物体,诸如大肠杆菌、嗜热脂肪芽孢杆菌等),其中O-tRNA识别选择性密码子且优先通过O-RS利用非天然氨基酸氨酰化。一方面,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少卯%、至少95%或99%的包含如SEQIDNO.:65中所述的多聚核卄酸序列或在细胞中由如SEQIDNO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介导将非夭然氨基酸并入蛋白质中。另一方面,O-tRNA包含SEQIDNO.:65的序列,且O-RS包含选自SEQIDNO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽序列和/或其保守变异体。在另一实施例中,脊椎动物细胞包含包括编码所关注多肽的多聚核苷酸的核酸,其中所述多聚核苷酸包含由O-tRNA所识别的选择性密码子。一方面,包含非天然氨基酸的所关注多肽的产率例如为从多聚核苷酸缺乏选择性密码子的细胞中获得天然存在的所关注多肽的产率的至少2.5%、至少5%、至少10%、至少25%、至少30%、至少40%、50%或更多。另一方面,细胞在不存在非天然氨基酸的情况下以一定产率产生所关注多肽,所述产率例如为在存在非天然氨基酸的情况下多肽产率的不到35%、不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。本发明还提供一种脊椎动物细胞,其包含正交氨酰基-tRNA合成酶(O-RS)、正交tRNA(OtRNA)、非天然氨基酸和包含编码所关注多肽的多聚核苷酸的核酸。所述多聚核苷酸包含由O-tRNA识别的选择性密码子。此外,在脊椎动物细胞中,O-RS优先利用非天然氨基酸将正交tRNA(O-tRNA)氨酰化,且所述细胞在不存在非天然氨基酸的情况下以一定产率产生所关注多肽,所述产率例如为在存在非天然氨基酸的情况下多肽产率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。包括包含正交tRNA(O-tRNA)的脊椎动物细胞的组合物也为本发明的特征。通常,O-tRNA介导在活体内将非天然氨基酸并入蛋白质中,所述蛋白质是由包含由O-tRNA识别的选择性密码子的多聚核苷酸编码。在一个实施例中,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或甚至99%或99。/。以上的包含如SEQIDNO.:65中所述的多聚核苷酸序列或在细胞中由如SEQIDNO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介导将非天然氨基酸并入蛋白质中。在另一实施例中,O-tRNA包含如SEQIDNO.:65中所述的多聚核苷酸序列或其保守变异体,或者是由如SEQIDNO.:65中所述的多聚核苷酸序列或其保守变异体加工。在另一实施例中,O-tRNA包含可重复利用的O-tRNA。在本发明一方面中,O-tRNA经转录后修饰。本发明还提供一种在脊椎动物细胞中编码O-tRNA的核酸,或其互补多聚核苷酸。在一个实施例中,核酸包含A盒和B合本发明还涉及产生例如O-RS或O-tRNA/O-RS对等翻译组件的方法(和由这些方法产生的翻译组件)。举例来说,本发明提供产生正交氨酰基-tRNA合成酶(O-RS)的方法,所述O-RS在脊椎动物细胞中优先利用非天然氨基酸将正交tRNA氨酰化。所述方法包括例如(a)在存在非天然氨基酸的情况下,使第一物种的脊椎动物细胞群经历正选择,其中所述脊椎动物细胞各自包含i)氨酰基-tRNA合成酶(RS)文库成员,ii)正交tRNA(O-tRNA),iii)编码正选择标记的多聚核苷酸,和iv)编码负选择标记的多聚核苷酸;其中在正选择下存活的细胞包含在存在非天然氨基酸的情况下将正交tRNA(O-tRNA)氨酰化的活性RS。使在正选择下存活的细胞在不存在非天然氨基酸的情况下经历负选择,以除去利用天然氨基酸将O-tRNA氨酰化的活性RS。这提供优先利用非天然氨基酸将O-tRNA氨酰化的O-RS。在某些实施例中,将编码正选择标记的多聚核苷酸可操作性连接到反应元件,并且所述细胞另外包含一种多聚核苷酸,其a)编码调节由反应元件进行的转录的转录调节蛋白(例如,脊椎动物转录调节蛋白等);且b)包含至少一个选择性密码子。通过利用非天然氨基酸氨酰化的O-tRNA将非天然氨基酸并入转录调节蛋白中,将会引起正选择标记的转录。在一个实施例中,转录调节蛋白为转录活化蛋白(例如GAL4等),且选择性密码子为琥珀终止密码子,例如其中所述琥珀终止密码子位于编码转录活化蛋白的DNA结合结构域的多聚核苷酸的一部分中,或实质上邻近编码转录活化蛋白的DNA结合结构域的多聚核苷酸的一部分。正选择标记可为多种分子中的任一个。在一个实施例中,正选择标记包含供生长的营养补充并且所述选择是在缺乏所述营养补充的培养基上执行。在另一实施例中,编码正选择标记的多聚核苷酸例如为ura3、leu2、lys2、lacZ基因、his3(例如,其中his3基因编码咪唑甘油磷酸酯脱水酶,通过提供3-氨基三唑(3-AT)检测)等。在另一实施例中,编码正选择标记的多聚核苷酸包含选择性密码子。与正选择标记相同,负选择标记也可为多种分子中的任一个。在某些实施例中,将编码负选择标记的多聚核苷酸可操作性连接到反应元件,转录调节蛋白通过所述反应元件介导转录。通过利用天然氨基酸氨酰化的O-tRNA将天然氨基酸并入转录调节蛋白中,将会引起负选择标记的转录。在一个实施例中,编码负选择标记的多聚核苷酸为例如ura3基因,且负选择是在包含5-氟乳清酸(5-FOA)的培养基上实现。在另一实施例中,用于负选择的培养基包含转化成通过负选择标记可检测的物质的选择或筛选剂。在本发明一方面中,可检测物质为有毒物质。在一个实施例中,编码负选择标记的多聚核苷酸包含选择性密码子。在某些实施例中,正选择标记和/或负选择标记包含在存在适当反应物的情况下发荧光或催化发光反应的多肽。在本发明一方面中,通过荧光活化细胞分选(fluorescence-activatedcellsorting,FACS)或通过发光来检测正选择标记和/或负选择标记。在某些实施例中,正选择标记和/或负选择标记包含基于亲和力的筛选标记或转录调节蛋白。在一个实施例中,同一多聚核苷酸编码正选择标记和负选择标记。在一个实施例中,编码本发明的正选择标记和/或负选择标记的多聚核苷酸可包含至少两个选择性密码子,其各自或都可包含至少两个不同选择性密码子或至两个相同选择性密码子。其它水平的选择/筛选严格度也可用于本发明方法中。在一个实施例中,所述方法可例如包含在步骤(a)、(b)或(a)和(b)中提供不同量的无活性合成酶,其中所述不同量的无活性合成酶提供另一水平的选择或筛选严格度。在一个实施例中,用于产生O-RS的方法的步骤(a)、(b)或步骤(a)和(b)包括改变例如正和/或负选择标记的选择或筛选严格度。所述方法任选包括使优先利用非天然氨基酸将O-tRNA氨酰化的O-RS经历另一回合选择,例如另一回合(数回合)正选择、另一回合(数回合)负选择或另一回合正和负选择的组合。在一个实施例中,选择/筛选包含一次或多次例如选自氨基酸渗透性改变、翻译效率改变、翻译保真度改变等的正或负选择/筛选。所述一种或多种改变是建立在一个或多个编码用于产生蛋白质的正交tRNA-tRNA合成酶对的组件的多聚核苷酸突变的基础上。通常,RS文库(例如,突变型RS文库)包含由例如来自非脊椎动物生物体的至少一种氨酰基-tRNA合成酶(RS)得到的RS。在一个实施例中,RS文库是从无活性RS得到,例如其中所述无活性RS是由使活性RS突变而产生。在另一实施例中,无活性RS包含氨基酸结合袋并且一个或多个包含所述结合袋的氨基酸经一个或多个不同氨基酸取代,例如所述经取代氨基酸经丙氨酸取代。在某些实施例中,产生O-RS的方法另外包括对编码RS的核酸执行随机突变、位点特异性突变、重组、嵌合构建或其任何组合,从而产生突变型RS文库。在某些实施例中,所述方法另外包括例如(c)分离出编码O-RS的核酸;(d)由所述核酸产生一组编码突变型O-RS的多聚核苷酸(例如,通过随机诱变、位点特异性诱变、嵌合构建、重组或其任何组合);和(e)重复步骤(a)和/或(b),直到获得优先利用非天然氨基酸将O-tRNA氨酰化的突变型O-RS。在本发明一方面中,将步骤(c)-(e)执行至少2次。产生O-tRNA/0-RS对的方法也为本发明的特征。在一个实施例中,如上文所述获得O-RS,且通过使第一物种的脊椎动物细胞群(其中所述脊椎动物细胞包含tRNA文库成员)经历负选择以除去包含经对于脊椎动物细胞为内源性的氨酰基-tRNA合成酶(RS)氨酰化的tRNA文库成员的细胞,来获得O-tRNA。这提供与第一物种的脊椎动物细胞正交的tRNA池。在本发明一方面中,tRNA文库包含由例如来自非脊椎动物生物体的至少一个tRNA得到的tRNA。在本发明另一方面中,氨酰基-tRNA合成酶(RS)文库包含由例如来自非脊椎动物生物体的至少一个氨酰基-tRNA合成酶(RS)得到的RS。在本发明另一方面中,tRNA文库包含由来自第一非脊椎动物生物体的至少一个tRNA得到的tRNA。氨酰基-tRNA合成酶(RS)文库任选包含由来.自第二非脊椎动物生物体的至少一个氨酰基-tRNA合成酶(RS)得到的RS。在一个实施例中,第一与第二非脊椎动物生物体相同。或者,第一与第二非脊椎动物生物体可不同。由本发明方法产生的特定0-tRNA/0-RS对也为本发明的特征。本发明另一特征为用于在一种物种中产生翻译组件并将选择/筛选的翻译组件引入第二物种中的方法。举例来说,在第一物种(例如,脊椎动物物种,诸如酵母等)中产生O-tRNA/0-RS对的方法另外包括将编码O-tRNA的核酸和编码O-RS的核酸引入第二物种(例如,哺乳动物、昆虫、真菌、藻类、植物等)的脊椎动物细胞中。第二物种可使用引入的翻译组件在活体内例如在翻译期间将非天然氨基酸并入正在生长的多肽链中。在另一实例中,在脊椎动物细胞中产生优先利用非天然氨基酸将正交tRNA氨酰化的正交氨酰基-tRNA合成酶(O-RS)的方法包括(a)在存在非天然氨基酸的情况下,使第一物种(例如,脊椎动物物种,诸如酵母等)的脊椎动物细胞群经历正选择。第一物种的脊椎动物细胞各自包含i)氨酰基-tRNA合成酶(RS)文库成员,ii)正交tRNA(0-tRNA),iii)编码正选择标记的多聚核苷酸,和iv)编码负选择标记的多聚核苷酸。在正选择中存活的细胞包含在存在非天然氨基酸的情况下将正交tRNA(O-tRNA)氨酰化的活性RS。使在正选择下存活的细胞在不存在非天然氨基酸的情况下经历负选择,以除去利用天然氨基酸将O-tRNA氨酰化的活性RS,从而提供优先利用非天然氨基酸将O-tRNA氨酰化的O-RS。将编码O-tRNA的核酸和编码O-RS的核酸引入第二物种(例如,哺乳动物、昆虫、真菌、藻类、植物等)的脊椎动物细胞中。当在第二物种中翻译时,可使用这些组件将非天然氨基酸并入第二物种中的所关注蛋白质或多肽中。在一个实施例中,将O-tRNA和/或O-RS引入第二物种的脊椎动物细胞中。在某些实施例中,通过使第一物种的脊椎动物细胞群(其中所述脊椎动物细胞包含tRNA文库成员)经历负选择以除去包含经对于脊椎动物细胞为内源性的氨酰基-tRNA合成酶(RS)氨酰化的tRNA文库成员的细胞,来获得O-tRNA。这提供与第一物种和第二物种的脊椎动物细胞正交的tRNA池。具有至少一个非天然氨基酸的蛋白质(或所关注多肽)也为本发明的特征。在本发明某些实施例中,具有至少一个非天然氨基酸的蛋白质包括至少一个翻译后修饰。在一个实施例中,至少一个翻译后修饰包含通过[3+2]环加成将包含第二反应性基团的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交联剂、细胞毒性化合物、亲和标记、生物素衍生物、树脂、第二蛋白质或多肽、金属螯合剂、辅因子、脂肪酸、碳水化合物、多聚核苷酸(例如,DNA、RNA等)等)与至少一个包含第一反应性基团的非天然氨基酸连接。举例来说,第一反应性基团为炔基部分(例如,在非天然氨基酸对-炔丙基氧基苯丙氨酸中)(这个基团有时也称为乙炔部分),且第二反应性基团为叠氮基部分。在另一实例中,第一反应性基团为叠氮基部分(例如,在非天然氨基酸对叠氮基-L-苯丙氨酸中)且第二反应性基团为炔基部分。在某些实施例中,本发明的蛋白质包括至少一个包含至少一个翻译后修饰的非天然氨基酸(例如,酮基非天然氨基酸),其中所述至少一个翻译后修饰包含糖部分。在某些实施例中,翻译后修饰是于脊椎动物细胞中在活体内进行。在某些实施例中,蛋白质包括至少一个在活体内由脊椎动物细胞所产生的翻译后修饰,其中所述翻译后修饰通常不是由原核细胞进行。翻译后修饰的实例包括(但不限于)乙酰化、酰化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷酸化、糖脂连接修饰等。在一个实施例中,翻译后修饰包含通过GlcNAc-天冬酰胺键将寡糖与天冬酰胺连接在一起(例如,寡糖包含(GlcNAc-Man)2-Man-GlcNAc-GlcNAc等的情形)。在另一实施例中,翻译后修饰包含通过GalNAc-丝氨酸、GalNAc-苏氨酸、GlcNAc-丝氨酸或GlcNAc-苏氨酸键将寡糖(例如,Gal-GalNAc、Gal-GlcNAc等)与丝氨酸或苏氨酸连接在一起。在某些实施例中,本发明的蛋白质或多肽可包含分泌或定位序列、抗原决定基标签(epit叩etag)、FLAG标签、聚组氨酸标签、GST融合体等。通常,蛋白质与任何可用蛋白质(例如,治疗性蛋白质、诊断性蛋白质、工业酶或其部分等)例如至少60%、至少70%、至少75%、至少80%、至少90%、至少95%或甚至至少99%或99%以上一致,且其包含一个或多个非天然氨基酸。在一个实施例中,本发明的组合物包括所关注蛋白质或多肽和赋形剂(例如,缓冲液、医药学上可接受的赋形剂等)。所关注蛋白质或多肽可含有至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或者十个或十个以上非天然氨基酸。非天然氨基酸可相同或不同,例如可在蛋白质中1、2、3、4、5、6、7、8、9、IO个或更多不同位点包含1、2、3、4、5、6、7、8、9、10个或更多不同非天然氨基酸。在某些实施例中,天然存在的蛋白质型式中所存在的至少一个(但少于全部)特定氨基酸经非天然氨基酸取代。蛋白质(或所关注多肽)的实例包括(但不限于)例如,细胞因子、生长因子、生长因子受体、干扰素、白细胞介素、炎症分子、癌基因产物、肽激素、信号转导分子、类固醇激素受体、促红细胞生成素(EPO)、胰岛素、人生长激素、a-l抗胰蛋白酶、血管抑素(Angiostatin)、抗溶血因子(Antihemolyticfactor)、抗体、载脂蛋白、脱辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子、T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-IO、GCP-2、NAP-4、SDF-1、PF4、MIG、降钙素、c-kit配体、细胞因子、CC趋化因子、单核细胞趋化蛩白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-la、单核细胞炎症蛋白-l卩、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、T64262、CD40、CD40配体、C-kit配体、胶原蛋白、群落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子、DHFR、上皮中性粒细胞活化肽-78、GROa/MGSA、GRO(3、GROy、MIP-la、MIP-1S、MCP-1、表皮生长因子(EGF)、上皮中性粒细胞活化肽、促红细胞生成素(EPO)、脱落毒素、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤维粘连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因子、生长因子受体、刺猬蛋白(hedgehogprotein)、血红蛋白、肝细胞生长因子(HGF)、水蛭素(hirudin)、人血清白蛋白、ICAM-1、ICAM-1受体、LFA-1、LFA-1受体、胰岛素、类胰岛素生长因子(IGF)、IGF-I、IGF-II、干扰素(IFN)、IFN-a、IFN-(3、IFN卞白细胞介素、IL-1、IL-2、IL-3、IL-4、IL墨5、IL-6、IL-7、IL-8、IL-9、IL-IO、IL-ll、IL-12、角质细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、荧光素酶、神经营养因子、中性粒细胞抑制因子(NIF)、抑瘤素M、成骨蛋白、癌基因产物、甲状旁腺激素、PD-ECSF、PDGF、肽激素、人生长激素、多效生长因子、蛋白质A、蛋白质G、致热性外毒素A、B或C、松驰素、肾素、SCF、可溶性补体受体I、可溶性I-CAM1、可溶性白细胞介素受体、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超抗原、葡萄球菌肠毒素、SEA、SEB、SEC1、SEC2、SEC3、SED、SEE、类固醇激素受体、超氧化物歧化酶(SOD)、中毒性休克综合症毒素、胸腺肽al、组织型纤溶酶原活化剂、肿瘤生长因子(TGF)、TGF-a、TGF-p、肿瘤坏死因子、肿瘤坏死因子a、肿瘤坏死因子p、肿瘤坏死因子受体(TNFR)、VLA-4蛋白、VCAM-l蛋白、血管内皮生长因子(VEGEF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受体、孕酮受体、睾酮受体、醛固酮受体、LDL受体、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-l、ICAM-1/LFA-1、透明质酸(hyalurin)/CD44、皮质酮、存在于Genebank或其它可用数据库中的蛋白质等,和/或其部分。在一个实施例中,所关注多肽包括转录调节蛋白(例如,转录活化蛋白(诸如GAL4)或转录阻遏蛋白等)或其部分。本发明的脊椎动物细胞提供合成包含大量有用非天然氨基酸的蛋白质的能力。举例来说,可产生在细胞提取物、缓冲液、医药学上可接受的赋形剂等中浓度为例如至少10微克/升、至少50微克/升、至少75微克/升、至少100微克/升、至少200微克/升、至少250微克/升或至少500微克/升或更多蛋白质的包含非天然氨基酸的蛋白质。在某些实施例中,本发明的组合物包括例如至少10^g、至少50^g、至少75pg、至少100貼、至少200吗、至少250吗或至少500pg或更多包含非天然氨基酸的蛋白质。在某些实施例中,所关注蛋白质或多肽(或其部分)是由核酸编码。通常,核酸包含至少一个选择性密码子、至少两个选择性密码子、至少三个选择性密码子、至少四个选择性密码子、至少五个选择性密码子、至少六个选择性密码子、至少七个选择性密码子、至少八个选择性密码子、至少九个选择性密码子或甚至十个或十个以上选择性密码子。本发明还提供用于在脊椎动物细胞中产生至少一种包含至少一个非天然氨基酸的蛋白质的方法(以及由所述方法产生的蛋白质)。所述方法包括例如使包含包括至少一个选择性密码子且编码蛋白质的核酸的脊椎动物细胞在适当培养基中生长。脊椎动物细胞还包含正交tRNA(O-tRNA),其在细胞中起作用并且识别选择性密码子;和正交氨酰基tRNA合成酶(O-RS),其优先利用非天然氨基酸将O-tRNA氨酰化;并且所述培养基包含非天然氨基酸。在一个实施例中,O-RS利用非天然氨基酸将O-tRNA氨酰化,这与具有(例如)如SEQIDNO.:86或45中所述序列的氨基酸序列的O-RS例如至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95'%或者甚至99%或99%以上有效。在另一实施例中,0-tRNA包含SEQIDNO.:64或65或者其互补多聚核苷酸序列;由SEQIDNO.:64或65或者其互补多聚核苷酸序列加工;或由SEQIDNO.:64或65或者其互补多聚核苷酸序列编码。在另一实施例中,O-RS包含如SEQIDNO.:36-63和/或86中任一序列所述的氨基酸序列。在一个实施例中,所述方法另外包括将非天然氨基酸并入蛋白质中,其中所述非天然氨基酸包含第一反应性基团;和使所述蛋白质与包含第二反应性基团的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交联剂、细胞毒性化合物、亲和标记、生物素衍生物、树脂、第二蛋白质或多肽、金属螯合剂、辅因子、脂肪酸、碳水化合物、多聚核苷酸(例如,DNA、RNA等)等)接触。第一反应性基团与第二反应性基团反应以通过[3+2]环加成将所述分子与非天然氨基酸连接。在一个实施例中,第一反应性基团为炔基或叠氮基部分且第二反应性基团为叠氮基或炔基部分。举例来说,第一反应性基团为炔基部分(例如,在非天然氨基酸对炔丙基氧基苯丙氨酸中)且第二反应性基团为叠氮基部分。在另一实例中,第一反应性基团为叠氮基部分(例如,在非天然氨基酸对叠氮基-L-苯丙氨酸中)且第二反应性基团为炔基部分。在某些实施例中,所编码的蛋白质包含治疗性蛋白质、诊断性蛋白质、工业酶或其部分。在一个实施例中,由所述方法产生的蛋白质进一步通过非天然氨基酸来得以修饰。举例来说,例如通过亲核-亲电反应、[3+2]环加成等来修饰非天然氨基酸。在另一实施例中,在活体内通过至少一个翻译后修饰(例如,N-糖基化、O-糖基化、乙酰化、酰化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷酸化、糖脂连接修饰等)来修饰由所述方法产生的蛋白质。还提供产生筛选或选择转录调节蛋白的方法(以及由所述方法产生的筛选或选择转录调节蛋白)。所述方法包括例如选择第一多聚核苷酸序列,其中所述多聚核苷酸序列编码核酸结合结构域;和使所述第一多聚核苷酸序列突变以包括至少一个选择性密码子。这将提供筛选或选择多聚核苷酸序列。所述方法还包括例如选择第二多聚核苷酸序列,其中所述第二多聚核苷酸序列编码转录活化结构域;提供包含可操作性连接到第二多聚核苷酸序列的筛选或选择多聚核苷酸序列的构建体;和将所述构建体、非天然氨基酸、正交tRNA合成酶(O-RS)和正交tRNA(O-tRNA)引入細胞中。利用这些组件,0-RS优先利用非天然氨基酸将0-tRNA氨酰化,且0-tRNA识别选择性密码子,并响应筛选或选择多聚核苷酸序列中的选择性密码子将非天然氨基酸并入核酸结合结构域中。这将提供筛选或选择转录调节蛋白。在某些实施例中,本发明的组合物和方法包括脊椎动物细胞。本发明的脊椎动物细胞包括例如哺乳动物细胞、酵母细胞、真菌细胞、植物细胞、昆虫细胞等中的任一种。本发明的翻译组件可得自多种生物体,例如非脊椎动物生物体,诸如原核生物体(例如,大肠杆菌、嗜热脂肪芽孢杆菌等)或古细菌;或例如脊椎动物生物体。本发明的选择性密码子将扩充脊椎动物蛋白质生物合成机器的遗传密码子框架。多个选择性密码子中的任一个可用于本发明中,包括终止密码子(例如,琥珀密码子、赭石密码子或蛋白石终止密码子)、无义密码子、稀有密码子、四(或更多)碱基密码子等。可用于本文所述的组合物和方法中的非天然氨基酸的实例包括(但不限于)对-乙酰基-L-苯丙氨酸;对-碘-L-苯丙氨酸;O-甲基-L-酪氨酸;对-炔丙基氧基苯丙氨酸;对-炔丙基-苯丙氨酸;L-3-(2-萘基)丙氨酸;3-甲基-苯丙氨酸;0-4-烯丙基-L-酪氨酸;4-丙基-L-酪氨酸;三-O-乙酰基-GlcNAcp-丝氨酸;L-多巴(L-Dopa);氟化苯丙氨酸;异丙基-L-苯丙氨酸;对-叠氮基-L-苯丙氨酸;对-酰基-L-苯丙氨酸;对-苯甲酰基-L-苯丙氨酸;L-磷酸丝氨酸;膦酰基丝氨酸;膦酰基酪氨酸;对-溴苯丙氨酸;对-氨基-L-苯丙氨酸;异丙基-L-苯丙氨酸;酪氨酸氨基酸的非天然类似物;谷氨酰胺氨基酸的非天然类似物;苯丙氨酸氨基酸的非天然类似物;丝氨酸氨基酸的非天然类似物;苏氨酸氨基酸的非天然类似物;垸基、芳基、酰基、叠氮基、氰基、卤基、肼、酰肼、羟基、烯基、炔基、醚、硫醇、磺酰基、硒基、酯、硫代酸、硼酸酯基(borate)、硼酸酯基(boronate)、磷酸基、膦酸基、膦、杂环、烯酮、亚胺、醛、羟胺、酮基或氨基取代的氨基酸,或其任何组合;具有可光活化交联剂的氨基酸;自旋标记的氨基酸;发荧光氨基酸;结合金属的氨基酸;含金属氨基酸;放射性氨基酸;光笼蔽(photocaged)和/或光致异构化氨基酸;含生物素或生物素类似物氨基酸;含酮基氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化学可裂解或可光裂解氨基酸;具有伸长侧链的氨基酸;含有毒基团的氨基酸;糖取代的氨基酸;含碳连接的糖的氨基酸;具有氧化还原活性的氨基酸;含a-羟基的酸;氨基硫代酸;a,a双取代氨基酸;p-氨基酸;除脯氨酸或组氨酸外的环状氨基酸;除苯丙氨酸、酪氨酸或色氨酸外的芳香族氨基酸等。本发明还提供多肽(O-RS)和多聚核苷酸,例如O-tRNA、编码O-RS或其部分(例如,合成酶活性位点)的多聚核苷酸、用于构建氨酰基-tRNA合成酶突变体的寡聚核苷酸、编码所关注蛋白质或多肽的包含一个或多个选择性密码子的多聚核苷酸等。举例来说,本发明的多肽包括包含如SEQIDNO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽;包含由如SEQIDNO.:3-35中任一序列所述的多聚核苷酸序列编码的氨基酸序列的多肽;以及与对包含如SEQIDNO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽具特异性的抗体特异性免疫反应的多肽;或包含由如SEQIDNO.:3-35中任一序列所示的多聚核苷酸序列编码的氨基酸序列的多肽。本发明的多肽中还包括包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQIDNO.:2)至少90%—致的氨基酸序列且包含两个或两个以上A-E组(上文所述)氨基酸的多肽。类似地,本发明的多肽还任选包括包含SEQIDNO.:36-63和/或86中任一序列的至少20个相邻氨基酸以及两个或两个以上如上文在A-E组中所述的氨基酸取代的多肽。还包括包含任一上述多肽的保守变异体的氨基酸序列作为本发明的多肽。在一个实施例中,组合物包括本发明的多肽和赋形剂(例如,缓冲液、水、医药学上可接受的赋形剂等)。本发明还提供与本发明的多肽特异性免疫反应的抗体或抗血清。本发明中还提供多聚核苷酸。本发明的多聚核苷酸包括具有一个或多个选择性密码子的编码本发明的所关注蛋白质或多肽的多聚核苷酸。此外,本发明的多聚核苷酸包括例如包含如SEQIDNO.:3-35、64-85中任一序列所述的核苷酸序列的多聚核苷酸;与其多聚核苷酸序列互补或编码其多聚核苷酸序列的多聚核苷酸;和/或编码包含如SEQIDNO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽的多聚核苷酸,或其保守变异体。本发明的多聚核苷酸还包括编码本发明的多肽的多聚核苷酸。类似地,在高度严格条件下在实质上整个核酸长度上与上文所述的多聚核苷酸杂交的核酸为本发明的多聚核苷酸。本发明的多聚核苷酸还包括编码多肽的多聚核苷酸,所述多肽包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQIDNO.:2)至少90%—致的氨基酸序列且包含两个或两个以上如上文在A-E组(上文指出)中所述的突变。本发明的多聚核苷酸中还包括与上文所述的多聚核苷酸至少70%(或至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或更多)一致的多聚核苷酸,和/或包含任一上文所述的多聚核苷酸的保守变异体的多聚核苷酸。在某些实施例中,载体(例如,质粒、柯斯质粒(cosmid)、噬菌体、病毒等)包含本发明的多聚核苷酸。在一个实施例中,载体为表达载体。在另一实施例中,表达载体包括可操作性连接到一个或多个本发明的多聚核苷酸的启动子。在另一实施例中,细胞包含包括本发明的多聚核苷酸的载体。另一方面,本发明提供化合物的组合物和制造所述化合物的方法。举例来说,化合物包括例如非天然氨基酸(诸如对-(炔丙基氧基)-苯丙氨酸(例如,图11中的l));叠氮基染料(诸如化学结构4和化学结构6中所示);炔基聚乙二醇(例如,如化学结构7中所示),其中n为介于例如50与10,000之间、75与5,000之间、100与2,000之间、100与1,000之间等的整数等。在本发明的实施例中,炔基聚乙二醇具有例如约5,000到约100,000Da、约20,000到约50,000Da、约20,000到约10,000Da(例如,20,000Da)的分子量。还提供包含这些化合物,例如具有蛋白质和细胞的各种组合物。一方面,包括对-(炔丙基氧基)-苯丙氨酸非天然氨基酸的组合物进一步包括正交tRNA。可将非天然氨基酸与正交tRNA键接(例如共价键接),例如通过氨酰基键与正交tRNA共价键接、与正交tRNA的末端核糖的3'0H或2'OH共价键接。试剂盒也为本发明的特征。举例来说,提供在细胞中产生包含至少一个非天然氨基酸的蛋白质的试剂盒,其中所述试剂盒包括含有编码O-tRNA的多聚核苷酸序列或O-tRNA以及编码O-RS的多聚核苷酸序列或O-RS的容器。在一个实施例中,试剂盒另外包括至少一个非天然氨基酸。在另一实施例中,试剂盒另外包含用于产生蛋白质的说明材料。图1表示使用杂合tRNA使hGH的表达增加。具体实施例方式在详细描述本发明之前,应了解,本发明不限于特定装置或生物系统,其当然可以变化。还应了解,本文所使用的术语只是出于描述特定实施例的目的,并且不打算限制本发明。除非内容另作明确指示,否则如本说明书和随附权利要求中所使用,单数形式"一"和"所述"包括多个参考物。因此,例如提及"一细胞"包括两个或两个以上细胞的组合;提及"细菌"包括细菌混合物等。除非本文或下文说明书的剩余部分中另作定义,否则本文所使用的所有科技术语都具有与本发明所属领域技术人员通常所了解相同的含义。同源:当蛋白质和/或蛋白质序列是天然或以人工方式从共同的祖先蛋白质或蛋白质序列得到时,其为"同源"的。类似地,当核酸和/或核酸序列是天然或以人工方式从共同的祖先核酸或核酸序列得到时,其为同源的。举例来说,可通过任何可用的诱变方法来修饰任何天然存在的核酸以使其包括一个或多个选择性密码子。当表达时,这一经诱变核酸将编码包含一个或多个非天然氨基酸的多肽。当然,突变方法可另外改变一个或多个标准密码子,从而也使所得突变蛋白质中的一个或多个标准氨基酸改变。同源性一般是从两种或两种以上核酸或蛋白质(或其序列)之间的序列相似性推断得出。可用于确定同源性的序列之间相似性的确切百分比随所讨论的核酸和蛋白质而变化,但通常使用仅25%的序列相似性来确定同源性。较高的序列相似性水平(例如,30%、40%、50%、60%、70%、80%、90%、95%或99%或更多)也可用于确定同源性。测定序列相似性百分比的方法(例如,使用默认参数的BLASTP禾nBLASTN)在本文中得以描述并且一般可用。正交:如本文所使用,术语"正交"是指与对于细胞或翻译系统为内源的相应分子相比,以降低的效率利用细胞的内源性组件起作用,或者无法利用细胞的内源性组件起作用的分子(例如,正交tRNA(O-tRNA)和/或正交氨酰基tRNA合成酶(O-RS))。在tRNA和氨酰基-tRNA合成酶的情况下,正交是指与利用内源性tRNA合成酶起作用的内源性tRNA相比,正交tRNA无法利用内源性tRNA合成酶起作用或以降低的效率(例如,低于20%的效率、低于10%的效率、低于5%的效率或低于1%的效率)利用内源性tRNA合成酶起作用;或者与利用内源性tRNA起作用的内源性tRNA合成酶相比,正交氦酰基-tRNA合成酶无法利用内源性tRNA起作用或以降低的效率(例如,低于20%的效率、低于10%的效率、低于5%的效率或低于1%的效率)利用内源性tRNA起作用。正交分子在细胞中缺乏功能性内源互补分子。举例来说,当与通过内源性RS将内源性tRNA氨酰化相比较时,细胞中的任何内源性RS以降低的效率或甚至为零的效率将所述细胞中的正交tRNA氨酰化。在另一实例中,当与通过内源性RS将内源性tRNA氨酰化相比较时,正交RS以降低的效率或甚至为零的效率将所关注细胞中的任何内源性tRNA氨酰化。可将第二正交分子引入细胞中从而与第一正交分子一起作用。举例来说,正交tRNA/RS对包括所引入的在细胞中相对于相应内源性tRNA/RS对以一定效率(例如,50%效率、60%效率、70%效率、75%效率、80%效率、90%效率、95%效率或99%或更高效率)一起作用的互补组件。互补:术语"互补"是指可一起作用的正交对O-tRNA与O-RS的组件,例如其中O-RS将O-tRNA氨酰化。优先氨酰化:术语"优先氨酰化"是指与O-RS将天然存在的tRNA或用于产生O-tRNA的原材料氨酰化相比,O-RS利用非天然氨基酸将O-tRNA氨酰化的效率,例如70%效率、75%效率、85%效率、卯%效率、95%效率或99%或更高效率。将非天然氨基酸以高保真度,例如以对指定选择性密码子高于75%的效率、对指定选择性密码子高于约80%的效率、对指定选择性密码子高于约90%的效率、对指定选择性密码子高于约95%的效率或对指定选择性密码子高于约99%或更高效率并入正在生长的多肽链中。选择性密码子:术语"选择性密码子"是指在翻译过程中由O-tRNA识别且不被内源性tRNA识别的密码子。O-tRNA反密码子环识别mRNA上的选择性密码子并且在多肽中的这一位点并入其氨基酸,例如非天然氨基酸。选择性密码子可例如包括无义密码子,诸如终止密码子,例如琥珀密码子、赭石密码子和蛋白石密码子;四个或四个以上碱基的密码子;稀有密码子;从天然或非天然碱基对获得的密码子等。抑制性tRNA:抑制性tRNA是(例如)通过提供响应选择性密码子将氨基酸并入多肽链的机制来改变指定翻译系统中信使RNA(mRNA)的阅读的tRNA。举例来说,抑制性tRNA可通读例如终止密码子、四碱基密码子或稀有密码子等。可重复利用tRNA:术语"可重复利用tRNA"是指在翻译期间经氨酰化且可利用氨基酸(例如非天然氨基酸)反复地再氨酰化以将所述氨基酸(例如非天然氨基酸)并入一个或多个多肽链中的tRNA。翻译系统:术语"翻译系统"是指将天然存在的氨基酸并入正在生长的多肽链(蛋白质)的组件集合。翻译系统的组件可包括例如核糖体、tRNA、合成酶、mRNA、氨基酸等。本发明的组件(例如,ORS、OtRNA、非天然氨基酸等)可添加到活体外或活体内翻译系统中,例如脊椎动物细胞,例如酵母细胞、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞等。非天然氨基酸:如本文所使用,术语"非天然氨基酸"是指不为20种常见的天然存在的氨基酸中的一种或者硒代半胱氨酸或吡咯赖氨酸的任何氨基酸、经修饰氨基酸和/或氨基酸类似物。得自:如本文所使用,术语"得自"是指从特定分子或生物体分离或者使用来自特定分子或生物体的信息制得的组件。无活性RS:如本文所使用,术语"无活性RS"是指已突变以致其无法再利用氨基酸将其天然同源tRNA氨酰化的合成酶。正选择或筛选标记:如本文所使用,术语"正选择或筛选标记"是指当存在(例如,经表达、经活化等)时导致将具有正选择标记的细胞从不具有正选择标记的细胞中鉴别出的标记。负选择或筛选标记:如本文所使用,术语"负选择或筛选标记"是指当存在(例如,经表达、经活化等)时使得鉴别出不具有所需特性(例如,当与具有所需特性的细胞相比较时)的细胞的标记。报告基因:如本文所使用,术语"报告基因"是指可用于选择所关注系统中的靶组件的组件。举例来说,报告基因可包括荧光筛选标记(例如,绿色荧光蛋白质);发光标记(例如,萤火虫荧光素酶蛋白);基于亲和力的筛选标记;或可选择标记基因,诸如his3、ura3、leu2、lys2、lacZ、卩-gal/lacZ(卩-半乳糖苷酶)、Adh(醇脱氢酶)等。脊椎动物:如本文所使用,术语"脊椎动物"是指属于系统发生域真核生物的生物体,诸如动物,例如哺乳动物、爬行动物、鸟类等。非真核生物:如本文所使用,术语"非真核生物"是指非脊椎动物生物体。举例来说,非脊椎动物生物体可属于真细菌(例如,大肠杆菌(&c/^n'c/n'aco/0、极端嗜热细菌(JTzermiw^2erwo/7/n'"csO、嗜热月旨肪芽孢杆菌CBoci//^WeaTO/7^r附op/n7iiy)等)系统发生域;或古细菌(例如,詹氏甲垸球菌(MW/m"oeoccMya朋oyc/n'z')、嗜热自养甲烷杆菌(Me^377o6a"en'wwAenw)m^Wra;^/cww)、诸如沃氏嗜盐富饶菌(i/a/o/eraxw/cam'0禾Q嗜盐菌属iViC-7(i7a/o6a"en'wwspeciesiViC-7)的嗜盐菌(//a/o6a"eW謂)、超嗜热古菌dc/aeog/o6iw/w/gzWiw)、强烈嗜热球菌(尸戸cocciw)、极端嗜热古菌(尸戶coccus/zo"'A:(^W)、嗜热泉生古细菌"ewrap>T,j^mfjc)等)系统发生域。抗体:如本文所使用,术语"抗体"包括(但不限于)实质上由一个或多个特异性结合并识别分析物(抗原)的免疫球蛋白基因或其片段所编码的多肽。实例包括多克隆抗体、单克隆抗体、嵌合抗体和单链抗体等。如本文所使用的术语"抗体"中也包括免疫球蛋白的片段,包括Fab片段和由表达文库(包括噬菌体呈现)所产生的片段。有关抗体结构和技术例如参看Paul,Fwm/ame"to//mw朋o/o狄第4版,1999,RavenPress,NewYork。保守变异体:术语"保守变异体"是指在功能上与得到保守变异体的组件(例如O-tRNA或O-RS)类似但序列变异的翻译组件,例如保守变异体O-tRNA或保守变异体O-RS。举例来说,O-RS将利用非天然氨基酸将互补O-tRNA或保守变异体O-tRNA氨酰化,但所述O-tRNA和所述保守变异体O-tRNA不具有相同序列。保守变异体的序列可具有例如一处变异、两处变异、三处变异、四处变异或者五处或五处以上变异,只要保守变异体与相应O-tRNA或O-RS互补即可。选择或筛选剂:如本文所使用,术语"选择或筛选剂"是指当存在时允许从群体中选择/筛选某些组件的试剂。举例来说,选择或筛选剂例如包括(但不限于)养分、抗生素、光波长、抗体、经表达多聚核苷酸(例如,转录调节蛋白)等。可例如通过浓度、强度等来改变选择剂。可检测物质:如本文所使用,术语"可检测物质"是指当经活化、改变、表达等时允许从群体中选择/筛选出某些组分的试剂。举例来说,可检测物质可为化学剂,例如5-氟乳清酸(5-FOA),其在某些条件下,例如表达URA3报告基因时,变为例如杀死表达URA3报告基因的细胞的可检测的有毒产物。除由遗传密码所强加的化学约束外,直接在脊椎动物细胞中基因修饰蛋白质结构的能力将提供探查和操纵细胞过程的有力的分子工具。本发明提供扩充脊椎动物细胞中基因编码的氨基酸数量的翻译组件。其包括tRNA(例如,正交tRNA(O-tRNA))、氨酰基-tRNA合成酶(例如,正交合成酶(O-RS))、O-tRNA/0-RS对和非天然氨基酸。通常,有效地表达和加工本发明的O-tRNA且其在脊椎动物细胞中的翻译过程中起作用,但不会被宿主的氨酰基-tRNA合成酶有效氮酰化。在mRNA翻译期间,本发明的O-tRNA响应选择性密码子将不编码常见20种氨基酸中的任一种的非天然氨基酸递送到正在生长的多肽链中。本发明的O-RS在脊椎动物细胞中优先利用非天然氨基酸将本发明的O-tRNA氨酰化,但不会将任何细胞质中宿主的tRNA氨酰化。此外,本发明的氨酰基-tRNA合成酶的特异性使得能接受非天然氨基酸,同时排除任何内源性氨基酸。包括例如O-RS的氮基酸序列的多肽或其部分也为本发明的特征。此夕卜,编码翻译组件0-tRNA、0-RS和其部分的多聚核苷酸为本发明的特征。本发明还提供产生所需翻译组件(例如)O-RS和或正交对(正交tRNA和正交氨酰基-tRNA合成酶)的方法,所述正交对利用非天然氨基酸用于脊椎动物细胞中,(和由所述方法产生的翻译组件)。举例来说,来自大肠杆菌的酪氨酰-tRNA合成酶/tRNAcuA对为本发明的0-tRNA/0-RS对。此外,本发明还提供在一种脊椎动物细胞中选择/筛选翻译组件并且当选择/筛选后将这些组件用于不同脊椎动物细胞(未用于选择/筛选的脊椎动物细胞)中的方法。举例来说,可在酵母(例如酿酒酵母(Sacc/zaTOmyc^ce^v^'ae))中进行产生用于脊椎动物细胞的翻译组件的选择/筛选方法,且随后可将这些所选组件用于另一脊椎动物细胞中,例如另一酵母细胞、哺乳动物细胞、昆虫细胞、植物细胞、真菌细胞等。本发明进一步提供在脊椎动物细胞中产生蛋白质的方法,其中所述蛋白质包含非天然氨基酸。所述蛋白质是使用本发明的翻译组件产生。本发明还提供包括非天然氨基酸的蛋白质(和由本发明的方法产生的蛋白质)。所关注蛋白质或多肽还可包括翻译后修饰,其例如是通过[3+2]环加成或亲核-亲电反应添加,并非由原核细胞所产生等。在某些实施例中,利用非天然氨基酸产生转录调节蛋白的方法(和由所述方法产生的蛋白质)也都包括在本发明中。包括包含非天然氨基酸的蛋白质的组合物也为本发明的特征。用于产生具有非天然氨基酸的蛋白质或多肽的试剂盒也为本发明的特征。正交氨酰基-TRNA合成酶(O-RS)为了将非天然氨基酸特异性并入脊椎动物细胞中的所关注蛋白质或多肽中,将改变合成酶的底物特异性,以致仅将所需非天然氨基酸而非常见20种氨基酸中任一种装入tRNA中。如果正交合成酶混杂,那么其将产生在耙位置具有天然与非天然氨基酸的混合物的突变蛋白质。本发明提供对特定非天然氨基酸具有经修饰的底物特异性的正交氨酰基-tRNA合成酶的组合物以及产生所述合成酶的方法。包括正交氨酰基-tRNA合成酶(O-RS)的脊椎动物细胞为本发明的特征。O-RS在脊椎动物细胞中优先利用非天然氨基酸将正交tRNA(0-tRNA)氨酰化。在某些实施例中,O-RS利用一个以上非天然氨基酸,例如两个或两个以上、三个或三个以上等。因此,本发明的O-RS可具有优先利用不同非天然氨基酸将O-tRNA氨酰化的能力。这允许通过选择将何种非天然氨基酸或非天然氨基酸组合放于细胞中和/或通过选择不同量的放于细胞中的非天然氨基酸以供其并入来达到另一层面的控制。本发明的0-RS任选具有一种或多种相比天然氨基酸改进或增强的针对非天然氨基酸的酶特性。这些特性包括例如与天然存在的氨基酸(例如,20种己知常见氨基酸中的一种)相比较,针对非天然氨基酸的较高Km、较低Km、较高kcat、较低kcat、较低kcat/km、较高kcat/km等。可任选通过包括O-RS的多肽和/或编码O-RS或其部分的多聚核苷酸将O-RS提供到脊椎动物细胞中。举例来说,O-RS或其部分是由如SEQIDNO.:3-35中任一序列所述的多聚核苷酸序列或其互补多聚核苷酸序列编码。在另一实例中,O-RS包含如SEQIDNO.:36-63和/或86中任一序列所述的氨基酸序列,或其保守变异体。关于例示性O-RS分子的序列,例如参看本文中表5、6和8以及实例6。O-RS还可包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列(例如,如SEQIDNO.:2中所述)例如至少90%、至少95%、至少98%、至少99%或甚至至少99.5%—致且包含两个或两个以上A-E组的氨基酸的氨基酸序列。A组包括在与大肠杆菌TyrRS的Tyr37对应的位置的缬氨酸、异亮氨酸、亮氨酸、甘氨酸、丝氨酸、丙氨酸或苏氨酸;B组包括在与大肠杆菌TyrRS的Asnl26对应的位置的天冬氨酸;C组包括在与大肠杆菌TyrRS的Asp182对应的位置的苏氨酸、丝氨酸、精氨酸、天冬酰胺或甘氨酸;D组包括在与大肠杆菌TyrRS的Phel83对应的位置的甲硫氨酸、丙氨酸、缬氨酸或酪氨酸;且E组包括在与大肠杆菌TyrRS的Leul86对应的位置的丝氨酸、甲硫氨酸、缬氨酸、半胱氨酸、苏氨酸或丙氨酸。除0-RS外,本发明的脊椎动物细胞还可包括其它组件,例如非天然氨基酸。脊椎动物细胞还包括正交tRNA(O-tRNA)(例如,得自非脊椎动物生物体,诸如大肠杆菌、嗜热脂肪芽孢杆菌等),其中O-tRNA识别选择性密码子且优先通过O-RS利用非天然氨基酸氨酰化。所述细胞中还可存在包含编码所关注多肽的多聚核苷酸的核酸,其中所述多聚核苷酸包含由O-tRNA识别的选择性密码子或者一个或多个所述密码子的组合。一方面,O-tRNA例如以至少45%、至少50%、至少60%、至少75%、至少80%、至少卯%、至少95%或99%的包含如SEQIDNO.:65中所述的多聚核苷酸序列或由如SEQIDNO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介导将非天然氨基酸并入蛋白质中。另一方面,O-tRNA包含SEQIDNO.:65,且O-RS包含SEQIDNO.:36-63和/或86中任一序列中所述的多肽序列和/或其保守变异体。关于例示性O-RS和O-tRNA分子的序列,也例如参看本文中表5和实例6。在一个实例中,脊椎动物细胞包含正交氨酰基-tRNA合成酶(O-RS)、正交tRNA(O-tRNA)、非天然氨基酸和包含编码所关注多肽的多聚核苷酸的核酸,所述多聚核苷酸包含由O-tRNA识别的选择性密码子。在脊椎动物细胞中,O-RS优先利用非天然氨基酸将正交tRNA(O-tRNA)氨酰化,且所述细胞在不存在非天然氨基酸的情况下以一定产率产生所关注多肽,所述产率例如为在存在非天然氨基酸的情况下多肽产率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。用于产生O-RS的方法(其为本发明的特征)任选包括由野生型合成酶框架产生突变合成酶池,且随后根据相对于常见20种氨基酸,针对非天然氨基酸的特异性选择突变RS。为分离出所述合成酶,其选择方法(i)敏感,因为由最初几回合得到的所需合成酶的活性较低且群体较小;(ii)"可调",因为需要以不同选择回合改变选择严格度;和(iii)通用,以致所述方法可用于不同非天然氨基酸。在脊椎动物细胞中产生优先利用非天然氨基酸将正交tRNA氨酰化的正交氨酰基-tRNA合成酶(0-RS)的方法通常包括应用正选择随后负选择的组合。在正选择过程中,抑制正标记非必需位置处所引入的选择性密码子将使脊椎动物细胞能在正选择压力下存活。因此,在存在非天然氨基酸的情况下,存活细胞编码将非天然氨基酸装于正交抑制tRNA的活性合成酶。在负选择的过程中,抑制负标记非必需位置处所引入的选择性密码子将去除具有天然氨基酸特异性的合成酶。负选择和正选择的存活细胞编码只能(或至少优先)利用非天然氨基酸将正交抑制tRNA氨酰化(装入)的合成酶。举例来说,所述方法包括(a)在存在非天然氨基酸的情况下,使第一物种的脊椎动物细胞群经历正选择,其中所述脊椎动物细胞各自包含i)氨酰基-tRNA合成酶(RS)文库成员,ii)正交tRNA(O-tRNA),iii)编码正选择标记的多聚核苷酸和iv)编码负选择标记的多聚核苷酸;其中在正选择下存活的细胞包含在存在非天然氨基酸的情况下将正交tRNA(O-tRNA)氨酰化的活性RS;和(b)在不存在非天然氨基酸的情况下,使在正选择下存活的细胞经历负选择,以除去利用天然氨基酸将O-tRNA氨酰化的活性RS,从而提供优先利用非天然氨基酸将O-tRNA氨酰化的O墨RS。正选择标记可为多种分子中的任一个。在一个实施例中,正选择标记为提供营养补充以供生长的产物,并且所述选择是在缺乏所述营养补充的培养基上执行。编码正选择标记的多聚核苷酸的实例包括(但不限于)例如基于补充细胞的氨基酸营养缺陷的报告基因、his3基因(例如,其中所述his3基因编码咪唑甘油磷酸酯脱水酶,通过提供3-氨基三唑(3-AT)检测)、ura3基因、leu2基因、lys2基因、lacZ基因、adh基因等。例如参看G.M.Kishore,&D.M.Shah,(1988),爿/m'mflcft/6/os^"Ae^iw/n'i^ons<xs/zerWcit/eAAnnualReviewofBiochemistry57:627-663。在一个实施例中,通过邻-硝基苯基-P-D-半乳糖吡喃糖苷(ONPG)水解检测lacZ产生。例如参看I.G.Serebriiskii,&E.A.Golemis,(2000),t/^sto加办/wwc/7cw..ev"/wa/7'卵o/Z)"a-ga/ac加/(i(xyeawa,ewp/oyed/"/7eyeaW/>v<-/i_y6rzW手"w,AnalyticalBiochemistry285:1-15。其它正选择标记包括例如荧光素酶、绿色荧光蛋白质(GFP)、YFP、EGFP、RFP、抗生素抗性基因的产物(例如,氯霉素乙酰转移酶(CAT))、转录调节蛋白(例如GAL4)等。编码正选择标记的多聚核苷酸任选包含选择性密码子。可将编码正选择标记的多聚核苷酸可操作性连接到反应元件。还可存在另一多聚核苷酸,其编码调节由反应元件进行的转录的转录调节蛋白且包含至少一个选择性密码子。通过经非天然氨基酸氨酰化的O-tRNA将非天然氨基酸并入转录调节蛋白中,将引起编码正选择标记的多聚核苷酸(例如报告基因)的转录。选择性密码子任选位于编码转录调节蛋白的DNA结合结构域的多聚核苷酸的一部分中或实质上邻近编码转录调节蛋白的DNA结合结构域的多聚核苷酸的一部分。还可将编码负选择标记的多聚核苷酸可操作性连接到反应元件,转录调节蛋白将通过所述反应元件介导转录。例如参看A丄DeMaggio等人,(2000),77ze,"W■^/"-/y^nW^We附'MethodEnzymol.328:128-137;H.M.Shih等人,(1996),^jrow."ve附w/a/7'o"x/7za^(Xwoc/Wo"w"/z/7zecoa"/v加rC5尸'Proc.Natl.Acad.Sci.U.S.A.93:13896-13901;M.Vidal等人,(1996),GeweO'cc/zarflCe"'zfl/z》wo/aj^Y)feiW"pro/eiwiw&rac/iowdomain&yw^"ga少eas1/reversefwo-/y^rz'<is少s/"e附./co/n附ew(/,Proc.Natl.Acad.Sci.U.S.A.93:10321-10326;和M.Vidal等人,(1996),DiV^-jWo/^fwz'""rfl"/o"s./co附wg"/7'Proc.Natl.Acad.Sci.U.S.A.93:10315-10320。通过经天然氨基酸氨酰化的O-tRNA将天然氨基酸并入转录调节蛋白中,将引起负选择标记的转录。负选择标记任选包含选择性密码子。在一个实施例中,本发明的正选择标记和/或负选择标记可包含至少两个选择性密码子,其各自或都可包含至少两个不同选择性密码子或至少两个相同选择性密码子。转录调节蛋白为结合(直接或间接)核酸序列(例如,反应元件)且调节可操作性连接到反应元件的序列的转录的分子。转录调节蛋白可为转录活化蛋白(例如,GAL4、核激素受体、AP1、CREB、LEF/tcf家族成员、SMAD、VP16、SP1等)、转录阻遏蛋白(例如,核激素受体、Groucho/tle家族、Engrailed家族等)或可视环境而具有两种活性的蛋白质(例如LEF/tcf、同源异型盒蛋白等)。反应元件通常为转录调节蛋白所识别的核酸序列或与转录调节蛋白一起作用的额外试剂。转录调节蛋白的另一实例为转录活化蛋白GAL4。例如参看A.Laughon等人,(1984),她"/7yca"'o"o/fwo/rato.似ewcocfed/7zeSacc/zar固ycescewWw'aeg墮,Molecular&CellularBiology4:268-275;A.Laughon,&R.F.Gesteland,(1984),户n.wflrysfrwc/i^eo//7zeiSacc/zarowycescerev/w.aeCL4丄4ge"e.Molecular&CellularBiology4:260-267;L.Keegan等人,(1986),鄉固麵ZWJ/raw/"mracrip"o"-(2"/w^'"g/kwWonaveWe6mferegw/atory/rato'",Science231-.699-704;禾卩M.Ptashne,(1988),i/oww"e6ra^Zra""〃;p"o"a/ac"》WonyNature335:683-689。此881个氨基酸的蛋白质的N末端147个氨基酸形成特异性结合DNA序列的DNA结合结构域(DBD)。例如参看M.Carey等人,(1989),J"fl冊'朋-"rm&a//ragwe"/1o/04Z^DA^(a^'mer,J.Mol.Biol.209:423-432;和E.Giniger等人,(1985),印e"ycD假6z'ndz'"gapo础veregw/a^yprate/"o/,赋Cell40:767-774。DBD通过插入蛋白质序列连接到当结合DNA时可活化转录的C末端113个氨基酸的活化结构域(AD)。例如参看J.Ma,&M.Ptashne,(1987),"e/"z'o"朋fl(yw^o/(X4丄4fife/"es/"wotra似cr/p"o"(2/ac/traZi"gsegme"&,Cell48:847-853;禾口J.Ma,&M.Ptashne,(1987),77zecar6o;c_y-/"e7-OTZ"a/30am/"oo/G^丄4arerecogw.zet/6}CL4丄S0,Cell50:137-142。将琥珀密码子朝向例如含有GAL4的N末端DBD和其C末端AD的单一多肽的N末端DBD放置,可将由O-tRNA/O-RS对执行的琥珀抑制连接到由GAL4执行的转录活化。可使用GAL4活化的报告基因以利用所述基因执行正选择和负选择。用于负选择的培养基可包含转化成通过负选择标记可检测的物质的选择或筛选剂。在本发明一方面中,可检测物质为有毒物质。编码负选择标记的多聚核苷酸可例如为ura3基因。举例来说,可将URA3报告基因置于含有GAL4DNA结合位点的启动子的控制下。当例如通过翻译编码具有选择性密码子的GAL4的多聚核苷酸产生负选择标记时,GAL4将活化URA3的转录。在包含5-氟乳清酸(5-FOA)的培养基上实现负选择,所述5-FOA将经ura3基因的基因产物转化成可检测物质(例如,杀死细胞的有毒物质)。例如参看J.D.Boeke等人,(1984),jw/""o"/or腦W腦'加"ce,Molecular&GeneralGenetics197:345-346;M.Vidal等人,(1996),yeastreverses3Ay"附./c0附附en(/,Proc.Natl.Acad.Sci.U.S.A.93:10321-10326;禾口M.Vidal等人,(1996),i譜,/wo-一"(iam/騰-一"Ws,慰6fe/^cfcZ/5^ocz'a/7'o"o//n/"e/"-;"o/"e/wa"fiDA^4-pro/^z'"z'nferac/iows,/co附附e"(/,Proc.Natl.Acad.Sci.U.S.A.93:10315-10320。与正选择标记相同,负选择标记也可为多种分子中的任一个。在一个实施例中,正选择标记和/或负选择标记为在存在适当反应物的情况下发荧光或催化发光反应的多肽。举例来说,负选择标记包括(但不限于)例如荧光素酶、绿色荧光蛋白质(GFP)、YFP、EGFP、RFP、抗生素抗性基因的产物(例如,氯霉素乙酰转移酶(CAT))、lacZ基因的产物、转录调节蛋白等。在本发明一方面中,通过荧光活化细胞分选(FACS)或通过发光来检测正选择标记和/或负选择标记。在另一实例中,正选择标记和/或负选择标记包含基于亲和力的筛选标记。同一多聚核苷酸可编码正选择标记和负选择标记。其它水平的选择/筛选严格度也可用于本发明方法中。在产生O-RS的方法的一个或两个步骤中可改变选择或筛选严格度。这可包括例如改变编码正选择和/或负选择标记的多聚核苷酸中反应元件的量;将不同量的无活性合成酶添加到一个或两个步骤中;改变所使用的选择/筛选剂的量等。还可执行额外回合的正和/或负选择。选择或筛选也可包含一次或多次正或负选择或筛选,所述选择或筛选包括例如氨基酸渗透性的改变、翻译效率的改变、翻译保真度的改变等。通常,一种或多种改变是建立在一个或多个包含或编码用于产生蛋白质的正交tRNA-tRNA合成酶对组件的多聚核苷酸突变的基础上。还可使用模型富集研究从过量无活性合成酶中迅速选择活性合成酶。可进行正和/或负模型选择研究。举例来说,将包含潜在活性氨酰基-tRNA合成酶的脊椎动物细胞与不同倍数过量的无活性氨酰基-tRNA合成酶混合。在生长于非选择性培养基中并例如通过X-GAL覆盖分析的细胞与生长于选择性培养基(例如,在不存在组氨酸和/或尿嘧啶的情况下)中且能存活并例如通过X-GAL分析的细胞之间进行比率比较。对于负选择模型,将潜在活性氨酰基-tRNA合成酶与不同倍数过量的无活性氨酰基-tRNA合成酶混合,并利用例如5-FOA等负选择物质执行选择。通常,RS文库(例如,突变型RS文库)包含由例如来自非脊椎动物生物体的至少一种氨酰基-tRNA合成酶(RS)得到的RS。在一个实施例中,RS文库是得自无活性RS,例如其中无活性RS是通过使活性RS例如在所述合成酶的活性位点、所述合成酶的编辑机制位点、由组合合成酶的不同结构域得到的不同位点等突变而产生。举例来说,使RS活性位点中的残基突变成例如丙氨酸残基。将编码丙氨酸突变的RS的多聚核苷酸用作模板,以将丙氨酸残基诱变为所有20种氨基酸。选择/筛选突变型RS的文库以产生O-RS。在另一实施例中,无活性RS包含氨基酸结合袋并且一个或多个包含所述结合袋的氨基酸经一个或多个不同氨基酸取代。在一个实例中,经取代氨基酸是经丙氨酸取代。任选将编码丙氨酸突变的RS的多聚核苷酸用作模板以将丙氨酸残基诱变为所有20种氨基酸,并加以选择/筛选。产生O-RS的方法可进一步包括通过使用所属领域中已知的各种诱变技术产生RS文库。举例来说,可通过位点特异性突变、随机点突变、同源重组、DNA改组或其它递归式诱变方法、嵌合构建或其任何组合产生突变型RS。举例来说,可由两个或两个以上其它(例如)较小、较少多样性的"子文库"产生突变型RS文库。在使合成酶经历正和负选择/筛选策略后,可随后使这些合成酶经历进一步诱变。举例来说,可分离出编码O-RS的核酸;可由所述核酸产生一组编码突变型O-RS的多聚核苷酸(例如,通过随机诱变、位点特异性诱变、重组或其任何组合);且可重复这些个别步骤或这些步骤的组合,直到获得优先利用非天然氨基酸将O-tRNA氨酰化的突变型O-RS。在本发明一方面中,将所述步骤执行至少2次。有关产生O-RS的其它细节可见于题为"MethodsandcompositionsfortheproductionoforthogonaltRNA-aminoacyltRNAsynthetasepairs."的^WO2002/086075中。还参看Hamano-Takaku等人,(2000)』腦咖,^foc/zm'c/^co",c^/-醇yiJournalofBiologicalChemistry.275(51):40324陽40328;Kiga等人(2002),*e"g/廳r^E^c/zer/c/n'aco//Z^ra^/-^A^f^"/7zetoe/orie,e"ycf"cor^oraricm。/朋w""a^ra/cd/-/ree^We附'PNAS99(15):9715-9723;和Francklyn等人,(2002),^附/"oflc;;"iA^■syWZzetowFfen"a"7e//a,^s1Aec/z朋gfng7/ea^fr<ms7a"<9",.RNA.8:1363-1372。正交tRNA本发明提供包括正交tRNA(O-tRNA)的真核细胞。正交tRNA介导在活体内将非天然氨基酸并入蛋白质中,所述蛋白质是由包含由O-tRNA识别的选择性密码子的多聚核苷酸编码。在某些实施例中,本发明的O-tRNA例如以至少40%、至少45%、至少50%、至少60%、至少75%、至少80%或甚至90%或更高的包含如SEQIDNO.:65中所述的多聚核苷酸序列或在细胞中由如SEQIDNO.:65中所述的多聚核苷酸序列加工的tRNA的效率,介导将非天然氨基酸并入蛋白质中。参看本文中表5。本发明O-tRNA的实例为SEQIDNO.:65(参看本文中实例6和表5)。SEQIDNO.:65为剪接前/加工前转录物,其在细胞中任选例如使用标准内源细胞剪接和加工机器加工,且经修饰以形成活性O-tRNA。通常,所述剪接前转录物群在细胞中形成活性tRNA群。本发明还包括O-tRNA的保守变异体和其经加工细胞产物。举例来说,O-tRNA的保守变异体包括功能与SEQIDNO.:65的O-tRNA类似且保持经加工形式的tRNAL形结构,但不具有相同序列的分子(且不为野生型tRNA分子)。通常,由于O-tRNA可在活体内再氨酰化,从而再次介导响应选择性密码子将非天然氨基酸并入由多聚核苷酸编码的蛋白质中,故本发明的O-tRNA为可重复利用的O-tRNA。真核生物而非原核生物中tRNA的转录是通过RNA聚合酶III进行,这将限制能在脊椎动物细胞中转录的tRNA结构基因的一级序列。而且,在脊椎动物细胞中,tRNA需要从转录tRNA的细胞核输出到细胞质,以进行翻译。编码本发明的O-tRNA或其互补多聚核苷酸的核酸也为本发明的特征。在本发明一个方面中,编码本发明的O-tRNA的核酸包括内部启动子序列,例如A盒(例如,TRGCNNAGY)和B盒(例如,GGTTCGANTCC,SEQIDNO:95)。A盒和B盒序列的其它实例可见于Geiduschek,(1988),7><myc,"'o"i濕尸o/,mwe瓜Ann-Rev.Biochem.57:873-914,其以引用的方式并入本文中。本发明的O-tRNA也可经转录后修饰。举例来说,真核生物中tRNA基因的转录后修饰包括分别通过RnaseP和3'-内切核酸酶去除5'-和3'-侧接序列。添加3'-CCA序列也为真核生物中tRNA基因的转录后修饰。在一个实施例中,通过使第一物种的脊椎动物细胞群(其中所述脊椎动物细胞包含tRNA文库成员)经历负选择来获得O-tRNA。负选择除去包含如下tRNA文库成员的细胞,所述tRNA文库成员经对于脊椎动物细胞为内源性的氨酰基-tRNA合成酶(RS)氨酰化。这提供与第一物种的脊椎动物细胞正交的tRNA池。另外,或者与上文所述其它方法组合,使用反式翻译系统以将非天然氨基酸并入多肽中。此系统涉及存在于大肠杆菌中的称为tmRNA的分子。这一RNA分子在结构上与丙氨酰tRNA相关且经丙氨酰合成酶氨酰化。tmRNA与tRNA之间的差异在于,反密码子环经特定较大序列置换。这一序列允许核糖体使用tmRNA内编码的开放式阅读框作为模板在已停止的序列上重新开始翻译。在本发明中,可产生优先经正交合成酶氨酰化且装载有非天然氨基酸的正交tmRNA。通过所述系统转录基因,核糖体将在特定位点停止;将非天然氨基酸引入此位点处,并且使用正交tmRNA内编码的序列重新开始翻译。有关产生重组正交tRNA的其它方法可见于例如题为"MethodsandcompositionsfortheproductionoforthogonaltRNA-aminoacyltRNAsynthetasepairs."的国际专禾U申请案WO2002/086075中。还参看Forster等人,(2003)Prograw/m'"g;e;"Wo/m'附W/c/rara/a/7酵wgge"W/ccodestifey/gwet/<ie"ovoPNAS100(11):6353陽6357;禾口Feng等人,(2003),ixp""W"g,iiVylrecog础owo/as声Aetoeaw."g/e函/"oa"Wc/z""ge,PNAS100(10):5676-5681。正交TRNA与正交氨酰基-TRNA合成酶对正交对是由例如抑制tRNA、移码tRNA等O-tRNA与O-RS构成。O-tRNA不经内源性合成酶酰化,且能够在活体内介导将非天然氨基酸并入蛋白质中,所述蛋白质是由包含由O-tRNA识别的选择性密码子的多聚核苷酸编码。在脊椎动物细胞中,O-RS识别O-tRNA且优先利用非天然氨基酸将O-tRNA氨酰化。本发明中包括用于产生正交对的方法连同由所述方法产生的正交对,和用于脊椎动物细胞中的正交对组合物。多种正交tRNA/合成酶对的开发可允许使用不同密码子将多个非天然氨基酸同时并入脊椎动物细胞中。可通过利用无效跨物种氨酰化输入来自不同生物体的对(例如,无义抑制子对)在脊椎动物细胞中产生正交O-tRNA/O-RS对。在脊椎动物细胞中有效表达和加工O-tRNA和O-RS,并且将O-tRNA从细胞核有效地输出到细胞质。举例来说,一种所述对为来自大肠杆菌的酪氨酰-tRNA合成酶/tRNAcuA对(例如参看,H.M.Goodman等人,(1968),Nature217:1019-24;和D.G.Barker等人,(1982),FEBSLetters150:419-23)。当在酿酒酵母细胞质中表达大肠杆菌酪氨酰-tRNA合成酶和其同源大肠杆菌tRNACUA时,大肠杆菌酪氨酰-tRNA合成酶有效地将其同源大肠杆菌tRNACUA氨酰化,但不会将酿酒酵母tRNA氨酰化。例如参看,H.Edwards,&P.Schimmel,(1990),Molecular&CellularBiology10:1633-41;和H.Edwards等人,(1991),PNASUnitedStatesofAmerica88:1153-6。此外,大肠杆菌酪氨酰tRNACUA为酿酒酵母氨酰基-tRNA合成酶的弱底物(例如参看V.Trezeguet等人,(1991),Molecular&CellularBiology11:2744-51),但其有效地在酿酒酵母的蛋白质翻译中起作用。例如参看,H.Edwards,&P.Schimmel,(1990)Molecular&CellularBiology10:1633-41;H.Edwards等人,(1991),PNASUnitedStatesofAmerica88:1153-6;和V.Trezeguet等人,(1991),Molecular&CellularBiology11:2744-51。此外,大肠杆菌TyrRS不具有校对接合到tRNA的非天然氨基酸的编辑机制。O-tRNA和O-RS可为天然存在的,或可通过使来自多种生物体的天然存在的tRNA和/或RS突变得到,这将产生tRNA文库和/或RS文库。参看本文中题为"来源和宿主"的章节。在各个实施例中,O-tRNA和O-RS是得自至少一种生物体。在另一实施例中,O-tRNA得自第一物种的天然存在或突变的天然存在的tRNA,且O-RS得自第二物种的天然存在或突变的天然存在的RS。在一个实施例中,第一与第二非脊椎动物生物体相同。或者,第一与第二非脊椎动物生物体可不同。有关产生O-RS和O-tRNA的方法,参看本文中题为"正交氨酰基-tRNA合成酶(Orthogonalaminoacyl-tRNAsynthetases),,和"O-tRNA"的章节。还参看题为"MethodsandcompositionsfortheproductionoforthogonaltRNA-aminoacyltRNAsynthetasepairs."的国际专利申请案WO2002/086075。保真度、效率和产率保真度是指将所需分子(例如非天然氨基酸或氨基酸)并入正在生长的多肽中的所需位置的准确度。本发明的翻译组件响应选择性密码子以高保真度将非天然氨基酸并入蛋白质中。举例来说,与并入正在生长的多肽链中所需位置的特定天然氨基酸的不合需要的并入相比,使用本发明的组件将所需非天然氨基酸并入正在生长的多肽链中所需位置(例如响应选择性密码子)的效率为例如大于75%、大于85%、大于95%或甚至大于99%有效。、效率还可以指与相关对照相比,O-RS利用非天然氨基酸将O-tRNA氨酰化的程度。本发明的O-RS可通过其效率定义。在本发明某些实施例中,将O-RS与另一O-RS相比较。例如,本发明的O-RS利用非天然氨基酸将O-tRNA氨酰化,这与具有(例如)如SEQIDNO.:86或45中所述的氨基酸序列的O-RS或表5)中另一特定RS将O-tRNA氨酰化相比例如至少40%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或甚至99%或更高有效。在另一实施例中,本发明的O-RS利用非天然氨基酸将O-tRNA氨酰化,这比O-RS利用天然氨基酸将O-tRNA氨酰化有效例如至少10倍、至少20倍、至少30倍等。使用本发明的翻译组件,包含非天然氨基酸的所关注多肽的产率例如为从多聚核苷酸缺乏选择性密码子的细胞中获得天然存在的所关注多肽的产率的至少5%、至少10%、至少20%、至少30%、至少40%、50%或更多。另一方面,细胞在不存在非天然氨基酸的情况下以一定产率产生所关注多肽,所述产率例如为在存在非天然氨基酸的情况下多肽产率的不到30%、不到20%、不到15%、不到10%、不到5%、不到2.5%等。来源和宿主生物体本发明的正交翻译组件通常得自非脊椎动物生物体从而用于脊椎动物细胞或翻译系统。举例来说,正交O-tRNA可得自非脊椎动物生物体,例如真细菌,诸如大肠杆菌、极端嗜热细菌(T7zmm^^^m叩/n'^)、嗜热脂肪芽孢杆菌等;或古细菌,例如詹氏甲烷球菌、嗜热自养甲烷杆菌(M""/wno6(3"en'wmAermom^ofrop/n.ct)、嗜盐古菌(/fo/o6a"en'ww)(诸如沃氏嗜盐富饶菌(i/a/o/eraxw/caw'0和嗜盐古菌NRC-1(f/ia/oZ)(3"m.簡speciesiVU))、闪烁古生球菌dc/zaeog/o6w51/w/g油s)、强烈火球菌(户"cocciw1/鹏'oras)、掘越氏热球菌(尸戶coccMZwr汰(w/n7)、嗜热泉生古细菌Uewra/^rwm网rm'x)等,而正交O-RS可得自非脊椎动物生物体,例如真细菌,诸如大肠杆菌、极端嗜热细菌、嗜热脂肪芽孢杆菌等;或古细菌,例如詹氏甲烷球菌、嗜热自养甲垸杆菌、嗜盐古菌(诸如沃氏嗜盐富饶菌和嗜盐古菌NRC-1)、闪烁古生球菌、强烈火球菌、掘越氏热球菌、嗜热泉生古细菌等。另外,还可使用脊椎动物来源,例如植物、藻类、原生生物、真菌、酵母、动物(例如,哺乳动物、昆虫、节肢动物等)等,例如其中所述组件与所关注细胞或翻译系统正交,或其中其经修饰(例如,突变)而与所述细胞或翻译系统正交。0-tRNA/0-RS对的个别组件可搏自相同生物体或不同生物体。在一个实施例中,0-tRNA/0-RS对是来自相同生物体。举例来说,O-tRNA/0-RS对可得自大肠杆菌的酪氨酰-tRNA合成酶/tRNAcuA对。或者O-tRNA/0-RS对的O-tRNA和0-RS任选来自不同生物体。正交0-tRNA、0-RS或O-tRNA/0-RS对可经选择或筛选和/或用于脊椎动物细胞中以产生具有非天然氨基酸的多肽。脊椎动物细胞可来自各种来源,例如任何脊椎动物(例如,哺乳动物、两栖动物、鸟类、爬行动物、鱼类等)等。具有本发明的翻译组件的脊椎动物细胞的组合物也为本发明的特征。本发明还提供在一种物种中有效筛选以任选用于所述物种和/或第二物种(任选无需额外选择/筛选)中。举例来说,在一种物种(例如,易于操纵的物种,诸如酵母细胞等)中选择或筛选0-tRNA/0-RS组件,且将其引入第二脊椎动物物种,例如植物(例如复杂植物,诸如单子叶植物或双子叶植物)、藻类、原生生物、真菌、酵母、动物(例如哺乳动物、昆虫、节肢动物等)等中,以用于在活体内将非天然氨基酸并入所述第二物种中。举例来说,由于酿酒酵母(SaccAarawycMcerevz'w'ae,S.cerev/w'ae)为单细胞的,具有快速换代时间和相对充分表征的遗传学,故可将其选作脊椎动物第一物种。例如参看D.Burke等人,(2000)MethodsinYeastGenetics.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY。此外,由于真核生物的翻译机器高度保守(例如参看(1996)TranslationalControl.ColdSpringHarborLaboratory,ColdSpringHarbor,NY;Y.Kwok,&J.T.Wong,(1980),EVo/Wo"a/^re/a"'ow血》6eAveew7fa/o6a"m'謂;/z卢ge"Wc;raZ^,CanadianJournalofBiochemistry58:213-218;禾口(2001)TheRibosome.ColdSpringHarborLaboratoryPress,ColdSpringHarbor,NY),古女可将在酉良酒酵母中发现的用于并入非天然氨基酸的aaRS基因引入高级脊椎动物生物体中,且与同源tRNA合作(例如参看K.Sakamoto等人,(2002)5""e-印ec折c/"corporario"o/a"w朋afwra/z'柳jtra/e/朋mamma//awce//^,NucleicAcidsRes.30:4692-4699;禾口C.Kohrer等人,(2001),/附戸Zq/謹hWoc/zre膨jkz'她附謂附aZ/awce〃fagewem/a,roac/zs"e,e"ycz'/wer"'owo/薩/朋""fl/og證她Proc.Natl.Acad.Sci.U.S.A.98:14310-14315)用于并入非天然氨基酸。在一个实例中,在如本文所述的第一物种中产生O-tRNA/O-RS对的方法另外包括将编码O-tRNA的核酸和编码O-RS的核酸引入第二物种(例如,哺乳动物、昆虫、真菌、藻类、植物等)的脊椎动物细胞中。在另一实例中,产生在脊椎动物细胞中优先利用非天然氨基酸将正交tRNA氨酰化的正交氨酰基-tRNA合成酶(O-RS)的方法包括(a)在存在非天然氨基酸的情况下,使第一物种(例如,酵母等)的脊椎动物细胞群经历正选择。所述脊椎动物细胞各自包含i)氨酰基-tRNA合成酶(RS)文库成员,ii)正交tRNA(O-tRNA),iii)编码正选择标记的多聚核苷酸,和iv)编码负选择标记的多聚核苷酸。在正选择中存活的细胞包含在存在非天然氨基酸的情况下将正交tRNA(O-tRNA)氨酰化的活性RS。使在正选择下存活的细胞在不存在非天然氨基酸的情况下经历负选择,以除去利用天然氨基酸将O-tRNA氨酰化的活性RS。这提供优先利用非天然氨基酸将O-tRNA氨酰化的O-RS。将编码O-tRNA的核酸和编码O-RS的核酸(或O-tRNA和/或O-RS的组件)引入第二物种(例如,哺乳动物、昆虫、真菌、藻类、植物等)的脊椎动物细胞中。通常,通过使第一物种的脊椎动物细胞群经历负选择来获得O-tRNA,其中所述脊椎动物细胞包含tRNA文库成员。负选择标记除去包含tRNA文库成员的细胞,所述tRNA文库成员经对于脊椎动物细胞为内源性的氨酰基-tRN合成酶(RS)氨酰化,其提供与第一物种和第二物种的脊椎动物细胞正交的tRNA池。选择性密码子本发明的选择性密码子将扩充蛋白质生物合成机器的遗传密码子框架。举例来说,选择性密码子包括例如独特的三碱基密码子、无义密码子(诸如终止密码子,例如琥珀密码子(UAG)、蛋白石密码子(UGA))、非天然密码子、至少四碱基的密码子、稀有密码子等。可将多个(例如一个或多个、两个或两个以上、三个以上等)选择性密码子引入所需基因中。基因可包括多个指定选择性密码子拷贝,或可包括多个不同选择性密码子或其组合。在一个实施例中,所述方法涉及使用作为终止密码子的选择性密码子以在脊椎动物细胞中于活体内并入非天然氨基酸。举例来说,产生识别终止密码子(例如UAG)且通过O-RS和用所需非天然氨基酸氨酰化的0-tRNA。天然存在的宿主氨酰基-tRNA合成酶不识别所述O-tRNA。可使用常规定点诱变将终止密码子(例如TAG)引入所关注多肽中的所关注位点处。例如参看Sayers,J.R.等人(1988),5',_3'Exo"wde氾ej^asp/zoTO/7u'oafe-6ase(io"go肌c/eWcfe-6frecfed麵togewes7's.NucleicAcidsRes.791-802。当在活体内将O-RS、O-tRNA和编码所关注多肽的核酸组合时,响应UAG密码子而并入非天然氨基酸从而得到在指定位置处含有所述非天然氨基酸的多肽。在活体内并入非天然氨基酸可在不显著干扰脊椎动物宿主细胞的情况下进行。举例来说,由于UAG密码子的抑制效率视O-tRNA(例如,琥珀抑制性tRNA)与脊椎动物释放因子(例如,eRF)(其与终止密码子结合并且起始正在生长的肽从核糖体释放)之间的竞争而定,故所述抑制效率可例如通过增加O-tRNA(例如,抑制性tRNA)的表达水平来调节。选择性密码子还包含扩充的密码子,例如四个或四个以上碱基的密码子,诸如四碱基密码子、五碱基密码子、六碱基密码子或更多个碱基的密码子。四碱基密码子的实例包括例如AGGA、CUAG、UAGA、CCCU等。五碱基密码子的实例包括例如AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本发明的特征包括基于移码抑制使用扩充的密码子。四个或四个以上碱基的密码子可将例如一个或多个非天然氨基酸插入同一蛋白质中。举例来说,在存在具有反密码子环、例如具有8-10nt反密码子环的突变O-tRNA(例如,特定移码抑制性tRNA)的情况下,将四个或四个以上碱基的密码子读作单一氨基酸。在其它实施例中,反密码子环可解码例如至少四碱基密码子、至少五碱基密码子或至少六碱基密码子或更多碱基的密码子。由于存在256个可能的四碱基密码子,故可在同一细胞中使用四个或四个以上碱基的密码子编码多个非天然氨基酸。参看Anderson等人,(2002)五xp/on'叫Aeo/CWona""w"co(iow5fee,ChemistryandBiology.9:237-244;Magliery,(2001)J.Mol.Biol.307:755-769。举例来说,已使用四碱基密码子使用活体外生物合成方法将非天然氨基酸并入蛋白质中。例如参看Ma等人,0993)Biochemistry.32:7939;和Hohsaka等人,(1999)J.Am.Chem.Soc,121:34。使用CGGG和AGGU利用两个以化学方式酰化的移码抑制性tRNA在活体外将2-萘基丙氨酸和赖氨酸的NBD衍生物同时并入抗生蛋白链菌素中。例如参看Hohsaka等人,(1999).Am.Chem.Soc,121:12194。在活体内研究中,Moore等人检査具有NCUA反密码子的tRNALeu衍生物抑制UAGN密码子(N可为U、A、G或C)的能力,并且发现四联体UAGA可以通过具有UCUA反密码子的tRNALeu以13%到26%的效率解码且在0或-1框内极少解码。参看Moore等人,(2000)J.Mol.Biol.,298:195。在一个实施例中,可将基于稀有密码子或无义密码子的扩充密码子用于本发明中,其可减少错义通读和其它不合需要的位点处的移码抑制。对于指定系统来说,选择性密码子也可包括一个天然三碱基密码子,其中内源系统不使用(或极少使用)天然碱基密码子。举例来说,这包括缺乏识别天然三碱基密码子的tRNA的系统和/或三碱基密码子为稀有密码子的系统。选择性密码子任选包括非天然碱基对。这些非天然碱基对使现有的遗传代码进一步扩展。一种额外的碱基对使三联体密码子的数量从64增加到125。第三碱基对的特性包括稳定且具选择性的碱基配对、通过聚合酶以高保真度有效酶促并入DNA中以及合成新的非天然碱基对之后有效的持续引物5r伸。可适于方法和组合物的非天然碱基对的描述包括例如Hirao等人,(2002)』"w朋a&ra/6氾eprn'r/orz'wco7ora/7'wga加'"oa"'c/ana/ogwesz'幽NatureBiotechnology.20:177-182。其它相关公开文献列于下文中。对于活体内使用来说,非天然核苷可渗透膜并且磷酸化形成相应的三磷酸盐。此外,增加的遗传信息稳定并且不被细胞酶所破坏。Bermer和其它人先前的工作利用不同于规范Watson-Crick配对的氢键模式,最值得关注的实例为iso-C:iso-G配对。例如参看Switzer等人,(1989)J.Am.Chem.Soc.111:8322;禾卩Piccirilli等人,(1990)Nature,343:33;Kool,(2000)Curr.Opin.Chem.Biol.4:602。一般说来,这些碱基在某种程度上与天然碱基错配并且无法酶促复制。Kool和同事证实,碱基之间的疏水堆积相互作用可替代氢键以驱动碱基对的形成。参看Kool,(2000)Curr.Opin.Chem.Biol,4:602;和Guckian及Kool,(1998)Angew.Chem.Int.Ed.Engl.,36,2825。在开发满足所有上述需求的非天然碱基对的工作中,Schultz、Romesberg和同事已系统地合成一系列非天然疏水碱基并且对其进行研究。已发现,PICS:PICS自身配对比天然碱基对稳定,并且能够通过大肠杆菌DNA聚合酶I的Klenow片段(KF)有效地并入看McMinn等人,(1999)J.Am.Chem.Soc,121:11586;以及Ogawa等人,(2000)J.Am.Chem.Soc,122:3274。3MN:3MN自身配对可通过KF以足以用于生物功能的效率和选择性合成。例如参看Ogawa等人,(2000)J.Am.Chem.Soc.122:8803。然而,两种碱基都充当用于进一步复制的链终止子。近来已开发出可用于复制PICS自身配对的突变体DNA聚合酶。此外,可复制7AI自身配对。例如参看Tae等人,(2001)J.Am.Chem.Soc,123:7439。也已开发出新颖的金属碱基对Dipic:Py,其在结合Cu(II)后形成稳定的配对。参看Meggers等人,(2000)J.Am.Chem.Soc,122:10714。由于扩充密码子和非天然密码子内在地与天然密码子正交,故本发明的方法可利用这一特性产生正交tRNA供其使用。也可使用翻译旁路系统将非天然氨基酸并入所需多肽中。在翻译旁路系统中,将较大序列插入基因中但并不被翻译成蛋白质。所述序列含有充当诱导核糖体越过所述序列并且在插入下游重新开始翻译的线索的结构。非天然氨基酸如本文所使用,非天然氨基酸是指除硒代半胱氨酸和/或吡咯赖氨酸和以下20种基因编码的a-氨基酸外的任何氨基酸、经修饰氨基酸或氨基酸类似物丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。通过式I说明a-氨基酸的一般结构IR非天然氨基酸通常为具有式r的任何结构,其中R基团为除二十种天然氨基酸中所用基团外的任何取代基。有关二十种天然氨基酸的结构,例如参看L.Stryer的第3版1988,FreemanandCompany,NewYork。应注意,本发明的非天然氨基酸可为除上述二十种a-氨基酸外的天然存在的化合物。由于本发明的非天然氨基酸与天然氨基酸的不同之处通常仅在于侧链,故非天然氨基酸以与其在天然存在的蛋白质中形成酰胺键相同的方式与其它氨基酸(例如,天然或非天然)形成酰胺键。然而,非天然氨基酸具有使其与天然氨基酸相区别的侧链基团。举例来说,式I中的R任选包含烷基-、芳基-、酰基-、酮基-、叠氮基-、羟基-、肼、氰基-、卤基-、酰肼、烯基、炔基、醚、硫醇、硒基-、磺酰基-、硼酸酯基(borate)、硼酸酯基(boronate)、磷酸基、膦酸基、膦、杂环、烯酮、亚胺、醛、酯、硫代酸、羟胺、胺等,或其任何组合。其它所关注非天然氨基酸包括(但不限于)包含可光活化交联剂的氨基酸、自旋标记的氨基酸、发荧光氨基酸、结合金属的氨基酸、含金属的氨基酸、放射性氨基酸、具有新颖官能团的氨基酸、与其它分子共价或非共价相互作用的氨基酸、光笼蔽和/或光致异构化氨基酸、含有生物素或生物素类似物的氨基酸、含酮基氨基酸、包含聚乙二醇或聚醚的氨基酸、重原子取代的氨基酸、可化学裂解和/或可光裂解的氨基酸、与天然氨基酸相比具有伸长侧链(例如,聚醚或长链烃,例如大于约5个、大于约IO个碳原子等)的氨基酸、含碳连接的糖的氨基酸、具有氧化还原活性的氨基酸、含有氨基硫代酸的氨基酸和包含一个或多个有毒部分的氨基酸。在一些实施例中,非天然氨基酸具有例如用于将蛋白质与固体支撑物连接的可光活化交联剂。在一个实施例中,非天然氨基酸具有连接到氨基酸侧链的糖部分(例如,糖基化氨基酸)和/或其它碳水化合物修饰。除含有新颖侧链的非天然氨基酸外,非天然氨基酸还任选包含经修饰的主链结构,例如,如式II和III的结构所示<formula>formulaseeoriginaldocumentpage41</formula>其中Z通常包含OH、NH2、SH、NH-R'或S-R';X和Y可相同或不同且通常包含S或0;且R和R'任选相同或不同且通常选自与上文关于具有式I的非天然氨基酸所述的R基的组分相同的列表以及氢。举例来说,如式n和m所示,本发明的非天然氨基酸任选在氨基或羧基中包含取代。此类非天然氨基酸包括(但不限于)例如具有与常见二十种天然氨基酸相对应的侧链或非天然侧链的a-羟基酸、a-硫代酸、a-氨基硫代羧酸酯。此外,a-碳的取代任选包括L、D或a-a双取代氨基酸,诸如D-谷氨酸、D-丙氨酸、D-甲基-O-酪氨酸、氨基丁酸等。其它结构替代物包括环状氨基酸,诸如脯氨酸类似物以及3、4、6、7、8和9元环脯氨酸类似物;P和y氨基酸,诸如经取代(3-丙氨酸和y-氨基丁酸。举例来说,许多非天然氨基酸都是建立在诸如酪氨酸、谷氨酸、苯丙氨酸等天然氨基酸的基础上。酪氨酸类似物包括对位取代的酪氨酸、邻位取代的酪氨酸和间位取代的酪氨酸,其中所述经取代酪氨酸包含例如酮基(例如乙酰基)、苯甲酰基、氨基、肼、羟胺、硫醇基、羧基、异丙基、甲基、c6-C20直链或支链烃、饱和或不饱和经、O-甲基、聚醚基、硝基、炔基等。此外,也涵盖多取代的芳基环。本发明的谷氨酰胺类似物包括(但不限于)a-羟基衍生物、y取代的衍生物、环状衍生物和酰胺取代的谷氨酰胺衍生物。苯丙氨酸类似物的实例包括(但不限于)对位取代的苯丙氨酸、邻位取代的苯丙氨酸和间位取代的苯丙氨酸,其中所述取代基包含例如羟基、甲氧基、甲基、烯丙基、醛、叠氮基、碘基、溴基、酮基(例如乙酰基)、苯甲酰基、炔基等。非天然氨基酸的特定实例包括(但不限于)对乙酰基-L-苯丙氨酸、对炔丙基氧基苯丙氨酸、O-甲基-L-酪氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、0-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-O-乙酰基-GlcNAc卩-丝氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对叠氮基-L-苯丙氨酸、对酰基-L-苯丙氨酸、对苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、膦酰基丝氨酸、膦酰基酪氨酸、对碘-苯丙氨酸、对溴苯丙氨酸、对氨基-L-苯丙氨酸和异丙基-L-苯丙氨酸等。多种非天然氨基酸的其它结构提供于例如题为"Invivoincorporationof腿aturalaminoacids."的WO2002/085923的图16、17、18、19、26和29中。关于其它甲硫氨酸类似物,还参看Kiick等人,(2002)/wco/yomrio"o/azWM/"torgcow6z'n朋z/orc/ze歸se/ec"vemO(i折co/7'ow/7ze5Yaw(i/wge/"//gto"o",PNAS99:19-24的图1结构2-5。在一个实施例中,提供包括非天然氨基酸(诸如对-(炔丙基氧基)-苯丙氨酸)的组合物。还提供包含对-(炔丙基氧基)-苯丙氨酸和例如蛋白质和/或细胞的各种组合物。一方面,包括对-(炔丙基氧基)-苯丙氨酸非天然氨基酸的组合物进一步包括正交tRNA。可将非天然氨基酸与正交tRNA键接(例如共价),例如通过氨酰基键与正交tRNA共价键接、与正交tRNA的末端核糖的3'OH或2'OH共价键接。可通过非天然氨基酸并入蛋白质中的化学部分为蛋白质提供多种益处和操纵。举例来说,酮基官能团的独特反应性允许在活体外和活体内利用多种含肼或羟胺试剂中任一种选择性修饰蛋白质。举例来说,重原子非天然氨基酸例如可用于定相X射线结构数据。使用非天然氨基酸位点特异性地引入重原子还为选择重原子的位置提供选择性和灵活性。光反应性非天然氨基酸(例如,具有二苯甲酮和叠氮芳基(例如叠氮苯)侧链的氨基酸)例如允许在活体内和活体外有效地光交联蛋白质。光反应性非天然氨基酸的实例包括(但不限于)例如对叠氮基-苯丙氨酸和对苯甲酰基-苯丙氨酸。随后可通过激发光反应性基团-提供时间(和/或空间)控制使具有光反应性非天然氨基酸的蛋白质随意交联。在一个实例中,非天然氨基酸的甲基可经作为局部结构和动力学探针(例如,使用核磁共振和振动光谱)的同位素标记的(例如)甲基取代。举例来说,炔基或叠氮基官能团允许利用分子通过[3+2]环加成反应选择性修饰蛋白质。非天然氨基酸的化学合成上文所提供的许多非天然氨基酸都是购自例如Sigma(USA))或Aldrich(Milwaukee,WI,USA)。非市售的非天然氨基酸是任选如本文所提供或如各种公开文献中所提供或使用所属领域技术人员巳知的标准方法来合成。有关有机合成技术,例如参看Fessendon和Fessendon的OrganicChemistry,(1982,第2版,WillardGrantPress,BostonMass.);March的AdvancedOrganicChemistry(第3版,1985,WileyandSons,NewYork);以及Carey禾卩Sundberg的AdvancedOrganicChemistrv(第3版,第A和B部分,1990,PlenumPress,NewYork)。描述非天然氨基酸的合成的其它公开文献例如包括题为"InvivoincorporationofUnnaturalAminoAcids"的WO2002/085923,Matsoukas等人,(1995)J.Med.Chem.,38-4669;King,F.E.&Kidd,D.A.A.(1949)JA^ew5^w,/zes/《o/o/y層Dfpep/7'(ieso/G7wfawz'cJc/t/々owi^f/^/afei//"fermec^'afes.J.Chem.Soc.3315-3319;Friedman,O.M.&Chatterrji,R.(1959)5^"/7zewJq/"De〃.va"veso/G7w/mz."eA/o<ie/5"w65tra&s/or^"/7'-rwmor爿ge"tt.J.Am.Chem.Soc.81,3750-3752;Craig,J.C.等人(1988)Jfeo/WeCo"/^wrario"o/&e〖C7z/or,—.J.Org.Chem.53,1167-1170;Azoulay,M.,Vilmont,M.&Frappier,F.(1991)G,wfa附/"ea打a/ogwe51asPofe打"a/^4wfz7na/an'a/s,Eur.J.Med.Chem.26-5;Koskinen,A.M.P.&Rapoport,H.(1989)Syw^ewio/4-S"6w/ft^ed/VoZ/wesawCo"/orw加'owa/(yCo组m/"ec/Jw/woy4"W勘a/ogwe义J.Org.Chem.54,1859-1866;Christie,B.D.&Rapoport,H.(1985)5^W/2es/so/0/^/ca〃少尸wre尸/peco/fl^es/row43爿c/c/Z)ecarZ)o"少/Wowawd/附z'w'謂TowC_yc//za"'o".J.Org.Chem.1989:1859-1866;Barton等人,(1987)iS"Aew'《o/Wove/a-^4wz'"o"c油朋(iDm'va/7'v^版wgia血a/y4///"op"'a^f/wa加ra&c/De"》fl^ve51.Tetrahedron43:4297-4308;禾口Subasinghe等人,(1992)wa//c腦W朋at/ogwe《.'■s1"/^*o/Ae/a-A"";^"^2-膽/"opropawo/caczWcife"'va^v《scmcf/iez'rac/tv办awove/gw一wa/她-"w础ze(is"e.J.Med.Chem.35:4602-7。非天然氨基酸的细胞摄取脊椎动物细胞对非天然氨基酸的摄取是在设计和选择例如并入蛋白质中的非天然氨基酸时通常考虑的一个问题。举例来说,a-氨基酸的高电荷密度表明这些化合物可能无法渗透细胞。天然氨基酸是经由一系列基于蛋白质的转运系统而吸收到脊椎动物细胞中。可进行快速筛选以评定哪些非天然氨基酸(如果存在)被细胞吸收。例如参看,例如2002年12月22日申请名称为"ProteinArrays"的代理人案号为P1001US00的申请案以及Liu,D.R.&Schultz,RG.(1999)to而rafew/Wowo/aworgan/纖w"/cmexp朋fife(ige"Wcco血PNASUnitedStates96:4780-4785中的毒性分析法。尽管易于利用各种分析法分析摄取,但设计适用于细胞摄取路径的非天然氨基酸的替代方法是提供生物合成路径以在活体内产生氨基酸。非天然氨基酸的生物合成许多生物合成路径已经存在于细胞中以产生氨基酸和其它化合物。特定非天然氨基酸的生物合成方法可能不存在于自然界(例如,脊椎动物细胞)中,而本发明提供所述方法。举例来说,任选在宿主细胞中通过添加新颖酶或改变现存的宿主细胞路径来产生非天然氨基酸的生物合成路径。其它新颖酶任选为天然存在的酶或人工开发的酶。举例来说,对氨基苯丙氨酸的生物合成(如题为"Invivoincorporationofunnaturalaminoacids"的WO2002/085923中的实例所提供)依赖于添加来自其它生物体的已知酶的组合。可通过用包含这些酶的基因的质粒转化细胞来将所述基因引入脊椎动物细胞中。当在细胞中表达时,这些基因提供合成所需化合物的酶促路径。任选添加的酶类型的实例提供于下文实例中。其它酶序列可见于例如Genbank中。也任选以相同方式将人工开发的酶添加到细胞中。以此方式,操纵细胞机器和细胞资源以产生非天然氨基酸。多种方法可用于产生用于生物合成路径或发展现存路径中的新颖酶。举例来说,任选将(例如)如Maxygen,Inc.所开发的递归重组(recursiverecombination)(可在万维网www,maxygen,com上获得)用于开发新颖酶和路径。例如参看Stemmer(1994),iapzWevo/Wo"o/av"ra6>>_DA^4s/zw,.wg,Nature370(4):389-391;禾口Stemmer,(1994),IWJAt^z'wgZyrawt/ow々agwew加/cw朋c/re(xwe附6(y:WfrorecowZu—wfi^/cw/ormo/ecw/arevo/z^/o",Proc.Natl.Acad.Sci,USA..91:10747-10751。类似地,任选将Genencor所开发的DesignPath(可在万维网genencor.com上获得)用于代谢路径工程改造,例如工程改造某一路径以在细胞中产生O-甲基-L-酪氨酸。这项技术使用例如通过功能性基因组学以及分子进化和设计所鉴别出的新基因的组合在宿主生物体中重建现存路径。Diversa公司(可在万维网diversa.com上获得)也提供迅速筛选基因文库和基因路径(例如建立新路径)的技术。通常以足以有效进行蛋白质生物合成但未达到影响其它氨基酸的浓度或耗尽细胞资源的程度的浓度(例如天然细胞量)来产生利用本发明的经工程改造的生物合成路径所产生的非天然氨基酸。在活体内以此方式所产生的典型浓度为约lOmM到约0.05mM。在用包含用于产生特定路径所需的酶的基因的质粒转化细胞并且产生非天然氨基酸后,任选使用活体内选择以针对核糖体蛋白质合成和细胞生长进一步优化非天然氨基酸的产生。'具有非天然氨基酸的多肽具有至少一个非天然氨基酸的所关注蛋白质或多肽为本发明的特征。本发明还包括使用本发明的组合物和方法产生的具有至少一个非天然氨基酸的多肽或蛋白质。赋形剂(例如,医药学上可接受的赋形剂)也可与蛋白质一起存在。通过在脊椎动物细胞中产生具有至少一个非天然氨基酸的所关注蛋白质或多肽,蛋白质或多肽通常将包括脊椎动物翻译后修饰。在某些实施例中,蛋白质包括至少一个非天然氨基酸和至少一个由脊椎动物细胞于活体内所产生的翻译后修饰,其中所述翻译后修饰不是由原核细胞产生。举例来说,翻译后修饰包括例如乙酰化、酰化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷酸化、糖酯连接修饰、糖基化等。一方面,翻译后修饰包括通过GlcNAc-天冬酰胺键将寡糖(例如(GlcNAc-Man)2-Man-GlcNAc-GlcNAc))与天冬酰胺连接在一起。参看表7,其列出脊椎动物蛋白质的N连接寡糖的一些实例(也可存在其它未展示的残基)。另一方面,翻译后修饰包括通过GalNAc-丝氨酸或GalNAc-苏氨酸键或者GlcNAc-丝氨酸或GlcNAc-苏氨酸键将寡糖(例如Gal-GalNAc、Gal-GlcNAc等)与丝氨酸或苏氨酸连接在一起。表7:通过GlcNAc键连接的寡糖的实例<table>tableseeoriginaldocumentpage46</column></row><table>另一方面,翻译后修饰包括前体(例如,降钙素前体、降钙素基因相关肽前体、前甲状旁腺激素原、前胰岛素原、前胰岛素、前阿黑皮素原(prepro-opiomelanocortin)、阿黑皮素原等)的蛋白水解处理;组装成多亚单元蛋白质或大分子组装物;翻译到细胞中另一位点处(例如,细胞器,诸如内质网、高尔基体(golgiapparatus)、细胞核、溶酶体、过氧化物酶体、线粒体、叶绿体、液泡等,或通过分泌途径)。在某些实施例中,蛋白质包含分泌或定位序列、抗原决定基标签、FLAG标签、聚组氨酸标签、GST融合体等。非天然氨基酸的一个优势在于,其提供可用于添加额外分子的额外化学部分。这些修饰可在脊椎动物细胞中于活体内进行或在活体外进行。因此,在某些实施例中,翻译后修饰是通过非天然氨基酸进行。举例来说,翻译后修饰可通过亲核-亲电反应进行。当前用于选择性修饰蛋白质的大部分反应涉及亲核与亲电反应搭配物之间的共价键形成,例如a-卤代酮与组氨酸或半胱氨酸侧链的反应。在这些情况中,选择性是由蛋白质中亲核残基的数量和可接近性决定。在本发明的蛋白质中,可在活体外或活体内使用其它更具选择性的反应,诸如非天然酮基氨基酸与酰肼或氨氧基化合物的反应。例如参看Comish等人,(1996)J.Am.Chem.Soc.118:8150-8151;Mahal等人,(1997)Science.276:1125-1128;Wang等人,(2001)Science292:498-500;Chin等人,(2002)Am.Chem.Soc.124:9026-卯27;Chin等人,(2002)Proc.Natl.Acad.99:11020-11024;Wang等人,(2003)Proc.Natl.Acad.Sci100:56-61;Zhang等人,(2003)Biochemistry.42:6735-6746;和Chin等人,(2003)Science.,出版中。这使得能够用包括荧光团、交联剂、糖衍生物和细胞毒性分子在内的多种试剂选择性标记几乎任何蛋白质。还参看2003年10月15日申请名称为"Glycoproteinsynthesis"的专利申请案USSN10/686,944。翻译后修饰(例如通过叠氮基氨基酸)也可通过施陶丁格接合(Staudingerligation)(例如,用三芳基膦试剂)进行。例如参看Kiick等人,(2002)/"corpomrio"c/rec蘭6/朋"/"jproto'm1/orc/ze腳se/ecriv"e,6fzyc油'o"&Sto/W"ger//g她.ow,PNAS99:19-24。本发明提供另一种选择性修饰蛋白质的极为有效的方法,其涉及响应选择性密码子将例如含有叠氮基或炔基部分的非天然氨基酸遗传并入蛋白质中。随后可通过例如胡伊斯根(Huisgen)[3+2]环加成反应(例如参看Padwa,A.ComprehensiveOrganicSynthesis,第4巻.(1991)Trost,B.M.编,Pergamon,Oxford,第1069-1109页;和Huisgen,R.1,3-Di.polarCycloadditionChemistry,(1984)Padwa,A.编,Wiley,NewYork,第1-176页)分别用例如炔基或叠氮化物衍生物来修饰这些氨基酸侧链。例如参看图16。由于这种方法涉及环加成而非亲核取代反应,故可以极高的选择性修饰蛋白质。可在室温下于水性条件中通过将催化量的Cu(I)盐添加到反应混合物中以优良的区位选择性(1,4>1,5)进行所述反应。例如参看Tornoe等人,(2002)J.Org.Chem.67:3057-3064;禾口Rostovtsev,等人,(2002)Angew,Chem.Int.Ed.41:2596-2599。可使用的另一方法是在双砷化合物上配体交换四半胱氨酸基元,例如参看Griffm等人,(1998)Science281:269-272。可通过非天然编码的氨基酸的官能团添加到本发明的蛋白质中的分子包括实质上任何具有互补官能团的分子。所述分子包括(但不限于)染料、荧光团、交联剂、糖衍生物、聚合物(例如,聚乙二醇衍生物)、光交联剂、细胞毒性化合物、亲和标记、生物素衍生物、树脂、珠粒、第二蛋白质或多肽(或更多)、多聚核苷酸(例如,DNA、RNA等)、金属螯合剂、辅因子、脂肪酸、碳水化合物等。另一方面,本发明提供包括所述分子的组合物以及产生这些分子(例如,聚乙二醇)的方法,其中n为介于例如50与10,000之间、75与5,000之间、100与2,000之间、100与1,000之间等的整数。在本发明的实施例中,聚乙二醇具有例如约5,000到约100,000Da、约20,000到约30,000Da、约40,000或约50,000Da、约20,000Da到约10,000Da等的分子量。还提供包含这些化合物,例如具有蛋白质和细胞的各种组合物。在本发明一方面中,包含叠氮基染料(例如,具有化学结构4或化学结构6)的蛋白质进一步包括至少一个非天然氨基酸(例如,炔基氨基酸),其中所述叠氮塞染料通过[3+2]环加成连接到所述非天然氨基酸。本发明的脊椎动物细胞提供合成包含大量有用非天然氨基酸的蛋白质的能力。一方面,组合物任选包括例如至少IO微克、至少50微克、至少75微克、至少'100微克、至少200微克、至少250微克、至少500微克、至少1毫克、至少10毫克或更多包含非天然氨基酸的蛋白质,或可利用活体内蛋白质产生方法所实现的量(关于重组蛋白产生和纯化的细节提供于本文中)。另一方面,蛋白质任选以在例如细胞溶解产物、缓冲液、医药缓冲液或其它液体悬浮液(例如,在从约1nl到约100L间任何数量的体积中)中为例如每升至少10微克蛋白质、每升至少50微克蛋白质、每升至少75微克蛋白质、每升至少100微克蛋白质、每升至少200微克蛋白质、每升至少250微克蛋白质、每升至少500微克蛋白质、每升至少1毫克蛋白质或每升至少10毫克蛋白质或更高的浓度存在于组合物中。在包括至少一个非天然氨基酸的脊椎动物细胞中产生大量(例如,大于通常用其它方法、例如活体外翻译可能获得的量)蛋白质为本发明的特征。可进行非天然氨基酸的并入,例如以调整蛋白质结构和/或功能的改变,例如改变尺寸、酸度、亲核性、氢键、疏水性、蛋白酶靶位点可接取性、靶向部分(例如,对于蛋白质阵列)等。包括非天然氨基酸的蛋白质可具有增强或者甚至全新的催化或物理特性。举例来说,任选通过将非天然氨基酸包涵入蛋白质中来改变以下特性毒性、生物分布、结构特性、光谱特性、化学和/或光化学特性、催化能力、半衰期(例如,血清半衰期)、与其它分子反应(例如共价或非共价)的能力等。包括包含至少一个非天然氨基酸的蛋白质的组合物可用于例如新颖治疗剂、诊断剂、催化酶、工业酶、结合蛋白(例如,抗体)以及例如蛋白质结构和功能研究。例如参看Dougherty,(2000)C/n"c^Mra/jfm'woas/Vo6eso/iVofe/nS/rw"wreFwnc/io",CurrentOpinioninChemicalBiology.4:645-652。在本发明一方面中,组合物包括至少一种具有至少一个、例如至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个或至少十个或更多非天然氨基酸的蛋白质。非天然氨基酸可相同或不同,例如可在蛋白质中1、2、3、4、5、6、7、8、9、10个或更多不同位点包含1、2、3、4、5、6、7、8、9、10个或更多不同非天然氨基酸。另一方面,组合物包括蛋白质中存在的至少一个(但少于全部)特定氨基酸经非天然氨基酸取代的蛋白质。对于具有一个以上非天然氨基酸的指定蛋白质,非天然氨基酸可相同或不同(例如,所述蛋白质可包括两种或48两种以上不同类型的非天然氨基酸,或可包括相同非天然氨基酸中的两个)。对于具有两个以上非天然氨基酸的指定蛋白质,非天然氨基酸可相同、不同或为多个相同种类的非天然氨基酸与至少一个不同非天然氨基酸的组合。基本上任何包括非天然氨基酸的蛋白质(或其部分)(以及任何相应编码核酸,例如其包括一个或多个选择性密码子)都可使用本文中的组合物和方法产生。未进行尝试来鉴别成千上万种已知蛋白质,所述蛋白质中任一种可例如通过调整任何可用突变方法以在相关翻译系统中包括一个或多个适当选择性密码子来修饰,从而包括一个或多个非天然氨基酸。已知蛋白质的常见序列谱系包括GenBankEMBL、DDBJ和NCBI。可易于通过搜索互联网鉴别其它谱系。通常,蛋白质与任何可用蛋白质(例如,治疗性蛋白质、诊断性蛋白质、工业酶或其部分等)例如至少60%、至少70%、至少75%、至少80%、至少卯%、至少95%或至少99%或更高一致,且其包含一个或多个非天然氨基酸。可经修饰以包含一个或多个非天然氨基酸的治疗性、诊断性和其它蛋白质的实例包括(但不限于)例如(x-l抗胰蛋白酶、血管抑素、抗溶血因子、抗体(关于抗体的其它细节见下文)、载脂蛋白、脱辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子(例如,T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-IO、GCP-2、NAP-4、SDF-1、PF4、MIG)、降钙素、CC趋化因子(例如,单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-lct、单核细胞炎症蛋白-ip、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配体、C-kit酉己体、胶原蛋白、群落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子(例如,上皮中性粒细胞活化肽-78、GROa/MGSA、GRO卩、GROy、MlP-la、MIP-15、MCP-1)、表皮生长因子(EGF)、促红细胞生成素("EPO",代表通过并入一个或多个非天然氨基酸修饰的优选靶)、脱落毒素A和B、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤维粘连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因子、剌猬蛋白(例如,音速(Sonic)、印度(Indian)、沙漠(Desert))、血红蛋白、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、胰岛素、类胰岛素生长因子(IGF)、干扰素(例如,IFN-a、IFN-(3、IFN-Y)、白细胞介素(例如,IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL墨8、IL-9、IL-10、IL-ll、IL-12等)、角质细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、荧光素酶、神经营养因子、中性粒细胞抑制因子(NIF)、抑瘤素M、成骨蛋白、甲状旁腺激素、PD-ECSF、PDGF、肽激素(例如,人生长激素)、多效生长因子、蛋白质A、蛋白质G、致热性外毒素A、B和C、松驰素、肾素、SCF、可溶性补体受体I、可溶性I-CAM1、可溶性白细胞介素受体(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超抗原(即葡萄球菌肠毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE))、超氧化物歧化酶(SOD)、中毒性休克综合症毒素(TSST-1)、胸腺肽otl、组织型纤溶酶原活化剂、肿瘤坏死因子|3(TNFP)、肿瘤坏死因子受体(TNFR)、肿瘤坏死因子a(TNFa)、血管内皮生长因子(VEGEF)、尿激酶等。可使用本文所述的用于活体内并入非天然氨基酸的组合物和方法产生的一类蛋白质包括转录调节蛋白或其部分。转录调节蛋白的实例包括调节细胞生长、分化、调控等的基因和转录调节蛋白。转录调节蛋白可在原核生物、病毒和真核生物(包括真菌、植物、酵母、昆虫,和动物,包括哺乳动物)中发现,从而提供多种治疗靶。应了解,表达和转录活化因子通过许多机制,例如通过结合受体、刺激信号转导级联、调控转录因子表达、结合启动子和增强子、与结合启动子和增强子的蛋白质结合、解开DNA、剪接前体mRNA、使RNA多聚腺苷酸化和降解RNA,来调控转录。举例来说,脊椎动物细胞中的GAL4蛋白或其部分的组合物也为本发明的特征。通常,GAL4蛋白或其部分包含至少一个非天然氨基酸。也参看本文中题为"正交氨酰基-tRNA合成酶"的章节。本发明的一类蛋白质(例如,具有一个或多个非天然氨基酸的蛋白质)包括表达活化因子,诸如细胞因子、炎症分子、生长因子、其受体和癌基因产物,例如白细胞介素(例如,IL-1、IL-2、IL-8等)、干扰素、FGF、IGF-I、IGF墨II、FGF、PDGF、TNF、TGF-a、TGF-p、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-l、ICAM-1/LFA-1和透明质酸/CD44;信号转导分子和相应癌基因产物,例如,Mos、Ras、Raf禾口Met;和转录活化因子和抑制因子,例如p53、Tat、Fos、Myc、Jun、Myb、Rel,和类固醇激素受体,诸如雌激素、孕酮、睾酮、醛固酮、LDL受体配体和皮质酮的受体。本发明还提供具有至少一个非天然氨基酸的酶(例如,工业酶)或其部分。酶的实例包括(但不限于)例如酰胺酶、氨基酸消旋酶、酰化酶、脱卤酶、双加氧酶、二芳基丙垸过氧化物酶、表异构酶、环氧化物水解酶、酯酶、异构酶、激酶、葡萄糖异构酶、糖苷酶、糖基转移酶、卤素过氧化物酶、单加氧酶(例如,p450)、脂肪酶、木素过氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酶、枯草杆菌蛋白酶、转氨酶和核酸酶。这些蛋白质中有许多在市面上有售(例如参看,SigmaBiosciences2002目录和报价单),且相应蛋白质序列和基因以及其许多常见变异体众所周知(例如参看Genbank)。可通过插入根据本发明的一个或多个非天然氨基酸来修饰其中任一种,从而例如改变蛋白质的所关注的一种或多种治疗、诊断或酶特性。治疗相关特性的实例包括血清半衰期、保存半衰期、稳定性、免疫原性、治疗活性、可检测性(例如,通过在非天然氨基酸中包涵报告子基团(例如,标记或标记结合位点))、LD50或其它副作用的减少、通过肠道进入身体的能力(例如,口服生物可用性)等。诊断特性的实例包括保存半衰期、稳定性、诊断活性、可检测性等。相关酶特性的实例包括保存半衰期、稳定性、酶活性、生产量等。还可对多种其它蛋白质加以修饰以包括本发明的一个或多个非天然氨基酸。举例来说,本发明可包括利用例如以下来源的蛋白质中的非天然氨基酸取代一种或多种蛋白疫苗中的一个或多个天然氨基酸感染性真菌,例如曲霉属U印wg///^)、念珠菌属(Omcfe/a);充当病原菌模型的细菌、尤其大肠杆菌,以及医学上重要的细菌,诸如葡萄球菌属(5top/^/ococcz')(例如,金黄葡萄球菌(awe^))或链球菌属(S/r印,ococcO(例如,肺炎链球菌(;"ewmom'ae));原生生物,诸如孢子虫类(sporozoa)(例如,,原虫(尸/画o&a))、根足虫)(例如,内阿米巴属(嵐謂oe6a))禾口鞭毛虫(flagellate)(锥虫(D7戸歸0應)、禾U什曼虫(Leish附疆.a)、毛滴虫(7Wc/wmo"^)、贾第虫(Gz'aWa)等);病毒,诸如(+)RNA病毒(实例包括痘病毒,例如牛痘(v"c"'m'");细小核糖核酸病毒,例如,脊髓灰质炎病毒&0//0);外衣病毒,例如风疹病毒(rw6e//a);黄病毒,例如HCV;和冠状病毒)、(-)RNA病毒(例如,棒状病毒,例如VSV;副粘病毒,例如RSV;流感粘病毒,例如流感病毒;本雅病毒(Bunyavirus);和腺病毒)、dsDNA病毒(例如,呼肠孤病毒(Reovims))、RNA变为DNA的病毒(即逆转录病毒,例如HIV和HTLV)和某些DNA变为RNA的病毒(诸如乙型肝炎病毒)。农业相关的蛋白也为非天然氨基酸修饰的适当靶,诸如昆虫抗性蛋白(例如,Cry蛋白)、淀粉和脂质产生酶、植物和昆虫毒素、毒素抗性蛋白、霉菌毒素脱毒蛋白、植物生长酶(例如,1,5-二磷酸核酮糖羧化酶/加氧酶,"RUBISCO")、脂氧合酶(LOX)和烯醇丙酮酸磷酸(PEP)羧化酶。本发明还提供用于在脊椎动物细胞中产生至少一种包含至少一个非天然氨基酸的蛋白质的方法(以及由所述方法产生的蛋白质)。举例来说,方法包括使包含包括至少一个选择性密码子且编码蛋白质的核酸的脊椎动物细胞在适当培养基中生长。脊椎动物细胞还包含正交tRNA(O-tRNA),其在细胞中起作用并且识别选择性密码子;和正交氨酰基-tRNA合成酶(O-RS),其优先利用非天然氨基酸将O-tRNA氨酰化;并且所述培养基包含非天然氨基酸。在一个实施例中,所述方法另外包括将非天然氨基酸并入蛋白质中,其中所述非天然氨基酸包含第一反应性基团;和使所述蛋白质与包含第二反应性基团的分子(例如,染料、例如聚乙二醇衍生物等聚合物、光交联剂、细胞毒性化合物、亲和标记、生物素衍生物、树脂、第二蛋白质或多肽、金属螯合剂、辅因子、脂肪酸、碳水化合物、多聚核苷酸(例如,DNA、RNA等)等)接触。第一反应性基团与第二反应性基团反应以通过[3+2]环加成将所述分子与非天然氨基酸连接。在一个实施例中,第一反应性基团为炔基或叠氮基部分且第二反应性基团为叠氮基或炔基部分。举例来说,第一反应性基团为炔基部分(例如,在非天然氨基酸对炔丙基氧基苯丙氨酸中)且第二反应性基团为叠氮基部分。在另一实例中,第一反应性基团为叠氮基部分(例如,在非天然氨基酸对叠氮基-L-苯丙氨酸中)且第二反应性基团为炔基部分。在一个实施例中,0-RS利用非天然氨基酸以与具有(例如)如SEQIDNO.:86或45中所述的氨基酸序列的O-RS至少50%—样的效率将O-tRNA氨酰化。在另一实施例中,O-tRNA包含SEQIDNO::65或64或者其互补多聚核苷酸序列;由SEQIDNO.:64或65或者其互补多聚核苷酸序列加工;或由SEQIDNO.:64或65或者其互补多聚核苷酸序列编码。在另一实施例中,O-RS包含SEQIDNO.:36-63和/或86中任一序列所述的氨基酸。所编码的蛋白质可包含例如治疗性蛋白质、诊断性蛋白质、工业酶或其部分。由所述方法产生的蛋白质任选进一步经非天然氨基酸修饰。举例来说,任选通过至少一种活体内翻译后修饰来修饰由所述方法产生的蛋白质。还提供产生筛选或选择转录调节蛋白的方法.(以及由所述方法产生的筛选或选择转录调节蛋白)。举例来说,方法包括选择第一多聚核苷酸序列,其中所述多聚核苷酸序列编码核酸结合结构域;和使所述第一多聚核苷酸序列突变以包括至少一个选择性密码子。这将提供筛选或选择多聚核苷酸序列。所述方法还包括选择第二多聚核苷酸序列,其中所述第二多聚核苷酸序列编码转录活化结构域;提供包含可操作性连接到第二多聚核苷酸序列的筛选或选择多聚核苷酸序列的构建体;和将所述构建体、非天然氨基酸、正交tRNA合成酶(O-RS)和正交tRNA(O-tRNA)引入细胞中。利用这些组件,O-RS优先利用非天然氨基酸将O-tRNA氨酰化,且52O-tRNA识别选择性密码子,并响应筛选或选择多聚核苷酸序列中的选择性密码子将非天然氨基酸并入核酸结合结构域中,从而提供筛选或选择转录调节蛋白。在某些实施例中,本发明的方法和/或组合物中的所关注蛋白质或多肽(或其部分)是由核酸编码。通常,核酸包含至少一个选择密码子、至少两个选择密码子、至少三个选择密码子、至少四个选择密码子、至少五个选择密码子、至少六个选择密码子、至少七个选择密码子、至少八个选择密码子、至少九个选择密码子、十个或十个以上选择密码子。可使用所属领域技术人员众所周知且在本文中在"诱变和其它分子生物学技术"下描述的方法诱变编码所关注蛋白质或多肽的基因以包括例如一个或多个选择性密码子以便并入非天然氨基酸。举例来说,使所关注蛋白质的核酸诱变以包括一个或多个选择性密码子,从而插入一个或多个非天然氨基酸。本发明包括例如包括至少一个非天然氨基酸的任何蛋白质的任何此种变异体(例如,突变体)型式。类似地,本发明还包括相应核酸,即,具有一个或多个编码一个或多个非天然氨基酸的选择性密码子的任何核酸。纯化包含非天然氨基酸的重组蛋白根据所属领域技术人员已知且使用的标准程序,可将本发明的蛋白质(例如包.含非天然氨基酸的蛋白质、针对包含非天然氨基酸的蛋白质的抗体等)部分或实质上纯化成均质。因此,可通过所属领域中众所周知的众多方法中的任一种来回收和纯化本发明的多肽,这些方法包括例如硫酸铵或乙醇沉淀、酸或碱萃取、柱色谱、亲和柱色谱、阴离子或阳离子交换色谱、磷酸纤维素色谱、疏水相互作用色谱、羟基磷灰石色谱、凝集素色谱、凝胶电泳等。必要时,在制备正确折叠的成熟蛋白质时可使用蛋白质再折叠步骤。可将高效液相色谱(HPLC)、亲和色谱或其它适合方法用于需要高纯度的最后纯化步骤中。在一个实施例中,将针对非天然氨基酸(或包含非天然氨基酸的蛋白质)制成的抗体用作纯化试剂,例如以基于亲和力纯化包含一个或多个非天然氨基酸的蛋白质。必要时,在部分纯化或纯化达到均质后,任选将多肽例如用作分析组分、治疗剂或抗体产生的免疫原。除了本文中指出的其它参考文献之外,所属领域中众所周知多种纯化/蛋白质折叠方法,包括例如以下文献中描述的那些R.Scopes,ProteinPurification,Springer-Verlag,N.Y.(1982);Deutscher,MethodsinEnzymology第182巻GuidetoProteinPurification.AcademicPress,Inc.N.Y.(1990);Sandana,(1997)BioseparationofProteins.AcademicPress,Inc.;Bollag等人(1996)ProteinMethods,第2版Wiley-Liss,NY;Walker,(1996)TheProteinProtocolsHandbookHumanaPress,NJ,Harris禾口Angal,(1990)ProteinPurificationApplications:APracticalApproachIRLPressatOxford,Oxford,England;Harris禾口Angal,ProteinPurificationMethods:APracticalApproachIRLPressatOxford,Oxford,England;Scopes,(1993)ProteinPurification:PrinciplesandPractice第3版SpringerVerlag,NY;Janson禾口Ryden,(1998)ProteinPurification:Principles.HighResolutionMethodsandApplications,第2版Wiley-VCH,NY;禾口Walker(1998),ProteinProtocolsonCD-ROMHumanaPress,NJ;以及其中所引用的参考文献。在脊椎动物细胞中产生具有至少一个非天然氨基酸的所关注蛋白质或多肽的一个优点在于,通常所述蛋白质或多肽将以其天然构象折叠。然而,在本发明某些实施例中,所属领域技术人员将认识到,在合成、表达和/或纯化之后,蛋白质可具有与相关多肽的所需构象不同的构象。在本发明一个方面中,所表达的蛋白质任选变性且随后复性。这是例如通过将伴侣蛋白(chaperonin)添加到所关注蛋白质或多肽中,和/或通过将蛋白质溶解于诸如盐酸胍等离液剂中来实现。一般来说,有时候需要变性和还原所表达的多肽且随后使多肽再折叠成优选构象。举例来说,可将胍、尿素、DTT、DTE和/或伴侣蛋白添加到所关注翻译产物中。所属领域技术人员众所周知还原、变性和复性蛋白质的方法(参看上述参考文献,以及Debinski等人,(1993)J.Biol.Chem.,268:14065-14070;Kreitman和Pastan(1993)Bioconjug.Chem.,4:581-585;禾口Buchner等人,(1992)Anal.Biochem.,205:263-270)。举例来说,Debinski等人描述在胍-DTE中使包涵体蛋白质变性和还原。所述蛋白质可在含有例如氧化谷胱甘肽和L-精氨酸的氧化还原缓冲液中再折叠。再折叠试剂可流动或以其它方式移动以与一种或多种多肽或其它表达产物接触,或者一种或多种多肽或其它表达产物可流动或以其它方式移动以与再折叠试剂接触。抗体一方面,本发明提供针对本发明的分子,例如合成酶、tRNA和包含非天然氨基酸的蛋白质的抗体。针对本发明的分子的抗体可用作纯化试剂,例如以供纯化本发明的分子。此外,可将所述抗体用作指示剂以指示合成酶、tRNA或包含非天然氨基酸的蛋白质的存在,例如以便追踪所述分子的存在或位置(例如,活体内或原位)。本发明的抗体可为包含一个或多个实质上或部分由免疫球蛋白基因或免疫球蛋白基因片段编码的多肽的蛋白质。认可的免疫球蛋白基因包括K、x、a、y、S、s和p恒定区基因,以及多种免疫球蛋白可变区基因。轻链分为K或x。重链分为y、ha、S或s,其又分别定义免疫球蛋白种类IgG、IgM、IgA、IgD和IgE。典型免疫球蛋白(例如抗体)结构单元包含四聚体。各四聚体是由两对相同的多肽链构成,各对具有一条"轻链"(约25kD)和一条"重链"(约50-70kD)。各链的N末端界定主要负责抗原识别的具有约100到110或更多个氨基酸的可变区。术语可变轻链(VL)和可变重链(Vh)分别是指这些轻链和重链。抗体是以完整免疫球蛋白形式或由各种肽酶消化产生的多个充分表征的片段的形式存在。因此,举例来说,胃蛋白酶消化抗体铰链区中的二硫键联,产生F(ab')2,即Fab的二聚体,所述Fab本身为通过二硫键与VH-CH1连接的轻链。F(ab')2可在温和条件下还原以断开铰链区中的二硫键联,从而将F(ab')2二聚体转化成Fab'单体。Fab'单体基本上为具有铰链区的部分的Fab(关于其它抗体片段的更为详细地描述,参看FundamentalImmunology.第4版,W.E.Paul编,RavenPress,N.Y.(1999))。尽管根据完整抗体的消化定义各种抗体片段,但所属领域技术人员将了解,所述Fab'片段等可以化学方法或通过利用重组DNA方法重新合成。因此,如本文所使用,术语抗体还任选包括由修饰完整抗体产生或使用重组DNA方法重新合成的抗体片段。抗体包括单链抗体,包括单链Fv(sFv或scFv)抗体,其中可变重链与可变轻链连接在一起(直接连接或通过肽连接子连接)形成连续多肽。本发明的抗体可例如为多克隆抗体、单克隆抗体、嵌合抗体、人化抗体、单链抗体、Fab片段、由Fab表达文库产生的片段等。一般说来,本发明的抗体在多种分子生物或制药过程中作为普通试剂和治疗剂都极具价值。产生多克隆和单克隆抗体的方法可得到,并且可用于制造本发明的抗体。多个基本文本中描述标准抗体产生方法,包括例如Borrebaeck(编)(1995)AntibodyEngineering.第2版FreemanandCompany,NY(Borrebaeck);McCafferty等人(1996)AntibodyEngineering,APracticalApproachIRLOxfordPress,Oxford,England(McCafferty);禾口Paul(1995)AntibodyEngineeringProtocolsHumanaPress,Towata,NJ(Paul);Paul(编),(1999)FundamentalImmunology.第5版RavenPress,N.Y.;Coligan(1991)CurrentProtocolsinImmunologyWiley/Greene,NY;Harlow禾口Lane(1989)Antibodies:ALaboratoryManualColdSpringHarborPress,NY;Stites等人(编)BasicandClinicalImmunology(第4版)LangeMedicalPublications,LosAltos,CA,和其中引用的参考文献;Goding(1986)MonoclonalAntibodies:PrinciplesandPractice(第2版)AcademicPress,NewYork,NY;以及Kohler和Milstein(1975)Nature256:495-497。已开发出多种用于抗体制备的不依赖于例如将抗原注射到动物中的重组技术,并且可将其用于本发明的情形中。举例来说,有可能在噬菌体或类似载体中产生并选择重组抗体文库。关于评论,例如参看Winter等人(1994)Mafe'"gJ""6o^"^尸/wgeZ)z'"/a;;rgc/z"o/ogvA腿.Rev.Immunol.12:433-55和其中所引用的参考文献。还参看,Griffiths禾口Duncan(1998)iSYm&g^/orse/e"/o"o/6>>-agefifop一CurrOpinBiotechnol9:102-8;Hoogenboom等人(1998)^4""6o办_p/agg<i—/a_y/"ecA"o/ogy朋c/"卯//(^".0朋Immunotechnology4:1-20;Gram等人(1992)/"/附ww"og/o6w/Z"/Ara7PNAS89:3576-3580;Huse等人(1989)Science246:1275-1281;和Ward等人(1989)Nature341:544-546。在一个实施例中,抗体文库可包括V基因谱系(例如,从淋巴细胞群采集或在活体外组装),其经克隆以在丝状噬菌体表面上展示相关重链和轻链可变结构域。通过结合抗原来选择噬菌体。可溶性抗体是由感染噬菌体的细菌表达并且可例如经由诱变来改进抗体。例如参看,Balint禾QLarrick(1993)乂""6o办^尸an7'歸"f(9wxA/utoge"e^Gsnc137:109-118;Stemmer等人(1993)<SWeWowo/朋Jcfz've>S7wg/e-CTza/wy4wri6ot(vFn9附aiVof"'"丄/wA;er丄z'6rar3;Prepare<i£>K_y/wa^c/"verse户CiBiotechniques14(2):256-65;Crameri等人(1996)Co"欲wcriowa"<ievo/Wo"q/h""6o办"//zagg//6m"'^ZWJ^/zw^7z'"gNatureMedicine2:100-103;以及Crameri禾口Stemmer(1995)Cow6f"a/"oWa/7nw//7》/ec<xwe"ewwtagewewicreafesa////zeper腦加z'owo/麵她/"ccm"e"esBioTechniques18:194-195。用于克隆和表达重组抗体噬菌体系统的试剂盒也已知且可得,例如来自Amersham-PharmaciaBiotechnology(Uppsala,Sweden)的"重组噬菌体抗体系统小鼠ScFv组件(mouseScFvmodule)"。也已产生噬菌体抗体文库以通过链改组制造高亲和力人类抗体(例如参看,Marks等人(1992)3少-Pa^/"g/wwwm'za"o",万w/Wf"gi/妙4^m'(y^"扁朋Jw/^oW"C7zaz'w5Tzw,wgBiotechniques10:779-782)。还应认识到,可通过多种商务服务中任一种(例如,BethylLaboratories(Montgomery,TX)、Anawa(Switzerland)、Eurogentec(Belgium且在US,Philadelphia,PA)等制备抗体。在某些实施例中,将本发明的抗体"人化"是有用的,例如在所述抗体将会治疗性给予的情况下。使用人化抗体倾向于减少针对治疗性抗体的不合需要的免疫反应的发生率(例如,当患者为人类时)。上述抗体参考文献中描述人化策略。除人化抗体外,人类抗体也为本发明的特征。人类抗体是由特征性人类免疫球蛋白序列组成。人类抗体可使用多种方法产生(关于评论,例如参看Larrick等人的美国专利第5,001,065号)。通过三源杂交瘤技术产生人类抗体的通用方法描述于Ostberg等人(1983),/^油顧2:361-367;Ostberg的美国专利第4,634,664号和Engelman等人的美国专利第4,634,666号中。已知多种将抗体用于蛋白质的纯化和检测中的方法,且其可用于检测和纯化如本文所述包含非天然氨基酸的蛋白质。一般说来,抗体为ELISA、Westem印迹法、免疫化学、亲和色谱法、SPR和许多其它方法的有用试剂。上文所述的参考文献提供有关如何执行ELISA分析、Western印迹、表面等离子体共振(SPR)等的细节。在本发明一方面中,本发明的抗体本身包括非天然氨基酸,提供具有所关注特性的抗体(例如,改进的半衰期、稳定性、毒性等)。还参看本文中题为"具有非天然氨基酸的多肽"的章节。抗体占当前临床试验中所有化合物的近50。/。(Wittmp,(1999)尸/^geowcfap/avTibtech17:423-424)且抗体普遍用作诊断试剂。因此,利用非天然氨基酸修饰抗体的能力提供修饰这些有价值的试剂的重要工具。举例来说,存在将MAb用于诊断领域的多种应用。分析范围从简单的斑点试验到较为复杂的方法,诸如用于肿瘤成像的来自DuPontMerckCo.放射性标记的NR-LU-10MAb(Rusch等人(1993)iVi-丄L^0婦朋c/o朋/朋hZw办5ca應'"g.jAe/p/w/CardiovascSurg106:200-4)。如所述,MAb为ELISA、Western印迹法、免疫化学、亲和色谱法等的重要试剂。可对任何此类诊断抗体加以修饰以包括一个或多个非天然氨基酸,从而改变例如Ab对靶的特异性或亲合力,或例如通过在非天然氨基酸中包括可检测标记(例如,光谱、荧光、发光等)来改变一种或多种可检测特性。一类有价值的抗体试剂为治疗性Ab。举例来说,抗体可为通过靶向肿瘤细胞以通过抗体依赖细胞介导的细胞毒性(ADCC)或补体介导的细胞溶解(CML)破坏来阻止肿瘤生长的肿瘤特异性Mab(这些常见类型的Ab有时称为"魔术弹(magicbullet)")。一个实例为利妥昔单抗(Rituxan),一种治疗非霍奇金氏淋巴瘤(Non-Hodgkinslymphoma)的抗CD20Mab(Scott(1998)i/to/扁6:aw,Aera;eWcwomc/owcr/aw幼o办/or"0"-//^沐"^/,//w则CancerPract6:195-7)。第二个实例涉及干扰肿瘤生长的关键组分的抗体。赫赛汀(Herceptin)为一种用于治疗转移性乳癌的抗HER-2单克隆抗体,并且提供具有此作用机制的抗体的实例(Basdga等人(1998)ieco附^/waw/1/zwmaw/zet/awf/-/^^72awfz'6o^i^(7i/ercep/7wjew/zawcesa打fffwmorac/7v/(y<9/p"c///axe/<ioxorwZ/c/"ga/wsfii/Ei2/wewoverex/r《5^f打g/zw/na打6rea5tca"cerxewogm/"[公开的勘误表见于CancerRes(1999)59(8):2020],CancerRes58:2825-31)。第三个实例涉及将细胞毒性化合物(毒素、放射性核素等)直接递送到肿瘤或其它所关注部位的抗体。举例来说,一个应用Mab为CYT-356,—种将辐射直接靶向前列腺肿瘤细胞的90Y连接的抗体(Deb等人7>ea^eW0//zw7wwe-re/ra"or;;p簡加ec朋cerw/z7卯7-ClT-35(5歸woc/owa/朋/7'6o办ClinCancerRes2:1289-97)。第四个应用为抗体定向酶前药疗法(antibody-directedenzymeprodrugtherapy),其中共定位于肿瘤的酶可活化在肿瘤邻近地区中全身给予的前药。举例来说,正开发一种连接到羧肽酶A的抗Ep-CAM1抗体来治疗结肠直肠癌(Wolfe等人(1999)爿w幼o办-<iz>ec,e<if/era"術'A77(58GwwtoWo/A膽awcar6ox"印rit/flwe力丄.<3"<i/"由oWwcf^w//7z//xxirag》o/膨/7zo/rex她朋d^z,/一她■orsGW/OWa"<iBioconiugChem10:38-48)。其它Ab(例如,拮抗剂)经设计以特异性抑制正常细胞功能用于治疗益处。实例为奥素健体(Orthoclone)OKT3,一种由强生公司(JohnsonandJohnson)所提供的用于减少急性器官移植物排斥的抗CD3MAb(Strate等人(1990)CW/wc/o"eOST3w/^/"//"e/7emj9少ac她rewa/a〃0grq/rej'ecricwTransplantProc22:219-20)。另~^类抗体产物为激动剂。这些Mab经设计以特异性增强正常细胞功能用于治疗益处。举例来说,用于神经疗法的基于Mab的.J先胆碱受体激动剂正在开发中(Xie等人zWeW诉c加"wc;/"agom'rfScFvNat.Biotechnol.15:768-71)。这些抗体中任一种可经修饰以包括一个或多个非天然氨基酸以增强一种或多种治疗特性(特异性、亲合力、血清半衰期等)。另一类抗体产物提供新颖功能。这一组中的主要抗体为巳经工程改造以模拟酶的催化能力的催化抗体,诸如Ig序列(Wentworth和Janda(1998)Q^a(y"ca"〃6o&^CurrOpinChemBiol2:138-44)。举例来说,值得关注的应用涉及使用催化抗体mAb-15A10以在活体内水解可卡因(cocaine)以用于成瘾的治疗(Mets等人(1998)Acato/,'caw,/6o办agaz'wWcocaz'we_preve"&coca/weant/tox/c她ProcNatlAcadSciUSA95:10176-81)。催化抗体还可经修饰以包括一个或多个非天然氨基酸以改进一种或多种所关注特性。通过免疫反应性定义多肽由于本发明的多肽提供多种新的多肽序列(例如,在本文中的翻译系统中合成的蛋白质的情况下包含非天然氨基酸;或例如在本文中新颖合成酶的情况下,包含新颖标准氨基酸序列),故所述多肽还提供可例如在免疫学分析中识别的新结构特征。特异性结合本发明多肽的抗体或抗血清的产生以及所述抗体或抗血清所结合的多肽为本发明的特征。举例来说,本发明包括合成酶蛋白,其特异性结合针对包含选自(SEQIDNO:36-63和/或86)中一个或多个序列的氨基酸序列的免疫原所产生的抗体或抗血清或与所述抗体或抗血清特异性免疫反应。为除去与其它同源物交叉反应,利用诸如野生型大肠杆菌酪氨酰基合成酶(TyrRS)(例如SEQIDNO.:2)等可用对照合成酶同源物消减抗体或抗血清。在一种典型形式中,免疫分析使用针对一种或多种包含一个或多个对应于SEQIDNO:36-63和/或86中一个或多个序列或者其实质子序列(即,提供至少约30%的全长序列)的序列的多肽产生的多克隆抗血清。得自SEQIDNO:36-63和86的潜在多肽免疫原组在下文中统称为"免疫原性多肽"。任选选择所得抗血清以对于对照合成酶同源物具有低交叉反应性,并且在免疫分析中使用多克隆抗血清之前,利用一种或多种对照合成酶同源物,例如通过免疫吸附去除任何此类交叉反应性。为了能产生用于免疫分析中的抗血清,可如本文所述产生一种或多种免疫原性多肽并加以纯化。举例来说,可在重组细胞中产生重组蛋白。利用免疫原性蛋白与标准佐剂(诸如,夫罗因德佐剂(Freimd'sadjuvant))的组合以及标准小鼠免疫方案,对近交系小鼠(因为结果归因于小鼠的实质遗传一致更为可重复从而用于此分析中)进行免疫(有关抗体产生、可用于测定特异性免疫反应性的免疫分析形式和条件,例如参看Harlow禾口Lane(1988)Antibodies,ALaboratoryManual.ColdSpringHarborPublications,NewYork。有关抗体的其它参考文献和论述也见于本文中且可在本文中用于制造通过免疫反应性定义/检测多肽的抗体)。另外,可将得自本文中所公开的序列的一种或多种合成或重组多肽与载体蛋白连结并用作免疫原。收集多克隆血清并且在免疫分析,例如,利用一种或多种固定于固体支撑物上的免疫原性蛋白的固相免疫分析中,对免疫原性多肽进行滴定。选择具有106或更高滴度的多克隆抗血清,汇集并利用对照合成酶多肽消减,以产生消减的经汇集的经滴定多克隆抗血清。在比较免疫分析中,测试消减的所汇集的经滴定多克隆抗血清对于对照同源物的交叉反应性。在这个比较分析中,测定用于消减的经滴定多克隆抗血清的差别结合条件,这引起比结合对照合成酶同源物高至少约5-10倍的经滴定多克隆抗血清和免疫原性合成酶的信噪比。也就是说,通过添加诸如白蛋白或无脂肪奶粉等非特异59性竞争剂,和/或通过调节盐条件、温度等,来调节结合/洗涤反应的严格度。将这些结合/洗涤条件用于后续分析中,以测定所汇集的经消减的多克隆抗血清是否特异性结合测试多肽(与免疫原性多肽和/或对照多肽相比较的多肽)。具体说来,如与已知合成酶相比,在差别结合条件下展示比对照合成酶同源物高至少2-5x的信噪比以及为免疫原性多肽的至少约y2的信噪比的测试多肽与免疫原性多肽共有相当大的结构相似性,且因此为本发明的多肽。在另一实例中,将竞争性结合形式的免疫分析用于检测测试多肽。举例来说,如所述,通过利用对照多肽的免疫吸附将交叉反应的抗体从汇集的抗血清混合物中去除。随后,将免疫原性多肽固定于暴露于所汇集的消减抗血清的固体支撑物上。将测试蛋白质添加到所述分析中以竞争结合所汇集的消减抗血清。将与固定蛋白质相比,测试蛋白质竞争结合所汇集的消减抗血清的能力与添加到所述分析中的免疫原性多肽竞争结合的能力(所述免疫原性多肽有效地与固定的免疫原性多肽竞争结合所汇集的抗血清)相比较。使用标准计算法计算测试蛋白质的交叉反应性百分比。在平行分析中,任选与免疫原性多肽竞争结合抗血清的能力相比较,测定对照蛋白质竞争结合所汇集的消减抗血清的能力。再使用标准计算法计算对照多肽的交叉反应性百分比。当测试多肽的交叉反应性百分比为对照多肽的至少5-10x高时,和或当测试多肽的结合大致在免疫原性多肽结合的范围内时,认为所述测试多肽特异性结合所汇集的消减抗血清。一般说来,可将经免疫吸附且汇集的抗血清用于如本文所述的竞争性结合免疫分析中,以将任何测试多肽与免疫原性和/或对照多肽相比较。为进行这个比较,分别分析多种浓度的免疫原性、测试和对照多肽,并且使用标准技术测定抑制50%的消减抗血清与例如经固定对照、测试或免疫原性蛋白质结合所需的各多肽的量。如果在竞争性分析中结合所需的测试多肽的量比所需的免疫原性多肽的量少2倍,那么只要所述量为对照多肽的至少约5-10x高,即认为测试多肽特异性结合针对免疫原性蛋白质所产生的抗体。作为特异性的另一测定法,任选利用免疫原性多肽(而非对照多肽)完全免疫吸附所汇集的抗血清,直到可检测到极少所得免疫原性多肽-经汇集的消减抗血清与免疫吸附中所使用的免疫原性多肽的结合或无法检测到结合。随后测试所述完全免疫吸附的抗血清与测试多肽的反应性。如果观察到极少反应性或未观察到反应性(即,关于完全免疫吸附的抗血清与免疫原性多肽结合观察到不超过2x的信噪比),那么免疫原性蛋白质引起抗血清与测试多肽的特异性结合。60医药组合物将本发明的多肽或蛋白质(例如,合成酶、包含一个或多个非天然氨基酸的蛋白质等)任选例如与适当医药载剂组合用于治疗用途。所述组合物例如包含治疗有效量的化合物和医药学上可接受的载剂或赋形剂。所述载剂或赋形剂包括(但不限于)生理盐水、缓冲生理盐水、葡萄糖、水、甘油、乙醇和/或其组合。调配物经制备成与给药模式相适应。一般来说,所属领域众所周知给予蛋白质的方法并且其可应用于给予本发明的多肽。根据所属领域众所周知的方法,任选在一种或多种适当的活体外和/或活体内动物疾病模型中测试包含一种或多种本发明的多肽的治疗性组合物,以确定功效、组织代谢并评估剂量。具体来说,最初可通过本文中非天然氨基酸同源物相对于天然氨基酸同源物的活性、稳定性或其它适当量度(例如,经修饰以包括一个或多个非天然氨基酸的EPO与天然氨基酸EPO的比较)(即在相关分析中)来确定剂量。给药可通过通常用于将分子引入以使其与血液或组织细胞紧密接触的任何途径进行。本发明的非天然氨基酸多肽是以任何适当的方式任选与一种或多种医药学上可接受的载剂一起给予。对患者给予本发明上下文中的所述多肽的适当方法都可用,且尽管可使用一种以上途径给予特定组合物,但特定途径通常能够提供比另一途径更快捷且更有效的作用或反应。医药学上可接受的载剂部分是由所给予的特定组合物以及用于给予组合物的特定方法决定。因此,存在多种本发明医药组合物的适当调配物。多肽组合物可通过多种途径给予,包括(但不限于)口服、静脉内、腹膜内、肌肉内、透皮、皮下、局部、舌下或直肠方式。还可经由脂质体给予非天然氨基酸多肽组合物。所属领域技术人员通常已知所述给药途径和适当的调配物。单独或与其它适当组分组合的非天然氨基酸多肽也可制成气雾剂调配物(即,其可"成雾状")以经由吸入给予。可将气雾剂调配物放入诸如二氯二氟甲烷、丙烷、氮气等加压可接受推进剂中。适于不经肠给药(诸如通过关节内(在关节中)、静脉内、肌肉内、皮内、腹膜内和皮下途径)的调配物包括水性和非水性等张无菌注射液,其可含有抗氧化剂、缓冲剂、抑菌剂和使调配物与预定接受者血液等张的溶质,以及可包括悬浮剂、增溶剂、增稠剂、稳定剂和防腐剂的水性和非水性无菌悬浮液。可于单位剂量或多剂量密封容器(诸如安瓿和小瓶)中提供包装好的核酸调配物。不经肠给药和静脉内给药是优选的给药方法。具体来说,已经用于天然氨基酸同源物治疗剂的给药途径(例如,通常用于EPO、GCSF、GMCSF、IFN、白细胞介素、抗体和/或任何其它医药学上递送蛋白质的途径)以及当前使用的调配物提供包括本发明的非天然氨基酸的蛋白质(当前治疗性蛋白质的聚乙二醇化变异体等)的优选给药途径以及调配物。在本发明的情况下,视应用而定,给予患者的剂量足以在患者体内随时间实现有益的治疗反应,或例如抑制病原体感染或其它适当活性。通过特定组合物/调配物的功效、所使用的非天然氨基酸多肽的活性、稳定性或血清半衰期和患者的病状以及欲治疗患者的体重或表面积来确定剂量。剂量大小也通过在特定患者体内伴随特定组合物/调配物的给药的任何不利副作用的存在、性质和程度等来确定。在确定疾病(例如,癌症、遗传疾病、糖尿病、AIDS等)的治疗或预防中欲给予的组合物/调配物的有效量时,医师会评估循环血浆水平、调配物毒性、疾病进展和/或(相关时)抗非天然氨基酸多肽抗体的产生。例如给予70公斤患者的剂量通常在等于当前使用的治疗性蛋白质的剂量范围内,所述范围可针对相关组合物的活性或血清半衰期的改变而调节。本发明的组合物/调配物可通过任何已知的常规疗法来补充治疗条件,包括抗体给予、疫苗给予、给予细胞毒性剂、天然氨基酸多肽、核酸、核苷酸类似物、生物反应调节剂等。对于给药,本发明的调配物是以由以下因素所确定的速率给予相关调配物的LD-50,和/或例如当关系到患者的质量和总体健康状况时,对各种浓度的非天然氨基酸的任何副作用的观察。给药可以单次剂量或分剂量实现。如果进行调配物输注的患者出现发烧、寒战或肌肉疼痛,那么其接收适当剂量的阿司匹林(aspirin)、布洛芬(ibuprofen)、对乙酰氨基酚(acetaminophen)或其它疼痛/发烧控制药物。在将要进行输注之前30分钟,对经历输注反应(诸如发烧、肌肉疼痛和寒战)的患者预先给予阿司匹林、对乙酰氨基酚或例如苯海拉明(diphenhydramine)。将哌替啶(Meperidine)用于不能对解热剂和抗组织胺快速作出反应的更为严重的寒战和肌肉疼痛。视反应的严重程度减缓或中断治疗。核酸和多肽序列及变异体如上文和下文所述,本发明提供核酸多聚核苷酸序列和多肽氨基酸序列(例如,O-tRNA和O-RS)以及例如包含所述序列的组合物和方法。例如O-tRNA和O-RS等所述序列的实例在本文中公幵(参看表5,例如SEQIDNO.3-65、86,以及SEQIDNO.:l和2)。然而,所属领域技术人员将了解,本发明不限于本文(例如,实例和表5)中所公开的这些序列。所属领域技术人员将了解,本发明还提供具有本文所述的功能(例如,编码O-tRNA或O-RS)的许多相关和甚至不相关的序列。本发明还提供多肽(0-RS);和多聚核苷酸,例如O-tRNA、编码O-RS或其部分(例如,所述合成酶的活性位点)的多聚核苷酸;用于构建氮酰基-tRNA合成酶突变体的寡聚核苷酸等。举例来说,本发明的多肽包括包含如SEQIDNO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽;包含由如SEQIDNO.:3-35中任一序列所示的多聚核苷酸序列编码的氨基酸序列的多肽;以及与对包含如SEQIDNO.:36-63和/或86中任一序列中所示的氨基酸序列的多肽具特异性的抗体特异性免疫反应的多肽;或包含由如SEQIDNO.:3-35中任一序列所示的多聚核苷酸序列编码的氨基酸序列的多肽。本发明的多肽中还包括包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQIDNO.:2)至少90%—致的氨基酸序列且包含两个或两个以上A-E组氨基酸的多肽。举例来说,A组包括在与大肠杆菌TyrRS的Tyr37对应的位置的缬氨酸、异亮氨酸、亮氨酸、甘氨酸、丝氨酸、丙氨酸或苏氨酸;B组包括在与大肠杆菌TyrRS的Asnl26对应的位置的天冬氨酸;C组包括在与大肠杆菌TyrRS的Asp182对应的位置的苏氨酸、丝氨酸、精氨酸、天冬酰胺或甘氨酸;D组包括在与大肠杆菌TyrRS的Phel83对应的位置的甲硫氨酸、丙氨酸、缬氨酸或酪氨酸;且E组包括在与大肠杆菌TyrRS的Leul86对应的位置的丝氨酸、甲硫氨酸、缬氨酸、半胱氨酸、苏氨酸或丙氨酸。类似地,本发明的多肽还包括包含SEQIDNO.:36-63和/或86的至少20个相邻氨基酸以及两个或两个以上如上文在A-E组中所述的氨基酸取代的多肽。还包括包含任一上述多肽的保守变异体的氨基酸序列作为本发明的多肽。在一个实施例中,组合物包括本发明的多肽和赋形剂(例如,缓冲液、水、医药学上可接受的赋形剂等)。本发明还提供与本发朋的多肽特异性免疫反应的抗体或抗血清。本发明中还提供多聚核苷酸。本发明的多聚核苷酸包括编码本发明的所关注蛋白质或多肽或包括一个或多个选择性密码子或二者的多聚核苷酸。举例来说,本发明的多聚核苷酸包括例如包含如SEQIDNO.:3-35、64-85中任一序列所述的核苷酸序列的多聚核苷酸;与其多聚核苷酸序列互补或编码其多聚核苷酸序列的多聚核苷酸;和/或编码包含如SEQIDNO.:36-63和/或86中任一序列中所述的氨基酸序列的多肽的多聚核苷酸,或其保守变异体。本发明的多聚核苷酸还包括编码本发明的多肽的多聚核苷酸。类似地,在高度严格条件下在实质上整个核酸长度上与上文所述的多聚核苷酸杂交的核酸为本发明的多聚核苷酸。本发明的多聚核苷酸还包括编码多肽的多聚核苷酸,所述多肽包含与天然存在的酪氨酰基氨酰基-tRNA合成酶(TyrRS)的氨基酸序列(例如,SEQIDNO.:2)至少90%—致的氨基酸序列且包含两个或两个以上如上文在第ll段中A-E组中所述的突变。本发明的多聚核苷酸中还包括与上文所述的多聚核苷酸至少70%(或至少75%、至少80%、至少85%、至少90%、至少95%、至少98%或至少99%或更多)一致的多聚核苷酸,和/或包含任一上文所述的多聚核苷酸的保守变异体的多聚核苷酸。在某些实施例中,载体(例如,质粒、柯斯质粒、噬菌体、病毒等)包含本发明的多聚核苷酸。在一个实施例中,载体为表达载体。在另一实施例中,表达载体包括可操作性连接到一个或多个本发明的多聚核苷酸的启动子。在另一实施例中,细胞包含包括本发明的多聚核苷酸的载体。技术人员还应了解,所公开的序列的许多变异体都包括在本发明中。举例来说,本发明中包括得到功能相同的序列的所公开的序列的保守变异体。认为核酸多聚核苷酸序列的变异体与至少一个所公开的序列杂交的变异体包括在本发明中。本发明中还包括如例如通过标准序列比较技术确定的本文所公开的序列的独特子序列。保守变异体归因于遗传密码的简并性,"沉默取代(silentsubstitution)"(即,不会引起所编码的多肽改变的核酸序列的取代)为编码氨基酸的各核酸序列所暗含的特征。类似地,"保守氨基酸取代"(即,氨基酸序列中一个或数个氨基酸经具有高度相似性的不同氨基酸取代)也易于鉴别为与所公开的构建体高度相似。所述各所公开序列的保守变异体为本发明的特征。,特定核酸序列的"保守变异体"是指编码相同或基本上相同的氨基酸序列的核酸,或当所述核酸不编码氨基酸序列时是指基本上相同的序列。所属领域技术人员将认识到,在编码序列中改变、添加或缺失单一氨基酸或少量氨基酸(通常小于5%,更通常小于4%、2%或1%)的个别取代、缺失或添加为"保守性修饰变异",其中所述改变将导致氨基酸的缺失、氨基酸的添加或化学上类似的氮基酸对氨基酸的取代。因此,本发明所列多肽序列的"保守变异"包括少量、通常小于5%、更通常小于2%或1%的多肽序列的氨基酸经具有相同保守取代基团的保守所选氨基酸取代。最后,不改变核酸分子的编码活性的序列的添加(诸如,非功能性序列的添加)为基本核酸的保守变异。所属领域技术人员众所周知提供功能类似的氨基酸的保守取代表。以下陈述含有包括彼此互为"保守取代"的天然氨基酸的例示性群组:保守取代组<table>tableseeoriginaldocumentpage65</column></row><table>核酸杂交可使用比较杂交来鉴别本发明的核酸,包括本发明核酸的保守变异体,并且所述比较杂交方法是区别本发明的核酸的优选方法。此外,与SEQIDNO:3-35、64-85所示的核酸在高、超高和极高严格条件下杂交的靶核酸为本发明的特征。所述核酸的实例包括与指定的核酸序列相比具有一个或数个沉默或保守核酸取代的核酸。当测试核酸以其与完全匹配的互补靶杂交的至少1/2水平与探针杂交时,g卩,以高达探针与靶在一定条件下(其中完全匹配的探针以关于与任何不匹配靶核酸杂交所观察到的信噪比的至少约5x-10x高的信噪比与完全匹配的互补靶结合)杂交的信噪比的至少1/2信噪比杂交时,认为所述测试核酸与探针核酸特异性杂交。当核酸通常在溶液中缔合时,其"杂交"。核酸因存在多种诸如氢键、溶剂排斥、碱基堆叠等充分表征的物理化学力而杂交。核酸杂交的广泛指导可见于Tijssen(1993)iVwc/ez'dWJVo6es第2章第I部分,"Overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays,"(Elsevier,NewYork),以及Ausubel,厨J:文中。Hames禾口Higgins(1995)GeneProbes1IRLPressatOxford'UniversityPress,Oxford,England,(HamesandHigginsl)以及Hames禾口Higgins(1995)GeneProbes2IRLPressatOxfordUniversityPress,Oxford,England(HamesandHiggins2)中提供有关合成、标记、检测和量化DNA和RNA(包括寡核苷酸)的细节。。在Southern印迹或Northern印迹中于过滤器上具有超过100个互补残基的互补核酸杂交的严格杂交条件的实例为42'C,50%福尔马林和lmg肝素,且进行杂交整夜。严格洗涤条件的实例为65'C下0.2xSSC洗涤15分钟(关于SSC缓冲液的描述参看Sambrook,局上文)。通常,高度严格洗涤是在低严格度洗涤之前以去除背景探针信号。例示性低严格度洗涤是在4(TC下以2xSSC洗涤15分钟。一般来说,5x(或更高)于在特定杂交分析中关于不相关探针所观察到的信噪比的信噪比指示检测到特异性杂交。在诸如Southern和Northern杂交等核酸杂交实验的情形中,"严格杂交洗涤条件"为序列依赖性,并且在不同环境参数下不同。有关核酸杂交的广泛指导可见于Tijssen(1993),局上文以及Hames和Higgins,1和2。任何测试核酸的严格杂交和洗涤条件都可易于根据经验确定。举例来说,在确定高度严格杂交和洗涤条件的过程中,将杂交和洗涤条件逐渐增加(例如,通过增加温度、降低盐浓度、增加清洁剂浓度和/或增加杂交或洗涤中诸如福尔马林等有机溶剂的浓度),直到满足一组所选择的标准。举例来说,逐渐增加杂交和洗涤条件,直到探针与完全匹配的互补靶以对于探针与不匹配靶杂交所观察到的至少5倍高的信噪比结合。选择与特定探针的热熔点(Tm)相等的"极严格"条件。Tm为50。/。的测试序列与完全匹配的探针杂交的温度(在指定离子强度和pH值下)。出于本发明的目的,一般地说,选择在指定离子强度和pH值下比特定序列的Tm低约5'C的"高度严格"杂交和洗涤条件。"超高严格"杂交和洗涤条件为增加杂交和洗涤条件的严格度,直到探针与完全匹配的互补耙核酸结合的信噪比为对于杂交任何不匹配耙核酸所观察到的至少10倍高。据悉,在所述条件下以完全匹配的互补靶核酸的至少1/2的信噪比与探针杂交的耙核酸在超高严格条件下与所述探针结合。类似地,可通过逐渐增加相关杂交分析的杂交和/或洗涤条件来确定甚至较高的严格度。举例来说,增加杂交和洗涤条件的严格度,直到探针与完全匹配的互补靶核酸结合的信噪比为对于杂交任何不匹配靶核酸所观察到的至少10x、20x、50x、100x或500x或更高倍数。据悉,在所述条件下以完全匹配的互补靶核酸的至少1/2的信噪比与探针杂交的靶核酸在极高严格条件下与所述探针结合。如果在严格条件下彼此不杂交的核酸编码的多肽实质上相同,那么所述核酸也实质上相同。例如当使用遗传密码所允许的最大密码子简并性产生核酸拷贝时,出现此情形。独特子序列一方面,本发明提供一种核酸,其包含选自本文所公开的O-tRNA和O-RS序列的核酸中的独特子序列。独特子序列与对应于任何已知的O-tRNA或O-RS核酸序列的核酸相比为独特的。可使用例如设置为默认参数的BLAST执行比对。任何独特子序列都例如可用作鉴别本发明的核酸的探针。类似地,本发明包括一种多肽,其包含选自本文所公开的O-RS序列的多肽中的独特子序列。在本文中,独特子序列与对应于任何巳知多肽序列的多肽相比为独特的。本发明还提供靶核酸,其在严格条件下与编码选自O-RS的序列的多肽中的独特子序列的独特编码寡聚核苷酸杂交,其中所述独特子序列与对应于任何对照多肽的多肽(例如,通过突变得到本发明的合成酶的亲本序列)相比为独特的。独特子序列是如上文所述确定。序列比较、一致性和同源性在两个或两个以上核酸或多肽序列的情形中,术语"一致"或"一致性"百分比是指当比较和比对最大对应性时,如使用下文所述的序列比较算法中的一种(或所属领域技术人员可用的其它算法)或通过目测所测量,相同或具有特定的相同氨基酸残基或核苷酸百分比的两个或两个以上序列或子序列。在两个核酸或多肽(例如,编码O-tRNA或O-RS的DNA,或O-RS的氨基酸序列)的情形中,短语"实质上一致"是指当比较和比对最大对应性时,如使用序列比较算法或通过目测所测量,具有至少约60%、优选80%、最优选卯-95%的核苷酸或氨基酸残基一致性的两个或两个以上序列或子序列。在不提及实际祖先的情况下,通常认为所述"实质上一致"的序列"同源"。"实质一致性"优选在至少约50个残基长的序列区、更优选至少约100个残基的区域上存在,且最优选所述序列在至少约150个残基或欲比较的两个序列的全长上实质上一致。为进行序列比较和同源性测定,通常将一个序列充当与测试序列相比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入计算机内,视需要指定子序列坐标,并且指定序列算法程序参数。随后序列比较算法基于指定的程序参数计算测试序列相对于参考序列的序列一致性百分比。可例如通过Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法、Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法、Pearson&Lipman,Proc.Nat,l.Acad.Sci.USA85:2444(1988)的相似性搜索方法、这些算法的计算机实施(WisconsinGeneticsSoftwarePackage,GeneticsComputerGroup,575ScienceDr.,Madison,WI中的GAP、BESTFIT、FASTA和TFASTA)或通过目测(例如参看Ausubel等人,JETOt")进行供比较序列的最佳比对。适于测定序列一致性百分比和序列相似性的算法的一个实例为BLAST算法,其描述于Altschul等人,J.Mol.Biol.215:403-410(1990)中。执行BLAST分析的软件可67通过美国生物技术信息中心(NationalCenterforBiotechnologyInformation,www.ncbi.nlm.nih.gov/)公共可用。所述算法涉及首先通过鉴别询问序列中长度W的短字来鉴别高得分的序列对(highscoringsequencepair,HSP),当与数据库序列中相同长度的字比对时,所述HSP匹配或满足一些正值临界得分T。T是指邻近字的临界分值(neighborhoodwordscorethreshold)(Altschul等人,局J:文)。这些初始邻近字匹配(wordhit)充当起始搜索的种子以发现含有其的较长HSP。随后使字匹配沿各序列的两个方向延伸直到可增加累积比对的分值。对核苷酸序列使用参数M(—对匹配残基的奖励分值;通常>0)和N(错配残基的处罚分值,通常<0)计算累积分值。对于氨基酸序列,使用得分矩阵计算累积分值。当累积比对分值比其所达到的最大值低数量X;累积分值因一个或多个负得分残基比对的积累而为零或更低值;或到达各序列的末端时,在各个方向上的字匹配延伸停止。BLAST算法参数W、T和X将决定比对的灵敏性和速度。BLASTN程序(对于核苷酸序列)使用11的字长(W)、10的期望值(expectation,E)、100的截止值、M=5、N;4和两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用3的字长(W)、10的期望值(E)和BLOSUM62得分矩阵(参看Henikoff&Henikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)作为默认值。除计算序列一致性百分比外,BLAST算法还执行两个序列之间相似性的统计学分析(例如参看Karlin&Altschul,Proc.Nat'l.Acad.Sci.USA90:5873-5787(1993))。BLAST算法所提供的一种相似性量度为最小和概率(smallestsumprobability,P(N)),其提供对于两个核苷酸或氨基酸序列之间偶然出现匹配的概率的指示。举例来说,如果在将测试核酸与参考核酸相比较时,最小和概率小于约O.l、更优选小于约O.Ol且最优选小于约0.001,那么可认为所述核酸与参考序列相似。诱变和其它分子生物学技术描述分子生物技术的常见文章包括Berger和KimmelGuidetoMolecularCloningTechniques.MethodsinEnzymology第152巻AcademicPress,Inc.,SanDiego,CA(Berger);Sambrook等人,MolecularCloning-ALaboratoryManual(第2版)第1-3巻.ColdSpringHarborLaboratory,ColdSpringHarbor,NewYork,1989("Sambrook")禾口CurrentProtocolsinMolecularBiology.F.M.Ausubel等人,编,CurrentProtocols,GreenePublishingAssociates,Inc.与JohnWiley&Sons,Inc.的合资公司,(1999增干U)("Ausubel")。这些文章描述诱变、载体的使用、启动子和许多其它相关课题,所述相关课题涉及例如包括用于产生包括非天然氨基酸的蛋白质的选择密码子、正交6tRNA、正交合成酶和其对在内的基因的产生。多类诱变方法用于本发明中,例如以产生tRNA文库、产生合成酶文库、插入编码所关注蛋白质或多肽中的非天然氨基酸的选择性密码子。所述诱变方法包括(但不限于)定点诱变、随机点诱变、同源重组、DNA改组或其它递归诱变方法、嵌合构建、使用含尿嘧啶的模板的诱变、寡核苷酸定向诱变、硫代磷酸酯修饰DNA诱变、使用缺口双螺旋DNA的诱变等或其任何组合。其它适当方法包括点错配修复、使用修复缺陷型宿主株的诱变、限制性选择和限制性纯化、缺失诱变、通过总基因合成诱变、双链断裂修复等。举例来说,涉及嵌合构建体的诱变也包括在本发明中。在一个实施例中,可通过天然存在分子或者改变或突变的天然存在的分子的巳知信息(例如,序列、序列比较、物理特性、晶体结构等)指导诱变。上述本文中所见的文章和实例描述这些程序。其它信息可见于文中所引用的以下公开文献禾口参考文献'Ling等人,^4邵raac/^,o_0濕腦啤e"ei.a"overv/ew,AnalBiochem.254(2):157-178(1997);Dale等人,Wgo匿/eo"UzVe"W謂d画附wtogewew^p/w印/ora/7^o她匿/7cxi,MethodsMol.Biol.57:369-374(1996);Smith,/"W加腦toge腦^,Arm.Rev.Genet19:423-462(1985);Botstei-n&Shortle,S/ra&g/e《朋6opWcW/o朋o/v/加画/""ge"e^,Science229:1193-1201(1985);Carter,甜e-Wre"e(i聽/agene^,Biochem.J.237:1-7(1986);Kunkel,77zeo/o//go"wc/etz7c/eWrecfedm幽ge打e我NucleicAcids&MolecularBiology(Eckstein,F.禾口Lilley,D.M.J编,SpringerVerlag,Berlin))(1987);Kunkel,x"e,ec诉cmwtogewe*vw'/7zo啤/2e"o妙Zcse/ec/7'ow,Proc.Natl.Acad.Sci.USA82:488-492(1985);Kunkel等人,iapzWe^c/ewfwYe-s/eczycww^fgewes^w"/zotrf;Z/ewo妙z'cse/ec/7'cw,MethodsinEnzymol.154,367-382(1987);Bass等人,7>prepmwoAyw欣"譜6zWz'wg印e"yc"Zes,Scisncs242:240-245(1988);MethodsinEnzvmol,100:468,(1983);MethodsinEnz豫ol.154:329-350(1987);Zoller&Smith,Wgo做c/eo/7We-Wre"ed附z^agewew'sM/3-<ien》e<ive"o朋e^de"/1AcidsRes.10:6487-6500(1982);Zoller&Smith,0/fgowwc/eo"W"z>*e"ei/證啤eweio/IWJ女flgme她c/o"ed/幽M/3vec/w&MethodsinEnzymol.100:468-500(1983);Zoller&Smith,0/z'gowwc/eo/7Uz>e"e<i;w幽gewe^:aw',/e,/7wd/woo/igowwc/eWfite/hmersaw'wg/e-WrtmcfefiZ)iV/4fewp/她,MethodsinEnzvmol.154:329-350(1987);Taylor等人,77jeteo/p/w^p/zorW/n'oWe-mo^/kc/Z)A^/"my/W"z》wreac/7owfopre/weZWJ,Nucl.AcidsRes,13:8749-8764(1985);Taylor等人,TTzer,Wgewera/itm(9/一wwc/eoriU/rec/W腿/a/7oraZz妙加《w^c^顧7g—oyp/wc^/n'o她-腳丄y^ZWJ,Nucl,AcidsRes,13:8765-8787(1985);Nakamaye&Eckstein,T//n力"Zowmst"'"/owe/^owwc/eoye脸z'/c/eavageNucl.AcidsRes,14:9679-9698(1986);Sayers等人,7-T£xom^/^w^/^(xs^/zo^^/n'o"/^-6ase(io//gowwc/eo"'<ie-dz'rec/edwwfagewexzXNucl.AcidsRes.16:791-802(1988);Sayers等人,5Vram/c/MV"gej^/zos^/zoro/^/oa/^-Z;wmVfe,(1988)Nucl.AcidsRes.16:803-814;Kramer等人,77^g";;^dd,fecZM^4oppraac/z0/一肌(:/^(9/^(^-(^>^/^wwto^owcowWrac/7冊,Nucl.AcidsRes.12:9441—9456(1984);Kramer&FritzWgo鼎c/eW^-d/recz^c欣w"/ow/77w加zom1由g卿W—/exD風MethodsinEnzvmol.154:350-367(1987);Kramer等人,oZ/g^wwc/eoOUrec/W0/mw她'o叫Nucl.AcidsRes.16:7207(1988);Fritz等人,(9/一wwc/eW6fe-(i〖/TC/Wcow^rac/z'ow0/附w/a/7o肌'ag",eJ(it/p/exZWJ/^ocedwrew/zTzow/1ewzy附a"creacaowsz'wvdro,Nucl.AcidsRes*16:6987-6999(1988);Kramer等人,尸o/"f她匿fc/z7^戸>,38:879-887(1984);Carter等人,/,謂Wo"go"wc/eW^fesU^"e(i聽啤e"e^腿.wgw"o/xNucl.AcidsRes*13:4431-4443(1985);Carter,/琴raved0/加肌c/eo/iHe"edmw啤eww/s腦'wgM/3ve"歸,MethodsinEnzvmol.154:382-403(1987);Eghtedarzadeh&Henikoff,t/化0/一wwc/e0/油s^gewer她/argede/"/o叫Nucl,AcidsRes.14:5115(1986);Wells等人,/,o他wceyb環a/7ow加6z7^wgAe/ra腦'"owW她o/swZjf/fez-w,Phil.Trans.R.Soc.Lond.A317:415-423(1986);Nambiar等人,7b^/矽"^^"am/c/om'wg0/age/eco<i/wg/or〃'Zowwc/eaye5|proto>7,Science223:1299-1301(1984);Sakamar禾口Khorana,Tbfa/^w/Z/e*expre^o"0/agewe/br/7zea-raiwm'/1rodo她rMgmeWwwc/eo^/e-^W/"gpTOto'wfyra^c/w">^.Nucl.AcidsRes.14:6361-6372(1988》Wells等人,mM啤e/ei'aw/br0/扁/印/e應她'owsW<s7'b,Gctic34:315-323(1985);Gmndstr6m等人,Wgo"wc/eW油-d/rec/W附wf"g^"e^6少m/crosca/e、/zo/1-gww'gewes"/^,XNucl.AcidsRes.13:3305-3316(1985);Mandecki,(9//g^wwc/ec^油-^yec/W^tow6/e-Wra"d6reaA:repa/r//ay附z'^fe五sc/^n'c/n'aco/zame/7oc//ors"e層57e"yk附w/agewes&,Proc.70Natl.Acad.Sci.USA,83:7177-7181(1986);Arnold,尸ra^.w/or薩層/e謂Vo扁e她,CurrentOpinioninBiotechnology4:450-455(1993);Sieber,等人,NatureBiotechnology,19:456-460(2001).W.P.C.Stemmer,Nature370,389-91(1994);和I.A.Lorimer,I.Pastan,NucleicAcidsRes.23,3067-8(1995)。关于众多上述方法的其它细节可见于MethodsinEnzymologv第154巻,其也描述对于各种诱变方法引起的故障査找问题的有效控制。本发明还涉及经由正交tRNA/RS对活体内并入非天然氨基酸的脊椎动物宿主细胞和生物体。利用本发明的多聚核苷酸或包括本发明的多聚核苷酸的构建体(例如本发明的载体,其可为例如克隆载体或表达载体)对宿主细胞进行基因工程改造(例如,转化、转导或转染)。载体可为例如质粒、细菌、病毒、裸多聚核苷酸或连结多聚核苷酸的形式。可通过标准方法将载体引入细胞和/或微生物中,所述方法包括电穿孔(Fromm等人,Proc.Natl.Acad.Sci,USA82,5824(1985))、通过病毒载体感染、在小珠粒或粒子基质内或在表面上用具有核酸的小粒子高速弹道穿透(Klein等人,Nature327,70-73(1987))。可在经调节适用于诸如筛选步骤、活化启动子或选择转化株的活动的常规营养培养基中培养经工程改造的宿主细胞。这些细胞可任选培养入转基因有机体中。关于例如细胞分离和培养(例如用于随后核酸分离)的其它有用参考文献包括Freshney(1994)CultureofAnimalCells,aManualofBasicTechnique,第3版,Wiley-Liss,NewYork及其中所引用的参考文献;Payne等人〔1992)PlantCellandTissueCultureinLiquidSystemsJohnWiley&Sons,Inc.NewYork,NY;Gamborg禾口Phillips(编)(1995)PlantCell,TissueandOrganCulture;FundamentalMethodsSpringerLabManual,Springer-Verlag(BerlinHeidelbergNewYork)以及Atlas禾口Parks(编)TheHandbookofMicrobiologicalMedia(1993)CRCPress,BocaRaton,FL。本发明还涉及具有经由正交tRNA/RS对并入一个或多个非天然氨基酸的能力的脊椎动物细胞系。可使用所属领域中已知的细胞培养技术在已经本发明的多聚核苷酸或包括本发明的多聚核苷酸的构建体转化、转导或转染的宿主细胞上建立这些细胞系。将外源核酸引入宿主细胞中的方法已为所属领域中众所周知且将随所使用的宿主细胞而变化。技术包括(但不限于)葡聚糖介导的转染、磷酸钙沉淀、氯化钙处理、聚凝胺(polybrene)介导的转染、原生质体融合、电穿孔、病毒或噬菌体感染、脂质体中多聚核苷酸的封装和定向微注射。可以允许瞬时或稳定并入DNA的方式转化或转染细胞。对于重组蛋白的长期、高产率产生来说,优选稳定表达。举例来说,可对稳定表达抗体分子的细胞系进行工程改造。可用通过适当表达控制元件(例如,启动子、增强子、序列、转录终止子、多聚腺苷酸位点等)控制的DNA和可选择标记转化宿主细胞,而非使用含有病毒复制起点的表达载体。在引入外来DNA后,可使经工程改造的细胞在富集培养基中生长l-2天,且随后转换为选择性培养基。重组质粒中的可选择标记赋予对选择的抗性,并且使细胞能将质粒稳定整合到其染色体组中并生长,从而形成细胞群,又可对其进行克隆并扩充成细胞系。可有利地使用所述方法来工程改造表达抗体分子的细胞系。所述经工程改造的细胞系尤其适用于筛选和评估与抗体分子直接或间接相互作用的化合物。另外,诸如一些病毒介导的载体转染技术等所属领域技术人员众所周知的其它技术可允许瞬时转染细胞。可使用将靶核酸引入细胞中的若干种众所周知的方法,其中任一种都可用于本发明中。这些方法包括受体细胞与含有DNA的细菌原生质体融合、电穿孔、基因枪法(projectilebombardment)(对于较为稳定的表达)和经病毒载体感染(其可用于稳定或瞬时转染且也在下文中进一步论述)等。细菌细胞可用于扩增含有本发明的DNA构建体的质粒的数目。使细菌生长到对数生长期且可通过所属领域中已知的多种方法分离细菌中的质粒(例如参看Sambrook)。另外,可购得大量试剂盒以从细菌中纯化质粒(例如参看都来自PharmaciaBiotech的EasyPrep、FlexiPrep;来自Stratagene的StrataClean;和来自Qiagen的QIAprep)。随后进一步操纵经分离和纯化的质粒以产生其它质粒,其用于转染细胞或并入相关载体中以感染生物体。典型载体含有转录和翻译终止子、转录和翻译起始序列以及可用于调控特定靶核酸表达的启动子。载体任选包含通用表达盒,其含有至少一个独立终止子序列、允许表达盒在真核细胞或原核细胞或两者中复制的序列(例如,穿梭载体)和用于原核系统与脊椎动物系统的选择标记。载体适用于在原核细胞、真核细胞或优选两者中复制和整合。参看Gillam&Smith,Gene8:81(1979);Roberts等人,Nature.328:731(1987);Schneider,B.等人,ProteinExpr.Purif.6435:10(1995);A讓bel,Sambrook,Berger(都同上文)。例如,ATCC(例如由ATCC出版的TheATCCCatalogueofBacteriaandBacteriophage(1992)Ghema等人(编))提供可用于克隆的细菌和噬菌体的目录。用于测序、克隆和分子生物学的其它方面的其它基本程序以及基础理论探讨也见于Watson等人(1992)RecombinantDNA第2版ScientificAmericanBooks,NY。另外,基本上任何核酸(和几乎任何标记核酸,无论标准或非标准)都可从多种商业来源中的任一种定制或标准定购,这些商业来源诸如MidlandCertifiedReagentCompany(Midland,TX,mcrc.com)、TheGreatAmericanGeneCompan,'^ilamona,CA,可通过万维网在genco.com上获得)、ExpressGenInc.(Chicago,IL,可通过万维网在expressgen.com上获得)、OperonTechnologiesInc.(Alameda,CA)禾口许多其它来源。试剂盒试剂盒也为本发明的特征。举例来说,提供在细胞中产生包含至少一个非天然氨基酸的蛋白质的试剂盒,其中所述试剂盒包括含有编码O-tRNA的多聚核苷酸序列和/或O-tRNA和/或编码O-RS的多聚核苷酸序列和/或O-RS的容器。在一个实施例中,试剂盒另外包括至少一个非天然氨基酸。在另一实施例中,试剂盒另外包含用于产生蛋白质的说明材料。实例提供以下实例说明但非限制所主张的本发明。所属领域技术人员将认识到,在不背离所主张的本发明的范围的情况下,可改变多个不重要的参数。实例1:在脊椎动物细胞中产生并入非天然氨基酸的氨酰基-tRNA合成酶的方法以及所述氨酰基-tRNA合成酶的组合物扩充脊椎动物遗传密码以包括具有新颖物理、化学或生物特性的非天然氨基酸,将提供用于分析和控制这些细胞中的蛋白质功能的有效工具。为此,描述用于分离氨酰基-tRNA合成酶的通用方法,所述氨酰基-tRNA合成酶响应酿酒酵母(Saccharomycescerevisiae,S.cerevisiae)中的琥珀密码子以高保真度并入非天然氨基酸。所述方法是建立在通过抑制GAL4的DNA结合结构域与转录活化结构域之间的琥珀密码子来活化GAL4反应性报告基因HIS3、URA3或LacZ的基础上。描述用于正选择活性大肠杆菌酪氨酰基-tRNA合成酶(EcTyrRS)变异体的GAL4报告基因的优化。还曾利用作为"有毒等位基因(toxicallele)"添加到生长培养基中的小分子,利用URA3报告基因来发展无活性EcTyrRS变异体的负选择。重要的是,可对单一细胞且以多种严格度执行正选择和负选择。这可促进从大型突变合成酶文库中分离出多种氨酰基-tRNA合成酶(aaRS)活性。用于分离所需aaRS表现型的方法的功效可通过模型选择加以证实。实例2大肠杆菌和嗜热脂肪芽孢杆菌TyrtRNA杂合tRNA的构建从酿酒酵母中进行的工作巳知,大肠杆菌TyrtRNA/RS对与内源性tRNA/RS对正交并且支持非天然氨基酸抑制。然而,在活体内于哺乳动物细胞中转录功能性大肠杆菌tRNATyr的尝试富有挑战。为此,关注焦点已转向作为tRNA序列来源的嗜热脂肪芽孢杆菌,其可支持哺乳动物细胞中非天然氨基酸的抑制。尽管嗜热脂肪芽孢杆菌tRNA为大肠杆菌tRNATyr合成酶的底物,但仍需要进一步工程改造tRNA以改进tRNA氨酰化的效率。改进tRNA氨酰化将会改进抑制效率。tRNA的接受茎(acceptorstem)为tRNA合成酶识别的关键决定因素。在本实例中,通过将大肠杆菌与嗜热脂肪芽孢杆菌tRNA7"的不同结构组件组合来构建杂合tRNA。所述杂合tRNA具有大肠杆菌tRNATyr接受茎,以及D臂、TvC臂、可变环和嗜热脂肪芽孢杆菌tRNAT"的反密码子茎。具有得自大肠杆菌的接受茎的新杂合tRNA为大肠杆菌tRNATyr合成酶的良好底物。下文的实验中将展示,当使用新近建立的杂合琥珀抑制tRNA时,获得改进的琥珀抑制效率。为进行比较,对杂合tRNA与得到所述杂合tRNA的嗜热脂肪芽孢杆菌tRNATyr加以测试。实验编码杂合tRNA的质粒的构建通过使用以下引物的重叠PCR:FTam73:具有EcoRI和BglII位点的正向引物OTACGAATTCCCGAGATCTGGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGAC丁AGCGCTCCGGTTTTTCTGTGC(SEQIDNO:91)FTamll5:反向引物AGTCCGCCGCGTTTAGCCACTTCGCTACCCCACCGACGTGTACGTGTGTCGGCCiTCCCCTGAGGTTCAGCACAGAAAAACCGGAGCGC(SEQIDNO:92)Ftamll6:第2段的正向引物GTGGCTAAACGCGGCOGACTCTAAATCCGCTCCCTTTGGGTTCGGCGGTTCGAATCCGTCCCCCACCAGACAAGTG(SEQIDNO:93)Ftamll7:第2段的反向引物GATGCAAGCTTOATOCiATCCGCCATAAGTCATCGGGAGCTGGAGAAAAAAACCGCACTTGTCTGGTGGGOGACGG(SEQIDNO:94),来构建单拷贝杂合琥珀抑制tRNA表达插入物,其包括5'限制性位点(EcoRI和Bgl11)、人类tRNA1"的5'侧接序列(GGATTACGCATGCTCAGTGCAATCTTCGGTTGCCTGGACTAGCGCTCCGGTTTTTCTGTGCTGAACCTCAGGGGACGCCGACACACGTACACGTC(SEQIDNO:,,缺乏3'-CCA的杂合WA64琥珀抑制突变体(杂合tRNA的核苷酸序列如下IDNO:87)且编码所述tRNA的DNA序列如下GGGTTCGGCGGTTCGAATCCGTCCCCCA(SEQIDNO:88))、人类tRNA,的3'NO:90))和3'限制位点(BamHI和HindIII)。将所述插入物接合到pUC19中EcoRI和HindIII位点处。利用杂合tRNA的琥珀抑制实验(图1):将编码hGHE88琥珀突变体、大肠杆菌tRNA合成酶和单拷贝琥珀抑制嗜热脂肪芽孢杆菌tRNA或单拷贝琥珀抑制杂合tRNA的质粒共转染到CHOKl细胞中。转染后42小时分析hGH的表达。当使用杂合tRNA(hbl).时,琥珀抑制效率相对于当使用嗜热脂肪芽孢杆菌琥珀抑制tRNA时所获得的效率增加约30%。实例3将分子添加到具有非天然氨基酸的蛋白质中一方面,本发明提供包含非天然氨基酸的蛋白质与其它取代基分子偶联的方法和相关组合物。应了解,本文所述的实例和实施例仅出于说明性目的,并且将对所属领域技术人员提出根据所述实例和实施例的各种修改或改变,且所述修改和改变都将包括在本申请案的精神和范围以及随附权利要求书的范围内。尽管已出于清楚和理解的目的相当详细地描述本发明,但在阅读本发明后所属领域技术人员将了解,在不偏离本发明的真实范围的情况下,可对形式和细节进行各种修改。举例来说,上述所有技术和设备可以各种组合使用。本申请案中引用的所有公开文献、专利、专利申请案和/或其它文献都以全文引用的方式并入本文中用于所有目的,所引用的程度就如同将各个别公开文献、专利、专利申请案和/或其它文献个别地以引用的方式并入本文中用于所有目的一般。表5IDNO.:标记序列SEQIDNO.:1大肠杆菌野生型TyrRS(合成酶)多聚核苷酸ATGGCAAGCAGTAACTTGATTAAACAATTGCAAGAGCCKiGGGCTGGTAGCCCAGGTGACGGACGAOGAAGCGTTAGCAGAGCOACTOOCGCAAGGCCCGATCGCOCTCTATTGCGGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCATTGTrATGCCTOAAACOCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTCGCGACCCGAGCTTCAAAGCTGCCGAOCGTAAOCTOAACACCGAAGAAACTGTTCAGGAGTOGGTGGACAAAATCCGTAAGCAGGTTGCCCCCiTTCCTCOATTTCGACTGTGGAGAAAACTCTCiCTATCGCGGCGAACAACTATCJACTOGTTCGGCAATATOAATGTGCTGACCTTCCTGCGCGATATTCJGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGWATTTCGTTCACTCAGTTTTCCTACAACCTGTTGCAOGGTTATGACTTCGCCTGTCTGAACAAACAGTACGGTGTGGTGCTGCAAATTGGTGGTTCTGACCAGTGGGGTAACATCACTTCTGGTATCGACCTGACCCGTCGTCTGCATCAGAATCAGGTGTTTGGCCTGAC03TTCCGCTGATCACTAAAGCAGATGGCACCAAATTTGGTAAAACTGAAGGCGGCGCAGTCTGGTTGGATCC(3AAGAAAACCAGCCCGTACAAATTCTACC人GTTCTGGATCAACACTGCGGATGCCGACGTTTACCGCTTCCTGAAGTTCTTCACCl.n'ATOAGCATTGAAGACiATCAACGCCCTGGAAGAAGAAGATAAAAACAGCGGTAAAGCACCGCGCGCCCAGTATGTACTGGCGGAGCAGGTGACTCOTCTGGTTCACGGTOAAGAAGOTTTACAG(3CGOCAAAACGTATTACCGAATGCCTGTTCAGCGGTTCTTTCAGTGCGCTCJAGTGAAGCGGACTTCGAACAGCTGGCOCAGGACGGCGTACCGATGGTTGAGATGGAAAAGGGCGCAGACCTGATGCAGGCACTCJGTCGATTCTGAACTGCAACCTTCCCGTGGTCAGGCACGTAAAACTATCGCCTCCAATGCCATCACCATTAACGGTGAAAAACAGTCCGATCCTGAATACTTCTTTAAAGAAGAAGATCGTCTGTTTGGTCG'ITrl'ACCTTACTGCGTCGC。GTAAAAAGAATTACTGTCTGATTTGCTGGAAATAASEQIDNO.:2大肠杆菌野生型TyrRS(合成酶)氨基酸(aa)MASSNLIKQLQERGLVAQVTDEEALAERLAQGPIALYCGFDPTADSLHLGHLVPLLCLKRFQQAGHKPVALWGATGUGDPSFKAAERKLNTEETVQEWVDKIRKQVAPFLDFDCGENSAIAANNYDWFGNNTNVLTFLRXMGICHFSVNQMINKEAVKQRLNREDQOlSFTEFSYNLLQGYDFACXNKQYGVVLQlGCiSDQWGNITSGlDLTRRLHQNQVFGLTVPUTKADGTXFGKTEGGAVVaDPKKTSPYKPYQFWINTADADVYRFLKFFTFMSIEE1NALEEEDKNSGKAPRAQYVLAEQVTRLVHGEEGLQAAKRITECLFSGSLSALSEADFECJLAQDGVPMVEM汰GADLMQALVDSEU5PSROQARKTlASNAITINGEKQSDPEYFFKEEDiaPGRFTXLRRGKKNYCLICWK76<table>tableseeoriginaldocumentpage77</column></row><table><table>tableseeoriginaldocumentpage78</column></row><table><table>tableseeoriginaldocumentpage79</column></row><table>SEQIDNO.:11.pOMe-9(活性位点)合成酶多聚核苷酸CGGCGOCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTCACTTGTGOCTTCGATCCTACCGCTGACAGCTTGCATTTGGOGCATCTTGTTCCATTGTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCCiAGCGTAAGCTGAACACCGAAGAAACTOTTCAG<3AGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGOCAATATGAATGTGCTGACCTTCCTGCGCGATATTOGCAAACACTTCTCCOTTAACCAGATGATCAACAAAGAAGCGCJTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAOTTTTCCTACAACCTOCTGCAGGGTTATTCGTATGCCTGTOCOAACAAACAGTACGGTGTGSEQIDNO.:.12pOMe-10(活性位点)合成酶多聚核苷酸CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCOCAAGGCCCGATCGCACTCACTTGTOGCTTCGATCCTACCGCTGACAGCTTGCATTTGGGGCATCTTGTTCCATTCTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGGCGGCGCCJACGGOTCTGATTCGCGACCCGACJCTTCAAAGCTGCCGAGCGTAAGCTOAACACCGAAGAAACTGTTCAGGAGTGGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTCGAGAAAACTCTC5CTATCGCGGCCAATAATTATGACTGGTTCAGCAATATGAATGTGCTGACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAGCAGC(3TCTCAACCGTGAAGATCAGG(3GATTTCGTTCACT(3ACnlllCCTACAACCTGCTGCAGGGTTATACGTATOCCTGTCTGAACAAACAGTACGGTGTGSEQIDNO.:13pOMe-ll(活性位点)合成酶多聚核苷酸CGGGGGCTGGTACCcCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCOCAAGGCCCGATCGCACTCCTTTGTGGCTTCGATCCTACCOCTOACAGCTTGCATTTCOOGCATCTTOTTCCATTCTTATGCCTGAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGCGCTGGTAGCiCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAOGAGTCGGTGGACAAAATCCGTAAGCAGGTTGCCCCGTTCCTCGATTTCGACTGTGOAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGCAATA化AATGTGCTGACCTTCCTGCGCGATATTGOCAAACACTTCTCCOTTAACCAGATGATCAACAAAOAAGCGGTTAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATTCTATTGCCTGTTCGAACAAACAGTACGGTGTCSEQIDNO.:14pOMe-12(活性位点)合成酶多聚核苷酸CGGGGGCTGGTAGCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCGACTGGCGCAAGGCCCGATCGCACTCGTGTGTGGCTTCGATCCTACCGCTOACAOCTTCJCATTTGGGOCATCTTGTTCCATTGrrATGCCTCAAACGCTTCCAGCAGGCGGGCCACAAGCCGGTTGC(3CTGGTAGGCGGCGCGACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAOAAACTOTTCAGOAGTGGGTOOACAAAATCCGTAAGCAGGTTGCCCCOTTCCTCGATTTCGACTroTGGAGAAAACTCTGCTATCGCGGCCAATAATTATGACTGGTTCGGCAATATGAAT<3TGCTCACCTTCCTGCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCOOITAAGCAGCGTCTCAACCGTGAAGATCAGGGGATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAGTATTGCCTGTTTGAACAAACAGTACGOTGTGSEQIDNO.:15pOMe-13(活性位点)合成酶多聚核苷酸CGGGOGCTGGTACCCCAGGTGACGGACGAGGAAGCGTTAGCAGAGCXJACTGGCGCAAGGCCCGATCGCACTCGTGTGTGGCTTCGATCCTACCGCTGACACCTTGCATTTGGGGCATCTTGTTCCATTGTTATGCCTOAAACGCTTCCAGCAGCCOGGCCACAAOCCGGTTGCGCTOGTAGGCGGCGCCiACGGGTCTGATTGGCGACCCGAGCTTCAAAGCTGCCGAGCGTAAGCTGAACACCGAAGAAACTGTTCAGGAGTCGGTGGACAAAATCCGTAAGCAOGTTGCCCCGTTCCTCGATTTCGACTOTOC3AGAAAACTCTGCTATCGCC!GCCAATAArrATGACTCGTTCOGCAATATGAATGTGCTGACCTTCCTCCGCGATATTGGCAAACACTTCTCCGTTAACCAGATGATCAACAAAGAAGCGGTTAAOCAGCOTCTCAACCOTOAAGATCAGOGCJATTTCGTTCACTGAGTTTTCCTACAACCTGCTGCAGGGTTATAGTATTCCCTGTTTGAACAAACAGTACG80<table>tableseeoriginaldocumentpage81</column></row><table><table>tableseeoriginaldocumentpage82</column></row><table><table>tableseeoriginaldocumentpage83</column></row><table><table>tableseeoriginaldocumentpage84</column></row><table><table>tableseeoriginaldocumentpage85</column></row><table><table>tableseeoriginaldocumentpage86</column></row><table><table>tableseeoriginaldocumentpage87</column></row><table><table>tableseeoriginaldocumentpage88</column></row><table><table>tableseeoriginaldocumentpage89</column></row><table><table>tableseeoriginaldocumentpage90</column></row><table><table>tableseeoriginaldocumentpage91</column></row><table>权利要求1.一种脊椎动物细胞或细胞系,其包含如SEQIDNO87或SEQIDNO88中所述的核苷酸序列。2.根据权利要求1所述的细胞,其中所述核苷酸序列编码具有对选择性密码子具特异性的反密码子识别序列的tRNA分子。3.根据权利要求2所述的细胞,其中所述选择性密码子选自由以下组成的群组琥珀密码子、赭石密码子、蛋白石密码子或者四个或四个以上碱基的密码子。4.根据权利要求2所述的细胞,其中所述核苷酸序列编码能够利用至少一个非天然氨基酸氨酰化的tRNA分子。5.根据权利要求1所述的细胞,其中所述核苷酸序列编码作为正交tRNA(O-tRNA)的tRNA分子。6.根据权利要求5所述的细胞,其中所述O-tRNA包含如SEQIDNO.:87、SEQIDNO.:88所述的氨基酸序列或其保守变异体。7.根据权利要求5所述的细胞,其中所述O-tRNA能够利用天然氨基酸或非天然氨基酸氨酰化。8.根据权利要求4所述的细胞,其中所述O-tRNA能够利用天然氨基酸和非天然氨基酸氨酰化。.9.根据权利要求5所述的细胞,其中所述O-tRNA能够利用非天然氨基酸氨酰化。10.根据权利要求1所述的细胞,其中所述核苷酸序列是得自非脊椎动物生物体或一种以上非脊椎动物生物体。11.根据权利要求1所述的细胞,其中所述核苷酸序列是得自脊椎动物生物体或一种以上脊椎动物生物体。12.根据权利要求1所述的细胞,其中所述核苷酸序列是得自脊椎动物和非脊椎动物生物体。13.根据权利要求1所述的细胞,其中所述核苷酸序列为野生型、突变型或经修饰的野生型。14.根据权利要求5所述的细胞,其中所述核苷酸序列是得自大肠杆菌(E^c/zen'c/z/aco/z')或嗜热月旨肪芽孢杆菌(5a"7/wsWeara^ze^7wop/H7iw1)。15.根据权利要求1所述的细胞,其中所述脊椎动物细胞为哺乳动物细胞。16.根据权利要求15所述的细胞,其中所述脊椎动物细胞为CH0-K1。17.根据权利要求15所述的细胞,其中所述脊椎动物细胞为CHODG-44。18.根据权利要求15所述的细胞,其中所述脊椎动物细胞为人类细胞系。19.根据权利要求9所述的细胞,其中所述非天然氨基酸选自由以下组成的群组对-乙酰基-L-苯丙氨酸;对-碘-L-苯丙氨酸;O-甲基-L-酪氨酸;对-炔丙基氧基苯丙氨酸;L-3-(2-萘基)丙氨酸;3-甲基-苯丙氨酸;0-4-烯丙基-L-酪氨酸;4-丙基-L-酪氨酸;三-O-乙酰基-GlcNAce-丝氨酸;L-多巴(L-Dopa);氟化苯丙氨酸;异丙基-L-苯丙氨酸;对-叠氮基-L-苯丙氨酸;对-酰基-L-苯丙氨酸;对-苯甲酰基-L-苯丙氨酸;L-磷酸丝氨酸;膦酰基丝氨酸;膦酰基酪氨酸;对-溴苯丙氨酸;对-氨基-L-苯丙氨酸;异丙基-L-苯丙氨酸;酪氨酸氨基酸的非天然类似物;谷氨酰胺氨基酸的非天然类似物;苯丙氨酸氨基酸的非天然类似物;丝氨酸氨基酸的非天然类似物;苏氨酸氨基酸的非天然类似物;垸基、芳基、酰基、叠氮基、氰基、卤基、肼、酰肼、羟基、烯基、炔基、醚、硫醇、磺酰基、硒基、酯、硫代酸、硼酸酯基、硼酸酯基、磷酸基、膦酸基、膦、杂环、烯酮、亚胺、醛、羟胺、酮基或氨基取代的氨基酸,或其任何组合;具有可光活化交联剂的氨基酸;自旋标记的氨基酸;发荧光氨基酸;结合金属的氨基酸;含金属氨基酸;放射性氨基酸;光笼蔽和/或光致异构化氨基酸;含生物素或生物素类似物氨基酸;含酮基氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化学可裂解或可光裂解氨基酸;具有伸长侧链的氨基酸;含有毒基团的氨基酸;糖取代的氨基酸;含碳连接糖的氨基酸;具有氧化还原活性的氨基酸;含a-羟基的酸;氨基硫代酸;(X,a双取代氨基酸;P-氨基酸;除脯氨酸或组氨酸外的环状氨基酸;除苯丙氨酸、酪氨酸或色氨酸外的芳香族氨基酸。20.根据权利要求15所述的细胞,其另外包含正交tRNA合成酶(O-RS),其中所述O-RS识别所述tRNA,并且所述tRNA优先通过所述O-RS利用非天然氨基酸氨酰化。21.根据权利要求20所述的细胞,其中所述O-RS是得自非脊椎动物生物体。22.根据权利要求20所述的细胞,其中所述0-RS包含SEQIDN0:3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、86的核苷酸序列或其保守变异体。23.根据权利要求21所述的细胞,其中所述非脊椎动物生物体为大肠杆菌或嗜热脂肪芽胞杆菌。24.根据权利要求20所述的细胞,其另外包含核酸,所述核酸包含编码所关注多肽的多聚核苷酸,其中所述多聚核苷酸包含由所述O-tRNA所识别的选择性密码子。25.根据权利要求24所述的细胞,其中所述所关注多肽为治疗性蛋白质、诊断性蛋白质、工业酶或其部分。26.根据权利要求24所述的细胞,其中所述所关注多肽包含选自由以下组成的群组的蛋白质或蛋白质的一部分细胞因子、生长因子、生长因子受体、干扰素、白细胞介素、炎症分子、癌基因产物、肽激素、信号转导分子、类固醇激素受体、促红细胞生成素(EPO)、胰岛素、人生长激素、a-l抗胰蛋白酶、血管抑素、抗溶血因子、抗体、载脂蛋白、脱辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、c-x-c趋化因子、T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-IO、GCP-2、NAP-4、SDF-1、PF4、MIG、'降钙素、c-kit配体、细胞因子、CC趋化因子、单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-la、单核细胞炎症蛋白-lp、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、T64262、CD40、CD40配体、C-kit配体、胶原蛋白、群落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子、DHFR、上皮中性粒细胞活化肽-78、GROa/MGSA、GROP、GROy、MIP-la、mip-15、mcp-1、表皮生长因子(EGF)、上皮中性粒细胞活化肽、促红细胞生成素(EPO)、脱落毒素、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤维粘连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因子、生长因子受体、刺猬蛋白(hedgehogprotein)、血红蛋白、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、ICAM-1、ICAM-1受体、LFA-1、LFA-1受体、胰岛素、类胰岛素生长因子(IGF)、IGF-I、IGF-II、干扰素、IFN-a、IFN-0、IFN-y、白细胞介素、IL-1、IL-'2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL陽10、IL-ll、IL-12、角质细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、荧光素酶、神经营养因子、中性粒细胞抑制因子(NIF)、抑瘤素M、成骨蛋白、癌基因产物、甲状旁腺激素、PD-ECSF、PDGF、肽激素、人生长激素、多效生长因子、蛋白质A、蛋白质G、致热性外毒素A、b或C、松驰素、肾素、SCF、可溶性补体受体i、可溶性i-CAM1、可溶性白细胞介素受体、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超抗原、葡萄球菌肠毒素、SEA、SEB、SEC1、SEC2、SEC3、SED、SEE、类固醇激素受体、超氧化物歧化酶(SOD)、中毒性休克综合症毒素、胸腺肽al、组织型纤溶酶原活化剂、肿瘤生长因子(TGF)、TGF-cc、TGF-e、肿瘤坏死因子、肿瘤坏死因子a、肿瘤坏死因子5、肿瘤坏死因子受体(TNFR)、VLA-4蛋白、VCAM-1蛋白、血管内皮生长因子(VEGEF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受体、孕酮受体、睾酮受体、醛固酮受体、LDL受体、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1、透明质酸/CD44和皮质酮。27.—种脊椎动物细胞,其包含正交氨酰基-tRNA合成酶(O-RS)、由SEQIDNO:87或SEQIDNO:88所编码的tRNA、非天然氨基酸以及包含编码所关注多肽的多聚核苷酸的核酸,其中所述多聚核苷酸包含由所述tRNA识别的选择性密码子,其中所述O-RS在所述脊椎动物细胞中优先利用所述非天然氨基酸将所述tRNA氨酰化,且其中所述细胞产生具有所述非天然氨基酸的所述所关注多肽。28.根据权利要求l所述的核酸,其中所述核酸包含A盒和B盒。29.根据权利要求1所述的细胞系,其中所述细胞系己经稳定转染。30.根据权利要求1所述的细胞系,其中所述细胞系己经瞬时转染。31.—种在脊椎动物细胞中产生至少一种包含至少一个非天然氨基酸的蛋白质的方法,所述方法包含使包含核酸的脊椎动物细胞在适当培养基中生长,所述核酸包含至少一个选择性密码子且编码所述蛋白质;其中所述培养基包含非天然氨基酸且所述脊椎动物细胞包含tRNA,其具有SEQIDNO:87或SEQIDNO:88中所述的在所述细胞中起作用并识别所述选择性密码子的核苷酸序列;和正交氨酰基tRNA合成酶(O-RS),其优先利用所述非天然氨基酸将所述O-tRNA氨酰化。32.根据权利要求31所述的方法,其中所述细胞已经稳定转染以包含所述O-tRNA和所述O-RS。33.根据权利要求31所述的方法,其中所述细胞己经瞬时转染以包含所述O-tRNA和所述O-RS。34.根据权利要求31所述的方法,其中所述细胞已经稳定转染以包含所述O-tRNA或所述O-RS,并且经瞬时转染以包含所述O-tRNA或所述O-RS,以致所述细胞仍包含t-RNA和O-RS。35.根据权利要求31所述的方法,其中所述非天然氨基酸选自由以下组成的群组对-乙酰基-L-苯丙氨酸;对-碘-L-苯丙氨酸;O-甲基-L-酪氨酸;对-炔丙基氧基苯丙氨酸;L-3-(2-萘基)丙氨酸;3-甲基-苯丙氨酸;0-4-烯丙基-L-酪氨酸;4-丙基丄-酪氨酸;三-O-乙酰基-GlcNAc0-丝氨酸;L-多巴;氟化苯丙氨酸;异丙基-L-苯丙氨酸;对-叠氮基-L-苯丙氨酸;乂^酰基-L-苯丙氨酸;对-苯甲酰基-L-苯丙氨酸;L-磷酸丝氨酸;膦酰基丝氨酸;膦酰基酪氨酸;对-溴苯丙氨酸;对-氨基-L-苯丙氨酸;异丙基-L-苯丙氨酸;酪氨酸氨基酸的非天然类似物;谷氨酰胺氨基酸的非天然类似物;苯丙氨酸氨基酸的非天然类似物;丝氨酸氨基酸的非天然类似物;苏氨酸氨基酸的非天然类似物;垸基、芳基、酰基、叠氮基、氰基、卤基、肼、酰肼、羟基、烯基、炔基、醚、硫醇、磺酰基、硒基、酯、硫代酸、硼酸酯基、硼酸酯基、磷酸基、膦酸基、膦、杂环、烯酮、亚胺、醛、羟胺、酮基或氨基取代的氨基酸,或其任何组合;具有可光活化交联剂的氨基酸;自旋标记的氨基酸;发荧光氨基酸;结合金属的氨基酸;含金属氨基酸;放射性氨基酸;光笼蔽和/或光致异构化氨基酸;含生物素或生物素类似物氨基酸;含酮基氨基酸;包含聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;化学可裂解或可光裂解氨基酸;具有伸长侧链的氨基酸;含有毒基团的氨基酸;糖取代的氨基酸;含碳连接糖的氨基酸;具有氧化还原活性的氨基酸;含0C-羟基的酸;氨基硫代酸;a,(X双取代氨基酸;P-氨基酸;除脯氨酸或组氨酸外的环状氨基酸;除苯丙氨酸、酪氨酸或色氨酸外的芳香族氨基酸。36.根据权利要求32所述的方法,其中所述蛋白质包含治疗性蛋白质、诊断性蛋白质、工业酶或其部分。37.根据权利要求32所述的方法,其中所述蛋白质包含选自由以下组成的群组的蛋白质或蛋白质的一部分细胞因子、生长因子、生长因子受体、干扰素、白细胞介素、炎症分子、癌基因产物、肽激素、信号转导分子、类固醇激素受体、促红细胞生成素(EPO)、胰岛素、人生长激素、(x-l抗胰蛋白酶、血管抑素、抗溶血因子、抗体、载脂蛋白、脱辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子、T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG、降转素、c-kit配体、细胞因子、CC趋化因子、单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-la、单核细胞炎症蛋白-lp、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、T64262、CD40、CD40酉己体、C-kit配体、胶原蛋白、群落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子、DHFR、上皮中性粒细胞活化肽-78、GROa/MGSA、GROe、GROy、MIP-la、MIP-15、MCP-1、表皮生长因子(EGF)、上皮中性粒细胞活化肽、促红细胞生成素(EPO)、脱落毒素、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤维粘连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因子、生长因子受体、剌猬蛋白、血红蛋白、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、ICAM-1、ICAM-1受体、LFA-1、LFA-1受体、胰岛素、类胰岛素生长因子(IGF)、IGF-I、IGF-II、干扰素、IFN-oc、IFN-e、IFN-y、白细胞介素、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、'IL-ll、IL-12、角质细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、荧光素酶、神经营养因子、中性粒细胞抑制因子(NIF)、抑瘤素M、成骨蛋白、癌基因产物、甲状旁腺激素、PD-ECSF、PDGF、肽激素、人生长激素、多效生长因子、蛋白质A、蛋白质G、致热性外毒素A、B或C、松驰素、肾素、SCF、可溶性补体受体I、可溶性I-CAM1、可溶性白细胞介素受体、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超抗原、葡萄球菌肠毒素、SEA、SEB、SEC1、SEC2、sec3、SED、SEE、类固醇激素受体、超氧化物歧化酶(SOD)、中毒性休克综合症毒素、胸腺肽al、组织型纤溶酶原活化剂、肿瘤生长因子(TGF)、TGF-a、TGF-P、肿瘤坏死因子、肿瘤坏死因子cc、肿瘤坏死因子e、肿瘤坏死因子受体(TNFR)、VLA-4蛋白、VCAM-1蛋白、血管内皮生长因子(VEGEF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受体、孕酮受体、睾酮受体、醛固酮受体、LDL受体、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-l、ICAM-1/LFA-1、透明质酸/CD44和皮质酮。38.—种用于产生包含至少一个非天然氨基酸的蛋白质的试剂盒,所述试剂盒包含容器,其含有SEQIDNO:87或SEQIDNO:88中所述的多聚核苷酸序列。39.根据权利要求38所述的试剂盒,其中所述试剂盒另外包含至少一个非天然氨基酸。40.根据权利要求38所述的试剂盒,其中所述试剂盒另外包含关于产生所述蛋白质的说明材料。全文摘要本发明提供用于产生扩充脊椎动物细胞中基因编码氨基酸的数量的翻译组件的组合物和方法。所述组件包括正交tRNA、正交氨酰基-tRNA合成酶、tRNA/合成酶正交对和非天然氨基酸。还提供具有非天然氨基酸的蛋白质和在脊椎动物细胞中产生具有非天然氨基酸的蛋白质的方法。本发明对脊椎动物细胞提供翻译组件,例如正交氨酰基-tRNA合成酶(O-RS)与正交tRNA(O-tRNA)对和其个别组件,所述翻译组件可用于脊椎动物蛋白质生物合成机器中以将非天然氨基酸并入脊椎动物细胞中正在生长的多肽链中。文档编号C12N5/10GK101541955SQ200780033108公开日2009年9月23日申请日期2007年9月7日优先权日2006年9月8日发明者席雅·诺曼,斯蒂芬妮·周,锋田申请人:Ambrx公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1