非天然活性氨基酸遗传密码增加的制作方法

文档序号:408793阅读:332来源:国知局
专利名称:非天然活性氨基酸遗传密码增加的制作方法
技术领域
本发明属于真核细胞中的翻译生物化学领域。本发明涉及在真核细胞中正交tRNA、正交合成酶和它们配对的生产方法和组合物。本发明也涉及非天然氨基酸的组合物、蛋白质和在真核细胞包括非天然氨基酸中生产蛋白质的方法。
背景技术
从细菌到人类,每个已知生物的遗传密码都编码相同的二十个普通氨基酸。这20个相同的天然氨基酸的不同组合形成蛋白质,进行实际上所有的复杂生命过程,从光合作用到信号转导和免疫反应。为了研究和修饰蛋白的结构和功能,科学家们试图操纵遗传密码和蛋白质的氨基酸序列。但是,难以去除由遗传密码强加的限制,即将蛋白质限于二十个遗传编码的标准构件(很少除硒代半胱氨酸(参见,例如,A. Bock等,(1991),MolecularMicrobiology 5:515-20)和卩比咯赖氨酸之外(参见,例如,G. Srinivasan,等,(2002),Science 296 :1459-62)。在消除这些限制方面已经取得了一些进展,虽然该进展已被限制而且合理控制蛋白结构和功能的能力仍就处于萌芽状态。例如,化学家已经开发了合成和操纵小分子结构的方法和策略(参见,例如,E. J. Corey和X. -M. Cheng,《化学合成的逻辑》(The Logicof Chemical Synthesis) (ffiley-Interscience, New York,1995))。全合成(参见,例如,B. Merrif ield,(1986),Science 232:341-7(1986))和半合成方法(参见,例如,D. Y. Jackson 等,(1994) Science 266 :243_7 和 P. E. Dawson 和 S. B. Kent, (2000), AnnualReview of Biochemistry 69 :923_60)使合成肽和小蛋白成为可能,但是这些方法限于使用超过10千道尔顿(kDa)的蛋白质。诱变法虽然是有功效的,但也限于有限数量的结构改变。在很多情况下,可能在整个蛋白质中竞争性掺入与普通氨基酸接近的结构类似物。参见,例如,R. Furter, (1998), Protein Science 7 :419_26 ;Κ· Kirshenbaum,等,(2002),ChemBioChem 3 :235_7 和 V. Doring 等,(2001),Science 292 :501_4。在尝试扩展操纵蛋白结构和功能的能力中,开发了用化学酰化正交tRNA的体外方法,该方法允许在体外响应于无义密码子将非天然氨基酸选择性掺入(参见,例如,J.A.Ellman,等,(1992),Science 255:197-200)。将具有新结构和物理性质的氨基酸选择性掺入蛋白中,以研究蛋白折叠和稳定性,以及生物分子识别和催化作用。参见,例如,D. Mendel,等,(1995), Annual Review of Biophysics and Biomolecular Structure 24:435-462 和 V.W. Cornish,等(1995 年 3 月 31 日),Angew Chem. Int. Ed. Engl. ,34 :621_633。然而,该方法的化学计量性质严重限制了可以产生的蛋白量。将非天然氨基酸显微注射入细胞。例如,通过显微注射化学错酰化嗜热四膜虫tRNA(例如,M.E. Saks,等(1996),用于通过无义抑制将非天然氨基酸体内掺入蛋白质中的工程四膜虫tRNAGln,J. Biol. Chem. 271 =23169-23175)和相应的mRNA将非天然氨基酸引入爪蟾卵母细胞的烟酰乙酰胆碱受体中(例如,M. ff. Nowak,等(1998),将非天然氨基酸体内掺入爪蟾卵母细胞表达系统的离子通道中,酶学方法.293 :504-529)。这允许通过引入具有独特的物理或化学性质的侧链氨基酸,对卵母细胞内的受体进行详细的生物物理研究。参见,例如,D. A. Dougherty (2000),作为蛋白结构和功能探针的非天然氨基酸,Curr. Opin.Chem. Biol. 4 :645_652。 不幸的是,该方法限于可显微注射的细胞中的蛋白质,因为相关的tRNA是体外化学酰化的,不能再酰化,所以蛋白产率很低。为克服这些限制,将新组分加入原核生物大肠杆菌的蛋白生物合成机器中(例如,L.Wang,等,(2001),Science 292 :498_500),这允许在体内遗传编码非天然氨基酸。为响应琥珀密码子TAG,用该方法将具有新化学、物理或生物学性质的一些新氨基酸,包括光亲和标记和可光异构的氨基酸、酮基氨基酸和糖基化氨基酸以高保真度有效掺入大肠杆菌的蛋白中。参见,例如,J. W. Chin 等,(2002), Journal of the American ChemicalSociety 124:9026-9027 ;J. W. Chin 和 P. G. Schultz,(2002),ChemBioChem 11 :1135_1137 ;J.W.Chin,等,(2002), PNAS United States of America99 :11020_11024 :和 L. Wang 和P. G. Schultz, (2002), Chem. Comm. , 1_10。然而,原核细胞和真核细胞的翻译机器并不是高度保守的;因此,加入大肠杆菌的生物合成机器的组分不能经常用来将非天然氨基酸位点特异性地掺入真核细胞的蛋白中。例如,大肠杆菌中使用的詹氏甲烷球菌酪氨酰-tRNA合成酶/tRNA对在真核细胞中是不正交的。此外,tRNA在真核细胞中,而非在原核细胞中的转录是通过RNA聚合酶III进行的,这限制了可在真核细胞中转录的tRNA结构基因的一级序列。而且,与原核细胞相反,真核细胞中的tRNA需要从转录它们的细胞核中输出至胞质,以在翻译中起作用。最后,真核80S核糖体与70S原核核糖体不同。因此,需要开发改进的生物合成机器组件,以扩展真核生物遗传密码。本发明满足了这些和其它需要,这在下面公开的综述中显而易见。
发明概要本发明提供了具有翻译组件的真核细胞,例如,正交氨酰基-tRNA合成酶(O-RS)对和正交tRNA (Ο-tRNA),及它们的个别组件,它们用于真核蛋白生物合成机器,在真核细胞中将非天然氨基酸掺入正在生长的多肽链中。本发明组合物包括含有正交氨酰基-tRNA合成酶(O-RS)(例如,来源于非真核生物,如大肠杆菌、嗜热脂肪芽孢杆菌等)的真核细胞(例如,酵母细胞(如酿酒酵母细胞),哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞等),其中O-RS在真核细胞中优选地氨酰化具有至少一个非天然氨基酸的正交tRNA(O-tRNA)。任选地,在给定真核细胞中可以氨酰化两种或多种OtRNA。在一个方面,O-RS氨酰化例如,至少40%、至少45%、至少50%、至少60%、至少75%、至少80%、或甚至90%或更多的具有非天然氨基酸的0-tRNA,与具有氨基酸序列,如SEQ ID NO. :86或45中所列序列的O-RS—样有效。在一个实施方式中,本发明的O-RS氨酰化具有非天然氨基酸的Ο-tRNA,比O-RS氨酰化具有天然氨基酸的Ο-tRNA的效率高例如,至少10倍、至少20倍、至少30倍等。
在一个实施方式中,SEQ ID NO. :3_35 (例如,3_19、20_35或序列3-35的任何其它亚组)中所列任一个多核苷酸序列,或其互补多核苷酸序列编码O-RS或其一部分。在另一实施方式中,O-RS包含SEQ ID NO. :36_63 (例如,36_47、48_63或36-63的任何其它亚组)和/或86,或其保守变体中任一个所列的氨基酸序列。在另一实施方式中,O-RS包含与天然产生的酪氨酰氨酰基-tRNA合成酶(TyrRS)例如、至少90%、至少95%、至少98%、至少99 %或至少99. 5 %或更多相同的氨基酸序列,并包含来自A-E族的两种或多种氨基酸。A族包括与大肠杆菌TyrRS的Tyr37相对应位置上的缬氨酸、异亮氨酸、亮氨酸、甘氨酸、丝氨酸、丙氨酸或苏氨酸。B族包括与大肠杆菌TyrRS的Asnl26相对应位置上的天冬氨酸。C族包括与大肠杆菌TyrRS的Aspl82相对应位置上的苏氨酸、丝氨酸、精氨酸、天冬酰胺或甘氨酸。D族包括与大肠杆菌TyrRS的Phel83相对应位置上的甲硫氨酸、丙氨酸、缬氨酸或酪氨酸;E族包括与大肠杆菌TyrRS的Leul86相对应位置上的丝氨酸、甲硫氨酸、缬氨酸、半胱氨酸、苏氨酸或丙氨酸。任何这些族组合的亚组是本发明的特征。例如,在一个实施方式中,O-RS具有两种或多种选自与大肠杆菌TyrRS的Tyr37相对应位置上出现的缬氨酸、异亮氨酸、亮氨酸、或苏氨酸;与大肠杆菌TyrRS的Aspl82相对应位置上的苏氨酸、丝氨酸、精氨酸、或甘氨酸;与大肠杆菌TyrRS的Phel83相对应位置上的甲硫氨酸、或酪氨酸;和与大肠杆菌TyrRS的Leul86相对应位置上的丝氨酸、或丙氨酸的氨基酸。在另一实施方式中,O-RS包括两种或多种选自与大肠杆菌TyrRS的Tyr37相对应位置上的甘氨酸、丝氨酸、或丙氨酸,与大肠杆菌TyrRS的Asnl26相对应位置上的天冬氨酸,与大肠杆菌TyrRS的Aspl82相对应位置上的天冬酰胺,与大肠杆菌TyrRS的Phel83相对应位置上的丙氨酸或缬氨酸和/或与大肠杆菌TyrRS的Leul86相对应位置上的甲硫氨酸、缬氨酸、半胱氨酸、或苏氨酸。在另一实施方式中,与天然氨基酸相比,O-RS对于非天然氨基酸具有一种或多种改进或增强的酶性质。例如,与天然氨基酸相比,对非天然氨基酸的改进或增强的性质包括,例如,较高km、较低km、较高krat、较低krat、较低kMt/km、较高kMt/km等的任意一种。真核细胞也任选地包括非天然氨基酸。真核细胞任选地包括正交tRNA(0-tRNA)(例如,来自非真核生物,如大肠杆菌、嗜热脂肪芽孢杆菌和/或类似物),其中Ο-tRNA识别选择密码子,并优选地由O-RS氨酰化具有非天然氨基酸的Ο-tRNA。在一个方面,0-tRNA介导非天然氨基酸掺入蛋白质中,其效率相当于包含SEQ ID NO. :65中所列多核苷酸序列或在该序列的细胞中加工的tRNA效率例如,至少45%、至少50%、至少60%、至少75%、至少80%、至少90%、至少95%或99%。在另一方面,Ο-tRNA包含SEQ ID NO. :65的序列,O-RS包含选自SEQ ID NO. :36-63(例如,36-47、48-63或36-63的任何其它亚组)和/或86,和/或其保守变体中任意一个所列氨基酸序列的多肽序列。在另一实施方式中,真核细胞包含含有编码感兴趣多肽的多核苷酸的核酸,其中多核苷酸包含0-tRNA识别的选择密码子。在一个方面,包含非天然氨基酸的感兴趣多肽的产率是从多核苷酸缺少选择密码子的细胞中获得的天然产生的感兴趣多肽的例如,至少
2.5%、至少5%、至少10%、至少25%、至少30%、至少40%、50%或更多。在另一方面,细胞在没有非天然氨基酸的情况下产生感兴趣多肽的产率是在有非天然氨基酸的情况下多肽产率的例如,小于35%、小于30%、小于20%、小于15%、小于10%、小于5%、小于2. 5%
坐寸ο本发明也提供包含正交氨酰基-tRNA合成酶(O-RS)、正交tRNA (Ο-tRNA)、非天然氨基酸和含有编码感兴趣多肽的多核苷酸的核酸的真核细胞。多核苷酸包含0-tRNA识别的选择密码子。此外,在真核细胞中O-RS优选地氨酰化具有非天然氨基酸的正交 tRNA (Ο-tRNA),细胞在没有非天然氨基酸的情况下产生感兴趣多肽的产率是在有非天然氨基酸的情况下多肽产率的例如,小于30%、小于20%、小于15%、小于10%、小于5%、小于
2.5 % 等。包括含有正交tRNA (Ο-tRNA)的真核细胞的组合物也是本发明的特征。一般地,Ο-tRNA在体内介导非天然氨基酸掺入蛋白质中,该蛋白质通过含有Ο-tRNA识别的选择密码子的多核苷酸编码。在一个实施方式中,Ο-tRNA介导非天然氨基酸掺入蛋白质中,其效率相当于包含SEQ ID NO. :65中所列多核苷酸序列或在该序列的细胞中加工的tRNA效率的例如,至少45 %、至少50 %、至少60 %、至少75 %、至少80 %、至少90 %、至少95 %或甚至99%或更高。在另一实施方式中,Ο-tRNA包含SEQ ID NO. :65中所列的多核苷酸序列或加工自多核苷酸序列,或其保守变体。在另一实施方式中,Ο-tRNA包含可循环的0-tRNA。在本发明的一个方面,Ο-tRNA是转录后修饰的。本发明也提供在真核细胞中编码Ο-tRNA的核酸或其互补多核苷酸。在一个实施方式中,核酸包含A框和B框。本发明也描述了生产翻译组件的方法,例如,O-RSs或0-tRNA/0-RS对(和这些方法生产的翻译组件)。例如,本发明提供了生产正交氨酰基-tRNA合成酶(O-RS)的方法,该酶在真核细胞中优选地氨酰化具有非天然氨基酸的正交tRNA。该方法包括,例如,将第一种类的真核细胞的群体在非天然氨基酸存在下进行正选择,其中真核细胞各自包含i)氨酰基-tRNA合成酶(RS)文库的一员、ii)正交tRNA (0-tRNA)、iii)编码正选择标记的多核苷酸和iv)编码负选择标记的多核苷酸;其中在正选择下存活的细胞包含在非天然氨基酸存在下氨酰化正交tRNA (Ο-tRNA)的活性RS。在没有非天然氨基酸的情况下将在正选择下存活的细胞进行负选择,以去除氨酰化具有天然氨基酸的Ο-tRNA的活性RS。这提供了优选地氨酰化具有非天然氨基酸的Ο-tRNA的0-RS。在某些实施方式中,将编码正选择标记的多核苷酸可操作地连接于效应元件,细胞还包括a)编码从效应元件调节转录的转录调节蛋白(例如,真核转录调节蛋白等)和b)包含至少一种选择密码子的的多核苷酸。通过氨酰化具有非天然氨基酸的Ο-tRNA将非天然氨基酸掺入转录调节蛋白中导致正选择标记的转录。在一个实施方式中,转录调节蛋白是转录激活蛋白(例如,GAL4等),选择密码子是琥珀终止密码子,例如,其中琥珀终止密码子位于或基本上接近编码转录激活蛋白的DNA结合域的部分多核苷酸。正选择标记可以是各种分子中任意一种。在一个实施方式中,正选择标记包含生长营养补充剂,在缺少营养补充剂的培养基中进行选择。在另一实施方式中,编码正选择标记的多核苷酸是例如,ura3、leu2、lys2、IacZ基因、his3 (例如,其中his3基因编码咪唑甘油磷酸脱氢酶,由提供的3-氨基三唑(3-AT)和/或类似物检测。在另一实施方式中,编码正选择标记的多核苷酸包含选择密码子如同正选择标记一样,负选择标记也可以是各种分子中任意一种。在某些实施方式中,编码负选择标记的多核苷酸可操作地连接于效应元件,转录调节蛋白从效应元件介导转录。通过氨酰化具有天然氨基酸的Ο-tRNA将天然氨基酸掺入转录调节蛋白中导致负选择标记的转录。在一个实施方式中,编码负选择标记的多核苷酸是例如,ura3基因,负选择在含有5-氟乳清酸(5-F0A)的培养基中完成。在另一实施方式中,用于负选择的培养基包含可以被负选择标记转化为可检测物质的选择剂或筛选剂。在本发明的一个方面,可检测物质是有毒物质。在一个实施方式中,编码负选择标记的多核苷酸包含选择密码子。在某些实施方式中,正选择标记和/或负选择标记包含在合适反应物的存在下发荧光或催化发光反应的多肽。在本发明的一个方面,通过荧光激活细胞分选(FACS)或通过发光检测正选择标记和/或负选择标记。在某些实施方式中,正选择标记和/或负选择标记包含基于亲和力的筛选标记或转录调节蛋白。在一个实施方式中,同一多核苷酸编码正选择标记和负选择标记。在一个实施方式中,编码本发明正选择标记和/或负选择标记的多核苷酸可以包含至少两个选择密码子,各自或两者可以包含至少两个不同的选择密码子或至少两个相同的选择密码子。选择/筛选严格性的附加水平也可用于本发明方法。在一个实施方式中,方法可包括,例如,在步骤(a)、(b)或(a)和(b)提供数量不等的失活合成酶,其中数量不等的失活合成酶提供附加水平的选择或筛选严格性。在一个实施方式中,本方法用于生产O-RS的步骤(a),(b)或步骤(a)和(b)包括不同的选择或筛选严格性,例如,正和/或负选择标记的严格性。该方法任选地包括将优选地氨酰化具有非天然氨基酸的Ο-tRNA的O-RS进行附加选择轮,例如,附加正选择轮、附加负选择轮或附加正和负选择轮的组合。在一个实施方式中,选择/筛选包括一种或多种正或负选择/筛选,它们选自,例如,氨基酸通透性的改变,翻译效率的改变,翻译保真度的改变等。一种或多种改变是基于编码正交tRNA-tRNA合成酶对的组件的一种或多种多核苷酸中的突变被用来生产蛋白。一般地,RS文库(例如,突变体RS文库)包含来自至少一种例如,来自非真核生物的氨酰基-tRNA合成酶(RS)的RS。在一个实施方式中,RS文库来自失活的RS,例如,其中失活RS通过突变活性RS而产生。在另一实施方式中,失活RS包含氨基酸结合口袋和一个或多个含有用一种或多种不同氨基酸取代结合口袋的氨基酸,例如,取代的氨基酸用丙氨酸取代。在某些实施方式中,生产O-RS的方法还包括在编码RS的核酸上进行随机突变、位点特异性突变、重组、嵌合构建或它们的任意组合,因此产生突变体RS文库。在某些实施方式中,该方法还包括,例如,(c)分离编码O-RS的核酸;(d)从核酸中产生一组编码突变O-RS的多核苷酸(例如,通过随机诱变、位点特异性诱变、嵌合构建、重组或它们的任意组合);和(e)重复步骤(a)和/或(b),直到获得优选地氨酰化具有非天然氨基酸的0-tRNA的突变0-RS。在本发明的一个方面,步骤(c)-(e)至少进行两次。生产0-tRNA/0-RS对的方法也是本发明的特征。在一个实施方式中,如上所述地获得0-RS,通过将第一种类的真核细胞的群体进行负选择获得Ο-tRNA,其中真核细胞包括tRNA文库的一员,以去除包含被对真核细胞内源性氨酰基-tRNA合成酶(RS)氨酰化的tRNA文库的一员的细胞。这提供了与第一种类的真核细胞正交的tRNA库。在本发明的一个方面,tRNA文库包含来自至少一种例如,来自非真核生物的tRNA的tRNA。在本发明的另一方面,氨酰基-tRNA合成酶(RS)文库包括来自至少一种例如,来自非真核生物的氨酰基-tRNA合成酶(RS)的RS。在本发明的另一方面,tRNA文库包括来自至少一种来自第一种非真核生物的tRNA的tRNAs。氨酰基-tRNA合成酶(RS)文库任选地包含来自至少一种来自第二种非真核生物的氨酰基-tRNA合成酶(RS)的RS。在一个实施方式中,第一种和第二种非真核生物是相同的。另外,第一种和第二种非真核生物可以是不同的。通过本发明方法生产的特异性O-tRNA/O-RS对也是本发明的特征。 本发明的另一特征是在一种类中生产翻译组件和将选择/筛选的翻译组件引入第二种类的方法。例如,在第一种类(例如,真核生物种类,如酵母等)中生产0-tRNA/0-RS对的方法还包括将编码Ο-tRNA的核酸和编码O-RS的核酸引入第二种类的真核细胞(例如,哺乳动物、昆虫、真菌、藻类、植物等)。第二种类可以在体内用引入的翻译组件将非天然氨基酸掺入正在生长的多肽链中,例如,在翻译期间。在另一实施例中,生产在真核细胞中优选地氨酰化具有非天然氨基酸的正交tRNA的正交氨酰基-tRNA合成酶(O-RS)的方法包括(a)在非天然氨基酸存在下对第一种类的真核细胞群体(例如,真核生物种类,如酵母或类似物)进行正选择。第一种类的真核细胞各自包括i)氨酰基-tRNA合成酶(RS)文库的一员,ii)正交tRNA (0-tRNA),iii)编码正选择标记的多核苷酸,和iv)编码负选择标记的多核苷酸。能够在正选择下存活的细胞包含在非天然氨基酸存在下氨酰化正交tRNA (Ο-tRNA)的活性RS。将在正选择下存活的细胞在没有非天然氨基酸的情况下进行负选择,以去除氨酰化具有天然氨基酸的Ο-tRNA的活性RS,因此提供优选地氨酰化具有非天然氨基酸的Ο-tRNA的0-RS。将编码Ο-tRNA的核酸和编码O-RS的核酸引入第二种类的真核细胞(例如,哺乳动物、昆虫、真菌、藻类、植物和/或类似物)。当这些组件在第二种类中翻译时,可以用来将非天然氨基酸掺入第二种类中感兴趣的蛋白或多肽。在一个实施方式中,将Ο-tRNA和/或O-RS引入第二种类的生物真核细胞中。在某些实施方式中,通过将第一种类真核细胞的群体进行负选择获得Ο-tRNA,其中真核细胞包含tRNA文库的一员,以去除被对真核细胞内源性氨酰基-tRNA合成酶(RS)氨酰化的tRNA文库的一员的细胞。这提供了与第一种类和第二种类的真核细胞正交的tRNA 库。在一个方面,本发明包括含有一种蛋白的组合物,其中该蛋白包含至少一种非天然氨基酸和至少一个翻译后修饰,其中至少一个翻译后修饰包括将含有第二活性基团的分子通过[3+2]环加成附着到含有第一活性基团的至少一种非天然氨基酸上。因此,具有至少一种非天然氨基酸的蛋白(或感兴趣多肽)也是本发明的特征。在本发明的某些实施方式中,具有至少一种非天然氨基酸的蛋白包括至少一个翻译后修饰。在一个实施方式中,至少一个翻译后修饰是将含有第二活性基团的分子(例如,染料、聚合物如聚乙二醇的衍生物、光交联剂、细胞毒化合物、亲和标记、生物素的衍生物、树脂、第二种蛋白或多肽、金属螯合剂、辅因子、脂肪酸、碳水化合物、多核苷酸(例如、DNA、RNA等)等)通过[3+2]环加成附着到含有第一活性基团的至少一种非天然氨基酸上。例如,第一活性基团是炔基部分( 例如,非天然氨基酸中对-炔丙基氧基苯丙氨酸)(该基团有时也称为乙炔部分),第二活性基团是叠氮基部分。在另一个实施例中,第一活性基团是叠氮基部分(例如,非天然氨基酸中对-叠氮基-L-苯丙氨酸),第二活性基团是炔基部分。在某些实施方式中,本发明的蛋白包括至少一种含有至少一个翻译后修饰的非天然氨基酸(例如,酮式非天然氨基酸),其中至少一个翻译后修饰包含糖部分。在某些实施方式中,在真核细胞中体内进行翻译后修饰。在某些实施方式中,蛋白包括至少一个通过真核细胞体内进行的翻译后修饰,其中翻译后修饰并不是通过原核细胞进行的。翻译后修饰的例子包括但不限于乙酰化、酰化、脂质-修饰、棕榈酰化、棕榈酸酯加成、磷酸化、糖脂-连接修饰等。在一个实施方式中,翻译后修饰包括将寡糖通过GlcNAc-天冬酰胺连接附着到天冬酰胺上(例如,其中寡糖包括(GlcNAc-Man) 2-Man-GlcNAc-GlcNAc等)。在另一实施方式中,翻译后修饰包括将寡糖(例如,Gal-GalNAc,Gal-GlcNAc 等)通过 GalNAc-丝氛酸、GalNAc-苏氛酸、GlcNAc-丝氛酸或GlcNAc-苏氨酸连接附着到丝氨酸或苏氨酸上。在某些实施方式中,本发明的蛋白或多肽可包含分泌或定位序列、表位标记、FLAG标记、聚组氨酸标记、GST融合蛋白和/或类似物。一般地,蛋白与任意可用蛋白(例如,治疗蛋白、诊断蛋白、工业酶或它们的一部分和/或类似物)有例如,至少60 %、至少70 %、至少75 %、至少80 %、至少90 %、至少95 %或甚至至少99 %或更多相同,它们包含一种或多种非天然氨基酸。在一个实施方式中,本发明组合物包括感兴趣的蛋白或多肽和赋形剂(例如,缓冲液、药学上可接受的赋形剂等)。感兴趣的蛋白或多肽可含有至少一个、至少两个、至少三个、至少四个、至少五个、至少六个、至少七个、至少八个、至少九个、或十个或更多非天然氨基酸。非天然氨基酸可以是相同或不同的,例如,在包含1、2、3、4、5、6、7、8、9、10或更多不同的非天然氨基酸的蛋白中可以有1、2、3、4、5、6、7、8、9、10或更多不同位点。在某些实施方式中,蛋白质天然产生形式中存在至少一种,但少于全部的具体氨基酸用非天然氨基酸取代。一种蛋白(或感兴趣多肽)的例子包括但不限于,例如,细胞因子、生长因子、生长因子受体、干扰素、白介素、炎症分子、癌基因产物、肽激素、信号转导分子、留类激素受体、促红细胞生成素(EPO)、胰岛素、人生长激素、α-I抗胰蛋白酶、血管生成抑制素、抗溶血因子、抗体、载脂蛋白、脱辅蛋白质、心钠素、心房钠尿多肽、心房肽、C-X-C趋化因子、Τ39765、NAP-2、ENA-78、Gro-a、Gro_b、Gro_c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG、降钙素、c-kit配体、细胞因子、CC趋化因子、单核细胞趋化蛋白-I、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-I α、单核细胞炎症蛋白-I β、RANTES, 1309、R83915、R91733、HCC1、Τ58847、D31065、Τ64262、CD40、CD40 配体、C-kit 配体、胶原、集落刺激因子(CSF)、补体因子5a、补体抑制剂、补体受体I、细胞因子、DHFR、上皮嗜中性粒细胞激活肽_78、GR0a /MGSA, GRO β , GRO y , MIP-I a、MIP-I δ、MCP-1、表皮生长因子(EGF)、上皮嗜中性粒细胞激活肽、促红细胞生成素(EPO)、剥脱性毒素、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤连蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺素、生长因子、生长因子受体、Hedgehog蛋白、血红蛋白、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、ICAM-I、ICAM-I受体、LFA-I、LFA-I受体、胰岛素、胰岛素-样生长因子(IGF)、IGF-I、IGF-II、干扰素、IFN- a、IFN- β、IFN- y、白介素、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-IU IL-12、角质形成细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、荧光素酶、Neurturin、嗜中性粒细胞抑制因子(NIF)、制瘤素M、成骨蛋白、癌基因产物、甲状旁腺激素、PD-ECSF, TOGF、肽激素、人生长激素、多效营养因子、蛋白A、蛋白G、热源性外毒素A、B或C、松弛素、肾素、SCF、可溶性补体受体I、可溶性I-CAM1、可溶性白介素受体、可溶性TNF受体、生长调节素、促生长素抑制素、促生长素、链激酶、超抗原、葡萄球菌肠毒素、SEA、SEB、SECl、SEC2、SEC3、SED、SEE、留类激素受体、超氧化物歧化酶(SOD)、中毒性休克综合征毒素、胸腺素α I、组织纤溶酶原激活物、肿瘤生长因子(TGF)、TGF-α、TGF-β、肿瘤坏死因子、肿瘤坏死因子α、肿瘤坏死因子β、肿瘤坏死因子受体(TNFR)、VLA-4蛋白、VCAM-I 蛋白、血管内皮生长因子(VEGEF)、尿激酶、Mos、Ras、Raf、Met ;p53、Tat、Fos、Myc、Jun> Myb> Rel、雌激素受体、孕酮受体、睾酮受体、醛固酮受体、LDL受体、SCF/c_Kit、CD40L/CD40、VLA-4/VCAM-l、ICAM-1/LFA-1、透明质酸苷(hyalurin)/CD44、皮质酮、Genebank 或其它可用数据库中存在的蛋白等,和/或它们的一部分。在一个实施方式中,感兴趣多肽包括转录调节蛋白(例如,转录激活蛋白(如GAL4),或转录抑制蛋白等)或它们的一部分。真核细胞中的GAL4蛋白或其部分的组合物也是本发明的特征。一般地,GAL4蛋白或其一部分包含至少一种非天然氨基酸。本发明的真核细胞提供了合成含大有用量非天然氨基酸的蛋白的能力。例如,生产含有非天然氨基酸的蛋白在细胞抽提物、缓冲液、药学上可接受的赋形剂和/或类似物中的蛋白浓度是,例如,至少10微克/升、至少50微克/升、至少75微克/升、至少100微克/升、至少200微克/升、至少250微克/升、或至少500微克/升或更高。在某些实施方式中,本发明组合物包括,例如,至少10微克、至少50微克、至少75微克、至少100微克、至少200微克、至少250微克、或至少500微克或更多含有非天然氨基酸的蛋白。在某些实施方式中,核酸编码感兴趣的蛋白或多肽(或它们的一部分)。一般地,该核酸包含至少一个选择密码子、至少两个选择密码子、至少三个选择密码子、至少四个选择密码子、至少五个选择密码子、至少六个选择密码子、至少七个选择密码子、至少八个选择密码子、至少九个选择密码子、或甚至十个或更多选择密码子。本发明也提供在真核细胞中生产至少一种含有至少一个非天然氨基酸的蛋白质(以及用这种方法生产的蛋白)的方法。方法包括,例如,在合适的培养基中培养含有一种核酸的真核细胞,该核酸包含至少一个选择密码子并编码该蛋白。真核细胞也含有细胞中有功能且能识别选择密码子的正交tRNA (Ο-tRNA),以及优选地氨酰化具有非天然氨基酸的Ο-tRNA的正交氨酰基tRNA合成酶(O-RS),培养基含有非天然氨基酸。在一个实施方式中,O-RS氨酰化具有非天然氨基酸的Ο-tRNA相当于具有如SEQ ID NO. :86或45中所列氨基酸序列的O-RS的效率的例如,至少45%、至少50%、至少60%、至少75%、至少80%、至少 90%、至少95%、或甚至99%或更高。在另一实施方式中,Ο-tRNA包括由SEQ ID NO. 64或65或其互补多核苷酸序列编码,或加工自该序列。在另一实施方式中,O-RS包含SEQ IDNO. 36-63 (例如,36-47、48-63或36-63的任意其它亚组)和/或86中任一个所列氨基酸序列。在一个实施方式中,该方法还包括将非天然氨基酸掺入该蛋白中,其中非天然氨基酸包含第一活性基团;并将该蛋白与含有第二活性基团的分子(例如,染料、聚合物、例如、聚乙二醇的衍生物、光交联剂、细胞毒化合物、亲和标记、生物素的衍生物、树脂、第二种蛋白或多肽、金属螯合齐U、辅因子、脂肪酸、碳水化合物、多核苷酸(例如、DNA、RNA等)等)接触。第一活性基团与第二活性基团反应,将该分子通过[3+2]环加成附着到非天然氨基酸上。在一个实施方式中,第一活性基团是炔基或叠氮基部分,第二活性基团是叠氮基或炔基部分。例如,第一活性基团是炔基部分(例如,非天然氨基酸中对-炔丙基氧基苯丙氨酸),第二活性基团是叠氮基部分。在另一实施例中,第一活性基团是叠氮基部分(例如,非天然氨基酸中对-叠氮基-L-苯丙氨酸),第二活性基团是炔基部分.在某些实施方式中,编码蛋白包含治疗蛋白、诊断蛋白、工业酶或它们的一部分。在一个实施方式中,通过非天然氨基酸进一步修饰该方法生产的蛋白。例如,通过如亲核-亲电子反应,经由[3+2]环加成等修 饰非天然氨基酸。在另一实施方式中,通过至少一个翻译后修饰(例如,N-糖基化,O-糖基化,乙酰化,酰化,脂质-修饰,棕榈酰化,棕榈酸酯加成,磷酸化,糖脂-连接修饰等)体内修饰该方法生产的蛋白质。也提供了生产筛选或选择转录调节蛋白的方法(以及用这种方法生产筛选或选择转录调节蛋白)。方法包括,例如,选择第一个多核苷酸序列,其中多核苷酸序列编码核酸结合域;将第一个多核苷酸序列突变,以包括至少一种选择密码子。这提供了筛选或选择多核苷酸序列。方法也包括,例如,选择第二个多核苷酸序列,其中第二个多核苷酸序列编码转录激活域;提供构建物,它包含可操作地连接于第二个多核苷酸序列的筛选或选择多核苷酸序列;和,将构建物非天然氨基酸、正交tRNA合成酶(O-RS)和正交tRNA (Ο-tRNA)引入细胞。用这些组件,响应于筛选或选择多核苷酸序列中的选择密码子,O-RS优选地氨酰化具有非天然氨基酸的0-tRNA,Ο-tRNA识别选择密码子并将非天然氨基酸掺入核酸结合域中。这提供了筛选或选择转录调节蛋白。在某些实施方式中,本发明的组合物和方法包括真核细胞。本发明的真核细胞包括,例如,哺乳动物细胞、酵母细胞、真菌细胞、植物细胞、昆虫细胞等的任意一种。本发明的翻译组件可以来自各种生物,例如,非真核生物,如原核生物(例如,大肠杆菌,嗜热脂肪芽孢杆菌等),或古细菌,或例如,真核生物。本发明的选择密码子扩展了真核蛋白生物合成机器的遗传密码子构架。本发明中可以使用各种选择密码子的任意一种,包括终止密码子(例如,琥珀密码子、赭石密码子或乳白终止密码子)、无义密码子、罕用密码子、四(或更多)碱基密码子和/或类似物。可用于本文描述的组合物和方法的非天然氨基酸的例子包括(但不限于)对-乙酰基-L-苯丙氨酸、对-碘代-L-苯丙氨酸、O-甲基-L-酪氨酸、对-炔丙基氧基苯丙氨酸、对-炔丙基-苯丙氨酸、L-3-(2-萘基)丙氨酸、3-甲基-苯丙氨酸、0-4-烯丙基-L-酪氨酸、4-丙基-L-酪氨酸、三-氧-乙酰基-GlcNAc β -丝氨酸、L-多巴、氟化苯丙氨酸、异丙基-L-苯丙氨酸、对-叠氮基-L-苯丙氨酸、对-酰基-L-苯丙氨酸、对-苯甲酰基-L-苯丙氨酸、L-磷酸丝氨酸、膦酰基丝氨酸、膦酰基酪氨酸、对-溴苯丙氨酸、对-氨基-L-苯丙氨酸、异丙基-L-苯丙氨酸、酪氨酸氨基酸的非天然类似物;谷氨酰胺氨基酸的非天然类似物;苯丙氨酸氨基酸的非天然类似物;丝氨酸氨基酸的非天然类似物;苏氨酸氨基酸的非天然类似物;烷基、芳基、酰基、叠氮基、氰基、齒素、肼、酰肼、羟基、链烯基、炔基、醚、硫醇、磺酰基、硒、酯、硫代酸、硼酸、硼酸盐、磷酰基、膦酰基、膦、杂环、烯酮、亚胺、醛、羟胺、酮基或氨基取代的氨基酸或它们的任意组合;具有可光敏化的交联剂的氨基酸;自旋标记的氨基酸;荧光氨基酸;金属结合氨基酸;含金属的氨基酸;放射性氨基酸;光笼蔽(photocaged)和/或可光异构的氨基酸;含有生物素或生物素_类似物的氨基酸;含酮氨基酸;含有聚乙二醇或聚醚的氨基酸;重原子取代的氨基酸;可化学切割或可光切割的氨基酸;具有延长侧链的氨基酸;含有毒基团的氨基酸;糖取代的氨基酸;含有碳-连接糖的氨基酸;具有氧化还原活性的氨基酸;含α -羟基的酸;氨基硫代酸;α,α双取代的氨基酸;β -氨基酸;除脯氨酸或组氨酸外的环氨基酸,除苯丙氨酸,酪氨酸或色氨酸外的芳族氨基酸,和/或类似物。 本发明也提供多肽(O-RS)和多核苷酸,例如,Ο-tRNA,编码O-RS或其一部分(例如,合成酶的活性位点)的多核苷酸,用于构建氨酰基-tRNA合成酶突变体的寡核苷酸,编码含有一种或多种选择密码子的感兴趣的蛋白或多肽的多核苷酸等。例如,本发明的多肽包括包含SEQ ID NO. 36-63 (例如,36_47、48_63或36-63的任意其它亚组)和/或86中任一个所列氨基酸序列的多肽,包含由SEQ ID NO. :3_35 (例如,3_19、20_35或序列3-35的任何其它亚组)中任一个所列多核苷酸序列编码的氨基酸序列的多肽,和具有抗体特异免疫活性的多肽,该抗体对包含SEQ ID NO. :36-63 (例如,36-47、48-63或36-63的任意其它亚组)和/或86中任一个所列氨基酸序列的多肽或包含SEQ ID NO. :3_35 (例如,3_19、20-35或序列3-35的任何其它亚组)中任一所列多核苷酸序列编码的氨基酸序列的多肽特
巳本发明的多肽也包括与天然产生的酪氨酰氨酰基-tRNA合成酶(TyrRS)(例如,SEQ ID NO. 2)具有至少90%相同氨基酸序列的多肽,和包含A-E族(上述)中两种或多种氨基酸的多肽。类似地,本发明多肽也任选地包括含有SEQ ID NO. :36-63(例如,36-47、48-63或36-63的任意其它亚组)和/或86中任意一个的至少20个连续氨基酸,和如A-E族中所述的两个或多个氨基酸取代的多肽。含有任一上述多肽的保守变体的氨基酸序列也作为本发明的多肽包括在内。在一个实施方式中,组合物包括本发明的多肽和赋形剂(例如,缓冲液、水、药学上可接受的赋形剂等)。本发明也提供与本发明多肽具有特异免疫活性的抗体或抗血清。本发明中也提供了多核苷酸。本发明的多核苷酸包括那些用一种或多种选择密码子编码本发明感兴趣的蛋白或多肽的多核苷酸。此外,本发明的多核苷酸包括,例如,含有SEQ ID NO. :3-35(例如,3-19、20-35或序列3-35的任意其它亚组)>64-85中任意一个所列核苷酸序列的多核苷酸;与该多核苷酸序列互补或编码该多核苷酸序列的多核苷酸;和/或编码含有SEQ ID NO. :36-63(例如,36-47、48-63或36-63的任意其它亚组)和/或86中任意一个所列氨基酸序列或其保守变体的多肽的多核苷酸。本发明的多核苷酸也包括编码本发明多肽的多核苷酸。类似地,在高度严谨条件下与上述多核苷酸杂交的核酸超过基本上全长的核酸是本发明的多核苷酸。本发明的多核苷酸也包括编码多肽的多核苷酸,该多肽包含与天然产生的酪氨酰氨酰基-tRNA合成酶(TyrRS)(例如,SEQ ID NO. 2)至少90%相同的氨基酸序列,和包含A-E族(上述)中两个或多个突变。与上述多核苷酸和/或含有任一上述多核苷酸的保守变体的多核苷酸至少70 % (或至少75 %、至少80 %、至少85 %、至少90 %、至少95 %、至少98%、或至少99%或更多)相同的多核苷酸也包括在本发明的多核苷酸中。在某些实施方式中,载体(例如,质粒、粘粒、噬菌体、病毒等)包含本发明的多核苷酸。在一个实施方式中,载体是表达载体。在另一实施方式中,表达载体包括可操作地连接于一种或多种本发明的多核苷酸的启动子。在另一实施方式中,细胞含有包括本发明的多核苷酸的载体。在另一方面,本发明提供了化合物的组合物和生产所述化合物的方法。例如,化合物包括,例如,非天然氨基酸(如对-(炔丙基氧基)-苯丙氨酸(例如,

图11中的1),叠氮基染料(如化学结构4和化学结构6中所示),炔基聚乙二醇(例如化学结构7中所示),其中η是例如,50和10,000,75和5,000、100和2,000、100和I, 000等之间的整数等。在本发明的实施方式中,炔基聚乙二醇的分子量为,例如约5,000至约100,OOODa、约20,000至约 50,OOODa、约 20,000 至约 10,OOODa (例如,20,OOODa)。
权利要求
1.一种在真核细胞中生产至少一种含有至少一个非天然氨基酸的蛋白质的方法,该方法包括 在合适的培养基中培养含有核酸的真核细胞,该核酸包含至少一个选择密码子并编码所述蛋白;其中所述培养基含有非天然氨基酸,所述真核细胞包含在细胞中起作用并识别选择密码子的正交tRNA(O-tRNA)和优选地氨酰化具有非天然氨基酸的Ο-tRNA的正交氨酰基tRNA合成酶(O-RS); 在该真核细胞中将非天然氨基酸掺入所述蛋白质,其中该非天然氨基酸包含第一活性基团;和 将该蛋白质与包含第二活性基团的分子接触;其中第一活性基团与第二活性基团反应,使该分子通过[3+2]环加成附着到所述非天然氨基酸上。
2.如权利要求I所述的方法,其特征在于,所述分子是染料、聚合物、聚乙二醇衍生物、光交联剂、细胞毒化合物、亲和标记、生物素衍生物、树脂、第二种蛋白质或多肽、金属螯合齐U、辅因子、脂肪酸、碳水化合物或多核苷酸。
3.如权利要求I所述的方法,其特征在于,所述第一活性基团是炔基或叠氮基部分,所述第二活性基团是叠氮基或炔基部分。
4.如权利要求3所述的方法,其特征在于,所述第一活性基团是炔基部分,所述第二活性基团是叠氮基部分。
5.如权利要求4所述的方法,其特征在于,所述非天然氨基酸包括对-炔丙基氧基苯丙氨酸。
6.如权利要求3所述的方法,其特征在于,所述第一活性基团是叠氮基部分,所述第二活性基团是炔基部分。
7.如权利要求6所述的方法,其特征在于,所述非天然氨基酸包括对-叠氮基-L-苯丙氨酸。
8.一种由权利要求I所述方法生产的蛋白质。
9.如权利要求8所述的蛋白质,其特征在于,所述蛋白质由至少一种体内翻译后修饰进行修饰,其中所述翻译后修饰选自N-糖基化、O-糖基化、乙酰化、酰化、脂质-修饰、棕榈酰化、棕榈酸酯加成、磷酸化和糖脂-连接修饰。
全文摘要
本发明提供了生产翻译组件的组合物和方法,该组件扩展了在真核细胞中遗传编码氨基酸的数量。组件包括正交tRNA、正交氨酰基-tRNA合成酶,tRNA/合成酶对和非天然氨基酸。也提供了在真核细胞中用非天然氨基酸生产蛋白质的蛋白质和方法。
文档编号C12P21/06GK102618605SQ20121005770
公开日2012年8月1日 申请日期2004年4月16日 优先权日2003年6月18日
发明者A·T·克罗普, A·戴特斯, C·J·安德森, J·W·钦, P·G·舒尔茨 申请人:斯克利普斯研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1