含非天然氨基酸苯基硒代半胱氨酸的蛋白质的遗传编程表达的制作方法

文档序号:74284阅读:522来源:国知局
专利名称:含非天然氨基酸苯基硒代半胱氨酸的蛋白质的遗传编程表达的制作方法
含非天然氨基酸苯基砸代半胱氨酸的蛋白质的遗传编程表达[0001]相关申请的交叉引用[0002]本申请要求以下申请的优先权2006年3月16日提交的美国临时申请序列号 60/783,272;2006年11月28日提交的美国临时申请序列号60/861,456 ;两篇申请的内容通过引用全文纳入本文。[0003]联邦资助研发下所作发明的权利的声明[0004]本发明在政府的国家卫生研究院(National Institutes of Health)基金号 GM62159的支持下作出。政府对本发明享有一定权利。发明领域[0005]本发明涉及翻译生物化学(translation biochemistry)领域。本发明涉及制备和利用将非天然氨基酸掺入蛋白质的正交tRNA、正交氨酰基-tRNA合成酶及其配对的组合物和方法。[0006]发明背景[0007]在历史上,对蛋白质结构和功能的研究依赖于利用天然氨基酸的反应活性基团的可用特性和反应化学特性。不幸的是,从细菌到人类的每种已知生物编码相同的二十种常见氨基酸。这20种氨基酸包含的官能团数目出乎意料地少氮碱基、羧酸和酰胺、醇基团和巯基。R-基团的这种有限选择性约束了对蛋白质结构和功能的研究,即天然氨基酸的化学特性限制了这 些研究。例如,数量有限的天然反应活性R-基团限制了制备高度靶向的蛋白质修饰而排除蛋白质中其它氨基酸的能力。[0008]涉及蛋白质的化学选择性连接反应对于各种目的至关重要,包括但不限于研究蛋白质-蛋白质相互作用和细胞信号传导以及产生新型蛋白治疗剂。本领域目前使用的大多数选择性蛋白质修饰反应涉及在亲核和亲电子反应伴侣之间形成靶向蛋白质氨基酸侧链中天然亲核残基的共价键,例如,α-卤代酮与组氨酸或半胱氨酸侧链的反应。在这些情况中,选择性由蛋白质中亲核残基的数目和可接近性决定。不幸的是,天然蛋白质通常含有定位不佳的(例如,不可接近的)反应位点或多个反应靶点(例如,赖氨酸、组氨酸和半胱氨酸残基),从而导致修饰反应的选择性不佳、难以利用亲核/亲电子试剂进行高度靶向的蛋白质修饰。此外,修饰位点通常局限于赖氨酸、组氨酸或半胱氨酸的天然亲核侧链。难以或不可能在其它位点进行修饰。[0009]本领域需要为修饰和研究蛋白质结构和功能而将非天然氨基酸掺入蛋白质的新方案,其中所述非天然氨基酸具有新型反应化学特性或其它特性,例如,未在天然氨基酸中发现的生物学特性。本领域急需开发能以高度选择性方式修饰蛋白质而且能在生理条件下修饰蛋白质的蛋白质修饰反应新方案。本领域需要产生蛋白质修饰的新方法,其中所述修饰是高度特异性的,例如没有天然氨基酸发生交叉反应或副反应的修饰。高度特异性蛋白质修饰方案的新型化学方法可应用于蛋白质结构和功能研究以及制备治疗性蛋白质的各领域。[0010]蛋白质脂化[0011]蛋白质脂化是参与蛋白质定位、正确胞内蛋白质运输和蛋白质-蛋白质相互作用的关键翻译后修饰。蛋白质脂化常是正确的生物学活性所需。该特征对于开发一些治疗性蛋白质而言至关重要。脂化对于研究蛋白质-蛋白质相互作用和细胞信号传导也至关重要。不幸的是,利用天然未脂化形式的蛋白质进行体外化学选择性连接以产生脂化蛋白质极其困难,一般仅限于修饰独特的表面暴露半胱氨酸残基。[0012]许多细胞蛋白质的生物学活性需要与细胞膜结合,这取决于半胱氨酸通过脂质残基,例如法尼基、肉豆蘧酰基和棕榈酰基部分的翻译后修饰(Chernomordik和 Kozlov(2003), Annual Review of Biochemistry72 :175-207)。例如,许多 G-蛋白偶联受体是棕榈酰化的。Ras蛋白是法尼基化和棕榈酰化的(Chernomordik和Kozlov(2003), Annual Review of Biochemistry72 :175-207)。虽然蛋白质法尼基化是稳定而不可逆的修饰,但棕榈酰化是可逆的,从而能动态调节蛋白质功能和特异性靶向细胞膜(Rocks等, (2005),Science307 (5716) :1746-1752)。此外,Y -羧基谷氨酸是凝血连锁中钙依赖性膜附着至关重要的必需修饰(Davie 等,(1991), Biochemistry30 (43) : 10363-10370)。[0013]|H交翻译系统[0014]克服遗传密码有限的局限性的一种方法是扩大遗传密码并将具有新型反应特性的氨基酸加入生物库(biological repertoire)中。现已开发了在原核和真核生物内将各种非天然氨基酸体内位点特异性地掺入蛋白质的通用方法。这些方法依赖于在体内多肽翻译期间识别合适的选择者密码子而将所需非天然氨基酸插入规定位置的正交蛋白质翻译组分。这些方法利用识别选择者密码子的正交tRNA (Ο-tRNA),进而相应的特异性正交氨酰基-tRNA合成酶(O-RS)用非天然氨基酸加载该Ο-tRNA。这些组分不与宿主生物中任何内源性tRNA、RS、氨基酸或密码子交叉反应(即,它必须是正交的)。利用这种正交tRNA-RS 配对能遗传学编码大量结构上有差异的氨基酸。[0015]适于制备含一个或多个非天然氨基酸的蛋白质的正交翻译系统的实施是本领域公知的,例如产生正交翻译系统的通用方法。例如,参见国际公开号W02002/086075, 名为“产生正交tRNA-氨酰基-tRNA合成酶配对的方法和组合物”(METHODS AND COMPOSITION FOR THE PRODUCTION 0F0RTH0G0NAL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS) ;W02002/085923,名为“非天然氨基酸的体内掺入”(IN VIVO INC0RP0RATI0N0F UNNATURAL AMINO ACIDS) ;W02004/094593,名为“扩展真核生物遗传密码” (EXPANDING THE EUKARYOTIC GENETIC CODE) ;W02005/019415,2004 年 7 月 7 日提交;W02005/007870,2004 年 7 月 7 日提交;W02005/007624,2004 年 7 月 7 日提交和 W02006/110182,2005 年 10 月 27日提交,名为“用于体内掺入非天然氨基酸的正交翻译组分”(ORTHOGONAL TRANSLATION COMPONENTS FOR THE IN VIVOINCORPORATION OF UNNATURAL AMINO ACIDS)。这些申请各自通过引用全文纳入本文。掺入非天然氨基酸的正交翻译系统及其产生和使用方法的其 它讨论还可参见 Wang 和 Schultz, “扩展遗传密码”(Expanding theGenetic Code), Chem. Commun. (Camb. )1:1-11(2002) ;Wang和 Schultz,“扩展遗传密码"(Expanding the Genetic Code), Angewandte Chemie Int. Ed, 44 (I) :34-66 (2005) ;Xie 和 Schultz, “扩展遗传密石马,,(An Expanding GeneticCode),Methods36 (3) :227-238(2005) ;Xie 和 Schultz,“扩展的遗传密码”(An Expanding Genetic Code),Methods36 (3) :227-238 (2005) ;Xie和 Schultz,“将氨基酸加入遗传库”(Adding Amino Acids to the Genetic Repertoire) ,Curr. Opinion in Chemical Biology9 (6) :548-554(2005) ;Wang 等,“扩展遗传密码子”(Expanding the Genetic Code),Annu. Rev. Biophys. Biomol. Struct. ,35 :225-249(2006) ;Xie 和 Schultz, “蛋白质的化学工具盒-扩展的遗传密码”(A Chemical Toolkit for Proteins-an Expanded Genetic Code), Nat. Rev. Mol. Cell Biol. ,7(10) :775-782 (2006)。[0016]本领域需要开发将非天然氨基酸掺入蛋白质的正交翻译组分,其中所述非天然氨基酸可掺入规定的位置,而所述非天然氨基酸具有的新化学特性能将该氨基酸作为特异性修饰(例如,脂化)的靶标从而能排除与蛋白质中其它位点的交叉反应或副反应。阅读下文后可明白本文所述发明满足了这些和其它需求。[0017]发明概述[0018]本发明提供在体内(例如在宿主细胞内)对选择者密码子(selector codon)如琥拍终止密码子起反应而将非天然氨基酸苯基硒代半胱氨酸(phenylselenocysteine)掺入延伸中的多肽链的组合物和方法。这些组合物包含不与宿主细胞翻译机制相互作用的正交-tRNA(Ο-tRNA)和正交氨酰基-tRNA合成酶(O-RS)配对。即,宿主细胞内源性氨酰基-tRNA合成酶不会用氨基酸(天然或非天然)加载Ο-tRNA。类似地,本发明提供的O-RS 不以显著水平或者某些情况下不以可检测水平地用氨基酸(天然或非天然)加载内源性 tRNA。这些新组合物能够产生含有翻译掺入的非天然氨基酸的大量蛋白质。苯基硒代半胱氨酸非天然氨基酸的化学特性还允许靶向修饰该残基,从而能产生所需偶联物,例如但不限于脂质偶联物。这些特异性修饰的蛋白质可用作治疗剂或用于生物医学研究。在一些方面,本发明提供翻译系统。这些系统包含第一正交氨酰-tRNA合成酶 (O-RS)、第一正交tRNA (Ο-tRNA)和第一非天然氨基酸,即苯基硒代半胱氨酸,其中所述第一 O-RS用所述第一非天然氨基酸,苯基硒代半胱氨酸优先氨酰化所述第一 Ο-tRNA。在一些方面,O-RS用所述苯基硒代半胱氨酸优先氨酰化Ο-tRNA的效率至少为含有相同Ο-tRNA、苯基硒代半胱氨酸和含有SEQ ID NO :4、6或8所示氨基酸序列的氨酰基-tRNA合成酶的翻译系统所观察到的效率的50 %。[0020]该翻译系统可使用衍生自各种来源的组分。在一个实施方式中,用于该系统的 O-RS可包含SEQ ID NO :4、6或8所示氨基酸序列及该序列的保守变体。在一些实施方式中,Ο-tRNA是琥珀抑制型tRNA。在一些实施方式中,Ο-tRNA包含SEQ ID NO 1所示(多核苷酸序列)或由其编码。[0021]在一些方面,翻译系统还包含编码感兴趣蛋白质的核酸,其中所述核酸具有 Ο-tRNA识别的至少一个选择者密码子。[0022]在一些方面,翻译系统包含利用第二非天然氨基酸的第二正交对(即第二 O-RS和第二Ο-tRNA),现在该系统能在多肽的不同所选位置掺入至少两个不同的非天然氨基酸。在这种双重系统中,第二 O-RS用不同于第一非天然氨基酸的第二非天然氨基酸优先氨酰化第二 Ο-tRNA,而第二 Ο-tRNA识别不同于第一 Ο-tRNA识别的选择者密码子的选择者密码子。[0023]在一些实施方式中,翻译系统位于宿主细胞中(包括该宿主细胞)。所用的宿主细胞不作具体限定,只要O-RS和Ο-tRNA在它们的宿主细胞环境中保留它们的正交性即可。所述宿主细胞可以是真细菌细胞如大肠杆菌。所述宿主细胞可含有一种或多种编码包括O-RS 或Ο-tRNA在内的翻译系统组分的多核苷酸。在一些实施方式中,编码O-RS的多核苷酸包含SEQ IDNO :5、7或9所示核苷酸序列。[0024]本发明还提供产生在所选位置含有一个或多个非天然氨基酸的蛋白质的方法。这些方法利用上述翻译系统。这些方法通常始于提供含有以下组分的翻译系统的步骤(i) 第一非天然氨基酸,即苯基硒代半胱氨酸;(ii)第一正交氨酰基-tRNA合成酶(O-RS); (iii)第一正交tRNA (Ο-tRNA),其中所述O-RS用所述非天然氨基酸优先氨酰化所述 Ο-tRNA;和(iv)编码蛋白质的核酸,其中所述核酸含有Ο-tRNA识别的至少一个选择者密码子(任选琥珀密码子)。然后在所述蛋白质的翻译过程中该方法对选择者密码子起反应而将所述非天然氨基酸掺入所述蛋白质的所选位置,从而产生在所选位置含有所述非天然氨基酸的蛋白质。在这些方法的一些方面,所述O-RS用苯基硒代半胱氨酸优先氨酰化所述 Ο-tRNA的效率至少为含有相同Ο-tRNA、苯基硒代半胱氨酸和含有SEQ ID N0:4、6或8所示氨基酸序列的氨酰基-tRNA合成酶的翻译系统所观察到效率的50%。在一些方面,翻译系统包含编码O-RS的核酸。[0025]可利用各种试剂广泛实施这些方法。在一些实施方式中,提供编码O-RS的多核苷酸。在一些实施方式中,所述O-RS含有SEQ ID NO :4、6或8所示氨基酸序列或及其保守变体。这些方法所用的翻译系统包含编码O-RS的核酸,例如SEQ ID N0:5、7或9所示的核酸。[0026]在这些方法的一些实施方式中,提供翻译系统的步骤包括通过定点诱变使野生型氨酰基-tRNA合成酶的氨基酸结合口袋发生突变,选择用所述非天然氨基酸优先氨酰化所述Ο-tRNA的所得0-RS。所述选择步骤包括定点诱变后从得到的氨酰基-tRNA合成酶分子库进行所述O-RS的正选择和负选择。在一些实施方式中,提供步骤提供编码Ο-tRNA的多核苷酸,例如,Ο-tRNA是琥珀抑制型tRNA,或者Ο-tRNA包含SEQ ID NO :1所示多核苷酸序列或由其编码。在这些方法中,提供步骤还包括提供含有翻译系统所用的琥珀选择者密码子的核酸。[0027]还可改进这些方法以在蛋白质中掺入一个以上非天然氨基酸。在那些方法中,联用第二正交翻译系统与第一翻译系统,其中第二系统具有不同的氨基酸和选择者密码子特异性。例如,提供步骤可包括提供第二 O-RS和第二 Ο-tRNA,其中第二 O-RS用不同于第一非天然氨基酸的第二非天然氨基酸优先氨酰化第二 Ο-tRNA,且第二 Ο-tRNA识别核酸中不同于第一 Ο-tRNA识别的选择者密码子的选择者密码子。[0028]还可在宿主细胞内实施产生含非天然氨基酸的蛋白质的方法。在这些情况中,提供的宿主细胞含有非天然氨基酸、0-RS、0-tRNA和含至少一个选择者密码子的核酸,而培养该宿主细胞可导致非天然氨基酸的掺入。在一些实施方式中,提供步骤包括提供真细菌宿主细胞(例如,大肠杆菌)。在一些实施方式中,提供步骤包括提供含有编码O-RS的多核苷酸的宿主细胞。例如,编码O-RS的多核苷酸可包含SEQ ID N0:5、7或9所示的核苷酸序列。[0029]在这些方法的一些改进形式中,所述流程还包括将苯基硒代半胱氨酸掺入多肽后对其进行修饰。例如,所述苯基硒代半胱氨酸可在某些条件下反应从而导致在所选位置转化成脱氢丙氨酸。该反应可以通过氧化消除进行。可通过使苯基硒代半胱氨酸与过氧化氢接触进行该反应。[0030]本发明还提供产生脂化蛋白质的方法,其中所述脂质偶联于指定的所选位置。这些方法利用上述翻译系统。这些方法通常始于提供含有以下组分的翻译系统的步骤 (i)苯基硒代半胱氨酸非天然氨基酸;(ii)正交氨酰基-tRNA合成酶(O-RS) ;(iii)正交 tRNA (Ο-tRNA),其中所述O-RS用所述苯基硒代半胱氨酸优先氨酰化所述Ο-tRNA ;和(iv) 编码蛋白质的核酸,其中所述核酸含有Ο-tRNA识别的至少一个选择者密码子(任选琥珀密码子)。然后在所述蛋白质的翻译过程中该方法对选择者密码子起反应而将所述苯基硒代半胱氨酸掺入所述蛋白质的所选位置。然后该苯基硒代半胱氨酸经反应而在所选位置产生脱氢丙氨酸,其自身进而与脂质反应以产生脂化氨基酸部分,从而产生在蛋白质的所选位置含有脂质的蛋白质。[0031]在这些方法的一些方面,通过氧化消除或与过氧化氢接触使得苯基硒代半胱氨酸反应。在一些方面,与脱氢丙氨酸反应的偶联脂质可以是硫代棕榈酸、法尼基硫醇 (farnesyImercaptan)或1-十六烧硫醇(hexadecanethiol)。如此形成的脂化氨基酸是棕榈酰基半胱氨酸、法尼基半胱氨酸和S-十六烧基半胱氨酸(hexadecylcysteine)。一般通过迈克尔加成反应进行脱氢丙氨酸的修饰。[0032]本发明还提供产生在所选位置具有脱氢丙氨酸的蛋白质的方法。这些方法利用上述翻译系统。这些方法通常始于提供含有以下组分的翻译系统的步骤(i)苯基硒代半胱氨酸非天然氨基酸;( )正交氨酰基-tRNA合成酶(O-RS) ; (iii)正交tRNA (Ο-tRNA),其中所述O-RS用所述苯基硒代半胱氨酸优先氨酰化所述Ο-tRNA ;和(iv)编码蛋白质的核酸, 其中所述核酸含有Ο-tRNA识别的至少一个选择者密码子(任选琥珀密码子)。然后在所述蛋白质的翻译过程中该方法对选择者密码子起反应而将所述苯基硒代半胱氨酸掺入所述蛋白质的所选位置。然后该苯基硒代半胱氨酸经反应而在所选位置产生脱氢丙氨酸。在这些方法的一些方面,通过氧化消除或与过氧化氢接触使得苯基硒代半胱氨酸反应。[0033]本发明还提供各种包含核酸和蛋白质的各种组合物。除了组合物含有所述核酸或蛋白质外,对该组合物的性质不作具体限制。本发明组合物可含有任何数量的任何性质的其它组分。例如,本发明提供含有O-RS多肽的组合物,其中所述多肽含有SEQ IDNO :4、6或 8所示氨基酸序列或其保守变体。在一些方面,所述保守变体多肽用非天然氨基酸氨酰化关联(cognate)正交tRNA(0_tRNA)的效率至少为含有该Ο-tRNA、该非天然氨基酸和含有 SEQ ID NO :4、6或8所示氨基酸序列的氨酰基-tRNA合成酶的翻译系统所观察到的效率的 50%。本发明还提供编码上述任何多肽的多核苷酸。在一些实施方式中,这些多核苷酸可含有SEQ ID NO :5、7或9所示核苷酸序列。在一些实施方式中,多肽在细胞中。[0035]本发明还提供含有SEQ ID NO :5、7或9所示核苷酸序列的多核苷酸组合物。在一些实施方式中,本发明提供含有所述多核苷酸的载体,如表达载体。在一些实施方式中,本发明提供含有上述载体的细胞。[0036]定义[0037]在详细描述本发明前,应该知道本发明不局限于具体的生物系统,本发明当然可以有各种变化。还应知道本文所用的术语只是为了描述具体的实施方式,而非限制性的。除非另有明确指出,本说明书和随附的权利要求
书中使用的单数形式“一个”、“一种”和“该” 也包括复数对象。因此,例如述及“一个细胞”包括两个或多个细胞的组合;“一个多核苷酸”实际上包括该多核苷酸的多份拷贝。[0038]除了此处和说明书以下其余部分所定义的,本文所用的所有技术和科学术语都与本发明所属领域普通技术人员常规理解的意义相同。[0039]正交:本文所用的术语“正交”指与某细胞或翻译系统的内源性相应分子相比,某分子(例如,正交tRNA (Ο-tRNA)和/或正交氨酰tRNA合成酶(O-RS))与该细胞内源性组分起作用的效率降低,或不能与该细胞的内源性组分起作用。就tRNA和氨酰-tRNA合成酶而言,正交指与和内源性tRNA合成酶起作用的内源性tRNA相比,正交tRNA不能与内源性 tRNA合成酶起作用或起作用的效率降低;或者与和内源性tRNA起作用的内源性tRNA合成酶相比,正交氨酰tRNA合成酶与内源性tRNA不起作用或起作用的效率降低,所述效率降低例如,小于20%的效率,小于10%的效率,小于5%的效率,或小于I %的效率。正交分子缺乏细胞中功能正常的内源性互补分子。例如,与内源性RS氨酰化内源性tRNA相比,细胞的任何内源性RS氨酰化细胞中正交tRNA的效率降低或者甚至为O。在另一例子中,与内源性RS氨酰化内源性tRNA相比,正交RS氨酰化感兴趣细胞中任何内源性tRNA的效率降低或者降为O。可将能与第一正交分子起作用的第二正交分子引入细胞。例如,正交tRNA/RS 配对包括引入的互补组份,与对照,例如相应的tRNA/RS内源性配对或活性正交配对(如酪氨酰正交tRNA/RS配对)相比,它们在细胞中共同起作用的效率是,例如45%效率、50%效率、60%效率、70%效率、75%效率、80%效率、90%效率、95%效率或99%效率,或更高。[0040][H交酪氨酰-tRNA :本文所用的正交酪氨酰-tRNA (酪氨酰_0_tRNA)是与感兴趣翻译系统正交的tRNA,其中所述tRNA是(I)与天然酪氨酰-tRNA相同或基本类似;(2)通过天然或人工诱变衍生自天然酪氨酰tRNA; (3)由考虑了(I)或(2)的野生型或突变型酪氨酰tRNA序列的任何方法产生;(4)与野生型或突变型酪氨酰tRNA同源;(5)与图2中称为酪氨酰tRNA合成酶底物的任何示例性tRNA同源;或¢)图2中称为酪氨酰tRNA合成酶底物的任何示例性tRNA的保守变体。酪氨酰tRNA可加载有氨基酸,或处于非负载状态。 还应知道“酪氨酰-Ο-tRNA”任选被关联(cognate)合成酶分别加载(氨酰化)除酪氨酸以外的氨基酸,例如非天然氨基酸。应该知道,实际上优选利用本发明酪氨酰-Ο-tRNA在翻译期间对选择者密码子起反应而基本上可将任何氨基酸(无论天然或人工的)掺入延伸的多肽内。[0041]ιΗ交酪氨酰氨基酸合成酶:本文所用的正交酪氨酰氨基酸合成酶(酪氨酰-0-RS) 是在感兴趣翻译系统内用氨基酸优先氨酰化酪氨酰-Ο-tRNA的合成酶。酪氨酰-O-RS加载到酪氨酰-Ο-tRNA上的氨基酸可以是任何氨基酸,无论是天然的还是人工的,并且不限于本文所述的。该合成酶任选与天然酪氨酰氨基酸合成酶相同或同源,或者与图2中称为 O-RS的合成酶相同或同源。例如,所述O-RS可以是图2的酪氨酰-O-RS的保守变体,和/ 或与图2中O-RS的序列至少有50%、60%、70%、80%、90%、95%、98%、99%或以上相同。[0042]关联(CORnate):术语“关联”指共同起作用的组分,例如正交tRNA和正交氨酰基-tRNA合成酶。这些组分也可互称为“互补的”。[0043]优先氨酿化:对于本文所用正交翻译系统而言,当某表达系统中O-RS使Ο-tRNA带上氨基酸的效率高于其使任何内源性tRNA带上氨基酸的效率时,该O-RS “优先氨酰化”关联Ο-tRNA。即,当翻译系统中存在摩尔比大致相等的Ο-tRNA与任何给定的内源性tRNA时, O-RS使Ο-tRNA带上氨基酸的频率高于它使内源性tRNA带上氨基酸的频率。当翻译系统中存在等摩尔浓度的Ο-tRNA与内源性tRNA时,由O-RS加载的Ο-tRNA与由O-RS加载的内源性tRNA的相对比例优选较高,最好导致O-RS仅加载或几乎仅加载Ο-tRNA。当存在等摩尔浓度的Ο-tRNA与O-RS时,由O-RS加载的Ο-tRNA与由O-RS加载的内源性tRNA的相对比例大于1:1,优选至少约2:1,更优选5:1,更优选10:1,更优选20:1,更优选50:1,更优选 75:1,更优选95:1、98:1、99:1、100:1、500:1、1,000:1、5,000:1 或更高。[0044]当(a)与内源性tRNA相比,O-RS优先氨酰化Ο-tRNA,和(b)与O-RS用任何天然氨基酸氨酰化Ο-tRNA相比,氨酰化对非天然氨基酸特异时,O-RS “用非天然氨基酸优先氨酰化Ο-tRNA”。即,当包含O-RS和Ο-tRNA的翻译系统中存在等摩尔量的非天然和天然氨基酸时,O-RS用非天然氨基酸加载Ο-tRNA的频率高于加载天然氨基酸的频率。加载有非天然氨基酸的Ο-tRNA与加载有天然氨基酸的Ο-tRNA的相对比例优选较高。O-RS最好使0-tRNA 仅仅加载,或者几乎仅仅加载有非天然氨基酸。当翻译系统中存在等摩尔浓度的天然和非天然氨基酸时,使Ο-tRNA带上非天然氨基酸与使Ο-tRNA带上天然氨基酸的相对比例大于 1:1,优选至少约2:1,更优选5:1,更优选10:1,更优选20:1,更优选50:1,更优选75:1,更优选95:1、98:1、99:1、100:1、500:1、1,000:1、5,000:1 或更高。[0045]选择者密码子:术语“选择者密码子”指翻译过程中为Ο-tRNA所识别而不为内源性tRNA所识别的密码子。Ο-tRNA反密码子环识别mRNA上的选择者密码子并在多肽的此位置掺入其氨基酸,例如非天然氨基酸。选择者密码子可包括,例如无义密码子,如终止密码子(如,琥拍、赭石和乳白密码子);四碱基或四碱基以上密码子;罕用密码子;衍生自天然或非天然碱基对的密码子,等等。[0046]抑制型tRNA :抑制型tRNA是在多肽翻译期间通常对终止密码子起反应而掺入氨基酸(即,“连读”)来改变给定的翻译系统中信使RNA (mRNA)阅读的tRNA。在一些方面,本发明的选择者密码子是抑制型密码子,例如,终止密码子(如,琥珀、赭石和乳白密码子)、 四碱基密码子、罕用密码子等。[0047]抑制活件:本文所用的术语“抑制活性”总体上指tRNA(例如,抑制型tRNA)能翻译连读在其它情况中可导致翻译终止或错译(例如,移码)的密码子(例如,作为选择者密码子的琥珀密码子或四个或以上个碱基的密码子)的能力。抑制型tRNA的抑制活性可表示为与第二抑制型tRNA,或与对照系统,例如缺乏O-RS的对照系统相比,观察到的翻译连读活性的百分比。[0048]本发明提供定量测定抑制活性的各种方法。具体Ο-tRNA和O-RS对感兴趣选择者密码子(例如,琥珀密码子)的抑制百分比指,在感兴趣的翻译系统中,在编码表达测试标记的核酸中含有选择者密码子的给定表达测试标记(例如,LacZ)的活性与阳性对照构建物相比的百分比,所述感兴趣的翻译系统包含O-RS和Ο-tRNA,所述阳性对照没有0-tRNA、 O-RS和选择者密码子。因此,例如,如果在给定翻译系统中观察到不含选择者密码子的活性阳性对照标记构建物的活性为X (其单位与所述标记试验相关),则含有选择者密码子的测试构建物的抑制百分比是在与阳性对照标记的表达基本相同的环境条件下(除了该测试标记构建物在也含有Ο-tRNA和O-RS的翻译系统中表达外),该测试标记构建物显示的X百分比。表达该测试标记的翻译系统一般也包含O-RS和Ο-tRNA识别的氨基酸。可任选通过将测试标记与“背景”或“阴性”对照标记构建物比较来校正抑制百分比的测量值,所述“背景”或“阴性”对照标记构建物含有与测试标记相同的选择者密码子,但其所在的系统不含 0-tRNA,0-RS和/或Ο-tRNA和/或O-RS识别的相关氨基酸。该阴性对照可用于标准化抑制百分比测定值以补偿感兴趣的翻译系统中标记的背景信号的影响。[0049]可通过本领域已知的许多试验测定抑制效率。例如,可采用半乳糖苷酶报道试验,如可将衍生的IacZ质粒(该构建物在IacZ核酸序列中含有选择者密码子)连同含有本发明的Ο-tRNA的质粒引入合适生物(例如,可利用正交组分的生物)的细胞。还可引入关联合成酶(可以是多肽或表达时能编码该关联合成酶的多核苷酸)。细胞在培养基中生长至所需密度,例如至0D_约为O. 5,进行β -半乳糖苷酶试验,例如用诺瓦金公司 (Novagen)的BetaFluor β -半乳糖苷酶试验试剂盒。可将抑制百分比计算为样品相对于可比较对照,例如,衍生的IacZ构建物的观察值的活性百分比,该衍生的IacZ构建物在所需位置具有相应的有义密码子而非选择者密码子。[0050]翻译系统:术语“翻译系统”指将氨基酸掺入延伸中的多肽链(蛋白质)的各组分。 翻译系统的组分可包括,例如核糖体、tRNA、合成酶、mRNA等。本发明的Ο-tRNA和/或O-RS 可加入体外或体内翻译系统或是其一部分,例如存在于非真核细胞,如细菌(如大肠杆菌) 中,或存在于真核细胞中,如酵母菌、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞等。[0051]非天然氨基酸:本文所用的术语“非天然氨基酸”指不在20种常见天然氨基酸之列的任何氨基酸,修饰的氨基酸和/或氨基酸类似物。例如,本发明可使用非天然氨基酸苯基硒代半胱氨酸(参见
图1,结构I)。[0052]衍生自:本文所用的术语“衍生自”指分离自特定分子或生物,或是用特定分子或生物的信息制得的某组份。例如,衍生自第二多肽的多肽含有与该第二多肽的氨基酸序列相同或基本上类似的氨基酸序列。以多肽为例,可通过,例如天然产生的诱变、人工定向诱变 或人工随机诱变获得衍生的种类。用于衍生多肽的诱变可以是有意定向或有意随机的, 或混用两种方法。诱变多肽以产生衍生自第一(多肽)的不同多肽可以是随机的(例如, 聚合酶失真所致),看通过合适的筛选方法,例如本文所述的方法鉴定衍生的多肽。诱变多肽通常需要对编码该多肽的多核苷酸进行操作。[0053]IH选择或筛选标记:本文所用的术语“正选择或筛选标记”指当存在该标记时(例如被表达或激活等)可从不具有特征的细胞中鉴定出具有特征的细胞,例如具有正选择标记的细胞。[0054]负选择或筛选标记:本文所用的术语“负选择或筛选标记”指当存在该标记时(例如被表达或激活等)可鉴定不含有所选特性或特征的细胞(例如,与确实具有该特性或特征的细胞相比)。[0055]报道分子:本文所用的术语“报道分子”是指可用于鉴定和/或选择感兴趣系统的靶组分的组分。例如,报道分子可以包括蛋白质,如能赋予抗生素抗性或敏感性的酶(如 β -内酰胺酶、氯霉素乙酰转移酶(CAT)等)、荧光筛选标记(如绿色荧光蛋白(如GFP)、 YFP、EGFP, RFP等)、冷光标记(如萤火虫萤光素酶蛋白)、亲和力筛选标记,或者可选择的正或负标记基因如lacZ、β -gal/lacZ ( β -半乳糖苷酶)、ADH(乙醇脱氢酶)、his3、ura3、 leu2、lys2 等。[0056]真核生物本文所用的术语“真核生物”指属于真核生物界(KingdomEucarya)的生物。真核生物通常因其以下特征而区别于原核生物典型的多细胞组织(但不都是多细胞,例如酵母),存在膜限制的核与其它膜限制的细胞器,线形遗传物质(即,线形染色体),不存在操纵子,存在内含子、信使(RNA)加帽和poly-A mRNA,以及其它生物化学特征,如不同的核糖体结构。真核生物包括,例如动物(如哺乳动物、昆虫、爬行动物、鸟等),纤毛虫·, 植物(如单子叶植物、双子叶植物、藻类等)、真菌、酵母菌、鞭毛虫类、微孢子虫、原生动物坐寸ο[0057]原核生物本文所用的术语“原核生物”指属于原核生物界(也称为原核生物 (Procarya))的生物。原核生物通常因其以下特征而区别于真核生物单细胞组织,通过出芽或分裂的无性生殖,缺乏膜限制的核与其它膜限制的细胞器,环状染色体,存在操纵子, 不存在内含子、信使(RNA)加帽和poly-A mRNA,以及其它生物化学特征,如不同的核糖体结构。原核生物包括真细菌和古细菌(Archaea)(有时称为“古细菌(Archaebacteria) ”) 亚界。在原核生物界有时将蓝细菌(蓝绿藻)与支原体分为不同类别。[0058]迦童:本文所用的术语“细菌”和“真细菌”指不同于古细菌的原核生物。类似地, 古细菌指不同于真细菌的原核生物。可根据许多形态和生物化学标准区分真细菌和古细菌。例如,可采用核糖体RNA序列、RNA聚合酶结构的差异,存在或不存在内含子,抗生素敏感性,存在或不存在细胞壁肽聚糖和其它细胞壁组分,膜脂质的分枝与不分枝结构,存在/ 不存在组蛋白和组蛋白样蛋白而将某生物指定为真细菌或古细菌。[0059]真细菌的例子包括大肠杆菌(Escherichia coli)、嗜热栖热菌 (Thermusthermophilus)、枯草芽抱杆菌(Bacillus subtilis)和嗜热脂肪芽抱杆菌(Bacillusstearothermophilus)等)。古细菌的例子包括詹氏甲烧球菌 (Methanococcusjannaschii)(Mj)> 梅氏甲烧八叠球菌(Methanosarcina mazei) (Mm)、嗜热喊甲烧杆菌(Methanobacteriurn thermoautotrophicum) (Mt)、海沼甲烧球菌(Methanococcus maripaludis)、甲烧嗜热菌(Methanopyrus kandleri)、盐细菌 (Halobacterium)(例如沃氏富盐菌(Haloferax volcanii)和盐细菌种NRC-1)、闪烁古生球菌(Archaeoglobus fulgidus) (Af)、激烈火球菌(Pyrococcus furiosus) (Pf)、极端嗜热古菌(Pyrococcus horikoshii) (Ph)、好氧火球菌(Pyrobaculum aerophilum)、Pyrococcus abyss1、硫横矿硫化叶菌(Sulfolobus solfataricus) (Ss)、Sulfolobustokodai1、嗜热泉生古细菌(Aeuropyrum pernix) (Ap)、嗜酸热原体(Thermoplasmaacidophilum)和火山热原体(Thermoplasma volcanium)。[0060]保守性变体就翻译组分而言,本文所用的术语“保守性变体”指在功能上类似于和该保守性变体相似的基本组分,例如Ο-tRNA或0-RS,但与参比Ο-tRNA或O-RS相比,序列中有变异的某翻译组份,例如保守性变体Ο-tRNA或保守性变体Ο-RS。例如,O-RS或该O-RS 的保守性变体可用苯基硒代半胱氨酸非天然氨基酸氨酰化关联Ο-tRNA。在该例子中,所述 O-RS及保守性变体O-RS的氨基酸序列不相同。所述保守性变体在序列中可具有例如一处变异、两处变异、三处变异、四处变异或五处或更多处变异,只要该保守性变体仍与关联的相应Ο-tRNA或O-RS互补(例如,与之起作用)。[0061 ] 在一些实施方式中,保守性变体O-RS与衍生其的O-RS相比,含有一个或多个保守性氨基酸取代。在一些实施方式中,保守性变体O-RS与衍生其的O-RS相比,含有一个或多个保守性氨基酸取代,此外还保留了 O-RS的生物学活性;例如,保守性变体O-RS保留了衍生其的亲本O-RS分子至少10%,或者至少20%,至少30%,或至少40%的生物学活性。在一些优选实施方式中,所述保守性变体O-RS保留了衍生其的亲本O-RS分子至少50%的生物学活性。保守性变体O-RS的保守性氨基酸取代可出现在该O-RS的任何结构域内,包括氨基酸结合口袋。[0062]选择或筛选试剂:本文所用的术语“选择或筛选试剂”指当其存在时可从某群体中选择/筛选某些组分的试剂。例如,选择或筛选试剂可以是但不限于,如营养物、抗生素、某波长的光、抗体、表达的多核苷酸等。选择试剂可根据例如浓度、强度等而不同。[0063]起反应:本文所用的术语“起反应”指本发明的Ο-tRNA识别选择者密码子并介导与该tRNA偶联的非天然氨基酸掺入延伸中的多肽链的过程。[0064]编遇:本文所用的术语“编码”指用多聚大分子或序列链中的信息来指导不同于该第一分子或序列链的第二种分子或序列链产生的任何过程。本文所用的该术语应用广泛, 可用于各领域。在一些方面,术语“编码”描述了半保留DNA复制的过程,其中双链DNA分子的一条链用作模板通过依赖DNA的DNA合成酶来编码新合成的互补姊妹链。[0065]在另一方面,术语“编過”指用一种分子的信息来指导产生化学性质不同于该第一分子的第二种分子的任何过程。例如,DNA分子可编码RNA分子(例如,通过依赖DNA的 RNA聚合酶参与的转录过程)。RNA分子也可编码多肽,例如翻译过程。当术语“编码”用于描述翻译过程时,其含义也延伸至编码氨基酸的三联密码子。在一些方面,RNA分子可编码 DNA分子,例如通过依赖RNA的DNA合成酶参与的逆转录过程。在另一方面,DNA分子可编码多肽,应该知道该情况用“编码”同时包括转录和翻译过程。[0066]附图简述图1提供非天然氨基酸苯基硒代半胱氨酸的化学结构(结构I)以及可从苯基硒代半胱氨酸衍生的结构。这些结构包括脱氢丙氨酸(2)、棕榈酰基半胱氨酸(3)、法尼基半胱氨酸(4)、S-十六烷基半胱氨酸(5)和Y -羧基谷氨酸(6)。[0068]图2提供本发明可用的各种核苷酸好氨基酸序列。[0069]发明详述[0070]本发明提供因20种天然氨基酸而受限的使用翻译系统固有局限性的解决方案。 所述解决方案包括涉及利用正交翻译系统将非天然氨基酸苯基硒代半胱氨酸(图1,结构 I)编程性、位点特异性生物合成掺入蛋白质的组合物和方法。通过工程改造编码感兴趣蛋白质的多核苷酸序列,使之含有选择者密码子从而将苯基硒代半胱氨酸编程性掺入蛋白质的任何所需位置,而所述选择者密码子能发出将非天然氨基酸掺入延伸中的多肽链的信号。[0071]本发明提供包含新型氨酰基-tRNA合成酶(O-RS)的新组合物,所述合成酶能用苯基硒代半胱氨酸加载合适的关联抑制型Ο-tRNA (例如,SEQ IDNO :1所示的Ο-tRNA)。这些 O-RS是能在细菌宿主细胞中用非天然氨基酸苯基硒代半胱氨酸选择性加载Ο-tRNA的詹氏甲烧球菌(Methanococcusjannaschii)酪氨酰-tRNA合成酶新型突变体。这些正交组分最优选不与宿主细胞(例如,大肠杆菌细胞)翻译机制的内源性宿主组分交叉反应。[0072]本发明O-RS可包括SEQ ID NO :4、6或8所示0-RS。本发明提供编码这些O-RS多肽的多核苷酸。本文还描述了开发能在真细菌中起作用而对选择者密码子起反应起作用, 从而位点特异性地掺入苯基硒代半胱氨酸非天然氨基酸的新型0-tRNA/0-RS配对的方法。[0073]本发明还提供对选择者密码子(例如,琥珀无义密码子,TAG)起反应而高度有效且位点特异性地将苯基硒代半胱氨酸(图1,结构I)掺入蛋白质(优选体内)的方法。这些新方法和组合物可用于,例如细菌宿主系统中。[0074]在一些情况中,在将苯基硒代半胱氨酸非天然氨基酸掺入多肽后,可对其进行特异性且区域选择性的修饰,如本文所述。由于苯基硒代基团的反应化学特性,可以极高选择性地修饰其所掺入的蛋白质。在一些情况中,苯基硒代半胱氨酸非天然氨基酸反应基团的优点是其对于体内系统完全是外来的,从而能提高反应选择性。在一些方面,可采用能在体外和体内进行涉及蛋白质的偶连反应并保留宿主细胞活力和/或蛋白质生物学活性的相对温和反应条件进行修饰反应。[0075]在一些方面,掺入的苯基硒代半胱氨酸部分经修饰,然后,例如通过偶连反应再次修饰该修饰产物。[0076]最终偶连于蛋白质中所选位置(对应于编码蛋白质的开放读框中的选择者密码子)的材料的性质不作具体限定,其可以使任何所需的实体,例如脂质、染料、荧光团、交联剂、糖衍生物、聚合物(例如,聚乙二醇的衍生物)、光交联剂、细胞毒性化合物、亲和力标记、生物素衍生物、树脂、小珠、第二蛋白质或多肽(或更多的)、一种或多种多核苷酸(例如,DNA、RNA等)、金属螯合剂、辅助因子、脂肪酸、碳水化合物等。[0077] 在一些方面,为演示(但不限于)本发明,本文内容描述了掺入模型蛋白质,例如肌红蛋白、人生长激素好GFP中的苯基硒代半胱氨酸非天然氨基酸部分。不是要将苯基硒代半胱氨酸非天然氨基酸的掺入局限于任何特定蛋白质。应该知道,可利用本发明的指导将苯基硒代半胱氨酸非天然氨基酸掺入感兴趣的任何所需蛋白质。产生包含一个好多个苯基硒代半胱氨酸非天然氨基酸(单独或与其它不同的非天然氨基酸组合)的蛋白质对于各种目的,例如用于治疗性蛋白质和研究目的是有利的。[0078]苯基砸代半胱氨酸的修饰[0079]在一些方面,本发明提供在将苯基硒代半胱氨酸氨基酸残基掺入多肽后对其进行修饰的方法。一种这样的修饰,例如氧化切割可有利地将苯基硒代半胱氨酸氨基酸残基转化成α,β -不饱和氨基酸脱氢丙氨酸(参见图1,结构2)。该脱氢丙氨酸非天然氨基酸也具有反应性,随后可对其进行修饰。[0080]本发明不应局限于苯基硒代半胱氨酸转化成脱氢丙氨酸的任何具体机制(例如, 氧化消除)或特定反应条件(例如,与过氧化氢接触)。本领域普通技术人员应该知道可等效用于本发明将苯基硒代半胱氨酸残基转化成脱氢丙氨酸的各种其它合适的机制和反应条件。[0081]脱氡丙氨酸的修饰[0082]在一些方面,本发明提供进一步修饰多肽中脱氢丙氨酸非天然氨基酸残基的方法。所述脱氢丙氨酸残基具有反应性,可在高度特异性修饰反应中作为靶标。这些方法尤其可用于形成脂质偶连物以产生脂化蛋白质。[0083]如本文所述,非天然氨基酸脱氢丙氨酸的迈克尔加成反应可产生具有编程性、位点特异性翻译后修饰的蛋白质。例如,脱氢丙氨酸与巯基-脂质反应可产生脂化蛋白质。例如,与硫代棕榈酸反应可产生棕榈酰基半胱氨酸(参见图1,结构3)、与法尼基硫醇反应可产生法尼基半胱氨酸(参见图1,结构4)、而与丙二酸(盐或酯)反应可产生Y-羧基谷氨酸(参见图1,结构6)。此外,与1-十六烷基硫醇反应看产生S-十六烷基半胱氨酸(参见图1,结构5)。[0084]虽然本说明书提供了这些实例,但应该知道本发明不限于修饰(偶连)脱氢丙氨酸的任何具体机制(例如,迈克尔加成途径)或特定试剂(巯基-脂质)。本领域普通技术人员知道其它各种合适的机制、反应条件好试剂可等效地用于本发明来修饰脱氢丙氨酸残基。实际上,修饰脱氢丙氨酸残基不限于脂质偶连,采用该偶连机制可将任何所需部分偶连于脱氢丙氨酸的位置。
IH交tRNA/氨酰基-tRNA合成酶技术[0086]理解与正交tRNA和正交氨酰-tRNA合成酶配对有关的活性有助于理解本发明的新型组合物和方法。为在遗传密码中加入额外的非天然氨基酸,需要含有氨酰基-tRNA合成酶和适当tRNA的新正交配对,它们可在宿主翻译机制中有效起作用,但对于所述翻译系统是“正交”的,这意味着它可不依赖于翻译系统的内源性合成酶和tRNA而起作用。正交配对的所需特征包括能解码或识别不由任何内源性tRNA解码的仅一种特定密码子(例如选择者密码子)的tRNA,和只能用一种特定非天然氨基酸优先氨酰化其关联tRNA(或“使之负载”)的氨酰基-tRNA合成酶。内源性合成酶通常不氨酰化Ο-tRNA。例如,在大肠杆菌宿主系统中,正交配对包括不与任何内源性tRNA(例如,大肠杆菌中有40种)交叉反应的氨酰基-tRNA合成酶和不被任何内源性合成酶(例如,大肠杆菌中有21种)氨酰化的正交 tRNA ο[0087]本领域已知适于制备含有一个或多个非天然氨基酸的蛋白质的正交翻译系统,例如制备正交翻译系统的通用方法。例如,可参见国际公开号W02002/086075,名为“产生正交tRNA-氨酰基-tRNA合成酶配对的方法和组合物”(METHODS AND COMPOSITIONS FOR THE PRODUCTION 0F0RTH0G0NAL tRNA-AMINOACYL-tRNA SYNTHETASE PAIRS) ;W02002/085923, 名为“非天然氨基酸的体内掺入”(IN VIVO INC0RP0RATI0N0F UNNATURAL AMINO ACIDS); W02004/094593,名为“扩展真核遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE); 2004 年 7 月 7 日提交的 W02005/019415 ;2004 年 7 月 7 日提交的 W02005/007870 ;2004 年7月7日提交的W02005/007624 ;和2005年10月27日提交的W02006/110182,名为 “用于体内掺入非天然氨基酸的正交翻译组分”(ORTHOGONAL TRANSLATI ON COMPONENTS FOR THE IN VIV0INC0RP0RATI0N OF UNNATURAL AMINO ACIDS)。这些出版物各自通过引用全文纳入本文。掺入非天然氨基酸的正交翻译系统和它们的产生及使用方法的讨论还可参见 Wang 和 Schultz, “扩展遗传密码”(Expanding theGenetic Code), Angewandte Chemie Int. Ed. ,44(I) :34-66(2005) ;Xie 和 Schultz, “扩展的遗传密码”(An Expanding Genetic Code),Methods36 (3) :227-238 (2005) ;Xie 和 Schultz,“将氨基酸加入遗传库,,(AddingAmino Acids to the Genetic Repertoire), Curr. Opinion in Chemical Biology9 (6) :548-554 ;Wang 等,“扩展遗传密码”(Expanding the Genetic Code), Annu. Rev. Biophys. Biomol. Struct. ,35 :225-249(2006) ;Ryu 和 Schultz,“在大肠杆菌中有效掺入非天然氨基酸,,(Efficient Incorporation of UnnaturalAmino Acids into Proteins in Escherichia coli), Nat. Methods (4) :263-265 (2006);这些文献的内容通过引用全文纳入本文。[0088]ιΗ交翻译系统[0089]正交翻译系统一般包括含有正交tRNA (Ο-tRNA)、正交氨酰基tRNA合成酶(O-RS) 和非天然氨基酸的细胞(可以是原核细胞,例如大肠杆菌),其中所述O-RS用非天然氨基酸氨酰化所述Ο-tRNA。本发明的正交配对可以包括Ο-tRNA,例如抑制型tRNA、移码tRNA等和关联0-RS。本发明的正交系统通常包含处于宿主细胞环境中或无宿主细胞的0-tRNA/0-RS 配对。除多组分系统外,本发明还提供各种新型组分,例如,新型正交氨酰基-tRNA合成酶多肽(例如,SEQ ID N0:4、6或8)和编码那些多肽的多核苷酸(例如,SEQ ID NO :5、7或 9)。[0090]当正交配对识别选择者密码子并对该选择者密码子起反应而加载氨基酸时,通常称该正交配对“抑制”该选择者密码子。即,翻译系统的(即,细胞的)内源性机制不识别的选择者密码子通常不被加载,从而阻断了多肽产生,否则可自核酸翻译该多肽。在正交配对系统中,O-RS用特定的非天然氨基酸氨酰化Ο-tRNA。加载的Ο-tRNA识别选择者密码子并抑制选择者密码子所致的翻译阻断。[0091]在一些方面,与包含本文序列表所示多核苷酸序列或由其编码的Ο-tRNA的抑制效率相比,本发明的Ο-tRNA识别选择者密码子并在有关联合成酶存在下对选择者密码子起反应而具有至少约,例如,45 %、50 %、60 %、75 %、80 %或90 %或更高的抑制效率。[0092]在一些实施方式中,联用O-RS和Ο-tRNA的抑制效率是缺乏O-RS的Ο-tRNA的抑制效率的约,例如5倍、10倍、15倍、20倍或25倍或更高。在一些方面,联用O-RS和Ο-tRNA的抑制效率是本文序列表所示正交合成酶配对的抑制效率的至少约,例如35%、40%、45%、 50%、60%、75%、80%或 90%或更高。[0093]宿主细胞利用0-tRNA/0-RS配对将非天然氨基酸掺入延伸中的多肽链,例如经由包含编码感兴趣多肽的多核苷酸的核酸,其中所述多核苷酸包含所述Ο-tRNA识别的选择者密码子。在某些优选方面,细胞 可包含一种或多种其它0-tRNA/0-RS配对,其中所述其它 O-RS用不同的非天然氨基酸加载所述其它Ο-tRNA。例如,Ο-tRNA之一可识别四碱基密码子,其它Ο-tRNA可识别终止密码子。或者,多个不同的终止密码子或多个不同的四碱基密码子可用于同一编码核酸。[0094]应注意,在一些实施方式中,细胞或其它翻译系统中可存在多个0-tRNA/0-RS配对,从而能将多个非天然氨基酸掺入多肽。例如,细胞还可包含额外的不同0-tRNA/0-RS配对和第二非天然氨基酸,其中该额外的Ο-tRNA识别第二选择者密码子,该额外的O-RS用该第二非天然氨基酸优先氨酰化该额外的0-RS。例如,包含0-tRNA/0-RS配对的细胞(其中所述Ο-tRNA识别,例如琥珀选择者密码子)还可包含第二正交配对,其中该第二 Ο-tRNA识别不同的选择者密码子,例如乳白密码子、四碱基密码子等。不同的正交配对优选衍生自不同来源,从而有助于识别不同的选择者密码子。[0095]在某些实施方式中,系统包含例如大肠杆菌细胞等细胞,这些细胞含有正交 tRNA (Ο-tRNA)、正交氨酰基tRNA合成酶(O-RS)、非天然氨基酸和包含编码感兴趣多肽的多核苷酸的核酸,其中所述多核苷酸包含所述Ο-tRNA识别的选择者密码子。翻译系统还可以是无细胞系统,例如与本文所述0-tRNA/0-RS配对和非天然氨基酸组合的各种市售可得 “体外”转录/翻译系统。[0096]Ο-tRNA和/或O-RS可以是天然产生的,或者可以是,例如天然tRNA和/或RS经突变衍生,例如,通过产生各种生物的tRNA文库和/或RS文库和/或采用各种可用的突变方案。例如,产生正交tRNA/氨酰基-tRNA合成酶配对的一种方案包括将,例如除宿主细胞外来源的异源(对宿主细胞而言)tRNA/合成酶配对输入宿主细胞。候选异源合成酶的特性包括,例如不加载任何宿主细胞tRNA,候选异源tRNA的特性包括,例如不被任何宿主细胞合成酶所氨酰化。此外,异源tRNA对于所有宿主细胞合成酶是正交的。产生正交配对的第二种方案包括产生用于筛选和/或选择Ο-tRNA或O-RS的突变体文库。也可联用这些方案。[0097]if 夺 tRNA (0-tRNA)[0098]本发明的正交tRNA (Ο-tRNA)优选在例如体内或体外介导将非天然氨基酸掺入蛋白质内,所述蛋白质由含选择者密码子的多核苷酸编码,而这种选择者密码子可被0-tRNA 识别。在某些实施方式中,与包含本文序列表中Ο-tRNA序列所示多核苷酸序列或由其编码的Ο-tRNA相比,本发明的Ο-tRNA在相关合成酶存在下,对选择者密码子起反应而具有至少 45%、50%、60%、75%、80%、90%或更高的抑制效率。[0099]可通过本领域已知的多种试验测定抑制效率。例如,可采用β半乳糖苷酶报道分子试验,例如,将衍生的IacZ质粒(该构建物含有选择者密码子和IacZ核酸序列)和含有本发明Ο-tRNA的质粒一起导入合适生物(如可利用正交组分的生物)的细胞内。还可导入关联合成酶(或者多肽或表达时可编码关联合成酶的多核苷酸)。将细胞在培养基内培养到所需密度,如0D600约O. 5时,米用例如诺瓦金公司(Novagen)的BetaFluor 0 -半乳糖苷酶检测试剂盒进行β半乳糖苷酶试验。抑制百分率可以计算为样品相对于可比较对照(如衍生的IacZ构建物的观察值)的活性百分数,所述构建物在所需位置上含有有义密码子而不是选择者密码子。本发明ο-tRNA的例子见本文序列表,例如参见图2和SEQ ID NO :1。本文内容还提供了设计其它等价Ο-tRNA的指导。在RNA分子(例如O-RSmRNA或Ο-tRNA分子)中,与给定序列(或对编码DNA而言反之亦然)或其互补序列相比,胸腺嘧啶(T)被尿嘧啶(U) 取代。还可存在碱基的其它修饰以大量产生功能等价分子。[0101]本发明还包括对应于本文具体ο-tRNA的ο-tRNA保守性变体。例如,Ο-tRNA保守性变体包括功能与具体(例如本文序列表中的)Ο-tRNA相似的,和因合适的自身互补性而保留了 tRNA的L-形结构但不具有与例如序列表或图2所示那些(序列)相同的序列并且最好也不是野生型tRNA分子的那些分子。[0102]含Ο-tRNA的组合物还可包含正交氨酰基-tRNA合成酶(O-RS),其中所述O-RS用非天然氨基酸优先氨酰化Ο-tRNA。在某些实施方式中,含有Ο-tRNA的组合物还可包含(例如体外或体内)翻译系统。细胞中也可存在含有编码感兴趣多肽的多核苷酸的核酸或这些物质中一个或多个的组合,其中所述多核苷酸含有Ο-tRNA能识别的选择者密码子。[0103]产生正交tRNA (Ο-tRNA)的方法也是本发明的特征之一。在本发明的某些实施方式中,可通过构建突变体文库来产生Ο-tRNA。突变体tRNA文库可用本领域已知的各种诱变技术构建。例如,可通过位点特异性突变、随机位点突变、同源重组、DNA改组或其它递归诱变(recursive mutagenesis)方法、嵌合体构建、或者这些技术的任何组合产生突变体 tRNA,例如 SEQID NO 1 所示 0-tRNA。[0104]也可将其它突变引入特定位置,例如tRNA的所需环或区域中一个或多个非保守位置、保守位置、一个或多个随机位置或者二者的组合位置,如反密码子环、接纳茎、D臂或环、可变环、TPC臂或环、tRNA分子的其它区域或其组合。tRNA中的突变通常包括使突变型tRNA文库内各成员的反密码子环突变以使其能识别选择者密码子。该方法还可包括给Ο-tRNA加上额外序列。与起始材料(例如多种tRNA序列)相比,Ο-tRNA通常提高了对所需生物的正交性,同时保留其对所需RS的亲和力。[0105]这些方法任选包括分析tRNA和/或氨酰基-tRNA合成酶序列的相似性(和/或所推断的同源性)以确定显示与特定生物正交的潜在候选0-tRNA、0-RS和/或其配对。可利用本领域已知和本文所述的计算机程序进行这种分析,例如可用BLAST和pileup程序。 在一个实施例中,为筛选用于大肠杆菌的可能的正交翻译组分,可选择与真细菌生物不显示接近的序列相似性的合成酶和/或tRNA。[0106]通常可通过,例如负选择第一物种的细胞群以获得Ο-tRNA,其中所述细胞含有多种潜在Ο-tRNA的某成员。负选择可去除含有被细胞内源性氨酰基-tRNA合成酶(RS)氨酰化的潜在Ο-tRNA文库某成员的细胞。这样就可以得到第一物种细胞的正交tRNA库。[0107]某些实施方式在负选择中将选择者密码子引入编码负选择标记(例如能赋予抗生素抗性的酶如β内酰胺酶;能得到可检测产物的酶如β半乳糖苷酶、氯霉素乙酰转移酶 (CAT),所述产物例如是毒性产物,如芽孢杆菌RNA酶)的多核苷酸的非必须位置(例如,仍能产生功能性芽孢杆菌RNA酶)等。还任选在有选择性试剂(比如抗生素,如氨苄青霉素) 存在下培养细胞群来进行筛选/选择。在一个实施方式中,选择性试剂的浓度不同。[0108]例如,为检测抑制型tRNA的活性,可利用基于选择者密码子的体内抑制的选择系统,例如将无义(如终止)或移码突变引入编码负选择标记的多核苷酸(如编码β半乳糖苷酶的基因(bla))中。例如,构建在某位置(如,A184)含有选择者密码子的多核苷酸变体,如bla变体。用这些多核苷酸转化细胞,如细菌。以不能被内源性大肠杆菌合成酶有效加载的正交tRNA为例,抗生素抗性,例如氨苄青霉素抗性应约为或小于未用质粒转化的细菌。如果tRNA不是正交的,或者能加载tRNA的异源合成酶在此系统内共同表达,应可观察到更高水平的抗生素(如氨苄青霉素)抗性。选出那些在抗生素浓度与未用质粒转化的细胞大致相等的LB琼脂平板上不能生长的细胞,如细菌。以毒性产物(如核糖核酸酶或芽孢杆菌RNA酶)为例,当多种潜在的tRNA成员被内源性宿主(如大肠杆菌)合成酶(即与宿主如大肠杆菌合成酶不是正交的)氨酰化时, 选择者密码子被抑制,所产生的毒性多核苷酸产物导致细胞死亡。而含有正交tRNA或非功能性tRNA的细胞可存活。[0110]然后,在一个实施方式中,对与所需生物正交的tRNA库进行正选择,其中将选择者密码子置于正选择标记中(例如抗药性基因(如β内酰胺酶基因)编码的标记)。对以下细胞进行正选择含有编码与该细胞正交的tRNA库某成员的多核苷酸或包含该成员的多核苷酸、含有编码正选择标记的多核苷酸和含有编码关联RS的多核苷酸。在某些实施方式中,第二群细胞含有不能通过负选择除去的细胞。该多核苷酸在胞内表达,细胞在有选择试剂(如氨苄青霉素)存在下生长。然后选择能被共同表达的关联合成酶氨酰化以及对此选择者密码子起反应而插入氨基酸的tRNA。与一种或多种含有非功能性tRNA或不能被感兴趣合成酶有效识别的tRNA的细胞相比,这些细胞通常显示抑制效率升高。含有非功能性 tRNA或不能被感兴趣合成酶有效识别的tRNA的细胞对该抗生素敏感。因此在两次选择中能保留下的tRNA是⑴不是内源性宿主(如大肠杆菌)合成酶的底物;(ii)能被感兴趣的合成酶氨酰化;以及(iii)能在翻译过程中起作用。[0111]因此,取决于筛选所处的环境,同一标记可以是正或负标记。即,如果为了筛选该标记,则它是正标记,但如果为了抵御该标记则它是负标记。[0112]上述方法中,筛选,如正选择、负选择或者正负选择的严格性任选包括改变选择的严格性。例如,由于芽孢杆菌RNA酶是毒性极高的蛋白质,可通过将不同数目的选择者密码子引入到芽孢杆菌RNA酶基因内和/或使用可诱导启动子来控制负选择的严格性。在另一实施例中,选择或筛选试剂的浓度(如氨苄青霉素的浓度)可以不同。在本发明的一些方面,因为在前几轮中所需活性较低,严格性可以不同。因此,前几轮适用较低的严格性标准, 而后几轮选择适用更严谨的标准。在某些实施方式中,负选择、正选择或者正负选择可重复多次。也可使用多个不同的负选择标记、正选择标记或正负选择标记。在某些实施方式中, 正选择标记和负选择标记可以相同。[0113]其他类型的选择/筛选方法也可用于本发明以制备正交翻译组分,如O -1RNA、 O-RS和能对选择者密码子起反应而加载非天然氨基酸的0-tRNA/0-RS配对。例如,负选择标记、正选择标记或正负选择标记可包括发荧光的或在合适反应物存在下能催化发光反应的标记。在另一实施方式中,可通过荧光激活细胞分选(FACS)或发光检测标记的产物。标记任选可包括亲和筛选标记。也参见Francisco,J.A.等,(1993),“在外表面表达功能性抗体片段的大肠杆菌的制备与突光激活细胞分选”(Production and fluorescence-activatedcell sorting of Escherichia coli expressing afunctional antibody fragement on theexternal surface),Proc Natl Acad Sci USA. ,90 10444-8 制备重组正交tRNA的其它方法可见,例如名为“制备正交tRNA-氨酰-tRNA合成酶配对的方法和组合物”(METHODS AND C0MP0SITI0NSF0R THE PRODUCTION OF ORTHOGONAL tRNA AMINOACYL-tRNASYNTHETASE PAIRS)的国际专利公布W02002/086075 ;名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的 W02004/094593 ;与 2004 年 7 月 7 日提交的W02005/019415。也参见Forster等,(2003),“通过翻译从头设计的遗传密码来编程月太模拟合成酶,,(Programming peptidomimetic synthetases by translating genetic codesdesigned dg novo), PNAS, 100 (11) :6353-6357 ;和 Feng 等,(2003), “通过单氛基酸改变扩大 tRNA 合成酶的 tRNA 识别” (Expanding tRNArecognition of a tRNA synthetase by asingle amino acid change), PNAS,100(10) :5676-5681。[0114]iH交氨酿基-tRNA合成酶(O-RS)[0115]本发明的O-RS在体外或体内能用非天然氨基酸优先氨酰化Ο-tRNA。可通过含 O-RS的多肽和/或编码O-RS或其部分的多核苷酸将本发明的O-RS提供给翻译系统(如细胞)。例如,示例性O-RS包含SEQ ID NO :4、6或8所示氨基酸序列或其保守变体。在另一实施例中,O-RS或其部分是由多核苷酸序列或其互补多核苷酸序列编码,该多核苷酸序列编码含有本文序列表和实施例所示的氨基酸序列。可参见,例如SEQ ID N0:5、7或9所示多核苷酸。[0116]鉴定可与Ο-tRNA —起应用的正交氨酰基-tRNA合成酶(O-RS)的方法也是本发明的特征之一。例如,该方法包括选择(如正选择)第一物种的细胞群,其中所述细胞各自含有1) 多种氨酰基-tRNA合成酶(RS)的成员之一(例如,所述多种RS可包括突变型RS、衍生自第一物种之外物种的RS,或二者);2)正交tRNA (Ο-tRNA)(例如,一个或多个物种的); 以及3)编码选择(例如正选择)标记并含有至少一个选择者密码子的多核苷酸。与缺乏所述多种RS的成员或成员数目少的细胞相比,选择或筛选出显示抑制效率提高的那些细胞。可用本领域已知和本文所述的方法测定抑制效率。抑制效率提高的细胞包含能氨酰化 Ο-tRNA的活性RS。将第一物种的第一组tRNA被活性RS氨酰化的水平(体外或体内)与第二物种的第二组tRNA被活性RS氨酰化的水平作比较。通过可检测物质(例如,标记的非天然氨基酸)测定氨酰化水平。通常选择与第一组tRNA相比更有效地氨酰化第二组tRNA 的活性RS,从而获得能与Ο-tRNA联用的有效(优化)正交氨酰基-tRNA合成酶。采用这种方法鉴定的O-RS也是本发明的特征之一。[0117]可用许多试验来测定氨酰化。这些试验可在体外或体内进行。例如,体外氨酰化试验可见例如Hoben和Soil, (1985),Methods Enzymo1.,113 :55-59 也可联用报道分子和正交翻译组分并检测细胞中的报道分子来测定氨酰化,所述细胞表达含有至少一个选择者密码子并编码某蛋白质的多核苷酸。也参见名为“非天然氨基酸的体内掺入”(IN VIVO INC0RP0RATI0N0F UNNATURAL AMINO ACIDS)的 W02002/085923 和名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的 W02004/094593。[0118]还可进一步改造所鉴定的O-RS以改变该合成酶的底物特异性,从而使得0-tRNA 只加载上所需的非天然氨基酸,而不是任何常见的20种氨基酸。产生对非天然氨基酸具有底物特异性的正交氨酰基tRNA-合成酶的方法包括,例如通过组合合成酶不同的结构域而使合成酶在其活性位点、在其编辑机理位点、在不同位点发生突变等,并应用选择方法。也可以采用先正选择再负选择的方案。在正选择中,抑制引入阳性标记的一个或多个非重要位置的选择者密码子使得细胞在正选择压力下存活。在同时有天然和非天然氨基酸存在时,如此存活的细胞编码使正交抑制型tRNA带有天然或非天然氨基酸的活性合成酶。在负选择中,抑制引入阴性标记的一个或多个非重要位置的选择者密码子使合成酶失去天然氨基酸特异性。经正、负选择而 存活的细胞编码只用非天然氨基酸氨酰化(加载)正交抑制型tRNA的合成酶。然后通过例如DNA改组或其它递归诱变方法进一步诱变这些合成酶。[0119]可采用本领域已知的各种诱变技术产生突变型O-RS文库。例如,可用位点特异性突变、随机点突变、同源重组、DNA改组或其它递归诱变方法,嵌合构建或它们的组合来制备突变型RS。例如,可从两种或更多种其它如较小、多样性较低的“亚文库”来制备突变型RS 文库。本发明也包括RS的嵌合文库。应注意,可以构建各种生物(例如微生物,如真细菌或古细菌)的tRNA合成酶文库,例如具有天然多样性的文库(参见,例如授予Short等的美国专利号6, 238, 884 ;授予Schallenberger等的美国专利号5, 756, 316 ;授予Petersen 等的美国专利号5,783,431 ;授予Thompson等的美国专利号5,824,485 ;授予Short等的美国专利号5,958,672),并任选构建和筛选正交配对。[0120]一旦合成酶经历正和负选择/筛选方法,就可进一步诱变这些合成酶。例如可分离编码O-RS的核酸;从该核酸制备编码突变O-RS的一组多核苷酸(例如通过随机诱变、位点特异性诱变、重组或它们的任何组合);可重复各步骤或各步骤的组合直至获得用非天然氨基酸优先氨酰化Ο-tRNA的突变0-RS。在本发明的一些方面,这些步骤可进行多次,例如至少两次。[0121]本发明方法也可采用其它水平的选择/筛选严格性来产生0-tRNA、O-RS或其配对。可改变O-RS产生方法中一个或两个步骤的选择或筛选严格性。这包括,例如,改变选择/筛选试剂的用量等。也可额外进行几轮正和/或负选择。选择或筛选也可包括以下一种或多种改变氨基酸渗透性、翻译效率、翻译保真度(translational fidelity)等。一种或多种改变通常依据用正交tRNA-tRNA合成酶配对来产生蛋白质的生物中一种或多种基因突变。[0122]产生O-RS并改变合成酶底物特异性的其它常规细节见名为“产生正交tRNA-氨酰基 tRNA合成酶配对的方法和组合物”(METHODS ANDC0MP0SITI0NS FOR THE PRODUCTION OF ORTHOGONAL tRNAAMINOACYL-tRNA SYNTHETASE PAIRS)的 W02002/086075 和名为“扩展真核生物遗传密码”(EXPANDING THE EUKARYOTIC GENETIC CODE)的 W02004/094593。也可参见 Wang 和 Schultz, “扩展遗传密码”(Expandingthe Genetic Code), Angewandte Chemie Int. Ed. ,44(1) :34-66(2005),其内容以引用方式全文纳入。[0123]来源和宿丰牛物[0124]本发明可用的正交翻译组分(Ο-tRNA和0-RS)可衍生自任何生物(或生物的组合)从而可用于任何其它物种的宿主翻译系统,只要所述0-tRNA/0-RS组分与宿主系统能以正交方式起作用。某正交配对中的Ο-tRNA和O-RS无需衍生自同一生物。在一些方面, 正交组分衍生自用于真细菌宿主系统的古菌(即,古细菌)基因。[0125]例如,正交Ο-tRNA可衍生自古菌生物,例如古细菌,如詹氏甲烷球菌、嗜热碱甲烷杆菌;盐细菌,如沃氏富盐菌和盐细菌种NRC-1 ;闪烁古生球菌、激烈火球菌、极端嗜热古菌、嗜热泉生古细菌、海沼甲烧球菌、甲烧嗜高热菌(Methanopyrus ka ndleri)、梅氏甲烧八叠球菌(Mm)、耐超高温热棒菌(Pyrobaculum aerophilum) > Pyrococcus abyss1、硫横矿硫化叶菌(Ss)、超嗜热古菌(Sulfolobus tokodaii)、嗜酸热原体、火山热原体等;或真细菌,如大肠杆菌、嗜热栖热菌、枯草芽胞杆菌(Bacillus subtilis)、嗜热脂肪芽孢杆菌等; 而正交O-RS可衍生自以下生物(或生物的组合),例如古细菌,如詹氏甲烷球菌、嗜热碱甲烷杆菌;盐细菌,如沃氏富盐菌和盐细菌种NRC-1 ;闪烁古生球菌、激烈火球菌、极端嗜热古菌、嗜热泉生古细菌、海沼甲烷球菌、甲烷嗜高热菌、梅氏甲烷八叠球菌、耐超高温热棒菌、 Pyrococcus abyss1、硫磺矿硫化叶菌、超嗜热古菌、嗜酸热原体、火山热原体等;或真细菌, 如大肠杆菌、嗜热栖热菌、枯草芽胞杆菌、嗜热脂肪芽孢杆菌等。在一个实施方式中,真核生物来源,例如植物、藻类、原生动物、真菌、酵母菌、动物(例如哺乳动物、昆虫、节肢动物等) 等也可用作Ο-tRNA和O-RS的来源。[0126]0-tRNA/0-RS配对的各组分可衍生自同一生物或不同生物。在一个实施方式中, 0-tRNA/0-RS配对可来自同一生物。或者,0-tRNA/0-RS配对的Ο-tRNA和O-RS可来自不同生物。[0127]ο-tRNA、O-RS或0-tRNA/0-RS配对可在体内或体外选择或筛选和/或可用于细胞, 例如真细菌细胞,从而产生含有非天然氨基酸的多肽。所述真细菌细胞例如但不限于大肠杆菌、嗜热栖热菌、枯草芽胞杆菌、嗜热脂肪芽孢杆菌等。含本发明翻译组分的真细菌细胞组合物也是本发明特征之一。[0128]为在一种生物中筛选Ο-tRNA和/或O-RS以用于另一种生物,也可参见2004年4 月16日提交的名为“扩展真核生物遗传密码”(EXPANDINGTHE EUKARYOTIC GENETIC CODE) 的国际申请公布号W02004/094593。[0129]虽然正交翻译系统(例如,含有0-RS、Ο-tRNA和非天然氨基酸)可利用培养的宿主细胞产生含非天然氨基酸的蛋白质,但并非要求本发明的正交翻译系统需要完整的、有活力的宿主细胞。例如,在有细胞提取物存在下,正交翻译系统可利用无细胞系统。实际上,使用无细胞的体外转录/翻译系统产生蛋白质是公认的技术。利用本文所述的正交翻译系统组分,使这些体外系统适用于产生含非天然氨基酸的蛋白质也属于本发明的范围。[0130] 诜择者密码子[0131 ] 本发明的选择者密码子扩大了蛋白质生物合成机理的遗传密码子框架。例如,选择者密码子包括,独特的三碱基密码子、无义密码子(如终止密码子(如琥珀密码子(UAG) 或乳白密码子(UGA)))、非天然密码子、至少四碱基的密码子、罕用密码子等。可将许多选择者密码子引入所需基因,例如一个以上、两个以上、三个以上等。利用不同的选择者密码子, 可采用多对正交tRNA/合成酶配对,从而能利用这些不同的选择者密码子同时位点特异性地掺入多个不同的非天然氨基酸,例如包含至少一个非天然氨基酸。[0132]在一个实施方式中,这些方法包括利用作为终止密码子的选择者密码子,在体内即细胞中掺入非天然氨基酸。例如,制备能识别终止密码子的Ο-tRNA,并由O-RS用非天然氨基酸氨酰化该Ο-tRNA。宿主的天然氨酰基-tRNA合成酶不识别该Ο-tRNA。可采用常规的定点诱变将终止密码子引入编码感兴趣多肽的多核苷酸中感兴趣的位点。可参见,例如Sayers,J.R.等,(1988),“硫代磷酸酯寡核苷酸定向诱变中的5’,3’核酸外切酶,,(5' , 3' Exonuclease in phosphorothioate-based oligonucleotide-directed mutagenesis) ,Nucleic Acids Res,791-802。当例如在体内联用 0-RS、0_tRNA和编码感兴趣多肽的核酸时,可对终止密码子起反应而掺入非天然氨基酸,从而获得在特定位点含有非天然氨基酸的多肽。在本发明的一个实施方式中,用作选择者密码子的终止密码子是琥珀密码子UAG和/或乳白密码子UGA。在一实施例中,UAG和UGA都用作选择者密码子的遗传密码可编码22个氨基酸,同时保留赭石无义密码子,UAA,其是最丰富的终止信号。体内掺入非天然氨基酸不会对宿主细胞有显著干扰。例如,在非真核细胞,如大肠杆菌中,由于UAG密码子的抑制效率依赖于Ο-tRNA(如琥珀抑制型tRNA)与释放因子 I(RFl)(其可结合UAG密码子,进而引起延伸中的肽链从核糖体释放)之间的竞争,因此通过,例如提高Ο-tRNA (如抑制型tRNA)的表达水平,或利用RFl缺陷型菌株可以调节抑制效率。在真核细胞中,由于UAG密码子的抑制效率依赖于Ο-tRNA(如琥珀抑制型tRNA)和真核释放因子(如eRF)(其可结合终止密码子,进而引起延伸中的肽链从核糖体释放)之间的竞争,因此通过,例如提高Ο-tRNA(如抑制型tRNA)的表达水平可以调节抑制效率。此外, 也可存在其它化合物,例如还原剂,如二硫苏糖醇(DTT)。[0134]非天然氨基酸也可由罕用密码子编码。例如,当体外蛋白合成反应中的精氨酸浓度下降时,证实罕用的精氨酸密码子AGG可利用丙氨酸酰化的合成tRNA而有效插入ala。 可参见Ma等,Biochemistry, 32 :7939(1993)。在此情况中,合成tRNA可与大肠杆菌中作为次要成分存在的天然tRNAArg竞争。此外,一些生物不能利用所有的三联密码子。藤黄微球菌(Micrococcusluteus)的未指定密码子AGA可用于在体外将氨基酸插入转录/翻译提取物中。可参见,例如Kowal和Oliver, Nucl. Acid. Res. ,25 :4685 (1997)。体内利用这些罕用密码子可以产生本发明的各组分。[0135]选择者密码子也可包括延伸密码子,例如四个或四个以上碱基的密码子,如四个、 五个、六个或更多碱基的密码子。四碱基密码子的例子包括,例如AGGA、CUAG, UAGA, CCCU 等。五碱基密码子的例子包括,例如AGGAC、CCCCU、CCCUC、CUAGA, CUACU、UAGGC等。本发明方法可包括使用基于移码抑制的延伸密码子。四个或四个以上碱基的密码子可将例如一个或多个非天然氨基酸插入同一蛋白质。在其它实施方式中,反密码子环可解码例如至少一种四碱基密码子、至少一种五碱基密码子或至少一种六碱基密码子或更多。由于可能的四碱基密码子有256种,所以同一细胞中可用四个或四个以上碱基的密码子编码多种非天然氨基酸。也可参见,Anderson等,(2002), “密码子和反密码子大小极限的研究,,(Exploring the Limits of Codon and Anticodon Size),Chemistry and Biology,9 237-244和Magliery,(2001),“扩增遗传密码在大肠杆菌中选择有效的四碱基密码子抑制剂并用文库方法鉴定“变化的”四碱基密码子"(Expanding the Genetic Code Selection of Efficient Suppressors of Four-baseCodons and Identification of " Shifty " Four-base Codons with a LibraryApproach in Escherichia coli), J. Mol. Biol. ,307 755-769。[0136]例如,已采用体外生物合成方法利用四碱基密码子将非天然氨基酸掺入蛋白质。 参见,例如 Ma 等,(1993), Biochemistry, 32 :7939 和 Hohsaka 等,(1999), J. Am. Chem. Soc., 121 :34。联用CGGG和AGGU及两种化学酰化的移码抑制型tRNA在体外将2-萘基丙氨酸和赖氨酸的NBD衍生物掺入链霉亲和素。可参见,例如Hohsaka等,(1999),J. Am. Chem. Soc., 121 :12194。在体内研究中,Moore等检测了含NCUA反密码子的tRNALeu衍生物抑制UAGN密码子(N可以是U、A、G或C)的能力,发现含UCUA反密码子的tRNA^解码四联UAGA的效率为13到26%,而在O或-1读框中几乎不解码。可参见Moore等,(2000), J. Mol. Biol.,298 195。在一个实施方式中,本发明可利用基于罕用密码子或无义密码子的延伸密码子,它们能降低在其它不期望位点的错义连读(missense readthrough)和移码抑制。四碱基密码子已在各种正交系统中用作选择者密码子。可参见,例如,W02005/019415 ;W02005/007870 和 W02005/07624。也可参见 Wang 和 Schultz, “扩展遗传密码”(Expanding the Genetic Code), Angewandte Chemielnt. Ed. , 44 (I) :34-66 (2005),其内容通过引用的方式全文纳入。虽然以下例子利用琥珀选择者密码子,但通过改进本文的实例使之包含四碱基0-tRNA 和经修饰的合成酶,从而能包含与之前描述的各非天然氨基酸O-RS相似的突变,四碱基或更多碱基的密码子也可使用。[0137]对于给定系统,选择者密码子还可包括天然三碱基密码子中内源性系统不用(或很少用)的那个天然碱基密码子。例如,这包括缺乏能识别该天然三碱基密码子的tRNA的系统,和/或该三碱基密码子是罕用密码子的系统。[0138]选择者密码子任选包含非天然碱基对。这些非天然碱基对进一步扩大了现有的遗传字符集(genetic alphabet)。一种额外的碱基对可将三联密码子的数目从64增加至125。第三碱基对的特性包括稳定和选择性的碱基配对,利用聚合酶高保真地有效酶促掺入DNA,新生非天然碱基对合成后引物继续有效延伸。适用于这些方法和组合物的非天然碱基对的描述包括例如Hirao等,(2002),“将氨基酸类似物掺入蛋白质的非天然碱基对,,(Anunnatural base pair for incorporating amino acid analogues into protein), Nature Biotechnology, 20 :177-182。也可参见 Wu, Y.等,(2002), J. Am. Chem. Soc. , 124 14626-14630。下文列出了其它的相关出版物。[0139]对于体内使用,非天然核苷是膜可渗透的,并可磷酸化形成相应的磷酸三酯。此外,增加的遗传信息稳定且不为细 胞酶所破坏。Benner与他人先前的工作利用了不同于经典Watson-Crick配对的氢键模式,其中最值得注意的例子是异-C :异-G配对(iso_C iso-G pair)。参见,例如 Switzer 等,(1989), J. Am. Chem. Soc. ,111 :8322 ;Piccirilli 等,(1990), Nature, 343 33 ;Kool, (2000), Curr. Opin. Chem. Biol. ,4 602o 这些喊基通常与天然碱基有一定程度的错配,因而不能酶促复制。Kool和同事证明,碱基间的疏水包装相互作用(hydrophobic packing interaction)可替代氢键以驱动碱基对形成。参见 Kool, (2000),Curr. Opin. Chem. Biol. ,4 602 ;Guckian 和 Kool, (1998),Angew. Chem. hit. Ed. Engl. ,36 :2825。在致力于开发符合以上所有要求的非天然碱基对的过程中,Schultz、 Romesberg和同事已系统地合成并研究了一系列非天然疏水碱基。发现PICS:PICS自·身配对比天然碱基对更稳定,并可用大肠杆菌DNA聚合酶I的Klenow片段(KF)有效地掺入 DNA0 可参见,例如 McMinn 等,(1999),J. Am. Chem. Soc.,121 :11586 ;和 Ogawa 等,(2000), J. Am. Chem. Soc.,122 :3274。就生物学功能而言,KF合成3MN 3MN自身配对的效率和选择性足够。可参见,例如Ogawa等,(2000),J. Am. Chem. Soc.,122 :8803。然而,这两种碱基均起到进一步复制的链终止子的作用。近来开发了可用于复制PICS自身配对的突变型DNA 聚合酶。此外,可复制7AI自身配对。可参见,例如Tae等,(2001), J. Am. Chem. Soc. ,123 7439。还已开发了与Cu(II)结合后可形成稳定配对的金属碱基(metallobase)对Dipis Py。可参见,Meggers等,(2000), J. Am. Chem. Soc. , 122 :10714。因为延伸密码子和非天然密码子在本质上与天然密码子正交,所以本发明方法可利用该特性产生它们的正交tRNA。[0140]还可利用一种翻译旁路系统将非天然氨基酸掺入所需多肽。在翻译旁路系统中, 可将一个大序列插入基因,但该序列不翻译成蛋白质。该序列含有可作为提示的结构,从而能诱导核糖体跳过该序列然后恢复该插入序列的下游翻译。[0141]非天然氨基酸[0142]本文所用的非天然氨基酸指除硒代半胱氨酸和/或吡咯赖氨酸和以下20种遗传编码的α-氨基酸以外的任何氨基酸、修饰的氨基酸或氨基酸类似物丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、甲硫氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸、缬氨酸。α -氨基酸的通用结构如式I所示[0143]
权利要求
1.一种翻译系统,所述系统是大肠杆菌细胞,且包含 (a)第一非天然氨基酸,其为苯基硒代半胱氨酸; (b)第一正交氨酰基-tRNA合成酶(O-RS),选自SEQID NO :4、6或8 ;和 (c)如SEQ ID NO :1 所示的第一正交 tRNA (Ο-tRNA); 其中所述第一 O-RS用所述苯基硒代半胱氨酸优先氨酰化所述第一 0-tRNA。
2.如权利要求
1所述的翻译系统,其特征在于,所述系统还包含编码感兴趣蛋白质的核酸,所述核酸含有琥珀选择者密码子UAG,其中所述第一 Ο-tRNA识别所述琥珀选择者密码子UAG。
3.如权利要求
1所述的翻译系统,其特征在于,所述大肠杆菌细胞包含编码所述第一O-RS的多核苷酸。
4.如权利要求
3所述的翻译系统,其特征在于,所述多核苷酸如SEQID N0:5、7或9所/Jn ο
5.如权利要求
1所述的翻译系统,其特征在于,所述大肠杆菌细胞包含编码所述第一Ο-tRNA的多核苷酸。
6.一种在翻译系统中产生在所选位置含非天然氨基酸的蛋白质的方法,所述方法包括 (a)提供翻译系统,该系统是大肠杆菌细胞,且包含 (i)第一非天然氨基酸,其为苯基硒代半胱氨酸; (ii)第一正交氨酰基-tRNA合成酶(O-RS),选自SEQID N0:4、6或8; (iii)如SEQID NO :1所示的第一正交tRNA (Ο-tRNA);其中所述第一 O-RS用所述苯基硒代半胱氨酸优先氨酰化所述第一 Ο-tRNA ;和 (iv)编码所述蛋白质的核酸,其中所述核酸包含所述第一Ο-tRNA识别的琥珀选择者密码子UAG ;和 (b)在所述蛋白质的翻译期间对所述选择者密码子起反应而将所述非天然氨基酸掺入所述蛋白质的所述所选位置,从而产生在所选位置含所述非天然氨基酸的所述蛋白质。
7.如权利要求
6所述的方法,其特征在于,所述翻译系统包含编码所述O-RS的多核苷酸。
8.如权利要求
6所述的方法,其特征在于,所述提供翻译系统包括提供编码所述Ο-tRNA的多核苷酸。
9.如权利要求
6所述的方法,其特征在于,所述提供翻译系统包括提供编码所述O-RS的核酸,其中所述核酸的多核苷酸序列如SEQ ID N0:5、7或9所示。
10.如权利要求
6所述的方法,其特征在于,所述掺入步骤包括培养所述大肠杆菌细胞。
11.如权利要求
10所述的方法,其特征在于,所述大肠杆菌细胞包含编码所述O-RS的核酸。
12.如权利要求
11所述的方法,其特征在于,编码所述O-RS的所述核酸的核苷酸序列如 SEQ ID N0:5、7 或 9 所示。
13.一种多肽,选自SEQ ID N0:4、6或8。
14.一种编码权利要求
13所述多肽的多核苷酸。
15.如权利要求
14所述的多核苷酸,其特征在于,所述多核苷酸如SEQID N0:5、7或9所示。
16.—种包含权利要求
14所述多核苷酸的载体。
17.—种包含权利要求
14所述多核苷酸的表达载体。
18.—种包含载体的细胞,所述载体含有权利要求
14所述的多核苷酸。
专利摘要
本发明涉及tRNA和氨酰基-tRNA合成酶的正交配对,所述配对能将非天然氨基酸苯基硒代半胱氨酸掺入真细菌细胞,例如大肠杆菌中产生的蛋白质中。本发明提供,例如但不限于新型正交氨酰基-tRNA合成酶、编码该新型合成酶分子的多核苷酸、鉴定和制备该新型合成酶的方法、产生含非天然氨基酸苯基硒代半胱氨酸的蛋白质和翻译系统的方法。本发明还包括通过靶向修饰蛋白质中的苯基硒代半胱氨酸而产生经修饰蛋白质(例如,脂化蛋白质)的方法。
文档编号C12P21/00GKCN101405401 B发布类型授权 专利申请号CN 200780009252
公开日2013年3月27日 申请日期2007年3月13日
发明者王江云, P·G·舒尔茨 申请人:斯克利普斯研究院导出引文BiBTeX, EndNote, RefMan专利引用 (3), 非专利引用 (1),
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1