新的草甘膦n-乙酰转移酶(gat)基因的制作方法

文档序号:115713阅读:1636来源:国知局
专利名称:新的草甘膦n-乙酰转移酶(gat)基因的制作方法
新的草甘膦N-乙酰转移酶(GAT)基因本申请是2001年10月四日提交的、发明名称为“新的草甘膦N-乙酰转移酶(GAT) 基因”的、专利申请号为01819975. 5的分案申请。有关申请的交叉参考本申请要求提交于2000年10月30日的序列号为No. 60/244,385的美国在先专利申请的优先权,出于所有的目的,在此将其全文并入以供参考。依据37C. F. R. § 1.71(E)的版权通告本发明文件的一部分公开内容包括受到版权保护的材料。版权所有者不反对任何人复制此专利文件或专利公开,对于专利商标局的专利文件或记录而言这是显而易见的, 但无论如何版权所有者保留所用的版权。
背景技术
将编码适当的除草剂代谢酶类的基因转到农作物中可以赋于农作物对特殊除草剂的选择性。某些情况下,这些酶类以及编码它们的核酸源自植物。其它情况下,它们衍生自其它生物,如微生物。参见,例如,I^adgette等,(1996) "New weed control opportunities !Development of soybeans with a Round UP Ready gene,, 出自 Herbicide-Resistant Crops (Duke 编),第 54-84 页,CRC 出版社,伯克莱屯;以及 Vasil (19 96) “ Phosphinothricin-resistant crops,,出自 Herbicide-Resistant Crops (Duke 编), 第85-91页。实际上,已经从各种生物来源构建了表达各种除草剂耐受性/代谢基因的转基因植物。例如,乙酰醇酸合成酶(已发现它可以使表达这种酶的植物抗多种类型的除草剂) 已经被引入许多植物(参见,例如,Hattori等(1995)Mol Gen Genet 246:419。其它可使植物耐受除草剂的基因包括编码大鼠细胞色素P4507A1和酵母NADPH-细胞色素P450氧化还原酶嵌合蛋白的基因(Siiota 等(1994)Plant PhysiolPlant Physiol 106 :17),谷胱甘肽还原酶基因和超氧化物歧化酶基团(Aono等,(1995)Plant Cell Physiol36 :1687)和各种磷酸转移酶的基因(Datta等(1992) Plant Mol Biol 20 :619)。在这方面,成为许多研究主题的一种除草剂是N-磷酰基甲基甘氨酸,它通常称为草甘膦。草甘膦是世界上卖得最好的除草剂,2003年的销售计划高达50亿美元。它是一种广谱的除草剂,可以杀死阔叶植物和草本植物。转基因植物中一种商业水平抗草甘膦的成功模式,是通过引入经过修饰的农杆菌属CP4 5-烯醇丙酮酸莽草酸-3-磷酸酯合酶(以下称为EPSP合酶或EPSPQ基因实现的。转基因的目的是使叶绿体在草甘膦存在时能够连续地将磷酸烯醇式丙酮酸(PEP)和莽草酸-3-膦酸酯合成为EPSP。相反,草甘膦会抑制天然EPSP的合成。如果没有转基因,喷洒过草甘膦的植物会因为EPSP合成酶的抑制而很快死亡,EPSP合酶会阻断芳香性氨基酸、激素和维生素生物合成所需的下游途径。例如, Monsanto已经研制了商品名为“Round UP Ready ”的CP4草甘膦抗性的大豆转基因植物。这种情况下,草甘膦的降解主要是通过土壤微生物代谢进行的。已鉴定出土壤中草甘膦的主要代谢物是氨甲基磷酸(AMPA),它最终被转变为铵盐、磷酸和二氧化碳。图8显示了所提出的草甘膦在土壤中通过AMPA途径降解的代谢过程。某些土壤细菌可以通过其它的代谢途径-肌氨酸途径-分解草甘膦,如图9所示,这一途径通过首先切断C-P键产生无机磷和肌氨酸。另一种成功的除草剂/转基因作物是草铵膦(膦丝菌素)和(例如Mventis销售的LibertyLink 。草铵膦也是一种广谱除草剂。它的靶标是叶绿体的谷氨酸合成酶。有抗性的植物带有吸水链霉菌的bar基因并通过bar的N-乙酰化作用得到抗性,bar可修饰
并解毒谷氨酸。PCT申请WO 00/29596号中报道了一种能够使AMPA的伯胺乙酰化的酶。但冰这种酶不能使带有仲胺的化合物(如,草甘膦)乙酰化。如上所述,虽然有各种除草剂抗性方法,但其他方法将会有商业价值。本发明提供了(例如)新的赋予除草剂耐受性的多核苷酸和多肽,以及在阅读以下公开内容时其它更多的优点也将是显而易见的。发明概述本发明的一个目的是提供使生物,如植物,对草甘膦有抵抗力的方法和试剂。以下所述的一个或多个实施方案叙述了本发明的这一目的以及其它目的。本发明的一个实施方案提供了本文称为GAT多肽的新的多肽。GAT多肽的特征为, 如当GAT多肽相互连接时就序列相似性而言,它们的结构是彼此类似的。一些GAT多肽具有草甘膦N-乙酰转移酶活性,即催化草甘膦乙酰化的能力。一些GAT多肽还能催化草甘膦类似物和/或草甘膦代谢物(如氨甲基磷酸)的乙酰化。还提供了本文称为GAT多核苷酸的新的多核苷酸。GAT多核苷酸以它们能够编码 GAT多肽为特征。在本发明的一些实施方案中,用相对于亲代密码子在植物中偏爱使用的同义密码子替代一个或多个亲代密码子改造GAT多核苷酸以供更好的植物表达,。在其它的实施方案中,引入了编码N-末端叶绿体转运肽的核苷酸序列以修饰GAT多核苷酸。下面将更加详细的描述GAT多肽、GAT多核苷酸和草甘膦N-乙酰转移酶的活性。 本发明还包括本文所述GAT多肽和GAT多核苷酸的某些片段。本发明包括本文所述多肽和多核苷酸的非天然变体,其中一个或多个编码多肽的氨基酸被突变了。本发明还提供了含有本发明多核苷酸的核酸构建物。这种构建物可以是载体,如植物转化载体。某些方面,本发明的载体将包括T-DNA序列。这种构建物可以任选地包括操作性连接于GAT多核苷酸的调节序列(如启动子),这里的启动子对该多核苷酸是异源的,并可有效引起编码多肽的足够表达以增强用此核酸构建物转化的植物细胞抵抗草甘膦的能力。在本发明的一些方面,GAT多核苷酸的功能在如植物、细菌、放线菌、酵母、藻类或其它真菌中作为选择性标记。例如,根据草甘膦存在时的生长能力可以选出用包含GAT多核苷酸选择性标记的载体转化的生物。GAT标记基因可用于选择或筛选表达此基因的转化细胞。本发明还提供了具有堆积性状的载体,即编码GAT的载体和还含有编码第二多肽的第二多核苷酸序列的载体,这里的第二多肽可使以有效水平表达第二多肽的细胞或生物具有可检测的表型性状。可检测的表型性状可作为可检测标记,例如,通过提供除草剂抗性、害虫抗性或提供某些类型的可视标记。一个实施方案中,本发明提供了含有两种或多种本发明多核苷酸的组合物。
含有两种或多种GAT多核苷酸或编码多肽的组合物是本发明的一个特征。一些情况下,这些组合物是含有(例如)至少3个或更多此类核酸的核酸文库。用限制性内切酶、 DNA酶或RNA酶消化本发明的核酸,或断裂核酸(如机械剪切、化学切割等)而制得的组合物也是本发明的一个特征,将本发明的核酸与脱氧核糖核酸三磷酸和核酸聚合酶(如热稳定的核酸聚合酶)一起温育而制得的组合物亦是如此。被本发明的载体转导的或掺入本发明的核酸的细胞是本发明的一个方面。在优选的实施方案中,这种细胞表达此核酸编码的多肽。一些实施方案中,掺入本发明核酸的细胞是植物细胞。掺入本发明核酸的转基因植物、转基因植物细胞和转基因植物的外植体也是本发明的一个特征。一些实施方案中,这种转基因植物、转基因植物细胞和转基因植物的外植体表达本发明核酸编码的具有草甘膦 N-乙酰转移酶活性的外源多肽。本发明还提供了本发明转基因植物生产的转基因种子。本发明还提供了对草甘膦的抗性增强的转基因植物或转基因植物的外植体,这是由于它们表达了具有草甘膦N-乙酰转移酶活性的多肽,和通过其它机制而具有草甘膦抗性的多肽(如抗草甘膦的5-烯醇丙酮酸莽草酸-3-磷酸酯合酶和/或抗草甘膦的草甘膦氧化还原酶)。在进一步的实施方案中,本发明提供了对草甘膦以及其它除草剂的抗性增强的转基因植物或转基因植物的外植体,这是由于它们表达了具有草甘膦N-乙酰转移酶活性的多肽,通过其它机制而具有草甘膦抗性的多肽(如抗草甘膦的5-烯醇丙酮酸莽草酸-3-磷酸酯合酶和/或抗草甘膦的草甘膦氧化还原酶),以及对其它除草剂具有抗性的多肽,如突变的羟苯基丙酮酸双氧化酶、抗磺胺的乙酸乳酸酯合酶、抗磺胺的乙酰羟酸合酶、 抗咪唑啉酮的乙酰乳酸酯合酶、抗咪唑啉酮的乙酰羟酸合酶、膦丝菌素乙酰转移酶和突变的原卟啉原氧化酶。本发明还提供了对草甘膦的抗性增强的转基因植物或转基因植物的外植体,是由于它们表达了具有草甘膦N-乙酰转移酶活性的多肽和对其它除草剂具有抗性的多肽,如突变的羟苯基丙酮酸双氧化酶、抗磺胺的乙酸乳酸酯合酶、抗磺胺的乙酰羟酸合酶、抗咪唑啉酮的乙酰乳酸酯合酶、抗咪唑啉酮的乙酰羟酸合酶、膦丝菌素乙酰转移酶和突变的原卟啉原氧化酶。本发明的另一方面是制造本发明多肽的方法,方法是将编码它们的核酸引入细胞然后使其表达并从细胞或培养介质中回收。在优选的实施方案中,表达本发明多肽的细胞是转基因植物细胞。与抗衍生自SEQ ID NO =ID NOS :6_10和沈3_514的抗原的多克隆抗血清特异性结合、但不和天然产生的相关序列(如以GenBank登录号为CAA70664的序列代表的肽)以及通过施用衍生自SEQ ID NO =ID NOS :6_10和沈3_514的一个或多个抗原而制得的抗体特异性结合的多肽,和/或与这种抗原特异性结合的多肽,以及不和GenBank登录号为CAA70664 相应的天然产生的多肽特异性结合的多肽都是本发明的特色。本发明的另一方面涉及通过体外或体内重组或突变本发明的核酸,使多核苷酸多样化以产生新的GAT多核苷酸和多肽的方法。一个实施方案中,这种重组产生了至少一个重组GAT多核苷酸文库。如此制得的文库以及含有此文库的细胞是本发明的实施方案。此外,通过突变本发明的核酸而制造经过修饰的GAT多核苷酸的方法亦是本发明的实施方案。用本发明的这些方法制造的重组和突变GAT多核苷酸和多肽亦是本发明的实施方案。
在本发明的一些方面,多样性是通过使用递推重组达到的,这可以在体外、体内、 硅内实现,或在其组合物中实现。下面将更详细描述的多样性方法的一些实施例是家族改组方法和合成改组方法。本发明提供了制造草甘膦抗性转基因植物或植物细胞的方法,它包括用编码草甘膦N-乙酰转移酶的多核苷酸转化植物或植物细胞,并任选地从转化的植物细胞重生转基因植物。某些方面,多核苷酸是GAT多核苷酸,任选地衍生自细菌来源的GAT多核苷酸。在本发明的一些方面,这一方法可以包括使转基因植物或植物细胞生长在可抑制同一物种野生型植株的生长但不抑制转化植株生长的草甘膦浓度中。这种方法可以包括使转化的植物和植物细胞,或植物或植物细胞的后代生长在草甘膦浓度升高的和/或对同一物种野生型植物或植物细胞有致死作用的草甘膦浓度中。用这种方法制得的草甘膦抗性转基因植物可以繁殖,例如,通过与第二种植物杂交,这样至少部分杂交后代显示有草甘膦抗性。本发明还提供了在种有农作物的农田中选择性控制杂草的方法,包括在土地上种植由于被编码草甘膦N-乙酰转移酶的基因转化因而具有草甘膦抗性的农作物种子或植物,并对土地里的农作物和杂草施用足量的草甘膦以控制杂草但不明显影响农作物。本发明还提供了控制地中的杂草并防止草甘膦抗性杂草出现在种有农作物的地中的方法,包括在土地上种植由于被编码草甘膦N-乙酰转移酶的基因和编码通过其它机制而具有草甘膦抗性的多肽(如抗草甘膦的5-烯醇丙酮酸莽草酸-3-磷酸酯合酶和/或抗草甘膦的草甘膦氧化还原酶)的基因转化,因而具有草甘膦抗性的农作物种子或植物, 并对土地里的农作物和杂草施用足量的草甘膦以控制杂草但不明显影响农作物。在本发明的另一方面,提供了控制地中的杂草并防止除草剂抗性的杂草出现在种有农作物的地中的方法,包括在土地上种植由于被编码草甘膦N-乙酰转移酶的基因;编码通过其它机制而具有草甘膦抗性的多肽(如抗草甘膦的5-烯醇丙酮酸莽草酸-3-磷酸酯合酶和/或抗草甘膦的草甘膦氧化还原酶)的基因;以及编码对其它除草剂具有抗性的多肽(如突变的羟苯基丙酮酸双氧化酶、抗磺胺的乙酸乳酸酯合酶、抗磺胺的乙酰羟酸合酶、 抗咪唑啉酮的乙酰乳酸酯合酶、抗咪唑啉酮的乙酰羟酸合酶、膦丝菌素乙酰转移酶和突变的原卟啉原氧化酶)的基因转化而具有草甘膦抗性的农作物种子或植物,并对土地里的农作物和杂草施用足量的草甘膦和其它除草剂(如羟苯基丙酮酸双氧化酶抑制剂、磺胺、咪唑啉酮、bialaphos、膦丝菌素、azafenidin、butafenacil、sulfosate、草铵膦和 ptotox 抑制剂)以控制杂草但不明显影响农作物。本发明还提供了控制地中的种子并防止除草剂抗性的种子出现在种有农作物的地中的方法,包括在土地上种植由于被编码草甘膦N-乙酰转移酶的基因和编码对其它除草剂具有抗性的多肽(如突变的羟苯基丙酮酸双氧化酶、抗磺胺的乙酸乳酸酯合酶、抗磺胺的乙酰羟酸合酶、抗咪唑啉酮的乙酰乳酸酯合酶、抗咪唑啉酮的乙酰羟酸合酶、膦丝菌素乙酰转移酶和突变的原卟啉原氧化酶)的基因转化而具有草甘膦抗性的农作物种子或植物,并对土地里的农作物和种子施用足量的草甘膦和其它除草剂(如羟苯基丙酮酸双氧化酶抑制剂、磺胺、咪唑啉酮、bialaphos、膦丝菌素、azafenidin、butafenacil、sulfosate、草铵膦和Ptotox抑制剂)以控制种子但不明显影响农作物。本发明还提供了制造经遗传转化而耐受草甘膦的植物的方法,包括在植物细胞的基因组中插入含有(i)作用于植物细胞以产生RNA序列的启动子;(ii)产生编码GAT的RNA 序列的结构性DNA序列;以及(iii)作用于植物细胞以使聚腺苷酸向RNA序列的3’末端增加延伸的3’非翻译区的重组体双链DNA分子;其中所述启动子对结构性DNA序列是异源的并可以造成该编码多肽的足够表达以增强被此DNA分子转化的植物细胞的草甘膦抗性; 获得转化的植物细胞;以及使转化的植物细胞重新产生对草甘膦抗性提高的遗产转化的植物。本发明还提供了产生农作物的方法,包括使已被编码草甘膦N-乙酰转移酶的基因转化而具有草甘膦抗性的农作物在此种农作物产生后代的条件下生长;并且从此农作物植株中收获农作物。这些方法通常包括以有效控制杂草的浓度向农作物植株施用草甘膦。 示范性的农作物包括棉花、玉米和大豆。本发明还提供了计算机、计算机可读介质和集成系统,包括序列记录(含有与SEQ ID NOs :1-514相对应的字符串)构成的数据库。这种集成系统任选的包括一套或多套将对应于SEQ ID NOs :1-514的一个或多个字符串相互和/或与其它的核酸或氨基酸序列进行选择、序列对比、翻译、反向翻译或观察的装置。附图的简要说明


图1描述了草甘膦N-乙酰转移酶(“GAT”)催化的草甘膦的N-乙酰化。图2描绘了通过表达天然GAT活性的试验性芽孢杆菌培养物产生的N-乙酰草甘膦的质谱检测。图3是分离自不同细菌菌株的GAT序列和枯草芽孢杆菌的yitl之间的相对同性。图4是大肠杆菌培养物表达和纯化的GAT酶的质粒pMAXY2120的作图。图5是显示典型GAT酶反应混合物中随时间而增加的N-乙酰草甘膦产量的质谱输出。图6是GAT酶动力学数据的标绘图,用它计算出草甘膦的Km为2. 9mM。图7取自图6动力学数据的标绘图,用它计算了乙酰CoA的Km为2 μ M。图8是土壤中草甘膦通过AMPA途径降解的流程图。图9是草甘膦降解的肌氨酸途径的流程图。
图 10 是 BL0SUM62 基质。
图11是质粒ρΜΑΧΥ2190的作图。
图12描绘了带有gat选择性标记的T-DNA构建物。
图13描绘了带有gat选择性标记的酵母表达载体。发明详述本发明涉及一类新的显示N-乙酰转移酶活性的酶。在一个方面,本发明涉及一类新的能够乙酰化草甘膦和草甘膦类似物(例如具有草甘膦N-乙酰转移酶(“GAT”)活性的酶)的酶。这种酶的特征是能够乙酰化一类化合物的仲胺。在本发明的一些方面,这种化合物是如
图1列举的除草剂(例如草甘膦)。这种化合物也可以是草甘膦类似物或草甘膦降解的代谢产物,例如氨甲基磷酸。尽管草甘膦的乙酰化在草甘膦分解代谢的一种代谢途径中是关键的催化步骤,但以前还没有描述过由天然产生的、独立的或重组酶促成的草甘膦的酶促乙酰化。因此,本发明的核酸和多肽提供了一种新的基因工程方法改造除草剂抗性的生化途径。
在一个方面,本发明提供了新的编码GAT多肽的基因。相当于天然发生的多核苷酸分离和重组的GAT多核苷酸,以及重组和工程改造的(例如变化的)GAT多核苷酸是本发明的一个特征。GAT多核苷酸以SEQ ID NO :1_5和11-262为例。提供了特定的GAT多核苷酸和多肽序列作为例子以帮助阐述本发明,目的不是要将本文所述和/或权利要求的GAT 多核苷酸和多肽的种类限制在这一范围内。本发明还根据选择文库组成中具有本文所述新的或活性改进的多核苷酸,提供产生多样化的文库并对其选择的方法,以产生包括编码具有改进和/或增强的特性(例如对草甘膦有改变的Km)、提高的催化速度、提高的稳定性等的GAT多肽的多核苷酸。这种多核苷酸在产生草甘膦抗性转基因植物中特别有效。本发明的GAT多肽显示了新的酶活性。特别地,在本发明之前尚未认识到合成的草甘膦除草剂的酶促乙酰化。因此,本文所述的多肽,例如以SEQ ID NO :6-10和沈3-514 为例,阐明了草甘膦解毒的在体内(例如在植物中)具有功能的新的生化途径。因此,本发明的核酸和多肽对于基因工程改造转基因植物的除草剂选择性,通过所提供的新的核酸、多肽和生化途径在产生草甘膦抗性植物中有着重要的用途。定义在详细描述本发明之前,应该理解本发明不限于特定的组合物或生物系统,当然, 它们是可以改变的。还应该理解本文所用的术语仅是出于描述特定实施方案的目的,而不是要限制。当用在本说明书和附加权利要求中时,除非内容明确指出,单数形式“一个”和 “这个”包括复数形式。因此,例如,提到“一种装置”时包括两个或更多此类装置的组合,提到“一种基因融合构建物”时包括构建物的混合物,依此类推。除非另有说明,本文所用的所有技术和科学术语和本发明所属技术领域的一般技术人员的通常理解有同样的含义。尽管任何与本文所述类似或等价的方法或物质都可用于实践以验证本发明,本文描述了适当物质和方法的特殊实施例。在本发明的描述和权利要求中,将根据下面给出的定义使用以下术语。出于本发明的目的,术语“草甘膦”应被认为包括N-磷酰基甲基甘氨酸(包括其任何盐)的任何除草有效形式和其它会导致在跗基节中产生草甘膦阴离子的形式。术语“草甘膦类似物”指草甘膦的任何结构类似物,这种类似物具有以一定水平抑制EPSPS的能力, 这样草甘膦类似物是除草有效的。如本文所用,术语“草甘膦-N-乙酰转移酶活性”或“GAT活性”是指催化草甘膦的仲胺基团乙酰化的能力,例如,如
图1中说明的。“草甘膦-N-乙酰转移酶”或“GAT”是一种催化草甘膦、草甘膦类似物和/或草甘膦主要代谢物(即AMPA或肌氨酸)的氨基乙酰化的酶。在本发明一些优选的实施方案中,GAT能够将乙酰基团从乙酰CoA转移到草甘膦的仲胺和AMPA的伯胺。本文所述示范例的GAT在pH5-9时是活性形式,在pH6. 5-8. 0范围有最佳活性。可用各种此领域熟知的动力学参数定量测定此活性,如k。at、Ks^nkratZlV可以按下面实施例7所述确定这些动力学参数。术语“多核苷酸”、“核苷酸序列”和“核酸”用于指核苷酸(A、C、T、U、G等,或天然产生或人造核苷酸类似物)的多聚物,例如,DNA或RNA,或其代表,如字符串等,这取决于相关内容。从任何特定的核苷酸序列可以确定给定的多核苷酸或互补多核苷酸。类似地,“氨基酸序列”是氨基酸的多聚体(蛋白质、多肽等)或代表氨基酸多聚体的字符串,这取决于内容。术语“蛋白质”、“多肽”和“肽”在本文可以互换使用。当其部分或完全从其通常相伴随的成分(其它蛋白质、核酸、细胞、合成试剂等) 中分离出来时就说多核苷酸,多肽或其它成分是“分离的”。当其是人造或工程改造的,或衍生自人造或工程改造的蛋白质或核酸的就说核酸或多肽是“重组的”。例如,一多核苷酸被插入载体或任何其它异源性位置(例如插入重组生物的基因组中),这样它就不和在自然界中发现的通常位于多核苷酸侧翼的核苷酸序列结合,这种多核苷酸是重组多核苷酸。重组多核苷酸体外或体内表达的蛋白质是重组多肽的例子。同样,在自然界中不出现的多核苷酸序列,如天然产生的基因的变体,是重组体。术语“草甘膦N-乙酰转移酶多肽”和“GAT多肽”可以互换使用,指本文提供的新型多肽家族的任何成员。术语“草甘膦N-乙酰转移酶多核苷酸”和“GAT多核苷酸”可以互换使用,指编码 GAT多肽的寡核苷酸。“亚序列”或“片段”是完整序列的一部分。当多聚体的其给定的单体化合物(氨基酸残基、掺入的核苷酸等)的位置与选定的参比多肽或多核苷酸中相同残基的位置一致时,氨基酸多聚体或核酸的编号与选定的氨基酸多聚体或核酸的编号一致。载体是一种能促进细胞被选定的核酸转导或该核酸在细胞中表达的组合物。载体包括,例如,质粒、粘粒、病毒、YAC、细菌、聚赖氨酸、染色体整合载体、附加体载体等。“多核苷酸或氨基酸序列的基本全长”是指至少约70%,通常至少约80%,或典型约为90%或更多的序列。本文使用的“抗体”是指含有基本或部分由免疫球蛋白基因或免疫球蛋白基因片段编码的一种或多种多肽的蛋白质。已知的免疫球蛋白基因包括K、λ、α、Υ、δ、ε禾口 μ恒定区基因,以及各种各样免疫球蛋白可变区基因。轻链是按K或λ分类的。重链是按Y、μ、α、δ或ε分类的,它们又决定了免疫球蛋白类型,分别为IgG、IgM、IgA、IgD和 IgE0典型的免疫球蛋白(抗体)结构单位包括一种四聚体。每个四聚体由相同的两对多肽链构成,每对含有一条“轻链”(约25kD)和一条“重”链(约50-70kD)。各条链的N-末端明确为大约100-110或更多氨基酸的主要负责抗体识别的可变区。术语可变轻链(VL)和可变重链(VH)分别指这些轻链和重链。抗体以完整的免疫球蛋白存在或以各种肽酶消化产生的特征已清楚的片段存在。因此,例如,胃蛋白酶在绞链区的二硫键以下消化抗体产生 F (ab),2,它是Fab的二聚体,Fab自身是一条轻链通过二硫键结合到VH-CHl。可在温和条件下还原F(ab),2打断绞链区的二硫键,将F(ab),2 二聚体转变成Fab,单体。Fab,单体实质上是带有部分绞链区的Fab (参见Fundamental Immunolc^y,第四版,W. E. Paul (编), Raven出版社,纽约(1998)以了解其它抗体片段更详细的描述)。由于是按照对完整抗体的消化来定义抗体片段的,熟练的技术人员将知道,可以用化学方法或通过重组DNA方法从头合成这种Fab’片段。因此,本文所用的抗体这一术语还包括通过修饰完整抗体或用重组DNA法从头合成产生的抗体片段。抗体包括单链抗体,这种单链Fv(sFv)抗体中重链可变区和轻链可变区连接在一起(直接连接或通过肽接头)形成一条连续的多肽。“叶绿体转运肽”是一种氨基酸序列,它和一蛋白质连接一起翻译并将该蛋白质导向叶绿体或产生此蛋白质的细胞中存在的其它质体形式。“叶绿体转运序列”是指编码叶绿体转运肽的核苷酸序列。“信号肽”是一种氨基酸序列,它和一蛋白质连接一起翻译并将该蛋白质导向分泌系统(Chrispeels, J. J.,(1991)Ann. Rev. Plant Phys. Plant Mol. Biol. 42 :21-53)。如果要将此蛋白质导向液泡,可以进一步加入液泡定向信号肽(同上),或者如果要导向内质网, 则可以加入内质网保留信号肽(同上)。如果要将蛋白质导向细胞核,可以除去存在的信号肽而加入核定位信号肽(Raikhel,N. (1992) Plant Phys. 100 :1627-1632)。当术语“多样化”和“多样性”用于多核苷酸时,指产生了多种修饰形式的亲代多核苷酸或多种亲代多核苷酸。当多核苷酸编码多肽时,该多核苷酸的核苷酸序列的多样性可以导致相应编码多肽的多样性,例如编码许多多肽变体的多样性多核苷酸库。在本发明的一些实施方案中,这种序列多样性是通过筛选/选择多样性多核苷酸文库中带有所需功能特征的变体(如编码具有增强的功能特征的GAT多肽的多核苷酸)而获得的。术语“编码”是指一核苷酸序列编码一种或多种氨基酸序列的能力。这一术语不需要起始或终止密码子。氨基酸序列可以在多核苷酸序列及其互补序列提供的六种不同阅读框的任何一种之中被编码。当用于本文时,术语“人造变体”是指具有GAT活性的多肽,它由经修饰的GAT多核苷酸(如SEQ ID NO 1-5和11-262中任一的修饰形式)或分离自生物体的天然产生的 GAT多核苷酸编码。经修饰的多核苷酸(当它在合适宿主中表达时可以产生人造变体)是通过修饰GAT多核苷酸的人工干涉获得的。术语“核酸构建物”或“多核苷酸构建物”是指单链或双链的核酸分子,它是从天然产生的基因中分离的,或经修饰而含有以自然界中不存在的方式的核酸片段。当核酸构建物含有表达本发明编码序列所需的控制序列时,术语核酸构建物和术语“表达盒”是同义的。术语“控制序列”本文定义为包括表达本发明多肽所需或有利于其表达的所有成分。每种控制序列对于编码该多肽的核酸序列或可以是天然的或外来的。这种控制序列包括但不限于前导区、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。控制序列至少包括启动子和转录和翻译终止信号。可以提供带接头的控制序列以引入的特定的限制性位点便于控制序列与编码多肽的核苷酸序列的编码区连接。术语“操作性连接”本文定义为一种构型,此构型中控制序列被适当地放在与DNA 序列的编码序列有关的位置上,使该控制序列能指导多肽的表达。当用于本文时,术语“编码序列”包括直接确定其蛋白质产物氨基酸序列的核苷酸序列。编码序列的边界一般由通常以ATG起始密码子开始的开放阅读框确定的。编码序列通常包括DNA、cDNA和/或重组核苷酸序列。在本文中,术语“表达”包括任何与多肽制造有关的步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。在本文中,术语“表达载体”包括线性或环状DNA分子,它包括编码本发明多肽的区段,并操作性连接于提供其转录的其它区段。当用于本文时,术语“宿主细胞”包括易接受核酸构建物转化的任何类型的细胞。术语“植物”包括所有植物、枝条营养器官/结构(如叶、茎和块茎)、根、花和花器官/结构(如苞片、萼片、花瓣、雄蕊、心皮、花药和胚珠)、种子(包括胚、胚乳和种皮)以及
12果实(成熟卵巢)、植物组织(如微管组织、地面组织等)和细胞(如保卫细胞、卵细胞、毛状体等),以及它们的后代。可用于本发明方法的植物种类通常包括适合转化技术的高等和低等植物,包括被子植物(单子叶植物和双子叶植物)、裸子植物、蕨类植物和多细胞藻类。 包括各种倍数水平的植物,包括非整倍体、多倍体、二倍体、单倍体和半合子的。当用于本文时,术语“异源性”描述了两种或多种元素之间的关系,表明这些元素相互之间性质上是不相似的。因此,例如,一多核苷酸序列与某生物或第二个多核苷酸序列是“异源性的”,如果它来源于不同种类,或者,如果来自同一种类但对其原始形式进行了修饰。例如,操作性连接于异源性编码序列的启动子,指该编码序列来自不同于产生此启动子生物种类的另一种类,或者,如果来自同一种类则该编码序列在自然情况下与此启动子无关(例如,遗传工程构建的编码序列或不同生态型或变体的等位基因)。异源性多肽的例子是转基因生物中重组多核苷酸表达的多肽。异源性多核苷酸和多肽都是重组分子的形式。本文还定义或定性了许多其它的术语。草甘膦N-乙酰转移酶一方面,本发明提供了一个本文称为“草甘膦N-乙酰转移酶”、“GAT”或“GAT酶” 的分离的或重组的酶的新家族。GAT是具有GAT活性的酶,较好的是具有足够的活性赋予工程改造的表达GAT的转基因植物某种程度草甘膦抗性。GAT的一些例子包括下面将更详细描述的GAT多肽。当然,GAT介导的草甘膦抗性是GAT活性、转基因植物中GAT表达水平、特定植物、 应用除草剂的性质和时间安排等的复杂函数。此领域的技术人员无需过多的实验就可以确定发挥草甘膦抗性所需的GAT活性水平的具体范围。可以用常规的动力学参数k。at、Km和k。at/KM特征鉴定GAT活性。k。at可看作是对乙酰化速度的衡量,尤其是在底物浓度高时,Km是对GAT与其底物(如乙酰CoA和草甘膦) 亲和性的衡量,k。at/KM是对催化效力的衡量,它同时考虑了底物亲和性和催化速度一当底物浓度至少部分是速度的限制因素时,这个参数就特别重要。通常,具有较高k。at或k。at/KM 的GAT较之具有较低k。at或k。at/KM的GAT是更有效的催化剂。因此,为确定一种GAT是否比其它GAT更有效,我们可以比较两种酶的动力学参数。k。at、kcat/KM和Km的相对重要性将根据希望达到的GAT的作用范围(例如,期望的草甘膦的有效浓度与草甘膦的Km有关)而不同。也可以根据任一功能特征(如稳定性、对抑制剂的敏感性或其它分子的活化作用等) 来特征鉴定GAT的活性。草甘膦N-乙酰转移酶多肽—方面,本发明提供了一个本文称为“草甘膦N-乙酰转移酶多肽”或“GAT多肽” 的分离的或重组的多肽的新家族。GAT多肽的特征是它们和新GAT家族的结构相类似。许多但不是所有的GAT多肽是GAT。区别是,GAT是以功能确定的,而GAT多肽是用结构确定的。GAT多肽的一个亚组由那些具有GAT活性(更好是将赋予表达此蛋白的转基因植物草甘膦抗性的水平达到有效水平)的GAT多肽构成的。一些优选的用于赋予草甘膦抗性的 CAT多肽的k。at至少为ImirT1,或更好是至少IOmirT1、IOOmirT1或lOOOmin—1。其它优选的用于赋予草甘膦抗性的CAT多肽的Km不超过IOOmM,或更好是不超过10mM、ImM或0. ImM。其它优选的用于赋予草甘膦抗性的CAT多肽的k。at/KM至少为ImM-1HiirT1或更大,较好是至少为 IOmr1Iiiirr1 UOOmr1Iiiirr1 UOOOmM^nirT1 或 10,OOOmM^nirT1。
示范性的GAT多肽已经从各种细菌菌株中被分离出来并作了特性。鉴定一种已经被分离并作了特性鉴定的单体GAT多肽的例子具有约17kD的分子半径。一种分离自地衣芽孢杆菌菌株的示范性GAT酶,SEQ ID NO -J,显示对草甘膦的Km约为2. 9mM,对乙酰CoA 的Km约为2 μ M, kcat等于6/分钟。术语“GAT多肽”指任何含有可与选自SEQ ID NO :6_10和沈3_514的氨基酸序列有最佳序列对比的氨基酸序列的多肽,产生的相似性采用BL0SUM62矩阵法评分至少为 430,存在一个缺口扣11分,延伸一个缺口扣1分。本发明的一些方面涉及含有可与选自 SEQ ID NO 6-10和沈3_514的氨基酸序列有最佳序列对比的氨基酸序列的GAT多肽,产生的相似性采用 BL0SUM62 矩阵法评分至少为 440、445、450、455、460、465、470、475、480、485、 490、495、500、505、510、515、520、525、530、535、540、545、550、555、560、565、570、575、580、 585、590、595、600、605、610、615、620、625、630、635、640、645、650、655、660、665、670、675、 680、685、690、695、700、705、710、715、720、725、730、735、740、745、750、755 或 760,存在一个缺口扣11分,延伸一个缺口扣1分。本发明的一个方面涉及含有可与SEQ ID NO :457有最佳序列对比的氨基酸序列的 GAT多肽,产生的相似性采用BL0SUM62矩阵法评分至少为430,存在一个缺口扣11分,延伸一个缺口扣1分。本发明的一些方面涉及含有可与SEQ ID NO :457有最佳序列对比的氨基酸序列的GAT多肽,产生的相似性采用BL0SUM62矩阵法评分至少为440、445、450、455、460、 465、470、475、480、485、490、495、500、505、510、515、520、525、530、535、540、545、550、555、 560、565、570、575、580、585、590、595、600、605、610、615、620、625、630、635、640、645、650、 655、660、665、670、675、680、685、690、695、700、705、710、715、720、725、730、735、740、745、 750、755或760,存在一个缺口扣11分,延伸一个缺口扣1分。本发明的一个方面涉及含有可与SEQ ID NO :445有最序列对比氨基酸序列的GAT 多肽,产生的相似性采用BL0SUM62矩阵法评分至少为430,存在一个缺口扣11分,延伸一个缺口扣1分。本发明的一些方面涉及含有可与SEQ ID NO :445有最佳序列对比的氨基酸序列的GAT多肽,产生的相似性采用BL0SUM62矩阵法评分至少为440、445、450、455、460、465、 470、475、480、485、490、495、500、505、510、515、520、525、530、535、540、545、550、555、560、 565、570、575、580、585、590、595、600、605、610、615、620、625、630、635、640、645、650、655、 660、665、670、675、680、685、690、695、700、705、710、715、720、725、730、735、740、745、750、 755或760,存在一个缺口扣11分,延伸一个缺口扣1分。本发明的一个方面涉及含有可与SEQ ID NO :300有最佳序列对比的氨基酸序列的 GAT多肽,产生的相似性采用BL0SUM62矩阵法评分至少为430,存在一个缺口扣11分,延伸一个缺口扣1分。本发明的一些方面涉及含有可与SEQ ID NO :300有最佳序列对比的氨基酸序列的GAT多肽,产生的相似性采用BL0SUM62矩阵法评分至少为440、445、450、455、460、 465、470、475、480、485、490、495、500、505、510、515、520、525、530、535、540、545、550、555、 560、565、570、575、580、585、590、595、600、605、610、615、620、625、630、635、640、645、650、 655、660、665、670、675、680、685、690、695、700、705、710、715、720、725、730、735、740、745、 750、755或760,存在一个缺口扣11分,延伸一个缺口扣1分。所谓两个序列是“有最佳序列对比”,指当它们排列对比时用确定的氨基酸取代矩阵(如BL0SUM62)计算出它们得到的相似性评分,经缺口存扣分和缺口延伸扣分后达到那对序列可能的最高评分。氨基酸取代矩阵和它们在量化两个序列之间相似性中的应用是本领域熟知的,其描述见,例如,Dayhoff 等(1978) "A model of evolutionary change in proteins,,,收录在"Atlas of Protein Sequence and Structure,,第 5 卷,±曾补本 3 (Μ. 0. Dayhoof 编),第 345-352 页,Natl. Biomed. Res. Found.,华盛顿特区和 Henikoff 等(1992)Proc. Natl. Acad. ki. USA 89 10915-10919。BL0SUM62 矩阵(图 10)在 Gapped BLAST 2. O等序列对比方案中经常被用作默认评分取代矩阵。对对比序列之一中引入一个氨基酸缺口采取缺口存在扣分,并对插入已打开缺口的每增加一个空氨基酸位点采取缺口延伸扣分。序列对比是以参加对比的各序列开始和结束处的氨基酸位置说明的,且可以选择在一个或两个序列中插入一个缺口或多个缺口来说明,以便达到最高的可能评分。尽管最佳序列对比和评分可以手工完成,但使用计算机辅助序列对比算法可以加快这一过程,这种算法有(例如)gapped BLAST 2. 0,它的描述见Altschul等(1997)Nucleic Acid Res. 25 :3389-3402,公众可以在National Center for Biotechnology Information Website (http://www.ncbi.nlm.nih. gov)上获得。最佳序列对比,包括多个序列对比,可以用(例如)PSI-BLAST制备,这可以通过http://www. ncbi. nlm. nih. gov获得,其描述见 Altschul 等(1997)Nucleic AcidRes. 25:3389-3402。至于与参比序列有最佳序列对比的氨基酸序列,某氨基酸残基与参比序列中序列对比时相配对的残基的位置“相对应”。该“位置”通过依次鉴定参比序列中各个氨基酸的位置相对于N-末端的数字表示。例如,在SEQ ID NO :300中位置1是M,位置2是I,位置 3是E等。当实验序列与SEQ ID NO :300有最佳序列对比时,实验序列中与位置3的E相对应的残基,指与SEQ ID NO :300的“位置3相对应”。当确定最佳序列对比时必需考虑缺失、插入、平截、融合等,通常仅仅通过从N-末端计数确定的实验序列中氨基酸残基的数目不必与参考序列中其相应位置的数目相同。例如,如果在配对的实验序列中有缺失,则在缺失位置上参考序列中就没有与此位置相应的氨基酸。当配对的参考序列中有插入时,则此插入就不与参考序列中任何氨基酸位置一致。至于平截或融合,则在参考或配对的参考序列中可以有不和相应序列中任何氨基酸一致的伸出的氨基酸。术语“GAT多肽”还可以指含有与选自SEQ ID NO :6_10和沈3_514的氨基酸序列至少有40%的序列同一性的氨基酸序列的多肽。本发明的一些方面涉及含有与选自SEQ ID NO 6-10 和 263-514 的氨基酸序列至少有 60 % ,70 % ,80 % ,90 % ,92 % ,95 % ,96 % ,97 %, 98%或99%序列同一性的氨基酸序列的多肽。本发明的一个方面涉及含有与SEQ ID NO :445至少有40%的序列同一性的氨基酸序列的GAT多肽。本发明的一些方面涉及含有与SEQ ID而457至少有60%、70(%、80(%、 90%、92%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的GAT多肽。本发明的一个方面涉及含有与SEQ ID NO :300至少有40%序列同一性的氨基酸序列的GAT多肽。本发明的一些方面涉及含有与SEQ IDNO :300至少有60%、70%、80%、 90%、92%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的GAT多肽。术语“GAT多肽”还指含有与选自SEQ ID NO :6_10和沈3_514的氨基酸序列残基 1-96至少有40%序列同一性的氨基酸序列的多肽。本发明的一些方面涉及含有与选自SEQ ID NO :6-10 禾Π 263-514 的氨基酸序列残基 1-96 至少有 60%、70%、80%、90%、92%、95%、 96 %、97 %、98 %或99 %序列同一性的氨基酸序列的多肽。
15
本发明的一个方面涉及含有与SEQ ID NO :457的残基1_96至少有40%序列同一性的氨基酸序列的GAT多肽。本发明的一些方面涉及含有与SEQ ID NO :457的残基1_96 至少有60%、70%、80%、90%、92%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的GAT多肽。本发明的一个方面涉及含有与SEQ ID NO :445的残基1-96至少有40%序列同一性的氨基酸序列的GAT多肽。本发明的一些方面涉及含有与SEQ ID NO :445的残基1_96 至少有60%、70%、80%、90%、92%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的GAT多肽。本发明的一个方面涉及含有与SEQ ID NO :300的残基1-96至少有40%序列同一性的氨基酸序列的GAT多肽。本发明的一些方面涉及含有与SEQ ID NO :300的残基1_96 至少有60%、70%、80%、90%、92%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的GAT多肽。术语“GAT多肽”还指含有与选自SEQ ID NO :6_10和沈3_514的氨基酸序列残基 51-146至少有40%序列同一性的氨基酸序列的多肽。本发明的一些方面涉及含有与选自 SEQ ID NO :6-10 和 263-514 的氨基酸序列的残基 51-146 至少有 60%、70%、80%、90%、 92%、95%、96%、97%、98%或99%序列同一性的氨基酸序列的多肽。本发明的一个方面涉及含有与SEQ ID NO :457的残基51-146至少有40%序列同一性的氨基酸序列的GAT多肽。本发明的一些方面涉及含有与SEQ ID NO :457的残基 51-146 至少有 60%、70%、80%、90%、92%、95%、96%、97%、98%或 99%序列同一性的氨基酸序列的GAT多肽。本发明的一个方面涉及含有与SEQ ID NO :445的残基51-146至少有40%序列同一性的氨基酸序列的GAT多肽。本发明的一些方面涉及含有与SEQ ID NO :445的残基 51-146 至少有 60%、70%、80%、90%、92%、95%、96%、97%、98%或 99%序列同一性的氨基酸序列的GAT多肽。本发明的一个方面涉及含有与SEQ ID NO :300的残基51-146至少有40%序列同一性的氨基酸序列的GAT多肽。本发明的一些方面涉及含有与SEQ ID NO :300的残基 51-146 至少有 60%、70%、80%、90%、92%、95%、96%、97%、98%或 99%序列同一性的氨基酸序列的GAT多肽。如本文所用,当术语“同一性”或“同一性百分比”用于具体的一对进行序列对比的氨基酸时,指通过 ClustalW 分析(版本 Wl. 8,获自 European Bioinformatics Institute, 剑桥,英国)获得的氨基酸序列同一性的百分比,计算序列对比中相同匹配的数目并用 (i)对比序列的长度和(ii)96中较大的数除以此相同匹配的数目,并采用以下默认的 ClustalW参数以实现慢/准确切换成对序列对比-缺口开放扣10分;缺口延伸扣0. 10 分;蛋白质重量矩阵=Gormet系列;DNA重量矩阵IUB ;Toggle慢/快切换成对序列对比= SLOW或FULL序列对比。另一方面,本发明提供了分离或重组的多肽,它们含有选自SEQ ID N0:6-10和 263-514的氨基酸序列中至少20,或者50,75,100,125或140个邻接的氨基酸。另一方面,本发明提供了分离或重组的多肽,它们含有SEQ ID NO :457中至少20, 或者50,100或140个邻接的氨基酸。
另一方面,本发明提供了分离或重组的多肽,它们含有SEQ ID NO :445中至少20, 或者50,100或140个邻接的氨基酸。另一方面,本发明提供了分离或重组的多肽,它们含有SEQ ID NO :300中至少20, 或者50,100或140个邻接的氨基酸。另一方面,本发明提供了含有选自SEQ ID而6-10和沈3-514的氨基酸序列的多肽。本发明一些优选的GAT多肽具有以下特征。当与选自SEQ ID NO :6-10和沈3_514 的参比氨基酸序列有最佳序列对比时,多肽中至少有90%的与以下位置相对应的氨基酸残基遵守以下规则(a)位置 2、4、15、19、洸、28、31、45、51、54、86、90、91、97、103、105、106、 114、123、129、139 和/ 或 145 的氨基酸残基是 Bl ;以及(b)位置 3、5、8、10、11、14、17、18、 24、27、32、37、38、47、48、49、52、57、58、61、62、63、68、69、79、80、82、83、89、92、100、101、 104、119、120、124、125、126、128、131、143 和 / 或 144 的氨基酸残基是 B2 ;其中 Bl 是选自 A、 I、L、M、F、W、Y和V的氨基酸;B2是选自R、N、D、C、Q、E、G、H、K、P、S和T的氨基酸。当用来表示氨基酸或氨基酸残基时,单字母名称A、C、D、E、F、G、H、I、K、L、M、N、P、Q、R、S、T、V、 W和Y具有如该领域所用的标准含义,并如本文表2所提供的含义。本发明一些优选的GAT多肽具有以下特征。当与选自SEQ ID NO :6-10和沈3_514 的参比氨基酸序列有最佳序列对比时,该多肽中至少有80%的与以下位置相对应的氨基酸残基遵守下列规则:(a)位置 2、4、15、19、洸、28、51、54、86、90、91、97、103、105、106、114、 129、139和/或145的氨基酸残基是Zl ; (b)位置31和/或45的氨基酸残基是Z2 ; (c)位置8和/或89的氨基酸残基是Ti ; (d)位置82、92、101和/或120的氨基酸残基是TA ; (e) 位置3、11、27和/或79的氨基酸残基是Z5 ; (f)位置123的氨基酸残基是Zl或Z2 ; (g)位置 12、33、35、39、53、59、112、132、135、140 和 / 或 146 的氨基酸残基是 Zl 或 ; (h)位置 30 的氨基酸残基是Zl或Z4 ;⑴位置6的氨基酸残基是Zl或Z6 ; (j)位置81和/或113的氨基酸残基是Z2或D ; (k)位置138和/或142的氨基酸残基是Z2或Z4 ;⑴位置5、17、 24,57,61,124和/或126的氨基酸残基是D或Z4 ; (m)位置104的氨基酸残基是D或Z5 ; (ο)位置38、52、62和/或69的氨基酸残基是D或Z6 ; (ρ)位置14、119和/或144的氨基酸残基是Ζ4或Ζ5 ; (q)位置18的氨基酸残基是Z4或Z6 ; (r)位置10、32、48、63、80和/ 或83的氨基酸残基是Z5或Z6 ; (s)位置40的氨基酸残基是Z1、Z2或; (t)位置65和/ 或96的氨基酸残基是Zl、D或Z5 ; (u)位置84和/或115的氨基酸残基是Zl、D或Z4 ; (ν)位置93的氨基酸残基是Ζ2、D或Ζ4 ; (w)位置130的氨基酸残基是Z2、Z4或Z6 ; (χ) 位置47和/或58的氨基酸残基是Ζ3、Ζ4或Ζ6 ; (y)位置49、68、100和/或143的氨基酸残基是Z3、Z4或Z5 ; (ζ)位置131的氨基酸残基是Ζ3、Ζ5或Ζ6 ; (aa)位置125和/或1 的氨基酸残基是Z4、Z5或Z6 ;(ab)位置67的氨基酸残基是Z1、Z3、Z4或Z5 ; (ac)位置60 的氨基酸残基是Z1、Z4、Z5或Z6 ;以及(ad)位置37的氨基酸残基是D、Z4、Z5或Z6 ;其中 Zl是选自A、I、L、M和V的氨基酸;Z2是选自F、W和Y的氨基酸J3是选自N、Q、S和T的氨基酸;Z4是选自R、H和K的氨基酸;Z5是选自D和E的氨基酸;Z6是选自C、G和P的氨基酸。本发明一些优选的GAT多肽具有以下特征。当与选自SEQ ID NO :6-10和沈3_514 的参比氨基酸序列有最佳序列对比时,该多肽中至少有90%的与以下位置相对应的氨基酸
17残基遵守下列规则:(a)位置 1、7、9、13、20、36、42、46、50、56、64、70、72、75、76、78、94、98、 107、110、117、118、121 和 / 或 141 的氨基酸残基是 Bl ;以及(b)位置 16、21、22、23、25、29、 34、41、43、44、55、66、71、73、74、77、85、87、88、95、99、102、108、109、111、116、122、127、133、 134、136和/或137的氨基酸残基是B2 ;其中Bl是选自A、I、L、M、F、W、Y和V的氨基酸; B2 是选自 R、N、D、C、Q、E、G、H、K、P、S 和 T 的氨基酸。本发明一些优选的GAT多肽具有以下特征。当与选自SEQ ID NO :6-10和沈3_514 的参比氨基酸序列有最佳序列对比时,多肽中至少有90%的与以下位置相对应的氨基酸残基遵守下列规则:(a)位置 1、7、9、20、36、42、50、64、72、75、76、78、94、98、110、121 和 / 或 141的氨基酸残基是Zl ; (b)位置13、46、56、70、107、117和/或118的氨基酸残基是Z2 ; (c)位置 23、55、71、77、88 和 / 或 109 的氨基酸残基是 Z3 ; (d)位置 16、21、41、73、85、99 和 /或111的氨基酸残基是Z4 ; (e)位置34和/或95的氨基酸残基是Z5 ; (f)位置22、25、 29、43、44、66、74、87、102、108、116、122、127、133、134、136 和 / 或 137 的氨基酸残基是 Z6 ; 其中Zl是选自A、I、L、M和V的氨基酸;Z2是选自F、W和Y的氨基酸J3是选自N、Q、S和 T的氨基酸;Z4是选自R、H和K的氨基酸;Z5是选自D和E的氨基酸;以及Z6是选自C、G 和P的氨基酸。本发明一些优选的GAT多肽具有以下特征。当与选自SEQ ID NO :6-10和沈3_514 的参比氨基酸序列有最佳序列对比时,多肽中至少有80%与以下位置相对应的氨基酸残基遵守下列规则(a)位置2的氨基酸残基是I或L ; (b)位置3的氨基酸残基是E或D ; (c) 位置4的氨基酸残基是V、A或I ; (d)位置5的氨基酸残基是K、R或N ; (e)位置6的氨基酸残基是P或L ; (f)位置8的氨基酸残基是N、S或T ; (g)位置10的氨基酸残基是E或G ; (h)位置11的氨基酸残基是D或E ; (i)位置12的氨基酸残基是T或A ; (j)位置14的氨基酸残基是E或K ; (k)位置15的氨基酸残基是I或L ; (1)位置17的氨基酸残基是H或 Q ; (m)位置18的氨基酸残基是R、C或K ; (η)位置19的氨基酸残基是I或V ; (ο)位置M 的氨基酸残基是Q或R ; (P)位置26的氨基酸残基是L或I ; (q)位置27的氨基酸残基是E 或D ; (r)位置观的氨基酸残基是A或V ; (s)位置30的氨基酸残基是K、M或R ;⑴位置 31的氨基酸残基是Y或F ; (u)位置32的氨基酸残基是E或G ; (ν)位置33的氨基酸残基是Τ、A或S ; (w)位置35的氨基酸残基是L、S或M ; (χ)位置37的氨基酸残基是R、G、E或 Q ; (y)位置38的氨基酸残基是G或S ; (ζ)位置39的氨基酸残基是T、A或S ; (aa)位置40 的氨基酸残基是F、L或S ; (ab)位置45的氨基酸残基是Y或F ; (ac)位置47的氨基酸残基是R、Q或G ; (ad)位置48的氨基酸残基是G或D ; (ae)位置49的氨基酸残基是K、R、E或 Q ; (af)位置51的氨基酸残基是I或V ; (ag)位置52的氨基酸残基是S、C或G ; (ah)位置 53的氨基酸残基是I或T ; (ai)位置M的氨基酸残基是A或V ; (aj)位置57的氨基酸残基是H或N ; (ak)位置58的氨基酸残基是Q、K、N或P ; (al)位置59的氨基酸残基是A或 S ; (am)位置60的氨基酸残基是E、K、G、V或D ; (an)位置61的氨基酸残基是H或Q ; (ao) 位置62的氨基酸残基是P、S或T ; (ap)位置63的氨基酸残基是E、G或D ; (aq)位置64的氨基酸残基是E、D、V或Q ; (ar)位置67的氨基酸残基是Q、E、R、L、H或K ; (as)位置68的氨基酸残基是K、R、E或N ; (at)位置69的氨基酸残基是Q或P ; (au)位置79的氨基酸残基是E或D ; (av)位置80的氨基酸残基是G或E ; (aw)位置81的氨基酸残基是Y、N或F ; (ax)位置82的氨基酸残基是R或H ; (ay)位置83的氨基酸残基是E、G或D ; (az)位置84的氨基酸残基是Q、R或L;(ba)位置86的氨基酸残基是A或V; (bb)位置89的氨基酸残基是T或S ; (be)位置90的氨基酸残基是L或I ; (bd)位置91的氨基酸残基是I或V ; (be) 位置92的氨基酸残基是R或K ; (bf)位置93的氨基酸残基是H、Y或Q ; (bg)位置96的氨基酸残基是E、A或Q ; (bh)位置97的氨基酸残基是L或I ; (bi)位置100的氨基酸残基是 K、R、N或E ; (bj)位置101的氨基酸残基是K或R ; (bk)位置103的氨基酸残基是A或V ; (bl)位置104的氨基酸残基是D或N ; (bm)位置105的氨基酸残基是L或M ; (bn)位置106 氨基酸残基是L或I ; (bo)位置112的氨基酸残基是T或I ; (bp)位置113的氨基酸残基是S、T或F ; (bq)位置114的氨基酸残基是A或V ; (br)位置115的氨基酸残基是S、R或 A ; (bs)位置119的氨基酸残基是K、E或R;(bt)位置120的氨基酸残基是K或R ;(bu)位置123的氨基酸残基是F或L ; (bv)位置IM的氨基酸残基是S或R ; (bw)位置125的氨基酸残基是E、K、G或D ; (bx)位置126的氨基酸残基是Q或H ; (by)位置128的氨基酸残基是E、G或K ; (bz)位置129的氨基酸残基是V、I或A ; (ca)位置130的氨基酸残基是Y、H、 F或C;(cb)位置131的氨基酸残基是D、G、N或E;(cc)位置132的氨基酸残基是I、Τ、A、 Μ、V或L ; (cd)位置135的氨基酸残基是V、Τ、A或I ; (ce)位置138的氨基酸残基是H或 Y ; (cf)位置139的氨基酸残基是I或V ; (eg)位置140的氨基酸残基是L或S ; (ch)位置 142的氨基酸残基是Y或H ; (ci)位置143的氨基酸残基是K、T或E ; (cj)位置144的氨基酸残基是K、E或R ; (ck)位置145的氨基酸残基是L或I ;以及(cl)位置146的氨基酸残基是T或A。本发明一些优选的GAT多肽具有以下特征。当与选自SEQ ID NO :6-10和沈3_514 的参比氨基酸序列有最佳序列对比时,该多肽中至少有80%的与以下位置相对应的氨基酸残基遵守下列规则(a)位置9、76、94和110的氨基酸残基是A ;(b)位置四和108的氨基酸残基是C ; (c)位置34的氨基酸残基是D ; (d)位置95的氨基酸残基是E ; (e)位置56的氨基酸残基是F ; (f)位置43、44、66、74、87、102、116、122、127和136的氨基酸残基是G ; (g) 位置41的氨基酸残基是H ; (h)位置7的氨基酸残基是I ; (i)位置85的氨基酸残基是K ; (j)位置20、36、42、50、72、78、98和121的氨基酸残基是L ; (k)位置1、75和141的氨基酸残基是M ; (1)位置23,64和109的氨基酸残基是N ; (m)位置22、25、133、134和137的氨基酸残基是P ; (η)位置71的氨基酸残基是Q ; (ο)位置16、21、73、99和111的氨基酸残基是 R ; (P)位置55和88的氨基酸残基是S ; (q)位置77的氨基酸残基是T ; (r)位置107的氨基酸残基是W;以及(s)位置13、46、70、117和118的氨基酸残基是Y。本发明一些优选的GAT多肽具有以下特征。当与选自SEQ ID NO :6-10和沈3_514 的参比氨基酸序列有最佳序列对比时,与位置28相对应的多肽的氨基酸残基是V或A。位置观的缬氨酸通常与降低的Km相关,而此位置上的丙氨酸通常与升高的k。at相关。其它优选的 GAT 多的特征是以具有 127(即位置 27 的 I)、M30、S35、R37、S39、G48、K49、N57、Q58、 P62、Q65、Q67、K68、E83、S89、A96、E96、RlOU T112、A114、K119、K120、E128、V129、D131、 T131、V134、R144、1145或T146或它们的任一组合为特征。本发明一些优选的GAT多肽含有选自SEQ ID NO :6_10和沈3_514的氨基酸序列。本发明进一步提供了以上述氨基酸残基位置限制的组合为特征的优选的GAT多肽。此外,本发明提供了编码上述优选的GAT多肽及其互补核苷酸序列的GAT多核苷酸。如本文所述,本发明的一些方面涉及具有GAT活性的GAT多肽任何上述种类的亚组。这些GAT多肽是优选的,例如,作为赋予植物草甘膦抗性的制剂。本文描述了所需的 GAT活性水平的例子。一方面,GAT多肽包括由天然来源(如细菌菌株)分离的重组或分离形式的天然产生的核酸编码的氨基酸序列。可以用本领域已知的标准技术特异性筛选编码此类GAT多肽的野生型多核苷酸。例如,通过表达表现GAT活性的杆菌菌株的序列的克隆发现了由SEQ ID NO :6-SEQ ID NO :10确定的多核苷酸,这在下文中有更详细的描述。本发明还包括分离或重组的多肽,它是由分离或重组的含有核苷酸序列的多核苷酸编码的,所述的核苷酸序列在严格条件下可以和几乎全长的选自SEQ IDNO :1-5和 11-262的核苷酸序列、它们的成分以及编码选自SEQ ID NO 6-10和沈3_514的氨基酸序列的核苷酸序列(包括它们的互补序列)杂交。本发明还包括任何具有GAT活性的多肽,它是由本文所述的GAT编码多核苷酸之一的片段编码的。本发明还提供了可以剪接形成功能性GAT多肽的GAT多肽片段。剪接可以在体外或体内进行,并可以包括顺式或反式(即分子内或分子间)剪接。这些片段本身可以(但不必需)具有GAT活性。例如,两个或多个GAT多肽区段可能被内含子分离;通过顺式剪接除去此内含子序列即产生了功能性GAT多肽。在另一个实施例中,编码的GAT多肽可以表达为两个或多个分离的片段;这些区段的反式剪接导致回收功能性GAT多肽。美国专利 09/517,933和09/710,686更详细的描述了各种顺式和反式剪接、基因编码和间插序列的引入,在此将它们全文并入以供参考。一般而言,本发明包括由于本文所述的多核苷酸序列的突变、递推序列重组和/ 或多样化变化而致的修饰的GAT多核苷酸编码的任何多肽。在本发明的一些方面,GAT多肽用单个或多个氨基酸取代、缺失、插入而修饰或一种或多种这些修饰的组合。取代可以是保守或非保守的,可以改变功能或不改变功能,并可以增加新的功能。插入和缺失可以是实质性的,比如截短的该序列的实质性片段,或者在内部或在N或C末端融合了附加序列。在本发明的一些实施方案中,GAT多肽是含有功能性附加物(例如分泌信号、叶绿体转运肽、 纯化用尾序列或许多其他功能基团之一,这些是本领域熟练技术人员懂得的)的融合蛋白的一部分,本说明书在别处对它们有更详细的描述。本发明的多肽可以含有一个或多个修饰的氨基酸。经修饰的氨基酸的存在可能有利于,例如,(a)提高多肽的体内半衰期,(b)降低或提高多肽抗原性,(c)提高多肽贮藏稳定性。在重组过程中氨基酸可共翻译而修饰或翻译后修饰(例如,在哺乳细胞中表达过程中N-X-S/T基序上N-连接的糖基化)或以合成方法修饰。修饰的氨基酸的非限制性例子包括糖基化的氨基酸、硫酸化的氨基酸、异戊二烯化的(prenlyated)(如法呢基化、牦牛儿牦牛儿基化)氨基酸、乙酰化的氨基酸、酰化的氨基酸、PEG基化的氨基酸、生物素化的氨基酸、羧基化的氨基酸、磷酸化的氨基酸等。有很多参考文献可以指导熟练的技术人员如何修饰氨基酸。示范性的方法见Walker (1998) Protein Protocols on CD-ROM. Human 出版社,Towata,NJ。本文描述了产生和分离本发明GAT多肽的重组方法。除了重组法,可以通过用固相技术引导肽合成来生产此多肽(如,Stewart等(1969) Solid-Phase PeptideSynthesis, WH Freeman 公司,旧金山;Merrifield T(1963) T. Am. Chem. Soc. 85 :2149-2154)。可以用人工技术或自动化完成肽合成。例如,可以用Applied Biosystems 431A肽合成仪(Perkin Elmer, Foster City,Calif.),按照制造商提供的说明实现自动合成。例如,可以分别化学合成诸个序列然后用化学方法将它们组合以得到全长的GAT多肽。这些肽也可以从各种来源定购。在本发明的另一方面,用本发明的GAT多肽来产生抗体,这些抗体具有诊断用途比如,涉及转基因植物各种组织中GAT多肽的活性、分布和表达。用于抗体诱导的GAT同系源肽不需要有生物学活性;然而,此多肽或寡肽必需有抗原性。用于诱导特异性抗体的肽可以含有由至少10个氨基酸,较好的是至少15-20个氨基酸组成的氨基酸序列。GAT多肽短的伸长部分可以与另一蛋白质融合,比如匙孔城血蓝蛋白和,产生抗核嵌合分子的抗体。制造多克隆和单克隆抗体的方法是本领域熟练技术人员已知的。参见,例如, ColiRan(1991)Current Protocols in ImmunoloRY Wiley/Greene,纽约州;以及 Harlow 和 Lane (1989) Antibodies :A Laboratory Manual 冷泉港出版社,纽约 #丨 ftites 等(编) Basic and Chinical ImmunoloRY ( H 4 M ) LanRe Medical 出版社,Los Altos,力口利福尼亚州,以及其中提到的参考资料:Goding(1986)MonoclonalAntibodies principles and Practice (第2版)学术出版社,纽约,纽约州;以及Kohler和Milstein (1975)Nature 256 495-497。其它合适的抗体制造技术包括噬菌体或类似载体中重组抗体库的筛选。参见, Huse 等(1989) Science 246 :1275-1281 ;以及 Ward 等(1989) Nature341 :544_546。特异的单克隆和多克隆抗体以及抗血清结合的Kd通常至少约为0. 1 μ M,较好的是至少约0. 01 μ M 或更好,最典型且最好的是0. 001 μ M或更好。其它详细的抗体制造和构建技术可以在Borrebaeck (编)(1995) AntibodyEngineering,第 2 版 Freeman and Company, M^l (Borrebaeck) ;MeCafferty 等(1996)Antibody Engineering,A Practical Approach IRL 牛津出版社,牛津,英国 (MeCafferty)以及Paul (1995) Antibody EnRineerinR Protocols Humana 出版社,Towata, 新泽西州(Paul)中找到。序列变异本发明的GAT多肽包括本文公开的SEQ ID NO :6_10和263-514号序列的保守性修饰的变异。这种保守性修饰的变异包括取代、插入或缺失,它改变、加入或删除了 SEQ ID NO 6-10和沈3-514中一个氨基酸或一小部分氨基酸(通常约少于5%,更典型的是少于约 4%、2%或 )。例如,本文称为SEQ ID NO 6的146个氨基酸的多肽的保守性修饰变异(如缺失),将具有长度至少为140个氨基酸,较好的是至少有141个氨基酸,更好是至少有144非氨基酸,最好至少有146个氨基酸,相应于不到大约5^^4^^2%或约或更少的多肽序列的缺失。根据表2(下文)列出的6个取代基,本文称为SEQ ID NO :6的多肽的保守性修饰的变异的另一个例子(如“保守性取代的变异”)将包括“保守性取代”,至多为146个氨基酸多肽的7个残基(即少于约5% )。
本发明的GAT多肽序列同类物,包括保守性取代的序列,可以较大多肽序列的一部分形式出现,如发生在GAT多肽中,GAT与单个序列(如叶绿体靶向序列)的融合或为了蛋白质纯化加入一个或多个功能域(聚组氨酸片段、FLAG尾片段等)。在后一种情况中,加入的功能域对蛋白质GAT部分的活性几乎没有或没有影响,或者可以通过蛋白酶处理等后合成加工步骤除去加入的功能域。通过免疫反应件鉴定多肽由于本发明的多肽提供了一类新的具有确定活性(即草甘膦的乙酰化)的酶,这种多肽还提供了(例如)在免疫试验中可被识别的新的结构特征。与本发明的多肽特异性结合的抗血清以及被此类抗血清结合的多肽的产生也许本发明的特征。本发明包括与抗体或抗血清特异性结合或特异性免疫反应的GAT多肽,这些抗体或抗血清所针对的免疫源含有选自SEQ ID NO :6-SEQ ID NO 10中一个或多个的氨基酸序列。为消除与其它GAT同类物的交叉反应,用可获得的相关蛋白(如相应于本申请的申请日已获得(以CAA70664、Z99109和Y09476为例)GenBank登录号的蛋白质或肽为代表的那些蛋白质)来吸收抗体或抗血清。当此登录号与某核酸相应时,就可以产生此核酸编码的多肽并将其用于抗体/抗血清的吸收。图3列出了示范的GAT多肽和Genbank中可得到的最密切相关的序列YitI之间的相对同一性。天然YitI的功能尚待阐明,但已经显示此酶具有可检测的GAT活性的酶。在一种典型的形式中,免疫试验使用了多克隆抗血清,这种抗血清可以抗一种或多种含有一个或多个与一个或多个SEQ ID NO :6-10和沈3-514或其取代的亚序列(即至少约占所提供序列全长的30% )的相应序列的多肽。所有衍生自SEQ IDNO :6_10和263-514 的潜在的多肽免疫原在下文中统称为“免疫原性多肽”。任意选择和其它相关序列有低交叉反应性的所得抗血清,并在免疫试验中使用这些多克隆抗血清之前,用一种或多种相关序列作免疫吸收除去任何此类交叉反应性。为制造用于免疫试验的抗血清,如上所述制造并纯化了一种或多种免疫原性多肽。例如,可以在细菌细胞系中制造重组蛋白。用免疫原性蛋白质加上标准佐剂(如弗氏佐剂)并用标准的小鼠免疫法免疫小鼠的近交品系(用于这种试验,因为这种小鼠实质上的遗传同一性试验结果更具重现性)(参见,Harlow和Lane (1988) Antibodies,A Laboratory Manual,冷泉港出版社,纽约,为对于抗体的产生免疫试验的形式和条件的规范说明,可用以确定特异性免疫反应性)。或者,将一种或多种衍生自本文公开的序列的合成或重组多肽与载体蛋白交联,将其用作免疫原。收集多克隆血清并在免疫试验(如将一种或多种免疫原性蛋白质固定在固体支持物上的固相免疫试验)中测定其抗免疫原性多肽的效价。选择效价为IO6或更高的多克隆抗血清,合并和用相关多肽(如所提到的由GENBANK鉴定的那些)吸收以产生经过吸收的混合的确定效价的多克隆抗血清。测试这种经吸收的混合的确定效价的多克隆抗血清与相关多肽的交叉反应性。在这种测定中最好使用至少两种免疫性GAT,且最好连同至少两种相关多肽,以鉴定被免疫原性蛋白特异性结合的抗体。在这种比较试验中,为经吸收并确定效价的多克隆抗血清确定有差别的结合条件,这导致与相关多肽的结合相比,确定效价的多克隆抗血清与免疫原性GAT多肽的结合信噪比至少高约5-10倍。这就是说,通过加入非特异性竞争物如白蛋白或脱脂乳粉或调节盐条件、温度等可以调节此结合反应的严紧性。将这些结合条件用于随后的试验以确定实验多肽是否被混合并经吸收的多克隆抗血清特异性结合。具体说,在有差别的结合条件下信噪比至少高出对照多肽2-5倍,并且与免疫原性多肽相比至少显示约1/2信噪比的实验多肽,与已知的GAT相比和免疫原性多肽有实质性的结构相似性,因此即是本发明的多肽。在另一个实施例中,采用竞争性结合模式的免疫试验来测定实验多肽。例如,像提到的那样,用对照GAT多肽作免疫吸收将交叉反应的抗体从合并的抗血清混合物中除去。 然后将此免疫原性多肽固定到固体支持物上使之与经吸收的混合抗血清接触。在测定中加入实验蛋白质,竞争与经吸收的混合抗血清结合。象与固定的蛋白质作比较那样,将实验蛋白质竞争结合经吸收的混合抗血清的能力,与加入试验中的免疫原性多肽竞争结合的能力相比较(此免疫原性多肽和固定的免疫原性多肽有力地竞争与混合抗血清结合)。用标准计算法计算出实验蛋白质交叉反应性的百分率。在平行试验中,对照蛋白质竞争结合经吸收的混合抗血清的能力,可以通过与免疫原性多肽竞争结合此抗血清的能力进行比较而确定。再者,用标准计算法计算出对照多肽交叉反应性的百分率。当交叉反应性至少高出实验多肽的百分5-10倍时,则说该实验多肽与经吸收的混合抗血清特异性结合。总之,免疫吸收并合并的抗血清可用于上述竞争性结合免疫试验,以比较任何实验多肽与免疫原性多肽。为进行这种比较,以宽浓度范围分别测定这两种多肽,并用标准技术确定各个多肽抑制50%经吸收抗血清与固定的蛋白质结合所需的量。如果实验多肽所需的量少于免疫原性多肽所需量的两倍,则说实验多肽与该免疫原性蛋白质产生的抗体发生了特异性结合,只要这个量至少高于对照多肽的5-10倍。作为特异性的最终鉴定,可以选用免疫原性多肽(而不是对照多肽)完全免疫吸收合并的抗血清直到几乎没有或不能检测到所得免疫原性多肽吸收的混合抗血清与免疫吸收所用的免疫原性多肽结合。然后测试这种完全免疫吸收过的抗血清与实验多肽的反应性。如果只观察到一点点或没有观察到活性(即观察到的完全免疫吸收的抗血清与免疫原性多肽结合的信噪比不超过2),则实验多肽被该免疫原性蛋白诱生的抗血清特异性结合。一方面,本发明提供了本文称为“草甘膦N-乙酰转移酶多核苷酸”或“GAT多核苷酸”的新的分离或重组多核苷酸家族。GAT多核苷酸序列的特征是能够编码GAT多肽。通常,本发明包括编码本文所述任何新的GAT多肽的核苷酸序列。在本发明的一些方法,编码具有GAT活性的GAT多肽的GAT多核苷酸是优选的。一方面,GAT多核苷酸包括重组或分离形式的天然产生的分离自生物(如细菌菌株)的核酸。通过显示GAT活性的杆菌菌株序列克隆的表达发现了 GAT多核苷酸的例子, 如SEQ ID N0:l-5。简而言之,对收集的大约500种杆菌和假单胞菌菌株天然产生N-乙酰化草甘膦的能力进行了筛选。让菌株在LB上生长过夜,离心收获,在稀释的甲苯中渗透,然后洗涤并重悬于含有缓冲液、5mM草甘膦和200 μ M乙酰CoA的反应混合物中。将细胞在反应混合物中培育1-48小时,培育结束后在反应物中加入等体积的甲醇。然后离心沉淀细胞并滤出上清,然后用母离子模式质谱法分析。如图2所示,将反应混合物的质谱图与N-乙酰草甘膦标准品进行比较鉴定反应产物为N-乙酰草甘膦阳性。产品检测取决于两种物质(乙酰CoA和草甘膦)并可以通过热变性细菌细胞而消除。然后通过功能性筛选从已鉴定的菌株克隆获得各种GAT多核苷酸。制备基因组 DNA并用Sau3Al酶部分消化。将大约4Kb的片段克隆入大肠杆菌表达载体并将其转化入电感受态大肠杆菌。按前面描述的反应用质谱法鉴定各个显示GAT活性的克隆,但是用PMBS 渗透替代甲苯洗涤。然后测序基因组片段并鉴定假定的GAT多肽编码开放阅读框。大肠杆菌中此开放阅读框的表达以及反应混合物产生的高水平N-乙酰草甘膦证实了对GAT基因的鉴定结果。在本发明的其它方面,GAT多核苷酸是通过多样化(如重组和/或突变一个或多个天然产生的、分离的或重组的GAT多核苷酸)产生的。像本文其它地方更加详细描述的那样,通常可以产生多样化的编码具有较高功能性(例如,高于用作底物的GAT多核苷酸或多样化过程中亲代的催化功能、稳定性和表达水平)的GAT多肽的GAT多核苷酸。本发明的多核苷酸在以下方面有多种用途,例如本发明GAT多肽的重组产物(即表达);作为转基因(如赋予转基因植物除草剂抗性);作为转化和质粒保留的选择性标记;作为免疫原;作为检测互补或部分互补核酸存在的诊断探针(包括检测编码天然GAT 的核酸);作为进一步产生多样性的底物,如制造新的和/或改进的GAT同类物的重组反应或突变反应,等等。值得一提的是,GAT多核苷酸的这种特定的、实质性的且可信的应用不需要编码多肽的多核苷酸具有实质性的GAT活性。例如,不编码活性酶的GAT多核苷酸可以是亲代多核苷酸的有价值来源,以用于为获得具有所需功能特性(例如,高kcat或kcat/Km、低Km、 对热或其它环境因素的高稳定性、高转录或翻译速度、对蛋白水解切制的抗性、减弱的抗原性等)的GAT多核苷酸变体或非GAT多核苷酸的多样化过程。例如,在DNA改组实验中已经将只有很少或没有可检测活性的编码蛋白酶变体的核苷酸序列用作亲代多核苷酸以产生编码较高活性蛋白酶的后代(Ness等(1999)Nature Biotechnology 17:893-96)。用多样性发生方法或递推序列重组(“RSR”)法(如DNA改组)产生的多核苷酸序列是本发明的一个特征。采用本文所述核酸的突变和重组方法是本发明第一个特征。例如,本发明的一种方法包括将一个或多个上下文所述的本发明的核苷酸序列与一个或多个其它的核苷递推重组。该重组步骤可以任选的在体内、活体内、硅中或体外进行。所述多样性发生或递推序列重组产生了至少一个重组修饰的GAT多核苷酸文库。本发明包括该文库成员编码的多肽。我们还考虑了多核苷酸本文也称为寡核苷酸的应用,它通常含至少12个碱基,较好至少15个,最好至少20、30或50或更多的碱基,它在严格或高严格条件下与GAT多核苷酸序列杂交。按照本文提出的方法,这种多核苷酸可用作探针、引物、有义或反义试剂等。根据本发明,GAT多核苷酸(包括编码GAT多肽、GAT多肽的片段、相关融合蛋白或其功能性的等价物的核苷酸序列)可用于在合适的宿主细胞(如细菌或植物细胞)中指导GAT多肽表达的重组DNA分子中。由于遗传密码固有的简并性,编码实质上同样的或功能等价的氨基酸序列的其它核酸序列,也可用于克隆和表达GAT多核苷酸。本发明提供了编码转录和/或翻译产物的GAT多核苷酸,它随后被剪接以最终产生功能性GAT多肽。剪接可以在体外或体内实现,并且可以包括顺式和反式剪接。剪接的底物可以是多核苷酸(如RNA转录物)或多肽。多核苷酸顺式剪接的例子是将插入编码序列的内含子除去并使两个侧接外显子区域剪接成为GAT多肽编码序列。反式剪接的例子是将编码序列分成两个或多个可以分别转录的片段,然后将其并接形成全长的GAT编码序列来编码GAT多核苷酸,。剪接增强子序列(可以将其引入本发明的构建物中)的应用有助于顺式或反式剪接。在本发明的其它地方将更详细地描述多肽的顺式和反式剪接。有关顺式和反式剪接更详细的描述可以在美国专利申请第09/517,933和09/710,686号中找到。因此,一些GAT多核苷酸不直接编码全长GAT多肽,但编码GAT多肽的片段或几个片段。可以通过与剪接有关的机制用这些GAT多核苷酸来表达功能性GAT多肽,剪接可以在多核苷酸(如内含子/外显子)和/或多肽(如intein/extein)水平发生。例如,在控制GAT活性的表达中这是有用的,因为如果在允许剪接加工以产生功能性产物的情况下表达所有所需的片段,则将只表达功能性GAT多肽。在另一个实施例中,在GAT多核苷酸中引入一个或多个插入序列可能有助于与低同源性多核苷酸的重组;对插入序列使用内含子或 intein有助于除去间插序列,因此可以保留被编码的变体的功能。精通此领域的技术人员将理解,修饰编码序列以增强其在特定宿主中的表达是有利的。遗传密码有64个可能的密码子,但大多数生物偏爱使用了这些密码子中的一部分。 在物种中最常使用的密码子称为最优密码子,而那些不常使用的密码子被列为稀有或低利用密码子(参见,例如,Zhang SP等(1991)Gene 105 :61-72)。可以进行取代密码子以反映宿主优选使用的密码子,这一过程有时称为“密码子优化”或“物种密码子偏爱控制”。可以制备含有某特定原核或真核宿主偏爱密码子的最优化的编码序列(也可以参见Murray,Ε.等(1989)Nuc. Acid Res. 17 :477-508),例如,以增加翻译速度或产生具有所需特性(如与用非最优化的序列产生的转录物相比,具有较长的半衰期)的重组RNA转录物。也可以修饰翻译终止密码子以反映宿主的偏爱性。例如,啤酒八叠球菌 (S. cerevisiae)和哺乳动物偏爱的终止密码子分别是UAA和UGA。单子叶植物偏爱的终止密码子是UGA,而昆虫和大肠杆菌偏爱使用UAA作为终止密码子(Dalphin ME等,(1996) Nuc. acids Res. 24 :216-218)。例如,在美国专利6,015,891和本文引用的参考资料中提供了优化核苷酸序列在植物中表达的方法。本发明的一个实施方案包括含有在相关宿主(如转基因植物宿主)中表达最佳密码子的GAT多核苷酸。当源自细菌的GAT多核苷酸被引入转基因植物(例如)以赋予植物草甘膦抗性时就特别需要这种多核苷酸。出于许多原因,可以基因工程方法改造本发明的多核苷酸序列以改变GAT多核苷酸,其中包括但不限于修饰该基因产物的克隆、加工和/或表达的变化。例如,可以用此领域熟知的技术(如定点突变)引入变化以插入新的限制性位点、改变糖基化模式、改变密码子偏爱、引入剪接位点等。由于这里更详细的描述,本发明的多核苷酸包括编码新的GAT多肽的序列和与该编码序列互补的序列,以及编码序列及其互补序列的新片段。此多核苷酸可以是RNA或DNA 是形式,并包括mRNA、cRNA、合成的RNA和DHA、基因组DNA和cDNA。此多核苷酸可以是双链或单链的,且如果是单链,则可以是编码链或非编码(反义、互补)链。此多核苷酸任选地包括GAT多肽的编码序列,其中的编码序列可以是⑴分离的,(ii)和其它编码序列结合, 以编码(例如)融合蛋白、前体蛋白、前原蛋白(pr印ro-protein)等,(iii)与非编码序列 (如内含子或intein、控制元件如启动子、增强子、终止元件或对编码序列在合适宿主中表达有效的5’和/或3’非翻译区)结合,和/或(iv)在载体或宿主环境中,GAT多核苷酸是异种基因。还可以发现这些序列可与典型的核酸组合物制品(包括存在载体、缓冲剂、佐剂、赋形剂等)结合。根据已知的合成方法,可以用标准固相方法制备本发明的多核苷酸和寡核苷酸。 通常,分别合成100个碱基以上的片段,然后连接(例如,通过酶或化学连接方法,或聚合酶介导的方法)形成实际所需的连续序列。例如,可以通过化学合成法,采用,例如,Beaucage 等(IgSl)jTetrahedron Letters 22 1859-69 描述的经典亚磷酰胺法或 Matthes 等(1984) EMBO J. 3 :801-05描述的方法,或例如,自动化合成法中通常所用的方法,制备本发明的多核苷酸和寡核苷酸。根据亚磷酰胺法,寡核苷酸是在(例如)自动DNA合成器中合成的,并纯化、退火、连接和克隆合适的载体中。此外,实际上任何核酸都可以从众多商业来源之一按需要订购,如The Midland Certified Reagent Company(mereOoligos. com)、The Great American Gene Company (http : //www. genco. com)、ExpressGen Inc. (www. expressgen. com)、Operon Technologies Inc. (Alameda,加利福尼亚州)等等。同样,肽和抗体也可以从任何众多来源按需要订购,如 PeptidoGenic (pkim@ccnet. com)、HTI Bio-products, Inc. (http://www. htibio. com)、BMA Biomedical Ltd (英国)、Bio. Synthesi s,Inc. j ο也可以用熟知的技术文献中描述的技术,合成多核苷酸。例如可以参见 Carruthers 等,Cold Spring Harbor Symp. Quant. Biol. 47 :411-418(1982)以及 Adams 等, J. Am. Chem. Soc. 105 :661 (1983)。然后可以通过合成互补链并在合适的条件下将链一起退火,或者通过采用合适的引物序列以DNA聚合酶加入互补链,以获得双链DNA片段。描述用于本发明的分子生物技术(包括诱变)的普通读本包括Berger和Kimmel, Guide to Molecular Cloning Techniques. Methods in Enzymology,第 152 卷,学术出版公司,圣地亚哥,加利福尼亚州(“Berger" ) ;Sambrook等,MolecularCloninR-A Laboratory Manual (第二版),第1_3卷,冷泉港实验室,冷泉港,纽约,1989 (“Sambrook"); 以及 Current Protocols in MolecularBiology, F. Μ. Ausubel 等编,Current Protocols, Greene Publishing Associates 公司和John Wiley & Sons公司的合资公司,(2000增补) ("Ausubel")。这些技术的举例,足以指导熟练技术人员实施体外扩增法,包括聚合酶链式反应(PCR)、连接酶链式反应(LCR), Q^-复制酶扩增,并在Berger,Sambrook和Ausubel 以及 Mullis 等(1987)美国专利 4,683,202 号;PCR Protocols A Guide to Methods andapplications (Innis等编)学术出版公司,圣地亚哥,加利福尼亚州(1990) ;Arnheim & Levinson (1990年 10 月 1 日)Chemical and Engineering News 36-47 ;The Journal Of NIH Research(1991) 3 :81-94 ;Kwoh 等(1989)Proc. Natl. Acad. Sci. USA 86 :1171 ;Guatelli 等(1990)Proc. Natl. Acad. Sci. USA 87 :1874 ;Lomell 等(1989).1. Clin. Chem. 35 :1826 ; Landegren 等(1988)Science 241 :1077-1080 ;Van Brunt (1990)BiotechnoloRY 8 291-294 ;Wu 和 Wallace (1989)Gene 4 :560 ;Barringer 等(1990)89 :117 ;以及 Sooknanan 和Malek(1995)BiotechnoloRyl3 :563-564中发现了其它RNA聚合酶介导的技术(例如 NASBA)。体外克隆扩增的核酸的改进方法描述在Wallace等的美国专利5,426,039中。通过PCR扩增大型核酸的改进方法总结在Cheng等(1994) Nature 369 :684-685和其中的参考资料中,其中产生了高达401Λ的PCR扩增子。熟练的技术人员懂得几乎可将任何RNA转变为适合限制性消化、PCR扩增并用逆转录酶和聚合酶测序的双链DNA。参见,Ausbel, Sambrook 禾口 Berger,同上。序列变异此领域的熟练技术人员懂得,由于遗传密码的简并性,多种编码本发明GAT多肽的核苷酸序列都可以制造,其中一些和本文明确公开的核酸序列基本上是相同的。表1密码子表
氨基酸密码子丙氨酸AlaAGCAGCCGCGGCU半胱氨酸CysCUGCUGU天冬氨酸AspDGACGAU谷氨酸GluEGAAGAG苯丙氨酸PheFUUCUUU甘氨酸GlyGGGAGGCGGGGGU组氨酸HisH .CACCAU异亮氨酸IleIAUAAUCAUU赖氨酸LysKAAAAAG亮氨酸LeuLUUAUUGCUACUC CUG CUU甲硫氨酸MetMAUG天冬酰胺AsnNAACAAU脯氨酸ProPCCACCCCCGCCU谷氨酰胺GlnQCAACAG精氨酸ArgRAGAAGGCGACGC CGG CGU丝氨酸SerSAGCAGUUCAUCC UCG UCU苏氨酸ThiTACAACCACGACU缬氨酸ValVGUAGUCGUGGUU色氨酸TrpWUGG酪氨酸TyrYUACUAU例如,观察密码子表(表1)可以看出,密码子464^66丄64丄6(、066和CGU都编码精氨酸。因此,在本发明的核酸中由一密码子规定为精氨酸的每个位置上,此密码子可以改变成上述任何一个相应的密码子而不改变编码的多肽。应该理解RNA序列中的U和DNA 序列中的T是相对应的。例如,用与SEQ ID NO 1的核苷1-15相对应的核酸序列ATG ATT GAA GTC AAA, 此序列的沉默变异包括AGT ATC GAG GTG AAG,这两个序列都编码与SEQ ID NO :6的氨基酸1-5相对应的氨基酸序列MIEVK。这种“沉默变异”是“保守性修饰的变异”的一种,将在下面将讨论。熟练的技术人员将认识到,可以用标准技术修饰核酸中的各个密码子(除了 AUG,它通常是甲硫氨酸唯一的密码子)以编码功能相同的多肽。因此,编码多肽的核酸的各种沉默变异在任何所述序列中都存在。本发明分别提供了编码本发明多肽的核酸序列每一种可能的变异,这可以根据可能的密码子选择通过选择性结合而做到。这些结合是按照用于编码本发明GAT同类物多肽的核酸序列的标准三联遗传密码(如表1所列)做到的。考虑到此序列以及遗传密码子具体提供并描述了本发明每个核酸所有的此类变异。按照本文描述可以产生任何变异。两个或更多的不同的密码子当在同样的环境中翻译时它们都编码同样的氨基酸, 本文称为“同义密码子”。如本文所述,在本发明的一些方面,为在所需的宿主生物(如植物宿主)中应用最优化的密码子,我们用基因工程方法改造了 GAT多核苷酸。术语“最优化的”或“最佳”不限于最好的密码子的可能组合,而仅指作为整体该编码序列相对于衍生此编码序列的前体多核苷酸,具有改进的密码子用途。因此,本发明一方面通过用相对于亲代密码子的所需宿主生物(如植物)偏爱采用的同义密码子,取代核苷酸序列中至少一个亲代密码子提供了一种产生GAT多核苷酸变体的方法。特定核酸序列的“保守性修饰的变异”或简单地说“保守性变异”是指那些编码相同的或基本上相同的氨基酸序列的核酸,或者,当该核酸不编码氨基酸序列时指基本上同样的序列。熟练的技术人员知道,编码序列中的改变、加入或删除单个氨基酸或小比例氨基酸(通常少于5%,最典型的是少于4%、2%或或更少)的各个取代、缺失或添加是“保守性修饰的变异”,这里的改变导致了一个氨基酸的缺失、一个氨基酸的添加或一个氨基酸被化学性质类似的氨基酸取代。提供了功能类似的氨基酸的保守性取代列表是此领域熟知的。表2列出了六组相互为“保守性取代”的氨基酸。^t 2保守性取代组
1丙氨酸(A)丝贫酸(S)苏氨酸(T)2天冬氨酸(D)谷氨酸(E)3天冬酰胺(N)谷氨酰胺⑴)4精氨酸(R)赖氨酸005异亮氨酸(I)亮氨酸(L)甲硫氨酸(M) 缬氨酸(V)6苯丙氨酸(F〉酷氨酸(Y)色氨酸00因此,所列本发明多肽序列的“保守性取代的变异”包括以小百分比,通常少于该多肽序列氨基酸的5%,最典型的是少于2%,且通常少于1 %,用同样的保守性取代基的选择的保守性氨基酸进行取代。例如,本文鉴定为SEQ ID NO :6的多肽的保守性取代的变异将包括上述六组的 “保守性取代”,在这个146个氨基酸的多肽中这种取代最多会发生在7个残基中(即5%的
氨基酸)。在另一实施例中,如果有四个保守性取代位于SEQ ID NO :6的氨基酸21_30相对应的区域中,根据表2中列出的保守性取代,这一区域PRN QPL EAC M保守性取代的变异的例子包括KPQ QPV ESC M 禾口KPN NPL DAC 1等,(在上述实施例中,用下划线表示保守性取代)。这里的蛋白
28质序列的列表加上述取代列表,提供了所有保守性取代的蛋白质的明确列表。最后,加入不会改变核酸分子编码活性的序列,例如加入无功能或非编码序列,也是基础核酸的一种保守性变异。熟练的技术人员懂得,本文公开的核酸构建物的许多保守性变异产生了功能相同的构建物。例如,如上所述,由于遗传密码的简并性,“沉默取代”(即不会导致编码多肽发生改变的核酸序列的取代)是编码氨基酸的各个核酸序列不言而喻的特征。类似地,氨基酸序列中一个或几个氨基酸的“保守性氨基酸取代”是被性质非常类似的不同氨基酸取代, 由于与本文公开的构建物高度类似也不难鉴定。各个公开序列的此类保守性取代是本发明的一个特征。特定核酸的非保守性修饰是那些其特征不是保守性取代的任何氨基酸的取代。例如,在表2所列6组之间进行的任何取代。它们包括用碱性或酸性氨基酸取代中性氨基酸 (如用Asp、Glu、Asn或Gln取代Val、Ile、Leu或Met)、用芳香性氨基酸取代碱性或酸性氨基酸(如用Phe、Tyr或Trp取代Asp、AsruGlu或Gln)或任何不用类似氨基酸替代一个氨基酸的其它取代。核酸杂交当核酸结合时可说它们“杂交”,这通常是在溶液中。核酸杂交是由于各种已知的物理化学力,如氢键、溶剂排斥(solvent exclusion)、碱基堆积等造成的。在 Tijssen (1993)Laboratory Techniques in Biochemistry and Molecular Biology -Hybridization with Nucleic Acid Probes,第 I 部分第 2 章,“Overview of principles of hybridization and the strategy of nucleic acid probe assays" (Elsevier,M 约)以及Ausubel (同上)中可以找到关于核酸杂交的大量指导,Hames和Higgins (1995) Gene Probes 1,牛津大学出版社IRL出版,牛津,英国(Hames和Higgins 1)以及Hames和 Higgins (1995) Gene Probes 2,牛津大学出版社 IRL 出版,牛津,英国(Hames 和 Higgins 2) 提供了有关DNA和RNA(包括寡核苷酸)合成、标记、检测并定量的细节。核酸杂交实验中的“严格的杂交洗涤条件”。如Southern和northern杂交,是序列依赖性的,且在不同的环境参数下是不同的。在Tijssen (1993),同上和Hames和Higgins 1以及Hames和Higgins 2,同上中可以找到关于核酸杂交的大量指导。通常,出于本发明的目的,“高严格”杂交和洗涤条件选定为,在确定的离子强度和 PH下,温度低于该特定序列的热融化温度(Tm)5°C或更低(如下所示,高严格条件也可以参考相当的术语)。Tm是50%的实验序列与正确匹配的探针杂交时的温度(在确定的离子强度和PH下)。选择与特定探针的Tm相等的非常严格条件。核酸双链体的Tm表示在所给条件下50%的双链体发生变性时的温度,它代表了核酸杂交稳定性的直接度量。因此,Tm相应于从螺旋到随机卷曲转变中点的温度;它取决于长伸展核苷酸的长度、核苷酸组成和离子强度。杂交后,可以用一系列洗涤除去未杂交的核酸物质,可以根据所需的结果调节其严格性。低严格性洗涤条件(如较高盐度和较低温度)可增加敏感性,但可能产生非特异性杂交信号和高背景信号。高严格条件(如较低盐度和更接近杂交温度的较高温度) 可降低背景信号,通常只保留特异信号。参见Rapley,R.和Walker,J. Μ.编,Molecular Biomethods Handbook (Humana Press 公司,1998)(以后称为“Rapley 和 Walker”),出于所有目的,在此将其全文并入以供参考。可以用下面的公式1估算DNA-DNA双链体的Tm Tm(°C ) = 81. 5°C +16. 6 (Iog10M)+0. 41(% G+C)-0. 72(% f)-500/n其中M是单价阳离子(通常是Na+)的摩尔浓度,(% G+C)是尿苷酸(G)和胞苷酸(C)的百分比,(%f)是成形的百分比,η是杂交的核苷酸碱基的数目(即长度)。参见 Rapley 禾口 Walker,同上。可以用下面的公式2估算RNA-DNA双链体的Tm Tm (°C ) = 79. 8 °C +18. 5 (Iog10M) +0. 58(% G+C)-ll. 8(% G+C) 2-0. 56(% f) -820/ n,其中M是单价阳离子(通常是Na+)的摩尔浓度,(% G+C)是尿苷酸(G)和胞苷酸(C)的百分比,(%f)是成形的百分比,η是杂交的核苷酸碱基的数目(即长度)。同样。公式1和公式2通常只对长度约100-200核苷以上的杂交双链体是精确的。同样。短于50个核苷酸的核酸序列的Tm可按下式计算Tm (°C ) =4 (G+C) +2 (Α+Τ), 其中A (腺苷)、C、T (胸苷)和G是相对应核苷酸的数目。互补残基超过100的互补核酸在在Southern或northern印迹的滤膜上杂交的严格杂交条件的一个例子是在42°C,含有Img肝素的50%的福尔马林,杂交过夜。严格洗涤条件的一个例子是在65°C用0. 2X SSC洗涤15分钟(参见Sambrook,同上,以了解SSC缓冲液)。通常在高严格洗涤之前进行低严格洗涤以除去背景探针信号。低严格洗涤的例子是在40°C用0.2X SSC洗涤15分钟。通常,特定杂交试验中信噪比超过无关探针观察到的2. 5X-5X (或更高)表明检测到了特殊的杂交。本发明文中两个序列之间至少严格杂交的检测表明了(例如)本文序列表中提供的本发明核酸的相对较强的结构相似性或同源性。这里提到的“高严格”条件选定为,在确定的离子强度和pH下,低于该特定序列的热融化温度(Tm)5°C或更低。在高严格条件下可以鉴定与感兴趣核苷酸序列(如“探针”) 密切相关或相同的靶序列。低严格条件适合于互补性较差的序列。例如参见,Rapley和 Walker,同上。比较性杂交可用于鉴定本发明的核酸,这种比较性杂交法是区别本发明核酸的优选方法。本发明文中两个核苷酸序列之间高严格杂交的检测,表明了(例如)本文序列表中提供的本发明核酸的相对较强的结构相似性或同源性。两个核苷酸序列之间高严格杂交证明了结构、核苷酸碱基成分、排布或顺序的相似性或同源性程度高于用严格杂交条件所测得的结果。特别地,本发明文中高严格杂交的检测,表明了(例如)本文序列表中提供的本发明核酸的高度结构相似性或结构同源性(例如,核酸构建物、碱基成分、排布或顺序)。 例如,需要在严格条件下鉴定与本发明样品核酸杂交的实验核酸。因此,严格杂交的一种衡量是在高严格条件下(或非常严格的条件,或超高严格杂交条件,或超超高严格杂交条件下),与所列核酸(如,核酸序列SEQ IDNO=I-SEQ ID NO 5和SEQ ID NO =Il-SEQ ID NO J62,以及其互补多核苷酸序列)之一杂交的能力。对任何实验核酸都可以容易地按照经验确定严格杂交(以及高严格、超高严格、或超超高严格杂交条件)和洗涤条件。例如,在确定高严格杂交和洗涤条件时,逐渐提高杂交和洗涤条件 (例如,提高杂交或洗涤时的温度、降低盐浓度、增加去污剂浓度和/或增加有机溶剂(如福尔马林)浓度),直至符合所选定的一系列标准。例如,逐渐增加杂交和洗涤条件直至含有选自 SEQ ID NO =I-SEQ IDNO 5 禾口 SEQ ID NO =Il-SEQ ID NO :262 中一个或多个核酸序列及其互补多核苷酸序列的探针,与完全匹配的互补目标(也是含有选自SFQ ID NO=I-SEQ ID NO :5和SEQID NO =Il-SEQ ID NO :262中一个或多个核酸序列及其互补多核苷酸序列的核酸)结合,其信噪比至少约为所观察到的探针与不匹配目标杂交结果的2. 5X倍,较好是约高5X或更高。这种情况下,不匹配目标是当本申请提交时在GenBank 等公共数据库中已存在核酸的相对应核酸(不是所附序列表中的那些)。熟练的技术人员可以在GenBank 中鉴定到这种序列。它的例子包括登录号Z99109和Y09476。此领域普通技术人员可以在 (例如)GenBank中鉴定到其它的此类序列。当实验核酸至少1/2与探针或完全匹配的互补目标杂交时,就说探针核酸特异性杂交了该核酸,即信噪比至少为探针与靶核酸杂交的1/2—样高,其中的杂交条件是,在完全匹配的探针与完全匹配的互补靶核酸结合产生的信噪比,比所观察到的与登录号为 Z99109和Y09476的任何非匹配多核苷酸杂交产生的,至少高约2 X -10 X倍,有时高20 X、 50X倍或更高的条件下进行。超高严格杂交和洗涤条件是这样的,提高杂交和洗涤条件的严格性直至探针与完全匹配的互补靶核酸结合的信噪比,至少比所观察到的与任何Genbank登录号为Z99109和 Y09476的非匹配靶核酸杂交的高IOX。在这种条件下以至少为完全匹配的互补靶核酸1/2 的信噪比与探针杂交的靶核酸,即被认为在超高严格条件下与探针结合。类似地,通过逐步提高有关杂交试验的杂交和/或洗涤条件可以确定甚至更高的严格水平。例如,这其中,提高杂交和洗涤条件的严格性,直至探针和完全匹配的互补靶核酸结合的信噪比,至少比所观察到的与任何Genbank登录号为Z99109和Y09476的非匹配靶核酸杂交的高10X、20X、50X、100X或500X倍或更高。在这种条件下以至少为完全匹配的互补靶核酸1/2的信噪比与探针杂交的靶核酸,即被认为在超超高严格条件下与探针结合。在高、超高和超超高严格条件下与以SEQ ID NO :1-SEQ ID NO :5和SEQ IDNO Il-SEQ ID NO :262代表的核酸杂交的靶核酸,是本发明的一个特征。这些核酸的例子包括那些与所给定核酸序列相比,含有一个或几个沉默或保守性核酸取代的核酸。如果诸核酸编码的多肽基本上相同,则在严格条件下这些不相互杂交的核酸实质上仍是相同的。这发生在,例如,当用遗传密码允许的最大密码子简并性产生某核酸的拷贝,或要产生针对 SEQ ID NO :6-SEQ ID NO :10 禾口 SEQ ID NO :263_SEQID NO :514 中一个或多个多肽的的一种或多种抗血清时,可以用已知核苷酸序列(包括Genbank登录号 CAA70664)编码的多肽将其吸收。下面是免疫鉴定本发明多肽的更多细节。此外,为区别序列不到100个核苷酸的双链体,可以使用此领域一般技术人员已知的TMACl杂交法。例如参见,Sorg, U.等,1 Nucleic Acid Res. (1991年9月11日(19 (17),出于所有目的,在此将其全文并入以供参考。一方面,本发明提供了含有选自 SEQ IDNO =I-SEQ ID NO :5和SEQ ID NO =Il-SEQID NO 262的独特序列的核酸。与对应于Genbank登录号Z99109和Y09476的核酸相比,这些独特的序列是唯一的。可以将任何SEQ ID NO =I-SEQ ID NO :5和SEQ IDNO =Il-SEQ ID NO: 262的核酸,与Genbank登录号Z99109、Y09476或本申请提交日公共数据库可得到的其它
31相关序列为代表的一整套核酸进行序列对比,由此确定这些唯一序列。序列对比用设置了默认参数的BLAST算法进行。任何唯一的序列都是有效的,例如,作为鉴定本发明核酸的探针。类似地,本发明包括含有选自SEQ ID NO :6_SEQ ID NO :10禾口 SEQ ID NO: 263-SEQID NO :514多肽中的独特序列。这里,与对应于Genbank登录号CAA70664的多肽相比,这些独特的序列是唯一的。同时,将这些多肽与Genbank登录号CAA70664代表的序列进行对比。注意,如果序列与非翻译序列(如假基因)一致,则只要将核酸序列在硅中(in silico)翻译成氨基酸序列就可以产生相应的多肽,其中的选出与同类GAT多核苷酸的阅读框相符的阅读框。本发明还为在严格条件下杂交的靶核酸提供了编码选自SEQ ID NO :6_SEQ IDNO 10和SEQ ID NO :263-SEQ ID NO :514的多肽中一种独特序列的唯一的编码寡核苷酸,其中, 与相应于任何对照多肽的多肽相比,这种独特的序列是唯一的。如上所述确定这些独特的序列。在一个实施例中,选择了严格条件,使与该编码寡核苷酸的完全互补的寡核苷酸与该编码寡核苷酸杂交,信噪比高于该完全互补寡核苷酸与相应于任何对照多肽的对照核酸杂交产生的2.5X-10X倍,较好的是至少高5-10X倍。可以选择这样的条件,以使在具体试验中观察到较高的信噪比,通常为(例如)约15X、20X、30X、50X倍或更高。在这个实施例中,与对照核酸与该编码寡核苷酸的杂交相比,靶核酸以至少高2X的信噪比与该独特的编码寡核苷酸杂交。另夕卜,可以选择较高的信噪比,例如,约2.5\、5\、10\、20父、 30X、50X或更高。具体的信号取决于相关试验所用的标记,如,荧光标记、比色标记、放射性标记等。iH本、赫莉陳汰避本发明还包括含有一个或多个上述核酸的重组构建物。这种构建物包括载体,如质粒、粘粒、噬菌体、病毒、细菌的人造染色体(BAC)、酵母菌人造染色体(YAC)等,其中以正向或反向插入了本发明的核酸序列。在这个实施方案优选的方面,这种构建物还包括调控序列,包括(例如)操作性连接于该序列的启动子。本领域的熟练技术人员已知许多合适的载体和启动子,且这些是市售的。描述本发明所用的分子生物技术(包括载体的使用、启动子和许多其它相关主题)的一般的教科书包括 Berger 禾口 Kimmel,Guide to Molecular CloninRTechniques, Methods in Enzymology 152卷,Academic Press公司,圣地亚哥,力口利福尼亚州(Berger); Sambrook 等,Molecular CloninR-A Laboratory Manual (第 2 版),1-3 卷,7令泉港实验室,冷泉港,纽约,1989( “Sambrook")以及 CurrentProtocols in Molecular BioIory, F. Μ. Ausubel 等编,Current Protocols, Greene Publishing Associates 公司禾口 John Wiley & Sons公司的合资公司,(2000增补)(“Ausubel,,)。这些技术的例子足以指导熟练技术人员实施体外扩增法,包括聚合酶链式反应(PCR)、连接酶链式反应(LCR)、 Q β-复制酶扩增,并在Berger,Sambrook和Ausubel以及Mullis等(1987)美国专利 4,683,202 号;PCRProtocols A Guide to Methods and applications (Innis 等编)学术出版公司,圣地亚哥,加利福尼亚州(1990) ;Arnheim & Levinson (1990年10月1日) Chemicaland Engineering News 36-47 ;The Journal Of NIH Research(1991) 3 :81-94 ;Kwoh 等(1989)Proc. Natl. Acad. Sci. USA 86 :1173 ;Guatelli 等(1990)Proc. Natl. Acad. Sci. USA 87 :1874 ;Lome 11 等(1989) Τ. Clin. Chem. 35 :1826 ;Landegren 等(1988) Science 241:1077-1080 ;Van Brunt(1990)Biotechnology8 :291-294 ;Wu 和 Wallace(1989)Gene 4 560 ;Barringer 等(1990)89 :117 ;以及 Sooknanan 和 Malek(1995)Biotechnology 13 563-564中找到其它RNA聚合酶介导的技术(例如NASBA)。体外克隆扩增的核酸的改进方法描述在Wallace等的美国专利5,426,039中。通过PCR扩增大型核酸的改进方法总结在Cheng等(1994)Nature369 :684-685和其中引用的参考资料中,其中产生了高达401Λ的 PCR扩增子。熟练的技术人员懂得可将几乎任何RNA转变为适合限制性消化、PCR扩增并用逆转录酶和聚合酶测序的双链DNA。参见,Ausbel、Sambrook和Berger,同上。本发明还涉及基因工程方法改造本发明载体(如本发明的克隆载体或本发明的表达载体)转导(转化或转染)的宿主细胞,以及用重组技术生产本发明的多肽。此载体可以是,例如,质粒、病毒颗粒、噬菌体等。改建的宿主细胞可以培养在常规的经适当修饰的培养基中以活化启动子、选择转化体或扩增GAT同类物基因。培养条件,如温度、pH等,是前述选来在宿主细胞中表达所用的条件,且将为本领域技术人员所了解并在本文提到的参考资料中,其中包括如 Sambrook、Ausubel 和 Berger,以及如 Freshney(1994)Culture of Animal Cells, a Manual of Basicl~echniaue,第三板,Wiley-Liss,纽约和其中引用的参考资料。可以在植物、酵母、真菌等非动物细胞中制造本发明的GAT多肽。除了 Sambrook、 Ausubel和Berger,有关非动物细胞培养的细节可以参见Payne等(1992)Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons 公司,纽约,纽约州;Gamborg 禾口 Phillips (编)(1995)Plant Cell, Tissue and OrRanCulture ;Fundanmental Methods Springer Lab Manual, Springer—Verlag(柏林,海德堡,纽约)以及 Atlas 禾口 Parks (编) The Handbook of MicrobiologicalMedia (1993) CRC 出版社,伯克莱屯,佛罗里达州。可将本发明的多核苷酸掺入适合于表达多肽的各种表达载体之一中,合适的载体包括染色体、非染色体和合成的DNA序列,如SV和衍生物、细菌质粒、噬菌体DNA、杆状病毒、 酵母菌质粒、质粒和噬菌体DNA组合产生的载体、病毒DNA、如牛痘苗、腺病毒、禽痘病毒、狂犬病毒、腺相关病毒、逆转录病毒和许多其他病毒。可采用能将遗传物质转志入细胞的任何载体,如需要复制,则为在有关宿主中可复制有活力的载体。当操作性连接于适当的转录控制序列(启动子)的本发明多核苷酸掺入一表达载体时可引导mRNA的合成。特别适合转基因植物用的这种转录调控序列的例子,包括美国临时专利申请60/2453M中描述的花椰菜花叶病毒(CaMV)、玄参花叶病毒(FMV)、草莓纹理带病毒(SVBV)启动子。已知能调控真核或源核细胞或其他病毒表达基因的和可用于本发明某些实施例的其他启动子、包括SV40启动子、大肠杆菌Lac或trp启动子。噬菌体入1\启动子。表达载体任选地含有翻译启始的核糖体结合位点和转录终止子。该载体也可任选地含有扩大表达的适当序列,如增强子。此外,本发明表达载体任选地含有一种或多种可选择标记基因以提供选择转化宿主细胞的表型性状,如二氢叶酸还原酶或真核细胞培养的新霉素抗性。或大肠杆菌培养的四环素或氨苄青霉素活性。本发明的载体可用于转化适当的宿主使该宿主表达本发明的蛋白质或多肽。合适的表达宿主例子包括细菌细胞如大肠杆菌、枯草芽孢杆菌、链霉菌和沙门伤塞杆菌;真菌细胞如酿酒酵母、赤巴斯德酵母和脉胞菌昆虫细胞如果蝇和草地夜蛾哺乳动物细胞如CH0、 C0S、BHK、HEK293或Bowes黑色素病;或植物细胞或外植体等。应理解并非所有的细胞或细胞系都需要产生完全功能性的GAT多肽,例如可能产生GAT多肽的抗原性片段。本发明不受所采用宿主细胞的限制。根据GAT多肽的使用意图可以选择在细菌系统中的多种表达载体。例如,当需要大量GAT多肽或其片段作商业生产或诱导抗体时,可能需要对易于纯化的融化蛋白具有高水平表达的载体。这种载体包括但不限于,多功能大肠杆菌克隆和表达载体,如 BLUESCRIPTGtratagene),其中,可以将GAT多肽编码序列框内连接到载体中,序列结构是氨基末端为Met和随后β -半乳糖苷酶的7个残基,这样产生了一种杂交蛋白;以及ρΙΝ 载体(Van Heeke & Schuster (1989) J Biol Chem264 :5503-5509) ;pET 载体(Novagen, Madison WI);等等。类似地,在酿酒酵母(Saccharomyces cerevisiae)茴中有许多含组成型或诱导型启动子的载体(如α因子、醇氧化酶和PGH)可用来生产本发明的GAT多肽。为了解这些可以参见 Ausubel 等(同上)和 Grant 等(I987,Methods in Enzymologyl53 :516-544)。在哺乳类宿主细胞中可以使用包括以病毒为基础的各种表达系统。当将腺病毒用作表达载体时,例如,可将GAT多肽的编码序列操作性连接入由晚期启动子和三联前导序列组成的腺病毒转录/翻译复合体中。在该病毒基因组非必需的El或E3区插入GAT多肽编码区,将导致存活的病毒能够在被感染的宿主细胞中表达GAT (Logan和Sienk(1984) Proc Natl Acad Sci USA 81:3655-3659)。此外,可以使用转录增强子,如罗斯肉瘤病毒 (RSV)增强子,以增加哺乳类宿主细胞中的表达。类似地,在植物细胞中,可以通过将转基因整合进植物染色体来驱动表达,或由附加体或病毒核酸胞质驱动表达。对于稳定整合的转基因,常常需要提供能够驱动本发明GAT 多核苷酸的组成型或诱导型表达的序列,例如,使用病毒(如CaMV)或植物衍生的调控序列。已经描述了各种来自植物的调控序列,其中包括以组织特异性方式引导表达的序列,如 TobRB7、patatin B33、BRP基因启动子、rbcS_3A启动子等。或者,通过短暂表达植物病毒载体(如,TMV、BMV等)的外源序列可以实现高水平表达。通常,组成型表达本发明GAT多核苷酸的转基因植物是优选的,并选择其调控序列以确保GAT多肽组成性稳定表达。在本发明的一些实施方案中,制备了适合转化植物细胞的GAT多肽构建物。例如, 可以将所需的GAT多核苷酸掺入重组表达盒以便于将该基因引入植物和随后表达所编码的多肽。表达盒通常包括操作性连接于启动子序列和其它转录和翻译起始调控序列的GAT 多核苷酸或其功能片段,这些控制序列指导了该序列在转化植物的预期组织(例如,整个植物、叶、种子)中表达。例如,可以使用强或弱的组成型植物启动子,它将指导GAT多肽在植物的所有组织中表达。这种启动子在大多数环境条件和发育或细胞分化阶段中都有活性。组成型启动子的例子包括衍生自根瘤土壤杆菌(Agrobacterium tumefaciens) T-DNA的1,-或2,-启动子,各种植物基因的其他转录起始区是技术人员已知的。当GAT多核苷酸过度表达对植物有害或不需要时,通过阅读本文,技术人员将懂得可以使用弱的组成型启动子以低水平表达。当高水平表达对植物无害时,可以使用强启动子,如t-RNA或其它pol III启动子,或强pol II启动子(如花椰菜花叶病毒启动子)。或者,可将植物启动子处于环境控制之下。这种启动子本文称为“诱导型”启动子。 可通过诱导型启动子影响转录的环境条件包括病原体攻击、厌氧条件或光照的存在。用于本发明的启动子可以是“组织特异的”以及,同样,处于发育控制之下,这就是说,此多核苷酸只在某些组织中表达,如叶和种子。在实施方案中,在此种构建物中引入了一个或多个植物系统内源的核酸序列,可以使用这些基因的内源启动子(或其变体)以在转基因植物中直接表达此基因。也可以用组织特异性启动子引导异源多核苷酸的表达。总而言之,用于植物中表达盒的具体启动子取决于使用意图。任何在植物细胞中引导转录的启动子都是合适的。启动子可以是组成型或诱导型的。除了上述启动子,可在植物中操作的细菌类源启动子,包括章鱼氨酸合成酶启动子、胭脂氨酸合成酶启动子和其它衍生自天然Ti质粒的启动子(参见Herrara-Estrella等(1993)Nature 303 :209-213)。 病毒启动子包括花椰菜花叶病毒的35S和19S RNA启动子(Odell等(1985)Nature313 810-812)。其它的植物启动子包括核酮糖-1,3-二磷酸羧化酶小亚基启动子和菜豆蛋白启动子。也可以使用E8基因和其它基因的启动子序列。E8启动子的分离和序列详细描述见 Deikman 和 Fischer(1988)EMB0J. 7 :3315_3327。为鉴定候选启动子,对基因组克隆的5’部分作启动子序列的序列特征分析。例如, 启动子序列元件包括TATA框共有序列(TATAAT),它通常在转录起始位点上游20-30个碱基对处。在植物中,在TATA框上游,在-80到-100的位置上,通常有启动子元件和密码子 G(或 T)周围有一系列腺苷,这正如 Messing 等(1983)Genetic Engineering in Plants, Kosage等(编),第221-227页所述。在制备本发明的多核苷酸构建物(如载体)时,也可以使用启动子以外的序列和共连接的多核苷酸。如果需要正常的多肽表达,可以在GAT-编码区3’-末端包含一聚腺苷酸化区域、例如,此聚腺苷酸化区域可衍生自各种植物基因,或来自T-DNA。此构建物还可以包括赋予植物细胞可选择表型的标记基因。例如,这种标记可以是编码抗微生物剂抗性、特定的抗生素抗性(如对卡那霉素、G418、博来霉素、潮霉素的抗性)或除草剂抗性(如对双丙氨酰膦或膦丝菌素(除草剂bialaphos和Basta中的活性成分)的抗性)。特殊的起始信号有助于本发明GAT多核苷酸编码序列的有效翻译。这些信号可以包括,例如,ATG起始密码子和毗邻序列。如果是GAT多肽编码序列,将其起始密码子和上游序列插入合适的表达载体中,则可不需要任何其它的翻译控制信号。然而,若只插入了编码序列(如成熟蛋白编码序列)或其部分,则必需提供包括起始密码子在内的外源转录控制信号。此外,起始密码子必需位于正确的阅读框中以确保整个插入片段的转录。外源转录元件和起始密码子可以有各种来源,可以是天然或合成的。在使用中加入适合细胞系统的增强子可以提高表达效力(Scharf D 等(1994)Results Probl Cell Differ 20 :125-62 ; Bittner 等(1987)Methods in Enzymol153 :516-544)。分泌/定位序列本发明多核苷酸还可框内融合于(例如)编码分泌/定位序列的核酸,以将多肽表达导向所需的细胞区室、膜、或哺乳类细胞的细胞器,或将多肽分泌导向周质空隙或进入细胞培养介质。这种序列是技术人员已知的,包括分泌前导肽、细胞器引导肽(如核定位序列、ER保留信号、线粒体转运序列、叶绿体转运序列)、膜定位/锚定序列(如停止转移序列、GPI锚定序列)等等。在优选的实施方案中,本发明的多核苷酸框内融合于带有N-末端叶绿体转移序列(或叶绿体转运肽序列)此转运序列衍生自通常靶向叶绿体的多肽的编码基因。这种序列通常富含丝氨酸和苏氨酸;缺乏天冬氨酸、谷氨酸和酪氨酸;并且通常含有富含正电荷氨基酸的中心区域。表汰宿主在另外的实施方案中,本发明涉及含有上述构建物的宿主细胞。这种宿主细胞可以是真核细胞,如哺乳类细胞、酵母细胞或植物细胞,或者该宿主细胞可以是原核细胞, 如细菌细胞。可用磷酸钙转染、DEAE-葡聚糖转染、电穿孔或其它常规技术将该构建物引入宿主细胞中(Davis, L.,Dibner, M.禾口 Battey,I. (1986)Basic Methods in Molecular BioIory)。通常要对宿主细胞品系调节插入序列的表达的能力或以所需形式加工所表达的蛋白质的能力进行选择。蛋白质的这种修饰包括但不限于乙酰化、羧化、糖基化、磷酸化、酯化和酰化。切割此蛋白质的“前蛋白”或“前原蛋白”形式的翻译后加工对于正确插入、折叠和/或功能也是重要的。不同的宿主细胞如大肠杆菌、杆菌属、酵母或哺乳类细胞(如CH0、 Hela、BHK、MDCK、293、WI38等)对于(例如)翻译后活性具有特定的细胞机理和特征机制, 并可以对此进行选择以确保引入的外源蛋白质的所需的修饰和加工。为长期、高产量制造重组蛋白可以使用稳定的表达系统。例如,可以稳定表达本发明多肽的植物细胞、外植体或组织(如芽、叶盘)用含有病毒来源的复制或外源表达元件和可选标记基因的表达载体转导。在载体转导后,可以让细胞在营养培养基中生长与细胞类型相适应的预定时间,如让细菌细胞生长1小时或几小时,让植物细胞生长1-4天,让一些植物的外植体生长2-4周,然后换成选择性培养基。可选标记的目的是赋予抗性以便选择, 它的存在使成功表达引入序列的细胞可以生长并回收。例如,可以就除草剂、草甘膦的抗性直接选择表达本发明多肽的转基因植物。例如可采用适合该细胞类型的组织培养技术来增殖衍生自稳定转化的外植体的抗性胚。将被编码本发明多肽的核苷酸序列转化的宿主细胞选择培养在适合该编码蛋白质表达并从细胞培养物中回收的条件下。重组细胞产生的此蛋白质或其片段可以是分泌的、膜结合的或含在细胞内,这取决于所用的序列和/或载体。本领域的技术人员懂得,用可以设计含有引导成熟多肽分泌通过原核或真核细胞膜的信号序列的本发明GAT多核苷酸的表达载体。其它多肽序列本发明的多核苷酸还可以含有框好融合于一标记序列的编码序列,这样可(例如)有利于该编码多肽的纯化。这种方便纯化的结构域包括但不限于金属螯合肽(如可以在固定的金属上纯化的组氨酸-色氨酸组件)、结合谷胱甘肽的序列(如GST)、血凝素(HA) 尾(相应于衍生自流感血凝素蛋白的表位;Wilson等(1984)Cell37 :767)、麦芽糖结合蛋白序列、用于FLAGS延伸/亲和纯化系统的FLAG表位(Immunex公司,西雅图,华盛顿州) 等。在纯化结构域和GAT同系物序列之间含有蛋白酶可切割的多肽接头序列可用于方便纯化。打算用于本文所述组合物和方法的一个表达载体为含有本发明多肽的融合蛋白的表达作了准备,其中本发明的多肽融合于被一肠激酶切割位点分离的聚组胺区域。该组氨酸残基促进了在IMIAC(固定的金属离子亲和层析,如Porath等(1992)ftOtein Expression and Purification 3 =263-281)所述)上进行纯化,而肠激酶切割位点提供一种从融合蛋白上分离GAT同系物多肽的方法。也可以用pGEX载体(Promega ;麦迪逊,威斯康星州)来表达外源多肽,成为和与胱甘肽S-转化酶(GST)的融合蛋白。总之,这种融合蛋白是可溶的并可以通过吸附于配体-琼脂糖珠(如在GAT-融合时使用谷胱甘肽-琼脂糖)然后在存在游离配体时进行洗脱,这样可以容易地从溶解的细胞中将其纯化。多肽制造和回收转导合适的宿主菌株并使宿主菌株生长至合适的细胞密度后,用合适的方法(如升高温度或化学诱导)诱导所选的增强子并将细胞再培养一段时间。通常通过离心收获, 用物理或化学方法破裂,并将所得粗制提取物进一步纯化。可以用任何常规的方法破裂用于表达蛋白质的微生物细胞,这些方法包括冷冻-解冻循环、超声、机械破碎或使用细胞溶解剂或其它方法,这些都是本领域技术人员熟知的。值得一提的是,有很多关于培养和产生多种细胞(包括细菌、植物、动物(尤其是哺乳动物)和古细菌来源的细胞)的参考资料。例如可以参见Sambrook、Ausubel 禾口 Berger(都同上),以及如 Freshney(1994)Culture of Animal Cells, aManual of Basic Technique,第三板,Wiley-Liss,纽约和其中引用的参考资料;Doyle和 Griffiths (1997)Mammalian Cell Culture :Essential Techniques Johnffiley & Sons, 纽约州;Humason (1979) Animal Tissue Techniques,第四版 W. H. Freeman 禾口 Company ;以及 Ricciardelli 等(1989) In vitro Cell Dev. Biol. 25 :1016-1024。有关植物细胞培养和再生,可以参见 Payne 等(1992)Plant Cell and Tissue Culture in Liquid Systems John Wiley & Sons 公司,纽约州Gambon 和 Phillips (编)(1995)Plant Cell, Tissue and OrganCulture ;Fundanmental Methods Springer Lab Manual, Springer-Verlag(柏林,海德堡,纽约)Jones 编(1994) Plant Gene Transfer and Expression Protocols, Humana 出版社,Towata,新泽西州以及 Plant Molecular BioIry(1993)R. R. D. Croy 编, Bios Scientific出版社,牛津,英国ISBN O 12 198370 6。细胞培养介质通常列在Atlas 和 Parks (编)The Handbook of Microbiological Media (1993) CRC 出版社,伯克莱屯,佛罗里达州。关于细胞培养的其它信息可以在以下市售文献中找到,如Sigma-Aldrich公司(圣路易斯,密苏里州)的 Life Science ResearchCell Culture Catalo卯θ (1998) (“Simga-LSRCCC”)和例如,同样来自Sigma-Aldrich公司(圣路易斯,密苏里州)^The Plant culture Catalogue及增补本(1997) ( “Simga-PCCS”)。其它有关植物细胞转化和制造转基因植物的详述可以在下面找到。用任何本领域熟知的方法可以从重组细胞培养物中回收并纯化本发明的多肽,这些方法包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水反应层析、亲和层析(如使用本文提到的任何标记系统)、羟基磷灰石层析以及凝集素层析。如果需要的话,在完成成热蛋白构型时可以采用蛋白质重折叠步骤。最后,在最终的纯化步骤中可以使用高效液相色谱(HPLC)。除了上述参考资料,许多纯化方法是本领域熟知的,例如其中包括以下文献中提到的方法,这些文献是Sandana(1997)Bioseparation of Proteins,学术出版社公司;以及Bollag等(1996) Protein Methods 第二版Wiley-Liss,纽约州:ffalker (1996)The Protein Protocols Handbook Humuna 出版社,新泽西州;Harris 禾口 Angal (1990) Protein Purification Applications :A Practical Approach 牛津 IRL 出版社,牛津,英国:Scopes (1993) Protein Purification principles andPractice 第三板 Springer Verlag,纽约州;Janson 禾口 Ryden (1998) ProteinPurification :Priciples, HiRh Resolution Methods and Applications,第二版 Wiley-VCH,纽约州;以及 Walker (1998) Protein Protocols on CD-ROM Humana 出版社,新泽西州。—些情况下,需要以适合工业和/或商业应用的大规模制造本发明的GAT多肽。 在这种情况下可采用大批量发酵程序。简单地说可将GAT多核苷酸(如含有SEQID NO 1-5和11-262中任一的多核苷酸)或其它编码本发明GAT多肽的核酸克隆进表达载体。 例如,Widner 等的美国专利 5,955,310 号 “METHODS FOR PRODUCING APOLYPEDTIDE IN A BACILLUS CELL”描述了带有串联增强子和操作性连接于一多肽编码序列的稳定序列的载体。将感兴趣的多核苷酸插入载体后,将该载体转化入细菌(如枯草芽孢杆菌菌株 PL1801IIE(amyE、apr、npr、spoIIE: :Tn917)宿主中。在芽孢杆菌细胞中引入表达载体可采用(例如)原生质体转化(例如参见 Chang 和 Cohen (1979)Molecular General Genetics 168 111)、采用感受态细胞(例如参见Young和 Soizizin (1961) Tournal of Bacteriology 81 :823,或Dubnau禾口Davidoff-Abelson(1971)Tournal of Molecular Biology 56 :209)、 电穿孔(例如参见Shigekawa和Dower (1998)Biotechniaues 6:742)、或通过偶联(例众口参见 Koehler 禾口 Thorne (1987) Tournal of Bacteriology 169:5271),以及 Ausubel、 Sambrook> Berger (都同上)来实施。用本领域已知的方法将转化的细胞培养在适合产生多肽的营养培养基中。例如, 可以在合适的培养基和多肽能够被表达和/或分离的条件下,在实验室或工业发酵罐中通过摇床培养、小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵) 培养细胞。采用本领域已知的程序,在合适的含有碳和氮源以及无机盐的营养培养基中进行培养。合适的培养基可由商业供应商获得,或按照所公布的组成(如美国典型培养物保藏中心的目录中)制备。可以从培养基中直接回收分泌的多肽。可用本领域已知的方法分离所产生的多肽。例如,可用常规方法从营养培养基中分离得到此多肽,这些方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。然后可以用本领域已知的各种方法进一步纯化分离的多肽,其中包括但不限于层析法(如离子交换、亲和、疏水、层析聚焦和排阻)、电泳法(如制备型等电聚焦)、根据不同溶解度分离(如硫酸铵沉淀)或提取(例如参见Bollag等(1996)Protein Methods第二版Wiley-Liss, 纽约州;Walker (1996) The Protein Protocols Handbook, Humana 出版社,新泽西州; Bollag 等(1996) Protein Methods 第二版 Wiley-Liss,纽约州;ffalker (1996) The Protein Protocols HandbookHumana 出版社,新泽西州)。也可以使用无细胞转录/翻译系统用本发明的DNA或RNA产生多肽。几个这种系统是商业上可获得的。有关体外转录和翻译过程的一般介绍可以在Tymms (1995) In vitro Transcription and Translation Protocols :Methods inMolecular Biology 第 37 卷, Gerland出版社,纽约州中找到。序列重组的底物和模式本发明的多核苷酸可以任选的用作各种多样性产生过程(如突变、重组和递推重组反应)的底物,此外它们还可以用于如(例如)Ausubel、Berer和Sambrook所述的标准克隆方法中,即,产生其它的具有所需特性的GAT多核苷酸和多肽。各种产生多样性的方法是可获得的且在本领域中有描述。这些方法可以单独使用,和/或联合使用以产生一种或多种多核苷酸的变体或一组多核苷酸以及编码蛋白的变体。无论是单独还是联合,这些过程提供了产生多样化的多核苷酸和多核苷酸组(例如包括多核苷酸文库)的强有力的、广泛适用的方法,这些多样性多核苷酸和多核苷酸组可用于(例如)构建或快速进化具有新的和/或改进特性的多核苷酸、蛋白质、途径、细胞和/或生物体。这种改变序列的方法可以产生,例如,单个核苷的取代、多个核苷酸取代、以及核酸序列区域的插入或缺失。虽然为了阐明在以下讨论中进行了区分和分类,但应明白这些技术通常不是相互排斥的。实际上,各种方法可以单独使用或联合、平行或依次使用,以获得不同的序列变体。本文所述的任何多样性产生过程的结果可能是产生了一种或多种多核苷酸,可以从中选择或筛选编码具有或赋予所需特性的蛋白质的多核苷酸。用本文所述的一种或多种方法或技术人员可获得的其它方法进行多样化后,可以从中选择具有所需活性或特性的多核苷酸,如对草甘膦改变的Km、对乙酰CoA改变的Km、选择性辅因子(如丙酰CoA)增加的k。at的应用等。这可以包括(例如)通过本领域的试验之一以自动或可自动化的形式鉴定可检测的任何活性。例如,用质谱法,可通过测定草甘膦转变为N-乙酰草甘膦检测特异性活性增加的GAT同系物。或者,可以使本发明核酸转化的细菌生长在含有递增浓度的草甘膦的琼脂上,或用草甘膦喷洒含有本发明核酸的转基因植物,这样可以测定提高的赋予草甘膦抗性的能力。根据实践者判断力可以连续或平行评价各种相关(或者甚至是不相关的)特性。例如,在提交于 1999 年 8 月 12 的 “DNA SHUFFLING TO PRODUCE HERBICIDE RESISTANT CROPS”(USSN 09/373, 333)中可以找到有关重组和选择除草剂抗性的其它细节。可以在以下公布和其中所引用的参考资料中找到有关各种多样性产生的过程,包括家族改组和产生经修饰的编码多个酶促待构域的核酸序列的方法的描述 Soong, N. φ (2000) "Molecular breeding of viruses"Nat Genet 25(4) :436-39 ; Stemmer 等(1999) "Molecular Breeding of viruses for targeting and other clinical properties,,Tumor Targeting 4 1-4 ;Ness 等(1999) "DNA Shuffling of subgenomic sequences of subtilisin,,Nature Biotechnology 17:893-896; Chang 等(1999) "Evolution of a cytokine using DNA family shuffling"Nature Biotechnology 17 :793-797 ;Minshull 禾口 Stemmer(1999) "Protein evolution by molecular breeding,,Current Opinion in Chemical Biology 3 :284-290 ;Christians 等(1999) "Directed evolution of thymidine kinase for AZT phosphorylation using DNA family shuff1ing" Nature Biotechnology 17 :259-264 ;Crameri 等 (1998) "DNA shuffling of a family of genes from diverse species accelerates directed evolution"Nature 391 :288-291 ;Crameri φ (1997) "Molecular evolution of an arsenate detoxification pathway by DNA shuffling"Nature Biotechnology 15 :436-438 ;Zhang 等(1997) "Directed evolution of an effective focusidase from a galactosidase by DNA shuffling and screening"Proc. Natl. Acad. Sci.USA 94 :4504-4509 ;Patten 等(1997) "Applications of DNA Shuffling toPharmaceuticals and Vaccines,,Current Opinion in Biotechnology 8:724-733; Crameri 等(1996) “Construction and evolution of antibody-phage libraries by DNA shuffling"Nature Medicine 2 :100-103 ;Crameri 等(1996) "Improved green fluorescent protein by molecular evolution using DNA shuff1ing" Nature Biotechnology 14 :315-319 ;“通过在 lac 阻抑物‘帽子形二聚体,(headpiece dimer) 上层示从肽文库进行配体的亲和选择性分离”,“分子生物学期刊”,255 :373-386 ; Stemmer (1996),“性PCR和装配PCR”,“分子生物学百科全书”,VCH出版社,纽约,第447-457 页;Crameri和Stemmer (19%),“组合性多盒式诱变产生了突变和野生型盒所有的置换”, "BioTechuigues”,18 :194-195 ;Stemmer 等(1995),“基因和完整的质粒的一步装配,形成大量的寡脱氧核糖核苷酸”,“Gene”,164 :49-53 ;Stemmer (1995),“分子计算的发展”, "Science", 270 :1510 ;Stemmer (1995),“探索序列空间”,"BioTechnolagy", 13 :549-553 ; Stemmer (1994),“通过DNA改组在体外进行蛋白质的快速进化”,“Nature ”,370 389-391 ; 和Stemmer (1994),“采用随机片段化和装配进行的DNA改组分子进化的体外重组”, Natl. Acad. Sci. USA, 9110747—10751。 产生多样性的突变方法包括,如定点诱变〔Ling等(1997),“DNA诱变的方法综述”,“Anal Biochem",254(2) :157-178 ;Dale等(1996),“使用硫代磷酸酯法进行寡核苷酸指导的随机诱变”,“Methods Mol Biol,,,57 :369-374 ;Smith (1995),“体外诱变,,,“Ann Rwv Genet”,19 :423-462 ;Botstein & Shortle (1985),“体外诱变的策略和应用”,“kteuce,,, 229 :1193-1201 ;Carter (1986),“定点诱变”,“Biochem J", 237 :1_7 ;和 Kunkel (1987),“寡核苷酸指导的诱变的效率”,“Nucleic”,Eckstein, F.和 Lilley,D. M. J.编辑,Springer Verlag, Berlin);使用含有模板的尿嘧啶进行的诱变〔Kunkel,1985,“不进行表型选择的快速和有效的位点特异性诱变”,Proc. Natl. Acad. Sci. USA, 82 :488-492 ;Kunkel等 (1987),“不进行表型选择的快速和有效的位点特异性诱变”,"Methods in Euzymol”,154 367-382 ;和Bass等(1988),“具有新的DNA-结合特异性的突变Trp阻抑物”,"Science", 242 :240-245 ;寡核苷酸指导的诱变《Methods in Euzymol)), 100 :468-500,1983 ;《Methods in Euzymol)), 154 :329-350 (1987) ;Zoller & Smith(1982),“使用M13衍生的载体进行寡核苷酸指导的诱变在DNA片段中产生点突变的有效和一般方法”,“Nucleic Acids ResMO 6487-6500 ;Zoller & Smith(1983),“克隆入M13载体中的DNA片段的寡核苷酸指导的诱变,,,“Mothin EmgnolMOO =468-500 ;和Zoller & Smith(1987),“寡核苷酸指导的诱变使用两种寡核苷酸引物和单链DNA模板的简单方法”,“Meth in Enzym0rM54 =329-350);硫代磷酸酯修饰的DNA诱变(Taylor等,1985),“在限制酶反应中使用硫代磷酸酯修饰的DNA 制备裸 DNA", "Nucl Acid Res”,13 :8749-8764 ;Taylor 等(1985),“使用硫代磷酸酯修饰的DNA以高频率快速产生寡核苷酸指导的突变”,“Nucl Acid Res”,13 :8765-8787 (1985); Nakamaye & Eckstein (1986),“硫代磷酸酯基团对限制性核酸内切酶Nci I切割的抑制及其在寡核苷酸指导的诱变中的应用”,《Nucl Acid Res》,14 :9679-9698 Jayers等(1988), “基于硫代磷酸酯的寡核苷酸指导的诱变中的Y-T核酸外切酶”,《Nucl Acid Res)), 16 791-802 ;和Sayers等(1988),“通过在溴乙锭的存在下与限制性核酸内切酶反应对含有硫代磷酸酯的DNA进行链特异性切割”,《Nucl Acid Res)), 16 =803-814);使用带缺口的双链体DNA进行的诱变〔Kramer等(1984)〕,“用于寡核苷酸指导的突变构建的带缺口的双链体DNA方法”,《Nucl Acid Res》,12 :9441-9456 ;Kramer & Fritz (1987), ((Mteh in Euzymol)), “通过带缺口的双链体DNA进行的寡核苷酸指导的构建的突变”,154 :350-367 ;Kramer等 (1988),“对于寡核苷酸指导的突变构建在带缺口的双链体DNA方法中,改进的体外酶反应,,,《Nucl Acid Res)), 16 :7207 ;和Fritz等(1988),“寡核苷酸指导的突变构建没有体外酶反应的带缺口的双链体DNA法”,《Nucl Acid Res)), 16 :6987-6999) 其他的合适方法包括点错配修复〔Kramer等(1984),“点错配修复”,“Cell”, 38 :879-887〕,使用修复缺陷的宿主细胞株进行的诱变〔Carter等(198 ,“使用M13载体改进寡核苷酸定点诱变”,((Nucl Acid Res)), 13 :4431-4443 ;和 Carter (1987),“使用 M13 载体进行改进的寡核苷酸指导的诱变”,“Mteh in EuzymolM54 :382_403〕,缺失诱变〔 Eghtedarzadeh & Henikoff (1986),“使用寡核苷酸产生大的缺失”,《Nucl Acid Res)), 14:5115〕,限制性选择和限制性效率和〔Wells等(1986),“氢键形成对稳定枯草蛋白酶过渡态的重要性”,Phil. Trans. R. Soc. Lond.A,317 :415_423〕,通过总基因合成进行的诱变 〔Nambiar等(1984),“编码核糖核酸酶S蛋白的基因的总合成和克隆”,“Science”,223 1299-1301 ;Sakamar和Khorana (1988),“用于牛杆菌外片段鸟嘌呤核苷酸结合蛋白(转导素)的亚基的基因的总合成和表达”,《Nucl Acid Res》,14 :6361-6372 ;Wells等(1985), “盒诱变在限定位点上产生多个突变的有效方法”,“Gene”,34 :315-323 ;和Grundstrom等 (1985),“通过微量‘鸟枪’基因合成进行的寡核苷酸指导的诱变”,《Nucl Acid Res)), 13 3305-3316〕,双链断裂修复(Mandecki (1986) ;Arnold(1993),“用于异常环境的蛋白质工程”,“Current Opin in Riotech”,4 :450-455 ;“大肠杆菌质粒中的寡核苷酸指导的双链断裂修复一种定点诱变方法”,Proc. Natl. Acad. Sci. USA, 83 :7177-7181〕。上述方法的更多细节可在“酶学方法”第1 卷中获得,该卷还描述了用各种诱变方法有效控制故障问题。关于各种产生多样性的方法的更详细的描写可从以下美国专利、PCT出版物和 EPO出版物中找到=Stemmer的美国专利5605793(1997年2月25日),《体外重组的方法》; Stemmer等的美国专利5811238(1998年9月22日),《通过反复选择和重组产生具有所需特性的多核苷酸的方法》;Stemmer等的美国专利5830721 (1998年11月3日),《采用随机片段化和重装配进行DNA诱变》;Stemmer等的美国专利5834252(1998年11月10日), 《未端互补聚合酶反应》;Minshull等的美国专利5837458(1998年11月17日),《用于细胞和代谢工程的方法和组合物》;WO 95/22625,Stemmer和Crameri,《采用随机片段化和装配进行的诱变》;Stemmer和Lipschutz的WO 96/33207,《未端互补聚合酶链式反应》; Memmer和Crameri的WO 97Λ0078,《通过反复选择和重组产生具有所需特性的多核苷酸的方法》;Minshull和Memmer的WO 97/35966,《用于细胞和代谢工程的方法和组合物》; Punnonen等的WO 99/41402,《遗传疫苗载体的靶标》;Punnonen等的W099/41383,《抗原库免疫》;Rmnonen等的WO 99/41369,《遗传疫苗载体工程》;Rmnonen等的WO 99/41368,《遗传疫苗的免疫调节性能的优化》;Stemmer和Crameri的EP 752008,《采用随机片段化和重装配进行的DNA诱变》;Stemmer的EP 0932670,《采用递推序列重组推进细胞DNA摄取》; Stemmer等的WO 99/23107,《采用病毒基因组改组进行的病毒嗜性和宿主范围的修饰》;Apt 等的W099/21979,《人乳头瘤病毒载体》;del Cardayre等的WO 98/31837,《采用递推序列重组推进全细胞和生物体》;flatten和Stemmer的WO 98/27230,《用于多肽工程的方法和组合物》;Stemmer等的WO 98/13487,《采用递推序列改组和选择优化基因治疗的方法》,WO00/00632,《产生高度多样性文库的方法》,WO 00/09679,《获得体外重组多核苷酸序列库和所产生的序列的方法》;Arnold等的WO 98/4观32,《使用随机的或限定的引物重组多核苷酸序列》;Arnold等的WO 99/29902,《产生多核苷酸和多肽序列的方法》;Vind的WO 98/41653, 《构建DNA文库的体外方法》;Borchert等WO 98/41622,《使用DNA改组构建文库的方法》; Pati和Zarling的WO 98/42727,《用同源重组进行序列改变》;Patten等的WO 00/18906, 《密码子改变的基因的改组》;Cardayre等的WO 00/04190,《采用递推序列重组推进全细胞和生物体》;Crameri等的WO 00/42561,《寡核苷酸介导的核酸重组》felifonov和Memmer 的TO 00/42559,《用于进化模拟中的繁殖数据结构的方法》;Mlifonov等的WO 00/42560, 《制备具有所需特征的特征链串、多核苷酸和多肽的方法》;Welch等的WO 01/23401,《将密码子改变的寡核苷酸合成法用于合成性改组》;以及Affholter的PCT/US01/06775,《单链核酸模板介导的重组和核酸片段分离》。某些美国申请还提供了关于产生多样性的方法的更详细的描述,包括=Patten等在1999年9月28日提交的《密码子改变的基因的改组》(USSN09/407800) ;delCardayre 等在 1998 年 7 月 15 日(USSN 09/166188)和 1999 年 7 月 15 日(USSN09/354922)提交的 《采用递推序列重组进化全细胞和生物体》;Crameri等在1999年9月28日提交的《寡核苷酸介导的核酸重组》(USSN 09/408392) ;Crameri等在2000年1月18日提交的《寡核苷酸介导的核酸重组》(PCT/US00/01203) ;Welch等在1999年9月观日提交的《将基于密码子的寡核苷酸合成用于合成性改组》(USSN 09/408393) ;Selifonov等在2000年1月18日提交的《具有所需特征的制备特字符串多核苷酸和多肽的方法》(PCT/US00/01202);和例如 klifonov等在200年7月18日提交的《制备具有所需特征的字符串、多核苷酸和多肽的方法》(USSN 09/618579) ;Selifonov和Stemmer在2000年1月18日提交的《用于进化模拟中的繁殖数据结构的方法》(PCT/US00/01138) ;Affholter的《单链核酸模板介导的重组和核酸片段分离》(USSN 60/186482,2000年3月2日提交)。简而言之,几类不同的普通的序列修饰法(如突变、重组等)对本发明是可用的并列在(例如)上述参考资料中。这就是说,可以在序列共连接之前或在共连接步骤之后,用任何一种上述方案改变核酸序列的组成以产生修饰的基因融合构建物。下面在本发明文中例举了一些不同类型的优选的多样化产生模式,例如包括,某些基于多样化产生模式的重组。用上述参考资料中讨论的各种技术可以进行核酸的体外重组,例如包括,用DNA 酶消化要被重组的核酸然后连接和/或PCR重新组装核酸。例如,可以使用有性PCR诱变, 其中,DNA分子被随机(或假随机,或甚至是非随机)断裂,然后在体外根据序列相似性在带有不同但相关的DNA序列的DNA分子之间进行重组,然后在聚合酶链式反应中通过延伸固定交换体。此过程和许多过程的变化描述在上述几种参考资料中,例如见Memmer (1994) Proc. Natl. Acad. Sci. USA 91 :10747_10751。类似地,可以在体内递推重组核酸,例如可以使重组发生在细胞内的核酸之间。上面提到的参考资料中列出了许多这种体内重组模式。这种模式通常选择在有关核酸之间提供直接重组,或在含有有关核酸的载体、病毒、质粒等之间提供重组,以及其它的模式。有关这种过程的细节可以在上述参考资料中找到。也可以使用全基因组重组法,其中,细胞或其它生物的全基因组被重组,任选的包括掺入带有所需库成分(如与本发明会经相符的基因)的基因组重组混合物。这些方法有许多应用,包括靶基因同一性不知道的那些全基因。可以在(例如)del Cardayre等题为"Evolution of Whole Cell and Organisms by Recursive Sequence Recombination,, 的 WO 98/31837 中,和(例如)del Cardayre 等标题亦为 “Evolution of Whole Cell and Organisms by Recursive Sequence Recombination,,的 PCT/US99/15972 中找至Ij这禾中方法的细节。因此,可以单独或联合使用任何重组、递推重组以及全基因组重组的这些方法和技术,以产生本发明经修饰的核酸序列和/或经修饰的基因融合构建物。也可以采用合成重组法,其中在PCR或连接反应中合成并重组装了对应于感兴趣靶子的寡核苷酸,包括与一个以上的亲代核酸相对应的寡核苷酸,因此产生了新的重组核酸。可以用标准的核苷酸加成法,或者可以(例如)通过三联核苷酸合成法产生寡核苷酸。有关这种方法的细节可以在上述参考资料中找到,例如包括Crameri等题为 "Olgonucleotide Mediated Nucleic Acid Recombination” 的 WO 00/42561 ;Welch 等题为“Use of Codon-Varied Oligonucleotide Synthesis for Synthetic Shuffling" 的 WO 01/23401 Jelifonov 等题为“Methods for Making Character Strings, Polynucleotides and Polypeptides Having Desired Characteristics''^ WO 00/42560 以及 Selifonov 禾口 Stemmer 题为“Methods of Populating Data Sructures for Use in Evolutionary Simulations"白勺 W000/42559。可采用硅内(in silico)重组方法,其中,在计算机中使用遗传算法重组对应于同源(乃至非同源)核酸的序列链。通过合成对应于重组序列的核酸,将产生的重组序列链任选地转化成核酸,如与寡核苷酸合成/基因重装配技术协同。这种方法可产生随机的、部分随机的或设计的变体。关于硅内重组的许多细节,包括遗传算法、遗传操纵子在计算机系统中的应用、与产生相应的核酸(和/或蛋白质)相结合、以及与所设计的核酸和/或蛋白质 (如基于横跨位点选择)相结合以及设计的、假随机的或随机的组合方法,在以下文献中所描述=Selifonov等的W000/42560,《制备具有所需特性的特性串、多核苷酸和多肽的方法》; klifonov和Memmer的WO 00/42559,《用于进化模拟中增加数据结构的方法》。关于硅内重组方法的更多细节可在这些文献中获得。通常可将这种方法用于本发明,以在硅内提供编码参与各种代谢途径(如类胡萝卜素生物合成途径、外蛋白(ectoime)生物合成途径、聚羟基链烷酸酯生物合成途径、芳族聚酮化合物生物合成途径等)的蛋白质的核酸序列和/ 或基因融合构建物的重组,和/或产生相应的核酸或蛋白质。可类似地采用评估天然多样性的许多方法,如通过使不同的核酸或核酸片段与单链模板杂交,经聚合和/或连接后,重产生全长序列,然后任选地使模板降解,回收所产生的修饰核酸。在使用单链模板的一个实施例中,使从基因组库衍生的片段群与对应于相反链的部分的或通常约全长的ssDNA或RNA退火。然后使用核酸酶除去非杂交片段末端,聚合填满这些片段之间的空隙,接着进行单链连接。从而介导了从此群装配得到复杂的嵌合基因。可通过消化(如果含有RNA或尿嘧啶)、在变性条件下的磁力分离(如果以有益于这种分离的方式标记)和其它可获得的分离/纯化方法除去亲代多核苷酸链。或者,使亲代链任选地与嵌合链共纯化,并在随后的筛选和加工步骤中除去。关于这种方法的更多细节可在Affholter的PCT/US01/06775 (《单链核酸模板介导的重组和核酸片段分离》)中获得。
在另一种方法中,将单链分子转化成双链DNA(dsDNA),然后通过配体介导的结合使该dsDNA分子结合到固相载体上。在将未结合的DNA分离后,从载体上释放出所选择的 DNA分子,然后将其导入合适的宿主细胞中,产生富含有与该探针杂交的序列的文库。以此法产生的文库为采用本文所述任一种方法进行进一步多样化提供了所需的底物。前述任何一种一般的重组形式都可以反复的方式进行(如一较或多较突变/重组,或者其它产生多样性的方法,任选地采用一种或多种选择方法),产生更多样的重组核酸组。还提出了采用多核苷酸链终止法进行诱变〔例如,参见Siort的美国专利 5965408,《中断合成重装配DNA的方法》,以及上面的文献〕,并可将该方法用于本发明。此方法中,在该基因的特异性引物的存在或缺乏的情况下,将对应于具有序列相似性区域的一个或多个基因的双链DNA混合并变性。然后使这些单链多核苷酸退火,并在聚合酶和链终止剂(如,紫外光、Y射线或X-射线;溴乙锭或其它嵌入剂;DNA结合蛋白,如单链结合蛋白、转录激活因子或者组蛋白;多环芳烃;三价铬或三价铬盐;或者由快速热循环介导的简易聚合;等等)的存在下培育,得到部分双链体分子。然后使这些部分双链体分子(如含有部分延伸的链)变性,并在随后的复制和部分复制循环中再退火,产生共享有不同程度的序列相似性的多核苷酸,这些多核苷酸与起始的DNA分子群相比是多样化的。任选地,可扩增该方法中一个或多个阶段的产物或者产物的部分合并物。通过链式终止法(如上述) 制得的多核苷酸是用于任何其它所述的重组方式的合适底物。还可采用Ostermeier等(1999)在“与DNA同源性无关的杂交酶的组合方法”〔《Nature Biotech)), 17 1205)中所述的“产生杂交酶的渐进截短”(incremental truncation for the creation of hybrid enzyme, ITCHY) ^M^LTj^^MM^MMM^ 产生多样性。可采用这种方法产生变体的起始文库,该文库可任选地作为一种或多种体外或体内重组方法的底物。还可参见Ostermeier等(1999),“采用渐进截短进行的组合蛋白质工程”,Proc. Natl. Acad. Sci. USA, 96 :3562-67 ;Ostermeier 等(1999),“在新颖的生物催化剂的工程中以渐进截短作为策略”,((Biol. Med. Chem)), 7 :2139_44。可有利地采用导致单个核苷酸或者邻接或非邻接核苷酸组改变的突变方法,将核苷酸多样性导入本发明的核酸序列和/或基因融合构建物中。许多诱变方法可在上述参考文献中获得;关于诱变方法的其他细节可在下文获得,这些细节也被应用于本发明。例如,可采用易错PCR产生核酸变体。采用这种技术,在DNA聚合酶复制保真性的条件下进行PCR,这样可沿着PCR产物的整个长度获得高比例的点突变。这些技术的例子可上述参考文献中获得,以及Leung等(1989),((Techuigue)), 1 :11-15 ;和Caldwell等 (1992), ((PCR Methods Applic》,2 :28_33。类似地,在涉及从小DNA片段的混合物装配PCR 产物的过程中,可采用装配PCR。在同一反应混合物中同时发生大量不同的PCR反应,一个反应的产物引发另一反应的产物。可采用寡核苷酸指导的诱变在感兴趣的核酸序列中导入位点特异性突变。这类技术的例子可在上述文献中获得,以及Reidhaar-Olson等(1988),仏cieuce》,241 :53_57。类似地,在使用与天然序列不同的合成性寡核苷酸盒替换双链DNA分子的小区域的过程中, 可采用盒诱变。寡核苷酸可含有完全和/或部分随机化的天然序列。递推集团诱变(recursive ensemble mutagenesis)是一种将蛋白质诱变的算法用于产生表型相关的突变体的多样性群体的方法,该突变体的诸成员在氨基酸序列上不同。这种方法使用反馈机制监测组合型盒式诱变的连续循环。这种方法的例子可在Arkin & Youvan (1992), Proc. Natl. Acad. Sci. USA, 89 :7811-7815 中获得。可采用指数集团诱变法产生含有高百分率独特和功能性突变体的组合型文库。感兴趣的序列中的少量残基在鉴别各改变位置上导致功能性蛋白质的氨基酸的同时被随机化。这类方法的例子可在Delegrave & Youvan (1993),《生物技术研究》,11 =1548-1552 ψ 获得。可采用体内诱变,通过在携带有一个或多个DNA修复途径中的突变的大肠杆菌菌株中繁殖DNA,在感兴趣的任何克隆DNA中产生随机突变。这些“增变”株比野生型亲代具有较高的随机突变率。使DNA在一个这样的菌株中繁殖,最终将在该DNA中产生随机突变。 这些方法在上述文献中有描述。在基因组(如细菌、真菌、动物或植物基因组)中产生多样性的其它方法可与上述和/或所参考的方法一起使用。例如,除了上述方法外,还提出了产生适用于转化到各种物种中的核酸多聚体的技术(例如,可参Ikhellenberger,美国专利5756316和上述参考文献)。用这类由相互之间不同的基因(如从天然的多样性得到的,或者通过采用定点诱变、 易错PCR获得的,通过诱变细菌株传代获得的等等)组成的多聚体转化合适的宿主,可提供用于DNA多样化的核酸多样性的来源,如通过上述体内重组方法。或者,可将共享有部分序列相似性的区域的个数单体多核苷酸转化入宿主物种中,由宿主细胞在体内进行重组。接下来的多轮细胞分裂可用来产生文库,文库的成员包括一个同源群,或者诸单体多核苷酸的混合群。或者,可采用标准的技术(如PCR和/或克隆)回收单体核酸,然后以任何一种重组方式进行重组,包括上面所述的递推重组方式。已描述了产生多物种表达文库的方法〔除了上述参考文献以外,还包括如 Peterson等(1998),美国专利5783431,《产生和筛选新颖代谢途径的方法》;和Thompson 等(1998),美国专利5拟4485,《产生和筛选新颖代途径的方法》〕,还提出了它们在鉴定感兴趣的蛋白质活性方面的用途〔除了上述文献以外,还可参见aiort(1999)的美国专利 5958672,《具有从非培养的微生物DNA的克隆的蛋白质活性筛选》〕。通常,多物种表达文库包括含有多种物种或菌株的cDNA或基因组序列的文库,在表达盒中操作性连接于适当的调节序列。该cDNA和/或基因组序列可任选地随机连接,以进一步提高多样性。载体可以是适用于在一种以上宿主生物体(如细菌物种、真核细胞)中转化和表达的穿梭载体。在一些例子中,通过预先选择编码感兴趣的蛋白质的序列,或者与感兴趣的核酸杂交的序列, 使得该文库产生偏倚。可提供这样的文库用作本文所述任一方法的底物。已广泛采用上述方法增加核酸和/或编码的蛋白质多样性。但是,在许多情况中, 并不是所有的多样性都是有用的,如功能方面,多样性仅仅有助于增加必然被筛选或选择的变体的背景、以鉴定少数有利的变体。在一些应用中,需要在多样化之前预先选择或预先筛选文库(如扩增的文库、基因组文库、cDNA文库、归一化文库等等)或其它底物核酸,例如,通过基于重组的诱变方法,或者需要使这些底物对编码功能性产物的核酸有偏倚。例如,在抗体工程中,在采用上述任一种方法进行人工操作前,利用体内重组活动,有可能使产生多样性的方法对具有功能性抗原结合位点的抗体产生偏倚。例如,可在采用本文所述的任一种方法进行多样化之前,先扩增B细胞cDNA文库衍生的重组CDR,然后装配到构架区域中〔如Jirholt等(1998),“利用序列空间体内将形成的互补性决定簇区域改组到主要构架中,,,《Gene》,215 :471〕。文库可针对编码具有所需酶活性的蛋白质的核酸产生偏倚。例如,在从具有特殊活性的文库中鉴定到一个克隆后,可采用任何已知的方法诱变该克隆,以引起DNA改变。 然后根据所需的活性筛选含有诱变的同系物的文库,该活性可能与初始的特殊活性相同, 或者不同。这种方法的一个例子是aiort(1999)在美国专利5939250〔《通过诱变产生具有所需活性的酶》)中提出的。可采用本领域已知的任何方法鉴定所需的活性。例如,WO 99/10539提出,可通过将基因文库的抽提物与从代谢旺盛的细胞获得的成分相组合,然后鉴定组合物中那一个显示了所需活性,从而筛选此基因文库。还提出(如WO 98/58085),可通过将生物活性底物插入文库的样品中,然后使用荧光分析仪(如流式细胞仪装置、CCD、 荧光计或光谱仪)检测对应于具有所需活性的产物的生物活性荧光,从而鉴定出具有所需活性的克隆。文库还可针对具有特殊特性(如与选择的核酸探针杂交)的核酸产生偏倚。例如, 申请WO 99/10539提出,可以下述方式从基因组DNA序列中鉴定出编码所需活性的多核苷酸(酶活性,例如脂肪酶、酯酶、蛋白酶、糖苷酶、糖基转移酶、磷酸酶、激酶、加氧酶、过氧化物酶、水解酶、水合酶、腈水解酶、转氨酶、酰胺酶或酰基转移酶)。使从基因组DNA群的单链DNA分子与偶联配体的探针杂交。可从培养的或非培养的微生物得到基因组DNA,或者从环境样品中得到。或者,可从多细胞生物或其组织得到基因组DNA。可事先从捕获培养基中释放的或未释放的用于捕获的杂交探针直接进行第二链合成,或者可采用本领域已知的各种其它策略进行。或者,可不需进一步克隆就将分离的单链基因组DNA群片段化,然后将其直接用于基于重组的方法(如上述,该方法使用单链模板)中。在Siort的WO 00/46344〔《基因疫苗和酶的非随机性产生》〕中描述了产生核酸和多肽的“非随机性”方法。这些方法,包括所提出的非随机性多核苷酸重装配和位点饱和性诱变方法都可用于本发明。采用掺杂或简并寡核苷酸进行随机或半随机诱变也有描述,如Arkin和^uvan (1992),“优化核苷酸混合物,以编码用于半随机诱变氨基酸的特殊亚组”,Biotechnology, 10. =297-300 ;Reidhaar-Olson ^ (1991),“使用寡核苷酸盒对蛋白质序列进行随机诱变,,,Methods Enzymo 1.,208 :564-86 ;Lim 和 Sauer (1991),“ 内部包装相互作用在决定蛋白质的结构和稳定性中的作用”,J. Mol. Biol.,219 :359-76 ;Breyer 和Sauer (1989),“单克隆抗体51F与λ阻抑物的良好特异性结合的突变分析”,J.Biol. Chem.,264 :13355-60 ;和《初排(walk-through)诱变》(Crea,R,美国专利 5830650 和 5798208 ;EP 专利 0527809B1)。不难理解,上述适用于在多样化前先使文库富集化的技术也可用于筛选由产生多样性方法获得的产物、或者产物文库。可以递推地或与改变核酸(如GAT编码多核苷酸) 联合实施上述方法。用于诱变、文库构建和其它产生多样性的方法的试剂盒也可从商业途径获得。例如,可从Mratagene (如QuickChange 定点诱变试剂盒;和Chameleon 双链、定点诱变试齐Ll盒)、Bio/Can Scientific、Bio_Rad(如,使用上述 Kunkel 方法)、Boehringer Mannheim Corp.、Clonetech Laboratories、DNA TechnoIogies>Epicentre Technologies (如 5 弓丨物 3 弓 I物试齐[J盒);Genpak Inc> Lemargo Inc、Life Technologies (Gibco BRL) >New EnglandBiolabs> Pharmacia Biotech、Promega Corp.、Quantum Biotechnologies、Amersham International pic (如,采用上述 Eckstein 法)禾口 Angl ian Biotechnology Ltd (如,米用上述 Carter/Winter 法)。上述参考文献提供了许多突变方式,包括重组、递推重组、递推突变和重组或者具有其它诱变形式的重组,以及这些方式的许多改变形式。不管采用哪种产生多样性的方式, 都可以重组本发明的核酸(相互之间,或者与相关(乃至无关)序列〕,产生用于本发明的基因融合构建物和修饰的基因融合构建物的重组核酸的不同组合,如同源核酸以及相应的多肽的组合。上述许多产生修饰的核酸序列的方法产生了亲代序列的大量多样性变体。在本发明的一些优选实施例中,采用经改动的技术(如某些形式的改组)产生变体的文库,然后筛选此文库中编码一些所需功能特性(如改进的GAT活性)的修饰核酸或者修饰核酸的混合池。可用于筛选酶活性的例子包括催化速率(通常以动力学常数如kcat和KM为特征)、底物特异性、和对底物、产物或其它分子(如抑制剂或激活剂)的激活或抑制的易感性。选择所需的酶活性的一个例子需要使宿主细胞在抑制不能充分表达感兴趣的酶活性(如GAT活性)的细胞生长和/或生存的条件下生长。采用这种选择方法可消除除编码所需酶活性的修饰核酸以外的所有修饰的核酸。例如,在本发明的一些实施例中,将宿主细胞维持在缺乏足够水平草甘膦时抑制细胞长年或存活的条件下。在这些条件下,仅仅含有编码能催化产生足够水平该产物的酶活性的修饰核酸的宿主细胞能生存和生长。本发明的某些实施例采用在递增浓度的草甘膦或草甘膦下进行多轮筛选。在本发明的某些实施例中采用质谱来检测草甘膦,草甘膦同类物或代谢物的乙酰化。质谱应用更详细的描述见以下实施例。为了方便以及获得高通量,常常需要筛选/选择微生物(如细菌,如大肠杆菌)中的所需的修饰核酸。另一方面,在一些例子中,植物细胞或植物中的筛选将是优选的,其最终的目的是产生用于在植物系统中表达的修饰核酸。在本发明的一些优选的实施例中,通过筛选表达不同的修饰核酸(单独的或者作为基因融合构建物的一部分)的宿主细胞池来增加通量。可对显示出明显活性的宿主的胞池反褶积,以鉴定表达所需活性的单个克隆。本领域技术人员将认识到,相关试验、筛选或选择方法将根据所需宿主生物而不同。通常,有利的是采用可以高通量形式实施的试验。在高通量试验中,有可能在一天内就筛选到几千种不同的变体。例如,可使用微滴定板的各个孔实施分离试验,或者,如果要观察浓度或培育时间的效果,每5-10个孔可检测试一种变体。除了液体方法以外,如上所述,有可能简单地使细胞在用于选择所需酶功能或代谢功能的培养基平板上生长。这种方法提供了一种简单和高通量的筛选方法。还已开发了许多众所周知的机器人系统,用于试验系统中的溶液相化学成分。这些系统包括自动工作站,如iTakeda Chemical Industries, LTD.(大阪,日本)开发的自动合成装置和许多使用机器臂的机器人系统(Zymate ILZymark公司,Hopkinton,MA ;0rca, Hewlett-Packard, Palo Alto,CA),该系统模拟科学家进行的人工合成操作。上述任一设备都适合在本发明中应用。对这些装置(如果有的话)的性质和实施作出改动以使它们如本文所述可参照整合系统进行操作,这对于相关领域的技术人员来说是明白。可从市场上获得高通量筛选系统〔例如,参见Zymark公司,Hopkinton,MA ;Air Technical Industries,Mentor, OH ;Beckman Instruments,Inc. Fullerton, CA ;Precision Systems, Inc.,Natick, MA等)。这些系统通常自动操作整个过程,包括所有的样品和试剂的吸取、液体分散、定时培育和在适用于该试验的检测器中对微滴定板进行最后读数。这些可配置的系统提供了高通量和快速起始,以及高度的灵活性和用户化。这类系统的制造商为各种高通量设备提供了详细的方案。因此,例如, ZymarkCorp.提供了描述用于检测基因转录、配体结合等调节的筛选系统的技术和册子。 Caliper Technologies (Mountain View, CA)也开发了试剂操作的微流体方法。在本文所述的实施例中,还可任选地使用照相机或其它记录设备(如光电二极管和数字存储设备)观察(以及任选地记录)光学图像,例如通过使图像数字化和/或在计算机上存储和分析该图像。可使用各种市售获得的外围设备和软件使录像或光学图像数字化,并将数字化的录像或光学图像存储和分析,如使用PC (Intel X 86或者与奔腾芯片相容的 DOS 、0S WIND0WS , WINDOWS NT 或者 WIND0WS95 为基础的机器)、MACINTOSH 或者 UNIX为基础的(如SUN 工作站)计算机。一个常规的系统将光线从试验设备传送到本领域常使用的冷电荷耦合装置(CCD) 的照相机中。C⑶照相机包括图像元素的一个阵列(像素)。样品的光线在C⑶上成像。对应于该样品的各区域的具体的像素(如在生物聚合物的阵列上的单个杂交位点)被取样, 以获得各位置上的光强度读数。平行加工多个像素,以增加速度。不难采用本发明的装置和方法通过荧光或暗视野显微镜技术观察任何样品,。其它多核苷酸组合物本发明还包括含有两种或多种本发明多核苷酸的组合物(如,作为重组底物)。这种组合物可以包含重组核酸文库,该文库含有至少2、3、5、10、20或50或更多的多核苷酸。 这些多核苷酸可任选地克隆入表达载体,提供表达文库。本发明还包括用限制性内切酶、RNA酶或DNA酶消化一个或多个本发明的多核苷酸而产生的组合物(例如,如以上述某些重组模式进行);以及通过机械方法(如超声、涡旋等)断裂或剪切一个或多个本发明的多肽产生的组合物,也可用以提供底物在上述方法中重组。类似地,含有若干组与本发明一个以上的核酸相对应的寡核苷酸的组合物可用作重组底物,这是本发明的一个特色。为了简便,这些断裂的、剪切的、或寡核苷酸合成的混合物称为片段化的核酸组。本发明还包括在核糖苷核酸或脱氧核糖核酸三磷酸和核酸聚合酶存在时通过培养一个或多个片段化的核酸组而制得的组合物。所产生的组合物形成了可用于上述许多重组模式的重组混合物。核酸聚合酶可以是RNA聚合酶、DNA聚合酶或RNA-引导的DNA聚合酶(即“反转录酶”);聚合酶可以是,例如,热稳定的DNA聚合酶(如VENT、TAQ等)。集成系统本发明提供了计算机、计算机可读介质和含有与本文的多肽和核酸(例如包括这里列出的那些序列及其各种沉默取代和保守取代)序列信息相对应的字符串的集成系统。例如,本领域已知的各种方法和遗传算法(GA)可用来测定不同字符串之间的同源性或相似性,或者可用来完成其它所需的功能,比如控制输出文件、提供基础以生成包括序列在内的信息的介绍等等。其例子包括上述的BLAST。因此,在本文的集成系统中可以检测并识别各种严格性和长度同源性和相似性的不同类型。例如,为比较分析生物多聚物的序列、在字处理中进行拼写检查以及为从各种数据库中获得数据,已经设计了许多确定同源性的方法。随着对天然多核苷酸中4个基础核碱基之间双螺旋互补配对反应的理解,模拟互补同源多核苷酸链退火的模型,也可用作序列对比的基础或通常依据本文序列相对应的字符串进行的其他操作(如字处理操作、构建含有序列或亚序列字符串的图表、输出表格等)的基础。用于计算序列相似性带GA的软件包的例子是BLAST,通过输入与本文序列相对应的字符串BLAST可适用于本发明。类似地,通过输入与本发明GAT同系物(核酸或蛋白质,或这两者)相对应的字符串,可以使标准桌面应用如字处理软件(例如Microsoft Word 或Corel WordPerfect ) 和数据库软件(例如电子制表软件如Microsoft Excel ,CorelQuattro Pro ,或数据库程序如Microsoft Access 或Paradox )适用于本发明。例如,此集成系统可以包括上述具有合适字符串信息的软件,例如和用户界面结合使用(如Windows、Macintosh或LINUX系统等标准操作系统中的GUI),以处理字符串。值得注意的是,也可以将专门的序列对比程序如BLAST合并入本发明的系统以对比核酸或蛋白质(或相应的字符串)的序列。用于本发明分析的集成系统通常包括数字计算机,装有序列对比GA软件以及输入该软件系统的包含本文任何序列的数据组。计算机可以是,例如,PC(IntelX86或者与奔腾芯片相容的以DOS 、0S WIND0WST\ WINDOWS NT 或者WIND0WS95 为基础的机器)、 MACINTOSH Power PC或者以UNIX (如SUN 工作站)为基础的机器或其它技术人员已知的商品化普通计算机。供序列对比或其它序列处理的软件是可以获得的,或者可以由技术人员采用Visualbasic、Fortan、Basic、Java等标准程序语言编写。任何控制器或计算机可任意包括一监测器,通常是阴极射线管(“CRT”)显示器、 平板显示器(如活性基质液晶显示器、液晶显示器)或其它设备。计算机线路通常置于含有许多集成电路芯片(如微处理器、储存器、接口电路等)的机箱中。机箱也可以任选地包括硬盘驱动器、光盘驱动器、高容量可移动驱动器如可写⑶-ROM和其它普通的外围元件。为用户输入和用户选择的序列作比较或在有关计算机系统中进行其它处理,任选地提供了键盘或鼠标等输入设备。计算机通常包括合适的接收用户指令的软件,它要么以用户输入一组参数字段 (如在GUI中)的形式,要么以预排程序的指令的形式(如为各种不同的特殊操作预排程序)。软件然后将这些指令转换成合适的语言以指导流动方向的操作并让控制器进行所需的操作。软件还可以包括输出元件以控制核酸合成(如根据本文序列或序列的对比)或其它在序列对比后发生的操作或其它采用本文序列相应的字符串进行的操作。因此,核酸合成设备可以是这里一种或多种集成系统的一个组件。其它方面,本发明提供了包含本发明的方法、组合物、系统和设备的箱子。本发明的箱子任选地含有以下一种或多种(1)本发明所述的设备、系统、系统组件或设备组件; (2)实施本发明所述方法,和/或操作本发明的装置或装置组件,和/或使用本发明组合物的说明书;(3) —种或多种GAT组合物或成分;(4)装载诸组分或组合物的容器;以及(5)包装材料。
在另一方面,本发明为实施本文所述的方法或试验,和/或为应用任何装置或本发明的箱子以实施本文所述的试验或方法提供了装置、装置组件、组合物或箱子。宿主细胞和牛物宿主细胞可包括真核系统,例如真核细胞、植物细胞、动物细胞、原生质体或者组织培养物。宿主细胞任选地含有多种细胞,例如生物体。或者,宿主细胞可包括原核系统,包括但不限于细菌(即革兰阳性菌、紫色细菌、绿硫菌、绿色非硫菌、蓝细菌、螺旋体、 栖热袍菌(thermatogale)、黄杆菌和类菌体)和古细菌(即Korarchaeota、热变形杆菌 (Thermoproteus)、热网属菌(Pyrodictium)、热球菌属(Thermococcales)、产甲烧菌、古生球菌属(Archaeoglobus)和极端嗜盐菌)。含有GAT核酸和/或表达本发明GAT多肽的转基因植物或植物细胞是本发明的一个特征。实际上可以用植物分子生物学领域的技术人员已知的各种方法进行植物细胞和原生质体的转化,这些方法包括但不限于本文所描述的方法。通常可以参见mi和Grossman 编的 Methods in Enzymology,第 153 卷(Recombinant DNA 第 D 部分)1987,学术出版社, 在此将其并入以供参考。当用于本文时,术语“转化”是指通过引入核酸序列,如“异源”或 “外源”核酸序列,改变宿主植株的基因型。异源核酸序列不一定自不同的来源,但有些时候在要将其引入细胞之外。除了 Berger、Ausubel和Sambrook之外,用于植物细胞克隆、培养和再生的一般性参考文献包括Jones (编)(19%)植物基因转移和表达方法-分子生物学方法,第49 卷Humana出版社"Towata新泽西州=Payne等(1992),“液态系统中的植物细胞和组织培养”(John Wiley & Sons,Inc.,纽约,NY)和 Gamborg 和 Philips 编辑(1995),“植物细胞、 组织和器官培养基本方法”(Springer Lab Mannal,Springer-Cerlag,Berlin)。在以下文献中描述了各种细胞培养基=Atlas和Parks (编)微生物培养基手册(199 (CRC出版社, Boca Raton,佛罗里达州)。植物细胞培养的其它信息可从商业文献中获得,如“生命科学研究用细胞培养分类”(1998),Sigma-Aldrich, Inc.(圣路易斯,密苏里州)(Sigma-LSRCCC), 以及增刊(1997),Sigma-Aldrich Inc.(圣路易斯,密苏里州)(Sigm-PCCS)。其它有关植物细胞培养的细节可以在Croy (编)“植物分子生物学”(199;3)BiOS kientific出版社, 牛津,英国中找到。在本发明的实施方案中,制备了适合植物细胞转化的含有一种或多种GAT多核苷酸的重组载体。编码所需GAT多肽的DNA序列,例如选自SEQ ID NO :1_5和11462,可方便地用来构建可被引入所需植物的重组表达盒。在本发明文中,此表达盒通常包括操作性连接于一启动子序列的经过选择的GAT多肽和其它转录和翻译起始调控序列,其中的调控序列足以引导GAT序列在被转化植物的预定组织(如整个植株、叶、根等)中的转录。例如,可以使用强或弱的组成型植物启动子,它可将GAT多肽的表达导向植物的所有组织。这种启动子在大多数环境条件和发育或细胞分化阶段中都有活性。组成型启动子的例子包括衍生自根瘤土壤杆菌(Agrobacterium tumefaciens) T-DNA的1,-或2,-启动子,各种植物基因的转录起始区是技术人员已知的。当GAT多核苷酸的过度表达对植物有害或不需要时,技术人员将认识到可以使用弱的组成型启动子以低水平表达。当高水平表达对植物无害时,可以使用强启动子,如t-RNA或其它pol III启动子,或强pol II启动子(如花椰菜花叶病毒启动子CaMV35S启动子)。
或者,植物启动子可以处于环境控制之下。这种启动子称为“诱导型”启动子。可能通过诱导型启动子改变转录的环境条件的例子包括病原体攻击、厌氧条件或光照的存在。 某些情况下,需要使用“组织特异的”和/或处于发育控制之下的启动子,这样GAT多核苷酸只在某些组织或其发育阶段中表达,如叶、根和芽孢等。涉及除草剂抗性和表型的基因的内源启动子对于驱动GAT核酸的表达特别有效,例如P450单加氧酶、谷胱甘肽-S-转移酶、 同型谷胱甘肽-S-转移酶、草甘膦氧化还原酶和5-烯醇丙酮莽草酸盐-2-磷酸合酶。组织特异性启动子也可用于引导异源结构基因,包括本文所述GAT多核苷酸的表达。因此这种启动子可用于重组表达盒以驱动本发明转基因植物所需的任何基因的表达, 例如GAT和/或其它赋予除草剂抗性或耐受性的基因,影响其它有用特征(如杂种优势) 的基因。类似地,如来自5’调控序列或异源基因内含子的增强子元件,也可用来促进异源性结构基因(如GAT多核苷酸)的表达。总之,用于植物中表达盒的具体启动子取决于使用意图。任何能在植物细胞中引导转录的启动子都是合适的。启动子可以是组成型或诱导型的。除了上述启动子,在植物中可起作用的细菌源启动子,包括章鱼氨酸合成酶启动子、胭脂氨酸合成酶启动子和其它衍生自天然Ti质粒的启动子。参见Herrera-Estrella等(1993)Nature 303:209。病毒启动子包括花椰菜花叶病毒的35S和19S RNA启动子。参见Odell等(1985)Nature 313 810-812。其它的植物启动子包括核酮糖-1,3-二磷酸羧化酶小亚基启动子和菜豆蛋白启动子。也可以使用E8基因(参见Deikman和Fischer (1988)EMB0 J. 7 :3315)和其它基因的启动子序列。还考虑了对单子叶植物种类特异的启动子(Mc Elroy D. , Brettell R. I. S. 1994. “转基因谷物中外源基因的表达”。Trends Biotech.,12 :62-68)。或者,采用本领域已知的方法,包括序列分析、增强子或启动子捕获等可以从病毒、细菌或植物来源中鉴定出具有有用特征的新启动子。在制备本发明的表达载体时,也可以使用启动子和GAT编码基因以外的序列。如果需要合适的多肽表达,可以从天然基因、各种其它植物基因或T-DNA中除去聚腺苷酸化区域。也可以使用(例如)能促进被表达的多肽转运进入内部细胞器(如叶绿体)或胞外分泌的信号/定位肽。含有GAT多核苷酸的载体还可以包括赋予植物细胞可选择表型的标记基因。例如,这种标记可以编码抗微生物剂抗性、特定的抗生素抗性(如对卡那霉素、G418、博来霉素、潮霉素的耐性)或除草剂抗性。可以使用报告基因,通过可视反应产物(如葡糖醛酸糖苷酶、半乳糖苷酶和氯霉素乙酰转移酶)或通过基因产物自身的直接显示化(如绿荧光蛋白、GFP ;Sheen等(1995) The Plant Journal8 :777)来监测基因表达和蛋白质定位,以便(例如)监测转基因在植物细胞中的表达。例如,在筛选具有除草剂抗性活性的植物细胞培养物时可以在植物细胞中使用短暂表达系统。植物转化原生质体本领域有许多用各种植物种类建立可转化的原生质体以及随后转化培养的原生质体的方法,在此将其并入以供参考。例如参见Hashimoto等(1990)PlantPhyhsiol. 93 857 ;Fowke 禾口 Constabel (编)(1994)Plant Protoplasts Saunders ^ (1993) Applicaiont of Plant In Vitro TechnoloRY symposium, UPM 16-18 ;以及 Lyznik 等(1991)BioTechniques 10 J95,在此将它们并入以供参考。叶绿体叶绿体是一些除草剂抗性活性的作用部位,在一些情况下,可将GAT多核苷酸融合于叶绿体转运序列肽,以促进其基因产物转运到叶绿体中。在这些情况下,可有利地将 GAT多核苷酸转化到植物宿主细胞的叶绿体中。在本领域中有许多方法可实现叶绿体转化和表达(例如可参见 Daniell 等(1998),Nature Biotech 16 :346 ;0,Neill 等(1993), The Blant J 3 :729 ;Maliga(1993),TIBTECH, 11 :1)。此表达构建物含有在植物中起作用的操作性连接于编码GAT多肽的多核苷酸的转录调节序列。设计用于在叶绿体中起作用的表达盒(如含有GAT多核苷酸的表达盒)包含确保在叶绿体中表达所需的序列。通常, 此编码序列侧接与叶绿体基因组同源的两个区域,以影响与叶绿体基因组的同源重组;可选择的标记基因还常常出现在侧接的质粒DNA序列中,以促进遗传稳定的转化叶绿体在所产生的转原生质体(transplastonic)植物细胞中的选择(例如,可参见Maliga(1993)和 Daniell (1998),以及其列出的参考文献)。通用转化方法可采用各种常规的技术将本发明的DNA构建物导入所需的植物宿主的基因组中。 用于转化各种高等植物物种的技术是周知的,并在技术和科学文献中有描述。例如,可参见 Payne, Gamborg, Croy, Jones 等,皆同上,以及如 ffeising 等(1988),Ann. Rev. Genet. 22 421。例如,可采用植物细胞原生质体的电穿孔和显微注射技术将DNA直接导入植物细胞的基因组DNA中,或者可使用弹道法(如DNA微粒轰击)将此种DNA构建物导入植物组织中。或者,可使该DNA构建物与合适的T-DNA侧接区域组合,然后一起导入常规的根癌农杆菌宿主载体中。当细胞受细菌感染时,农杆菌宿主的毒力功能将指导该构建物和毗邻标记插入植物细胞DNA中。显微注射技术在本领域中是已知的,并且在科学和专利文献中有很好的描述。 Paszkowski等(1984)EMBO .13 :2717中描述了使用聚乙二醇沉淀导入DNA构建物的方法。Fromm 等(1985),Proc. Natl. Acad. Sci. USA 82 :5824 中描述了电穿孔技术。Klein 等 (1987)Nature 327 :70 和 Week 等(1993)Plant Physiol 102 1077 描述了弹道转化技术。在一些实施方案中,采用农杆菌介导的转化技术将本发明的GAT序列转移到转基因植物中。农杆菌介导的转化主要用于双子叶植物,但是,某些单子叶植物也可用农杆菌转化。例如,以下文献描述了稻米的农杆菌转化Hiei等(1994)Plant.!. 6 :271 ;美国专利 5187073 ;美国专利 5591616 ;Li 等(1991) Science in China34 :54 ;和 Raineri 等(1990) Bio/TechnoloRY 8 :33。此外,Xu 等(1990)Chinese.! Bot 2 :81 描述了用农杆菌感染转化玉米、大麦、黑小麦和芦笋。农杆菌介导的转化技术有利地将根癌农杆菌的肿瘤诱导(Ti)性质粒整合到植物细胞基因组中的能力,用于将感兴趣的核酸共转染到本发明的重组植物细胞中。一般产生一种表达载体,其中感兴趣的核酸(如本发明的GAT多核苷酸)与自主复制的质粒连接,该质粒还含有T-DNA序列。T-DNA序列通常侧接该感兴趣的表达盒核酸,并含有该质粒的整合序列。除了该表达盒外,T-DNA通常还含有标记序列,如抗生素抗性基因。然后将具有T-DNA 和此表达盒的质粒转染到根癌农杆菌细胞中。通常,为了有效转化植物细胞,根癌农杆菌在质粒上含有必需的Vir区域,或者使该区域整合进染色体中。关于根癌农杆菌的讨论,可参见如FiroozabadyfPKuehnle, (1995)Plant Cell Tissue and OrRan Culture Fundamental Methods, Gamborg 禾口 Phillips (编)。转基因棺物的再牛可以培养通过植物转化技术(包括上面讨论的那些)得到的转化的植物细胞,以至产生具有转化的基因型(即GAT多核苷酸)从而具有所需的表型(如所需的对草甘膦或草甘膦类似物的抗性(即耐性))的全植物。这种再生技术依靠在组织培养生长培养基中操纵某种植物激素,通常依赖于已与所需的核苷酸序列一起导入的杀生物剂和/或除草剂标记物。或者,可以实施本发明GAT多核苷酸赋予的对草甘膦抗性的选择。以下文献描述了培养的原生质体的植物再生Evans等(198 “原生质体分离和培养,植物细胞培养手册”第124-176页,Macmillian出版公司,纽约;和Binding(1985) “植物、植物原生质体的再生”第21-73页,CRC出版社,Boca Raton0还可从植物愈伤组织、外植块、器官或其部分中获得再生。这些再生技术在以下文献中有一般性描述Klee等(1987) Arm. Rev. of Plant Phys 38:467。还可参见I^ayne和Gamborg。在用农杆菌转化后,将外植块转移到选择培养基中。技术人员将认识到,选择培养基的选择依赖于被共转染到该外植块中的可选择的标记。经过适当长的时间后,转化子将开始形成根。在根长约1-2厘米后,将其转移到合适的根和枝条培养基中。根和枝条培养基中应该维持选择压力。通常,在1周到约2周中,转化子长出根并形成小植株。在小植株高约3-5厘米后, 可将它们外植在纤维罐(fiber pot)中的无菌土壤中。本领域技术人员将认识到,应使用不同的气候环境以获得不同的的转化植物。例如,在长出根和枝条后将转化植物的切片以及体细胞胚转移到用于建立小植株的培养基中。关于转化植物的选择和再生的描述,可参见Dodds和Roberts (1995) “植物组织培养实验”,第3版,剑桥大学出版社。对于鼠耳芥属也有用真空渗滤(Bechtold N.,Ellis J.和Pelletier G., 1993, In planta Agrobacterium mediated gene transfer by infiltration of adult Arabidopsis thaliana plants. CR Acad Sci Paris Life Sci 316:1194-1199)禾口简 单浸淸开花植物(Desfeux, C. , Clough S. J.禾P Bent Α. F. ,2000, Female reproductive tissue are the primary target of Agrobacterium-mediated transformation by the Arabidopsis floral-dip method. Plant Physiol. 123 :895-904)进行农杆菌转化的方法。 采用这些方法,无需组织培养就可以产生转基因种子。现已研究出有效的农杆菌介导的转化方法的植物品种。例如,对于一些最有经济价值的棉花品种,还未见报道转化组织再生产生转基因植物的成功的组织转化。然而,可用于这些植物的方法包括通过农杆菌介导的转化将多核苷酸引入有关植物品种,确认可操作性,然后用标准有性杂交或回交技术将转基因转移到所需的经济作物中。例如,如果是棉花,可以用农杆菌来转化陆地棉(Gossypium hirustum)的Coker品系(如Coker品系310, 312,5110Deltapine 61或Moneville213),然后通过回交将转基因引入其它更具经济价值的陆地棉品种中。可以用基因型或表型特性鉴定本发明的转基因植物以确定本发明GAT多核苷酸的存在。可以用任何一种熟知的技术进行基因型分析,这包括基因组DNA的PCR扩增以及基因组DNA与特异性标记的探针杂交。表型分析包括,例如,暴露在一种经过选择的除草剂(如草甘膦)中的植物或植物组织的存活情况。 基本上任何植物基本上都可使用本发明的GAT多核苷酸来转化。用于本发明新颖的GAT多核苷酸的转化和表达的合适植物包括农艺上和园艺上重要的物种。这些物种包括但不限于禾本科(包括玉米、黑麦、黑小麦、大麦、粟、稻、小麦、燕麦等);豆科(包括豌豆、菜豆、扁豆、花生、薯蓣豆、豇豆、绒毛黧豆、大豆、苜蓿、紫苜蓿、羽扇豆、野豌豆、荷花、草木樨、紫藤和香豌豆);菊科(维管植物的最大家族,包括至少1000种属,包括重要的经济作物,如向日葵)和蔷薇科(包括悬钩子、杏树、杏仁、桃树、玫瑰等)。以及坚果树(包括胡桃、山核桃、榛子等),和林木〔包括松属(Pinus)、栎属(Quercus)、黄杉属(Pseudotsuga)、 红杉属(Sequoia)、杨属(Populus)等〕。其它可用本发明的GAT多核苷酸修饰以及上述修饰的目标植物包括下述种属 剪股颖属(Agrostis)、葱属(Allium)、金鱼草属(Antirrhinum)、旱芹属(Apium)、鼠耳 ^fM (Arabidopsis) > it^M (Arachis) ,P'β M (Asparagus) > ^p M (Atropa) > M ^ 属(Avena)(如燕麦)、山白竹属(Bambusa)、芸苔属(Brassica)、雀麦属(Bromus)、博洛瓦阿拉属(Browaalia)、山茶属(Camellia)、大麻属(Cannabis)、辣椒属(Capsicum)、鹰嘴豆属(Cicer)、藜属(Chenopodium)、菊苣属(Chichorium)、柑桔属(Citrus)、咖啡属 (Coffea)、薏苡属(Coix)、香瓜属(Cucumis)、葫芦属(Curcubita)、狗牙根属(Cynodon)、鸭茅属(Dactylis)、曼陀罗属(Datura)、胡萝卜属(Daucus)、毛地黄属(Digitalis)、薯蓣属 (Dioscorea)、油掠属(Elaeis)、Eleusine、羊矛属(Festuca)、草莓属(Fragaria)、老鹤草属(Geranium)(Glycine) > (n| H^M (Helianthus)(Heterocallis) >Η 叶胶属(Hevea)、大麦属(Hordeum)(如大麦)、天仙子属(Hyoscyamus)、番薯薯(Ipomoea)、 莴苣属(Lactuca)、兵豆属(Lens)、百合属(Lilium)、亚麻属(Linum)、黑麦草属(Lolium)、 百脉根属(Lotus)、番茄属(Lycopersicon)、甘牛至属(Majorana)、苹果属(Malus)、芒果属(Mangifera)、木薯属(Manihot)、苜蓿属(Medicago)、龙面花属(Nemesia)、烟草属(Nicotiana)、驴食豆属(Onobrychis)、稻属(Oryza)(如稻)、稷属(Panicum)、天竺葵属(Pelargonium)、狼尾草属(Pennisetum)(如粟)、碧冬茄属(Petunia)、豌豆属 (Pisum)、菜豆属(Phaseolus)、梯牧草属(Phleum)、早熟禾属(Poa)、李属(Prunus)、毛茛属(Ranunculus)、萝卜属(Raphanus)、茶庶子属(Ribes)、蓖麻属(Ricinus)、悬钩子属 (Rubus)、甘蔗属(Saccharum)、蛾蝶花属(Salpiglossis)、黑麦属(Secale)(如黑麦)、 千里光属(Senecio)、狗尾草属(Setaria)、白芥属(Sinapis)、茄属(Solanum)、蜀黍属 (Sorghum)、钝叶草属(Stenotaphrum)、可可树属(Theobroma)、车轴草属(Trifolium)、胡卢巴属(Trigonella)、小麦属(Triticum)(如小麦)、野豌豆属(Vicia)、豇豆属(Vigna)、 葡萄属(Vitis)、玉蜀黍属(Zea)(如玉米)、01yreae、Pharoideae以及其它。应注意的是, 禾本科(Graminae)的植物是本发明方法的特选目标植物。作为本发明的目标的普通农作物包括玉米、稻米、黑小麦、黑麦、棉花、大豆、高粱、 小麦、燕麦、大麦、粟、向日葵、加拿大油菜、豌豆、菜豆、小扁豆、花生、薯蓣豆、豇豆、绒毛黧豆、大豆、苜蓿、紫苜蓿、羽扇豆、野豌豆、荷花、草木樨、紫藤和香豌豆、番茄、香蕉和坚果植物(如胡桃、山核桃等)。一方面,本发明提供了通过在可使农作物植株生产出农作物的条件下,种植受编码草甘膦N-乙酰转移酶基因转化而耐受草甘膦的农作物植株,以制造农作物和收获农作物的方法。较好地,在植株或植株附近施用草甘膦其浓度可有效控制杂草而不抑制转基因农作物植株生长和产生农作物。可以在种植之前,或在种植后的任何时间包括收获时施用草甘膦。草甘膦可以施用一次或多次。草甘膦施用的时间安排、用量、施用模式和其它参数将取决于农作物植株和生长环境的具体性质,并本领域技术人员不难确定。本发明还提供了用这种方法制造的农作物。 本发明提供了繁殖含有GAT多核苷酸转基因的植物的方法。这种植物可以是,例如,单子叶植物或双子叶植物。一方面,繁殖必需使含有GAT多核苷酸转基因的植物和第二种植物杂交,这样至少一些杂交后代显示草甘膦抗性。—方面,本发明提供了在种植农作物的田地中选择性控制杂草的方法。此方法包括种植受编码GAT (如GAT多核苷酸)的基因转化而具有草甘膦抗性的农作物种子或植株, 然后对农作物和任何杂草施用足量的草甘膦以控制对农作物没有明显不利影响。重要的是应注意,不必使农作物都对除草剂不敏感,只要从抑制杂草得到的好处超过草甘膦或草甘膦类似物对农作物或农作物植株的不利影响即可。另一方面,本发明提供了将GAT多核苷酸用作可选择标记基因的方法。在本发明的一个实施方案中,细胞或生物体中GAT多核苷酸的存在赋予了该细胞或生物体可检测的草甘膦抗性表型特征,因此使技术人员可以挑选已受到与GAT多核苷酸连接的感兴趣基因转化的细胞或生物体。因此,例如,可将GAT多核苷酸引入核酸构建物(如载体)中,由此可通过在草甘膦存在时培养该宿主,选择成活和/或生长能力明显高于缺乏此核酸构建物的宿主存活或生长速度的植株,以鉴定含有此核酸构建物的宿主(如细胞或转基因植物)。 GAT多核苷酸在许多对草甘膦敏感的宿主(包括植物、大多数细菌(包括大肠杆菌)、放线菌、酵母、藻类和真菌)中都可用作可选标记。就抗常规的抗生素抗性而言,采用除草剂抗性作为植物中一种标记的一个好处是,它消除了某些人对抗生素抗性可能泄漏到环境中的担心。在本说明书的实施例部分描述了一些实验的实验数据,这些实验显示了 GAT多核苷酸在各种宿主系统中作为可选标记的应用。^t ^m^m^mm^m^mmm^mM-mm^可以就赋予转基因植物草甘膦抗性的能力,在按照本文所述方法多样化的GAT编码核酸的文库中进行选择。经过一轮或多轮多样化和选择后,可采用修饰的GAT基因作为选择标记以便于转基因植物的产生和评价,还可用作赋予实验作物或农作物除草剂抗性的方法。例如,多样化SEQ ID NO =I-SEQ ID NO :5中一个或多个多样化后产和了一个多样化的GAT多核苷酸文库,可以通过在大肠杆菌中表达该GAT编码序列文库进行最初的功能评价。如上所述,可纯化或部分纯化表达的GAT多肽,并用质谱仪筛选具有改进的动力学的菌株。经一轮或几轮初步多样化和选择后,将编码改进的GAT多肽的多核苷酸克隆入植物表达载体,该植物表达载体与,例如,强组成型启动子(如CaMV 35S启动子)操作性相连的。 通常经农杆菌介导的转化,将含有修饰的GAT核酸的表达载体转化入拟南芥宿主植株。例如,将花序浸在农杆菌溶液中然后使它们生长并结子不难转化拟南芥属宿主。在大约6周内回收了数千颗种子。然后从浸过的植物中大批收集种子并使其生长在土壤中。用这种方法可以产生数千株独立转化的植株以供评价、建立高产量(HTP)植物转化模式。用草甘膦喷洒成批生长的幼苗,存活的具有草甘膦抗性的幼苗可在选择过程中存活,而未转基因的植株和掺入较少有利修饰的GAT核酸的植株受到了除草剂处理的伤害或被杀死。任选地,例如可以利用该文库插入侧接T-DNA引物的物作PCR扩增回收可赋予改善的草甘膦抗性的 GAT编码核酸,并将其用于进一步的多样化步骤或用来产生相同或不同种类的其他转基因植物。如果需要,可以在各个随后的选择中采用增加浓度的草甘膦再进行多轮多样化和选择。用这种方法,可以获得在农田情况下有用的赋予草甘膦浓度抗性的GAT多核苷酸和多肽。
除草剂抗件本发明的草甘膦抗性机制可以和本领域已知的其它草甘膦抗性模式结合以制造具有较高草甘膦抗性的植物和植物的外植体。例如,通过在植物基因组中插入具有产生高水平5-烯醇丙酮酸莽草酸-3-磷酸酯合酶(EPSP)能力的序列可以产生草甘膦抗性植物,这在以下美国专利6, 248,876BU5, 627,061,5, 804,425,5, 633,435,5, 145,783、 4,971,908,5, 312,910,5, 188,642,4, 940,835,5, 866,775,6, 225,114BU6, 130,366、 5,310,667,4, 535,060,4, 769,061,5, 633,448,5, 510,471、Re. 36,449、RE 37,287E 和 5, 491, 288 以及国际出版物 WO 97/04103,WO 00/66746,WO 01/66704 和 WO 00/66747 中有更加完整的描述,出于所有目的在此将它们全文并入以供参考。还可向表达编码草甘膦氧化_还原酶基因的植物传递草甘膦抗性,这在美国专利5,776,760和5,463,175中有更加完整的描述,出于所有目的在此将它们全文并入以供参考。此外,本发明的草甘膦抗性机制可以和其它模式的除草剂抗性结合以使植物和植物的外植体对草甘膦和一种或多种其它除草剂具有抗性。例如,羟苯基丙酮酸双氧化酶是催化对-羟苯基丙酮酸(HPP)转化成尿黑酸反应的酶。抑制此酶并与此酶结合以抑制 HPP转化为尿黑酸的分子可用作除草剂。对这种除草剂抗性更强的植物描述在美国专利 6,245,968BU6, 268,549和6,069,115以及国际出版物WO 99/23886中,出于所有目的在此将它们全文并入以供参考。磺酰脲和咪唑啉酮除草剂通过阻遏乙酰乳糖合成酶(ALS)或乙酰羟酸合成酶(ARAS)也抑制高等植物的生长。磺酰脲和咪唑啉酮抗性植物的制造在美国专利 5,605,011,5, 013,659,5, 141,870,5, 767,361,5, 731,180,5, 304,732,4, 761,373、 5,331,107,5, 928,937和5,378,824以及国际出版物WO 96/33270中有更加完整的描述,出于所有目的在此将它们全文并入以供参考。谷氨酸合成酶(GS)似乎是大多数植物细胞发育和生长必需的基础酶。GS的抑制剂对植物细胞是有毒的。根据GS抑制植物的毒性作用,已经开发了草铵膦除草剂。这些除草剂是非选择性的。它们抑制现有植物所有不同种类的生长,引起它们整体毁灭。含有外源膦丝菌素乙酰转移酶的植物的开发描述在美国专利5,969,213,5, 489,520,5, 550,318、 5,874,265,5, 919,675,5, 561,236,5, 648,477,5, 646,024,6, 177,616B1 和 5,879,903 中, 出于所有目的在此将它们全文并入以供参考。原卟啉原氧化酶(protox)是产生植物存活必需的叶绿素所必需的。protox酶是许多除草化合物的靶标。这些除草剂也抑制现有植物所有不同种类的生长,引起它们整体毁灭。耐受这些除草剂的具有改变的protox活性的植物的开发描述在美国专利 6,288,306BU6, 282,837B1和5,767,373中,出于所有目的在此将它们全文并入以供参考。
实施例
例举了以下非限制性的实施例。技术人员将认识到,可以改变许多非关键性的参数以获得实质上类似的结果。实施例1 分离新的天然GAT多核苷酸通过显示GAT活 性的杆菌菌株的序列的表达克隆,发现了五种天然GAT多核苷酸 (即在非遗传修饰的生物中天然产生的GAT多核苷酸)。它们的核苷酸序列在本文中被确定并提供为SEQ ID NO=I-SEQ ID NO :5。简单地说,就对N-乙酰草甘膦的天然能力筛选了大约500株杆菌和假单胞菌菌株。将菌株在LB中培养过夜,离心收集,在稀释的甲苯中渗透,然后洗涤并重悬在含有缓冲液、5mM草甘膦和200 μ M乙酰-CoA的反应混合物中。将细胞在反应混合物中培养1-48小时,培养结束后在反应物中加入等体积的甲醇。然后离心沉淀细胞,滤去上清液,然后用母离子型质谱仪进行分析。如图2所述,通过比较反应混合物与N-乙酰草甘膦标准品的质谱图将反应产物鉴定为N-乙酰草甘膦阳性。产物检测同时依赖于两种底物(乙酰CoA和草甘膦),并通过加热变性细菌细胞而停止。然后通过功能性筛选从鉴定的菌株中克隆了各个GAT多核苷酸。制备基因组DNA 并用Sau3Al酶部分消化。将大约4Kb的片段克隆入大肠杆菌表达载体中并将其转化入电感受态大肠杆菌。在上述反应后用质谱仪鉴定各个显示GAT活性的克隆,但以PMBS渗透替代甲苯。测序基因组片段并鉴定假定的GAT多肽编码的开放性阅读框。大肠杆菌中该开放性阅读框的表达和反应混合物产生的高水平N-乙酰草甘膦的检测,证实了对GAT基因的鉴定结果。实施例2 分离自 m^mmmmm ΒΘ 的 GAT ^mmm^纯化地衣芽孢杆菌菌株B6的基因组DNA,用Sau3Al部分消化,并将I-IOKb的片段克隆入大肠杆菌表达载体中。用质谱分析确定了赋予大肠杆菌草甘膦N-乙酰转移酶(GAT) 活性的带有2. 5kb插入物的克隆。此插入物的测序揭示了一个含有441个碱基对的完整的开放性阅读框。此开放性阅读框随后的克隆证实它编码GAT酶。将图4所示的带有编码B6GAT酶基因的质粒pMAXY2120转化入大肠杆菌XLlBlue品系中。在Luria肉汤中加入 10%无害的饱和培养物,将该培养物在37°C培养1小时。以ImM的浓度加入IPTG诱导GAT 的表达。将培养物继续培养4小时,然后离心收集细胞并将细胞团保藏在-80°C。在0. 2g细胞中加入Iml以下缓冲液使细胞裂解25mM HEPES, pH7. 3 ;IOOmMKCl 和10 %甲醇(HKM),力卩有0. ImM EDTA, ImM DTT、lmg/ml鸡蛋溶菌酶和蛋白酶抑制剂 cocktail (获自Sigma,并按制造商的建议使用)。在室温(例如22_25°C )培育20分钟后, 短暂超声完成裂解。将裂解物离心并取上清液通过HKM平衡的S印hadeXG25将上清液脱盐。 在CoA Agrose(Sigma)上进行亲和层析部分纯化,此柱用HKM平衡,并在流体静力压下让澄清的提取物通过此柱。通过HKM洗涤除去未结合的蛋白质,并用含ImM辅酶A的HKM洗脱 GAT0这一过程提供了 4倍的纯化。这时,用粗制裂解物上样SDS聚丙烯酰胺凝胶观察到着染蛋白质大约65%是由GAT,另外的20%是该载体编码的氯霉素乙酰转移酶。通过Superdex 75 (Pharmacia)凝胶过滤部分纯化的蛋白质实现了均质性纯化。 流动相是HKM,其中GAT活性在相当于分子半径为17kD的体积处洗脱。取3 μ g GAT样品在厚Imm的12%丙烯酰胺凝胶上进行SDS聚丙烯酰胺凝胶电泳,考马斯染色判断此物质是均质的。纯化在此活性上提高了 6倍。对含有饱和(200 μ Μ)乙酰CoA、不同浓度的草甘膦和1 μ M纯化的GAT (含在用乙酸和20%乙二醇将pH调至7. 7并含有5mM吗啉的缓冲液中)的反应混合物测定了对草甘膦的表观KM。通过在235nm(E = 3. 40D/mM/cm)处连续监测乙酰CoA硫酯键的水解,确定初始反应速度。观察到了双曲线样的饱和动力学曲线(图5),由此得到2.9 士 0.2(SD)的表观对含有5mM草甘膦、不同浓度的乙酰CoA和0. 19 μ M GAT (含在用乙酸和20 %乙二醇将PH调至7. 7并含有5mM吗啉的缓冲液中)的反应混合物测定了对AcCoA的表观KM。 用质谱测定N-乙酰草甘膦确定了初始反应速度。在此装置中反复注入5 μ 1并绘制反应时间对整合峰面积的曲线得到了反应速度(图6)。观察到了双曲线样的饱和动力学曲线(图 7),由此得到2 μ M的表观ΚΜ。从已知酶浓度获得的Vmax值计算出k。at为6/min。实施例3 质谱(MS)筛检过稈以每个样品26秒的速度从96孔微量滴定板中取出样品(5 μ 1),无需分离将其注入质谱仪(Micromass Quattro LC,三组四倍器质谱仪)。通过水/甲醇(50 50)流动相以500UI/min的流速将样品带进质谱仪。负电子喷射电离处理(针电压_3. 5KV ;锥电压 20V ;电子源温120C ;去溶剂化温度250C ;锥气流90L/Hr ;去溶剂化气流500L/Hr)将注入的各个样品离子化。用第一组四倍器选择此过程中形成的分子离子(m/z 210)在第二组四倍器中进行碰撞诱导解离(CID),压力设置为5\10-4!^01~,碰撞能量调节为2(^1将第三组四倍器设为仅允许母离子(m/z 210)产生的一个子离子(m/z 124)进入记录信号的检测器。将第一组和第三组四倍器设在单位分辨度并在650V操作光电倍增管。将纯N-乙酰草甘膦标准品用于比较和峰整合以估计浓度。用这种方法可以检测出少于200Nm的N-乙酰草甘膦。实施例4 天然或低活性GAT酶的检测天然或低活性的GAT酶的Keat通常约为lmirT1,对草甘膦的Km为1. 5_10Mm。对乙酰CoA的Km通常小于25 μ M0使细菌培养物生长在96孔深孔板的营养培养基中,离心收集0. 5ml静止相细胞, 用5mM pH8的醋酸吗啉洗涤并重悬浮在0. Iml含有200 μ M乙酰CoA铵、5mM草甘膦铵和 5 μ g/ml PMBS(Sigma)的5mM pH8醋酸吗啉反应混合液中。PBMS渗透进细胞膜使底物和产物从细胞移至缓冲液而不释放所有细胞成分。反应在25-37°C下进行1-48小时。用等体积的100%乙醇结束反应并用0. 45 μ m的MAHV Multiscreen滤板(Millipore)过滤所有混合物。如上所述用质谱仪分析样品并与合成的N-乙酰草甘膦标准品进行比较。实施例5 高活性GAT酶的检测高活性GAT酶的k。at通常高达^OmirT1,且Km通常低于0. ImM草甘膦。将编码GAT酶的基因克隆入PQESO(Qiagen)等大肠杆菌表达载体并将其引入 XLlBlue(Stratagene)等大肠杆菌菌株。让培养物在浅U底96孔聚苯乙烯平板150ul营养培养基(如加有50 μ g/ml羧苄青霉素的LB)中生长至对数后期,并用新鲜的含有ImM IPTG(USB)的培养基作1 9稀释。培育4-8小时后,收集细胞,用pH6. 8的5mM醋酸吗啉洗涤并重悬于等体积的同样吗啉缓冲液中。最多用IOul洗涤过的细胞进行反应。在较高的活性水平,细胞先以作1 200稀释取5μ 1加入ΙΟΟμ 1反应混合物中。为测量GAT活性,对低活性可以使用上述一样的反应混合物。然而,为测量高活性GAT酶,应将草甘膦浓度降至0. 15-0. 5mM, pH降至6. 8,37°C进行反应1小时。反应结束和MS检测如本文所述。
实施例6 :GAT酶的纯化在CoA-琼脂糖 上亲和层析细胞到解物并在Superdex-75上凝胶过滤完成此酶的纯化。用下述方法获得了多达IOmg纯化的GAT酶将IOOml在pQE80载体上带有GAT多核苷酸的大肠杆菌培养物培养在含50μ g/ml羧苄青霉素的LB中过夜,用于接种IL加有 50ug/ml羧苄青霉素的LB。1小时后,加入IPTG至ImM并使培养物再生长6小时。离心收集细胞。将细胞悬浮在25mM HEPES(pH 7. 2) UOOmM KC1、10%甲醇(称为HKM)、0. ImM EDTAUmM DTT、Si gma-Aldrich提供的蛋白酶抑制剂混合物和lmg/ml鸡蛋溶菌酶中进行裂解。室温30分钟后,短暂超声细胞。离心除去颗粒物质并使裂解物通过辅酶A-琼脂糖柱。用几倍柱床体积的HKM洗涤柱子并用1. 5倍柱床体积的含有ImM乙酰辅酶A的HKM洗脱GAT。洗脱液中的GAT保留在Centricon YM 50超滤膜上而浓缩。通过一系列0. 6ml注射使此蛋白质通过Superdex 75柱获得进一步纯化。GAT活性峰在相应于分子量为17kD的体积处洗脱出来。这种方法使得GAT酶纯化至均一,回收>85%。用类似方法每次可以获得0. 1-0. 4mg量的最多96个改组的变体。诱导的培养物体积减至I-IOml,可在装在MAHV 滤板(Millipore)中的0.15ml柱子中进行辅酶A-琼脂糖亲和层析,Superdex75层析可以省略。实施例7 测定K,和L的标准方法用连续分光光度测定确定了纯化的蛋白质对草甘膦的Keat和KM,其中AcCoA硫酯键的水解以235nm监测。于室温(约23°C )下在96-孔测定板的孔中进行反应,孔中装有最终体积为0. 3ml的以下成分20mM HEPES pH6. 8、10%乙二醇、0. 2mM乙酰辅酶A和不同浓度的草甘膦铵。比较两种GAT酶的动力学,应该在同等条件下(如都在23°C )测定两种酶。用Vmax和通过Bradford测定确定的酶浓度,计算出K。at。采用Michaelis-Menten方程的Lineweaver-Burke转化从0. 125-10mM范围的草甘膦浓度获得的初始反应速度,计算出 KM。将K。at的值除以Km的值得到K。at/KM。用这种方法已经确定了本文例举的一些GAT多肽的动力学参数。例如,用上述试验条件已经确定与SEQ ID NO 445相应的GAT多肽的Kcat、Km和Kcat/KM分别为322min"\ 0. 5mM和ΘΘΟπιΜ^ι ιΓ1。用上述试验条件已经确定与SEQ ID NO 457相应的GAT多肽的Kcat、 Km和K。at/KM分别为llSmirT1、。. ImM和llSAm^min-1。用上述试验条件已经确定与SEQ ID NO 300 相应的 GAT 多肽的 K。at、KM 和 K。at/KM 分别为 2961^11入0. 65mM 和 ΑδθπιΜ^ι ιΓ1。本领域技术人员可以用这些数字证实,GAT活性试验产生的GAT动力学参数适合与这里所给数值进行比较。例如,如本文所报告,用于比较GAT活性的条件对SEQ ID NO :300、445和457 应该产生同样的动力学常数(在正常的实验方差内),如果这些条件用来比较实验GAT和本文例举的GAT多肽的话。按照这个方法测定了许多GAT多肽变体的动力学参数,这些参数提供在表3、4和5中。表3. GAT多肽的k。at值
SEQ ID NO.克隆 IDKcat (miη-1)
SEQ ID NO 263 13—10F648 6SEQ ID NO 264~~13—12G652Λ
SEQ ID NO 26514—2A5280.8
SEQ ID NO 26614—2C1133.4
SEQ ID NO 26714—2F11136.9
SEQ ID NO 268CHIMERA155.4
SEQ ID NO 26910—12D7Thl
SEQ ID NO 27010—15F43 Γ6
SEQ ID NO 27110—17D1176.2
SEQ ID NO 27210—17F6AT~9
SEQ ID NO 27310—18G924
SEQ ID NO 27410—1H376Γ2
SEQ ID NO 27510—20D1086 2
SEQ ID NO 27610—23F2101. 3
SEQ ID NO 27710—2B8108.4
SEQ ID NO 27810—2C7135
SEQ ID NO 27910—3G5KLA
SEQ ID NO 28010—4H7112
SEQ ID NO 28110—6D11&2Λ
SEQ ID NO 28210—8C6 Γ
SEQ ID NO 283UC3Γδ
SEQ ID NO 284UG3ΙδΓθ
SEQ ID NO 285 Η3h2
SEQ ID NO 28612—1F9δΟ
SEQ ID NO 28712—2G9151.权利要求
1.一种编码具有草甘膦N-乙酰转移酶活性的多肽的分离或重组的多核苷酸,其包括编码与含有SEQ ID NO :445的序列的最佳对比相似性评分至少为460的氨基酸序列的核苷酸序列,该评分用BL0SUM62矩阵法算得,该算法中,存在一个缺口扣11分,延伸一个缺口扣1分。
2.如权利要求1所述分离或重组的多核苷酸,其中,所述多肽包含SEQID NO :445的氨基酸序列。
3.如权利要求2所述分离或重组的多核苷酸,它包含SEQID NO :193或其互补序列的核苷酸序列。
4.如权利要求1-2中任一项所述分离或重组的多核苷酸,其中(a)亲代密码子已被相对于此亲代密码子为植物所优选使用的同义密码子替代;和/或(b)所述多核苷酸还包含编码N-末端叶绿体转运肽的核苷酸序列。
5.包含如权利要求1-4任一项所述多核苷酸的核酸构建物,所述构建物包含操作性连接于所述多核苷酸的启动子,其中该启动子与多核苷是异源的并可有效引起所编码多肽的充分表达以增强受此核酸构建物转化的植物细胞的草甘膦抗性。
6.如权利要求5所述的构建物,其还包含编码多肽的多核苷酸序列,此多肽赋予以有效水平表达该多肽的细胞或生物体一种可检测的表型性状;和/或其中的构建物包含T-DNA序列;和/或其中的多核苷酸操作性地连接于调控序列;和/或其中的构建物是植物转化载体。
7.含有至少一种如权利要求1-4中任一项所述多核苷酸或至少一种如权利要求5或 6所述构建物的细胞,其中,所述编码具有草甘膦-N-乙酰转移酶活性的多肽的多核苷酸和此细胞异源。
8.如权利要求7所述的细胞,其中,所述细胞是植物细胞。
9.如权利要求8所述的细胞,其中所述植物细胞还含有(a)至少一种通过另外的机制赋予草甘膦抗性的多肽;或(b)至少一种赋予对其他除草剂的抗性的多肽。
10.如权利要求9所述的细胞,其中(a)所述至少一种通过另外的机制赋予草甘膦抗性的多肽是抗草甘膦的5-烯醇丙酮酸莽草酸-3-磷酸酯合酶或抗草甘膦的草甘膦氧化还原酶;或(b)所述至少一种赋予对其他除草剂的抗性的多肽为突变的羟苯基丙酮酸双加氧酶, 抗磺胺的乙酰乳酸合酶,抗磺胺的乙酰羟酸合酶,抗咪唑啉酮的乙酰乳酸合酶,抗咪唑啉酮的乙酰羟酸合酶,膦丝菌素乙酰转移酶和突变的原卟啉原氧化酶。
11.如权利要求8-11中任一项所述的细胞,其中所述植物细胞来自选自下列属的农作物植物Eleusine,黑麦草属,山白竹属,芸苔属,鸭茅属,蜀黍属,狼尾草属,玉蜀黍属,稻属,小麦属,黑麦属,燕麦属,大麦属,甘蔗属,薏苡属,大豆属和棉属。
12.—种具有草甘膦N-乙酰转移酶活性的分离或重组的多肽,其中(a)所述多肽包含与含有SEQ ID NO :445的序列的最佳对比相似性评分至少为460的氨基酸序列,该评分用BL0SUM62矩阵法算得,该算法中,存在一个缺口扣11分,延伸一个缺口扣1分,或(b)权利要求10 (a)中所述多肽对草甘膦的Km至少为约2mM或更少,对乙酰CoA的Km 至少为约200 μ M或更少;且Kcat至少为约6/分钟。
13.如权利要求12所述分离或重组的多肽,其中,所述多肽包含SEQID NO :445的氨基酸序列。
14.如权利要求12所述分离或重组的多肽,它还包含N-末端叶绿体转运肽;和/或还包含分泌序列或定位序列。
15.一种生产具有草甘膦N-乙酰转移酶抗性的多肽的方法,所述方法包括培养如权利要求7-11中任一项所述的细胞。
16.一种产生草甘膦抗性转基因植物、其种子或植物细胞的方法,该方法包括(a)用权利要求1-4中任一项的多核苷酸转化植物或植物细胞;以及(b)任选的从转化的植物细胞再生转基因植物。
17.如权利要求16所述的方法,其还包括使转化的植物或植物细胞生长在可抑制同一物种野生型植株生长但不会抑制该转化的植株生长的草甘膦浓度下,其中,所述生长期间逐步提高草甘膦的浓度,和/或其中,所述生长期间,草甘膦浓度为对同一物种野生型植物或植物细胞的致死浓度。
18.如权利要求16或17中任一项所述的方法,其还包括通过杂交所述转基因植物和第二种植物以繁殖所述转基因植物,使得至少一部分杂交后代显示草甘膦抗性。
19.一种在农田中选择性控制杂草的方法,该方法包括(a)将被编码草甘膦N-乙酰转移酶的多核苷酸转化而具有草甘膦抗性的农作物种子或植株种植在田地中,其中编码草甘膦N-乙酰转移酶的多核苷酸为权利要求1-4中任一项的多核苷酸或权利要求5或6的构建体;以及(b)对田地中的农作物和杂草施用足以控制杂草而不明显影响农作物的足量草甘膦。
20.权利要求19的方法,其中所述农作物种子或植株包含至少一种通过另外的机制赋予草甘膦抗性的多肽。
21.权利要求20的方法,其中所述至少一种通过另外的机制赋予草甘膦抗性的多肽是抗草甘膦的5-烯醇丙酮酸莽草酸-3-磷酸酯合酶或抗草甘膦的草甘膦氧化还原酶。
22.权利要求19-21中任一项的方法,其中所述农作物植物选自下列的属=Eleusine, 黑麦草属,山白竹属,芸苔属,鸭茅属,蜀黍属,狼尾草属,玉蜀黍属,稻属,小麦属,黑麦属, 燕麦属,大麦属,甘蔗属,薏苡属,大豆属和棉属。
23.在农田中选择性控制杂草的方法,其包括(a)在田地里种植农作物种子或植株,所述农作物种子或植株由于被编码草甘膦N-乙酰转移酶的多核苷酸转化而具有草甘膦抗性,其中编码草甘膦N-乙酰转移酶的多核苷酸为权利要求1-4中任一项的多核苷酸或权利要求5或6的构建体,并且植株表达具有草甘膦N-乙酰转移酶活性的多肽和至少一种赋予对其他除草剂的抗性的多肽,和(b)对田地中的农作物和杂草施用足以抑制田地中杂草的生长而不明显影响农作物的草甘膦,和(c)任选地,对田地中的农作物和杂草同时或先后错开地施用草甘膦和任选地其它除草剂。
24.权利要求M的方法,其中所述至少一种赋予对其他除草剂的抗性的多肽为突变的羟苯基丙酮酸双加氧酶,抗磺胺的乙酰乳酸合酶,抗磺胺的乙酰羟酸合酶,抗咪唑啉酮的乙酰乳酸合酶,抗咪唑啉酮的乙酰羟酸合酶,膦丝菌素乙酰转移酶和突变的原卟啉原氧化酶。
25.如权利要求23或M所述的方法,其中,包括施用其它除草剂,且它选自羟苯基丙酮酸双加氧酶抑制剂、磺胺、咪唑啉酮、bialaphos、膦丝菌素、azafenidin、butafenacil、 sulfosate、草铵膦和ptotox抑制剂。
26.如权利要求25所述的方法,其中,所述其它除草剂被同时或先后施用。
27.权利要求23-26中任一项的方法,其中所述农作物植物选自下列的属=Eleusine, 黑麦草属,山白竹属,芸苔属,鸭茅属,蜀黍属,狼尾草属,玉蜀黍属,稻属,小麦属,黑麦属, 燕麦属,大麦属,甘蔗属,薏苡属,大豆属和棉属。
全文摘要
本发明涉及新的草甘膦N-乙酰转移酶(GAT)基因。具体地,本发明提供了新的蛋白质,包括能够催化草甘膦乙酰化的蛋白质以及其它结构上相关的蛋白质。还提供了新的能够编码这些蛋白质的多核苷酸、含有一种或多种这些新蛋白质和/或多核苷酸的组合物、含有这些新化合物的重组细胞和转基因植物、涉及新化合物的多样化方法以及使用这些化合物的方法。本发明提供的一些新方法和化合物可使生物(如植物)具有对草甘膦的抗性。
文档编号A01H5/00GK102212534SQ201110085718
公开日2011年10月12日 申请日期2001年10月29日 优先权日2000年10月30日
发明者B·F·麦克卡琴, C·艾维, D·西尔, J·明舒尔, L·A·卡斯尔, L·J·吉弗, N·B·杜克, P·A·帕腾, R·肯布尔, 陈永鸿 申请人:弗迪亚股份有限公司, 杜邦公司, 美国先锋海布雷国际公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1