新的草甘膦耐受型5－烯醇丙酮酰莽草酸－3－磷酸合成酶及其编码基因的制作方法

文档序号：393236阅读：183来源：国知局

专利名称：新的草甘膦耐受型5－烯醇丙酮酰莽草酸－3－磷酸合成酶及其编码基因的制作方法
技术领域：
本发明涉及分子生物学领域。具体地，本发明涉及一种新的草甘膦耐受型5-烯醇丙酮酰莽草酸-3-磷酸合成酶(5-enolpyrul-shikimate-3-phosphatesynthase，EPSPS)、编码上述合成酶的分离的核酸序列，包含该序列或其编码片段的核酸构建体，携有该序列或其编码片段或携有所述核酸构建体的载体，以及用所述构建体或载体转化的宿主细胞。
背景技术：
5-烯醇丙酮酰莽草酸-3-磷酸合成酶(EPSPS)是芳香族氨基酸合成途径中的关键酶，存在于植物和细菌中。草甘膦(Glyphosate)，即N-膦酰甲基甘氨酸，是一种广谱、高效的发芽后除草剂。它是EPSPS合成底物磷酸烯醇式丙酮酸(PEP)的竞争性抑制剂，可阻断PEP和3-磷酸莽草酸这两种底物在EPSPS催化下向5-烯醇丙酮酰莽草酸-3-磷酸莽草酸的转化，从而阻断芳香族氨基酸合成前体——莽草酸的合成途径，导致植物和细菌死亡。
植株对草甘膦的耐受性可通过向它们的基因组稳定引入草甘膦耐受型EPSPS编码基因而获得。目前已知的草甘膦耐受性EPSPS基因主要有两大类I类(如US 4,971,908；US 5,310,667；US 5,866,775等)和II类(如US5,627,061；US 5,633,435等)，它们都已成功导入植物基因组中，获得了具有草甘膦耐受性的植物细胞，以及完整的植株。
本发明的目的是寻找一种新的能耐受草甘膦的天然序列EPSPS。

发明内容
发明目的本发明一个目的是提供一种新分离的编码草甘膦耐受型EPSPS蛋白的核酸序列。
本发明另一目的是提供一种新的草甘膦耐受型EPSPS蛋白。
本发明还有一个目的是提供一种由上述核酸序列与使上述核酸序列在相应宿主细胞中表达所必需的调控序列可操作地连接而形成的核酸构建体。所述调控序列具体可任选包括启动子、增强子、前导序列、聚腺苷酸化信号、以及转录和翻译的起始和终止序列等。
本发明还有一个目的是提供一种含有上述核酸序列或核酸构建体的载体。
本发明还有一个目的是提供由上述核酸构建体或载体所转化的宿主细胞，该宿主细胞可以在适当的条件下表达上述核酸序列所编码的蛋白，并使该蛋白具有的EPSPS酶活性以及草甘膦耐受性，从而使该宿主细胞具有草甘膦耐受性。
本发明还有一个目的是提供上述宿主细胞及其后代细胞，这些细胞中含有上述核酸序列或其编码片段、核酸构建体、或载体，并且这些细胞具有草甘膦耐受性。
本发明的其它目的还可以体现在以下对本发明的详细描述以及具体实施例中。
发明概述本发明提供了一种具有天然序列的草甘膦耐受型5-烯醇丙酮酰莽草酸-3-磷酸合成酶(EPSPS)。所谓“天然序列”是指未经人工诱变，或其它生物学或化学改造，如基因工程改造的序列。本发明提供了该EPSPS的分离的氨基酸序列(即序列表中的序列3)，在该序列的基础上进行任何改动，如缺失、添加和/或取代一或多个氨基酸残基，最终所得氨基酸序列只要能形成具有EPSPS活性和草甘膦耐受性的蛋白，也都包括在本发明的范围内。
本发明还提供了分离的编码所述EPSPS的核酸序列(即序列表中的序列2，尤其其中的编码区)，在该序列的基础上进行任何改动，如缺失、添加和/或取代一或多个核苷酸，最终所得核酸序列只要能编码具有EPSPS活性和草甘膦耐受性的蛋白，也都包括在本发明的范围内。
将本发明编码EPSPS的核酸序列与相对于该序列同源或异源的其它序列可操作地连接，就构成本发明的核酸构建体。
根据本发明的方法，可将本发明的核酸构建体，或者直接将本发明的分离的核酸序列导入载体，用该载体转化特定的宿主细胞，从而表达本发明的EPSPS酶并使得该重组宿主细胞获得草甘膦耐受性。或者不通过载体转化，而是直接将本发明的分离的核酸序列，或本发明的核酸构建体用常规方法，如电穿孔等导入宿主细胞，同样可以表达本发明的EPSPS酶并赋予该细胞草甘膦耐受性。如此所获得的载体和重组宿主细胞，以及获得该细胞的方法，都包括在本发明的范围之内。
定义本文中“序列同源性％”是指通过序列对比，并且必要时插入空隙以获得同源性的最大百分比，而不考虑序列同源性的任何保守取代时，候选序列中相同于目标序列的氨基酸残基的百分数。此处所述序列包括氨基酸序列和核苷酸序列。可使用本领域已知的各种方法测定序列同源性百分比，例如，使用公众可得到的计算机软件如BLAST、BLAST-2、ALIGN、ALIGN-2或Megalign(DNASTAR)。本领域技术人员可以确定用于序列对比的具体参数，以及全长序列的最大比较所需的任何算法。
本文中“核酸构建体”指单链或双链核酸分子，这些分子分离自天然基因或已经过改变而含有以自然界不存在的方式而结合和并列的核酸片段。当核酸构建体含有表达本发明EPSPS所需的所有调控序列时，术语“核酸构建体”与“表达盒”是同义词。
本文中“调控序列”包括表达本发明多肽所必需的或有利的所有元件。每一种调控序列既可以是编码该多肽的核酸序列天然具有的，也可以是外来的。这种调控序列包括，但不限于，前导序列、聚腺苷酸化序列、前肽序列、启动子、和转录终止子。调控序列最少应包括启动子、以及转录和翻译终止信号。为了导入特异的限制性酶切位点以有助于调控序列和编码异源多肽的核酸序列的编码区进行连接，可以制备带有接头的调控序列。
本文中“可操作地连接”定义为使本发明的分离的核酸序列与相对于该序列同源或异源的任何其它序列相连，从而使它们作为一个整体能编码一种产物。需要时，可通过一定方式，如通过限制性内切酶的酶切而使它们分离。这里所述的同源或异源序列可以是任何序列，如能指导本发明所述分离的核酸序列在特定宿主细胞中表达的任何调控序列，或与本发明所述分离的核酸序列共同编码一种融合蛋白的序列，等等。
本文中“宿主细胞”包括任何能接受本发明所述分离的核酸序列，或能接受含有该序列的构建体或载体，并使该序列稳定维持在细胞内的细胞。宿主细胞包含了本发明所述分离的核酸序列后，能获得由该序列编码的性状或特征。
发明详述本发明人意外地发现并分离出一种新的草甘膦耐受型EPSPS编码基因。本发明人测定并在本文中公开了该基因的编码序列，即序列表中编号为2的序列以及其中明确指示的编码区(CDS，为第574-1800位的核苷酸)。本发明还公开了由该CDS编码的氨基酸序列，即序列表中编号为3的序列。本发明人使用DNAMAN 4.0版，按照CLUSTAL格式，将序列3所示氨基酸序列与已知的I类和II类EPSPS的序列比较后发现，本发明的序列中不含有被以往专利所保护的任何序列(见图2)。在GenBank蛋白序列库中进行的BLAST搜索发现，本发明的序列3与醋酪酸梭状芽孢杆菌EPSPS的氨基酸序列有37％同源性，与大肠杆菌EPSPS的氨基酸序列有20％同源性(见图2)。将序列2中574-1800位核苷酸所示的序列用NCBI-BLAST搜索，未发现与现有任何核酸序列的同源性。因此认为本发明所述的核酸序列和蛋白是新的。
因此，本发明一个方面涉及一种分离的核酸序列，其含有序列表中编号为2的核酸序列并可编码草甘膦耐受性EPSPS。
本发明还涉及含有上述序列2中第574-1800位核苷酸所示序列的分离的核酸序列，其可编码草甘膦耐受性EPSPS。
本发明还涉及在上述序列2所示序列，或上述序列2的第574-1800位核苷酸所示序列中改变一或多个核苷酸，或缺失和/或添加3个或3的倍数个核苷酸而产生的核酸序列，且该核酸序列能编码具有5-烯醇式丙酮酰莽草酸-3-磷酸合成酶(EPSPS)活性和草甘膦耐受性的蛋白。这里所述的核苷酸改变，缺失和添加是本领域技术范畴之内的常规内容。
本发明还涉及与用上述序列2所限定的核酸序列，或与用上述序列2的第574-1800位核苷酸所限定的核酸序列具有一定同源性的核酸序列，如同源性至少约65％，优选至少约66％，优选至少约67％，优选至少约68％，优选至少约69％，优选至少约70％，优选至少约71％，优选至少约72％，优选至少约73％，优选至少约74％，优选至少约75％，优选至少约76％，优选至少约77％，优选至少约78％，优选至少约79％，更优选至少约80％，更优选至少约81％，更优选至少约82％，更优选至少约83％，更优选至少约84％，更优选至少约85％，更优选至少约86％，更优选至少约87％，更优选至少约88％，更优选至少约89％，更优选至少约90％，更优选至少约91％，更优选至少约92％，更优选至少约93％，更优选至少约94％，最优选至少约95％，最优选至少约96％，最优选至少约97％，最优选至少约98％，最优选至少约99％，只要该序列编码具有草甘膦耐受性EPSPS活性的蛋白就属于本发明的范围。
本发明所述分离的核酸序列可按照本发明实施例部分所述方法从自然界克隆而获得。克隆方法可包括限制酶切割并分离含有编码目标蛋白的核酸序列的预期核酸片段，将该片段插入载体分子中，将该重组载体掺入到宿主细胞中，从而使该核酸序列的多个拷贝或克隆在该宿主细胞中复制。但是，更简便的方法是，根据在此公开的核苷酸序列，用自动核苷酸合成仪(如Applied Biosystems公司的ABI394 DNA合成仪)合成所述序列，或参照2000年10月4日公开的中国专利申请99103472.4的方法，分别合成上述核酸序列的片段，然后用常规连接酶和载体将这些片段连接成完整序列。
本发明的核酸序列可以是基因组序列、cDNA序列、RNA序列、半合成的序列、完全人工合成的序列或其任何组合物。
本发明另一方面还涉及能编码具有EPSPS活性和草甘膦耐受性的蛋白产物的分离的核酸序列，其中所述蛋白产物具有序列3所示氨基酸序列。
本发明还涉及能编码具有EPSPS活性和草甘膦耐受性的蛋白产物的分离的核酸序列，其中所述蛋白产物的氨基酸序列相对于上述序列3所示氨基酸序列，有一或多个氨基酸的取代、缺失和/或添加，但该产物仍具有EPSPS活性和草甘膦耐受性。所述氨基酸的取代、缺失和/或添加都是本领域常规技术可以完成的。优选这种氨基酸变化为小的特性改变，即不显著影响蛋白的折叠和/或活性的保守氨基酸取代；小的缺失，通常约1-30个氨基酸的缺失；小的氨基或羧基端延伸，例如氨基端延伸一个甲硫氨酸残基；小的连接肽，例如约20-25个残基长。
保守取代的实例是在下列氨基酸组内发生的取代碱性氨基酸(如精氨酸、赖氨酸和组氨酸)、酸性氨基酸(如谷氨酸和天冬氨酸)、极性氨基酸(如谷氨酰胺、天冬酰胺)、疏水性氨基酸(如亮氨酸、异亮氨酸和缬氨酸)、芳香氨基酸(如苯丙氨酸、色氨酸和酪氨酸)，以及小分子氨基酸(如甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变特定活性的那些氨基酸取代在本领域内是众所周知的，并且已由，例如，N.Neurath和R.L.Hill在1979年纽约学术出版社(Academic Press)出版的Protein中进行了描述。最常见的互换有Ala/Ser，Val/Ile，Asp/Glu，Thr/Ser，Ala/Gly，Ala/Thr，Ser/Asn，Ala/Val，Ser/Gly，Tyr/Phe，Ala/Pro，Lys/Arg，Asp/Asn，Leu/Ile，Leu/Val，Ala/Glu，和Asp/Gly，以及它们相反的互换。
对于本领域的技术人员而言很明显，这种取代可以在对分子功能起重要作用的区域之外发生，而且仍产生活性多肽。对于由本发明的分离的核酸序列编码的多肽，其活性必需的并因此选择不被取代的氨基酸残基，可以根据本领域已知的方法，如定点诱变或丙氨酸扫描诱变进行鉴定(如参见，Cunningham和Wells，1989，Science2441081-1085)。后一技术是在分子中每一个带正电荷的残基处引入突变，检测所得突变分子的草甘膦耐受性EPSPS活性，从而确定对该分子活性而言重要的氨基酸残基。底物-酶相互作用位点也可以通过其三维结构的分析来测定，这种三维结构可由核磁共振分析、结晶学或光亲合标记等技术测定(参见，如de Vos等，1992，Science255306-312；Smith等，1992，J.Mol.Biol224899-904；Wlodaver等，1992，FEBS Letters30959-64)。
本发明还涉及与上述序列3所示氨基酸序列具有一定同源性的氨基酸序列，如同源性至少约50％，优选至少约60％，优选至少约65％，优选至少约66％，优选至少约67％，优选至少约68％，优选至少约69％，优选至少约70％，优选至少约71％，优选至少约72％，优选至少约73％，优选至少约74％，优选至少约75％，优选至少约76％，优选至少约77％，优选至少约78％，优选至少约79％，更优选至少约80％，更优选至少约81％，更优选至少约82％，更优选至少约83％，更优选至少约84％，更优选至少约85％，更优选至少约86％，更优选至少约87％，更优选至少约88％，更优选至少约89％，更优选至少约90％，更优选至少约91％，更优选至少约92％，更优选至少约93％，更优选至少约94％，最优选至少约95％，最优选至少约96％，最优选至少约97％，最优选至少约98％，最优选至少约99％，只要具有所述同源序列的蛋白为草甘膦耐受性EPSPS蛋白，该序列就属于本发明的范围。
由本发明的分离的核酸序列编码的蛋白，具有含序列3所示氨基酸序列之EPSPS的活性的至少20％，优选至少40％，更优选至少60％，甚至更优选至少80％，甚至更优选至少90％，最优选至少100％。
本发明还涉及含有上述定义的核酸序列，或其中的编码序列(如本文中，序列2的574-1800位核苷酸)的核酸构建体。
本发明的核酸构建体还含有能使上述序列在所选宿主细胞中表达所必需的调控序列。所述调控序列与上述分离的核酸序列在核酸构建体中可操作地连接。
调控序列可以是启动子序列，包括介导多肽的表达的转录调控序列。启动子可以是在细胞中显示转录活性的任何核酸序列，包括突变的、截短的、及杂合的启动子，而且可以从编码细胞外或细胞内多肽的基因中得到，这些多肽可以与该细胞同源或不同源。众多用于原核细胞的启动子为本领域所熟知。
调控序列也可以是适当的转录终止序列，即被本文所述的宿主细胞识别以终止转录的序列。该终止序列与编码多肽的核酸序列的3’端可操作地连接。任何在宿主细胞中有功能的终止子都可以在本发明中使用。
调控序列可以是适当的前导序列，即mRNA上对细胞的翻译很重要的非翻译区。前导序列与编码多肽的核酸序列的5’端可操作地连接。任何在宿主细胞中有功能的前导序列都可以在本发明中使用。
调控序列也可以是聚腺苷酸化序列。该序列与核酸序列的3’端可操作地连接，而且当转录时，被细胞作为信号来识别，从而将聚腺苷酸残基加到转录出的mRNA上。任何在该细胞中有功能的聚腺苷酸化序列都可以在本发明中使用。
核酸构建体还可以包括一个或多个这样的核酸序列，这些核酸序列编码一个或多个有利于指导异源多肽表达的因子，例如，转录激活因子(如反式作用因子)、伴侣蛋白和加工型蛋白酶。任何在宿主细胞特别是细菌细胞和植物细胞中有效的因子都可以在本发明中使用。编码一个或多个这些因子的核酸不一定与编码异源多肽的核酸序列串联。
可以将上述各种核酸和调控序列连接在质粒或病毒等常规载体上，产生本发明的“重组表达载体”，所用方法是本领域技术人员所熟知的(可参见J.Sambrook，E.F.Fritsch和T.Maniatus，1989，Molecullar Cloning，laboratorymannual，2thed，Cold Spring，NY)。所述载体可以包含一个或多个便利的限制性内切酶位点。载体的选择通常取决于载体与所用宿主细胞的兼容性。所述载体可以是线性或闭合环状质粒。这样的载体可以是自主复制型载体，即，以染色体外实体的形式存在的载体，其复制独立于染色体的复制，如质粒(一种染色体外元件)，微型染色体，或人工染色体。载体可以包含确保自我复制的任何手段。或者，所述载体也可在导入细胞后，整合到基因组中并随染色体一起复制。载体系统可以是单一载体或质粒或两个或多个载体或质粒(它们共同包含目标核酸序列)，或是转座子。
在载体向细胞基因组整合的情况中，该载体可以包含指导该载体通过同源重组整合入细胞基因组的附加核酸序列。这些附加的核酸序列能够使该载体在染色体的精确位置整合入基因组中。为了增加在精确位置整合的可能性，整合元件应该优选包含足够数量的核酸，例如100至1500个碱基对，优选400至1500个碱基对，最优选800至1500个碱基对，它们与其相应的靶序列高度同源以提高同源重组的可能性。这些整合元件可以是与细胞基因组中靶序列同源的任何序列。而且，这些整合元件可以是非编码或编码型核酸序列。另一方面，该载体可以通过非同源重组整合入细胞的基因组中。
在自主复制的情况中，该载体可以进一步包含使该载体能在细菌细胞和植物细胞中自主复制的复制起始点。
本发明还涉及含有本发明核酸序列的重组“宿主细胞”。可将含有本发明核酸序列的核酸构建体或载体引入宿主细胞中，使本发明的核酸序列整合至染色体上或使载体自主复制，从而本发明的核酸序列得以在该宿主细胞中稳定表达，导致赋予该宿主细胞抗草甘膦的抗性。
宿主细胞可以是原核生物如细菌的细胞，但更优选真核生物如植物的细胞。
常用的细菌细胞有革兰氏阳性细菌如芽孢杆菌的细胞，或革兰氏阴性细菌如大肠杆菌和假单胞菌的细胞。在一个优选的实施方案中，细菌宿主细胞大肠杆菌的细胞。
将表达载体引入细菌宿主细胞可通过原生质体转化(如Chang和Cohen，1979，分子普通遗传学168111-115)，利用感受态细胞(如Young和Spizizin，1961，J.Bacteriol.81823-829，或Dubnau和Davidoff-Abelson，1971，J.Mol.Biol.56209-221)，通过电穿孔(如Shigekawa和Dower，1988，Biotech.6742-751)，或通过接合作用(如Koehler和Thorne，1987，J.Bacteriol.1695771-5278)而实现。

图1显示pKU2004的质粒图谱。
图2显示恶臭假单胞菌P.P4G-1的EPSPS与多个已知EPSPS的氨基酸序列比较。图中方框和阴影所示为以往专利所具体要求保护的序列。
图3显示带不同EPSPS基因的大肠杆菌XL1-BLUE MR在不同草甘膦浓度下的生长曲线。
具体实施例方式
实施例1.草甘膦耐受菌株的分离在河北省保定市附近一个草甘膦生产厂周围土壤中采样，用含有一定浓度草甘膦的培养基进行有效分离，共得到48株对草甘膦有很强耐受和降解能力的菌株，其中一株菌4G-1可以在400mM草甘膦限制性培养基上生长，而且对100mg/L的氨苄青霉素具有抗性，选择此菌株进行进一步研究。
实施例2.草甘膦耐受菌株的鉴定a)4G-1菌总DNA的小量制备在3ml含100mg/L氨苄青霉素的LB液体培养基中接种4G-1菌株，28℃振荡过夜培养，12000rpm/min离心收集菌体，将所得离心产物重悬于0.5ml溶液I(10mM NaCl，20mM Tris-Hcl pH8.0，1mM EDTA)中，加入蛋白酶K(Merck，德国)和SDS至终浓度分别为10μg/ml和0.5％。小心颠倒混匀，50℃放置6小时以上。加入等体积的酚，小心颠倒混匀，室温放置10min。室温12000rpm/min离心5min，用枪头(AxyGen，USA)吸取上清水相，再用等体积酚/氯仿抽提一遍。在上清液中加入10％3M NaAC，加2.3倍体积的无水乙醇沉淀，于-10℃12000rpm/min离心25min。弃去上清，再加70％乙醇500μl洗涤，12000rpm/min离心1分钟，尽量吸尽上清，在Savant中抽干20min或37℃温箱中晾干1hr，加入100μl TE溶液(10mM Tris-Cl，1mM EDTA，pH8.0)将其溶解，置-20℃中冻存备用。
b)4G-1菌株16S rRNA的克隆合成一对16S rRNA的通用引物(引物15’AGA GTT TGA TCA TGGCTC AG3’和引物25’TAC GGT TAC CTT GTT ACG ACT T3’)。用这一对引物在Robocycler 40(Stratagene)中进行PCR扩增反应。反应体系为1μl4G-1菌株总DNA为模板，5μl缓冲液，4μl 10μmol dNTP，1μl 20pmol/μl引物1和1μl 20pmol/μl引物2，37μl去离子水。反应条件为94℃10min，加入1μl 5U Pyrobest Taq DNA聚合酶，然后以94℃1min、50℃1min、72℃2min进行30个循环，最后72℃再延伸10min。得到一段约1.5kb的片段。按照PCR产物纯化试剂盒供应商Boehringer提供的方法提纯PCR产物。
将PCR纯化产物进行加A(脱氧腺苷酸)反应。反应体系为20μl(2μg)PCR纯化产物，5μl缓冲液，1μl(5U)Taq DNA聚合酶(鼎国公司，北京)，4μl5μmol dATP，20μl去离子水。
将反应产物按PCR产物的纯化方法纯化后，按照供应商Takara的说明与T载体(Takara，大连)相连，得到质粒pKU2000。测序结果如序列1所示。在美国国家生物信息中心(NCBI)用BLAST软件以及BLASTP 2.2.2[Dec-14-2001]数据库进行序列比对，发现该序列与恶臭假单胞菌(Pseudomonas putida)16S rRNA的基因序列有99％同源性，因此推定4G-1菌株为恶臭假单胞菌，将其命名为恶臭假单胞菌(Pseudomonas putida)4G-1(简称P.P4G-1)，并于2002年4月30日将该菌株保藏在中国微生物菌种保藏管理委员会普通微生物中心(中国.北京.中关村)，保藏号为CGMCC 0739。
实施例3.4G-1菌株基因文库的构建a)4G-1总DNA的大量制备将P.P4G-1菌株接种至含100ml LB培养基(补加100mg/L氨苄青霉素)的250ml锥形瓶中，28℃以200rpm/min振荡培养过夜，离心(8000转/min，5min)，将沉淀重悬于14ml上述溶液I中，加入蛋白酶K(Merck，德国)和SDS至终浓度分别为10μg/ml和0.5％。小心颠倒混匀，50℃放置6小时。加入等体积的酚，小心颠倒混匀，室温放置10min。室温4000rpm/min离心20min，用宽口枪头吸取上清水相，再加入等体积的酚/氯仿抽提一遍。在上清液中加入10％3M NaAC(pH5.5)，加2.3倍体积的无水乙醇沉淀。用玻璃棒小心挑出DNA，于70％乙醇中洗涤，弃去乙醇，晾干，加入2ml TE溶液(pH8.0)于4℃溶解24小时，得到约1mg总DNA。0.3％琼脂糖凝胶电泳确定DNA片段在80Kb以上。
b)回收总DNA的酶切片段取200μl总DNA(100μg)，加入5U限制性内切酶Sau3AI于室温分别酶切消化20分钟，30分钟，45分钟。合并酶切消化产物，加入EDTA至终浓度0.25mM，用等体积的酚/氯仿抽提，取上清加入10％3M醋酸钠，加2.3倍体积的无水乙醇沉淀，沉淀物用70％乙醇洗涤，如上述抽干，加入200μlTE溶解，将其加入Beckman sw28超速离心管中的12ml 10-40％蔗糖密度梯度上，将这些样品于20℃Beckman sw28转子中以120000g离心18小时，从顶部收集各组分(0.5ml)，每组分取15μl用0.3％琼脂糖凝胶电泳分析，合并含有30-40kb DNA的组分，加入约2倍体积的去离子水，7倍体积的无水乙醇，-20℃过夜沉淀，70％乙醇洗涤，干燥，溶于50μl TE中。
c)4G-1基因文库的构建按照Stratagne的方法将其提供的SuperCos1柯斯质粒载体先后用XbaI、碱性磷酸酶、BamHI处理，将其与上一步分离的总DNA片段相连。
按照Stratagene的说明书使用Gigapack III Gold的包装抽提物在体外包装一份连接产物；用Stratagene的试剂盒在大肠杆菌XL1-Blue MR(Stratagene)上滴定文库。由此获得的文库按照同一供应商的说明加以扩增和储存。
实施例4.
具有草甘膦耐受性的EPSPS基因的分离、筛选、测序及分析a)具有草甘膦耐受性基因的文库的筛选将1ml上述文库的储存液离心，弃去上清，加1ml灭菌生理盐水重悬，离心弃去上清，加1ml灭菌生理盐水重悬。按照大约每平皿103个细菌的密度涂布10mM草甘膦-50mg/L氨苄青霉素平板(20mM硫酸铵；0.4％葡萄糖；10mM草甘膦；0.5mM磷酸氢二钾；0.1mg/L硫酸铁；0.5g/L硫酸镁；0.5g/L氯化钙；2.1g/L氯化钠；50mM Tris(pH7.2)；5mg/L维生素b1；15g/L琼脂)，37℃过夜培养，得到一个菌株，将此菌株命名为BDS，将其携带的柯斯质粒命名为pKU2001。
b)草甘膦耐受性基因的分离将BDS菌株接种在50ml锥形瓶内20ml LB(补加50mg/L氨苄青霉素)中，以300rpm/min 37℃摇床培养12hr，离心收集菌体后按Molecullar cloning，laboratoty manual，出处同上所述碱法提取质粒pKU2001。将其与柯斯质粒载体重新转化入大肠杆菌XL1-Blue MR(Stratagene)中，于10mM草甘膦平板划线，只带柯斯质粒空载体的菌株无法在草甘膦培养基上生长，而带有pKU2001的菌株生长良好，证实pKU2001中确实带有抗草甘膦的基因。
将pKU2001用Sau3AI消化，用0.7％琼脂糖凝胶电泳回收2-4kb DNA片段，与经BamH I酶切并已经去磷酸化的pUC18载体(Yanisch-Perron，C.，Vieria，J.and Messing，J.1985，Gene 33103-119)相连，转化入大肠杆菌XL1-Blue MR(Stratagene)中，在补充50mg/L氨苄青霉素的10mM草甘膦板上铺板，37℃过夜培养，得到数十个克隆，挑菌、提质粒，筛选得到携有约2kb的外源片段的质粒，命名为pKU2002。将质粒pKU2002与pUC18空载体分别转入大肠杆菌XL1-Blue MR(Stratagene)中，划线于补充有50μg/ml氨苄青霉素的10mM草甘膦板上，带有pUC18空载体的菌株不能在草甘膦平板上生长，而带有pKU2002质粒的菌株生长良好，证实质粒pKU2002中确实带有抗草甘膦基因。
c)对pKU2002测序，得到1914bp克隆的全序列，见序列2。
d)用DNASIS软件对pKU2002进行序列分析，确定唯一可能的读码框(ORF)，见序列2中第574-1800位的核苷酸。其编码的氨基酸序列见序列3。
e)将该蛋白序列在美国国家生物信息中心(NCBI)的GenBank蛋白序列数据库中进行Blast搜索，发现与醋酪酸梭状芽孢杆菌EPSPS的氨基酸序列有37％同源性，与大肠杆菌EPSPS的氨基酸序列有20％同源性。此1230bp的序列可能编码一种EPSP合成酶，将此基因命名为pparoA。分析表明该基因不属于现有任何一种EPSPS类型，而是一种新型的EPSPS基因(第III类)。大肠杆菌、醋酪酸梭状芽孢杆菌和P.P4G-1的EPSPS氨基酸序列比较见图2。
f)设计一对含有下划线所示BamH I酶切位点的引物引物35’-CGG GAT CCT AAG TAA GTG AAA GTA ACA ATA CAGC-3’引物45’-CGG GAT CCC TTC TTC GGA CAA TGA CAG AC-3’以pKU2001为模板，进行PCR扩增。将扩增片段用BamH I酶切后插入pUC18，得到质粒pKU2003，测序证明无错配碱基的引入；将pKU2003用BamH I酶切，得到的小片段正向连入pACYC184(Chang，A.C.Y.，andCohen，S.N.，1978，J.Bacteriol.1341141-1156)的BamH I位点，得到质粒pKU2004(图谱见图1)，在此质粒中pparoA基因被pACYC184中的Tcr启动子起始转录。
实施例5大肠杆菌aroA基因的克隆及其草甘膦耐受性定位突变(对照实验)将大肠杆菌ET8000(MacNeil，T.，MacNeil，D.，and Tyler，B.1982 J.Bacteriol.1501302-1313)接种至15ml试管内3ml LB液体培养基中，37℃振荡培养过夜，离心收集菌体，按照前述方法提取总DNA。
设计一对引物并引入如下划线所示的BamH I酶切位点引物55’-CGG GAT CCG TTA ATG CCG AAA TTT TGC TTA ATC-3’引物65’-CGG GAT CCA GGT CCG AAA AAA AAC GCC GAC-3’以大肠杆菌总DNA为模板扩增得到大肠杆菌的aroA基因，即大肠杆菌中编码EPSPS蛋白的基因，将此基因用BamH I酶切，插入pUC18中得到质粒pKU2005，测序得到序列10，该序列与NCBI的GenBank数据库中大肠杆菌EPSPS的基因序列对比，证实无误。将质粒pKU2005用BamH I酶切，回收小片段正向插入载体pACYC184的BamH I位点得到质粒pKU2006。
对大肠杆菌的aroA基因进行点突变，将第287位的鸟嘌呤变为胞嘧啶，从而使大肠杆菌EPSPS蛋白的96位甘氨酸突变为丙氨酸。将该基因片段同样插入pACYC184 BamHI位点，得到质粒pKU2007。
实施例6.大肠杆菌aroA-菌株的EPSPS功能互补实验将pACYC184、pKU2004、pKU2006、pKU2007转化入大肠杆菌AB2889中(大肠杆菌aroA-菌株，来源于耶鲁大学)，分别在含有终浓度25mg/L氯霉素的限制性M63培养基(13.6g/L KH2PO4，0.5mg/L FeSO4-7H2O，20mM(NH4)2SO4，0.4％葡萄糖，1mM硫酸镁，0.5mg/L维生素B1)上划线培养，结果如表1。
补加aAAS组分如下100mg/L苯丙氨酸100mg/L酪氨酸100mg/L色氨酸5mg/L对氨基苯甲酸5mg/L 2，3-二羟基苯甲酸
5mg/L对羟基苯甲酸表1.大肠杆菌aroA缺失菌株EPSPS功能互补及草甘膦耐受性实验EPSPS功能互补及抗草甘膦状况AB2889M63培养基携带的质粒 M63培养基抗10mM草甘膦(补加aAAS)pACYC184- + -PKU2006 + + -pKU2007 + + +pKU2004 + + +同时在液体培养条件下，对以上菌株的生长曲线进行了测定。结果表明，与大肠杆菌aroA基因对照一样(pKU2006)，pKU2004所携带的基因完全可以在EPSPS功能上互补大肠杆菌AB2899的aroA缺陷，证明该质粒携带的1230bp核酸序列为EPSPS编码基因，同时该基因编码的EPSPS还具有草甘膦耐受性。
实施例7.新型EPSPS编码基因对草甘膦的抗性强度实验将质粒pKU2004、pKU2006、pKU2007分别转化入大肠杆菌XL1-BlueMR中，然后分别接种在M63限制性培养基中过夜培养，再转接入补加了不同浓度草甘膦的M63限制性培养基中培养，测它们的生长曲线。结果发现转化有pKU2006的大肠杆菌在5mM草甘膦培养基中生长已受到较明显的抑止，在40mM草甘膦培养基中已停止生长，而转化有pKU2004和pKU2006的大肠杆菌在40mM草甘膦培养基中生长未受到明显抑制，转化有pKU2004的大肠杆菌在120mM的草甘膦培养基中还能生长良好(图3生长曲线)。
序列表<110>孙义成陈彦丞李凤梅田哲贤林敏王忆平<120>新的草甘膦耐受型5-烯醇丙酮酰莽草酸-3-磷酸合成酶及其编码基因<130>PJMD3540N<141>2002-04-30<160>12<170>PatentIn version 3.1<210>1<211>1501<212>DNA<213>恶臭假单胞菌P.P4G-1(Pseudomonas putida P.P4G-1)<400>1agagtttgat catggctcag attgaacgct ggcggcaggc ctaacacatg caagtcgagc 60ggatgagaag agcttgctct tcgattcagc ggcggacggg tgagtaatgc ctaggaatct 120gcctggtagt gggggacaac gtttcgaaag gaacgctaat accgcatacg tcctacggga 180gaaagcaggg gaccttcggg ccttgcgcta tcagatgagc ctaggtcgga ttagctagtt 240ggtgaggtaa tggctcacca aggcgacgat ccgtaactgg tctgagagga tgatcagtca 300cactggaact gagacacggt ccagactcct acgggaggca gcagtgggga atattggaca 360atgggcgaaa gcctgatcca gccatgccgc gtgtgtgaag aaggtcttcg gattgtaaag 420cactttaagt tgggaggaag ggcattaacc taatacgtta gtgttttgac gttaccgaca 480gaataagcac cggctaactc tgtgccagca gccgcggtaa tacagagggt gcaagcgtta 540atcggaatta ctgggcgtaa agcgcgcgta ggtggtttgt taagttggat gtgaaagccc 600cgggctcaac ctgggaactg tatccaaaac tggcaagcta gagtacggta gagggtggtg 660gaatttcctg tgtagcggtg aaatgcgtag atataggaag gaacaccagt ggcgaaggcg 720accacctgga ctgatactga cactgaggtg cgaaagcgtg gggagcaaac aggattagat 780accctggtag tccacgccgt aaacgatgtc aactagccgt tggaatcctt gagattttag 840tggcgcagct aacgcattaa gttgaccgcc tggggagtac ggccgcaagg ttaaaactca 900aatgaattga cgggggcccg cacaagcggt ggagcatgtg gtttaattcg aagcaacgcg 960aagaacctta ccaggccttg acatgcagag aactttccag agatggattg gtgccttcgg 1020gaactctgac acaggtgctg catggctgtc gtcagctcgt gtcgtgagat gttgggttaa 1080gtcccgtaac gagcgcaacc cttgtcctta gttaccagca cgtaatggtg ggcactctaa 1140ggagactgcc ggtgacaaac cggaggaagg tggggatggc gtcaagtcat catggccctt 1200acggcctggg ctacacacgt gctacaatgg tcggtacaga gggttgccaa gccgcgaggt 1260ggagctaatc tcacaaaacc gatcgtagtc cggatcgcag tctgcaactc gactgcgtga 1320agtcggaatc gctagtaatc gcgaatcaga atgtcgcggt gaatacgttc ccgggccttg 1380tacacaccgc ccgtcacacc atgggagtgg gttgcaccag aagtagctag tctaaccttc 1440gggaggacgg ttaccacggt gtgattcatg actggggtga agtcgtaaca aggtaaccgt 1500a 1501<210>2<211>1914<212>DNA<213>恶臭假单胞菌P.P4G-1(Pseudomonas putida P.P4G-1)<220><221>CDS<222>(574)..(1803)<223><400>2gatcataaaa catgcttgta taaaggatgc tgccatgttc cgtgaactgg aagcgaacaa 60tcttgcggta tatcagaaaa agccaaagct gattgcagtg cttcttcagc gtaatgctca120gttaaaagcg aaggttgttc aggaggatga gttcgaaaag tcggtaaggc gtttgttgaa180ctttggtcat acattggggc atgccatcga aaatgaatat gcgttgatgc atggccatgc240ggttgctata ggaatgacat acgcgtgtca tatttctgag caattgtctg gattcaaaca300aacaaatcgc gtggtagaag tgttggaaca atatgggtta ccgacttata tggcattcga360tagggaaaag gcttttaatc tgttgaaaat ggacaagaag cgtgaaaaaa aggaaatgaa420ctatgtgttg ctggaaaaag tagggaaggg agtggtgaag agtattccac tggttcaatt480agaaaaaatc attcaagcat taccaaagtg aaagtaacaa tacagcccgg agatctgact540ggaattatcc agtcacccgc ttcaaaaagt tcg atg cag cga gct tgt gct gct 594Met Gln Arg Ala Cys Ala Ala1 5gca ctg gtt gca aaa gga ata agt gag atc att aat ccc ggt cat agc 642Ala Leu Val Ala Lys Gly Ile Ser Glu Ile Ile Asn Pro Gly His Ser10 15 20aat gat gat aaa gct gcc agg gat att gta agc cgg ctt ggt gcc agg 690Asn Asp Asp Lys Ala Ala Arg Asp Ile Val Ser Arg Leu Gly Ala Arg25 30 35ctt gaa gat cag cct gat ggt tct ttg cag ata aca agt gaa ggc gta 738Leu Glu Asp Gln Pro Asp Gly Ser Leu Gln Ile Thr Ser Glu Gly Val40 45 50 55aaa cct gtc gct cct ttt att gac tgc ggt gaa tct ggt tta agt atc 786Lys Pro Val Ala Pro Phe Ile Asp Cys Gly Glu Ser Gly Leu Ser Ile60 65 70cgg atg ttt act ccg att gtt gcg ttg agt aaa gaa gag gtg acg atc 834Arg Met Phe Thr Pro Ile Val Ala Leu Ser Lys Glu Glu Val Thr Ile75 80 85aaa gga tct gga agc ctt gtt aca aga cca atg gat ttc ttt gat gaa 882Lys Gly Ser Gly Ser Leu Val Thr Arg Pro Met Asp Phe Phe Asp Glu90 95 100att ctt ccg cat ctc ggt gta aaa gtt aaa tct aac cag ggt aaa ttg 930Ile Leu Pro His Leu Gly Val Lys Val Lys Ser Asn Gln Gly Lys Leu105 110 115cct ctc gtt ata cag ggg cca ttg aaa cca gca gac gtt acg gtt gat 978Pro Leu Val Ile Gln Gly Pro Leu Lys Pro Ala Asp Val Thr Val Asp120 125 130 135ggg tcc tta agc tct cag ttc ctt aca ggt ttg ttg ctt gca tat gcg 1026Gly Ser Leu Ser Ser Gln Phe Leu Thr Gly Leu Leu Leu Ala Tyr Ala140 145 150gcc gca gat gca agc gat gtt gcg ata aaa gta acg aat ctc aaa agc 1074Ala Ala Asp Ala Ser Asp Val Ala Ile Lys Val Thr Asn Leu Lys Ser155 160 165cgt ccg tat atc gat ctt aca ctg gat gtg atg aag cgg ttt ggt ttg 1122Arg Pro Tyr Ile Asp Leu Thr Leu Asp Val Met Lys Arg Phe Gly Leu170 175 180aag act ccc gag aat cga aac tat gaa gag ttt tat ttc aaa gcc ggg 1170Lys Thr Pro Glu Asn Arg Asn Tyr Glu Glu Phe Tyr Phe Lys Ala Gly185 190 195aat gta tat gat gaa acg aaa atg caa cga tac acc gta gaa ggc gac 1218Asn Val Tyr Asp Glu Thr Lys Met Gln Arg Tyr Thr Val Glu Gly Asp200 205 210 215tgg agc ggt ggt gct ttt tta ctg gta gcg ggg gct att gcc ggg ccg 1266Trp Ser Gly Gly Ala Phe Leu Leu Val Ala Gly Ala Ile Ala Gly Pro220 225 230atc acg gta aga ggt ttg gat ata gct tcg acg cag gct gat aaa gcg 1314Ile Thr Val Arg Gly Leu Asp Ile Ala Ser Thr Gln Ala Asp Lys Ala235 240 245atc gtt cag gct ttg atg agt gcg aac gca ggt att gcg att gat gca 1362Ile Val Gln Ala Leu Met Ser Ala Asn Ala Gly Ile Ala Ile Asp Ala
250 255 260aaa gag atc aaa ctt cat cct gct gat ctc aat gca ttt gaa ttt gat 1410Lys Glu Ile Lys Leu His Pro Ala Asp Leu Asn Ala Phe Glu Phe Asp265 270 275gct act gat tgc ccg gat ctt ttt ccg cca ttg gtt gct ttg gcg tct 1458Ala Thr Asp Cys Pro Asp Leu Phe Pro Pro Leu Val Ala Leu Ala Ser280 285 290 295tat tgc aaa gga gaa aca aag atc aaa ggc gta agc agg ctg gcg cat 1506Tyr Cys Lys Gly Glu Thr Lys Ile Lys Gly Val Ser Arg Leu Ala His300 305 310aaa gaa agt gac aga gga ttg acg ctg cag gac gag ttc ggg aaa atg 1554Lys Glu Ser Asp Arg Gly Leu Thr Leu Gln Asp Glu Phe Gly Lys Met315 320 325ggt gtt gaa atc cac ctt gag gga gat ctg atg cgc gtg atc gga ggg 1602Gly Val Glu Ile His Leu Glu Gly Asp Leu Met Arg Val Ile Gly Gly330 335 340aaa ggc gta aaa gga gct gaa gtt agt tca agg cac gat cat cgc att 1650Lys Gly Val Lys Gly Ala Glu Val Ser Ser Arg His Asp His Arg Ile345 350 355gcg atg gct tgc gcg gtg gct gct tta aaa gct gtg ggt gaa aca acc 1698Ala Met Ala Cys Ala Val Ala Ala Leu Lys Ala Val Gly Glu Thr Thr360 365 370 375atc gaa cat gca gaa gcg gtg aat aaa tcc tac ccg gat ttt tac agc 1746Ile Glu His Ala Glu Ala Val Asn Lys Ser Tyr Pro Asp Phe Tyr Ser380 385 390gat ctt aaa caa ctt ggc ggt gtt gta tct tta aac cat caa ttt aat 1794Asp Leu Lys Gln Leu Gly Gly Val Val Ser Leu Asn His Gln Phe Asn395 400 405ttc tca tga atagcttcgg ccgcatcttc agggtgcata tttttggcga 1843Phe Seratcacatggt gaatcagtag gcatcgttat tgatggttgt cctgctggtc tgtcattgtc 1903cgaagaagat c1914<210>3<211>409<212>PRT<213>恶臭假单胞菌P.P4G-1(Pseudomonas putida P.P4G-1)<400>3Met Gln Arg Ala Cys Ala Ala Ala Leu Val Ala Lys Gly Ile Ser Glu1 5 10 15Ile Ile Asn Pro Gly His Ser Asn Asp Asp Lys Ala Ala Arg Asp Ile20 25 30Val Ser Arg Leu Gly Ala Arg Leu Glu Asp Gln Pro Asp Gly Ser Leu35 40 45Gln Ile Thr Ser Glu Gly Val Lys Pro Val Ala Pro Phe Ile Asp Cys50 55 60G1y Glu Ser Gly Leu Ser Ile Arg Met Phe Thr Pro Ile Val Ala Leu65 70 75 80Ser Lys Glu Glu Val Thr Ile Lys Gly Ser Gly Ser Leu Val Thr Arg85 90 95Pro Met Asp Phe Phe Asp Glu Ile Leu Pro His Leu Gly Val Lys Val100 105 110Lys Ser Asn Gln Gly Lys Leu Pro Leu Val Ile Gln Gly Pro Leu Lys115 120 125Pro Ala Asp Val Thr Val Asp Gly Ser Leu Ser Ser Gln Phe Leu Thr130 135 140Gly Leu Leu Leu Ala Tyr Ala Ala Ala Asp Ala Ser Asp Val Ala Ile145 150 155 160Lys Val Thr Asn Leu Lys Ser Arg Pro Tyr Ile Asp Leu Thr Leu Asp165 170 175Val Met Lys Arg Phe Gly Leu Lys Thr Pro Glu Asn Arg Asn Tyr Glu180 185 190Glu Phe Tyr Phe Lys Ala Gly Asn Val Tyr Asp Glu Thr Lys Met Gln195 200 205Arg Tyr Thr Val Glu Gly Asp Trp Ser Gly Gly Ala Phe Leu Leu Val210 215 220Ala Gly Ala Ile Ala Gly Pro Ile Thr Val Arg Gly Leu Asp Ile Ala225 230 235 240Ser Thr Gln Ala Asp Lys Ala Ile Val Gln Ala Leu Met Ser Ala Asn245 250 255Ala Gly Ile Ala Ile Asp Ala Lys Glu Ile Lys Leu His Pro Ala Asp260 265 270Leu Asn Ala Phe Glu Phe Asp Ala Thr Asp Cys Pro Asp Leu Phe Pro275 280 285Pro Leu Val Ala Leu Ala Ser Tyr Cys Lys Gly Glu Thr Lys Ile Lys290 295 300Gly Val Ser Arg Leu Ala His Lys Glu Ser Asp Arg Gly Leu Thr Leu305 310 315 320Gln Asp Glu Phe Gly Lys Met Gly Val Glu Ile His Leu Glu Gly Asp325 330 335Leu Met Arg Val Ile Gly Gly Lys Gly Val Lys Gly Ala Glu Val Ser340 345 350Ser Arg His Asp His Arg Ile Ala Met Ala Cys Ala Val Ala Ala Leu355 360 365Lys Ala Val Gly Glu Thr Thr Ile Glu His Ala Glu Ala Val Asn Lys370 375 380Ser Tyr Pro Asp Phe Tyr Ser Asp Leu Lys Gln Leu Gly Gly Val Val385 390 395 400Ser Leu Asn His Gln Phe Asn Phe Ser405<210>4<211>20<212>DNA<213>人工序列<400>4agagtttgat catggctcag20<210>5<211>22<212>DNA<213>人工序列<400>5tacggttacc ttgttacgac tt 22<210>6<211>34<212>DNA<213>人工序列<400>6cgggatccta agtaagtgaa agtaacaata cagc34<210>7<211>29<212>DNA<213>人工序列<400>7cgggatccct tcttcggaca atgacagac 29<210>8<211>33<212>DNA<213>人工序列<400>8cgggatccgt taatgccgaa attttgctta atc 33<210>9<211>30<212>DNA<213>人工序列<400>9cgggatccag gtccgaaaaa aaacgccgac 30<210>10<211>1436<212>DNA<213>大肠杆菌(Escherichia coli)<400>10gttaatgccg aaattttgct taatccccac agccagcctg tggggttttt atttctgttg 60tagagagttg agttcatgga atccctgacg ttacaaccca tcgctcgtgt cgatggcact120attaatctgc ccggttccaa gagcgtttct aaccgcgctt tattgctggc ggcattagca180cacggcaaaa cagtattaac caatctgctg gatagcgatg acgtgcgcca tatgctgaat240gcattaacag cgttaggggt aagctatacg ctttcagccg atcgtacgcg ttgcgaaatt300atcggtaacg gcggtccatt acacgcagaa ggtgccctgg agttgttcct cggtaacgcc360ggaacggcaa tgcgtccgct ggcggcagct ctttgtctgg gtagcaatga tattgtgctg420accggtgagc cgcgtatgaa agaacgcccg attggtcatc tggtggatgc gctgcgcctg480ggcggggcga agatcactta cctggaacaa gaaaattatc cgccgttgcg tttacagggc540ggctttactg gcggcaacgt tgacgttgat ggctccgttt ccagccaatt cctcaccgca600ctgttaatga ctgcgcctct tgcgccggaa gatacggtga ttcgtattaa aggcgatctg660gtttctaaac cttatatcga catcacactc aatctgatga agacgtttgg tgttgaaatt720gaaaatcagc actatcaaca atttgtcgta aaaggcgggc agtcttatca gtctccgggt780acttatttgg tcgaaggcga tgcatcttcg gcttcttact ttctggcagc agcagcaatc840aaaggcggca ctgtaaaagt gaccggtatt ggacgtaaca gtatgcaggg tgatattcgc900tttgctgatg tgctggaaaa aatgggcgcg accatttgct ggggcgatga ttatatttcc960tgcacgcgtg gtgaactgaa cgctattgat atggatatga accatattcc tgatgcggcg 1020atgaccattg ccacggcggc gttatttgca aaaggcacca ccacgctgcg caatatctat 1080aactggcgtg ttaaagagac cgatcgcctg tttgcgatgg caacagaact gcgtaaagtc 1140ggcgcggaag tggaagaggg gcacgattac attcgtatca ctcctccgga aaaactgaac 1200tttgccgaga tcgcgacata caatgatcac cggatggcga tgtgtttctc gctggtggcg 1260ttgtcagata caccagtgac gattcttgat cccaaatgca cggccaaaac atttccggat 1320tatttcgagc agctggcgcg gattagccag gcagcctgaa tgaacaacgg gcaataaata 1380gccaaatctt tctttatcaa aacgtcggca cattgtcggc gttttttttc ggacct 1436<210>11<211>1284<212>DNA<213>大肠杆菌(Escherichia coli)<220><221>CDS<222>(1)..(1284)<223><400>11atg gaa tcc ctg acg tta caa ccc atc gct cgt gtc gat ggc act att 48Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile1 5 10 15aat ctg ccc ggt tcc aag agc gtt tct aac cgc gct tta ttg ctg gcg 96Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala20 25 30gca tta gca cac ggc aaa aca gta tta acc aat ctg ctg gat agc gat 144Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp35 40 45gac gtg cgc cat atg ctg aat gca tta aca gcg tta ggg gta agc tat 192Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr50 55 60acg ctt tca gcc gat cgt acg cgt tgc gaa att atc ggt aac ggc ggt 240Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly65 70 75 80cca tta cac gca gaa ggt gcc ctg gag ttg ttc ctc ggt aac gcc gga 288Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly85 90 95acg gca atg cgt ccg ctg gcg gca gct ctt tgt ctg ggt agc aat gat 336Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp100 105 110att gtg ctg acc ggt gag ccg cgt atg aaa gaa cgc ccg att ggt cat 384Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His115 120 125ctg gtg gat gcg ctg cgc ctg ggc ggg gcg aag atc act tac ctg gaa 432Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu130 135 140caa gaa aat tat ccg ccg ttg cgt tta cag ggc ggc ttt act ggc ggc 480Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly145 150 155 160aac gtt gac gtt gat ggc tcc gtt tcc agc caa ttc ctc acc gca ctg 528Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu165 170 175tta atg act gcg cct ctt gcg ccg gaa gat acg gtg att cgt att aaa 576Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys180 185 190ggc gat ctg gtt tct aaa cct tat atc gac atc aca ctc aat ctg atg 624Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met195 200 205aag acg ttt ggt gtt gaa att gaa aat cag cac tat caa caa ttt gtc 672Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val210 215 220gta aaa ggc ggg cag tct tat cag tct ccg ggt act tat ttg gtc gaa 720Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu225 230 235 240ggc gat gca tct tcg gct tct tac ttt ctg gca gca gca gca atc aaa 768Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys245 250 255ggc ggc act gta aaa gtg acc ggt att gga cgt aac agt atg cag ggt 816Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly260 265 270gat att cgc ttt gct gat gtg ctg gaa aaa atg ggc gcg acc att tgc 864Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys275 280 285tgg ggc gat gat tat att tcc tgc acg cgt ggt gaa ctg aac gct att 912Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile290 295 300gat atg gat atg aac cat att cct gat gcg gcg atg acc att gcc acg 960Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr305 310 315 320gcg gcg tta ttt gca aaa ggc acc acc acg ctg cgc aat atc tat aac 1008Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn325 330 335tgg cgt gtt aaa gag acc gat cgc ctg ttt gcg atg gca aca gaa ctg 1056Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu340 345 350cgt aaa gtc ggc gcg gaa gtg gaa gag ggg cac gat tac att cgt atc 1104Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile355 360 365act cct ccg gaa aaa ctg aac ttt gcc gag atc gcg aca tac aat gat 1152Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp370 375 380cac cgg atg gcg atg tgt ttc tcg ctg gtg gcg ttg tca gat aca cca 1200His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro385 390 395 400gtg acg att ctt gat ccc aaa tgc acg gcc aaa aca ttt ecg gat tat 1248Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr405 410 415ttc gag cag ctg gcg cgg att agc cag gca gcc tga 1284Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala420 425<210>12<211>427<212>PRT<213>大肠杆菌(Escherichia coli)<400>12Met Glu Ser Leu Thr Leu Gln Pro Ile Ala Arg Val Asp Gly Thr Ile1 5 10 15Asn Leu Pro Gly Ser Lys Ser Val Ser Asn Arg Ala Leu Leu Leu Ala20 25 30Ala Leu Ala His Gly Lys Thr Val Leu Thr Asn Leu Leu Asp Ser Asp35 40 45Asp Val Arg His Met Leu Asn Ala Leu Thr Ala Leu Gly Val Ser Tyr50 55 60Thr Leu Ser Ala Asp Arg Thr Arg Cys Glu Ile Ile Gly Asn Gly Gly65 70 75 80Pro Leu His Ala Glu Gly Ala Leu Glu Leu Phe Leu Gly Asn Ala Gly85 90 95Thr Ala Met Arg Pro Leu Ala Ala Ala Leu Cys Leu Gly Ser Asn Asp100 105 110Ile Val Leu Thr Gly Glu Pro Arg Met Lys Glu Arg Pro Ile Gly His115 120 125Leu Val Asp Ala Leu Arg Leu Gly Gly Ala Lys Ile Thr Tyr Leu Glu130 135 140Gln Glu Asn Tyr Pro Pro Leu Arg Leu Gln Gly Gly Phe Thr Gly Gly145 150 155 160Asn Val Asp Val Asp Gly Ser Val Ser Ser Gln Phe Leu Thr Ala Leu165 170 175Leu Met Thr Ala Pro Leu Ala Pro Glu Asp Thr Val Ile Arg Ile Lys180 185 190Gly Asp Leu Val Ser Lys Pro Tyr Ile Asp Ile Thr Leu Asn Leu Met195 200 205Lys Thr Phe Gly Val Glu Ile Glu Asn Gln His Tyr Gln Gln Phe Val210 215 220Val Lys Gly Gly Gln Ser Tyr Gln Ser Pro Gly Thr Tyr Leu Val Glu225 230 235 240Gly Asp Ala Ser Ser Ala Ser Tyr Phe Leu Ala Ala Ala Ala Ile Lys245 250 255Gly Gly Thr Val Lys Val Thr Gly Ile Gly Arg Asn Ser Met Gln Gly260 265 270Asp Ile Arg Phe Ala Asp Val Leu Glu Lys Met Gly Ala Thr Ile Cys275 280 285Trp Gly Asp Asp Tyr Ile Ser Cys Thr Arg Gly Glu Leu Asn Ala Ile290 295 300Asp Met Asp Met Asn His Ile Pro Asp Ala Ala Met Thr Ile Ala Thr305 310 315 320Ala Ala Leu Phe Ala Lys Gly Thr Thr Thr Leu Arg Asn Ile Tyr Asn325 330 335Trp Arg Val Lys Glu Thr Asp Arg Leu Phe Ala Met Ala Thr Glu Leu340 345 350Arg Lys Val Gly Ala Glu Val Glu Glu Gly His Asp Tyr Ile Arg Ile355 360 365Thr Pro Pro Glu Lys Leu Asn Phe Ala Glu Ile Ala Thr Tyr Asn Asp370 375 380His Arg Met Ala Met Cys Phe Ser Leu Val Ala Leu Ser Asp Thr Pro385 390 395 400Val Thr Ile Leu Asp Pro Lys Cys Thr Ala Lys Thr Phe Pro Asp Tyr405 410 415Phe Glu Gln Leu Ala Arg Ile Ser Gln Ala Ala420 42权利要求
1.一种分离的编码草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合成酶(EPSPS)的核酸序列，其中所述合成酶具有如下(i)或(ii)所述的特征(i)含有序列表中编号为3的序列所示氨基酸序列，或(ii)是在(i)限定的氨基酸序列中取代、缺失和/或添加一或多个氨基酸而衍生的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合成酶(EPSPS)。
2.权利要求1所述分离的核酸序列，其具有如下(i)或(ii)所述的特征(i)含有序列表中编号为2的序列所示核苷酸序列，并优选含有序列表中编号为2的序列中第574-1800位所示核苷酸序列，或(ii)在(i)限定的核苷酸序列中改变一或多个核苷酸，或缺失和/或添加3个或3的倍数个核苷酸后衍生的核苷酸序列，且其编码的蛋白具有5-烯醇式丙酮酰莽草酸-3-磷酸合成酶(EPSPS)活性和草甘膦耐受性。
3.权利要求1或2所述分离的核酸序列所编码的蛋白产物，其具有5-烯醇式丙酮酰莽草酸-3-磷酸合成酶(EPSPS)活性和草甘膦耐受性。
4.一种核酸构建体，其含有权利要求1或2所述分离的核酸序列。
5.一种载体，其携有权利要求1或2所述分离的核酸序列，或携有权利要求4的核酸构建体。
6.一种宿主细胞，其由权利要求4的核酸构建体或权利要求5的载体转化而成。
7.权利要求6的宿主细胞或其后代细胞，所述细胞包含权利要求1或2所述分离的核酸序列，或包含权利要求4的核酸构建体，或包含权利要求5的载体。
8.权利要求6或7的宿主细胞，其具有对草甘膦的耐受性。
9.制备权利要求8所述宿主细胞的方法，包括将权利要求1或2的核酸与适当调控序列可操作相连后导入适当载体，将该载体导入所选宿主细胞，使权利要求1或2的核酸序列表达出有活性的草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合成酶(EPSPS)。
10.一种草甘膦耐受型5-烯醇式丙酮酰莽草酸-3-磷酸合成酶(EPSPS)，其含有(i)序列表中编号为3的序列所示氨基酸序列，或(ii)在(i)所限定的氨基酸序列中取代、缺失和/或添加一或多个氨基酸而衍生的氨基酸序列。
全文摘要
本发明涉及一种新型5－烯醇丙酮酰莽草酸－3－磷酸合成酶(5－enolpyrul－shikimate－3－phosphatesynthase，EPSPS)，它对其合成底物磷酸烯醇式丙酮酸(PEP)的竞争性抑制剂草甘膦表现出很高的耐受性。本发明也涉及编码上述合成酶的基因、含此基因的构建体和载体，以及用该构建体或载体转化的宿主细胞。
文档编号C12N5/10GK1456672SQ0211799
公开日2003年11月19日申请日期2002年5月28日优先权日2002年5月10日
发明者孙义成, 陈彦丞, 李凤梅, 田哲贤, 林敏 , 王忆平申请人:北京大学

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：孙义成;陈彦丞;李凤梅;田哲贤;林敏;王忆平
技术所有人：北京大学
我是此专利的发明人

上一篇：偏振片保护膜的制作方法
上一篇：一种阴离子型层状材料固定化酶及其制备方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。