转化植物以表达苏云金芽孢杆菌δ-内毒素的方法

文档序号:454594阅读:590来源:国知局
专利名称:转化植物以表达苏云金芽孢杆菌δ-内毒素的方法
1.0发明背景1.1发明领域本发明总的来讲涉及具有杀虫能力的转基因植物,以及涉及用来将赋予抗虫性的基因转移到植物基因组中的DNA构成物。更具体地讲,本发明涉及在用苏云金芽孢杆菌(B.thuringiensis)δ-内毒素编码基因转化的植物中表达杀虫蛋白、导致有效防治敏感的目标害虫的方法。
1.2相关技术的描述1.2.1在植物中防治昆虫侵染的方法众所周知革兰氏阳性土壤细菌苏云金芽孢杆菌产生蛋白性伴胞晶体或δ-内毒素,δ-内毒素对种类繁多的鳞翅目、鞘翅目和双翅目幼虫有毒性。苏云金芽孢杆菌在孢子形成过程中产生对某些昆虫物种具有特异性毒素的晶体蛋白。已经表明许多不同菌株的苏云金芽孢杆菌产生杀虫晶体蛋白。包含产生具杀虫活性蛋白的苏云金芽孢杆菌菌株的组合物在商业上已经用作环境可接受的局部杀虫剂,因为它们对特定目标昆虫具有毒性,而对植物和其它非目标生物没有毒性。
δ-内毒素晶体通过摄食对昆虫幼虫有毒性。该晶体在昆虫中肠溶解,释放前毒素形式的δ-内毒素,这种形式的δ-内毒素在大多数情况下随后被中肠蛋白酶加工为活性毒素。活化的毒素通过受体蛋白而识别并结合昆虫中肠上皮的刷状缘。已经从某些昆虫幼虫中分离出几种推定的晶体蛋白受体(Knight等,1995;Gill等,1995;Masson等,1995)。活性毒素结合后,毒素分子嵌入并聚集,在中肠上皮形成孔。这一过程导致衬于中肠上皮的细胞渗透失调、水肿、裂解,最终导致幼虫死亡。1.2.2转基因苏云金芽孢杆菌δ-内毒素作为生物杀虫剂植物抗性和生物防治在应用于大多数不同作物的大多数杀虫改进程序中是重要的防治策略。随着分子遗传学技术的来临,已经分离出各种δ-内毒素基因并且测定了其DNA序列。这些基因已经用来构建某些遗传工程苏云金芽孢杆菌制品,这些制品已经被批准用于商业用途。最新进展已经看到了开发的新的δ-内毒素传递系统,包括含有并表达遗传工程δ-内毒素基因的植物。只要可以解决某些问题,苏云金芽孢杆菌δ-内毒素在植物中的表达则保持有效控制植物害虫的潜力。这些问题包括昆虫产生对所述植物中表达的特定Cry蛋白的抗性以及因为存在所述转基因而产生形态异常的植物。
已经证明苏云金芽孢杆菌δ-内毒素在转基因棉花、玉米和马铃薯中的表达是一种防治农业上重要的害虫的有效方法(Perlak等,1990;Koziel等,1993;Perlak等,1993)。表达苏云金芽孢杆菌δ-内毒素的转基因作物使得栽培者能够显著减少昂贵的、有毒并且有时无效的局部化学杀虫剂的应用。当编码苏云金芽孢杆菌δ-内毒素的转基因的插入对来自转化植物的所需制品的产量没有负面影响时,应用所述转基因特别有利。已经观察到,表达某些苏云金芽孢杆菌δ-内毒素(例如Cry1A或Cry3A)的作物的产量等于或优于在其它方面相似的非转基因商业植物品种。这表明某些苏云金芽孢杆菌δ-内毒素的表达对植物生长或发育没有显著的负面影响。然而,可以用来转化植物的苏云金芽孢杆菌δ-内毒素的情况并不都是如此。
应用局部苏云金芽孢杆菌源杀虫剂也可能导致产生抗所述杀虫剂的昆虫品系。至少在一种充分记载的情况下已经产生了对作为叶面喷洒剂应用的Cry1A苏云金芽孢杆菌δ-内毒素的抗性(Shelton等,1993)。预期昆虫可能同样产生对转基因植物中表达的苏云金芽孢杆菌δ-内毒素的抗性。如果这种抗性成为世界性的,则这种抗性可能明显限制了含有编码苏云金芽孢杆菌δ-内毒素的基因的玉米、棉花、马铃薯和其它种质的商业价值。既增加所述杀虫剂对目标害虫的效力、又减少杀虫剂抗性害虫的产生的一个可能的途径,可能是确保转基因作物表达高水平的苏云金芽孢杆菌δ-内毒素(McGaughey和Whalon,1993;Roush,1994)。
除产生高水平表达苏云金芽孢杆菌δ-内毒素的转基因植物外,商业上可使用的苏云金芽孢杆菌基因必须满足另外几种的标准。例如,这些基因在转基因作物中的表达必须不降低所述植物的活力、生存力或育性,它也不能影响所述植物的正常形态。这样的有害效应有两种不希望有的结果它们可能干扰转基因植物的回收和繁殖;它们也可以阻碍产生成熟植物,或赋予不可接受的农学特性。
仍需要可用于产生以足以有效防治目标植物害虫以及防止产生杀虫剂抗性害虫品系的高水平表达苏云金芽孢杆菌δ-内毒素的转基因植物的组合物和方法。导致较高水平表达苏云金芽孢杆菌δ-内毒素的方法,也提供以下优点以更高频率获得商业上可使用的转化植物系和在整个生长季节抵抗侵染的更有效的保护。
也仍需要同时不导致干扰最佳生长和所需植物组织发育的植物形态改变的、提高苏云金芽孢杆菌δ-内毒素表达水平的方法。例如,增强苏云金芽孢杆菌δ-内毒素在玉米中的表达的方法应该不产生对于栽培不能最适发育的玉米植株。例如高表达水平以及回收形态正常植物的这些目标的达到一直是难以捉摸的,而其研究一直在进行,并且是杀虫植物制品长期价值的一个重要方面。
2.0发明概述描述了在转化植物中表达缺乏显著双翅目抑制活性的Cry2A苏云金芽孢杆菌δ-内毒素的新方法。这种方法有利地既导致提高苏云金芽孢杆菌δ-内毒素表达水平,又导致形态正常植株的回收率较高。
通过达到高表达率,本发明解决了现有技术中的另一个限制问题产生昆虫抗性。具体地说,本发明提供一种优越的策略,用来延迟或消除对转基因系最常表达的苏云金芽孢杆菌蛋白的Cry1Aδ-内毒素的抗性的产生。这种所公开的方法涉及表达Cry2A类的苏云金芽孢杆菌δ-内毒素,特别是缺乏双翅目抑制活性的苏云金芽孢杆菌δ-内毒素。Cry2A类的苏云金芽孢杆菌δ-内毒素与Cry1A型δ-内毒素没有显著的同源性,并且表现出不同的结合和孔形成特性(English等,1994),因此预期防治变为抗Cry1Aδ-内毒素或不受Cry1Aδ-内毒素影响的昆虫(Hofte和Whiteley,1989)。
在优选实施方案中,本发明提供分离和纯化的DNA构成物,所述构成物包含定位至质体或叶绿体或定位至植物细胞核基因组、且有效连接于编码质体转运肽(PTP)区的Cry2Aδ-内毒素编码区。本发明的优选DNA构成物包括编码Cry2Aδ-内毒素的那些构成物,所述构成物缺乏双翅目抑制活性,尽管不需要对双翅目完全无活性。在一个说明性实施方案中,本发明的DNA构成物编码有效连接于编码质体转运肽的DNA区段(或序列)的Cry2Abδ-内毒素,这是一种使Cry2Abδ-内毒素能够定位至质体或叶绿体的方法。在某些实施方案中,所述Cry2Abδ-内毒素包含SEQ ID NO2的序列。然而,本发明人设想,可以按照本发明利用任何缺乏双翅目抑制活性的Cry2Aδ-内毒素,特别优选与Cry2Ab具有相当大同源性的那些Cry2Aδ-内毒素。
在另一实施方案中,本发明的DNA构成物利用编码PTP的核酸区段来增强所述δ-内毒素的表达。在美国专利5,500,365(该文献通过引用全部具体结合到本文中)中公开了利用一种类型的PTP-叶绿体引导肽(CTP)结合cry1A苏云金芽孢杆菌转基因来促进该转基因在转化植物中的表达。然而,在观察到表达增加的情况下,将其部分归因于在表达载体中应用新的5’非翻译前导序列。
与现有技术相反,本发明公开了一种引起产生编码定向融合蛋白的RNA序列的结构DNA序列,所述定向融合蛋白包含具有Cry2Abδ-内毒素的氨基末端质体转运肽;公开了一种3’非翻译DNA序列,它在植物细胞中起作用以引起转录终止,并将聚腺苷酸化核苷酸添加至所述RNA序列的3’端。意想不到的是,这种DNA构成物导致Cry2Aδ-内毒素的表达水平提高。定向融合蛋白对所有物种均是无活性的,但作为使成熟的杀虫活性δ-内毒素蛋白定位至叶绿体的工具而产生,产生惊人和意想不到的有益农学效应。
本发明设想的一个实施方案是将编码缺乏双翅目活性的Cry2Aδ-内毒素的基因引入叶绿体或质体基因组中。或者,可以从位于叶绿体或质体中的自主复制型附加型元件表达编码缺乏双翅目活性的Cry2Aδ-内毒素的基因。
在另一优选实施方案中,本发明提供已经用分离和纯化的DNA构成物转化的转基因植物,所述DNA构成物由该植物以高水平翻译和表达。单子叶植物和双子叶植物均可以按照该方法、用本文公开的DNA构成物转化。在再一优选实施方案中,通过本发明转化的植物可以通过包括以下步骤的方法制备获得所述分离和纯化的DNA构成物,然后用该构成物转化所述植物,以使所述植物表达该构成物编码的蛋白。本发明人已经观察到,通过所述公开的方法转化植物,导致表达所述转基因的转化体的频率增加以及从最初的转化体产生形态更为正常的植株。
设想了在所述公开的发明中观察到的表达水平提高将便于减少产生抗Btδ-内毒素的昆虫。通过用所述优选DNA构成物转化植物以达到单独的Cry2A高表达率,或通过同时将目标昆虫暴露于在感病植物中表达的Cry1A和无双翅目活性的Cry2Aδ-内毒素,可以达到这一目的。这样的昆虫包括玉蜀黍(Zea mays)中的秆野螟(Ostrina spp.)、杆草螟(Diatraea spp.)、Helicoverpa spp.和贪夜蛾(Spodoptera spp.);陆地棉(Gossypmm hirsutum)中的烟芽夜蛾(Heliothis virescens)、Helicoverpa spp.、Pectinophora spp.;和大豆(Glycine max)中的干煞夜蛾(Anticarsia spp.)、Pseudoplusia spp.、叶小卷蛾(Epinotia spp.);和稻(Oryza sativa)中的三化螟(Scirpophaga incertulas)。
因此设想了本发明公开的方法将提供优于现有技术的许多优点,包括以上具体概述的优点。这些优点包括获得改进的对敏感昆虫的防治;最大限度地减少杀虫剂抗性昆虫品系的产生;获得大量商业上可利用的抗虫性植物系;达到抵抗昆虫病原体的全期保护;和提高形态正常的转化植株的发生率。本发明的另一优点是为鉴定具有正常生长特性的转基因事件所需要产生的转基因系数目减少。
因此设想了本发明公开的方法将提供优于现有技术的许多优点,包括以上具体概述的优点。这些优点包括获得改进的对敏感昆虫的防治;最大限度地减少杀虫剂抗性昆虫品系的产生;获得大量商业上可利用的抗虫性植物系;达到抵抗昆虫病原体的全期保护;和提高形态正常的转化植株的发生率。本发明的另一优点是为鉴定具有正常生长特性的转基因事件所需要产生的转基因系数目减少。2.1核酸组合物在一个重要的实施方案中,本发明提供包含一个Cry2A编码区和一个PTP编码区的分离和纯化的核酸构成物。这些DNA构成物当转移到植物中时,经历导致δ-内毒素在所述转基因植物中表达增加的细胞过程。本发明的Cry2A内毒素最好对双翅目物种不是有效的,尽管可以耐受对双翅目的某些副作用。在某些实施方案中,所述DNA构成物编码对双翅目无活性的Cry2Abδ-内毒素,在更优选的实施方案中,所述Cry2Abδ-内毒素具有SEQ ID NO2的多肽序列,或具有与SEQ IDNO2的多肽序列大致同源的序列。这样的核苷酸同源物与SEQ IDNO2中公开的Cry2Abδ-内毒素的同源性可能高于约88%,高于约90%,高于约95%,甚至高于约99%。典型的肽包括与SEQ ID NO2中公开的Cry2Abδ-内毒素的同源性为约88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或甚至99%或更高。
在甚至更优选的实施方案中,本发明的DNA构成物包含具有SEQID NO1的核酸序列的Cry2Abδ-内毒素编码区、或与SEQ ID O1的序列大致同源的序列。也设想属于本发明范围内的是具有与SEQ IDNO1中公开的核酸序列具有大致同源性的区段的那些DNA构成物,例如同源性可以约为90%或约95%或甚至约99%的那些DNA构成物。更具体地讲,本发明中包括的同源核酸序列包括与SEQ ID NO1的核酸序列的同源性约为90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的那些核酸序列。
本文提供的DNA构成物也包括位于cry2Aδ-内毒素编码区上游和启动子下游的一个PTP编码区。这些质体转运肽编码区可以编码任何植物功能性PTP,并且可以操作以将所编码的蛋白导向该植物细胞内的某些质体,或增加所述DNA构成物编码的δ-内毒素的表达。在优选实施方案中,本发明可以包括选自zmSSU、PTP1、PTP1Δ和PTP2或任何其它植物功能性PTP的一种PTP。更优选的是,所述质体转运肽编码区编码具有SEQ ID NO4、SEQ ID NO6、SEQ ID NO8或SEQ ID NO10的氨基酸序列或与这些序列大致同源的任何多肽序列的质体转运肽。甚至更优选的是,本发明包括具有SEQ ID NO3、SEQID NO5、SEQ ID NO7或SEQ ID NO9的核酸序列或与这些序列大致同源的核酸序列的质体转运肽编码区。
此外,本发明人设想,如果本文提供的DNA构成物与其它杀虫剂组合物例如其它蛋白一起共表达,则本发明还可以达到提高对害虫的致病性并导致杀虫剂抗性昆虫的产生减少的目标。因此,本发明提供还包含植物可表达的其它Cry蛋白编码区的所公开的DNA构成物的应用。这些包括Cry1蛋白例如Cry1A、Cry1Ab、Cry1Bb或Cry1嵌合体的编码区(参见共同待审的美国申请序号08/754,490和08/922,505以及共同待审的基于美国申请序号08/721,259的PCT申请PCT/US97/17507,每个文献通过引用全部具体结合到本文中)。
在某些优选实施方案中,所述DNA构成物是可以从所述质粒切下并分离的表达盒。2.2其它核酸组合物元件本发明的多核苷酸组合物可用来转化单子叶植物,也可用来转化双子叶植物。因此,本发明的DNA构成物还可以包含其它各种调节元件,以有助于蛋白表达和进一步促进将所述DNA构成物引入所述植物。该方面的一个实例是在所述DNA构成物中包括一个位于非翻译前导序列中、相对于质体转运肽编码区处于上游的内含子。一种有用的前导序列是矮牵牛热激蛋白。在不同的替代实施方案中,所述内含子可以是以下内含子中的任一种Adh内含子1、蔗糖合酶内含子、TMVΩ元件、玉米热激蛋白(hsp)70或水稻Actl内含子。在优选实施方案中,所述内含子不是玉米热激蛋白70,就是矮牵牛热激蛋白70。
在本发明的另一优选实施方案中提供置于植物可操作启动子控制下的包含一个对双翅目基本上无活性的cry2Aδ-内毒素编码区和一个PTP编码区的多核苷酸序列。驱动细胞过程需要应用启动子,以使该基因的表达最大化。优选的启动子包括以下启动子CaMV35S、组蛋白、CaMV 19S、nos、OCS、Adh、蔗糖合酶、α-微管蛋白、肌动蛋白、cab、PEPC酶、ssRUBISCO、Actl、Famv、增强的FMV或R基因复合体相关的启动子。在更优选的实施方案中,所述启动子是增强或重复CaMV 35S启动子(Kay等,1987)。在其它优选实施方案中,所述启动子是FMV 35S启动子。植物叶绿体或质体功能性启动子也在本发明范围内。
本发明还设想了在所述DNA构成物中包括终止子区,以有助于涉及蛋白表达的细胞过程。在各种实施方案中,这种终止子可以是以下终止子中的任一种根癌土壤杆菌(Agrobacterium tumefaciens)胭脂碱合酶基因终止子、根癌土壤杆菌章鱼碱合酶基因终止子以及得自马铃薯或番茄的蛋白酶抑制剂I或II基因的3’端。在特别优选的实施方案中,所述终止子是根癌土壤杆菌胭脂碱合酶基因终止子。2.3转化载体因为本发明的DNA构成物尽管不是仅计划用于植物转化,但主要计划用于植物转化,所以在某些优选实施方案中,所述DNA构成物包含在表达载体中。这种表达载体可以含有种类繁多的调节元件和计划便于最佳表达所述表达载体编码的所需蛋白的其它元件。这些其它元件可以包括在以上2.2一节中概述的启动子、终止子和内含子。含有所述DNA构成物和任何调节元件或其它元件的载体可以选自酵母人工染色体、细菌人工染色体、质粒或粘粒。
此外,所述表达载体自身可以具有多种形式。这些形式可以因各种原因而不同,可能根据它们用来转化单子叶植物还是转化双子叶植物而包括不同的组分。例如,

图1描绘了一种可能的实施方案,其中所述单子叶植物表达载体含有在命名为(SEQ ID NO16)的质粒中的cry2Ab基因。还设想了,含有包括在这些质粒载体中的表达盒以及含有大致同源物的表达盒的其它表达载体也是有用的转化构成物。因此,含有得自SEQ ID NO16的核酸1781-5869的核酸序列的任何转化载体。
图2描绘了一种可能的双子叶植物表达载体。它含有包括在命名为pMON33827(SEQ ID NO13)、pMON33828(SEQ ID NO14)和pMON33829(SEQ ID NO15)的质粒中的cry2Ab基因。正如说明性单子叶植物转化载体一样,本发明还设想了含有包括在这些质粒载体中的表达盒、或与那些表达盒的大致同源物的其它表达载体,将可用作双子叶植物转化构成物。优选的双子叶植物表达盒包括体现为SEQ IDNO13的核酸17-3182、SEQ ID NO14的核酸17-3092和SEQ IDNO15的核酸17-3155的那些表达盒。含有这种表达盒的载体的说明性实施方案公开于本文命名为SEQ ID NO13、SEQ ID NO14和SEQID NO15的序列中。
进一步设想在本发明范围内的载体包括能够既含有公开于以上2.1一节中的对双翅目无活性的cry2A核酸组合物又含有包含植物可表达的其它Cry蛋白(例如Cry1蛋白)编码区的任何其它DNA构成物的那些载体。能够含有这两种构成物的载体还可以在所述DNA构成物之间包含一个内部核糖体进入位点;它们也可以含有多种不同的顺反子,使得它们为多顺反子。2.4转化的宿主细胞本发明的另一优选实施方案包括用本文公开于2.1和2.2小节的DNA构成物以及利用公开于2.3一节的转化载体转化的细胞。本发明中设想的转化细胞包括表达由本发明新DNA构成物编码的蛋白的原核细胞和真核细胞。产生转基因细胞的方法是本领域众所周知的。一般而言,该方法包括用含有有效连接于编码苏云金芽孢杆菌δ-内毒素的编码区的启动子的DNA区段转化合适的宿主细胞。这样的编码区一般有效连接于转录终止区,由此所述启动子能够驱动所述编码区在该细胞中的转录,并因此提供所述细胞在体内产生所述δ-内毒素的能力。或者,在希望控制、调节或减少在特定转基因细胞中表达的一种或多种特定δ-内毒素的量的情况下,本发明也提供δ-内毒素反义mRNA、内含子反义mRNA、PTP反义mRNA或UTR反义mRNA的表达。将反义mRNA用作控制或减少细胞中给定目的蛋白的量的手段是本领域众所周知的。
在一个优选实施方案中,本发明包括已经用本发明的核酸区段或DNA构成物转化并且表达编码一种或多种本文公开的对双翅目无活性的Cry2A苏云金芽孢杆菌δ-内毒素的基因或基因区段的植物细胞。本文使用的术语“转基因植物细胞”是指已经掺入DNA序列的植物细胞,所述DNA序列包括但不限于也许不通常不存在的基因、通常不转录为RNA或翻译为蛋白(“表达”)的DNA序列、或人们需要引入非转化植物中的任何其它基因或DNA序列,例如可能通常存在于非转化植物中、但人们希望或者对其进行遗传工程或者将其表达改变的基因。
设想了在某些情况下,本发明的转基因植物的基因组将通过稳定引入以上2.1和2.2小节中公开的对双翅目无活性的Cry2A苏云金芽孢杆菌δ-内毒素的编码DNA构成物而增加。在某些情况下,将一个以上的转基因加入所述转化宿主植物细胞的核基因组中,或加入叶绿体或质体基因组中。当将一种以上晶体蛋白编码DNA区段加入这种植物的基因组中时,情况是这样的。在某些情况下,可能希望在转化转基因植物中加入一种、两种、三种、四种或甚至更多种苏云金芽孢杆菌晶体蛋白编码多核苷酸(或者天然的或者重组工程化的)并且在其中稳定表达。
在优选实施方案中,将所述转基因引入所述植物细胞的基因组中导致稳定整合,其中这种植物的后代在其基因组中也含有一个拷贝的该转基因。最初引入所述基因的植物的后代的这种遗传元件的遗传性是本发明的一个优选方面。可以引入的优选基因包括例如苏云金芽孢杆菌δ-内毒素,特别是一个或多个本文描述的δ-内毒素。
转化植物细胞和制备转基因细胞系的方法是本领域众所周知的(如美国专利5,550,318、5,508,468、5,482,852、5,384,253、5,276,269和5,225,341中例举的,所述专利通过引用全部具体结合到本文中),并且在本文中简短地进行了讨论。当然,用于转化这种细胞的载体、质粒、粘粒、YAC(酵母人工染色体)和DNA区段一般包含本发明的或者操纵子、基因或者得自基因的序列,它们或者是天然的,或者是合成衍生的,特别是编码所公开的晶体蛋白的那些操纵子、基因或者序列。这些DNA构成物根据需要可以还包括一些结构,例如启动子、增强子、多接头或者甚至对特定目的基因有正调节活性或负调节活性的基因序列。所述DNA区段或基因可以编码或者天然或者修饰的晶体蛋白,所述晶体蛋白将在所产生的重组细胞中表达和/或将赋予所述再生植物改进的表型。
在本发明中具体设想的转基因细胞包括转基因植物细胞。特别优选的植物细胞包括得自玉米、小麦、大豆、草坪草、观赏植物、果树、灌木、蔬菜、谷类、豆科植物等或希望引入对双翅目无活性的苏云金芽孢杆菌δ-内毒素转基因的任何植物的那些细胞。2.5转化植物另一方面,用本发明的任何DNA构成物转化的、表达所述构成物编码的蛋白的植物设想为本发明的一部分。因此,本发明还提供已经用在2.1和2.2小节中公开的DNA构成物转化、以及利用2.3一节中公开的转化载体转化的转基因植物。农学、园艺、观赏和其它经济或商业上有用的植物可以按照本文描述的方法制备,以足以赋予对昆虫病原体的抗性而同时保持形态正常的高水平表达苏云金芽孢杆菌δ-内毒素。
这种植物可以与以下物质一起共表达所述δ-内毒素多肽其它抗真菌、抗细菌或抗病毒致病相关肽、多肽或蛋白;杀虫蛋白;赋予除草剂抗性的蛋白;和参与改进植物产品品质或数量、或植物农艺性能的蛋白。在植物中同时共表达多种蛋白的优点是,它利用一种以上的作用方式来防治植物病原体损害。这可以最大限度地减小产生抗性病原体品系的可能性,扩大抗性范围和潜在地产生协同杀虫效应,因此增强植物抗昆虫侵染的能力(国际专利申请公布号WO 92/17591,1992年10月15日,其通过引用全文具体结合到本文中)。
本发明的转化植物可以是单子叶植物或者是双子叶植物。当所述植物是单子叶植物时,它可以是各种各样物种中的任一种。本发明包括的优选单子叶植物物种可以包括玉米、水稻、小麦、大麦、燕麦、黑麦、小米、高粱、甘蔗、石刁柏、草坪草或多种其它谷类植物中的任一种。在优选实施方案中,所述单子叶植物是玉米植株。
本发明也设想了各种各样的双子叶植物,例如棉花、大豆、番茄、马铃薯、柑桔、烟草、甜菜、苜蓿、蚕豆、豌豆、菜豆、苹果、樱桃、梨、草莓、悬钩子或任何其它豆科植物、块茎或果树。在优选实施方案中,所述双子叶植物是大豆植株、烟草植株或棉花植株。
按照所公开的发明转化的植物中的许多种植物是经济作物。商品形式的这些植物可以是原始植株或是已经遗传了所需转基因的其后代。因此,还设想在本发明范围内的植物包括在本申请中记录的DNA构成物的任何变更物转化的植物的任何后代。具体地说,所述后代可以定义为R0转基因植物。所述转化植物的其它后代也包括在本发明范围内,包括所转化植物任何后代的任何后代植物,其中所述后代植物已经从任何R0植物遗传了所述DNA构成物。
用特定DNA构成物转化时,所述构成物的核酸或多核苷酸区段可以以不同的部分掺入转化体的染色体中。因此,在另一实施方案中,本发明包括应用本文公开的DNA构成物制备的任何转基因植物或植物细胞。本发明包括的这种植物或细胞包括通过有以下步骤的方法制备的植物或细胞(1)获得一种DNA构成物,所述DNA构成物包含一个对双翅目无活性的Cry2A苏云金芽孢杆菌δ-内毒素编码区,该编码区符合读框定位并在该植物中有效的启动子控制下;和一个质体转运肽编码区,该编码区位于所述Cry2A苏云金芽孢杆菌δ-内毒素编码区上游和所述启动子下游;和(2)用所获得的DNA构成物转化所述植物,以使所述植物表达所述Cry2A苏云金芽孢杆菌δ-内毒素。也可以转化所述植物,以使进一步掺入到植物基因组中并表达其它Cryδ-内毒素。
在一个相关方面,本发明也包括由所述转化植物产生的种子、得自这种种子的后代和由按照上述方法产生的原始转基因植物的后代产生的种子。这种后代和种子均具有稳定加入其基因组中的对双翅目无活性的苏云金芽孢杆菌δ-内毒素转基因,并且这种后代植物将通过以孟德尔方式遗传引入稳定转基因而获得的性状。所有这种其基因组中掺入编码任何本文公开的DNA构成物,特别是在2.1和2.2小节公开的DNA构成物的转基因DNA区段的转基因植物,是本发明的多个方面。
也产生了重组植物、细胞、种子和其它组织,其中仅改变了线粒体或叶绿体DNA以掺入在本申请中设想的分子。本领域已知在叶绿体中起作用的启动子(Hanley-Bowden等,Trends in Biochemical Sciences1267-70,1987)。Daniell等的美国专利第5,693,507号(1997)已经描述了获得含已经插入异源DNA的叶绿体的细胞的方法和组合物。2.6植物转化方法2.6.1在植物中表达Cry2Aδ-内毒素的方法在另一优选实施方案中,本发明提供了在转基因植物中高水平表达对双翅目无活性的Cry2A苏云金芽孢杆菌δ-内毒素的方法。所公开的方法可以利用以上2.1和2.2小节中公开的任何DNA构成物以及例如在以上2.3小节中公开的任何转化载体。所述设想的方法使得用于防治几种害虫的Cry1A苏云金芽孢杆菌δ-内毒素的替代物Cry2Aδ-内毒素可以在植物中表达,而不会负面影响回收农学数量的转基因植物。本文描述的发明也使得能够以高于用目前方法获得的水平至多25倍的水平表达Cry2Aδ-内毒素。
本文所述方法因此使得表达Cry2A的植物能够用作表达Cry1A型苏云金芽孢杆菌δ-内毒素的植物的或者替代或者补充,来防治重要的害虫并且进行重要害虫的抗性管理,所述重要的害虫包括玉蜀黍中的秆野螟、杆草螟、Helicoverpa spp.和贪夜蛾;陆地棉中的烟芽夜蛾、Helicoverpa spp.、Pectinophora spp.;和大豆中的干煞夜蛾、Psedoplusia spp.、叶小卷蛾。也设想了所述方法可以用来显著增强包括Cry2A和与Cry2A相关的苏云金芽孢杆菌δ-内毒素的表达,因此增强其对目标害虫的效力,并减低产生对这些蛋白抗性的可能性。在本发明的一个实施方案中,表达Cry2Abδ-内毒素。该蛋白的目标害虫及其通常的寄主示于以下表1中。
表1Cry2Ab的目标害虫和那些害虫的通常植物寄主害虫 寄主参考文献玉米螟 玉蜀黍Donovan(Ostrina nubialis)巨座玉米螟 陆地棉美国专利5,338,544(Diatraea grandiosella)Helicoverpazea 大豆烟芽夜蛾棉红铃虫(Pectinophora gossypiella)黎豆夜蛾(Pseudoplusia includens)Epinotia aporema本文公开的在植物中表达Cry2A苏云金芽孢杆菌δ-内毒素的方法包括以下步骤(1)获得包含一个启动子的核酸区段,所述启动子有效连接于编码质体转运肽的第一多核苷酸序列和编码缺乏双翅目活性的Cry2A苏云金芽孢杆菌δ-内毒素的第二核苷酸序列,以产生包含氨基末端质体转运肽和缺乏双翅目活性的Cry2A苏云金芽孢杆菌δ-内毒素的融合蛋白;和(2)用步骤1的DNA构成物转化所述植物,以使所述植物表达所述蛋白融合体。在一个优选实施方案中,构建该方法步骤(1)中使用的核酸区段,以使所述第二多核苷酸序列的5’端在同一翻译读框中有效连接于所述第一多核苷酸序列的3’端。
通过本文公开的方法转化的植物或植物细胞可以或者是单子叶植物或者是双子叶植物。当所述植物是单子叶植物时,它可以是多种物种的任一种。本发明包括的优选单子叶植物物种可以包括玉米、水稻、小麦、大麦、燕麦、黑麦、小米、高粱、甘蔗、石刁柏、草坪草或多种其它谷类植物中的任一种。在优选实施方案中,所述单子叶植物是玉米植株。
本发明也设想了转化各种各样的双子叶植物或植物细胞的方法。所述双子叶植物可以包括例如棉花、大豆、番茄、马铃薯、柑桔、烟草、甜菜、苜蓿、蚕豆、豌豆、菜豆、苹果、樱桃、梨、草莓、悬钩子或任何其它豆科植物、块茎或果树的植物。在优选实施方案中,所述双子叶植物是大豆植株、烟草植株或棉花植株或细胞。2.6.2在后代植物中表达Cry2Abδ-内毒素的方法如在本发明公开的其它实施方案所述,计划按照所公开发明进行转化的植物中的许多植物是商品作物。商品形式的这些植物可以是原始植物或是已经遗传有所需转基因的其后代。因此,本发明人还设想了,本文公开的方法包括产生转基因后代植物或后代植物细胞的方法。产生这样的后代的方法包括本文所公开的在植物中表达Cry2A苏云金芽孢杆菌δ-内毒素的方法包括以下步骤(1)获得核酸区段,所述核酸区段包含有效连接于第一多核苷酸序列和第二多核苷酸序列的启动子,所述第一多核苷酸序列编码质体转运肽,而所述第二多核苷酸序列编码缺乏双翅目活性的Cry2A苏云金芽孢杆菌δ-内毒素,以产生由氨基末端质体转运肽和缺乏双翅目活性的Cry2A苏云金芽孢杆菌δ-内毒素组成的融合蛋白;(2)获得第二植物;和(3)使所述第一植物和所述第二植物杂交,获得已经遗传了来自所述第一植物的核酸区段的杂交转基因后代植物或植物细胞。本发明特别包括所述单子叶植物或双子叶植物中任一种的后代、后代植物或种子,所述单子叶植物和双子叶植物包括以上2.5和2.6.1小节中所提及的。2.6.3 Cry2Ab和其它Cry苏云金芽孢杆菌δ-内毒素在植物和后代植物中共表达在另一优选实施方案中,本文公开的表达对双翅目无活性的Cry2A苏云金芽孢杆菌δ-内毒素的方法包括与Cry1苏云金芽孢杆菌δ-内毒素一起共表达在任何其各种实施方案中所公开的DNA构成物。预期一起表达这些Cry苏云金芽孢杆菌δ-内毒素的方法将通过提高表达和减少昆虫抗性产生而达到在所述转化植物中增加杀虫特性-所有这些均是在现有技术中没有的所需结果。这种共表达可以在原始转化体中,或在已经遗传了所述基因以共表达本文公开的任一DNA构成物编码的蛋白的原始转化体后代的任何数目的世代中。
3.0附图简述以下附图构成本说明书的部分,并包括以进一步证明本发明的某些方面。通过参考一个或多个这些附图并结合本文叙述的具体实施方案的详细描述,可以更好地理解本发明。
图1.单子叶植物cry2Ab表达载体pMON30464、pMON30463和pMON26800的元件的图示说明。
图2.双子叶植物cry2Ab表达载体pMON33830、pMON33827、pMON33828和pMON33829的元件的图示说明。
图3.双子叶植物cry2Aa表达载体pMON33803、pMON33812、pMON33811和pMON33806的元件的图示说明。
图4.命名为pMON30464的质粒。
图5.命名为pMON33827的质粒。
图6.命名为pMON33828的质粒。
图7.命名为pMON33829的质粒。
4.0说明性实施方案的描述提供以下本发明的详细描述,以有助于本领域技术人员实施本发明。虽然如此,以下详细描述不应该被解释为不当地限制本发明,因为在不偏离本发明的精神和范围的情况下,本领域技术人员可以在本文所述的实施方案中进行各种修改和变化。4.1序列的鉴别SEQ ID NO1.cry2Ab基因的核酸序列。
SEQ ID NO2.cryAb苏云金芽孢杆菌δ-内毒素的氨基酸序列。
SEQ ID NO3.zmSSU质体转运肽的核酸序列。
SEQ ID NO4.zmSSU质体转运肽的氨基酸序列。
SEQ ID NO5.质体转运肽1(PTP1)的核酸序列。
SEQ ID NO6.PTP1的氨基酸序列。
SEQ ID NO7.质体转运肽1Δ(PTP1Δ)的核酸序列。
SEQ ID NO8.PTP1Δ的氨基酸序列。
SEQ ID NO9.质体转运肽2(PTP2)的核酸序列。
SEQ ID NO10.PTP2的氨基酸序列。
SEQ ID NO11.cry2Aa基因的核酸序列。
SEQ ID NO12.cry2Aa多肽的氨基酸序列。
SEQ ID NO13.pMON33827。
SEQ ID NO14.pMON33828。
SEQ ID NO15.pMON33829。
SEQ ID NO16.pMON30464。
SEQ ID NO17.苏云金芽孢杆菌cry2Ab基因序列,UWGCG登录号M23724(Widner和Whiteley)。
SEQ ID NO18.由SEQ ID NO17翻译的苏云金芽孢杆菌cry2Ab氨基酸序列。4.2定义本文中以下词语和短语具有下文陈述的含义。
生物功能性等同物在本发明杀虫蛋白方面本文使用的这种等同物是这样的肽、多肽和蛋白,它们所含的序列或部分表现出与本发明的新肽(例如Cry2Ab)有序列相似性,并且表现出与本文公开的多肽相同或相似的功能特性,包括杀虫活性。生物等同物也包括与针对Cry2Ab产生的抗体反应即与其特异性结合、并表现出相同或相似杀虫活性的肽、多肽和蛋白,所述抗体包括单克隆抗体和多克隆抗体。
如本文所用的叶绿体或质体定位的是指或者为多核苷酸或者为多肽的生物分子,它们定位于叶绿体或质体中,以使所述分子与细胞质环境分离,并在叶绿体或质体胞质中起作用以提供本发明中宣布的效应。生物分子定位至叶绿体或质体,在多核苷酸方面,可以通过人工机械方法,例如电穿孔、机械微注射或通过多核苷酸包被的微粒轰击而发生,在多肽方面,可以通过分泌或输入方法而发生,其中使用用来将所连接的多肽导向、插入、辅助或定位到叶绿体或质体中的天然、合成或异源质体或叶绿体引导肽序列。
在农业方面的对抗或防治虫害是指减少害虫侵染引起的对作物的损害。更概括地讲,该短语是指由于在任何特定位置存在不希望有的昆虫所引起的副作用的减小。
事件是指由于外源DNA插入核基因组DNA中一个或多个特有位点而得到的转基因植物。
表达编码DNA分子例如结构基因所经历的产生多肽的胞内过程的组合,所述胞内过程包括转录、翻译和其它胞内蛋白和RNA加工和稳定功能。
杀虫多肽是指具有杀虫特性的多肽,例如抑制目标害虫生长、发育、生存力或生殖力的多肽。
有效连接的符合读框连接以使一种区段的特性影响另一种区段表达的核酸编码区段。
植物可表达的编码区由于含有促进目的基因表达的典型的植物调节元件而可在植物中表达的编码区。
质体转运肽可用于将所连接的氨基酸(例如蛋白融合体)导向亚细胞区室或亚细胞器(例如质体)的任何氨基酸序列。
后代“后代”包括所述转基因植物的任何后代,或在其谱系中具有所述转化体的任何后来的植物。后代不限于一个世代,而是包括所述转化体的后代,只要它们含有或表达所述转基因。含有转基因胚的种子以及得自所述转基因植物种子和它们的后代,也是本发明的重要部分。
启动子DNA序列或一组DNA序列上的识别位点,它为结构基因提供表达控制元件,并且RNA聚合酶与其特异性结合并起动该基因的RNA合成(转录)。
R0是得自培养的植物组织或细胞转化的原代再生植株。得自所述R0的后来的后代或世代称为R1(第一代)、R2(第二代)等。
再生由植物细胞(例如植物原生质体或外植体)培育植株的过程。
稳定保持在植物质体或叶绿体中是指通过电穿孔、转化、转导或微团或脂质体样融合将多核苷酸或核酸引入叶绿体或质体中,其引入方式使得所述核酸或者通过重组掺入到叶绿体或质体基因组中,或者作为驻留在叶绿体或质体中的自主复制型共价闭环复制子,通过含有这种转化叶绿体或质体的任何植物、植物细胞或植物组织的生长,同时在需要在所述复制子上存在的并从所述复制子表达的一个或多个基因的化学物质或化合物存在,以确保所述植物、植物细胞或植物组织中的所述转化质体或叶绿体及其后代质体或叶绿体存活的情况下,使所述核酸保留在受体叶绿体或质体中以及保留在所述受体叶绿体或质体的所有后来的后代中。
结构编码序列是指编码肽、多肽或蛋白的DNA序列,所述肽、多肽或蛋白的DNA序列是由细胞在从所述结构编码序列转录出信使RNA(mRNA)、然后由mRNA翻译出所需肽、多肽或蛋白产物后而制备的。
结构基因被表达而产生多肽的基因。
大致同源性当本文使用该术语时,是指其同源性约为86%至约90%、至约95%、至约99%的核酸序列或多肽序列。更具体地讲,本发明人设想了与多肽的参比核酸序列的同源性约为86、87、88、89、90、91、92、93、94、95、96、97、98和99百分比的大致同源性。
大致时序或空间调节是指植物或植物组织内的基因从植物有效启动子的表达。关于时序调节,启动子可以受到调节以仅在植物细胞或组织或甚至整株植物的生长和发育期间的特定时间内表达。仅在种子萌发期间活性表达一个或多个基因的启动子是时序调节的一个实例。其它实例可以包括仅在所述植物、植物细胞或植物组织暴露于一定光强时或在完全黑暗时活性表达一个或多个基因的启动子。大致时序调节涉及这样的启动子所述启动子在一定时间活性表达,但在其它时间可能完全或不完全受抑制,因此通过监测某些指示物(例如从连接于这种启动子的编码序列产生的酶)的存在,或根据在整个植物生长、分化和发育的不同时间和/或对不同环境刺激应答而产生的某些基因产物例如mRNA的增加或减少进行测量,仍可以检测出表达。大致空间调节是指与仅在植物内某些细胞或组织的生长和发育期间进行表达的启动子连接的基因的表达。例如,预期绒毡层启动子仅在花生长和发育期间表达。同样,预期根特异性或根增强启动子仅在根细胞或根组织内表达。大致空间调节也涉及得自特定组织特异性启动子的在该特定组织中的表达水平,也与在其它组织中得自该启动子或相似启动子的表达水平相关,其中表达也可以在优选启动子表达的该特定组织以外的组织中检测到,但根据由连接于该启动子的编码序列产生的酶的产生或根据某些可检测的基因产物的出现进行测量,其表达水平明显较低。启动子也可以既受大致时序调节,又受大致空间调节,以及以协同调节方式同时受调节。
合成基因编码本发明的苏云金芽孢杆菌δ-内毒素的合成基因是其制备方式涉及任何种类基因分离或操作的那些合成基因。这包括从天然存在的状态分离所述基因,如通过密码子修饰(如本文所述)进行基因操作或定点诱变(如本文所述)、将所述基因截短或任何其它的操作或分离方法。
终止子3’端转录终止和聚腺苷酸化序列。
转化将外源DNA序列(例如载体或重组DNA分子)引入细胞或原生质体中的方法,其中所述外源DNA掺入染色体中,或能够自主复制。
转化的细胞通过引入一种或多种外源DNA分子而改变的细胞。
转基因包含希望在受体细胞、组织或生物中表达的基因的基因构成物或DNA区段。这可以包括完整的质粒或其它载体,或可以仅仅包括所述转移的DNA构成物的功能性编码区、区域、结构域或区段。
转基因细胞得自或再生自转化细胞或得自转基因细胞的任何细胞。典型的转基因细胞包括得自转化植物细胞和得自转基因植物的特定细胞例如叶片、根、茎例如体细胞或生殖细胞的植物愈伤组织。
转基因事件通过将外源DNA插入植物细胞或原生质体的核基因组而得到的植物或其后代。
转基因植物已经被遗传修饰以含有外源DNA序列并将其表达为蛋白的植物或其后代。如本文具体例举的,遗传修饰转基因大豆植株,使其含有并表达有效连接于在植物细胞或组织中或在整株植株中起作用的转录控制序列并在其调控之下的至少一种异源DNA序列。转基因植物也可以称为转化植物。转基因植物也是指原始转基因植物的后代,其中那些后代含有并能够表达在本文所述植物可表达转录控制序列的调节控制下的所述异源编码序列。
载体能够在宿主细胞中复制和/或可以有效连接另一DNA区段以导致所连接的区段复制的DNA分子。质粒是一种典型的载体。4.3编码苏云金芽孢杆菌δ-内毒素和质体引导序列的核酸区段的合成和分离本发明公开了包含编码苏云金芽孢杆菌δ-内毒素以及质体引导序列的多核苷酸序列的新DNA构成物。构建合成的苏云金芽孢杆菌基因并将其在植物中表达的方法是本领域技术人员众所周知的,并且详细描述于美国专利5,500,365中。本发明设想了应用Cry2A苏云金芽孢杆菌基因转化单子叶植物和双子叶植物。为了增强这些基因的表达,本发明提供了DNA构成物,所述DNA构成物包含位于编码所需苏云金芽孢杆菌δ-内毒素的多核苷酸序列上游的编码质体引导肽的多核苷酸区段。特别是,设想了编码基本缺乏双翅目物种抑制活性的苏云金芽孢杆菌δ-内毒素的序列。4.4探针和引物一方面,本发明提供的核苷酸序列信息可供用来制备有能力与本文公开的选定多核苷酸的基因序列特异性杂交的相对短的DNA序列。在这些方面,基于编码Cry2Aδ-内毒素多肽的选定多核苷酸序列(例如示于SEQ ID NO1的序列)的考虑,制备合适长度的核酸探针。也可以基于编码质体引导肽的选定多核苷酸序列(例如示于SEQ IDNO3、SEQ ID NO5、SEQ ID NO7和SEQ ID NO9的那些序列)的考虑,制备这些核酸探针。这种核酸探针与编码δ-内毒素多肽或质体引导肽序列的基因序列特异性杂交的能力,为它们提供了在多种实施方案中的特定用途。最为重要的是,所述探针可以用于多种测定中,以检测特定样品中互补序列的存在。
在某些实施方案中,最好使用寡核苷酸引物。采用本发明的多核苷酸设计这种引物的序列,以用来采用PCRTM技术对得自苏云金芽孢杆菌的晶体蛋白基因的限定区段进行检测、扩增或突变。该方法也可以用来对编码质体引导肽的多核苷酸的限定区段进行检测、扩增或突变。与本发明编码所述δ-内毒素多肽和质体引导肽的多核苷酸相关的基因区段也可以采用这种引物经PCRTM来扩增。
为了提供按照本发明的某些优点,用于杂交研究或测定的优选核酸序列包括与编码晶体蛋白的多核苷酸序列(例如示于SEQ ID NO1的序列)的至少长14-30个核苷酸等的一段序列互补的序列;与编码质体引导肽的序列(例如示于SEQ ID NO3、SEQ ID NO5、SEQ IDNO7和SEQ ID NO9的序列)的至少长14-30个核苷酸等的一段序列互补的序列。
长度至少为14个核苷酸的大小有助于确保所述片段具有足够长度,以形成稳定且选择性的双链分子。一般优选具有在长14个碱基以上的区段内互补序列的分子。为了提高所述杂交体的稳定性和选择性,并因此提高所获得的特定杂交分子的质量和程度,人们一般优选设计具有14-20个核苷酸或必要时更长的基因互补序列的核酸分子。通过例如化学方法直接合成所述片段,通过应用核酸复制技术例如美国专利4,683,195和4,683,202(每个专利具体通过引用结合到本文中)的PCRTM技术,或通过从含有合适插入片段和合适限制位点的重组质粒切下选定的DNA片段,可以容易地制备这样的片段。4.5表达载体本发明也设想了包含本发明多核苷酸的表达载体。因此,在一个实施方案中,表达载体是包含有效连接于编码本发明多肽的编码区的启动子的分离和纯化的DNA分子,所述编码区有效连接于转录终止区,因此所述启动子驱动所述编码区的转录。所述编码区可以包括编码苏云金芽孢杆菌δ-内毒素的区段和编码质体引导肽的区段。包含所述DNA分子的表达载体也可以含有一个功能内含子。
本文所用的术语“操作性连接的”或“有效连接的”是指启动子与编码区连接的方式,使得该编码区的转录受该启动子的控制和调节。将启动子操作性连接于编码区以调节上游和下游的方法是本领域熟知的。
优选的植物转化载体包括衍生自根癌土壤杆菌Ti质粒的载体以及Herrera-Estrella(1983)、Bevan(1983)、Klee(1985)和欧洲专利申请号EP 0120516(每个文献具体通过引用结合到本文中)公开的那些载体。
在细菌中起作用的启动子是本领域熟知的。用于苏云金芽孢杆菌晶体蛋白的典型和优选的启动子包括sigA、sigE和sigK基因的启动子。或者,可以使用天然的、诱变的、异源的或重组的晶体蛋白编码基因启动子本身。
当用本发明的表达载体转化植物时,选择能够在该特定植物种中驱动表达的启动子。在不同植物种中有功能的启动子也是本领域熟知的。可用于在植物中表达多肽的启动子是如描述的诱导型、病毒的、合成的或组成型的那些启动子(Odell等,1985)和/或时序调节、空间调节和时空调节的那些启动子。优选的启动子包括增强的CaMV35S启动子和FMV35S启动子。4.5.1具有质体引导肽编码区段的载体按照本发明,设计以特异性地增强所述多肽在转化植物中的表达的表达载体可以包括编码质体引导肽(PTP)的某些区域。这些区域当与某些苏云金芽孢杆菌δ-内毒素结合时便于涉及所编码蛋白的转录、翻译和表达的细胞过程完全被利用。这种质体引导肽以多种方式起作用,例如通过将所表达的蛋白转运至其最为有效操作的细胞结构,或通过将所表达的蛋白转运至表达所必需的细胞过程集中的细胞区域。
PTP的应用也可以提高形态正常植株的回收率和可以回收的转基因植物的频率。已知通过表达保持定位于细胞溶胶中的蛋白形式(即非定向形式),已经达到Cry1A和Cry3A型苏云金芽孢杆菌δ-内毒素的商业上可利用的表达,因此最初在转基因棉花、烟草和玉米中也尝试了非定向形式的Cry2Aa和Cry2Ab两者的表达。
在玉米中,非定向Cry2Ab表达转化载体产生相对少的Cry2Ab的表达水平足以用于商业上可接受的虫害防治的转基因事件(即独立的插入玉米基因组的事件)。此外,表达非定向Cry2Ab的许多玉米转化体表现出使得所述植物为商业上不可接受的明显的生长缺陷,例如株型严重减小(矮化)或叶片严重黄化(缺绿症)。非定向Cry2Ab在玉米中的表达水平不高于约15ppm,这是Cry2Ab介导的欧洲玉米螟(ECB)防治所需的最低水平。
虽然已经描述了涉及质体定向Cry1A型苏云金芽孢杆菌δ-内毒素在转基因植物中表达的研究(Wong等,1992),但先前尚未描述过非同源Cry2A或Cry2A蛋白的定向。一篇质体定向Cry1Ac表达的报道指出,这种定向导致Cry1Ac表达很少增加或不增加(美国专利第5,500,365号)。另一篇报道指出,质体定向形式的Cry1Ac表达的增加需要包括一段新的5’非翻译前导序列(Wong等,1992),并且该前导序列和引导序列对表达的影响非常依赖于所述结构基因的编码序列。Wong等推断,包括前导序列和质体转运肽这两种将Cry1Ac的表达提高18倍,但所述相同的序列仅将β-葡糖醛酸糖苷酶的表达提高6倍。最后,先前的报道中没有一篇预测质体定向会导致形态正常的苏云金芽孢杆菌表达植株的回收增加。
本发明公开了当使用质体定向形式的Cry2A时,以显著更高的频率回收以至多比ECB防治所需水平高10倍的水平表达对双翅目无活性的Cry2Aδ-内毒素(例如Cry2Ab)的转基因玉米植株。在Cry2Ab的情况下,在获得防治ECB的转基因玉米方面,提高的表达是关键性的,因为Cry2Ab抗ECB的LC50显著高于目前用来在转基因玉米中防治ECB的Cry1Ab苏云金芽孢杆菌的LC50ECB(美国专利5,338,544,1994;MacIntosh等,1990;Armstrong等,1995)。
增加的表达也尤其有价值,因为它通过高剂量策略提供阻止抗性产生的额外保护(McGaughey和Whalon,1993;Roush,1994)。高水平表达甚至是更加希望的,因为它在杀虫基因表达由于环境条件而减低的情况下提供持久的昆虫防护。另外并且意想不到的是,用质体定向Cry2Ab表达载体转化的玉米植株表现出正常生长和发育。
在Cry2Ab的定向和非定向(细胞溶胶)表达之间的显著不同是Cry2Ab蛋白在用质体定向Cry2Ab表达载体转化的植物中的水平相对于用细胞溶胶Cry2Ab载体转化的植物显著增加。这一结果是非常意想不到的。此外,与先前研究的内容相反,本文公开的发明揭示出,采用所公开的质体定向表达的方法,可以达到表型正常的转基因植株的回收增加。
质体引导肽(PTP)的一个实例是叶绿体引导肽。已经发现叶绿体引导肽在草甘膦抗性选择标记系统中特别有用。在该系统中,经转化表达赋予草甘膦抗性的蛋白的植物用将所述肽导向细胞的叶绿体的PTP转化。草甘膦抑制莽草酸途径,莽草酸途径导致包括氨基酸和维生素在内的芳族化合物的生物合成。具体地说,草甘膦通过抑制5-烯酰丙酮酰-3-磷酸莽草酸合酶(EPSP合酶或EPSPS),抑制磷酸烯醇丙酮酸和3-磷酸莽草酸转化为5-烯酰丙酮酰-3-磷酸莽草酸。通过插入编码该酶的转基因提供的补充的EPSPS,使得所述细胞可以抗草甘膦的效应。因此,由于除草剂草甘膦的作用是通过特别是在所述细胞的叶绿体中中断芳族氨基酸的生物合成而杀伤所述细胞,因此PTP通过将所述细胞表达的草甘膦抗性酶集中于叶绿体中,即集中于所述细胞的靶细胞器中,提供对该除草剂的增强抗性。典型的除草剂抗性酶包括上述的ESPS、草甘膦氧化还原酶(GOX)和aroA基因(参见美国专利第4,535,060号,其具体通过引用全部结合到本文中)。
PTP可以将蛋白导向叶绿体和其它质体。例如,所述靶细胞器可以是造粉体。本发明优选的PTP包括导向叶绿体以及其它质体的那些PTP。优选PTP的具体实例包括玉米RUBISCO SSU蛋白PTP和功能相关的肽,例如PTP1、PTPΔ和PTP2。这些PTP的实例为示于SEQID NO4、SEQ ID NO6、SEQ ID NO8和SEQ ID NO10中的多肽。编码这些PTP多肽的多核苷酸序列示于SEQ ID NO3、SEQ IDNO5、SEQ ID NO7和SEQ ID NO9中。
也可以产生其中线粒体或叶绿体DNA已经被改变以掺入本申请中设想的分子的重组植物、细胞、种子和其它植物组织。在叶绿体中起作用的启动子是本领域已知的(Hanley-Bowden等,Trends inBiochemical Sciences 1267-70,1987)。获得含插入异源DNA的叶绿体的细胞的方法和组合物已经由Daniell等的美国专利第5,693,507号(1997)描述。McBride等(WO 95/24492)公开了编码Cry1Aδ-内毒素蛋白的基因在烟草植株叶绿体基因组中的定位和表达。如本文公开的,Cry2Aa定位至叶绿体或质体,根据Cry2Aaδ-内毒素的积累测定,导致表达水平降低,这与定位叶绿体或质体的Cry2Abδ-内毒素的表达提高相反。4.5.2启动子在表达载体中的应用以双链DNA形式存在的基因的表达,涉及由RNA聚合酶从所述DNA的编码链转录出信使RNA(mRNA),随后在细胞核内加工mRNA初级转录物。从DNA转录出mRNA受通常称为“启动子”的DNA区的调节。启动子区含有一段碱基序列,该序列对RNA聚合酶发送信号以使其与所述DNA结合,并采用所述DNA链中的一条作为模板启动mRNA的转录,产生相应的RNA链。选定的特定启动子应该能够引起该酶编码序列的足够表达,以导致产生有效杀虫量的所述苏云金芽孢杆菌蛋白。
本发明的嵌合植物基因的3’非翻译区也含有一个聚腺苷酸化信号,该信号在植物中起作用,以使得腺苷酸核苷酸添加至所述RNA的3’端。优选的3’区的实例是(1)含有土壤杆菌肿瘤诱导(Ti)质粒基因例如胭脂碱合酶(NOS)基因的聚腺苷酸化信号的3’转录的非翻译区,和(2)植物基因例如豌豆ssRUBISCO E9基因的3’端(Fischhoff等,1987)。
根据启动子将转化的植物细胞或转基因植物的转录活性导向编码区的能力来选择启动子,以确保所述酶编码序列的足够表达,以导致产生杀虫量的苏云金芽孢杆菌蛋白。在植物组织中结构基因可以由各种各样的启动子驱动。启动子可以是近组成型的(near-constitutive)(即它们在所有组织中均驱动转基因的转录),例如CaMV35S启动子;或影响双子叶植物或单子叶植物的组织特异性或发育特异性的启动子。当启动子为近组成型启动子,例如为CaMV35S或FMV35S时,在许多转化植物组织和大多数植物器官(例如愈伤组织、叶片、种子和根)中发现多肽表达的增加。增强的或重复形式的CaMV35S和FMV35S启动子在本发明的实施中特别有用(Kay等,1987;Rogers,美国专利5,378,619)。
本领域技术人员会认识到,有许多启动子在植物细胞中有活性,并且已经在文献中进行了描述。这样的启动子可以得自植物或植物病毒,包括但不限于胭脂碱合酶(NOS)启动子和章鱼碱合酶(OCS)启动子(它们载于根癌土壤杆菌的肿瘤诱导质粒上)、花椰菜花叶病毒(CaMV)19S和35S启动子、来自核酮糖1,5-二磷酸羧化酶(ssRUBISCO,一种非常丰富的植物多肽)小亚基的光诱导型启动子、水稻Actl启动子和玄参花叶病毒(FMV)35S启动子。所有这些启动子已经用来创造各种类型的DNA构成物,所述构成物已经在植物中表达(参见例如McElroy等,1990,美国专利5,463,175)。
另外,也可能最好采用含有组织特异性启动子的植物整合型载体,促使苏云金芽孢杆菌δ-内毒素在植物的特定组织中表达。具体的靶组织可以包括叶片、茎、根、块茎、种子、果实等,所选择的启动子应该具有所需的组织和发育特异性。因此,应该通过选择具有所需组织表达能力和接近的启动子强度的启动子,并选择在所述靶组织中产生所需杀虫活性的转化体,使启动子功能最佳化。在异源结构基因在植物中表达方面,这种来自转化体库(pool)的选择方法是常规使用的,因为在含有同一异源基因的转化体之间有由于在所述植物基因组中基因插入位点而引起的变异(通常称为“位置效应”)。除已知引起DNA在植物细胞中转录(组成型或组织特异性的)的启动子外,可以通过在植物cDNA文库中筛选选择性或优选在靶组织中表达的基因,鉴定其它启动子以用于本发明中,然后确定所述启动子区。
典型的组织特异性启动子是凝集素启动子,它是种子组织特异性的。大豆种子中的凝集素蛋白由仅在种子成熟期间表达的单基因(Lel)编码,并且占总种子mRNA的约2-5%。已经全面表征了凝集素基因和种子特异性启动子,并用来指导转基因烟草植株中的种子特异性表达(Vodkin等,1983;Lindstrom等,1990)。可以将含有编码目的多肽的编码区的表达载体工程改造,以将其置于所述凝集素启动子控制之下,并且可以采用例如原生质体转化法(Dhir等,1991),将该载体引入植物中。所述多肽的表达则应特异性地导向转基因植物的种子。
由用组织特异性启动子转化的植物细胞产生的本发明转基因植物可以与由用不同的组织特异性启动子转化的植物细胞产生的第二转基因植物杂交,以产生在一个以上的特定组织中表现出转化效应的杂种转基因植物。
其它典型的组织特异性启动子是玉米蔗糖合成酶1(Yang等,1990)、玉米乙醇脱氢酶1(Vogel等,1989)、玉米集光复合体(Simpson,1986)、玉米热激蛋白(Odell等,1985)、豌豆小亚基RuBP羧化酶(Poulsen等,1986;Cashmore等,1983)、Ti质粒甘露碱合酶(McBride和Summerfelt,1989)、Ti质粒胭脂碱合酶(Langridge等,1989)、矮牵牛查耳酮异构酶(Van Tunen等,1988)、菜豆富甘氨酸蛋白1(Keller等,1989)、CaMV35s转录物(Odell等,1985)和马铃薯patatin(Wenzler等,1989)。优选的启动子是花椰菜花叶病毒(CaMV35S)启动子和S-E9小亚基RuBP羧化酶启动子。
如有需要,可以对用于本发明DNA构成物中的启动子进行修饰,以影响其控制特性。例如,可以将CaMV35S启动子连接于ssRUBISCO基因代表在缺乏光时表达ssRUBISCO的部分,以产生在叶片有活性而在根中无活性的启动子。所得的嵌合启动子可以如本文所述使用。为了这种描述,短语“CaMV35S”启动子因此包括CaMV35S启动子的变异,例如由于与操纵基因区连接、随机诱变或控制诱变等得到的启动子。此外,可以将所述启动子改变,以含有多个“增强子序列”,以有助于提高基因表达。这类增强子序列的实例已经由Kay等(1987)报道。叶绿体或质体特异性启动子是本领域已知的(Daniell等,美国专利第5,693,507号;其通过引用结合到本文中),例如可得自例如以下叶绿体基因的启动子得自菠菜或豌豆的psbA基因、得自玉米的rbcL和atpB启动子区和rRNA启动子。任何叶绿体或质体有效启动子均在本发明范围内。
由本发明DNA构成物产生的RNA也含有5’非翻译前导序列。该序列可以得自选择用来表达所述基因的启动子,并且可以对其进行特异性地修饰,以增加所述mRNA的翻译。5’非翻译区也可以得自病毒RNA、合适的真核基因或合成的基因序列。本发明不限于其中非翻译区得自伴随所述启动子序列的5’非翻译序列的构成物。如下所示,可用于本发明的植物基因前导序列是矮牵牛热激蛋白70(hsp70)前导序列(Winter等,1988)。
本发明的一个典型实施方案包括所述苏云金芽孢杆菌氨基酸序列的质体定向或质体定位。质体导向序列已经从许多核编码的植物基因中分离出来,并且已经显示引导胞质合成的蛋白输入质体(Keegstra和Olsen的综述,1989)。本领域熟知的各种各样的质体导向序列可以用于实施本发明,它们包括但不限于ADPGPP、EPSP合酶或ssBUBISCO。在可供选择的优选实施方案中,用于单子叶作物的质体导向序列(肽和核酸)可以包含含内含子序列的基因组编码片段以及在编码的质体导向序列中的重复(duplicated)蛋白酶切位点。
最优选的核酸序列在此称为zmSSU PTP(SEQ ID NO3),它包含一个含内含子序列的基因组编码片段以及一个在编码的质体导向序列中的重复蛋白酶切位点,衍生自质体导向序列zmS1(Russell等,1993)。zmSSU PTP肽序列(SEQ ID NO4)与所述序列氨基末端的直接翻译融合体,可用于在转基因玉米中获得提高水平的所述多肽。可以通过将zmSSU PTP序列3’(C末端编码)末端的NcoI位点与cry2Ab序列的5’NcoI位点(N末端编码)连接,实现zmSSU PTP核酸序列(SEQ IDNO3)与cry2Ab基因(SEQ ID NO1)符合读框的融合。
用于双子叶作物的在此称为PTP2(SEQ ID NO9)的优选序列包含一个含叶绿体引导肽序列的基因组编码片段,所述叶绿体引导肽序列得自拟南芥(Arabidopsis thaliana)的EPSP合酶基因,其中豌豆ssRUBISCO PTP的转运肽切割位点取代了所述天然EPSP合酶的PTP切割位点(Klee等,1987)。
如上所述,本发明的嵌合植物基因的3’非翻译区含有一个在植物中起作用的聚腺苷酸化信号,使得腺苷酸核苷酸添加至所述RNA的3’端。优选的3’区的实例是(1)3’转录的非翻译区,含有土壤杆菌肿瘤诱导(Ti)质粒基因如胭脂碱合酶(NOS)基因的聚腺苷酸化信号,和(2)植物基因,例如豌豆ssRLUBISCO E9基因(Fischhoff等,1987)。4.5.3内含子在表达载体中的应用为了使在单子叶植物中的表达最佳化,在所述DNA表达构成物中也可以包含内含子。这种内含子通常置于非翻译序列中mRNA 5’端附近。这种内含子可以得自但不限于以下一组内含子玉米热激蛋白(HSP)70内含子(美国专利5,424,412;1995)、水稻Actl内含子(McElroy等,1990)、Adh内含子1(Callis等,1 987)或蔗糖合酶内含子(Vasil等,1989)。正如本文所示,玉米HSP70内含子可用于本发明中。4.5.4终止子在表达载体中的应用RNA聚合酶转录核基因组编码DNA序列通过聚腺苷酸化发生的位点。通常,位于聚腺苷酸化位点下游数百个碱基对的DNA序列用来终止转录。那些DNA序列在此称为转录终止区。转录的信使RNA(mRNA)的有效聚腺苷酸化需要那些区。对于引入叶绿体或质体、或引入叶绿体或质体基因组中的编码序列,mRNA转录的终止与细菌基因表达领域中熟知的方法相似。例如,通过干环结构或类似于依赖于rho的序列的结构,可以终止或者多顺反子或单顺反子序列的转录。
构成物通常包括目的基因与用作终止转录的信号并且在构成物中计划用于核基因组表达的3’端DNA序列,便于产生的mRNA聚腺苷酸化。最优选的3’元件设想为得自根癌土壤杆菌胭脂碱合酶基因的那些3’元件(nos3’端)(Bevan等,1983)、根癌土壤杆菌章鱼碱合酶基因T7转录物的终止子和马铃薯或番茄的蛋白酶抑制剂i或ii基因的3’端。如有需要,可以再包括调节元件例如TMVΩ元件(Gallie等,1989)。4.5.5其它表达增强元件可以调节基因表达的另一种类型的元件是转录起始位点和编码序列起点之间的DNA序列,称为非翻译前导序列。前导序列可以影响基因表达。可以进行前导序列的编译(compilation),以预测最适或亚适序列,并产生“共有序列”和优选的前导序列(Joshi,1987)。设想优选的前导序列包括包含预测指导所连接的结构基因最佳表达的序列的那些前导序列,即包括可以增加或保持mRNA稳定性并防止翻译不正确起始的优选共有前导序列。按照本说明书,这类序列的选择是本领域技术人员已知的。最优选由在植物、特别是在玉米中高表达的基因衍生的序列。一个特别有用的前导序列可以是矮牵牛HSP70前导序列。
转录增强子或增强子重复可以用来增加表达。这些增强子通常发现位于在真核细胞中起作用的启动子中的转录起始处的5’,但通常可以以正向或反向插入所述编码序列的5’或3’。增强子的实例包括得自CaMV 35S启动子、章鱼碱合酶基因(Ellis等,1987)、水稻肌动蛋白基因和非植物真核生物(例如酵母;Ma等,1988)启动子的元件。4.5.6多基因载体构成物和IRES在本发明的某些实施方案中,内部核糖体结合位点(IRES)元件的应用用来产生多基因或多顺反子信息。IRES元件能够绕过依赖于5’甲基化帽翻译的核糖体扫描模型,并在内部位点开始翻译(Pelletier和Sonenberg,1988)。已经描述了得自小RNA病毒科两个成员(脊髓灰质炎和脑心肌炎)的IRES元件(Pelletier和Sonenberg,1988),以及得自哺乳动物信息的IRES元件(Macejak和Sarnow,1991)。IRES元件可以连接于异源可读框。多个可读框可以一起转录,每个可读框由一个IRES分隔,产生多顺反子信息。借助所述IRES元件,每个可读框可为核糖体所及,以有效翻译。采用单启动子/增强子可以有效表达多基因,以转录一个单一信息。
任何异源可读框均可以连接于IRES元件。这包括以下蛋白的基因分泌蛋白、由独立的基因编码的多亚基蛋白、胞内蛋白或膜结合蛋白和选择标记。这样,可以用一种构成物和一种选择标记,将几种蛋白的表达同时工程化到一个细胞中。
计划利用叶绿体或质体特异性转录和翻译机器在叶绿体或质体内表达的构成物可以含有或者单顺反子或多顺反子序列。4.5.7表达载体的构建选择哪种表达载体以及选择哪种与多肽编码区最终操作性连接的启动子直接取决于所需的功能特性,例如蛋白表达的位置和时间以及待转化的宿主细胞。在构建重组DNA分子的领域中有固有的众所周知的限制。然而,可用于实施本发明的载体能够指导与其操作性连接的多肽编码区的表达。
可用于在高等植物中表达基因的典型的载体是本领域众所周知的,并且包括衍生自描述的根癌土壤杆菌的肿瘤诱导(Ti)质粒(Rogers等,1987)的载体。然而,已知几种其它植物整合型载体系统在植物中起作用,包括描述的pCaMVCN转移控制载体(Fromm等,1985)。pCaMVCN(可得自Pharmacia,Piscataway,NJ)包括CaMV35S启动子。
在优选实施方案中,用来表达所述多肽的载体包括一个在植物细胞中有效的选择标记,最好是抗药性选择标记。一个优选的抗药性标记是其表达导致卡那霉素抗性的基因,即已描述的含有胭脂碱合酶启动子、Tn5新霉素磷酸转移酶II(nptII)和胭脂碱合酶3’非翻译区的嵌合基因(Rogers等,1988)。
用于制备表达载体的方法是本领域众所周知的。用来转化植物的表达(转化)载体和制备那些载体的方法描述于美国专利4,971,908、4,940,835、4,769,061和4,757,011(每个文献具体通过引用结合到本文中)。可以修饰那些载体,以使其包括按照本发明的编码序列。
已经开发了多种方法以通过互补粘性末端或平端将DNA操作性地连接于载体。例如,可以将互补同聚物序列段加至待插入的DNA区段以及加至载体DNA。然后通过互补同聚物尾之间的氢键连接所述载体和DNA区段,形成重组DNA分子。
编码有能力赋予细胞杀虫活性的多肽的编码区,最好是编码苏云金芽孢杆菌δ-内毒素的多核苷酸或这种多核苷酸的功能等同体。按照这种实施方案,也优选包含SEQ ID NO1的DNA序列的编码区。
已经表明结合质体引导肽编码基因成功转化植物、以高水平表达特定苏云金芽孢杆菌δ-内毒素的所述δ-内毒素多肽编码基因,是包含在所述质粒载体中的那些基因。含质体引导肽的优选质粒包括pMON30464、pMON33827、pMON33828、pMON33829。这些质粒由SEQ ID NO16、SEQ ID NO13、SEQ ID NO14和SEQ IDNO15中所示序列编码。更优选的是,可以用含有包含以下核苷酸序列的表达盒的任何载体成功地转化植物SEQ ID NO16的核苷酸1781-5869、SEQ ID NO13的核苷酸17-3182、SEQ ID NO14的核苷酸17-3092或SEQ ID NO15的核苷酸17-3155。
本文所述的研究已经鉴定出在植物中增强苏云金芽孢杆菌δ-内毒素表达的方法,所述内毒素当加入感病植物的核基因组、质体或叶绿体基因组中时赋予对昆虫病原体的抗性。美国专利5,500,365(具体通过引用结合到本文中)描述了用于合成植物基因以优化所合成基因编码的蛋白的表达水平的方法。该方法涉及对外源转基因结构基因序列的修饰,以使其更“象植物”,并因此更有可能被所述植物翻译和表达。用于最好在单子叶植物中增加转基因表达的相似方法公开于美国专利5,689,052(其具体通过引用结合到本文中)。农学、园艺、观赏和其它经济或商业上有用的植物可以按照本文所述的方法制备,使所述植物以足以赋予对昆虫病原体抗性的高水平表达苏云金芽孢杆菌δ-内毒素。
这类植物可以共表达所述苏云金芽孢杆菌δ-内毒素多肽以及以下其它物质抗真菌、抗细菌或抗病毒的致病相关肽、多肽或蛋白;杀虫蛋白;赋予除草剂抗性的蛋白;和涉及提高植物制品质量或植物农艺性能的蛋白。在植物中同时共表达多种蛋白是有利的,因为它利用一种以上的作用方式来防治植物病原体损害。这可以使产生抗性病原体品系的概率减至最小、扩大抗性谱和潜在地导致协同杀虫效应,由此增强植物抗昆虫侵染的能力(WO 92/17591)。
具体设想了按照本发明使用包括ocs增强子元件的载体。该元件首先作为16bp回文增强子从土壤杆菌章鱼碱合酶(ocs)基因中鉴定出(Ellis等,19870,并存在于至少10种其它启动子中(Bouchez等,1989)。提出当在单子叶植物转化方面应用时,增强子元件例如ocs元件、特别是多拷贝的该元件的应用可以用来提高来自相邻启动子的转录水平。
设想了可能希望引入包含一种以上基因的大DNA序列。利用细菌或酵母人工染色体(分别为BAC或YAC)或甚至植物人工染色体,有助于这种序列的引入。例如,Hamilton等(1996)公开了应用BAC进行土壤杆菌介导的转化。
最后,用于引入单子叶植物基因组中的最理想的DNA区段可以是编码所需性状(例如增产)的同源基因或基因家族,它们在新启动子或增强子等、或许甚至同源或组织特异性(例如根颈/根鞘、轮生体、茎、穗梗(earshank)、籽粒或叶片特异性)启动子或控制元件控制下被引入。事实上,设想了本发明的具体应用可以是产生包含被以组织特异性方式导向的转基因的转化体。例如,抗虫性基因可以在轮生体和根颈/根鞘组织中特异性表达,这些组织分别是ECB的第一批和第二批卵(broods)的目标。同样,可以将具有抗根虫(rootworm)特殊活性的蛋白的编码基因直接导向根组织。
用于在转基因植物中组织特异性地导向基因表达的载体通常包括组织特异性启动子,也可以包括其它组织特异性控制元件,例如增强子序列。按照本说明书,在某些植物组织中指导特异性的或增强的表达的启动子是本领域技术人员已知的。
也设想了通过将组成型表达的基因(在所有组织中)和仅在不需要所述基因产物的组织中表达的反义基因共同引入,可以功能性地实现组织特异性表达。例如,可以引入编码苏云金芽孢杆菌结晶毒素蛋白的基因,以使采用花椰菜花叶病毒的35S启动子将其在所有组织中表达。或者,水稻肌动蛋白启动子或双子叶植物或单子叶植物种的组蛋白启动子也可以用于组成型基因表达。此外,设想了结合得自一种以上启动子的元件的启动子可能是有用的。例如,美国专利5,491,288公开了将花椰菜花叶病毒启动子与组蛋白启动子结合。因此,采用例如玉米醇溶蛋白启动子在玉米籽粒中表达Bt基因反义转录物可能防止所述δ-内毒素在种子中累积。因此,由所引入的基因编码的蛋白就存在于除籽粒外的所有组织中。本发明人特别设想了相似的策略可以用于本发明,以指导可筛选标记或选择标记在种子组织中的表达。
另一方面,人们可能希望获得按照本发明使用的新组织特异性启动子序列。为此,人们可以首先从所关注的组织中分离cDNA克隆,并例如采用RNA印迹法鉴定在该组织中特异性表达的那些克隆。理想的是,人们有可能鉴定出不以高拷贝数存在的基因,但所述基因产物在特定组织中相对丰富。可以采用本领域技术人员已知的分子生物学技术,将相应的基因组克隆的启动子和控制元件定位。
设想了仅需要在特定条件下在转基因植物中表达某些基因。例如,建议赋予对环境胁迫因素例如干旱的抗性的某些基因仅需要在真正的胁迫条件下表达。进一步设想了这类基因在植物的整个发育期间的表达可能具有有害效应。已知存在着大量对环境应答的基因。例如,由光通过植物光敏素介导调节某些基因例如编码核酮糖二磷酸羧化酶小亚基的rbcS的表达。其它基因由次级刺激物诱导。例如,脱落酸(ABA)的合成由某些环境因素诱导,包括但不限于水胁迫。已经表明许多基因由ABA诱导(Skriver和Mundy,1990)。也预期可能仅需要在实际昆虫侵袭的条件下表达赋予抗昆虫掠食的基因。因此,对于某些所需性状,需要在转基因植物中诱导型表达基因。
在本发明的某些实施方案中,提出仅需要在植物发育的某个时期在转基因植物中表达基因。发育的定时通常与组织特异性基因表达相关。例如,在传粉后约15天在胚乳中启动玉米醇溶蛋白贮存蛋白的表达。
也设想了就一个细胞而言DNA自身定向可能是有用的。例如,将所引入的DNA导向细胞核可能是有用的,因为这可以提高转化频率。在细胞核自身中,将基因定向以便达到定点整合可能是有用的。例如,让通过转化引入的基因取代该细胞中现有的基因可能是有用的。4.6杀虫苏云金芽孢杆菌δ-内毒素和基因的鉴定和分离设想了本发明中所述方法可以用来获得多种新的如下文所述分离的苏云金芽孢杆菌内毒素的大大提高的表达。先前已经描述了对于编码具杀虫活性的结晶内毒素的新苏云金芽孢杆菌菌株的鉴定(Donovan等,1992)。分离出苏云金芽孢杆菌内毒素,然后进行氨基末端的氨基酸序列分析、反向翻译(back-translation)所述氨基酸序列,以设计寡核苷酸探针或应用相关的苏云金芽孢杆菌基因作为探针,然后通过杂交克隆编码所述内毒素的基因,这些是本领域技术人员熟悉的,并且已有描述(参见例如Donovan等,1992,美国专利5,264,364,每个文献具体通过引用结合到本文中)。
通过本发明描述的方法,可以达到在转基因植物中提高表达对双翅目无活性的Cry2A苏云金芽孢杆菌δ-内毒素。一种获得提高表达的蛋白是Cry2Ab。
先前的研究表明,某些Cry2Aδ-内毒素能够具有比其它密切相关的Cry2Aδ-内毒素更宽的寄主范围特异性,其中不仅鳞翅目物种,而且双翅目物种也对非常低的毒素剂量特别敏感。相反,没有表现出显著双翅目抑制活性的密切相关的Cry2A内毒素因此表现出其寄主范围特异性更窄(Widner等,1989,J.Bacteriol.171965-974;Widner等(a),1990,J.Bacteriol.1722826-2832)。这些研究表明,此中所用的Cry2Ab不是完全缺乏双翅目抑制活性,而是仅仅比其它密切相关的Cry2A苏云金芽孢杆菌δ-内毒素的效力低得多。那些研究表明,特别是Cry2Ab比Cry2Aa的效力低得多,因此当针对埃及伊蚊(Aedes egyptii)测试时缺乏双翅目活性。然而,对于密切相关的δ-内毒素之间的鉴别没有一种单一可接受的方法,如本文所述,通过采用一种方法或几种方法的组合可以完成合适Cry2A的选择,所述方法包括但不限于比较总体氨基酸序列同源性、在由氨基酸序列307-382指定的区域中将Cry2A之间进行狭窄集中的相似性比较,或基于IC50数据。Widner等证实,为了获得对双翅目物种相似的IC50效应,需要Cry2Ab比Cry2Aa多50-100倍。因此,双翅目物种对Cry2A蛋白的敏感性范围,可以用作测量和鉴别在不同类Cry2A蛋白之间目标昆虫敏感性差异的一种方法。例如,比Cry2Aa对埃及伊蚊表现出的IC50 PPM高约3倍的IC50PPM数值,可以用作排除某些缺乏显著双翅目物种抑制活性的Cry2A蛋白的特征。然而,利用基于IC50抑制活性范围的方法应该小心采用,因为这些数值非常依赖于多种高度可变的条件,包括但不限于用于分析该蛋白的方法和材料以及所检测昆虫的物理条件。鉴别缺乏显著双翅目物种抑制活性的、得自不在本发明范围内的δ-内毒素的Cry2Aδ-内毒素的一个可供选择的方法,可以包括排除在氨基酸序列上与Cry2Aa的相似性高于约87%的Cry2A蛋白,或更优先排除在氨基酸序列上与Cry2Aa的相似性高于约90%的Cry2A蛋白。特别是,认为Cry2Aa中对应于氨基酸残基约307-382的区域对于该蛋白的双翅目抑制活性是关键性的,并且当取代Cry2Ab中不相似的互补区时,赋予Cry2Ab蛋白双翅目抑制活性。因此,鉴别属于本发明范围内的Cry2Aδ-内毒素的另一种方法可以包括所述蛋白该区域的相似性比较,当将任何特定Cry2Aδ-内毒素与Cry2Aa中的该区比较时,考虑要避免的同源性水平。确定属于本发明范围的Cry2Aδ-内毒素在该76个氨基酸序列结构域中的可变氨基酸,可能优选是在该序列中与Cry2Aa的相似性高于约80-99%的那些氨基酸,或更优选是在该序列中与Cry2Aa的相似性高于约60-79%的那些氨基酸,或是在该序列中与Cry2Aa的相似性高于约40-59%的那些氨基酸,或甚至优选是在该序列中与Cry2Aa的相似性高于约24-39%的那些氨基酸,或最优选是在该序列中与Cry2Aa的相似性高于约0-23%的那些Cry2Aδ-内毒素的氨基酸。4.7转化的植物细胞和转基因植物也设想了用本发明表达载体转化的植物。也设想了衍生自这种转化或转基因细胞的转基因植物。本领域技术人员会认识到,可以用本领域熟知的方法,将含本发明结构编码序列的嵌合植物基因插入植物的基因组中。用于植物细胞的DNA转化的这种方法包括土壤杆菌介导的植物转化、应用脂质体、采用病毒或花粉的转化、电穿孔、原生质体转化、将基因转移到花粉中,注射到生殖器官、注射到未成熟胚中和粒子轰击。这些方法中的每种都具有不同的优点和缺点。因此,将基因引入特定植物品系的一种特定方法对于另一种植物品系可能不一定是最有效的,但众所周知哪些方法可用于特定的植物品系。
有许多将转化DNA区段引入细胞中的方法,但不是所有的方法均适合于将DNA传递至植物细胞。认为合适的方法事实上包括可以将DNA引入细胞中的任何方法,例如通过根癌土壤杆菌和相关土壤杆菌菌株感染、例如通过以下方法直接传递DNAPEG介导的原生质体转化(Omirulleh等,1993)、干燥/抑制介导的DNA摄入、电穿孔、与碳化硅纤维一起搅拌、DNA包被粒子的加速等。在某些实施方案中,加速方法是优选的,包括例如微粒轰击等。
将DNA引入细胞中的技术是本领域技术人员熟知的。已经描述了用于将基因传递至细胞中的4种常用方法(1)化学方法(Graham和van der Eb,1973);(2)物理方法,例如微注射(Capecchi,1980)、电穿孔(Wong和Neumann,1982;Fromm等,1985)和基因枪(Johnston和Tang,1994;Fynan等,1993);(3)病毒载体(Clapp,1993;Lu等,1993;Eglitis和Anderson,1988a;1988b);和(4)受体介导的机制(Curiel等,1991;1992;Wagner等,1992)。4.7.1电穿孔将短高压电脉冲施加到多种动物和植物细胞上,导致在质膜中形成纳米大小的孔。DNA或者通过这些孔,或者由于伴随孔封闭的膜组分重分配,而被直接吸收到细胞质中。电穿孔可能非常有效,并且可以既用于瞬时表达所克隆的基因,又用来建立携带整合拷贝目的基因的细胞系。与磷酸钙介导的转染和原生质体融合相反,电穿孔时常产生携带一个整合拷贝、或最多几个整合拷贝的外源DNA的细胞系。
通过电穿孔的方法引入DNA是本领域技术人员众所周知的。为了通过电穿孔实现转化,人们可以利用或者易碎的组织例如细胞的悬浮培养物、或胚胎发生愈伤组织,或者人们可以直接转化未成熟胚或其它构成组织。人们可以通过将选定细胞暴露于果胶降解酶(果胶溶酶),或者以控制的方式机械制造伤口使所述细胞对转化更加敏感,部分降解其细胞壁。则这种细胞对于经电穿孔转化DNA为感受态,可以在该阶段进行电穿孔,然后根据新掺入的DNA的性质,通过合适的选择或筛选方案鉴定转化细胞。4.7.2微粒轰击将转化DNA区段传递到植物细胞的再一种有利方法是微粒轰击。在该方法中,可以用核酸包被粒子,通过推进力将其传递至细胞中。典型的粒子包括由钨、金、铂等构成的粒子。采用这些粒子,所述小金属粒子表面上的DNA穿过细胞壁被携带到胞质中(Klein等,1987;Klein等,1988;Kawata等,1988)。金属粒子穿透数层细胞,因此使得可以转化组织外植体中的细胞。对于鉴定叶绿体或质体定向转化事件,优选微粒轰击法。
微粒轰击除了是可再现的稳定转化植物细胞的有效方法外,其一个优点是既不需要分离原生质体(Cristou等,1988),又不需要对土壤杆菌感染的敏感性。用于通过加速将DNA传递至植物细胞中的方法的一个说明性实施方案是Biolistics粒子传递系统,它可以用来将包有DNA或细胞的粒子通过筛网,例如不锈钢或Nytex筛网,推进到覆盖有悬浮液中的植物培养细胞的滤膜表面上。所述筛网分散所述粒子,使得它们不会以大聚集物传递至受体细胞。人们认为间插在发射装置和待轰击的细胞之间的筛网减小轰击粒子聚集物的大小,并且可能通过减小太大的轰击粒子对受体细胞施加的损害,而导致转化率较高。
关于所述轰击,最好就将悬浮液中的细胞在滤膜或固体培养基上浓缩。或者,可以在固体培养基上布置未成熟胚或其它靶细胞。待轰击的细胞位于微粒(microprojectile)阻止板之下适当的距离处。如有需要,还可在加速装置和待轰击细胞之间放置一个或多个筛网。通过利用本文叙述的技术,人们可以获得高达1000个或更多的瞬时表达标记基因的细胞转化灶。在轰击后48小时转化灶中表达所述外源基因产物的细胞数范围通常为1-10个,平均1-3个。
在轰击转化中,人们可以优化轰击前培养条件和轰击参数,以产生最大数目的稳定转化体。轰击的物理参数和生物学参数在该技术中均是重要的。物理因素是涉及操作所述DNA/微粒沉淀或影响宏弹或微弹射程和速度的因素。生物因素包括涉及在轰击之前以及紧随轰击后的细胞操作的所有步骤、有助于减轻与轰击相关创伤的靶细胞的渗透调节以及转化DNA的性质,例如线性化DNA或完整的超螺旋质粒。人们认为轰击前操作对于成功转化未成熟植物胚尤为重要。
因此,设想了人们可能需要在小规模研究中调节各种轰击参数,以全面优化所述条件。人们可能特别希望调节诸如间隙距离、飞行距离、组织距离和氦气压之类的物理参数。人们也可以通过修改影响受体细胞生理状态和可以因此影响转化和整合效率的条件,使创伤减少因素(TRF)最小化。例如,可以调节渗透状态、组织水合作用和受体细胞的传代培养阶段或细胞周期,以使转化最佳。根据本说明书,其它常规调节的实施是本领域技术人员已知的。
粒子介导的转化方法是本领域技术人员众所周知的。美国专利5,015,580(其具体通过引用结合到本文中)描述了采用这种技术转化大豆。4.7.3土壤杆菌介导的转移土壤杆菌介导的转移是将基因引入植物细胞中的广泛适用的系统,因为可以将所述DNA引入全株植物组织中,由此绕过由原生质体再生完整植株的需要。应用土壤杆菌介导的植物整合型载体将DNA引入植物细胞是本领域熟知的。参见例如(Fraley等,1985;Rogers等,1987)描述的方法。在美国专利5,004,863(其具体通过引用结合到本文中)中描述了用土壤杆菌介导的转移对棉花植株进行基因工程;在美国专利5,349,124(其具体通过引用结合到本文中)中描述了莴苣植株的相似转化;以及在美国专利5,416,011(其具体通过引用结合到本文中)中描述了大豆的土壤杆菌介导的转化。此外,Ti-DNA的整合是一种相对精确的方法,几乎不导致重排。转移的DNA区由边界(border)序列限定,通常将间插DNA插入植物基因组中,如已描述的(Spielmann等,1986;Jorgensen等,1987)。
现代土壤杆菌转化载体能够在大肠杆菌以及土壤杆菌中复制,提供方便的操作,如已描述的(Klee等,1985)。此外,近来在用于土壤杆菌介导的基因转移的载体方面的技术进展已经改进了所述载体中基因和限制位点的布置,以便于构建能够表达各种多肽编码基因的载体。所述载体(Rogers等,1987)具有方便的多接头区,多接头区侧翼为用于指导所插入多肽编码基因表达的启动子和聚腺苷酸化位点,这些载体适用于本发明目的。另外,含有致瘤性(armed)和非致瘤性(disarmed)Ti基因的土壤杆菌可以用于转化。在土壤杆菌介导的转化有效的那些植物品种中,所述基因转移由于其易得和限定的特性而成为选择的方法。
土壤杆菌介导的叶圆盘和其它组织(例如子叶和下胚轴)的转化看来限于土壤杆菌天然感染的植物。土壤杆菌介导的转化在双子叶植物中是最有效的。看来几乎没有单子叶植物是土壤杆菌的天然宿主,尽管如所述用土壤杆菌载体已经在石刁柏中产生了转基因植物(Bytebier等,1987)。最近也已经用土壤杆菌转化了其它单子叶植物。在该组中包括玉米(Ishida等)和水稻(Cheng等)。
用土壤杆菌转化法产生的转基因植物通常在一条染色体上仅含有单个基因。这种转基因植物对于所加入的基因可以称为杂合的。然而,因为使用词语“杂合的”通常暗示在一对染色体的第二条染色体的同一基因座上存在互补基因,而在含一个加入的基因的植物中没有这种基因,所以人们认为这种植物更准确的名称是独立分离子,因为所加入的外源基因在有丝分裂和减数分裂期间独立地分离。
当所述植物作为杂种商品化时,例如玉米,可能优选独立分离子。在这种情况下,使含有该基因的独立分离子与另一植株杂交,以形成目的基因杂合的杂种植物。
另一种优选是所加入的结构基因纯合的转基因植物,即含有两个加入的基因的转基因植物,一对染色体的每条染色体上的同一基因座都有一个基因。通过使含有单个所加入基因的独立分离转基因植株进行有性杂交(自交),将所产生的某些种子萌发,并分析所产生的植株的目的基因活性和孟德尔遗传性,表明相对于对照(天然的非转基因植物)或独立分离转基因植物为纯合性,可以获得纯合的转基因植物。
可以使两种不同的转基因植物交配,以产生含有两个独立分离的所加入的外源基因的后代。使合适的子代自交可以产生两个所加入的编码目的多肽的外源基因均纯合的植物。也设想了与亲本植株回交和与非转基因植物异型杂交(out-crossing)。
采用基于磷酸钙沉淀法、聚乙二醇处理、电穿孔和这些处理的组合的方法,可以完成植物原生质体转化(参见例如Potrykus等,1985;Lorz等,1985;Fromm等,1985;Uchimiya等,1986;Callis等,1987;Marcotte等,1988)。
这些系统对不同植物种质的应用取决于由原生质体再生该特定植物品种的能力。描述了用于由原生质体再生谷类作物的说明性方法(参见例如Fujimura等,1985;Toriyama等,1986;Yamada等,1986;Abdullah等,1986)。
为了转化不能由原生质体成功再生的植物种质,可以利用将DNA引入完整细胞或组织的其它方法。例如,如已描述的,已经实现了由未成熟胚或外植体再生谷类作物(Vasil,1988)。4.8植物中的基因表达未修饰的细菌基因通常在转基因植物细胞中表达差。植物密码子选择更加非常类似人类和高于单细胞生物例如细菌的其它高等生物。几篇报道已经公开了改进重组基因在植物中表达的方法(Murray等,1989;Diehn等,1996;Iannacone等,1997;Rouwendal等,1997;Futterer等,1997;和Futterer和Hohn,1996)。这些报道公开了各种方法,用于将根据植物密码子频率表编码序列工程化,以代表更有效翻译的序列;采用避免可疑的聚腺苷酸化或富A/T结构域或内含子剪接共有序列的重组序列改进密码子第三碱基位置偏倚。尽管用于合成基因构建的这些方法是值得注意的,但按照Brown等的方法(美国专利第5,689,052号,1997;其通过引用全部结合到本文中)制备本发明的合成基因。因此,本发明提供制备在植物中以显著高于野生型基因的水平表达所需蛋白产物的合成植物基因的方法。简而言之,按照Brown等的方法,减小编码所需蛋白的多核苷酸序列中稀有和半稀有单子叶植物密码子的频率,并用更优选的单子叶植物密码子取代。在单子叶植物中由修饰的多核苷酸序列编码的所需多肽累积的增强是提高优选密码子频率的结果,所述优选密码子频率的提高是通过以连续6个核苷酸的片段分析所述编码序列,并基于就单子叶植物中最稀少的284、484和664六聚体的出现频率而论的所述六聚体出现的频率,改变所述序列来实现。此外,Brown等公开了通过应用降低罕用密码子频率的方法增加重组基因表达,降低稀有密码子频率通过以下方法进行在所述核苷酸序列中减少聚腺苷酸化信号和内含子剪接位点的出现,除去所述核苷酸序列中自身互补的序列,并用非自身互补的核苷酸取代这种序列,同时维持编码所述多肽的结构基因,并降低所述核苷酸序列中5’-CG-3’二核苷酸对出现的频率。这些步骤顺序进行,并且有累积效应,产生对于所需多肽中存在的大多数氨基酸而言含有单子叶植物优先利用的更优选的单子叶植物密码子的核苷酸序列。
本文所述研究已经鉴定出在植物中增强苏云金芽孢杆菌δ-内毒素表达的方法,当所述内毒素掺入感病植物的核基因组、质体基因组或叶绿体基因组中时,赋予对昆虫病原体的抗性。美国专利5,500,365(其具体通过引用结合到本文中)描述了合成植物基因以优化所合成基因编码的蛋白的表达水平的方法。该方法涉及修饰外源转基因的结构基因序列,以使其更“象植物”,并因此更有可能被所述单子叶植物或双子叶植物翻译和表达。然而,美国专利5,689,052中公开的方法提供了最好在单子叶植物中转基因表达的增强。4.9抗虫性转基因植物的产生因此,可以采用诸如本文4.7一节公开的转化方法,通过转化植物在那些植物中增加编码目的多肽(即细菌晶体蛋白或δ-内毒素多肽和质体引导肽)的基因量。特别是,叶绿体或质体转化可以在含这些亚细胞器结构的组织中产生以至多约10,000拷贝/细胞存在的所需编码序列(McBride等,Bio/Technology 13362-365,1995)。
也可以如所述(Zhou等,1983;Hess,1987)将DNA直接转移到花粉中,将DNA引入植物中。如描述的方法(Pena等,1987),通过将所述DNA注射到植物生殖器官,可以获得多肽编码基因的表达。也可以将DNA直接注射到未成熟胚的细胞中,并如描述的方法(Neuhaus等,1987;Benbrook等,1986)将干燥的胚再水合。4.9.1转化细胞的选择在实现外源DNA传递至受体细胞后,获得转基因植物的下一步一般涉及鉴定转化细胞,用于进一步培养和植株再生。如本文所述,为了提高鉴定转化体的能力,人们可以希望使用选择标记基因或可筛选标记基因作为可表达的目的基因,或除可表达的目的基因外,可以使用所述标记或可筛选基因。在这种情况下,则人们通常应该通过将所述细胞暴露于一种或多种选择剂来分析潜在转化的细胞群体,或人们应该筛选具有所需标记基因性状的细胞。
转化细胞鉴定方法的一个典型实施方案涉及将转化的培养物暴露于选择剂,例如代谢抑制剂、抗生素、除草剂等。已经被转化并稳定整合了赋予对所用的选择剂抗性的标记基因的细胞,将在培养物中生长并分裂。敏感细胞经不起进一步培养。优选标记基因的一个实例是赋予草甘膦抗性的基因。当将该基因用作选择标记时,推定的转化细胞培养物用草甘膦处理。处理后,将可得到转基因细胞用于进一步培养,而不能得到敏感的或非转化的细胞。该方法详细地描述于美国专利5,569,834,其具体通过引用结合到本文中。优选选择标记系统的另一实例是新霉素磷酸转移酶(nptII)抗性系统,该系统赋予对抗生素卡那霉素的抗性,如美国专利5,569,834(其具体通过引用结合到本文中)中所述。另外,在用该系统转化后,当用卡那霉素处理时,将可得到转化细胞用于进一步培养,而不能得到非转化细胞。再一优选选择标记系统涉及应用赋予对巴龙霉素抗性的基因构成物。该类型选择标记系统的应用描述于美国专利5,424,412(其具体通过引用结合到本文中)。
所有设想的分析均是非破坏性的,转化细胞可以在鉴定后进一步培养。可以使用的另一可筛选标记是编码绿荧光蛋白的基因。
壮观霉素是一种质体或叶绿体蛋白合成的抑制剂,但不是由核基因组编码的胞质核糖体的蛋白合成的抑制剂,通过利用叶绿体或质体对壮观霉素的敏感性,简化transplastonomic选择(质体或叶绿体转化事件的选择)。壮观霉素防止光合作用所需的叶绿体蛋白的积累,因此可以基于在其颜色方面的差异辨别抗壮观霉素转化植物细胞抗壮观霉素的转化细胞是绿色的,而敏感细胞由于质体蛋白合成受抑制则是白色的。用合适的细菌aad基因转化叶绿体或质体,或用编码壮观霉素抗性质体或叶绿体功能核糖体RNA的基因转化叶绿体或质体,提供了选择和维持transplastonomic事件的方法(Maliga,Trends inBiotechnology 11101-106,1993)。
还设想了可筛选和可选择标记的组合将可用于鉴定转化细胞。在某些细胞或组织类型中,例如草甘膦或卡那霉素的选择剂可能或者未提供足够的杀伤活性以清楚地识别转化细胞,或者可能引起对转化体以及同样对非转化体的显著的非选择性抑制,因此使得所述选择技术不很有效。建议用一种生长抑制化合物例如草甘膦在低于引起100%抑制的那些浓度的浓度下进行选择,然后筛选例如卡那霉素的可筛选标记基因表达的生长中的组织,将使得人们可以从经不起单独选择的细胞或组织类型中回收转化体。我们提出选择和筛选的组合可能使得人们能够在更多细胞类型和组织类型中鉴定转化体。4.9.2转化体的再生由或者单个植物原生质体或者各种外植体发育或再生植株是本领域熟知的(Weissbach和Weissbach,1988)。这种再生和生长过程通常包括以下步骤选择转化细胞、培养那些个体化细胞通过通常的胚胎发育阶段通过生根的小植株阶段。转基因胚和种子的再生是相似的。此后将所产生的转基因生根苗种植在合适的植物生长介质中,例如土壤。
得自叶片外植体、含有由土壤杆菌引入的编码目的多肽的外来、外源基因的植株的发育或再生,可以采用本领域熟知的方法完成,如已描述的方法(Horsch等,1985)。在该方法中,在选择剂存在下,并于诱导被转化的植物品系苗再生的培养基中培养转化体,如已描述的方法(Fraley等,1983)。特别是,美国专利5,349,124(其具体通过引用结合到本文中)详细描述了创造表达杂种晶体蛋白的基因转化莴苣细胞和由其产生的植株,其中所述杂种晶体蛋白赋予这种植株对鳞翅目幼虫的杀虫活性。
该方法通常在2-4个月内产生苗,然后将这些苗转移至合适的含所述选择剂和防止细菌生长的抗生素的促进生根培养基。然后将在所述选择剂存在下生根形成小植株的苗移植至土壤或其它介质中,以允许产生根。这些步骤根据所用的具体植物品系而不同,这种变化是本领域众所周知的。
最好是,让所述再生植株自花授粉以提供纯合的转基因植物,或用得自所述再生植株的花粉与农学上重要的种子生长的植株(最好是近交系)杂交。相反,用得自这些重要系的花粉给再生植株传粉。采用本领域技术人员熟知的方法,培育本发明的含有所需多肽的转基因植物。
因此,在本发明转基因植物中,编码苏云金芽孢杆菌δ-内毒素多肽和质体引导肽的编码区的量增加。优选的转基因植物是独立分离子,并且可以将该基因和其活性传递至其后代。更优选的转基因植物是该基因纯合的,并且当有性交配时将该基因传递至其所有后代。可以将得自转基因植物的种子种植在大田或温室中,使所得的性成熟转基因植物自花传粉,以产生纯育植株。这些植株的后代成为纯育系,评价其苏云金芽孢杆菌转基因表达的增加。4.10具有耐虫性的转基因植物事件的鉴定为了鉴定表达高水平目的δ-内毒素的转基因植物,根据杀虫活性和/或目的基因的表达筛选所述除草剂抗性或抗生素抗性的转基因再生植株(R0代)是必不可少的。可以采用本领域技术人员熟知的各种方法完成这一步骤,所述方法包括但不限于1)从转基因R0植株中获得小组织样品,直接平行分析所述组织与得自非表达的阴性对照植株的组织对敏感昆虫的活性。例如,通过分析得自这种植株的叶片组织对ECB的活性,可以鉴定表达苏云金芽孢杆菌内毒素例如Cry2Ab的R0转基因玉米植株;2)通过对目的基因(Cry2Ab)特异性的酶联免疫测定(ELISA)分析蛋白提取物;或3)反转录酶PCRTM(RT PCRTM),以鉴定表达目的基因的事件。4.11分离同源基因和基因片段按照本发明的基因和δ-内毒素不仅包括本文公开的全长序列,而且也包括保留本文所具体例举序列的特征性杀虫活性的这些序列的片段或融合蛋白。
本领域技术人员应该明显看出,可以通过几种方法鉴定并获得杀虫δ-内毒素。特定的基因或其部分可以得自培养物保藏机构,或例如利用基因机合成构建。可以采用制备点突变的标准技术容易地构建这些基因的变异物。此外,采用市售的外切核酸酶或内切核酸酶,按照标准方法,可以制备这些基因的片段。例如,诸如Bal31的酶或定点诱变可以用来从这些基因的末端有规则地切下核苷酸。此外,采用多种其它限制酶可以获得编码活性片段的基因。蛋白酶可以用来直接获得这些δ-内毒素的活性片段。
采用本文提供的内容,也可以从芽孢杆菌属菌株和/或DNA文库中分离出等同的δ-内毒素和/或编码这些δ-内毒素的基因。例如,本文公开和要求保护的抗δ-内毒素的抗体可以用来从蛋白混合物中鉴定并分离出其它δ-内毒素。具体地说,可以针对所述δ-内毒素最恒定并且与其它苏云金芽孢杆菌δ-内毒素最不同的部分产生抗体。这些抗体则可以用来通过免疫沉淀、酶联免疫测定(ELISA)或蛋白质印迹法,特异性地鉴定出具有特征性杀虫活性的等同δ-内毒素。
用于鉴定本发明δ-内毒素和基因的另一方法是通过应用寡核苷酸探针。这些探针是具有可检测标记的核苷酸序列。正如本领域众所周知的,如果所述探针分子和核酸样品通过在这两种分子之间形成强结合而杂交,则可以合理地假设所述探针和样品基本相同。所述探针的可检测标记提供了以已知方式确定杂交是否发生的手段。这种探针分析提供了本发明杀虫δ-内毒素基因的快速鉴定方法。
采用标准方法,利用DNA合成仪可以合成用作按照本发明探针的核苷酸区段。在所述核苷酸区段作为探针的应用中,用本领域技术人员已知的任何合适标记来标记所述特定的探针,所述标记包括放射性标记和非放射性标记。典型的放射性标记包括32P、125I、35S等。采用DNA酶和DNA聚合酶,通过常规切口平移反应,可以从与所述DNA样品互补的核苷酸序列构建用放射性同位素标记的探针。然后可以将探针和样品在杂交缓冲液中混合,并于合适的温度下保持直至发生退火。此后,洗涤下膜上无关的物质,留下样品和结合的探针分子,通常通过放射自显影和/或液闪计数检测和定量。
非放射性标记包括例如配体,如生物素或甲状腺素;以及酶,例如水解酶或过氧化物酶;或各种化学发光剂,例如萤光素,或荧光化合物如荧光蛋白及其衍生物。所述探针也可以在两端用不同类型的标记物来标记以易于分离,例如在上述末端采用同位素标记标记,而在另一端采用生物素标记。
双链体的形成和稳定性取决于杂交体两条链之间的大致互补,如上所述,可以容许一定程度的错配。因此,本发明的探针包括所述序列的突变(单突变和多突变)、缺失、插入以及它们的组合,其中所述突变、插入和缺失允许与所述目的靶多核苷酸形成稳定的杂交体。以许多方式,采用目前本领域一般技术人员已知的方法,也许通过将来可能已知的其它方法,可以在给定的多核苷酸序列中产生突变、插入和缺失。
所列的所述探针的可能变异是部分由于遗传密码的丰余性。由于遗传密码的丰余性,对于用来制备蛋白的大多数氨基酸而言,可以使用一种以上的编码核苷酸三联体(密码子)。因此,不同的核苷酸序列可以编码一种特定的氨基酸。因此,苏云金芽孢杆菌δ-内毒素和肽和质体引导肽的氨基酸序列以及编码它们的多核苷酸,可以由编码所述蛋白或肽的同一氨基酸序列的等同核苷酸序列制备。因此,本发明包括这种等同核苷酸序列。此外,反向或互补序列是本发明的一个方面,可以由本领域技术人员容易地使用。另外,已经表明,已鉴定结构和功能的蛋白可以通过改变氨基酸序列来构建,只要这种改变不改变蛋白的二级结构(Kaiset和Kezdy,1984)。因此,本发明包括本文描述的氨基酸序列的突变体,其中所述突变体不改变蛋白二级结构,或如果结构被改变,则大致保留所述生物活性。此外,如本发明中所讨论的,本发明也包括带有编码δ-内毒素的基因或编码质粒引导肽的基因的整个基因或其部分的生物的突变体。这样的突变体可以采用本领域技术人员熟知的技术制备。例如,可以用UV辐射制备宿主生物突变体。同样,这样的突变体可以包括也可以采用本领域熟知的方法制备的无孢子宿主细胞。4.12定点诱变定点诱变是可用于通过对作为基础的DNA进行特异性诱变来制备单个肽或生物功能等同蛋白或肽的技术。所述技术还提供制备并测试序列变异体的现成可用的能力,其中所述变异体例如通过将一个或多个核苷酸序列变化引入所述DNA中而加入一个或多个上述考虑。定点诱变允许通过利用特定寡核苷酸序列产生突变体,所述特定寡核苷酸序列编码具有所需突变的所述DNA序列以及具有足够数目的相邻核苷酸,以提供足够大小的引物序列以及在缺失接点相反的两侧形成稳定双链体的序列复杂性。通常最好是长约17-25个核苷酸的引物,在该序列结构两侧约5-10个残基被改变。
一般而言,定点诱变技术是本领域熟知的,如各种出版物例举的。正如人们将认识到的,该技术通常使用以单链或双链形式存在的噬菌体载体。可用于定点诱变的典型载体包括载体例如M13噬菌体。这些噬菌体容易从市场上获得,并且其用法一般是本领域技术人员众所周知的。双链质粒也常规用于定点诱变,它消除了将目的基因从质粒转移至噬菌体的步骤。
一般而言,通过首先获得单链载体或将在序列中包括编码所需肽的DNA序列的双链载体的两条链解链,进行按照本文的定点诱变。一般合成制备带有所需突变序列的寡核苷酸引物。然后将该引物与单链载体一起退火,并经过DNA聚合酶例如大肠杆菌聚合酶IKlenow片段处理,以便完成含突变链的合成。因此,形成其中一条链编码原始非突变序列而第二条链带有所需突变的杂双链体。然后用这种杂双链体载体转化合适的细胞例如大肠杆菌细胞,并选择包括带突变序列布置的重组载体的克隆。
作为产生潜在有用的种类并且不是限制性的方法,提供采用定点诱变制备编码选定肽的DNA区段的序列变体,尽管有可以获得肽变体序列及编码其的DNA序列的其它方法。例如,编码所需肽序列的重组载体可以用诱变剂例如羟胺处理,以获得序列变体。这样的方法可以顺利地改变所述蛋白的生物化学和生物物理特性或其作用方式。这些包括但不限于1)增加δ-内毒素的形成,2)提高蛋白稳定性或减少蛋白酶降低,3)增加对昆虫膜受体的识别和结合,4)在昆虫中肠内皮中增加寡聚或形成通道,和5)由于上述任何原因或所有原因而提高杀虫活性或杀虫特异性。4.13生物功能等同物可以在本发明肽的结构和编码它们的DNA区段中制造修饰和变化,仍获得编码具有所需特性的蛋白或肽的功能分子。本文设想的生物功能等同肽、多肽和蛋白应该与基础的Cry2Ab氨基酸序列的序列或其中相应的部分具有约80%或更高的序列相似性,优选具有约85%或更高的序列相似性,最优选具有约90%或更高的序列相似性。
以下的讨论基于改变蛋白的氨基酸,以产生等同的或甚至改进的第二代分子。在本发明的具体实施方案中,设想突变的晶体蛋白可用于提高所述蛋白的杀虫活性,并因此在植物细胞中提高所述重组转基因的杀虫活性和/或表达。根据表3中给出的密码子,通过改变所述DNA序列的密码子,可以完成所述氨基酸改变。
表3氨基酸 密码子丙氨酸 Ala AGCA GCC GCG GCU半胱氨酸 Cys CUGC UGU天冬氨酸 Asp DGAC GAU谷氨酸 G1u EGAA GAG苯丙氨酸 Phe FUUC UUU甘氨酸 G1y GGGA GGC GGG GGU组氨酸 His HCAC CAU异亮氨酸 I1e IAUA AUC AUU赖氨酸 Lys KAAA AAG亮氨酸 Leu LUUA UUG CUA CUC CUG CUU甲硫氨酸 Met MAUG天冬酰胺 Asn NAAC AAU脯氨酸 Pro PCCA CCC CCG CCU谷氨酰胺 Ghn QCAA CAG精氨酸 Arg RAGA AGG CGA CGC CGG CGU丝氨酸 Ser SAGC AGU UCA UCC UCG UCU苏氨酸 Thr TACA ACC ACG ACU缬氨酸 Val VGUA GUC GUG GUU色氨酸 Trp WUGG酪氨酸 Tyr YUAC UAU
例如,在蛋白结构中的某些氨基酸可以用其它氨基酸取代,而不明显损失所述蛋白结构与例如抗体的抗原结合区或底物分子上的结合位点的结构的相互作用结合能力。由于正是蛋白的相互作用能力和特性限定该蛋白的生物学功能活性,因此在蛋白序列中,当然还有其作为基础的DNA编码序列中,可以进行某些氨基酸序列取代,依然获得具有相似特性的蛋白。因此本发明人考虑到,在所公开的组合物的肽序列或编码所述肽的相应的DNA序列中,可以进行各种改变,而不明显损失其生物利用性或生物活性。
在制备这种改变时,可以考虑氨基酸的亲水指数。亲水氨基酸指数在赋予蛋白相互作用性生物功能方面的重要性是本领域普通了解的(Kyte和Doolittle,1982,通过引用结合到本文中)。普遍认为,所述氨基酸的相对亲水特性有助于所产生的蛋白的二级结构,所述二级结构进而又限定了该蛋白与其它分子的相互作用,所述其它分子例如为酶、底物、受体、DNA、抗体、抗原等。
根据氨基酸的疏水性和电荷特性,已经确定了每种氨基酸的亲水指数(Kyte和Doolittle,1982),它们是异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-39);和精氨酸(-4.5)。
本领域已知某些氨基酸可以被具有相似亲水指数或计分的其它氨基酸取代,仍产生具有相似生物活性的蛋白,即仍获得生物功能等同的蛋白。在制备这样的改变时,优选亲水指数在±2以内的氨基酸取代,特别优选亲水指数在±1以内的氨基酸的取代,甚至更特别优选亲水指数在±0.5以内的氨基酸的取代。
本领域也知道,根据亲水性可以有效地进行相似氨基酸的取代。美国专利4,554,101(其通过引用结合到本文中)叙述了取决于其相邻氨基酸亲水性的蛋白的最大局部平均亲水性与所述蛋白的生物特性相关。
如美国专利4,554,101中详细描述了,已经确定了氨基酸残基的以下亲水性值精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5±1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。
人们理解,一种氨基酸可以被具有相似亲水性值的另一氨基酸取代,并且仍获得生物学等同的、特别是免疫学等同的蛋白。在制备这样的改变时,优选亲水性值在±2以内的氨基酸取代,特别优选亲水性值在±1以内的氨基酸的取代,甚至更特别优选亲水性值在±0.5以内的氨基酸的取代。
如上概述的,因此氨基酸取代一般基于氨基酸侧链取代基的相对相似性,例如其疏水性、亲水性、电荷、大小等。考虑各种上述特征的典型取代基是本领域技术人员熟知的,并且包括精氨酸和赖氨酸;谷氨酸和天冬氨酸;丝氨酸和苏氨酸;谷氨酰胺和天冬酰胺;以及缬氨酸、亮氨酸和异亮氨酸。
本领域技术人员知道,编码得自苏云金芽孢杆菌的δ-内毒素的多核苷酸当加入转基因植物的核DNA中时表达差(Diehn等的综述,1996)。最好是,基本上如美国专利5,500,365和5,689,052(其具体通过引用结合到本文中)中所述,设计编码目的δ-内毒素的核苷酸序列。可用于表达的核苷酸序列的实例包括但不限于cry2Ab(SEQ IDNO1)。
与Cry2Ab生物功能等同的肽、多肽和蛋白包括在示于SEQ IDNO2的基础序列中含有保守氨基酸改变的氨基酸序列。在这类氨基酸序列中,所述基础序列中的一个或多个氨基酸被另外的其电荷和极性类似于所述天然氨基酸的氨基酸取代(即保守氨基酸取代),导致沉默变化。
在所述基础多肽序列中的氨基酸取代可以选自所述天然存在的氨基酸所属类别的其它成员。可以将氨基酸分为以下4组(1)酸性氨基酸;(2)碱性氨基酸;(3)中性极性氨基酸;和(4)中性非极性氨基酸。这些不同组中的代表性氨基酸包括但不限于(1)酸性(带负电)氨基酸,例如天冬氨酸和谷氨酸;(2)碱性(带正电)氨基酸,例如精氨酸、组氨酸和赖氨酸;(3)中性极性氨基酸,例如甘氨酸、丝氨酸、苏氨酸、半胱氨酸、胱氨酸、酪氨酸、天冬酰胺和谷氨酰胺;(4)中性非极性(疏水性)氨基酸,例如丙氨酸、亮氨酸、异亮氨酸、缬氨酸、脯氨酸、苯丙氨酸、色氨酸和甲硫氨酸。
通过用这些组中的一种氨基酸取代同一组中的另一种氨基酸,可以进行所述基础多肽序列中的保守氨基酸改变。cry2Ab的生物功能等同物可以具有10个或更少的保守氨基酸改变,更优选为7个或更少的保守氨基酸改变,最优选具有5个或更少的保守氨基酸改变。所述编码核苷酸序列(基因、质粒DNA、cDNA或合成DNA)因此将具有相应的碱基置换,使得它编码cry2Ab的生物功能等同形式。
5.0实施例包括以下实施例以证明本发明的优选实施方案。本领域技术人员应该认识到,以下实施例中公开的技术代表本发明人发现的在实施本发明中工作良好的技术,并因此被认为构成本发明的优选实施模式。然而,本领域技术人员根据本说明书应该认识到,在不偏离本发明精神和范围的情况下,可以在所公开的具体实施方案中进行许多改变,且仍获得同样或相似的结果。5.1实施例1-采用定向载体的Cry2Ab的增加表达比较用定向和非定向CryAb表达载体转化的玉米植株中Cry2Ab蛋白的表达,用定向载体的植物中的表达显著较高。非定向Cry2Ab植物表达载体pMON26800和pMON30463含有一种包含以下成分的表达盒一个增强的CaMV35S启动子、一个玉米hsp70内含子、一个具有翻译起始和终止密码子的合成cry2Ab基因(SEQ ID NO1)和一个胭脂碱合酶聚腺苷酸化位点。
定向植物表达载体pMON30464(SEQ ID NO16)含有一个包含以下成分的表达盒一个增强的CaMV35S启动子、一个玉米hsp70内含子、一个与合成cry2Ab基因符合读框融合的玉米ssRUBSICO叶绿体转运肽(SEQ ID NO3)和一个胭脂碱合酶聚腺苷酸化位点。
所有的载体(pMON26800、pMON30463和pMON30464)也含有一个赋予转化植物组织巴龙霉素抗性的盒。在pMON26800的情况下,该盒包含一个增强的CaMV35S启动子、一个玉米hsp70内含子、一个具有翻译起始和终止密码子的新霉素磷酸转移酶基因和一个胭脂碱合酶聚腺苷酸化位点。在pMON30463和pMON30464的情况下,该盒包含一个CaMV35S启动子、一个具有翻译起始和终止密码子的新霉素磷酸转移酶基因和一个胭脂碱合酶聚腺苷酸化位点。基本上如美国专利5,424,412(其具体通过引用结合到本文中)中所述,得到抗巴龙霉素的转基因玉米植株。
通过定量ELISA测定,对得自R0阶段中独立转化的转基因事件叶片组织定量分析Cry2Ab蛋白水平。该ELISA使用采用针对Cry2Aa和作为标准的纯合Cry2Aa产生的单克隆捕获抗体的直接夹层技术,所述单克隆捕获抗体是一种作为第二抗体的与碱性磷酸酶缀合的不同Cry2Aa单克隆抗体。
在pMON30463(非定向)和pMON30464(定向)玉米植株中Cry2Ab表达水平的比较表明,非定向Cry2Ab表达不超过15ppm,而定向表达通常高于100ppm(表4)。蛋白印迹分析证实,pMON30464(定向)产生的交叉反应性物质水平的增加是因为与由pMON30463(非定向)产生的Cry2Ab和得自苏云金芽孢杆菌的Cry2Aa标准共迁移的约Mr71,000蛋白累计的增加。该数据表明,与Cry2Ab蛋白N末端融合的引导肽被有效地加工或去除。
在得自原始R0转基因事件的R1子代植物中也观察到,Cry2Ab在pMON30464(定向)载体中表达相对于在pMON26800(非定向)载体中的表达增加,表明高度表达是可遗传的(表5)。
表4Cry2Ab在用定向(pMON30464)和非定向(pMON30463)表达载体转化的R0玉米中的表达在不同事件中表达水平的分布载体总 总 0 0-5 5-15 15-50 50- 100- >200事件 ECB+ppm ppm ppmppm100 200 ppmppm ppm非定向 16 3 0 0 3 0 0 0 0(30463) (19%)定向40 14 0 2 2 0 0 4 5(30464) (35%)表5Cry2Ab在用定向(pMON30464)和非定向(pMON26800)表达载体转化的R0玉米中的表达在不同事件中表达水平的分布载体 分析的总 0 0-5 5-15 15-50 50-100 100-200 >200事件数ppm ppm ppmppm ppm ppm ppm非定向2801810 0 0 00(26800)定向 3353 2 0 2 417(30464)为了有效地防治摄食多种玉米组织的昆虫,关键是在所有潜在摄食部位均以高水平表达杀虫蛋白。为了确定Cry2Ab定向表达在其它组织中是否增加,对代表用相应载体类型获得的高表达系的独立定向和非定向转基因事件,平行分析Cry2Ab表达水平。通过定向表达,Cry2Ab的表达实际上在被害虫例如玉米螟和Helicoverpazea侵袭的所有玉米组织中均增加(表6)。这种类型的一致高水平表达尤其有价值,因为不太可能允许目标害虫通过行为(摄食)适应产生抗性。
表6转基因玉米中的定向和非定向Cry2Ab表达载体事 N 根 叶片 鞘 茎 柄 苞叶 玉米穗 玉米芯 籽粒件N30pMON #1 1 13.1117.6 140.8 514.9 397.5 121.8 130.5 165.2 106.930464#2 4 11.3±4.5 105±12121±2596±18 134±3852±9.1101±11113±45170±36N30pMON #1 2 1.2±0.410±5.320±12 28±5.629±7.57.6±7.6 46±9.99.6±9.6 10.9±4.626800表达以所示μgCry2Ab/gm鲜重(根和叶片)或干重组织(鞘、茎、柄、苞叶、玉米穗、玉米芯、籽粒〕±标准差(L30464#2)或范围(L26800#1)计进一步的分析表明,pMON30464产生的Cry2Ab蛋白水平增加导致直接在摄食测定中测量的物活性水平的相称增加。为了评价产生的杀虫活性水平,在组织饮食续加测定(tissue diet overlay studies)中分析得自对照(非转基因)、定向(pmon30464)和非定向(pMON30464)植株的玉米叶片组织对烟芽夜蛾的活性(表7)。对两种浓度的组织(0.0016%和0.0031%)进行生物测定,也对用于饮食续加中的给以同一组织样品进行定量ELISA测定Cry2Ab水平。Cry2Ab水平在定向(pMON30464)样品中相对于非定向(pMON30463)样品中增加7.5倍,这明显与在两种浓度比率下观察到的平均幼虫重量的6倍差异相关。这些数据因此表明,pMON30464产生的Cry2Ab水平的增加导致生物活性水平的相称增加。
表7Cry2Ab表达水平的增加与烟芽夜蛾组织饮食续加生物测定中的生物活性增加的相关性组织浓度1 组织浓度2Cry2Ab浓度 (0.0031%组织)(0.0016%组织)组织样品 (ppm) 平均幼虫重量(mg) 平均幼虫重量(mg)对照 0.0 22.00 24.6定向 444 1.2 2.1非定向 60 7.3 12.75.2实施例2-Cry2Ab的质体定向提高从转化回收的农学正常植株的频率为了获得商业上可利用的基于转基因的虫害防治性状,关键是获得具有正常植株生长特性的事件。在大多数情况下,在田间试验中增加相当大数量的独立转基因事件,以确保鉴定出满足所有重要标准(有效的害虫防治、转基因正常的孟德尔行为和正常生长特性或农艺性状)。提高获得正常事件的频率的方法显然是有价值的,因为它们增加鉴定出可以商业化的事件的可能性。它也可用来放大预期事件的库(pool)大小,以通过提高能育性R0事件(原代再生植株)的百分比来进行筛选。因为植株转化的工作强度大,所以减少必须产生以获得合适性能和生长特性的转基因事件R0事件数的任何方法也是有价值的。
产生非定向pMON26800和pMON30463载体和定向pMON30464载体的独立转基因R0插入事件大群体,并记录其能育性。也观察到,用所述定向载体产生的R0事件的较高百分比是能育的(表8)。随后将能育的R0事件的子代引入田间试验,在此记录它们的欧洲玉米螟抗性(ECB1)和正常分离。
确定ECB1评级和分离值的方法基本上如所述方法进行(Armstrong等,1995)。通过ECB1和分离标准的事件随后记录其矮化或株高的降低。虽然60%的非定向事件表现出株高降低,但仅有3%的定向事件矮化(表8)。能育性提高和矮化降低导致用定向Cry2Ab载体的非矮化ECB1阳性事件的回收率显著提高(37%对8%)。总而言之,在转化研究中,必须产生并筛选4倍以上的非定向R0事件,以获得与用定向Cry2Ab载体所获得的正常ECB+R0事件数目相同的正常ECB+R0事件。
表8用非定向和定向Cry2Ab表达载体获得的能育、矮化和正常玉米植株的百分比比较载体 ECBLD+R0可育事件%b矮化%c正常、ECB1+%d事件数a非定向192 66 63 7定向 78 85 4 31aECB LD+R0事件数是ECB叶圆盘摄食测定阳性的R0事件数。
b产生有活力R1子代(种子)的ECBLD+R0事件%。
c矮化%是株型减小的ECB1阳性和适当分离事件的百分比。(非定向的总ECB1阳性和正确分离为38,而定向的为25).
d4)正常、ECB1+%是所获得的相对于筛选的ECB LD+R0事件总数的正常ECB+事件的百分比。5.3实施例3-Cry2Ab的质体定向提高转基因玉米中高水平欧洲玉米螟防治的频率也根据第二代欧洲玉米螟侵染(ECB2)的抗性,筛选先前描述的得自定向(pMON30464)和非定向(pMON30463或pMON26800)Cry2Ab表达载体的独立转化事件群体。为了促进这些研究,包括用Cry1Ab基因转化的商业上有效转基因玉米事件MON810(YieldgardTM)作为阳性对照。在田间试验中,基本上如所述方法(Armstrong等,1995)测试抗ECB2的功效。在1996年田间试验中,将18个独立的非定向pMON26800事件与MN810(Cry1Ab)相比。在这18个事件中,仅1个传递的ECB2保护既在统计学上不能与MON810区别,又显著低于非转基因阴性对照(表9中的事件UT1)。在1997年的田间试验中,与3个非定向事件(得自1996年试验的1个pMON30463事件和2个pMON26800事件)以及MON810平行测试了18个独立的定向事件(pMON30464)(表10)。18个定向pMON30464事件中的9个事件传递了既在统计学上不能与商业上有效的表达Cry1Ab的MON810(YieldgardTM)事件赋予的ECB2保护区别、又均显著低于非转基因阴性对照的ECB2损害的ECB2保护(表10)。
这些数据组表明,得自定向pMON30464载体的商业上有效的Cry2Ab系的绝对数目和频率均比得自非定向pMON26800载体高得多。18个定向Cry2Ab事件中的9个事件(50%)传递了既在统计学上不能与MON810 Cry1Ab的商业标准区别、又显著低于非转基因阴性对照的ECB2防治,而18个非定向Cry2Ab事件中的1个事件(6%)表现出既在统计学上不能与MON810 cry1Ab的商业标准区别、又显著低于非转基因阴性对照的ECB2防治。如若人们考虑到9个商业上有效的Cry2Ab事件得自总共78个ECB叶圆盘阳性R0植株,其回收率为11.5%,而仅3个商业上有效的Cry2Ab事件得自总共192个ECB叶圆盘摄食阳性R0,回收率为1.6%(得自表6的R0ECB数据),则定向Cry2Ab表达载体的优越性是尤其明显的。
表9在田间试验中非定向(UT)Cry2Ab转基因玉米相对于MON810Cry1Ab YieldgardTM转基因玉米中ECB2保护的比较事件 样品大小 茎蛀道(英寸)MON810(+对照)20 0.3aUT1 10 0.7aUT2 10 1.9aUT3 10 2.0aUT4 10 2.5bUT5 82.6bUT6 10 2.9bUT7 10 3.1bUT8 10 3.4bUT9 10 3.4bUT10 10 3.5bUT11 43.6b野生型 10 3.7bUT12 10 3.8bUT13 10 4.6bUT14 10 5.8bUT15 10 6.8bUT16 10 7.6cUT17 10 9.3cUT18 10 10.1ca,b以相同上标(a)标记的数值在预定比较中在P=0.05下在统计学上不能与MON810区别。具有上标(b)的数值在统计学上不同。茎蛀道数值显著高于Cry1Ab商品标准MON810的事件以粗体显示。所有事件的遗传背景均是相同的(B73×H99)。c,*以星号标记的数值在与阴性对照的预定比较中显著低于野生型非转基因阴性对照(P=0.05)。以上标(c)标记的数值在与阴性对照的预定比较中显著高于野生型非转基因阴性对照(P=0.05)。UT1-UT18非定向pMON26800事件#1-18。
表10在田间试验中定向(T)和非定向(UT)Cry2Ab转基因玉米相对于MON810 Cry1Ab YieldgardTM转基因玉米中ECB2保护的比较事件 样品大小茎蛀道(英寸)T1 9 0.6aT2 10 0.6aMON810(+对照)30 0.9aT3 14 1aT4 12 1.3aT5 7 1.4aUT1 10 1.6aT6 13 1.6aT7 11 1.6aT8 10 1.7aUT2 10 1.8aT9 10 2.4aT10 12 2.5bT11 7 2.6bT12 9 2.9bT13 10 3.2bT14 11 3.3bT15 10 3.5bT16 10 4.0bT17 10 4.3bUT3 8 4.8bT18 8 5.4b野生型(-对照)20 13.7ca,b,c以上标(a)标记的数值在预定比较中在P=0.05下在统计学上不能与MON810区别。具有上标的数值在统计学上不同。茎蛀道数值显著高于Cry1Ab商品标准MON810的事件以粗体显示;在与阴性对照的预定比较中(P=0.5)所有转基因事件均表现出蛀道显著小于野生型非转基因阴性对照。所有事件的遗传背景均是相同的(B73×H99)。T1-T18定向pMON30464事件#1-18。UT1-UT3非定向pMON30463和pMON26800事件#1-3。1997年田间试验中的UT1是与1996年田间试验中UT3相同的pMON26800事件。5.4实施例4-Cry2Ab蛋白的质体定向导致转基因棉花愈伤组织中表达增加比较了Cry2Ab蛋白在用质体定向和非定向Cry2Ab表达载体转化的棉花愈伤组织中的水平。在已经用质体定向基因转化的愈伤组织中Cry2Ab水平显著较高(表11)。
植物表达载体pMON33830含有一个Cry2Ab表达盒,该表达盒包含以下有效连接以在植物细胞中产生功能Cry2Ab蛋白的遗传元件一个增强的CaMV35S启动子、一个矮牵牛hsp705’非翻译前导序列、一个具有翻译起始密码子的合成cry2Ab基因(SEQ ID NO1)和一个得自根癌土壤杆菌胭脂碱合酶(NOS)基因的转录终止和聚腺苷酸化序列。
植物表达载体pMON33827(SEQ ID NO13)、pMON33828(SEQID O14)和pMON33829(SEQ ID NO15)含有类似于pMON33830中存在的Cry2Ab表达盒,只是每个载体中不同的叶绿体引导序列与所述合成cry2Ab基因N末端翻译上融合。pMON33827含有PTP1编码序列(SEQ ID NO5),该编码序列包含拟南芥ssRUBISCO(SSU)叶绿体引导序列和编码ssRUBISCO(SSU)蛋白前24个氨基酸的序列(Wong等,1992)。SEQ ID NO6代表PTP1引导肽序列。该肽含有完整的天然引导序列,包括质体引导肽切割位点与成熟RUBISCOSSU蛋白的前24个氨基酸,后者与含有RUBISCOSSU质体引导肽切割位点(SEQ IDNO6氨基酸位置80-87)的重复氨基酸(SEQ ID NO6氨基酸50-57)的序列顺序连接。为此PTP1含有一个重复质体引导肽切割位点。含有该PTP编码序列的多核苷酸盒于其3’端连接于一个NcoI限制位点,以便于插入与所述PTP编码序列符合读框地翻译的编码序列,例如编码Cry2Ab、Cry2Aa、这些序列的变体和其它有用的多肽编码序列。
pMON33828含有PTP1Δ(SEQ ID NO7)的编码序列,这是一种PTP1的修饰物,其中在所述两个转运肽切割位点之间的SSU的24个氨基酸通过用限制酶SphI切割而去除,SphI在每个拷贝的所述转运肽切割位点中切割一次,然后再连接,导致仅存在PTP1的转运肽部分,后接一个拷贝的转运肽切割位点和一个NcoI位点。PTP1Δ的肽序列命名为SEQ ID NO8。
pMON33829含有PTP2的编码序列(SEQ ID NO9),这是得自拟南芥EPSP合酶基因的转运肽序列。PTP2的肽序列命名为SEQ IDNO10。
所有上述植物转化表达载体也含有一个选择标记基因盒,赋予转化植物细胞卡那霉素抗性。
得自分别用pMON33827、pMON33828、pMON33829和pMON33830转化的12个随机选择的独立转基因事件的棉花愈伤组织,采用定量ELISA测定经过Cry2Ab蛋白水平的定量分析。这种ELISA采用使用针对Cry2Aa产生的单克隆捕获抗体和纯合Cry2Aa蛋白作为标准的直接夹层技术,所述单克隆捕获抗体是与作为第二抗体的碱性磷酸酶缀合的不同的Cry2Aa单克隆抗体。在定向和非定向愈伤组织中Cry2Ab表达水平的比较显示出当包括叶绿体引导序列时表达显著增加(表11)。当通过应用t检定测定与非定向Cry2Ab比较时,PTP1Δ提供显著更高的平均表达水平(t=2.31,p=0.03)。应用G检定测定,PTP2提供显著更高的获得表达较高水平Cry2Ab的愈伤组织系的可能性(G2/X2=5.6,p=0.02)。
表11在比较叶绿体定向和非定向cry2Ab基因的独立转化棉花愈伤组织系中的Cry2Ab水平棉花愈伤组织系 Cry2Ab ng/ml愈伤组织提取物非转化愈伤组织系10系20系30系40pMON33827,PTP1-cry2Ab基因系1464系261系30系425系50系6368系774系8101系920系10 652系11 0系12 0pMON33828,PTP1Δ-cry2Ab基因系1252系2235系30系4416系50系60系70系8101系9393系10 587系11 788系12 277pMON33829,PTP2-cry2Ab基因系160系20系32220系42036系50系638系7674系82440系915系1091系11290系1271pMON33830,cry2Ab基因系119系2166系347系420系533系647系7781系835系931系10 0系11 0系12 1365.5实施例5-将Cry2Aa蛋白导向质体导致转基因棉花愈伤组织中表达降低与上述实施例4相反,并且例证采用质体引导序列获得的表达增加对于特定的cry基因的特异性的,本发明人发现,上述相同的质体引导序列PTP1、PTP1Δ和PTP2导致转基因棉花愈伤组织中密切相关cry2Aa基因的表达水平显著降低(表12)。植物表达载体pMON33803含有一个cry2Aa表达盒,该表达盒含有一个有效连接以在植物细胞中产生功能Cry2Aa蛋白的以下遗传元件一个FMV35S启动子、一个矮牵牛热激HSP705’非翻译前导序列、一个具有一个翻译起始密码子和于5’端一个Nco限制酶位点的合成cry2Aa基因(SEQ ID NO11)和得自豌豆E9 SSU基因的转录终止和聚腺苷酸化序列。该Cry2Aa蛋白的肽序列命名为SQE ID NO12。pMON33812、pMON33811和pMON33806含有类似于pMON33803中存在的cry2Aa表达盒,只是在每个表达盒中不同的叶绿体引导序列(分别为PTP1、PTP1Δ和PTP2)与所述合成cry2Aa基因的N末端在转换(transitional)融合。所有这些载体也含有一个选择标记基因盒,赋予转化植物细胞草甘膦抗性。
得自分别用pMON33803、pMON33812、pMON33811和pMON33806转化的10个随机选择的独立转基因事件的棉花愈伤组织,采用定量Cry2ELISA测定经过Cry2Aa蛋白水平的定量分析。在定向和非定向愈伤组织中Cry2Aa表达水平的比较显示出当包括叶绿体引导序列时表达显著降低(表12)。当通过Tukey-Kramer HSD检定测定,非定向Cry2Aa基因赋予的表达水平显著不同于采用所述三种质体定向cry2Aa基因获得的表达水平(α=0.05)。
表12在比较叶绿体定向和非定向cry2Aa基因的独立转化棉花愈伤组织系中的Cry2Aa水平棉花愈伤组织系Cry2Aa ng/mL提取物非转化愈伤组织系1 0系2 0系3 0系4 0pMON33812,PTP1-Cry2Aa基因系1 29系2 32
系3 22系4 41系5 24系6 47系7 43系8 49系9 0系10 23pMON33811,PTP1Δ-Cry2Aa基因系1 0系2 59系3 48系4 72系5 29系6 37系7 44系8 32系9 20系10 0pMON33806,PTP2-Cry2Aa基因系1 27系2 0系3 10系4 84系5 205系6 0系7 13系8 6系9 0系10 8pMON33803,Cry2Aa基因系1 63系2 2278系3 181系4 3131系5 3752
系6 851系7 303系8 1365系9 1601系10 16485.6实施例6-将Cry2Aa蛋白导向质体导致转基因烟草植株中表达降低和植物毒性增加采用非定向cry2Aa植物表达载体pMON33803和叶绿体定向PTP2-cry2Aa植物表达载体pMON33806产生转化烟草植株。在等体积提取缓冲液中提取得自48株pMON33803植株和41株pMON33806植株的等重量叶片组织样品,并采用定量ELISA测定cry2Aa相对水平(表13)。这种ELISA采用使用针对Cry2Aa产生的多克隆捕获抗体和纯合的Cry2Aa蛋白作为标准的直接夹层技术,所述多克隆捕获抗体是与作为第二抗体的碱性磷酸酶缀合的同一多克隆抗体。
从高水平表达非定向Cry2Aa的转化回收的植株总数的比例,高于回收的高水平表达定向Cry2Aa的植株的比例。相反,从不能表达可检测定向Cry2Aa的转化回收的植株总数的比例高于回收的不能表达非定向Cry2Aa的植株的比例。所有具有可检测Cry2Aa表达水平的PTP2-Cry2Aa植株均表现出严重的异常表型;这些植株极度矮化,节间缩短,具有变形的皱叶并且不育。所有缺乏Cry2Aa表达的PTP2-Cry2Aa植株外表均正常。相反,仅某些高表达非定向Cry2Aa的植株表现出矮化表型。
表13在比较叶绿体定向和非定向cry2Aa基因的独立转化烟草植株中的Cry2Aa水平
5.7实施例7-用Cry2Ab基因转化烟草叶绿体可以产生其中仅线粒体或叶绿体DNA已经改变以掺入在该应用设想的分子的重组植物。在叶绿体中起作用的启动子是本领域已知的(Hanley-Bowden等,Trends in Biochemical Sciences 1267-70,1987)。获得含已经插入异源DNA的叶绿体的细胞的方法和组合物已经例如由Daniell等(美国专利第5,693,507;1997)和Maliga等(美国专利第5,451,513;1995)描述。可以构建含从中产生Cry2A蛋白的表达盒的载体。表达盒可以含有叶绿体有效的驱动cry2A晶体蛋白基因表达的启动子序列,其构建方式与本文其它多核苷酸大致相似,采用热扩增法,限制性内切核酸酶消化和连接等。叶绿体可表达基因将提供一个得自异源基因或叶绿体基因例如psbA的启动子和5’非翻译区,这将可供用于编码Cry2A蛋白的DNA序列在叶绿体中转录和翻译;一个编码Cry2A蛋白的DNA序列;和一个转录和翻译终止区,例如叶绿体基因的3’反向重复区,它可以稳定表达的cry2A mRNA。所述叶绿体中的表达将增强cry2A基因产物的积累。含叶绿体或质体的宿主细胞可以用所述表达盒转化,然后可以培养所产生的含转化叶绿体的细胞,以表达所述Cry2A蛋白。一个盒除含有所述cry2A基因外,也可以含有抗生素、除草剂耐受性或其它选择标记基因。所述表达盒可以邻接得自叶绿体DNA、能够促进特别是通过同源重组将所述表达盒稳定整合到叶绿体基因组中的DNA序列。或者,所述表达盒可以不整合,而是通过包括得自叶绿体DNA的复制起点,能够保证异源cry2A基因在叶绿体中复制。可以由含转化叶绿体的细胞产生植株,然后可以将其培养以产生种子,从所述种子可以产生另外的植株。这种转化法优于核基因组转化,特别是在通过整合到叶绿体基因组中实现叶绿体转化的情况下是有利的,因为叶绿体基因一般是母性遗传。这提供了环境上“安全的”转基因植物,事实上消除了逃逸到环境中的可能性。此外,可以转化叶绿体多次,以产生表达多种所需重组蛋白的功能性叶绿体基因组,而已经表明当需要多基因时核基因组转化相当有限。因此,采用叶绿体或质体转化避免了分离事件。与核基因组表达的植物不同,叶绿体或质体中的表达可以仅从一个启动子起始,并且继续通过多顺反子区以由一个mRNA产生多种肽。
所述表达盒将以构建其它植物转化载体的大致相同方式产生。可以将植物叶绿体有效DNA序列插入细菌质粒中并连接至表达所需基因产物例如Cry2A蛋白的DNA序列,以使Cry2A蛋白在叶绿体中产生,避免了核调节基因的核基因调节、加帽、剪接或聚腺苷酸化、或者叶绿体或质体引导序列的需要。包含或者合成构建或者为直接得自苏云金芽孢杆菌基因组或苏云金芽孢杆菌附加体型元件的天然基因的cry2A基因的表达盒,可以插入构建用于叶绿体或质体转化的载体中的限制位点中。该盒上游可以邻接叶绿体或质体功能性启动子,下游可以邻接叶绿体或质体功能性转录和翻译终止序列。所得的盒可以采用熟知的异源重组法掺入叶绿体或质体基因组中。
或者,可以通过采用自主复制型质粒或能够在叶绿体或质体中繁殖的其它载体获得叶绿体或质体转化。实现该方法的一个方法可能是利用叶绿体或质体复制起始所需的叶绿体或质体基因组的一部分,作为在转化叶绿体或质体中保持所述质粒或载体的工具。通过在也含有一个叶绿体或质体选择标记基因的标准细菌载体中随机克隆叶绿体或质体基因组,然后转化叶绿体或质体,并且在合适的选择培养基上选择转化细胞,可以容易地鉴定能够稳定复制叶绿体或质粒外遗传元件的序列。将本文所述的表达盒引入叶绿体或质体可复制外遗传元件中,将提供将Cry2A苏云金芽孢杆菌δ-内毒素定位至叶绿体或质体的有效方法。
6.0参考文献以下参考文献在其提供示例性方法或补充本文叙述的内容的其它细节的程度上,具体通过引用结合到本文中。
美国专利第4,535,060号;1985美国专利第4,554,101号;1985美国专利第4,683,195号;1987美国专利第4.683,202号;1987美国专利第4,757,011号;1988美国专利第4,769,06l号;1988美国专利第4,940,835号;1990美国专利第4,971,908号;1990美国专利第5,004,863号;1991
美国专利第5,015,580号;1991美国专利第5,023,179号;1991美国专利第5,225,341号;1993美国专利第5,264,364号;1993美国专利第5,276,269号;1994美国专利第5,322,687号;1994美国专利第5,338,433号;1994美国专利第5,349,124号;1994美国专利第5,378,619号;1995美国专利第5,384,253号;1995美国专利第5,416,011号;1995美国专利第5,424,412号;1995美国专利第5,451,513号;1995美国专利第5,463,175号;1995美国专利第5,482,852号;1996美国专利第5,491,288号;1996美国专利第5,500,365号;1996美国专利第5,508,468号;1996美国专利第5,569,834号;1996美国专利第5,689,052号;1997美国专利第5,693,507号;1997EPO 0120516WO 92/17591WO 95/24492Armstrong et al.,Plant Cell Rep.,9335-339,1990.Armstrong et al.,Crop Science,35(2)550-557,1995.Barton et al.,Plant Physiol.,851103-1109,1987.Benfey et al.,EMBO J.,82195-2202,1989.Bevan et al.,Nature,304184,1983.Callis et al.,Genes Dev.,11183-1200;1987.Cheng et al.,Proc.Natl.Acad.Sci.USA,96(6)2767-2772,1998.Dhir et al.,Plant Cell Rep.,10106-10;1991Diehn et al.,InGenetic Engineering,Ed. J.K.Setlow,Plenum Press,New York,NY,1883-99,1996.Donovan et al.,Mol.Gen.Genet.,214365-372,1988.Donovan et al.,Appl.Environ.Microbiol.,583921-3927,1992.English et al.,Insect.Biochem.Molec.Bio.,24(l0)1025-1026,(1994)Feinberg and Vogelstein,Anal.Biochem.,1326-13,1983.Fischhoff et al.,Bio/Technology,5807-813,1987.Frischauf et al.,Methods Enzymol.,153103-115,1987.Fromm et al.,Nature,319791-793,1986.Fromm et al.,Bio/Technology,8833-839,1990.Gould et al.,J.Cell Biol.,1052923-2931,1987.Hanley-Bowden et al.,Trends in Biochemical Sciences 1267-70;1987.Herrera-Estrella et al.,Nature,303209,1983.Hertig et al.,Plant Mol.Biol.,16171-174,1991.Hofte and Whiteley,Microbiol.Rev.,53(2)242-255,1989.Horsch et al.,Science,2271229-1231,1985.Horton et al.,Gene,7761-68,1989.Ishida et al.,Nat.Biotechnol.,14(6)745-750,1996.Kay et al.,Science,2361299-1302,1987.Keegstra and Olsen,Ann. Rev.Plant Physiol.Mol.Biol.,40471-501,1989.Klee et al.,Bio/Technology,3637-642,1985.Klee et al.,Mol.Gen.Genet.,210437-442,1987.Koehler and Ho,Plant Cell,2769-783,1990.Kozicl et al.,Bio/Technology,11194-200,1993.Lambert et al.,Appl.Environ.Microbiol.,6280-86,1996.Lee et al.,Science,2391288-1291,1988.Lindstrom et al.,Dev.Genet.,11160-7;1990.Macejak and Sarnow,Nature,35390-94,1991.MacIntosh et al.,J.Invert.Pathol.,56258-266,1990.Maliga,Trends in Biotechnology,11101-106,1993.McElroy et al.,Plant Cell,2163-171,1990.McGaughey and Whalon,Science,2581451-1455,1993.Nayak et al.,Proc.Natl.Acad.Sci.USA,94(6)2111-2116,1997.Odell et al.,Nature,313810-12;1985.Pelletier and Sonenberg,Nature,334320-325,1988.Perlak et al.,Bio/technology,8939-943,1990.Perlak et al.,Plant Molecular Biol.,22313-321,1993.R oush,Biocontrol Sci.Technol.,4501-516,1994,Russell et al.,Plant Cell Reports,1324-27,1993.Shelton et al.,J. Econ. Entomol.,86697-705,1993.Tang et al.,Appl.Environ.Microbiol,62564-569,1996.Tillmann et al.,EMBO J.,8(9)2463-2467,1989.Vaeck et al.,Nature,32833-37,1987.Vas il et al.,Plant Physiol.,911575-1579;1989.Vodkin etal.,Cell,341023-1031;1983.Widner et al.,J. Bacteriol.,171965-974;1989.Widner et al.(a),J. Bacteriol.,1722826-2832;1990.Winter et al.,Mol. Gen. Genet.,221 (2)315-319,1988.Wong et al.,Plant Molec.Biol.,2081-93,1992.Xu et al.,Plant Mol. Biol.,27237-248,1995.Yamamoto et al.,Plant Cell371-382,1991.
根据本说明书,可以在不进行过多试验的情况下可以进行并实现本文公开和要求保护的所有组合物和方法。虽然在优选实施方案方面描述了本发明的组合物和方法,但对本领域技术人员显而易见的是,在不偏离本发明概念、精神和范围的情况下可以将变体应用于所述组合物和方法,以及应用到本文所述方法的步骤和步骤顺序中。更具体地讲,显然化学上和生理上相关的某些因子可以取代本文所述的因子,而可以获得相同或相似结果。所有对本领域技术人员显而易见的这样的相似取代和修改均被认为在所附权利要求书限定的本发明的精神、范围和概念内。
序列表<110>David R.CorbinCharles P.Romano<120>转化植物以表达δ-内毒素的改进方法<130>38-21(13547)<140>申请号09/186,002<141>申请日11/04/98<160>18<170>FastSEQ for windows Version 3.0<210>1<211>1934<212>DNA<213>人工序列<220><223>完全合成的<400>1ccatggacaa ctccgtcctg aactctggtc gcaccaccat ctgcgacgcc tacaacgtcg 60cggcgcatga tccattcagc ttccagcaca agagcctcga cactgttcag aaggagtgga 120cggagtggaa gaagaacaac cacagcctgt acctggaccc catcgtcggc acggtggcca 180gcttccttct caagaaggtc ggctctctcg tcgggaagcg catcctctcg gaactccgca 240acctgatctt tccatctggc tccaccaacc tcatgcaaga catcctcagg gagaccgaga 300agtttctcaa ccagcgcctc aacactgata cccttgctcg cgtcaacgct gagctgacgg 360gtctgcaagc aaacgtggag gagttcaacc gccaagtgga caacttcctc aaccccaacc 420gcaatgcggt gcctctgtcc atcacttctt ccgtgaacac catgcaacaa ctgttcctca 480accgcttgcc tcagttccag atgcaaggct accagctgct cctgctgcca ctctttgctc 540aggctgccaa cctgcacctc tccttcattc gtgacgtgat cctcaacgct gacgagtggg 600gcatctctgc agccacgctg aggacctacc gcgactacct gaagaactac accagggact 660actccaacta ttgcatcaac acctaccagt cggccttcaa gggcctcaat acgaggcttc 720acgacatgct ggagttcagg acctacatgt tcctgaacgt gttcgagtac gtcagcatct 780ggtcgctctt caagtaccag agcctgctgg tgtccagcgg cgccaacctc tacgccagcg 840gctctggtcc ccaacaaact cagagcttca ccagccagga ctggccattc ctgtattcgt 900tgttccaagt caactccaac tacgtcctca acggcttctc tggtgctcgc ctctccaaca 960ccttccccaa cattgttggc ctccccggct ccaccacaac tcatgctctg cttgctgcca 1020gagtgaacta ctccggcggc atctcgagcg gcgacattgg tgcatcgccg ttcaaccaga 1080acttcaactg ctccacctrc ctgccgccgc tgctcacccc gttcgtgagg tcctggctcg 1140acagcggctc cgaccgcgag ggcgtggcca ccgtcaccaa ctggcaaacc gagtccttcg 1200agaccaccct tggcctccgg agcggcgcct tcacggcgcg tgggaattct aactacttcc 1260ccgactactt catcaggaac atctctggtg ttcctctcgt cgtccgcaac gaggacctcc 1320gccgtccact gcactacaac gagatcagga acatcgcctc tccgtccggg acgcccggag 1380gtgcaagggc gtacatggtg agcgtccata acaggaagaa caacatccac gctgtgcatg 1440agaacggctc catgatccac ctggcgccca atgattacac cggcttcacc atctctccaa 1500tccacgccac ccaagtgaac aaccagacac gcaccttcat ctccgagaag ttcggcaacc 1560agggcgactc cctgaggttc gagcagaaca acaccaccgc caggtacacc ctgcgcggca 1620acggcaacag ctacaacctg tacctgcgcg tcagctccat tggcaactcc accatcaggg 1680tcaccatcaa cgggagggtg tacacagcca ccaatgtgaa cacgacgacc aacaatgatg 1740gcgtcaacga caacggcgcc cgcttcagcg acatcaacat tggcaacgtg gtggccagca 1800gcaactccga cgtcccgctg gacaccaacg tgaccctgaa ctctggcacc cagttcgacc 1860tcatgaacat catgctggtg ccaactaaca tctcgccgct gtactgatag gagctctgat 1920ccccatggga attc 1934<210>2<211>634<212>PRT<213>苏云金芽孢杆菌<400>2Met Asp Asn Ser Val Leu Asn Ser Gly Arg Thr Thr Ile Cys Asp Ala1 5 10 15Tyr Asn Val Ala Ala His Asp Pro Phe Ser Phe Gln His Lys Ser Leu20 25 30Asp Thr Val Gln Lys Glu Trp Thr Glu TrP Lys Lys Asn Asn His Ser35 40 45Leu Tyr Leu Asp Pro Ile Val Gly Thr Val Ala Ser Phe Leu Leu Lys50 55 60Lys Val Gly Ser Leu Val Gly Lys Arg Ile Leu Ser Glu Leu Arg Asn65 70 75 80Leu Ile Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp Ile Leu Arg85 90 95Glu Thr Glu Lys Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala100 105 110Arg Val Asn Ala Glu Leu Thr Gly Leu Gln Ala Asn Val Glu Glu Phe115 120 125Asn Arg Gln Val Asp Asn Phe Leu Asn Pro Asn Arg Asn Ala Val Pro130 135 140Leu Ser Ile Thr Ser Ser Val Asn Thr Met Gln Gln Leu Phe Leu Asn145 150 155 160Arg Leu Pro Gln Phe Gln Met Gln Gly Tyr Gln Leu Leu Leu Leu Pro165 170 175Leu Phe Ala Gln Ala Ala Asn Leu His Leu Sar Phe Ile Arg Asp Val180 185 190Ile Leu Asn Ala Asp Glu Trp Gly Ile Ser Ala Ala Thr Leu Arg Thr195 200 205Tyr Arg Asp Tyr Leu Lys Asn Tyr Thr Arg Asp Tyr Ser Asn Tyr Cys210 215 220Ile Asn Thr Tyr Gln Ser Ala Phe Lys Gly Leu Asn Thr Arg Leu His225 230 235 240Asp Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Phe Glu Tyr245 250 255Val Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser Ser260 265 270Gly Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln Ser275 280 285Phe Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Val Asn290 295 300Ser Asn Tyr Val Leu Asn Gly Phe Ser Gly Ala Arg Leu Ser Asn Thr305 310 315 320Phe Pro Asn Ile Val Gly Leu Pro Gly Ser Thr Thr Thr His Ala Leu325 330 335Leu Ala Ala Arg Val Asn Tyr Ser Gly Gly Ile Ser Ser Gly Asp Ile340 345 350Gly Ala Ser Pro Phe Asn Gln Asn Phe Asn Cys Ser Thr Phe Leu Pro355 360 365Pro Leu Leu Thr Pro Phe Val Arg Ser Trp Leu Asp Ser Gly Ser Asp370 375 380Arg Glu Gly Val Ala Thr Val Thr Asn Trp Gln Thr Glu Ser Phe Glu385 390 395 400Thr Thr Leu Gly Leu Arg Ser Gly Ala Phe Thr Ala Arg Gly Asn Ser405 410 415Asn Tyr Phe Pro Asp Tyr Phe Ile Arg Asn Ile Ser Gly Val Pro Leu420 425 430Val Val Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Glu Ile435 440 445Arg Asn Ile Ala Ser Pro Ser Gly Thr Pro Gly Gly Ala Arg Ala Tyr450 455 460Met Val Ser Val His Asn Arg Lys Asn Asn Ile His Ala Val His Glu465 470 475 480Asn Gly Ser Met Ile His Leu Ala Pro Asn Asp Tyr Thr Gly Phe Thr485 490 495Ile Ser Pro Ile His Ala Thr Gln Val Asn Asn Gln Thr Arg Thr Phe500 505 510Ile Ser Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln515 520 525Asn Asn Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr530 535 540Asn Leu Tyr Leu Arg Val Ser Ser Ile Gly Asn Ser Thr Ile Arg Val545 550 555 560Thr Ile Asn Gly Arg Val Tyr Thr Ala Thr Asn Val Asn Thr Thr Thr565 570 575Asn Asn Asp Gly Val Asn Asp Asn Gly Ala Arg Phe Ser Asp Ile Asn580 585 590Ile Gly Asn Val Val Ala Ser Ser Asn Ser Asp Val Pro Leu Asp Ile595 600 605Asn Val Thr Leu Asn Ser Gly Thr Gln Phe Asp Leu Met Asn Ile Met610 615 620Leu Val Pro Thr Asn Ile Ser Pro Leu Tyr625 630<210>3<211>415<212>DNA<213>玉蜀黍<400>3tctagaggat cagcatggcg cccaccgtga tgatggcctc gtcggccacc gccgtcgctc 60cgttcctggg gctcaagtcc accgccagcc tccccgtcgc ccgccgctcc tccagaagcc 120tcggcaacgt cagcaacggc ggaaggatcc ggtgcatgca ggtaacaaat gcatcctagc 180tagtagttct ttgcattgca gcagctgcag ctagcgagtt agtaatagga agggaactga 240tgatccatgc atggactgat gtgtgttgcc catcccatcc catcccattt cccaaacgaa 300ccgaaaacac cgtactacgt gcaggtgtgg ccctacggca acaagaagtt cgagacgctg 360tcgtacctgc cgccgctgtc gaccggcggg cgcatccgct gcatgcaggc catgg 415<210>4<211>79<212>PRT<213>玉蜀黍<400>4Met Ala Pro Thr Val Met Met Ala Ser Ser Ala Thr Ala Val Ala Pro1 5 10 15Phe Leu Gly Leu Lys Ser Thr Ala Sar Leu Pro Val Ala Arg Arg Ser20 25 30Ser Arg Ser Leu Gly Asn Val Ser Asn Gly Gly Arg Ile Arg Cys Met35 40 45Gln Val Trp Pro Tyr Gly Asn Lys Lys Phe Glu Thr Leu Ser Tyr Leu50 55 60Pro Pro Leu Ser Thr Gly Gly Arg Ile Arg Cys Met Gln Ala Met65 70 75<210>5<211>268<212>DNA<213>人工序列<220><221>转运肽<222>1-267<223>PTP1的编码序列,包含拟南芥ssRUBISCO(SSU)叶绿体引导序列和编码ssRUBISCO(SSU)蛋白的前24个氨基酸的序列(Wong等,1992)<400>5atggcttcct ctatgctctc ttccgctact atggttgcct ctccggctca ggccactatg 60gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac 120aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggtgtggcct l80ccgattggaa agaagaagtt tgagactctc tcttaccttc ctgaccttac cgattccggt 240ggtcgcgtca actgcatgca ggccatgg 268<210>6<211>89<212>PRT<213>拟南芥<400>6Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Va1 Ala Ser Pro Ala1 5 10 15Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala20 25 30Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser35 40 45Asn Gly Gly Arg Val Asn Cys Met Gln Val Trp Pro Pro Ile Gly Lys50 55 60Lys Lys Phe Glu Thr Leu Ser Tyr Leu Pro Asp Leu Thr Asp Ser Gly65 70 75 80Gly Arg Val Asn Cys Met Gln Ala Met85<210>7<211>178<212>DNA<213>拟南芥<400>7atggcttcct ctatgctctc ttccgctact atffttgcct ctccggctca ggccactatg 60gtcgctcctt tcaacggact taagtcctcc gctgccttcc cagccacccg caaggctaac 120aacgacatta cttccatcac aagcaacggc ggaagagtta actgcatgca ggccatgg178<210>8<211>59<212>pRT<213>拟南芥<400>8Met Ala Ser Ser Met Leu Ser Ser Ala Thr Met Va1 Ala Ser Pro Ala1 5 10 15Gln Ala Thr Met Val Ala Pro Phe Asn Gly Leu Lys Ser Ser Ala Ala20 25 30Phe Pro Ala Thr Arg Lys Ala Asn Asn Asp Ile Thr Ser Ile Thr Ser35 40 45Asn Gly Gly Arg Val Asn Cys Meg Gln Ala Met50 55<210>9<211>240<212>DNA<213>拟南芥<400>9atggcgcaag ttagcagaat ctgcaatggt gtgcagaacc catctcttat ctccaatctc 60tcgaaatcca gtcaacgcaa atctccctta tcggtttctc tgaagacgca gcagcatcca 120cgagcttatc cgatttcgtc gtcgtgggga ttgaagaaga gtgggatgac gttaattggc 180tctgagcttc gtcctcttaa ggtcatgtct tctgtttcca cggcgtgcat gcttgccatg 240<210>10<211>80<212>PRT<213>拟南芥<400>10Met Ala Gln Val Ser Arg Ile Cys Asn Gly Val Gln Asn Pro Ser Leu1 5 10 15Ile Ser Asn Leu Ser Lys Ser Ser Gln Arg Lys Ser Pro Leu Ser Val20 25 30Ser Leu Lys Thr Gln Gln His Pro Arg Ala Tyr Pro Ile Ser Ser Ser35 40 45Trp Gly Leu Lys Lys Ser Gly Met Thr Leu Ile Gly Ser Glu Leu Arg50 55 60Pro Leu Lys Val Met Ser Ser Val Ser Thr Ala Cys Met Leu Ala Met65 70 75 80<210>11<211>1907<212>DNA<213>人工序列<220>完全合成的<223><400>11ccatggacaa caacgtcttg aactctggta gaacaaccat ctgcgacgca tacaacgtcg60tggctcacga tccattcagc ttcgaacaca agagcctcga cactattcag aaggagtgga 120tggaatggaa acgtactgac cactctctct acgtcgcacc tgtggttgga acagtgtcca 180gcttccttct caagaaggtc ggctctctca tcggaaaacg tatcttgtcc gaactctggg 240gtatcatctt tccatctggg tccactaatc tcatgcaaga catcttgagg gagaccgaac 300agtttctcaa ccagcgtctc aacactgata ccttggctag agtcaacgct gagttgatcg 360gtctccaagc aaacattcgt gagttcaacc agcaagtgga caacttcttg aatccaactc 420agaatcctgt gcctctttcc atcacttctt ccgtgaacac tatgcagcaa ctcttcctca 480acagattgcc tcagtttcag attcaaggct accagttgct ccttcttcca ctctttgctc 540aggctgccaa catgcacttg tccttcatac gtgacgtgat cctcaacgct gacgaatggg 600gaatctctgc agccactctt aggacataca gagactactt gaggaactac actcgtgatt 660actccaacta ttgcatcaac acttatcaga ctgcctttcg tggactcaat actaggcttc 720acgacatgct tgagttcagg acctacatgt tccttaacgt gtttgagtac gtcagcattt 780ggagtctctt caagtaccag agcttgatgg tgtcctctgg agccaatctc tacgcctctg 840gcagtggacc acagcaaact cagagcttca cagctcagaa ctggccattc ttgtatagct 900tgttccaagt caactccaac tacatcctca gtggtatctc tgggaccaga ctctccataa 960cctttcccaa cattggtgga cttccaggct ccactacaac ccatagcctt aactctgcca 1020gagtgaacta cagtggaggt gtcagctctg gattgattgg tgcaactaac ttgaaccaca 1080acttcaattg ctccaccgtc ttgccacctc tgagcacacc gtttgtgagg tcctggcttg 1140acagcggtac tgatcgcgaa ggagttgcta cctctacaaa ctggcaaacc gagtccttcc 1200aaaccactct tagccttcgg tgtggagctt tctctgcacg tgggaattca aactactttc 1260cagactactt cattaggaac atctctggtg ttcctctcgt catcaggaat gaagacctca 1320cccgtccact tcattacaac cagattagga acatcgagtc tccatccggt actccaggag 1380gtgcaagagc ttacctcgtg tctgtccata acaggaagaa caacatctac gctgccaacg 1440agaatggcac catgattcac cttgcaccag aagattacac tggattcacc atctctccaa 1500tccacgctac ccaagtgaac aatcagacac gcaccttcat ctccgaaaag ttcggaaatc 1560aaggtgactc cttgaggttc gagcaatcca acactaccgc taggtacact ttgagaggca 1620atggaaacag ctacaacctt tacttgagag ttagctccat tggtaactcc accatccgtg 1680ttaccatcaa cggacgtgtt tacacagtct ctaatgtgaa cactacaacg aacaatgatg 1740gcgttaacga caacggagcc agattcagcg acatcaacat tggcaacatc gtggcctctg 1800acaacactaa cgttactttg gacatcaatg tgaccctcaa ttctggaact ccatttgatc 1860tcatgaacat catgtttgtg ccaactaacc tccctccatt gtactaa 1907<210>12<211>634<212>pRT<213>苏云金芽孢杆菌<400>12Met Asp Asn Asn Val Leu Asn Ser Gly Arg Thr Thr Ile Cys Asp Ala1 5 10 15Tyr Asn Val Val Ala His Asp Pro Phe Ser Phe Glu His Lys Ser Leu20 25 30Asp Thr Ile Gln Lys Glu Trp Met Glu Trp Lys Arg Thr Asp His Ser35 40 45Leu Tyr Val Ala Pro Val Val Gly Thr Val Ser Ser Phe Leu Leu Lys50 55 60Lys Val Gly Ser Leu I1e Gly Lys Arg Ile Leu Ser Glu Leu Trp Gly65 70 75 80Ile Ile Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp Ile Leu Arg85 90 95Glu Thr Glu Gln Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala100 105 110Arg Val Asn Ala Glu Leu Ile Gly Leu Gln Ala Asn Ile Arg Glu Phe115 120 125Asn Gln Gln Val Asp Asn Phe Leu Asn Pro Thr Gln Asn Pro Val Pro130 135 140Leu Ser Ile Thr Ser Ser Val Asn Thr Met Gln Gln Leu Phe Leu Asn145 150 155 160Arg Leu Pro Gln Phe Gln Ile Gln Gly Tyr Gln Leu Leu Leu Leu Pro165 170 175Leu Phe Ala Gln Ala Ala Asn Met His Leu Ser Phe Ile Arg Asp Val180 185 190Ile Leu Asn Ala Asp Glu Trp Gly Ile Ser Ala Ala Thr Leu Arg Thr195 200 205Tyr Arg Asp Tyr Leu Arg Asn Tyr Thr Arg Asp Tyr Ser Asn Tyr Cys210 215 220Ile Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Thr Arg Leu His225 230 235 240Asp Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Phe Glu Tyr245 250 255Val Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Met Val Ser Ser260 265 270Gly Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln Ser275 280 285Phe Thr Ala Gln Asn Trp Pro Phe Leu Tyr Ser Leu Phe Gln Val Asn290 295 300Ser Asn Tyr Ile Leu Ser Gly Ile Ser Gly Thr Arg Leu Ser Ile Thr305 310 315 320Phe Pro ASn Ile Gly Gly Leu Pro Gly Ser Thr Thr Thr His Ser Leu325 330 335Asn Ser Ala Arg Val Asn Tyr Ser Gly Gly Val Ser ser Gly Leu Ile340 345 350Gly Ala Thr Asn Leu Asn His Asn Phe Asn Cys Ser Thr Val Leu Pro355 360 365Pro Leu Ser Thr Pro Phe Val Arg SerTrp Leu Asp Ser Gly Thr Asp370 375380Arg Glu Gly Val Ala Thr Ser Thr Asn Trp Gln Thr Glu Ser Phe Gln385 390 395 400Thr Thr Leu Ser Leu Arg Cys Gly Ala Phe Ser Ala Arg Gly Asn Ser405 410 415Asn Tyr Phe Pro Asp Tyr Phe Ile Arg Asn Ile Ser Gly Val Pro Leu420 425 430Val Ile Arg Asn Glu Asp Leu Thr Arg Pro Leu His Tyr Asn Gln Ile435 440 445Arg Asn Ile Glu Ser Pro Ser Gly Thr Pro Gly Gly Ala Arg Ala Tyr450 455 460Leu Val Ser Val His Asn Arg Lys Asn Asn Ile Tyr Ala Ala Asn Glu465 470 475 480Asn Gly Thr Met Ile His Leu Ala Pro Glu Asp Tyr Thr Gly Phe Thr485 490 495Ile Ser Pro Ile His Ala Thr Gln Val Asn Asn Gln Thr Arg Thr Phe500 505 510Ile Ser Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln515 520 525Ser Asn Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr530 535 540Asn Leu Tyr Leu Arg Val Ser Ser Ile Gly Asn Ser Thr Ile Arg Val545 550 555 560Thr Ile Asn Gly Arg Val Tyr Thr Val Ser Asn Val Asn Thr Thr Thr565 570 575Asn Asn Asp Gly Val Asn Asp Asn Gly Ala Arg Phe Ser Asp Ile Asn580 585 590Ile Gly Asn Ile Val Ala Ser Asp Asn Thr Asn Val Thr Leu Asp Ile595 600 605Asn Val Thr Leu Asn Ser Gly Thr Pro Phe Asp Leu Met Asn Ile Met610 615 620Phe Val Pro Thr Asn Leu Pro Pro Leu Tyr625 630<210>13<211>10339<212>DNA<213>人工序列<220><221>未确定<222>3687-3760;4382-4434<223>“n”=g,a、c或t<400>13ggccgcgtta actgcaggtc cgatgtgaga cggttcaaca aagggtaata tccggaaacc 60tcctcggatt ccattgccca gctatctgtc actttattgt gaagatagtg gaaaaggaag 120gtggctccta caaatgccat cattgcgata aaggaaaggc catcgttgaa gatgcctctg 180ccgacagtgg tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg 240ttccaaccac gtcttcaaag caagtggatt gatgtgatgg tccgatgtga gacttttcaa 300caaagggtaa tatccggaaa cctcctcgga ttccattgcc cagctatctg tcactttatt 360gtgaagatag tggaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag 420gccatcgttg aagatgcctc tgccgacagt ggtcccaaag atggaccccc acccacgagg 480agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat 540atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct 600atataaggaa gttcatttca tttggagagg acacagaaaa atttgctaca ttgtttcaca 660aacttcaaat attattcatt tatttgtcag ctttcaaact ctttgtttct tgtttgttga 720ttgagaatac aatggcttcc tctatgctct cttccgctac tatggttgcc tctccggctc 780aggccactat ggtcgctcct ttcaacggac ttaagtcctc cgctgccttc ccagccaccc 840gcaaggctaa caacgacatt acttccatca caagcaacgg cggaagagtt aactgcatgc 900aggtgtggcc tccgattgga aagaagaagt ttgagactct ctcttacctt cctgacctta 960ccgattccgg tggtcgcgtc aactgcatgc aggccatgga caactccgtc ctgaactctg 1020gtcgcaccac catctgcgac gcctacaacg tcgcggcgca tgatccattc agcttccagc 1080acaagagcct cgacactgtt cagaaggagt ggacggagtg gaagaagaac aaccacagcc 1140tgtacctgga ccccatcgtc ggcacggtgg ccagcttcct tctcaagaag gtcggctctc 1200tcgtcgggaa gcgcatcctc tcggaactcc gcaacctgat ctttccatct ggctccacca 1260acctcatgca agacatcctc agggagaccg agaagtttct caaccagcgc ctcaacactg 1320atacccttgc tcgcgtcaac gctgagctga cgggtctgca agcaaacgtg gaggagttca 1380accgccaagt ggacaacttc ctcaacccca accgcaatgc ggtgcctctg tccatcactt 1440cttccgtgaa caccatgcaa caactgttcc tcaaccgctt gcctcagttc cagatgcaag 1500gctaccagct gctcctgctg ccactctttg ctcaggctgc caacctgcac ctctccttca 1560ttcgtgacgt gatcctcaac gctgacgagt ggggcatctc tgcagccacg ctgaggacct 1620accgcgacta cctgaagaac tacaccaggg actactccaa ctattgcatc aacacctacc 1680agtcggcctt caagggcctc aatacgaggc ttcacgacat gctggagttc aggacctaca 1740tgttcctgaa cgtgttcgag tacgtcagca tctggtcgct cttcaagtac cagagcctgc 1800tggtgtccag cggcgccaac ctctacgcca gcggctctgg tccccaacaa actcagagct 1860tcaccagcca ggactggcca ttcctgtatt cgttgttcca agtcaactcc aactacgtcc 1920tcaacggctt ctctggtgct cgcctctcca acaccttccc caacattgtt ggcctccccg 1980gctccaccac aactcatgct ctgcttgctg ccagagtgaa ctactccggc ggcatctcga 2040gcggcgacat tggtgcatcg ccgttcaacc agaacttcaa ctgctccacc ttcctgccgc 2100cgctgctcac cccgttcgtg aggtcctggc tcgacagcgg ctccgaccgc gagggcgtgg 2160ccaccgtcac caactggcaa accgagtcct tcgagaccac ccttggcctc cggagcggcg 2220ccttcacggc gcgtgggaat tctaactact tccccgacta cttcatcagg aacatctctg 2280gtgttcctct cgtcgtccgc aacgaggacc tccgccgtcc actgcactac aacgagatca 2340ggaacatcgc ctctccgtcc gggacgcccg gaggtgcaag ggcgtacatg gtgagcgtcc 2400ataacaggaa gaacaacatc cacgctgtgc atgagaacgg ctccatgatc cacctggcgc 2460ccaatgatta caccggcttc accatctctc caatccacgc cacccaagtg aacaaccaga 2520cacgcacctt catctccgag aagttcggca accagggcga ctccctgagg ttcgagcaga 2580acaacaccac cgccaggtac accctgcgcg gcaacggcaa cagctacaac ctgtacctgc 2640gcgtcagctc cattggcaac tccaccatca gggtcaccat caacgggagg gtgtacacag 2700ccaccaatgt gaacacgacg accaacaatg atggcgtcaa cgacaacggc gcccgcttca 2760gcgacatcaa cattggcaac gtggtggcca gcagcaactc cgacgtcccg ctggacatca 2820acgtgaccct gaactctggc acccagttcg acctcatgaa catcatgctg gtgccaacta 2880acatctcgcc gctgtactga taggagctct gatccccatg ggaattcccg atcgttcaaa 2940catttggcaa taaagtttct taagattgaa tcctgttgcc ggtcttgcga tgattatcat 3000ataatttctg ttgaattacg tcaagcatgt aataattaac atgtaatgca tgacgttatt 3060tatgagatgg gtttttatga ttagagtccc gcaattatac atttaatacg cgatagaaaa 3120caaaatatag cgcgcaaact aggataaatt atcgcgcgcg gtgtcatcta tgttactaga 3180tcggggatat ccccggggcg gccgctcgag tggtggccgc atcgatcgtg aagtttctca 3240tctaagcccc catttggacg tgaatgtaga cacgtcgaaa taaagatttc cgaattagaa 3300taatttgttt attgctttcg cctataaata cgacggatcg taatttgtcg ttttatcaaa 3360atgtactttc attttataat aacgctgcgg acatctacat ttttgaattg aaaaaaaatt 3420ggtaattact ctttcttttt ctccatattg accatcatac tcattgctga tccatgtaga 3480tttcccggac atgaagccat ttacaattga atatatcctg ccgccgctgc cgctttgcac 3540ccggtggagc ttgcatgttg gtttctacgc agaactgagc cggttaggca gataatttcc 3600attgagaact gagccatgtg caccttcccc ccaacacggt gagcgacggg gcaacggagt 3660gatccacatg ggacttttcc tagcttnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn ccgggagggt tcgagaaggg 3780ggggcacccc ccttcggcgt gcgcggtcac gcgccagggc gcagccctgg ttaaaaacaa 3840ggtttataaa tattggttta aaagcaggtt aaaagacagg ttagcggtgg ccgaaaaacg 3900ggcggaaacc cttgcaaatg ctggattttc tgcctgtgga cagcccctca aatgtcaata 3960ggtgcgcccc tcatctgtca tcactctgcc cctcaagtgt caaggatcgc gcccctcatc 4020tgtcagtagt cgcgcccctc aagtgtcaat accgcagggc acttatcccc aggcttgtcc 4080acatcatctg tgggaaactc gcgtaaaatc aggcgttttc gccgatttgc gaggctggcc 4140agctccacgt cgccggccga aatcgagcct gcccctcatc tgtcaacgcc gcgccgggtg 4200agtcggcccc tcaagtgtca acgtccgccc ctcatctgtc agtgagggcc aagttttccg 4260cgtggtatcc acaacgccgg cggccggccg cggtgtctcg cacacggctt cgacggcgtt 4320tctggcgcgt ttgcagggcc atagacggcc gccagcccag cggcgagggc aaccagcccg 4380gnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnngtcgat 4440cgaccgatgc ccttgagagc cttcaaccca gtcagctcct tccggtgggc gcggggcatg 4500actatcgtcg ccgcacttat gactgtcttc tttatcatgc aactcgtagg acaggtgccg 4560gcagcgctct gggtcatttt cggcgaggac cgctttcgct ggagcgcgac gatgatcggc 4620ctgtcgcttg cggtattcgg aatcttgcac gccctcgctc aagccttcgt cactggtccc 4680gccaccaaac gtttcggcga gaagcaggcc attatcgccg gcatggcggc cgacgcgctg 4740ggctacgtct tgctggcgtt cgcgacgcga ggctggatgg ccttccccat tatgattctt 4800ctcgcttccg gcggcatcgg gatgcccgcg ttgcaggcca tgctgtccag gcaggtagat 4860gacgaccatc agggacagct tcaaggatcg ctcgcggctc ttaccagcct aacttcgatc 4920actggaccgc tgatcgtcac ggcgatttat gccgcctcgg cgagcacatg gaacgggttg 4980gcatggattg taggcgccgc cctatacctt gtctgcctcc ccgcgttgcg tcgcggtgca 5040tggagccggg ccacctcgac ctgaatggaa gccggcggca cctcgctaac ggattcacca 5100ctccaagaat tggagccaat caattcttgc ggagaactgt gaatgcgcaa accaaccctt 5160ggcagaacat atccatcgcg tccgccatct ccagcagccg cacgcggcgc atctcgggca 5220gcgttgggtc ctggccacgg gtgcgcatga tcgtgctcct gtcgttgagg acccggctag 5280gctggcgggg ttgccttact ggttagcaga atgaatcacc gatacgcgag cgaacgtgaa 5340gcgactgctg ctgcaaaacg tctgcgacct gagcaacaac atgaatggtc ttcggtttcc 5400gtgtttcgta aagtctggaa acgcggaagt cagcgccctg caccattatg ttccggatct 5460gcatcgcagg atgctgctgg ctaccctgtg gaacacctac atctgtatta acgaagcgct 5520ggcattgacc ctgagtgatt tttctctggt cccgccgcat ccataccgcc agttgtttac 5580cctcacaacg ttccagtaac cgggcatgtt catcatcagt aacccgtatc gtgagcatcc 5640tctctcgttt catcggtatc attaccccca tgaacagaaa ttccccctta cacggaggca 5700tcaagtgacc aaacaggaaa aaaccgccct taacatggcc cgctttatca gaagccagac 5760attaacgctt ctggagaaac tcaacgagct ggacgcggat gaacaggcag acatctgtga 5820atcgcttcac gaccacgctg atgagcttta ccgcagctgc ctcgcgcgtt tcggtgatga 5880cggtgaaaac ctctgacaca tgcagctccc ggagacggtc acagcttgtc tgtaagcgga 5940tgccgggagc agacaagccc gtcagggcgc gtcagcgggt gttggcgggt gtcggggcgc 6000agccatgacc cagtcacgta gcgatagcgg agtgtatact ggcttaacta tgcggcatca 6060gagcagattg tactgagagt gcaccatatg cggtgtgaaa taccgcacag atgcgtaagg 6120agaaaatacc gcatcaggcg ctcttccgct tcctcgctca ctgactcgct gcgctcggtc 6180gttcggctgc ggcgagcggt atcagctcac tcaaaggcgg taatacggtt atccacagaa 6240tcaggggata acgcaggaaa gaacatgtga gcaaaaggcc agcaaaaggc caggaaccgt 6300aaaaaggccg cgttgctggc gtttttccat aggctccgcc cccctgacga gcatcacaaa 6360aatcgacgct caagtcagag gtggcgaaac ccgacaggac tataaagata ccaggcgttt 6420ccccctggaa gctccctcgt gcgctctcct gttccgaccc tgccgcttac cggatacctg 6480tccgcctttc tcccttcggg aagcgtggcg ctttctcata gctcacgctg taggtatctc 6540agttcggtgt aggtcgttcg ctccaagctg ggctgtgtgc acgaaccccc cgttcagccc 6600gaccgctgcg ccttatccgg taactatcgt cttgagtcca acccggtaag acacgactta 6660tcgccactgg cagcagccac tggtaacagg attagcagag cgaggtatgt aggcggtgct 6720acagagttct tgaagtggtg gcctaactac ggctacacta gaaggacagt atttggtatc 6780tgcgctctgc tgaagccagt taccttcgga aaaagagttg gtagctcttg atccggcaaa 6840caaaccaccg ctggtagcgg tggttttttt gtttgcaagc agcagattac gcgcagaaaa 6900aaaggatctc aagaagatcc tttgatcttt tctacggggt ctgacgctca gtggaacgaa 6960aactcacgtt aagggatttt ggtcatgaga ttatcaaaaa ggatcttcac ctagatcctt 7020ttaaattaaa aatgaagttt taaatcaatc taaagtatat atgagtaaac ttggtctgac 7080agttaccaat gcttaatcag tgaggcacct atctcagcga tctgtctatt tcgttcatcc 7140atagttgcct gactccccgt cgtgtagata actacgatac gggagggctt accatctggc 7200cccagtgctg caatgatacc gcgagaccca cgctcaccgg ctccagattt atcagcaata 7260aaccagccag ccggaagggc cgagcgcaga agtggtcctg caactttatc cgcctccatc 7320cagtctatta attgttgccg ggaagctaga gtaagtagtt cgccagttaa tagtttgcgc 7380aacgttgttg ccattgctgc aggtcgggag cacaggatga cgcctaacaa ttcattcaag 7440ccgacaccgc ttcgcggcgc ggcttaattc aggagttaaa catcatgagg gaagcggtga 7500tcgccgaagt atcgactcaa ctatcagagg tagttggcgt catcgagcgc catctcgaac 7560cgacgttgct ggccgtacat ttgtacggct ccgcagtgga tggcggcctg aagccacaca 7620gtgatattga tttgctggtt acggtgaccg taaggcttga tgaaacaacg cggcgagctt 7680tgatcaacga ccttttggaa acttcggctt cccctggaga gagcgagatt ctccgcgctg 7740tagaagtcac cattgttgtg cacgacgaca tcattccgtg gcgttatcca gctaagcgcg 7800aactgcaatt tggagaatgg cagcgcaatg acattcttgc aggtatcttc gagccagcca 7860cgatcgacat tgatctggct atcttgctga caaaagcaag agaacatagc gttgccttgg 7920taggtccagc ggcggaggaa ctctttgatc cggttcctga acaggatcta tttgaggcgc 7980taaatgaaac cttaacgcta tggaactcgc cgcccgactg ggctggcgat gagcgaaatg 8040tagtgcttac gttgtcccgc atttggtaca gcgcagtaac cggcaaaatc gcgccgaagg 8100atgtcgctga agactgggca atggagcgcc tgccggccca gtatcagccc gtcatacttg 8160aagctaggca ggcttatctt ggacaagaag atcgcttggc ctcgcgcgca gatcagttgg 8220aagaatttgt tcactacgtg aaaggcgaga tcaccaaggt agtcggcaaa taatgtctaa 8280caattcgttc aagccgacgc cgcttcgcgg cgcggcttaa ctcaagcgtt agatgctgca 8340ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg ttcccaacga 8400tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc cttcggtcct 8460ccgatcgagg atttttcggc gctgcgctac gtccgckacc gcgttgaggg atcaagccac 8520agcagcccac tcgacctcta gccgacccag acgagccaag ggatcttttt ggaatgctgc 8580tccgtcgtca ggctttccga cgtttgggtg gttgaacaga agtcattatc gtacggaatg 8640ccaagcactc ccgaggggaa ccctgtggtt ggcatgcaca tacaaatgga cgaacggata 8700aaccttttca cgccctttta aatatccgtt attctaataa acgctctttt ctcttaggtt 8760tacccgccaa tatatcctgt caaacactga tagtttaaac tgaaggcggg aaacgacaat 8820ctgatcccca tcaagcttgg tcgagtggaa gctagcttcc cgatcctatc tgtcacttca 8880tcaaaaggac agtagaaaag gaaggtggca ctacaaatgc catcattgcg ataaaggaaa 8940ggctatcgtt caagatgcct ctgccgacag tggtcccaaa gatggacccc cacccacgag 9000gagcatcgtg gaaaaagaag acgttccaac cacgtcttca aagcaagtgg attgatgtga 9060tacttccact gacgtaaggg atgacgcaca atcccactat ccttcgcaag acccttcctc 9120tatataagga agttcatttc atttggagag gacacgctga aatcaccagt ctctctctac 9180aagatcgggg atctctagct agacgatcgt ttcgcatgat tgaacaagat ggattgcacg 9240caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca caacagacaa 9300tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg gttctttttg 9360tcaagaccga cctgtccggt gccctgaatg aactgcagga cgaggcagcg cggctatcgt 9420ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact gaagcgggaa 9480gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct caccttgctc 9540ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg cttgatccgg 9600ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt actcggatgg 9660aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc gcgccagccg 9720aactgttcgc caggctcaag gcgcgcatgc ccgacggcga ggatctcgtc gtgacccatg 9780gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga ttcatcgact 9840gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc cgtgatattg 9900ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt atcgccgctc 9960ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga gcgggactct10020ggggttcgat ccccaattcc cgatcgttca aacatttggc aataaagttt cttaagattg10080aatcctgttg ccggtcttgc gatgattatc atataatttc tgttgaatta cgttaagcat10140gtaataatta acatgtaatg catgacgtta tttatgagat gggtttttat gattagagtc10200ccgcaattat acatttaata cgcgatagaa aacaaaatat agcgcgcaaa ctaggataaa10260ttatcgcgcg cggtgtcatc tatgttacta gatcggggat cgggccactc gaccaagctt10320ctgcaggtcc tgctcgagc 10339<210>14<211>10249<212>DNA<213>人工序列<220><221>未确定<222>3597-3670;4292-4344<223>“n”=g、a、c或t<400>14ggccgcgtta actgcaggtc cgatgtgaga cttttcaaca aagggtaata tccggaaacc 60tcctcggatt ccattgccca gctatctgtc actttattgt gaagatagtg gaaaaggaag 120gtggctccta caaatgccat cattgcgata aaggaaaggc catcgttgaa gatgcctctg 180ccgacagtgg tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg 240ttccaaccac gtcttcaaag caagtggatt gatgtgatgg tccgatgtga gacttttcaa 300caaagggtaa tatccggaaa cctcctcgga ttccattgcc cagctatctg tcactttatt 360gtgaagatag tggaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag 420gccatcgttg aagatgcctc tgccgacagt ggtcccaaag atggaccccc acccacgagg 480agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga ttgatgtgat 540atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct 600atataaggaa gttcatttca tttggagagg acacagaaaa atgtgctaca ttgtttcaca 660aacttcaaat attattcatt tatttgtcag ctttcaaact ctttgtttct tgtttgttga 720ttgagaatac aatggcttcc tctatgctct cttccgctac tatggttgcc tctccggctc 780aggccactat ggtcgctcct ttcaacggac ttaagtcctc cgctgccttc ccagccaccc 840gcaaggctaa caacgacatt acttccatca caagcaacgg cggaagagtt aactgcatgc 900aggccatgga caactccgtc ctgaactctg gtcgcaccac catctgcgac gcctacaacg 960tcgcggcgca tgatccattc agcttccagc acaagagcct cgacactgtt cagaaggagt 1020ggacggagtg gaagaagaac aaccacagcc tgtacctgga ccccatcgtc ggcacggtgg 1080ccagcttcct tctcaagaag gtcggctctc tcgtcgggaa gcgcatcctc tcggaactcc 1140gcaacctgat ctttccatct ggctccacca acctcatgca agacatcctc agggagaccg 1200agaagtttct caaccagcgc ctcaacactg atacccttgc tcgcgtcaac gctgagctga 1260cgggtctgca agcaaacgtg gaggagttca accgccaagt ggacaacttc ctcaacccca 1320accgcaatgc ggtgcctctg tccatcactt cttccgtgaa caccatgcaa caactgttcc 1380tcaaccgctt gcctcagttc cagatgcaag gctaccagct gctcctgctg ccactctttg 1440ctcaggctgc caacctgcac ctctccttca ttcgtgacgt gatcctcaac gctgacgagt 1500ggggcatctc tgcagccacg ctgaggacct accgcgacta cctgaagaac tacaccaggg 1560actactccaa ctattgcatc aacacctacc agtcggcctt caagggcctc aatacgaggc 1620ttcacgacat gctggagttc aggacctaca tgttcctgaa cgtgttcgag tacgtcagca 1680tctggtcgct cttcaagtac cagagcctgc tggtgtccag cggcgccaac ctctacgcca 1740gcggctctgg tccccaacaa actcagagct tcaccagcca ggactggcca ttcctgtatt 1800cgttgttcca agtcaactcc aactacgtcc tcaacggctt ctctggtgct cgcctctcca 1860acaccttccc caacattgtt ggcctccccg gctccaccac aactcatgct ctgcttgctg 1920ccagagtgaa ctactccggc ggcatctcga gcggcgacat tggtgcatcg ccgttcaacc 1980agaacttcaa ctgctccacc ttcctgccgc cgctgctcac cccgttcgtg aggtcctggc 2040tcgacagcgg ctccgaccgc gagggcgtgg ccaccgtcac caactggcaa accgagtcct 2100tcgagaccac ccttggcctc cggagcggcg ccttcacggc gcgtgggaat tctaactact 2160tccccgacta cttcatcagg aacatctctg gtgttcctct cgtcgtccgc aacgaggacc 2220tccgccgtcc actgcactac aacgagatca ggaacatcgc ctctccgtcc gggacgcccg 2280gaggtgcaag ggcgtacatg gtgagcgtcc ataacaggaa gaacaacatc cacgctgtgc 2340atgagaacgg ctccatgatc cacctggcgc ccaatgatta caccggcttc accatctctc 2400caatccacgc cacccaagtg aacaaccaga cacgcacctt catctccgag aagttcggca 2460accagggcga ctccctgagg ttcgagcaga acaacaccac cgccaggtac accctgcgcg 2520gcaacggcaa cagctacaac ctgtacctgc gcgtcagctc cattggcaac tccaccatca 2580gggtcaccat caacgggagg gtgtacacag ccaccaatgt gaacacgacg accaacaatg 2640atggcgtcaa cgacaacggc gcccgcttca gcgacatcaa cattggcaac gtggtggcca 2700gcagcaactc cgacgtcccg ctggacatca acgtgaccct gaactctggc acccagttcg 2760acctcatgaa catcatgctg gtgccaacta acatctcgcc gctgtactga taggagctct 2820gatccccatg ggaattcccg atcgttcaaa catttggcaa taaagtttct taagattgaa 2880tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg ttaagcatgt 2940aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc 3000gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt 3060atcgcgcgcg gtgtcatcta tgttactaga tcggggatat ccccggggcg gccgctcgag 3120tggtggccgc atcgatcgtg aagtttctca tctaagcccc catttggacg tgaatgtaga 3180cacgtcgaaa taaagatttc cgaattagaa taatttgttt attgctttcg cctataaata 3240cgacggatcg taatttgtcg ttttatcaaa atgtactttc attttataat aacgctgcgg 3300acatctacat ttttgaattg aaaaaaaatt ggtaattact ctttcttttt ctccatattg 3360accatcatac tcattgctga tccatgtaga tttcccggac atgaagccat ttacaattga 3420atatatcctg ccgccgctgc cgctttgcac ccggtggagc ttgcatgttg gtttctacgc 3480agaactgagc cggttaggca gataatttcc attgagaact gagccatgtg caccttcccc 3540ccaacacggt gagcgacggg gcaacggagt gatccacatg ggacttttcc tagcttnnnn 3600nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3660nnnnnnnnnn ccgggagggt tcgagaaggg ggggcacccc ccttcggcgt gcgcggtcac 3720gcgccagggc gcagccctgg ttaaaaacaa ggtttataaa tattggttta aaagcaggtt 3780aaaagacagg ttagcggtgg ccgaaaaacg ggcggaaacc cttgcaaatg ctggattttc 3840tgcctgtgga cagcccctca aatgtcaata ggtgcgcccc tcatctgtca tcactctgcc 3900cctcaagtgt caaggatcgc gcccctcatc tgtcagtagt cgcgcccctc aagtgtcaat 3960accgcagggc acttatcccc aggcttgtcc acatcatctg tgggaaactc gcgtaaaatc 4020aggcgttttc gccgatttgc gaggctggcc agctccacgt cgccggccga aatcgagcct 4080gcccctcatc tgtcaacgcc gcgccgggtg agtcggcccc tcaagtgtca acgtccgccc 4140ctcatctgtc agtgagggcc aagttttccg cgtggtatcc acaacgccgg cggccggccg 4200cggtgtctcg cacacggctt cgacggcgtt tctggcgcgt ttgcagggcc atagacggcc 4260gccagcccag cggcgagggc aaccagcccg gnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 4320nnnnnnnnnn nnnnnnnnnn nnnngtcgat cgaccgatgc ccttgagagc cttcaaccca 4380gtcagctcct tccggtgggc gcggggcatg actatcgtcg ccgcacttat gactgtcttc 4440tttatcatgc aactcgtagg acaggtgccg gcagcgctct gggtcatttt cggcgaggac 4500cgctttcgct ggagcgcgac gatgatcggc ctgtcgcttg cggtattcgg aatcttgcac 4560gccctcgctc aagccttcgt cactggtccc gccaccaaac gtttcggcga gaagcaggcc 4620attatcgccg gcatggcggc cgacgcgctg ggctacgtct tgctggcgtt cgcgacgcga 4680ggctggatgg ccttccccat tatgattctt ctcgcttccg gcggcatcgg gatgcccgcg 4740ttgcaggcca tgctgtccag gcaggtagat gacgaccatc agggacagct tcaaggatcg 4800ctcgcggctc ttaccagcct aacttcgatc actggaccgc tgatcgtcac ggcgatttat 4860gccgcctcgg cgagcacatg gaacgggttg gcatggattg taggcgccgc cctatacctt 4920gtctgcctcc ccgcgttgcg tcgcggtgca tggagccggg ccacctcgac ctgaatggaa 4980gccggcggca cctcgctaac ggattcacca ctccaagaat tggagccaat caattcttgc 5040ggagaactgt gaatgcgcaa accaaccctt ggcagaacat atccatcgcg tccgccatct 5100ccagcagccg cacgcggcgc atctcgggca gcgttgggtc ctggccacgg gtgcgcatga 5160tcgtgctcct gtcgttgagg acccggctag gctggcgggg ttgccttact ggttagcaga 5220atgaatcacc gatacgcgag cgaacgtgaa gcgactgctg ctgcaaaacg tctgcgacct 5280gagcaacaac atgaatggtc ttcggtttcc gtgtttcgta aagtctggaa acgcggaagt 5340cagcgccctg caccattatg ttccggatct gcatcgcagg atgctgctgg ctaccctgtg 5400gaacacctac atctgtatta acgaagcgct ggcattgacc ctgagtgatt tttctctggt 5460cccgccgcat ccataccgcc agttgtttac cctcacaacg ttccagtaac cgggcatgtt 5520catcatcagt aacccgtatc gtgagcatcc tctctcgttt catcggtatc atcaccccca 5580tgaacagaaa ttccccctta cacggaggca tcaagtgacc aaacaggaaa aaaccgccct 5640taacatggcc cgctttatca gaagccagac attaacgctt ctggagaaac tcaacgagct 5700ggacgcggat gaacaggcag acatctgtga atcgcttcac gaccacgctg atgagcttta 5760ccgcagctgc ctcgcgcgtt tcggtgatga cggtgaaaac ctctgacaca tgcagctccc 5820ggagacggtc acagcttgtc tgtaagcgga tgccgggagc agacaagccc gtcagggcgc 5880gtcagcgggt gttggcgggt gtcggggcgc agccatgacc cagtcacgta gcgatagcgg 5940agtgtatact ggcttaacta tgcggcatca gagcagattg tactgagagt gcaccatatg 6000cggtgtgaaa taccgcacag atgcgtaagg agaaaatacc gcatcaggcg ctcttccgct 6060tcctcgctca ctgactcgct gcgctcggtc gttcggctgc ggcgagcggt atcagctcac 6120tcaaaggcgg taatacggtt atccacagaa tcaggggata acgcaggaaa gaacatgtga 6180gcaaaaggcc agcaaaaggc caggaaccgt aaaaaggccg cgttgctggc gtttttccat 6240aggctccgcc cccctgacga gcatcacaaa aatcgacgct caagtcagag gtggcgaaac 6300ccgacaggac tataaagata ccaggcgttt ccccctggaa gctccctcgt gcgctctcct 6360gttccgaccc tgccgcttac cggatacctg tccgcctttc tcccttcggg aagcgtggcg 6420ctttctcata gctcacgctg gaggtatctc agttcggtgt aggtcgttcg ctccaagctg 6480ggctgtgtgc acgaaccccc cgttcagccc gaccgctgcg ccttatccgg taactatcgt 6540cttgagtcca acccggtaag acacgactta tcgccactgg cagcagccac tggtaacagg 6600attagcagag cgaggtatgt aggcggtgct acagagttct tgaagtggtg gcctaactac 6660ggctacacta gaaggacagt atttggtatc tgcgctctgc tgaagccagt taccttcgga 6720aaaagagttg gtagctcttg atccggcaaa caaaccaccg ctggtagcgg tggttttttt 6780gtttgcaagc agcagattac gcgcagaaaa aaaggatctc aagaagatcc tttgatcttt 6840tctacggggt ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaga 6900ttatcaaaaa ggatcttcac ctagatcctt ttaaattaaa aatgaagttt taaatcaatc 6960taaagtatat atgagtaaac ttggtctgac agttaccaat gcttaatcag tgaggcacct 7020atctcagcga tctgtctatt tcgttcatcc atagttgcct gactccccgt cgtgtagata 7080actacgatac gggagggctt accatctggc cccagtgctg caatgatacc gcgagaccca 7140cgctcaccgg ctccagattt atcagcaata aaccagccag ccggaagggc cgagcgcaga 7200agtggtcctg caactttatc cgcctccatc cagtctatta attgttgccg ggaagctaga 7260gtaagtagtt cgccagttaa tagtttgcgc aacgttgttg ccattgctgc aggtcgggag 7320cacaggatga cgcctaacaa ttcattcaag ccgacaccgc ttcgcggcgc ggcttaattc 7380aggagttaaa catcatgagg gaagcggtga tcgccgaagt atcgactcaa ctatcagagg 7440tagttggcgt catcgagcgc catctcgaac cgacgttgct ggccgtacat ttgtacggct 7500ccgcagtgga tggcggcctg aagccacaca gtgatattga tttgctggtt acggtgaccg 7560taaggcttga tgaaacaacg cggcgagctt tgatcaacga ccttttggaa acttcggctt 7620cccctggaga gagcgagatt ctccgcgctg tagaagtcac cattgttgtg cacgacgaca 7680tcattccgtg gcgttatcca gctaagcgcg aactgcaatt tggagaatgg cagcgcaatg 7740acattcttgc aggtatcttc gagccagcca cgatcgacat tgatctggct atcttgctga 7800caaaagcaag agaacatagc gttgccttgg taggtccagc ggcggaggaa ctctttgatc 7860cggttcctga acaggatcta tttgaggcgc taaatgaaac cttaacgcta tggaactcgc 7920cgcccgactg ggctggcgat gagcgaaatg tagtgcttac gttgtcccgc atttggtaca 7980gcgcagtaac cggcaaaatc gcgccgaagg atgtcgctga agactgggca atggagcgcc 8040tgccggccca gtatcagccc gtcatacttg aagctaggca ggcttatctt ggacaagaag 8100atcgcttggc ctcgcgcgca gatcagttgg aagaatttgt tcactacg=g aaaggcgaga 8160tcaccaaggt agtcggcaaa taatgtctaa caattcgttc aagccgacgc cgcttcgcgg 8220cgcggcttaa ctcaagcgtt agatgctgca ggcatcgtgg tgtcacgctc gtcgtttggt 8280atggcttcat tcagctccgg ttcccaacga tcaaggcgag ttacatgatc ccccatgttg 8340tgcaaaaaag cggttagctc cttcggtcct ccgatcgagg attt=tcggc gctgcgctac 8400gtccgckacc gcgttgaggg atcaagccac agcagcccac tcgacctcta gccgacccag 8460acgagccaag ggatcttttt ggaatgctgc tccgtcgtca ggctttccga cgtttgggtg 8520gttgaacaga agtcattatc gtacggaatg ccaagcactc ccgaggggaa ccctgtggtt 8580ggcatgcaca tacaaatgga cgaacggata aaccttttca cgccctttta aatatccgtt 8640attctaataa acgctctttt ctcttaggtt tacccgccaa tatatcctgt caaacactga 8700tagtttaaac tgaaggcggg aaacgacaat ctgatcccca tcaagcttgg tcgagtggaa 8760gctagcttcc cgatcctatc cgtcacttca tcaaaaggac agtagaaaag gaaggtggca 8820ctacaaa=gc catcattgcg ataaaggaaa ggctatcgtt caagatgcct ccgccgacag 8880tggtcccaaa gatggacccc cacccacgag gagcatcgtg gaaaaagaag acgttccaac 8940cacgtcttca aagcaagtgg attgatgtga tacttccact gacgtaaggg atgacgcaca 9000atcccactat ccttcgcaag acccttcctc tatataagga agttcatttc atttggagag 9060gacacgctga aatcaccagt ctctctctac aagatcgggg atctctagct agacgatcgt 9120ttcgcatgat tgaacaagat ggattgcacg caggttctcc ggccgcttgg gtggagaggc 9180tattcggcta tgactgggca caacagacaa tcggctgctc tgatgccgcc gtgttccggc 9240tgtcagcgca ggggcgcccg gttctttttg tcaagaccga cctgtccggt gccctgaatg 9300aactgcagga cgaggcagcg cggctatcgt ggctggccac gacgggcgtt ccttgcgcag 9360ctgtgctcga cgttgtcact gaagcgggaa gggactggct gctattgggc gaagtgccgg 9420ggcaggatct cctgtcatct caccttgctc ctgccgagaa agtatccatc atggctgatg 9480caatgcggcg gctgcatacg cttgatccgg ctacctgccc attcgaccac caagcgaaac 9540atcgcatcga gcgagcacgt actcggatgg aagccggtct tgtcgatcag gatgatctgg 9600acgaagagca tcaggggctc gcgccagccg aactgttcgc caggctcaag gcgcgcatgc 9660ccgacggcga ggatctcgtc gtgacccatg gcgatgcctg cttgccgaat atcatggtgg 9720aaaatggccg cttttctgga ttcatcgact gtggccggct gggtgtggcg gaccgctatc 9780aggacatagc gttggctacc cgtgatattg ctgaagagct tggcggcgaa tgggctgacc 9840gcttcctcgt gctttacggt atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc 9900ttcttgacga gttcttctga gcgggactct ggggttcgat ccccaattcc cgatcgttca 9960aacatttggc aataaagttt cttaagattg aatcctgttg ccggtcttgc gatgattatc 10020atataatttc tgttgaatta cgttaagcat gtaataatta acatgtaatg catgacgtta 10080tttatgagat gggtttttat gattagagtc ccgcaattat acatttaaca cgcgatagaa 10140aacaaaatat agcgcgcaaa ctaggataaa ttatcgcgcg cggtgtcatc tatgttacta 10200gatcggggat cgggccactc gaccaagctt ctgcaggtcc tgctcgagc 10249<210>15<211>10312<212>DNA<213>人工序列<220><221>来确定<222>3660-3773;4355-4407<223>“n”=g、a、c或t<400>15ggccgcgtta actgcaggtc cgatgtgaga cttttcaaca aagggtaata tccggaaacc 60tcctcggatt ccattgccca gctatctgtc actttattgt gaagatagtg gaaaaggaag 120gtggctccta caaatgccat cattgcgata aaggaaaggc catcgtcgaa gatgcctctg 180ccgacagtgg tcccaaagat ggacccccac ccacgaggag catcgtggaa aaagaagacg 240ttccaaccac gtcttcaaag caagtggatt gatgtgatgg tccgatgtga gacttttcaa 300caaagggtaa tatccggaaa cctcctcgga ttccattgcc cagctatctg tcactttatt 360gtgaagatag tggaaaagga aggtggctcc tacaaatgcc atcattgcga taaaggaaag 420gccatcgttg aagatgcctc tgccgacagt ggtcccaaag atggaccccc acccacgagg 480agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagcgga ttgatgtgat 540atctccactg acgtaaggga tgacgcacaa tcccactatc cttcgcaaga cccttcctct 600atataaggaa gttcatttca tttggagagg acacagaaaa atttgctaca ttgtttcaca 660aacttcaaat attattcatt tatttgtcag ctttcaaact ctttgtttct tgtttgttga 720ttgagaatac aatggcgcaa gttagcagaa tctgcaatgg tgtgcagaac ccatctctta 780tctccaatct ctcgaaatcc agtcaacgca aatctccctt atcggtttct ctgaagacgc 840agcagcatcc acgagcttat ccgatttcgt cgtcgtgggg attgaagaag agtgggatga 900cgttaattgg ctctgagctt cgtcctctta aggtcatgtc ttctgtttcc acggcgtgca 960tgcttgccat ggacaactcc gtcctgaact ctggtcgcac caccatctgc gacgcctaca 1020acgtcgccgc gcatgatcca ttcagcttcc agcacaagag cctcgacact gttcagaagg 1080agtggacgga gtggaagaag aacaaccaca gcctgtacct ggaccccatc gtcggcacgg 1140tggccagctt ccttctcaag aaggtcggct ctctcgtcgg gaagcgcatc ctctcggaac 1200tccgcaacct gatctttcca tctggctcca ccaacctcat gcaagacatc ctcagggaga 1260ccgagaagtt tctcaaccag cgcctcaaca ctgataccct tgctcgcgtc aacgctgagc 1320tgacgggtct gcaagcaaac gtggaggagt tcaaccgcca agtggacaac ttcctcaacc 1380ccaaccgcaa tgcggtgcct ctgtccatca cttcttccgt gaacaccatg caacaactgt 1440tcctcaaccg cttgcctcag ttccagatgc aaggctacca gctgctcctg ctgccactct 1500ttgctcaggc tgccaacctg cacctctcct tcattcgtga cgtgatcctc aacgctgacg 1560agtggggcat ctctgcagcc acgctgagga cctaccgcga ctacctgaag aactacacca 1620gggactactc caactattgc atcaacacct accagtcggc cttcaagggc ctcaatacga 1680ggcttcacga catgctggag ttcaggacct acatgttcct gaacgtgttc gagtacgtca 1740gcatctggtc gctcttcaag taccagagcc tgctggtgtc cagcggcgcc aacctctacg 1800ccagcggctc tggtccccaa caaactcaga gcttcaccag ccaggactgg ccattcctgt 1860attcgttgtt ccaagtcaac tccaactacg tcctcaacgg cttctctggt gctcgcctct 1920ccaacacctt ccccaacatt gttggcctcc ccggctccac cacaactcat gctctgcttg 1980ctgccagagt gaactactcc ggcggcatct cgagcggcga cattggtgca tcgccgttca 2040accagaactt caactgctcc accttcctgc cgccgctgct caccccgttc gtgaggtcct 2100ggctcgacag cggctccgac cgcgagggcg tggccaccgt caccaactgg caaaccgagt 2160ccttcgagac cacccttggc ctccggagcg gcgccttcac ggcgcgtggg aattctaact 2220acttccccga ctacttcatc aggaacatct ctggtgttcc tctcgtcgtc cgcaacgagg 2280acctccgccg tccactgcac tacaacgaga tcaggaacat cgcctctccg tccgggacgc 2340ccggaggtgc aagggcgtac atggtgagcg tccataacag gaagaacaac atccacgctg 2400tgcatgagaa cggctccatg atccacctgg cgcccaatga ttacaccggc ttcaccatct 2460ctccaatcca cgccacccaa gtgaacaacc agacacgcac cttcatctcc gagaagttcg 2520gcaaccaggg cgactccctg aggttcgagc agaacaacac caccgccagg tacaccctgc 2580gcggcaacgg caacagctac aacctgtacc tgcgcgtcag ctccattggc aactccacca 2640tcagggtcac catcaacggg agggtgtaca cagccaccaa tgtgaacacg acgaccaaca 2700atgatggcgt caacgacaac ggcgcccgct tcagcgacat caacattggc aacgtggtgg 2760ccagcagcaa ctccgacgtc ccgctggaca tcaacgtgac cctgaactct ggcacccagt 2820tcgacctcat gaacatcatg ctggtgccaa ctaacatctc gccgctgtac tgataggagc 2880tctgatcccc atgggaattc ccgatcgttc aaacatttgg caataaagtt tcttaagatt 2940gaatcctgtt gccggtcttg cgatgattat catataattt ctgttgaatt acgttaagca 3000tgtaataatt aacatgtaat gcatgacgtt atttatgaga tgggttttta tgattagagt 3060cccgcaatta tacatttaat acgcgataga aaacaaaata tagcgcgcaa actaggataa 3120attatcgcgc gcggtgtcat ctatgttact agatcgggga tatccccggg gcggccgctc 3180gagtggtggc cgcatcgatc gtgaagtttc tcatctaagc ccccatttgg acgtgaatgt 3240agacacgtcg aaataaagat ttccgaatta gaataatttg tttattgctt tcgcctataa 3300atacgacgga tcgtaatttg tcgttttatc aaaatgtact ttcattttat aataacgctg 3360cggacatcta catttttgaa ttgaaaaaaa attggtaatt actctttctt tttctccata 3420tcgaccatca tactcattgc tgatccatgt agatttcccg gacatgaagc catttacaat 3480tgaatatatc ctgccgccgc tgccgctttg cacccggtgg agcttgcatg ttggtttcta 3540cgcagaactg agccggttag gcagataatt tccattgaga actgagccat gtgcaccttc 3600cccccaacac ggtgagcgac ggggcaacgg agtgatccac atgggacttt tcctagcttn 3660nnnnnnnnnn nnnnnnnnnn nnnrnnnnnn nnnnnnnnnn nnnnnnnnnn nnnnnnnnnn 3720nnnnnnnnnn nnnccgggag ggttcgagaa gggggggcac cccccttcgg cgtgcgcggt 3780cacgcgccag ggcgcagccc tggttaaaaa caaggtttat aaatattggt ttaaaagcag 3840gttaaaagac aggttagcgg tggccgaaaa acgggcggaa acccttgcaa atgctggatt 3900ttctgcctgt ggacagcccc tcaaatgtca ataggtgcgc ccctcatctg tcatcactct 3960gcccctcaag tgtcaaggat cgcgcccctc atctgtcagt agtcgcgccc ctcaagtgtc 4020aataccgcag ggcacttatc cccaggcttg tccacatcat ctgtgggaaa ctcgcgtaaa 4080atcaggcgtt ttcgccgatt tgcgaggctg gccagctcca cgtcgccggc cgaaatcgag 4140cctgcccctc atctgtcaac gccgcgccgg gtgagtcggc ccctcaagtg tcaacgtccg 4200cccctcatct gtcagtgagg gccaagtttt ccgcgtggta tccacaacgc cggcggccgg 4260ccgcggtgtc tcgcacacgg cttcgacggc gtttctggcg cgtttgcagg gccatagacg 4320gccgccagcc cagcggcgag ggcaaccagc ccggnnnnnn nnnnnnnnnn nnnnnnnnnn 4380nnnnnnnnnn nnnnnnnnnn nnnnnnngtc gatcgaccga tgcccttgag agccttcaac 4440ccagtcagct ccttccggtg ggcgcggggc atgactatcg tcgccgcact tacgactgtc 4500ttctttatca tgcaactcgt aggacaggtg ccggcagcgc tctgggtcat tttcggcgag 4560gaccgctttc gctggagcgc gacgatgatc ggcctgtcgc ttgcggtatt cggaatcttg 4620cacgccctcg ctcaagcctt cgtcactggt cccgccacca aacgtttcgg cgagaagcag 4680gccattatcg ccggcatggc ggccgacgcg ctgggctacg tcttgctggc gttcgcgacg 4740cgaggctgga tggccttccc cattatgatt cttctcgctt ccggcggcat cgggatgccc 4800gcgttgcagg ccatgctgtc caggcaggta gatgacgacc atcagggaca gcttcaagga 4860tcgctcgcgg ctcttaccag cctaacttcg atcactggac cgctgatcgt cacggcgatt 4920tatgccgcct cggcgagcac atggaacggg ttggcatgga ttgtaggcgc cgccctatac 4980cttgtctgcc tccccgcgtt gcgtcgcggt gcatggagcc gggccacctc gacctgaatg 5040gaagccggcg gcacctcgct aacggattca ccactccaag aattggagcc aatcaattct 5100tgcggagaac tgtgaatgcg caaaccaacc cttggcagaa catatccatc gcgtccgcca 5160tctccagcag ccgcacgcgg cgcatctcgg gcagcgttgg gtcctggcca cgggtgcgca 5220tgatcgtgct cctgtcgttg aggacccggc taggctggcg gggttgcctt actggttagc 5280agaatgaatc accgatacgc gagcgaacgt gaagcgactg ctgctgcaaa acgtctgcga 5340cctgagcaac aacatgaatg gtcttcggtt tccgtgtttc gtaaagtctg gaaacgcgga 5400agtcagcgcc ctgcaccatt atgttccgga tctgcatcgc aggatgctgc tggctaccct 5460gtggaacacc tacatctgta ttaacgaagc gctggcattg accctgagtg atttttctct 5520ggtcccgccg catccatacc gccagttgtt taccctcaca acgttccagt aaccgggcat 5580gttcatcatc agtaacccgt atcgtgagca tcctctctcg tttcatcggt atcattaccc 5640ccatgaacag aaattccccc ttacacggag gcatcaagtg accaaacagg aaaaaaccgc 5700ccttaacatg gcccgcctta tcagaagcca gacattaacg cttctggaga aactcaacga 5760gctggacgcg gatgaacagg cagacatctg tgaatcgctt cacgaccacg ctgatgagct 5820ttaccgcagc tgcctcgcgc gtttcggtga tgacggtgaa aacctctgac acatgcagct 5880cccggagacg gtcacagctt gtctgtaagc ggatgccggg agcagacaag cccgtcaggg 5940cgcgtcagcg ggtgttggcg ggtgtcgggg cgcagccatg acccagtcac gtagcgatag 6000cggagtgtat actggcttaa ctatgcggca tcagagcaga ttgtactgag agtgcaccat 6060atgcggtgtg aaataccgca cagatgcgta aggagaaaat accgcatcag gcgctcttcc 6120gcttcctcgc tcactgactc gctgcgctcg gtcgttcggc tgcggcgagc ggtatcagct 6180cactcaaagg cggtaatacg gttatccaca gaatcagggg ataacgcagg aaagaacatg 6240tgagcaaaag gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc 6300cataggctcc gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga 6360aacccgacag gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct 6420cctgttccga ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg 6480gcgctttctc atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag 6540ctgggctgtg tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat 6600cgtcttgagt ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac 6660aggattagca gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac 6720tacggctaca ctagaaggac agtatttggt atctgcgctc tgctgaagcc agttaccttc 6780ggaaaaagag ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt 6840tttgtttgca agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc 6900ttttctacgg ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg 6960agattatcaa aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca 7020atctaaagta tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca 7080cctatctcag cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag 7140ataactacga tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagac 7200ccacgctcac cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc 7260agaagtggtc ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct 7320agagtaagta gttcgccagt taatagtttg cgcaacgttg ttgccattgc tgcaggtcgg 7380gagcacagga tgacgcctaa caattcattc aagccgacac cgcttcgcgg cgcggcttaa 7440ttcaggagtt aaacatcatg agggaagcgg tgatcgccga agtatcgact caactatcag 7500aggtagttgg cgtcatcgag cgccatctcg aaccgacgtt gctggccgta catttgtacg 7560gctccgcagt ggatggcggc ctgaagccac acagtgatat tgatttgctg gttacggtga 7620ccgtaaggct tgatgaaaca acgcggcgag ctttgatcaa cgaccttttg gaaacttcgg 7680cttcccctgg agagagcgag attctccgcg ctgtagaagt caccattgtt gtgcacgacg 7740acatcattcc gtggcgttat ccagctaagc gcgaactgca atttggagaa tggcagcgca 7800atgacattct tgcaggtatc ttcgagccag ccacgatcga cattgatctg gctatcttgc 7860tgacaaaagc aagagaacat agcgttgcct tggtaggtcc agcggcggag gaactctttg 7920atccggttcc tgaacaggat ctatttgagg cgctaaatga aaccttaacg ctatggaact 7980cgccgcccga ctgggctggc gatgagcgaa atgtagtgct tacgttgtcc cgcatttggt 8040acagcgcagt aaccggcaaa atcgcgccga aggatgtcgc tgaagactgg gcaatggagc 8100gcctgccggc ccagtatcag cccgtcatac ttgaagccag gcaggcccac cttggacaag 8160aagaccgctt ggcctcgcgc gcagatcagt tggaagaatt tgttcaccac gcgaaaggcg 8220agatcaccaa ggtagtcggc aaataatgtc taacaattcg ttcaagccga cgccgcttcg 8280cggcgcggct taactcaagc gttagatgct gcaggcatcg tggtgtcacg ctcgtcgttt 8340ggtatggctt cattcagctc cggttcccaa cgatcaaggc gagttacatg atcccccatg 8400ttgtgcaaaa aagcggttag ctccttcggt cctccgatcg aggatttttc ggcgctgcgc 8460tacgtccgck accgcgttga gggatcaagc cacagcagcc cactcgacct ctagcggacc 8520cagacgagcc aagggatctt tttggaatgc tgctccgtcg tcaggctttc cgacgtttgg 8580gcggttgaac agaagtcatt atcgtacgga atgccaagca ctcccgaggg gaaccccgtg 8640gttggcatgc acatacaaat ggacgaacgg ataaaccttt tcacgccctt ttaaatatcc 8700gttattctaa taaacgctct tttctcttag gtttacccgc caatatatcc tgtcaaacac 8760tgatagttta aactgaaggc gggaaacgac aatctgatcc ccatcaagct tggtcgagtg 8820gaagctagct tcccgatcct atctgtcact tcatcaaaag gacagtagaa aaggaaggtg 8880gcactacaaa tgccatcatt gcgataaagg aaaggctatc gttcaagatg cctctgccga 8940cagtggtccc aaagatggac ccccacccac gaggagcatc gtggaaaaag aagacgttcc 9000aaccacgtct tcaaagcaag tggattgatg tgatacttcc actgacgtaa gggatgacgc 9060acaatcccac tatccttcgc aagacccttc ctctatataa ggaagttcat ttcatttgga 9120gaggacacgc tgaaatcacc agtctctctc tacaagatcg gggatctcta gctagacgat 9180cgtttcgcat gattgaacaa gatggattgc acgcaggttc tccggccgct tgggtggaga 9240ggctattcgg ctatgactgg gcacaacaga caatcggctg ctctgatgcc gccgtgttcc 9300ggctgtcagc gcaggggcgc ccggttcttt ttgtcaagac cgacctgtcc ggtccctga 9360atgaactgca ggacgaggca gcgcggctat cgtggctggc cacgacgggc gttccttgcg 9420cagctgtgct cgacgttgtc actgaagcgg gaagggactg gctgctattg ggcgaagtgc 9480cggggcagga tctcctgtca tctcaccttg ctcctgccga gaaagtatcc atcatggctg 9540atgcaatgcg gcggctgcat acgcttgatc cggctacctg cccattcgac caccaagcga 9600aacatcgcat cgagcgagca cgtactcgga tggaagccgg tcttgtcgat caggatgatc 9660tggacgaaga gcatcagggg ctcgcgccag ccgaactgtt cgccaggctc aaggcgcgca 9720tgcccgacgg cgaggatctc gtcgtgaccc atggcgatgc ctgcttgccg aatatcatgg 9780tggaaaatgg ccgcttttct ggattcatcg actgtggccg gctgggtgtg gcggaccgct 9840atcaggacat agcgttggct acccgtgata ttgctgaaga gcttggcggc gaatgggctg 9900accgcttcct cgtgctttac ggtatcgccg ctcccgattc gcagcgcatc gccttctatc 9960gccttcttga cgagttcttc tgagcgggac tctggggttc gatccccaat tcccgatcgt10020tcaaacattt ggcaataaag tttcttaaga ttgaatcctg ttgccggtct tgcgatgatt10080atcatataat ttctgttgaa ttacgttaag catgtaataa ttaacatgta atgcatgacg10140ttatttatga gatgggtttt tatgattaga gtcccgcaat tatacattta atacgcgata10200gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc gcgcggtgtc atctatgtta10260ctagatcggg gatcgggcca ctcgaccaag cttctgcagg tcctgctcga gc10312<210>16<211>8349<212>DNA<213>人工序列<220><221>基因<222>3666-5573<223>完全合成的<400>16gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag ctggcgaaag 60ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag tcacgacgtt 120gtaaaacgac ggccagtgaa ttgcggccac gcgtggtacc aagcttcccg atcctatctg 180tcacttcatc aaaaggacag tagaaaagga aggtggcacc tacaaatgcc atcattgcga 240taaaggaaag gctatcattc aagatgcctc tgccgacagt ggtcccaaag atggaccccc 300acccacgagg agcatcgtgg aaaaagaaga cgttccaacc acgtcttcaa agcaagtgga 360ttgatgtgat acttccactg acgtaaggga atgacgcaca atcccactat ccttcgcaag 420acccttcctc tatataagga agttcatttc atttggagag gacacgctga aatcaccagt 480ctctctctac aagatcgggg atctctagct agacgatcgt ttcgcatgat tgaacaagat 540ggattgcacg caggttctcc ggccgcttgg gtggagaggc tattcggcta tgactgggca 600caacagacaa tcggctgctc tgatgccgcc gtgttccggc tgtcagcgca ggggcgcccg 660gttctttttg tcaagaccga cctgtccggt gccctgaatg aactgcagga cgaggcagcg 720cggctatcgt ggctggccac gacgggcgtt ccttgcgcag ctgtgctcga cgttgtcact 780gaagcgggaa gggactggct gctattgggc gaagtgccgg ggcaggatct cctgtcatct 840caccttgctc ctgccgagaa agtatccatc atggctgatg caatgcggcg gctgcatacg 900cttgatccgg ctacctgccc attcgaccac caagcgaaac atcgcatcga gcgagcacgt 960actcggatgg aagccggtct tgtcgatcag gatgatctgg acgaagagca tcaggggctc 1020gcgccagccg aactgttcgc caggctcaag gcgcgcatgc ccgacggcga ggatctcgtc 1080gtgacccatg gcgatgcctg cttgccgaat atcatggtgg aaaatggccg cttttctgga 1140ttcatcgact gtggccggct gggtgtggcg gaccgctatc aggacatagc gttggctacc 1200cgtgatattg ctgaagagct tggcggcgaa tgggctgacc gcttcctcgt gctttacggt 1260atcgccgctc ccgattcgca gcgcatcgcc ttctatcgcc ttcttgacga gttcttctga 1320gcgggactct ggggttcgaa atgaccgacc aagcgacgcc caacctgcca tcacgagatt 1380tcgattccac cgccgccttc tatgaaaggt tgggcttcgg aatcgttttc cgggacgccg 1440gctggatgat cctccagcgc ggggatctca tgctggagtt cttcgcccac ccccggatcc 1500ccatgggaat tcccgatcgt tcaaacattt ggcaataaag tttcttaaga ttgaatcctg 1560ttgccggtct tgcgatgatt atcatataat ttctgttgaa ttacgttaag catgtaataa 1620ttaacatgta atgcatgacg ttatttatga gatgggtttt tatgattaga gtcccgcaat 1680tatacattta atacgcgata gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc 1740gcgcggtgtc atctatgtta ctagatcggg gatatccccg cggccgcgtt aacaagcttc 1800tgcaggtccg atgtgagact tttcaacaaa gggtaatatc cggaaacctc ctcggattcc 1860attgcccagc tatctgtcac tttattgtga agatagtgga aaaggaaggt ggctcctaca 1920aatgccatca ttgcgataaa ggaaaggcca tcgttgaaga tgcctctgcc gacagtggtc 1980ccaaagatgg acccccaccc acgaggagca tcgtggaaaa agaagacgtt ccaaccacgt 2040cttcaaagca agtggattga tgtgatggtc cgatgtgaga cttttcaaca aagggtaata 2100tccggaaacc tcctcggatt ccattgccca gctatctgtc actttattgt gaagatagtg 2160gaaaaggaag gtggctccta caaatgccat cattgcgata aaggaaaggc catcgttgaa 2220gatgcctctg ccgacagtgg tcccaaagat ggacccccac ccacgaggag catcgtggaa 2280aaagaagacg ttccaaccac gtcttcaaag caagtggatt gatgtgatat ctccactgac 2340gtaagggatg acgcacaatc ccactatcct tcgcaagacc cttcctctat ataaggaagt 2400tcatttcatt tggagaggac acgctgacaa gctgactcta gcagatctac cgtcttcggt 2460acgcgctcac tccgccctct gcctttgtta ctgccacgtt tctctgaatg ctctcttgtg 2520tggtgattgc tgagagtggt ttagctggat ctagaattac actctgaaat cgtgttctgc 2580ctgtgctgat tacttgccgt cctttgtagc agcaaaatat agggacatgg tagtacgaaa 2640cgaagataga acctacacag caatacgaga aatgtgtaat ttggtgctta gcggtattta 2700tttaagcaca tgttggtgtt atagggcact tggattcaga agtttgctgt taatttaggc 2760acaggcttca tactacatgg gtcaatagta tagggattca tattataggc gatactataa 2820taatttgttc gtctgcagag cttattattt gccaaaatta gatattccta ttctgttttt 2880gtttgtgtgc tgttaaattg ttaacgcctg aaggaataaa tataaatgac gaaattttga 2940tgtttatctc tgctccttta ttgtgaccat aagtcaagat cagatgcact cgttttaaat 3000attgttgtct gaagaaataa gtactgacag tattttgatg cattgatctg cttgtttgtt 3060gtaacaaaat ttaaaaataa agagtttcct ttttgttgct ctccttacct cctgatggta 3120tctagtatct accaactgac actatattgc ttctctttac atacgtatct tgctcgatgc 3180cttctcccta gtgttgacca gtgttactca catagtcttt gctcatttca ttgtaatgca 3240gataccaagc ggcctctaga ggatcagcat ggcgcccacc gtgatgatgg cctcgtcggc 3300caccgccgtc gctccgttcc tggggctcaa gcccaccgcc agcctccccg tcgcccgccg 3360ctcctccaga agcctcggca acgtcagcaa cggcggaagg atccggtgca tgcaggtaac 3420aaatgcatcc tagctagtag ttctttgcat tgcagcagct gcagctagcg agttagtaat 3480aggaagggaa ctgatgatcc atgcatggac tgatgtgtgt tgcccatccc atcccatccc 3540atttcccaaa cgaaccgaaa acaccgtact acgtgcaggt gtggccctac ggcaacaaga 3600agttcgagac gctgtcgtac ctgccgccgc tgtcgaccgg cgggcgcatc cgctgcatgc 3660aggccatgga caactccgtc ctgaactctg gtcgcaccac catctgcgac gcctacaacg 3720tcgcggcgca tgatccattc agcttccagc acaagagcct cgacactgtt cagaaggagt 3780ggacggagtg gaagaagaac aaccacagcc tgtacctgga ccccatcgtc ggcacggtgg 3840ccagcttcct tctcaagaag gtcggctctc tcgtcgggaa gcgcatcctc tcggaactcc 3900gcaacctgat ctttccatct ggctccacca acctcatgca agacatcctc agggagaccg 3960agaagtttct caaccagcgc ctcaacactg atacccttgc tcgcgtcaac gctgagctga 4020cgggtctgca agcaaacgtg gaggagttca accgccaagt ggacaacttc ctcaacccca 4080accgcaatgc ggtgcctctg tccatcactt cttccgtgaa caccatgcaa caaccgttcc 4140tcaaccgctt gcctcagttc cagatgcaag gctaccagct gctcctgctg ccactctttg 4200ctcaggctgc caacctgcac ctctccttca ttcgtgacgt gatcctcaac gctgacgagt 4260ggggcatctc tgcagccacg ctgaggacct accgcgacta cctgaagaac tacaccaggg 4320actactccaa ctattgcatc aacacctacc agtcggcctt caagggcctc aatacgaggc 4380ttcacgacat gctggag5tc aggacctaca tgttcctgaa cgtgttcgag tacgtcagca 4440tctggtcgct cttcaagtac cagagcctgc tggtgtccag cggcgccaac ctctacgcca 4500gcggctctgg tccccaacaa actcagagct tcaccagcca ggactggcca ttcctgtatt 4560cgttgttcca agtcaactcc aactacgtcc tcaacggctt ctctggtgct cgcctctcca 4620acaccttccc caacattgtt ggcctccccg gctccaccac aactcatgct ctgcttgctg 4680ccagagtgaa ctactccggc ggcatctcga gcggcgacat tggtgcatcg ccgttcaacc 4740agaacttcaa ctgctccacc ttcctgccgc cgctgctcac cccgttcgtg aggtcctggc 4800tcgacagcgg ctccgaccgc gagggcgtgg ccaccgtcac caactggcaa accgagtcct 4860tcgagaccac ccttggcctc cggagcggcg ccttcacggc gcgtgggaat tctaactact 4920tccccgacta cttcatcagg aacatctctg gtgttcctct cgtcgtccgc aacgaggacc 4980tccgccgtcc actgcactac aacgagatca ggaacatcgc ctctccgtcc gggacgcccg 5040gaggtgcaag ggcgtacatg gtgagcgtcc ataacaggaa gaacaacatc cacgctgtgc 5100atgagaacgg ctccatgatc cacctggcgc ccaatgatta caccggcttc accatctctc 5160caatccacgc cacccaagtg aacaaccaga cacgcacctt catctccgag aagttcggca 5220accagggcga ctccctgagg ttcgagcaga acaacaccac cgccaggtac accctgcgcg 5280gcaacggcaa cagctacaac ctgtacctgc gcgtcagctc cattggcaac tccaccatca 5340gggtcaccat caacgggagg gtgtacacag ccaccaatgt gaacacgacg accaacaatg 5400atggcgtcaa cgacaacggc gcccgcttca gcgacatcaa cattggcaac gtggtggcca 5460gcagcaactc cgacgtcccg ctggacatca acgtgaccct gaactctggc acccagttcg 5520acctcatgaa catcatgctg gtgccaacta acatctcgcc gctgtactga taggagctct 5580gatccccatg ggaattcccg atcgttcaaa catttggcaa taaagtttct taagattgaa 6640tcctgttgcc ggtcttgcga tgattatcat ataatttctg ttgaattacg ttaagcatgt 5700aataattaac atgtaatgca tgacgttatt tatgagatgg gtttttatga ttagagtccc 5760gcaattatac atttaatacg cgatagaaaa caaaatatag cgcgcaaact aggataaatt 5820atcgcgcgcg gtgtcatcta tgttactaga tcggggatat ccccggggcg gccgcgggga 5880attcggtacc aagcttacgc gtggccgcag cttggcgtaa tcatggtcat agctgtttcc 5940tgtgtgaaat tgttatccgc tcacaattcc acacaacata cgagccggaa gcataaagtg 6000taaagcctgg ggtgcctaat gagtgagcta actcacatta attgcgttgc gctcactgcc 6060cgctttccag tcgggaaacc tgtcgtgcca gctgcattaa tgaatcggcc aacgcgcggg 6120gagaggcggt ttgcgtattg ggcgctcttc cgcttcctcg ctcactgact cgctgcgctc 6180ggtcgttcgg ctgcggcgag cggtatcagc tcactcaaag gcggtaatac ggttatccac 6240agaatcaggg gataacgcag gaaagaacat gtgagcaaaa ggccagcaaa aggccaggaa 6300ccgtaaaaag gccgcgttgc tggcgttttt ccataggctc cgcccccctg acgagcatca 6360caaaaatcga cgctcaagtc agaggtggcg aaacccgaca ggactataaa gataccaggc 6420gtttccccct ggaagctccc tcgtgcgctc tcctgttccg accctgccgc ttaccggata 6480cctgtccgcc tttctccctt cgggaagcgt ggcgctttct caatgctcac gctgtaggta 6540tctcagttcg gtgtaggtcg ttcgctccaa gctgggctgt gtgcacgaac cccccgttca 6600gcccgaccgc tgcgccttat ccggtaacta tcgtcttgag tccaacccgg taagacacga 6660cttatcgcca ctggcagcag ccactggtaa caggattagc agagcgaggt atgtaggcgg 6720tgctacagag ttcttgaagt ggtggcctaa ctacggctac actagaagga cagtatttgg 6780tatctgcgct ctgctgaagc cagttacctt cggaaaaaga gttggtagct cttgatccgg 6840caaacaaacc accgctggta gcggtggttt ttttgtttgc aagcagcaga ttacgcgcag 6900aaaaaaagga tctcaagaag atcctttgat cttttctacg gggtctgacg ctcagtggaa 6960cgaaaactca cgttaaggga ttttggtcat gagattatca aaaaggatct tcacctagat 7020ccttttgggg tgggcgaaga actccagcat gagatccccg cgctggagga tcatccagcc 7080ggcgtcccgg aaaacgattc cgaagcccaa cctttcatag aaggcggcgg tggaatcgaa 7140atctcgtgat ggcaggttgg gcgtcgcttg gtcggtcatt tcgaacccca gagtcccgct 7200cagaagaact cgtcaagaag gcgatagaag gcgatgcgct gcgaatcggg agcggcgata 7260ccgtaaagca cgaggaagcg gtcagcccat tcgccgccaa gctcttcagc aatatcacgg 7320gtagccaacg ctatgtcctg atagcggtcc gccacaccca gccggccaca gtcgatgaat 7380ccagaaaagc ggccattttc caccatgata ttcggcaagc aggcatcgcc atgggtcacg 7440acgagatcct cgccgtcggg catgcgcgcc ttgagcctgg cgaacagttc ggctggcgcg 7500agcccctgat gctcttcgtc cagatcatcc tgatcgacaa gaccggcttc catccgagta 7560cgtgctcgct cgatgcgatg tttcgcttgg tggtcgaatg ggcaggtagc cggatcaagc 7620gtatgcagcc gccgcattgc atcagccatg atggatactt tctcggcagg agcaaggtga 7680gatgacagga gatcctgccc cggcacttcg cccaatagca gccagtccct tcccgcttca 7740gtgacaacgt cgagcacagc tgcgcaagga acgcccgtcg tggccagcca cgatagccgc 7800gctgcctcgt cctgcagttc attcagggca ccggacaggt cggtcttgac aaaaagaacc 7860gggcgcccct gcgctgacag ccggaacacg gcggcatcag agcagccgat tgtctgttgt 7920gcccagtcat agccgaatag cctctccacc caagcggccg gagaacctgc gtgcaatcca 7980tcttgttcaa tcatgcgaaa cgatcctcat cctgtctctt gatcagatct tgatcccctg 8040cgccatcaga tccttggcgg caagaaagcc atccagttta ctttgcaggg cttcccaacc 8100ttaccagagg gcgccccagc tggcaattcc ggttcgcttg ctgtccataa aaccgcccag 8160tctagctatc gccatgtaag cccactgcaa gctacctgct ttctctttgc gcttgcgttt 8220tcccttgtcc agatagccca gtagctgaca ttcatccggg gtcagcaccg tttctgcgga 8280ctggctttct acgtgttccg cttcctttag cagcccttgc gccctgagtg cttgcggcag 8340cgtgaagct 8349<210>17<211>1912<212>DNAt213>苏云金芽孢杆菌<400>17atgaatagtg tattgaatag cggaagaact actatttgtg atgcgtataa tgtagcggct 60catgatccat ttagttttca acacaaatca ttagataccg tacaaaagga atggacggag 120tggaaaaaaa ataatcatag tttataccta gatcctattg ttggaactgt ggctagtttt 180ctgttaaaga aagtggggag tcttgttgga aaaaggatac taagtgagtt acggaattta 240atatttccta gtggtagtac aaatctaatg caagatattt taagagagac agaaaaattc 300ctgaatcaaa gacttaatac agacactctt gcccgtgtaa atgcggaatt gacagggctg 360caagcaaatg tagaagagtt taatcgacaa gtagataatt ttttgaaccc taaccgaaac 420gctgttcctt tatcaataac ttcttcagtt aatacaatgc aacaattatt tctaaataga 480ttaccccagt tccagatgca aggataccaa ctgttattat tacctttatt tgcacaggca 540gccaatttac atctttcttt tattagagat gttattctaa atgcagatga atggggaatt 600tcagcagcaa cattacgtac gtatcgagat tacttgaaaa attatacaag agattactct 660aactattgta taaatacgta tcaaagtgcg tttaaaggtt taaacactcg tttacacgat 720atgttagaat ttagaacata tatgttttta aatgtatttg agtatgtatc tatctggtcg 780ttgtttaaat atcaaagtct tctagtatct tccggtgcta atttatatgc aagtggtagt 840ggaccacagc agacccaatc atttacttca caagactggc catttttata ttctcttttc 900caagttaatt caaattatgt gttaaatgga tttagtggtg ctaggctttc taataccttc 960cctaatatag ttggtttacc tggttctact acaactcacg cattgcttgc tgcaagggtt 1020aattacagtg gaggaatttc gtctggtgat ataggtgcat ctccgtttaa tcaaaatttt 1080aattgtagca catttctccc cccattgtta acgccatttg ttaggagttg gctagattca 1140ggttcagatc gggagggcgt tgccaccgtt acaaattggc aaacagaatc ctttgagaca 1200actttagggt taaggagtgg tgcttttaca gctcgcggta attcaaacta tttcccagat 1260tattttattc gtaatatttc tggagttcct ttagttgtta gaaatgaaga tttaagaaga 1320ccgttacact ataatgaaat aagaaatata gcaagtcctt caggaacacc tggtggagca 1380cgagcttata tggtatctgt gcataacaga aaaaataata tccatgctgt tcatgaaaat 1440ggttctatga ttcatttagc gccaaatgac tatacaggat ttactatttc gccgatacat 1500gcaactcaag tgaataatca aacacgaaca tttatttctg aaaaatttgg aaatcaaggt 1560gattctttaa ggtttgaaca aaacaacacg acagctcgtt atacgcttag agggaatgga 1620aatagttaca atctttattt aagagtttct tcaataggaa attccactat tcgagttact 1680ataaacggta gggtatatac tgctacaaat gttaatacta ctacaaataa cgatggagtt 1740aatgataatg gagctcgttt ttcagatatt aatatcggta atgtagtagc aagtagtaat 1800tctgatgtac cattagatat aaatgtaaca ttaaactccg gtactcaatt tgatcttatg 1860aatattatgc ttgtaccaac taatatttca ccactttatt aaggtttgag ta 1912<210>18<211>633<212>PRT<213>苏云金芽孢杆菌<400>18Met Asn Ser Val Leu Asn Ser Gly Arg Thr Thr Ile Cys Asp Ala Tyr1 5 10 15Asn Val Ala Ala His Asp Pro Phe Ser Phe Gln His Lys Ser Leu Asp20 25 30Thr Val Gln Lys Glu Trp Thr Glu Trp Lys Lys Asn Asn His Ser Leu35 40 45Tyr Leu Asp Pro Ile Val Gly Thr Val Ala Ser Phe Leu Leu Lys Lys50 55 60Val gly Ser Leu Val Gly Lys Arg Ile Leu Ser Glu Leu Arg Asn Leu65 70 75 80Ile Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp Ile Leu Arg Glu85 90 95Thr Glu Lys Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala Arg100 105 110Val Asn Ala Glu Leu Thr Gly Leu Gln Ala Asn Val Glu Glu Phe Asn115 120 125Arg Gln Val Asp Asn Phe Leu Asn Pro Asn Arg Asn Ala Val Pro Leu130 135 140Ser Ile Thr Ser Ser Val Asn Thr Met Gln Gln Leu Phe Leu Asn Arg145 150 155 160Leu Pro Gln Phe Gln Met Gln Gly Tyr Gln Leu Leu Leu Leu Pro Leu165 170 175Phe Ala Gln Ala Ala Asn Leu His Leu Ser Phe Ile Arg Asp Val Ile180 185 190Leu Asn Ala Asp Glu Trp Gly Ile Ser Ala Ala Thr Leu Arg Thr Tyr195 200 205Arg Asp Tyr Leu Lys Asn Tyr Thr Arg Asp Tyr Ser Asn Tyr Cys Ile210 215 220Asn Thr Tyr Gln Ser Ala Phe Lys Gly Leu Asn Thr Arg Leu His Asp225 230 235 240Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Pha Glu Tyr Val245 250 255Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser Ser Gly260 265 270Ala Asn Leu Tyr Ala sar Gly Ser Gly Pro Gln Gln Thr Gln Ser Phe275 280 285Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Val Asn Ser290 295 300Asn Tyr Val Leu Asn Gly Phe Ser Gly Ala Arg Leu Ser Asn Thr Phe305 310 315 320Pro Asn Ile Val Gly Leu Pro Gly Ser Thr Thr Thr His Ala Leu Leu325 330 335Ala Ala Arg Val Asn Tyr Ser Gly Gly Ile Ser Ser Gly Asp Ile Gly340 345 350Ala Ser Pro Phe Asn Gln Asn Phe Asn Cys Ser Thr Phe Leu Pro Pro355 360 365Leu Leu Thr Pro Phe Val Arg Ser Trp Leu Asp Ser Gly Ser Asp Arg370 375 380Glu Gly Val Ala Thr Val Thr Asn Trp Gln Thr Glu Ser Phe Glu Thr385 390 395 400Thr Leu Gly Leu Arg Ser Gly Ala Phe Thr Ala Arg Gly Asn Ser Asn405 410 415Tyr Phe Pro Asp Tyr Phe Ile Arg Asn Ile Ser Gly Val Pro Leu Val420 425 430Val Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Glu Ile Arg435 440 445Asn Ile Ala Ser Pro Ser Gly Thr Pro Gly Gly Ala Arg Ala Tyr Met450 455 460Val Ser Val His Asn Arg Lys Asn Asn Ile His Ala Val His Glu Asn465 470 475 480Gly Ser Met Ile His Leu Ala Pro Asn Asp Tyr Thr Gly Phe Thr Ile
485 490495Ser Pro Ile His Ala Thr Gln Val Asn Asn Gln Thr Arg Thr Phe Ile500 505 510Ser Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln Asn515 520 525Asn Thr Thr Ala Arg Tyr Thr Leu Arg GlyAsn Gly Asn Ser Tyr Asn530 535540Leu Tyr Leu Arg Val Ser Ser Ile Gly Asn Ser Thr Ile Arg Val Thr545 550 555 560Ile Asn Gly Arg Val Tyr Thr Ala Thr Asn Val Asn Thr Thr Thr Asn565 570 575Asn Asp Gly Val Asn Asp Asn Gly Ala Arg Phe Ser Asp Ile Asn Ile580 585 590Gly Asn Val Val Ala Ser Ser Asn Ser Asp Val Pro Leu Asp Ile Asn595 600 605Val Thr Leu Asn Ser Gly Thr Gln Phe Asp Leu Met Asn Ile Met Leu610 615 620Val Pro Thr Asn Ile Ser Pro Leu Tyr625 630
权利要求
1.包含含植物功能性启动子序列的核酸序列的植物,所述启动子序列有效连接于编码Cry2A苏云金芽孢杆菌δ-内毒素蛋白的多核苷酸序列,所述δ-内毒素蛋白缺乏显著的双翅目物种抑制活性,其中所述核酸序列在所述植物中的表达产生定位至亚细胞器或亚细胞区室的所述蛋白。
2.包含含植物功能性启动子序列的核酸序列的植物,所述启动子序列有效连接于编码质体转运肽的第一多核苷酸序列,所述第一多核苷酸序列与编码Cry2A苏云金芽孢杆菌δ-内毒素蛋白的第二多核苷酸序列符合读框地连接,所述δ-内毒素蛋白缺乏显著的双翅目物种抑制活性,其中所述第二多核苷酸序列有效连接于植物功能性3’端转录终止和聚腺苷酸化序列,其中所述核酸序列在所述植物中的表达产生包含共价连接于所述δ-内毒素蛋白的氨基末端质体转运肽的融合蛋白,并且其中所述融合蛋白的作用是将所述δ-内毒素蛋白定位至亚细胞器或亚细胞区室。
3.权利要求1的植物,其中编码Cry2A苏云金芽孢杆菌δ-内毒素蛋白的所述多核苷酸序列包括编码Cry2Ab苏云金芽孢杆菌δ-内毒素蛋白的序列。
4.权利要求2的植物,其中编码Cry2A苏云金芽孢杆菌δ-内毒素蛋白的所述多核苷酸序列包括编码Cry2Ab苏云金芽孢杆菌δ-内毒素蛋白的序列。
5.权利要求1的植物,其中所述亚细胞器或亚细胞区室是植物质体或叶绿体。
6.权利要求2的植物,其中所述亚细胞器或亚细胞区室是植物质体或叶绿体。
7.权利要求1的植物,其中将所述核酸序列引入并稳定保持在植物质体或叶绿体中。
8.得自按照权利要求5的植物的后代的植物组织,其中所述植物组织包括包含编码所述δ-内毒素蛋白的所述多核苷酸序列的植物、植物种子或植物细胞。
9.得自按照权利要求6的植物的后代的植物组织,其中所述植物组织包括包含编码所述δ-内毒素蛋白的所述多核苷酸序列的植物、植物种子或植物细胞。
10.按照权利要求1的植物,其中包含启动子的所述核酸序列是植物叶绿体或质体功能性启动子。
11.按照权利要求2的植物,其中包含植物功能性启动子的所述核酸序列是在植物中天然表达的启动子序列。
12.按照权利要求1的植物,其中编码Cry2A苏云金芽孢杆菌δ-内毒素蛋白的所述多核苷酸序列选自SEQ ID NO1、SEQ ID NO11和SEQ ID NO17。
13.按照权利要求2的植物,其中编码Cry2A苏云金芽孢杆菌δ-内毒素蛋白的所述多核苷酸序列选自SEQ ID NO1、SEQ ID NO11和SEQ ID NO17。
14.按照权利要求1的植物,其中所述Cry2Ab苏云金芽孢杆菌δ-内毒素蛋白选自SEQ ID NO2、SEQID NO12和SEQID NO18。
15.按照权利要求2的植物,其中所述Cry2Ab苏云金芽孢杆菌δ-内毒素蛋白选自SEQ ID NO2、SEQID NO12和SEQID NO18。
16.权利要求2的植物,其中所述核酸序列还包含植物功能性内含子序列。
17.权利要求16的植物,其中所述内含子序列选自Adh内含子1、蔗糖合酶内含子、TMVΩ元件、玉米热激蛋白70内含子或水稻Actl内含子。
18.权利要求16的植物,其中所述内含子序列是玉米热激蛋白70内含子。
19.权利要求2的植物,其中所述第一多核苷酸序列编码选自zmSSU PTP、PTP1、PTP1Δ和PTP2的质体转运肽。
20.权利要求19的植物,其中包含SEQ ID NO4的所述zmSSUPTP质体转运肽由包含SEQ ID NO3的核酸序列编码。
21.权利要求19的植物,其中包含SEQ ID NO6的所述PTP1质体转运肽由包含SEQ ID NO5的核酸序列编码。
22.权利要求19的植物,其中包含SEQ ID NO8的所述PTP1Δ质体转运肽由包含SEQ ID NO7的核酸序列编码。
23.权利要求19的植物,其中包含SEQ ID NO10的所述PTP2质体转运肽由包含SEQ ID NO9的核酸序列编码。
24.权利要求2的植物,包含SEQ ID NO13的核苷酸17-3182。
25.权利要求2的植物,包含SEQ ID NO14的核苷酸17-3092。
26.权利要求2的植物,包含SEQ ID NO15的核苷酸17-3155。
27.权利要求1的植物,其中所述植物是单子叶植物。
28.权利要求2的植物,其中所述植物是单子叶植物。
29.权利要求27的植物,其中所述植物是选自玉米、水稻、小麦、大麦、燕麦、黑麦、小米、高粱、甘蔗和草坪草的单子叶植物。
30.权利要求28的植物,其中所述植物是选自玉米、水稻、小麦、大麦、燕麦、黑麦、小米、高粱、甘蔗和草坪草的单子叶植物。
31.权利要求1的植物,其中所述植物是双子叶植物。
32.权利要求2的植物,其中所述植物是双子叶植物。
33.权利要求31的植物,其中所述植物是选自棉花、大豆、番茄、马铃薯、柑桔、烟草、canola和草莓的双子叶植物。
34.权利要求32的植物,其中所述植物是选自棉花、大豆、番茄、马铃薯、柑桔、烟草、canola和草莓的双子叶植物。
35.权利要求1植物,还包括R0转基因植物。
36.权利要求2植物,还包括R0转基因植物。
37.权利要求35的植物的任何世代的后代植物,其中所述植物遗传有来自所述R0转基因植物的所述核酸序列。
38.权利要求36的植物的任何世代的后代植物,其中所述植物遗传有来自所述R0转基因植物的所述核酸序列。
39.按照权利要求1的植物,其中所述植物还包含一种含植物有效启动子的额外的核酸序列,所述启动子有效连接于编码Cry1苏云金芽孢杆菌δ-内毒素蛋白的多核苷酸序列。
40.按照权利要求2的植物,其中所述植物还包含一种含植物有效启动子的额外的核酸序列,所述启动子有效连接于编码Cry1苏云金芽孢杆菌δ-内毒素蛋白的多核苷酸序列。
41.产生转基因植物后代植株的方法,包括(a)获得含有一种含植物功能性启动子的核酸序列的第一植物,所述启动子有效连接于编码质体转运肽的第一多核苷酸序列,所述第一多核苷酸序列与编码Cry2A苏云金芽孢杆菌δ-内毒素蛋白的第二多核苷酸序列符合读框地连接,所述δ-内毒素蛋白缺乏显著的双翅目物种抑制活性,其中所述第二多核苷酸序列有效连接于植物功能性3’端转录终止和聚腺苷酸化序列,其中所述核酸序列在所述植物中的表达产生包含共价连接于所述δ-内毒素蛋白的氨基末端质体转运肽的融合蛋白,并且其中所述融合蛋白的作用是将所述δ-内毒素蛋白定位至亚细胞器或亚细胞区室;(b)获得第二植物;和(c)使所述第一植物与所述第二植物杂交,获得杂交的转基因后代植物,所述后代植物遗传有得自所述第一植物的所述核酸序列。
42.权利要求41的方法,其中所述后代植物是单子叶植物,所述单子叶植物选自玉米、水稻、小麦、大麦、燕麦、黑麦、小米、高粱、甘蔗和草坪草。
43.权利要求41的方法,其中所述后代植物是双子叶植物,所述双子叶植物选自棉花、大豆、番茄、马铃薯、柑桔和烟草。
44.包含有效连接于编码质体转运肽的第一多核苷酸序列的启动子的核酸序列,所述第一多核苷酸序列与编码Cry2A苏云金芽孢杆菌δ-内毒素蛋白的第二多核苷酸序列符合读框地连接,所述δ-内毒素蛋白缺乏显著的双翅目抑制活性,其中植物细胞表达所述核酸序列产生包含共价连接于所述δ-内毒素蛋白的氨基末端质体转运肽的融合蛋白,并且其中所述融合蛋白的作用是将所述δ-内毒素蛋白定位至亚细胞器或亚细胞区室
45.权利要求44的核酸序列,其中所述第二多核苷酸序列编码Cry2Ab苏云金芽孢杆菌δ-内毒素蛋白。
46.权利要求45的核酸序列,其中所述第二多核苷酸序列编码选自SEQ ID NO2和SEQ ID NO18的序列的Cry2Ab苏云金芽孢杆菌δ-内毒素蛋白。
47.权利要求46的核酸序列,其中所述第二多核苷酸序列选自SEQ ID NO1和SEQ ID NO17的序列。
48.包含含启动子的核酸序列的植物细胞,所述启动子有效连接于编码Cry2A苏云金芽孢杆菌δ-内毒素蛋白的多核苷酸序列,所述δ-内毒素蛋白缺乏显著的双翅目抑制活性,其中所述核酸序列在所述植物中的表达产生定位至亚细胞器或亚细胞区室的所述蛋白。
49.权利要求48的植物细胞,其中编码Cry2A苏云金芽孢杆菌δ-内毒素蛋白的所述多核苷酸序列编码Cry2Ab苏云金芽孢杆菌δ-内毒素蛋白。
50.权利要求49的植物细胞,其中所述亚细胞器或亚细胞区室是植物质体或叶绿体。
51.权利要求48的植物细胞,其中将所述核酸序列引入并稳定保持在植物质体或叶绿体中。
52.权利要求51的植物细胞,其中所述核酸序列在所述质体或叶绿体中表达,所述表达产生杀虫有效量的定位至所述质体或叶绿体的所述δ-内毒素蛋白。
53.得自按照权利要求48的植物细胞的后代的植物组织,其中所述植物组织包括包含表达定位至植物质体或叶绿体的所述δ-内毒素蛋白的所述多核苷酸序列的植物、植物种子、植物细胞或其后代组织。
54.按照权利要求50的植物细胞,其中包含启动子的所述核酸序列是植物叶绿体或质体功能性启动子。
55.按照权利要求54的植物细胞,其中编码Cry2A苏云金芽孢杆菌δ-内毒素的所述多核苷酸序列选自SEQ ID NO1、SEQ ID NO11和SEQ ID NO17。
56.按照权利要求55的植物细胞,其中所述Cry2Ab苏云金芽孢杆菌δ-内毒素选自SEQ ID NO2、SEQ ID NO12和SEQ ID NO18。
全文摘要
公开了通过在植物中表达Cry2A苏云金芽孢杆菌δ-内毒素的新方法防治植物害虫的方法。本发明包括编码包含Cry2A苏云金芽孢杆菌δ-内毒素的蛋白的核酸区段。公开了所述核酸区段,也公开了包含所述核酸区段的转化载体、用要求保护的区段转化的植物、转化植物的方法和控制害虫侵染的方法。
文档编号C12N15/12GK1332800SQ99815106
公开日2002年1月23日 申请日期1999年11月4日 优先权日1998年11月4日
发明者D·R·科尔宾, C·P·罗马诺 申请人:孟山都公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1