细菌杀昆虫蛋白的制作方法

文档序号：571000阅读：638来源：国知局

专利名称：细菌杀昆虫蛋白的制作方法
背景技术：
1.发明领域本发明涉及从细菌菌株，优选短芽孢杆菌(Brevibacillus)菌株，最优选侧孢短小芽孢杆菌(Brevibacillus laterosporus)菌株分离的、新的杀昆虫分泌蛋白(“ISP”)及编码该蛋白的DNA，当所述蛋白与ISP-支助蛋白(ISP-complimentary protein)，如本发明的另一种ISP蛋白组合被昆虫摄入后即可杀昆虫。这些蛋白可用于防止或减少田地里昆虫，特别是玉米根虫对植物的损害。
本发明还涉及植物，特别是玉米植物，所述植物通过在其细胞中表达本发明的ISP蛋白而具有杀昆虫能力，优选杀鞘翅目昆虫特别是叶甲属(Diabrotica)、马铃薯叶甲属(Leptinotarsa)和花象属(Anthonomus)种的昆虫。
本发明还涉及通过使下述的昆虫摄入本发明的ISP蛋白，特别是具有SEQ ID No.2，4，8或10之任一项的氨基酸序列的蛋白，或其中具有杀昆虫活性的片段来控制由叶甲属(Diabrotica)、马铃薯叶甲属(Leptinotarsa)或花象属(Anthonomus)种昆虫，优选叶甲属(Diabrotica)种昆虫害虫，特别是玉米根虫引起的损失的方法。
2.现有技术的描述已发现一些最具破坏性的害虫属于Diabroticine beetles。在北美，人们认为三种重要的玉米根虫，玉米根叶甲(Diabrotica virgifera)(西部玉米根虫)、Diabrotica barberi(北部玉米根虫)和黄瓜十一星叶甲食根亚种(Diabrotica undecimpunctata howardi)(南部玉米根虫)是需要花费最昂贵资金来控制的病虫害。(Metcalf，1986，Foreword，“Methods for theStudy of PestDiabrotica”，pp.vii-xv，编者Krysan，J.L.和Miller，T.A.，Springer-Verlag，纽约)。玉米根叶甲(Diabrotica virgifera)和Diabroticabarberi被认为是美国和加拿大主要生产玉米的州中最为严重的玉米病虫害(Levine和Oloumi-Sadeghi，1991，Annu.Rev.Entomol.36，229-55)。其幼虫以玉米根为食，从而对玉米的生长和收获造成直接的损害。控制幼虫损害玉米根系的土壤杀昆虫剂和减少甲虫损害玉米穗的空气喷雾剂的费用，加上玉米的亏损每年有将近十亿美圆(Metcalf，1986，参见上文)。最近，在美国的一些州发现在种植玉米后种植大豆的轮作方式失去了作用，这是由于玉米根虫已经适应了这种情况。
对玉米根虫具有毒性的细菌菌株和/或基因在美国专利6,023,013；6,015,553；6,001,637；5,906,818和5,645,831中已有描述。另外，PCT出版物WO00/09697，WO99/57282，WO98/18932，WO97/40162，和WO00/26378也涉及到可从芽孢杆菌(Bacillus)或其它细菌种获得的毒素和基因，其中的一些被述及对玉米根虫具有毒性。WO98/44137，WO94/21795和WO96/10083涉及以在营养生长过程中产生的杀昆虫蛋白和辅助蛋白为特征的杀昆虫芽孢杆菌(Bacillus)菌株，并描述了其中的一些对玉米根虫具有毒性。美国专利5,055,293描述了一种通过向土壤中接种形成伴胞晶体的侧孢芽孢杆菌(Bacillus laterosporus)来控制玉米根虫的方法。
Orlova等(1998，Applied Environmental Microbiol.64，2723)报道了在有晶体形成的侧孢芽孢杆菌(Bacillus laterosporus)中与蛋白晶体相关的杀蚊虫活性。
发明目的及发明简述本发明的目的在于提供对昆虫，优选叶甲属(Diabrotica)种昆虫，特别是玉米根虫具有显著毒性的新的蛋白和编码该蛋白的DNA序列。
在本发明的一个实施方案中，提供了包含SEQ ID No.2中最小活性毒素蛋白的氨基酸序列的蛋白，其中所述最小活性毒素a)是SEQ ID No.2所示蛋白的片段，且b)当与SEQ ID No.4中51到457位氨基酸序列所示的蛋白组合被玉米根叶甲(Diabrotica virgifera)幼虫摄入后能够将所述幼虫杀死。
还提供了包含SEQ ID No.4中最小活性毒素蛋白的氨基酸序列的蛋白，其中所述的最小活性毒素a)是SEQ ID No.4所示蛋白的片段，且b)当与SEQ ID No.2中38到871位氨基酸序列所示的蛋白组合被玉米根叶甲(Diabrotica virgifera)幼虫摄入后能够将所述幼虫杀死。
特别优选的是以包含SEQ ID No.2中38到768或781位的氨基酸序列为特征的蛋白，优选以SEQ ID No.2或SEQ ID No.10的氨基酸序列为特征的蛋白；和以含有SEQ ID No.4从第51位氨基酸到第449或457位氨基酸的序列为特征的蛋白，优选以SEQ ID No.4或SEQ ID No.8的氨基酸序列为特征的蛋白。
本发明的另一个目的是提供一种蛋白质，其包含isp1A DNA所编码蛋白的蛋白酶消化片段的氨基酸序列，所述的isp1A DNA保藏于BCCM-LMBP，保藏号为LMBP 4009，其中所述蛋白酶消化片段当与SEQID.No.4中第51位到第457位氨基酸组成的蛋白组合施用时对玉米根叶甲(Diabrotica virgifera)具有杀昆虫作用；以及一种包含isp2A DNA所编码蛋白的蛋白酶消化片段的氨基酸序列的蛋白，所述的isp2A DNA保藏于BCCM-LMBP，保藏号为LMBP 4009，所述蛋白酶消化片段当与SEQ ID.No.2中第38位到第871位氨基酸组成的蛋白组合施用时对玉米根叶甲(Diabrotica virgifera)具有杀昆虫作用；具体地说，其中所述的蛋白酶消化片段可经鞘翅目昆虫消化液处理得到。
本发明还提供编码上述蛋白的DNA序列，特别是含有与天然存在的DNA序列相比所使用的密码子不同但编码的蛋白序列相同的人工DNA序列的DNA，该DNA优选包含在嵌合基因中可操作地与能在植物中表达的启动子区域(即适合用于植物细胞中的表达的启动子区域，其可来源于细菌，病毒或植物也可以是人工制备的)，尤其是优先在根组织中具有活性的启动子区域相连接。
在本发明的一个实施方案中，所述嵌合基因中的启动子包含SEQ ID No.5或6的DNA序列或者可在严紧条件下与其杂交的DNA。
在本发明另一实施方案中，所述的嵌合基因还包含用于从细胞中向外分泌或靶向细胞器的信号肽，特别是叶绿体转运肽。
本发明还提供如下植物细胞、植物或种子，特别是玉米细胞、植物或种子，它们包含整合到其细胞中的上述任一嵌合基因，特别是编码ISP1A或其具有杀昆虫活性的片段的嵌合基因与编码ISP2A或其具有杀昆虫活性的片段的嵌合基因的组合。
在本发明的另一个实施方案中，提供了经转化而含有上述任意一种DNA序列的微生物。
本发明还提供控制昆虫的方法，特别是使植物抗鞘翅目昆虫的方法，该方法包括在植物细胞中表达任意一种本发明的ISP蛋白，再从所述的抗昆虫性细胞再生出转化植物。在这一方法中所述的昆虫优选选自根虫，象甲，马铃薯甲虫，叶甲属(Diabrotica)种，花象属(Anthonomus)种，马铃薯叶甲属(Leptinotarsa)种，杨树莹叶甲(Agelastica alni)，紫油苜蓿叶象(Hypera postica)，埃及苜蓿叶象(Hypera brunneipennis)，Halticatombacina，墨西哥棉铃象(Anthonomus grandis)，黄粉虫(Tenebriomolitor)，赤拟谷盗(Triboleum castaneum)，水稻铁甲(Dicladispaarmigera)，Trichispa serica，水稻负泥虫(Oulema oryzae)，葡萄肖叶甲(Colaspis brunnea)，稻水象甲(Lissorhorptrus oryzophilus)，萝卜菜跳甲(Phyllotreta cruciferae)，黄曲条菜跳甲(Phyllotreta striolata)，忽布跳甲(Psylliodes punctulata)，美洲油菜叶甲(Entomoscelis americana)，油菜露尾甲(Meligethes aeneus)，龟象属(Ceutorynchus)种，油菜金头跳甲(Psylliodes chrysocephala)，豌豆细纹跳甲(Phyllotreta undulata)，马铃薯叶甲(Leptinotarsa decemlineata)，黄瓜十一星叶甲亚种(Diabroticaundecimpunctata undecimpunctata，)黄瓜十一星叶甲食根亚种(Diabroticaundecimpunctata howardi)，Diabrotica barberi，和玉米根叶甲(Diabroticavirgifera)。
本发明的另一个目的是提供使植物抗鞘翅目昆虫的方法以及控制鞘翅目昆虫的方法，所述的方法包括使用编码本发明的ISP蛋白的DNA序列转化植物，特别是玉米，然后大田种植、播种或栽培所述植物。在本发明的一个实施方案中，所述的ISP蛋白与其它杀昆虫蛋白或蛋白组合，优选对玉米根虫具有毒性的蛋白相联合。
本发明还提供ISP1A或ISP2A的等价物，其优选来自侧孢短小芽孢杆菌(Brevibacillus laterosporus)菌株，特别是来自不形成晶状包含体的侧孢短小芽孢杆菌(Brevibacillus laterosporus)菌株。利用适当的分子量标记在标准的8-10％ SDS-PAGE凝胶电泳中确定，这类等价物的分子量优选地为ISP1A等价物约95到约100kD，ISP2A等价物约45到约50kD。
本发明优选实施方案的详细描述依照本发明，我们分离并表征了新的细菌毒素和编码它们的DNA序列。所述的新蛋白命名为ISP1A和ISP2A，编码它们的DNA序列分别为isp1A和isp2A。
依照本发明，“ISP1A蛋白”是指包含当与适宜的ISP-支助蛋白，特别是ISP2A成熟蛋白组合被昆虫摄入后仍保持杀昆虫活性的SEQ ID No.2氨基酸序列中的最小蛋白片段的任何蛋白，所述杀昆虫活性特别是对鞘翅目昆虫，更特别是对玉米根虫、棉铃象甲和马铃薯甲虫，优选对叶甲属(Diabrotica)种，尤其是对南部、西部和北部玉米根虫，特别是对玉米根叶甲(Diabrotica virgifera)的杀昆虫活性。这包括任何具有下述氨基酸序列的蛋白，所述的氨基酸序列包含SEQ ID No.2中从第32或38位优选第38位氨基酸到第768位至871位氨基酸中的一个位置的氨基酸序列；特别是任何具有下述氨基酸序列的蛋白，所述的氨基酸序列包含至少SEQ IDNo.2中从第38到第768位氨基酸的序列。这也包括通过从SEQ ID No.2的氨基酸序列中切除部分或全部N-末端信号肽序列所获得的蛋白，或者其中的信号肽被另一(如植物的)引导肽、甲硫氨酸或甲硫氨酸-丙氨酸二肽替换的蛋白。具体地，这包括含有原核或真核(如细菌或植物)的N-末端分泌或靶向信号肽的蛋白。这还包括含有上述最小毒性蛋白片段的杂合或嵌合蛋白，如本发明的ISP2A蛋白和ISP1A蛋白之间的杂合体。而且，用昆虫消化液处理后获得的保持了杀昆虫活性的ISP1A蛋白的蛋白酶抗性片段也包含在此处所用到的名称“ISP1A”中，所述的昆虫消化液优选是鞘翅目昆虫消化液，特别是鞘翅目昆虫肠道蛋白酶，优选玉米根虫蛋白酶，如半胱氨酸蛋白酶、丝氨酸蛋白酶、胰蛋白酶、糜蛋白酶或胰蛋白酶样蛋白酶。具体说来，所述的鞘翅目昆虫选自玉米根虫，棉铃象甲和马铃薯甲虫，叶甲属(Diabrotica)种，玉米根叶甲(Diabrotica virgifera)，Diabrotica barberi，黄瓜十一星叶甲(Diabrotica undecimpuncata)，马铃薯叶甲(Leptinotarsa decemlineata)和墨西哥棉铃象(Anthonomusgrandis)。在本发明的优选实施方案中，在不同时或相继提供ISP支助蛋白，如ISP2A蛋白的情况下，根据本发明的ISP1A蛋白被单独摄入时没有杀昆虫活性。
依照本发明，“ISP2A蛋白”是指包含当与适宜的ISP-支助蛋白，特别是ISP1A成熟蛋白组合被昆虫摄入后仍保持杀昆虫活性的SEQ ID No.4氨基酸序列中的最小蛋白片段的任何蛋白，所述杀昆虫活性特别是对鞘翅目昆虫，更特别是对玉米根虫、棉铃象甲和马铃薯甲虫，优选对叶甲属(Diabrotica)种，尤其是对玉米根叶甲(Diabrotica virgifera)，Diabroticabarberi，黄瓜十一星叶甲(Diabrotica undecimpuncata)的杀昆虫活性。这包括任何具有下述氨基酸序列的蛋白，所述的氨基酸序列包含SEQ IDNo.4中从第43或51位优选第51位氨基酸到第449位至457位氨基酸中的一个位置的氨基酸序列；特别是任何具有下述氨基酸序列的蛋白，所述的氨基酸序列包含至少SEQ ID No.4中从第51到第449位氨基酸的序列。这也包括从SEQ ID No.4的氨基酸序列中切除该蛋白的部分或全部N-末端信号肽序列所获得的蛋白，以及其中的信号肽被另一(如植物的)引导肽、甲硫氨酸或甲硫氨酸-丙氨酸二肽替换的蛋白。具体地，这包括含有原核或真核(如细菌或植物)的N-末端分泌或靶向信号肽的蛋白。这还包括含有上述最小毒性蛋白片段的杂合或嵌合蛋白，如本发明的ISP2A蛋白和ISP1A蛋白之间的杂合体。而且，用昆虫消化液处理后获得的保持了杀昆虫活性的ISP2A蛋白中的蛋白酶抗性片段也包含在此处所用到的名称“ISP2A”中，所述的昆虫消化液优选是鞘翅目昆虫消化液，特别是鞘翅目昆虫肠道蛋白酶，如半胱氨酸蛋白酶、丝氨酸蛋白酶、胰蛋白酶、糜蛋白酶或胰蛋白酶样蛋白酶。在本发明的优选实施方案中，在不同时或相继提供ISP支助蛋白，如ISP1A蛋白的情况下，根据本发明的ISP2A蛋白被单独摄入时没有杀昆虫活性。
此处所用的“ISP-支助蛋白”是指当与一种本发明的ISP蛋白组合被昆虫特别是鞘翅目昆虫摄入后具有杀昆虫活性的蛋白，其包括但不限于成熟的ISP1A或ISP2A蛋白，所述的昆虫优选是玉米根虫、棉铃象甲或马铃薯甲虫，尤其是玉米根叶甲(Diabrotica virgifera)，Diabrotica barberi，黄瓜十一星叶甲(Diabrotica undecimpuncata)或墨西哥棉铃象(Anthonomus grandis)。具体地，WO98/44137，WO94/21795和WO96/10083中所述的VIP蛋白及其活性片段，尤其是切除了信号序列的成熟VIP蛋白也是本发明的ISP-支助蛋白。ISP1A蛋白的理想ISP-支助蛋白是ISP2A蛋白或者美国专利5,990,383中所描述的VIP2Aa或VIP2Ab蛋白或其活性片段(例如去除了信号序列的成熟蛋白)，或与ISP2或VIP2蛋白之任一种具有至少50％、优选至少75％、特别是至少85％序列同一性且与成熟的ISP1A蛋白组合被昆虫，优选鞘翅目昆虫，特别是玉米根虫摄入后具有杀昆虫活性的任何细菌分泌蛋白。ISP2A蛋白的理想ISP-支助蛋白是成熟的ISP1A蛋白或如美国专利5,990,383中所描述的VIP1Aa或VIP1Ab蛋白或其活性片段(例如去除了信号序列的成熟蛋白)，或与ISP1或VIP1蛋白之任一种具有至少50％、优选至少75％、特别是至少85％序列同一性且与成熟的ISP2A蛋白组合被昆虫，优选鞘翅目昆虫，特别是玉米根虫摄入后具有杀昆虫活性的任何细菌分泌蛋白。为避免混淆，ISP-支助蛋白和ISP蛋白总是指不同的蛋白。
在本发明的一个优选实施方案中，当在标准昆虫食物上进行表面污染试验时，本发明的ISP蛋白或其等价物以如下浓度单独使用时(即不存在任何ISP支助蛋白)优选对玉米根虫幼虫特别是玉米根叶甲(Diabroticavirgifera)不表现明显的杀昆虫活性，所述浓度为这些蛋白的组合(每一种蛋白均以此浓度应用)可以导致玉米根虫幼虫，尤其是玉米根叶甲(Diabrotica virgifera)100％死亡率的浓度。具体地说，在使用标准的玉米根虫食物的表面污染试验中以70ng/cm2的浓度单独应用ISP1蛋白时，本发明的ISP1蛋白并不引起玉米根叶甲(Diabrotica virgifera)幼虫的明显死亡(即，与仅使用缓冲液的对照没有区别)，在使用标准的玉米根虫食物的表面污染试验中以36ng/cm2的浓度单独应用ISP2蛋白时，本发明的ISP2蛋白并不引起玉米根叶甲(Diabrotica virgifera)幼虫的明显死亡(即，与仅使用缓冲液的对照没有明显的区别)，而在这些浓度下将ISP1和ISP2一起使用在同种类型的试验中可以使这些幼虫的死亡率达到100％。
此处所用到的“ISP1A等价物”或“ISP2A等价物”是指这样的蛋白，当将其与ISP-支助蛋白二元组合应用于靶昆虫时，优选被这样的昆虫摄取时其对靶昆虫的毒性分别与ISP1A或ISP2A蛋白对靶昆虫的毒性相同或基本相同，而且其分别与ISP1A或ISP2A蛋白具有基本相同的氨基酸序列。按标准8-10％SDS-PAGE凝胶电泳确定的分子量分别为约45到约50kD和约95到约100kD且在组合而非单独使用时对玉米根虫幼虫有明显的杀昆虫活性的细菌蛋白，优选来自侧孢短小芽孢杆菌(Brevibacilluslaterosporus)，特别是不产生晶状包含体的侧孢短小芽孢杆菌(Brevibacilluslaterosporus)的该细菌蛋白也包含在ISP1A或ISP2A等价物的定义内。
在提及对靶昆虫施用ISP蛋白(或其等价物)和ISP-支助蛋白以取得杀昆虫效果时，所使用的术语“组合”包括同时施用(即，在相同的饲料，细胞或组织中同时施用于昆虫或由昆虫摄入)和分开地相继施用(即，施用一个之后再施用另外一个，但不是同时施用或摄入)本发明的ISP蛋白(或其等价物)和ISP-支助蛋白，只要能如期在昆虫的消化道中同时发现这些蛋白即可。因此，本发明的ISP1A蛋白可以在植物根部的某种细胞类型或某个区域表达，而本发明的ISP2A蛋白可以在同一植物根部的另一种细胞类型或另一区域表达，以致只有当根物质被摄入后上述蛋白才能相互作用。ISP蛋白或其等价物在植物，特别是玉米根部的表达及ISP-支助蛋白在与根相关的细菌如根瘤菌(rhizobacteria)菌株中的表达(或反过来)也包括于此。
此处所用到的有关ISP蛋白和ISP等价物蛋白“对靶昆虫的相同毒性”是指，在适宜的ISP支助蛋白存在时ISP蛋白引起的平均死亡率与在同样的适宜ISP支助蛋白存在时ISP等价物引起的平均死亡率没有明显的差异。具体说来，这是指ISP蛋白的LC50的95％置信界限(在适宜的ISP支助蛋白存在下进行试验时)与ISP等价物的LC50的95％置信界限(在适宜的ISP支助蛋白存在下进行试验时)相重叠的情况。
此处所用到的有关ISP蛋白和ISP等价物蛋白“对靶昆虫的基本相同的毒性”是指优选当这些蛋白在植物中表达时，由ISP和ISP等价物蛋白引起的靶昆虫的平均死亡率水平有明显的差异，但这些死亡率仍处于可用于控制或杀死相关靶昆虫的杀昆虫活性范围内。在本发明的优选实施方案中，当在相同的实验条件下相同的(重复的)体外实验中这些蛋白对靶昆虫的LC50值相差2到100，优选2到50，特别是2到20，最优选2到10倍时，所述蛋白对靶昆虫具有基本相同的毒性。
同样，可以用功能类似的氨基酸替换ISP1A或ISP2A蛋白中的某些氨基酸以获得ISP1A或ISP2A等价物。例如，所述序列中的一个或多个氨基酸可用具有相似极性的其它氨基酸作为功能等价物进行替代，导致就所述蛋白功能而言的沉默改变。序列中的氨基酸的替代物可以选自该氨基酸所属类型中的其它氨基酸。例如，非极性的(疏水的)氨基酸包括丙氨酸，亮氨酸，异亮氨酸，缬氨酸，脯氨酸，苯丙氨酸，色氨酸和甲硫氨酸。极性中性氨基酸包括甘氨酸，丝氨酸，苏氨酸，半胱氨酸，酪氨酸，天冬酰胺和谷氨酰胺。带正电荷的(碱性)氨基酸包括精氨酸，赖氨酸和组氨酸。带负电荷的(酸性)氨基酸包括天冬氨酸和谷氨酸。用上述相同类型中的氨基酸进行保守氨基酸替换所得的、与原始蛋白相比对靶昆虫保持了基本相同的杀昆虫活性的蛋白也包含于此作为本发明的ISP蛋白的等价物。
此处所用的与ISP1A蛋白有“基本上相同的氨基酸序列”的蛋白是指与ISP1A蛋白具有至少90％，尤其是至少95％，优选至少97％序列同一性的蛋白，其中序列同一性百分数是用Wisconsin GCG软件包(Madison，Wisconsin，USA)10.0版(用GCG缺省值)中的GAP程序里的blosum62评分矩阵确定的。在本申请中沿用的“序列同一性”当涉及蛋白时是指用此指定的分析方法得到的同一氨基酸的百分数。此处所用的“序列同一性”当涉及DNA序列时是用WisconsinGCG软件包(Madison，Wisconsin，USA)10.0版(用GCG缺省值)中的GAP程序里的nwsgapdna评分矩阵确定的。
此处所用的“ISP蛋白”或“本发明的ISP蛋白”是指本发明中的任意一种新蛋白，此处表示为ISP1A或ISP2A蛋白或它们的等价物。“ISP原毒素”是指由天然存在的细菌DNA序列编码的包括信号肽在内的全长ISP1A或ISP2A蛋白。“ISP毒素”是指其中的杀昆虫片段，特别是其最小毒性片段或已去除了信号肽的成熟蛋白。此处所用的“成熟的ISP”是指由天然的细菌宿主细胞分泌出的本发明的ISP蛋白，其与ISP-支助蛋白(没有N末端细菌信号肽序列)组合具有杀昆虫活性。成熟的ISP蛋白可以具有完整的天然C末端也可以是C-末端截短的蛋白。
由细菌，优选非苏云金芽孢杆菌(B.Thuringiensis)或蜡状芽孢杆菌(B.cereus)的细菌，特别是侧孢短小芽孢杆菌(Brevibacillus laterosporus)分泌的、成熟形式的表观分子量为约95到约100kD、且特征在于当与下述第二蛋白或其具有杀昆虫活性的片段相组合时具有显著的杀昆虫活性的第一蛋白，或所述第一蛋白中具有杀昆虫活性的片段也作为ISP蛋白包括在本发明的范围内，其中所述的第二蛋白是由细菌，优选不是苏云金芽孢杆菌(B.Thuringiensis)或蜡状芽孢杆菌(B.cereus)的细菌，特别是侧孢短小芽孢杆菌(Brevibacillus laterosporus)分泌的、成熟形式的表观分子量为约45到约50kD，优选约45kD的蛋白，其中所述第一和所述第二蛋白或它们的杀昆虫片段的组合在被昆虫摄入后对马铃薯甲虫、西部玉米根虫、南部玉米根虫和北部玉米根虫的幼虫具有明显的杀昆虫活性，但所述蛋白组合被玉米螟(Ostrinia nubilalis)、草地粘虫(Spodoptera frugiperda)、烟芽夜蛾(Heliothis virescens)、美洲棉铃虫(Helicoverpa zea)和Sesamianonagroides摄入后没有明显的杀昆虫活性，且其中所述的第一蛋白单独被昆虫摄入后也没有明显的杀昆虫活性。与上述第一蛋白组合被昆虫摄入后具有杀昆虫活性的上述第二蛋白也包括在本发明内。
此处所用到的“表观分子量”是以分子量标准为参照通过SDS-PAGE分析显示的分子量。本领域的技术人员知道这一分子量是近似确定的分子量，与基于氨基酸序列确定的分子量相比可以有约10-15％的差异。
此处所用的术语“isp1ADNA”或“isp2ADNA”是指分别编码以上定义的ISP1A或ISP2A蛋白的DNA序列。这包括编码以上定义的新分离蛋白或其片段的天然、人工的或合成的DNA序列，特别是经修饰后具有与植物中的密码子使用更为匹配的密码子使用的DNA序列。编码ISP1A和ISP2A蛋白的人工DNA序列的例子分别如SEQ ID Nos.9和7(由这些DNA序列编码的ISP蛋白在此处定义为ISP1A-1和ISP2A-1)所示。编码杀昆虫蛋白并与SEQ ID No.1，3，7或9 DNA序列足够相似以致于能够与这些DNA序列在严紧条件下杂交(即，有这种能力)的DNA序列也包含于此。此处所用到的“严紧杂交条件”特别是指在其中仍可获得杂交的下述条件将第一DNA序列固定在滤膜上，于50％甲酰胺，5％SSPE，2x Denhardt氏试剂和0.1％SDS中于42℃预杂交1到2小时，或在6x SSC，2xDenhardt氏试剂和0.1％SDS中于68℃下预杂交1到2小时。然后将变性的放射性标记的第二DNA直接加到预杂交液中，在任意一个以上选择的温度下温育16到24小时。温育后将上述滤膜在室温下用1x SSC，0.1％SDS洗20分钟，然后在68℃下用0.2x SSC和0.1％SDS洗3次，各20分钟。使用增感屏将上述的滤膜对X-光片(Kodak XAR-2或其等价物)于-70℃曝光24到48小时得到放射自显影像。当然，上述过程中也可以使用等价的条件和参数而仍能保持所需的严紧杂交条件。此处所用到的严紧杂交优选出现于至少有90％到95％，优选至少97％，特别是99％序列同一性的DNA序列之间。
包含在“isp1DNA”定义中的还有编码下述蛋白的所有DNA序列，所述的蛋白与SEQ ID.No.2的蛋白具有至少90％，优选至少95％，特别是至少97％，最优选至少99％的序列同一性，而且其与SEQ ID.No.2所示蛋白具有基本相同，优选相同的杀昆虫活性，其中所述蛋白序列同一性是用Wisconsin GCG软件包(Madison，Wisconsin，USA)10.0版(用GCG缺省值)中的GAP程序里的blosum62评分矩阵确定的。包含在“isp2DNA”定义中的还有编码下述蛋白的所有DNA序列，所述的蛋白与SEQ ID.No.4的蛋白有至少90％，优选至少95％，特别是至少97％，最优选至少99％的序列同一性，并且其与SEQ ID.No.4所示蛋白具有基本相同，优选相同的杀昆虫活性，其中所述蛋白序列同一性是用WisconsinGCG软件包(Madison，Wisconsin，USA)10.0版(用GCG缺省值)中的GAP程序里的blosum62评分矩阵确定的。
此处所用的“isp基因”或“ispDNA”是编码本发明的ISP蛋白的DNA序列，指任何一种上述定义的isp1A或isp2ADNA序列。
此处所用到的“ispDNA等价物”或“isp基因等价物”是编码上述定义的ISP等价物蛋白的DNA。
此处所用到的术语“含序列X的DNA/蛋白”和“具有含序列X的序列的DNA/蛋白”是指在其核苷酸序列或氨基酸序列中包括或含有至少序列X的DNA或蛋白，因此可以在5’(或N-末端)和/或3’(或C-末端)端包括其它核苷酸或氨基酸序列，例如N-末端转运肽或信号肽。此处所用的术语“包含”是一种开放式的表述，是“包括”的意思，指不是特指元件的其它元件也可以存在。此处所用术语“由…组成”是一种封闭式的表述，即仅存在那些特指元件。此处所用的术语“编码含序列X的蛋白的DNA”指含有下述编码序列的DNA，所述的编码序列经转录翻译后形成至少包含氨基酸序列X的蛋白。编码蛋白的DNA无需是天然存在的DNA，可以是半合成的，全合成的或人工DNA，并可以包括内含子和5’和/或3’侧翼区。此处所用的术语“核苷酸序列”指DNA或RNA分子的序列，所述分子可以是单链或双链形式。
此处所用的术语“基因”指侧翼带有可使能翻译成蛋白的RNA得以转录的5’和/或3’调节序列的DNA编码区，典型地，所述的调节序列至少包含启动子区。对于本发明的ispDNA，“嵌合基因”是指具有不同于在天然的宿主细胞中驱动ISP蛋白表达的天然细菌5’和/或3’调节序列的5’和/或3’调节序列的ispDNA序列。
此处所用到的“杀昆虫活性”或“杀昆虫作用”当指本发明的ISP蛋白或其等价物时是指当昆虫，优选鞘翅目昆虫，特别是玉米根虫，尤其是玉米根叶甲(Diabrotica virgifera)摄入ISP蛋白与ISP支助蛋白如第二ISP蛋白后，ISP蛋白杀死昆虫的能力比相同的实验条件下对照处理的杀昆虫水平高。优选地，所述的第二ISP蛋白是由与第一ISP蛋白相同的细菌操纵子编码的另一蛋白或其具杀昆虫活性的片段或其等价物，从而当昆虫摄入此蛋白组合时能获得最佳的昆虫死亡率。ISP蛋白的“昆虫控制量”是指在与ISP-支助蛋白组合应用这样的ISP蛋白时，足以将以该植物为食的昆虫对所述植物的损害限制在商业上可接受的水平的ISP蛋白的量，所述限制可以通过例如杀死昆虫或抑制昆虫的发育或生长从而降低它们对植物的损害且对植物的产量不造成明显的负面影响的方式来实现，其中所述的ISP-支助蛋白是例如另一种ISP蛋白，优选由与第一ISP蛋白相同的操纵子编码的另一蛋白或其具有杀昆虫活性的片段。此处所用到的“有杀昆虫作用的ISP片段”是指本发明的ISP蛋白的片段，其在与ISP支助蛋白，如另一种ISP蛋白，优选由与第一ISP蛋白相同的操纵子编码的另一ISP蛋白组合施用时保持杀昆虫活性。在上述涉及杀昆虫活性的定义中，所述的昆虫优选地是处于任何幼虫阶段的幼虫。本申请中会提到“ispDNA和其具有杀昆虫活性的片段或等价物”，在此种情况下所述的杀昆虫活性显然是指由所述DNA编码的蛋白的活性，而非DNA本身的杀昆虫活性。
根据本发明，发现本发明的ISP蛋白及其等价物，尤其是成熟的ISP1A和ISP2A蛋白对选自烟芽夜蛾(Heliothis virescens)，美洲棉铃虫(Helicoverpa zea)，烟草天蛾(Manduca sexta)，棉铃虫(Helicoverpaarmigera)，海灰翅夜蛾(Spodoptera littoralis)，草地粘虫(Spodopterafrugiperda)，Sesamia nonagroides和玉米螟(Ostrinia nubilalis)的鳞翅目昆虫没有明显的杀昆虫活性。
依照本发明，通过使编码ISP蛋白的DNA序列在转基因植物中表达，可使对本发明的ISP蛋白或其等价物敏感的靶昆虫与昆虫控制量，优选杀昆虫量的上述蛋白相接触。只有当所述的靶昆虫摄入植物组织时，其才受这些杀昆虫蛋白的影响。因此，本发明的另一个目的是提供使植物具有杀鞘翅目昆虫活性的方法以及控制鞘翅目昆虫的方法，所述的方法包括在田地里种植、播种或栽培用编码本发明的ISP蛋白的DNA序列转化的植物，特别是玉米。
可以通过本领域已知的方法去除或修饰本发明的ISP蛋白的信号肽，参见例如已发表的PCT专利申请WO96/10083，或者可以用下述的肽替换所述的信号肽，所述肽为将所述蛋白转运到叶绿体的叶绿体转运肽(例如，Van Den Broeck等，1985，Nature 313，358，或优选美国专利5,510,471中的经修饰的叶绿体转运肽)、分泌信号肽或使所述蛋白靶向其它质体、线粒体、ER或另一种细胞器的肽，或者可以用甲硫氨酸或甲硫氨酸-丙氨酸二肽替换ISP蛋白的信号肽。使蛋白靶向胞内细胞器或分泌到植物细胞外或细胞壁的信号序列存在于天然存在的靶向或分泌蛋白中，优选在下述文献中描述的那些Klsgen等(1989，Mol.Gen.Genet.217，155-161)，Klsgen和Weil(1991，Mol.Gen.Genet.225，297-304)，Neuhaus & Rogers(1998，Plant Mol.Biol.38，127-144)，Bih等(1999，J.Biol.Chem.274，22884-22894)，Morris等(1999，Biochem.Biophys.Res.Commun.255，328-333)，Hesse等(1989，EMBO J.8 2453-2461)，Tavladoraki等(1998，FEBS Lett.426，62-66)，Terashima等(1999，Appl.Microbiol.Biotechnol.52，516-523)，Park等(1997，J.Biol.Chem.272，6876-6881)，Shcherban等(1995，Proc.Natl.Acad.Sci USA 92，9245-9249)(所有这些文献引入本文作为参考)，尤其是来自玉米的靶向或分泌蛋白的信号肽序列。尽管可以将编码这类植物信号肽的DNA序列插入到编码ISP1A的嵌合基因中和编码ISP2A的嵌合基因中用于在植物中表达，但在本发明的一个实施方案中，编码这类信号肽的DNA序列仅被插入到嵌合的ISP2A基因中，而嵌合的ISP1A基因中缺少信号肽或者由甲硫氨酸或甲硫氨酸-丙氨酸二肽替代了所述的信号肽。在本发明的一个优选实施方案中，如Gleba等(1999，Proc.Natl.Acad.Sci.USA 25，5973-5977)和Borisjuk等，1999(Nat.Biotechn.17，466-469)中所述，用强的根优先启动子(特别是来自玉米的强的根优先启动子)和使蛋白从根细胞向外分泌的N-末端信号肽(优选来自玉米的信号肽，特别是分泌蛋白的信号肽，优选选自青霉杀菌素、α-淀粉酶、多胺氧化酶、细胞分裂素氧化酶、内切木聚糖酶的玉米分泌蛋白的信号肽)，使所述的蛋白从根分泌出来。
包含在本发明范围内的植物有玉米，棉花，大豆，豌豆，蚕豆，兵豆，马铃薯，番茄，烟草，莴苣，芸苔科植物，甘蔗，稻，油菜籽，芥菜，芦笋，小麦，大麦，咖啡，茶，葡萄，橡胶植物，甜菜，草皮草，高粱，燕麦，黑麦，洋葱，胡萝卜，韭菜，黄瓜，南瓜，甜瓜，向日葵，特别是易受鞘翅目昆虫损害的任何植物，最优选玉米，所述的鞘翅目昆虫优选玉米根虫、马铃薯甲虫或象甲，特别是叶甲属(Diabrotica)或马铃薯叶甲属(Leptinotarsa)种的昆虫，最优选选自下组的任何昆虫玉米根叶甲(Diabrotica virgifera)，Diabrotica barberi，黄瓜十一星叶甲(Diabrotica undecimpuncata)，马铃薯叶甲(Leptinotarsa decemlineata)和墨西哥棉铃象(Anthonomus grandis)。
此处所用到的“玉米”指所有的玉蜀黍(Zea mays)种的植物、及各种玉蜀黍的种子、根或谷粒、或包含玉米细胞或直接由玉米细胞产生的其它材料，所述玉蜀黍包括但不限于饲料玉米、甜玉米、杂交玉米、白玉米和臼齿形玉米，其既可是杂交系也可是近交系。优选地，用于本发明的玉米是产生杂交玉米的适宜亲本株系，最优选的是它们已经具有内源或转基因抗昆虫性，这使它们可以抗主要的玉米鳞翅目病虫害，其包括但不限于玉米螟(Ostrinia nubilalis)。
本发明的ISP1A和ISP2A蛋白可以按常规的方式从依照布达佩斯条约的规定于2000年1月11日保藏在BCCM-LMBP(比利时微生物协调保藏中心-Laboratorium voor Moleculaire Biologie-Plasmidencollectie，University of Gent，K.L.Ledeganckstraat 35，B-9000 Gent，比利时)、保藏号为LMBP 4009的大肠杆菌菌株中分离出来，或更优选地，上述蛋白可以从如下芽孢杆菌(Bacillus)菌株的上清液中分离，所述的芽孢杆菌优选是用含有质粒pUCIB120/ISP(保藏号为LMBP 4009)中的约7kbXbaI-EcoRI片段的质粒转化的无晶体苏云金芽孢杆菌(Bacillusthuringiensis)。所述的ISP蛋白可用于通过常规的方法制备特异的单克隆或多克隆抗体(Hfte等，1988，Appl.Environm.Microbiol.54，2010)。所述的ISP蛋白可以用蛋白酶，如半胱氨酸蛋白酶处理，以获得ISP蛋白的蛋白酶抗性片段。
编码ISP蛋白的DNA序列可由常规的方法从所保藏的菌株中分离也可以在所编码的氨基酸序列的基础上合成。
编码本发明的其它ISP蛋白的DNA序列可通过下述方式鉴定用限制性酶消化由分离菌株获得的总DNA；按大小分级分离由此产生的DNA片段，得到5到10Kb，优选7到10Kb的DNA断片；将这些断片与克隆载体相连接；用下述DNA探针筛选由所述克隆载体转化的大肠杆菌，所述的DNA探针为由已知的ISP蛋白基因的区域构建的DNA探针，或基于通过相应于已知ISP蛋白基因的某个区域的引物从ispDNA产生的特定PCR片段的DNA探针。与本发明的ISP蛋白类似，根据本发明分离的这种“其它ISP蛋白”以任一个或全部，优选全部下述特性为特征a)当这种所谓的其它ISP蛋白与ISP-支助蛋白，优选本发明的成熟ISP1A或ISP2A蛋白被昆虫摄入后，它们对南部玉米根虫、黄瓜十一星叶甲的幼虫和马铃薯甲虫、马铃薯叶甲(Leptinotarsa decemlineata)的幼虫具有明显的杀昆虫活性；b)当这种所谓的其它ISP蛋白与ISP-支助蛋白，优选本发明的成熟ISP1A或ISP2A蛋白被昆虫摄入后，它们对鳞翅目昆虫，优选玉米螟(Ostrinia nubilalis)不具有明显的杀昆虫活性；c)其成熟形式(不含信号肽)的表观分子量为约100kD或约45kD；d)它们存在于细菌培养物的上清液中，所述的细菌不是苏云金芽孢杆菌(Bacillus thuringiensis)或蜡状芽孢杆菌(Bacillus cereus)；和e)在无ISP-支助蛋白存在的情况下被昆虫摄入后，它们对玉米根虫，优选玉米根叶甲(Diabrotica virgifera)没有明显的毒性。
当然，可以根据特定的目的构建出在密码子使用上存在差异，但编码相同蛋白或具有基本上相同的杀昆虫活性的类似蛋白的任何其它DNA序列。已有报道在一些原核和真核表达系统中将密码子使用改变为宿主的密码子使用对于基因在外源宿主中的表达是理想的(Bennetzen & Hall，1982，J.Biol.Chem.257，3026；Itakura，1977，Science 198，1056-1063)。密码子使用表可以从文献(Wada等，1990，Nucl.Acids Res.18，2367-1411；Murray等，1989，Nucleic Acids Research 17，477-498)和主要的DNA序列数据库中获得。由此可以构建合成的DNA序列以产生相同或基本上相同的蛋白。显然，当本发明的ISP蛋白的氨基酸序列已知时可以设计几种DNA序列。这样的其它DNA序列包括经改变以使基因中的某些位点失活的合成的或半合成的DNA序列，所述改变可通过例如选择性灭活存在于天然序列中的某些隐藏的调节或加工元件、或通过调节全部的密码子使用使之适应更相关的宿主生物(优选需要在其中表达所述DNA序列的宿主生物)的密码子使用来进行。合成的DNA序列也可以按EP0385962，EP0618967或EP0682115所描述的方法产生。
对DNA序列进行的小修饰如上述的小修饰可以通过PCR介导的诱变常规进行(Ho等，1989，Gene 77，51-59；White等，1989，Trends in Genet.5，185-189)。新的合成的或半合成的基因可通过自动DNA合成然后连接所得的DNA片段来制备。
为阻止或延迟鞘翅目昆虫，特别是玉米根虫、棉铃象甲或马铃薯甲虫，优选马铃薯叶甲(Leptinotarsa decemlineata)、Diabrotica barberi、Diabrotica undecimpuncata、墨西哥棉铃象(Anthonomus grandis)或玉米根叶甲(Diabrotica virgifera)对表达本发明的ISP蛋白或其等价物的转基因宿主(特别是植物)产生抗性，优选在相同的宿主(优选转基因植物)中再表达另一种当其在转基因宿主(优选植物)中产生后以不同的作用方式对上述第一种毒素或毒素复合物所靶向的同种昆虫产生高毒性的蛋白或蛋白复合物。适合与本发明的ISP1A和ISP2A相组合的侯选蛋白包括与PCT出版物WO96/10083中的成熟VIP2Aa或VIP2Ab蛋白组合的成熟VIP1Aa蛋白，条件是这些VIP蛋白与所述的ISP蛋白相比具有不同的作用方式；Photorhabdus或致病杆菌属(Xenorhabdus)种的玉米根虫毒素，例如发光杆菌(Photorhabdus luminescens)W-14的杀昆虫蛋白(Guo等，1999，J.Biol.Chem.274，9836-9842)；WO00/26378中的CryET70蛋白；WO97/40162中所描述的Bt菌株PS80JJ1，PS149B1和PS167H2产生的杀昆虫蛋白，特别是Bt菌株PS149B1的约14kD和约44kD蛋白；美国专利6,023,013中的Cry3Bb蛋白；蛋白酶抑制剂，例如大豆N2和R1半胱氨酸蛋白酶抑制剂(Zhao等，1996，Plant Physiol.111，1299-1306)，或oryzastatine如水稻半胱氨酸蛋白酶抑制剂(Genbank登录号S49967)，玉米半胱氨酸蛋白酶抑制剂(Genbank登录号D38130，D10622，D63342)例如Irie等(1996，Plant Mol.Biol.30，149-157)描述的在植物中表达的玉米半胱氨酸蛋白酶抑制剂。上述蛋白的所有等价物和变异体，如保持杀昆虫活性的截短蛋白也包括在此中。
这种组合表达可以通过如下方式实现对经转化已表达玉米根虫毒素蛋白或蛋白复合物的植物进行转化，或使经转化表达不同玉米根虫毒素蛋白的植物杂交。或者，可以在玉米根虫幼虫摄食根组织时诱导本发明的ISP蛋白在根中表达，例如用损伤诱导型启动子区域，优选损伤诱导型根优先的启动子区域来进行诱导。
可以将从本发明isp基因的总DNA制备的5到10，优选7到10Kb的片段与合适的表达载体相连然后转化到大肠杆菌中，再用针对ISP蛋白的单克隆或多克隆抗体通过常规的菌落免疫探测方法(French等，1986，Anal.Biochem.156，417-423)筛选表达所述毒素的克隆。还可以将由本发明的细菌菌株的总DNA制备的5到10Kb的片段与合适的Bt穿梭载体(Lereclus等，1992，Bio/Technology 10，418)相连接，然后转化无晶体Bt突变体。之后筛选产生ISP蛋白的克隆(通过SDS-PAGE，Western印迹和/或昆虫实验)。
编码本发明的ISP蛋白的基因可以通过常规的方法测序(Maxam和Gilbert，1980，Methods in Enzymol.65，499-560；Sanger，1977，Proc.Natl.Acad.Sci.USA 74，5463-5467)以获得其DNA序列。序列比较显示所述的基因与以前描述的芽孢杆菌或其它细菌菌种在营养生长阶段分泌的蛋白的编码基因以及具有抗鞘翅目昆虫活性的苏云金芽孢杆菌(Bacillusthuringiensis)晶体蛋白的编码基因均不同(Crickmore，等，1998，Microbiology and Molecular Biology Reviews Vol 62807-813；WO98/44137，WO94/21795，WO96/10083，WO00/09697，WO9957282和WO9746105)。
为了在大肠杆菌、其它细菌菌株或植物中表达编码本发明ISP蛋白的DNA序列的全部或有杀昆虫活性的部分，可以在所述DNA序列的两侧引入合适的限制性位点。这可以通过已知的方法(例如，Stanssens等，1989，Nucleic Acids Research 12，4441-4454；White等，1989，同上)由定点诱变完成。为能在植物中表达，本发明的ispDNA或其等价物通常包含于两测带有5′和3′调节序列的嵌合基因中，所述的调节序列包括在植物中可表达的启动子区域和在植物细胞中有活性的3′转录终止以及多腺苷酸化序列。为增强在植物中的表达，可对本发明的ispDNA或其等价物的密码子使用进行修饰以形成等价的、修饰的或人工的基因或部分基因，或者，可以将所述的ispDNA或其有杀昆虫作用的部分插入到叶绿体基因组中并利用在叶绿体中有活性的启动子使之在其中表达(例如，Mc Bride等，1995，Bio/Technology 13，362)。为了增强在单子叶植物，如玉米中的表达，也可以向嵌合基因中加入单子叶植物内含子，并且ispDNA或其有杀昆虫作用的部分可以进一步以翻译上中性的方式改变，通过定点内含子插入和/或通过向所使用的密码子中引入改变以更改该基因部份中存在的可能抑制性DNA序列，例如在不明显改变所编码的氨基酸序列的情况下调整密码子使用使之对特定的植物而言是最优选的(Murray等，1989，见上)。
编码ISP蛋白的有杀昆虫作用的ispDNA或其等价物，优选isp嵌合基因可以通过常规的方法稳定地插入到单一植物细胞的核基因组中，由此转化的植物细胞可通过常规的方法用于产生抗昆虫的转化植物。在这一方面，根癌农杆菌(Agrobacterium tumefaciens)中含有具杀昆虫作用的isp基因部分的卸甲(disarmed)Ti质粒可以用于转化植物细胞，其后可以用下述文献中描述的方法从该转化的植物细胞再生转化植物，所述文献例如EP0116718，EP0270822，PCT出版物WO84/02913和已公开的欧洲专利申请(″EP″)0242246和Gould等(1991，Plant Physiol.95，426-434)。优选的Ti-质粒载体均包含位于Ti-质粒的T-DNA边界序列之间或至少定位于右边界序列的左侧的有杀昆虫活性的isp嵌合基因序列。当然，应用下述方法，其它类型的载体也可以用于转化植物细胞，所述的方法如直接基因转移(如EP0233247中所描述)，花粉介导的转化(如EP0270356，PCT出版物WO85/01856，和美国专利4,684,611中的描述)，植物RNA病毒介导的转化(如EP0067553和美国专利4,407,956中所描述的)，脂质体介导的转化(如美国专利4,536,475中所描述的)，以及其它的方法例如用于转化某些玉米株系(Fromm等，1990，Bio/Technology 8，833-839；Gordon-Kamm等，1990，The Plant Cell 2，603-618，US专利5,767,367)和水稻株系的方法(Shimamoto等，1989，Nature 338，274-276；Datta等，1990，Bio/Technology 8，736-740)和最近公开的一般用于转化单子叶植物的方法(PCT出版物WO92/09696)。
为实现两种ISP蛋白在转基因植物中的组合表达可以应用不同的常规方法，小结如下I.通过嵌合基因构建体使两个ISP DNA序列和标记基因作为单一的一段DNA转移到植物基因组中，并且插入到基因组的单一位点中。
Ia.改造所述的基因使之处于受不同启动子控制的不同转录单元中。
为使两个ISP蛋白和标记蛋白作为分离的转录单元表达，如上所述可以应用在植物细胞中指导表达的几个启动子片段。对于一个ISP基因的嵌合构建体，上述启动子均可以组合在其中。在本发明的每一嵌合基因中的ISP编码区可以是完整的isp基因，或优选是完整isp基因中具有杀昆虫活性的部分。依照标准的方法(例如，EP0193259)将各个嵌合基因克隆到同一质粒载体中。
Ib.可以将两个基因(例如，isp和标记基因或两个isp基因)或更多个基因组合在同一个转录单元中。
为在相同的转录单元中表达两个isp基因，能够区分出下述的情况在第一种情况中，可以将其中一个基因的编码区按符合读框的方式与另一基因的编码区融合的杂合基因置于单一启动子的控制之下。可以使isp基因和标记基因融合，也可以使两个isp基因融合。
而且，在两个编码ISP或其具有杀昆虫活性的片段的基因之间可以包含一段编码对蛋白酶(例如，胰蛋白酶，半胱氨酸或丝氨酸蛋白酶)敏感的蛋白部分的基因片段，例如编码可通过靶昆虫中肠酶的激活作用而去除或裂开的ISP蛋白部分的基因片段。或者，在两个编码ISP或其具有杀昆虫活性的片段的基因之间可以包含一段编码具有约16到20个氨基酸、无须酶反应即能介导在自身C末端裂解的肽的基因片段(Halpin等，1999，Plant J.17，453-459，US专利5,846,767)，或编码接头肽序列的基因片段，所述的接头肽使得可以产生对靶昆虫具有显著毒性的重组细胞。
在第二种情况下，可以将两个isp基因的相应编码区组合于一个启动子控制下的双顺反子单元中。两个isp因的编码区彼此前后排列，中间有规定长度的基因间序列。产生单一的信使RNA分子，而翻译成两个分离的基因产物。基于经修饰的扫描模型(Kozak，1987，Mol.Cell.Biol.7，3438-3445)，翻译再起始的概念已被接受，条件是具有上游ATG的框内的终止密码子在下游的ATG之前。实验数据也显示植物的翻译机器能由多顺反子mRNA合成几个多肽(Angenon等，1989，Mol.Cell Biol.9，5676-5684)。
基于翻译的内部起始机制(Jackson和Kaminski，1995，RNA 1，985-1000)，第二个基因翻译的起始是通过43S前起始复合物与特定的基因间序列(内部核糖体进入序列；IRES)结合而出现的。实验数据也显示植物的翻译机器能由含基因间IRES元件的多顺反子mRNA合成几个多肽(Hefferon等，1997，J Gen Virol 78，3051-3059；Skulachev等，1999，Virology 263，139-154；PCT专利出版物WO98/54342)。II.将带有一个isp基因的嵌合构建体转移到已有一个isp基因转化到其中的植物的基因组中可在连续转化步骤(再转化)过程中将几个基因引入到植物细胞中，条件是对于第二轮转化有可供选择的筛选转化体的系统，或者选择标记基因可通过DNA重组技术从植物基因组中切除(例如，已公开的PCT申请WO94/17176和WO91/09957中所描述的)。这种再转化导致被引入到基因组中多个位点的isp基因的组合表达。优选地，在两个连续的转化步骤中使用两个不同的选择标记基因。第一个选择标记用于在第一次转化中选择转化细胞，第二个选择标记用于在第二轮转化中选择转化体。利用卡那霉素和潮霉素的连续转化步骤已有报道，例如Sandler等(1988，Plant Mol.Biol.11，301-310)和Delauney等(1988，Proc.Natl.Acad.Sci.U.S.A.85，4300-4304)的描述。III.带有isp基因的嵌合构建体通过独立的转化事件分别转移到不同的植物核基因组中，然后通过杂交结合到单一的植物基因组中。
第一植物应当是用第一isp基因转化的植物或通过自花授粉从该植物衍生的F1植物(优选具有纯合isp基因的F1植物)。第二植物应当是用第二isp基因转化的植物或通过自花授粉从该植物衍生的F1植物(优选具有纯合的第二isp基因的F1植物)。筛选由此杂交获得的植物以获得在其基因组中存在这两个isp基因(如，Southern印迹)并表达这两个ISP(例如，对免疫学上不同的ISP的单独的ELISA检测)的植物。这是从用不同的isp基因转化的两亲本株系产生杂交变体的有用策略，并是通过来自相同近交系的两个独立转化体(或它们的F1自花授粉子代)的杂交产生包含两个不同isp基因的近交系的有用策略。IV.将带有一个或多个isp基因的嵌合构建体通过同一个转化实验分别单独地转移到一个植物的基因组中，由此导致各个嵌合基因插在相同或不同的位点。
共转化涉及用两个不同的表达载体同时转化一株植物，所述的表达载体一个包含第一isp基因，另一个包含第二isp基因。伴随每个isp基因使用不同的标记基因，这样可以利用两个标记同时筛选。或者，可以使用一个标记，然后可以筛选足够大量的备选植物以获得具有两个isp基因(例如，通过Southern印迹)并表达两个蛋白(例如，通过ELISA的方式)的植物。用不只一个T-DNA进行的共转染可以同时用各带有不同的Ti质粒的两个不同的农杆菌菌株来完成(Depicker等，1985，Mol.Gen.Genet.201，477-484)，或用包含两个位于不同的质粒上的T-DNA的一个农杆菌来完成(de Framond等，1986，Mol.Gen.Genet.202，125-131)。用两种质粒或其片段的混合物进行的直接基因转移也可以用于可选择的基因和不可选择的基因向植物细胞的共转化(Schocher等，1986，Bio/technology 4，1093-1096)。
所得的转化植物可以在常规的植物育种方案中应用，以产生更多具有相同特征的转化植物或将具有杀昆虫活性的isp基因引入到相同或相关植物种的其它变体中。从所述转化植物收获的种子包含稳定地插入到其基因组中的杀昆虫性isp基因。可以用常规的方法培养转化植物的细胞以产生具有杀昆虫活性的ISP蛋白部分，可以回收该部分，将其用于常规的杀昆虫组合物中。当然，上述在植物中组合产生ISP蛋白的可能方案对本发明的ISP蛋白活性片段和ISP等价物同样适用。
将具有杀昆虫活性的isp基因插入到植物细胞基因组中，使所插入的基因可操作地连接到可指导所述基因在植物细胞中表达的启动子的下游(即3’端)。优选地这通过向植物细胞基因组，特别是细胞核或叶绿体基因组中插入嵌合的isp基因来完成。优选的启动子包括隔离群CM 1841(Gardner等，1981，Nucl.Acids Res.9，2871-2887)，CabbB-S(Franck等，1980，Cell 21，285-294)和CabbB-JI(Hull和Howell，1987，Virology 86，482-493)的花椰菜花叶病毒(CaMV)强组成型35S启动子(“35S启动子”)；遍在蛋白家族的启动子(例如，Christensen等，1992，Plant Mol.Biol.18，675-689中描述的玉米遍在蛋白启动子；也可参见Cornejo等，1993，PlantMol.Biol.23，567-581)，gos2启动子(de Pater等，1992，Plant J.2，837-844)，emu启动子(Last等，1990，Theor.Appl.Genet.81，581-588)，水稻肌动蛋白启动子，例如Zhang等(1991，The Plant Cell 3，1155-1165)描述的启动子；和分别驱动T-DNA中1′和2′基因表达的TR1′启动子以及TR2′启动子(分别为“TR1′启动子”和“TR2′启动子”)(Velten等，1984，EMBO J 3，2723-2730)。或者，可以使用非组成型但对植物的一个或多个组织或器官(例如叶和/或根)具有特异性的启动子，由此使所插入的isp基因仅在特定的组织或器官的细胞中表达。在本发明的一个优选实施方案中，通过将具有杀昆虫活性的isp基因部分置于根优先的启动子(即，在植物的根组织中最活跃的启动子，优选在非根组织，例如花粉、叶和茎中不或几乎不转录的启动子，更优选只在根中进行可检测的转录的启动子)的控制之下，使具有杀昆虫活性的isp基因在植物，优选玉米的根中选择性地表达。根优先的启动子并不需要仅在根中具有活性。本发明的根优先的启动子包括但不限于紧接位于相应于根特异的cDNA的DNA序列上游的启动子，优选来自玉米；美国专利5,837,876，已公开的PCT专利申请WO00/29594，WO00/73474，WO01/00833，或美国专利6,008,436中的启动子；美国专利5,633,363和Held等(1997，Plant Mol.Biol.35，367-375，Genbank登录号U38790)中的ZRP2启动子；美国专利5,817,502中的启动子；de Framond(1991，FEBS 290103-106；EP0452269)描述的启动子，来自小麦的过氧化物酶基因POX1的根特异性启动子(Hertig等，1991，Plant Molec.Biol.16，171-174)，美国专利5,837,848中的启动子，PCT出版物WO015662中的启动子，Goddemeier等(1998，Plant Mol.Biol.36，799-802)所述的启动子。可对本发明有用的其它根特异的或根优先的启动子包括下述文献中描述的启动子Hirel等，1992，Plant Mol.Biol.20，207；Keller和Baumgartner，1991，The Plant Cell 3，1051-1061；Sanger等，1990，Plant Mol.Biol.14，433-443；Miao等，1991，The Plant Cell 3，11-22；Bogusz等，1990，The Plant Cell，2，633-641；Leach和Aoyagi，1991，Plant Science 79，69-76；Teeri等，1989，EMBO Journal 8，343-350，所有这些引入本文作为参考。
如美国专利5,254,799中所述可以通过利用植物本身或其它植物例如豌豆的核酮糖-1，5-二磷酸羧化酶小亚基基因的启动子来实现在植物叶中的表达。另一可供选择的方案是使用可诱导(例如，通过温度或化学因子)表达的启动子。而且，对于玉米，特别当玉米根虫成虫出现在带玉米根虫的地里时，利用可在玉米花粉中表达的启动子区，如在已公开的PCT申请WO93/25695和WO01/12799中描述的启动子在花粉中进行表达是优选的。
将具有杀昆虫活性的isp基因插入到植物基因组中，使所述的插入基因位于合适的3′端转录调节信号(即，转录本形成和多腺苷酸化信号)的上游(即，5’)。
这优选通过将isp嵌合基因插入到植物细胞基因组中而完成。在本发明嵌合基因中3′调节序列的选择并不是关键性的。有些情况下，嵌合基因中不存在这样的区域也可以获得很好的表达，这是因为插入位点处的DNA序列可以充当3′调节序列。优选的多腺苷酸化和转录本形成信号包括CaMV 35S(Mogen等，1990，The Plant Cell 2，1261-1272)，章鱼肉碱合酶基因(Gielen等，1984，EMBO J 3，835-845)，胭脂碱合酶基因(Depicker等，1982，J.Mol.Appl.Genet.1，p.561)，和T-DNA基因7(Velten和Schell，1985，Nucleic Acids Research 13，6981-6998)的这些信号，其可在转化的植物细胞中充当3’-非翻译DNA序列。
任选地，具有杀昆虫活性的isp基因可作为与标记基因，如编码卡那霉素抗性的neo基因(EP0242236)共用同一个启动子的杂合基因(US专利5,254,799；Vaeck等，1987，Nature 327，33-37)选择性地插入到植物基因组中，以使所述植物表达融合蛋白。
还可用全部或部分isp基因转化其它细菌，如对鞘翅目或鳞翅目昆虫具有杀昆虫活性的苏云金芽孢杆菌、或定居于根的细菌如定居于根的恶臭假单孢菌(Pseudomonas putida)(Vilchez等，J.Bacteriol.182，91-99)。由此可产生对杀灭昆虫有用的并可影响多种鞘翅目和鳞翅目昆虫害虫的转化细菌。可以用整合到合适的克隆载体上的全部或部分isp基因进行细菌转化，所述的细菌如土壤杆菌属(Agrobacterium)、芽孢杆菌属(Bacillus)或埃希氏菌属(Escherichia)细菌，所述的转化可以通过常规的方式如热激转化(Bergmans等，1981，J.Bacteriol 146，564-570)或如Mahillon等(1989，FEMS Microbiol.Letters 60，205-210)和PCT专利出版物WO90/06999中所描述的电穿孔技术来进行。
含有本发明isp基因的转化细菌菌株如芽孢杆菌属种菌株，优选苏云金芽孢杆菌可以通过常规的方法发酵(Dulmage，1981，“制备用于生物控制昆虫的细菌”，Biological Control in Crop Production，编者Paparizas，D.C.，Osmun Publishers，Totowa，N.J.，USA，pp.129-141；Bernhard和Utz，1993，“制备实验用和商用的苏云金芽孢杆菌杀昆虫剂”，Bacillusthuringiensis，An Environmental BiopesticideTheory and Practice，pp.255-267，编者Entwistle，P.F.，Cory，J.S.，Bailey，M.J.和Higgs，S.，JohnWiley and Sons，纽约)以提供高产量的细胞。
本发明的杀昆虫剂，特别是抗鞘翅目(优选抗玉米根虫)组合物可按常规的方式利用经isp基因转化的微生物或优选地它们各自的ISP蛋白或其具有杀昆虫活性的部分作为活性成份，与合适的载体、稀释剂、乳化剂和/或分散剂一起配制(例如，参见Bernhard和Utz，1993，同上)。这种杀昆虫组合物可以配制成可湿性粉末、小球、颗粒或粉剂，或者用水性或非水性的溶剂配制的成液体制剂，泡沫，凝胶，悬液或浓缩液等。已知的微生物包括假单孢菌(Pseudomonas)或其它细菌细胞，这些细胞使蛋白在用于昆虫之前被包封在稳定的环境中。包含本发明的ISP1A和ISP2A蛋白作为组合制剂用以同时、分开或连续使用以保护玉米不受玉米根虫侵害的的产品也包括在本发明的范围之内，具体说来，所述的产品是杀昆虫组合物或转基因玉米。
本发明的控制昆虫，特别是鞘翅目昆虫的方法包括向待保护的场所(区域)施用(例如，喷洒)杀昆虫量的ISP蛋白或用本发明的isp基因转化的宿主细胞。待保护的场所包括例如昆虫害虫栖息地或生长中的植物或将种植植物的区域。
为获得ISP蛋白，可以按常规的方式在合适的培养基上培养表达ISP蛋白的重组宿主细胞，再通过常规的方式从培养基中收获蛋白。然后通过标准的技术如层析，抽提，电泳等分离纯化ISP蛋白。再用如半胱氨酸蛋白酶或丝氨酸蛋白酶消化所得的蛋白以获得抗蛋白酶形式的毒素。
检测杀昆虫活性的生物试验是本领域熟知的。在Marrone等(1985，J.Econ.Entomol.78，290-293)中描述了一种玉米根虫试验方法，许多其它利用人工食物或转基因植物检测昆虫的方法也是已知的，例如美国专利5,990,383。在适宜的生物试验中包括适当的对照以检测背景死亡率。
下面所给出的实施例用以举例说明本发明，但不作为对本发明或其保护范围的限制。这些实施例的许多改变形式和等价形式均是本领域的普通技术人员基于本发明的教导和公知常识所能作到或设想出的。本申请中提及的序列表(其作为本发明的一部分，附于其后)如下序列表SEQ ID No.1-ISP1A蛋白和DNA的氨基酸序列和DNA序列SEQ ID No.2-ISP1A蛋白的氨基酸序列SEQ ID No.3-ISP2A蛋白和DNA的氨基酸序列和DNA序列SEQ ID No.4-ISP2A蛋白的氨基酸序列SEQ ID No.5-短zrp2启动子片段的DNA序列(n＝任意核苷酸)SEQ ID No.6-长zrp2启动子片段的DNA序列(n＝任意核苷酸)SEQ ID No.7-编码ISP2A-1蛋白的DNA序列SEQ ID No.8-ISP2A-1蛋白的氨基酸序列SEQ ID No.9-编码ISP1A-1蛋白片段的DNA序列SEQ ID No.10-ISP1A-1蛋白的氨基酸序列在实施例中如不另外指出，所有产生和操作重组DNA的步骤均依照如Sambrook等，Molecular Cloning-A Laboratory Manual，Second Ed.，Cold Spring Harbor Laboratory Press，NY(1989)，和Ausubel等(1994)Current Protocols in Molecular Biology，Current Protocols，USA第1、2卷中所述的标准方法进行。植物分子生物学操作的标准材料和方法参见PlantMolecular Biology Labfax(1993)，R.R.D.Croy编，BIOS ScientificPublications Ltd(UK)和Blackwell Scientific Publications(UK)联合出版。PCR技术的操作见M.A.Innis，D.H.Gelfand，J.J.Sninsky和T.J.White等编写的“PCR protocolsa guide to methods and applications”(AcademicPress，Inc.，1990)中所述。
将该菌株在LB琼脂平板(添加1.5％琼脂的LB培养基；LB培养基10g/l胰蛋白胨，10g/l NaCl，5g/l酵母抽提物，pH7.3)上于28℃下培养过夜。为进行小规模的培养，接种20ml TB培养基(Terrific液体培养基12g/l胰蛋白胨，24g/l酵母抽提物，3.8g/l KH2PO4，12.5g/l K2HPO4，5ml/l甘油，pH7.1)并在约70转每分钟的旋转平台上于28℃下培养65小时。65小时后，向培养物中添加蛋白酶抑制剂混合物。此鸡尾酒混合物具有如下成分(所给体积为需要加入一份20ml的培养物中的体积)200μl PMSF(100mM)，200μl苯甲脒.HCl(100mM)和ε-氨基-正-己酸(500mM)的混合物，400μl EGTA(0.5M)，40μl抗蛋白酶(0.5mg/ml)/亮抑蛋白酶肽(0.5mg/ml)和20μlβ-巯基乙醇(14M)。将已加入蛋白酶抑制剂混合物的培养物3000rpm离心20分钟。某些情况下，将上清液用Centriprep YM-10离心过滤装置(Millipore Cat.No.4305)浓缩4倍。为长期保存，将一环产孢子的细胞加到0.5ml 25％或50％甘油中，涡悬振荡后于-70℃下保存。产孢子的细胞是通过将所述菌株于LB琼脂平板上培养直到形成孢子(在光学显微镜下清晰可见)而获得的。
将单细胞菌落在LB琼脂平板上培养后，对IB120-A菌株培养物的显微镜分析结果显示存在杆状可移动的单个营养细胞和含有卵形孢子的膨胀孢子囊。在IB120-A菌株培养物中没有检测到伴孢晶体。
在人工食物(Sutter等(1971，J.Econ.Entomol.64，65-67)描述的食物)上进行的表面污染分析中，IB120-A菌株的上清液表现出对玉米根叶甲(Diabrotica virgifera)幼虫(此后称作“Dv”)的强烈毒性。上述分析是在24孔Costar板中于24℃(+/-1℃)下进行的，50微升毒素溶液每孔(2cm2)，对每个样品用6个孔(每孔4个L1(一龄)幼虫)进行分析(7天后作评价)。
筛选在起始培养后7，24，30，48和120小时收获的上清液，显示在48小时对Dv有最强的毒性，在第7小时的时候没有发现明显的毒性。在第48小时，将上清液(总蛋白浓度214μg/ml)以1/1024稀释后仍可观察到50-60％的死亡率。
在开始培养后48，65和144小时收获的IB120-A上清液(稀释比例为1/1到1/8)经热处理后丧失活性，但经硫酸铵沉淀后活性仍保留，这表明所述的毒性化合物可能是一种蛋白质。
利用旋转酶B基因(Yamada等，1999，Appl.Environm.Microbiol.65，1483-1490)的PCR引物对IB120-A菌株的初步表征提示其不是苏云金、炭疽(Bacillus anthracis)或蜡状芽孢杆菌亚种。用特异表征Paenibacillus属16S RNA序列的引物所进行的PCR也没有得到扩增产物，上述引物也识别缓病芽孢杆菌(Bacillus lentimorbus)和日本甲虫芽孢杆菌(Bacilluspopilliae)(Pettersson等，1999，Int J Syst Bacteriol.49(2)，531-540)。在NB(营养肉汤3g/l细菌培养用牛肉膏，5g/l细菌培养用蛋白胨，pH6.8)培养基中的生长表明该新菌株不是幼虫芽孢杆菌(Bacillus larvae)种。因此这一IB120-A菌株看来不同于目前已分离的已知产生不包含于晶体中的分泌型杀昆虫蛋白的芽孢杆菌(Bacillus)菌株。
基于杆状形状和需氧生长，该菌株可能是芽孢杆菌属(Bacillus)种的菌株。在用一组针对苏云金芽孢杆菌cry3基因的一般和特异引物分析菌株IB-120A时没有发现扩增产物。
用标准的微生物鉴定技术对IB120-A菌株进行详细地分析，包括脂肪酸分析和结合API 20E试验的API 50CHB试验，表明这一菌株是侧孢短小芽孢杆菌(Brevibacillus laterosporus)种的菌株。实施例2.isp1和isp2 DNA/蛋白的分离和表征为分离IB120-A中与毒性相关的基因，提取该菌株的总DNA并用Sau3A进行部分酶切。经消化的DNA用蔗糖梯度按大小分级分离，将在7kb到10kb范围的片段连接到用BamHI-消化及TsAP(热敏感的碱性磷酸酶)处理的克隆载体pUC19(Yannisch-Perron等，1985，Gene 33，103-119.)上。将连接混合物通过电穿孔转化到大肠杆菌XL1-Blue细胞中。将转化体涂布在含Xgal和IPTG的LB-triacillin平板上，选择白色克隆用于滤膜杂交实验。用如下制备的DIG标记探针筛选含有所述载体的重组大肠杆菌克隆。首先，以IB120-A菌株细胞为模板进行PCR。所得的扩增产物经凝胶纯化后用作二次PCR反应的模板，所述的二次PCR使用DIG标记的dNTP和与第一次PCR反应相同的引物。将适当量的扩增产物用于杂交反应。
鉴定了含带有全长isp基因的质粒的阳性菌落后，利用染料末端标记方法和Perkin Elmer ABI Prism-377 DNA测序仪确定这些基因的序列。在阳性菌落中的克隆DNA片段上的两个开放阅读框的序列如SEQ ID No.1和3所示。发现这些DNA序列被组织在一个操纵子中并编码新蛋白ISP1A(SEQID No.2)和ISP2A(SEQ ID No.4)，正是由于这两个蛋白的原因使我们观察到高杀昆虫活性。含带有毒性有关基因的pUC-衍生质粒(质粒pUCIB120/ISP)的阳性菌落已按布达佩斯条约的规定于2000年1月11日提交了保藏，作为保藏号为LMBP 4009的大肠杆菌XL1Blue。
从阳性菌落提取质粒，用XbaI和EcoRI酶切(得到约7Kb的片段)，再将其连接到经同样限制性酶切的穿梭载体pSL40上。获得质粒pSLIB120/ISP。将该pSLIB120/ISP质粒转入不产生晶体的苏云金芽孢杆菌菌株中。这一重组Bt菌株的上清液依如下方式获得。
将所述菌株在含红霉素(20μg/ml)的LB琼脂平板上于28℃下培养过夜。为进行小规模的培养，接种20ml含红霉素(20μg/ml)的TB培养基并在约70转每分钟的旋转平台上于28℃下生长65小时。65小时后，向培养物中添加蛋白酶抑制剂混合物。此鸡尾酒混合物具有如下成分(所给体积为需要加入一份20ml培养物中的体积)200μl PMSF(100mM)，200μl苯甲脒.HCl(100mM)和ε-氨基-正-己酸(500mM)的混合物，400μl EGTA(0.5M)，40μl抗蛋白酶(0.5mg/ml)/亮抑蛋白酶肽(0.5mg/ml)和20μlβ-巯基乙醇(14M)。将已加入蛋白酶抑制剂混合物的培养物3000rpm离心20分钟。某些情况下，将上清液用Centriprep YM-10离心过滤装置(Millipore Cat.No.4305)浓缩约4倍。
在上述的Dv表面污染分析中，含pSLIB120/ISP质粒的重组Bt菌株的培养物上清液在起始培养后第48小时经1/1024稀释后仍表现出明显死亡率，在60％范围内，而对照(对照包含未经转化的Bt菌株的上清液)的死亡率为0％。这表明此分离的DNA编码IB120-A菌株中的杀昆虫组分，当其转移到其它细菌中后，该杀昆虫组分也可以表达并分泌到培养基中。使用以pSLIB120/ISP质粒转化的另一个独立的不产生晶体的Bt菌株进行的毒性分析也确证了，与未经转化的对照相比转化菌株的上清液表现出高杀昆虫活性。
通过上述用Dv幼虫进行的表面污染分析，发现表达两种ISP蛋白的Bt菌株的上清液的LC50值在4天后为3.5ng/cm2(基于上清液中的总蛋白浓度)。关于表达ISP1A和ISP2A蛋白的重组Bt菌株的上清液对所选择的鞘翅目昆虫的毒性的详细分析结果列于下表1中。本发明的ISP蛋白对西、北和南部玉米根虫幼虫以及马铃薯甲虫和棉铃象甲幼虫均具有显著的杀昆虫活性。
成熟的ISP1和ISP2蛋白经硫酸铵沉淀再经过不同的色谱柱纯化到近似均质。色谱分析表明ISP1A和ISP2A蛋白以等克分子比例存在于上清液中。发现ISP1A蛋白相当疏水而ISP2A相当亲水。对不产生晶体的重组Bt菌株中产生的成熟ISP1A和ISP2A蛋白进行的氨基末端序列测定结果表明对于ISP1A SEQ ID No.2的第38位氨基酸和对于ISP2A SEQ ID No.4的第51位氨基酸是存在于转化的Bt菌株上清液中的活性蛋白的N-末端氨基酸。ISP1A的N末端为IATTTQASKD，ISP2A的N末端为LVKTTNNTED，其与所分离的DNA序列的氨基酸序列完全匹配。
用37，50，75，100和150kD分子量标记，通过8％ SDS-PAGE凝胶电泳确定，纯的成熟ISP1A蛋白的表观分子量为约100kD，通过10％SDS-PAGE凝胶电泳确定，纯的成熟ISP2A蛋白的表观分子量为约45kD。
由重组菌株产生的成熟ISP1A和ISP2A蛋白的活性针对几种昆虫进行了评估，对于所选择的鞘翅目昆虫的结果列于下表1。表1ISP1A-ISP2A对鞘翅目昆虫的活性
对表1的注释Dv玉米根叶甲(Diabrotica virgifera)，西部玉米根虫；DbDiabroticabarberi，北部玉米根虫；Du黄瓜十一星叶甲食根亚种(Diabroticaundecimpunctata howardi)，西部玉米根虫；Ld马铃薯叶甲(Leptinotarsadecemlineata)，马铃薯甲虫；Ag墨西哥棉铃象(Anthonomus grandis)，棉铃象甲；L1第一幼虫阶段；L2第二幼虫阶段；L3第三幼虫阶段；L1+2d孵化2天后；*90％CL(CL＝置信界限，LC50杀死50％昆虫的上清液中的总蛋白浓度)。
所用的生物测定Dv，Db，Du以25μl/cm2的比例利用人工食物进行表面污染分析(参见上述)，7天后作评价；Ld用马铃薯叶进行浸泡试验(切下马铃薯的叶，浸于毒性溶液中，晾干后置于盛有10条幼虫的平皿(直径9cm)中；1天后，向平皿中加入未经处理的叶，5天后作评价)；Ag人工食物掺入试验如Moore和Whisnant，Handbook of Insect Rearing，Vol.I，Pritah Singh和R.F.Moore；Elsevier，Amsterdam，1985，p.217中描述的食物；测定每25ml食物中掺入2ml毒素溶液，在24多孔Costar平板中(约1ml/孔)进行，每孔1个卵，每个样品20个孔，14天后作评价)。
在表1报道的测定结果中，对照(未处理的食物，在此食物中添加了未经转化的无晶体Bt菌株的上清液或水)导致上述所有昆虫的死亡率不高于20％(根据幼虫阶段和昆虫种类的不同，对照死亡率在5到20％之间变化(20％值对应于Dv的第三幼虫阶段))。
当从重组的Bt菌株上清液中纯化出ISP1A和ISP2A蛋白后，在联合施用等摩尔的上述蛋白时，通过上述的生物试验获得的针对玉米根叶甲(Diabrotica virgifera)幼虫的LC50值与上述所得值没有显著的区别。
在标准表面污染试验中生物测定成熟的ISP1A和ISP2A蛋白的混合物对选择的鳞翅目昆虫(欧洲玉米螟(Ostrinia nubilialis)，烟芽夜蛾(Heliothisvirescens)，美洲棉铃虫(Helicoverpa zea)，草地粘虫(Spodopterafrugiperda)，Sesamia nonagrioides，海灰翅夜蛾(Spodoptera littoralis)，棉铃虫(Helicoverpa armigera)，和烟草天蛾(Manduca sexta))的作用，结果表明与对照相比本发明的ISP蛋白在这些昆虫中并没有引起较高死亡率。这证实了本发明蛋白的鞘翅目昆虫特异性性质。用两蚜虫种所进行的初步生物试验也表明ISP1A和ISP2A蛋白的混合物并不在这些昆虫中引起明显的死亡率。
为确定是isp基因的哪个片段足以编码对叶甲(Diabrotica)幼虫具有毒性的ISP蛋白复合物，通过向isp基因的ORF中的不同位置插入终止密码子(由此形成不同的3’基因截短)以获得一系列的C-末端截短ISP蛋白。所述的终止密码子通过Genome Priming System(GPS，New EnglandBiolabs，catalog #7100)插入在随机的位置。利用这一系统，1.7kb转座子(在全部三个开放阅读框和2个与特异引物支助的序列中均包含终止密码子)被随机地插入到“靶”DNA中，但只插入一次。这样可以通过基因特异性的引物和转座子特异性的引物由PCR筛选估计，或通过测序精确地确定插入的位置和由此造成的截短。然后用一组在一个isp基因的不同位置带有转座子的构建体分别单独转化无晶体的Bt菌株，并通过上述的试验测定西部玉米根虫幼虫对这些重组Bt菌株上清液的敏感性。
为使isp2基因截短，用BstBI和PmlI切下质粒pSLIB120/ISP上含所述基因的片段。在GPS反应之后，将这一片段连接到经同样酶切的pSLIB120/ISP载体上。通过PCR筛选重组的大肠杆菌菌落以估计转座子的插入位点。选出一组在isp2基因的第二半部分(3’半部分)中的不同位置带有转座子的10个克隆。将这些克隆中的质粒转化到dcm和dam甲基化酶阴性的大肠杆菌菌株GM2163中。再将从这一菌株中分离出的质粒转化到无晶体的Bt菌株中。制备上清液进行生物分析，以用pSLIB120/ISP转化的Bt菌株的上清液作为阳性对照，用无晶体的Bt菌株的上清液作为阴性对照。为截短isp1基因用PmlI和EcoRI从pSLIB120/ISP上切下一个片段。所用的方法与截短isp2基因所用的方法类似。
转座子插入分析的结果表明在isp2A基因3’末端相对大片段的截短会使毒性遭到破坏，这表明在ISP2A蛋白中不允许C-末端截短或只允许相对短的C-末端截短。测序后，发现在本研究中在与ISP1A蛋白组合测定时仍保留毒性的最短C-末端截短ISP2A毒素片段截止到SEQ ID No.4中第449位氨基酸。
这些分析的结果表明，在ISP1A蛋白3’末端进行大片段的截短是可能的序列测定显示带有最大的C-末端截短的毒性片段截止到SEQ ID No.2中的第768位氨基酸。这样，在不丧失毒性的前提下ISP1A编码区可在3’端缺失约300bp。
上述研究还表明在没有功能性的ISP1A蛋白产生时，杀昆虫活性下降到背景水平，这确证了本发明的ISP蛋白的二元本质。
因此，SEQ ID No.4中第51位到449位氨基酸的ISP2A蛋白和SEQ IDNo.2中第38位到第768位氨基酸的ISP1A蛋白是ISP蛋白的有用杀昆虫片段。
而且，我们使含融合了ISP1A和ISP2A基因的DNA的嵌合基因在无晶体的苏云金芽孢杆菌berliner1715菌株中表达。在编码ISP2A和ISP1A蛋白(ISP2A仍保留其N端信号肽，而ISPIA的信号肽缺失)的开放阅读框之间有编码Arg-Lys接头(RKRKRK)的DNA序列或编码Gly接头(GGGGGG)的DNA序列，因此可以产生可翻译的融合蛋白，即其中有指定的接头将ISP2A蛋白(作为N-末端融合部分)连接到ISP1A蛋白(作为C-末端融合部分)上的融合蛋白。已证明重组Bt菌株可使玉米根叶甲(Diabrotica virgifera)的死亡率明显高于未转化的对照菌株(即无晶体的Bt 1715菌株)引起的死亡率。这表明可用单嵌合基因使本发明的ISP蛋白作为融合蛋白在重组的宿主细胞中产生。
显然，如本说明书中所描述的，可以用多种不同的方法在重组细胞，如植物细胞中产生融合蛋白。
实施例3在植物中生产ISP蛋白为在植物中获得理想的表达，可修饰天然的isp1A和isp2A基因以产生编码ISP1A和ISP2A蛋白的修饰DNA序列。编码其信号肽被甲硫氨酸和丙氨酸替换的ISP1A-1和ISP2A-1蛋白的理想DNA序列分别如SEQ ID No.9和7所示。
通过标准的技术插入到嵌合基因中的编码区与适宜的调节序列(如基于SEQ ID No.5或6的长或短zrp2启动子序列的启动子、适当的3’转录终止和聚腺苷酸化序列)可操作地连接。在一些构建体中，上述的嵌合基因包含编码导致靶向质体的如美国专利5,510,471(或再颁布的美国专利RE036449)中所描述的优化的叶绿体转运肽(代替N-末端的细菌信号肽)、或者导致靶向细胞壁的信号肽的DNA序列。类似地，也可以使用其它在植物细胞中有效的信号肽，优选由水稻α-淀粉酶3基因编码的信号肽(Sutliff等，1991，Plant Molec.Biol.16，579-591)、由菠菜铁氧还原蛋白NADP+氧化还原酶基因编码的信号肽(Oelmueller等，1993，Mol.Gen.Genet.237，261-272)、或由马铃薯蛋白酶抑制剂基因II编码的信号肽(Keil等，1986，Nucl.Acids Res.14，5641-5650)。
通过农杆菌介导的转化(Ishida等，1996，Nature Biotechnology 14，745-750；和U.S.专利No.5,591,616)、如美国专利5,792,936所述的原生质体转化、或如WO92/09696或美国专利5,641,664中所述的用损伤的并经酶降解的成胚愈伤组织进行的电穿孔，使上述的isp1A和isp2A嵌合基因稳定转化玉米细胞(所有这些文献在此处引入作为参考)。由转化的细胞再生玉米植株，再根据在根中的最佳表达水平和综合农艺性状进行选择。由此获得产生上述ISP蛋白的转基因玉米植株，其对试图以此种植物为食的玉米根叶甲(Diabrotica virgifera)可引起显著的死亡率。
依照本发明，也可以获得含有几种DNA构建体的稳定转化的玉米植株，以致这种玉米植株可在其细胞中表达处于合适的调控区域的控制下的一种或两种本发明的ISP蛋白以及合适的标记基因，优选除草剂抗性基因。在这些DNA构建体中，优选的3′转录终止和多聚腺苷酸化序列是含有由花椰菜花叶病毒中获得的3′转录终止和多聚腺苷酸化序列的215bp片段(Oka等，1981，J.Mol.Biol.147，217-226)。在一些构建体中可以加入5’非翻译前导序列，优选那些来自碧冬茄属(Petunia)cab22基因(Harpster等，1988，Mol.Gen Genetics 212，182-190)或zrp2基因(Held等，1997，PlantMolecular Biology 35，367-375，Genbank登录号U38790)的前导序列。在这些构建体中优选的启动子是35S启动子(例如，Odell等，1985，Nature 313，810-812)或zrp2启动子(Held等，1997，Plant Molecular Biology 35，367-375，Genbank登录号U38790)的有效启动子部分。除了上述优化的叶绿体转运肽之外，所述的构建体还可以包含在植物细胞中有效的信号肽，即水稻α-淀粉酶3基因信号肽(Sutliff等，1991，Plant Molec.Biol.16，579-591)、来自菠菜的铁氧还原蛋白NADP+氧化还原酶信号肽(Oelmueller等，1993，Mol.Gen.Genet.237，261-272)、或来自马铃薯的蛋白酶抑制剂II的信号肽(Keil等，1986，Nucl.Acids Res.14，5641-5650)。选择以上的优选元件用ISP嵌合基因以本领域普通技术人员所掌握的技术转化植物即可用于实现本发明的目的。
优选地，所述植物还包括编码赋予草胺膦(glufosinate)或草甘膦抗性的蛋白的基因，其可应用不同的启动子和/或前导序列，例如gos2启动子和/或gos2前导序列(de Pater等，1992，Plant J.2，837-844)。
显然，本发明并不仅仅局限于上述使用的玉米植物、转化方法及特定的ISP蛋白或DNA序列。相反，本发明还包括保留杀昆虫活性的ISP蛋白的变异体或等价物，如基本上具有本发明的ISP蛋白的氨基酸序列并基本上具有ISP蛋白的杀昆虫活性的蛋白。另外，任何易受下述昆虫损害的植物均包含在本发明的范围内作为编码ISP蛋白的DNA所转化的优选靶植物，所述的昆虫为鞘翅目的昆虫，尤其是玉米根虫，象甲或马铃薯甲虫，特别是玉米根叶甲(Diabrotica virgifera)或马铃薯叶甲(Leptinotarsa decemlineata)，优选的昆虫选自杨树莹叶甲(Agelastica alni)，紫苜蓿叶象(Hyperapostica)，埃及苜蓿叶象(Hypera brunneipennis)，Haltica tombacina，墨西哥棉铃象(Anthonomus grandis)，黄粉虫(Tenebrio molitor)，赤拟谷盗(Triboleum castaneum)，水稻铁甲(Dicladispa armigera)，Trichispaserica，水稻负泥虫(Oulema oryzae)，葡萄肖叶甲(Colaspis brunnea)，稻水象甲(Lissorhorptrus oryzophilus)，萝卜菜跳甲Phyllotreta cruciferae，黄曲条菜跳甲(Phyllotreta striolata)，忽布跳甲(Psylliodes punctulata)，美洲油菜叶甲(Entomoscelis americana)，油菜露尾虫(Meligethes aeneus)，龟象属种(Ceutorynchus)，油菜金头跳甲(Psylliodes chrysocephala)，豌豆细纹跳甲(Phyllotreta undulata)，马铃薯叶甲(Leptinotarsadecemlineata)，黄瓜十一星叶甲亚种(Diabrotica undecimpunctataundecimpunctata)，黄瓜十一星叶甲食根亚种(Diabrotica undecimpunctatahowardi)，Diabrotica barberi和玉米根叶甲(Diabrotica virgifera)。
序列表<110>拜尔生物科学公司<120>细菌杀昆虫蛋白<130>CRWISPWO1<150>US09/573,872<151>2000-05-18<160>10<170>PatentIn version 3.0<210>1<211>2616<212>DNA<213>侧孢短小芽孢杆菌(Brevibacillus laterosporus)<220><221>CDS<222>(1)..(2613)<400>1atg aaa tat atg aaa aaa gga tta tct agt gtt gta ata ggt acg ttg 48Met Lys Tyr Met Lys Lys Gly Leu Ser Ser Val Val Ile Gly Thr Leu1 5 10 15ttc gct tct atg ttt ttg aat ggg aat gta aat gct gtt tac gcg aac 96Phe Ala Ser Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asn20 25 30agt aaa aca aat cag att gct aca aca act cag gca agc aaa gac aac144Ser Lys Thr Asn Gln Ile Ala Thr Thr Thr Gln Ala Ser Lys Asp Asn35 40 45caa ata gat cga gaa gga cta ctt ggt tat tac ttt aaa gga aaa gat192Gln Ile Asp Arg Glu Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp50 55 60ttt aat gat ctt acc ttg ttt gca ccg aca cgt gat aat act ctt att240Phe Asn Asp Leu Thr Leu Phe Ala Pro Thr Arg Asp Asn Thr Leu Ile65 70 75 80tat gac caa caa aca gca aat aca cta gta gat caa aag cat caa gaa288Tyr Asp Gln Gln Thr Ala Asn Thr Leu Val Asp Gln Lys His Gln Glu85 90 95tat cat tct att cgc tgg att gga ttg att cag agt agt gca aca gga336Tyr His Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Ser Ala Thr Gly100 105 110gat ttc aca ttt aaa ttg tca gat gat gaa aat gcc atc att gaa ttg384Asp Phe Thr Phe Lys Leu Ser Asp Asp Glu Asn Ala Ile Ile Glu Leu115 120 125gat ggg aaa gtt att tct gaa aaa ggt aac aat aaa caa agt gtt cat432Asp Gly Lys Val Ile Ser Glu Lys Gly Asn Asn Lys Gln Ser Val His130 135 140tta gaa aaa gga cag ttg gtg caa ata aaa att gag tac caa tca gac480Leu Glu Lys Gly Gln Leu Val Gln Ile Lys Ile Glu Tyr Gln Ser Asp145 150 155 160gat gca tta cat ata gat aat aaa att ttt aaa gag ctt aag cta ttc528Asp Ala Leu His Ile Asp Asn Lys Ile Phe Lys Glu Leu Lys Leu Phe165 170 175aag ata gat agt caa aat cac tct caa caa gtt caa caa gat gaa ctg576Lys Ile Asp Ser Gln Asn His Ser Gln Gln Val Gln Gln Asp Glu Leu180 185 190aga aac cct gag ttt aat aag aaa gaa acg caa gta ttc tta aag aaa624Arg Asn Pro Glu Phe Asn Lys Lys Glu Thr Gln Val Phe Leu Lys Lys195 200 205gca tcg aaa aca aat ctt ttt aca caa aaa aca aaa aga gac att gat672Ala Ser Lys Thr Asn Leu Phe Thr Gln Lys Thr Lys Arg Asp Ile Asp210 215 220gaa gat acg gat aca gat gga gat tct atc cct gat gtt tgg gaa gaa720Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Val Trp Glu Glu225 230 235 240aac ggg tat acc att caa aac aaa gtc gca gtc aaa tgg gat gat tcg768Asn Gly Tyr Thr Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser245 250 255tta gca agt aaa ggg tat caa aaa ttt act tct aat cca cta gaa gca816Leu Ala Ser Lys Gly Tyr Gln Lys Phe Thr Ser Asn Pro Leu Glu Ala260 265 270cac aca gtt gga gat ccc tat agt gat tat gaa aaa gct gca aga gat 864His Thr Val Gly Asp Pro Tyr Ser Asp Tyr Glu Lys Ala Ala Arg Asp275 280 285atg ccc tta tcg aat gca aaa gaa act ttt aat cct ctg gtt gcc gcc 912Met Pro Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala290 295 300ttt cca tca gta aat gtt agt tta gaa aag gtg att tta tcc aaa aat 960Phe Pro Ser Val Asn Val Ser Leu Glu Lys Val Ile Leu Ser Lys Asn305 310 315 320gaa gac ctt tcc cat agc gtt gaa agc agt caa tct acc aat tgg tct1008Glu Asp Leu Ser His Ser Val Glu Ser Ser Gln Ser Thr Asn Trp Ser325 330 335tat acc aat act gaa ggc gtt aac gtc aat gcc gga tgg tca ggc tta1056Tyr Thr Asn Thr Glu Gly Val Asn Val Asn Ala Gly Trp Ser Gly Leu340 345 350gga cct agt ttt gga gtt tct gtt aac tat caa cat agt gaa act gta1104Gly Pro Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val355 360 365gca aat gaa tgg ggt tct gcg acg aat gat ggc aca cat ata aat gga1152Ala Asn Glu Trp Gly Ser Ala Thr Asn Asp Gly Thr His Ile Asn Gly370 375 380gcg gaa tct gct tat tta aac gca aat gtt cgc tat aat aac gtt ggg1200Ala Glu Ser Ala Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly385 390 395 400aca gga gca att tat gaa acg aaa cca aca acg agt ttt att ctt gat1248Thr Gly Ala Ile Tyr Glu Thr Lys Pro Thr Thr Ser Phe Ile Leu Asp405 410 415gga aca aca att gga acg att aaa gca aaa gaa aat aca aca gct tta1296Gly Thr Thr Ile Gly Thr Ile Lys Ala Lys Glu Asn Thr Thr Ala Leu420 425 430act att tta ccg gac caa agc tat cca gag aaa ggg aaa aac gga atc1344Thr Ile Leu Pro Asp Gln Ser Tyr Pro Glu Lys Gly Lys Asn Gly Ile
435 440 445gca att aac aca atg gat gat ttt aac tct cgc cca att cca tta aat1392Ala Ile Asn Thr Met Asp Asp Phe Asn Ser Arg Pro Ile Pro Leu Asn450 455 460aaa gag caa cta aat act tat tta tct aat aaa aaa cca atc cta ctt1440Lys Glu Gln Leu Asn Thr Tyr Leu Ser Asn Lys Lys Pro Ile Leu Leu465 470 475 480gaa aca gat caa gta gaa gga aaa tac gcc ata aag gat acc aat ggg1488Glu Thr Asp Gln Val Glu Gly Lys Tyr Ala Ile Lys Asp Thr Asn Gly485 490 495aat att aca ata gct gga gat tgg aat ggt ata aca gat gaa att tct1536Asn Ile Thr Ile Ala Gly Asp Trp Asn Gly Ile Thr Asp Glu Ile Ser500 505 510gct aaa acg gcc tct att att gta gat aat gga aat caa atg tca gaa1584Ala Lys Thr Ala Ser Ile Ile Val Asp Asn Gly Asn Gln Met Ser Glu515 520 525aag aga gtt gca gcg aag gat tat aca aat cca gag gat aaa act cct1632Lys Arg Val Ala Ala Lys Asp Tyr Thr Asn Pro Glu Asp Lys Thr Pro530 535 540aat tta tct gta aaa gaa gct cta aag tta gct tat cca gat gaa att1680Asn Leu Ser Val Lys Glu Ala Leu Lys Leu Ala Tyr Pro Asp Glu Ile545 550 555 560gag gaa aaa gat ggt tta tta ttt tat aat gac caa cct att ttt gaa1728Glu Glu Lys Asp Gly Leu Leu Phe Tyr Asn Asp Gln Pro Ile Phe Glu565 570 575gca tct gta caa agt tat gtt gac gaa tat aca gct aaa caa att aga1776Ala Ser Val Gln Ser Tyr Val Asp Glu Tyr Thr Ala Lys Gln Ile Arg580 585 590aaa cag tta aat gat agt act ggt agc ttc aaa gat gtt aag aat tta1824Lys Gln Leu Asn Asp Ser Thr Gly Ser Phe Lys Asp Val Lys Asn Leu595 600 605tat gat gtg aaa tta gaa ccc aaa atg aat ttc aca ata aaa act agc 1872Tyr Asp Val Lys Leu Glu Pro Lys Met Asn Phe Thr Ile Lys Thr Ser610 615 620act tta tat gat gga gga gaa tct gac aac aca aaa ata gga aat tgg1920Thr Leu Tyr Asp Gly Gly Glu Ser Asp Asn Thr Lys Ile Gly Asn Trp625 630 635 640tac tat act tat gtt gtc aac gga gga aat acg ggt aaa aaa caa tac1968Tyr Tyr Thr Tyr Val Val Asn Gly Gly Asn Thr Gly Lys Lys Gln Tyr645 650 655cgt tca gct aat aaa ggt gcc ttt act gag ctg tca aca gaa tca aag2016Arg Ser Ala Asn Lys Gly Ala Phe Thr Glu Leu Ser Thr Glu Ser Lys660 665 670aat aaa ttg aaa aaa aat ata gat tac tac gta agc cta tat atg aag2064Asn Lys Leu Lys Lys Asn Ile Asp Tyr Tyr Val Ser Leu Tyr Met Lys675 680 685gct gac tca aag gtt tca gtt gat ata gaa ata gac gga aaa cag gag2112Ala Asp Ser Lys Val Ser Val Asp Ile Glu Ile Asp Gly Lys Gln Glu690 695 700tca att gta aca gat aat ata acc tta gat cac gta ggt tac caa aga2160Ser Ile Val Thr Asp Asn Ile Thr Leu Asp His Val Gly Tyr Gln Arg705 710 715 720ata aac atc cta gtc ccc aat ctg gaa gga aac gaa ata aat act att2208Ile Asn Ile Leu Val Pro Asn Leu Glu Gly Asn Glu Ile Asn Thr Ile725 730 735tct att aaa ggt gac gga caa acc aat gtt tat tgg gat gat gtc tcc2256Ser Ile Lys Gly Asp Gly Gln Thr Asn Val Tyr Trp Asp Asp Val Ser740 745 750ttt gtc gaa gtg gga gca gaa gaa att gaa tat aaa gat cca gtt ccc2304Phe Val Glu Val Gly Ala Glu Glu Ile Glu Tyr Lys Asp Pro Val Pro755 760 765caa ttt gac att ata gaa gga gat ttt gat ttc ttt ggt gat cca ttg2352Gln Phe Asp Ile Ile Glu Gly Asp Phe Asp Phe Phe Gly Asp Pro Leu770 775 780gcg gta aaa tat cat gat gca acg tat ttt ata gat agt cct ttg att2400Ala Val Lys Tyr His Asp Ala Thr Tyr Phe Ile Asp Ser Pro Leu Ile785 790 795 800aca caa act cct gga act ttc tcc ttt act tat aaa gtg att ggg gaa2448Thr Gln Thr Pro Gly Thr Phe Ser Phe Thr Tyr Lys Val Ile Gly Glu805 810 815caa acg aag aca gta tta gat tcg gga tct ggt aaa aac gca aat cga2496Gln Thr Lys Thr Val Leu Asp Ser Gly Ser Gly Lys Asn Ala Asn Arg820 825 830atc aac cta gat ttt aaa aat gta aaa tca gat cgt tca ttc tta tat2544Ile Asn Leu Asp Phe Lys Asn Val Lys Ser Asp Arg Ser Phe Leu Tyr835 840 845aca tta tca tgt aaa gat gat tta tgg gga agc act cgc aca gca gtt2592Thr Leu Ser Cys Lys Asp Asp Leu Trp Gly Ser Thr Arg Thr Ala Val850 855 860gtt aga att ttt gct gta gat taa2616Val Arg Ile Phe Ala Val Asp865 870<210>2<211>871<212>PRT<213>侧孢短小芽孢杆菌<400>2Met Lys Tyr Met Lys Lys Gly Leu Ser Ser Val Val Ile Gly Thr Leu1 5 10 15Phe Ala Ser Met Phe Leu Asn Gly Asn Val Asn Ala Val Tyr Ala Asn20 25 30Ser Lys Thr Asn Gln Ile Ala Thr Thr Thr Gln Ala Ser Lys Asp Asn35 40 45Gln Ile Asp Arg Glu Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp50 55 60Phe Asn Asp Leu Thr Leu Phe Ala Pro Thr Arg Asp Asn Thr Leu Ile65 70 75 80Tyr Asp Gln Gln Thr Ala Asn Thr Leu Val Asp Gln Lys His Gln Glu85 90 95Tyr His Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Ser Ala Thr Gly100 105 110Asp Phe Thr Phe Lys Leu Ser Asp Asp Glu Asn Ala Ile Ile Glu Leu115 120 125Asp Gly Lys Val Ile Ser Glu Lys Gly Asn Asn Lys Gln Ser Val His130 135 140Leu Glu Lys Gly Gln Leu Val Gln Ile Lys Ile Glu Tyr Gln Ser Asp145 150 155 160Asp Ala Leu His Ile Asp Asn Lys Ile Phe Lys Glu Leu Lys Leu Phe165 170 175Lys Ile Asp Ser Gln Asn His Ser Gln Gln Val Gln Gln Asp Glu Leu180 185 190Arg Asn Pro Glu Phe Asn Lys Lys Glu Thr Gln Val Phe Leu Lys Lys195 200 205Ala Ser Lys Thr Asn Leu Phe Thr Gln Lys Thr Lys Arg Asp Ile Asp210 215 220Glu Asp Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Val Trp Glu Glu225 230 235 240Asn Gly Tyr Thr Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser245 250 255Leu Ala Ser Lys Gly Tyr Gln Lys Phe Thr Ser Asn Pro Leu Glu Ala260 265 270His Thr Val Gly Asp Pro Tyr Ser Asp Tyr Glu Lys Ala Ala Arg Asp275 280 285Met Pro Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala290 295 300Phe Pro Ser Val Asn Val Ser Leu Glu Lys Val Ile Leu Ser Lys Asn305 310 315 320Glu Asp Leu Ser His Ser Val Glu Ser Ser Gln Ser Thr Asn Trp Ser325 330 335Tyr Thr Asn Thr Glu Gly Val Asn Val Asn Ala Gly Trp Ser Gly Leu340 345 350Gly Pro Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val355 360 365Ala Asn Glu Trp Gly Ser Ala Thr Asn Asp Gly Thr His Ile Asn Gly370 375 380Ala Glu Ser Ala Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly385 390 395 400Thr Gly Ala Ile Tyr Glu Thr Lys Pro Thr Thr Ser Phe Ile Leu Asp405 410 415Gly Thr Thr Ile Gly Thr Ile Lys Ala Lys Glu Asn Thr Thr Ala Leu420 425 430Thr Ile Leu Pro Asp Gln Ser Tyr Pro Glu Lys Gly Lys Asn Gly Ile435 440 445Ala Ile Asn Thr Met Asp Asp Phe Asn Ser Arg Pro Ile Pro Leu Asn450 455 460Lys Glu Gln Leu Asn Thr Tyr Leu Ser Asn Lys Lys Pro Ile Leu Leu465 470 475 480Glu Thr Asp Gln Val Glu Gly Lys Tyr Ala Ile Lys Asp Thr Asn Gly485 490 495Asn Ile Thr Ile Ala Gly Asp Trp Asn Gly Ile Thr Asp Glu Ile Ser500 505 510Ala Lys Thr Ala Ser Ile Ile Val Asp Asn Gly Asn Gln Met Ser Glu515 520 525Lys Arg Val Ala Ala Lys Asp Tyr Thr Asn Pro Glu Asp Lys Thr Pro530 535 540Asn Leu Ser Val Lys Glu Ala Leu Lys Leu Ala Tyr Pro Asp Glu Ile545 550 555 560Glu Glu Lys Asp Gly Leu Leu Phe Tyr Asn Asp Gln Pro Ile Phe Glu565 570 575Ala Ser Val Gln Ser Tyr Val Asp Glu Tyr Thr Ala Lys Gln Ile Arg580 585 590Lys Gln Leu Asn Asp Ser Thr Gly Ser Phe Lys Asp Val Lys Asn Leu595 600 605Tyr Asp Val Lys Leu Glu Pro Lys Met Asn Phe Thr Ile Lys Thr Ser610 615 620Thr Leu Tyr Asp Gly Gly Glu Ser Asp Asn Thr Lys Ile Gly Asn Trp625 630 635 640Tyr Tyr Thr Tyr Val Val Asn Gly Gly Asn Thr Gly Lys Lys Gln Tyr645 650 655Arg Ser Ala Asn Lys Gly Ala Phe Thr Glu Leu Ser Thr Glu Ser Lys660 665 670Asn Lys Leu Lys Lys Asn Ile Asp Tyr Tyr Val Ser Leu Tyr Met Lys675 680 685Ala Asp Ser Lys Val Ser Val Asp Ile Glu Ile Asp Gly Lys Gln Glu690 695 700Ser Ile Val Thr Asp Asn Ile Thr Leu Asp His Val Gly Tyr Gln Arg705 710 715 720Ile Asn Ile Leu Val Pro Asn Leu Glu Gly Asn Glu Ile Asn Thr Ile725 730 735Ser Ile Lys Gly Asp Gly Gln Thr Asn Val Tyr Trp Asp Asp Val Ser740 745 750Phe Val Glu Val Gly Ala Glu Glu Ile Glu Tyr Lys Asp Pro Val Pro755 760 765Gln Phe Asp Ile Ile Glu Gly Asp Phe Asp Phe Phe Gly Asp Pro Leu770 775 780Ala Val Lys Tyr His Asp Ala Thr Tyr Phe Ile Asp Ser Pro Leu Ile785 790 795 800Thr Gln Thr Pro Gly Thr Phe Ser Phe Thr Tyr Lys Val Ile Gly Glu805 810 815Gln Thr Lys Thr Val Leu Asp Ser Gly Ser Gly Lys Asn Ala Asn Arg820 825 830Ile Asn Leu Asp Phe Lys Asn Val Lys Ser Asp Arg Ser Phe Leu Tyr835 840 845Thr Leu Ser Cys Lys Asp Asp Leu Trp Gly Ser Thr Arg Thr Ala Val850 855 860Val Arg Ile Phe Ala Val Asp865 870<210>3<211>1374<212>DNA<213>侧孢短小芽孢杆菌<220><221>CDS<222>(1)..(1371)<400>3atg att gtg att att tte aca aac gta aaa gga ggg aat gag ttg aaa 48Met Ile Val Ile Ile Phe Thr Asn Val Lys Gly Gly Asn Glu Leu Lys1 5 10 15aag aat ttt tat aag aat ctt att tgt atg tct gct tta ttg tta gcc 96Lys Asn Phe Tyr Lys Asn Leu Ile Cys Met Ser Ala Leu Leu Leu Ala20 25 30atg cct ata tca agc aac gtt acg tac gct tac ggt agt gag aag gtt144Met Pro Ile Ser Ser Asn Val Thr Tyr Ala Tyr Gly Ser Glu Lys Val35 40 45gat tat tta gta aaa acg act aac aat aca gag gat ttt aaa gag gat192Asp Tyr Leu Val Lys Thr Thr Asn Asn Thr Glu Asp Phe Lys Glu Asp50 55 60aag gaa aaa gcc aaa gaa tgg ggg aaa gaa aaa gag aaa gag tgg aaa240Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp Lys65 70 75 80cta act gtt act gaa aaa aca agg atg aat aat ttt tta gat aat aaa288Leu Thr Val Thr Glu Lys Thr Arg Met Asn Asn Phe Leu Asp Asn Lys85 90 95aat gat ata aaa aaa aat tat aaa gaa att act ttt tct atg gca ggt336Asn Asp Ile Lys Lys Asn Tyr Lys Glu Ile Thr Phe Ser Met Ala Gly100 105 110tca ttt gaa gat gaa ata aaa gat tta aaa gag att gat aaa atg ttt384Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met Phe115 120 125gat aaa gcc aat cta tca agt tct att gtc acc tat aaa aat gtg gag432Asp Lys Ala Asn Leu Ser Ser Ser Ile Val Thr Tyr Lys Asn Val Glu130 135 140ccc tca acg att gga ttt aac aaa cct tta aca gaa ggt aat act att480Pro Ser Thr Ile Gly Phe Asn Lys Pro Leu Thr Glu Gly Asn Thr Ile145 150 155 160aat act gat gta caa gcc cag ttt aaa gaa caa ttt tta gga aaa gat528Asn Thr Asp Val Gln Ala Gln Phe Lys Glu Gln Phe Leu Gly Lys Asp165 170 175att aag ttt gat agt tat ctt gac act cac tta act gca caa aat gtt576Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Asn Val180 185 190tct agt aaa gaa aga att att tta caa gtt aca gtg cca agt ggt aaa624Ser Ser Lys Glu Arg Ile Ile Leu Gln Val Thr Val Pro Ser Gly Lys195 200 205gga tct act att cca aca aaa gca ggt gta att tta aat aat aat gag672Gly Ser Thr Ile Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Asn Glu210 215 220tat aaa atg cta att gat aat ggc tat gta ctc cat gtg gat aat ata720Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu His Val Asp Asn Ile225 230 235 240tcg aaa gta gta aaa aaa ggt tat gaa tgt tta caa att caa gga acg 768Ser Lys Val Val Lys Lys Gly Tyr Glu Cys Leu Gln Ile Gln Gly Thr245 250 255cta aaa aag agt ctc gat ttt aaa aat gat att aat gct gag gct cat 816Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala His260 265 270cgt tgg ggt atg aaa aat tat gaa gga tgg gct aaa aat tta aca gat 864Arg Trp Gly Met Lys Asn Tyr Glu Gly Trp Ala Lys Asn Leu Thr Asp275 280 285cct caa agg gaa gct tta gat ggg tat gct aga caa gat tat aaa caa 912Pro Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys Gln290 295 300ata aat gat tat tta cga aat caa ggt gga agt gga aat gaa aaa cta 960Ile Asn Asp Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys Leu305 310 315 320gat aca caa ata aaa aat att tct gaa gca tta gaa aag cag cca ata1008Asp Thr Gln Ile Lys Asn Ile Ser Glu Ala Leu Glu Lys Gln Pro Ile325 330 335cca gaa aat att act gtg tat aga tgg tgt gga atg gcg gaa ttt ggt1056Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Ala Glu Phe Gly340 345 350tat caa att agt gat cct tta cct tct tta aaa gaa atg gaa gaa aaa1104Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Glu Met Glu Glu Lys355 360 365ttt tta aat aca atg aaa gaa gat aag gga tat atg agt act agt ttg1152Phe Leu Asn Thr Met Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser Leu370 375 380tca agt gaa cgt ctt tct gca ttt ggt tcg aga aaa ttc att tta aga1200Ser Ser Glu Arg Leu Ser Ala Phe Gly Ser Arg Lys Phe Ile Leu Arg385 390 395 400tta caa gtt cct aaa gga agc aca ggg gca tat tta agc gct att ggg1248Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile Gly
405 410 415gga ttt gca agt gaa aaa gaa atc ctt att gat aaa gat agt aac tat1296Gly Phe Ala Ser Glu Lys Glu Ile Leu Ile Asp Lys Asp Ser Asn Tyr420 425 430cat att gat aaa ata aca gag gta gtc att aaa ggt gtt aag cga tat1344His Ile Asp Lys Ile Thr Glu Val Val Ile Lys Gly Val Lys Arg Tyr435 440 445gta gtt gat gca acg tta tta aca aaa taa1374Val Val Asp Ala Thr Leu Leu Thr Lys450 455<210>4<211>457<212>PRT<213>侧孢短小芽孢杆菌<400>4Met Ile Val Ile Ile Phe Thr Asn Val Lys Gly Gly Asn Glu Leu Lys1 5 10 15Lys Asn Phe Tyr Lys Asn Leu Ile Cys Met Ser Ala Leu Leu Leu Ala20 25 30Met Pro Ile Ser Ser Asn Val Thr Tyr Ala Tyr Gly Ser Glu Lys Val35 40 45Asp Tyr Leu Val Lys Thr Thr Asn Asn Thr Glu Asp Phe Lys Glu Asp50 55 60Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp Lys65 70 75 80Leu Thr Val Thr Glu Lys Thr Arg Met Asn Asn Phe Leu Asp Asn Lys85 90 95Asn Asp Ile Lys Lys Asn Tyr Lys Glu Ile Thr Phe Ser Met Ala Gly100 105 110Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met Phe115 120 125Asp Lys Ala Asn Leu Ser Ser Ser Ile Val Thr Tyr Lys Asn Val Glu130 135 140Pro Ser Thr Ile Gly Phe Asn Lys Pro Leu Thr Glu Gly Asn Thr Ile145 150 155 160Asn Thr Asp Val Gln Ala Gln Phe Lys Glu Gln Phe Leu Gly Lys Asp165 170 175Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Asn Val180 185 190Ser Ser Lys Glu Arg Ile Ile Leu Gln Val Thr Val Pro Ser Gly Lys195 200 205Gly Ser Thr Ile Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Asn Glu210 215 220Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu His Val Asp Asn Ile225 230 235 240Ser Lys Val Val Lys Lys Gly Tyr Glu Cys Leu Gln Ile Gln Gly Thr245 250 255Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala His260 265 270Arg Trp Gly Met Lys Asn Tyr Glu Gly Trp Ala Lys Asn Leu Thr Asp275 280 285Pro Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys Gln290 295 300Ile Asn Asp Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys Leu305 310 315 320Asp Thr Gln Ile Lys Asn Ile Ser Glu Ala Leu Glu Lys Gln Pro Ile325 330 335Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Ala Glu Phe Gly340 345 350Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Glu Met Glu Glu Lys355 360 365Phe Leu Asn Thr Met Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser Leu370 375 380Ser Ser Glu Arg Leu Ser Ala Phe Gly Ser Arg Lys Phe Ile Leu Arg385 390 395 400Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile Gly405 410 415Gly Phe Ala Ser Glu Lys Glu Ile Leu Ile Asp Lys Asp Ser Asn Tyr420 425 430His Ile Asp Lys Ile Thr Glu Val Val Ile Lys Gly Val Lys Arg Tyr435 440 445Val Val Asp Ala Thr Leu Leu Thr Lys
450455<210>5<211>2658<212>DNA<213>玉蜀黍(Zea mays)<220><221>misc feature<222>(21)..()<223>第21位核苷酸是″n″，其中″n″＝任何核苷酸<400>5cctaaggccg atttcgtcct nagcagggcc caaaggaagg aagtacttca gtggatcaag 60atgttgatgt tccctgatgg gtatgcagct aacctgagta ggtggggtga acttatctac120tctgtgagtc ttagggatga agagtcatga cttccacata tggattgaac agattcttct180ctgtgcatgg acaatctggg gcggcatcca acaaccctca tggatcgccc ggccaatcgc240cgcaccagtc catccgccca cctcgatgag acttatgttc ttagtgttga gacttcagaa300cttattgata atgctgtatt ggatacttat gtttgtgttc gatacttatg tgagaacttg360agacttatga gacttatgtt cttgatactt atgtttgtgt tgagaacttg gatatttatg420tttgtgttgg atacttatgt ctgtgatgat atatgtgatg tatatatgtg atgtatatgt480gacatatgtg atgtatatgt ggtatctttt gtttgtttgg atggaataga gaaagcaaat540aaaaatgtgt atactggtca ctttgtcgag tgtaacactc ggcaaaaagg tgctttgccg600agtgttaggg ccatagcact cggtagagaa ccaatactta ggcaccggta aagctttttt660ggcgagtgtt gtggccctgg cactcagctt tgccgagtgc ctcacagagc actcgacaaa720gaacctgaca aatggacccg ctggtaaatc ctttaccgag tgcaggtcag tagacactcg780gcaaaggtaa cttctttgcc gagtgccgct tagaacattt gacaaagggt catctccgtt840acccggtgtc gtgacggccg cttttctttg ccgagtgcct gatagaaagt actcggcaaa900gaagtcgttg ccaatgtatt gttcgctgag gtctctttgt caagtattac actcggcaaa 960gactgtgccg agtgtttttc agactttgcc gagtggttta agcactcagc aaagcgctcg1020atttcggtag tgacggttgt ttggcaatag taaaatccag ccctctcccg tggggaaaaa1080actggtagga tctggctcgt ggctaagatt ctctttcttc cctttgtaaa aaaagagaag1140aaaaaaaaaa cgactgtcac ggtgccttgt ctggtaatga tcgcgcggtc ggctctgtcc1200taacccgtaa gatggacggg agctgatgat agcgtgacct ccaaataaac aacaagggcg1260tgttccccgc ggtcgaatat tttaagggcc actgattagg tgcggttgaa tacatcaact1320tcacgaacat catctgatct gatctgattt ggtctgatat gatctgggta gtcatttctg1380caatgagcat ctatcaggtg aaccaattaa tattgatgac attatgagtt cgaagatata1440ctctaaagtg ttatctaaat acagaagaca ttcgttcgtt ctttgcctat aactctaaaa1500ggcttgtaac accctcattc atcctctata tacgaagact ctctcctatc atttttatcg1560atttattttt tttatattta gacaatggaa ttaaatagaa ctaaaatata tataagatga1620tatctgagga cccgagatgg taatggggac tcgatcctcg attctccacg gagaattcct1680ctaggatata ggtaatttgt ccccacgagg attgaaacgg ggtaatttgg tccccatgtg1740cccgtcccgc gaacttctct tgatctaaat tagtctattt ccatgttaaa actatactaa1800aaatttaata cacagtctat tataaaatag caaactaaat tctaaagttg atgcatcttg1860taattttaaa tctggtttgt tcaagttata ttcatttgat ataataaatt tgaatttgac1920tcttaatatc gtattttttc ctaacgggga cggattctcc acggggataa attccatgat1980acagatggga tgaaagaaaa atctcccgta tgaacttttg caggaatggg gatgggccag2040agaaattttc tccctgcggg gacgggggag ccatatcctc ggtggagaat ttcccattat2100catccttatt tgtggtacat atatatgcat aatctttttt ttttgactga catgtgggaa2160agtatcccat ctcaatagta gaaaatcttg ggaacggtag gatcgaacac aaagatcagc2220tagcttgtaa tcaccgagcc atatagctag agggtaatag atcatgaatc aaatgttttt2280ttcataaatt attaaggctc taaattattt ttaatttaaa aataaataaa aatatagttc2340gattcttaca ttttatagtg taaaacttta aagtctatta ttacccctac ttattgagtt2400atggttcagt tcttgtcgac ggagagtaat gagatataga ataaggtacc ctatagaata2460aagaatcttt ctctgaaaag tctgacgtac gtaaataaga tataataaaa aaaatacaaa2520gagaagcgct ggactggaga tgctcctata tgcggcaatg cctgtgctta taaatagcca2580cctcggtcgg caaggacatg aacggcggac gcagtgtgca tgcatacaag agcaacaaga2640tactggcgca gaggagca 2658<210>6<211>4325<212>DNA<213>玉蜀黍<220><221>misc_feature<222>(372)..(1688)<223>第372，525，586，714，737，747，754，785和1688位核苷酸是″n″，其中″n″＝任何核苷酸<400>6gcggccgcgg aattaaccct cactaaaggg aacgaattcg gatccctgtg gagaaatttt 60tacgtcgcgg ggatggtatg gggagttatt cccctgtagg aaatgggtga cgcctaagag120ggagggtgaa gtaggacttc taaaactttc actaaactag gccacaaata attccctaga180gcaaaaccta tgcaaatagt caaactagaa tgtgcaaacc aagttttgtc taagtgttgc240tatctctacc gcaatggcta agtttcaatc tacactatat aagtatgaat acaagaatga300aacttaaata cttaatataa atgcggaaac ttaaagagca aggtagagat gcaaattctc360gtggatgacg cntgcatttt tatcgaggta tccggaacca cgcaaggtcc cgactaatcc420tcattggtgc ccctacgcaa agggaagccc acgcgagggc caagcacctc ggtcgagtaa480ctcttataga gagccgtggg ccttctccac gcgcaagtgg tgctntgctt tcagctcctc 540tcagaccctc cccgctgtct ccactatcga gcttccggct gaaaangcca tgggcctcgt 600tccctccggt acacggtggc ggccgtgaca caaatgcggt tatcacgggt ctcgcaagac 660tctcaccccc actggggaca aatttcaatg gctcgcacaa gagccgaggg gttnatggtt 720tatctaatct cactcanctt aactagnatt catntaaagc aagcgctaga gcggtctaac 780taacntaagc acttcacaaa gcacctacgc ttaatcaccg agtgattcta tttagcactt 840gggtgcaaga gcacttgaga atgtctacta tatgccttgc tatgtctctt gggctcccaa 900acttggaaat ggccggttgg tggtgtattt atagccccca acacaaaact agccgttgga 960ggaagctgct gctttttgtg gtgcaccgga cagtccggtg gggtcaccag acagtccgac1020gcccctgtcc ggtgcccctg tccgatgcgc ctagttgttg ggtctgtcag cgtaggtgac1080cgttggcgcg caggcttttt gcaccggaca gtccggtggt cttccctcga cagtgccacc1140tggagctagc cgttagggct actgttcctg gtgcaccgga cagtagtccg gtgctcttgt1200ttggacagtc cgacttgtgg caacacttct tcttttcttg gactttactt gatcttcatg1260atgtcttctt ttgaggtgtt gctttcctaa gtgccttggt ccaagtaact tatcatcctg1320tgaactacaa acacaaatag tagcaaacac attagtccac aggttatgtt gatcatcaaa1380taccaaaatc tattaagcca aatggcccag ggtccatttt ccttacatcc ccgacgaaga1440attctccgtt gccatcccta tctgtgtacg cactactgga atccgggtct ttgctgagta1500ccgcactcgg caaagtccta ctctcggtaa cgatgccttt tgccgagagc aggactctcg1560gcacaggaat acactcggcg aagggcgggt ctcggcaaag gccgttagcc accgtccaaa1620gctgacggtc gttacctatg ccgagtggtg gaaagatatt gtgaaggcct aaggccgatt1680tcgtcctnag cagggcccaa aggaaggaag tacttcagtg gatcaagatg ttgatgttcc1740ctgatgggta tgcagctaac ctgagtaggt ggggtgaact tatctactct gtgagtctta1800gggatgaaga gtcatgactt ccacatatgg attgaacaga ttcttctctg tgcatggaca1860atctggggcg gcatccaaca accctcatgg atcgcccggc caatcgccgc accagtccat1920ccgcccacct cgatgagact tatgttctta gtgttgagac ttcagaactt attgataatg1980ctgtattgga tacttatgtt tgtgttcgat acttatgtga gaacttgaga cttatgagac2040ttatgttctt gatacttatg tttgtgttga gaacttggat atttatgttt gtgttggata2100cttatgtctg tgatgatata tgtgatgtat atatgtgatg tatatgtgac atatgtgatg2160tatatgtggt atcttttgtt tgtttggatg gaatagagaa agcaaataaa aatgtgtata2220ctggtcactt tgtcgagtgt aacactcggc aaaaaggtgc tttgccgagt gttagggcca2280tagcactcgg tagagaacca atacttaggc accggtaaag cttttttggc gagtgttgtg2340gccctggcac tcagctttgc cgagtgcctc acagagcact cgacaaagaa cctgacaaat2400ggacccgctg gtaaatcctt taccgagtgc aggtcagtag acactcggca aaggtaactt2460ctttgccgag tgccgcttag aacatttgac aaagggtcat ctccgttacc cggtgtcgtg2520acggccgctt ttctttgccg agtgcctgat agaaagtact cggcaaagaa gtcgttgcca2580atgtattgtt cgctgaggtc tctttgtcaa gtattacact cggcaaagac tgtgccgagt2640gtttttcaga ctttgccgag tggtttaagc actcagcaaa gcgctcgatt tcggtagtga2700cggttgtttg gcaatagtaa aatccagccc tctcccgtgg ggaaaaaact ggtaggatct2760ggctcgtggc taagattctc tttcttccct ttgtaaaaaa agagaagaaa aaaaaaacga2820ctgtcacggt gccttgtctg gtaatgatcg cgcggtcggc tctgtcctaa cccgtaagat2880ggacgggagc tgatgatagc gtgacctcca aataaacaac aagggcgtgt tccccgcggt2940cgaatatttt aagggccact gattaggtgc ggttgaatac atcaacttca cgaacatcat3000ctgatctgat ctgatttggt ctgatatgat ctgggtagtc atttctgcaa tgagcatcta3060tcaggtgaac caattaatat tgatgacatt atgagttcga agatatactc taaagtgtta3120tctaaataca gaagacattc gttcgttctt tgcctataac tctaaaaggc ttgtaacacc3180ctcattcatc ctctatatac gaagactctc tcctatcatt tttatcgatt tatttttttt3240atatttagac aatggaatta aatagaacta aaatatatat aagatgatat ctgaggaccc3300gagatggtaa tggggactcg atcctcgatt ctccacggag aattcctcta ggatataggt3360aatttgtccc cacgaggatt gaaacggggt aatttggtcc ccatgtgccc gtcccgcgaa3420cttctcttga tctaaattag tctatttcca tgttaaaact atactaaaaa tttaatacac3480agtctattat aaaatagcaa actaaattct aaagttgatg catcttgtaa ttttaaatct3540ggtttgttca agttatattc atttgatata ataaatttga atttgactct taatatcgta3600ttttttccta acggggacgg attctccacg gggataaatt ccatgataca gatgggatga3660aagaaaaatc tcccgtatga acttttgcag gaatggggat gggccagaga aattttctcc3720ctgcggggac gggggagcca tatcctcggt ggagaatttc ccattatcat ccttatttgt3780ggtacatata tatgcataat cttttttttt tgactgacat gtgggaaagt atcccatctc3840aatagtagaa aatcttggga acggtaggat cgaacacaaa gatcagctag cttgtaatca3900ccgagccata tagctagagg gtaatagatc atgaatcaaa tgtttttttc ataaattatt3960aaggctctaa attattttta atttaaaaat aaataaaaat atagttcgat tcttacattt4020tatagtgtaa aactttaaag tctattatta cccctactta ttgagttatg gttcagttct4080tgtcgacgga gagtaatgag atatagaata aggtacccta tagaataaag aatctttctc4140tgaaaagtct gacgtacgta aataagatat aataaaaaaa atacaaagag aagcgctgga4200ctggagatgc tcctatatgc ggcaatgcct gtgcttataa atagccacct cggtcggcaa4260ggacatgaac ggcggacgca gtgtgcatgc atacaagagc aacaagatac tggcgcagag4320gagca4325<210>7<211>1239<212>DNA<213>人工<220><223>编码ISP2A蛋白的修饰DNA<220><221>CDS<222>(3)..(1229)<400>7cc atg gca cta gtg aag acc acc aac aac acc gag gac ttc aag gag 47Met Ala Leu Val Lys Thr Thr Asn Asn Thr Glu Asp Phe Lys Glu1 5 10 15gac aag gag aag gcc aag gag tgg ggc aag gag aag gag aag gag tgg 95Asp Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp20 25 30aag ctg acc gtg acc gag aag acg cgt atg aat aat ttc ctg gac aac143Lys Leu Thr Val Thr Glu Lys Thr Arg Met Asn Asn Phe Leu Asp Asn35 40 45aag aac gac atc aag aag aac tac aag gag atc acc ttc agc atg gct191Lys Asn Asp Ile Lys Lys Asn Tyr Lys Glu Ile Thr Phe Ser Met Ala50 55 60ggc tcc ttc gag gac gag atc aag gac ctg aag gag atc gac aag atg239Gly Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met65 70 75ttc gac aag gcc aac ctg tcc tcc tcc atc gtg acc tac aag aac gtg287Phe Asp Lys Ala Asn Leu Ser Ser Ser Ile Val Thr Tyr Lys Asn Val80 85 90 95gag cca tcc acc atc gga ttt aac aag cca ctg acc gag ggc aac acc335Glu Pro Ser Thr Ile Gly Phe Asn Lys Pro Leu Thr Glu Gly Asn Thr100 105 110atc aac acc gac gtg cag gcc cag ttc aag gag cag ttc ctg ggc aag383Ile Asn Thr Asp Val Gln Ala Gln Phe Lys Glu Gln Phe Leu Gly Lys115 120 125gac atc aag ttc gac tcc tac ctg gac acc cac ctg act gct cag aac431Asp Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Asn130 135 140gtg tcc tcc aag gag agg atc atc ctc caa gtg acc gtg cca tcc ggc479Val Ser Ser Lys Glu Arg Ile Ile Leu Gln Val Thr Val Pro Ser Gly145 150 155aag ggc tcc acc atc ccg acc aag gct ggt gtg atc ctg aac aac aac527Lys Gly Ser Thr Ile Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Asn160 165 170 175gag tac aag atg ctg atc gac aac ggc tac gtg ctg cac gtg gac aac575Glu Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu His Val Asp Asn180 185 190atc tcc aag gtg gtg aag aag ggt tac gag tgc ctg cag atc cag ggt623Ile Ser Lys Val Val Lys Lys Gly Tyr Glu Cys Leu Gln Ile Gln Gly195 200 205acc ctg aag aag tcc ctg gac ttc aag aac gac atc aac gcc gag gct671Thr Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala210 215 220cac agg tgg ggc atg aag aac tac gag ggt tgg gct aag aac ctg acc719His Arg Trp Gly Met Lys Asn Tyr Glu Gly Trp Ala Lys Asn Leu Thr225 230 235gac cca cag agg gag gcc ctg gac ggc tac gct agg cag gac tac aag767Asp Pro Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys240 245 250 255cag atc aac gac tac ctg cgg aac cag ggt ggc tcc ggc aac gag aag815Gln Ile Asn Asp Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys260 265 270ctg gac acc cag atc aag aac atc tcc gag gct ctg gag aag cag ccg863Leu Asp Thr Gln Ile Lys Asn Ile Ser Glu Ala Leu Glu Lys Gln Pro275 280 285atc cca gag aac atc acc gtg tac agg tgg tgc ggt atg gcc gag ttc911Ile Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Ala Glu Phe290 295 300ggt tac cag att tcc gac cca ctg cca tcc ctg aag gag atg gag gag959Gly Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Glu Met Glu Glu305 310 315aag ttc ctg aac acc atg aag gag gac aag ggt tac atg tcc acc tcc 1007Lys Phe Leu Asn Thr Met Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser320 325 330 335ctg tcc tcc gag agg ctg tcc gct ttc ggc tcc agg aag ttc atc ctg1055Leu Ser Ser Glu Arg Leu Ser Ala Phe Gly Ser Arg Lys Phe Ile Leu340 345 350agg ctg cag gtg cca aag ggt tcc act ggt gcc tac ctg tcc gct atc1103Arg Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile355 360 365ggt ggc ttc gct tcc gag aag gag atc ctg atc gac aag gac tcc aac1151Gly Gly Phe Ala Ser Glu Lys Glu Ile Leu Ile Asp Lys Asp Ser Asn370 375 380tac cac atc gac aag atc acc gag gtg gtg atc aag ggt gtg aag agg1199Tyr His Ile Asp Lys Ile Thr Glu Val Val Ile Lys Gly Val Lys Arg385 390 395tac gta gtg gac gct acc ctg ctg acc aag tgaggctagc 1239Tyr Val Val Asp Ala Thr Leu Leu Thr Lys400 405<210>8<211>409<212>PRT<213>人工<400>8Met Ala Leu Val Lys Thr Thr Asn Asn Thr Glu Asp Phe Lys Glu Asp1 5 10 15Lys Glu Lys Ala Lys Glu Trp Gly Lys Glu Lys Glu Lys Glu Trp Lys20 25 30Leu Thr Val Thr Glu Lys Thr Arg Met Asn Asn Phe Leu Asp Asn Lys35 40 45Asn Asp Ile Lys Lys Asn Tyr Lys Glu Ile Thr Phe Ser Met Ala Gly50 55 60Ser Phe Glu Asp Glu Ile Lys Asp Leu Lys Glu Ile Asp Lys Met Phe65 70 75 80Asp Lys Ala Asn Leu Ser Ser Ser Ile Val Thr Tyr Lys Asn Val Glu85 90 95Pro Ser Thr Ile Gly Phe Asn Lys Pro Leu Thr Glu Gly Asn Thr Ile100 105 110Asn Thr Asp Val Gln Ala Gln Phe Lys Glu Gln Phe Leu Gly Lys Asp115 120 125Ile Lys Phe Asp Ser Tyr Leu Asp Thr His Leu Thr Ala Gln Asn Val130 135 140Ser Ser Lys Glu Arg Ile Ile Leu Gln Val Thr Val Pro Ser Gly Lys145 150 155 160Gly Ser Thr Ile Pro Thr Lys Ala Gly Val Ile Leu Asn Asn Asn Glu165 170 175Tyr Lys Met Leu Ile Asp Asn Gly Tyr Val Leu His Val Asp Asn Ile180 185 190Ser Lys Val Val Lys Lys Gly Tyr Glu Cys Leu Gln Ile Gln Gly Thr195 200 205Leu Lys Lys Ser Leu Asp Phe Lys Asn Asp Ile Asn Ala Glu Ala His210 215 220Arg Trp Gly Met Lys Asn Tyr Glu Gly Trp Ala Lys Asn Leu Thr Asp225 230 235 240Pro Gln Arg Glu Ala Leu Asp Gly Tyr Ala Arg Gln Asp Tyr Lys Gln245 250 255Ile Asn Asp Tyr Leu Arg Asn Gln Gly Gly Ser Gly Asn Glu Lys Leu260 265 270Asp Thr Gln Ile Lys Asn Ile Ser Glu Ala Leu Glu Lys Gln Pro Ile275 280 285Pro Glu Asn Ile Thr Val Tyr Arg Trp Cys Gly Met Ala Glu Phe Gly290 295 300Tyr Gln Ile Ser Asp Pro Leu Pro Ser Leu Lys Glu Met Glu Glu Lys305 310 315 320Phe Leu Asn Thr Met Lys Glu Asp Lys Gly Tyr Met Ser Thr Ser Leu325 330 335Ser Ser Glu Arg Leu Ser Ala Phe Gly Ser Arg Lys Phe Ile Leu Arg340 345 350Leu Gln Val Pro Lys Gly Ser Thr Gly Ala Tyr Leu Ser Ala Ile Gly355 360 365Gly Phe Ala Ser Glu Lys Glu Ile Leu Ile Asp Lys Asp Ser Asn Tyr370 375 380His Ile Asp Lys Ile Thr Glu Val Val Ile Lys Gly Val Lys Arg Tyr385 390 395 400Val Val Asp Ala Thr Leu Leu Thr Lys405<210>9<211>2520<212>DNA<213>人工<220><223>编码ISP1A蛋白的修饰DNA<220><221>CDS<222>(3)..(2510)<400>9cc atg gct atc gcc acc acc acc cag gct tcg aag gac aac cag atc 47Met Ala Ile Ala Thr Thr Thr Gln Ala Ser Lys Asp Asn Gln Ile1 5 10 15gac agg gag ggc ctg ctg ggc tac tac ttc aag ggc aag gac ttc aac 95Asp Arg Glu Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Asn20 25 30gac ctg acc ctg ttc gct cca acc agg gac aac acc ctg atc tac gac143Asp Leu Thr Leu Phe Ala Pro Thr Arg Asp Asn Thr Leu Ile Tyr Asp35 40 45cag cag acc gct aac acc ctc gtg gac cag aag cac cag gag tac cac191Gln Gln Thr Ala Asn Thr Leu Val Asp Gln Lys His Gln Glu Tyr His50 55 60tcc atc cgc tgg atc ggc ctg atc cag tcc tcc gcc act ggt gac ttc239Ser Ile Arg Trp Ile Gly Leu Ile Gln Ser Ser Ala Thr Gly Asp Phe65 70 75acc ttc aag ctg tcc gac gac gag aac gcc atc atc gag ctg gac ggc287Thr Phe Lys Leu Ser Asp Asp Glu Asn Ala Ile Ile Glu Leu Asp Gly80 85 90 95aag gtg atc tcc gag aag ggc aac aac aag cag tcc gtg cac ctc gaa335Lys Val Ile Ser Glu Lys Gly Asn Asn Lys Gln Ser Val His Leu Glu100 105 110aag ggc cag ctg gtg cag atc aag atc gag tac cag tcc gac gac gcc383Lys Gly Gln Leu Val Gln Ile Lys Ile Glu Tyr Gln Ser Asp Asp Ala115 120 125ctg cac atc gac aac aag atc ttc aag gag ctg aag ctg ttc aag atc431Leu His Ile Asp Asn Lys Ile Phe Lys Glu Leu Lys Leu Phe Lys Ile130 135 140gac tcc cag aac cac tcc cag cag gtg cag cag gac gag ctg agg aac479Asp Ser Gln Asn His Ser Gln Gln Val Gln Gln Asp Glu Leu Arg Asn145 150 155cca gag ttc aac aag aag gag acc cag gtg ttc ctg aag aag gcc tcc527Pro Glu Phe Asn Lys Lys Glu Thr Gln Val Phe Leu Lys Lys Ala Ser160 165 170 175aag acc aac ctg ttc acc cag aag acc aag agg gac atc gac gag gac575Lys Thr Asn Leu Phe Thr Gln Lys Thr Lys Arg Asp Ile Asp Glu Asp180 185 190acc gac acc gac ggc gac tcc atc ccg gac gtg tgg gag gag aac ggc623Thr Asp Thr Asp Gly Asp Ser Ile Pro Asp Val Trp Glu Glu Asn Gly195 200 205tac acc atc cag aac aag gtg gcc gtg aag tgg gac gac tcc ctg gcc671Tyr Thr Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser Leu Ala210 215 220tcc aag ggc tac cag aag ttc acc agc aac cca ctc gaa gcc cac acc719Ser Lys Gly Tyr Gln Lys Phe Thr Ser Asn Pro Leu Glu Ala His Thr225 230 235gtg ggc gac cca tac tcc gac tac gag aag gct gct agg gac atg cca767Val Gly Asp Pro Tyr Ser Asp Tyr Glu Lys Ala Ala Arg Asp Met Pro240 245 250 255ctg tcc aac gcc aag gag acc ttc aac cca ctg gtg gct gct ttc cca815Leu Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro260 265 270tcc gtg aac gtg tcc ctc gaa aag gtg atc ctg tcc aag aac gag gac863Ser Val Asn Val Ser Leu Glu Lys Val Ile Leu Ser Lys Asn Glu Asp275 280 285ctg tcc cac tcc gtg gag tcc tcc cag tcc acc aac tgg tcc tac acc911Leu Ser His Ser Val Glu Ser Ser Gln Ser Thr Asn Trp Ser Tyr Thr290 295 300aac acc gag ggc gtg aac gtg aac gct ggt tgg tcc ggt ctg ggt cca959Asn Thr Glu Gly Val Asn Val Asn Ala Gly Trp Ser Gly Leu Gly Pro305 310 315tcc ttc ggc gtg tcc gtg aac tac cag cac tcc gag acc gtg gcc aac1007Ser Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala Asn320 325 330 335gag tgg ggc tcc gcc acc aac gac ggc acc cac atc aac ggt gct gag1055Glu Trp Gly Ser Ala Thr Asn Asp Gly Thr His Ile Asn Gly Ala Glu340 345 350tcc gcc tac ctg aac gcc aac gtg agg tac aac aac gtg ggc acc ggt1103Ser Ala Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly355 360 365gct atc tac gag acc aag cca acc acc tcc ttc atc ctg gac ggc acc1151Ala Ile Tyr Glu Thr Lys Pro Thr Thr Ser Phe Ile Leu Asp Gly Thr370 375 380acc atc ggc acc atc aag gcc aag gag aac acc acc gct ctg acc atc1199Thr Ile Gly Thr Ile Lys Ala Lys Glu Asn Thr Thr Ala Leu Thr Ile385 390 395ctg cca gac cag tcc tac cca gag aag ggc aag aac ggc atc gcc atc1247Leu Pro Asp Gln Ser Tyr Pro Glu Lys Gly Lys Asn Gly Ile Ala Ile400 405 410 415aac acg atg gac gac ttc aac tcc agg ccg atc cca ctg aac aag gag1295Asn Thr Met Asp Asp Phe Asn Ser Arg Pro Ile Pro Leu Asn Lys Glu420 425 430cag ctg aac acc tac ctg tcc aac aag aag ccg atc ctg ctc gaa acc1343Gln Leu Asn Thr Tyr Leu Ser Asn Lys Lys Pro Ile Leu Leu Glu Thr435 440 445gac cag gtg gag ggc aag tac gcc atc aag gac acc aac ggc aac atc1391Asp Gln Val Glu Gly Lys Tyr Ala Ile Lys Asp Thr Asn Gly Asn Ile450 455 460acc atc gct ggt gac tgg aac ggc atc acc gac gag atc tcc gcc aag1439Thr Ile Ala Gly Asp Trp Asn Gly Ile Thr Asp Glu Ile Ser Ala Lys465 470 475acc gcc agc atc atc gtc gac aac ggc aac cag atg tcc gag aag agg1487Thr Ala Ser Ile Ile Val Asp Asn Gly Asn Gln Met Ser Glu Lys Arg480 485 490 495gtg gct gct aag gac tac acc aac cca gag gac aag acc cca aat tta1535Val Ala Ala Lys Asp Tyr Thr Asn Pro Glu Asp Lys Thr Pro Asn Leu500 505 510tcc gtg aag gag gcc ctg aag ctg gcc tac cca gac gag atc gag gag1583Ser Val Lys Glu Ala Leu Lys Leu Ala Tyr Pro Asp Glu Ile Glu Glu515 520 525aag gac ggc ctg ctg ttc tac aac gac cag ccg atc ttc gag gct tcc1631Lys Asp Gly Leu Leu Phe Tyr Asn Asp Gln Pro Ile Phe Glu Ala Ser530 535 540gtg cag tcc tac gtg gac gag tac acc gct aag cag atc agg aag cag1679Val Gln Ser Tyr Val Asp Glu Tyr Thr Ala Lys Gln Ile Arg Lys Gln545 550 555ctg aac gac tcc acc ggt tcc ttc aag gac gtg aag aac ctg tac gac1727Leu Asn Asp Ser Thr Gly Ser Phe Lys Asp Val Lys Asn Leu Tyr Asp560 565 570 575gtg aag ctc gaa ccg aag atg aac ttc aca ata aag acc tcc acc ctg1775Val Lys Leu Glu Pro Lys Met Asn Phe Thr Ile Lys Thr Ser Thr Leu580 585 590tac gac ggt ggt gag tcc gac aac acc aag atc ggc aac tgg tac tac1823Tyr Asp Gly Gly Glu Ser Asp Asn Thr Lys Ile Gly Asn Trp Tyr Tyr595 600 605acc tac gtg gtg aac ggt ggt aac acc ggt aag aag cag tac agg tcc1871Thr Tyr Val Val Asn Gly Gly Asn Thr Gly Lys Lys Gln Tyr Arg Ser610 615 620gct aac aag ggt gct ttc acc gag ctg tcc acc gag tcc aag aac aag1919Ala Asn Lys Gly Ala Phe Thr Glu Leu Ser Thr Glu Ser Lys Asn Lys625 630 635ctg aag aag aac atc gac tac tac gtg tcc ctg tac atg aag gct gac1967Leu Lys Lys Asn Ile Asp Tyr Tyr Val Ser Leu Tyr Met Lys Ala Asp640 645 650 655tcc aag gtg tcc gtg gac atc gag atc gac ggt aag cag gag tcc atc2015Ser Lys Val Ser Val Asp Ile Glu Ile Asp Gly Lys Gln Glu Ser Ile660 665 670gtg acc gac aac atc acc ctg gac cac gtg ggt tac cag agg atc aac2063Val Thr Asp Asn Ile Thr Leu Asp His Val Gly Tyr Gln Arg Ile Asn675 680 685atc ctg gtg cca aac ctg gag ggc aac gag atc aac acc atc tcc atc2111Ile Leu Val Pro Asn Leu Glu Gly Asn Glu Ile Asn Thr Ile Ser Ile690 695 700aag ggt gac ggc cag acc aac gtg tac tgg gac gac gtg tcc ttc gtg2159Lys Gly Asp Gly Gln Thr Asn Val Tyr Trp Asp Asp Val Ser Phe Val705 710 715gag gtg ggt gct gag gag atc gag tac aag gac cca gtg cca cag ttc2207Glu Val Gly Ala Glu Glu Ile Glu Tyr Lys Asp Pro Val Pro Gln Phe720 725 730 735gac atc atc gag ggt gac ttc gac ttc ttc ggt gac cca ctg gcc gtg2255Asp Ile Ile Glu Gly Asp Phe Asp Phe Phe Gly Asp Pro Leu Ala Val740 745 750aag tac cac gac gct acc tac ttc atc gac tcc cca ctg att acc cag2303Lys Tyr His Asp Ala Thr Tyr Phe Ile Asp Ser Pro Leu Ile Thr Gln755 760 765acc cca ggt acc ttc tcc ttc acc tac aag gtg atc ggt gag cag acc2351Thr Pro Gly Thr Phe Ser Phe Thr Tyr Lys Val Ile Gly Glu Gln Thr770 775 780aag acc gtg ctg gac tcc ggt tcc ggc aag aac gct aac agg atc aac2399Lys Thr Val Leu Asp Ser Gly Ser Gly Lys Asn Ala Asn Arg Ile Asn785 790 795ctg gac ttc aag aac gtg aag tcc gac agg tcc ttc ctg tac acc ctg2447Leu Asp Phe Lys Asn Val Lys Ser Asp Arg Ser Phe Leu Tyr Thr Leu800 805 810 815tcc tgc aag gac gac ctg tgg ggc tcc acc agg acc gct gtg gtg agg2495Ser Cys Lys Asp Asp Leu Trp Gly Ser Thr Arg Thr Ala Val Val Arg820 825 830atc ttc gct gtg gac tgaggctagc 2520Ile Phe Ala Val Asp835<210>10<211>836<212>PRT<213>人工<400>10Met Ala Ile Ala Thr Thr Thr Gln Ala Ser Lys Asp Asn Gln Ile Asp1 5 10 15Arg Glu Gly Leu Leu Gly Tyr Tyr Phe Lys Gly Lys Asp Phe Asn Asp20 25 30Leu Thr Leu Phe Ala Pro Thr Arg Asp Asn Thr Leu Ile Tyr Asp Gln35 40 45Gln Thr Ala Asn Thr Leu Val Asp Gln Lys His Gln Glu Tyr His Ser50 55 60Ile Arg Trp Ile Gly Leu Ile Gln Ser Ser Ala Thr Gly Asp Phe Thr65 70 75 80Phe Lys Leu Ser Asp Asp Glu Asn Ala Ile Ile Glu Leu Asp Gly Lys85 90 95Val Ile Ser Glu Lys Gly Asn Asn Lys Gln Ser Val His Leu Glu Lys100 105 110Gly Gln Leu Val Gln Ile Lys Ile Glu Tyr Gln Ser Asp Asp Ala Leu115 120 125His Ile Asp Asn Lys Ile Phe Lys Glu Leu Lys Leu Phe Lys Ile Asp130 135 140Ser Gln Asn His Ser Gln Gln Val Gln Gln Asp Glu Leu Arg Asn Pro145 150 155 160Glu Phe Asn Lys Lys Glu Thr Gln Val Phe Leu Lys Lys Ala Ser Lys165 170 175Thr Asn Leu Phe Thr Gln Lys Thr Lys Arg Asp Ile Asp Glu Asp Thr180 185 190Asp Thr Asp Gly Asp Ser Ile Pro Asp Val Trp Glu Glu Asn Gly Tyr195 200 205Thr Ile Gln Asn Lys Val Ala Val Lys Trp Asp Asp Ser Leu Ala Ser210 215 220Lys Gly Tyr Gln Lys Phe Thr Ser Asn Pro Leu Glu Ala His Thr Val225 230 235 240Gly Asp Pro Tyr Ser Asp Tyr Glu Lys Ala Ala Arg Asp Met Pro Leu245 250 255Ser Asn Ala Lys Glu Thr Phe Asn Pro Leu Val Ala Ala Phe Pro Ser260 265 270Val Asn Val Ser Leu Glu Lys Val Ile Leu Ser Lys Asn Glu Asp Leu275 280 285Ser His Ser Val Glu Ser Ser Gln Ser Thr Asn Trp Ser Tyr Thr Asn290 295 300Thr Glu Gly Val Asn Val Asn Ala Gly Trp Ser Gly Leu Gly Pro Ser305 310 315 320Phe Gly Val Ser Val Asn Tyr Gln His Ser Glu Thr Val Ala Asn Glu325 330 335Trp Gly Ser Ala Thr Asn Asp Gly Thr His Ile Asn Gly Ala Glu Ser340 345 350Ala Tyr Leu Asn Ala Asn Val Arg Tyr Asn Asn Val Gly Thr Gly Ala355 360 365Ile Tyr Glu Thr Lys Pro Thr Thr Ser Phe Ile Leu Asp Gly Thr Thr370 375 380Ile Gly Thr Ile Lys Ala Lys Glu Asn Thr Thr Ala Leu Thr Ile Leu385 390 395 400Pro Asp Gln Ser Tyr Pro Glu Lys Gly Lys Asn Gly Ile Ala Ile Asn405 410 415Thr Met Asp Asp Phe Asn Ser Arg Pro Ile Pro Leu Asn Lys Glu Gln420 425 430Leu Asn Thr Tyr Leu Ser Asn Lys Lys Pro Ile Leu Leu Glu Thr Asp435 440 445Gln Val Glu Gly Lys Tyr Ala Ile Lys Asp Thr Asn Gly Asn Ile Thr450 455 460Ile Ala Gly Asp Trp Asn Gly Ile Thr Asp Glu Ile Ser Ala Lys Thr465 470 475 480Ala Ser Ile Ile Val Asp Asn Gly Asn Gln Met Ser Glu Lys Arg Val485 490 495Ala Ala Lys Asp Tyr Thr Asn Pro Glu Asp Lys Thr Pro Asn Leu Ser500 505 510Val Lys Glu Ala Leu Lys Leu Ala Tyr Pro Asp Glu Ile Glu Glu Lys515 520 525Asp Gly Leu Leu Phe Tyr Asn Asp Gln Pro Ile Phe Glu Ala Ser Val530 535 540Gln Ser Tyr Val Asp Glu Tyr Thr Ala Lys Gln Ile Arg Lys Gln Leu545 550 555 560Asn Asp Ser Thr Gly Ser Phe Lys Asp Val Lys Asn Leu Tyr Asp Val565 570 575Lys Leu Glu Pro Lys Met Asn Phe Thr Ile Lys Thr Ser Thr Leu Tyr580 585 590Asp Gly Gly Glu Ser Asp Asn Thr Lys Ile Gly Asn Trp Tyr Tyr Thr595 600 605Tyr Val Val Asn Gly Gly Asn Thr Gly Lys Lys Gln Tyr Arg Ser Ala610 615 620Asn Lys Gly Ala Phe Thr Glu Leu Ser Thr Glu Ser Lys Asn Lys Leu625 630 635 640Lys Lys Asn Ile Asp Tyr Tyr Val Ser Leu Tyr Met Lys Ala Asp Ser645 650 655Lys Val Ser Val Asp Ile Glu Ile Asp Gly Lys Gln Glu Ser Ile Val660 665 670Thr Asp Asn Ile Thr Leu Asp His Val Gly Tyr Gln Arg Ile Asn Ile675 680 685Leu Val Pro Asn Leu Glu Gly Asn Glu Ile Asn Thr Ile Ser Ile Lys690 695 700Gly Asp Gly Gln Thr Asn Val Tyr Trp Asp Asp Val Ser Phe Val Glu705 710 715 720Val Gly Ala Glu Glu Ile Glu Tyr Lys Asp Pro Val Pro Gln Phe Asp725 730 735Ile Ile Glu Gly Asp Phe Asp Phe Phe Gly Asp Pro Leu Ala Val Lys740 745 750Tyr His Asp Ala Thr Tyr Phe Ile Asp Ser Pro Leu Ile Thr Gln Thr755 760 765Pro Gly Thr Phe Ser Phe Thr Tyr Lys Val Ile Gly Glu Gln Thr Lys770 775 780Thr Val Leu Asp Ser Gly Ser Gly Lys Asn Ala Asn Arg Ile Asn Leu785 790 795 800Asp Phe Lys Asn Val Lys Ser Asp Arg Ser Phe Leu Tyr Thr Leu Ser805 810 815Cys Lys Asp Asp Leu Trp Gly Ser Thr Arg Thr Ala Val Val Arg Ile820 825 830Phe Ala Val Asp83权利要求
1.包含SEQ ID No.2中最小活性毒素蛋白的氨基酸序列的蛋白质，其中所述的最小活性毒素a)是SEQ ID No.2所示蛋白的片段，且b)当与SEQ ID No.4中51到457位氨基酸序列所示的蛋白组合被玉米根叶甲幼虫摄入后能够将所述幼虫杀死。
2.包含SEQ ID No.4中最小活性毒素蛋白的氨基酸序列的蛋白质，其中所述的最小活性毒素a)是SEQ ID No.4所示蛋白的片段，且b)当与SEQ ID No.2中38到871位氨基酸序列所示的蛋白组合被玉米根叶甲幼虫摄入后能够将所述幼虫杀死。
3.蛋白质，其包含SEQ ID No.2中从第38位到768或871位的氨基酸序列。
4.如权利要求3所述的蛋白质，其包含SEQ ID No.2或SEQ IDNo.10的氨基酸序列。
5.蛋白质，其包含SEQ ID No.4中从第51位到449或457位的氨基酸序列。
6.如权利要求5所述的蛋白质，其包含SEQ ID No.4或SEQ ID No.8的氨基酸序列。
7.包含isp1ADNA所编码蛋白的蛋白酶消化片段的氨基酸序列的蛋白质，所述的isp1ADNA保藏于BCCM-LMBP，保藏号为LMBP 4009，其中所述蛋白酶消化片段当与SEQ ID.No.4中第51位到第457位氨基酸组成的蛋白组合施用时对玉米根叶甲具有杀昆虫作用。
8.包含isp2ADNA所编码蛋白的蛋白酶消化片段的氨基酸序列的蛋白质，所述的isp2ADNA保藏于BCCM-LMBP，保藏号为LMBP 4009，其中所述蛋白酶消化片段当与SEQ ID.No.2中第38位到第871位氨基酸组成的蛋白组合施用时对玉米根叶甲具有杀昆虫作用。
9.如权利要求7所述的蛋白质，其中所述蛋白酶消化片段可经鞘翅目昆虫消化液处理得到。
10.如权利要求8所述的蛋白质，其中所述蛋白酶消化片段可经鞘翅目昆虫消化液处理得到。
11.编码权利要求1，3，4，7，或9中任意一项的蛋白质的DNA序列。
12.编码权利要求2，5，6，8或10中任意一项的蛋白质的DNA序列。
13.如权利要求11所述的DNA，其包含人工的DNA序列，该人工DNA序列与天然存在的DNA序列有不同的密码子使用但编码相同的蛋白序列。
14.如权利要求12所述的DNA，其包含人工的DNA序列，该人工DNA序列与天然存在的DNA序列有不同的密码子使用但编码相同的蛋白序列。
15.嵌合基因，其包含权利要求13所述的DNA和可在植物中表达的启动子区域。
16.嵌合基因，其包含权利要求14所述的DNA和可在植物中表达的启动子区域。
17.如权利要求15所述的嵌合基因，其中所述的启动子区域优先在根组织中具有活性。
18.如权利要求16所述的嵌合基因，其中所述的启动子区域优先在根组织中具有活性。
19.如权利要求15所述的嵌合基因，其中所述的启动子包括SEQ IDNo.5或6的DNA序列或能在严紧条件下与其杂交的DNA。
20.如权利要求16所述的嵌合基因，其中所述的启动子包括SEQ IDNo.5或6的DNA序列或能在严紧条件下与其杂交的DNA。
21.如权利要求15所述的嵌合基因，其中所述的嵌合基因还包含用于向细胞外分泌或靶向细胞器的信号肽。
22.如权利要求16所述的嵌合基因，其中所述的嵌合基因还包含用于向细胞外分泌或靶向细胞器的信号肽。
23.如权利要求21所述的嵌合基因，其中所述的信号肽是叶绿体转运肽。
24.如权利要求22所述的嵌合基因，其中所述的信号肽是叶绿体转运肽。
25.植物细胞，其包含嵌合基因，所述的嵌合基因选自权利要求15，17，19，21或23中任意一项所述的嵌合基因。
26.植物细胞，其包含嵌合基因，所述的嵌合基因选自权利要求16，18，20，22或24中任意一项所述的嵌合基因。
27.植物细胞，其经转化而含有选自权利要求15，17，19，21或23中任意一项所述的嵌合基因的嵌合基因和选自权利要求16，18，20，22或24中任意一项所述的嵌合基因的嵌合基因。
28.植物细胞，其经转化而产生权利要求1，3，4或7中任意一项所述的蛋白和权利要求2，5，6或8中任意一项所述的蛋白。
29.植物或种子，其包含整合到其细胞中的嵌合基因，其中所述的嵌合基因选自权利要求15，17，19，21或23中任意一项所述的嵌合基因。
30.植物或种子，其包含嵌合基因，其中所述的嵌合基因选自权利要求16，18，20，22或24中任意一项所述的嵌合基因。
31.如权利要求29所述的植物或种子，其是玉米植物或种子。
32.如权利要求30所述的植物或种子，其是玉米植物或种子。
33.微生物，其经转化而含有权利要求11所述的DNA或权利要求12所述的DNA。
34.控制昆虫的方法，其包括在植物细胞中表达蛋白，其中所述的蛋白选自权利要求1到8中任意一项所述的蛋白。
35.赋予植物抗鞘翅目昆虫的方法，其包括用第一嵌合基因和第二嵌合基因转化植物细胞，和由所述的抗昆虫性细胞再生转化植物，其中所述的第一嵌合基因选自权利要求15，17，19，21或23中任意一项所述的嵌合基因；所述的第二嵌合基因选自权利要求16，18，20，22或24中任意一项所述的嵌合基因。
36.控制鞘翅目昆虫病虫害的方法，包括在田地里种植、播种或栽培经第一嵌合基因和第二嵌合基因转化的植物，其中所述的第一嵌合基因选自权利要求15，17，19，21或23中任意一项所述的嵌合基因；所述的第二嵌合基因选自权利要求16，18，20，22或24中任意一项所述的嵌合基因。
37.如权利要求36所述的方法，其中所述的植物是玉米。
38.如权利要求35，36或37中任意一项所述的方法，其中所述的昆虫选自根虫，象甲，马铃薯甲虫，叶甲，花象属种，马铃薯叶甲属种，杨树莹叶甲，紫苜蓿叶象，埃及苜蓿叶象，Haltica tombacina，墨西哥棉铃象，黄粉虫，赤拟谷盗，水稻铁甲，Trichispa serica，水稻负泥虫，葡萄肖叶甲，稻水象甲，萝卜菜跳甲，黄曲条菜跳甲，忽布跳甲，美洲油菜叶甲，油菜露尾甲，龟象属种，油菜金头跳甲，豌豆细纹跳甲，马铃薯甲虫，黄瓜十一星叶甲亚种，黄瓜十一星叶甲食根亚种，Diabrotica barberi和玉米根叶甲。
39.产品，其包含作为组合制剂用以同时、分开或连续使用以保护玉米植物不受玉米根虫侵害的权利要求1，3，4，7或9中任意一项所述的蛋白和权利要求2，5，6，8和10中任意一项所述的蛋白。
40.权利要求39所述的产品，其是保护玉米植物不受玉米根虫侵害的玉米植物或杀昆虫组合物。
全文摘要
本发明分离了细菌杀昆虫蛋白及其等价物。这些蛋白和编码所述蛋白的DNA序列可用于制备杀昆虫组合物或转基因植物，以保护植物不受昆虫尤其是鞘翅目昆虫的损害。
文档编号C12N1/19GK1432065SQ01809679
公开日2003年7月23日申请日期2001年5月17日优先权日2000年5月18日
发明者A·伯特斯, G·阿尔诺, N·达默, J·万瑞申请人:拜尔生物科学公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：A.伯特斯;G.阿尔诺;N.达默;J.万瑞
技术所有人：拜尔生物科学公司
我是此专利的发明人

上一篇：用活性炭进行微过滤的制作方法
上一篇：夜香树黄叶卷曲病毒启动子的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。