苏云金芽孢杆菌杀昆虫蛋白质的制作方法

文档序号:601829阅读:562来源:国知局
专利名称:苏云金芽孢杆菌杀昆虫蛋白质的制作方法
技术领域
苏云金芽孢杆菌(本文中缩写为"Bt")因其对昆虫害虫的特异毒性而出名,几乎一个世纪以来,人们利用它控制植物的昆虫害虫。最近几年,产生了表达Bt蛋白质的转基因植物,发现该转基因植物成功控制了昆虫对植物的损害(例如,Vaeck等,1987,Jansens等,1997)。
尽管分离了相当多的杀昆虫Bt基因,但是还在继续寻找编码杀昆虫蛋白质的新的基因。实际上,与化学杀昆虫剂比较,已知杀昆虫Bt蛋白质有相对窄的靶昆虫范围。并且,如果有多种毒素可以针对相同的靶昆虫物种,则将允许应用不同作用方式的蛋白质,由此可以防止或延迟昆虫抗性的发展。而且,具有不同氨基酸序列的杀昆虫Bt蛋白质对特定昆虫有不同水平的杀昆虫效力,为了能够控制不同农作物的相关昆虫害虫,人们可能期望有几种不同的杀昆虫蛋白质可用。
(ii)相关领域的描述以前,已鉴定了几种类型的Cry2A-蛋白质(参见Crickmore等,1998,这里并其为参考文献)。
本发明新的Cry2Ae蛋白质与Cry2Aa1蛋白质(Donovan等,GenBank记录号M31738)有最高氨基酸序列的同一性,但是两者的氨基酸序列仍旧有约9%的不同。
在Cry2Ab1蛋白质(Widner和Whiteley,GenBank记录号M23724)中发现了与Cry2Af蛋白质最接近的序列同一性,但是两种蛋白质的氨基酸序列仍旧有约5%的不同。
在Cry2Ac1蛋白质(Wu等,GenBank记录号X57252)中,发现了与Cry2Ag蛋白质最接近的序列同一性,但是两种蛋白质的氨基酸序列仍旧有约20%的不同。
其它已知的Cry2A蛋白质包括Cry2Ad1蛋白质(Choi等,1999)和其它Cry2Aa,Cry2Ab和Cry2Ac蛋白质(Crickmore等,1998)。在美国专利5,338,544,公布的PCT专利申请WO 00/26371和公布的PCT专利申请WO 98/40490中还记载了Cry2A-样蛋白质和编码它们的DNA序列。
植物中Cry2A-类蛋白质的表达在例如,Kota等,(1999)和公布的PCT专利申请WO 00/26371中已有描述。
本发明目的和概述本发明提供了编码蛋白质的核酸序列,特别是DNA序列,所述蛋白质包含选自下面的氨基酸序列a)保藏在BCCM-LMBP、保藏号为LMBP4248的cry2Ae基因编码的蛋白质的最小毒性片段的氨基酸序列,b)保藏在BCCM-LMBP、保藏号为LMBP 4247的cry2Af基因编码的蛋白质的最小毒性片段的氨基酸序列,和c)保藏在BCCM-LMBP、保藏号为LMBP4249的cry2Ag基因编码的蛋白质的最小毒性片段的氨基酸序列。
本发明特别优选的是编码如下蛋白质的核酸序列,尤其是DNA序列,所述蛋白质包含选自下面的氨基酸序列SEQ ID No.2蛋白质的杀昆虫片段的氨基酸序列,SEQ ID No.4蛋白质的杀昆虫片段的氨基酸序列,SEQID No.4蛋白质的杀昆虫片段的氨基酸序列。
而且,本发明提供了编码如下蛋白质的核酸序列,特别是DNA序列,所述蛋白质包含选自下面的氨基酸序列SEQ ID No.2中从氨基酸位置1到氨基酸位置632的氨基酸序列,SEQ ID No.4中从氨基酸位置1到氨基酸位置632的氨基酸序列,SEQ ID No.6中从氨基酸位置1到氨基酸位置627的氨基酸序列。
而且,本发明提供了包含人工序列的上述核酸序列,特别是DNA序列,其中所述人工序列尽管与天然存在的序列比较有不同的密码子使用,但是仍编码相同的蛋白质或其杀昆虫片段,优选此密码子使用类似于植物的密码子使用,特别是核酸序列(尤其是DNA序列)将要转化的宿主植物的密码子使用。
进一步,本发明提供了包含选自下面的氨基酸序列的蛋白质a)保藏在BCCM-LMBP、保藏号为LMBP 4248的cry2Ae基因编码的蛋白质的最小毒性片段的氨基酸序列,b)保藏在BCCM-LMBP、保藏号为LMBP4247的cry2Af基因编码的蛋白质的最小毒性片段的氨基酸序列,和c)保藏在BCCM-LMBP、保藏号为LMBP 4249的cry2Ag基因编码的蛋白质的杀昆虫最小毒性片段的氨基酸序列。
这里特别优选的是包含选自下面的氨基酸序列的蛋白质SEQ ID No.2蛋白质的杀昆虫片段的氨基酸序列,SEQ ID No.4蛋白质的杀昆虫片段的氨基酸序列,SEQ ID No.6蛋白质的杀昆虫片段的氨基酸序列。
这里也提供了受植物可表达启动子控制的包含上述DNA的嵌合基因,及经转化而含有这些嵌合基因的植物细胞、植物或种子,特别是选自下面的植物细胞、植物或种子玉米、棉花、水稻、烟草、油籽油菜、芸苔属种、茄子、大豆、马铃薯、向日葵、番茄、甘蔗、茶、豆、烟草、草莓、苜蓿、黄瓜、西瓜、胡椒、燕麦、大麦、小麦、大丽花、唐菖蒲、菊花、甜菜、高梁、紫花苜蓿、苹果、梨、草莓、花生。根据本发明,嵌合基因可以整合在植物细胞的核,质体或线粒体DNA中,或还可以含有编码用于靶向液泡、叶绿体、线粒体、质体或用于分泌的有效导向肽或转运肽的DNA。
进一步,本发明提供了被转化而含有任何上述DNA序列的微生物,特别是选自假单孢菌属(Pseudomonas)、农杆菌属(Agrobacterium)、埃希氏菌属(Escherichia)或芽孢杆菌属(Bacillus)的微生物。
这里也提供了控制昆虫的方法,包括在宿主细胞,尤其是植物细胞中表达任何上述核酸序列,特别是DNA序列,和用所述宿主细胞接触昆虫;以及提供了使植物抗昆虫的方法,包括用任何上述DNA序列或嵌合基因转化植物细胞,从该抗昆虫的细胞再生转化的植物。
本发明也涉及控制鳞翅目昆虫,特别是棉花、玉米或大豆的鳞翅目昆虫害虫的方法,该方法包括向要保护的区域或植物施用这里所述的Cry2A蛋白质,优选这里所述的Cry2Ae蛋白质(即,通过种植用本发明cry2A基因转化的植物,或通过喷洒含有本发明Cry2A蛋白质的组合物)。本发明也涉及本发明Cry2A蛋白质,特别是Cry2Ae蛋白质抗鳞翅目昆虫害虫以最小化所述昆虫对大豆植物的损害的用途。
本发明进一步涉及控制鳞翅目水稻昆虫害虫,特别是鳞翅目二化螟,稻苞虫,稻切根虫,稻叶夜蛾,稻纵卷叶螟或美洲稻弄蝶的方法,优选地,昆虫选自二化螟(Chilo suppressalis),Chilo partellus,一点螟(Scirpophaga incertulas),稻蛀茎夜蛾(Sesamia inferens),稻纵卷叶野螟(Cnaphalocrocis medinalis),Marasmia patnalis,Marasmia exigua,Marasmia ruralis,Scirpophaga innotata,该方法包括向要保护的区域或植物应用这里所述的Cry2A蛋白质,优选这里所述的Cry2Ae蛋白质(即,通过种植用本发明cry2A基因转化的水稻植物,或通过喷洒含有本发明Cry2A蛋白质的组合物)。本发明也涉及本发明Cry2A蛋白质,特别是Cry2Ae蛋白质抗鳞翅目水稻昆虫害虫以最小化所述昆虫对水稻植物的损害的用途。
本发明优选实施方案的详细描述根据本发明,“核酸序列”指编码本发明任何Cry2A蛋白质的单或双链形式的DNA或RNA分子,优选DNA或RNA,特别是DNA。用在这里的“分离的核酸序列”指不再存在于其分离自的天然环境中的核酸序列,例如在另外的细菌宿主或植物核基因组中的核酸序列。
根据本发明,可交换使用的术语“蛋白质”或“多肽”指氨基酸序列,而不考虑任何功能性、大小、三维结构或来源。因此,这里仍旧称本发明Cry2A蛋白质的片段或部分在本文中亦称作“蛋白质”。
根据本发明,已分离和表征了编码新的BtCry毒素的核酸序列,特别是DNA序列。这些新的基因命名为cry2Ae,cry2Af,cry2Ag,它们编码的蛋白质命名为Cry2Ae,Cry2Af和Cry2Ag。
本发明“Cry2Ae蛋白质”指包含SEQ ID No.2氨基酸序列中保留了杀昆虫活性的最小片段(此后称为“最小毒性片段”)的任何蛋白质,特别是包含SEQ ID No.2中从氨基酸位置1到氨基酸位置625,尤其是到氨基酸位置632的氨基酸序列的任何蛋白质。这包括含有最小毒性蛋白质片段的杂合和嵌合蛋白质,及含有SEQ ID No.2蛋白质的三个结构域中的至少一个的蛋白质。该定义也包括SEQ ID No.2氨基酸序列的变异体,例如,用GCG的Wisconsin包的GAP程序(Madison,Wisconsin,美国,版本10.0;在GAP程序中用GCG缺省值;对于氨基酸序列比较,用blosum62记分矩阵)利用成对对齐测定在氨基酸序列水平上有至少92%、特别是至少93%、95%、96%、97%、98%或99%序列同一性的蛋白质,优选已添加、置换或缺失一些(优选5-10个,尤其是少于5个)氨基酸而未显著改变,优选没有改变蛋白质的杀昆虫活性的蛋白质,例如SEQ ID No.8的Cry2Ae蛋白质。
这里所用的术语“包含序列X的DNA/蛋白质”指包含或含有至少序列X的DNA或蛋白质,这样可以在5’(或N-末端)和/或3’(或C-末端)末端包含其它的核苷酸或氨基酸序列,例如EP 0 193 259中所公开的可选择标记蛋白质(的核苷酸序列)、转运肽(的核苷酸序列)和/或5′或3′前导序列。
这里所用本发明Cry蛋白质的“最小毒性片段”是指可以通过对全长Cry蛋白质酶促消化得到的保留杀昆虫活性的Cry蛋白质的最小片段或部分,所述酶优选为胰蛋白酶或糜蛋白酶;或是指可以通过在编码Cry蛋白质的DNA中产生核苷酸缺失而得到的保留杀昆虫活性的Cry蛋白质的最小片段或部分。利用本领域常规可用技术,通过对上述片段的氨基酸序列进行测定可以方便地确定最小毒性片段的N-和C-端氨基酸序列的末端。对于本发明保留杀昆虫活性的Cry2A蛋白质片段,通常可以产生N-末端缺失而几乎不可以在其C-末端进行缺失。对于本发明Cry2Ae和Cry2Af蛋白质,预期在C-末端可以产生一直到氨基酸位置625的缺失(即,C-末端氨基酸可以是位置625的氨基酸)而同时保留杀昆虫活性,对于Cry2Ag蛋白质,预期在C-末端可以产生一直到氨基酸位置620的缺失(即,C-末端氨基酸可以是位置620的氨基酸)而同时保留蛋白质的杀昆虫活性。在本发明三种Cry2A蛋白质的氨基酸序列中,预期N-末端缺失可以一直到约第50位氨基酸,优选N-末端缺失一直到氨基酸位置50(即,N-末端氨基酸将是序列表所示序列的第50位)而仍保留它们的抗鳞翅目昆虫的大部分杀昆虫活性。
本发明“Cry2Af蛋白质”指包含SEQ ID No.4氨基酸序列中的最小毒性片段的任何蛋白质,特别是包含SEQ ID No.4中从氨基酸位置1到氨基酸位置625,尤其是到氨基酸位置632的氨基酸序列的任何蛋白质。这包括含有最小毒性蛋白质片段的杂合和嵌合蛋白质,及含有SEQ ID No.4蛋白质的三个结构域中的至少一个的蛋白质。该定义也包括SEQ ID No.4氨基酸序列的变异体,例如,用GCG的Wisconsin包的GAP程序(Madison,Wisconsin,美国,版本10.0;在GAP程序中用GCG缺省值;对于氨基酸序列比较,用blosum62记分矩阵)利用成对对齐测定在氨基酸序列水平上有至少95%、特别是至少97%、至少98%或至少99%序列同一性的蛋白质,优选已添加、置换或缺失一些(优选5-10个,尤其是少于5个)氨基酸而未显著改变,优选没有改变蛋白质的杀昆虫活性的蛋白质。
本发明“Cry2Ag蛋白质”指包含SEQ ID No.6氨基酸序列中的最小毒性片段的任何蛋白质,特别是包含SEQ ID No.6中从氨基酸位置1到氨基酸位置620,尤其是到氨基酸位置627的氨基酸序列的任何蛋白质。这包括含有最小毒性蛋白质片段的杂合或嵌合蛋白质,及含有SEQ ID No.6的毒性片段的三个结构域中至少一个的蛋白质。该定义也包括SEQ ID No.6氨基酸序列的变异体,例如,用GCG的Wisconsin包的GAP程序(Madison,Wisconsin,美国,版本10.0;在GAP程序中用GCG缺省值;对于氨基酸序列比较,用blosum62记分矩阵)利用成对对齐测定在氨基酸序列水平上有至少80%,特别是至少85%、90%、95%、96%、97%、98%或至少99%序列同一性的蛋白质,优选已添加、置换或缺失一些(优选5-10个,尤其是少于5个)氨基酸而未显著改变,优选没有改变蛋白质的杀昆虫活性的蛋白质。
这里所用术语“cry2Ae DNA”,“cry2Af DNA”或“cry2Ag DNA”分别指编码如上所定义的Cry2Ae,Cry2Af或Cry2Ag蛋白质的任何DNA序列。这包括编码如上所述SEQ ID Nos.2,4或6的蛋白质或它们的杀昆虫片段或变异体的天然、人工或合成的DNA序列。这里也包括编码杀昆虫蛋白质的如下DNA序列,该DNA序列与保藏的基因组DNA序列或序列表中提供的序列的编码区足够相似,这样在严格杂交条件下它们能(即,有能力)与这些DNA序列杂交。这里所用的严格杂交条件特别指下面的条件在滤膜上固定相关基因组DNA序列,在42℃,50%甲酰胺,5%SSPE,2xDenhardt试剂和0.1%SDS中预杂交滤膜1到2小时,或者在68℃,6x SSC,2xDenhardt试剂和0.1%SDS中预杂交滤膜1到2小时。然后,向预杂交液体中直接加入变性的(地高辛或放射性)标记探针,在上述合适的温度下,进行温育16到24小时。温育后,在室温,2x SSC,0.1%SDS中洗滤膜30分钟,随后在68℃,0.5x SSC和0.1%SDS中再洗2次,每次30分钟。在-70℃,用增感屏,通过滤膜使X射线胶片(Kodak XAR-2或等效物)曝光24到48小时,建立放射自显影。当然,在该方法中,可以用等同的条件和参数,同时仍旧保留期望的严格杂交条件。本发明cry2AeDNA的优选变异体是编码上述杀昆虫Cry2Ae蛋白质变异体的DNA,或是与SEQ ID No.1的编码序列有至少92%,优选至少93到97%,特别地至少98%或至少99%序列同一性的、编码杀昆虫蛋白质的DNA序列。特别是,在严格杂交条件下,该DNA序列也能与保藏在BCCM-LMBP、保藏号为LMBP 4248的cry2Ae编码序列杂交,或与SEQ ID No.1的编码序列杂交。本发明cry2Af DNA的优选变异体是编码上述杀昆虫Cry2Af蛋白质变异体的DNA,或是与SEQ ID No.3的编码序列有至少95%,优选至少96%或97%,更优选至少98%或至少99%序列同一性的、编码杀昆虫蛋白质的DNA序列。特别是,在严格杂交条件下,该DNA序列也能与保藏在BCCM-LMBP、保藏号为LMBP 4247的cry2Af编码序列杂交,或与SEQ ID No.3的编码序列杂交。本发明cry2Ag DNA的优选变异体是编码上述Cry2Ag蛋白质变异体的DNA,或是与SEQ ID No.5的编码序列有至少86%,优选87%,特别地至少98%或至少99%序列同一性的DNA序列。特别是,在严格杂交条件下,该DNA序列也能与保藏在BCCM-LMBP、保藏号为LMBP 4249的cry2Ag编码序列杂交,或与SEQID No.5的编码序列杂交。上述序列同一性用10.0版本GCG的Wisconsin包的GAP程序(Madison,Wisconsin,USA)(使用GCG缺省值,对于DNA序列比较,用"nwsgapdna"记分矩阵)计算得到,而严格杂交条件如上所述。
这里所用蛋白质的“杀昆虫活性”意指当喂食昆虫该蛋白质(优选通过在重组宿主如植物中表达该蛋白质)时蛋白质杀伤昆虫的能力。本文中,蛋白质的“控制昆虫的量”指足以将以该植物为食的昆虫对植物的损害限制到商业可接受的水平的蛋白质量,例如可通过杀死昆虫或抑制昆虫的发育、生育力或生长来降低昆虫对植物的损害以及使植物产量不受到显著不利地影响。
根据本发明,使对本发明的新Cry蛋白质敏感的昆虫接触该蛋白质,其中所述蛋白质的用量为控制昆虫的量,优选为杀昆虫量。本发明蛋白质的优选靶昆虫是造成经济损失的玉米,棉花,水稻和大豆植物的昆虫害虫,特别是在北美和南美国家中。本发明Cry2A蛋白质,尤其是Cry2Ae蛋白质的特别优选的靶昆虫是实夜蛾属(Heliothis spp.),棉铃虫属(Helicoverpaspp.),灰翅夜蛾属(Spodoptera spp.),蛀茎夜蛾属(Sesamia spp.),Anticarsia spp.,秆野螟属(Ostrinia spp.),禾草螟属(Chilo spp.),蛀茎夜蛾属(Sesamia spp.),刷须野螟属(Marasmia spp.),白种螟属(Scirpophaga spp.)和纵卷叶野螟属(Cnaphaloerocis spp.)昆虫,优选地,最佳为烟芽夜蛾(Heliothis virescens),玉米穗虫(Helicoverpa zea),棉铃实夜蛾(Helicoverpa armigera),黎豆夜蛾(Anticarsia gemmatalis)和玉米螟(Ostrinia nubilalis)。
这里所用术语“Cry2A蛋白质”,“本发明Cry2A蛋白质”,“Cry蛋白质”,或“本发明Cry蛋白质”指可按本发明分离的并在这里鉴定和定义为Cry2Ae,Cry2Af或Cry2Ag蛋白质的任何一种新的蛋白质。这里所用Cry蛋白质可以是全长蛋白质,也称为毒素原,或可以是保留了杀昆虫活性的截短的形式,或可以是联合了不同蛋白质的杂合或融合蛋白质形式。“Cry蛋白质”指全长晶体蛋白质,其是由天然存在的Bt DNA序列编码的;“Cry毒素”指其杀昆虫片段,特别是其最小的毒性片段,通常分子量为如通过SDS-PAGE电泳所测定的约50-65kD,特别是约60kD。这里所用“cry基因”,“cry2A基因”,“cry DNA”或“cry2A DNA”是编码本发明Cry蛋白质的DNA序列,指上述任何cry2Ae,cry2Af或cry2Ag DNA序列。
可以通过常规方法从重组大肠杆菌株系中分离编码本发明Cry蛋白质的核酸序列,特别是DNA序列,所述重组大肠杆菌株系根据布达佩斯条约在2000年10月6日保藏在比利时微生物协调保藏中心(Universiteit Gent,K.L.Ledeganckstraat 35,B-9000 Gent,比利时)(此后缩写为“BCCM-LMBP”),保藏号为BCCM-LMBP 4247,表示株系XL1Blue:pUC1099E/cry2clone1,其编码Cry2Af蛋白质;BCCM-LMBP4248,表示株系XL1Blue:pUC1099E/cry2 clone7,其编码Cry2Ae蛋白质;和BCCM-LMBP 4249,表示株系XL1Blue:pUC2761A/cry2clone141,其编码Cry2Ag蛋白质。用常规技术,可以从这些保藏株系中分离编码本发明Cry蛋白质的DNA序列,而且可以将其插入表达载体中以产生大量的Cry蛋白质。可以用Cry蛋白质通过常规方法制备特异性单克隆或多克隆抗体(H_fte等,1988)。
而且,可以通过合成产生用在本发明中的DNA序列。实际上,由于遗传密码子的简并性,可以不改变蛋白质的氨基酸序列而将一些氨基酸密码子替换为其它氨基酸密码子。而且,可以将一些氨基酸替换为其它等效氨基酸而不显著改变,优选不改变蛋白质的杀昆虫活性。而且,对与结合或成孔无关的分子区域中氨基酸序列或组成进行改变也不太可能引起蛋白质杀昆虫活性出现不同。本发明DNA序列的等效物包括能与SEQ ID.No.1,3或5的Cry蛋白质的DNA序列在严格杂交条件下杂交并编码与本发明蛋白质有相同杀昆虫特征的蛋白质的DNA序列;或与本发明天然cry2A基因比较有不同密码子使用,但是编码具有相同杀昆虫活性及相同或基本相同(优选相同)的氨基酸序列的蛋白质的DNA序列。在SEQ ID Nos.7和9中示例性显示了密码子优化后的本发明Cry2A蛋白质的DNA序列。优化这些DNA序列的方式是利用现有的密码子使用表将密码子使用适应性修改为植物基因(特别是目的植物属或种的天然基因)中最优选的密码子使用(Bennetzen & Hall,1982;Itakura等1977)(SEQ ID No.7更适应于在棉花中的表达,而SEQ ID No.9更适应于玉米),并消除长于5或6,优选长于5个核苷酸的AT或GT核苷酸序列,及插入合适的限制性位点。
而且,可以修饰Cry蛋白质的N-末端以便具有最适的翻译起始环境,为此在蛋白质N-末端添加或缺失一个或多个氨基酸。在大多数情况下,作为最佳翻译起始,优选使待在植物细胞中表达的本发明蛋白质开始于Met-Asp或Met-Ala二肽,这就需要在cry2A DNA中于起始密码子的下游插入一个编码Asp或Ala氨基酸的密码子作为新的第二密码子。
当然,根据特定的目的,可以构建密码子使用不同但是编码相同蛋白质或具有基本相同杀昆虫活性的类似蛋白质的DNA序列。有记载,在原核生物和真核生物表达系统中,对于外源宿主中的基因表达可能期望将密码子使用改变成宿主细胞的密码子使用(Bennetzen & Hall,1982;Itakura等,1977)。而且,已知Bt晶体蛋白质基因并不偏向真核生物的密码子,而且非常富含AT(Adang等,1985,Schnepf等,1985)。在文献中(Wada等,1990;Murray等,1989)和主要DNA序列数据库中(例如,在德国Heidelberg的EMBL)可得到密码子使用表。因此,可以构建合成DNA序列,以产生相同或基本相同的蛋白质。明显地,一旦已知本发明Cry蛋白质的氨基酸序列,就可以产生几种DNA序列。这些其它DNA序列包括经改变而使基因中一些位点失活的合成或半合成DNA序列,所述改变为例如,按PCT公布WO 91/16432和WO 93/09218所述选择性地失活天然序列中存在的一些隐蔽的调节或加工元件,或使全部密码子使用适应性修改为更相关的宿主生物体(优选期望在其中实施表达的宿主生物体)的密码子使用。在专利和科技文献中可以发现几种可将密码子使用修饰为宿主细胞的优选密码子使用的技术。修饰密码子使用的确切方法并不是本发明的重点,只要多数或所有隐蔽的调节序列或加工元件可以被其它序列置换即可。在所附SEQ ID Nos.7和9中示例性显示了用于植物中表达的优化DNA序列。
可以常规地,即通过PCR介导的诱变对DNA序列产生如上所述的小修饰(Ho等,1989,White等,1989)。并可以用现有技术,通过从头DNA合成期望的编码区域,常规地对DNA序列产生更复杂的修饰。
所用术语“基本相同”,当指Cry蛋白质的氨基酸序列时,意指包括这样的氨基酸序列,其与被比蛋白质的氨基酸序列有不超过5%,优选不超过2%的差异;当指Cry蛋白质的毒性时,意指包括这样的蛋白质,其LC50值与在相同生物测定条件下得到的被比蛋白质的LC50值相差不超过10%,优选不超过5%。
本文中,术语Cry毒素的“结构域”意指毒素中具有特定结构的任何部分或域,其可以被转移到另一个(Cry)蛋白质上以产生具有本发明Cry毒素的至少一个功能特征(例如结合和/或毒性特征)的新的杂合蛋白质(Ge等,1991)。该部分可以构成具有本发明Cry蛋白质的结合和/或毒性特征的杂合Bt蛋白质的基本特征。该杂合蛋白质可以有扩大的宿主范围,改进的毒性和/或可以用在预防昆虫抗性发展的策略中。(欧洲专利公布("EP")408403;Visser等,1993)。
可以在适宜的表达载体中连接从总DNA制备的本发明cry DNA序列,并且转化大肠杆菌,然后可以通过常规菌落免疫探针方法(French等,1986)用抗Cry蛋白质的单克隆或多克隆抗体筛选表达此毒素的克隆。
而且,可以在适合的Bt穿梭载体中(Lereclus等,1992)连入本发明cry DNA,并且转化晶体负型Bt突变体。然后筛选产生晶体(通过显微镜检术检测)或晶体蛋白质(通过SDS-PAGE检测)的克隆,或检测这些克隆与对照晶体负型株系相比较的杀昆虫活性。
可以用常规方法(Maxam和Gilbert,1980;Sanger,1977)测定编码本发明Cry蛋白质的基因的序列以获得DNA序列。序列比较表明这些基因不同于以前所述编码具有抗鳞翅目活性的毒素原和毒素的基因(参见,例如,H_fte和Whiteley,1989;Crickmore,等,1998;及与Crickmore等(1998)公开对应的,2000年10月16日更新的Bt命名网站http//epunix biols.susx.ac.uk/Home/Neil Crickmore/Bt/index.html)。而且与2001年12月13日更新的该Bt命名网站上的任何苏云金芽孢杆菌晶体蛋白质序列比较,本发明Cry2A蛋白质是新的。
基因序列分析后,可以用常规方法产生DNA序列的杀昆虫有效部分,其编码新鉴定的毒素原形式的Cry蛋白质的杀昆虫有效部分。在该片段中,优选该蛋白质中至少包含与Bt晶体蛋白质的保守序列块5(Hofte &Whiteley,1989;Schnepf等,1998)同源的序列,优选多达该同源区域后2个氨基酸。对于Cry2Ae和Cry2Af蛋白质,该同源区域分别终止在SEQ IDNos.2和4的氨基酸位置625,对于Cry2Ag则在SEQ ID No.6的氨基酸位置620。可以从分离的DNA序列的DNA序列信息确定Cry蛋白质的氨基酸序列。编码Cry蛋白质的DNA序列的“杀昆虫有效部分”(或区段或片段)在这里也称作“截短的基因”或“截短的DNA”,意指编码比毒素原形式的Cry蛋白质具有较少氨基酸但具有杀昆虫活性的多肽的DNA序列。
为了在大肠杆菌、其它Bt株系和植物中表达编码本发明Cry蛋白质的DNA序列的全部或杀昆虫有效部分,可以在DNA序列侧翼引入适合的限制位点。这可以用已知方法(Stanssens等,1989;White等,1989),通过位点定向诱变完成。
为了在植物中获得改进的表达,可以根据PCT公布WO 91/16432和WO 93/09218;EP 0 358 962和EP 0 359 472,修饰本发明cry基因或cry基因的杀昆虫有效部分的密码子使用以形成等效的、修饰的或人工的基因或基因部分,或者可以在质体、线粒体或叶绿体基因组中插入这些Bt基因或基因部分,并且用适合的启动子使这些基因在其中表达(如,Mc Bride等,1995;美国专利5,693,507)。为了在单子叶植物,如玉米中获得提高的表达,也可以向嵌合基因中添加内含子,优选单子叶植物内含子;此外,还可以通过位点定向内含子插入和/或通过改变密码子使用,例如将密码子使用适应性修改为植物(优选特定相关植物属)最优选的密码子使用(Murray et al.,1989)而不显著改变(优选不改变)所编码的氨基酸序列,以翻译中性方式进一步改变cry基因或其杀昆虫部分的DNA序列,从而修饰基因部分中存在的可能抑制性DNA序列。
根据本发明的一种实施方案,优选使蛋白质靶向细胞内细胞器,如质体,优选叶绿体、线粒体,或向细胞外分泌,从而潜在地优化蛋白质的稳定性和/或表达。为了达到这个目的,本发明嵌合基因包含编码信号或导向肽的编码区,其与本发明Cry蛋白质编码区连接。可包含在本发明蛋白质中的特别优选的肽是用于靶向叶绿体或其它质体的转运肽,特别是从基因产物靶向质体的植物基因复制得到的转运肽区域、Capellades等(美国专利5,635,618)的优化转运肽,菠菜铁氧还蛋白-NADP+氧化还原酶的转运肽(Oelmuller等,1993)、Wong等(1992)所述的转运肽和公布的PCT专利申请WO 00/26371中的导向肽。还优选这样的肽,与这种肽连接的蛋白质可以在该肽发出的信号的指引下向细胞外分泌,如马铃薯蛋白酶抑制因子II的分泌信号(Keil等,1986),水稻α-淀粉酶3基因的分泌信号(Sutliff等,1991)和烟草PR1蛋白质的分泌信号(Cornelissen等,1986)。
本发明特别有用的信号肽包括引起蛋白质向叶绿体转运的叶绿体转运肽(例如,Van Den Broeck等,(1985))或美国专利5,510,471和美国专利5,635,618的优化的叶绿体转运肽、分泌信号肽、或引导蛋白质靶向其它质体、线粒体、ER或其它细胞器的肽。在天然定向蛋白质或分泌蛋白质中可以发现用于靶向细胞内细胞器或用于向植物细胞外分泌或靶向细胞壁的信号序列,优选Kl_sgen等,(1989),Kl_sgen和Weil(1991),Neuhaus &Rogers(1998),Bih等,(1999),Morris等,(1999),Hesse等,(1989),Tavladoraki等,(1998),Terashima等,(1999),Park等,(1997),Shcherban等,(1995)所述信号序列(这里并入所有这些文献为参考文献),特别是来自于玉米,棉花,水稻或大豆的定向蛋白或分泌蛋白的信号肽序列。
而且,用本领域已知的方法(例如,Van Rie等,1990)可以评估本发明Cry蛋白质的结合特性,以确定本发明Cry蛋白质是否结合在其它已知Cry或Bt蛋白质不识别(或竞争)的昆虫中肠位点。特别是在植物中表达时,具有不同结合位点且所述位点在相关敏感昆虫中不存在竞争结合的Bt毒素是极有价值的,它们可以置换昆虫可能已经产生了抗性的已知Bt毒素,或与具有不同作用方式的Bt毒素联合使用以防止或延迟昆虫抗Bt毒素抗性的发展。鉴于新分离的Bt毒素的这些特征,用它们转化植物,例如单子叶植物,如玉米或水稻和双子叶植物如棉花,大豆和芸苔属种植物以保护这些植物免受昆虫损害是极其有用的。在玉米穗虫(Helicoverpa zea)中,Cry2Aa蛋白质与Cry1Ac蛋白质不共用结合位点,这已经有过描述(English等,1994)。类似地,预期在相关昆虫害虫中,本发明Cry2A蛋白质的结合特性也不同于目前在转基因植物中所用的Cry1或Cry9毒素的结合特性。如上所述,可以通过常规结合测定法检测这种不同的结合特性。特别是对特定昆虫害虫,为了控制昆虫抗性,优选本发明Cry2A蛋白质和其它昆虫控制蛋白质,特别是Bt晶体蛋白质联合,其中所述控制蛋白质不能识别至少一个该Cry2A蛋白质的识别结合位点。与本发明Cry2A蛋白质(优选Cry2Ae蛋白质)联合(特别是用于在植物,优选棉花植物中同时表达时)的优选昆虫控制蛋白质包括Cry1F蛋白质或来源于Cry1F蛋白质的杂合蛋白质(例如,美国专利6,326,169;6,281,016;6,218,188中所述的杂合Cry1A-Cry1F蛋白质,或其毒性片段),Cry1A-类蛋白质或其毒性片段,优选Cry1Ac蛋白质或来自于Cry1Ac蛋白质的杂合蛋白质(例如,美国专利5,880,275中所述的杂合Cry1Ab-Cry1Ac蛋白质),Estruch等(1996)和美国专利6,291,156中所述的VIP3Aa蛋白质或其毒性片段,来源于Xhenorhabdus、沙雷氏菌属(Serratia)或光杆状菌属(photorhabdus)种的杀昆虫蛋白质(例如,Waterfield等,2001;ffrench-Constant和Bowen,2000)。在一个实施方案中,通过用本发明Cry2A转化已表达昆虫控制蛋白质的植物,或通过杂交用昆虫控制蛋白质转化的植物和用本发明Cry2A蛋白质转化的植物,可以容易地实现此共表达。对于棉花植物,优选用Cry2Ae蛋白质作为第一昆虫控制蛋白质,用Cry1Ac或VIP3Aa蛋白质或其衍生物作为第二昆虫控制蛋白质。欧洲专利0 408 403中描述了在相同植物中获得不同Bt(或类似地,对于其它昆虫控制蛋白质)杀昆虫蛋白质表达以试图最小化或阻止昆虫对转基因抗昆虫植物产生抗性的方法。
在昆虫对控制蛋白质,如Cry1 Bt蛋白质(该蛋白质目前已通过转基因植物商品化)产生了抗性的情况下,也可以方便地利用本发明的Cry2A蛋白质控制昆虫。
优选地,为了筛选目的及增加杂草控制选项,也可以用编码能赋予抗广谱除草剂(例如基于草铵膦或草甘膦的除草剂)抗性的蛋白质的DNA转化本发明转基因植物。
用常规方法,可以向单植物细胞的核基因组中稳定插入编码Cry毒素原的杀昆虫有效部分的杀昆虫有效cry基因部分或其等效物,优选cry嵌合基因,而且可以用常规方法利用这样转化的植物细胞产生抗昆虫的转化植物。在这方面,可以用根癌农杆菌中含有杀昆虫有效cry基因部分的卸甲Ti质粒转化植物细胞,此后,可以用例如在EP 0 116 718,EP 0 270 822,PCT公布WO 84/02913和公开的欧洲专利申请("EP")0 242 246及Gould等,(1991)中所述程序,从转化的植物细胞再生转化的植物。优选的Ti质粒载体在Ti质粒的T-DNA的两个边界序列之间,或至少在右边界序列的左侧含有杀昆虫有效cry基因部分。当然,使用如直接基因转移(例如,如EP 0 233 247中所述)、花粉介导的转化(例如,如EP 0 270 356,PCT公布WO 85/01856,和美国专利4,684,611中所述)、植物RNA病毒介导的转化(例如,如EP 0 067 553和美国专利4,407,956中所述)、脂质体介导的转化(例如,如美国专利4,536,475中所述)以及其它方法,如最近描述的用于转化一些玉米(例如,美国专利6,140,553;Fromm等,1990;Gordon-Kamm等,1990)和水稻(Shimamoto等,1989;Datta等,1990)株系的方法和通用的转化单子叶植物的方法(PCT公布WO92109696),亦可以用其它类型的载体转化植物细胞。对于棉花转化,特别优选PCT专利公布WO 00/71733中所述的方法。对于大豆转化,参照本领域已知的方法,例如Hinchee等,(1988)和Christou等,(1990),或WO 00/42207的方法。
并且,除了核基因转化的方法外,本发明也包括质体基因组,优选叶绿体基因组的转化。Kota等,(1999)描述了在烟草叶绿体中超表达Cry2Aa蛋白质的方法。
可以在常规植物育种方案中使用得到的转化植物,以产生更多具有相同特征的转化植物或向相同或相关植物物种的其它品种中引入杀昆虫有效的cry基因部分。从转化植物得到的种子含有作为稳定基因组插入物的杀昆虫有效cry基因部分。可以用常规方式培养转化的植物细胞以产生Cry毒素原的杀昆虫有效部分,优选Cry毒素,然后可以回收用于抗鳞翅目的常规杀昆虫组合物(美国专利5,254,799)中。
可以在植物细胞基因组中插入杀昆虫有效cry基因部分,优选截短的cry基因,使插入的基因位于启动子下游(即,3′)并且受其控制,其中该启动子为可以指导该基因部分在植物细胞中表达的启动子。优选通过在植物细胞基因组,特别在核或质体(例如,叶绿体)基因组中插入cry嵌合基因来完成上述过程。优选的启动子包括CM 1841(Gardner等,1981),CabbB-S(Franck等1980)和CabbB-JI(Hull和Howell,1987)分离物的花椰菜花叶病毒(CaMV)的强组成型35S启动子("35S启动子");Odell等,(1985)所述的35S启动子,泛素家族的启动子(例如,Christensen等,1992的玉米泛素启动子,也参见Cornejo等,1993),gos2启动子(de Pater等,1992),emu启动子(Last等,1990),拟南芥属肌动蛋白启动子如An等(1996)所述的启动子,水稻肌动蛋白启动子如Zhang等(1991)所述的启动子;木薯脉花叶病毒的启动子(WO 97/48819,Verdaguer等,(1998)),地下三叶草矮化病毒的pPLEX系列启动子(WO 96/06932,特别是S7启动子),醇脱氢酶启动子例如pAdh1S(GenBank记录号X04049,X00581)及分别驱动T-DNA的1′和2′基因表达的TR1′启动子和TR2′启动子(分别是“TR1′启动子”和“TR2′启动子”)(Velten等,1984)。做为替代方案,可以利用非组成型的但是对植物的一个或多个组织或器官(例如,叶子和/或根)具有特异性的启动子,这样插入的cry基因部分仅仅在特异组织或器官的细胞中表达。例如,通过将此杀昆虫有效基因部分置于光诱导启动子的控制下,杀昆虫有效cry基因部分可以在植物(例如,玉米,棉花)的叶子中选择性地表达,所述光诱导启动子的例子是该植物自身或其它植物如豌豆的核酮糖1,5-二磷酸羧化酶小亚基基因启动子,见美国专利5,254,799的公开。其它替代方案是利用可诱导表达的启动子,优选通过伤口,如昆虫咬食诱导的启动子,例如,Cordera等(1994)所述的MPI启动子,或化学因子诱导的启动子。
可以在植物基因组中插入杀昆虫有效的cry基因部分,使插入的基因部分位于适合的3′末端转录调节信号(即,转录形成和聚腺苷酸化信号)的上游(即,5′)。优选通过在植物细胞基因组中插入cry嵌合基因完成上述过程。优选的聚腺苷酸化和转录形成信号包括胭脂碱合成酶基因(Depicker等,1982),章鱼碱合成酶基因(Gielen等,1984)和T-DNA基因7(Velten和Schell,1985)的那样,它们在转化的植物细胞中充当3′-非翻译DNA序列。
可选地,杀昆虫有效cry基因部分可以作为杂合基因插入到植物基因组中(美国专利5,254,799;Vaeck等,1987)并且与可选择或评分的标志基因,如编码卡那霉素抗性的neo基因(EP 0 242 236)处于相同的启动子的控制下,这样,植物将表达易检测的融合蛋白质。
也可以通过转化植物细胞,在植物细胞培养中大量生产本发明的蛋白质,例如生产Cry2A蛋白质,然后,在适宜配制后,可以将其应用在作物上。本文中提到转基因植物细胞时,指分离的或组织培养中的植物细胞(或也指植物原生质体),或包含在植物中或分化器官或组织中的植物细胞(或原生质体),且本文中这两种可能性均明确地包括在内。因此,在说明书或权利要求书中提到植物细胞不仅仅意指培养中分离的细胞,也指可能位于任何位置或可能存在于任何类型的植物组织或器官中的任何植物细胞。
也可以用编码抗鳞翅目蛋白质的所有或部分cry基因转化其它细菌,如对鳞翅目或鞘翅目昆虫有杀虫活性的苏云金芽孢杆菌。由此,可以产生这样的转化Bt株系,该株系可对鳞翅目和鞘翅目昆虫害虫产生广谱抗性或可用于抗其它的鳞翅目昆虫害虫。可以用常规方法,优选用如Mahillon等,(1989)和PCT专利公布WO 90/06999中所述的常规电穿孔技术,用引入适当克隆载体中的本发明cry基因的全部或部分转化细菌,如假单胞菌属,农杆菌属,芽孢杆菌属或埃希氏属细菌。
可以用常规方法(Dulmage,1981;Bernhard和Utz,1993)发酵含有本发明cry基因的转化芽孢杆菌株系以提供高产量的细胞。在熟知的适当条件下(Dulmage,1981),这些株系每一个都可形成孢子从而高产量地生产含有Cry毒素原的晶体蛋白质。
可以将cry基因所转化的微生物、或优选它们各自的Cry蛋白质或Cry毒素原、毒素或杀昆虫有效的毒素原部分作为活性组分,与适宜的载体、稀释剂、乳化剂和/或分散剂(例如,如Bernhard和Utz,1993所述)一起通过常规方法制成本发明的杀昆虫组合物,特别是抗鳞翅目组合物。该杀昆虫组合物可以制成可湿性粉剂,小球,颗粒剂或粉剂,或具有含水或不含水溶剂的液体制剂,如泡沫,凝胶,混悬液,浓缩物等。
根据本发明,控制昆虫,特别是鳞翅目的方法包括向要保护的场所(区域)施用(例如,喷雾)杀昆虫量的Cry蛋白质或本发明cry基因转化的宿主细胞。要保护的场所可以包括,例如昆虫害虫的栖息地或植物生长或待生长的区域。
本发明进一步涉及控制鳞翅目大豆昆虫害虫,特别是鳞翅目二化螟,稻苞虫,稻切根虫,稻叶夜蛾,稻纵卷叶螟或美洲稻弄蝶的方法,优选昆虫选自二化螟(Chilo suppressalis),Chilo partellus,一点螟(Scirpophagaincertulas),稻蛀茎叶蛾(Sesamia inferens),稻纵卷叶野螟(Cnaphalocrocismedinalis),Marasmia patnalis,Marasmia exigua,Marasmia ruralis,Scirpophaga innotata,该方法包括向要保护的区域或植物施用这里所定义的Cry2A蛋白质,优选这里所定义的Cry2Ae蛋白质(即,通过种植本发明cry2A基因转化的水稻植物,或喷雾含有本发明Cry2A蛋白质的组合物)。本发明也涉及本发明Cry2A蛋白质,特别是Cry2Ae蛋白质在抵抗鳞翅目水稻昆虫害虫以最小化水稻植物损失中的用途。
本发明进一步涉及控制鳞翅目棉花昆虫害虫的方法,该方法包括向要保护的区域或植物施用这里所定义的Cry2A蛋白质,优选这里所定义的Cry2Ae蛋白质(即,通过种植本发明cry2A基因转化的水稻植物,或喷雾含有本发明Cry2A蛋白质的组合物)。本发明也涉及本发明Cry2A蛋白质,特别是Cry2Ae蛋白质在抵抗鳞翅目水稻昆虫害虫以最小化水稻植物损失中的用途。
本发明进一步涉及控制鳞翅目水稻昆虫害虫,特别是鳞翅目二化螟,稻苞虫,稻切根虫,稻叶夜蛾,稻纵纵卷叶螟或美洲弄蝶的方法,优选昆虫选自二化螟(Chilo suppressalis),Chilo partellus,一点螟(Scirpophagaincertulas),稻蛀茎叶蛾(Sesamia inferens),稻纵卷叶野螟(Cnaphalocrocismedinalis),Marasmia patnalis,Marasmia exigua,Marasmia ruralis,Scirpophaga innotata,该方法包括向要保护的区域或植物施用这里所定义的Cry2A蛋白质,优选这里所定义的Cry2Ae蛋白质(即,通过种植本发明cry2A基因转化的水稻植物,或喷雾含有本发明Cry2A蛋白质的组合物)。本发明也涉及本发明Cry2A蛋白质,特别是Cry2Ae蛋白质在抵抗鳞翅目水稻昆虫害虫以最小化水稻植物损失中的用途。
为了获得Cry毒素原或毒素,可以通过常规方法在适宜培养基上培养表达Cry蛋白质的重组宿主细胞,然后用常规方法如酶降解或去污剂等将其裂解。然后,用标准技术,如层析法,提取,电泳或类似的技术分离和纯化毒素原。然后,通过毒素原的胰蛋白酶消化可以得到毒素。
在权利要求书的表述中反映了构成了本发明说明书部分的本发明的这些和/或其它实施方案。
下面的实施例示例了本发明,这些实施例对本发明或其寻求的保护范围没有提供限制。在实施例,权利要求书和说明书中提到的序列表如下序列表SEQ ID No.1-Cry2Ae蛋白质和DNA的氨基酸序列和DNA序列;SEQ ID No.2-Cry2Ae蛋白质的氨基酸序列;SEQ ID No.3-Cry2Af蛋白质和DNA的氨基酸序列和DNA序列;SEQ ID No.4-Cry2Af蛋白质的氨基酸序列;SEQ ID No.5-Cry2Ag蛋白质和DNA的氨基酸序列和DNA序列;SEQ ID No.6-Cry2Ag蛋白质的氨基酸序列;SEQ ID No.7-用于棉花中表达的人工cry2Ae DNA序列;SEQ ID No.8-SEQ ID No.7的DNA编码的Cry2Ae蛋白质的氨基酸序列;SEQ ID No.9-用于玉米中表达的人工cry2Ae DNA序列;除了在实施例中另外说明外,用Sambrook等,Molecular Cloning-ALaboratory Manual,第二版,Cold Spring Harbor Laboratory Press,NY(1989),和Ausubel等,(1994)Current Protocols in Molecular Biology,Current Protocols,USA的卷1和卷2所述的标准方法进行产生和操作重组DNA的所有的程序。由BIOS Scientific Publications Ltd(UK)和BlackwellScientific Publications(UK)共同出版的R.R.D.Croy的Plant MolecularBiology Labfax(1993)描述了用于植物分子生物学工作的标准材料和方法。在M.A.Innis,D.H.Gelfand,J.J.Sninsky和T.J.White编辑的“PCRprotocolsa guide to methods and applications”,(Academic Press,Inc.,1990)中可以发现PCR技术的程序。
实施例实施例1株系的表征从菲律宾(South Tagalog)和比利时(Deerlijk)收集的谷物粒(grain dust)中分别分离到BTS02761A和BTS01099E株系。
可以在常规标准培养基,优选T3培养基(胰蛋白胨3g/l,胰蛋白 2g/l,酵母提取物1.5g/l,5mg MnCl2,0.05M Na2HPO4.2H2O,0.05MNaH2PO4.H2O,pH6.8和1.5%琼脂)上,优选在28℃培养每个株系。为了长期贮藏,优选将等体积的孢子晶体悬液和等体积的50%甘油混合并在-70℃贮藏,或冻干孢子晶体悬浮液。对于孢子形成,优选在28℃,在T3培养基上生长72小时,随后在4℃贮藏。在孢子形成期间株系产生的晶体蛋白质包裹在晶体中。
实施例2BTS02761A和BTS01099E株系对选择的鳞翅目昆虫种的杀昆虫活性将获自BTS01099E或BTS02761A的孢子晶体混合物的未稀释碱性(pH12)提取物铺在人工饲料上,在饲喂该人工饲料的玉米穗虫(Helicoverpa zea),棉铃实夜蛾(Helicoverpa armigera),烟芽夜蛾(Heliothis virescens),玉米螟(Ostrinia nubilalis),草地贪夜蛾(Spodopterafrugiperda)和西非蛀茎夜蛾(Sesamia nonagrioides)的新生幼虫上进行毒性测定。
在Costar 48-孔板的孔中分配人工饲料(Vanderzant,1962).饲料表面加上25微升提取物,在层流空气中干燥。每个孔中放入一只幼虫,每个样品用18只幼虫。在第7天计算死亡和活着的幼虫。死亡幼虫的百分数如下表I所示。
在生物测定中检测来自于株系BTS02761A和BTS01099E的孢子/晶体的混合物,得到如下结果
表I

*生长稍微受影响的存活幼虫;阴性对照(标准饲料)Hz6%M,Hv17%M,Sf0%M。Hz玉米穗虫(Helicoverpa zea);Hv烟芽夜蛾(Heliothis virescens);Sf草地贪夜蛾(Spodoptera frugiperda);On玉米螟(Ostrinianubilalis);Sn西非蛀茎夜蛾(Sesamia nonagroides)(NT表示没有检测)。
实施例3来自Bt株系BTS01099E和BTS02761A的新cry2A基因的鉴定和表征用适合的引物,扩增BTS02761A和BTS01099E株系的cry2A基因的部分;随后,用限制酶消化这些扩增产物,获得消化样式。对来自含有已知cry2A基因的株系的扩增产物进行上述消化时,也获得消化样式,比较这两种样式。根据限制消化的样式,株系BTS02761A和BTS01099E的cry2A基因看起来是新的。因此,测序扩增产物。测序证实了扩增的片段来源于新的cry2A基因株系BTS02761A含有一个新的cry2A-样基因,而株系1099E含有两个新的cry2A-样基因。
用Sau3A处理株系BTS02761A和BTS01099E的总DNA,大小分级分离后将7到10kb片段连入pUC19I(pUC19的衍生物)中,pUC19I已用BamHI切割和TsAP(热稳定碱性磷酸酶)处理过。通过电穿孔将连接混合物导入大肠杆菌XL1 Blue中。
用DIG-标记的PCR片段做探针进行菌落杂交鉴定阳性克隆。在2000年10月6日将重组大肠杆菌株系保藏在比利时微生物协调保藏中心(Universiteit Gent,K.L.Ledeganckstraat 35,B-9000 Gent,比利时)(以下缩写为“BCCM-LMBP”),保藏号为BCCM-LMBP 4247,表示株系XL1Blue:pUC1099E/cry2clone1,该株系编码名称为Cry2Af的蛋白质;及BCCM-LMBP 4248,表示株系XL1Blue:pUC1099E/cry2clone7,其编码名称为Cry2Ae的蛋白质;和BCCM-LMBP 4249,表示株系XL1Blue:pUC2761A/cry2clone141,其编码名称为Cry2Ag的蛋白质。通过NotI-FseI消化,从这些保藏的克隆中可以分离到这些基因。
将这些克隆的插入物亚克隆到穿梭载体pSL40I中。首先将由此得到的质粒转化到大肠杆菌GM2163中。然后,将得自该株系的质粒制备物电穿孔到晶体负型苏云金芽孢杆菌种berliner 1715株系中。
然后,从得自重组Bt株系的孢子/晶体混合物制备碱性提取物,在生物测定中利用其来评估新的Cry2A蛋白质的毒性。在如上述实施例1所述的测定中检测该提取物。结果如表II所示表II

“Conc.”用Bradford方法测定的株系提取物的总蛋白质浓度(mg/ml);“Ha”棉铃实夜蛾(Heliothis armigera),其它缩写如上面表I所用;包括的对照(正常的饲料,添加PBS-BSA或未转化的晶体负型Bt株系1715)没有显示显著的死亡率。
当在选定的鳞翅目昆虫上检测时,表达Cry2Af蛋白质的重组克隆也显示了显著的死亡率。
此外,我们进行了分析以确定重组产生的Cry2Ae蛋白质的LC50和LC90值,并与已知的Cry2Aa和Cry2Ab蛋白质相比较。
为了进行这个检测,在Costar 24孔板的孔中分配昆虫特异的人工饲料。在饲料表面施用50微升源于XL1Blue:pUC1099Eclone7含有cry2Ae基因的重组Bt株系的孢子晶体混合物的碱性(pH12)提取物,层流空气干燥。用于草地贪夜蛾和玉米螟(O.nubilalis)的饲料含有1000ml水;琼脂20g;玉米面112g;麦胚28g;酵母30g;抗坏血酸4.8g;苯甲酸1.2g;对羟苯甲酸甲酯1g;金霉素0.06g;制霉菌素0.03g。烟芽夜蛾(H.virescens)和玉米穗虫(H.zea)的饲料含有1000ml水;琼脂20g;豆粉81g;麦胚36g;蔗糖14.7g;玉米油5ml;Wesson盐混合物10g;Vanderzant维生素混合物9.5g;山梨酸1.1g;对羟苯甲酸甲酯1g;金霉素0.34g;制霉菌素0.06g。检测不同的蛋白质浓度以确定LC50值。对于在玉米穗虫(H.zea)、烟芽夜蛾(H.virescens)和草地贪夜蛾(S.frugiperda)上的检测,每孔中放入一只幼虫,每个样品用20只幼虫。对于在玉米螟(O.nubilalis)上的检测,每个孔中放入二只幼虫,每个样品用24只幼虫。在第7天(对于S.frugiperda是第6天,对于玉米螟(O.nubilalis)是第5天)计算死亡和活的幼虫。用概率单位分析(POLO程序,LeOra软件,1987,POLO-PC.概率单位分析或逻辑分析用户指南,Berkeley,California)计算LC50和LC90值。结果示于下表III。
表III

NT没有检测;Conc.在产生相关蛋白质的Bt重组株系的碱性提取物中的总蛋白质浓度,单位mg/ml;星号表示对于玉米螟(O.nubilalis),用具有不同蛋白质浓度(在列“Conc.”下面,括号之间显示)的不同批提取物得到的结果;对照(正常饲料,加PBS-BSA或晶体负型对照Bt株系)产生不超过0-5%的死亡率。
对于用纯化的Cry2Ae蛋白质抗藜豆夜蛾(Anticarsia gemmatalis),实验设定与上述用于玉米螟(O.nubilalis)的相同(检测20个孔,每个浓度检测1只幼虫),发现了这种蛋白质对这种重要大豆昆虫害虫有高的活性。发现纯化的Cry2Ae蛋白质对这种昆虫的LC50值是0.44ng/cm2(95%的置信水平;该LC50值是不同生物批纯化蛋白质的2次测定的平均值),发现LC90值是7.79ng/cm2(95%的置信水平;该LC90值是不同生物批纯化蛋白质的2次测定的平均值)。用与上述玉米螟(O.nubilalis)相同的实验设定和纯化的Cry2Ae蛋白质,证实了该蛋白质对玉米穗虫(HelicoverpaZea)和玉米螟(Ostrinia Nubilalis)有显著的毒性(发现对于这些昆虫LC50值分别是145.1和48.31ng/cm2(95%的置信水平;这些LC50值是分别在每种昆虫上不同生物批纯化蛋白质的2次测定的平均值))。
这些结果表明本发明的新Cry蛋白质,特别是Cry2Ae蛋白质是对相关鳞翅目昆虫害虫,尤其是Heliothis zea、玉米螟(Ostrinia nubilalis)、黎豆夜蛾和玉米穗虫(Helicoverpa zea)具有高活性的有用蛋白质,而这些昆虫害虫是造成植物,如大豆,棉花和玉米的商业损失的昆虫害虫。
在所附序列表中显示了本发明分离的cry2A基因的测定的序列,及测定的氨基酸序列。用GCG的Wisconsin包中GAP程序进行的成对对齐表明了与其它Cry2A序列(对于已知Cry2A蛋白质和DNA的序列,参见Crickmore等,(1998)和上述网站)的序列同一性水平,见表IVA和IVB中所示(在GAP程序中用GCG缺省值;对于氨基酸序列比较,用blosum62记分矩阵,对于DNA序列比较,用nwsgapdna记分矩阵)。
表IVA.蛋白质水平上的序列同一性百分数

表IV.B.DNA水平上的序列同一性百分数

实施例4在转化植物中新的Cry蛋白质的产生用熟知的程序,用启动子如CaMV 35S(Hul和Howell,1987)和泛素(Christensen等,1992)启动子,产生各编码Cry2Ae,Cry2Af和Cry2Ag蛋白质的嵌合基因。优选地,如公布的PCT专利申请WO 94/12264所述,使开放可读框的密码子使用适应宿主植物的密码子使用,以优化表达效率。而且,在一些嵌合基团中包括了编码转运肽的DNA序列(如说明书中所述)以引导本发明Cry2A蛋白质达到植物叶绿体。
为了用编码Cry2Ae蛋白质的嵌合基因转化玉米和棉花,将几个嵌合基因构建体插入农杆菌株系质粒中。这些构建体包括构建体pACS9和pACS11,其中SEQ ID No.7的cry2Ae编码序列功能性地与花椰菜花叶病毒35S2启动子(Odell等,1985)、矮牵牛叶绿体a/b结合蛋白质基因的前导序列(Harpster等,1988)及花椰菜花叶病毒35S基因的3’转录终止和聚腺苷酸化区(Sanfacon等,1991)连接;和构建体pACS12和pACS13,它们除了在cry2Ae编码区的5’末端插入了编码允许靶向叶绿体的TpssuAt转运肽的DNA序列(Krebbers等,1988)外,具有相同的调节区和相同的cry2Ae编码区,由此产生转运肽融合蛋白质。这些构建体也包括在木薯脉花叶病毒CsVMV启动子(Verdaguer等,1996,1998)和胭脂碱合成酶基因的3′转录终止和聚腺苷酸化区(Depicker等,1982)控制下的作为选择标志的编码草甘膦除草剂抗性蛋白质的DNA序列(在公布的PCT专利申请WO97/04103中描述的,与优化的转运肽(美国专利5,635,618)连接)或编码草铵膦除草剂抗性蛋白质的DNA序列(Thompson等,1987)。
如并入为参考文献的美国专利6,140,553所述,通过农杆菌属介导的转化,用pACS9,pACS11,pACS12和pACS13构建体稳定转化玉米细胞。用这里并入为参考文献的PCT专利公布WO 00/71733中所述的转化方法,用pACS9,pACS11,pACS12和pACS13构建体稳定转化棉花细胞。用公布的PCT专利申请WO 92/09696中所述的方法稳定转化水稻细胞。基本上如EP专利0 116 718或Deblaere等(1987)所述用农杆菌介导的转化方法,用pACS11和pACS12构建体稳定转化烟草细胞。
在含有选择性试剂膦丝菌素或草甘磷的培养基中生长转化细胞和由此再生的小植物,这样,即使不是所有再生植物,也是大多数再生植物将是转化的。
通过Cry2A ELISA,Northern和Southern印迹及根据杀昆虫效力和农学特征筛选再生转化的烟草、玉米、棉花和水稻植物。与非转化对照植物比较,含有嵌合cry2A基因的子代植物显示了对昆虫改进的抗性,其中昆虫抗性和转化表型有适当的分离。蛋白质和RNA检测表明具有增加的昆虫抗性的植物在它们的细胞中有较高的新Cry2A蛋白质的表达。
引用的参考文献Adang等,(1985).基因(Gene)36,289。
An等,(1996).植物杂志(Plant J.)10,107。
Bennetzen & Hall.(1982).生物化学杂志(J.Biol.Chem.)257,3026-3031。
Berhard,K.和Utz,R.,《苏云金芽孢杆菌,环境的生物杀昆虫剂理论和实践》,“用于实验和商业用途的苏云金芽孢杆菌杀昆虫剂的生产”,pp.255-267,编,Entwistle,P.F.,Cory,J.S.,Bailey,M.J.和Higgs,S.,JohnWiley and Sons,New York(1993)。
Bih等,(1999),生物化学杂志(J.Biol.Chem.)274,22884-22894。
Choi等,GenBank记录号AF200816(1999)。
Christensen等,(1992)植物分子生物学(Plant mol.Biol.)18,675-689。
Christou等,(1990).生物技术动向(Trends Biotechnology)8,145。
Cordera等,(1994)植物杂志(The Plant Journal)6,141。
Cornejo等,(1993)植物分子生物学(Plant Mol.Biol.)23,567-581。
Cornelissen等,(1986)EMBO J.5,37-40。
Crickmore等,(1998)微生物分子生物学综述(Microbiol.Mol.Biol Rev.)62(3),807-13。
Datta等,生物/技术(Bio/Technology)8,736-740(1990).
Deblaere等,(1987)酶学方法(Methods in Enzymology)153,277-292.
De Pater等,1992,植物杂志(Plant J.)2,834-844.
Depicker等,1982,分子应用遗传学杂志(J.Molec.Appl.Genetics)1,561-573.
Dulmage,H.T.,《玉米生产中的生物控制》“用于生物控制昆虫的细菌的生产”编,Paparizas,D.C.,Osmun Publishers,Totowa,N.J.,USA,129-141页(1981)。
Estruch等,(1996),美国国家科学院院报(Proc Natl Acad Sci)USA 93,5389-94。
Franck等,细胞(Cell)21,285-294(1980)。
French等,生物化学纪事(Anal.Biochem.)156,417-423(1986)。
Ffrench-Constant和Bowen(2000)细胞分子生命科学(Cell Mol Life Sci)57,828-33。
Fromm等,生物/技术(Bio/Technology)8,833-839(1990)。
Gardner等,核酸研究(Nucleic Acids Research)9,2871-2887(1981)。
Ge等,生物化学杂志(J.Biol.Chem.)266,17954-17958(1991)。
Gielen等,EMBO J 3,835-845(1984)。
Gordon-Kamm等,植物细胞(The Plant Cell)2,603-618(1990)。
Gould等,植物生理(Plant Physiol.)95,426-434(1991).
Harpster等,(1988),分子和普通遗传学(Molecular and General Genetics)212,182-190。
Hesse等,(1989),EMBO J.82453-2461。
Hinchee等,(1988)生物/技术(Bio/Technology)6,915。
Ho等,(1989).基因(Gene)77,51-59。
H_fte等,应用和环境微生物学(Appl.and Environm.Microbiol.)54,2010-2017(1988)。
H_fte和Whiteley,微生物学综述(Microbiological Review)53,242-255(1989)。
Hull和Howell,病毒学(Virology)86,482-493(1987)。
Itakura等,(1977).科学(Science)198,1056-1063。
Jansens等,(1997)作物科学(Crop Science)37,1616-1624。
Keil等,(1986),核酸研究(Nucl.Acids Res.)14,5641-5650。
Kl_sgen等,(1989),分子和普通遗传学(Mol.Gen.Genet.)217,155-161。
Kl_sgen和Weil(1991),分子和普通遗传学(Mol.Gen.Genet.)225,297-304。
Kota等,(1999)美国国家科学院院报(Proc.Natl.Acad.Sci.)USA 96,1840-1845。
Krebbers等,(1988)植物分子生物学(Plant Molec.Biol.)11,745-759。
Last等,(1990)理论和应用遗传学(Theor.Appl.Genet.)81,581-588。
Lereclus等,生物/技术(Bio/Technology)10,418(1992)。
Mahillon等,FEMS Microbiol.Letters 60,205-210(1989)。
Maxam和Gilbert,酶学方法(Methods in Enzymol.)65,499-560(1980)。McBride等,1995,生物/技术(Bio/Technology)13,362。
Morris等,(1999),生物化学与生物物理学研究通讯(Biochem.Biophys.Res.Commun.)255,328-333。
Murray等,M.,核酸研究(Nucleic Acids Research)17(2),477-498(1989)。
Neuhaus&Rogers(1998),植物分子生物学(Plant Mol.Biol.)38,127-144。
Odell等,(1985)自然(Nature)313,810-812。
Oelmuller等,分子和普通遗传学(Mol.Gen.Genet.)237,261-272(1993)。
Park等,(1997),生物化学杂志(J.Biol.Chem.)272,6876-6881。
Sanfacon等,(1991),基因和发育(Genes and Development)5,141-149。
Sanger等,美国国家科学院院报(Proc.Natl.Acad.Sci.)USA.74(12),5463-5467(1977)。
Schnepf等,(1985).生物化学杂志(Journal of Biological Chemistry)260,6264。
Schnepf等,(1998).微生物分子生物学综述(Microbiol.Mol.Biol.Rev.)62(3),775-806。
Shcherban等,(1995),美国国家科学院院报(Proc.Natl.Acad.Sci)USA 92,9245-9249。
Shimamoto等,自然(Nature)338,274-276(1989)。
Stanssens等,核酸研究(Nucleic Acids Research)12,4441-4454(1989)。
Sutliff等,(1991)植物分子生物学(Plant Molec.Biol.)16,579-591。
Tavladoraki等,(1998),FEBS Lett.426,62-66。
Terashima等,(1999),应用微生物生物技术(Appl.Microbiol.Biotechnol.)52,516-523。
Thompson等(1987),EMBO J.6,2519-2523。
Vaeck等,1987,自然(Nature)328,33-37。
Van Den Broeck等,1985,自然(Nature)313,358。
Vanderzant,经济昆虫学杂志(J.Econ.Entomol.)55,p.140(1962)。
Van Rie等,科学(Science)247,72(1990)。
Velten等,J.,EMBO J 3,2723-2730(1984)。
Velten和Schell,核酸研究(Nucleic Acids Research)13,6981-6998(1985)。
Verdaguer等,植物分子生物学(Plant Mol.Biol.)31,1129-1139(1996)。
Verdaguer等,植物分子生物学(Plant Mol.Biol.)37,1055-1067(1998)。
Visser等,《苏云金芽孢杆菌,环境的生物杀昆虫剂理论和实践》“苏云金芽孢杆菌晶体蛋白质的域结构研究一种遗传方法”,pp.71-88,eds.Entwistle,P.F.,Cory,J.S.,Bailey,M.J.和Higgs,S.,John Wiley和Sons,New York(1993)。
Wada等,(1990).核酸研究(Nucl.Acids Res.)18,2367-1411。
Waterfield等,(2001)微生物学动向(Trends Microbiol)9,185-91。
White等,(1989).遗传学动向(Trends in Genet.)5,185-189。
Wong等,(1992),植物分子生物学(Plant Molec.Biol.)20,81-93。
Zhang等,(1991)植物细胞(The Plant Cell)3,1155-1165。
序列表<110>拜尔生物科学公司<120>苏云金芽孢杆菌杀昆虫蛋白<130>NEW2AS WO1<150>US 09/756296<151>2001-01-09<160>9<170>PatentIn version 3.0<210>1<211>1899<212>DNA<213>苏云金芽孢杆菌(Bacillus thuringiensis)<220><221>CDS<222>(1)..(1896)<400>1atg aat aat gta tta aat aac gga aga act act att tgt gat gcg tat48Met Asn Asn Val Leu Asn Asn Gly Arg Thr Thr Ile Cys Asp Ala Tyr1 5 10 15aat gta gtg gcc cat gat cca ttt agt ttt gag cat aaa tca tta gat96Asn Val Val Ala His Asp Pro Phe Ser Phe Glu His Lys Ser Leu Asp20 25 30acc atc cga aaa gaa tgg atg gag tgg aaa aga aca gat cat agt tta144Thr Ile Arg Lys Glu Trp Met Glu Trp Lys Arg Thr Asp His Ser Leu35 40 45tat gta gct cct ata gtc gga act gtt tct agc ttt ctg cta aag aag192Tyr Val Ala Pro Ile Val Gly Thr Val Ser Ser Phe Leu Leu Lys Lys50 55 60gtg ggg agt ctt att gga aaa agg ata ttg agt gaa tta tgg ggg tta240Val Gly Ser Leu Ile Gly Lys Arg Ile Leu Ser Glu Leu Trp Gly Leu65 70 75 80ata ttt cct agt ggt agc aca aat cta atg caa gat att tta agg gag288Ile Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp Ile Leu Arg Glu85 90 95aca gaa caa ttc cta aat caa aga ctt aat aca gac act ctt gcc cgt336Thr Glu Gln Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala Arg100 105 110gta aat gcg gaa ttg gaa ggg ctg caa gcg aat ata agg gag ttt aat384Val Asn Ala Glu Leu Glu Gly Leu Gln Ala Asn Ile Arg Glu Phe Asn115 120 125caa caa gta gat aat ttt tta aat cct act caa aac cct gtt cct tta432Gln Gln Val Asp Asn Phe Leu Asn Pro Thr Gln Asn Pro Val Pro Leu130 135 140tca ata act tct tca gtt aat aca atg cag caa tta ttt cta aat aga480Ser Ile Thr Ser Ser Val Asn Thr Met Gln Gln Leu Phe Leu Asn Arg145 150 155 160tta ccc cag ttc cgt gtg caa gga tac caa ctg tta tta tta cct tta528Leu Pro Gln Phe Arg Val Gln Gly Tyr Gln Leu Leu Leu Leu Pro Leu165 170 175ttt gca cag gca gcc aat atg cat ctt tct ttt att aga gat gtt gtt576Phe Ala Gln Ala Ala Asn Met His Leu Ser Phe Ile Arg Asp Val Val180 185 190ctc aat gca gat gaa tgg gga att tca gca gca aca tta cgt acg tat624Leu Asn Ala Asp Glu Trp Gly Ile Ser Ala Ala Thr Leu Arg Thr Tyr195 200 205caa aat tat ctg aaa aat tat aca aca gag tac tct aat tat tgt ata672Gln Asn Tyr Leu Lys Asn Tyr Thr Thr Glu Tyr Ser Asn Tyr Cys Ile210 215220aat acg tat caa act gcg ttt aga ggt tta aac acc cgt tta cac gat720Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Thr Arg Leu His Asp225 230 235 240atg tta gaa ttt aga aca tat atg ttt tta aat gta ttt gaa tat gta768Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val phe Glu Tyr Val245 250 255tct atc tgg tcg ttg ttt aaa tat caa agc ctt cta gta tct tct ggc816Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser Ser Gly260 265 270gct aat tta tat gca agc ggt agt gga cca cag cag act caa tca ttt864Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln Ser Phe275 280 285act tca caa gac tgg cca ttt tta tat tct ctt ttc caa gtt aat tca 912Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Val Asn Ser290 295 300aat tat gtg tta aat ggc ttt agt ggc gct aga ctt acg cag act ttc 960Asn Tyr Val Leu Asn Gly Phe Ser Gly Ala Arg Leu Thr Gln Thr Phe305 310 315 320cct aat att ggt ggt tta cct ggt act act aca act cac gca ttg ctt 1008Pro Asn Ile Gly Gly Leu Pro Gly Thr Thr Thr Thr His Ala Leu Leu325 330 335gcg gca agg gtc aat tac agt gga gga gtt tcg tct ggt gat ata ggc 1056Ala Ala Arg Val Asn Tyr Ser Gly Gly Val Ser Ser Gly Asp Ile Gly340 345 350gct gtg ttt aat caa aat ttt agt tgt agc aca ttt ctc cca cct ttg 1104Ala Val Phe Asn Gln Asn Phe Ser Cys Ser Thr Phe Leu Pro Pro Leu355 360 365tta aca cca ttt gtt agg agt tgg cta gat tca ggt tca gat cga ggg 1152Leu Thr Pro Phe Val Arg Ser Trp Leu Asp Ser Gly Ser Asp Arg Gly370 375 380ggt gtt aat acc gtt aca aat tgg caa aca gaa tcg ttt gag tca act 1200Gly Val Asn Thr Val Thr Asn Trp Gln Thr Glu Ser Phe Glu Ser Thr385 390 395 400tta ggt tta agg tgt ggt gct ttt aca gct cgt ggt aat tca aac tat 1248Leu Gly Leu Arg Cys Gly Ala Phe Thr Ala Arg Gly Asn Ser Asn Tyr405 410 415ttc cca gat tat ttt atc cgt aat att tca gga gtt cct tta gtt gtt 1296Phe Pro Asp Tyr Phe Ile Arg Asn Ile Ser Gly Val Pro Leu Val Val420 425 430aga aat gaa gat tta aga aga ccg tta cac tat aat gaa ata aga aat 1344Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Glu Ile Arg Asn
435440 445ata gaa agt cct tca gga aca cct ggt gga tta cga gct tat atg gta1392Ile Glu Ser Pro Ser Gly Thr Pro Gly Gly Leu Arg Ala Tyr Met Val450 455 460tct gtg cat aat aga aaa aat aat atc tat gcc gtg cat gaa aat ggt1440Ser Val His Asn Arg Lys Asn Asn Ile Tyr Ala Val His Glu Asn Gly465 470 475 480act atg att cat tta gcg ccg gaa gat tat aca gga ttc acc ata tcg1488Thr Met Ile His Leu Ala Pro Glu Asp Tyr Thr Gly Phe Thr Ile Ser485 490 495ccg ata cat gca act caa gtg aat aat caa acg cga aca ttt att tct1536Pro Ile His Ala Thr Gln Val Asn Asn Gln Thr Arg Thr Phe Ile Ser500 505 510gaa aaa ttt gga aat caa ggt gat tcc tta aga ttt gaa caa agc aac1584Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln Ser Asn515 520 525acg aca gca cgt tat aca ctt aga gga aat gga aat agt tac aat ctt1632Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr Asn Leu530 535 540tat tta aga gta tct tca cta gga aat tcc act att cga gtt act ata1680Tyr Leu Arg Val Ser Ser Leu Gly Asn Ser Thr Ile Arg Val Thr Ile545 550 555 560aac ggt agg gtt tat act gct tca aat gtt aat act act aca aat aac1728Asn Gly Arg Val Tyr Thr Ala Ser Asn Val Asn Thr Thr Thr Asn Asn565 570 575gat gga gtt aat gat aat ggc gct cgt ttt tta gat att aat atg ggt1776Asp Gly Val Asn Asp Asn Gly Ala Arg Phe Leu Asp Ile Asn Met Gly580 585 590aat gta gta gca agt gat aat act aat gta ccg tta gat ata aat gtg1824Asn Val Val Ala Ser Asp Asn Thr Asn Val Pro Leu Asp Ile Asn Val595 600 605aca ttt aac tcc ggt act caa ttt gag ctt atg aat att atg ttt gtt1872Thr Phe Asn Ser Gly Thr Gln Phe Glu Leu Met Asn Ile Met Phe Val610 615 620cca act aat ctt cca cca ata tat taa1899Pro Thr Asn Leu Pro Pro Ile Tyr625 630<210>2<211>632<212>PRT<213>苏云金芽孢杆菌<400>2Met Asn Asn Val Leu Asn Asn Gly Arg Thr Thr Ile Cys Asp Ala Tyr1 5 10 15Asn Val Val Ala His Asp Pro Phe Ser Phe Glu His Lys Ser Leu Asp20 25 30Thr Ile Arg Lys Glu Trp Met Glu Trp Lys Arg Thr Asp His Ser Leu35 40 45Tyr Val Ala Pro Ile Val Gly Thr Val Ser Ser Phe Leu Leu Lys Lys50 55 60Val Gly Ser Leu Ile Gly Lys Arg Ile Leu Ser Glu Leu Trp Gly Leu65 70 75 80Ile Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp Ile Leu Arg Glu85 90 95Thr Glu Gln Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala Arg100 105 110Val Asn Ala Glu Leu Glu Gly Leu Gln Ala AsnIle Arg Glu Phe Asn115 120125Gln Gln Val Asp Asn Phe Leu Asn Pro Thr Gln Asn Pro Val Pro Leu130 135 140Ser Ile Thr Ser Ser Val Asn Thr Met Gln Gln Leu Phe Leu Asn Arg145 150 155 160Leu Pro Gln Phe Arg Val Gln Gly Tyr Gln Leu Leu Leu Leu Pro Leu165 170 175Phe Ala Gln Ala Ala Asn Met His Leu Ser Phe Ile Arg Asp Val Val180 185 190Leu Asn Ala Asp Glu Trp Gly Ile Ser Ala Ala Thr Leu Arg Thr Tyr195 200 205Gln Asn Tyr Leu Lys Asn Tyr Thr Thr Glu Tyr Ser Asn Tyr Cys Ile210 215 220Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Thr Arg Leu His Asp225 230 235 240Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Phe Glu Tyr Val245 250 255Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser Ser Gly260 265 270Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln Ser Phe275 280 285Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Val Asn Ser290 295 300Asn Tyr Val Leu Asn Gly Phe Ser Gly Ala Arg Leu Thr Gln Thr Phe305 310 315 320Pro Asn Ile Gly Gly Leu Pro Gly Thr Thr Thr Thr His Ala Leu Leu325 330 335Ala Ala Arg Val Asn Tyr Ser Gly Gly Val Ser Ser Gly Asp Ile Gly340 345 350Ala Val Phe Asn Gln Asn Phe Ser Cys Ser Thr Phe Leu Pro Pro Leu355 360 365Leu Thr Pro Phe Val Arg Ser Trp Leu Asp Ser Gly Ser Asp Arg Gly370 375 380Gly Val Asn Thr Val Thr Asn Trp Gln Thr Glu Ser Phe Glu Ser Thr385 390 395 400Leu Gly Leu Arg Cys Gly Ala Phe Thr Ala Arg Gly Asn Ser Asn Tyr405 410 415Phe Pro Asp Tyr Phe Ile Arg Asn Ile Ser Gly Val Pro Leu Val Val420 425 430Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Glu Ile Arg Asn435 440 445Ile Glu Ser Pro Ser Gly Thr Pro Gly Gly Leu Arg Ala Tyr Met Val450 455 460Ser Val His Asn Arg Lys Asn Asn Ile Tyr Ala Val His Glu Asn Gly465 470 475 480Thr Met Ile His Leu Ala Pro Glu Asp Tyr Thr Gly Phe Thr Ile Ser485 490 495Pro Ile His Ala Thr Gln Val Asn Asn Gln Thr Arg Thr Phe Ile Ser500 505 510Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln Ser Asn515 520 525Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr Asn Leu530 535 540Tyr Leu Arg Val Ser Ser Leu Gly Asn Ser Thr Ile Arg Val Thr Ile545 550 555 560Asn Gly Arg Val Tyr Thr Ala Ser Asn Val Asn Thr Thr Thr Asn Asn565 570 575Asp Gly Val Asn Asp Asn Gly Ala Arg Phe Leu Asp Ile Asn Met Gly580 585 590Asn Val Val Ala Ser Asp Asn Thr Asn Val Pro Leu Asp Ile Asn Val595 600 605Thr Phe Asn Ser Gly Thr Gln Phe Glu Leu Met Asn Ile Met Phe Val610 615 620Pro Thr Asn Leu Pro Pro Ile Tyr625 630<210>3<211>1899<212>DNA<213>苏云金芽孢杆菌<220><221>CDS<222>(1)..(1896)<400>3atg aat agt gta ttg aat agc gga aga act act att tgt gat gcg tat48Met Asn Ser Val Leu Asn Ser Gly Arg Thr Thr Ile Cys Asp Ala Tyr1 5 10 15aat gta gtg gct cat gat cca ttt agt ttt caa cat aaa tca tta gat96Asn Val Val Ala His Asp Pro Phe Ser Phe Gln His Lys Ser Leu Asp20 25 30acc ata caa gaa gaa tgg atg gag tgg aaa aaa gat aat cat agt tta144Thr Ile Gln Glu Glu Trp Met Glu Trp Lys Lys Asp Asn His Ser Leu35 40 45tat gta gat cct att gtt gga act gtg gct agt ttt ctt tta aag aaa192Tyr Val Asp Pro Ile Val Gly Thr Val Ala Ser Phe Leu Leu Lys Lys50 55 60gtg ggg agt ctt gtt gga aaa aga ata ctg agt gag tta cgg aat tta240Val Gly Ser Leu Val Gly Lys Arg Ile Leu Ser Glu Leu Arg Asn Leu65 70 75 80ata ttt cct agt ggc agt aca aat cta atg caa gat att tta aga gag288Ile Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp Ile Leu Arg Glu85 90 95aca gaa aaa ttc ctg aat caa aga ctt aat aca gac act ctt gcc cgt336Thr Glu Lys Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala Arg100 105 110gta aat gcg gaa ttg aca ggg ctg caa gca aat gta gaa gag ttt aat384Val Asn Ala Glu Leu Thr Gly Leu Gln Ala Asn Val Glu Glu Phe Asn115 120 125cga caa gta gat aat ttt ttg aac cct aac cga aat gct gtt cct tta432Arg Gln Val Asp Asn Phe Leu Asn Pro Asn Arg Asn Ala Val Pro Leu130 135 140tca ata act tct tca gtt aat aca atg cag caa tta ttt cta aat aga480Ser Ile Thr Ser Ser Val Asn Thr Met Gln Gln Leu Phe Leu Asn Arg145 150 155 160tta acc cag ttc cag atg caa gga tac caa ttg tta tta tta cct tta528Leu Thr Gln Phe Gln Met Gln Gly Tyr Gln Leu Leu Leu Leu Pro Leu165 170 175ttt gca cag gca gcc aat tta cat ctt tct ttt att aga gat gtt att576Phe Ala Gln Ala Ala Asn Leu His Leu Ser Phe Ile Arg Asp Val Ile180 185 190ctt aat gca gac gaa tgg gga att tca gca gca aca tta cgt acg tat624Leu Asn Ala Asp Glu Trp Gly Ile Ser Ala Ala Thr Leu Arg Thr Tyr195 200 205caa aat cac ctg aga aat tat aca aga gat tac tct aat tat tgt ata672Gln Asn His Leu Arg Asn Tyr Thr Arg Asp Tyr Ser Asn Tyr Cys Ile210 215 220aat acg tat caa act gcg ttt aga ggt tta aac acc cgt tta cac gat720Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Thr Arg Leu His Asp225 230 235 240atg tta gaa ttt aga aca tat atg ttt tta aat gta ttt gag tat gta768Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Phe Glu Tyr Val245 250 255tct atc tgg tcg ttg ttt aaa tat caa agc ctt cta gtc tct tct ggc816Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser Ser Gly260 265 270gct aat tta tat gca agt ggt agt gga cca cag cag acc caa tca ttt864Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln Ser Phe275 280 285act tca caa gac tgg cca ttt tta tat tct ctt ttc caa gtt aat tca912Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Val Asn Ser290 295 300aat tat gtg tta aat ggc ttt agt ggc gct aga ctt acg cag act ttc960Asn Tyr Val Leu Asn Gly Phe Ser Gly Ala Arg Leu Thr Gln Thr Phe305 310 315 320cct aat att gtt ggt tta cct ggt act act aca sct cac gca ttg ctt1008Pro Asn Ile Val Gly Leu Pro Gly Thr Thr Thr Thr His Ala Leu Leu
325 330 335gct gca agg gtc aat tac agt gga gga gtt tcg tct ggt gat ata ggc1056Ala Ala Arg Val Asn Tyr Ser Gly Gly Val Ser Ser Gly Asp Ile Gly340 345 350gct gtg ttt aat caa aat ttt agt tgt agc aca ttt ctc cca cct ttg1104Ala Val Phe Asn Gln Asn Phe Ser Cys Ser Thr Phe Leu Pro Pro Leu355 360 365tta aca cca ttt gtt agg agt tgg cta gat tca ggt tca gat cgg ggg1152Leu Thr Pro Phe Val Arg Ser Trp Leu Asp Ser Gly Ser Asp Arg Gly370 375 380ggg atc aat acc gtt acc aat tgg caa aca gaa tcc ttt gag aca act1200Gly Ile Asn Thr Val Thr Asn Trp Gln Thr Glu Ser Phe Glu Thr Thr385 390 395 400tta ggt tta agg agt ggt gct ttt aca gct cga ggt aat tca aac tat1248Leu Gly Leu Arg Ser Gly Ala Phe Thr Ala Arg Gly Asn Ser Asn Tyr405 410 415ttc cca gat tat ttt atc cgt aat att tcc gga gtt cct tta gtt gtt1296Phe Pro Asp Tyr Phe Ile Arg Asn Ile Ser Gly Val Pro Leu Val Val420 425 430aga aat gaa gat tta aga aga ccg tta cac tat aat caa ata aga aat1344Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Gln Ile Arg Asn435 440 445ata gaa agt cct tca gga aca cct ggt gga tta cga gct tat atg gta1392Ile Glu Ser Pro Ser Gly Thr Pro Gly Gly Leu Arg Ala Tyr Met Val450 455 460tct gtg cat aac aga aaa aat aat atc tat gcc gtt cat gaa aat ggt1440Ser Val His Asn Arg Lys Asn Asn Ile Tyr Ala Val His Glu Asn Gly465 470 475 480act atg att cat tta gcg ccg gaa gat tat aca gga ttt act ata tcg1488Thr Met Ile His Leu Ala Pro Glu Asp Tyr Thr Gly Phe Thr Ile Ser485 490 495ccg ata cat gca act caa gtg aat aat caa acg cga aca ttt att tct1536Pro Ile His Ala Thr Gln Val Asn Asn Gln Thr Arg Thr Phe Ile Ser500 505 510gaa aaa ttt gga aat caa ggt gat tcc tta aga ttt gaa caa agc aac1584Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln Ser Asn515 520 525acg aca gct cgt tat aca ctt aga ggg aat gga aat agt tac aat ctt1632Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr Asn Leu530 535 540tat tta aga gta tct tca ata gga aat tcc act att cga gtt act ata1680Tyr Leu Arg Val Ser Ser Ile Gly Asn Ser Thr Ile Arg Val Thr Ile545 550 555 560aac ggt aga gtt tat act gct tca aat gtt aat act act aca aat aac1728Asn Gly Arg Val Tyr Thr Ala Ser Asn Val Asn Thr Thr Thr Asn Asn565 570 575gat gga gtt aat gat aat gga gct cgt ttt tca gat att aat att ggt1776Asp Gly Val Asn Asp Asn Gly Ala Arg Phe Ser Asp Ile Asn Ile Gly580 585 590aat gta gta gca agt gat aat act aat gta ccg tta gat ata aac gtg1824Asn Val Val Ala Ser Asp Asn Thr Asn Val Pro Leu Asp Ile Asn Val595 600 605aca tta aat tct ggt act caa ttt gag ctt atg aat att atg ttt gtt1872Thr Leu Asn Ser Gly Thr Gln Phe Glu Leu Met Asn Ile Met Phe Val610 615 620cca act aat atc tca cca ctt tat taa1899Pro Thr Asn Ile Ser Pro Leu Tyr625 630<210>4<211>632<212>PRT<213>苏云金芽孢杆菌<400>4Met Asn Ser Val Leu Asn Ser Gly Arg Thr Thr Ile Cys Asp Ala Tyr1 5 10 15Asn Val Val Ala His Asp Pro Phe Ser Phe Gln His Lys Ser Leu Asp20 25 30Thr Ile Gln Glu Glu Trp Met Glu Trp Lys Lys Asp Asn His Ser Leu35 40 45Tyr Val Asp Pro Ile Val Gly Thr Val Ala Ser Phe Leu Leu Lys Lys50 55 60Val Gly Ser Leu Val Gly Lys Arg Ile Leu Ser Glu Leu Arg Asn Leu65 70 75 80Ile Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp Ile Leu Arg Glu85 90 95Thr Glu Lys Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala Arg100 105 110Val Asn Ala Glu Leu Thr Gly Leu Gln Ala Asn Val Glu Glu Phe Asn115 120 125Arg Gln Val Asp Asn Phe Leu Asn Pro Asn Arg Asn Ala Val Pro Leu130 135 140Ser Ile Thr Ser Ser Val Asn Thr Met Gln Gln Leu Phe Leu Asn Arg145 150 155 160Leu Thr Gln Phe Gln Met Gln Gly Tyr Gln Leu Leu Leu Leu Pro Leu165 170 175Phe Ala Gln Ala Ala Asn Leu His Leu Ser Phe Ile Arg Asp Val Ile180 185 190Leu Asn Ala Asp Glu Trp Gly Ile Ser Ala Ala Thr Leu Arg Thr Tyr195 200 205Gln Asn His Leu Arg Asn Tyr Thr Arg Asp Tyr Ser Asn Tyr Cys Ile210 215 220Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Thr Arg Leu His Asp225 230 235 240Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Phe Glu Tyr Val245 250 255Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser Ser Gly260 265 270Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln Ser Phe275 280 285Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Val Asn Ser290 295 300Asn Tyr Val Leu Asn Gly Phe Ser Gly Ala Arg Leu Thr Gln Thr Phe305 310 315 320Pro Asn Ile Val Gly Leu Pro Gly Thr Thr Thr Thr His Ala Leu Leu325 330 335Ala Ala Arg Val Asn Tyr Ser Gly Gly Val Ser Ser Gly Asp Ile Gly340 345 350Ala Val Phe Asn Gln Asn Phe Ser Cys Ser Thr Phe Leu Pro Pro Leu355 360 365Leu Thr Pro Phe Val Arg Ser Trp Leu Asp Ser Gly Ser Asp Arg Gly370 375 380Gly Ile Asn Thr Val Thr Asn Trp Gln Thr Glu Ser Phe Glu Thr Thr385 390 395 400Leu Gly Leu Arg Ser Gly Ala Phe Thr Ala Arg Gly Asn Ser Asn Tyr405 410 415Phe Pro Asp Tyr Phe Ile Arg Asn Ile Ser Gly Val Pro Leu Val Val420 425 430Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Gln Ile Arg Asn435 440 445Ile Glu Ser Pro Ser Gly Thr Pro Gly Gly Leu Arg Ala Tyr Met Val450 455 460Ser Val His Asn Arg Lys Asn Asn Ile Tyr Ala Val His Glu Asn Gly465 470 475 480Thr Met Ile His Leu Ala Pro Glu Asp Tyr Thr Gly Phe Thr Ile Ser485 490 495pro Ile His Ala Thr Gln Val Asn Asn Gln Thr Arg Thr Phe Ile Ser500 505 510Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln Ser Asn515 520 525Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr Asn Leu530 535 540Tyr Leu Arg Val Ser Ser Ile Gly Asn Ser Thr Ile Arg Val Thr Ile545 550 555 560Asn Gly Arg Val Tyr Thr Ala Ser Asn Val Asn Thr Thr Thr Asn Asn565 570 575Asp Gly Val Asn Asp Asn Gly Ala Arg Phe Ser Asp Ile Asn Ile Gly580 585 590Asn Val Val Ala Ser Asp Asn Thr Asn Val Pro Leu Asp Ile Asn Val595 600 605Thr Leu Asn Ser Gly Thr Gln Phe Glu Leu Met Asn Ile Met Phe Val610 615 620Pro Thr Asn Ile Ser Pro Leu Tyr625 630<210>5<211>1884<212>DNA<213>苏云金芽孢杆菌<220><221>CDS<222>(1)..(1881)<400>5atg aat aat gta ttg aat agc gaa aga act act aag tgt ggt gcg tat48Met Asn Asn Val Leu Asn Ser Glu Arg Thr Thr Lys Cys Gly Ala Tyr1 5 10 15aac gta gtg gct cat gat cca ttc agt ttt gaa cat aaa tca tta gat96Asn Val Val Ala His Asp Pro Phe Ser Phe Glu His Lys Ser Leu Asp20 25 30acc ata caa aaa gaa tgg atg gag tgg aaa aga act gat cat agt tta144Thr Ile Gln Lys Glu Trp Met Glu Trp Lys Arg Thr Asp His Ser Leu35 40 45tat gta tct cct att gta gga act ata gcc agt ttt ctg tta aag aaa192Tyr Val Ser Pro Ile Val Gly Thr Ile Ala Ser Phe Leu Leu Lys Lys50 55 60ata gga ggg ctt ata gga aaa aga ata tta agt gag tta aag aat tta240Ile Gly Gly Leu Ile Gly Lys Arg Ile Leu Ser Glu Leu Lys Asn Leu65 70 75 80att ttt cct agt ggt agt ata gaa tca atg caa gat att tta aga ggg288Ile Phe Pro Ser Gly Ser Ile Glu Ser Met Gln Asp Ile Leu Arg Gly85 90 95gca gaa caa ttt cta aat caa aga ctt gat gca gac acc ttt agt cgt336Ala Glu Gln Phe Leu Asn Gln Arg Leu Asp Ala Asp Thr Phe Ser Arg100 105 110gta gaa gca gaa ttg aga ggg ctt caa gca aat gta gag gaa ttt aat384Val Glu Ala Glu Leu Arg Gly Leu Gln Ala Asn Val Glu Glu Phe Asn115 120 125cga caa gtg gac aat ttt tta aac cca aat caa aac cct gcc cct tta432Arg Gln Val Asp Asn Phe Leu Asn Pro Asn Gln Asn Pro Ala Pro Leu130 135 140gca ata att gat tcg gtt aat aca ttg caa caa tta ttc cta agt aga480Ala Ile Ile Asp Ser Val Asn Thr Leu Gln Gln Leu Phe Leu Ser Arg145 150 155 160tta ccc cag ttc cag ata caa cgc tat cag cta tta tta tta cct tta528Leu Pro Gln Phe Gln Ile Gln Arg Tyr Gln Leu Leu Leu Leu Pro Leu165 170 175ttt gca caa gca gcc aat tta cac ctt tct ttt att aga gac gtt att576Phe Ala Gln Ala Ala Asn Leu His Leu Ser Phe Ile Arg Asp Val Ile180 185 190ctt aat gca gat gaa tgg gga ata cca gct gca acg gtg cgc aca tat624Leu Asn Ala Asp Glu Trp Gly Ile Pro Ala Ala Thr Val Arg Thr Tyr195 200 205aga gag cac cta caa aga tat aca cgc gaa tac tcc aat tat tgt ata672Arg Glu His Leu Gln Arg Tyr Thr Arg Glu Tyr Ser Asn Tyr Cys Ile
210215 220aat acg tat caa act gcg ttt aga ggg tta aat gcc act tta cac gat720Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Ala Thr Leu His Asp225 230 235 240ttt cta gaa ttt aga aca tat atg ttt tta aat gta tta gac tat gta768Phe Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Leu Asp Tyr Val245 250 255tct atc tgg tcg ttg ttt aaa tat cag agc ctt ctg gta tcc tct ggc816Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser Ser Gly260 265 270gct aat tta tat gcg agt ggt agt gga gta aca aat aga caa tca ttt864Ala Asn Leu Tyr Ala Ser Gly Ser Gly Val Thr Asn Arg Gln Ser Phe275 280 285act gca caa gac tgg cca ttt tta aat tct ctt ttc caa gtt aat caa912Thr Ala Gln Asp Trp Pro Phe Leu Asn Ser Leu Phe Gln Val Asn Gln290 295 300aat tat gta tta aca ggt atg aat ggt tat agg tat act tta agt tct960Asn Tyr Val Leu Thr Gly Met Asn Gly Tyr Arg Tyr Thr Leu Ser Ser305 310 315 320gtt ttt ggt aca aat caa aca ata cat tct gtt agg agt aat tat agg1008Val Phe Gly Thr Asn Gln Thr Ile His Ser Val Arg Ser Asn Tyr Arg325 330 335ggc ggg gtt tca tct ggt tac att gga gtt aat ctt agt gaa ggt gac1056Gly Gly Val Ser Ser Gly Tyr Ile Gly Val Asn Leu Ser Glu Gly Asp340 345 350caa aat ttt agt tgt agt aca ttt ttg gat cct tta gaa aca ccg ttt1104Gln Asn Phe Ser Cys Ser Thr Phe Leu Asp Pro Leu Glu Thr Pro Phe355 360 365att aga agt tgg ctg gat tca ggt agc gat gat ggc ttt aat tgg agt1152Ile Arg Ser Trp Leu Asp Ser Gly Ser Asp Asp Gly Phe Asn Trp Ser370 375 380aca gga gtc ttt aca aca act att ggt tta cct act tgt agc att ttt1200Thr Gly Val Phe Thr Thr Thr Ile Gly Leu Pro Thr Cys Ser Ile Phe385 390 395 400tgg cct cgt ggt aac tcg aac tat ttt cca gat tat ttt ata cga aat1248Trp Pro Arg Gly Asn Ser Asn Tyr Phe Pro Asp Tyr Phe Ile Arg Asn405 410 415att tct ggt gtc gtt ggt cgt ctt agg aac gaa gat tta aga aga cca1296Ile Ser Gly Val Val Gly Arg Leu Arg Asn Glu Asp Leu Arg Arg Pro420 425 430cta tat ttt aat gag ata aga aat ata gta gga aat aac aat cca ccg1344Leu Tyr Phe Asn Glu Ile Arg Asn Ile Val Gly Asn Asn Asn Pro Pro435 440 445gca act gga tcg tta tca gtc gcc agc cta gtc tct gtg cat aac aga1392Ala Thr Gly Ser Leu Ser Val Ala Ser Leu Val Ser Val His Asn Arg450 455 460aaa aat aat att tat gct gct cat gaa aat ggt act atg att cat ttg1440Lys Asn Asn Ile Tyr Ala Ala His Glu Asn Gly Thr Met Ile His Leu465 470 475 480gca ccg gaa gat tat aca ggt ttc aca atg tca cca ata cat gca act1488Ala Pro Glu Asp Tyr Thr Gly Phe Thr Met Ser Pro Ile His Ala Thr485 490 495caa gta aat aat caa aca cga aca ttt att tcc gag aaa tta gga aac1536Gln Val Asn Asn Gln Thr Arg Thr Phe Ile Ser Glu Lys Leu Gly Asn500 505 510caa ggt gat tcc ttg aga ttt gaa caa aca aat aca acg gct cga tac1584Gln Gly Asp Ser Leu Arg Phe Glu Gln Thr Asn Thr Thr Ala Arg Tyr515 520 525aca ttt aga ggg aat gga aat agt tac aat ctt tat tta aga gta tct1632Thr Phe Arg Gly Asn Gly Asn Ser Tyr Asn Leu Tyr Leu Arg Val Ser530 535 540tca cta gga aat tcc aca att cga gtt act ata aac ggt aga gtt tat1680Ser Leu Gly Asn Ser Thr Ile Arg Val Thr Ile Asn Gly Arg Val Tyr545 550 555 560act gtt tca aac gtc aat act act aca aat aac gat gga gtt gtt gat1728Thr Val Ser Asn Val Asn Thr Thr Thr Asn Asn Asp Gly Val Val Asp565 570 575aat ggc gct cgt ttt tca gat att aat ata ggt aat gta gtg gca agt1776Asn Gly Ala Arg Phe Ser Asp Ile Asn Ile Gly Asn Val Val Ala Ser580 585 590gct aat act aat ata cca tta gat ata aat gta aca ttt aac tct ggt1824Ala Asn Thr Asn Ile Pro Leu Asp Ile Asn Val Thr Phe Asn Ser Gly595 600 605acg caa ttt gag ctt atg aat att atg ttt gtt cca act aat att cca1872Thr Gln Phe Glu Leu Met Asn Ile Met Phe Val Pro Thr Asn Ile Pro610 6l5 620cca att tat taa1884Pro Ile Tyr625<210>6<211>627<212>PRT<213>苏云金芽孢杆菌<400>6Met Asn Asn Val Leu Asn Ser Glu Arg Thr Thr Lys Cys Gly Ala Tyr1 5 10 15Asn Val Val Ala His Asp Pro Phe Ser Phe Glu His Lys Ser Leu Asp20 25 30Thr Ile Gln Lys Glu Trp Met Glu Trp Lys Arg Thr Asp His Ser Leu35 40 45Tyr Val Ser Pro Ile Val Gly Thr Ile Ala Ser Phe Leu Leu Lys Lys50 55 60Ile Gly Gly Leu Ile Gly Lys Arg Ile Leu Ser Glu Leu Lys Asn Leu65 70 75 80Ile Phe Pro Ser Gly Ser Ile Glu Ser Met Gln Asp Ile Leu Arg Gly85 90 95Ala Glu Gln Phe Leu Asn Gln Arg Leu Asp Ala Asp Thr Phe Ser Arg100 105 110Val Glu Ala Glu Leu Arg Gly Leu Gln Ala Asn Val Glu Glu Phe Asn
115 120 125Arg Gln Val Asp Asn Phe Leu Asn Pro Asn Gln Asn Pro Ala Pro Leu130 135 140Ala Ile Ile Asp Ser Val Asn Thr Leu Gln Gln Leu Phe Leu Ser Arg145 150 155 160Leu Pro Gln Phe Gln Ile Gln Arg Tyr Gln Leu Leu Leu Leu Pro Leu165 170 175Phe Ala Gln Ala Ala Asn Leu His Leu Ser Phe Ile Arg Asp Val Ile180 185 190Leu Asn Ala Asp Glu Trp Gly Ile Pro Ala Ala Thr Val Arg Thr Tyr195 200 205Arg Glu His Leu Gln Arg Tyr Thr Arg Glu Tyr Ser Asn Tyr Cys Ile210 215 220Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Ala Thr Leu His Asp225 230 235 240Phe Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Leu Asp Tyr Val245 250 255Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser Ser Gly260 265 270Ala Asn Leu Tyr Ala Ser Gly Ser Gly Val Thr Asn Arg Gln Ser Phe275 280 285Thr Ala Gln Asp Trp Pro Phe Leu Asn Ser Leu Phe Gln Val Asn Gln290 295 300Asn Tyr Val Leu Thr Gly Met Asn Gly Tyr Arg Tyr Thr Leu Ser Ser305 310 315 320Val Phe Gly Thr Asn Gln Thr Ile His Ser Val Arg Ser Asn Tyr Arg325 330 335Gly Gly Val Ser Ser Gly Tyr Ile Gly Val Asn Leu Ser Glu Gly Asp340 345 350Gln Asn Phe Ser Cys Ser Thr Phe Leu Asp Pro Leu Glu Thr Pro Phe
355 360 365Ile Arg Ser Trp Leu Asp Ser Gly Ser Asp Asp Gly Phe Asn Trp Ser370 375 380Thr Gly Val Phe Thr Thr Thr Ile Gly Leu Pro Thr Cys Ser Ile Phe385 390 395 400Trp Pro Arg Gly Asn Ser Asn Tyr Phe Pro Asp Tyr Phe Ile Arg Asn405 410 415Ile Ser Gly Val Val Gly Arg Leu Arg Asn Glu Asp Leu Arg Arg Pro420 425 430Leu Tyr Phe Asn Glu Ile Arg Asn Ile Val Gly Asn Asn Asn Pro Pro435 440 445Ala Thr Gly Ser Leu Ser Val Ala Ser Leu Val Ser Val His Asn Arg450 455 460Lys Asn Asn Ile Tyr Ala Ala His Glu Asn Gly Thr Met Ile His Leu465 470 475 480Ala Pro Glu Asp Tyr Thr Gly Phe Thr Met Ser Pro Ile His Ala Thr485 490 495Gln Val Asn Asn Gln Thr Arg Thr Phe Ile Ser Glu Lys Leu Gly Asn500 505 510Gln Gly Asp Ser Leu Arg Phe Glu Gln Thr Asn Thr Thr Ala Arg Tyr515 520 525Thr Phe Arg Gly Asn Gly Asn Ser Tyr Asn Leu Tyr Leu Arg Val Ser530 535 540Ser Leu Gly Asn Ser Thr Ile Arg Val Thr Ile Asn Gly Arg Val Tyr545 550 555 560Thr Val Ser Asn Val Asn Thr Thr Thr Asn Asn Asp Gly Val Val Asp565 570 575Asn Gly Ala Arg Phe Ser Asp Ile Asn Ile Gly Asn Val Val Ala Ser580 585 590Ala Asn Thr Asn Ile Pro Leu Asp Ile Asn Val Thr Phe Asn Ser Gly
595 600 605Thr Gln Phe Glu Leu Met Asn Ile Met Phe Val Pro Thr Asn Ile Pro610 615 620Pro Ile Tyr625<210>7<211>1910<212>DNA<213>人工序列<220><223>用于在棉花中表达的人工cry2Ae DNA序列<220><221>CDS<222>(3)..(1901)<400>7cc atg gct aac aac gtt ctt aac aac ggt agg act act att tgc gat 47Met Ala Asn Asn Val Leu Asn Asn Gly Arg Thr Thr Ile Cys Asp1 5 10 15gca tac aac gtt gtt gct cat gat cct ttc tct ttc gag cat aag tct95Ala Tyr Asn Val Val Ala His Asp Pro Phe Ser Phe Glu His Lys Ser20 25 30ctt gat aca att agg aag gag tgg atg gag tgg aag agg act gat cat143Leu Asp Thr Ile Arg Lys Glu Trp Met Glu Trp Lys Arg Thr Asp His35 40 45tct ctt tac gtt gct cct att gtt ggt act gtt tct tct ttc ctt ctt191Ser Leu Tyr Val Ala Pro Ile Val Gly Thr Val Ser Ser Phe Leu Leu50 55 60aag aag gtt ggt tct ctt atc ggt aag agg atc ctt tct gag ctt tgg239Lys Lys Val Gly Ser Leu Ile Gly Lys Arg Ile Leu Ser Glu Leu Trp65 70 75ggt ctt atc ttc cct tct ggt tct act aac ctt atg caa gat att ett287Gly Leu Ile Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp Ile Leu80 85 90 95agg gag act gaa caa ttc ctt aac cag agg ctt aac act gat act ctt335Arg Glu Thr Glu Gln Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu100 105 110gct agg gtt aac gct gag ctt gag ggt ctt caa gct aac att agg gaa383Ala Arg Val Asn Ala Glu Leu Glu Gly Leu Gln Ala Asn Ile Arg Glu115 120 125ttc aac cag caa gtt gat aac ttc ctt aac cct act caa aac cct gtt431Phe Asn Gln Gln Val Asp Asn Phe Leu Asn Pro Thr Gln Asn Pro Val130 135 140cct ctt tct att act tct tct gtt aac act atg caa caa ctt ttc ctt479Pro Leu Ser Ile Thr Ser Ser Val Asn Thr Met Gln Gln Leu Phe Leu145 150 155aac agg ctt cct caa ttc agg gtt caa ggt tac caa ctt ctt ctt ctt527Asn Arg Leu Pro Gln Phe Arg Val Gln Gly Tyr Gln Leu Leu Leu Leu160 165 170 175cct ctt ttc gct caa gct gct aac atg cac cta agc ttc att agg gat575Pro Leu Phe Ala Gln Ala Ala Asn Met His Leu Ser Phe Ile Arg Asp180 185 190gtt gtt ctt aac gct gat gag tgg ggt att tct gct gct act ctt agg623Val Val Leu Asn Ala Asp Glu Trp Gly Ile Ser Ala Ala Thr Leu Arg195 200 205act tac caa aac tac ctt aag aac tac act act gag tac tct aac tac671Thr Tyr Gln Asn Tyr Leu Lys Asn Tyr Thr Thr Glu Tyr Ser Asn Tyr210 215 220tgc att aac act tac caa act gct ttc agg ggt ctt aac act agg ctt719Cys Ile Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Thr Arg Leu225 230 235cat gat atg ctt gag ttc agg act tac atg ttc ctt aac gtt ttc gag767His Asp Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Phe Glu240 245 250 255tac gtt tct att tgg tct ctt ttc aag tac cag tct ctt ctt gtt tct815Tyr Val Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser260 265 270tct ggt gct aac ctt tac gct tct ggt tct ggt cct caa caa act caa863Ser Gly Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln275 280 285tct ttc act tct caa gac tgg cct ttc ctt tac tct ctt ttc caa gtt911Ser Phe Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Val290 295 300aac tct aac tac gtt ctt aac ggt ttc tct ggt gct agg ctt act caa959Asn Ser Asn Tyr Val Leu Asn Gly Phe Ser Gly Ala Arg Leu Thr Gln305 310 315act ttc cct aac atc ggt ggt ctt cct ggt act act act act cat gct1007Thr Phe Pro Asn Ile Gly Gly Leu Pro Gly Thr Thr Thr Thr His Ala320 325 330 335ctt ctt gct gct agg gtt aac tac tct ggt ggt gtt tct tct ggt gat1055Leu Leu Ala Ala Arg Val Asn Tyr Ser Gly Gly Val Ser Ser Gly Asp340 345 350atc ggt gct gtt ttc aac cag aac ttc tct tgc tct act ttc ctt cct1103Ile Gly Ala Val Phe Asn Gln Asn Phe Ser Cys Ser Thr Phe Leu Pro355 360 365cct ctt ctt act cct ttc gtt agg tct tgg ctt gat tct ggt tct gat1151Pro Leu Leu Thr Pro Phe Val Arg Ser Trp Leu Asp Ser Gly Ser Asp370 375 380agg ggt ggt gtt aac act gtt act aac tgg caa act gag tct ttc gag1199Arg Gly Gly Val Asn Thr Val Thr Asn Trp Gln Thr Glu Ser Phe Glu385 390 395tct act ctt ggt ctt agg tgc ggt gct ttc act gct agg ggt aac tct1247Ser Thr Leu Gly Leu Arg Cys Gly Ala Phe Thr Ala Arg Gly Asn Ser400 405 410 415aac tac ttc cct gat tac ttc att agg aac att tct ggt gtt cct ctt1295Asn Tyr Phe Pro Asp Tyr Phe Ile Arg Asn Ile Ser Gly Val Pro Leu420 425 430gtt gtt agg aac gag gat ctt agg agg cct ctt cat tac aac gag att1343Val Val Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Glu Ile435 440 445agg aac att gag tct cct tct ggt act cct ggt ggt ctt agg gct tac1391Arg Asn Ile Glu Ser Pro Ser Gly Thr Pro Gly Gly Leu Arg Ala Tyr450 455 460atg gtt tct gtt cat aac agg aag aac aac atc tac gct gtt cat gag1439Met Val Ser Val His Asn Arg Lys Asn Asn Ile Tyr Ala Val His Glu465 470 475aac ggt act atg att cat ctt gct cct gag gat tac acc ggt ttc acc1487Asn Gly Thr Met Ile His Leu Ala Pro Glu Asp Tyr Thr Gly Phe Thr480 485 490 495atc tcc ccc atc cac gcc acc cag gtc aat aat cag acc agg acc ttc1535Ile Ser Pro Ile His Ala Thr Gln Val Asn Asn Gln Thr Arg Thr Phe500 505 510atc tcc gag aag ttc ggc aac cag ggc gac tcc ctg agg ttc gag cag1583Ile Ser Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln515 520 525tcc aac acc acc gcc agg tac acc ctg agg ggc aac ggc aac tcc tac1631Ser Asn Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr530 535 540aac ctg tac ctc agg gtg tcc tcc ctc ggc aac tcc acc atc agg gtc1679Asn Leu Tyr Leu Arg Val Ser Ser Leu Gly Asn Ser Thr Ile Arg Val545 550 555acc atc aac ggc agg gtg tac acc gcc tcc aac gtg aac acc acc acc1727Thr Ile Asn Gly Arg Val Tyr Thr Ala Ser Asn Val Asn Thr Thr Thr560 565 570 575aac aac gac ggc gtc aac gac aac ggc gct agg ttc ctg gac atc aac1775Asn Asn Asp Gly Val Asn Asp Asn Gly Ala Arg Phe Leu Asp Ile Asn580 585 590atg ggc aac gtc gtg gcc tcc gac aac acc aac gtg ccc ctg gac atc1823Met Gly Asn Val Val Ala Ser Asp Asn Thr Asn Val Pro Leu Asp Ile595 600 605aac gtg aca ttt aac tcc ggc acc cag ttc gag ctg atg aac atc atg1871Asn Val Thr Phe Asn Ser Gly Thr Gln Phe Glu Leu Met Asn Ile Met610 615 620ttc gtg cca act aac ctc cca ccc atc tac tgagctagc 1910Phe Val Pro Thr Asn Leu Pro Pro Ile Tyr625 630<210>8<211>633<212>PRT<213>人工序列<400>8Met Ala Asn Asn Val Leu Asn Asn Gly Arg Thr Thr Ile Cys Asp Ala1 5 10 15Tyr Asn Val Val Ala His Asp Pro Phe Ser Phe Glu His Lys Ser Leu20 25 30Asp Thr Ile Arg Lys Glu Trp Met Glu Trp Lys Arg Thr Asp His Ser35 40 45Leu Tyr Val Ala Pro Ile Val Gly Thr Val Ser Ser Phe Leu Leu Lys50 55 60Lys Val Gly Ser Leu Ile Gly Lys Arg Ile Leu Ser Glu Leu Trp Gly65 70 75 80Leu Ile Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp Ile Leu Arg85 90 95Glu Thr Glu Gln Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala100 105 110Arg Val Asn Ala Glu Leu Glu Gly Leu Gln Ala Asn Ile Arg Glu Phe115 120 125Asn Gln Gln Val Asp Asn Phe Leu Asn Pro Thr Gln Asn Pro Val Pro130 135 140Leu Ser Ile Thr Ser Ser Val Asn Thr Met Gln Gln Leu Phe Leu Asn145 150 155 160Arg Leu Pro Gln Phe Arg Val Gln Gly Tyr Gln Leu Leu Leu Leu Pro165 170 175Leu Phe Ala Gln Ala Ala Asn Met His Leu Ser Phe Ile Arg Asp Val180 185 190Val Leu Asn Ala Asp Glu Trp Gly Ile Ser Ala Ala Thr Leu Arg Thr195 200 205Tyr Gln Asn Tyr Leu Lys Asn Tyr Thr Thr Glu Tyr Ser Asn Tyr Cys210 215 220Ile Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Thr Arg Leu His225 230 235 240Asp Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Phe Glu Tyr245 250 255Val Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser Ser260 265 270Gly Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln Ser275 280 285Phe Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Val Asn290 295 300Ser Asn Tyr Val Leu Asn Gly Phe Ser Gly Ala Arg Leu Thr Gln Thr305 310 315 320Phe Pro Asn Ile Gly Gly Leu Pro Gly Thr Thr Thr Thr His Ala Leu325 330 335Leu Ala Ala Arg Val Asn Tyr Ser Gly Gly Val Ser Ser Gly Asp Ile340 345 350Gly Ala Val Phe Asn Gln Asn Phe Ser Cys Ser Thr Phe Leu Pro Pro355 360 365Leu Leu Thr Pro Phe Val Arg Ser Trp Leu Asp Ser Gly Ser Asp Arg370 375 380Gly Gly Val Asn Thr Val Thr Asn Trp Gln Thr Glu Ser Phe Glu Ser385 390 395 400Thr Leu Gly Leu Arg Cys Gly Ala Phe Thr Ala Arg Gly Asn Ser Asn405 410 415Tyr Phe Pro Asp Tyr Phe Ile Arg Asn Ile Ser Gly Val Pro Leu Val420 425 430Val Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Glu Ile Arg435 440 445Asn Ile Glu Ser Pro Ser Gly Thr Pro Gly Gly Leu Arg Ala Tyr Met450 455 460Val Ser Val His Asn Arg Lys Asn Asn Ile Tyr Ala Val His Glu Asn465 470 475 480Gly Thr Met Ile His Leu Ala Pro Glu Asp Tyr Thr Gly Phe Thr Ile485 490 495Ser Pro Ile His Ala Thr Gln Val Asn Asn Gln Thr Arg Thr Phe Ile500 505 510Ser Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln Ser515 520 525Asn Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr Asn530 535 540Leu Tyr Leu Arg Val Ser Ser Leu Gly Asn Ser Thr Ile Arg Val Thr545 550 555 560Ile Asn Gly Arg Val Tyr Thr Ala Ser Asn Val Asn Thr Thr Thr Asn565 570 575Asn Asp Gly Val Asn Asp Asn Gly Ala Arg Phe Leu Asp Ile Asn Met580 585 590Gly Asn Val Val Ala Ser Asp Asn Thr Asn Val Pro Leu Asp Ile Asn595 600 605Val Thr Phe Asn Ser Gly Thr Gln Phe Glu Leu Met Asn Ile Met Phe610 615 620Val Pro Thr Asn Leu Pro Pro Ile Tyr625 630<210>9<211>1910<212>DNA<213>人工序列<220><223>用于在玉米中表达的人工cry2Ae DNA序列<400>9ccatggctaa caacgtgctg aacaacggca ggaccaccat ctgcgatgca tacaacgtgg60tggcccacga cccattcagc ttcgagcaca agagcctgga caccatccgc aaggagtgga120tggagtggaa gcgcaccgac cacagcctgt acgtggcccc tatcgtgggc accgtgagca180gcttcctgct gaagaaggtg ggcagcctga tcggcaagag gatcctgagc gagctgtggg240gcctgatctt cccaagcggc agcaccaacc tgatgcagga catcctgagg gagaccgagc300agttcctgaa ccagcgcctg aacaccgaca ccctggctcg cgtgaacgcc gagctggagg360gcctccaggc caacatcagg gaattcaacc agcaggtgga caacttcctg aacccaaccc420agaacccagt gccactgagc atcaccagca gcgtgaacac catgcagcag ctgttcctga480accgcctgcc acagttccgc gtgcagggct accagctgct gctgctgcca ctgttcgccc540aggctgccaa catgcaccta agcttcatcc gcgacgtggt gctgaacgcc gacgagtggg600gcatcagcgc tgccaccctg cgcacctacc agaactacct gaagaactac accaccgagt660acagcaacta ctgcatcaac acctaccaga ccgccttcag gggcctgaac accaggctgc720acgacatgct ggagttccgc acctacatgt tcctgaacgt gttcgagtac gtgagcatct780ggagcctgtt caagtaccag agcctgctgg tgagcagcgg tgccaacctg tacgccagcg840gcagcggtcc acagcagacc cagagcttca ccagccagga ctggcccttc ctgtacagcc900tgttccaggt gaacagcaac tacgtgctga acggcttcag cggtgccagg ctgacccaga960ccttcccaaa catcggaggc ctgccaggca ccaccaccac ccacgccctg ctggctgcca1020gggtgaacta cagcggtggc gtgagcagcg gcgatatcgg cgctgtgttc aaccagaact1080tcagctgcag caccttcctg ccaccactgc tgaccccatt cgtgcgcagc tggctggaca1140gcggcagcga caggggtggc gtgaacaccg tgaccaactg gcagaccgag agcttcgaga1200gcaccctggg cctgcgctgc ggtgccttca ccgccagggg caacagcaac tacttcccag1260actacttcat ccgcaacatc agcggcgtgc cactggtggt gcgcaacgag gacctgcgca1320ggccactgca ctacaacgag atccgcaaca tcgagagccc aagcggcacc ccaggaggcc1380tgagggccta catggtgagc gtgcacaacc gcaagaacaa catctacgcc gtgcacgaga1440acggcaccat gatccacctg gccccagagg actacaccgg tttcaccatc tcccccatcc1500acgccaccca ggtcaataat cagaccagga ccttcatctc cgagaagttc ggcaaccagg1560gcgactccct gaggttcgag cagtccaaca ccaccgccag gtacaccctg aggggcaacg1620gcaactccta caacctgtac ctcagggtgt cctccctcgg caactccacc atcagggtca1680ccatcaacgg cagggtgtac accgcctcca acgtgaacac caccaccaac aacgacggcg1740tcaacgacaa cggcgctagg ttcctggaca tcaacatggg caacgtcgtg gcctccgaca1800acaccaacgt gcccctggac atcaacgtga catttaactc cggcacccag ttcgagctga1860tgaacatcat gttcgtgcca actaacctcc cacccatcta ctgagctagc 1910
权利要求
1.编码杀昆虫Cry2Ae蛋白质的核酸序列,其中,所述杀昆虫Cry2Ae蛋白质包含选自下面的氨基酸序列a)保藏在BCCM-LMBP、保藏号为LMBP 4248的cry2Ae基因编码的蛋白质或其杀昆虫部分的氨基酸序列,b)SEQ ID No.2的蛋白质或其杀昆虫部分的氨基酸序列,c)SEQ ID No.2的蛋白质中氨基酸位置1到氨基酸位置625的氨基酸序列,和d)在严格杂交条件下可以与保藏在BCCM-LMBP保藏号为LMBP 4248的cry2Ae编码序列杂交的DNA所编码的杀昆虫蛋白质的氨基酸序列,所述DNA与SEQ ID No.1的编码序列有至少93%,尤其是至少98%,优选至少99%的序列同一性。
2.编码蛋白质的核酸序列,其中,所述蛋白质包含选自下面的氨基酸序列a)保藏在BCCM-LMBP、保藏号为LMBP 4247的cry2Af基因编码的蛋白质或其杀昆虫部分的氨基酸序列,b)SEQ ID No.4的蛋白质或其杀昆虫片段的氨基酸序列,c)SEQ ID No.4中氨基酸位置1到氨基酸位置625的氨基酸序列,和d)在严格杂交条件下可以与保藏在BCCM-LMBP保藏号为LMBP 4247的cry2Af编码序列杂交的DNA所编码的杀昆虫蛋白质的氨基酸序列,所述DNA与SEQ ID No.3的编码序列有至少95%,尤其是至少98%,优选至少99%的序列同一性。
3.编码蛋白质的核酸序列,其中,所述蛋白质包含选自下面的氨基酸序列a)保藏在BCCM-LMBP、保藏号为LMBP 4249的cry2Ag基因编码的蛋白质或其杀昆虫部分的氨基酸序列,b)SEQ ID No.6的蛋白质或其杀昆虫片段的氨基酸序列,c)SEQ ID No.6的蛋白质中氨基酸位置1到氨基酸位置620的氨基酸序列,和d)在严格杂交条件下可以与保藏在BCCM-LMBP保藏号为LMBP 4249的cry2Ag编码序列杂交的DNA所编码的杀昆虫蛋白质的氨基酸序列,所述DNA与SEQ ID No.5的编码序列有至少95%,尤其是至少98%,优选至少99%的序列同一性。
4.如权利要求1至3任一项所述的核酸序列,其中所述核酸序列是DNA。
5.如权利要求4所述的核酸序列,其包含与天然存在的DNA序列相比,有不同密码子使用但是编码相同蛋白质或其杀昆虫片段的人工DNA序列。
6.如权利要求5所述的核酸序列,其是SEQ ID No.7或9的DNA序列。
7.蛋白质,其包含选自下面的氨基酸序列a)保藏在BCCM-LMBP、保藏号为LMBP 4248的cry2Ae基因编码的蛋白质或其杀昆虫部分的氨基酸序列,b)SEQ ID No.2的蛋白质或其杀昆虫部分的氨基酸序列,c)包含SEQ ID No.2中氨基酸位置1到氨基酸位置625的氨基酸的氨基酸序列,或d)在严格杂交条件下可以与保藏在BCCM-LMBP保藏号为LMBP4248的cry2Ae编码序列杂交的DNA所编码的杀昆虫蛋白质的氨基酸序列,其中所述杀昆虫蛋白质与SEQ ID No.2的蛋白质有至少92%,尤其是至少98%,优选至少99%的序列同一性。
8.蛋白质,其包含选自下面的氨基酸序列a)保藏在BCCM-LMBP、保藏号为LMBP 4247的cry2Af基因编码的蛋白质的氨基酸序列,b)SEQID No.4的蛋白质或其杀昆虫部分的氨基酸序列,c)包含SEQ ID No.4中氨基酸位置1到氨基酸位置625的氨基酸的氨基酸序列,或d)在严格杂交条件下可以与保藏在BCCM-LMBP保藏号为LMBP 4247的cry2Af编码序列杂交的DNA所编码的杀昆虫蛋白质的氨基酸序列,其中所述蛋白质与SEQ ID No.4的蛋白质有至少95%,尤其是至少98%,优选至少99%的序列同一性。
9.蛋白质,其包含选自下面的氨基酸序列a)保藏在BCCM-LMBP、保藏号为LMBP 4249的cry2Ag基因编码的蛋白质或其杀昆虫部分的氨基酸序列,b)SEQ ID No.6的蛋白质或其杀昆虫部分的氨基酸序列,c)SEQ IDNo.6的蛋白质中氨基酸位置1到氨基酸位置620的氨基酸序列,或d)在严格杂交条件下可以与保藏在BCCM-LMBP保藏号为LMBP 4249的cry2Ag编码序列杂交的DNA所编码的杀昆虫蛋白质的氨基酸序列,其中所述蛋白质与SEQ ID No.6的蛋白质有至少95%,尤其是至少98%,优选至少99%的序列同一性。
10.包含权利要求4的核酸序列的嵌合基因,其受植物可表达的启动子的控制。
11.包含权利要求5或6的核酸序列的嵌合基因,其受植物可表达的启动子的控制。
12.权利要求10的嵌合基因,其进一步包含编码用于靶向液泡、线粒体、叶绿体、质体或用于分泌的导向肽或转运肽的DNA序列。
13.权利要求11的嵌合基因,其进一步包含编码用于靶向液泡、线粒体、叶绿体、质体或用于分泌的导向肽或转运肽的DNA序列。
14.植物细胞、植物或种子,其通过转化而包含有权利要求10或12的嵌合基因。
15.植物细胞、植物或种子,其通过转化而包含有权利要求11或13的嵌合基因。
16.如权利要求14所述的植物细胞、植物或种子,其选自玉米、棉花、水稻、烟草、油籽油菜、芸苔属种、茄子、大豆、马铃薯、向日葵、番茄、甘蔗、茶、豆、烟草、草莓、苜蓿、黄瓜、西瓜、胡椒、燕麦、大麦、小麦、大丽花、唐菖蒲、菊花、甜菜、高梁、紫花苜蓿和花生。
17.如权利要求15所述的植物细胞、植物或种子,其选自玉米、棉花、水稻、烟草、油籽油菜、芸苔属种、茄子、大豆、马铃薯、向日葵、番茄、甘蔗、茶、豆、烟草、草莓、苜蓿、黄瓜、西瓜、胡椒、燕麦、大麦、小麦、大丽花、唐菖蒲、菊花、甜菜、高梁、紫花苜蓿和花生的植物细胞、植物或种子。
18.微生物,其通过转化而包含有权利要求1至6之任一项的核酸序列。
19.使植物抗昆虫的方法,其包括用权利要求10或11的嵌合基因转化植物细胞,以及从抗昆虫的该细胞再生转化的植物。
20.使植物抗昆虫的方法,其包括用权利要求12或13的嵌合基因转化植物细胞,以及从抗昆虫的该细胞再生转化的植物。
21.如权利要求19或20所述的方法,其中所述的昆虫选自烟芽夜蛾(Heliothis virescens),玉米穗虫(Helicoverpa zea),棉铃实夜蛾(Helicoverpa armigera),黎豆夜蛾(Anticarsia gemmatalis)和玉米螟(Ostrinia nubilalis),二化螟(Chilo suppressalis),Chilo partellus,一点螟(Scirpophaga incertulas),稻蛀茎夜蛾(Sesamia inferens),稻纵卷叶野螟(Cnaphalocrocis medinalis),Marasmia patnalis,Marasmiaexigua,Marasmia ruralis和Scirpophaga innotata。
22.权利要求7至9任一项所述的蛋白质在昆虫控制中的用途,所述昆虫选自烟芽夜蛾(Heliothis virescens),玉米穗虫(Helicoverpa zea),棉铃实夜蛾(Helicoverpa armigera),黎豆夜蛾(Anticarsia gemmatalis)和玉米螟(Ostrinia nubilalis),二化螟(Chilo suppressalis),Chilo partellus,一点螟(Scirpophaga incertulas),稻蛀茎夜蛾(Sesamia inferens),稻纵卷叶野螟(Cnaphalocrocis medinalis),Marasmia patnalis,Marasmiaexigua,Marasmia ruralis和Scirpophaga innotata。
全文摘要
本发明涉及来源于苏云金芽孢杆菌株系的杀昆虫化合物。提供了命名为Cry2Ae,Cry2Af,和Cry2Ag的蛋白质和其变异体,及编码这些蛋白质或其变异体的DNA序列。还提供了表达这些蛋白质的重组宿主,特别是植物细胞和植物。
文档编号C12N15/32GK1484702SQ02803567
公开日2004年3月24日 申请日期2002年1月8日 优先权日2001年1月9日
发明者G·阿尔诺, A·伯茨, S·瓦纳斯特, J·范里, S·范霍德特, G 阿尔诺, 伤固, 舻绿 申请人:拜尔生物科学公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1