具有广谱活性的杀昆虫多肽和其用途的制作方法

文档序号:12701137阅读:863来源:国知局

创建于2015年8月20日、大小为53千字节的文件名为“6059WOPCT_sequence_listing”的序列表以计算机可读形式与本说明书同时提交。该序列表是本说明书的一部分,并且全文以引用的方式并入本文。

技术领域

本公开涉及从新型苏云金芽孢杆菌(Bacillus thuringiensis)基因获得的天然存在的重组核酸,该新型苏云金芽孢杆菌基因编码以针对昆虫害虫的杀虫活性为特征的杀虫多肽。本发明的组合物和方法利用所公开的核酸及其编码的杀虫多肽来防治植物害虫。



背景技术:

昆虫害虫是造成全世界农作物损失的主要因素。例如,行军虫取食、黑地蚕损害或者欧洲玉米螟损害可对农业生产商造成经济上的破坏。单单是欧洲玉米螟侵袭非甜质玉米和甜玉米造成的昆虫害虫相关作物损失,一年的损害和防治费用就达大约十亿美元。

传统上,影响昆虫害虫群体的主要方法是施用广谱化学杀昆虫剂。但是,消费者和政府监管者都日益关注与合成化学杀虫剂的生产和使用相关的环境危害。由于这些关注,监管者禁止或者限制了一些危害比较大的杀虫剂的使用。因此,人们对于开发另外的杀虫剂有很大的兴趣。

使用微生物剂如真菌、细菌或者另一种昆虫对具有农业意义的昆虫害虫进行生物防治,可提供具有环境友好性和商业吸引力的合成化学杀虫剂替代方案。一般而言,生物杀虫剂的使用造成的污染和环境危害的风险较低,并且生物杀虫剂能提供比传统广谱化学杀昆虫剂的特征性靶特异性更高的靶特异性。另外,生物杀虫剂的生产成本往往较低,因此能提高众多作物的经济产量。

已知芽孢杆菌属(Bacillus)微生物的某些物种对于多种昆虫害虫具有杀虫活性,这些昆虫害虫包括鳞翅目(Lepidoptera)、双翅目(Diptera)、鞘翅目(Coleoptera)、半翅目(Hemiptera)等等。苏云金芽孢杆菌(Bacillus thuringiensis)(Bt)和日本金龟芽孢杆菌(Bacillus papilliae)是至今为止发现的最成功的生物防治剂的代表。幼虫芽孢杆菌(B.larvae)、缓病芽孢杆菌(B.lentimorbus)、球形芽孢杆菌(B.sphaericus)的菌株(Harwook编辑,(1989),Bacillus(普莱南出版社(Plenum Press)),306)和蜡状芽孢杆菌(B.cereus)的菌株(WO 96/10083)也被指出具有昆虫病原性。杀虫活性看起来集中在伴胞晶体蛋白包涵体中,但从芽孢杆菌的营养生长期也分离到杀虫蛋白。有数种编码这些杀虫蛋白的基因已得到分离和表征(参见例如美国专利No.5,366,892和No.5,840,868)。

微生物杀昆虫剂特别是那些从芽孢杆菌(Bacillus)菌株获得的微生物杀昆虫剂,在农业上作为害虫化学防治的替代方案已起到重要的作用。最近,农业科学家通过对作物进行遗传工程改造以产生来自芽孢杆菌的杀虫蛋白,开发出了抗虫性增强的作物。例如,已对玉米和棉花作物进行遗传工程改造以产生从Bt的菌株分离的杀虫蛋白(参见例如Aronson(2002)Cell Mol.Life Sci.59(3):417-425;Schnepf等人(1998)Microbiol Mol Biol Rev.62(3):775-806)。这些经遗传工程改造的作物目前在美国农业中广泛应用,给农场主提供了传统昆虫防治方法的环境友好的替代方案。另外,经遗传工程改造而含有杀虫Cry毒素的马铃薯已被出售给美国农场主。虽然这些经遗传工程改造的抗昆虫作物已证明在商业上十分成功,但它们仅对较窄范围的经济上重要的昆虫害虫具有抗性。

因此,仍然需要对昆虫害虫具有更大范围的杀昆虫活性的新Bt毒素,例如对更多种类的鳞翅目昆虫具有活性的毒素。另外,仍然需要对多种昆虫害虫具有活性的生物杀虫剂和需要具有改善的杀昆虫活性的生物杀虫剂。



技术实现要素:

本发明提供用于影响昆虫害虫的组合物和方法。更具体而言,本发明的实施方案涉及利用编码杀昆虫肽的核苷酸序列来产生表达本发明实施方案的杀昆虫多肽的转化微生物和植物从而影响昆虫的方法。在一些实施方案中,所述核苷酸序列编码对至少一种属于鳞翅目的昆虫具有杀虫作用的多肽。

本发明实施方案提供编码对昆虫害虫具有杀虫活性的多肽的核酸分子及其片段和变体(例如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9)。获自Bt的本发明实施方案的野生型(例如天然存在的)核苷酸序列编码新型杀昆虫肽。本发明实施方案还提供编码生物活性(例如杀昆虫)多肽的所公开的核苷酸序列的片段和变体。

本发明实施方案还提供由本发明实施方案的天然存在的或经修饰的(例如经诱变或经操纵的)核酸所编码的分离的杀虫(例如杀昆虫)多肽。具体举例,本发明实施方案的杀虫蛋白包括从经诱变的核酸产生的全长蛋白质和多肽的片段,所述经诱变的核酸被设计用来将特定氨基酸序列引入本发明实施方案的多肽中。在特定实施方案中,所述多肽相对于衍生出它们的天然存在的多肽的活性具有增强的杀虫活性。

本发明实施方案的核酸也可用于产生转基因的(例如转化的)单子叶植物或双子叶植物,所述植物的特征在于其基因组包含至少一个被稳定掺入的核苷酸构建体,所述核苷酸构建体包含可操作地连接至驱动所编码的杀虫多肽表达的启动子的本发明实施方案的编码序列。因此,本发明还提供转化的植物细胞、植物组织、植物及其种子。

在一个特定实施方案中,可使用已被优化以使在宿主植物中的表达提高的核酸来产生转化植物。例如,可将本发明实施方案的杀虫多肽之一进行反翻译,以产生包含为了在特定宿主中表达而优化的密码子的核酸,所述宿主例如是作物如玉米(Zea mays)植物。这种转化的植物(例如双子叶植物或者单子叶植物)表达编码序列将导致产生杀虫多肽并向植物赋予提高的抗虫性。一些实施方案提供表达在用于影响各种昆虫害虫的方法中使用的杀虫多肽的转基因植物。

本发明实施方案还包括含有本发明实施方案的杀昆虫多肽的杀虫或杀昆虫组合物,并可任选包含另外的杀昆虫肽。本发明实施方案涵盖将这种组合物应用于昆虫害虫的环境以便影响昆虫害虫。

具体实施方式

本发明的实施方案涉及用于影响昆虫害虫尤其是植物害虫的组合物和方法。更具体而言,本发明实施方案的分离核酸及其片段和变体包含编码杀虫多肽(例如蛋白质)的核苷酸序列。所公开的杀虫蛋白对昆虫害虫具有生物活性(例如杀虫活性),所述昆虫害虫例如但不限于鳞翅目的昆虫害虫。

本发明实施方案的组合物包含编码杀虫多肽的分离核酸及其片段和变体、包含本发明实施方案的核苷酸序列的表达盒、分离的杀虫蛋白以及杀虫组合物。一些实施方案提供对鳞翅目昆虫的杀昆虫活性相对于相应的野生型蛋白的杀虫活性得到改善的经修饰杀虫多肽。本发明实施方案还提供用这些新型核酸转化的植物和微生物,以及涉及将这种核酸、杀虫组合物、转化的生物体及其产物用于影响昆虫害虫的方法。

本发明实施方案的核酸和核苷酸序列可用于转化任何生物体以产生所编码的杀虫蛋白。本发明提供涉及使用这种转化的生物体来影响或防治植物害虫的方法。本发明实施方案的核酸和核苷酸序列也可用于转化细胞器如叶绿体(McBride等人,(1995)Biotechnology 13:362-365;和Kota等人,(1999)Proc.Natl.Acad.Sci.USA 96:1840-1845)。

本发明实施方案还涉及对编码生物活性杀虫蛋白的天然存在的编码序列的片段和变体的鉴定。本发明实施方案的核苷酸序列可在用于影响害虫特别是昆虫害虫(如鳞翅目害虫)的方法中直接使用。因此,本发明实施方案提供不依赖使用传统的合成化学杀昆虫剂而影响昆虫害虫的新方法。本发明实施方案涉及对天然存在的可生物降解的杀虫剂及编码它们的基因的发现。

本发明实施方案还提供天然存在的编码序列的片段和变体,所述天然存在的编码序列也编码生物活性(例如杀虫)多肽。本发明实施方案的核酸涵盖已被优化以便由特定生物体的细胞表达的核酸或者核苷酸序列,例如已使用基于具有增强的杀虫活性的多肽的氨基酸序列的植物优选的密码子进行了反翻译(即逆翻译)的核酸序列。本发明实施方案还提供赋予本发明实施方案的多肽改善的或改变的性质的突变。参见例如美国专利7,462,760。

在下面的描述中,以广义方式使用到多个术语。提供了以下定义以便理解本发明实施方案。

单位、前缀和符号可以以其国际单位制(SI)接受的形式表示。除非另有规定,否则核酸以5′至3′的取向从左向右书写;相应地,氨基酸序列以氨基到羧基的取向从左向右书写。数值范围包括限定该范围的数字。氨基酸在本文中可通过它们通常知道的三字母符号表示或通过IUPAC-IUB生化命名委员会(IUPAC-IUB Biochemical Nomenclature Commission)推荐的单字母符号表示。同样,核苷酸可通过它们通常接受的单字母密码表示。以上定义的术语通过参考本说明书整体而得到更完全的定义。

本文所用的“核酸”包括指单链或双链形式的脱氧核糖核苷酸或核糖核苷酸聚合物,并且除非另外限制,否则涵盖在以下方面具有天然核苷酸的基本性质的已知类似物(例如肽核酸):其以与天然存在的核苷酸相似的方式杂交至单链核酸。

本文所用的术语“编码”或“所编码的”在指定的核酸的语境中使用时,意指该核酸包含指导核苷酸序列翻译成指定蛋白质所必需的信息。据以编码蛋白质的信息是通过使用密码子来确定的。编码蛋白的核酸可以包含在该核酸的翻译区内的非翻译序列(例如内含子)或可以缺少这种居间的非翻译序列(例如,如在cDNA中)。

本文所用的指涉指定的多核苷酸或其所编码的蛋白质的“全长序列”,意指具有天然的(非合成的)内源序列的整个核酸序列或者整个氨基酸序列。全长多核苷酸编码指定蛋白质的全长催化活性形式。

本文所用的术语“反义”在核苷酸序列的取向的语境中使用时,指双链多核苷酸序列以反义链得以转录的取向可操作地连接至启动子。反义链与内源转录产物充分互补,使得内源转录产物的翻译常常被抑制。因此,在术语“反义”在特定核苷酸序列的语境中使用的情形中,这个术语指该参考转录产物的互补链。

术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,指氨基酸残基的聚合物。这些术语适用于其中一个或多个氨基酸残基为相应的天然存在的氨基酸的人工化学类似物的氨基酸聚合物,并且适用于天然存在的氨基酸聚合物。

术语“残基”或“氨基酸残基”或“氨基酸”在本文中可互换使用,指掺入蛋白质、多肽或肽(统称“蛋白质”)中的氨基酸。该氨基酸可以是天然存在的氨基酸,并且除非另外进行限制,否则可涵盖可以以与天然存在的氨基酸类似的方式发挥功能的天然氨基酸的已知类似物。

本发明实施方案的多肽可以由本文公开的核酸产生,或者通过使用标准分子生物学技术产生。例如,本发明实施方案的蛋白质可通过在适当的宿主细胞中表达本发明实施方案的重组核酸来产生,或者作为另一种选择,通过离体(ex vivo)程序的组合来产生。

本文所用的术语“分离的”和“纯化的”可互换使用,指这样的核酸或多肽或它们的生物活性部分:实质上或基本上不含通常在其天然存在的环境中存在的与该核酸或多肽相伴或者相互作用的组分。因此,分离的或纯化的核酸或多肽,当通过重组技术产生时实质上不含其它细胞物质或培养基,或者当通过化学法合成时实质上不含化学前体或其它化学品。

“分离的”核酸通常不含在该核酸的来源生物体的基因组DNA中天然位于该核酸的旁侧的序列(即位于该核酸的5′和3′末端的序列)(例如蛋白质编码序列)。例如,在各个实施方案中,分离的核酸可含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在该核酸的来源细胞的基因组DNA中天然位于该核酸的旁侧的核苷酸序列。

本文所用的术语“分离的”或者“纯化的”在用来指本发明实施方案的多肽时,意指该分离的蛋白质实质上不含细胞物质,并且包括具有小于约30%、20%、10%或5%(以干重计)的污染性蛋白质的蛋白质制剂。当本发明实施方案的蛋白质或其生物活性部分用重组法生产时,培养基代表少于约30%、20%、10%或5%(以干重计)的化学前体或者非目的蛋白质的化学品。

“重组的”核酸分子(或DNA)在本文用来指处于重组细菌或植物宿主细胞中的核酸序列(或DNA)。在一些实施方案中,“分离的”或“重组的”核酸不含在该核酸的来源生物体的基因组DNA中天然位于该核酸旁侧的序列(即位于该核酸的5′和3′端的序列)(优选蛋白质编码序列)。出于本发明的目的,“分离的”或“重组的”在用来指核酸分子时排除分离的染色体。

如本文所用,“非基因组核酸序列”或“非基因组核酸分子”是指与天然或基因组核酸序列相比在核酸序列中具有一个或多个改变的核酸分子。在一些实施方案中,天然或基因组核酸分子的改变包括但不限于:因遗传密码的简并性而导致的核酸序列的改变;为在植物中表达而对核酸序列进行的密码子优化;与天然或基因组序列相比,为了引入至少一个氨基酸置换、插入、缺失和/或添加而发生的核酸序列中的改变;一个或多个与基因组核酸序列相关联的内含子的移除;一个或多个异源内含子的插入;一个或多个与基因组核酸序列相关联的上游或下游调控区的缺失;一个或多个异源上游或下游调控区的插入;与基因组核酸序列相关联的5′和/或3′非翻译区的缺失;异源5′和/或3′非翻译区的插入;以及多聚腺苷酸化位点的修饰。在一些实施方案中,所述非基因组核酸分子是cDNA。在一些实施方案中,所述非基因组核酸分子是合成核酸序列。

在本说明书通篇中,词语“包含”及其语法变体应被理解为暗示包括规定的元件、整数或步骤或者元件组、整数组或步骤组,但不排除任何其它元件、整数或步骤或者元件组、整数组或步骤组。

本文所用的术语“影响昆虫害虫”指在昆虫发育的任何阶段引起昆虫取食、生长和/或行为方面的变化,包括但不限于:杀死昆虫;延迟生长;阻碍繁殖能力;拒食活性等。

本文所用的术语“杀虫活性”和“杀昆虫活性”同义地用来指某生物体或物质(例如蛋白质)的可以通过害虫在取食和暴露达适宜时间长度后害虫死亡率、害虫体重减轻、害虫排斥性和害虫的其它行为和身体变化(但不限于通过这些方面)进行测量的活性。因此,具有杀虫活性的生物体或物质不利地影响害虫适合度的至少一个可测量参数。例如,“杀虫蛋白”是本身或与其它蛋白质组合表现杀虫活性的蛋白质。

如本文所用,术语“杀虫有效量”意指某物质或者生物体的当在害虫的环境中存在时具有杀虫活性的量。对于每种物质或者生物体,杀虫有效量是针对在指定环境中受影响的每种害虫凭经验确定。类似地,当害虫是昆虫害虫时,“杀昆虫有效量”可用来指“杀虫有效量”。

本文所用的术语“重组工程改造的”或“工程改造的”意指基于对蛋白质作用机制的了解和对被引入、缺失或置换的氨基酸的考虑,利用重组DNA技术在蛋白质结构中引入(例如工程改造出)变化。

本文所用的术语“突变核苷酸序列”或“突变”或“经诱变的核苷酸序列”意指这样的核苷酸序列,其已被诱变或变更以含有一个或多个在相应的野生型序列中不存在的核苷酸残基(例如碱基对)。这种诱变或变更由核酸残基的一个或多个添加、缺失或置换或替代所组成。当突变是通过添加、移除或替代蛋白水解位点的氨基酸作出时,这个添加、移除或替代可在蛋白水解位点基序内或靠近蛋白水解位点基序,只要达到突变的目的(即,只要该位点处的蛋白水解被改变)。

突变核苷酸序列可编码表现出改善的或降低的杀昆虫活性的突变杀昆虫毒素,或者编码这样的氨基酸序列,该氨基酸序列能赋予含有它的多肽的改善的或降低的杀昆虫活性。本文所用的术语“突变体”或“突变”在蛋白质、多肽或氨基酸序列的语境中是指这样的序列,其已被诱变或变更以含有一个或多个在相应的野生型序列中不存在的氨基酸残基。这种诱变或变更由氨基酸残基的一个或多个添加、缺失或置换或替代所组成。突变多肽表现出改善的或降低的杀昆虫活性,或者代表这样的氨基酸序列,该氨基酸序列能赋予含有它的多肽改善的杀昆虫活性。因此,术语“突变体”或“突变”指突变核苷酸序列和所编码的氨基酸中的任一者或二者。突变体可单独使用,或者可与本发明实施方案的其它突变体或者与其它突变体以任何相容的组合进行使用。“突变多肽”可相反地表现出杀昆虫活性的降低。在不止一个突变被添加到特定核酸或蛋白质的情形中,所述突变可同时添加或依序添加;如果是依序添加,所述突变可以按任何合适的顺序添加。

本文所用的术语“改善的杀昆虫活性”或“改善的杀虫活性”指本发明实施方案的杀昆虫多肽相对于其相应的野生型蛋白质的活性具有增强的杀昆虫活性,和/或该杀昆虫多肽对更广范围的昆虫有效,和/或该杀昆虫多肽对不易受野生型蛋白的毒性影响的昆虫具有特异性。改善的或增强的杀虫活性的发现,要求证明相对于野生型杀昆虫多肽的针对同一昆虫测定的杀虫活性而言,对该昆虫靶标的杀虫活性提高至少10%,或至少20%、25%、30%、35%、40%、45%、50%、60%、70%、100%、150%、200%或300%或更高的杀虫活性的提高。

例如,如果相对于受野生型Bt毒素影响的昆虫范围而言,受该多肽影响的昆虫范围更广或更窄,则就提供了改善的杀虫或杀昆虫活性。在需要多用途性的情况下,更宽的影响范围可能是合乎需要的,而在例如有益昆虫可能反而会被该毒素的使用或存在影响的情况下,更窄的影响范围可能是合乎需要的。虽然本发明实施方案不受任何具体作用机制的约束,但也可通过多肽的一个或多个特性的改变而提供改善的杀虫活性;例如,多肽在昆虫肠道中的稳定性或寿命可相对于相应的野生型蛋白质的稳定性或寿命得到提高。

本文所用的术语“毒素”指表现出杀虫活性或杀昆虫活性或改善的杀虫活性或改善的杀昆虫活性的多肽。“Bt”或“苏云金芽孢杆菌”毒素旨在包括苏云金芽孢杆菌各个菌株中存在的较广类别的Cry毒素,包括诸如Cryls、Cry2s、或Cry3s之类的毒素在内。

术语“蛋白水解位点”或者“切割位点”指这样的氨基酸序列,其赋予对一类蛋白酶或某种特定蛋白酶的敏感性,使得含有该氨基酸序列的多肽被该类蛋白酶或该特定蛋白酶消化。蛋白水解位点据称对能识别该位点的蛋白酶“敏感”。本领域认识到,消化的效率会不同,而消化效率的降低可导致多肽在昆虫肠道中的稳定性或寿命提高。因此,蛋白水解位点可赋予对不止一种蛋白酶或一类蛋白酶的敏感性,但各种蛋白酶在该位点处的消化效率可不同。蛋白水解位点包括例如胰蛋白酶位点、胰凝乳蛋白酶位点和弹性蛋白酶位点。

研究已证实,鳞翅目的昆虫肠道蛋白酶包括胰蛋白酶类、胰凝乳蛋白酶类和弹性蛋白酶类。参见例如Lenz等人,(1991)Arch.Insect Biochem.Physiol.16:201-212;以及Hedegus等人,(2003)Arch.Insect Biochem.Physiol.53:30-47。例如,在棉铃虫(Helicoverpa armigera)幼虫的中肠中发现了大约18种不同的胰蛋白酶类(参见Gatehouse等人,(1997)Insect Biochem.Mol.Biol.27:929-944)。已研究了这些蛋白酶优选的蛋白水解底物位点。参见例如Peterson等人,(1995)Insect Biochem.Mol.Biol.25:765-774。

已试图了解Bt毒素的作用机制和对毒素进行工程改造使其具有改善的性质。已证实昆虫肠道蛋白酶可影响Bt Cry蛋白对昆虫的影响。一些蛋白酶会通过将Cry蛋白从“原毒素”形式加工成毒性形式或“毒素”而将它们活化。参见Oppert(1999)Arch.Insect Biochem.Phys.42:1-12;以及Carroll等人,(1997)J.Invertebrate Pathology 70:41-49。毒素的这种活化可包括从蛋白质移除N末端肽和C末端肽,也可包括蛋白质的内部切割。其它蛋白酶可降解Cry蛋白。参见Oppert(出处同上)。

对具有不同特异性的Cry毒素的氨基酸序列的比较揭示出五个高度保守的序列块。在结构上,毒素包含三个不同的结构域,其从N末端到C末端为:参与孔形成的一簇七个α螺旋(称为“结构域1”)、参与细胞结合的三个反平行β片层(称为“结构域2”)和β夹层(beta sandwich)(称为“结构域3”)。这些结构域的位置和性质是本领域技术人员已知的。参见例如Li等人,(1991)Nature,305:815-821和Morse等人,(2001)Structure,9:409-417。当指涉特定结构域如结构域1时,应当理解,该结构域相对于特定序列的确切终点并不关键,只要该序列或其部分包括能提供至少某种归因于该特定结构域的功能的序列。因此,例如,当指涉“结构域1”时,意指特定序列包括一簇七个α螺旋,但就该簇而言所使用的或所指的序列的确切终点并不关键。本领域技术人员熟悉这种终点的确定和这类功能的评价。

为更好地表征和改善Bt毒素,研究了细菌Bt的各种菌株。发现从Bt菌株的培养物制备的晶体制品具有针对多种鳞翅目害虫的杀虫活性(参见例如实验实施例1)。已作出努力以从选定的菌株鉴定编码晶体蛋白的核苷酸序列,并且从这些细菌菌株分离出了本发明实施方案的野生型(即天然存在的)核酸,将其克隆进表达载体中并转化进大肠杆菌中。认识到,取决于给定的制品的特性,有时需要进行胰蛋白酶预处理以活化杀虫蛋白才能展示出杀虫活性。因此,应当理解,一些杀虫蛋白需要蛋白酶消化(例如通过胰蛋白酶、胰凝乳蛋白酶等)进行活化,而其它蛋白质不用进行活化就具有生物活性(例如杀虫活性)。

这种分子可通过例如美国专利7,462,760所描述的手段进行变更。另外,可对核酸序列进行工程改造以编码含有额外的突变的多肽,所述额外的突变相对于天然存在的多肽的杀虫活性赋予改善的或改变的杀虫活性。这种经工程改造的核酸的核苷酸序列包含野生型序列中不存在的突变。

本发明实施方案的突变多肽通常由包括以下步骤的过程制备:获得编码Cry家族多肽的核酸序列;基于考虑所提出的靶结构域在该毒素作用模式中的功能,分析该多肽的结构,以鉴定用于对相应基因序列进行诱变的特定“靶”位点;向该核酸序列中引入一个或多个突变,以在所编码的多肽序列的一个或多个氨基酸残基中产生所需的变化;以及测定所产生的多肽的杀虫活性。

许多Bt杀昆虫毒素由于它们的氨基酸序列和三级结构的相似性而有不同程度的相关性,并且获得Bt毒素的晶体结构的手段是公知的。Cry3A和Cry3B多肽二者的示例性高分辨率晶体结构解析可在文献中获得。Cry3A基因的已解出的结构(Li等人,(1991)Nature 353:815-821)使人们把握了毒素的结构与功能之间的关系。将已发表的Bt毒素的结构分析与已报道的与特定结构、基序等相关联的功能结合起来考虑,发现该毒素的特定区域与该蛋白质的特定功能和作用模式各分立步骤相关。例如,许多分离自Bt的毒素通常被描述为包括三种结构域:参与孔形成的七螺旋束、参与受体结合的三片层结构域以及β夹层模体(Li等人,(1991)Nature 305:815-821)。

如美国专利No.7,105,332和7,462,760中报道,可通过靶向位于Cry蛋白的结构域1的α螺旋3和4之间的区域来改善该毒素的毒性。该理论以有关杀昆虫毒素的大量知识为前提,这些知识包括:1)已报道Cry3A毒素的结构域1的α螺旋4和5插入到易感昆虫的中肠的衬细胞的脂质双层中(Gazit等人,(1998)Proc.Natl.Acad.Sci.USA 95:12289-12294);2)本发明人知道野生型蛋白的氨基酸序列内胰蛋白酶和胰凝乳蛋白酶切割位点的位置;3)观察到在通过胰蛋白酶或胰凝乳蛋白酶处理进行体外活化后野生型蛋白对某些昆虫的活性更高;以及4)有报道说从3′端消化毒素导致对昆虫的毒性降低。

可在多个背景序列中产生和设置一系列突变,以产生具有增强的或改变的杀虫活性的新型多肽。参见例如美国专利7,462,760。这些突变体包括但不限于:在位于结构域1的螺旋3和4之间的区域中添加至少一个对蛋白酶更敏感的位点(例如胰蛋白酶切割位点);将野生型序列中的原始蛋白酶敏感位点用另一不同的蛋白酶敏感位点替代;在特定的位置中添加多个蛋白酶敏感位点;在蛋白酶敏感位点附近添加氨基酸残基以变更多肽的折叠从而增强多肽在该蛋白酶敏感位点处的消化;以及添加突变以保护多肽免遭会使毒性降低的降解性消化(例如作出一系列突变,其中野生型氨基酸被缬氨酸替代,以保护多肽免遭消化)。各突变可单独使用或以任何组合使用以提供本发明实施方案的多肽。

使用BLAST和PSI-BLAST在美国国家生物技术信息中心(NCBI)的非冗余数据库(nr)中通过相似性搜索鉴定出了同源序列。同源蛋白由主要来自苏云金芽孢杆菌(Bacillus thuringiensis)的Cry毒素构成。

作为额外的或备选的蛋白酶敏感位点的突变可对若干类蛋白酶敏感,如丝氨酸蛋白酶(其包括胰蛋白酶和胰凝乳蛋白酶)或诸如弹性蛋白酶之类的酶。因此,可设计作为额外的或备选的蛋白酶敏感位点的突变,使得该位点容易被一系列蛋白酶如哺乳动物蛋白酶或昆虫蛋白酶识别和/或切割。也可将蛋白酶敏感位点设计成被已知在某种生物体中产生的特定类别的酶或者特定的酶切割,例如玉米穗虫(Heliothis zea)产生的胰凝乳蛋白酶(Lenz等人,(1991)Arch.Insect Biochem.Physiol.16:201-212)。突变也可赋予对蛋白水解消化的抗性,例如对胰凝乳蛋白酶在该肽C末端处的消化的抗性。

在本发明实施方案的核酸所编码的多肽的氨基酸序列中存在额外和/或备选的蛋白酶敏感位点,可改善该所编码的多肽的杀虫活性和/或特异性。因此,可将本发明实施方案的核苷酸序列进行重组工程改造或操纵,以产生与未经修饰的野生型毒素相比具有改善的或改变的杀昆虫活性和/或特异性的多肽。另外,本文所公开的突变可被设置进其它核苷酸序列或者与其它核苷酸序列联用以提供改善的性质。例如,可将容易被昆虫胰凝乳蛋白酶(例如披肩粘虫或者玉米穗虫中存在的胰凝乳蛋白酶)切割的蛋白酶敏感位点(Hegedus等人,(2003)Arch.Insect Biochem.Physiol.53:30-47;以及Lenz等人,(1991)Arch.Insect Biochem.Physiol.16:201-212)置于Cry背景序列中,以提供对该序列的改善的毒性。这样,本发明实施方案提供具有改善性质的毒性多肽。

例如,经诱变的Cry核苷酸序列可构成包含额外密码子的额外突变体,所述额外密码子将第二胰蛋白酶敏感氨基酸序列(除天然存在的胰蛋白酶位点之外的)引入到所编码的多肽中。本发明实施方案的备选的添加突变体包含这样的额外密码子,其被设计用来将至少一个额外的不同蛋白酶敏感位点引入多肽中,例如紧邻天然存在的胰蛋白酶位点的5′或3′的胰凝乳蛋白酶敏感位点。作为另一种选择,可产生置换突变体,其中该核酸的编码天然存在的蛋白酶敏感位点的至少一个密码子被破坏,而备选的密码子被引入该核酸序列中以提供另一不同的(例如置换的)蛋白酶敏感位点。也可将替代突变体添加给Cry序列,其中所编码多肽中存在的天然存在的胰蛋白酶切割位点被破坏而在它的位置引入胰凝乳蛋白酶或者弹性蛋白酶切割位点。

已认识到,可使用编码作为蛋白水解位点或推定的蛋白水解位点的氨基酸序列(例如诸如RR或者LKM之类的序列)的任何核苷酸序列,并且用来将任何这些切割位点引入变体多肽中的密码子的确切种类可根据在特定植物物种中的使用(即表达)而变。还认识到,可将任何所公开的突变引入本发明实施方案的任何这样的多核苷酸序列中,所述多核苷酸序列包含提供作为修饰靶标的天然胰蛋白酶切割位点的氨基酸残基的密码子。因此,可将全长毒素或其片段的变体修饰成含有额外的或备选的切割位点,并且这些实施方案旨在被本文所公开的实施方案的范围所涵盖。

本领域技术人员将会认识到,可向本发明实施方案的序列加入任何有用的突变,只要所编码的多肽保持杀虫活性。因此,还可将序列进行突变,使得所编码的多肽对胰凝乳蛋白酶的蛋白水解消化具有抗性。可以以任何组合在特定位置中加入不止一个识别位点,并且可以给该毒素添加多个识别位点或从该毒素移除多个识别位点。因此,额外的突变可包含三个、四个或更多个识别位点。应当认识到,可在任何合适的多核苷酸序列中工程改造出多个突变;因此,全长序列或其片段都可被修饰成含有额外的或备选的切割位点以及修饰成能抵抗蛋白水解消化。这样,本发明实施方案提供含有能改善杀虫活性的突变的Cry毒素,以及用于使用其它Bt毒素影响害虫的改善的组合物和方法。

突变可保护多肽免遭蛋白酶降解,例如通过从不同区域移除推定的蛋白水解位点(如推定的丝氨酸蛋白酶位点和弹性蛋白酶识别位点)来保护。可移除或变更这些推定位点中的一些或全部,使得在原始位点位置处的蛋白水解降低。可通过将突变多肽与野生型毒素进行比较,或通过将在它们的氨基酸序列方面有差异的各个突变毒素进行比较,来评估蛋白水解的变化。推定的蛋白水解位点和蛋白水解位点包括但不限于以下序列:RR,为胰蛋白酶切割位点;LKM,为胰凝乳蛋白酶位点;以及胰蛋白酶位点。这些位点可通过添加或缺失任何数目和种类的氨基酸残基进行变更,只要多肽的杀虫活性得以提高。因而,由包含突变的核苷酸序列所编码的多肽相对于天然或背景序列,将包含至少一个氨基酸变化或添加,或者2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、32、35、38、40、45、47、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270或280个或更多个氨基酸变化或添加。也可通过截短天然的或全长的序列来改善多肽的杀虫活性,如本领域已知的。

本发明实施方案的组合物包括编码杀虫多肽的核酸及其片段和变体。具体而言,本发明实施方案提供包含编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8和SEQ ID NO:10所示氨基酸序列的核苷酸序列的分离核酸分子或者编码所述氨基酸序列的核苷酸序列,例如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7和SEQ ID NO:9所示的核苷酸序列,以及它们的片段和变体。

还值得关注的是编码本发明实施方案的杀虫蛋白的优化的核苷酸序列。本文所用的短语“优化的核苷酸序列”指经优化以在特定生物体例如植物中表达的核酸。可使用本领域已知的方法针对所关注的任何生物体制备优化的核苷酸序列。参见例如,美国专利No.7,462,760,该专利描述了编码所公开的杀虫蛋白的优化的核苷酸序列。在该示例中,核苷酸序列是这样制备的:将蛋白质的氨基酸序列进行反翻译,并改变核苷酸序列以包含玉蜀黍优选的密码子而仍编码同一氨基酸序列。Murray等人,(1989)Nucleic Acids Res.17:477-498对该程序作了更详细的描述。优化的核苷酸序列可用于提高杀虫蛋白在植物中的表达,所述植物为例如禾本科(Gramineae,Poaceae)的单子叶植物,例如玉蜀黍或玉米植物。

本发明实施方案还提供由本发明实施方案的天然存在的或经修饰的核酸编码的分离的杀虫(例如杀昆虫)多肽。更具体而言,本发明实施方案提供由本文所述核酸(例如SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7和SEQ ID NO:9所示的那些以及它们的片段和变体)编码的包含SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8和SEQ ID NO:10所示氨基酸序列的多肽。

在一些实施方案中,提供包含SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8和SEQ ID NO:10所示的氨基酸序列的多肽,以及它们的片段和变体。

在特定实施方案中,本发明实施方案的杀虫蛋白提供全长杀昆虫多肽、全长杀昆虫多肽的片段以及从被设计用来向本发明实施方案的多肽中引入特定氨基酸序列的由经诱变的核酸产生的变体多肽。在特定实施方案中,被引入多肽中的氨基酸序列包含提供酶(如蛋白酶)的切割位点的序列。

本领域知道,Bt毒素的杀虫活性通常是通过在昆虫肠道中由各种蛋白酶对该肽进行切割来活化。由于肽可能并不总是以十足的效率在昆虫肠道中被切割,因此全长毒素的片段与全长毒素本身相比可能具有增强的杀虫活性。因此,本发明实施方案的多肽中的一些包括全长杀昆虫多肽的片段,并且所述多肽片段、变体和突变中的一些相对于衍生出它们的天然存在的杀昆虫多肽的活性具有增强的杀虫活性,特别是如果该天然存在的杀昆虫多肽在进行活性筛选之前不用蛋白酶进行体外活化的话。因此,本申请涵盖所述序列的截短版本或片段。

可将突变设置于任何背景序列中,包括这种截短的多肽,只要该多肽保持杀虫活性。本领域技术人员使用本领域已知的或本文别处描述的测定法,可容易地比较两种或更多种蛋白质的杀虫活性。应当理解,本发明实施方案的多肽可通过表达本文公开的核酸来产生,或通过使用标准分子生物学技术来产生。

已经认识到,杀虫蛋白可以是低聚体,并且在分子量、残基数目、组成肽、针对特定害虫的活性以及其它特征方面会有不同。但是,通过本文给出的方法,可分离和表征对多种害虫具有活性的蛋白质。本发明实施方案的杀虫蛋白可与其它Bt毒素或其它杀昆虫蛋白组合使用,以增加昆虫靶标范围。此外,本发明实施方案的杀虫蛋白与其它Bt毒素或具有独特性质的其它杀昆虫原理组合使用,对于防止和/或管理昆虫抗性具有特别的实用性。其它杀昆虫剂包括蛋白酶抑制剂(丝氨酸类型和半胱氨酸类型二者)、α-淀粉酶和过氧化物酶。

核苷酸和氨基酸序列以及它们所编码的多肽的片段和变体也被本发明实施方案涵盖。本文所用的术语“片段”指本发明实施方案的多核苷酸的核苷酸序列的一部分或多肽的氨基酸序列的一部分。核苷酸序列的片段可编码保持天然的或相应的全长蛋白质的生物活性从而具有杀虫活性的蛋白质片段。因此,可公认本发明实施方案的多核苷酸和氨基酸序列中的一些可正确地称为片段和突变体二者。

应当理解,术语“片段”在用于指本发明实施方案的核酸序列时,也涵盖可用作杂交探针的序列。这类核苷酸序列通常不编码保持生物活性的片段蛋白质。因此,核苷酸序列的片段长度可为至少约20个核苷酸、约50个核苷酸、约100个核苷酸并且最多至编码本发明实施方案的蛋白质的全长核苷酸序列。

编码本发明实施方案的杀虫蛋白的生物活性部分的本发明实施方案的核苷酸序列的片段,将编码至少15、25、30、50、100、200、250或者300个连续氨基酸或者最多至本发明实施方案的杀虫多肽中存在的氨基酸的总数(例如对于SEQ ID NO:2为751个氨基酸)。因此,应当理解,本发明实施方案还涵盖这样的多肽,其为本发明实施方案的示例性杀虫蛋白的片段,且长度为至少15、25、30、50、100、200、250或300个连续氨基酸,或者最多至本发明实施方案的杀虫多肽中存在的氨基酸总数(例如对于SEQ ID NO:2为751个氨基酸)。。本发明实施方案的可用作杂交探针或PCR引物的核苷酸序列的片段通常不需要编码杀虫蛋白的生物活性部分。因此,本发明实施方案的核酸的片段可编码杀虫蛋白的生物活性部分,或者它可以是可采用本文公开的方法用作杂交探针或PCR引物的片段。杀虫蛋白的生物活性部分可如下制备:分离本发明实施方案的核苷酸序列其中之一的一部分,表达杀虫蛋白的编码部分(例如通过体外重组表达),并评估杀虫蛋白的所编码部分的活性。

属于本发明实施方案的核苷酸序列的片段的核酸,包含至少16、20、50、75、100、150、200、250、300、350、400、450、500、600、700、800、850、900或者950个核苷酸或者最多至本文公开的核苷酸序列中存在的核苷酸的数目(例如对于SEQ ID NO:1为2256个核苷酸)。特定的实施方案设想衍生自(例如产生自)本发明实施方案的第一核酸的片段,其中该片段编码具有杀虫活性的截短毒素。由本发明实施方案的多核苷酸片段编码的截短多肽具有这样的杀虫活性:该杀虫活性相对于由衍生出该片段的第一核酸所编码的相应全长多肽的活性相当或得到改善。可预想本发明实施方案的这种核酸片段可在天然的或相应的全长编码序列的3′端处截短。核酸片段也可同时在天然或相应的全长编码序列的5′和3′端这两处截短。

术语“变体”在本文中用来指实质上相似的序列。对于核苷酸序列而言,保守变体包括那些由于遗传密码的简并性而编码本发明实施方案的杀虫多肽其中之一的氨基酸序列的序列。本领域普通技术人员将易于理解,由于遗传密码的简并性,存在大量本发明的编码核苷酸序列。表1是提供每个氨基酸的同义密码子的密码子表。例如,密码子AGA、AGG、CGA、CGC、CGG和CGU全部都编码氨基酸精氨酸。因此,在本发明核酸中由某密码子指定为精氨酸的每个位置处,该密码子可变更为上述任何相应的密码子,而不变更所编码的多肽。应当理解,RNA序列中的U对应于DNA序列中的T。

表1

如适当,可将核酸进行优化以提高其在宿主生物体中的表达。因此,如果该宿主生物体是植物,则可用植物优选的密码子合成出合成的核酸以改善表达。有关宿主优选的密码子用法的讨论,参见例如Campbell和Gowri,(1990)Plant Physiol.92:1-11。例如,尽管本发明实施方案的核酸序列在单子叶植物物种和双子叶植物物种两者中都可表达,但可对序列进行修饰以解决单子叶植物或双子叶植物的特定密码子偏好性和GC含量偏好性,因为这些偏好性已被证实是不同的(Murray等人,(1989)Nucleic Acids Res.17:477-498)。因此,特定氨基酸的玉蜀黍优选的密码子可由来自玉蜀黍的已知基因序列得出。关于来自玉蜀黍植物的28种基因的玉蜀黍密码子的用法在Murray等人(出处同上)的表4中列出。合成植物优选的基因的方法是本领域现成的。参见例如美国专利No.5,380,831和5,436,391以及Murray等人,(1989)Nucleic Acids Res.17:477-498以及Liu H等人,Mol Bio Rep 37:677-684,2010,其均以引用的方式并入本文。玉蜀黍(Zea maize)密码子用法表也可见于kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=4577(可使用www前缀访问)。表2示出了玉蜀黍最佳密码子分析(修改自Liu H等人,Mol Bio Rep 37:677-684,2010)。

表2

使用卡方列联检验来比较密码子用法以鉴定最佳密码子。明显更频繁出现(P\0.01)的密码子用星号指示。

大豆(Glycine max)密码子用法表在表3中示出并且也可见于kazusa.or.jp/codon/cgi-bin/showcodon.cgi?species=3847&aa=1&style=N(可使用www前缀访问)。

表3

技术人员还将理解,可通过核酸序列的突变引入变化,从而引起所编码的多肽的氨基酸序列的变化,而不变更蛋白质的生物活性。因此,可通过将一个或多个核苷酸置换、添加和/或缺失引入本文所公开的相应核酸序列中来形成变体核酸分子,使得一个或多个氨基酸置换、添加或缺失被引入所编码的蛋白质中。可通过标准技术,比如定点诱变和PCR介导的诱变来引入突变。此类变体核酸序列也被本发明涵盖。

诸如这些的天然存在的等位基因变体可用熟知的分子生物学技术(例如本文述及的聚合酶链反应(PCR)和杂交技术)进行鉴定。

在一些实施方案中,编码SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8和SEQ ID NO:10的多肽的多核苷酸是非基因组核酸序列。

变体核苷酸序列也包括通过合成衍生的核苷酸序列,如那些例如通过使用定点诱变产生但仍编码本发明实施方案的杀虫蛋白(如突变毒素)的核苷酸序列。通常,本发明实施方案的特定核苷酸序列的变体将与该特定核苷酸序列具有至少约70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,这通过本文别处描述的序列比对程序使用默认参数测定。本发明实施方案的核苷酸序列的变体可与该序列相差少至1-15个核苷酸、少至1-10个如6-10个、少至5个、少至4个、3个、2个或甚至1个核苷酸。

本发明实施方案的特定核苷酸序列(即示例性的核苷酸序列)的变体,也可通过比较由变体核苷酸序列所编码的多肽与由参考核苷酸序列所编码的多肽之间的序列同一性百分比来进行评价。因此,例如,公开了编码与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8和SEQ ID NO:10的多肽具有给定的序列同一性百分比的多肽的分离核酸。任何两条多肽之间的序列同一性百分比可用本文别处描述的序列比对程序使用默认参数进行计算。在本发明实施方案的任何给定的一对多核苷酸是通过比较它们编码的两条多肽所共有的序列同一性百分比来进行评价的情况中,这两条所编码的多肽之间的序列同一性百分比为至少约40%、45%、50%、55%、60%、65%、70%,通常至少约75%、80%、85%,至少约90%、91%、92%、93%、94%、95%、96%、97%,或者至少约98%、99%或更高的序列同一性。

如本文所用,术语“变体蛋白”涵盖通过如下手段而衍生自天然蛋白质的多肽:在天然蛋白质的N末端和/或C末端缺失(所谓的截短)或添加一个或多个氨基酸;在天然蛋白质中的一个或多个位点缺失或添加一个或多个氨基酸;或者在该天然蛋白质中的一个或多个位点置换一个或多个氨基酸。因此,术语“变体蛋白”涵盖天然蛋白质的这样的生物活性片段:其包含足够数量的连续氨基酸残基以保持天然蛋白质的生物活性,即具有杀虫活性。这种杀虫活性相对于天然蛋白质可以是不同的或改善的,或者其可以是未改变的,只要杀虫活性得以保持即可。

本发明实施方案所涵盖的变体蛋白具有生物活性,即它们继续具有天然蛋白质的所需生物活性,即本文所述的杀虫活性。这类变体可例如由遗传多态性或由人类操纵而得到。本发明实施方案的天然杀虫蛋白的生物活性变体将与天然蛋白质的氨基酸序列具有至少约60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,这通过用本文别处描述的序列比对程序使用默认参数测定。本发明实施方案的蛋白质的生物活性变体可与该蛋白质相差少至1-15个氨基酸残基,少至1-10个如6-10个、少至5个、少至4个、3个、2个或甚至1个氨基酸残基。

在一些实施方案中,杀昆虫多肽与SEQ ID NO:2的氨基酸序列具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的序列同一性。

在一些实施方案中,杀昆虫多肽与SEQ ID NO:4的氨基酸序列具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的序列同一性。

在一些实施方案中,杀昆虫多肽与SEQ ID NO:6的氨基酸序列具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的序列同一性。

在一些实施方案中,杀昆虫多肽与SEQ ID NO:8的氨基酸序列具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的序列同一性。

在一些实施方案中,杀昆虫多肽与SEQ ID NO:10的氨基酸序列具有至少60%、65%、70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或更高的序列同一性。

在一些实施方案中,多肽具有修饰的物理性质。如本文所用,术语“物理性质”是指适用于描述蛋白的物理化学特性的任何参数。如本文所用,“所关注的物理性质”和“所关注的性质”可互换使用,是指正研究和/或修饰的蛋白的物理性质。物理性质的示例包括但不限于蛋白表面上的净表面电荷和电荷分布、蛋白表面上的净疏水性和疏水残基分布、表面电荷密度、表面疏水性密度、表面可电离基团的总数、表面张力、蛋白大小及其在溶液中的分布、熔融温度、热容和第二维里系数。物理性质的示例还包括但不限于溶解度、折叠性、稳定性和消化性。在一些实施方案中,多肽增强了蛋白水解片段在昆虫肠道中的消化性。由模拟胃液来消化的模型是本领域技术人员已知的(Fuchs,R.L.和J.D.Astwood.Food Technology 50:83-88,1996;Astwood,J.D.等人,Nature Biotechnology14:1269-1273,1996;Fu TJ等人,J.Agric Food Chem.50:7154-7160,2002)。

本发明实施方案还涵盖转化了本发明实施方案的至少一种核酸的微生物、转化了包含该核酸的表达盒的微生物或者转化了包含该表达盒的载体的微生物。在一些实施方案中,该微生物是在植物上繁殖的微生物。本发明的一个实施方案涉及封装的(encapsulated)杀虫蛋白,其包含能够表达至少一种本发明实施方案的杀虫蛋白的转化微生物。

本发明实施方案提供包含本发明实施方案的转化微生物的杀虫组合物。在此类实施方案中,转化微生物通常以杀虫有效量与合适的载体一起存在于杀虫组合物中。本发明实施方案还涵盖这样的杀虫组合物,其以杀昆虫有效量仅包含本发明实施方案的分离的蛋白质或包含本发明实施方案的分离的蛋白质与本发明实施方案的转化微生物和/或本发明实施方案的封装杀虫蛋白的组合,以及包含合适的载体。

本发明实施方案还提供通过使用本发明实施方案的杀虫蛋白与至少一种其它或“第二”杀虫蛋白的组合来增加昆虫靶标范围的方法。本领域已知的任何杀虫蛋白都可用于本发明实施方案的方法中。这种杀虫蛋白包括但不限于Bt毒素、蛋白酶抑制剂、α-淀粉酶和过氧化物酶。

本发明实施方案还涵盖包含至少一种本发明实施方案的核苷酸序列的转化植物或转基因植物。在一些实施方案中,该植物稳定转化有这样的核苷酸构建体:该构建体包含可操作地连接至能驱动植物细胞中的表达的启动子的至少一种本发明实施方案的核苷酸序列。如本文所用,术语“转化植物”和“转基因植物”是指在其基因组中包含异源多核苷酸的植物。通常,异源多核苷酸稳定整合于转基因植物或转化植物的基因组中,使得该多核苷酸被传递到后续各代。异源多核苷酸可单独整合进基因组中,或者作为重组表达盒的一部分整合进基因组中。

应理解,如本文所用的术语“转基因”包括任何其基因型已因异源核酸的存在而被变更的细胞、细胞系、愈伤组织、组织、植物部分或植物,包括那些最初以此方式变更的转基因以及那些通过从最初的转基因进行有性杂交或无性繁殖而产生的转基因在内。如本文所用,术语“转基因”不涵盖通过常规植物育种方法或通过自然发生事件(如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变)进行的基因组(染色体或染色体外)变更。

本文所用的术语“植物”包括指整个植株、植物器官(例如叶、茎、根等)、种子、植物细胞和它们的子代。转基因植物的部分落入本发明实施方案的范围内,包括例如植物细胞、植物原生质体、可从中再生出植株的植物细胞组织培养物、植物愈伤组织、植物块(clump)、以及在植物或诸如胚、花粉、胚珠、种子、叶、花、枝、果实、果仁、穗、穗轴、果壳、秆、根、根尖、花粉囊等的植物部分中完整的植物细胞,它们起源于之前转化有本发明实施方案的DNA分子的转基因植物或其后代并因此至少部分地由转基因细胞组成。可用于本发明实施方案的方法中的植物的类别通常与适于转化技术的高等植物的类别一样宽泛,包括单子叶植物和双子叶植物两者在内。

虽然本发明实施方案并不依赖于特定的生物机制来提高植物对植物害虫的抗性,但本发明实施方案的核苷酸序列在植物中的表达可导致本发明实施方案的杀虫蛋白的产生和植物对植物害虫的抗性的提高。本发明实施方案的植物可在农业中在用于影响昆虫害虫的方法中使用。某些实施方案提供可在用于影响植物的昆虫害虫(如鳞翅目害虫)的方法中使用的转化作物(例如玉蜀黍植物)。

“受试植物或植物细胞”是其中已针对目的基因进行了遗传变更(如转化)的植物或植物细胞,或者是从经如此变更的植物或细胞遗传下来并包含该变更的植物或植物细胞。“对照”或“对照植物”或“对照植物细胞”提供用于测量受试植物或植物细胞的表型变化的参考点。

对照植物或植物细胞可包括例如:(a)野生型植物或细胞,即具有与用于进行遗传变更的起始材料相同的基因型的植物或细胞,该遗传变更会得到受试植物或细胞;(b)具有与起始材料相同的基因型但已用无效构建体(即,用对目的性状不具有已知效果的构建体,诸如包含标记基因的构建体)转化的植物或植物细胞;(c)为受试植物或植物细胞的子代中的非转化分离子的植物或植物细胞;(d)在遗传上与受试植物或植物细胞相同但不暴露于会诱导目的基因的表达的条件或刺激因素的植物或植物细胞;或者(e)处于目的基因不被表达的条件下的受试植物或植物细胞本身。

本领域技术人员会容易认识到,分子生物学领域的进展如位点特异性诱变和随机诱变、聚合酶链反应方法和蛋白质工程技术,可提供适用于对具有农业意义的蛋白质的氨基酸序列和相应遗传序列二者进行变更或工程改造的广泛工具和方案集合。

因此,本发明实施方案的蛋白质可通过各种方式(包括氨基酸置换、缺失、截短和插入)进行变更。这类操纵的方法是本领域公知的。例如,可通过向合成的核酸(例如DNA分子)中引入突变来制备杀虫蛋白的氨基酸序列变体。诱变和核酸变更的方法是本领域熟知的。例如,可使用寡核苷酸介导的定点诱变技术来引入所设计的变化。参见例如Kunkel(1985)Proc.Natl.Acad.Sci.USA 82:488-492;Kunkel等人,(1987)Methods in Enzymol.154:367-382;美国专利No.4,873,192;Walker和Gaastra编辑,(1983)Techniques in Molecular Biology(MacMillan Publishing Company,New York);以及其中引用的参考文献。

可对本发明实施方案的经诱变的核苷酸序列进行修饰,以改变所编码的多肽的一级序列中存在的约1、2、3、4、5、6、8、10、12个或更多个氨基酸。作为另一种选择,可对天然序列引入甚至更多的变化,使得所编码的蛋白质与相应的野生型蛋白质相比可具有至少约1%或2%或约3%、4%、5%、6%、7%、8%、9%、10%、11%、12%或甚至约13%、14%、15%、16%、17%、18%、19%或20%、21%、22%、23%、24%或25%、30%、35%或40%或更多的密码子被变更或以别的方式被修饰。以同样的方式,所编码的蛋白质与相应的野生型蛋白质相比可具有至少约1%或2%或约3%、4%、5%、6%、7%、8%、9%、10%、11%、12%或甚至约13%、14%、15%、16%、17%、18%、19%或20%、21%、22%、23%、24%或25%、30%、35%或40%或更多的额外的密码子。应理解,本发明实施方案的经诱变的核苷酸序列旨在涵盖具有杀虫活性(例如通过对欧洲玉米螟幼虫的拒食性质所确定的改善的杀虫活性)的生物功能性等同肽,这种序列可由于已知在核酸序列以及因而其所编码的蛋白质内天然存在的密码子冗余性和功能等同性而产生。

本领域技术人员会认识到,氨基酸添加和/或置换通常是基于氨基酸侧链取代基的相对形似性,如它们的疏水性、电荷、大小等。考虑前述各个特征的示例性的氨基酸置换组是本领域技术人员熟知的,包括:精氨酸和赖氨酸;谷氨酸和天冬氨酸;丝氨酸和苏氨酸;谷氨酰胺和天冬酰胺;以及缬氨酸、亮氨酸和异亮氨酸。

有关不会影响目的蛋白质的生物活性的适当氨基酸置换的指导可在以下文献所述的模型中找到:Dayhoff等人,(1978)Atlas of Protein Sequence and Structure(Natl.Biomed.Res.Found.,Washington,D.C.),将该文献以引用方式并入本文。可作出保守置换,如将一个氨基酸用另一具有相似性质的氨基酸进行交换。

因此,本发明实施方案的基因和核苷酸序列包括天然存在的序列和突变形式二者。同样,本发明实施方案的蛋白质涵盖天然存在的蛋白质和其变型形式(例如截短多肽)及修饰形式(例如突变)。这种变体将继续具有所需的杀虫活性。显然,要在编码该变体的核苷酸序列中作出的突变必须不将该序列置于阅读框外,并且通常不会生成可能会产生二级mRNA结构的互补区。参见EP专利申请公开No.75,444。

不期望本文所涵盖的蛋白质序列的缺失、插入和置换会造成该蛋白质特性的根本变化。然而,当在进行置换、缺失或插入之前难以预测置换、缺失或插入的确切效应时,本领域技术人员会知道将通过常规的筛选测定法(如昆虫取食测定法)来评价该效应。参见例如,Marrone等人,(1985)J.Econ.Entomol.78:290-293以及Czapla和Lang(1990)J.Econ.Entomol.83:2480-2485,所述文献以引用方式并入本文。

变体核苷酸序列和蛋白质还涵盖衍生自诱变和引起重组的程序(如DNA改组)的序列和蛋白质。用这种程序,可操纵一个或多个不同的编码序列以产生具有所需性质的新的杀虫蛋白。以此方式,从一组相关的多核苷酸序列产生重组多核苷酸的文库,所述相关的多核苷酸序列包含具有实质的序列同一性且可以在体外或体内同源重组的序列区域。例如,使用该方法,可将本发明实施方案的核苷酸序列的全长编码序列、编码目的结构域的序列基序或者任何片段在本发明实施方案的核苷酸序列与其它已知Cry核苷酸序列的相应部分之间进行改组(shuffle),以获得编码具有改善的所关注性质的蛋白质的新基因。

所关注性质包括但不限于每单位杀虫蛋白的杀虫活性、蛋白稳定性以及对非靶标物种,具体来讲人类、牲畜和表达本发明实施方案的杀虫多肽的植物和微生物的毒性。本发明实施方案不受具体的改组策略的局限,只要至少一种本发明实施方案的核苷酸序列或其部分涉及这个改组策略。改组可仅涉及本文公开的核苷酸序列,或者可另外涉及本领域已知的其它核苷酸序列的改组。DNA改组的策略是本领域已知的。参见例如Stemmer(1994)Proc.Natl.Acad.Sci.USA 91:10747-10751;Stemmer(1994)Nature 370:389-391;Crameri等人,(1997)Nature Biotech 15:436-438;Moore等人,(1997)J.Mol.Biol.272:336-347;Zhang等人,(1997)Proc.Natl.Acad.Sci.USA 94:4504-4509;Crameri等人,(1998)Nature 391:288-291;以及美国专利No.5,605,793和5,837,458。

本发明实施方案的核苷酸序列也可用于从其它生物体,特别是其它细菌,更特别是其它芽孢杆菌属菌株分离相应的序列。以此方式,诸如PCR、杂交等之类的方法可以用来基于这类序列与本文所述序列的序列同源性从而鉴定这类序列。本发明实施方案涵盖了基于序列与本文所述的完整序列或其片段的序列同一性而选择的序列。这类序列包括为所公开的序列的直系同源物的序列。术语“直系同源物”指衍生自共同祖先基因并且由于物种形成而存在于不同物种中的基因。当其核苷酸序列和/或其所编码的蛋白质序列如本文其它地方所定义的那样具有实质性的同一性时,存在于不同物种中的基因被认为是直系同源物。直系同源物的功能在各种物种中常常是高度保守的。

在PCR方法中,可设计寡核苷酸引物用于PCR反应,以从提取自任何所关注生物体的cDNA或基因组DNA扩增相应的DNA序列。用于设计PCR引物和PCR克隆的方法是本领域公知的,并且公开于以下文献中:Sambrook等人,(1989)Molecular Cloning:A Laboratory Manual(第2版,Cold Spring Harbor Laboratory Press,Plainview,New York),下文称“Sambrook”。另参见Innis等人编辑,(1990)PCR Protocols:A Guide to Methods and Applications(Academic Press,New York);Innis和Gelfand编辑,(1995)PCR Strategies(Academic Press,New York);以及Innis和Gelfand编辑,(1999)PCR Methods Manual(Academic Press,New York)。已知的PCR方法包括但不限于利用成对引物、巢式引物、单一特异引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。

在杂交技术中,将已知的核苷酸序列的全部或一部分用作探针,该探针与来自所选生物体的一组克隆的基因组DNA片段或cDNA片段(即基因组或cDNA文库)中存在的其它对应核苷酸序列选择性杂交。该杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其它寡核苷酸,并且可用可检测基团如32P或任何其它可检测标记物标记。因此,例如,杂交用探针可通过对基于本发明实施方案的序列的合成寡核苷酸进行标记来制备。用于制备杂交用探针和用于构建cDNA文库和基因组文库的方法是本领域公知的,在“Sambrook”中有公开。

例如,本文所公开的整个序列,或其一个或多个部分可用作能够与相应的序列和信使RNA特异性杂交的探针。为实现在各种条件下的特异性杂交,这种探针包括对本发明实施方案的序列而言是独特的并且长度通常为至少约10个或20个核苷酸的序列。这种探针可用于通过PCR从选定的生物体扩增相应的Cry序列。这项技术可用于从所需生物体分离另外的编码序列,或者用作诊断测定法以确定编码序列在生物体中的存在。杂交技术包括对平板接种的(plated)DNA文库(噬菌斑或菌落;参见例如,Sambrook)的杂交筛选。

这类序列的杂交可以在严格条件下进行。本文所用的术语“严格条件”或“严格杂交条件”指探针与其靶序列杂交的程度将比它与其它序列杂交的程度可检测地更高(例如,比背景高至少2倍、5倍或者10倍)的条件。严格条件是序列依赖性的,在不同的情况中将会不同。通过控制杂交和/或洗涤条件的严格性,可以鉴定与探针100%互补的靶序列(同源探测)。或者,可以调节严格性条件以允许序列中的一些错配,从而检测到较低程度的相似性(异源探测)。通常,探针的长度小于约1000或500个核苷酸。

通常,严格条件将为其中盐浓度低于约1.5M钠离子,通常为约0.01至1.0M钠离子浓度(或其它盐),pH为7.0至8.3,对短探针(例如,10至50个核苷酸)而言温度为至少约30℃,对长探针(例如超过50个核苷酸)而言温度为至少约60℃的那些条件。严格条件还可以通过添加去稳定剂如甲酰胺来实现。示例性的低严格条件包括用30-35%甲酰胺、1M NaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液在37℃下杂交并在1倍至2倍SSC(20倍SSC=3.0M NaCI/0.3M柠檬酸三钠)中在50-55℃下洗涤。示例性的中等严格条件包括在40-45%甲酰胺、1.0M NaCl、1%SDS中在37℃下杂交并在0.5倍至1倍SSC中在55-60℃下洗涤。示例性的高严格条件包括在50%甲酰胺、1M NaCl、1%SDS中在37℃下杂交并最后在0.1倍SSC中在60-65℃下洗涤至少约20分钟。任选地,洗涤缓冲液可以包含约0.1%至约1%SDS。杂交的持续时间通常小于约24小时,往往为约4至约12小时。

特异性通常决定于杂交后的洗涤,关键因素为最终洗涤溶液的离子强度和温度。对于DNA-DNA杂交体,Tm(热熔点)可以根据Meinkoth和Wahl(1984)Anal.Biochem.138:267-284的方程:Tm=81.5℃+16.6(log M)+0.41(%GC)-0.61(%form)-500/L进行估计;其中M为单价阳离子的摩尔浓度,%GC为DNA中鸟嘌呤核苷酸和胞嘧啶核苷酸的百分比,%form为杂交溶液中甲酰胺的百分比,L为杂交体的长度(单位为碱基对)。Tm为50%的互补靶序列与完全匹配的探针杂交时的温度(在确定的离子强度和pH下)。洗涤通常至少进行至达到平衡和获得低的杂交背景水平为止,例如2小时、1小时或30分钟。

对于每1%错配,Tm下降约1℃;因此,可以调节Tm、杂交和/或洗涤条件以与具有所需同一性的序列杂交。例如,如果寻求具有≥90%同一性的序列,则Tm可降低10℃。通常,将严格条件选择为比特定序列及其互补序列在确定的离子强度和pH下的Tm低约5℃。然而,极严格条件可以利用比Tm低1、2、3或4℃下的杂交和/或洗涤;中等严格条件可以利用比Tm低6、7、8、9或10℃下的杂交和/或洗涤;低严格条件可以利用比Tm低11、12、13、14、15或20℃下的杂交和/或洗涤。

利用所述公式,杂交和洗涤组成以及所需的Tm,普通技术人员将认识到,杂交和/或洗涤溶液的严格性的变化固有地得到了描述。如果所需的错配程度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),则可增加SSC浓度以使得可使用较高的温度。有关核酸杂交的详尽指导见于Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,第I部分,第2章(Elsevier,New York);以及Ausubel等人编辑,(1995)Current Protocols in Molecular Biology,第2章(Greene Publishing and Wiley-Interscience,New York)。另参见“Sambrook”。因此,本发明实施方案涵盖编码本发明实施方案的Cry蛋白并在严格条件下与本文公开的Cry序列或与其片段杂交的分离的序列。

如下术语用来描述两条或更多条核酸或多核苷酸之间的序列关系:(a)“参考序列”、(b)“比较窗口”、(c)“序列同一性”、(d)“序列同一性百分比”和(e)“实质上相同”。

(a)本文所用的“参考序列”是用作序列比较的基础的确定的序列。

参考序列可以是指定序列的子集或者全部;例如,作为全长cDNA或基因序列的区段,或者完整的cDNA或基因序列。

(b)本文所用的“比较窗口”是指多核苷酸序列的连续的且指定的区段,其中该比较窗口中的多核苷酸序列相比于参考序列(不包含添加或缺失)可包含添加或缺失(即空位),以便两条序列进行最佳比对。通常,比较窗口长度为至少20个连续的核苷酸,任选可为30、40、50、100个或更长。本领域技术人员认识到,为避免由于在多核苷酸序列中加入空位所致的与参考序列的高度相似性,通常引入空位罚分并从匹配数扣除空位罚分。

将序列比对以作比较的方法是本领域熟知的。因此,任何两条序列之间的序列同一性百分比的确定可使用数学算法来完成。此类数学算法的非限制性示例是Myers和Miller(1988)CABIOS 4:11-17的算法;Smith等人,(1981)Adv.Appl.Math.2:482的局部比对算法;Needleman和Wunsch(1970)J.Mol.Biol.48:443-453的全局比对算法;Pearson和Lipman,(1988)Proc.Natl.Acad.Sci.85:2444-2448的搜索-局部比对方法;Karlin和Altschul,(1990)Proc.Natl.Acad.Sci.USA 872264的算法,如在Karlin和Altschul(1993)Proc.Natl.Acad.Sci.USA 90:5873-5877中改良的。

可利用这些数学算法的计算机实现进行序列的比较以确定序列同一性。此类执行序包括、但不限于:PC/Gene程序(可获自加利福尼亚州山景城的Intelligenetics公司(Mountain View,California))中的CLUSTAL;GCG Wisconsin Genetics Software版本10(可得自美国加利福尼亚州圣地亚哥斯克兰顿路9685号的Accelrys有限公司(Accelrys Inc.,9685Scranton Road,San Diego,California,USA))中的ALIGN程序(版本2.0)和GAP、BESTFIT、BLAST、FASTA和TFASTA。使用这些程序的比对可以使用默认参数进行。以下文献对CLUSTAL程序进行了详细描述:Higgins等人,(1988)Gene 73:237-244(1988);Higgins等人,(1989)CABIOS 5:151-153;Corpet等人,(1988)Nucleic Acids Res.16:10881-90;Huang等人,(1992)CABIOS 8:155-65;以及Pearson等人,(1994)Meth.Mol.Biol.24:307-331。ALIGN程序基于Myers和Miller(1988年)(出处同上)的算法。当比较氨基酸序列时,ALIGN程序可使用PAM120加权残基表、空位长度罚分12和空位罚分4。Altschul et al(1990)J.Mol.Biol.215:403(Altschul等人,1990年,《分子生物学杂志》,第215卷,第403页)的BLAST程序基于上文中Karlin和Altschul(1990)(出处同上)的算法。BLAST核苷酸搜索可用BLASTN程序、score(得分)=100、wordlength(字长)=12来进行,以获得与编码本发明实施方案的蛋白质的核苷酸序列同源的核苷酸序列。BLAST蛋白质搜索可用BLASTN程序、score(得分)=50、wordlength(字长)=3来进行,以获得与本发明实施方案的蛋白质或多肽同源的氨基酸序列。为了出于比较目的获得带空位的比对结果,可以使用如Altschul等人,(1997)Nucleic Acids Res.25:3389中所述的Gapped BLAST(在BLAST 2.0中)。作为另外一种选择,PSI-BLAST(在BLAST 2.0中)可以用来执行检测分子之间远源关系的迭代搜索。参见Altschul等人,(1997)(Altschul等人,1997年),出处同上。当采用BLAST、Gapped BLAST、PSI-BLAST时,可以使用各个程序的默认参数(例如BLASTN用于核苷酸序列,BLASTX用于蛋白质)。参见美国国家生物技术信息中心(National Center for Biotechnology Information)网站(www.ncbi.nlm.nih.gov)。还可以以人工方式通过检查来进行比对。

除非另外指明,否则本文提供的序列同一性/相似性值是指使用采用以下参数的GAP版本10或其任何等同程序获得的值:核苷酸序列的%同一性和%相似性采用GAP权重50和长度权重3以及nwsgapdna.cmp评分矩阵;氨基酸序列的%同一性和%相似性采用GAP权重8和长度权重2以及BLOSUM62评分矩阵。本文所用术语的“等同程序”指任何这样的序列比较程序,其对于任何两个所考虑的序列,相比于由GAP版本10所产生的相应比对,能产生出具有相同的核苷酸或氨基酸残基匹配和相同的序列同一性百分比的比对。

GAP利用Needleman和Wunsch(1970)(出处同上)的算法来寻找两个完整序列的能使匹配数最大而使空位数最小的比对。GAP考虑所有可能的比对和空位位置,并产生具有最大数目的匹配碱基和最少的空位的比对。它使得可以提供以匹配碱基数为单位的空位产生罚分和空位延伸罚分。GAP对于其插入的每个空位,必须利用匹配的空位产生罚分数。如果选择大于零的空位延伸罚分,GAP对于每个插入的空位必须另外利用空位长度乘以空位延伸罚分。对于蛋白质序列,GCG威斯康星遗传学软件包(GCG Wisconsin Genetics Software Package)的版本10中的默认空位产生罚分值和空位延伸罚分值分别为8和2。对于核苷酸序列,默认空位产生罚分为50,而默认空位延伸罚分为3。空位产生罚分和空位延伸罚分可以以选自0至200的整数来表示。因此,例如,空位产生罚分和空位延伸罚分可以为0、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65或更大。

GAP给出该家族中的具有最佳比对的一个成员。可能存在这个家族的许多成员,但其它成员没有更好的品质。GAP显示用于比对的四个优值因素:品质、比率、同一性和相似性。品质是为了将序列进行比对而最大化的指标(metric)。比率是品质除以较短片段中的碱基数。同一性百分比是实际匹配的符号的百分比。相似性百分比是相似的符号的百分比。将相应于空位的符号忽略。当一对符号的评分矩阵值大于或等于0.50(相似性阈值)时,评定为相似性。GCG Wisconsin Genetics Software Package的版本10中使用的评分矩阵为BLOSUM62(参见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)。

(c)在两条核酸或多肽序列的情形中,本文所用的“序列同一性”或“同一性”是指在指定的比较窗口范围为获得最大对应而比对时这两条序列中相同的残基。当序列同一性百分比针对蛋白使用时,认识到不相同的残基位置往往差别在于保守氨基酸置换,其中氨基酸残基由具有相似化学性质(例如电荷或疏水性)的其它氨基酸残基置换,因此不会改变分子的功能性质。当序列差别在于保守置换,则可以上调序列同一性百分比以校正置换的保守性质。差别在于这种保守置换的序列被称为具有“序列相似性”或“相似性”。作出这个调整的手段是本领域技术人员熟知的。通常,这涉及将保守置换评定为部分错配而不是完全错配,从而增加序列同一性百分比。因此,例如,如果相同的氨基酸给予1分,非保守置换给予0分,则保守置换给予0至1之间的分数。保守置换的评分是例如在程序PC/GENE(美国加利福尼亚州山景城(Mountain View,California)的Intelligenetics公司)中所执行那样进行计算。

(d)本文所用的“序列同一性百分比”意指通过在比较窗口范围内比较两个最佳比对的序列所确定的值,其中与参考序列(不包含添加或缺失)相比,多核苷酸序列在比较窗口中的部分可包含添加或缺失(即空位),以便最佳比对两个序列。通过以下方式计算所述百分比:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以得到匹配的位置的数目,将匹配的位置的数目除以比较窗口中位置的总数目,然后将结果乘以100以得到序列同一性百分比。

(e)(i)多核苷酸序列的“实质上相同”这个术语意指在使用所描述的比对程序之一采用标准的参数与参考序列进行比较时,多核苷酸包含具有至少70%、80%、90%或95%或更高的序列同一性的序列。本领域技术人员将会认识到,可通过考虑密码子简并性、氨基酸相似性、阅读框定位等等适当调整这些值以确定由两条核苷酸序列所编码的蛋白质的相应同一性。出于这些目的,氨基酸序列实质上相同通常意指序列同一性为至少60%、70%、80%、90%或95%或更高的序列同一性。

核苷酸序列实质上相同的另一种指示是两个分子在严格条件下是否彼此杂交。通常,将严格条件选择为比特定序列在确定的离子强度和pH下的Tm低约5℃。但是,严格条件涵盖在比Tm低约1℃至约20℃的范围内的温度,取决于本文另外限定的所需严格程度。在严格条件下不互相杂交的核酸,如果它们编码的多肽是实质上相同的,则它们仍是实质上相同的。例如,当利用遗传密码所允许的最大密码子简并性产生一个核酸拷贝时,这可能会发生。两条核酸序列实质上相同的一个指示是,由第一核酸编码的多肽与由第二核酸编码的多肽发生免疫交叉反应。

(e)(ii)在肽的情形中,术语“实质上相同”指肽包含这样的序列,在指定比较窗口上该序列与参考序列具有至少70%、80%、85%、90%、95%或更高的序列同一性。出于这些目的的最佳比对可用Needleman和Wunsch(1970)(出处同上)的全局比对算法来进行。两条肽序列实质上相同的指示是,一种肽可与针对第二种肽产生的抗体发生免疫反应。因而,例如,如果某种肽与第二种肽差别仅在于保守置换的话,则这两种肽实质上相同。“实质上相似的”肽共有如上所述的序列,例外的是不相同的残基位置差别可能在于保守氨基酸变化。

本文中术语“核苷酸构建体”的使用无意于将所述实施方案局限于包含DNA的核苷酸构建体。本领域普通技术人员将认识到,核苷酸构建体,特别是由核糖核苷酸以及核糖核苷酸和脱氧核糖核苷酸的组合构成的多核苷酸和寡核苷酸,也可应用于本文公开的方法中。所述实施方案的核苷酸构建体、核酸和核苷酸序列另外涵盖这类构建体、分子和序列的所有互补形式。此外,所述实施方案的核苷酸构建体、核苷酸分子和核苷酸序列涵盖可在本发明实施方案的方法中采用以转化植物的所有核苷酸构建体、分子和序列,包括但不限于那些由脱氧核糖核苷酸、核糖核苷酸以及它们的组合所构成的核苷酸构建体、分子和序列。这种脱氧核糖核苷酸和核糖核苷酸既包括天然存在的分子,也包括合成的类似物。本发明实施方案的核苷酸构建体、核酸和核苷酸序列还涵盖所有形式的核苷酸构建体,包括但不限于单链形式、双链形式、发夹结构、茎-环结构等。

另一个实施方案例涉及转化的生物体,如选自植物和昆虫细胞、细菌、酵母、杆状病毒、原生动物、线虫和藻类的生物体。该转化的生物体包含:本发明实施方案的DNA分子、含所述DNA分子的表达盒或者含所述表达盒的载体,它们可稳定掺入到转化的生物体的基因组中。

所述实施方案的序列在DNA构建体中提供以用于在所关注生物体中表达。该构建体将包括可操作地连接至本发明实施方案的序列的5′和3′调控序列。本文所用的术语“可操作地连接”指启动子与第二序列之间的功能性连接,其中启动子序列起始并介导与第二序列对应的DNA序列的转录。一般来讲,可操作地连接意指被连接的核酸序列是连续的,并且如果有必要连接两个蛋白编码区的话,是连续的且在相同的阅读框内。该构建体可另外含有至少一个待共转化到该生物体中的额外基因。或者,所述额外基因可在多个DNA构建体上提供。

这种DNA构建体提供有多个限制性位点,以使Cry毒素序列的插入处于调控区的转录调控之下。DNA构建体可另外含有选择性标记基因。

该DNA构建体在5′至3′转录方向上将包含:转录和翻译起始区(即,启动子)、本发明实施方案的DNA序列、和在充当宿主的生物体中具有功能的转录和翻译终止区(即终止区)。所述转录起始区(即启动子)相对于宿主生物体和/或相对于本发明实施方案的序列可以是天然的、类似的、外来的或者异源的。另外,该启动子可以是天然序列或另选地是合成序列。如本文所用的术语“外来的”表示启动子在引入该启动子的天然生物体中不存在。如果启动子相对于本发明实施方案的序列是“外来的”或者“异源的”,则意指该启动子不是可操作地连接的本发明实施方案的序列的天然或天然存在的启动子。本文所用的嵌合基因包含可操作地连接至转录起始区的编码序列,该转录起始区对于该编码序列是异源的。如果启动子是天然或自然的序列,则可操作地连接的序列的表达相比野生型表达被变更,这导致表型变更。

终止区可以是对于转录起始区而言是天然的,可以对于可操作地连接的目的DNA序列而言是天然的,可以对于植物宿主而言是天然的,或者可以衍自另一来源(即对于该启动子、目的序列、植物宿主或者它们的任何组合而言是外来的或异源的)。

易得的终止区可获自根瘤农杆菌(A.tumefaciens)的Ti质粒,比如章鱼碱合酶和胭脂碱合酶终止区。另参见Guerineau等人,(1991)Mol.Gen.Genet.262:141-144;Proudfoot,(1991)Cell 64:671-674;Callis等人,(1991)Genes Dev.5:141-149;Mogen等人,(1990)Plant Cell 2:1261-1272;Munroe等人,(1990)Gene 91:151-158;Ballas等人,(1989)Nucleic Acids Res.17:7891-7903;以及Joshi等人,(1987)Nucleic AcidRes.15:9627-9639。

如适当,可将核酸进行优化以提高其在宿主生物体中的表达。因此,如果该宿主生物体是植物,则可用植物优选的密码子合成出合成的核酸以改善表达。有关宿主优选的密码子用法的讨论,参见例如Campbell和Gowri,(1990)Plant Physiol.92:1-11。例如,尽管本发明实施方案的核酸序列在单子叶植物物种和双子叶植物物种两者中都可表达,但可对序列进行修饰以解决单子叶植物或双子叶植物的特定密码子偏好性和GC含量偏好性,因为这些偏好性已被证实是不同的(Murray等人,(1989)Nucleic Acids Res.17:477-498)。因此,特定氨基酸的玉蜀黍优选的密码子可由来自玉蜀黍的已知基因序列得出。关于来自玉蜀黍植物的28个基因的玉蜀黍密码子用法在Murray等人(出处同上)的表4中列出。合成植物优选的基因的方法是本领域现成的。参见例如美国专利No.5,380,831和No.5,436,391,以及Murray et al.(1989)Nucleic Acids Res.18:455-498(Murray等人,1989年,《核酸研究》,第18卷,第455-498页),将其以引用方式并入本文。

已知有另外的序列修饰能增强细胞宿主中的基因表达。这些包括消除以下序列:编码假多聚腺苷酸化信号、外显子-内含子剪接位点信号的序列、转座子样重复序列以及其它得到充分表征的可能对基因表达有害的序列。可将序列的GC含量调节至给定细胞宿主的平均水平,这通过参考在宿主细胞中表达的已知基因计算得到。如本文所用的术语“宿主细胞”指含有载体并支持该表达载体的复制和/或表达的细胞。宿主细胞可以是原核细胞如大肠杆菌(E.coli)或者真核细胞如酵母、昆虫、两栖动物或者哺乳动物细胞,或者单子叶或者双子叶植物细胞。单子叶植物宿主细胞的一个示例是玉蜀黍宿主细胞。当可能时,修饰序列以避免可预见的发夹二级mRNA结构。

表达盒可以另外含有5′前导序列。此类前导序列可以起到增强翻译的作用。翻译前导序列是本领域已知的,包括:小核糖核酸病毒前导序列,例如EMCV前导序列(脑心肌炎5′非编码区)(Elroy-Stein等人,(1989)Proc.Natl.Acad.Sci.USA 86:6126-6130);马铃薯Y病毒前导序列,例如TEV前导序列(烟草蚀纹病毒)(Gallie等人,(1995)Gene 165(2):233-238);MDMV前导序列(玉米矮花叶病毒);人免疫球蛋白重链结合蛋白(BiP)(Macejak等人,(1991)Nature 353:90-94);来自苜蓿花叶病毒的外壳蛋白mRNA(AMV RNA 4)的非翻译前导序列(Jobling等人,(1987)Nature 325:622-625);烟草花叶病毒前导序列(TMV)(Gallie等人(1989),载于:Molecular Biology of RNA,Cech编辑(Liss,New York),第237-256页);以及玉米褪绿斑驳病毒前导序列(MCMV)(Lommel等人,(1991)Virology 81:382-385)。另参见Della-Cioppa等人,(1987)Plant Physiol.84:965-968。

在制备表达盒时,可对多个DNA片段进行操纵,以提供处于正确取向的DNA序列,且适当时提供处于正确的阅读框内的DNA序列。为此目的,可应用衔接子或接头将DNA片段连接在一起,或者可涉及其它的操纵以提供易得的限制性位点、移除多余的DNA、移除限制性位点等。出于这个目的,可能涉及体外诱变、引物修复、限制性酶切、退火、再置换(例如转换和颠换)。

有多种启动子可用于本发明实施方案的实践中。可根据期望的结果来选择启动子。可将核酸与组成型启动子、组织优选的启动子、诱导型启动子或其它启动子进行组合,以在宿主生物体中表达。适用于植物宿主细胞的组成型启动子包括例如WO 99/43838和美国专利No.6,072,050中公开的Rsyn7启动子和其它组成型启动子的核心启动子;核心CaMV 35S启动子(Odell等人,(1985)Nature 313:810-812);水稻肌动蛋白(McElroy等人,(1990)Plant Cell 2:163-171);遍在蛋白(Christensen等人,(1989)Plant Mol.Biol.12:619-632,以及Christensen等人,(1992)Plant Mol.Biol.18:675-689);pEMU(Last等人,(1991)Theor.Appl.Genet.81:581-588);MAS(Velten等人,(1984)EMBO J.3:2723-2730);ALS启动子(美国专利No.5,659,026),等等。其它的组成型启动子包括例如以下各个美国专利中论述的那些:No.5,608,149、5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142;和6,177,611。

取决于所需的结果,从诱导型启动子表达基因可能是有利的。对于调控本发明实施方案的核苷酸序列在植物中的表达特别有意义的是损伤诱导型启动子。这种损伤诱导型启动子可响应于由昆虫取食所引起的损害,包括马铃薯蛋白酶抑制剂(pin II)基因(Ryan(1990)Ann.Rev.Phytopath.28:425-449;Duan等人,(1996)Nature Biotechnology 14:494-498);wun1和wun2,美国专利No.5,428,148;win1和win2(Stanford等人,(1989)Mol.Gen.Genet.215:200-208);系统素(McGurl等人,(1992)Science 225:1570-1573);WIPl(Rohmeier等人,(1993)Plant Mol.Biol.22:783-792;Eckelkamp等人,(1993)FEBS Letters 323:73-76);MPI基因(Corderok等人,(1994)Plant J.6(2):141-150);等等,将这些专利和文献以引用方式并入本文。

另外,病原体诱导型启动子可在所述实施方案的方法和核苷酸构建体中使用。这种病原体诱导型启动子包括那些来自致病相关蛋白(PR蛋白)的在被病原体感染后被诱导的启动子;例如,PR蛋白、SAR蛋白、β-1,3-葡聚糖酶、几丁质酶等。参见例如Redolfi等人,(1983)Neth.J.Plant Pathol.89:245-254;Uknes等人,(1992)Plant Cell 4:645-656;以及Van Loon,(1985)Plant Mol.Virol.4:111-116。还可参见WO 99/43819,该专利以引用的方式并入本文。

在病原体感染位点处或附近局部表达的启动子值得关注。参见例如,Marineau等人,(1987)Plant Mol.Biol.9:335-342;Matton等人,(1989)Molecular Plant-Microbe Interactions 2:325-331;Somsisch等人,(1986)Proc.Natl.Acad.Sci.USA 83:2427-2430;Somsisch等人,(1988)Mol.Gen.Genet.2:93-98;以及Yang(1996)Proc.Natl.Acad.Sci.USA 93:14972-14977。还可参见Chen等人,(1996)Plant J.10:955-966;Zhang等人,(1994)Proc.Natl.Acad.Sci.USA 91:2507-2511;Warner等人,(1993)Plant J.3:191-201;Siebertz等人,(1989)Plant Cell 1:961-968;美国专利No.5,750,386(线虫诱导型);以及其中引用的参考文献。特别值得关注的是玉蜀黍PRms基因的诱导型启动子,其表达由病原体串珠镰刀菌(Fusarium moniliforme)诱导(参见例如,Cordero等人,(1992)Physiol.Mol.Plant Path.41:189-200)。

可通过施加外源化学调节剂将化学调控启动子用于调节基因在植物中的表达。取决于目标,启动子可以是化学诱导型启动子,其中施用化学物质可诱导基因表达,或者是化学阻抑型启动子,其中施用化学物质可抑制基因表达。化学诱导型启动子是本领域已知的,包括但不限于玉蜀黍In2-2启动子(其通过苯磺酰胺除草剂安全剂活化)、玉蜀黍GST启动子(其通过用作芽前除草剂的疏水性亲电化合物活化)和烟草PR-1a启动子(其通过水杨酸活化)。其它所关注的化学调控启动子包括甾类化合物响应性启动子(参见例如,糖皮质类固醇诱导型启动子,载于Schena等人,(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425以及McNellis等人,(1998)Plant J.14(2):247-257)以及四环素诱导型和四环素阻抑型启动子(参见例如Gatz等人,(1991)Mol.Gen.Genet.227:229-237以及美国专利No.5,814,618和5,789,156),这些文献和专利以引用方式并入本文。

组织优选的启动子可用来使增强的杀虫蛋白表达靶向于特定的植物组织内。组织优选的启动子包括以下文献中讨论的那些启动子:Yamamoto等人,(1997)Plant J.12(2)255-265;Kawamata等人,(1997)Plant Cell Physiol.38(7):792-803;Hansen等人,(1997)Mol.Gen Genet.254(3):337-343;Russell等人,(1997)Transgenic Res.6(2):157-168;Rinehart等人,(1996)Plant Physiol.112(3):1331-1341;Van Camp等人,(1996)Plant Physiol.112(2):525-535;Canevascini等人,(1996)Plant Physiol.112(2):513-524;Yamamoto等人,(1994)Plant Cell Physiol.35(5):773-778;Lam(1994)Results Probl.Cell Differ.20:181-196;Orozco等人,(1993)Plant Mol Biol.23(6):1129-1138;Matsuoka等人,(1993)Proc Natl.Acad.Sci.USA 90(20):9586-9590;以及Guevara-Garcia等人,(1993)Plant J.4(3):495-505。如有必要,可对此类启动子进行修饰,以便弱化表达。

叶优选的启动子是本领域已知的。参见例如Yamamoto等人,(1997)Plant J.12(2):255-265;Kwon等人,(1994)Plant Physiol.105:357-67;Yamamoto等人,(1994)Plant Cell Physiol.35(5):773-778;Gotor等人,(1993)Plant J.3:509-18;Orozco等人,(1993)Plant Mol.Biol.23(6):1129-1138;以及Matsuoka等人,(1993)Proc.Natl.Acad.Sci.USA 90(20):9586-9590。

根优选的启动子或者根特异性启动子是已知的,并且可选自许多可从文献得到的启动子,或者从各种相容的物种从头(de novo)分离。参见例如,Hire等人,(1992)Plant Mol.Biol.20(2):207-218(大豆根特异性谷氨酰胺合成酶基因);Keller和Baumgartner(1991)Plant Cell 3(10):1051-1061(法国菜豆的GRP 1.8基因中的根特异性控制元件);Sanger等人,(1990)Plant Mol.Biol.14(3):433-443(根瘤农杆菌的甘露氨酸合酶(MAS)基因的根特异性启动子);以及Miao等人,(1991)Plant Cell 3(1):11-22(编码胞液型谷氨酰胺合成酶(GS)的全长cDNA克隆,该酶在大豆的根和根瘤中表达)。还可参见Bogusz等人,(1990)Plant Cell 2(7):633-641,其中描述了从来自固氮非豆科植物榆科山黄麻(Parasponia andersonii)和相关的非固氮非豆科植物鸡屎藤山麻黄(Trema tomentosa)的血红蛋白基因分离的两种根特异性启动子。将这些基因的启动子连接至β-葡糖醛酸酶报道基因并引入非豆科植物烟草(Nicotiana tabacum)和豆科植物百脉根(Lotus corniculatus)二者中,在这两种情况中根特异性启动子活性得以保持。Leach和Aoyagi(1991)描述了他们对毛根农杆菌(Agrobacterium rhizogenes)的高表达rolC和rolD根诱导基因的启动子的分析结果(参见Plant Science(Limerick)79(1):69-76)。他们得出结论认为,增强子和组织优选的DNA决定子在那些启动子中是分离的。Teeri等人,(1989)使用与lacZ的基因融合证实,编码章鱼碱合酶的农杆菌属(Agrobacterium)T-DNA基因在根尖表皮中特别活跃,且TR2′基因在完整植物中是根特异性的并通过叶组织中的创伤刺激,这是用于杀昆虫或杀幼虫基因的特别理想的特性组合(参见EMBO J.8(2):343-350)。与nptlI(新霉素磷酸转移酶II)融合的TR1′基因显示了相似的特性。另外的根优选的启动子包括VfENOD-GRP3基因启动子(Kuster等人,(1995)Plant Mol.Biol.29(4):759-772);以及rolB启动子(Capana等人,(1994)Plant Mol.Biol.25(4):681-691)。另参见以下美国专利:No.5,837,876;5,750,386;5,633,363;5,459,252;5,401,836;5,110,732;和5,023,179。

“种子优选的”启动子包括“种子特异性”启动子(这种启动子在种子发育期间活跃,例如种子贮藏蛋白的启动子)和“种子萌发”启动子(这种启动子在种子萌发期间活跃)。参见Thompson等人,(1989)BioEssays 10:108,该文献以引用方式并入本文。这类种子优选的启动子包括但不限于Cim1(细胞分裂素诱导信息);cZ19B1(玉蜀黍19kDa玉米醇溶蛋白);和milps(肌醇-1-磷酸合酶)(参见美国专利No.6,225,529,将该文献以引用方式并入本文)。γ-玉米醇溶蛋白和Glob-1是胚乳特异性启动子。对于双子叶植物而言,种子特异性启动子包括但不限于菜豆β-菜豆蛋白基因启动子、油菜籽蛋白(napin)基因启动子、β-伴球蛋白基因启动子、大豆凝集素基因启动子、十字花科蛋白基因启动子等。对于单子叶植物,种子特异性启动子包括但不限于玉蜀黍15kDa玉米醇溶蛋白、22kDa玉米醇溶蛋白、27kDa玉米醇溶蛋白、g-玉米醇溶蛋白、waxy、shrunken 1、shrunken 2、球蛋白1等。还可参见WO 00/12733,其中公开了来自endl和end2基因的种子优选的启动子;该专利以引用方式并入本文。在特定组织中具有“偏好”表达的启动子在该组织中表达的程度高于在至少一种其它植物组织中表达的程度。一些组织优选的启动子几乎专门在特定组织中表达。

如果需要低水平表达,则要使用弱启动子。一般来讲,如本文所用的术语“弱启动子”指驱动编码序列以低水平表达的启动子。所谓“低水平表达”意指处于约1/1000个转录物至约1/100,000个转录物至约1/500,000个转录物的水平。作为另一种选择,认识到术语“弱启动子”还涵盖仅在少数细胞中而不在其它细胞中驱动表达从而造成总表达水平较低的启动子。如启动子驱动不可接受的高水平表达,则可缺失或者修饰启动子序列的一些部分以降低表达水平。

这种弱组成型启动子包括例如Rsyn7启动子的核心启动子(WO 99/43838和美国专利No.6,072,050)、核心35S CaMV启动子等。其它组成型启动子包括例如以下美国专利中描述的那些启动子:No.5,608,149;5,608,144;5,604,121;5,569,597;5,466,785;5,399,680;5,268,463;5,608,142;和6,177,611,这些专利以引用方式并入本文。

一般来讲,表达盒将包含用于选择转化细胞的选择性标记基因。选择性标记基因用于选择经转化的细胞或组织。标记基因包括编码抗生素抗性的基因,诸如那些编码新霉素磷酸转移酶II(NEO)和潮霉素磷酸转移酶(HPT)的基因,以及赋予对除草化合物的抗性的基因,所述除草化合物为例如草铵膦、溴苯腈、咪唑啉酮和2,4-二氯苯氧基乙酸(2,4-D)。合适的选择性标记基因的另外示例包括但不限于:编码对以下抗生素的抗性的基因:氯霉素(Herrera Estrella等人,(1983)EMBO J.2:987-992);甲氨喋呤(Herrera Estrella等人,(1983)Nature 303:209-213;以及Meijer等人,(1991)Plant Mol.Biol.16:807-820);链霉素(Jones等人,(1987)Mol.Gen.Genet.210:86-91);壮观霉素(Bretagne-Sagnard等人,(1996)Transgenic Res.5:131-137);博来霉素(Hille等人,(1990)Plant Mol.Biol.7:171-176);磺酰胺(Guerineau等人,(1990)Plant Mol.Biol.15:127-136);溴苯腈(Stalker等人,(1988)Science 242:419-423);草甘膦(Shaw等人,(1986)Science 233:478-481;以及美国专利No.7,709,702和7,462,481);草丁膦(DeBlock等人,(1987)EMBO J.6:2513-2518)。主要参见:Yarranton(1992)Curr.Opin.Biotech.3:506-511;Christopherson等人,(1992)Proc.Natl.Acad.Sci.USA 89:6314-6318;Yao等人,(1992)Cell 71:63-72;Reznikoff(1992)Mol.Microbiol.6:2419-2422;Barkley等人,(1980),载于:The Operon,第177-220页;Hu等人,(1987)Cell 48:555-566;Brown等人,(1987)Cell 49:603-612;Figge等人,(1988)Cell 52:713-722;Deuschle等人,(1989)Proc.Natl.Acad.Sci.USA 86:5400-5404;Fuerst等人,(1989)Proc.Natl.Acad.Sci.USA 86:2549-2553;Deuschle等人,(1990)Science 248:480-483;Gossen(1993)德国海德尔堡大学(University of Heidelberg)博士论文;Reines等人,(1993)Proc.Natl.Acad.Sci.USA 90:1917-1921;Labow等人,(1990)Mol.Cell.Biol.10:3343-3356;Zambretti等人,(1992)Proc.Natl.Acad.Sci.USA 89:3952-3956;Baim等人,(1991)Proc.Natl.Acad.Sci.USA 88:5072-5076;Wyborski等人,(1991)Nucleic Acids Res.19:4647-4653;Hillenand-Wissman(1989)Topics Mol.Struc.Biol.10:143-162;Degenkolb等人,(1991)Antimicrob.Agents Chemother.35:1591-1595;Kleinschnidt等人,(1988)Biochemistry 27:1094-1104;Bonin(1993)德国海德尔堡大学(University of Heidelberg)博士论文;Gossen等人,(1992)Proc.Natl.Acad.Sci.USA 89:5547-5551;Oliva等人,(1992)Antimicrob.Agents Chemother.36:913-919;Hlavka等人(1985)Handbook of Experimental Pharmacology(《实验药理学手册》),第78卷(Springer-Verlag,Berlin);以及Gill等人,(1988)Nature 334:721-724。这些公开内容以引用的方式并入本文。

以上选择性标记基因的列表并不意指是限制性的。任何选择性标记基因都可用于本发明实施方案。

本发明实施方案的方法涉及将多肽或多核苷酸引入植物中。“引入”意在指以多核苷酸或者多肽序列进入植物细胞内部的方式将多核苷酸或者多肽呈送到植物。本发明实施方案的方法不依赖于将多核苷酸或多肽引入植物中的具体方法,只要多核苷酸或多肽可进入植物的至少一个细胞的内部即可。用于将多核苷酸或多肽引入植物中的方法是本领域已知的,包括但不限于稳定转化方法、瞬时转化方法和病毒介导的方法。

“稳定转化”意指被引入植物中的核苷酸构建体整合进植物的基因组中,并能够由其后代继承。“瞬时转化”意指将多核苷酸引入植物中但它没有整合进植物的基因组中,或者将多肽引入植物中。

转化方案以及将核苷酸序列引入植物中的方案,可以根据转化所靶向的植物或者植物细胞的类型(即单子叶植物或者双子叶植物)变动。将核苷酸序列引入植物细胞中并随后插入植物基因组中的合适方法包括:微量注射法(Crossway等人,(1986)Biotechniques 4:320-334)、电穿孔(Riggs等人,(1986)Proc.Natl.Acad.Sci.USA 83:5602-5606)、农杆菌介导的转化(美国专利No.5,563,055和5,981,840)、直接基因转移(Paszkowski等人,(1984)EMBO J.3:2717-2722)以及弹道粒子加速(参见例如美国专利No.4,945,050;5,879,918;5,886,244;和5,932,782;Tomes等人,(1995),载于Plant Cell,Tissue,and Organ Culture:Fundamental Methods,Gamborg和Phillips编辑(Springer-Verlag,Berlin);以及McCabe等人,(1988)Biotechnology 6:923-926);以及Lecl转化(WO 00/28058)。对于马铃薯转化,参见Tu等人,(1998)Plant Molecular Biology 37:829-838;以及Chong等人,(2000)Transgenic Research 9:71-78。另外的转化程序可见于Weissinger等人,(1988)Ann.Rev.Genet.22:421-477;Sanford等人,(1987)Particulate Science and Technology 5:27-37(洋葱);Christou等人,(1988)Plant Physiol.87:671-674(大豆);McCabe等人,(1988)Bio/Technology 6:923-926(大豆);Finer和McMullen,(1991)In Vitro Cell Dev.Biol.27P:175-182(大豆);Singh等人,(1998)Theor.Appl.Genet.96:319-324(大豆);Datta等人,(1990)Biotechnology 8:736-740(水稻);Klein等人,(1988)Proc.Natl.Acad.Sci.USA 85:4305-4309(玉蜀黍);Klein等人,(1988)Biotechnology 6:559-563(玉蜀黍);美国专利No.5,240,855;5,322,783和5,324,646;Klein等人,(1988)Plant Physiol.91:440-444(玉蜀黍);Fromm等人,(1990)Biotechnology 8:833-839(玉蜀黍);Hooykaas-Van Slogteren等人,(1984)Nature(London)311:763-764;美国专利No.5,736,369(谷类);Bytebier等人,(1987)Proc.Natl.Acad.Sci.USA 84:5345-5349(百合科);De Wet等人,(1985),载于The Experimental Manipulation of Ovule Tissues,Chapman等人编辑(Longman,New York),第197-209页)(花粉);Kaeppler等人,(1990)Plant Cell Reports 9:415-418,以及Kaeppler等人,(1992)Theor.Appl.Genet.84:560-566(颈须介导的转化);D′Halluin等人,(1992)Plant Cell 4:1495-1505(电穿孔);Li等人,(1993)Plant Cell Reports 12:250-255以及Christou和Ford,(1995)Annals of Botany 75:407-413(水稻);Osjoda等人,(1996)Nature Biotechnology 14:745-750(玉蜀黍,通过根瘤农杆菌(Agrobacterium tumefaciens));将所有这些文献和专利以引用方式并入本文。

在具体的实施方案中,所述实施方案的序列可用多种瞬时转化方法提供给植物。这类瞬时转化方法包括但不限于直接向植物中引入Cry毒素蛋白或其变体和片段,或者向植物中引入Cry毒素转录物。这类方法包括(例如)显微注射法或粒子轰击法。参见例如Crossway等人,(1986)Mol Gen.Genet.202:179-185;Nomura等人,(1986)Plant Sci.44:53-58;Hepler等人,(1994)Proc.Natl.Acad.Sci.91:2176-2180以及Hush等人,(1994)The Journal of Cell Science 107:775-784;所有这些文献以引用方式并入本文。作为另一种选择,可使用本领域已知的技术将Cry毒素多核苷酸瞬时转化到植物中。此类技术包括利用病毒载体系统,和将多核苷酸以避免DNA随后释放的方式沉淀。因此,从粒子结合的DNA可发生转录,但其释放出来而整合进基因组中的频率则大大降低。此类方法包括使用包被有聚乙基亚胺(PEI;Sigma#P3143)的粒子。

用于在植物基因组中特定位置处靶向插入多核苷酸的方法是本领域已知的。在一个实施方案中,在期望的基因组位置处插入多核苷酸是使用位点特异性重组系统实现的。参见例如WO99/25821、WO99/25854、WO99/25840、WO99/25855和WO99/25853,这些专利全部以引用方式并入本文。简而言之,可将本发明实施方案的多核苷酸包含在转移盒中,该转移盒旁侧是两个不相同的重组位点。将转移盒引入植物中,该植物基因组中稳定掺入有靶位点,其中所述靶位点旁侧是两个与该转移盒的所述位点相对应的不相同重组位点。提供适当的重组酶,将转移盒整合在该靶位点处。目的多核苷酸因此被整合在植物基因组中的特定染色体位置处。

可依据常规方式将已转化的细胞培育成植株。参见例如,McCormick等人,(1986)Plant Cell Reports 5:81-84。然后可栽培这些植株并用同一转化株系或不同的株系进行授粉,并鉴定出具有所需表型特征的组成型或者诱导型表达的所得杂交种。可以培育两代或更多代以确保稳定保持和遗传所需表型特性的表达,然后收获种子以确保已经实现所需表型特征的表达。

本发明实施方案的核苷酸序列可通过使植物与病毒或者病毒核酸接触而提供给植物。通常,这种方法涉及将目的核苷酸构建体掺入病毒DNA或RNA分子内。应当认识到,本发明实施方案的重组蛋白可最初作为病毒聚蛋白的一部分来合成,其以后可通过体内或体外蛋白水解加工而产生所需的杀虫蛋白。还认识到,这种包含本发明实施方案的杀虫蛋白的氨基酸序列的至少一部分的病毒聚蛋白可具有所需的杀虫活性。这种病毒聚蛋白及其编码核苷酸序列为本发明实施方案所涵盖。用于给植物提供核苷酸构建体并在植物中产生所编码的蛋白质的方法(涉及病毒DNA或RNA分子)是本领域已知的。参见例如美国专利No.5,889,191;5,889,190;5,866,785;5,589,367;和5,316,931;这些专利以引用方式并入本文。

所述实施方案还涉及所述实施方案的转化植物的植物繁殖材料,包括但不限于种子、块茎、球茎、鳞茎、叶、以及根和苗的插条。

本发明实施方案可用于转化任何植物物种,包括但不限于单子叶植物和双子叶植物。所关注的植物的示例包括但不限于玉米(Zea mays)、芸苔属物种(Brassica sp.)(例如甘蓝型油菜(B.napus)、芜菁(B.rapa)、芥菜(B.juncea)),特别是可用作种子油来源的那些芸苔属物种;苜蓿(Medicago sativa)、水稻(Oryza sativa)、黑麦(Secale cereale)、高粱(Sorghum bicolor,Sorghum vulgare)、粟(例如珍珠粟(Pennisetum glaucum)、黄米(Panicum miliaceum)、谷子(Setaria italica)、龙爪稷(Eleusine coracana))、向日葵(Helianthus annuus)、红花(Carthamus tinctorius)、小麦(Triticum aestivum)、大豆(Glycine max)、烟草Nicotiana tabacum)、马铃薯(Solanum tuberosum)、花生(Arachis hypogaea)、棉花(海岛棉(Gossypium barbadense)、陆地棉(Gossypium hirsutum))、甘薯(Ipomoea batatus)、木薯(Manihot esculenta)、咖啡(Coffea spp.)、椰子(Cocos nucifera)、菠萝(Ananas comosus)、柑橘(Citrus spp.)、可可(Theobroma cacao)、茶(Camellia sinensis)、香蕉(Musa spp.)、鳄梨(Persea americana)、无花果(Ficus casica)、番石榴(Psidium guajava)、芒果(Mangifera indica)、橄榄(Olea europaea)、木瓜(Carica papaya)、腰果(Anacardium occidentale)、澳洲坚果(Macadamia integrifolia)、杏树(Prunus amygdalus)、糖用甜菜(Beta vulgaris)、甘蔗(Saccharum spp.)、燕麦、大麦、蔬菜、观赏植物和针叶树。

蔬菜包括番茄(Lycopersicon esculentum)、莴苣(例如Lactuca sativa)、青豆(Phaseolus vulgaris)、利马豆(Phaseolus limensis)、豌豆(香豌豆属(Lathyrus)物种)和黄瓜属(Cucumis)的成员比如黄瓜(C.sativus)、香瓜(C.cantalupensis)和甜瓜(C.melo)。观赏植物包括杜鹃(杜鹃花属(Rhododendron)物种)、八仙花(Macrophylla hydrangea)、朱槿(Hibiscus rosasanensis)、玫瑰(蔷薇属(Rosa)物种)、郁金香(郁金香属(Tulipa)物种)、水仙(水仙属(Narcissus)物种)、矮牵牛(Petunia hybrida)、康乃馨(Dianthus caryophyllus)、一品红(Euphorbia pulcherrima)和菊花。可应用于实践所述实施方案的针叶树包括例如松树,如火炬松(Pinus taeda)、沼泽松(Pinus elliotii)、美国黄松(Pinus ponderosa)、黑松(Pinus contorta)和蒙特利松(Pinus radiata);花旗松(Pseudotsuga menziesii);西铁杉(Tsuga canadensis);北美云杉(Picea glauca);红杉(Sequoia sempervirens);枞树(true firs)诸如银枞(Abies amabilis)和胶枞(Abies balsamea);以及雪松诸如西方红雪松(Thuja plicata)和阿拉斯加黄雪松(Chamaecyparis nootkatensis)。本发明实施方案的植物包括作物植物,包括但不限于:玉米、苜蓿、向日葵、芸苔属物种(Brassica spp.)、大豆、棉花、红花、花生、高粱、小麦、粟、烟草属植物、甘蔗等。

草坪草包括但不限于:一年生早熟禾(Poa annua);一年生黑麦草(Lolium multiflorum);加拿大蓝草(Poa compressa);紫羊茅(Festuca rubra);细弱剪股颖(Agrostis tenuis);匍匐翦股颖(Agrostis palustris);光穗冰草(Agropyron desertorum);扁穗冰草(Agropyron cristatum);硬羊茅(Festuca longifolia);肯塔基蓝草(Poa pratensis);果园草(Dactylis glomerata);多年生黑麦草(Lolium perenne);紫羊茅(Festuca rubra);红顶草(Agrostis alba);粗茎蓝草(Poa trivialis);羊茅(Festuca ovina);无芒雀麦草(Bromnus inermis);高羊茅(Festuca arundinacea);梯牧草(Phleum pratense);绒毛剪股颖(Agrostis canina);碱茅(Puccinellia distans);西方冰草(Agropyron smithii);百慕达草(Cynodon spp.);圣奥古斯丁草(Stenotaphrum secundatum);结缕草(Zoysia spp.);美洲雀稗(Paspalum notatum);地毯草(Axonopus affinis);百足草(Eremochloa ophiuroides);狼尾草(Pennisetum clandesinum);海滨雀稗(Paspalum vaginatum);蓝格兰马草(Bouteloua gracilis);野牛草(Buchloe dactyloids);垂穗草(Bouteloua curtipendula)。

所关注的植物包括谷物植物(提供所关注的种子)、油籽植物和豆科植物。所关注的种子包括谷物种子,如玉米、小麦、大麦、水稻、高粱、黑麦、粟等。油籽植物包括棉花、大豆、红花、向日葵、芸苔属植物、玉蜀黍、苜蓿、棕榈、椰子、亚麻、蓖麻、橄榄等。豆科植物包括豆类和豌豆。豆类包括瓜尔豆、槐豆、胡芦巴、大豆、四季豆、豇豆、绿豆、利马豆、蚕豆、小扁豆、鹰嘴豆等。

在某些实施方案中,本发明实施方案的核酸序列可与目的多核苷酸序列的任何组合进行堆叠(stack),以产生具有所需表型的植物。例如,本发明实施方案的多核苷酸可与任何其它编码具有杀虫和/或杀昆虫活性的多肽的多核苷酸进行堆叠,所述多肽例如其它Bt毒蛋白(描述于美国专利No.5,366,892;5,747,450;5,736,514;5,723,756;5,593,881;以及Geiser等人(1986)Gene 48:109)、五邻体蛋白(pentin)(描述于美国专利No.5,981,722)等。所产生的组合还可包括目的多核苷酸中的任何一者的多个拷贝。本发明实施方案的多核苷酸也可与任何其它基因或者基因组合进行堆叠,以产生具有多种所需的性状组合的植物,所述性状包括但不限于动物饲料所需的性状如高油基因(例如美国专利No.6,232,529);平衡的氨基酸(例如hordothionins(美国专利No.5,990,389;5,885,801;5,885,802;和5,703,049);大麦高赖氨酸(Williamson等人,(1987)Eur.J.Biochem.165:99-106;和WO 98/20122)以及高甲硫氨酸蛋白(Pedersen等人,(1986)J.Biol.Chem.261:6279;Kirihara等人,(1988)Gene 71:359;和Musumura等人,(1989)Plant Mol.Biol.12:123));消化性提高(例如经修饰的贮藏蛋白(美国专利6,858,778);和硫氧还蛋白(美国专利No.7,009,087);将这些文献和专利的公开内容以引用方式并入本文。

本发明实施方案的多核苷酸也可与疾病或者抗除草剂性所需的性状进行堆叠(例如伏马毒素脱毒基因(美国专利No.5,792,931);无毒性和疾病抗性基因(Jones等人,(1994)Science 266:789;Martin等人,(1993)Science 262:1432;以及Mindrinos等人,(1994)Cell 78:1089);导致抗除草剂性的乙酰乳酸合酶(ALS)突变体,例如S4和/或Hra突变;谷氨酰胺合酶的抑制剂例如草丁膦或basta(例如,bar基因);以及草甘膦抗性(EPSPS基因和GAT基因,如美国专利No.7,709,702和7,462,481中所公开;以及加工或过程产物所需的性状,如高油(例如美国专利No.6,232,529);改性油(例如脂肪酸去饱和酶基因(美国专利No.5,952,544;WO 94/11516));改性淀粉(例如ADPG焦磷酸化酶(AGP酶)、淀粉合酶(SS)、淀粉分支酶(SBE)和淀粉脱支酶(SDBE));以及聚合物或者生物塑料(例如美国专利No.5,602,321;β-酮基硫解酶、聚羟基丁酸合酶和乙酰乙酰基-CoA还原酶(Schubert细菌,(1988)J.Bacteriol.170:5837-5847)有利于聚羟基链烷酸酯(PHA)的表达),以上公开内容以引用方式并入本文。还可以将本发明实施方案的多核苷酸与提供诸如雄性不育(例如参见美国专利No.5.583,210)、茎秆强度、开花时间之类的农学性状或者诸如细胞周期调控或基因靶向(例如WO 99/61619;WO 00/17364;WO 99/25821)之类的转化技术性状的多核苷酸组合,以上公开内容以引用方式并入本文。

在一些实施方案中,堆叠的性状可为已取得监管批准的性状或事件,包括但不限于表4A-F中的事件。

表4A Glvcine max L.大豆

表4A续表Glycine maxL.大豆

表4B Triticum aestivum小麦

表4C Zea mays L.玉蜀黍

表4C续表Zea mays L.玉蜀黍

表4C续表Zea mays L.玉蜀黍

表4C续表Zea mays L.玉蜀黍

表4C续表Zea mays L.玉蜀黍

表4C续表Zea mays L.玉蜀黍

表4D Oryza sativa水稻

表4E Helianthus annuus向日葵

表4F Medicago sativa苜蓿

其它监管批准的事件是本领域技术人员熟知的并且可见于环境风险评估中心(cera-gmc.org/?action=gm_crop_database,可使用www前缀对其进行访问)和国际农业生物技术应用服务组织(International Service for the Acquisition of Agri-Biotech Applications)(isaaa.org/gmapprovaldatabase/default.asp,可使用www前缀对其进行访问)。

这些堆叠的组合可通过任何方法来产生,包括但不限于通过任何常规方法或方法或遗传转化来对植物进行杂交育种。如果性状是通过遗传转化植株来堆叠,则目的多核苷酸序列可在任何时间以任何顺序进行组合。例如,可将包含一种或多种期望性状的转基因植物用作靶标,通过后续的转化引入更多性状。可以用共转化方案将性状与目的多核苷酸同时引入,所述目的多核苷酸由转化盒的任何组合提供。例如,如果将要引入两条序列,则可将该两条序列包含在单独的转化盒中(反式)或包含在同一转化盒中(顺式)。可通过相同启动子或不同启动子驱动所述序列表达。在某些情况下,可期望引入会抑制目的多核苷酸的表达的转化盒。这可以与其它抑制盒或过表达盒的任何组合进行组合以在植物中生成所需的性状组合。还认识到,可使用位点特异性重组系统在所需的基因组位置处堆叠多核苷酸序列。参见例如WO99/25821、WO99/25854、WO99/25840、WO99/25855和WO99/25853,这些专利全部以引用方式并入本文。

本发明实施方案的组合物可用于以多种方式保护植物、种子和植物产物。例如,所述组合物可用于涉及通过选自喷雾、喷粉、广播或者种子涂覆的程序将有效量的杀虫组合物置于害虫的环境中的方法中。

在植物繁殖材料(果实、块茎、鳞茎、球茎、谷物、种子),但尤其是种子,作为商品出售之前,其通常用保护剂包衣进行处理,所述保护剂包衣包含除草剂、杀昆虫剂、杀真菌剂、杀细菌剂、杀线虫剂、杀软体动物剂或这些制剂中的几种的混合物,如果需要的话还进一步加上制剂领域常用的载体、表面活性剂或促施用助剂,以提供对由抗细菌、真菌或动物害虫造成的损害的保护。为了处理种子,可通过如下方法将保护剂包衣施用至种子:用液体制剂浸渍块茎或谷粒,或用组合的湿或干制剂对种子进行涂覆。另外,在特殊的情况中,其它施用至植物的方法也是可能的,例如针对芽或果实进行的处理。

包含编码本发明实施方案的杀虫蛋白的核苷酸序列的本发明实施方案的植物种子,可用包含种子处理化合物的种子保护剂包衣进行处理,所述种子处理化合物例如克菌丹、萎锈灵、福美双、methalaxyl、甲基嘧啶磷以及其它常用于种子处理的化合物。在一个实施方案中,包含本发明实施方案的杀虫组合物的种子保护剂包衣单独使用或者与常用于种子处理的种子保护剂包衣之一组合使用。

认识到,可用编码杀虫蛋白的基因来转化昆虫病原生物体。这种生物体包括杆状病毒、真菌、原生动物、细菌和线虫。

可通过合适的载体将编码本发明实施方案的杀虫蛋白的基因引入到微生物宿主中,并将所述宿主施放到环境或者植物或者动物。在将核酸插入细胞中的语境中的术语“引入”,意指“转染”或“转化”或“转导”,包括指涉核酸掺入真核或原核细胞中,其中该核酸可掺入细胞的基因组(例如染色体、质粒、质体或线粒体DNA)中、转化成自主复制或者瞬时表达(例如转染的mRNA)。

可选择已知会占领一种或者多种所关注作物的“植物圈”(叶面、叶圈、根际和/或根面)的微生物宿主。选择这些微生物以便能够在特定环境中成功地与野生型微生物竞争,提供表达杀虫蛋白的基因的稳定维持和表达,并且理想地提供改善的对该杀虫剂的保护使其不受环境降解和失活。

这种微生物包括细菌、藻类和真菌。特别要关注的是微生物:例如细菌,如假单胞菌属(Pseudomonas)、欧文氏菌属(Erwinia)、沙雷氏菌属(Serratia)、克雷伯氏杆菌属(Klebsiella)、黄单胞菌属(Xanthomonas)、链霉菌属(Streptomyces)、根瘤菌属(Rhizobium)、红假单胞菌属(Rhodopseudomonas)、甲基菌属(Methylius)、农杆菌属(Agrobacterium)、醋酸杆菌属(Acetobacter)、乳酸杆菌属(Lactobacillus)、节细菌属(Arthrobacter)、固氮菌属(Azotobacter)、明串珠菌属(Leuconostoc)和产碱杆菌属(Alcaligenes);真菌,尤其是酵母如酵母菌属(Saccharomyces)、隐球菌属(Cryptococcus)、克鲁维酵母菌属(Kluyveromyces)、掷孢酵母属(Sporobolomyces)、红酵母属(Rhodotorula)和短梗霉属(Aureobasidium)。特别值得关注的是诸如以下的植物圈细菌物种:丁香假单胞菌(Pseudomonas syringae)、荧光假单胞菌(Pseudomonas fluorescens)、粘质沙雷氏菌(Serratia marcescens)、木醋杆菌(Acetobacter xylinum)、农杆菌(Agrobacteria)、球形红假单胞菌(Rhodopseudomonas spheroides)、野油菜黄单胞菌(Xanthomonas campestris)、苜蓿根瘤菌(Rhizobium melioti)、富营养产碱菌(Alcaligenes entrophus)、木质棍状杆菌(Clavibacter xyli)和维涅兰德固氮菌(Azotobacter vinelandii),以及诸如以下的植物圈酵母物种:深红酵母(Rhodotorula rubra)、粘红酵母(R.glutinis)、海滨红酵母(R.marina)、橙黄红酵母(R.aurantiaca)、浅白色隐球酵母(Cryptococcus albidus)、流散隐球酵母(C.diffluens)、罗伦隐球酵母(C.laurentii)、罗斯酵母(Saccharomyces rosei)、S.pretoriensis、酿酒酵母(S.cerevisiae)、粉红掷孢酵母(Sporobolomyces roseus)、香气掷孢酵母(S.odorus)、Kluyveromyces veronae和茁芽短梗霉(Aureobasidium pollulans)。特别要关注的是有色素微生物。

有多种方式可用来将表达杀虫蛋白的基因引入处于容许该基因的稳定维持和表达的条件下的微生物宿主中。例如,可构建出这样的表达盒,其包括目的核苷酸构建体及为了该核苷酸构建体的表达该核苷酸构建体可操作地连接的转录和翻译调控信号、与宿主生物体中的序列同源的核苷酸序列(据此将发生整合)和/或在宿主中具有功能的复制系统(据此将发生整合或稳定维持)。

转录和翻译调控信号包括但不限于启动子、转录起始位点、操纵子、活化子、增强子、其它调控元件、核糖体结合位点、起始密码子、终止信号等。参见例如,美国专利No.5,039,523和No.4,853,331;EPO 0480762A2;Sambrook;Maniatis等人(冷泉港实验室出版社,纽约冷泉港(Cold Spring Harbor Laboratory Press,Cold Spring Harbor,New York));Davis等人编辑,(1980)Advanced Bacterial Genetics(Cold Spring Harbor Laboratory Press)以及其中引用的参考文献。

如果含杀虫蛋白的细胞要被进行处理以延长当将经处理的细胞施用于靶标害虫的环境时杀虫蛋白在细胞中的活性,则合适的宿主细胞可包括原核生物或者真核生物,通常限于那些不会产生对高等生物体(如哺乳动物)有毒的物质的细胞。但是,如果毒素不稳定或者施用水平足够低以避免对哺乳动物宿主的毒性的任何可能性,则可以使用会产生对高等生物体有毒的物质的生物体。作为宿主,特别要关注的将是原核生物和低等真核生物如真菌。示例性的革兰氏阴性和革兰氏阳性原核生物包括肠杆菌科(Enterobacteriaceae),例如埃希氏菌属(Escherichia)、欧文氏菌属(Erwinia)、志贺氏菌属(Shigella)、沙门氏菌属(Salmonella)和变形杆菌属(Proteus);芽胞杆菌科(Bacillaceae);根瘤菌科(Rhizobiaceae),例如根瘤菌属(Rhizobium);螺菌科(Spirillaceae),例如发光杆菌属(photobacterium)、发酵单胞菌属(Zymomonas)、沙雷氏菌(Serratia)、气单胞菌属(Aeromonas)、弧菌属(Vibrio)、脱硫弧菌属(Desulfovibrio)、螺菌属(Spirillum);乳杆菌科(Lactobacillaceae);假单胞菌科(Pseudomonadaceae),例如假单胞菌属(Pseudomonas)和醋杆菌属(Acetobacter);固氮菌科(Azotobacteraceae)硝化杆菌科(Nitrobacteraceae)。真核生物之中为真菌,例如藻状菌纲(Phycomycetes)和子囊菌纲(Ascomycetes),其包括酵母诸如酵母属(Saccharomyces)和裂殖酵母属(Schizosaccharomyces);以及担子菌纲(Basidiomycetes)酵母,例如红酵母属(Rhodotorula)、出芽短梗霉(Aureobasidium)、掷孢酵母属(Sporobolomyces)等等。

在为了杀虫蛋白生产目的而选择宿主细胞时特别要关注的特征包括杀虫蛋白基因向宿主中引入的便利性、表达系统的可获得性、表达的效率、蛋白质在宿主中的稳定性以及辅助遗传能力的存在。对于作为杀虫剂微胶囊使用要关注的特征包括杀虫剂的保护质量,如厚细胞壁、色素沉着以及包涵体的胞内包装或形成;叶亲和力;哺乳动物毒性的缺乏;对害虫取食的吸引力;在不对毒素造成损害的情况下杀灭和固定的容易性;等。其它考虑因素包括配制和操作容易性、经济性、贮存稳定性等。

特别值得关注的宿主生物体包括酵母,如红酵母属(Rhodotorula spp.)物种、短梗霉属(Aureobasidium spp.)物种、酵母属(Saccharomyces spp.)物种(如酿酒酵母(S.cerevisiae))、掷孢酵母属(Sporobolomyces spp.)物种、叶面生物如假单胞菌属(Pseudomonas spp.)物种(如铜绿假单胞菌(P.aeruginosa)、荧光假单胞菌(P.fluorescens))、欧文氏菌属(Erwinia spp.)物种和黄杆菌属(Flavobacterium spp.)物种和其它此类生物体,包括Bt、大肠杆菌、枯草芽孢杆菌(Bacillus subtilis)等。

可将编码本发明实施方案的杀虫蛋白的基因引入植物上繁殖的微生物(体表寄生菌)中,以将杀虫蛋白递送到潜在的靶标害虫。体表寄生菌例如可以是革兰氏阳性或革兰氏阴性细菌。

根定殖细菌可通过例如本领域已知的方法从所关注的植物分离。具体而言,定殖于根的蜡状芽孢杆菌(Bacillus cereus)菌株可从植物的根分离(参见例如,Handelsman等人,(1991)Appl.Environ.Microbiol.56:713-718)。可通过本领域已知的标准方法将编码本发明实施方案的杀虫蛋白的基因引入根定殖蜡状芽孢杆菌中。

可通过电转化手段将编码杀虫蛋白的基因例如引入到根定殖芽孢杆菌中。具体而言,可将编码杀虫蛋白的基因克隆到穿梭载体如pHT3101中(Lerecius等人,(1989)FEMS Microbiol.Letts.60:211-218)。含有特定杀虫蛋白基因的编码序列的穿梭载体pHT3101可例如通过电穿孔手段转化到根定殖芽孢杆菌中(Lerecius等人,(1989)FEMS Microbiol.Letts.6 0:211-218)。

可设计表达系统,使得杀虫蛋白被分泌到革兰氏阴性细菌(如大肠杆菌)的细胞质之外。分泌杀虫蛋白的好处是:(1)避免所表达的杀虫蛋白的潜在细胞毒性作用;和(2)改善杀虫蛋白的纯化效率,包括但不限于提高每体积细胞培养液的蛋白质回收和纯化效率和降低每单位蛋白质的回收和纯化时间和/或成本。

可例如通过将适当的大肠杆菌信号肽与杀虫蛋白的氨基末端融合,使杀虫蛋白在大肠杆菌中分泌。由大肠杆菌识别的信号肽可存在于已知在大肠杆菌中分泌的蛋白质,例如OmpA蛋白(Ghrayeb等人(1984)EMBO J,(《欧洲分子生物学组织杂志》)3:2437-2442)。OmpA是大肠杆菌外膜的主要蛋白质,因此它的信号肽被认为在易位过程中有效。另外,在加工前不需要对OmpA信号肽进行修饰,而其它信号肽例如脂蛋白信号肽则需要(Duffaud等人,(1987)Meth.Enzymol.153:492)。

可在细菌宿主中发酵本发明实施方案的杀虫蛋白,并且将所得的细菌加工并以与Bt菌株已被用作杀昆虫喷雾剂相同的方式用作微生物喷雾剂。在杀虫蛋白从芽孢杆菌分泌的情况中,用本领域已知的程序将分泌信号移除或者突变。这种突变和/或缺失能防止杀虫蛋白在发酵过程中分泌到生长培养基中。杀虫蛋白保持在细胞内,然后将细胞进行加工以得到封装的杀虫蛋白。任何合适的微生物都可用于这个目的。已用假单胞菌属将Bt毒素表达为封装蛋白,并且将所得的细胞进行加工并作为杀昆虫剂喷施(Gaertner等人,(1993),载于:Advanced Engineered Pesticides,Kim编辑)。

作为另一个选择,通过将异源基因引入细胞宿主中来产生杀虫蛋白。异源基因的表达直接或间接导致该杀虫剂的胞内产生和维持。然后将这些细胞在当将细胞施用于靶标害虫的环境时能延长该产生的毒素在细胞中的活性的条件下进行处理。所得的产物保持该毒素的毒性。然后可按照常规技术配制这些天然封装的杀虫蛋白以便施用于靶标害虫的寄生环境,例如土壤、水和植物的叶。参见例如EP0192319以及其中引用的参考文献。

在本发明实施方案中,可将转化的微生物(其包括完整生物体、细胞、孢子、杀虫蛋白、杀虫组分、害虫影响组分、突变体、活的或者死的细胞和细胞组分,包括活的或者死的细胞和细胞组分的混合物在内,并包括破碎的细胞和细胞组分在内)或者分离的杀虫蛋白可与可接受的载体一起配制成例如以下杀虫组合物:悬浮液、溶液、乳液、撒粉、可分散颗粒或丸、可润湿粉末以及可乳化浓缩物、气溶胶或喷雾剂、浸渍颗粒、助剂、可涂覆糊剂、胶体还有例如在聚合物物质中的封装物。这种配制的组合物可通过诸如将包含该多肽的细胞的培养物进行干燥、冻干、均化、提取、过滤、离心、沉淀或者浓缩的常规手段进行制备。

以上所公开的这类组合物可通过加入以下物质来获得:表面活性剂、惰性载体、防腐剂、保湿剂、取食刺激剂、引诱剂、封装剂、粘合剂、乳化剂、染料、紫外保护剂、缓冲剂、助流剂或肥料、微量营养物供体或其它能影响植物生长的制剂。可将包括但不限于除草剂、杀昆虫剂、杀真菌剂、杀细菌剂、杀线虫剂、杀软体动物剂、杀螨剂、植物生长调节剂、收获助剂和肥料的一种或多种农业化学品与常用于配制领域的载体、表面活性剂或助剂或者其他组分进行组合,以便于产品操作和施用于特定的靶标害虫。合适的载体和助剂可以是固体或液体,并对应于通常用于配制技术的物质,例如天然或再生的矿物质、溶剂、分散剂、润湿剂、增粘剂、粘合剂或肥料。本发明实施方案的活性成分通常以组合物的形式施用,并且可以施用于待处理的作物区、植物或者种子。例如,本发明实施方案的组合物可以在粮仓或者青贮塔(silo)等中施用于在准备贮藏时或者在贮藏过程中的谷物。本发明实施方案的组合物可以与其它化合物同时或者相继施用。施用含有至少一种通过本发明实施方案的细菌菌株产生的杀虫蛋白的本发明实施方案的活性成分或者本发明实施方案的农业化学组合物的方法,包括但不限于施用于叶子、涂覆种子和施用于土壤。施用次数和施用速率取决于相应害虫所侵染的强度。

合适的表面活性剂包括但不限于阴离子化合物如例如金属的羧酸盐;长链脂肪酸的羧酸盐;N-酰基肌氨酸盐;磷酸与脂肪醇乙氧基化物的单酯或二酯或者这类酯的盐;脂肪醇硫酸盐如十二烷基硫酸钠、十八烷基硫酸钠或十六烷基硫酸钠;乙氧基化脂肪醇硫酸盐;乙氧基化烷基苯酚硫酸盐;木质素磺酸盐;石油磺酸盐;烷基芳基磺酸盐如烷基苯磺酸盐或低级烷基萘磺酸盐,例如丁基萘磺酸盐;磺化的萘-甲醛缩合物的盐;磺化的苯酚-甲醛缩合物的盐;更复杂的磺酸盐如酰胺磺酸盐,例如油酸和N-甲基牛磺酸的磺化缩合产物;或者二烷基磺基琥珀酸盐,例如琥珀酸二辛酯的磺酸钠。非离子剂包括脂肪酸酯、脂肪醇、脂肪酸酰胺或者脂肪烷基或烯基取代的酚与环氧乙烷的缩合产物,多元醇醚的脂肪酸酯例如脱水山梨糖醇脂肪酸酯,这种酯类与环氧乙烷的缩合产物例如聚氧乙烯脱水山梨糖醇脂肪酸酯,环氧乙烷和环氧丙烷的嵌段共聚物,炔二醇如2,4,7,9-四乙基-5-癸炔-4,7-二醇,或者乙氧基化的炔二醇。阳离子表面活性剂的示例包括例如脂族单胺、二胺或聚胺如乙酸盐、环烷酸盐或者油酸盐;或者含氧胺如聚氧乙烯烷基胺的氧化胺;通过羧酸与二胺或聚胺的缩合制备的酰胺连接的胺;或者季铵盐。

惰性材料的示例包括但不限于无机矿物质如高岭土、页硅酸盐、碳酸盐、硫酸盐、磷酸盐或者植物材料如软木、粉末玉米穗轴、花生壳、稻壳和胡桃壳。

本发明实施方案的组合物可以为适于直接施用的形式,或者作为初级组合物的浓缩物,在施用前需要用适量的水或者其它稀释剂稀释。杀虫浓度将随具体配方的性质而异,具体而言,取决于它是浓缩物还是直接施用。组合物含有1至98%的固体或液体惰性载体和0至50%或0.1至50%的表面活性剂。这些组合物将以商业产品的标示比率施用,例如当为干燥形式时约0.01磅至5.0磅每英亩,当为液体形式时约0.01品脱至10品脱每英亩。

在又一个实施方案中,本发明实施方案的组合物以及转化的微生物和杀虫蛋白可在配制前先进行处理,以延长当施用于靶标害虫的环境时的杀虫活性,只要该预处理对杀虫活性无害。这种处理可通过化学和/或物理手段进行,只要该处理不会有害地影响组合物的性质。化学试剂的示例包括但不限于卤化剂;醛类如甲醛和戊二醛;抗感染剂如氯化苯甲烃铵;醇类如异丙醇和乙醇;以及组织固定剂如Bouin固定剂和Helly固定剂(参见例如,Humason(1967)Animal Tissue Techniques(《动物组织技术》)(W.H.Freeman and Co.))。

在其它实施方案中,可能有利的是用蛋白酶例如胰蛋白酶处理Cry毒素多肽以活化该蛋白质,然后再将本发明实施方案的杀虫蛋白组合物施用于靶标害虫的环境。通过丝氨酸蛋白酶活化原毒素的方法是本领域熟知的。参见例如Cooksey(1968)Biochem.J.6:445-454以及Carroll和Ellar(1989)Biochem.J.261:99-105,将这些文献的教导内容以引用方式并入本文。例如,合适的活化方案包括但不限于将待活化的多肽例如经纯化的新型Cry多肽(例如,具有SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8和SEQ ID NO:10所示的氨基酸序列)和胰蛋白酶以1/100的蛋白质/胰蛋白酶重量比在20nM NaHCO3(pH 8)中混合并使样品在36℃下煮解3小时。

组合物(包括本发明实施方案的转化微生物和杀虫蛋白)可通过例如以下方式施用于昆虫害虫的环境:喷雾、雾化、撒粉、分散、涂覆或者倾倒、引入土壤中或者引到土壤上、引入灌溉水中、在害虫已开始出现时或者在害虫出现前进行种子处理或者一般施用或者撒粉作为保护措施。例如,可将本发明实施方案的杀虫蛋白和/或转化微生物与谷物混合以在贮藏过程中保护谷物。通常重要的是在植物生长的早期阶段获得对害虫的良好防治,因为这是植物可能受到最严重损害的时期。本发明实施方案的组合物可便利地含有另一杀昆虫剂,如果认为这有必要的话。在一个实施方案中,在种植时将组合物直接施用于土壤,施用的形式为载体与芽孢杆菌菌株或者本发明实施方案的转化微生物的死细胞的组合物的颗粒形式。另一个实施方案是包含农业化学品例如除草剂、杀昆虫剂、肥料、惰性载体与芽孢杆菌菌株或者本发明实施方案的转化微生物的死细胞的组合物的颗粒形式。

本领域技术人员会认识到,并不是所有的化合物都对所有的害虫同等有效。本发明实施方案的化合物显示出对昆虫害虫的活性,这些昆虫害虫可包括经济上重要的农艺害虫、森林害虫、温室害虫、苗圃害虫、观赏植物害虫、食物和纤维害虫、公共卫生和动物卫生害虫、家庭和商业设施害虫、居室害虫和仓储害虫。昆虫害虫包括选自以下各目的昆虫:鞘翅目、双翅目、膜翅目、鳞翅目、食毛目、同翅目、半翅目、直翅目、缨尾目、革翅目、等翅目、虱目、蚤目、毛翅目等,特别是鞘翅目和鳞翅目。

鳞翅目(Lepidoptera)昆虫包括(但不限于):夜蛾科(Noctuidae)中的行军虫、地老虎、尺蠖和棉铃虫,小地老虎(Agrotis ipsilon Hufnagel)(黑地老虎);灰地老虎(A.orthogonia Morrison)(西部地老虎);A.segetum Denis &Schiffermüller(黄地老虎);粒肤地老虎(A.subterranea Fabricius)(粒肤地蚕);叶波纹须蛾(Alabama argillacea Hübner)(棉叶虫);黎豆夜蛾(Anticarsia gemmatalis Hübner)(黎豆毛虫);粗皮夜蛾(Athetis mindara Barnes and McDunnough)(粗皮地蚕);棉斑实蛾(Earias insulana Boisduval)(多刺螟蛉(spiny bollworm));翠纹金刚钻(E.vittella Fabricius)(斑点螟蛉(spotted bollworm));Egira(Xylomyges)curialis Grote(柑橘地老虎);暗缘地老虎(Euxoa messoria Harris)(darksided cutworm);蕃茄夜蛾(Helicoverpa armigera Hübner)(美洲螟蛉(American bollworm));谷实夜蛾(H.zea Boddie)(玉米穗虫(corn earworm)或棉铃虫(cotton bollworm));烟芽夜蛾(Heliothis virescens Fabricius)(烟草蚜虫(tobacco budworm));苜蓿绿叶蛾(Hypena scabra Fabricius)(green cloverworm);Mamestra configurata Walker(披肩粘虫);甘蓝夜蛾(M.brassicae Linnaeus)(cabbage moth);斑马纹夜蛾(Melanchra picta Harris)(zebra caterpillar);普通夜盗蛾(Pseudaletia unipuncta Haworth)(行军虫);大豆夜蛾(Pseudoplusia includens Walker)(大豆尺蠖);Richia albicosta Smith(西部豆夜蛾);草地贪夜蛾(Spodoptera frugiperda JE Smith)(秋粘虫);S.exigua Hübner(甜菜夜蛾);斜纹贪夜蛾(S.litura Fabricius)(斜纹夜蛾、茶虫);Trichoplusia ni Hübner(卷心菜尺蠖);来自螟蛾科(Pyralidae)和草螟科(Crambidae)的钻蛀虫、鞘蛾、结网毛虫、松果梢斑螟和雕叶虫,如Achroia grisella Fabricius(小蜡螟);脐橙螟蛾(Amyelois transitella Walker)(naval orangeworm);地中海粉螟蛾Anagasta kuehniella Zeller)(Mediterranean flour moth);粉斑螟蛾(Cadra cautella Walker)(杏仁蛾);粉红禾草螟(Chilo partellus Swinhoe)(斑点蛀茎虫(spotted stalk borer));二化螟(C.suppressalis Walker)(条纹蛀茎虫/稻钻心虫(striped stem/rice borer));C.terrenellus Pagenstecher(甘蔗茎钻心虫);外米缀蛾(Corcyra cephalonica Stainton)(米蛾(rice moth));玉米根草螟(Crambus caliginosellus Clemens)(corn root webworm);早熟禾草螟(C.teterrellus Zincken)(禾螟);稻纵卷叶螟(Cnaphalocrocis medinalis Guenée)(稻卷叶虫(rice leaf roller));葡萄野螟(Desmia funeralis Hübner)(葡萄卷叶虫(grape leaffolder));甜瓜绢野螟(Diaphania hyalinata Linnaeus)(甜瓜野螟);黄瓜绢野螟(D.nitidalis Stoll)(泡菜虫);Diatraea grandiosella Dyar(西南玉米螟),D.saccharalis Fabricius(甘蔗钻心虫);南美玉米苗斑螟(Elasmopalpus lignosellus Zeller)(小玉米茎钻心虫(lesser cornstalk borer));墨西哥稻螟(Eoreuma loftini Dyar)(Mexican rice borer);烟草粉螟(Ephestia elutella Hübner)(烟草(可可)飞蛾);大蜡螟(Galleria mellonella Linnaeus)(greater wax moth);甘蔗卷叶蛾(Hedylepta accepta Butler)(甘蔗卷叶虫);水稻切叶野螟(Herpetogramma licarsisalis Walker)(草地螟);向日葵同斑螟(Homoeosoma electellum Hulst)(向日葵螟);草地螟(Loxostege sticticalis Linnaeus)(甜菜网螟);豇豆荚螟(Maruca testulalis Geyer)(豆荚螟);茶树螟(Orthaga thyrisalis Walker)(tea tree web moth);玉米螟(Ostrinia nubilalis Hübner)(欧洲玉米螟(European corn borer));印度谷螟(Plodia interpunctella Hübner)(印度谷蛾(Indian meal moth));Scirpophaga incertulas Walker(三化螟);芹菜网螟(Udea rubigalis Guenée)(芹菜叶虫(celery leaftier));和卷叶蛾科(Tortricidae)的卷叶虫、蚜虫、种实虫以及果实虫,西部黑头长翅卷蛾(Tortricidae Acleris gloverana Walsingham)(Western blackheaded budworm);东部黑头长翅卷蛾(A.variana Fernald)(Eastern blackheaded budworm);棉褐带卷叶蛾(Adoxophyes orana Fischer von )(summer fruit tortrix moth);黄卷蛾属(Archips)物种,包括果树黄卷蛾(A.argyrospila Walker)(果树卷叶虫(fruit tree leaf roller))和欧洲卷叶蛾(A.rosana Linnaeus)(European leaf roller);带卷蛾属物种(Argyrotaenia spp.);Bonagota salubricola Meyrick(巴西苹果卷叶蛾);色卷蛾属物种(Choristoneura spp.);Cochylis hospes Walsingham(条纹向日葵螟);榛小卷蛾(Cydia latiferreana Walsingham)(filbertworm);苹果蠹蛾(C.pomonella Linnaeus)(苹果小卷蛾);萄果实蛀虫(Endopiza viteana Clemens)(葡萄浆果蛾);女贞细卷蛾(Eupoecilia ambiguella Hübner)(葡萄蛾);梨小食心虫(Grapholita molesta Busck)(梨小食心虫);葡萄花翅小卷蛾(Lobesia botrana Denis&Schiffermüller)(欧洲葡萄蛾);杂色卷叶蛾(Platynota flavedana Clemens)(variegated leafroller);荷兰石竹小卷蛾(P.stultana Walsingham)(杂食卷叶蛾);苹白小卷蛾(Spilonota ocellana Denis&Schiffermüller)(苹果芽小卷叶蛾);和向日葵芽蛾(Suleima helianthana Riley)(sunflower bud moth)。

鳞翅目中选择的其它农艺学害虫包括但不限于秋星尺蠖(Alsophila pometaria Harris)(秋尺蠖);桃枝麦蛾(Anarsia lineatella Zeller)(桃条麦蛾);犀额蛾(Anisota senatoria J.E.Smith)(orange striped oakworm);柞蚕(Antheraea pernyi Guérin-Méneville)(柞蚕);家蚕(Bombyx mori Linnaeus)(蚕);棉潜蛾(Bucculatrix thurberiella Busck)(cotton leafperforator);苜蓿黄蝶(Colias eurytheme Boisduval)(alfalfa caterpillar);Datana integerrimaGrote&Robinson(胡桃毛虫);Dendrolimus sibiricus Tschetwerikov(西伯利亚丝蛾),Ennomos subsignaria Hübner(榆树尺蠖);菩提尺蠖(Erannis tiliaria Harris)(椴木尺蠖);甘蔗芽蛾(Erechthias flavistriata Walsingham)(甘蔗芽蛾);黄毒蛾(Euproctis chrysorrhoea Linnaeus)(棕尾毒蛾);黑拟蛉蛾(Harrisina americana Guérin-Méneville)(葡萄叶食虫);Heliothis subflexa Guenée;Hemileuca oliviae Cockrell(牧场毛虫);美国白蛾(Hyphantria cunea Drury)(fall webworm);番茄蠹蛾(Keiferia lycopersicella Walsingham)(番茄蠹蛾);二尾蛱蝶(Lambdina fiscellaria fiscellaria Hulst)(Eastern hemlock looper);西部铁杉尺蠖(L.fiscellaria lugubrosa Hulst)(Western hemlock looper);Leucoma salicis Linnaeus(柳毒蛾);Lymantria dispar Linnaeus(舞毒蛾);天幕毛虫属物种(Malacosoma spp.);番茄天蛾(Manduca quinquemaculata Haworth)(五斑天蛾、番茄天蛾);烟草天蛾(M.sexta Haworth)(番茄天蛾、烟草天蛾);冬尺蠖(Operophtera brumata Linnaeus)(松白条尺蠖蛾);古毒蛾属物种(Orgyia spp.);春尺蠖(Paleacrita vernata Peck)(spring cankerworm);大凤蝶(Papilio cresphontes Cramer)(大黄带凤蝶、橙凤蝶);加州槲蛾(Phryganidia californica Packard)(California oakworm);柑橘潜叶蛾(Phyllocnistis citrella Stainton)(citrus leafminer);斑幕潜叶蛾(Phyllonorycter blancardella Fabricius)(spotted tentiform leafminer);大菜粉蝶(Pieris brassicae Linnaeus)(large white butterfly);小菜粉蝶(P.rapae Linnaeus)(菜白蛾);暗脉菜粉蝶(P.napi Linnaeus)(green veined whitebutterfly);洋蓟羽蛾(Platyptilia carduidactyla Riley)(artichoke plume moth);Plutella xylostella Linnaeus(小菜蛾);Pectinophora gossypiella Saunders(棉红铃虫);纹白蝶Boisduval&Leconte(南部菜青虫);Sabulodes aegrotata Guenée(杂食尺蠖);红疣天社蛾(Schizura concinna J.E.Smith)(red humped caterpillar);麦蛾(Sitotroga cerealella Olivier)(Angoumois grain moth);Thaumetopoea pityocampa Schiffermuller(松树列队毛虫);结网衣蛾(Tineola bisselliella Hummel)(webbing clothesmoth);番茄斑潜蝇(Tuta aboluta Meyrick)(tomato leafminer)和苹果巢蛾(Yponomeuta padella Linnaeus)(ermine moth)。

值得关注的是鞘翅目的幼虫和成体,其包括来自长角象鼻虫科(Anthribidae)、豆象科(Bruchidae)和象甲科(Curculionidae)的象鼻虫,包括但不限于:棉铃象甲(Anthonomus grandis Boheman)(棉籽象鼻虫);向日葵茎象甲(Cylindrocopturus adspersus LeConte)(sunflower stem weevi);蔗根非耳象(Diaprepes abbreviatus Linnaeus)(Diaprepes root weevi);三叶草叶象(Hypera punctata Fabricius)(clover leaf weevi);Lissorhoptrus oryzophilus Kuschel(稻水象甲);西印度蔗象甲(Metamasius hemipterus hemipterus Linnaeus)(West Indian cane weevi);丝光蔗象甲(M.hemipterus sericeus Olivier)(silky cane weevi);Sitophilus granarius Linnaeus(谷象);S.oryzae Linnaeus(米象);红色葵花籽象甲(Smicronyx fulvus LeConte)(red sunflflower seed weevi);灰色葵花籽象甲(S.sordidus LeConte)(gray sunflower seed weevi);Sphenophorus maidisChittenden(玉米象虫);新几内亚蔗象甲(Rhabdoscelus obscurus Boisduval)(New Guinea sugarcane weevi);叶甲科(Chrysomelidae)的跳甲、守瓜、根虫、叶甲、马铃薯甲虫和潜叶虫,包括但不限于:荒地玉米跳甲(Chaetocnema ectypa Horn)(desert corn flea beetle);玉米铜色跳甲(C.pulicaria Melsheimer)(玉米跳甲(corn flea beetle))Colaspis brunnea Fabricius(葡萄肖叶甲);Diabrotica barberiSmith&Lawrence(北方玉米根虫);黄瓜十一星叶甲(D.undecimpunctata howardi Barber)(南方玉米根虫(southern corn rootworm));玉米根萤叶甲(D.virgifera virgifera LeConte)(西部玉米根虫);科罗拉多州马铃薯甲虫(Leptinotarsa decemlineata Say)(科罗拉多马铃薯甲虫);黑角负泥虫(Oulema melanopus Linnaeus)(禾谷叶甲(cereal leaf beetle));十字花科跳甲(Phyllotreta cruciferae Goeze)(玉米跳甲);Zygogramma exclamationis Fabricius(向日葵甲虫);来自瓢甲科(Coccinellidae)的甲虫,包括但不限于:Epilachna varivestis Mulsant(墨西哥豆瓢虫);来自金龟子科(Scarabaeidae)的金龟子和其它甲虫,包括但不限于:牧草金龟(Antitrogus parvulus Britton)(Childers cane grub);北方圆头犀金龟(Cyclocephala borealis Arrow)(northern masked chafer,蛴螬);南方圆头犀金龟(C.immaculata Olivier)(southern masked chafer,蛴螬);白毛革鳞鳃金龟(Dermolepida albohirtum Waterhouse)(Greyback cane beetle);甘蔗犀金龟(Euetheola humilis rugiceps LeConte)(sugarcane beetle);Lepidiota frenchi Blackburn(法国蔗蚧螬);胡萝卜金龟(Tomarus gibbosus De Geer)(carrot beetle);T.subtropicus Blatchley(甘蔗蛴螬);Phyllophaga crinita Burmeister(白蛴螬);P.latifrons LeConte(六月鳃金龟);Popillia japonica Newman(日本金龟子);Rhizotrogus majalis Razoumowsky(欧洲金龟子);来自皮蠹科(Dermestidae)的地毯圆皮蠹(carpet beetle);来自以下各科属的线虫:叩头虫科(Elateridae)、伪金针虫属(Eleodes spp.),纹叩甲属(Melanotus spp.),包括M.communis Gyllenhal(线虫);宽胸叩头虫属物种(Conoderus spp.);丘胸叩甲属物种(Limonius spp.);细胸叩甲属物种(Agriotes spp.);旱地金针虫属物种(Ctenicera spp.);Aeolus属物种;来自小蠹虫科(Scolytidae)的树皮甲虫(bark beetle);来自拟步甲科(Tenebrionidae)的甲虫;来自天牛科(Cerambycidae)科的甲虫,例如但不限于Migdolus fryanus Westwood(长角甲虫);和来自吉丁虫科(Buprestidae)的甲虫,包括但不限于Aphanisticus cochinchinae seminulum Obenberger(潜叶吉丁虫)。

双翅目(Diptera)的成体和未成熟体是值得关注的,包括潜叶虫Agromyza parvicornis Loew(玉米斑潜叶虫);摇蚊,包括但不限于:高粱瘿蚊(Contarinia sorghicola Coquillett(高粱摇蚊(sorghum midge));黑森瘿蚊(Mayetiola destructor Say)(黑森蝇(Hessian fly));向日葵籽摇蚊(Neolasioptera murtfeldtiana Felt)(sunflower seed midge));麦红吸浆虫(Sitodiplosis mosellana Géhin)(小麦摇蚊);果实蝇(实蝇科(Tephritidae))、黑麦秆蝇(Oscinella frit Linnaeus)(眼蝇);蛆,包括但不限于:地种蝇属(Delia spp.)物种,包括灰地种蝇(Delia platura Meigen)(种蝇);麦种蝇(D.coarctata Fallen)(麦秆蝇);夏厕蝇(Fannia canicularis Linnaeus)、小舍蝇(F.femoralis Stein)(lesser house flies);美洲麦杆蝇(Meromyza americana Fitch)(麦秆蝇);舍蝇(Musca domestica Linnaeus)(家蝇类);厩螫蝇(Stomoxys calcitrans Linnaeus)(厩蝇类);面蝇、角蝇、丽蝇、金蝇属物种(Chrysomya spp.);伏蝇属物种(Phormia spp.);和其它家蝇(muscoid fly)害虫、马蝇类虻属物种(Tabanus spp.);肤蝇类胃蝇属物种(Gastrophilus spp.);狂蝇属物种(Oestrus spp.);牛蝇类皮蝇属物种(Hypoderma spp.);鹿蝇类斑虻属物种(Chrysops spp.);绵羊虱蝇(Melophagus ovinus Linnaeus)(虱蝇类);和其它短角亚目(Brachycera)、蚊类伊蚊属物种(Aedes spp.);按蚊属物种(Anopheles spp.);库蚊属物种(Culex spp.);黑蝇类原蚋属物种(Prosimulium spp.);蚋属物种(Simulium spp.);铗蠓、白蛉、尖眼蕈蚊(sciarid)和其它长角亚目(Nematocera)。

作为所关注的昆虫,包括半翅目的那些昆虫,例如、但不限于以下科:球蚜科(Adelgidae)、粉虱科(Aleyrodidae)、蚜科(Aphididae)、链蚧科(Asterolecaniidae)、沫蝉科(Cercopidae)、叶蝉科(Cicadellidae)、蝉科(Cicadidae)、菱飞虱科(Cixiidae)、软介壳虫科(Coccidae)、缘蝽科(Coreidae)、胭蚧科(Dactylopiidae)、飞虱科(Delphacidae)、盾蚧科(Diaspididae)、毡蚧科(Eriococcidae)、蛾蜡蝉科(Flatidae)、蜡蝉科(Fulgoridae)、圆飞虱科(Issidae)、长蝽科(Lygaeidae)、硕蚧科(Margarodidae)、角蝉科(Membracidae)、盲蝽科(Miridae)、旌介壳虫科(Ortheziidae)、蝽科(Pentatomidae)、刺葵介壳虫科(Phoenicococcidae)、根瘤蚜科(Phylloxeridae)、粉蚧科(Pseudococcidae)、木虱科(Psyllidae)、红蝽科(Pyrrhocoridae)和网蝽科(Tingidae)。

来自半翅目的农学上重要的成员包括但不限于:喜绿蝽(Acrosternum hilare Say)(稻绿蝽);豌豆蚜(Acyrthisiphon pisum Harris)(豆长管蚜);球蚜属(Adelgesspp.)(球蚜);苜蓿褐盲蝽(Adelphocoris rapidus Say)(rapid plant bug);Anasa tristis De Geer(南瓜缘蝽);花生蚜(Aphis craccivora Koch)(黑豆蚜);A.fabae Scopoli(黑豆蚜);棉蚜(A.gossypu Glover)(棉蚜、瓜蚜);玉米根蚜(A.maidiradicis Forbes)(corn root aphid);苹果黄蚜(A.pomi De Geer)(苹果蚜);绣线菊蚜(A.spiraecola Patch)(卷叶蚜);印尼轮盾介壳虫(Aulacaspis tegalensis Zehntner)(sugarcane scale);Aulacorthum solani Kaltenbach(茄无网长管蚜);Bemisia tabaci Gennadius(烟粉虱,甘薯粉虱);B.argentifolii Bellows&Perring(银叶粉虱);美洲谷长蝽(Blissus leucopterus leucopterus Say)(高粱长蝽);负子蝽属物种(Blostomatidae spp.);甘蓝短棒蚜(Brevicoryne brassicae Linnaeus)(甘蓝蚜);梨木虱(Cacopsylla pyricola Foerster)(梨黄木虱);马铃薯衣壳蝽(Calocoris norvegicus Gmelin)(potato capsid bug);Chaetosiphon fragaefolii Cockerell(草莓蚜);臭虫科属物种(Cimicidae spp.);缘蝽属物种(Coreidae spp.);方翅网蝽(Corythuca gossypii Fabricius)(棉花网蝽);Cyrtopeltis modesta Distant(番茄蝽);烟草小盲蝽(C.notatus Distant)(suckfly);沫蝉(Deois flavopicta)(spittlebug);Dialeurodes citri Ashmead(柑桔白粉虱);皂荚蝽(Diaphnocoris chlorionis Say)(honeylocust plant bug);Diuraphis noxia Kurdjumov/Mordvilko(俄罗斯小麦蚜);竹禾盾介壳虫(Duplachionaspis divergens Green)(armored scale);玫瑰苹果蚜(Dysaphis plantaginea Paaserini)(rosy apple aphid);棉蝽(Dysdercus suturellus Herrich-)(污棉虫);甘蔗灰粉蚧(Dysmicoccus boninsis Kuwana)(gray sugarcane mealybug);蚕豆微叶蝉(Empoasca fabae Harris)(马铃薯小绿叶蝉);Eriosoma lanigerum Hausmann(苹果绵蚜);Erythroneoura spp.(葡萄小叶蝉);Eumetopina flavipes Muir(岛屿甘蔗飞虱);扁盾蝽属物种(Eurygaster spp.);褐臭椿(Euschistus servus Say)(brown stink bug);一斑臭蝽(E.variolarius Palisot de Beauvois)(one-spotted stink bug);长蝽属物种(Graptostethus spp.)(长蝽科复合体(complex of seed bugs));和Hyalopterus pruni Geoffroy(桃大尾蚜);Icerya purchasi Maskell(吹绵介壳虫);Labopidicola allii Knight(洋葱蝽);Laodelphax striatellus Fallen(灰飞虱);Leptoglossus corculus Say(松叶根蝽);Leptodictya tabida Herrich-Schaeffer(sugarcane lace bug);Lipaphis erysimi Kaltenbach(萝卜蚜);长绿盲蝽(Lygocoris pabulinus Linnaeus)(common green capsid);Lygus lineolaris Palisot de Beauvois(牧草盲蝽);L.HesperusKnight(西部牧草盲蝽);牧草盲蝽(L.pratensis Linnaeus)(common meadow bug);长毛草盲蝽(L.rugulipennis Poppius)(欧洲牧草盲蝽);Macrosiphum euphorbiae Thomas(马铃薯蚜);翠菊叶蝉(Macrosteles quadrilineatus Forbes)(二点叶蝉);Magicicada septendecim Linnaeus(周期蝉);Mahanarva fimbriolata(甘蔗沫蝉);高粱蚜(Melanaphis sacchari Zehntner)(sugarcane aphid);粉蚧(Melanaspis glomerata Green)(black scale);麦无网长管蚜(Metopolophium dirhodum Walker)(rose grain aphid);烟蚜(Myzus persicae Sulzer)(桃蚜);Nasonovia ribisnigri Mosley(莴苣蚜);黑尾叶蝉(Nephotettix cinticeps Uhler)(青叶蝉);二条黑尾叶蝉(N.nigropictus)(黑尾叶蝉);稻绿蝽(Nezara viridula Linnaeus)(南部稻绿蝽);Nilaparvata lugens(褐飞虱);拟麦长蝽(Nysius ericae Schilling)(false chinch bug)茶黄蓟马(Nysius raphanus Howard)(假麦长蝽);稻蝽(Oebalus pugnax Fabricius)(稻褐蝽);Oncopeltus fasciatus Dallas(大马利筋长蝽);Orthops campestris Linnaeus;瘿绵蚜属物种(Pemphigusspp.)(根蚜和瘿蚜);Peregrinus maidis Ashmead(玉米飞虱);甘蔗扁角飞虱(Perkinsiella saccharicida Kirkaldy)(sugarcane delphacid);长山核桃根瘤蚜(Phylloxera devastatrix Pergande)(美洲山核桃根瘤蚜);桔臀纹粉蚧(Planococcus citri Risso)(柑桔粉蚧);苹盲蝽(Plesiocoris rugicollis Fallen)(apple capsid);四线盲蝽(Poecilocapsus lineatus Fabricius)(four-lined plant bug);Pseudatomoscelis seriatus Reuter(棉盲蝽);粉蚧属物种(Pseudococcusspp.)(其它粉蚧复合体);棉草介壳虫(Pulvinaria elongata Newstead(棉草介壳虫);蔗短足蜡蝉(Pyrilla perpusilla Walker)(sugarcane leafhopper);红蝽属物种(Pyrrhocoridae spp.);梨园蚧(Quadraspidiotus perniciosus Comstock)(圣约瑟虫);猎蝽属物种(Reduviidae spp.);玉米缢管蚜(Rhopalosiphum maidis Fitch)(玉米叶蚜);R.padi Linnaeus(禾谷缢管蚜);甘蔗红粉蚧(Saccharicoccus sacchari Cockerell)(pink sugarcane mealybug);Schizaphis graminum Rondani(麦二叉蚜);Sipha flava Forbes(yellow sugarcane aphid);Sitobion avenae Fabricius(麦长管蚜);Sogatella furcifera Horvath(白背飞虱);稻条背飞虱(Sogatodes oryzicola Muir)(稻飞虱);Spanagonicus albofasciatus Reuter(白斑盲蝽);斑点苜蓿蚜(Therioaphis maculata Buckton)(苜蓿斑蚜);谷蛾属物种(Tinidae spp.);Toxoptera aurantii Boyer de Fonscolombe(桔二叉蚜);和T.citricida Kirkaldy(褐色橘蚜);Trialeurodes abutiloneus(纹翅粉虱)和T.vaporariorum Westwood(温室白粉虱);Trioza diospyri Ashmead(柿木虱);以及Typhlocyba pomaria McAtee(白色苹果叶蝉)。

另外,包括蜱螨目(Acari)(螨类)的成体和幼虫,诸如Aceria tosichella Keifer(小麦卷叶螨)苹果全爪螨(Panonychus ulmi Koch)(苹果红蜘蛛);麦岩螨(Petrobia latens Müller)(褐色小麦螨);班氏细螨(Steneotarsonemus bancrofti Michael)(甘蔗细螨);叶螨科(Tetranychidae)的叶螨和红螨,Oligonychus grypus Baker&Pritchard、O.indicus Hirst(甘蔗叶螨(sugarcane leaf mite))、O.pratensis Banks(草地小爪螨)、O.stickneyi McGregor(甘蔗叶螨);Tetranychus urticae Koch(二斑叶螨);迈叶螨(T.mcdanieli McGregor)(McDaniel mite);T.cinnabarinus Boisduval(红蜘蛛螨);T.turkestani Ugarov&Nikolski(草莓蛛螨)、细须螨科(Tenuipalpidae)的葡萄短须螨类、Brevipalpus lewisi McGregor(柑橘红蜘蛛);瘿螨科(Eriophyidae)中的锈螨和芽蜱以及其它食叶螨和对人类和动物健康重要的螨,即表皮螨科(Epidermoptidae)的尘螨、蠕形螨科(Demodicidae)的蠕形螨、食甜螨科(Glycyphagidae)的谷螨,硬蜱科(Ixodidae)的蜱类。黑脚硬蜱(Ixodes scapularis Say)(鹿蜱);全环硬蜱(I.holocyclus Neumann)(澳洲寄生蜱(Australian paralysis tick));变异革蜱(Dermacentor variabilis Say)(美洲犬蜱);美洲钝眼蜱(Amblyomma americanum Linnaeus)(孤星蜱);以及痒螨科(Psoroptidae)、蒲螨科(Pyemotidae)和疥螨科(Sarcoptidae)的痒螨和疥螨。

缨尾目(Thysanura)的昆虫害虫是值得关注的,诸如Lepisma saccharina Linnaeus(蠹虫);家衣鱼(Thermobia domestica Packard)(小灶衣鱼(firebrat))。

另外的节肢动物害虫包括:蜘蛛目(Araneae)的蜘蛛诸如Loxosceles reclusa Gertsch&Mulaik(棕色隐士蛛);和红斑寇蛛(Latrodectus mactans Fabricius)(黑寡妇蜘蛛(black widow spider));和蚰蜓目(Scutigeromorpha)的多足类诸如Scutigera coleoptrata Linnaeus(蚰蜒)。此外,等翅目(Isoptera)的昆虫害虫是值得关注的,包括白蚁科(termitidae)的那些昆虫害虫,例如但不限于Cylindrotermes nordenskioeldi Holmgren和Pseudacanthotermes militaris Hagen(甘蔗白蚁)。缨翅目(Thysanoptera)的昆虫也是值得关注的,包括但不限于蓟马类,例如Stenchaetothrips minutus van Deventer(甘蔗蓟马)。

可在昆虫害虫的早期发育阶段(例如作为幼虫或者其它发育未完全的形式)对昆虫害虫测试本发明实施方案的组合物的杀虫活性。可将昆虫在完全黑暗中在约20℃至约30℃和约30%至约70%相对湿度下饲养。可如以下文献中所述进行生物测定:Czapla和Lang(1990)J.Econ.Entomol.83(6):2480-2485。饲养昆虫幼虫和进行生物测定法的方法是本领域普通技术人员熟知的。

有多种生物测定技术为本领域技术人员所知。一般程序包括将实验化合物或者生物体添加到密闭容器中的食物源。然后在取食和暴露适当的一段时间后,通过(但不限于)死亡率变化、体重减轻、吸引、排斥和其它行为和身体的变化来测量杀虫活性。本文所述的生物测定可用于幼虫阶段或者成虫阶段的任何取食昆虫害虫。

以下实施例以举例说明的方式给出,而非限制本发明。除非上下文另外明确规定,如本文所用的单数形式“一个”、“一种”和“该”包括多个指代物。因此,例如,提及“一个细胞”包括多个此类细胞,并且提及“该蛋白”包括提及一种或多种蛋白以及本领域技术人员已知的其等同物,等等。除非另外明确指明,否则本文所用的所有技术和科学术语均具有本发明所属领域的普通技术人员通常所理解的相同含义。

说明书中提到的所有公布和专利申请指示了本发明适合的本领域技术人员的水平。所有公布和专利申请以引用方式并入本文,如同每个单独的公布或专利申请被具体地和独立地指出以引用方式并入本文一样。

虽然为了清楚理解的目的已通过例证和示例的方式详细地描述的前述发明,但一些变化和修改可在所附权利要求的范围内实施。

实验

实施例1——基因鉴定和大肠杆菌(E.coli)表达

编码SEQ ID NO:4的杀昆虫蛋白的基因可获自命名为UZ348的苏云金芽孢杆菌菌株。使选定的Bt菌株在30mL的培养基中以250rpm振荡生长16小时。使用得自Macherey-Nagel的试剂盒(Catalog#740521)从细胞收集分离的DNA。然后使用Illumina HiSeq2500对DNA进行测序、装配和注释。接着选择目的基因。

合成SEQ ID NO:4的杀昆虫多肽的编码序列SEQ ID NO:3,以及SEQ ID NO:4的变体的编码序列(包括SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:7和SEQ ID NO:9)并克隆到pET28a载体中并转化到大肠杆菌BL21细胞(Invitrogen)中。使大规模1.0L培养物生长直至O.D.600nm~0.8,然后用异丙基β-D-1-硫代半乳糖苷(IPTG)1mM诱导培养物并使其在16℃下生长16小时。用添加有0.02%溶菌酶(w/v)和0.1%Tween-20以及1片完全蛋白酶抑制剂(Roch)的50mL的500mM NaCl/20mM Tris/5mM咪唑/pH 7.9裂解细胞沉淀物。在裂解之后,对溶液进行超声波处理并将溶胞产物在25,000rpm下离心30分钟。使包含可溶性蛋白级份的上清液过滤通过0.45u真空过滤器并然后添加1ml的Talon(Clontech)浆液,接着在旋转器上以100rpm温育1小时以进行结合。然后将溶胞产物添加到柱上并用20ml的50mmM NaCl/20mM Tris/5mM咪唑/pH 7.9分离和洗涤结合的蛋白质,接着用1.5ml的50mmM NaCl/20mM Tris/500mM咪唑/pH 7.9进行洗脱。然后将经纯化的蛋白质透析到50mM碳酸钠缓冲液(pH10)中。在体外取食测定法中,将杀昆虫活性的经纯化蛋白质施加于鳞翅目平板上。

实施例2——用部分纯化蛋白进行的鳞翅目测定

进行杀昆虫活性生物测定筛选以评估杀昆虫蛋白对多种鳞翅目物种的作用:欧洲玉米螟(Ostrinia nubilalis)、玉米穗虫(Helicoverpa zea)、黑地蚕(Agrotis ipsilon)、秋夜蛾(Spodoptera frugiperda)、大豆尺蠖(Pseudoplusia includens)和黎豆毛虫(Anticarsia gemmatalis)。

对96孔板装置中包含经纯化蛋白质的人工饲料进行鳞翅目取食测定。然后将经纯化的蛋白质(25ul)添加到人工饲料中。每孔放入2到5只新生幼虫,随意饲喂取食5天。对于诸如发育迟缓和/或死亡的幼虫反应,结果表示为阳性。如果幼虫与饲喂只加入上述缓冲液的食物的阴性对照相似,则结果表示为阴性。在欧洲玉米螟(Ostrinia nubilalis)、玉米穗虫(Helicoverpa zea)、黑地蚕(Agrotis ipsilon)、秋夜蛾(Spodoptera frugiperda)、大豆尺蠖(Pseudoplusia includens)和黎豆毛虫(Anticarsia gemmatalis)上对每种经纯化蛋白质以单一浓度进行初步生物测定筛选。昆虫测定按以下标准评分:3=100%死亡率;2=严重发育迟缓;1=发育迟缓;和0=无活性。

SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:8和SEQ ID NO:10的杀昆虫多肽的初步杀昆虫测定结果示于表5中。

表5

对SEQ ID NO:6的杀昆虫多肽而言,在初步生物测定之后还针对CEW和FAW测定一系列浓度的相应经纯化蛋白质样品。

对SEQ ID NO:6的杀昆虫多肽而言,计算了SEQ ID NO:6的蛋白质的一系列浓度和50%死亡率(LC50)或50%个体受抑制(IC50)的浓度。SEQ ID NO:6的杀昆虫多肽的LC50/IC50结果示于表6中。

表6

实施例3——秋粘虫(FAW)的CrylF抗性品系中杀昆虫多肽的交互抗性

利用对鳞翅目昆虫的标准化饲料掺入生物测定来评估SEQ ID NO:6对FAW幼虫的影响。将蛋白质与鳞翅目特定的人工饲料组合,以形成生物测定饲料。基于范围搜寻测定结果,对易感性和CrylF-抗性FAW品系两者的测试浓度在2倍稀释液中为0.156-40ppm。使用96孔板对所有浓度处理加上缓冲液检测中的每一者进行4次平行测定,并且每种浓度在各个平板中占8个孔。将一个新生FAW置入包含生物测定饲料和杀昆虫蛋白的平板的各个孔中。在各个生物测定开始之后,将所有平板于26.7±1℃下孵育4天。基于概率元分析,使用基于死亡的死亡率数据计算50%致死浓度(LC50)。对死亡率和严重发育迟缓的计数进行评分并合并为对50%个体受抑制(IC50)进行计算的总响应。基于蛋白质对易感和抗性FAW品系的LC/IC50来计算抗性比(RR)。

RR=抗性品系的LC或IC50/易感品系的LC或IC50

表7示出Cry1F抗性的FAW品系对SEQ ID NO:6没有交互抗性(RR=0.4,基于IC50)。

表7

SS=易感品系

Res=抗性品系

实施例4——农杆菌介导的玉蜀黍转化和转基因植物的再生

为用多核苷酸序列(例如SEQ ID NO:1或SEQ ID NO:3)进行农杆菌介导的玉蜀黍转化,可使用Zhao的方法(美国专利5,981,840和PCT专利公布WO98/32326;将所述专利的内容以引用方式并入本文)。简单而言,从玉蜀黍分离不成熟胚,并使胚与农杆菌悬浮液在该细菌能够将毒素核苷酸序列(例如,SEQ ID NO:1或SEQ ID NO:3)转移到至少一个未成熟胚的至少一个细胞的条件下进行接触(步骤1:感染步骤)。在这个步骤中,可将未成熟胚浸入农杆菌悬浮液中以引发接种。将胚与农杆菌共培养一段时间(步骤2:共培养步骤)。在该感染步骤之后,可将未成熟胚在固体培养基上进行培养。在这个共培养期之后,设想到任选的“静息”步骤。在这个静息步骤中,将胚在至少一种已知能抑制农杆菌生长的抗生素的存在下进行温育,不添加植物转化子的选择剂(步骤3:静息步骤)。可将未成熟胚在含有抗生素但无选择剂的固体培养基上培养,为了消除农杆菌以及为了受感染细胞的静息阶段。接着,将经接种的胚在含有选择剂的培养基上进行培养,回收生长出的转化愈伤组织(步骤4:选择步骤)。将未成熟胚在固体培养基上与选择剂一起进行培养,从而导致转化细胞的选择性生长。然后将愈伤组织再生成植株(步骤5:再生步骤),并可将在选择性培养基上生长的愈伤组织在固体培养基上进行培养以再生出植株。

实施例5——大豆胚的转化

如下所述,用含有可操作地连接至合适的启动子的SEQ ID NO:1或SEQ ID NO:3毒素核苷酸序列的质粒对大豆胚进行轰击。为了诱导体细胞胚,从适当的大豆栽培种的经表面灭菌的未成熟种子解剖出长3-5mm的子叶,然后将其在适当的琼脂培养基上于26℃在光照或黑暗中培养六至十个星期。然后切取产生次级胚的体细胞胚并置于合适的液体培养基中。在反复选择作为早期球状阶段的胚繁殖的体细胞胚的簇之后,如下所述维持悬浮物。

大豆胚发生悬浮培养物可在旋转振荡器上在150rpm、26℃下维持在35mL液体培养基中,以荧光灯按16∶8小时白日/黑夜时间表进行维持。每隔两周,通过将大约35mg的组织接种到35mL的液体培养基中,将培养物进行传代培养。

可然后通过粒子枪轰击方法(Klein等人,(1987)Nature(伦敦)327:70-73,美国专利No.4,945,050)转化大豆胚发生悬浮培养物。可使用Du Pont Biolistic PDSl000/HE仪器(氦改型)进行这些转化。

可用于促进大豆转化的选择性标记基因包括但不限于:来自花椰菜花叶病毒的35S启动子(Odell等人,(1985)Nature 313:810-812)、来自质粒pJR225(来自大肠杆菌;Gritz等人,(1983)Gene 25:179-188)的潮霉素磷酸转移酶基因和来自根瘤农杆菌的Ti质粒的T-DNA的胭脂碱合酶基因的3′区。包含可操作地连接至合适的启动子的毒素核苷酸序列(例如SEQ ID NO:1或SEQ ID NO:3)的表达盒可作为限制性片段分离。然后可将这个片段插入携带标记基因的载体的独特限制性位点中。

向50μL的60mg/mL 1μm金粒子悬浮液加入(按顺序):5μL DNA(1μg/μL)、20μL亚精胺(0.1M)和50μL CaCl2(2.5M)。然后将粒子制备物搅动三分钟,在微量离心机中离心10秒,移除上清液。然后将DNA包被的粒子在400μL 70%乙醇中洗涤一次并再悬浮于40μL无水乙醇中。可将DNA/粒子悬浮液超声处理三次,每次1秒。然后将五微升DNA包被的金粒子加载至每个巨载体盘上。

将大约300-400mg的两周龄悬浮培养物置于空的60×15mm培养皿中,用移液管将残余液体从组织移除。对于每次转化实验,通常轰击大约5-10个组织平板。将膜破裂压力设定为1100psi,将室抽至28英寸汞柱的真空。将组织距离阻滞屏(retaining screen)大约3.5英寸放置,轰击三次。轰击后,可将组织一分为二并放回进液体中,如上所述进行培养。

轰击后五至七天,可将液体培养基与新鲜培养基交换,轰击后七至十二天与含有50mg/mL潮霉素的新鲜培养基交换。该选择培养基可每周更换。轰击后七至八周,可观察到绿色的转化组织从未转化的坏死的胚发生簇长出来。移出分离的绿色组织并接种进单独的烧瓶中以产生新的、无性繁殖的、转化的胚发生悬浮培养物。可将每一新株系当作独立的转化事件。然后可将这些悬浮物传代培养,并作为未成熟胚簇维持或者通过使各单独体细胞胚成熟和发芽而再生成完整植株。

序列表

<110> PIONEER HI-BRED INTERNATIONAL, INC.

ABAD, ANDRE R.

CROW, ANDREW CARL

POLAND, BRAD

SHI, XIAOMEI

WOLFE, THOMAS CHAD

<120> 具有广谱活性的杀昆虫多肽和其用途

<130> 6059-WO-PCT

<150> US 62/064848

<151> 2014-10-16

<160> 10

<170> PatentIn版本3.5

<210> 1

<211> 2256

<212> DNA

<213> 人工序列

<220>

<223> MP589FL的变体

<400> 1

atggagggaa ataatctaaa tcaatgcata ccttacaatt gtttaagtaa tcctaaggac 60

ataatattag gtgatgaaag gctagaaact ggtaatactg tagcagacat taccttaggg 120

attgtcaatc tattgttttc tgagtttgtt cctggtggag gctttatact aggattactg 180

gatttaatat gggggtctat aggtcgttcc caatgggatc tatttctgga acagattgaa 240

caattgatta agcaaagaat agaagaattt gctaggaatc aggcaatttc aagattggag 300

gggctaagcg atctttataa gacctatgct agagcgttta gcgattggga ggcagatccg 360

actaatccag cattaaggga agaaatgcgt atacaattta atgacatgaa tagtgctatc 420

ataacggctc tcccactttt tagagttcaa aattatgaag ttgctctttt atctgtttat 480

gttcaagctg caaacttaca tttatctatt ttaagagatg tttcagtctt tggagaaaga 540

tggggatatg atacagcaac tatcaataat cgctatagtg acttaactag ccttattcat 600

gtttatacta atcattgtgt ggatacgtat aatcagggat taaggcgttt ggaaggtcgt 660

tttcttaccg attggattgt atataatcgt ttccgaagac aattaacaat ttcagtatta 720

gatattgttg cattttttcc aaattatgat attcgaacat atccaattca aacagctact 780

cagctaacga gggaaatcta tctggattta ccttttatta atgaaaatct ttctcctgca 840

gcaagctatc cctcattctc agatgctgaa agtgctataa tcaggagtcc tcatttagtg 900

gactttttaa atagcttcac tatttataca gatagtcttg ctcgatattt atattgggga 960

gggcatcggg tgaattttac ccgttcagga gttactactt ttatacaatc accactatat 1020

ggaagggaag gaaatgcaga gcgttctgta attatttcgg catcatctag cgtaccaata 1080

tttagaacac tttcatatgt tactggcctt gacaatgcaa atcctgtagc tggaattgaa 1140

ggagtggaat tccaaaatac tataagtaga agtatctatc gtaaaagtgg tccaattgat 1200

tcttttaatg aattaccacc tcaagatgcc agtgtatctc cttcaattgg gtatagtcac 1260

cgtttatgtc atgccacatt tttagaacgg attagtggac caagaattgc aggtgtcgtt 1320

ttttcctgga cacatcgtag tgctagccct actaatgaag taagttcatc tagaattaca 1380

caaattccat gggtaaaggc gcatactctt gcgtctggtg cctccgttat taaagggcct 1440

ggatttacag gtggagatat actaactagg aataccttag gcgaactggg gactttaaga 1500

gtaacttttg caggaagatt atcacaaagt tattatatac gtttccgtta tgcttccgta 1560

gctaatagga gtggtatatt tagctattca cagccaactt catatggaat ttcctttcca 1620

aaaactatgg atgcagatga atcattaaca tctcgttcat ttgcacttgc tacacttgct 1680

acaccgctaa cctttagaag gcaagaagaa ttaaatctac aaataccatc aggtacttat 1740

atagatcgaa ttgagtttgt tccagtcgat gaaaccttta caacagaatc tgatctggat 1800

agagcacaac aggcggtgaa tgcgctgttt acttcttcca atcaaatcgg cttaaaaaca 1860

gatgtgacgg attatcatat tgatcaagta tccaatttag tggattgttt atcggatgaa 1920

ttttgtctgg atgaaaagcg agaattgtcc gagaaagtca aacatgcgaa gcgactcagt 1980

gatgagcgga atttacttca agatccaaac tttagaggaa tcaatagaca accagaccgt 2040

ggttggagag gaagtacaga tattaccatc caaggaggag atgacgtatt caaagagaat 2100

tacgttacac taccaggtac ctttgatgag tgctatccaa cgtatttata tcaaaaaata 2160

gatgagtcga aattaaaagc ctatacccgt taccaattaa gagggtatat cgaagatagt 2220

caagacttag aaatctattt aattcgctac aattga 2256

<210> 2

<211> 751

<212> PRT

<213> 人工序列

<220>

<223> MP589FL aa的变体

<400> 2

Met Glu Gly Asn Asn Leu Asn Gln Cys Ile Pro Tyr Asn Cys Leu Ser

1 5 10 15

Asn Pro Lys Asp Ile Ile Leu Gly Asp Glu Arg Leu Glu Thr Gly Asn

20 25 30

Thr Val Ala Asp Ile Thr Leu Gly Ile Val Asn Leu Leu Phe Ser Glu

35 40 45

Phe Val Pro Gly Gly Gly Phe Ile Leu Gly Leu Leu Asp Leu Ile Trp

50 55 60

Gly Ser Ile Gly Arg Ser Gln Trp Asp Leu Phe Leu Glu Gln Ile Glu

65 70 75 80

Gln Leu Ile Lys Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Ile

85 90 95

Ser Arg Leu Glu Gly Leu Ser Asp Leu Tyr Lys Thr Tyr Ala Arg Ala

100 105 110

Phe Ser Asp Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Glu

115 120 125

Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Ile Ile Thr Ala Leu

130 135 140

Pro Leu Phe Arg Val Gln Asn Tyr Glu Val Ala Leu Leu Ser Val Tyr

145 150 155 160

Val Gln Ala Ala Asn Leu His Leu Ser Ile Leu Arg Asp Val Ser Val

165 170 175

Phe Gly Glu Arg Trp Gly Tyr Asp Thr Ala Thr Ile Asn Asn Arg Tyr

180 185 190

Ser Asp Leu Thr Ser Leu Ile His Val Tyr Thr Asn His Cys Val Asp

195 200 205

Thr Tyr Asn Gln Gly Leu Arg Arg Leu Glu Gly Arg Phe Leu Thr Asp

210 215 220

Trp Ile Val Tyr Asn Arg Phe Arg Arg Gln Leu Thr Ile Ser Val Leu

225 230 235 240

Asp Ile Val Ala Phe Phe Pro Asn Tyr Asp Ile Arg Thr Tyr Pro Ile

245 250 255

Gln Thr Ala Thr Gln Leu Thr Arg Glu Ile Tyr Leu Asp Leu Pro Phe

260 265 270

Ile Asn Glu Asn Leu Ser Pro Ala Ala Ser Tyr Pro Ser Phe Ser Asp

275 280 285

Ala Glu Ser Ala Ile Ile Arg Ser Pro His Leu Val Asp Phe Leu Asn

290 295 300

Ser Phe Thr Ile Tyr Thr Asp Ser Leu Ala Arg Tyr Leu Tyr Trp Gly

305 310 315 320

Gly His Arg Val Asn Phe Thr Arg Ser Gly Val Thr Thr Phe Ile Gln

325 330 335

Ser Pro Leu Tyr Gly Arg Glu Gly Asn Ala Glu Arg Ser Val Ile Ile

340 345 350

Ser Ala Ser Ser Ser Val Pro Ile Phe Arg Thr Leu Ser Tyr Val Thr

355 360 365

Gly Leu Asp Asn Ala Asn Pro Val Ala Gly Ile Glu Gly Val Glu Phe

370 375 380

Gln Asn Thr Ile Ser Arg Ser Ile Tyr Arg Lys Ser Gly Pro Ile Asp

385 390 395 400

Ser Phe Asn Glu Leu Pro Pro Gln Asp Ala Ser Val Ser Pro Ser Ile

405 410 415

Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Leu Glu Arg Ile Ser

420 425 430

Gly Pro Arg Ile Ala Gly Val Val Phe Ser Trp Thr His Arg Ser Ala

435 440 445

Ser Pro Thr Asn Glu Val Ser Ser Ser Arg Ile Thr Gln Ile Pro Trp

450 455 460

Val Lys Ala His Thr Leu Ala Ser Gly Ala Ser Val Ile Lys Gly Pro

465 470 475 480

Gly Phe Thr Gly Gly Asp Ile Leu Thr Arg Asn Thr Leu Gly Glu Leu

485 490 495

Gly Thr Leu Arg Val Thr Phe Ala Gly Arg Leu Ser Gln Ser Tyr Tyr

500 505 510

Ile Arg Phe Arg Tyr Ala Ser Val Ala Asn Arg Ser Gly Ile Phe Ser

515 520 525

Tyr Ser Gln Pro Thr Ser Tyr Gly Ile Ser Phe Pro Lys Thr Met Asp

530 535 540

Ala Asp Glu Ser Leu Thr Ser Arg Ser Phe Ala Leu Ala Thr Leu Ala

545 550 555 560

Thr Pro Leu Thr Phe Arg Arg Gln Glu Glu Leu Asn Leu Gln Ile Pro

565 570 575

Ser Gly Thr Tyr Ile Asp Arg Ile Glu Phe Val Pro Val Asp Glu Thr

580 585 590

Phe Thr Thr Glu Ser Asp Leu Asp Arg Ala Gln Gln Ala Val Asn Ala

595 600 605

Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp

610 615 620

Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu

625 630 635 640

Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala

645 650 655

Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg

660 665 670

Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile

675 680 685

Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu

690 695 700

Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile

705 710 715 720

Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr

725 730 735

Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn

740 745 750

<210> 3

<211> 3492

<212> DNA

<213> 苏云金芽孢杆菌

<400> 3

atggagggaa ataatctaaa tcaatgcata ccttacaatt gtttaagtaa tcctaaggac 60

ataatattag gtgatgaaag gctagaaact ggtaatactg tagcagacat taccttaggg 120

attgtcaatc tattgttttc tgagtttgtt cctggtggag gctttatact aggattactg 180

gatttaatat gggggtctat aggtcgttcc caatgggatc tatttctgga acagattgaa 240

caattgatta agcaaagaat agaagaattt gctaggaatc aggcaatttc aagattggag 300

gggctaagcg atctttataa gacctatgct agagcgttta gcgattggga ggcagatccg 360

actaatccag cattaaggga agaaatgcgt atacaattta atgacatgaa tagtgctatc 420

ataacggctc tcccactttt tagagttcaa aattatgaag ttgctctttt atctgtttat 480

gttcaagctg caaacttaca tttatctatt ttaagagatg tttcagtctt tggagaaaga 540

tggggatatg atacagcaac tatcaataat cgctatagtg acttaactag ccttattcat 600

gtttatacta atcattgtgt ggatacgtat aatcagggat taaggcgttt ggaaggtcgt 660

tttcttaccg attggattgt atataatcgt ttccgaagac aattaacaat ttcagtatta 720

gatattgttg cattttttcc aaattatgat attcgaacat atccaattca aacagctact 780

cagctaacga gggaaatcta tctggattta ccttttatta atgaaaatct ttctcctgca 840

gcaagctatc cctcattctc agatgctgaa agtgctataa tcaggagtcc tcatttagtg 900

gactttttaa atagcttcac tatttataca gatagtcttg ctcgatattt atattgggga 960

gggcatcggg tgaattttac ccgttcagga gttactactt ttatacaatc accactatat 1020

ggaagggaag gaaatgcaga gcgttctgta attatttcgg catcatctag cgtaccaata 1080

tttagaacac tttcatatgt tactggcctt gacaatgcaa atcctgtagc tggaattgaa 1140

ggagtggaat tccaaaatac tataagtaga agtatctatc gtaaaagtgg tccaattgat 1200

tcttttaatg aattaccacc tcaagatgcc agtgtatctc cttcaattgg gtatagtcac 1260

cgtttatgtc atgccacatt tttagaacgg attagtggac caagaattgc aggtgtcgtt 1320

ttttcctgga cacatcgtag tgctagccct actaatgaag taagttcatc tagaattaca 1380

caaattccat gggtaaaggc gcatactctt gcgtctggtg cctccgttat taaagggcct 1440

ggatttacag gtggagatat actaactagg aataccttag gcgaactggg gactttaaga 1500

gtaacttttg caggaagatt atcacaaagt tattatatac gtttccgtta tgcttccgta 1560

gctaatagga gtggtatatt tagctattca cagccaactt catatggaat ttcctttcca 1620

aaaactatgg atgcagatga atcattaaca tctcgttcat ttgcacttgc tacacttgct 1680

acaccgctaa cctttagaag gcaagaagaa ttaaatctac aaataccatc aggtacttat 1740

atagatcgaa ttgagtttgt tccagtcgat gaaaccttta caacagaatc tgatctggat 1800

agagcacaac aggcggtgaa tgcgctgttt acttcttcca atcaaatcgg cttaaaaaca 1860

gatgtgacgg attatcatat tgatcaagta tccaatttag tggattgttt atcggatgaa 1920

ttttgtctgg atgaaaagcg agaattgtcc gagaaagtca aacatgcgaa gcgactcagt 1980

gatgagcgga atttacttca agatccaaac tttagaggaa tcaatagaca accagaccgt 2040

ggttggagag gaagtacaga tattaccatc caaggaggag atgacgtatt caaagagaat 2100

tacgttacac taccaggtac ctttgatgag tgctatccaa cgtatttata tcaaaaaata 2160

gatgagtcga aattaaaagc ctatacccgt tatcaattaa gagggtatat cggggatagt 2220

caagacttag aaatctattt aattcgttac aatgcaaaac acgaaatagt aaatgtacca 2280

ggtacaggga gtttatggac tctttctgta gaaaattcaa ttggaccttg tggagaaccg 2340

aatcgatgcg cgccacacct tgaatggaat cctaatctag agtgttcttg cagagaaggg 2400

gaaaaatgtg cccatcattc ccatcatttc tccttggaca ttgatgttgg atgtacagac 2460

ttaaatgagg acttaggtgt atgggcgata ttcaagatta agacgcaaga tggccatgca 2520

agactaggaa atctagagtt tctcgaagag aaaccactat taggggaagc actagctcgt 2580

gtgaaaagag cggagaagaa atggagagac aaacgcgaaa aattggaatg ggaaacaaat 2640

attgtttata aagaggcaaa agaatctgta gatgctttat ttgtgaactc tcaatatgat 2700

agattacaag cggatacgaa tatcgcgatg attcatgcgg cagataaacg cgttcataga 2760

attagagaag cataccttcc agaattatct gtaattccgg gtgtaaatgc gggcattttc 2820

gaagaattag agggacgcat tttcacagcc tactctctat atgatgcgag aaatgtcatt 2880

aaaaatggcg atttcaataa tggtttattg tgctggaact tgaaagggca tgtagatgta 2940

gaagaacaaa acaaccatcg ttcagtcctt gttgtcccgg aatgggaagc agaggtgtcc 3000

caagaagttc gtgtctgtcc aggtcgtggc tatatccttc gtgttacagc gtacaaagag 3060

ggatatggag agggctgcgt aaccatccat gagatcgaag acaatacaga cgaactgaaa 3120

ttcagcaact gtgtagaaga ggaagtatat ccaaacaaca cggtaacgtg taatgattat 3180

actgcgactc aagaagaata tgagggtacg tacacttctc gtaatcgagg atatgacgga 3240

gcctatgaaa gcaattcttc tgtaccagct gattatgcat cagcctatga agaaaaagcg 3300

tatacagatg gaagaagaga gaatccttgt gaatctaata gaggatatgg ggattacgcg 3360

ccactaccag ctggttatgt gacaaaggaa ttagagtact tcccagaaac cgataaggta 3420

tggattgaga tcggagaaac ggaaggaaca ttcattgtgg atagtgtgga attactcctt 3480

atggaggaat aa 3492

<210> 4

<211> 1163

<212> PRT

<213> 苏云金芽孢杆菌

<400> 4

Met Glu Gly Asn Asn Leu Asn Gln Cys Ile Pro Tyr Asn Cys Leu Ser

1 5 10 15

Asn Pro Lys Asp Ile Ile Leu Gly Asp Glu Arg Leu Glu Thr Gly Asn

20 25 30

Thr Val Ala Asp Ile Thr Leu Gly Ile Val Asn Leu Leu Phe Ser Glu

35 40 45

Phe Val Pro Gly Gly Gly Phe Ile Leu Gly Leu Leu Asp Leu Ile Trp

50 55 60

Gly Ser Ile Gly Arg Ser Gln Trp Asp Leu Phe Leu Glu Gln Ile Glu

65 70 75 80

Gln Leu Ile Lys Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Ile

85 90 95

Ser Arg Leu Glu Gly Leu Ser Asp Leu Tyr Lys Thr Tyr Ala Arg Ala

100 105 110

Phe Ser Asp Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Glu

115 120 125

Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Ile Ile Thr Ala Leu

130 135 140

Pro Leu Phe Arg Val Gln Asn Tyr Glu Val Ala Leu Leu Ser Val Tyr

145 150 155 160

Val Gln Ala Ala Asn Leu His Leu Ser Ile Leu Arg Asp Val Ser Val

165 170 175

Phe Gly Glu Arg Trp Gly Tyr Asp Thr Ala Thr Ile Asn Asn Arg Tyr

180 185 190

Ser Asp Leu Thr Ser Leu Ile His Val Tyr Thr Asn His Cys Val Asp

195 200 205

Thr Tyr Asn Gln Gly Leu Arg Arg Leu Glu Gly Arg Phe Leu Thr Asp

210 215 220

Trp Ile Val Tyr Asn Arg Phe Arg Arg Gln Leu Thr Ile Ser Val Leu

225 230 235 240

Asp Ile Val Ala Phe Phe Pro Asn Tyr Asp Ile Arg Thr Tyr Pro Ile

245 250 255

Gln Thr Ala Thr Gln Leu Thr Arg Glu Ile Tyr Leu Asp Leu Pro Phe

260 265 270

Ile Asn Glu Asn Leu Ser Pro Ala Ala Ser Tyr Pro Ser Phe Ser Asp

275 280 285

Ala Glu Ser Ala Ile Ile Arg Ser Pro His Leu Val Asp Phe Leu Asn

290 295 300

Ser Phe Thr Ile Tyr Thr Asp Ser Leu Ala Arg Tyr Leu Tyr Trp Gly

305 310 315 320

Gly His Arg Val Asn Phe Thr Arg Ser Gly Val Thr Thr Phe Ile Gln

325 330 335

Ser Pro Leu Tyr Gly Arg Glu Gly Asn Ala Glu Arg Ser Val Ile Ile

340 345 350

Ser Ala Ser Ser Ser Val Pro Ile Phe Arg Thr Leu Ser Tyr Val Thr

355 360 365

Gly Leu Asp Asn Ala Asn Pro Val Ala Gly Ile Glu Gly Val Glu Phe

370 375 380

Gln Asn Thr Ile Ser Arg Ser Ile Tyr Arg Lys Ser Gly Pro Ile Asp

385 390 395 400

Ser Phe Asn Glu Leu Pro Pro Gln Asp Ala Ser Val Ser Pro Ser Ile

405 410 415

Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Leu Glu Arg Ile Ser

420 425 430

Gly Pro Arg Ile Ala Gly Val Val Phe Ser Trp Thr His Arg Ser Ala

435 440 445

Ser Pro Thr Asn Glu Val Ser Ser Ser Arg Ile Thr Gln Ile Pro Trp

450 455 460

Val Lys Ala His Thr Leu Ala Ser Gly Ala Ser Val Ile Lys Gly Pro

465 470 475 480

Gly Phe Thr Gly Gly Asp Ile Leu Thr Arg Asn Thr Leu Gly Glu Leu

485 490 495

Gly Thr Leu Arg Val Thr Phe Ala Gly Arg Leu Ser Gln Ser Tyr Tyr

500 505 510

Ile Arg Phe Arg Tyr Ala Ser Val Ala Asn Arg Ser Gly Ile Phe Ser

515 520 525

Tyr Ser Gln Pro Thr Ser Tyr Gly Ile Ser Phe Pro Lys Thr Met Asp

530 535 540

Ala Asp Glu Ser Leu Thr Ser Arg Ser Phe Ala Leu Ala Thr Leu Ala

545 550 555 560

Thr Pro Leu Thr Phe Arg Arg Gln Glu Glu Leu Asn Leu Gln Ile Pro

565 570 575

Ser Gly Thr Tyr Ile Asp Arg Ile Glu Phe Val Pro Val Asp Glu Thr

580 585 590

Phe Thr Thr Glu Ser Asp Leu Asp Arg Ala Gln Gln Ala Val Asn Ala

595 600 605

Leu Phe Thr Ser Ser Asn Gln Ile Gly Leu Lys Thr Asp Val Thr Asp

610 615 620

Tyr His Ile Asp Gln Val Ser Asn Leu Val Asp Cys Leu Ser Asp Glu

625 630 635 640

Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys His Ala

645 650 655

Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn Phe Arg

660 665 670

Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr Asp Ile

675 680 685

Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val Thr Leu

690 695 700

Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln Lys Ile

705 710 715 720

Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg Gly Tyr

725 730 735

Ile Gly Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr Asn Ala

740 745 750

Lys His Glu Ile Val Asn Val Pro Gly Thr Gly Ser Leu Trp Thr Leu

755 760 765

Ser Val Glu Asn Ser Ile Gly Pro Cys Gly Glu Pro Asn Arg Cys Ala

770 775 780

Pro His Leu Glu Trp Asn Pro Asn Leu Glu Cys Ser Cys Arg Glu Gly

785 790 795 800

Glu Lys Cys Ala His His Ser His His Phe Ser Leu Asp Ile Asp Val

805 810 815

Gly Cys Thr Asp Leu Asn Glu Asp Leu Gly Val Trp Ala Ile Phe Lys

820 825 830

Ile Lys Thr Gln Asp Gly His Ala Arg Leu Gly Asn Leu Glu Phe Leu

835 840 845

Glu Glu Lys Pro Leu Leu Gly Glu Ala Leu Ala Arg Val Lys Arg Ala

850 855 860

Glu Lys Lys Trp Arg Asp Lys Arg Glu Lys Leu Glu Trp Glu Thr Asn

865 870 875 880

Ile Val Tyr Lys Glu Ala Lys Glu Ser Val Asp Ala Leu Phe Val Asn

885 890 895

Ser Gln Tyr Asp Arg Leu Gln Ala Asp Thr Asn Ile Ala Met Ile His

900 905 910

Ala Ala Asp Lys Arg Val His Arg Ile Arg Glu Ala Tyr Leu Pro Glu

915 920 925

Leu Ser Val Ile Pro Gly Val Asn Ala Gly Ile Phe Glu Glu Leu Glu

930 935 940

Gly Arg Ile Phe Thr Ala Tyr Ser Leu Tyr Asp Ala Arg Asn Val Ile

945 950 955 960

Lys Asn Gly Asp Phe Asn Asn Gly Leu Leu Cys Trp Asn Leu Lys Gly

965 970 975

His Val Asp Val Glu Glu Gln Asn Asn His Arg Ser Val Leu Val Val

980 985 990

Pro Glu Trp Glu Ala Glu Val Ser Gln Glu Val Arg Val Cys Pro Gly

995 1000 1005

Arg Gly Tyr Ile Leu Arg Val Thr Ala Tyr Lys Glu Gly Tyr Gly

1010 1015 1020

Glu Gly Cys Val Thr Ile His Glu Ile Glu Asp Asn Thr Asp Glu

1025 1030 1035

Leu Lys Phe Ser Asn Cys Val Glu Glu Glu Val Tyr Pro Asn Asn

1040 1045 1050

Thr Val Thr Cys Asn Asp Tyr Thr Ala Thr Gln Glu Glu Tyr Glu

1055 1060 1065

Gly Thr Tyr Thr Ser Arg Asn Arg Gly Tyr Asp Gly Ala Tyr Glu

1070 1075 1080

Ser Asn Ser Ser Val Pro Ala Asp Tyr Ala Ser Ala Tyr Glu Glu

1085 1090 1095

Lys Ala Tyr Thr Asp Gly Arg Arg Glu Asn Pro Cys Glu Ser Asn

1100 1105 1110

Arg Gly Tyr Gly Asp Tyr Ala Pro Leu Pro Ala Gly Tyr Val Thr

1115 1120 1125

Lys Glu Leu Glu Tyr Phe Pro Glu Thr Asp Lys Val Trp Ile Glu

1130 1135 1140

Ile Gly Glu Thr Glu Gly Thr Phe Ile Val Asp Ser Val Glu Leu

1145 1150 1155

Leu Leu Met Glu Glu

1160

<210> 5

<211> 2259

<212> DNA

<213> 人工序列

<220>

<223> MP589FL的变体

<400> 5

atggaaggca acaacctgaa ccagtgcatt ccgtataact gcctgagcaa cccgaaagat 60

attattctgg gcgatgaacg tctggaaacc ggcaacaccg tggcggatat taccctgggc 120

attgtgaacc tgctgtttag cgaatttgtg ccgggcggcg gctttattct gggcctgctg 180

gatctgattt ggggcagcat tggccgtagc cagtgggatc tgtttctgga acagattgaa 240

cagctgatta aacagcgtat tgaagaattt gcgcgtaacc aggcgattag ccgtctggaa 300

ggcctgagcg atctgtataa aacctatgcg cgtgcgttta gcgattggga agcggatccg 360

accaacccgg cgctgcgtga agaaatgcgt attcagttta acgatatgaa cagcgcgatt 420

attaccgcgc tgccgctgtt tcgtgtgcag aactatgaag tggcgctgct gagcgtgtat 480

gtgcaggcgg cgaacctgca tctgagcatt ctgcgtgatg tgagcgtgtt tggcgaacgt 540

tggggctatg ataccgcgac cattaacaac cgttatagcg atctgaccag cctgattcat 600

gtgtatacca accattgcgt ggatacctat aaccagggcc tgcgtcgtct ggaaggccgt 660

tttctgaccg attggattgt gtataaccgt tttcgtcgtc agctgaccat tagcgtgctg 720

gatattgtgg cgttttttcc gaactatgat attcgtacct atccgattca gaccgcgacc 780

cagctgaccc gtgaagtgta tctggatctg ccgtttatta acgaaaacct gagcccggcg 840

gcgagctatc cgacctttag cgcggcggaa agcgcgatta ttcgtagccc gcatctggtg 900

gattttctga acagctttac catttatacc gatagcctgg cgcgttatgc gtattggggc 960

ggccatctgg tgaacagctt tcgtaccggc accaccacca acctgattcg tagcccgctg 1020

tatggccgtg aaggcaacac cgaacgtccg gtgaccatta ccgcgagccc gagcgtgccg 1080

atttttcgta ccctgagcta tattaccggc ctggataaca gcaacccggt ggcgggcatt 1140

gaaggcgtgg aatttcagaa caccattagc cgtagcattt atcgtaaaag cggcccgatt 1200

gatagcttta gcgaactgcc gccgcaggat gcgagcgtga gcccggcgat tggctatagc 1260

catcgtctgt gccatgcgac ctttctggaa cgtattagcg gcccgcgtat tgcgggcacc 1320

gtgtttagct ggacccatcg tagcgcgagc ccgaccaacg aagtgagccc gagccgtatt 1380

acccagattc cgtgggtgaa agcgcatacc ctggcgagcg gcgcgagcgt gattaaaggc 1440

ccgggcttta ccggcggcga tattctgacc cgtaacagca tgggcgaact gggcaccctg 1500

cgtgtgacct ttaccggccg tctgccgcag agctattata ttcgttttcg ttatgcgagc 1560

gtggcgaacc gtagcggcac ctttcgttat agccagccgc cgagctatgg cattagcttt 1620

ccgaaaacca tggatgcggg cgaaccgctg accagccgta gctttgcgca taccaccctg 1680

tttaccccga ttacctttag ccgtgcgcag gaagaatttg atctgtatat tcagagcggc 1740

gtgtatattg atcgtattga atttattccg gtgaccgcga cctttgaagc ggaatatgat 1800

ctggaacgtg cgcagaaagt ggtgaacgcg ctgtttacca gcaccaacca gctgggcctg 1860

aaaaccgatg tgaccgatta tcatattgat caggtgagca acctggtggc gtgcctgagc 1920

gatgaatttt gcctggatga aaaacgtgaa ctgagcgaaa aagtgaaaca tgcgaaacgt 1980

ctgagcgatg aacgtaacct gctgcaggat ccgaactttc gtggcattaa ccgtcagccg 2040

gatcgtggct ggcgtggcag caccgatatt accattcagg gcggcgatga tgtgtttaaa 2100

gaaaactatg tgaccctgcc gggcaccttt gatgaatgct atccgaccta tctgtatcag 2160

aaaattgatg aaagcaaact gaaagcgtat acccgttatc agctgcgtgg ctatattgaa 2220

gatagccagg atctggaaat ttatctgatt cgttataac 2259

<210> 6

<211> 753

<212> PRT

<213> 人工序列

<220>

<223> MP589FL的变体

<400> 6

Met Glu Gly Asn Asn Leu Asn Gln Cys Ile Pro Tyr Asn Cys Leu Ser

1 5 10 15

Asn Pro Lys Asp Ile Ile Leu Gly Asp Glu Arg Leu Glu Thr Gly Asn

20 25 30

Thr Val Ala Asp Ile Thr Leu Gly Ile Val Asn Leu Leu Phe Ser Glu

35 40 45

Phe Val Pro Gly Gly Gly Phe Ile Leu Gly Leu Leu Asp Leu Ile Trp

50 55 60

Gly Ser Ile Gly Arg Ser Gln Trp Asp Leu Phe Leu Glu Gln Ile Glu

65 70 75 80

Gln Leu Ile Lys Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Ile

85 90 95

Ser Arg Leu Glu Gly Leu Ser Asp Leu Tyr Lys Thr Tyr Ala Arg Ala

100 105 110

Phe Ser Asp Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Glu

115 120 125

Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Ile Ile Thr Ala Leu

130 135 140

Pro Leu Phe Arg Val Gln Asn Tyr Glu Val Ala Leu Leu Ser Val Tyr

145 150 155 160

Val Gln Ala Ala Asn Leu His Leu Ser Ile Leu Arg Asp Val Ser Val

165 170 175

Phe Gly Glu Arg Trp Gly Tyr Asp Thr Ala Thr Ile Asn Asn Arg Tyr

180 185 190

Ser Asp Leu Thr Ser Leu Ile His Val Tyr Thr Asn His Cys Val Asp

195 200 205

Thr Tyr Asn Gln Gly Leu Arg Arg Leu Glu Gly Arg Phe Leu Thr Asp

210 215 220

Trp Ile Val Tyr Asn Arg Phe Arg Arg Gln Leu Thr Ile Ser Val Leu

225 230 235 240

Asp Ile Val Ala Phe Phe Pro Asn Tyr Asp Ile Arg Thr Tyr Pro Ile

245 250 255

Gln Thr Ala Thr Gln Leu Thr Arg Glu Val Tyr Leu Asp Leu Pro Phe

260 265 270

Ile Asn Glu Asn Leu Ser Pro Ala Ala Ser Tyr Pro Thr Phe Ser Ala

275 280 285

Ala Glu Ser Ala Ile Ile Arg Ser Pro His Leu Val Asp Phe Leu Asn

290 295 300

Ser Phe Thr Ile Tyr Thr Asp Ser Leu Ala Arg Tyr Ala Tyr Trp Gly

305 310 315 320

Gly His Leu Val Asn Ser Phe Arg Thr Gly Thr Thr Thr Asn Leu Ile

325 330 335

Arg Ser Pro Leu Tyr Gly Arg Glu Gly Asn Thr Glu Arg Pro Val Thr

340 345 350

Ile Thr Ala Ser Pro Ser Val Pro Ile Phe Arg Thr Leu Ser Tyr Ile

355 360 365

Thr Gly Leu Asp Asn Ser Asn Pro Val Ala Gly Ile Glu Gly Val Glu

370 375 380

Phe Gln Asn Thr Ile Ser Arg Ser Ile Tyr Arg Lys Ser Gly Pro Ile

385 390 395 400

Asp Ser Phe Ser Glu Leu Pro Pro Gln Asp Ala Ser Val Ser Pro Ala

405 410 415

Ile Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Leu Glu Arg Ile

420 425 430

Ser Gly Pro Arg Ile Ala Gly Thr Val Phe Ser Trp Thr His Arg Ser

435 440 445

Ala Ser Pro Thr Asn Glu Val Ser Pro Ser Arg Ile Thr Gln Ile Pro

450 455 460

Trp Val Lys Ala His Thr Leu Ala Ser Gly Ala Ser Val Ile Lys Gly

465 470 475 480

Pro Gly Phe Thr Gly Gly Asp Ile Leu Thr Arg Asn Ser Met Gly Glu

485 490 495

Leu Gly Thr Leu Arg Val Thr Phe Thr Gly Arg Leu Pro Gln Ser Tyr

500 505 510

Tyr Ile Arg Phe Arg Tyr Ala Ser Val Ala Asn Arg Ser Gly Thr Phe

515 520 525

Arg Tyr Ser Gln Pro Pro Ser Tyr Gly Ile Ser Phe Pro Lys Thr Met

530 535 540

Asp Ala Gly Glu Pro Leu Thr Ser Arg Ser Phe Ala His Thr Thr Leu

545 550 555 560

Phe Thr Pro Ile Thr Phe Ser Arg Ala Gln Glu Glu Phe Asp Leu Tyr

565 570 575

Ile Gln Ser Gly Val Tyr Ile Asp Arg Ile Glu Phe Ile Pro Val Thr

580 585 590

Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Val Val

595 600 605

Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys Thr Asp Val

610 615 620

Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Ala Cys Leu Ser

625 630 635 640

Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys

645 650 655

His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn

660 665 670

Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr

675 680 685

Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val

690 695 700

Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln

705 710 715 720

Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg

725 730 735

Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr

740 745 750

Asn

<210> 7

<211> 2259

<212> DNA

<213> 人工序列

<220>

<223> MP589FL的变体

<400> 7

atggaaggca acaacctgaa ccagtgcatt ccgtataact gcctgaccaa cccgaaagat 60

attattctgg gcgatgaacg tctggaaacc ggcaacaccg tggcggatat taccctgggc 120

attgtgaacc tgctgtttac cgaatttgtg ccgggcggcg gctttattct gggcctgctg 180

gatgtgattt ggggcagcat tggccgtagc cagtgggaac tgtttctgga acagattgaa 240

cagctgatta aacagcgtat tgaagaattt gcgcgtaacc aggcgattag ccgtctggaa 300

ggcctgagcg atctgtataa aacctatgcg cgtgcgttta gcgattggga agcggatccg 360

accaacccgg cgctgcgtga agaaatgcgt attcagttta acgatatgaa cagcgcgatt 420

attaccgcgc tgccgctgtt tcgtgtgcag aactatgaag tggcgctgct gagcgtgtat 480

gtgcaggcgg cgaacctgca tctgagcatt ctgcgtgatg tgagcgtgtt tggcgaacgt 540

tggggctatg ataccgcgac cattaacaac cgttatagcg atctgaccag cctgattcat 600

gtgtatacca accattgcgt ggatacctat aaccagggcc tgcgtcgtct ggaaggccgt 660

tttctgaccg attggattgt gtataaccgt tttcgtcgtc agctgaccat tagcgtgctg 720

gatattgtgg cgttttttcc gaactatgat attcgtacct atccgattca gaccgcgacc 780

cagctgaccc gtgaagtgta tctggatctg ccgtttatta acgaaaacct gagcccggcg 840

gcgagctatc cgacctttag cgcggcggaa agcgcgatta ttcgtagccc gcatctggtg 900

gattttctga acagctttac catttatacc gatagcctgg cgcgttatgc gtattggggc 960

ggccatctgg tgaacagctt tcgtaccggc accaccacca acctgattcg tagcccgctg 1020

tatggccgtg aaggcaacac cgaacgtccg gtgaccatta ccgcgagccc gagcgtgccg 1080

atttttcgta ccctgagcta tattaccggc ctggataaca gcaacccggt ggcgggcatt 1140

gaaggcgtgg aatttcagaa caccattagc cgtagcattt atcgtaaaag cggcccgatt 1200

gatagcttta gcgaactgcc gccgcaggat gcgagcgtga gcccggcgat tggctatagc 1260

catcgtctgt gccatgcgac ctttctggaa cgtattagcg gcccgcgtat tgcgggcacc 1320

gtgtttagct ggacccatcg tagcgcgagc ccgaccaacg aagtgagccc gagccgtatt 1380

acccagattc cgtgggtgaa agcgcatacc ctggcgagcg gcgcgagcgt gattaaaggc 1440

ccgggcttta ccggcggcga tattctgacc cgtaacagca tgggcgaact gggcaccctg 1500

cgtgtgagct ttaccggccg tctgccgcag agctattata ttcgttttcg ttatgcgagc 1560

gtggcgaacc gtaccggcac ctttcgttat agccagccgc cgagctatgg cctgagcttt 1620

ccgaaaacca tggatgcggg cgaaccgctg accagccgta gctttgcgca taccaccctg 1680

tttaccccga ttacctttag ccgtgcgcag gaagaatttg atctgtatat tcagagcggc 1740

gtgtatattg atcgtattga atttattccg gtgaccgcga cctttgaagc ggaatatgat 1800

ctggaacgtg cgcagaaagt ggtgaacgcg ctgtttacca gcaccaacca gctgggcctg 1860

aaaaccgatg tgaccgatta tcatattgat caggtgagca acctggtggc gtgcctgagc 1920

gatgaatttt gcctggatga aaaacgtgaa ctgagcgaaa aagtgaaaca tgcgaaacgt 1980

ctgagcgatg aacgtaacct gctgcaggat ccgaactttc gtggcattaa ccgtcagccg 2040

gatcgtggct ggcgtggcag caccgatatt accattcagg gcggcgatga tgtgtttaaa 2100

gaaaactatg tgaccctgcc gggcaccttt gatgaatgct atccgaccta tctgtatcag 2160

aaaattgatg aaagcaaact gaaagcgtat acccgttatc agctgcgtgg ctatattgaa 2220

gatagccagg atctggaaat ttatctgatt cgttataac 2259

<210> 8

<211> 753

<212> PRT

<213> 人工序列

<220>

<223> MP589FL的变体

<400> 8

Met Glu Gly Asn Asn Leu Asn Gln Cys Ile Pro Tyr Asn Cys Leu Thr

1 5 10 15

Asn Pro Lys Asp Ile Ile Leu Gly Asp Glu Arg Leu Glu Thr Gly Asn

20 25 30

Thr Val Ala Asp Ile Thr Leu Gly Ile Val Asn Leu Leu Phe Thr Glu

35 40 45

Phe Val Pro Gly Gly Gly Phe Ile Leu Gly Leu Leu Asp Val Ile Trp

50 55 60

Gly Ser Ile Gly Arg Ser Gln Trp Glu Leu Phe Leu Glu Gln Ile Glu

65 70 75 80

Gln Leu Ile Lys Gln Arg Ile Glu Glu Phe Ala Arg Asn Gln Ala Ile

85 90 95

Ser Arg Leu Glu Gly Leu Ser Asp Leu Tyr Lys Thr Tyr Ala Arg Ala

100 105 110

Phe Ser Asp Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Glu

115 120 125

Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Ile Ile Thr Ala Leu

130 135 140

Pro Leu Phe Arg Val Gln Asn Tyr Glu Val Ala Leu Leu Ser Val Tyr

145 150 155 160

Val Gln Ala Ala Asn Leu His Leu Ser Ile Leu Arg Asp Val Ser Val

165 170 175

Phe Gly Glu Arg Trp Gly Tyr Asp Thr Ala Thr Ile Asn Asn Arg Tyr

180 185 190

Ser Asp Leu Thr Ser Leu Ile His Val Tyr Thr Asn His Cys Val Asp

195 200 205

Thr Tyr Asn Gln Gly Leu Arg Arg Leu Glu Gly Arg Phe Leu Thr Asp

210 215 220

Trp Ile Val Tyr Asn Arg Phe Arg Arg Gln Leu Thr Ile Ser Val Leu

225 230 235 240

Asp Ile Val Ala Phe Phe Pro Asn Tyr Asp Ile Arg Thr Tyr Pro Ile

245 250 255

Gln Thr Ala Thr Gln Leu Thr Arg Glu Val Tyr Leu Asp Leu Pro Phe

260 265 270

Ile Asn Glu Asn Leu Ser Pro Ala Ala Ser Tyr Pro Thr Phe Ser Ala

275 280 285

Ala Glu Ser Ala Ile Ile Arg Ser Pro His Leu Val Asp Phe Leu Asn

290 295 300

Ser Phe Thr Ile Tyr Thr Asp Ser Leu Ala Arg Tyr Ala Tyr Trp Gly

305 310 315 320

Gly His Leu Val Asn Ser Phe Arg Thr Gly Thr Thr Thr Asn Leu Ile

325 330 335

Arg Ser Pro Leu Tyr Gly Arg Glu Gly Asn Thr Glu Arg Pro Val Thr

340 345 350

Ile Thr Ala Ser Pro Ser Val Pro Ile Phe Arg Thr Leu Ser Tyr Ile

355 360 365

Thr Gly Leu Asp Asn Ser Asn Pro Val Ala Gly Ile Glu Gly Val Glu

370 375 380

Phe Gln Asn Thr Ile Ser Arg Ser Ile Tyr Arg Lys Ser Gly Pro Ile

385 390 395 400

Asp Ser Phe Ser Glu Leu Pro Pro Gln Asp Ala Ser Val Ser Pro Ala

405 410 415

Ile Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Leu Glu Arg Ile

420 425 430

Ser Gly Pro Arg Ile Ala Gly Thr Val Phe Ser Trp Thr His Arg Ser

435 440 445

Ala Ser Pro Thr Asn Glu Val Ser Pro Ser Arg Ile Thr Gln Ile Pro

450 455 460

Trp Val Lys Ala His Thr Leu Ala Ser Gly Ala Ser Val Ile Lys Gly

465 470 475 480

Pro Gly Phe Thr Gly Gly Asp Ile Leu Thr Arg Asn Ser Met Gly Glu

485 490 495

Leu Gly Thr Leu Arg Val Ser Phe Thr Gly Arg Leu Pro Gln Ser Tyr

500 505 510

Tyr Ile Arg Phe Arg Tyr Ala Ser Val Ala Asn Arg Thr Gly Thr Phe

515 520 525

Arg Tyr Ser Gln Pro Pro Ser Tyr Gly Leu Ser Phe Pro Lys Thr Met

530 535 540

Asp Ala Gly Glu Pro Leu Thr Ser Arg Ser Phe Ala His Thr Thr Leu

545 550 555 560

Phe Thr Pro Ile Thr Phe Ser Arg Ala Gln Glu Glu Phe Asp Leu Tyr

565 570 575

Ile Gln Ser Gly Val Tyr Ile Asp Arg Ile Glu Phe Ile Pro Val Thr

580 585 590

Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Val Val

595 600 605

Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys Thr Asp Val

610 615 620

Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Ala Cys Leu Ser

625 630 635 640

Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys

645 650 655

His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn

660 665 670

Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr

675 680 685

Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val

690 695 700

Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln

705 710 715 720

Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg

725 730 735

Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr

740 745 750

Asn

<210> 9

<211> 2259

<212> DNA

<213> 人工序列

<220>

<223> MP589FL的变体

<400> 9

atggaaggca acaacctgaa ccagtgcatt ccgtataact gcctgaccaa cccgaaagat 60

attattctgg gcgatgaacg tctggaaacc ggcaacaccg tggcggatat taccctgggc 120

attgtgaacc tgctgtttac cgaatttgtg ccgggcggcg gctttattct gggcctgctg 180

gatgtgattt ggggcagcat tggccgtagc cagtgggaac tgtttctgga acagattgaa 240

cagctgatta aacagcgtat tgatgatttt gcgcgtaacc aggcgattag ccgtctggaa 300

ggcctgagcg atctgtataa aacctatgcg cgtgcgttta gcgattggga agcggatccg 360

accaacccgg cgctgcgtga agaaatgcgt attcagttta acgatatgaa cagcgcgatt 420

attaccgcgc tgccgctgtt tcgtgtgcag aactatgaag tggcgctgct gagcgtgtat 480

gtgcaggcgg cgaacctgca tctgagcatt ctgcgtgatg tgagcgtgtt tggcgaacgt 540

tggggctatg ataccgcgac cattaacaac cgttatagcg atctgaccag cctgattcat 600

gtgtatacca accattgcgt ggatacctat aaccagggcc tgcgtcgtct ggaaggccgt 660

tttctgaccg attggattgt gtataaccgt tttcgtcgtc agctgaccat tagcgtgctg 720

gatattgtgg cgttttttcc gaactatgat attcgtacct atccgattca gaccgcgacc 780

cagctgaccc gtgaagtgta tctggatctg ccgtttatta acgaaaacct gagcccggcg 840

gcgagctatc cgacctttag cgcggcggaa agcgcgatta ttcgtagccc gcatctggtg 900

gattttatta acagctttac catttatacc gatagcctgg cgcgttatgc gtattggggc 960

ggccatctgg tgaacagctt tcgtaccggc accaccacca acctgattcg tagcccgctg 1020

tatggccgtg aaggcaacac cgaacgtccg gtgaccatta ccgcgagccc gagcgtgccg 1080

atttttcgta ccctgagcta tattaccggc ctggataaca gcaacccggt ggcgggcatt 1140

gaaggcgtgg aatttcagaa caccattagc cgtagcattt atcgtaaaag cggcccgatt 1200

gatagcttta gcgaactgcc gccgcaggat gcgagcgtga gcccggcgat tggctatagc 1260

catcgtctgt gccatgcgac ctttctggaa cgtattagcg gcccgcgtat tgcgggcacc 1320

gtgtttagct ggacccatcg tagcgcgagc ccgaccaacg aagtgagccc gagccgtatt 1380

acccagattc cgtgggtgaa agcgcatacc ctggcgagcg gcgcgagcgt gattaaaggc 1440

ccgggcttta ccggcggcga tattctgacc cgtaacagca tgggcgaact gggcaccctg 1500

cgtgtgagct ttaccggccg tctgccgcag agctattata ttcgttttcg ttatgcgagc 1560

gtggcgaacc gtaccggcac ctttcgttat agccagccgc cgagctatgg cctgagcttt 1620

ccgaaaacca tggatgcggg cgaaccgctg accagccgta gctttgcgca taccaccctg 1680

tttaccccga ttacctttag ccgtgcgcag gaagaatttg atctgtatat tcagagcggc 1740

gtgtatattg atcgtattga atttattccg gtgaccgcga cctttgaagc ggaatatgat 1800

ctggaacgtg cgcagaaagt ggtgaacgcg ctgtttacca gcaccaacca gctgggcctg 1860

aaaaccgatg tgaccgatta tcatattgat caggtgagca acctggtggc gtgcctgagc 1920

gatgaatttt gcctggatga aaaacgtgaa ctgagcgaaa aagtgaaaca tgcgaaacgt 1980

ctgagcgatg aacgtaacct gctgcaggat ccgaactttc gtggcattaa ccgtcagccg 2040

gatcgtggct ggcgtggcag caccgatatt accattcagg gcggcgatga tgtgtttaaa 2100

gaaaactatg tgaccctgcc gggcaccttt gatgaatgct atccgaccta tctgtatcag 2160

aaaattgatg aaagcaaact gaaagcgtat acccgttatc agctgcgtgg ctatattgaa 2220

gatagccagg atctggaaat ttatctgatt cgttataac 2259

<210> 10

<211> 753

<212> PRT

<213> 人工序列

<220>

<223> MP589FL的变体

<400> 10

Met Glu Gly Asn Asn Leu Asn Gln Cys Ile Pro Tyr Asn Cys Leu Thr

1 5 10 15

Asn Pro Lys Asp Ile Ile Leu Gly Asp Glu Arg Leu Glu Thr Gly Asn

20 25 30

Thr Val Ala Asp Ile Thr Leu Gly Ile Val Asn Leu Leu Phe Thr Glu

35 40 45

Phe Val Pro Gly Gly Gly Phe Ile Leu Gly Leu Leu Asp Val Ile Trp

50 55 60

Gly Ser Ile Gly Arg Ser Gln Trp Glu Leu Phe Leu Glu Gln Ile Glu

65 70 75 80

Gln Leu Ile Lys Gln Arg Ile Asp Asp Phe Ala Arg Asn Gln Ala Ile

85 90 95

Ser Arg Leu Glu Gly Leu Ser Asp Leu Tyr Lys Thr Tyr Ala Arg Ala

100 105 110

Phe Ser Asp Trp Glu Ala Asp Pro Thr Asn Pro Ala Leu Arg Glu Glu

115 120 125

Met Arg Ile Gln Phe Asn Asp Met Asn Ser Ala Ile Ile Thr Ala Leu

130 135 140

Pro Leu Phe Arg Val Gln Asn Tyr Glu Val Ala Leu Leu Ser Val Tyr

145 150 155 160

Val Gln Ala Ala Asn Leu His Leu Ser Ile Leu Arg Asp Val Ser Val

165 170 175

Phe Gly Glu Arg Trp Gly Tyr Asp Thr Ala Thr Ile Asn Asn Arg Tyr

180 185 190

Ser Asp Leu Thr Ser Leu Ile His Val Tyr Thr Asn His Cys Val Asp

195 200 205

Thr Tyr Asn Gln Gly Leu Arg Arg Leu Glu Gly Arg Phe Leu Thr Asp

210 215 220

Trp Ile Val Tyr Asn Arg Phe Arg Arg Gln Leu Thr Ile Ser Val Leu

225 230 235 240

Asp Ile Val Ala Phe Phe Pro Asn Tyr Asp Ile Arg Thr Tyr Pro Ile

245 250 255

Gln Thr Ala Thr Gln Leu Thr Arg Glu Val Tyr Leu Asp Leu Pro Phe

260 265 270

Ile Asn Glu Asn Leu Ser Pro Ala Ala Ser Tyr Pro Thr Phe Ser Ala

275 280 285

Ala Glu Ser Ala Ile Ile Arg Ser Pro His Leu Val Asp Phe Ile Asn

290 295 300

Ser Phe Thr Ile Tyr Thr Asp Ser Leu Ala Arg Tyr Ala Tyr Trp Gly

305 310 315 320

Gly His Leu Val Asn Ser Phe Arg Thr Gly Thr Thr Thr Asn Leu Ile

325 330 335

Arg Ser Pro Leu Tyr Gly Arg Glu Gly Asn Thr Glu Arg Pro Val Thr

340 345 350

Ile Thr Ala Ser Pro Ser Val Pro Ile Phe Arg Thr Leu Ser Tyr Ile

355 360 365

Thr Gly Leu Asp Asn Ser Asn Pro Val Ala Gly Ile Glu Gly Val Glu

370 375 380

Phe Gln Asn Thr Ile Ser Arg Ser Ile Tyr Arg Lys Ser Gly Pro Ile

385 390 395 400

Asp Ser Phe Ser Glu Leu Pro Pro Gln Asp Ala Ser Val Ser Pro Ala

405 410 415

Ile Gly Tyr Ser His Arg Leu Cys His Ala Thr Phe Leu Glu Arg Ile

420 425 430

Ser Gly Pro Arg Ile Ala Gly Thr Val Phe Ser Trp Thr His Arg Ser

435 440 445

Ala Ser Pro Thr Asn Glu Val Ser Pro Ser Arg Ile Thr Gln Ile Pro

450 455 460

Trp Val Lys Ala His Thr Leu Ala Ser Gly Ala Ser Val Ile Lys Gly

465 470 475 480

Pro Gly Phe Thr Gly Gly Asp Ile Leu Thr Arg Asn Ser Met Gly Glu

485 490 495

Leu Gly Thr Leu Arg Val Ser Phe Thr Gly Arg Leu Pro Gln Ser Tyr

500 505 510

Tyr Ile Arg Phe Arg Tyr Ala Ser Val Ala Asn Arg Thr Gly Thr Phe

515 520 525

Arg Tyr Ser Gln Pro Pro Ser Tyr Gly Leu Ser Phe Pro Lys Thr Met

530 535 540

Asp Ala Gly Glu Pro Leu Thr Ser Arg Ser Phe Ala His Thr Thr Leu

545 550 555 560

Phe Thr Pro Ile Thr Phe Ser Arg Ala Gln Glu Glu Phe Asp Leu Tyr

565 570 575

Ile Gln Ser Gly Val Tyr Ile Asp Arg Ile Glu Phe Ile Pro Val Thr

580 585 590

Ala Thr Phe Glu Ala Glu Tyr Asp Leu Glu Arg Ala Gln Lys Val Val

595 600 605

Asn Ala Leu Phe Thr Ser Thr Asn Gln Leu Gly Leu Lys Thr Asp Val

610 615 620

Thr Asp Tyr His Ile Asp Gln Val Ser Asn Leu Val Ala Cys Leu Ser

625 630 635 640

Asp Glu Phe Cys Leu Asp Glu Lys Arg Glu Leu Ser Glu Lys Val Lys

645 650 655

His Ala Lys Arg Leu Ser Asp Glu Arg Asn Leu Leu Gln Asp Pro Asn

660 665 670

Phe Arg Gly Ile Asn Arg Gln Pro Asp Arg Gly Trp Arg Gly Ser Thr

675 680 685

Asp Ile Thr Ile Gln Gly Gly Asp Asp Val Phe Lys Glu Asn Tyr Val

690 695 700

Thr Leu Pro Gly Thr Phe Asp Glu Cys Tyr Pro Thr Tyr Leu Tyr Gln

705 710 715 720

Lys Ile Asp Glu Ser Lys Leu Lys Ala Tyr Thr Arg Tyr Gln Leu Arg

725 730 735

Gly Tyr Ile Glu Asp Ser Gln Asp Leu Glu Ile Tyr Leu Ile Arg Tyr

740 745 750

Asn

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1