具有抗半翅目活性的杀昆虫蛋白及其使用方法与流程

文档序号:11294495阅读:365来源:国知局
具有抗半翅目活性的杀昆虫蛋白及其使用方法对以电子方式提交的序列表的引用以电子方式将序列表的正式副本作为ASCII格式的序列表提交,该文件名称为“5264WOPCT_Sequence_Listing.TXT”,并且该文件与本说明书同时提交。该ASCII格式文档中所含的序列表是本说明书的一部分,并且全文以引用的方式并入本文。
技术领域
:本发明涉及编码杀虫多肽的基因,该基因以针对昆虫害虫的杀虫活性为特征。本发明的组合物和方法利用所公开的核酸及其编码的杀虫多肽来防治植物害虫。
背景技术
::昆虫害虫是造成全世界农作物损失的主要因素。例如,行军虫取食、黑地蚕损害或者欧洲玉米螟损害可对农业生产商造成经济上的破坏。单单是欧洲玉米螟侵袭非甜质玉米和甜玉米造成的昆虫害虫相关作物损失,一年的损害和防治费用就达大约十亿美元。传统上,防治昆虫害虫种群的主要方法是施用广谱化学杀昆虫剂。但是,消费者和政府监管者都日益关注与合成化学杀虫剂的生产和使用相关的环境危害。由于这些关注,监管者禁止或者限制了一些危害比较大的杀虫剂的使用。因此,人们对于开发另类杀虫剂有很大的兴趣。使用微生物剂如真菌、细菌或者另一种昆虫对具有农业意义的昆虫害虫进行生物防治,可提供具有环境友好性和商业吸引力的合成化学杀虫剂替代方案。一般而言,生物杀虫剂的使用造成的污染和环境危害的风险较低,并且生物杀虫剂能提供比传统广谱化学杀昆虫剂的特征性靶标特异性更高的靶标特异性。另外,生物杀虫剂的生产成本往往较低,因此能提高众多作物的经济产量。已知芽孢杆菌属(Bacillus)微生物的某些物种对于多种昆虫害虫具有杀虫活性,这些昆虫害虫包括鳞翅目(Lepidoptera)、双翅目(Diptera)、鞘翅目(Coleoptera)、半翅目(Hemiptera)等等。苏云金芽孢杆菌(Bacillusthuringiensis)(Bt)和日本金龟芽孢杆菌(Bacilluspapilliae)是至今为止发现的最成功的生物防治剂的代表。昆虫致病性也被认为是由幼虫芽孢杆菌(B.larvae)、缓病芽孢杆菌(B.lentimorbus)、球形芽孢杆菌(B.sphaericus)和蜡样芽孢杆菌(B.cereus)的菌株引起的。微生物杀昆虫剂特别是那些从芽孢杆菌菌株获得的微生物杀昆虫剂,在农业上作为害虫化学防治的替代方案已起到重要的作用。最近,已通过对作物进行遗传工程改造以产生来自芽孢杆菌的杀虫蛋白,开发出了昆虫抗性增强的作物。这些经遗传工程改造的作物目前在美国农业中广泛应用,给生产者提供了替代传统昆虫防治方法的环境友好的方案。虽然这些经遗传工程改造的抗昆虫作物已证明在商业上十分成功,但它们通常仅对较窄范围的经济上重要的害虫具有抗性。某些昆虫已对这些经遗传工程改造的作物中的某些杀昆虫多肽产生了抗性。因此,仍然需要对昆虫害虫具有更大范围的杀昆虫活性的新杀虫蛋白,例如对更多种类的鳞翅目、鞘翅目、半翅目等昆虫具有活性的毒素。此外,仍然需要具有改善的杀昆虫活性和对于多种对现有杀虫剂及杀虫蛋白已产生抗性的昆虫具有活性的生物杀虫剂。技术实现要素:在一个方面,提供了将杀虫活性赋予细菌、植物、植物细胞、组织和种子的组合物和方法。组合物包含编码杀虫和杀昆虫多肽的序列的核酸分子、含有那些核酸分子的载体以及含有所述载体的宿主细胞。组合物还包含杀虫多肽序列以及那些多肽的抗体。核酸序列可用于DNA构建体或表达盒中,该DNA构建体或表达盒用于在生物体(包括微生物和植物)中转化和表达。核苷酸或氨基酸序列可以为设计用于在生物体(包括但不限于微生物或植物)中表达的合成序列。组合物还包含转化的细菌、植物、植物细胞、组织和种子。具体地讲,提供了编码MP467或MP812多肽(包括氨基酸置换、缺失、插入、SEQIDNO:2或SEQIDNO:24片段)的分离或重组的核酸分子。此外,涵盖了与MP467或MP812多肽对应的氨基酸序列。提供了SEQIDNO:1或SEQIDNO:23的分离或重组的核酸分子,其能够编码MP467或MP812多肽以及氨基酸置换、缺失、插入及其片段,以及它们的组合。还涵盖了与所述实施例的核酸序列互补或杂交至所述实施例的序列的核酸序列。在另一方面,提供了用于产生多肽以及使用那些多肽防治或杀灭鳞翅目、鞘翅目、线虫、真菌和/或半翅目害虫的方法。所述实施例的转基因植物表达本文所公开的杀虫序列中的一者或多者。在各种实施例中,所述转基因植物还包含具有昆虫抗性的一个或多个另外的基因,例如,用于防治鞘翅目、鳞翅目、半翅目或线虫害虫的一个或多个另外的基因。本领域技术人员应当理解,所述转基因植物可包含赋予所关注的农艺性状的任何基因。在另一方面,还包括用于检测样品中的本发明实施例的核酸和多肽的方法。提供了用于检测MP467多肽或MP812多肽的存在或检测样品中编码MP467多肽和/或MP812多肽的多核苷酸的存在的试剂盒。所述试剂盒可连同执行检测预期因子的方法所需的所有试剂和对照样品以及使用说明一起提供。在另一方面,本发明实施例的组合物和方法可用于产生具有增强的害虫抗性或耐受性的生物体。这些生物体和包含所述生物体的组合物对农业用途而言是理想的。本发明实施例的组合物也可用于产生具有杀虫活性的改变或改善的蛋白质,或可用于检测产物或生物体中MP467多肽或核酸和MP812多肽或核酸的存在。附图说明图1示出了MP467(SEQIDNO:2)与绿色水螅(Hydraviridissima)中水螅溶素蛋白(SEQIDNO:4)的氨基酸序列比对。显示强调了MP467(SEQIDNO:2)与水螅溶素(SEQIDNO:4)之间的相同和相似氨基酸(*=相同;*=相似)。构成MP467(SEQIDNO:2)疏水补丁的残基(Phe26、Val48、Pro50、Ile52、Tyr56、Met193、Val202、His205、Tyr206、Phe207、Trp208、Phe209和Leu210)在序列下方用“*”标出。图2示出了MP467(SEQIDNO:2)与苏云金芽孢杆菌中抗癌晶体蛋白2/Cry46Ab蛋白(SEQIDNO:12)的氨基酸序列比对。显示强调了MP467(SEQIDNO:2)与Cry46Ab(SEQIDNO:12)之间的相同和相似氨基酸(*=相同;*=相似)。构成MP467(SEQIDNO:2)疏水补丁的残基(Phe26、Val48、Pro50、Ile52、Tyr56、Met193、Val202、His205、Tyr206、Phe207、Trp208、Phe209和Leu210)在序列下方用“*”标出。图3示出了MP467(SEQIDNO:2)与苏云金芽孢杆菌中抗癌晶体蛋白2/Cry46Aa蛋白(SEQIDNO:10)的氨基酸序列比对。显示强调了MP467(SEQIDNO:2)与Cry46Aa(SEQIDNO:10)之间的相同和相似氨基酸(*=相同;*=相似)。构成MP467(SEQIDNO:2)疏水补丁的残基(Phe26、Val48、Pro50、Ile52、Tyr56、Met193、Val202、His205、Tyr206、Phe207、Trp208、Phe209和Leu210)在序列下方用“*”标出。图4示出了MP467(SEQIDNO:2)与无杀昆虫活性同源物MP543(SEQIDNO:6)和MP544(SEQIDNO:8)的氨基酸序列比对。显示强调了与MP467(SEQIDNO:2)相比,MP543(SEQIDNO:6)和MP544(SEQIDNO:8)之间的序列多样性。构成MP467(SEQIDNO:2)疏水补丁的残基(Phe26、Val48、Pro50、Ile52、Tyr56、Met193、Val202、His205、Tyr206、Phe207、Trp208、Phe209和Leu210)在序列下方用“*”标出。β发夹中的交替残基以下划线标出,并在序列下方用“+”表示。图5示出了MP467(467)(SEQIDNO:14)和如下同源物中β发夹结构区的氨基酸序列比对:抗癌晶体蛋白-2(Ps2)(SEQIDNO:15);水螅溶素(Hdr)(SEQIDNO:16);α毒素(ApT)(SEQIDNO:17);气溶素(Aer)(SEQIDNO:18);ε毒素(Epn)(SEQIDNO:19);溶血性凝集素(LSL)(SEQIDNO:20);肠毒素(CPE)(SEQIDNO:21);和α溶血素(Aph)(SEQIDNO:22)。显示强调了β发夹中的交替残基。图6示出了指示β发夹区的α溶血素的孔道(porestem)结构。图7示出了MP467、MP812和Cry46A的整体三结构域结构。图8示出了MP467同源物之间的结构比较。图9示出了指示螺旋1(H1)、螺旋2(H2)、螺旋3(H3)、螺旋4(H4)、β链3(S3)、β链11(S11)、β链12(S12)、和β链11和β链12之间1’-β-转角区的MP467和MP812的结构域1的结构。显示强调了MP467(SEQIDNO:2)的1’-β-转角区的残基H205、Y206、F207、W208和F209。MP812(SEQIDNO:24)的对应残基H229、H230、F231、W232和A233用方框标出。图10示出了MP467(SEQIDNO:2)和MP812(SEQIDNO:24)的氨基酸序列比对。显示强调了MP467(SEQIDNO:2)与MP812(SEQIDNO:12)之间的相同和相似氨基酸(*=相同;*=相似)。具体实施方式本发明的实施例涉及用于防治昆虫害虫尤其是植物害虫的组合物和方法。更具体而言,本发明实施例的分离核酸及其片段和变体包含编码杀虫多肽(例如蛋白质)的核苷酸序列。所公开的杀虫蛋白对昆虫害虫具有生物活性(例如杀虫活性),所述昆虫害虫例如但不限于鳞翅目、鞘翅目和半翅目的昆虫害虫。所关注的昆虫害虫包括但不限于:欧洲玉米螟(Ostrinianubilalis,EuropeanCornBorer)、秋夜蛾(Spodopterafrugiperda,FallArmyworm)、玉米穗虫(HelicoverpazeaBoddie,ComEarworm)、黑地蚕(AgrotisipsilonHufnagel,BlackCutworm)、大豆尺蠖(PseudoplusiaincludensWalker,SoybeanLooper)、黎豆毛虫(AnticarsiagemmatalisHübner,VelvetbeanCaterpillar)、西方玉米根虫(Diabroticavirgiferavirgifera,WesternCornRootworm)、南方玉米根虫(根萤叶甲属物种(Diabroticaspp.))、北方玉米根虫(根萤叶甲属物种(Diabroticaspp.))、墨西哥豆瓢虫(EpilachnavarivestisMulsant)、蝽蟓(蝽科)和草盲蝽属物种(Lygusspp.)。本发明实施例的组合物包含编码杀虫多肽的分离核酸及其片段和变体、包含本发明实施例的核苷酸序列的表达盒、分离的杀虫蛋白及其变体和片段以及杀虫组合物。本发明涵盖了以下实施例:1.一种分离的三结构域杀昆虫蛋白,其结构包含:a.结构域I,包含表面疏水补丁和1’型β转角;b.结构域II;以及c.结构域III,其中结构域II和结构域III的表面包含暴露于溶剂中的丝氨酸和苏氨酸残基条带。2.实施例1所述的分离的三结构域杀昆虫蛋白,其中结构域I还包含具有四个短链的反向平行β折叠和四个α螺旋,称之为螺旋1、螺旋2、螺旋3和螺旋4。3.实施例2所述的分离的三结构域杀昆虫蛋白,其中结构域I的反向平行的β折叠还包括链11、链12的C端,并且链11和链12的1’型β转角连接。4.实施例1至3中任一项所述的分离的三结构域杀昆虫蛋白,其中结构域I还包含螺旋2和螺旋3之间的β发夹。5.实施例1至4中任一项所述的分离的三结构域杀昆虫蛋白,其中所述表面疏水补丁包含链12、螺旋2、螺旋3的残基,并且所述1’型β转角包含链11和链12之间的残基。6.实施例5所述的分离的三结构域杀昆虫蛋白,其中链11和链12之间的1’型β转角包含如由SEQIDNO:25表示的氨基酸序列基序。7.实施例5或6所述的分离的三结构域杀昆虫蛋白,其中链11和链12之间的1’型β转角包含SEQIDNO:13的氨基酸序列。8.实施例1至7中任一项所述的分离的三结构域杀昆虫蛋白,其中所述表面疏水补丁为约9.实施例1至8中任一项所述的分离的三结构域杀昆虫蛋白,其中所述疏水补丁包含与SEQIDNO:2的Phe26、Val48、Pro50、Ile52、Tyr56、Met193、Val202、His205、Tyr206、Phe207、Trp208、Phe209和Leu210对应的残基。10.实施例1至9中任一项所述的分离的三结构域杀昆虫蛋白,其中结构域1包含与SEQIDNO:2的残基对应的残基1至约残基65和约残基187至约残基223。11.实施例1至10中任一项所述的分离的三结构域杀昆虫蛋白,其中结构域II包含5条链构成的反向平行β折叠(β5/β6-β11-β13-β7-β10),通过源于β2和β10的两亲性β发夹补于一侧。12.实施例1至11中任一项所述的分离的三结构域杀昆虫蛋白,其中结构域II包含与SEQIDNO:2的残基对应的约残基66至约残基79;约残基104至约残基154;约残基175至约残基186;和约残基224至约残基234。13.实施例1至12中任一项所述的分离的三结构域杀昆虫蛋白,其中结构域III包含与域II相同的5个β链,结构域II的5个β链延伸并以β夹层结构重新折叠至结构域III,其中β5/β6、β11和β13三个链在中间扭转180°形成新的3链β折叠,作为β夹层的一侧,而β7和β10从中心折叠散开,在中间扭转,并且疏水地压向链β5/β6、β11和β13。14.实施例1至13中任一项所述的分离的三结构域杀昆虫蛋白,其中结构域III包含与SEQIDNO:2的残基对应的约残基80至约残基103;约残基155至约残基174;和约残基235至约残基246。15.实施例1至14中任一项所述的分离的三结构域杀昆虫蛋白,其中结构域II和结构域III表面暴露的丝氨酸和苏氨酸残基条带包括:链11上交替基序中3个丝氨酸残基和4个苏氨酸残基,以及链7上的3个丝氨酸残基和2个苏氨酸残基。16.实施例1至15中任一项所述的分离的三结构域杀昆虫蛋白,其中链11上的3个丝氨酸残基和4个苏氨酸残基的平均溶剂可及性为约链7上的3个丝氨酸残基和2个苏氨酸残基平均约有的面积暴露于溶剂中。17.实施例1至16中任一项所述的分离的三结构域杀昆虫蛋白,其中所述三结构域杀昆虫蛋白与SEQIDNO:2的多肽相比,其溶血活性有所降低。18.实施例17所述的分离的三结构域杀昆虫蛋白,其中其溶血活性与SEQIDNO:2的多肽的溶血活性相比,降低了至少1/2。19.实施例17所述的分离的三结构域杀昆虫蛋白,其中其溶血活性与SEQIDNO:20的多肽的溶血活性相比,降低了大于19/20。20.实施例17至19中任一项所述的分离的三结构域杀昆虫蛋白,其中所述溶血活性的降低是所述疏水补丁中一个或多个氨基酸残基置换的结果。21.实施例20所述的分离的三结构域杀昆虫蛋白,其中所述疏水补丁中的残基选自与SEQIDNO:2的Phe26、Val48、Pro50、Ile52、Tyr56、Met193、Val202、His205、Tyr206、Phe207、Trp208、Phe209和Leu210对应的残基。22.实施例21所述的分离的三结构域杀昆虫蛋白,其中所述疏水补丁中的残基选自与SEQIDNO:2的Tyr56、Tyr206、Phe207、Trp208、Phe209对应的残基。23.实施例20所述的分离的三结构域杀昆虫蛋白,其中所述疏水补丁包含如由SEQIDNO:26的序列表示的基序,其中在对应于SEQIDNO:2的位置206、207、208或209的残基处,至少一个残基为与野生型氨基酸不同的氨基酸。24.实施例20所述的分离的三结构域杀昆虫蛋白,其中所述疏水补丁包含如由SEQIDNO:27的序列表示的基序,其中在对应于SEQIDNO:2的位置206、207、208或209的残基处,至少一个残基为与野生型氨基酸不同的氨基酸。25.实施例1至24中任一项所述的分离的三结构域杀昆虫蛋白,其中所述三结构域杀昆虫蛋白与SEQIDNO:2具有至少80%的同一性。26.实施例1至24中任一项所述的分离的三结构域杀昆虫蛋白,其中所述三结构域杀昆虫蛋白与SEQIDNO:2具有至少90%的同一性。27.实施例1至24中任一项所述的分离的三结构域杀昆虫蛋白,其中所述三结构域杀昆虫蛋白与SEQIDNO:2具有至少95%的同一性。28.实施例1至24中任一项所述的分离的三结构域杀昆虫蛋白,其中所述三结构域杀昆虫蛋白与SEQIDNO:24具有至少80%的同一性。29.实施例1至24中任一项所述的分离的三结构域杀昆虫蛋白,其中所述三结构域杀昆虫蛋白与SEQIDNO:24具有至少90%的同一性。30.实施例1至24中任一项所述的分离的三结构域杀昆虫蛋白,其中所述三结构域杀昆虫蛋白与SEQIDNO:24具有至少95%的同一性。31.一种分离的核酸分子,其编码实施例1至30中任一项所述的三结构域杀昆虫蛋白。32.实施例31所述的分离的核酸分子,其中所述核苷酸分子是已被设计用来在植物中表达的合成分子。33.一种DNA构建体,其包含实施例31或32所述的核酸分子。34.实施例33所述的DNA构建体,其中所述DNA构建体还包含有效连接至所述编码三结构域杀昆虫蛋白的核酸分子的异源启动子。35.一种宿主细胞,其包含实施例33或34所述的DNA构建体。36.实施例35所述的宿主细胞,其中所述宿主细胞为细菌细胞。37.实施例35所述的宿主细胞,其中所述宿主细胞为植物细胞。38.一种转基因植物,其包含实施例33或34所述的DNA构建体。39.实施例38所述的转基因植物,其中所述植物选自玉米、高粱、小麦、向日葵、番茄、十字花科物种、辣椒属物种、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦和油菜。40.实施例38或39所述的转基因植物的转化种子,其中所述种子包含所述DNA构建体。41.一种组合物,其包含实施例1至30中任一项所述的三结构域杀昆虫蛋白。42.实施例41所述的组合物,其中所述组合物选自散剂、粉剂、小丸剂、颗粒剂、喷雾剂、乳剂、胶体剂和溶液剂。43.实施例42所述的组合物,其中所述组合物通过对微生物的培养物进行干燥、冻干、均化、提取、过滤、离心、沉淀或浓缩而制备。44.一种防治害虫种群的方法,包括使所述种群接触杀昆虫有效量的实施例1至30中任一项所述的三结构域杀昆虫蛋白。45.一种杀灭害虫的方法,包括使所述害虫接触或者给所述害虫喂食杀昆虫有效量的实施例1至30中任一项所述的三结构域杀昆虫蛋白。46.一种保护植物免遭害虫侵扰的方法,包括向所述植物或其细胞中引入实施例33或34所述的至少一种DNA构建体。47.实施例46所述的方法,其中所述植物针对至少一种半翅目昆虫物种产生具有杀昆虫活性的杀昆虫蛋白。48.实施例47所述的方法,其中所述昆虫物种是蝽科。49.实施例48所述的方法,其中所述昆虫物种选自茶翅椿(Halyomorphahalys)、南方绿蝽(Nezaraviridula)、稻绿蝽(Chinaviahilare)、褐臭蝽(Euschistusservus)、暗淡蝽(Euschistustristigmus)、Euschistusquadrator、稻蝽(Oebaluspugnax)、红肩蝽(ThyantaaccerraMcAtee)、Thyantacustator、红带蝽(Piezodorusguildini)、菜蝽(Murgantiahistrionica)、Edessabifida和两块血斑蝽(CosmopeplalintnerianaKirkaldy)。50.实施例46所述的方法,其中所述植物针对至少一种鳞翅目昆虫物种产生具有杀昆虫活性的杀昆虫蛋白。51.实施例50所述的方法,其中所述昆虫物种选自欧洲玉米螟(Ostrinianubilalis)、玉米穗虫(Helicoverpazea)、黑地蚕(Agrotisipsilon)、秋夜蛾(Spodopterafrugiperda)、大豆尺蠖(Pseudoplusiaincludens)和黎豆毛虫(Anticarsiagemmatalis)。52.实施例46所述的方法,其中所述植物针对至少一种鞘翅目物种产生具有杀昆虫活性的杀昆虫蛋白。53.实施例52所述的方法,其中所述昆虫物种选自西方玉米根虫(Diabroticavirgiferavirgifera)、北方玉米根虫(Diabroticabarberi)、墨西哥玉米根虫(Diabroticavirgiferazeae)。54.一种产生三结构域杀昆虫多肽的方法,包括在所述编码多肽的核酸分子表达的条件下培养实施例35至37中任一项所述的宿主细胞。55.一种植物,其基因组中稳定地掺入了DNA构建体,所述DNA构建体包含编码与SEQIDNO:10的氨基酸序列具有至少80%序列同一性的蛋白质的核苷酸序列;其中所述核苷酸序列有效连接至启动子,该启动子驱动所述编码序列在植物细胞中的表达。56.一种保护植物免遭害虫侵扰的方法,包括向所述植物或其细胞中引入至少一种DNA构建体,所述DNA构建体包含编码与SEQIDNO:10的氨基酸序列具有至少80%序列同一性的杀昆虫多肽的核苷酸序列。57.实施例56所述的方法,其中所述植物针对至少一种半翅目昆虫物种产生具有杀昆虫活性的杀昆虫蛋白。58.实施例57所述的方法,其中所述昆虫物种属于蝽科。本发明实施例还提供由本发明实施例的天然或经修饰的核酸编码的分离的杀虫(例如杀昆虫)多肽。更具体地讲,本发明实施例提供包含在SEQIDNO:2和SEQIDNO:24中示出的氨基酸序列的多肽,并且所述多肽由本文所述的核酸编码,例如在SEQIDNO:1和SEQIDNO:23中示出的那些多肽及其片段和变体,所述多肽包括但不限于SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41、SEQIDNO:42、SEQIDNO:43、SEQIDNO:44、SEQIDNO:45、SEQIDNO:46、SEQIDNO:47、SEQIDNO:48、SEQIDNO:49、SEQIDNO:50、SEQIDNO:51、SEQIDNO:52、SEQIDNO:53、SEQIDNO:54、SEQIDNO:55、SEQIDNO:56、SEQIDNO:57、SEQIDNO:58、SEQIDNO:59、SEQIDNO:60、SEQIDNO:61、SEQIDNO:62、SEQIDNO:63、SEQIDNO:64、SEQIDNO:65、SEQIDNO:66、SEQIDNO:67、SEQIDNO:68和SEQIDNO:69的多肽。本发明实施例还提供分离的杀虫(例如,杀昆虫)多肽。更具体地讲,本发明实施例提供包含在SEQIDNO:2和SEQIDNO:24中示出的氨基酸序列及其片段和变体的多肽,包括但不限于SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41、SEQIDNO:42、SEQIDNO:43、SEQIDNO:44、SEQIDNO:45、SEQIDNO:46、SEQIDNO:47、SEQIDNO:48、SEQIDNO:49、SEQIDNO:50、SEQIDNO:51、SEQIDNO:52、SEQIDNO:53、SEQIDNO:54、SEQIDNO:55、SEQIDNO:56、SEQIDNO:57、SEQIDNO:58、SEQIDNO:59、SEQIDNO:60、SEQIDNO:61、SEQIDNO:62、SEQIDNO:63、SEQIDNO:64、SEQIDNO:65、SEQIDNO:66、SEQIDNO:67、SEQIDNO:68和SEQIDNO:69的多肽。在一些实施例中,所述杀昆虫多肽与SEQIDNO:2、SEQIDNO:10、SEQIDNO:24、SEQIDNO:29、SEQIDNO:30、SEQIDNO:31、SEQIDNO:32、SEQIDNO:33、SEQIDNO:34、SEQIDNO:35、SEQIDNO:36、SEQIDNO:37、SEQIDNO:38、SEQIDNO:39、SEQIDNO:40、SEQIDNO:41、SEQIDNO:42、SEQIDNO:43、SEQIDNO:44、SEQIDNO:45、SEQIDNO:46、SEQIDNO:47、SEQIDNO:48、SEQIDNO:49、SEQIDNO:50、SEQIDNO:51、SEQIDNO:52、SEQIDNO:53、SEQIDNO:54、SEQIDNO:55、SEQIDNO:56、SEQIDNO:57、SEQIDNO:58、SEQIDNO:59、SEQIDNO:60、SEQIDNO:61、SEQIDNO:62、SEQIDNO:63、SEQIDNO:64、SEQIDNO:65、SEQIDNO:66、SEQIDNO:67、SEQIDNO:68或SEQIDNO:69具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。在一些实施例中,所述杀昆虫多肽与SEQIDNO:2具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。在一些实施例中,所述杀昆虫多肽与SEQIDNO:24具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。在一些实施例中,所述杀昆虫多肽与SEQIDNO:10具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。一些实施例提供经修饰的杀虫多肽,其特征在于其杀昆虫活性相对于相应的野生型蛋白的杀虫活性而言得到改善。本发明实施例还提供用这些新核酸转化的植物和微生物,以及涉及将这种核酸、杀虫组合物、转化的生物体及其产物用于防治昆虫害虫的方法。本发明实施例的核酸和核苷酸序列可用于转化任何生物体以产生所编码的杀虫蛋白。本发明提供了涉及使用这种经转化的生物体来防治植物害虫的方法。本发明实施例的核酸和核苷酸序列也可用于转化细胞器如叶绿体(McBrideetal.(1995)Biotechnology13:362-365(McBride等人,1995年,《生物技术》,第13卷,第362-365页);和Kotaetal.(1999)Proc.Natl.Acad.Sci.USA96:1840-1845(Kota等人,1999年,《美国国家科学院院刊》,第96卷,第1840-1845页))。本发明实施例还涉及对编码生物活性杀虫蛋白的天然编码序列的片段和变体的识别。本发明实施例的核苷酸序列可直接用于防治害虫的方法。因此,本发明实施例提供不依赖使用传统的合成化学杀昆虫剂而防治昆虫害虫的新方法。本发明实施例涉及对天然生物可降解杀虫剂及编码它们的基因的发现。本发明实施例还提供天然编码序列的片段和变体,所述天然编码序列也编码生物活性(例如杀虫)多肽。本发明实施例的核酸涵盖已被优化以便由特定生物体的细胞表达的核酸或者核苷酸序列,例如已使用基于具有增强的杀虫活性的多肽的氨基酸序列的植物偏好密码子进行了反翻译(即逆翻译)的核酸序列。本发明实施例还提供能赋予本发明实施例的多肽改善的或变更的性质的突变。参见例如提交于2003年6月25日的共同未决的美国专利申请No.10/606,320和提交于2003年12月24日的美国专利申请No.10/746,914。在下面的描述中,以广义方式使用到多个术语。提供了以下定义以便理解本发明实施例。单位、前缀和符号可以以其国际单位制(SI)接受的形式表示。除非另外指明,否则分别地,核酸以5′至3′取向从左向右书写;氨基酸序列以氨基向羧基取向从左向右书写。数值范围包括限定该范围的数字。氨基酸在本文中可通过它们通常知道的三字母符号表示或通过IUPAC-IUB生化命名委员会(IUPAC-IUBBiochemicalNomenclatureCommission)推荐的单字母符号表示。同样,核苷酸可通过它们通常接受的单字母密码表示。以上术语通过参考本说明书整体而得到更完全的定义。所谓“杀虫毒素”或“杀虫蛋白”意指对于一种或多种害虫(包括但不限于鳞翅目、双翅目、半翅目和鞘翅目或线虫门的成员)具有毒杀活性的蛋白,或与此类蛋白同源的蛋白。杀虫蛋白已从生物体分离,所述生物体包括例如芽孢杆菌属物种、假单胞菌属物种、发光杆菌属物种(Photorhabdussp.)、致病杆菌属物种(Xenorhabdussp.)、双酶梭菌(Clostridiumbifermentans)以及日本甲虫类芽孢杆菌(Paenibacilluspopilliae)。术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,指氨基酸残基的聚合物。这些术语适用于其中一个或多个氨基酸残基为相应的天然氨基酸的人工化学类似物的氨基酸聚合物,并且适用于天然氨基酸聚合物。术语“残基”或“氨基酸残基”或“氨基酸”在本文中可互换使用,指整合进蛋白质、多肽或肽(统称“蛋白质”)中的氨基酸。该氨基酸可以是天然氨基酸,并且除非另外进行限制,否则可涵盖可以以与天然氨基酸类似的方式发挥功能的天然氨基酸的已知类似物。本发明实施例的多肽可以由本文公开的核酸产生,或者通过使用标准的分子生物学技术产生。例如,本发明实施例的蛋白质可通过在适当的宿主细胞中表达本发明实施例的重组核酸来产生,或者作为另一种选择,通过离体(exvivo)程序的组合来产生。本文所用的术语“分离的”和“纯化的”可互换使用,指这样的核酸或者多肽或者它们的生物活性部分:实质上或者基本上不含通常在其天然环境中存在的与其相伴或者相互作用的成分。因此,分离的或纯化的核酸或多肽,当通过重组技术产生时实质上不含其他细胞物质或培养基,或者当通过化学法合成时实质上不含化学前体或其他化学品。在一些实施例中,本公开的多肽包含从本文所公开的全长核酸序列推断出的氨基酸序列以及因使用替代的下游起始位点或因产生具有杀虫活性的较短蛋白的加工而短于全长序列的氨基酸序列。加工可在蛋白表达的生物体中进行或在蛋白摄食后在害虫体内进行。在一些实施例中,编码MP467多肽或MP812多肽的核酸分子是非基因组核酸序列。如本文所用,“非基因组核酸序列”或“非基因组核酸分子”或“非基因组多核苷酸”是指与天然或基因组核酸序列相比在核酸序列中具有一个或多个改变的核酸分子。在一些实施例中,对天然或基因组核酸分子的改变包括但不限于:由于遗传密码简并性引起的核酸序列改变;用于在植物中表达的核酸序列的密码子优化;与天然或基因组序列相比,引入至少一种氨基酸置换、插入、缺失和/或添加引起的核酸序列改变;与基因组核酸序列相关的一个或多个内含子的去除;一个或多个异源内含子的插入;与基因组核酸序列相关的一个或多个上游或下游调节区的缺失;一个或多个异源上游或下游调节区的插入;与基因组核酸序列相关的5’和/或3’非翻译区的缺失;异源5’和/或3’非翻译区的插入;以及聚腺苷酸化位点的修饰。在一些实施例中,所述非基因组核酸分子是cDNA。在一些实施例中,所述非基因组核酸分子是合成核酸序列。本文中用于描述蛋白质结构基序和二级结构的术语在本领域中具有其标准含义。参见例如:Creighton,ThomasA.,Proteins:StructuresandMolecularProperties,W.H.Freeman;Seconded.(1992)(Creighton、ThomasA.,《蛋白质:结构和分子特性》,W.H.弗里曼公司,第2版,1992年);Kabsch,et.al.,DictionaryofProteinSecondaryStructure,Biopolymers,Vol.22,2577-2637(1983)(Kabsch等人,蛋白质二级结构词典,《生物聚合物》,第22卷,第2577-2637页,1983年)。本文所用的术语“改善的杀昆虫活性”或“改善的杀虫活性”指本发明实施例的杀昆虫多肽相对于其相应的野生型蛋白质的具有增强的杀昆虫活性,和/或该杀昆虫多肽对更广范围的昆虫有效,和/或该杀昆虫多肽对不易受野生型蛋白的毒性影响的昆虫具有特异性。改善的或增强的杀虫活性的发现,要求证明相对于野生型杀昆虫多肽的针对同一昆虫靶标测定的杀虫活性而言,对该昆虫靶标的杀虫活性提高至少10%,或至少20%、25%、30%、35%、40%、45%、50%、60%、70%、100%、150%、200%或300%或更高。例如,如果相对于受野生型毒素影响的昆虫范围而言受该多肽防治的昆虫范围更广或更窄,则提供了改善的杀虫或杀昆虫活性。在需要多用途性的情况下,更宽的防治范围可能是合乎需要的,而在例如有益昆虫可能反而会被该毒素的使用或存在影响的情况下,较窄的范围可能是合乎需要的。尽管本发明实施例不受任何特定作用机制的限定,但也可以通过多肽的一个或多个特征的改变从而提供改善的杀虫活性;例如,多肽在昆虫肠内的稳定性和寿命相对于相应野生型蛋白质的稳定性和寿命可能有所改善。可对本发明的多肽进行一些改变,赋予它们其他期望的物理或生物特性,包括但不限于:降低的溶血活性、改变的对胃蛋白酶、胰蛋白酶、胰凝乳蛋白酶及其他蛋白酶的敏感性。本发明涵盖了这样的改变:其对蛋白质的杀虫活性或杀昆虫活性可以不带来负面影响。例如,可在一个或多个预测的非必需氨基酸残基处进行保守氨基酸置换。“非必需”氨基酸残基是可从多肽的野生型序列改变而不改变其生物活性的残基。“保守氨基酸置换”是氨基酸残基被替换为具有类似侧链的氨基酸残基的氨基酸置换。具有类似侧链的氨基酸残基的家族已在本领域中定义。这些家族包括:具有碱性侧链(例如赖氨酸、精氨酸、组氨酸);酸性侧链(例如天冬氨酸、谷氨酸);极性、带负电荷的残基及其酰胺(例如天冬氨酸、天冬酰胺、谷氨酸、谷氨酰胺);不带电荷的极性侧链(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸);较小脂族、非极性或弱极性残基(例如丙氨酸、丝氨酸、苏氨酸、脯氨酸、甘氨酸);非极性侧链(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸);较大脂族、非极性残基(例如甲硫氨酸、亮氨酸、异亮氨酸、缬氨酸、胱氨酸);β-支化的侧链(例如苏氨酸、缬氨酸、异亮氨酸);芳族侧链(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸);较大芳族侧链(例如酪氨酸、苯丙氨酸、色氨酸)的氨基酸。氨基酸置换可在保留功能的非保守区中进行。一般来讲,除本文另外提到的情况外,此类置换不会对保守氨基酸残基或对位于保守基序内的氨基酸残基进行,其中此类残基是蛋白活性必需的。保守的且可能是蛋白活性必需的残基的例子包括例如在相似或相关毒素与所述实施例的序列的比对中所含的所有蛋白之间相同的残基(例如,在同源蛋白的比对中相同的残基)。保守的但可允许保守氨基酸置换且仍然保留活性的残基的例子包括例如在相似或相关毒素与所述实施例的序列的比对中所含的所有蛋白之间仅具有保守置换的残基(例如,在同源蛋白的比对中所含的所有蛋白之间仅具有保守置换的残基)。然而,本领域技术人员应当理解,功能性变体在保守残基中可具有较少保守或非保守的改变。有关不会影响所关注蛋白质的生物活性的适当氨基酸置换的指导可在以下文献所述的模型中找互:Dayhoff,etal.,(1978)AtlasofProteinSequenceandStructure(Natl.Biomed.Res.Found.,Washington,D.C.)(Dayhoff等人,1978年,《蛋白序列和结构图表集》(美国国家生物医学研究基金会,华盛顿特区)),将该文献以引用方式并入本文。在进行此类改变时,可考虑氨基酸的亲水性指数。亲水性氨基酸指数在为蛋白赋予相互作用的生物功能方面的重要性是本领域中普遍理解的(KyteandDoolittle,(1982)JMolBiol.157(1):105-32,1982(Kyte和Doolittle,1982年,《分子生物学》,第157卷,第1期,第105-132页))。公认的是,氨基酸的相对亲水性特征促成了所得蛋白的二级结构,这继而限定了蛋白与其他分子例如酶、底物、受体、DNA、抗体、抗原等等的相互作用。本领域已知的是,某些氨基酸可被具有类似亲水性指数或评分的其他氨基酸置换,并且仍然产生具有类似生物活性的蛋白,即仍然获得生物功能方面等效的蛋白。基于其疏水性和带电特性为每个氨基酸指定了亲水性指数(Kyte和Doolittle,同前)。亲水性指数分别为:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);甲硫氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9);和精氨酸(-4.5)。在进行此类改变时,亲水性指数在+2内的氨基酸的置换是优选的,亲水性指数在+1内的那些是尤其优选的,并且亲水性指数在+0.5内的那些甚至更是尤其优选的。本领域中还应当理解,可基于亲水性有效地进行类似氨基酸的置换。美国专利No.4,554,101陈述了如由其相邻氨基酸的亲水性决定的蛋白的最大局部平均亲水性与蛋白的生物性质相关联。如美国专利No.4,554,101中详述,已为氨基酸残基指定下列亲水性值:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0.+0.1);谷氨酸(+3.0.+0.1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2);甘氨酸(0);苏氨酸(-0.4);脯氨酸(-0.5.+0.1);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);甲硫氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。或者,可对许多蛋白在氨基端或羧基端的蛋白序列进行改变,而基本上不影响其活性。这可包括通过现代分子方法引入的插入、缺失或改变,所述现代分子方法诸如PCR,包括通过使PCR扩增中采用的寡核苷酸中包含氨基酸编码序列而改变或延长蛋白编码序列的PCR扩增。或者,所添加的蛋白序列可包括全部蛋白编码序列,诸如本领域通常用于产生蛋白融合体的那些。此类融合蛋白通常用于(1)增加所关注蛋白的表达,(2)引入结合结构域、酶活性或表位以有利于蛋白纯化、蛋白检测或本领域已知的其他实验用途,(3)使蛋白的分泌或翻译靶向亚细胞细胞器,诸如革兰氏阴性细菌的细胞周质间隙、植物的线粒体或叶绿体或者真核细胞的内质网,后者通常导致蛋白的糖基化。本发明的变体核苷酸和氨基酸序列还涵盖源自诱变和引起重组的程序诸如DNA改组的序列。采用此类程序时,一个或多个不同多肽编码区可用于形成具有所需性质的新多肽。以此方式,从一组相关的多核苷酸序列产生重组多核苷酸的文库,所述相关的多核苷酸序列包含具有实质的序列同一性且可以在体外或体内同源重组的序列区域。例如,使用该方法,可将编码所关注结构域的序列基序在杀虫基因和其他已知的杀虫基因之间进行改组,以获得编码具有改进的所关注性质(诸如提高的杀昆虫活性)的蛋白质的新基因。这种DNA改组的策略是本领域已知的。参见,例如,Stemmer(1994)Proc.Natl.Acad.Sci.USA91:10747-10751(Stemmer,1994年,《美国国家科学院院刊》,第91卷,第10747-10751页);Stemmer,(1994)Nature370:389-391(Stemmer,1994年,《自然》,第370卷,第389-391页);Crameri,etal.,(1997)NatureBiotech.15:436-438(Crameri等人,1997年,《自然生物技术》,第15卷,第436-438页);Moore,etal.,(1997)J.Mol.Biol.272:336-347(Moore等人,1997年,《分子生物学杂志》,第272卷,第336-347页);Zhang,etal.,(1997)Proc.Natl.Acad.Sci.USA94:4504-4509(Zhang等人,1997年,《美国国家科学院院刊》,第94卷,第4504-4509页);Crameri,etal.,(1998)Nature391:288-291(Crameri等人,1998年,《自然》,第391卷,第288-291页);以及美国专利No.5,605,793和5,837,458。结构域交换或改组是用于产生改变的多肽的另一种机制。结构域可在杀虫多肽之间进行交换,从而产生具有改善的杀虫活性或目标谱的杂合或嵌合毒素。用于产生重组蛋白并测试其杀虫活性的方法是本领域熟知的(参见,例如Naimov,etal.,(2001)Appl.Environ.Microbiol.67:5328-5330(Naimov等人,2001年,《应用与环境微生物学》,第67卷,第5328-5330页);deMaagd,etal.,(1996)Appl.Environ.Microbiol.62:1537-1543(deMaagd等人,1996年,《应用与环境微生物学》,第62卷,第1537-1543页);Ge,etal.,(1991)J.Biol.Chem.266:17954-17958(Ge等人,1991年,《生物化学杂志》,第266卷,第17954-17958页);Schnepf,etal.,(1990)J.Biol.Chem.265:20923-20930(Schnepf等人,1990年,《生物化学杂志》,第265卷,第20923-20930页);Rang,etal.,91999)Appl.Environ.Microbiol.65:2918-2925(Rang等人,1999年,《应用与环境微生物学》,第65卷,第2918-2925页))。本文所用的术语“降低的溶血活性”指本发明实施例的杀昆虫多肽相对于其相应的野生型蛋白质具有降低的红细胞裂解活性。在一些实施例中,与SEQIDNO:2的多肽的溶血活性相比,本发明实施例的杀昆虫多肽具有降低的溶血活性。在一些实施例中,该溶血活性与SEQIDNO:2的多肽的溶血活性相比,降低了至少1/3、1/2、2/3、3/4、4/5、5/6、6/7、7/8、8/9、9/10、10/11、11/12、12/13、13/14、14/15、15/16、16/17、17/18、18/19、19/20或更多。使用BLAST和PSI-BLAST在美国国家生物技术信息中心(NCBI)的非冗余数据库(nr)中通过相似性搜索识别出了与MP467(SEQIDNO:2)同源的氨基酸序列。还使用隐马尔科夫模型方法(HMMER3)通过两个PFAM家族,气溶素和ETX_MT2(梭菌(Clostridium)ε-毒素和芽孢杆菌杀蚊毒素)扩大成员搜索。NCBI非冗余数据库中共有485个序列与MP467具有较低但可检测到的相似性(<70%)。如果两个序列超过95%的长度中具有95%的同一性,那么将这两个序列集为一个,通过这一冗余缩减后,识别出333个单一序列。同源蛋白存在于各生物界,尽管绝大多数都是细菌毒素,例如来自气单胞菌(Aeromonas)的气溶素、来自腐败梭菌(Clostridiumsepticum)的α-毒素、来自产气荚膜梭菌(Clostridiumperfringens)的ε-毒素、来自苏云金芽孢杆菌的抗癌晶体蛋白-2(PS2)。当在MP467的整个长度上比对时,来自绿色水螅的水螅溶素显示与MP467具有67%的序列相似性(参见图1和SEQIDNO:4)。这一蛋白质表现出具有相似频谱的弱杀昆虫活性。当在MP467的整个长度上比对时,来自苏云金芽孢杆菌的蛋白质即抗癌晶体蛋白-2Aa(ItoA.etal,J.Biol.Chem,279:21282-212862004-Accession#BAC79010.1(ItoA.等人,生物化学杂志,第279卷,第21282-21286页,2004年-登录号BAC79010.1))显示与MP467(SEQIDNO:2)具有约57%的序列相似性。早期出版物将一部分这些蛋白质命名为抗癌晶体蛋白,以将其与杀昆虫Cry蛋白区分开。这些抗癌晶体蛋白仍被认为是不可杀昆虫的。后来,抗癌晶体蛋白采用了Cry蛋白的命名,因此同一蛋白质具有多个名字。如本文所用,“抗癌晶体蛋白-2Aa”、“PS2”和“Cry46Aa”可互换使用,并且指SEQIDNO:10及其功能变体和片段。与表明Cry46Aa(SEQIDNO:10)缺乏杀昆虫活性的文献报道相反,本文出人意料地证明Cry46Aa(SEQIDNO:10)针对广泛范围的昆虫具有杀昆虫活性(参见实例2)。最近在苏云金芽孢杆菌A1470菌株(OkumuraS.etal,BiotechnolLett35:1889-1984,2013-Accession#BAG68906.1(OkumuraS.等人,《生物技术通讯》,第35卷,第1889-1984页,2013年-登录号BAG68906.1))中识别出了另外的Cry46A同源物,并且在苏云金芽孢杆菌TK-E6菌株(HayakawaT.etal,CurrentMicrobiology55:278-283,2007-Accession#BAD35170.1(HayakawaT.等人,《当代微生物学》,第55卷,第278-283页,2007年-登录号BAD35170.1))中识别出了Cry46Ab(SEQIDNO:12),显示与MP467(SEQIDNO:2)具有约53%的序列相似性(图2和表7)。来自苏云金芽孢杆菌的显示与MP467(SEQIDNO:2)具有相似结构同源性的两个相似蛋白MP543(SEQIDNO:6)和MP544(SEQIDNO:8),在测试浓度显示无杀昆虫活性。MP543(SEQIDNO:6)、MP544(SEQIDNO:8)和MP467(SEQIDNO:2)的氨基酸序列比对(图4)表明与MP467(SEQIDNO:2)的氨基酸置换相比,MP543(SEQIDNO:6)和MP544(SEQIDNO:8)在1’型β转角中具有氨基酸置换。另外,来自刺细胞动物(Cnidaria)的水螅溶素、来自寄生蘑菇硫色绚孔菌(Laetiporussulphureus)的溶血性凝集素和巴西树种子产生的enterolobin也在这一列表中。本发明的一个方面涉及包含编码本发明的多肽或其生物活性部分的核酸序列的分离的或重组的核酸分子,以及足以用作识别编码具有序列同源性区域的蛋白的核酸分子的杂交探针的核酸分子。如本文所用,术语“核酸”意在包括DNA分子(例如,重组DNA、cDNA、基因组DNA、质体DNA、线粒体DNA)和RNA分子(例如,mRNA)以及使用核苷酸类似物产生的DNA或RNA的类似物。核酸分子可以是单链的或双链的,但优选的是双链DNA。本文所用的术语“编码”或“所编码的”在指定的核酸的语境中使用时,意指该核酸包含指导核苷酸序列翻译成指定蛋白质所必需的信息。据以编码蛋白质的信息是通过使用密码子来确定的。编码蛋白的核酸可以包含在该核酸的翻译区内的非翻译序列(例如内含子)或可以缺少这种居间的非翻译序列(例如,如在cDNA中)。本文所用的指涉指定的多核苷酸或其所编码的蛋白质的“全长序列”,意指具有天然的(非合成的)内源序列的整个核酸序列或者整个氨基酸序列。全长多核苷酸编码指定蛋白质的全长催化活性形式。“分离的”或“重组的”核酸分子(或DNA)在本文用来指不再处于其天然环境中,例如处于体外的或重组细菌或植物宿主细胞中的核酸序列(或DNA)。在一些实施例中,“分离的”或“重组的”核酸不含在该核酸的来源生物体的基因组DNA中天然处于该核酸旁侧的序列(即位于该核酸的5′和3′端的序列)(优选蛋白质编码序列)。出于本发明的目的,“分离的”或“重组的”在用来指核酸分子时排除分离的染色体。例如,在各种实施例中,编码本发明的多肽的重组核酸分子可含有少于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的在该核酸的来源细胞的基因组DNA中天然处于该核酸分子的旁侧的核酸序列。设想了编码本发明的多肽或相关蛋白的多种多核苷酸。此类多核苷酸在有效连接至合适的启动子、转录终止和/或多聚腺苷酸化序列时可用于在宿主细胞中产生多肽。此类多核苷酸也可用作分离编码本发明的多肽或相关蛋白的同源或基本上同源的多核苷酸的探针。本文所用的术语“突变核苷酸序列”或“突变”或“经诱变的核苷酸序列”表示这样的核苷酸序列,其已被诱变或变更以含有一个或多个在相应的野生型序列中不存在的核苷酸残基(例如碱基对)。这种诱变或变更由核酸残基的一个或多个添加、缺失或置换或取代所组成。当突变是通过添加、移除或取代蛋白水解位点的氨基酸作出时,这个添加、移除或取代可在蛋白水解位点基序内或靠近蛋白水解位点基序,只要达到突变的目的(即,只要该位点的蛋白水解被改变)。突变核苷酸序列可编码表现出改善的或降低的杀昆虫活性的突变杀昆虫毒素,或者编码这样的氨基酸序列,该氨基酸序列能赋予含有它的多肽改善的或降低的杀昆虫活性。本文所用的术语“突变体”或“突变”在蛋白质、多肽或氨基酸序列的语境中是指这样的序列,其已被诱变或变更以含有一个或多个在相应的野生型序列中不存在的氨基酸残基。这种诱变或变更由氨基酸残基的一个或多个添加、缺失或置换或取代所组成。突变多肽表现出改善的或降低的杀昆虫活性,或者代表这样的氨基酸序列,该氨基酸序列能赋予含有它的多肽改善的杀昆虫活性。因此,术语“突变体”或“突变”指突变核苷酸序列和所编码的氨基酸中的任一者或二者。突变体可单独使用,或者可与本发明实施例的其他突变体或者与其他突变体以任何相容的组合进行使用。“突变多肽”可相反地表现出杀昆虫活性的降低。在不止一个突变被添加到特定核酸或蛋白质的情形中,所述突变可同时添加或依序添加;如果是依序添加,突变可以按任何合适的顺序添加。因而,由包含突变的核苷酸序列所编码的多肽相对于天然或背景序列,将包含至少一个氨基酸变化或添加,或者2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、32、35、38、40、45、47、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270或280个或更多个氨基酸变化或添加。也可通过截短天然的或全长的序列来改善多肽的杀虫活性,如本领域已知的。这样,本发明的实施例提供氨基酸和包含多个突变的核酸序列,诸如例如保持或超出野生型蛋白质杀虫活性的疏水补丁的诱变。本发明实施例的组合物包括编码杀虫多肽的核酸及其片段和变体。具体而言,本发明实施例提供分离的核酸分子,该核酸分子包含编码在SEQIDNO:2和SEQIDNO:24中示出的氨基酸序列的核苷酸序列,或编码所述氨基酸序列的核苷酸序列,例如在SEQIDNO:1、SEQIDNO:23和SEQIDNO:28中示出的核苷酸序列及其杀昆虫片段和变体,以及表6中示出的杀昆虫变体。核苷酸和氨基酸序列以及它们所编码的多肽的片段和变体也被本发明实施例涵盖。本文所用的术语“片段”指本发明实施例的多核苷酸的核苷酸序列的一部分或多肽的氨基酸序列的一部分。核苷酸序列的片段可编码保持天然的或相应的全长蛋白质的生物活性从而具有杀虫活性的蛋白质片段。因此,可公认本发明实施例的多核苷酸和氨基酸序列中的一些可正确地称为片段和突变体二者。应当理解,术语“片段”在用于指本发明实施例的核酸序列时,也涵盖可用作杂交探针的序列。这类核苷酸序列通常不编码保持生物活性的片段蛋白质。因此,核苷酸序列的片段长度可为至少约20个核苷酸、约50个核苷酸、约100个核苷酸并且最多至编码本发明实施例的蛋白质的全长核苷酸序列。编码本发明实施例的杀虫蛋白的生物活性部分的本发明实施例的核苷酸序列的片段,将编码至少15、25、30、50、100、200或者300个连续氨基酸或者直至本发明实施例的杀虫多肽中存在的氨基酸的总数(例如对于SEQIDNO:2为258个氨基酸)。因此,应理解,本发明实施例还涵盖这样的多肽,其是本发明实施例的示例性杀虫蛋白的片段,且长度为至少15、25、30、50、100、200或者300个连续氨基酸或者直至本发明实施例的杀虫多肽中存在的氨基酸的总数。本发明实施例的核苷酸序列的可用作杂交探针或PCR引物的片段,通常不需要编码杀虫蛋白的生物活性部分。因此,本发明实施例的核酸的片段可编码杀虫蛋白的生物活性部分,或者它可以是可采用本文公开的方法用作杂交探针或PCR引物的片段。杀虫蛋白的生物活性部分可如下制备:分离本发明实施例的核苷酸序列其中之一的一部分,表达杀虫蛋白的编码部分(例如通过体外重组表达),并评估杀虫蛋白的该编码部分的活性。属于本发明实施例的核苷酸序列的片段的核酸,包含至少16、20、50、75、100、150、200、250、300、350、400、450、500、600、700或者800个核苷酸或者直至本文公开的核苷酸序列中存在的核苷酸的数目(例如对于SEQIDNO:1为774个核苷酸)。具体的实施例预想到从本发明实施例的第一核酸衍生(例如产生)的片段,其中该片段编码以杀虫活性为特征的截短毒素。由本发明实施例的多核苷酸片段编码的截短多肽以这样的杀虫活性为特征:该杀虫活性相对于衍生该片段的第一核酸所编码的相应全长多肽的活性相当或得到改善。可预想本发明实施例的这种核酸片段可在天然的或相应的全长编码序列的3′末端截短。核酸片段也可同时在天然或相应的全长编码序列的5′和3′末端截短。术语“变体”在本文中用来指实质上相似的序列。对于核苷酸序列而言,保守变体包括那些由于遗传密码的简并性而编码本发明实施例的杀虫多肽其中之一的氨基酸序列的序列。诸如这些的天然等位基因变体可用公知的分子生物学技术(例如本文述及的聚合酶链反应(PCR)和杂交技术)进行识别。变体核苷酸序列也包括通过合成衍生的核苷酸序列,如那些例如通过使用定点诱变产生但仍编码本发明实施例的杀虫蛋白(如突变毒素)的核苷酸序列。通常,本发明实施例的特定核苷酸序列的变体将与该特定核苷酸序列具有至少约70%、75%、80%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性,这通过本文别处描述的序列比对程序使用默认参数测定。本发明实施例的核苷酸序列的变体可与该序列相差少至1-15个核苷酸、少至1-10个如6-10个、少至5个、少至4个、3个、2个或甚至1个核苷酸。本发明实施例的特定核苷酸序列(即示例性的核苷酸序列)的变体,也可通过比较由变体核苷酸序列编码的多肽与参考核苷酸序列编码的多肽之间的序列同一性百分比来进行评价。因此,例如,公开了编码与SEQIDNO.2或SEQIDNO:24的多肽具有给定序列同一性百分数的多肽的分离核酸。任何两条多肽之间的序列同一性百分比可用本文别处描述的序列比对程序使用默认参数进行计算。在本发明实施例的任何给定的一对多核苷酸是通过比较它们编码的两条多肽所共有的序列同一性百分比来进行评价的情况中,这两条编码的多肽之间的序列同一性百分比为至少约40%、45%、50%、55%、60%、65%、70%,通常至少约75%、80%、85%,至少约90%、91%、92%、93%、94%、95%、96%、97%,或者至少约98%、99%或更高的序列同一性。本发明实施例的核苷酸序列也可用于从其他生物体,特别是其他细菌,更特别是其他芽孢杆菌属菌株分离相应的序列。以此方式,诸如PCR、杂交等之类的方法可以用来基于这类序列与本文所述序列的序列同源性从而识别这类序列。本发明实施例涵盖了基于序列与本文所述的完整序列或其片段的序列同一性而选择的序列。这类序列包括为所公开的序列的直系同源物的序列。术语“直系同源物”指衍生自共同祖先基因并且由于物种形成而存在于不同物种中的基因。当其核苷酸序列和/或其所编码的蛋白质序列如本文其他地方所定义的那样具有实质性的同一性时,存在于不同物种中的基因被认为是直系同源物。直系同源物的功能在各种物种中常常是高度保守的。在PCR方法中,可设计寡核苷酸引物用于PCR反应,以从提取自任何所关注生物体的cDNA或基因组DNA扩增相应的DNA序列。设计PCR引物和PCR克隆的方法是本领域公知的,并且公开于以下文献中:Sambrooketal.(1989)MolecularCloning:ALaboratoryManual(2ded.,ColdSpringHarborLaboratoryPress,Plainview,NewYork)(Sambrook等人,1989年,《分子克隆:实验室手册》,第2版,冷泉港实验室出版社,纽约普莱恩维尤),下文称“Sambrook”。另参见Innisetal.,eds.(1990)PCRProtocols:AGuidetoMethodsandApplications(AcademicPress,NewYork)(Innis等人编辑,1990年,《PCR方案:方法和应用指南》,学术出版社,纽约);InnisandGelfand,eds.(1995)PCRStrategies(AcademicPress,NewYork)(Innis和Gelfand编辑,1995年,《PCR策略》,学术出版社,纽约);以及InnisandGelfand,eds.(1999)PCRMethodsManual(AcademicPress,NewYork)(Innis和Gelfand编辑,1999年,《PCR方法手册》,学术出版社,纽约)。已知的PCR方法包括但不限于利用成对引物、巢式引物、单一特异引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。在杂交技术中,将已知的核苷酸序列的全部或一部分用作探针,该探针与来自所选生物体的一组克隆的基因组DNA片段或cDNA片段(即基因组或cDNA文库)中存在的其他对应核苷酸序列选择性杂交。该杂交探针可以是基因组DNA片段、cDNA片段、RNA片段或其他寡核苷酸,并且可用可检测基团如32P或任何其他可检测标记物标记。因此,例如,杂交用探针可通过对基于本发明实施例的序列的合成寡核苷酸进行标记来制备。制备杂交用探针和构建cDNA文库和基因组文库的方法是本领域公知的,在“Sambrook”中有公开。例如,本文所公开的整个序列,或其一个或多个部分可用作能够与相应的序列和信使RNA特异性杂交的探针。为实现在各种条件下的特异性杂交,这种探针包括对本发明实施例的序列而言是独特的并且长度通常为至少约10个或20个核苷酸的序列。这种探针可用于通过PCR从选定的生物体扩增相应的序列。这个技术可用于从所需生物体分离另外的编码序列,或者用作诊断测定法以确定编码序列在生物体中的存在。杂交技术包括对平板(plated)DNA文库(噬菌斑或菌落,参见例如Sambrook)的杂交筛选。这类序列的杂交可以在严格条件下进行。本文所用的术语“严格条件”或“严格杂交条件”指探针与其靶序列杂交的程度将比它与其他序列杂交的程度可检测地更高(例如,比背景高至少2倍、5倍或者10倍)的条件。严格条件是序列依赖性的,在不同的情况中将会不同。通过控制杂交和/或洗涤条件的严格性,可以识别与探针100%互补的靶标序列(同源探测)。或者,可以调节严格性条件以允许序列中的一些错配,从而检测到较低程度的相似性(异源探测)。通常,探针的长度小于约1000或500个核苷酸。通常,严格条件将为其中盐浓度低于约1.5M钠离子,通常为约0.01至1.0M钠离子浓度(或其他盐),pH为7.0至8.3,对短探针(例如,10至50个核苷酸)而言温度为至少约30℃,对长探针(例如超过50个核苷酸)而言温度为至少约60℃的那些条件。严格条件还可以通过添加去稳定剂如甲酰胺来实现。示例性的低严格条件包括用30-35%甲酰胺、1MNaCl、1%SDS(十二烷基硫酸钠)的缓冲溶液在37℃下杂交并在1倍至2倍SSC(20倍SSC=3.0MNaCl/0.3M柠檬酸三钠)中在50-55℃下洗涤。示例性的中等严格条件包括在40-45%甲酰胺、1.0MNaCl、1%SDS中在37℃下杂交并在0.5倍至1倍SSC中在55-60℃下洗涤。示例性的高严格条件包括在50%甲酰胺、1MNaCl、1%SDS中在37℃下杂交并最后在0.1倍SSC中在60-65℃下洗涤至少约20分钟。任选地,洗涤缓冲液可以包含约0.1%至约1%SDS。杂交的持续时间通常小于约24小时,往往为约4至约12小时。特异性通常决定于杂交后的洗涤,关键因素为最终洗涤溶液的离子强度和温度。对于DNA-DNA杂交体,Tm(热熔点)可以根据MeinkothandWahl(1984)Anal.Biochem.138:267-284(Meinkoth和Wahl,1984年,《分析生物化学》,第138卷,第267-284页)的方程来估计:Tm=81.5℃+16.6(logM)+0.41(%GC)-0.61(%form)-500/L;其中M为单价阳离子的摩尔浓度,%GC为DNA中的鸟嘌呤核苷酸和胞嘧啶核苷酸的百分数,%form为杂交溶液中的甲酰胺的百分数,L为杂交体的长度(单位为碱基对)。Tm为50%的互补靶标序列与完美匹配的探针杂交时的温度(在确定的离子强度和pH下)。洗涤通常至少进行至达到平衡和获得低的杂交背景水平为止,例如2小时、1小时或30分钟。每1%错配,Tm降低约1℃;因而,可调整Tm、杂交和/或洗涤条件以与具有所需同一性的序列杂交。例如,如果寻求具有≥90%同一性的序列,则Tm可降低10℃。通常,将严格条件选择为比特定序列及其互补序列在确定的离子强度和pH下的Tm低约5℃。然而,极端严格条件可采用比Tm低1、2、3或4℃下的杂交和/或洗涤;中等严格条件可采用比Tm低6、7、8、9或10℃下的杂交和/或洗涤;低严格条件可采用比Tm低11、12、13、14、15或20℃下的杂交和/或洗涤。利用所述公式,杂交和洗涤组成以及所需的Tm,普通技术人员将认识到,杂交和/或洗涤溶液的严格性的变化固有地得到了描述。如果所需的错配程度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),则可增加SSC浓度以使得可使用较高的温度。有关核酸杂交的详尽指南可见于Tijssen,(1993)LaboratoryTechniquesinBiochemistryandMolecularBiology--HybridizationwithNucleicAcidProbes,PartI,Chapter2(Elsevier,NewYork)(Tijssen,1993年,《生物化学和分子生物学实验技术-与核酸探针的杂交》,第I部分第2章,爱思唯尔出版社,纽约);和Ausubeletal.,eds.(1995)CurrentProtocolsinMolecularBiology,Chapter2(GreenePublishingandWiley-Interscience,NewYork)(Ausubel等人编辑,1995年,《现代分子生物学实验手册》,第2章,格林出版与威立国际科学,纽约)。另参见“Sambrook”。因此,本发明实施例涵盖了编码本发明实施例的蛋白并在严格条件下与本文公开的序列或与其片段杂交的分离的序列。以下术语用来描述两条或更多条核酸或多核苷酸之间的序列关系:(a)“参考序列”、(b)“比较窗口”、(c)“序列同一性”、(d)“序列同一性百分比”和(e)“实质同一性”。(a)本文所用的“参考序列”是用作序列比较的基础的确定的序列。参考序列可以是指定序列的子集或全体;例如,作为全长cDNA或基因序列的区段,或者完全的cDNA或基因序列。(b)本文所用的“比较窗口”是指多核苷酸序列的连续的且指定的区段,其中该比较窗口中的多核苷酸序列相比于参考序列(不包含添加或缺失)可包含添加或缺失(即空位),以便两条序列进行最佳比对。通常,比较窗口长度为至少20个连续的核苷酸,任选可为30、40、50、100个或更长。本领域技术人员认识到,为避免由于在多核苷酸序列中加入空位所致的与参考序列的高度相似性,通常引入空位罚分并从匹配数扣除空位罚分。将序列比对以作比较的方法是本领域公知的。因此,任何两条序列之间的序列同一性百分比的确定可使用数学算法来完成。这类数学算法的非限制性例子有MyersandMiller(1988)CABIOS4:11-17(Myers和Miller,1988年,《计算机在生物科学中的应用》,第4卷,第11-17页)的算法;Smithetal.(1981)Adv.Appl.Math.2:482(Smith等人,1981年,《应用数学进展》,第2卷,第482页)的局部比对算法;NeedlemanandWunsch(1970)J.Mol.Biol.48:443-453(Needleman和Wunsch,1970年,《分子生物学杂志》,第48卷,第443-453页)的全局比对算法;PearsonandLipman(1988)Proc.Natl.Acad.Sci.85:2444-2448(Pearson和Lipman,1988年,《美国国家科学院院刊》,第85卷,第2444-2448页)的搜索局部(search-for-local)比对方法;KarlinandAltschul(1990)Proc.Natl.Acad.Sci.USA872264(Karlin和Altschul,1990年,《美国国家科学院院刊》,872264)的算法,在KarlinandAltschul(1993)Proc.Natl.Acad.Sci.USA90:5873-5877(Karlin和Altschul,1993年,《美国国家科学院院刊》,第90卷,第5873-5877页)中进行了修改。这些数学算法的计算机执行可以用来比较序列以确定序列同一性。这类执行包括但不限于:PC/Gene程序(可获自加利福尼亚州山景城Intelligenetics公司(Intelligenetics,MountainView,Califomia))中的CLUSTAL;GCGWisconsinGeneticsSoftwarePackage版本10(可获自美国加利福尼亚州圣地亚哥斯克兰顿路9685号的Accelrys公司(AccelrysInc.,9685ScrantonRoad,SanDiego,Calif.,USA))中的ALIGN程序(版本2.0)和GAP、BESTFIT、BLAST、FASTA和TFASTA。使用这些程序的比对可以使用默认参数进行。以下文献对CLUSTAL程序进行了详细描述:Higginsetal.(1988)Gene73:237-244(Higgins等人,1988年,《基因》,第73卷,第237-244页);Higginsetal.(1989)CABIOS5:151-153(Higgins等人,1989年,《计算机在生物科学中的应用》,第5卷,第151-153页);Corpetetal.(1988)NucleicAcidsRes.16:10881-90(Corpet等人,1988年,《核酸研究》,第16卷,第10881-10890页);Huangetal.(1992)CABIOS8:155-65(Huang等人,1992年,《计算机在生物科学中的应用》,第8卷,第155-165页);以及Pearsonetal.(1994)Meth.Mol.Biol.24:307-331(Pearson等人,1994年,《分子生物学方法》,第24卷,第307-331页)。ALIGN程序是基于Myers和Miller(1988)(出处同上)的算法。当比较氨基酸序列时,ALIGN程序可使用PAM120加权残基表(weightresiduetable)、空位长度罚分12和空位罚分4。Altschuletal(1990)J.Mol.Biol.215:403(Altschul等人,1990年,《分子生物学杂志》,第215卷,第403页)的BLAST程序基于上文中Karlin和Altschul(1990)(出处同上)的算法。BLAST核苷酸搜索可用BLASTN程序、score(得分)=100、wordlength(字长)=12来进行,以获得与编码本发明实施例的蛋白质的核苷酸序列同源的核苷酸序列。BLAST蛋白质搜索可用BLASTN程序、score(得分)=50、wordlength(字长)=3来进行,以获得与本发明实施例的蛋白质或多肽同源的氨基酸序列。为了出于比较目的获得带空位的比对结果,可以使用如Altschuletal.(1997)NucleicAcidsRes.25:3389(Altschul等人,1997年,《核酸研究》,第25卷,第3389页)所述的GappedBLAST(在BLAST2.0中)。或者,PSI-BLAST(在BLAST2.0中)可以用来执行检测分子之间远源关系的迭代搜索。参见Altschul等人,(1997),出处同上。当采用BLAST、GappedBLAST、PSI-BLAST时,可以使用各个程序的默认参数(例如BLASTN用于核苷酸序列,BLASTX用于蛋白质)。参见美国国家生物技术信息中心(NationalCenterforBiotechnologyInformation)网站(www.ncbi.nlm.nih.gov)。还可以以人工方式通过检查来进行比对。除非另有规定,否则本文提供的序列同一性/相似性值是指使用GAP版本10用以下参数获得的值:使用GAP权重50和长度权重3及nwsgapdna.cmp打分矩阵,获得核苷酸序列的同一性百分数和相似性百分数;使用GAP权重8和长度权重2及BLOSUM62打分矩阵或其任何等同程序,获得氨基酸序列的同一性百分数和相似性百分数。本文所用术语的“等同程序”指任何这样的序列比较程序,其对于任何两个所考虑的序列,相比于GAP版本10所产生的相应比对,能产生出具有相同的核苷酸或氨基酸残基匹配和相同的序列同一性百分比的比对。GAP利用Needleman和Wunsch(1970)(出处同上)的算法来寻找两个完整序列的能使匹配数最大而使空位数最小的比对。GAP考虑所有可能的比对和空位位置,并产生具有最大数目的匹配碱基和最少的空位的比对。它使得可以提供以匹配碱基数为单位的空位产生罚分和空位延伸罚分。GAP对于其插入的每个空位,必须利用匹配的空位产生罚分数。如果选择大于零的空位延伸罚分,GAP对于每个插入的空位必须另外利用空位长度乘以空位延伸罚分。对于蛋白质序列,GCGWisconsinGeneticsSoftwarePackage的版本10中的默认空位产生罚分值和空位延伸罚分值分别为8和2。对于核苷酸序列,默认空位产生罚分为50,而默认空位延伸罚分为3。空位产生罚分和空位延伸罚分可以以选自0至200的整数来表示。因此,例如,空位产生罚分和空位延伸罚分可以为0、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65或更大。GAP给出该家族中的具有最佳比对的一个成员。可能存在这个家族的许多成员,但其他成员没有更好的品质。GAP显示关于比对的四个品质因素:品质(quanlity)、比率(ratio)、同一性(identity)和相似性(similarity)。品质是为了将序列进行比对而最大化的指标(metric)。比率是品质除以较短片段中的碱基数。同一性百分数是实际匹配的符号的百分数。相似性百分数是相似的符号的百分数。将相应于空位的符号忽略。当一对符号的评分矩阵值大于或等于0.50(相似性阈值)时,评定为相似性。GCGWisconsinGeneticsSoftwarePackage的版本10中使用的评分矩阵为BLOSUM62(参见HenikoffandHenikoff(1989)Proc.Natl.Acad.Sci.USA89:10915)(Henikoff和Henikoff,1989年,《美国国家科学院院刊》,第89卷,第10915页))。(c)在两条核酸或多肽序列的情形中,本文所用的“序列同一性”或“同一性”是指在指定的比较窗口范围为获得最大对应而比对时这两条序列中相同的残基。当序列同一性百分数针对蛋白使用时,认识到不相同的残基位置往往差别在于保守氨基酸置换,其中氨基酸残基由具有相似化学性质(例如电荷或疏水性)的其他氨基酸残基置换,因此不会改变分子的功能性质。当序列差别在于保守置换,则可以上调序列同一性百分数以校正置换的保守性质。差别在于这种保守置换的序列被称为具有“序列相似性”或“相似性”。作出这个调整的手段是本领域技术人员公知的。通常,这涉及将保守置换评定为部分错配而不是完全错配,从而增加序列同一性百分数。因此,例如,如果相同的氨基酸给予1分,非保守置换给予0分,则保守置换给予0至1之间的分数。保守置换的评分是例如在程序PC/GENE(加利福尼亚州山景城(MountainView,California)的Intelligenetics公司)中所执行那样进行计算。(d)本文所用的“序列同一性百分数”意指通过在比较窗口范围内比较两个最佳比对的序列所确定的数值,其中与参考序列(不包含添加或缺失)相比,多核苷酸序列在比较窗口中的部分可包含添加或缺失(即空位),以便最佳比对两个序列。通过以下方式计算所述百分数:确定在两个序列中出现相同核酸碱基或氨基酸残基的位置的数目以得到匹配的位置的数目,将匹配的位置的数目除以比较窗口中位置的总数目,然后将结果乘以100以得到序列同一性百分数。(e)(i)多核苷酸序列的“实质上相同”这个术语意指在使用所描述的比对程序之一采用标准的参数与参考序列进行比较时,多核苷酸包含具有至少70%、80%、90%或95%或更高的序列同一性的序列。本领域技术人员将会认识到,可通过考虑密码子简并性、氨基酸相似性、阅读框定位等等适当调整这些值以确定两条核苷酸序列所编码的蛋白质的相应同一性。出于这些目的,氨基酸序列实质上相同通常意指序列同一性为至少60%、70%、80%、90%或95%或更高的序列同一性。核苷酸序列基本上相同的另一种指示是两个分子在严格条件下是否彼此杂交。通常,将严格条件选择为比特定序列在确定的离子强度和pH下的Tm低约5℃。但是,严格条件涵盖在比Tm低约1℃至约20℃的范围内的温度,取决于本文另外限定的所需严格程度。在严格条件下不互相杂交的核酸,如果它们编码的多肽是实质上相同的,则它们仍是实质上相同的。例如,当利用遗传密码所允许的最大密码子简并性产生一个核酸拷贝时,这可能会发生。两条核酸序列基本上相同的一个指示是,第一核酸编码的多肽与第二核酸编码的多肽发生免疫交叉反应。(e)(ii)在肽的情形中,术语“实质上相同”指肽包含这样的序列,在指定比较窗口上该序列与参考序列具有至少70%、80%、85%、90%、95%或更高的序列同一性。出于这些目的的最佳比对可用Needleman和Wunsch(1970)(出处同上)的全局比对算法来进行。两条肽序列实质上相同的指示是,一种肽可与针对第二种肽产生的抗体发生免疫反应。因而,例如,如果某种肽与第二种肽差别仅在于保守置换的话,则这两种肽实质上相同。“实质上相似的”肽共有如上所述的序列,例外的是不相同的残基位置差别可能在于保守氨基酸变化。本文中术语“构建体”的使用无意于将本发明实施例局限于包含DNA的核苷酸构建体。本领域普通技术人员将认识到,核苷酸构建体,特别是由核糖核苷酸以及核糖核苷酸和脱氧核糖核苷酸的组合构成的多核苷酸和寡核苷酸,也可应用于本文公开的方法中。本发明实施例的核苷酸构建体、核酸和核苷酸序列另外涵盖这类构建体、分子和序列的所有互补形式。此外,本发明实施例的核苷酸构建体、核苷酸分子和核苷酸序列涵盖所有可在本发明实施例的方法中应用以转化植物的核苷酸构建体、分子和序列,包括但不限于那些由脱氧核糖核苷酸、核糖核苷酸以及它们的组合所构成的核苷酸构建体、分子和序列。这种脱氧核糖核苷酸和核糖核苷酸既包括天然存在的分子也包括合成的类似物。本发明实施例的核苷酸构建体、核酸和核苷酸序列还涵盖所有形式的核苷酸构建体,包括但不限于单链形式、双链形式、发夹结构、茎-环结构等。本发明实施例的序列在用于在所关注生物体中表达的DNA构建体中提供。该构建体将包括有效连接至本发明实施例的序列的5′和3′调节序列。本文所用的术语“有效连接”指启动子与第二序列之间的功能性连接,其中启动子序列起始并介导与第二序列对应的DNA序列的转录。一般来讲,有效连接意指被连接的核酸序列是连续的,并且如果有必要连接两个蛋白编码区的话,是连续的且在相同的阅读框内。该构建体可另外含有至少一个待共转化到该生物体中的额外基因。或者,所述额外基因可在多个DNA构建体上提供。这种DNA构建体提供有多个限制位点,以使该杀昆虫序列的插入处于调节区的转录调节之下。该DNA构建体可另外含有选择性标记基因。该DNA构建体在5′至3′转录方向上可包含:转录和翻译起始区(即,启动子)、本发明实施例的DNA序列、在充当宿主的生物体中具有功能的转录和翻译终止区(即终止区)。所述转录起始区(即启动子)相对于宿主生物体和/或相对于本发明实施例的序列可以是天然的、类似的、外来的或者异源的。另外,该启动子可以是天然序列或备选地是合成序列。如本文所用的术语“外来的”表示启动子在引入该启动子的天然生物体中不存在。如果启动子相对于本发明实施例的序列是“外来的”或者“异源的”,则意指该启动子不是所有效连接的本发明实施例的序列的天然或自然存在的启动子。本文所用的嵌合基因包含与转录起始区可操作连接的编码序列,该转录起始区对于该编码序列是异源的。如果启动子是天然或自然的序列,则所有效连接的序列的表达相比野生型表达被变更,这导致表型变更。终止区可以是对于转录起始区而言是天然的,可以对于有效连接的所关注DNA序列而言是天然的,可以对于植物宿主而言是天然的,或者可以衍自另一来源(即对于该启动子、所关注的序列、植物宿主或者它们的任何组合而言是外来的或异源的)。便利的终止区可获自根瘤农杆菌(A.tumefaciens)的Ti质粒,如章鱼碱合酶和胭脂碱合酶终止区。另参见Guerineauetal.(1991)Mol.Gen.Genet.262:141-144(Guerineau等人,1991年,《分子遗传学与普通遗传学》,第262卷,第141-144页);Proudfoot(1991)Cell64:671-674(Proudfoot,1991年,《细胞》,第64卷,第671-674页);Sanfaconetal.(1991)GenesDev.5:141-149(Sanfacon等人,1991年,《基因与发育》,第5卷,第141-149页);Mogenetal.(1990)PlantCell2:1261-1272(Mogen等人,1990年,《植物细胞》,第2卷,第1261-1272页);Munroeetal.(1990)Gene91:151-158(Munroe等人,1990年,《基因》,第91卷,第151-158页);Ballasetal.(1989)NucleicAcidsRes.17:7891-7903(Ballas等人,1989年,《核酸研究》,第17卷,第7891-7903页);以及Joshietal.(1987)NucleicAcidRes.15:9627-9639(Joshi等人,1987年,《核酸研究》,第15卷,第9627-9639页)。如适当,可将核酸进行优化以提高其在宿主生物体中的表达。因此,如果该宿主生物体是植物,则可用植物偏好的密码子合成出合成的核酸以改进表达。有关宿主偏好的密码子使用的讨论,参见例如CampbellandGowri(1990)PlantPhysiol.92:1-11(Campbell和Gowri,1990年,《植物生理学》,第92卷,第1-11页)。例如,尽管本发明实施例的核酸序列在单子叶植物物种和双子叶植物物种中都可表达,但可对序列进行修饰以解决单子叶植物或双子叶植物的特定密码子偏好性和GC含量偏好性,因为这些偏好性已被证实是不同的(Murrayetal.(1989)NucleicAcidsRes.17:477-498(Murray等人,1989年,《核酸研究》,第17卷,第477-498页))。因此,特定氨基酸的玉蜀黍偏好密码子可由来自玉蜀黍的已知基因序列得出。关于来自玉蜀黍植物的28个基因的玉蜀黍密码子使用在Murray等人(出处同上)的表4中列出。本领域可获得用于合成植物优选性基因的方法。参见例如美国专利No.5,380,831和No.5,436,391,以及Murrayetal.(1989)NucleicAcidsRes.18:455-498(Murray等人,1989年,《核酸研究》,第18卷,第455-498页),将其以引用方式并入本文。已知有另外的序列修饰能增强细胞宿主中的基因表达。这些包括消除以下序列:编码假多聚腺苷酸化信号、外显子-内含子剪接位点信号的序列、转座子样重复序列以及其他得到充分表征的可能对基因表达有害的序列。可将序列的GC含量调整至给定细胞宿主的平均水平,这通过参考在宿主细胞中表达的已知基因计算得到。如本文所用的术语“宿主细胞”指含有载体并支持该表达载体的复制和/或表达的细胞。宿主细胞可以是原核细胞如大肠杆菌(E.coli)或者真核细胞如酵母、昆虫、两栖动物或者哺乳动物细胞,或者单子叶或者双子叶植物细胞。单子叶植物宿主细胞的一个例子是玉蜀黍宿主细胞。当可能时,修饰序列以避免可预见的发夹二级mRNA结构。表达盒或构建体可以另外含有5′前导序列。此类前导序列可以起到增强翻译的作用。翻译前导序列是本领域已知的,包括:小核糖核酸病毒前导序列,例如EMCV前导序列(脑心肌炎5′非编码区)(Elroy-Steinetal.(1989)Proc.Natl.Acad.Sci.USA86:6126-6130(Elroy-Stein等人,1989年,《美国国家科学院院刊》,第86卷,第6126-6130页));马铃薯Y病毒前导序列,例如TEV前导序列(烟草蚀纹病毒)(Gallieetal.(1995)Gene165(2):233-238(Gallie等人,1995年,《基因》,第165卷,第2期,第233-238页));MDMV前导序列(玉米矮花叶病毒);人免疫球蛋白重链结合蛋白(BiP)(Macejaketal.(1991)Nature35...当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1