用于控制植物有害生物的组合物和方法与流程

文档序号:20706889发布日期:2020-05-12 16:34阅读:192来源:国知局

对电子提交的序列表的引用

该序列表的官方副本是以ascii格式的序列表以2018年8月27日生成的名为“81292-cn-reg-org-p_seqlist_st25.txt”的文件进行电子提交的,并且该序列表的大小为247千字节并且与本说明书同时提交。包含在该ascii格式文件中的序列表是本说明书的一部分,并且通过引用以其全文结合在此。

本发明涉及杀有害生物蛋白和编码它们的核酸分子,连同用于控制植物有害生物的组合物和方法。



背景技术:

苏云金芽孢杆菌(bacillusthuringiensis,bt)是一种革兰氏阳性的孢子形成的土壤细菌,其特征在于它产生晶体包含体的能力,这些晶体包含体对于某些目以及种的植物有害生物(包括昆虫)是特异地有毒的,但是对于植物和其他非靶标生物是无害的。出于这个原因,包含苏云金芽孢杆菌菌株或它们的杀昆虫蛋白的组合物可以用作环境上可接受的杀昆虫剂以控制农业昆虫有害生物或多种人或动物疾病的昆虫载体。

来自苏云金芽孢杆菌的晶体(cry)蛋白主要针对鳞翅目的、双翅目的、以及鞘翅目的有害生物昆虫具有有力的杀昆虫活性。这些蛋白质还已经显示针对以下目的有害生物的活性:膜翅目、同翅目、毛虱目、食毛目、以及壁虱目,连同其他的无脊椎动物目,如线虫动物门、扁形动物门、以及肉足鞭毛亚门(feitelson,j.,1993,thebacillusthuringiensisfamilytree[苏云金芽孢杆菌家族树],在:advancedengineeredpesticides[前沿的工程化的杀有害生物剂],马塞尔德克尔公司(marceldekker,inc.),纽约,纽约州)。这些蛋白质最初主要基于它们的杀昆虫活性而被分类为cryi至cryvi。主要的类别是鳞翅目特异性(i)、鳞翅目和双翅目特异性(ii)、鞘翅目特异性(iii)、双翅目特异性(iv)、以及线虫特异性(v)和(vi)。这些蛋白质进一步被分类为子族;在各个家族内的更高相关的蛋白质指定了区分的字母,如cryia、cryib、cryic等。在各个区分内的甚至更紧密相关的蛋白质被给定名称,例如cryic(a)、cryic(b)等。术语“cry毒素”以及“δ-内毒素”与术语“cry蛋白”已可互换地使用。对于cry蛋白和基因的当前命名法基于氨基酸序列同源性而不是昆虫靶标特异性(crickmore等人,(1998),microbiol.mol.biol.rev.[微生物分子生物学评论],62:807-813)。在这个更可接受的分类中,每种毒素被指定唯一的名称,所述名称合并了初级等级(阿拉伯数字)、二级等级(大写字母)、三级等级(小写字母)、以及四级等级(另一个阿拉伯数字)。在当前分类中,在初级等级中罗马数字已经换为阿拉伯数字。例如,在旧命名法下的“cryia(a)”现在在当前命名法下是“cry1aa”。根据ibrahim等人(2010,bioeng.bugs[生物工程学蝽象],1:31-50),cry毒素仍然可以根据其昆虫宿主特异性被分为六个主要类别并且包括:组1—鳞翅目(例如cry1、cry9和cry15);组2—鳞翅目和双翅目(例如cry2);组3—鞘翅目(cry3、cry7和cry8);组4—双翅目(cry4、cry10、cry11、cry16、cry17、cry19和cry20);组5—鳞翅目和鞘翅目(cry1i);以及组6—线虫(cry6)。cry1i、cry2、cry3、cry10和cry11毒素(73–82kda)是独特的,因为它们似乎是更大cry1和cry4蛋白(130–140kda)的天然截短。

cry蛋白是在bt的孢子形成阶段期间以结晶形式积聚为原毒素的球状蛋白质分子。在由有害生物摄取后,这些晶体典型地被溶解以释放原毒素,原毒素大小的范围可以为,例如,对于许多鳞翅目有活性的cry蛋白如cry1和cry9为从130-140kda,并且对于鞘翅目有活性的cry3蛋白及鳞翅目/双翅目有活性的cry2蛋白为60-80kda。在这些晶体被易感昆虫溶解后,这些释放的原毒素被昆虫肠道中的蛋白酶例如胰蛋白酶和胰凝乳蛋白酶加工,以产生抗蛋白酶的核心cry蛋白毒素。这种蛋白水解加工涉及从各种cry原毒素的不同区域去除氨基酸。例如,为130-140kda的cry原毒素典型地通过蛋白水解去除25-30个氨基酸的n-末端肽以及c-末端的大约一半的剩余蛋白来激活,产生大约60-70kda成熟cry毒素。为60-80kda的原毒素(例如cry2和cry3)也被加工但是其程度不与更大的原毒素相同。与更大的原毒素相比,较小的原毒素典型地从n-末端去除相等或更多个氨基酸,但较少氨基酸被从c-末端去除。例如,cry2家族成员的蛋白水解激活典型地涉及去除大约40-50个n-末端氨基酸。许多cry蛋白对特定的靶标昆虫是相当有毒的,但许多具有窄的活性谱。

cry蛋白通常具有五个保守序列结构域、以及三个保守结构性结构域(参见例如,demaagd等人,(2001)trendsgenetics[遗传学趋势],17:193-199)。第一保守结构性结构域(称作结构域i)典型地由七个α螺旋组成并且参与膜插入以及孔形成。结构域ii典型地由三个布置为希腊钥匙构型的β片层组成,并且结构域iii典型地由两个处于“果冻卷”(‘jelly-roll’)构造的反平行的β片层组成(demaagd等人,2001,同上)。结构域ii和iii参与受体识别和结合,并且因此被认为是毒素特异性的决定物。

众多商业上有价值的植物(包括普通的农作物)易受植物有害生物(包括昆虫和线虫有害生物)的攻击的影响,导致作物产量和品质的实质性降低。例如,植物有害生物是在全世界重要农作物损失中的主要因素。由于昆虫有害生物和疾病,在中国每年收获的谷类损失约15%-20%。此外,由于无脊椎有害生物(包含昆虫)的侵染,仅在美国每年就损失约80亿美元。昆虫有害生物对于菜农和果农,对于观赏性花卉的生产商,以及对于家庭花匠也是负担。

昆虫有害生物主要是通过密集施用化学杀有害生物剂来控制,这些化学杀有害生物剂通过抑制昆虫成长、预防昆虫摄食或繁殖、或者导致死亡而有效。生物性有害生物控制剂,如表达杀有害生物毒素(如cry蛋白)的苏云金芽孢杆菌菌株,也已经施用于作物植物中,产生了令人满意的结果,提供化学杀有害生物剂的替代物或补充物。已经分离了编码这些cry蛋白中的一些的基因并且它们在异源宿主(如转基因植物)中的表达已经显示出提供了另一种用于控制经济上重要的昆虫有害生物的手段。

因此可以达到良好的昆虫控制,但是某些化学品有时也能影响非目标有益昆虫,并且某些生物制剂具有非常窄的活性谱。此外,某些化学和生物控制方法的继续使用增加了昆虫有害生物对此类控制措施产生抗性的机会。通过各种抗性管理实践已部分地缓和了这种状况,但仍需要开发新的并有效的有害生物控制剂,这些有害生物控制剂为农民提供经济利益并且是环境可接受的。特别需要的是可以靶向更广谱的经济上重要的昆虫有害生物并有效控制昆虫品系的控制剂,这些昆虫品系对现有的昆虫控制剂是有抗性的或可以变得有抗性。



技术实现要素:

鉴于这些需求,本发明的目的是通过提供可以用来控制多种植物有害生物的新颖基因和杀有害生物蛋白来提供新的有害生物控制剂。

本发明提供了用于赋予细菌、植物、植物细胞、组织以及种子的杀有害生物活性的组合物以及方法。特别地,提供了包含衍生自组装的多核苷酸、编码cry蛋白的新颖多核苷酸的嵌合基因以及基本上与其相同的序列,这些序列的表达产生具有对经济上重要的昆虫有害生物(特别是侵染植物的昆虫有害生物)的毒性的蛋白质。本发明进一步涉及由这些多核苷酸的表达产生的新颖cry蛋白,并且涉及含有这些cry蛋白的组合物以及配制品,它们通过抑制昆虫有害生物的生存、生长以及繁殖或者限制昆虫相关的对作物植物的损害或损失的能力对昆虫是有毒的。本发明的cry蛋白包括衍生自组装的多核苷酸的cry蛋白以及具有一个或多个氨基酸取代、添加或缺失的突变型或变体cry蛋白。突变型cry蛋白的实例包括但不限于被突变为具有比天然cry蛋白对应物更宽的活性谱或更高的特异活性的那些,经突变以引入表位来产生从天然蛋白质中差异性地识别出经突变的蛋白质的抗体的那些,或经突变以调节在转基因生物中的表达的那些。本发明的新颖cry蛋白对昆虫有害生物是高毒性的。例如,本发明的cry蛋白可以用于控制一种或多种经济学上重要的昆虫有害生物,这些昆虫有害生物例如亚洲玉米蛀虫(asiancornborer)(亚洲玉米螟(ostriniafurnacalis))、黑色地老虎(blackcutworm)(小地老虎(agrotisipsilon))、棉螟蛉(cottonbollworm)(棉铃虫(helicoverpaarmigera))、黄色桃螟虫(yellowpeachborer)(桃蛀螟(conogethespunctiferalis))、东方黏虫(orientalarmyworm)(东方粘虫(mythimnasepatate))、欧洲玉米蛀虫(europeancornborer)(欧洲玉米螟(ostrinianubilalis))、秋黏虫(fallarmyworm)(草地贪夜蛾(spodopterafrugiperda))、玉米穗蛾(cornearworm)(玉米穗虫(helicoverpazea))、甘蔗螟(sugarcaneborer)(小蔗螟(diatraeasaccharalis))、绒毛豆毛虫(velvetbeancaterpillar)(黎豆夜蛾(anticarsiagemmatalis))、大豆夜蛾(soybeanlooper)(大豆尺蠖(chrysodeixisincludes))、西南玉米蛀虫(southwestcornborer)(西南玉米螟(diatraeagrandiosella))、西部豆切根虫(westernbeancutworm)(西部豆夜蛾(richiaalbicosta))、烟夜蛾(tobaccobudworm)(烟芽夜蛾(heliothisvirescens))、条纹蛀茎虫(stripedstemborer)(二化螟(chilosuppressalis))、粉蛀茎虫(pinkstemborer)(非洲大螟(sesamiacalamistis))、水稻卷叶螟(riceleaffolder)(稻纵卷叶螟(cnaphalocrocismedinalis))等。

本发明还提供了合成多核苷酸,其编码本发明的cry蛋白,这些cry蛋白已经进行一个或多个密码子优化用于在转基因生物如转基因细菌或转基因植物中表达。

本发明进一步涉及表达盒和重组载体,其包含编码本发明的cry蛋白的多核苷酸。本发明还提供了包含嵌合基因、或表达盒或重组载体的经转化的细菌、植物、植物细胞、组织、以及种子,该嵌合基因或表达盒或重组载体在经转化的细菌、植物、植物细胞、组织以及种子中表达本发明的cry蛋白方面是有用的。

本发明还涉及分离的苏云金芽孢杆菌(bt)菌株,这些菌株产生本发明的cry蛋白。

本发明还涉及使用这些本发明的多核苷酸的方法,例如在dna构建体或嵌合基因或表达盒或重组载体中用于在生物(包括植物和微生物,如细菌)中进行转化和表达。核苷酸或氨基酸序列可以是已经被设计用于在生物(如植物或细菌)中表达的组装的、天然的或密码子优化的序列,或者制成杂合的、具有增强的杀有害生物活性的cry毒素。本发明进一步涉及制备这些cry蛋白的方法以及使用这些多核苷酸序列和cry蛋白的方法,例如,在微生物中控制昆虫或者在转基因植物中赋予保护免受昆虫损害。

本发明的另一个方面包括杀昆虫组合物和配制品,这些组合物和配制品包含本发明的cry蛋白或苏云金芽孢杆菌菌株;以及使用这些组合物或配制品来控制昆虫群体的方法,例如通过将这些组合物或配制品施用至昆虫侵袭的区域,或者施用至预防性处理易感染昆虫的区域或植物以赋予针对昆虫有害生物的保护。任选地,除本发明的cry蛋白或bt菌株之外,本发明的这些组合物或配制品还可以包含其他杀有害生物剂(如化学杀有害生物剂)以加强或增强组合物或配制品的昆虫控制能力。

本发明的这些组合物和方法可用于控制攻击植物、特别是作物植物的昆虫有害生物。本发明的这些组合物对于产生改变的或改进的具有杀有害生物活性的cry蛋白、或对于检测商用产品或转基因生物中的cry蛋白或核酸的存在也是有用的。

参考以下详细说明书和权利要求书,本发明的这些和其他特征、方面、以及优点将变得更好理解。

序列表中的序列简述

seqidno:1代表对bt264蛋白进行编码的核苷酸序列。

seqidno:2代表对bt288蛋白进行编码的核苷酸序列。

seqidno:3代表对bt302蛋白进行编码的核苷酸序列。

seqidno:4代表对bt454蛋白进行编码的核苷酸序列。

seqidno:5代表对bt485蛋白进行编码的核苷酸序列。

seqidno:6代表对bt264蛋白进行编码的密码子优化序列。

seqidno:7代表对bt288蛋白进行编码的密码子优化序列。

seqidno:8代表对bt302蛋白进行编码的密码子优化序列。

seqidno:9代表对bt454蛋白进行编码的密码子优化序列。

seqidno:10代表对bt485蛋白进行编码的密码子优化序列。

seqidno:11代表对突变型bt264蛋白进行编码的核苷酸序列。

seqidno:12代表对突变型bt288蛋白进行编码的核苷酸序列。

seqidno:13代表对突变型bt302蛋白进行编码的核苷酸序列。

seqidno:14代表对突变型bt454蛋白进行编码的核苷酸序列。

seqidno:15代表对突变型bt485蛋白进行编码的核苷酸序列。

seqidno:16代表bt264蛋白的氨基酸序列。

seqidno:17代表bt288蛋白的氨基酸序列。

seqidno:18代表bt302蛋白的氨基酸序列。

seqidno:19代表bt454蛋白的氨基酸序列。

seqidno:20代表bt485蛋白的氨基酸序列。

seqidno:21代表突变型bt264蛋白的氨基酸序列。

seqidno:22代表突变型bt288蛋白的氨基酸序列。

seqidno:23代表突变型bt302蛋白的氨基酸序列。

seqidno:24代表突变型bt454蛋白的氨基酸序列。

seqidno:25代表突变型bt485蛋白的氨基酸序列。

seqidno:26代表seqidno:17的n-末端。

seqidno:27代表seqidno:17的c-末端。

seqidno:28代表seqidno:18的n-末端。

seqidno:29代表seqidno:18的c-末端。

seqidno:30代表seqidno:20的n-末端。

seqidno:31代表seqidno:20的c-末端。

seqidno:32是cry54aa蛋白的氨基酸序列。

seqidno:33是cry4aa蛋白的氨基酸序列。

seqidno:34是cry39aa蛋白的氨基酸序列。

seqidno:35是cry19ca蛋白的氨基酸序列。

seqidno:36是cry50ba蛋白的氨基酸序列。

seqidno:37是cry4ba蛋白的氨基酸序列。

具体实施方式

本说明不旨在是可以实施本发明的所有不同方式,或可以添加到本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以并入其他实施例中,并且关于一个特定实施例所说明的特征可以从那个实施例删除。因此,本发明考虑了,在本发明的一些实施例中,可以排除或省略在此陈述的任何特征或特征的组合。此外,鉴于本披露内容,在此建议的不同实施例的众多变化以及附加对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些特定实施例,并且并没有穷尽地叙述其所有排列、组合和变化。

除非另外定义,在此所使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。在此本发明的说明中使用的术语是仅出于描述特定实施例的目的,且并不旨在限制本发明。

定义

当在此和所附权利要求书中使用时,单数形式“一个/种(a/an)”和“该(the)”包括复数指代物,除非上下文另外明确地指示。因此,例如,提及“一种植物”是提及一种或多种植物并且包括本领域技术人员已知的其等效物等。

如在此使用的,词语“和/或”是指并且涵盖一个或多个相关联的列出项的任何及全部可能组合,连同当以可替代性(“或”)解释时组合的缺少。

术语“约”在此用于意指大约、大致、约或在……左右。当术语“约”结合数值范围来使用时,它通过将边界延伸至高于以及低于所阐明的数值来限定这个范围。通常,术语“约”在此用于将数值限定至以20%的变化,优选地10%上下(更高或更低)地高于以及低于规定值。关于温度,术语“约”意指±1℃,优选±0.5℃。当术语“约”被用于本发明的上下文中(例如与温度或分子量值组合)时,精确值(即,无“约”)是优选的。

如在此使用的,术语“扩增的”意指使用至少一种核酸分子作为模板,构建核酸分子的多个拷贝或与该核酸分子互补的多个拷贝。扩增系统包括聚合酶链式反应(pcr)系统、连接酶链式反应(lcr)系统、基于核酸序列的扩增(nasba,安大略省密西索加的坎基尼公司(cangene,mississauga,ontario))、q-β复制酶系统、基于转录的扩增系统(tas)、以及链置换扩增(sda)。参见例如,diagnosticmolecularmicrobiology:principlesandapplications[诊断分子微生物学:原理与应用],persing等人编著,华盛顿美国微生物学会(americansocietyformicrobiology,washington,d.c.),(1993)。扩增产物被称为“扩增子”。

根据本发明的“组装的序列”、“组装的多核苷酸”、“组装的核苷酸序列”等是通过比对多核苷酸或测序的多核苷酸的部分(即k-mer,通过dna测序获得的读数的长度k的所有可能的子序列)的重叠序列制备的合成多核苷酸,其使用dna测序技术从基因组dna确定。组装的序列典型地含有碱基识别(base-calling)错误,与获得基因组dna的基因组中包含的天然dna序列相比,碱基识别错误可能是错误确定的碱基、插入和/或缺失。因此,例如,“组装的多核苷酸”可以编码蛋白质,并且根据本发明,该多核苷酸和该蛋白质二者都不是天然产物,而是仅通过人类行为而存在。

如在此使用的术语“嵌合构建体”或“嵌合基因”或“嵌合多核苷酸”或“嵌合核酸”(或类似术语)是指如下构建体或分子,该构建体或分子包含被组装进单个核酸分子中的不同来源的两个或更多个多核苷酸。术语“嵌合构建体”、“嵌合基因”、“嵌合多核苷酸”或“嵌合核酸”是指如下任何构建体或分子,该构建体或分子含有但不限于(1)多核苷酸(例如,dna),包括在自然界中没有被发现在一起的调节多核苷酸和编码多核苷酸(即,构建体中的至少一个多核苷酸相对于它的其他多核苷酸中的至少一个是异源的),或(2)编码不是天然毗邻的蛋白质部分的多核苷酸,或(3)不是天然毗邻的启动子部分。另外,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸可以包含衍生自不同来源的调节多核苷酸和编码多核苷酸,或包含衍生自相同来源、但以与在自然界中所发现的不同的方式进行布置的调节多核苷酸和编码多核苷酸。在本发明的一些实施例中,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸包含表达盒,该表达盒包含在调节多核苷酸的控制下、特别地在植物或细菌中具有功能性的调节多核苷酸的控制下的本发明的多核苷酸。

“编码序列”是转录成rna(如mrna、rrna、trna、snrna、正义rna或反义rna)的核酸序列。优选地,rna进而在生物中被翻译以产生蛋白质。

如在此使用的,“密码子优化的”序列意指如下核苷酸序列,其中这些密码子被选择以反映宿主细胞或生物可以具有的特定的密码子偏好性。这典型地是以这样一种方式来完成,该方式是为了保持由待优化的核苷酸序列所编码的多肽的氨基酸序列。在某些实施例中,重组dna构建体的dna序列包括已经针对该构建体有待在其中进行表达的细胞(例如,动物、植物、或真菌细胞)进行了密码子优化的序列。例如,有待在植物细胞中表达的构建体可以使其全部或部分序列(例如,第一基因抑制元件或基因表达元件)进行密码子优化用于在植物中表达。参见例如,美国专利号6,121,014,通过引用结合在此。

“控制”昆虫意指通过毒性作用抑制昆虫有害生物存活、生长、摄食、或繁殖的能力,或者限制昆虫相关的作物植物损害或损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“控制”昆虫可以是或可以不是意指杀死昆虫,尽管其优选意指杀死昆虫。

术语“包含(comprises或comprising)”当用于本说明书中时指示所说明的特征、整数、步骤、操作、要素、或组分的存在,但并不排除一个或多个其他特征、整数、步骤、操作、要素、组分、或其组的存在或添加。

如在此使用的,过渡短语“基本上由...组成”(以及语法变体)意指,权利要求书的范围有待被解读为涵盖权利要求书中所列举的指定材料或步骤以及不实质上改变所要求的发明的一个或多个基本和新颖特征的那些。因此,当用于本发明的权利要求中时,术语“基本上由...组成”并不旨在被解释为等同于“包含(comprising)”。

在本发明的上下文中,“对应于(correspondingto或correspondsto)”意指当变体或同系物cry蛋白的氨基酸序列与彼此比对时,“对应于”在该变体或同系物蛋白中某些枚举的位置的氨基酸是与参考蛋白中的这些位置比对的那些,但在相对于本发明的特定参考氨基酸序列而言的这些精确的数字位置中是不必要的。例如,如果seqidno:20是参考序列并且与seqidno:27比对的话,seqidno:27的gln151“对应于”seqidno:20的gln144,或者例如,seqidno:27的asn301“对应于”seqidno:20的thr294。

如在此使用的,术语“cry蛋白”意指可以在苏云金芽孢杆菌或相关细菌中以结晶形式存在的杀昆虫蛋白。术语“cry蛋白”可以指原毒素形式或其任何杀昆虫片段或毒素。

“递送”组合物或毒性蛋白意指该组合物或毒性蛋白与昆虫接触,这促进该组合物或毒性蛋白的经口摄取,产生对昆虫的毒性作用和控制。可以按照许多公认的方式,包括但不限于转基因植物表达、一种或多种配制的蛋白质组合物、一种或多种可喷洒的蛋白质组合物、饵基(baitmatrix)、或任何其他的领域公认的蛋白质递送系统来递送该组合物或毒性蛋白。

术语“结构域”是指沿着进化相关蛋白的序列的比对在特定位置处保守的一组氨基酸。虽然其他位置上的氨基酸可在同系物之间有所不同,但是在特定位置处高度保守的氨基酸指示在蛋白质的结构、稳定性或功能中很可能是必需的氨基酸。通过其在蛋白质同系物家族的经比对序列中的高度保守性进行鉴别,其可用作鉴别物(identifier),用来确定所讨论的任何多肽是否属于先前鉴别的多肽组。

“有效的昆虫控制量”意指毒性蛋白的浓度,它通过毒性作用抑制昆虫存活、生长、摄食或繁殖的能力,或者限制昆虫相关的损害或作物植物损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“有效的昆虫控制量”可以是或可以不是意指杀死昆虫,尽管其优选意指杀死昆虫。

如在此使用的“表达盒”意指能够在适当的宿主细胞中指导至少一种目的多核苷酸(例如编码本发明的cry蛋白的多核苷酸)的表达的核酸序列,包括启动子,该启动子可操作地连接至目的多核苷酸,该多核苷酸可操作地连接至终止信号。“表达盒”还典型地包含正确翻译目的多核苷酸所需的另外的多核苷酸。该表达盒还可以包含在目的多核苷酸的直接表达中不是必需的但是由于用于从一个表达载体去除该表达盒的方便限制位点而存在的其他多核苷酸。包含一个或多个目的多核苷酸的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少一种是异源的。该表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。然而,典型地,该表达盒相对于该宿主是异源的,即在该表达盒中的目的多核苷酸不是天然存在于该宿主细胞中的,并且必须已经通过转化过程或育种过程引入到该宿主细胞或该宿主细胞的祖先中。该表达盒中的一个或多个目的多核苷酸的表达通常是在启动子的控制下。在多细胞生物(如植物)的情况下,启动子还可能对于特定组织、或器官、或者发育阶段是特异性的或优先的。当被转化进植物中时,表达盒或其片段也可被称为“插入的多核苷酸”或者“插入多核苷酸”。

“基因”在此定义为包含一个或多个多核苷酸的遗传单位,该遗传单位占据染色体或质粒上特定位置并且含有用于生物中的特定特征或性状的遗传指令。

“肠蛋白酶”是在昆虫的消化道中天然发现的蛋白酶。这种蛋白酶通常参与被摄取的蛋白质的消化。肠蛋白质酶的实例包括胰蛋白酶,其典型地切割赖氨酸(k)或精氨酸(r)残基的c-末端侧上的肽;以及胰凝乳蛋白酶,其典型地切割苯丙氨酸(f)、色氨酸(w)或酪氨酸(y)的c-末端侧上的肽。

当提及基因或多核苷酸或多肽使用时,术语“异源”是指基因或多核苷酸或多肽不是在其天然环境中或包含其非天然环境中存在的一部分(即,已经通过人工改变)。例如,异源基因可以包括自一个物种引入到另一个物种的多核苷酸。异源基因还可以包括对生物来说是天然的多核苷酸,该多核苷酸已经以一些方式(例如,经突变;以多个拷贝添加;连接至一种非天然启动子或增强子多核苷酸等)被改变。异源基因可以进一步包含植物基因多核苷酸,其包含植物基因的cdna形式;这些cdna可以以正义方向(以产生mrna)或反义方向(以产生一种反义rna转录本,其与mrna转录本是互补的)被表达。在本发明的一个方面,异源基因区别于内源性植物基因在于该异源基因多核苷酸被典型地连接至包含调节元件如启动子的多核苷酸上,未发现这些多核苷酸与由该异源基因编码的蛋白质的基因或与该染色体中的植物基因多核苷酸天然相关联,或者与在自然界中未发现的染色体的部分(例如,在基因座中表达的基因,其中该基因未正常表达)相关联。另外,“异源”多核苷酸是指不与将多核苷酸引入其中的宿主细胞天然地相关联的多核苷酸,包括天然存在的多核苷酸的非天然存在的多拷贝。

“同源重组”是在相同的多核苷酸的区域中成对染色体的两个dna分子或染色单体之间的dna片段的交换(“交叉”)。“重组事件”在此被理解为意指减数分裂交叉。

当核酸序列编码了多肽(该多肽与由参考核酸序列所编码的多肽具有相同的氨基酸序列)时,该核酸序列与参考核酸序列“同类编码”。例如,seqidno:6与seqidno:1为同类编码,因为它们都编码由seqidno:16代表的氨基酸序列。

术语“分离的”核酸分子、多核苷酸或蛋白质是不再存在于其天然环境中的核酸分子、多核苷酸或蛋白质。本发明的分离的核酸分子、多核苷酸或蛋白质可以按照纯化的形式存在,或者可以存在于重组宿主中,例如转基因细菌或转基因植物中。因此,如在此所列举的对“分离的”核酸分子的要求涵盖当核酸分子包含在转基因植物基因组内时的核酸分子。

“核酸分子”是可以从任何来源中分离的或可以合成制备的单链或双链dna或rna。在本发明的上下文中,该核酸分子优选地是dna区段。

“可操作地连接”是指在单一核酸片段上多核苷酸的关联,这样使得一者的功能影响另一者的功能。例如,当启动子能够影响编码多核苷酸或功能rna的表达时(即,该编码多核苷酸或功能rna处于该启动子的转录控制之下),则该启动子与该编码多核苷酸或功能rna是可操作地连接的。正义方向或者反义方向的编码多核苷酸能够与调节多核苷酸可操作地连接。

如在此使用的“杀有害生物”、“杀昆虫”等是指本发明的cry蛋白控制有害生物的能力或者可以控制如在此所定义的有害生物的cry蛋白的量。因此,杀有害生物cry蛋白可以杀死或抑制有害生物(例如,昆虫有害生物)存活、生长、摄食、或繁殖的能力。

“植物”是在发育的任何阶段的任何植物,特别是种子植物。

“植物细胞”是植物的结构和生理单位,包含原生质体和细胞壁。植物细胞可以处于分离的单个细胞或培养细胞的形式,或者是作为较高级的组织单位(如例如,植物组织、植物器官、或全株植物)的一部分。

“植物细胞培养物”意指植物单元(如例如,原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、接合子以及处于不同发育阶段的胚)的培养物。

“植物材料”是指叶、茎、根、花或花的部分、果实、花粉、卵细胞、接合子、种子、切条、细胞或组织培养物、或植物的任何其他部分或产物。

“植物器官”是植物的独特而明显的已结构化并且分化的部分,如根、茎、叶、花蕾或胚。

如在此使用的“植物组织”意指组织化成结构和功能单元的一组植物细胞。包括植物中或培养物中的任何植物组织。这个术语包括但不限于:全株植物、植物器官、植物种子、组织培养物以及被组织化成结构或功能单元的任何植物细胞群组。这个术语与如以上列出的或由该定义以其他方式涵盖的任何具体类型的植物组织的联合应用或单独应用并不旨在排除任何其他类型的植物组织。

“多核苷酸”是指由共价键合于链中的许多核苷酸单体构成的聚合物。此类“多核苷酸”包括dna、rna、经修饰的寡核苷酸(例如,包含对于生物rna或dna不典型的碱基的寡核苷酸,如2'-o-甲基化寡核苷酸)等。在一些实施例中,核酸或多核苷酸可以是单链的、双链的、多链的或其组合。除非另外指示,否则本发明的具体核酸或多核苷酸任选地包含或编码除明确指示的任何多核苷酸之外的互补多核苷酸。

“目的多核苷酸”是指任何多核苷酸,当其转移至生物(例如,植物)中时赋予该生物所希望的特征,如昆虫抗性、疾病抗性、除草剂耐受性、抗生素抗性、改进的营养价值、工业过程中改进的性能、商业上有价值的酶或代谢物的生产、或者改变的繁殖能力。

术语“启动子”是指多核苷酸,通常在它的编码多核苷酸的上游(5'),它通过提供对正确转录所需的rna聚合酶以及其他因子的识别来控制该编码多核苷酸的表达。

“原生质体”是分离的植物细胞,没有细胞壁或仅具有部分的细胞壁。

如在此使用的,术语“重组”是指核酸分子(例如,dna或rna)或蛋白质或生物的如下形式,该形式通常不会在自然界中发现并且正因为如此通过人类干预来产生。如在此使用的,“重组核酸分子”是包括多核苷酸组合的核酸分子,这些多核苷酸不会天然地一起存在并且是人类干预的结果,例如,由至少两种彼此异源的多核苷酸的组合组成的核酸分子,或人工合成的(例如,使用组装的核苷酸序列合成的多核苷酸)并且包含偏离通常存在于自然界中的多核苷酸的多核苷酸的核酸分子,或包含人工掺入至宿主细胞的基因组dna中和该宿主细胞基因组相关侧翼dna中的转基因的核酸分子。重组核酸分子的另一个实例是由将转基因插入至植物的基因组dna中产生的dna分子,其可以最终导致该生物中的重组rna/或蛋白质分子的表达。如在此使用的,“重组植物”是通常不会在自然界中存在的植物,是人类干预的结果,并且含有掺入至其基因组中的转基因和/或异源核酸分子。由于此类基因组改变,该重组植物明显不同于相关的野生型植物。

“调节元件”是指参与控制核苷酸序列的表达的序列。调节元件包含可操作地连接至目的核苷酸序列的启动子以及终止信号。它们还典型地涵盖适当翻译该核苷酸序列所需的序列。

在两个核酸或氨基酸序列的上下文中,术语“同一性”或“相同的”或“基本上相同的”是指当针对最大对应性进行比较和比对时具有至少60%、优选至少80%、更优选90%、甚至更优选95%、并且最优选至少99%核苷酸或氨基酸残基同一性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目测检查所测量的。优选地,该基本的同一性存在于整个具有长度为至少约50个残基或碱基的序列的区域中,更优选地在整个至少约100个残基或碱基的区域中,并且最优选地这些序列在至少约150个残基或碱基上是基本上相同的。在尤其优选的实施方式中,在整个编码区域长度中的序列是基本上相同的。此外,基本上相同的核酸或氨基酸序列基本上执行相同的功能。

对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(如有必要,指定子序列坐标),并且指定序列算法程序的参数。然后,该序列比较算法基于所指定的程序参数来计算这个或这些测试序列相对于该参考序列的序列同一性百分比。

用于比较的序列的最佳比对可以按照以下方式进行,例如通过smith和waterman,adv.appl.math.[应用数学进展]2:482(1981)的局部同源性算法、通过needleman和wunsch,j.mol.biol.[分子生物学杂志]48:443(1970)的同源比对算法、通过pearson和lipman,proc.nat'l.acadsci.usa[美国国家科学院院刊]85:2444(1988)的相似性方法的搜索,通过这些算法的计算机化实施(威斯康星州遗传学分析软件包中的gap、bestfit、fasta和tfasta,遗传学计算机组(geneticscomputergroup),科学街575号(575sciencedr.),麦迪逊,威斯康星州),或通过目测检查(总体上参见ausubel等人,下文)。

适合于确定序列同一性百分比以及序列相似性的算法的一个实例是blast算法,其描述于以下文献中:altschul等人,j.mol.biol.[分子生物学杂志]215:403-410(1990)。执行blast分析的软件是通过国家生物技术信息中心(thenationalcenterforbiotechnologyinformation,美国国家医学图书馆(u.s.nationallibraryofmedicine),洛克维尔大道8600号(8600rockvillepike),贝塞斯达,马里兰州20894美国)可供公众使用的。这种算法涉及首先通过鉴定查询序列中具有长度w的短字码而鉴定得分高的序列对(hsp),这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正值阈值的得分t。t被称为邻近字码得分阈(altschul等人,1990)。这些初始的邻近字码命中充当种子用于起始搜索以发现含有它们的较长的hsp。然后,将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列,使用参数m(对于一对匹配残基的奖赏得分;总是>0)和n(对于错配残基的罚分;总是<0)来计算累积的得分。对于氨基酸序列,使用得分矩阵来计算累积得分。当累积的比对得分从它的最大达到值降低了数量x;由于累积一个或多个负得分的残基比对使累积得分趋于0或0以下;或者到达任一序列的末端时,停止这些字码命中在每个方向上的延伸。blast算法的参数w、t、以及x决定了比对的灵敏度与速度。blastn程序(对核苷酸序列来说)使用字长(w)为11、期望值(e)为10、截止值(cutoff)为100、m=5、n=-4、以及两条链的比较作为默认值。对于氨基酸序列,blastp程序使用字长(w)为3、期望值(e)为10、以及blosum62评分矩阵作为默认值(参见henikoff和henikoff,proc.natl.acadsci.usa[美国国家科学院院刊]89:10915(1989))。

除了计算序列同一性百分比之外,blast算法还进行两个序列之间相似性的统计分析(参见例如,karlin和altschul,proc.nat'l.acad.sci.usa[美国国家科学院院刊]90:5873-5787(1993))。由blast算法提供的相似性的一种量度是最小概率总和(p(n)),它提供了在两个核苷酸或氨基酸序列之间会偶然发生匹配的概率的指示。例如,若在测试核酸序列与参考核酸序列的比较中最小概率总和小于约0.1、更优选地小于约0.01、并且最优选地小于约0.001,则该测试核酸序列被认为是与该参考序列相似的。

两个核酸序列基本上相同的另一个指示是这两种分子在严格条件下彼此杂交。短语“特异性杂交”是指分子在严格条件下仅与特定的核苷酸序列结合、双链化或杂交,这是在该序列存在于复合混合物(例如,总细胞的)dna或rna中时进行的。“基本上结合”是指在探针核酸与靶核酸之间的互补杂交,并且涵盖少量错配,这些错配可以通过降低杂交介质的严格来容纳,以实现靶核酸序列的所希望的检测。

在核酸杂交实验(如dna杂交和rna杂交)的上下文中,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。较长的序列在较高的温度下特异性杂交。对核酸杂交的广泛指导见于以下文献中:tijssen(1993)laboratorytechniquesinbiochemistryandmolecularbiology-hybridizationwithnucleicacidprobes[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第2章第i部分“overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays[杂交原理和核酸探针测定策略综述]”elsevier[爱思唯尔集团],纽约。通常,高严格杂交和洗涤条件在限定的离子强度和ph下被选定为比特定序列的热熔点(tm)低约5℃。典型地,在“严格条件”下,探针将会与它的靶子序列进行杂交,但不会与其他序列杂交。

tm是50%的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和ph下)。非常严格条件被选定为等于特定探针的tm。对于互补核酸(它们在dna或rna印迹中在滤器上具有超过100个互补的残基)的杂交的严格杂交条件的实例是在42℃下、具有1mg肝素的50%甲酰胺、将杂交进行过夜。高严格洗涤条件的实例是0.15mnacl在72℃下持续约15分钟。严格洗涤条件的实例是0.2×ssc洗涤在65℃下持续15分钟(参见,sambrook,下文,对于ssc缓冲剂的说明)。通常,高严格洗涤之前会先进行低严格洗涤,以去除背景探针信号。对于例如超过100个核苷酸的双链体的中等严格洗涤的实例是1×ssc在45℃下持续15分钟。对于例如超过100个核苷酸的双链体的低严格洗涤的实例是4-6×ssc在40℃下持续15分钟。对于短探针(例如,约10-50个核苷酸),严格条件典型地涉及小于约1.0m的na离子的盐浓度,典型地在ph7.0-8.3下约0.01至1.0m的na离子浓度(或其他盐类),并且该温度典型地是至少约30℃。还可以通过添加去稳定剂(如甲酰胺)来达到严格条件。一般而言,相比于不相关的探针,在特定的杂交测定中观察到高出2倍(或更高)的信噪比就表明检测到特异性杂交。如果在严格条件下彼此不杂交的核酸所编码的蛋白质是基本上相同的,则它们仍然是基本上相同的。例如,当使用遗传密码允许的最大程度的密码子简并而生成核酸的拷贝时,则发生这种情况。

以下是可以用来克隆同源核苷酸序列(这些序列与本发明的参考核苷酸序列基本上相同)的杂交/洗涤条件的设置的实例:参考核苷酸序列在以下条件下优选地与该参考核苷酸序列杂交:在7%十二烷基硫酸钠(sds)、0.5mnapo4、1mmedta中在50℃,并且在2×ssc、0.1%sds中在50℃洗涤;更令人希望的是在7%十二烷基硫酸钠(sds)、0.5mnapo4、1mmedta中在50℃,并且在1×ssc、0.1%sds中在50℃洗涤;仍更令人希望的是在7%十二烷基硫酸钠(sds)、0.5mnapo4、1mmedta中在50℃,并且在0.5×ssc、0.1%sds中在50℃洗涤;优选地在7%十二烷基硫酸钠(sds)、0.5mnapo4、1mmedta中在50℃,并且在0.1×ssc、0.1%sds中在50℃洗涤;更优选地在7%十二烷基硫酸钠(sds)、0.5mnapo4、1mmedta中在50℃,并且在0.1×ssc、0.1%sds中在65℃洗涤。

两个核酸序列或蛋白质基本上相同的另一个指示是由第一核酸编码的蛋白质与由第二核酸编码的蛋白质进行免疫性交联反应或与其特异性结合。因此,蛋白质典型地是与第二蛋白质基本上相同的,例如其中这两种蛋白质仅在保守性取代上不同。

如在此使用的,“合成多核苷酸”是指包含天然存在的多核苷酸中不存在的碱基或结构性特征的多核苷酸。例如,编码本发明的cry蛋白的合成多核苷酸(其包含更类似于双子叶植物或单子叶植物基因的g+c含量和正常密码子分布的核苷酸序列)被表述为合成的。本发明的合成多核苷酸还可以例如包含本发明的组装的核苷酸序列。

如在此使用的,对昆虫有害生物是“有毒的”cry蛋白意指该cry蛋白充当口服活性的昆虫控制剂以杀死昆虫有害生物,或者该cry蛋白能够破坏或阻止昆虫摄食、或引起对昆虫有害生物的生长抑制,其两者可以引起或可以不引起昆虫死亡。当本发明的cry蛋白被递送至昆虫或昆虫与cry蛋白进行经口接触时,结果典型地是该昆虫的死亡、或者该昆虫的生长减慢、或者该昆虫停止以使该有毒的cry蛋白可供该昆虫利用的来源为食。

“转化”是用于将异源核酸引入到宿主细胞或生物的方法。特别地,“转化”意指dna分子稳定地整合到目的生物的基因组中。

“转化的/转基因的/重组的”是指异源核酸分子已经引入其中的宿主生物如细菌或植物。核酸分子可以稳定地整合进入宿主基因组,或者,核酸分子也可以作为染色体外分于存在。这种染色体外分子能够自主复制。转化的细胞、组织或植物应当理解为不仅涵盖转化过程的终产物,而且涵盖其转基因子代。“非转化的”、“非转基因的”、或“非重组的”宿主是指不含该异源的核酸分子的野生型生物,例如细菌或植物。

在此的核苷酸通过以下标准缩写进行指示:腺嘌呤(a)、胞嘧啶(c)、胸腺嘧啶(t)、以及鸟嘌呤(g)。氨基酸也由以下标准缩写进行指示:丙氨酸(ala;a)、精氨酸(arg;r)、天冬酰胺(asn;n)、天冬氨酸(asp;d)、半胱氨酸(cys;c)、谷氨酰胺(gln;q)、谷氨酸(glu;e)、甘氨酸(gly;g)、组氨酸(his;h)、异亮氨酸(ile;1)、亮氨酸(leu;l)、赖氨酸(lys;k)、甲硫氨酸(met;m)、苯丙氨酸(phe;f)、脯氨酸(pro;p)、丝氨酸(ser;s)、苏氨酸(thr;t)、色氨酸(trp;w)、酪氨酸(tyr;y)、以及缬氨酸(val;v)。

本发明提供了用于控制有害的植物有害生物的组合物以及方法。特别地,本发明涉及由基因组dna组装的核苷酸序列编码的cry蛋白,其可以分离自细菌如苏云金芽孢杆菌,其对昆虫有害生物是有毒的;涉及包含编码这些cry蛋白的核苷酸序列的组装的多核苷酸和相关多核苷酸;以及涉及制备和使用这些组装的多核苷酸和相关多核苷酸以及cry蛋白来控制昆虫有害生物。

根据一些实施例,本发明提供核酸分子或任选地分离的核酸分子,该核酸分子包含以下、或基本上由以下组成、或由以下组成:编码处于其原毒素形式的cry蛋白或其生物活性或毒素片段的核苷酸序列,其中该核苷酸序列(a)与seqidno:1-5中任一项或其毒素编码片段的组装的序列具有至少80%到至少99%序列同一性;或者(b)编码包含氨基酸序列的蛋白质,该氨基酸序列与seqidno:16-20中任一项或其毒素片段具有至少80%到至少99%序列同一性;或者(c)是(a)或(b)的组装的核苷酸序列;或者(d)是(a)、(b)或(c)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。在其他实施例中,该核苷酸序列包含seqidno:1、seqidno:2、seqidno:3、seqidno:4、seqidno:5、或seqidno:1-5中任一项的任何毒素编码片段。在其他实施例中,该合成核苷酸序列包含seqidno:6、seqidno:7、seqidno:8、seqidno:9、seqidno:10、seqidno:11、seqidno:12、seqidno:13、seqidno:14、seqidno:15、或seqidno:6-15中任一项的任何毒素编码片段。

本发明还涵盖多核苷酸,其是cry蛋白原毒素编码多核苷酸的片段。“片段”旨在编码cry蛋白的核苷酸序列的一个部分。核苷酸序列的片段可以编码cry蛋白的生物活性部分,即所谓的“毒性片段”,或它可以是如下片段,使用以下披露的方法该片段可以用作杂交探针或pcr引物。核酸分子是cry蛋白编码核苷酸序列的片段,根据所期望的用途包括至少约15、20、50、75、100、200、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450个连续核苷酸,或高达存在于在此披露的全长cry蛋白编码核苷酸序列中的核苷酸的数目(例如,针对seqidno:1是3519个核苷酸)。“连续的”核苷酸旨在彼此直接相邻的核苷酸残基。本发明的核苷酸序列的一些片段将编码保留cry蛋白的生物活性、并且因此保留杀昆虫活性的毒性片段。“保留杀昆虫活性”旨在该片段将具有至少约30%、优选地至少约50%、更优选地至少约70%、甚至更优选地至少约80%的cry蛋白的杀昆虫活性。用于测量杀昆虫活性的方法在本领域是已熟知的。参见例如,czapla和lang,(1990),j.econ.entomol.[经济昆虫学杂志]83:2480-2485;andrews等人,(1988),biochem.j.[生物化学杂志]252:199-206;marrone等人,(1985),j.ofeconomicentomology[经济昆虫学杂志]78:290-293;以及美国专利号5,743,477,将其全部通过引用以其全文结合在此。

本发明的cry蛋白的毒素片段将编码至少约15、25、30、50、75、100、125、150、175、200、250、300、350、400、和450个连续的氨基酸,或高达存在于本发明的全长cry蛋白中的总数目的氨基酸(例如,针对seqidno:16是1173个氨基酸)。

在一些实施例中,本发明的核酸分子包含以下、或基本上由以下组成、或由以下组成:编码cry蛋白的核苷酸序列,该cry蛋白包含氨基酸序列,该氨基酸序列与seqidno:16-20中任一项或其毒素片段具有至少80%到至少99%序列同一性。在一些其他实施例中,该氨基酸序列包含以下、或基本由以下组成、或由以下组成:seqidno:16-20中任一项或其毒素片段。因此,在一些实施例中,借助于蛋白酶水解加工(例如通过从昆虫的肠中制备的蛋白酶)而已经被激活的cry蛋白可以被表征并且经激活的毒素片段的n-末端或c-末端氨基酸被鉴定。在本发明的这个方面,技术人员可以确定:例如,seqidno:16的毒素片段可包含seqidno:16的约26-605或约26-617或约26-628的氨基酸,或者seqidno:17的毒素片段可包含seqidno:17的从约45、或从约53至约622或约624、或至约642或至约662的氨基酸,或者seqidno:18的毒素片段可包含seqidno:18的从约氨基酸11、或从约氨基酸13、或从约氨基酸35、或从约氨基酸47至约氨基酸628、或至约氨基酸662的氨基酸,或者seqidno:19的毒素片段可包含seqidno:19的从约氨基酸24、或从氨基酸35、或从氨基酸47、或从氨基酸49至约氨基酸660、或至氨基酸670的氨基酸,或者seqidno:20的毒素片段可包含seqidno:20的从约氨基酸17、或从约氨基酸18、或从约氨基酸32、或从约氨基酸37至约氨基酸610、或至约氨基酸636、或至约氨基酸652、或至约氨基酸657、或至约氨基酸660、或至约氨基酸671的氨基酸,或者通过在该编码序列的适当位置处引入或消除蛋白酶加工位点以允许或消除昆虫、植物或微生物蛋白酶对更大变体蛋白质的蛋白水解切割而产生的cry蛋白变体的毒素片段也在本发明的范围内。此类操作的最终结果被理解为产生具有与完整cry原毒素蛋白相同或更好活性的毒素片段分子。

在本发明的一些实施例中,提供了嵌合基因,该嵌合基因包含异源启动子,该启动子可操作地连接至多核苷酸,该多核苷酸包含以下、或基本上由以下组成、或由以下组成:编码对于鳞翅目有害生物有毒的cry蛋白的核苷酸序列,其中该核苷酸序列(a)与seqidno:1-5中任一项或其毒素编码片段具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列同一性;或者(b)编码包含如下氨基酸序列的蛋白质,该氨基酸序列与seqidno:16-20中任一项或其毒素片段具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列同一性;或者(c)是(a)或(b)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。

在其他实施例中,该异源启动子是植物可表达型启动子。例如但不限于,该植物可表达型启动子选自下组启动子,该组由以下组成:泛素、夜香树属黄病毒、玉米trpa、osmads6、玉蜀黍h3组蛋白、噬菌体t3基因95'utr、玉米蔗糖合成酶1、玉米醇脱氢酶1、玉米捕光复合物、玉米热休克蛋白、玉蜀黍mtl、豌豆小亚基rubp羧化酶、水稻肌动蛋白、水稻亲环蛋白、ti质粒甘露碱合酶、ti质粒胭脂碱合酶、矮牵牛查尔酮异构酶、豆类富甘氨酸蛋白1、马铃薯糖蛋白(potatopatatin)、凝集素、camv35s以及s-e9小亚基rubp羧化酶启动子。

在另外的实施例中,由嵌合基因编码的蛋白质对一种或多种鳞翅目有害生物是有毒的,这些鳞翅目有害生物选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟),粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)。

在另外的实施例中,该多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列,该核苷酸序列与seqidno:1或其毒素编码片段具有至少85%到至少99%序列同一性,或者与seqidno:2或其毒素编码片段具有至少95%到至少99%序列同一性,或者与seqidno:3或其毒素编码片段具有至少90%到至少99%序列同一性,或者与seqidno:4或其毒素编码片段具有至少90%到至少99%序列同一性,或者与seqidno:5或其毒素编码片段具有至少95%到至少99%序列同一性。在其他实施例中,该多核苷酸包含以下、基本由以下组成、或由以下组成:seqidno:1-5中任一项或其毒素编码片段。

在其他实施例中,该多核苷酸包含以下、基本上由以下组成、或由以下组成:编码如下蛋白质的核苷酸序列,该蛋白质包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与seqidno:16-20中任一项或其毒素片段具有至少80%到至少99%序列同一性。

在仍其他实施例中,该氨基酸序列与seqidno:16或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在另外的实施例中,该氨基酸序列与seqidno:17或其毒素片段具有至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在仍另外的实施例中,该氨基酸序列与seqidno:18或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在其他实施例中,该氨基酸序列与seqidno:19或其毒素片段具有至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在仍其他实施例中,该氨基酸序列与seqidno:20或其毒素片段具有至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在一些实施例中,本发明的嵌合基因包含如下多核苷酸,该多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列的合成序列,与seqidno:6-15中任一项或其毒素编码片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或在至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%同一性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在其他实施例中,本发明的嵌合基因包含如下多核苷酸,该多核苷酸包含以下、基本上由以下组成、或由以下组成:编码如下蛋白质的核苷酸序列的合成序列,该蛋白质包含如下氨基酸序列,该氨基酸序列与seqidno:16-25中任一项或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或在至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在另外的实施例中,该转基因生物是转基因细菌或转基因植物。

在一些实施例中,本发明提供了如下合成多核苷酸,该合成多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列,该核苷酸序列编码对于鳞翅目有害生物是有毒的蛋白质,其中该核苷酸序列与seqidno:6-15中任一项或其毒素编码片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在其他实施例中,本发明提供了如下合成多核苷酸,该合成多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列,该核苷酸序列编码对于鳞翅目有害生物是有毒的蛋白质,其中该核苷酸序列编码如下氨基酸序列,该氨基酸序列与seqidno:16-25中任一项或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

可以使用来自苏云金芽孢杆菌(bt)菌株的基因组来组装本发明的cry蛋白。bt菌株可以通过标准技术分离并且测试对本发明的鳞翅目有害生物的毒性或用于分离基因组dna而不测试bt菌株对昆虫的毒性。通常,bt菌株可以通过本领域中已知的方法分离自任何环境样品,包括土壤、植物、昆虫、谷物升降机粉尘、以及其他样品材料等。参见例如,travers等人,(1987),appl.environ.microbiol.[应用与环境微生物学]53:1263-1266;saleh等人,(1969),canj.microbiol.[加拿大微生物学杂志]15:1101-1104;delucca等人,(1981),canj.microbiol.[加拿大微生物学杂志]27:865-870;以及norris等人,(1981),“thegenerabacillusandsporolactobacillus[芽孢杆菌属和芽孢乳杆菌属]”,于starr等人,(编著),theprokaryotes:ahandbookonhabitats,isolation,andidentificationofbacteria[原核生物:关于细菌的栖息地、分离和鉴定手册],第ii卷,施普林格出版社(springer-verlog)柏林海德堡。分离之后,可以测试bt菌株对于昆虫有害生物的毒性并且可以鉴定由本发明涵盖的cry蛋白。因此,在一些实施例中,本发明提供了分离的苏云金芽孢杆菌(bt)菌株,该菌株产生cry蛋白或重组cry蛋白,该cry蛋白包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与seqidno:16-25中任一项具有至少80%到至少99%序列同一性。在仍另外的实施例中,该cry蛋白或重组cry蛋白包含以下、基本上由以下组成、或由以下组成:seqidno:16-25中的任一项。

根据一些实施例,本发明提供cry蛋白和任选地分离的cry蛋白,其对于鳞翅目有害生物是有毒的,其中该cry蛋白包含以下、基本上由以下组成、或由以下组成:(a)氨基酸序列,该氨基酸序列与seqidno:16-25中任一项或其毒素片段具有至少80%序列同一性到至少99%序列同一性;或者(b)氨基酸序列,该氨基酸序列由核苷酸序列或组装的核苷酸序列编码,该核苷酸序列与由seqidno:6-15中任一项代表的核苷酸序列或其毒素编码片段具有至少80%序列同一性到至少99%序列同一性。

在其他实施例中,该cry蛋白或分离的cry蛋白包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与seqidno:16-25中任一项或其毒素片段具有至少80%到至少99%序列同一性。在仍其他实施例中,该氨基酸序列与seqidno:16或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在其他实施例中,该氨基酸序列与seqidno:17或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在另外的实施例中,该氨基酸序列与seqidno:18或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在仍另外的实施例中,该氨基酸序列与seqidno:19或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在其他实施例中,该氨基酸序列与seqidno:20或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在一些实施例中,该氨基酸序列包含以下、基本由以下组成、或由以下组成:seqidno:16-25中任一项或其毒素片段。在其他实施例中,该氨基酸序列是由如下核苷酸序列编码的,该核苷酸序列包含以下、基本上由以下组成、或由以下组成:seqidno:6-15中任一项或其毒素编码片段。

在其他实施例中,本发明的cry蛋白对鳞翅目有害生物是有毒的,该鳞翅目有害昆虫选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟),粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)。在其他实施例中,本发明的cry蛋白对至少亚洲玉米蛀虫(亚洲玉米螟)是有毒的。

在一些实施例中,本发明涵盖重组cry蛋白,其对于鳞翅目有害生物是有毒的,其中该重组cry蛋白包含以下、基本上由以下组成、或由以下组成:(a)氨基酸序列,该氨基酸序列与由seqidno:21-25中任一项代表的氨基酸序列或其毒素片段具有至少80%到至少99%序列同一性;或者(b)氨基酸序列,该氨基酸序列由如下核苷酸序列编码,该核苷酸序列与由seqidno:11-15中任一项代表的核苷酸序列或其毒素编码片段具有至少80%到至少99%序列同一性。

在其他实施例中,该重组cry蛋白包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与seqidno:21-25中任一项或其毒素片段具有至少80%到至少99%序列同一性。在仍其他实施例中,该氨基酸序列与seqidno:21或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在仍其他实施例中,该氨基酸序列与seqidno:22或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在仍其他实施例中,该氨基酸序列与seqidno:23或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在仍其他实施例中,该氨基酸序列与seqidno:24或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在仍其他实施例中,该氨基酸序列与seqidno:25或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。

在仍另外的实施例中,该重组cry蛋白包含以下、基本上由以下组成、或由以下组成:seqidno:21-25中任一项的氨基酸序列或其毒素片段。在其他实施例中,该重组cry蛋白是由如下核苷酸序列编码的,该核苷酸序列包含以下、基本由以下组成、或由以下组成:seqidno:11-15中任一项或其毒素编码片段。

本发明还涵盖响应于通过组装的或突变型bt-0264、bt-0288、bt-0302、bt-0454和bt-0485、或相关cry蛋白(包括天然cry蛋白)的免疫激发而产生的抗体。此类抗体可以使用生产多克隆抗血清的标准免疫学技术生产,并且如果需要的话,无限增殖免疫宿主的抗体产生细胞用于单克隆抗体生产源。用于生产针对任何感兴趣物质的抗体的技术是熟知的,例如,如在以下文献中:harlow和lane(1988,antibodiesalaboratorymanual.[抗体:实验室手册],第726页,冷泉港实验室)以及如在goding(monoclonalantibodies:principles&practice[单克隆抗体:原理与实践]1986,学术出版社公司(academicpress,inc.),奥兰多,佛罗里达州)。本发明涵盖杀昆虫蛋白,其与抗体、特别是单克隆抗体交叉反应,产生了针对本发明的杀昆虫cry蛋白中的一种或多种。

本发明中生产的这些抗体在用于确定生物样品中组装的或突变型bt-0264、bt-0288、bt-0302、bt-0454和bt-0485cry蛋白、或相关cry蛋白(包括天然cry蛋白)的量或存在的免疫测定中也是有用的。此类测定在质量控制生产含有本发明的cry蛋白中的一种或多种或相关毒性蛋白的组合物中也是有用的。此外,这些抗体可以用来评估本发明的cry蛋白中的一种或多种或相关蛋白的重组生产的功效,连同针对编码本发明的cry蛋白中的一种或多种的核苷酸序列或相关蛋白编码序列的存在而筛选表达文库的功效。抗体还作为亲和配体用于纯化或分离本发明的蛋白质中的任何一种或多种以及相关蛋白是有用的。本发明的cry蛋白和含有相关抗原表位的蛋白质可以通过在优选的宿主细胞中过度表达编码全部或部分本发明的cry蛋白或相关蛋白的序列的全长或部分长度来获得。

应当认识到,可以通过不同方法来改变编码本发明的cry蛋白的组装的dna序列,并且这些改变可以产生编码如下蛋白质的dna序列,这些蛋白质具有不同于由本发明的组装的cry蛋白所编码的氨基酸序列。所得的突变型cry蛋白可以按照不同的方式进行改变,包括seqidno:16-20中任一项的一个或多个氨基酸的氨基酸取代、缺失、截短、以及插入,包括多达约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155个、或更多个氨基酸取代、缺失或插入。用于此类操作的方法在本领域中通常是已知的。例如,通过在编码该蛋白质的多核苷酸中的突变可以制备天然cry蛋白的氨基酸序列变体。这还可以通过若干种诱变形式之一或在定向进化中来完成。在一些方面中,在该氨基酸序列中所编码的改变将实质上不影响该蛋白质的功能。此类变体将具有所希望的杀昆虫活性。在本发明的一些实施例中,由seqidno:1-5代表的核苷酸序列被改变,以在编码的蛋白质中引入氨基酸取代。在其他实施例中,所得的突变型蛋白是由合成的突变型多核苷酸编码的,该多核苷酸包含由seqidno:11-15中任一项代表的核苷酸序列。在其他实施例中,这些突变型cry蛋白包含以下、基本上由以下组成、或由以下组成:由seqidno:21-25中任一项代表的氨基酸序列。

应当理解的是可以通过使用此类技术改进杀昆虫蛋白对本发明的这些组合物赋予杀昆虫活性的能力。例如,可以在以下宿主细胞中表达cry蛋白,这些宿主细胞在dna复制过程中展现高比率的碱基错误结合,如xl-1red(斯特塔杰公司(stratagene),拉荷亚(lajolla),加利福尼亚州)。在此类菌株中繁殖之后,可以分离出该dna(例如通过制备质粒dna,或通过由pcr进行扩增并且将得到的pcr片段克隆到载体中),在非诱变菌株中培养这些cry蛋白突变体,并且鉴定具有杀昆虫活性的经突变的基因,例如通过进行对杀昆虫活性进行测试的测定。通常,在摄食测定中混合并使用了该蛋白质。参见例如marrone等人,(1985),j.ofeconomicentomology[经济昆虫学杂志]78:290-293。此类测定可以包括使植物与一种或多种有害生物接触,并且确定该植物存活或引起这些有害生物死亡的能力。导致毒性提高的突变的实例见于schnepf等人,(1998),microbiol.mol.biol.rev.[微生物分子生物学综述]62:775-806中。

可替代地,可以在氨基或羧基的末端上对本发明的氨基酸序列进行改变,而实质上不影响活性。这可以包括通过现代分子方法所引入的插入、缺失、或改变,这些方法是如pcr,包括pcr扩增,这些pcr扩增借助于将编码氨基酸的序列包含到在pcr扩增中所使用的寡核苷酸之中而改变或延长该蛋白质编码序列。可替代地,所添加的蛋白质序列可以包括完整的蛋白质编码序列,如在本领域内通常用于产生蛋白质融合物的那些序列。此类融合蛋白常常用于(1)增加目的蛋白质的表达;(2)引入结合域、酶活性、或表位以促进蛋白质纯化、蛋白质检测、或本领域已知的其他实验用途;(3)将蛋白质的分泌或翻译靶向亚细胞器,如革兰氏阴性菌的壁膜间隙,或真核细胞的内质网,后者常常导致蛋白质的糖基化。

本发明的cry蛋白还可以被突变以引入表位来产生识别该经突变蛋白的抗体。因此,在一些实施例中,本发明提供了经突变的cry蛋白,其中在天然cry蛋白中的氨基酸取代产生了具有抗原区域的突变型cry蛋白,该抗原区域允许该突变型cry蛋白在蛋白质检测分析中区别于该天然cry蛋白。

在一些实施例中,本发明提供了制备如下抗体的方法,该抗体从衍生出经突变的cry蛋白的组装的或相关的天然cry蛋白中差异性地识别出经突变的cry蛋白,该方法包括以下步骤:在组装的或天然cry蛋白的抗原环中取代氨基酸;并且产生特异性识别经突变cry蛋白的经突变抗原环但不识别该组装的或天然cry蛋白的抗体。在一个实施例中,该抗原环在组装的或天然cry蛋白的结构域i外部的非保守区域中被鉴别出。在另一个实施例中,该抗原环不是参与cry蛋白的昆虫肠受体识别或参与cry蛋白的蛋白酶活化的环。

本发明的变体核苷酸和氨基酸序列还涵盖了由诱变和引起重组的程序(如dna改组)所衍生的序列。使用此类程序,可以将一个或多个不同的毒性蛋白编码区用来创造出具有所希望特性的新的毒性蛋白。以这种方式,从相关序列多核苷酸的群体产生重组多核苷酸文库,这些相关序列多核苷酸包含如下序列区域,这些序列区域具有实质性的序列同一性并且可以在体外或体内进行同源重组。例如,使用这种方法,可以将编码目的结构域的序列基序在本发明的杀有害生物基因与其他已知的杀有害生物基因之间进行改组,以获得编码如下蛋白质的新基因,该蛋白质具有改进的目的特性,如增加的杀昆虫活性。用于此种dna改组的策略在本领域中是已知的。参见例如,stemmer,(1994),proc.natl.acad.sci.usa[美国国家科学院院刊]91:10747-10751;stemmer,(1994),nature[自然]370:389-391;crameri等人,(1997),naturebiotech.[自然生物技术]15:436-438;moore等人,(1997),j.mol.biol.[分子生物学杂志]272:336-347;zhang等人,(1997),proc.natl.acad.sci.usa[美国国家科学院院刊]94:4504-4509;crameri等人,(1998),nature[自然]391:288-291;以及美国专利号5,605,793和5,837,458。

结构域交换或改组是用于产生本发明的经改变的cry蛋白的另一种机制。可以在cry蛋白之间交换结构域,从而产生具有改进的杀有害生物活性或靶标谱的杂合或嵌合毒性蛋白。用于产生重组蛋白和测试它们的杀有害生物活性的方法在本领域是熟知的(参见例如,naimov等人,(2001)appl.environ.microbiol.[应用与环境微生物学]67:5328-5330];demaagd等人,(1996)appl.environ.microbiol.[应用与环境微生物学]62:1537-1543];ge等人,(1991)j.biol.chem.[生物化学杂志]266:17954-17958;schnepf等人,(1990)j.biol.chem.[生物化学杂志]265:20923-20930;rang等人,(1999)appl.environ.microbiol.[应用与环境微生物学]65:2918-2925])。

因此在一些实施例中,本发明涵盖杂合杀昆虫蛋白,所述杂合杀昆虫蛋白在n-末端至c-末端方向上包含:a)与cry4a蛋白的c-末端区域融合的cry54a蛋白的n-末端区域,其中所述cry54a蛋白和所述cry4a蛋白之间的交换位置位于cry54a的结构域iii和cry4a的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与seqidno:17具有至少90%同一性;或者b)与cry19c蛋白的c-末端区域融合的cry39a蛋白的n-末端区域,其中所述cry39a蛋白和所述cry19蛋白之间的交换位置位于cry39a的结构域iii和cry19c的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与seqidno:18具有至少90%同一性;或者c)与cry4b蛋白的c-末端区域融合的cry50b蛋白的n-末端区域,其中所述cry50b蛋白和所述cry4b蛋白之间的交换位置位于cry50b的结构域iii和cry4b的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与seqidno:20具有至少90%同一性。在其他实施例中,所述杂合杀昆虫蛋白针对鳞翅目昆虫有害生物具有活性。在这个实施例的一个方面,所述鳞翅目昆虫有害生物是亚洲玉米蛀虫(acb;亚洲玉米螟)。

在一些实施例中,本发明提供了如下重组载体,该重组载体包含本发明的多核苷酸、组装的多核苷酸、核酸分子、表达盒或嵌合基因。在其他实施例中,该载体被进一步限定为质粒、粘粒、噬菌粒、人工染色体、噬菌体或病毒载体。用于在植物和其他生物的转化中使用的某些载体在本领域是已知的。

因此,本发明的一些实施例针对被设计成表达本发明的多核苷酸和核酸分子的表达盒。如在此使用的,“表达盒”意指如下核酸分子,该核酸分子具有至少一种可操作地连接至目的核苷酸序列(例如,编码本发明的cry蛋白的本发明的核苷酸序列)上的控制序列。以这种方式,例如,可操作地连接至待表达的核苷酸序列的植物启动子可以在表达盒中提供,用于在植物、植物部分或植物细胞中的表达。

包含目的多核苷酸的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少另外一种是异源的。表达盒还可以是天然存在但已经是以适用于异源表达的重组形式获得的表达盒。然而,典型地,该表达盒相对于该宿主而言是异源的,即该表达盒的特定核酸序列不是天然存在于该宿主细胞中的,并且必须已经通过转化事件引入到该宿主细胞或该宿主细胞的祖先中。

除可操作地连接至本发明的核苷酸序列的启动子之外,本发明的表达盒还可以包括其他调节序列。如在此使用的,“调节序列”意指位于编码序列上游(5'非编码序列)、内部或下游(3'非编码序列)并影响相关编码序列的转录、rna加工或稳定性、或翻译的核苷酸序列。调节序列包括但不限于增强子、内含子、翻译前导序列、终止信号、以及多腺苷酸化信号序列。

在一些实施例中,本发明的表达盒还可以包括编码除本发明的cry蛋白之外的其他所希望的性状的多核苷酸。此类包含叠加性状的表达盒可以用来产生具有所希望的具有叠加性状(即,分子叠加)的表型的植物、植物部分或植物细胞。植物中的此类叠加的组合还可以通过其他方法来产生,包括但不限于通过任何常规的方法学的杂交育种植物。如果是通过遗传转化这些植物来进行叠加的,目的核苷酸序列可以在任何时间并且以任何次序进行组合。例如,包含一种或多种所希望的性状的转基因植物可以用作通过后续转化而引入另外的性状的靶标。另外的核苷酸序列可以在共转化方案中与由表达盒的任何组合提供的本发明的核苷酸序列、核酸分子、核酸构建体、或组合物同时引入。例如,如果将引入两个核苷酸序列,则它们可以合并在分开的盒(反式)中或可以合并在相同的盒(顺式)上。多核苷酸的表达可以通过相同的启动子或通过不同的启动子驱动。进一步认识到多核苷酸可以使用位点特异性重组系统在所希望的基因组位置处叠加。参见例如,国际专利申请公开号wo99/25821;wo99/25854;wo99/25840;wo99/25855;以及wo99/25853。

表达盒还可以包括用于农艺性状的一种或多种目的多肽或双链rna分子(dsrna)的另外的编码序列,这些农艺性状的主要受益者是种子公司、栽培者或谷物加工者。目的多肽可以是由目的核苷酸序列编码的任何多肽。适合用于在植物中生产的目的多肽的非限制性实例包括产生农艺学重要性状的那些多肽,这些性状如除草剂抗性(有时也称为“除草剂耐受性”)、病毒抗性、细菌病原体抗性、昆虫抗性、线虫抗性、或真菌抗性。参见,例如美国专利号5,569,823;5,304,730;5,495,071;6,329,504;和6,337,431。多肽还可以是提高植物活力或产量(包括允许植物在不同的温度、土壤条件以及日光和沉淀水平下生长的性状)的多肽,或是允许对展现目的性状(例如,选择性标记、种皮颜色等)的植物进行鉴别的多肽。不同的目的多肽,连同用于将这些多肽引入植物中的方法描述于例如美国专利号4,761,373、4,769,061、4,810,648、4,940,835、4,975,374、5,013,659、5,162,602、5,276,268、5,304,730、5,495,071、5,554,798、5,561,236、5,569,823、5,767,366、5,879,903、5,928,937、6,084,155、6,329,504和6,337,431,连同美国专利公开号2001/0016956中。还参见,万维网上的lifesci.sussex.ac.uk/home/neil_crickmore/bt/。

赋予对抑制生长点或分生组织的除草剂(如咪唑啉酮或磺酰脲)的抗性/耐受性的多核苷酸也可以适用于本发明的一些实施例中。对于突变型als和ahas酶在这一分类号中的示例性多核苷酸如描述于例如,美国专利号5,767,366和5,928,937中。美国专利号4,761,373和5,013,659针对抵抗不同的咪唑啉酮或磺酰脲除草剂的植物。美国专利号4,975,374涉及含有如下核酸的植物细胞和植物,该核酸编码突变型谷氨酰胺合成酶(gs),该突变型谷氨酰胺合成酶抵抗已知抑制gs的除草剂(例如,草胺膦和甲硫氨酸磺基肟(methioninesulfoximine))的抑制作用。美国专利号5,162,602披露了抵抗环己二酮和芳氧苯氧丙酸除草剂的抑制作用的植物。该抗性由改变的乙酰辅酶a羧化酶(accase)赋予。

赋予对草甘膦抗性的、由核苷酸序列编码的多肽也适用于本发明。参见例如,美国专利号4,940,835和美国专利号4,769,061。美国专利号5,554,798披露了抗草甘膦的转基因玉蜀黍植物,该抗性由改变的5-烯醇丙酮莽草酸-3-磷酸(epsp)合成酶基因赋予。

编码对磷酰基化合物(如草铵膦或草丁膦、以及吡啶氧丙酸或苯氧丙酸以及环己酮)的抗性的多核苷酸也是适合的。参见欧洲专利申请号0242246。还参见美国专利号5,879,903、5,276,268和5,561,236。

其他适合的多核苷酸包括编码对抑制光合作用的除草剂(如三嗪和苯基氰(腈水解酶))的抗性的那些,参见美国专利号4,810,648。编码用于除草剂抗性的另外的适合的多核苷酸包括编码对2,2-二氯丙酸、烯禾啶、吡氟氯禾灵、咪唑啉酮除草剂、磺酰脲除草剂、三唑并嘧啶除草剂、均三嗪除草剂以及溴草腈的抗性的那些。同样适合的是赋予对原卟啉原氧化酶的抗性或者提供增强的对植物疾病的抗性、增强的对不利环境条件(非生物胁迫)的耐受性(这些条件包括但不限于干旱、极冷、极热、或极端的土壤盐度或极端的酸度或碱度)、以及在植物构造或发育中的改变(包括发育时间方面的变化)的多核苷酸。参见例如,美国专利公开号2001/0016956和美国专利号6,084,155。

另外的适合的多核苷酸包括对杀有害生物(例如杀昆虫)多肽进行编码的那些。这些多肽可以按足以控制例如昆虫有害生物的量(即,昆虫控制量)进行生产。应当认识到在植物中对控制昆虫或其他有害生物必要的杀有害生物多肽的生产量可以变化,这取决于栽培品种、有害生物的类型、环境因素等。有用于另外的昆虫或有害生物抗性的多核苷酸包括例如编码芽孢杆菌属(bacillus)生物中鉴定到的毒素的那些。已经克隆了包含编码来自若干个亚种的苏云金芽孢杆菌(bt)cry蛋白的核苷酸序列的多核苷酸,并且已经发现这些重组克隆对鳞翅目、双翅目和/或鞘翅目昆虫幼虫是有毒的。此类bt杀昆虫蛋白的实例包括如下cry蛋白,例如cry1aa、cry1ab、cry1ac、cry1b、cry1c、cry1d、cry1ea、cry1fa、cry3a、cry9a、cry9b、cry9c等,连同营养期杀昆虫蛋白例如vip1、vip2、vip3等。bt来源的蛋白的完整清单可以在万维网在苏塞克斯大学(universityofsussex)维护的苏云金芽孢杆菌毒素命名法数据库中找到(还参见,crickmore等人(1998)microbiol.mol.biol.rev.[微生物分子生物学综述]62:807-813)。

适合在植物中生产的多肽进一步包括改进或通过其他方式有助于收获的植物或植物部分转化成为商业上有用的产品(包括例如增加的或改变的碳水化合物含量或分布、改进的发酵特性、增加的油含量、增加的蛋白质含量、改进的消化率、以及增加的营养成分含量(例如,增加的植物甾醇含量、增加的生育酚含量、增加的甾烷醇含量或增加的维生素含量))的那些。目的多肽还包括,例如在收获的作物中导致或促成不需要的成分(例如植酸、或降解糖的酶类)的含量降低的那些。“导致(resultingin)”或“促成(contributingto)”是指这种目的多肽可以直接或间接地促成目的性状的存在(例如,通过异源纤维素酶的使用来增加纤维素降解)。

在一些实施例中,多肽促成了食品或饲料的改进的可消化度。木聚糖酶是半纤维素分解酶,这些酶改进了植物细胞壁的分解,这导致动物更好地利用这些植物营养素。这导致了改进的生长率和饲料转化。同样,可以减小含有木聚糖的饲料的粘度。在植物细胞内异源产生木聚糖酶也可以促进木质纤维素转化成工业加工中的可发酵糖。

来自真菌和细菌微生物的众多木聚糖酶已经得到鉴别和表征(参见例如,美国专利号5,437,992;coughlin等人,(1993),“proceedingsofthesecondtricelsymposiumontrichodermareeseicellulasesandotherhydrolases”[“里氏木霉纤维素酶和其他水解酶的第二tricel研讨会论文集”],埃斯波(espoo);souminen和reinikainen编著,(1993)生物技术和工业发酵研究基金会(foundationforbiotechnicalandindustrialfermentationresearch)8:125-135;美国专利公开号2005/0208178;以及pct公开号wo03/16654)。特别地,在里氏木霉(t.reesei)中已经鉴别出三种特异性木聚糖酶(xyl-i、xyl-ii、和xyl-iii)(tenkanen等人,(1992),enzymemicrob.technol.[酶与微生物技术]14:566;torronen等人,(1992),bio/technology[生物/技术]10:1461;以及xu等人,(1998),appl.microbiol.biotechnol.[应用微生物与生物技术]49:718)。

在其他实施例中,对于本发明有用的多肽可以是多糖降解酶。产生这样一种酶的本发明的植物对于产生例如用于生物加工的发酵原料会是有用的。在一些实施例中、可用于发酵过程的酶包括α淀粉酶、蛋白酶、支链淀粉酶、异淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、环糊精糖基转移酶、脂肪酶、植酸酶、漆酶、氧化酶、酯酶、角质酶、颗粒淀粉水解酶以及其他葡糖淀粉酶。

多糖降解酶包括:淀粉降解酶如α-淀粉酶(ec3.2.1.1)、葡糖醛酸糖苷酶(e.c.3.2.1.131);外切-1,4-α-d葡聚糖酶如淀粉葡糖苷酶和葡糖淀粉酶(ec3.2.1.3)、β-淀粉酶(ec3.2.1.2)、α-葡糖苷酶(ec3.2.1.20)和其他外切淀粉酶;淀粉去分支酶,如a)异淀粉酶(ec3.2.1.68)、支链淀粉酶(ec3.2.1.41)等;b)纤维素酶如外切-1,4-3-纤维二糖水解酶(ec3.2.1.91)、外切-1,3-β-d-葡聚糖酶(ec3.2.1.39)、β-葡糖苷酶(ec3.2.1.21);c)l-阿拉伯糖酶(arabinase)、如内切-1,5-α-l-阿拉伯糖酶(ec3.2.1.99)、α-阿拉伯糖苷酶(ec3.2.1.55)等;d)半乳聚糖酶如内切-1,4-β-d-半乳聚糖酶(ec3.2.1.89)、内切-1,3-β-d-半乳聚糖酶(ec3.2.1.90)、α-半乳糖苷酶(ec3.2.1.22)、β-半乳糖苷酶(ec3.2.1.23)等;e)甘露聚糖酶,如内切-1,4-β-d-甘露聚糖(ec3.2.1.78)、β-甘露糖苷酶(ec3.2.1.25)、α-甘露糖苷酶(ec3.2.1.24)等;f)木聚糖酶,如内切-1,4-β-木聚糖酶(ec3.2.1.8)、β-d-木糖苷酶(ec3.2.1.37)、1,3-β-d-木聚糖酶等;和g)其他酶如α-l-岩藻糖苷酶(ec3.2.1.51)、α-l-鼠李糖苷酶(ec3.2.1.40)、果聚糖酶(ec3.2.1.65)、菊粉酶(ec3.2.1.7)等。在一个实施例中,α-淀粉酶是描述于美国专利号8,093,453中的合成α-淀粉酶amy797e,将该专利通过引用以其全文结合在此。

可以与本发明一起使用的另外的酶包括蛋白酶,如真菌和细菌蛋白酶。真菌蛋白酶包括但不限于从曲霉属(aspergillus)、木霉属(trichoderma)、毛霉属(mucor)和根霉属(rhizopus),如黑曲霉(a.niger)、泡盛曲霉(a.awamori)、米曲霉(a.oryzae)和米黑毛霉(m.miehei)获得的那些。在一些实施例中,本发明的多肽可以是纤维二糖水解酶(cbh)(ec3.2.1.91)。在一个实施例中,该纤维二糖水解酶可以是cbh1或cbh2。

与本发明一起使用的其他酶包括但不限于半纤维素酶,如甘露聚糖酶和阿拉伯呋喃糖苷酶(ec3.2.1.55);木质素酶;脂肪酶(例如,e.c.3.1.1.3)、葡糖氧化酶、果胶酶、木聚糖酶、转葡糖苷酶、α1,6葡糖苷酶(例如,e.c.3.2.1.20);酯酶,如阿魏酸酯酶(ec3.1.1.73)和乙酰基木聚糖酯酶(ec3.1.1.72);以及角质酶(例如e.c.3.1.1.74)。

与本发明一起使用的双链rna分子包括但不限于抑制靶标昆虫基因的那些。如在此使用的词语“基因抑制”当一起考虑时旨在是指用于减少作为基因转录为mrna和该mrna的后续翻译的结果而产生的蛋白质的水平的任何熟知的方法。基因抑制还旨在意指减少从基因或编码序列表达蛋白质,包括转录后基因抑制和转录抑制。转录后基因抑制由从靶向抑制的基因或编码序列转录的mrna的全部或其一部分与用于抑制的相应双链rna之间的同源性介导,并且是指在细胞中可供被核糖体结合使用的可获得的mrna的量的实质且可测量的减少。经转录的rna可以处于正义方向而发挥作用,称为共抑制,处于反义方向而发挥作用,称为反义抑制,或在两个方向上产生dsrna而发挥作用,称为rna干扰(rnai)。转录抑制由细胞中存在作为基因抑制剂的与启动子dna序列或其补体展示出实质序列同一性而发挥作用的dsrna介导,称为启动子反式抑制。针对与性状相关的天然植物基因,基因抑制可以是有效的,例如,以提供具有减少水平的由该天然基因编码的蛋白质或具有增强或减少水平的受影响代谢物的植物。针对植物有害生物中的靶基因,基因抑制也可以是有效的,这些有害生物可以摄取或接触含有基因抑制剂的植物材料,这些基因抑制剂专门设计用于阻抑或抑制一种或多种同源或互补序列在该有害生物的细胞中的表达。靶向抑制的此类基因可以编码必需蛋白质,其预测功能选自下组,该组由以下组成:肌肉形成、保幼激素形成、保幼激素调节、离子调节和转运、消化酶合成、细胞膜电势的维持、氨基酸生物合成、氨基酸降解、精子形成、外激素(pheromone)合成、外激素感测、触角形成、翼形成、腿形成、发育和分化、卵形成、幼虫成熟、消化酶形成、血淋巴合成、血淋巴维持、神经传递、细胞分裂、能量代谢、呼吸以及凋亡。

在一些实施例中,本发明提供了如下转基因非人类宿主细胞,该细胞包括本发明的多核苷酸、核酸分子、嵌合基因、表达盒或重组载体。转基因非人类宿主细胞可以包括但不限于植物细胞、酵母细胞、细菌细胞或昆虫细胞。因此,在一些实施例中,本发明提供了选自以下属的细菌细胞:芽孢杆菌属、短芽孢杆菌属(brevibacillus)、梭菌属(clostridium)、致病杆菌属(xenorhabdus)、发光杆菌属(photorhabdus)、巴斯德氏芽菌属(pasteuria)、埃希氏菌属(escherichia)、假单胞菌属(pseudomonas)、欧文氏菌属(erwinia)、沙雷氏菌属(serratia)、克雷伯菌属(klebsiella)、沙门氏菌属(salmonella)、巴氏杆菌属(pasteurella)、黄单胞菌属(xanthomonas)、链霉菌属(streptomyces)、根瘤菌属(rhizobium)、红假单胞菌属(rhodopseudomonas)、嗜甲基菌属(methylophilius)、农杆菌属(agrobacterium)、醋杆菌属(acetobacter)、乳杆菌属(lactobacillus)、节杆菌属(arthrobacter)、固氮菌属(azotobacter)、明串珠菌属(leuconostoc)或产碱杆菌属(alcaligenes)。因此,例如,作为生物昆虫控制剂,本发明的cry蛋白可以通过在细菌细胞中表达编码本发明的cry蛋白的嵌合基因而产生。例如,在一些实施例中,提供了包含本发明的嵌合基因的苏云金芽孢杆菌细胞。

在另外的实施例中,本发明提供了作为双子叶植物细胞或单子叶植物细胞的转基因植物细胞。在另外的实施例中,该双子叶植物细胞选自下组,该组由以下组成:大豆细胞、向日葵细胞、番茄细胞、芸苔属作物细胞、棉花细胞、甜菜细胞以及烟草细胞。在另外的实施例中,该单子叶植物细胞选自下组,该组由以下组成:大麦细胞、玉蜀黍细胞、燕麦细胞、水稻细胞、高粱细胞、甘蔗细胞以及小麦细胞。在一些实施例中,本发明提供了多个双子叶植物细胞或单子叶植物细胞,这些细胞表达由本发明的嵌合基因编码的本发明的cry蛋白。在其他实施例中,将该多个细胞并列以形成质外体并且使其在自然光照中生长。

在本发明的其他实施例中,在高等生物(例如,植物)中表达本发明的杀昆虫cry蛋白。在这种情况下,表达有效量的杀昆虫蛋白的转基因植物保护自身免受植物有害生物如昆虫有害生物的伤害。当昆虫开始摄食这样一种转基因植物时,它摄取了所表达的杀昆虫cry蛋白。这可以妨碍昆虫进一步咬食植物组织或者甚至可以伤害或杀死昆虫。本发明的多核苷酸被插入表达盒中,然后该表达盒被稳定地整合到植物的基因组中。在其他实施例中,该多核苷酸被包括在非致病性自我复制病毒中。根据本发明转化的植物可以是单子叶植物或双子叶植物,并且包括但不限于玉米(玉蜀黍)、大豆、水稻、小麦、大麦、黑麦、燕麦、高粱、粟、向日葵、红花、甜菜、棉花、甘蔗、油菜、苜蓿、烟草、花生、蔬菜(包括甘薯、豆类、豌豆、菊苣、莴苣、甘蓝、花椰菜、西兰花、芜菁、胡萝卜、茄子、黄瓜、萝卜、菠菜、马铃薯、番茄、芦笋、洋葱、大蒜、瓜类、胡椒、芹菜、南瓜、西葫芦、绿皮西葫芦)、水果(包括苹果、梨、榅桲、李、樱桃、桃、蜜桃、杏、草莓、葡萄、覆盆子、黑莓、菠萝、鳄梨、番木瓜、芒果、香蕉)和特种植物如拟南芥以及木本植物如针叶树和落叶树。优选地,本发明的植物是作物植物,如玉蜀黍、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦、油菜等。

一旦所希望的多核苷酸已经被转化进特定的植物物种中,便可以使用传统的育种技术将其在该物种中繁殖或将其转移到相同物种的其他品种中,特别是包括商业品种。

在转基因植物中表达本发明的多核苷酸,由此导致在这些转基因植物中对处于原毒素或毒素形式的编码的cry蛋白的生物合成。以此方式,产生在存在昆虫压力下具有增强的产量保护的转基因植物。用于它们在转基因植物中的表达,本发明的核苷酸序列可能需要修饰和优化。尽管在许多情况下,来自微生物生物的基因能够在植物中高水平表达而无需修饰,但在转基因植物中的低表达可能是由于微生物核苷酸序列的缘故,这些序列具有在植物中并不优选的密码子。在本领域中已知,活生物具有特定的密码子使用偏好,而且在本发明中所描述的这些核苷酸序列的密码子可以被改变以符合植物偏好,同时维持由其编码的氨基酸。此外,在植物(例如玉米植物)中高表达最好是由如下编码序列实现的,这些编码序列具有至少约35%、或至少约45%、或至少约50%、或至少约60%的gc含量。具有低gc含量的微生物核苷酸序列在植物中也许表达欠佳,这是由于存在着可能使信息不稳定的attta基序,以及可导致不恰当的多腺苷酸化的aataaa基序。尽管某些基因序列可以在单子叶植物和双子叶植物物种两者中充分表达,但是可以对序列进行修饰以便迎合单子叶植物或双子叶植物的特定密码子偏好以及gc含量偏好,因为这些偏好已经被证明是不同的(murray等人,nucl.acidsres.[核酸研究]17:477-498(1989))。此外,针对不正常剪接位点的存在来对这些核苷酸序列进行筛选,这些位点可能导致信息平截(messagetruncation)。使用描述于例如美国专利号5,625,136、5,500,365和6,013,523中的方法,使用熟知的定点诱变、pcr以及合成基因构建技术对在这些核苷酸序列之内所有需要做出的变化(如以上所描述的那些)进行改变。

在一些实施例中,本发明提供了根据披露于美国专利号5,625,136中的程序制备的合成编码序列或多核苷酸,将该专利通过引用结合在此。在这个程序中,使用了玉蜀黍优选的密码子,即最频繁地编码玉蜀黍中的氨基酸的单个密码子。针对特定的氨基酸的玉蜀黍偏好的密码子可衍生自例如来自玉蜀黍的已知基因序列。例如,针对来自玉蜀黍植物的28个基因的玉蜀黍密码子使用发现于以下文献中:murray等人,nucleicacidsresearch[核酸研究]17:477-498(1989),将其披露内容通过引用结合在此。本发明的确切示例的用玉蜀黍优化密码子制备的合成序列由seqidno:6-15中的任一项代表。以这种方式,这些核苷酸序列可以进行优化用于在任何植物中表达。应当认识到,核苷酸序列的全部或任何部分可以是优化的或合成的。也就是说,多核苷酸可以包含作为部分天然序列和部分密码子优化序列的核苷酸序列。

为了有效的翻译起始,可能需要修饰与起始甲硫氨酸相邻的序列。例如,它们可以通过包含已知在植物中有效的序列而被修饰。joshi已经提出了针对植物的适当的共有序列(nar15:6643-6653(1987))。这些共有序列适于与本发明的核苷酸序列一起使用。将这些序列掺入至包含核苷酸序列的构建体中,达到atg并且包括atg(同时保持不修饰第二氨基酸),或者可替代地达到atg后的gtc并且包括atg后的gtc(具有修饰该转基因的第二氨基酸的可能性)。

本发明的新颖cry蛋白编码序列(作为它们的组装的序列、天然序列或作为如上所述的合成序列)可以可操作地融合至用于在植物中表达的多种启动子(包括组成型、诱导型、时序性调节的、发育调节的、化学调节的、组织优选的以及组织特异性启动子)以制备重组dna分子(即,嵌合基因)。启动子的选择将根据表达的时间和空间需要而变化,并且还根据靶物种而变化。因此,本发明的核苷酸序列在叶、在柄(stalk)或茎(stem)、在穗、在花序(例如穗状花序、圆锥花序、穗轴等)、在根或籽苗中的表达是优选的。然而在许多情况下,寻求针对多于一种类型昆虫有害生物的保护,并且因此在多个组织中的表达是令人希望的。尽管已经显示来自双子叶植物的很多启动子在单子叶植物中是可操作的并且反之亦然,但理想的是选择双子叶植物启动子用于在双子叶植物中表达,并且选择单子叶植物启动子用于在单子叶植物中表达。不过,对于所选的启动子的起源没有限制;只要它们可有效驱动核苦酸序列在期望细胞中表达就足够了。

适合的组成型启动子包括例如camv35s启动子(seqidno:1546;odell等人,nature[自然]313:810-812,1985);拟南芥at6669启动子(seqidno:1652;参见pct公开号w004081173a2);玉蜀黍ubi1(christensen等人,plantmol.biol.[植物分子生物学]18:675-689,1992);水稻肌动蛋白(mcelroy等人,plantcell[植物细胞]2:163-171,1990);pemu(last等人,theor.appl.genet.[理论与应用遗传学]81:581-588,1991);camv19s(nilsson等人,physiol.plant[植物生理学]100:456-462,1997);gos2(depater等人,plantj[植物杂志]11月;2(6):837-44,1992);泛素(christensen等人,plantmol.biol.[植物分子生物学]18:675-689,1992);水稻亲环蛋白(bucholz等人,plantmol.biol.[植物分子生物学]25(5):837-43,1994);玉蜀黍h3组蛋白(lepetit等人,mol.gen.genet.[分子遗传学与普通遗传学]231:276-285,1992);肌动蛋白2(an等人,plantj.[植物杂志]10(1);107-121,1996)、组成型根尖ct2启动子(seqidno:1535;还参见pct申请号il/2005/000627))以及syntheticsupermas(ni等人,theplantjournal[植物杂志]7:661-76,1995)。其他组成型启动子包括美国专利号5,659,026、5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、以及5,608,142中的那些。

对于在植物(特别是玉蜀黍)中表达本发明的新颖cry蛋白编码序列有用的组织特异性或组织优先启动子是指导在根、髓、叶或花粉中的表达的那些。适合的组织特异性启动子包括但不限于叶特异性启动子[如例如由yamamoto等人,plantj.[植物杂志]12:255-265,1997;kwon等人,plantphysiol.[植物生理学]105:357-67,1994;yamamoto等人,plantcellphysiol.[植物细胞生理学]35:773-778,1994;gotor等人,plantj.[植物杂志]3:509-18,1993;orozco等人,plantmol.biol.[植物分子生物学]23:1129-1138,1993;以及matsuoka等人,proc.natl.acad.sci.usa[美国国家科学院院刊]90:9586-9590,1993所描述],种子优选启动子[例如来自种子特异性基因(simon等人,plantmol.biol.[植物分子生物学]5.191,1985;scofield等人,j.biol.chem.[生物化学杂志]262:12202,1987;baszczynski等人,plantmol.biol.[植物分子生物学]14:633,1990)、巴西坚果白蛋白(pearson等人,plantmol.biol.[植物分子生物学]18:235-245,1992)、豆球蛋白(ellis等人,plantmol.biol.[植物分子生物学]10:203-214,1988)、谷蛋白(水稻)(takaiwa等人,mol.gen.genet.[分子遗传学与普通遗传学]208:15-22,1986;takaiwa等人,febsletts.[欧洲生化学会联合会快报]221:43-47,1987)、玉米蛋白(matzke等人,plantmolbiol[植物分子生物学],143).323-321990)、napa(stalberg等人,planta[植物]199:515-519,1996)、小麦spa(albanietal,plantcell[植物细胞],9:171-184,1997)、向日葵油体蛋白(oleosin)(cummins等人,plantmol.biol.[植物分子生物学]19:873-876,1992)],胚乳特异性启动子[例如,小麦lmw和hmw,麦谷蛋白-1(molgengenet[分子遗传学与普通遗传学]216:81-90,1989;nar17:461-2),小麦a、b和g麦醇溶蛋白(emb03:1409-15,1984),大麦ltrl启动子,大麦b1、c、d大麦醇溶蛋白(theorapplgen[理论与应用遗传学]98:1253-62,1999;plantj[植物杂志]4:343-55,1993;molgengenet[分子遗传学与普通遗传学]250:750-60,1996),大麦dof(mena等人,theplantjournal[植物杂志]116(1):53-62,1998),biz2(ep99106056.7),合成启动子(vicente-carbajosa等人,plantj.[植物杂志]13:629-640,1998),水稻谷醇溶蛋白nrp33、水稻-球蛋白glb-1(wu等人,plantcellphysiology[植物细胞生理学]39(8)885-889,1998),水稻α-球蛋白reb/ohp-1(nakase等人,plantmol.biol.[植物分子生物学]33:513-s22,1997),水稻adp-葡萄糖pp(transres6:157-68,1997),玉蜀黍esr基因家族(plantj[植物杂志]12:235-46,1997),高粱γ-高粱醇溶蛋白(plantmol.biol[植物分子生物学]32:1029-35,1996)],胚特异性启动子[例如,水稻osh1(sato等人,proc.nati.acad.sci.usa[美国国家科学院院刊]93:8117-8122),knox(postma-haarsma等人,plantmol.biol.[植物分子生物学]39:257-71,1999),水稻油体蛋白(wu等人,j.biochem.[生物化学杂志],123:386,1998)],花特异性启动子[例如,atprp4,查尔酮合酶(chalenesynthase;chsa)(vandermeer等人,plantmol.biol.[植物分子生物学]15,95-109,1990),lat52(twell等人,mol.gengenet.[分子遗传学与普通遗传学]217:240-245;1989),apetala-3,植物繁殖组织[例如,osmads启动子(美国专利申请2007/0006344)]。

本发明的核苷酸序列也可以在被化学调节的启动子的调节下进行表达。这使得本发明的cry蛋白能够仅在用诱导化学品对作物植物进行处理时被合成。用于基因表达的化学诱导的此类技术的实例详述于公开申请ep0332104和美国专利号5,614,395中。在一个实施例中,该化学调节的启动子是烟草pr-1a启动子。

另一类在本发明中有用的启动子是创伤可诱导的启动子。已经描述了数量众多的在创伤部位并且还在植物病原菌感染的部位表达的启动子。理想的是,这样的启动子在昆虫入侵的部位应该仅有局部活性,并且以此方式这些杀昆虫蛋白仅在需要合成这些杀昆虫蛋白的细胞中积聚以杀死入侵的昆虫有害生物。这类启动子的实例包括由以下文献所描述的那些:stanford等人,mol.gen.genet.[分子遗传学与普通遗传学]215:200-208(1989);xu等人,plantmolec.biol.[植物分子生物学]22:573-588(1993);logemann等人,plantcell[植物细胞]1:151-158(1989);rohrmeier和lehle,plantmolec.biol.[植物分子生物学]22:783-792(1993);firek等人,plantmolec.biol.[植物分子生物学]22:129-142(1993)以及warner等人,plantj.[植物杂志]3:191-201(1993)。

导致在本发明中有用的组织特异性表达模式的启动子的非限制性实例包括绿色组织特异性的、根特异性的、茎特异性的或花特异性的。适用于在绿色组织中表达的启动子包括调节涉及光合作用的基因的许多启动子,并且这些中的许多已经从单子叶植物和双子叶植物两者中得以克隆。一种此类启动子是来自磷酸烯醇羧化酶基因的玉蜀黍pepc启动子(hudspeth和grula,plantmolec.biol.[植物分子生物学]12:579-589(1989))。另一种用于根特异性表达的启动子是由deframond(febs290:103-106(1991)或美国专利号5,466,785)描述的启动子。另一种在本发明中有用的启动子是描述于美国专利号5,625,136中的茎特异性启动子,它天然地驱动玉蜀黍trpa基因的表达。

除了选择适合的启动子之外,用于在植物中表达杀昆虫毒素的构建体还需要适当的可操作地连接在异源核苷酸序列下游的转录终止子。一些此类的终止子是可获得的并且在本领域中是已知的(例如来自camv的tml,来自rbcs的e9)。任何已知在植物中发挥作用的可供使用的终止子均可以在本发明的上下文中使用。

可以将许多其他序列掺入本发明所描述的表达盒中。这些序列包括已经显示出增强表达的序列,如内含子序列(例如,来自adhl和bronzel)以及病毒的前导序列(例如,来自tmv、mcmv、和amv)。

本发明的核苷酸序列在植物中针对不同的细胞定位的靶向表达可能是更优选的。在一些情况下,在胞质溶胶中的定位可能是令人希望的,而在其他情况下,在某个亚细胞器中的定位可能是优选的。用于靶向例如植物中的基因产物的任何机构都可以用于实践本发明,并且已知此类机构存在于植物中并且已经相当详细地表征了控制这些机构的功能的序列。已经表征了导致将基因产物靶向其他细胞区室的序列。氨基末端序列可以负责将目的蛋白质靶向任何细胞区室,如植物的液泡、线粒体、过氧化物酶体、蛋白体、内质网、叶绿体、淀粉颗粒、淀粉体、质外体或细胞壁(例如unger等人plantmolec.biol.[植物分子生物学]13:411-418(1989);rogers等人(1985)proc.natl.acad.sci.usa[美国国家科学院院刊]82:6512-651;美国专利号7,102,057;wo2005/096704,将其全部通过引用而特此结合)。任选地,信号序列可以是来自waxy的n-末端信号序列、来自γ-玉米蛋白的n-末端信号序列、淀粉结合结构域、c-末端淀粉结合结构域、将成熟蛋白引入叶绿体的叶绿体靶向序列(comai等人,(1988)j.biol.chem.[生物化学杂志]263:15104-15109;vandenbroeck等人,(1985)nature[自然]313:358-363;美国专利号5,639,949)或来自糊粉细胞的分泌信号序列(koehler和ho,plantcell[植物细胞]2:769-783(1990))。另外,与羧基末端序列结合的氨基末端序列负责基因产物的液泡靶向(shinshi等人(1990)plantmolec.biol.[植物分子生物学]14:357-368)。在一个实施例中,所选择的信号序列包括已知的切割位点,并且构建的融合体考虑了在一个或多个切割位点之后的需要切割的任何氨基酸。在一些情况下,这个要求可以通过在切割位点与转基因atg之间添加小数目的氨基酸,或可替代地置换转基因序列内的一些氨基酸来满足。这些构建技术在本领域是熟知的并且同样适用于任何细胞区室。

应认识到,用于细胞靶向的上述机制不仅可以与其同源启动子结合使用,还可以与异源启动子结合使用,从而在启动子的转录调节下实现特定的细胞靶向目标,该启动子具有不同于自其衍生靶向信号的启动子的表达谱。

植物转化

用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括通过以下项的转化:细菌介导的核酸递送(例如,经由农杆菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、peg介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学的、化学的、物理的(机械的)或生物的机制,包括其任何组合。对于本领域已知的不同植物转化方法的一般指导包括以下文献:miki等人(“proceduresforintroducingforeigndnaintoplants”inmethodsinplantmolecularbiologyandbiotechnology[植物分子生物学与生物技术方法中的“用于将外来dna引入植物中的程序”],glick,b.r.和thompson,j.e.编辑,crc出版公司(crcpress,inc.),波卡拉顿(bocaraton),1993,第67-88页)和rakowoczy-trojanowska(cell.mol.biol.lett.[细胞与分子生物学快报]7:849-858(2002))。

对于农杆菌介导的转化,二元载体或携带至少一个t-dna边界序列的载体是适合的,而对于直接基因转移(例如,微粒轰击等),任何载体都是适合的,并且仅含有目的构建体的线性dna可以是优选的。在直接基因转移的情况下,可以使用以单个dna种类的转化或共转化(schocher等人,biotechnology[生物技术]4:1093-1096(1986))。对于直接基因转移以及农杆菌介导的转移二者,转化通常(但不是必需的)用如下选择性标记进行,该选择性标记可以是正向选择(磷甘露糖异构酶),提供对抗生素(卡那霉素、潮霉素或甲氨蝶呤)或除草剂(草甘膦或草丁膦)的抗性。然而,选择性标记的选择对于本发明并不是至关重要的。

农杆菌介导的转化是用于转化植物的常用方法,因为它的高转化效率以及因为它与许多不同物种的广泛实用性。农杆菌介导的转化典型地涉及将携带目的外来dna的二元载体转移至适当的农杆菌菌株,这可能取决于由宿主农杆菌菌株或者在共同存在的ti质粒上或染色体地携带的vir基因的互补体(uknes等人,(1993),plantcell[植物细胞]5:159-169)。将该重组二元载体转移至农杆菌可以使用携带该重组二元载体的大肠杆菌、辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元载体移动到靶标农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地,可以通过核酸转化将所述重组二元载体转移至农杆菌中(和willmitzer,(1988)nucleicacidsres.[核酸研究]16:9877)。

可以使用农杆菌转化双子叶植物以及单子叶植物。用于农杆菌介导的水稻转化方法包括熟知的水稻转化方法,如任何以下文献中描述的那些:欧洲专利申请ep1198985a1,aldemita和hodges(planta[植物]199:612-617,1996);chan等人(plantmolbiol[植物分子生物学]22(3):491-506,1993),hiei等人(plantj[植物杂志]6(2):271-282,1994),将这些披露通过引用结合在此,其引用程度如同完全阐明一样。在玉米转化的情况下,优选方法是如ishida等人(nat.biotechnol[自然生物技术]14(6):745-50,1996)或frame等人(plantphysiol[植物生理学]129(1):13-22,2002)中所描述的,将这些披露通过引用结合在此,其引用程度如同完全阐明一样。所述方法例如在b.jenes等人,techniquesforgenetransfer[基因转移技术],在:transgenicplants[转基因植物],第1卷,engineeringandutilization[工程化以及利用]中,s.d.kung和r.wu编著,学术出版社(1993)128-143以及在potrykus,annu.rev.plantphysiol.plantmolec.biol.[植物生理学年评和植物分子生物学]42(1991)205-225)中进一步描述。有待表达的核酸或构建体优选地克隆至适合于转化根癌农杆菌(agrobacteriumtumefaciens)的载体例如pbin19中(bevan等人,nucl.acidsres.[核酸研究]12(1984)8711)。然后,能够以已知的方式使用由这种载体转化的农杆菌来转化植物,如用作模型的植物像拟南芥或作物植物如烟草植物,方法是例如通过将捣碎的叶或切碎的叶浸没于农杆菌溶液中,并且然后将其在适合的培养基中培养。例如,借助于根癌农杆菌来转化植物由hagen和willmitzer描述于nucl.acidres.[核酸研究](1988)16,9877中或尤其自以下文献已知:f.f.white,vectorsforgenetransferinhigherplants;intransgenicplants[用于高等植物中的基因转移的载体],第1卷,engineeringandutilization[工程化以及利用],编辑s.d.kung和r.wu,学术出版社(academicpress),1993,第15-38页。

通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方法。在携带位于这些二元质粒t-dna边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。

如先前所讨论的,另一种用于转化植物、植物部分和植物细胞的方法涉及在植物组织和细胞上推进惰性或生物活性的粒子。参见例如,美国专利号4,945,050;5,036,006和5,100,792。通常,这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时,可以通过用含有目的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地,一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性的粒子(例如,干酵母细胞、干细菌或噬菌体,各自含有一种或多种被试图引入的核酸)推进到植物组织中。

在其他实施例中,本发明的多核苷酸可以被直接转化进质体基因组中。质体转化的主要优点在于质体通常能够表达细菌基因而无需实质性的修饰,而且质体能够在单个启动子的控制下表达多个开放阅读框。在美国专利号5,451,513、5,545,817和5,545,818中,在pct申请号wo95/16783中,以及在mcbride等人(1994)proc.nati.acad.sci.usa[美国国家科学院院刊]91,7301-7305中广泛描述了质体转化技术。基本的叶绿体转化技术涉及例如使用生物射弹(biolistic)或原生质体转化(例如,氯化钙或peg介导的转化),将位于选择性标记侧翼的经克隆的质体dna区连同目的基因一起引入合适的靶组织中。这些1至1.5kb的侧翼区(被命名为靶向序列)促进了与质体基因组的同源重组,并且因而允许置换或修饰原质体(plastome)的特定区域。最初,可以将叶绿体16srrna和rps12基因(赋予针对大观霉素或链霉素的抗性)的点突变用作供转化用的选择性标记(svab,z.、hajdukiewicz,p.和maliga,p.,(1990)proc.natl.acad.sci.usa[美国国家科学院院刊]87,8526-8530);staub,j.m.和maliga,p.,(1992)plantcell[植物细胞]4,39-45)。在这些标记之间克隆位点的存在允许建立质体靶向载体用于外来基因的引入(staub,j.m.和maliga,p.,(1993)emboj.[欧洲分子生物学杂志]12,601-606)。转化效率的实质性增加可以通过用显性的选择性标记(对大观霉素解毒酶氨基糖苷-3'-腺苷转移酶进行编码的细菌aada基因)置换隐性的rrna或r蛋白抗生素抗性基因而获得(svab,z.和maliga,p.,(1993)proc.natl.acad.sci.usa[美国国家科学院院刊]90,913-917)。先前,这种标记已经被成功地用于莱茵衣藻这种绿藻的质体基因组的高频率转化(goldschmidt-clermont,m.(1991)nucl.acidsres.[核酸研究]19:4083-4089)。有用于质体转化的其他选择性标记在本领域是已知的,并且被包括在本发明的范围之内。典型地,转化之后需要大约15-20个细胞分裂循环以便达到同质状态。质体表达(其中基因通过同源重组被插入到在每个植物细胞中存在的所有数千个环状质体基因组的拷贝中)利用了超过核表达的基因的庞大的拷贝数目的优点,以便允许能够很容易超过总的可溶性植物蛋白的10%的表达水平。在一个实施例中,可以将本发明的多核苷酸插入质体靶向载体中并转化进所希望的植物宿主的质体基因组中。因此,可以获得与含有本发明的核苷酸序列的质体基因组同型的植物,这些植物能够高表达该多核苷酸。

选择转化的转基因植物、植物细胞或植物组织培养物的方法在本领域中是常规的,并且可以用于在此提供的本发明的方法中。例如,本发明的重组载体还可以包括包含用于选择性标记的核苷酸序列的表达盒,该选择性标记可以用于选择转化的植物、植物部分或植物细胞。如在此使用的,“选择性标记”意指如下核苷酸序列,当该核苷酸序列表达时向表达该标记的植物、植物部分或植物细胞赋予不同的表型,并且因此允许此类转化的植物、植物部分或植物细胞与不具有该标记的那些区别开来。这样的核苷酸序列可以编码选择性或筛选性标记,这取决于该标记是否赋予可以通过化学手段而被选择的性状,如通过使用选择剂(例如,抗生素、除草剂等),或者取决于该标记是否仅是人们可以通过观察或测试而鉴别的性状,如通过筛选(例如,r基因座性状)。当然,适合的选择性标记的许多实例在本领域是已知的并且可以用于在此描述的表达盒中。

选择性标记的实例包括但不限于编码neo或nptii的核苷酸序列,它赋予对卡那霉素、g418等的抗性(potrykus等人(1985)mol.gen.genet.[分子遗传学与普通遗传学]199:183-188);编码bar的核苷酸序列,它赋予对草丁膦的抗性;编码改变的5-烯醇丙酮莽草酸-3-磷酸(epsp)合酶的核苷酸序列,它赋予对草甘膦的抗性(hinchee等人(1988)biotech.[生物技术]6:915-922);编码腈水解酶(如来自臭鼻克雷白氏杆菌(klebsiellaozaenae)的bxn)的核苷酸序列,它赋予对溴草腈的抗性(stalker等人(1988)science[科学]242:419-423);编码改变的乙酰乳酸合酶(als)的核苷酸序列,它赋予对咪唑啉酮、磺酰脲或其他als-抑制化学品的抗性(欧洲专利申请号154204);编码甲氨蝶呤-抗性的二氢叶酸还原酶(dhfr)的核苷酸序列(thillet等人(1988)j.biol.chem.[生物化学杂志]263:12500-12508);编码茅草枯脱卤素酶的核苷酸序列,它赋予对茅草枯的抗性;编码甘露糖-6-磷酸异构酶(也称为磷酸甘露糖异构酶(pmi))的核苷酸序列,它赋予代谢甘露糖的能力(美国专利号5,767,378和5,994,629);编码改变的邻氨基苯甲酸盐合酶的核苷酸序列,它赋予对5-甲基色氨酸的抗性;或编码hph的核苷酸序列,它赋予对潮霉素的抗性。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。

另外的选择性标记包括但不限于编码β-葡糖醛酸酶的核苷酸序列或编码对于多种显色底物已知的酶的uida(gus);编码在植物组织中对花色苷色素(红色)进行调节的产物的r基因座核苷酸序列(dellaporta等人,chromosomestructureandfunction:impactofnewconcepts[染色体结构与功能:新概念的影响]中263-282页,“molecularcloningofthemaizer-njallelebytransposon-taggingwithac[通过ac转座子标签技术对玉蜀黍r-nj等位基因的分子克隆]”,第18届斯特德莱遗传学专题讨论会(18thstadlergeneticssymposium)(gustafson和appels编辑,plenum出版社,1988));编码β-内酰胺酶的核苷酸序列,对于β-内酰胺酶而言多种显色底物是已知的(例如,padac,显色头孢菌素)(sutcliffe,(1978)proc.natl.acad.sci.usa[美国国家科学院院刊]75:3737-3741);编码xyle的核苷酸序列,xyle编码儿茶酚双加氧酶(zukowsky等人,(1983)proc.natl.acad.sci.usa[美国国家科学院院刊]80:1101-1105);编码酪氨酸酶的核苷酸序列,酪氨酸酶能够氧化酪氨酸成为dopa和多巴醌,其进而缩合形成黑色素(katz等人,(1983)j.gen.microbiol.[普通微生物学杂志]129:2703-2714);编码β-半乳糖苷酶的核苷酸序列,对于β-半乳糖苷酶而言存在显色底物;编码荧光素酶(lux)的核苷酸序列,荧光素酶允许生物发光检测(ow等人,(1986)science[科学]234:856-859);编码水母发光蛋白的核苷酸序列,水母发光蛋白可以在钙敏感的生物发光检测中采用(prasher等人,(1985)biochem.biophys.res.comm.[生物化学与生物物理学研究通讯]126:1259-1268);或编码绿色荧光蛋白的核苷酸序列(niedz等人,(1995)plantcellreports[植物细胞报道]14:403-406)。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。

此外,如本领域中所熟知的,完整的转基因植物可以使用多种已知技术中的任何技术从转化的植物细胞、植物组织培养物或培养的原生质体再生而来。在以下文献中描述了从植物细胞、植物组织培养物或培养的原生质体进行的植物再生:例如,evans等人(handbookofplantcellcultures[植物细胞培养物手册],第1卷,麦克米兰出版公司(macmilanpublishingco.),纽约(1983));以及vasili.r.(编辑)(cellcultureandsomaticcellgeneticsofplants[植物的细胞培养和体细胞遗传学],学术出版社,奥兰多,第i卷(1984)和第ii卷(1986))。

另外,工程化进以上所述的本发明的转基因种子和植物、植物部分或植物细胞中的遗传特性可以通过有性生殖或营养生长来传递,并且因此可以在子代植物中维持并传代。通常,维持和传代利用了被开发以适合特定目的(如收获、播种或耕作)的已知农业方法。

因此,可以按本领域熟知的任何数目的方法(如上所述的)将多核苷酸引入该植物、植物部分或植物细胞中。因此,没有依赖用于将一种或多种多核苷酸引入植物中的特定方法,相反可以使用允许将该一种或多种多核苷酸稳定地整合到该植物的基因组中的任何方法。在有待引入一种以上多核苷酸的情况下,这些对应的多核苷酸可以作为单一核酸分子的一部分、或者作为分开的核酸分子而进行组装,并且可以位于相同的或不同的核酸分子上。因此,可以在单个转化事件中、在分开的转化事件中、或者例如作为育种方案的一部分在植物中,将这些多核苷酸引入目的细胞中。

本发明的另外的实施例包括从本发明的转基因植物或其部分产生的收获产物以及从该收获产物产生的加工产物。收获产物可以是如在此描述的全株或任何植物部分。因此,在一些实施例中,收获产物的非限制性实例包括种子、果实、花或其部分(例如,花药、柱头等)、叶、茎等。在其他实施例中,加工产物包括但不限于从收获的本发明的种子或其他植物部分产生的细粉、粗粉、油、淀粉、谷物等,其中该种子或其他植物部分包含本发明的核酸分子/多核苷酸/核苷酸序列。

在其他实施例中,本发明提供了来自本发明的转基因种子或转基因植物的提取物,其中该提取物包含本发明的核酸分子、多核苷酸、核苷酸序列或毒性蛋白。可以根据本领域熟知的程序制备来自植物或植物部分的提取物(参见,delatorre等人,food,agric.environ.[食品农业与环境]2(1):84-89(2004);guidet,nucleicacidsres.[核酸研究]22(9):1772-1773(1994);lipton等人,foodagric.immun.[食品农业通讯]12:153-164(2000))。

杀昆虫组合物

在一些实施例中,本发明提供了杀昆虫组合物,该组合物包含农业上可接受的载体中的本发明的cry蛋白。如在此使用的“农业上可接受的载体”可以包括与活性cry蛋白组合以有助于它施用至或植物或其部分的天然或合成的有机或无机材料。农业上可接受的载体的实例包括但不限于粉剂、尘剂、丸剂、颗粒剂、喷雾剂、乳剂、胶体以及溶液。农业上可接受的载体进一步包括但不限于可用于农业配制品中的惰性组分、分散剂、表面活性剂、佐剂、增粘剂、粘着剂、粘合剂或其组合。此类组合物可以按使杀有害生物蛋白或其他有害生物控制剂与这些有害生物接触的任何方式施用。因此,可以将这些组合物施用于植物或植物部分的表面,包括种子、叶、花、茎、块茎、根等。在其他实施例中,在植物体内产生本发明的cry蛋白的植物是被表达的cry蛋白的农业载体。

在另外的实施例中,该杀昆虫组合物包含细菌细胞或本发明的转基因细菌细胞,其中该细菌细胞或转基因细菌细胞产生本发明的cry蛋白。这样一种杀昆虫组合物可以通过脱水、冷冻干燥、均化、萃取、过滤、离心、沉降或浓缩苏云金芽孢杆菌(bt)的培养物而制备。此类bt培养物可以是下文实例中描述的天然存在的bt菌株yn171-1、gx078-2和gx435-1或转基因bt培养物。在另外的实施例中,该组合物包含按重量计从约1%至约99%的本发明的cry蛋白。

本发明的cry蛋白可以与其他有害生物控制剂组合使用,以增加有害生物靶标范围或用于预防或管理昆虫抗性。因此,在一些实施例中,本发明提供了控制一种或多种植物有害生物的组合物,其中该组合物包含本发明的第一cry蛋白和不同于该第一cry蛋白的第二有害生物控制剂。在其他实施例中,该组合物是用于局部施用至植物的配制品。在仍其他实施例中,该组合物是转基因植物。在另外的实施例中,该组合物是局部施用至转基因植物的配制品的组合。在一些实施例中,当该转基因植物包含该第二有害生物控制剂时,该配制品包含本发明的该第一cry蛋白。在其他实施例中,当该转基因植物包含本发明的该第一cry蛋白时,该配制品包含该第二有害生物控制剂。

在一些实施例中,该第二有害生物控制剂可以是选自下组的试剂,该组由以下组成:化学杀有害生物剂(如杀昆虫剂)、苏云金芽孢杆菌(bt)杀昆虫蛋白、致病杆菌属杀昆虫蛋白、发光杆菌属杀昆虫蛋白、侧孢短芽孢杆菌(brevibacilluslaterosporus)杀昆虫蛋白、球形芽孢杆菌(bacillussphaericus)杀昆虫蛋白、蛋白酶抑制剂(丝氨酸和半胱氨酸类型两者)、凝集素、α-淀粉酶、过氧化物酶、胆固醇氧化酶以及双链rna(dsrna)分子。

在其他实施例中,该第二有害生物控制剂是选自下组的化学杀有害生物剂,该组由以下组成:拟除虫菊酯、氨基甲酸酯、新烟碱、神经元钠通道阻断剂、杀昆虫大环内酯、γ-氨基丁酸(gaba)拮抗剂、杀昆虫脲以及保幼激素模拟物。在其他实施例中,该化学杀有害生物剂选自下组,该组由以下组成:阿巴美丁、乙酰甲胺磷、啶虫脒、磺胺螨酯(amidoflumet)(s-1955)、除虫菌素(avermectin)、印楝素、甲基谷硫磷、联苯菊酯、联苯肼酯(binfenazate)、噻嗪酮、克百威、溴虫腈、定虫隆、毒死蜱、甲基毒死蜱、环虫酰肼、噻虫胺、氟氯氰菊酯、β-氟氯氰菊酯、三氯氟氰菊酯、λ-三氯氟氰菊酯、氯氰菊酯、灭蝇胺、溴氰菊酯、杀螨隆、二嗪磷、除虫脲、乐果、苯虫醚、甲氨基阿维菌素、硫丹、高氰戊菊酯、乙虫腈、苯硫威(fenothicarb)、苯氧威、甲氰菊酯、唑螨酯、氰戊菊酯、氟虫腈、氟啶虫酰胺、氟氰戊菊酯、τ-氟胺氰菊酯、嘧虫胺(ur-50701)、氟虫脲、地虫硫磷、氯虫酰肼、氟铃脲、吡虫啉、茚虫威、异柳磷、虱螨脲、马拉硫磷、聚乙醛、甲胺磷、杀扑磷、灭多威、烯虫酯、甲氧氯、久效磷、甲氧虫酰肼、噻虫醛(nithiazin)、双苯氟脲、多氟脲(xde-007)、杀线威、对硫磷、甲基对硫磷、氯菊酯、甲拌磷、伏杀磷、亚胺硫磷、磷胺、抗蚜威、丙溴磷、吡蚜酮、啶虫丙醚、蚊蝇醚、鱼藤酮、多杀菌素、螺甲螨酯(spiromesifin)(bsn2060)、硫丙磷、虫酰肼、伏虫隆、七氟菊酯、特丁硫磷、杀虫畏、噻虫啉、噻虫嗪、硫双威、杀虫双(thiosultap-sodium)、四溴菊酯、敌百虫和杀铃脲、涕灭威、杀线威、苯线磷、双甲脒、灭螨猛、乙酯杀螨醇、三环锡、三氯杀螨醇、除螨灵、依杀螨、喹螨醚、苯丁锡、甲氰菊酯、唑螨酯、噻螨酮、克螨特、哒螨灵以及吡螨胺。在仍其他实施例中,该化学杀有害生物剂选自下组,该组由以下组成:氯氰菊酯、三氯氟氰菊酯、氟氯氰菊酯和β-氟氯氰菊酯、高氰戊菊酯、氰戊菊酯、四溴菊酯、苯硫威、灭多威、杀线威、硫双威、噻虫胺、吡虫啉、噻虫啉、茚虫威、多杀菌素、阿巴美丁、除虫菌素、甲氨基阿维菌素、硫丹、乙虫腈、氟虫腈、氟虫脲、杀铃脲、苯虫醚、蚊蝇醚、吡蚜酮以及双甲脒。

在另外的实施例中,该第二有害生物控制剂可以是任何数目的苏云金芽孢杆菌杀昆虫蛋白中的一种或多种,包括但不限于cry蛋白、营养期杀昆虫蛋白(vip)以及任何前述杀昆虫蛋白的杀昆虫嵌合体。在其他实施例中,该第二有害生物控制剂是选自下组的cry蛋白,该组由以下组成:cry1aa、cry1ab、cry1ac、cry1ad、cry1ae、cry1af、cry1ag、cry1ah、cry1ai、cry1aj、cry1ba、cry1bb、cry1bc、cry1bd、cry1be、cry1bf、cry1bg、cry1bh、cry1bi、cry1ca、cry1cb、cry1da、cry1db、cry1dc、cry1dd、cry1ea、cry1eb、cry1fa、cry1fb、cry1ga、cry1gb、cry1gc、cry1ha、cry1hb、cry1hc、cry1ia、cry1ib、cry1ic、cry1id、cry1ie、cry1if、cry1ig、cry1ja、cry1jb、cry1jc、cry1jd、cry1ka、cry1la、cry1ma、cry1na、cry1nb、cry2aa、cry2ab、cry2ac、cry2ad、cry2ae、cry2af、cry2ag、cry2ah、cry2ai、cry2aj、cry2ak,cry2al、cry2ba、cry3aa、cry3ba、cry3bb、cry3ca、cry4aa、cry4ba、cry4ca、cry4cb、cry4cc、cry5aa、cry5ab、cry5ac、cry5ad、cry5ba、cry5ca、cry5da、cry5ea、cry6aa、cry6ba、cry7aa、cry7ab、cry7ac、cry7ba、cry7bb、cry7ca、cry7cb、cry7da、cry7ea、cry7fa、cry7fb、cry7ga、cry7gb、cry7gc、cry7gd、cry7ha、cry7ia、cry7ja、cry7ka、cry7kb、cry7la、cry8aa、cry8ab、cry8ac、cry8ad、cry8ba、cry8bb、cry8bc、cry8ca、cry8da、cry8db、cry8ea、cry8fa、cry8ga、cry8ha、cry8ia、cry8ib、cry8ja、cry8ka、cry8kb、cry8la、cry8ma、cry8na、cry8pa、cry8qa、cry8ra、cry8sa、cry8ta、cry9aa、cry9ba、cry9bb、cry9ca、cry9da、cry9db、cry9dc、cry9ea、cry9eb、cry9ec、cry9ed、cry9ee、cry9fa、cry9ga、cry10aa、cry11aa、cry11ba、cry11bb、cry12aa,cry13aa、cry14aa、cry14ab、cry15aa、cry16aa、cry17aa、cry18aa、cry18ba、cry18ca、cry19aa、cry19ba、cry19ca、cry20aa、cry20ba、cry21aa、cry21ba、cry21ca、cry21da、cry21ea、cry21fa、cry21ga、cry21ha、cry22aa、cry22ab、cry22ba、cry22bb、cry23aa、cry24aa、cry24ba、cry24ca、cry25aa、cry26aa、cry27aa、cry28aa、cry29aa、cry29ba、cry30aa、cry30ba、cry30ca、cry30da、cry30db、cry30ea、cry30fa、cry30ga,cry31aa、cry31ab、cry31ac、cry31ad、cry32aa、cry32ab、cry32ba、cry32ca、cry32cb、cry32da、cry32ea、cry32eb、cry32fa、cry32ga、cry32ha、cry32hb、cry32ia、cry32ja、cry32ka、cry32la、cry32ma、cry32mb、cry32na、cry32oa、cry32pa、cry32qa、cry32ra、cry32sa、cry32ta、cry32ua、cry33aa、cry34aa、cry34ab、cry34ac、cry34ba、cry35aa、cry35ab、cry35ac、cry35ba、cry36aa、cry37aa、cry38aa、cry39aa、cry40aa、cry40ba、cry40ca、cry40da、cry41aa、cry41ab、cry41ba、cry42aa、cry43aa、cry43ba、cry43ca、cry43cb、cry43cc、cry44aa、cry45aa、cry46aa、cry46ab、cry47aa、cry48aa、cry48ab、cry49aa、cry49ab、cry50aa、cry50ba、cry51aa、cry52aa、cry52ba、cry53aa、cry53ab、cry54aa、cry54ab、cry54ba、cry55aa、cry56aa、cry57aa、cry57ab、cry58aa、cry59aa、cry59ba、cry60aa、cry60ba、cry61aa、cry62aa、cry63aa、cry64aa、cry65aa、cry66aa、cry67aa、cry68aa、cry69aa、cry69ab、cry70aa、cry70ba、cry70bb、cry71aa、cry72aa以及cry73aa。

在另外的实施例中,该第二有害生物控制试剂是选自下组的vip3营养期杀昆虫蛋白,该组由以下组成:vip3aa1、vip3aa2、vip3aa3、vip3aa4、vip3aa5、vip3aa6、vip3aa7、vip3aa8、vip3aa9、vip3aa10、vip3aa11、vip3aa12、vip3aa13、vip3aa14、vip3aa15、vip3aa16、vip3aa17、vip3aa18、vip3aa19、vip3aa20、vip3aa21、vip3aa22、vip3aa2、vip3aa24、vip3aa25、vip3aa26、vip3aa27、vip3aa28、vip3aa29、vip3aa30、vip3aa31、vip3aa32、vip3aa33、vip3aa34、vip3aa35、vip3aa36、vip3aa37、vip3aa38、vip3aa39、vip3aa40、vip3aa41、vip3aa42、vip3aa43、vip3aa44、vip3ab1、vip3ab2、vip3ac1、vip3ad1、vip3ad2、vip3ae1、vip3af1、vip3af2、vip3af3、vip3ag1、vip3ag2、vip3ag3、hm117633、vip3ag4、vip3ag5、vip3ah1、vip3ba1、vip3ba2、vip3bb1、vip3bb2以及vip3bb3。

在仍另外的实施例中,在转基因植物中共表达本发明的第一cry蛋白和该第二有害生物控制剂。可以通过将植物遗传工程化以含有并表达所有的必需基因来实现一种以上杀有害生物成分在同一个转基因植物中的共表达。可替代地,可以将植物(亲本1)遗传工程化,用于本发明的cry蛋白的表达。可以将第二植物(亲本2)遗传工程化,用于第二有害生物控制剂的表达。通过将亲本1与亲本2杂交,获得了表达被引入至亲本1和亲本2中的所有基因的子代植物。

在其他实施例中,本发明提供了对植物有害生物侵染有抗性的叠加性转基因植物,该植物包含编码用于在靶标有害生物中抑制必需基因的dsrna的dna序列和编码针对该靶标有害生物展示出生物活性的本发明的cry蛋白的dna序列。已经报道,dsrna对抗某些鳞翅目有害生物是无效的(rajagopol等人,2002,j.biol.chem.[生物化学杂志]277:468-494),这可能是由于中肠中的高ph使得dsrna不稳定。因此,在一些靶标有害生物是鳞翅目有害生物的实施例中,本发明的cry蛋白起作用以瞬时降低中肠ph,这用于稳定共摄取的dsrna,从而使得该dsrna有效沉默靶基因。

除了提供组合物之外,本发明还提供了产生对鳞翅目有害生物有毒的cry蛋白的方法。这样一种方法包括在转基因非人类宿主细胞产生对鳞翅目有害生物有毒的蛋白质的条件下培养该宿主细胞,该宿主细胞包含本发明的多核苷酸或嵌合基因或核酸分子或重组载体。在一些实施例中,该转基因非人类宿主细胞是植物细胞。在一些其他实施例中,该植物细胞是玉蜀黍细胞。在其他实施例中,该植物细胞或玉蜀黍细胞在其下生长的条件包括自然光照。在其他实施例中,该转基因非人类宿主细胞是细菌细胞。在仍其他实施例中,该转基因非人类宿主细胞是酵母细胞。

在该方法的其他实施例中,该鳞翅目有害生物选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)及其任何组合。

在该方法的另外的实施例中,该嵌合基因包括seqidno:1-5中的任一项。在仍其他实施例中,所产生的蛋白质包含seqidno:16-25中任一项的氨基酸序列。

在该方法的一些实施例中,该嵌合基因包含针对在植物中表达进行了密码子优化的核苷酸序列。在其他实施例中,该嵌合基因包含seqidno:6-10中的任一项。在另外的实施例中,所产生的蛋白质包含seqidno:16-25中任一项的氨基酸序列。

在另外的实施例中,本发明提供了一种产生抗有害生物(例如,抗昆虫)转基因植物的方法,该方法包括向植物中引入包含编码本发明的cry蛋白的核苷酸序列的本发明的多核苷酸、嵌合基因、重组载体、表达盒或核酸分子,其中该核苷酸序列被表达于该植物中,由此赋予该植物对鳞翅目有害生物的抗性,并且产生抗昆虫转基因植物。在一些实施例中,与缺乏本发明的多核苷酸、嵌合基因、重组载体、表达盒或核酸分子的对照植物相比,抗有害生物转基因植物对杆野螟属(ostrinia)的鳞翅目有害生物有抗性。在其他实施例中,杆野螟属的该昆虫是亚洲玉米蛀虫(亚洲玉米螟)。在一些实施例中,通过转化植物实现引入。在其他实施例中,通过使包含本发明的嵌合基因、重组载体、表达盒或核酸分子的第一植物与不同的第二植物杂交来实现引入。

在一些实施例中,至少对亚洲玉米蛀虫(亚洲玉米螟)有抗性的本发明的转基因植物还对至少一种另外的鳞翅目有害生物有抗性,其中该另外的鳞翅目有害生物包括但不限于黑色地老虎(小地老虎)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)或水稻卷叶螟(稻纵卷叶螟)及其任何组合。

在另外的实施例中,提供了一种控制鳞翅目有害生物如亚洲玉米蛀虫(亚洲玉米螟)的方法,该方法包括向这些昆虫递送有效量的本发明的cry蛋白。为了有效,该cry蛋白首先被昆虫经口摄取。然而,该cry蛋白可以按许多公认的方式被递送至该昆虫。用于将蛋白质经口递送至昆虫的方式包括但不限于将该蛋白质提供于(1)转基因植物中,其中该昆虫取食(摄取)该转基因植物的一个或多个部分,由此摄取在该转基因植物中表达的多肽;(2)一种或多种配制的蛋白质组合物中,它们可以被施用至或掺入例如昆虫生长介质中;(3)一种或多种蛋白质组合物中,它们可以被施用至表面,例如喷雾在植物部分的表面,然后当该昆虫取食喷雾的一个或多个植物部分时组合物被该昆虫摄取;(4)饵基;或(5)任何其他本领域公认的蛋白质递送系统。因此,可以使用经口递送至昆虫的任何方法来递送本发明的毒性cry蛋白。在一些特定实施例中,将本发明的cry蛋白经口递送至昆虫,其中该昆虫摄取转基因植物的一个或多个部分。

在其他实施例中,将本发明的cry蛋白经口递送至昆虫,其中该昆虫摄取用包含本发明的cry蛋白的组合物喷雾的植物的一个或多个部分。可以使用本领域技术人员已知的用于将化合物、组合物、配制品等施用于植物表面的任何方法将本发明的组合物递送至植物表面。递送至或接触植物或其部分的一些非限制性实例包括喷雾、撒粉、喷洒、分散、下雾、雾化、撒播、浸泡、土壤注入、土壤掺入、浸透(例如,根、土壤处理)、浸渍、灌注、涂覆、叶或茎浸润、侧施或种子处理等及其组合。用于使植物或其部分与一种或多种化合物、一种或多种组合物或一种或多种配制品接触的这些和其他程序是本领域技术人员熟知的。

在一些实施例中,本发明涵盖为农民提供控制鳞翅目有害生物的手段的方法,该方法包括向该农民供应或出售植物材料如种子,该植物材料包含能够在由该种子生长的植物中表达本发明的cry蛋白的多核苷酸、嵌合基因、表达盒或重组载体,如上所述。

本发明的实施例可以通过参考以下实例而被更好地理解。前述的和以下的本发明的实施例以及各种实施例的描述不是旨在限制权利要求书,而是对其具有说明性。因此,应理解的是权利要求书不旨在受限于这些实例的具体细节。本领域技术人员应理解的是本发明的其他实施例可以在不偏离本披露的精神和范围的情况下进行实践,本披露的范围是由所附权利要求书限定的。

实例

实例1.用于基因组测序的bt菌株的鉴别

从在中国收集的土壤样品中分离苏云金芽孢杆菌(bt)菌株。将土壤样品悬浮于lb+2.5m乙酸钠液体培养基中,随后70℃热处理约20min。然后将一微升悬浮液涂布在t3+青霉素琼脂平板上并且在28℃下孵育,直到形成菌落。将具有芽孢杆菌属样形态学的菌落从这些平板中挑出并且在t3+青霉素琼脂平板上重新划线直到它们已经形成孢子,典型地持续大约三天。通过用考马斯蓝/乙酸将培养物染色并且用显微镜目测来鉴别bt菌株。鉴别bt菌株后,如下所述分离基因组dna。

实例2.基因组组装与分析

使用全基因组测序方法,从如实例1中所述分离的bt菌株的基因组组装本发明的btcry基因。简言之,使用covariss2超声波装置(covaris公司,沃本,马萨诸塞州)剪切芽孢杆菌属dna,其中将程序dna_400bp设为工作循环:10%;强度:4;循环/脉冲:200。将dna用ultratmendrepair/da-加尾模块(新英格兰生物实验室公司(newenglandbiolabs,inc.),伊普斯维奇,马萨诸塞州)处理。如供应商(新英格兰生物实验室公司,伊普斯维奇,马萨诸塞州)所述的,使用nebquickligationtm连接生物科技(biooscience)有索引的1-57个适配子(1-27巴西,28-57美国、英国和瑞士)。如供应商(贝克曼库尔特公司(beckmancoulter,inc.),印第安纳波利斯,印第安纳州)所述的,使用agencourtampurexp珠粒清理连接物。

将文库如下进行大小分级:将50ul样品与45ul75%珠粒混合物(25%ampure珠粒加75%nacl/peg溶液teknova目录号p4136)混合。搅拌混合物并置于磁性支架上。将所得上清液转移至新孔中并且添加45ul50%珠粒混合物(50%ampure珠粒加50%nacl/peg溶液teknova目录号p4136)。搅拌该混合物并置于磁性支架上。去除所得上清液并且用80%乙醇洗涤珠粒。添加25ul的洗脱缓冲液(eb)并且将混合物置于磁性支架上。去除所得最终上清液并置于1.5ml管中。这个方法产生了525个dna碱基对(bp)(插入物加适配子)大小范围内的文库。

使用kapa生物系统高保真热启动(kapabiosystemhifihotstart)(kapa生物系统公司(kapabiosystems,inc.),威尔明顿,马萨诸塞州)使用以下循环条件扩增大小确定的dna文库:[98℃,45s];12x[98℃,15s,60℃,30s,72℃,30s];[72℃,1min]。每个反应含有:5uldna文库、1ul生物科技通用引物(25um)、18ul无菌水、1ul生物科技有索引的引物(25um)、25ul2xkapahifi聚合酶。

使用高灵敏度芯片在agilent2100生物分析仪(安捷伦科技公司(agilenttechnologies),圣克拉拉,加利福尼亚州)上跑文库,以确定文库大小范围和平均插入物大小。使用标准的制造商测序方案(亿明达公司(illumina,inc.),圣地亚哥,加利福尼亚州)在hiseq2500测序系统上针对配对末端(pe)测序(100个循环/读数;12-24个文库/泳道)处理所有文库。

使用被开发用于鉴别和表征可能的cry样基因的芽孢杆菌属计算分析工具来优先化引导物,用于进一步实验室测试。

上述基因组组装与分析鉴别出五个cry样基因,本文称为bt264、bt288、bt302、bt454和bt485,分别编码包含1173个氨基酸、1190个氨基酸、1192个氨基酸、1201个氨基酸和1146个氨基酸的并且分别具有132.1kd、135.8kd、135.6kd、134.1kd和129.3kd的分子量的蛋白质。技术人员将认识到,由于基因组测序和基因组装过程,组装的核苷酸序列和由其衍生的氨基酸序列不太可能是天然存在的,因为本领域已知序列的组装不是100%准确的并且可能引入不同于天然核苷酸序列的碱基。因此,这些核苷酸序列在此称为“组装的序列”,并且它们编码的cry蛋白衍生自“组装的序列”。

对衍生自组装的核苷酸序列的全长和截短的cry蛋白氨基酸序列进行序列同源性搜索。该截短的序列接近成熟毒素的大小,即大约67kd。使用万维网ncbi.nlm.nih.gov/blast上的ncbi蛋白质-蛋白质blast程序来确定同源性。与每种组装的cry蛋白具有最高同源性的已知cry蛋白表明了组装的cry蛋白所属的最近的cry家族。这些组装的cry编码序列和蛋白质的鉴别特征示于表1中。

表1.苏云金芽孢杆菌菌株中鉴别的组装的cry基因/蛋白质。

令人惊讶的是,根据是否对三种组装的cry蛋白(bt288、bt302和bt485)的全长与截短的氨基酸序列进行搜索,鉴别出不同的最近的cry家族成员。如表1所示,与全长bt288(seqidno:17)(其中它最近的cry家族是cry4aa,cry4aa与其全长具有42%同一性)相比,对于截短的bt288cry蛋白(seqidno:26)鉴别出的最近的cry家族是cry54aa。将bt288与cry54a和cry4aa进行比对显示出bt288的n-末端(seqidno:26)与cry54a蛋白具有51%同一性(参见表2),并且bt288的c-末端(seqidno:27)与cry4a蛋白具有47%同一性(参见表3),这表明组装的bt288核苷酸序列是cry50a和cry4a蛋白之间的杂合体。

表2.bt288的n-末端(seqidno:26)与cry54aa(seqidno:32)的比对。

表3.bt0288的c-末端(seqidno:27)与cry4aa(seqidno:33)的比对。

与全长bt302(seqidno:18)(其中它最近的cry家族是cry19ca,cry19ca与其全长具有47%同一性)相比,对于截短的bt302cry蛋白(seqidno:28)鉴别出的最近的cry家族是cry39aa。将bt302与cry39a和cry19ca进行比对显示出bt302的n-末端(seqidno:28)与cry39a具有54%同一性(参见表4),并且bt302的c-末端(seqidno:29)与cry19ca具有53%同一性(参见表5),这表明组装的bt302核苷酸序列是cry39a和cry19c蛋白之间的杂合体。

表4.bt0302的n-末端(seqidno:28)与cry39aa(seqidno:34)的比对。

表5.bt0302的c-末端(seqidno:29)与cry19ca(seqidno:35)的比对。

与全长(seqidno:20)(其中它最近的cry家族是cry4ba,cry4ba与其全长具有62%同一性)相比,对于截短的bt485cry蛋白(seqidno:30)(其与其全长形式具有62%同一性)鉴别出的最近的cry家族是cry50b。将bt485与cry50b和cry4b进行比对显示出bt485的n-末端(seqidno:30)与cry50b具有70%同一性(参见表6),并且bt485的c-末端(seqidno:31)与cry4b具有75%同一性(参见表7)。cry50b和cry4b与其全长仅具有51%同一性(参见表8)。因此,组装的bt485核苷酸序列似乎是cry50和cry4之间的杂合体。本领域已知cry4b和cry50对双翅目昆虫,特别是蚊子具有活性(zhang等人2012.characterizationofanewhighlymosquitocidalisolateofbacillusthuringiensis--analternativetobti.[一种新的高度灭蚊的苏云金芽孢杆菌分离物的表征-bti的替代品]j.invertebr.pathol.[无脊椎动物病理学杂志]109(2),217-222),并且没有明显的针对鳞翅目昆虫具有活性的报告。

表6.bt485的n-末端(seqidno:30)与cry50ba(seqidno:36)的比对。

表7.bt485的c-末端(seqidno:31)与cry4ba(seqidno:37)的比对。

表8.cry4ba(seqidno:37)与cry50ba(seqidno:36)的比对。

实例3.重组宿主细胞中的bt蛋白表达

芽孢杆菌属表达。经由设计用于在大肠杆菌和bt两者中表达的指定为pcib5634`的穿梭载体,在没有可观察到的背景杀昆虫活性的无晶体(crystalminus)苏云金芽孢杆菌(bt)菌株中表达实例2中描述的cry蛋白。载体pcib5634`包括驱动经克隆的btcry基因的表达的cry1ac启动子和红霉素抗性标记。经由电穿孔将包括目的cry编码序列的表达盒转化进宿主bt菌株中并且在含有红霉素的琼脂平板上选择转基因bt菌株。使所选择的转基因bt菌株在t3培养基中于28℃下生长4-5天至孢子形成阶段。收获细胞沉淀并且在溶解于含有2mmdtt的高ph碳酸盐缓冲液(50mm)中之前反复洗涤。

大肠杆菌表达。使用pet28a或pet29a载体(默克公司(merckkgaa),达姆施塔特,德国)在大肠杆菌菌株中表达cry蛋白。通过电穿孔转化构建体并且在含有卡那霉素的琼脂平板上选择转大肠杆菌克隆。使所选择的转基因大肠杆菌菌株生长并且使用iptg诱导在28℃下诱导cry蛋白表达。将细胞再悬浮于含有2mmdtt的高ph碳酸盐缓冲液(50mm)中并且然后使用microfluidicslv-1匀浆器打碎。

表达分析。然后经由离心澄清来自转基因bt或大肠杆菌菌株的所得细胞裂解物并且使用bioradexperion系统(伯乐公司(biorad),赫拉克勒斯,加利福尼亚州)经由sds-page和电泳图分析样品的纯度。经由布雷福德(bradford)或赛默(thermo)660测定来确定总蛋白浓度。然后在以下描述的生物测定中测试经纯化的cry蛋白。

实例4.cry蛋白在生物测定中的活性

使用本领域公认的人工饲料生物测定方法针对以下鳞翅目有害生物物种中的一种或多种测试实例3中产生的cry蛋白:亚洲玉米蛀虫(acb;亚洲玉米螟)、棉螟蛉(cbw;棉铃虫)、黑色地老虎(bcw;小地老虎)、欧洲玉米蛀虫(ecb;欧洲玉米螟)、秋黏虫(faw;草地贪夜蛾)、玉米穗蛾(cew;玉米穗虫)、甘蔗螟(scb;小蔗螟)、西南玉米蛀虫(swcb;西南玉米螟)、大豆夜蛾(sbl;大豆尺蠖)、以及烟夜蛾(tbw;烟芽夜蛾)。

向24孔平板中的人工昆虫饲料(bioserv公司,弗伦奇敦,新泽西州)的表面施用等量的溶液中的蛋白质。在饲料表面干燥之后,向每个孔中添加有待测试的昆虫物种的幼虫。将这些平板密封并且保持在就温度、光照以及相对湿度而言的环境实验室条件下。阳性对照组由暴露于非常具活性且广谱的野生型芽孢杆菌属菌株的幼虫组成。阴性对照组由暴露于仅用缓冲溶液处理的昆虫饲料的幼虫和未处理的昆虫饲料(即只有饲料)上的幼虫组成。约120小时之后评估死亡率并且相对于对照评分。

结果示于表9中,其中“-”意指与对照组相比无活性,“+/-”意指与对照组相比0-10%的活性(此类别还包括具有强烈幼虫生长抑制的0%死亡率),“+”意指与对照组相比10%-25%的活性,“++”意指与对照组相比25%-75%的活性,并且“+++”意指与对照组相比75%-100%的活性。表2中的名称“nt”意指没有针对该具体有害生物测试所指示的蛋白质。

表9.cry蛋白的生物测定结果。

实例5.针对植物表达的基因定向

在植物中表达之前,在自动基因合成平台(例如,金斯瑞公司(genscript,inc.),皮斯卡塔韦,新泽西州)上合成编码cry蛋白bt264(seqidno:16)、bt288(seqidno:17)、bt302(seqidno:18)、bt454(seqidno:19)或bt485(seqidno:20)或者突变型cry蛋白mbt264(seqidno:21)、mbt288(seqidno:22)、mbt302(seqidno:23)、mbt454(seqidno:24)或mbt485(seqidno:25)的多核苷酸。用于这个实例,制备包含可操作地连接至cry蛋白编码序列(该编码序列可操作地连接至终止子)的植物可表达型启动子的第一表达盒,并且制备包含可操作地连接至选择性标记(该选择性标记可操作地连接至终止子)的植物可表达型启动子的第二表达盒。选择性标记的表达允许在选择培养基上鉴别转基因植物。将两个表达盒克隆进适于农杆菌介导的水稻或玉蜀黍转化的载体中。

实例6.cry蛋白在玉蜀黍植物中的表达与活性

未成熟的玉蜀黍胚的转化基本上如在以下文献中描述的来进行:negrotto等人,2000,plantcellreports[植物细胞报告]19:798803。简言之,使包含描述于实例5中的表达载体的农杆菌菌株lba4404(psb1)在28℃下在yep(酵母提取物(5g/l)、蛋白胨(10g/l)、nacl(5g/l)、15g/l琼脂,ph6.8)固体培养基上生长2-4天。将大约0.8x109个农杆菌细胞悬浮于补充有100μmas的ls-inf培养基中。在这个培养基中对细菌预诱导大约30-60分钟。

将来自近交玉蜀黍系的未成熟胚从8-12天龄的穗中切除到液体ls-inf+100μmas中。用新鲜的感染培养基漂洗这些胚。然后添加农杆菌溶液,并且将这些胚涡旋30秒并且允许其与细菌一起沉降5分钟。然后将这些胚盾片向上地转移到lsa培养基中,并且在暗处培养两到三天。随后,将每皮氏板(petriplate)大约20与25个之间的胚转移至补充有头孢噻肟(250mg/l)和硝酸银(1.6mg/l)的lsdc培养基中,并且在大约28℃下在黑暗中培养10天。

将产生胚性愈伤组织的未成熟胚转移至lsd1m0.5s培养基中。在这种培养基上对培养物进行持续大约6周的选择,在约3周时进行传代培养步骤。将存活的愈伤组织转移至补充有甘露糖的reg1培养基中。在光照中(16小时光照/8小时黑暗方案)培养之后,然后将绿色组织转移至没有生长调节剂的reg2培养基中并且孵育约1-2周。将这些小植株转移至含有reg3培养基的magentaga-7盒(马真塔公司(magentacorp),芝加哥,伊利诺伊州)中并使其在光照中生长。约2-3周之后,通过pcr测试植物的选择性标记基因和btcry基因的存在。将来自pcr测定的阳性植物转移至温室用于进一步评估。

在叶切除生物测定中,针对拷贝数(通过taqman分析确定)、蛋白质表达水平(通过elisa确定)和对抗目的昆虫种类的功效对转基因植物进行评估。确切地说,从单拷贝事件(v3-v4阶段)中切取植物组织(叶或花丝)并且用靶标有害生物的新生幼虫侵染,然后在室温下孵育5天。针对一种或多种鳞翅目有害生物如亚洲玉米蛀虫(亚洲玉米螟)测试来自表达bt264、bt288、bt302、bt454、bt485、mbt264、mbt288、mbt302、mbt454或mbt485的转基因植物的叶圆片。转基因植物组织生物测定的结果将证实当在转基因植物中表达时本发明的cry蛋白对于目标鳞翅目有害生物中的一种或多种是有毒的。

序列表

<110>syngentaparticipationsag

syngentabiotechnologychinaco.,ltd.

huazhongagriculturaluniversity

sun,ming

mei,wenqian

seguin,katherine

bramlett,matthew

<120>用于控制植物有害生物的组合物和方法

<130>81292-cn-reg-org-p

<160>37

<170>patentinversion3.5

<210>1

<211>3522

<212>dna

<213>苏云金芽孢杆菌

<400>1

atgggaggaataaatatgagtccaaattattcagatgactatgaaatcataaatgctcca60

tcgaatacttctccaagatatcctttagtacacgatctaactccacaattccaagatatg120

aattataaagattatttacgaatgacggaggggaataggggtgtttccgctacatcagta180

agatcaggtggtgaagcaattgatgctgcactctctataactgcaattttgctaggtgtt240

ttaggtcacccagttggttctgcggttgttggtacttttaatgctcttttaggcttattg300

tggccgaatggtcaaacaattgtatgggaagatttattagcaaaagcagaagattttgct360

aataaagtcataacagcggaaataagaagtaatgcattctcagctttaaatgtatcatac420

gcaatggtatctgagtatacaagcgcgttaaatgattggatagaaaatccaggagtacgt480

atatctcaacaactaatgagagagatatttactaatacagtactccaattagctagtcag540

atgccatattttaatgtagctggttatgaaacatcattgttaacaatgtatgcacaagct600

gccaatttacatctatctgtattaaaagatatattcatttttgggaaagaatggggattt660

cctcaaactgacattgatttttattattatgaggaattcatagatcatcttcctgtatat720

gttgatcattgcacgaaatggtataatgaagggttaaacaacttaccaaagtcaaactct780

tatgattggtataactataataaattccgtagagaaatgacattaatggtactagatatt840

gttgctttatttccaagttatgatgcatatgtatatacattggagacaacaacagagctt900

acaagaatagtttatacagatccacttgggattatgatacctccacctccaggatatgag960

gaaatggttggttatggtggtaatcttgattggcgtaattatggttttagcttctcatat1020

ttagaaagtcaacttcgacagcctgttctgtttagttggttaaattcaataaaaatgtat1080

acgagaaaaataatatgtgaggctggtactccccacagtctttggtcagggaatgagata1140

aatctatcttatacatcagatccttcaaatacttttacgcttcagagtgggtatagtact1200

ggatatacacatacagatttcctagatatcaattcaaaagatatttatgaagttgtttca1260

aaaataggttcagaggcagttgttggtccgggagacgattcttatctctatggattgtat1320

caagcagcttttcggatcatacctaaagatagttctgcatattcttatctttatcctaca1380

tatgacattggcatgaatggttattctatgagctcactggtagaattacctccggaatcg1440

tccgatccacctcaaccggatgaatatacgtatactcatagattatcttacgcgacactt1500

cttagcgtgcacagttatacttctgatttttttaatgatggagcgattcctatatacggt1560

tggacacatagaagtgtaaatcgtgataatcaaatttacccagatagaattacgcaaatt1620

ccagctgtaaaaggaaaacagttaatagagggtgcgagtgttcataaaggacctggatcg1680

actggaggagatttagttagactttatttaaatgatagagtttatctaaatgttaacgta1740

gactcagtatcacaaaaatatcgtgtaagagttcgttgtgctacttacaatcctggttct1800

atatatttgtatcgtgataatactataattagttctgctacagctccaaagactacggat1860

acaacagatactactcaaattaaatttaatgactttcaatatataacttttagtgatatt1920

tttacatttactagtacttggcaacaaatatctataggtgcaggtacaacatatgcagaa1980

gtgtatatcgacaaaatcgaattcatcccagtgaatgagacatatgaagcggaaagaaat2040

ttagaaaatgcgaagaaggcagtgagcgcattattcacaggtacgatggatacattaaaa2100

agagaagtgacagattatcaaatcgatcgggcttcgaatttaatagaatgtgtgtcagat2160

gaaatgtatggaaacgataaacgactgttatttgaagcggtaaaaaccgcaaaacgattg2220

agtcaatcccgtaatctacttcaagatctaaattttgaaatgttaaataccagcggtaac2280

ggagaaaatggctgggtcggaagtacaggaatacaagttgtagaaggagatgcgctattt2340

aaaaatcgttccctgcgtttaccaggtgcgagacaatttgatacagaaacatatccaacg2400

tatctgtatcaaaaaatagaggagtctaaattaaaaccatatacacgatataaagtgaga2460

gggtttataaaaggtagtaaagatttagaggtagatgtgatgcgatatggcgcgaaacag2520

aaagtgttgaacgttccaaataatttaaatccagatatcattcctataaatgcttgtgga2580

gacgtggatcgatgcagacaacaacaagcagtcaatgcgcgtttacaaccagcaaccatt2640

tcaccgtgtgaggggggagataccaatacttccgcacatgcattttcattctcgattgat2700

acaggtgccatcgatacaagtgaaagaccaggaattggcgtggcgtttaaaattgcgaca2760

ccagaaggttacgcatcactaggaaatctagaagtgatagaagaaggtccactcacagga2820

gaagcgttagcacatgtgaaacaacgagaaagacaatggaaagacaaaataacaaaaaaa2880

cgtgcagaaacagaaaccatttatacaagagcgaaacaagcaattaataatttgttcgca2940

gattatcaagatcgacaattaaagcatgatgtagagattccaaatattattgcggcagac3000

cagattgtagagtctattcgtgatagatataatgaatggattcctgcaattccaggaatg3060

aattatgaaatctacacagagctaaaaaatagaatccaacgagcatatgctttatatgat3120

gctcggaatatcatcaaaaatggagacttccgaaacggattagcaaattggaatgcgacg3180

cctggtgcaagagtacaacaaatgaacgggaatccagtactagtcattccaaattgggat3240

acgcaagtttcccaaagtgttcctgtagaaccaaatcatagatatctgttacgtgtaacg3300

gcacaaaaattaggtgctggaaacggatatgttacagtgacagatggtacaaatcataca3360

gaaacattgacatttgatagatgtgataataatacaactggatctaatcgatatgtaacg3420

aaaacaattgaatttaccccacgtacaaatcaattacaagttgaaataggtgaaacagaa3480

ggaacattcaacatagaaagtgtgaatttgctcggttgttaa3522

<210>2

<211>3573

<212>dna

<213>苏云金芽孢杆菌

<400>2

atgactcaaaataacaatgaatatgaaattatagatcaaaatacttcaccttattcttct60

aacagaaacaataataactccagatatccctttgcaaataatccaaatcaagcattacaa120

cagactaattacaaagattggatcaatatgtgtcaaaaaaatcaacaatgtggtgaaaat180

cttgaaacgtttgctagtgctgatacaattgccgcagttagtgcaggtgttattgtagta240

ggcactatgttaggagcttttggtgcccctgttacaactggtcttattatatccttcgga300

acactattgccgattttttggggaccaagtgaagatcctaaaaaagtatggaaagaattt360

ttaacaatcggaaatagaccttttggttcagaagtagatcaaggtataattgatttacta420

tatactaaagtaaatggcttaagatcgcaatttgaagactttcaaaggtattttgatcta480

tggaaaaataataaaaatccagtcaatgctgatgtagtaagacaaaaatttctttcattg540

gattctgatgtaataagagaattagaaacattaaaaggaaactattatataacgttactt600

cctggttatacacaagtagctaattggcatttaaatctattacgacaagctgcatattat660

tatgacgaatgggcaccttcatctaacttatcaatacaaagtatatatcctcaggattac720

actaacgatcttcagacttgcttagataattgccctagcgaaagtggtaataaggtatct780

tctgcatactataagtgcatattaaaatgtagaattaatgaatatattaattattgttca840

aaaacatatcaagaaggcttaaataaacttaaaaattcaagtgatataaaatggaatata900

tataatgagtatcgtagagaaatgactttaactgtattagatcttattgctgcttttcca960

aattatgacctagaaaaatatccaataggtactaaatgtgaacttactagagaagtttat1020

acaaatgctttgatggggtctagttctatgtctatagcagaactagaaaaatcactaaca1080

aaagatccttttttgattacttggttaaataaaatattgctttatacaagaaattataag1140

caacctactactgaggatgtttttgtttttactggcaatcagcttcgttattcatttaca1200

atggattcaaatttagggtatagtggattttatggtgatgttagttatactgatgacaca1260

gaacaaatacttgaaatcccgggcaattcacaaattgttaaggtagaagttgaaaggcac1320

agagactctcctgatataatatggaaaattgattttcatttaaataatggagcagtatta1380

aagtataattcaggttcaacggcagatccgaattttagagtaagggacgttttaacgatt1440

cctccagatagtaaaggcaatgcaagtcattttttatcctatatgaaaagtgcttatgtt1500

acatcagatgttaaacaattaagaagagtttcatttgcttggacacataatagtattaat1560

tataacaatgagatttataatgatataattacacaaattgcagctgtaaaaggccattac1620

ctcggcctcgaaggtttagcttcccgagtcattcaaggtcctggtcacacaggtggagat1680

ttagttgatttaaaagatgacctacgccttgcatgtcaacactctggtactcaacaatct1740

tattatatacgaatccgttatgcttctgatggagatactagaatcgtccttgtaatccca1800

ttaatggaatcacaaaatattccactcaaatcaactttttcgggtgtaaatcatgatgaa1860

ttaaaatataaagattttgggtatgttcaatttccaggggaaataacattaaatcaacac1920

tcaaagataactcttatttttcgtcttcaagatatatattcaaatataagtgtattcatt1980

gataaaattgaatttatcccaatcactagttctattcgagaaaacagagaaaaataccaa2040

ttagaaaaagcgaaacgagcagtagatgatttatttataagtgctaaaaaacaaaatata2100

aaaattgatatcacagattatcagattgatcaaactgctaacttagtagactccctatca2160

gaagaaccatatccacaagaaaaaatgatgttactaaatcaaatcaaatatgctaaacaa2220

ctaagtcaatcacgaaatttacttagtaatggagattttgaatctttaattggctggaca2280

acaagtagtagtattactgtccaaactggtaatactatttttaagggattttctctccat2340

atgctaggagcaagaacaacagaaattaacgctactgtattcccaacttatgtatatcaa2400

aaaattgatgaatcaaggttaaaaccttatacacgttatatagttcgaggattcattgga2460

agtagtaagggtttaggaatatttgttacaagatataataatgtaccagataaattagcc2520

tatataagatctacaaattcttgtggagaattaaatcaatacgaatcgcaaaattattct2580

cttgtaagtgaaaataattctacaatgagtctacaaaacataacagcatcaaatgatact2640

tcatgtctatcggaaaatttacgttattgtgaaccaaatcagttatatccgacatgtcat2700

aacttacatgatttttctttttctatagacacaggagaattagatttcaatgaaaaccca2760

ggtatctggattctattcaaaatctctaatccggatgggtatgctacattaggtaattta2820

gaagtaattgaagaaaaaacattagttggagaagaaataaataatgttaaagaaaaagga2880

aaaagatggaaaaaagaaatggatactaaacaaacaaaaacagaaactgcattttctcaa2940

gcccaacaagcagttaatgggttatttatgaatacacaatattcaatgttaaaaatagaa3000

acaactatgcaagatattgttacagcagataacctcataaatgagattccatatgtttac3060

gacgaactgttacctaatgaaccagcaggtaggaattataacatgtttatagaattaaaa3120

aatcaaatctcacaagtatactctttatataatgccagaaacatcattcaaaatggtaac3180

tttaacaacggcttaaaaaattggcacacatcaccggatgccaaagtacaaaaaatagat3240

aatacctctgtacttgtcattccaaactggagtacacaagtatctcaacacaccaactta3300

caacaaaatcaacgatatctattacgtgtcacagcaaaaaaagaaggaatgggaaatgga3360

tatgtaaaagtgagtgattgtgcaaataatgtagaaacactaacatttaaatccagtgat3420

atcactaacaacaatatgtggaatgaatctataggctacatgaccaaaacaatgtatatc3480

actccacatactagtcaagtacgcattgatataggagaaacggaagggaactttaaaatc3540

aacagtatagaacttatttgtataaaaaactaa3573

<210>3

<211>3579

<212>dna

<213>苏云金芽孢杆菌

<400>3

atgagtagtggaggaacgaatatgaattcaaatcgtaataaaaatgaatatgaaatacta60

gatgcatcatcaagtacatctaacatgacgaatcagtattcaagataccctctggcaaat120

aatccacaggcttttatgcgaaatacgaattataaagattggttagctatgtgcgaaaga180

aatgatactggagttttagaaaatcccgaagtattgagcttaagaggtgcagttggtact240

ggagtgagtatcgtcggcatgatttttagcttaataggtattccagttattggggaggta300

gttggaatactagtatcattaacaaaccttctttggccagaatctgaaggaagtgcacaa360

tacacttggcaagaacttatcactcatgtagaagagcttatggatcaacgaataggagag420

acgcaaaaagctaatgcacttgcaaaattatcaggtttaaaagctcaagtagctgcatat480

aatcgggctcttgaggattgggaaaaaaatccgaattcaagatctgcatctgaagtaata540

gctagattccgaagtactaacaatgattttgtaggatctatgcctcaattttcgcctaat600

ggttacgaaatattattattgtctgtatatgcacaagctgcgaatctgcatttactatta660

atacgagatgctactatttatggaagtcagtgggggctatctcaaggtgacgtcaatcta720

tattacaatgaacaactactgtatacaaaacaatacgttaatcattgtgttacctggtat780

aacaatggcttagctcaacaaaaagcattgttcgctacatcaccaaactggaatcgattt840

aatgcttatcgaagagacatgacaattaacgtattagatctcattgcactattcccaatt900

tatgacgctcgtttgtatccgcaaccagtaagggcagaacttacaagagaaatctattca960

aatatattgaattcggatgtgtacggagtacaatgggcagattttgaaaaaaatgaaagt1020

acattcacacgcccaccacatttatttacgtggttacgaaaatttgacttttacacaaga1080

actaagtattacaaccaagggctagggtggctatttttaggggggcatacaaactattat1140

tcgtatacgaatagtagtaaccttaaatcaggatcttataataatttttggggttcagat1200

atgcaaacaagtacacttactattccagataacccttctatttataggttgtggacaaaa1260

agttatacgcatatctatccatatacagatccggttaacatcacgcaaatgcaattttat1320

ttaacaaataatcaacagttaacttatacggctacggctaaccctcggtatcctgtacgt1380

gaaacgaattttgaattaccatctaccgatgagaatccgctaacttatcaaaattatagt1440

catattttatcttatatgataagttcacaacatttcggggataaaagatctggatataca1500

tttgcttggacacataatagcgtggaccctactaatactcttgccccaaataaaattaca1560

caaatcccagctgtgaaagctaatactctggaaggtaataaatcttttgttgtaaaaggt1620

ccaaatcatacaggaggggatttagtaattcttgaggctgaaccaggtccagtttatcct1680

attgtgtaccgaggagtaatgggaattacttgtaaggttacacaagctcagaattatcgt1740

attcgtattcgttatgcttcaaatggtggtgctcaaatggctatcagtttaagaaatcgc1800

ggaactggtacggtttttactgtaagtaaaacttatacaggtaatagtattgaaaactta1860

cagtataatgattttcaatataaggatatgcctgttattttggaagcaagtcaatatgaa1920

cccaacaattccatatatgtatatttatatcaggagagtccatatatacaagtaattatc1980

gacaaaatcgaatttattccaattgatacaacttctcaagaatatgaagaaaaacatcaa2040

ctagaaaaagcaaagaaagcggtgggagtcttgtttaccaatgatgcaaagaaggccctg2100

aaaatagatacaactgattatgatgtggatcaagcggcaaacttgatagaatgtctgtca2160

gatgaacaatacgcaaaagaaaaaatgattttattggatgaagtaaaatacgcaaaacaa2220

ctgagccaatcacgaaatttgcttcaaaatggagactttgaatcttctgaaattggatgg2280

gaaacaagtaatactatcacaattcaagcgggtaatcttatcttcaaaggtaagtatctc2340

aatatgtcaggtgcaagaaatatagatggcgctatatttccaacctacgcattccaaaaa2400

gtagatgagtcaagattaaaaccatatacacgttataaggtgagaggatttgttggcagt2460

agtaaagatgtagaagtggtagttacacggtatggtgaagaagtagatacaataatgaat2520

gtaccaaatgatttaacatatgatgtaggttctgttaaatcttgtggagaatggaatcga2580

tgtgaacaacagccatatcaaaataggaaccaagtgttaaacaattctatgataattgct2640

aatacttctaatgcatcaaactcttgtgaatatgtaccagagaaaaaacgtgtaatgtgc2700

ccagaaccacatcaattttctttccatgttgatacaggagaaactaatttgaacgaaaat2760

ttagggatttcggtcttatttaaaatttcttcaccagagggttacgcaatattagataat2820

attgaattaatcgaagagggttcactggtaggagaatcgttggcttatgttcaaaatcga2880

gaaaagagatggaaaaataaaatgcaagcagaacgtatggaaacacagcaagcatataat2940

atcgccaaacaagtagtcgatatcttatttactgatcctcaagatacagcattaaggttc3000

gaaacgaataaatccaacattatttcagcagatgagcttgtgcagtccattccttatata3060

tacaatgactggttacgagatgtaccaggtatgaattacaacatgtttacagaattaaaa3120

ggccggatcacacaagcatactatttatatgatgatcgaaatgtgcttcaaaatggagac3180

tttaataatggactcacatcttggtatgttacaggaaatgcagaagtacagcaaatagat3240

ggtacatttgtattagtgcttcaaaattggagtaccactgtttcacaaaatgtttgttta3300

caacacaatcgtgggtatgttttacgggtaaccgcaagaaaagaaggcatgggaaatggg3360

tacgtgacaatgagtgattgtgcaaatcatatagaaaagattatatttacttcttgtgat3420

aataatatagttgttacatcaactgactctgcagaatatgtaacacgaactgtctccttc3480

ttcccagatacagaccacgtacgaattgaaattggagaaaccgaaggtacttttaaagta3540

gaaagtgtggaattgatttgtatggaggggaaggaataa3579

<210>4

<211>3606

<212>dna

<213>苏云金芽孢杆菌

<400>4

atgaatcagaatattgcagcagtgcgagaggcagtcaatgctttgttttcaaatcatacg60

ttacaattgaaagtcacggattatcatgtggatcaggtggcaaagttagtagagtgtata120

tctgatcagaaccattcaaaagaaaaaatgtgtttgttagatcaagtaaaattggcgaaa180

cgattgagtcgagaacgtaatttgttaaactatggtgattttgaatcatcgaattgggct240

ggcgcagatggatggaacatcagtgctcatgtatacacgatagctgataatctaatcttt300

aaagatcattatctcaatatgccaagtgtaaataatcccatattaagtgataaaatattt360

ccaacgtatgcctatcaaaagatagaggaatcaaagttaaagccgtatacccgctatatg420

gtacgagggtttgtaggaagtagtaaagatttagaaattcttgttgcaagacatggtaaa480

gaagtgcacaaaagaatgaatgtaccgaatgatattataccaacaaatccatgtacagga540

gaacttgtatcgcaaccacccccgtatcctgttatgccaatccatacgatggcccaaaac600

atgtggtgtaatccatgtgagaatggctatcagactgcagcagggatgatggttcaagag660

acaaatatggtgtgtcaagatccacatgaatttaaattctctattgatataggtgagatc720

gatagggagcgaaatttaggcatttggattggttttaaagtgggaacaacagaggggatg780

gcgacactagatagtatagaagtagtagaagtaggaccgttaacgggagatgccttaaaa840

cgtatgcaaaaacgtgaacaaaaatggaagaaaaaatgggcagagaaacaaatgaagatt900

gaaagggctgtgcaaatagcacgaaatgcgattcaaacattattcacagatccaaatcaa960

aacagactacaatccgctattacactgaaaaatattgtagatgcagaaaaatgggtacaa1020

aagattccatatgtatacaatcaattcttgcaaggggctataccagaggtaccaggtgaa1080

caatacaacgtcttccaacaactttcccaagcagtggtgacagcacggggtctgtataat1140

cagcgaaatgtgataaacaatggagatttctctgcgggattgtcgaattggaatggtacg1200

aaaggtgcagatgtacaacagattggaaaggaatctgtgctaatgatttccgattggagt1260

gcaaatatttcgcaacaggtgtgtgtggagccagaacatagctatttattacgtgtaacg1320

gcaagaaaagaaggttctggtgaaggatatgtgacaattagcgatggaacgaaagacaat1380

acagagacactgaagtttatagtcggtgaagagacgacaggtgcgacaatgtctactatt1440

cgttcccatattcgtgaacgttataatgagcgcaatatggtgacatcagaagtctatgac1500

gcaagcgggtatgcgagcaatcaaaatatggtgaattactcatcagaaaattatggaatg1560

agtgcatattcaggaaataacaacaagaattatcaatcagaaagctttggatttactcca1620

tatggtgatgaaaatagtatgatgaactatccatcagaaaattatggggaaaatgcatat1680

tcaggcaacgataatatgaattatccatcaaacaattacgaaatgaacccatactctagc1740

gatatgaatatgtcaatgaatcaaggatcggattgcagatgtggatgcagcacaaactca1800

tatccaggtggagatatgacgatgaataactatccatctagcatgtatgaaacgaatgca1860

tatccaagtagcacgaacatgaccgataatctgggaatgggctgtggatgttattacagt1920

acaaatgaacatccgatggtagaacaaagtacccttgacctttctgattatgtaatgaaa1980

acagttgaaatcttcccagaaacgaatcgtgtatgtattgaaattggcgaaacagcggga2040

atatttatgatagaaagtattgaatttgttccggtaaatccgattgaatcagtacccgag2100

cctggtcctggtatctatcagagtgttacagctttaaataatagtagtgtagtagagatg2160

gcgtcacaaggagcgaggaatgtaatcaaggcacttccacaaaatgcgtcaaatatagag2220

ttagagtatgctcctgtgtatgactacgacacagacgggtgttatgcgactgcagcaatt2280

tctccagatggcacgactaaccctggactaggtatgggcgatagcccgagcagtggctgt2340

agaggtcctgcacaactagaaaattcaaacacttattctcgggccaaatcaaataatggt2400

tggactgcaattatgtatgcgagttactttgagaaagatcaaacatctctcggccctggt2460

tcggctggacatcgacatgactgggaacacacaatagtttgggttaaagatggtcaggtt2520

caatatgtaacttattcagcacatggtaactggtacactaatcctcgctcaaacgtcaga2580

ttcagtggaaaccatccgaaaattgtataccataaggacagcatctcgacacatgctttt2640

cgcttggctaatagcaatgacgagccgccagaaaactattaccaccagtggcttcttcta2700

ccaatagttggttggtatggctatccaagccgggctattcgagaaaaactaatgactacg2760

aactttggatctgcaacaattgagatcaaagatggaaattttgaaagggcccttgagaaa2820

gcaaagccacccattaactttgacccttacgcaccggaactggaagatggtggtgcttat2880

caaatagtttctactttaaataatagaagtgttgtagatatggacccaccaagtaaaaat2940

gttcacttatgggagaatggtaacgctaataatcaaaaatggaagctagtatatgattca3000

attaaatcagcataccaaatgaaaaatatagcaaatgaaaatctagtattaacttggaat3060

gatcttaatggttctattaatgtaattgctacatctaatcaaaatcaggaagagcaatat3120

tggataccaacagaagcaggaaatggatattattatgtaaggaataagaaggacccaaac3180

aaagtgttagatgtaagtggttatggtactgcaaatggaacaaatgttacagtatataat3240

gtccatggtggtaataatcaaaaattcaaattgtctaatgtaacaggaattttaacaaga3300

gaagtggagtcactctataaggcacagcctggtcaaagcagtagatcaagtaataatttt3360

tcacttgaacatcttgcggcaggtaccaaagtacgagttattttagcaggagaaggtgct3420

acctctttgtcatttaacatttcaagagataaatcaggtacagactctagcatttggtca3480

aatgttagagatagttctgttctaacgatcccttcaggagatgatagaaagaatttgtat3540

atctcaggtcctcctagcggatacacttctaatggtacatttacagtgaaattctacgct3600

ctttaa3606

<210>5

<211>3441

<212>dna

<213>苏云金芽孢杆菌

<400>5

atgaatcaatataacaatacgaataatgaaataattgatgcttctacaaagagatctcct60

caatacccactagcaaataacccacaaaattctataaaaactacgaactataaagactgg120

attaatatgtgtgaagggaatgcagaagcattttttttaactgatgaacaaatggtttct180

attgttggagctgcaatttctaaacttcttggatttgtccctgtggttggagacatttta240

agcttcttggcggatacgtattggccaaaaattgcaggacaagaggtagatacaagagtt300

tgggcaggattgataagacatacagcaaatttaatagacaatagagaagctgaaaaagta360

atagggcaagcgacgactaatttaatgtcactctacggagctttaggtgtatataataga420

tttcttgagcaatggaaacagaatgaaaagtcgtttgctaacctcgctgatgaagtacga480

acacagatgtctgctcttcaccttctatttacgacaaaaattattagtgatttcacgtta540

cacggttatgaatcaatattactaccttcatacgcaagtgccgcgaatctgcacttacta600

ctattgcgcgatattgcaatttatggagaaagattaggttttgatccaaaggttctgcaa660

gcttatcatgatgaacaagtgcttttcacaagacaatatacagctcattgtataaatacg720

tacaatttaactttaaacgcacaaaaacctagaggttgggtagctttcaatcaatatcgt780

agggatatgactttgacagtactagatctaattgcattatttccaagttatgatacacat840

aaatatcctgtagataaaaaaaatgtaaaaaaactgtcaacaactgaatttacaagagaa900

atttatacagcattaatagaacctaatcctaataaaacagtagaaggaatggaagcatca960

cttacaagaactccccatttatttacttggataaagagattagacttctatacaaatact1020

ttatacccagatttacgatacctatctgctaatagaattgggttttcatatacaaattct1080

tcaacaatacaacaaagtggaatctatggagactctggtttcggttcaaatctcactcac1140

caattgccgataaatccaaatatatttaaatcctctatcactgatactagatcaccctct1200

aatcaaattacaaaaatggatttttataaaactgatggaactcaagcatcttataattca1260

ggaataacgccaactcctggggatttaagaaccacattttttggattttcgacaaatgag1320

aacacacctaaccagccaagcattaacgattatacacattttttaacttatatgaaaacg1380

gatgttatatcaggtggagcaccaaaaagagtgtcattggcttgggcacataagagtgtt1440

aatcttaacaaccaaatattcacagatgatatcacgcaagttccagctgtaaaatcaaat1500

gttttaaatacgcaagctaaagtaattaagggacctggccatacaggtggagatttagtt1560

gctattaccagtgacggtgttttatctggaagaatggaaatccaatgtaaagcaagtgtt1620

tttaatgaacctgaaagaaggtatggtttacgcatacgttatgctgcaaatagtatatta1680

acagtaaatgcatcctatacatctcaaggcaatactagatcaataacatttactacagaa1740

tctacttttacaggaaatacaataccaacagatttaaaatatgaaaatttaaaatacaaa1800

gaaccttttgatgcgattcttccaatgcgtttaacttctaatgaattaacaaatataact1860

attcaaccacaaaatatgtcgtcaaatcaattattgatcattgacagaatagaatttatt1920

ccaatcacttcaactgtcttaggtgatacagagaagcaaaacttagaaaaagtacagaaa1980

gctgtgaatgatttgtttactaatactgcgaaaaatgcgttgaaagcagaaacgacagat2040

tatgaaatagatcaaaccgcaaatatagtagagtgtttatctgatgaacactctacaaaa2100

gaaaaaatgatattgttagatgaagtgaaatatgcgaaacaactaagccaatctcgaaat2160

gtactccaaaatggggattttgaatctgatacgcttggctggacaacgagcaataatatt2220

acaattcaagccgataatccgatttttaaagggaagtatcttcatatgtcaggggcaaga2280

gacattgacggatctgtatttccaacttatatttaccaaaaaattgatgaatcgaaatta2340

aagccctatacacgctatcgagtaaggggatttgtgggaagtagtaaagaactagaatta2400

gtcgtttcgcgttatggagaagaaattgatgcgattatgaatgttccgaacaaattggta2460

gatatgtatccacctgcttctgattgtgggggtcttaatcgttgcgagatatcctctgct2520

cttgaaataaatcaggtggattacacgaatatgtcctatccatgtcaaaatgatggaaat2580

aaaaaacatgttttgtgtcacgatcgtcattcatacgattttcatattgatacggggtca2640

gtagacctcaatgaaaatatagggatttgggtcttgtttaaagtctcttccccggatgga2700

tatgcaacattagataatttagaagtggtcgaagaaagatcactcgatggggaagcattg2760

gcacgtgtgaaacaccgagaaaagaaatggattcatcaaatagaagtaaaacgttatgaa2820

acccaacaagcatatgacgcgacgaaacaggcaatggatgcattattcacaaatgaccaa2880

gatgaagcgttacaatttgatacaacattagcacaaattcagcacgctgatgatttggta2940

cagtccattccctatgtgtataatgaatgggtaccaagtgctccaggcatgaattatgac3000

ttgtatgtagaattagaagcacgagtggtgaaagcaaggtacttgtatgatacaagaaat3060

gtcattagaaatggtgatttttcagaaggattacagggttggcatgtaacaggcaatgca3120

aaagtacaacaaatagatggtgtatcggtattagttctatcgaattggagtgcaggtgtc3180

gctcaaaatatgtatgtccaacataatcatgggtatgtattacgagtaactgccaaaaaa3240

gagggtcatggaaaaggatatgttacgctcatggactgtgatgggaatcaagaaacactc3300

acatttacttcttgtgaagaaggatatgtcacaaaaactgtagatgtattccctgacaca3360

gatcgtgtacgcgtagatatcggagaaactgaaggtcctttctatatagaaagcattgaa3420

ttaatttgtatgaacgggtag3441

<210>6

<211>3519

<212>dna

<213>人工序列

<220>

<223>针对单子叶植物而优化的密码子

<400>6

atgggtggcatcaacatgtcgccaaactactcggacgactatgagatcattaatgcccca60

agcaatactagcccacgctatccgcttgttcacgaccttacaccccaattccaagacatg120

aattataaagactatctgaggatgacggaaggtaacagaggggtgtcagccacttcggtt180

cgctcgggtggcgaagctattgacgcggcgttgtcaataacagctattctgctcggtgtg240

ctcggacatcctgtcggcagcgccgttgttggtacttttaacgcactgctgggtcttctg300

tggcctaatggccagactattgtttgggaggatttgctggctaaagcggaggattttgct360

aacaaggtcattactgccgaaattagatctaatgcgttttcagctctcaacgtctcatat420

gcgatggtcagcgaatatacttccgctctcaatgactggatcgaaaaccccggcgtcaga480

atatcgcagcagttgatgagggagatcttcacgaataccgtgctgcaattggcctctcaa540

atgccttattttaatgtcgcaggttatgagacatcgctgttgacaatgtacgcgcaggct600

gctaacttgcatctgagcgttctcaaagatatttttattttcgggaaagagtgggggttc660

ccacaaactgatatcgacttctactactatgaagagtttatagaccacttgccagtctac720

gtcgaccattgtactaagtggtataacgaggggttgaataacctgcctaaatccaactca780

tatgattggtacaactacaataaatttaggagagaaatgacattgatggtgcttgacata840

gtggcgctgttcccgtcatatgatgcttatgtctatacattggaaacaacgaccgaactt900

acgcggatagtgtacactgatcctctgggcataatgataccccccccacccggttacgaa960

gagatggtggggtatggaggaaacctcgactggagaaactatgggttttcttttagctat1020

ttggaatctcaacttcgccaaccggtgctgttctcatggcttaactcgattaaaatgtac1080

actcggaagataatttgcgaagcggggacacctcatagcctttggtctggaaatgaaatc1140

aacttgtcgtacacatcggatccaagcaacacctttaccctgcaatccgggtattccact1200

ggttacacacacacggatttcctcgatataaactcgaaagatatctatgaagtggtgtct1260

aagattggctcggaagcagttgtgggtcctggcgacgactcgtatctttatggtttgtac1320

caagcggcttttcgcatcataccaaaagactctagcgcgtattcttatctctatccaacg1380

tatgacataggcatgaatggttactccatgtcctccctggttgaattgccgcccgaatca1440

tcggacccaccccagcctgacgaatatacttacacacaccggctctcttatgctaccctt1500

ctttcggtgcattcgtacacctctgatttctttaatgacggagcgattcctatatatggt1560

tggacacaccggagcgtgaaccgggataatcagatttatcctgacagaatcacacaaata1620

cctgctgttaagggaaagcagctcatcgagggtgcttcggtgcacaaaggtcccgggtcg1680

acggggggagacctggtccgcctttatctcaacgaccgcgtttatttgaatgtgaatgtt1740

gattcagtctctcaaaaatatagggtcagggtccggtgcgcaacttacaatcccggcagc1800

atctatctttatagagataacaccattatctcgagcgcaactgcccccaaaacgacggac1860

acaaccgatactacccagattaagttcaacgacttccagtacattacattctcagacatt1920

ttcacgtttacgagcacctggcaacaaatctctatcggggcagggaccacatatgctgaa1980

gtgtatatcgataagattgaattcataccggtcaacgaaacatatgaggcggaacgcaat2040

ttggaaaatgccaaaaaagcagtctcggctctgttcaccggaacgatggacacactgaaa2100

cgcgaggtgactgattaccagattgacagggctagcaatttgatagagtgcgtttcggac2160

gaaatgtacgggaacgacaagaggcttctgtttgaggcggttaaaacggcgaaacgcctt2220

tctcaaagcagaaatttgctccaggacttgaactttgaaatgttgaatacatcgggtaac2280

ggcgagaatggatgggtgggatcgacggggatccaggtcgtcgaaggcgacgctctcttc2340

aaaaatagatcattgcgccttccaggtgcacggcaattcgacacggagacttaccccact2400

tacctctatcaaaaaatagaagagagcaaactgaagccatacactcgctataaggtgaga2460

ggtttcatcaagggttctaaggatctggaggtcgacgttatgaggtacggcgcaaaacag2520

aaggtgctgaatgtcccaaacaaccttaaccccgatatcatacctataaacgcgtgcggg2580

gatgtcgacaggtgcaggcagcagcaggccgtgaatgcgagactccagccagcgacaatc2640

tccccttgcgaaggtggagataccaacacgtccgcacacgcgttctccttttcgattgat2700

accggagcaattgataccagcgagcgcccagggataggtgtggcgtttaagattgcgact2760

ccagaggggtatgccagcctgggaaatctcgaagtcatcgaggagggcccgcttaccggt2820

gaagcgttggctcacgtcaagcagagggaaagacagtggaaagacaaaattaccaagaaa2880

agagctgaaacagaaacaatatacacaagggctaaacaggcaatcaataaccttttcgct2940

gattatcaagatcggcaattgaagcacgacgttgaaattccaaatataattgccgccgac3000

caaatcgtcgagtcgatcagagatagatacaatgaatggattcccgcaatacctgggatg3060

aactatgagatatacacagagctgaaaaaccgcatccaaagggcctatgcgctctacgat3120

gctagaaacataattaaaaacggagattttaggaatggattggccaattggaatgcaacc3180

cctggagcacgggttcaacagatgaacggaaatccagttttggtcatcccgaactgggac3240

actcaggtgtcccagtcggtgcctgttgagcccaatcataggtatttgctgcgggtgact3300

gcacaaaagttgggcgctggtaatgggtacgttaccgtcacggacgggacgaatcataca3360

gagacgcttacgttcgatagatgtgacaacaacactacaggttcaaacaggtacgttacg3420

aagacgatcgaattcactccacgcactaaccaactccaagtcgagattggagagacagag3480

ggaacatttaacatagagagcgtcaatctgctcggatgc3519

<210>7

<211>3570

<212>dna

<213>人工序列

<220>

<223>针对单子叶植物而优化的密码子

<400>7

atgacccaaaacaacaacgagtatgaaatcatagatcaaaacacgtcaccctattcatca60

aaccggaacaataataacagcagataccccttcgcgaacaaccctaaccaggcgttgcag120

cagaccaactacaaggattggattaatatgtgtcaaaaaaaccagcagtgcggagaaaac180

ctggaaacgttcgcttcagctgacacgatagccgccgtttccgctggcgtcatagtcgtt240

ggaacaatgctcggagcgtttggcgcaccagtcactactggtctcattatatcgttcggt300

accctgctgcccatattttggggtccatccgaagacccaaaaaaggtgtggaaggagttc360

ctgacgattggcaaccgccccttcggatccgaggttgatcaaggtataattgatcttctg420

tacaccaaagttaacgggctccggtctcagttcgaagacttccaacggtacttcgacctc480

tggaaaaataacaaaaacccagttaacgcggatgtcgtcaggcaaaagtttttgtcactg540

gactcggatgttatacgcgagctcgagacactcaaagggaactactatatcacgttgctc600

cctggttacacccaggttgcgaactggcatttgaatctcctgaggcaggcagcctactac660

tatgacgaatgggcaccgtccagcaatctgtcaatccaaagcatctatccccaagactat720

accaatgacctccagacttgcctcgacaactgtccgtccgaatcaggaaataaggtgagc780

tcggcctactacaaatgtatactgaaatgccgcatcaatgaatacataaattactgcagc840

aaaacttaccaagaaggtctcaacaagctcaaaaattcatcggatataaagtggaatatt900

tataacgaatatcggcgcgagatgacgctgacagtccttgatctcatcgccgctttccca960

aactatgatctcgaaaaatatcctattggcacgaaatgtgaactcacaagagaggtgtac1020

accaatgcactcatgggctcgtcatctatgtcgatagctgagttggagaagagcttgaca1080

aaagatcctttccttatcacctggcttaataagattcttctgtacactcggaactataag1140

cagcctacgacagaggatgtgttcgtgtttacgggtaatcagcttcggtactcatttacg1200

atggactccaacctcgggtactctgggttctatggcgacgtctcatataccgatgatacc1260

gaacaaatacttgagataccgggcaattctcaaatagtcaaggtggaagttgagcggcat1320

cgcgattcgcccgacattatctggaaaatagacttccatcttaacaacggggcggtgctt1380

aagtataattcgggatcaactgccgaccctaattttagggttagagacgttctgacgatt1440

ccaccggattcgaaggggaacgcctcccattttctcagctatatgaagtccgcctatgtc1500

acatccgatgttaaacaactgagacgggtgagcttcgcctggacccacaactcaataaat1560

tataataacgaaatctataatgacatcattacccaaatcgcagcagtcaagggacactac1620

ctcggcctcgaagggctcgcgtcgagagtcatccaggggccgggacacaccggcggtgac1680

ctggttgatctgaaggacgatctgcggttggcttgccaacacagcgggacccagcagtca1740

tactatattcggattagatatgcctcggatggggacacgaggattgtccttgtgatacct1800

ctcatggagtcccaaaatatacctttgaaatccacattttcgggagtcaaccacgatgag1860

ttgaaatacaaggatttcggatacgtgcaatttccgggggagatcaccctcaaccaacat1920

agcaaaatcacgctcattttccggctccaagacatttattcaaacatttcggtgtttatt1980

gataagatagagtttatcccaataacttcttccatccgcgaaaatagagaaaaatatcag2040

ctggagaaggccaaacgcgcggttgacgatctcttcataagcgccaaaaaacaaaatatt2100

aagattgacataacagactaccaaatagaccaaacagctaacctcgtggactcactcagc2160

gaagaaccttatccgcaggagaaaatgatgctgttgaaccagatcaaatacgcgaagcaa2220

ctctcacaatcgaggaacctcctctcgaatggagacttcgagtcgctcatagggtggaca2280

acaagctcgtcgatcactgttcagacgggaaatactatttttaagggattttcgctccat2340

atgttgggagcaaggacaactgaaattaatgcaacagttttccctacctatgtgtatcaa2400

aaaatagatgagtcgcgcttgaaaccatatacacggtatatagtgagagggtttataggg2460

tccagcaagggattgggaatttttgttacaaggtataacaatgtgcctgacaaactggca2520

tacataaggtctactaactcctgcggggagcttaatcagtacgaaagccaaaattactcg2580

cttgtttcagagaataactctaccatgtcccttcaaaatatcaccgcctccaatgacaca2640

tcgtgcctttcggagaacctcagatactgtgagccaaatcagctgtacccgacttgtcac2700

aatttgcatgacttcagcttttccatcgacaccggcgaactcgatttcaacgaaaaccca2760

ggcatatggattctgttcaaaatttcgaatcctgacggctacgcgacccttgggaacctg2820

gaggtgattgaagaaaagactctcgtcggagaggagattaacaacgttaaagagaaggga2880

aagcgctggaagaaagaaatggacaccaaacaaaccaagaccgagacagccttctcacag2940

gctcaacaggccgttaatggcttgtttatgaacacgcagtactcaatgctgaagatcgag3000

accaccatgcaagacatcgtgacggccgacaatttgattaacgagattccatacgtctat3060

gatgagcttcttcccaacgaacctgcgggccggaattataatatgtttattgagctgaaa3120

aatcaaataagccaagtctattcgctctacaatgccagaaacattatacagaacggcaat3180

ttcaacaatggcttgaaaaactggcacactagccctgatgctaaggttcaaaagatcgac3240

aatacctcagtgcttgtcataccaaactggtccacacaggtctcacagcatactaatctt3300

cagcaaaatcaaagatatctgctcagagtcacggccaagaaagagggaatgggtaatggc3360

tatgtcaaggtttcagactgtgctaataacgtggaaacacttacctttaagtccagcgat3420

attactaataataatatgtggaatgagtcgataggctacatgactaaaactatgtatata3480

acaccacacacaagccaggtgcggatagacattggggagactgaagggaactttaagata3540

aattcgatcgaactgatctgtattaagaat3570

<210>8

<211>3576

<212>dna

<213>人工序列

<220>

<223>针对单子叶植物而优化的密码子

<400>8

atgagcagcggggggacaaacatgaactcaaatcgcaataagaacgagtatgaaatcctg60

gatgcatcttcttccacctcaaatatgacaaaccaatattctcggtaccccctcgcaaac120

aatccgcaggcatttatgcggaacacgaattataaagattggcttgctatgtgtgagagg180

aacgacacgggtgtgttggagaaccccgaagtcctctcgcttcggggggcagtcggaacg240

ggtgtcagcatcgttggaatgattttttccctgataggcattccagtgataggtgaagtt300

gtggggattctcgtctctcttaccaatctgctttggccggaatctgagggctccgctcag360

tatacatggcaagaattgattacgcacgtcgaggagcttatggaccagcgcataggtgag420

acgcaaaaagctaatgctcttgccaagttgtcgggattgaaggcccaggtggctgcttat480

aaccgcgccctcgaagactgggagaaaaacccgaacagccgctccgcaagcgaagtgatc540

gcgcgcttcaggtctactaataacgattttgttggtagcatgccgcaattttccccgaac600

ggatacgagatattgcttctcagcgtctacgcccaagctgcgaacttgcacttgctgttg660

attcgggacgccactatttacggctctcagtggggcctctcacagggagacgtcaacttg720

tactacaatgaacaactgttgtatacaaagcaatatgtgaaccattgcgtgacctggtac780

aataacggactcgcacagcagaaagccctctttgcaacgagccccaactggaatcgcttc840

aatgcctaccgccgcgacatgacgatcaacgttttggacctgatcgccctctttcccatt900

tatgacgcacggctctacccccaacccgtccgcgcggaacttactcgcgagatttactca960

aacatattgaattctgatgtctacggcgtccaatgggccgattttgaaaagaatgaaagc1020

acttttacacgccccccccaccttttcacttggttgcgcaaattcgatttctatacccgg1080

acgaagtattacaatcaggggttgggatggctgttcttgggaggccacaccaactactat1140

tcatatacaaacagctcgaatctgaagtcggggtcttacaacaatttctggggatcagac1200

atgcagacttccactcttaccattcctgacaatccttcaatttaccgcctctggacaaaa1260

tcttacacgcacatatatccgtataccgatccggtgaatataactcagatgcaattttat1320

ttgaccaacaaccaacagttgacatacacggccacggccaatcctaggtatccagtgaga1380

gaaacgaacttcgaacttccgtcaacagatgagaatcctctgacataccaaaactactct1440

catatcctttcatatatgatctcgtcgcaacattttggtgataagcggtcaggctacacg1500

ttcgcctggactcacaattcagttgatcccaccaatacgcttgccccaaataaaattacc1560

cagattcctgccgttaaggccaataccctcgaaggtaataaaagctttgtggtgaaagga1620

ccgaaccatacggggggggatttggttatacttgaggctgagcctggaccagtgtatcct1680

attgtttatcggggcgtcatggggattacgtgcaaagtgactcaggcccagaactatcgc1740

attaggatccgctatgcttccaatggaggggcgcagatggctatcagccttcgcaacagg1800

gggaccgggacggtctttacagtgtcgaaaacgtacacggggaactctattgagaatctt1860

cagtacaatgatttccagtataaagacatgccagtgatacttgaggcttcacaatacgaa1920

cccaacaattccatctacgtttatctctatcaagaatctccttatatccaagtcatcatc1980

gacaagatagaattcatcccgattgacacaacttcgcaggagtatgaggaaaagcatcaa2040

cttgaaaaggcgaagaaagctgtgggagttctgttcacgaatgacgccaagaaagctttg2100

aagatcgatactaccgattacgatgttgaccaggccgcaaacctcattgagtgcctttca2160

gatgaacaatacgctaaagagaagatgatattgctggatgaagtcaaatacgctaagcaa2220

ctttcccagtctcggaatctcctgcagaatggagactttgagtccagcgagatcggatgg2280

gagacctccaacacgatcacgatacaagcagggaacttgatcttcaaaggtaagtatttg2340

aacatgtcaggtgcacggaacatagatggggccatctttcctacgtacgccttccagaag2400

gtcgacgagtctcggctcaagccttatacgcggtacaaggttaggggattcgtcggctca2460

tcgaaagacgtcgaagtggtcgttactcggtatggggaggaagtcgataccatcatgaac2520

gtgccaaatgaccttacatatgacgttggtagcgtcaagagctgcggtgagtggaatcgc2580

tgtgagcagcagccttaccagaatcgcaaccaagtgctcaataactctatgataatagct2640

aacacgtccaacgcgtccaactcatgcgaatatgtcccagaaaagaaaagggtcatgtgc2700

cctgagccccatcaattcagcttccatgtggatacgggcgagaccaatctcaacgaaaat2760

ttggggatttcagtcctgtttaaaatttctagcccggaggggtatgcaatacttgacaac2820

atagagttgatcgaagaagggtccctcgttggtgaatcgcttgcttacgttcaaaaccgg2880

gagaaaagatggaaaaataaaatgcaggcggaaagaatggagacccaacaagcgtataat2940

atagctaagcaagtggtcgacatactttttacagatccacaggataccgccctccgcttc3000

gaaactaataaatccaatataatttctgcagatgagctcgtccaatcgatcccatacatc3060

tacaatgactggcttagagacgtccccggcatgaactacaacatgttcactgagctcaag3120

ggtagaattactcaagcttattatctttacgatgataggaacgtgttgcagaacggggac3180

ttcaacaatgggctcacgagctggtacgtcaccggaaatgcagaagtgcagcagatagat3240

gggacttttgtcctcgttctgcaaaattggtcgactacagtctcgcagaacgtgtgcctt3300

cagcacaataggggatatgttctgcgggtgacggcacgcaaagaaggaatgggcaacggg3360

tacgtcaccatgtctgactgcgcgaatcacatagagaaaatcattttcacatcgtgtgat3420

aacaacatcgttgttacctccacggattccgccgaatatgtgactagaaccgtgtctttc3480

tttccagacaccgaccatgttcgcatagaaataggggaaactgagggcaccttcaaggtc3540

gagtcagttgaactcatatgtatggagggaaaagaa3576

<210>9

<211>3603

<212>dna

<213>人工序列

<220>

<223>针对单子叶植物而优化的密码子

<400>9

atgaatcaaaacatagccgcagtgcgggaagcggtcaatgctctcttttctaatcacacg60

cttcaacttaaagtgacagactaccacgtcgaccaggtggctaaattggtggaatgcata120

tctgaccagaaccatagcaaggagaagatgtgcctgcttgatcaggtgaagttggcaaaa180

agattgtcgagggagaggaacctgttgaactacggtgacttcgaatcctctaactgggca240

ggtgcagatggctggaacatttctgcgcacgtttacaccattgccgataacctgatcttc300

aaggaccattatcttaatatgccgtcggtgaataatcccatactgtcggacaaaatattc360

cccacttatgcgtatcagaaaatagaggagtcaaagctgaaaccttacacgagatacatg420

gtgcgcggattcgttggttcttccaaggaccttgagatcttggttgctcggcacggcaag480

gaggtgcataaacgcatgaatgttcctaatgacatcattcccaccaacccttgcactggc540

gaactcgtctcccagccgccgccatatccagttatgcctatacacacaatggcccaaaac600

atgtggtgcaatccttgcgaaaatggttatcaaaccgctgcaggtatgatggtccaggag660

acgaatatggtctgtcaggaccctcacgagttcaaatttagcatcgacatcggagagatc720

gaccgcgaaaggaatttgggtatatggattgggttcaaagtcggaacgactgaaggtatg780

gccacactcgactctatagaggtggttgaggtcggaccactgacaggcgatgcactgaag840

cgcatgcaaaaaagagagcagaagtggaaaaagaaatgggctgagaagcaaatgaaaata900

gagcgcgccgttcagattgcacgcaatgctattcaaactcttttcactgacccaaatcag960

aataggcttcaatcggcaattactctgaagaacattgtggacgctgagaagtgggttcag1020

aaaattccctatgtctataatcaatttcttcagggggctattcctgaggttccgggtgag1080

caatacaacgtgtttcaacaactctcgcaggccgtcgtcacggctagggggttgtacaac1140

caaagaaatgtcatcaataatggtgacttcagcgccggcttgagcaactggaacgggact1200

aaaggtgcagatgtccaacaaattggaaaagagtcagttctcatgatcagcgattggtca1260

gcaaacatatcacaacaagtctgtgttgagcctgagcattcatacctgctgcgcgtgaca1320

gcacggaaagaaggctctggggaaggttacgtgacgatctctgatggaactaaagataac1380

accgaaacgctcaaatttatcgtgggagaagagacaactggcgcaaccatgagcactatc1440

cggtcacacataagggagagatacaacgaacgcaacatggttacttcggaggtctatgac1500

gcgagcggatatgccagcaatcagaatatggtcaactactcttcggagaattatggcatg1560

tccgcatacagcgggaacaacaataaaaattaccaatcagagtcattcggatttactcct1620

tatggtgacgagaactccatgatgaattacccaagcgagaactacggggagaatgcgtat1680

tcgggaaacgataacatgaattatccttctaataactacgagatgaacccctattccagc1740

gacatgaacatgtctatgaatcaggggagcgactgcaggtgtggctgtagcactaattcc1800

taccctggcggggacatgaccatgaataattatccctcttcgatgtatgaaacaaacgca1860

tacccctcttctaccaacatgacggacaacctgggaatgggctgtggttgctattactct1920

actaatgaacatccaatggttgagcagagcacactggacctgtcggattacgttatgaaa1980

accgttgaaattttccctgaaacgaatagagtctgtatagaaatcggagaaactgccggg2040

atatttatgatagagtcgatagagttcgtgccggtcaatccgattgaatcagtgcccgag2100

cctgggccagggatatatcagagcgttacagcattgaataatagctctgtcgtggagatg2160

gccagccagggagctaggaacgttattaaagcccttccgcaaaatgcgagcaatatagag2220

cttgagtatgccccggtctatgactatgataccgatggctgctacgctaccgctgcaata2280

tcaccagatgggacaacgaatcctggcctgggcatgggcgattcaccctcgtccggttgc2340

aggggcccggctcagctcgaaaatagcaacacctattcgagggctaagtctaacaacgga2400

tggaccgccataatgtacgctagctactttgaaaaggatcaaacttctctcgggcctggg2460

tcggctgggcatagacacgactgggagcacaccattgtttgggtcaaggacgggcaagtc2520

caatacgtcacatactccgcacacgggaactggtacacgaatcctagatctaacgttcgg2580

ttttcaggcaatcacccgaagatcgtgtatcacaaagattctatttctacccatgctttt2640

cgcctggctaattctaacgacgaacctccagagaattattaccaccagtggcttcttctc2700

cctatagttggttggtatggttatccctctagagcaattagggagaaactgatgacgacc2760

aattttgggtcagcgacgattgagatcaaggacggtaacttcgaacgggccttggaaaaa2820

gcgaagccaccaataaacttcgacccgtatgcccctgagctcgaggacgggggcgcgtac2880

caaatcgttagcaccctgaataacaggtctgttgtggacatggatccaccatcgaagaat2940

gtgcatctgtgggaaaatggtaatgcaaataaccaaaaatggaagctggtttatgactca3000

attaaaagcgcttatcagatgaagaatatcgccaatgagaatctggtcctgacctggaat3060

gatctgaatgggagcataaatgttattgctactagcaaccagaaccaggaagagcaatat3120

tggatcccaactgaagcgggaaatgggtattattacgttagaaacaagaaggatccaaat3180

aaagttttggatgtctcaggctatgggaccgcaaatgggacgaatgtcacagtttataat3240

gtgcatgggggaaataaccaaaaattcaaattgtcaaacgttaccggcatcctcacgaga3300

gaggtggaaagcttgtacaaagcccagcccggtcagtccagccggtccagcaacaacttc3360

tcccttgagcatctcgccgctggtacgaaggtccgcgtcatacttgcaggcgagggcgcg3420

acgagcctgtcgttcaacatttcgcgcgacaaatccggcaccgattcttcgatatggtca3480

aatgtcagagactccagcgttctcactatacctagcggagatgatagaaagaacctttat3540

atttcagggccgccaagcggctacacatccaacgggaccttcactgttaagttctatgca3600

ctg3603

<210>10

<211>3438

<212>dna

<213>人工序列

<220>

<223>针对单子叶植物而优化的密码子

<400>10

atgaaccaatacaacaacaccaacaacgagataatagatgcgtccactaaacgctccccc60

cagtatcccctggctaacaatccacagaatagcattaagactactaactacaaagattgg120

ataaacatgtgcgagggaaacgcagaagcttttttcttgaccgatgagcaaatggtttcc180

attgttggtgccgctatttctaagttgttgggtttcgttccggttgtgggcgacatcctt240

tcgtttctcgcagacacatattggcctaagatagcgggacaggaggtggacacccgggtt300

tgggcaggcctgatccgccacactgccaacctgatcgataacagggaagcggaaaaagtt360

attggccaggctaccaccaaccttatgtcgttgtacggagcgctcggcgtttacaataga420

tttctggagcaatggaaacaaaatgagaaatcatttgcgaatctggccgacgaagtgaga480

acacaaatgtctgcgctgcacctccttttcaccaccaagataatctctgattttactctc540

catggttacgagtccatccttctgccatcctatgcctccgcagcaaatctccatctgctt600

cttctgagggacattgctatttacggtgagaggcttggatttgacccaaaagtcctccag660

gcttaccatgacgagcaagttctctttactaggcagtatacagcacactgtatcaatact720

tataaccttacattgaacgcgcagaaacccagaggatgggttgccttcaaccaatataga780

cgggatatgacactcacagttttggatttgatagctctgtttccgagctacgacactcac840

aagtatcctgtggataagaaaaatgttaagaagttgagcactaccgagtttactcgggaa900

atctatacggctttgatcgaacctaatcctaacaagaccgtcgagggcatggaggcctcg960

ctgacaaggactccccacctcttcacttggattaaacgccttgacttttacaccaacacg1020

ctttacccggatctcagatatttgtccgcaaaccgcattggttttagctacacaaattcg1080

tcgacgatccaacagagcggtatttacggtgattcaggatttgggtccaatctgacgcat1140

cagcttccgataaatccaaacatatttaaaagctccatcacggataccagatcaccttcg1200

aaccaaattactaagatggacttttacaaaacagacggtacccaagcgagctacaattcg1260

gggataacaccaacgcctggtgatctgcgcaccacattcttcggtttctcgactaatgaa1320

aataccccaaatcagccttctatcaatgactatacgcattttcttacgtacatgaagacc1380

gatgttatatcgggtggagccccaaaaagggtctcattggcctgggcccacaaaagcgtc1440

aacctcaataatcaaattttcactgatgacattactcaggtccctgccgtcaaaagcaac1500

gttctcaacacacaagccaaagttataaaaggaccgggacatacagggggcgatctggtg1560

gctattacttctgatggagtgctcagcggccggatggaaatccagtgtaaggcatctgtc1620

tttaacgaaccggagcgccggtatgggctcagaattcgctacgcggcgaattcgatcctt1680

acagtcaacgcttcgtatacgtcacagggcaacacgcgctctatcacgtttacgaccgag1740

agcacgtttacagggaacactattcccaccgacctgaaatatgaaaatttgaagtacaaa1800

gaacctttcgacgccatcctccctatgagacttacgtcgaatgagctcacgaatattaca1860

attcaaccgcagaatatgtcatctaatcaacttcttataattgatcgcatcgagtttata1920

cctataacctcaacggttctcggcgatactgagaagcaaaatctggagaaagtgcaaaag1980

gctgttaacgatctcttcactaacaccgcaaagaacgcactcaaggctgaaacgacagac2040

tatgaaatagaccagactgcaaacattgtcgagtgtttgtcagacgagcattctacgaag2100

gagaagatgattctcctggacgaggtcaagtacgctaagcaactttcgcaatcacgcaat2160

gtgctgcaaaatggtgacttcgagtcggatacactgggatggacaacttcaaacaatatt2220

accatacaagcagacaatcccatcttcaaagggaaataccttcacatgtccggggccagg2280

gatatcgacggttctgtctttcccacttatatctaccaaaaaattgacgagtccaaactt2340

aaaccttacacgcggtacagagtgaggggtttcgtggggtcgtctaaagagctcgagctt2400

gtggtttcaaggtacggcgaggagatcgatgcaatcatgaacgtcccgaacaaattggtc2460

gatatgtatccgcccgcctcggattgcggtggcttgaatagatgtgaaatctcgtccgct2520

ttggagatcaaccaagtcgactacactaacatgagctacccttgccaaaacgatggtaac2580

aagaagcatgtcttgtgccacgatagacattcatacgatttccatatcgacacggggtcc2640

gttgatctcaacgaaaatattggcatatgggtgcttttcaaggtctcatcacctgacggt2700

tacgctaccttggataatcttgaggtggtggaggagcgctctctcgacggagaagctctc2760

gctagggtgaaacacagggaaaaaaaatggattcaccagatagaagtgaaacggtacgaa2820

acccagcaagcttacgacgcgacaaaacaggcaatggacgcattgtttactaacgaccag2880

gacgaagcgctccaattcgatactactctcgcgcagattcaacacgcggacgaccttgtg2940

caatcaatcccatatgtttacaacgaatgggtccccagcgcacctgggatgaactacgac3000

ctctatgtcgagttggaagcgcgcgttgtcaaagcgcggtacctttacgatacacggaat3060

gttatacggaatggagatttctctgaaggactccaagggtggcatgttaccggaaacgcc3120

aaggttcagcagattgacggagtgtccgtccttgtgttgtccaactggagcgcaggggtg3180

gctcaaaatatgtacgttcagcacaaccatggctatgtcctccgggtgactgccaagaaa3240

gaaggacacggtaagggctatgtgacacttatggactgtgacgggaatcaggagaccctt3300

acctttacatcttgcgaagaggggtacgtcacaaagacagttgacgttttccctgataca3360

gatagagtcagagtggatatcggggagacagaaggccctttttacatcgagtcgattgag3420

cttatttgtatgaatggc3438

<210>11

<211>3519

<212>dna

<213>人工序列

<220>

<223>编码突变型bt0264

<400>11

atgggtggcatcaacatgtcgccaaactactcggacgactatgagatcattaatgcccca60

agcaatactagcccacgctatccgcttgttcacgaccttacaccccaattccaagacatg120

aattataaagactatatcaggatgacggaaggtaacagaggggtgtcagccacttcggtt180

cgctcgggtggcgaagctattgacgcggcgttgtcaataacagctattctgctcggtgtg240

ctcggacatcctgtcggcagcgccgttgttggtacttttaacgcactgctgggtcttctg300

tggcctaatggccagactattgtttgggaggatttgctggctaaagcggaggattttgct360

aacaaggtcattactgccgaaattagatctaatgcgttttcagctctcaacgtctcatat420

gcgatggtcagcgaatatacttccgctctcaatgactggatcgaaaaccccggcgtcaga480

atatcgcagcagttgatgagggagatcttcacgaataccgtgctgcaattggcctctcaa540

atgccttattttaatgtcgcaggttatgagacatcgctgttgacaatgtacgcgcaggct600

gctaacttgcatctgagcgttctcaaagatatttttattttcgggaaagagtgggggttc660

ccacaaactgatatcgacttctactactatgaagagtttatagaccacttgccagtctac720

gtcgaccattgtactaagtggtataacgaggggttgaataacctgcctaaatccaactca780

tatgattggtacaactacaataaatttaggagagaaatgacattgatggtgcttgacata840

gtggcgctgttcccgtcatatgatgcttatgtctatacattggaaacaacgaccgaactt900

acgcggatagtgtacactgatcctctgggcataatgataccccccccacccggttacgaa960

gagatggtggggtatggaggaaacctcgactggagaaactatgggttttcttttagctat1020

ttggaatctcaacttcgccaaccggtgctgttctcatggcttaactcgattaaaatgtac1080

actcggaagataatttgcgaagcggggacacctcatagcctttggtctggaaatgaaatc1140

aacttgtcgtacacatcggatccaagcaacacctttaccctgcaatccgggtattccact1200

ggttacacacacacggatttcctcgatataaactcgaaagatatctatgaagtggtgtct1260

aagattggctcggaagcagttgtgggtcctggcgacgactcgtatctttatggtttgtac1320

caagcggcttttcgcatcataccaaaagactctagcgcgtattcttatctctatccaacg1380

tatgacataggcatgaatggttactccatgtcctccctggttgaattgccgcccgaatca1440

tcggacccaccccagcctgacgaatatacttacacacaccggctctcttatgctaccctt1500

ctttcggtgcattcgtacacctctgatttctttaatgacggagcgattcctatatatggt1560

tggacacaccggagcgtgaaccgggataatcagatttatcctgacagaatcacacaaata1620

cctgctgttaagggaaagcagctcatcgagggtgcttcggtgcacaaaggtcccgggtcg1680

acggggggagacctggtccgcctttatctcaacgaccgcgtttatttgaatgtgaatgtt1740

gattcagtctctcaaaaatatagggtcagggtccggtgcgcaacttacaatcccggcagc1800

atctatctttatagagataacaccattatctcgagcgcaactgcccccaaaacgacggac1860

acaaccgatactacccagattaagttcaacgacttccagtacattacattctcagacatt1920

ttcacgtttacgagcacctggcaacaaatctctatcggggcagggaccacatatgctgaa1980

gtgtatatcgataagattgaattcataccggtcaacgaaacatatgaggcggaacgcaat2040

ttggaaaatgccaaaaaagcagtctcggctctgttcaccggaacgatggacacactgaaa2100

cgcgaggtgactgattaccagattgacagggctagcaatttgatagagtgcgtttcggac2160

gaaatgtacgggaacgacaagaggcttctgtttgaggcggttaaaacggcgaaacgcctt2220

tctcaaagcagaaatttgctccaggacttgaactttgaaatgttgaatacatcgggtaac2280

ggcgagaatggatgggtgggatcgacggggatccaggtcgtcgaaggcgacgctctcttc2340

aaaaatagatcattgcgccttccaggtgcacggcaattcgacacggagacttaccccact2400

tacctctatcaaaaaatagaagagagcaaactgaagccatacactcgctataaggtgaga2460

ggtttcatcaagggttctaaggatctggaggtcgacgttatgaggtacggcgcaaaacag2520

aaggtgctgaatgtcccaaacaaccttaaccccgatatcatacctataaacgcgtgcggg2580

gatgtcgacaggtgcaggcagcagcaggccgtgaatgcgagactccagccagcgacaatc2640

tccccttgcgaaggtggagataccaacacgtccgcacacgcgttctccttttcgattgat2700

accggagcaattgataccagcgagcgcccagggataggtgtggcgtttaagattgcgact2760

ccagaggggtatgccagcctgggaaatctcgaagtcatcgaggagggcccgcttaccggt2820

gaagcgttggctcacgtcaagcagagggaaagacagtggaaagacaaaattaccaagaaa2880

agagctgaaacagaaacaatatacacaagggctaaacaggcaatcaataaccttttcgct2940

gattatcaagatcggcaattgaagcacgacgttgaaattccaaatataattgccgccgac3000

caaatcgtcgagtcgatcagagatagatacaatgaatggattcccgcaatacctgggatg3060

aactatgagatatacacagagctgaaaaaccgcatccaaagggcctatgcgctctacgat3120

gctagaaacataattaaaaacggagattttaggaatggattggccaattggaatgcaacc3180

cctggagcacgggttcaacagatgaacggaaatccagttttggtcatcccgaactgggac3240

actcaggtgtcccagtcggtgcctgttgagcccaatcataggtatttgctgcgggtgact3300

gcacaaaagttgggcgctggtaatgggtacgttaccgtcacggacgggacgaatcataca3360

gagacgcttacgttcgatagatgtgacaacaacactacaggttcaaacaggtacgttacg3420

aagacgctggaattcactccacgcactaaccaactccaagtcgagattggagagacagag3480

ggaacatttaacatagagagcgtcaatctgctcggatgc3519

<210>12

<211>3570

<212>dna

<213>人工序列

<220>

<223>编码突变型bt0288

<400>12

atgacccaaaacaacaacgagtatgaaatcatagatcaaaacacgtcaccctattcatca60

aaccggaacaataataacagcagataccccttcgcgaacaaccctaaccaggcgttgcag120

cagaccaactacaaggattggctgaatatgtgtcaaaaaaaccagcagtgcggagaaaac180

ctggaaacgttcgcttcagctgacacgatagccgccgtttccgctggcgtcatagtcgtt240

ggaacaatgctcggagcgtttggcgcaccagtcactactggtctcattatatcgttcggt300

accctgctgcccatattttggggtccatccgaagacccaaaaaaggtgtggaaggagttc360

ctgacgattggcaaccgccccttcggatccgaggttgatcaaggtataattgatcttctg420

tacaccaaagttaacgggctccggtctcagttcgaagacttccaacggtacttcgacctc480

tggaaaaataacaaaaacccagttaacgcggatgtcgtcaggcaaaagtttttgtcactg540

gactcggatgttatacgcgagctcgagacactcaaagggaactactatatcacgttgctc600

cctggttacacccaggttgcgaactggcatttgaatctcctgaggcaggcagcctactac660

tatgacgaatgggcaccgtccagcaatctgtcaatccaaagcatctatccccaagactat720

accaatgacctccagacttgcctcgacaactgtccgtccgaatcaggaaataaggtgagc780

tcggcctactacaaatgtatactgaaatgccgcatcaatgaatacataaattactgcagc840

aaaacttaccaagaaggtctcaacaagctcaaaaattcatcggatataaagtggaatatt900

tataacgaatatcggcgcgagatgacgctgacagtccttgatctcatcgccgctttccca960

aactatgatctcgaaaaatatcctattggcacgaaatgtgaactcacaagagaggtgtac1020

accaatgcactcatgggctcgtcatctatgtcgatagctgagttggagaagagcttgaca1080

aaagatcctttccttatcacctggcttaataagattcttctgtacactcggaactataag1140

cagcctacgacagaggatgtgttcgtgtttacgggtaatcagcttcggtactcatttacg1200

atggactccaacctcgggtactctgggttctatggcgacgtctcatataccgatgatacc1260

gaacaaatacttgagataccgggcaattctcaaatagtcaaggtggaagttgagcggcat1320

cgcgattcgcccgacattatctggaaaatagacttccatcttaacaacggggcggtgctt1380

aagtataattcgggatcaactgccgaccctaattttagggttagagacgttctgacgatt1440

ccaccggattcgaaggggaacgcctcccattttctcagctatatgaagtccgcctatgtc1500

acatccgatgttaaacaactgagacgggtgagcttcgcctggacccacaactcaataaat1560

tataataacgaaatctataatgacatcattacccaaatcgcagcagtcaagggacactac1620

ctcggcctcgaagggctcgcgtcgagagtcatccaggggccgggacacaccggcggtgac1680

ctggttgatctgaaggacgatctgcggttggcttgccaacacagcgggacccagcagtca1740

tactatattcggattagatatgcctcggatggggacacgaggattgtccttgtgatacct1800

ctcatggagtcccaaaatatacctttgaaatccacattttcgggagtcaaccacgatgag1860

ttgaaatacaaggatttcggatacgtgcaatttccgggggagatcaccctcaaccaacat1920

agcaaaatcacgctcattttccggctccaagacatttattcaaacatttcggtgtttatt1980

gataagatagagtttatcccaataacttcttccatccgcgaaaatagagaaaaatatcag2040

ctggagaaggccaaacgcgcggttgacgatctcttcataagcgccaaaaaacaaaatatt2100

aagattgacataacagactaccaaatagaccaaacagctaacctcgtggactcactcagc2160

gaagaaccttatccgcaggagaaaatgatgctgttgaaccagatcaaatacgcgaagcaa2220

ctctcacaatcgaggaacctcctctcgaatggagacttcgagtcgctcatagggtggaca2280

acaagctcgtcgatcactgttcagacgggaaatactatttttaagggattttcgctccat2340

atgttgggagcaaggacaactgaaattaatgcaacagttttccctacctatgtgtatcaa2400

aaaatagatgagtcgcgcttgaaaccatatacacggtatatagtgagagggtttataggg2460

tccagcaagggattgggaatttttgttacaaggtataacaatgtgcctgacaaactggca2520

tacataaggtctactaactcctgcggggagcttaatcagtacgaaagccaaaattactcg2580

cttgtttcagagaataactctaccatgtcccttcaaaatatcaccgcctccaatgacaca2640

tcgtgcctttcggagaacctcagatactgtgagccaaatcagctgtacccgacttgtcac2700

aatttgcatgacttcagcttttccatcgacaccggcgaactcgatttcaacgaaaaccca2760

ggcatatggattctgttcaaaatttcgaatcctgacggctacgcgacccttgggaacctg2820

gaggtgattgaagaaaagactctcgtcggagaggagattaacaacgttaaagagaaggga2880

aagcgctggaagaaagaaatggacaccaaacaaaccaagaccgagacagccttctcacag2940

gctcaacaggccgttaatggcttgtttatgaacacgcagtactcaatgctgaagatcgag3000

accaccatgcaagacatcgtgacggccgacaatttgattaacgagattccatacgtctat3060

gatgagcttcttcccaacgaacctgcgggccggaattataatatgtttattgagctgaaa3120

aatcaaataagccaagtctattcgctctacaatgccagaaacattatacagaacggcaat3180

ttcaacaatggcttgaaaaactggcacactagccctgatgctaaggttcaaaagatcgac3240

aatacctcagtgcttgtcataccaaactggtccacacaggtctcacagcatactaatctt3300

cagcaaaatcaaagatatctgctcagagtcacggccaagaaagagggaatgggtaatggc3360

tatgtcaaggtttcagactgtgctaataacgtggaaacaatcacctttaagtccagcgat3420

attactaataataatatgtggaatgagtcgataggctacatgactaaaactatgtatata3480

acaccacacacaagccaggtgcggatagacattggggagactgaagggaactttaagata3540

aattcgatcgaactgatctgtattaagaat3570

<210>13

<211>3576

<212>dna

<213>人工序列

<220>

<223>编码突变型bt0302

<400>13

atgagcagcggggggacaaacatgaactcaaatcgcaataagaacgagtatgaaatcctg60

gatgcatcttcttccacctcaaatatgacaaaccaatattctcggtaccccctcgcaaac120

aatccgcaggcatttatgcggaacacgaattataaagattggatcgctatgtgtgagagg180

aacgacacgggtgtgttggagaaccccgaagtcctctcgcttcggggggcagtcggaacg240

ggtgtcagcatcgttggaatgattttttccctgataggcattccagtgataggtgaagtt300

gtggggattctcgtctctcttaccaatctgctttggccggaatctgagggctccgctcag360

tatacatggcaagaattgattacgcacgtcgaggagcttatggaccagcgcataggtgag420

acgcaaaaagctaatgctcttgccaagttgtcgggattgaaggcccaggtggctgcttat480

aaccgcgccctcgaagactgggagaaaaacccgaacagccgctccgcaagcgaagtgatc540

gcgcgcttcaggtctactaataacgattttgttggtagcatgccgcaattttccccgaac600

ggatacgagatattgcttctcagcgtctacgcccaagctgcgaacttgcacttgctgttg660

attcgggacgccactatttacggctctcagtggggcctctcacagggagacgtcaacttg720

tactacaatgaacaactgttgtatacaaagcaatatgtgaaccattgcgtgacctggtac780

aataacggactcgcacagcagaaagccctctttgcaacgagccccaactggaatcgcttc840

aatgcctaccgccgcgacatgacgatcaacgttttggacctgatcgccctctttcccatt900

tatgacgcacggctctacccccaacccgtccgcgcggaacttactcgcgagatttactca960

aacatattgaattctgatgtctacggcgtccaatgggccgattttgaaaagaatgaaagc1020

acttttacacgccccccccaccttttcacttggttgcgcaaattcgatttctatacccgg1080

acgaagtattacaatcaggggttgggatggctgttcttgggaggccacaccaactactat1140

tcatatacaaacagctcgaatctgaagtcggggtcttacaacaatttctggggatcagac1200

atgcagacttccactcttaccattcctgacaatccttcaatttaccgcctctggacaaaa1260

tcttacacgcacatatatccgtataccgatccggtgaatataactcagatgcaattttat1320

ttgaccaacaaccaacagttgacatacacggccacggccaatcctaggtatccagtgaga1380

gaaacgaacttcgaacttccgtcaacagatgagaatcctctgacataccaaaactactct1440

catatcctttcatatatgatctcgtcgcaacattttggtgataagcggtcaggctacacg1500

ttcgcctggactcacaattcagttgatcccaccaatacgcttgccccaaataaaattacc1560

cagattcctgccgttaaggccaataccctcgaaggtaataaaagctttgtggtgaaagga1620

ccgaaccatacggggggggatttggttatacttgaggctgagcctggaccagtgtatcct1680

attgtttatcggggcgtcatggggattacgtgcaaagtgactcaggcccagaactatcgc1740

attaggatccgctatgcttccaatggaggggcgcagatggctatcagccttcgcaacagg1800

gggaccgggacggtctttacagtgtcgaaaacgtacacggggaactctattgagaatctt1860

cagtacaatgatttccagtataaagacatgccagtgatacttgaggcttcacaatacgaa1920

cccaacaattccatctacgtttatctctatcaagaatctccttatatccaagtcatcatc1980

gacaagatagaattcatcccgattgacacaacttcgcaggagtatgaggaaaagcatcaa2040

cttgaaaaggcgaagaaagctgtgggagttctgttcacgaatgacgccaagaaagctttg2100

aagatcgatactaccgattacgatgttgaccaggccgcaaacctcattgagtgcctttca2160

gatgaacaatacgctaaagagaagatgatattgctggatgaagtcaaatacgctaagcaa2220

ctttcccagtctcggaatctcctgcagaatggagactttgagtccagcgagatcggatgg2280

gagacctccaacacgatcacgatacaagcagggaacttgatcttcaaaggtaagtatttg2340

aacatgtcaggtgcacggaacatagatggggccatctttcctacgtacgccttccagaag2400

gtcgacgagtctcggctcaagccttatacgcggtacaaggttaggggattcgtcggctca2460

tcgaaagacgtcgaagtggtcgttactcggtatggggaggaagtcgataccatcatgaac2520

gtgccaaatgaccttacatatgacgttggtagcgtcaagagctgcggtgagtggaatcgc2580

tgtgagcagcagccttaccagaatcgcaaccaagtgctcaataactctatgataatagct2640

aacacgtccaacgcgtccaactcatgcgaatatgtcccagaaaagaaaagggtcatgtgc2700

cctgagccccatcaattcagcttccatgtggatacgggcgagaccaatctcaacgaaaat2760

ttggggatttcagtcctgtttaaaatttctagcccggaggggtatgcaatacttgacaac2820

atagagttgatcgaagaagggtccctcgttggtgaatcgcttgcttacgttcaaaaccgg2880

gagaaaagatggaaaaataaaatgcaggcggaaagaatggagacccaacaagcgtataat2940

atagctaagcaagtggtcgacatactttttacagatccacaggataccgccctccgcttc3000

gaaactaataaatccaatataatttctgcagatgagctcgtccaatcgatcccatacatc3060

tacaatgactggcttagagacgtccccggcatgaactacaacatgttcactgagctcaag3120

ggtagaattactcaagcttattatctttacgatgataggaacgtgttgcagaacggggac3180

ttcaacaatgggctcacgagctggtacgtcaccggaaatgcagaagtgcagcagatagat3240

gggacttttgtcctcgttctgcaaaattggtcgactacagtctcgcagaacgtgtgcctt3300

cagcacaataggggatatgttctgcgggtgacggcacgcaaagaaggaatgggcaacggg3360

tacgtcaccatgtctgactgcgcgaatcacatagagaaaatcattttcacatcgtgtgat3420

aacaacctggttgttacctccacggattccgccgaatatgtgactagaaccgtgtctttc3480

tttccagacaccgaccatgttcgcatagaaataggggaaactgagggcaccttcaaggtc3540

gagtcagttgaactcatatgtatggagggaaaagaa3576

<210>14

<211>3603

<212>dna

<213>人工序列

<220>

<223>编码突变型bt0454

<400>14

atgaatcaaaacatagccgcagtgcgggaagcggtcaatgctctcttttctaatcacacg60

cttcaacttaaagtgacagactaccacgtcgaccaggtggctaaattggtggaatgcata120

tctgaccagaaccatagcaaggagaagatgtgcctgcttgatcaggtgaagatcgcaaaa180

agattgtcgagggagaggaacctgttgaactacggtgacttcgaatcctctaactgggca240

ggtgcagatggctggaacatttctgcgcacgtttacaccattgccgataacctgatcttc300

aaggaccattatcttaatatgccgtcggtgaataatcccatactgtcggacaaaatattc360

cccacttatgcgtatcagaaaatagaggagtcaaagctgaaaccttacacgagatacatg420

gtgcgcggattcgttggttcttccaaggaccttgagatcttggttgctcggcacggcaag480

gaggtgcataaacgcatgaatgttcctaatgacatcattcccaccaacccttgcactggc540

gaactcgtctcccagccgccgccatatccagttatgcctatacacacaatggcccaaaac600

atgtggtgcaatccttgcgaaaatggttatcaaaccgctgcaggtatgatggtccaggag660

acgaatatggtctgtcaggaccctcacgagttcaaatttagcatcgacatcggagagatc720

gaccgcgaaaggaatttgggtatatggattgggttcaaagtcggaacgactgaaggtatg780

gccacactcgactctatagaggtggttgaggtcggaccactgacaggcgatgcactgaag840

cgcatgcaaaaaagagagcagaagtggaaaaagaaatgggctgagaagcaaatgaaaata900

gagcgcgccgttcagattgcacgcaatgctattcaaactcttttcactgacccaaatcag960

aataggcttcaatcggcaattactctgaagaacattgtggacgctgagaagtgggttcag1020

aaaattccctatgtctataatcaatttcttcagggggctattcctgaggttccgggtgag1080

caatacaacgtgtttcaacaactctcgcaggccgtcgtcacggctagggggttgtacaac1140

caaagaaatgtcatcaataatggtgacttcagcgccggcttgagcaactggaacgggact1200

aaaggtgcagatgtccaacaaattggaaaagagtcagttctcatgatcagcgattggtca1260

gcaaacatatcacaacaagtctgtgttgagcctgagcattcatacctgctgcgcgtgaca1320

gcacggaaagaaggctctggggaaggttacgtgacgatctctgatggaactaaagataac1380

accgaaacgctcaaatttatcgtgggagaagagacaactggcgcaaccatgagcactatc1440

cggtcacacataagggagagatacaacgaacgcaacatggttacttcggaggtctatgac1500

gcgagcggatatgccagcaatcagaatatggtcaactactcttcggagaattatggcatg1560

tccgcatacagcgggaacaacaataaaaattaccaatcagagtcattcggatttactcct1620

tatggtgacgagaactccatgatgaattacccaagcgagaactacggggagaatgcgtat1680

tcgggaaacgataacatgaattatccttctaataactacgagatgaacccctattccagc1740

gacatgaacatgtctatgaatcaggggagcgactgcaggtgtggctgtagcactaattcc1800

taccctggcggggacatgaccatgaataattatccctcttcgatgtatgaaacaaacgca1860

tacccctcttctaccaacatgacggacaacctgggaatgggctgtggttgctattactct1920

actaatgaacatccaatggttgagcagagcacactggacctgtcggattacgttatgaaa1980

accgttgaaattttccctgaaacgaatagagtctgtatagaaatcggagaaactgccggg2040

atatttatgatagagtcgatagagttcgtgccggtcaatccgattgaatcagtgcccgag2100

cctgggccagggatatatcagagcgttacagcattgaataatagctctgtcgtggagatg2160

gccagccagggagctaggaacgttattaaagcccttccgcaaaatgcgagcaatatagag2220

cttgagtatgccccggtctatgactatgataccgatggctgctacgctaccgctgcaata2280

tcaccagatgggacaacgaatcctggcctgggcatgggcgattcaccctcgtccggttgc2340

aggggcccggctcagctcgaaaatagcaacacctattcgagggctaagtctaacaacgga2400

tggaccgccataatgtacgctagctactttgaaaaggatcaaacttctctcgggcctggg2460

tcggctgggcatagacacgactgggagcacaccattgtttgggtcaaggacgggcaagtc2520

caatacgtcacatactccgcacacgggaactggtacacgaatcctagatctaacgttcgg2580

ttttcaggcaatcacccgaagatcgtgtatcacaaagattctatttctacccatgctttt2640

cgcctggctaattctaacgacgaacctccagagaattattaccaccagtggcttcttctc2700

cctatagttggttggtatggttatccctctagagcaattagggagaaactgatgacgacc2760

aattttgggtcagcgacgattgagatcaaggacggtaacttcgaacgggccttggaaaaa2820

gcgaagccaccaataaacttcgacccgtatgcccctgagctcgaggacgggggcgcgtac2880

caaatcgttagcaccctgaataacaggtctgttgtggacatggatccaccatcgaagaat2940

gtgcatctgtgggaaaatggtaatgcaaataaccaaaaatggaagctggtttatgactca3000

attaaaagcgcttatcagatgaagaatatcgccaatgagaatctggtcctgacctggaat3060

gatctgaatgggagcataaatgttattgctactagcaaccagaaccaggaagagcaatat3120

tggatcccaactgaagcgggaaatgggtattattacgttagaaacaagaaggatccaaat3180

aaagttttggatgtctcaggctatgggaccgcaaatgggacgaatgtcacagtttataat3240

gtgcatgggggaaataaccaaaaattcaaattgtcaaacgttaccggcatcctcacgaga3300

gaggtggaaagcttgtacaaagcccagcccggtcagtccagccggtccagcaacaacttc3360

tcccttgagcatctcgccgctggtacgaaggtccgcgtcatacttgcaggcgagggcgcg3420

acgagcctgtcgttcaacatttcgcgcgacaaatccggcaccgattcttcgatatggtca3480

aatgtcagagactccagcgttctcactctgcctagcggagatgatagaaagaacctttat3540

atttcagggccgccaagcggctacacatccaacgggaccttcactgttaagttctatgca3600

ctg3603

<210>15

<211>3438

<212>dna

<213>人工序列

<220>

<223>编码突变型bt0485

<400>15

atgaaccaatacaacaacaccaacaacgagataatagatgcgtccactaaacgctccccc60

cagtatcccctggctaacaatccacagaatagcattaagactactaactacaaagattgg120

ataaacatgtgcgagggaaacgcagaagcttttttcatcaccgatgagcaaatggtttcc180

attgttggtgccgctatttctaagttgttgggtttcgttccggttgtgggcgacatcctt240

tcgtttctcgcagacacatattggcctaagatagcgggacaggaggtggacacccgggtt300

tgggcaggcctgatccgccacactgccaacctgatcgataacagggaagcggaaaaagtt360

attggccaggctaccaccaaccttatgtcgttgtacggagcgctcggcgtttacaataga420

tttctggagcaatggaaacaaaatgagaaatcatttgcgaatctggccgacgaagtgaga480

acacaaatgtctgcgctgcacctccttttcaccaccaagataatctctgattttactctc540

catggttacgagtccatccttctgccatcctatgcctccgcagcaaatctccatctgctt600

cttctgagggacattgctatttacggtgagaggcttggatttgacccaaaagtcctccag660

gcttaccatgacgagcaagttctctttactaggcagtatacagcacactgtatcaatact720

tataaccttacattgaacgcgcagaaacccagaggatgggttgccttcaaccaatataga780

cgggatatgacactcacagttttggatttgatagctctgtttccgagctacgacactcac840

aagtatcctgtggataagaaaaatgttaagaagttgagcactaccgagtttactcgggaa900

atctatacggctttgatcgaacctaatcctaacaagaccgtcgagggcatggaggcctcg960

ctgacaaggactccccacctcttcacttggattaaacgccttgacttttacaccaacacg1020

ctttacccggatctcagatatttgtccgcaaaccgcattggttttagctacacaaattcg1080

tcgacgatccaacagagcggtatttacggtgattcaggatttgggtccaatctgacgcat1140

cagcttccgataaatccaaacatatttaaaagctccatcacggataccagatcaccttcg1200

aaccaaattactaagatggacttttacaaaacagacggtacccaagcgagctacaattcg1260

gggataacaccaacgcctggtgatctgcgcaccacattcttcggtttctcgactaatgaa1320

aataccccaaatcagccttctatcaatgactatacgcattttcttacgtacatgaagacc1380

gatgttatatcgggtggagccccaaaaagggtctcattggcctgggcccacaaaagcgtc1440

aacctcaataatcaaattttcactgatgacattactcaggtccctgccgtcaaaagcaac1500

gttctcaacacacaagccaaagttataaaaggaccgggacatacagggggcgatctggtg1560

gctattacttctgatggagtgctcagcggccggatggaaatccagtgtaaggcatctgtc1620

tttaacgaaccggagcgccggtatgggctcagaattcgctacgcggcgaattcgatcctt1680

acagtcaacgcttcgtatacgtcacagggcaacacgcgctctatcacgtttacgaccgag1740

agcacgtttacagggaacactattcccaccgacctgaaatatgaaaatttgaagtacaaa1800

gaacctttcgacgccatcctccctatgagacttacgtcgaatgagctcacgaatattaca1860

attcaaccgcagaatatgtcatctaatcaacttcttataattgatcgcatcgagtttata1920

cctataacctcaacggttctcggcgatactgagaagcaaaatctggagaaagtgcaaaag1980

gctgttaacgatctcttcactaacaccgcaaagaacgcactcaaggctgaaacgacagac2040

tatgaaatagaccagactgcaaacattgtcgagtgtttgtcagacgagcattctacgaag2100

gagaagatgattctcctggacgaggtcaagtacgctaagcaactttcgcaatcacgcaat2160

gtgctgcaaaatggtgacttcgagtcggatacactgggatggacaacttcaaacaatatt2220

accatacaagcagacaatcccatcttcaaagggaaataccttcacatgtccggggccagg2280

gatatcgacggttctgtctttcccacttatatctaccaaaaaattgacgagtccaaactt2340

aaaccttacacgcggtacagagtgaggggtttcgtggggtcgtctaaagagctcgagctt2400

gtggtttcaaggtacggcgaggagatcgatgcaatcatgaacgtcccgaacaaattggtc2460

gatatgtatccgcccgcctcggattgcggtggcttgaatagatgtgaaatctcgtccgct2520

ttggagatcaaccaagtcgactacactaacatgagctacccttgccaaaacgatggtaac2580

aagaagcatgtcttgtgccacgatagacattcatacgatttccatatcgacacggggtcc2640

gttgatctcaacgaaaatattggcatatgggtgcttttcaaggtctcatcacctgacggt2700

tacgctaccttggataatcttgaggtggtggaggagcgctctctcgacggagaagctctc2760

gctagggtgaaacacagggaaaaaaaatggattcaccagatagaagtgaaacggtacgaa2820

acccagcaagcttacgacgcgacaaaacaggcaatggacgcattgtttactaacgaccag2880

gacgaagcgctccaattcgatactactctcgcgcagattcaacacgcggacgaccttgtg2940

caatcaatcccatatgtttacaacgaatgggtccccagcgcacctgggatgaactacgac3000

ctctatgtcgagttggaagcgcgcgttgtcaaagcgcggtacctttacgatacacggaat3060

gttatacggaatggagatttctctgaaggactccaagggtggcatgttaccggaaacgcc3120

aaggttcagcagattgacggagtgtccgtccttgtgttgtccaactggagcgcaggggtg3180

gctcaaaatatgtacgttcagcacaaccatggctatgtcctccgggtgactgccaagaaa3240

gaaggacacggtaagggctatgtgacacttatggactgtgacgggaatcaggagaccctt3300

acctttacatcttgcgaagaggggtacgtcacaaagacagttgacgttttccctgataca3360

gatagagtcagagtggatctgggggagacagaaggccctttttacatcgagtcgattgag3420

cttatttgtatgaatggc3438

<210>16

<211>1173

<212>prt

<213>苏云金芽孢杆菌

<400>16

metglyglyileasnmetserproasntyrseraspasptyrgluile

151015

ileasnalaproserasnthrserproargtyrproleuvalhisasp

202530

leuthrproglnpheglnaspmetasntyrlysasptyrleuargmet

354045

thrgluglyasnargglyvalseralathrservalargserglygly

505560

glualaileaspalaalaleuserilethralaileleuleuglyval

65707580

leuglyhisprovalglyseralavalvalglythrpheasnalaleu

859095

leuglyleuleutrpproasnglyglnthrilevaltrpgluaspleu

100105110

leualalysalagluaspphealaasnlysvalilethralagluile

115120125

argserasnalapheseralaleuasnvalsertyralametvalser

130135140

glutyrthrseralaleuasnasptrpilegluasnproglyvalarg

145150155160

ileserglnglnleumetarggluilephethrasnthrvalleugln

165170175

leualaserglnmetprotyrpheasnvalalaglytyrgluthrser

180185190

leuleuthrmettyralaglnalaalaasnleuhisleuservalleu

195200205

lysaspilepheilepheglylysglutrpglypheproglnthrasp

210215220

ileaspphetyrtyrtyrgluglupheileasphisleuprovaltyr

225230235240

valasphiscysthrlystrptyrasngluglyleuasnasnleupro

245250255

lysserasnsertyrasptrptyrasntyrasnlyspheargargglu

260265270

metthrleumetvalleuaspilevalalaleupheprosertyrasp

275280285

alatyrvaltyrthrleugluthrthrthrgluleuthrargileval

290295300

tyrthraspproleuglyilemetileproproproproglytyrglu

305310315320

glumetvalglytyrglyglyasnleuasptrpargasntyrglyphe

325330335

serphesertyrleugluserglnleuargglnprovalleupheser

340345350

trpleuasnserilelysmettyrthrarglysileilecysgluala

355360365

glythrprohisserleutrpserglyasngluileasnleusertyr

370375380

thrseraspproserasnthrphethrleuglnserglytyrserthr

385390395400

glytyrthrhisthrasppheleuaspileasnserlysaspiletyr

405410415

gluvalvalserlysileglyserglualavalvalglyproglyasp

420425430

aspsertyrleutyrglyleutyrglnalaalapheargileilepro

435440445

lysaspserseralatyrsertyrleutyrprothrtyraspilegly

450455460

metasnglytyrsermetserserleuvalgluleuproprogluser

465470475480

seraspproproglnproaspglutyrthrtyrthrhisargleuser

485490495

tyralathrleuleuservalhissertyrthrseraspphepheasn

500505510

aspglyalaileproiletyrglytrpthrhisargservalasnarg

515520525

aspasnglniletyrproaspargilethrglnileproalavallys

530535540

glylysglnleuilegluglyalaservalhislysglyproglyser

545550555560

thrglyglyaspleuvalargleutyrleuasnaspargvaltyrleu

565570575

asnvalasnvalaspservalserglnlystyrargvalargvalarg

580585590

cysalathrtyrasnproglyseriletyrleutyrargaspasnthr

595600605

ileileserseralathralaprolysthrthraspthrthraspthr

610615620

thrglnilelyspheasnasppheglntyrilethrpheseraspile

625630635640

phethrphethrserthrtrpglnglnileserileglyalaglythr

645650655

thrtyralagluvaltyrileasplysileglupheileprovalasn

660665670

gluthrtyrglualagluargasnleugluasnalalyslysalaval

675680685

seralaleuphethrglythrmetaspthrleulysarggluvalthr

690695700

asptyrglnileaspargalaserasnleuileglucysvalserasp

705710715720

glumettyrglyasnasplysargleuleupheglualavallysthr

725730735

alalysargleuserglnserargasnleuleuglnaspleuasnphe

740745750

glumetleuasnthrserglyasnglygluasnglytrpvalglyser

755760765

thrglyileglnvalvalgluglyaspalaleuphelysasnargser

770775780

leuargleuproglyalaargglnpheaspthrgluthrtyrprothr

785790795800

tyrleutyrglnlysileglugluserlysleulysprotyrthrarg

805810815

tyrlysvalargglypheilelysglyserlysaspleugluvalasp

820825830

valmetargtyrglyalalysglnlysvalleuasnvalproasnasn

835840845

leuasnproaspileileproileasnalacysglyaspvalasparg

850855860

cysargglnglnglnalavalasnalaargleuglnproalathrile

865870875880

serprocysgluglyglyaspthrasnthrseralahisalapheser

885890895

pheserileaspthrglyalaileaspthrsergluargproglyile

900905910

glyvalalaphelysilealathrprogluglytyralaserleugly

915920925

asnleugluvalileglugluglyproleuthrglyglualaleuala

930935940

hisvallysglnarggluargglntrplysasplysilethrlyslys

945950955960

argalagluthrgluthriletyrthrargalalysglnalaileasn

965970975

asnleuphealaasptyrglnaspargglnleulyshisaspvalglu

980985990

ileproasnileilealaalaaspglnilevalgluserileargasp

99510001005

argtyrasnglutrpileproalaileproglymetasntyrglu

101010151020

iletyrthrgluleulysasnargileglnargalatyralaleu

102510301035

tyraspalaargasnileilelysasnglyasppheargasngly

104010451050

leualaasntrpasnalathrproglyalaargvalglnglnmet

105510601065

asnglyasnprovalleuvalileproasntrpaspthrglnval

107010751080

serglnservalprovalgluproasnhisargtyrleuleuarg

108510901095

valthralaglnlysleuglyalaglyasnglytyrvalthrval

110011051110

thraspglythrasnhisthrgluthrleuthrpheaspargcys

111511201125

aspasnasnthrthrglyserasnargtyrvalthrlysthrile

113011351140

gluphethrproargthrasnglnleuglnvalgluileglyglu

114511501155

thrgluglythrpheasnilegluservalasnleuleuglycys

116011651170

<210>17

<211>1190

<212>prt

<213>苏云金芽孢杆菌

<400>17

metthrglnasnasnasnglutyrgluileileaspglnasnthrser

151015

protyrserserasnargasnasnasnasnserargtyrpropheala

202530

asnasnproasnglnalaleuglnglnthrasntyrlysasptrpile

354045

asnmetcysglnlysasnglnglncysglygluasnleugluthrphe

505560

alaseralaaspthrilealaalavalseralaglyvalilevalval

65707580

glythrmetleuglyalapheglyalaprovalthrthrglyleuile

859095

ileserpheglythrleuleuproilephetrpglyprosergluasp

100105110

prolyslysvaltrplysglupheleuthrileglyasnargprophe

115120125

glysergluvalaspglnglyileileaspleuleutyrthrlysval

130135140

asnglyleuargserglnphegluasppheglnargtyrpheaspleu

145150155160

trplysasnasnlysasnprovalasnalaaspvalvalargglnlys

165170175

pheleuserleuaspseraspvalilearggluleugluthrleulys

180185190

glyasntyrtyrilethrleuleuproglytyrthrglnvalalaasn

195200205

trphisleuasnleuleuargglnalaalatyrtyrtyraspglutrp

210215220

alaproserserasnleuserileglnseriletyrproglnasptyr

225230235240

thrasnaspleuglnthrcysleuaspasncysproserglusergly

245250255

asnlysvalserseralatyrtyrlyscysileleulyscysargile

260265270

asnglutyrileasntyrcysserlysthrtyrglngluglyleuasn

275280285

lysleulysasnserseraspilelystrpasniletyrasnglutyr

290295300

argargglumetthrleuthrvalleuaspleuilealaalaphepro

305310315320

asntyraspleuglulystyrproileglythrlyscysgluleuthr

325330335

arggluvaltyrthrasnalaleumetglysersersermetserile

340345350

alagluleuglulysserleuthrlysasppropheleuilethrtrp

355360365

leuasnlysileleuleutyrthrargasntyrlysglnprothrthr

370375380

gluaspvalphevalphethrglyasnglnleuargtyrserphethr

385390395400

metaspserasnleuglytyrserglyphetyrglyaspvalsertyr

405410415

thraspaspthrgluglnileleugluileproglyasnserglnile

420425430

vallysvalgluvalgluarghisargaspserproaspileiletrp

435440445

lysileaspphehisleuasnasnglyalavalleulystyrasnser

450455460

glyserthralaaspproasnpheargvalargaspvalleuthrile

465470475480

proproaspserlysglyasnalaserhispheleusertyrmetlys

485490495

seralatyrvalthrseraspvallysglnleuargargvalserphe

500505510

alatrpthrhisasnserileasntyrasnasngluiletyrasnasp

515520525

ileilethrglnilealaalavallysglyhistyrleuglyleuglu

530535540

glyleualaserargvalileglnglyproglyhisthrglyglyasp

545550555560

leuvalaspleulysaspaspleuargleualacysglnhissergly

565570575

thrglnglnsertyrtyrileargileargtyralaseraspglyasp

580585590

thrargilevalleuvalileproleumetgluserglnasnilepro

595600605

leulysserthrpheserglyvalasnhisaspgluleulystyrlys

610615620

asppheglytyrvalglnpheproglygluilethrleuasnglnhis

625630635640

serlysilethrleuilepheargleuglnaspiletyrserasnile

645650655

servalpheileasplysileglupheileproilethrserserile

660665670

arggluasnargglulystyrglnleuglulysalalysargalaval

675680685

aspaspleupheileseralalyslysglnasnilelysileaspile

690695700

thrasptyrglnileaspglnthralaasnleuvalaspserleuser

705710715720

glugluprotyrproglnglulysmetmetleuleuasnglnilelys

725730735

tyralalysglnleuserglnserargasnleuleuserasnglyasp

740745750

phegluserleuileglytrpthrthrserserserilethrvalgln

755760765

thrglyasnthrilephelysglypheserleuhismetleuglyala

770775780

argthrthrgluileasnalathrvalpheprothrtyrvaltyrgln

785790795800

lysileaspgluserargleulysprotyrthrargtyrilevalarg

805810815

glypheileglyserserlysglyleuglyilephevalthrargtyr

820825830

asnasnvalproasplysleualatyrileargserthrasnsercys

835840845

glygluleuasnglntyrgluserglnasntyrserleuvalserglu

850855860

asnasnserthrmetserleuglnasnilethralaserasnaspthr

865870875880

sercysleusergluasnleuargtyrcysgluproasnglnleutyr

885890895

prothrcyshisasnleuhisasppheserpheserileaspthrgly

900905910

gluleuasppheasngluasnproglyiletrpileleuphelysile

915920925

serasnproaspglytyralathrleuglyasnleugluvalileglu

930935940

glulysthrleuvalglyglugluileasnasnvallysglulysgly

945950955960

lysargtrplyslysglumetaspthrlysglnthrlysthrgluthr

965970975

alapheserglnalaglnglnalavalasnglyleuphemetasnthr

980985990

glntyrsermetleulysilegluthrthrmetglnaspilevalthr

99510001005

alaaspasnleuileasngluileprotyrvaltyraspgluleu

101010151020

leuproasngluproalaglyargasntyrasnmetpheileglu

102510301035

leulysasnglnileserglnvaltyrserleutyrasnalaarg

104010451050

asnileileglnasnglyasnpheasnasnglyleulysasntrp

105510601065

histhrserproaspalalysvalglnlysileaspasnthrser

107010751080

valleuvalileproasntrpserthrglnvalserglnhisthr

108510901095

asnleuglnglnasnglnargtyrleuleuargvalthralalys

110011051110

lysgluglymetglyasnglytyrvallysvalseraspcysala

111511201125

asnasnvalgluthrleuthrphelysserseraspilethrasn

113011351140

asnasnmettrpasngluserileglytyrmetthrlysthrmet

114511501155

tyrilethrprohisthrserglnvalargileaspileglyglu

116011651170

thrgluglyasnphelysileasnserilegluleuilecysile

117511801185

lysasn

1190

<210>18

<211>1192

<212>prt

<213>苏云金芽孢杆菌

<400>18

metserserglyglythrasnmetasnserasnargasnlysasnglu

151015

tyrgluileleuaspalaserserserthrserasnmetthrasngln

202530

tyrserargtyrproleualaasnasnproglnalaphemetargasn

354045

thrasntyrlysasptrpleualametcysgluargasnaspthrgly

505560

valleugluasnprogluvalleuserleuargglyalavalglythr

65707580

glyvalserilevalglymetilepheserleuileglyileproval

859095

ileglygluvalvalglyileleuvalserleuthrasnleuleutrp

100105110

proglusergluglyseralaglntyrthrtrpglngluleuilethr

115120125

hisvalglugluleumetaspglnargileglygluthrglnlysala

130135140

asnalaleualalysleuserglyleulysalaglnvalalaalatyr

145150155160

asnargalaleugluasptrpglulysasnproasnserargserala

165170175

sergluvalilealaargpheargserthrasnasnaspphevalgly

180185190

sermetproglnpheserproasnglytyrgluileleuleuleuser

195200205

valtyralaglnalaalaasnleuhisleuleuleuileargaspala

210215220

thriletyrglyserglntrpglyleuserglnglyaspvalasnleu

225230235240

tyrtyrasngluglnleuleutyrthrlysglntyrvalasnhiscys

245250255

valthrtrptyrasnasnglyleualaglnglnlysalaleupheala

260265270

thrserproasntrpasnargpheasnalatyrargargaspmetthr

275280285

ileasnvalleuaspleuilealaleupheproiletyraspalaarg

290295300

leutyrproglnprovalargalagluleuthrarggluiletyrser

305310315320

asnileleuasnseraspvaltyrglyvalglntrpalaasppheglu

325330335

lysasngluserthrphethrargproprohisleuphethrtrpleu

340345350

arglyspheaspphetyrthrargthrlystyrtyrasnglnglyleu

355360365

glytrpleupheleuglyglyhisthrasntyrtyrsertyrthrasn

370375380

serserasnleulysserglysertyrasnasnphetrpglyserasp

385390395400

metglnthrserthrleuthrileproaspasnproseriletyrarg

405410415

leutrpthrlyssertyrthrhisiletyrprotyrthraspproval

420425430

asnilethrglnmetglnphetyrleuthrasnasnglnglnleuthr

435440445

tyrthralathralaasnproargtyrprovalarggluthrasnphe

450455460

gluleuproserthraspgluasnproleuthrtyrglnasntyrser

465470475480

hisileleusertyrmetileserserglnhispheglyasplysarg

485490495

serglytyrthrphealatrpthrhisasnservalaspprothrasn

500505510

thrleualaproasnlysilethrglnileproalavallysalaasn

515520525

thrleugluglyasnlysserphevalvallysglyproasnhisthr

530535540

glyglyaspleuvalileleuglualagluproglyprovaltyrpro

545550555560

ilevaltyrargglyvalmetglyilethrcyslysvalthrglnala

565570575

glnasntyrargileargileargtyralaserasnglyglyalagln

580585590

metalaileserleuargasnargglythrglythrvalphethrval

595600605

serlysthrtyrthrglyasnserilegluasnleuglntyrasnasp

610615620

pheglntyrlysaspmetprovalileleuglualaserglntyrglu

625630635640

proasnasnseriletyrvaltyrleutyrglngluserprotyrile

645650655

glnvalileileasplysileglupheileproileaspthrthrser

660665670

glnglutyrgluglulyshisglnleuglulysalalyslysalaval

675680685

glyvalleuphethrasnaspalalyslysalaleulysileaspthr

690695700

thrasptyraspvalaspglnalaalaasnleuileglucysleuser

705710715720

aspgluglntyralalysglulysmetileleuleuaspgluvallys

725730735

tyralalysglnleuserglnserargasnleuleuglnasnglyasp

740745750

pheglusersergluileglytrpgluthrserasnthrilethrile

755760765

glnalaglyasnleuilephelysglylystyrleuasnmetsergly

770775780

alaargasnileaspglyalailepheprothrtyralapheglnlys

785790795800

valaspgluserargleulysprotyrthrargtyrlysvalarggly

805810815

phevalglyserserlysaspvalgluvalvalvalthrargtyrgly

820825830

glugluvalaspthrilemetasnvalproasnaspleuthrtyrasp

835840845

valglyservallyssercysglyglutrpasnargcysgluglngln

850855860

protyrglnasnargasnglnvalleuasnasnsermetileileala

865870875880

asnthrserasnalaserasnsercysglutyrvalproglulyslys

885890895

argvalmetcysprogluprohisglnpheserphehisvalaspthr

900905910

glygluthrasnleuasngluasnleuglyileservalleuphelys

915920925

ileserserprogluglytyralaileleuaspasnilegluleuile

930935940

glugluglyserleuvalglygluserleualatyrvalglnasnarg

945950955960

glulysargtrplysasnlysmetglnalagluargmetgluthrgln

965970975

glnalatyrasnilealalysglnvalvalaspileleuphethrasp

980985990

proglnaspthralaleuargphegluthrasnlysserasnileile

99510001005

seralaaspgluleuvalglnserileprotyriletyrasnasp

101010151020

trpleuargaspvalproglymetasntyrasnmetphethrglu

102510301035

leulysglyargilethrglnalatyrtyrleutyraspasparg

104010451050

asnvalleuglnasnglyasppheasnasnglyleuthrsertrp

105510601065

tyrvalthrglyasnalagluvalglnglnileaspglythrphe

107010751080

valleuvalleuglnasntrpserthrthrvalserglnasnval

108510901095

cysleuglnhisasnargglytyrvalleuargvalthralaarg

110011051110

lysgluglymetglyasnglytyrvalthrmetseraspcysala

111511201125

asnhisileglulysileilephethrsercysaspasnasnile

113011351140

valvalthrserthraspseralaglutyrvalthrargthrval

114511501155

serphepheproaspthrasphisvalargilegluileglyglu

116011651170

thrgluglythrphelysvalgluservalgluleuilecysmet

117511801185

gluglylysglu

1190

<210>19

<211>1201

<212>prt

<213>苏云金芽孢杆菌

<400>19

metasnglnasnilealaalavalargglualavalasnalaleuphe

151015

serasnhisthrleuglnleulysvalthrasptyrhisvalaspgln

202530

valalalysleuvalglucysileseraspglnasnhisserlysglu

354045

lysmetcysleuleuaspglnvallysleualalysargleuserarg

505560

gluargasnleuleuasntyrglyaspphegluserserasntrpala

65707580

glyalaaspglytrpasnileseralahisvaltyrthrilealaasp

859095

asnleuilephelysasphistyrleuasnmetproservalasnasn

100105110

proileleuserasplysilepheprothrtyralatyrglnlysile

115120125

glugluserlysleulysprotyrthrargtyrmetvalargglyphe

130135140

valglyserserlysaspleugluileleuvalalaarghisglylys

145150155160

gluvalhislysargmetasnvalproasnaspileileprothrasn

165170175

procysthrglygluleuvalserglnproproprotyrprovalmet

180185190

proilehisthrmetalaglnasnmettrpcysasnprocysgluasn

195200205

glytyrglnthralaalaglymetmetvalglngluthrasnmetval

210215220

cysglnaspprohisgluphelyspheserileaspileglygluile

225230235240

asparggluargasnleuglyiletrpileglyphelysvalglythr

245250255

thrgluglymetalathrleuaspserilegluvalvalgluvalgly

260265270

proleuthrglyaspalaleulysargmetglnlysarggluglnlys

275280285

trplyslyslystrpalaglulysglnmetlysilegluargalaval

290295300

glnilealaargasnalaileglnthrleuphethraspproasngln

305310315320

asnargleuglnseralailethrleulysasnilevalaspalaglu

325330335

lystrpvalglnlysileprotyrvaltyrasnglnpheleuglngly

340345350

alaileprogluvalproglygluglntyrasnvalpheglnglnleu

355360365

serglnalavalvalthralaargglyleutyrasnglnargasnval

370375380

ileasnasnglyasppheseralaglyleuserasntrpasnglythr

385390395400

lysglyalaaspvalglnglnileglylysgluservalleumetile

405410415

serasptrpseralaasnileserglnglnvalcysvalgluproglu

420425430

hissertyrleuleuargvalthralaarglysgluglyserglyglu

435440445

glytyrvalthrileseraspglythrlysaspasnthrgluthrleu

450455460

lyspheilevalglyglugluthrthrglyalathrmetserthrile

465470475480

argserhisilearggluargtyrasngluargasnmetvalthrser

485490495

gluvaltyraspalaserglytyralaserasnglnasnmetvalasn

500505510

tyrsersergluasntyrglymetseralatyrserglyasnasnasn

515520525

lysasntyrglnsergluserpheglyphethrprotyrglyaspglu

530535540

asnsermetmetasntyrprosergluasntyrglygluasnalatyr

545550555560

serglyasnaspasnmetasntyrproserasnasntyrglumetasn

565570575

protyrserseraspmetasnmetsermetasnglnglyseraspcys

580585590

argcysglycysserthrasnsertyrproglyglyaspmetthrmet

595600605

asnasntyrprosersermettyrgluthrasnalatyrproserser

610615620

thrasnmetthraspasnleuglymetglycysglycystyrtyrser

625630635640

thrasngluhisprometvalgluglnserthrleuaspleuserasp

645650655

tyrvalmetlysthrvalgluilepheprogluthrasnargvalcys

660665670

ilegluileglygluthralaglyilephemetilegluserileglu

675680685

phevalprovalasnproilegluservalprogluproglyprogly

690695700

iletyrglnservalthralaleuasnasnserservalvalglumet

705710715720

alaserglnglyalaargasnvalilelysalaleuproglnasnala

725730735

serasnilegluleuglutyralaprovaltyrasptyraspthrasp

740745750

glycystyralathralaalaileserproaspglythrthrasnpro

755760765

glyleuglymetglyaspserproserserglycysargglyproala

770775780

glnleugluasnserasnthrtyrserargalalysserasnasngly

785790795800

trpthralailemettyralasertyrpheglulysaspglnthrser

805810815

leuglyproglyseralaglyhisarghisasptrpgluhisthrile

820825830

valtrpvallysaspglyglnvalglntyrvalthrtyrseralahis

835840845

glyasntrptyrthrasnproargserasnvalargpheserglyasn

850855860

hisprolysilevaltyrhislysaspserileserthrhisalaphe

865870875880

argleualaasnserasnaspgluproprogluasntyrtyrhisgln

885890895

trpleuleuleuproilevalglytrptyrglytyrproserargala

900905910

ileargglulysleumetthrthrasnpheglyseralathrileglu

915920925

ilelysaspglyasnphegluargalaleuglulysalalyspropro

930935940

ileasnpheaspprotyralaprogluleugluaspglyglyalatyr

945950955960

glnilevalserthrleuasnasnargservalvalaspmetasppro

965970975

proserlysasnvalhisleutrpgluasnglyasnalaasnasngln

980985990

lystrplysleuvaltyraspserilelysseralatyrglnmetlys

99510001005

asnilealaasngluasnleuvalleuthrtrpasnaspleuasn

101010151020

glyserileasnvalilealathrserasnglnasnglngluglu

102510301035

glntyrtrpileprothrglualaglyasnglytyrtyrtyrval

104010451050

argasnlyslysaspproasnlysvalleuaspvalserglytyr

105510601065

glythralaasnglythrasnvalthrvaltyrasnvalhisgly

107010751080

glyasnasnglnlysphelysleuserasnvalthrglyileleu

108510901095

thrarggluvalgluserleutyrlysalaglnproglyglnser

110011051110

serargserserasnasnpheserleugluhisleualaalagly

111511201125

thrlysvalargvalileleualaglygluglyalathrserleu

113011351140

serpheasnileserargasplysserglythraspserserile

114511501155

trpserasnvalargaspserservalleuthrileprosergly

116011651170

aspasparglysasnleutyrileserglyproproserglytyr

117511801185

thrserasnglythrphethrvallysphetyralaleu

119011951200

<210>20

<211>1146

<212>prt

<213>苏云金芽孢杆菌

<400>20

metasnglntyrasnasnthrasnasngluileileaspalaserthr

151015

lysargserproglntyrproleualaasnasnproglnasnserile

202530

lysthrthrasntyrlysasptrpileasnmetcysgluglyasnala

354045

glualaphepheleuthraspgluglnmetvalserilevalglyala

505560

alaileserlysleuleuglyphevalprovalvalglyaspileleu

65707580

serpheleualaaspthrtyrtrpprolysilealaglyglngluval

859095

aspthrargvaltrpalaglyleuilearghisthralaasnleuile

100105110

aspasnargglualaglulysvalileglyglnalathrthrasnleu

115120125

metserleutyrglyalaleuglyvaltyrasnargpheleuglugln

130135140

trplysglnasnglulysserphealaasnleualaaspgluvalarg

145150155160

thrglnmetseralaleuhisleuleuphethrthrlysileileser

165170175

aspphethrleuhisglytyrgluserileleuleuprosertyrala

180185190

seralaalaasnleuhisleuleuleuleuargaspilealailetyr

195200205

glygluargleuglypheaspprolysvalleuglnalatyrhisasp

210215220

gluglnvalleuphethrargglntyrthralahiscysileasnthr

225230235240

tyrasnleuthrleuasnalaglnlysproargglytrpvalalaphe

245250255

asnglntyrargargaspmetthrleuthrvalleuaspleuileala

260265270

leupheprosertyraspthrhislystyrprovalasplyslysasn

275280285

vallyslysleuserthrthrgluphethrarggluiletyrthrala

290295300

leuilegluproasnproasnlysthrvalgluglymetglualaser

305310315320

leuthrargthrprohisleuphethrtrpilelysargleuaspphe

325330335

tyrthrasnthrleutyrproaspleuargtyrleuseralaasnarg

340345350

ileglyphesertyrthrasnserserthrileglnglnserglyile

355360365

tyrglyaspserglypheglyserasnleuthrhisglnleuproile

370375380

asnproasnilephelysserserilethraspthrargserproser

385390395400

asnglnilethrlysmetaspphetyrlysthraspglythrglnala

405410415

sertyrasnserglyilethrprothrproglyaspleuargthrthr

420425430

phepheglypheserthrasngluasnthrproasnglnproserile

435440445

asnasptyrthrhispheleuthrtyrmetlysthraspvalileser

450455460

glyglyalaprolysargvalserleualatrpalahislysserval

465470475480

asnleuasnasnglnilephethraspaspilethrglnvalproala

485490495

vallysserasnvalleuasnthrglnalalysvalilelysglypro

500505510

glyhisthrglyglyaspleuvalalailethrseraspglyvalleu

515520525

serglyargmetgluileglncyslysalaservalpheasnglupro

530535540

gluargargtyrglyleuargileargtyralaalaasnserileleu

545550555560

thrvalasnalasertyrthrserglnglyasnthrargserilethr

565570575

phethrthrgluserthrphethrglyasnthrileprothraspleu

580585590

lystyrgluasnleulystyrlysglupropheaspalaileleupro

595600605

metargleuthrserasngluleuthrasnilethrileglnprogln

610615620

asnmetserserasnglnleuleuileileaspargileglupheile

625630635640

proilethrserthrvalleuglyaspthrglulysglnasnleuglu

645650655

lysvalglnlysalavalasnaspleuphethrasnthralalysasn

660665670

alaleulysalagluthrthrasptyrgluileaspglnthralaasn

675680685

ilevalglucysleuseraspgluhisserthrlysglulysmetile

690695700

leuleuaspgluvallystyralalysglnleuserglnserargasn

705710715720

valleuglnasnglyaspphegluseraspthrleuglytrpthrthr

725730735

serasnasnilethrileglnalaaspasnproilephelysglylys

740745750

tyrleuhismetserglyalaargaspileaspglyservalphepro

755760765

thrtyriletyrglnlysileaspgluserlysleulysprotyrthr

770775780

argtyrargvalargglyphevalglyserserlysgluleugluleu

785790795800

valvalserargtyrglyglugluileaspalailemetasnvalpro

805810815

asnlysleuvalaspmettyrproproalaseraspcysglyglyleu

820825830

asnargcysgluileserseralaleugluileasnglnvalasptyr

835840845

thrasnmetsertyrprocysglnasnaspglyasnlyslyshisval

850855860

leucyshisasparghissertyraspphehisileaspthrglyser

865870875880

valaspleuasngluasnileglyiletrpvalleuphelysvalser

885890895

serproaspglytyralathrleuaspasnleugluvalvalgluglu

900905910

argserleuaspglyglualaleualaargvallyshisargglulys

915920925

lystrpilehisglnilegluvallysargtyrgluthrglnglnala

930935940

tyraspalathrlysglnalametaspalaleuphethrasnaspgln

945950955960

aspglualaleuglnpheaspthrthrleualaglnileglnhisala

965970975

aspaspleuvalglnserileprotyrvaltyrasnglutrpvalpro

980985990

seralaproglymetasntyraspleutyrvalgluleuglualaarg

99510001005

valvallysalaargtyrleutyraspthrargasnvalilearg

101010151020

asnglyaspphesergluglyleuglnglytrphisvalthrgly

102510301035

asnalalysvalglnglnileaspglyvalservalleuvalleu

104010451050

serasntrpseralaglyvalalaglnasnmettyrvalglnhis

105510601065

asnhisglytyrvalleuargvalthralalyslysgluglyhis

107010751080

glylysglytyrvalthrleumetaspcysaspglyasnglnglu

108510901095

thrleuthrphethrsercysglugluglytyrvalthrlysthr

110011051110

valaspvalpheproaspthraspargvalargvalaspilegly

111511201125

gluthrgluglyprophetyrilegluserilegluleuilecys

113011351140

metasngly

1145

<210>21

<211>1173

<212>prt

<213>人工序列

<220>

<223>突变型bt0264

<400>21

metglyglyileasnmetserproasntyrseraspasptyrgluile

151015

ileasnalaproserasnthrserproargtyrproleuvalhisasp

202530

leuthrproglnpheglnaspmetasntyrlysasptyrileargmet

354045

thrgluglyasnargglyvalseralathrservalargserglygly

505560

glualaileaspalaalaleuserilethralaileleuleuglyval

65707580

leuglyhisprovalglyseralavalvalglythrpheasnalaleu

859095

leuglyleuleutrpproasnglyglnthrilevaltrpgluaspleu

100105110

leualalysalagluaspphealaasnlysvalilethralagluile

115120125

argserasnalapheseralaleuasnvalsertyralametvalser

130135140

glutyrthrseralaleuasnasptrpilegluasnproglyvalarg

145150155160

ileserglnglnleumetarggluilephethrasnthrvalleugln

165170175

leualaserglnmetprotyrpheasnvalalaglytyrgluthrser

180185190

leuleuthrmettyralaglnalaalaasnleuhisleuservalleu

195200205

lysaspilepheilepheglylysglutrpglypheproglnthrasp

210215220

ileaspphetyrtyrtyrgluglupheileasphisleuprovaltyr

225230235240

valasphiscysthrlystrptyrasngluglyleuasnasnleupro

245250255

lysserasnsertyrasptrptyrasntyrasnlyspheargargglu

260265270

metthrleumetvalleuaspilevalalaleupheprosertyrasp

275280285

alatyrvaltyrthrleugluthrthrthrgluleuthrargileval

290295300

tyrthraspproleuglyilemetileproproproproglytyrglu

305310315320

glumetvalglytyrglyglyasnleuasptrpargasntyrglyphe

325330335

serphesertyrleugluserglnleuargglnprovalleupheser

340345350

trpleuasnserilelysmettyrthrarglysileilecysgluala

355360365

glythrprohisserleutrpserglyasngluileasnleusertyr

370375380

thrseraspproserasnthrphethrleuglnserglytyrserthr

385390395400

glytyrthrhisthrasppheleuaspileasnserlysaspiletyr

405410415

gluvalvalserlysileglyserglualavalvalglyproglyasp

420425430

aspsertyrleutyrglyleutyrglnalaalapheargileilepro

435440445

lysaspserseralatyrsertyrleutyrprothrtyraspilegly

450455460

metasnglytyrsermetserserleuvalgluleuproprogluser

465470475480

seraspproproglnproaspglutyrthrtyrthrhisargleuser

485490495

tyralathrleuleuservalhissertyrthrseraspphepheasn

500505510

aspglyalaileproiletyrglytrpthrhisargservalasnarg

515520525

aspasnglniletyrproaspargilethrglnileproalavallys

530535540

glylysglnleuilegluglyalaservalhislysglyproglyser

545550555560

thrglyglyaspleuvalargleutyrleuasnaspargvaltyrleu

565570575

asnvalasnvalaspservalserglnlystyrargvalargvalarg

580585590

cysalathrtyrasnproglyseriletyrleutyrargaspasnthr

595600605

ileileserseralathralaprolysthrthraspthrthraspthr

610615620

thrglnilelyspheasnasppheglntyrilethrpheseraspile

625630635640

phethrphethrserthrtrpglnglnileserileglyalaglythr

645650655

thrtyralagluvaltyrileasplysileglupheileprovalasn

660665670

gluthrtyrglualagluargasnleugluasnalalyslysalaval

675680685

seralaleuphethrglythrmetaspthrleulysarggluvalthr

690695700

asptyrglnileaspargalaserasnleuileglucysvalserasp

705710715720

glumettyrglyasnasplysargleuleupheglualavallysthr

725730735

alalysargleuserglnserargasnleuleuglnaspleuasnphe

740745750

glumetleuasnthrserglyasnglygluasnglytrpvalglyser

755760765

thrglyileglnvalvalgluglyaspalaleuphelysasnargser

770775780

leuargleuproglyalaargglnpheaspthrgluthrtyrprothr

785790795800

tyrleutyrglnlysileglugluserlysleulysprotyrthrarg

805810815

tyrlysvalargglypheilelysglyserlysaspleugluvalasp

820825830

valmetargtyrglyalalysglnlysvalleuasnvalproasnasn

835840845

leuasnproaspileileproileasnalacysglyaspvalasparg

850855860

cysargglnglnglnalavalasnalaargleuglnproalathrile

865870875880

serprocysgluglyglyaspthrasnthrseralahisalapheser

885890895

pheserileaspthrglyalaileaspthrsergluargproglyile

900905910

glyvalalaphelysilealathrprogluglytyralaserleugly

915920925

asnleugluvalileglugluglyproleuthrglyglualaleuala

930935940

hisvallysglnarggluargglntrplysasplysilethrlyslys

945950955960

argalagluthrgluthriletyrthrargalalysglnalaileasn

965970975

asnleuphealaasptyrglnaspargglnleulyshisaspvalglu

980985990

ileproasnileilealaalaaspglnilevalgluserileargasp

99510001005

argtyrasnglutrpileproalaileproglymetasntyrglu

101010151020

iletyrthrgluleulysasnargileglnargalatyralaleu

102510301035

tyraspalaargasnileilelysasnglyasppheargasngly

104010451050

leualaasntrpasnalathrproglyalaargvalglnglnmet

105510601065

asnglyasnprovalleuvalileproasntrpaspthrglnval

107010751080

serglnservalprovalgluproasnhisargtyrleuleuarg

108510901095

valthralaglnlysleuglyalaglyasnglytyrvalthrval

110011051110

thraspglythrasnhisthrgluthrleuthrpheaspargcys

111511201125

aspasnasnthrthrglyserasnargtyrvalthrlysthrleu

113011351140

gluphethrproargthrasnglnleuglnvalgluileglyglu

114511501155

thrgluglythrpheasnilegluservalasnleuleuglycys

116011651170

<210>22

<211>1190

<212>prt

<213>人工序列

<220>

<223>突变型bt0288

<400>22

metthrglnasnasnasnglutyrgluileileaspglnasnthrser

151015

protyrserserasnargasnasnasnasnserargtyrpropheala

202530

asnasnproasnglnalaleuglnglnthrasntyrlysasptrpleu

354045

asnmetcysglnlysasnglnglncysglygluasnleugluthrphe

505560

alaseralaaspthrilealaalavalseralaglyvalilevalval

65707580

glythrmetleuglyalapheglyalaprovalthrthrglyleuile

859095

ileserpheglythrleuleuproilephetrpglyprosergluasp

100105110

prolyslysvaltrplysglupheleuthrileglyasnargprophe

115120125

glysergluvalaspglnglyileileaspleuleutyrthrlysval

130135140

asnglyleuargserglnphegluasppheglnargtyrpheaspleu

145150155160

trplysasnasnlysasnprovalasnalaaspvalvalargglnlys

165170175

pheleuserleuaspseraspvalilearggluleugluthrleulys

180185190

glyasntyrtyrilethrleuleuproglytyrthrglnvalalaasn

195200205

trphisleuasnleuleuargglnalaalatyrtyrtyraspglutrp

210215220

alaproserserasnleuserileglnseriletyrproglnasptyr

225230235240

thrasnaspleuglnthrcysleuaspasncysproserglusergly

245250255

asnlysvalserseralatyrtyrlyscysileleulyscysargile

260265270

asnglutyrileasntyrcysserlysthrtyrglngluglyleuasn

275280285

lysleulysasnserseraspilelystrpasniletyrasnglutyr

290295300

argargglumetthrleuthrvalleuaspleuilealaalaphepro

305310315320

asntyraspleuglulystyrproileglythrlyscysgluleuthr

325330335

arggluvaltyrthrasnalaleumetglysersersermetserile

340345350

alagluleuglulysserleuthrlysasppropheleuilethrtrp

355360365

leuasnlysileleuleutyrthrargasntyrlysglnprothrthr

370375380

gluaspvalphevalphethrglyasnglnleuargtyrserphethr

385390395400

metaspserasnleuglytyrserglyphetyrglyaspvalsertyr

405410415

thraspaspthrgluglnileleugluileproglyasnserglnile

420425430

vallysvalgluvalgluarghisargaspserproaspileiletrp

435440445

lysileaspphehisleuasnasnglyalavalleulystyrasnser

450455460

glyserthralaaspproasnpheargvalargaspvalleuthrile

465470475480

proproaspserlysglyasnalaserhispheleusertyrmetlys

485490495

seralatyrvalthrseraspvallysglnleuargargvalserphe

500505510

alatrpthrhisasnserileasntyrasnasngluiletyrasnasp

515520525

ileilethrglnilealaalavallysglyhistyrleuglyleuglu

530535540

glyleualaserargvalileglnglyproglyhisthrglyglyasp

545550555560

leuvalaspleulysaspaspleuargleualacysglnhissergly

565570575

thrglnglnsertyrtyrileargileargtyralaseraspglyasp

580585590

thrargilevalleuvalileproleumetgluserglnasnilepro

595600605

leulysserthrpheserglyvalasnhisaspgluleulystyrlys

610615620

asppheglytyrvalglnpheproglygluilethrleuasnglnhis

625630635640

serlysilethrleuilepheargleuglnaspiletyrserasnile

645650655

servalpheileasplysileglupheileproilethrserserile

660665670

arggluasnargglulystyrglnleuglulysalalysargalaval

675680685

aspaspleupheileseralalyslysglnasnilelysileaspile

690695700

thrasptyrglnileaspglnthralaasnleuvalaspserleuser

705710715720

glugluprotyrproglnglulysmetmetleuleuasnglnilelys

725730735

tyralalysglnleuserglnserargasnleuleuserasnglyasp

740745750

phegluserleuileglytrpthrthrserserserilethrvalgln

755760765

thrglyasnthrilephelysglypheserleuhismetleuglyala

770775780

argthrthrgluileasnalathrvalpheprothrtyrvaltyrgln

785790795800

lysileaspgluserargleulysprotyrthrargtyrilevalarg

805810815

glypheileglyserserlysglyleuglyilephevalthrargtyr

820825830

asnasnvalproasplysleualatyrileargserthrasnsercys

835840845

glygluleuasnglntyrgluserglnasntyrserleuvalserglu

850855860

asnasnserthrmetserleuglnasnilethralaserasnaspthr

865870875880

sercysleusergluasnleuargtyrcysgluproasnglnleutyr

885890895

prothrcyshisasnleuhisasppheserpheserileaspthrgly

900905910

gluleuasppheasngluasnproglyiletrpileleuphelysile

915920925

serasnproaspglytyralathrleuglyasnleugluvalileglu

930935940

glulysthrleuvalglyglugluileasnasnvallysglulysgly

945950955960

lysargtrplyslysglumetaspthrlysglnthrlysthrgluthr

965970975

alapheserglnalaglnglnalavalasnglyleuphemetasnthr

980985990

glntyrsermetleulysilegluthrthrmetglnaspilevalthr

99510001005

alaaspasnleuileasngluileprotyrvaltyraspgluleu

101010151020

leuproasngluproalaglyargasntyrasnmetpheileglu

102510301035

leulysasnglnileserglnvaltyrserleutyrasnalaarg

104010451050

asnileileglnasnglyasnpheasnasnglyleulysasntrp

105510601065

histhrserproaspalalysvalglnlysileaspasnthrser

107010751080

valleuvalileproasntrpserthrglnvalserglnhisthr

108510901095

asnleuglnglnasnglnargtyrleuleuargvalthralalys

110011051110

lysgluglymetglyasnglytyrvallysvalseraspcysala

111511201125

asnasnvalgluthrilethrphelysserseraspilethrasn

113011351140

asnasnmettrpasngluserileglytyrmetthrlysthrmet

114511501155

tyrilethrprohisthrserglnvalargileaspileglyglu

116011651170

thrgluglyasnphelysileasnserilegluleuilecysile

117511801185

lysasn

1190

<210>23

<211>1192

<212>prt

<213>人工序列

<220>

<223>突变型bt0302

<400>23

metserserglyglythrasnmetasnserasnargasnlysasnglu

151015

tyrgluileleuaspalaserserserthrserasnmetthrasngln

202530

tyrserargtyrproleualaasnasnproglnalaphemetargasn

354045

thrasntyrlysasptrpilealametcysgluargasnaspthrgly

505560

valleugluasnprogluvalleuserleuargglyalavalglythr

65707580

glyvalserilevalglymetilepheserleuileglyileproval

859095

ileglygluvalvalglyileleuvalserleuthrasnleuleutrp

100105110

proglusergluglyseralaglntyrthrtrpglngluleuilethr

115120125

hisvalglugluleumetaspglnargileglygluthrglnlysala

130135140

asnalaleualalysleuserglyleulysalaglnvalalaalatyr

145150155160

asnargalaleugluasptrpglulysasnproasnserargserala

165170175

sergluvalilealaargpheargserthrasnasnaspphevalgly

180185190

sermetproglnpheserproasnglytyrgluileleuleuleuser

195200205

valtyralaglnalaalaasnleuhisleuleuleuileargaspala

210215220

thriletyrglyserglntrpglyleuserglnglyaspvalasnleu

225230235240

tyrtyrasngluglnleuleutyrthrlysglntyrvalasnhiscys

245250255

valthrtrptyrasnasnglyleualaglnglnlysalaleupheala

260265270

thrserproasntrpasnargpheasnalatyrargargaspmetthr

275280285

ileasnvalleuaspleuilealaleupheproiletyraspalaarg

290295300

leutyrproglnprovalargalagluleuthrarggluiletyrser

305310315320

asnileleuasnseraspvaltyrglyvalglntrpalaasppheglu

325330335

lysasngluserthrphethrargproprohisleuphethrtrpleu

340345350

arglyspheaspphetyrthrargthrlystyrtyrasnglnglyleu

355360365

glytrpleupheleuglyglyhisthrasntyrtyrsertyrthrasn

370375380

serserasnleulysserglysertyrasnasnphetrpglyserasp

385390395400

metglnthrserthrleuthrileproaspasnproseriletyrarg

405410415

leutrpthrlyssertyrthrhisiletyrprotyrthraspproval

420425430

asnilethrglnmetglnphetyrleuthrasnasnglnglnleuthr

435440445

tyrthralathralaasnproargtyrprovalarggluthrasnphe

450455460

gluleuproserthraspgluasnproleuthrtyrglnasntyrser

465470475480

hisileleusertyrmetileserserglnhispheglyasplysarg

485490495

serglytyrthrphealatrpthrhisasnservalaspprothrasn

500505510

thrleualaproasnlysilethrglnileproalavallysalaasn

515520525

thrleugluglyasnlysserphevalvallysglyproasnhisthr

530535540

glyglyaspleuvalileleuglualagluproglyprovaltyrpro

545550555560

ilevaltyrargglyvalmetglyilethrcyslysvalthrglnala

565570575

glnasntyrargileargileargtyralaserasnglyglyalagln

580585590

metalaileserleuargasnargglythrglythrvalphethrval

595600605

serlysthrtyrthrglyasnserilegluasnleuglntyrasnasp

610615620

pheglntyrlysaspmetprovalileleuglualaserglntyrglu

625630635640

proasnasnseriletyrvaltyrleutyrglngluserprotyrile

645650655

glnvalileileasplysileglupheileproileaspthrthrser

660665670

glnglutyrgluglulyshisglnleuglulysalalyslysalaval

675680685

glyvalleuphethrasnaspalalyslysalaleulysileaspthr

690695700

thrasptyraspvalaspglnalaalaasnleuileglucysleuser

705710715720

aspgluglntyralalysglulysmetileleuleuaspgluvallys

725730735

tyralalysglnleuserglnserargasnleuleuglnasnglyasp

740745750

pheglusersergluileglytrpgluthrserasnthrilethrile

755760765

glnalaglyasnleuilephelysglylystyrleuasnmetsergly

770775780

alaargasnileaspglyalailepheprothrtyralapheglnlys

785790795800

valaspgluserargleulysprotyrthrargtyrlysvalarggly

805810815

phevalglyserserlysaspvalgluvalvalvalthrargtyrgly

820825830

glugluvalaspthrilemetasnvalproasnaspleuthrtyrasp

835840845

valglyservallyssercysglyglutrpasnargcysgluglngln

850855860

protyrglnasnargasnglnvalleuasnasnsermetileileala

865870875880

asnthrserasnalaserasnsercysglutyrvalproglulyslys

885890895

argvalmetcysprogluprohisglnpheserphehisvalaspthr

900905910

glygluthrasnleuasngluasnleuglyileservalleuphelys

915920925

ileserserprogluglytyralaileleuaspasnilegluleuile

930935940

glugluglyserleuvalglygluserleualatyrvalglnasnarg

945950955960

glulysargtrplysasnlysmetglnalagluargmetgluthrgln

965970975

glnalatyrasnilealalysglnvalvalaspileleuphethrasp

980985990

proglnaspthralaleuargphegluthrasnlysserasnileile

99510001005

seralaaspgluleuvalglnserileprotyriletyrasnasp

101010151020

trpleuargaspvalproglymetasntyrasnmetphethrglu

102510301035

leulysglyargilethrglnalatyrtyrleutyraspasparg

104010451050

asnvalleuglnasnglyasppheasnasnglyleuthrsertrp

105510601065

tyrvalthrglyasnalagluvalglnglnileaspglythrphe

107010751080

valleuvalleuglnasntrpserthrthrvalserglnasnval

108510901095

cysleuglnhisasnargglytyrvalleuargvalthralaarg

110011051110

lysgluglymetglyasnglytyrvalthrmetseraspcysala

111511201125

asnhisileglulysileilephethrsercysaspasnasnleu

113011351140

valvalthrserthraspseralaglutyrvalthrargthrval

114511501155

serphepheproaspthrasphisvalargilegluileglyglu

116011651170

thrgluglythrphelysvalgluservalgluleuilecysmet

117511801185

gluglylysglu

1190

<210>24

<211>1201

<212>prt

<213>人工序列

<220>

<223>突变型bt0454

<400>24

metasnglnasnilealaalavalargglualavalasnalaleuphe

151015

serasnhisthrleuglnleulysvalthrasptyrhisvalaspgln

202530

valalalysleuvalglucysileseraspglnasnhisserlysglu

354045

lysmetcysleuleuaspglnvallysilealalysargleuserarg

505560

gluargasnleuleuasntyrglyaspphegluserserasntrpala

65707580

glyalaaspglytrpasnileseralahisvaltyrthrilealaasp

859095

asnleuilephelysasphistyrleuasnmetproservalasnasn

100105110

proileleuserasplysilepheprothrtyralatyrglnlysile

115120125

glugluserlysleulysprotyrthrargtyrmetvalargglyphe

130135140

valglyserserlysaspleugluileleuvalalaarghisglylys

145150155160

gluvalhislysargmetasnvalproasnaspileileprothrasn

165170175

procysthrglygluleuvalserglnproproprotyrprovalmet

180185190

proilehisthrmetalaglnasnmettrpcysasnprocysgluasn

195200205

glytyrglnthralaalaglymetmetvalglngluthrasnmetval

210215220

cysglnaspprohisgluphelyspheserileaspileglygluile

225230235240

asparggluargasnleuglyiletrpileglyphelysvalglythr

245250255

thrgluglymetalathrleuaspserilegluvalvalgluvalgly

260265270

proleuthrglyaspalaleulysargmetglnlysarggluglnlys

275280285

trplyslyslystrpalaglulysglnmetlysilegluargalaval

290295300

glnilealaargasnalaileglnthrleuphethraspproasngln

305310315320

asnargleuglnseralailethrleulysasnilevalaspalaglu

325330335

lystrpvalglnlysileprotyrvaltyrasnglnpheleuglngly

340345350

alaileprogluvalproglygluglntyrasnvalpheglnglnleu

355360365

serglnalavalvalthralaargglyleutyrasnglnargasnval

370375380

ileasnasnglyasppheseralaglyleuserasntrpasnglythr

385390395400

lysglyalaaspvalglnglnileglylysgluservalleumetile

405410415

serasptrpseralaasnileserglnglnvalcysvalgluproglu

420425430

hissertyrleuleuargvalthralaarglysgluglyserglyglu

435440445

glytyrvalthrileseraspglythrlysaspasnthrgluthrleu

450455460

lyspheilevalglyglugluthrthrglyalathrmetserthrile

465470475480

argserhisilearggluargtyrasngluargasnmetvalthrser

485490495

gluvaltyraspalaserglytyralaserasnglnasnmetvalasn

500505510

tyrsersergluasntyrglymetseralatyrserglyasnasnasn

515520525

lysasntyrglnsergluserpheglyphethrprotyrglyaspglu

530535540

asnsermetmetasntyrprosergluasntyrglygluasnalatyr

545550555560

serglyasnaspasnmetasntyrproserasnasntyrglumetasn

565570575

protyrserseraspmetasnmetsermetasnglnglyseraspcys

580585590

argcysglycysserthrasnsertyrproglyglyaspmetthrmet

595600605

asnasntyrprosersermettyrgluthrasnalatyrproserser

610615620

thrasnmetthraspasnleuglymetglycysglycystyrtyrser

625630635640

thrasngluhisprometvalgluglnserthrleuaspleuserasp

645650655

tyrvalmetlysthrvalgluilepheprogluthrasnargvalcys

660665670

ilegluileglygluthralaglyilephemetilegluserileglu

675680685

phevalprovalasnproilegluservalprogluproglyprogly

690695700

iletyrglnservalthralaleuasnasnserservalvalglumet

705710715720

alaserglnglyalaargasnvalilelysalaleuproglnasnala

725730735

serasnilegluleuglutyralaprovaltyrasptyraspthrasp

740745750

glycystyralathralaalaileserproaspglythrthrasnpro

755760765

glyleuglymetglyaspserproserserglycysargglyproala

770775780

glnleugluasnserasnthrtyrserargalalysserasnasngly

785790795800

trpthralailemettyralasertyrpheglulysaspglnthrser

805810815

leuglyproglyseralaglyhisarghisasptrpgluhisthrile

820825830

valtrpvallysaspglyglnvalglntyrvalthrtyrseralahis

835840845

glyasntrptyrthrasnproargserasnvalargpheserglyasn

850855860

hisprolysilevaltyrhislysaspserileserthrhisalaphe

865870875880

argleualaasnserasnaspgluproprogluasntyrtyrhisgln

885890895

trpleuleuleuproilevalglytrptyrglytyrproserargala

900905910

ileargglulysleumetthrthrasnpheglyseralathrileglu

915920925

ilelysaspglyasnphegluargalaleuglulysalalyspropro

930935940

ileasnpheaspprotyralaprogluleugluaspglyglyalatyr

945950955960

glnilevalserthrleuasnasnargservalvalaspmetasppro

965970975

proserlysasnvalhisleutrpgluasnglyasnalaasnasngln

980985990

lystrplysleuvaltyraspserilelysseralatyrglnmetlys

99510001005

asnilealaasngluasnleuvalleuthrtrpasnaspleuasn

101010151020

glyserileasnvalilealathrserasnglnasnglngluglu

102510301035

glntyrtrpileprothrglualaglyasnglytyrtyrtyrval

104010451050

argasnlyslysaspproasnlysvalleuaspvalserglytyr

105510601065

glythralaasnglythrasnvalthrvaltyrasnvalhisgly

107010751080

glyasnasnglnlysphelysleuserasnvalthrglyileleu

108510901095

thrarggluvalgluserleutyrlysalaglnproglyglnser

110011051110

serargserserasnasnpheserleugluhisleualaalagly

111511201125

thrlysvalargvalileleualaglygluglyalathrserleu

113011351140

serpheasnileserargasplysserglythraspserserile

114511501155

trpserasnvalargaspserservalleuthrleuprosergly

116011651170

aspasparglysasnleutyrileserglyproproserglytyr

117511801185

thrserasnglythrphethrvallysphetyralaleu

119011951200

<210>25

<211>1146

<212>prt

<213>人工序列

<220>

<223>突变型bt0485

<400>25

metasnglntyrasnasnthrasnasngluileileaspalaserthr

151015

lysargserproglntyrproleualaasnasnproglnasnserile

202530

lysthrthrasntyrlysasptrpileasnmetcysgluglyasnala

354045

glualaphepheilethraspgluglnmetvalserilevalglyala

505560

alaileserlysleuleuglyphevalprovalvalglyaspileleu

65707580

serpheleualaaspthrtyrtrpprolysilealaglyglngluval

859095

aspthrargvaltrpalaglyleuilearghisthralaasnleuile

100105110

aspasnargglualaglulysvalileglyglnalathrthrasnleu

115120125

metserleutyrglyalaleuglyvaltyrasnargpheleuglugln

130135140

trplysglnasnglulysserphealaasnleualaaspgluvalarg

145150155160

thrglnmetseralaleuhisleuleuphethrthrlysileileser

165170175

aspphethrleuhisglytyrgluserileleuleuprosertyrala

180185190

seralaalaasnleuhisleuleuleuleuargaspilealailetyr

195200205

glygluargleuglypheaspprolysvalleuglnalatyrhisasp

210215220

gluglnvalleuphethrargglntyrthralahiscysileasnthr

225230235240

tyrasnleuthrleuasnalaglnlysproargglytrpvalalaphe

245250255

asnglntyrargargaspmetthrleuthrvalleuaspleuileala

260265270

leupheprosertyraspthrhislystyrprovalasplyslysasn

275280285

vallyslysleuserthrthrgluphethrarggluiletyrthrala

290295300

leuilegluproasnproasnlysthrvalgluglymetglualaser

305310315320

leuthrargthrprohisleuphethrtrpilelysargleuaspphe

325330335

tyrthrasnthrleutyrproaspleuargtyrleuseralaasnarg

340345350

ileglyphesertyrthrasnserserthrileglnglnserglyile

355360365

tyrglyaspserglypheglyserasnleuthrhisglnleuproile

370375380

asnproasnilephelysserserilethraspthrargserproser

385390395400

asnglnilethrlysmetaspphetyrlysthraspglythrglnala

405410415

sertyrasnserglyilethrprothrproglyaspleuargthrthr

420425430

phepheglypheserthrasngluasnthrproasnglnproserile

435440445

asnasptyrthrhispheleuthrtyrmetlysthraspvalileser

450455460

glyglyalaprolysargvalserleualatrpalahislysserval

465470475480

asnleuasnasnglnilephethraspaspilethrglnvalproala

485490495

vallysserasnvalleuasnthrglnalalysvalilelysglypro

500505510

glyhisthrglyglyaspleuvalalailethrseraspglyvalleu

515520525

serglyargmetgluileglncyslysalaservalpheasnglupro

530535540

gluargargtyrglyleuargileargtyralaalaasnserileleu

545550555560

thrvalasnalasertyrthrserglnglyasnthrargserilethr

565570575

phethrthrgluserthrphethrglyasnthrileprothraspleu

580585590

lystyrgluasnleulystyrlysglupropheaspalaileleupro

595600605

metargleuthrserasngluleuthrasnilethrileglnprogln

610615620

asnmetserserasnglnleuleuileileaspargileglupheile

625630635640

proilethrserthrvalleuglyaspthrglulysglnasnleuglu

645650655

lysvalglnlysalavalasnaspleuphethrasnthralalysasn

660665670

alaleulysalagluthrthrasptyrgluileaspglnthralaasn

675680685

ilevalglucysleuseraspgluhisserthrlysglulysmetile

690695700

leuleuaspgluvallystyralalysglnleuserglnserargasn

705710715720

valleuglnasnglyaspphegluseraspthrleuglytrpthrthr

725730735

serasnasnilethrileglnalaaspasnproilephelysglylys

740745750

tyrleuhismetserglyalaargaspileaspglyservalphepro

755760765

thrtyriletyrglnlysileaspgluserlysleulysprotyrthr

770775780

argtyrargvalargglyphevalglyserserlysgluleugluleu

785790795800

valvalserargtyrglyglugluileaspalailemetasnvalpro

805810815

asnlysleuvalaspmettyrproproalaseraspcysglyglyleu

820825830

asnargcysgluileserseralaleugluileasnglnvalasptyr

835840845

thrasnmetsertyrprocysglnasnaspglyasnlyslyshisval

850855860

leucyshisasparghissertyraspphehisileaspthrglyser

865870875880

valaspleuasngluasnileglyiletrpvalleuphelysvalser

885890895

serproaspglytyralathrleuaspasnleugluvalvalgluglu

900905910

argserleuaspglyglualaleualaargvallyshisargglulys

915920925

lystrpilehisglnilegluvallysargtyrgluthrglnglnala

930935940

tyraspalathrlysglnalametaspalaleuphethrasnaspgln

945950955960

aspglualaleuglnpheaspthrthrleualaglnileglnhisala

965970975

aspaspleuvalglnserileprotyrvaltyrasnglutrpvalpro

980985990

seralaproglymetasntyraspleutyrvalgluleuglualaarg

99510001005

valvallysalaargtyrleutyraspthrargasnvalilearg

101010151020

asnglyaspphesergluglyleuglnglytrphisvalthrgly

102510301035

asnalalysvalglnglnileaspglyvalservalleuvalleu

104010451050

serasntrpseralaglyvalalaglnasnmettyrvalglnhis

105510601065

asnhisglytyrvalleuargvalthralalyslysgluglyhis

107010751080

glylysglytyrvalthrleumetaspcysaspglyasnglnglu

108510901095

thrleuthrphethrsercysglugluglytyrvalthrlysthr

110011051110

valaspvalpheproaspthraspargvalargvalaspleugly

111511201125

gluthrgluglyprophetyrilegluserilegluleuilecys

113011351140

metasngly

1145

<210>26

<211>669

<212>prt

<213>人工序列

<220>

<223>衍生自组装的序列。

<400>26

metthrglnasnasnasnglutyrgluileileaspglnasnthrser

151015

protyrserserasnargasnasnasnasnserargtyrpropheala

202530

asnasnproasnglnalaleuglnglnthrasntyrlysasptrpile

354045

asnmetcysglnlysasnglnglncysglygluasnleugluthrphe

505560

alaseralaaspthrilealaalavalseralaglyvalilevalval

65707580

glythrmetleuglyalapheglyalaprovalthrthrglyleuile

859095

ileserpheglythrleuleuproilephetrpglyprosergluasp

100105110

prolyslysvaltrplysglupheleuthrileglyasnargprophe

115120125

glysergluvalaspglnglyileileaspleuleutyrthrlysval

130135140

asnglyleuargserglnphegluasppheglnargtyrpheaspleu

145150155160

trplysasnasnlysasnprovalasnalaaspvalvalargglnlys

165170175

pheleuserleuaspseraspvalilearggluleugluthrleulys

180185190

glyasntyrtyrilethrleuleuproglytyrthrglnvalalaasn

195200205

trphisleuasnleuleuargglnalaalatyrtyrtyraspglutrp

210215220

alaproserserasnleuserileglnseriletyrproglnasptyr

225230235240

thrasnaspleuglnthrcysleuaspasncysproserglusergly

245250255

asnlysvalserseralatyrtyrlyscysileleulyscysargile

260265270

asnglutyrileasntyrcysserlysthrtyrglngluglyleuasn

275280285

lysleulysasnserseraspilelystrpasniletyrasnglutyr

290295300

argargglumetthrleuthrvalleuaspleuilealaalaphepro

305310315320

asntyraspleuglulystyrproileglythrlyscysgluleuthr

325330335

arggluvaltyrthrasnalaleumetglysersersermetserile

340345350

alagluleuglulysserleuthrlysasppropheleuilethrtrp

355360365

leuasnlysileleuleutyrthrargasntyrlysglnprothrthr

370375380

gluaspvalphevalphethrglyasnglnleuargtyrserphethr

385390395400

metaspserasnleuglytyrserglyphetyrglyaspvalsertyr

405410415

thraspaspthrgluglnileleugluileproglyasnserglnile

420425430

vallysvalgluvalgluarghisargaspserproaspileiletrp

435440445

lysileaspphehisleuasnasnglyalavalleulystyrasnser

450455460

glyserthralaaspproasnpheargvalargaspvalleuthrile

465470475480

proproaspserlysglyasnalaserhispheleusertyrmetlys

485490495

seralatyrvalthrseraspvallysglnleuargargvalserphe

500505510

alatrpthrhisasnserileasntyrasnasngluiletyrasnasp

515520525

ileilethrglnilealaalavallysglyhistyrleuglyleuglu

530535540

glyleualaserargvalileglnglyproglyhisthrglyglyasp

545550555560

leuvalaspleulysaspaspleuargleualacysglnhissergly

565570575

thrglnglnsertyrtyrileargileargtyralaseraspglyasp

580585590

thrargilevalleuvalileproleumetgluserglnasnilepro

595600605

leulysserthrpheserglyvalasnhisaspgluleulystyrlys

610615620

asppheglytyrvalglnpheproglygluilethrleuasnglnhis

625630635640

serlysilethrleuilepheargleuglnaspiletyrserasnile

645650655

servalpheileasplysileglupheileproilethr

660665

<210>27

<211>521

<212>prt

<213>人工序列

<220>

<223>衍生自组装的序列。

<400>27

serserilearggluasnargglulystyrglnleuglulysalalys

151015

argalavalaspaspleupheileseralalyslysglnasnilelys

202530

ileaspilethrasptyrglnileaspglnthralaasnleuvalasp

354045

serleuserglugluprotyrproglnglulysmetmetleuleuasn

505560

glnilelystyralalysglnleuserglnserargasnleuleuser

65707580

asnglyaspphegluserleuileglytrpthrthrserserserile

859095

thrvalglnthrglyasnthrilephelysglypheserleuhismet

100105110

leuglyalaargthrthrgluileasnalathrvalpheprothrtyr

115120125

valtyrglnlysileaspgluserargleulysprotyrthrargtyr

130135140

ilevalargglypheileglyserserlysglyleuglyilepheval

145150155160

thrargtyrasnasnvalproasplysleualatyrileargserthr

165170175

asnsercysglygluleuasnglntyrgluserglnasntyrserleu

180185190

valsergluasnasnserthrmetserleuglnasnilethralaser

195200205

asnaspthrsercysleusergluasnleuargtyrcysgluproasn

210215220

glnleutyrprothrcyshisasnleuhisasppheserpheserile

225230235240

aspthrglygluleuasppheasngluasnproglyiletrpileleu

245250255

phelysileserasnproaspglytyralathrleuglyasnleuglu

260265270

valilegluglulysthrleuvalglyglugluileasnasnvallys

275280285

glulysglylysargtrplyslysglumetaspthrlysglnthrlys

290295300

thrgluthralapheserglnalaglnglnalavalasnglyleuphe

305310315320

metasnthrglntyrsermetleulysilegluthrthrmetglnasp

325330335

ilevalthralaaspasnleuileasngluileprotyrvaltyrasp

340345350

gluleuleuproasngluproalaglyargasntyrasnmetpheile

355360365

gluleulysasnglnileserglnvaltyrserleutyrasnalaarg

370375380

asnileileglnasnglyasnpheasnasnglyleulysasntrphis

385390395400

thrserproaspalalysvalglnlysileaspasnthrservalleu

405410415

valileproasntrpserthrglnvalserglnhisthrasnleugln

420425430

glnasnglnargtyrleuleuargvalthralalyslysgluglymet

435440445

glyasnglytyrvallysvalseraspcysalaasnasnvalgluthr

450455460

leuthrphelysserseraspilethrasnasnasnmettrpasnglu

465470475480

serileglytyrmetthrlysthrmettyrilethrprohisthrser

485490495

glnvalargileaspileglygluthrgluglyasnphelysileasn

500505510

serilegluleuilecysilelysasn

515520

<210>28

<211>687

<212>prt

<213>人工序列

<220>

<223>衍生自组装的序列。

<400>28

metasnserasnargasnlysasnglutyrgluileleuaspalaser

151015

serserthrserasnmetthrasnglntyrserargtyrproleuala

202530

asnasnproglnalaphemetargasnthrasntyrlysasptrpleu

354045

alametcysgluargasnaspthrglyvalleugluasnprogluval

505560

leuserleuargglyalavalglythrglyvalserilevalglymet

65707580

ilepheserleuileglyileprovalileglygluvalvalglyile

859095

leuvalserleuthrasnleuleutrpproglusergluglyserala

100105110

glntyrthrtrpglngluleuilethrhisvalglugluleumetasp

115120125

glnargileglygluthrglnlysalaasnalaleualalysleuser

130135140

glyleulysalaglnvalalaalatyrasnargalaleugluasptrp

145150155160

glulysasnproasnserargseralasergluvalilealaargphe

165170175

argserthrasnasnaspphevalglysermetproglnpheserpro

180185190

asnglytyrgluileleuleuleuservaltyralaglnalaalaasn

195200205

leuhisleuleuleuileargaspalathriletyrglyserglntrp

210215220

glyleuserglnglyaspvalasnleutyrtyrasngluglnleuleu

225230235240

tyrthrlysglntyrvalasnhiscysvalthrtrptyrasnasngly

245250255

leualaglnglnlysalaleuphealathrserproasntrpasnarg

260265270

pheasnalatyrargargaspmetthrileasnvalleuaspleuile

275280285

alaleupheproiletyraspalaargleutyrproglnprovalarg

290295300

alagluleuthrarggluiletyrserasnileleuasnseraspval

305310315320

tyrglyvalglntrpalaasppheglulysasngluserthrphethr

325330335

argproprohisleuphethrtrpleuarglyspheaspphetyrthr

340345350

argthrlystyrtyrasnglnglyleuglytrpleupheleuglygly

355360365

histhrasntyrtyrsertyrthrasnserserasnleulyssergly

370375380

sertyrasnasnphetrpglyseraspmetglnthrserthrleuthr

385390395400

ileproaspasnproseriletyrargleutrpthrlyssertyrthr

405410415

hisiletyrprotyrthraspprovalasnilethrglnmetglnphe

420425430

tyrleuthrasnasnglnglnleuthrtyrthralathralaasnpro

435440445

argtyrprovalarggluthrasnphegluleuproserthraspglu

450455460

asnproleuthrtyrglnasntyrserhisileleusertyrmetile

465470475480

serserglnhispheglyasplysargserglytyrthrphealatrp

485490495

thrhisasnservalaspprothrasnthrleualaproasnlysile

500505510

thrglnileproalavallysalaasnthrleugluglyasnlysser

515520525

phevalvallysglyproasnhisthrglyglyaspleuvalileleu

530535540

glualagluproglyprovaltyrproilevaltyrargglyvalmet

545550555560

glyilethrcyslysvalthrglnalaglnasntyrargileargile

565570575

argtyralaserasnglyglyalaglnmetalaileserleuargasn

580585590

argglythrglythrvalphethrvalserlysthrtyrthrglyasn

595600605

serilegluasnleuglntyrasnasppheglntyrlysaspmetpro

610615620

valileleuglualaserglntyrgluproasnasnseriletyrval

625630635640

tyrleutyrglngluserprotyrileglnvalileileasplysile

645650655

glupheileproileaspthrthrserglnglutyrgluglulyshis

660665670

glnleuglulysalalyslysalavalglyvalleuphethrasn

675680685

<210>29

<211>498

<212>prt

<213>人工序列

<220>

<223>衍生自组装的序列。

<400>29

aspalalyslysalaleulysileaspthrthrasptyraspvalasp

151015

glnalaalaasnleuileglucysleuseraspgluglntyralalys

202530

glulysmetileleuleuaspgluvallystyralalysglnleuser

354045

glnserargasnleuleuglnasnglyasppheglusersergluile

505560

glytrpgluthrserasnthrilethrileglnalaglyasnleuile

65707580

phelysglylystyrleuasnmetserglyalaargasnileaspgly

859095

alailepheprothrtyralapheglnlysvalaspgluserargleu

100105110

lysprotyrthrargtyrlysvalargglyphevalglyserserlys

115120125

aspvalgluvalvalvalthrargtyrglyglugluvalaspthrile

130135140

metasnvalproasnaspleuthrtyraspvalglyservallysser

145150155160

cysglyglutrpasnargcysgluglnglnprotyrglnasnargasn

165170175

glnvalleuasnasnsermetileilealaasnthrserasnalaser

180185190

asnsercysglutyrvalproglulyslysargvalmetcysproglu

195200205

prohisglnpheserphehisvalaspthrglygluthrasnleuasn

210215220

gluasnleuglyileservalleuphelysileserserproglugly

225230235240

tyralaileleuaspasnilegluleuileglugluglyserleuval

245250255

glygluserleualatyrvalglnasnargglulysargtrplysasn

260265270

lysmetglnalagluargmetgluthrglnglnalatyrasnileala

275280285

lysglnvalvalaspileleuphethraspproglnaspthralaleu

290295300

argphegluthrasnlysserasnileileseralaaspgluleuval

305310315320

glnserileprotyriletyrasnasptrpleuargaspvalprogly

325330335

metasntyrasnmetphethrgluleulysglyargilethrglnala

340345350

tyrtyrleutyraspaspargasnvalleuglnasnglyasppheasn

355360365

asnglyleuthrsertrptyrvalthrglyasnalagluvalglngln

370375380

ileaspglythrphevalleuvalleuglnasntrpserthrthrval

385390395400

serglnasnvalcysleuglnhisasnargglytyrvalleuargval

405410415

thralaarglysgluglymetglyasnglytyrvalthrmetserasp

420425430

cysalaasnhisileglulysileilephethrsercysaspasnasn

435440445

ilevalvalthrserthraspseralaglutyrvalthrargthrval

450455460

serphepheproaspthrasphisvalargilegluileglygluthr

465470475480

gluglythrphelysvalgluservalgluleuilecysmetglugly

485490495

lysglu

<210>30

<211>668

<212>prt

<213>人工序列

<220>

<223>衍生自组装的序列。

<400>30

metasnglntyrasnasnthrasnasngluileileaspalaserthr

151015

lysargserproglntyrproleualaasnasnproglnasnserile

202530

lysthrthrasntyrlysasptrpileasnmetcysgluglyasnala

354045

glualaphepheleuthraspgluglnmetvalserilevalglyala

505560

alaileserlysleuleuglyphevalprovalvalglyaspileleu

65707580

serpheleualaaspthrtyrtrpprolysilealaglyglngluval

859095

aspthrargvaltrpalaglyleuilearghisthralaasnleuile

100105110

aspasnargglualaglulysvalileglyglnalathrthrasnleu

115120125

metserleutyrglyalaleuglyvaltyrasnargpheleuglugln

130135140

trplysglnasnglulysserphealaasnleualaaspgluvalarg

145150155160

thrglnmetseralaleuhisleuleuphethrthrlysileileser

165170175

aspphethrleuhisglytyrgluserileleuleuprosertyrala

180185190

seralaalaasnleuhisleuleuleuleuargaspilealailetyr

195200205

glygluargleuglypheaspprolysvalleuglnalatyrhisasp

210215220

gluglnvalleuphethrargglntyrthralahiscysileasnthr

225230235240

tyrasnleuthrleuasnalaglnlysproargglytrpvalalaphe

245250255

asnglntyrargargaspmetthrleuthrvalleuaspleuileala

260265270

leupheprosertyraspthrhislystyrprovalasplyslysasn

275280285

vallyslysleuserthrthrgluphethrarggluiletyrthrala

290295300

leuilegluproasnproasnlysthrvalgluglymetglualaser

305310315320

leuthrargthrprohisleuphethrtrpilelysargleuaspphe

325330335

tyrthrasnthrleutyrproaspleuargtyrleuseralaasnarg

340345350

ileglyphesertyrthrasnserserthrileglnglnserglyile

355360365

tyrglyaspserglypheglyserasnleuthrhisglnleuproile

370375380

asnproasnilephelysserserilethraspthrargserproser

385390395400

asnglnilethrlysmetaspphetyrlysthraspglythrglnala

405410415

sertyrasnserglyilethrprothrproglyaspleuargthrthr

420425430

phepheglypheserthrasngluasnthrproasnglnproserile

435440445

asnasptyrthrhispheleuthrtyrmetlysthraspvalileser

450455460

glyglyalaprolysargvalserleualatrpalahislysserval

465470475480

asnleuasnasnglnilephethraspaspilethrglnvalproala

485490495

vallysserasnvalleuasnthrglnalalysvalilelysglypro

500505510

glyhisthrglyglyaspleuvalalailethrseraspglyvalleu

515520525

serglyargmetgluileglncyslysalaservalpheasnglupro

530535540

gluargargtyrglyleuargileargtyralaalaasnserileleu

545550555560

thrvalasnalasertyrthrserglnglyasnthrargserilethr

565570575

phethrthrgluserthrphethrglyasnthrileprothraspleu

580585590

lystyrgluasnleulystyrlysglupropheaspalaileleupro

595600605

metargleuthrserasngluleuthrasnilethrileglnprogln

610615620

asnmetserserasnglnleuleuileileaspargileglupheile

625630635640

proilethrserthrvalleuglyaspthrglulysglnasnleuglu

645650655

lysvalglnlysalavalasnaspleuphethrasn

660665

<210>31

<211>478

<212>prt

<213>人工序列

<220>

<223>衍生自组装的序列。

<400>31

thralalysasnalaleulysalagluthrthrasptyrgluileasp

151015

glnthralaasnilevalglucysleuseraspgluhisserthrlys

202530

glulysmetileleuleuaspgluvallystyralalysglnleuser

354045

glnserargasnvalleuglnasnglyaspphegluseraspthrleu

505560

glytrpthrthrserasnasnilethrileglnalaaspasnproile

65707580

phelysglylystyrleuhismetserglyalaargaspileaspgly

859095

servalpheprothrtyriletyrglnlysileaspgluserlysleu

100105110

lysprotyrthrargtyrargvalargglyphevalglyserserlys

115120125

gluleugluleuvalvalserargtyrglyglugluileaspalaile

130135140

metasnvalproasnlysleuvalaspmettyrproproalaserasp

145150155160

cysglyglyleuasnargcysgluileserseralaleugluileasn

165170175

glnvalasptyrthrasnmetsertyrprocysglnasnaspglyasn

180185190

lyslyshisvalleucyshisasparghissertyraspphehisile

195200205

aspthrglyservalaspleuasngluasnileglyiletrpvalleu

210215220

phelysvalserserproaspglytyralathrleuaspasnleuglu

225230235240

valvalglugluargserleuaspglyglualaleualaargvallys

245250255

hisargglulyslystrpilehisglnilegluvallysargtyrglu

260265270

thrglnglnalatyraspalathrlysglnalametaspalaleuphe

275280285

thrasnaspglnaspglualaleuglnpheaspthrthrleualagln

290295300

ileglnhisalaaspaspleuvalglnserileprotyrvaltyrasn

305310315320

glutrpvalproseralaproglymetasntyraspleutyrvalglu

325330335

leuglualaargvalvallysalaargtyrleutyraspthrargasn

340345350

valileargasnglyaspphesergluglyleuglnglytrphisval

355360365

thrglyasnalalysvalglnglnileaspglyvalservalleuval

370375380

leuserasntrpseralaglyvalalaglnasnmettyrvalglnhis

385390395400

asnhisglytyrvalleuargvalthralalyslysgluglyhisgly

405410415

lysglytyrvalthrleumetaspcysaspglyasnglngluthrleu

420425430

thrphethrsercysglugluglytyrvalthrlysthrvalaspval

435440445

pheproaspthraspargvalargvalaspileglygluthrglugly

450455460

prophetyrilegluserilegluleuilecysmetasngly

465470475

<210>32

<211>673

<212>prt

<213>苏云金芽孢杆菌

<400>32

metsermetlysserleuileglnargiletyrleuvalleuleuthr

151015

gluileleuthrileleuaspthrleuleuglnileileargileasn

202530

histyrlysasntrpileasnmetcysglnlysasnglnglntyrgly

354045

gluasnleugluthrphealaseralaaspthrilealaglyvalser

505560

alaglyvalilevalvalglythrmetleuglyalaphealaalapro

65707580

ilethralaglyleuileileserpheglythrleuleuproilephe

859095

trplysproglygluaspprolysthrvaltrpglnalapheleulys

100105110

ileglyasnargpropheserserprovalaspglnalaleuileasp

115120125

leuleuserasnlysalaargserleugluserglnpheasnaspphe

130135140

glnargtyrpheaspiletrpasnasnasnlysthrproglyasnala

145150155160

glygluvalleuargargpheserserleuaspalaaspileilearg

165170175

gluleugluglnleulysglyasntyrtyrilethrvalleuprogly

180185190

tyralaglnvalalaasntrphisleuasnleuleuargilealaala

195200205

phetyrtyraspglntrpalaserserserasnleuserileglnser

210215220

iletyrprogluasptyrileasnaspleuglnthrcysleuthrasn

225230235240

cysalailegluserglyasnlysileserserlystyrtyrlyscys

245250255

valleulyscysargileasnglutyrileasntyrcysserlysthr

260265270

tyrglngluglyleuasnileleulysasnserserglyleulystrp

275280285

asnglutyrasnthrtyrargargglumetthrleuasnvalleuasp

290295300

leuilealavalpheproasntyraspproasplystyrleuileser

305310315320

thrlysserglnleuthrarggluiletyrthraspalaleuileasp

325330335

alaphealaasnalahispheasnileasnaspilegluasnserleu

340345350

thrargproproglyleuvalthrtrpileasnargleuaspphetyr

355360365

thrglymetphethrlysservalproglyleuthralaasnglyile

370375380

asntyrserphethrasnglyasnserasnaspserproiletyrgly

385390395400

tyrargleuseraspaspserserthrproileglnileproargasn

405410415

glntyrvaltyrasnmetleuilethrtyrleuargaspserproser

420425430

valileglnlysileglupheasnleuasnasnglnglnthrargthr

435440445

tyraspthrglyleuthrleualaprothrtyrglnserthrileasn

450455460

leuserleuproglylysaspargserpheproprolyspheasnasn

465470475480

tyrthrhispheleusertyrvallysthralaproglyaspgluarg

485490495

proserserserargalaargasnvalcyspheglytrpmethisphe

500505510

servalasnasptyraspvalleualaglyglytyrasnthrileser

515520525

asnlysileilethrglnileproalavallysalaarghisleupro

530535540

leuproserphevalmetproglyproglyhisthrglyglyasnleu

545550555560

valvalleuserthrglnileglupheglncysilevalleuasnpro

565570575

valsertyrlysileargmetargtyrvalalatyrserproasnarg

580585590

serileasnleuthrvalserileargsergluileglyasntyrgln

595600605

asnilevalproasnileserserthrvalglnserprogluaspthr

610615620

lysasnprolystyrgluhispheglntyrleuaspileserilepro

625630635640

leugluleupheglyilethrasnilethrilethrargseraspser

645650655

ileserasnasnthrleuileileasplysilegluphethrproasp

660665670

val

<210>33

<211>1180

<212>prt

<213>苏云金芽孢杆菌

<400>33

metasnprotyrglnasnlysasnglutyrgluthrleuasnalaser

151015

glnlyslysleuasnileserasnasntyrthrargtyrproileglu

202530

asnserprolysglnleuleuglnserthrasntyrlysasptrpleu

354045

asnmetcysglnglnasnglnglntyrglyglyaspphegluthrphe

505560

ileaspserglygluleuseralatyrthrilevalvalglythrval

65707580

leuthrglypheglyphethrthrproleuglyleualaleuilegly

859095

pheglythrleuileprovalleupheproalaglnaspglnserasn

100105110

thrtrpserasppheilethrglnthrlysasnileilelyslysglu

115120125

ilealaserthrtyrileserasnalaasnlysileleuasnargser

130135140

pheasnvalileserthrtyrhisasnhisleulysthrtrpgluasn

145150155160

asnproasnproglnasnthrglnaspvalargthrglnileglnleu

165170175

valhistyrhispheglnasnvalileprogluleuvalasnsercys

180185190

proproasnproseraspcysasptyrtyrasnileleuvalleuser

195200205

sertyralaglnalaalaasnleuhisleuthrvalleuasnglnala

210215220

vallyspheglualatyrleulysasnasnargglnpheasptyrleu

225230235240

gluproleuprothralaileasptyrtyrprovalleuthrlysala

245250255

ilegluasptyrthrasntyrcysvalthrthrtyrlyslysglyleu

260265270

asnleuilelysthrthrproaspserasnleuaspglyasnileasn

275280285

trpasnthrtyrasnthrtyrargthrlysmetthrthralavalleu

290295300

aspvalvalalaleupheproasntyraspvalglylystyrproile

305310315320

glyvalglnsergluleuthrarggluiletyrglnvalleuasnphe

325330335

glugluserprotyrlystyrtyrasppheglntyrglngluaspser

340345350

leuthrargargprohisleuphethrtrpleuaspserleuasnphe

355360365

tyrglulysalaglnthrthrproasnasnphephethrserhistyr

370375380

asnmetphehistyrthrleuaspasnileserglnlysserserval

385390395400

pheglyasnhisasnvalthrasplysleulysserleuglyleuala

405410415

thrasniletyrilepheleuleuasnvalileserleuaspasnlys

420425430

tyrleuasnasptyrasnasnileserlysmetaspphepheilethr

435440445

asnglythrargleuleuglulysgluleuthralaglyserglygln

450455460

ilethrtyraspvalasnlysasnilepheglyleuproileleulys

465470475480

argarggluasnglnglyasnprothrleupheprothrtyraspasn

485490495

tyrserhisileleuserpheilelysserleuserileproalathr

500505510

tyrlysthrglnvaltyrthrphealatrpthrhisserservalasp

515520525

prolysasnthriletyrthrhisleuthrthrglnileproalaval

530535540

lysalaasnserleuglythralaserlysvalvalglnglyprogly

545550555560

histhrglyglyaspleuileaspphelysasphisphelysilethr

565570575

cysglnhisserasnpheglnglnsertyrpheileargileargtyr

580585590

alaserasnglyseralaasnthrargalavalileasnleuserile

595600605

proglyvalalagluleuglymetalaleuasnprothrphesergly

610615620

thrasptyrthrasnleulystyrlysasppheglntyrleugluphe

625630635640

serasngluvallysphealaproasnglnasnileserleuvalphe

645650655

asnargseraspvaltyrthrasnthrthrvalleuileasplysile

660665670

glupheleuproilethrargserilearggluaspargglulysgln

675680685

lysleugluthrvalglnglnileileasnthrphetyralaasnpro

690695700

ilelysasnthrleuglnsergluleuthrasptyraspileaspgln

705710715720

alaalaasnleuvalglucysileserglugluleutyrprolysglu

725730735

lysmetleuleuleuaspgluvallysasnalalysglnleusergln

740745750

serargasnvalleuglnasnglyaspphegluseralathrleugly

755760765

trpthrthrseraspasnilethrileglngluaspaspproilephe

770775780

lysglyhistyrleuhismetserglyalaargaspileaspglythr

785790795800

ilepheprothrtyrilepheglnlysileaspgluserlysleulys

805810815

protyrthrargtyrleuvalargglyphevalglyserserlysasp

820825830

valgluleuvalvalserargtyrglyglugluileaspalailemet

835840845

asnvalproalaaspleuasntyrleutyrproserthrpheaspcys

850855860

gluglyserasnargcysgluthrseralavalproalaasnilegly

865870875880

asnthrseraspmetleutyrsercysglntyraspthrglylyslys

885890895

hisvalvalcysglnaspserhisglnpheserphethrileaspthr

900905910

glyalaleuaspthrasngluasnileglyvaltrpvalmetphelys

915920925

ileserserproaspglytyralaserleuaspasnleugluvalile

930935940

glugluglyproileaspglyglualaleuserargvallyshismet

945950955960

glulyslystrpasnaspglnmetglualalysargsergluthrgln

965970975

glnalatyraspvalalalysglnalaileaspalaleuphethrasn

980985990

valglnaspglualaleuglnpheaspthrthrleualaglnilegln

99510001005

tyralaglutyrleuvalglnserileprotyrvaltyrasnasp

101010151020

trpleuseraspvalproglymetasntyraspiletyrvalglu

102510301035

leuaspalaargvalalaglnalaargtyrleutyraspilearg

104010451050

asnileilelysasnglyaspphethrglnglyvalmetglytrp

105510601065

hisvalthrglyasnalaaspvalglnglnileaspglyvalser

107010751080

valleuvalleuserasntrpseralaglyvalserglnasnval

108510901095

hisleuglnhisasnhisglytyrvalleuglyvalilealalys

110011051110

lysgluglyproglyasnglytyrvalthrleumetasptrpglu

111511201125

gluasnglnglulysleuthrphethrsercysglugluglytyr

113011351140

ilethrlysthrvalaspvalpheproaspthraspargvalarg

114511501155

ilegluileglygluthrgluglyserphetyrilegluserile

116011651170

gluleuilecysmetasnglu

11751180

<210>34

<211>660

<212>prt

<213>苏云金芽孢杆菌

<400>34

metasnsertyrgluasnlysasnglutyrgluileleuasnaspser

151015

lyslysserasnmetserasnprotyrleuargtyrproleualaasn

202530

aspserleualasermetglnasnthrasntyrlysasptrpleuthr

354045

metcysaspargthraspthraspvalleuserserargglyalaval

505560

serthrglyvalglymetleuserthrileleuserleupheglyile

65707580

proleuileglygluglyileaspleuleuleuglyalaalaaspphe

859095

leutrpprogluseraspglyglyhisglntyrthrtrpgluaspleu

100105110

metasnhisileglugluleumetaspgluargleugluthrglulys

115120125

argthrthralaleuaspaspleuargglyleulysalaleuleugly

130135140

leupheargaspalapheaspsertrpglulysasnglnasnasppro

145150155160

ilealalysasnargvalglyglytyrphegluaspvalhisthrhis

165170175

phevallysaspmetalaserilepheseralathrasntyrgluval

180185190

leuleuleuprovaltyralaglnalaalaasnleuhisleuleuleu

195200205

leuarggluglyvaliletyrglyserargtrpglyilealaproala

210215220

alaaspphetyrhisaspglnleuleulystyrthralailetyrala

225230235240

asnhiscysvalthrtrptyrasnasnglyleualaglnglnlysglu

245250255

leuphealalysserproasntrpasnargpheasnalatyrargarg

260265270

aspmetthrilethrvalleuaspileilealaleupheprothrtyr

275280285

aspalaargleutyrthrlysproilelysthrgluleuthrargglu

290295300

iletyrseraspvalleuasnleuaspvaltyrglyvalglnglnthr

305310315320

aspleuasnlysasnglualaalaphethrargserprohisleuval

325330335

thrargleuargglypheaspphetyrthrargthrlystyralatyr

340345350

trpargtyrleualaglyhisthrasntyrpheserphethrglyasn

355360365

glythriletyrserserserpheasnasntrptyraspthraspmet

370375380

thrlysserthrileasnileproasptyralaasniletyrlysleu

385390395400

trpthrlyssertyrthrasnileserprotyrthraspprovalgly

405410415

ileserglnmetglnpheserleuthrasnasnglnglnleuthrtyr

420425430

thrglythrseralaprolystyrprovalarggluthrphepheglu

435440445

ileproprothraspglulysproleuthrtyrgluasntyrserhis

450455460

ileleusertyrmetthrseralaglnhispheglyasplyslysile

465470475480

glytyrthrphealatrpmethisgluservalasppheaspasnarg

485490495

valaspproasplysilethrglnileproalavallysglyasptyr

500505510

leuglntyrglytyrvallysglnglyproglyhisthrglyglyasp

515520525

leuvalsermetileargthraspargleuglyileasnvaltyrphe

530535540

proglnproleuasptyrargileargileargtyrserthrserser

545550555560

asnglytyrleutyriletyrserproasnthrlysilevaltyrleu

565570575

proprothrthrleuvalaspglyglnprothrpheaspprometasp

580585590

pheseralapheargvalvalgluvalproalaserpheargalaser

595600605

valalaglytyrthrasnphethrileglualaglypheglyproval

610615620

tyrileasplysileglupheileproaspasnthrthrthrleuglu

625630635640

tyrgluglyglyargaspleuglulysthrlysasnalavalasnasp

645650655

leuphethrasn

660

<210>35

<211>1192

<212>prt

<213>苏云金芽孢杆菌

<400>35

metaspsertyrhisasnlysasngluaspglumetleuasnalaser

151015

leuasnglnserasnmetaspasnargtyrproleualaasntyrpro

202530

asnlysserleuglnasnthrasntyrlysasptrpleuthrmetcys

354045

gluglythrprovalvalphealaserglualaglnalaphelysval

505560

leuglyalathrilealaargvalleuglyleuileproalavalgly

65707580

proleuleuserserleuvalserilephetrpprothrleuglnthr

859095

proasnthriletrpglnaspmetmetlystyrvalalaaspleuile

100105110

argglngluleuthrthrtyrthrileasnglnalathrargasnleu

115120125

thrglyleutyrgluserleuasniletyrasnargalaleualaala

130135140

trplysileasnlysasnhisphealaseralagluleuvalarggly

145150155160

tyrileasnaspleuhisileargpheglyalaaspileglnalaasp

165170175

phethrleulysglytyrgluthrileleuleuprosertyralaser

180185190

alaalaasnleuhisleuleuleuleuargaspileservaltyrgly

195200205

lysgluleuglytyrserglnglnaspleuaspphetyrtyrglyglu

210215220

glnlyshistyrthrgluargtyrserasnhiscysvalasnlystyr

225230235240

asnalaglyleuasnleuglulysglnlysglytrpserserpheasn

245250255

argtyrargargaspmetthrleuleuvalleuaspleuvalalaleu

260265270

pheproleutyraspleuargiletyrproserlysaspaspasnile

275280285

asnvallyssergluleuthrarggluiletyrseraspvalileasn

290295300

alahisvaltyrleuvalleuasngluaspmetalatyrphealagln

305310315320

alaglualaleutyrthrargglnprohisleuphethrtrpleuarg

325330335

glypheargphevalthrasnserilesersertrpthrpheleuser

340345350

glyserglnasnlystyrsertyrthrasnasnasnserilepheasn

355360365

glyprophetyrglyglnaspthrglutyrglyglythrserserasn

370375380

metaspilealagluglysertyriletyrglnleutrpthrlysasn

385390395400

tyrglutyriletyrprotrpleuaspprovalasnilethrlysile

405410415

asnpheservalthraspasnasnpheserlysgluvalthrtyrgly

420425430

glygluargileasnileprothrvalargthrasppheasppheleu

435440445

ilelyslysaspglythrglyleualathrhisasnasntyrserhis

450455460

ileleuserserileleuthrasnglyserthralaglyglnlyslys

465470475480

hisglytyrserphealaphethrhisserservalaspglnlysasn

485490495

serleuserpheasplysilethrglnileproalavallysserser

500505510

asptrpleuphetyrglyasnleuleulysglyproglyhisthrgly

515520525

glyaspleuvalpheleuaspasnglyasnasnpheasnvalargval

530535540

asnpheprovalglnsertyrargvalargileargtyralaalaasp

545550555560

glyasnglyglumetalaileservalaspglythrleutyrthrpro

565570575

pheasnvalgluargthrpheserasnasnasntyrasnaspleulys

580585590

phegluaspphelysvalileaspthrproleuiletyrasnalaser

595600605

tyrgluglyalalysserilepheleutyrasnasnserasnlysarg

610615620

valileileasplysileglupheileproileglylysseralaleu

625630635640

glutyrgluserlysglnasnleugluglnalaglnlysalavalasn

645650655

aspleuphethrasnaspthrlysasnmetleulysthraspthrthr

660665670

asptyrglnileaspglnvalvalasntrpvalaspcysvalserglu

675680685

gluleutyrvallysglulysmetileleuargaspgluilelystyr

690695700

alalysglnglnserleuserargasnleuleuglnasnglyaspphe

705710715720

gluaspthrserlysglytrpthrthrserasnthrilethrilegln

725730735

alaaspasnproilephelysglyhistyrleuasnmetserglyala

740745750

arggluileaspglythrilepheprothrtyriletyrglnlysile

755760765

aspgluserlysleulysprotyrthrargtyrglnvalargglyphe

770775780

valglyserserlysglyleugluphevalvalthrargtyrglylys

785790795800

gluthraspalailemetasnvalproasnasptrpprotyrilegln

805810815

proasnsersercysglyasptyrhisargcysaspthrserserglu

820825830

provalmettyrglnglytyrprothrproleuprogluglytyrala

835840845

proaspleuglyleuleucysglnasnserleuglylyslyshisval

850855860

valcyshisasparghisglnpheaspphehisilethrthrglyglu

865870875880

leuaspileasnthrasnleuglyileglnvalleuphelysileser

885890895

serproaspglytyralathrleuasnasnleugluvalilegluglu

900905910

glyproleuserglygluserleugluargvallyshisargglulys

915920925

lystrplysglnasnmetglualalysargleugluthrglnglnala

930935940

tyrasnalaalalysglnvalvalaspserleuphethrasnalalys

945950955960

aspgluserleuargpheaspthrthrleuthrhisilemetasnala

965970975

gluhistrpvalglnserileprotyrvalaspasnalatrpserser

980985990

aspileproglythrserasnaspleutyrvalgluleuglualaarg

99510001005

leualaglnalaargtyrleutyraspalaglnasnvalilethr

101010151020

asnglyasnphethrglnglyleumetglytrphisalathrarg

102510301035

aspvalgluvalglnglnmetasnglyalaservalleuvalleu

104010451050

serasntrpseralaglyalaserglnasnvalhisalaglnhis

105510601065

hisglnglytyrvalleuargvalilealaarglysgluglythr

107010751080

glylysglytyrvalthrmetmetaspcysasnasnasnglnglu

108510901095

thrleuthrphethrsercysglugluglytyrilethrlysthr

110011051110

valgluvalpheproaspthraspservalargilegluilegly

111511201125

gluthrgluglyserphetyrilegluserilegluleuasncys

113011351140

metlysglytyrtyraspglnlysseraspseriletyraspgln

114511501155

glytyrasnasnasntyrasnglnasnserserasnmethisasn

116011651170

glnglytyrlysasnasntyrasnglnasnglyserseralalys

117511801185

pheleulysarg

1190

<210>36

<211>679

<212>prt

<213>苏云金芽孢杆菌

<400>36

metasnsertyrglnasnthrasnglutyrgluileleuaspalaser

151015

prosertyrserasnmetthrasnsertyrproargtyrproleuala

202530

asnasnargglnglysermetlysasnthrasntyrlysasptrpleu

354045

alametcysgluglyasnvalgluglyleupheleuthraspglugln

505560

metvalserilevalglyalaalaileserlysleuleuglypheval

65707580

provalvalglyaspileleuserserleualaaspthrtyrtrppro

859095

lysilealaglyglnglualaaspthrargvaltrpalaglyleuile

100105110

arghisthralaasnleuileaspasnargaspvalaspargvalile

115120125

glyglnalathralaasnvalmetserleutyralaalaleuglyval

130135140

tyrasnargpheleugluglntrplysserprovallysprotyrala

145150155160

glyleualaaspgluileargalaglnmetserthrleuhisleuleu

165170175

phethrthrlysileileseraspphethrileglnglytyrgluala

180185190

ileleuleuprosertyralaasnalaalaserleuhisleuleuleu

195200205

leuargaspileseriletyrglyglulysleuglypheaspserlys

210215220

thrleuglnalatyrhisasngluglnvallysphethrthrasptyr

225230235240

thralahiscysilelysthrtyrasnleuasnleuasnalaglnlys

245250255

serlysglytrpvalalapheasnglntyrargargaspmetthrleu

260265270

thrvalleuaspleuilealaleupheprosertyraspthrhisarg

275280285

tyrproalaaspglulysasnvallyslysleuserasnthrgluleu

290295300

thrarggluiletyrthralaleuthrgluserserproserlysthr

305310315320

valglualametglugluserleuthrargglyprohisleuphethr

325330335

trpprolysargleuaspphetrpthrpheasntyrasnmettyrpro

340345350

aspthrargtyrleuseralaasnargileglyphesertyrthrasn

355360365

sersergluilegluaspserglyiletyrglyserprothrphegly

370375380

thrvalleuthrhisglnileproleuasnserasnvaltyrargthr

385390395400

serilethraspthrthralavalproasnglnvalthrlysmetasp

405410415

phetyrlysileaspglythrasnalasertyrasnserasnilethr

420425430

provalproalaasnleuargthrthrphepheglypheserserasp

435440445

alaasnargproproasnglnprothrvalglnasptyrasnasnile

450455460

leusertyrilelysthraspileileglyglyhisglnalaargval

465470475480

serphealatrpthrhislysglyvalasnproasnasnglnileleu

485490495

thraspasnvalthrglnvalproalavallysserserleuleuasn

500505510

alaproalaargvalilelysglyproglyhisthrglyglyaspleu

515520525

valalaleuleuasnasnglythrglnalaglythrmetglnilegln

530535540

cyslysthrglyserphethrgluthrserargargtyrglyilearg

545550555560

metargtyralaalaasnasnalaphethrvalserleusertyrthr

565570575

leuglnglyglyasnproileglyilethrpheglythrgluargthr

580585590

pheserargthrasnasnileileprothraspleulystyrgluglu

595600605

phelystyrlysglutyrasnglnileilethrmetasnserprogln

610615620

asnthrilevalthrileaspileargglnleuasnproserserasn

625630635640

aspglnleuileileaspargileglupheileproilethrglnser

645650655

valleuasptyrthrglugluglnasnleugluthralaglnalaval

660665670

valaspasnleuphethrasn

675

<210>37

<211>1136

<212>prt

<213>苏云金芽孢杆菌

<400>37

metasnserglytyrproleualaasnaspleuglnglysermetlys

151015

asnthrasntyrlysasptrpleualametcysgluasnasnglngln

202530

tyrglyvalasnproalaalaileasnserserservalserthrala

354045

leulysvalalaglyalaileleulysphevalasnproproalagly

505560

thrvalleuthrvalleuseralavalleuproileleutrpprothr

65707580

asnthrprothrprogluargvaltrpasnaspphemetthrasnthr

859095

glyasnleuileaspglnthrvalthralatyrvalargthraspala

100105110

asnalalysmetthrvalvallysasptyrleuaspglntyrthrthr

115120125

lyspheasnthrtrplysarggluproasnasnglnsertyrargthr

130135140

alavalilethrglnpheasnleuthrseralalysleuarggluthr

145150155160

alavaltyrpheserasnleuvalglytyrgluleuleuleuleupro

165170175

iletyralaglnvalalaasnpheasnleuleuleuileargaspgly

180185190

leuileasnalaglnglutrpserleualaargseralaglyaspgln

195200205

leutyrasnthrmetvalglntyrthrlysglutyrilealahisser

210215220

ilethrtrptyrasnlysglyleuaspvalleuargasnlysserasn

225230235240

glyglntrpilethrpheasnasptyrlysargglumetthrilegln

245250255

valleuaspileleualaleuphealasertyraspproargargtyr

260265270

proalaasplysileaspasnthrlysleuserlysthrgluphethr

275280285

arggluiletyrthralaleuvalgluserproserserlysserile

290295300

alaalaleuglualaalaleuthrargaspvalhisleuphethrtrp

305310315320

leulysargvalaspphetrpthrasnthriletyrglnaspleuarg

325330335

pheleuseralaasnlysileglyphesertyrthrasnserserala

340345350

metglngluserglyiletyrglyserserglypheglyserasnleu

355360365

thrhisglnileglnleuasnserasnvaltyrlysthrserilethr

370375380

aspthrserserproserasnargvalthrlysmetaspphetyrlys

385390395400

ileaspglythrleualasertyrasnserasnilethrprothrpro

405410415

gluglyleuargthrthrphepheglypheserthrasngluasnthr

420425430

proasnglnprothrvalasnasptyrthrhisileleusertyrile

435440445

lysthraspvalileasptyrasnserasnargvalserphealatrp

450455460

thrhislysilevalaspproasnasnglniletyrthraspalaile

465470475480

thrglnvalproalavallysserasnpheleuasnalathralalys

485490495

valilelysglyproglyhisthrglyglyaspleuvalalaleuthr

500505510

serasnglythrleuserglyargmetgluileglncyslysthrser

515520525

ilepheasnaspprothrargsertyrglyleuargileargtyrala

530535540

alaasnserproilevalleuasnvalsertyrvalleuglnglyval

545550555560

serargglythrthrileserthrgluserthrpheserargproasn

565570575

asnileileprothraspleulystyrgluglupheargtyrlysasp

580585590

propheaspalailevalprometargleuserserasnglnleuile

595600605

thrilealaileglnproleuasnmetthrserasnasnglnvalile

610615620

ileaspargilegluileileproilethrglnservalleuaspglu

625630635640

thrgluasnglnasnleuglusergluarggluvalvalasnalaleu

645650655

phethrasnaspalalysaspalaleuasnileglythrthrasptyr

660665670

aspileaspglnalaalaasnleuvalglucysileserglugluleu

675680685

tyrprolysglulysmetleuleuleuaspgluvallysasnalalys

690695700

glnleuserglnserargasnvalleuglnasnglyaspphegluser

705710715720

alathrleuglytrpthrthrseraspasnilethrileglngluasp

725730735

aspproilephelysglyhistyrleuhismetserglyalaargasp

740745750

ileaspglythrilepheprothrtyrilepheglnlysileaspglu

755760765

serlysleulysprotyrthrargtyrleuvalargglyphevalgly

770775780

serserlysaspvalgluleuvalvalserargtyrglyglugluile

785790795800

aspalailemetasnvalproalaaspleuasntyrleutyrproser

805810815

thrpheaspcysgluglyserasnargcysgluthrseralavalpro

820825830

alaasnileglyasnthrseraspmetleutyrsercysglntyrasp

835840845

thrglylyslyshisvalvalcysglnaspserhisglnpheserphe

850855860

thrileaspthrglyalaleuaspthrasngluasnileglyvaltrp

865870875880

valmetphelysileserserproaspglytyralaserleuaspasn

885890895

leugluvalileglugluglyproileaspglyglualaleuserarg

900905910

vallyshismetglulyslystrpasnaspglnmetglualalysarg

915920925

sergluthrglnglnalatyraspvalalalysglnalaileaspala

930935940

leuphethrasnvalglnaspglualaleuglnpheaspthrthrleu

945950955960

alaglnileglntyralaglutyrleuvalglnserileprotyrval

965970975

tyrasnasptrpleuseraspvalproglymetasntyraspiletyr

980985990

valgluleuaspalaargvalalaglnalaargtyrleutyraspthr

99510001005

argasnileilelysasnglyaspphethrglnglyvalmetgly

101010151020

trphisvalthrglyasnalaaspvalglnglnileaspglyval

102510301035

servalleuvalleuserasntrpseralaglyvalserglnasn

104010451050

valhisleuglnhisasnhisglytyrvalleuargvalileala

105510601065

lyslysgluglyproglyasnglytyrvalthrleumetaspcys

107010751080

glugluasnglnglulysleuthrphethrsercysgluglugly

108510901095

tyrilethrlysthrvalaspvalpheproaspthraspargval

110011051110

argilegluileglygluthrgluglyserphetyrilegluser

111511201125

ilegluleuilecysmetasnglu

11301135

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1