对电子提交的序列表的引用
该序列表的官方副本是以ascii格式的序列表以2018年8月27日生成的名为“81292-cn-reg-org-p_seqlist_st25.txt”的文件进行电子提交的,并且该序列表的大小为247千字节并且与本说明书同时提交。包含在该ascii格式文件中的序列表是本说明书的一部分,并且通过引用以其全文结合在此。
本发明涉及杀有害生物蛋白和编码它们的核酸分子,连同用于控制植物有害生物的组合物和方法。
背景技术:
苏云金芽孢杆菌(bacillusthuringiensis,bt)是一种革兰氏阳性的孢子形成的土壤细菌,其特征在于它产生晶体包含体的能力,这些晶体包含体对于某些目以及种的植物有害生物(包括昆虫)是特异地有毒的,但是对于植物和其他非靶标生物是无害的。出于这个原因,包含苏云金芽孢杆菌菌株或它们的杀昆虫蛋白的组合物可以用作环境上可接受的杀昆虫剂以控制农业昆虫有害生物或多种人或动物疾病的昆虫载体。
来自苏云金芽孢杆菌的晶体(cry)蛋白主要针对鳞翅目的、双翅目的、以及鞘翅目的有害生物昆虫具有有力的杀昆虫活性。这些蛋白质还已经显示针对以下目的有害生物的活性:膜翅目、同翅目、毛虱目、食毛目、以及壁虱目,连同其他的无脊椎动物目,如线虫动物门、扁形动物门、以及肉足鞭毛亚门(feitelson,j.,1993,thebacillusthuringiensisfamilytree[苏云金芽孢杆菌家族树],在:advancedengineeredpesticides[前沿的工程化的杀有害生物剂],马塞尔德克尔公司(marceldekker,inc.),纽约,纽约州)。这些蛋白质最初主要基于它们的杀昆虫活性而被分类为cryi至cryvi。主要的类别是鳞翅目特异性(i)、鳞翅目和双翅目特异性(ii)、鞘翅目特异性(iii)、双翅目特异性(iv)、以及线虫特异性(v)和(vi)。这些蛋白质进一步被分类为子族;在各个家族内的更高相关的蛋白质指定了区分的字母,如cryia、cryib、cryic等。在各个区分内的甚至更紧密相关的蛋白质被给定名称,例如cryic(a)、cryic(b)等。术语“cry毒素”以及“δ-内毒素”与术语“cry蛋白”已可互换地使用。对于cry蛋白和基因的当前命名法基于氨基酸序列同源性而不是昆虫靶标特异性(crickmore等人,(1998),microbiol.mol.biol.rev.[微生物分子生物学评论],62:807-813)。在这个更可接受的分类中,每种毒素被指定唯一的名称,所述名称合并了初级等级(阿拉伯数字)、二级等级(大写字母)、三级等级(小写字母)、以及四级等级(另一个阿拉伯数字)。在当前分类中,在初级等级中罗马数字已经换为阿拉伯数字。例如,在旧命名法下的“cryia(a)”现在在当前命名法下是“cry1aa”。根据ibrahim等人(2010,bioeng.bugs[生物工程学蝽象],1:31-50),cry毒素仍然可以根据其昆虫宿主特异性被分为六个主要类别并且包括:组1—鳞翅目(例如cry1、cry9和cry15);组2—鳞翅目和双翅目(例如cry2);组3—鞘翅目(cry3、cry7和cry8);组4—双翅目(cry4、cry10、cry11、cry16、cry17、cry19和cry20);组5—鳞翅目和鞘翅目(cry1i);以及组6—线虫(cry6)。cry1i、cry2、cry3、cry10和cry11毒素(73–82kda)是独特的,因为它们似乎是更大cry1和cry4蛋白(130–140kda)的天然截短。
cry蛋白是在bt的孢子形成阶段期间以结晶形式积聚为原毒素的球状蛋白质分子。在由有害生物摄取后,这些晶体典型地被溶解以释放原毒素,原毒素大小的范围可以为,例如,对于许多鳞翅目有活性的cry蛋白如cry1和cry9为从130-140kda,并且对于鞘翅目有活性的cry3蛋白及鳞翅目/双翅目有活性的cry2蛋白为60-80kda。在这些晶体被易感昆虫溶解后,这些释放的原毒素被昆虫肠道中的蛋白酶例如胰蛋白酶和胰凝乳蛋白酶加工,以产生抗蛋白酶的核心cry蛋白毒素。这种蛋白水解加工涉及从各种cry原毒素的不同区域去除氨基酸。例如,为130-140kda的cry原毒素典型地通过蛋白水解去除25-30个氨基酸的n-末端肽以及c-末端的大约一半的剩余蛋白来激活,产生大约60-70kda成熟cry毒素。为60-80kda的原毒素(例如cry2和cry3)也被加工但是其程度不与更大的原毒素相同。与更大的原毒素相比,较小的原毒素典型地从n-末端去除相等或更多个氨基酸,但较少氨基酸被从c-末端去除。例如,cry2家族成员的蛋白水解激活典型地涉及去除大约40-50个n-末端氨基酸。许多cry蛋白对特定的靶标昆虫是相当有毒的,但许多具有窄的活性谱。
cry蛋白通常具有五个保守序列结构域、以及三个保守结构性结构域(参见例如,demaagd等人,(2001)trendsgenetics[遗传学趋势],17:193-199)。第一保守结构性结构域(称作结构域i)典型地由七个α螺旋组成并且参与膜插入以及孔形成。结构域ii典型地由三个布置为希腊钥匙构型的β片层组成,并且结构域iii典型地由两个处于“果冻卷”(‘jelly-roll’)构造的反平行的β片层组成(demaagd等人,2001,同上)。结构域ii和iii参与受体识别和结合,并且因此被认为是毒素特异性的决定物。
众多商业上有价值的植物(包括普通的农作物)易受植物有害生物(包括昆虫和线虫有害生物)的攻击的影响,导致作物产量和品质的实质性降低。例如,植物有害生物是在全世界重要农作物损失中的主要因素。由于昆虫有害生物和疾病,在中国每年收获的谷类损失约15%-20%。此外,由于无脊椎有害生物(包含昆虫)的侵染,仅在美国每年就损失约80亿美元。昆虫有害生物对于菜农和果农,对于观赏性花卉的生产商,以及对于家庭花匠也是负担。
昆虫有害生物主要是通过密集施用化学杀有害生物剂来控制,这些化学杀有害生物剂通过抑制昆虫成长、预防昆虫摄食或繁殖、或者导致死亡而有效。生物性有害生物控制剂,如表达杀有害生物毒素(如cry蛋白)的苏云金芽孢杆菌菌株,也已经施用于作物植物中,产生了令人满意的结果,提供化学杀有害生物剂的替代物或补充物。已经分离了编码这些cry蛋白中的一些的基因并且它们在异源宿主(如转基因植物)中的表达已经显示出提供了另一种用于控制经济上重要的昆虫有害生物的手段。
因此可以达到良好的昆虫控制,但是某些化学品有时也能影响非目标有益昆虫,并且某些生物制剂具有非常窄的活性谱。此外,某些化学和生物控制方法的继续使用增加了昆虫有害生物对此类控制措施产生抗性的机会。通过各种抗性管理实践已部分地缓和了这种状况,但仍需要开发新的并有效的有害生物控制剂,这些有害生物控制剂为农民提供经济利益并且是环境可接受的。特别需要的是可以靶向更广谱的经济上重要的昆虫有害生物并有效控制昆虫品系的控制剂,这些昆虫品系对现有的昆虫控制剂是有抗性的或可以变得有抗性。
技术实现要素:
鉴于这些需求,本发明的目的是通过提供可以用来控制多种植物有害生物的新颖基因和杀有害生物蛋白来提供新的有害生物控制剂。
本发明提供了用于赋予细菌、植物、植物细胞、组织以及种子的杀有害生物活性的组合物以及方法。特别地,提供了包含衍生自组装的多核苷酸、编码cry蛋白的新颖多核苷酸的嵌合基因以及基本上与其相同的序列,这些序列的表达产生具有对经济上重要的昆虫有害生物(特别是侵染植物的昆虫有害生物)的毒性的蛋白质。本发明进一步涉及由这些多核苷酸的表达产生的新颖cry蛋白,并且涉及含有这些cry蛋白的组合物以及配制品,它们通过抑制昆虫有害生物的生存、生长以及繁殖或者限制昆虫相关的对作物植物的损害或损失的能力对昆虫是有毒的。本发明的cry蛋白包括衍生自组装的多核苷酸的cry蛋白以及具有一个或多个氨基酸取代、添加或缺失的突变型或变体cry蛋白。突变型cry蛋白的实例包括但不限于被突变为具有比天然cry蛋白对应物更宽的活性谱或更高的特异活性的那些,经突变以引入表位来产生从天然蛋白质中差异性地识别出经突变的蛋白质的抗体的那些,或经突变以调节在转基因生物中的表达的那些。本发明的新颖cry蛋白对昆虫有害生物是高毒性的。例如,本发明的cry蛋白可以用于控制一种或多种经济学上重要的昆虫有害生物,这些昆虫有害生物例如亚洲玉米蛀虫(asiancornborer)(亚洲玉米螟(ostriniafurnacalis))、黑色地老虎(blackcutworm)(小地老虎(agrotisipsilon))、棉螟蛉(cottonbollworm)(棉铃虫(helicoverpaarmigera))、黄色桃螟虫(yellowpeachborer)(桃蛀螟(conogethespunctiferalis))、东方黏虫(orientalarmyworm)(东方粘虫(mythimnasepatate))、欧洲玉米蛀虫(europeancornborer)(欧洲玉米螟(ostrinianubilalis))、秋黏虫(fallarmyworm)(草地贪夜蛾(spodopterafrugiperda))、玉米穗蛾(cornearworm)(玉米穗虫(helicoverpazea))、甘蔗螟(sugarcaneborer)(小蔗螟(diatraeasaccharalis))、绒毛豆毛虫(velvetbeancaterpillar)(黎豆夜蛾(anticarsiagemmatalis))、大豆夜蛾(soybeanlooper)(大豆尺蠖(chrysodeixisincludes))、西南玉米蛀虫(southwestcornborer)(西南玉米螟(diatraeagrandiosella))、西部豆切根虫(westernbeancutworm)(西部豆夜蛾(richiaalbicosta))、烟夜蛾(tobaccobudworm)(烟芽夜蛾(heliothisvirescens))、条纹蛀茎虫(stripedstemborer)(二化螟(chilosuppressalis))、粉蛀茎虫(pinkstemborer)(非洲大螟(sesamiacalamistis))、水稻卷叶螟(riceleaffolder)(稻纵卷叶螟(cnaphalocrocismedinalis))等。
本发明还提供了合成多核苷酸,其编码本发明的cry蛋白,这些cry蛋白已经进行一个或多个密码子优化用于在转基因生物如转基因细菌或转基因植物中表达。
本发明进一步涉及表达盒和重组载体,其包含编码本发明的cry蛋白的多核苷酸。本发明还提供了包含嵌合基因、或表达盒或重组载体的经转化的细菌、植物、植物细胞、组织、以及种子,该嵌合基因或表达盒或重组载体在经转化的细菌、植物、植物细胞、组织以及种子中表达本发明的cry蛋白方面是有用的。
本发明还涉及分离的苏云金芽孢杆菌(bt)菌株,这些菌株产生本发明的cry蛋白。
本发明还涉及使用这些本发明的多核苷酸的方法,例如在dna构建体或嵌合基因或表达盒或重组载体中用于在生物(包括植物和微生物,如细菌)中进行转化和表达。核苷酸或氨基酸序列可以是已经被设计用于在生物(如植物或细菌)中表达的组装的、天然的或密码子优化的序列,或者制成杂合的、具有增强的杀有害生物活性的cry毒素。本发明进一步涉及制备这些cry蛋白的方法以及使用这些多核苷酸序列和cry蛋白的方法,例如,在微生物中控制昆虫或者在转基因植物中赋予保护免受昆虫损害。
本发明的另一个方面包括杀昆虫组合物和配制品,这些组合物和配制品包含本发明的cry蛋白或苏云金芽孢杆菌菌株;以及使用这些组合物或配制品来控制昆虫群体的方法,例如通过将这些组合物或配制品施用至昆虫侵袭的区域,或者施用至预防性处理易感染昆虫的区域或植物以赋予针对昆虫有害生物的保护。任选地,除本发明的cry蛋白或bt菌株之外,本发明的这些组合物或配制品还可以包含其他杀有害生物剂(如化学杀有害生物剂)以加强或增强组合物或配制品的昆虫控制能力。
本发明的这些组合物和方法可用于控制攻击植物、特别是作物植物的昆虫有害生物。本发明的这些组合物对于产生改变的或改进的具有杀有害生物活性的cry蛋白、或对于检测商用产品或转基因生物中的cry蛋白或核酸的存在也是有用的。
参考以下详细说明书和权利要求书,本发明的这些和其他特征、方面、以及优点将变得更好理解。
序列表中的序列简述
seqidno:1代表对bt264蛋白进行编码的核苷酸序列。
seqidno:2代表对bt288蛋白进行编码的核苷酸序列。
seqidno:3代表对bt302蛋白进行编码的核苷酸序列。
seqidno:4代表对bt454蛋白进行编码的核苷酸序列。
seqidno:5代表对bt485蛋白进行编码的核苷酸序列。
seqidno:6代表对bt264蛋白进行编码的密码子优化序列。
seqidno:7代表对bt288蛋白进行编码的密码子优化序列。
seqidno:8代表对bt302蛋白进行编码的密码子优化序列。
seqidno:9代表对bt454蛋白进行编码的密码子优化序列。
seqidno:10代表对bt485蛋白进行编码的密码子优化序列。
seqidno:11代表对突变型bt264蛋白进行编码的核苷酸序列。
seqidno:12代表对突变型bt288蛋白进行编码的核苷酸序列。
seqidno:13代表对突变型bt302蛋白进行编码的核苷酸序列。
seqidno:14代表对突变型bt454蛋白进行编码的核苷酸序列。
seqidno:15代表对突变型bt485蛋白进行编码的核苷酸序列。
seqidno:16代表bt264蛋白的氨基酸序列。
seqidno:17代表bt288蛋白的氨基酸序列。
seqidno:18代表bt302蛋白的氨基酸序列。
seqidno:19代表bt454蛋白的氨基酸序列。
seqidno:20代表bt485蛋白的氨基酸序列。
seqidno:21代表突变型bt264蛋白的氨基酸序列。
seqidno:22代表突变型bt288蛋白的氨基酸序列。
seqidno:23代表突变型bt302蛋白的氨基酸序列。
seqidno:24代表突变型bt454蛋白的氨基酸序列。
seqidno:25代表突变型bt485蛋白的氨基酸序列。
seqidno:26代表seqidno:17的n-末端。
seqidno:27代表seqidno:17的c-末端。
seqidno:28代表seqidno:18的n-末端。
seqidno:29代表seqidno:18的c-末端。
seqidno:30代表seqidno:20的n-末端。
seqidno:31代表seqidno:20的c-末端。
seqidno:32是cry54aa蛋白的氨基酸序列。
seqidno:33是cry4aa蛋白的氨基酸序列。
seqidno:34是cry39aa蛋白的氨基酸序列。
seqidno:35是cry19ca蛋白的氨基酸序列。
seqidno:36是cry50ba蛋白的氨基酸序列。
seqidno:37是cry4ba蛋白的氨基酸序列。
具体实施方式
本说明不旨在是可以实施本发明的所有不同方式,或可以添加到本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以并入其他实施例中,并且关于一个特定实施例所说明的特征可以从那个实施例删除。因此,本发明考虑了,在本发明的一些实施例中,可以排除或省略在此陈述的任何特征或特征的组合。此外,鉴于本披露内容,在此建议的不同实施例的众多变化以及附加对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些特定实施例,并且并没有穷尽地叙述其所有排列、组合和变化。
除非另外定义,在此所使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。在此本发明的说明中使用的术语是仅出于描述特定实施例的目的,且并不旨在限制本发明。
定义
当在此和所附权利要求书中使用时,单数形式“一个/种(a/an)”和“该(the)”包括复数指代物,除非上下文另外明确地指示。因此,例如,提及“一种植物”是提及一种或多种植物并且包括本领域技术人员已知的其等效物等。
如在此使用的,词语“和/或”是指并且涵盖一个或多个相关联的列出项的任何及全部可能组合,连同当以可替代性(“或”)解释时组合的缺少。
术语“约”在此用于意指大约、大致、约或在……左右。当术语“约”结合数值范围来使用时,它通过将边界延伸至高于以及低于所阐明的数值来限定这个范围。通常,术语“约”在此用于将数值限定至以20%的变化,优选地10%上下(更高或更低)地高于以及低于规定值。关于温度,术语“约”意指±1℃,优选±0.5℃。当术语“约”被用于本发明的上下文中(例如与温度或分子量值组合)时,精确值(即,无“约”)是优选的。
如在此使用的,术语“扩增的”意指使用至少一种核酸分子作为模板,构建核酸分子的多个拷贝或与该核酸分子互补的多个拷贝。扩增系统包括聚合酶链式反应(pcr)系统、连接酶链式反应(lcr)系统、基于核酸序列的扩增(nasba,安大略省密西索加的坎基尼公司(cangene,mississauga,ontario))、q-β复制酶系统、基于转录的扩增系统(tas)、以及链置换扩增(sda)。参见例如,diagnosticmolecularmicrobiology:principlesandapplications[诊断分子微生物学:原理与应用],persing等人编著,华盛顿美国微生物学会(americansocietyformicrobiology,washington,d.c.),(1993)。扩增产物被称为“扩增子”。
根据本发明的“组装的序列”、“组装的多核苷酸”、“组装的核苷酸序列”等是通过比对多核苷酸或测序的多核苷酸的部分(即k-mer,通过dna测序获得的读数的长度k的所有可能的子序列)的重叠序列制备的合成多核苷酸,其使用dna测序技术从基因组dna确定。组装的序列典型地含有碱基识别(base-calling)错误,与获得基因组dna的基因组中包含的天然dna序列相比,碱基识别错误可能是错误确定的碱基、插入和/或缺失。因此,例如,“组装的多核苷酸”可以编码蛋白质,并且根据本发明,该多核苷酸和该蛋白质二者都不是天然产物,而是仅通过人类行为而存在。
如在此使用的术语“嵌合构建体”或“嵌合基因”或“嵌合多核苷酸”或“嵌合核酸”(或类似术语)是指如下构建体或分子,该构建体或分子包含被组装进单个核酸分子中的不同来源的两个或更多个多核苷酸。术语“嵌合构建体”、“嵌合基因”、“嵌合多核苷酸”或“嵌合核酸”是指如下任何构建体或分子,该构建体或分子含有但不限于(1)多核苷酸(例如,dna),包括在自然界中没有被发现在一起的调节多核苷酸和编码多核苷酸(即,构建体中的至少一个多核苷酸相对于它的其他多核苷酸中的至少一个是异源的),或(2)编码不是天然毗邻的蛋白质部分的多核苷酸,或(3)不是天然毗邻的启动子部分。另外,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸可以包含衍生自不同来源的调节多核苷酸和编码多核苷酸,或包含衍生自相同来源、但以与在自然界中所发现的不同的方式进行布置的调节多核苷酸和编码多核苷酸。在本发明的一些实施例中,嵌合构建体、嵌合基因、嵌合多核苷酸或嵌合核酸包含表达盒,该表达盒包含在调节多核苷酸的控制下、特别地在植物或细菌中具有功能性的调节多核苷酸的控制下的本发明的多核苷酸。
“编码序列”是转录成rna(如mrna、rrna、trna、snrna、正义rna或反义rna)的核酸序列。优选地,rna进而在生物中被翻译以产生蛋白质。
如在此使用的,“密码子优化的”序列意指如下核苷酸序列,其中这些密码子被选择以反映宿主细胞或生物可以具有的特定的密码子偏好性。这典型地是以这样一种方式来完成,该方式是为了保持由待优化的核苷酸序列所编码的多肽的氨基酸序列。在某些实施例中,重组dna构建体的dna序列包括已经针对该构建体有待在其中进行表达的细胞(例如,动物、植物、或真菌细胞)进行了密码子优化的序列。例如,有待在植物细胞中表达的构建体可以使其全部或部分序列(例如,第一基因抑制元件或基因表达元件)进行密码子优化用于在植物中表达。参见例如,美国专利号6,121,014,通过引用结合在此。
“控制”昆虫意指通过毒性作用抑制昆虫有害生物存活、生长、摄食、或繁殖的能力,或者限制昆虫相关的作物植物损害或损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“控制”昆虫可以是或可以不是意指杀死昆虫,尽管其优选意指杀死昆虫。
术语“包含(comprises或comprising)”当用于本说明书中时指示所说明的特征、整数、步骤、操作、要素、或组分的存在,但并不排除一个或多个其他特征、整数、步骤、操作、要素、组分、或其组的存在或添加。
如在此使用的,过渡短语“基本上由...组成”(以及语法变体)意指,权利要求书的范围有待被解读为涵盖权利要求书中所列举的指定材料或步骤以及不实质上改变所要求的发明的一个或多个基本和新颖特征的那些。因此,当用于本发明的权利要求中时,术语“基本上由...组成”并不旨在被解释为等同于“包含(comprising)”。
在本发明的上下文中,“对应于(correspondingto或correspondsto)”意指当变体或同系物cry蛋白的氨基酸序列与彼此比对时,“对应于”在该变体或同系物蛋白中某些枚举的位置的氨基酸是与参考蛋白中的这些位置比对的那些,但在相对于本发明的特定参考氨基酸序列而言的这些精确的数字位置中是不必要的。例如,如果seqidno:20是参考序列并且与seqidno:27比对的话,seqidno:27的gln151“对应于”seqidno:20的gln144,或者例如,seqidno:27的asn301“对应于”seqidno:20的thr294。
如在此使用的,术语“cry蛋白”意指可以在苏云金芽孢杆菌或相关细菌中以结晶形式存在的杀昆虫蛋白。术语“cry蛋白”可以指原毒素形式或其任何杀昆虫片段或毒素。
“递送”组合物或毒性蛋白意指该组合物或毒性蛋白与昆虫接触,这促进该组合物或毒性蛋白的经口摄取,产生对昆虫的毒性作用和控制。可以按照许多公认的方式,包括但不限于转基因植物表达、一种或多种配制的蛋白质组合物、一种或多种可喷洒的蛋白质组合物、饵基(baitmatrix)、或任何其他的领域公认的蛋白质递送系统来递送该组合物或毒性蛋白。
术语“结构域”是指沿着进化相关蛋白的序列的比对在特定位置处保守的一组氨基酸。虽然其他位置上的氨基酸可在同系物之间有所不同,但是在特定位置处高度保守的氨基酸指示在蛋白质的结构、稳定性或功能中很可能是必需的氨基酸。通过其在蛋白质同系物家族的经比对序列中的高度保守性进行鉴别,其可用作鉴别物(identifier),用来确定所讨论的任何多肽是否属于先前鉴别的多肽组。
“有效的昆虫控制量”意指毒性蛋白的浓度,它通过毒性作用抑制昆虫存活、生长、摄食或繁殖的能力,或者限制昆虫相关的损害或作物植物损失,或者保护在昆虫有害生物存在的条件下生长时的作物的产量潜力。“有效的昆虫控制量”可以是或可以不是意指杀死昆虫,尽管其优选意指杀死昆虫。
如在此使用的“表达盒”意指能够在适当的宿主细胞中指导至少一种目的多核苷酸(例如编码本发明的cry蛋白的多核苷酸)的表达的核酸序列,包括启动子,该启动子可操作地连接至目的多核苷酸,该多核苷酸可操作地连接至终止信号。“表达盒”还典型地包含正确翻译目的多核苷酸所需的另外的多核苷酸。该表达盒还可以包含在目的多核苷酸的直接表达中不是必需的但是由于用于从一个表达载体去除该表达盒的方便限制位点而存在的其他多核苷酸。包含一个或多个目的多核苷酸的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少一种是异源的。该表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。然而,典型地,该表达盒相对于该宿主是异源的,即在该表达盒中的目的多核苷酸不是天然存在于该宿主细胞中的,并且必须已经通过转化过程或育种过程引入到该宿主细胞或该宿主细胞的祖先中。该表达盒中的一个或多个目的多核苷酸的表达通常是在启动子的控制下。在多细胞生物(如植物)的情况下,启动子还可能对于特定组织、或器官、或者发育阶段是特异性的或优先的。当被转化进植物中时,表达盒或其片段也可被称为“插入的多核苷酸”或者“插入多核苷酸”。
“基因”在此定义为包含一个或多个多核苷酸的遗传单位,该遗传单位占据染色体或质粒上特定位置并且含有用于生物中的特定特征或性状的遗传指令。
“肠蛋白酶”是在昆虫的消化道中天然发现的蛋白酶。这种蛋白酶通常参与被摄取的蛋白质的消化。肠蛋白质酶的实例包括胰蛋白酶,其典型地切割赖氨酸(k)或精氨酸(r)残基的c-末端侧上的肽;以及胰凝乳蛋白酶,其典型地切割苯丙氨酸(f)、色氨酸(w)或酪氨酸(y)的c-末端侧上的肽。
当提及基因或多核苷酸或多肽使用时,术语“异源”是指基因或多核苷酸或多肽不是在其天然环境中或包含其非天然环境中存在的一部分(即,已经通过人工改变)。例如,异源基因可以包括自一个物种引入到另一个物种的多核苷酸。异源基因还可以包括对生物来说是天然的多核苷酸,该多核苷酸已经以一些方式(例如,经突变;以多个拷贝添加;连接至一种非天然启动子或增强子多核苷酸等)被改变。异源基因可以进一步包含植物基因多核苷酸,其包含植物基因的cdna形式;这些cdna可以以正义方向(以产生mrna)或反义方向(以产生一种反义rna转录本,其与mrna转录本是互补的)被表达。在本发明的一个方面,异源基因区别于内源性植物基因在于该异源基因多核苷酸被典型地连接至包含调节元件如启动子的多核苷酸上,未发现这些多核苷酸与由该异源基因编码的蛋白质的基因或与该染色体中的植物基因多核苷酸天然相关联,或者与在自然界中未发现的染色体的部分(例如,在基因座中表达的基因,其中该基因未正常表达)相关联。另外,“异源”多核苷酸是指不与将多核苷酸引入其中的宿主细胞天然地相关联的多核苷酸,包括天然存在的多核苷酸的非天然存在的多拷贝。
“同源重组”是在相同的多核苷酸的区域中成对染色体的两个dna分子或染色单体之间的dna片段的交换(“交叉”)。“重组事件”在此被理解为意指减数分裂交叉。
当核酸序列编码了多肽(该多肽与由参考核酸序列所编码的多肽具有相同的氨基酸序列)时,该核酸序列与参考核酸序列“同类编码”。例如,seqidno:6与seqidno:1为同类编码,因为它们都编码由seqidno:16代表的氨基酸序列。
术语“分离的”核酸分子、多核苷酸或蛋白质是不再存在于其天然环境中的核酸分子、多核苷酸或蛋白质。本发明的分离的核酸分子、多核苷酸或蛋白质可以按照纯化的形式存在,或者可以存在于重组宿主中,例如转基因细菌或转基因植物中。因此,如在此所列举的对“分离的”核酸分子的要求涵盖当核酸分子包含在转基因植物基因组内时的核酸分子。
“核酸分子”是可以从任何来源中分离的或可以合成制备的单链或双链dna或rna。在本发明的上下文中,该核酸分子优选地是dna区段。
“可操作地连接”是指在单一核酸片段上多核苷酸的关联,这样使得一者的功能影响另一者的功能。例如,当启动子能够影响编码多核苷酸或功能rna的表达时(即,该编码多核苷酸或功能rna处于该启动子的转录控制之下),则该启动子与该编码多核苷酸或功能rna是可操作地连接的。正义方向或者反义方向的编码多核苷酸能够与调节多核苷酸可操作地连接。
如在此使用的“杀有害生物”、“杀昆虫”等是指本发明的cry蛋白控制有害生物的能力或者可以控制如在此所定义的有害生物的cry蛋白的量。因此,杀有害生物cry蛋白可以杀死或抑制有害生物(例如,昆虫有害生物)存活、生长、摄食、或繁殖的能力。
“植物”是在发育的任何阶段的任何植物,特别是种子植物。
“植物细胞”是植物的结构和生理单位,包含原生质体和细胞壁。植物细胞可以处于分离的单个细胞或培养细胞的形式,或者是作为较高级的组织单位(如例如,植物组织、植物器官、或全株植物)的一部分。
“植物细胞培养物”意指植物单元(如例如,原生质体、细胞培养物细胞、植物组织中的细胞、花粉、花粉管、胚珠、胚囊、接合子以及处于不同发育阶段的胚)的培养物。
“植物材料”是指叶、茎、根、花或花的部分、果实、花粉、卵细胞、接合子、种子、切条、细胞或组织培养物、或植物的任何其他部分或产物。
“植物器官”是植物的独特而明显的已结构化并且分化的部分,如根、茎、叶、花蕾或胚。
如在此使用的“植物组织”意指组织化成结构和功能单元的一组植物细胞。包括植物中或培养物中的任何植物组织。这个术语包括但不限于:全株植物、植物器官、植物种子、组织培养物以及被组织化成结构或功能单元的任何植物细胞群组。这个术语与如以上列出的或由该定义以其他方式涵盖的任何具体类型的植物组织的联合应用或单独应用并不旨在排除任何其他类型的植物组织。
“多核苷酸”是指由共价键合于链中的许多核苷酸单体构成的聚合物。此类“多核苷酸”包括dna、rna、经修饰的寡核苷酸(例如,包含对于生物rna或dna不典型的碱基的寡核苷酸,如2'-o-甲基化寡核苷酸)等。在一些实施例中,核酸或多核苷酸可以是单链的、双链的、多链的或其组合。除非另外指示,否则本发明的具体核酸或多核苷酸任选地包含或编码除明确指示的任何多核苷酸之外的互补多核苷酸。
“目的多核苷酸”是指任何多核苷酸,当其转移至生物(例如,植物)中时赋予该生物所希望的特征,如昆虫抗性、疾病抗性、除草剂耐受性、抗生素抗性、改进的营养价值、工业过程中改进的性能、商业上有价值的酶或代谢物的生产、或者改变的繁殖能力。
术语“启动子”是指多核苷酸,通常在它的编码多核苷酸的上游(5'),它通过提供对正确转录所需的rna聚合酶以及其他因子的识别来控制该编码多核苷酸的表达。
“原生质体”是分离的植物细胞,没有细胞壁或仅具有部分的细胞壁。
如在此使用的,术语“重组”是指核酸分子(例如,dna或rna)或蛋白质或生物的如下形式,该形式通常不会在自然界中发现并且正因为如此通过人类干预来产生。如在此使用的,“重组核酸分子”是包括多核苷酸组合的核酸分子,这些多核苷酸不会天然地一起存在并且是人类干预的结果,例如,由至少两种彼此异源的多核苷酸的组合组成的核酸分子,或人工合成的(例如,使用组装的核苷酸序列合成的多核苷酸)并且包含偏离通常存在于自然界中的多核苷酸的多核苷酸的核酸分子,或包含人工掺入至宿主细胞的基因组dna中和该宿主细胞基因组相关侧翼dna中的转基因的核酸分子。重组核酸分子的另一个实例是由将转基因插入至植物的基因组dna中产生的dna分子,其可以最终导致该生物中的重组rna/或蛋白质分子的表达。如在此使用的,“重组植物”是通常不会在自然界中存在的植物,是人类干预的结果,并且含有掺入至其基因组中的转基因和/或异源核酸分子。由于此类基因组改变,该重组植物明显不同于相关的野生型植物。
“调节元件”是指参与控制核苷酸序列的表达的序列。调节元件包含可操作地连接至目的核苷酸序列的启动子以及终止信号。它们还典型地涵盖适当翻译该核苷酸序列所需的序列。
在两个核酸或氨基酸序列的上下文中,术语“同一性”或“相同的”或“基本上相同的”是指当针对最大对应性进行比较和比对时具有至少60%、优选至少80%、更优选90%、甚至更优选95%、并且最优选至少99%核苷酸或氨基酸残基同一性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目测检查所测量的。优选地,该基本的同一性存在于整个具有长度为至少约50个残基或碱基的序列的区域中,更优选地在整个至少约100个残基或碱基的区域中,并且最优选地这些序列在至少约150个残基或碱基上是基本上相同的。在尤其优选的实施方式中,在整个编码区域长度中的序列是基本上相同的。此外,基本上相同的核酸或氨基酸序列基本上执行相同的功能。
对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(如有必要,指定子序列坐标),并且指定序列算法程序的参数。然后,该序列比较算法基于所指定的程序参数来计算这个或这些测试序列相对于该参考序列的序列同一性百分比。
用于比较的序列的最佳比对可以按照以下方式进行,例如通过smith和waterman,adv.appl.math.[应用数学进展]2:482(1981)的局部同源性算法、通过needleman和wunsch,j.mol.biol.[分子生物学杂志]48:443(1970)的同源比对算法、通过pearson和lipman,proc.nat'l.acadsci.usa[美国国家科学院院刊]85:2444(1988)的相似性方法的搜索,通过这些算法的计算机化实施(威斯康星州遗传学分析软件包中的gap、bestfit、fasta和tfasta,遗传学计算机组(geneticscomputergroup),科学街575号(575sciencedr.),麦迪逊,威斯康星州),或通过目测检查(总体上参见ausubel等人,下文)。
适合于确定序列同一性百分比以及序列相似性的算法的一个实例是blast算法,其描述于以下文献中:altschul等人,j.mol.biol.[分子生物学杂志]215:403-410(1990)。执行blast分析的软件是通过国家生物技术信息中心(thenationalcenterforbiotechnologyinformation,美国国家医学图书馆(u.s.nationallibraryofmedicine),洛克维尔大道8600号(8600rockvillepike),贝塞斯达,马里兰州20894美国)可供公众使用的。这种算法涉及首先通过鉴定查询序列中具有长度w的短字码而鉴定得分高的序列对(hsp),这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正值阈值的得分t。t被称为邻近字码得分阈(altschul等人,1990)。这些初始的邻近字码命中充当种子用于起始搜索以发现含有它们的较长的hsp。然后,将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列,使用参数m(对于一对匹配残基的奖赏得分;总是>0)和n(对于错配残基的罚分;总是<0)来计算累积的得分。对于氨基酸序列,使用得分矩阵来计算累积得分。当累积的比对得分从它的最大达到值降低了数量x;由于累积一个或多个负得分的残基比对使累积得分趋于0或0以下;或者到达任一序列的末端时,停止这些字码命中在每个方向上的延伸。blast算法的参数w、t、以及x决定了比对的灵敏度与速度。blastn程序(对核苷酸序列来说)使用字长(w)为11、期望值(e)为10、截止值(cutoff)为100、m=5、n=-4、以及两条链的比较作为默认值。对于氨基酸序列,blastp程序使用字长(w)为3、期望值(e)为10、以及blosum62评分矩阵作为默认值(参见henikoff和henikoff,proc.natl.acadsci.usa[美国国家科学院院刊]89:10915(1989))。
除了计算序列同一性百分比之外,blast算法还进行两个序列之间相似性的统计分析(参见例如,karlin和altschul,proc.nat'l.acad.sci.usa[美国国家科学院院刊]90:5873-5787(1993))。由blast算法提供的相似性的一种量度是最小概率总和(p(n)),它提供了在两个核苷酸或氨基酸序列之间会偶然发生匹配的概率的指示。例如,若在测试核酸序列与参考核酸序列的比较中最小概率总和小于约0.1、更优选地小于约0.01、并且最优选地小于约0.001,则该测试核酸序列被认为是与该参考序列相似的。
两个核酸序列基本上相同的另一个指示是这两种分子在严格条件下彼此杂交。短语“特异性杂交”是指分子在严格条件下仅与特定的核苷酸序列结合、双链化或杂交,这是在该序列存在于复合混合物(例如,总细胞的)dna或rna中时进行的。“基本上结合”是指在探针核酸与靶核酸之间的互补杂交,并且涵盖少量错配,这些错配可以通过降低杂交介质的严格来容纳,以实现靶核酸序列的所希望的检测。
在核酸杂交实验(如dna杂交和rna杂交)的上下文中,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。较长的序列在较高的温度下特异性杂交。对核酸杂交的广泛指导见于以下文献中:tijssen(1993)laboratorytechniquesinbiochemistryandmolecularbiology-hybridizationwithnucleicacidprobes[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第2章第i部分“overviewofprinciplesofhybridizationandthestrategyofnucleicacidprobeassays[杂交原理和核酸探针测定策略综述]”elsevier[爱思唯尔集团],纽约。通常,高严格杂交和洗涤条件在限定的离子强度和ph下被选定为比特定序列的热熔点(tm)低约5℃。典型地,在“严格条件”下,探针将会与它的靶子序列进行杂交,但不会与其他序列杂交。
tm是50%的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和ph下)。非常严格条件被选定为等于特定探针的tm。对于互补核酸(它们在dna或rna印迹中在滤器上具有超过100个互补的残基)的杂交的严格杂交条件的实例是在42℃下、具有1mg肝素的50%甲酰胺、将杂交进行过夜。高严格洗涤条件的实例是0.15mnacl在72℃下持续约15分钟。严格洗涤条件的实例是0.2×ssc洗涤在65℃下持续15分钟(参见,sambrook,下文,对于ssc缓冲剂的说明)。通常,高严格洗涤之前会先进行低严格洗涤,以去除背景探针信号。对于例如超过100个核苷酸的双链体的中等严格洗涤的实例是1×ssc在45℃下持续15分钟。对于例如超过100个核苷酸的双链体的低严格洗涤的实例是4-6×ssc在40℃下持续15分钟。对于短探针(例如,约10-50个核苷酸),严格条件典型地涉及小于约1.0m的na离子的盐浓度,典型地在ph7.0-8.3下约0.01至1.0m的na离子浓度(或其他盐类),并且该温度典型地是至少约30℃。还可以通过添加去稳定剂(如甲酰胺)来达到严格条件。一般而言,相比于不相关的探针,在特定的杂交测定中观察到高出2倍(或更高)的信噪比就表明检测到特异性杂交。如果在严格条件下彼此不杂交的核酸所编码的蛋白质是基本上相同的,则它们仍然是基本上相同的。例如,当使用遗传密码允许的最大程度的密码子简并而生成核酸的拷贝时,则发生这种情况。
以下是可以用来克隆同源核苷酸序列(这些序列与本发明的参考核苷酸序列基本上相同)的杂交/洗涤条件的设置的实例:参考核苷酸序列在以下条件下优选地与该参考核苷酸序列杂交:在7%十二烷基硫酸钠(sds)、0.5mnapo4、1mmedta中在50℃,并且在2×ssc、0.1%sds中在50℃洗涤;更令人希望的是在7%十二烷基硫酸钠(sds)、0.5mnapo4、1mmedta中在50℃,并且在1×ssc、0.1%sds中在50℃洗涤;仍更令人希望的是在7%十二烷基硫酸钠(sds)、0.5mnapo4、1mmedta中在50℃,并且在0.5×ssc、0.1%sds中在50℃洗涤;优选地在7%十二烷基硫酸钠(sds)、0.5mnapo4、1mmedta中在50℃,并且在0.1×ssc、0.1%sds中在50℃洗涤;更优选地在7%十二烷基硫酸钠(sds)、0.5mnapo4、1mmedta中在50℃,并且在0.1×ssc、0.1%sds中在65℃洗涤。
两个核酸序列或蛋白质基本上相同的另一个指示是由第一核酸编码的蛋白质与由第二核酸编码的蛋白质进行免疫性交联反应或与其特异性结合。因此,蛋白质典型地是与第二蛋白质基本上相同的,例如其中这两种蛋白质仅在保守性取代上不同。
如在此使用的,“合成多核苷酸”是指包含天然存在的多核苷酸中不存在的碱基或结构性特征的多核苷酸。例如,编码本发明的cry蛋白的合成多核苷酸(其包含更类似于双子叶植物或单子叶植物基因的g+c含量和正常密码子分布的核苷酸序列)被表述为合成的。本发明的合成多核苷酸还可以例如包含本发明的组装的核苷酸序列。
如在此使用的,对昆虫有害生物是“有毒的”cry蛋白意指该cry蛋白充当口服活性的昆虫控制剂以杀死昆虫有害生物,或者该cry蛋白能够破坏或阻止昆虫摄食、或引起对昆虫有害生物的生长抑制,其两者可以引起或可以不引起昆虫死亡。当本发明的cry蛋白被递送至昆虫或昆虫与cry蛋白进行经口接触时,结果典型地是该昆虫的死亡、或者该昆虫的生长减慢、或者该昆虫停止以使该有毒的cry蛋白可供该昆虫利用的来源为食。
“转化”是用于将异源核酸引入到宿主细胞或生物的方法。特别地,“转化”意指dna分子稳定地整合到目的生物的基因组中。
“转化的/转基因的/重组的”是指异源核酸分子已经引入其中的宿主生物如细菌或植物。核酸分子可以稳定地整合进入宿主基因组,或者,核酸分子也可以作为染色体外分于存在。这种染色体外分子能够自主复制。转化的细胞、组织或植物应当理解为不仅涵盖转化过程的终产物,而且涵盖其转基因子代。“非转化的”、“非转基因的”、或“非重组的”宿主是指不含该异源的核酸分子的野生型生物,例如细菌或植物。
在此的核苷酸通过以下标准缩写进行指示:腺嘌呤(a)、胞嘧啶(c)、胸腺嘧啶(t)、以及鸟嘌呤(g)。氨基酸也由以下标准缩写进行指示:丙氨酸(ala;a)、精氨酸(arg;r)、天冬酰胺(asn;n)、天冬氨酸(asp;d)、半胱氨酸(cys;c)、谷氨酰胺(gln;q)、谷氨酸(glu;e)、甘氨酸(gly;g)、组氨酸(his;h)、异亮氨酸(ile;1)、亮氨酸(leu;l)、赖氨酸(lys;k)、甲硫氨酸(met;m)、苯丙氨酸(phe;f)、脯氨酸(pro;p)、丝氨酸(ser;s)、苏氨酸(thr;t)、色氨酸(trp;w)、酪氨酸(tyr;y)、以及缬氨酸(val;v)。
本发明提供了用于控制有害的植物有害生物的组合物以及方法。特别地,本发明涉及由基因组dna组装的核苷酸序列编码的cry蛋白,其可以分离自细菌如苏云金芽孢杆菌,其对昆虫有害生物是有毒的;涉及包含编码这些cry蛋白的核苷酸序列的组装的多核苷酸和相关多核苷酸;以及涉及制备和使用这些组装的多核苷酸和相关多核苷酸以及cry蛋白来控制昆虫有害生物。
根据一些实施例,本发明提供核酸分子或任选地分离的核酸分子,该核酸分子包含以下、或基本上由以下组成、或由以下组成:编码处于其原毒素形式的cry蛋白或其生物活性或毒素片段的核苷酸序列,其中该核苷酸序列(a)与seqidno:1-5中任一项或其毒素编码片段的组装的序列具有至少80%到至少99%序列同一性;或者(b)编码包含氨基酸序列的蛋白质,该氨基酸序列与seqidno:16-20中任一项或其毒素片段具有至少80%到至少99%序列同一性;或者(c)是(a)或(b)的组装的核苷酸序列;或者(d)是(a)、(b)或(c)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。在其他实施例中,该核苷酸序列包含seqidno:1、seqidno:2、seqidno:3、seqidno:4、seqidno:5、或seqidno:1-5中任一项的任何毒素编码片段。在其他实施例中,该合成核苷酸序列包含seqidno:6、seqidno:7、seqidno:8、seqidno:9、seqidno:10、seqidno:11、seqidno:12、seqidno:13、seqidno:14、seqidno:15、或seqidno:6-15中任一项的任何毒素编码片段。
本发明还涵盖多核苷酸,其是cry蛋白原毒素编码多核苷酸的片段。“片段”旨在编码cry蛋白的核苷酸序列的一个部分。核苷酸序列的片段可以编码cry蛋白的生物活性部分,即所谓的“毒性片段”,或它可以是如下片段,使用以下披露的方法该片段可以用作杂交探针或pcr引物。核酸分子是cry蛋白编码核苷酸序列的片段,根据所期望的用途包括至少约15、20、50、75、100、200、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450个连续核苷酸,或高达存在于在此披露的全长cry蛋白编码核苷酸序列中的核苷酸的数目(例如,针对seqidno:1是3519个核苷酸)。“连续的”核苷酸旨在彼此直接相邻的核苷酸残基。本发明的核苷酸序列的一些片段将编码保留cry蛋白的生物活性、并且因此保留杀昆虫活性的毒性片段。“保留杀昆虫活性”旨在该片段将具有至少约30%、优选地至少约50%、更优选地至少约70%、甚至更优选地至少约80%的cry蛋白的杀昆虫活性。用于测量杀昆虫活性的方法在本领域是已熟知的。参见例如,czapla和lang,(1990),j.econ.entomol.[经济昆虫学杂志]83:2480-2485;andrews等人,(1988),biochem.j.[生物化学杂志]252:199-206;marrone等人,(1985),j.ofeconomicentomology[经济昆虫学杂志]78:290-293;以及美国专利号5,743,477,将其全部通过引用以其全文结合在此。
本发明的cry蛋白的毒素片段将编码至少约15、25、30、50、75、100、125、150、175、200、250、300、350、400、和450个连续的氨基酸,或高达存在于本发明的全长cry蛋白中的总数目的氨基酸(例如,针对seqidno:16是1173个氨基酸)。
在一些实施例中,本发明的核酸分子包含以下、或基本上由以下组成、或由以下组成:编码cry蛋白的核苷酸序列,该cry蛋白包含氨基酸序列,该氨基酸序列与seqidno:16-20中任一项或其毒素片段具有至少80%到至少99%序列同一性。在一些其他实施例中,该氨基酸序列包含以下、或基本由以下组成、或由以下组成:seqidno:16-20中任一项或其毒素片段。因此,在一些实施例中,借助于蛋白酶水解加工(例如通过从昆虫的肠中制备的蛋白酶)而已经被激活的cry蛋白可以被表征并且经激活的毒素片段的n-末端或c-末端氨基酸被鉴定。在本发明的这个方面,技术人员可以确定:例如,seqidno:16的毒素片段可包含seqidno:16的约26-605或约26-617或约26-628的氨基酸,或者seqidno:17的毒素片段可包含seqidno:17的从约45、或从约53至约622或约624、或至约642或至约662的氨基酸,或者seqidno:18的毒素片段可包含seqidno:18的从约氨基酸11、或从约氨基酸13、或从约氨基酸35、或从约氨基酸47至约氨基酸628、或至约氨基酸662的氨基酸,或者seqidno:19的毒素片段可包含seqidno:19的从约氨基酸24、或从氨基酸35、或从氨基酸47、或从氨基酸49至约氨基酸660、或至氨基酸670的氨基酸,或者seqidno:20的毒素片段可包含seqidno:20的从约氨基酸17、或从约氨基酸18、或从约氨基酸32、或从约氨基酸37至约氨基酸610、或至约氨基酸636、或至约氨基酸652、或至约氨基酸657、或至约氨基酸660、或至约氨基酸671的氨基酸,或者通过在该编码序列的适当位置处引入或消除蛋白酶加工位点以允许或消除昆虫、植物或微生物蛋白酶对更大变体蛋白质的蛋白水解切割而产生的cry蛋白变体的毒素片段也在本发明的范围内。此类操作的最终结果被理解为产生具有与完整cry原毒素蛋白相同或更好活性的毒素片段分子。
在本发明的一些实施例中,提供了嵌合基因,该嵌合基因包含异源启动子,该启动子可操作地连接至多核苷酸,该多核苷酸包含以下、或基本上由以下组成、或由以下组成:编码对于鳞翅目有害生物有毒的cry蛋白的核苷酸序列,其中该核苷酸序列(a)与seqidno:1-5中任一项或其毒素编码片段具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列同一性;或者(b)编码包含如下氨基酸序列的蛋白质,该氨基酸序列与seqidno:16-20中任一项或其毒素片段具有至少80%(例如80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)到至少99%(99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%)序列同一性;或者(c)是(a)或(b)的合成序列,该合成序列已经进行密码子优化用于在转基因生物中表达。
在其他实施例中,该异源启动子是植物可表达型启动子。例如但不限于,该植物可表达型启动子选自下组启动子,该组由以下组成:泛素、夜香树属黄病毒、玉米trpa、osmads6、玉蜀黍h3组蛋白、噬菌体t3基因95'utr、玉米蔗糖合成酶1、玉米醇脱氢酶1、玉米捕光复合物、玉米热休克蛋白、玉蜀黍mtl、豌豆小亚基rubp羧化酶、水稻肌动蛋白、水稻亲环蛋白、ti质粒甘露碱合酶、ti质粒胭脂碱合酶、矮牵牛查尔酮异构酶、豆类富甘氨酸蛋白1、马铃薯糖蛋白(potatopatatin)、凝集素、camv35s以及s-e9小亚基rubp羧化酶启动子。
在另外的实施例中,由嵌合基因编码的蛋白质对一种或多种鳞翅目有害生物是有毒的,这些鳞翅目有害生物选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟),粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)。
在另外的实施例中,该多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列,该核苷酸序列与seqidno:1或其毒素编码片段具有至少85%到至少99%序列同一性,或者与seqidno:2或其毒素编码片段具有至少95%到至少99%序列同一性,或者与seqidno:3或其毒素编码片段具有至少90%到至少99%序列同一性,或者与seqidno:4或其毒素编码片段具有至少90%到至少99%序列同一性,或者与seqidno:5或其毒素编码片段具有至少95%到至少99%序列同一性。在其他实施例中,该多核苷酸包含以下、基本由以下组成、或由以下组成:seqidno:1-5中任一项或其毒素编码片段。
在其他实施例中,该多核苷酸包含以下、基本上由以下组成、或由以下组成:编码如下蛋白质的核苷酸序列,该蛋白质包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与seqidno:16-20中任一项或其毒素片段具有至少80%到至少99%序列同一性。
在仍其他实施例中,该氨基酸序列与seqidno:16或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在另外的实施例中,该氨基酸序列与seqidno:17或其毒素片段具有至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍另外的实施例中,该氨基酸序列与seqidno:18或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与seqidno:19或其毒素片段具有至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与seqidno:20或其毒素片段具有至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在一些实施例中,本发明的嵌合基因包含如下多核苷酸,该多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列的合成序列,与seqidno:6-15中任一项或其毒素编码片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或在至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%同一性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在其他实施例中,本发明的嵌合基因包含如下多核苷酸,该多核苷酸包含以下、基本上由以下组成、或由以下组成:编码如下蛋白质的核苷酸序列的合成序列,该蛋白质包含如下氨基酸序列,该氨基酸序列与seqidno:16-25中任一项或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或在至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性,其中该合成序列已经进行密码子优化用于在转基因生物中表达。在另外的实施例中,该转基因生物是转基因细菌或转基因植物。
在一些实施例中,本发明提供了如下合成多核苷酸,该合成多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列,该核苷酸序列编码对于鳞翅目有害生物是有毒的蛋白质,其中该核苷酸序列与seqidno:6-15中任一项或其毒素编码片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,本发明提供了如下合成多核苷酸,该合成多核苷酸包含以下、基本上由以下组成、或由以下组成:核苷酸序列,该核苷酸序列编码对于鳞翅目有害生物是有毒的蛋白质,其中该核苷酸序列编码如下氨基酸序列,该氨基酸序列与seqidno:16-25中任一项或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
可以使用来自苏云金芽孢杆菌(bt)菌株的基因组来组装本发明的cry蛋白。bt菌株可以通过标准技术分离并且测试对本发明的鳞翅目有害生物的毒性或用于分离基因组dna而不测试bt菌株对昆虫的毒性。通常,bt菌株可以通过本领域中已知的方法分离自任何环境样品,包括土壤、植物、昆虫、谷物升降机粉尘、以及其他样品材料等。参见例如,travers等人,(1987),appl.environ.microbiol.[应用与环境微生物学]53:1263-1266;saleh等人,(1969),canj.microbiol.[加拿大微生物学杂志]15:1101-1104;delucca等人,(1981),canj.microbiol.[加拿大微生物学杂志]27:865-870;以及norris等人,(1981),“thegenerabacillusandsporolactobacillus[芽孢杆菌属和芽孢乳杆菌属]”,于starr等人,(编著),theprokaryotes:ahandbookonhabitats,isolation,andidentificationofbacteria[原核生物:关于细菌的栖息地、分离和鉴定手册],第ii卷,施普林格出版社(springer-verlog)柏林海德堡。分离之后,可以测试bt菌株对于昆虫有害生物的毒性并且可以鉴定由本发明涵盖的cry蛋白。因此,在一些实施例中,本发明提供了分离的苏云金芽孢杆菌(bt)菌株,该菌株产生cry蛋白或重组cry蛋白,该cry蛋白包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与seqidno:16-25中任一项具有至少80%到至少99%序列同一性。在仍另外的实施例中,该cry蛋白或重组cry蛋白包含以下、基本上由以下组成、或由以下组成:seqidno:16-25中的任一项。
根据一些实施例,本发明提供cry蛋白和任选地分离的cry蛋白,其对于鳞翅目有害生物是有毒的,其中该cry蛋白包含以下、基本上由以下组成、或由以下组成:(a)氨基酸序列,该氨基酸序列与seqidno:16-25中任一项或其毒素片段具有至少80%序列同一性到至少99%序列同一性;或者(b)氨基酸序列,该氨基酸序列由核苷酸序列或组装的核苷酸序列编码,该核苷酸序列与由seqidno:6-15中任一项代表的核苷酸序列或其毒素编码片段具有至少80%序列同一性到至少99%序列同一性。
在其他实施例中,该cry蛋白或分离的cry蛋白包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与seqidno:16-25中任一项或其毒素片段具有至少80%到至少99%序列同一性。在仍其他实施例中,该氨基酸序列与seqidno:16或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与seqidno:17或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在另外的实施例中,该氨基酸序列与seqidno:18或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍另外的实施例中,该氨基酸序列与seqidno:19或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在其他实施例中,该氨基酸序列与seqidno:20或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在一些实施例中,该氨基酸序列包含以下、基本由以下组成、或由以下组成:seqidno:16-25中任一项或其毒素片段。在其他实施例中,该氨基酸序列是由如下核苷酸序列编码的,该核苷酸序列包含以下、基本上由以下组成、或由以下组成:seqidno:6-15中任一项或其毒素编码片段。
在其他实施例中,本发明的cry蛋白对鳞翅目有害生物是有毒的,该鳞翅目有害昆虫选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟),绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖),西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟),粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)。在其他实施例中,本发明的cry蛋白对至少亚洲玉米蛀虫(亚洲玉米螟)是有毒的。
在一些实施例中,本发明涵盖重组cry蛋白,其对于鳞翅目有害生物是有毒的,其中该重组cry蛋白包含以下、基本上由以下组成、或由以下组成:(a)氨基酸序列,该氨基酸序列与由seqidno:21-25中任一项代表的氨基酸序列或其毒素片段具有至少80%到至少99%序列同一性;或者(b)氨基酸序列,该氨基酸序列由如下核苷酸序列编码,该核苷酸序列与由seqidno:11-15中任一项代表的核苷酸序列或其毒素编码片段具有至少80%到至少99%序列同一性。
在其他实施例中,该重组cry蛋白包含以下、基本上由以下组成、或由以下组成:氨基酸序列,该氨基酸序列与seqidno:21-25中任一项或其毒素片段具有至少80%到至少99%序列同一性。在仍其他实施例中,该氨基酸序列与seqidno:21或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与seqidno:22或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与seqidno:23或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与seqidno:24或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍其他实施例中,该氨基酸序列与seqidno:25或其毒素片段具有至少80%、或至少81%、或至少82%、或至少83%、或至少84%、或至少85%、或至少86%、或至少87%、或至少88%、或至少89%、或至少90%、或至少91%、或至少92%、或至少93%、或至少94%、或至少95%、或至少96%、或至少97%、或至少98%、或至少99%、或至少99.1%、或至少99.2%、或至少99.3%、或至少99.4%、或至少99.5%或至少99.6%、或至少99.7%、或至少99.8%、或至少99.9%序列同一性。
在仍另外的实施例中,该重组cry蛋白包含以下、基本上由以下组成、或由以下组成:seqidno:21-25中任一项的氨基酸序列或其毒素片段。在其他实施例中,该重组cry蛋白是由如下核苷酸序列编码的,该核苷酸序列包含以下、基本由以下组成、或由以下组成:seqidno:11-15中任一项或其毒素编码片段。
本发明还涵盖响应于通过组装的或突变型bt-0264、bt-0288、bt-0302、bt-0454和bt-0485、或相关cry蛋白(包括天然cry蛋白)的免疫激发而产生的抗体。此类抗体可以使用生产多克隆抗血清的标准免疫学技术生产,并且如果需要的话,无限增殖免疫宿主的抗体产生细胞用于单克隆抗体生产源。用于生产针对任何感兴趣物质的抗体的技术是熟知的,例如,如在以下文献中:harlow和lane(1988,antibodiesalaboratorymanual.[抗体:实验室手册],第726页,冷泉港实验室)以及如在goding(monoclonalantibodies:principles&practice[单克隆抗体:原理与实践]1986,学术出版社公司(academicpress,inc.),奥兰多,佛罗里达州)。本发明涵盖杀昆虫蛋白,其与抗体、特别是单克隆抗体交叉反应,产生了针对本发明的杀昆虫cry蛋白中的一种或多种。
本发明中生产的这些抗体在用于确定生物样品中组装的或突变型bt-0264、bt-0288、bt-0302、bt-0454和bt-0485cry蛋白、或相关cry蛋白(包括天然cry蛋白)的量或存在的免疫测定中也是有用的。此类测定在质量控制生产含有本发明的cry蛋白中的一种或多种或相关毒性蛋白的组合物中也是有用的。此外,这些抗体可以用来评估本发明的cry蛋白中的一种或多种或相关蛋白的重组生产的功效,连同针对编码本发明的cry蛋白中的一种或多种的核苷酸序列或相关蛋白编码序列的存在而筛选表达文库的功效。抗体还作为亲和配体用于纯化或分离本发明的蛋白质中的任何一种或多种以及相关蛋白是有用的。本发明的cry蛋白和含有相关抗原表位的蛋白质可以通过在优选的宿主细胞中过度表达编码全部或部分本发明的cry蛋白或相关蛋白的序列的全长或部分长度来获得。
应当认识到,可以通过不同方法来改变编码本发明的cry蛋白的组装的dna序列,并且这些改变可以产生编码如下蛋白质的dna序列,这些蛋白质具有不同于由本发明的组装的cry蛋白所编码的氨基酸序列。所得的突变型cry蛋白可以按照不同的方式进行改变,包括seqidno:16-20中任一项的一个或多个氨基酸的氨基酸取代、缺失、截短、以及插入,包括多达约2、约3、约4、约5、约6、约7、约8、约9、约10、约15、约20、约25、约30、约35、约40、约45、约50、约55、约60、约65、约70、约75、约80、约85、约90、约100、约105、约110、约115、约120、约125、约130、约135、约140、约145、约150、约155个、或更多个氨基酸取代、缺失或插入。用于此类操作的方法在本领域中通常是已知的。例如,通过在编码该蛋白质的多核苷酸中的突变可以制备天然cry蛋白的氨基酸序列变体。这还可以通过若干种诱变形式之一或在定向进化中来完成。在一些方面中,在该氨基酸序列中所编码的改变将实质上不影响该蛋白质的功能。此类变体将具有所希望的杀昆虫活性。在本发明的一些实施例中,由seqidno:1-5代表的核苷酸序列被改变,以在编码的蛋白质中引入氨基酸取代。在其他实施例中,所得的突变型蛋白是由合成的突变型多核苷酸编码的,该多核苷酸包含由seqidno:11-15中任一项代表的核苷酸序列。在其他实施例中,这些突变型cry蛋白包含以下、基本上由以下组成、或由以下组成:由seqidno:21-25中任一项代表的氨基酸序列。
应当理解的是可以通过使用此类技术改进杀昆虫蛋白对本发明的这些组合物赋予杀昆虫活性的能力。例如,可以在以下宿主细胞中表达cry蛋白,这些宿主细胞在dna复制过程中展现高比率的碱基错误结合,如xl-1red(斯特塔杰公司(stratagene),拉荷亚(lajolla),加利福尼亚州)。在此类菌株中繁殖之后,可以分离出该dna(例如通过制备质粒dna,或通过由pcr进行扩增并且将得到的pcr片段克隆到载体中),在非诱变菌株中培养这些cry蛋白突变体,并且鉴定具有杀昆虫活性的经突变的基因,例如通过进行对杀昆虫活性进行测试的测定。通常,在摄食测定中混合并使用了该蛋白质。参见例如marrone等人,(1985),j.ofeconomicentomology[经济昆虫学杂志]78:290-293。此类测定可以包括使植物与一种或多种有害生物接触,并且确定该植物存活或引起这些有害生物死亡的能力。导致毒性提高的突变的实例见于schnepf等人,(1998),microbiol.mol.biol.rev.[微生物分子生物学综述]62:775-806中。
可替代地,可以在氨基或羧基的末端上对本发明的氨基酸序列进行改变,而实质上不影响活性。这可以包括通过现代分子方法所引入的插入、缺失、或改变,这些方法是如pcr,包括pcr扩增,这些pcr扩增借助于将编码氨基酸的序列包含到在pcr扩增中所使用的寡核苷酸之中而改变或延长该蛋白质编码序列。可替代地,所添加的蛋白质序列可以包括完整的蛋白质编码序列,如在本领域内通常用于产生蛋白质融合物的那些序列。此类融合蛋白常常用于(1)增加目的蛋白质的表达;(2)引入结合域、酶活性、或表位以促进蛋白质纯化、蛋白质检测、或本领域已知的其他实验用途;(3)将蛋白质的分泌或翻译靶向亚细胞器,如革兰氏阴性菌的壁膜间隙,或真核细胞的内质网,后者常常导致蛋白质的糖基化。
本发明的cry蛋白还可以被突变以引入表位来产生识别该经突变蛋白的抗体。因此,在一些实施例中,本发明提供了经突变的cry蛋白,其中在天然cry蛋白中的氨基酸取代产生了具有抗原区域的突变型cry蛋白,该抗原区域允许该突变型cry蛋白在蛋白质检测分析中区别于该天然cry蛋白。
在一些实施例中,本发明提供了制备如下抗体的方法,该抗体从衍生出经突变的cry蛋白的组装的或相关的天然cry蛋白中差异性地识别出经突变的cry蛋白,该方法包括以下步骤:在组装的或天然cry蛋白的抗原环中取代氨基酸;并且产生特异性识别经突变cry蛋白的经突变抗原环但不识别该组装的或天然cry蛋白的抗体。在一个实施例中,该抗原环在组装的或天然cry蛋白的结构域i外部的非保守区域中被鉴别出。在另一个实施例中,该抗原环不是参与cry蛋白的昆虫肠受体识别或参与cry蛋白的蛋白酶活化的环。
本发明的变体核苷酸和氨基酸序列还涵盖了由诱变和引起重组的程序(如dna改组)所衍生的序列。使用此类程序,可以将一个或多个不同的毒性蛋白编码区用来创造出具有所希望特性的新的毒性蛋白。以这种方式,从相关序列多核苷酸的群体产生重组多核苷酸文库,这些相关序列多核苷酸包含如下序列区域,这些序列区域具有实质性的序列同一性并且可以在体外或体内进行同源重组。例如,使用这种方法,可以将编码目的结构域的序列基序在本发明的杀有害生物基因与其他已知的杀有害生物基因之间进行改组,以获得编码如下蛋白质的新基因,该蛋白质具有改进的目的特性,如增加的杀昆虫活性。用于此种dna改组的策略在本领域中是已知的。参见例如,stemmer,(1994),proc.natl.acad.sci.usa[美国国家科学院院刊]91:10747-10751;stemmer,(1994),nature[自然]370:389-391;crameri等人,(1997),naturebiotech.[自然生物技术]15:436-438;moore等人,(1997),j.mol.biol.[分子生物学杂志]272:336-347;zhang等人,(1997),proc.natl.acad.sci.usa[美国国家科学院院刊]94:4504-4509;crameri等人,(1998),nature[自然]391:288-291;以及美国专利号5,605,793和5,837,458。
结构域交换或改组是用于产生本发明的经改变的cry蛋白的另一种机制。可以在cry蛋白之间交换结构域,从而产生具有改进的杀有害生物活性或靶标谱的杂合或嵌合毒性蛋白。用于产生重组蛋白和测试它们的杀有害生物活性的方法在本领域是熟知的(参见例如,naimov等人,(2001)appl.environ.microbiol.[应用与环境微生物学]67:5328-5330];demaagd等人,(1996)appl.environ.microbiol.[应用与环境微生物学]62:1537-1543];ge等人,(1991)j.biol.chem.[生物化学杂志]266:17954-17958;schnepf等人,(1990)j.biol.chem.[生物化学杂志]265:20923-20930;rang等人,(1999)appl.environ.microbiol.[应用与环境微生物学]65:2918-2925])。
因此在一些实施例中,本发明涵盖杂合杀昆虫蛋白,所述杂合杀昆虫蛋白在n-末端至c-末端方向上包含:a)与cry4a蛋白的c-末端区域融合的cry54a蛋白的n-末端区域,其中所述cry54a蛋白和所述cry4a蛋白之间的交换位置位于cry54a的结构域iii和cry4a的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与seqidno:17具有至少90%同一性;或者b)与cry19c蛋白的c-末端区域融合的cry39a蛋白的n-末端区域,其中所述cry39a蛋白和所述cry19蛋白之间的交换位置位于cry39a的结构域iii和cry19c的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与seqidno:18具有至少90%同一性;或者c)与cry4b蛋白的c-末端区域融合的cry50b蛋白的n-末端区域,其中所述cry50b蛋白和所述cry4b蛋白之间的交换位置位于cry50b的结构域iii和cry4b的原毒素尾部之间,并且其中所述杂合杀昆虫蛋白与seqidno:20具有至少90%同一性。在其他实施例中,所述杂合杀昆虫蛋白针对鳞翅目昆虫有害生物具有活性。在这个实施例的一个方面,所述鳞翅目昆虫有害生物是亚洲玉米蛀虫(acb;亚洲玉米螟)。
在一些实施例中,本发明提供了如下重组载体,该重组载体包含本发明的多核苷酸、组装的多核苷酸、核酸分子、表达盒或嵌合基因。在其他实施例中,该载体被进一步限定为质粒、粘粒、噬菌粒、人工染色体、噬菌体或病毒载体。用于在植物和其他生物的转化中使用的某些载体在本领域是已知的。
因此,本发明的一些实施例针对被设计成表达本发明的多核苷酸和核酸分子的表达盒。如在此使用的,“表达盒”意指如下核酸分子,该核酸分子具有至少一种可操作地连接至目的核苷酸序列(例如,编码本发明的cry蛋白的本发明的核苷酸序列)上的控制序列。以这种方式,例如,可操作地连接至待表达的核苷酸序列的植物启动子可以在表达盒中提供,用于在植物、植物部分或植物细胞中的表达。
包含目的多核苷酸的表达盒可以是嵌合的,意味着它的组分中的至少一种相对于它的其他组分中的至少另外一种是异源的。表达盒还可以是天然存在但已经是以适用于异源表达的重组形式获得的表达盒。然而,典型地,该表达盒相对于该宿主而言是异源的,即该表达盒的特定核酸序列不是天然存在于该宿主细胞中的,并且必须已经通过转化事件引入到该宿主细胞或该宿主细胞的祖先中。
除可操作地连接至本发明的核苷酸序列的启动子之外,本发明的表达盒还可以包括其他调节序列。如在此使用的,“调节序列”意指位于编码序列上游(5'非编码序列)、内部或下游(3'非编码序列)并影响相关编码序列的转录、rna加工或稳定性、或翻译的核苷酸序列。调节序列包括但不限于增强子、内含子、翻译前导序列、终止信号、以及多腺苷酸化信号序列。
在一些实施例中,本发明的表达盒还可以包括编码除本发明的cry蛋白之外的其他所希望的性状的多核苷酸。此类包含叠加性状的表达盒可以用来产生具有所希望的具有叠加性状(即,分子叠加)的表型的植物、植物部分或植物细胞。植物中的此类叠加的组合还可以通过其他方法来产生,包括但不限于通过任何常规的方法学的杂交育种植物。如果是通过遗传转化这些植物来进行叠加的,目的核苷酸序列可以在任何时间并且以任何次序进行组合。例如,包含一种或多种所希望的性状的转基因植物可以用作通过后续转化而引入另外的性状的靶标。另外的核苷酸序列可以在共转化方案中与由表达盒的任何组合提供的本发明的核苷酸序列、核酸分子、核酸构建体、或组合物同时引入。例如,如果将引入两个核苷酸序列,则它们可以合并在分开的盒(反式)中或可以合并在相同的盒(顺式)上。多核苷酸的表达可以通过相同的启动子或通过不同的启动子驱动。进一步认识到多核苷酸可以使用位点特异性重组系统在所希望的基因组位置处叠加。参见例如,国际专利申请公开号wo99/25821;wo99/25854;wo99/25840;wo99/25855;以及wo99/25853。
表达盒还可以包括用于农艺性状的一种或多种目的多肽或双链rna分子(dsrna)的另外的编码序列,这些农艺性状的主要受益者是种子公司、栽培者或谷物加工者。目的多肽可以是由目的核苷酸序列编码的任何多肽。适合用于在植物中生产的目的多肽的非限制性实例包括产生农艺学重要性状的那些多肽,这些性状如除草剂抗性(有时也称为“除草剂耐受性”)、病毒抗性、细菌病原体抗性、昆虫抗性、线虫抗性、或真菌抗性。参见,例如美国专利号5,569,823;5,304,730;5,495,071;6,329,504;和6,337,431。多肽还可以是提高植物活力或产量(包括允许植物在不同的温度、土壤条件以及日光和沉淀水平下生长的性状)的多肽,或是允许对展现目的性状(例如,选择性标记、种皮颜色等)的植物进行鉴别的多肽。不同的目的多肽,连同用于将这些多肽引入植物中的方法描述于例如美国专利号4,761,373、4,769,061、4,810,648、4,940,835、4,975,374、5,013,659、5,162,602、5,276,268、5,304,730、5,495,071、5,554,798、5,561,236、5,569,823、5,767,366、5,879,903、5,928,937、6,084,155、6,329,504和6,337,431,连同美国专利公开号2001/0016956中。还参见,万维网上的lifesci.sussex.ac.uk/home/neil_crickmore/bt/。
赋予对抑制生长点或分生组织的除草剂(如咪唑啉酮或磺酰脲)的抗性/耐受性的多核苷酸也可以适用于本发明的一些实施例中。对于突变型als和ahas酶在这一分类号中的示例性多核苷酸如描述于例如,美国专利号5,767,366和5,928,937中。美国专利号4,761,373和5,013,659针对抵抗不同的咪唑啉酮或磺酰脲除草剂的植物。美国专利号4,975,374涉及含有如下核酸的植物细胞和植物,该核酸编码突变型谷氨酰胺合成酶(gs),该突变型谷氨酰胺合成酶抵抗已知抑制gs的除草剂(例如,草胺膦和甲硫氨酸磺基肟(methioninesulfoximine))的抑制作用。美国专利号5,162,602披露了抵抗环己二酮和芳氧苯氧丙酸除草剂的抑制作用的植物。该抗性由改变的乙酰辅酶a羧化酶(accase)赋予。
赋予对草甘膦抗性的、由核苷酸序列编码的多肽也适用于本发明。参见例如,美国专利号4,940,835和美国专利号4,769,061。美国专利号5,554,798披露了抗草甘膦的转基因玉蜀黍植物,该抗性由改变的5-烯醇丙酮莽草酸-3-磷酸(epsp)合成酶基因赋予。
编码对磷酰基化合物(如草铵膦或草丁膦、以及吡啶氧丙酸或苯氧丙酸以及环己酮)的抗性的多核苷酸也是适合的。参见欧洲专利申请号0242246。还参见美国专利号5,879,903、5,276,268和5,561,236。
其他适合的多核苷酸包括编码对抑制光合作用的除草剂(如三嗪和苯基氰(腈水解酶))的抗性的那些,参见美国专利号4,810,648。编码用于除草剂抗性的另外的适合的多核苷酸包括编码对2,2-二氯丙酸、烯禾啶、吡氟氯禾灵、咪唑啉酮除草剂、磺酰脲除草剂、三唑并嘧啶除草剂、均三嗪除草剂以及溴草腈的抗性的那些。同样适合的是赋予对原卟啉原氧化酶的抗性或者提供增强的对植物疾病的抗性、增强的对不利环境条件(非生物胁迫)的耐受性(这些条件包括但不限于干旱、极冷、极热、或极端的土壤盐度或极端的酸度或碱度)、以及在植物构造或发育中的改变(包括发育时间方面的变化)的多核苷酸。参见例如,美国专利公开号2001/0016956和美国专利号6,084,155。
另外的适合的多核苷酸包括对杀有害生物(例如杀昆虫)多肽进行编码的那些。这些多肽可以按足以控制例如昆虫有害生物的量(即,昆虫控制量)进行生产。应当认识到在植物中对控制昆虫或其他有害生物必要的杀有害生物多肽的生产量可以变化,这取决于栽培品种、有害生物的类型、环境因素等。有用于另外的昆虫或有害生物抗性的多核苷酸包括例如编码芽孢杆菌属(bacillus)生物中鉴定到的毒素的那些。已经克隆了包含编码来自若干个亚种的苏云金芽孢杆菌(bt)cry蛋白的核苷酸序列的多核苷酸,并且已经发现这些重组克隆对鳞翅目、双翅目和/或鞘翅目昆虫幼虫是有毒的。此类bt杀昆虫蛋白的实例包括如下cry蛋白,例如cry1aa、cry1ab、cry1ac、cry1b、cry1c、cry1d、cry1ea、cry1fa、cry3a、cry9a、cry9b、cry9c等,连同营养期杀昆虫蛋白例如vip1、vip2、vip3等。bt来源的蛋白的完整清单可以在万维网在苏塞克斯大学(universityofsussex)维护的苏云金芽孢杆菌毒素命名法数据库中找到(还参见,crickmore等人(1998)microbiol.mol.biol.rev.[微生物分子生物学综述]62:807-813)。
适合在植物中生产的多肽进一步包括改进或通过其他方式有助于收获的植物或植物部分转化成为商业上有用的产品(包括例如增加的或改变的碳水化合物含量或分布、改进的发酵特性、增加的油含量、增加的蛋白质含量、改进的消化率、以及增加的营养成分含量(例如,增加的植物甾醇含量、增加的生育酚含量、增加的甾烷醇含量或增加的维生素含量))的那些。目的多肽还包括,例如在收获的作物中导致或促成不需要的成分(例如植酸、或降解糖的酶类)的含量降低的那些。“导致(resultingin)”或“促成(contributingto)”是指这种目的多肽可以直接或间接地促成目的性状的存在(例如,通过异源纤维素酶的使用来增加纤维素降解)。
在一些实施例中,多肽促成了食品或饲料的改进的可消化度。木聚糖酶是半纤维素分解酶,这些酶改进了植物细胞壁的分解,这导致动物更好地利用这些植物营养素。这导致了改进的生长率和饲料转化。同样,可以减小含有木聚糖的饲料的粘度。在植物细胞内异源产生木聚糖酶也可以促进木质纤维素转化成工业加工中的可发酵糖。
来自真菌和细菌微生物的众多木聚糖酶已经得到鉴别和表征(参见例如,美国专利号5,437,992;coughlin等人,(1993),“proceedingsofthesecondtricelsymposiumontrichodermareeseicellulasesandotherhydrolases”[“里氏木霉纤维素酶和其他水解酶的第二tricel研讨会论文集”],埃斯波(espoo);souminen和reinikainen编著,(1993)生物技术和工业发酵研究基金会(foundationforbiotechnicalandindustrialfermentationresearch)8:125-135;美国专利公开号2005/0208178;以及pct公开号wo03/16654)。特别地,在里氏木霉(t.reesei)中已经鉴别出三种特异性木聚糖酶(xyl-i、xyl-ii、和xyl-iii)(tenkanen等人,(1992),enzymemicrob.technol.[酶与微生物技术]14:566;torronen等人,(1992),bio/technology[生物/技术]10:1461;以及xu等人,(1998),appl.microbiol.biotechnol.[应用微生物与生物技术]49:718)。
在其他实施例中,对于本发明有用的多肽可以是多糖降解酶。产生这样一种酶的本发明的植物对于产生例如用于生物加工的发酵原料会是有用的。在一些实施例中、可用于发酵过程的酶包括α淀粉酶、蛋白酶、支链淀粉酶、异淀粉酶、纤维素酶、半纤维素酶、木聚糖酶、环糊精糖基转移酶、脂肪酶、植酸酶、漆酶、氧化酶、酯酶、角质酶、颗粒淀粉水解酶以及其他葡糖淀粉酶。
多糖降解酶包括:淀粉降解酶如α-淀粉酶(ec3.2.1.1)、葡糖醛酸糖苷酶(e.c.3.2.1.131);外切-1,4-α-d葡聚糖酶如淀粉葡糖苷酶和葡糖淀粉酶(ec3.2.1.3)、β-淀粉酶(ec3.2.1.2)、α-葡糖苷酶(ec3.2.1.20)和其他外切淀粉酶;淀粉去分支酶,如a)异淀粉酶(ec3.2.1.68)、支链淀粉酶(ec3.2.1.41)等;b)纤维素酶如外切-1,4-3-纤维二糖水解酶(ec3.2.1.91)、外切-1,3-β-d-葡聚糖酶(ec3.2.1.39)、β-葡糖苷酶(ec3.2.1.21);c)l-阿拉伯糖酶(arabinase)、如内切-1,5-α-l-阿拉伯糖酶(ec3.2.1.99)、α-阿拉伯糖苷酶(ec3.2.1.55)等;d)半乳聚糖酶如内切-1,4-β-d-半乳聚糖酶(ec3.2.1.89)、内切-1,3-β-d-半乳聚糖酶(ec3.2.1.90)、α-半乳糖苷酶(ec3.2.1.22)、β-半乳糖苷酶(ec3.2.1.23)等;e)甘露聚糖酶,如内切-1,4-β-d-甘露聚糖(ec3.2.1.78)、β-甘露糖苷酶(ec3.2.1.25)、α-甘露糖苷酶(ec3.2.1.24)等;f)木聚糖酶,如内切-1,4-β-木聚糖酶(ec3.2.1.8)、β-d-木糖苷酶(ec3.2.1.37)、1,3-β-d-木聚糖酶等;和g)其他酶如α-l-岩藻糖苷酶(ec3.2.1.51)、α-l-鼠李糖苷酶(ec3.2.1.40)、果聚糖酶(ec3.2.1.65)、菊粉酶(ec3.2.1.7)等。在一个实施例中,α-淀粉酶是描述于美国专利号8,093,453中的合成α-淀粉酶amy797e,将该专利通过引用以其全文结合在此。
可以与本发明一起使用的另外的酶包括蛋白酶,如真菌和细菌蛋白酶。真菌蛋白酶包括但不限于从曲霉属(aspergillus)、木霉属(trichoderma)、毛霉属(mucor)和根霉属(rhizopus),如黑曲霉(a.niger)、泡盛曲霉(a.awamori)、米曲霉(a.oryzae)和米黑毛霉(m.miehei)获得的那些。在一些实施例中,本发明的多肽可以是纤维二糖水解酶(cbh)(ec3.2.1.91)。在一个实施例中,该纤维二糖水解酶可以是cbh1或cbh2。
与本发明一起使用的其他酶包括但不限于半纤维素酶,如甘露聚糖酶和阿拉伯呋喃糖苷酶(ec3.2.1.55);木质素酶;脂肪酶(例如,e.c.3.1.1.3)、葡糖氧化酶、果胶酶、木聚糖酶、转葡糖苷酶、α1,6葡糖苷酶(例如,e.c.3.2.1.20);酯酶,如阿魏酸酯酶(ec3.1.1.73)和乙酰基木聚糖酯酶(ec3.1.1.72);以及角质酶(例如e.c.3.1.1.74)。
与本发明一起使用的双链rna分子包括但不限于抑制靶标昆虫基因的那些。如在此使用的词语“基因抑制”当一起考虑时旨在是指用于减少作为基因转录为mrna和该mrna的后续翻译的结果而产生的蛋白质的水平的任何熟知的方法。基因抑制还旨在意指减少从基因或编码序列表达蛋白质,包括转录后基因抑制和转录抑制。转录后基因抑制由从靶向抑制的基因或编码序列转录的mrna的全部或其一部分与用于抑制的相应双链rna之间的同源性介导,并且是指在细胞中可供被核糖体结合使用的可获得的mrna的量的实质且可测量的减少。经转录的rna可以处于正义方向而发挥作用,称为共抑制,处于反义方向而发挥作用,称为反义抑制,或在两个方向上产生dsrna而发挥作用,称为rna干扰(rnai)。转录抑制由细胞中存在作为基因抑制剂的与启动子dna序列或其补体展示出实质序列同一性而发挥作用的dsrna介导,称为启动子反式抑制。针对与性状相关的天然植物基因,基因抑制可以是有效的,例如,以提供具有减少水平的由该天然基因编码的蛋白质或具有增强或减少水平的受影响代谢物的植物。针对植物有害生物中的靶基因,基因抑制也可以是有效的,这些有害生物可以摄取或接触含有基因抑制剂的植物材料,这些基因抑制剂专门设计用于阻抑或抑制一种或多种同源或互补序列在该有害生物的细胞中的表达。靶向抑制的此类基因可以编码必需蛋白质,其预测功能选自下组,该组由以下组成:肌肉形成、保幼激素形成、保幼激素调节、离子调节和转运、消化酶合成、细胞膜电势的维持、氨基酸生物合成、氨基酸降解、精子形成、外激素(pheromone)合成、外激素感测、触角形成、翼形成、腿形成、发育和分化、卵形成、幼虫成熟、消化酶形成、血淋巴合成、血淋巴维持、神经传递、细胞分裂、能量代谢、呼吸以及凋亡。
在一些实施例中,本发明提供了如下转基因非人类宿主细胞,该细胞包括本发明的多核苷酸、核酸分子、嵌合基因、表达盒或重组载体。转基因非人类宿主细胞可以包括但不限于植物细胞、酵母细胞、细菌细胞或昆虫细胞。因此,在一些实施例中,本发明提供了选自以下属的细菌细胞:芽孢杆菌属、短芽孢杆菌属(brevibacillus)、梭菌属(clostridium)、致病杆菌属(xenorhabdus)、发光杆菌属(photorhabdus)、巴斯德氏芽菌属(pasteuria)、埃希氏菌属(escherichia)、假单胞菌属(pseudomonas)、欧文氏菌属(erwinia)、沙雷氏菌属(serratia)、克雷伯菌属(klebsiella)、沙门氏菌属(salmonella)、巴氏杆菌属(pasteurella)、黄单胞菌属(xanthomonas)、链霉菌属(streptomyces)、根瘤菌属(rhizobium)、红假单胞菌属(rhodopseudomonas)、嗜甲基菌属(methylophilius)、农杆菌属(agrobacterium)、醋杆菌属(acetobacter)、乳杆菌属(lactobacillus)、节杆菌属(arthrobacter)、固氮菌属(azotobacter)、明串珠菌属(leuconostoc)或产碱杆菌属(alcaligenes)。因此,例如,作为生物昆虫控制剂,本发明的cry蛋白可以通过在细菌细胞中表达编码本发明的cry蛋白的嵌合基因而产生。例如,在一些实施例中,提供了包含本发明的嵌合基因的苏云金芽孢杆菌细胞。
在另外的实施例中,本发明提供了作为双子叶植物细胞或单子叶植物细胞的转基因植物细胞。在另外的实施例中,该双子叶植物细胞选自下组,该组由以下组成:大豆细胞、向日葵细胞、番茄细胞、芸苔属作物细胞、棉花细胞、甜菜细胞以及烟草细胞。在另外的实施例中,该单子叶植物细胞选自下组,该组由以下组成:大麦细胞、玉蜀黍细胞、燕麦细胞、水稻细胞、高粱细胞、甘蔗细胞以及小麦细胞。在一些实施例中,本发明提供了多个双子叶植物细胞或单子叶植物细胞,这些细胞表达由本发明的嵌合基因编码的本发明的cry蛋白。在其他实施例中,将该多个细胞并列以形成质外体并且使其在自然光照中生长。
在本发明的其他实施例中,在高等生物(例如,植物)中表达本发明的杀昆虫cry蛋白。在这种情况下,表达有效量的杀昆虫蛋白的转基因植物保护自身免受植物有害生物如昆虫有害生物的伤害。当昆虫开始摄食这样一种转基因植物时,它摄取了所表达的杀昆虫cry蛋白。这可以妨碍昆虫进一步咬食植物组织或者甚至可以伤害或杀死昆虫。本发明的多核苷酸被插入表达盒中,然后该表达盒被稳定地整合到植物的基因组中。在其他实施例中,该多核苷酸被包括在非致病性自我复制病毒中。根据本发明转化的植物可以是单子叶植物或双子叶植物,并且包括但不限于玉米(玉蜀黍)、大豆、水稻、小麦、大麦、黑麦、燕麦、高粱、粟、向日葵、红花、甜菜、棉花、甘蔗、油菜、苜蓿、烟草、花生、蔬菜(包括甘薯、豆类、豌豆、菊苣、莴苣、甘蓝、花椰菜、西兰花、芜菁、胡萝卜、茄子、黄瓜、萝卜、菠菜、马铃薯、番茄、芦笋、洋葱、大蒜、瓜类、胡椒、芹菜、南瓜、西葫芦、绿皮西葫芦)、水果(包括苹果、梨、榅桲、李、樱桃、桃、蜜桃、杏、草莓、葡萄、覆盆子、黑莓、菠萝、鳄梨、番木瓜、芒果、香蕉)和特种植物如拟南芥以及木本植物如针叶树和落叶树。优选地,本发明的植物是作物植物,如玉蜀黍、高粱、小麦、向日葵、番茄、十字花科植物、胡椒、马铃薯、棉花、水稻、大豆、甜菜、甘蔗、烟草、大麦、油菜等。
一旦所希望的多核苷酸已经被转化进特定的植物物种中,便可以使用传统的育种技术将其在该物种中繁殖或将其转移到相同物种的其他品种中,特别是包括商业品种。
在转基因植物中表达本发明的多核苷酸,由此导致在这些转基因植物中对处于原毒素或毒素形式的编码的cry蛋白的生物合成。以此方式,产生在存在昆虫压力下具有增强的产量保护的转基因植物。用于它们在转基因植物中的表达,本发明的核苷酸序列可能需要修饰和优化。尽管在许多情况下,来自微生物生物的基因能够在植物中高水平表达而无需修饰,但在转基因植物中的低表达可能是由于微生物核苷酸序列的缘故,这些序列具有在植物中并不优选的密码子。在本领域中已知,活生物具有特定的密码子使用偏好,而且在本发明中所描述的这些核苷酸序列的密码子可以被改变以符合植物偏好,同时维持由其编码的氨基酸。此外,在植物(例如玉米植物)中高表达最好是由如下编码序列实现的,这些编码序列具有至少约35%、或至少约45%、或至少约50%、或至少约60%的gc含量。具有低gc含量的微生物核苷酸序列在植物中也许表达欠佳,这是由于存在着可能使信息不稳定的attta基序,以及可导致不恰当的多腺苷酸化的aataaa基序。尽管某些基因序列可以在单子叶植物和双子叶植物物种两者中充分表达,但是可以对序列进行修饰以便迎合单子叶植物或双子叶植物的特定密码子偏好以及gc含量偏好,因为这些偏好已经被证明是不同的(murray等人,nucl.acidsres.[核酸研究]17:477-498(1989))。此外,针对不正常剪接位点的存在来对这些核苷酸序列进行筛选,这些位点可能导致信息平截(messagetruncation)。使用描述于例如美国专利号5,625,136、5,500,365和6,013,523中的方法,使用熟知的定点诱变、pcr以及合成基因构建技术对在这些核苷酸序列之内所有需要做出的变化(如以上所描述的那些)进行改变。
在一些实施例中,本发明提供了根据披露于美国专利号5,625,136中的程序制备的合成编码序列或多核苷酸,将该专利通过引用结合在此。在这个程序中,使用了玉蜀黍优选的密码子,即最频繁地编码玉蜀黍中的氨基酸的单个密码子。针对特定的氨基酸的玉蜀黍偏好的密码子可衍生自例如来自玉蜀黍的已知基因序列。例如,针对来自玉蜀黍植物的28个基因的玉蜀黍密码子使用发现于以下文献中:murray等人,nucleicacidsresearch[核酸研究]17:477-498(1989),将其披露内容通过引用结合在此。本发明的确切示例的用玉蜀黍优化密码子制备的合成序列由seqidno:6-15中的任一项代表。以这种方式,这些核苷酸序列可以进行优化用于在任何植物中表达。应当认识到,核苷酸序列的全部或任何部分可以是优化的或合成的。也就是说,多核苷酸可以包含作为部分天然序列和部分密码子优化序列的核苷酸序列。
为了有效的翻译起始,可能需要修饰与起始甲硫氨酸相邻的序列。例如,它们可以通过包含已知在植物中有效的序列而被修饰。joshi已经提出了针对植物的适当的共有序列(nar15:6643-6653(1987))。这些共有序列适于与本发明的核苷酸序列一起使用。将这些序列掺入至包含核苷酸序列的构建体中,达到atg并且包括atg(同时保持不修饰第二氨基酸),或者可替代地达到atg后的gtc并且包括atg后的gtc(具有修饰该转基因的第二氨基酸的可能性)。
本发明的新颖cry蛋白编码序列(作为它们的组装的序列、天然序列或作为如上所述的合成序列)可以可操作地融合至用于在植物中表达的多种启动子(包括组成型、诱导型、时序性调节的、发育调节的、化学调节的、组织优选的以及组织特异性启动子)以制备重组dna分子(即,嵌合基因)。启动子的选择将根据表达的时间和空间需要而变化,并且还根据靶物种而变化。因此,本发明的核苷酸序列在叶、在柄(stalk)或茎(stem)、在穗、在花序(例如穗状花序、圆锥花序、穗轴等)、在根或籽苗中的表达是优选的。然而在许多情况下,寻求针对多于一种类型昆虫有害生物的保护,并且因此在多个组织中的表达是令人希望的。尽管已经显示来自双子叶植物的很多启动子在单子叶植物中是可操作的并且反之亦然,但理想的是选择双子叶植物启动子用于在双子叶植物中表达,并且选择单子叶植物启动子用于在单子叶植物中表达。不过,对于所选的启动子的起源没有限制;只要它们可有效驱动核苦酸序列在期望细胞中表达就足够了。
适合的组成型启动子包括例如camv35s启动子(seqidno:1546;odell等人,nature[自然]313:810-812,1985);拟南芥at6669启动子(seqidno:1652;参见pct公开号w004081173a2);玉蜀黍ubi1(christensen等人,plantmol.biol.[植物分子生物学]18:675-689,1992);水稻肌动蛋白(mcelroy等人,plantcell[植物细胞]2:163-171,1990);pemu(last等人,theor.appl.genet.[理论与应用遗传学]81:581-588,1991);camv19s(nilsson等人,physiol.plant[植物生理学]100:456-462,1997);gos2(depater等人,plantj[植物杂志]11月;2(6):837-44,1992);泛素(christensen等人,plantmol.biol.[植物分子生物学]18:675-689,1992);水稻亲环蛋白(bucholz等人,plantmol.biol.[植物分子生物学]25(5):837-43,1994);玉蜀黍h3组蛋白(lepetit等人,mol.gen.genet.[分子遗传学与普通遗传学]231:276-285,1992);肌动蛋白2(an等人,plantj.[植物杂志]10(1);107-121,1996)、组成型根尖ct2启动子(seqidno:1535;还参见pct申请号il/2005/000627))以及syntheticsupermas(ni等人,theplantjournal[植物杂志]7:661-76,1995)。其他组成型启动子包括美国专利号5,659,026、5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463、以及5,608,142中的那些。
对于在植物(特别是玉蜀黍)中表达本发明的新颖cry蛋白编码序列有用的组织特异性或组织优先启动子是指导在根、髓、叶或花粉中的表达的那些。适合的组织特异性启动子包括但不限于叶特异性启动子[如例如由yamamoto等人,plantj.[植物杂志]12:255-265,1997;kwon等人,plantphysiol.[植物生理学]105:357-67,1994;yamamoto等人,plantcellphysiol.[植物细胞生理学]35:773-778,1994;gotor等人,plantj.[植物杂志]3:509-18,1993;orozco等人,plantmol.biol.[植物分子生物学]23:1129-1138,1993;以及matsuoka等人,proc.natl.acad.sci.usa[美国国家科学院院刊]90:9586-9590,1993所描述],种子优选启动子[例如来自种子特异性基因(simon等人,plantmol.biol.[植物分子生物学]5.191,1985;scofield等人,j.biol.chem.[生物化学杂志]262:12202,1987;baszczynski等人,plantmol.biol.[植物分子生物学]14:633,1990)、巴西坚果白蛋白(pearson等人,plantmol.biol.[植物分子生物学]18:235-245,1992)、豆球蛋白(ellis等人,plantmol.biol.[植物分子生物学]10:203-214,1988)、谷蛋白(水稻)(takaiwa等人,mol.gen.genet.[分子遗传学与普通遗传学]208:15-22,1986;takaiwa等人,febsletts.[欧洲生化学会联合会快报]221:43-47,1987)、玉米蛋白(matzke等人,plantmolbiol[植物分子生物学],143).323-321990)、napa(stalberg等人,planta[植物]199:515-519,1996)、小麦spa(albanietal,plantcell[植物细胞],9:171-184,1997)、向日葵油体蛋白(oleosin)(cummins等人,plantmol.biol.[植物分子生物学]19:873-876,1992)],胚乳特异性启动子[例如,小麦lmw和hmw,麦谷蛋白-1(molgengenet[分子遗传学与普通遗传学]216:81-90,1989;nar17:461-2),小麦a、b和g麦醇溶蛋白(emb03:1409-15,1984),大麦ltrl启动子,大麦b1、c、d大麦醇溶蛋白(theorapplgen[理论与应用遗传学]98:1253-62,1999;plantj[植物杂志]4:343-55,1993;molgengenet[分子遗传学与普通遗传学]250:750-60,1996),大麦dof(mena等人,theplantjournal[植物杂志]116(1):53-62,1998),biz2(ep99106056.7),合成启动子(vicente-carbajosa等人,plantj.[植物杂志]13:629-640,1998),水稻谷醇溶蛋白nrp33、水稻-球蛋白glb-1(wu等人,plantcellphysiology[植物细胞生理学]39(8)885-889,1998),水稻α-球蛋白reb/ohp-1(nakase等人,plantmol.biol.[植物分子生物学]33:513-s22,1997),水稻adp-葡萄糖pp(transres6:157-68,1997),玉蜀黍esr基因家族(plantj[植物杂志]12:235-46,1997),高粱γ-高粱醇溶蛋白(plantmol.biol[植物分子生物学]32:1029-35,1996)],胚特异性启动子[例如,水稻osh1(sato等人,proc.nati.acad.sci.usa[美国国家科学院院刊]93:8117-8122),knox(postma-haarsma等人,plantmol.biol.[植物分子生物学]39:257-71,1999),水稻油体蛋白(wu等人,j.biochem.[生物化学杂志],123:386,1998)],花特异性启动子[例如,atprp4,查尔酮合酶(chalenesynthase;chsa)(vandermeer等人,plantmol.biol.[植物分子生物学]15,95-109,1990),lat52(twell等人,mol.gengenet.[分子遗传学与普通遗传学]217:240-245;1989),apetala-3,植物繁殖组织[例如,osmads启动子(美国专利申请2007/0006344)]。
本发明的核苷酸序列也可以在被化学调节的启动子的调节下进行表达。这使得本发明的cry蛋白能够仅在用诱导化学品对作物植物进行处理时被合成。用于基因表达的化学诱导的此类技术的实例详述于公开申请ep0332104和美国专利号5,614,395中。在一个实施例中,该化学调节的启动子是烟草pr-1a启动子。
另一类在本发明中有用的启动子是创伤可诱导的启动子。已经描述了数量众多的在创伤部位并且还在植物病原菌感染的部位表达的启动子。理想的是,这样的启动子在昆虫入侵的部位应该仅有局部活性,并且以此方式这些杀昆虫蛋白仅在需要合成这些杀昆虫蛋白的细胞中积聚以杀死入侵的昆虫有害生物。这类启动子的实例包括由以下文献所描述的那些:stanford等人,mol.gen.genet.[分子遗传学与普通遗传学]215:200-208(1989);xu等人,plantmolec.biol.[植物分子生物学]22:573-588(1993);logemann等人,plantcell[植物细胞]1:151-158(1989);rohrmeier和lehle,plantmolec.biol.[植物分子生物学]22:783-792(1993);firek等人,plantmolec.biol.[植物分子生物学]22:129-142(1993)以及warner等人,plantj.[植物杂志]3:191-201(1993)。
导致在本发明中有用的组织特异性表达模式的启动子的非限制性实例包括绿色组织特异性的、根特异性的、茎特异性的或花特异性的。适用于在绿色组织中表达的启动子包括调节涉及光合作用的基因的许多启动子,并且这些中的许多已经从单子叶植物和双子叶植物两者中得以克隆。一种此类启动子是来自磷酸烯醇羧化酶基因的玉蜀黍pepc启动子(hudspeth和grula,plantmolec.biol.[植物分子生物学]12:579-589(1989))。另一种用于根特异性表达的启动子是由deframond(febs290:103-106(1991)或美国专利号5,466,785)描述的启动子。另一种在本发明中有用的启动子是描述于美国专利号5,625,136中的茎特异性启动子,它天然地驱动玉蜀黍trpa基因的表达。
除了选择适合的启动子之外,用于在植物中表达杀昆虫毒素的构建体还需要适当的可操作地连接在异源核苷酸序列下游的转录终止子。一些此类的终止子是可获得的并且在本领域中是已知的(例如来自camv的tml,来自rbcs的e9)。任何已知在植物中发挥作用的可供使用的终止子均可以在本发明的上下文中使用。
可以将许多其他序列掺入本发明所描述的表达盒中。这些序列包括已经显示出增强表达的序列,如内含子序列(例如,来自adhl和bronzel)以及病毒的前导序列(例如,来自tmv、mcmv、和amv)。
本发明的核苷酸序列在植物中针对不同的细胞定位的靶向表达可能是更优选的。在一些情况下,在胞质溶胶中的定位可能是令人希望的,而在其他情况下,在某个亚细胞器中的定位可能是优选的。用于靶向例如植物中的基因产物的任何机构都可以用于实践本发明,并且已知此类机构存在于植物中并且已经相当详细地表征了控制这些机构的功能的序列。已经表征了导致将基因产物靶向其他细胞区室的序列。氨基末端序列可以负责将目的蛋白质靶向任何细胞区室,如植物的液泡、线粒体、过氧化物酶体、蛋白体、内质网、叶绿体、淀粉颗粒、淀粉体、质外体或细胞壁(例如unger等人plantmolec.biol.[植物分子生物学]13:411-418(1989);rogers等人(1985)proc.natl.acad.sci.usa[美国国家科学院院刊]82:6512-651;美国专利号7,102,057;wo2005/096704,将其全部通过引用而特此结合)。任选地,信号序列可以是来自waxy的n-末端信号序列、来自γ-玉米蛋白的n-末端信号序列、淀粉结合结构域、c-末端淀粉结合结构域、将成熟蛋白引入叶绿体的叶绿体靶向序列(comai等人,(1988)j.biol.chem.[生物化学杂志]263:15104-15109;vandenbroeck等人,(1985)nature[自然]313:358-363;美国专利号5,639,949)或来自糊粉细胞的分泌信号序列(koehler和ho,plantcell[植物细胞]2:769-783(1990))。另外,与羧基末端序列结合的氨基末端序列负责基因产物的液泡靶向(shinshi等人(1990)plantmolec.biol.[植物分子生物学]14:357-368)。在一个实施例中,所选择的信号序列包括已知的切割位点,并且构建的融合体考虑了在一个或多个切割位点之后的需要切割的任何氨基酸。在一些情况下,这个要求可以通过在切割位点与转基因atg之间添加小数目的氨基酸,或可替代地置换转基因序列内的一些氨基酸来满足。这些构建技术在本领域是熟知的并且同样适用于任何细胞区室。
应认识到,用于细胞靶向的上述机制不仅可以与其同源启动子结合使用,还可以与异源启动子结合使用,从而在启动子的转录调节下实现特定的细胞靶向目标,该启动子具有不同于自其衍生靶向信号的启动子的表达谱。
植物转化
用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括通过以下项的转化:细菌介导的核酸递送(例如,经由农杆菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、peg介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学的、化学的、物理的(机械的)或生物的机制,包括其任何组合。对于本领域已知的不同植物转化方法的一般指导包括以下文献:miki等人(“proceduresforintroducingforeigndnaintoplants”inmethodsinplantmolecularbiologyandbiotechnology[植物分子生物学与生物技术方法中的“用于将外来dna引入植物中的程序”],glick,b.r.和thompson,j.e.编辑,crc出版公司(crcpress,inc.),波卡拉顿(bocaraton),1993,第67-88页)和rakowoczy-trojanowska(cell.mol.biol.lett.[细胞与分子生物学快报]7:849-858(2002))。
对于农杆菌介导的转化,二元载体或携带至少一个t-dna边界序列的载体是适合的,而对于直接基因转移(例如,微粒轰击等),任何载体都是适合的,并且仅含有目的构建体的线性dna可以是优选的。在直接基因转移的情况下,可以使用以单个dna种类的转化或共转化(schocher等人,biotechnology[生物技术]4:1093-1096(1986))。对于直接基因转移以及农杆菌介导的转移二者,转化通常(但不是必需的)用如下选择性标记进行,该选择性标记可以是正向选择(磷甘露糖异构酶),提供对抗生素(卡那霉素、潮霉素或甲氨蝶呤)或除草剂(草甘膦或草丁膦)的抗性。然而,选择性标记的选择对于本发明并不是至关重要的。
农杆菌介导的转化是用于转化植物的常用方法,因为它的高转化效率以及因为它与许多不同物种的广泛实用性。农杆菌介导的转化典型地涉及将携带目的外来dna的二元载体转移至适当的农杆菌菌株,这可能取决于由宿主农杆菌菌株或者在共同存在的ti质粒上或染色体地携带的vir基因的互补体(uknes等人,(1993),plantcell[植物细胞]5:159-169)。将该重组二元载体转移至农杆菌可以使用携带该重组二元载体的大肠杆菌、辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元载体移动到靶标农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地,可以通过核酸转化将所述重组二元载体转移至农杆菌中(
可以使用农杆菌转化双子叶植物以及单子叶植物。用于农杆菌介导的水稻转化方法包括熟知的水稻转化方法,如任何以下文献中描述的那些:欧洲专利申请ep1198985a1,aldemita和hodges(planta[植物]199:612-617,1996);chan等人(plantmolbiol[植物分子生物学]22(3):491-506,1993),hiei等人(plantj[植物杂志]6(2):271-282,1994),将这些披露通过引用结合在此,其引用程度如同完全阐明一样。在玉米转化的情况下,优选方法是如ishida等人(nat.biotechnol[自然生物技术]14(6):745-50,1996)或frame等人(plantphysiol[植物生理学]129(1):13-22,2002)中所描述的,将这些披露通过引用结合在此,其引用程度如同完全阐明一样。所述方法例如在b.jenes等人,techniquesforgenetransfer[基因转移技术],在:transgenicplants[转基因植物],第1卷,engineeringandutilization[工程化以及利用]中,s.d.kung和r.wu编著,学术出版社(1993)128-143以及在potrykus,annu.rev.plantphysiol.plantmolec.biol.[植物生理学年评和植物分子生物学]42(1991)205-225)中进一步描述。有待表达的核酸或构建体优选地克隆至适合于转化根癌农杆菌(agrobacteriumtumefaciens)的载体例如pbin19中(bevan等人,nucl.acidsres.[核酸研究]12(1984)8711)。然后,能够以已知的方式使用由这种载体转化的农杆菌来转化植物,如用作模型的植物像拟南芥或作物植物如烟草植物,方法是例如通过将捣碎的叶或切碎的叶浸没于农杆菌溶液中,并且然后将其在适合的培养基中培养。例如,借助于根癌农杆菌来转化植物由hagen和willmitzer描述于nucl.acidres.[核酸研究](1988)16,9877中或尤其自以下文献已知:f.f.white,vectorsforgenetransferinhigherplants;intransgenicplants[用于高等植物中的基因转移的载体],第1卷,engineeringandutilization[工程化以及利用],编辑s.d.kung和r.wu,学术出版社(academicpress),1993,第15-38页。
通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方法。在携带位于这些二元质粒t-dna边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。
如先前所讨论的,另一种用于转化植物、植物部分和植物细胞的方法涉及在植物组织和细胞上推进惰性或生物活性的粒子。参见例如,美国专利号4,945,050;5,036,006和5,100,792。通常,这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时,可以通过用含有目的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地,一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性的粒子(例如,干酵母细胞、干细菌或噬菌体,各自含有一种或多种被试图引入的核酸)推进到植物组织中。
在其他实施例中,本发明的多核苷酸可以被直接转化进质体基因组中。质体转化的主要优点在于质体通常能够表达细菌基因而无需实质性的修饰,而且质体能够在单个启动子的控制下表达多个开放阅读框。在美国专利号5,451,513、5,545,817和5,545,818中,在pct申请号wo95/16783中,以及在mcbride等人(1994)proc.nati.acad.sci.usa[美国国家科学院院刊]91,7301-7305中广泛描述了质体转化技术。基本的叶绿体转化技术涉及例如使用生物射弹(biolistic)或原生质体转化(例如,氯化钙或peg介导的转化),将位于选择性标记侧翼的经克隆的质体dna区连同目的基因一起引入合适的靶组织中。这些1至1.5kb的侧翼区(被命名为靶向序列)促进了与质体基因组的同源重组,并且因而允许置换或修饰原质体(plastome)的特定区域。最初,可以将叶绿体16srrna和rps12基因(赋予针对大观霉素或链霉素的抗性)的点突变用作供转化用的选择性标记(svab,z.、hajdukiewicz,p.和maliga,p.,(1990)proc.natl.acad.sci.usa[美国国家科学院院刊]87,8526-8530);staub,j.m.和maliga,p.,(1992)plantcell[植物细胞]4,39-45)。在这些标记之间克隆位点的存在允许建立质体靶向载体用于外来基因的引入(staub,j.m.和maliga,p.,(1993)emboj.[欧洲分子生物学杂志]12,601-606)。转化效率的实质性增加可以通过用显性的选择性标记(对大观霉素解毒酶氨基糖苷-3'-腺苷转移酶进行编码的细菌aada基因)置换隐性的rrna或r蛋白抗生素抗性基因而获得(svab,z.和maliga,p.,(1993)proc.natl.acad.sci.usa[美国国家科学院院刊]90,913-917)。先前,这种标记已经被成功地用于莱茵衣藻这种绿藻的质体基因组的高频率转化(goldschmidt-clermont,m.(1991)nucl.acidsres.[核酸研究]19:4083-4089)。有用于质体转化的其他选择性标记在本领域是已知的,并且被包括在本发明的范围之内。典型地,转化之后需要大约15-20个细胞分裂循环以便达到同质状态。质体表达(其中基因通过同源重组被插入到在每个植物细胞中存在的所有数千个环状质体基因组的拷贝中)利用了超过核表达的基因的庞大的拷贝数目的优点,以便允许能够很容易超过总的可溶性植物蛋白的10%的表达水平。在一个实施例中,可以将本发明的多核苷酸插入质体靶向载体中并转化进所希望的植物宿主的质体基因组中。因此,可以获得与含有本发明的核苷酸序列的质体基因组同型的植物,这些植物能够高表达该多核苷酸。
选择转化的转基因植物、植物细胞或植物组织培养物的方法在本领域中是常规的,并且可以用于在此提供的本发明的方法中。例如,本发明的重组载体还可以包括包含用于选择性标记的核苷酸序列的表达盒,该选择性标记可以用于选择转化的植物、植物部分或植物细胞。如在此使用的,“选择性标记”意指如下核苷酸序列,当该核苷酸序列表达时向表达该标记的植物、植物部分或植物细胞赋予不同的表型,并且因此允许此类转化的植物、植物部分或植物细胞与不具有该标记的那些区别开来。这样的核苷酸序列可以编码选择性或筛选性标记,这取决于该标记是否赋予可以通过化学手段而被选择的性状,如通过使用选择剂(例如,抗生素、除草剂等),或者取决于该标记是否仅是人们可以通过观察或测试而鉴别的性状,如通过筛选(例如,r基因座性状)。当然,适合的选择性标记的许多实例在本领域是已知的并且可以用于在此描述的表达盒中。
选择性标记的实例包括但不限于编码neo或nptii的核苷酸序列,它赋予对卡那霉素、g418等的抗性(potrykus等人(1985)mol.gen.genet.[分子遗传学与普通遗传学]199:183-188);编码bar的核苷酸序列,它赋予对草丁膦的抗性;编码改变的5-烯醇丙酮莽草酸-3-磷酸(epsp)合酶的核苷酸序列,它赋予对草甘膦的抗性(hinchee等人(1988)biotech.[生物技术]6:915-922);编码腈水解酶(如来自臭鼻克雷白氏杆菌(klebsiellaozaenae)的bxn)的核苷酸序列,它赋予对溴草腈的抗性(stalker等人(1988)science[科学]242:419-423);编码改变的乙酰乳酸合酶(als)的核苷酸序列,它赋予对咪唑啉酮、磺酰脲或其他als-抑制化学品的抗性(欧洲专利申请号154204);编码甲氨蝶呤-抗性的二氢叶酸还原酶(dhfr)的核苷酸序列(thillet等人(1988)j.biol.chem.[生物化学杂志]263:12500-12508);编码茅草枯脱卤素酶的核苷酸序列,它赋予对茅草枯的抗性;编码甘露糖-6-磷酸异构酶(也称为磷酸甘露糖异构酶(pmi))的核苷酸序列,它赋予代谢甘露糖的能力(美国专利号5,767,378和5,994,629);编码改变的邻氨基苯甲酸盐合酶的核苷酸序列,它赋予对5-甲基色氨酸的抗性;或编码hph的核苷酸序列,它赋予对潮霉素的抗性。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
另外的选择性标记包括但不限于编码β-葡糖醛酸酶的核苷酸序列或编码对于多种显色底物已知的酶的uida(gus);编码在植物组织中对花色苷色素(红色)进行调节的产物的r基因座核苷酸序列(dellaporta等人,chromosomestructureandfunction:impactofnewconcepts[染色体结构与功能:新概念的影响]中263-282页,“molecularcloningofthemaizer-njallelebytransposon-taggingwithac[通过ac转座子标签技术对玉蜀黍r-nj等位基因的分子克隆]”,第18届斯特德莱遗传学专题讨论会(18thstadlergeneticssymposium)(gustafson和appels编辑,plenum出版社,1988));编码β-内酰胺酶的核苷酸序列,对于β-内酰胺酶而言多种显色底物是已知的(例如,padac,显色头孢菌素)(sutcliffe,(1978)proc.natl.acad.sci.usa[美国国家科学院院刊]75:3737-3741);编码xyle的核苷酸序列,xyle编码儿茶酚双加氧酶(zukowsky等人,(1983)proc.natl.acad.sci.usa[美国国家科学院院刊]80:1101-1105);编码酪氨酸酶的核苷酸序列,酪氨酸酶能够氧化酪氨酸成为dopa和多巴醌,其进而缩合形成黑色素(katz等人,(1983)j.gen.microbiol.[普通微生物学杂志]129:2703-2714);编码β-半乳糖苷酶的核苷酸序列,对于β-半乳糖苷酶而言存在显色底物;编码荧光素酶(lux)的核苷酸序列,荧光素酶允许生物发光检测(ow等人,(1986)science[科学]234:856-859);编码水母发光蛋白的核苷酸序列,水母发光蛋白可以在钙敏感的生物发光检测中采用(prasher等人,(1985)biochem.biophys.res.comm.[生物化学与生物物理学研究通讯]126:1259-1268);或编码绿色荧光蛋白的核苷酸序列(niedz等人,(1995)plantcellreports[植物细胞报道]14:403-406)。本领域技术人员能够选择用于在本发明的表达盒中使用的适合的选择性标记。
此外,如本领域中所熟知的,完整的转基因植物可以使用多种已知技术中的任何技术从转化的植物细胞、植物组织培养物或培养的原生质体再生而来。在以下文献中描述了从植物细胞、植物组织培养物或培养的原生质体进行的植物再生:例如,evans等人(handbookofplantcellcultures[植物细胞培养物手册],第1卷,麦克米兰出版公司(macmilanpublishingco.),纽约(1983));以及vasili.r.(编辑)(cellcultureandsomaticcellgeneticsofplants[植物的细胞培养和体细胞遗传学],学术出版社,奥兰多,第i卷(1984)和第ii卷(1986))。
另外,工程化进以上所述的本发明的转基因种子和植物、植物部分或植物细胞中的遗传特性可以通过有性生殖或营养生长来传递,并且因此可以在子代植物中维持并传代。通常,维持和传代利用了被开发以适合特定目的(如收获、播种或耕作)的已知农业方法。
因此,可以按本领域熟知的任何数目的方法(如上所述的)将多核苷酸引入该植物、植物部分或植物细胞中。因此,没有依赖用于将一种或多种多核苷酸引入植物中的特定方法,相反可以使用允许将该一种或多种多核苷酸稳定地整合到该植物的基因组中的任何方法。在有待引入一种以上多核苷酸的情况下,这些对应的多核苷酸可以作为单一核酸分子的一部分、或者作为分开的核酸分子而进行组装,并且可以位于相同的或不同的核酸分子上。因此,可以在单个转化事件中、在分开的转化事件中、或者例如作为育种方案的一部分在植物中,将这些多核苷酸引入目的细胞中。
本发明的另外的实施例包括从本发明的转基因植物或其部分产生的收获产物以及从该收获产物产生的加工产物。收获产物可以是如在此描述的全株或任何植物部分。因此,在一些实施例中,收获产物的非限制性实例包括种子、果实、花或其部分(例如,花药、柱头等)、叶、茎等。在其他实施例中,加工产物包括但不限于从收获的本发明的种子或其他植物部分产生的细粉、粗粉、油、淀粉、谷物等,其中该种子或其他植物部分包含本发明的核酸分子/多核苷酸/核苷酸序列。
在其他实施例中,本发明提供了来自本发明的转基因种子或转基因植物的提取物,其中该提取物包含本发明的核酸分子、多核苷酸、核苷酸序列或毒性蛋白。可以根据本领域熟知的程序制备来自植物或植物部分的提取物(参见,delatorre等人,food,agric.environ.[食品农业与环境]2(1):84-89(2004);guidet,nucleicacidsres.[核酸研究]22(9):1772-1773(1994);lipton等人,foodagric.immun.[食品农业通讯]12:153-164(2000))。
杀昆虫组合物
在一些实施例中,本发明提供了杀昆虫组合物,该组合物包含农业上可接受的载体中的本发明的cry蛋白。如在此使用的“农业上可接受的载体”可以包括与活性cry蛋白组合以有助于它施用至或植物或其部分的天然或合成的有机或无机材料。农业上可接受的载体的实例包括但不限于粉剂、尘剂、丸剂、颗粒剂、喷雾剂、乳剂、胶体以及溶液。农业上可接受的载体进一步包括但不限于可用于农业配制品中的惰性组分、分散剂、表面活性剂、佐剂、增粘剂、粘着剂、粘合剂或其组合。此类组合物可以按使杀有害生物蛋白或其他有害生物控制剂与这些有害生物接触的任何方式施用。因此,可以将这些组合物施用于植物或植物部分的表面,包括种子、叶、花、茎、块茎、根等。在其他实施例中,在植物体内产生本发明的cry蛋白的植物是被表达的cry蛋白的农业载体。
在另外的实施例中,该杀昆虫组合物包含细菌细胞或本发明的转基因细菌细胞,其中该细菌细胞或转基因细菌细胞产生本发明的cry蛋白。这样一种杀昆虫组合物可以通过脱水、冷冻干燥、均化、萃取、过滤、离心、沉降或浓缩苏云金芽孢杆菌(bt)的培养物而制备。此类bt培养物可以是下文实例中描述的天然存在的bt菌株yn171-1、gx078-2和gx435-1或转基因bt培养物。在另外的实施例中,该组合物包含按重量计从约1%至约99%的本发明的cry蛋白。
本发明的cry蛋白可以与其他有害生物控制剂组合使用,以增加有害生物靶标范围或用于预防或管理昆虫抗性。因此,在一些实施例中,本发明提供了控制一种或多种植物有害生物的组合物,其中该组合物包含本发明的第一cry蛋白和不同于该第一cry蛋白的第二有害生物控制剂。在其他实施例中,该组合物是用于局部施用至植物的配制品。在仍其他实施例中,该组合物是转基因植物。在另外的实施例中,该组合物是局部施用至转基因植物的配制品的组合。在一些实施例中,当该转基因植物包含该第二有害生物控制剂时,该配制品包含本发明的该第一cry蛋白。在其他实施例中,当该转基因植物包含本发明的该第一cry蛋白时,该配制品包含该第二有害生物控制剂。
在一些实施例中,该第二有害生物控制剂可以是选自下组的试剂,该组由以下组成:化学杀有害生物剂(如杀昆虫剂)、苏云金芽孢杆菌(bt)杀昆虫蛋白、致病杆菌属杀昆虫蛋白、发光杆菌属杀昆虫蛋白、侧孢短芽孢杆菌(brevibacilluslaterosporus)杀昆虫蛋白、球形芽孢杆菌(bacillussphaericus)杀昆虫蛋白、蛋白酶抑制剂(丝氨酸和半胱氨酸类型两者)、凝集素、α-淀粉酶、过氧化物酶、胆固醇氧化酶以及双链rna(dsrna)分子。
在其他实施例中,该第二有害生物控制剂是选自下组的化学杀有害生物剂,该组由以下组成:拟除虫菊酯、氨基甲酸酯、新烟碱、神经元钠通道阻断剂、杀昆虫大环内酯、γ-氨基丁酸(gaba)拮抗剂、杀昆虫脲以及保幼激素模拟物。在其他实施例中,该化学杀有害生物剂选自下组,该组由以下组成:阿巴美丁、乙酰甲胺磷、啶虫脒、磺胺螨酯(amidoflumet)(s-1955)、除虫菌素(avermectin)、印楝素、甲基谷硫磷、联苯菊酯、联苯肼酯(binfenazate)、噻嗪酮、克百威、溴虫腈、定虫隆、毒死蜱、甲基毒死蜱、环虫酰肼、噻虫胺、氟氯氰菊酯、β-氟氯氰菊酯、三氯氟氰菊酯、λ-三氯氟氰菊酯、氯氰菊酯、灭蝇胺、溴氰菊酯、杀螨隆、二嗪磷、除虫脲、乐果、苯虫醚、甲氨基阿维菌素、硫丹、高氰戊菊酯、乙虫腈、苯硫威(fenothicarb)、苯氧威、甲氰菊酯、唑螨酯、氰戊菊酯、氟虫腈、氟啶虫酰胺、氟氰戊菊酯、τ-氟胺氰菊酯、嘧虫胺(ur-50701)、氟虫脲、地虫硫磷、氯虫酰肼、氟铃脲、吡虫啉、茚虫威、异柳磷、虱螨脲、马拉硫磷、聚乙醛、甲胺磷、杀扑磷、灭多威、烯虫酯、甲氧氯、久效磷、甲氧虫酰肼、噻虫醛(nithiazin)、双苯氟脲、多氟脲(xde-007)、杀线威、对硫磷、甲基对硫磷、氯菊酯、甲拌磷、伏杀磷、亚胺硫磷、磷胺、抗蚜威、丙溴磷、吡蚜酮、啶虫丙醚、蚊蝇醚、鱼藤酮、多杀菌素、螺甲螨酯(spiromesifin)(bsn2060)、硫丙磷、虫酰肼、伏虫隆、七氟菊酯、特丁硫磷、杀虫畏、噻虫啉、噻虫嗪、硫双威、杀虫双(thiosultap-sodium)、四溴菊酯、敌百虫和杀铃脲、涕灭威、杀线威、苯线磷、双甲脒、灭螨猛、乙酯杀螨醇、三环锡、三氯杀螨醇、除螨灵、依杀螨、喹螨醚、苯丁锡、甲氰菊酯、唑螨酯、噻螨酮、克螨特、哒螨灵以及吡螨胺。在仍其他实施例中,该化学杀有害生物剂选自下组,该组由以下组成:氯氰菊酯、三氯氟氰菊酯、氟氯氰菊酯和β-氟氯氰菊酯、高氰戊菊酯、氰戊菊酯、四溴菊酯、苯硫威、灭多威、杀线威、硫双威、噻虫胺、吡虫啉、噻虫啉、茚虫威、多杀菌素、阿巴美丁、除虫菌素、甲氨基阿维菌素、硫丹、乙虫腈、氟虫腈、氟虫脲、杀铃脲、苯虫醚、蚊蝇醚、吡蚜酮以及双甲脒。
在另外的实施例中,该第二有害生物控制剂可以是任何数目的苏云金芽孢杆菌杀昆虫蛋白中的一种或多种,包括但不限于cry蛋白、营养期杀昆虫蛋白(vip)以及任何前述杀昆虫蛋白的杀昆虫嵌合体。在其他实施例中,该第二有害生物控制剂是选自下组的cry蛋白,该组由以下组成:cry1aa、cry1ab、cry1ac、cry1ad、cry1ae、cry1af、cry1ag、cry1ah、cry1ai、cry1aj、cry1ba、cry1bb、cry1bc、cry1bd、cry1be、cry1bf、cry1bg、cry1bh、cry1bi、cry1ca、cry1cb、cry1da、cry1db、cry1dc、cry1dd、cry1ea、cry1eb、cry1fa、cry1fb、cry1ga、cry1gb、cry1gc、cry1ha、cry1hb、cry1hc、cry1ia、cry1ib、cry1ic、cry1id、cry1ie、cry1if、cry1ig、cry1ja、cry1jb、cry1jc、cry1jd、cry1ka、cry1la、cry1ma、cry1na、cry1nb、cry2aa、cry2ab、cry2ac、cry2ad、cry2ae、cry2af、cry2ag、cry2ah、cry2ai、cry2aj、cry2ak,cry2al、cry2ba、cry3aa、cry3ba、cry3bb、cry3ca、cry4aa、cry4ba、cry4ca、cry4cb、cry4cc、cry5aa、cry5ab、cry5ac、cry5ad、cry5ba、cry5ca、cry5da、cry5ea、cry6aa、cry6ba、cry7aa、cry7ab、cry7ac、cry7ba、cry7bb、cry7ca、cry7cb、cry7da、cry7ea、cry7fa、cry7fb、cry7ga、cry7gb、cry7gc、cry7gd、cry7ha、cry7ia、cry7ja、cry7ka、cry7kb、cry7la、cry8aa、cry8ab、cry8ac、cry8ad、cry8ba、cry8bb、cry8bc、cry8ca、cry8da、cry8db、cry8ea、cry8fa、cry8ga、cry8ha、cry8ia、cry8ib、cry8ja、cry8ka、cry8kb、cry8la、cry8ma、cry8na、cry8pa、cry8qa、cry8ra、cry8sa、cry8ta、cry9aa、cry9ba、cry9bb、cry9ca、cry9da、cry9db、cry9dc、cry9ea、cry9eb、cry9ec、cry9ed、cry9ee、cry9fa、cry9ga、cry10aa、cry11aa、cry11ba、cry11bb、cry12aa,cry13aa、cry14aa、cry14ab、cry15aa、cry16aa、cry17aa、cry18aa、cry18ba、cry18ca、cry19aa、cry19ba、cry19ca、cry20aa、cry20ba、cry21aa、cry21ba、cry21ca、cry21da、cry21ea、cry21fa、cry21ga、cry21ha、cry22aa、cry22ab、cry22ba、cry22bb、cry23aa、cry24aa、cry24ba、cry24ca、cry25aa、cry26aa、cry27aa、cry28aa、cry29aa、cry29ba、cry30aa、cry30ba、cry30ca、cry30da、cry30db、cry30ea、cry30fa、cry30ga,cry31aa、cry31ab、cry31ac、cry31ad、cry32aa、cry32ab、cry32ba、cry32ca、cry32cb、cry32da、cry32ea、cry32eb、cry32fa、cry32ga、cry32ha、cry32hb、cry32ia、cry32ja、cry32ka、cry32la、cry32ma、cry32mb、cry32na、cry32oa、cry32pa、cry32qa、cry32ra、cry32sa、cry32ta、cry32ua、cry33aa、cry34aa、cry34ab、cry34ac、cry34ba、cry35aa、cry35ab、cry35ac、cry35ba、cry36aa、cry37aa、cry38aa、cry39aa、cry40aa、cry40ba、cry40ca、cry40da、cry41aa、cry41ab、cry41ba、cry42aa、cry43aa、cry43ba、cry43ca、cry43cb、cry43cc、cry44aa、cry45aa、cry46aa、cry46ab、cry47aa、cry48aa、cry48ab、cry49aa、cry49ab、cry50aa、cry50ba、cry51aa、cry52aa、cry52ba、cry53aa、cry53ab、cry54aa、cry54ab、cry54ba、cry55aa、cry56aa、cry57aa、cry57ab、cry58aa、cry59aa、cry59ba、cry60aa、cry60ba、cry61aa、cry62aa、cry63aa、cry64aa、cry65aa、cry66aa、cry67aa、cry68aa、cry69aa、cry69ab、cry70aa、cry70ba、cry70bb、cry71aa、cry72aa以及cry73aa。
在另外的实施例中,该第二有害生物控制试剂是选自下组的vip3营养期杀昆虫蛋白,该组由以下组成:vip3aa1、vip3aa2、vip3aa3、vip3aa4、vip3aa5、vip3aa6、vip3aa7、vip3aa8、vip3aa9、vip3aa10、vip3aa11、vip3aa12、vip3aa13、vip3aa14、vip3aa15、vip3aa16、vip3aa17、vip3aa18、vip3aa19、vip3aa20、vip3aa21、vip3aa22、vip3aa2、vip3aa24、vip3aa25、vip3aa26、vip3aa27、vip3aa28、vip3aa29、vip3aa30、vip3aa31、vip3aa32、vip3aa33、vip3aa34、vip3aa35、vip3aa36、vip3aa37、vip3aa38、vip3aa39、vip3aa40、vip3aa41、vip3aa42、vip3aa43、vip3aa44、vip3ab1、vip3ab2、vip3ac1、vip3ad1、vip3ad2、vip3ae1、vip3af1、vip3af2、vip3af3、vip3ag1、vip3ag2、vip3ag3、hm117633、vip3ag4、vip3ag5、vip3ah1、vip3ba1、vip3ba2、vip3bb1、vip3bb2以及vip3bb3。
在仍另外的实施例中,在转基因植物中共表达本发明的第一cry蛋白和该第二有害生物控制剂。可以通过将植物遗传工程化以含有并表达所有的必需基因来实现一种以上杀有害生物成分在同一个转基因植物中的共表达。可替代地,可以将植物(亲本1)遗传工程化,用于本发明的cry蛋白的表达。可以将第二植物(亲本2)遗传工程化,用于第二有害生物控制剂的表达。通过将亲本1与亲本2杂交,获得了表达被引入至亲本1和亲本2中的所有基因的子代植物。
在其他实施例中,本发明提供了对植物有害生物侵染有抗性的叠加性转基因植物,该植物包含编码用于在靶标有害生物中抑制必需基因的dsrna的dna序列和编码针对该靶标有害生物展示出生物活性的本发明的cry蛋白的dna序列。已经报道,dsrna对抗某些鳞翅目有害生物是无效的(rajagopol等人,2002,j.biol.chem.[生物化学杂志]277:468-494),这可能是由于中肠中的高ph使得dsrna不稳定。因此,在一些靶标有害生物是鳞翅目有害生物的实施例中,本发明的cry蛋白起作用以瞬时降低中肠ph,这用于稳定共摄取的dsrna,从而使得该dsrna有效沉默靶基因。
除了提供组合物之外,本发明还提供了产生对鳞翅目有害生物有毒的cry蛋白的方法。这样一种方法包括在转基因非人类宿主细胞产生对鳞翅目有害生物有毒的蛋白质的条件下培养该宿主细胞,该宿主细胞包含本发明的多核苷酸或嵌合基因或核酸分子或重组载体。在一些实施例中,该转基因非人类宿主细胞是植物细胞。在一些其他实施例中,该植物细胞是玉蜀黍细胞。在其他实施例中,该植物细胞或玉蜀黍细胞在其下生长的条件包括自然光照。在其他实施例中,该转基因非人类宿主细胞是细菌细胞。在仍其他实施例中,该转基因非人类宿主细胞是酵母细胞。
在该方法的其他实施例中,该鳞翅目有害生物选自下组,该组由以下组成:亚洲玉米蛀虫(亚洲玉米螟)、黑色地老虎(小地老虎)、棉螟蛉(棉铃虫)、黄色桃螟虫(桃蛀螟)、东方黏虫(东方粘虫)、欧洲玉米蛀虫(欧洲玉米螟)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)、以及水稻卷叶螟(稻纵卷叶螟)及其任何组合。
在该方法的另外的实施例中,该嵌合基因包括seqidno:1-5中的任一项。在仍其他实施例中,所产生的蛋白质包含seqidno:16-25中任一项的氨基酸序列。
在该方法的一些实施例中,该嵌合基因包含针对在植物中表达进行了密码子优化的核苷酸序列。在其他实施例中,该嵌合基因包含seqidno:6-10中的任一项。在另外的实施例中,所产生的蛋白质包含seqidno:16-25中任一项的氨基酸序列。
在另外的实施例中,本发明提供了一种产生抗有害生物(例如,抗昆虫)转基因植物的方法,该方法包括向植物中引入包含编码本发明的cry蛋白的核苷酸序列的本发明的多核苷酸、嵌合基因、重组载体、表达盒或核酸分子,其中该核苷酸序列被表达于该植物中,由此赋予该植物对鳞翅目有害生物的抗性,并且产生抗昆虫转基因植物。在一些实施例中,与缺乏本发明的多核苷酸、嵌合基因、重组载体、表达盒或核酸分子的对照植物相比,抗有害生物转基因植物对杆野螟属(ostrinia)的鳞翅目有害生物有抗性。在其他实施例中,杆野螟属的该昆虫是亚洲玉米蛀虫(亚洲玉米螟)。在一些实施例中,通过转化植物实现引入。在其他实施例中,通过使包含本发明的嵌合基因、重组载体、表达盒或核酸分子的第一植物与不同的第二植物杂交来实现引入。
在一些实施例中,至少对亚洲玉米蛀虫(亚洲玉米螟)有抗性的本发明的转基因植物还对至少一种另外的鳞翅目有害生物有抗性,其中该另外的鳞翅目有害生物包括但不限于黑色地老虎(小地老虎)、秋黏虫(草地贪夜蛾)、玉米穗蛾(玉米穗虫)、甘蔗螟(小蔗螟)、绒毛豆毛虫(黎豆夜蛾)、大豆夜蛾(大豆尺蠖)、西南玉米蛀虫(西南玉米螟)、西部豆切根虫(西部豆夜蛾)、烟夜蛾(烟芽夜蛾)、棉螟蛉(棉铃虫)、条纹蛀茎虫(二化螟)、粉蛀茎虫(非洲大螟)或水稻卷叶螟(稻纵卷叶螟)及其任何组合。
在另外的实施例中,提供了一种控制鳞翅目有害生物如亚洲玉米蛀虫(亚洲玉米螟)的方法,该方法包括向这些昆虫递送有效量的本发明的cry蛋白。为了有效,该cry蛋白首先被昆虫经口摄取。然而,该cry蛋白可以按许多公认的方式被递送至该昆虫。用于将蛋白质经口递送至昆虫的方式包括但不限于将该蛋白质提供于(1)转基因植物中,其中该昆虫取食(摄取)该转基因植物的一个或多个部分,由此摄取在该转基因植物中表达的多肽;(2)一种或多种配制的蛋白质组合物中,它们可以被施用至或掺入例如昆虫生长介质中;(3)一种或多种蛋白质组合物中,它们可以被施用至表面,例如喷雾在植物部分的表面,然后当该昆虫取食喷雾的一个或多个植物部分时组合物被该昆虫摄取;(4)饵基;或(5)任何其他本领域公认的蛋白质递送系统。因此,可以使用经口递送至昆虫的任何方法来递送本发明的毒性cry蛋白。在一些特定实施例中,将本发明的cry蛋白经口递送至昆虫,其中该昆虫摄取转基因植物的一个或多个部分。
在其他实施例中,将本发明的cry蛋白经口递送至昆虫,其中该昆虫摄取用包含本发明的cry蛋白的组合物喷雾的植物的一个或多个部分。可以使用本领域技术人员已知的用于将化合物、组合物、配制品等施用于植物表面的任何方法将本发明的组合物递送至植物表面。递送至或接触植物或其部分的一些非限制性实例包括喷雾、撒粉、喷洒、分散、下雾、雾化、撒播、浸泡、土壤注入、土壤掺入、浸透(例如,根、土壤处理)、浸渍、灌注、涂覆、叶或茎浸润、侧施或种子处理等及其组合。用于使植物或其部分与一种或多种化合物、一种或多种组合物或一种或多种配制品接触的这些和其他程序是本领域技术人员熟知的。
在一些实施例中,本发明涵盖为农民提供控制鳞翅目有害生物的手段的方法,该方法包括向该农民供应或出售植物材料如种子,该植物材料包含能够在由该种子生长的植物中表达本发明的cry蛋白的多核苷酸、嵌合基因、表达盒或重组载体,如上所述。
本发明的实施例可以通过参考以下实例而被更好地理解。前述的和以下的本发明的实施例以及各种实施例的描述不是旨在限制权利要求书,而是对其具有说明性。因此,应理解的是权利要求书不旨在受限于这些实例的具体细节。本领域技术人员应理解的是本发明的其他实施例可以在不偏离本披露的精神和范围的情况下进行实践,本披露的范围是由所附权利要求书限定的。
实例
实例1.用于基因组测序的bt菌株的鉴别
从在中国收集的土壤样品中分离苏云金芽孢杆菌(bt)菌株。将土壤样品悬浮于lb+2.5m乙酸钠液体培养基中,随后70℃热处理约20min。然后将一微升悬浮液涂布在t3+青霉素琼脂平板上并且在28℃下孵育,直到形成菌落。将具有芽孢杆菌属样形态学的菌落从这些平板中挑出并且在t3+青霉素琼脂平板上重新划线直到它们已经形成孢子,典型地持续大约三天。通过用考马斯蓝/乙酸将培养物染色并且用显微镜目测来鉴别bt菌株。鉴别bt菌株后,如下所述分离基因组dna。
实例2.基因组组装与分析
使用全基因组测序方法,从如实例1中所述分离的bt菌株的基因组组装本发明的btcry基因。简言之,使用covariss2超声波装置(covaris公司,沃本,马萨诸塞州)剪切芽孢杆菌属dna,其中将程序dna_400bp设为工作循环:10%;强度:4;循环/脉冲:200。将dna用
将文库如下进行大小分级:将50ul样品与45ul75%珠粒混合物(25%ampure珠粒加75%nacl/peg溶液teknova目录号p4136)混合。搅拌混合物并置于磁性支架上。将所得上清液转移至新孔中并且添加45ul50%珠粒混合物(50%ampure珠粒加50%nacl/peg溶液teknova目录号p4136)。搅拌该混合物并置于磁性支架上。去除所得上清液并且用80%乙醇洗涤珠粒。添加25ul的洗脱缓冲液(eb)并且将混合物置于磁性支架上。去除所得最终上清液并置于1.5ml管中。这个方法产生了525个dna碱基对(bp)(插入物加适配子)大小范围内的文库。
使用kapa生物系统高保真热启动(kapabiosystemhifihotstart)(kapa生物系统公司(kapabiosystems,inc.),威尔明顿,马萨诸塞州)使用以下循环条件扩增大小确定的dna文库:[98℃,45s];12x[98℃,15s,60℃,30s,72℃,30s];[72℃,1min]。每个反应含有:5uldna文库、1ul生物科技通用引物(25um)、18ul无菌水、1ul生物科技有索引的引物(25um)、25ul2xkapahifi聚合酶。
使用高灵敏度芯片在agilent2100生物分析仪(安捷伦科技公司(agilenttechnologies),圣克拉拉,加利福尼亚州)上跑文库,以确定文库大小范围和平均插入物大小。使用标准的制造商测序方案(亿明达公司(illumina,inc.),圣地亚哥,加利福尼亚州)在hiseq2500测序系统上针对配对末端(pe)测序(100个循环/读数;12-24个文库/泳道)处理所有文库。
使用被开发用于鉴别和表征可能的cry样基因的芽孢杆菌属计算分析工具来优先化引导物,用于进一步实验室测试。
上述基因组组装与分析鉴别出五个cry样基因,本文称为bt264、bt288、bt302、bt454和bt485,分别编码包含1173个氨基酸、1190个氨基酸、1192个氨基酸、1201个氨基酸和1146个氨基酸的并且分别具有132.1kd、135.8kd、135.6kd、134.1kd和129.3kd的分子量的蛋白质。技术人员将认识到,由于基因组测序和基因组装过程,组装的核苷酸序列和由其衍生的氨基酸序列不太可能是天然存在的,因为本领域已知序列的组装不是100%准确的并且可能引入不同于天然核苷酸序列的碱基。因此,这些核苷酸序列在此称为“组装的序列”,并且它们编码的cry蛋白衍生自“组装的序列”。
对衍生自组装的核苷酸序列的全长和截短的cry蛋白氨基酸序列进行序列同源性搜索。该截短的序列接近成熟毒素的大小,即大约67kd。使用万维网ncbi.nlm.nih.gov/blast上的ncbi蛋白质-蛋白质blast程序来确定同源性。与每种组装的cry蛋白具有最高同源性的已知cry蛋白表明了组装的cry蛋白所属的最近的cry家族。这些组装的cry编码序列和蛋白质的鉴别特征示于表1中。
表1.苏云金芽孢杆菌菌株中鉴别的组装的cry基因/蛋白质。
令人惊讶的是,根据是否对三种组装的cry蛋白(bt288、bt302和bt485)的全长与截短的氨基酸序列进行搜索,鉴别出不同的最近的cry家族成员。如表1所示,与全长bt288(seqidno:17)(其中它最近的cry家族是cry4aa,cry4aa与其全长具有42%同一性)相比,对于截短的bt288cry蛋白(seqidno:26)鉴别出的最近的cry家族是cry54aa。将bt288与cry54a和cry4aa进行比对显示出bt288的n-末端(seqidno:26)与cry54a蛋白具有51%同一性(参见表2),并且bt288的c-末端(seqidno:27)与cry4a蛋白具有47%同一性(参见表3),这表明组装的bt288核苷酸序列是cry50a和cry4a蛋白之间的杂合体。
表2.bt288的n-末端(seqidno:26)与cry54aa(seqidno:32)的比对。
表3.bt0288的c-末端(seqidno:27)与cry4aa(seqidno:33)的比对。
与全长bt302(seqidno:18)(其中它最近的cry家族是cry19ca,cry19ca与其全长具有47%同一性)相比,对于截短的bt302cry蛋白(seqidno:28)鉴别出的最近的cry家族是cry39aa。将bt302与cry39a和cry19ca进行比对显示出bt302的n-末端(seqidno:28)与cry39a具有54%同一性(参见表4),并且bt302的c-末端(seqidno:29)与cry19ca具有53%同一性(参见表5),这表明组装的bt302核苷酸序列是cry39a和cry19c蛋白之间的杂合体。
表4.bt0302的n-末端(seqidno:28)与cry39aa(seqidno:34)的比对。
表5.bt0302的c-末端(seqidno:29)与cry19ca(seqidno:35)的比对。
与全长(seqidno:20)(其中它最近的cry家族是cry4ba,cry4ba与其全长具有62%同一性)相比,对于截短的bt485cry蛋白(seqidno:30)(其与其全长形式具有62%同一性)鉴别出的最近的cry家族是cry50b。将bt485与cry50b和cry4b进行比对显示出bt485的n-末端(seqidno:30)与cry50b具有70%同一性(参见表6),并且bt485的c-末端(seqidno:31)与cry4b具有75%同一性(参见表7)。cry50b和cry4b与其全长仅具有51%同一性(参见表8)。因此,组装的bt485核苷酸序列似乎是cry50和cry4之间的杂合体。本领域已知cry4b和cry50对双翅目昆虫,特别是蚊子具有活性(zhang等人2012.characterizationofanewhighlymosquitocidalisolateofbacillusthuringiensis--analternativetobti.[一种新的高度灭蚊的苏云金芽孢杆菌分离物的表征-bti的替代品]j.invertebr.pathol.[无脊椎动物病理学杂志]109(2),217-222),并且没有明显的针对鳞翅目昆虫具有活性的报告。
表6.bt485的n-末端(seqidno:30)与cry50ba(seqidno:36)的比对。
表7.bt485的c-末端(seqidno:31)与cry4ba(seqidno:37)的比对。
表8.cry4ba(seqidno:37)与cry50ba(seqidno:36)的比对。
实例3.重组宿主细胞中的bt蛋白表达
芽孢杆菌属表达。经由设计用于在大肠杆菌和bt两者中表达的指定为pcib5634`的穿梭载体,在没有可观察到的背景杀昆虫活性的无晶体(crystalminus)苏云金芽孢杆菌(bt)菌株中表达实例2中描述的cry蛋白。载体pcib5634`包括驱动经克隆的btcry基因的表达的cry1ac启动子和红霉素抗性标记。经由电穿孔将包括目的cry编码序列的表达盒转化进宿主bt菌株中并且在含有红霉素的琼脂平板上选择转基因bt菌株。使所选择的转基因bt菌株在t3培养基中于28℃下生长4-5天至孢子形成阶段。收获细胞沉淀并且在溶解于含有2mmdtt的高ph碳酸盐缓冲液(50mm)中之前反复洗涤。
大肠杆菌表达。使用pet28a或pet29a载体(默克公司(merckkgaa),达姆施塔特,德国)在大肠杆菌菌株中表达cry蛋白。通过电穿孔转化构建体并且在含有卡那霉素的琼脂平板上选择转大肠杆菌克隆。使所选择的转基因大肠杆菌菌株生长并且使用iptg诱导在28℃下诱导cry蛋白表达。将细胞再悬浮于含有2mmdtt的高ph碳酸盐缓冲液(50mm)中并且然后使用microfluidicslv-1匀浆器打碎。
表达分析。然后经由离心澄清来自转基因bt或大肠杆菌菌株的所得细胞裂解物并且使用bioradexperion系统(伯乐公司(biorad),赫拉克勒斯,加利福尼亚州)经由sds-page和电泳图分析样品的纯度。经由布雷福德(bradford)或赛默(thermo)660测定来确定总蛋白浓度。然后在以下描述的生物测定中测试经纯化的cry蛋白。
实例4.cry蛋白在生物测定中的活性
使用本领域公认的人工饲料生物测定方法针对以下鳞翅目有害生物物种中的一种或多种测试实例3中产生的cry蛋白:亚洲玉米蛀虫(acb;亚洲玉米螟)、棉螟蛉(cbw;棉铃虫)、黑色地老虎(bcw;小地老虎)、欧洲玉米蛀虫(ecb;欧洲玉米螟)、秋黏虫(faw;草地贪夜蛾)、玉米穗蛾(cew;玉米穗虫)、甘蔗螟(scb;小蔗螟)、西南玉米蛀虫(swcb;西南玉米螟)、大豆夜蛾(sbl;大豆尺蠖)、以及烟夜蛾(tbw;烟芽夜蛾)。
向24孔平板中的人工昆虫饲料(bioserv公司,弗伦奇敦,新泽西州)的表面施用等量的溶液中的蛋白质。在饲料表面干燥之后,向每个孔中添加有待测试的昆虫物种的幼虫。将这些平板密封并且保持在就温度、光照以及相对湿度而言的环境实验室条件下。阳性对照组由暴露于非常具活性且广谱的野生型芽孢杆菌属菌株的幼虫组成。阴性对照组由暴露于仅用缓冲溶液处理的昆虫饲料的幼虫和未处理的昆虫饲料(即只有饲料)上的幼虫组成。约120小时之后评估死亡率并且相对于对照评分。
结果示于表9中,其中“-”意指与对照组相比无活性,“+/-”意指与对照组相比0-10%的活性(此类别还包括具有强烈幼虫生长抑制的0%死亡率),“+”意指与对照组相比10%-25%的活性,“++”意指与对照组相比25%-75%的活性,并且“+++”意指与对照组相比75%-100%的活性。表2中的名称“nt”意指没有针对该具体有害生物测试所指示的蛋白质。
表9.cry蛋白的生物测定结果。
实例5.针对植物表达的基因定向
在植物中表达之前,在自动基因合成平台(例如,金斯瑞公司(genscript,inc.),皮斯卡塔韦,新泽西州)上合成编码cry蛋白bt264(seqidno:16)、bt288(seqidno:17)、bt302(seqidno:18)、bt454(seqidno:19)或bt485(seqidno:20)或者突变型cry蛋白mbt264(seqidno:21)、mbt288(seqidno:22)、mbt302(seqidno:23)、mbt454(seqidno:24)或mbt485(seqidno:25)的多核苷酸。用于这个实例,制备包含可操作地连接至cry蛋白编码序列(该编码序列可操作地连接至终止子)的植物可表达型启动子的第一表达盒,并且制备包含可操作地连接至选择性标记(该选择性标记可操作地连接至终止子)的植物可表达型启动子的第二表达盒。选择性标记的表达允许在选择培养基上鉴别转基因植物。将两个表达盒克隆进适于农杆菌介导的水稻或玉蜀黍转化的载体中。
实例6.cry蛋白在玉蜀黍植物中的表达与活性
未成熟的玉蜀黍胚的转化基本上如在以下文献中描述的来进行:negrotto等人,2000,plantcellreports[植物细胞报告]19:798803。简言之,使包含描述于实例5中的表达载体的农杆菌菌株lba4404(psb1)在28℃下在yep(酵母提取物(5g/l)、蛋白胨(10g/l)、nacl(5g/l)、15g/l琼脂,ph6.8)固体培养基上生长2-4天。将大约0.8x109个农杆菌细胞悬浮于补充有100μmas的ls-inf培养基中。在这个培养基中对细菌预诱导大约30-60分钟。
将来自近交玉蜀黍系的未成熟胚从8-12天龄的穗中切除到液体ls-inf+100μmas中。用新鲜的感染培养基漂洗这些胚。然后添加农杆菌溶液,并且将这些胚涡旋30秒并且允许其与细菌一起沉降5分钟。然后将这些胚盾片向上地转移到lsa培养基中,并且在暗处培养两到三天。随后,将每皮氏板(petriplate)大约20与25个之间的胚转移至补充有头孢噻肟(250mg/l)和硝酸银(1.6mg/l)的lsdc培养基中,并且在大约28℃下在黑暗中培养10天。
将产生胚性愈伤组织的未成熟胚转移至lsd1m0.5s培养基中。在这种培养基上对培养物进行持续大约6周的选择,在约3周时进行传代培养步骤。将存活的愈伤组织转移至补充有甘露糖的reg1培养基中。在光照中(16小时光照/8小时黑暗方案)培养之后,然后将绿色组织转移至没有生长调节剂的reg2培养基中并且孵育约1-2周。将这些小植株转移至含有reg3培养基的magentaga-7盒(马真塔公司(magentacorp),芝加哥,伊利诺伊州)中并使其在光照中生长。约2-3周之后,通过pcr测试植物的选择性标记基因和btcry基因的存在。将来自pcr测定的阳性植物转移至温室用于进一步评估。
在叶切除生物测定中,针对拷贝数(通过taqman分析确定)、蛋白质表达水平(通过elisa确定)和对抗目的昆虫种类的功效对转基因植物进行评估。确切地说,从单拷贝事件(v3-v4阶段)中切取植物组织(叶或花丝)并且用靶标有害生物的新生幼虫侵染,然后在室温下孵育5天。针对一种或多种鳞翅目有害生物如亚洲玉米蛀虫(亚洲玉米螟)测试来自表达bt264、bt288、bt302、bt454、bt485、mbt264、mbt288、mbt302、mbt454或mbt485的转基因植物的叶圆片。转基因植物组织生物测定的结果将证实当在转基因植物中表达时本发明的cry蛋白对于目标鳞翅目有害生物中的一种或多种是有毒的。
序列表
<110>syngentaparticipationsag
syngentabiotechnologychinaco.,ltd.
huazhongagriculturaluniversity
sun,ming
mei,wenqian
seguin,katherine
bramlett,matthew
<120>用于控制植物有害生物的组合物和方法
<130>81292-cn-reg-org-p
<160>37
<170>patentinversion3.5
<210>1
<211>3522
<212>dna
<213>苏云金芽孢杆菌
<400>1
atgggaggaataaatatgagtccaaattattcagatgactatgaaatcataaatgctcca60
tcgaatacttctccaagatatcctttagtacacgatctaactccacaattccaagatatg120
aattataaagattatttacgaatgacggaggggaataggggtgtttccgctacatcagta180
agatcaggtggtgaagcaattgatgctgcactctctataactgcaattttgctaggtgtt240
ttaggtcacccagttggttctgcggttgttggtacttttaatgctcttttaggcttattg300
tggccgaatggtcaaacaattgtatgggaagatttattagcaaaagcagaagattttgct360
aataaagtcataacagcggaaataagaagtaatgcattctcagctttaaatgtatcatac420
gcaatggtatctgagtatacaagcgcgttaaatgattggatagaaaatccaggagtacgt480
atatctcaacaactaatgagagagatatttactaatacagtactccaattagctagtcag540
atgccatattttaatgtagctggttatgaaacatcattgttaacaatgtatgcacaagct600
gccaatttacatctatctgtattaaaagatatattcatttttgggaaagaatggggattt660
cctcaaactgacattgatttttattattatgaggaattcatagatcatcttcctgtatat720
gttgatcattgcacgaaatggtataatgaagggttaaacaacttaccaaagtcaaactct780
tatgattggtataactataataaattccgtagagaaatgacattaatggtactagatatt840
gttgctttatttccaagttatgatgcatatgtatatacattggagacaacaacagagctt900
acaagaatagtttatacagatccacttgggattatgatacctccacctccaggatatgag960
gaaatggttggttatggtggtaatcttgattggcgtaattatggttttagcttctcatat1020
ttagaaagtcaacttcgacagcctgttctgtttagttggttaaattcaataaaaatgtat1080
acgagaaaaataatatgtgaggctggtactccccacagtctttggtcagggaatgagata1140
aatctatcttatacatcagatccttcaaatacttttacgcttcagagtgggtatagtact1200
ggatatacacatacagatttcctagatatcaattcaaaagatatttatgaagttgtttca1260
aaaataggttcagaggcagttgttggtccgggagacgattcttatctctatggattgtat1320
caagcagcttttcggatcatacctaaagatagttctgcatattcttatctttatcctaca1380
tatgacattggcatgaatggttattctatgagctcactggtagaattacctccggaatcg1440
tccgatccacctcaaccggatgaatatacgtatactcatagattatcttacgcgacactt1500
cttagcgtgcacagttatacttctgatttttttaatgatggagcgattcctatatacggt1560
tggacacatagaagtgtaaatcgtgataatcaaatttacccagatagaattacgcaaatt1620
ccagctgtaaaaggaaaacagttaatagagggtgcgagtgttcataaaggacctggatcg1680
actggaggagatttagttagactttatttaaatgatagagtttatctaaatgttaacgta1740
gactcagtatcacaaaaatatcgtgtaagagttcgttgtgctacttacaatcctggttct1800
atatatttgtatcgtgataatactataattagttctgctacagctccaaagactacggat1860
acaacagatactactcaaattaaatttaatgactttcaatatataacttttagtgatatt1920
tttacatttactagtacttggcaacaaatatctataggtgcaggtacaacatatgcagaa1980
gtgtatatcgacaaaatcgaattcatcccagtgaatgagacatatgaagcggaaagaaat2040
ttagaaaatgcgaagaaggcagtgagcgcattattcacaggtacgatggatacattaaaa2100
agagaagtgacagattatcaaatcgatcgggcttcgaatttaatagaatgtgtgtcagat2160
gaaatgtatggaaacgataaacgactgttatttgaagcggtaaaaaccgcaaaacgattg2220
agtcaatcccgtaatctacttcaagatctaaattttgaaatgttaaataccagcggtaac2280
ggagaaaatggctgggtcggaagtacaggaatacaagttgtagaaggagatgcgctattt2340
aaaaatcgttccctgcgtttaccaggtgcgagacaatttgatacagaaacatatccaacg2400
tatctgtatcaaaaaatagaggagtctaaattaaaaccatatacacgatataaagtgaga2460
gggtttataaaaggtagtaaagatttagaggtagatgtgatgcgatatggcgcgaaacag2520
aaagtgttgaacgttccaaataatttaaatccagatatcattcctataaatgcttgtgga2580
gacgtggatcgatgcagacaacaacaagcagtcaatgcgcgtttacaaccagcaaccatt2640
tcaccgtgtgaggggggagataccaatacttccgcacatgcattttcattctcgattgat2700
acaggtgccatcgatacaagtgaaagaccaggaattggcgtggcgtttaaaattgcgaca2760
ccagaaggttacgcatcactaggaaatctagaagtgatagaagaaggtccactcacagga2820
gaagcgttagcacatgtgaaacaacgagaaagacaatggaaagacaaaataacaaaaaaa2880
cgtgcagaaacagaaaccatttatacaagagcgaaacaagcaattaataatttgttcgca2940
gattatcaagatcgacaattaaagcatgatgtagagattccaaatattattgcggcagac3000
cagattgtagagtctattcgtgatagatataatgaatggattcctgcaattccaggaatg3060
aattatgaaatctacacagagctaaaaaatagaatccaacgagcatatgctttatatgat3120
gctcggaatatcatcaaaaatggagacttccgaaacggattagcaaattggaatgcgacg3180
cctggtgcaagagtacaacaaatgaacgggaatccagtactagtcattccaaattgggat3240
acgcaagtttcccaaagtgttcctgtagaaccaaatcatagatatctgttacgtgtaacg3300
gcacaaaaattaggtgctggaaacggatatgttacagtgacagatggtacaaatcataca3360
gaaacattgacatttgatagatgtgataataatacaactggatctaatcgatatgtaacg3420
aaaacaattgaatttaccccacgtacaaatcaattacaagttgaaataggtgaaacagaa3480
ggaacattcaacatagaaagtgtgaatttgctcggttgttaa3522
<210>2
<211>3573
<212>dna
<213>苏云金芽孢杆菌
<400>2
atgactcaaaataacaatgaatatgaaattatagatcaaaatacttcaccttattcttct60
aacagaaacaataataactccagatatccctttgcaaataatccaaatcaagcattacaa120
cagactaattacaaagattggatcaatatgtgtcaaaaaaatcaacaatgtggtgaaaat180
cttgaaacgtttgctagtgctgatacaattgccgcagttagtgcaggtgttattgtagta240
ggcactatgttaggagcttttggtgcccctgttacaactggtcttattatatccttcgga300
acactattgccgattttttggggaccaagtgaagatcctaaaaaagtatggaaagaattt360
ttaacaatcggaaatagaccttttggttcagaagtagatcaaggtataattgatttacta420
tatactaaagtaaatggcttaagatcgcaatttgaagactttcaaaggtattttgatcta480
tggaaaaataataaaaatccagtcaatgctgatgtagtaagacaaaaatttctttcattg540
gattctgatgtaataagagaattagaaacattaaaaggaaactattatataacgttactt600
cctggttatacacaagtagctaattggcatttaaatctattacgacaagctgcatattat660
tatgacgaatgggcaccttcatctaacttatcaatacaaagtatatatcctcaggattac720
actaacgatcttcagacttgcttagataattgccctagcgaaagtggtaataaggtatct780
tctgcatactataagtgcatattaaaatgtagaattaatgaatatattaattattgttca840
aaaacatatcaagaaggcttaaataaacttaaaaattcaagtgatataaaatggaatata900
tataatgagtatcgtagagaaatgactttaactgtattagatcttattgctgcttttcca960
aattatgacctagaaaaatatccaataggtactaaatgtgaacttactagagaagtttat1020
acaaatgctttgatggggtctagttctatgtctatagcagaactagaaaaatcactaaca1080
aaagatccttttttgattacttggttaaataaaatattgctttatacaagaaattataag1140
caacctactactgaggatgtttttgtttttactggcaatcagcttcgttattcatttaca1200
atggattcaaatttagggtatagtggattttatggtgatgttagttatactgatgacaca1260
gaacaaatacttgaaatcccgggcaattcacaaattgttaaggtagaagttgaaaggcac1320
agagactctcctgatataatatggaaaattgattttcatttaaataatggagcagtatta1380
aagtataattcaggttcaacggcagatccgaattttagagtaagggacgttttaacgatt1440
cctccagatagtaaaggcaatgcaagtcattttttatcctatatgaaaagtgcttatgtt1500
acatcagatgttaaacaattaagaagagtttcatttgcttggacacataatagtattaat1560
tataacaatgagatttataatgatataattacacaaattgcagctgtaaaaggccattac1620
ctcggcctcgaaggtttagcttcccgagtcattcaaggtcctggtcacacaggtggagat1680
ttagttgatttaaaagatgacctacgccttgcatgtcaacactctggtactcaacaatct1740
tattatatacgaatccgttatgcttctgatggagatactagaatcgtccttgtaatccca1800
ttaatggaatcacaaaatattccactcaaatcaactttttcgggtgtaaatcatgatgaa1860
ttaaaatataaagattttgggtatgttcaatttccaggggaaataacattaaatcaacac1920
tcaaagataactcttatttttcgtcttcaagatatatattcaaatataagtgtattcatt1980
gataaaattgaatttatcccaatcactagttctattcgagaaaacagagaaaaataccaa2040
ttagaaaaagcgaaacgagcagtagatgatttatttataagtgctaaaaaacaaaatata2100
aaaattgatatcacagattatcagattgatcaaactgctaacttagtagactccctatca2160
gaagaaccatatccacaagaaaaaatgatgttactaaatcaaatcaaatatgctaaacaa2220
ctaagtcaatcacgaaatttacttagtaatggagattttgaatctttaattggctggaca2280
acaagtagtagtattactgtccaaactggtaatactatttttaagggattttctctccat2340
atgctaggagcaagaacaacagaaattaacgctactgtattcccaacttatgtatatcaa2400
aaaattgatgaatcaaggttaaaaccttatacacgttatatagttcgaggattcattgga2460
agtagtaagggtttaggaatatttgttacaagatataataatgtaccagataaattagcc2520
tatataagatctacaaattcttgtggagaattaaatcaatacgaatcgcaaaattattct2580
cttgtaagtgaaaataattctacaatgagtctacaaaacataacagcatcaaatgatact2640
tcatgtctatcggaaaatttacgttattgtgaaccaaatcagttatatccgacatgtcat2700
aacttacatgatttttctttttctatagacacaggagaattagatttcaatgaaaaccca2760
ggtatctggattctattcaaaatctctaatccggatgggtatgctacattaggtaattta2820
gaagtaattgaagaaaaaacattagttggagaagaaataaataatgttaaagaaaaagga2880
aaaagatggaaaaaagaaatggatactaaacaaacaaaaacagaaactgcattttctcaa2940
gcccaacaagcagttaatgggttatttatgaatacacaatattcaatgttaaaaatagaa3000
acaactatgcaagatattgttacagcagataacctcataaatgagattccatatgtttac3060
gacgaactgttacctaatgaaccagcaggtaggaattataacatgtttatagaattaaaa3120
aatcaaatctcacaagtatactctttatataatgccagaaacatcattcaaaatggtaac3180
tttaacaacggcttaaaaaattggcacacatcaccggatgccaaagtacaaaaaatagat3240
aatacctctgtacttgtcattccaaactggagtacacaagtatctcaacacaccaactta3300
caacaaaatcaacgatatctattacgtgtcacagcaaaaaaagaaggaatgggaaatgga3360
tatgtaaaagtgagtgattgtgcaaataatgtagaaacactaacatttaaatccagtgat3420
atcactaacaacaatatgtggaatgaatctataggctacatgaccaaaacaatgtatatc3480
actccacatactagtcaagtacgcattgatataggagaaacggaagggaactttaaaatc3540
aacagtatagaacttatttgtataaaaaactaa3573
<210>3
<211>3579
<212>dna
<213>苏云金芽孢杆菌
<400>3
atgagtagtggaggaacgaatatgaattcaaatcgtaataaaaatgaatatgaaatacta60
gatgcatcatcaagtacatctaacatgacgaatcagtattcaagataccctctggcaaat120
aatccacaggcttttatgcgaaatacgaattataaagattggttagctatgtgcgaaaga180
aatgatactggagttttagaaaatcccgaagtattgagcttaagaggtgcagttggtact240
ggagtgagtatcgtcggcatgatttttagcttaataggtattccagttattggggaggta300
gttggaatactagtatcattaacaaaccttctttggccagaatctgaaggaagtgcacaa360
tacacttggcaagaacttatcactcatgtagaagagcttatggatcaacgaataggagag420
acgcaaaaagctaatgcacttgcaaaattatcaggtttaaaagctcaagtagctgcatat480
aatcgggctcttgaggattgggaaaaaaatccgaattcaagatctgcatctgaagtaata540
gctagattccgaagtactaacaatgattttgtaggatctatgcctcaattttcgcctaat600
ggttacgaaatattattattgtctgtatatgcacaagctgcgaatctgcatttactatta660
atacgagatgctactatttatggaagtcagtgggggctatctcaaggtgacgtcaatcta720
tattacaatgaacaactactgtatacaaaacaatacgttaatcattgtgttacctggtat780
aacaatggcttagctcaacaaaaagcattgttcgctacatcaccaaactggaatcgattt840
aatgcttatcgaagagacatgacaattaacgtattagatctcattgcactattcccaatt900
tatgacgctcgtttgtatccgcaaccagtaagggcagaacttacaagagaaatctattca960
aatatattgaattcggatgtgtacggagtacaatgggcagattttgaaaaaaatgaaagt1020
acattcacacgcccaccacatttatttacgtggttacgaaaatttgacttttacacaaga1080
actaagtattacaaccaagggctagggtggctatttttaggggggcatacaaactattat1140
tcgtatacgaatagtagtaaccttaaatcaggatcttataataatttttggggttcagat1200
atgcaaacaagtacacttactattccagataacccttctatttataggttgtggacaaaa1260
agttatacgcatatctatccatatacagatccggttaacatcacgcaaatgcaattttat1320
ttaacaaataatcaacagttaacttatacggctacggctaaccctcggtatcctgtacgt1380
gaaacgaattttgaattaccatctaccgatgagaatccgctaacttatcaaaattatagt1440
catattttatcttatatgataagttcacaacatttcggggataaaagatctggatataca1500
tttgcttggacacataatagcgtggaccctactaatactcttgccccaaataaaattaca1560
caaatcccagctgtgaaagctaatactctggaaggtaataaatcttttgttgtaaaaggt1620
ccaaatcatacaggaggggatttagtaattcttgaggctgaaccaggtccagtttatcct1680
attgtgtaccgaggagtaatgggaattacttgtaaggttacacaagctcagaattatcgt1740
attcgtattcgttatgcttcaaatggtggtgctcaaatggctatcagtttaagaaatcgc1800
ggaactggtacggtttttactgtaagtaaaacttatacaggtaatagtattgaaaactta1860
cagtataatgattttcaatataaggatatgcctgttattttggaagcaagtcaatatgaa1920
cccaacaattccatatatgtatatttatatcaggagagtccatatatacaagtaattatc1980
gacaaaatcgaatttattccaattgatacaacttctcaagaatatgaagaaaaacatcaa2040
ctagaaaaagcaaagaaagcggtgggagtcttgtttaccaatgatgcaaagaaggccctg2100
aaaatagatacaactgattatgatgtggatcaagcggcaaacttgatagaatgtctgtca2160
gatgaacaatacgcaaaagaaaaaatgattttattggatgaagtaaaatacgcaaaacaa2220
ctgagccaatcacgaaatttgcttcaaaatggagactttgaatcttctgaaattggatgg2280
gaaacaagtaatactatcacaattcaagcgggtaatcttatcttcaaaggtaagtatctc2340
aatatgtcaggtgcaagaaatatagatggcgctatatttccaacctacgcattccaaaaa2400
gtagatgagtcaagattaaaaccatatacacgttataaggtgagaggatttgttggcagt2460
agtaaagatgtagaagtggtagttacacggtatggtgaagaagtagatacaataatgaat2520
gtaccaaatgatttaacatatgatgtaggttctgttaaatcttgtggagaatggaatcga2580
tgtgaacaacagccatatcaaaataggaaccaagtgttaaacaattctatgataattgct2640
aatacttctaatgcatcaaactcttgtgaatatgtaccagagaaaaaacgtgtaatgtgc2700
ccagaaccacatcaattttctttccatgttgatacaggagaaactaatttgaacgaaaat2760
ttagggatttcggtcttatttaaaatttcttcaccagagggttacgcaatattagataat2820
attgaattaatcgaagagggttcactggtaggagaatcgttggcttatgttcaaaatcga2880
gaaaagagatggaaaaataaaatgcaagcagaacgtatggaaacacagcaagcatataat2940
atcgccaaacaagtagtcgatatcttatttactgatcctcaagatacagcattaaggttc3000
gaaacgaataaatccaacattatttcagcagatgagcttgtgcagtccattccttatata3060
tacaatgactggttacgagatgtaccaggtatgaattacaacatgtttacagaattaaaa3120
ggccggatcacacaagcatactatttatatgatgatcgaaatgtgcttcaaaatggagac3180
tttaataatggactcacatcttggtatgttacaggaaatgcagaagtacagcaaatagat3240
ggtacatttgtattagtgcttcaaaattggagtaccactgtttcacaaaatgtttgttta3300
caacacaatcgtgggtatgttttacgggtaaccgcaagaaaagaaggcatgggaaatggg3360
tacgtgacaatgagtgattgtgcaaatcatatagaaaagattatatttacttcttgtgat3420
aataatatagttgttacatcaactgactctgcagaatatgtaacacgaactgtctccttc3480
ttcccagatacagaccacgtacgaattgaaattggagaaaccgaaggtacttttaaagta3540
gaaagtgtggaattgatttgtatggaggggaaggaataa3579
<210>4
<211>3606
<212>dna
<213>苏云金芽孢杆菌
<400>4
atgaatcagaatattgcagcagtgcgagaggcagtcaatgctttgttttcaaatcatacg60
ttacaattgaaagtcacggattatcatgtggatcaggtggcaaagttagtagagtgtata120
tctgatcagaaccattcaaaagaaaaaatgtgtttgttagatcaagtaaaattggcgaaa180
cgattgagtcgagaacgtaatttgttaaactatggtgattttgaatcatcgaattgggct240
ggcgcagatggatggaacatcagtgctcatgtatacacgatagctgataatctaatcttt300
aaagatcattatctcaatatgccaagtgtaaataatcccatattaagtgataaaatattt360
ccaacgtatgcctatcaaaagatagaggaatcaaagttaaagccgtatacccgctatatg420
gtacgagggtttgtaggaagtagtaaagatttagaaattcttgttgcaagacatggtaaa480
gaagtgcacaaaagaatgaatgtaccgaatgatattataccaacaaatccatgtacagga540
gaacttgtatcgcaaccacccccgtatcctgttatgccaatccatacgatggcccaaaac600
atgtggtgtaatccatgtgagaatggctatcagactgcagcagggatgatggttcaagag660
acaaatatggtgtgtcaagatccacatgaatttaaattctctattgatataggtgagatc720
gatagggagcgaaatttaggcatttggattggttttaaagtgggaacaacagaggggatg780
gcgacactagatagtatagaagtagtagaagtaggaccgttaacgggagatgccttaaaa840
cgtatgcaaaaacgtgaacaaaaatggaagaaaaaatgggcagagaaacaaatgaagatt900
gaaagggctgtgcaaatagcacgaaatgcgattcaaacattattcacagatccaaatcaa960
aacagactacaatccgctattacactgaaaaatattgtagatgcagaaaaatgggtacaa1020
aagattccatatgtatacaatcaattcttgcaaggggctataccagaggtaccaggtgaa1080
caatacaacgtcttccaacaactttcccaagcagtggtgacagcacggggtctgtataat1140
cagcgaaatgtgataaacaatggagatttctctgcgggattgtcgaattggaatggtacg1200
aaaggtgcagatgtacaacagattggaaaggaatctgtgctaatgatttccgattggagt1260
gcaaatatttcgcaacaggtgtgtgtggagccagaacatagctatttattacgtgtaacg1320
gcaagaaaagaaggttctggtgaaggatatgtgacaattagcgatggaacgaaagacaat1380
acagagacactgaagtttatagtcggtgaagagacgacaggtgcgacaatgtctactatt1440
cgttcccatattcgtgaacgttataatgagcgcaatatggtgacatcagaagtctatgac1500
gcaagcgggtatgcgagcaatcaaaatatggtgaattactcatcagaaaattatggaatg1560
agtgcatattcaggaaataacaacaagaattatcaatcagaaagctttggatttactcca1620
tatggtgatgaaaatagtatgatgaactatccatcagaaaattatggggaaaatgcatat1680
tcaggcaacgataatatgaattatccatcaaacaattacgaaatgaacccatactctagc1740
gatatgaatatgtcaatgaatcaaggatcggattgcagatgtggatgcagcacaaactca1800
tatccaggtggagatatgacgatgaataactatccatctagcatgtatgaaacgaatgca1860
tatccaagtagcacgaacatgaccgataatctgggaatgggctgtggatgttattacagt1920
acaaatgaacatccgatggtagaacaaagtacccttgacctttctgattatgtaatgaaa1980
acagttgaaatcttcccagaaacgaatcgtgtatgtattgaaattggcgaaacagcggga2040
atatttatgatagaaagtattgaatttgttccggtaaatccgattgaatcagtacccgag2100
cctggtcctggtatctatcagagtgttacagctttaaataatagtagtgtagtagagatg2160
gcgtcacaaggagcgaggaatgtaatcaaggcacttccacaaaatgcgtcaaatatagag2220
ttagagtatgctcctgtgtatgactacgacacagacgggtgttatgcgactgcagcaatt2280
tctccagatggcacgactaaccctggactaggtatgggcgatagcccgagcagtggctgt2340
agaggtcctgcacaactagaaaattcaaacacttattctcgggccaaatcaaataatggt2400
tggactgcaattatgtatgcgagttactttgagaaagatcaaacatctctcggccctggt2460
tcggctggacatcgacatgactgggaacacacaatagtttgggttaaagatggtcaggtt2520
caatatgtaacttattcagcacatggtaactggtacactaatcctcgctcaaacgtcaga2580
ttcagtggaaaccatccgaaaattgtataccataaggacagcatctcgacacatgctttt2640
cgcttggctaatagcaatgacgagccgccagaaaactattaccaccagtggcttcttcta2700
ccaatagttggttggtatggctatccaagccgggctattcgagaaaaactaatgactacg2760
aactttggatctgcaacaattgagatcaaagatggaaattttgaaagggcccttgagaaa2820
gcaaagccacccattaactttgacccttacgcaccggaactggaagatggtggtgcttat2880
caaatagtttctactttaaataatagaagtgttgtagatatggacccaccaagtaaaaat2940
gttcacttatgggagaatggtaacgctaataatcaaaaatggaagctagtatatgattca3000
attaaatcagcataccaaatgaaaaatatagcaaatgaaaatctagtattaacttggaat3060
gatcttaatggttctattaatgtaattgctacatctaatcaaaatcaggaagagcaatat3120
tggataccaacagaagcaggaaatggatattattatgtaaggaataagaaggacccaaac3180
aaagtgttagatgtaagtggttatggtactgcaaatggaacaaatgttacagtatataat3240
gtccatggtggtaataatcaaaaattcaaattgtctaatgtaacaggaattttaacaaga3300
gaagtggagtcactctataaggcacagcctggtcaaagcagtagatcaagtaataatttt3360
tcacttgaacatcttgcggcaggtaccaaagtacgagttattttagcaggagaaggtgct3420
acctctttgtcatttaacatttcaagagataaatcaggtacagactctagcatttggtca3480
aatgttagagatagttctgttctaacgatcccttcaggagatgatagaaagaatttgtat3540
atctcaggtcctcctagcggatacacttctaatggtacatttacagtgaaattctacgct3600
ctttaa3606
<210>5
<211>3441
<212>dna
<213>苏云金芽孢杆菌
<400>5
atgaatcaatataacaatacgaataatgaaataattgatgcttctacaaagagatctcct60
caatacccactagcaaataacccacaaaattctataaaaactacgaactataaagactgg120
attaatatgtgtgaagggaatgcagaagcattttttttaactgatgaacaaatggtttct180
attgttggagctgcaatttctaaacttcttggatttgtccctgtggttggagacatttta240
agcttcttggcggatacgtattggccaaaaattgcaggacaagaggtagatacaagagtt300
tgggcaggattgataagacatacagcaaatttaatagacaatagagaagctgaaaaagta360
atagggcaagcgacgactaatttaatgtcactctacggagctttaggtgtatataataga420
tttcttgagcaatggaaacagaatgaaaagtcgtttgctaacctcgctgatgaagtacga480
acacagatgtctgctcttcaccttctatttacgacaaaaattattagtgatttcacgtta540
cacggttatgaatcaatattactaccttcatacgcaagtgccgcgaatctgcacttacta600
ctattgcgcgatattgcaatttatggagaaagattaggttttgatccaaaggttctgcaa660
gcttatcatgatgaacaagtgcttttcacaagacaatatacagctcattgtataaatacg720
tacaatttaactttaaacgcacaaaaacctagaggttgggtagctttcaatcaatatcgt780
agggatatgactttgacagtactagatctaattgcattatttccaagttatgatacacat840
aaatatcctgtagataaaaaaaatgtaaaaaaactgtcaacaactgaatttacaagagaa900
atttatacagcattaatagaacctaatcctaataaaacagtagaaggaatggaagcatca960
cttacaagaactccccatttatttacttggataaagagattagacttctatacaaatact1020
ttatacccagatttacgatacctatctgctaatagaattgggttttcatatacaaattct1080
tcaacaatacaacaaagtggaatctatggagactctggtttcggttcaaatctcactcac1140
caattgccgataaatccaaatatatttaaatcctctatcactgatactagatcaccctct1200
aatcaaattacaaaaatggatttttataaaactgatggaactcaagcatcttataattca1260
ggaataacgccaactcctggggatttaagaaccacattttttggattttcgacaaatgag1320
aacacacctaaccagccaagcattaacgattatacacattttttaacttatatgaaaacg1380
gatgttatatcaggtggagcaccaaaaagagtgtcattggcttgggcacataagagtgtt1440
aatcttaacaaccaaatattcacagatgatatcacgcaagttccagctgtaaaatcaaat1500
gttttaaatacgcaagctaaagtaattaagggacctggccatacaggtggagatttagtt1560
gctattaccagtgacggtgttttatctggaagaatggaaatccaatgtaaagcaagtgtt1620
tttaatgaacctgaaagaaggtatggtttacgcatacgttatgctgcaaatagtatatta1680
acagtaaatgcatcctatacatctcaaggcaatactagatcaataacatttactacagaa1740
tctacttttacaggaaatacaataccaacagatttaaaatatgaaaatttaaaatacaaa1800
gaaccttttgatgcgattcttccaatgcgtttaacttctaatgaattaacaaatataact1860
attcaaccacaaaatatgtcgtcaaatcaattattgatcattgacagaatagaatttatt1920
ccaatcacttcaactgtcttaggtgatacagagaagcaaaacttagaaaaagtacagaaa1980
gctgtgaatgatttgtttactaatactgcgaaaaatgcgttgaaagcagaaacgacagat2040
tatgaaatagatcaaaccgcaaatatagtagagtgtttatctgatgaacactctacaaaa2100
gaaaaaatgatattgttagatgaagtgaaatatgcgaaacaactaagccaatctcgaaat2160
gtactccaaaatggggattttgaatctgatacgcttggctggacaacgagcaataatatt2220
acaattcaagccgataatccgatttttaaagggaagtatcttcatatgtcaggggcaaga2280
gacattgacggatctgtatttccaacttatatttaccaaaaaattgatgaatcgaaatta2340
aagccctatacacgctatcgagtaaggggatttgtgggaagtagtaaagaactagaatta2400
gtcgtttcgcgttatggagaagaaattgatgcgattatgaatgttccgaacaaattggta2460
gatatgtatccacctgcttctgattgtgggggtcttaatcgttgcgagatatcctctgct2520
cttgaaataaatcaggtggattacacgaatatgtcctatccatgtcaaaatgatggaaat2580
aaaaaacatgttttgtgtcacgatcgtcattcatacgattttcatattgatacggggtca2640
gtagacctcaatgaaaatatagggatttgggtcttgtttaaagtctcttccccggatgga2700
tatgcaacattagataatttagaagtggtcgaagaaagatcactcgatggggaagcattg2760
gcacgtgtgaaacaccgagaaaagaaatggattcatcaaatagaagtaaaacgttatgaa2820
acccaacaagcatatgacgcgacgaaacaggcaatggatgcattattcacaaatgaccaa2880
gatgaagcgttacaatttgatacaacattagcacaaattcagcacgctgatgatttggta2940
cagtccattccctatgtgtataatgaatgggtaccaagtgctccaggcatgaattatgac3000
ttgtatgtagaattagaagcacgagtggtgaaagcaaggtacttgtatgatacaagaaat3060
gtcattagaaatggtgatttttcagaaggattacagggttggcatgtaacaggcaatgca3120
aaagtacaacaaatagatggtgtatcggtattagttctatcgaattggagtgcaggtgtc3180
gctcaaaatatgtatgtccaacataatcatgggtatgtattacgagtaactgccaaaaaa3240
gagggtcatggaaaaggatatgttacgctcatggactgtgatgggaatcaagaaacactc3300
acatttacttcttgtgaagaaggatatgtcacaaaaactgtagatgtattccctgacaca3360
gatcgtgtacgcgtagatatcggagaaactgaaggtcctttctatatagaaagcattgaa3420
ttaatttgtatgaacgggtag3441
<210>6
<211>3519
<212>dna
<213>人工序列
<220>
<223>针对单子叶植物而优化的密码子
<400>6
atgggtggcatcaacatgtcgccaaactactcggacgactatgagatcattaatgcccca60
agcaatactagcccacgctatccgcttgttcacgaccttacaccccaattccaagacatg120
aattataaagactatctgaggatgacggaaggtaacagaggggtgtcagccacttcggtt180
cgctcgggtggcgaagctattgacgcggcgttgtcaataacagctattctgctcggtgtg240
ctcggacatcctgtcggcagcgccgttgttggtacttttaacgcactgctgggtcttctg300
tggcctaatggccagactattgtttgggaggatttgctggctaaagcggaggattttgct360
aacaaggtcattactgccgaaattagatctaatgcgttttcagctctcaacgtctcatat420
gcgatggtcagcgaatatacttccgctctcaatgactggatcgaaaaccccggcgtcaga480
atatcgcagcagttgatgagggagatcttcacgaataccgtgctgcaattggcctctcaa540
atgccttattttaatgtcgcaggttatgagacatcgctgttgacaatgtacgcgcaggct600
gctaacttgcatctgagcgttctcaaagatatttttattttcgggaaagagtgggggttc660
ccacaaactgatatcgacttctactactatgaagagtttatagaccacttgccagtctac720
gtcgaccattgtactaagtggtataacgaggggttgaataacctgcctaaatccaactca780
tatgattggtacaactacaataaatttaggagagaaatgacattgatggtgcttgacata840
gtggcgctgttcccgtcatatgatgcttatgtctatacattggaaacaacgaccgaactt900
acgcggatagtgtacactgatcctctgggcataatgataccccccccacccggttacgaa960
gagatggtggggtatggaggaaacctcgactggagaaactatgggttttcttttagctat1020
ttggaatctcaacttcgccaaccggtgctgttctcatggcttaactcgattaaaatgtac1080
actcggaagataatttgcgaagcggggacacctcatagcctttggtctggaaatgaaatc1140
aacttgtcgtacacatcggatccaagcaacacctttaccctgcaatccgggtattccact1200
ggttacacacacacggatttcctcgatataaactcgaaagatatctatgaagtggtgtct1260
aagattggctcggaagcagttgtgggtcctggcgacgactcgtatctttatggtttgtac1320
caagcggcttttcgcatcataccaaaagactctagcgcgtattcttatctctatccaacg1380
tatgacataggcatgaatggttactccatgtcctccctggttgaattgccgcccgaatca1440
tcggacccaccccagcctgacgaatatacttacacacaccggctctcttatgctaccctt1500
ctttcggtgcattcgtacacctctgatttctttaatgacggagcgattcctatatatggt1560
tggacacaccggagcgtgaaccgggataatcagatttatcctgacagaatcacacaaata1620
cctgctgttaagggaaagcagctcatcgagggtgcttcggtgcacaaaggtcccgggtcg1680
acggggggagacctggtccgcctttatctcaacgaccgcgtttatttgaatgtgaatgtt1740
gattcagtctctcaaaaatatagggtcagggtccggtgcgcaacttacaatcccggcagc1800
atctatctttatagagataacaccattatctcgagcgcaactgcccccaaaacgacggac1860
acaaccgatactacccagattaagttcaacgacttccagtacattacattctcagacatt1920
ttcacgtttacgagcacctggcaacaaatctctatcggggcagggaccacatatgctgaa1980
gtgtatatcgataagattgaattcataccggtcaacgaaacatatgaggcggaacgcaat2040
ttggaaaatgccaaaaaagcagtctcggctctgttcaccggaacgatggacacactgaaa2100
cgcgaggtgactgattaccagattgacagggctagcaatttgatagagtgcgtttcggac2160
gaaatgtacgggaacgacaagaggcttctgtttgaggcggttaaaacggcgaaacgcctt2220
tctcaaagcagaaatttgctccaggacttgaactttgaaatgttgaatacatcgggtaac2280
ggcgagaatggatgggtgggatcgacggggatccaggtcgtcgaaggcgacgctctcttc2340
aaaaatagatcattgcgccttccaggtgcacggcaattcgacacggagacttaccccact2400
tacctctatcaaaaaatagaagagagcaaactgaagccatacactcgctataaggtgaga2460
ggtttcatcaagggttctaaggatctggaggtcgacgttatgaggtacggcgcaaaacag2520
aaggtgctgaatgtcccaaacaaccttaaccccgatatcatacctataaacgcgtgcggg2580
gatgtcgacaggtgcaggcagcagcaggccgtgaatgcgagactccagccagcgacaatc2640
tccccttgcgaaggtggagataccaacacgtccgcacacgcgttctccttttcgattgat2700
accggagcaattgataccagcgagcgcccagggataggtgtggcgtttaagattgcgact2760
ccagaggggtatgccagcctgggaaatctcgaagtcatcgaggagggcccgcttaccggt2820
gaagcgttggctcacgtcaagcagagggaaagacagtggaaagacaaaattaccaagaaa2880
agagctgaaacagaaacaatatacacaagggctaaacaggcaatcaataaccttttcgct2940
gattatcaagatcggcaattgaagcacgacgttgaaattccaaatataattgccgccgac3000
caaatcgtcgagtcgatcagagatagatacaatgaatggattcccgcaatacctgggatg3060
aactatgagatatacacagagctgaaaaaccgcatccaaagggcctatgcgctctacgat3120
gctagaaacataattaaaaacggagattttaggaatggattggccaattggaatgcaacc3180
cctggagcacgggttcaacagatgaacggaaatccagttttggtcatcccgaactgggac3240
actcaggtgtcccagtcggtgcctgttgagcccaatcataggtatttgctgcgggtgact3300
gcacaaaagttgggcgctggtaatgggtacgttaccgtcacggacgggacgaatcataca3360
gagacgcttacgttcgatagatgtgacaacaacactacaggttcaaacaggtacgttacg3420
aagacgatcgaattcactccacgcactaaccaactccaagtcgagattggagagacagag3480
ggaacatttaacatagagagcgtcaatctgctcggatgc3519
<210>7
<211>3570
<212>dna
<213>人工序列
<220>
<223>针对单子叶植物而优化的密码子
<400>7
atgacccaaaacaacaacgagtatgaaatcatagatcaaaacacgtcaccctattcatca60
aaccggaacaataataacagcagataccccttcgcgaacaaccctaaccaggcgttgcag120
cagaccaactacaaggattggattaatatgtgtcaaaaaaaccagcagtgcggagaaaac180
ctggaaacgttcgcttcagctgacacgatagccgccgtttccgctggcgtcatagtcgtt240
ggaacaatgctcggagcgtttggcgcaccagtcactactggtctcattatatcgttcggt300
accctgctgcccatattttggggtccatccgaagacccaaaaaaggtgtggaaggagttc360
ctgacgattggcaaccgccccttcggatccgaggttgatcaaggtataattgatcttctg420
tacaccaaagttaacgggctccggtctcagttcgaagacttccaacggtacttcgacctc480
tggaaaaataacaaaaacccagttaacgcggatgtcgtcaggcaaaagtttttgtcactg540
gactcggatgttatacgcgagctcgagacactcaaagggaactactatatcacgttgctc600
cctggttacacccaggttgcgaactggcatttgaatctcctgaggcaggcagcctactac660
tatgacgaatgggcaccgtccagcaatctgtcaatccaaagcatctatccccaagactat720
accaatgacctccagacttgcctcgacaactgtccgtccgaatcaggaaataaggtgagc780
tcggcctactacaaatgtatactgaaatgccgcatcaatgaatacataaattactgcagc840
aaaacttaccaagaaggtctcaacaagctcaaaaattcatcggatataaagtggaatatt900
tataacgaatatcggcgcgagatgacgctgacagtccttgatctcatcgccgctttccca960
aactatgatctcgaaaaatatcctattggcacgaaatgtgaactcacaagagaggtgtac1020
accaatgcactcatgggctcgtcatctatgtcgatagctgagttggagaagagcttgaca1080
aaagatcctttccttatcacctggcttaataagattcttctgtacactcggaactataag1140
cagcctacgacagaggatgtgttcgtgtttacgggtaatcagcttcggtactcatttacg1200
atggactccaacctcgggtactctgggttctatggcgacgtctcatataccgatgatacc1260
gaacaaatacttgagataccgggcaattctcaaatagtcaaggtggaagttgagcggcat1320
cgcgattcgcccgacattatctggaaaatagacttccatcttaacaacggggcggtgctt1380
aagtataattcgggatcaactgccgaccctaattttagggttagagacgttctgacgatt1440
ccaccggattcgaaggggaacgcctcccattttctcagctatatgaagtccgcctatgtc1500
acatccgatgttaaacaactgagacgggtgagcttcgcctggacccacaactcaataaat1560
tataataacgaaatctataatgacatcattacccaaatcgcagcagtcaagggacactac1620
ctcggcctcgaagggctcgcgtcgagagtcatccaggggccgggacacaccggcggtgac1680
ctggttgatctgaaggacgatctgcggttggcttgccaacacagcgggacccagcagtca1740
tactatattcggattagatatgcctcggatggggacacgaggattgtccttgtgatacct1800
ctcatggagtcccaaaatatacctttgaaatccacattttcgggagtcaaccacgatgag1860
ttgaaatacaaggatttcggatacgtgcaatttccgggggagatcaccctcaaccaacat1920
agcaaaatcacgctcattttccggctccaagacatttattcaaacatttcggtgtttatt1980
gataagatagagtttatcccaataacttcttccatccgcgaaaatagagaaaaatatcag2040
ctggagaaggccaaacgcgcggttgacgatctcttcataagcgccaaaaaacaaaatatt2100
aagattgacataacagactaccaaatagaccaaacagctaacctcgtggactcactcagc2160
gaagaaccttatccgcaggagaaaatgatgctgttgaaccagatcaaatacgcgaagcaa2220
ctctcacaatcgaggaacctcctctcgaatggagacttcgagtcgctcatagggtggaca2280
acaagctcgtcgatcactgttcagacgggaaatactatttttaagggattttcgctccat2340
atgttgggagcaaggacaactgaaattaatgcaacagttttccctacctatgtgtatcaa2400
aaaatagatgagtcgcgcttgaaaccatatacacggtatatagtgagagggtttataggg2460
tccagcaagggattgggaatttttgttacaaggtataacaatgtgcctgacaaactggca2520
tacataaggtctactaactcctgcggggagcttaatcagtacgaaagccaaaattactcg2580
cttgtttcagagaataactctaccatgtcccttcaaaatatcaccgcctccaatgacaca2640
tcgtgcctttcggagaacctcagatactgtgagccaaatcagctgtacccgacttgtcac2700
aatttgcatgacttcagcttttccatcgacaccggcgaactcgatttcaacgaaaaccca2760
ggcatatggattctgttcaaaatttcgaatcctgacggctacgcgacccttgggaacctg2820
gaggtgattgaagaaaagactctcgtcggagaggagattaacaacgttaaagagaaggga2880
aagcgctggaagaaagaaatggacaccaaacaaaccaagaccgagacagccttctcacag2940
gctcaacaggccgttaatggcttgtttatgaacacgcagtactcaatgctgaagatcgag3000
accaccatgcaagacatcgtgacggccgacaatttgattaacgagattccatacgtctat3060
gatgagcttcttcccaacgaacctgcgggccggaattataatatgtttattgagctgaaa3120
aatcaaataagccaagtctattcgctctacaatgccagaaacattatacagaacggcaat3180
ttcaacaatggcttgaaaaactggcacactagccctgatgctaaggttcaaaagatcgac3240
aatacctcagtgcttgtcataccaaactggtccacacaggtctcacagcatactaatctt3300
cagcaaaatcaaagatatctgctcagagtcacggccaagaaagagggaatgggtaatggc3360
tatgtcaaggtttcagactgtgctaataacgtggaaacacttacctttaagtccagcgat3420
attactaataataatatgtggaatgagtcgataggctacatgactaaaactatgtatata3480
acaccacacacaagccaggtgcggatagacattggggagactgaagggaactttaagata3540
aattcgatcgaactgatctgtattaagaat3570
<210>8
<211>3576
<212>dna
<213>人工序列
<220>
<223>针对单子叶植物而优化的密码子
<400>8
atgagcagcggggggacaaacatgaactcaaatcgcaataagaacgagtatgaaatcctg60
gatgcatcttcttccacctcaaatatgacaaaccaatattctcggtaccccctcgcaaac120
aatccgcaggcatttatgcggaacacgaattataaagattggcttgctatgtgtgagagg180
aacgacacgggtgtgttggagaaccccgaagtcctctcgcttcggggggcagtcggaacg240
ggtgtcagcatcgttggaatgattttttccctgataggcattccagtgataggtgaagtt300
gtggggattctcgtctctcttaccaatctgctttggccggaatctgagggctccgctcag360
tatacatggcaagaattgattacgcacgtcgaggagcttatggaccagcgcataggtgag420
acgcaaaaagctaatgctcttgccaagttgtcgggattgaaggcccaggtggctgcttat480
aaccgcgccctcgaagactgggagaaaaacccgaacagccgctccgcaagcgaagtgatc540
gcgcgcttcaggtctactaataacgattttgttggtagcatgccgcaattttccccgaac600
ggatacgagatattgcttctcagcgtctacgcccaagctgcgaacttgcacttgctgttg660
attcgggacgccactatttacggctctcagtggggcctctcacagggagacgtcaacttg720
tactacaatgaacaactgttgtatacaaagcaatatgtgaaccattgcgtgacctggtac780
aataacggactcgcacagcagaaagccctctttgcaacgagccccaactggaatcgcttc840
aatgcctaccgccgcgacatgacgatcaacgttttggacctgatcgccctctttcccatt900
tatgacgcacggctctacccccaacccgtccgcgcggaacttactcgcgagatttactca960
aacatattgaattctgatgtctacggcgtccaatgggccgattttgaaaagaatgaaagc1020
acttttacacgccccccccaccttttcacttggttgcgcaaattcgatttctatacccgg1080
acgaagtattacaatcaggggttgggatggctgttcttgggaggccacaccaactactat1140
tcatatacaaacagctcgaatctgaagtcggggtcttacaacaatttctggggatcagac1200
atgcagacttccactcttaccattcctgacaatccttcaatttaccgcctctggacaaaa1260
tcttacacgcacatatatccgtataccgatccggtgaatataactcagatgcaattttat1320
ttgaccaacaaccaacagttgacatacacggccacggccaatcctaggtatccagtgaga1380
gaaacgaacttcgaacttccgtcaacagatgagaatcctctgacataccaaaactactct1440
catatcctttcatatatgatctcgtcgcaacattttggtgataagcggtcaggctacacg1500
ttcgcctggactcacaattcagttgatcccaccaatacgcttgccccaaataaaattacc1560
cagattcctgccgttaaggccaataccctcgaaggtaataaaagctttgtggtgaaagga1620
ccgaaccatacggggggggatttggttatacttgaggctgagcctggaccagtgtatcct1680
attgtttatcggggcgtcatggggattacgtgcaaagtgactcaggcccagaactatcgc1740
attaggatccgctatgcttccaatggaggggcgcagatggctatcagccttcgcaacagg1800
gggaccgggacggtctttacagtgtcgaaaacgtacacggggaactctattgagaatctt1860
cagtacaatgatttccagtataaagacatgccagtgatacttgaggcttcacaatacgaa1920
cccaacaattccatctacgtttatctctatcaagaatctccttatatccaagtcatcatc1980
gacaagatagaattcatcccgattgacacaacttcgcaggagtatgaggaaaagcatcaa2040
cttgaaaaggcgaagaaagctgtgggagttctgttcacgaatgacgccaagaaagctttg2100
aagatcgatactaccgattacgatgttgaccaggccgcaaacctcattgagtgcctttca2160
gatgaacaatacgctaaagagaagatgatattgctggatgaagtcaaatacgctaagcaa2220
ctttcccagtctcggaatctcctgcagaatggagactttgagtccagcgagatcggatgg2280
gagacctccaacacgatcacgatacaagcagggaacttgatcttcaaaggtaagtatttg2340
aacatgtcaggtgcacggaacatagatggggccatctttcctacgtacgccttccagaag2400
gtcgacgagtctcggctcaagccttatacgcggtacaaggttaggggattcgtcggctca2460
tcgaaagacgtcgaagtggtcgttactcggtatggggaggaagtcgataccatcatgaac2520
gtgccaaatgaccttacatatgacgttggtagcgtcaagagctgcggtgagtggaatcgc2580
tgtgagcagcagccttaccagaatcgcaaccaagtgctcaataactctatgataatagct2640
aacacgtccaacgcgtccaactcatgcgaatatgtcccagaaaagaaaagggtcatgtgc2700
cctgagccccatcaattcagcttccatgtggatacgggcgagaccaatctcaacgaaaat2760
ttggggatttcagtcctgtttaaaatttctagcccggaggggtatgcaatacttgacaac2820
atagagttgatcgaagaagggtccctcgttggtgaatcgcttgcttacgttcaaaaccgg2880
gagaaaagatggaaaaataaaatgcaggcggaaagaatggagacccaacaagcgtataat2940
atagctaagcaagtggtcgacatactttttacagatccacaggataccgccctccgcttc3000
gaaactaataaatccaatataatttctgcagatgagctcgtccaatcgatcccatacatc3060
tacaatgactggcttagagacgtccccggcatgaactacaacatgttcactgagctcaag3120
ggtagaattactcaagcttattatctttacgatgataggaacgtgttgcagaacggggac3180
ttcaacaatgggctcacgagctggtacgtcaccggaaatgcagaagtgcagcagatagat3240
gggacttttgtcctcgttctgcaaaattggtcgactacagtctcgcagaacgtgtgcctt3300
cagcacaataggggatatgttctgcgggtgacggcacgcaaagaaggaatgggcaacggg3360
tacgtcaccatgtctgactgcgcgaatcacatagagaaaatcattttcacatcgtgtgat3420
aacaacatcgttgttacctccacggattccgccgaatatgtgactagaaccgtgtctttc3480
tttccagacaccgaccatgttcgcatagaaataggggaaactgagggcaccttcaaggtc3540
gagtcagttgaactcatatgtatggagggaaaagaa3576
<210>9
<211>3603
<212>dna
<213>人工序列
<220>
<223>针对单子叶植物而优化的密码子
<400>9
atgaatcaaaacatagccgcagtgcgggaagcggtcaatgctctcttttctaatcacacg60
cttcaacttaaagtgacagactaccacgtcgaccaggtggctaaattggtggaatgcata120
tctgaccagaaccatagcaaggagaagatgtgcctgcttgatcaggtgaagttggcaaaa180
agattgtcgagggagaggaacctgttgaactacggtgacttcgaatcctctaactgggca240
ggtgcagatggctggaacatttctgcgcacgtttacaccattgccgataacctgatcttc300
aaggaccattatcttaatatgccgtcggtgaataatcccatactgtcggacaaaatattc360
cccacttatgcgtatcagaaaatagaggagtcaaagctgaaaccttacacgagatacatg420
gtgcgcggattcgttggttcttccaaggaccttgagatcttggttgctcggcacggcaag480
gaggtgcataaacgcatgaatgttcctaatgacatcattcccaccaacccttgcactggc540
gaactcgtctcccagccgccgccatatccagttatgcctatacacacaatggcccaaaac600
atgtggtgcaatccttgcgaaaatggttatcaaaccgctgcaggtatgatggtccaggag660
acgaatatggtctgtcaggaccctcacgagttcaaatttagcatcgacatcggagagatc720
gaccgcgaaaggaatttgggtatatggattgggttcaaagtcggaacgactgaaggtatg780
gccacactcgactctatagaggtggttgaggtcggaccactgacaggcgatgcactgaag840
cgcatgcaaaaaagagagcagaagtggaaaaagaaatgggctgagaagcaaatgaaaata900
gagcgcgccgttcagattgcacgcaatgctattcaaactcttttcactgacccaaatcag960
aataggcttcaatcggcaattactctgaagaacattgtggacgctgagaagtgggttcag1020
aaaattccctatgtctataatcaatttcttcagggggctattcctgaggttccgggtgag1080
caatacaacgtgtttcaacaactctcgcaggccgtcgtcacggctagggggttgtacaac1140
caaagaaatgtcatcaataatggtgacttcagcgccggcttgagcaactggaacgggact1200
aaaggtgcagatgtccaacaaattggaaaagagtcagttctcatgatcagcgattggtca1260
gcaaacatatcacaacaagtctgtgttgagcctgagcattcatacctgctgcgcgtgaca1320
gcacggaaagaaggctctggggaaggttacgtgacgatctctgatggaactaaagataac1380
accgaaacgctcaaatttatcgtgggagaagagacaactggcgcaaccatgagcactatc1440
cggtcacacataagggagagatacaacgaacgcaacatggttacttcggaggtctatgac1500
gcgagcggatatgccagcaatcagaatatggtcaactactcttcggagaattatggcatg1560
tccgcatacagcgggaacaacaataaaaattaccaatcagagtcattcggatttactcct1620
tatggtgacgagaactccatgatgaattacccaagcgagaactacggggagaatgcgtat1680
tcgggaaacgataacatgaattatccttctaataactacgagatgaacccctattccagc1740
gacatgaacatgtctatgaatcaggggagcgactgcaggtgtggctgtagcactaattcc1800
taccctggcggggacatgaccatgaataattatccctcttcgatgtatgaaacaaacgca1860
tacccctcttctaccaacatgacggacaacctgggaatgggctgtggttgctattactct1920
actaatgaacatccaatggttgagcagagcacactggacctgtcggattacgttatgaaa1980
accgttgaaattttccctgaaacgaatagagtctgtatagaaatcggagaaactgccggg2040
atatttatgatagagtcgatagagttcgtgccggtcaatccgattgaatcagtgcccgag2100
cctgggccagggatatatcagagcgttacagcattgaataatagctctgtcgtggagatg2160
gccagccagggagctaggaacgttattaaagcccttccgcaaaatgcgagcaatatagag2220
cttgagtatgccccggtctatgactatgataccgatggctgctacgctaccgctgcaata2280
tcaccagatgggacaacgaatcctggcctgggcatgggcgattcaccctcgtccggttgc2340
aggggcccggctcagctcgaaaatagcaacacctattcgagggctaagtctaacaacgga2400
tggaccgccataatgtacgctagctactttgaaaaggatcaaacttctctcgggcctggg2460
tcggctgggcatagacacgactgggagcacaccattgtttgggtcaaggacgggcaagtc2520
caatacgtcacatactccgcacacgggaactggtacacgaatcctagatctaacgttcgg2580
ttttcaggcaatcacccgaagatcgtgtatcacaaagattctatttctacccatgctttt2640
cgcctggctaattctaacgacgaacctccagagaattattaccaccagtggcttcttctc2700
cctatagttggttggtatggttatccctctagagcaattagggagaaactgatgacgacc2760
aattttgggtcagcgacgattgagatcaaggacggtaacttcgaacgggccttggaaaaa2820
gcgaagccaccaataaacttcgacccgtatgcccctgagctcgaggacgggggcgcgtac2880
caaatcgttagcaccctgaataacaggtctgttgtggacatggatccaccatcgaagaat2940
gtgcatctgtgggaaaatggtaatgcaaataaccaaaaatggaagctggtttatgactca3000
attaaaagcgcttatcagatgaagaatatcgccaatgagaatctggtcctgacctggaat3060
gatctgaatgggagcataaatgttattgctactagcaaccagaaccaggaagagcaatat3120
tggatcccaactgaagcgggaaatgggtattattacgttagaaacaagaaggatccaaat3180
aaagttttggatgtctcaggctatgggaccgcaaatgggacgaatgtcacagtttataat3240
gtgcatgggggaaataaccaaaaattcaaattgtcaaacgttaccggcatcctcacgaga3300
gaggtggaaagcttgtacaaagcccagcccggtcagtccagccggtccagcaacaacttc3360
tcccttgagcatctcgccgctggtacgaaggtccgcgtcatacttgcaggcgagggcgcg3420
acgagcctgtcgttcaacatttcgcgcgacaaatccggcaccgattcttcgatatggtca3480
aatgtcagagactccagcgttctcactatacctagcggagatgatagaaagaacctttat3540
atttcagggccgccaagcggctacacatccaacgggaccttcactgttaagttctatgca3600
ctg3603
<210>10
<211>3438
<212>dna
<213>人工序列
<220>
<223>针对单子叶植物而优化的密码子
<400>10
atgaaccaatacaacaacaccaacaacgagataatagatgcgtccactaaacgctccccc60
cagtatcccctggctaacaatccacagaatagcattaagactactaactacaaagattgg120
ataaacatgtgcgagggaaacgcagaagcttttttcttgaccgatgagcaaatggtttcc180
attgttggtgccgctatttctaagttgttgggtttcgttccggttgtgggcgacatcctt240
tcgtttctcgcagacacatattggcctaagatagcgggacaggaggtggacacccgggtt300
tgggcaggcctgatccgccacactgccaacctgatcgataacagggaagcggaaaaagtt360
attggccaggctaccaccaaccttatgtcgttgtacggagcgctcggcgtttacaataga420
tttctggagcaatggaaacaaaatgagaaatcatttgcgaatctggccgacgaagtgaga480
acacaaatgtctgcgctgcacctccttttcaccaccaagataatctctgattttactctc540
catggttacgagtccatccttctgccatcctatgcctccgcagcaaatctccatctgctt600
cttctgagggacattgctatttacggtgagaggcttggatttgacccaaaagtcctccag660
gcttaccatgacgagcaagttctctttactaggcagtatacagcacactgtatcaatact720
tataaccttacattgaacgcgcagaaacccagaggatgggttgccttcaaccaatataga780
cgggatatgacactcacagttttggatttgatagctctgtttccgagctacgacactcac840
aagtatcctgtggataagaaaaatgttaagaagttgagcactaccgagtttactcgggaa900
atctatacggctttgatcgaacctaatcctaacaagaccgtcgagggcatggaggcctcg960
ctgacaaggactccccacctcttcacttggattaaacgccttgacttttacaccaacacg1020
ctttacccggatctcagatatttgtccgcaaaccgcattggttttagctacacaaattcg1080
tcgacgatccaacagagcggtatttacggtgattcaggatttgggtccaatctgacgcat1140
cagcttccgataaatccaaacatatttaaaagctccatcacggataccagatcaccttcg1200
aaccaaattactaagatggacttttacaaaacagacggtacccaagcgagctacaattcg1260
gggataacaccaacgcctggtgatctgcgcaccacattcttcggtttctcgactaatgaa1320
aataccccaaatcagccttctatcaatgactatacgcattttcttacgtacatgaagacc1380
gatgttatatcgggtggagccccaaaaagggtctcattggcctgggcccacaaaagcgtc1440
aacctcaataatcaaattttcactgatgacattactcaggtccctgccgtcaaaagcaac1500
gttctcaacacacaagccaaagttataaaaggaccgggacatacagggggcgatctggtg1560
gctattacttctgatggagtgctcagcggccggatggaaatccagtgtaaggcatctgtc1620
tttaacgaaccggagcgccggtatgggctcagaattcgctacgcggcgaattcgatcctt1680
acagtcaacgcttcgtatacgtcacagggcaacacgcgctctatcacgtttacgaccgag1740
agcacgtttacagggaacactattcccaccgacctgaaatatgaaaatttgaagtacaaa1800
gaacctttcgacgccatcctccctatgagacttacgtcgaatgagctcacgaatattaca1860
attcaaccgcagaatatgtcatctaatcaacttcttataattgatcgcatcgagtttata1920
cctataacctcaacggttctcggcgatactgagaagcaaaatctggagaaagtgcaaaag1980
gctgttaacgatctcttcactaacaccgcaaagaacgcactcaaggctgaaacgacagac2040
tatgaaatagaccagactgcaaacattgtcgagtgtttgtcagacgagcattctacgaag2100
gagaagatgattctcctggacgaggtcaagtacgctaagcaactttcgcaatcacgcaat2160
gtgctgcaaaatggtgacttcgagtcggatacactgggatggacaacttcaaacaatatt2220
accatacaagcagacaatcccatcttcaaagggaaataccttcacatgtccggggccagg2280
gatatcgacggttctgtctttcccacttatatctaccaaaaaattgacgagtccaaactt2340
aaaccttacacgcggtacagagtgaggggtttcgtggggtcgtctaaagagctcgagctt2400
gtggtttcaaggtacggcgaggagatcgatgcaatcatgaacgtcccgaacaaattggtc2460
gatatgtatccgcccgcctcggattgcggtggcttgaatagatgtgaaatctcgtccgct2520
ttggagatcaaccaagtcgactacactaacatgagctacccttgccaaaacgatggtaac2580
aagaagcatgtcttgtgccacgatagacattcatacgatttccatatcgacacggggtcc2640
gttgatctcaacgaaaatattggcatatgggtgcttttcaaggtctcatcacctgacggt2700
tacgctaccttggataatcttgaggtggtggaggagcgctctctcgacggagaagctctc2760
gctagggtgaaacacagggaaaaaaaatggattcaccagatagaagtgaaacggtacgaa2820
acccagcaagcttacgacgcgacaaaacaggcaatggacgcattgtttactaacgaccag2880
gacgaagcgctccaattcgatactactctcgcgcagattcaacacgcggacgaccttgtg2940
caatcaatcccatatgtttacaacgaatgggtccccagcgcacctgggatgaactacgac3000
ctctatgtcgagttggaagcgcgcgttgtcaaagcgcggtacctttacgatacacggaat3060
gttatacggaatggagatttctctgaaggactccaagggtggcatgttaccggaaacgcc3120
aaggttcagcagattgacggagtgtccgtccttgtgttgtccaactggagcgcaggggtg3180
gctcaaaatatgtacgttcagcacaaccatggctatgtcctccgggtgactgccaagaaa3240
gaaggacacggtaagggctatgtgacacttatggactgtgacgggaatcaggagaccctt3300
acctttacatcttgcgaagaggggtacgtcacaaagacagttgacgttttccctgataca3360
gatagagtcagagtggatatcggggagacagaaggccctttttacatcgagtcgattgag3420
cttatttgtatgaatggc3438
<210>11
<211>3519
<212>dna
<213>人工序列
<220>
<223>编码突变型bt0264
<400>11
atgggtggcatcaacatgtcgccaaactactcggacgactatgagatcattaatgcccca60
agcaatactagcccacgctatccgcttgttcacgaccttacaccccaattccaagacatg120
aattataaagactatatcaggatgacggaaggtaacagaggggtgtcagccacttcggtt180
cgctcgggtggcgaagctattgacgcggcgttgtcaataacagctattctgctcggtgtg240
ctcggacatcctgtcggcagcgccgttgttggtacttttaacgcactgctgggtcttctg300
tggcctaatggccagactattgtttgggaggatttgctggctaaagcggaggattttgct360
aacaaggtcattactgccgaaattagatctaatgcgttttcagctctcaacgtctcatat420
gcgatggtcagcgaatatacttccgctctcaatgactggatcgaaaaccccggcgtcaga480
atatcgcagcagttgatgagggagatcttcacgaataccgtgctgcaattggcctctcaa540
atgccttattttaatgtcgcaggttatgagacatcgctgttgacaatgtacgcgcaggct600
gctaacttgcatctgagcgttctcaaagatatttttattttcgggaaagagtgggggttc660
ccacaaactgatatcgacttctactactatgaagagtttatagaccacttgccagtctac720
gtcgaccattgtactaagtggtataacgaggggttgaataacctgcctaaatccaactca780
tatgattggtacaactacaataaatttaggagagaaatgacattgatggtgcttgacata840
gtggcgctgttcccgtcatatgatgcttatgtctatacattggaaacaacgaccgaactt900
acgcggatagtgtacactgatcctctgggcataatgataccccccccacccggttacgaa960
gagatggtggggtatggaggaaacctcgactggagaaactatgggttttcttttagctat1020
ttggaatctcaacttcgccaaccggtgctgttctcatggcttaactcgattaaaatgtac1080
actcggaagataatttgcgaagcggggacacctcatagcctttggtctggaaatgaaatc1140
aacttgtcgtacacatcggatccaagcaacacctttaccctgcaatccgggtattccact1200
ggttacacacacacggatttcctcgatataaactcgaaagatatctatgaagtggtgtct1260
aagattggctcggaagcagttgtgggtcctggcgacgactcgtatctttatggtttgtac1320
caagcggcttttcgcatcataccaaaagactctagcgcgtattcttatctctatccaacg1380
tatgacataggcatgaatggttactccatgtcctccctggttgaattgccgcccgaatca1440
tcggacccaccccagcctgacgaatatacttacacacaccggctctcttatgctaccctt1500
ctttcggtgcattcgtacacctctgatttctttaatgacggagcgattcctatatatggt1560
tggacacaccggagcgtgaaccgggataatcagatttatcctgacagaatcacacaaata1620
cctgctgttaagggaaagcagctcatcgagggtgcttcggtgcacaaaggtcccgggtcg1680
acggggggagacctggtccgcctttatctcaacgaccgcgtttatttgaatgtgaatgtt1740
gattcagtctctcaaaaatatagggtcagggtccggtgcgcaacttacaatcccggcagc1800
atctatctttatagagataacaccattatctcgagcgcaactgcccccaaaacgacggac1860
acaaccgatactacccagattaagttcaacgacttccagtacattacattctcagacatt1920
ttcacgtttacgagcacctggcaacaaatctctatcggggcagggaccacatatgctgaa1980
gtgtatatcgataagattgaattcataccggtcaacgaaacatatgaggcggaacgcaat2040
ttggaaaatgccaaaaaagcagtctcggctctgttcaccggaacgatggacacactgaaa2100
cgcgaggtgactgattaccagattgacagggctagcaatttgatagagtgcgtttcggac2160
gaaatgtacgggaacgacaagaggcttctgtttgaggcggttaaaacggcgaaacgcctt2220
tctcaaagcagaaatttgctccaggacttgaactttgaaatgttgaatacatcgggtaac2280
ggcgagaatggatgggtgggatcgacggggatccaggtcgtcgaaggcgacgctctcttc2340
aaaaatagatcattgcgccttccaggtgcacggcaattcgacacggagacttaccccact2400
tacctctatcaaaaaatagaagagagcaaactgaagccatacactcgctataaggtgaga2460
ggtttcatcaagggttctaaggatctggaggtcgacgttatgaggtacggcgcaaaacag2520
aaggtgctgaatgtcccaaacaaccttaaccccgatatcatacctataaacgcgtgcggg2580
gatgtcgacaggtgcaggcagcagcaggccgtgaatgcgagactccagccagcgacaatc2640
tccccttgcgaaggtggagataccaacacgtccgcacacgcgttctccttttcgattgat2700
accggagcaattgataccagcgagcgcccagggataggtgtggcgtttaagattgcgact2760
ccagaggggtatgccagcctgggaaatctcgaagtcatcgaggagggcccgcttaccggt2820
gaagcgttggctcacgtcaagcagagggaaagacagtggaaagacaaaattaccaagaaa2880
agagctgaaacagaaacaatatacacaagggctaaacaggcaatcaataaccttttcgct2940
gattatcaagatcggcaattgaagcacgacgttgaaattccaaatataattgccgccgac3000
caaatcgtcgagtcgatcagagatagatacaatgaatggattcccgcaatacctgggatg3060
aactatgagatatacacagagctgaaaaaccgcatccaaagggcctatgcgctctacgat3120
gctagaaacataattaaaaacggagattttaggaatggattggccaattggaatgcaacc3180
cctggagcacgggttcaacagatgaacggaaatccagttttggtcatcccgaactgggac3240
actcaggtgtcccagtcggtgcctgttgagcccaatcataggtatttgctgcgggtgact3300
gcacaaaagttgggcgctggtaatgggtacgttaccgtcacggacgggacgaatcataca3360
gagacgcttacgttcgatagatgtgacaacaacactacaggttcaaacaggtacgttacg3420
aagacgctggaattcactccacgcactaaccaactccaagtcgagattggagagacagag3480
ggaacatttaacatagagagcgtcaatctgctcggatgc3519
<210>12
<211>3570
<212>dna
<213>人工序列
<220>
<223>编码突变型bt0288
<400>12
atgacccaaaacaacaacgagtatgaaatcatagatcaaaacacgtcaccctattcatca60
aaccggaacaataataacagcagataccccttcgcgaacaaccctaaccaggcgttgcag120
cagaccaactacaaggattggctgaatatgtgtcaaaaaaaccagcagtgcggagaaaac180
ctggaaacgttcgcttcagctgacacgatagccgccgtttccgctggcgtcatagtcgtt240
ggaacaatgctcggagcgtttggcgcaccagtcactactggtctcattatatcgttcggt300
accctgctgcccatattttggggtccatccgaagacccaaaaaaggtgtggaaggagttc360
ctgacgattggcaaccgccccttcggatccgaggttgatcaaggtataattgatcttctg420
tacaccaaagttaacgggctccggtctcagttcgaagacttccaacggtacttcgacctc480
tggaaaaataacaaaaacccagttaacgcggatgtcgtcaggcaaaagtttttgtcactg540
gactcggatgttatacgcgagctcgagacactcaaagggaactactatatcacgttgctc600
cctggttacacccaggttgcgaactggcatttgaatctcctgaggcaggcagcctactac660
tatgacgaatgggcaccgtccagcaatctgtcaatccaaagcatctatccccaagactat720
accaatgacctccagacttgcctcgacaactgtccgtccgaatcaggaaataaggtgagc780
tcggcctactacaaatgtatactgaaatgccgcatcaatgaatacataaattactgcagc840
aaaacttaccaagaaggtctcaacaagctcaaaaattcatcggatataaagtggaatatt900
tataacgaatatcggcgcgagatgacgctgacagtccttgatctcatcgccgctttccca960
aactatgatctcgaaaaatatcctattggcacgaaatgtgaactcacaagagaggtgtac1020
accaatgcactcatgggctcgtcatctatgtcgatagctgagttggagaagagcttgaca1080
aaagatcctttccttatcacctggcttaataagattcttctgtacactcggaactataag1140
cagcctacgacagaggatgtgttcgtgtttacgggtaatcagcttcggtactcatttacg1200
atggactccaacctcgggtactctgggttctatggcgacgtctcatataccgatgatacc1260
gaacaaatacttgagataccgggcaattctcaaatagtcaaggtggaagttgagcggcat1320
cgcgattcgcccgacattatctggaaaatagacttccatcttaacaacggggcggtgctt1380
aagtataattcgggatcaactgccgaccctaattttagggttagagacgttctgacgatt1440
ccaccggattcgaaggggaacgcctcccattttctcagctatatgaagtccgcctatgtc1500
acatccgatgttaaacaactgagacgggtgagcttcgcctggacccacaactcaataaat1560
tataataacgaaatctataatgacatcattacccaaatcgcagcagtcaagggacactac1620
ctcggcctcgaagggctcgcgtcgagagtcatccaggggccgggacacaccggcggtgac1680
ctggttgatctgaaggacgatctgcggttggcttgccaacacagcgggacccagcagtca1740
tactatattcggattagatatgcctcggatggggacacgaggattgtccttgtgatacct1800
ctcatggagtcccaaaatatacctttgaaatccacattttcgggagtcaaccacgatgag1860
ttgaaatacaaggatttcggatacgtgcaatttccgggggagatcaccctcaaccaacat1920
agcaaaatcacgctcattttccggctccaagacatttattcaaacatttcggtgtttatt1980
gataagatagagtttatcccaataacttcttccatccgcgaaaatagagaaaaatatcag2040
ctggagaaggccaaacgcgcggttgacgatctcttcataagcgccaaaaaacaaaatatt2100
aagattgacataacagactaccaaatagaccaaacagctaacctcgtggactcactcagc2160
gaagaaccttatccgcaggagaaaatgatgctgttgaaccagatcaaatacgcgaagcaa2220
ctctcacaatcgaggaacctcctctcgaatggagacttcgagtcgctcatagggtggaca2280
acaagctcgtcgatcactgttcagacgggaaatactatttttaagggattttcgctccat2340
atgttgggagcaaggacaactgaaattaatgcaacagttttccctacctatgtgtatcaa2400
aaaatagatgagtcgcgcttgaaaccatatacacggtatatagtgagagggtttataggg2460
tccagcaagggattgggaatttttgttacaaggtataacaatgtgcctgacaaactggca2520
tacataaggtctactaactcctgcggggagcttaatcagtacgaaagccaaaattactcg2580
cttgtttcagagaataactctaccatgtcccttcaaaatatcaccgcctccaatgacaca2640
tcgtgcctttcggagaacctcagatactgtgagccaaatcagctgtacccgacttgtcac2700
aatttgcatgacttcagcttttccatcgacaccggcgaactcgatttcaacgaaaaccca2760
ggcatatggattctgttcaaaatttcgaatcctgacggctacgcgacccttgggaacctg2820
gaggtgattgaagaaaagactctcgtcggagaggagattaacaacgttaaagagaaggga2880
aagcgctggaagaaagaaatggacaccaaacaaaccaagaccgagacagccttctcacag2940
gctcaacaggccgttaatggcttgtttatgaacacgcagtactcaatgctgaagatcgag3000
accaccatgcaagacatcgtgacggccgacaatttgattaacgagattccatacgtctat3060
gatgagcttcttcccaacgaacctgcgggccggaattataatatgtttattgagctgaaa3120
aatcaaataagccaagtctattcgctctacaatgccagaaacattatacagaacggcaat3180
ttcaacaatggcttgaaaaactggcacactagccctgatgctaaggttcaaaagatcgac3240
aatacctcagtgcttgtcataccaaactggtccacacaggtctcacagcatactaatctt3300
cagcaaaatcaaagatatctgctcagagtcacggccaagaaagagggaatgggtaatggc3360
tatgtcaaggtttcagactgtgctaataacgtggaaacaatcacctttaagtccagcgat3420
attactaataataatatgtggaatgagtcgataggctacatgactaaaactatgtatata3480
acaccacacacaagccaggtgcggatagacattggggagactgaagggaactttaagata3540
aattcgatcgaactgatctgtattaagaat3570
<210>13
<211>3576
<212>dna
<213>人工序列
<220>
<223>编码突变型bt0302
<400>13
atgagcagcggggggacaaacatgaactcaaatcgcaataagaacgagtatgaaatcctg60
gatgcatcttcttccacctcaaatatgacaaaccaatattctcggtaccccctcgcaaac120
aatccgcaggcatttatgcggaacacgaattataaagattggatcgctatgtgtgagagg180
aacgacacgggtgtgttggagaaccccgaagtcctctcgcttcggggggcagtcggaacg240
ggtgtcagcatcgttggaatgattttttccctgataggcattccagtgataggtgaagtt300
gtggggattctcgtctctcttaccaatctgctttggccggaatctgagggctccgctcag360
tatacatggcaagaattgattacgcacgtcgaggagcttatggaccagcgcataggtgag420
acgcaaaaagctaatgctcttgccaagttgtcgggattgaaggcccaggtggctgcttat480
aaccgcgccctcgaagactgggagaaaaacccgaacagccgctccgcaagcgaagtgatc540
gcgcgcttcaggtctactaataacgattttgttggtagcatgccgcaattttccccgaac600
ggatacgagatattgcttctcagcgtctacgcccaagctgcgaacttgcacttgctgttg660
attcgggacgccactatttacggctctcagtggggcctctcacagggagacgtcaacttg720
tactacaatgaacaactgttgtatacaaagcaatatgtgaaccattgcgtgacctggtac780
aataacggactcgcacagcagaaagccctctttgcaacgagccccaactggaatcgcttc840
aatgcctaccgccgcgacatgacgatcaacgttttggacctgatcgccctctttcccatt900
tatgacgcacggctctacccccaacccgtccgcgcggaacttactcgcgagatttactca960
aacatattgaattctgatgtctacggcgtccaatgggccgattttgaaaagaatgaaagc1020
acttttacacgccccccccaccttttcacttggttgcgcaaattcgatttctatacccgg1080
acgaagtattacaatcaggggttgggatggctgttcttgggaggccacaccaactactat1140
tcatatacaaacagctcgaatctgaagtcggggtcttacaacaatttctggggatcagac1200
atgcagacttccactcttaccattcctgacaatccttcaatttaccgcctctggacaaaa1260
tcttacacgcacatatatccgtataccgatccggtgaatataactcagatgcaattttat1320
ttgaccaacaaccaacagttgacatacacggccacggccaatcctaggtatccagtgaga1380
gaaacgaacttcgaacttccgtcaacagatgagaatcctctgacataccaaaactactct1440
catatcctttcatatatgatctcgtcgcaacattttggtgataagcggtcaggctacacg1500
ttcgcctggactcacaattcagttgatcccaccaatacgcttgccccaaataaaattacc1560
cagattcctgccgttaaggccaataccctcgaaggtaataaaagctttgtggtgaaagga1620
ccgaaccatacggggggggatttggttatacttgaggctgagcctggaccagtgtatcct1680
attgtttatcggggcgtcatggggattacgtgcaaagtgactcaggcccagaactatcgc1740
attaggatccgctatgcttccaatggaggggcgcagatggctatcagccttcgcaacagg1800
gggaccgggacggtctttacagtgtcgaaaacgtacacggggaactctattgagaatctt1860
cagtacaatgatttccagtataaagacatgccagtgatacttgaggcttcacaatacgaa1920
cccaacaattccatctacgtttatctctatcaagaatctccttatatccaagtcatcatc1980
gacaagatagaattcatcccgattgacacaacttcgcaggagtatgaggaaaagcatcaa2040
cttgaaaaggcgaagaaagctgtgggagttctgttcacgaatgacgccaagaaagctttg2100
aagatcgatactaccgattacgatgttgaccaggccgcaaacctcattgagtgcctttca2160
gatgaacaatacgctaaagagaagatgatattgctggatgaagtcaaatacgctaagcaa2220
ctttcccagtctcggaatctcctgcagaatggagactttgagtccagcgagatcggatgg2280
gagacctccaacacgatcacgatacaagcagggaacttgatcttcaaaggtaagtatttg2340
aacatgtcaggtgcacggaacatagatggggccatctttcctacgtacgccttccagaag2400
gtcgacgagtctcggctcaagccttatacgcggtacaaggttaggggattcgtcggctca2460
tcgaaagacgtcgaagtggtcgttactcggtatggggaggaagtcgataccatcatgaac2520
gtgccaaatgaccttacatatgacgttggtagcgtcaagagctgcggtgagtggaatcgc2580
tgtgagcagcagccttaccagaatcgcaaccaagtgctcaataactctatgataatagct2640
aacacgtccaacgcgtccaactcatgcgaatatgtcccagaaaagaaaagggtcatgtgc2700
cctgagccccatcaattcagcttccatgtggatacgggcgagaccaatctcaacgaaaat2760
ttggggatttcagtcctgtttaaaatttctagcccggaggggtatgcaatacttgacaac2820
atagagttgatcgaagaagggtccctcgttggtgaatcgcttgcttacgttcaaaaccgg2880
gagaaaagatggaaaaataaaatgcaggcggaaagaatggagacccaacaagcgtataat2940
atagctaagcaagtggtcgacatactttttacagatccacaggataccgccctccgcttc3000
gaaactaataaatccaatataatttctgcagatgagctcgtccaatcgatcccatacatc3060
tacaatgactggcttagagacgtccccggcatgaactacaacatgttcactgagctcaag3120
ggtagaattactcaagcttattatctttacgatgataggaacgtgttgcagaacggggac3180
ttcaacaatgggctcacgagctggtacgtcaccggaaatgcagaagtgcagcagatagat3240
gggacttttgtcctcgttctgcaaaattggtcgactacagtctcgcagaacgtgtgcctt3300
cagcacaataggggatatgttctgcgggtgacggcacgcaaagaaggaatgggcaacggg3360
tacgtcaccatgtctgactgcgcgaatcacatagagaaaatcattttcacatcgtgtgat3420
aacaacctggttgttacctccacggattccgccgaatatgtgactagaaccgtgtctttc3480
tttccagacaccgaccatgttcgcatagaaataggggaaactgagggcaccttcaaggtc3540
gagtcagttgaactcatatgtatggagggaaaagaa3576
<210>14
<211>3603
<212>dna
<213>人工序列
<220>
<223>编码突变型bt0454
<400>14
atgaatcaaaacatagccgcagtgcgggaagcggtcaatgctctcttttctaatcacacg60
cttcaacttaaagtgacagactaccacgtcgaccaggtggctaaattggtggaatgcata120
tctgaccagaaccatagcaaggagaagatgtgcctgcttgatcaggtgaagatcgcaaaa180
agattgtcgagggagaggaacctgttgaactacggtgacttcgaatcctctaactgggca240
ggtgcagatggctggaacatttctgcgcacgtttacaccattgccgataacctgatcttc300
aaggaccattatcttaatatgccgtcggtgaataatcccatactgtcggacaaaatattc360
cccacttatgcgtatcagaaaatagaggagtcaaagctgaaaccttacacgagatacatg420
gtgcgcggattcgttggttcttccaaggaccttgagatcttggttgctcggcacggcaag480
gaggtgcataaacgcatgaatgttcctaatgacatcattcccaccaacccttgcactggc540
gaactcgtctcccagccgccgccatatccagttatgcctatacacacaatggcccaaaac600
atgtggtgcaatccttgcgaaaatggttatcaaaccgctgcaggtatgatggtccaggag660
acgaatatggtctgtcaggaccctcacgagttcaaatttagcatcgacatcggagagatc720
gaccgcgaaaggaatttgggtatatggattgggttcaaagtcggaacgactgaaggtatg780
gccacactcgactctatagaggtggttgaggtcggaccactgacaggcgatgcactgaag840
cgcatgcaaaaaagagagcagaagtggaaaaagaaatgggctgagaagcaaatgaaaata900
gagcgcgccgttcagattgcacgcaatgctattcaaactcttttcactgacccaaatcag960
aataggcttcaatcggcaattactctgaagaacattgtggacgctgagaagtgggttcag1020
aaaattccctatgtctataatcaatttcttcagggggctattcctgaggttccgggtgag1080
caatacaacgtgtttcaacaactctcgcaggccgtcgtcacggctagggggttgtacaac1140
caaagaaatgtcatcaataatggtgacttcagcgccggcttgagcaactggaacgggact1200
aaaggtgcagatgtccaacaaattggaaaagagtcagttctcatgatcagcgattggtca1260
gcaaacatatcacaacaagtctgtgttgagcctgagcattcatacctgctgcgcgtgaca1320
gcacggaaagaaggctctggggaaggttacgtgacgatctctgatggaactaaagataac1380
accgaaacgctcaaatttatcgtgggagaagagacaactggcgcaaccatgagcactatc1440
cggtcacacataagggagagatacaacgaacgcaacatggttacttcggaggtctatgac1500
gcgagcggatatgccagcaatcagaatatggtcaactactcttcggagaattatggcatg1560
tccgcatacagcgggaacaacaataaaaattaccaatcagagtcattcggatttactcct1620
tatggtgacgagaactccatgatgaattacccaagcgagaactacggggagaatgcgtat1680
tcgggaaacgataacatgaattatccttctaataactacgagatgaacccctattccagc1740
gacatgaacatgtctatgaatcaggggagcgactgcaggtgtggctgtagcactaattcc1800
taccctggcggggacatgaccatgaataattatccctcttcgatgtatgaaacaaacgca1860
tacccctcttctaccaacatgacggacaacctgggaatgggctgtggttgctattactct1920
actaatgaacatccaatggttgagcagagcacactggacctgtcggattacgttatgaaa1980
accgttgaaattttccctgaaacgaatagagtctgtatagaaatcggagaaactgccggg2040
atatttatgatagagtcgatagagttcgtgccggtcaatccgattgaatcagtgcccgag2100
cctgggccagggatatatcagagcgttacagcattgaataatagctctgtcgtggagatg2160
gccagccagggagctaggaacgttattaaagcccttccgcaaaatgcgagcaatatagag2220
cttgagtatgccccggtctatgactatgataccgatggctgctacgctaccgctgcaata2280
tcaccagatgggacaacgaatcctggcctgggcatgggcgattcaccctcgtccggttgc2340
aggggcccggctcagctcgaaaatagcaacacctattcgagggctaagtctaacaacgga2400
tggaccgccataatgtacgctagctactttgaaaaggatcaaacttctctcgggcctggg2460
tcggctgggcatagacacgactgggagcacaccattgtttgggtcaaggacgggcaagtc2520
caatacgtcacatactccgcacacgggaactggtacacgaatcctagatctaacgttcgg2580
ttttcaggcaatcacccgaagatcgtgtatcacaaagattctatttctacccatgctttt2640
cgcctggctaattctaacgacgaacctccagagaattattaccaccagtggcttcttctc2700
cctatagttggttggtatggttatccctctagagcaattagggagaaactgatgacgacc2760
aattttgggtcagcgacgattgagatcaaggacggtaacttcgaacgggccttggaaaaa2820
gcgaagccaccaataaacttcgacccgtatgcccctgagctcgaggacgggggcgcgtac2880
caaatcgttagcaccctgaataacaggtctgttgtggacatggatccaccatcgaagaat2940
gtgcatctgtgggaaaatggtaatgcaaataaccaaaaatggaagctggtttatgactca3000
attaaaagcgcttatcagatgaagaatatcgccaatgagaatctggtcctgacctggaat3060
gatctgaatgggagcataaatgttattgctactagcaaccagaaccaggaagagcaatat3120
tggatcccaactgaagcgggaaatgggtattattacgttagaaacaagaaggatccaaat3180
aaagttttggatgtctcaggctatgggaccgcaaatgggacgaatgtcacagtttataat3240
gtgcatgggggaaataaccaaaaattcaaattgtcaaacgttaccggcatcctcacgaga3300
gaggtggaaagcttgtacaaagcccagcccggtcagtccagccggtccagcaacaacttc3360
tcccttgagcatctcgccgctggtacgaaggtccgcgtcatacttgcaggcgagggcgcg3420
acgagcctgtcgttcaacatttcgcgcgacaaatccggcaccgattcttcgatatggtca3480
aatgtcagagactccagcgttctcactctgcctagcggagatgatagaaagaacctttat3540
atttcagggccgccaagcggctacacatccaacgggaccttcactgttaagttctatgca3600
ctg3603
<210>15
<211>3438
<212>dna
<213>人工序列
<220>
<223>编码突变型bt0485
<400>15
atgaaccaatacaacaacaccaacaacgagataatagatgcgtccactaaacgctccccc60
cagtatcccctggctaacaatccacagaatagcattaagactactaactacaaagattgg120
ataaacatgtgcgagggaaacgcagaagcttttttcatcaccgatgagcaaatggtttcc180
attgttggtgccgctatttctaagttgttgggtttcgttccggttgtgggcgacatcctt240
tcgtttctcgcagacacatattggcctaagatagcgggacaggaggtggacacccgggtt300
tgggcaggcctgatccgccacactgccaacctgatcgataacagggaagcggaaaaagtt360
attggccaggctaccaccaaccttatgtcgttgtacggagcgctcggcgtttacaataga420
tttctggagcaatggaaacaaaatgagaaatcatttgcgaatctggccgacgaagtgaga480
acacaaatgtctgcgctgcacctccttttcaccaccaagataatctctgattttactctc540
catggttacgagtccatccttctgccatcctatgcctccgcagcaaatctccatctgctt600
cttctgagggacattgctatttacggtgagaggcttggatttgacccaaaagtcctccag660
gcttaccatgacgagcaagttctctttactaggcagtatacagcacactgtatcaatact720
tataaccttacattgaacgcgcagaaacccagaggatgggttgccttcaaccaatataga780
cgggatatgacactcacagttttggatttgatagctctgtttccgagctacgacactcac840
aagtatcctgtggataagaaaaatgttaagaagttgagcactaccgagtttactcgggaa900
atctatacggctttgatcgaacctaatcctaacaagaccgtcgagggcatggaggcctcg960
ctgacaaggactccccacctcttcacttggattaaacgccttgacttttacaccaacacg1020
ctttacccggatctcagatatttgtccgcaaaccgcattggttttagctacacaaattcg1080
tcgacgatccaacagagcggtatttacggtgattcaggatttgggtccaatctgacgcat1140
cagcttccgataaatccaaacatatttaaaagctccatcacggataccagatcaccttcg1200
aaccaaattactaagatggacttttacaaaacagacggtacccaagcgagctacaattcg1260
gggataacaccaacgcctggtgatctgcgcaccacattcttcggtttctcgactaatgaa1320
aataccccaaatcagccttctatcaatgactatacgcattttcttacgtacatgaagacc1380
gatgttatatcgggtggagccccaaaaagggtctcattggcctgggcccacaaaagcgtc1440
aacctcaataatcaaattttcactgatgacattactcaggtccctgccgtcaaaagcaac1500
gttctcaacacacaagccaaagttataaaaggaccgggacatacagggggcgatctggtg1560
gctattacttctgatggagtgctcagcggccggatggaaatccagtgtaaggcatctgtc1620
tttaacgaaccggagcgccggtatgggctcagaattcgctacgcggcgaattcgatcctt1680
acagtcaacgcttcgtatacgtcacagggcaacacgcgctctatcacgtttacgaccgag1740
agcacgtttacagggaacactattcccaccgacctgaaatatgaaaatttgaagtacaaa1800
gaacctttcgacgccatcctccctatgagacttacgtcgaatgagctcacgaatattaca1860
attcaaccgcagaatatgtcatctaatcaacttcttataattgatcgcatcgagtttata1920
cctataacctcaacggttctcggcgatactgagaagcaaaatctggagaaagtgcaaaag1980
gctgttaacgatctcttcactaacaccgcaaagaacgcactcaaggctgaaacgacagac2040
tatgaaatagaccagactgcaaacattgtcgagtgtttgtcagacgagcattctacgaag2100
gagaagatgattctcctggacgaggtcaagtacgctaagcaactttcgcaatcacgcaat2160
gtgctgcaaaatggtgacttcgagtcggatacactgggatggacaacttcaaacaatatt2220
accatacaagcagacaatcccatcttcaaagggaaataccttcacatgtccggggccagg2280
gatatcgacggttctgtctttcccacttatatctaccaaaaaattgacgagtccaaactt2340
aaaccttacacgcggtacagagtgaggggtttcgtggggtcgtctaaagagctcgagctt2400
gtggtttcaaggtacggcgaggagatcgatgcaatcatgaacgtcccgaacaaattggtc2460
gatatgtatccgcccgcctcggattgcggtggcttgaatagatgtgaaatctcgtccgct2520
ttggagatcaaccaagtcgactacactaacatgagctacccttgccaaaacgatggtaac2580
aagaagcatgtcttgtgccacgatagacattcatacgatttccatatcgacacggggtcc2640
gttgatctcaacgaaaatattggcatatgggtgcttttcaaggtctcatcacctgacggt2700
tacgctaccttggataatcttgaggtggtggaggagcgctctctcgacggagaagctctc2760
gctagggtgaaacacagggaaaaaaaatggattcaccagatagaagtgaaacggtacgaa2820
acccagcaagcttacgacgcgacaaaacaggcaatggacgcattgtttactaacgaccag2880
gacgaagcgctccaattcgatactactctcgcgcagattcaacacgcggacgaccttgtg2940
caatcaatcccatatgtttacaacgaatgggtccccagcgcacctgggatgaactacgac3000
ctctatgtcgagttggaagcgcgcgttgtcaaagcgcggtacctttacgatacacggaat3060
gttatacggaatggagatttctctgaaggactccaagggtggcatgttaccggaaacgcc3120
aaggttcagcagattgacggagtgtccgtccttgtgttgtccaactggagcgcaggggtg3180
gctcaaaatatgtacgttcagcacaaccatggctatgtcctccgggtgactgccaagaaa3240
gaaggacacggtaagggctatgtgacacttatggactgtgacgggaatcaggagaccctt3300
acctttacatcttgcgaagaggggtacgtcacaaagacagttgacgttttccctgataca3360
gatagagtcagagtggatctgggggagacagaaggccctttttacatcgagtcgattgag3420
cttatttgtatgaatggc3438
<210>16
<211>1173
<212>prt
<213>苏云金芽孢杆菌
<400>16
metglyglyileasnmetserproasntyrseraspasptyrgluile
151015
ileasnalaproserasnthrserproargtyrproleuvalhisasp
202530
leuthrproglnpheglnaspmetasntyrlysasptyrleuargmet
354045
thrgluglyasnargglyvalseralathrservalargserglygly
505560
glualaileaspalaalaleuserilethralaileleuleuglyval
65707580
leuglyhisprovalglyseralavalvalglythrpheasnalaleu
859095
leuglyleuleutrpproasnglyglnthrilevaltrpgluaspleu
100105110
leualalysalagluaspphealaasnlysvalilethralagluile
115120125
argserasnalapheseralaleuasnvalsertyralametvalser
130135140
glutyrthrseralaleuasnasptrpilegluasnproglyvalarg
145150155160
ileserglnglnleumetarggluilephethrasnthrvalleugln
165170175
leualaserglnmetprotyrpheasnvalalaglytyrgluthrser
180185190
leuleuthrmettyralaglnalaalaasnleuhisleuservalleu
195200205
lysaspilepheilepheglylysglutrpglypheproglnthrasp
210215220
ileaspphetyrtyrtyrgluglupheileasphisleuprovaltyr
225230235240
valasphiscysthrlystrptyrasngluglyleuasnasnleupro
245250255
lysserasnsertyrasptrptyrasntyrasnlyspheargargglu
260265270
metthrleumetvalleuaspilevalalaleupheprosertyrasp
275280285
alatyrvaltyrthrleugluthrthrthrgluleuthrargileval
290295300
tyrthraspproleuglyilemetileproproproproglytyrglu
305310315320
glumetvalglytyrglyglyasnleuasptrpargasntyrglyphe
325330335
serphesertyrleugluserglnleuargglnprovalleupheser
340345350
trpleuasnserilelysmettyrthrarglysileilecysgluala
355360365
glythrprohisserleutrpserglyasngluileasnleusertyr
370375380
thrseraspproserasnthrphethrleuglnserglytyrserthr
385390395400
glytyrthrhisthrasppheleuaspileasnserlysaspiletyr
405410415
gluvalvalserlysileglyserglualavalvalglyproglyasp
420425430
aspsertyrleutyrglyleutyrglnalaalapheargileilepro
435440445
lysaspserseralatyrsertyrleutyrprothrtyraspilegly
450455460
metasnglytyrsermetserserleuvalgluleuproprogluser
465470475480
seraspproproglnproaspglutyrthrtyrthrhisargleuser
485490495
tyralathrleuleuservalhissertyrthrseraspphepheasn
500505510
aspglyalaileproiletyrglytrpthrhisargservalasnarg
515520525
aspasnglniletyrproaspargilethrglnileproalavallys
530535540
glylysglnleuilegluglyalaservalhislysglyproglyser
545550555560
thrglyglyaspleuvalargleutyrleuasnaspargvaltyrleu
565570575
asnvalasnvalaspservalserglnlystyrargvalargvalarg
580585590
cysalathrtyrasnproglyseriletyrleutyrargaspasnthr
595600605
ileileserseralathralaprolysthrthraspthrthraspthr
610615620
thrglnilelyspheasnasppheglntyrilethrpheseraspile
625630635640
phethrphethrserthrtrpglnglnileserileglyalaglythr
645650655
thrtyralagluvaltyrileasplysileglupheileprovalasn
660665670
gluthrtyrglualagluargasnleugluasnalalyslysalaval
675680685
seralaleuphethrglythrmetaspthrleulysarggluvalthr
690695700
asptyrglnileaspargalaserasnleuileglucysvalserasp
705710715720
glumettyrglyasnasplysargleuleupheglualavallysthr
725730735
alalysargleuserglnserargasnleuleuglnaspleuasnphe
740745750
glumetleuasnthrserglyasnglygluasnglytrpvalglyser
755760765
thrglyileglnvalvalgluglyaspalaleuphelysasnargser
770775780
leuargleuproglyalaargglnpheaspthrgluthrtyrprothr
785790795800
tyrleutyrglnlysileglugluserlysleulysprotyrthrarg
805810815
tyrlysvalargglypheilelysglyserlysaspleugluvalasp
820825830
valmetargtyrglyalalysglnlysvalleuasnvalproasnasn
835840845
leuasnproaspileileproileasnalacysglyaspvalasparg
850855860
cysargglnglnglnalavalasnalaargleuglnproalathrile
865870875880
serprocysgluglyglyaspthrasnthrseralahisalapheser
885890895
pheserileaspthrglyalaileaspthrsergluargproglyile
900905910
glyvalalaphelysilealathrprogluglytyralaserleugly
915920925
asnleugluvalileglugluglyproleuthrglyglualaleuala
930935940
hisvallysglnarggluargglntrplysasplysilethrlyslys
945950955960
argalagluthrgluthriletyrthrargalalysglnalaileasn
965970975
asnleuphealaasptyrglnaspargglnleulyshisaspvalglu
980985990
ileproasnileilealaalaaspglnilevalgluserileargasp
99510001005
argtyrasnglutrpileproalaileproglymetasntyrglu
101010151020
iletyrthrgluleulysasnargileglnargalatyralaleu
102510301035
tyraspalaargasnileilelysasnglyasppheargasngly
104010451050
leualaasntrpasnalathrproglyalaargvalglnglnmet
105510601065
asnglyasnprovalleuvalileproasntrpaspthrglnval
107010751080
serglnservalprovalgluproasnhisargtyrleuleuarg
108510901095
valthralaglnlysleuglyalaglyasnglytyrvalthrval
110011051110
thraspglythrasnhisthrgluthrleuthrpheaspargcys
111511201125
aspasnasnthrthrglyserasnargtyrvalthrlysthrile
113011351140
gluphethrproargthrasnglnleuglnvalgluileglyglu
114511501155
thrgluglythrpheasnilegluservalasnleuleuglycys
116011651170
<210>17
<211>1190
<212>prt
<213>苏云金芽孢杆菌
<400>17
metthrglnasnasnasnglutyrgluileileaspglnasnthrser
151015
protyrserserasnargasnasnasnasnserargtyrpropheala
202530
asnasnproasnglnalaleuglnglnthrasntyrlysasptrpile
354045
asnmetcysglnlysasnglnglncysglygluasnleugluthrphe
505560
alaseralaaspthrilealaalavalseralaglyvalilevalval
65707580
glythrmetleuglyalapheglyalaprovalthrthrglyleuile
859095
ileserpheglythrleuleuproilephetrpglyprosergluasp
100105110
prolyslysvaltrplysglupheleuthrileglyasnargprophe
115120125
glysergluvalaspglnglyileileaspleuleutyrthrlysval
130135140
asnglyleuargserglnphegluasppheglnargtyrpheaspleu
145150155160
trplysasnasnlysasnprovalasnalaaspvalvalargglnlys
165170175
pheleuserleuaspseraspvalilearggluleugluthrleulys
180185190
glyasntyrtyrilethrleuleuproglytyrthrglnvalalaasn
195200205
trphisleuasnleuleuargglnalaalatyrtyrtyraspglutrp
210215220
alaproserserasnleuserileglnseriletyrproglnasptyr
225230235240
thrasnaspleuglnthrcysleuaspasncysproserglusergly
245250255
asnlysvalserseralatyrtyrlyscysileleulyscysargile
260265270
asnglutyrileasntyrcysserlysthrtyrglngluglyleuasn
275280285
lysleulysasnserseraspilelystrpasniletyrasnglutyr
290295300
argargglumetthrleuthrvalleuaspleuilealaalaphepro
305310315320
asntyraspleuglulystyrproileglythrlyscysgluleuthr
325330335
arggluvaltyrthrasnalaleumetglysersersermetserile
340345350
alagluleuglulysserleuthrlysasppropheleuilethrtrp
355360365
leuasnlysileleuleutyrthrargasntyrlysglnprothrthr
370375380
gluaspvalphevalphethrglyasnglnleuargtyrserphethr
385390395400
metaspserasnleuglytyrserglyphetyrglyaspvalsertyr
405410415
thraspaspthrgluglnileleugluileproglyasnserglnile
420425430
vallysvalgluvalgluarghisargaspserproaspileiletrp
435440445
lysileaspphehisleuasnasnglyalavalleulystyrasnser
450455460
glyserthralaaspproasnpheargvalargaspvalleuthrile
465470475480
proproaspserlysglyasnalaserhispheleusertyrmetlys
485490495
seralatyrvalthrseraspvallysglnleuargargvalserphe
500505510
alatrpthrhisasnserileasntyrasnasngluiletyrasnasp
515520525
ileilethrglnilealaalavallysglyhistyrleuglyleuglu
530535540
glyleualaserargvalileglnglyproglyhisthrglyglyasp
545550555560
leuvalaspleulysaspaspleuargleualacysglnhissergly
565570575
thrglnglnsertyrtyrileargileargtyralaseraspglyasp
580585590
thrargilevalleuvalileproleumetgluserglnasnilepro
595600605
leulysserthrpheserglyvalasnhisaspgluleulystyrlys
610615620
asppheglytyrvalglnpheproglygluilethrleuasnglnhis
625630635640
serlysilethrleuilepheargleuglnaspiletyrserasnile
645650655
servalpheileasplysileglupheileproilethrserserile
660665670
arggluasnargglulystyrglnleuglulysalalysargalaval
675680685
aspaspleupheileseralalyslysglnasnilelysileaspile
690695700
thrasptyrglnileaspglnthralaasnleuvalaspserleuser
705710715720
glugluprotyrproglnglulysmetmetleuleuasnglnilelys
725730735
tyralalysglnleuserglnserargasnleuleuserasnglyasp
740745750
phegluserleuileglytrpthrthrserserserilethrvalgln
755760765
thrglyasnthrilephelysglypheserleuhismetleuglyala
770775780
argthrthrgluileasnalathrvalpheprothrtyrvaltyrgln
785790795800
lysileaspgluserargleulysprotyrthrargtyrilevalarg
805810815
glypheileglyserserlysglyleuglyilephevalthrargtyr
820825830
asnasnvalproasplysleualatyrileargserthrasnsercys
835840845
glygluleuasnglntyrgluserglnasntyrserleuvalserglu
850855860
asnasnserthrmetserleuglnasnilethralaserasnaspthr
865870875880
sercysleusergluasnleuargtyrcysgluproasnglnleutyr
885890895
prothrcyshisasnleuhisasppheserpheserileaspthrgly
900905910
gluleuasppheasngluasnproglyiletrpileleuphelysile
915920925
serasnproaspglytyralathrleuglyasnleugluvalileglu
930935940
glulysthrleuvalglyglugluileasnasnvallysglulysgly
945950955960
lysargtrplyslysglumetaspthrlysglnthrlysthrgluthr
965970975
alapheserglnalaglnglnalavalasnglyleuphemetasnthr
980985990
glntyrsermetleulysilegluthrthrmetglnaspilevalthr
99510001005
alaaspasnleuileasngluileprotyrvaltyraspgluleu
101010151020
leuproasngluproalaglyargasntyrasnmetpheileglu
102510301035
leulysasnglnileserglnvaltyrserleutyrasnalaarg
104010451050
asnileileglnasnglyasnpheasnasnglyleulysasntrp
105510601065
histhrserproaspalalysvalglnlysileaspasnthrser
107010751080
valleuvalileproasntrpserthrglnvalserglnhisthr
108510901095
asnleuglnglnasnglnargtyrleuleuargvalthralalys
110011051110
lysgluglymetglyasnglytyrvallysvalseraspcysala
111511201125
asnasnvalgluthrleuthrphelysserseraspilethrasn
113011351140
asnasnmettrpasngluserileglytyrmetthrlysthrmet
114511501155
tyrilethrprohisthrserglnvalargileaspileglyglu
116011651170
thrgluglyasnphelysileasnserilegluleuilecysile
117511801185
lysasn
1190
<210>18
<211>1192
<212>prt
<213>苏云金芽孢杆菌
<400>18
metserserglyglythrasnmetasnserasnargasnlysasnglu
151015
tyrgluileleuaspalaserserserthrserasnmetthrasngln
202530
tyrserargtyrproleualaasnasnproglnalaphemetargasn
354045
thrasntyrlysasptrpleualametcysgluargasnaspthrgly
505560
valleugluasnprogluvalleuserleuargglyalavalglythr
65707580
glyvalserilevalglymetilepheserleuileglyileproval
859095
ileglygluvalvalglyileleuvalserleuthrasnleuleutrp
100105110
proglusergluglyseralaglntyrthrtrpglngluleuilethr
115120125
hisvalglugluleumetaspglnargileglygluthrglnlysala
130135140
asnalaleualalysleuserglyleulysalaglnvalalaalatyr
145150155160
asnargalaleugluasptrpglulysasnproasnserargserala
165170175
sergluvalilealaargpheargserthrasnasnaspphevalgly
180185190
sermetproglnpheserproasnglytyrgluileleuleuleuser
195200205
valtyralaglnalaalaasnleuhisleuleuleuileargaspala
210215220
thriletyrglyserglntrpglyleuserglnglyaspvalasnleu
225230235240
tyrtyrasngluglnleuleutyrthrlysglntyrvalasnhiscys
245250255
valthrtrptyrasnasnglyleualaglnglnlysalaleupheala
260265270
thrserproasntrpasnargpheasnalatyrargargaspmetthr
275280285
ileasnvalleuaspleuilealaleupheproiletyraspalaarg
290295300
leutyrproglnprovalargalagluleuthrarggluiletyrser
305310315320
asnileleuasnseraspvaltyrglyvalglntrpalaasppheglu
325330335
lysasngluserthrphethrargproprohisleuphethrtrpleu
340345350
arglyspheaspphetyrthrargthrlystyrtyrasnglnglyleu
355360365
glytrpleupheleuglyglyhisthrasntyrtyrsertyrthrasn
370375380
serserasnleulysserglysertyrasnasnphetrpglyserasp
385390395400
metglnthrserthrleuthrileproaspasnproseriletyrarg
405410415
leutrpthrlyssertyrthrhisiletyrprotyrthraspproval
420425430
asnilethrglnmetglnphetyrleuthrasnasnglnglnleuthr
435440445
tyrthralathralaasnproargtyrprovalarggluthrasnphe
450455460
gluleuproserthraspgluasnproleuthrtyrglnasntyrser
465470475480
hisileleusertyrmetileserserglnhispheglyasplysarg
485490495
serglytyrthrphealatrpthrhisasnservalaspprothrasn
500505510
thrleualaproasnlysilethrglnileproalavallysalaasn
515520525
thrleugluglyasnlysserphevalvallysglyproasnhisthr
530535540
glyglyaspleuvalileleuglualagluproglyprovaltyrpro
545550555560
ilevaltyrargglyvalmetglyilethrcyslysvalthrglnala
565570575
glnasntyrargileargileargtyralaserasnglyglyalagln
580585590
metalaileserleuargasnargglythrglythrvalphethrval
595600605
serlysthrtyrthrglyasnserilegluasnleuglntyrasnasp
610615620
pheglntyrlysaspmetprovalileleuglualaserglntyrglu
625630635640
proasnasnseriletyrvaltyrleutyrglngluserprotyrile
645650655
glnvalileileasplysileglupheileproileaspthrthrser
660665670
glnglutyrgluglulyshisglnleuglulysalalyslysalaval
675680685
glyvalleuphethrasnaspalalyslysalaleulysileaspthr
690695700
thrasptyraspvalaspglnalaalaasnleuileglucysleuser
705710715720
aspgluglntyralalysglulysmetileleuleuaspgluvallys
725730735
tyralalysglnleuserglnserargasnleuleuglnasnglyasp
740745750
pheglusersergluileglytrpgluthrserasnthrilethrile
755760765
glnalaglyasnleuilephelysglylystyrleuasnmetsergly
770775780
alaargasnileaspglyalailepheprothrtyralapheglnlys
785790795800
valaspgluserargleulysprotyrthrargtyrlysvalarggly
805810815
phevalglyserserlysaspvalgluvalvalvalthrargtyrgly
820825830
glugluvalaspthrilemetasnvalproasnaspleuthrtyrasp
835840845
valglyservallyssercysglyglutrpasnargcysgluglngln
850855860
protyrglnasnargasnglnvalleuasnasnsermetileileala
865870875880
asnthrserasnalaserasnsercysglutyrvalproglulyslys
885890895
argvalmetcysprogluprohisglnpheserphehisvalaspthr
900905910
glygluthrasnleuasngluasnleuglyileservalleuphelys
915920925
ileserserprogluglytyralaileleuaspasnilegluleuile
930935940
glugluglyserleuvalglygluserleualatyrvalglnasnarg
945950955960
glulysargtrplysasnlysmetglnalagluargmetgluthrgln
965970975
glnalatyrasnilealalysglnvalvalaspileleuphethrasp
980985990
proglnaspthralaleuargphegluthrasnlysserasnileile
99510001005
seralaaspgluleuvalglnserileprotyriletyrasnasp
101010151020
trpleuargaspvalproglymetasntyrasnmetphethrglu
102510301035
leulysglyargilethrglnalatyrtyrleutyraspasparg
104010451050
asnvalleuglnasnglyasppheasnasnglyleuthrsertrp
105510601065
tyrvalthrglyasnalagluvalglnglnileaspglythrphe
107010751080
valleuvalleuglnasntrpserthrthrvalserglnasnval
108510901095
cysleuglnhisasnargglytyrvalleuargvalthralaarg
110011051110
lysgluglymetglyasnglytyrvalthrmetseraspcysala
111511201125
asnhisileglulysileilephethrsercysaspasnasnile
113011351140
valvalthrserthraspseralaglutyrvalthrargthrval
114511501155
serphepheproaspthrasphisvalargilegluileglyglu
116011651170
thrgluglythrphelysvalgluservalgluleuilecysmet
117511801185
gluglylysglu
1190
<210>19
<211>1201
<212>prt
<213>苏云金芽孢杆菌
<400>19
metasnglnasnilealaalavalargglualavalasnalaleuphe
151015
serasnhisthrleuglnleulysvalthrasptyrhisvalaspgln
202530
valalalysleuvalglucysileseraspglnasnhisserlysglu
354045
lysmetcysleuleuaspglnvallysleualalysargleuserarg
505560
gluargasnleuleuasntyrglyaspphegluserserasntrpala
65707580
glyalaaspglytrpasnileseralahisvaltyrthrilealaasp
859095
asnleuilephelysasphistyrleuasnmetproservalasnasn
100105110
proileleuserasplysilepheprothrtyralatyrglnlysile
115120125
glugluserlysleulysprotyrthrargtyrmetvalargglyphe
130135140
valglyserserlysaspleugluileleuvalalaarghisglylys
145150155160
gluvalhislysargmetasnvalproasnaspileileprothrasn
165170175
procysthrglygluleuvalserglnproproprotyrprovalmet
180185190
proilehisthrmetalaglnasnmettrpcysasnprocysgluasn
195200205
glytyrglnthralaalaglymetmetvalglngluthrasnmetval
210215220
cysglnaspprohisgluphelyspheserileaspileglygluile
225230235240
asparggluargasnleuglyiletrpileglyphelysvalglythr
245250255
thrgluglymetalathrleuaspserilegluvalvalgluvalgly
260265270
proleuthrglyaspalaleulysargmetglnlysarggluglnlys
275280285
trplyslyslystrpalaglulysglnmetlysilegluargalaval
290295300
glnilealaargasnalaileglnthrleuphethraspproasngln
305310315320
asnargleuglnseralailethrleulysasnilevalaspalaglu
325330335
lystrpvalglnlysileprotyrvaltyrasnglnpheleuglngly
340345350
alaileprogluvalproglygluglntyrasnvalpheglnglnleu
355360365
serglnalavalvalthralaargglyleutyrasnglnargasnval
370375380
ileasnasnglyasppheseralaglyleuserasntrpasnglythr
385390395400
lysglyalaaspvalglnglnileglylysgluservalleumetile
405410415
serasptrpseralaasnileserglnglnvalcysvalgluproglu
420425430
hissertyrleuleuargvalthralaarglysgluglyserglyglu
435440445
glytyrvalthrileseraspglythrlysaspasnthrgluthrleu
450455460
lyspheilevalglyglugluthrthrglyalathrmetserthrile
465470475480
argserhisilearggluargtyrasngluargasnmetvalthrser
485490495
gluvaltyraspalaserglytyralaserasnglnasnmetvalasn
500505510
tyrsersergluasntyrglymetseralatyrserglyasnasnasn
515520525
lysasntyrglnsergluserpheglyphethrprotyrglyaspglu
530535540
asnsermetmetasntyrprosergluasntyrglygluasnalatyr
545550555560
serglyasnaspasnmetasntyrproserasnasntyrglumetasn
565570575
protyrserseraspmetasnmetsermetasnglnglyseraspcys
580585590
argcysglycysserthrasnsertyrproglyglyaspmetthrmet
595600605
asnasntyrprosersermettyrgluthrasnalatyrproserser
610615620
thrasnmetthraspasnleuglymetglycysglycystyrtyrser
625630635640
thrasngluhisprometvalgluglnserthrleuaspleuserasp
645650655
tyrvalmetlysthrvalgluilepheprogluthrasnargvalcys
660665670
ilegluileglygluthralaglyilephemetilegluserileglu
675680685
phevalprovalasnproilegluservalprogluproglyprogly
690695700
iletyrglnservalthralaleuasnasnserservalvalglumet
705710715720
alaserglnglyalaargasnvalilelysalaleuproglnasnala
725730735
serasnilegluleuglutyralaprovaltyrasptyraspthrasp
740745750
glycystyralathralaalaileserproaspglythrthrasnpro
755760765
glyleuglymetglyaspserproserserglycysargglyproala
770775780
glnleugluasnserasnthrtyrserargalalysserasnasngly
785790795800
trpthralailemettyralasertyrpheglulysaspglnthrser
805810815
leuglyproglyseralaglyhisarghisasptrpgluhisthrile
820825830
valtrpvallysaspglyglnvalglntyrvalthrtyrseralahis
835840845
glyasntrptyrthrasnproargserasnvalargpheserglyasn
850855860
hisprolysilevaltyrhislysaspserileserthrhisalaphe
865870875880
argleualaasnserasnaspgluproprogluasntyrtyrhisgln
885890895
trpleuleuleuproilevalglytrptyrglytyrproserargala
900905910
ileargglulysleumetthrthrasnpheglyseralathrileglu
915920925
ilelysaspglyasnphegluargalaleuglulysalalyspropro
930935940
ileasnpheaspprotyralaprogluleugluaspglyglyalatyr
945950955960
glnilevalserthrleuasnasnargservalvalaspmetasppro
965970975
proserlysasnvalhisleutrpgluasnglyasnalaasnasngln
980985990
lystrplysleuvaltyraspserilelysseralatyrglnmetlys
99510001005
asnilealaasngluasnleuvalleuthrtrpasnaspleuasn
101010151020
glyserileasnvalilealathrserasnglnasnglngluglu
102510301035
glntyrtrpileprothrglualaglyasnglytyrtyrtyrval
104010451050
argasnlyslysaspproasnlysvalleuaspvalserglytyr
105510601065
glythralaasnglythrasnvalthrvaltyrasnvalhisgly
107010751080
glyasnasnglnlysphelysleuserasnvalthrglyileleu
108510901095
thrarggluvalgluserleutyrlysalaglnproglyglnser
110011051110
serargserserasnasnpheserleugluhisleualaalagly
111511201125
thrlysvalargvalileleualaglygluglyalathrserleu
113011351140
serpheasnileserargasplysserglythraspserserile
114511501155
trpserasnvalargaspserservalleuthrileprosergly
116011651170
aspasparglysasnleutyrileserglyproproserglytyr
117511801185
thrserasnglythrphethrvallysphetyralaleu
119011951200
<210>20
<211>1146
<212>prt
<213>苏云金芽孢杆菌
<400>20
metasnglntyrasnasnthrasnasngluileileaspalaserthr
151015
lysargserproglntyrproleualaasnasnproglnasnserile
202530
lysthrthrasntyrlysasptrpileasnmetcysgluglyasnala
354045
glualaphepheleuthraspgluglnmetvalserilevalglyala
505560
alaileserlysleuleuglyphevalprovalvalglyaspileleu
65707580
serpheleualaaspthrtyrtrpprolysilealaglyglngluval
859095
aspthrargvaltrpalaglyleuilearghisthralaasnleuile
100105110
aspasnargglualaglulysvalileglyglnalathrthrasnleu
115120125
metserleutyrglyalaleuglyvaltyrasnargpheleuglugln
130135140
trplysglnasnglulysserphealaasnleualaaspgluvalarg
145150155160
thrglnmetseralaleuhisleuleuphethrthrlysileileser
165170175
aspphethrleuhisglytyrgluserileleuleuprosertyrala
180185190
seralaalaasnleuhisleuleuleuleuargaspilealailetyr
195200205
glygluargleuglypheaspprolysvalleuglnalatyrhisasp
210215220
gluglnvalleuphethrargglntyrthralahiscysileasnthr
225230235240
tyrasnleuthrleuasnalaglnlysproargglytrpvalalaphe
245250255
asnglntyrargargaspmetthrleuthrvalleuaspleuileala
260265270
leupheprosertyraspthrhislystyrprovalasplyslysasn
275280285
vallyslysleuserthrthrgluphethrarggluiletyrthrala
290295300
leuilegluproasnproasnlysthrvalgluglymetglualaser
305310315320
leuthrargthrprohisleuphethrtrpilelysargleuaspphe
325330335
tyrthrasnthrleutyrproaspleuargtyrleuseralaasnarg
340345350
ileglyphesertyrthrasnserserthrileglnglnserglyile
355360365
tyrglyaspserglypheglyserasnleuthrhisglnleuproile
370375380
asnproasnilephelysserserilethraspthrargserproser
385390395400
asnglnilethrlysmetaspphetyrlysthraspglythrglnala
405410415
sertyrasnserglyilethrprothrproglyaspleuargthrthr
420425430
phepheglypheserthrasngluasnthrproasnglnproserile
435440445
asnasptyrthrhispheleuthrtyrmetlysthraspvalileser
450455460
glyglyalaprolysargvalserleualatrpalahislysserval
465470475480
asnleuasnasnglnilephethraspaspilethrglnvalproala
485490495
vallysserasnvalleuasnthrglnalalysvalilelysglypro
500505510
glyhisthrglyglyaspleuvalalailethrseraspglyvalleu
515520525
serglyargmetgluileglncyslysalaservalpheasnglupro
530535540
gluargargtyrglyleuargileargtyralaalaasnserileleu
545550555560
thrvalasnalasertyrthrserglnglyasnthrargserilethr
565570575
phethrthrgluserthrphethrglyasnthrileprothraspleu
580585590
lystyrgluasnleulystyrlysglupropheaspalaileleupro
595600605
metargleuthrserasngluleuthrasnilethrileglnprogln
610615620
asnmetserserasnglnleuleuileileaspargileglupheile
625630635640
proilethrserthrvalleuglyaspthrglulysglnasnleuglu
645650655
lysvalglnlysalavalasnaspleuphethrasnthralalysasn
660665670
alaleulysalagluthrthrasptyrgluileaspglnthralaasn
675680685
ilevalglucysleuseraspgluhisserthrlysglulysmetile
690695700
leuleuaspgluvallystyralalysglnleuserglnserargasn
705710715720
valleuglnasnglyaspphegluseraspthrleuglytrpthrthr
725730735
serasnasnilethrileglnalaaspasnproilephelysglylys
740745750
tyrleuhismetserglyalaargaspileaspglyservalphepro
755760765
thrtyriletyrglnlysileaspgluserlysleulysprotyrthr
770775780
argtyrargvalargglyphevalglyserserlysgluleugluleu
785790795800
valvalserargtyrglyglugluileaspalailemetasnvalpro
805810815
asnlysleuvalaspmettyrproproalaseraspcysglyglyleu
820825830
asnargcysgluileserseralaleugluileasnglnvalasptyr
835840845
thrasnmetsertyrprocysglnasnaspglyasnlyslyshisval
850855860
leucyshisasparghissertyraspphehisileaspthrglyser
865870875880
valaspleuasngluasnileglyiletrpvalleuphelysvalser
885890895
serproaspglytyralathrleuaspasnleugluvalvalgluglu
900905910
argserleuaspglyglualaleualaargvallyshisargglulys
915920925
lystrpilehisglnilegluvallysargtyrgluthrglnglnala
930935940
tyraspalathrlysglnalametaspalaleuphethrasnaspgln
945950955960
aspglualaleuglnpheaspthrthrleualaglnileglnhisala
965970975
aspaspleuvalglnserileprotyrvaltyrasnglutrpvalpro
980985990
seralaproglymetasntyraspleutyrvalgluleuglualaarg
99510001005
valvallysalaargtyrleutyraspthrargasnvalilearg
101010151020
asnglyaspphesergluglyleuglnglytrphisvalthrgly
102510301035
asnalalysvalglnglnileaspglyvalservalleuvalleu
104010451050
serasntrpseralaglyvalalaglnasnmettyrvalglnhis
105510601065
asnhisglytyrvalleuargvalthralalyslysgluglyhis
107010751080
glylysglytyrvalthrleumetaspcysaspglyasnglnglu
108510901095
thrleuthrphethrsercysglugluglytyrvalthrlysthr
110011051110
valaspvalpheproaspthraspargvalargvalaspilegly
111511201125
gluthrgluglyprophetyrilegluserilegluleuilecys
113011351140
metasngly
1145
<210>21
<211>1173
<212>prt
<213>人工序列
<220>
<223>突变型bt0264
<400>21
metglyglyileasnmetserproasntyrseraspasptyrgluile
151015
ileasnalaproserasnthrserproargtyrproleuvalhisasp
202530
leuthrproglnpheglnaspmetasntyrlysasptyrileargmet
354045
thrgluglyasnargglyvalseralathrservalargserglygly
505560
glualaileaspalaalaleuserilethralaileleuleuglyval
65707580
leuglyhisprovalglyseralavalvalglythrpheasnalaleu
859095
leuglyleuleutrpproasnglyglnthrilevaltrpgluaspleu
100105110
leualalysalagluaspphealaasnlysvalilethralagluile
115120125
argserasnalapheseralaleuasnvalsertyralametvalser
130135140
glutyrthrseralaleuasnasptrpilegluasnproglyvalarg
145150155160
ileserglnglnleumetarggluilephethrasnthrvalleugln
165170175
leualaserglnmetprotyrpheasnvalalaglytyrgluthrser
180185190
leuleuthrmettyralaglnalaalaasnleuhisleuservalleu
195200205
lysaspilepheilepheglylysglutrpglypheproglnthrasp
210215220
ileaspphetyrtyrtyrgluglupheileasphisleuprovaltyr
225230235240
valasphiscysthrlystrptyrasngluglyleuasnasnleupro
245250255
lysserasnsertyrasptrptyrasntyrasnlyspheargargglu
260265270
metthrleumetvalleuaspilevalalaleupheprosertyrasp
275280285
alatyrvaltyrthrleugluthrthrthrgluleuthrargileval
290295300
tyrthraspproleuglyilemetileproproproproglytyrglu
305310315320
glumetvalglytyrglyglyasnleuasptrpargasntyrglyphe
325330335
serphesertyrleugluserglnleuargglnprovalleupheser
340345350
trpleuasnserilelysmettyrthrarglysileilecysgluala
355360365
glythrprohisserleutrpserglyasngluileasnleusertyr
370375380
thrseraspproserasnthrphethrleuglnserglytyrserthr
385390395400
glytyrthrhisthrasppheleuaspileasnserlysaspiletyr
405410415
gluvalvalserlysileglyserglualavalvalglyproglyasp
420425430
aspsertyrleutyrglyleutyrglnalaalapheargileilepro
435440445
lysaspserseralatyrsertyrleutyrprothrtyraspilegly
450455460
metasnglytyrsermetserserleuvalgluleuproprogluser
465470475480
seraspproproglnproaspglutyrthrtyrthrhisargleuser
485490495
tyralathrleuleuservalhissertyrthrseraspphepheasn
500505510
aspglyalaileproiletyrglytrpthrhisargservalasnarg
515520525
aspasnglniletyrproaspargilethrglnileproalavallys
530535540
glylysglnleuilegluglyalaservalhislysglyproglyser
545550555560
thrglyglyaspleuvalargleutyrleuasnaspargvaltyrleu
565570575
asnvalasnvalaspservalserglnlystyrargvalargvalarg
580585590
cysalathrtyrasnproglyseriletyrleutyrargaspasnthr
595600605
ileileserseralathralaprolysthrthraspthrthraspthr
610615620
thrglnilelyspheasnasppheglntyrilethrpheseraspile
625630635640
phethrphethrserthrtrpglnglnileserileglyalaglythr
645650655
thrtyralagluvaltyrileasplysileglupheileprovalasn
660665670
gluthrtyrglualagluargasnleugluasnalalyslysalaval
675680685
seralaleuphethrglythrmetaspthrleulysarggluvalthr
690695700
asptyrglnileaspargalaserasnleuileglucysvalserasp
705710715720
glumettyrglyasnasplysargleuleupheglualavallysthr
725730735
alalysargleuserglnserargasnleuleuglnaspleuasnphe
740745750
glumetleuasnthrserglyasnglygluasnglytrpvalglyser
755760765
thrglyileglnvalvalgluglyaspalaleuphelysasnargser
770775780
leuargleuproglyalaargglnpheaspthrgluthrtyrprothr
785790795800
tyrleutyrglnlysileglugluserlysleulysprotyrthrarg
805810815
tyrlysvalargglypheilelysglyserlysaspleugluvalasp
820825830
valmetargtyrglyalalysglnlysvalleuasnvalproasnasn
835840845
leuasnproaspileileproileasnalacysglyaspvalasparg
850855860
cysargglnglnglnalavalasnalaargleuglnproalathrile
865870875880
serprocysgluglyglyaspthrasnthrseralahisalapheser
885890895
pheserileaspthrglyalaileaspthrsergluargproglyile
900905910
glyvalalaphelysilealathrprogluglytyralaserleugly
915920925
asnleugluvalileglugluglyproleuthrglyglualaleuala
930935940
hisvallysglnarggluargglntrplysasplysilethrlyslys
945950955960
argalagluthrgluthriletyrthrargalalysglnalaileasn
965970975
asnleuphealaasptyrglnaspargglnleulyshisaspvalglu
980985990
ileproasnileilealaalaaspglnilevalgluserileargasp
99510001005
argtyrasnglutrpileproalaileproglymetasntyrglu
101010151020
iletyrthrgluleulysasnargileglnargalatyralaleu
102510301035
tyraspalaargasnileilelysasnglyasppheargasngly
104010451050
leualaasntrpasnalathrproglyalaargvalglnglnmet
105510601065
asnglyasnprovalleuvalileproasntrpaspthrglnval
107010751080
serglnservalprovalgluproasnhisargtyrleuleuarg
108510901095
valthralaglnlysleuglyalaglyasnglytyrvalthrval
110011051110
thraspglythrasnhisthrgluthrleuthrpheaspargcys
111511201125
aspasnasnthrthrglyserasnargtyrvalthrlysthrleu
113011351140
gluphethrproargthrasnglnleuglnvalgluileglyglu
114511501155
thrgluglythrpheasnilegluservalasnleuleuglycys
116011651170
<210>22
<211>1190
<212>prt
<213>人工序列
<220>
<223>突变型bt0288
<400>22
metthrglnasnasnasnglutyrgluileileaspglnasnthrser
151015
protyrserserasnargasnasnasnasnserargtyrpropheala
202530
asnasnproasnglnalaleuglnglnthrasntyrlysasptrpleu
354045
asnmetcysglnlysasnglnglncysglygluasnleugluthrphe
505560
alaseralaaspthrilealaalavalseralaglyvalilevalval
65707580
glythrmetleuglyalapheglyalaprovalthrthrglyleuile
859095
ileserpheglythrleuleuproilephetrpglyprosergluasp
100105110
prolyslysvaltrplysglupheleuthrileglyasnargprophe
115120125
glysergluvalaspglnglyileileaspleuleutyrthrlysval
130135140
asnglyleuargserglnphegluasppheglnargtyrpheaspleu
145150155160
trplysasnasnlysasnprovalasnalaaspvalvalargglnlys
165170175
pheleuserleuaspseraspvalilearggluleugluthrleulys
180185190
glyasntyrtyrilethrleuleuproglytyrthrglnvalalaasn
195200205
trphisleuasnleuleuargglnalaalatyrtyrtyraspglutrp
210215220
alaproserserasnleuserileglnseriletyrproglnasptyr
225230235240
thrasnaspleuglnthrcysleuaspasncysproserglusergly
245250255
asnlysvalserseralatyrtyrlyscysileleulyscysargile
260265270
asnglutyrileasntyrcysserlysthrtyrglngluglyleuasn
275280285
lysleulysasnserseraspilelystrpasniletyrasnglutyr
290295300
argargglumetthrleuthrvalleuaspleuilealaalaphepro
305310315320
asntyraspleuglulystyrproileglythrlyscysgluleuthr
325330335
arggluvaltyrthrasnalaleumetglysersersermetserile
340345350
alagluleuglulysserleuthrlysasppropheleuilethrtrp
355360365
leuasnlysileleuleutyrthrargasntyrlysglnprothrthr
370375380
gluaspvalphevalphethrglyasnglnleuargtyrserphethr
385390395400
metaspserasnleuglytyrserglyphetyrglyaspvalsertyr
405410415
thraspaspthrgluglnileleugluileproglyasnserglnile
420425430
vallysvalgluvalgluarghisargaspserproaspileiletrp
435440445
lysileaspphehisleuasnasnglyalavalleulystyrasnser
450455460
glyserthralaaspproasnpheargvalargaspvalleuthrile
465470475480
proproaspserlysglyasnalaserhispheleusertyrmetlys
485490495
seralatyrvalthrseraspvallysglnleuargargvalserphe
500505510
alatrpthrhisasnserileasntyrasnasngluiletyrasnasp
515520525
ileilethrglnilealaalavallysglyhistyrleuglyleuglu
530535540
glyleualaserargvalileglnglyproglyhisthrglyglyasp
545550555560
leuvalaspleulysaspaspleuargleualacysglnhissergly
565570575
thrglnglnsertyrtyrileargileargtyralaseraspglyasp
580585590
thrargilevalleuvalileproleumetgluserglnasnilepro
595600605
leulysserthrpheserglyvalasnhisaspgluleulystyrlys
610615620
asppheglytyrvalglnpheproglygluilethrleuasnglnhis
625630635640
serlysilethrleuilepheargleuglnaspiletyrserasnile
645650655
servalpheileasplysileglupheileproilethrserserile
660665670
arggluasnargglulystyrglnleuglulysalalysargalaval
675680685
aspaspleupheileseralalyslysglnasnilelysileaspile
690695700
thrasptyrglnileaspglnthralaasnleuvalaspserleuser
705710715720
glugluprotyrproglnglulysmetmetleuleuasnglnilelys
725730735
tyralalysglnleuserglnserargasnleuleuserasnglyasp
740745750
phegluserleuileglytrpthrthrserserserilethrvalgln
755760765
thrglyasnthrilephelysglypheserleuhismetleuglyala
770775780
argthrthrgluileasnalathrvalpheprothrtyrvaltyrgln
785790795800
lysileaspgluserargleulysprotyrthrargtyrilevalarg
805810815
glypheileglyserserlysglyleuglyilephevalthrargtyr
820825830
asnasnvalproasplysleualatyrileargserthrasnsercys
835840845
glygluleuasnglntyrgluserglnasntyrserleuvalserglu
850855860
asnasnserthrmetserleuglnasnilethralaserasnaspthr
865870875880
sercysleusergluasnleuargtyrcysgluproasnglnleutyr
885890895
prothrcyshisasnleuhisasppheserpheserileaspthrgly
900905910
gluleuasppheasngluasnproglyiletrpileleuphelysile
915920925
serasnproaspglytyralathrleuglyasnleugluvalileglu
930935940
glulysthrleuvalglyglugluileasnasnvallysglulysgly
945950955960
lysargtrplyslysglumetaspthrlysglnthrlysthrgluthr
965970975
alapheserglnalaglnglnalavalasnglyleuphemetasnthr
980985990
glntyrsermetleulysilegluthrthrmetglnaspilevalthr
99510001005
alaaspasnleuileasngluileprotyrvaltyraspgluleu
101010151020
leuproasngluproalaglyargasntyrasnmetpheileglu
102510301035
leulysasnglnileserglnvaltyrserleutyrasnalaarg
104010451050
asnileileglnasnglyasnpheasnasnglyleulysasntrp
105510601065
histhrserproaspalalysvalglnlysileaspasnthrser
107010751080
valleuvalileproasntrpserthrglnvalserglnhisthr
108510901095
asnleuglnglnasnglnargtyrleuleuargvalthralalys
110011051110
lysgluglymetglyasnglytyrvallysvalseraspcysala
111511201125
asnasnvalgluthrilethrphelysserseraspilethrasn
113011351140
asnasnmettrpasngluserileglytyrmetthrlysthrmet
114511501155
tyrilethrprohisthrserglnvalargileaspileglyglu
116011651170
thrgluglyasnphelysileasnserilegluleuilecysile
117511801185
lysasn
1190
<210>23
<211>1192
<212>prt
<213>人工序列
<220>
<223>突变型bt0302
<400>23
metserserglyglythrasnmetasnserasnargasnlysasnglu
151015
tyrgluileleuaspalaserserserthrserasnmetthrasngln
202530
tyrserargtyrproleualaasnasnproglnalaphemetargasn
354045
thrasntyrlysasptrpilealametcysgluargasnaspthrgly
505560
valleugluasnprogluvalleuserleuargglyalavalglythr
65707580
glyvalserilevalglymetilepheserleuileglyileproval
859095
ileglygluvalvalglyileleuvalserleuthrasnleuleutrp
100105110
proglusergluglyseralaglntyrthrtrpglngluleuilethr
115120125
hisvalglugluleumetaspglnargileglygluthrglnlysala
130135140
asnalaleualalysleuserglyleulysalaglnvalalaalatyr
145150155160
asnargalaleugluasptrpglulysasnproasnserargserala
165170175
sergluvalilealaargpheargserthrasnasnaspphevalgly
180185190
sermetproglnpheserproasnglytyrgluileleuleuleuser
195200205
valtyralaglnalaalaasnleuhisleuleuleuileargaspala
210215220
thriletyrglyserglntrpglyleuserglnglyaspvalasnleu
225230235240
tyrtyrasngluglnleuleutyrthrlysglntyrvalasnhiscys
245250255
valthrtrptyrasnasnglyleualaglnglnlysalaleupheala
260265270
thrserproasntrpasnargpheasnalatyrargargaspmetthr
275280285
ileasnvalleuaspleuilealaleupheproiletyraspalaarg
290295300
leutyrproglnprovalargalagluleuthrarggluiletyrser
305310315320
asnileleuasnseraspvaltyrglyvalglntrpalaasppheglu
325330335
lysasngluserthrphethrargproprohisleuphethrtrpleu
340345350
arglyspheaspphetyrthrargthrlystyrtyrasnglnglyleu
355360365
glytrpleupheleuglyglyhisthrasntyrtyrsertyrthrasn
370375380
serserasnleulysserglysertyrasnasnphetrpglyserasp
385390395400
metglnthrserthrleuthrileproaspasnproseriletyrarg
405410415
leutrpthrlyssertyrthrhisiletyrprotyrthraspproval
420425430
asnilethrglnmetglnphetyrleuthrasnasnglnglnleuthr
435440445
tyrthralathralaasnproargtyrprovalarggluthrasnphe
450455460
gluleuproserthraspgluasnproleuthrtyrglnasntyrser
465470475480
hisileleusertyrmetileserserglnhispheglyasplysarg
485490495
serglytyrthrphealatrpthrhisasnservalaspprothrasn
500505510
thrleualaproasnlysilethrglnileproalavallysalaasn
515520525
thrleugluglyasnlysserphevalvallysglyproasnhisthr
530535540
glyglyaspleuvalileleuglualagluproglyprovaltyrpro
545550555560
ilevaltyrargglyvalmetglyilethrcyslysvalthrglnala
565570575
glnasntyrargileargileargtyralaserasnglyglyalagln
580585590
metalaileserleuargasnargglythrglythrvalphethrval
595600605
serlysthrtyrthrglyasnserilegluasnleuglntyrasnasp
610615620
pheglntyrlysaspmetprovalileleuglualaserglntyrglu
625630635640
proasnasnseriletyrvaltyrleutyrglngluserprotyrile
645650655
glnvalileileasplysileglupheileproileaspthrthrser
660665670
glnglutyrgluglulyshisglnleuglulysalalyslysalaval
675680685
glyvalleuphethrasnaspalalyslysalaleulysileaspthr
690695700
thrasptyraspvalaspglnalaalaasnleuileglucysleuser
705710715720
aspgluglntyralalysglulysmetileleuleuaspgluvallys
725730735
tyralalysglnleuserglnserargasnleuleuglnasnglyasp
740745750
pheglusersergluileglytrpgluthrserasnthrilethrile
755760765
glnalaglyasnleuilephelysglylystyrleuasnmetsergly
770775780
alaargasnileaspglyalailepheprothrtyralapheglnlys
785790795800
valaspgluserargleulysprotyrthrargtyrlysvalarggly
805810815
phevalglyserserlysaspvalgluvalvalvalthrargtyrgly
820825830
glugluvalaspthrilemetasnvalproasnaspleuthrtyrasp
835840845
valglyservallyssercysglyglutrpasnargcysgluglngln
850855860
protyrglnasnargasnglnvalleuasnasnsermetileileala
865870875880
asnthrserasnalaserasnsercysglutyrvalproglulyslys
885890895
argvalmetcysprogluprohisglnpheserphehisvalaspthr
900905910
glygluthrasnleuasngluasnleuglyileservalleuphelys
915920925
ileserserprogluglytyralaileleuaspasnilegluleuile
930935940
glugluglyserleuvalglygluserleualatyrvalglnasnarg
945950955960
glulysargtrplysasnlysmetglnalagluargmetgluthrgln
965970975
glnalatyrasnilealalysglnvalvalaspileleuphethrasp
980985990
proglnaspthralaleuargphegluthrasnlysserasnileile
99510001005
seralaaspgluleuvalglnserileprotyriletyrasnasp
101010151020
trpleuargaspvalproglymetasntyrasnmetphethrglu
102510301035
leulysglyargilethrglnalatyrtyrleutyraspasparg
104010451050
asnvalleuglnasnglyasppheasnasnglyleuthrsertrp
105510601065
tyrvalthrglyasnalagluvalglnglnileaspglythrphe
107010751080
valleuvalleuglnasntrpserthrthrvalserglnasnval
108510901095
cysleuglnhisasnargglytyrvalleuargvalthralaarg
110011051110
lysgluglymetglyasnglytyrvalthrmetseraspcysala
111511201125
asnhisileglulysileilephethrsercysaspasnasnleu
113011351140
valvalthrserthraspseralaglutyrvalthrargthrval
114511501155
serphepheproaspthrasphisvalargilegluileglyglu
116011651170
thrgluglythrphelysvalgluservalgluleuilecysmet
117511801185
gluglylysglu
1190
<210>24
<211>1201
<212>prt
<213>人工序列
<220>
<223>突变型bt0454
<400>24
metasnglnasnilealaalavalargglualavalasnalaleuphe
151015
serasnhisthrleuglnleulysvalthrasptyrhisvalaspgln
202530
valalalysleuvalglucysileseraspglnasnhisserlysglu
354045
lysmetcysleuleuaspglnvallysilealalysargleuserarg
505560
gluargasnleuleuasntyrglyaspphegluserserasntrpala
65707580
glyalaaspglytrpasnileseralahisvaltyrthrilealaasp
859095
asnleuilephelysasphistyrleuasnmetproservalasnasn
100105110
proileleuserasplysilepheprothrtyralatyrglnlysile
115120125
glugluserlysleulysprotyrthrargtyrmetvalargglyphe
130135140
valglyserserlysaspleugluileleuvalalaarghisglylys
145150155160
gluvalhislysargmetasnvalproasnaspileileprothrasn
165170175
procysthrglygluleuvalserglnproproprotyrprovalmet
180185190
proilehisthrmetalaglnasnmettrpcysasnprocysgluasn
195200205
glytyrglnthralaalaglymetmetvalglngluthrasnmetval
210215220
cysglnaspprohisgluphelyspheserileaspileglygluile
225230235240
asparggluargasnleuglyiletrpileglyphelysvalglythr
245250255
thrgluglymetalathrleuaspserilegluvalvalgluvalgly
260265270
proleuthrglyaspalaleulysargmetglnlysarggluglnlys
275280285
trplyslyslystrpalaglulysglnmetlysilegluargalaval
290295300
glnilealaargasnalaileglnthrleuphethraspproasngln
305310315320
asnargleuglnseralailethrleulysasnilevalaspalaglu
325330335
lystrpvalglnlysileprotyrvaltyrasnglnpheleuglngly
340345350
alaileprogluvalproglygluglntyrasnvalpheglnglnleu
355360365
serglnalavalvalthralaargglyleutyrasnglnargasnval
370375380
ileasnasnglyasppheseralaglyleuserasntrpasnglythr
385390395400
lysglyalaaspvalglnglnileglylysgluservalleumetile
405410415
serasptrpseralaasnileserglnglnvalcysvalgluproglu
420425430
hissertyrleuleuargvalthralaarglysgluglyserglyglu
435440445
glytyrvalthrileseraspglythrlysaspasnthrgluthrleu
450455460
lyspheilevalglyglugluthrthrglyalathrmetserthrile
465470475480
argserhisilearggluargtyrasngluargasnmetvalthrser
485490495
gluvaltyraspalaserglytyralaserasnglnasnmetvalasn
500505510
tyrsersergluasntyrglymetseralatyrserglyasnasnasn
515520525
lysasntyrglnsergluserpheglyphethrprotyrglyaspglu
530535540
asnsermetmetasntyrprosergluasntyrglygluasnalatyr
545550555560
serglyasnaspasnmetasntyrproserasnasntyrglumetasn
565570575
protyrserseraspmetasnmetsermetasnglnglyseraspcys
580585590
argcysglycysserthrasnsertyrproglyglyaspmetthrmet
595600605
asnasntyrprosersermettyrgluthrasnalatyrproserser
610615620
thrasnmetthraspasnleuglymetglycysglycystyrtyrser
625630635640
thrasngluhisprometvalgluglnserthrleuaspleuserasp
645650655
tyrvalmetlysthrvalgluilepheprogluthrasnargvalcys
660665670
ilegluileglygluthralaglyilephemetilegluserileglu
675680685
phevalprovalasnproilegluservalprogluproglyprogly
690695700
iletyrglnservalthralaleuasnasnserservalvalglumet
705710715720
alaserglnglyalaargasnvalilelysalaleuproglnasnala
725730735
serasnilegluleuglutyralaprovaltyrasptyraspthrasp
740745750
glycystyralathralaalaileserproaspglythrthrasnpro
755760765
glyleuglymetglyaspserproserserglycysargglyproala
770775780
glnleugluasnserasnthrtyrserargalalysserasnasngly
785790795800
trpthralailemettyralasertyrpheglulysaspglnthrser
805810815
leuglyproglyseralaglyhisarghisasptrpgluhisthrile
820825830
valtrpvallysaspglyglnvalglntyrvalthrtyrseralahis
835840845
glyasntrptyrthrasnproargserasnvalargpheserglyasn
850855860
hisprolysilevaltyrhislysaspserileserthrhisalaphe
865870875880
argleualaasnserasnaspgluproprogluasntyrtyrhisgln
885890895
trpleuleuleuproilevalglytrptyrglytyrproserargala
900905910
ileargglulysleumetthrthrasnpheglyseralathrileglu
915920925
ilelysaspglyasnphegluargalaleuglulysalalyspropro
930935940
ileasnpheaspprotyralaprogluleugluaspglyglyalatyr
945950955960
glnilevalserthrleuasnasnargservalvalaspmetasppro
965970975
proserlysasnvalhisleutrpgluasnglyasnalaasnasngln
980985990
lystrplysleuvaltyraspserilelysseralatyrglnmetlys
99510001005
asnilealaasngluasnleuvalleuthrtrpasnaspleuasn
101010151020
glyserileasnvalilealathrserasnglnasnglngluglu
102510301035
glntyrtrpileprothrglualaglyasnglytyrtyrtyrval
104010451050
argasnlyslysaspproasnlysvalleuaspvalserglytyr
105510601065
glythralaasnglythrasnvalthrvaltyrasnvalhisgly
107010751080
glyasnasnglnlysphelysleuserasnvalthrglyileleu
108510901095
thrarggluvalgluserleutyrlysalaglnproglyglnser
110011051110
serargserserasnasnpheserleugluhisleualaalagly
111511201125
thrlysvalargvalileleualaglygluglyalathrserleu
113011351140
serpheasnileserargasplysserglythraspserserile
114511501155
trpserasnvalargaspserservalleuthrleuprosergly
116011651170
aspasparglysasnleutyrileserglyproproserglytyr
117511801185
thrserasnglythrphethrvallysphetyralaleu
119011951200
<210>25
<211>1146
<212>prt
<213>人工序列
<220>
<223>突变型bt0485
<400>25
metasnglntyrasnasnthrasnasngluileileaspalaserthr
151015
lysargserproglntyrproleualaasnasnproglnasnserile
202530
lysthrthrasntyrlysasptrpileasnmetcysgluglyasnala
354045
glualaphepheilethraspgluglnmetvalserilevalglyala
505560
alaileserlysleuleuglyphevalprovalvalglyaspileleu
65707580
serpheleualaaspthrtyrtrpprolysilealaglyglngluval
859095
aspthrargvaltrpalaglyleuilearghisthralaasnleuile
100105110
aspasnargglualaglulysvalileglyglnalathrthrasnleu
115120125
metserleutyrglyalaleuglyvaltyrasnargpheleuglugln
130135140
trplysglnasnglulysserphealaasnleualaaspgluvalarg
145150155160
thrglnmetseralaleuhisleuleuphethrthrlysileileser
165170175
aspphethrleuhisglytyrgluserileleuleuprosertyrala
180185190
seralaalaasnleuhisleuleuleuleuargaspilealailetyr
195200205
glygluargleuglypheaspprolysvalleuglnalatyrhisasp
210215220
gluglnvalleuphethrargglntyrthralahiscysileasnthr
225230235240
tyrasnleuthrleuasnalaglnlysproargglytrpvalalaphe
245250255
asnglntyrargargaspmetthrleuthrvalleuaspleuileala
260265270
leupheprosertyraspthrhislystyrprovalasplyslysasn
275280285
vallyslysleuserthrthrgluphethrarggluiletyrthrala
290295300
leuilegluproasnproasnlysthrvalgluglymetglualaser
305310315320
leuthrargthrprohisleuphethrtrpilelysargleuaspphe
325330335
tyrthrasnthrleutyrproaspleuargtyrleuseralaasnarg
340345350
ileglyphesertyrthrasnserserthrileglnglnserglyile
355360365
tyrglyaspserglypheglyserasnleuthrhisglnleuproile
370375380
asnproasnilephelysserserilethraspthrargserproser
385390395400
asnglnilethrlysmetaspphetyrlysthraspglythrglnala
405410415
sertyrasnserglyilethrprothrproglyaspleuargthrthr
420425430
phepheglypheserthrasngluasnthrproasnglnproserile
435440445
asnasptyrthrhispheleuthrtyrmetlysthraspvalileser
450455460
glyglyalaprolysargvalserleualatrpalahislysserval
465470475480
asnleuasnasnglnilephethraspaspilethrglnvalproala
485490495
vallysserasnvalleuasnthrglnalalysvalilelysglypro
500505510
glyhisthrglyglyaspleuvalalailethrseraspglyvalleu
515520525
serglyargmetgluileglncyslysalaservalpheasnglupro
530535540
gluargargtyrglyleuargileargtyralaalaasnserileleu
545550555560
thrvalasnalasertyrthrserglnglyasnthrargserilethr
565570575
phethrthrgluserthrphethrglyasnthrileprothraspleu
580585590
lystyrgluasnleulystyrlysglupropheaspalaileleupro
595600605
metargleuthrserasngluleuthrasnilethrileglnprogln
610615620
asnmetserserasnglnleuleuileileaspargileglupheile
625630635640
proilethrserthrvalleuglyaspthrglulysglnasnleuglu
645650655
lysvalglnlysalavalasnaspleuphethrasnthralalysasn
660665670
alaleulysalagluthrthrasptyrgluileaspglnthralaasn
675680685
ilevalglucysleuseraspgluhisserthrlysglulysmetile
690695700
leuleuaspgluvallystyralalysglnleuserglnserargasn
705710715720
valleuglnasnglyaspphegluseraspthrleuglytrpthrthr
725730735
serasnasnilethrileglnalaaspasnproilephelysglylys
740745750
tyrleuhismetserglyalaargaspileaspglyservalphepro
755760765
thrtyriletyrglnlysileaspgluserlysleulysprotyrthr
770775780
argtyrargvalargglyphevalglyserserlysgluleugluleu
785790795800
valvalserargtyrglyglugluileaspalailemetasnvalpro
805810815
asnlysleuvalaspmettyrproproalaseraspcysglyglyleu
820825830
asnargcysgluileserseralaleugluileasnglnvalasptyr
835840845
thrasnmetsertyrprocysglnasnaspglyasnlyslyshisval
850855860
leucyshisasparghissertyraspphehisileaspthrglyser
865870875880
valaspleuasngluasnileglyiletrpvalleuphelysvalser
885890895
serproaspglytyralathrleuaspasnleugluvalvalgluglu
900905910
argserleuaspglyglualaleualaargvallyshisargglulys
915920925
lystrpilehisglnilegluvallysargtyrgluthrglnglnala
930935940
tyraspalathrlysglnalametaspalaleuphethrasnaspgln
945950955960
aspglualaleuglnpheaspthrthrleualaglnileglnhisala
965970975
aspaspleuvalglnserileprotyrvaltyrasnglutrpvalpro
980985990
seralaproglymetasntyraspleutyrvalgluleuglualaarg
99510001005
valvallysalaargtyrleutyraspthrargasnvalilearg
101010151020
asnglyaspphesergluglyleuglnglytrphisvalthrgly
102510301035
asnalalysvalglnglnileaspglyvalservalleuvalleu
104010451050
serasntrpseralaglyvalalaglnasnmettyrvalglnhis
105510601065
asnhisglytyrvalleuargvalthralalyslysgluglyhis
107010751080
glylysglytyrvalthrleumetaspcysaspglyasnglnglu
108510901095
thrleuthrphethrsercysglugluglytyrvalthrlysthr
110011051110
valaspvalpheproaspthraspargvalargvalaspleugly
111511201125
gluthrgluglyprophetyrilegluserilegluleuilecys
113011351140
metasngly
1145
<210>26
<211>669
<212>prt
<213>人工序列
<220>
<223>衍生自组装的序列。
<400>26
metthrglnasnasnasnglutyrgluileileaspglnasnthrser
151015
protyrserserasnargasnasnasnasnserargtyrpropheala
202530
asnasnproasnglnalaleuglnglnthrasntyrlysasptrpile
354045
asnmetcysglnlysasnglnglncysglygluasnleugluthrphe
505560
alaseralaaspthrilealaalavalseralaglyvalilevalval
65707580
glythrmetleuglyalapheglyalaprovalthrthrglyleuile
859095
ileserpheglythrleuleuproilephetrpglyprosergluasp
100105110
prolyslysvaltrplysglupheleuthrileglyasnargprophe
115120125
glysergluvalaspglnglyileileaspleuleutyrthrlysval
130135140
asnglyleuargserglnphegluasppheglnargtyrpheaspleu
145150155160
trplysasnasnlysasnprovalasnalaaspvalvalargglnlys
165170175
pheleuserleuaspseraspvalilearggluleugluthrleulys
180185190
glyasntyrtyrilethrleuleuproglytyrthrglnvalalaasn
195200205
trphisleuasnleuleuargglnalaalatyrtyrtyraspglutrp
210215220
alaproserserasnleuserileglnseriletyrproglnasptyr
225230235240
thrasnaspleuglnthrcysleuaspasncysproserglusergly
245250255
asnlysvalserseralatyrtyrlyscysileleulyscysargile
260265270
asnglutyrileasntyrcysserlysthrtyrglngluglyleuasn
275280285
lysleulysasnserseraspilelystrpasniletyrasnglutyr
290295300
argargglumetthrleuthrvalleuaspleuilealaalaphepro
305310315320
asntyraspleuglulystyrproileglythrlyscysgluleuthr
325330335
arggluvaltyrthrasnalaleumetglysersersermetserile
340345350
alagluleuglulysserleuthrlysasppropheleuilethrtrp
355360365
leuasnlysileleuleutyrthrargasntyrlysglnprothrthr
370375380
gluaspvalphevalphethrglyasnglnleuargtyrserphethr
385390395400
metaspserasnleuglytyrserglyphetyrglyaspvalsertyr
405410415
thraspaspthrgluglnileleugluileproglyasnserglnile
420425430
vallysvalgluvalgluarghisargaspserproaspileiletrp
435440445
lysileaspphehisleuasnasnglyalavalleulystyrasnser
450455460
glyserthralaaspproasnpheargvalargaspvalleuthrile
465470475480
proproaspserlysglyasnalaserhispheleusertyrmetlys
485490495
seralatyrvalthrseraspvallysglnleuargargvalserphe
500505510
alatrpthrhisasnserileasntyrasnasngluiletyrasnasp
515520525
ileilethrglnilealaalavallysglyhistyrleuglyleuglu
530535540
glyleualaserargvalileglnglyproglyhisthrglyglyasp
545550555560
leuvalaspleulysaspaspleuargleualacysglnhissergly
565570575
thrglnglnsertyrtyrileargileargtyralaseraspglyasp
580585590
thrargilevalleuvalileproleumetgluserglnasnilepro
595600605
leulysserthrpheserglyvalasnhisaspgluleulystyrlys
610615620
asppheglytyrvalglnpheproglygluilethrleuasnglnhis
625630635640
serlysilethrleuilepheargleuglnaspiletyrserasnile
645650655
servalpheileasplysileglupheileproilethr
660665
<210>27
<211>521
<212>prt
<213>人工序列
<220>
<223>衍生自组装的序列。
<400>27
serserilearggluasnargglulystyrglnleuglulysalalys
151015
argalavalaspaspleupheileseralalyslysglnasnilelys
202530
ileaspilethrasptyrglnileaspglnthralaasnleuvalasp
354045
serleuserglugluprotyrproglnglulysmetmetleuleuasn
505560
glnilelystyralalysglnleuserglnserargasnleuleuser
65707580
asnglyaspphegluserleuileglytrpthrthrserserserile
859095
thrvalglnthrglyasnthrilephelysglypheserleuhismet
100105110
leuglyalaargthrthrgluileasnalathrvalpheprothrtyr
115120125
valtyrglnlysileaspgluserargleulysprotyrthrargtyr
130135140
ilevalargglypheileglyserserlysglyleuglyilepheval
145150155160
thrargtyrasnasnvalproasplysleualatyrileargserthr
165170175
asnsercysglygluleuasnglntyrgluserglnasntyrserleu
180185190
valsergluasnasnserthrmetserleuglnasnilethralaser
195200205
asnaspthrsercysleusergluasnleuargtyrcysgluproasn
210215220
glnleutyrprothrcyshisasnleuhisasppheserpheserile
225230235240
aspthrglygluleuasppheasngluasnproglyiletrpileleu
245250255
phelysileserasnproaspglytyralathrleuglyasnleuglu
260265270
valilegluglulysthrleuvalglyglugluileasnasnvallys
275280285
glulysglylysargtrplyslysglumetaspthrlysglnthrlys
290295300
thrgluthralapheserglnalaglnglnalavalasnglyleuphe
305310315320
metasnthrglntyrsermetleulysilegluthrthrmetglnasp
325330335
ilevalthralaaspasnleuileasngluileprotyrvaltyrasp
340345350
gluleuleuproasngluproalaglyargasntyrasnmetpheile
355360365
gluleulysasnglnileserglnvaltyrserleutyrasnalaarg
370375380
asnileileglnasnglyasnpheasnasnglyleulysasntrphis
385390395400
thrserproaspalalysvalglnlysileaspasnthrservalleu
405410415
valileproasntrpserthrglnvalserglnhisthrasnleugln
420425430
glnasnglnargtyrleuleuargvalthralalyslysgluglymet
435440445
glyasnglytyrvallysvalseraspcysalaasnasnvalgluthr
450455460
leuthrphelysserseraspilethrasnasnasnmettrpasnglu
465470475480
serileglytyrmetthrlysthrmettyrilethrprohisthrser
485490495
glnvalargileaspileglygluthrgluglyasnphelysileasn
500505510
serilegluleuilecysilelysasn
515520
<210>28
<211>687
<212>prt
<213>人工序列
<220>
<223>衍生自组装的序列。
<400>28
metasnserasnargasnlysasnglutyrgluileleuaspalaser
151015
serserthrserasnmetthrasnglntyrserargtyrproleuala
202530
asnasnproglnalaphemetargasnthrasntyrlysasptrpleu
354045
alametcysgluargasnaspthrglyvalleugluasnprogluval
505560
leuserleuargglyalavalglythrglyvalserilevalglymet
65707580
ilepheserleuileglyileprovalileglygluvalvalglyile
859095
leuvalserleuthrasnleuleutrpproglusergluglyserala
100105110
glntyrthrtrpglngluleuilethrhisvalglugluleumetasp
115120125
glnargileglygluthrglnlysalaasnalaleualalysleuser
130135140
glyleulysalaglnvalalaalatyrasnargalaleugluasptrp
145150155160
glulysasnproasnserargseralasergluvalilealaargphe
165170175
argserthrasnasnaspphevalglysermetproglnpheserpro
180185190
asnglytyrgluileleuleuleuservaltyralaglnalaalaasn
195200205
leuhisleuleuleuileargaspalathriletyrglyserglntrp
210215220
glyleuserglnglyaspvalasnleutyrtyrasngluglnleuleu
225230235240
tyrthrlysglntyrvalasnhiscysvalthrtrptyrasnasngly
245250255
leualaglnglnlysalaleuphealathrserproasntrpasnarg
260265270
pheasnalatyrargargaspmetthrileasnvalleuaspleuile
275280285
alaleupheproiletyraspalaargleutyrproglnprovalarg
290295300
alagluleuthrarggluiletyrserasnileleuasnseraspval
305310315320
tyrglyvalglntrpalaasppheglulysasngluserthrphethr
325330335
argproprohisleuphethrtrpleuarglyspheaspphetyrthr
340345350
argthrlystyrtyrasnglnglyleuglytrpleupheleuglygly
355360365
histhrasntyrtyrsertyrthrasnserserasnleulyssergly
370375380
sertyrasnasnphetrpglyseraspmetglnthrserthrleuthr
385390395400
ileproaspasnproseriletyrargleutrpthrlyssertyrthr
405410415
hisiletyrprotyrthraspprovalasnilethrglnmetglnphe
420425430
tyrleuthrasnasnglnglnleuthrtyrthralathralaasnpro
435440445
argtyrprovalarggluthrasnphegluleuproserthraspglu
450455460
asnproleuthrtyrglnasntyrserhisileleusertyrmetile
465470475480
serserglnhispheglyasplysargserglytyrthrphealatrp
485490495
thrhisasnservalaspprothrasnthrleualaproasnlysile
500505510
thrglnileproalavallysalaasnthrleugluglyasnlysser
515520525
phevalvallysglyproasnhisthrglyglyaspleuvalileleu
530535540
glualagluproglyprovaltyrproilevaltyrargglyvalmet
545550555560
glyilethrcyslysvalthrglnalaglnasntyrargileargile
565570575
argtyralaserasnglyglyalaglnmetalaileserleuargasn
580585590
argglythrglythrvalphethrvalserlysthrtyrthrglyasn
595600605
serilegluasnleuglntyrasnasppheglntyrlysaspmetpro
610615620
valileleuglualaserglntyrgluproasnasnseriletyrval
625630635640
tyrleutyrglngluserprotyrileglnvalileileasplysile
645650655
glupheileproileaspthrthrserglnglutyrgluglulyshis
660665670
glnleuglulysalalyslysalavalglyvalleuphethrasn
675680685
<210>29
<211>498
<212>prt
<213>人工序列
<220>
<223>衍生自组装的序列。
<400>29
aspalalyslysalaleulysileaspthrthrasptyraspvalasp
151015
glnalaalaasnleuileglucysleuseraspgluglntyralalys
202530
glulysmetileleuleuaspgluvallystyralalysglnleuser
354045
glnserargasnleuleuglnasnglyasppheglusersergluile
505560
glytrpgluthrserasnthrilethrileglnalaglyasnleuile
65707580
phelysglylystyrleuasnmetserglyalaargasnileaspgly
859095
alailepheprothrtyralapheglnlysvalaspgluserargleu
100105110
lysprotyrthrargtyrlysvalargglyphevalglyserserlys
115120125
aspvalgluvalvalvalthrargtyrglyglugluvalaspthrile
130135140
metasnvalproasnaspleuthrtyraspvalglyservallysser
145150155160
cysglyglutrpasnargcysgluglnglnprotyrglnasnargasn
165170175
glnvalleuasnasnsermetileilealaasnthrserasnalaser
180185190
asnsercysglutyrvalproglulyslysargvalmetcysproglu
195200205
prohisglnpheserphehisvalaspthrglygluthrasnleuasn
210215220
gluasnleuglyileservalleuphelysileserserproglugly
225230235240
tyralaileleuaspasnilegluleuileglugluglyserleuval
245250255
glygluserleualatyrvalglnasnargglulysargtrplysasn
260265270
lysmetglnalagluargmetgluthrglnglnalatyrasnileala
275280285
lysglnvalvalaspileleuphethraspproglnaspthralaleu
290295300
argphegluthrasnlysserasnileileseralaaspgluleuval
305310315320
glnserileprotyriletyrasnasptrpleuargaspvalprogly
325330335
metasntyrasnmetphethrgluleulysglyargilethrglnala
340345350
tyrtyrleutyraspaspargasnvalleuglnasnglyasppheasn
355360365
asnglyleuthrsertrptyrvalthrglyasnalagluvalglngln
370375380
ileaspglythrphevalleuvalleuglnasntrpserthrthrval
385390395400
serglnasnvalcysleuglnhisasnargglytyrvalleuargval
405410415
thralaarglysgluglymetglyasnglytyrvalthrmetserasp
420425430
cysalaasnhisileglulysileilephethrsercysaspasnasn
435440445
ilevalvalthrserthraspseralaglutyrvalthrargthrval
450455460
serphepheproaspthrasphisvalargilegluileglygluthr
465470475480
gluglythrphelysvalgluservalgluleuilecysmetglugly
485490495
lysglu
<210>30
<211>668
<212>prt
<213>人工序列
<220>
<223>衍生自组装的序列。
<400>30
metasnglntyrasnasnthrasnasngluileileaspalaserthr
151015
lysargserproglntyrproleualaasnasnproglnasnserile
202530
lysthrthrasntyrlysasptrpileasnmetcysgluglyasnala
354045
glualaphepheleuthraspgluglnmetvalserilevalglyala
505560
alaileserlysleuleuglyphevalprovalvalglyaspileleu
65707580
serpheleualaaspthrtyrtrpprolysilealaglyglngluval
859095
aspthrargvaltrpalaglyleuilearghisthralaasnleuile
100105110
aspasnargglualaglulysvalileglyglnalathrthrasnleu
115120125
metserleutyrglyalaleuglyvaltyrasnargpheleuglugln
130135140
trplysglnasnglulysserphealaasnleualaaspgluvalarg
145150155160
thrglnmetseralaleuhisleuleuphethrthrlysileileser
165170175
aspphethrleuhisglytyrgluserileleuleuprosertyrala
180185190
seralaalaasnleuhisleuleuleuleuargaspilealailetyr
195200205
glygluargleuglypheaspprolysvalleuglnalatyrhisasp
210215220
gluglnvalleuphethrargglntyrthralahiscysileasnthr
225230235240
tyrasnleuthrleuasnalaglnlysproargglytrpvalalaphe
245250255
asnglntyrargargaspmetthrleuthrvalleuaspleuileala
260265270
leupheprosertyraspthrhislystyrprovalasplyslysasn
275280285
vallyslysleuserthrthrgluphethrarggluiletyrthrala
290295300
leuilegluproasnproasnlysthrvalgluglymetglualaser
305310315320
leuthrargthrprohisleuphethrtrpilelysargleuaspphe
325330335
tyrthrasnthrleutyrproaspleuargtyrleuseralaasnarg
340345350
ileglyphesertyrthrasnserserthrileglnglnserglyile
355360365
tyrglyaspserglypheglyserasnleuthrhisglnleuproile
370375380
asnproasnilephelysserserilethraspthrargserproser
385390395400
asnglnilethrlysmetaspphetyrlysthraspglythrglnala
405410415
sertyrasnserglyilethrprothrproglyaspleuargthrthr
420425430
phepheglypheserthrasngluasnthrproasnglnproserile
435440445
asnasptyrthrhispheleuthrtyrmetlysthraspvalileser
450455460
glyglyalaprolysargvalserleualatrpalahislysserval
465470475480
asnleuasnasnglnilephethraspaspilethrglnvalproala
485490495
vallysserasnvalleuasnthrglnalalysvalilelysglypro
500505510
glyhisthrglyglyaspleuvalalailethrseraspglyvalleu
515520525
serglyargmetgluileglncyslysalaservalpheasnglupro
530535540
gluargargtyrglyleuargileargtyralaalaasnserileleu
545550555560
thrvalasnalasertyrthrserglnglyasnthrargserilethr
565570575
phethrthrgluserthrphethrglyasnthrileprothraspleu
580585590
lystyrgluasnleulystyrlysglupropheaspalaileleupro
595600605
metargleuthrserasngluleuthrasnilethrileglnprogln
610615620
asnmetserserasnglnleuleuileileaspargileglupheile
625630635640
proilethrserthrvalleuglyaspthrglulysglnasnleuglu
645650655
lysvalglnlysalavalasnaspleuphethrasn
660665
<210>31
<211>478
<212>prt
<213>人工序列
<220>
<223>衍生自组装的序列。
<400>31
thralalysasnalaleulysalagluthrthrasptyrgluileasp
151015
glnthralaasnilevalglucysleuseraspgluhisserthrlys
202530
glulysmetileleuleuaspgluvallystyralalysglnleuser
354045
glnserargasnvalleuglnasnglyaspphegluseraspthrleu
505560
glytrpthrthrserasnasnilethrileglnalaaspasnproile
65707580
phelysglylystyrleuhismetserglyalaargaspileaspgly
859095
servalpheprothrtyriletyrglnlysileaspgluserlysleu
100105110
lysprotyrthrargtyrargvalargglyphevalglyserserlys
115120125
gluleugluleuvalvalserargtyrglyglugluileaspalaile
130135140
metasnvalproasnlysleuvalaspmettyrproproalaserasp
145150155160
cysglyglyleuasnargcysgluileserseralaleugluileasn
165170175
glnvalasptyrthrasnmetsertyrprocysglnasnaspglyasn
180185190
lyslyshisvalleucyshisasparghissertyraspphehisile
195200205
aspthrglyservalaspleuasngluasnileglyiletrpvalleu
210215220
phelysvalserserproaspglytyralathrleuaspasnleuglu
225230235240
valvalglugluargserleuaspglyglualaleualaargvallys
245250255
hisargglulyslystrpilehisglnilegluvallysargtyrglu
260265270
thrglnglnalatyraspalathrlysglnalametaspalaleuphe
275280285
thrasnaspglnaspglualaleuglnpheaspthrthrleualagln
290295300
ileglnhisalaaspaspleuvalglnserileprotyrvaltyrasn
305310315320
glutrpvalproseralaproglymetasntyraspleutyrvalglu
325330335
leuglualaargvalvallysalaargtyrleutyraspthrargasn
340345350
valileargasnglyaspphesergluglyleuglnglytrphisval
355360365
thrglyasnalalysvalglnglnileaspglyvalservalleuval
370375380
leuserasntrpseralaglyvalalaglnasnmettyrvalglnhis
385390395400
asnhisglytyrvalleuargvalthralalyslysgluglyhisgly
405410415
lysglytyrvalthrleumetaspcysaspglyasnglngluthrleu
420425430
thrphethrsercysglugluglytyrvalthrlysthrvalaspval
435440445
pheproaspthraspargvalargvalaspileglygluthrglugly
450455460
prophetyrilegluserilegluleuilecysmetasngly
465470475
<210>32
<211>673
<212>prt
<213>苏云金芽孢杆菌
<400>32
metsermetlysserleuileglnargiletyrleuvalleuleuthr
151015
gluileleuthrileleuaspthrleuleuglnileileargileasn
202530
histyrlysasntrpileasnmetcysglnlysasnglnglntyrgly
354045
gluasnleugluthrphealaseralaaspthrilealaglyvalser
505560
alaglyvalilevalvalglythrmetleuglyalaphealaalapro
65707580
ilethralaglyleuileileserpheglythrleuleuproilephe
859095
trplysproglygluaspprolysthrvaltrpglnalapheleulys
100105110
ileglyasnargpropheserserprovalaspglnalaleuileasp
115120125
leuleuserasnlysalaargserleugluserglnpheasnaspphe
130135140
glnargtyrpheaspiletrpasnasnasnlysthrproglyasnala
145150155160
glygluvalleuargargpheserserleuaspalaaspileilearg
165170175
gluleugluglnleulysglyasntyrtyrilethrvalleuprogly
180185190
tyralaglnvalalaasntrphisleuasnleuleuargilealaala
195200205
phetyrtyraspglntrpalaserserserasnleuserileglnser
210215220
iletyrprogluasptyrileasnaspleuglnthrcysleuthrasn
225230235240
cysalailegluserglyasnlysileserserlystyrtyrlyscys
245250255
valleulyscysargileasnglutyrileasntyrcysserlysthr
260265270
tyrglngluglyleuasnileleulysasnserserglyleulystrp
275280285
asnglutyrasnthrtyrargargglumetthrleuasnvalleuasp
290295300
leuilealavalpheproasntyraspproasplystyrleuileser
305310315320
thrlysserglnleuthrarggluiletyrthraspalaleuileasp
325330335
alaphealaasnalahispheasnileasnaspilegluasnserleu
340345350
thrargproproglyleuvalthrtrpileasnargleuaspphetyr
355360365
thrglymetphethrlysservalproglyleuthralaasnglyile
370375380
asntyrserphethrasnglyasnserasnaspserproiletyrgly
385390395400
tyrargleuseraspaspserserthrproileglnileproargasn
405410415
glntyrvaltyrasnmetleuilethrtyrleuargaspserproser
420425430
valileglnlysileglupheasnleuasnasnglnglnthrargthr
435440445
tyraspthrglyleuthrleualaprothrtyrglnserthrileasn
450455460
leuserleuproglylysaspargserpheproprolyspheasnasn
465470475480
tyrthrhispheleusertyrvallysthralaproglyaspgluarg
485490495
proserserserargalaargasnvalcyspheglytrpmethisphe
500505510
servalasnasptyraspvalleualaglyglytyrasnthrileser
515520525
asnlysileilethrglnileproalavallysalaarghisleupro
530535540
leuproserphevalmetproglyproglyhisthrglyglyasnleu
545550555560
valvalleuserthrglnileglupheglncysilevalleuasnpro
565570575
valsertyrlysileargmetargtyrvalalatyrserproasnarg
580585590
serileasnleuthrvalserileargsergluileglyasntyrgln
595600605
asnilevalproasnileserserthrvalglnserprogluaspthr
610615620
lysasnprolystyrgluhispheglntyrleuaspileserilepro
625630635640
leugluleupheglyilethrasnilethrilethrargseraspser
645650655
ileserasnasnthrleuileileasplysilegluphethrproasp
660665670
val
<210>33
<211>1180
<212>prt
<213>苏云金芽孢杆菌
<400>33
metasnprotyrglnasnlysasnglutyrgluthrleuasnalaser
151015
glnlyslysleuasnileserasnasntyrthrargtyrproileglu
202530
asnserprolysglnleuleuglnserthrasntyrlysasptrpleu
354045
asnmetcysglnglnasnglnglntyrglyglyaspphegluthrphe
505560
ileaspserglygluleuseralatyrthrilevalvalglythrval
65707580
leuthrglypheglyphethrthrproleuglyleualaleuilegly
859095
pheglythrleuileprovalleupheproalaglnaspglnserasn
100105110
thrtrpserasppheilethrglnthrlysasnileilelyslysglu
115120125
ilealaserthrtyrileserasnalaasnlysileleuasnargser
130135140
pheasnvalileserthrtyrhisasnhisleulysthrtrpgluasn
145150155160
asnproasnproglnasnthrglnaspvalargthrglnileglnleu
165170175
valhistyrhispheglnasnvalileprogluleuvalasnsercys
180185190
proproasnproseraspcysasptyrtyrasnileleuvalleuser
195200205
sertyralaglnalaalaasnleuhisleuthrvalleuasnglnala
210215220
vallyspheglualatyrleulysasnasnargglnpheasptyrleu
225230235240
gluproleuprothralaileasptyrtyrprovalleuthrlysala
245250255
ilegluasptyrthrasntyrcysvalthrthrtyrlyslysglyleu
260265270
asnleuilelysthrthrproaspserasnleuaspglyasnileasn
275280285
trpasnthrtyrasnthrtyrargthrlysmetthrthralavalleu
290295300
aspvalvalalaleupheproasntyraspvalglylystyrproile
305310315320
glyvalglnsergluleuthrarggluiletyrglnvalleuasnphe
325330335
glugluserprotyrlystyrtyrasppheglntyrglngluaspser
340345350
leuthrargargprohisleuphethrtrpleuaspserleuasnphe
355360365
tyrglulysalaglnthrthrproasnasnphephethrserhistyr
370375380
asnmetphehistyrthrleuaspasnileserglnlysserserval
385390395400
pheglyasnhisasnvalthrasplysleulysserleuglyleuala
405410415
thrasniletyrilepheleuleuasnvalileserleuaspasnlys
420425430
tyrleuasnasptyrasnasnileserlysmetaspphepheilethr
435440445
asnglythrargleuleuglulysgluleuthralaglyserglygln
450455460
ilethrtyraspvalasnlysasnilepheglyleuproileleulys
465470475480
argarggluasnglnglyasnprothrleupheprothrtyraspasn
485490495
tyrserhisileleuserpheilelysserleuserileproalathr
500505510
tyrlysthrglnvaltyrthrphealatrpthrhisserservalasp
515520525
prolysasnthriletyrthrhisleuthrthrglnileproalaval
530535540
lysalaasnserleuglythralaserlysvalvalglnglyprogly
545550555560
histhrglyglyaspleuileaspphelysasphisphelysilethr
565570575
cysglnhisserasnpheglnglnsertyrpheileargileargtyr
580585590
alaserasnglyseralaasnthrargalavalileasnleuserile
595600605
proglyvalalagluleuglymetalaleuasnprothrphesergly
610615620
thrasptyrthrasnleulystyrlysasppheglntyrleugluphe
625630635640
serasngluvallysphealaproasnglnasnileserleuvalphe
645650655
asnargseraspvaltyrthrasnthrthrvalleuileasplysile
660665670
glupheleuproilethrargserilearggluaspargglulysgln
675680685
lysleugluthrvalglnglnileileasnthrphetyralaasnpro
690695700
ilelysasnthrleuglnsergluleuthrasptyraspileaspgln
705710715720
alaalaasnleuvalglucysileserglugluleutyrprolysglu
725730735
lysmetleuleuleuaspgluvallysasnalalysglnleusergln
740745750
serargasnvalleuglnasnglyaspphegluseralathrleugly
755760765
trpthrthrseraspasnilethrileglngluaspaspproilephe
770775780
lysglyhistyrleuhismetserglyalaargaspileaspglythr
785790795800
ilepheprothrtyrilepheglnlysileaspgluserlysleulys
805810815
protyrthrargtyrleuvalargglyphevalglyserserlysasp
820825830
valgluleuvalvalserargtyrglyglugluileaspalailemet
835840845
asnvalproalaaspleuasntyrleutyrproserthrpheaspcys
850855860
gluglyserasnargcysgluthrseralavalproalaasnilegly
865870875880
asnthrseraspmetleutyrsercysglntyraspthrglylyslys
885890895
hisvalvalcysglnaspserhisglnpheserphethrileaspthr
900905910
glyalaleuaspthrasngluasnileglyvaltrpvalmetphelys
915920925
ileserserproaspglytyralaserleuaspasnleugluvalile
930935940
glugluglyproileaspglyglualaleuserargvallyshismet
945950955960
glulyslystrpasnaspglnmetglualalysargsergluthrgln
965970975
glnalatyraspvalalalysglnalaileaspalaleuphethrasn
980985990
valglnaspglualaleuglnpheaspthrthrleualaglnilegln
99510001005
tyralaglutyrleuvalglnserileprotyrvaltyrasnasp
101010151020
trpleuseraspvalproglymetasntyraspiletyrvalglu
102510301035
leuaspalaargvalalaglnalaargtyrleutyraspilearg
104010451050
asnileilelysasnglyaspphethrglnglyvalmetglytrp
105510601065
hisvalthrglyasnalaaspvalglnglnileaspglyvalser
107010751080
valleuvalleuserasntrpseralaglyvalserglnasnval
108510901095
hisleuglnhisasnhisglytyrvalleuglyvalilealalys
110011051110
lysgluglyproglyasnglytyrvalthrleumetasptrpglu
111511201125
gluasnglnglulysleuthrphethrsercysglugluglytyr
113011351140
ilethrlysthrvalaspvalpheproaspthraspargvalarg
114511501155
ilegluileglygluthrgluglyserphetyrilegluserile
116011651170
gluleuilecysmetasnglu
11751180
<210>34
<211>660
<212>prt
<213>苏云金芽孢杆菌
<400>34
metasnsertyrgluasnlysasnglutyrgluileleuasnaspser
151015
lyslysserasnmetserasnprotyrleuargtyrproleualaasn
202530
aspserleualasermetglnasnthrasntyrlysasptrpleuthr
354045
metcysaspargthraspthraspvalleuserserargglyalaval
505560
serthrglyvalglymetleuserthrileleuserleupheglyile
65707580
proleuileglygluglyileaspleuleuleuglyalaalaaspphe
859095
leutrpprogluseraspglyglyhisglntyrthrtrpgluaspleu
100105110
metasnhisileglugluleumetaspgluargleugluthrglulys
115120125
argthrthralaleuaspaspleuargglyleulysalaleuleugly
130135140
leupheargaspalapheaspsertrpglulysasnglnasnasppro
145150155160
ilealalysasnargvalglyglytyrphegluaspvalhisthrhis
165170175
phevallysaspmetalaserilepheseralathrasntyrgluval
180185190
leuleuleuprovaltyralaglnalaalaasnleuhisleuleuleu
195200205
leuarggluglyvaliletyrglyserargtrpglyilealaproala
210215220
alaaspphetyrhisaspglnleuleulystyrthralailetyrala
225230235240
asnhiscysvalthrtrptyrasnasnglyleualaglnglnlysglu
245250255
leuphealalysserproasntrpasnargpheasnalatyrargarg
260265270
aspmetthrilethrvalleuaspileilealaleupheprothrtyr
275280285
aspalaargleutyrthrlysproilelysthrgluleuthrargglu
290295300
iletyrseraspvalleuasnleuaspvaltyrglyvalglnglnthr
305310315320
aspleuasnlysasnglualaalaphethrargserprohisleuval
325330335
thrargleuargglypheaspphetyrthrargthrlystyralatyr
340345350
trpargtyrleualaglyhisthrasntyrpheserphethrglyasn
355360365
glythriletyrserserserpheasnasntrptyraspthraspmet
370375380
thrlysserthrileasnileproasptyralaasniletyrlysleu
385390395400
trpthrlyssertyrthrasnileserprotyrthraspprovalgly
405410415
ileserglnmetglnpheserleuthrasnasnglnglnleuthrtyr
420425430
thrglythrseralaprolystyrprovalarggluthrphepheglu
435440445
ileproprothraspglulysproleuthrtyrgluasntyrserhis
450455460
ileleusertyrmetthrseralaglnhispheglyasplyslysile
465470475480
glytyrthrphealatrpmethisgluservalasppheaspasnarg
485490495
valaspproasplysilethrglnileproalavallysglyasptyr
500505510
leuglntyrglytyrvallysglnglyproglyhisthrglyglyasp
515520525
leuvalsermetileargthraspargleuglyileasnvaltyrphe
530535540
proglnproleuasptyrargileargileargtyrserthrserser
545550555560
asnglytyrleutyriletyrserproasnthrlysilevaltyrleu
565570575
proprothrthrleuvalaspglyglnprothrpheaspprometasp
580585590
pheseralapheargvalvalgluvalproalaserpheargalaser
595600605
valalaglytyrthrasnphethrileglualaglypheglyproval
610615620
tyrileasplysileglupheileproaspasnthrthrthrleuglu
625630635640
tyrgluglyglyargaspleuglulysthrlysasnalavalasnasp
645650655
leuphethrasn
660
<210>35
<211>1192
<212>prt
<213>苏云金芽孢杆菌
<400>35
metaspsertyrhisasnlysasngluaspglumetleuasnalaser
151015
leuasnglnserasnmetaspasnargtyrproleualaasntyrpro
202530
asnlysserleuglnasnthrasntyrlysasptrpleuthrmetcys
354045
gluglythrprovalvalphealaserglualaglnalaphelysval
505560
leuglyalathrilealaargvalleuglyleuileproalavalgly
65707580
proleuleuserserleuvalserilephetrpprothrleuglnthr
859095
proasnthriletrpglnaspmetmetlystyrvalalaaspleuile
100105110
argglngluleuthrthrtyrthrileasnglnalathrargasnleu
115120125
thrglyleutyrgluserleuasniletyrasnargalaleualaala
130135140
trplysileasnlysasnhisphealaseralagluleuvalarggly
145150155160
tyrileasnaspleuhisileargpheglyalaaspileglnalaasp
165170175
phethrleulysglytyrgluthrileleuleuprosertyralaser
180185190
alaalaasnleuhisleuleuleuleuargaspileservaltyrgly
195200205
lysgluleuglytyrserglnglnaspleuaspphetyrtyrglyglu
210215220
glnlyshistyrthrgluargtyrserasnhiscysvalasnlystyr
225230235240
asnalaglyleuasnleuglulysglnlysglytrpserserpheasn
245250255
argtyrargargaspmetthrleuleuvalleuaspleuvalalaleu
260265270
pheproleutyraspleuargiletyrproserlysaspaspasnile
275280285
asnvallyssergluleuthrarggluiletyrseraspvalileasn
290295300
alahisvaltyrleuvalleuasngluaspmetalatyrphealagln
305310315320
alaglualaleutyrthrargglnprohisleuphethrtrpleuarg
325330335
glypheargphevalthrasnserilesersertrpthrpheleuser
340345350
glyserglnasnlystyrsertyrthrasnasnasnserilepheasn
355360365
glyprophetyrglyglnaspthrglutyrglyglythrserserasn
370375380
metaspilealagluglysertyriletyrglnleutrpthrlysasn
385390395400
tyrglutyriletyrprotrpleuaspprovalasnilethrlysile
405410415
asnpheservalthraspasnasnpheserlysgluvalthrtyrgly
420425430
glygluargileasnileprothrvalargthrasppheasppheleu
435440445
ilelyslysaspglythrglyleualathrhisasnasntyrserhis
450455460
ileleuserserileleuthrasnglyserthralaglyglnlyslys
465470475480
hisglytyrserphealaphethrhisserservalaspglnlysasn
485490495
serleuserpheasplysilethrglnileproalavallysserser
500505510
asptrpleuphetyrglyasnleuleulysglyproglyhisthrgly
515520525
glyaspleuvalpheleuaspasnglyasnasnpheasnvalargval
530535540
asnpheprovalglnsertyrargvalargileargtyralaalaasp
545550555560
glyasnglyglumetalaileservalaspglythrleutyrthrpro
565570575
pheasnvalgluargthrpheserasnasnasntyrasnaspleulys
580585590
phegluaspphelysvalileaspthrproleuiletyrasnalaser
595600605
tyrgluglyalalysserilepheleutyrasnasnserasnlysarg
610615620
valileileasplysileglupheileproileglylysseralaleu
625630635640
glutyrgluserlysglnasnleugluglnalaglnlysalavalasn
645650655
aspleuphethrasnaspthrlysasnmetleulysthraspthrthr
660665670
asptyrglnileaspglnvalvalasntrpvalaspcysvalserglu
675680685
gluleutyrvallysglulysmetileleuargaspgluilelystyr
690695700
alalysglnglnserleuserargasnleuleuglnasnglyaspphe
705710715720
gluaspthrserlysglytrpthrthrserasnthrilethrilegln
725730735
alaaspasnproilephelysglyhistyrleuasnmetserglyala
740745750
arggluileaspglythrilepheprothrtyriletyrglnlysile
755760765
aspgluserlysleulysprotyrthrargtyrglnvalargglyphe
770775780
valglyserserlysglyleugluphevalvalthrargtyrglylys
785790795800
gluthraspalailemetasnvalproasnasptrpprotyrilegln
805810815
proasnsersercysglyasptyrhisargcysaspthrserserglu
820825830
provalmettyrglnglytyrprothrproleuprogluglytyrala
835840845
proaspleuglyleuleucysglnasnserleuglylyslyshisval
850855860
valcyshisasparghisglnpheaspphehisilethrthrglyglu
865870875880
leuaspileasnthrasnleuglyileglnvalleuphelysileser
885890895
serproaspglytyralathrleuasnasnleugluvalilegluglu
900905910
glyproleuserglygluserleugluargvallyshisargglulys
915920925
lystrplysglnasnmetglualalysargleugluthrglnglnala
930935940
tyrasnalaalalysglnvalvalaspserleuphethrasnalalys
945950955960
aspgluserleuargpheaspthrthrleuthrhisilemetasnala
965970975
gluhistrpvalglnserileprotyrvalaspasnalatrpserser
980985990
aspileproglythrserasnaspleutyrvalgluleuglualaarg
99510001005
leualaglnalaargtyrleutyraspalaglnasnvalilethr
101010151020
asnglyasnphethrglnglyleumetglytrphisalathrarg
102510301035
aspvalgluvalglnglnmetasnglyalaservalleuvalleu
104010451050
serasntrpseralaglyalaserglnasnvalhisalaglnhis
105510601065
hisglnglytyrvalleuargvalilealaarglysgluglythr
107010751080
glylysglytyrvalthrmetmetaspcysasnasnasnglnglu
108510901095
thrleuthrphethrsercysglugluglytyrilethrlysthr
110011051110
valgluvalpheproaspthraspservalargilegluilegly
111511201125
gluthrgluglyserphetyrilegluserilegluleuasncys
113011351140
metlysglytyrtyraspglnlysseraspseriletyraspgln
114511501155
glytyrasnasnasntyrasnglnasnserserasnmethisasn
116011651170
glnglytyrlysasnasntyrasnglnasnglyserseralalys
117511801185
pheleulysarg
1190
<210>36
<211>679
<212>prt
<213>苏云金芽孢杆菌
<400>36
metasnsertyrglnasnthrasnglutyrgluileleuaspalaser
151015
prosertyrserasnmetthrasnsertyrproargtyrproleuala
202530
asnasnargglnglysermetlysasnthrasntyrlysasptrpleu
354045
alametcysgluglyasnvalgluglyleupheleuthraspglugln
505560
metvalserilevalglyalaalaileserlysleuleuglypheval
65707580
provalvalglyaspileleuserserleualaaspthrtyrtrppro
859095
lysilealaglyglnglualaaspthrargvaltrpalaglyleuile
100105110
arghisthralaasnleuileaspasnargaspvalaspargvalile
115120125
glyglnalathralaasnvalmetserleutyralaalaleuglyval
130135140
tyrasnargpheleugluglntrplysserprovallysprotyrala
145150155160
glyleualaaspgluileargalaglnmetserthrleuhisleuleu
165170175
phethrthrlysileileseraspphethrileglnglytyrgluala
180185190
ileleuleuprosertyralaasnalaalaserleuhisleuleuleu
195200205
leuargaspileseriletyrglyglulysleuglypheaspserlys
210215220
thrleuglnalatyrhisasngluglnvallysphethrthrasptyr
225230235240
thralahiscysilelysthrtyrasnleuasnleuasnalaglnlys
245250255
serlysglytrpvalalapheasnglntyrargargaspmetthrleu
260265270
thrvalleuaspleuilealaleupheprosertyraspthrhisarg
275280285
tyrproalaaspglulysasnvallyslysleuserasnthrgluleu
290295300
thrarggluiletyrthralaleuthrgluserserproserlysthr
305310315320
valglualametglugluserleuthrargglyprohisleuphethr
325330335
trpprolysargleuaspphetrpthrpheasntyrasnmettyrpro
340345350
aspthrargtyrleuseralaasnargileglyphesertyrthrasn
355360365
sersergluilegluaspserglyiletyrglyserprothrphegly
370375380
thrvalleuthrhisglnileproleuasnserasnvaltyrargthr
385390395400
serilethraspthrthralavalproasnglnvalthrlysmetasp
405410415
phetyrlysileaspglythrasnalasertyrasnserasnilethr
420425430
provalproalaasnleuargthrthrphepheglypheserserasp
435440445
alaasnargproproasnglnprothrvalglnasptyrasnasnile
450455460
leusertyrilelysthraspileileglyglyhisglnalaargval
465470475480
serphealatrpthrhislysglyvalasnproasnasnglnileleu
485490495
thraspasnvalthrglnvalproalavallysserserleuleuasn
500505510
alaproalaargvalilelysglyproglyhisthrglyglyaspleu
515520525
valalaleuleuasnasnglythrglnalaglythrmetglnilegln
530535540
cyslysthrglyserphethrgluthrserargargtyrglyilearg
545550555560
metargtyralaalaasnasnalaphethrvalserleusertyrthr
565570575
leuglnglyglyasnproileglyilethrpheglythrgluargthr
580585590
pheserargthrasnasnileileprothraspleulystyrgluglu
595600605
phelystyrlysglutyrasnglnileilethrmetasnserprogln
610615620
asnthrilevalthrileaspileargglnleuasnproserserasn
625630635640
aspglnleuileileaspargileglupheileproilethrglnser
645650655
valleuasptyrthrglugluglnasnleugluthralaglnalaval
660665670
valaspasnleuphethrasn
675
<210>37
<211>1136
<212>prt
<213>苏云金芽孢杆菌
<400>37
metasnserglytyrproleualaasnaspleuglnglysermetlys
151015
asnthrasntyrlysasptrpleualametcysgluasnasnglngln
202530
tyrglyvalasnproalaalaileasnserserservalserthrala
354045
leulysvalalaglyalaileleulysphevalasnproproalagly
505560
thrvalleuthrvalleuseralavalleuproileleutrpprothr
65707580
asnthrprothrprogluargvaltrpasnaspphemetthrasnthr
859095
glyasnleuileaspglnthrvalthralatyrvalargthraspala
100105110
asnalalysmetthrvalvallysasptyrleuaspglntyrthrthr
115120125
lyspheasnthrtrplysarggluproasnasnglnsertyrargthr
130135140
alavalilethrglnpheasnleuthrseralalysleuarggluthr
145150155160
alavaltyrpheserasnleuvalglytyrgluleuleuleuleupro
165170175
iletyralaglnvalalaasnpheasnleuleuleuileargaspgly
180185190
leuileasnalaglnglutrpserleualaargseralaglyaspgln
195200205
leutyrasnthrmetvalglntyrthrlysglutyrilealahisser
210215220
ilethrtrptyrasnlysglyleuaspvalleuargasnlysserasn
225230235240
glyglntrpilethrpheasnasptyrlysargglumetthrilegln
245250255
valleuaspileleualaleuphealasertyraspproargargtyr
260265270
proalaasplysileaspasnthrlysleuserlysthrgluphethr
275280285
arggluiletyrthralaleuvalgluserproserserlysserile
290295300
alaalaleuglualaalaleuthrargaspvalhisleuphethrtrp
305310315320
leulysargvalaspphetrpthrasnthriletyrglnaspleuarg
325330335
pheleuseralaasnlysileglyphesertyrthrasnserserala
340345350
metglngluserglyiletyrglyserserglypheglyserasnleu
355360365
thrhisglnileglnleuasnserasnvaltyrlysthrserilethr
370375380
aspthrserserproserasnargvalthrlysmetaspphetyrlys
385390395400
ileaspglythrleualasertyrasnserasnilethrprothrpro
405410415
gluglyleuargthrthrphepheglypheserthrasngluasnthr
420425430
proasnglnprothrvalasnasptyrthrhisileleusertyrile
435440445
lysthraspvalileasptyrasnserasnargvalserphealatrp
450455460
thrhislysilevalaspproasnasnglniletyrthraspalaile
465470475480
thrglnvalproalavallysserasnpheleuasnalathralalys
485490495
valilelysglyproglyhisthrglyglyaspleuvalalaleuthr
500505510
serasnglythrleuserglyargmetgluileglncyslysthrser
515520525
ilepheasnaspprothrargsertyrglyleuargileargtyrala
530535540
alaasnserproilevalleuasnvalsertyrvalleuglnglyval
545550555560
serargglythrthrileserthrgluserthrpheserargproasn
565570575
asnileileprothraspleulystyrgluglupheargtyrlysasp
580585590
propheaspalailevalprometargleuserserasnglnleuile
595600605
thrilealaileglnproleuasnmetthrserasnasnglnvalile
610615620
ileaspargilegluileileproilethrglnservalleuaspglu
625630635640
thrgluasnglnasnleuglusergluarggluvalvalasnalaleu
645650655
phethrasnaspalalysaspalaleuasnileglythrthrasptyr
660665670
aspileaspglnalaalaasnleuvalglucysileserglugluleu
675680685
tyrprolysglulysmetleuleuleuaspgluvallysasnalalys
690695700
glnleuserglnserargasnvalleuglnasnglyaspphegluser
705710715720
alathrleuglytrpthrthrseraspasnilethrileglngluasp
725730735
aspproilephelysglyhistyrleuhismetserglyalaargasp
740745750
ileaspglythrilepheprothrtyrilepheglnlysileaspglu
755760765
serlysleulysprotyrthrargtyrleuvalargglyphevalgly
770775780
serserlysaspvalgluleuvalvalserargtyrglyglugluile
785790795800
aspalailemetasnvalproalaaspleuasntyrleutyrproser
805810815
thrpheaspcysgluglyserasnargcysgluthrseralavalpro
820825830
alaasnileglyasnthrseraspmetleutyrsercysglntyrasp
835840845
thrglylyslyshisvalvalcysglnaspserhisglnpheserphe
850855860
thrileaspthrglyalaleuaspthrasngluasnileglyvaltrp
865870875880
valmetphelysileserserproaspglytyralaserleuaspasn
885890895
leugluvalileglugluglyproileaspglyglualaleuserarg
900905910
vallyshismetglulyslystrpasnaspglnmetglualalysarg
915920925
sergluthrglnglnalatyraspvalalalysglnalaileaspala
930935940
leuphethrasnvalglnaspglualaleuglnpheaspthrthrleu
945950955960
alaglnileglntyralaglutyrleuvalglnserileprotyrval
965970975
tyrasnasptrpleuseraspvalproglymetasntyraspiletyr
980985990
valgluleuaspalaargvalalaglnalaargtyrleutyraspthr
99510001005
argasnileilelysasnglyaspphethrglnglyvalmetgly
101010151020
trphisvalthrglyasnalaaspvalglnglnileaspglyval
102510301035
servalleuvalleuserasntrpseralaglyvalserglnasn
104010451050
valhisleuglnhisasnhisglytyrvalleuargvalileala
105510601065
lyslysgluglyproglyasnglytyrvalthrleumetaspcys
107010751080
glugluasnglnglulysleuthrphethrsercysgluglugly
108510901095
tyrilethrlysthrvalaspvalpheproaspthraspargval
110011051110
argilegluileglygluthrgluglyserphetyrilegluser
111511201125
ilegluleuilecysmetasnglu
11301135