可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸的制作方法

文档序号：449951阅读：1117来源：国知局

专利名称：可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸的制作方法
相关申请的交互参照本申请要求2002年6月28日申请的临时申请序列号60/392,633及2003年1月21日申请的临时申请序列号60/441,647的优先权。
背景技术：
昆虫和其它害虫在农作物损失及在控制这些害虫的花费上使农民每年损失数十亿美圆。虫害在农业生产环境中引起的损失包括农作物产量下降、农作物质量降低及收获成本升高。虫害也是菜农和果农的负担，也是观赏花的生产者及家庭园丁及家庭物主的负担。
耕作方法，如轮作法及应用高水平氮肥，部分解决了农业害虫引起的问题。然而，应用农田的经济需求限制了轮作法的应用。此外，一些昆虫的越冬特性破坏了在一些地区运用轮作法。
因此，最大程度依赖合成化学杀虫剂以达到足够水平的控制。然而，应用合成化学杀虫剂有几个缺点。例如，应用这些化学剂中的一些可对许多有益昆虫造成有害影响。靶昆虫对一些化学杀虫剂也发展了抗性。这已通过多种抵抗管理策略得到部分减轻，但对备选害虫控制剂有增加的需求。而且，非常多的幼虫、大雨及杀虫应用设备的标度不适当可导致控制失败。不适当应用杀虫剂引起环境忧虑如污染土壤及地表和地下供水系统。残留物也存在于经处理的水果、蔬菜及其它经处理植物上。操作一些杀虫剂也可对应用杀虫剂的人造成危害。因此，合成化学杀虫剂由于它们的潜在毒性环境后果受到越来越多的仔细审查。应用杀虫剂的严格新限制及从市场上去除一些有效杀虫剂对控制损害及费用大的害虫可对经济的和有效的选择产生限制。
由于与应用合成化学杀虫剂相关的问题，明确需要限制这些试剂的应用及需要确定备选控制剂。替代合成化学杀虫剂或将这些试剂与生物学杀虫剂组合可降低环境中毒性化学剂的水平。
现在正在应用的，已取得一些成功的一些生物学杀虫剂来源自土壤微生物苏云金芽孢杆菌(Bacillus thuringiensis)(B.t.)。土壤微生物苏云金芽孢杆菌(B.t.)为革兰氏阳性的产孢子细菌。B.t.的大多数菌株不表现杀虫活性。一些B.t.菌株产生并以形成伴胞晶体蛋白质包含体为特征。这些包含体在显微镜下常常呈现为特定形状的晶体。一些B.t.蛋白质对害虫如昆虫有高度毒性，并且它们的毒性活性是特异的。某些杀虫B.t.蛋白质与包含体相关。这些 “δ-内毒素”与有非特异宿主范围的外毒素不同。其它种的芽孢杆菌也产生杀虫蛋白质。
已对某些芽孢杆菌毒素基因进行了分离并测序，并产生了基于重组DNA的产物，且已批准应用。此外，随着基因工程技术的应用，多种向农业环境中递送这些毒素的方法正在完善。这些包括将针对昆虫抗性的毒素基因进行基因改造的植物及应用经稳定的完整微生物细胞作为毒素递送载体。因此，经分离的芽孢杆菌毒素基因正成为商业上有价值的物质。
B.t.杀虫剂的商业用途最初局限于靶向鳞翅目(毛虫)害虫的狭窄范围。苏云金芽孢杆菌库尔斯塔克(Kurstaki)亚种的芽孢和晶体制剂作为对鳞翅目害虫的商品化杀虫剂已应用多年。例如苏云金芽孢杆菌库尔斯塔克HD-1变种产生对许多鳞翅目昆虫有毒性的晶体δ-内毒素。
最近，已鉴定了B.t.的新亚种，并已分离了负责活性δ-内毒素蛋白质的基因。H_fte和Whiteley将B.t.晶体蛋白质基因分为四个主要类型(H_fte，H.，H.R.Whiteley Microbiological Reviews 52(2)242-255)。所述类型为CryI(鳞翅目特异)，CryII(鳞翅目及双翅目特异)，CryIII(鞘翅目特异)及CryIV(双翅目特异)。已报导发现对其它害虫有特异毒性的种。例如，提议将CryV和CryVI作为线虫特异的毒素基因类型。
鳞翅目特异CryI晶体蛋白质，在它们的天然状态下，为大约130-至140-kDa的蛋白质，此蛋白质是在苏云金芽孢杆菌芽孢形成期间在双锥体晶体包含体中积累。这些蛋白质为在昆虫中肠的碱性环境中稳定的原毒素(protoxin)，通过晶体相关或幼虫中肠蛋白酶的蛋白水解转换成60至70kDa的毒性核心片段。该活化也可在体外用多种蛋白酶实现。毒性结构域位于原毒素的N-末端部分。这是对CryIA(b)及CryIC蛋白质通过对经胰蛋白酶活化毒素的N-末端氨基酸序列进行测定证实的。Hofte等人，1989。切割发生在称为“第5区块(Block 5)”保守区的C-末端，因此形成核心毒素的C-末端。短的N-末端原毒素节段也可进行加工去除。N-末端切割位点对CryIA及CryID蛋白质也高度保守，表明对于这些蛋白质，毒素片段的N末端位于同一位置。然而，在这个区域，CryIB与其它CryI蛋白质不同。该蛋白质是否也在N末端进行加工是未知的。H_fte等人1989。
几种cryI基因的缺失分析进一步证实原毒素的3’部分对毒素活性是不需要的。报导的最短毒性片段之一位于CryIAb的密码子29和607之间。进一步从3’末端去除四个密码子或从5’末端去除八个密码子使基因产物的毒素活性完全丧失。对cryIA(a)及cryIA(c)基因观察到同样现象。H_fte等人，1989。
cryII基因编码几株亚种菌株中形成立方型包含体的65-kDa蛋白质。以前将这些晶体蛋白质命名为“P2”蛋白质，以与存在于同一菌株中的130-kDa Pl晶体蛋白质进行区分。H_fte等人1989。
cryIIA基因克隆自苏云金芽孢杆菌库尔斯塔克HD-263亚种并在巨大芽孢杆菌(Bacillus megaterium)中进行表达。产生CryIIA蛋白质的细胞对鳞翅目中的烟芽夜蛾(Heliothis virescens)和舞毒蛾(Lymantriadispar)，并且对双翅目埃及伊蚊(Aedes aegypti)的幼虫有毒性。Widner和Whitely (1989，J.Bacteriol.171965-974)从苏云金芽孢杆菌库尔斯塔克HD-1亚种克隆了两个相关基因(cryIIA及cryIIB)。两个基因均编码预计分子量为71kDa的633个氨基酸(比苏云金芽孢杆菌产生的P2蛋白质确定的表观分子量稍大)。虽然CryIIA和CryIIB蛋白质有高度同源性(约87％氨基酸同一性)，它们在杀虫谱上不同。CryIIA对鳞翅目(烟草天蛾(Manduca Sexta))和双翅目(埃及伊蚊)物种均有活性，而cryIIB只对鳞翅目昆虫有毒性。H_fte等人，1989。将CryII毒素作为一组，在序列水平上比其它组相对更保守(＞80％同一性)。相反，有很多例如，包括一些低于60％同一性的CryI毒素。
H_fte和Whiteley 1989年对晶体蛋白质的命名与分类方案均是建立在毒素的推导氨基酸序列和宿主范围的基础上。该系统编辑为涵盖分为五个主要类的14个不同型的毒素基因。由于发现越来越多的编码有多种杀虫活性谱的蛋白质基因，1989年的命名方案变的不再适用。因此，采用了只建立在氨基酸同一性基础上的经修订命名方案(Crickmore等人，1998，Microbiology and Molecular Biology Reviews 62807-813)。除了仍为单独类型的cytA及cytB外，对于所有毒素基因保留了有助于记忆的“cry”。第一位的罗马数字换成阿拉伯数字，将第三位的括号去除。虽然对许多进行了重新分类，但除了所指出的例外外，仍保留了许多最初的名称。现在至少有37个最初类别的Cry蛋白质及两个最初类别的cyt毒素。从苏云金芽孢杆菌中也发现了其它型的毒素，如WO98/18932及WO97/40162中所述的毒素。
将芽孢杆菌(和其它生物学)杀虫蛋白质成功用于农业有一些障碍。某些昆虫对芽孢杆菌毒素的作用有抗性。昆虫如棉子象鼻虫(boll weevils)、黑切根虫(black cutworm)及谷实夜蛾(Helicoverpa zea)以及大多数物种的成虫，迄今已证实对许多B.t.-δ内毒素没有明显敏感性。
另一个潜在障碍是昆虫对B.t.毒素的抗性发展。B.t.蛋白质毒素最初作为可喷洒的昆虫控制剂进行配制。更最近B.t.技术的应用是分离编码这些毒素的基因并转化植物。随后转基因植物产生毒素，因此提供昆虫控制。参见Mycogen公司的美国专利号5,380,831；5,567,600及5,567,862。转基因B.t.植物是非常有效的并且预计在一些农作物及一些地区应用率很高。这引起一些忧虑即抗性控制问题比传统可喷雾应用增加的更快。虽然已将许多昆虫对B.t.毒素的抗性在实验室中进行了筛选，只有菱形斑纹蛾(Plutella xylostella)在田间证实有抗性(Ferre，J.和Van Rie，J.，Annu.Rev.Etitoinol.47501-533，2002)。
转基因植物技术中的抗性控制策略极令人感兴趣(例如，如在天然细菌中，多种不同毒素可暴露在同一植物上，因此大大降低了对一种毒素有抗性的昆虫存活而散布抗性的机会)。已提议了几种用于保留有效应用苏云金芽孢杆菌毒素能力的策略。这些策略包括使用高剂量的权宜之计，以及备选或共应用不同毒素(McGaughey等人，(1998)，“B.t.抗性控制”，Nature Biotechnol 16144-146)。
因此，非常需要研发在植物中表达的其它基因以有效控制多种昆虫。除继续尝试发现新B.t.毒素外，非常希望发现能产生在用于转基因植物策略中应用的毒素或能与B.t.组合产生昆虫控制的转基因植物的其它细菌源(不同于B.t.)。
从细菌光杆状菌属/致病杆菌属(Photorhabdus/Xenorhabdus)中克隆杀虫毒素基因的最近努力提出了来自苏云金芽孢杆菌毒素的潜在备选物。细菌致病杆菌种与斯氏线虫(Steinernema)共生相关是本领域已知的。不幸地是，如在许多文章中报导的，细菌只在注射到昆虫幼虫时有杀虫活性，而经口递送时不表现生物学活性。
有效的开发线虫或其细菌共生生物的杀虫特性是困难的。因此，非常需要从有口腔活性的致病杆菌细菌中发现蛋白质因子以使产生自所述细菌的产物可作为可喷雾杀虫剂进行制备，或可将编码所述蛋白质因子的细菌基因进行分离并在产生转基因植物中应用。WO95/00647涉及用致病杆菌蛋白毒素控制昆虫，但它不为经口活性毒素。WO98/08388涉及来自致病杆菌的经口施用杀虫剂。美国专利号6,048,838涉及获得自致病杆菌种及菌株的有口腔活性的蛋白质毒素/毒素复合体。
光杆状菌及致病杆菌种是与土壤线虫在昆虫病原学上相关并为共生相关的革兰氏阴性细菌。这些细菌在侵袭并杀死昆虫的昆虫病原性线虫的肠中发现。当线虫侵袭昆虫宿主时，将细菌释放到昆虫血腔(开放循环系统)中，细菌和线虫均进行多轮复制；昆虫宿主一般死亡。这些细菌可在它们的线虫宿主外进行培养。对这些细菌的更详细的讨论，参见Forst和Nealson，60 Microbiol.Rev.1(1996)，第21-43页。
将致病杆菌属分类定义为肠杆菌科成员，但它有不属于这个科的某些特性。例如，该属的菌株一般为硝酸盐还原阴性及过氧化氢酶阴性。只是最近将致病杆菌进行再分类以产生第二个属，即光杆状菌属，其中包含一种发光光杆状菌(Photorhabdus luminescens)(以前称为发光致病杆菌(Xenorhabdus luminescens))(Boemare等人，1993 Int.J.Syst.Bacteriol.43，249-255)。此差异是建立在熟练技术人员易于鉴定的几个有区别特征的基础上的。所述差异包括下列差异DNA-DNA特征研究；过氧化氢活性的表型存在(光杆状菌)或缺失(致病杆菌)；生物发光存在(光杆状菌)或缺失(致病杆菌)；线虫宿主家族的不同，因为在斯氏线虫(Steinernematidae)中发现致病杆菌，而在异小杆线虫(Heterorhabditidae)中发现光杆状菌)；以及比较性进行的细胞脂肪酸分析(Janse等人，1990，Lett.Appl.Microbiol.10，131-135；Suzuki等人，1990，J.Gen.Appl.Microbiol.，36，393-401)。此外，最近集中于16S rRNA基因的序列(Rainey等人，1995，Int.J.Syst.Bacteriol.，45，379-381)及限制性分析(Brunel等人，1997，App.Environ.Micro.，63，574-580)的分子研究也支持这两个属的分开。
致病杆菌的预期性状如下为革兰氏染色阴性的杆菌，白色至黄色/棕色菌落着色，存在包含体，不存在过氧化氢酶，不能还原硝酸盐，不存在生物发光，能从培养基中摄取染料，明胶水解阳性，在肠杆菌科选择培养基上生长，生长温度低于37℃，在厌氧条件下存活及有运动性。
现在，细菌致病杆菌属由四个公认种组成，嗜线虫致病杆菌(Xenorhabdus nematophilus)，波氏致病杆菌(Xenorhabdus poinarii)，博氏致病杆菌(Xenorhabdus bovienii)以及贝氏致病杆菌(Xenorhabdusbeddingii)(Brunel等人，1997，App.Environ.Micro.，63，574-580)。在文献中对多个相关菌株进行了描述(例如，Akhurst和Boemare 1988 J.Gen.Microbiol.，134，1835-1845；Boemare等人，1993 Int.J.Syst.Bacteriol.43，第249-255页；Putz等人，1990，Appl.Environ.Microbiol.，56，181-186，Brunel等人，1997，App.Environ.Micro.，63，574-580，Rainey等人，1995，Int.J.Syst.Bacteriol.，45，379-381)。
致病杆菌及光杆状菌细菌向培养基中分泌多种物质；这些分泌物包括脂酶、蛋白酶、抗生素及脂多糖。对不同蛋白酶级分的纯化清楚证实了它们与发光光杆状菌培养基(随后确定该培养基只存在Tc蛋白质)的经口毒性活性无关。这些物质中的几种以前就与昆虫毒性有关但直到最近还没有对杀虫基因进行克隆。然而，蛋白酶的纯化及分离也有助于检查它们在例如，抑制抗细菌蛋白质如杀菌肽中的推定作用。R.H.ffrench-Constant和Bowen，Current Opinions in Micriobiology，1999，12284-288。参见R.H.ffrench-Constant等，66 AEM No.8，第3310-3329页(2000年8月)，与光杆状菌昆虫毒力有关的多种因素的综述。
对编码来自发光光杆状菌及嗜线虫致病杆菌这两者的杀虫毒素基因进行克隆已取得很大进展。来自发光光杆状菌的毒素复合体编码基因最先得以检验。参见，例如WO98/08932。“平行”基因是最近从嗜线虫致病杆菌克隆的。Morgan等人，Applied and Environmental Microbiology 2001，672062-69。
在光杆状菌种中已鉴定四个不同的毒素复合体(TC)-Tca，Tcb，Tcc及Tcd。这些毒素复合体中每种在天然琼脂糖凝胶上可作为单体或二聚体，但在变性凝胶上的分辨率显示每种复合物由25-280kDa范围的分子组成。来自光杆状菌的编码TC的ORF以及蛋白酶切割位点(垂直箭头)在

图1中显示。也参见R.H.ffrench-Constant和Bowen，57 Cell.Mol.Life Sci.828-833(2000)。
将发光光杆状菌的基因文库用DNA探针及用针对毒素的单克隆和/或多克隆抗体进行了筛选。对四个tc基因座tca，tcb，tcc及tcd进行了克隆。Tca基因座为从同一DNA链转录的三个可读框(ORF)tcaA、tcaB和tcaC，以及一个从相反方向转录的小末端ORF(tcaZ)的推定操纵子。tcc基因座也由推定从同一方向(tccA，tccB及tccC)转录的三个ORF组成。tcb基因座为一个大ORF(tcbA)，且tcd基因座由两个ORF(tcdA及tcdB)组成，tcbA及tcdA，每个大约7.5kb，编码大昆虫毒素。TcdB与TcaC有一些同源性。经确定这些基因的许多产物是由蛋白酶进行切割的。例如，TcbA及TcdA均被切割成三个称为i、ii、iii(例如，TcbAi，TcbAii及TcbAiii)片段。也将tca及tcc ORF的产物进行切割。参见图1。也参见R.H.ffrench-Constant和D.J.Bowen，Current Opinions in Microbiology，1999，12284-288。
Tca毒素复合体的生物测试显示经口服用时，它们对第一龄期烟草天蛾(tobacco hornworm)有高度毒性(LD50为每平方厘米人工饮食875ng)。R.H.ffrench-Constant和Bowen 1999。Tca剂量低至40ng/cm2停止摄食。鉴于Tca的在摩尔基础上的高预计分子量，发光光杆状菌毒素为高活性并且显示需要相对少量分子发挥毒性作用。R.H.ffrench-Constant和Bowen，Current Opinions in Micriobiology，1999，12284-288。
显示这四个基因座无一与基因库中已知功能的任何序列具有总体上的相似性。序列相似性区域暗示这些蛋白质(TcaC及TccA)可通过攻击昆虫血细胞克服昆虫免疫力。R.H.ffrench-Constant和Bowen，CurrentOpinions in Microbiology，1999，12284-288。
将TcaB，TcbA及TcdA进行相互比较，在它们预测的蛋白酶切割位点附近，均显示氨基酸保守性(～50％同一性)。三个不同TC蛋白质间的此保守性表明它们都可通过相同或相似的蛋白酶进行加工。TcbA和TcdA总体也有～50％的同一性，并且在羧基及氨基末端的切割中有相似的预定模式。可以推定这些蛋白质为相互的同系物。此外，TcbA及TcdA相似的大小，以及这两种毒素均显示作用于昆虫肠的事实，可表明相似的作用方式。R.H.ffrench-Constant和Bowen，Current Opinions in Microbiology，1999，12284-288。
缺失/敲除研究表明tca及tcd基因座的产物引起了对鳞翅目的大多数口服毒性。缺失tca或tcd基因大大降低了对烟草天蛾的口服毒性。即tca及tcd基因座产物自身为口服鳞翅目毒素；它们组合作用对大部分分泌的口服活性有贡献。R.H.ffrench-Constant和D.J.Bowen，57 Cell.Mol.Life.Sci.831(2000)。令人感兴趣的是，单独缺失tcb或tcc基因座也降低死亡率，表明不同基因产物有复合相互作用。因此，tca基因座的产物可增强tcd产物的毒性。备选地，tcd产物可调节tca产物及可能其它复合物的毒性。注意以上涉及针对单一昆虫物种的口服毒性，tcb或tcc基因座可产生对其它组昆虫活性更强的毒素(或通过直接注射到昆虫血腔有活性—这是通过细菌体内分泌时递送的正常途径)。R.H.ffrench-Constant和Bowen，Current Opinions in Microbiology，1999，12284-288。
WO01/11029公开了编码TcdA及TcbA的核苷酸序列，并且其具有对天然基因已进行改变的碱基组成以使它们与植物基因更相似。也公开了表达毒素A及毒素B的转基因植物。
在分离自发光光杆状菌(W-14)的分离毒素中，对命名为毒素A及毒素B的毒素集中研究了它们对靶目的昆虫物种(例如，玉米根虫)的活性。毒素A包含两个不同亚单位。天然基因tcdA编码原毒素TcdA。如通过质谱测定法确定的，TcdA通过一种或多种蛋白酶进行加工以提供毒素A。更具体地，TcdA为大约282.9kDa蛋白质(2516个氨基酸)，所述282.9kDa蛋白质进行加工以提供TcdAi(最初的88个氨基酸)，TcdAii(接下来的1849个氨基酸；由tcdA核苷酸265-5811编码的大约208.2kDa蛋白质)及大约63.5kDa(579个氨基酸)蛋白质(由tcdA核苷酸5812-7551编码)的TcdAiii。显示TcdAii及TcdAiii装配成二聚体(可能通过TcdAi的帮助)，并且二聚体装配成四个二聚体的四聚体。毒素B同样来自TcbA。
由于现在对TC蛋白质相互的确切分子相互作用及它们的作用机制还不了解，例如，已知光杆状菌的Tca毒素复合体对烟草天蛾有毒性。此外，一些TC蛋白质已知有“独特”杀虫活性，其它TC蛋白质已知加强或增强独特毒素的活性。已知TcdA蛋白质单独对烟草天蛾有活性，但TcdB和TccC一起，可用于增强TcdA的活性。Waterfield，N.等人，Appl.Environ.Microbiol.2001，675017-5024。TcbA(只有一个Tcb蛋白质)是来自光杆状菌的另一个独特毒素。该毒素(TcbA)的活性也可通过TcdB与TccC-样蛋白质进行增强。
美国专利申请20020078478提供了来自发光光杆状菌W-14基因组区的两个增效基因tcdB2及tccC2的核苷酸序列。其中显示tcdB及tccC1与tcdA的共表达与tcdA单独表达相比，前者导致获得的口服昆虫毒性水平增强。tcdB及tccC1与tcdA或tcbA共表达提供增强的口服昆虫毒性。
如下表中显示的，TccA与TcdA的N末端有一些水平的同源性，并且TccB与TcdA的C末端有一些水平的同源性。TccA及TccB对某些受试昆虫的活性远比TcdA低。来自发光光杆状菌W-14菌株的TccA及TccB称为“毒素D”。在下面对“毒素A”(TcdA)，“毒素B”(TcbA)及“毒素C”(TcaA及TcaB)也进行了显示。此外，TcaA与TccA有一些水平的同源性并同样与TcdA的N末端有一些水平的同源性。又进一步，TcaB与TccB有一些水平的同源性及同样与TcdA的N末端有一些水平的同源性。TccA及TcaA大小相似，TccB及TcaB也大小相似。TcdB与Tcac有显著水平的相似性(序列及大小均相似)。
昆虫中肠上皮均包含柱状(结构)及杯形(分泌)细胞。烟草天蛾摄取tca产物导致柱状细胞的细胞质囊泡顶端肿胀并起泡，导致最终囊泡内的细胞核排入肠腔。杯形细胞也明显地以同样方式受到影响。tca产物在经口递送或注射后作用于昆虫中肠。R.H.french-Constant和D.J.Bowen，Current Opinions in Microbiology，1999，12284-288。经纯化的tca产物对烟草天蛾显示有口服毒性(LD50为875ng/cm2)。R.H.french-Constant和D.J.Bowen，57 Cell.Mol.Life Sci.828-833(2000)。
WO99/42589及美国专利号6,281,413公开了来自发光光杆状菌的TC样ORF。WO00/30453及WO00/42855公开了来自致病杆菌的TC样蛋白质。WO99/03328及WO99/54472(及美国专利号6,174,860及6,277,823)涉及来自致病杆菌和光杆状菌的其它毒素。
嗜线虫致病杆菌的近期克隆结果也显示经确定的新杀虫毒素基因与发光光杆状菌的tc基因座有同源性。参见，例如WO98/08388及Morgan等人，Applied and Environmental Microbiology 2001，672062-69。R.H.ffrench-Constant和D.J.Bowen，Current Opinions in Microbiology，1999，12284-288。粘粒克隆对另一鳞翅目菜粉蝶(Pieris brassicae)的口服毒性直接进行筛选。将口服毒性粘粒克隆进行测序。对所述粘粒的序列分析表明五个不同的ORF与光杆状菌tc基因有相似性；orf2及orf5均与tcbA及tcdA有一些水平的序列相关性，而orf1与tccB相似，orf3与tccC相似及orf4与tcaC相似。重要的是，许多这些预计的ORF也有发光光杆状菌中记录的推定切割位点，表明活性毒素也是受蛋白水解加工的。
有五个典型的致病杆菌TC蛋白质XptA1，XptA2，XptB1，XptC1及XptD1。XptA1是“独特”毒素。XptA2是来自致病杆菌有独特毒素活性的另一TC蛋白质。对来自嗜线虫致病杆菌的序列参见GENBANK登录号AJ308438。XptB1及XptC1为可增强一种(或两种)XptA毒素活性的致病杆菌增效物。XptD1与TccB有一些水平的同源性。XptC1与TcaC有一些水平的相似性。致病杆菌的XptA2蛋白质与TcdA蛋白质有一些程度的相似性。XptB1与TccC有一些水平的相似性。
在这两种不同细菌中发现多少有些相似的毒素编码基因座，这一点对在这些毒力基因的可能来源方面是令人感兴趣的。嗜线虫致病杆菌粘粒也显示包含转座酶样序列，该序列的存在可表明这些基因座可在不同细菌菌株或种间转移。许多这样的转移事件也可解释两种不同细菌中tc操纵子的明显不同的基因组构成。此外，只有嗜线虫致病杆菌及发光光杆状菌菌株亚群显示对烟草天蛾有毒性，这表明或是不同菌株缺乏tc基因或是它们携带不同的tc基因。对这些细菌种内或种间进行菌株及毒素种系发生的详细分析有助于阐明毒素基因的可能来源及它们在不同菌群中是如何维持的。R.H.ffrench-Constant和Bowen，Current Opinions in Microbiology，1999，12284-288。
最近对来自其它的昆虫相关细菌如昆虫病原菌嗜虫沙雷氏菌(Serratiaentomophila)的TC蛋白质及基因进行了描述。Waterfield等人，TRENDSin Microbiology，第9卷，第4期，2001年4月。
总而言之，来自发光光杆状菌及嗜线虫致病杆菌的毒素复合体蛋白质显示与以前鉴定的细菌毒素同源性较低，并对来自苏云金芽孢杆菌的毒素提供了有用的备选物。虽然它们与其他口服活性毒素对昆虫中肠有相似的毒性作用，它们确切作用方式还是模糊的。进一步的工作可阐明它们的作用机制。
虽然发现一些致病杆菌TC蛋白质与一些光杆状菌TC蛋白质“对应”(有相似功能及一些水平的序列同源性)，特定的光杆状菌蛋白质与“相关”的致病杆菌蛋白质只有约40％序列同一性。这在以下四个“独特”毒素中进行了示例
(对于更完整的综述，参见，例如Morgan等人“来自嗜线虫致病杆菌PMFI296的杀虫基因的序列分析，”第67卷，Applied and EnvironmentalMicrobiology，2001年5月，第2062-2069页)。
类芽孢杆菌属(paenibacillus)细菌与其它细菌在rRNA及表型特征方面是有区别的(C.Ash等人(1993)，“用PCR探针检验分子鉴定rRNA第3组芽孢杆菌(Ash，Farrow，Wallbanks和Collins)产生新类芽孢杆菌属的建议，”Antonie Van Leeuwenhoek 64253-260)。比较16S rRNA序列分析证实芽孢杆菌属由至少五个种系组成。核糖体RNA第3组芽孢杆菌(Ash，Farrow，Wallbanks和Collins(1991)，包含多粘芽孢杆菌(Bacillus polymyxa)及其相关细菌)，为系统发生的，因此从枯草芽孢杆菌(Bacillus subtilis)(本属的模式种及其它需氧芽孢形成杆菌)中去除，将它们进行重新分类作为新属，即类芽孢杆菌属。
该属的一些种已知对蜜蜂(幼虫类芽孢杆菌(Paenibacillus Larvae))及金龟子甲虫蛴螬(日本甲虫类芽孢杆菌(P.popilliae)及缓病类芽孢杆菌(P.lentinnorbus))有病原性是已知的。已发现蜜蜂相关的一些其它类芽孢杆菌种，但它们是不致病的。在该属中已知至少18个其它种，包括解硫胺素类芽孢杆菌(P.thianninolyticus)；它们没有已知的昆虫相关性(Shida等人，1997；Pettersson等人，1999)。金龟子(鞘翅目)是全北美的草皮、苗圃及农作物的严重害虫，并有检疫价值。参见美国农业部，农业研究机构网。
认为幼虫类芽孢杆菌(P.larvae)，日本甲虫类芽孢杆菌(P.popilliae)及缓病类芽孢杆菌(P.lentimiorbus)是与金龟子甲虫的乳白病相关的专性昆虫病原(在A.Balows等人编辑的The Procaryotes，第2版，第2卷，Springer-Verlag，纽约，NY一书中，D.P.Stahly等人(1992)，“芽孢杆菌属昆虫病原，”第1697-1745页)。这三个类芽孢杆菌种特征是生长缓慢，为通过侵袭过程引起疾病的难养生物，所述侵袭过程为细菌通过中肠并在血淋巴及其它组织中增殖到高数量。对于所有三个种，已提出了在昆虫致病性中一些常见蛋白相关的指征。然而，对特定蛋白质没有证实有特定作用。Stahly等人对幼虫类芽孢杆菌作出结论即毒素相关的问题是开放的，并且(甲虫)乳白病的确切原因还是未知的。
在日本甲虫类芽孢杆菌及缓病类芽孢杆菌中鉴定了甲虫(鞘翅目)毒素Cry18。Cry18与Cry2蛋白质有约40％同一性(Zhang等人，1997；Harrison等人，2000)。而Zhang等人(1997)推测Cry18攻击中肠以利于营养细胞进入血腔，Harrison等人认为对这个作用没有直接证据并进一步声明“乳白病中多分孢子蛋白质的作用，如果有，是未知的。”J.Zhang等人(1997)，“来自日本甲虫芽孢杆菌的第一个cry基因的克隆及分析”，J.Bacteriol.1794336-4341；H.Harrison等人(2000)，“中美及南美金龟子中的类芽孢杆菌相关的乳白病，”J.Invertebr.Pathol.76(3)169-175。
Stahly等人，Zhang等人及Harrison等人均指出与苏云金芽孢杆菌晶体蛋白质对昆虫毒性作用(昆虫症状的高频率可通过特定晶体蛋白质的性质进行解释)相比较，类芽孢杆菌及乳白病(特定毒素的作用没有此类联系)的情况呈现相反的证据。
因此，虽然已知一些类芽孢杆菌种对某些鞘翅目及一些与蜜蜂相关的昆虫有致病性，迄今为止已知还未知对鳞翅目有毒性的类芽孢杆菌菌株。同样，在类芽孢杆菌中还没有报导TC蛋白质及鳞翅目毒性Cry蛋白质。
发明简述这是首次公开对鳞翅目害虫有活性的类芽孢杆菌蛋白质毒素。一些类芽孢杆菌种已知是有杀虫性的，但它们对蛴螬/甲虫/鞘翅目有活性。没有已知对鳞翅目有毒性的类芽孢杆菌种或菌株的报导。因此，本发明总体上涉及对鳞翅目有活性的类芽孢杆菌种，并涉及从类芽孢杆菌种筛选类芽孢杆菌亚种、其对鳞翅目有活性的蛋白质及克隆文库。
更具体地，本发明最初来源于对文中称为DAS1529的新类芽孢杆菌菌株的发现。这在多种原因上是一个令人惊讶的发现。该菌株产生独特的鳞翅目毒性Cry蛋白质。该菌株以及DB482，产生独特的毒性复合物(TC)样蛋白质(与致病杆菌/光杆状菌TC有一些相似性)。高度优选类芽孢杆菌DB482分离株及获自该菌株的毒素，并且均在本发明的范围内。
这是首次报导具有TC样蛋白质的类芽孢杆菌。因此，本发明涉及对类芽孢杆菌种筛选TC样基因及蛋白质的方法。文中显示本发明的类芽孢杆菌TC蛋白质用于例如增强或加强“独特”致病杆菌毒素蛋白质的活性。迄今为止，本文鉴定的TC样基因在类芽孢杆菌属中至今为止是未知的。本发明扩宽了发现TC样基因的生物体(细菌属)的范围。因此，本发明总体上涉及获自类芽孢杆菌种的TC样蛋白质，并涉及对类芽孢杆菌种筛选这些蛋白质的方法等。一个实例为发现了产生TC样蛋白质的蜂类芽孢杆菌(Paenibacillus apiarius)。
虽然目标TC样蛋白质与致病杆菌及光杆状菌TC蛋白质有一些序列相关性及共同特征，目标TC样蛋白质的序列与以前已知的TC蛋白质有很大差异。因此，本申请提供了新类型的获自类芽孢杆菌属、光杆状菌属、致病杆菌属等细菌的TC样蛋白质及编码这些蛋白质的基因。
DAS1529菌株的另一令人惊讶的特征为它产生对鳞翅目有毒性的独特B.t.样Cry蛋白质。将目标Cry毒素进行压缩/缩短并显示缺乏它野生型形态的典型原毒素部分。因此，本发明总体上涉及筛选具有鳞翅目毒性Cry蛋白质的类芽孢杆菌分离株。本发明也涉及对类芽孢杆菌亚种及苏云金芽孢杆菌种筛选例如具有该新类型Cry基因及蛋白质的方法。
DAS1529菌株是第一个已知均产生Cry样毒素及TC样蛋白质的天然细菌的实例。又令人惊讶的是这是第一个已知与TC蛋白质基因密切相关(基因近似)的cry毒素基因实例。这些前驱的观察现象有广泛含义并因此使本领域技术人员能对合适细菌种筛选这些类型的独特操纵子及这些类型的已知操纵子的其它组分。这些技术在本发明的范围内。
本发明的又一方面来源于DAS1529菌株也产生与硫胺素酶非常相似的可溶昆虫毒素这一令人惊讶的发现。令人惊讶的是发现类芽孢杆菌硫胺素酶蛋白有杀虫活性。虽然此类蛋白是已知的，但本领域不能预计该酶显示对昆虫/昆虫样害虫的毒素样活性。因此，本发明也涉及对类芽孢杆菌筛选具有杀虫硫胺素酶基因及蛋白质等的方法，并涉及这些基因及蛋白质对控制昆虫及相似害虫的用途。
本发明的其它目的、优点及特征对受益于本公开的本领域技术人员是明显的。
附图简述图1显示了来自光杆状菌的TC操纵子。
图2显示了插入到“SBI2”克隆中的来自DAS1529的显示有杀虫活性的DNA，其中可读框用框状及线状箭头标出。
图3显示了SEQ ID NO17与来自解硫胺素芽孢杆菌(Campobasso等人，1998)或AAC44156的硫胺素酶I的部分序列对比。
图4显示了来自DAS1529的经纯化硫胺素酶对CEW的测试结果。
图5显示了pEt101D中的ORF3-ORF6。
图6显示了针对烟芽夜蛾(TBW)的Cry1529(ORF7)活性。
图7显示了SEQ ID NO9与SEQ ID NO5(tcaB2与tcaB1)的比较/对比；括号显示了ORF2连接处。
图8显示了DAS1529 ORF7(Cry1529)与其它Cry蛋白质比较的系统发生树。
图9和10显示了野生型及经修饰Cry1529蛋白质的胰蛋白酶消化结果。
图11A和11B显示了用于tcaA引物设计的序列对比。
图12A-D显示了用于tcaB引物设计的序列对比。
图13A和13B显示了用于tcaC引物设计的序列对比。
图14A和14B显示了用于tccC引物设计的序列对比。
序列简述SEQ ID NO1为SB12整个插入片段的核苷酸序列。
SEQ ID NO2为编码tcaA样蛋白质(基因tcaA1，来源生物为类芽孢杆菌IDAS1529菌株，基因命名为tcaA1-1529)的ORF1核苷酸序列。
SEQ ID NO3为ORF1编码的氨基酸序列。
SEQ ID NO4为ORF2去除IS元件的核苷酸序列，其编码tcaB样蛋白质(基因tcaB1，来源生物为类芽孢杆菌IDAS1529菌株，基因命名为tcaB1-1529)。
SEQ ID NO5为ORF2编码的氨基酸序列。
SEQ ID NO6为编码tcaA样蛋白质的ORF3的核苷酸序列(基因tcaA2，来源生物为类芽孢杆菌IDAS1529菌株，基因命名为tcaA2-1529)。
SEQ ID NO7为ORF3编码的氨基酸序列。
SEQ ID NO8为编码tcaB样蛋白质的ORF4的核苷酸序列(基因tcaB2，来源生物为类芽孢杆菌IDAS1529菌株，基因命名为tcaB2-1529)。
SEQ ID NO9为ORF4编码的氨基酸序列。
SEQ ID NO10为编码tcaC样蛋白质的ORF5的核苷酸序列(基因tcaC，来源生物为类芽孢杆菌IDAS1529菌株，基因命名为tcaC-1529)。
SEQ ID NO11为ORF5编码的氨基酸序列。
SEQ ID NO12为编码tccC样蛋白质的ORF6的核苷酸序列。
SEQ ID NO13为ORF6编码的氨基酸序列。
SEQ ID NO14为编码Cry样蛋白质的ORF7的核苷酸序列。
SEQ ID NO15为ORF7编码的氨基酸序列。
SEQ ID NO16为用于分类的DAS1529 16S rDNA的部分核苷酸序列。
SEQ ID NO17为来自DAS1529培养液级分中经纯化毒素的N末端氨基酸序列。
SEQ ID NO18来自解硫胺素芽孢杆菌的硫胺素酶I的氨基酸序列(Campobasso等人，J.Biochem.37(45)15981-15989(1998))。
SEQ ID NO19为ORF6蛋白质的ORF6核苷酸序列(基因tccC，来源生物类芽孢杆菌IDAS1529菌株，基因命名为tccC-1529)编码的备选氨基酸序列。
SEQ ID NO20为基因xptC1，来源生物致病杆菌Xwi菌株，基因命名为xptC1-Xwi。
SEQ ID NO21为基因xptB1，类源生物致病杆菌Xwi菌株，基因命名为xptB1-Xwi。
SEQ ID NO22为引物SB101。
SEQ ID NO23为引物SB102。
SEQ ID NO24为引物SB103。
SEQ ID NO25为引物SB104。
SEQ ID NO26为引物SB105。
SEQ ID NO27为引物SB106。
SEQ ID NO28为引物SB212。
SEQ ID NO29为引物SB213。
SEQ ID NO30为引物SB215。
SEQ ID NO31为引物SB217。
SEQ ID NO32为来自蜂类芽孢杆菌DB482菌株的tcaA样基因的核苷酸序列。
SEQ ID NO33为来自蜂类芽孢杆菌DB482菌株的TcaA样蛋白质的氨基酸序列。
SEQ ID NO34为来自蜂类芽孢杆菌DB482菌株的tcaB样基因的核苷酸序列。
SEQ ID NO35为来自蜂类芽孢杆菌DB482菌株的tcaB样基因的核苷酸序列。
SEQ ID NO36为来自蜂类芽孢杆菌DB482菌株的TcaB样蛋白质的氨基酸序列。
SEQ ID NO37为来自蜂类芽孢杆菌DB482菌株的TcaB样蛋白质的氨基酸序列。
SEQ ID NO38为来自蜂类芽孢杆菌DB482菌株的tcaC样基因的核苷酸序列。
SEQ ID NO39为来自蜂类芽孢杆菌DB482菌株的TcaC样蛋白质的氨基酸序列。
SEQ ID NO40来自蜂类芽孢杆菌DB482菌株的tccC样基因的核苷酸序列。
SEQ ID NO41为来自蜂类芽孢杆菌DB482菌株的TccC样蛋白质的氨基酸序列。
SEQ ID NO42为基因tcdB1，来源生物光杆状菌W14菌株，基因命名为tcdB1-W14。
SEQ ID NO43为基因tcdB2，来源生物为光杆状菌W14菌株，基因命名为tcdB2-W14。
SEQ ID NO44为基因tccC1，来源生物光杆状菌W14菌株，基因命名为tccC1-W14。
SEQ ID NO45为基因tccC2，来源生物光杆状菌W14菌株，基因命名为tccC2-W14。
SEQ ID NO46为基因tccC3，来源生物光杆状菌W14菌株，基因命名为tccC3-W14。
SEQ ID NO47为基因tccC4，来源生物光杆状菌W14菌株，基因命名为tccC4-W14。
SEQ ID NO48为基因tccC5，来源生物光杆状菌W14菌株，基因命名为tccC5-W14。
SEQ ID NO49为来自嗜线虫致病杆菌Xwi的XptA2 TC蛋白质的氨基酸序列。
发明详述本发明提供了用于害虫控制的独特生物学备选物。更具体地，本发明提供了对昆虫，优选对鳞翅目及其它类似害虫有毒素活性蛋白质的新来源。本发明也涉及可用于编码此类毒素的新多核苷酸的新来源，并涉及毒素制备方法及用毒素及对应的核酸序列控制昆虫和其它类似植物害虫的方法。本发明提出需要新的昆虫控制剂。本发明涉及获自类芽孢杆菌及其它细菌的新杀虫蛋白质。
本发明最初源自新的类芽孢杆菌菌株的发现。该菌株在文中是指DAS1529。为证实本发明的广泛含义，也对另一类芽孢杆菌菌株的发现进行示例。这些菌株保藏在位于美国，1815 North University Street Peoria，Ill.61604的农业研究机构专利培养物保藏中心(NRRL)。保藏菌株及对应的保藏日期及保藏编号如下保藏菌株保藏日期保藏编号DAS1529 2002年6月19日 NRRL B-30599DB482 2003年6月17日 NRRL B-30670这些培养物是为了本专利申请进行保藏并在保证这个专利申请未决期间专利和商标委员会确定的人可获得培养物的条件下保藏，所赋予的号为37 CFR 1.14及35 U.S.C.122。对本申请的副本或其随后的申请文本进行申请时，当其所在国家的外国专利法要求这些保藏物时，这些保藏物也是可获得的。然而，应当理解保藏物的可用性并不允许在损害政府授予的专利权下实施本发明。
此外，目标培养保藏物根据用于保藏微生物的布达佩斯公约的条款进行制备，即它们必需全力在最近用于提供保藏样本的需求后至少五年时期，并且在任何情况下，保藏日期后的至少三十(30)年时期或可发布公开培养物可实施期限内，使它们保持活力并不受污染下进行保存。如果由于保藏条件，在需要时对保藏物不能提供样本，保藏者有责任替代保藏物。一旦授予专利公开它们时，公众对目标培养保藏物可获得性的所有限制最终废止。
目标DAS1529菌株的发现有多种原因是令人惊讶的。该菌株产生独特的鳞翅目毒性Cry蛋白质。该菌株以及DB482，也产生独特的毒素复合体(TC)样蛋白质(与致病杆菌/光杆状菌TC)有相似性)。类芽孢杆菌DB482分离株及由其获得的毒素是高度优选的，并均在本发明的范围内。
这是第一个已知公开的有针对鳞翅目活性的类芽孢杆菌蛋白质毒素。发现DAS1529菌株对鳞翅目害虫有毒素活性。这是令人惊讶的发现。已知一些种的类芽孢杆菌对蛴螬/甲虫/鞘翅目有杀虫活性。还没有类芽孢杆菌种或菌株对鳞翅目有毒性的报导。因此，本发明总体上涉及对鳞翅目有活性的类芽孢杆菌种，并涉及针对鳞翅目具有活性的和/或编码“鳞翅目毒素”的基因，且更具体地，涉及用于鳞翅目毒性Cry蛋白质的类芽孢杆菌培养物、其蛋白质及其克隆文库的筛选。
这也是具有TC样蛋白质的类芽孢杆菌的第一次已知报导。因此，本发明涉及对类芽孢杆菌种筛选TC样基因及蛋白质的方法。非常令人惊讶的是发现DAS1529及DB482菌株有TC样操纵子并产生TC蛋白质(与致病杆菌及光杆状菌的TC蛋白质有一些水平的相似性)。迄今为止，在类芽孢杆菌属中还不知道存在文中鉴定的TC蛋白质及基因。此发现扩宽了发现TC蛋白质的生物体(细菌属)的范围。因此本发明总体上涉及获自类芽孢杆菌种的TC蛋白质，涉及对类芽孢杆菌种筛选此类蛋白质等的方法。用本发明的方法发现类芽孢杆菌种的实例为蜂类芽孢杆菌(Paenibacillus apairus)DB482菌株。此蜂类芽孢杆菌菌株也产生独特TC样蛋白质。
虽然目标TC蛋白质与致病杆菌及光杆状菌的TC蛋白质有一些共同特征，目标TC蛋白质是独特的并与以前已知的TC蛋白质不同。因此，本申请提供了获自类芽孢杆菌属，光杆状菌属，致病杆菌属，沙雷氏菌属等细菌的新类型TC样蛋白质及编码这些蛋白质的基因。
本发明也涉及获自类芽孢杆菌种的鳞翅目毒性Cry蛋白质。因此，本发明涉及对类芽孢杆菌种筛选针对鳞翅目害虫有毒素活性的cry基因及Cry蛋白质的方法。
DAS1529 Cry毒素为非常独特的B.t.样Cry蛋白质毒素。另一对蛴螬有活性的类芽孢杆菌菌株已知产生鞘翅目毒性Cry蛋白质。其为与Cry2蛋白质最相关的(但只有大约40％同一性)的Cry18蛋白质。文中示例的Cry蛋白质显示与以前已知的Cry蛋白质只有低水平的序列同一性及相似性。如果那样，在所有已知的B.t.Cry蛋白质中，目标Cry蛋白质与Cry1蛋白质有最大的相似性。目标Cry蛋白质的一个令人惊讶的方面是它非常小，即甚至比Cry1 Fa核心毒素小。目标Cry蛋白质在它的C末端或接近C末端有一个可鉴定的第5区块(Block 5)。此毒素的野生型状态没有原毒素部分，其中所述原毒素部分一般在Cry1毒素中发现。目标Cry毒素令人惊讶地进行了压缩。因此，本发明总体上涉及新类型的Cry蛋白质。此公开对从苏云金芽孢杆菌(B.t.)中寻找额外cry基因也是重要的。对从本公开获益的本领域技术人员清楚的是，可对其它细菌如B.t.及其它芽孢杆菌亚种(包括球形芽孢杆菌(B.sphaericus))筛选类似毒素及毒素基因。这些筛选方法在本发明的范围内。
DAS1529菌株是第一个已知可产生Cry样毒素及TC样蛋白质这两者的天然细菌的实例。又令人惊讶的是这是第一个已知与TC蛋白质基因密切相关(基因近似)的cry毒素基因的实例。这些先驱的观察现象使本领域技术人员能对适当细菌种筛选这些型的独特操纵子及这些型的已知操纵子的其他组分。这些技术在本发明的范围内。DAS1529菌株是具有同一类型的多个TC蛋白质基因(即在这种情况下，两个tca样及两个tcaB样基因)的TC样操纵子的野生型菌株的令人感兴趣的实例。这对进一步的基因发现有意义。
本发明的又一方面起源于类芽孢杆菌硫胺素酶蛋白质有杀虫活性的令人惊讶的发现。虽然此蛋白质是已知的，本领域决不会预计此酶显示对昆虫/昆虫样害虫的毒素样活性。
类芽孢杆菌TC蛋白质关于示例TC蛋白质的更具体的说明，以下对来自DAS1529菌株的TC蛋白质文中进行了充分描述两个TcaA样蛋白质(TcaA1及TcaA2)，两个TcaB样蛋白质(TcaB1及TcaB2)，一个TcaC蛋白质及一个TccC样蛋白质。TcaA1及TcaA2蛋白质相互在序列水平上有高度相似性，并且tcaB1及tcaB2蛋白质相互在序列水平上有高度相似性。获自蜂类芽孢杆菌的TC样蛋白质也本文也进行了示例，并在本发明的范围内。
本发明的TC蛋白质可与其它蛋白质一样进行应用。这对于在根据本领域已知的进行观察时具有本公开益处的本领域技术人员是很显然的。参见，例如R.H.ffrench-Constant和Bowen(2000))及美国专利号6,048,838讨论的以上背景部分。例如，光杆状菌的Tca毒素复合体对烟草天蛾有高度毒性是已知的。
虽然现在不了解TC蛋白质相互的确切分子相互作用及它们的作用机制，已知一些TC蛋白质有“独特”杀虫活性，并且已知其它TC蛋白质增强同一给定生物产生独特毒素的活性。例如已知TcdA蛋白质对烟草天蛾有活性。TcaC及TccC一起可用于增强TcdA的活性。TcdB(替代TcaC)与TccC可用作增强剂。TcbA是另一个有独特毒素活性的光杆状菌TC蛋白质。TcaC(或TcdB)与TccC一起可用于增强/加强TcbA的毒素活性。
以下对光杆状菌TC蛋白质及来自类芽孢杆菌“对应的”TC蛋白质/基因进行概述
如以上指出的，TccA与TcdA的N末端有一些水平的同源性，及TccB与TcdA的C末端有一些水平的同源性。此外，TcdA大约280kDa，及如果组合，TccA与TccB一起与TcdA大约同样大小。此外，TcaA与TccA有一些水平的同源性并且同样与TcdA的N末端有一些水平的同源性。又此外，TcaB与TccB有一些水平的同源性及同样与TcdA的N末端有一些水平的同源性。TccA及TcaA，TccB及TcaB有同样大小。
虽然发现一些致病杆菌TC蛋白质“对应”于一些光杆状菌TC蛋白质，“对应”蛋白质相互只有约40％(近似)序列同一性。来自类芽孢杆菌的目标蛋白质与以前TC蛋白质有大约同样程度的序列相关性(～40％同一性)。
如以下更详细的描述，本发明的一种或多种毒素能互相组合和/或与其它毒素组合应用(即光杆状菌Tca复合物已知对烟草天蛾有活性；光杆状菌TC蛋白质的多种“组合”例如可一起应用以增强其它独特光杆状菌毒素的活性；例如，建议应用光杆状菌毒素“与”B.t.毒素用于抗性控制)。此外，本发明的类芽孢杆菌TC蛋白质文中显示用于增强或加强“独特”致病杆菌毒素蛋白质的活性。例如，临时申请号60/441,723(Timothy D.Hey等人)，标题为“用于害虫控制的混合及匹配TC蛋白质”涉及TC蛋白质来源于一个属如光杆状菌属生物的TC蛋白质与来源于另一属生物对应的TC蛋白质互换应用的令人惊讶的发现。接着这些在以下列出的其它令人惊讶的数据进一步表明了本发明类芽孢杆菌TC蛋白质的实用性。这些结果的一个原因为令人惊讶的是在“对应”致病杆菌、光杆状菌及目标类芽孢杆菌TC蛋白质之间只有～40％序列同一性。
蛋白质及毒素本发明提供了易于施用的功能性蛋白质。本发明也提供了用于递送对许多种昆虫，优选对鳞翅目昆虫具有功能活性并为有效杀虫毒素的方法。“功能活性”(或“针对活性”)文中表示蛋白质毒素作为口服活性昆虫控制剂(单独或与其它蛋白质组合)发挥功能，蛋白质有毒性作用(单独或与其它蛋白质组合)或能破坏或阻止昆虫生长和/或摄食，其中所述摄食引起或不可引起昆虫死亡。当昆虫与通过转基因植物表达，被制成蛋白质组合物，可喷雾蛋白质组合物，诱饵基质或其它递送系统递送的有效量的本发明“毒素”接触时，结果一般是昆虫死亡，抑制昆虫的生长和/或增殖，和/或预防昆虫摄食昆虫可获得毒素的来源(优选转基因植物)。本发明的功能性蛋白质也可增强或改进其它毒素蛋白质的活性。因此，文中应用的术语“毒性”“毒力”“毒素活性”及“杀虫活性”如文中定义表示目标“毒素”有“功能活性”。
优选对摄食昆虫有完全致死性，但不需要达到功能活性。如果昆虫避开毒素或停止摄食，在一些应用中此避开是有用的，即使作用是亚致死的或致死性被延迟或非直接的。例如，如果目的是获得抗昆虫的转基因植物，昆虫不愿摄食植物与对昆虫有致死毒性同样是有用的，因为最终目的是避免昆虫引起植物损害。
有其它将毒素混合到昆虫食物的方法。例如，如文中公开的，通过向食物喷洒蛋白质溶液将毒性蛋白质掺入到幼虫食物源是可能的。备选地，可将经纯化蛋白质基因改造入另外的无害细菌中，然后此细菌可在培养物中生长，并且将所述细菌或用于食物源或使其在需要根除昆虫的土壤中定居。并且，可将蛋白质直接基因改造入昆虫食物源中。例如，对许多昆虫幼虫的主要食物源是植物。因此可将编码毒素的基因转移到植物中以使所述植物表达目的毒素。
将功能活性转移到植物或细菌系统中一般需要将编码毒素氨基酸序列的核酸序列整合到适于载体定居的宿主的蛋白质表达载体中。获得编码有功能活性蛋白质的核酸序列的一个途径是如文中公开的，用来自毒素氨基酸序列推导的信息，从产生毒素的细菌种中分离天然遗传物质。可将天然序列进行优化用于在植物中表达，例如，以下进行更详细的讨论。优化的多核苷酸也可在蛋白质序列的基础上进行设计。
本发明提供了具有有益杀虫活性的新类型毒素。对这些类型的毒素及编码它们的多核苷酸进行定性的一个途径是在一系列特定条件下，与示例的核苷酸序列(其互补体和/或探针或来自任意链的探针)杂交能力和/或通过它们用来自示例序列的引物通过PCR进行扩增的能力定义多核苷酸。
有许多获得本发明杀虫毒素的方法。例如，文中公开及权利要求的杀虫毒素的抗体可用于从蛋白质混合物中鉴定并分离其它毒素。特别地，可制备针对更稳定并与其它毒素区别最大的毒素部分的抗体。然后这些抗体可用于特别通过免疫沉淀、酶联免疫吸附测定(ELISA)或Western印迹鉴定有特征活性的相同毒素。文中公开的毒素抗体或相同毒素抗体或这些毒素片段的抗体，用标准方法易于制备。单克隆、多克隆、特异和/或交叉反应抗体可根据本发明进行制备及应用。在检测试剂盒中可包括此类抗体用于检测本发明蛋白质(及其抗原性片段)的存在。
本领域技术人员易于认识到本发明的毒素(及基因)可从多种来源获得。“来自”或“获自”目标DAS1529分离株和/或蜂类芽孢杆菌分离株的毒素表示此毒素(或相似毒素)可获自该分离株或一些其它来源，如另一细菌菌株或转基因植物。例如，本领域技术人员易于认识到，如果公开细菌基因及毒素，可将植物进行工程化以产生毒素。抗体制剂、核酸探针(DNA及RNA)等等可用文中公开的多核苷酸和/或氨基酸序列进行制备并用于从其它(天然)来源筛选及发现其它毒素基因。本发明的毒素可获自多种来源/源微生物。
多核苷酸及探针本发明进一步提供了编码本发明毒素的核苷酸序列。本发明又提供了鉴定及定性编码杀虫毒素基因的方法。在一个实施方案中，本发明提供了用于作为杂交探针和/或用于PCR技术引物的独特核苷酸序列。产生特征性基因片段的引物可用于鉴定、定性和/或分离特异毒素基因。本发明的核苷酸序列编码与以前描述毒素不同的毒素。
本发明的多核苷酸可用于形成完整“基因”以在目的宿主细胞中编码蛋白质或肽。例如，如本领域技术人员易于识别的，如本领域显然已知的，目标多核苷酸可适当地处于目的宿主中的启动子控制下。
如本领域技术人员已知的，DNA一般以双链形式存在。在此排列中，一条链与另一条链互补，反过来也是如此。由于DNA在植物中复制，产生额外的DNA互补链。本领域中常用的“编码链”是指与反义链结合的链。mRNA从DNA的“反义”链进行转录。“正义”或“编码”链有一系列可作为可读框(ORF)进行阅读以形成目的蛋白质或肽的密码子(密码子为可作为三个残基单位进行阅读以代表一个特定氨基酸的三个核苷酸)。为了在体内表达蛋白质，DNA链一般转录成可用作用于蛋白质模板的mRNA的互补链。因此，本发明包括后附序列表和/或包括互补链的等同物显示的示例多核苷酸的用途。与示例DNA功能性相同的RNA及PNA(肽核酸)包括在本发明中。
在本发明的一个实施方案中，细菌分离株可在致使该微生物高度增殖的条件下进行培养。在处理微生物以提供单链基因组核酸后，DNA可与本发明的引物接触并进行PCR扩增。毒素编码基因的特征性片段可通过程序进行扩增，因此确定毒素编码基因的存在。
本发明的又一方面包括用文中公开的方法及核苷酸序列鉴定的基因及分离株。这样鉴定的基因编码对害虫有活性的毒素。
本发明的毒素及基因可例如通过用寡核苷酸探针进行鉴定并获得。这些探针为可依靠适当标记可检测的或如国际申请号WO93/16094描述的可制成固有荧光的可检测核苷酸序列。探针(及本发明的多核苷酸)可为DNA、RNA或PNA。除腺嘌呤(A)，胞嘧啶(C)，鸟嘌呤(G)，胸腺嘧啶(T)及尿嘧啶(U，用于RNA分子)外，本发明的合成探针(及多核苷酸)也可有次黄嘌呤(能与所有四个碱基配对的中性碱基；在合成探针中，有时用于替代所有四种碱基的混合物)。因此，当文中谈及合成的简并寡核苷酸时，一般应用“n”，“n”可为G，A，T，C或次黄嘌呤。根据标准IUPAC命名委员会，本申请的文中应用含糊密码子(例如，R表示A或G，Y表示C或T等)。
如本领域公知的，如果探针分子与核酸样本杂交，可合理地推定探针与样本大体上有同源性/相似性/同一性。优选地，通过本领域公知的技术，例如，如在Keller，G.H.，M.M.Manak(1987)DNA Probes，Stockton出版社，纽约，NY，第169-170页一书中所述，首先进行多核苷酸的杂交，接着在低、中等或高严格条件下洗涤。例如，如文中阐述的，低严格条件可通过第一次用2×SSC(标准柠檬酸盐)/0.1％SDS(十二烷基硫酸钠)于室温洗涤15分钟实施。一般进行两次洗涤。然后高严格条件可通过降低盐浓度和/或通过升高温度而达到。例如，以上描述的洗涤可接着每次用0.1×SSC/0.1％SDS于室温洗涤15分钟，进行两次，接着继续用0.1×SSC/0.1％SDS于55℃每次洗涤30分钟。这些温度可与其它文中提出的杂交及洗涤方法应用，并是本领域技术人员已知的(例如，SSPE可代替SSC用作盐)。2×SSC/0.1％SDS可通过向445ml水中加入50ml的20×SSC及5ml的10％SDS进行制备。20×SSC可通过组合NaCl(175.3g/0.150M)、柠檬酸钠(88.2g/0.015M)及加水至1升，接着用10NNaOH调整pH至7.0进行制备。10％SDS可通过在50ml经高压水中溶解10g的SDS，稀释至100ml并分装进行制备。
探针的检测提供了以已知的方式用于确定是否杂交在维持着的方法。此种探针分析提供了用于快速鉴定本发明毒素编码基因的方法。根据本发明用作探针的核苷酸节段可用DNA合成仪及标准方法进行合成。这些核苷酸序列可用作PCR引物以扩增本发明的基因。
根据本发明用于应用的探针可来源自多种来源，如文中提及或建议的任何基因。例如，根据本发明可应用以下任何类型的基因(编码和/或非编码或其互补链)的全部或部分tcaA，tcaB，tcaC，tcbA，tccA，tccB，tccC，tcdA，tcdB，xptA1，xptD1，xptB1，xptC1，xptA2，sepA，sepB及sepC。除了另外特别指出外，例如，提到“tccC”基因包括这个型基因所有特异等位基因(如tccC1及tccC2)。所有其它基因也是同样的(例如，tcdB2，tccC3及表17中提及的等位基因)。
分子的杂交特征可用于定义本发明的多核苷酸。因此本发明包括与文中示例或建议的多核苷酸(或寡核苷酸或引物)杂交的多核苷酸(和/或它们的互补体，优选它们全长互补体)。
如文中应用的杂交的“严格”条件是指可达到通过当前申请人利用的条件同样或大约同样程度的杂交特异性的条件。具体地，通过标准方法(参见，例如，Maniatis，T.，E.F.Fritsch，J.Sambrook MolecularCloningA Laboratory Manual，Cold Spring Harbor Laboratory，ColdSpring Harbor，NY)在Southern印迹上固定的DNA用32P-标记的基因特异探针进行杂交。一般而言，杂交及后来的洗涤可在可允许检测靶序列的条件下进行。对于双链DNA基因探针，杂交在低于DNA杂交体解链温度(Tm)20-25℃时在6×SSPE，5×Denhardt′s溶液，0.1％SDS，0.1mg/ml经变性DNA中过夜进行。解链温度通过以下公式进行描述(Beltz，G.A.，K.A.Jacobs，T.H.Eickbush，P.T.Cherbas和F.C.KafatosMcthods of Enzymology，Wu，L.Grossman和K.Moldave编辑，Academic出版社，纽约100266-285)Tm＝81.5℃+16.6Log[Na+]+0.41(％G+C)-0.61(％甲酰胺)-600/碱基对中双链体长度。
洗涤一般按以下进行(1)在1×SSPE，0.1％SDS中于室温洗涤15分钟进行两次(低严格洗涤)。
(2)在0.2×SSPE，0.1％SDS中于室温20℃洗涤15分钟，进行一次(中等严格洗涤)。
对于寡核苷酸探针，杂交于低于杂交体解链温度10-20℃时在6×SSPE，5×Denhardt′s溶液，0.1％SDS，0.1mg/ml经变性DNA中过夜进行。用于寡核苷酸探针的Tm通过以下公式进行确定Tm(℃)＝2(T/A碱基对数目)+4(G/C碱基对数目)(Suggs，S.V.，T.Miyake，E.H.Kawashime，M.J.Johnson，K.Itakura和R.B.WallaceICN-UCLA Symp.Dev.Biol.Using Purified Genes，D.D.Brown编辑，Academic出版社，纽约，23683-693)一般按以下进行洗涤(1)在1×SSPE，0.1％SDS中于室温洗涤15分钟，进行两次(低严格洗涤)。
(2)在1×SSPE，0.1％SDS中于杂交温度洗涤15分钟，进行一次(中等严格洗涤)。
一般，盐和/或温度可进行改变以改变严格度。用经标记的长度＞70个碱基左右的DNA片段，可应用以下条件低1或2×SSPE，室温低1或2×SSPE，42℃中等0.2×或1×SSPE，65℃高0.1×SSPE，65℃双链体形成及稳定性依赖于两条杂交链间的实质互补性。并且如上提及的，可允许一定程度的误配。因此，本发明的探针序列包括所述序列的突变(单个或多重)、缺失、插入及其组合，其中所述突变、插入或缺失允许形成与靶目的多核苷酸形成稳定杂交体。突变、插入及缺失可以多种方法在给定多核苷酸序列中进行产生，并且这些方法对一般技术人员是已知的。其它方法将来可成为已知的。
PCR技术聚合酶链反应(PCR)为核苷酸序列的重复性、酶促引发合成过程。该程序是公知的并是本领域技术人员常规应用的(参见Mullis，美国专利号4,683,195，4,683,202和4,800,159；Saiki，Randall K.，StephenScharf，Fred Faloona，Kary B.Mullis，Glenn T.Horn，Henry A.Erlich，Norman Arnheim“酶扩增β-球蛋白基因组序列及限制位点分析用于诊断镰状细胞贫血，”Science 2301350-1354)。PCR是建立在酶扩增目的DNA片段基础上的，其中所述目的DNA片段的侧翼为与目的序列的相反链杂交的两个寡核苷酸引物。引物导向互相指向3’末端。模板进行重复循环的热变性，引物与它们的互补序列退火及经退火引物与DNA酶的延伸结果导致PCR引物5’末端定义的节段的扩增。每条引物的延伸产物可作为用于其它引物的模板，因此每次循环一般使在上一次循环中产生的DNA片段数量加倍。这导致特异靶片段的指数增加，在几小时内达到几百万倍。通过应用分离自嗜热细菌嗜热水生菌(Thermus aquaticus)的热稳定DNA聚合酶如Taq聚合酶，扩增过程可完成自动化。可进行应用的其它酶是本领域技术人员已知的。
本发明的DNA序列可用作用于PCR扩增的引物。进行PCR扩增时，引物及模板间可允许一定程度的误配。因此，示例引物的突变、缺失及插入(特别是向5’末端添加核苷酸)是在本发明的范围内。突变、插入及缺失在给定引物中可通过一般技术人员已知的方法进行产生。
基因与毒素的修饰根据本发明有用的基因与毒素不仅包括特定示例的全长序列，也包括这些序列的部分、节段和/或片段(与全长分子相比包括内部和/或末端缺失)、变体、突变体、嵌合体及其融合体。例如，本发明的毒素可以通过两个或多个毒素/蛋白质部分组合产生的嵌合毒素的形式应用。
本发明的蛋白质可具有经替代氨基酸，只要它们保持文中特定的示例蛋白质的特征性杀虫/功能活性。“变体”基因的核苷酸序列编码相同毒素或与文中示例蛋白质有相同杀虫活性的等同毒素。术语“变体蛋白质”及“等同毒素”是指对靶害虫有相同或基本上相同生物学/功能活性，并与示例毒素有等同序列的毒素。如文中应用的，谈及“等同”序列是指经改进或不对杀虫活性有副作用的其中存在氨基酸替代、缺失、添加或插入的序列。保持杀虫活性的片段也包括在本定义中。片段及保持相同或相似功能的其它等同物或示例毒素对应片段的“毒素活性”在本发明的范围内。可进行变化，如氨基酸替代或添加用于多种目的，如增加(或降低)蛋白质的蛋白酶稳定性(基本上/一般不降低毒素的功能活性)。
用文中提供的教导，等同毒素和/或编码这些等同毒素的基因可获自/来自野生型或重组细菌和/或其它野生型或重组生物体。例如其它芽孢杆菌，类芽孢杆菌，光杆状菌及致病杆菌种，可用作源分离株。
例如，基因的改变通过使用制备点突变的标准技术易于构建。此外，例如，美国专利号5,605,793描述了随机片段化后，通过用DNA重组装用于产生额外分子多样性的方法。可用变体基因产生变体蛋白质；重组宿主可用于产生变体蛋白质。用这些“基因改组”技术，包含文中示例任何序列的任意5、10或20个连续残基(氨基酸或核苷酸)的等同基因及蛋白质可进行构建。如本领域技术人员已知的，可将基因改组技术进行调整以获得具有，例如1，2，3，4，5，6，7，8，9，10，11，12，13，14，15，16，17，18，19，20，21，22，23，24，25，26，27，28，29，30，3132，33，34，35 36，37，38，39，40，41，42，43，44，45，46，47，48，49，50，51，52，53，54，55，56，57，58，59，60，61，62，63，64，65，66，67，68，69，70，71，72，73，74，75，76，77，78，79，80，81，82，83，84，85，86，87，88，89，90，91，92，93，94，95，96，97，98，99，100，101，102，103，104，105，106，107，108，109，110，111，112，113，114，115，116，117，118，119，120，121，122，123，124，125，126，127，128，129，130，131，132，133，134，135，136，137，138，139，140，141，142，143，144，145，146，147，148，149，150，151，152，153，154，155，156，157，158，159，160，161，162，163，164，165，166，167，168，169，170，171，172，173，174，175，176，177，178，179，180，181，182，183，184，185，186，187，188，189，190，191，192，193，194，195，196，197，198，199，200，201，202，203，204，205，206，207，208，209，210，211，212，213，214，215，216，217，218，219，220，221，222，223，224，225，226，227，228，229，230，231，232，233，234，235，236，237，238，239，240，241，242，243，244，245，246，247，248，249，250，251，252，253，254，255，256，257，258，259，260，261，262，263，264，265，266，267，268，269，270，271，272，273，274，275，276，277，278，279，280，281，282，283，284，285，286，287，288，289，290，291，292，293，294，295，296，297，298，299，300，301，302，303，304，305，306，307，308，309，310，311，312，313，314，315，316，317，318，319，320，321，322，323，324，325，326，327，328，329，330，331，332，333，334，335，336，337，338，339，340，341，342，343，344，345，346，347，348，349，350，351，352，353，354，355，356，357，358，359，360，361，362，363，364，365，366，367，368，369，370，371，372，373，374，375，376，377，378，379，380，381，382，383，384，385，386，387，388，389，390，391，392，393，394，395，396，397，398，399，400，401，402，403，404，405，406，407，408，409，410，411，412，413，414，415，416，417，418，419，420，421，422，423，424，425，426，427，428，429，430，431，432，433，434，435，436，437，438，439，440，441，442，443，444，445，446，447，448，449，450，451，452，453，454，455，456，457，458，459，460，461，462，463，464，465，466，467，468，469，470，471，472，473，474，475，476，477，478，479，480，481，482，483，484，485，486，487，488，489，490，491，492，493，494，495，496，497，498，499或500或更多个连续残基(氨基酸或核苷酸)，其中所述连续残基对应于任意示例序列(或其互补体(全长互补体))中的节段(相同大小)。类似大小的节段，特别对于保守区的节段，也可用作探针和/或引物。
全长基因片段可根据标准方法用商业上可获得的外切酶或内切酶进行制备。例如，酶如Bal31或定点诱变可用于从这些基因末端系统地切除核苷酸。同样，可用多种限制酶获得编码活性片段的基因。可用蛋白酶直接获得这些毒素的活性片段。
如文中公开的，可将毒素截短并仍保持功能活性，这也在本发明的范围内。“截短毒素”表示可将毒素蛋白质的部分进行切割并在切割后仍显示活性。切割可通过昆虫肠内或肠外的蛋白酶达到。此外，可用分子生物学技术产生有效切割的蛋白质，其中编码所述毒素的DNA碱基通过用限制性内切酶消化或其它本领域技术人员可获得的技术。进行截短后，所述蛋白质可在外源系统如大肠杆菌、杆状病毒、基于植物的病毒系统；酵母等等中进行表达并然后置于文中公开的昆虫测定中以确定活性。本领域熟知可成功产生截短毒素，这样虽然其小于全长的完整序列，但仍保留了功能活性。B.t.毒素可以以截短(核心毒素)形式进行应用是本领域公知的。参见，例如，Adang等人，Gene 36289-300(1985)，“苏云金芽孢杆菌库尔斯塔克HD-73亚种晶体蛋白质的全长及截短质粒克隆的定性及它们对烟草天蛾的毒性”。有保留杀虫活性的截短蛋白质的其它实例，包括昆虫保幼激素酯酶(加利福尼亚大学的美国专利号5,674,485)。如文中应用的，术语“毒素”也表示功能活性截短形式。另一方面，可添加原毒素部分(一般在模式B.t.Cry毒素的C末端部分)以形成有活性的全长蛋白质。参见，例如，美国专利号6,218,188。
文中也特别示例了本发明的某些毒素。由于这些毒素只是本发明毒素的示例，本发明包含与示例毒素有相同或相似杀虫活性的变体或等同毒素(及编码等同毒素的核苷酸序列)是显而易见的。等同毒素与示例毒素有氨基酸相似性(和/或同源性)。氨基酸同一性一般大于60％，优选大于75％，更优选大于80％，甚至更优选大于90％并可大于95％。也可将优选的本发明多核苷酸及蛋白质根据更特定的同一性和/或相似性范围进行定义。例如，与文中示例序列相比，同一性和/或相似性可为49，50，51，52，53，54，55，56，57，58，59，60，61，62，63，64，65，66，67，68，69，70，71，72，73，74，75，76，77，78，79，80，81，82，83，84，85，86，87，88，89，90，91，92，93，94，95，96，97，98或99％。除了另外详细说明外，如文中应用的两个核酸序列同一性和/或相似性的百分数用Karlin和Altschul(1990)，Proc.Natl.Acad.Sci.USA 872264-2268，如在Karlin和Altschul(1993)，Proc.Natl.Acad.Sci.USA 905873-5877中经改进的运算法则进行确定。此种运算法则在Altschul等人(1990)，J.Mol.Biol.215402-410的NBLAST和XBLAST程序中进行引用。用NBLAST程序进行BLAST核苷酸搜索，分值＝100，字长＝12。为获得用于比较的缺口比对，如Altschul等人(1997)，Nucl.Acids Res.253389-3402描述应用缺口BLAST。当应用BLAST及缺口BLAST程序时，应用了各自程序(NBLAST及XBLAST)的默认系数。参见NCBI/NIH网站。分值可用以上背景部分描述的Crickmore等人的方法及运算法则进行计算。
在说明生物学特性或参与决定最终与生物学活性有关的三维构象的毒素的关键区中，氨基酸同源性/相似性/同一性最高。在这点上，某些氨基酸替代是可接受的并预计是可容忍的。例如，这些替代可在对活性不是关键的蛋白质区进行替代，分析蛋白质的晶体结构及基于软件的蛋白质结构模型可用于确定可进行修饰(用定点诱变、改组等)的蛋白质区以真正改变蛋白质的性质和/或增加蛋白质功能。
也可改变蛋白质的多种性质及靶向3D特征而对蛋白质的活性/功能性没有副面影响。预计可容忍/对分子的三维构象没有副面影响的保守氨基酸替代。氨基酸分为以下类非极性、不带电荷极性、碱性及酸性。藉此一类氨基酸被另一同型的氨基酸取代，只要替代对化合物的生物学活性无害的氨基酸替代在本发明的范围内。表1提供了属于一类氨基酸的实例表。
在一些情况下，也可进行非保守性替代。关键因素是这些替代必需对毒素的功能性/生物学活性没有明显损害。
如文中应用的，谈及“经分离”多核苷酸和/或“经纯化”毒素是指它们与在自然界发现的其它相关分子不再相关的这些分子。因此，如文中描述的，谈及“经分离”和/或“经纯化”表示有“人工”的参与。例如，置于植物中用于表达的本发明细菌毒素“基因”为“经分离多核苷酸”。同样，如文中示例的，通过植物产生的类芽孢杆菌蛋白质是“经分离蛋白质。”由于遗传密码的简并性/冗余性，多种不同DNA序列可编码文中公开的氨基酸序列。产生编码相同或基本上相同毒素的备选DNA序列是在本领域熟练技术人员的技术内。这些变体DNA序列在本发明的范围内。
优化用于在植物中表达的序列为了在植物中获得异源基因的高表达，可优选重新改造所述基因使它们在植物细胞(的细胞质)中有效表达。玉米是在转化前可优选重新设计异源基因以增加其在所述植物中表达水平的此种植物。因此，在设计编码细菌毒素基因设计中的额外步骤是重新改造异源基因用于优化表达。
用于重新改造细菌毒素用于在玉米中表达的一个原因是由于天然基因的非最佳G+C含量。例如，许多天然细菌基因非常低的G+C含量(及随之发生的偏向高A+T含量)导致产生模拟或复制已知为高度富含A+T的植物基因控制序列的序列。导入植物基因的DNA中一些富含A+T序列的存在(例如，一般在基因启动子中发现的TATA盒区)可导致基因的异常转录。另一方面，在经转录mRNA存在的其它调控序列的存在(例如，多腺苷酸化信号序列(AAUAAA)或与参与前mRNA剪接的核内小RNA互补的序列)可导致RNA的不稳定性。因此，设计编码细菌毒素基因用于玉米表达，更优选是指植物优化基因的一个目标是产生有较高G+C含量，并优选地为与编码代谢酶的玉米基因相近的DNA序列。设计编码细菌毒素的植物优化基因的另一个目标是产生其中对序列修饰的不阻碍翻译的DNA序列。
下表(表2)表示了玉米中的G+C含量如何高。对于表2的数据，基因的编码区是从基因库(Release 71)得到的，其碱基组成用MacVector程序(Accelerys，Burlington，MA)进行计算。在计算中忽略了内含子序列。
由于通过遗传密码简并性/冗余性赋予的可塑性(即一些氨基酸由一种以上的密码子表示)，不同生物体或生物体不同类的基因组的进化导致冗余密码子的不同选择。此“密码子偏倚性”反映在蛋白质编码区的平均碱基组成中。例如，有相对低G+C含量的生物体利用在简并密码子第三位有A或T的密码子，而有较高G+C含量的生物体利用在第三位有G或C的密码子。认为mRNA中“稀有”密码子的存在可降低mRNA的绝对翻译率，特别是当对应于稀有密码子的相对丰富的带电荷tRNA低时。此现象的延伸是个别稀有密码子翻译率降低可引起至少对多个稀有密码子进行叠加。因此，有相对高含量稀有密码子的mRNA可有对应的低翻译率。此翻译率通过随后低水平的经编码蛋白质反应出来。
在编码用于玉米(或其它植物，如棉花或大豆)表达的细菌毒素的重新改造基因中，确定了植物的密码子偏倚性。对于玉米的密码子偏倚性是统计该植物用于编码它的蛋白质的密码子分布并且优选的密码子选择在表3中进行显示。确定偏倚性后，确定目的基因中密码子的百分率。确定植物优选的第一密码子以及优选的第二及第三密码子的选择。然后，将目的细菌毒素的氨基酸序列进行反向翻译以使核酸序列正好编码天然基因进行异源表达时所产生的相同蛋白质。用密码子偏倚信息对新DNA序列进行设计，以使它对应目的植物的最优选密码子。然后对新序列用于通过修饰可产生的限制性内切酶位点进行分析。鉴定的位点通过用第二或第三选择的优选密码子替代进行进一步修饰。序列中可影响目的基因转录或翻译的其它位点为外显子内含子连接处(5’或3’)，多聚A添加信号或RNA聚合酶终止信号。将序列进一步进行分析及修饰以降低TA或GC双联体的频率。除了双联体外，具有同时多于约四个残基的G或C序列块可影响序列的转录。因此，序列块也可通过用下一选择的优选密码子替代第一或第二选择的密码子等将这些序列块进行修饰。
.sup.a括号内给出类型基因数目。
.sup.b括号内给出了标准差。
.sup.c平均计算中忽略的组合组平均值优选编码包含第一选择密码子约63％，第二选择密码子约22％至约37％之间及第三选择密码子约15％至约0％之间(其中总百分率为100％)的细菌毒素的植物优化基因。最优选包含第一选择密码子约63％，第二选择密码子至少约22％，第三选择密码子约7.5％及第四选择密码子约7.5％(其中总百分率为100％)的植物优化基因。用于玉米表达的改造基因优选的密码子选择在表3中显示。以上描述的方法使本领域技术人员能修饰用于特定植物的外源基因以使基因在植物中最佳表达。此方法在PCT申请WO97/13402中进一步阐明。
为了设计编码细菌毒素的植物优化基因，如表2显示的那样用建立自对特定植物基因序列编译的密码子偏倚表的非冗余遗传密码，将所述蛋白质的氨基酸序列反向翻译成DNA序列。将得到的密码子选择完全均一的DNA序列进一步修饰以建立这样的DNA序列，所述DNA序列除了有较高程度密码子多样性外，也包含战略上放置的限制性酶位点、需要的碱基组成及缺乏可能干扰基因转录或产物mRNA翻译的序列。
*用于玉米的第一及第二优选密码子。
因此，与本发明毒素/基因功能性相等的合成基因可用于转化宿主，包括植物。关于产生合成基因的其它指导可在例如美国专利号5,380,831中找到。
在一些情况下，特别对于在植物中表达，用表达截短蛋白质的截短基因是有益的。例如在以上背景部分讨论的H_fte等人(1989)讨论了B.t.毒素的原毒素及核心毒素节段。优选的截短基因一般编码全长毒素的40，41，42，43，44，45，46，47，48，49，50，51，52，53，54，55，56，57，58，59，60，61，62，63，64，65，66，67，68，69，70，71，72，73，74，75，76，77，78，79，80，81，82，83，84，85，86，87，88，89，90，91，92，93，94，95，96，97，98或99％。
转基因宿主可将本发明的毒素编码基因导入多种微生物或植物宿主中。在优选的实施方案中，应用转基因植物细胞及植物。优选的植物(及植物细胞)为谷物、玉米及棉花。
在优选的实施方案中，毒素基因的表达直接或间接地导致杀虫蛋白质的细胞内产生(及维持)。以这种方式可造成植物对昆虫有抗性。当害虫摄入转基因/重组/转化/转染的宿主细胞(或其内容物)时，害虫也摄入了毒素。这是引起害虫与毒素接触的优选方式。结果是控制(杀死或使得病)害虫。吸吮害虫也可用相似的方式进行控制。备选地，适当的微生物宿主，例如假单胞菌如荧光假单胞菌(P.fluorescens)，可用于存在靶害虫的部位；微生物可在那里增殖，并被靶害虫摄入。带有毒素基因的微生物可在延长毒素活性及稳定细胞的条件下进行处理。然后保持毒素活性的经处理细胞可用于靶害虫的环境中。
如果将靶基因通过适当载体导入到微生物宿主，且所述宿主以存活状态应用于环境时，应该用某些宿主微生物。选择已知占据一种或多种目的作物“植物圈”(叶面，叶圈，根际和/或根面)的微生物宿主。选择这些微生物以便能在特定环境(作物及其它昆虫栖息地)中与野生型微生物进行成功竞争，提供表达多肽杀虫剂的基因稳定维持及表达，并且希望的是，对杀虫剂提供免受环境降解及灭活的经改进保护作用。
已知许多微生物栖息在很多种重要作物的叶面(植物叶的表面)和/或根际(植物根周围土壤)。这些微生物包括细菌、藻类及真菌。特别令人感兴趣的是微生物，如细菌，例如假单胞菌属(Pseudomonas)，欧文氏菌属(Erwinia)，沙雷氏菌属(Serratia)，克雷伯氏菌属(Klebsiella)，黄单胞菌属(Xanthomonas)，链霉菌属(Streptomyces)，根瘤菌属(Rhizobium)，红假单胞菌属(Rhodopseudomonas)，嗜甲基菌属(Methylophilius)，农杆菌属(Agrobacterium)，醋杆菌属(Acetobacter)，乳杆菌属(Lactobacillus)，节杆菌属(Arthrobacter)，固氮菌属(Azotobacter)，明串珠菌属(Leuconostoc)及产碱杆菌属(Alcaligenes)；真菌，特别是酵母，例如，酵母属(Saccharomyces)，隐球酵母属(Cryptococcus)、克鲁维酵母属(Kluyveromyces)、掷孢酵母属(Sporobolomyces)、红酵母属(Rhodotorula)及短柄霉属(Aureobasidium)。特别令人感兴趣的是植物圈细菌种如丁香假单胞菌(Pseudomonas syringae)，荧光假单胞菌(Pseudomonas fluorescens)，褪色沙雷氏菌(Serratia marcescens)，木糖醋杆菌(Acetobacter xylinum)，根癌农杆菌(Agrobacterium tumefaciens)，类球红假单胞菌(Rhodopseudomonas spheroides)，野油菜黄单胞菌(Xanthomonascampestris)，苜蓿根瘤菌(Rhizobiurn melioti)，富氧粪产碱菌(Alcaligenesentrophus)及瓦黑兰德固氮菌(Azotobacter vinlandii)；及植物圈酵母种如深红酵母(Rhodotorula rubra)，红酵母(R.glutinis)，海滨红酵母(R.marina)，橙黄红酵母(R.aurantiaca)，浅白隐球酵母(Cryptococcusalbidus)，流散隐球酵母(C.diffluens)，变黄罗伦隐球酵母(C.laurentii)，罗斯酵母(Saccharomyces rosei)，普地酵母(S.pretoriensis)，酿酒酵母(S.cerevisiae)，掷孢酵母(Sporobolomyces roseus)，香气掷孢酵母(S.odorus)，佛地克鲁维酵母(Kluyveromyces veronae)及出芽短梗霉(Aureobasidium pollulans)也是令人感兴趣的色素微生物。
插入基因以形成转基因宿主本发明的一方面是用表达本发明蛋白质的本发明多核苷酸转化/转染植物、植物细胞和其它宿主细胞。以这种方式转化的植物可对靶害虫的攻击产生抗性。
可获得很多种方法用于在允许基因稳定维持及表达条件下，将编码杀虫蛋白质的基因导入到靶宿主中。这些方法对本领域技术人员是公知的并例如，在美国专利号5,135,867中的描述。
例如，可获得许多包含大肠杆菌中的复制系统及允许选择经转化细胞的标记物的克隆载体用于向高等植物插入外源基因的制备。载体包括，例如pBR322，pUC系列，M13mp系列，pACYC184等。因此，编码毒素的序列可在适当的限制性位点插入到载体中。将获得的质粒转化到大肠杆菌中。将大肠杆菌细胞在适当的培养基中进行培养，然后进行收获并裂解。重新获得质粒。作为分析方法一般进行序列分析，限制性分析，电泳及其它生物化学-分子生物学方法。在每一操作后，应用的DNA序列可进行切割及与下一个DNA序列连接。每个质粒序列可克隆入相同或其它质粒中。根据向植物中插入目的基因的方法，可能需要其它DNA序列。例如，如果Ti或Ri质粒用于转化植物细胞，则Ti或Ri质粒T-DNA的至少右边界，但常常是右边界及左边界与将插入基因的侧翼区进行连接。用于转化植物细胞的T-DNA的应用已进行了深入研究并在EP 120 516；Hoekema(1985)在The Binary Plant Vector System，Offset-durkkerij Kanters B.V.，Alblasserdam，第5章；Fraley等人，Crit.Rev.Plant Sci.41-46；和An等人(1985)EMBO J.4277-287中进行了与描述。
可获得许多用于向植物宿主细胞中插入DNA的技术。这些技术包括使用T-DNA通过根癌农杆菌(Agrobacterium tumefaciens)或发根农杆菌(Agrobacterium rhizogenes)转化、融合、注射、微粒轰击(biolistics)或电穿孔以及其它可能方法进行转化。如果应用农杆菌用于转化，将欲插入的DNA克隆到特定质粒中，即或插入到中间载体或插入到双元载体中。由于具有与T-DNA中序列同源的序列，中间载体可通过同源重组整合到Ti或Ri质粒中。Ti或Ri质粒也包含对T-DNA转移所必需的vir区。中间载体本身不能在农杆菌中复制。中间载体可通过辅助质粒(结合)转移到根癌农杆菌中。双元载体本身可在大肠杆菌及农杆菌中复制。它们包含构建在T-DNA右边界区及左边界区的选择标记基因及接头或多接头。它们可直接转化到农杆菌中(Holstersetal. Mol.Gen.Genet.163181-187)。用作宿主细胞的农杆菌包含携带vir区的质粒。Vir区是用于向植物细胞中转移T-DNA必需的。可包含额外T-DNA。如此转化的细菌用于转化植物细胞。植物外植体可与根癌农杆菌或发根农杆菌方便地进行培养，用于向植物细胞中转移DNA。然后整株植物在可包含用于筛选的抗生素或杀生物剂的适当培养基中从受感染植物材料(例如，叶片、茎段、根，还有原生质体或经悬浮培养细胞)再生。然后对如此获得的植物是否存在经插入DNA进行检测。关于注射及电穿孔的质粒无特殊需求，用常规质粒如例如pUC衍生物是可能的。
经转化细胞在植物体内以常规方式生长。它们可形成生殖细胞并将经转化特性传递给子代植物。此类植物可以正常方式进行生长并与具有相同的经转化遗传因子或其它遗传因子的植物进行杂交。得到的杂交个体具有相应的表型特征。
在本发明的一些优选实施方案中，编码细菌毒素的基因从插入到植物基因组中的转录单位进行表达。优选地，所述转录单位为能稳定整合到植物基因组中并能选择表达编码所述蛋白质的mRNA的经转化植物品系的重组载体。
一旦经插入的DNA整合到基因组中，则所述经插入DNA在基因组中相对稳定(并不再出来)。它通常包含使经转化植物细胞可抵抗杀生物剂或抗生素，如卡那霉素、G418、博来霉素、潮霉素或氯霉素等的选择标记。因此单独使用的标记允许选择经转化细胞，而不是选择不包含经插入DNA的细胞。目的基因优选通过组成型或可诱型导启动子在植物细胞中表达。mRNA一旦表达，即翻译成蛋白质，由此将目的氨基酸整合到蛋白质中。编码毒素的基因在植物细胞中的表达可在组成型启动子、组织特异型启动子或可诱导型启动子的控制下。
存在几种技术用于向植物细胞导入外源重组载体并用于获得稳定维持并表达所导入基因的植物。此类技术包括将包裹在微粒上的遗传物质直接导入到细胞中(Cornell的美国专利号4,945,050及DowElanco的，现在为Dow AgroSciences，LLC的5,141,131)。此外，植物可用农杆菌技术进行转化，参见Toledo大学的美国专利号5,177,010；Texas A&M的5,104,310；欧洲专利申请0131624B1；Schilperoot的欧洲专利申请120516，159418B1及176,112；Schilperoot的美国专利号5,149,645，5,469,976，5,464,763及4,940,838及Schilperoot的4,693,976；均属于Max Planck的欧洲专利申请116718，290799，320500；日本烟草局的欧洲专利申请604662及627752，及美国专利号5,591,616；均属于Ciba Geigy现在为Novartis的欧洲专利申请0267159及0292435，及美国专利号5,231,019；均属于Calgene的美国专利号5,463,174及4,762,785；及均属于Agracetus的美国专利号5,004,863及5,159,135。其它转化技术包括whiskers技术。参见均属于Zeneca的美国专利号5,302,523及5,464,765。电穿孔技术也用于转化植物。参见Boyce Thompson研究所的WO87/06614；均属于Dekalb的美国专利号5,472,869及5,384,253；及均属于Plant Genetic Systems的WO 92/09696及WO 93/21335。此外，病毒载体也可用于产生表达目的蛋白质的转基因植物。例如，单子叶植物可用属于Mycogen Plant Science和Ciba-Giegy，现在为Novartis的美国专利号5,569,597以及均属于Biosource的美国专利号5,589,367及5,316,931描述的方法用病毒载体进行转化。
如以前阐述的，DNA构建体导入到植物宿主的方式对本发明不是关键性的。可使用提供用于有效转化的任何方法。例如，用于植物细胞转化的多种方法在文中进行描述并包括用Ti或Ri质粒等进行农杆菌介导的转化。在许多情况下，希望将用于转化的构建体的一侧或两侧邻近T-DNA边界，更具体地为右边界。当构建体应用根癌农杆菌或发根农杆菌转化时，这是特别有用的，虽然T-DNA边界可在其它转化方式中找到其它用途。当农杆菌用于植物细胞转化时，可应用可导入到宿主中用于与宿主中存在的T-DNA或Ti或Ri质粒同源重组的载体。导入载体可通过电穿孔、三亲杂交及其它本领域技术人员已知的用于转化革兰氏阴性细菌的其它技术进行。载体导入到农杆菌宿主中的方式对本发明不是关键性的。包含T-DNA的用于重组的Ti或Ri质粒可能或不能引起菌瘿形成，并且只要在所述宿主中存在vir基因，这对所述发明并不是关键性的。
在农杆菌用于转化的一些情况下，如文中引用作为参考的Ditta等人描述的(PNAS USA(1980)777347-7351及EPO 0120 515)，将在T-DNA边界内的表达构建体插入到广谱载体如pRK2或其衍生物中。表达构建体及T-DNA内包括文中描述的允许选择经转化农杆菌及经转化植物细胞的一个或多个标记。利用的特别标记对本发明不是必需的，优选的标记取决于所用的宿主及构建体。
对于用农杆菌转化植物细胞，可将外植体与经转化农杆菌进行组合并孵育足够时间以使其转化。转化后，通过用适当的抗生素筛选将农杆菌杀死并且植物细胞用适当的选择性培养基进行培养。一旦形成愈伤组织，根据本领域公知的植物组织培养及植物再生的方法，可通过利用适当植物激素促进枝条形成。然而，愈伤组织中间期不一定是必需的。枝条形成后，将所述植物细胞转移到促进根形成的培养基中，因此完成植物再生。然后植物可长大结种并且所述种子可用于建立后代。不管转化技术为何种技术，编码细菌毒素的基因优选整合到适合在植物细胞中表达所述基因的基因转移载体，其中所述载体中包括植物启动子调节元件以及3’非翻译转录终止区如Nos等。
除了用于转化植物的许多技术外，与外源基因接触的组织型也可变化。此类组织包括但不限于胚发生组织，愈伤组织组织I，II和III型，下胚轴，分生组织，根组织，用于在韧皮部表达的组织等。几乎所有植物组织可在去分化期间用文中描述的适当方法进行转化。
如以上阐述的，如果需要，可用多种可选择标记。对特定标记的优选是由技术人员决定的，但以下任何可选择标记可与任何文中没有列出的作为可选择标记发挥作用的其它基因一起应用。此类可选择标记包括但不限于编码抗抗生素卡那霉素、新霉素及G418的转座子Tn5(AphII)的氨基糖苷磷酸转移酶基因以及编码用于抵抗或耐受草甘瞵；潮霉素；氨甲蝶呤；膦丝菌素(双丙氨膦)；咪唑啉酮，磺酰脲及三唑并嘧啶除草剂，如氯硫磺；溴草腈，茅草枯等的那些基因。
除可选择标记外，还希望应用报道基因。在一些情况下，报道基因可在有或无可选择标记时应用。报道基因为一般在受体生物体或组织中不存在，并且一般编码的蛋白质导致一些表型变化或具有酶特性的基因。K.Wising等人，Ann.Rev.Genetics，22，421(1988)提供了此类基因的实例。优选的报道基因包括大肠杆菌uidA基因座的β-葡糖苷酸酶(GUS)，来自大肠杆菌Tn9的氯霉素乙酰转移酶基因，来自生物发光水母维多利亚水母(Aequorea victoria)的绿色荧光蛋白及来自北美萤火虫(Photinuspyralis)的萤光素酶基因。然后可在所述基因导入到受体细胞后的适当时间检测报道基因表达。优选的此种测定法需要如通过Jefferson等人(1987Biochem.Soc.Trans.15，17-19)描述的应用编码大肠杆菌uidA基因座β-葡糖苷酸酶(GUS)的基因以鉴定经转化细胞。
除植物启动子调节元件外，来自多种来源的启动子调节元件可有效用于在植物细胞中表达外源基因。例如可应用细菌源的启动子调节元件，如章鱼氨酸合酶启动子，胭脂氨酸合酶启动子，甘露氨酸合酶启动子；病毒源启动子，如花椰菜花叶病毒(35S及19S)，35T(为重新改造的35S启动子，参见美国专利号6,166,302，特别是实施例7E)等等。植物启动子调节元件包括但不限于核酮糖-1，6-二磷酸(RUBP)羧化酶小亚单位(ssu)，β-伴大豆球蛋白启动子，β-云扁豆蛋白启动子，ADH启动子，热休克启动子及组织特异的启动子。可存在其它元件如基质附着区，支架附着区，内含子，增强子，多聚腺苷酸化序列等等并因此可改进转录效率或DNA整合性。此类元件对DNA功能可需要或可不需要，虽然它们可通过影响转录、mRNA稳定性等提供更好的DNA表达或功能。由于希望获得经转录DNA在植物中的最佳性能，此类元件可包括在DNA中。典型的元件包括但不限于Adh-内含子1，Adh-内含子6，苜蓿花叶病毒包膜蛋白前导序列，玉米条纹病毒包膜蛋白前导序列，以及技术人员可获得的其它元件。因此组成型启动子调节元件也可在所有细胞型中于任何时候均指导持续的基因表达(例如，肌动蛋白，遍在蛋白，CaMV 35S等等)。组织特异启动子调节元件负责在特定细胞或组织型如叶或种子中的基因表达(例如玉米醇溶蛋白，油质蛋白，napin，ACP，球蛋白等等)并且也可应用此类启动子。
启动子调节元件也可在植物发育的某阶段有活性以及在植物组织及器官中有活性。此类实例包括但不限于花粉特异、胚特异、玉米穗特异、棉花纤维特异、根特异、种子胚乳特异的启动子调节元件等。在某些情况下，希望应用诱导型启动子调节元件，其负责对特异信号如物理刺激(热休克基因)、光(RUBP羧化酶)、激素(Em)、代谢物、化学物及应激作出反应的基因表达。可应用在植物中发挥作用的其它所需转录及翻译元件。许多植物特异的基因转移载体是本领域公知的。
可用标准分子生物学技术对文中描述的毒素进行克隆及测序。其它信息可在此处引用作为参考的Sambrook，J.，Fritsch，E.F.和Maniais，T.(1989)，Molecular Cloning，A Laboratory Manual(Cold Spring Harbor出版社)一书中找到。
抗性控制随着杀虫蛋白质在转基因植物中商品化应用的增加，一个须考虑的问题是抗性控制。有许多公司在他们的产品中应用苏云金芽孢杆菌毒素，然而一些昆虫会产生B.t.毒素抗性是令人担心的。一个用于昆虫抗性控制的策略是将致病杆菌，光杆状菌等产生的TC毒素等等与毒素如B.t.(晶体毒素，来自芽孢杆菌菌株的可溶性杀虫蛋白质(参见，例如WO98/18932及WO99/57282))或其它昆虫毒素进行组合。组合物可制备为用于可喷雾应用或可为分子组合物。植物可用产生两个或多个不同昆虫毒素的细菌基因进行转化(参见，例如Gould，38 Bioscience 26-33(1988)及美国专利号5,500,365；同样，欧洲专利申请0 400 246 A1及美国专利5,866,784；5,908,970及6,172,281也描述了用两个B.t.晶体毒素转化植物)。另一个产生包含多个昆虫抗性基因的转基因植物的方法是首先产生两种植物，每种植物包含一种昆虫抵抗基因。然后将这些植物用传统植物育种技术进行杂交以产生包含一种以上昆虫抗性基因的植物。因此，如文中应用的“包含多核苷酸”的短语除了另外特别指明外表示至少一个多核苷酸(且可能更多，为连续或不连续的)。
剂型及其它递送系统制备成包含目标类芽孢杆菌分离株的芽孢和/或晶体的诱饵颗粒或包含获自文中公开分离株基因的重组微生物，可应用于土壤。经制成产物可作为种子包衣应用或在作物周期晚期进行根处理或整个植物处理而应用。植物及土壤处理细胞可通过与多种惰性物质，如无机矿物质(叶硅酸盐、碳酸盐、硫酸盐、磷酸盐等等)或植物材料(粉碎的玉米芯、稻壳、核桃壳等等)混合用作可湿性粉剂、颗粒剂或粉剂。剂型可包括展布-粘着(spreader-sticker)佐剂、稳定剂、其它杀虫添加剂或表面活性剂。液体剂型可为基于水的或非水的并用作泡沫、凝胶、悬液、乳油等等。成分可包括流变剂、表面活性剂、乳化剂、分散剂或聚合物。
如本领域技术人员理解的，杀虫浓度可有很大变化，这取决于特定的剂型特性，特别是其为浓缩物还是直接应用。杀虫剂可占重量的至少1％，并可占重量的100％。干燥剂型可具有约1-95％重量的杀虫剂，而液体剂型一般在液相中具有约1-60％的固体重量。剂型一般具有约从102至约104个细胞/毫克。这些剂型在每公倾上使用约50mg(液体或干燥物)至1kg或更多。
剂型可通过喷雾、撒粉、喷洒等等应用到害虫的环境中，例如土壤或树叶。
另一个递送方式是将毒素的遗传物质整合到杆状病毒载体中。杆状病毒感染特定昆虫宿主，包括希望用毒素靶向的宿主。可将携带毒素表达构建体的感染性杆状病毒导入到昆虫出没地区以毒死经感染的昆虫。
昆虫病毒或杆状病毒已知感染并对某些昆虫有不利作用。病毒对昆虫的作用缓慢，并且病毒不立即停止昆虫的摄食。因此，不认为病毒是最佳的虫害控制剂。然而，将毒素基因组合到杆状病毒载体中可提供传播毒素的有效途径。此外，由于不同杆状病毒对不同昆虫是特异的，用特定毒素选择性靶向特定实施损害的虫害是可能的。用于毒素基因的特别有用的载体是核多角体病毒。已对使用此病毒的转移载体进行了描述并且现在是用于转移外源基因进入昆虫的选择载体。病毒-毒素基因重组体可以经口传播形式进行构建。杆状病毒通常通过中肠肠粘膜感染昆虫。可将插入到强病毒包膜蛋白启动子后的毒素基因进行表达并快速杀死经感染昆虫。
除了用于本发明蛋白质毒素的昆虫病毒或杆状病毒或转基因植物递送体系外，蛋白质可用苏云金芽孢杆菌包囊技术(诸如但不限于文中引用作为参考的美国专利号4,695,455；4,695,462；4,861,595)进行包裹。用于本发明蛋白质毒素的另一递送体系为将蛋白质制入诱饵基质，然后将诱饵基质应用到地上及地下昆虫诱饵站中。此类技术的实例包括但不限于文中引用作为参考的PCT专利申请WO93/23998。
基于植物RNA病毒的系统也用于表达细菌毒素。在如此做时，可将编码毒素的基因插入到感染目的宿主植物的适当植物病毒的包膜启动子区。然后毒素进行表达，由此对来自昆虫损害的植物提供保护。基于植物RNA病毒的系统在Mycogen Plant Sciences，Inc.的美国专利号5,500,360 to及Biosource Genetics公司的美国专利号5,316,931及5,589,367中进行了描述。
除了产生经转化植物外，希望有对细菌基因进行重新改造的其它递送系统。例如，蛋白质毒素可通过与吸引昆虫的分子融合而构建，从而作为带毒素的食物源。在实验室中纯化后可将有“内部”诱饵的此种毒性剂包装进标准昆虫诱捕房中。
突变体本发明DAS1529及DB482分离株的突变体可通过本领域公知的方法进行制备。例如，不产孢子突变体可通过用甲磺酸乙酯(EMS)诱变分离株而获得。突变体可通过本领域公知的方法用紫外线及亚硝基胍进行制备。
所有文中谈及的或引用的专利、专利申请、临时申请及出版物完整并入本文，使它们与本说明书的明确教导相一致的程度在文中引用作为参考。
以下为说明实行本发明步骤的实施例。这些实施例不作为限制。除非另外注明，所有百分率为重量百分率且所有溶剂混合物比例为体积比例。
实施例1-DAS1529作为类芽孢杆菌种的分离及杀虫活性的发现发现称为DAS1529的细菌菌株产生对新生鳞翅目昆虫谷实夜蛾(cornearworm；CEW)、烟芽夜蛾(TBW)及烟草天蛾(THW)具有生长抑制的因子。
DAS1529在添加1.25％NaCl的2％蛋白酶蛋白胨3号(PP3)培养基(Difco Laboratories，Detroit，MI)或在添加0.2％葡萄糖的JB培养基中进行培养。细菌培养物于25℃，150转/分钟生长～40小时。
杀虫活性因子最初在5kDa分子量截止滤波器浓缩的发酵培养液中发现。这些因子是不耐热的(通过于85℃加热20分钟进行灭活)。这些数据表明因子为蛋白质性质的。也参见实施例4末尾。
为鉴定细胞沉淀物中的活性因子，将细菌培养物于8000转/分钟在4℃进行离心5分钟，用无菌蒸馏水洗涤一次，并在无菌蒸馏水中重新悬浮至33X原培养体积，并如以下实施例3描述的进行昆虫生物试验。对DAS1529菌株的生物测定数据在表4中进行了总结。数据显示培养培养液及经浓缩DAS1529细菌细胞对CEW(在33X时，有30至50％死亡率)及TBW(在33X时有100％死亡率)有好的活性。DAS1529中的这些毒素因子与靶向研发谷物及棉花中鳞翅目昆虫(例如，CEW及TBW)的商品化转基因产物有重要相关性。
*n.d.-没有测定；-，++，+++，分别为无，中等及高活性实施例2-DAS1529的分类进行了分子种系发生以确定DAS1529菌株的分类学关系。确定了DAS1529 16SrDNA的核苷酸序列并用于相似性及系统进化分析(用来自ABI的MicroSeq试剂盒)。序列作为SEQ ID NO16进行提供。BLAST检索结果如下
核心E(比特)值gi|15395282|emb|AJ320490.1|PTH320490 解硫胺素类芽孢杆菌 29060.0gi|3328014|gb|AF071859.1|AF071859 日本甲虫类芽孢杆菌s... 28340.0gi|3328015|gb|AF071860.1|AF071860 日本甲虫类芽孢杆菌s... 28150.0gi|2769591|emb|Y16129.1|PS16SC168 类芽孢杆菌C-168 1... 26990.0gi|2769590|emb|Y16128.1|PS16ST168 类芽孢杆菌T-168 1... 25090.0gi|2077917|dbj|D78475.1|D78475 解硫胺素类芽孢杆菌25030.0gi|3328016|gb|AF071861.1|AF071861 缓病类芽孢杆菌 24930.0gi|2895560|gb|AF039408.1| Racillus tipchiralis 16S核糖体 24930.0gi|2077936|dbj|D88513.1|D88513 解硫胺素类芽孢杆菌24930.0gi|15395283|emb|AJ320491.1|PAL320491 蜂房类芽孢杆菌pa...24040.0来自BLAST检索的这些相同高分值序列也用来自GCG 10.2版的缺口程序(Needleman和Wunsch，J.Mol.Biol.48；443-453(1970))进行比较，有以下结果％Ident％Simgi|15395282|emb|AJ320490.1|PTH320490 解硫胺素类芽孢杆菌 99.2 99.6gi|3328014|gb|AF071859.1|AF071859 日本甲虫类芽孢杆菌s... 99.299.6gi|3328015|gb|AF071860.1|AF071860 日本甲虫类芽孢杆菌s... 99.299.3gi|2769591|emb|Y16129.1|PS16SC168 类芽孢杆菌C-168 1... 97.197.3gi|2769590|emb|Y16128.1|PS16ST168 类芽孢杆菌T-168 1... 97.497.4gi|2077917|dbj|D78475.1|D78475 解硫胺素类芽孢杆菌96.598.1gi|3328016|gb|AF071861.1|AF071861 缓病类芽孢杆菌 98.898.9gi|2895560|gb|AF039408.1| Bacillus tipchiralis 16S核糖体 96.096.9gi|2077936|dbj|D88513.1|D88513 解硫胺素类芽孢杆菌96.798.7gi|15395283|emb|AJ320491.1|PAL320491 蜂房类芽孢杆菌pa...95.295.3[％Ident明确碱基的配对；％Sim％Ident加上潜在匹配的不明确碱基]许多相关序列，包括以上注明的高分值序列，也用序列对比程序CLUSTRAL W(Thompson，J.D.，D.G.Higgins和T.J.Gibson，NucleicAcids Res.224673-4680，1994)，通过Shida等人的描述(Int.J.Syst.Bacteriol.47289-298，1997)进行整理及排列。结果清楚地将DAS1529列入Pettersson等人鉴定的类芽孢杆菌属中的日本甲虫类芽孢杆菌/缓病类芽孢杆菌亚群(Int.J.Syst.Bacteriol.49531-540，1999)，并与以上报导的分析一致。此亚群包括昆虫相关种日本甲虫类芽孢杆菌、缓病类芽孢杆菌及解硫胺素类芽孢杆菌(类芽孢杆菌T-168及C-168种)，及已知没有昆虫相关性的“Bacillus tipchiralis”(Pettersson等人，1999)。如Wayne等人(Int.J.Syst.Bacteriol.37463-464，1987)及Vandamme等人(Microbiol.Rev.60407-438)指出的，大于97％同一性的rDNA序列在没有额外信息时，一般不可用于将细菌菌株归入特定种中。对于DAS1529，对鳞翅目的杀虫活性及硫胺素酶的证据与已知的日本甲虫类芽孢杆菌及缓病类芽孢杆菌不一致，昆虫相关性与已知的解硫胺素类芽孢杆菌(以及其它亚群种)也不一致。
因为其它类芽孢杆菌菌株已知为对日本甲虫(Popillia jalonica)幼虫引起乳白病的病原因子(Harrison等人，2000)，将DAS1529对日本甲虫的亲缘物种六月甲虫(June beetles)的活性进行检测。对于在JB与PP3培养基中生长的培养物没有发现活性。显微镜检查这些培养物显示菌体均匀着色，无可见孢子形成或不存在伴孢晶体。我们能显示DAS1529可在定义的培养基及培养条件以及烟草天蛾的血淋巴中形成孢子。已知具有日本甲虫活性的类芽孢杆菌菌株一般与多分孢子及类芽孢体相关(Harrison等人，2000)。
需要额外工作以确定DAS1529是否属于存在种或应归入新种命名。
实施例3-昆虫生物试验方法应用两种昆虫生物试验方法以获得以下列出的结果。96孔形式及128孔形式用于最初筛选抗鳞翅目昆虫的活性。24孔加入食物的形式用于确定毒素的特异活性(LC50)。
对于96孔形式，人工食物分装到96孔微滴度板中。每孔测量为大约0.32cm2并包含150μl人工食物。样本/毒素以50μl/孔用于发酵培养液、细胞沉淀物及经纯化毒素。包括适当剂量的阳性对照(Cry1Ac)及高剂量的阴性对照(水，空白培养基，不表达靶毒素的细菌宿主菌株)。使样本干燥大约1-3小时以便样本丧失湿度，但食物仍保留湿度。将昆虫卵分散到经样本处理食物的表面上，或每孔种上单一昆虫幼虫。经感染板用铁上(iron-on)聚酯薄膜覆盖或用带孔粘性盖覆盖。在聚酯薄膜上制备小气孔以保证昆虫的空气供应。板于28℃孵育5天并对死亡率及发育障碍进行评分。这在每孔基础上进行，由于每孔中常沉积多个卵，故忽略每孔中幼虫的数目。然后指定每一处理的活性分值0＝无活性，幼虫健康度与水对照孔相同，1＝幼虫发育障碍或有一些死亡率的发育障碍，2＝所有幼虫死亡。
样本/毒素的特异活性(LC50)在24孔Nutrend板(Nu-TrendTMContainer Corp.，Jacksonville，FL)中通过掺入食物的生物试验进行确定。昆虫人工食物在应用前进行制备并于55℃水浴中保持液体状态。通过将27ml人工食物与不多于3ml样本/毒素混合进行系列稀释(≥5)。将样本与食物混合物总共30ml进行涡旋30秒，然后平均分装到每个板中，装满每孔容积的～50％。在感染前使板冷却至少30分钟。感染每个孔的受试昆虫，将清晰的聚酯薄膜封在每个包含昆虫的板上。用昆虫针在每孔的聚酯薄膜上打上小孔用于空气循环。试验一般于25℃进行6天，但如果需要更快出来结果，一些可于30℃进行4天。对每一试验进行一组阳性及一组阴性对照。试验基于死亡率进行评分，但对发育障碍的数据也进行记录。对受试样本应用统计学方法评估LC50并用ng或μg/ml食物进行表达。
实施例4-来自DAS1529发酵培养液的杀虫毒素-硫胺素酶的生物化学纯化及表征DAS1529发酵培养液包含对鳞翅目物种，如烟草蚜虫、谷实夜蛾及烟草天蛾的杀虫活性。通过生物化学纯化及表征对杀虫活性的性质进行了研究。在纯化过程中如实施例3所述进行了谷实夜蛾的生物试验，以了解杀虫活性。
DAS1529发酵培养液用添加1.25％NaCl的2％PP3产生，并如实施例1描述的进行处理。根据制造商推荐，用与Amicon M-12过滤装置连接的Amicon(Beverly，MA)螺旋超滤柱S1Y10(10kDa分子量截止)将四升培养液进行浓缩。将存留物用20mM磷酸钠，pH7.0(缓冲液A)进行渗滤，并以5ml/分钟上样于Q琼脂糖凝胶XL阴离子交换柱(1.6×10cm)。用5倍床体积的缓冲液A将柱进行洗涤以去除未结合的蛋白质。毒素活性通过在缓冲液A中的1.0M NaCl进行洗脱。
包含杀虫活性的级分以20ml等份上样至用缓冲液A平衡的凝胶过滤柱Macro-Prep SE 1000/40(2.6×100cm)上。蛋白质用缓冲液A以3ml/分钟流速进行洗脱。收集对谷实夜蛾有活性的级分并以1ml/分钟流速上样于用20mM Tris-HCl，pH7.0(缓冲液B)平衡的MonoQ(1.0×10cm)柱上。与柱结合的蛋白质用缓冲液B中的0至1M NaCl的线性梯度以2ml/分钟洗脱60分钟。对两毫升级分进行收集并如实施例1描述的对活性进行确定。
向以上活性蛋白质级分中加入固体(NH4)2SO4使终浓度为1.7M。然后以1ml/分钟将蛋白质上样于用在50mM磷酸钾缓冲液，pH7(缓冲液C)中含1.7M(NH4)2SO4平衡的苯基-Superose(1.0×10cm)柱。用10毫升缓冲液C洗柱后，将与柱结合的蛋白质用缓冲液C至5mM磷酸钾，pH7.0的线性梯度以1ml/分钟洗脱120分钟。对通过生物试验确定的最强活性级分合并，并用缓冲液A透析过夜。
经透析样本以1ml/分钟上样于用缓冲液B平衡的Mono Q(0.5×5cm)柱。与柱结合的蛋白质通过在缓冲液B中的0至1M NaCl的线性梯度以1ml/分钟进行洗脱。对活性级分合并，并调整(NH4)2SO4终浓度为1.7M。然后以1ml/分钟将蛋白质上样于用缓冲液C平衡的苯基-Superose(0.5×5cm)柱。与柱结合的蛋白质用缓冲液C至5mM磷酸钾，pH7.0的线性梯度以0.5ml/分钟洗脱40分钟。对经纯化级分合并，并用缓冲液A透析过夜。
最终经纯化毒素的分子量通过凝胶过滤柱Superdex S-200进行检查。毒素显示天然分子量大约为40kDa。经纯化毒素的SDS-PAGE显示大约40kDa的明显条带。这表明天然DAS1529毒素(在此级分中)是大约40kDa的单体。
经纯化毒素在4-20％SDS-PAGE中进行电泳并转印到PVDF膜上。将印迹进行氨基酸分析并进行N末端氨基酸序列测定(SEQ ID NO17)。使用所述序列查询而搜索蛋白质数据库(NCBI-NR)，显示它与来自解硫胺素芽孢杆菌的约42kDa硫胺素酶I有95％同一性(Campobasso等人，1998；基因库登录号2THIA；SEQ ID NO18)。部分序列比对在图3中显示，它与基因库登录号AAC44156(硫胺素酶I前体；U17168是用于DNA基因库的相应登录号，所述硫胺素酶I前体可进行表达以得到产生并分泌自细菌细胞的硫胺素酶)存在同样比对。对来自DAS1529的经纯化硫胺素酶对谷实夜蛾(CEW)的作用进行了检测，结果在图4中显示。该毒素不能杀死谷实夜蛾(浓度达8μg/cm2)但在浓度低至5ng/cm2时显示95％的生长抑制作用。也发现经纯化硫胺素酶不被蛋白酶K灭活。
实施例5-克隆编码DAS1529产生的杀虫因子基因为了克隆编码DAS1529产生的杀虫因子的核苷酸序列，用分离自DAS1529的总DNA构建了粘粒文库并对杀虫活性进行了筛选。鉴定了六个产生对谷实夜蛾有杀虫活性的重组粘粒克隆。所述粘粒克隆中有三个产生导致昆虫死亡的不耐热(当加热至85℃持续20分钟)因子。另外三个粘粒克隆产生对昆虫生长抑制的不耐热因子。选择一个产生昆虫死亡的粘粒，命名为粘粒SB12，用于核苷酸序列分析。
A.DAS1529粘粒文库的构建用DNA纯化试剂盒(Qiagen Inc.，Valencia，CA)从DAS1529分离总DNA。载体及插入DNA的制备、连接及包装，按供应商(Stratagene，La Jolla，CA)的说明进行。将作为Sau3AI DNA片段的DAS1529 DNA插入片段克隆入SuperCos 1粘粒载体的BamHI位点。将经连接产物用Gigapack_III金包装提取物进行包装并转染宿主细胞XL1-Blue MRF’。将转化物在LB-卡那霉素琼脂板上进行筛选。粘粒文库由在200μl LB-卡那霉素(50μg/ml)中的10个96孔微滴度板上生长的960个随机挑选克隆组成，用于昆虫活性筛选及长期保存。
B.筛选DAS1529粘粒文库的杀虫活性对于抗鳞翅目昆虫(CEW及TBW)活性的克隆的初步筛选，作为单一菌落的总共960个粘粒克隆在96孔板的2ml培养基中生长。将培养物进行离心，以大约10X浓度重悬于原初培养基中并进行生物试验。包括SuperCos 1载体(SB1)作为阴性对照。从第一轮筛选分离到十六个阳性克隆(SB2至SB17)。进行第二及第三轮筛选以筛选抗TBW及CEW的活性。选择了一个一贯显示最高活性的粘粒克隆(SB12)用于进一步分析。表5总结了SB12粘粒的活性谱(作为经测试的活性谱)。(BAW为甜菜夜蛾(Spodoptera exigua)；ECB为欧洲玉米螟(Ostrinia nubilalis)；SCRW为南方谷类根虫(Diabrotica undecimzpucata howardi))。SB12大肠杆菌(E.coli)培养培养液均不包含CEW活性；因此，SB12中的活性因子与DAS1529菌株培养培养液中的活性因子不同。
*n.d.-未测定；-，++，+++，分别为无，中等，高活性C.SB12粘粒插入片段的序列测定及tc样和cry样ORF的鉴定粘粒SB12的核苷酸序列测定显示它包含一个大约34kb的基因组插入片段。这个序列分析令人惊讶地显示存在至少10个推定可读框(ORF)(参见图2)。令人惊讶地发现经鉴定ORF中六个与以前鉴定的来自发光光杆状菌(Waterfield等人，2001)、嗜线虫致病杆菌(Morgan等人，2001)、Serratia entonaophila(Hurst和Glare，2002；Hurst等人，2000)及鼠疫耶尔森氏菌(Yersinia pestis)(Cronin等人，2001)的tcaA，tcaB，tcaC及tccC有一些程度的氨基酸序列同一性(38-48％)。已显示那些来自光杆状菌，致病杆菌及沙雷氏菌的TC蛋白质基因编码杀虫因子。也非常令人感兴趣的是一个DAS1529 ORF与来自苏云金芽孢杆菌的Cry1Ac有～40％的氨基酸序列同一性，其中所述Cry1Ac为另一个以前鉴定为杀虫因子的基因(Schnepf等人，1998；de Maagd等人，2001)。这些发现对理解细菌界中毒素基因分布及研发用于毒素基因搜索及改造的进一步策略有重要意义。
确定了SB12粘粒的核苷酸序列。进一步分析了41,456bp长的经组装DNA。定位了三处缺口两处位于粘粒载体中，一处位于插入片段中。大约34,000bp的最长毗连序列群的核苷酸序列分析显示存在至少10个推定的可读框(ORF)，它们被鉴定为潜在的起始密码子及其后延伸的可读框。已知在与类芽孢杆菌相关的基因组中这个方法对翻译起始位点的错误鉴定率为19％(枯草芽孢杆菌((Bacillus subtilis))及22％(耐盐芽孢杆菌(Bacillus halodurans))(Besemer，J.，Lomsadze，A.，Borodovsky，M.，Nucleic Acids Res.292607-2618，2001)。因此，在鉴定天然翻译起始位点时，考虑了与枯草芽孢杆菌16S rRNA 5’末端互补的碱基(在Rocha，E.P.C.，Danchin，A.，Viari，A.，Nucleic Acids Res.273567-3576，1999中进行综述)的性质和位置、N末端氨基酸序列及与相关基因的比对。推定的ORF及注释总结在表6中，并在以下进行了更详细的讨论。
粘粒SB12中ORF1开始于DAS1529DNA克隆位点的第一个核苷酸，并因此丢失了其天然翻译起始位点。ORF1与ORF3有显著的DNA序列同源性，并且序列比较分析表明ORF1的头18bp被截短，如ORF3中发现的那样，这前六个密码子编码氨基酸甲硫氨酸-缬氨酸-丝氨酸-苏氨酸-苏氨酸。推测ORF1翻译起始与ORF3的翻译起始相似，从SEQ ID NO1的大约9505碱基到9523碱基处。如以上提及的，基于备选的翻译起始位点，对于ORF2，ORF4及ORF6给出了两个预测的氨基酸序列(SEQ IDNO19及13)。对于ORF2，以上讨论了SEQ ID NO5。备选的及优选的起始位点位于ORF1的3295残基处。因此，从这个起始位点得到的蛋白质开始于SEQ ID NO5的氨基酸残基9(从较好的RBS翻译)。同样，对于ORF4，以上讨论了SEQ ID NO9。备选的及优选的起始位点位于SEQ ID NO1的12,852残基处。得到的蛋白质也丢失了SEQ ID NO9的前八个氨基酸(因此开始于SEQ ID NO8的氨基酸残基9-从较好的RBS翻译)。
实施例6-“重复”TC的序列分析将两个ORF2片段(tcaB1)与ORF4(tcaB2)比较确定序列的同一性程度，并将ORF1(tcaA1)与ORF3(tcaA2)比较确定序列的同一性程度这两对ORF观察到相似的序列关系。
因为本身插入(显然是自发产生的)了插入序列样元件并破坏了ORF2，所以通过合并两个片段而构建了该ORF。参见图2。这个插入片段的位置通过将全长SB12 DNA序列(SEQ ID NO1)与SEQ ID NO4的序列进行分析/比较而确定，其中所述后一序列不反映(非编码)插入片段。如图7的括号所指明的，SEQ ID NO4残基490前的5’翻译产物及从残基491始的3’翻译产物的序列，与ORF4(SEQ ID NO8)排列很好。在明显插入位点处的DNA序列显示为通常在插入元件侧翼发现的9bp直接重复(CACCGAGCA，SEQ ID NO1的4734-4742及6071-6080碱基)。
实施例7-进一步的序列分析总而言之，根据Vector NTI clustalW，GCG和/或Blastp分析，六个经鉴定的ORF(ORF1至ORF6)与tcaA、tcaB、tcaC及tccC(以前鉴定的光杆状菌tc基因)具有38-48％氨基酸序列同一性。ORF7编码与来自苏云金芽孢杆菌的Cry1Ac有～40％氨基酸序列同一性的蛋白质，其中所述Cry1Ac为另一个以前鉴定为杀虫因子的基因。通过将ORF7(Cry1529)与许多其它Cry蛋白质序列比较，产生种系图(图8)。这个系统发育树表明Cry1529与其它日本甲虫类芽孢杆菌Cry序列如Cry18s远缘相关(Zhang等人，1997，Zhang等人，1998)，其中所述Cry18s与Cry2s是相近的。Cry1529落入这样一组Cry蛋白质组中(虽然与其并不接近，但仍是最接近的)，所述组通常含有在鳞翅目中发现的(Cry1，Cry9)毒素、鞘翅目中发现的(Cry3，Cry8，Cry7)毒素及双翅目中发现的(Cry4)毒素，所述Cry蛋白质组与包括线虫毒素Cry5，-12，-13，-14和-21及Cry2，-18比较为不同的组。
在类芽孢杆菌中发现Cry及TC蛋白质基因(在SB12基因组插入片段中)是令人惊讶的并且是新的发现。新Cry及TC蛋白质基因的鉴定与本领域理解的光杆状菌、致病杆菌及苏云金芽孢杆菌相关，并扩展了发现其中存在Cry及TC蛋白质基因的细菌属的范围。文中鉴定的全长Cry1529的大小对应于Cry1s的核心毒素；Cry1529代表了一类新Cry蛋白质，所述蛋白质对于从苏云金芽孢杆菌及类芽孢杆菌分离进一步的cry基因也有意义。
为了证实这些令人惊讶的现象不是由于菌株污染的结果(即为了证实带有TC及Cry ORF的34kb插入片段真正来自DAS 1529的总DNA)，通过Southern印迹杂交及PCR进行了分子分析。对于使用PCR的确认，应用ORF6(tccC样)及ORF7(Cry1529)特异引物(实施例8，表8)以从SB12粘粒及DAS1529总DNA扩增ORF6及ORF7。对于ORF6，用以下参数在PE9600热循环仪(Perkin Elmer)上进行PCR扩增最初于95℃变性2分钟，然后于95℃变性30秒，于60℃退火45秒，于72℃延伸2分钟进行30个循环，最后于72℃延伸2分钟。对于ORF7，除了退火温度为55℃进行30秒及延伸为72℃进行4分钟外，扩增参数与ORF6相同。对ORF6及ORF7均扩增到预计大小单一条带的特异PCR产物。
最初southern印迹杂交建立在部分SB12 DNA序列基础上并根据标准方法(Sambrock等人，1990)进行。DNA样本包括来自两个独立制备的DAS1529总DNA、SB12粘粒DNA及一个来自NC1(光杆状菌)的阴性对照DNA样本。两个DAS1529 DNA样本均为经证实系类芽孢杆菌种来源的16SrDNA序列，并且一个样本最初用作粘粒文库构建；另一个为新制备物。DNA样本用EcoRI消化，印迹到膜上，并用扩增自SB12的经Roche DIG系统(Roche)标记的180bp PCR产物杂交。PCR引物为与载体及经截短ORF1(与全长ORF3相比较)部分退火的5’CCT CAC TAAAGG GAT CAC ACG G 3’，以及与经截短ORF1(tcaA样)及全长ORF3(tcaA样)退火的5’GGC TAA TTG ATG AAT CTC CTT CGC 3’。检测到了与PCR探针杂交的总共三个DNA片段(0.85kb，2.7kb及8.0kb)，其中0.85及8.0kb为SB12中的，2.7及8.0kb为DAS1529 DNA中的。阴性对照中没有检测到信号。0.85kb(从第一个EcoRI ORF1内部片段到载体中的第一个EcoRI位点)及8.0kb(从ORF3中第一个5’EcoRI位点到ORF1中第三个EcoRI位点)与来自SB12的靶DNA片段的经计算大小相匹配。2.7kb片段的检测表明在DAS1529 DNA的ORF1第一个EcoRI位点2.7kb紧上游存在EcoRI位点。这些结果显示SB12插入片段来自DAS1529总DNA，并且基于杂交及限制性分析，可说明ORF的所有拷贝。
实施例8-SB12粘粒ORF编码的蛋白质杀虫活性的特征进行了随机转座子插入诱变(以破坏单个ORF或整个操纵子)及异源表达(表达单个ORF或整个操纵子)以分离在SB12粘粒中赋予杀虫活性的单个ORF或操纵子。
A.SB12粘粒的随机转座子诱变用GPS-1基因组启动系统(New England BioLabs，Beverly，MA)按试剂盒说明书自DAS1529粘粒SB12产生Tn诱变文库。简而言之，将2μl 10XGPS缓冲液，1μl pGPS2.1供体DNA(0.02μg)，1μlSB12粘粒(0.1μg)及18μl无菌H2O加入到0.5ml管中。加入1μl TnsABC转座酶；将混合物涡旋及然后简短离心以收集管底物质。这个反应混合物于37℃孵育10分钟。加入1μl起始溶液并通过吸上吸下几次进行混合。反应于37℃孵育1小时，然后于75℃热灭活10分钟。将1μl反应混合物用无菌H2O稀释10倍；将1μl经稀释反应物电穿孔入100μl ElectroMAXDH5α大肠杆菌(Gibco BRL，Rockville，MD)中。在SOC培养基中于37℃生长1小时后，将10μl或100μl培养物涂布到包含20μg/ml培养物卡那霉素及15μg/ml氯霉素的LB平板上，接着于37℃孵育过夜。
将来自SB12 Tn诱变的单个菌落划线到包含20μg/ml卡那霉素及15μg/ml氯霉素的新鲜LB平板上。通过划线，进一步接种至包含20μg/ml卡那霉素及15μg/ml氯霉素的50ml LB培养物并于28℃，200转/分钟生长48小时。然后通过以3500转/分钟离心20分钟收集细胞。将上清弃去并将沉淀物用2.5ml培养上清重新悬浮进行20X浓缩。然后将经浓缩的细胞沉淀物用于抗谷实夜蛾的活性分析。将40μl 20X浓缩物表面应用于人造食物，在128孔板中每个样本用8孔。加入新孵育的谷实夜蛾幼虫并饲养5天，然后对死亡率及体重进行记录。
检测了总共184个克隆抗谷实夜蛾活性的丧失。结果总结于表7。Tn克隆的生物试验显示在Cry1529基因中Tn的插入导致活性完全丧失。最初的生物试验显示tc基因中携带Tn插入片段的克隆活性是可变的。与SB12比较，在生物试验前将所有培养物校正到同样的细胞密度，对这些克隆的进一步分析显示没有丧失活性。来自Tn分析的结果表明ORF7(Cry1529)是SB12粘粒的主要杀虫活性组分。
*n.d.-未测定；-，++，+++，分别为无，中等及高活性。
B.SB12 ORF/操纵子的异源表达将Cry1529(ORF7)及五个tc ORF(参见以下表8)在pET101D_系统进行了表达。参见图5。这个表达载体具有经T7调节的基本pET表达系统的全部属性(Dubendorff和Studier，1991；Studier和Moffatt，1986)并可使钝端PCR产物定向克隆到载体中用于高水平的受调控表达，并简化大肠杆菌中的蛋白质纯化。优化的PCR扩增利用高度热稳定并具有3’至5’外切酶校正活性(以校正核苷酸误掺入错误)的高保真PfuTurboTMDNA聚合酶(Stratagene，La Jolla，CA)。当应用ThermalAceTM聚合酶(Invitrogen)时，将点突变导入到tc ORF中，所述点突变通过基于PfuTurboTM的Quick-ChangeTMXL定点诱变试剂盒(Stratagene)进行校正。由于大肠杆菌BL21starTM(DE3)菌株包含普遍增强mRNA稳定性及重组蛋白质产量的rne131突变，将该菌株用作进行表达的宿主(Lopez等人，1999)。
单个ORF是在定义条件下用ORF特异引物(表8)自SB12粘粒中进行PCR扩增得到的。作为定向克隆化必要条件，设计正向PCR引物在5’端包含序列CACC，以保证PCR产物与pET101.D载体中的突出序列GTGG进行碱基配对。反向引物与正向引物配对时会分别扩增每一ORF。PCR反应在包含50ng SB12粘粒DNA，1X Pfu反应缓冲液(Stratagene)，每种dNTP 0.2mM，每条引物0.25mM及2U PfuTurbo DNA聚合酶(Stratagene)的50μl反应混合物中进行。PCR扩增在PE9600热循环仪(Perkin Elmer)上用以下参数进行扩增最初于95℃持续2分钟，接下来于95℃变性30秒，于55℃退火30秒，每kb ORF于72℃延伸2分钟进行35个循环，最后于72℃延伸10分钟。
按照供应商(Invitrogen)的说明书将每个ORF的PCR产物克隆入pET101.D。经克隆ORF作为pET101.D质粒DNA进行纯化并对序列进行确定。由于Tn分析表明ORF7是用于控制受试害虫的SB12的主要组分，生物化学分析及昆虫生物试验集中于经异源表达的ORF7蛋白质。对于ORF7表达克隆，DNA序列分析显示与最初SB12DNA序列有100％匹配。根据试剂盒说明书(Invitrogen)，ORF7的表达是通过0.5mM IPTG诱导4小时进行的。
C.用于ORF7及tc操纵子杀虫活性的生物试验生物试验样本制备为完整大肠杆菌细胞、细胞裂解物及经纯化毒素。ORF7(Cry1529)谱及特异活性在表10中进行了总结。Cry1529对烟草天蛾活性最强，对烟芽夜蛾有高度活性(LC50为10μg/ml食物)；观察到对于两种昆虫均为100％死亡率。在较高剂量时，Cry1529对谷实夜蛾、甜菜夜娥及黑切根虫(Agrotis ipsilon)具有一些死亡率(20至60％)及相当程度的生长抑制。对于欧洲玉米螟，Cry1529在较高剂量时有一些生长抑制作用。对于一些其它昆虫种(秋天行军虫(fall armyworm)，棉子象鼻虫，南方根虫，蚊子)，没有检测到活性。对Cry1A(Cry1Ac)抵抗的小菜蛾(diamondback moth；DBMr)及敏感的小菜蛾(DBMs)，Cry1529LC50s分别为＞50μg/ml及＜1.0μg/ml，表明有潜在的交叉抗性。Cry1529对与日本甲虫有亲缘关系的草地蛴螬，没有可检测到的活性。
为检测DAS1529中其它非Cry1529因子的活性，对敲除了Cry1529 tn的SB12粘粒一个克隆(tn67)进行了抗TBW，CEW，SCRW，ECB，BW，BAW，THW，及蛴螬的作用分析；发现对这些害虫没有活性。为了回答tc ORF在SB12背景中潜在的非表达或低表达，将分别表达的tc ORF进行了单独检测，并与其它来自DAS1529的其它TC组合进行了检测；发现对TBW，CEW及蛴螬没有活性。此外，将四个ORF作为单一操纵子在大肠杆菌细胞中表达到很高水平。在体外检测时，全细胞不包含可检测的抗TBW、CEW及蛴螬活性。虽然缺少抗蛴螬活性有些令人感兴趣，但这些结果并不令人惊讶，因为类芽孢杆菌一般感染范围狭窄的蛴螬宿主。鉴于此，可以知道杀虫毒素活性谱也是相对狭窄的。因此需要涉及较宽范围害虫的筛选(用已知方法)及更多时间以鉴定易感害虫。文中列出的结果使人认识到目标TC蛋白质有与来自致病杆菌，光杆状菌等的其它TC蛋白质同样的作用。
将可溶性蛋白质用25mM磷酸钠pH8.0，100mM氯化钠进行提取，并在4-12％NuPAGE梯度凝胶上用1X MES缓冲液(Invitrogen)进行分析。ORF7蛋白质用标准程序进行纯化，N末端序列测定显示了预计的序列MNSNEPNLSDV。用表达靶蛋白质的细胞密度经过标准化的整个大肠杆菌细胞进行了生物试验。参见图6。大量经纯化ORF7蛋白质用于通过体外生物试验获得ORF7的LC50。经纯化ORF7的热稳定性分析表明于75℃处理5分钟足可废除其抗TBW的活性。参见表9。
-，+++，分别为无活性及完全活性对于tc基因，ORF3及ORF6的无错误克隆用作中间克隆以产生表达ORF3(tcaA)、ORF4(tcaB)、ORF5(tcaC)及ORF6(tccC)的tc操纵子克隆。为了在pET101.D中构建tc操纵子，将包含部分tcaA、完全tcaB和tcaC以及部分tccC的NsiI/SacI片段自SB12粘粒中切除以替代pET101.D-tcaA中的NsiI/SacI插入片段；其接着插入来自pET101.D-tccC的208bp SacI片段，参见图5。将所有四个ORF通过标准的IPTG诱导进行表达到高水平。对于在tc操纵子中表达的ORF6(tccC)，经表达蛋白质的大小比通过载体NTI从最5’ATG(SEQ ID NO18)预测的ORF6略小并是单独表达的。因此，基于核糖体结合位点共有序列的所注释ORF6(SEQ ID NO13)可能为在SB12及DAS1529中产生的天然蛋白质。
D.毒素的活性谱Cry1529(ORF7)的毒素活性谱总结于表10中。
注解-，+，++，+++分别为(无，低，中，高活性)；FCP，经冷冻细胞沉淀物；SE，可溶性提取物；经纯化＝柱纯化的Cry1529；IC，P.f.Cry1529包含体在最初试图确定目标TC/tc ORF活性谱的测定中，只应用了有限范围的害虫。用ORF3-OR6操纵子，获得了以下数据
此外，虽然这个初轮筛选没有显示这些TC对这些害虫的活性，本领域技术人员毫无疑问地认为对应于光杆状菌/致病杆菌蛋白质的这些目标蛋白质是有用的。此外，参见以下实施例10。
实施例9-应用PCR引物鉴定来自其它细菌属、种及菌株的Cry1529同系物对于从其它(类芽孢杆菌或其它)菌株中筛选其它的ORF7 cry1529同系物，设计了基因特异的简并PCR引物以扩增1kb的靶ORF7 DNA序列。PCR引物推导自在Cry蛋白质中高度保守的两个非常保守的蛋白质基序(QAANLHL，结构域I，第1区块(block 1)核心用于正向引物；GPGFTGGD，结构域III，第3区块用于反向引物)。这些引物在表12列出并在DAS1529中进行验证。PCR扩增在PE9600热循环仪(PerkinElmer)上用以下参数进行最初于95℃变性2分钟；接下来于95℃变性30秒，于47℃退火45秒，于72℃延伸2分钟，进行35个循环，最后于72℃延伸10分钟。那些引物对用于通过PCR筛选细菌(非苏云金芽孢杆菌)培养收集物。192个菌株中有5个(3个类芽孢杆菌1个芽孢杆菌及一个未确定菌)产生预计大小的PCR产物。根据初步生物试验筛选也发现这些菌株有CEW活性。然而，用不同引物对获自这些菌株之一中的扩增子进行序列分析显示扩增子不是来自cry基因。
虽然这样，并且由于这些筛选不是穷尽性的，本发明包括对Cry1529样蛋白质及基因筛选类芽孢杆菌亚种、芽孢杆菌亚种(包括苏云金芽孢杆菌及球形芽孢杆菌)等的方法。鉴于在类芽孢杆菌中发现鳞翅目毒性Cry蛋白质的重要特性，本发明也包括总体上用于鳞翅目毒性Cry蛋白质及基因的筛选类芽孢杆菌亚种的方法。多种筛选方法是本领域公知的，包括PCR技术(如以上示例的)、探针及摄食试验(其中将整个细胞摄食靶害虫)。如本领域技术人员易于认识到的，本发明的筛选方法包括在这些筛选中制备及应用克隆文库(如粘粒文库)。
1529＝基因特异；PP＝日本甲虫类芽孢杆菌密码子偏倚；PT＝解硫胺素类芽孢杆菌密码子偏倚实施例10-致病杆菌XptA2 TC蛋白质毒素与DAS1529 TC蛋白质的互补作用这个实施例提供了用单一操纵子(ORF 3-6，tcaA，tcaB，TcaC及tccC；参见实施例8的C部分)表达的DAS1529 TC蛋白质与来自嗜线虫致病杆菌Xwi(参见SEQ ID NO49)的XptA2毒素互补的实验证据。进行两个独立的实验以单独表达DAS1529 TC操纵子及XptA2，或在同一大肠杆菌细胞中共表达XptA2基因及TC操纵子。对表达不同毒素/毒素组合物的整个细胞抗鳞翅目昆虫谷实夜蛾(CEW)及烟芽夜蛾(TBW)的活性进行检测。来自两个实验的数据表明DAS1529 TC蛋白质对受检测的两种昆虫均能增强致病杆菌TC蛋白质XptA2活性。
A.DAS 1529 TC及致病杆菌XptA2的共表达TC操纵子的表达通过携带ColEl复制起点及氨苄青霉素抗性选择标记的pET101.D表达载体(Invitrogen)中的T7启动子/lac操纵基因进行调节。Tc操纵子的克隆与表达的综合性描述可在实施例8的C部分找到。将XptA2基因克隆入带有氯霉素抗性选择标记及与ColEl相容的复制起点的pCot-3表达载体中。pCot-3载体表达系统也通过T7启动子/lac操纵基因进行调节。因此，相容的复制起点及不同的选择标记形成了TC操纵子与XptA2在同一大肠杆菌细胞中共表达的基础。将带有TC操纵子及XptA2的质粒DNA单独或组合转化入大肠杆菌BL21StarTM(DE3)中。在包含50μg/ml羧苄青霉素的LB琼脂平板上用于pET101.D-TC操纵子转化体的筛选，在包含50μg/ml氯霉素的平板上用于pCot-3-XptA2转化体的筛选，并且在包含这两种抗生素的平板上用于pET101.D-TC操纵子/pCot-3-XptA2转化体的筛选。为抑制基础毒素的表达，在琼脂及液体LB培养基中均包括终浓度为50mM的葡萄糖。
对于毒素的产生，用在LB琼脂平板上生长的过夜培养物接种包含抗生素及50mM葡萄糖的5ml及50ml LB培养基。培养物在摇床上以300转/分钟于30℃生长。一旦培养物密度在600nm达到O.D.～0.4，向培养基中加入终浓度为75μM的IPTG以诱导基因表达。24小时后，将大肠杆菌细胞收获，用于通过NuPAGE系统(Invitrogen)进行蛋白质凝胶分析。来自0.5ml 1X培养培养液的细胞沉淀物用100μl 1X NuPAGE LDS样本缓冲液重悬。简要超声处理并煮沸5分钟后，将5μl样本上样到4至12％NuPAGE bis-tris梯度凝胶中用于总蛋白特性分析。当单独表达时或在存在TC操纵子表达时，XptA2表达到可检测水平。基于Personal密度计SI(Molecular Dynamics)凝胶扫描分析，XptA2与TC操纵子共表达时，与XptA2独自表达相比，其表达几乎高达8X。对于5ml诱导实验，XptA2有几乎相等的表达。
B.杀虫活性的生物试验如实施例8描述的，单独表达或作为操纵子表达时，DAS 1529tc ORF显示对TBW及CEW没有活性。以下生物测定实验集中于确定类芽孢杆菌(DAS1529)TC蛋白质(ORF3-6的TC蛋白质；TcaA-，TcaB-，TcaC-及TccC-样蛋白质)是否能与致病杆菌TC蛋白质毒素活性(XptA2为示例)互补。生物测定样本制备为将完整大肠杆菌细胞在4X细胞浓缩物中用于5ml诱导实验，XptA2及XptA2/TC操纵子细胞均包含非常低但几乎等量的XptA2毒素。表13中的数据显示在受检测的4X细胞浓缩物中，TC蛋白质+致病杆菌XptA2对CEW有活性。这提供了类芽孢杆菌DAS1529 TC蛋白质对致病杆菌XptA2辅助作用的第一个证据。
*-，++，+++＝分别为无，中等及高活性对于第二个生物测定实验，将XptA2细胞及XptA2+TC操纵子细胞中XptA2蛋白质的量在光密度计凝胶扫描分析的基础上进行校正。如表14中显示的，XptA2本身在40X时对TBW(烟芽夜蛾)有中等活性，但在20X及低于20X时，活性降到不可检测水平。然而，当与TC共表达时，在存在10X及5X的XptA2时高水平活性非常明显，在1.25X XptA2时仍检测到低活性。这些观察现象表明1529TC蛋白质对致病杆菌XptA2的抗烟芽夜蛾能力有显著的增强作用。在检测的最高剂量中，阴性对照及tc操纵子本身对这个害虫均没有任何活性。
*n.d.-未测定；-，+，++，+++＝分别为无，低，中等及高活性实施例11-Cry1529蛋白质对胰蛋白酶消化的稳定性本实施例教导了SEQ ID NO14公开的DNA序列的修饰，所述DNA序列编码Cry1529蛋白质(SEQ ID NO15公开的)以至新的经编码蛋白质比天然蛋白质对蛋白水解消化更有抗性。蛋白质在昆虫肠中的消化限制了昆虫暴露于蛋白质毒素的时间。因此，降低蛋白质毒素对蛋白酶消化的易感性可用于增加蛋白质的效力。
对于这些检测，将胰蛋白酶(例如，Sigma Chemical#T1426)及胰蛋白酶抑制剂(例如，Sigma Chemical#T9008)在50mM Tris HCl缓冲液，pH8中制备成4mg/mL或10mg/mL的储存液。检测为用多种浓度的胰蛋白酶及Cry1529蛋白质于37℃孵育1小时，并通过加入等体积的等浓度胰蛋白酶抑制剂进行终止(例如，接受35μl 4mg/mL胰蛋白酶溶液的消化通过加入35μl 4mg/mL胰蛋白酶抑制剂进行终止)。一个典型实验是，Cry1529蛋白质通过适当的改造的大肠杆菌细胞产生并通过以上描述的步骤进行纯化，所述纯化包括通过大小排阻柱与其它蛋白质分开。消化后，蛋白酶产物通过标准的丙烯酰胺凝胶电泳进行分析，接着用制备的抗Cry1529蛋白质的抗体进行免疫印迹分析。此种实验结果在图9中进行显示。
胰蛋白酶消化产生两个主要蛋白质产物，其中较小的分子量大约为50kDa。应当注意这个消化模式与来自Cry1529-His6蛋白质的胰蛋白酶消化产生的消化模式相同，其中所述Cry1529-His6蛋白质除了在羧基末端加入氨基酸KGELNSKLEGKPIPNPLLGLDSTRTGHHHHHH外，它与SEQ ID NO15的天然Cry1529蛋白质氨基酸序列相同。Cry1529-His6的编码区通过将天然Cry1529蛋白质的编码区连接到pET101/D-TOPO_载体中(InvitrogenTM，Carlsbad，CA)而产生。制备的这个重组克隆通过结合到商业上可获得的其表位以氨基酸序列GKPIPNPLLGLDSTRTG(在上面序列中以下划线标出)表示的V5抗体，或通过利用六个组氨酸残基(在上面序列中以双下划线标出)的纯化策略有助于重组Cry1529蛋白质的纯化。用于这些操作的步骤根据pET101/D-TOPO_载体提供的说明书进行。
发现用胰蛋白酶消化Cry1529-His6蛋白质导致去除了在昆虫生物试验中其抗鳞翅目昆虫的活性。用MALDI-TOF分析确定包含50kDa肽N末端的氨基酸序列，确定了对应于SEQ ID NO15氨基酸残基122位(R，精氨酸)及126位(K，赖氨酸)的两个蛋白酶加工位点。用Quick Change_诱变方法(Stratagene，La Jolla，CA)对天然DNA序列(SEQ ID NO14)进行修饰以去除经编码蛋白质中的第一个胰蛋白酶切割位点。在SEQ ID NO15的120至123位区域的氨基酸中进行了三个不同类型的突变RARA至HANA，RARA至RARS及RARA至QANA。用于这些突变的DNA寡核苷酸引物(对每条链以5’至3’方向列出)在以下表15中列出。与天然DNA序列不同的碱基用下划线标出。
野生型及通过这些引物导入的经突变编码区的比较在下表中进行了显示。相关的氨基酸残基以粗体显示。
将单独的经突变编码区单个克隆到pET101/D-TOPO_载体中，这允许可诱导产生Cry1529变体蛋白质。包含所述构建体的大肠杆菌细胞生长，并通过供应商推荐的方法诱导Cry1529变体基因的表达。然后将经收获细胞在胰蛋白酶消化测定中进行检测并如以上进行分析。一般结果在图10中显示。对于这些实验，将10mg完整细胞沉淀物在50mM Tris HCl，pH8.0中进行悬浮，并在终体积为1mL中，用100μL的10mg/mL胰蛋白酶中于37℃消化3小时。在孵育期间，时常混合这些反应物。通过加入100μL的10mg/mL胰蛋白酶抑制剂将消化终止并将管保存在冰上。
这些结果证实天然Cry1529(RARA)及Cry1529-His6(RARA)蛋白质均被胰蛋白酶消化以产生约50kDa的主要产物。当将对应于胰蛋白酶切割位点的RARA序列突变为HANA或QANA时，获得了相当高程度的对胰蛋白酶消化的抗性。不产生50kDa肽，并存在易于检测的明显全长Cry1529-His6蛋白质的量。RARA位点向RARS的突变不消除产生50kDa肽，但相当程度地降低了蛋白酶切割的速率。因此，Cry1529蛋白质中蛋白酶加工位点的突变基本上降低了其对蛋白酶消化的易感性，这使蛋白质在摄入后在昆虫肠中定居较长时间期，导致杀死易感昆虫的效力增强。
实施例12-设计PCR引物，用于检测其它类芽孢杆菌株中IDAS1529 tcORF同系物如以上显示，类芽孢杆菌IDAS1529菌株产生对多种鳞翅目昆虫有毒性的细胞外蛋白质。该菌株的16S核糖体基因的分子种系发生表明它与解硫胺素类芽孢杆菌-缓病类芽孢杆菌-日本甲虫类芽孢杆菌群成员最相关。也显示类芽孢杆菌IDAS1529菌株包含毒素复合体基因(此后称为tc基因)及称为cry1529的新杀虫晶体包含体蛋白质基因这两者。试图确定在类芽孢杆菌属其它成员中是否存在tc同系物，对收集的类芽孢杆菌菌株通过聚合酶链反应(PCR)及杂交分析进行筛选。对于PCR分析，将分离自类芽孢杆菌菌株的总DNA用作模板，并用在类芽孢杆菌IDAS1529菌株、光杆状菌种及致病杆菌种中发现的tc基因特异的寡核苷酸引物进行筛选。将用tc引物组获得的扩增产物进行克隆及确定它们的核苷酸序列，并与获自类芽孢杆菌IDAS1529菌株的tc序列进行比较。以下实施例说明个人怎样设计tc特异寡核苷酸引物并用PCR在类芽孢杆菌分离株的总DNA中寻找与类芽孢杆菌IDAS1529菌株、光致病菌种及致病杆菌种中确定的tc基因同源的DNA序列。通过用PCR分析(如文中描述)，可能在与类芽孢杆菌IDAS1529菌株及解硫胺素类芽孢杆菌-缓病类芽孢杆菌-日本甲虫类芽孢杆菌群不同的类芽孢杆菌种中确定tc同系物。
12.A.-从类芽孢杆菌菌株中提取总DNA类芽孢杆菌菌株在营养琼脂平板(8g/l营养培养液，15g/l细菌用琼脂；Difco Laboratories，Detroit，MI)上于30℃生长3-5天。挑取单菌落并接种到包含100ml无菌营养培养液(8g/l营养培养液；Difco Laboratories，Detroit，MI)的500ml三挡板烧瓶中。在旋转摇床上以150转/分钟于30℃孵育24-72小时后，将培养物分装到无菌500ml聚乙烯瓶中并于4℃，6,500xg离心1小时。离心后，将上清液弃去并保留细菌细胞沉淀物。用QIAGEN Genomic tip系统100/G及相关的基因组DNA缓冲液组(QIAGEN Inc.，Valencia，CA，USA)按正如制造者描述的用于细菌的样本制备及裂解方法从细胞沉淀物中提取总DNA。经提取的总DNA在0.5ml TE缓冲液(10mM Tris-HCl，pH8.0；1mM EDTA，pH8.0)中进行溶解。
12.B.-用于PCR的tc特异寡核苷酸引物的选择为了选择以前自类芽孢杆菌IDAS1529菌株鉴定的tc基因特异的寡核苷酸引物，将获自类芽孢杆菌IDAS1529菌株，光杆状菌W14菌株及致病杆菌Xwi菌株的tcaA，tcaB，tcdB及tccC的核苷酸序列使用在Vector NTI软件包(Informax，Inc.，Frederick，MD)中的比对程序进行比对。在表17中列出了用于此分析的核苷酸序列。
12.B.i.-tcaA特异引物的选择tcaA1-1529，tcaA2-1529及tcaA-W14核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的两个区域，用于选择具最小简并性的PCR引物(图10中显示的加框区)。选择这两个区域用于合成tcaA特异引物，将所述引物命名为SB105及SB106(表18及19)。
12.B.ii.-tcaB特异引物的选择tcaB1-1529，tcaB2-1529及tcaB-W14核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的四个区域，用于选择具最小简并性的PCR引物(图11)。选择这四个区域用于合成tcaB特异引物，将所述引物命名为SB101，SB102，SB103及SB104(表18及19)。
12.B.iii.-tcaC特异引物的选择tcdB1-W14，tcedB2-W14，xptC1-Xwi及tcaC-1529核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的两个区域，用于选择具最小简并性的PCR引物(图12)。选择这两个区域用于合成tcaC特异引物，将所述引物命名为SB215及SB217(表18及19)。
12.B.iv-tccC特异引物的筛选tccCl-W14，tccC2-W14，tccC3-W14，tccC4-W14，tccC5-W14，xptB1-Xwi及tccC-1529核苷酸序列的对比确定了核苷酸序列同一的具有足够长度的两个区域，用于选择具最小简并性的PCR引物(图13)。选择这两个区域用于合成tccC特异引物，将所述引物命名为SB212及SB213(表18及19)。
*K＝G或T；S＝G或C；W＝A或T；Y＝C或T；R＝G或A；M＝A或C；V＝G或C或A；B＝G或T或C；H＝A或C或T，I＝次黄苷
实施例13-类芽孢杆菌DNA的PCR扩增对于用tcaA特异引物组及tcaB特异引物组进行PCR扩增，将获自每一类芽孢杆菌菌株的3-5μl总DNA与50pmole的每种引物及1X EppendorfMasterMix(Eppendorf AG；Hamburg，德国)在20μl反应体积中进行混合。扩增条件为于94℃变性3分钟，接着于94℃变性1分钟，于52℃退火1.5分钟，于72℃延伸1.5分钟，进行30个循环，接着于72℃最后延伸5分钟。
对于用tcaC特异引物组及tccC特异引物组的PCR扩增，将获自每一类芽孢杆菌菌株的大约375ng总DNA与50pmole的每种引物及12.5μlEpicentre_ FailSafeTM缓冲液D及2.5U Epicentre_ FailSafeTM聚合酶(Epicentre；Madison，WI)在25μl反应体积中进行混合。扩增条件为于96℃变性4分钟，接着于94℃变性30秒，于64℃退火30秒，于70℃延伸30秒，进行40个循环。对每个循环，退火温度降低0.5℃，且延伸时间增加5秒。
13.A.-PCR扩增产物的凝胶电泳、克隆及核苷酸序列的确定PCR扩增反应用0.8至1％Seakem LE琼脂糖(BioWhittakerMolecular Applications，Rockland，ME)在1X TAE缓冲液中通过凝胶电泳进行检查。将扩增产物正如厂商描述的那样用TOPOTA_克隆试剂盒(Invitrogen Life Technologies，Carlsbad，CA)克隆到载体pCR2.1-TOPO_中。经克隆扩增产物的核苷酸序列用M13正向、M13反向及如需要用tc序列特异的测序引物进行确定以获得每个经克隆扩增产物的双链序列。用CEQ Dye终止子循环测序快速启动试剂盒(Beckman Coulter，Fullerton，CA，USA)及CEQ 2000XL DNA分析系统(Beckman Coulter)正如制造者所指导的那样进行核苷酸序列的测定。将Sequencher(v.4.1.4)软件包(Gene Codes，Ann Arbor，MI)用于自测序数据中构建毗连序列群并确定用于每个扩增产物的共有序列。
13.B.-PCR扩增产物的核苷酸序列分析13.B.i.-tcaA当用获自收集的类芽孢杆菌菌株收集物的总DNA用tcaA-(引物组合SB105及SB106)进行PCR时，观察到获自蜂类芽孢杆菌菌株(NRRLNRS1438；此后称为DB482)的总DNA产生预计大小的扩增产物。将扩增产物进行克隆并测序。
将用SB105及SB106引物组合获得的扩增产物命名为tcaA2-DB482。当tcaA2-DB482的序列(SEQ ID NO32)与获自类芽孢杆菌IDAS1529菌株及光杆状菌W14菌株的tcaA序列比较时，观察到tcaA2-DB482与tcaA2-1529有最大的核苷酸序列同一性(在1,239个核苷酸中同一性为90.5％)(表20)。由tcaA2-DB482编码的经推导氨基酸序列(命名为TcaA2-DB482；SEQ ID NO33)与tcaA2-1529的相应经推导氨基酸序列(命名为TcaA2-1529；SEQ ID NO7)有89.1％的同一性。
13.B.ii-tcaB
将用SB101及SB102引物组合及SB103及SB104引物组合获得的扩增产物分别命名为tcaB2a-DB482及tcaB2b-DB482。当tcaB2a-DB482(SEQID NO34)及tcaB2b-DB482(SEQ ID NO35)与获自类芽孢杆状菌IDAS1529菌株及光杆状菌W14菌株的tcaB序列进行比较时，观察到这两个序列均与tcaB1-1529及tcaB2-1529有最大的核苷酸序列同一性(表21)。tcaB2a-DB482及tcaB2b-DB482与tcaB2-1529的核苷酸序列同一性分别为92.6％和89.8％。由tcaB2a-DB482(命名为TcaB2a-DB482；SEQID NO36)与tcaB2b-DB482(命名为TcaB2b-DB482；SEQ ID NO37)编码的经推导氨基酸序列与tcaB2-1529对应的经推导氨基酸序列(命名为TcaB2-1529；SEQ ID NO9)同一性分别为91.2％和91.1％。
13.B.iii-tcdB用tcaC特异引物组合(SB215及SB217)对获自DB482的总DNA进行PCR时，产生预计大小的扩增产物。将扩增产物进行克隆并测序。
将用SB215及SB217引物组合获得的扩增产物命名为tcaC-DB482。当tcaC-DB482序列(SEQ ID NO38)与获自类芽孢杆菌IDAS1529菌株、致病杆菌Xwi菌株及光杆状菌W14菌株的tcaC序列进行比较时，观察到tcaC-DB482与tcaC-1529有最大的核苷酸序列同一性(在2,091个核苷酸中同一性为93.5％)(表22)。由tcaC-DB482编码的经推导氨基酸序列(命名为TcaC-DB482；SEQ ID NO39)与tcaC-1529对应的经推导氨基酸序列(命名为TcaC-1529；SEQ ID NO11)同一性为91.1％。
13.B.iv.-tccC当用tccC特异引物组合(SB212及SB213)将获自收集的类芽孢杆菌菌株的总DNA进行PCR时，观察到来自DB482的总DNA产生预计大小的扩增产物。将扩增产物进行克隆并测序。
将用SB212及SB213引物组合获得的扩增产物命名为tccC-DB482。当tccC-DB482序列(SEQ ID NO40)与获自类芽孢杆菌IDAS1529菌株、致病杆菌Xwi菌株及光杆状菌W14菌株的tccC序列进行比较时，观察到tccC-DB482与tccC-1529有最大的核苷酸序列同一性(在858个核苷酸中同一性为93.7％)(表23)。由tccC-DB482编码的经推导氨基酸序列(命名为TccC-DB482；SEQ ID NO41)与tccC-1529对应的经推导氨基酸序列(命名为TccC-1529；SEQ ID NO13)同一性为95.5％。
13.C.-PCR分析总结本实施例(及文中其它实施例)阐述了基于三个细菌属的tc基因设计寡核苷酸引物的方法及这些引物的用途，用于PCR筛选类芽孢杆菌菌株，由此可鉴定在那些菌株中存在的tc同系物。显示分离自蜜蜂幼虫的蜂类芽孢杆菌(作为NRRLB-30670保藏)的分离株DB482包含tcaA、tcaB、tcaC及tccC的同系物。这些tc同系物的发现证实类芽孢杆菌IDAS1529菌株在类芽孢杆菌属中不是唯一存在tc基因的菌株。因此，本领域技术人员可用这些及其它方法以确定在其它类芽孢杆菌种如软骨素类芽孢杆菌(P.chondroitinus)，解藻酸类芽孢杆菌(P.alginolyticus)，幼虫类芽孢杆菌(P.larvae)，强壮类芽孢杆菌(P.validus)，戈氏类芽孢杆菌(P.gordonae)，蜂房类芽孢杆菌(P.alvei)，缓病类芽孢杆菌，日本甲虫类芽孢杆菌，解硫胺素类芽孢杆菌，解菌多糖类芽孢杆菌(P.curdlanaolyticus)，神户类芽孢杆菌(P.kobensis)，解糖类芽孢杆菌(P.glucaizolyticus)，灿烂类芽孢杆菌(P.lautus)，千叶类芽孢杆菌(P.chibensis)，马阔里类芽孢杆菌(P.macquariensis)，固氮类芽孢杆菌(P.azotofxans)，皮奥利亚类芽孢杆菌(P.peoriae)，多粘类芽孢杆菌(P.polymyxa)，依利诺斯类芽孢杆菌(P.illinoisensis)，解淀粉类芽孢杆菌(P.amylolyticus)，饲料类芽孢杆菌(P.pabuli)及浸麻类芽孢杆菌(P.macerans)中的其它tc同系物。
实施例14-通过Southern杂交在其它类芽孢杆菌菌株中检测IDAS1529tcORF同系物本实施例阐述了如何应用放射标记的DNA片段作为探针在类芽孢杆菌分离株基因组DNA中寻找DNA序列(优选与第一次在IDAS1529中检测到的已知tcORF有一些同源性)。结果证明在蜂类芽孢杆菌分离株DB482中检测到与两个tcORF同源的序列。
如以上在实施例12中描述的，制备来自多种类芽孢杆菌菌株(或来自作为阴性对照的大肠杆菌)的基因组DNA，并用限制酶进行消化以产生多个片段。一般消化通过在EcoRI酶的制造商(New England Biolabs，Beverly，MA)提供的400μl反应缓冲液的总体积中包含8μg DNA。将包含200单位酶的反应物于37℃孵育过夜，然后置于冰上。将经消化DNA进一步进行纯化并通过加入30μl 3M乙酸钠(pH5.2)及750μL冰冷的100％乙醇进行浓缩，接着进行离心。将DNA沉淀物用70％乙醇洗两次，真空下干燥并在50μl TE缓冲液[10mM Tris HCI，pH8.0；1mM乙二胺四乙酸(EDTA)]重新悬浮。通过凝胶电泳进行分析用于限制性消化的视觉确证。以类似方式将IDAS1529粘粒SB12的DNA用EcoRI消化，并用作杂交实验的阳性对照。
将用于Southern印迹分析的经EcoRI消化的基因组DNA片段在TEA缓冲液(40mM Tris-乙酸，2mM EDTA，pH8.0)(1μgDNA/孔)中通过0.7％或1.2％琼脂糖凝胶电泳分离。在每块凝胶上，用包含1kb DNA分子量梯度(Invitrogen，Carlsbad，CA)的泳道提供分子量大小标准。在这个梯度中大于500bp的15个片段大小(用千碱基表示)为12.2，11.2，10.1，9.2，8.1，7.1，6.1，5.1，4.1，3.1，2.0，1.6，1.0，0.52及0.50。凝胶中的DNA用50μg/mL溴化乙锭染色，将凝胶照相，然后将凝胶中的DNA脱嘌呤(0.2M HCl中5分钟)，变性(0.5M NaOH，1.5M NaCl中15分钟)，中和(0.2M HCl中5分钟)并在2XSSC(20XSSC包含3M NaCl，0.3M柠檬酸钠，pH7.0)中转移到MAGNA 0.45微米尼龙转移膜(Osmonics，Westborough，MA)。DNA通过紫外线(Stratalinker_；Stratagene；La Jolla；CA)与膜进行交联并准备用于在“最低杂交”溶液[包含10％w/v聚乙二醇(分子量大约8000)，7％w/v十二烷基硫酸钠；0.6XSSC，5mM EDTA，100μg/ml经变性鲑鱼精DNA及10mM磷酸钠缓冲液(来自包含95g/L NaH2PO4·1H2O及84.5g/L Na2HPO4·7H2O的1M储存液)]中于60℃或65℃杂交1至3小时。
用作杂交探针的tcORF DNA片段首先通过用SB12粘粒DNA作为模板(参见以前实施例)的聚合酶链反应(PCR)进行制备。用于这些扩增的正向及反向引物在以下(大写字母的碱基对应于蛋白质编码区)表24中列出(每条DNA链的5’至3’方向)。设计的引物组1从SB12粘粒DNA扩增包含所有tcORF5的DNA片段，所述DNA片段在SEQ ID NO10公开并与光杆状菌tcaC基因有一些相似性(表6)。设计的引物组2用于从粘粒SB12扩增编码如SEQ ID NO19公开的蛋白质DNA片段。这个DNA片段及编码的蛋白质比如SEQ ID NO1 2公开的tc ORF6 DNA序列及所编码的如SEQ ID NO13的蛋白质稍长。作为SEQ ID NO13及SEQ ID NO19公开的蛋白质与光杆状菌tccC基因(表6)编码的蛋白质均有一些相似性。将扩增的PCR产物克隆入pCR_2.1-TOPO_克隆载体(Invitrogen，Carlsbad，CA)中，并将包含tcORF的片段通过限制酶消化(在以下表中列出)从产生的克隆中切下，接着通过用Gen EluteTM琼脂糖离心柱(Sigma Chemical Co，St Louis，MO)从琼脂糖凝胶中纯化。回收的片段通过用Quick-PrecipTMPlus溶液按照供应商的说明书(EdgeBioSystems，Gaithersburg，MD)进行沉淀而浓缩。
*在这个表中，引物5’端的小写碱基不与粘粒SB12 DNA序列互补。它们用于提供扩增产物末端上的限制性酶识别序列以有助于以后的克隆操作。
**将来自天然序列的那些碱基改变为小写粗体碱基以去除可能干扰以后克隆的功能性分析的潜在发夹结构。
放射性标记的DNA片段用高效引发放射性标记的试剂盒(RocheDiagnostics，Mannheim，德国)按照供应者的说明书进行制备。未掺入的核苷酸过通QIAquick_PCR纯化柱(Qiagen，Inc.Valencia，CA)按照制造者的说明书进行去除。通过这些方法标记的大约100ng DNA片段产生大约0.1μCi/ng的特异活性。经标记DNA片段通过煮沸5分钟进行变性，然后加入至最低杂交溶液中的杂交印迹中并于60℃或65℃孵育过夜。通过在2XSSC中于室温漂洗去除不牢固放射性，然后通过在0.3XSSC+0.1％十二烷基硫酸钠中于60℃或65℃洗涤印迹至少1小时去除较紧密结合的放射性。至少进行两次此种洗涤。将印迹于-80℃置于有两层增感屏的X射线胶片上，并在1至3天曝光后，将曝光胶片进行显影。通过在0.3XSSC+0.1％SDS中煮沸10分钟，将经杂交DNA片段从印迹中去除，并在以后的杂交中重新应用一次或两次。
在获自蜂类芽孢杆菌DB482菌株的基因组DNA中观察到与来自引物组1及引物组2的探针杂交的不同片段。检测与IDAS1529 tcORF5序列同源的衍生自引物组1(引物SB126及SB127)的探针与预计大小(以千碱基表示)为20、10.2及8.4的片段杂交。在这个分子大小的范围内，DNA片段的迁移只可提供对分子真实大小的估计。对估计为20kb及8.4kb片段的信号强度比对估计为10.2kb片段的信号强度更强。由于这些片段中的每一片段至少为探针片段(约4.4kb)大小的两倍，这些结果的一个解释为与来自IDAS 1529 tcORF5的探针类似并因此与光杆状菌tcaC基因类似的基因的多重拷贝在蜂类芽孢杆菌DB482菌株中存在。然而，对这个结果的其它解释是可能的。
来自引物组2(引物SB128及SB129)的探针，其检测与IDAS 1529tcORF6及其侧翼5’端序列同源的序列，所述探针与估计大小(以千碱基表示)为7.8及4.5的片段杂交。估计为7.8kb片段的信号强度比估计为4.5kb片段见到的信号强度强的多。这个结果的一个解释为蜂类芽孢杆菌DB482菌株有与IDAS 1529 tcORF6及其5’侧翼序列相似的单一基因，并因此与光杆状菌tccC基因相似，并且EcoRI将该基因切割成该基因所包含的两个不等部分DNA序列的片段。然而，对这个结果的其它解释是可能的，包括与探针有不同量绝对同源性的多重基因的存在。
这些结果(通过PCR扩增接着通过DNA序列分析检测)证实了在蜂类芽孢杆菌DB482菌株中存在光杆状菌tcaC及tccC基因的相关物。
实施例15-DB482的杀虫活性显示类芽孢杆菌DAS1529菌株产生对鳞翅目昆虫有毒性的细胞外蛋白质并且也显示此菌株包含名为Cry1529的cry基因。由于此菌株产生细胞外杀虫活性蛋白质及细胞内杀虫活性蛋白质，本发明包括筛选类芽孢杆菌其它菌株的细胞外(释放到培养基上清液)和/或细胞内(细胞相关)杀虫活性因子。该实施例阐述了如何产生类芽孢杆菌菌株的发酵培养液，如何处理这些培养液及如何检验来自这些培养液样本的杀虫活性。
15.A.类芽孢杆菌发酵培养液的产生及处理类芽孢杆菌菌株在营养琼脂平板(8g/l营养培养液，15g/l细菌用琼脂；Difco Laboratories，Detroit，MI)于30℃生长3-5天。挑取单个菌落并接种到包含100ml无菌的改良胰胨豆胨培养液(胰蛋白胨10-g/l，蛋白胨7g/l，豆胨3g/l，KCl 5g/l，K2PO42.5g/l；Difco Laboratories，Detroit，MI)的500ml三挡板烧瓶中。于28℃在旋转摇床上以150转/分钟孵育72小时后，将培养物分装到无菌500ml聚乙烯瓶中并于4℃，以4,000xg离心45分钟。离心后，弃去上清液并通过0.22μm膜滤器(MilliporeCorporation，Bedford，MA)。然后将培养滤液用Centricon Plus-20离心过滤装置用5,000分子量截止膜通过4,000xg离心浓缩20X。细菌细胞沉淀物在10mM磷酸钾缓冲液(pH＝8)中进行重悬。然后这些样本在昆虫生物试验中对经处理上清及细胞沉淀样本中包含的杀虫活性进行检验。
15.B.经处理上清及细胞沉淀物的昆虫生物试验在这些测定中包括的昆虫种为南方谷类根虫(Southern cornrootworm，SCR)，谷实夜蛾(CEW)及烟芽夜蛾(TBW)。用于喂养的人工食物及生物测定SCR在以前进行了描述(Rose，R.L.及McCabe，J.M.1973.J.Econ.Entomol.66，398-400)。标准人工鳞翅目食物(StonevilleYellow食物)用于喂养及ECB、CEW及TBW的生物测定。将40μl份经浓缩上清或细胞沉淀物样本直接应用于包含人工食物的孔(～1.5cm2)表面。使经处理的食物孔在无菌通风橱中空气干燥，并且将每孔感染孵育自表面无菌卵的单个新生昆虫。然后将测定板进行密封，置于湿度生长箱，并于28℃维持3-5天。然后对死亡率及确定的幼虫重量进行评分。每个处理应用八个昆虫。
15.C.DB482的杀虫活性来自DB482菌株的经浓缩上清及细胞沉淀物对SCR、TBW及CEW相对于对照处理有杀虫活性(表25)。这可能是因为来自DB482的经浓缩上清及细胞沉淀物的杀虫活性是两个不同杀虫因子的结果，一个杀虫因子为细胞相关(即Cry样)而另一个是来自细胞释放(即TC样)。然而，也可能来自DB482的经浓缩上清及细胞沉淀物的杀虫活性为存在于这两种细胞级分中的同一杀虫因子的结果。
表25.DB482的杀虫活性
*-，++，+++；分别为无，中等及高活性15.D.杀虫活性筛选的总结这个实施例阐述了用于筛选来自类芽孢杆菌菌株的经浓缩培养上清及细胞沉淀物以确定对鞘翅目及鳞翅目昆虫具有杀虫活性菌株的方法。文中显示的蜂类芽孢杆菌分离株DB482包含tcaA，tcaB，tcaC及tccC的同系物。在DB482中发现的杀虫活性证实类芽孢杆菌DAS1529菌株在类芽孢杆菌属中不是唯一产生对鳞翅目昆虫杀虫活性的菌株。因此，本发明包括用于鉴定在其它类芽孢杆菌种如软骨素类芽孢杆菌，解藻酸类芽孢杆菌，幼虫类芽孢杆菌，强壮类芽孢杆菌，戈氏类芽孢杆菌，蜂房类芽孢杆菌，缓病类芽孢杆菌，缓病类芽孢杆菌，日本甲虫类芽孢杆菌，解硫胺素类芽孢杆菌，解菌多糖类芽孢杆菌，神户类芽孢杆菌，解糖类芽孢杆菌，灿烂类芽孢杆菌，千叶类芽孢杆菌，马阔里类芽孢杆菌，固氮类芽孢杆菌，皮奥利亚类芽孢杆菌，多粘类芽孢杆菌，依利诺斯类芽孢杆菌，解淀粉类芽孢杆菌，饲料类芽孢杆菌及浸麻类芽孢杆菌中对鳞翅目昆虫有杀虫活性的其它类芽孢杆菌菌株的方法。
序列表<110>美国陶氏益农公司<120>可获自类芽孢杆菌种的杀虫活性蛋白质及多核苷酸<130>DAS-101XC2<150>US 60/392,633<151>2002-06-28<150>US 60/441,647<151>2003-01-21<160>49<170>PatentIn版本3.2<210>1<211>33521<212>DNA<213>人工序列<220>
<223>SB12全部插入片段的核酸序列<400>1gatcacacgg ccggcgtatt ccggctcgga accgaagaat taacagaagc gcttcagcag 60tccggttatc ggacagtctt tgatattgca tctgaaaatc ttgcggaatt tcagaaaagc120aatccggaga ttccctcttc cgacgcgaag gagattcatc aattagccgt ccagaggaca180gaaaacttat gcatgcttta taaggcctgg caactgcaca atgatccggt cgtccagagc240cttcccaaat tatccgcgga taccggcctg cgaggcatgc gtgccgcgtt ggagcggagt300cttggagggg gagccgattt tggagacttg ttcccggagc gatcgccaga gggctatgcg360gaagcctcct ctatacagtc gcttttttcg ccgggacgtt accttacggt gctgtataaa420attgcgcagg atctccacga cccaaaagac aaactgcata ttgacaaccg ccgtccagat480ttgaagtcgc tgatcctcaa taatgacaat atgaaccgtg aggtgtcttc cctggatatc540
ctgctggatg tgctgcagtc cgaaggctcc ggcacactga catccctgaa ggatacctac 600tatccgatga cccttccc tatgatgacgac cttgcgcaaa tcaatgccgt ggcggaggcg 660cgctcatcca atttgctggg gatctgggat accctgctgg acacgcagcg gacttccatc 720ctgcaggatt ccgccgctgt ccaccggata agcaagccgc ggcactcggc atacgtcaat 780cagagagtct ccgatgatga accggtattg atcgcgggag aggaattcta cttggagacc 840ggcggtgttg ccgacacgac cccgtctccg ccaacgaggg aagcgctttc cttgacgcca 900aacagcttcc gtctgctggt caaccccgag ccgacagcag acgacatcgc caatcactac 960aacgttaaga ctcaagatcc tgccgctctg gccgccgtct taaatgtggt cgatgacttt1020tgcctgaaaa ccggtttgag ctttaatgag ttgctggact taacgatgca gaaggatgat1080gaatcgatcg gcagcgagta caaaagccgg tttgtaaaat ttggcggcga ggccaatgtt1140ccggtttcaa cctatggagc tgtatttctg acaggaacgg aagaaactcc gttgtgggta1200ggaaaaggag ctgtgataag ccctgcagcg gacgcctatg ttcgtaatgg gacatatgca1260aacacgaatt atggatcaga cactagtctt gttgtgaagc aggatgggtc tagtggatac1320agtagggaag catatatcag gtttgatttg acaggtcttt ccggagttgt ggaggaagct1380aaaatttctc taacaactag agcgaaacaa ttgtctagct taagacacca agctcatttg1440gtcagtgaca acagttggga tgaattgaaa atcacatgga ataacaaacc tgcaggagga1500gcgatcatcg caagctggga tgttcccgaa gttggtgaga atgtaaaggt tgatgtgacc1560cggcaagtaa atgatgcgct cgcaaacggt caagataaac tatcaattgt tattcgttct1620agtgcaaatt atggcagtct gggcgatgtc tcttatgcct ctagagaaca ccctgaaaaa1680gcctcacgac cttctatgga aatcaaggcg ataacgggtg ctggtttaaa ttttacggcg1740gataatgttg tagctctggc aggaagggcg gaaaagcttg tccggctggc gcgcagcacg1800ggactttcct ttgagcagtt ggattggctg attaccaata ccagccgtgc cgtaatcgaa1860
catggtggag aactgattct ggataagccg gtactggagt ctgtggccga attcacaagg1920ctccataagc gttatggcat cacagcggat atgttcgccg cgtttatcgg cgaagtcaat1980acgtatgctg aagcaggtaa agagagcttt tatcagacga ttttcagcac ggccgaccat2040tcggctgcct tacctttagg cgcaactttg caatttgagg tgagcaaaca ggatcgatat2100gaagcgattt gctgcggggc catgggggtg accgccgatg agttctctcg tatcggcaaa2160tactgctttg gcgacaacgc gcagcaagtt accgccaatg aaacaaccgt tgcgcagctt2220tatcgtttag gccgaattcc tcacatgctt ggattgcgtt ttaccgaggc ggagctgttg2280tggaaattga tggctggcgg cgaggatacc ttgctccgca cgattggcgc gaagcctcgc2340agtttacaag ccttagagat tattcgccgt actgaggtcc ttttggactg gatggatgct2400catcagcttg atgttgtctc cctgcaagcc atggttacca atcggtacag cggcacagcc2460acgccggagc tgtacaactt tttggcacag gtgcaccaat ccacaagcag tgccgcgaac2520gtgtccaaag cggatgctca ggataccctg cccgcggaca agctgttccg ggccttggcg2580gtaggcttca acctgaaggc caacgtgatg gcgcaggtca ttgactggtt ggacaaaacc2640gacggagcgt ttacgctgcg ggctttctgg gacaagcttc aagcgtattt cagcgccgat2700catgaagaag aactgacggc cttggaagga gaagccgact tgctgcagtg gtgccaacag2760atcagccagt atgcgctcat tgtccgctgg tgcgggttaa gcgatcagga tctggcgctg2820ctgaccgggc atcccgggca gcttctgtcc ggacaacata cggtgccggt accctcgctg2880catctcctgc tggtgctgac ccgcctgaag gaatggcagc agcgcgtcca ggtttccagc2940gaggaggcca tgcgctattt tgcccaggcc gatgcgccaa ccgtcacacg cgatgctgcg3000gtcaagctgc ttgcccgtat ccatggctgg aatgaacagg ataccgcctc gatgaatgac3060tacctgctgg gagagaacga atatcctaag aactttgagc agatctttac tttggaaagc3120tgggtcaacc tgggccgtca actgaatgtt ggcagccgaa cgttgggaga gctggttgac3180
atgtcagaag aggatgatac cgcggaaaac acggatttga ttatctcggt cgcccaaagc3240ctgatggctg cggtgcaggc ctgaaccaac atgaccaagg aaggtggtaa gaatatgtct3300acttcaaccc tgttgcaatt gattaaggaa tcccgccggg atgcgttggt caaccattat3360atcgccaaca atgtcccgag agagcttacg gataagatta cagacgcaga cagcctgtat3420gagtatttgc tgctggatac caagatcagt gaactcgtaa aaacatcgcc gatagctgag3480gccattagca gcgttcagtt atacatgaac cgatgcgtgg aaggctatga aggcaagctg3540actccggaag gcaacagcca tttcgggccg ggaaaattcc tgaataattg ggatacctat3600aacaagcgtt attccacttg ggccggcaag gaacgtctga aatattatgc aggcagttat3660attgacccgt ccttgcgcta taacaaaacg gatccgttcc tgaacctgga acagaatatc3720agccagggaa gaatcaccga tgacaccgta aagaacgcgc tgcaacacta cctgactgaa3780tatgaagtgt tggcggattt ggaatatatc agcgtaaata aaggcgccga tgaaagtgta3840ttattcttcg taggccgcac caaaacaatg ccatacgaat attactggcg ccgattaacg3900ttgaaaaagg acaataacaa taaactggtg cctgccatct ggtctcaatg gaaaaaaata3960actgccaata tcggcgaagc agttaataat tatgtggtgc ttcactggca taataaccgc4020ttacatgtac aatggggttc tacagagaaa acacaaaatg atgacggaga acccattgag4080aaacgatatt tgaatgactg gttcatggat aagtccagtg tctggtcttc attccgaaag4140gtttcatata tagaaaatag ttttacttat actgagggca tcattgattc aagaaatatt4200actatagctg gaaatcaact gttctgtgat gattcaaata cttttaaggc aacaataacg4260gcacttccat ttgaccaaat acgtgtttac ttagaaaaga tttacggtac aggcggcagc4320atcacggtta ctggagaaaa taaaggctat attattaagg tgggggagcc aagagaagtc4380agtttctctc ctaatacgtt actagatgta ttcataggta gtaatgcaag ccctcgagac4440ccatatttca aagctacatt taatagagaa gctctccaaa attcatacgg ctcaattaaa4500
ataaatcaat acacccctcc ttctggaagc aatatcaaag gtcctatcga ccttaccctg4560aaaaataaca tcgacctgtc ggcgttgttg gaagagagcc ttgacgtact gttcgactat4620accattcagg ggaataacca attgggcggc ttagaggcct ttaacgggcc ttacggactt4680tatttgtggg aaatcttcct ccatgttcca tttttaatgg cggttcgctt ccacaccgag4740cactgagaga tcccctcata atttccccaa agcgtaacca tgtgtgaata aattttgagc4800tagtagggtt gcagccacga gtaagtcttc ccttgttatt gtgtagccag aatgccgcaa4860aacttccatg cctaagcgaa ctgttgagag tacgtttcga tttctgactg tgttagcctg4920gaagtgcttg tcccaacctt gtttctgagc atgaacgccc gcaagccaac atgttagttg4980aagcatcagg gcgattagca gcatgatatc aaaacgctct gagctgctcg ttcggctatg5040gcgtaggcct agtccgtagg caggactttt caagtctcgg aaggtttctt caatctgcat5100tcgcttcgaa tagatattaa caagttgttt gggtgttcga atttcaacag gtaagttagt5160tgctagaatc catggctcct ttgccgacgc tgagtagatt ttaggtgacg ggtggtgaca5220atgagtccgt gtcgagcgct gattttttcg gcctttagag cgagatttat acaatagaat5280ttggcatgag attggattgc ttttagtcag cctcttatag cctaaagtct ttgagtgact5340agatgacata tcatgtaagt tgctgatagg tttccagttt tccgctccta ggtctgcata5400ttgtactttt cctcttactc gacttaacca gtaccaaccc agcttctcaa cggatttata5460ccatggcact ttaaagccag catcactgac aatgagcggt gtggtgttac tcggtagaat5520gctcgcaagg tcggctagaa attggtcatg agctttcttt gaacattgct ctgaaagcgg5580gaacgctttc tcataaagag taacagaacg accgtgtagt gcgactgaag ctcgcaatac5640cataagccgt ttttgctcac ggatatcaga ccagtcaaca agtacaatggg catcgtatt5700gcccgaacag ataaagctag catgccaacg gtatacagcg agtcgctc tttgtggaggtg5760acgattacct aacaatcggt cgattcgttt gatgttatgt tttgttctcg ctttggttgg5820
caggttacgg ccaagttcgg taagagtgag agttttacag tcaagtaagg cgtggcaagc5880caacgttaag ctgttgagtc gttttaagtg taattcgggg cagaattggt aaagagagtc5940gtgtaaaata tcgagttcgc acattttgtt gtctgattat tgatttttgg cgaaaccatt6000tgatcatatg acaagatgtg tatctacctt aacttaatga ttttgataaa aatcattagg6060ggattcatca gcaccgagca gcggtatgag ttggcggaac gatggtttaa attcattttc6120aacagcgcag gttaccgtga tggctacggc aatctgctga cggatgacaa aggcaacgtg6180cgctactgga acgtcgtgcc tctgcaggag gatacggagt gggatgacac gttgtccctg6240gcaacgaccg acccggacga gattgcgatg gccgacccga tgcaatacaa gctggctatc6300tttattcaca ccttggactt cttgatcagc cgcggcgaca gcttgtaccg gatgctggag6360cgggatacct tgaccgaagc gaagatgtat tacattcagg ccagccaact gcttgggcct6420cgtcccgaga tccggatcaa tcacagctgg cctgatccga ccctgcaaag cgaagcggac6480gcggtaaccg ccgtgccgac gcgaagcgat tcgccggcag cgccaattct cgccttgcga6540gcgcttctga atgcggaaaa cgggcatttc ctgccgcctt ataatgatga actattagct6600ttctgggata aaatcgacct gcgtctctac aatttacgcc acaatctgag cctggacggt6660cagccgcttc atttgccgct ctttaccgaa ccggtcaatc ctcgtgagct gcaggttcag6720catggggcag gcgatggatt agggggaagc gccggttccg tccaaagccg tcaaagtgtc6780tatcgttttc ctctggtcat cgataaggcg cgcaatgccg cgagtagtgt tatccaattc6840gggaatgccc tggaaaacgc gctgacaaag caggacagcg aggccatgac tatgctgttg6900caatcccagc agcagattgt cctgcagcaa acccgcgata ttcaggagaa gaacctggcc6960tcgctgcaag caagtctgga agcaacgatg acagccaaag cgggcgcgaa atcccgaaag7020acccattttg ccggcctggc ggataactgg atgtcgcata atgaaaccgc ctcacttgca7080ctgcgtacca ctgcgggaat tatcaataca agctcgaccg tgccaatcgc tatcactggc7140
ggcttggata tggctccgaa catttttggt ttcgcagttg gaggttcccg ctggggagca7200gccagcgcgg ctgtagccca aggattgcaa atcgccgccg gcgtaatgga acagacggcc7260aatatcatcg atatcagcga aagctaccgc cggcgccggg aggattggct gctgcagcgg7320gatgttgccg agaatgaagc ggcgcagttg gattcgcaga ttgcggccct gcgggaacag7380atggatatgg cgcgaaaaca acttgcgctg gcggagacgg aacaggcaca cgcgcaagcg7440gtctacgagc tgctaagcac ccgttttacg aatcaagctt tgtataactg gatggccgga7500cgtctgtcgt ctctatacta tcaaatgtat gacgccgcat tgccgctctg cttgatggcc7560aaacaggctt tagagaaaga aatcggcaat gataaaacgg ttggaatctt caccctcccg7620gcctggaatg atttgtatca gggattgcta gcgggcgagg cgctgctgct cgagcttcag7680aagctggaga atctgtggct ggaggaggac aagcgcggaa tggaagctgt aagaacggta7740tctttagata cccttctccg caaagaaaag ccagaatccg gttttgcaga tttcgtcaag7800gaagttctgg acggaaagac gcctgaccct gtaagcggag ttagcgtaca gctgcaaaac7860aatattttca gtgcaaccct tgacctgtcc acccttggcc tggatcgctt ttacaaccaa7920gcggaaaagg cccacaggat caaaaacctg tcggttacct tacccgcgct attgggacct7980tatcaggata ttgcggcaac cttatcgcta ggtggcgaga ccgttgcgct ttcccatggc8040gtggatgaca gcggcttgtt tatcacggat ctcaacgaca gccgtttcct gcctttcgag8100ggtatggatc ctttatccgg cacactcgtt ctgtcgatac tccatgccgg gcaagacggt8160gaccagcgcc tcctgctgga aagcctgaac gacgtcatct tccacattcg atatgtcatg8220aaatagaaga caaactcccg cgaaatagtt caaccgcggg agttctttat tttccaccca8280aatcattgac ataaatatac tttaataata tgttggagga agaagaggag gttgttattg8340gtgagaataa agaaaatgtt tgaagtagcg atgatgttat cattggcgtg tttgtttttt8400gttacatcag ctgcttcagc aaaaacaact aatttaactt cttccccgaa acttatgaac8460
tgctttgatg tagctggtaa cgtaacctac aaaaccgctc ctgatggttc aattacgaaa8520ataatcgaag tacaagatgt tagtaaattc agtgaacaaa ccaatctcag gttggctcca8580gattctaaag ttaccattta tattcctgac tccagtgaca ataaccagcc caattactcc8640aataataatt ccaatgacta tagtgaacaa aattacctca atactaaccc caacgttgaa8700ccatttgttg aaccatttgt tgaacttata aagtatattg cgaacgtaag tgatccatat8760gaagcgtgtg gatcaaaatc gattagagat tctgattatg atcctcccgg cggaaaaatg8820ataataaaac aagggataca ggctacacac tcaaccacgg tttctatcga tgccaaaatc8880gtttcaactg ccttaaaata tgatgtaaca acgagttatt ccattgaaga ggagcaaaat8940attaaagtac cagacaataa aagaggaaga attattgctt atccaaagta tgatgtcaac9000cc tttgaaa tatgggaagc tggtctaata tataataaaa agattggaga cggtacggct9060ttctatccta aaggagtatg ttttgttaca attattaatt aactttcaaa taagagaagc9120tgtttcttaa gaataaagaa gcagcttctt gcatttttta ttatgatatt acactctatc9180ttctgtcaga tgctccctct caacttccat tcccaatccc ctcttcttaa aaggccataa9240aagttacact tatcatttcc gtcattgcta atctaccttg cagttaacct aaaatatacc9300ttccgggatt cctgaaggat gaaacatatt ttcacccatc agtgaaacta tctatgcttt9360tttgattgaa gcgagaggta tgcttgggtt gtaaatgaaa ggggggacct gttcatggga9420aactacctaa aacggtaacg gatagcttct atggttttga tgtctgcagt cattttgtct9480tggggagtac tcatcattca gaacacaaga ggaggagttc atggtgtcaa caacagacaa9540cacggccggc gtattccggc tcggaaccga agaattaaca gaagcgctta agcagtccgg9600ttatcggacc gtctttga tattgtatctga caatcttgcg gaatttcaga aaaacaatcc9660ggagattccc tcttctgacg cgaaggaga ttcatcaatta gccgtccaga ggacagaaaa9720cttatgcatg ctttataagg cctggcagct gcacaatgat ccggttgtcc agagccttcc9780
caaattatcc gcggataccg gcctgcaagg catgcgtgcc gcgttggagc ggagtcttgg9840aggcggagcc gattttggag acttgttccc ggagcgatcg ccagagggct atgcggaagc9900ctcctctata cagtcgcttt tctcgccggg acgttacctg acggtgctgt ataaaattgc9960gcgggatctc cacgacccaa aagataaact gcatattgac aaccgccgtc cagatttgaa 10020gtcgctgatc ctcaataatg acaatatgaa ccgagaggta tcttctctgg atatccttct 10080ggatgtgctg cagcccgaag gctctgacac gctgacatcc ttgaaggata cctaccatcc 10140gatgaccctt ccctatgatg acgaccttgc gcaaatcaat gccgtggcgg aggcgcgttc 10200atctaatttg ctggggattt gggataccct gctggacacg cagcggactt ccatcctgca 10260gaattccgcc gctgcccgcc ggataagcaa ggcgcggcac tcggcatacg ccaatcagaa 10320agcctccaat gatgagccgg tattcatcac gggagaggaa atctacctgg aaaccggagg 10380taaacggctt tttctggcgc ataaactcga gataggttca actattagcg ctaaaatcaa 10440cattggaccg ccgcaagcgg ccgatatcgc gccggcaaag ttgcaactcg tatattacgg 10500cagaggcggc agagggaact acttcctgcg cgtggcagac gatgtgtccc tcggtggaaa 10560gctgctgacc aattgttatc tgaccagcga tgacggacag agcaacaata ttagcgggcc 10620atactgccta atgatcaacc gaggcaccgg cagcatgcct agcgggactc accttccagt 10680tcagattgaa agagtgaccg atacatccat ccgcattttt gtgccggatc acggctattt 10740ggggctaggc gaaagccttg ccagcaactg gaatgaaccg ttggcgctga atctgggctt 10800ggatgaagcg ttgaccttta ccttgagaaa gaaggagacg ggaaatgaca ccatttccat 10860aatcgacatg ctgccgccgg tagcgaacac gactccgtct ccgccgacga gggaaacgct 10920ttccttgacg ccaaacagct tccgtctgct ggtcaaccct gagccgacag cggaggacat 10980cgccaagcac tacaacgtca cgacggtaac ccgggctcct gccgatctgg cctccgcctt 11040aaatgttgtc gatgatttct gcttgaaaac cggtttgagc tttaacgaat tgctggattt 11100
aaccatgcag aaggattatc agtcaaaaag cagtgagtac aaaagccgat ttgtaaaatt11160cggcggcggg gagaatgttc cggtatcaag ctatggcgca gcctttctga caggagcgga11220agatactcct ttgtgggtga aacagtataa cagcgtgggg actgcaacaa gcacccctgt11280tttaaacttt acgccagata atgttgtggc tttggcagga agggcggaaa agcttgtccg11340gctgatgcgc agcacgggtc tttcctttga gcagttggat tggctgattg ccaatgccag11400ccgtgccgtt atcgaacacg gtggagagct ttttctggat aagccggtac tggaagctgt11460ggccgaattc acaaggctca ataagcgtta tggcgtcaca tcggatatgt tcgccgcgtt11520tatcggcgaa gtcaatacgt atacagaagc gggcaaggac agcttttatc aggcgagttt11580cagcacggcc gaccattcgg ctaccttacc tttgggcgct tctttgcaac ttgaggtgag11640caagcaggat cgatatgaag cgatttgctg cggggctatg ggggtgaccg ccgatgagtt11700ctcccgtatc ggcaaatact gctttgggga taaagcacag caaatcacgg ccaatgaaac11760aaccgttgcc cagctttatc gtttaggccg aattcctcat atgctaggct tgcgttttac11820cgaggcagag ctgttgtgga aattgatggc tgggggcgag gataccttgc tccgcacgat11880tggcgcgaac cctcgcagtt tagaagcgtt agagattatt cgccggacgg aggtcctttt11940ggactggatg gatgcccatc agctggatgt tgtctccctg caagccatgg ttaccaatcg12000gtacagcggc acagccacgc cggagctgta caattttttg gcacaggtgc atcaatccgc12060aagcagtgcc gcgaacgtgg ccagagcgga tggtcaggat acgttgcctg cggacaagct12120gctccgggca ttggcggcgg gcttcaaact gaaagccaac gtgatggcgc gagtaatcga12180ctggatggac aaaaccaata aagcgtttac gctgcgggct ttctgggaca agcttcaagc12240gtatttcagc gccgatcatg aagaagaact gaccgccctg gaaggagaag ccgcaatgct12300gcagtggtgc cagcagatca gccagtatgc gctcattgtc cgctggtgcg ggttaagcga12360gcaggatctg gcgctgctga ccgggaatcc ggagcagctt ctggacggac aacatacggt12420
gcccgtaccc tcgctgcatc tcctgctggt gctgacccgc ctgaaggaat ggcagcagcg12480cgtccaggtt tccagcgagg aggctatgcg ctattttgcc caggccgatt cgccaaccgt12540cacgcgcgac gatgcggtta atctgcttgc ccgtatccat ggctggaatg aagcggatac12600cgtctcgatg aatgactacc tgctgggaga gaacgaatat cctaagaact ttgatcagat12660ctttgcactg gaaagctggg tcaacctggg ccgtcaactg aacgtgggca gcagaacgct12720gggagagctg gttgacatgg ctgaagagga taaaaccgcg gaaaacatgg atctgattac12780ttcggtggcc catagcctga tggctgcagc gaaagcctga accaacatga ccaaggaagg12840tgataagcat atgtctactt caaccctgtt gcaatcgatt aaagaagccc gccgggatgc12900gctggtcaac cattatattg ctaatcaggt tccgacagcg cttgcggaca agattacgga12960cgcggacagc ctgtatgagt acttgctgct ggataccaag atcagtgaac tcgtaaaaac13020atcgccgata gcggaggcca tcagcagcgt gcagttatac atgaaccgct gcgtcgaagg13080ctatgaaggc aagttgactc cggaaagtaa tactcatttt ggcccaggta aatttctata13140taactgggat acgtacaaca aacgtttttc cacctgggca ggaaaagaac gcttgaaata13200ttatgcaggc agctatattg agccgtcctt gcgctacaac aaaaccgatc cattcctgaa13260cctggaacag agcatcagcc agggaagaat tactgatgat accgtaaaga acgcgctgca13320acactacctg actgaatatg aagtgttggc ggatctggat tatatcagcg ttaataaagg13380cggcgacgaa agtgttttac tctttgttgg acgcaccaaa accgtaccgt atgaatacta13440ctggcgccgt ttgcttttaa aaagggacaa taataataag ctagtaccag cagtctggtc13500tcagtggaaa aaaatcagtg ccaatatcgg tgaagcggtt gatagttatg tggtgcctcg13560gtggcataaa aaccggctac atgtgcaatg gtgttctata gagaaaagtg aaaatgatgc13620cggtgaaccc attgagaaac gatatttgaa tgactggttc atggatagtt ccggagtctg13680gtcttcattt cgaaagattc cggttgtgga aaagagtttc gaatatttgg acggaagcct13740
cgatccccga tttgtcgctc ttgttagaaa tcaaatatta attgatgagc cagaaatatt 13800cagaattaca gtatcagccc ctaatccgat agatgcaaat ggaagagtag aggtacattt 13860tgaagaaaac tatgcaaaca gatataatat taccattaaa tatgggacaa cgagtcttgc 13920tattcctgca gggcaggtag ggcatccaaa tatctctatt aatgaaacat taagggttga 13980attcggcacc aggccggatt ggtattatac tttcagatat ttaggaaata caatccaaaa 14040ctcatacggt tcaattgtca ataatcaatt ttcacctcca tcaggaagca atattaaagg 14100tcctatcgac cttaccctga aaaataacat cgacctgtcg gccttgttgg atgagagcct 14160tgacgcactg ttcgactata ccattcaggg cgataaccaa ttgggcggct tagctgcctt 14220taacgggcct tacggacttt acttgtggga aatcttcttc catgttcctt ttttaatggc 14280ggttcgcttc cacaccgagc agcggtatga gttggcggaa cgttggttta aattcatctt 14340caacagcgca ggataccgtg atgattacgg cagtctgctg acggatgaca aaggcaacgt 14400gcgttactgg aacgtgatac cgctgcaaga ggacacggag tgggatgaca cgttgtccct 14460ggcaacgacc gacccggacg agattgcgat ggccgacccg atgcaataca agctggctat 14520atttattcac accatggact tcctgatcag ccgcggcgat agcttgtacc ggatgctgga 14580gcgggatacc ctggccgaag ccaagatgta ttacattcag gccagccaac tgcttgggcc 14640ccgccccgac atccggctca atcacagttg gcctaatccg accttgcaaa gcgaagcgga 14700cgcggtaacc gccgtgccga cgcgaagcga ttcgccggca gcgccaattt tggccttgcg 14760agcgcttctg acaggcgaaa acggtcattt cctgccgcct tataatgatg aactgttcgc 14820tttctgggac aaaatcgatc tgcgtttata caatttgcgc cacaatttga gtctggacgg 14880tcagccgctt catttgccgc tctttgccga accggtcaat ccgcgtgaat tgcaggttca 14940gcatggcccg ggcgatggct tggggggaag cgcgggttcc gcccaaagcc gtcagagtgt 15000ctatcgtttt cctctggtca tcgataaggc gcgcaatgcg gccaacagtg tcatccaatt 15060
cggcaatgcc ctggaaaacg cactgaccaa gcaagacagc gaagcaatga ccatgctgtt 15120gcagtcccag cagcagattg tcctgcagca aacccgcgat attcaggaga agaacctggc 15180cgcgctgcaa gcaagtctgg aagcaacgat gacagcgaaa gcgggggcgg agtcccggaa 15240gacccatttt gccggcttgg cggacaactg gatgtcggac aatgaaaccg cctcactcgc 15300actgcgtacc accgcgggaa tcatcaatac cagctcaacc gtgccgatcg ccatcaccgg 15360cggcttggat atggctccga acatttttgg tttcgcagtt ggaggttccc gctggggagc 15420agccagcgcg gctgtagccc aaggattgca aatcgccgcc ggcgtaatgg aacagacggc 15480caatattatc gatattagcg aaagctaccg ccggcgccgg gaggattggc tgctgcagcg 15540ggatgttgcc gaaaatgaag cggcgcagtt ggattcgcag attgcggccc tgcgggaaca 15600gatggatatg gcgcgcaagc aacttgcgct ggcggagacg gaacaggcgc acgcgcaagc 15660ggtctacgag ctgcaaagca cccgctttac gaatcaagct ttgtataact ggatggctgg 15720acgtctgtcg tctctatact atcaaatgta tgacgccgca ttgccgctct gcttgatggc 15780gaagcaggct ttagagaaag aaatcggttc ggataaaacg gtcggagtct tgtccctccc 15840ggcctggaat gatctatatc agggattatt ggcgggcgag gcgctgctgc tcgagcttca 15900gaagctggag aatctgtggc tggaggaaga caagcgcgga atggaagccg taaaaacagt 15960ctctctggat actcttctcc gcaaaacaaa tccgaactcc gggtttgcgg atctcgtcaa 16020ggaggcactg gacgaaaacg gaaagacgcc tgacccggtg agcggagtcg gcgtacagct 16080gcaaaacaat attttcagcg caacccttga cctctccgtt cttggcctgg atcgctctta 16140caatcaggcg gaaaagtccc gcaggatcaa aaatatgtcg gttaccttac ctgcgctatt 16200ggggccttac caggatatag aggcaacctt atcgctaggc ggcgagaccg ttgcgctgtc 16260ccatggcgtg gatgacagcg gcttgttcat cactgatctc aacgacagcc ggttcctgcc 16320tttcgagggc atggatccgt tatccggcac actcgtcctg tcgatattcc atgccgggca 16380
agacggcgac cagcgcctcc tgctggaaag tctcaatgac gtcatcttcc acattcgata 16440tgttatgaaa tagctttaca gtcagatata ttccggggct tgtattcaca agcccctcca 16500aggaggaatt gggttatgcc acaatctagc aatgccgata tcaagctatt gtcgccatcg 16560ctgccaaagg gcggcggttc catgaaggga atcgaagaaa acatcgcggc tcccggctcc 16620gacggcatgg cacgttgtaa tgtgccgctg ccggtaacct ccggccgcta tattactcct 16680gatataagcc tgtcctatgc gagcggccac ggcaacggcg cttatggaat gggctggacg 16740atgggagtga tgagcattag ccggagaaca agccgaggga cccccagtta tacatccgaa 16800gaccagttcc ttggtccgga tggggaggtg cttgttccgg aaagcaacga acaaggggag 16860atcattaccc gccacaccga tacggcccaa gggataccgt taggcgagac gtttacggtt 16920acacgctatt ttccccggat cgagagcgct tttcatttgc tggaatactg ggaagcgcaa 16980gcaggaagcg caacagcgtc gttttggctt attcactctg ccgatggagt gctgcactgt 17040ctgggtaaaa ctgctcaggc gaggatagcc gcccctgacg attccgccaa gatcgcagaa 17100tggctagtgg aggagtccgt ctcccccttc ggagagcata tttattacca atacaaagaa 17160gaagacaatc aaggcgtgaa tctggaggaa gacaatcatc aatatggggc gaaccgctat 17220ctgaaatcga ttcgctatgg aaataaggtt gcctctcctt ctctctatgt ctggaagggg 17280gaaattccgg cagacggcca atggctgtat tccgttatcc tggattatgg cgagaacgat 17340acctcagcgg atgttcctcc cctatacacg ccccaagggg agtggctggt gcgcccggac 17400cgtttttccc gctatgacta cggatttgag gtccggactt gccgcttgtg ccgccaggtc 17460ttgatgttcc acgtctttaa ggagcttggc ggggagccgg cgctggtgtg gcggatgcag 17520ttggaatacg acgagaaccc ggcggcgtcc atgctgagcg cggtccggca attggcttat 17580gaagcagatg gggccattcg aagcttgccg ccgctggaat tcgattatac tccatttggc 17640atcgagacaa cggccgattg gcagcctttt ctgcctgtgc ctgaatgggc ggatgaagaa 7700
cattatcagt tggtcgattt gtacggagaa ggcataccgg gcttattata tcagaacaat 17760gaccactggc attatcgttc gcccgcccgg ggcgacacac cggacgggat cgcctataac 17820agctggcggc cgcttcctca tatccccgtg aactcccgga acgggatgct gatggatctg 17880aatggagacg ggtatctgga atggttgctt gcggaacccg gggttgcggg gcgctatagc 17940atgaacccgg ataagagctg gtccggtttt gtgccgctcc aggcactgcc aacggaattc 18000ttccatccgc aggcacagct tgccaatgtt accggatcgg gtttaaccga cttggttatg 18060atcggtccga agagcgtccg gttttatgcc ggagaagaag cgggcttcaa gcgcgcatgt 18120gaagtgtggc agcaagtggg cattactttg cctgtggaac gcgtggataa aaaggaactg l8180gtggcattca gcgatatgct gggatcgggt cagtctcatc tggtgcgcat ccggcatgat 18240ggcgttacat gctggcctaa tctggggaac ggcgtgttcg gggcgccgtt ggcccttcac 18300gggtttacgg catcggagcg ggaattcaat ccggaacgtg tatatcttgt ggaccttgat 18360ggatccggcg cttccgatat catttatgct tctcgtgacg ctctactcat ttaccgaaat 18420ctttccggca atggctttgc tgatccggtg cgggttccgc tgcctgacgg cgtgcggttt 18480gataatctgt gccggctgct gcctgccgat atccgcgggt taggtgtggc cagtctggtg 18540ctgcatgtac cttacatggc cccccgcagt tggaaattag atttctttgc ggcgaagccg 18600tatttattgc aaacggtcag caacaatctt ggagcttcca gctcgttttg gtaccgaagc 18660tccacccagt attggctgga tgagaaacag gcggcctcat cggctgtctc cgctttgccc 18720ttcccgataa acgtggtatc ggatatgcac acggtggacg aaatcagcgg ccgcaccagg 18780actcagaagt atacttaccg ccatggcgtg tatgaccgga ccgaaaagga atttgccgga 18840ttcggccgca ttgacacatg ggaagaggag cgggattccg aaggaaccct gagcgtcagc 18900actccgcccg tgctgacgcg gacctggtat cataccgggc aaaagcagga tgaggagcgt 18960gccgtgcagc aatattggca aggcgaccct gcggcttttc aggttaaacc cgtccggctt 19020
actcgattcg atgcggcagc ggcccaggat ctgccgctag attctaataa tgggcagcaa 19080atactggctg tgtaccgatc attacaaggg atgccgctgc ggactgagat ttttgcggga 19140gatgttggcg ggtcgcctcc ttatcaggta gagagcttcc gttatcaagt gcgcttggtg 19200cagagcatcg attcggaatg tgttgccttg cccatgcagt tggagcagct tacgtacaac 19260tatgagcaaa tcgcctctga tccgcagtgt tcacagcaga tacagcaatg gttcgacgaa 19320tacggcgtgg cggcacagag tgtaacaatc caatatccgc gccgggcaca gccggaggac 19380aatccgtacc ctcgcacgct gccggatacc agctggagca gcagttatga ttcgcagcaa 19440atgctgctgc ggttgaccag gcaaaggcaa aaagcgtacc accttgcaga tcctgaaggc 19500tggcgcttga atattcccca tcagacacgc ctggatgcct tcatttattc tgctgacagc 19560gtgcccgccg aaggaataag cgccgagctg ctggaggtgg acggcacgtt acgatcttcg 19620gcgctggaac aggcttatgg cggccagtca gagatcatct atgcgggcgg gggcgaaccg 19680gatttgcgag ccctggtcca ttacaccaga agcgcggttc ttgatgaaga ctgtttacaa 19740gcctatgaag gcgtactgag cgatagccaa ttgaactcgc ttcttgcctc ttccggctat 19800caacgaagcg caagaatatt gggttcgggc gatgaagtgg atatttttgt cgcggaacaa 19860ggatttaccc gttatgcgga tgaaccgaat tttttccgta ttctggggca acaatcctct 19920ctcttgtccg gggaacaagt attaacatgg gatgataatt tctgtgcggt tacatccatc 19980gaagacgcgc ttggcaatca aattcagatt gcatatgatt accgctttgt ggaggccatc 20040cagattaccg atacgaataa taatgtgaat caggtcgccc tggatgctct cggccgggtc 20100gtatacagcc ggacctgggg cacggaggaa gggataaaga ccggcttccg cccggaggtg 20160gaattcgcga cgcccgagac aatggagcag gcgcttgccc tggcatctcc cttgccggtt 20220gcatcctgct gtgtatatga tgcgcatagc tggatgggaa cgataactct tgcacaactg 20280tcagagcttg ttccagatag tgaaaagcaa tggtcgttct tgatagacaa tcgcttgatt 20340
atgccggacg gcagaatcag atcccgcggt cgggatccat ggtcgcttca ccggctattg 20400ccgcctgctg tgggcgaatt gctgagcgag gcggaccgta aaccgccgca tacggtaatt 20460ttggcagcag atcgttaccc ggatgaccca tcccagcaaa ttcaggcgag catcgtgttt 20520agcgatggct ttgggcgtac gatacaaact gctaaaagag aagatacccg atgggcgatt 20580gcggaacggg tggactatga cggaaccgga gccgtaatcc gcagctttca gcctttttat 20640cttgacgact ggaattatgt gggcgaagag gctgtcagca gctctatgta cgcaacgatc 20700tattattatg atgctctggc acgacaatta aggatggtca acgctaaagg atatgagagg 20760agaactgctt tttacccatg gtttacagta aacgaagatg aaaatgatac catggactca 20820tcattatttg cttcaccgcc tgcgcggtga gatggaggtt aaacctatga acacaacgtc 20880catatatagg ggcacgccta cgatttcagt tgtggataac cggaacttgg agattcgcat 20940tcttcagtat aaccgtatcg cggctgaaga tccggcagat gagtgtatcc tgcggaacac 21000gtatacgccg ttaagctatc ttggcagcag catggatccc cgtttgttct cgcaatatca 21060ggatgatcgc ggaacaccgc cgaatatacg aaccatggct tccctgagag gcgaagcgct 21120gtgttcggaa agtgtggatg ccggccgcaa ggcggagctt tttgatatcg aggggcggcc 21180cgtctggctt atcgatgcca acggcacaga gacgactctc gaatatgatg tcttaggcag 21240gccaacagcc gtattcgagc aacaggaagg tacggactcc ccccagtgca gggagcggtt 21300tatttatggt gagaaggagg cggatgccca ggccaacaat ttgcgcggac aactggttcg 21360ccactacgat accgcgggcc ggatacagac cgacagcatc tccttggctg gactgccgtt 21420gcgccaaagc cgtcaactgc tgaaaaattg ggatgaacct ggcgactgga gtatggatga 21480ggaaagcgcc tgggcctcgt tgctggctgc cgaagcttat gatacgagct ggcggtatga 21540cgcgcaggac agggtgctcg cccaaaccga cgccaaaggg aatctccagc aactgactta 21600caatgacgcc ggccagccgc aggcggtcag cctcaagctg caaggccaag cggagcaacg 21660
gatttggaac cggatcgagt acaacgcggc gggtcaagtg gatctcgccg aagccgggaa 21720tggaatcgta acggaatata cttacgagga aagcacgcag cggttaatcc gaaaaaaaga 21780ttcccgcgga ctgtcctccg gggaaagaga agtgctgcag gattatcgtt atgaatatga 21840tccggtaggc aatatccttt ctatttacaa tgaagcggag ccggttcgtt atttccgcaa 21900tcaggccgtt gctccgaaaa ggcaatatgc ctacgatgcc ttgtatcagc ttgtatctag 21960ttcggggcgg gaatccgacg cgcttcggca gcagacgtcg cttcctccct tgatcacgcc 22020tatccctctg gacgatagcc aatacgtcaa ttacgctgaa aaatacagct atgatcaggc 22080gggcaattta atcaagctta gccataacgg ggcaagtcaa tatacaacga atgtgtatgt 22140ggacaaaagc tcaaaccggg ggatttggcg gcaaggggaa gacatcccgg atatcgcggc 22200ttcctttgac agagcaggca atcaacaagc tttattcccg gggagaccgt tggaatggga 22260tacacgcaat caattaagcc gtgtccatat ggtcgtgcgc gaaggcggag acaacgactg 22320ggaaggctat ctctatgaca gctcgggaat gcgtatcgta aaacgatcta cccgcaaaac 22380acagacaacg acgcaaacgg atacgaccct ctatttgccg ggcctggagc tgcgaatccg 22440ccagaccggg gaccgggtca cggaagcatt gcaggtcatt accgtggatg agggagcggg 22500acaagtgagg gtgctgcact gggaggatgg aaccgagccg ggcggcatcg ccaatgatca 22560gtaccggtac agcctgaacg atcatcttac ctcctcttta ttggaagttg acgggcaagg 22620tcagatcatt agtaaggaag aattttatcc ctatggcggc acagccctgt ggacagcccg 22680gtcagaggta gaggcaagct acaagaccat ccgctattca ggcaaagagc gggatgccac 22740aggcctgtat tattacggac accgctacta tatgccatgg ttgggtcgct ggctgaatcc 22800ggacccggcc ggaatggtag atggactaaa cctgtaccgt atggtcagga acaatcctat 22860aggactgatg gatccgaatg ggaatgcgcc aatcaacgtg gcggattata gcttcgtgca 22920tggtgattta gtttatggtc ttagtaagga aagaggaaga tatctaaagc tatttaatcc 22980
aaactttaat atggaaaaat cagactctcc tgctatggtt atagatcaat ataataataa 23040tgttgcattg agtataacta accaatataa agtagaagaa ttgatgaaat ttcaaaaaga 23100cccacaaaaa gccgcacgga aaataaaggt tccagaaggg aatcgtttat cgaggaacga 23160aaattatcct ttgtggcacg attatattaa cattggagaa gctaaagctg catttaaggc 23220ctctcatatt ttccaagaag tgaaggggaa ttatgggaaa gattattatc ataaattatt 23280attagacaga atgatagaat cgccgttgct gtggaaacga ggcagcaaac tcgggctaga 23340aatcgccgct accaatcaga gaacaaaaat acactttgtt cttgacaatt taaatatcga 23400gcaggtggtt acgaaagagg gtagcggcgg tcagtcaatc acagcttcgg agctccgtta 23460tatttatcga aatcgcgaaa gattgaacgg gcgtgtcatt ttctatagaa ataatgaaag 23520gctagatcag gctccatggc aagaaaatcc ggacttatgg agcaaatatc aaccgggtct 23580tagacaaagc agcagttcaa gagtcaaaga acgagggatt gggaactttt tccgccggtt 23640ttcaatgaag agaaagtagc atgtaactaa aattgctccc cattggttgt gtaaactaat 23700ggggagttgt gattcactcc tgttcaacgc cattcatgta gaattgtttt gggaggttaa 23760accgattgga tgccggcccc aaggcggagc tttttgatac cgaggggctt cgagtgtggc 23820ttatcgatat caacggcaca cagacgactc tcgaatatga tgtattaggc aggcctgcag 23880ccgtattcga gcatcaggaa ggcaaggaat ttcctaagtg ccgggatcgg tttagaatga 23940gtctgatgcc aagccaacaa tttgcgaggg cagttgatgc gccactacga tacaatcccg 24000ttacattcct tgataataag gggcttaaaa tcgtaattac cctaagtctc gtcgaggttg 24060ctatagaatt gtatcgtctt catggtggcg ttcttttgct tcataatagt acgtgctgct 24120agaattgtgc aggacgtcgc acattgctga tgtaaatgta tgtctttttc ttggaatagt 24180agatccgctc cttgttctga tgtgttcatt ctactagccc ttattttttc tggccaacta 24240agtcctatat ataattataa aaaaagcata gatatcttca tctataggtg aggatatcta 24300
tgcttttcat tttttgatta gagatatact tgtagtgcaa ggaaaagtag ataggagggt 24360gaatttaaca gaagttacaa actgttgttt acttaaaaaa ttaatatgga gggaaataaa 24420tatgaactca aatgaaccaa atttatctga tgttgttaat tgtttaagtg accccaatag 24480tgacttggag aagtctggcg gtggagtagc gctagatgtt ggaatgtcat tgatatccga 24540acttcttggt acggttccag ttgctggatc aattcttcaa tttgtattcg ataaattgtg 24600gtttattttt ggcccttctg agtgggactc acttatggaa catgttgaag cattaattga 24660tagtaaaata caagagcagg taaaaagaag tgcacaagat gaactaaatg caattacaaa 24720taacttatct acgtatttga aatttctaga tgcatgggaa aatgattcta ataatttaag 24780agcgagagct gtagtgaaag accaatttgt aggccttgaa cagactcttg aaagaaaaat 24840ggttagtgtt tttggaagta cgggtcatga agtgcatctt ttgccaattt tcgctcaagc 24900agccaacctc cacctaattc tattaagaga tgctgagaaa tatggaaaga gatggggttg 24960ggcagataga gaaattcaag tatattatga taaccagatt cgttatatcc atgaatatac 25020ggaccattgt attaaatatt ataatcaagg attaagtaaa ctgaaaggtt ctacctatca 25080agattgggat aagtataatc gttttagaag agaaatgacc ctaactgttc ttgatttgat 25140ttcaattttc ccatcgtatg atactagaac ttacccaatt gatacaatag gtcaattgac 25200aagggaagtt tattcggatt tacttattgc taacccgtct gggatgcaga ctttcactaa 25260tgtagatttc gacaatattc ttattagaaa acctcattta atggatttct taagaactct 25320tgagattttt accgatcgac ataacgcaag cagacacaac gtatattggg gcggacatcg 25380agtgcattct tcttacacag gaggtaattt tgaaaatttt gaatctccct tatatggcag 25440tgaagcaaat gtagaacccc gaacatggtt gagttttgga gaatctcaag tctataatat 25500acgttcgaag cctgagtggg atagaggaag tactgcaatt agtggctcct atgaatttcg 25560aggagtgaca ggatgttctt tttatcgaat gggaaatttt gctggcaccg tagccctaac 25620
ttaccgacag tttggtaacg aaggttctca aatcccattg cacaggctat gtcatgttac 25680ttattttaga agatctcaag ctgtgggggc gacttcgaga cagacgttaa caagtggtcc 25740gctattttcc tggacacata gtagtgctac ggaaacgaat atcattcacc cgacaaaaat 25800tacacaaata ccaatggtga aggctagttc ccttggatca ggtacttctg ttgtccaagg 25860accaggcttt acaggagggg atgtacttcg aagaaatagc cccggtagca caggaacttt 25920aagagttaac gtcaattcac cattatcaca gagatatcgt ataagaattc gttacgcttc 25980tactacggat ttagattttt ttgtcattcg cggaaatacg acagttaata attttagatt 26040tgggaacact atgcgtaaag gagaccctat aacctctcga tcatttagat ttgcggcttt 26100tagtacacca tttacttttg ctagctcaca ggatgaactt agaataaatg tacaaaattt 26160caataatggt gaagaagttt atatagatag aatcgaagtt attccagttt gatactacag 26220atgtttatgt tgatacccta ggtaatacac ctactgagac gttgggaaga agtgtaaaaa 26280actcatctca aaatcgaaag taaaagagcc cttcttaaaa ttttaagagg ggctcagctc 26340attgttgcac agttactcca gggtctgtca aggattttgc ttaaattgat ttatatgaac 26400ctaccccgag ggggagacga gcctcaaggc aaaatgctgg ccgatgcgtt ctggaaagaa 26460tacggagaac tgcagcagca ttttcggaca gcaggcggaa atagcctgag agaagacgat 26520gaggttgtcg acccaggtga tcaggatgtc ctggactccc cgattcttaa gatcgttcag 26580aatgctgagc cagaacttcg tggactcgtt ttccccgatc cacatgctca gtacgacctt 26640attgccgtcc aaatcgatgc cgtacacatt ctggagatga tcttcaatct cccgtgtact 26700tacgtcctct tggcgtagag ggcgaatatc agtcctcgat gccggttacg ctcgtttgat 26760tcttcttcac aacgatgggc tcgaacttga ttaggcggtc tcgggaacgg aaatcgcctg 26820tacgccgtac tcacctggtg atcgtcttct tgctcttacc attgcggcta tttgccgtct 26880gctggttctg cacatcatac ctctcataac ccagatgcgt gtcctccccc aacctttcta 26940
gtcctttcat tgttagtgga tttgattgag tttacacgaa gtatttacga ctcttggaac 27000ccgggtgttt tttgcaagtg aaaaatgctg agttttgctg caaaaagtgc caggctccct 27060tgccagccaa aacattactg cggaatgcgt tccattgcct gcttgaggcg gaaactctcg 27120cctgtgaacg agagaatatg cgcgtggtgc acgagacggt cgaccaaggc tgaggtgagc 27180ttagtatccc caaatatgga ggtccattgg ccaaactcca ggtactgggc tgtgggtttt 27240gcgcttgcga agggcggcgt tccagtcgct ctggtcggca tagcgtttgg ccgttcgcca 27300gtgaatgccc acctaccttg cgatttcgct cactgagcag ccttctgttt cgcgtaaaaa 27360agttgttgag gcattttcag catccttccc gtctccttcg tcaagttctc ggcaaaccta 27420acgataggag gattttaagg ggctgacaag tgcctttttt gcatctgact tcagcatttt 27480tacgctgcaa ttctaggcat ttttagtatg caataaacac ccgggtctcc atctctgaca 27540tgagcctgcc gggcactcat ataatataaa aagcatcaga gctgaatgag tcggctgctg 27600atgcttattt attggaccga acgatatctc tgcaagtaca agtacgaatg gagcccggta 27660ttgttgatac ccccgttttt ataaggatag actaagcagt tctttaatag actttaaatc 27720tttcaggatg agtttatctg gtatccaaat gacaggaatt tgagttttat tgattttgta 27780attggttata atgaaatcga atttgaccgt attgcttggt tcggtttgaa ggtttagaac 27840gttacccaat tcattattta atttgtgata gatgaatttt ttccaattgg ttggtccgga 27900taaaagcaat aaaacctttt ttttataatt tgacaggaga atagataaaa tatgaaacgt 27960gatgtggtag ctctcatctt cagataatct attttcattt atttctttat tccatgcgac 28020aataagaggg tgaatgatgt tgtagccctc tattaattca ttaggaatcg tcttaaatct 28080accccaatag tattctaacg gtaaattgag atttttaaat atatagatct tgtggaaaga 28140aaaatggatg ttatgtctta tttcttctat tactttggca ttcatattta cttcacttga 28200aatcatgtca attaaagcaa ggtgcttatc gtaaagttgt ttatatgatc cacgatagta 28260
attcttgatt ttactttttt cattatcatc cccctcggag atgaggaaaa aaaatagtgt 28320aaaaaactta agttcatttt gctggaagct gaccttatag aaattttcaa tggcagagac 28380aatggcatag gtgcaatcta acttttgaga gctaaatatg tagtccatat taaaactttt 28440ggaaataaaa tgcttgtata tatttctatt tacagacaca ttgatgagta tggttaatag 28500attataatcg atctccattt tatagaaacg aatatagttc tcaatttttt gttgcaagtc 28560taggtccggt ttaaagattt ctttatactt ttgcacgtga aaaaaaagaa ccatatagaa 28620gtatctaata ttcagttcct ttccaattat ttggatcgtt gttctgaaat taaaatcaag 28680gttaaaatgt ctaagtattt ttctgaaatt atttaatttt ttcttcaatg ttaatttatc 28740taagtacaat atttgagacc atttttccaa gctataatac ttctgattga atattcccat 28800taaaatgatg taaagttcac tgtttattat ataagtagct ataatagtgg aaaggtgatc 28860taaaggatct ttttttagaa cgtaaccttt ggaattaatg cttattatat cccaattatc 28920tggaagatcc tgttttaatt gagaaatgtc acttataatc gttctgcttg tacattgcag 28980cttacgggct aaagaactgg aagacacgat accttcgctg tcaattaagg attctaatat 29040ttggattttt cgaataattg aatgattttg aattaagtga gcggtgaatt catccattta 29100gtctccccct cgaaaagcga taactggtta aagtgcagat gtactatcct ttgttcgaag 29160ttgctagtaa tcaattctgc ggatctcttc aaagtgctcc aggtgctatg gatttacgaa 29220tttcccctaa acatatcttt ctaatgtttg tcttcttaat gaaaatcttt attatttttc 29280tccttttcac aatttaaatt tcaattagaa agtaacgtaa ttttggaatg aaaaacgata 29340cataatttca ttaatagatg aaaatatgta tggtttttaa aatgtttgta aaggtcagct 29400taatgcggtt aatagaaggt taagagattt tattgtgcaa ggggggacga agaaggatat 29460aagatagaac atatccgaaa gggaggaggc taacgaaatt tgaaattatt tgttgggtag 29520tgtttgcaaa actcgaatta tatggtaatc tatagatggt caattatttg caatgccaaa 29580
ggaaggtgag gctgtgagta ccgttgctgc gaagccacag aggttggggg agctaataca 29640gtactatcgg cagaagaagg aattgagtct gtcgaagctg caagaagcgg tcggcattga 29700taaaggcagc ctgtcgagaa ttgaaaacag cgaggtcaaa cgccctgatt ttcgatccat 29760cttgtcgatc gccgcggtat tggacattcc ccatgacgcc atcgtagaac agtacatcga 29820gatcggacat aaatcggaag tcatatacac tattttacag aacgaattga caaccctcga 29880gcatccatcg ctcataccga aaattgccgc aaagtttctt gaagcgccca atgaagacag 29940tctggatgca gtagagaagt tgtaccgaac gataggctcc gtgaatcatc cttccactca 30000gttatcttta tacaccctca tcgtagacta ctcacgcgcc catggaatca tgccttacat 30060tgccaaagga ttatttcgga agtacatgat tgaacgaaat gatttcagca ggttgaagga 30120aacgtatcag gttggaaaaa atgtgctgga ctatgctaat tttttgagcg agaaagagcg 30180gatacttcta tactatggct tgagtgttca cgcttatagt cttatgtttt atcatgatgc 30240cataaaattc ggtaattatg ttgtggaaaa tggggaagaa gaaccgctag caaatgcaac 30300tcataatgtt tgcaatgcct attaccattt ggggaattat gacgattgca atacctatct 30360cgaaaagtat agtcatttcc catatccttt cgtcaaagag aatgttaaat taatgactgc 30420ctttcttaac gggaagaaag ggaatattga gtccgccatt actcagttta ataactgttt 30480agataccctg tcctcatata atttgattca tgccgtaact gaattaatgg aactatatct 30540ccataaaaac gatcttgttg cagcagatca actccttatg tatgaagaac aaataattga 30600gagcatcacc caaccacgaa ctacgccata taaaaggtca agattagcgc actactttcg 30660catcaaagga caattgttaa ctcgtaaaca acatgaaaaa gacgctgttg atagtttctt 30720gaaaagtaca ttagagtacg taaaaattgg tcgttttacg gaagcttttg aatcattgtc 30780gtttgtgacg cattcaatga tacataatca gtcaatcatt aatagtgaaa taattaaaaa 30840ggttgataat attttacaaa taattgctgc aaaataatta aggaggaata tggtgccatg 30900
agaaaacgta aacttctttt cattgcctct cttctagttt ttggagcaat cagcatggag 30960catattgttt catacatcga tgccccgtgg ataactaact tctaatgaat ataacatctc 31020ataacgctag tcatggcccc gccattcgtt ggtggggtaa catccttcga aagcccgatt 31080cttttactgg caatgttgct gcaattgtaa ggggcctcac tcactccaag tgctgtctct 31140gcagatcctc tttggtttat gccatcggtc tatagcagca gtaactcgat cgacagataa 31200aaatttgaaa attctcttcg aaaggagatt gacgcattaa gacgccttta tgggcgtttt 31260tttgtttttt atgtataaag ttgttgcata ataatccaga atcaagtcat atttaccaac 31320ttcatctata atcaggtcaa ataatacagt ttatggatga ggtgtggaaa tgagccatca 31380accggtatac aaaggtgact taatcccttt tacttatagc tatgagaaag ctggctgttt 31440aattgaaatc attgagagca ctcgacagga gcttatagta gcggccacgg aaaaaaagtg 31500tcttaccgac gaaactgttg taagattaag ccaaaagtta gatacatacc tattggaatt 31560tcaaagaagg agctgcggct agaagaatag gatgtgataa tccggattat taggggaagg 31620tgaggctgtg agtatcggtt ctgtgaagcc taaaagcttg ggggagttaa tcaagtatta 31680tcgaaaaatg aatagcgaaa tcgcagatca gacattgaga ttgagcaaaa acctaaagtc 31740attttctcaa tcttgcagaa cgaattggaa acactcgagc atccagcatt aatacccgaa 31800atagccgcca aatttcttga cttatcaaat ggtatggagg gggtaaaaga gctttacaga 31860gtaattgact cggtagaaga tacctccatt caattagctg tgtacaacct tattattgat 31920tactctcgcg ctcatggaat gatgccctat attgctaagg gattataccg aaaatacatg 31980atcgaacgaa atgatttcag caaattgaaa gaaacctatc aactaggtaa gtgtgtattg 32040gactatatac agtttctggg cgacgaagaa cgaattgtat tttattattc aataggagtt 32100cacgctgaca gcttaatgaa ctatgatgac tctgtaccct atatgaaata tgtggtggag 32160aacgataact cagaaaatgg tgcctataga gcgaatgctt atcttagtct atgcaattct 32220
tcctataata ctggtgatta caaagcaagc caggaatatt tagatgagta cagtaagtac 32280tctttttcat atgtagccga taatgtgcat tttatgtcgg cttgtataga gggcaagatg 32340gggaacgtgg atagttcgat ttcaaagtta cgttcttatt tacaaagttc atgggaagta 32400tcccgttgaa aagggaacct aaatatattc aaacgccttg tggtgtctca gattgttgaa 32460aaaccctgtc cttttctaaa ggtacagggt ttctcacatg aaaaggactc acgaaacgaa 32520ccttccgatg aacccggcca cggttttttc gtacgtttcc cgatccatcc ggtatgcttc 32580tccatgtccg gctttcggaa cgatgtatag ctctttctcg gcggggcaat tttcgtaaac 32640tttatgcacc atctccgtcg gcacaaaagt atcgttggcc ccatgaatga agagagtcgg 32700ggttttcgac tttttcacct gctccagtgc ggaggcttct ccgaaaaagt accctgcccg 32760tagcctggtc agcaggctgg tggtatccac gatcgggaat gccggaagat gatacatgcg 32820ccgcagctgg aaggaaagct gatccttcac agaggtataa ccacagtctt cgacgatggc 32880tttcacgttc ggcggcaaat tctcgccgct ggtcatcatc acggttgccc ctcccatcga 32940cacgccgtgg agaacgattt gtgaattcgt cccattcgtg tccaaaaccc gctgaatcca 33000tttcaaataa tccttacgct cgggccagcc gaaaccgata taatggcctt cgctttcccc 33060atgtccccga gcatcgggga gcaggatgtt gtagccccat ttctcgtggt acattctggc 33120gtaaccgctc atttgcgttg cgttcccgga atatccgtgc gcgatgatga ccgttttgtc 33180cgacggcttg gatgccggca aataatacgc cttcagatga atgccgtcat ccgagtccat 33240ctcccagcgc tcaaagcttt ggttgttcca ccattccttg tccgccagcg tggtttgctt 33300tgattcctcc acctcaggac tggttttcag gtcgggattg tcgctcaaaa agtctttcga 33360agcgcgcgca atcgccactt gataaaagta aaagctcccg gcggtaagga taataatgac 33420aaatacaatc aaggaaataa agcctgtcac catttttttc ttcaattctg ttctctccta 33480gtaaactctc atgttagtta ttttaatata tcataatgat c 33521
<210>2<211>3264<212>DNA<213>类芽孢杆菌IDAS 1529菌株<400>2gatcacacgg ccggcgtatt ccggctcgga accgaagaat taacagaagc gcttcagcag60tccggttatc ggacagtctt tgatattgca tctgaaaatc ttgcggaatt tcagaaaagc 120gaaaacttat gcatgcttta taaggcctgg caactgcaca atgatccggt cgtccagagc 240cttcccaaat tatccgcgga taccggcctg cgaggcatgc gtgccgcgtt ggagcggagt 300cttggagggg gagccgattt tggagacttg ttcccggagc gatcgccaga gggctatgcg 360gaagcctcct ctatacagtc gcttttttcg ccgggacgtt accttacggt gctgtataaa 420attgcgcagg atctccacga cccaaaagac aaactgcata ttgacaaccg ccgtccagat 480ttgaagtcgc tgatcctcaa taatgacaat atgaaccgtg aggtgtcttc cctggatatc 540ctgctggatg tgctgcagtc cgaaggctcc ggcacactga catccctgaa ggatacctac 600tatccgatga cccttcccta tgatgacgac cttgcgcaaa tcaatgccgt ggcggaggcg 660cgctcatcca atttgctggg gatctgggat accctgctgg acacgcagcg gacttccatc 720ctgcaggatt ccgccgctgt ccaccggata agcaagccgc ggcactcggc atacgtcaat 780cagagagtct ccgatgatga accggtattg atcgcgggag aggaattcta cttggagacc 840ggcggtgttg ccgacacgac cccgtctccg ccaacgaggg aagcgctttc cttgacgcca 900aacagcttcc gtctgctggt caaccccgag ccgacagcag acgacatcgc caatcactac 960aacgttaaga ctcaagatcc tgccgctctg gccgccgtct taaatgtggt cgatgacttt 1020tgcctgaaaa ccggtttgag ctttaatgag ttgctggact taacgatgca gaaggatgat 1080gaatcgatcg gcagcgagta caaaagccgg tttgtaaaat ttggcggcga ggccaatgtt 1140
ccggtttcaa cctatggagc tgtatttctg acaggaacgg aagaaactcc gttgtgggta1200ggaaaaggag ctgtgataag ccctgcagcg gacgcctatg ttcgtaatgg gacatatgca1260aacacgaatt atggatcaga cactagtctt gttgtgaagc aggatgggtc tagtggatac1320agtagggaag catatatcag gtttgatttg acaggtcttt ccggagttgt ggaggaagct1380aaaatttctc taacaactag agcgaaacaa ttgtctagct taagacacca agctcatttg1440gtcagtgaca acagttggga tgaattgaaa atcacatgga ataacaaacc tgcaggagga1500gcgatcatcg caagctggga tgttcccgaa gttggtgaga atgtaaaggt tgatgtgacc1560cggcaagtaa atgatgcgct cgcaaacggt caagataaac tatcaattgt tattcgttct1620agtgcaaatt atggcagtct gggcgatgtc tcttatgcct ctagagaaca ccctgaaaaa1680gcctcacgac cttctatgga aatcaaggcg ataacgggtg ctggtttaaa ttttacggcg1740gataatgttg tagctctggc aggaagggcg gaaaagcttg tccggctggc gcgcagcacg1800ggactttcct ttgagcagtt ggattggctg attaccaata ccagccgtgc cgtaatcgaal860catggtggag aactgattct ggataagccg gtactggagt ctgtggccga attcacaagg1920ctccataagc gttatggcat cacagcggat atgttcgccg cgtttatcgg cgaagtcaat1980acgtatgctg aagcaggtaa agagagcttt tatcagacga ttttcagcac ggccgaccat2040tcggctgcct tacctttagg cgcaactttg caatttgagg tgagcaaaca ggatcgatat2100gaagcgattt gctgcggggc catgggggtg accgccgatg agttctctcg tatcggcaaa2160tactgctttg gcgacaacgc gcagcaagtt accgccaatg aaacaaccgt tgcgcagctt2220tatcgtttag gccgaattcc tcacatgctt ggattgcgtt ttaccgaggc ggagctgttg2280tggaaattga tggctggcgg cgaggatacc ttgctccgca cgattggcgc gaagcctcgc2340agtttacaag ccttagagat tattcgccgt actgaggtcc ttttggactg gatggatgct2400catcagcttg atgttgtctc cctgcaagcc atggttacca atcggtacag cggcacagcc2460
acgccggagc tgtacaactt tttggcacag gtgcaccaat ccacaagcag tgccgcgaac 2520gtgtccaaag cggatgctca ggataccctg cccgcggaca agctgttccg ggccttggcg 2580gtaggcttca acctgaaggc caacgtgatg gcgcaggtca ttgactggtt ggacaaaacc 2640gacggagcgt ttacgctgcg ggctttctgg gacaagcttc aagcgtattt cagcgccgat 2700catgaagaag aactgacggc cttggaagga gaagccgact tgctgcagtg gtgccaacag 2760atcagccagt atgcgctcat tgtccgctgg tgcgggttaa gcgatcagga tctggcgctg 2820ctgaccgggc atcccgggca gcttctgtcc ggacaacata cggtgccggt accctcgctg 2880catctcctgc tggtgctgac ccgcctgaag gaatggcagc agcgcgtcca ggtttccagc 2940gaggaggcca tgcgctattt tgcccaggcc gatgcgccaa ccgtcacacg cgatgctgcg 3000gtcaagctgc ttgcccgtat ccatggctgg aatgaacagg ataccgcctc gatgaatgac 3060tacctgctgg gagagaacga atatcctaag aactttgagc agatctttac tttggaaagc 3120tgggtcaacc tgggccgtca actgaatgtt ggcagccgaa cgttgggaga gctggttgac 3180atgtcagaag aggatgatac cgcggaaaac acggatttga ttatctcggt cgcccaaagc 3240ctgatggctg cggtgcaggc ctga 3264<210>3<211>1087<212>PRT<213>类芽孢杆菌IDAS 1529菌株<400>3Asp His Thr Ala Gly Val Phe Arg Leu Gly Thr Glu GIU Leu Thr Glu1 5 10 15Ala Leu Gln Ser Gly Tyr Arg Thr Val Phe Asp Ile Ala Ser Glu20 25 30
Asn Leu Ala Glu Phe Gln Lys Ser Asn Pro Glu Ile Pro Ser Ser Asp35 40 45Ala Lys Glu Ile His Gln Leu Ala Val Gln Arg Thr Glu Asn Leu Cys50 55 60Met Leu Tyr Lys Ala Trp Gln Leu His Asn Asp Pro Val Val Gln Ser65 70 75 80Leu Pro Lys Leu Ser Ala Asp Thr Gly Leu Arg Gly Met Arg Ala Ala85 90 95Leu Glu Arg Ser Leu Gly Gly Gly Ala Asp Phe Gly Asp Leu Phe Pro100 105 110Glu Arg Ser Pro Glu Gly Tyr Ala Glu Ala Ser Ser Ile Gln Ser Leu115 120 125Phe Ser Pro Gly Arg Tyr Leu Thr Val Leu Tyr Lys Ile Ala Gln Asp130 135 140Leu His Asp Pro Lys Asp Lys Leu His Ile Asp Asn Arg Arg Pro Asp145 150 155 160Leu Lys Ser Leu Ile Leu Asn Asn Asp Asn Met Asn Arg Glu Val Ser165 170 175Ser Leu Asp Ile Leu Leu Asp Val Leu Gln Ser Glu Gly Ser Gly Thr180 185 190Leu Thr Ser Leu Lys Asp Thr Tyr Tyr Pro Met Thr Leu Pro Tyr Asp195 200 205
Asp Asp Leu Ala Gln Ile Asn Ala Val Ala Glu Ala Arg Ser Ser Asn210 215 220Leu Leu Gly Ile Trp Asp Thr Leu Leu Asp Thr Gln Arg Thr Ser Ile225 230 235 240Leu Gln Asp Ser Ala Ala Val His Arg Ile Ser Lys Pro Arg His Ser245 250 255Ala Tyr Val Asn Gln Arg Val Ser Asp Asp Glu Pro Val Leu Ile Ala260 265 270Gly Glu Glu Phe Tyr Leu Glu Thr Gly Gly Val Ala Asp Thr Thr Pro275 280 285Ser Pro Pro Thr Arg Glu Ala Leu Ser Leu Thr Pro Asn Ser Phe Arg290 295 300Leu Leu Val Asn Pro Glu Pro Thr Ala Asp Asp Ile Ala Asn His Tyr305 310 315 320Asn Val Lys Thr GIn Asp Pro Ala Ala Leu Ala Ala Val Leu Asn Val325 330 335Val Asp Asp Phe Cys Leu Lys Thr Gly Leu Ser Phe Asn Glu Leu Leu340 345 350Asp Leu Thr Met Gln Lys Asp Asp Glu Ser Ile Gly Ser Glu Tyr Lys355 360 365Ser Arg Phe Val Lys Phe Gly Gly Glu Ala Asn Val Pro Val Ser Thr370 375 380
Tyr Gly Ala Val Phe Leu Thr Gly Thr Glu Glu Thr Pro Leu Trp Val385 390 395 400Gly Lys Gly Ala Val Ile Ser Pro Ala Ala Asp Ala Tyr Val Arg Asn405 410 415Gly Thr Tyr Ala Asn Thr Asn Tyr Gly Ser Asp Thr Ser Leu Val Val420 425 430Lys Gln Asp Gly Ser Ser Gly Tyr Ser Arg Glu Ala Tyr Ile Arg Phe435 440 445Asp Leu Thr Gly Leu Ser Gly Val Val Glu Glu Ala Lys Ile Ser Leu450 455 460Thr Thr Arg Ala Lys Gln Leu Ser Ser Leu Arg His Gln Ala His Leu465 470 475 480Val Ser Asp Asn Ser Trp Asp Glu Leu Lys Ile Thr Trp Asn Asn Lys485 490 495Pro Ala Gly Gly Ala Ile Ile Ala Ser Trp Asp Val Pro Glu Val Gly500 505 510Glu Asn Val Lys Val Asp Val Thr Arg Gln Val Asn Asp Ala Leu Ala515 520 525Asn Gly Gln Asp Lys Leu Ser Ile Val Ile Arg Ser Ser Ala Asn Tyr530 535 540Gly Ser Leu Gly Asp Val Ser Tyr Ala Ser Arg Glu His Pro Glu Lys545 550555 560
Ala Ser Arg Pro Ser Met Glu Ile Lys Ala Ile Thr Gly Ala Gly Leu565 570 575Asn Phe Thr Ala Asp Asn Val Val Ala Leu Ala Gly Arg Ala Glu Lys580 585 590Leu Val Arg Leu Ala Arg Ser Thr Gly Leu Ser Phe Glu Gln Leu Asp595 600 605Trp Leu Ile Thr Asn Thr Ser Arg Ala Val Ile Glu His Gly Gly Glu610 6l5 620Leu Ile Leu Asp Lys Pro Val Leu Glu Ser Val Ala Glu Phe Thr Arg625 630 635 640Leu His Lys Arg Tyr Gly Tle Thr Ala Asp Met Phe Ala Ala Phe Ile645 650 655Gly Glu Val Asn Thr Tyr Ala Glu Ala Gly Lys Glu Ser Phe Tyr Gln660 665 670Thr Ile Phe Ser Thr Ala Asp His Ser Ala Ala Leu Pro Leu Gly Ala675 680 685Thr Leu Gln Phe Glu Val Ser Lys Gln Asp Arg Tyr Glu Ala Ile Cys690 695 700Cys Gly Ala Met Gly Val Thr Ala Asp Glu Phe Ser Arg Ile Gly Lys705 710 715 720Tyr Cys Phe Gly Asp Asn Ala Gln Gln Val Thr Ala Asn Glu Thr Thr725 730 735
Val Ala Gln Leu Tyr Arg Leu Gly Arg Ile Pro His Met Leu Gly Leu740 745 750Arg Phe Thr Glu Ala Glu Leu Leu Trp Lys Leu Met Ala Gly Gly Glu755 760 765Asp Thr Leu Leu Arg Thr Ile Gly Ala Lys Pro Arg Ser Leu Gln Ala770 775780Leu Glu Ile Ile Arg Arg Thr Glu Val Leu Leu Asp Trp Met Asp Ala785 790 795 800His Gln Leu Asp Val Val Ser Leu Gln Ala Met Val Thr Asn Arg Tyr805 810 815Ser Gly Thr Ala Thr Pro Glu Leu Tyr Asn Phe Leu Ala Gln Val His820 825 830Gln Ser Thr Ser Ser Ala Ala Asn Val Ser Lys Ala Asp Ala Gln Asp835 840 845Thr Leu Pro Ala Asp Lys Leu Phe Arg Ala Leu Ala Val Gly Phe Asn850 855 860Leu Lys Ala Asn Val Met Ala Gln Val Ile Asp Trp Leu Asp Lys Thr865 870 875 880Asp Gly Ala Phe Thr Leu Arg Ala Phe Trp Asp Lys Leu Gln Ala Tyr885 890 895Phe Ser Ala Asp His Glu Glu Glu Leu Thr Ala Leu Glu Gly Glu Ala900 905 910
Asp Leu Leu Gln Trp Cys Gln Gln Ile Ser Gln Tyr Ala Leu Ile Val915 920 925Arg Trp Cys Gly Leu Ser Asp Gln Asp Leu Ala Leu Leu Thr Gly His930 935 940Pro Gly Gln Leu Leu Ser Gly Gln His Thr Val Pro Val Pro Ser Leu945 950 955 960His Leu Leu Leu Val Leu Thr Arg Leu Lys Glu Trp Gln Gln Arg Val965 970 975GIn Val Ser Ser Glu Glu Ala Met Arg Tyr Phe Ala Gln Ala Asp Ala980 985 990Pro Thr Val Thr Arg Asp Ala Ala Val Lys Leu Leu Ala Arg Ile His995 10001005Gly Trp Asn Glu Gln Asp Thr Ala Ser Met Asn Asp Tyr Leu Leu101010151020Gly Glu Asn Glu Tyr Pro Lys Asn Phe Glu Gln Ile Phe Thr Leu102510301035Glu Ser Trp Val Asn Leu Gly Arg Gln Leu Asn Val Gly Ser Arg104010451050Thr Leu Gly Glu Leu Val Asp Met Ser Glu Glu Asp Asp Thr Ala105510601065Glu Asn Thr Asp Leu Ile Ile Ser Val Ala Gln Ser Leu Met Ala107010751080
Ala Val Gln Ala1085<210>4<211>3618<212>DNA<213>类芽孢杆菌IDAS 1529菌株<400>4atgaccaagg aaggtggtaa gaatatgtct acttcaaccc tgttgcaatt gattaaggaa 60tcccgccggg atgcgttggt caaccattat atcgccaaca atgtcccgag agagcttacg120gaactcgtaa aaacatcgcc gatagctgag gccattagca gcgttcagtt atacatgaac240cgatgcgtgg aaggctatga aggcaagctg actccggaag gcaacagcca tttcgggccg300ggaaaattcc tgaataattg ggatacctat aacaagcgtt attccacttg ggccggcaag360gaacgtctga aatattatgc aggcagttat attgacccgt ccttgcgcta taacaaaacg420gatccgttcc tgaacctgga acagaatatc agccagggaa gaatcaccga tgacaccgta480aagaacgcgc tgcaacacta cctgactgaa tatgaagtgt tggcggattt ggaatatatc540agcgtaaata aaggcgccga tgaaagtgta ttattcttcg taggccgcac caaaacaatg600ccatacgaat attactggcg ccgattaacg ttgaaaaagg acaataacaa taaactggtg660cctgccatct ggtctcaatg gaaaaaaata actgccaata tcggcgaagc agttaataat720tatgtggtgc ttcactggca taataaccgc ttacatgtac aatggggttc tacagagaaa780acacaaaatg atgacggaga acccattgag aaacgatatt tgaatgactg gttcatggat840aagtccagtg tctggtcttc attccgaaag gtttcatata tagaaaatag ttttacttat900actgagggca tcattgattc aagaaatatt actatagctg gaaatcaact gttctgtgat960gattcaaata cttttaaggc aacaataacg gcacttccat ttgaccaaat acgtgtttac 1020ttagaaaaga tttacggtac aggcggcagc atcacggtta ctggagaaaa taaaggctat 1080
attattaagg tgggggagcc aagagaagtc agtttctctc ctaatacgtt actagatgta1140ttcataggta gtaatgcaag ccctcgagac ccatatttca aagctacatt taatagagaa1200gctctccaaa attcatacgg ctcaattaaa ataaatcaat acacccctcc ttctggaagc1260aatatcaaag gtcctatcga ccttaccctg aaaaataaca tcgacctgtc ggcgttgttg1320gaagagagcc ttgacgtact gttcgactat accattcagg ggaataacca attgggcggc1380ttagaggcct ttaacgggcc ttacggactt tatttgtggg aaatcttcct ccatgttcca1440tttttaatgg cggttcgctt ccacaccgag cagcggtatg agttggcgga acgatggttt1500aaattcattt tcaacagcgc aggttaccgt gatggctacg gcaatctgct gacggatgac1560aaaggcaacg tgcgctactg gaacgtcgtg cctctgcagg aggatacgga gtgggatgac1620acgttgtccc tggcaacgac cgacccggac gagattgcga tggccgaccc gatgcaatac1680aagctggcta tctttattca caccttggac ttcttgatca gccgcggcga cagcttgtac1740cggatgctgg agcgggatac cttgaccgaa gcgaagatgt attacattca ggccagccaa1800ctgcttgggc ctcgtcccga gatccggatc aatcacagct ggcctgatcc gaccctgcaa1860agcgaagcgg acgcggtaac cgccgtgccg acgcgaagcg attcgccggc agcgccaatt1920ctcgccttgc gagcgcttct gaatgcggaa aacgggcatt tcctgccgcc ttataatgat1980gaactattag ctttctggga taaaatcgac ctgcgtctct acaatttacg ccacaatctg2040agcctggacg gtcagccgct tcatttgccg ctctttaccg aaccggtcaa tcctcgtgag2100ctgcaggttc agcatggggc aggcgatgga ttagggggaa gcgccggttc cgtccaaagc2160cgtcaaagtg tctatcgttt tcctctggtc atcgataagg cgcgcaatgc cgcgagtagt2220gttatccaat tcgggaatgc cctggaaaac gcgctgacaa agcaggacag cgaggccatg2280actatgctgt tgcaatccca gcagcagatt gtcctgcagc aaacccgcga tattcaggag2340aagaacctgg cctcgctgca agcaagtctg gaagcaacga tgacagccaa agcgggcgcg2400
aaatcccgaa agacccattt tgccggcctg gcggataact ggatgtcgca taatgaaacc 2460gcctcacttg cactgcgtac cactgcggga attatcaata caagctcgac cgtgccaatc 2520gctatcactg gcggcttgga tatggctccg aacatttttg gtttcgcagt tggaggttcc 2580cgctggggag cagccagcgc ggctgtagcc caaggattgc aaatcgccgc cggcgtaatg 2640gaacagacgg ccaatatcat cgatatcagc gaaagctacc gccggcgccg ggaggattgg 2700ctgctgcagc gggatgttgc cgagaatgaa gcggcgcagt tggattcgca gattgcggcc 2760ctgcgggaac agatggatat ggcgcgaaaa caacttgcgc tggcggagac ggaacaggca 2820cacgcgcaag cggtctacga gctgctaagc acccgtttta cgaatcaagc tttgtataac 2880tggatggccg gacgtctgtc gtctctatac tatcaaatgt atgacgccgc attgccgctc 2940tgcttgatgg ccaaacaggc tttagagaaa gaaatcggca atgataaaac ggttggaatc 3000ttcaccctcc cggcctggaa tgatttgtat cagggattgc tagcgggcga ggcgctgctg 3060ctcgagcttc agaagctgga gaatctgtgg ctggaggagg acaagcgcgg aatggaagct 3120gtaagaacgg tatctttaga tacccttctc cgcaaagaaa agccagaatc cggttttgca 3180gatttcgtca aggaagttct ggacggaaag acgcctgacc ctgtaagcgg agttagcgta 3240cagctgcaaa acaatatttt cagtgcaacc cttgacctgt ccacccttgg cctggatcgc 3300ttttacaacc aagcggaaaa ggcccacagg atcaaaaacc tgtcggttac cttacccgcg 3360ctattgggac cttatcagga tattgcggca accttatcgc taggtggcga gaccgttgcg 3420ctttcccatg gcgtggatga cagcggcttg tttatcacgg atctcaacga cagccgtttc 3480ctgcctttcg agggtatgga tcctttatcc ggcacactcg ttctgtcgat actccatgcc 3540gggcaagacg gtgaccagcg cctcctgctg gaaagcctga acgacgtcat cttccacatt 3600cgatatgtca tgaaatag 3618
<210>5<211>1205<212>PRT<213>类芽孢杆菌IDAS 1529菌株<400>5Met Thr Lys Glu Gly Gly Lys Asn Met Ser Thr Ser Thr Leu Leu Gln1 5 10 15Leu Ile Lys Glu Ser Arg Arg Asp Ala Leu Val Asn His Tyr Ile Ala20 25 30Asn Asn Val Pro Arg Glu Leu Thr Asp Lys Ile Thr Asp Ala Asp Ser35 40 45Leu Tyr Glu Tyr Leu Leu Leu Asp Thr Lys I le Ser Glu Leu Val Lys50 55 60Thr Ser Pro Ile Ala Glu Ala Ile Ser Ser Val Gln Leu Tyr Met Asn65 70 75 80Arg Cys Val Glu Gly Tyr Glu Gly Lys Leu Thr Pro Glu Gly Asn Ser85 90 95His Phe Gly Pro Gly Lys Phe Leu Asn Asn Trp Asp Thr Tyr Asn Lys100 105 110Arg Tyr Ser Thr Trp Ala Gly Lys Glu Arg Leu Lys Tyr Tyr Ala Gly115 120 125Ser Tyr Ile Asp Pro Ser Leu Arg Tyr Asn Lys Thr Asp Pro Phe Leu130 135 140Asn Leu Glu Gln Asn Ile Ser Gln Gly Arg Ile Thr Asp Asp Thr Val
145 150 155 160Lys Asn Ala Leu Gln His Tyr Leu Thr Glu Tyr Glu Val Leu Ala Asp165 170 175Leu Glu Tyr Ile Ser Val Asn Lys Gly Ala Asp Glu Ser Val Leu Phe180 185 190Phe Val Gly Arg Thr Lys Thr Met Pro Tyr Glu Tyr Tyr Trp Arg Arg195 200 205Leu Thr Leu Lys Lys Asp Asn Asn Asn Lys Leu Val Pro Ala Ile Trp210 215 220Ser Gln Trp Lys Lys Ile Thr Ala Asn Ile Gly Glu Ala Val Asn Asn225 230 235 240Tyr Val Val Leu His Trp His Asn Asn Arg Leu His Val Gln Trp Gly245 250 255Ser Thr Glu Lys Thr Gln Asn Asp Asp Gly Glu Pro Ile Glu Lys Arg260 265 270Tyr Leu Asn Asp Trp Phe Met Asp Lys Ser Ser Val Trp Ser Ser Phe275 280 285Arg Lys Val Ser Tyr Ile Glu Asn Ser Phe Thr Tyr Thr Glu Gly Ile290 295 300Ile Asp Ser Arg Asn Ile Thr Ile Ala Gly Asn Gln Leu Phe Cys Asp305 310 315 320Asp Ser Asn Thr Phe Lys Ala Thr Ile Thr Ala Leu Pro Phe Asp Gln
325 330 335Ile Arg Val Tyr Leu Glu Lys Ile Tyr Gly Thr Gly Gly Ser Ile Thr340 345 350Val Thr Gly Glu Asn Lys Gly Tyr Ile Ile Lys Val Gly Glu Pro Arg355 360 365Glu Val Ser Phe Ser Pro Asn Thr Leu Leu Asp Val Phe Ile Gly Ser370 375 380Asn Ala Ser Pro Arg Asp Pro Tyr Phe Lys Ala Thr Phe Asn Arg Glu385 390 395 400Ala Leu Gln Asn Ser Tyr Gly Ser Ile Lys Ile Asn Gln Tyr Thr Pro405 410 415Pro Ser Gly Ser Asn Ile Lys Gly Pro Ile Asp Leu Thr Leu Lys Asn420 425 430Asn Ile Asp Leu Ser Ala Leu Leu Glu Glu Ser Leu Asp Val Leu Phe435 440 445Asp Tyr Thr Ile Gln Gly Asn Asn Gln Leu Gly Gly Leu Glu Ala Phe450 455 460Asn Gly Pro Tyr Gly Leu Tyr Leu Trp Glu Ile Phe Leu His Val Pro465 470 475 480Phe Leu Met Ala Val Arg Phe His Thr Glu Gln Arg Tyr Glu Leu Ala485 490 495Glu Arg Trp Phe Lys Phe Ile Phe Asn Ser Ala Gly Tyr Arg Asp Gly
500 505 510Tyr Gly Asn Leu Leu Thr Asp Asp Lys Gly Asn Val Arg Tyr Trp Asn515 520 525Val Val Pro Leu Gln Glu Asp Thr Glu Trp Asp Asp Thr Leu Ser Leu530 535 540Ala Thr Thr Asp Pro Asp Glu Ile Ala Met Ala Asp Pro Met Gln Tyr545 550 555 560Lys Leu Ala Ile Phe Ile His Thr Leu Asp Phe Leu Ile Ser Arg Gly565 570 575Asp Ser Leu Tyr Arg Met Leu Glu Arg Asp Thr Leu Thr Glu Ala Lys580 585 590Met Tyr Tyr Ile Gln Ala Ser Gln Leu Leu Gly Pro Arg Pro Glu Ile595 600 605Arg Ile Asn His Ser Trp Pro Asp Pro Thr Leu Gln Ser Glu Ala Asp610 615 620Ala Val Thr Ala Val Pro Thr Arg Ser Asp Ser Pro Ala Ala Pro Ile625 630 635 640Leu Ala Leu Arg Ala Leu Leu Asn Ala Glu Asn Gly His Phe Leu Pro645 650 655Pro Tyr Asn Asp Glu Leu Leu Ala Phe Trp Asp Lys Ile Asp Leu Arg660 665 670Leu Tyr Asn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro Leu His
675 680 685Leu Pro Leu Phe Thr Glu Pro Val Asn Pro Arg Glu Leu Gln Val Gln690 695 700His Gly Ala Gly Asp Gly Leu Gly Gly Ser Ala Gly Ser Val Gln Ser705 710 715 720Arg Gln Ser Val Tyr Arg Phe Pro Leu Val Ile Asp Lys Ala Arg Asn725 730 735Ala Ala Ser Ser Val Ile Gln Phe Gly Asn Ala Leu Glu Asn Ala Leu740 745 750Thr Lys Gln Asp Ser Glu Ala Met Thr Met Leu Leu Gln Ser Gln Gln755 760 765Gln Ile Va1 Leu Gln Gln Thr Arg Asp Ile Gln Glu Lys Asn Leu Ala770 775 780Ser Leu Gln Ala Ser Leu Glu Ala Thr Met Thr Ala Lys Ala Gly Ala785 790 795 800Lys Ser Arg Lys Thr His Phe Ala Gly Leu Ala Asp Asn Trp Met Ser805 810 815His Asn Glu Thr Ala Ser Leu Ala Leu Arg Thr Thr Ala Gly Ile Ile820 825 830Asn Thr Ser Ser Thr Val Pro Ile Ala Ile Thr Gly Gly Leu Asp Met835 840 845Ala Pro Asn Ile Phe Gly Phe Ala Val Gly Gly Ser Arg Trp Gly Ala
850 855 860Ala Ser Ala Ala Val Ala Gln Gly Leu Gln Ile Ala Ala Gly Val Met865 870 875 880Glu Gln Thr Ala Asn Ile Ile Asp Ile Ser Glu Ser Tyr Arg Arg Arg885 890 895Arg Glu Asp Trp Leu Leu Gln Arg Asp Val Ala Glu Asn Glu Ala Ala900 905 910Gln Leu Asp Ser Gln Ile Ala Ala Leu Arg Glu Gln Met Asp Met Ala915 920 925Arg Lys Gln Leu Ala Leu Ala Glu Thr Glu Gln Ala His Ala Gln Ala930 935 940Val Tyr Glu Leu Leu Ser Thr Arg Phe Thr Asn Gln Ala Leu Tyr Asn945 950 955 960Trp Met Ala Gly Arg Leu Ser Ser Leu Tyr Tyr Gln Met Tyr Asp Ala963 970 975Ala Leu Pro Leu Cys Leu Met Ala Lys Gln Ala Leu Glu Lys Glu Ile980 985 990Gly Asn Asp Lys Thr Val Gly Ile Phe Thr Leu Pro Ala Trp Asn Asp995 10001005Leu Tyr Gln Gly Leu Leu Ala Gly Glu Ala Leu Leu Leu Glu Leu101010l51020Gln Lys Leu Glu Asn Leu Trp Leu Glu Glu Asp Lys Arg Gly Met
102510301035Glu Ala Val Arg Thr Val Ser Leu Asp Thr Leu Leu Arg Lys Glu104010451050Lys Pro Glu Ser Gly Phe Ala Asp Phe Val Lys Glu Val Leu Asp105510601065Gly Lys Thr Pro Asp Pro Val Ser Gly Val Ser Val Gln Leu Gln107010751080Asn Asn Ile Phe Ser Ala Thr Leu Asp Leu Ser Thr Leu Gly Leu108510901095Asp Arg Phe Tyr Asn Gln Ala Glu Lys Ala His Arg Ile Lys Asn110011051110Leu Ser Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Ile111511201125Ala Ala Thr Leu Ser Leu Gly Gly Glu Thr Val Ala Leu Ser His113011351140Gly Val Asp Asp Ser Gly Leu Phe Ile Thr Asp Leu Asn Asp Ser114511501155Arg Phe Leu Pro Phe Glu Gly Met Asp Pro Leu Ser Gly Thr Leu116011651170Val Leu Ser Ile Leu His Ala Gly Gln Asp Gly Asp Gln Arg Leu117511801185Leu Leu Glu Ser Leu Asn Asp Val Ile Phe His Ile Arg Tyr Val
1190 11951200Met Lys1205<210>6<211>3300<212>DNA<213>类芽孢杆菌IDAS 1529菌株<400>6atggtgtcaa caacagacaa cacggccggc gtattccggc tcggaaccga agaattaaca 60gaagcgctta agcagtccgg ttatcggacc gtctttgata ttgtatctga caatcttgcg 120gccgtccaga ggacagaaaa cttatgcatg ctttataagg cctggcagct gcacaatgat 240ccggttgtcc agagccttcc caaattatcc gcggataccg gcctgcaagg catgcgtgcc 300gcgttggagc ggagtcttgg aggcggagcc gattttggag acttgttccc ggagcgatcg 360ccagagggct atgcggaagc ctcctctata cagtcgcttt tctcgccggg acgttacctg 420acggtgctgt ataaaattgc gcgggatctc cacgacccaa aagataaact gcatattgac 480aaccgccgtc cagatttgaa gtcgctgatc ctcaataatg acaatatgaa ccgagaggta 540tcttctctgg atatccttct ggatgtgctg cagcccgaag gctctgacac gctgacatcc 600ttgaaggata cctaccatcc gatgaccctt ccctatgatg acgaccttgc gcaaatcaat 660gccgtggcgg aggcgcgttc atctaatttg ctggggattt gggataccct gctggacacg 720cagcggactt ccatcctgca gaattccgcc gctgcccgcc ggataagcaa ggcgcggcac 780tcggcatacg ccaatcagaa agcctccaat gatgagccgg tattcatcac gggagaggaa 840atctacctgg aaaccggagg taaacggctt tttctggcgc ataaactcga gataggttca 900actattagcg ctaaaatcaa cattggaccg ccgcaagcgg ccgatatcgc gccggcaaag 960
ttgcaactcg tatattacgg cagaggcggc agagggaact acttcctgcg cgtggcagac1020gatgtgtccc tcggtggaaa gctgctgacc aattgttatc tgaccagcga tgacggacag1080agcaacaata ttagcgggcc atactgccta atgatcaacc gaggcaccgg cagcatgcct1140agcgggactc accttccagt tcagattgaa agagtgaccg atacatccat ccgcattttt1200gtgccggatc acggctattt ggggctaggc gaaagccttg ccagcaactg gaatgaaccg1260ttggcgctga atctgggctt ggatgaagcg ttgaccttta ccttgagaaa gaaggagacg1320ggaaatgaca ccatttccat aatcgacatg ctgccgccgg tagcgaacac gactccgtct1380ccgccgacga gggaaacgct ttccttgacg ccaaacagct tccgtctgct ggtcaaccct1440gagccgacag cggaggacat cgccaagcac tacaacgtca cgacggtaac ccgggctcct1500gccgatctgg cctccgcctt aaatgttgtc gatgatttct gcttgaaaac cggtttgagc1560tttaacgaat tgctggattt aaccatgcag aaggattatc agtcaaaaag cagtgagtac1620aaaagccgat ttgtaaaatt cggcggcggg gagaatgttc cggtatcaag ctatggcgca1680gcctttctga caggagcgga agatactcct ttgtgggtga aacagtataa cagcgtgggg1740actgcaacaa gcacccctgt tttaaacttt acgccagata atgttgtggc tttggcagga1800agggcggaaa agcttgtccg gctgatgcgc agcacgggtc tttcctttga gcagttggatl860tggctgattg ccaatgccag ccgtgccgtt atcgaacacg gtggagagct ttttctggat1920aagccggtac tggaagctgt ggccgaattc acaaggctca ataagcgtta tggcgtcaca1980tcggatatgt tcgccgcgtt tatcggcgaa gtcaatacgt atacagaagc gggcaaggac2040agcttttatc aggcgagttt cagcacggcc gaccattcgg ctaccttacc tttgggcgct2100tctttgcaac ttgaggtgag caagcaggat cgatatgaag cgatttgctg cggggctatg2160ggggtgaccg ccgatgagtt ctcccgtatc ggcaaatact gctttgggga taaagcacag2220caaatcacgg ccaatgaaac aaccgttgcc cagctttatc gtttaggccg aattcctcat2280
atgctaggct tgcgttttac cgaggcagag ctgttgtgga aattgatggc tgggggcgag 2340gataccttgc tccgcacgat tggcgcgaac cctcgcagtt tagaagcgtt agagattatt 2400cgccggacgg aggtcctttt ggactggatg gatgcccatc agctggatgt tgtctccctg 2460caagccatgg ttaccaatcg gtacagcggc acagccacgc cggagctgta caattttttg 2520gcacaggtgc atcaatccgc aagcagtgcc gcgaacgtgg ccagagcgga tggtcaggat 2580acgttgcctg cggacaagct gctccgggca ttggcggcgg gettcaaact gaaagccaac 2640gtgatggcgc gagtaatcga ctggatggac aaaaccaata aagcgtttac gctgcgggct 2700ttctgggaca agcttcaagc gtatttcagc gccgatcatg aagaagaact gaccgccctg 2760gaaggagaag ccgcaatgct gcagtggtgc cagcagatca gccagtatgc gctcattgtc 2820cgctggtgcg ggttaagcga gcaggatctg gcgctgctga ccgggaatcc ggagcagctt 2880ctggacggac aacatacggt gcccgtaccc tcgctgcatc tcctgctggt gctgacccgc 2940ctgaaggaat ggcagcagcg cgtccaggtt tccagcgagg aggctatgcg ctattttgcc 3000caggccgatt cgccaaccgt cacgcgcgac gatgcggtta atctgcttgc ccgtatccat 3060ggctggaatg aagcggatac cgtctcgatg aatgactacc tgctgggaga gaacgaatat 3120cctaagaact ttgatcagat ctttgcactg gaaagctggg tcaacctggg ccgtcaactg 3180aacgtgggca gcagaacgct gggagagctg gttgacatgg ctgaagagga taaaaccgcg 3240gaaaacatgg atctgattac ttcggtggcc catagcctga tggctgcagc gaaagcctga 3300<210>7<211>1099<212>PRT<213>类芽孢杆菌IDAS 1529菌株<400>7Met Val Ser Thr Thr Asp Asn Thr Ala Gly Val Phe Arg Leu Gly Thr1 5 10 15
Glu Glu Leu Thr Glu Ala Leu Lys Gln Ser Gly Tyr Arg Thr Val Phe20 25 30Asp Ile Val Ser Asp Asn Leu Ala Glu Phe Gln Lys Asn Asn Pro Glu35 40 45Ile Pro Ser Ser Asp Ala Lys Glu Ile His Gln Leu Ala Val Gln Arg50 55 60Thr Glu Asn Leu Cys Met Leu Tyr Lys Ala Trp Gln Leu His Asn Asp65 70 75 80Pro Val Val Gln Ser Leu Pro Lys Leu Ser Ala Asp Thr Gly Leu Gln85 90 95Gly Met Arg Ala Ala Leu Glu Arg Ser Leu Gly Gly Gly Ala Asp Phe100 105 110Gly Asp Leu Phe Pro Glu Arg Ser Pro Glu Gly Tyr Ala Glu Ala Ser115 120 125Ser Ile Gln Ser Leu Phe Ser Pro Gly Arg Tyr Leu Thr Val Leu Tyr130 135 140Lys Ile Ala Arg Asp Leu His Asp Pro Lys Asp Lys Leu His Ile Asp145 150 155 160Asn Arg Arg Pro Asp Leu Lys Ser Leu Ile Leu Asn Asn Asp Asn Met165 170 175Asn Arg Glu Val Ser Ser Leu Asp Ile Leu Leu Asp Val Leu Gln Pro180 185 190
Glu Gly Ser Asp Thr Leu Thr Ser Leu Lys Asp Thr Tyr His Pro Met195 200 205Thr Leu Pro Tyr Asp Asp Asp Leu Ala Gln Ile Asn Ala Val Ala Glu210 215 220Ala Arg Ser Ser Asn Leu Leu Gly Ile Trp Asp Thr Leu Leu Asp Thr225 230 235 240Gln Arg Thr Ser Ile Leu Gln Asn Ser Ala Ala Ala Arg Arg Ile Ser245 250 255Lys Ala Arg His Ser Ala Tyr Ala Asn Gln Lys Ala Ser Asn Asp Glu260 265 270Pro Val Phe Ile Thr Gly Glu Glu Ile Tyr Leu Glu Thr Gly Gly Lys275 280 285Arg Leu Phe Leu Ala His Lys Leu Glu Ile Gly Ser Thr Ile Ser Ala290 295 300Lys Ile Asn Ile Gly Pro Pro Gln Ala Ala Asp Ile Ala Pro Ala Lys305 310 315 320Leu Gln Leu Val Tyr Tyr Gly Arg Gly Gly Arg Gly Asn Tyr Phe Leu325 330 335Arg Val Ala Asp Asp Val Ser Leu Gly Gly Lys Leu Leu Thr Asn Cys340 345 350Tyr Leu Thr Ser Asp Asp Gly Gln Ser Asn Asn Ile Ser Gly Pro Tyr355 360 365
Cys Leu Met Ile Asn Arg Gly Thr Gly Ser Met Pro Ser Gly Thr His370 375 380Leu Pro Val Gln Ile Glu Arg Val Thr Asp Thr Ser Ile Arg Ile Phe385 390 395 400Val Pro Asp His Gly Tyr Leu Gly Leu Gly Glu Ser Leu Ala Ser Asn405 410 415Trp Asn Glu Pro Leu Ala Leu Asn Leu Gly Leu Asp Glu Ala Leu Thr420 425 430Phe Thr Leu Arg Lys Lys Glu Thr Gly Asn Asp Thr Ile Ser Ile Ile435 440 445Asp Met Leu Pro Pro Val Ala Asn Thr Thr Pro Ser Pro Pro Thr Arg450 455 460Glu Thr Leu Ser Leu Thr Pro Asn Ser Phe Arg Leu Leu Val Asn Pro465 470 475 480Glu Pro Thr Ala Glu Asp Ile Ala Lys His Tyr Asn Val Thr Thr Val485 490 495Thr Arg Ala Pro Ala Asp Leu Ala Ser Ala Leu Asn Val Val Asp Asp500 505 510Phe Cys Leu Lys Thr Gly Leu Ser Phe Asn Glu Leu Leu Asp Leu Thr515 520 525Met Gln Lys Asp Tyr Gln Ser Lys Ser Ser Glu Tyr Lys Ser Arg Phe530 535 540
Val Lys Phe Gly Gly Gly Glu Asn Val Pro Val Ser Ser Tyr Gly Ala545 550 555 560Ala Phe Leu Thr Gly Ala Glu Asp Thr Pro Leu Trp Val Lys Gln Tyr565 570 575Asn Ser Val Gly Thr Ala Thr Ser Thr Pro Va1 Leu Asn Phe Thr Pro580 585 590Asp Asn Val Val Ala Leu Ala Gly Arg Ala Glu Lys Leu Val Arg Leu595 600 605Met Arg Ser Thr Gly Leu Ser Phe Glu Gln Leu Asp Trp Leu Ile Ala610 615 620Asn Ala Ser Arg Ala Val Ile Glu His Gly Gly Glu Leu Phe Leu Asp625 630 635 640Lys Pro Val Leu Glu Ala Val Ala Glu Phe Thr Arg Leu Asn Lys Arg645 650 655Tyr Gly Val Thr Ser Asp Met Phe Ala Ala Phe Ile Gly Glu Val Asn660 665 670Thr Tyr Thr Glu Ala G1y Lys Asp Ser Phe Tyr Gln Ala Ser Phe Ser675 680 685Thr Ala Asp His Ser Ala Thr Leu Pro Leu Gly Ala Ser Leu Gln Leu690 695 700Glu Val Ser Lys Gln Asp Arg Tyr Glu Ala Ile Cys Cys Gly Ala Met705 710 715 720
Gly Val Thr Ala Asp Glu Phe Ser Arg Ile Gly Lys Tyr Cys Phe Gly725 730 735Asp Lys Ala Gln Gln Ile Thr Ala Asn Glu Thr Thr Val Ala Gln Leu740 745 750Tyr Arg Leu Gly Arg Ile Pro His Met Leu Gly Leu Arg Phe Thr Glu755 760 765Ala Glu Leu Leu Trp Lys Leu Met Ala Gly Gly Glu Asp Thr Leu Leu770 775 780Arg Thr Ile Gly Ala Asn Pro Arg Ser Leu Glu Ala Leu Glu Ile Ile785 790 795 800Arg Arg Thr Glu Val Leu Leu Asp Trp Met Asp Ala His Gln Leu Asp805 810 815Val Val Ser Leu Gln Ala Met Val Thr Asn Arg Tyr Ser Gly Thr Ala820 825 830Thr Pro Glu Leu Tyr Asn Phe Leu Ala Gln Val His Gln Ser Ala Ser835 840 845Ser Ala Ala Asn Val Ala Arg Ala Asp Gly Gln Asp Thr Leu Pro Ala850 855 860Asp Lys Leu Leu Arg Ala Leu Ala Ala Gly Phe Lys Leu Lys Ala Asn865 870 875 880Val Met Ala Arg Val Ile Asp Trp Met Asp Lys Thr Asn Lys Ala Phe885 890 895
Thr Leu Arg Ala Phe Trp Asp Lys Leu Gln Ala Tyr Phe Ser Ala Asp900 905 910His Glu Glu Glu Leu Thr Ala Leu Glu Gly Glu Ala Ala Met Leu Gln915 920 925Trp Cys Gln Gln Ile Ser Gln Tyr Ala Leu Ile Val Arg Trp Cys Gly930 935 940Leu Ser Glu Gln Asp Leu Ala Leu Leu Thr Gly Asn Pro Glu Gln Leu945 950 955 960Leu Asp Gly Gln His Thr Val Pro Val Pro Ser Leu His Leu Leu Leu965 970 975Val Leu Thr Arg Leu Lys Glu Trp Gln Gln Arg Val Gln Val Ser Ser980 985 990Glu Glu Ala Met Arg Tyr Phe Ala Gln Ala Asp Ser Pro Thr Val Thr995 10001005Arg Asp Asp Ala Val Asn Leu Leu Ala Arg Ile His Gly Trp Asn101010151020Glu Ala Asp Thr Val Ser Met Asn Asp Tyr Leu Leu Gly Glu Asn102510301035Glu Tyr Pro Lys Asn Phe Asp Gln Ile Phe Ala Leu Glu Ser Trp104010451050Val Asn Leu Gly Arg Gln Leu Asn Val Gly Ser Arg Thr Leu Gly105510601065
Glu Leu Val Asp Met Ala Glu Glu Asp Lys Thr Ala Glu Asn Met107010751080Asp Leu Ile Thr Ser Val Ala His Ser Leu Met Ala Ala Ala Lys108510901095Ala<210>8<211>3627<212>DNA<213>类芽孢杆菌IDAS 1529菌株<400>8atgaccaagg aaggtgataa gcatatgtct acttcaaccc tgttgcaatc gattaaagaa60gcccgccggg atgcgctggt caaccattat attgctaatc aggttccgac agcgcttgcg 120gaactcgtaa aaacatcgcc gatagcggag gccatcagca gcgtgcagtt atacatgaac 240cgctgcgtcg aaggctatga aggcaagttg actccggaaa gtaatactca ttttggccca 300ggtaaatttc tatataactg ggatacgtac aacaaacgtt tttccacctg ggcaggaaaa 360gaacgcttga aatattatgc aggcagctat attgagccgt ccttgcgcta caacaaaacc 420gatccattcc tgaacctgga acagagcatc agccagggaa gaattactga tgataccgta 480aagaacgcgc tgcaacacta cctgactgaa tatgaagtgt tggcggatct ggattatatc 540agcgttaata aaggcggcga cgaaagtgtt ttactctttg ttggacgcac caaaaccgta 600ccgtatgaat actactggcg ccgtttgctt ttaaaaaggg acaataataa taagctagta 660ccagcagtct ggtctcagtg gaaaaaaatc agtgccaata tcggtgaagc ggttgatagt 720tatgtggtgc ctcggtggca taaaaaccgg ctacatgtgc aatggtgttc tatagagaaa 780
agtgaaaatg atgccggtga acccattgag aaacgatatt tgaatgactg gttcatggat840agttccggag tctggtcttc atttcgaaag attccggttg tggaaaagag tttcgaatat900ttggacggaa gcctcgatcc ccgatttgtc gctcttgtta gaaatcaaat attaattgat960gagccagaaa tattcagaat tacagtatca gcccctaatc cgatagatgc aaatggaaga 1020gtagaggtac attttgaaga aaactatgca aacagatata atattaccat taaatatggg 1080acaacgagtc ttgctattcc tgcagggcag gtagggcatc caaatatctc tattaatgaa 1140acattaaggg ttgaattcgg caccaggccg gattggtatt atactttcag atatttagga 1200aatacaatcc aaaactcata cggttcaatt gtcaataatc aattttcacc tccatcagga 1260agcaatatta aaggtcctat cgaccttacc ctgaaaaata acatcgacct gtcggccttg 1320ttggatgaga gccttgacgc actgttcgac tataccattc agggcgataa ccaattgggc 1380ggcttagctg cctttaacgg gccttacgga ctttacttgt gggaaatctt cttccatgtt 1440ccttttttaa tggcggttcg cttccacacc gagcagcggt atgagttggc ggaacgttgg 1500tttaaattca tcttcaacag cgcaggatac cgtgatgatt acggcagtct gctgacggat 1560gacaaaggca acgtgcgtta ctggaacgtg ataccgctgc aagaggacac ggagtgggat 1620gacacgttgt ccctggcaac gaccgacccg gacgagattg cgatggccga cccgatgcaa 1680tacaagctgg ctatatttat tcacaccatg gacttcctga tcagccgcgg cgatagcttg 1740taccggatgc tggagcggga taccctggcc gaagccaaga tgtattacat tcaggccagc 1800caactgcttg ggccccgccc cgacatccgg ctcaatcaca gttggcctaa tccgaccttg 1860caaagcgaag cggacgcggt aaccgccgtg ccgacgcgaa gcgattcgcc ggcagcgcca 1920attttggcct tgcgagcgct tctgacaggc gaaaacggtc atttcctgcc gccttataat 1980gatgaactgt tcgctttctg ggacaaaatc gatctgcgtt tatacaattt gcgccacaat 2040ttgagtctgg acggtcagcc gcttcatttg ccgctctttg ccgaaccggt caatccgcgt 2100
gaattgcagg ttcagcatgg cccgggcgat ggcttggggg gaagcgcggg ttccgcccaa 2160agccgtcaga gtgtctatcg ttttcctctg gtcatcgata aggcgcgcaa tgcggccaac 2220agtgtcatcc aattcggcaa tgccctggaa aacgcactga ccaagcaaga cagcgaagca 2280atgaccatgc tgttgcagtc ccagcagcag attgtcctgc agcaaacccg cgatattcag 2340gagaagaacc tggccgcgct gcaagcaagt ctggaagcaa cgatgacagc gaaagcgggg 2400gcggagtccc ggaagaccca ttttgccggc ttggcggaca actggatgtc ggacaatgaa 2460accgcctcac tcgcactgcg taccaccgcg ggaatcatca ataccagctc aaccgtgccg 2520atcgccatca ccggcggctt ggatatggct ccgaacattt ttggtttcgc agttggaggt 2580tcccgctggg gagcagccag cgcggctgta gcccaaggat tgcaaatcgc cgccggcgta 2640atggaacaga cggccaatat tatcgatatt agcgaaagct accgccggcg ccgggaggat 2700tggctgctgc agcgggatgt tgccgaaaat gaagcggcgc agttggattc gcagattgcg 2760gccctgcggg aacagatgga tatggcgcgc aagcaacttg cgctggcgga gacggaacag 2820gcgcacgcgc aagcggtcta cgagctgcaa agcacccgct ttacgaatca agctttgtat 2880aactggatgg ctggacgtct gtcgtctcta tactatcaaa tgtatgacgc cgcattgccg 2940ctctgcttga tggcgaagca ggctttagag aaagaaatcg gttcggataa aacggtcgga 3000gtcttgtccc tcccggcctg gaatgatcta tatcagggat tattggcggg cgaggcgctg 3060ctgctcgagc ttcagaagct ggagaatctg tggctggagg aagacaagcg cggaatggaa 3120gccgtaaaaa cagtctctct ggatactctt ctccgcaaaa caaatccgaa ctccgggttt 3180gcggatctcg tcaaggaggc actggacgaa aacggaaaga cgcctgaccc ggtgagcgga 3240gtcggcgtac agctgcaaaa caatattttc agcgcaaccc ttgacctctc cgttcttggc 3300ctggatcgct cttacaatca ggcggaaaag tcccgcagga tcaaaaatat gtcggttacc 3360ttacctgcgc tattggggcc ttaccaggat atagaggcaa ccttatcgct aggcggcgag 3420
accgttgcgc tgtcccatgg cgtggatgac agcggcttgt tcatcactga tctcaacgac 3480agccggttcc tgcctttcga gggcatggat ccgttatccg gcacactcgt cctgtcgata 3540ttccatgccg ggcaagacgg cgaccagcgc ctcctgctgg aaagtctcaa tgacgtcatc 3600ttccacattc gatatgttat gaaatag 3627<210>9<211>1208<212>PRT<213>类芽孢杆菌IDAS 1529菌株<400>9Met Thr Lys Glu Gly Asp Lys His Met Ser Thr Ser Thr Leu Leu Gln1 5 10 15Ser Ile Lys Glu Ala Arg Arg Asp Ala Leu Val Asn His Tyr Ile Ala20 25 30Asn Gln Val Pro Thr Ala Leu Ala Asp Lys Ile Thr Asp Ala Asp Ser35 40 45Leu Tyr Glu Tyr Leu Leu Leu Asp Thr Lys Ile Ser Glu Leu Val Lys50 55 60Thr Ser Pro Ile Ala Glu Ala Ile Ser Ser Val Gln Leu Tyr Met Asn65 70 75 80Arg Cys Val Glu Gly Tyr Glu Gly Lys Leu Thr Pro Glu Ser Asn Thr85 90 95His Phe Gly Pro Gly Lys Phe Leu Tyr Asn Trp Asp Thr Tyr Asn Lys100 105 110
Arg Phe Ser Thr Trp Ala Gly Lys Glu Arg Leu Lys Tyr Tyr Ala Gly115 120 125Ser Tyr Ile Glu Pro Ser Leu Arg Tyr Asn Lys Thr Asp Pro Phe Leu130 135 140Asn Leu Glu Gln Ser Ile Ser Gln Gly Arg Ile Thr Asp Asp Thr Val145 150 155 160Lys Asn Ala Leu Gln His Tyr Leu Thr Glu Tyr Glu Va1 Leu Ala Asp165 170 175Leu Asp Tyr Ile Ser Val Asn Lys Gly Gly Asp Glu Ser Val Leu Leu180 185 190Phe Val Gly Arg Thr Lys Thr Val Pro Tyr Glu Tyr Tyr Trp Arg Arg195 200 205Leu Leu Leu Lys Arg Asp Asn Asn Asn Lys Leu Val Pro Ala Val Trp210 215 220Ser Gln Trp Lys Lys Ile Ser Ala Asn Ile Gly Glu Ala Val Asp Ser225 230 235 240Tyr Val Val Pro Arg Trp His Lys Asn Arg Leu His Val Gln Trp Cys245 250 255Ser Ile Glu Lys Ser Glu Asn Asp Ala Gly Glu Pro Ile Glu Lys Arg260 265 270Tyr Leu Asn Asp Trp Phe Met Asp Ser Ser Gly Val Trp Ser Ser Phe275 280 285
Arg Lys Ile Pro Val Val Glu Lys Ser Phe Glu Tyr Leu Asp Gly Ser290 295 300Leu Asp Pro Arg Phe Val Ala Leu Val Arg Asn Gln Ile Leu Ile Asp305 310 315 320Glu Pro Glu Ile Phe Arg Ile Thr Val Ser Ala Pro Asn Pro Ile Asp325 330 335Ala Asn Gly Arg Val Glu Val His Phe Glu Glu Asn Tyr Ala Asn Arg340 345 350Tyr Asn Ile Thr Ile Lys Tyr Gly Thr Thr Ser Leu Ala Ile Pro Ala355 360 365Gly Gln Val Gly His Pro Asn Ile Ser Ile Asn Glu Thr Leu Arg Val370 375 380Glu Phe Gly Thr Arg Pro Asp Trp Tyr Tyr Thr Phe Arg Tyr Leu Gly385 390 395 400Asn Thr Ile Gln Asn Ser Tyr Gly Ser Ile Val Asn Asn Gln Phe Ser405 410 415Pro Pro Ser Gly Ser Asn Ile Lys Gly Pro Ile Asp Leu Thr Leu Lys420 425 430Asn Asn Ile Asp Leu Ser Ala Leu Leu Asp Glu Ser Leu Asp Ala Leu435 440 445Phe Asp Tyr Thr Ile Gln Gly Asp Asn Gln Leu Gly Gly Leu Ala Ala450 455 460
Phe Asn Gly Pro Tyr Gly Leu Tyr Leu Trp Glu Ile Phe Phe His Val465 470 475 480Pro Phe Leu Met Ala Val Arg Phe His Thr Glu Gln Arg Tyr Glu Leu485 490 495Ala Glu Arg Trp Phe Lys Phe Ile Phe Asn Ser Ala Gly Tyr Arg Asp500 505 510Asp Tyr Gly Ser Leu Leu Thr Asp Asp Lys Gly Asn Val Arg Tyr Trp515 520 525Asn Val Ile Pro Leu Gln Glu Asp Thr Glu Trp Asp Asp Thr Leu Ser530 535 540Leu Ala Thr Thr Asp Pro Asp Glu Ile Ala Met Ala Asp Pro Met Gln545 550 555 560Tyr Lys Leu Ala Ile Phe Ile His Thr Met Asp Phe Leu Ile Ser Arg565 570 575Gly Asp Ser Leu Tyr Arg Met Leu Glu Arg Asp Thr Leu Ala Glu Ala580 585 590Lys Met Tyr Tyr Ile Gln Ala Ser Gln Leu Leu Gly Pro Arg Pro Asp595 600 605Ile Arg Leu Asn His Ser Trp Pro Asn Pro Thr Leu Gln Ser Glu Ala610 615 620Asp Ala Val Thr Ala Val Pro Thr Arg Ser Asp Ser Pro Ala Ala Pro625 630 635 640
Ile Leu Ala Leu Arg Ala Leu Leu Thr Gly Glu Asn Gly His Phe Leu645 650 655Pro Pro Tyr Asn Asp Glu Leu Phe Ala Phe Trp Asp Lys Ile Asp Leu660 665 670Arg Leu Tyr Asn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro Leu675 680 685His Leu Pro Leu Phe Ala Glu Pro Val Asn Pro Arg Glu Leu Gln Val690 695 700Gln His Gly Pro Gly Asp Gly Leu Gly Gly Ser Ala Gly Ser Ala Gln705 710 715 720Ser Arg Gln Ser Val Tyr Arg Phe Pro Leu Val Ile Asp Lys Ala Arg725 730 735Asn Ala Ala Asn Ser Val Ile Gln Phe Gly Asn Ala Leu Glu Asn Ala740 745 750Leu Thr Lys Gln Asp Ser Glu Ala Met Thr Met Leu Leu Gln Ser Gln755 760 765Gln Gln Ile Val Leu Gln Gln Thr Arg Asp Ile Gln Glu Lys Asn Leu770 775 780Ala Ala Leu Gln Ala Ser Leu Glu Ala Thr Met Thr Ala Lys Ala Gly785 790 795 800Ala Glu Ser Arg Lys Thr His Phe Ala Gly Leu Ala Asp Asn Trp Met805 810 815
Ser Asp Asn Glu Thr Ala Ser Leu Ala Leu Arg Thr Thr Ala Gly Ile820 825 830Ile Asn Thr Ser Ser Thr Val Pro Ile Ala Ile Thr Gly Gly Leu Asp835 840 845Met Ala Pro Asn Ile Phe Gly Phe Ala Val Gly Gly Ser Arg Trp Gly850 855 860Ala Ala Ser Ala Ala Val Ala Gln Gly Leu Gln Ile Ala Ala Gly Val865 870 875 880Met Glu Gln Thr Ala Asn Ile Ile Asp Ile Ser Glu Ser Tyr Arg Arg885 890 895Arg Arg Glu Asp Trp Leu Leu Gln Arg Asp Val Ala Glu Asn Glu Ala900 905 910Ala Gln Leu Asp Ser Gln Ile Ala Ala Leu Arg Glu Gln Met Asp Met915 920 925Ala Arg Lys Gln Leu Ala Leu Ala Glu Thr Glu Gln Ala His Ala Gln930 935 940Ala Val Tyr Glu Leu Gln Ser Thr Arg Phe Thr Asn Gln Ala Leu Tyr945 950 955 960Asn Trp Met Ala Gly Arg Leu Ser Ser Leu Tyr Tyr Gln Met Tyr Asp965 970 975Ala Ala Leu Pro Leu Cys Leu Met Ala Lys Gln Ala Leu Glu Lys Glu980 985 990
Ile Gly Ser Asp Lys Thr Val Gly Val Leu Ser Leu Pro Ala Trp Asn995 10001005Asp Leu Tyr Gln Gly Leu Leu Ala Gly Glu Ala Leu Leu Leu Glu101010151020Leu Gln Lys Leu Glu Asn Leu Trp Leu Glu Glu Asp Lys Arg Gly102510301035Met Glu Ala Val Lys Thr Val Ser Leu Asp Thr Leu Leu Arg Lys104010451050Thr Asn Pro Asn Ser Gly Phe Ala Asp Leu Val Lys Glu Ala Leu105510601065Asp Glu Asn Gly Lys Thr Pro Asp Pro Val Ser Gly Val Gly Val107010751080Gln Leu Gln Asn Asn Ile Phe Ser Ala Thr Leu Asp Leu Ser Val108510901095Leu Gly Leu Asp Arg Ser Tyr Asn Gln Ala Glu Lys Ser Arg Arg110011051110Ile Lys Asn Met Ser Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr111511201125Gln Asp Ile Glu Ala Thr Leu Ser Leu Gly Gly Glu Thr Val Ala113011351140Leu Ser His Gly Val Asp Asp Ser Gly Leu Phe Ile Thr Asp Leu114511501155
Asn Asp Ser Arg Phe Leu Pro Phe Glu Gly Met Asp Pro Leu Ser116011651170Gly Thr Leu Val Leu Ser Ile Phe His Ala Gly Gln Asp Gly Asp117511801185Gln Arg Leu Leu Leu Glu Ser Leu Asn Asp Val Ile Phe His Ile119011951200Arg Tyr Val Met Lys1205<210>10<211>4335<212>DNA<213>类芽孢杆菌IDAS 1529菌株<400>10atgccacaat ctagcaatgc cgatatcaag ctattgtcgc catcgctgcc aaagggcggc60ggttccatga agggaatcga agaaaacatc gcggctcccg gctccgacgg catggcacgt 120tgtaatgtgc cgctgccggt aacctccggc cgctatatta ctcctgatat aagcctgtcc 180tatgcgagcg gccacggcaa cggcgcttat ggaatgggct ggacgatggg agtgatgagc 240attagccgga gaacaagccg agggaccccc agttatacat ccgaagacca gttccttggt 300ccggatgggg aggtgcttgt tccggaaagc aacgaacaag gggagatcat tacccgccac 360accgatacgg cccaagggat accgttaggc gagacgttta cggttacacg ctattttccc 420cggatcgaga gcgcttttca tttgctggaa tactgggaag cgcaagcagg aagcgcaaca 480gcgtcgtttt ggcttattca ctctgccgat ggagtgctgc actgtctggg taaaactgct 540caggcgagga tagccgcccc tgacgattcc gccaagatcg cagaatggct agtggaggag 600tccgtctccc ccttcggaga gcatatttat taccaataca aagaagaaga caatcaaggc 660
gtgaatctgg aggaagacaa tcatcaatat ggggcgaacc gctatctgaa atcgattcgc720tatggaaata aggttgcctc tccttctctc tatgtctgga agggggaaat tccggcagac780ggccaatggc tgtattccgt tatcctggat tatggcgaga acgatacctc agcggatgtt840cctcccctat acacgcccca aggggagtgg ctggtgcgcc cggaccgttt ttcccgctat900gactacggat ttgaggtccg gacttgccgc ttgtgccgcc aggtcttgat gttccacgtc960tttaaggagc ttggcgggga gccggcgctg gtgtggcgga tgcagttgga atacgacgag 1020aacccggcgg cgtccatgct gagcgcggtc cggcaattgg cttatgaagc agatggggcc 1080attcgaagct tgccgccgct ggaattcgat tatactccat ttggcatcga gacaacggcc 1140gattggcagc cttttctgcc tgtgcctgaa tgggcggatg aagaacatta tcagttggtc 1200gatttgtacg gagaaggcat accgggctta ttatatcaga acaatgacca ctggcattat 1260cgttcgcccg cccggggcga cacaccggac gggatcgcct ataacagctg gcggccgctt 1320cctcatatcc ccgtgaactc ccggaacggg atgctgatgg atctgaatgg agacgggtat 1380ctggaatggt tgcttgcgga acccggggtt gcggggcgct atagcatgaa cccggataag 1440agctggtccg gttttgtgcc gctccaggca ctgccaacgg aattcttcca tccgcaggca 1500cagcttgcca atgttaccgg atcgggttta accgacttgg ttatgatcgg tccgaagagc 1560gtccggtttt atgccggaga agaagcgggc ttcaagcgcg catgtgaagt gtggcagcaa 1620gtgggcatta ctttgcctgt ggaacgcgtg gataaaaagg aactggtggc attcagcgat 1680atgctgggat cgggtcagtc tcatctggtg cgcatccggc atgatggcgt tacatgctgg 1740cctaatctgg ggaacggcgt gttcggggcg ccgttggccc ttcacgggtt tacggcatcg 1800gagcgggaat tcaatccgga acgtgtatat cttgtggacc ttgatggatc cggcgcttcc 1860gatatcattt atgcttctcg tgacgctcta ctcatttacc gaaatctttc cggcaatggc 1920tttgctgatc cggtgcgggt tccgctgcct gacggcgtgc ggtttgataa tctgtgccgg 1980
ctgctgcctg ccgatatccg cgggttaggt gtggccagtc tggtgctgca tgtaccttac 2040atggcccccc gcagttggaa attagatttc tttgcggcga agccgtattt attgcaaacg 2100gtcagcaaca atcttggagc ttccagctcg ttttggtacc gaagctccac ccagtattgg 2160ctggatgaga aacaggcggc ctcatcggct gtctccgctt tgcccttccc gataaacgtg 2220gtatcggata tgcacacggt ggacgaaatc agcggccgca ccaggactca gaagtatact 2280taccgccatg gcgtgtatga ccggaccgaa aaggaatttg ccggattcgg ccgcattgac 2340acatgggaag aggagcggga ttccgaagga accctgagcg tcagcactcc gcccgtgctg 2400acgcggacct ggtatcatac cgggcaaaag caggatgagg agcgtgccgt gcagcaatat 2460tggcaaggcg accctgcggc ttttcaggtt aaacccgtcc ggcttactcg attcgatgcg 2520gcagcggccc aggatctgcc gctagattct aataatgggc agcaagaata ctggctgtac 2580cgatcattac aagggatgcc gctgcggact gagatttttg cgggagatgt tggcgggtcg 2640cctccttatc aggtagagag cttccgttat caagtgcgct tggtgcagag catcgattcg 2700gaatgtgttg ccttgcccat gcagttggag cagcttacgt acaactatga gcaaatcgcc 2760tctgatccgc agtgttcaca gcagatacag caatggttcg acgaatacgg cgtggcggca 2820cagagtgtaa caatccaata tccgcgccgg gcacagccgg aggacaatcc gtaccctcgc 2880acgctgccgg ataccagctg gagcagcagt tatgattcgc agcaaatgct gctgcggttg 2940accaggcaaa ggcaaaaagc gtaccacctt gcagatcctg aaggctggcg cttgaatatt 3000ccccatcaga cacgcctgga tgccttcatt tattctgctg acagcgtgcc cgccgaagga 3060ataagcgccg agctgctgga ggtggacggc acgttacgat cttcggcgct ggaacaggct 3120tatggcggcc agtcagagat catctatgcg ggcgggggcg aaccggattt gcgagccctg 3180gtccattaca ccagaagcgc ggttcttgat gaagactgtt tacaagccta tgaaggcgta 3240ctgagcgata gccaattgaa ctcgcttctt gcctcttccg gctatcaacg aagcgcaaga 3300
atattgggtt cgggcgatga agtggatatt tttgtcgcgg aacaaggatt tacccgttat 3360gcggatgaac cgaatttttt ccgtattctg gggcaacaat cctctctctt gtccggggaa 3420caagtattaa catgggatga taatttctgt gcggttacat ccatcgaaga cgcgcttggc 3480aatcaaattc agattgcata tgattaccgc tttgtggagg ccatccagat taccgatacg 3540aataataatg tgaatcaggt cgccctggat gctctcggcc gggtcgtata cagccggacc 3600tggggcacgg aggaagggat aaagaccggc ttccgcccgg aggtggaatt cgcgacgccc 3660gagacaatgg agcaggcgct tgccctggca tctcccttgc cggttgcatc ctgctgtgta 3720tatgatgcgc atagctggat gggaacgata actcttgcac aactgtcaga gcttgttcca 3780gatagtgaaa agcaatggtc gttcttgata gacaatcgct tgattatgcc ggacggcaga 3840atcagatccc gcggtcggga tccatggtcg cttcaccggc tattgccgcc tgctgtgggc 3900gaattgctga gcgaggcgga ccgtaaaccg ccgcatacgg taattttggc agcagatcgt 3960tacccggatg acccatccca gcaaattcag gcgagcatcg tgtttagcga tggctttggg 4020cgtacgatac aaactgctaa aagagaagat acccgatggg cgattgcgga acgggtggac 4080tatgacggaa ccggagccgt aatccgcagc tttcagcctt tttatcttga cgactggaat 4140tatgtgggcg aagaggctgt cagcagctct atgtacgcaa cgatctatta ttatgatgct 4200ctggcacgac aattaaggat ggtcaacgct aaaggatatg agaggagaac tgctttttac 4260ccatggttta cagtaaacga agatgaaaat gataccatgg actcatcatt atttgcttca 4320ccgcctgcgc ggtga 4335<210>11<211>1444<212>PRT<213>类芽孢杆菌IDAS 1529菌株<400>11
Met Pro Gln Ser Ser Asn Ala Asp Ile Lys Leu Leu Ser Pro Ser Leu1 5 10 15Pro Lys Gly Gly Gly Ser Met Lys Gly Ile Glu Glu Asn Ile Ala Ala20 25 30Pro Gly Ser Asp Gly MeT Ala Arg Cys Asn Val Pro Leu Pro Val Thr35 40 45Ser Gly Arg Tyr Ile Thr Pro Asp Ile Ser Leu Ser Tyr Ala Ser Gly50 55 60His Gly Asn Gly Ala Tyr Gly Met Gly Trp Thr Met Gly Val Met Ser65 70 75 80Ile Ser Arg Arg Thr Ser Arg Gly Thr Pro Ser Tyr Thr Ser Glu Asp85 90 95Gln Phe Leu Gly Pro Asp Gly Glu Val Leu Val Pro Glu Ser Asn Glu100 105 110Gln Gly Glu Ile Ile Thr Arg His Thr Asp Thr Ala Gln Gly Ile Pro115 120 125Leu Gly Glu Thr Phe Thr Val Thr Arg Tyr Phe Pro Arg Ile Glu Ser130 135 140Ala Phe His Leu Leu Glu Tyr Trp Glu Ala Gln Ala Gly Ser Ala Thr145 150 155 160Ala Ser Phe Trp Leu Ile His Ser Ala Asp Gly Val Leu His Cys Leu165 170 175
Gly Lys Thr Ala Gln Ala Arg Ile Ala Ala Pro Asp Asp Ser Ala Lys180 185 190Ile Ala Glu Trp Leu Val Glu Glu Ser Val Ser Pro Phe Gly Glu His195 200 205Ile Tyr Tyr Gln Tyr Lys Glu Glu Asp Asn Gln Gly Val Asn Leu Glu210 215 220Glu Asp Asn His Gln Tyr Gly Ala Asn Arg Tyr Leu Lys Ser Ile Arg225 230 235 240Tyr Gly Asn Lys Val Ala Ser Pro Ser Leu Tyr Val Trp Lys Gly Glu245 250 255Ile Pro Ala Asp Gly Gln Trp Leu Tyr Ser Val Ile Leu Asp Tyr Gly260 265 270Glu Asn Asp Thr Ser Ala Asp Val Pro Pro Leu Tyr Thr Pro Gln Gly275 280 285Glu Trp Leu Val Arg Pro Asp Arg Phe Ser Arg Tyr Asp Tyr Gly Phe290 295 300Glu Val Arg Thr Cys Arg Leu Cys Arg Gln Val Leu Met Phe His Val305 310 315 320Phe Lys Glu Leu Gly Gly Glu Pro Ala Leu Val Trp Arg Met Gln Leu325 330 335Glu Tyr Asp Glu Asn Pro Ala Ala Ser Met Leu Ser Ala Val Arg Gln340 345 350
Leu Ala Tyr Glu Ala Asp Gly Ala Ile Arg Ser Leu Pro Pro Leu Glu355 360 365Phe Asp Tyr Thr Pro Phe Gly Ile Glu Thr Thr Ala Asp Trp Gln Pro370 375 380Phe Leu Pro Val Pro Glu Trp Ala Asp Glu Glu His Tyr Gln Leu Val385 390 395 400Asp Leu Tyr Gly Glu Gly Ile Pro Gly Leu Leu Tyr Gln Asn Asn Asp405 410 415His Trp His Tyr Arg Ser Pro Ala Arg Gly Asp Thr Pro Asp Gly Ile420 425 430Ala Tyr Asn Ser Trp Arg Pro Leu Pro His Ile Pro Val Asn Ser Arg435 440 445Asn Gly Met Leu Met Asp Leu Asn Gly Asp Gly Tyr Leu Glu Trp Leu450 455 460Leu Ala Glu Pro Gly Val Ala Gly Arg Tyr Ser Met Asn Pro Asp Lys465 470 475 480Ser Trp Ser Gly Phe Val Pro Leu Gln Ala Leu Pro Thr Glu Phe Phe485 490 495His Pro Gln Ala Gln Leu Ala Asn Val Thr Gly Ser Gly Leu Thr Asp500 505 510Leu Val Met Ile Gly Pro Lys Ser Val Arg Phe Tyr Ala Gly Glu Glu515 520 525
Ala Gly Phe Lys Arg Ala Cys Glu Val Trp Gln Gln Val Gly Ile Thr530 535 540Leu Pro Val Glu Arg Val Asp Lys Lys Glu Leu Val Ala Phe Ser Asp545 550 555 560Met Leu Gly Ser Gly Gln Ser His Leu Val Arg Ile Arg His Asp Gly565 570 575Val Thr Cys Trp Pro Asn Leu Gly Asn Gly Val Phe Gly Ala Pro Leu580 585 590Ala Leu His Gly Phe Thr Ala Ser Glu Arg Glu Phe Asn Pro Glu Arg595 600 605Val Tyr Leu Val Asp Leu Asp Gly Ser Gly Ala Ser Asp Ile Ile Tyr610 615 620Ala Ser Arg Asp Ala Leu Leu Ile Tyr Arg Asn Leu Ser Gly Asn Gly625 630 635 640Phe Ala Asp Pro Val Arg Val Pro Leu Pro Asp Gly Val Arg Phe Asp645 650 655Asn Leu Cys Arg Leu Leu Pro Ala Asp Ile Arg Gly Leu Gly Val Ala660 665 670Ser Leu Val Leu His Val Pro Tyr Met Ala Pro Arg Ser Trp Lys Leu675 680 685Asp Phe Phe Ala Ala Lys Pro Tyr Leu Leu Gln Thr Val Ser Asn Asn690 695 700
Leu Gly Ala Ser Ser Ser Phe Trp Tyr Arg Ser Ser Thr Gln Tyr Trp705 710 715 720Leu Asp Glu Lys Gln Ala Ala Ser Ser Ala Val Ser Ala Leu Pro Phe725 730 735Pro Ile Asn Val Val Ser Asp Met His Thr Val Asp Glu Ile Ser Gly740 745 750Arg Thr Arg Thr Gln Lys Tyr Thr Tyr Arg His Gly Val Tyr Asp Arg755 760 765Thr Glu Lys Glu Phe Ala Gly Phe Gly Arg Ile Asp Thr Trp Glu Glu770 775 780Glu Arg Asp Ser Glu Gly Thr Leu Ser Val Ser Thr Pro Pro Val Leu785 790 795 800Thr Arg Thr Trp Tyr His Thr Gly Gln Lys Gln Asp Glu Glu Arg Ala805 810 815Val Gln Gln Tyr Trp Gln Gly Asp Pro Ala Ala Phe Gln Val Lys Pro820 825 830Val Arg Leu Thr Arg Phe Asp Ala Ala Ala Ala Gln Asp Leu Pro Leu835 840 845Asp Ser Asn Asn Gly Gln Gln Glu Tyr Trp Leu Tyr Arg Ser Leu Gln850 855 860Gly Met Pro Leu Arg Thr Glu Ile Phe Ala Gly Asp Val Gly Gly Ser865 870 875 880
Pro Pro Tyr Gln Val Glu Ser Phe Arg Tyr Gln Val Arg Leu Val Gln885 890 895Ser Ile Asp Ser Glu Cys Val Ala Leu Pro Met Gln Leu Glu Gln Leu900 905 910Thr Tyr Asn Tyr Glu Gln Ile Ala Ser Asp Pro Gln Cys Ser Gln Gln915 920 925Ile Gln Gln Trp Phe Asp Glu Tyr Gly Val Ala Ala Gln Ser Val Thr930 935 940Ile Gln Tyr Pro Arg Arg Ala Gln Pro Glu Asp Asn Pro Tyr Pro Arg945 950 955 960Thr Leu Pro Asp Thr Ser Trp Ser Ser Ser Tyr Asp Ser Gln Gln Met965 970 975Leu Leu Arg Leu Thr Arg Gln Arg Gln Lys Ala Tyr His Leu Ala Asp980 985 990Pro Glu Gly Trp Arg Leu Asn Ile Pro His Gln Thr Arg Leu Asp Ala995 10001005Phe Ile Tyr Ser Ala Asp Ser Val Pro Ala Glu Gly Ile Ser Ala101010151020Glu Leu Leu Glu Val Asp Gly Thr Leu Arg Ser Ser Ala Leu Glu102510301035Gln Ala Tyr Gly Gly Gln Ser Glu Ile Ile Tyr Ala Gly Gly Gly104010451050
Glu Pro Asp Leu Arg Ala Leu Val His Tyr Thr Arg Ser Ala Val105510601065Leu Asp Glu Asp Cys Leu Gln Ala Tyr Glu Gly Val Leu Ser Asp107010751080Ser Gln Leu Asn Ser Leu Leu Ala Ser Ser Gly Tyr Gln Arg Ser108510901095Ala Arg Ile Leu Gly Ser Gly Asp Glu Val Asp Ile Phe Val Ala110011051110Glu Gln Gly Phe Thr Arg Tyr Ala Asp Glu Pro Asn Phe Phe Arg111511201125Ile Leu Gly Gln Gln Ser Ser Leu Leu Ser Gly Glu Gln Val Leu113011351140Thr Trp Asp Asp Asn Phe Cys Ala Val Thr Ser Ile Glu Asp Ala114511501155Leu Gly Asn Gln Ile Gln Ile Ala Tyr Asp Tyr Arg Phe Val Glu116011651170Ala Ile Gln Ile Thr Asp Thr Asn Asn Asn Val Asn Gln Val Ala117511801185Leu Asp Ala Leu Gly Arg Val Val Tyr Ser Arg Thr Trp Gly Thr119011951200Glu Glu Gly Ile Lys Thr Gly Phe Arg Pro Glu Val Glu Phe Ala120512101215
Thr Pro Glu Thr Met Glu Gln Ala Leu Ala Leu Ala Ser Pro Leu122012251230Pro Val Ala Ser Cys Cys Val Tyr Asp Ala His Ser Trp Met Gly123512401245Thr Ile Thr Leu Ala Gln Leu Ser Glu Leu Val Pro Asp Ser Glu125012551260Lys Gln Trp Ser Phe Leu Ile Asp Asn Arg Leu Ile Met Pro Asp` 126512701275Gly Arg Ile Arg Ser Arg Gly Arg Asp Pro Trp Ser Leu His Arg128012851290Leu Leu Pro Pro Ala Val Gly Glu Leu Leu Ser Glu Ala Asp Arg129513001305Lys Pro Pro His Thr Val Ile Leu Ala Ala Asp Arg Tyr Pro Asp131013151320Asp Pro Ser Gln Gln Ile Gln Ala Ser Ile Val Phe Ser Asp Gly132513301335Phe Gly Arg Thr Ile Gln Thr Ala Lys Arg Glu Asp Thr Arg Trp134013451350Ala Ile Ala Glu Arg Val Asp Tyr Asp Gly Thr Gly Ala Val Ile135513601365Arg Ser Phe Gln Pro Phe Tyr Leu Asp Asp Trp Asn Tyr Val Gly137013751380
Glu Glu Ala Val Ser Ser Ser Met Tyr Ala Thr Ile Tyr Tyr Tyr138513901395Asp Ala Leu Ala Arg Gln Leu Arg Met Val Asn Ala Lys Gly Tyr140014051410Glu Arg Arg Thr Ala Phe Tyr Pro Trp Phe Thr Val Asn Glu Asp141514201425Glu Asn Asp Thr Met Asp Ser Ser Leu Phe Ala Ser Pro Pro Ala143014351440Arg<210>12<211>2793<212>DNA<213>类芽孢杆菌IDAS 1529菌株<400>12atgaacacaa cgtccatata taggggcacg cctacgattt cagttgtgga taaccggaac 60ttggagattc gcattcttca gtataaccgt atcgcggctg aagatccggc agatgagtgt120atcctgcgga acacgtatac gccgttaagc tatcttggca gcagcatgga tccccgtttg180ttctcgcaat atcaggatga tcgcggaaca ccgccgaata tacgaaccat ggcttccctg240agaggcgaag cgctgtgttc ggaaagtgtg gatgccggcc gcaaggcgga gctttttgat300atcgaggggc ggcccgtctg gcttatcgat gccaacggca cagagacgac tctcgaatat360gatgtcttag gcaggccaac agccgtattc gagcaacagg aaggtacgga ctccccccag420tgcagggagc ggtttattta tggtgagaag gaggcggatg cccaggccaa caatttgcgc480ggacaactgg ttcgccacta cgataccgcg ggccggatac agaccgacag catctccttg540
gctggactgc cgttgcgcca aagccgtcaa ctgctgaaaa attgggatga acctggcgac 600tggagtatgg atgaggaaag cgcctgggcc tcgttgctgg ctgccgaagc ttatgatacg 660agctggcggt atgacgcgca ggacagggtg ctcgcccaaa ccgacgccaa agggaatctc 720cagcaactga cttacaatga cgccggccag ccgcaggcgg tcagcctcaa gctgcaaggc 780caagcggagc aacggatttg gaaccggatc gagtacaacg cggcgggtca agtggatctc 840gccgaagccg ggaatggaat cgtaacggaa tatacttacg aggaaagcac gcagcggtta 900atccgaaaaa aagattcccg cggactgtcc tccggggaaa gagaagtgct gcaggattat 960cgttatgaat atgatccggt aggcaatatc ctttctattt acaatgaagc ggagccggtt1020cgttatttcc gcaatcaggc cgttgctccg aaaaggcaat atgcctacga tgccttgtat1080cagcttgtat ctagttcggg gcgggaatcc gacgcgcttc ggcagcagac gtcgcttcct1140cccttgatca cgcctatccc tctggacgat agccaatacg tcaattacgc tgaaaaatac1200agctatgatc aggcgggcaa tttaatcaag cttagccata acggggcaag tcaatataca1260acgaatgtgt atgtggacaa aagctcaaac cgggggattt ggcggcaagg ggaagacatc1320ccggatatcg cggcttcctt tgacagagca ggcaatcaac aagctttatt cccggggaga1380ccgttggaat gggatacacg caatcaatta agccgtgtcc atatggtcgt gcgcgaaggc1440ggagacaacg actgggaagg ctatctctat gacagctcgg gaatgcgtat cgtaaaacga1500tctacccgca aaacacagac aacgacgcaa acggatacga ccctctattt gccgggcctg1560gagctgcgaa tccgccagac cggggaccgg gtcacggaag cattgcaggt cattaccgtg1620gatgagggag cgggacaagt gagggtgctg cactgggagg atggaaccga gccgggcggc1680atcgccaatg atcagtaccg gtacagcctg aacgatcatc ttacctcctc tttattggaa1740gttgacgggc aaggtcagat cattagtaag gaagaatttt atccctatgg cggcacagcc1800ctgtggacag cccggtcaga ggtagaggca agctacaaga ccatccgcta ttcaggcaaa1860
gagcgggatg ccacaggcct gtattattac ggacaccgct actatatgcc atggttgggt 1920cgctggctga atccggaccc ggccggaatg gtagatggac taaacctgta ccgtatggtc 1980aggaacaatc ctataggact gatggatccg aatgggaatg cgccaatcaa cgtggcggat 2040tatagcttcg tgcatggtga tttagtttat ggtcttagta aggaaagagg aagatatcta 2100aagctattta atccaaactt taatatggaa aaatcagact ctcctgctat ggttatagat 2160caatataata ataatgttgc attgagtata actaaccaat ataaagtaga agaattgatg 2220aaatttcaaa aagacccaca aaaagccgca cggaaaataa aggttccaga agggaatcgt 2280ttatcgagga acgaaaatta tcctttgtgg cacgattata ttaacattgg agaagctaaa 2340gctgcattta aggcctctca tattttccaa gaagtgaagg ggaattatgg gaaagattat 2400tatcataaat tattattaga cagaatgata gaatcgccgt tgctgtggaa acgaggcagc 2460aaactcgggc tagaaatcgc cgctaccaat cagagaacaa aaatacactt tgttcttgac 2520aatttaaata tcgagcaggt ggttacgaaa gagggtagcg gcggtcagtc aatcacagct 2580tcggagctcc gttatattta tcgaaatcgc gaaagattga acgggcgtgt cattttctat 2640agaaataatg aaaggctaga tcaggctcca tggcaagaaa atccggactt atggagcaaa 2700tatcaaccgg gtcttagaca aagcagcagt tcaagagtca aagaacgagg gattgggaac 2760tttttccgcc ggttttcaat gaagagaaag tag 2793<210>13<211>930<212>PRT<213>类芽孢杆菌IDAS 1529菌株<400>13Met Asn Thr Thr Ser Ile Tyr Arg Gly Thr Pro Thr Ile Ser Val Val1 5 10 15
Asp Asn Arg Asn Leu Glu Ile Arg Ile Leu Gln Tyr Asn Arg Ile Ala20 25 30Ala Glu Asp Pro Ala Asp Glu Cys Ile Leu Arg Asn Thr Tyr Thr Pro35 40 45Leu Ser Tyr Leu Gly Ser Ser Met Asp Pro Arg Leu Phe Ser Gln Tyr50 55 60Gln Asp Asp Arg Gly Thr Pro Pro Asn Ile Arg Thr Met Ala Ser Leu65 70 75 80Arg Gly Glu Ala Leu Cys Ser Glu Ser Val Asp Ala Gly Arg Lys Ala85 90 95Glu Leu Phe Asp lle Glu Gly Arg Pro Val Trp Leu Ile Asp Ala Asn100 105 110Gly Thr Glu Thr Thr Leu Glu Tyr Asp Val Leu Gly Arg Pro Thr Ala115 120 125Val Phe Glu Gln Gln Glu Gly Thr Asp Ser Pro Gln Cys Arg Glu Arg130 135 140Phe Ile Tyr Gly Glu Lys Glu Ala Asp Ala Gln Ala Asn Asn Leu Arg145 150 155 160Gly Gln Leu Val Arg His Tyr Asp Thr Ala Gly Arg Ile Gln Thr Asp165 170 175Ser Ile Ser Leu Ala Gly Leu Pro Leu Arg Gln Ser Arg Gln Leu Leu180 185 190
Lys Asn Trp Asp Glu Pro Gly Asp Trp Ser Met Asp Glu Glu Ser Ala195 200 205Trp Ala Ser Leu Leu Ala Ala Glu Ala Tyr Asp Thr Ser Trp Arg Tyr210 215 220Asp Ala Gln Asp Arg Val Leu Ala Gln Thr Asp Ala Lys Gly Asn Leu225 230 235 240Gln Gln Leu Thr Tyr Asn Asp Ala Gly Gln Pro Gln Ala Val Ser Leu245 250 255Lys Leu Gln Gly Gln Ala Glu Gln Arg Ile Trp Asn Arg Ile Glu Tyr260 265 270Asn Ala Ala Gly Gln Val Asp Leu Ala Glu Ala Gly Asn Gly Ile Val275 280 285Thr Glu Tyr Thr Tyr Glu Glu Ser Thr Gln Arg Leu Ile Arg Lys Lys290 295 300Asp Ser Arg Gly Leu Ser Ser Gly Glu Arg Glu Val Leu Gln Asp Tyr305 310 315 320Arg Tyr Glu Tyr Asp Pro Val Gly Asn Ile Leu Ser Ile Tyr Asn Glu325 330 335Ala Glu Pro Val Arg Tyr Phe Arg Asn Gln Ala Val Ala Pro Lys Arg340 345 350Gln Tyr Ala Tyr Asp Ala Leu Tyr Gln Leu Val Ser Ser Ser Gly Arg355 360 365
Glu Ser Asp Ala Leu Arg Gln Gln Thr Ser Leu Pro Pro Leu Ile Thr370 375 380Pro Ile Pro Leu Asp Asp Ser Gln Tyr Val Asn Tyr Ala Glu Lys Tyr385 390 395 400Ser Tyr Asp Gln Ala Gly Asn Leu Ile Lys Leu Ser His Asn Gly Ala405 410 415Ser Gln Tyr Thr Thr Asn Val Tyr Val Asp Lys Ser Ser Asn Arg Gly420 425 430Ile Trp Arg Gln Gly Glu Asp Ile Pro Asp Ile Ala Ala Ser Phe Asp435 440 445Arg Ala Gly Asn Gln Gln Ala Leu Phe Pro Gly Arg Pro Leu Glu Trp450 455 460Asp Thr Arg Asn Gln Leu Ser Arg Val His Met Val Val Arg Glu Gly465 470 475 480Gly Asp Asn Asp Trp Glu Gly Tyr Leu Tyr Asp Ser Ser Gly Met Arg485 490 495Ile Val Lys Arg Ser Thr Arg Lys Thr Gln Thr Thr Thr Gln Thr Asp500 505 510Thr Thr Leu Tyr Leu Pro Gly Leu Glu Leu Arg Ile Arg Gln Thr Gly515 520 525Asp Arg Val Thr Glu Ala Leu Gln Val Ile Thr Val Asp Glu Gly Ala530 535 540
Gly Gln Val Arg Val Leu His Trp Glu Asp Gly Thr Glu Pro Gly Gly545 550 555 560Ile Ala Asn Asp Gln Tyr Arg Tyr Ser Leu Asn Asp His Leu Thr Ser565 570 575Ser Leu Leu Glu Val Asp Gly Gln Gly Gln Ile Ile Ser Lys Glu Glu580 585 590Phe Tyr Pro Tyr Gly Gly Thr Ala Leu Trp Thr Ala Arg Ser Glu Val595 600 605Glu Ala Ser Tyr Lys Thr Ile Arg Tyr Ser Gly Lys Glu Arg Asp Ala610 615 620Thr Gly Leu Tyr Tyr Tyr Gly His Arg Tyr Tyr Met Pro Trp Leu Gly625 630 635640Arg Trp Leu Asn Pro Asp Pro Ala Gly Met Val Asp Gly Leu Asn Leu645 650 655Tyr Arg Met Val Arg Asn Asn Pro Ile Gly Leu Met Asp Pro Asn Gly660 665 670Asn Ala Pro Ile Asn Val Ala Asp Tyr Ser Phe Val His Gly Asp Leu675 680 685Val Tyr Gly Leu Ser Lys Glu Arg Gly Arg Tyr Leu Lys Leu Phe Asn690 695 700Pro Asn Phe Asn Met Glu Lys Ser Asp Ser Pro Ala Met Val Ile Asp705 710 715 720
Gln Tyr Asn Asn Asn Val Ala Leu Ser Ile Thr Asn Gln Tyr Lys Val725 730 735Glu Glu Leu Met Lys Phe Gln Lys Asp Pro Gln Lys Ala Ala Arg Lys740 745 750Ile Lys Val Pro Glu Gly Asn Arg Leu Ser Arg Asn Glu Asn Tyr Pro755 760 765Leu Trp His Asp Tyr Ile Asn Ile Gly Glu Ala Lys Ala Ala Phe Lys770 775 780Ala Ser His Ile Phe Gln Glu Val Lys Gly Asn Tyr Gly Lys Asp Tyr785790 795 800Tyr His Lys Leu Leu Leu Asp Arg Met Ile Glu Ser Pro Leu Leu Trp805 810 815Lys Arg Gly Ser Lys Leu Gly Leu Glu Ile Ala Ala Thr Asn Gln Arg820 825 830Thr Lys Ile His Phe Val Leu Asp Asn Leu Asn Ile Glu Gln Val Val835 840 845Thr Lys Glu Gly Ser Gly Gly Gln Ser Ile Thr Ala Ser Glu Leu Arg850 855 860Tyr Ile Tyr Arg Asn Arg Glu Arg Leu Asn Gly Arg Val Ile Phe Tyr865 870 875 880Arg Asn Asn Glu Arg Leu Asp Gln Ala Pro Trp Gln Glu Asn Pro Asp885 890 895
Leu Trp Ser Lys Tyr Gln Pro Gly Leu Arg Gln Ser Ser Ser Ser Arg900 905 910Val Lys Glu Arg Gly Ile Gly Asn Phe Phe Arg Arg Phe Ser Met Lys915 920 925Arg Lys930<210>14<211>1791<212>DNA<213>人工序列<220>
<223>ORF7的核酸序列，其编码cry-样蛋白<400>14atgaactcaa atgaaccaaa tttatctgat gttgttaatt gtttaagtga ccccaatagt 60gacttggaga agtctggcgg tggagtagcg ctagatgttg gaatgtcatt gatatccgaa120cttcttggta cggttccagt tgctggatca attcttcaat ttgtattcga taaattgtgg180tttatttttg gcccttctga gtgggactca cttatggaac atgttgaagc attaattgat240agtaaaatac aagagcaggt aaaaagaagt gcacaagatg aactaaatgc aattacaaat300aacttatcta cgtatttgaa atttctagat gcatgggaaa atgattctaa taatttaaga360gcgagagctg tagtgaaaga ccaatttgta ggccttgaac agactcttga aagaaaaatg420gttagtgttt ttggaagtac gggtcatgaa gtgcatcttt tgccaatttt cgctcaagca480gccaacctcc acctaattct attaagagat gctgagaaat atggaaagag atggggttgg540gcagatagag aaattcaagt atattatgat aaccagattc gttatatcca tgaatatacg600gaccattgta ttaaatatta taatcaagga ttaagtaaac tgaaaggttc tacctatcaa660
gattgggata agtataatcg ttttagaaga gaaatgaccc taactgttct tgatttgatt 720tcaattttcc catcgtatga tactagaact tacccaattg atacaatagg tcaattgaca 780agggaagttt attcggattt acttattgct aacccgtctg ggatgcagac tttcactaat 840gtagatttcg acaatattct tattagaaaa cctcatttaa tggatttctt aagaactctt 900gagattttta ccgatcgaca taacgcaagc agacacaacg tatattgggg cggacatcga 960gtgcattctt cttacacagg aggtaatttt gaaaattttg aatctccctt atatggcagt 1020gaagcaaatg tagaaccccg aacatggttg agttttggag aatctcaagt ctataatata 1080cgttcgaagc ctgagtggga tagaggaagt actgcaatta gtggctccta tgaatttcga 1140ggagtgacag gatgttcttt ttatcgaatg ggaaattttg ctggcaccgt agccctaact 1200taccgacagt ttggtaacga aggttctcaa atcccattgc acaggctatg tcatgttact 1260tattttagaa gatctcaagc tgtgggggcg acttcgagac agacgttaac aagtggtccg 1320ctattttcct ggacacatag tagtgctacg gaaacgaata tcattcaccc gacaaaaatt 1380acacaaatac caatggtgaa ggctagttcc cttggatcag gtacttctgt tgtccaagga 1440ccaggcttta caggagggga tgtacttcga agaaatagcc ccggtagcac aggaacttta 1500agagttaacg tcaattcacc attatcacag agatatcgta taagaattcg ttacgcttct l560actacggatt tagatttttt tgtcattcgc ggaaatacga cagttaataa ttttagattt 1620gggaacacta tgcgtaaagg agaccctata acctctcgat catttagatt tgcggctttt 1680agtacaccat ttacttttgc tagctcacag gatgaactta gaataaatgt acaaaatttc 1740aataatggtg aagaagttta tatagataga atcgaagtta ttccagtttg a 1791<210>15<211>596<212>PRT<213>人工序列
<220>
<223>ORF7编码的氨基酸序列<400>15Met Asn Ser Asn Glu Pro Asn Leu Ser Asp Val Val Asn Cys Leu Ser1 5 10 15Asp Pro Asn Ser Asp Leu Glu Lys Ser Gly Gly Gly Val Ala Leu Asp20 25 30Val Gly Met Ser Leu Ile Ser Glu Leu Leu Gly Thr Val Pro Val Ala35 40 45Gly Ser Ile Leu Gln Phe Val Phe Asp Lys Leu Trp Phe Ile Phe Gly50 55 60Pro Ser Glu Trp Asp Ser Leu Met Glu His Val Glu Ala Leu Ile Asp65 70 75 80Ser Lys Ile Gln Glu Gln Val Lys Arg Ser Ala Gln Asp Glu Leu Asn85 90 95Ala Ile Thr Asn Asn Leu Ser Thr Tyr Leu Lys Phe Leu Asp Ala Trp100 105 110Glu Asn Asp Ser Asn Asn Leu Arg Ala Arg Ala Val Val Lys Asp Gln115 120 125Phe Val Gly Leu Glu Gln Thr Leu Glu Arg Lys Met Val Ser Val Phe130 135 140Gly Ser Thr Gly His Glu Val His Leu Leu Pro Ile Phe Ala Gln Ala145 150 155 160
Ala Asn Leu His Leu Ile Leu Leu Arg Asp Ala Glu Lys Tyr Gly Lys165 170 175Arg Trp Gly Trp Ala Asp Arg Glu Ile Gln Val Tyr Tyr Asp Asn Gln180 185 190Ile Arg Tyr Ile His Glu Tyr Thr Asp His Cys Ile Lys Tyr Tyr Asn195 200 205Gln Gly Leu Ser Lys Leu Lys Gly Ser Thr Tyr Gln Asp Trp Asp Lys210 210 220Tyr Asn Arg Phe Arg Arg Glu Met Thr Leu Thr Val Leu Asp Leu Ile225 230 235 240Ser Ile Phe Pro Ser Tyr Asp Thr Arg Thr Tyr Pro Ile Asp Thr Ile245 250 255Gly Gln Leu Thr Arg Glu Val Tyr Ser Asp Leu Leu Ile Ala Asn Pro260 265 270Ser Gly Met Gln Thr Phe Thr Asn Val Asp Phe Asp Asn Ile Leu Ile275 280 285Arg Lys Pro His Leu Met Asp Phe Leu Arg Thr Leu Glu Ile Phe Thr290 295 300Asp Arg His Asn Ala Ser Arg His Asn Val Tyr Trp Gly Gly His Arg305 310 315 320Val His Ser Ser Tyr Thr Gly Gly Asn Phe Glu Asn Phe Glu Ser Pro325 330 335
Leu Tyr Gly Ser Glu Ala Asn Val Glu Pro Arg Thr Trp Leu Ser Phe340 345 350Gly Glu Ser Gln Val Tyr Asn Ile Arg Ser Lys Pro Glu Trp Asp Arg355 360 365Gly Ser Thr Ala Ile Ser Gly Ser Tyr Glu Phe Arg Gly Val Thr Gly370 375 380Cys Ser Phe Tyr Arg Met Gly Asn Phe Ala Gly Thr Val Ala Leu Thr385 390 395 400Tyr Arg Gln Phe Gly Asn Glu Gly Ser Gln Ile Pro Leu His Arg Leu405 410 415Cys His Val Thr Tyr Phe Arg Arg Ser Gln Ala Va1 Gly Ala Thr Ser420 425 430Arg Gln Thr Leu Thr Ser Gly Pro Leu Phe Ser Trp Thr His Ser Ser435 440 445Ala Thr Glu Thr Asn Ile Ile His Pro Thr Lys Ile Thr Gln Ile Pro450 455 460Met Val Lys Ala Ser Ser Leu Gly Ser Gly Thr Ser Val Val Gln Gly465 470 475 480Pro Gly Phe Thr Gly Gly Asp Val Leu Arg Arg Asn Ser Pro Gly Ser485 490 495Thr Gly Thr Leu Arg Val Asn Val Asn Ser Pro Leu Ser Gln Arg Tyr500 505 510
Arg Ile Arg Ile Arg Tyr Ala Ser Thr Thr Asp Leu Asp Phe Phe Val515 520 525Ile Arg Gly Ash Thr Thr Val Asn Asn Phe Arg Phe Gly Asn Thr Met530 535 540Arg Lys Gly Asp Pro Ile Thr Ser Arg Ser Phe Arg Phe Ala Ala Phe545 550 555 560Ser Thr Pro Phe Thr Phe Ala Ser Ser Gln Asp Glu Leu Arg Ile Asn565 570 575Val Gln Asn Phe Asn Asn Gly Glu Glh Val Tyr Ile Asp Arg Ile Glu580 585 590Val Ile Pro Val595<210>16<211>1547<212>DNA<213>人工序列<220>
<223>IDAS1529 16S rDNA的核酸序列<400>16tggagagttt gatcctggct caggacgaac gctggcggcg tgcctaatac atgcaagtcg60agcggakcaa cggtttcctt cgggaaaccr ttagcttagc ggcggacggg tgagtaatac 120gtaggtaacc tgcccttaag accgggataa ctcacggaaa cgtgggctaa taccggatag 180gcgatttcct cgcatgaggg aatcgggaaa ggcggagcaa tctgccactt atggatggac 240ctacggcgca ttagctagtt ggtggggtaa cggctcacca aggcgacgat gcgtagccga 300
cctgagaggg tgatcggcca cactgggact gagacacggc ccagactcct acgggaggca360gcagtaggga atcttccgca atggacgcaa gtctgacgga gcaacgccgc gtgagtgatg420aaggttttcg gatcgtaaag ctctgttgcc agggaagaac gctatggaga gtaactgttc480cataggtgac ggtacctgag aagaaagccc cggctaacta cgtgccagca gccgcggtaa540tacgtagggg gcaagcgttg tccggaatta ttgggcgtaa agcgcgcgca ggcggtcatg600taagtctggt gtttaaaccc ggggctcaac tccgggtcgc atcggaaact gtgtgacttg660agtgcagaag aggaaagtgg aattccacgt gtagcggtga aatgcgtaga gatgtggagg720aacaccagtg gcgaaggcga ctttctgggc tgtaactgac gctgaggcgc gaaagcgtgg780ggagcaaaca ggattagata ccctggtagt ccacgccgta aacgatgaat gctaggtgtt840aggggtttcg atacccttgg tgccgaagtt aacacattaa gcattccgcc tggggagtac900ggtcgcaaga ctgaaactca aaggaattga cggggacccg cacaagcagt ggagtatgtg960gtttaattcg aagcaacgcg aagaacctta ccaggtcttg acatccctct gaccgtccta 1020gagatagggc ttcccttcgg ggcagaggag acaggtggtg catggttgtc gtcagctcgt 1080gtcgtgagat gttgggttaa gtcccgcaac gagcgcaacc cttaacttta gttgccagca 1140ttaagttggg cactctagag tgactgccgg tgacaaaccg gaggaaggtg gggatgacgt 1200caaatcatca tgccccttat gacctgggct acacacgtac tacaatggct ggtacaacgg 1260gaagcgaagc cgcgaggtgg agcgaatcct aaaaagccag tctcagttcg gattgcaggc 1320tgcaactcgc ctgcatgaag tcggaattgc tagtaatcgc ggatcagcat gccgcggtga 1380atacgttccc gggtcttgta cacaccgccc gtcacaccac gagagtttac aacacccgaa 1440gtcggtgggg taaccgcaag gagccagccg ccgaaggtgg ggtagatgat tggggtgaag 1500tcgtaacaag gtagccgtat cggaaggtgc ggytggatca cctcctt 1547<210>17
<211>20<212>PRT<213>人工序列<220>
<223>来自IDAS1529培养液级分的经纯化毒素的N-末端氨基酸序列<400>17Asp Ile Thr Leu Lys Val Ala Ile Tyr Pro Tyr Val Pro Asp Pro Ser1 5 10 15Arg Phe Gln Ala20<210>18<211>379<212>PRT<213>人工序列<220>
<223>来自解硫胺素芽孢杆菌(Bacillus thiaminolyticus)的硫胺素酶I的氨基酸序列<400>18Ala His Ser Asp Ala Ser Ser Asp Ile Thr Leu Lys Val Ala Ile Tyr1 5 10 15Pro Tyr Val Pro Asp Pro Ala Arg Phe Gln Ala Ala Val Leu Asp Gln20 25 30Trp Gln Arg Gln Glu Pro Gly Val Lys Leu Glu Phe Thr Asp Trp Asp35 40 45Ser Tyr Ser Ala Asp Pro Pro Asp Asp Leu Asp Val Phe Val Leu Asp50 55 60Ser Ile Phe Leu Ser His Phe Val Asp Ala Gly Tyr Leu Leu Pro Phe
65 70 75 80Gly Ser Gln Asp Ile Asp Gln Ala Glu Asp Val Leu Pro Phe Ala Leu85 90 95Gln Gly Ala Lys Arg Asn Gly Glu Val Tyr Gly Leu Pro Gln Ile Leu100 105 110Cys Thr Asn Leu Leu Phe Tyr Arg Lys Gly Asp Leu Lys Ile Gly Gln115 120 125Val Asp Asn Ile Tyr Glu Leu Tyr Lys Lys Ile Gly Thr Ser His Ser130 135 140Glu Gln Ile Pro Pro Pro Gln Asn Lys Gly Leu Leu Ile Asn Met Ala145 150 155 160Gly Gly Thr Thr Lys Ala Ser Me tTyr Leu Glu Ala Leu Ile Asp Vall65 170 175Thr Gly Gln Tyr Thr Glu Tyr Asp Leu Leu Pro Pro Leu Asp Pro Leu180 185 190Asn Asp Lys Val Ile Arg Gly Leu Arg Leu Leu Ile Asn Met Ala Gly195 200 205Glu Lys Pro Ser Gln Tyr Val Pro Glu Asp Gly Asp Ala Tyr Val Arg210 215 220Ala Ser Trp Phe Ala Gln Gly Ser Gly Arg Ala Phe Ile Gly Tyr Ser225 230 235 240Glu Ser Met Met Arg Met Gly Asp Tyr Ala Glu Gln Val Arg Phe Lys
245 250 255Pro Ile Ser Ser Ser Ala Gly Gln Asp Ile Pro Leu Phe Tyr Ser Asp260 265 270Val Val Ser Val Asn Ser Lys Thr Ala His Pro Glu Leu Ala Lys Lys275 280 285Leu Ala Asn Val Met Ala Ser Ala Asp Thr Val Glu Gln Ala Leu Arg290 295 300Pro Gln Ala Asp Gly Gln Tyr Pro Gln Tyr Leu Leu Pro Ala Arg His305 310 315 320Gln Val Tyr Glu Ala Leu Met Gln Asp Tyr Pro Ile Tyr Ser Glu Leu325 330 335Ala Gln Ile Val Asn Lys Pro Ser Asn Arg Val Phe Arg Leu Gly Pro340 345 350Glu Val Arg Thr Trp Leu Lys Asp Ala Lys Gln Val Leu Pro Glu Ala355 360 365Leu Gly Leu Thr Asp Val Ser Ser Leu Ala Ser370 375<210>19<211>953<212>PRT<213>类芽孢杆菌IDAS 1529菌株<400>19Met Lys Met Ile Pro Trp Thr His His Tyr Leu Leu His Arg Leu Arg1 5 10 15
Gly Glu Met Glu Val Lys Pro Met Asn Thr Thr Ser Ile Tyr Arg Gly20 25 30Thr Pro Thr Ile Ser Val Val Asp Asn Arg Asn Leu Glu Ile Arg Ile35 40 45Leu Gln Tyr Asn Arg Ile Ala Ala Glu Asp Pro Ala Asp Glu Cys Ile50 55 60Leu Arg Asn Thr Tyr Thr Pro Leu Ser Tyr Leu Gly Ser Ser Met Asp65 70 75 80Pro Arg Leu Phe Ser Gln Tyr Gln Asp Asp Arg Gly Thr Pro Pro Asn85 90 95Ile Arg Thr Met Ala Ser Leu Arg Gly Glu Ala Leu Cys Ser Glu Ser100 105 110Val Asp Ala Gly Arg Lys Ala Glu Leu Phe Asp Ile Glu Gly Arg Pro115 120 125Val Trp Leu Ile Asp Ala Asn Gly Thr Glu Thr Thr Leu Glu Tyr Asp130 135 140Val Leu Gly Arg Pro Thr Ala Val Phe Glu Gln Gln Glu Gly Thr Asp145 150 155 160Ser Pro Gln Cys Arg Glu Arg Phe Ile Tyr Gly Glu Lys Glu Ala Asp165 170 175Ala Gln Ala Asn Asn Leu Arg Gly Gln Leu Val Arg His Tyr Asp Thr180 185 190
Ala Gly Arg Ile Gln Thr Asp Ser Ile Ser Leu Ala Gly Leu Pro Leu195 200 205Arg Gln Ser Arg Gln Leu Leu Lys Asn Trp Asp Glu Pro Gly Asp Trp210 215 220Ser Met Asp Glu Glu Ser Ala Trp Ala Ser Leu Leu Ala Ala Glu Ala225 230 235 240Tyr Asp Thr Ser Trp Arg Tyr Asp Ala Gln Asp Arg Val Leu Ala Gln245 250 255Thr Asp Ala Lys Gly Asn Leu Gln Gln Leu Thr Tyr Asn Asp Ala Gly260 265 270Gln Pro Gln Ala Val Ser Leu Lys Leu Gln Gly Gln Ala Glu Gln Arg275 280 285Ile Trp Asn Arg Ile Glu Tyr Asn Ala Ala Gly Gln Val Asp Leu Ala290 295 300Glu Ala Gly Asn Gly Ile Val Thr Glu Tyr Thr Tyr Glu Glu Ser Thr305 310 315 320Gln Arg Leu Ile Arg Lys Lys Asp Ser Arg Gly Leu Ser Ser Gly Glu325 330 335Arg Glu Va1 Leu Gln Asp Tyr Arg Tyr Glu Tyr Asp Pro Val Gly Asn340 345 350Ile Leu Ser Ile Tyr Asn Glu Ala Glu Pro Val Arg Tyr Phe Arg Asn355 360 365
Gln Ala Val Ala Pro Lys Arg Gln Tyr Ala Tyr Asp Ala Leu Tyr Gln370 375 380Leu Val Ser Ser Ser Gly Arg Glu Ser Asp Ala Leu Arg Gln Gln Thr385 390 395 400Ser Leu Pro Pro Leu Ile Thr Pro Ile Pro Leu Asp Asp Ser Gln Tyr405 410 415Val Asn Tyr Ala Glu Lys Tyr Ser Tyr Asp Gln Ala Gly Asn Leu Ile420 425 430Lys Leu Ser His Asn Gly Ala Ser Gln Tyr Thr Thr Asn Val Tyr Val435 440 445Asp Lys Ser Ser Asn Arg Gly Ile Trp Arg Gln Gly Glu Asp Ile Pro450 455 460Asp Ile Ala Ala Ser Phe Asp Arg Ala Gly Asn Gln Gln Ala Leu Phe465 470 475 480Pro Gly Arg Pro Leu Glu Trp Asp Thr Arg Asn Gln Leu Ser Arg Val485 490 495His Met Val Val Arg Glu Gly Gly Asp Asn Asp Trp Glu Gly Tyr Leu500 505 510Tyr Asp Ser Ser Gly Met Arg Ile Val Lys Arg Ser Thr Arg Lys Thr515 520 525Gln Thr Thr Thr Gln Thr Asp Thr Thr Leu Tyr Leu Pro Gly Leu Glu530 535 540
Leu Arg Ile Arg Gln Thr Gly Asp Arg Val Thr Glu Ala Leu Gln Val545 550 555 560Ile Thr Val Asp Glu Gly Ala Gly Gln Val Arg Val Leu His Trp Glu565 570 575Asp Gly Thr Glu Pro Gly Gly Ile Ala Asn Asp Gln Tyr Arg Tyr Ser580 585 590Leu Asn Asp His Leu Thr Ser Ser Leu Leu Glu Val Asp Gly Gln Gly595 600 605Gln Ile Ile Ser Lys Glu Glu Phe Tyr Pro Tyr Gly Gly Thr Ala Leu610 615 620Trp Thr Ala Arg Ser Glu Val Glu Ala Ser Tyr Lys Thr Ile Arg Tyr625 630 635 640Ser Gly Lys Glu Arg Asp Ala Thr Gly Leu Tyr Tyr Tyr Gly His Arg645 650 655Tyr Tyr Met Pro Trp Leu Gly Arg Trp Leu Asn Pro Asp Pro Ala Gly660 665 670Met Val Asp Gly Leu Asn Leu Tyr Arg Met Val Arg Asn Asn Pro Ile675 680 685Gly Leu Met Asp Pro Asn Gly Asn Ala Pro Ile Asn Val Ala Asp Tyr690 695 700Ser Phe Val His Gly Asp Leu Val Tyr Gly Leu Ser Lys Glu Arg Gly705 710 715 720
Arg Tyr Leu Lys Leu Phe Asn Pro Asn Phe Asn Met Glu Lys Ser Asp725 730 735Ser Pro Ala Met Val Ile Asp Gln Tyr Asn Asn Asn Val Ala Leu Ser740 745 750Ile Thr Asn Gln Tyr Lys Val Glu Glu Leu Met Lys Phe Gln Lys Asp755 760 765Pro Gln Lys Ala Ala Arg Lys Ile Lys Val Pro Glu Gly Asn Arg Leu770 775 780Ser Arg Asn Glu Asn Tyr Pro Leu Trp His Asp Tyr Ile Asn Ile Gly785 790 795 800Glu Ala Lys Ala Ala Phe Lys Ala Ser His Ile Phe Gln Glu Val Lys805 810 815Gly Asn Tyr Gly Lys Asp Tyr Tyr His Lys Leu Leu Leu Asp Arg Met820825 830Ile Glu Ser Pro Leu Leu Trp Lys Arg Gly Ser Lys Leu Gly Leu Glu835 840 845Ile Ala Ala Thr Asn Gln Arg Thr Lys Ile His Phe Val Leu Asp Asn850 855 860Leu Asn Ile Glu Gln Val Val Thr Lys Glu Gly Ser Gly Gly Gln Ser865 870 875 880Ile Thr Ala Ser Glu Leu Arg Tyr Ile Tyr Arg Asn Arg Glu Arg Leu885 890 895
Asn Gly Arg Val Ile Phe Tyr Arg Asn Asn Glh Arg Leu Asp Gln Ala900 905 910Pro Trp Gln Glu Asn Pro Asp Leu Trp Ser Lys Tyr Gln Pro Gly Leu915 920 925Arg Gln Ser Ser Ser Ser Arg Val Lys Glu Arg Gly Ile Gly Asn Phe930 935 940Phe Arg Arg Phe Ser Met Lys Arg Lys945 950<210>20<211>4482<212>DNA<213>致病杆菌(Xenorhabdus)Xwi菌株<400>20atgcagggtt caacaccttt gaaacttgaa ataccgtcat tgccctctgg gggcggatca60ctaaaaggaa tgggagaagc actcaatgcc gtcggagcgg aagggggagc gtcattttca 120ctgcccttgc cgatctctgt cgggcgtggt ctggtgccgg tgctatcact gaattacagc 180agtactgccg gcaatgggtc attcgggatg gggtggcaat gtggggttgg ttttatcagc 240ctgcgtaccg ccaagggcgt tccgcactat acgggacaag atgagtatct cgggccggat 300ggggaagtgt tgagtattgt gccggacagc caagggcaac cagagcaacg caccgcaacc 360tcactgttgg ggacggttct gacacagccg catactgtta cccgctatca gtcccgcgtg 420gcagaaaaaa tcgttcgttt agaacactgg cagccacagc agagacgtga ggaagagacg 480tctttttggg tactttttac tgcggatggt ttagtgcacc tattcggtaa gcatcaccat 540gcacgtattg ctgacccgca ggatgaaacc agaattgccc gctggctgat ggaggaaacc 600
gtcacgcata ccggggaaca tatttactat cactatcggg cagaagacga tcttgactgt660gatgagcatg aacttgctca gcattcaggt gttacggccc agcgttatct ggcaaaagtc720agctatggca atactcagcc ggaaaccgct tttttcgcgg taaaatcagg tattcctgct780gataatgact ggctgtttca tctggtattt gattacggtg agcgctcatc ttcgctgaac840tctgtacccg aattcaatgt gtcagaaaac aatgtgtctg aaaacaatgt gcctgaaaaa900tggcgttgtc gtccggacag tttctcccgc tatgaatatg ggtttgaaat tcgaacccgt960cgcttgtgtc gccaagttct gatgtttcat cagctgaaag cgctggcagg ggaaaaggtt 1020gcagaagaaa caccggcgct ggtttcccgt cttattctgg attatgacct gaacaacaag l080gtttccttgc tgcaaacggc ccgcagactg gcccatgaaa cggacggtac gccagtgatg 1140atgtccccgc tggaaatgga ttatcaacgt gttaatcatg gcgtgaatct gaactggcag 1200tccatgccgc agttagaaaa aatgaacacg ttgcagccat accaattggt tgatttatat 1260ggagaaggaa tttccggcgt actttatcag gatactcaga aagcctggtg gtaccgtgct 1320ccggtacggg atatcactgc cgaaggaacg aatgcggtta cctatgagga ggccaaacca 1380ctgccacata ttccggcaca acaggaaagc gcgatgttgt tggacatcaa tggtgacggg 1440cgtctggatt gggtgattac ggcatcaggg ttacggggct accacaccat gtcaccggaa 1500ggtgaatgga caccctttat tccattatcc gctgtgccaa tggaatattt ccatccgcag 1560gcaaaactgg ctgatattga tggggctggg ctgcctgact tagcgcttat cgggccaaat 1620agtgtacgtg tctggtcaaa taatcgggca ggatgggatc gcgctcagga tgtgattcat 1680ttgtcagata tgccactgcc ggttcccggc agaaatgagc gtcatcttgt cgcattcagt 1740gatatgacag gctccgggca atcacatctg gtggaagtaa cggcagatag cgtgcgctac 1800tggccgaacc tggggcatgg aaaatttggt gagcctctga tgatgacagg cttccagatt 1860agcggggaaa cgtttaaccc cgacagactg tatatggtag acatagatgg ctcaggcacc 1920
accgatttta tttatgcccg caatacttac cttgaactct atgccaatga aagcggcaat 1980cattttgctg aacctcagcg tattgatctg ccggatgggg tacgttttga tgatacttgt 2040cggttacaaa tagcggatac acaaggatta gggactgcca gcattatttt gacgatcccc 2100catatgaagg tgcagcactg gcgattggat atgaccatat tcaagccttg gctgctgaat 2160gccgtcaata acaatatggg aacagaaacc acgctgtatt atcgcagctc tgcccagttc 2220tggctggatg agaaattaca ggcttctgaa tccgggatga cggtggtcag ctacttaccg 2280ttcccggtgc atgtgttgtg gcgcacggaa gtgctggatg aaatttccgg taaccgattg 2340accagccatt atcattactc acatggtgcc tgggatggtc tggaacggga gtttcgtggt 2400tttgggcggg tgacacaaac tgatattgat tcacgggcga gtgcgacaca ggggacacat 2460gctgaaccac cggcaccttc gcgcacggtt aattggtacg gcactggcgt acgggaagtc 2520gatattcttc tgcccacgga atattggcag ggggatcaac aggcatttcc ccattttacc 2580ccacgcttta cccgttatga cgaaaaatcc ggtggtgata tgacggtcac gccgagcgaa 2640caggaagaat actggttaca tcgagcctta aaaggacaac gtttacgcag tgagctgtat 2700ggggatgatg attctatact ggccggtacg ccttattcag tggatgaatc ccgcacccaa 2760gtacgtttgt taccggtgat ggtatcggac gtgcctgcgg tactggtttc ggtggccgaa 2820tcccgccaat accgatatga acgggttgct accgatccac agtgcagcca aaagatcgtc 2880cttaaatctg atgcgttagg atttccgcag gacaatcttg agattgccta ttcgagacgt 2940ccacagcctg agttctcgcc ttatccggat accctgcccg aaacactttt caccagcagt 3000ttcgacgaac agcagatgtt ccttcgtctg acacgccagc gttcttctta tcatcatctg 3060aatcatgatg ataatacgtg gatcacaggg cttatggata cctcacgcag tgacgcacgt 3120atttatcaag ccgataaagt gccggacggt ggattttccc ttgaatggtt ttctgccaca 3180ggtgcaggag cattgttgt tgcctgatgcc gcagccgatt atctgggaca tcagcgtgta 3240
gcatataccg gtccagaaga acaacccgct attcctccgc tggtggcata cattgaaacc3300gcagagtttg atgaacgatc gttggcggct tttgaggagg tgatggatga gcaggagctg3360acaaaacagc tgaatgatgc gggctggaat acggcaaaag tgccgttcag tgaaaagaca3420gatttccatg tctgggtggg acaaaaggaa tttacagaat atgccggtgc agacggattc3480tatcggccat tggtgcaacg ggaaaccaag cttacaggta aaacgacagt cacgtgggat3540agccattact gtgttatcac cgcaacagag gatgcggctg gcctgcgtat gcaagcgcat3600tacgattatc gatttatggt tgcggataac accacagatg tcaatgataa ctatcacacc3660gtgacgtttg atgcactggg gagggtaacc agcttccgtt tctgggggac tgaaaacggt3720gaaaaacaag gatatacccc tgcggaaaat gaaactgtcc cctttattgt ccccacaacg3780gtggatgatg ctctggcatt gaaacccggt atacctgttg cagggctgat ggtttatgcc3840cctctgagct ggatggttca ggccagcttt tctaatgatg gggagcttta tggagagctg3900aaaccggctg ggatcatcac tgaagatggt tatctcctgt cgcttgcttt tcgccgctgg3960caacaaaata accctgccgc tgccatgcca aagcaagtca attcacagaa cccaccccat4020gtactgagtg tgatcaccga ccgctatgat gccgatccgg aacaacaatt acgtcaaacg4080tttacgttta gtgatggttt tgggcgaacc ttacaaacag ccgtacgcca tgaaagtggt4140gaagcctggg tacgtgatga gtatggagcc attgtggctg aaaatcatgg cgcgcctgaa4200acggcgatga cagatttccg ttgggcagtt tccggacgta cagaatatga cggaaaaggc4260caagccctgc gtaagtatca accgtatttc ctgaatagtt ggcagtacgt cagtgatgac4320agtgcccggc aggatatata tgccgatacc cattactatg atccgttggg gcgtgaatat4380caggttatca cggccaaagg cgggtttcgt cgatccttat tcactccctg gtttgtggtg4440aatgaagatg aaaatgacac tgccggtgaa atgacagcat aa 4482<210>21
<211>3051<212>DNA<213>致病杆菌Xwi菌株<400>21atgaagaatt tcgttcacag caatacgcca tccgtcaccg tactggacaa ccgtggtcag 60acagtacgcg aaatagcctg gtatcggcac cccgatacac ctcaggtaac cgatgaacgc120atcaccggtt atcaatatga tgctcaagga tctctgactc agagtattga tccgcgattt180tatgaacgcc agcagacagc gagtgacaag aacgccatta cacccaatct tattctcttg240tcatcactca gtaagaaggc attgcgtacg caaagtgtgg atgccggaac ccgtgtcgcc300ctgcatgatg ttgccgggcg tcccgtttta gctgtcagcg ccaatggcgt tagccgaacg360tttcagtatg aaagtgataa ccttccggga cgattgctaa cgattaccga gcaggtaaaa420ggagagaacg cctgtatcac ggagcgattg atctggtcag gaaatacgcc ggcagaaaaa480ggcaataatc tggccggcca gtgcgtggtc cattatgatc ccaccggaat gaatcaaacc540aacagcatat cgttaaccag catacccttg tccatcacac agcaattact gaaagatgac600agcgaagccg attggcacgg tatggatgaa tctggctgga aaaacgcgct ggcgccggaa660agcttcactt ctgtcagcac aacggatgct accggcacgg tattaacgag tacagatgct720gccggaaaca agcaacgtat cgcctatgat gtggccggtc tgcttcaagg cagttggttg780gcgctgaagg ggaaacaaga acaagttatc gtgaaatccc tgacctattc ggctgccagc840cagaagctac gggaggaaca tggtaacggg atagtgacta catataccta tgaacccgag900acgcaacgag ttattggcat aaaaacagaa cgtccttccg gtcatgccgc tggggagaaa960attttacaaa acctgcgtta tgaatatgat cctgtcggaa atgtgctgaa atcaactaat 1020gatgctgaaa ttacccgctt ttggcgcaac cagaaaattg taccggaaaa tacttacacc 1080tatgacagcc tgtaccagct ggtttccgtc actgggcgtg aaatggcgaa tattggccga 1140caaaaaaacc agttacccat ccccgctctg attgataaca atacttatac gaattactct 1200
cgcacttacg actatgatcg tgggggaaat ctgaccagaa ttcgccataa ttcaccgatc 1260accggtaata actatacaac gaacatgacc gtttcagatc acagcaaccg ggctgtactg 1320gaagagctgg cgcaagatcc cactcaggtg gatatgttgt tcacccccgg cgggcatcag 1380acccggcttg ttcccggtca ggatcttttc tggacacccc gtgacgaatt gcaacaagtg 1440atattggtca atagggaaaa tacgacgcct gatcaggaat tctaccgtta tgatgcagac 1500agtcagcgtg tcattaagac tcatattcag aagacaggta acagtgagca aatacagcga 1560acattatatt tgccagagct ggaatggcgc acgacatata gcggcaatac attaaaagag 1620tttttgcagg tcatcactgt cggtgaatcg ggtcaggcac aagtgcgggt gctgcattgg 1680gaaacaggca aaccggcgga tatcagcaat gatcagctgc gctacagtta tggcaacctg 1740attggcagta gcgggctgga attggacagt gacgggcaga tcattagtca ggaagaatat 1800tacccctatg ggggaaccgc cgtgtgggca gcccgaagtc agtcagaagc tgattacaaa 1860accgtgcgtt attctggcaa agagcgggat gcaacagggt tgtattacta cggttatcgt 1920tattatcaat cgtggacagg gcgatggttg agtgtagatc ctgccggtga ggtcgatggt 1980ctcaatttgt tccgaatgtg caggaataac cccatcgttt tttctgattc tgatggtcgt 2040ttccccggtc agggtgtcct tgcctggata gggaaaaaag cgtatcgaaa ggcagtcaac 2100atcacgacag aacacctgct tgaacaaggc gcttcctttg atacgttctt gaaattaaac 2160cgaggattgc gaacgtttgt tttgggtgtg ggggtagcaa gtctgggggt gaaggcggcc 2220acgattgcag gagcgtcgcc ttgggggatt gtcggggctg ccattggtgg ttttgtctcc 2280ggggcggtga tggggttttt cgcgaacaac atctcagaaa aaattgggga agttttaagt 2340tatctgacgc gtaaacgttc tgttcctgtt caggttggcg cttttgttgt cacatcgctt 2400gtgacgtctg cactatttaa cagctcttcg acaggtaccg ccatttccgc agcaacagcg 2460gtcaccgttg gaggattaat ggctttagcc ggagagcata acacgggcat ggctatcagt 2520
attgccacac ccgccggaca aggtacgctg gatacgctca ggcccggtaa tgtcagcgcg 2580ccagagcggt taggggcact atcaggcgca attattggcg gcatattact tggccgccat 2640cagggaagtt ctgagctggg tgaacgggca gcgattggtg ctatgtatgg tgctcgatgg 2700ggaaggatca ttggtaatct atgggatggc ccttatcggt ttatcggcag gttactgctc 2760agaagaggca ttagctctgc catttcccac gctgtcagtt ccaggagctg gtttggccga 2820atgataggag aaagtgtcgg gagaaatatt tctgaagtat tattacctta tagccgtaca 2880cccggtgaat gggttggtgc agccattggc gggacagccg cggccgctca tcatgccgtt 2940ggaggggaag ttgccaatgc cgctagccgg gttacctgga gcggctttaa gcgggctttt 3000aataacttct tctttaacgc ctctgcacgt cataatgaat ccgaagcata a 3051<210>22<211>32<212>DNA<213>人工序列<220>
<223>引物SB101<400>22gckatggcsg acccgatgca wtacaagctg gc 32<210>23<211>32<212>DNA<213>人工序列<220>
<223>引物SB102<400>23agcggytgac crtccagrct carattgtgg cg 32
<210>24<211>28<212>DNA<213>人工序列<220>
<223>引物SB103<400>24tgtataactg gatggcyggw cgtctstc28<210>25<211>26<212>DNA<213>人工序列<220>
<223>引物SB104<400>25tcraaaggca graamcggct gtcgtt 26<210>26<211>28<212>DNA<213>人工序列<220>
<223>引物SB105<400>26cttcyctkga tatcytkytg gatgtgct28<210>27<211>30<212>DNA<213>人工序列<220>
<223>引物SB106
<400>27acgrctggya ttggyaatca gccartccaa 30<210>28<211>27<212>DNA<213>人工序列<220>
<223>引物SB212<220>
<221>misc_feature<222>(7)..(7)<223>n＝i(次黄苷)<400>28cgytatnaat atgaycckgt vggyaat 27<210>29<211>25<212>DNA<213>人工序列<220>
<223>引物SB213<220>
<221>misc_feature<222>(17)..(17)<223>n＝i(次黄苷)<400>29catcbcgytc tttrccngar tarcg 25<210>30<211>33<212>DNA<213>人工序列
<220>
<223>引物SB215<220>
<221>misc_feature<222>(10)..(10)<223>n＝i(次黄苷)<400>30cghagctcyn cccagtwytg gctggatgar aaa 33<210>31<211>32<212>DNA<213>人工序列<220>
<223>引物SB217<220>
<221>misc_feature<222>(24)..(24)<223>n＝i(次黄苷)<400>31gtrtcatttt catcttcrtt bacnryaaac ca 32<210>32<211>1293<212>DNA<213>蜂类芽孢杆菌(蜂类芽孢杆菌)DB482菌株<400>32gcagcccgaa ggctccggca cgctggcatc cttgaaggat acctaccatc cgatgaccct 60tccctatgat gacgaccttg cgcaaatcaa tgccgtggcg gaggcgcact catctaattt120gctggggatt tgggataccc tgctggacac gcagcggact tccatcctgc agaattccgcl80
cgctgcctgc cggataagca aggcgcggca atcggcatcc ccggatcaga gagcctccga 240tgatgagccg gtattgatta caggagaaga attctacctg gagacgggcg gcaaacggct 300ttttctggcg cataaactcg agataggctc cacgataagc gccaaaatca acattggacc 360gccgcaagcg gccgatatcg cgccagcaaa gttgcaactc gtttattacg gcagaggcgg 420cagaggggac tacttccttc gtgtggcaga cgatgtgtcc ctcggtggaa aattgctgaa 480caattgttat ctgaccagcg acgacggaca gagcaacaat attaacggac cattctgcct 540aatgattaat cgaggcaccg gcagcatgcc cagcgggact cacctgccag ttcagattga 600cagagtgaca gatacatccc tacgcatttt tgtgccgcaa cacggttact tgggactagg 660agaaagcctt gccagcaact ggaatgaacc gttggcgctg aatctggact tggatcaagc 720gttgaccttt accctaagaa agaatgagtc cggacaagat accatttcca taatcgatat 780gatgccgcct gttgccgaca cgaccccgtc cccgccgacg agggaaacgc tttccttgac 840gccaaacagc ttccgtctgc tggttaaccc cgagccgaca gaagaagaca tcgccaagca 900ctacaacgtt aagactgcca taacccgagc tcctgccgat ctggccgccg ccttaaatgt 960tgtcgatgat ttctgcatga agaccggctt gagctttgat gaattgctga acttaacgat 1020gcagaaggat tatcagtcaa aaagcagtga gtacaaaagc cgatttgtaa aatttggcgg 1080cggggagcat gttccggttt caacctatgg agctgtgttt ttgacaggta cggaagaaac 1140tccgttgtgg gcaaaacagt ataacagcgc aggcgctgca acagacaccc ctgttttgaa 1200ctttacggcg gataatgttg cagctttggc aggaagagcg gaaaagcttg tgcggctggc 1260gcgaagcacg ggtctttcct ttgagcagtt gga 1293<210>33<211>430<212>PRT<213>蜂类芽孢杆菌DB482菌株
<400>33Gln Pro Glu Gly Ser Gly Thr Leu Ala Ser Leu Lys Asp Thr Tyr His1 5 10 15Pro Met Thr Leu Pro Tyr Asp Asp Asp Leu Ala Gln Ile Asn Ala Val20 25 30Ala Glu Ala His Scr Ser Asn Leu Leu Gly Ile Trp Asp Thr Leu Leu35 40 45Asp Thr Gln Arg Thr Ser Ile Leu Gln Asn Ser Ala Ala Ala Cys Arg50 55 60Ile Ser Lys Ala Arg Gln Ser Ala Ser Pro Asp Gln Arg Ala Ser Asp65 70 75 80Asp Glu Pro Val Leu Ile Thr Gly Glu Glu Phe Tyr Leu Glu Thr Gly85 90 95Gly Lys Arg Leu Phe Leu Ala His Lys Leu Glu Ile Gly Ser Thr Ile100 105 110Ser Ala Lys Ile Asn Ile Gly Pro Pro Gln Ala Ala Asp Ile Ala Pro115 120 125Ala Lys Leu Gln Leu Val Tyr Tyr Gly Arg Gly Gly Arg Gly Asp Tyr130 135 140Phe Leu Arg Val Ala Asp Asp Val Ser Leu Gly Gly Lys Leu Leu Asn145 150 155 160Asn Cys Tyr Leu Thr SerA sp Asp Gly Gln Ser Asn Asn Ile Asn Gly165 170 175
Pro Phe Cys Leu Met Ile Asn Arg Gly Thr Gly Ser Met Pro Ser Gly180 185 190Thr His Leu Pro Val Gln Ile Asp Arg Val Thr Asp Thr Ser Leu Arg195 200 205Ile Phe Val Pro Gln His Gly Tyr Leu Gly Leu Gly Glu Ser Leu Ala210 215 220Ser Asn Trp Asn Glu Pro Leu Ala Leu Asn Leu Asp Leu Asp Gln Ala225 230 235 240Leu Thr Phe Thr Leu Arg Lys Asn Glu Ser Gly Gln Asp Thr Ile Ser245 250 255Ile Ile Asp Met Met Pro Pro Val Ala Asp Thr Thr Pro Ser Pro Pro260 265 270Thr Arg Glu Thr Leu Ser Leu Thr Pro Asn Ser Phe Arg Leu Leu Val275 280 285Asn Pro Glu Pro Thr Glu Glu Asp Ile Ala Lys His Tyr Asn Val Lys290 295 300Thr Ala Ile Thr Arg Ala Pro Ala Asp Leu Ala Ala Ala Leu Asn Val305 310 315 320Val Asp Asp Phe Cys Met Lys Thr Gly Leu Ser Phe Asp Glu Leu Leu325 330 335Asn Leu Thr Met Gln Lys Asp Tyr Gln Ser Lys Ser Ser Glu Tyr Lys340 345 350
Ser Arg Phe Val Lys Phe Gly Gly Gly Glu his Val Pro Val Ser Thr355 360 365Tyr Gly Ala Val Phe Leu Thr Gly Thr Glu Glu Thr Pro Leu Trp Ala370 375 380Lys Gln Tyr Asn Ser Ala Gly Ala Ala Thr Asp Thr Pro Val Leu Asn385 390 395 400Phe Thr Ala Asp Asn Val Ala Ala Leu Ala Gly Arg Ala Glu Lys Leu405 410 415Val Arg Leu Ala Arg Ser Thr Gly Leu Ser Phe Glu Gln Leu420 425 430<210>34<211>340<212>DNA<213>蜂类芽孢杆菌DB482菌株<400>34tatatttatt cacaccttgg acttcctgat caaccgcggc gacagcttgt accggctgct 60ggagcgggat actctgaccg aagccaagat gtattacatc caggccagcc aactgcttgg120tccccgcccc gatatccgga tcaatcacag ttggcctaat ccgaccctgc aaagcgaagc180ggacgcggtg accgccgtac cgacgcgaag cgattcgcgg gcaacgccaa tcctcgcctt240gcgagcgctt ctgaaagcgg aaaacgggca tttcctgccg ccttataatg atgaactgtt300agctttctgg gataaaatcg atctgcgttt atacaattta 340<210>35<211>565<212>DNA
<213>蜂类芽孢杆菌DB482菌株<400>35gtctctatac tatcaaatgt atgacgccgc attgccgctc tgcttgatgg ccaaacaggc 60tttagagaaa gaaatcggca ctgataaaac gggtggagtt ttcaccctcc cggcctggaa120tgatctgtat cagggattac tggcggggga ggcgctgctg ctcgagcttc agaagctgga180gaatctgtgg ctggaggaag acaagcgcgg aatggaagcc gtaaaaacgg tatctttaga240tacccttctc cgcaaagaaa cgccagagtc tagcttcgta gagctagtca aggaagttct300ggacggaaag acgcctgacc ctgtaggcgg agtcggcgta cagctgcaaa acaatatttt360cagcgcaacc cttgacctgt ccgttcttgg cttggatcgc tcttacaacc aagcggaaaa420gacccgcagg atcaaaaatc tgtcggttac cttacccgcg cttttgggac cttaccagga480tatagaagca accttatcgc taggcggcga gaccgttgcg ctttcccatg gcgtggatga540cagcggcttg ttcatcacgg atctt 565<210>36<211>113<212>PRT<213>蜂类芽孢杆菌DB482菌株<400>36Ile Phe Ile His Thr Leu Asp Phe Leu Ile Asn Arg Gly Asp Ser Leu1 5 10 15Tyr Arg Leu Leu Glu Arg Asp Thr Leu Thr Glu Ala Lys Met Tyr Tyr20 25 30Tle Gln Ala Ser Gln Leu Leu Gly Pro Arg Pro Asp Ile Arg Ile Asn35 40 45His Ser Trp Pro Asn Pro Thr Leu Gln Ser Glu Ala Asp Ala Val Thr
50 55 60Ala Val Pro Thr Arg Ser Asp Ser Arg Ala Thr Pro Ile Leu Ala Leu65 70 75 80Arg Ala Leu Leu Lys Ala Glu Asn Gly His Phe Leu Pro Pro Tyr Asn85 90 95Asp Glu Leu Leu Ala Phe Trp Asp Lys Ile Asp Leu Arg Leu Tyr Asn100 105 110Leu<210>37<211>188<212>PRT<213>蜂类芽孢杆菌DB482菌株<400>37Ser Leu Tyr Tyr Gln Met Tyr Asp Ala Ala Leu Pro Leu Cys Leu Met1 5 10 15Ala Lys Gln Ala Leu Glu Lys Glu Ile Gly Thr Asp Lys Thr Gly Gly20 25 30Val Phe Thr Leu Pro Ala Trp Asn Asp Leu Tyr Gln Gly Leu Leu Ala35 40 45Gly Glu Ala Leu Leu Leu Glu Leu Gln Lys Leu Glu Asn Leu Trp Leu50 55 60Glu Glu Asp Lys Arg Gly Met Glu Ala Val Lys Thr Val Ser Leu Asp65 70 75 80
Thr Leu Leu Arg Lys Glu Thr Pro Glu Ser Ser Phe Val Glu Leu Val85 90 95Lys Glu Val Leu Asp Gly Lys Thr Pro Asp Pro Val Gly Gly Val Gly100 105 110Val Gln Leu Gln Asn Asn Ile Phe Ser Ala Thr Leu Asp Leu Ser Val115 120 125Leu Gly Leu Asp Arg Ser Tyr Asn Gln Ala Glu Lys Thr Arg Arg Ile130 135 140Lys Asn Leu Ser Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp145 150 155 160Ile Glu Ala Thr Leu Ser Leu Gly Gly Glu Thr Val Ala Leu Ser His165 170 175Gly Val Asp Asp Ser Gly Leu Phe Ile Thr Asp Leu180 185<210>38<211>2091<212>DNA<213>蜂类芽孢杆菌DB482菌株<400>38caggcaacct catcggctgt ctgtggtgtg ccattcccga tcaacgtggt atcggacata 60cacacggtgg acgaaatcag cggcagcgcc aggattcaga agtatactta ccgcaatggc120gtgtatgacc ggaccgataa ggaatttgcc gggttcggcc acattgacac atgggaagag180gagcgggatt ccgagggaac ccttagcatc agcactcccc ccgtgctgac acggacctgg240
tatcataccg ggcaaaagca ggatgaggag cgtgccgtgc agcaatattg gcaaggcgac300cctgccgctt ttcaggttaa acccgtccgg cttactcgat tcgatgcggc aacggcccag360gatgtcccgc tagactctcc caataggcgg gaagagtatt ggctgtatcg ctcgttgcga420gggatgccgc tgcgtaatga aatttttgct ggagatgttg tggggttgcc tccttatcag480gtggagagct tacgttatca agtgcgcttg atgcagagca ccgattcgga atgtgttaca540ttgcccatgc agttggagca gcttacgtac aactatgagc aaatcgcctc tgatccgcag600tgttcacagc agatacagca atggttcgac gaatacggcg tggcggcaca gagtataacg660atccaatatc cgcgccgggc acagccggag gacaatccgt accctcacac gctgccggat720accagctgga gcagcagtta tgattcgcag caaatgctgc tgcggttaac aaggcaaagg780caaaaagcgt accaccttgc agaccctgaa ggctggcgct tgaatatccc ccatcagaca840cgcctggatt ctttcatcta ttctgctgac agcgtgcctg ccgaaggaat aagcgcagag900ctgctggggg gtgacggcac gttacgatct ccggcgctgg aacaggctta tggcggccag960tcagagatca tctatgcggg cgggggggaa ccggattcgc gagctctggt ccattacacc 1020agaagcgcga ttctcgatga agcctgtttg caagcctatg aaggcgtact gagcgatagc 1080caattgaact cgcttcttgc atcttccggc tatcaacgaa gcgcaagaat attgggttcc 1140ggcgatgaag cggatatttt tgttgcggaa caaggattta cccgttatgc ggatgaacag 1200aattttttcc gtattctggg acaacaatcc tctctcttga ccggggaaca agtattaaca 1260tgggatgata atttctgtgc ggtaacatcc atagaagacg cgcttggcaa tcaaattcag 1320attgcatatg attaccgctt tgtggaggct atccagatta ccgatgcgaa taacaatgtg 1380aatcaggtct ccctggatgc tctcggccgg gtcgtataca gccggacctg gggcacagag 1440gaagggatag agacgggctt ccgcccggag gcggaattct cgccgcccga gacaatggag 1500caggcgcttg ccctggcgtc tcccttgccg gttgcatcct gctgtgttta tgatgcgcat 1560
agctggatgg gaacgataac tcttgggcag ctgtcagcgc ttgttccaga tagtgaaaag 1620caatggtcgt tcttgatagc caatcgcttg attatgccgg acggcaggat aagagcccgc 1680ggccgggccc catggtggct tcaacggcta ttgccgcctg ccgtggccaa gctgctgagc 1740gaggcggacc gtaagccgcc gcatacggta gttttggcag cagatcgcta cccggatgac 1800ccatcccagc aaattcaggc cagcgtcgtg tttagcgatg gctttgggcg tacgatacaa 1860accgctaaaa gagcagatac ccgatgggcg attacggaac ggattgacta tgacgaaacc 1920ggagccgtaa tccgaagctt tcagcctttt tatattgatg actggaatta tgtgggcaaa 1980gaggctgtca gcggctctat gtatgcaacg atctattact atgatgctct ggcacgccaa 2040ctaaggatgg tcaacgccaa aggatatgag aggagaactg ctttttaccc a 2091<210>39<211>697<212>PRT<213>蜂类芽孢杆菌DB482菌株<400>39Gln Ala Thr Ser Ser Ala Val Cys Gly Val Pro Phe Pro Ile Asn Val1 5 10 15Val Ser Asp Ile His Thr Val Asp Glu Ile Ser Gly Ser Ala Arg Ile20 25 30Gln Lys Tyr Thr Tyr Arg Asn Gly Val Tyr Asp Arg Thr Asp Lys Glu35 40 45Phe Ala Gly Phe Gly his Ile Asp Thr Trp Glu Glu Glu Arg Asp Ser50 55 60Glu Gly Thr Leu Ser Ile Ser Thr Pro Pro Val Leu Thr Arg Thr Trp65 70 75 80
Tyr His Thr Gly Gln Lys Gln Asp Glu Glu Arg Ala Val Gln Gln Tyr85 90 95Trp Gln Gly Asp Pro Ala Ala Phe Gln Val Lys Pro Val Arg Leu Thr100 105 110Arg Phe Asp Ala Ala Thr Ala Gln Asp Val Pro Leu Asp Ser Pro Asn115 120 125Arg Arg Glu Glu Tyr Trp Leu Tyr Arg Ser Leu Arg Gly Met Pro Leu130 135 140Arg Asn Glu Ile Phe Ala Gly Asp Val Val Gly Leu Pro Pro Tyr Gln145 150 155 160Val Glu Ser Leu Arg Tyr Gln Va1 Arg Leu Met Gln Ser Thr Asp Ser165 170 175Glu Cys Val Thr Leu Pro Met Gln Leu Glu Gln Leu Thr Tyr Asn Tyr180 185 190Glu Gln Ile Ala Ser Asp Pro Gln Cys Ser Gln Gln Ile Gln Gln Trp195 200 205Phe Asp Glu Tyr Gly Val Ala Ala Gln Ser Ile Thr Ile Gln Tyr Pro210 215 220Arg Arg Ala Gln Pro Glu Asp Asn Pro Tyr Pro His Thr Leu Pro Asp225 230 235 240Thr Ser Trp Ser Ser Ser Tyr Asp Ser Gln Gln Met Leu Leu Arg Leu245 250 255
Thr Arg Gln Arg Gln Lys Ala Tyr His Leu Ala Asp Pro Glu Gly Trp260 265 270Arg Leu Asn Ile Pro His Gln Thr Arg Leu Asp Ser Phe Ile Tyr Ser275 280 285Ala Asp Ser Val Pro Ala Glu Gly Ile Ser Ala Glu Leu Leu Gly Gly290 295 300Asp Gly Thr Leu Arg Ser Pro Ala Leu Glu Gln Ala Tyr Gly Gly Gln305 310 315 320Ser Glu Ile Ile Tyr Ala Gly Gly Gly Glu Pro Asp Ser Arg Ala Leu325 330 335Val His Tyr Thr Arg Ser Ala Ile Leu Asp Glu Ala Cys Leu Gln Ala340 345 350Tyr Glu Gly Val Leu Ser Asp Ser Gln Leu Asn Ser Leu Leu Ala Ser355 360 365Ser Gly Tyr Gln Arg Ser Ala Arg Ile Leu Gly Ser Gly Asp Glu Ala370 375 380Asp Ile Phe Val Ala Glu Gln Gly Phe Thr Arg Tyr Ala Asp Glu Gln385 390 395 400Asn Phe Phe Arg Ile Leu Gl y Gln Gln Ser Ser Leu Leu Thr Gly Glu405 410 415Gln Val Leu Thr Trp Asp Asp Asn Phe Cys Ala Val Thr Ser Ile Glu420 425 430
Asp Ala Leu Gly Asn Gln Ile Gln Ile Ala Tyr Asp Tyr Arg Phe Val435 440 445Glu Ala Ile Gln Ile Thr Asp Ala Asn Asn Asn Val Asn Gln Val Ser450 455 460Leu Asp Ala Leu Gly Arg Val Val Tyr Ser Arg Thr Trp Gly Thr Glu465 470 475 480Glu Gly Ile Glu Thr Gly Phe Arg Pro Glu Ala Glu Phe Ser Pro Pro485 490 495Glu Thr Met Glu Gln Ala Leu Ala Leu Ala Ser Pro Leu Pro Val Ala500 505 510Ser Cys Cys Val Tyr Asp Ala His Ser Trp Met Gly Thr Ile Thr Leu515 520 525Gly Gln Leu Ser Ala Leu Val Pro Asp Ser Glu Lys Gln Trp Ser Phe530 535 540Leu Ile Ala Asn Arg Leu Ile Met Pro Asp Gly Arg Ile Arg Ala Arg545 550 555 560Gly Arg Ala Pro Trp Trp Leu Gln Arg Leu Leu Pro Pro Ala Val Ala565 570 575Lys Leu Leu Ser Glu Ala Asp Arg Lys Pro Pro His Thr Val Val Leu580 585 590Ala Ala Asp Arg Tyr Pro Asp Asp Pro Ser Gln Gln Ile Gln Ala Ser595 600 605
Val Val Phe Ser Asp Gly Phe Gly Arg Thr Ile Gln Thr Ala Lys Arg610 615 620Ala Asp Thr Arg Trp Ala Ile Thr Glu Arg Ile Asp Tyr Asp Glu Thr625 630 635 640Gly Ala Val Ile Arg Ser Phe Gln Pro Phe Tyr Ile Asp Asp Trp Asn645 650 655Tyr Val Gly Lys Glu Ala Val Ser Gly Ser Met Tyr Ala Thr Ile Tyr660 665 670Tyr Tyr Asp Ala Leu Ala Arg Gln Leu Arg Met Val Asn Ala Lys Gly675 680 685Tyr Glu Arg Arg Thr Ala Phe Tyr Pro690 695<210>40<211>858<212>DNA<213>蜂类芽孢杆菌DB482菌株<400>40atcctgtcta tctgcaatga agcggagccg gtccgttatt tccgcaatca ggccgtcgct 60ccgaaaaggc agtatgctta cgatgccctg tatcagcttg tatccagctc ggggcgggaa120tccgacgcgc ttcgtcagca gacgtcgctt cctcccttga tcacgcctat tcctctcgac180gatagccaat acgtcaatta tgctgagaga tacagctatg atcgggcggg caatctaatc240aagcttagcc atcatggggc aagtcaatat acaacgaatg tgcatgtgga caaaagttca300aaccggggga tttggcggca aggggaagac atcccggata tcgcggcttc ctttgacaga360
gcaggcaatc aacaagattt attcccgggg agacggttgg aatgggatac acgcaatcag420ttatgccgtg tccatatggt cgtgcgcgaa ggcggcgata acgactggga gggctatctc480tatgacagct caggaatgcg catcgtaaaa cattctaccc gcaagacaca gacgacaacg540caaacggata cgacgatcta tttgccgggc ctggagcttc gcatccgcca aaccggggac600agggtcacgg aagcattgca ggtcattacc gtggatgagg gagcgggaca agtgagggtg660ctgcactggg aggatggaac cgagccgggc ggcatagcca atgatcagta tcggtacagc720ctaaacgatc atcttggctc ctctttattg gaagttgacg ggcaaagtca gatcattagc780aaggaagaat tttatcccta tggcggcaca gcattgtgga cagcccggtc agaggtggag840gcaagctaca agaccacg 858<210>41<211>286<212>PRT<213>蜂类芽孢杆菌DB482菌株<400>41Ile Leu Ser Ile Cys Asn Glu Ala Glu Pro Val Arg Tyr Phe Arg Ash1 5 10 15Gln Ala Val Ala Pro Lys Arg Gln Tyr Ala Tyr Asp Ala Leu Tyr Gln20 25 30Leu Val Ser Ser Ser Gly Arg Glu Ser Asp Ala Leu Arg Gln Gln Thr35 40 45Ser Leu Pro Pro Leu Ile Thr Pro Ile Pro Leu Asp Asp Ser Gln Tyr50 55 60Val Asn Tyr Ala Glu Arg Tyr Ser Tyr Asp Arg Ala Gly Asn Leu Ile65 70 75 80
Lys Leu Ser His His Gly Ala Ser Gln Tyr Thr Thr Asn Val His Val85 90 95Asp Lys Ser Ser Asn Arg Gly Ile Trp Arg Gln Gly Glu Asp Ile Pro100 105 110Asp Ile Ala Ala Ser Phe Asp Arg Ala Gly Asn Gln Gln Asp Leu Phe115 120 125Pro Gly Arg Arg Leu Glu Trp Asp Thr Arg Asn Gln Leu Cys Arg Val130 135 140His Met Val Val Arg Glu Gly Gly Asp Asn Asp Trp Glu Gly Tyr Leu145 L50 155 160Tyr Asp Ser Ser Gly Met Arg Ile Val Lys His Ser Thr Arg Lys Thr165 170 175Gln Thr Thr Thr Gln Thr Asp Thr Thr Ile Tyr Leu Pro Gly Leu Glu180 185 190Leu Arg Ile Arg Gln Thr Gly Asp Arg Val Thr Glu Ala Leu Gln Val195 200 205Ile Thr Val Asp Glu Gly Ala Gly Gln Val Arg Val Leu His Trp Glu210 215 220Asp Gly Thr Glu Pro Gly Gly Ile Ala Asn Asp Gln Tyr Arg Tyr Ser225 230 235 240Leu Asn Asp His Leu Gly Ser Ser Leu Leu Glu Val Asp Gly Gln Ser245 250 255
Gln Ile Ile Ser Lys Glu Glu Phe Tyr Pro Tyr Gly Gly Thr Ala Leu260 265 270Trp Thr Ala Arg Ser Glu Val Glu Ala Ser Tyr Lys Thr Thr275 280 285<210>42<211>4434<212>DNA<213>光杆状菌(Photorhabdus)W14菌株<400>42atgatgcaga attcacaaac attcagtgtt accgagctgt cattacccaa aggcggcggc 60gctattaccg gtatgggtga agcattaaca ccagccgggc cggatggtat ggccgcctta120tccctgccat tacccatttc cgccgggcgt ggttacgcac cctcgctcac tctgaattac180aacagtggaa ccggtaacag cccatttggt ctcggttggg actgcggcgt catggcaatt240cgtcgtcgca ccagtaccgg cgtaccgaat tacgatgaaa ccgatacttt tctggggccg300gaaggtgaag tgttggtcgt agcattaaat gaggcaggtc aagctgatat ccgcagtgaa360tcctcattgc agggcatcaa tttgggtgcg accttcaccg ttacctgtta tcgctcccgc420ctagaaagcc actttaaccg gttggaatac tggcaacccc aaacaaccgg cgcaaccgat480ttctggctga tatacagccc cgacggacag gtccatttac tgggcaaaaa tcctcaggca540cgtatcagca atccactcaa tgttaaccaa acagcgcaat ggctgttgga agcctcgata600tcatcccaca gcgaacagat ttattatcaa tatcgcgctg aagatgaagc aggttgtgaa660accgacgagc tagcagccca ccccagcgca accgttcagc gctacctgca aacagtacat720tacgggaacc tgaccgccag cgacgttttt cctacactaa acggagatga cccacttaaa780tctggctgga tgttctgttt agtatttgac tacggtgagc gcaaaaacag cttatctgaa840
atgccgctgt ttaaagccac aggcaattgg ctttgccgaa aagaccgttt ttcccgttat900gagtacggtt ttgaattgcg tactcgccgc ttatgccgcc aaatactgat gtttcaccgt960ctacaaaccc tatctggtca ggcaaagggg gatgatgaac ctgcgctagt gtcgcgtctg 1020atactggatt atgacgaaaa cgcgatggtc agtacgctcg tttctgtccg ccgggtaggc 1080catgaggaca acaacacggt taccgcgctg ccaccactgg aactggccta tcagcctttt 1140gagccagaac aaaccgcact ctggcaatca atggatgtac tggcaaattt caacaccatt 1200cagcgctggc aactgcttga cctgaaagga gaaggcgtgc ccggcattct ctatcaggat 1260agaaatggct ggtggtatcg atctgcccaa cgtcaggccg gggaagagat gaatgcggtc 1320acctggggga aaatgcaact ccttcccatc acaccagctg tgcaggataa cgcctcactg 1380atggatatta acggtgacgg gcaactggac tgggtgatta ccgggccggg gctaaggggc 1440tatcacagcc aacacccgga tggcagttgg acgcgtttta cgccattaca tgccctgccg 1500atagaatatt ctcatcctcg cgctcaactt gccgatttaa tgggagccgg gctgtccgat 1560ttagtgctaa ttggtcccaa aagtgtgcgc ttatatgtca ataaccgtga tggttttacc 1620gaagggcggg atgtggtgca atccggtgat atcaccctgc cgctaccggg cgccgatgcc 1680cgtaagttag tggcatttag tgacgtactg ggttcaggcc aagcacatct ggttgaagtt 1740agtgcaactc aagtcacctg ctggccgaat ctggggcatg gccgttttgg tcagccaatc 1800gtattgccgg gattcagcca atctgccgcc agttttaatc ctgatcgagt tcatctggcc 1860gatttggatg ggagcggccc tgccgatttg atttatgttc atgctgaccg tctggatatt 1920ttcagcaatg aaagtggcaa cggttttgca aaaccattca cactctcttt tcctgacggc 1980ctgcgttttg atgatacctg ccagttgcaa gtagccgatg tacaagggtt aggcgttgtc 2040agcctgatcc taagcgtacc gcatatggcg ccacatcatt ggcgctgcga tctgaccaac 2100gcgaaaccgt ggttactcag tgaaacgaac aacaatatgg gggccaatca caccttgcat 2160
taccgtagct ctgtccagtt ctggctggat gaaaaagctg cggcattggc taccggacaa 2220acaccggtct gttacctgcc cttcccggtc catacccttt ggcaaacaga aaccgaggat 2280gaaatcagcg gcaataagtt agtgaccacg ttacgttatg ctcacggcgc ttgggatgga 2340cgtgaacggg aatttcgtgg ctttggttat gttgagcaga cagacagcca tcaactcgct 2400caaggcaatg cgccggaacg tacaccaccg gcactcacca aaagctggta tgccaccgga 2460ttacctgcgg tagataatgc gttatccgcc gggtattggc gtggcgataa gcaagctttc 2520gccggtttta cgccacgttt tactctctgg aaagagggca aagatgttcc actgacaccg 2580gaagatgacc ataatctata ctggttaaac cgggcgctaa aaggtcagcc actgcgtagt 2640gaactctacg ggctggatgg cagcgcacag caacagatcc cctatacagt gactgaatcc 2700cgtccacagg tgcgccaatt acaagatggc gccaccgttt ccccggtgct ctgggcctca 2760gtcgtggaaa gccgtagtta tcactacgaa cgtattatca gtgatcccca gtgcaatcag 2820gatatcacgt tgtccagtga cctattcggg caaccactga aacaggtttc cgtacaatat 2880ccccgccgca acaaaccaac aaccaatccg tatcccgata ccctaccgga tacgctgttt 2940gccagcagtt atgacgatca acaacagcta ttgcgattaa cctgccgaca atccagttgg 3000caccatctta ttggtaatga gctaagagtg ttgggattac cggatggcac acgcagtgat 3060gcctttactt acgatgccaa acaggtacct gtcgatggct taaatctgga aaccctgtgt 3120gctgaaaata gcctgattgc cgatgataaa cctcgcgaat acctcaatca gcaacgaacg 3180ttctataccg acgggaaaaa ccaaacaccg ctgaaaacac cgacacgaca agcgttaatc 3240gcctttaccg aaacggcggt attaacggaa tctctgttat ccgcgtttga tggcggtatt 3300acgccagacg aattaccggg aatactgaca caggccggat accaacaaga gccttatctg 3360tttccacgca ccggcgaaaa caaagtttgg gtagcgcgtc aaggctatac cgattacggg 3420acggaagcac aattttggcg tcctgtcgca caacgtaaca gcctgttaac cgggaaaatg 3480
acgttaaaat gggatactca ctattgtgtc atcacccaaa cccaagatgc tgccggcctc 3540accgtctcag ccaattatga ctggcgtttt ctcacaccaa cgcaactgac tgacatcaac 3600gataatgtgc atctcatcac cttggatgct ctgggacgcc ctgtcacgca acgtttctgg 3660gggatcgaaa gcggtgtggc aacaggttac tcttcatcag aagaaaaacc attctctcca 3720ccaaacgata tcgataccgc tattaatcta accggaccac tccctgtcgc acagtgtctg 3780gtctatgcac cggacagttg gatgccacta ttcagtcaag aaaccttcaa cacattaacg 3840caggaagagc aggagacgct gcgtgattca cgtattatca cggaagattg gcgtatttgc 3900gcactgactc gccgccgttg gctacaaagt caaaagatca gtacaccatt agttaaactg 3960ttaaccaaca gcattggttt acctccccat aaccttacgc tgaccacaga ccgttatgac 4020cgcgactctg agcagcaaat tcgccaacaa gtcgcattta gtgatggttt tggccgtctg 4080ctacaagcgt ctgtacgaca tgaggcaggc gaagcctggc aacgtaacca agacggttct 4140ctggtgacaa aagtggagaa taccaaaacg cgttgggcgg tcacgggacg caccgaatat 4200gataataaag ggcaaacgat acgcacttat cagccctatt tcctcaacga ctggcgatat 4260gtcagtgatg acagcgccag aaaagaagcc tatgcggata ctcatattta tgatccaatt 4320gggcgagaaa tccgggttat tactgcaaaa ggctggctgc gccaaagcca atatttcccg 4380tggtttaccg tgagtgagga tgagaatgat acggccgctg atgcgctggt gtaa4434<210>43<211>4425<212>DNA<213>光杆状菌W14菌株<400>43atgcaaaatt cacaagattt tagtattacg gaactgtcac tgcccaaagg ggggggcgct60atcacgggaa tgggtgaagc attaaccccc actggaccgg atggtatggc cgcgctatct 120ctaccattgc ctatttctgc cgggcgcggt tatgctcccg cattcactct gaattacaac 180
agcggcgccg gtaacagtcc atttggtctg ggttgggatt gcaacgttat gactatccgc240cgccgcaccc attttggcgt cccccattat gacgaaaccg ataccttttt ggggccagaa300ggcgaagtgc tggtggtagc ggatcaacct cgcgacgaat ccacattaca gggtatcaat360ttaggcgcca cctttaccgt taccggctac cgttcccgtc tggaaagcca tttcagccga420ttggaatatt ggcaacccaa aacaacaggt aaaacagatt tttggttgat atatagccca480gatgggcagg tgcatctact gggtaaatca ccgcaagcgc ggatcagcaa cccatcccaa540acgacacaaa cagcacaatg gctgctggaa gcctctgtat catcacgtgg cgaacaaatt600tattatcaat atcgcgccga agatgacaca ggttgcgaag cagatgaaat tacgcaccat660ttacaggcta cagcgcaacg ttatttacac atcgtgtatt acggcaaccg tacagccagc720gaaacattac ccggtctgga tggcagcgcc ccatcacaag cagactggtt gttctatctg780gtatttgatt acggcgaacg cagtaacaac ctgaaaacgc caccagcatt ttcgactaca840ggtagctggc tttgccgtca ggaccgtttt tcccgttatg aatatggctt tgagattcgt900acccgccgct tatgccgtca ggtattgatg taccatcacc tgcaagcact ggatagtaag960ataacagaac acaacggacc aacgctggtt tcacgcctga tactcaatta cgacgaaagc 1020gcgatagcca gcacgctagt attcgttcgc cgagtgggac acgagcaaga tggtaatgtc 1080gtcaccctgc cgccattaga attggcatat caggattttt caccgcgaca tcacgctcac 1140tggcaaccaa tggatgtact ggcaaacttc aatgccattc agcgctggca gctagtcgat 1200ctaaaaggcg aaggattacc cggcctgtta tatcaggata aaggcgcttg gtggtaccgc 1260tccgcacagc gtctgggcga aattggctca gatgccgtca cttgggaaaa gatgcaacct 1320ttatcggtta ttccttcttt gcaaagtaat gcctcgttgg tggatatcaa tggagacggc 1380caacttgact gggttatcac cggaccggga ttacggggat atcatagtca acgcccggat 1440ggcagttgga cacgttttac cccactcaac gctctgccgg tggaatacac ccatccacgc 1500
gcgcaactcg cagatttaat gggagccggg ctatccgatt tggtgctgat cggccctaag 1560agcgtgcgtt tatatgccaa tacccgcgac ggctttgcca aaggaaaaga tgtggtgcaa 1620tccggtgata tcacactgcc ggtgccgggc gccgatccac gtaagttggt ggcgtttagt 1680gatgtattgg gttcaggtca agcccatctg gttgaagtaa gcgcgactaa agtcacctgc 1740tggcctaatc tggggcgcgg acgttttggt caacccatta ccttaccggg attcagccag 1800ccagcaaccg agtttaaccc ggctcaagtt tatctggccg atctggatgg cagcggtcca 186acggatctga tttatgttca tacaaaccgt ctggatatct tcctgaacaa aagtggcaat 1920ggctttgctg aaccagtgac attacgcttc ccggaaggtc tgcgttttga tcatacctgt 1980cagttacaaa tggccgatgt acaaggatta ggcgtcgcca gcctgatact gagcgtgccg 2040catatgtctc cccatcactg gcgctgcgat ctgaccaaca tgaagccgtg gttactcaat 2100gaaatgaaca acaatatggg ggtccatcac accttgcgtt accgcagttc ctcccaattc 2160tggctggatg aaaaagccgc ggcgctgact accggacaaa caccggtttg ctatctcccc 2220ttcccgatcc acaccctatg gcaaacggaa acagaagatg aaatcagcgg caacaaatta 2280gtcacaacac ttcgttatgc tcgtggcgca tgggacggac gcgagcggga atttcgcgga 2340tttggttatg tagagcagac agacagccat caactggctc aaggcaacgc gccagaacgt 2400acgccaccgg cgctgaccaa aaactggtat gccaccggac tgccggtgat agataacgca 2460ttatcaaccg agtattggcg tgatgatcag gcttttgccg gtttctcacc gcgctttacg 2520acttggcaag ataacaaaga tgtcccgtta acaccggaag atgataacag tcgttactgg 2580ttcaaccgcg cgttgaaagg tcaactgcta cgtagtgaac tgtacggatt ggacgatagt 2640acaaataaac acgttcccta tactgtcact gaatttcgt tcacaggtacg tcgattacag 2700cataccgaca gccgataccc tgtactttgg tcatctgtag ttgaaagccg caactatcac 2760tacgaacgta tcgccagcga cccgcaatgc agtcaaaata ttacgctatc cagtgatcga 2820
tttggtcagc cgctaaaaca gctttcggta cagtacccgc gccgccagca gccagcaatc 2880aatctgtatc ctgatacatt gcctgataag ttgttagcca acagctatga tgaccaacaa 2940cgccaattac ggctcaccta tcaacaatcc agttggcatc acctgaccaa caataccgtt 3000cgagtattgg gattaccgga tagtacccgc agtgatatct ttacttatgg cgctgaaaat 3060gtgcctgctg gtggtttaaa tctggaactt ctgagtgata aaaatagcct gatcgcggac 3120gataaaccac gtgaatacct cggtcagcaa aaaaccgctt ataccgatgg acaaaataca 3180acgccgttgc aaacaccaac acggcaagcc ctgattgcct ttaccgaaac aacggtattc 3240aaccagtcca cattatcagc gtttaacgga agcatcccgt ccgataaatt atcaacgacg 3300ctggagcaag ctggatatca gcaaacaaat tatctattcc ctcgcactgg agaagataaa 3360gtttgggtag cccatcacgg ctataccgat tatggtacag cggcacagtt ctggcgcccg 3420caaaaacaga gcaacaccca actcaccggt aaaatcaccc tcatctggga tgcaaactat 3480tgcgttgtgg tacaaacccg ggatgctgct ggactgacaa cctcagccaa atatgactgg 3540cgttttctga ccccggtgca actcaccgat atcaatgaca atcagcacct tatcacactg 3600gatgcattgg gccgaccaat cacattgcgc ttttggggaa ctgaaaacgg caagatgaca 3660ggttattcct caccggaaaa agcatcattt tctccaccat ccgatgttaa tgccgctatt 3720gagttaaaaa aaccgctccc tgtagcacag tgtcaggtct acgcaccaga aagctggatg 3780ccagtattaa gtcagaaaac cttcaatcga ctggcagaac aagattggca aaagttatat 3840aacgcccgaa tcatcaccga agatggacgt atctgcacac tggcttatcg ccgctgggta 3900caaagccaaa aggcaatccc tcaactcatt agcctgttaa acaacggacc ccgtttacct 3960cctcacagcc tgacattgac gacggatcgt tatgatcacg atcctgagca acagatccgt 4020caacaggtgg tattcagtga tggctttggc cgcttgctgc aagccgctgc ccgacatgag 4080gcaggcatgg cccggcaacg caatgaagac ggctctttga ttataaatgt ccagcatact 4140
gagaaccgtt gggcagtgac tggacgaacg gaatatgaca ataaggggca accgatacgt 4200acctatcagc cctatttcct caatgactgg cgatacgtca gcaatgatag tgcccggcag 4260gaaaaagaag cttatgcaga tacccatgtc tatgatccca taggtcgaga aatcaaggtt 4320atcaccgcaa aaggttggtt ccgtcgaacc ttgttcactc cctggtttac tgtcaatgaa 4380gatgaaaatg acacagccgc tgaggtgaag aaggtaaaga tgtaa 4425<210>44<211>3132<212>DNA<213>光杆状菌W14菌株<400>44atgagcccgt ctgagactac tctttatact caaaccccaa cagtcagcgt gttagataat 60cgcggtctgt ccattcgtga tattggtttt caccgtattg taatcggggg ggatactgac120acccgcgtca cccgtcacca gtatgatgcc cgtggacacc tgaactacag tattgaccca180cgcttgtatg atgcaaagca ggctgataac tcagtaaagc ctaattttgt ctggcagcat240gatctggccg gtcatgccct gcggacagag agtgtcgatg ctggtcgtac tgttgcattg300aatgatattg aaggtcgttc ggtaatgaca atgaatgcga ccggtgttcg tcagacccgt360cgctatgaag gcaacacctt gcccggtcgc ttgttatctg tgagcgagca agttttcaac420caagagagtg ctaaagtgac agagcgcttt atctgggctg ggaatacaac ctcggagaaa480gagtataacc tctccggtct gtgtatacgc cactacgaca cagcgggagt gacccggttg540atgagtcagt cactggcggg cgccatgcta tcccaatctc accaattgct ggcggaaggg600caggaggcta actggagcgg tgacgacgaa actgtctggc agggaatgct ggcaagtgag660gtctatacga cacaaagtac cactaatgcc atcggggctt tactgaccca aaccgatgcg720aaaggcaata ttcagcgtct ggcttatgac attgccggtc agttaaaagg gagttggttg780
acggtgaaag gccagagtga acaggtgatt gttaagtccc tgagctggtc agccgcaggt840cataaattgc gtgaagagca cggtaacggc gtggttacgg agtacagtta tgagccggaa900actcaacgtc tgataggtat caccacccgg cgtgccgaag ggagtcaatc aggagccaga960gtattgcagg atctacgcta taagtatgat ccggtgggga atgttatcag tatccataat 1020gatgccgaag ctacccgctt ttggcgtaat cagaaagtgg agccggagaa tcgctatgtt 1080tatgattctc tgtatcagct tatgagtgcg acagggcgtg aaatggctaa tatcggtcag 1140caaagcaacc aacttccctc acccgttata cctgttccta ctgacgacag cacttatacc 1200aattaccttc gtacctatac ttatgaccgt ggcggtaatt tggttcaaat ccgacacagt 1260tcacccgcga ctcaaaatag ttacaccaca gatatcaccg tttcaagccg cagtaaccgg 1320gcggtattga gtacattaac gacagatcca acccgagtgg atgcgctatt tgattccggc 1380ggtcatcaga agatgttaat accggggcaa aatctggatt ggaatattcg gggtgaattg 1440caacgagtca caccggtgag ccgtgaaaat agcagtgaca gtgaatggta tcgctatagc 1500agtgatggca tgcggctgct aaaagtgagt gaacagcaga cgggcaacag tactcaagta 1560caacgggtga cttatctgcc gggattagag ctacggacaa ctggggttgc agataaaaca 1620accgaagatt tgcaggtgat tacggtaggt gaagcgggtc gcgcacaggt aagggtattg 1680cactgggaaa gtggtaagcc gacagatatt gacaacaatc aggtgcgcta cagctacgat 1740aatctgcttg gctccagcca gcttgaactg gatagcgaag ggcagattct cagtcaggaa 1800gagtattatc cgtatggcgg tacggcgata tgggcggcga gaaatcagac agaagccagc 1860tacaaattta ttcgttactc cggtaaagag cgggatgcca ctggattgta ttattacggc 1920taccgttatt atcaaccttg ggtgggtcga tggttgagtg ctgatccggc gggaaccgtg 1980gatgggctga atttgtaccg aatggtgagg aataacccca tcacattgac tgaccatgac 2040ggattagcac cgtctccaaa tagaaatcga aatacatttt ggtttgcttc atttttgttt 2100
cgtaaacctg atgagggaat gtccgcgtca atgagacggg gacaaaaaat tggcagagcc 2160attgccggcg ggattgcgat tggcggtctt gcggctacca ttgccgctac ggctggcgcg 2220gctatccccg tcattctggg ggttgcggcc gtaggcgcgg ggattggcgc gttgatggga 2280tataacgtcg gtagcctgct ggaaaaaggc ggggcattac ttgctcgact cgtacagggg 2340aaatcgacgt tagtacagtc ggcggctggc gcggctgccg gagcgagttc agccgcggct 2400tatggcgcac gggcacaagg tgtcggtgtt gcatcagccg ccggggcggt aacaggggct 2460gtgggatcat ggataaataa tgctgatcgg gggattggcg gcgctattgg ggccgggagt 2520gcggtaggca ccattgatac tatgttaggg actgcctcta cccttaccca tgaagtcggg 2580gcagcggcgg gtggggcggc gggtgggatg atcaccggta cgcaagggag tactcgggca 2640ggtatccatg ccggtattgg cacctattat ggctcctgga ttggttttgg tttagatgtc 2700gctagtaacc ccgccggaca tttagcgaat tacgcagtgg gttatgccgc tggtttgggt 2760gctgaaatgg ctgtcaacag aataatgggt ggtggatttt tgagtaggct cttaggccgg 2820gttgtcagcc catatgccgc cggtttagcc agacaattag tacatttcag tgtcgccaga 2880cctgtctttg agccgatatt tagtgttctc ggcgggcttg tcggtggtat tggaactggc 2940ctgcacagag tgatgggaag agagagttgg atttccagag cgttaagtgc tgccggtagt 3000ggtatagatc atgtcgctgg catgattggt aatcagatca gaggcagggt cttgaccaca 3060accgggatcg ctaatgcgat agactatggc accagtgctg tgggagccgc acgacgagtt 3120ttttctttgt aa 3132<210>45<211>2748<212>DNA<2l3>光杆状菌W14菌株<400>45atgagcagtt acaattctgc aattgaccaa aagaccccct cgattaaggt attagataac60
aggaaattaa atgtacgtac tttagaatat ctacgcactc aagctgacga aaacagtgat120gaattaatta cgttctatga gttcaatatt ccgggatttc aggtaaaaag caccgatcct180cgtaaaaata aaaaccagag cggcccaaat ttcattcgtg tctttaatct tgccggtcaa240gttttacgtg aagaaagtgt tgatgccggt cggactatta ccctcaatga tattgaaagt300cgcccggtgt tgatcatcaa tgcaaccggt gtccgccaaa accatcgtta tgaagataac360acccttcccg gtcgtctgct cgctatcacc gaacaagtac aggcaggaga gaaaacgacc420gaacgtctta tctgggccgg caatacgccg caagaaaaag attacaacct cgccggtcag480tgtgtccgcc attacgatac cgcgggactt actcaactca atagcctttc tctggctggc540gtcgtgctat cacaatctca gcaactactc gtcgatgata aaaatgctga ctggacaggt600gaagaccaaa gcctctggca gcaaaaactg agcagtgatg tctataccac ccaaaataaa660gccgatgcca ccggggcttt attgacccag accgatgcca aaggcaacat ccagcgtctg720gcctacgacg tagccgggca gctaaaaggc tgttggttga cactcaaagg tcaggccgag780caagtgatta tcaaatcgct gacctactcc gccgccggac aaaaattacg cgaagagcac840ggtaacgggg ttatcactga atacagctat gaaccagaaa cccaacggct tatcggtatt900gccacccgcc gtccgtcaga cgccaaagtg ttgcaagact tacgctatca atatgacccg960gtaggcaatg tgatcaatat ccgtaatgat gcggaagcca cccgcttttg gcgcaatcag 1020aaagtggtcc cggagaatag ctatacctac gactccctgt atcagcttat cagtgccacc 1080gggcgggaaa tggctaatat aggtcagcaa aataaccaac tgccctcccc tgcgctacct 1140tctgacaaca atacctacac taactatact cgcagctaca gctatgatca cagtggtaat 1200ctgacgcaaa ttcggcacag ctcgccagct acccagaaca actacaccgt ggctatcacc 1260ctctcaaacc gcagcaatcg gggtgttctc agtacgctaa ccaccgatcc aaatcaagtg 1320gatacgttgt ttgatgccgg tggtcaccaa accagtttat tacccggaca gacacttatc 1380
tggacaccac gaggagagtt aaagcaggtt aataatggcc cgggaaatga gtggtaccgc 1440tacgacagca acggcatgag acaactgaaa gtgagtgaac agccaaccca gaatactacg 1500cagcaacaac gggtaatcta tttgccggga ctggagctac gcacaaccca gagcaacgcc 1560acaacaacgg aagagttaca cgttatcaca ctcggtgaag ccggtcgcgc acaggtacgg 1620gtgttgcact gggagagcgg taagccagaa gatgtcaaca ataatcaact acgttacagc 1680tacgataatc tgatcggctc cagccagctt gaactggaca accaaggaca aattatcagc 1740gaggaagagt attatccatt tggcgggaca gcgctgtggg cagcaaacag ccaaacagaa 1800gccagctata aaacgattcg ctattccggc aaagaacgag atgccaccgg gttgtattat 1860tacggttatc gttattacca accgtgggcg ggcagatggt taagcgcgga cccggcagga 1920accattgatg ggctgaatct ataccgaatg gtaagaaata atcctgtgag tttacaagat 1980gaaaatggat tagcgccaga aaaagggaaa tataccaaag aggtaaattt ctttgatgaa 2040ttaaaattca aattggcagc caaaagttca catgttgtca aatggaacga gaaagagagc 2100agttatacaa aaaataaatc attgaaagtg gttcgtgtcg gtgattccga tccgtcgggt 2160tatttgctaa gccacgaaga gttactaaaa ggtatagaaa aaagtcaaat catatatagc 2220cgacttgaag aaaacagctc cctttcagaa aaatcaaaaa cgaatctttc tttaggatct 2280gaaatatccg gttatatggc aagaaccata caagatacga tatcagaata tgccgaagag 2340cataaatata gaagtaatca ccctgatttt tattcagaaa ccgatttctt tgcgttaatg 2400gataaaagtg aaaaaaatga ttattccggt gaaagaaaaa tttatgcggc aatggaggtt 2460aaggtttatc atgatttaaa aaataaacaa tcagaattac atgtcaacta tgcattggcc 2520catccctata cgcaattgag taatgaagaa agagcgctgt tgcaagaaac agaacccgct 2580attgcaatag atagagaata taatttcaaa ggtgttggca aattcctgac aatgaaagca 2640attaaaaaat cattgaaagg acataaaatt aataggatat caacagaggc tattaatatt 2700
cgctctgcgg ctatcgctga gaatttagga atgcggagaa cttcataa2748<210>46<211>2883<212>DNA<213>光杆状菌W14菌株<400>46atgaaaaaca ttgatcccaa actttatcaa aaaaccccta ctgtcagcgt ttacgataac60cgtggtctga taatccgtaa catcgatttt catcgtacta ccgcaaatgg tgatcccgat 120acccgtatta cccgccatca atacgatatt cacggacacc taaatcaaag catcgatccg 180cgcctatatg aagccaagca aaccaacaat acgatcaaac ccaattttct ttggcagtat 240gatttgaccg gtaatcccct atgtacagag agcattgatg caggtcgcac tgtcaccttg 300aatgatattg aaggccgtcc gctactaacg gtgactgcaa caggggttat acaaactcga 360caatatgaaa cttcttccct gcccggtcgt ctgttatctg ttgccgaaca aacacccgag 420gaaaaaacat cccgtatcac cgaacgcctg atttgggctg gcaataccga agcagagaaa 480gaccataacc ttgccggcca gtgcgtgcgt cactatgaca cggcgggagt tacccggtta 540gagagtttat cactgaccgg tactgtttta tctcaatcca gccaactatt gatcgacact 600caagaggcaa actggacagg tgataacgaa accgtctggc aaaacatgct ggctgatgac 660atctacacaa ccctgagcac cttcgatgcc accggtgctt tactgactca gaccgatgcg 720aaagggaaca ttcagagact ggcttatgat gtggccgggc agctaaacgg gagctggcta 780acactcaaag gccagacgga acaagtgatt atcaaatccc tgacctactc cgccgccgga 840caaaaattac gtgaggaaca cggcaatgat gttatcaccg aatacagtta tgaaccggaa 900acccaacggc tgatcggtat caaaacccgc cgtccgtcag acactaaagt gctacaagac 960ctgcgctatg aatatgaccc ggtaggcaat gtcatcagca tccgtaatga cgcggaagcc 1020
acccgctttt ggcacaatca gaaagtgatg ccggaaaaca cttataccta cgattccctg 1080tatcagctta tcagcgccac cgggcgcgaa atggcgaata taggtcaaca aagtcaccaa 1140tttccctcac ccgctctacc ttctgataac aacacctata ccaactatac ccgtacttat 1200acttatgacc gtggcggcaa tctgaccaaa atccagcaca gttcaccggc gacgcaaaac 1260aactacacca ccaatatcac ggtttcaaat cgcagcaacc gcgcagtact cagcacattg 1320accgaagatc cggcgcaagt agatgctttg tttgatgcag gcggacatca gaacaccttg 1380atatcaggac aaaacctgaa ctggaatact cgtggtgaac tgcaacaagt aacactggtt l440aaacgggaca agggcgccaa tgatgatcgg gaatggtatc gttatagcgg tgacggaaga 1500aggatgttaa aaatcaatga acagcaggcc agcaacaacg ctcaaacaca acgtgtgact 1560tatttgccga acttagaact tcgtctaaca caaaacagca cggccacaac cgaagatttg 1620caagttatca ccgtaggcga agcgggccgg gcacaggtac gagtattaca ttgggagagc 1680ggtaaaccgg aagatatcga caataatcag ttgcgttata gttacgataa tcttatcggt 1740tccagtcaac ttgaattaga tagcgaagga caaattatca gtgaagaaga atattatccc 1800tatggtggaa cagcattatg ggccgccagg aatcagacag aagccagtta taaaactatc 1860cgttattcag gcaaagagcg ggatgccacc gggctatatt actacggcta tcggtattac 1920caaccgtgga taggacggtg gttaagctcc gatccggcag gaacaatcga tgggctgaat 1980ttatatcgga tggtgaggaa taatccagtt accctccttg atcctgatgg attaatgcca 2040acaattgcag aacgcatagc agcactaaaa aaaaataaag taacagactc agcgccttcg 2100ccagcaaatg ccacaaacgt agcgataaac atccgcccgc ctgtagcacc aaaacctagc 2160ttaccgaaag catcaacgag tagccaacca accacacacc ctatcggagc tgcaaacata 2220aaaccaacga cgtctgggtc atctattgtt gctccattga gtccagtagg aaataaatct 2280acttctgaaa tctctctgcc agaaagcgct caaagcagtt cttcaagcac tacctcgaca 2340
aatctacaga aaaaatcatt tactttatat agagcagata acagatcctt tgaagaaatg 2400caaagtaaat tccctgaagg atttaaagcc tggactcctc tagacactaa gatggcaagg 2460caatttgcta gtatctttat tggtcagaaa gatacatcta atttacctaa agaaacagtc 2520aagaacataa gcacatgggg agcaaagcca aaactaaaag atctctcaaa ttacataaaa 2580tataccaagg acaaatctac agtatgggtt tctactgcaa ttaatactga agcaggtgga 2640caaagctcag gggctccact ccataaaatt gatatggatc tctacgagtt tgccattgat 2700ggacaaaaac taaatccact accggagggt agaactaaaa acatggtacc ttccctttta 2760ctcgacaccc cacaaataga gacatcatcc atcattgcac ttaatcatgg accggtaaat 2820gatgcagaaa tttcatttct gacaacaatt ccgcttaaaa atgtaaaacc tcataagaga 2880taa2883<210>47<211>2850<212>DNA<213>光杆状菌W14菌株<400>47atgaaaaaca ttgacccaaa actttatcaa catacgccca ccgttaacgt ctacgataac60cgtggcctga ccattcgtaa catcgacttt caccgtgacg tcgcgggagg cgatacagat 120actcgtatta cccgccacca atatgatacc cgaggacact tgagccaaag cattgatcca 180cggctgtatg acgccaaaca aaccaataac tcgacaaacc ccaacttcct ctggcaatac 240aatctcaccg gcgacacttt gcggacagaa agtgtcgatg ccggccgtac cgtagccctc 300aatgatattg aaggccgtca agtgttgatt gtaaccgcaa ccggcgccat tcagacccga 360caatatgaag ccaataccct gcccggtcgt ctattatccg taagtgaaca agcccccgga 420gaacagactc cccgcgttac tgagcatttt atttgggctg gtaatacaca ggcggagaaa 480gatcataatc ttgccggcca gtatgtgcgc cactacgaca cagcaggagt gacgcaactg 540
gaaagcctgt cattgacaga aaacatctta tctcaatccc gtcagttatt agccgacggt600caggaagcag actggacagg taacgatgaa accctctggc agaccaaact caatagcgaa660acttacacga cacaaagcac ctttgatgct accggcgctt tgctgaccca aaccgatgca720aaaggcaaca tgcaacgtct ggcttacaac gtggcaggac aattacaagg tagctggctg780acattgaaaa accaaagtga gcaagtcatt gtcaaatccc tgacctattc cgccgcaggc840cagaaattgc gtgaagaaca cggtaatggc gttatcactg aatacagcta tgaaccggaa900actctacgat tgatcggtac cactactcgc cgtcaatcag atagcaaggt gttacaagat960ctacgctatg aacatgatcc tgtagggaat attattagtg tccgtaatga tgcagaagcc 1020acccgcttct ggcgcaatca gaaaatagtc cctgaaaata cctacaccta cgattccctg 1080tatcagctta tcagtgcaac aggacgtgag atggctaaca tcggccagca aagcaaccaa 1140cttccttcgc caatcatccc tcttcctact gatgaaaact catataccaa ctatactcgc 1200agctataatt acgatcgcgg cggcaatttg gttcaaatcc ggcacagttc ccccgccgcc 1260caaaataact acaccacaga tatcaccgtt tcgaatcgca gtaaccgggc agtgctgagt 1320tcgctaacct cagacccaac acaggtggag gcactgtttg atgccggcgg acatcaaaca 1380aaattgttac cggggcaaga gctgagttgg aatacacgag gtgaactaaa acaggtaacg 1440ccagtcagtc gcgagagcgc cagcgatcgg gaatggtatc gttacggcaa cgacggcatg 1500cgacggttaa aagtcagtga gcaacagact ggcaacagca cgcagcagca acgagtaact 1560tatcttcccg atctggagct acgtacaaca caaaatggga ctactacatc agaagacctg 1620catgctatta ccgtgggagc agcaggccac gcacaagtgc gagttctaca ctgggaaact 1680acgccaccag ccggtatcaa taacaatcag cttcgctata gctatgataa tttgattggt 1740tccagtcaac ttgaactgga taacgcagga caaattatca gtcaggaaga gtattatcca 1800tttggcggca cagcattatg ggcagcaaga aaccaaatag aagccagcta caaaatcctc 1860
cgttactcag gtaaagaacg cgatgctacc gggctctatt attacggcta ccgctattat 1920cagccgtggg ttggtaggtg gttaagcgcc gatccggctg gaacaatcga tggactgaat 1980ctataccgga tggtgagaaa taatccgtca acactggttg atatttctgg gcttgcacct 2040acgaaataca atattcccgg atttgacttt gatgtagaaa tagatgagca aaaaagatct 2100aaattaaaac caacgttgat aagaatcaaa gatgaatttt tacattatgg tcctgtagat 2160aagctgttag aagaaaaaaa acccggcctc aatgtaccag aggagctatt tgatagaggt 2220ccatccgaga atggagtgtc aacattaact ttcaaaaaag acctaccgat aagttgtatt 2280agcaacacag aatataccct tgatatctta tacaacaaac atgagactaa accattccct 2340tacgaaaacg aagcaacagt tggcgcagat ctgggagtaa taatgtccgt ggagtttgga 2400aataaatcaa taggtaatgc ctctgacgaa gatttaaaag aagaacatct cccattagga 2460aaatccacaa tggataaaac agacctgcca gatttaaaac aagggctaat gatcgcggag 2520aagataaaaa gtggaaaagg ggcatatcct tttcattttg gtgctgcaat agctgttgta 2580tatggtgagg ataaaaaagt agccgcttca attctgacag atttatctga acctaaaaga 2640gacgaaggcg agtatttgca aagtacgaga aaggtaagcg caatgtttat cacaaacgtc 2700aatgaatttc gcggccatga ttacccaaaa agtaaatata gtatcggatt agttacagct 2760gaaaaacgtc agccagtaat aagcaaaaaa cgtgcaaacc cggaagaggc cccttcatca 2820tccagaaata aaaaattgca tgtacattaa 2850<210>48<211>2817<212>DNA<213>光杆状菌W14菌株<400>48atggaaaaca ttgacccaaa actttatcac catacgccta ccgtcagtgt tcacgataac60
cgtggactag ctatccgtaa tattagtttt caccgcacta ccgcagaagc aaataccgat120acccgtatta cccgccatca atataatgcc ggcggatatt tgaaccaaag cattgatcct180cgcctgtatg acgccaaaca gactaacaac gctgtacaac cgaattttat ctggcgacat240aatttgaccg gcaatatcct gcgaacagag agcgtcgatg ccggtcggac gattaccctc300aacgatattg aaggccgccc ggtgttgacc atcaatgcag ccggtgtccg gcaaaaccat360cgctacgaag ataacaccct gcccggtcgc ctgctcgcta tcagcgaaca aggacaggca420gaagagaaaa cgaccgagcg ccttatctgg gccggcaata cgccgcaaga aaaagaccac480aaccttgccg gtcagtgcgt ccgccattac gataccgcag gactcactca actcaacagc540cttgccctga ccggcgccgt tctatcacaa tctcaacaac tgcttaccga taaccaggat600gccgactgga caggtgaaga ccagagcctc tggcaacaaa aactgagtag tgatgtctat660atcacccaaa gtaacactga tgccaccggg gctttactga cccagaccga tgccaaaggc720aacattcagc ggctggccta tgatgtggcc gggcagctaa aagggagttg gttaacactc780aaaggtcagg cggaacaggt gattatcaaa tcgctaacct actccgccgc cgggcaaaaa840ttacgtgaag agcacggtaa cgggattgtc actgaataca gctacgaacc ggaaacccaa900cggcttatcg gcattaccac tcgccgtcca tcagacgcca aggtgttgca agacctacgc960tatcaatatg acccagtagg caatgtcatt agtatccgta atgatgcgga agccactcgc 1020ttttggcgca atcagaaagt agccccggag aatagctata cctacgattc cctgtatcag 1080cttatcagcg ccaccgggcg cgagatggcc aatatcggtc agcaaagcaa ccaacttccc 1140tctccggcgc taccttctga taacaatacc tacaccaact atactcgcac ttatacttat 1200gaccgtggcg gcaatttgac gaaaattcag catagttcac cagccgcgca aaataactac 1260acgacggata taacggtttc aaatcgcagc aaccgcgcgg tactcagcac attgaccgca 1320gatccaactc aagtcgatgc cttatttgat gcgggaggcc atcaaaccag cttgttatcc 1380
ggccaagttc taacttggac accgcgaggc gaattgaaac aagccaacaa tagcgcagga 1440aatgagtggt atcgctacga tagcaacggc atacgccagc taaaagtgaa tgaacaacaa 1500actcagaata tcccgcaaca acaaagggta acttatctac cggggctgga aatacgtaca 1560acccagaaca acgccacaac aacagaagag ttacacgtta tcacactcgg taaagccggc 1620cgcgcgcaag tccgagtatt gcattgggag agcggtaaac cagaagatat taataacaat 1680cagcttcgtt acagctacga taatcttatt ggctccagcc aacttcaatt agatagcgac 1740ggacaaatta tcagtgaaga agaatattat ccatttggtg gtacagcgct gtgggcggca 1800aggaatcaaa ccgaagccag ctataaaacc attcgttatt ctggtaaaga gcgggatgtt 1860accgggctgt attattatgg ctaccgttat taccaaccgt gggcgggcag atggttaagt 1920gcagacccgg caggaaccat tgatggactg aatttatatc gcatggtgag aaataacccg 1980gtgacgcaat ttgatgttca gggattatca ccggccaaca gaacagaaga agcgataata 2040aaacagggtt cctttacggg aatggaagaa gctgtttata aaaaaatggc taaacctcaa 2100actttcaaac gccaaagagc tatcgctgcc caaacagagc aagaagccca tgaatcattg 2160accaacaacc ctagtgtaga tattagccca attaaaaact acaccacaga tagctcacaa 2220attaatgccg cgataaggga aaatcgtatt acgccagcag tggaaagttt agacgccaca 2280ttatcttccc tacaagatag acaaatgagg gtaacttatc gggtgatgac ctatgtagat 2340aattccacgc catcgccttg gcactcgcca caggaaggaa atagtattaa tgttggtgat 2400atcgtttcgg ataacgctta tttatcaaca tcggcccatc gtggttttct gaattttgtt 2460cacaaaaaag aaaccagtga aactcgatac gtcaagatgg catttttaac gaatgcgggt 2520gtcaatgtct cagcagcatc tatgtataat aatgctggcg aggagcaagt atttaaaatg 2580gatttaaacg attcaagaaa aagccttgct gaaaaattaa aactaagagt cagtggacca 2640caatcgggac aagcggaaat attactacct agggaaacac agttcgaagt tgtttcaatg 2700
aaacatcaag gcagagatac ctatgtatta ttgcaagata ttaaccaatc cgcagccact 2760catagaaatg tacgtaacac ttacaccggt aatttcaaat catccagtgc aaattaa 2817<210>49<211>2538<212>PRT<213>嗜线虫致病杆菌Xenorhabdus nematophilus)<400>49Met Tyr Ser Thr Ala Val Leu Leu Asn Lys Ile Ser Pro Thr Arg Asp1 5 10 15Gly Gln Thr Met Thr Leu Ala Asp Leu Gln Tyr Leu Ser Phe Ser Glu20 25 30Leu Arg Lys Ile Phe Asp Asp Gln Leu Ser Trp Gly Glu Ala Arg His35 40 45Leu Tyr His Glu Thr Ile Glu Gln Lys Lys Asn Asn Arg Leu Leu Glu50 55 60Ala Arg Ile Phe Thr Arg Ala Asn Pro Gln Leu Ser Gly Ala Ile Arg65 70 75 80Leu Gly Ile Glu Arg Asp Ser Val Ser Arg Ser Tyr Asp Glu Met Phe85 90 95Gly Ala Arg Ser Ser Ser Phe Val Lys Pro Gly Ser Val Ala Ser Met100 105 110Phe Ser Pro Ala Gly Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Lys Asp115 120 125
Leu His Phe Ser Ser Ser Ala Tyr His Leu Asp Asn Arg Arg Pro Asp130 135 140Leu Ala Asp Leu Thr Leu Ser Gln Ser Asn Met Asp Thr Glu Ile Ser145 150 155 160Thr Leu Thr Leu Ser Asn Glu Leu Leu Leu Glu His Ile Thr Arg Lys165 170 175Thr Gly Gly Asp Ser Asp Ala Leu Met Glu Ser Leu Ser Thr Tyr Arg180 185 190Gln Ala Ile Asp Thr Pro Tyr His Gln Pro Tyr Glu Thr Ile Arg Gln195 200 205Val Ile Met Thr His Asp Ser Thr Leu Ser Ala Leu Ser Arg Asn Pro210 215 220Glu Val Met Gly Gln Ala Glu Gly Ala Ser Leu Leu Ala Ile Leu Ala225 230 235 240Asn Ile Ser Pro Glu Leu Tyr Asn Ile Leu Thr Glu Glu Ile Thr Glu245 250 255Lys Asn Ala Asp Ala Leu Phe Ala Gln Asn Phe Ser Glu Asn Ile Thr260 265 270Pro Glu Asn Phe Ala Ser Gln Ser Trp Ile Ala Lys Tyr Tyr Gly Leu275 280 285Glu Leu Ser Glu Val Gln Lys Tyr Leu Gly Met Leu Gln Asn Gly Tyr290 295 300
Ser Asp Ser Thr Ser Ala Tyr Va1 Asp Asn Ile Ser Thr Gly Leu Val305 310 315 320Val Asn Asn Glu Ser Lys Leu Glu Ala Tyr Lys Ile Thr Arg Val Lys325 330 335Thr Asp Asp Tyr Asp Lys Asn Ile Asn Tyr Phe Asp Leu Met Tyr Glu340 345 350Gly Asn Asn Gln Phe Phe Ile Arg Ala Asn Phe Lys Val Ser Arg Glu355 360 365Phe Gly Ala Thr Leu Arg Lys Asn Ala Gly Pro Ser Gly Ile Val Gly370 375 380Ser Leu Ser Gly Pro Leu Ile Ala Asn Thr Asn Phe Lys Ser Asn Tyr385 390 395 400Leu Ser Asn Ile Ser Asp Ser Glu Tyr Lys Asn Gly Val Lys Ile Tyr405 410 415Ala Tyr Arg Tyr Thr Ser Ser Thr Ser Ala Thr Asn Gln Gly Gly Gly420 425 430Ile Phe Thr Phe Glu Ser Tyr Pro Leu Thr Ile Phe Ala Leu Lys Leu435 440 445Asn Lys Ala Ile Arg Leu Cys Leu Thr Ser Gly Leu Ser Pro Asn Glu450 455 460Leu Gln Thr Ile Val Arg Ser Asp Asn Ala Gln Gly Ile Ile Asn Asp465 470 475 480
Ser Val Leu Thr Lys Val Phe Tyr Thr Leu Phe Tyr Ser His Arg Tyr485 490 495Ala Leu Ser Phe Asp Asp Ala Gln Val Leu Asn Gly Ser Val Ile Asn500 505 510Gln Tyr Ala Asp Asp Asp Ser Val Ser His Phe Asn Arg Leu Phe Asn515 520 525Thr Pro Pro Leu Lys Gly Lys ILe Phe Glu Ala Asp Gly Asn Thr Val530 535 540Ser Ile Asp Pro Asp Glu Glu Gln Ser Thr Phe Ala Arg Ser Ala Leu545 550 555 560Met Arg Gly Leu Gly Val Asn Ser Gly Glu Leu Tyr Gln Leu Gly Lys565 570 575Leu Ala Gly Val Leu Asp Ala Gln Asn Thr Ile Thr Leu Ser Val Phe580 585 590Val Ile Ser Ser Leu Tyr Arg Leu Thr Leu Leu Ala Arg Val His Gln595 600 605Leu Thr Val Asn Glu Leu Cys Met Leu Tyr Gly Leu Ser Pro Phe Asn610 615 620Gly Lys Thr Thr Ala Ser Leu Ser Ser Gly Glu Leu Pro Arg Leu Val625 630 635 640Ile Trp Leu Tyr Gln Val Thr Gln Trp Leu Thr Glu Ala Glu Ile Thr645 650 655
Thr Glu Ala Ile Trp Leu Leu Cys Thr Pro Glu Phe Ser Gly Asn Ile660 665 670Ser Pro Glu Ile Ser Asn Leu Leu Asn Asn Leu Arg Pro Ser Ile Ser675 680 685Glu Asp Met Ala Gln Ser His Asn Arg Glu Leu Gln Ala Glu Ile Leu690 695 700Ala Pro Phe Ile Ala Ala Thr Leu His Leu Ala Ser Pro Asp Met Ala705 710 715 720Arg Tyr Ile Leu Leu Trp Thr Asp Asn Leu Arg Pro Gly Gly Leu Asp725 730 735Ile Ala Gly Phe Met Thr Leu Val Leu Lys Glu Ser Leu Asn Ala Asn740 745 750Glu Thr Thr Gln Leu Val Gln Phe Cys His Val Met Ala Gln Leu Ser755 760 765Leu Ser Val Gln Thr Leu Arg Leu Ser Glu Ala Glu Leu Ser Va1 Leu770 775 780Val Ile Ser Gly Phe Ala Val Leu Gly Ala Lys Asn Gln Pro Ala Gly785 790 795 800Gln His Asn Ile Asp Thr Leu Phe Ser Leu Tyr Arg Phe His Gln Trp805 810 815Ile Asn Gly Leu Gly Asn Pro Gly Ser Asp Thr Leu Asp Met Leu Arg820 825 830
Gln Gln Thr Leu Thr Ala Asp Arg Leu Ala Ser Val Met Gly Leu Asp835 840 845Ile Ser Met Val Thr Gln Ala Met Val Ser Ala Gly Val Asn Gln Leu850 855 860Gln Cys Trp Gln Asp Ile Asn Thr Val Leu Gln Trp Ile Asp Val Ala865 870 875 880Ser Ala Leu His Thr Met Pro Ser Val Ile Arg Thr Leu Val Asn Ile885 890 895Arg Tyr Val Thr Ala Leu Asn Lys Ala Glu Ser Asn Leu Pro Ser Trp900 905 910Asp Glu Trp Gln Thr Leu Ala Glu Asn Met Glu Ala Gly Leu Ser Thr915 920 925Gln Gln Ala Gln Thr Leu Ala Asp Tyr Thr Ala Glu Arg Leu Ser Ser930 935 940Val Leu Cys Asn Trp Phe Leu Ala Asn Ile Gln Pro Glu Gly Val Ser945 950 955 960Leu His Ser Arg Asp Asp Leu Tyr Ser Tyr Phe Leu Ile Asp Asn Gln965 970 975Val Ser Ser Ala Ile Lys Thr Thr Arg Leu Ala Glu Ala Ile Ala Gly980 985 990Ile Gln Leu Tyr Ile Asn Arg Ala Leu Asn Arg Ile Glu Pro Asn Ala995 10001005
Arg Ala Asp Val Ser Thr Arg Gln Phe Phe Thr Asp Trp Thr Val101010151020Asn Asn Arg Tyr Ser Thr Trp Gly Gly Val Ser Arg Leu Val Tyr102510301035Tyr Pro Glu Asn Tyr Ile Asp Pro Thr Gln Arg Ile Gly Gln Thr104010451050Arg Met Met Asp Glu Leu Leu Glu Asn Ile Ser Gln Ser Lys Leu105510601065Ser Arg Asp Thr Val Glu Asp Ala Phe Lys Thr Tyr Leu Thr Arg1070 10751080Phe Glu Thr Val Ala Asp Leu Lys Val Val Ser Ala Tyr His Asp108510901095Asn Val Asn Ser Asn Thr Gly Leu Thr Trp Phe Val Gly Gln Thr110011051110Arg Glu Asn Leu Pro Glu Tyr Tyr Trp Arg Asn Val Asp Ile Ser111511201125Arg Met Gln Ala Gly Glu Leu Ala Ala Asn Ala Trp Lys Glu Trp113011351140Thr Lys Ile Asp Thr Ala Va1 Asn Pro Tyr Lys Asp Ala Ile Arg114511501155Pro Val Ile Phe Arg Glu Arg Leu His Leu Ile Trp Val Glu Lys116011651170
Glu Glu Val Ala Lys Asn Gly Thr Asp Pro Val Glu Thr Tyr Asp117511801185Arg Phe Thr Leu Lys Leu Ala Phe Leu Arg His Asp Gly Ser Trp119011951200Ser Ala Pro Trp Ser Tyr Asp Ile Thr Thr Gln Val Glu Ala Val120512101215Thr Asp Lys Lys Pro Asp Thr Glu Arg Leu Ala Leu Ala Ala Ser122012251230Gly Phe Gln Gly Glu Asp Thr Leu Leu Val Phe Val Tyr Lys Thr123512401245Gly Lys Ser Tyr Ser Asp Phe Gly Gly Ser Asn Lys Asn Val Ala125012551260Gly Met Thr Ile Tyr Gly Asp Gly Ser Phe Lys Lys Met Glu Asn126512701275Thr Ala Leu Ser Arg Tyr Ser Gln Leu Lys Asn Thr Phe Asp Ile128012851290Ile His Thr Gln Gly Asn Asp Leu Val Arg Lys Ala Ser Tyr Arg129513001305Phe Ala Gln Asp Phe Glu Val Pro Ala Ser Leu Asn Met Gly Ser131013151320Ala Ile Gly Asp Asp Ser Leu Thr Val Met Glu Asn Gly Asn Ile132513301335
Pro Gln Ile Thr Ser Lys Tyr Ser Ser Asp Asn Leu Ala Ile Thr134013451350Leu His Asn Ala Ala Phe Thr Val Arg Tyr Asp Gly Ser Gly Asn1355l3601365Val Ile Arg Asn Lys Gln Ile Ser Ala Met Lys Leu Thr Gly Val137013751380Asp Gly Lys Ser Gln Tyr Gly Asn Ala Phe Ile Ile Ala Asn Thr138513901395Val Lys His Tyr Gly Gly Tyr Ser Asp Leu Gly Gly Pro Ile Thr140014051410Val Tyr Asn Lys Thr Lys Asn Tyr Ile Ala Ser Val Gln Gly His141514201425Leu Met Asn Ala Asp Tyr Thr Arg Arg Leu Ile Leu Thr Pro Val143014351440Glu Asn Asn Tyr Tyr Ala Arg Leu Phe Glu Phe Pro Phe Ser Pro144514501455Asn Thr Ile Leu Asn Thr Val Phe Thr Val Gly Ser Asn Lys Thr146014651470Ser Asp Phe Lys Lys Cys Ser Tyr Ala Val Asp Gly Asn Asn Ser147514801485Gln Gly Phe Gln Ile Phe Ser Ser Tyr Gln Ser Ser Gly Trp Leu149014951500
Asp Ile Asp Thr Gly Ile Asn Asn Thr Asp Ile Lys Ile Thr Val150515101515Met Ala Gly Ser Lys Thr His Thr Phe Thr Ala Ser Asp His Ile152015251530Ala Ser Leu Pro Ala Asn Ser Phe Asp Ala Met Pro Tyr Thr Phe153515401545Lys Pro Leu Glu Ile Asp Ala Ser Ser Leu Ala Phe Thr Asn Asn155015551560Ile Ala Pro Leu Asp Ile Val Phe Glu Thr Lys Ala Lys Asp Gly156515701575Arg Val Leu Gly Lys Ile Lys Gln Thr Leu Ser Val Lys Arg Val158015851590Asn Tyr Asn Pro Glu Asp Ile Leu Phe Leu Arg Glu ThrHis Ser159516001605Gly Ala Gln Tyr Met Gln Leu Gly Val Tyr Arg Ile ArgLeu Asn161016151620Thr Leu Leu Ala Ser Gln Leu Val Ser Arg Ala Asn Thr Gly Ile162516301635Asp Thr Ile Leu Thr Met Glu Thr Gln Arg Leu Pro Glu Pro Pro164016451650Leu Gly Glu Gly Phe Phe Ala Asn Phe Val Leu Pro Lys Tyr Asp165516601665
Pro Ala Glu His Gly Asp Glu Arg Trp Phe Lys Ile His Ile Gly167016751680Asn Val Gly Gly Asn Thr Gly Arg Gln Pro Tyr Tyr Ser Gly Met168516901695Leu Ser Asp Thr Ser Glu Thr Ser Met Thr Leu Phe Val Pro Tyr170017051710Ala Glu Gly Tyr Tyr Met His Glu Gly Val Arg Leu Gly Val Gly171517201725Tyr Gln Lys Ile Thr Tyr Asp Asn Thr Trp Glu Ser Ala Phe Phe173017351740Tyr Phe Asp Glu Thr Lys Gln Gln Phe Val Leu Ile Asn Asp Ala174517501755Asp His Asp Ser Gly Met Thr Gln Gln Gly Ile Val Lys Asn Ile176017651770Lys Lys Tyr Lys Gly Phe Leu Asn Val Ser Ile Ala Thr Gly Tyr177517801785Ser Ala Pro Met Asp Phe Asn Ser Ala Ser Ala Leu Tyr Tyr Trp179017951800Glu Leu Phe Tyr Tyr Thr Pro Met Met Cys Phe Gln Arg Leu Leu180518101815Gln Glu Lys Gln Phe Asp Glu Ala Thr Gln Trp Ile Asn Tyr Val182018251830
Tyr Asn Pro Ala Gly Tyr Ile Val Asn Gly Glu Ile Ala Pro Trp183518401845Ile Trp Asn Cys Arg Pro Leu Glu GLu Thr Thr Ser Trp Asn Ala185018551860Asn Pro Leu Asp Ala Ile Asp Pro Asp Ala Val Ala Gln Asn Asp186518701875Pro Met His Tyr Lys Ile Ala Thr Phe Met Arg Leu Leu Asp Gln188018851890Leu Ile Leu Arg Gly Asp Met Ala Tyr Arg Glu Leu Thr Arg Asp189519001905Ala Leu Asn Glu Ala Lys Met Trp Tyr Val Arg Thr Leu Glu Leu191019151920Leu Gly Asp Glu Pro Glu Asp Tyr Gly Ser Gln Gln Trp Ala Alal92519301935Pro Ser Leu Ser Gly Ala Ala Ser Gln Thr Val Gln Ala Ala Tyr194019451950Gln Gln Asp Leu Thr Met Leu Gly Arg Gly Gly Val Ser Lys Asn195519601965Leu Arg Thr Ala Asn Ser Leu Val Gly Leu Phe Leu Pro Glu Tyr197019751980Asn Pro Ala Leu Thr Asp Tyr Trp Gln Thr Leu Arg Leu Arg Leu198519901995
Phe Asn Leu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Ser200020052010Leu Ala Ile Tyr Ala Glu Pro Thr Asp Pro Lys Ala Leu Leu Thr201520202025Ser Met Val Gln Ala Ser Gln Gly Gly Ser Ala Val Leu Pro Gly203020352040Thr Leu Ser Leu Tyr Arg Phe Pro Val Met Leu Glu Arg Thr Arg204520502055Asn Leu Val Ala Gln Leu Thr Gln Phe Gly Thr Ser Leu Leu Ser206020652070Met Ala Glu His Asp Asp Ala Asp Glu Leu Thr Thr Leu Leu Leu207520802085Gln Gln Gly Met Glu Leu Ala Thr Gln Ser Ile Arg Ile Gln Gln209020952100Arg Thr Val Asp Glu Val Asp Ala Asp Ile Ala Val Leu Ala Glu210521102115Ser Arg Arg Ser Ala Gln Asn Arg Leu Glu Lys Tyr Gln Gln Leu21202l252130Tyr Asp Glu Asp Ile Asn His Gly Glu Gln Arg Ala Met Ser Leu213521402145Leu Asp Ala Ala Ala Gly Gln Ser Leu Ala Gly Gln Val Leu Ser215021552160
Ile Ala Glu Gly Val Ala Asp Leu Val Pro Asn Val Phe Gly Leu216521702175Ala Cys Gly Gly Ser Arg Trp Gly Ala Ala Leu Arg Ala Ser Ala218021852190Ser Val Met Ser Leu Ser Ala Thr Ala Ser Gln Tyr Ser Ala Asp219522002205Lys Ile Ser Arg Ser Glu Ala Tyr Arg Arg Arg Arg Gln Glu Trp221022152220Glu Ile Gln Arg Asp Asn Ala Asp Gly Glu Val Lys Gln Met Asp222522302235Ala Gln Leu Glu Ser Leu Lys Ile Arg Arg Glu Ala Ala Gln Met224022452250Gln Val Glu Tyr Gln Glu Thr Gln Gln Ala His Thr Gln Ala Gln225522602265Leu Glu Leu Leu Gln Arg Lys Phe Thr Asn Lys Ala Leu Tyr Ser227022752280Trp Met Arg Gly Lys Leu Ser Ala Ile Tyr Tyr Gln Phe Phe Asp228522902295Leu Thr Gln Ser Phe Cys Leu Met Ala Gln Glu Ala Leu Arg Arg23002305 2310Glu Leu Thr Asp Asn Gly Val Thr Phe Ile Arg Gly Gly Ala Trp231523202325
Asn Gly Thr Thr Ala Gly Leu Met Ala Gly Glu Thr Leu Leu Leu233023352340Asn Leu Ala Glu Met Glu Lys Val Trp Leu Glu Arg Asp Glu Arg234523502355Ala Leu Glu Val Thr Arg Thr Val Ser Leu Ala Gln Phe Tyr Gln236023652370Ala Leu Ser Ser Asp Asn Phe Asn Leu Thr Glu Lys Leu Thr Gln237523802385Phe Leu Arg Glu Gly Lys Gly Asn Val Gly Ala Ser Gly Asn Glu239023952400Leu Lys Leu Ser Asn Arg Gln Ile Glu Ala Ser Val Arg Leu Ser240524102415Asp Leu Lys Ile Phe Ser Asp Tyr Pro Glu Ser Leu Gly Asn Thr242024252430Arg Gln Leu Lys Gln Val Ser Va1 Thr Leu Pro Ala Leu Val Gly243524402445Pro Tyr Glu Asp Ile Arg Ala Val Leu Asn Tyr Gly Gly Ser Ile245024552460Val Met Pro Arg Gly Cys Ser Ala Ile Ala Leu Ser His Gly Val246524702475Asn Asp Ser Gly Gln Phe Met Leu Asp Phe Asn Asp Ser Arg Tyr248024852490
Leu Pro Phe Glu Gly Ile Ser Val Asn Asp Ser Gly Ser Leu Thr249525002505Leu Ser Phe Pro Asp Ala Thr Asp Arg Gln Lys Ala Leu Leu Glu251025152520Ser Leu Ser Asp Ile Ile Leu His Ile Arg Tyr Thr Ile Arg Ser25252530253权利要求
1.筛选类芽孢杆菌(paenibacillus)分离株培养物用于编码选自对鳞翅目害虫有毒性的Cry蛋白及毒素复合体蛋白的基因的方法，其中所述方法包括至少一个以下步骤(a)自所述培养物获得DNA并分析所述DNA中所述基因的存在；及(b)获得由所述培养物产生的蛋白质并分析所述蛋白质是否存在表明在所述分离株中存在所述基因的蛋白质。
2.筛选类芽孢杆菌分离株培养物抗鳞翅目害虫的具有毒素活性蛋白质的方法，其中所述方法包括至少一个以下步骤(a)获得由所述培养物产生的培养液并分析所述培养液抗鳞翅目害虫的毒素活性；及(b)将多种所述分离株喂饲鳞翅目害虫，并观察毒素对所述害虫的作用。
3.权利要求1的方法，其中所述方法包括筛选一群类芽孢杆菌分离株的所述蛋白质，且所述分离株在所述群体中。
4.权利要求1的方法，其中所述蛋白质为毒素复合体蛋白。
5.权利要求4的方法，其中所述蛋白质增强毒素复合体毒素蛋白质的活性。
6.权利要求1的方法，其中所述蛋白质为对鳞翅目害虫有毒性的Cry蛋白。
7.权利要求1的方法，其中自所述培养物获得DNA的所述步骤包括产生来自所述DNA的克隆文库并分析至少一个所述克隆是否存在所述基因。
8.权利要求7的方法，其中用于分析所述克隆存在所述多核苷酸的所述步骤包括分析所述克隆对鳞翅目的毒素活性，由此表明存在所述多核苷酸。
9.权利要求1的方法，其中分析所述DNA的所述步骤包括用至少一个引物进行聚合酶链反应，其中所述引物设计为用以表明存在所述基因。
10.权利要求1的方法，其中分析所述蛋白质的所述步骤包括将抗体与所述蛋白质进行免疫反应，其中所述抗体设计为用以表明存在所述蛋白质。
11.权利要求1的方法，其中分析所述DNA的所述步骤包括将核酸探针与所述DNA杂交，其中所述探针设计为用以表明存在所述基因。
12.具有抗昆虫害虫毒素活性的经分离蛋白质，其中所述蛋白质由这样的多核苷酸序列编码，所述多核苷酸序列与选自SEQ ID NO2，4，6，8，10，12，14，32，34，35，38及40的序列互补物杂交。
13.权利要求12的蛋白质，其中所述蛋白质为Cry蛋白，且所述探针为SEQ ID NO14的互补物。
14.权利要求12的蛋白质，其中所述蛋白质为毒素复合体蛋白，且所述探针为选自SEQ ID NO2，4，6，8，10，12，32，34，35，38及40的序列的互补物。
15.根据权利要求12所述蛋白质的免疫反应性片段。
16.经分离多核苷酸，其编码根据权利要求12所述的蛋白质。
17.细胞，其包含根据权利要求16所述的多核苷酸。
18.根据权利要求17所述的细胞，其中所述细胞选自植物细胞及微生物细胞。
19.控制昆虫害虫的方法，其中所述方法包括将所述害虫与蛋白质接触的步骤，其中所述蛋白质包含选自SEQ ID NO3，5，7，9，11，13，15，18，19，33，36，37，39及41的氨基酸序列。
20.权利要求1的方法，其中所述类芽孢杆菌分离株为选自蜂类芽孢杆菌(P.apiarius)、软骨素类芽孢杆菌(P.chondroitinus)、解藻酸类芽孢杆菌(P.alginolyticus)、幼虫类芽孢杆菌(P.larvae)、强壮类芽孢杆菌(P.validus)、戈氏类芽孢杆菌(P.gordonae)、蜂房类芽孢杆菌(P.alvei)、缓病类芽孢杆菌(P.lentinnorbus)、日本甲虫类芽孢杆菌(P.popilliae)、解硫胺素类芽孢杆菌(P.thiaminolyticus)、解菌多糖类芽孢杆菌(P.curdlanolyticus)、神户类芽孢杆菌(P.kobensis)、解糖类芽孢杆菌(P.glucanolyticus)、灿烂类芽孢杆菌(P.lautus)、千叶类芽孢杆菌(P.chibensis)、马阔里类芽孢杆菌(P.macquariensis)、固氮类芽孢杆菌(P.azotofixans)、皮奥利亚类芽孢杆菌(P.peoriae)、多粘类芽孢杆菌(P.polymyxa)、依利诺斯类芽孢杆菌(P.illinoisensis)、解淀粉类芽孢杆菌(P.amylolyticus)、饲料类芽孢杆菌(P.pabuli)及浸麻类芽孢杆菌(P.macerans)的种。
21.权利要求11的方法，其中所述探针衍生自选自tcaA、tcaB、tcaC、tcbA、tccA、tccB、tccC、tcdA、tcdB、xptA1、xptD1、xptB1、xptC1、xptA2、sepA、sepB及sepC的基因。
22.权利要求9的方法，其中所述引物衍生自选自tcaA、tcaB、tcaC、tcbA、tccA、tccB、tccC、tcdA、tcdB、xptA1、xptD1、xptB1、xptC1、xptA2、sepA、sepB及sepC的基因。
23.权利要求9的方法，其中所述引物选自SEQ ID NO22，23，24，25，26，27，28，29，30及31。
24.类芽孢杆菌菌株的生物学纯的培养物，其中所述类芽孢杆菌菌株选自DAS1529(可获自NRRL B-30599)及DB482(可获自NRRL B-30670)。
全文摘要
本主题发明提供了用于害虫控制的独特生物学备选物。更具体地，本发明涉及新杀虫蛋白质、杀虫蛋白质的新来源、编码此类毒素的多核苷酸及涉及用这些毒素控制昆虫及其它植物害虫的方法。本主题发明涉及类芽孢杆菌种及来自它的蛋白质对鳞翅目有毒性的令人惊讶的发现。类芽孢杆菌种、菌株或蛋白质对鳞翅目有毒性还未见已知报导。这也是第一个已知的对鳞翅目有毒性的类芽孢杆菌Cry蛋白质的实例。此外，这是类芽孢杆菌具有毒性复合体(TC)样蛋白质的首次已知报导。此处公开的DAS1529分离株也是产生Cry毒素及TC蛋白质这两者的天然细菌的首个已知实例。本发明也涉及新类型的具有杀虫活性的Cry及TC蛋白质。
文档编号C12N1/15GK1684974SQ03815337
公开日2005年10月19日申请日期2003年6月27日优先权日2002年6月28日
发明者S·B·宾特里姆, S·A·贝文, 朱宝龙, D·J·默洛申请人:美国陶氏益农公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：S.B.宾特里姆;S.A.贝文;朱宝龙;D.J.默洛
技术所有人：美国陶氏益农公司
我是此专利的发明人

上一篇：新的链霉菌属细菌PapM多肽变异体的制作方法
上一篇：发酵戊糖的发酵单胞菌菌株及其应用的制作方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.食品功能因子基因工程菌种的构建、智能高通量进化筛选 2.发酵工艺优化
2、马老师：1.酶工程与生物催化 2.酿造技术与风味分析 3.生物质资源综合利用
3、林老师：1.酿造微生物育种及关键酿造工艺开发 2. 真菌基因功能及调控网络解析 3.精细化学品、蛋白真菌细胞底盘开发
4、张老师：1.发酵食品安全：危害物相关基因的筛选，危害物产生菌的快速检测，危害物的预警和发酵过程控制 2.真菌次级代谢与调控 3.酿造酒相关研究
5、郭老师：1.现代酿造技术与食品安全 2. 酵母生物学 3.生物基化学品与合成生物学
如您是高校老师，可以点此联系我们加入专家库。