重组微生物的制作方法

文档序号:426683阅读:541来源:国知局
专利名称:重组微生物的制作方法
技术领域
本发明涉及可用于生产有用蛋白质或多肽的重组微生物,以及涉及该蛋白质和多肽。
背景技术
微生物广泛用于工业生产大量有用物质,包括酒精饮料、例如味噌和酱油之类的某些类型的食品、氨基酸、有机酸、核酸相关物质、抗生素、糖、脂质和蛋白质。这些物质还发现具有多种用途,包括食品、医药品、洗涤剂、例如化妆品之类的日用品和各种化工原料。
在利用微生物工业生产有用物质时,生产率的提高是一个主要关注点,因此一种方法是通过诱变或其它基因手段进行微生物育种。最近,特别是随着微生物遗传学和生物技术的进步,通过基因重组技术进行更有效的有用微生物育种,并与其相关地是正在开发用于获得重组基因的宿主微生物。例如,已经进一步改进了枯草杆菌Marburg No.168,其作为宿主微生物已经被证实是安全且具有优异特性的。
然而,微生物本身拥有各种基因使其能够应对自然界中的环境变化,因此,它们在只采用有限的生产媒介的工业生产中不一定表现出蛋白质和类似物质的高生产效率。

发明内容
本发明提供一种重组微生物,其通过将编码异性蛋白质或多肽的基因转移到枯草杆菌基因comA、yopO、treR、yvbA、cspB、yvaN、yttP、yurK、yozA、licR、sigL、mntR、glcT、yvdE、ykvE、slr、rocR、ccpA、yaaT、yyaA、yycH、yacP、hprK、rsiX、yhdK以及ylbO的任意一种或一个或多个与这些基因的任意一种功能相当的基因缺失或被剔除的微生物的突变株上而制备。


图1示意性地显示了通过SOE-PCR(SOE重叠延伸拼接法)(参见Gene,77,61(1989))缺失基因以制备DNA片段的方法,和使用该DNA缺失目标基因的方法(用抗药性基因取代目标基因)。
具体实施例方式
本发明针对一种通过将编码蛋白质或多肽的基因转移到能够以提高的生产率生产蛋白质或多肽的宿主微生物上而获得的重组微生物,以及针对使用该重组微生物生产蛋白质或多肽的方法。
本发明人在微生物基因组上编码的许多不同基因中对有用蛋白质或多肽的生产中不需要或有害的基因进行了广泛的研究,并发现,当特异性基因从微生物的基因组中缺失或剔除之后,编码目标蛋白质或多肽的基因转移到例如枯草杆菌之类的微生物上,与缺失或剔除之前的情况相比,目标蛋白质或多肽的生产率提高。
在本发明的微生物中,由于缺失或剔除了对目标蛋白质或多肽的生产不必要或有害的基因,因此包括能量损耗、副产物生成和单位生产率降低在内的培养基的浪费显著减少,并且此外,蛋白质和多肽可以持续生产,从而高效地生产目标产物。
在本发明中,氨基酸序列之间的同源性和核酸序列之间的同源性都使用Lipman-Pearson法(Science,227,1435(1985))测定。具体而言,将ktup参数(相匹配的单元大小)设定为2,使用Genetyx-Win(Software Development Co.,Ltd.)的遗传信息处理软件开发的同源性分析程序(Search Homology)进行计算。
对构成本发明的微生物的母体微生物没有特别的限制,只要其含有对于目标蛋白质或多肽的生产不是必需的基因。具体而言,可以使用如表1所示的任何枯草杆菌基因或与其功能相当的基因,其中基因可以是野生型或突变体。具体例子包括枯草杆菌和属于芽孢杆菌属的类似微生物、属于梭状芽胞杆菌属的微生物和酵母。其中,优选属于芽孢杆菌属的微生物。特别是从已经获得该微生物的完全基因组信息、并由此确立了基因工程技术和基因组工程技术、并且该微生物具有细胞外分泌所得蛋白质的能力的角度考虑,优选枯草杆菌。
使用本发明的微生物生产的目标蛋白质或多肽的例子包括酶、生理活性物质,和其它发现在食品、医药品、化妆品、洗涤剂、纤维处理剂、临床化验剂等有用的蛋白质和多肽。
以已知在基因组上含有4,106个基因的枯草杆菌为例,要被缺失或剔除的一个或多个基因是表1所示的任一枯草杆菌基因,或者选自与其功能相当的基因。本发明人已经发现,这些基因不会直接参与目标蛋白质或多肽的生产并且对于微生物在普通工业生产培养基中的生长不是必需的。
此处所含表中的各个基因的名称、数量和功能与Nature,390,249-256(1997)中报道并由JAFAN(Japan Functional Analysis Networkfor Bacillus subtilis;BSORF DB)在互联网上公开(http:∥bacillus.genome.ad.jp/,2003年6月17日更新)的枯草杆菌基因组数据相符。
表1


来源于其它微生物的基因,优选来源于属于芽胞杆菌属的细菌的基因,其具有与表1所示的任一枯草杆菌相同的功能,或具有与表1所示任一基因的核苷酸序列70%或更高的同源性,优选80%或更高的同源性,更优选90%或更高,进一步优选95%或更高,仍然更优选98%或更高的同源性的,应该被认为与表1所示的基因功能相当,并因此构成根据本发明要缺失或剔除的基因。在这一方面,使用Lipman-Pearson法(Science,227,1435,1985)用计算机计算核苷酸的同源性。
表1所示的编码枯草杆菌的多种基因是参与各种基因表达的活化或抑制的调节基因,或被推导成这种调节基因的基因。基于此发现实现了本发明;即,在本发明中揭示了对蛋白质或多肽的生产不必要或有害的调节基因的存在。
值得注意地是下列事实已经引起了注意,即所列的许多“不必要”或“有害”基因是参与糖摄取或代谢的调节基因,以下列基因为例glcT基因,其对葡萄糖PTS摄取操纵子起到抗终止子的作用;LicT基因,其对地衣淀粉水解操纵子起到抗终止子的作用;treR基因,其起到海藻糖摄取和代谢的阻遏物的作用;和hprk基因和ccpA基因,其关系到葡萄糖分解代谢物的阻遏。
而且,除了参与糖摄取和代谢的调节基因外,可以缺失或剔除参与激活精氨酸同化的rocR基因、和感受态相关的comA基因和slr基因,它们也是调节基因,从而提高蛋白质或多肽的生产率。
表1所示的基因包括yhdK基因,以及编码抑制ECFσ(sigma)因子表达的抗EC Fσ因子,即抗σx因子的rsiX基因。有报道yhdK参与了σM的抑制(Mol.Microbiol.,32,41,1999)。编码σL的σ基因也包括在表1的基因中。这表明,在σX或σM调节下的基因表达有利于蛋白质生产,相反,在σL调节下的一些基因表达是不利的。
通过缺失或剔除一个或多个选自上述基因的基因,可以防止对蛋白质或多肽的生产不必要的或有害的表达,从而使该蛋白质或多肽生产中的生产率提高。
要缺失或剔除的基因数为一个或更多,优选两个或更多,更优选三个或更多,甚至更优选5个或更多。当构筑本发明的微生物时,可以缺失或失活上述基因以外的一个或多个基因。在这种情况下,预计会有更好的效果。另一种实现本发明的方法是通过将另一来源的DNA片段插入到目标基因中或在该基因的转录/转译起始区域引入突变体来使目标基因失活或剔除。然而,优选物理缺失目标基因。
在缺失或剔除基因的示例性的方法中,根据之前提出的方案缺失或剔除表1所示的任一目标基因。或者,进行基因的随机缺失或通过剔除进行突变,然后对蛋白质生产率进行评测并进行基因分析。
目标基因可以通过同源重组而缺失或剔除。也就是,用合适的质粒载体克隆含有部分目标基因的DNA片段从而获得环形重组质粒,并将所得质粒转移到母体微生物的细胞中。此后,通过在目标基因的部分区域中进行同源重组,使母体微生物基因组上的目标基因裂解,从而完成目标基因的失活。或者,通过碱基的取代或插入来使目标基因剔除,或者通过PCR或类似方法构成含有目标基因序列外的区域但不含目标基因的线型DNA片段,并将由此制成的基因或片段转移到母体微生物的细胞中。在母体微生物基因组的目标基因中突变点外部的两个位点上,或在目标基因序列外的两个区域上,发生双交换同源重组,从而替换成基因组上的目标基因缺失或剔除的基因片段。
特别是当用于构筑本发明的微生物的母体微生物是枯草杆菌时,由于一些文献已经描述了缺失或剔除目标基因的方法(参见,例如,Mol.Gen.Genet.,223,268 1990),可以根据这些方法的任何一种重复,从而生产本发明的宿主微生物。
基因随机缺失或失活可以通过使用与上述通过使用随机克隆的DNA片段诱发同源重组的方法类似的方法,或通过用γ射线或类似射线辐射母体微生物而进行。
接下来将更详细地描述通过使用为缺失目的而设计的DNA片段采用双交换的缺失方法,该DNA片段是通过SOE-PCR制备的(Gene,77,61,1989)。然而,在本发明中,缺失基因的方法不仅仅限于下述方法。
用于缺失目的的DNA片段是如下构成的片段抗药标记基因在ca.0.5至3kb上游序列的侧面之间插入并且处于要缺失的基因的上游,以及抗药标记基因在ca.0.5至3kb下游序列的侧面之间插入并且处于相同基因的下游。在PCR的第一次循环中,制备下列三个片段要缺失的上游片段和下游片段,和抗药标记基因。例如,要在该步骤中使用的引物可以是专门设计的引物,以便将抗药性基因的上游10-30碱基对序列加入到上游片段的下端,以及将抗药性标记基因的下游10-30碱基对序列加入到下游片段的上端(图1)。
接下来,使用在第一次循环中制备的三个PCR片段作为模板,使用上游片段的上部引物和下游片段的下部引物进行PCR的第二次循环。该步骤导致与如上制成的抗药性基因序列中的抗药性标记基因片段退火接合,并通过PCR扩增,可以获得在上游片段和下游片段之间插有抗药性标记基因的DNA片段(图1)。
当采用抗氯霉素基因作为抗药性标记基因时,可以使用合适的DNA模板和如表2所示的引物组和传统的PCR酶试剂盒(例如PyrobestDNA聚合酶(Takara Shuzo的产品)在文献中描述的典型条件下(参见,例如,PCR Protocols.Current Methods and Applications,Edited by B.A.White,Humana Press,pp.251(1993),Gene,77,61,1989)通过SOE-PCR获得用于缺失基因的DNA片段。
当由此获得的用于实现基因缺失的DNA片段通过转化方法(competent method)或类似方法引入细胞中时,在要缺失的基因上游和下游存在的同源区域中发生细胞内基因重组。因此,其中的目标基因已经被抗药性基因取代的细胞可以通过使用抗药性标记物而选择性地分离(图1)。具体而言,当在细胞中引入通过表2所列的引物组而制备的用于基因缺失的DNA片段时,分离出在含有氯霉素的琼脂培养基上生长的菌落,并通过例如使用基因组作模板的PCR之类的合适方法来证实通过被抗氯霉素基因取代而缺失了目标基因。
随后,当将编码目标蛋白质或多肽的基因转移到表1所示的任一枯草杆菌基因或一个或多个选自与其相对应的基因的基因从中缺失或剔除的宿主突变微生物菌株上时,可以获得本发明的微生物。
对编码目标蛋白质或多肽的基因没有特别的限制。蛋白质和多肽的例子包括用于工业用途的例如洗涤剂、食品、纤维、饲料、化学品、药品和诊断用药之类的生理活性多肽和酶。工业酶从功能上可以分成氧化还原酶、转移酶、水解酶、裂合酶、异构酶和连接酶/合成酶。优选地,可以使用例如纤维素酶、α-淀粉酶和蛋白质酶之类的水解酶。具体例子包括属于水解酶分类中的族5的纤维素酶(Bioche M.J.,280,309,1991);特别是源自微生物的纤维素酶,更特别是源自芽孢杆菌属的纤维素酶。这些类型的工业酶的其它具体例子包括源自芽孢杆菌属并含有氨基酸序列号2或4的碱性纤维素酶,以及含有与所述氨基酸序列具有70%同源性,优选80%同源性,更优选90%同源性,进一步优选95%同源性,又进一步优选98%或更高同源性的另一氨基酸序列的纤维素酶。
α-淀粉酶的具体例子包括源自微生物的α-淀粉酶,优选源自芽孢杆菌属的液化淀粉酶。更具体的例子包括源自芽孢杆菌属并含有序列号6的氨基酸序列的碱性淀粉酶,以及含有与所述氨基酸序列具有70%同源性,优选80%同源性,更优选90%同源性,进一步优选95%同源性,特别优选98%或更高同源性的另一氨基酸序列的淀粉酶。氨基酸序列的同源性通过Lipman-Pearson法(Science,227,1435(1985))计算。蛋白酶的具体例子包括源自微生物,特别是源自属于芽孢杆菌属的微生物的丝氨酸蛋白酶和金属蛋白酶。
优选地,编码目标蛋白或多肽的基因在其上游区域具有一个或多个适当地接合到其上的与基因的转录、转译或分泌有关的调节区域(具体而言,一个或多个选自包含启动子和转录起始位点的转录起始调节区域;包含核蛋白体结合位点和起始密码子的转译起始区域;和分泌信号肽区域的区域)。优选将由转录起始调节区域、转译起始调节区域和分泌信号区域构成的三个区域接合到目标基因上。更优选分泌信号肽区域是源自属于芽孢杆菌属的微生物的纤维素酶基因,且转录起始区域和转译起始区域是该纤维素酶基因上游的0.6至1kb区域。在一个优选例子中,在例如日本专利申请(公开)第2000-210081号和第190793/1990号中公开的源自属于芽孢杆菌属的微生物的纤维素酶基因;即,源自KSM-S237菌株(FERM BP-7875)或KSM-64菌株(FERMBP-2886)的纤维素酶基因的转录起始调节区域、转译起始区域、和分泌信号肽区域,适当地接合到目标蛋白或多肽的结构基因上。更具体地,要接合的优选DNA片段包括序列号1的碱基数量为1至659的核苷酸序列;序列号3的纤维素酶基因的碱基数量为1至696的核苷酸序列;含有与所述任意一种核苷酸序列具有70%同源性,优选80%同源性,更优选90%同源性,进一步优选95%同源性,甚至更优选98%或更高同源性的核苷酸序列的DNA片段;或含有缺失了所述任意一种核苷酸序列的一部分的核苷酸序列的DNA片段。优选将这些DNA片段的一种适当地接合到目标蛋白质或多肽的结构基因上。正如此处所用,含有缺失上述任意一种核苷酸序列的一部分的核苷酸序列的DNA片段是指不含上述任意一种核苷酸序列的一部分并具有与该基因的转录、转译和分泌有关的功能的DNA片段。
本发明的重组微生物可以通过传统的转化技术获得,其中将含有包括编码目标蛋白质或多肽的基因并接合到适当的质粒载体上的DNA片段的重组质粒转移到宿主微生物细胞中。或者,重组微生物可以利用通过将上述DNA片段接合到与宿主微生物基因组的某一部分同源的一个合适区域上而制备的DNA片段,并直接插入宿主微生物基因组中而获得。
使用本发明的重组微生物获得的目标蛋白质或多肽可以按照如下方式生产将相应的细胞株植入含有可同化的碳源和氮源以及其它主要组分的培养基上;通过传统的微生物培养法培养细胞株;随后,收集并提纯蛋白质或多肽。
通过前述方法,可以生产宿主突变微生物株,其中表1所示的任一枯草杆菌基因或一个或多个选自与其功能相当的基因的基因已经缺失或剔除。此外,通过使用这种突变株,可以生产重组微生物。由此,通过使用突变株或重组微生物可以有效地生产有用的蛋白质或多肽。
下面将以构筑属于枯草杆菌的已经从中缺失了枯草杆菌的ccpA基因(BG10376)的重组菌株的实施例为中心,详细描述根据本发明构筑重组微生物的方法,以及使用该重组微生物生产纤维素酶和α-淀粉酶的方法。
实施例实施例1使用从枯草杆菌168菌株中提取的用作模板的基因组DNA样品和表1和2所示的两个引物组(ccpA-AF和ccpA-A/CmR;和ccpA-B/CmF和ccpA-BR)制备在该基因组上的ccpA基因上游侧侧面的0.6kb片段(A)和在ccpA基因下游侧侧面的0.6kb片段(B)。将质粒pC194的抗氯霉素基因(J.Bacteriol.150(2),815(1982))插入质粒pUC18的XbaI-BamHI裂解位点,由此制备重组质粒pCBB 31。使用重组质粒pCBB和表2所示的由CmF和CmR构成的引物组制备含有抗氯霉素基因的1kb片段(C)。随后,使用表2所示的引物ccpA-AF和ccpA-BR进行SOE-PCR,并结合使用由此制成的三个片段(A)、(B)和(C)作为模板,制备2.2kb DNA片段,其中在该序列中接合了片段(A)、(B)和(C)(参见图1)。使用由此制成的DNA片段,通过转化方法转化枯草杆菌168菌株。收集在含氯霉素的LB琼脂培养基中生长的菌落作为转化体。提取上述转化体的基因组,在其上进行的PCR证实,ccpA基因已经被缺失并被抗氯霉素基因取代。
表2-1

表2-2

表2-3

表2-4

实施例2按照与实施例1所述相似的方式,通过使用由选自表2所示的各种引物组;即,基因-AF、基因-A/CmR、基因-B/CmF、基因-BR、CmF以及CmR的适当引物组而制成的用于实现缺失的DNA片段来分离孢子形成基因缺失了的菌株,在该菌株中已经通过取代下述缺失的基因而引入了抗氯霉素基因。从基因组中缺失的基因是comA、yopO、treR、yvbA、yvaN、yttP、yurK、yozA、licR、sigL、mntR、glcT、ykvE、slr、rocR、yyaA或rsiX。
实施例3按照与实施例2所述相似的方式,通过使用选自表2所示的基因-AF、基因-A/Cm2R、基因-B/Cm2F、基因-BR、Cm2F以及Cm2R的适当引物组来制备用于缺失的DNA片段。通过使用由此制成的DNA片段,分离孢子形成基因缺失了的菌株,在该菌株中已经通过取代下述缺失的基因而引入了抗氯霉素基因。从基因组中缺失的基因是cspB、yvdE、yaaT、yycH或ylbO。
实施例4
按照与实施例2所述相似的方式,由选自表2所示的基因-AF、基因-A/Cm4R、基因-B/Cm4F、基因-BR、Cm4F以及Cm4R的适当引物组制备用于实现缺失的DNA片段。通过使用由此制成的DNA片段,分离孢子形成基因缺失了的菌株,在该菌株中已经通过取代缺失的基因yacP、hprK和yhdK而引入了抗氯霉素基因。
实施例5在实施例1到4获得的每种基因缺失的菌株中和在用作对照物的枯草杆菌168菌株中,通过原生质体转化法引入重组质粒pHY-S237。重组质粒pHY-S237的制备如下将源自芽孢杆菌sp.KSM-S237菌株的编码碱性纤维素酶的DNA片段(3.1kb)(序列号1,日本专利申请(公开)第2000-210081号)插入穿梭载体pHY300 PLK的限制性内切酶BamHI裂解位点。将由此制成的每种细胞株在LB培养基(5毫升)中以30℃震荡培养过夜。将培养液(0.03毫升)注入2×L-麦芽糖培养基(2%胰胨、1%酵母提取物、1%NaCl、7.5%麦芽糖、7.5ppm4-5水合硫酸锰和15ppm四环素)中,然后在30℃震荡培养三天。在培养完成后,通过离心去除细胞,并测定由培养物获得的上层清液的碱性纤维素酶活性,由此计算细胞在培养过程中分泌出的碱性纤维素酶的量;即,在细胞外生成的碱性纤维素酶的量。从表3中清楚看出,与对照物168菌株(野生型菌株)相比,在使用基因缺失的可形成孢子的菌株作为宿主的所有情况下,碱性纤维素酶的生产或分泌都被证实更为有效。
表3

实施例6在实施例1至4获得的每种基因缺失的菌株中和在用作对照物的枯草杆菌168菌株中,通过原生质体转化法引入重组质粒pHSP-K38。重组质粒pHSP-K38的制备如下在穿梭载体pHY300PLK的限制性内切酶BagII-XbaI裂解位点插入如下制成的2.1kb片段(序列号5)将包含碱性纤维素酶基因的启动子区域和信号序列区域部分的上游0.6kb片段(序列号3)与编码源自芽孢杆菌sp.KSM-K38菌株的碱性淀粉酶基因的成熟酶区域(Asp1-Gln480)的DNA片段(1.5kb)的上游侧接合(日本专利申请(公开)第2000-1884882号,Eur.J.Biochem.,268,2974(2001))。将由此获得的每种细胞株在LB培养基(5毫升)中以30℃震荡培养过夜。将培养液(0.03毫升)注入2×L-麦芽糖培养基(2%胰胨、1%酵母提取物、1%NaCl、7.5%麦芽糖、7.5ppm4-5水合硫酸锰和15ppm四环素)中,然后在30℃震荡培养三至六天。在培养完成后,通过离心去除细胞,并测定由培养物获得的上层清液的碱性淀粉酶的活性,由此计算在培养过程中细胞分泌出的碱性淀粉酶的量;即,在细胞外生成的碱性淀粉酶的量。从表4中清楚看出,与对照物168菌株(野生型菌株)相比,在使用基因缺失的菌株作为宿主的情况下,碱性淀粉酶的生产或分泌被证实更为有效。
表4

序列表<110>花王株式会社<120>重组微生物<130>KS0795<150>JP 2003-379167<151>2003.11.7<160>122<170>PatentIn Ver.2.1<210>1<211>3150<212>DNA<213>芽孢杆菌KSM-S237<220>
<221>CDS<222>(573)..(3044)<223>
<220>
<221>sig_peptide<222>(573)..(659)<223>
<220>
<221>mat_peptide<222>(660)..()<223>
<400>1gatttgccga tgcaacaggc ttatatttag aggaaatttc tttttaaatt gaatacggaa60taaaatcagg taaacaggtc ctgattttat ttttttgagt tttttagaga actgaagatt120gaaataaaag tagaagacaa aggacataag aaaattgcat tagttttaat tatagaaaac180gcctttttat aattatttat acctagaacg aaaatactgt ttcgaaagcg gtttactata240aaaccttata ttccggctct tttttaaaac agggggtaaa aattcactct agtattctaa300tttcaacatg ctataataaa tttgtaagac gcaatatgca tctctttttt tacgatatat360gtaagcggtt aaccttgtgc tatatgccga tttaggaagg ggggtagatt gagtcaagta420
gtaataatat agataactta taagttgttg agaagcagga gagcatctgg gttactcaca480agttttttta aaactttaac gaaagcactt tcggtaatgc ttatgaattt agctatttga540ttcaattact ttaaaaatat ttaggaggta at atg atg tta aga aag aaa aca 593Met Met Leu Arg Lys Lys Thr-25aag cag ttg att tct tcc att ctt att tta gtt tta ctt cta tct tta 641Lys Gln Leu Ile Ser Ser Ile Leu Ile Leu Val Leu Leu Leu Ser Leu-20 -15 -10ttt ccg gca gct ctt gca gca gaa gga aac act cgt gaa gac aat ttt 689Phe Pro Ala Ala Leu Ala Ala Glu Gly Asn Thr Arg Glu Asp Asn Phe-5 -1 1 5 10aaa cat tta tta ggt aat gac aat gtt aaa cgc cct tct gag gct ggc 737Lys His Leu Leu Gly Asn Asp Asn Val Lys Arg Pro Ser Glu Ala Gly15 20 25gca tta caa tta caa gaa gtc gat gga caa atg aca tta gta gat caa 785Ala Leu Gln Leu Gln Glu Val Asp Gly Gln Met Thr Leu Val Asp Gln30 35 40cat gga gaa aaa att caa tta cgt gga atg agt aca cac gga tta cag 833His Gly Glu Lys Ile Gln Leu Arg Gly Met Ser Thr His Gly Leu Gln45 50 55tgg ttt cct gag atc ttg aat gat aac gca tac aaa gct ctt tct aac 881Trp Phe Pro Glu Ile Leu Asn Asp Asn Ala Tyr Lys Ala Leu Ser Asn60 65 70gat tgg gat tcc aat atg att cgt ctt gct atg tat gta ggt gaa aat 929Asp Trp Asp Ser Asn Met Ile Arg Leu Ala Met Tyr Val Gly Glu Asn75 80 85 90ggg tac gct aca aac cct gag tta atc aaa caa aga gtg att gat gga 977Gly Tyr Ala Thr Asn Pro Glu Leu Ile Lys Gln Arg Val Ile Asp Gly95 100 105att gag tta gcg att gaa aat gac atg tat gtt att gtt gac tgg cat 1025Ile Glu Leu Ala Ile Glu Asn Asp Met Tyr Val Ile Val Asp Trp His110 115 120gtt cat gcg cca ggt gat cct aga gat cct gtt tat gca ggt gct aaa 1073Val His Ala Pro Gly Asp Pro Arg Asp Pro Val Tyr Ala Gly Ala Lys125 130 135
gat ttc ttt aga gaa att gca gct tta tac cct aat aat cca cac att1121Asp Phe Phe Arg Glu Ile Ala Ala Leu Tyr Pro Asn Asn Pro His Ile140 145 150att tat gag tta gcg aat gag ccg agt agt aat aat aat ggt gga gca1169Ile Tyr Glu Leu Ala Asn Glu Pro Ser Ser Asn Asn Asn Gly Gly Ala155 160 165 170ggg att ccg aat aac gaa gaa ggt tgg aaa gcg gta aaa gaa tat gct1217Gly Ile Pro Asn Asn Glu Glu Gly Trp Lys Ala Val Lys Glu Tyr Ala175 180 185gat cca att gta gaa atg tta cgt aaa agc ggt aat gca gat gac aac1265Asp Pro Ile Val Glu Met Leu Arg Lys Ser Gly Asn Ala Asp Asp Asn190 195 200att atc att gtt ggt agt cca aac tgg agt cag cgt ccg gac tta gca1313Ile Ile Ile Val Gly Ser Pro Asn Trp Ser Gln Arg Pro Asp Leu Ala205 210 215gct gat aat cca att gat gat cac cat aca atg tat act gtt cac ttc 1361Ala Asp Asn Pro Ile Asp Asp His His Thr Met Tyr Thr Val His Phe220 225 230tac act ggt tca cat gct gct tca act gaa agc tat ccg tct gaa act1409Tyr Thr Gly Ser His Ala Ala Ser Thr Glu Ser Tyr Pro Ser Glu Thr235 240 245 250cct aac tct gaa aga gga aac gta atg agt aac act cgt tat gcg tta1457Pro Asn Ser Glu Arg Gly Asn Val Met Ser Asn Thr Arg Tyr Ala Leu255 260 265gaa aac gga gta gcg gta ttt gca aca gag tgg gga acg agt caa gct1505Glu Asn Gly Val Ala Val Phe Ala Thr Glu Trp Gly Thr Ser Gln Ala270 275 280agt gga gac ggt ggt cct tac ttt gat gaa gca gat gta tgg att gaa1553Ser Gly Asp Gly Gly Pro Tyr Phe Asp Glu Ala Asp Val Trp Ile Glu285 290 295ttt tta aat gaa aac aac att agc tgg gct aac tgg tct tta acg aat1601Phe Leu Asn Glu Asn Asn Ile Ser Trp Ala Asn Trp Ser Leu Thr Asn300 305 310aaa aat gaa gta tct ggt gca ttt aca cca ttc gag tta ggt aag tct1649Lys Asn Glu Val Ser Gly Ala Phe Thr Pro Phe Glu Leu Gly Lys Ser315 320 325 330aac gca acc aat ctt gac cca ggt cca gat cat gtg tgg gca cca gaa1697
Asn Ala Thr Asn Leu Asp Pro Gly Pro Asp His Val Trp Ala Pro Glu335 340 345gaa tta agt ctt tct gga gaa tat gta cgt gct cgt att aaa ggt gtg1745Glu Leu Ser Leu Ser Gly Glu Tyr Val Arg Ala Arg Ile Lys Gly Val350 355 360aac tat gag cca atc gac cgt aca aaa tac acg aaa gta ctt tgg gac1793Asn Tyr Glu Pro Ile Asp Arg Thr Lys Tyr Thr Lys Val Leu Trp Asp365 370 375ttt aat gat gga acg aag caa gga ttt gga gtg aat tcg gat tct cca1841Phe Asn Asp Gly Thr Lys Gln Gly Phe Gly Val Asn Ser Asp Ser Pro380 385 390aat aaa gaa ctt att gca gtt gat aat gaa aac aac act ttg aaa gtt1889Asn Lys Glu Leu Ile Ala Val Asp Asn Glu Asn Asn Thr Leu Lys Val395 400 405 410tcg gga tta gat gta agt aac gat gtt tca gat ggc aac ttc tgg gct1937Ser Gly Leu Asp Val Ser Asn Asp Val Ser Asp Gly Asn Phe Trp Ala415 420 425aat gct cgt ctt tct gcc aac ggt tgg gga aaa agt gtt gat att tta1985Asn Ala Arg Leu Ser Ala Asn Gly Trp Gly Lys Ser Val Asp Ile Leu430 435 440ggt gct gag aag ctt aca atg gat gtt att gtt gat gaa cca acg acg2033Gly Ala Glu Lys Leu Thr Met Asp Val Ile Val Asp Glu Pro Thr Thr445 450 455gta gct att gcg gcg att cca caa agt agt aaa agt gga tgg gca aat2081Val Ala Ile Ala Ala Ile Pro Gln Ser Ser Lys Ser Gly Trp Ala Asn460 465 470cca gag cgt gct gtt cga gtg aac gcg gaa gat ttt gtc cag caa acg2129Pro Glu Arg Ala Val Arg Val Asn Ala Glu Asp Phe Val Gln Gln Thr475 480 485 490gac ggt aag tat aaa gct gga tta aca att aca gga gaa gat gct cct2177Asp Gly Lys Tyr Lys Ala Gly Leu Thr Ile Thr Gly Glu Asp Ala Pro495 500 505aac cta aaa aat atc gct ttt cat gaa gaa gat aac aat atg aac aac2225Asn Leu Lys Asn Ile Ala Phe His Glu Glu Asp Asn Asn Met Asn Asn510 515 520atc att ctg ttc gtg gga act gat gca gct gac gtt att tac tta gat2273Ile Ile Leu Phe Val Gly Thr Asp Ala Ala Asp Val Ile Tyr Leu Asp
525 530 535aac att aaa gta att gga aca gaa gtt gaa att cca gtt gtt cat gat2321Asn Ile Lys Val Ile Gly Thr Glu Val Glu Ile Pro Val Val His Asp540 545 550cca aaa gga gaa gct gtt ctt cct tct gtt ttt gaa gac ggt aca cgt2369Pro Lys Gly Glu Ala Val Leu Pro Ser Val Phe Glu Asp Gly Thr Arg555 560 565 570caa ggt tgg gac tgg gct gga gag tct ggt gtg aaa aca gct tta aca2417Gln Gly Trp Asp Trp Ala Gly Glu Ser Gly Val Lys Thr Ala Leu Thr575 580 585att gaa gaa gca aac ggt tct aac gcg tta tca tgg gaa ttt gga tat2465Ile Glu Glu Ala Asn Gly Ser Asn Ala Leu Ser Trp Glu Phe Gly Tyr590 595 600cca gaa gta aaa cct agt gat aac tgg gca aca gct cca cgt tta gat2513Pro Glu Val Lys Pro Ser Asp Asn Trp Ala Thr Ala Pro Arg Leu Asp605 610 615ttc tgg aaa tct gac ttg gtt cgc ggt gag aat gat tat gta gct ttt2561Phe Trp Lys Ser Asp Leu Val Arg Gly Glu Asn Asp Tyr Val Ala Phe620 625 630gat ttc tat cta gat cca gtt cgt gca aca gaa ggc gca atg aat atc2609Asp Phe Tyr Leu Asp Pro Val Arg Ala Thr Glu Gly Ala Met Asn Ile635 640 645 650aat tta gta ttc cag cca cct act aac ggg tat tgg gta caa gca cca2657Asn Leu Val Phe Gln Pro Pro Thr Asn Gly Tyr Trp Val Gln Ala Pro655 660 665aaa acg tat acg att aac ttt gat gaa tta gag gaa gcg aat caa gta2705Lys Thr Tyr Thr Ile Asn Phe Asp Glu Leu Glu Glu Ala Asn Gln Val670 675 680aat ggt tta tat cac tat gaa gtg aaa att aac gta aga gat att aca2753Asn Gly Leu Tyr His Tyr Glu Val Lys Ile Asn Val Arg Asp Ile Thr685 690 695aac att caa gat gac acg tta cta cgt aac atg atg atc att ttt gca2801Asn Ile Gln Asp Asp Thr Leu Leu Arg Asn Met Met Ile Ile Phe Ala700 705 710gat gta gaa agt gac ttt gca ggg aga gtc ttt gta gat aat gtt cgt2849Asp Val Glu Ser Asp Phe Ala Gly Arg Val Phe Val Asp Asn Val Arg715 720 725 730
ttt gag ggg gct gct act act gag ccg gtt gaa cca gag cca gtt gat2897Phe Glu Gly Ala Ala Thr Thr Glu Pro Val Glu Pro Glu Pro Val Asp735 740 745cct ggc gaa gag acg cca cct gtc gat gag aag gaa gcg aaa aaa gaa2945Pro Gly Glu Glu Thr Pro Pro Val Asp Glu Lys Glu Ala Lys Lys Glu750 755 760caa aaa gaa gca gag aaa gaa gag aaa gag gca gta aaa gaa gaa aag2993Gln Lys Glu Ala Glu Lys Glu Glu Lys Glu Ala Val Lys Glu Glu Lys765 770 775aaa gaa gct aaa gaa gaa aag aaa gca gtc aaa aat gag get aag aaa3041Lys Glu Ala Lys Glu Glu Lys Lys Ala Val Lys Asn Glu Ala Lys Lys780 785 790aaa taatctatta aactagttat agggttatct aaaggtctga tgtagatctt 3094Lys795ttagataacc tttttcttgc ataactggac acagagttgt tattaaagaa agtaag 3150<210>2<211>824<212>PRT<213>芽孢杆菌KSM-S237<400>2Met Met Leu Arg Lys Lys Thr Lys Gln Leu Ile Ser Ser Ile Leu Ile-25 -20 -15Leu Val Leu Leu Leu Ser Leu Phe Pro Ala Ala Leu Ala Ala Glu Gly-10 -5 -1 1Asn Thr Arg Glu Asp Asn Phe Lys His Leu Leu Gly Asn Asp Asn Val5 10 15Lys Arg Pro Ser Glu Ala Gly Ala Leu Gln Leu Gln Glu Val Asp Gly20 25 30 35Gln Met Thr Leu Val Asp Gln His Gly Glu Lys Ile Gln Leu Arg Gly40 45 50
Met Ser Thr His Gly Leu Gln Trp Phe Pro Glu Ile Leu Asn Asp Asn55 60 65Ala Tyr Lys Ala Leu Ser Asn Asp Trp Asp Ser Asn Met Ile Arg Leu70 75 80Ala Met Tyr Val Gly Glu Asn Gly Tyr Ala Thr Asn Pro Glu Leu Ile85 90 95Lys Gln Arg Val Ile Asp Gly Ile Glu Leu Ala Ile Glu Asn Asp Met100 105 110 115Tyr Val Ile Val Asp Trp His Val His Ala Pro Gly Asp Pro Arg Asp120 125 130Pro Val Tyr Ala Gly Ala Lys Asp Phe Phe Arg Glu Ile Ala Ala Leu135 140 145Tyr Pro Asn Asn Pro His Ile Ile Tyr Glu Leu Ala Asn Glu Pro Ser150 155 160Ser Asn Asn Asn Gly Gly Ala Gly Ile Pro Asn Asn Glu Glu Gly Trp165 170 175Lys Ala Val Lys Glu Tyr Ala Asp Pro Ile Val Glu Met Leu Arg Lys180 185 190 195Ser Gly Asn Ala Asp Asp Asn Ile Ile Ile Val Gly Ser Pro Asn Trp200 205 210Ser Gln Arg Pro Asp Leu Ala Ala Asp Asn Pro Ile Asp Asp His His215 220 225Thr Met Tyr Thr Val His Phe Tyr Thr Gly Ser His Ala Ala Ser Thr230 235 240
Glu Ser Tyr Pro Ser Glu Thr Pro Asn Ser Glu Arg Gly Asn Val Met245 250 255Ser Asn Thr Arg Tyr Ala Leu Glu Asn Gly Val Ala Val Phe Ala Thr260 265 270 275Glu Trp Gly Thr Ser Gln Ala Ser Gly Asp Gly Gly Pro Tyr Phe Asp280 285 290Glu Ala Asp Val Trp Ile Glu Phe Leu Asn Glu Asn Asn Ile Ser Trp295 300 305Ala Asn Trp Ser Leu Thr Asn Lys Asn Glu Val Ser Gly Ala Phe Thr310 315 320Pro Phe Glu Leu Gly Lys Ser Asn Ala Thr Asn Leu Asp Pro Gly Pro325 330 335Asp His Val Trp Ala Pro Glu Glu Leu Ser Leu Ser Gly Glu Tyr Val340 345 350 355Arg Ala Arg Ile Lys Gly Val Asn Tyr Glu Pro Ile Asp Arg Thr Lys360 365 370Tyr Thr Lys Val Leu Trp Asp Phe Asn Asp Gly Thr Lys Gln Gly Phe375 380 385Gly Val Asn Ser Asp Ser Pro Asn Lys Glu Leu Ile Ala Val Asp Asn390 395 400Glu Asn Asn Thr Leu Lys Val Ser Gly Leu Asp Val Ser Asn Asp Val405 410 415Ser Asp Gly Asn Phe Trp Ala Asn Ala Arg Leu Ser Ala Asn Gly Trp420 425 430 435
Gly Lys Ser Val Asp Ile Leu Gly Ala Glu Lys Leu Thr Met Asp Val440 445 450Ile Val Asp Glu Pro Thr Thr Val Ala Ile Ala Ala Ile Pro Gln Ser455 460 465Ser Lys Ser Gly Trp Ala Asn Pro Glu Arg Ala Val Arg Val Asn Ala470 475 480Glu Asp Phe Val Gln Gln Thr Asp Gly Lys Tyr Lys Ala Gly Leu Thr485 490 495Ile Thr Gly Glu Asp Ala Pro Asn Leu Lys Asn Ile Ala Phe His Glu500 505 510 515Glu Asp Asn Asn Met Asn Asn Ile Ile Leu Phe Val Gly Thr Asp Ala520 525 530Ala Asp Val Ile Tyr Leu Asp Asn Ile Lys Val Ile Gly Thr Glu Val535 540 545Glu Ile Pro Val Val His Asp Pro Lys Gly Glu Ala Val Leu Pro Ser550 555 560Val Phe Glu Asp Gly Thr Arg Gln Gly Trp Asp Trp Ala Gly Glu Ser565 570 575Gly Val Lys Thr Ala Leu Thr Ile Glu Glu Ala Asn Gly Ser Asn Ala580 585 590 595Leu Ser Trp Glu Phe Gly Tyr Pro Glu Val Lys Pro Ser Asp Asn Trp600 605 610Ala Thr Ala Pro Arg Leu Asp Phe Trp Lys Ser Asp Leu Val Arg Gly615 620 625Glu Asn Asp Tyr Val Ala Phe Asp Phe Tyr Leu Asp Pro Val Arg Ala
630 635 640Thr Glu Gly Ala Met Asn Ile Asn Leu Val Phe Gln Pro Pro Thr Asn645 650 655Gly Tyr Trp Val Gln Ala Pro Lys Thr Tyr Thr Ile Asn Phe Asp Glu660 665 670 675Leu Glu Glu Ala Asn Gln Val Asn Gly Leu Tyr His Tyr Glu Val Lys680 685 690Ile Asn Val Arg Asp Ile Thr Asn Ile Gln Asp Asp Thr Leu Leu Arg695 700 705Asn Met Met Ile Ile Phe Ala Asp Val Glu Ser Asp Phe Ala Gly Arg710 715 720Val Phe Val Asp Asn Val Arg Phe Glu Gly Ala Ala Thr Thr Glu Pro725 730 735Val Glu Pro Glu Pro Val Asp Pro Gly Glu Glu Thr Pro Pro Val Asp740 745 750 755Glu Lys Glu Ala Lys Lys Glu Gln Lys Glu Ala Glu Lys Glu Glu Lys760 765 770Glu Ala Val Lys Glu Glu Lys Lys Glu Ala Lys Glu Glu Lys Lys Ala775 780 785Val Lys Asn Glu Ala Lys Lys Lys790 795<210>3<211>3332<212>DNA<213>芽孢杆菌KSM-64<220>
<221>CDS<222>(610)..(3075)<223>
<220>
<221>sig peptide<222>(610)..(696)<223>
<220>
<221>mat_peptide<222>(697)..()<223>
<400>3agtacttacc attttagagt caaaagatag aagccaagca ggatttgccg atgcaaccgg60cttatattta gagggaattt ctttttaaat tgaatacgga ataaaatcag gtaaacaggt120cctgatttta tttttttgaa tttttttgag aactaaagat tgaaatagaa gtagaagaca180acggacataa gaaaattgta ttagttttaa ttatagaaaa cgcttttcta taattattta240tacctagaac gaaaatactg tttcgaaagc ggtttactat aaaaccttat attccggctc300tttttttaaa cagggggtga aaattcactc tagtattcta atttcaacat gctataataa360atttgtaaga cgcaatatac atcttttttt tatgatattt gtaagcggtt aaccttgtgc420tatatgccga tttaggaagg gggtagattg agtcaagtag tcataattta gataacttat480aagttgttga gaagcaggag agaatctggg ttactcacaa gttttttaaa acattatcga540aagcactttc ggttatgctt atgaatttag ctatttgatt caattacttt aataatttta600ggaggtaat atg atg tta aga aag aaa aca aag cag ttg att tct tcc att651Met Met Leu Arg Lys Lys Thr Lys Gln Leu Ile Ser Ser Ile-25 -20ctt att tta gtt tta ctt cta tct tta ttt ccg aca gct ctt gca gca 699Leu Ile Leu Val Leu Leu Leu Ser Leu Phe Pro Thr Ala Leu Ala Ala-15 -10 -5 -1 1gaa gga aac act cgt gaa gac aat ttt aaa cat tta tta ggt aat gac 747Glu Gly Asn Thr Arg Glu Asp Asn Phe Lys His Leu Leu Gly Asn Asp5 10 15aat gtt aaa cgc cct tct gag gct ggc gca tta caa tta caa gaa gtc 795Asn Val Lys Arg Pro Ser Glu Ala Gly Ala Leu Gln Leu Gln Glu Val
20 25 30gat gga caa atg aca tta gta gat caa cat gga gaa aaa att caa tta843Asp Gly Gln Met Thr Leu Val Asp Gln His Gly Glu Lys Ile Gln Leu35 40 45cgt gga atg agt aca cac gga tta caa tgg ttt cct gag atc ttg aat891Arg Gly Met Ser Thr His Gly Leu Gln Trp Phe Pro Glu Ile Leu Asn50 55 60 65gat aac gca tac aaa gct ctt gct aac gat tgg gaa tca aat atg att939Asp Asn Ala Tyr Lys Ala Leu Ala Asn Asp Trp Glu Ser Asn Met Ile70 75 80cgt cta gct atg tat gtc ggt gaa aat ggc tat gct tca aat cca gag987Arg Leu Ala Met Tyr Val Gly Glu Asn Gly Tyr Ala Ser Asn Pro Glu85 90 95tta att aaa agc aga gtc att aaa gga ata gat ctt gct att gaa aat1035Leu Ile Lys Ser Arg Val Ile Lys Gly Ile Asp Leu Ala Ile Glu Asn100 105 110gac atg tat gtc atc gtt gat tgg cat gta cat gca cct ggt gat cct1083Asp Met Tyr Val Ile Val Asp Trp His Val His Ala Pro Gly Asp Pro115 120 125aga gat ccc gtt tac gct gga gca gaa gat ttc ttt aga gat att gca1131Arg Asp Pro Val Tyr Ala Gly Ala Glu Asp Phe Phe Arg Asp Ile Ala130 135 140 145gca tta tat cct aac aat cca cac att att tat gag tta gcg aat gag1179Ala Leu Tyr Pro Asn Asn Pro His Ile Ile Tyr Glu Leu Ala Asn Glu150 155 160cca agt agt aac aat aat ggt gga gct ggg att cca aat aat gaa gaa1227Pro Ser Ser Asn Asn Asn Gly Gly Ala Gly Ile Pro Asn Asn Glu Glu165 170 175ggt tgg aat gcg gta aaa gaa tac gct gat cca att gta gaa atg tta1275Gly Trp Asn Ala Val Lys Glu Tyr Ala Asp Pro Ile Val Glu Met Leu180 185 190cgt gat agc ggg aac gca gat gac aat att atc att gtg ggt agt cca1323Arg Asp Ser Gly Asn Ala Asp Asp Asn Ile Ile Ile Val Gly Ser Pro195 200 205aac tgg agt cag cgt cct gac tta gca gct gat aat cca att gat gat1371Asn Trp Ser Gln Arg Pro Asp Leu Ala Ala Asp Asn Pro Ile Asp Asp210 215 220 225
cac cat aca atg tat act gtt cac ttc tac act ggt tca cat gct gct1419His His Thr Met Tyr Thr Val His Phe Tyr Thr Gly Ser His Ala Ala230 235 240tca act gaa agc tat ccg cct gaa act cct aac tct gaa aga gga aac1467Ser Thr Glu Ser Tyr Pro Pro Glu Thr Pro Asn Ser Glu Arg Gly Asn245 250 255gta atg agt aac act cgt tat gcg tta gaa aac gga gta gca gta ttt1515Val Met Ser Asn Thr Arg Tyr Ala Leu Glu Asn Gly Val Ala Val Phe260 265 270gca aca gag tgg gga act agc caa gca aat gga gat ggt ggt cct tac1563Ala Thr Glu Trp Gly Thr Ser Gln Ala Asn Gly Asp Gly Gly Pro Tyr275 280 285ttt gat gaa gca gat gta tgg att gag ttt tta aat gaa aac aac att1611Phe Asp Glu Ala Asp Val Trp Ile Glu Phe Leu Asn Glu Asn Asn Ile290 295 300 305agc tgg gct aac tgg tct tta acg aat aaa aat gaa gta tct ggt gca1659Ser Trp Ala Asn Trp Ser Leu Thr Asn Lys Asn Glu Val Ser Gly Ala310 315 320ttt aca cca ttc gag tta ggt aag tct aac gca aca agt ctt gac cca1707Phe Thr Pro Phe Glu Leu Gly Lys Ser Asn Ala Thr Ser Leu Asp Pro325 330 335ggg cca gac caa gta tgg gta cca gaa gag tta agt ctt tct gga gaa1755Gly Pro Asp Gln Val Trp Val Pro Glu Glu Leu Ser Leu Ser Gly Glu340 345 350tat gta cgt gct cgt att aaa ggt gtg aac tat gag cca atc gac cgt1803Tyr Val Arg Ala Arg Ile Lys Gly Val Asn Tyr Glu Pro Ile Asp Arg355 360 365aca aaa tac acg aaa gta ctt tgg gac ttt aat gat gga acg aag caa1851Thr Lys Tyr Thr Lys Val Leu Trp Asp Phe Asn Asp Gly Thr Lys Gln370 375 380 385gga ttt gga gtg aat gga gat tct cca gtt gaa gat gta gtt att gag1899Gly Phe Gly Val Asn Gly Asp Ser Pro Val Glu Asp Val Val Ile Glu390 395 400aat gaa gcg ggc gct tta aaa ctt tca gga tta gat gca agt aat gat1947Asn Glu Ala Gly Ala Leu Lys Leu Ser Gly Leu Asp Ala Ser Asn Asp405 410 415
gtt tct gaa ggt aat tac tgg gct aat gct cgt ctt tct gcc gac ggt1995Val Ser Glu Gly Asn Tyr Trp Ala Asn Ala Arg Leu Ser Ala Asp Gly420 425 430tgg gga aaa agt gtt gat att tta ggt gct gaa aaa ctt act atg gat2043Trp Gly Lys Ser Val Asp Ile Leu Gly Ala Glu Lys Leu Thr Met Asp435 440 445gtg att gtt gat gag ccg acc acg gta tca att gct gca att cca caa2091Val Ile Val Asp Glu Pro Thr Thr Val Ser Ile Ala Ala Ile Pro Gln450 455 460 465ggg cca tca gcc aat tgg gtt aat cca aat cgt gca att aag gtt gag2139Gly Pro Ser Ala Asn Trp Val Asn Pro Asn Arg Ala Ile Lys Val Glu470 475 480cca act aat ttc gta ccg tta gga gat aag ttt aaa gcg gaa tta act2187Pro Thr Asn Phe Val Pro Leu Gly Asp Lys Phe Lys Ala Glu Leu Thr485 490 495ata act tca gct gac tct cca tcg tta gaa gct att gcg atg cat gct2235Ile Thr Ser Ala Asp Ser Pro Ser Leu Glu Ala Ile Ala Met His Ala500 505 510gaa aat aac aac atc aac aac atc att ctt ttt gta gga act gaa ggt2283Glu Asn Asn Asn Ile Asn Asn Ile Ile Leu Phe Val Gly Thr Glu Gly515 520 525gct gat gtt atc tat tta gat aac att aaa gta att gga aca gaa gtt2331Ala Asp Val Ile Tyr Leu Asp Asn Ile Lys Val Ile Gly Thr Glu Val530 535 540 545gaa att cca gtt gtt cat gat cca aaa gga gaa gct gtt ctt cct tct2379Glu Ile Pro Val Val His Asp Pro Lys Gly Glu Ala Val Leu Pro Ser550 555 560gtt ttt gaa gac ggt aca cgt caa ggt tgg gac tgg gct gga gag tct2427Val Phe Glu Asp Gly Thr Arg Gln Gly Trp Asp Trp Ala Gly Glu Ser565570 575ggt gtg aaa aca gct tta aca att gaa gaa gca aac ggt tct aac gcg2475Gly Val Lys Thr Ala Leu Thr Ile Glu Glu Ala Asn Gly Ser Asn Ala580 585 590tta tca tgg gaa ttt gga tac cca gaa gta aaa cct agt gat aac tgg2523Leu Ser Trp Glu Phe Gly Tyr Pro Glu Val Lys Pro Ser Asp Asn Trp595 600 605gca aca gct cca cgt tta gat ttc tgg aaa tct gac ttg gtt cgc ggt2571
Ala Thr Ala Pro Arg Leu Asp Phe Trp Lys Ser Asp Leu Val Arg Gly610 615 620 625gaa aat gat tat gta act ttt gat ttc tat cta gat cca gtt cgt gca 2619Glu Asn Asp Tyr Val Thr Phe Asp Phe Tyr Leu Asp Pro Val Arg Ala630 635 640aca gaa ggc gca atg aat atc aat tta gta ttc cag cca cct act aac 2667Thr Glu Gly Ala Met Asn Ile Asn Leu Val Phe Gln Pro Pro Thr Asn645 650 655ggg tat tgg gta caa gca cca aaa acg tat acg att aac ttt gat gaa 2715Gly Tyr Trp Val Gln Ala Pro Lys Thr Tyr Thr Ile Asn Phe Asp Glu660 665 670tta gag gaa gcg aat caa gta aat ggt tta tat cac tat gaa gtg aaa 2763Leu Glu Glu Ala Asn Gln Val Asn Gly Leu Tyr His Tyr Glu Val Lys675 680 685att aac gta aga gat att aca aac att caa gat gac acg tta cta cgt 2811Ile Asn Val Arg Asp Ile Thr Asn Ile Gln Asp Asp Thr Leu Leu Arg690 695 700 705aac atg atg atc att ttt gca gat gta gaa agt gac ttt gca ggg aga 2859Asn Met Met Ile Ile Phe Ala Asp Val Glu Ser Asp Phe Ala Gly Arg710 715 720gtc ttt gta gat aat gtt cgt ttt gag ggg gct gct act act gag ccg 2907Val Phe Val Asp Asn Val Arg Phe Glu Gly Ala Ala Thr Thr Glu Pro725 730 735gtt gaa cca gag cca gtt gat cct ggc gaa gag acg ccg cct gtc gat 2955Val Glu Pro Glu Pro Val Asp Pro Gly Glu Glu Thr Pro Pro Val Asp740 745 750gag aag gaa gcg aaa aaa gaa caa aaa gaa gca gag aaa gaa gag aaa 3003Glu Lys Glu Ala Lys Lys Glu Gln Lys Glu Ala Glu Lys Glu Glu Lys755 760 765gaa gca gta aaa gaa gaa aag aaa gaa gct aaa gaa gaa aag aaa gca 3051Glu Ala Val Lys Glu Glu Lys Lys Glu Ala Lys Glu Glu Lys Lys Ala770 775 780 785atc aaa aat gag gct acg aaa aaa taatctaata aactagttat agggttatct 3105Ile Lys Asn Glu Ala Thr Lys Lys790aaaggtctga tgcagatctt ttagataacc tttttttgca taactggaca tagaatggtt3165
attaaagaaa gcaaggtgtt tatacgatat taaaaaggta gcgattttaa attgaaacct3225ttaataatgt cttgtgatag aatgatgaag taatttaaga gggggaaacg aagtgaaaac3285ggaaatttct agtagaagaa aaacagacca agaaatactg caagctt 3332<210>4<211>822<212>PRT<213>芽孢杆菌KSM-64<400>4Met Met Leu Arg Lys Lys Thr Lys Gln Leu Ile Ser Ser Ile Leu Ile-25 -20 -15Leu Val Leu Leu Leu Ser Leu Phe Pro Thr Ala Leu Ala Ala Glu Gly-10 -5 -1 1Asn Thr Arg Glu Asp Asn Phe Lys His Leu Leu Gly Asn Asp Asn Val5 10 15Lys Arg Pro Ser Glu Ala Gly Ala Leu Gln Leu Gln 6lu Val Asp Gly20 25 30 35Gln Met Thr Leu Val Asp Gln His Gly Glu Lys Ile Gln Leu Arg Gly40 45 50Met Ser Thr His Gly Leu Gln Trp Phe Pro Glu Ile Leu Asn Asp Asn55 60 65Ala Tyr Lys Ala Leu Ala Asn Asp Trp Glu Ser Asn Met Ile Arg Leu70 75 80Ala Met Tyr Val Gly Glu Asn Gly Tyr Ala Ser Asn Pro Glu Leu Ile85 90 95Lys Ser Arg Val Ile Lys Gly Ile Asp Leu Ala Ile Glu Asn Asp Met100 105 110 115
Tyr Val Ile Val Asp Trp His Val His Ala Pro Gly Asp Pro Arg Asp120 125 130Pro Val Tyr Ala Gly Ala Glu Asp Phe Phe Arg Asp Ile Ala Ala Leu135 140 145Tyr Pro Asn Asn Pro His Ile Ile Tyr Glu Leu Ala Asn Glu Pro Ser150 155 160Ser Asn Asn Asn Gly Gly Ala Gly Ile Pro Asn Asn Glu Glu Gly Trp165 170 175Asn Ala Val Lys Glu Tyr Ala Asp Pro Ile Val Glu Met Leu Arg Asp180 185 190 195Ser Gly Asn Ala Asp Asp Asn Ile Ile Ile Val Gly Ser Pro Asn Trp200 205 210Ser Gln Arg Pro Asp Leu Ala Ala Asp Asn Pro Ile Asp Asp His His215 220 225Thr Met Tyr Thr Val His Phe Tyr Thr Gly Ser His Ala Ala Ser Thr230 235 240Glu Ser Tyr Pro Pro Glu Thr Pro Asn Ser Glu Arg Gly Asn Val Met245 250 255Ser Asn Thr Arg Tyr Ala Leu Glu Asn Gly Val Ala Val Phe Ala Thr260 265 270 275Glu Trp Gly Thr Ser Gln Ala Asn Gly Asp Gly Gly Pro Tyr Phe Asp280 285 290Glu Ala Asp Val Trp Ile Glu Phe Leu Asn Glu Asn Asn Ile Ser Trp295 300 305
Ala Asn Trp Ser Leu Thr Asn Lys Asn Glu Val Ser Gly Ala Phe Thr310 315 320Pro Phe Glu Leu Gly Lys Ser Asn Ala Thr Ser Leu Asp Pro Gly Pro325 330 335Asp Gln Val Trp Val Pro Glu Glu Leu Ser Leu Ser Gly Glu Tyr Val340 345 350 355Arg Ala Arg Ile Lys Gly Val Asn Tyr Glu Pro Ile Asp Arg Thr Lys360 365 370Tyr Thr Lys Val Leu Trp Asp Phe Asn Asp Gly Thr Lys Gln Gly Phe375 380 385Gly Val Asn Gly Asp Ser Pro Val Glu Asp Val Val Ile Glu Asn Glu390 395 400Ala Gly Ala Leu Lys Leu Ser Gly Leu Asp Ala Ser Asn Asp Val Ser405 410 415Glu Gly Asn Tyr Trp Ala Asn Ala Arg Leu Ser Ala Asp Gly Trp Gly420 425 430 435Lys Ser Val Asp Ile Leu Gly Ala Glu Lys Leu Thr Met Asp Val Ile440 445 450Val Asp Glu Pro Thr Thr Val Ser Ile Ala Ala Ile Pro Gln Gly Pro455 460 465Ser Ala Asn Trp Val Asn Pro Asn Arg Ala Ile Lys Val Glu Pro Thr470 475 480Asn Phe Val Pro Leu Gly Asp Lys Phe Lys Ala Glu Leu Thr Ile Thr485 490 495Ser Ala Asp Ser Pro Ser Leu Glu Ala Ile Ala Met His Ala Glu Asn
500 505 510 515Asn Asn Ile Asn Asn Ile Ile Leu Phe Val Gly Thr Glu Gly Ala Asp520 525 530Val Ile Tyr Leu Asp Asn Ile Lys Val Ile Gly Thr Glu Val Glu Ile535 540 545Pro Val Val His Asp Pro Lys Gly Glu Ala Val Leu Pro Ser Val Phe550 555 560Glu Asp Gly Thr Arg Gln Gly Trp Asp Trp Ala Gly Glu Ser Gly Val565 570 575Lys Thr Ala Leu Thr Ile Glu Glu Ala Asn Gly Ser Asn Ala Leu Ser580 585 590 595Trp Glu Phe Gly Tyr Pro Glu Val Lys Pro Ser Asp Asn Trp Ala Thr600 605 610Ala Pro Arg Leu Asp Phe Trp Lys Ser Asp Leu Val Arg Gly Glu Asn615 620 625Asp Tyr Val Thr Phe Asp Phe Tyr Leu Asp Pro Val Arg Ala Thr Glu630 635 640Gly Ala Met Asn Ile Asn Leu Val Phe Gln Pro Pro Thr Asn Gly Tyr645 650 655Trp Val Gln Ala Pro Lys Thr Tyr Thr Ile Asn Phe Asp Glu Leu Glu660 665 670 675Glu Ala Asn Gln Val Asn Gly Leu Tyr His Tyr Glu Val Lys Ile Asn680 685 690Val Arg Asp Ile Thr Asn Ile Gln Asp Asp Thr Leu Leu Arg Asn Met695 700 705
Met Ile Ile Phe Ala Asp Val Glu Ser Asp Phe Ala Gly Arg Val Phe710 715 720Val Asp Asn Val Arg Phe Glu Gly Ala Ala Thr Thr Glu Pro Val Glu725 730 735Pro Glu Pro Val Asp Pro Gly Glu Glu Thr Pro Pro Val Asp Glu Lys740 745 750 755Glu Ala Lys Lys Glu Gln Lys Glu Ala Glu Lys Glu Glu Lys Glu Ala760 765 770Val Lys Glu Glu Lys Lys Glu Ala Lys Glu Glu Lys Lys Ala Ile Lys775 780 785Asn Glu Ala Thr Lys Lys790<210>5<211>2343<212>DNA<213>芽孢杆菌pHSP-K38<220>
<221>CDS<222>(580)..(2067)<223>
<220>
<221>sig_peptide<222>(580)..(627)<223>
<220>
<221>mat_peptide<222>(628)..()<223>
<400>5agatctagca ggatttgccg atgcaaccgg cttatattta gagggaattt ctttttaaat60
tgaatacgga ataaaatcag gtaaacaggt cctgatttta tttttttgaa tttttttgag120aactaaagat tgaaatagaa gtagaagaca acggacataa gaaaattgta ttagttttaa180ttatagaaaa cgcttttcta taattattta tacctagaac gaaaatactg tttcgaaagc240ggtttactat aaaaccttat attccggctc tttttttaaa cagggggtga aaattcactc300tagtattcta atttcaacat gctataataa atttgtaaga cgcaatatac atcttttttt360tatgatattt gtaagcggtt aaccttgtgc tatatgccga tttaggaagg gggtagattg420agtcaagtag tcataattta gataacttat aagttgttga gaagcaggag agaatctggg480ttactcacaa gttttttaaa acattatcga aagcactttc ggttatgctt atgaatttag540ctatttgatt caattacttt aataatttta ggaggtaat atg atg tta aga aag 594Met Met Leu Arg Lys-15aaa aca aag cag ttg ggt cga cca gca caa gcc gat gga ttg aac ggt 642Lys Thr Lys Gln Leu Gly Arg Pro Ala Gln Ala Asp Gly Leu Asn Gly-10 -5 -1 1 5acg atg atg cag tat tat gag tgg cat ttg gaa aac gac ggg cag cat 690Thr Met Met Gln Tyr Tyr Glu Trp His Leu Glu Asn Asp Gly Gln His10 15 20tgg aat cgg ttg cac gat gat gcc gca gct ttg agt gat gct ggt att 738Trp Asn Arg Leu His Asp Asp Ala Ala Ala Leu Ser Asp Ala Gly Ile25 30 35aca gct att tgg att ccg cca gcc tac aaa ggt aat agt cag gcg gat 786Thr Ala Ile Trp Ile Pro Pro Ala Tyr Lys Gly Asn Ser Gln Ala Asp40 45 50gtt ggg tac ggt gca tac gat ctt tat gat tta gga gag ttc aat caa 834Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu Phe Asn Gln55 60 65aag ggt act gtt cga acg aaa tac gga act aag gca cag ctt gaa cga 882Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Ala Gln Leu Glu Arg70 75 80 85gct att ggg tcc ctt aaa tct aat gat atc aat gta tac gga gat gtc 930Ala Ile Gly Ser Leu Lys Ser Asn Asp Ile Asn Val Tyr Gly Asp Val90 95 100gtg atg aat cat aaa atg gga gct gat ttt acg gag gca gtg caa gct 978
Val Met Asn His Lys Met Gly Ala Asp Phe Thr Glu Ala Val Gln Ala105 110 115gtt caa gta aat cca acg aat cgt tgg cag gat att tca ggt gcc tac1026Val Gln Val Asn Pro Thr Asn Arg Trp Gln Asp Ile Ser Gly Ala Tyr120 125 130acg att gat gcg tgg acg ggt ttc gac ttt tca ggg cgt aac aac gcc1074Thr Ile Asp Ala Trp Thr Gly Phe Asp Phe Ser Gly Arg Asn Asn Ala135 140 145tat tca gat ttt aag tgg aga tgg ttc cat ttt aat ggt gtt gac tgg1122Tyr Ser Asp Phe Lys Trp Arg Trp Phe His Phe Asn Gly Val Asp Trp150 155 160 165gat cag cgc tat caa gaa aat cat att ttc cgc ttt gca aat acg aac1170Asp Gln Arg Tyr Gln Glu Asn His Ile Phe Arg Phe Ala Asn Thr Asn170 175 180tgg aac tgg cga gtg gat gaa gag aac ggt aat tat gat tac ctg tta1218Trp Asn Trp Arg Val Asp Glu Glu Asn Gly Asn Tyr Asp Tyr Leu Leu185 190 195gga tcg aat atc gac ttt agt cat cca gaa gta caa gat gag ttg aag1266Gly Ser Asn Ile Asp Phe Ser His Pro Glu Val Gln Asp Glu Leu Lys200 205 210gat tgg ggt agc tgg ttt acc gat gag tta gat ttg gat ggt tat cgt1314Asp Trp Gly Ser Trp Phe Thr Asp Glu Leu Asp Leu Asp Gly Tyr Arg215 220 225tta gat gct att aaa cat att cca ttc tgg tat aca tct gat tgg gtt1362Leu Asp Ala Ile Lys His Ile Pro Phe Trp Tyr Thr Ser Asp Trp Val230 235 240 245cgg cat cag cgc aac gaa gca gat caa gat tta ttt gtc gta ggg gaa1410Arg His Gln Arg Asn Glu Ala Asp Gln Asp Leu Phe Val Val Gly Glu250 255 260tat tgg aag gat gac gta ggt gct ctc gaa ttt tat tta gat gaa atg1458Tyr Trp Lys Asp Asp Val Gly Ala Leu Glu Phe Tyr Leu Asp Glu Met265 270 275aat tgg gag atg tct cta ttc gat gtt cca ctt aat tat aat ttt tac1506Asn Trp Glu Met Ser Leu Phe Asp Val Pro Leu Asn Tyr Asn Phe Tyr280 285 290cgg gct tca caa caa ggt gga agc tat gat atg cgt aat att tta cga1554Arg Ala Ser Gln Gln Gly Gly Ser Tyr Asp Met Arg Asn Ile Leu Arg
295 300 305gga tct tta gta gaa gcg cat ccg atg cat gca gtt acg ttt gtt gat1602Gly Ser Leu Val Glu Ala His Pro Met His Ala Val Thr Phe Val Asp310 315 320 325aat cat gat act cag cca ggg gag tca tta gag tca tgg gtt gct gat1650Asn His Asp Thr Gln Pro Gly Glu Ser Leu Glu Ser Trp Val Ala Asp330 335 340tgg ttt aag cca ctt gct tat gcg aca att ttg acg cgt gaa ggt ggt1698Trp Phe Lys Pro Leu Ala Tyr Ala Thr Ile Leu Thr Arg Glu Gly Gly345 350 355tat cca aat gta ttt tac ggt gat tac tat ggg att cct aac gat aac1746Tyr Pro Asn Val Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro Asn Asp Asn360 365 370att tca gct aaa aaa gat atg att gat gag ctg ctt gat gca cgt caa1794Ile Ser Ala Lys Lys Asp Met Ile Asp Glu Leu Leu Asp Ala Arg Gln375 380 385aat tac gca tat ggc acg cag cat gac tat ttt gat cat tgg gat gtt1842Asn Tyr Ala Tyr Gly Thr Gln His Asp Tyr Phe Asp His Trp Asp Val390 395 400 405gta gga tgg act agg gaa gga tct tcc tcc aga cct aat tca ggc ctt1890Val Gly Trp Thr Arg Glu Gly Ser Ser Ser Arg Pro Asn Ser Gly Leu410 415 420gcg act att atg tcg aat gga cct ggt ggt tcc aag tgg atg tat gta1938Ala Thr Ile Met Ser Asn Gly Pro Gly Gly Ser Lys Trp Met Tyr Val425 430 435gga cgt cag aat gca gga caa aca tgg aca gat tta act ggt aat aac1986Gly Arg Gln Asn Ala Gly Gln Thr Trp Thr Asp Leu Thr Gly Asn Asn440 445 450gga gcg tcc gtt aca att aat ggc gat gga tgg ggc gaa ttc ttt acg2034Gly Ala Ser Val Thr Ile Asn Gly Asp Gly Trp Gly Glu Phe Phe Thr455 460 465aat gga gga tct gta tcc gtg tac gtg aac caa taacaaaaag ccttgagaag 2087Asn Gly Gly Ser Val Ser Val Tyr Val Asn Gln470 475 480ggattcctcc ctaactcaag gctttcttta tgtcgcttag ctttacgctt ctacgacttt 2147gaagcttggg gatccgtcga gacaaggtaa aggataaaac agcacaattc caagaaaaac 2207
acgatttaga acctaaaaag aacgaatttg aactaactca taaccgagag gtaaaaaaag 2267aacgaagtcg agatcaggga atgagtttat aaaataaaaa aagcacctga aaaggtgtct 2327ttttttgatg tctaga 2343<210>6<211>496<212>PRT<213>芽孢杆菌pHSP-K38<400>6Met Met Leu Arg Lys Lys Thr Lys Gln Leu Gly Arg Pro Ala Gln Ala-15 -10 -5 -1Asp Gly Leu Asn Gly Thr Met Met Gln Tyr Tyr Glu Trp His Leu Glu1 5 10 15Asn Asp Gly Gln His Trp Asn Arg Leu His Asp Asp Ala Ala Ala Leu20 25 30Ser Asp Ala Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Tyr Lys Gly35 40 45Asn Ser Gln Ala Asp Val Gly Tyr 6ly Ala Tyr Asp Leu Tyr Asp Leu50 55 60Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys65 70 75 80Ala Gln Leu Glu Arg Ala Ile Gly Ser Leu Lys Ser Asn Asp Ile Asn85 90 95Val Tyr Gly Asp Val Val Met Asn His Lys Met Gly Ala Asp Phe Thr100 105 110Glu Ala Val Gln Ala Val Gln Val Asn Pro Thr Asn Arg Trp Gln Asp115 120 125
Ile Ser Gly Ala Tyr Thr Ile Asp Ala Trp Thr Gly Phe Asp Phe Ser130 135 140Gly Arg Asn Asn Ala Tyr Ser Asp Phe Lys Trp Arg Trp Phe His Phe145 150 155 160Asn Gly Val Asp Trp Asp Gln Arg Tyr Gln Glu Asn His Ile Phe Arg165 170 175Phe Ala Asn Thr Asn Trp Asn Trp Arg Val Asp Glu Glu Asn Gly Asn180 185 190Tyr Asp Tyr Leu Leu Gly Ser Asn Ile Asp Phe Ser His Pro Glu Val195 200 205Gln Asp Glu Leu Lys Asp Trp Gly Ser Trp Phe Thr Asp Glu Leu Asp210 215 220Leu Asp Gly Tyr Arg Leu Asp Ala Ile Lys His Ile Pro Phe Trp Tyr225 230 235 240Thr Ser Asp Trp Val Arg His Gln Arg Asn Glu Ala Asp Gln Asp Leu245 250 255Phe Val Val Gly Glu Tyr Trp Lys Asp Asp Val Gly Ala Leu Glu Phe260 265 270Tyr Leu Asp Glu Met Asn Trp Glu Met Ser Leu Phe Asp Val Pro Leu275 280 285Asn Tyr Asn Phe Tyr Arg Ala Ser Gln Gln Gly Gly Ser Tyr Asp Met290 295 300Arg Asn Ile Leu Arg Gly Ser Leu Val Glu Ala His Pro Met His Ala305 310 315 320
Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Glu Ser Leu Glu325 330 335Ser Trp Val Ala Asp Trp Phe Lys Pro Leu Ala Tyr Ala Thr Ile Leu340 345 350Thr Arg Glu Gly Gly Tyr Pro Asn Val Phe Tyr Gly Asp Tyr Tyr Gly355 360 365Ile Pro Asn Asp Ash Ile Ser Ala Lys Lys Asp Met Ile Asp Glu Leu370 375 380Leu Asp Ala Arg Gln Asn Tyr Ala Tyr Gly Thr Gln His Asp Tyr Phe385 390 395 400Asp His Trp Asp Val Val Gly Trp Thr Arg Glu Gly Ser Ser Ser Arg405 410 415Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asn Gly Pro Gly Gly Ser420 425 430Lys Trp Met Tyr Val Gly Arg Gln Asn Ala Gly Gln Thr Trp Thr Asp435 440 445Leu Thr Gly Asn Asn Gly Ala Ser Val Thr Ile Asn Gly Asp Gly Trp450 455 460Gly Glu Phe Phe Thr Asn Gly Gly Ser Val Ser Val Tyr Val Asn Gln465 470 475 480<210>7<211>22<212>DNA<213>人工序列<400>7aaggatgata atccgtcccg tg 22
<210>8<211>38<212>DNA<213>人工序列<400>8gttatccgct cacaattcgg atggtcatca atcactag 38<210>9<211>38<212>DNA<213>人工序列<400>9cgtcgtgact gggaaaactg cgaaatcaga cggtgtac 38<210>10<211>20<212>DNA<213>人工序列<400>10cgtcgcctat cggcgggcac 20<210>11<211>25<212>DNA<213>人工序列<400>11atgtatatag gaggttggtg gtatg 25<210>12<211>38<212>DNA<213>人工序列<400>12gttatccgct cacaattcgc tctgacatgt caacctcc 38<210>13<211>38<212>DNA<213>人工序列
<400>13cgtcgtgact gggaaaacag atgagaaagg aggagaag 38<210>14<211>23<212>DNA<213>人工序列<400>14ataactgtta ctatataatg gcc 23<210>15<211>20<212>DNA<213>人工序列<400>15gctggggatg acgaatccga 20<210>16<211>38<212>DNA<213>人工序列<400>16gttatccgct cacaattctc accttcatta tggaccac 38<210>17<211>38<212>DNA<213>人工序列<400>17cgtcgtgact gggaaaacca ccgtctcgaca aattccg 38<210>18<211>20<212>DNA<213>人工序列<400>18gttgccaagc gcgatatagg 20
<210>19<211>25<212>DNA<213>人工序列<400>19tatacaggga ttatcagtat tgagc 25<210>20<211>38<212>DNA<213>人工序列<400>20gttatccgct cacaattctt ttctccttgt tggatctg 38<210>21<211>38<212>DNA<213>人工序列<400>21cgtcgtgact gggaaaacgg ggataacgat ttatgaag 38<210>22<211>30<212>DNA<213>人工序列<400>22ttttgtaata atgatatgaa gctagtgttg 30<210>23<211>20<212>DNA<213>人工序列<400>23atatccagcc ctgcctcttc 20<210>24<211>58<212>DNA
<213>人工序列<400>24ctgtgtgaaa ttgttatccg ctcacaattc gaaatttcct cctaaagcga tcataacg 58<210>25<211>51<212>DNA<213>人工序列<400>25gtcgttttac aacgtcgttg actgggaaaa cccacaagct gctaacgtta c 51<210>26<211>20<212>DNA<213>人工序列<400>26tcctgtttgg gctcctgttg 20<210>27<211>26<212>DNA<213>人工序列<400>27tgtttatgta tggcggcctg cgggac 26<210>28<211>38<212>DNA<213>人工序列<400>28gttatccgct cacaattcag ctttccatat atctcacc 38<210>29<211>38<212>DNA<213>人工序列<400>29cgtcgtgact gggaaaacac ggtctgctga tgactgac 38
<210>30<211>20<212>DNA<213>人工序列<400>30gcgtttactt aagatgtcga 20<210>31<211>39<212>DNA<213>人工序列<400>31tttctagcgt ttcggcaaat tgagttaag 39<210>32<211>38<212>DNA<213>人工序列<400>32gttatccgct cacaattcct tactttcata cggctcac 38<210>33<211>38<212>DNA<213>人工序列<400>33cgtcgtgact gggaaaacga gacgtggcgc tcaccaac 38<210>34<211>29<212>DNA<213>人工序列<400>34cggattaaaa aaagaatatc gcggacagc 29<210>35<211>20
<212>DNA<213>人工序列<400>35tgccgctgcc cgccggagag 20<210>36<211>38<212>DNA<213>人工序列<400>36gttatccgct cacaattcaa ggtgtagaac ttccgttg 38<210>37<211>38<212>DNA<213>人工序列<400>37cgtcgtgact gggaaaacac catcaacagc ccctacac 38<210>38<211>24<212>DNA<213>人工序列<400>38tcaaataaag gcggcattca gtcc 24<210>39<211>22<212>DNA<213>人工序列<400>39ataatggtat ccaaatccac gc 22<210>40<211>38<212>DNA<213>人工序列<400>40
gttatccgct cacaattcat tcagtcatat gtatcacc 38<210>41<211>38<212>DNA<213>人工序列<400>41cgtcgtgact gggaaaacga tccatcatac acagcatg 38<210>42<211>28<212>DNA<213>人工序列<400>42cacttctcaa cggaggggat ttcacatc 28<210>43<211>20<212>DNA<213>人工序列<400>43taatggagga gagaaggccg 20<210>44<211>38<212>DNA<213>人工序列<400>44gttatccgct cacaattcag tcgcccatga agcatgag 38<210>45<211>42<212>DNA<213>人工序列<400>45cgtcgtgact gggaaaacac caaaaaatgc tgagctgaca gc 42<210>46
<211>26<212>DNA<213>人工序列<400>46ttgccaatga tgaggaaaaa ggaacc 26<210>47<211>26<212>DNA<213>人工序列<400>47ctgaacgtcttgaataaaaaagcagg 26<210>48<211>38<212>DNA<213>人工序列<400>48gttatccgct cacaattcgc tgaagtttca tatccatc 38<210>49<211>38<212>DNA<213>人工序列<400>49cgtcgtgact gggaaaacat tccgtcatcg gcagcgag 38<210>50<211>20<212>DNA<213>人工序列<400>50agcggtttac aagttggagg 20<210>51<211>22<212>DNA<213>人工序列
<400>51atttcagaag gcatacttca ag 22<210>52<211>38<212>DNA<213>人工序列<400>52gttatccgct cacaattcca tacttggtgt tgtcatcg 38<210>53<211>40<212>DNA<213>人工序列<400>53cgtcgtgact gggaaaacca taatcagtaa aaaggcggtc 40<210>54<211>20<212>DNA<213>人工序列<400>54ttctgaccgc tctggcaacc 20<210>55<211>20<212>DNA<213>人工序列<400>55ataatgcccg cttcccaacc 20<210>56<211>38<212>DNA<213>人工序列<400>56gttatccgct cacaattccg atcctcagct cctttgtc 38
<210>57<211>38<212>DNA<213>人工序列<400>57cgtcgtgact gggaaaactc atctgatacc gattaacc 38<210>58<211>20<212>DNA<213>人工序列<400>58caactgaatc cgaaggaatg 20<210>59<211>20<212>DNA<213>人工序列<400>59tcggggtcat gccgagcggt 20<210>60<211>38<212>DNA<213>人工序列<400>60gttatccgct cacaattcca atgttgccat tttcatcc 38<210>61<211>38<212>DNA<213>人工序列<400>61cgtcgtgact gggaaaactt gtacgagaat caacgctg 38<210>62<211>20<212>DNA<213>人工序列
<400>62cacggcaatg cattcttcgg 20<210>63<211>21<212>DNA<213>人工序列<400>63agatctgtcg gccaggttta c 20<210>64<211>38<212>DNA<213>人工序列<400>64gttatccgct cacaattctg atttttctgt catgtctc 61<210>65<211>38<212>DNA<213>人工序列<400>65cgtcgtgact gggaaaacgg tagagatgtg caccgaaa 38<210>66<211>20<212>DNA<213>人工序列<400>66gagtcagacg gcatcgatga 20<210>67<211>23<212>DNA<213>人工序列<400>67ttctgattca ttttcactgc tgg 23
<210>68<211>38<212>DNA<213>人工序列<400>68gttatccgct cacaattcaa cggataattc ttccaatc 38<210>69<211>37<212>DNA<213>人工序列<400>69cgtcgtgact gggaaaactg tccatgaagt caaatcc 37<210>70<211>20<212>DNA<213>人工序列<400>70cgctgaaata ttctctcgca 20<210>71<211>21<212>DNA<213>人工序列<400>71cgccgctttc accgcggatt c 21<210>72<211>38<212>DNA<213>人工序列<400>72gttatccgct cacaattcct ttgaccactg tatgaacc 38<210>73<211>38<212>DNA
<213>人工序列<400>73cgtcgtgact gggaaaacac tcgtctaacg aataatcc 38<210>74<211>20<212>DNA<213>人工序列<400>74tgtcatcacg gaatttgacg 20<210>75<211>30<212>DNA<213>人工序列<400>75ccaaattatc ctttgtgagc gcggaatcag 30<210>76<211>38<212>DNA<213>人工序列<400>76gttatccgct cacaattccg tagatcgtaa tattgctc 38<210>77<211>38<212>DNA<213>人工序列<400>77cgtcgtgact gggaaaacag cttagaaagt caaccaag 38<210>78<211>20<212>DNA<213>人工序列<400>78tttgagcatc agcacaagcc 20
<210>79<211>21<212>DNA<213>人工序列<400>79tgtagcagaa gcagtcgaat t 21<210>80<211>40<212>DNA<213>人工序列<400>80ctaatgggtg ctttagttga caattacgca gctgtcatgt 40<210>81<211>41<212>DNA<213>人工序列<400>81ctgccccgtt agttgaagaa ctgataaacc gtgaaaaagt g 41<210>82<211>20<212>DNA<213>人工序列<400>82cctttgaaaa aggctcccgt 20<210>83<211>29<212>DNA<213>人工序列<400>83gttttccaag tctgccgata aaaatatgc 29<210>84<211>38
<212>DNA<213>人工序列<400>84gttatccgct cacaattcat gcttcatgta cctacacc 38<210>85<211>38<212>DNA<213>人工序列<400>85cgtcgtgact gggaaaacca attaacgatt cgcatacc 38<210>86<211>30<212>DNA<213>人工序列<400>86aaaaagaaga agtcacagta cagaacgtgg 30<210>87<211>23<212>DNA<213>人工序列<400>87atttttcgcc atcttgaatt ttc 23<210>88<211>40<212>DNA<213>人工序列<400>88ctaatgggtg ctttagttgg atgatcctct cgttgaactg 40<210>89<211>39<212>DNA<213>人工序列<400>89
ctgccccgtt agttgaaggg atgagccttc agaaaagtt 39<210>90<211>20<212>DNA<213>人工序列<400>90gccggacaga gatctgtatg 20<210>91<211>45<212>DNA<213>人工序列<400>91gaagaaggtt tttatgttga cgcttttttg cccaatactg tataa 45<210>92<211>45<212>DNA<213>人工序列<400>92caaaaaagcg tcaacataaa aaccttcttc aactaacggg gcagg 45<210>93<211>30<212>DNA<213>人工序列<400>93aagacgagta cttttctctc taaatcactt 30<210>94<211>30<212>DNA<213>人工序列<400>94aactcgatca aatggtgaca ggacagcatc 30<210>95
<211>45<212>DNA<213>人工序列<400>95ggagaataaa gaccctcttc aactaaagca cccattagtt caaca 45<210>96<211>45<212>DNA<213>人工序列<400>96tgctttagtt gaagagggtc tttattctcc cacagggttt cgttt 45<210>97<211>45<212>DNA<213>人工序列<400>97tttttatatt acagcgagtt ggcgttaaat gaatgaagcg ataga 45<210>98<211>45<212>DNA<213>人工序列<400>98atttaacgcc aactcgctgt aatataaaaa ccttcttcaa ctaac 45<210>99<211>30<212>DNA<213>人工序列<400>99ttgattgatg ataaattcag gcaggtgcag 30<210>100<211>30<212>DNA<213>人工序列
<400>100caaagcttga gaaatgttcc catgctcttg 30<210>101<211>45<212>DNA<213>人工序列<400>101caggaggaac atatctcttc aactaaagca cccattagtt caaca 45<210>102<211>45<212>DNA<213>人工序列<400>102tgctttagtt gaagagatat gttcctcctg ttccgggctg ccccg 45<210>103<211>25<212>DNA<213>人工序列<400>103attccagtta ctcgtaatat agttg 25<210>104<211>38<212>DNA<213>人工序列<400>104gttatccgct cacaattcac ttcatcatcc attagctc 38<210>105<211>38<212>DNA<213>人工序列<400>105cgtcgtgact gggaaaacct gctccaaatc cgatttcc 38
<210>106<211>23<212>DNA<213>人工序列<400>106gtcctgcatt tttcgaagtc tgg 23<210>107<211>30<212>DNA<213>人工序列<400>107tacacatcct tcaaacaagt ctgaacaaac 30<210>108<211>45<212>DNA<213>人工序列<400>108tgctttagtt gaagattacc agttccataa ttccacctcg ccgac 45<210>109<211>45<212>DNA<213>人工序列<400>109tttttatatt acagcgtgtg tataccattg tatctgtaga tacga 45<210>110<211>30<212>DNA<213>人工序列<400>110gctatgatca ttgtaacgaa aggaaagggg 30<210>111<211>45<212>DNA<213>人工序列
<400>111ttatggaact ggtaatcttc aactaaagca cccattagtt caaca 45<210>112<211>45<212>DNA<213>人工序列<400>112caatggtata cacacgctgt aatataaaaa ccttcttcaa ctaac 45<210>113<211>30<212>DNA<213>人工序列<400>113aatctgaaca agaaaaagga gctgctcctc 30<210>114<211>45<212>DNA<213>人工序列<400>114tgctttagtt gaagaattca atctccctcc atgtcagctt attta 45<210>115<211>45<212>DNA<213>人工序列<400>115tttttatatt acagcagaaa cgcctgaaat gaaccggccc tatag 45<210>116<211>30<212>DNA<213>人工序列<400>116tgtttgacaa aggtagaacg tctgcttatc 30
<210>117<211>45<212>DNA<213>人工序列<400>117ggagggagat tgaattcttc aactaaagca cccattagtt caaca 45<210>118<211>45<212>DNA<213>人工序列<400>118atttcaggcg tttctgctgt aatataaaaa ccttcttcaa ctaac 45<210>119<211>18<212>DNA<213>人工序列<400>119gaattgtgag cggataac 18<210>120<211>18<212>DNA<213>人工序列<400>120gttttcccag tcacgacg 18<210>121<211>19<212>DNA<213>人工序列<400>121caactaaagc acccattag 19<210>122<211>18<212>DNA
<213>人工序列<400>122cttcaactaa cggggcag 18
权利要求
1.一种重组微生物,其通过将编码异性蛋白质或多肽的基因转移到枯草杆菌基因comA、yopO、treR、yvbA、cspB、yvaN、yttP、yurK、yozA、licR、sigL、mntR、glcT、yvdE、ykvE、slr、rocR、ccpA、yaaT、yyaA、yycH、yacP、hprK、rsiX、yhdK以及ylbO的任意一种或一个或多个与这些基因的任意一种功能相当的基因缺失或被剔除的微生物的突变株上而制备。
2.如权利要求1所述的重组微生物,其中所述微生物是枯草杆菌或属于芽孢杆菌属的另一细菌。
3.如权利要求1或2所述的重组微生物,其中一个或多个选自转录起始调节区域、转译起始调节区域和分泌信号区域的区域接合到编码异性蛋白或多肽的基因的上游区域。
4.如权利要求3所述的重组微生物,其中所述一个或多个区域是由转录起始调节区域、转译起始调节区域和分泌信号区域构成的三个区域。
5.如权利要求3或4所述的重组微生物,其中所述分泌信号区域来自属于芽孢杆菌属的细菌的纤维素酶基因,而转录起始调节区域和转译起始调节区域各自来自该纤维素酶基因上游的0.6至1kb区域。
6.如权利要求4所述的重组微生物,其中由所述转录起始调节区域、所述转译起始调节区域和所述分泌信号区域构成的三个区域是序列号1的纤维素酶基因的碱基数为1至659的核苷酸序列;序列号3的纤维素酶基因的碱基数为1至696的核苷酸序列;含有与所述核苷酸序列的任意一种具有70%同源性的核苷酸序列的DNA片段;或含有缺失了所述核苷酸序列的任意一种的一部分的核苷酸序列的DNA片段。
7.一种生产蛋白质或多肽的方法,其使用如权利要求1至6任意一项所述的重组微生物。
全文摘要
一种重组微生物,其通过将编码蛋白质或多肽的基因转移到能够以提高的生产率生产蛋白质或多肽的宿主微生物上而获得,以及使用该重组微生物生产蛋白质或多肽的方法。该重组微生物通过将编码异性蛋白质或多肽的基因转移到枯草杆菌基因comA、yopO、treR、yvbA、cspB、yvaN、yttP、yurK、yozA、licR、sigL、mntR、glcT、yvdE、ykvE、slr、rocR、ccpA、yaaT、yyaA、yycH、yacP、hprK、rsiX、yhdK以及ylbO的任意一种或一个或多个与这些基因的任意一种功能相当的基因缺失或被剔除的微生物的突变株上而制备。
文档编号C12R1/125GK1875106SQ200480031689
公开日2006年12月6日 申请日期2004年11月5日 优先权日2003年11月7日
发明者东畑正敏, 泽田和久, 尾崎克也, 小林和夫, 小笠原直毅 申请人:花王株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1