经过修饰的启动子的制作方法

文档序号:430453阅读:240来源:国知局
专利名称:经过修饰的启动子的制作方法
技术领域
本发明涉及经过修饰的启动子DNA、含有该DNA的表达载体、含有该表达载体的重组微生物以及利用该重组微生物的蛋白质或多肽的制造方法。
背景技术
利用微生物的有用物质的工业生产,以酒精饮料和味噌、酱油等的食品类为代表,还有氨基酸、有机酸、核酸相关物质、抗生素、糖、脂质和蛋白质等,其种类跨越多方面,而且关于其用途,也扩展到广泛的领域直到食品、医药和洗涤剂、化妆品等的日用品或各种化学合成品原料等。
在这样的利用微生物的有用物质的工业生产中,其生产率的提高是一个重要课题,作为其手段,可以进行利用突变等的遗传学手段的生产菌的育种。另一方面,由于微生物遗传学和生物技术的进步,特别是最近,使用基因重组技术等更更有效的有用物质的生产得到关注。
关于基因转录中需要的启动子的研究也进行了很多,作为在枯草杆菌(Bacillussubtilis)中强有力地转录编码异种蛋白质或多肽的基因的启动子区域,例如,可以利用来自芽孢杆菌sp(Bacillussp.)KSM-64株(FERM BP-2886)的碱性纤维素酶基因的启动子区域(例如,参考非专利文献1)、或者存在于来自芽孢杆菌sp KSM-S237株(FERMBP-7875)的碱性纤维素酶基因(例如,参考专利文献1)的上游部位的启动子区域等。
但是,在工业生产中需要降低生产成本,而即使在现在所使用的上述那样的启动子领域内生产率提高的效果也不能称为充分,需要更高的生产率。
日本特开2000-210081号公报[非专利文献2]Biosci.Biotech.Biochem.,59,2172,(1995)

发明内容
本发明提供一种对含有由SigA识别的启动子及其附近的碱基的碱基序列,进行修饰以使得被SigA和SigE识别而形成的启动子DNA。
而且,本发明提供含有该启动子DNA的表达载体、含有该表达载体的重组微生物、以及以培养该重组微生物为特征的蛋白质或多肽的制造方法。
此外,本发明提供一种启动子DNA的构建方法,其特征在于,对含有由SigA识别的启动子及其附近的碱基的碱基序列进行修饰,以使得被SigA和SigE识别。


图1是表示使用SOE-PCR法的SigE识别启动子序列的导入方法的示意图;图2是表示导入了SigE识别启动子序列的碱性纤维素酶生产用的质粒的构建方法的示意图。
具体实施例方式
本发明涉及提供一种使编码蛋白质或多肽的基因的转录量提高的经过修饰的启动子DNA,以及一种使用其的蛋白质或多肽的有效制造方法。
在枯草杆菌中,作为RNA聚合酶复合体的亚单位而参与启动子序列的识别的σ因子鉴定有17个,以在营养增殖期中参与生殖所必需的基因的转录的主要σ因子(管家σ因子)SigA为代表,存在控制孢子形成过程的σ因子SigH、SigF、SigE、SigG、SigK,控制鞭毛形成和细胞壁溶解的σ因子SigD,控制某种氨基酸或糖的代谢的σ因子SigL,控制对环境变化的响应的σ因子SigB或称为ECFσ的σ因子等。结合在由除σ因子之外的5个(α、β、β’、δ、ω)亚单位构成的RNA聚合酶轴心复合体(core complex)上的各σ因子,被认为通过每个σ因子参与不同的启动子序列的识别,从而控制不同的基因的转录,由此,对存在于基因组上的4100多个基因、进行根据情况的基因的表达控制。
有报告称,尽管在营养增殖期内,主要是SigA与RNA聚合酶轴心复合体会合,诱导具有SigA识别的启动子的基因或操纵子的转录,但是进入孢子形成期而控制孢子形成过程的σ因子被活化时,引起与RNA聚合酶轴心复合体会合的σ因子的置换,与SigA会合的RNA聚合酶的量相对下降(J.Bacteriol.,179,4969,(1999))。因此,被认为在孢子形成期之后,来自通过SigA识别的启动子的转录量相对下降。
鉴于这种情况,本发明者们发现,对含有由枯草杆菌的σ因子SigA识别的启动子DNA片段,利用基因工程学的操作实施碱基的修饰,在保留该启动子的功能、重新构建由SigE识别的序列的情况下,可以提高编码在下游处连接的蛋白质或多肽的基因的转录量。
和使用天然启动子的情况相比,本发明的启动子DNA可以极大地提高编码在下游处连接的蛋白质或多肽的基因的转录量,可以有效地生产蛋白质或多肽。
在本发明中,氨基酸序列和碱基序列的同一性,通过Lipman-Pearson法(Science,227,1435,(1985))计算。具体地说,通过使用遗传信息处理软件Genetyx-Win(软件开发)的同源性解析(Searchhomology)程序,将参数Unit size to compare(ktup)设为2进行分析而算出。
通常,σ因子识别并结合存在于转录起始点的上游10碱基和35碱基附近的数个碱基序列,分别称为-10区域、-35区域。另外,两区域的序列、两区域间的距离,已知每个σ因子分别具有共通的特征,称为共有序列,可以认为作为启动子的本体。有报告称,SigA的共有序列,为由用TTGaca表示的-35区域、用在其14碱基之后连接的tgnTAtaat所表示的-10区域所形成(n为A或G或C或T。此外,大写字母表示保存性高,而小写字母表示保存性低。Bacillus Subtilis andIts Closest RelativesFrom Genes to Cells,Edited by A.L.Sonenshein,American Society for Microbiology,pp289,(2002))。并且,有报告称,在上述序列号1的碱基号92~552、序列号2的碱基号133~589之间,存在多个SigA的共有序列(Biosci Biotechnol Biochem.64,2281,2000、Biosci Biotechnol Biochem.56,872,(1992))。
因此,作为含有本发明的由SigA识别的启动子及其附近的碱基的碱基序列,优选含有由序列号1所表示的碱基号92~552的碱基序列、由序列号2所表示的碱基序列的碱基号133~589的碱基序列,或者包含具有对该碱基序列具有80%以上、优选90%以上、更优选95%以上、特别优选98%以上的同一性的碱基序列、且是具有SigA的共有序列的碱基序列和/或具有相同的启动子功能的碱基序列,或者,具有由序列号1所表示的碱基序列、由序列号2所表示的碱基序列、或者对该碱基序列具有90%、优选95%以上、更优选98%以上的同一性的碱基序列、且是具有SigA的共有序列的和/或具有相同的启动子功能的。作为上述由含有序列号1所表示的碱基号92~552的碱基序列的碱基序列,优选在序列号1中含有碱基号的92~552的461~570bp的连续的碱基序列,更优选为461~520bp,特别优选461~480bp的连续的碱基序列。作为上述含有由序列号2所表示的碱基号133~589的碱基序列的碱基序列,优选在序列号2中含有碱基号133~589的457~610bp的连续的碱基序列,更优选为457~520bp,特别优选457~480bp以下的连续的碱基序列。
在此,由序列号1所表示的碱基序列是存在于来自芽孢杆菌sp.KSM-S237株(FERM BP-7875)的碱性纤维素酶基因的上游的,由序列号2所表示的碱基序列是存在于来自芽孢杆菌sp.KSM-64株(FERMBP-2886)的碱性纤维素酶基因的上游的,两者具有95.6%的同一性。
本发明的启动子DNA,对上述碱基序列实施碱基的修饰,进行构建以使得除了SigA,也可以由SigE识别。在此,所构建的启动子序列可以是单独的,也可以是多个。
另一方面,有报道称,由SigE识别的启动子序列为,由ATAHTT(H为A或C或T)所表示的-35区域、和、在其13或14碱基之后连接的CATAYAHT(Y为C或T)所表示的-10区域形成的碱基序列,优选为由ATATTT所表示的-35区域和在其13或14碱基之后连接的CATACAAT所表示的-10区域形成的碱基序列,更优选为由ATATTTCAAGTAGTAATAACATACAAT所形成的碱基序列(J.Mol.Biol.327,945,(2003)),优选该碱基序列为重新构建的。
在本发明中的最优选的启动子DNA,可以举出,由序列号7所表示的、将序列号1修饰的碱基序列,或者由序列号8所表示的、将序列号2修饰的碱基序列。
碱基的修饰,尽管可以通过插入具有由上述SigE识别的启动子序列的DNA片段,或者缺失、置换或者插入1个或多个碱基而进行,但是其中优选通过置换1个或多个碱基而进行的方法。即,例如在来源于在质粒载体上克隆的来自芽孢杆菌sp.KSM-S237株(FERMBP-7875)的碱性纤维素酶基因的上游的DNA片段(序列号1)或者来源于来自芽孢杆菌sp.KSM-64株(FERM BP-2886)的碱性纤维素酶基因的上游的DNA片段(序列号2)的任意部位处,通过Kunkel法(Proc.Natl.Acad.Sci.USA.,82,488,1985)等的部位特异的变异导入法而导入限制性内切酶的识别部位,另一方面,通过化学合成等制备在两端添加有该限制性内切酶识别部位的含有由SigE识别的启动子序列的DNA片段后,可以通过用酶结合由该限制性内切酶处理过的两个片段,从而构建插入由SigE识别的启动子序列的启动子DNA。
此外,可以通过将来自于由序列号1或序列号2所表示的碱性纤维素酶基因的上游处的DNA片段的一部分通过SOE(重叠延伸拼接法,splicing by overlap extension)-PCR法(Gene,77,51,1989)等而进行碱基置换,从而构建该DNA片段。
下面,更具体地说明通过使用SOE-PCR法在由序列号1所表示的碱基序列所形成的DNA片段的一部分上施行碱基置换,重新构建由SigE识别的启动子(序列)的方法。
首先,通过第一次的PCR制备将实施了碱基置换的部位作为下游末端的上游侧DNA片段、以及将实施了碱基置换的部位作为上游末端的下游侧DNA片段,但是此时,例如,实施设计以使得,在用于上游侧DNA片段的下游侧以及下游侧DNA片段的上游侧的引物中,相互退火、且由SigE识别的启动子序列被重新构建(图1)。
随后,将在第一次的PCR中制备的2种DNA片段作为模板,通过使用上游侧DNA片段的上游侧引物和下游侧DNA片段的下游侧引物进行第二次的PCR,在上游侧DNA片段的下游末端和下游侧DNA片段的上游末端之间发生退火,PCR扩增的结果是可以得到2个DNA片段连接、且在其连接部分处重新构建有由SigE识别的启动子序列的DNA片段(图1)。
如此构建的启动子DNA,由于除了SigA、还能被SigE识别,所以即使在孢子形成期中,也可以进行编码在其下游处连接的蛋白质或多肽的基因的转录。
即,在通过枯草杆菌重组生产异种蛋白质或多肽时,通过在编码目标蛋白质或多肽的基因的上游处连接该启动子DNA,该基因除了在营养增殖期内由与SigA会合的RNA聚合酶转录,而且还在继营养增殖期之后的孢子形成期内由与SigE会合的RNA聚合酶转录,并且还在孢子形成期内维持该基因的转录。因此,导入有含有该启动子DNA的表达载体的重组枯草杆菌,与使用在重新构建由SigE识别的启动子序列之前的天然的启动子的情况相比较,可以生产大量的目标蛋白质或多肽。
目标蛋白质或多肽的基因,没有特别限制,包括洗涤剂、食品、纤维、饲料、化学品、医疗、诊断等各种工业用酶以及生物活性肽等。此外,尽管按照工业用酶的功能分类,包括氧化还原酶(Oxidoreductase)、转移酶(Transferase)、水解酶(Hydrolase)、裂解酶(Lyase)、异构酶(Isomerase)、合成酶(Ligase/Synthetase)等,但优选的可以举出,纤维素酶、α-淀粉酶、蛋白酶等水解酶的基因。具体地说,可以举出,在多糖水解酶的分类(Biochem.J.,280,309(1991))中属于族5的纤维素酶,也可以举出其中来自微生物、特别是来自芽孢杆菌属细菌的纤维素酶。作为更具体的例子,可以举出,由用序列号4或序列号6所表示的氨基酸序列所组成的、分别来自芽孢杆菌sp.KSM-S237株(FERM BP-7875)或芽孢杆菌sp.KSM-64株(FERMBP-2886)的纤维素酶,或者由与该氨基酸序列具有70%、优选80%、更优选90%以上、进一步优选95%以上、特别优选98%以上的同一性的氨基酸序列构成的纤维素酶。
而且,作为α-淀粉酶的具体例子,可以举出来自微生物的α-淀粉酶,特别优选来自芽孢杆菌属细菌的液化型淀粉酶。作为更具体的例子,可以举出由用序列号14所表示的氨基酸序列组成的来自芽孢杆菌属sp.KSM-K38株(FERM BP-6946)的碱性纤维素酶,或者由与该氨基酸序列具有70%、优选80%、更优选90%以上、进一步优选95%以上、特别优选98%以上的同一性的氨基酸序列所组成的纤维素酶。此外,作为蛋白酶的具体例子,可以举出来自微生物、特别是来自芽孢杆菌属细菌的丝氨酸蛋白酶和金属蛋白酶等。
另一方面,希望目标蛋白质或多肽的基因,除了本发明的启动子DNA,还适当地结合有与该基因的翻译、分泌有关的控制区域,即,核糖体结合部位(SD序列)和含有起始密码子的翻译起始区域和分泌用信号肽区域。希望适当地与目标蛋白质或多肽的结构基因结合有,例如,在日本特开2000-210081号公报和日本特开平4-190793号公报等中记载的来自芽孢杆菌属细菌、即KSM-S237株(FERM BP-7875)和KSM-64株(FERM BP-2886)的纤维素酶基因的翻译起始区域、分泌用信号肽区域,更具体地说为,由序列号3所表示的碱基序列的碱基号563~659的碱基序列或由用序列号5所表示的碱基序列所组成的纤维素酶基因的碱基号600~696的碱基序列,或者由相对于该碱基序列具有70%以上、优选80%以上、更优选90%以上、进一步优选95%以上、特别优选98%以上的同一性的碱基序列所构成的DNA片段,或者由上述任意碱基序列的一部分缺失的碱基序列组成的DNA片段。
可以通过将在含有上述目标蛋白质或多肽基因的DNA片段的上游处连接有本发明的启动子DNA并插入到适合的载体中的表达载体,按照一般的转化法摄入到枯草杆菌中并构建重组微生物,而使目标蛋白质或多肽的生产率提高。此外,也可以由通过使用在本发明的启动子DNA上结合有与枯草杆菌基因组适当的相同区域的DNA片段、而直接编入枯草杆菌基因组中而构建的重组菌株,使目标蛋白质或多肽的生产率提高。
使用本发明的启动子DNA的目标蛋白质或多肽的制造,可以通过,将上述重组微生物接种到含有同化性的碳源、氮源、其它必需成分的培养基中,按照常规的微生物培养方法培养,培养结束后,收集精制蛋白质或多肽而进行。
以下,使用实施例,对本发明的DNA片段的构建方法以及利用该DNA片段的纤维素酶的重组生产方法进行具体说明。
实施例实施例1 SigE识别启动子(序列)向碱性纤维素酶基因的上游区域的构建如图2所示地,进行了SigE识别启动子序列向碱性纤维素酶基因的上游区域的导入。即,在穿梭载体pHY300PLK的BamHI限制性内切酶的切断位点处,将插入有编码来自芽孢杆菌sp.(Bacillussp.)KSM-S237株(FERM BP-7875)的碱性纤维素酶基因(日本特开2000-210081号公报)的DNA片段(3.1kb)的重组质粒pHY-S237作为模板,用表1中所示的237UB1和EP1UPr的引物组制备碱性纤维素酶基因的上游区域0.4kb片段(A)。同样用表1中所示的EP1DNf和S237RV的引物组制备碱性纤维素酶基因的下游区域2.7kb片段(B)。随后,通过将所得的(A)(B)2片段混合后作为模板,进行使用表1中所示的237UB1和S237RV的引物组的SOE-PCR,按照(A)(B)的顺序使2片段结合而得到3.1kb的DNA片段(C)。对引物EP1UPr和EP1DNf分别实施碱基置换,如图2所示,在DNA片段(C)中在从碱性纤维素酶基因的翻译起始部位开始大约150bp的上游区域处重新构建SigE识别启动子(序列)。将得到的3.1kb的DNA片段(C)插入穿梭载体pHY300PLK的SmaI限制性内切酶切断点,构建重组质粒pHY-S237EP1。并将重组质粒pHY-S237作为模板,用表1中所示的237UB1和S237RV的引物组制备含有碱性纤维素酶基因的整个区域的3.1kb片段(D),并将其插入穿梭载体pHY300PLK的SmaI限制性内切酶切断点,构建重组质粒pHY-S237W。
实施例2 碱性纤维素酶的分泌生产评价将实施例1中所得的重组质粒pHY-S237EP1和作为对照的重组质粒pHY-S237W,通过原生质体转化法导入枯草杆菌168株中。将由此得到的菌株在10mL的LB培养基中37℃进行振荡培养一夜,并将该培养液0.05mL接种到50mL的2×L-麦芽糖培养基(2%胰胨、1%酵母提取物、1%NaCl、7.5%麦芽糖、7.5ppm硫酸锰4-5水合物和15ppm四环素)中,在30℃进行振荡培养3天。培养后,测定通过离心分离除去菌体的培养液上清液的碱性纤维素酶活性,从而求得通过培养在菌体外分泌生产的碱性纤维素酶的量。如表2所示,其结果发现,和对照的pHY-S237W(野生型)的情况相比,作为重组质粒使用pHY-S237EP1的情况有高的碱性纤维素酶的分泌生产。由此推测,在使用pHY-S237EP1的情况中,除了从由SigA识别的启动子开始的转录,还通过进行从重新构建的由SigE识别的启动子开始的转录,提高了纤维素酶分泌生产率。
表1

表2

实施例3 对导入有SigE识别启动子(序列)的碱性纤维素酶基因上游区域的碱性纤维素酶的生产的有效性的验证将实施例1中构建的质粒pHY-S237EP1作为模板,用表3中所示的S237ppp-F2(BamHI)和S237ppp-R2(ALAA)的引物组进行PCR,扩增含有导入了SigE识别启动子(序列)的碱性纤维素酶基因的启动子区域和编码分泌信号序列的区域的0.6kb的DNA片段(E)。而且,将从芽孢杆菌sp.(Bacillussp.)KSM-K38株(FERM BP-6946)提取的基因组DNA作为模板,用表3中所示的K38matu-F2(ALAA)和SP64K38-R(XbaI)的引物组进行PCR,将编码具有由序列号14所表示的氨基酸序列的碱性纤维素酶(Appl.Environ.Microbiol.,67,1744,(2001))的1.5kb的DNA片段(F)进行扩增。随后将所得的(E)(F)2片段混合后作为模板,通过用表3中所示的S237ppp-F2(BamHI)和SP64K38-R(XbaI)的引物组进行SOE-PCR,得到在导入有SigE识别启动子(序列)的碱性纤维素酶基因的启动子区域和在其之后的编码分泌信号序列的区域的下游处连接有碱性纤维素酶基因的2.1kb的DNA片段(G)。将得到的2.2kb的DNA片段(G)插入穿梭载体pHY300PLK(Yakult)的BamHI-XbaI限制性内切酶切断点,构建重组质粒pHY-K38(S237ps)EP1。此外,通过将上述用于0.6kb的DNA片段(E)的扩增的模板取代为实施例1中构建的质粒pHY-S237W,同样构建重组质粒pHY-K38(S237ps)W。
将重组质粒pHY-K38(S237ps)EP1和作为对照的pHY-K38(S237ps)W,通过原生质体转化法导入枯草杆菌168株中。将由此得到的菌株在与实施例2相同的条件下进行振荡培养5天。培养后,测定通过离心分离除去了菌体的培养液上清液的碱性纤维素酶活性,从而求得通过培养在菌体外分泌生产的碱性纤维素酶的量。其结果,如表4所示,和对照的pHY-K38(S237ps)W(野生型)的情况相比,使用pHY-K38(S237ps)EP1作为重组质粒的情况可以看到高的碱性纤维素酶的分泌生产。由此,显示出导入有SigE识别启动子(序列)的碱性纤维素酶基因上游区域在各种蛋白质或多肽的生产中是有效的。
表3

表4

序列表<110>花王株式会社(KAO CORPORATION)<120>经过修饰的启动子<130>KS0817<150>JP 2004-062853<151>2004.03.05<160>18<170>PatentIn Ver.3.1<210>1<211>572<212>DNA<213>芽孢杆菌sp.KSM-S237<400>1gatttgccga tgcaacaggc ttatatttag aggaaatttc tttttaaatt gaatacggaa 60taaaatcagg taaacaggtc ctgattttat ttttttgagt tttttagaga actgaagatt120gaaataaaag tagaagacaa aggacataag aaaattgcat tagttttaat tatagaaaac180gcctttttat aattatttat acctagaacg aaaatactgt ttcgaaagcg gtttactata240aaaccttata ttccggctct tttttaaaac agggggtaaa aattcactct agtattctaa300tttcaacatg ctataataaa tttgtaagac gcaatatgca tctctttttt tacgatatat360gtaagcggtt aaccttgtgc tatatgccga tttaggaagg ggggtagatt gagtcaagta420gtaataatat agataactta taagttgttg agaagcagga gagcatctgg gttactcaca480agttttttta aaactttaac gaaagcactt tcggtaatgc ttatgaattt agctatttga540ttcaattact ttaaaaatat ttaggaggta at 572<210>2<211>609
<212>DNA<213>芽孢杆菌sp.KSM-64<400>2agtacttacc attttagagt caaaagatag aagccaagca ggatttgccg atgcaaccgg 60cttatattta gagggaattt ctttttaaat tgaatacgga ataaaatcag gtaaacaggt120cctgatttta tttttttgaa tttttttgag aactaaagat tgaaatagaa gtagaagaca180acggacataa gaaaattgta ttagttttaa ttatagaaaa cgcttttcta taattattta240tacctagaac gaaaatactg tttcgaaagc ggtttactat aaaaccttat attccggctc300tttttttaaa cagggggtga aaattcactc tagtattcta atttcaacat gctataataa360atttgtaaga cgcaatatac atcttttttt tatgatattt gtaagcggtt aaccttgtgc420tatatgccga tttaggaagg gggtagattg agtcaagtag tcataattta gataacttat480aagttgttga gaagcaggag agaatctggg ttactcacaa gttttttaaa acattatcga540aagcactttc ggttatgctt atgaatttag ctatttgatt caattacttt aataatttta600ggaggtaat609<210>3<211>3150<212>DNA<213>芽孢杆菌sp.KSM-S237<220>
<221>CDS<222>(573)..(3044)<223>
<220>
<221>sig_peptide<222>(573)..(659)<223>
<220>
<221>mat_peptide
<222>(660)..(3044)<223>
<400>3gatttgccga tgcaacaggc ttatatttag aggaaatttc tttttaaatt gaatacggaa 60taaaatcagg taaacaggtc ctgattttat ttttttgagt tttttagaga actgaagatt120gaaataaaag tagaagacaa aggacataag aaaattgcat tagttttaat tatagaaaac180gcctttttat aattatttat acctagaacg aaaatactgt ttcgaaagcg gtttactata240aaaccttata ttccggctct tttttaaaac agggggtaaa aattcactct agtattctaa300tttcaacatg ctataataaa tttgtaagac gcaatatgca tctctttttt tacgatatat360gtaagcggtt aaccttgtgc tatatgccga tttaggaagg ggggtagatt gagtcaagta420gtaataatat agataactta taagttgttg agaagcagga gagcatctgg gttactcaca480agttttttta aaactttaac gaaagcactt tcggtaatgc ttatgaattt agctatttga540ttcaattact ttaaaaatat ttaggaggta at atg atg tta aga aag aaa aca 593Met Met Leu Arg Lys Lys Thr-25aag cag ttg att tct tcc att ctt att tta gtt tta ctt cta tct tta641Lys Gln Leu Ile Ser Ser Ile Leu Ile Leu Val Leu Leu Leu Ser Leu-20 -15 -10ttt ccg gca gct ctt gca gca gaa gga aac act cgt gaa gac aat ttt689Phe Pro Ala Ala Leu Ala Ala Glu Gly Asn Thr Arg Glu Asp Asn Phe-5 -1 1 5 10aaa cat tta tta ggt aat gac aat gtt aaa cgc cct tct gag gct ggc737Lys His Leu Leu Gly Asn Asp Asn Val Lys Arg Pro Ser Glu Ala Gly15 20 25gca tta caa tta caa gaa gtc gat gga caa atg aca tta gta gat caa785Ala Leu Gln Leu Gln Glu Val Asp Gly Gln Met Thr Leu Val Asp Gln30 35 40cat gga gaa aaa att caa tta cgt gga atg agt aca cac gga tta cag833His Gly Glu Lys Ile Gln Leu Arg Gly Met Ser Thr His Gly Leu Gln
45 50 55tgg ttt cct gag atc ttg aat gat aac gca tac aaa gct ctt tct aac 881Trp Phe Pro Glu Ile Leu Asn Asp Asn Ala Tyr Lys Ala Leu Ser Asn60 65 70gat tgg gat tcc aat atg att cgt ctt gct atg tat gta ggt gaa aat 929Asp Trp Asp Ser Asn Met Ile Arg Leu Ala Met Tyr Val Gly Glu Asn75 80 85 90ggg tac gct aca aac cct gag tta atc aaa caa aga gtg att gat gga 977Gly Tyr Ala Thr Asn Pro Glu Leu Ile Lys Gln Arg Val Ile Asp Gly95 100 105att gag tta gcg att gaa aat gac atg tat gtt att gtt gac tgg cat1025Ile Glu Leu Ala Ile Glu Asn Asp Met Tyr Val Ile Val Asp Trp His110 115 120gtt cat gcg cca ggt gat cct aga gat cct gtt tat gca ggt gct aaa1073Val His Ala Pro Gly Asp Pro Arg Asp Pro Val Tyr Ala Gly Ala Lys125 130 135gat ttc ttt aga gaa att gca gct tta tac cct aat aat cca cac att1121Asp Phe Phe Arg Glu Ile Ala Ala Leu Tyr Pro Asn Asn Pro His Ile140 145 150att tat gag tta gcg aat gag ccg agt agt aat aat aat ggt gga gca1169Ile Tyr Glu Leu Ala Asn Glu Pro Ser Ser Asn Asn Asn Gly Gly Ala155 160 165 170ggg att ccg aat aac gaa gaa ggt tgg aaa gcg gta aaa gaa tat gct1217Gly Ile Pro Asn Asn Glu Glu Gly Trp Lys Ala Val Lys Glu Tyr Ala175 180 185gat cca att gta gaa atg tta cgt aaa agc ggt aat gca gat gac aac1265Asp Pro Ile Val Glu Met Leu Arg Lys Ser Gly Asn Ala Asp Asp Asn190 195 200att atc att gtt ggt agt cca aac tgg agt cag cgt ccg gac tta gca1313Ile Ile Ile Val Gly Ser Pro Asn Trp Ser Gln Arg Pro Asp Leu Ala205 210 215gct gat aat cca att gat gat cac cat aca atg tat act gtt cac ttc1361Ala Asp Asn Pro Ile Asp Asp His His Thr Met Tyr Thr Val His Phe
220 225 230tac act ggt tca cat gct gct tca act gaa agc tat ccg tct gaa act1409Tyr Thr Gly Ser His Ala Ala Ser Thr Glu Ser Tyr Pro Ser Glu Thr235 240 245 250cct aac tct gaa aga gga aac gta atg agt aac act cgt tat gcg tta1457Pro Asn Ser Glu Arg Gly Asn Val Met Ser Asn Thr Arg Tyr Ala Leu255 260 265gaa aac gga gta gcg gta ttt gca aca gag tgg gga acg agt caa gct1505Glu Asn Gly Val Ala Val Phe Ala Thr Glu Trp Gly Thr Ser Gln Ala270 275 280agt gga gac ggt ggt cct tac ttt gat gaa gca gat gta tgg att gaa1553Ser Gly Asp Gly Gly Pro Tyr Phe Asp Glu Ala Asp Val Trp Ile Glu285 290 295ttt tta aat gaa aac aac att agc tgg gct aac tgg tct tta acg aat1601Phe Leu Asn Glu Asn Asn Ile Ser Trp Ala Asn Trp Ser Leu Thr Asn300 305 310aaa aat gaa gta tct ggt gca ttt aca cca ttc gag tta ggt aag tct1649Lys Asn Glu Val Ser Gly Ala Phe Thr Pro Phe Glu Leu Gly Lys Ser315 320 325 330aac gca acc aat ctt gac cca ggt cca gat cat gtg tgg gca cca gaa1697Asn Ala Thr Asn Leu Asp Pro Gly Pro Asp His Val Trp Ala Pro Glu335 340 345gaa tta agt ctt tct gga gaa tat gta cgt gct cgt att aaa ggt gtg1745Glu Leu Ser Leu Ser Gly Glu Tyr Val Arg Ala Arg Ile Lys Gly Val350 355 360aac tat gag cca atc gac cgt aca aaa tac acg aaa gta ctt tgg gac1793Asn Tyr Glu Pro Ile Asp Arg Thr Lys Tyr Thr Lys Val Leu Trp Asp365 370 375ttt aat gat gga acg aag caa gga ttt gga gtg aat tcg gat tct cca1841Phe Asn Asp Gly Thr Lys Gln Gly Phe Gly Val Asn Ser Asp Ser Pro380 385 390aat aaa gaa ctt att gca gtt gat aat gaa aac aac act ttg aaa gtt1889Asn Lys Glu Leu Ile Ala Val Asp Asn Glu Asn Asn Thr Leu Lys Val
395 400 405 410tcg gga tta gat gta agt aac gat gtt tca gat ggc aac ttc tgg gct1937Ser Gly Leu Asp Val Ser Asn Asp Val Ser Asp Gly Asn Phe Trp Ala415 420 425aat gct cgt ctt tct gcc aac ggt tgg gga aaa agt gtt gat att tta1985Asn Ala Arg Leu Ser Ala Asn Gly Trp Gly Lys Ser Val Asp Ile Leu430 435 440ggt gct gag aag ctt aca atg gat gtt att gtt gat gaa cca acg acg2033Gly Ala Glu Lys Leu Thr Met Asp Val Ile Val Asp Glu Pro Thr Thr445 450 455gta gct att gcg gcg att cca caa agt agt aaa agt gga tgg gca aat2081Val Ala Ile Ala Ala Ile Pro Gln Ser Ser Lys Ser Gly Trp Ala Asn460 465 470cca gag cgt gct gtt cga gtg aac gcg gaa gat ttt gtc cag caa acg2129Pro Glu Arg Ala Val Arg Val Asn Ala Glu Asp Phe Val Gln Gln Thr475 480 485 490gac ggt aag tat aaa gct gga tta aca att aca gga gaa gat gct cct2177Asp Gly Lys Tyr Lys Ala Gly Leu Thr Ile Thr Gly Glu Asp Ala Pro495 500 505aac cta aaa aat atc gct ttt cat gaa gaa gat aac aat atg aac aac2225Asn Leu Lys Asn Ile Ala Phe His Glu Glu Asp Asn Asn Met Asn Asn510 515 520atc att ctg ttc gtg gga act gat gca gct gac gtt att tac tta gat2273Ile Ile Leu Phe Val Gly Thr Asp Ala Ala Asp Val Ile Tyr Leu Asp525 530 535aac att aaa gta att gga aca gaa gtt gaa att cca gtt gtt cat gat2321Asn Ile Lys Val Ile Gly Thr Glu Val Glu Ile Pro Val Val His Asp540 545 550cca aaa gga gaa gct gtt ctt cct tct gtt ttt gaa gac ggt aca cgt2369Pro Lys Gly Glu Ala Val Leu Pro Ser Val Phe Glu Asp Gly Thr Arg555 560 565 570caa ggt tgg gac tgg gct gga gag tct ggt gtg aaa aca gct tta aca2417Gln Gly Trp Asp Trp Ala Gly Glu Ser Gly Val Lys Thr Ala Leu Thr
575 580 585att gaa gaa gca aac ggt tct aac gcg tta tca tgg gaa ttt gga tat2465Ile Glu Glu Ala Asn Gly Ser Asn Ala Leu Ser Trp Glu Phe Gly Tyr590 595 600cca gaa gta aaa cct agt gat aac tgg gca aca gct cca cgt tta gat2513Pro Glu Val Lys Pro Ser Asp Asn Trp Ala Thr Ala Pro Arg Leu Asp605 610 615ttc tgg aaa tct gac ttg gtt cgc ggt gag aat gat tat gta gct ttt2561Phe Trp Lys Ser Asp Leu Val Arg Gly Glu Asn Asp Tyr Val Ala Phe620 625 630gat ttc tat cta gat cca gtt cgt gca aca gaa ggc gca atg aat atc2609Asp Phe Tyr Leu Asp Pro Val Arg Ala Thr Glu Gly Ala Met Asn Ile635 640 645 650aat tta gta ttc cag cca cct act aac ggg tat tgg gta caa gca cca2657Asn Leu Val Phe Gln Pro Pro Thr Asn Gly Tyr Trp Val Gln Ala Pro655 660 665aaa acg tat acg att aac ttt gat gaa tta gag gaa gcg aat caa gta2705Lys Thr Tyr Thr Ile Asn Phe Asp Glu Leu Glu Glu Ala Asn Gln Val670 675 680aat ggt tta tat cac tat gaa gtg aaa att aac gta aga gat att aca2753Asn Gly Leu Tyr His Tyr Glu Val Lys Ile Asn Val Arg Asp Ile Thr685 690 695aac att caa gat gac acg tta cta cgt aac atg atg atc att ttt gca2801Asn Ile Gln Asp Asp Thr Leu Leu Arg Asn Met Met Ile Ile Phe Ala700 705 710gat gta gaa agt gac ttt gca ggg aga gtc ttt gta gat aat gtt cgt2849Asp Val Glu Ser Asp Phe Ala Gly Arg Val Phe Val Asp Asn Val Arg715 720 725 730ttt gag ggg gct gct act act gag ccg gtt gaa cca gag cca gtt gat2897Phe Glu Gly Ala Ala Thr Thr Glu Pro Val Glu Pro Glu Pro Val Asp735 740 745cct ggc gaa gag acg cca cct gtc gat gag aag gaa gcg aaa aaa gaa2945Pro Gly Glu Glu Thr Pro Pro Val Asp Glu Lys Glu Ala Lys Lys Glu
750 755 760caa aaa gaa gca gag aaa gaa gag aaa gaa gca gta aaa gaa gaa aag2993Gin Lys Glu Ala Glu Lys Glu Glu Lys Glu Ala Val Lys Glu Glu Lys765 770 775aaa gaa gct aaa gaa gaa aag aaa gca gtc aaa aat gag gct aag aaa3041Lys Glu Ala Lys Glu Glu Lys Lys Ala Val Lys Asn Glu Ala Lys Lys780 785 790aaa taatctatta aactagttat agggttatct aaaggtctga tgtagatctt 3094Lys795ttagataacc tttttcttgc ataactggac acagagttgt tattaaagaa agtaag 3150<210>4<211>795<212>PRT<213>芽孢杆菌sp.KSM-S237<400>4Ala Glu Gly Asn Thr Arg Glu Asp Asn Phe Lys His Leu Leu Gly Asn1 5 10 15Asp Asn Val Lys Arg Pro Ser Glu Ala Gly Ala Leu Gln Leu Gln Glu20 25 30Val Asp Gly Gln Met Thr Leu Val Asp Gln His Gly Glu Lys Ile Gln35 40 45Leu Arg Gly Met Ser Thr His Gly Leu Gln Trp Phe Pro Glu Ile Leu50 55 60Asn Asp Asn Ala Tyr Lys Ala Leu Ser Asn Asp Trp Asp Ser Asn Met65 70 75 80
Ile Arg Leu Ala Met Tyr Val Gly Glu Asn Gly Tyr Ala Thr Asn Pro85 90 95Glu Leu Ile Lys Gln Arg Val Ile Asp Gly Ile Glu Leu Ala Ile Glu100 105 110Asn Asp Met Tyr Val Ile Val Asp Trp His Val His Ala Pro Gly Asp115 120 125Pro Arg Asp Pro Val Tyr Ala Gly Ala Lys Asp Phe Phe Arg Glu Ile130 135 140Ala Ala Leu Tyr Pro Asn Asn Pro His Ile Ile Tyr Glu Leu Ala Asn145 150 155 160Glu Pro Ser Ser Asn Asn Asn Gly Gly Ala Gly Ile Pro Asn Asn Glu165 170 175Glu Gly Trp Lys Ala Val Lys Glu Tyr Ala Asp Pro Ile Val Glu Met180 185 190Leu Arg Lys Ser Gly Asn Ala Asp Asp Asn Ile Ile Ile Val Gly Ser195 200 205Pro Asn Trp Ser Gln Arg Pro Asp Leu Ala Ala Asp Asn Pro Ile Asp210 215 220Asp His His Thr Met Tyr Thr Val His Phe Tyr Thr Gly Ser His Ala225 230 235 240Ala Ser Thr Glu Ser Tyr Pro Ser Glu Thr Pro Asn Ser Glu Arg Gly245 250 255
Asn Val Met Ser Asn Thr Arg Tyr Ala Leu Glu Asn Gly Val Ala Val260 265 270Phe Ala Thr Glu Trp Gly Thr Ser Gln Ala Ser Gly Asp Gly Gly Pro275 280 285Tyr Phe Asp Glu Ala Asp Val Trp Ile Glu Phe Leu Asn Glu Asn Asn290 295 300Ile Ser Trp Ala Asn Trp Ser Leu Thr Asn Lys Asn Glu Val Ser Gly305 310 315 320Ala Phe Thr Pro Phe Glu Leu Gly Lys Ser Asn Ala Thr Asn Leu Asp325 330 335Pro Gly Pro Asp His Val Trp Ala Pro Glu Glu Leu Ser Leu Ser Gly340 345 350Glu Tyr Val Arg Ala Arg Ile Lys Gly Val Asn Tyr Glu Pro Ile Asp355 360 365Arg Thr Lys Tyr Thr Lys Val Leu Trp Asp Phe Asn Asp Gly Thr Lys370 375 380Gln Gly Phe Gly Val Asn Ser Asp Ser Pro Asn Lys Glu Leu Ile Ala385 390 395 400Val Asp Asn Glu Asn Asn Thr Leu Lys Val Ser Gly Leu Asp Val Ser405 410 415Asn Asp Val Ser Asp Gly Asn Phe Trp Ala Asn Ala Arg Leu Ser Ala420 425 430
Asn Gly Trp Gly Lys Ser Val Asp Ile Leu Gly Ala Glu Lys Leu Thr435 440 445Met Asp Val Ile Val Asp Glu Pro Thr Thr Val Ala Ile Ala Ala Ile450 455 460Pro Gln Ser Ser Lys Ser Gly Trp Ala Asn Pro Glu Arg Ala Val Arg465 470 475 480Val Asn Ala Glu Asp Phe Val Gln Gln Thr Asp Gly Lys Tyr Lys Ala485 490 495Gly Leu Thr Ile Thr Gly Glu Asp Ala Pro Asn Leu Lys Asn Ile Ala500 505 510Phe His Glu Glu Asp Asn Asn Met Asn Asn Ile Ile Leu Phe Val Gly515 520 525Thr Asp Ala Ala Asp Val Ile Tyr Leu Asp Asn Ile Lys Val Ile Gly530 535 540Thr Glu Val Glu Ile Pro Val Val His Asp Pro Lys Gly Glu Ala Val545 550 555 560Leu Pro Ser Val Phe Glu Asp Gly Thr Arg Gln Gly Trp Asp Trp Ala565 570 575Gly Glu Ser Gly Val Lys Thr Ala Leu Thr Ile Glu Glu Ala Asn Gly580 585 590Ser Asn Ala Leu Ser Trp Glu Phe Gly Tyr Pro Glu Val Lys Pro Ser595 600 605
Asp Asn Trp Ala Thr Ala Pro Arg Leu Asp Phe Trp Lys Ser Asp Leu610 615 620Val Arg Gly Glu Asn Asp Tyr Val Ala Phe Asp Phe Tyr Leu Asp Pro625 630 635 640Val Arg Ala Thr Glu Gly Ala Met Asn Ile Asn Leu Val Phe Gln Pro645 650 655Pro Thr Asn Gly Tyr Trp Val Gln Ala Pro Lys Thr Tyr Thr Ile Asn660 665 670Phe Asp Glu Leu Glu Glu Ala Asn Gln Val Asn Gly Leu Tyr His Tyr675 680 685Glu Val Lys Ile Asn Val Arg Asp Ile Thr Asn Ile Gln Asp Asp Thr690 695 700Leu Leu Arg Asn Met Met Ile Ile Phe Ala Asp Val Glu Ser Asp Phe705 710 715 720Ala Gly Arg Val Phe Val Asp Asn Val Arg Phe Glu Gly Ala Ala Thr725 730 735Thr Glu Pro Val Glu Pro Glu Pro Val Asp Pro Gly Glu Glu Thr Pro740 745 750Pro Val Asp Glu Lys Glu Ala Lys Lys Glu Gln Lys Glu Ala Glu Lys755 760 765Glu Glu Lys Glu Ala Val Lys Glu Glu Lys Lys Glu Ala Lys Glu Glu770 775 780
Lys Lys Ala Val Lys Asn Glu Ala Lys Lys Lys785 790 795<210>5<211>3332<212>DNA<213>芽孢杆菌sp.KSM-64<220>
<221>CDS<222>(610)..(3075)<223>
<220>
<221>sig_peptide<222>(610)..(696)<223>
<220>
<221>mat_peptide<222>(697)..(3075)<223>
<400>5agtacttacc attttagagt caaaagatag aagccaagca ggatttgccg atgcaaccgg 60cttatattta gagggaattt ctttttaaat tgaatacgga ataaaatcag gtaaacaggt120cctgatttta tttttttgaa tttttttgag aactaaagat tgaaatagaa gtagaagaca180acggacataa gaaaattgta ttagttttaa ttatagaaaa cgcttttcta taattattta240tacctagaac gaaaatactg tttcgaaagc ggtttactat aaaaccttat attccggctc300tttttttaaa cagggggtga aaattcactc tagtattcta atttcaacat gctataataa360atttgtaaga cgcaatatac atcttttttt tatgatattt gtaagcggtt aaccttgtgc420tatatgccga tttaggaagg gggtagattg agtcaagtag tcataattta gataacttat480aagttgttga gaagcaggag agaatctggg ttactcacaa gttttttaaa acattatcga540aagcactttc ggttatgctt atgaatttag ctatttgatt caattacttt aataatttta600
ggaggtaat atg atg tta aga aag aaa aca aag cag ttg att tct tcc att 651Met Met Leu Arg Lys Lys Thr Lys Gln Leu Ile Ser Ser Ile-25 -20ctt att tta gtt tta ctt cta tct tta ttt ccg aca gct ctt gca gca 699Leu Ile Leu Val Leu Leu Leu Ser Leu Phe Pro Thr Ala Leu Ala Ala-15 -10 -5 -1 1gaa gga aac act cgt gaa gac aat ttt aaa cat tta tta ggt aat gac 747Glu Gly Asn Thr Arg Glu Asp Asn Phe Lys His Leu Leu Gly Asn Asp5 10 15aat gtt aaa cgc cct tct gag gct ggc gca tta caa tta caa gaa gtc 795Asn Val Lys Arg Pro Ser Glu Ala Gly Ala Leu Gln Leu Gln Glu Val20 25 30gat gga caa atg aca tta gta gat caa cat gga gaa aaa att caa tta 843Asp Gly Gln Met Thr Leu Val Asp Gln His Gly Glu Lys Ile Gln Leu35 40 45cgt gga atg agt aca cac gga tta caa tgg ttt cct gag atc ttg aat 891Arg Gly Met Ser Thr His Gly Leu Gln Trp Phe Pro Glu Ile Leu Asn50 55 60 65gat aac gca tac aaa gct ctt gct aac gat tgg gaa tca aat atg att 939Asp Asn Ala Tyr Lys Ala Leu Ala Asn Asp Trp Glu Ser Asn Met Ile70 75 80cgt cta gct atg tat gtc ggt gaa aat ggc tat gct tca aat cca gag 987Arg Leu Ala Met Tyr Val Gly Glu Asn Gly Tyr Ala Ser Asn Pro Glu85 90 95tta att aaa agc aga gtc att aaa gga ata gat ctt gct att gaa aat1035Leu Ile Lys Ser Arg Val Ile Lys Gly Ile Asp Leu Ala Ile Glu Asn100 105 110gac atg tat gtc atc gtt gat tgg cat gta cat gca cct ggt gat cct1083Asp Met Tyr Val Ile Val Asp Trp His Val His Ala Pro Gly Asp Pro115 120 125aga gat ccc gtt tac gct gga gca gaa gat ttc ttt aga gat att gca1131Arg Asp Pro Val Tyr Ala Gly Ala Glu Asp Phe Phe Arg Asp Ile Ala130 135 140 145
gca tta tat cct aac aat cca cac att att tat gag tta gcg aat gag1179Ala Leu Tyr Pro Asn Asn Pro His Ile Ile Tyr Glu Leu Ala Asn Glu150 155 160cca agt agt aac aat aat ggt gga gct ggg att cca aat aat gaa gaa1227Pro Ser Ser Asn Asn Asn Gly Gly Ala Gly Ile Pro Asn Asn Glu Glu165 170 175ggt tgg aat gcg gta aaa gaa tac gct gat cca att gta gaa atg tta1275Gly Trp Asn Ala Val Lys Glu Tyr Ala Asp Pro Ile Val Glu Met Leu180 185 190cgt gat agc ggg aac gca gat gac aat att atc att gtg ggt agt cca1323Arg Asp Ser Gly Asn Ala Asp Asp Asn Ile Ile Ile Val Gly Ser Pro195 200 205aac tgg agt cag cgt cct gac tta gca gct gat aat cca att gat gat1371Asn Trp Ser Gln Arg Pro Asp Leu Ala Ala Asp Asn Pro Ile Asp Asp210 215 220 225cac cat aca atg tat act gtt cac ttc tac act ggt tca cat gct gct1419His His Thr Met Tyr Thr Val His Phe Tyr Thr Gly Ser His Ala Ala230 235 240tca act gaa agc tat ccg cct gaa act cct aac tct gaa aga gga aac1467Ser Thr Glu Ser Tyr Pro Pro Glu Thr Pro Asn Ser Glu Arg Gly Asn245 250 255gta atg agt aac act cgt tat gcg tta gaa aac gga gta gca gta ttt1515Val Met Ser Asn Thr Arg Tyr Ala Leu Glu Asn Gly Val Ala Val Phe260 265 270gca aca gag tgg gga act agc caa gca aat gga gat ggt ggt cct tac1563Ala Thr Glu Trp Gly Thr Ser Gln Ala Asn Gly Asp Gly Gly Pro Tyr275 280 285ttt gat gaa gca gat gta tgg att gag ttt tta aat gaa aac aac att1611Phe Asp Glu Ala Asp Val Trp Ile Glu Phe Leu Asn Glu Asn Asn Ile290 295 300 305agc tgg gct aac tgg tct tta acg aat aaa aat gaa gta tct ggt gca1659Ser Trp Ala Asn Trp Ser Leu Thr Asn Lys Asn Glu Val Ser Gly Ala310 315 320
ttt aca cca ttc gag tta ggt aag tct aac gca aca agt ctt gac cca1707Phe Thr Pro Phe Glu Leu Gly Lys Ser Asn Ala Thr Ser Leu Asp Pro325 330 335ggg cca gac caa gta tgg gta cca gaa gag tta agt ctt tct gga gaa1755Gly Pro Asp Gln Val Trp Val Pro Glu Glu Leu Ser Leu Ser Gly Glu340 345 350tat gta cgt gct cgt att aaa ggt gtg aac tat gag cca atc gac cgt1803Tyr Val Arg Ala Arg Ile Lys Gly Val Asn Tyr Glu Pro Ile Asp Arg355 360 365aca aaa tac acg aaa gta ctt tgg gac ttt aat gat gga acg aag caa1851Thr Lys Tyr Thr Lys Val Leu Trp Asp Phe Asn Asp Gly Thr Lys Gln370 375 380 385gga ttt gga gtg aat gga gat tct cca gtt gaa gat gta gtt att gag1899Gly Phe Gly Val Asn Gly Asp Ser Pro Val Glu Asp Val Val Ile Glu390 395 400aat gaa gcg ggc gct tta aaa ctt tca gga tta gat gca agt aat gat1947Asn Glu Ala Gly Ala Leu Lys Leu Ser Gly Leu Asp Ala Ser Asn Asp405 410 415gtt tct gaa ggt aat tac tgg gct aat gct cgt ctt tct gcc gac ggt1995Val Ser Glu Gly Asn Tyr Trp Ala Asn Ala Arg Leu Ser Ala Asp Gly420 425 430tgg gga aaa agt gtt gat att tta ggt gct gaa aaa ctt act atg gat2043Trp Gly Lys Ser Val Asp Ile Leu Gly Ala Glu Lys Leu Thr Met Asp435 440 445gtg att gtt gat gag ccg acc acg gta tca att gct gca att cca caa2091Val Ile Val Asp Glu Pro Thr Thr Val Ser Ile Ala Ala Ile Pro Gln450 455 460 465ggg cca tca gcc aat tgg gtt aat cca aat cgt gca att aag gtt gag2139Gly Pro Ser Ala Asn Trp Val Asn Pro Asn Arg Ala Ile Lys Val Glu470 475 480cca act aat ttc gta ccg tta gga gat aag ttt aaa gcg gaa tta act2187Pro Thr Asn Phe Val Pro Leu Gly Asp Lys Phe Lys Ala Glu Leu Thr485 490 495
ata act tca gct gac tct cca tcg tta gaa gct att gcg atg cat gct2235Ile Thr Ser Ala Asp Ser Pro Ser Leu Glu Ala Ile Ala Met His Ala500 505 510gaa aat aac aac atc aac aac atc att ctt ttt gta gga act gaa ggt2283Glu Asn Asn Asn Ile Asn Asn Ile Ile Leu Phe Val Gly Thr Glu Gly515 520 525gct gat gtt atc tat tta gat aac att aaa gta att gga aca gaa gtt2331Ala Asp Val Ile Tyr Leu Asp Asn Ile Lys Val Ile Gly Thr Glu Val530 535 540 545gaa att cca gtt gtt cat gat cca aaa gga gaa gct gtt ctt cct tct2379Glu Ile Pro Val Val His Asp Pro Lys Gly Glu Ala Val Leu Pro Ser550 555 560gtt ttt gaa gac ggt aca cgt caa ggt tgg gac tgg gct gga gag tct2427Val Phe Glu Asp Gly Thr Arg Gln Gly Trp Asp Trp Ala Gly Glu Ser565 570 575ggt gtg aaa aca gct tta aca att gaa gaa gca aac ggt tct aac gcg2475Gly Val Lys Thr Ala Leu Thr Ile Glu Glu Ala Asn Gly Ser Asn Ala580 585 590tta tca tgg gaa ttt gga tac cca gaa gta aaa cct agt gat aac tgg2523Leu Ser Trp Glu Phe Gly Tyr Pro Glu Val Lys Pro Ser Asp Asn Trp595 600 605gca aca gct cca cgt tta gat ttc tgg aaa tct gac ttg gtt cgc ggt2571Ala Thr Ala Pro Arg Leu Asp Phe Trp Lys Ser Asp Leu Val Arg Gly610 615 620 625gaa aat gat tat gta act ttt gat ttc tat cta gat cca gtt cgt gca2619Glu Asn Asp Tyr Val Thr Phe Asp Phe Tyr Leu Asp Pro Val Arg Ala630 635 640aca gaa ggc gca atg aat atc aat tta gta ttc cag cca cct act aac2667Thr Glu Gly Ala Met Asn Ile Asn Leu Val Phe Gln Pro Pro Thr Asn645 650 655ggg tat tgg gta caa gca cca aaa acg tat acg att aac ttt gat gaa2715Gly Tyr Trp Val Gln Ala Pro Lys Thr Tyr Thr Ile Asn Phe Asp Glu660 665 670
tta gag gaa gcg aat caa gta aat ggt tta tat cac tat gaa gtg aaa2763Leu Glu Glu Ala Asn Gln Val Asn Gly Leu Tyr His Tyr Glu Val Lys675 680 685att aac gta aga gat att aca aac att caa gat gac acg tta cta cgt2811Ile Asn Val Arg Asp Ile Thr Asn Ile Gln Asp Asp Thr Leu Leu Arg690 695 700 705aac atg atg atc att ttt gca gat gta gaa agt gac ttt gca ggg aga2859Asn Met Met Ile Ile Phe Ala Asp Val Glu Ser Asp Phe Ala Gly Arg710 715 720gtc ttt gta gat aat gtt cgt ttt gag ggg gct gct act act gag ccg2907Val Phe Val Asp Asn Val Arg Phe Glu Gly Ala Ala Thr Thr Glu Pro725 730 735gtt gaa cca gag cca gtt gat cct ggc gaa gag acg ccg cct gtc gat2955Val Glu Pro Glu Pro Val Asp Pro Gly Glu Glu Thr Pro Pro Val Asp740 745 750gag aag gaa gcg aaa aaa gaa caa aaa gaa gca gag aaa gaa gag aaa3003Glu Lys Glu Ala Lys Lys Glu Gln Lys Glu Ala Glu Lys Glu Glu Lys755 760 765gaa gca gta aaa gaa gaa aag aaa gaa gct aaa gaa gaa aag aaa gca3051Glu Ala Val Lys Glu Glu Lys Lys Glu Ala Lys Glu Glu Lys Lys Ala770 775 780 785atc aaa aat gag gct acg aaa aaa taatctaata aactagttat agggttatct 3105Ile Lys Asn Glu Ala Thr Lys Lys790aaaggtctga tgcagatctt ttagataacc tttttttgca taactggaca tagaatggtt 3165attaaagaaa gcaaggtgtt tatacgatat taaaaaggta gcgattttaa attgaaacct 3225ttaataatgt cttgtgatag aatgatgaag taatttaaga gggggaaacg aagtgaaaac 3285ggaaatttct agtagaagaa aaacagacca agaaatactg caagctt3332<210>6<211>793
<212>PRT<213>芽孢杆菌sp.KSM-64<400>6Ala Glu Gly Asn Thr Arg Glu Asp Asn Phe Lys His Leu Leu Gly Asn1 5 10 15Asp Asn Val Lys Arg Pro Ser Glu Ala Gly Ala Leu Gln Leu Gln Glu20 25 30Val Asp Gly Gln Met Thr Leu Val Asp Gln His Gly Glu Lys Ile Gln35 40 45Leu Arg Gly Met Ser Thr His Gly Leu Gln Trp Phe Pro Glu Ile Leu50 55 60Asn Asp Asn Ala Tyr Lys Ala Leu Ala Asn Asp Trp Glu Ser Asn Met65 70 75 80Ile Arg Leu Ala Met Tyr Val Gly Glu Asn Gly Tyr Ala Ser Asn Pro85 90 95Glu Leu Ile Lys Ser Arg Val Ile Lys Gly Ile Asp Leu Ala Ile Glu100 105 110Asn Asp Met Tyr Val Ile Val Asp Trp His Val His Ala Pro Gly Asp115 120 125Pro Arg Asp Pro Val Tyr Ala Gly Ala Glu Asp Phe Phe Arg Asp Ile130 135 140Ala Ala Leu Tyr Pro Asn Asn Pro His Ile Ile Tyr Glu Leu Ala Asn145 150 155 160
Glu Pro Ser Ser Asn Asn Asn Gly Gly Ala Gly Ile Pro Asn Asn Glu165 170 175Glu Gly Trp Asn Ala Val Lys Glu Tyr Ala Asp Pro Ile Val Glu Met180 185 190Leu Arg Asp Ser Gly Asn Ala Asp Asp Asn Ile Ile Ile Val Gly Ser195 200 205Pro Asn Trp Ser Gln Arg Pro Asp Leu Ala Ala Asp Asn Pro Ile Asp210 215 220Asp His His Thr Met Tyr Thr Val His Phe Tyr Thr Gly Ser His Ala225 230 235 240Ala Ser Thr Glu Ser Tyr Pro Pro Glu Thr Pro Asn Ser Glu Arg Gly245 250 255Asn Val Met Ser Asn Thr Arg Tyr Ala Leu Glu Asn Gly Val Ala Val260 265 270Phe Ala Thr Glu Trp Gly Thr Ser Gln Ala Asn Gly Asp Gly Gly Pro275 280 285Tyr Phe Asp Glu Ala Asp Val Trp Ile Glu Phe Leu Asn Glu Asn Asn290 295 300Ile Ser Trp Ala Asn Trp Ser Leu Thr Asn Lys Asn Glu Val Ser Gly305 310 315 320Ala Phe Thr Pro Phe Glu Leu Gly Lys Ser Asn Ala Thr Ser Leu Asp325 330 335
Pro Gly Pro Asp Gln Val Trp Val Pro Glu Glu Leu Ser Leu Ser Gly340 345 350Glu Tyr Val Arg Ala Arg Ile Lys Gly Val Asn Tyr Glu Pro Ile Asp355 360 365Arg Thr Lys Tyr Thr Lys Val Leu Trp Asp Phe Asn Asp Gly Thr Lys370 375 380Gln Gly Phe Gly Val Asn Gly Asp Ser Pro Val Glu Asp Val Val Ile385 390 395 400Glu Asn Glu Ala Gly Ala Leu Lys Leu Ser Gly Leu Asp Ala Ser Asn405 410 415Asp Val Ser Glu Gly Asn Tyr Trp Ala Asn Ala Arg Leu Ser Ala Asp420 425 430Gly Trp Gly Lys Ser Val Asp Ile Leu Gly Ala Glu Lys Leu Thr Met435 440 445Asp Val Ile Val Asp Glu Pro Thr Thr Val Ser Ile Ala Ala Ile Pro450 455 460Gln Gly Pro Ser Ala Asn Trp Val Asn Pro Asn Arg Ala Ile Lys Val465 470 475 480Glu Pro Thr Asn Phe Val Pro Leu Gly Asp Lys Phe Lys Ala Glu Leu485 490 495Thr Ile Thr Ser Ala Asp Ser Pro Ser Leu Glu Ala Ile Ala Met His500 505 510
Ala Glu Asn Asn Asn Ile Asn Asn Ile Ile Leu Phe Val Gly Thr Glu515 520 525Gly Ala Asp Val Ile Tyr Leu Asp Asn Ile Lys Val Ile Gly Thr Glu530 535 540Val Glu Ile Pro Val Val His Asp Pro Lys Gly Glu Ala Val Leu Pro545 550 555 560Ser Val Phe Glu Asp Gly Thr Arg Gln Gly Trp Asp Trp Ala Gly Glu565 570 575Ser Gly Val Lys Thr Ala Leu Thr Ile Glu Glu Ala Asn Gly Ser Asn580 585 590Ala Leu Ser Trp Glu Phe Gly Tyr Pro Glu Val Lys Pro Ser Asp Asn595 600 605Trp Ala Thr Ala Pro Arg Leu Asp Phe Trp Lys Ser Asp Leu Val Arg610 615 620Gly Glu Asn Asp Tyr Val Thr Phe Asp Phe Tyr Leu Asp Pro Val Arg625 630 635 640Ala Thr Glu Gly Ala Met Asn Ile Asn Leu Val Phe Gln Pro Pro Thr645 650 655Asn Gly Tyr Trp Val Gln Ala Pro Lys Thr Tyr Thr Ile Asn Phe Asp660 665 670Glu Leu Glu Glu Ala Asn Gln Val Asn Gly Leu Tyr His Tyr Glu Val675 680 685
Lys Ile Asn Val Arg Asp Ile Thr Asn Ile Gln Asp Asp Thr Leu Leu690 695 700Arg Asn Met Met Ile Ile Phe Ala Asp Val Glu Ser Asp Phe Ala Gly705 710 715 720Arg Val Phe Val Asp Asn Val Arg Phe Glu Gly Ala Ala Thr Thr Glu725 730 735Pro Val Glu Pro Glu Pro Val Asp Pro Gly Glu Glu Thr Pro Pro Val740 745 750Asp Glu Lys Glu Ala Lys Lys Glu Gln Lys Glu Ala Glu Lys Glu Glu755 760 765Lys Glu Ala Val Lys Glu Glu Lys Lys Glu Ala Lys Glu Glu Lys Lys770 775 780Ala Ile Lys Asn Glu Ala Thr Lys Lys785 790<210>7<211>572<212>DNA<213>芽孢杆菌sp.KSM-S237<400>7gatttgccga tgcaacaggc ttatatttag aggaaatttc tttttaaatt gaatacggaa 60taaaatcagg taaacaggtc ctgattttat ttttttgagt tttttagaga actgaagatt120gaaataaaag tagaagacaa aggacataag aaaattgcat tagttttaat tatagaaaac180gcctttttat aattatttat acctagaacg aaaatactgt ttcgaaagcg gtttactata240aaaccttata ttccggctct tttttaaaac agggggtaaa aattcactct agtattctaa300
tttcaacatg ctataataaa tttgtaagac gcaatatgca tctctttttt tacgatatat360gtaagcggtt aaccttgtgc tatatgccga tttaggaagg ggggtagaat atttcaagta420gtaataacat acaatactta taagttgttg agaagcagga gagcatctgg gttactcaca480agttttttta aaactttaac gaaagcactt tcggtaatgc ttatgaattt agctatttga540ttcaattact ttaaaaatat ttaggaggta at 572<210>8<211>609<212>DNA<213>芽孢杆菌sp.KSM-64<400>8agtacttacc attttagagt caaaagatag aagccaagca ggatttgccg atgcaaccgg 60cttatattta gagggaattt ctttttaaat tgaatacgga ataaaatcag gtaaacaggt120cctgatttta tttttttgaa tttttttgag aactaaagat tgaaatagaa gtagaagaca180acggacataa gaaaattgta ttagttttaa ttatagaaaa cgcttttcta taattattta240tacctagaac gaaaatactg tttcgaaagc ggtttactat aaaaccttat attccggctc300tttttttaaa cagggggtga aaattcactc tagtattcta atttcaacat gctataataa360atttgtaaga cgcaatatac atcttttttt tatgatattt gtaagcggtt aaccttgtgc420tatatgccga tttaggaagg gggtagaata tttcaagtag taataacata caatacttat480aagttgttga gaagcaggag agaatctggg ttactcacaa gttttttaaa acattatcga540aagcactttc ggttatgctt atgaatttag ctatttgatt caattacttt aataatttta600ggaggtaat609<210>9<211>37<212>DNA
<213>人工序列<220>
<223>设计自用于纤维素酶的芽孢杆菌sp.KSM-S237基因的核苷酸序列的作为PCR引物的低聚核苷酸;在5’-端插入有BamHI限制酶切位点的序列<400>9ttgcggatcc aacaggctta tatttagagg aaatttc<210>10<211>40<212>DNA<213>人工序列<220>
<223>设计自纤维素酶的芽孢杆菌sp.KSM-S237基因的核苷酸序列的作为PCR引物的低聚核苷酸;包含8个SigmaE识别的核苷酸取代基的序列<400>10gtatgttatt actacttgaa atattctacc ccccttccta<210>11<211>39<212>DNA<213>人工序列<220>
<223>设计自纤维素酶的芽孢杆菌sp.KSM-S237基因的核苷酸序列的作为PCR引物的低聚核苷酸;包含8个SigmaE识别的核苷酸取代基的序列<400>11atatttcaag tagtaataac atacaatact tataagttg<210>12<211>20<212>DNA<213>人工序列<220>
<223>设计自纤维素酶的芽孢杆菌sp.KSM-S237基因的核苷酸序列的作为PCR引物的低聚核苷酸
<400>12tcgctaccct tttattatcg<210>13<211>1795<212>DNA<213>芽孢杆菌sp.KSM-K38<220>
<221>CDS<222>(212)..(1714)<223>
<220>
<221>sig_peptide<222>(212)..(274)<223>
<220>
<221>mat_peptide<222>(275)..(1714)<223>
<400>13caggccagcc aaagtagcca ccaactaagt aacatcgatt caggataaaa gtatgcgaaa 60cgatgcgcaa aactgcgcaa ctactagcac tcttcaggga ctaaaccacc ttttttccaa120aaatgacatc atataaacaa atttgtctac caatcactat ttaaagctgt ttatgatata180tgtaagcgtt atcattaaaa ggaggtattt g atg aga aga tgg gta gta gca 232Met Arg Arg Trp Val Val Ala-21 -20 -15atg ttg gca gtg tta ttt tta ttt cct tcg gta gta gtt gca gat gga 280Met Leu Ala Val Leu Phe Leu Phe Pro Ser Val Val Val Ala Asp Gly-10 -5 1ttg aac ggt acg atg atg cag tat tat gag tgg cat ttg gaa aac gac 328Leu Asn Gly Thr Met Met Gln Tyr Tyr Glu Trp His Leu Glu Asn Asp5 10 15
ggg cag cat tgg aat cgg ttg cac gat gat gcc gca gct ttg agt gat376Gly Gln His Trp Asn Arg Leu His Asp Asp Ala Ala Ala Leu Ser Asp20 25 30gct ggt att aca gct att tgg att ccg cca gcc tac aaa ggt aat agt424Ala Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Tyr Lys Gly Asn Ser35 40 45 50cag gcg gat gtt ggg tac ggt gca tac gat ctt tat gat tta gga gag472Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu Gly Glu55 60 65ttc aat caa aag ggt act gtt cga acg aaa tac gga act aag gca cag520Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys Ala Gln70 75 80ctt gaa cga gct att ggg tcc ctt aaa tct aat gat atc aat gta tac568Leu Glu Arg Ala Ile Gly Ser Leu Lys Ser Asn Asp Ile Asn Val Tyr85 90 95gga gat gtc gtg atg aat cat aaa atg gga gct gat ttt acg gag gca616Gly Asp Val Val Met Asn His Lys Met Gly Ala Asp Phe Thr Glu Ala100 105 110gtg caa gct gtt caa gta aat cca acg aat cgt tgg cag gat att tca664Val Gln Ala Val Gln Val Asn Pro Thr Asn Arg Trp Gln Asp Ile Ser115 120 125 130ggt gcc tac acg att gat gcg tgg acg ggt ttc gac ttt tca ggg cgt712Gly Ala Tyr Thr Ile Asp Ala Trp Thr Gly Phe Asp Phe Ser Gly Arg135 140 145aac aac gcc tat tca gat ttt aag tgg aga tgg ttc cat ttt aat ggt760Asn Asn Ala Tyr Ser Asp Phe Lys Trp Arg Trp Phe His Phe Asn Gly150 155 160gtt gac tgg gat cag cgc tat caa gaa aat cat att ttc cgc ttt gca808Val Asp Trp Asp Gln Arg Tyr Gln Glu Asn His Ile Phe Arg Phe Ala165 170 175aat acg aac tgg aac tgg cga gtg gat gaa gag aac ggt aat tat gat856Asn Thr Asn Trp Asn Trp Arg Val Asp Glu Glu Asn Gly Asn Tyr Asp180 185 190
tac ctg tta gga tcg aat atc gac ttt agt cat cca gaa gta caa gat 904Tyr Leu Leu Gly Ser Asn Ile Asp Phe Ser His Pro Glu Val Gln Asp195 200 205 210gag ttg aag gat tgg ggt agc tgg ttt acc gat gag tta gat ttg gat 952Glu Leu Lys Asp Trp Gly Ser Trp Phe Thr Asp Glu Leu Asp Leu Asp215 220 225ggt tat cgt tta gat gct att aaa cat att cca ttc tgg tat aca tct1000Gly Tyr Arg Leu Asp Ala Ile Lys His Ile Pro Phe Trp Tyr Thr Ser230 235 240gat tgg gtt cgg cat cag cgc aac gaa gca gat caa gat tta ttt gtc1048Asp Trp Val Arg His Gln Arg Asn Glu Ala Asp Gln Asp Leu Phe Val245 250 255gta ggg gaa tat tgg aag gat gac gta ggt gct ctc gaa ttt tat tta1096Val Gly Glu Tyr Trp Lys Asp Asp Val Gly Ala Leu Glu Phe Tyr Leu260 265 270gat gaa atg aat tgg gag atg tct cta ttc gat gtt cca ctt aat tat1144Asp Glu Met Asn Trp Glu Met Ser Leu Phe Asp Val Pro Leu Asn Tyr275 280 285 290aat ttt tac cgg gct tca caa caa ggt gga agc tat gat atg cgt aat1192Asn Phe Tyr Arg Ala Ser Gln Gln Gly Gly Ser Tyr Asp Met Arg Asn295 300 305att tta cga gga tct tta gta gaa gcg cat ccg atg cat gca gtt acg1240Ile Leu Arg Gly Ser Leu Val Glu Ala His Pro Met His Ala Val Thr310 315 320ttt gtt gat aat cat gat act cag cca ggg gag tca tta gag tca tgg1288Phe Val Asp Asn His Asp Thr Gln Pro Gly Glu Ser Leu Glu Ser Trp325 330 335gtt gct gat tgg ttt aag cca ctt gct tat gcg aca att ttg acg cgt1336Val Ala Asp Trp Phe Lys Pro Leu Ala Tyr Ala Thr Ile Leu Thr Arg340 345 350gaa ggt ggt tat cca aat gta ttt tac ggt gat tac tat ggg att cct1384Glu Gly Gly Tyr Pro Asn Val Phe Tyr Gly Asp Tyr Tyr Gly Ile Pro355 360 365 370
aac gat aac att tca gct aaa aaa gat atg att gat gag ctg ctt gat 1432Asn Asp Asn Ile Ser Ala Lys Lys Asp Met Ile Asp Glu Leu Leu Asp375 380 385gca cgt caa aat tac gca tat ggc acg cag cat gac tat ttt gat cat 1480Ala Arg Gln Asn Tyr Ala Tyr Gly Thr Gln His Asp Tyr Phe Asp His390 395 400tgg gat gtt gta gga tgg act agg gaa gga tct tcc tcc aga cct aat 1528Trp Asp Val Val Gly Trp Thr Arg Glu Gly Ser Ser Ser Arg Pro Asn405 410 415tca ggc ctt gcg act att atg tcg aat gga cct ggt ggt tcc aag tgg 1576Ser Gly Leu Ala Thr Ile Met Ser Asn Gly Pro Gly Gly Ser Lys Trp420 425 430atg tat gta gga cgt cag aat gca gga caa aca tgg aca gat tta act 1624Met Tyr Val Gly Arg Gln Asn Ala Gly Gln Thr Trp Thr Asp Leu Thr435 440 445 450ggt aat aac gga gcg tcc gtt aca att aat ggc gat gga tgg ggc gaa 1672Gly Asn Asn Gly Ala Ser Val Thr Ile Asn Gly Asp Gly Trp Gly Glu455 460 465ttc ttt acg aat gga gga tct gta tcc gtg tac gtg aac caa taacaaaaa1723Phe Phe Thr Asn Gly Gly Ser Val Ser Val Tyr Val Asn Gln470 475 480gccttgagaa gggattcctc cctaactcaa ggctttcttt atgtcgctta gctttacgct1783tctacgactt tg1795<210>14<211>480<212>PRT<213>芽孢杆菌sp.KSM-K38<400>14Asp Gly Leu Asn Gly Thr Met Met Gln Tyr Tyr Glu Trp His Leu Glu1 5 10 15
Asn Asp Gly Gln His Trp Asn Arg Leu His Asp Asp Ala Ala Ala Leu20 25 30Ser Asp Ala Gly Ile Thr Ala Ile Trp Ile Pro Pro Ala Tyr Lys Gly35 40 45Asn Ser Gln Ala Asp Val Gly Tyr Gly Ala Tyr Asp Leu Tyr Asp Leu50 55 60Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr Lys65 70 75 80Ala Gln Leu Glu Arg Ala Ile Gly Ser Leu Lys Ser Asn Asp Ile Asn85 90 95Val Tyr Gly Asp Val Val Met Asn His Lys Met Gly Ala Asp Phe Thr100 105 110Glu Ala Val Gln Ala Val Gln Val Asn Pro Thr Asn Arg Trp Gln Asp115 120 125Ile Ser Gly Ala Tyr Thr Ile Asp Ala Trp Thr Gly Phe Asp Phe Ser130 135 140Gly Arg Asn Asn Ala Tyr Ser Asp Phe Lys Trp Arg Trp Phe His Phe145 150 155 160Asn Gly Val Asp Trp Asp Gln Arg Tyr Gln Glu Asn His Ile Phe Arg165 170 175Phe Ala Asn Thr Asn Trp Asn Trp Arg Val Asp Glu Glu Asn Gly Asn180 185 190
Tyr Asp Tyr Leu Leu Gly Ser Asn Ile Asp Phe Ser His Pro Glu Val195 200 205Gln Asp Glu Leu Lys Asp Trp Gly Ser Trp Phe Thr Asp Glu Leu Asp210 215 220Leu Asp Gly Tyr Arg Leu Asp Ala Ile Lys His Ile Pro Phe Trp Tyr225 230 235 240Thr Ser Asp Trp Val Arg His Gln Arg Asn Glu Ala Asp Gln Asp Leu245 250 255Phe Val Val Gly Glu Tyr Trp Lys Asp Asp Val Gly Ala Leu Glu Phe260 265 270Tyr Leu Asp Glu Met Asn Trp Glu Met Ser Leu Phe Asp Val Pro Leu275 280 285Asn Tyr Asn Phe Tyr Arg Ala Ser Gln Gln Gly Gly Ser Tyr Asp Met290 295 300Arg Asn Ile Leu Arg Gly Ser Leu Val Glu Ala His Pro Met His Ala305 310 315 320Val Thr Phe Val Asp Asn His Asp Thr Gln Pro Gly Glu Ser Leu Glu325 330 335Ser Trp Val Ala Asp Trp Phe Lys Pro Leu Ala Tyr Ala Thr Ile Leu340 345 350Thr Arg Glu Gly Gly Tyr Pro Asn Val Phe Tyr Gly Asp Tyr Tyr Gly355 360 365
Ile Pro Asn Asp Asn Ile Ser Ala Lys Lys Asp Met Ile Asp Glu Leu370 375 380Leu Asp Ala Arg Gln Asn Tyr Ala Tyr Gly Thr Gln His Asp Tyr Phe385 390 395 400Asp His Trp Asp Val Val Gly Trp Thr Arg Glu Gly Ser Ser Ser Arg405 410 415Pro Asn Ser Gly Leu Ala Thr Ile Met Ser Asn Gly Pro Gly Gly Ser420 425 430Lys Trp Met Tyr Val Gly Arg Gln Asn Ala Gly Gln Thr Trp Thr Asp435 440 445Leu Thr Gly Asn Asn Gly Ala Ser Val Thr Ile Asn Gly Asp Gly Trp450 455 460Gly Glu Phe Phe Thr Asn Gly Gly Ser Val Ser Val Tyr Val Asn Gln465 470 475 480<210>15<211>25<212>DNA<213>人工序列<220>
<223>设计自纤维素酶的芽孢杆菌sp.KSM-S237基因的核苷酸序列的作为PCR引物的低聚核苷酸;在5’-端插入有BamHI限制酶切位点的序列<400>15cccggatcca acaggcttat attta 25<210>16<211>29<212>DNA
<213>人工序列<220>
<223>作为PCR引物的低聚核苷酸;其3’-部分设计自纤维素酶的芽孢杆菌sp.
KSM-S237基因的核苷酸序列,其5’-部分设计自淀粉酶的芽孢杆菌sp.
KSM-K38基因的核苷酸序列<400>16ttcaatccat ctgctgcaag agctgccgg 29<210>17<211>30<212>DNA<213>人工序列<220>
<223>作为PCR引物的低聚核苷酸;其3’-部分设计自淀粉酶的芽孢杆菌sp.KSM-K38基因的核苷酸序列,其5’-部分设计自纤维素酶的芽孢杆菌sp.KSM-S237基因的核苷酸序列<400>17gctcttgcag cagatggatt gaacggtacg 30<210>18<211>30<212>DNA<213>人工序列<220>
<223>设计自淀粉酶的芽孢杆菌sp.KSM-K38基因的核苷酸序列的作为PCR引物的低聚核苷酸;在5’-端插入有Xbal限制酶切位点的序列<400>18ttggtctaga ccccaagctt caaagtcgta 30
权利要求
1.一种启动子DNA,其特征在于,是对含有由SigA识别的启动子及其附近的碱基的碱基序列进行修饰以使得被SigA和SigE识别而形成的启动子DNA。
2.如权利要求1所述的启动子DNA,其特征在于,是通过构建被SigE识别的共有序列而进行修饰的启动子DNA。
3.如权利要求2所述的启动子DNA,其特征在于,被SigE识别的共有序列为,由用ATAHTT所表示的-35区域和用在其13或14碱基之后连接的CATAYAHT所表示的-10区域形成的碱基序列,其中,H为A或C或T,Y为C或T。
4.如权利要求1~3的任意一项所述的启动子DNA,其特征在于,含有被SigA识别的启动子及其附近的碱基的碱基序列为含有如下碱基序列的碱基序列由序列号1所表示的碱基序列的碱基号92~552的碱基序列,由序列号2所表示的碱基序列的碱基号133~589的碱基序列,或者对该碱基序列具有80%以上的同一性、且具有SigA的共有序列和/或具有相同的启动子功能的碱基序列。
5.如权利要求1~3的任意一项所述的启动子DNA,其特征在于,含有被SigA识别的启动子及其附近的碱基的碱基序列为,由序列号1所表示的碱基序列,由序列号2所表示的碱基序列,或对该碱基序列具有90%以上的同一性、且具有SigA的共有序列和/或具有相同的启动子功能的碱基序列。
6.如权利要4或5所述的启动子DNA,其特征在于,含有由SigA识别的启动子及其附近的碱基的碱基序列为610bp以下的大小。
7.一种启动子DNA,其特征在于,是连接2个以上的权利要求1~6的任意一项所述的启动子DNA的启动子DNA。
8.一种表达载体,其特征在于,是含有权利要求1~7的任意一项所述的启动子DNA的表达载体。
9.一种重组微生物,其特征在于,是含有权利要求8所述的表达载体的重组微生物。
10.一种重组微生物,其特征在于,是在基因组上导入了权利要求1~7的任意一项所述的启动子DNA的重组微生物。
11.一种蛋白质或多肽的制造方法,其特征在于,培养权利要求9或10所述的重组微生物。
12.如权利要求11所述的制造方法,其特征在于,蛋白质为纤维素酶或淀粉酶。
13.如权利要求12所述的制造方法,其特征在于,纤维素酶为由用序列号4所表示的氨基酸序列所组成的碱性纤维素酶,或者对该氨基酸序列具有70%以上的同源性、并且具有碱性纤维素酶活性的蛋白质。
14.如权利要求12所述的制造方法,其特征在于,淀粉酶为由用序列号14所表示的氨基酸序列所组成的碱性淀粉酶,或者对该氨基酸序列具有70%以上的同源性、并且具有碱性淀粉酶活性的蛋白质。
15.一种启动子DNA的构建方法,其特征在于,对含有由SigA识别的启动子及其附近的碱基的碱基序列进行修饰以使得可由SigA和SigE识别。
全文摘要
本发明提供一种能够使编码蛋白质或多肽的基因的转录量提高的经过修饰的启动子DNA,以及使用其的蛋白质或多肽的有效的制造方法。通过对包含由SigA识别的启动子及其附近的碱基的碱基序列进行修饰以使得由SigA和SigE识别而形成的启动子DNA;含有该启动子DNA的表达载体、含有该表达载体的重组微生物、以及以培养该重组微生物为特征的蛋白质或多肽的制造方法。
文档编号C12N1/19GK1930291SQ20058000711
公开日2007年3月14日 申请日期2005年3月4日 优先权日2004年3月5日
发明者远藤圭二, 尾崎克也 申请人:花王株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1