超耐热蛋白酶基因的制作方法

文档序号:450026阅读:318来源:国知局

专利名称::超耐热蛋白酶基因的制作方法
技术领域
:本发明涉及用作工业酶的超耐热蛋白酶,编码相同酶的基因和通过遗传工程制备该酶的方法。
背景技术
:蛋白酶是断裂蛋白中肽键的酶,并且许多蛋白酶发现于动物、植物和微生物中。它们不仅用作研究工作和医疗用品的试剂,而且用于工业领域和清洁剂的添加剂,食品加工及利用可逆反应的化学合成,并且从工业角度来说,它们是很重要的酶。对于用于工业领域的蛋白酶,由于需要很高的物理和化学稳定性,尤其,具有高耐热性的酶被优选使用。目前,主要用于工业领域的蛋白酶是通过芽孢杆菌属的细菌而制备因为它们具有相对高的耐热性。然而,具有更高优越性的酶是必要的且已试图从生长于高温的微生物,如芽孢杆菌属的嗜热菌中获得酶。另一方面,一组名为超嗜热菌(hyperthermophiles)的微生物很适于高温环境且因此它们被期望成为提供各种耐热酶的来源。已知这些超嗜热菌中的一员,激烈热球菌,产生蛋白酶[应用环境微生物学,56卷,1992-1998页(1990),FEMS微生物学通讯,7l卷,l7-20页(1990),遗传微生物学杂志,137卷,ll93-1199页(1991)]。一种属于热球菌属,报道属于热球菌类的菌株KODl产生巯基蛋白酶(半胱氨酸蛋白酶)[应用环境微生物学,60卷,4559-4566页(1994)]。已知属于热球菌属,葡萄嗜热菌属和栖热拟杆菌属同时也是超嗜热菌的细菌产生蛋白酶[应用微生物学生物技术,34卷,715-719页(1991)]。发明目的由于通过这些超耐热菌制备的蛋白酶具有高的耐热性,故它们被期望能用于任何已知酶未能用到的应用中。然而,上面的说明仅告诉了存在于获自培养上清的无细胞提取物或粗酶溶液,并且没有公开有关分离及其纯化的酶的特性。仅有通过菌株KOD1而制备的蛋白酶是作为纯化形式而获得。然而,由于半胱氨酸蛋白酶具有通过氧化而容易丧失活性的缺陷,故它在工业应用中是不利的。此外,由于需要在高温下微生物的培养以从这些超耐热菌中获取酶,故存在该酶的工业化生产问题。为了解决上面的问题,本发明的目的是提供在工业应用中具有优势的超嗜热菌的蛋白酶,分离编码超嗜热菌蛋白酶的基因,以及提供用该基因通过遗传工程手段制备超耐热蛋白酶的方法。发明公开为了获得超耐热蛋白酶基因,本发明者最初试图从微生物细胞及激烈热球菌DSM3638的培养上清中纯化蛋白酶以便于测定该酶的部分氨基酸序列。然而,用微生物细胞或培养上清的场合中蛋白酶的纯化是很困难的,并且本发明人未能获得具有足够纯度而用于其部分氨基酸序列测定的这样的酶样品。作为没有酶蛋白一级结构的任何信息而克隆一个目的酶基因的方法,有一种表达克隆方法。例如,源自沃氏热球菌(WO92/02614)的pllulanase基因是根据该方法获得的。然而,在表达克隆方法中,一般要用质粒载体并且,在这种情况,使用能将目的基因裂解成相对较小的DNA片段以致该片段可被插入到质粒载体而没有目的基因任何内部部分断裂的限制性酶是必要的。因此,表达克隆方法不可总是能用于所有种类酶基因的克隆。此外,测试许多克隆酶活性是必要的并且该操作过程复杂。本发明人试图用能包含较大DNA片段(30~50kb)的粘粒载体代替质粒载体以制备激烈热球菌基因组的粘粒文库并且在文库中检测粘粒克隆以找出表达蛋白酶活性的克隆而分离蛋白酶基因。通过使用粘粒载体,除了降低酶基因内部片段断裂的可能性之外要筛选的转化子数目可被减少。另一方面,由于宿主细胞中粘粒载体的拷贝数不高于质粒载体的拷贝数,也许表达的酶量太少而检测不出来。考虑到目的酶的高耐热性,首先,本发明人分别培养在粘粒文库中的各自转化子且以从这样获得的微生物细胞中制备仅含耐热性蛋白的溶菌物步骤与该步骤合并,并且用这些溶菌物检测酶的活性。此外,用于检测蛋白酶活性的含明胶的SDS-聚丙烯酰胺凝胶电泳允许痕量酶活性的检测。这样,本发明人从激烈热球菌粘粒文库中获得几个表达蛋白酶活性的粘粒克隆并且从该克隆中所含的插入DNA片段中成功地分离出编码蛋白酶的基因。此外,本发明人证实由该基因编码的蛋白酶具有极高的耐热性。通过比较从基因核苷酸序列推断的超耐热蛋白酶氨基酸序列与源于微生物的已知蛋白酶的氨基酸序列相比,已显示出超耐热蛋白酶前半部分的氨基酸序列与一组代表枯草蛋白酶的碱性丝氨酸蛋白酶的前半部分的同源性。尤其,在已知对酶催化活性重要的四个氨基酸残基周围的每个区域发现具有极高的同源性。这样,由于通过激烈热球菌而制备的蛋白酶(在如此高温下仍是有活性的以致于源于中温菌(mesophiles)的蛋白酶容易失活)显示出与适温菌的菌具有类似的结构,所以提示类似的蛋白酶也会通过除激烈热球菌以外的超嗜热菌而制备。于是,本发明人注意到了在获得的超耐热蛋白酶基因的核苷酸序列中,显示出与枯草蛋白酶等具有较高同源性的核苷酸序列编码区可作检测超耐热蛋白酶基因的探针的可能性,并且试图通过PCR检测源于超嗜热菌的蛋白酶基因,该PCR用根据其核苷酸序列而设计的合成DNAs作为引物从而克隆基因。结果,发现与上述基因具有同源性的基因片段存在于超嗜热菌,速生热球菌DSM2476中。克隆该基因的全长是困难的并且这被认为是由于源自该基因的产物对宿主有害。本发明用枯草芽孢杆菌作为克隆的宿主并且发现含有全长基因是可能的并且表达的蛋白酶是细胞外分泌的,进一步证实表达的蛋白酶在95℃显示出蛋白酶活性并且具有较高的耐热性。对于该酶,发现由该基因编码的蛋白酶的分子量还不到源自上述激烈热球菌高分子蛋白酶分子量的一半。此外,通过用该基因片段作为探针的杂交,我们发现不同于高分子蛋白酶基因的第二个蛋白酶基因存在于激烈热球菌。该基因编码与源自速生热球菌的超耐热蛋白酶具有类似分子量的蛋白酶,并且该基因被分离并导入到枯草芽孢杆菌中并且,因此,表达自该基因的产物为细胞外分泌。表达的蛋白酶在95℃显示出酶活性并且具有较高的耐热性。此外,通过蛋白酶的加工而形成的成熟蛋白酶的氨基酸序列也被揭示。由于这两种蛋白酶为细胞外分泌而没有任何特殊步骤,故认为由该基因本身编码的信号肽在枯草芽孢杆菌中发挥作用。每个培养物中表达的2种蛋白酶的数量与源自激烈热球菌且在大肠杆菌或枯草芽孢杆菌中表达的高分子蛋白酶的情况相比要高得多,此外,当通过应用枯草蛋白酶基因启动子和信号序列表达该基因时,表达的蛋白酶的量进一步提高。此外,本发明人制备了编码杂合蛋白酶的基因,该蛋白酶是两种蛋白酶的嵌合体蛋白,并且证实由该基因表达的酶与上面的超耐热蛋白酶一样在高温条件下表现出蛋白酶活性,这将导致本发明的完成。发明概述本发明第一个方面提供了具有在序列表的SEQIDNO.1中描述的氨基酸序列的超耐热蛋白酶或其功能等价物以及编码超耐热蛋白酶的超耐热蛋白酶基因,此外,还有具有在序列表的SEQIDNO.2中描述的核苷酸序列的超耐热蛋白酶基因。此外,也提供了与该超耐热蛋白酶基因杂交并且编码超耐热蛋白酶的基因。此外,本发明的第二个方面提供了具有序列表的SEQIDNO.3中描述的氨基酸序列的超耐热蛋白酶或其功能等价物以及编码超耐热蛋白酶的超耐热蛋白酶基因,除此之外,还有具有序列表的SEQIDNO.4中描述的核苷酸序列的超耐热蛋白酶基因。此外,也提供了与该超耐热蛋白酶基因杂交并且编码超耐热蛋白酶的基因。此外,本发明的第三个方面提供了具有序列表的SEQIDNO.5中描述的氨基酸序列的超耐热蛋白酶或其功能等价物以及编码超耐热蛋白酶的超耐热蛋白酶基因,除此之外,还有具有序列表的SEQIDNO.6中描述的核苷酸序列的超耐热蛋白酶基因。此外,也提供了与该超耐热蛋白酶基因杂交的并且编码超耐热蛋白酶的基因。此外,本发明提供了超耐热蛋白酶的制备方法,其中包括培养含有本发明超耐热蛋白酶基因的转化子,并且从培养物中收集超耐热蛋白酶。正如这里所用的,术语“功能等价物”意义如下已知在天然产生的蛋白中,虽然如一个或几个(如,达到总氨基酸的5%)氨基酸的缺失、添加、替代等的突变除了编码它们的基因的多肽性或突变之外,由于在活体中或纯化过程中制备蛋白的修饰反应等而可能发生,尽管上述的突变,仍存在与没有突变的蛋白表现出基本相同的生理或生物活性的蛋白。当蛋白在结构上具有微小差异而没有认识到其功能的巨大差异时,它们便称为功能等价物。当上面的突变人为地导入到蛋白的氨基酸序列中并且在这种情况可制备更多种突变体时这种现象是正确的。例如,在人白介素-2(IL-2)的氨基酸序列中某一半胱氨酸残基以丝氨酸残基替代的多肽表现出白介素-2的活性[科学,224卷,1431页(1984)]由本发明超耐热蛋白酶基因转录和翻译的基因产物是含有两个区域的酶前体(前酶原),其中之一是细胞外分泌必需的信号肽且另外一个是当前者去除后活性开始表达的前肽。当转化有上述基因的转化子能断裂信号肽时,从中信号肽被去除的酶前体(酶原)则细胞外分泌。此外,一种从中肽原被去除的活性形式的酶通过酶原之间的自我消化反应而产生。从本发明基因而获得的所有前酶原、酶原及活性形式的酶为最终具有等价功能的蛋白且落入“功能等价物”的范畴。由于对本领域的技术人员已众所周知,适当的信号肽可依据用作感兴趣基因的表达宿主而选择。当不需要细胞外分泌时信号肽可被去除。因此,在这里公开的超耐热蛋白酶基因中,其中编码信号肽的部分被去除的基因,和其中的一部分以其它核苷酸序列替代的基因也在本发明的范围之内因为在内容上它们编码具有基本上相同活性的蛋白酶。如这里所使用的,“与超耐热蛋白酶基因杂交”的基因是指在下面的严格条件下与超耐热蛋白酶基因杂交的基因,即,在含0.5%SDS,0.1%序血清白蛋白(BSA)、0.1%聚乙烯吡咯烷酮,0.1%Ficoll400和0.01%变性鲑精DNA的6×SSC(1×SSC代表0.15MNaCl,0.015M柠檬酸钠,pH7.0)中50℃孵育12~20小时。附图简述图.1为显示源自激烈热球菌包含在质粒pTPR12和质粒pUBP13中DNA片段的限制性图谱。图.2为显示寡核苷酸PRO-1F的设计图。图.3为显示寡核苷酸PRO-2F和PRO-2R的设计图。图.4为显示寡核苷酸PRO-4R的设计图。图.5为质粒p2F-4R的限制性图谱。图.6为质粒pTC3的限制性图谱。图.7为质粒pTCS6的限制性图谱。图.8为质粒pTC4的限制性图谱。图.9为显示构建质粒pSTC3的步骤图。图.10为质粒pSTC3的限制性图谱。图.11为比较各种蛋白酶氨基酸序列的图。图.12为图.11的延续。图.13为显示激烈热球菌染色体DNA上蛋白酶PFUS基因周围的限制性图谱。图.14为质粒pSPT1的限制性图谱。图.15为质粒pSNP1的限制性图谱。图.16为质粒pPS1的限制性图谱。图.17为质粒pNAPS1的限制性图谱。图.18为显示酶制剂TC-3最适温度的图。图.19为显示酶制剂NAPS-1最适温度的图。图.20为显示酶制剂TC-3最适pH的图。图.21为显示酶制剂NP-1最适pH的图。图.22为显示酶制剂NAPS-1最适pH的图。图.23为显示酶制剂TC-3耐热性的图。图.24为显示酶制剂NP-1耐热性的图。图.25为显示激活的酶制剂NP-1耐热性的图。图.26为显示酶制剂NAPS-1耐热性的图。图.27为显示酶制剂NP-1pH稳定性的图。图.28为显示在SDS存在下酶制剂NP-1稳定性的图。图.29为显示在SDS存在下酶制剂NAPS-1稳定性的图。图.30为显示在乙腈存在下酶制剂NAPS-1稳定性的图。图.31为显示在尿素存在下酶制剂NAPS-1稳定性的图。图.32为显示在盐酸胍存在下酶制剂NAPS-1稳定性的图。本发明的优选实施方案本发明的超耐热蛋白酶基因可通过筛选超嗜热菌的基因文库而获得。作为超嗜热菌,可以使用属于热球菌属的细菌并且感兴趣的基因可通过筛选激烈热球菌基因组的粘粒文库而获得。例如,激烈热球菌DSM3638可用作激烈热球菌,并且该菌株可从德意志微生物保藏中心得到。激烈热球菌基因组粘粒文库的一个实例可通过连接以限制性酶Sau3A1(由TakaraShuzo公司生产)部分消化激烈热球菌DSM3638基因组DNA而获得的DNA片段与三股螺旋粘粒载体(由Stratagene生产),并且根据体外包装方法将连接产物包装进入λ噬菌体颗粒而获得。然后,将该文库导入合适的大肠杆菌,如,大肠杆菌DH5αMCR(由BRL生产)以获得转化子,接着通过培养它们,收集微生物细胞,将它们进行热处理(如,100℃10分钟),超声及再次热处理(如,100℃10分钟)。得到的裂解液中蛋白酶活性的有无可用含凝胶的SDS-聚丙烯酰胺凝胶电泳而筛选。用这种方式,可获得含超耐热蛋白酶基因且表达对上述热处理具有抗性的蛋白酶的粘粒克隆。此外,从这样获得的粘粒克隆制备的粘粒DNA可用适当的限制性酶切割成片段以获得具有每个插入片段的重组质粒。然后,以该质粒转化适当的微生物,并且可检测由得到的转化子表达的蛋白酶活性而获得含感兴趣的超耐热蛋白酶基因的重组质粒。即,以NotI与PvuII(两者均由TakaraShuzo公司生产)酶切从上面的一个粘粒克隆制备的粘粒以得到一个约7.5kb的DNA片段,它可被分离并插入到导入有NotI接头(由TakaraShuzo公司生产)的PUC19质粒载体的NotI位点与SmaI位点之间。该质粒命名为质粒pTPR12且以该质粒转化的大肠杆菌JM109命名为大肠杆菌JM109/pTPR12并且保藏于国家生命科学与人类技衣研究所,Higashi,Tsukuba-shi1-1-3号,Ibaraki-ken,日本,1994年5月24日(最初保藏日期)作为根据布达佩斯条约的保藏FERMBP-5103。大肠杆菌JM109/pTPR12的裂解液与上面的粘粒克隆裂解液一样在含明胶的SDS-聚丙烯酰胺凝胶中表现出类似的蛋白酶活性。源自激烈热球菌并被插入到质粒pTPR12中的DNA片段的核苷酸序列可用传统方法测定,如,双脱氧方法。位于插入到质粒pTPR12的DNA片段中且两侧带有2个DraI位点的4.8kb部分的核苷酸序列显示于序列表中的SEQIDNO.7。从核苷酸序列推断的基因产物的氨基酸序列显示于序列表的SEQIDNO.8。这样,一种源自激烈热球菌,其核苷酸序列和氨基酸序列均被揭示的超耐热蛋白酶被命名为蛋白酶PFUL。如序列表的SEQIDNO.8所示,蛋白酶PFUL为由1398个氨基酸残基组成并且具有大于15万道尔顿的高分子量蛋白酶。蛋白酶PFUL基因可用枯草芽孢杆菌作为宿主来表达。作为枯草芽孢杆菌,枯草芽孢杆菌DB104可被使用且该菌株为在《基因》,83卷,215-233页(1989)描述过的已知菌株、作为克隆载体,质粒pUB18P43可被使用且该质粒由Calgary大学的Sui-LamWong博士惠馈。该质粒含有作为可选择标记的卡那霉素抗性基因。有一种这样的质粒pUBP13,其中的以DraI酶切质粒pTPR13而获得的约4.8kb的DNA片段被插入到质粒载体pUB18-P43的SmaI位点。在该质粒中,蛋白酶PFUL基因位于在枯草芽孢杆菌中起作用的P43启动子[生物化学杂志,259卷,8619-8625页(1984)]的下游。以该质粒转化的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pUBP13。转化子的裂解物与大肠杆菌JM109pTPR12的裂解物显示出类似的蛋白酶活性。然而,在转化子的培养上清中仅检测到极少量的蛋白酶活性。这被认为是由于蛋白酶PFUL分子量过高且在枯草芽孢杆菌中没有有效地翻译。并且由蛋白酶PFUL基因编码的信号序列没有在枯草芽孢杆菌中很好地发挥功能。也存在蛋白酶PFUL为膜结合型蛋白酶的可能性,并且位于蛋白酶PFULC-末端的肽链也许是结合到细胞膜上的区域。图.1显示了激烈热球菌染色体上蛋白酶PFUL基因周围的限制性图谱,以及插入到质粒pTPR12和质粒pUBP13中的DNA片段。此外,图.1中的箭头表示编码蛋白酶PFUL的开放阅读框。通过比较序列表中SEQIDNO8所代表的蛋白酶PFUL的氨基酸序列与源自已知微生物的蛋白酶的氨基酸序列,发现蛋白酶PFUL的前半部分氨基酸序列与一组代表枯草蛋白酶[蛋白质工程,4卷,719-737(1991)]的碱性丝氨酸蛋白酶的氨基酸序列具有同源性,并且在被认为是对蛋白酶催化活性重要的四个氨基酸残基的周围具有极高的同源性。由于已证明普遍存在于源自适温菌的蛋白酶中的区域也存在于由超嗜热菌激烈热球菌产生的蛋白酶PFUL的氨基酸序列中,故预计这些区域也存在于除激烈热球菌之外的超耐热菌产生的相同种蛋白酶中。即,具有适当长度的DNA可根据编码与枯草蛋白酶等序列具有高度同源性区域的氨基酸序列的部分的序列而制备,并且该DNA可用作杂交探针或作为如PCR等基因扩增的引物以在各种超嗜热菌中筛选出与本发明酶类似的超耐热蛋白酶基因。在上述方法中,有时获得的是仅含感兴趣基因一部分的DNA片段,有鉴于此,检查得到DNA片段的核苷酸序列并证明它是感兴趣基因的一部分并且,之后,可用该DNA片段或其部分作为探针进行杂交或可用根据该DNA片段的核苷酸序列合成的引物进行PCR以获得整个感兴趣的基因。上面的杂交可在以下条件中进行。即,固定有DNA的膜在含0.5%SDS,0.1%牛血清白蛋白(BSA),0.1%聚乙烯吡咯烷酮,0.1%Ficoll400和0.01%变性鲑精DNA的6×SSC(1×SSC代表0.15MNaCl,0.015M柠檬酸钠,pH7.0)中与适当标记的探针在50℃孵育12~20小时。孵育完成以后,洗膜,开始以含0.5%SDS的2×SSC37℃洗膜,改变SSC的浓度至0.1×且温度至50℃,直到杂交到固定DNA上的探针信号可与背景区分开来为止。此外,对于本领域的技术人员还很明显,可根据这样获得的新超耐热基因制备探针和引物按照类似的方法获得其它超耐热蛋白酶基因。图.2、3和4显示了在蛋白酶PFUL氨基酸序列区域的氨基酸序列之间的关系(它们与枯草蛋白酶等的氨基酸序列具有高度的同源性)、编码该区域蛋白酶PFUL基因的核苷酸序列、以及根据它们而合成的寡核苷酸PRO-1F,PRO-2F,PRO-2R和PRO-4R的核苷酸序列。此外,序列表中的SEQIDNO.9、10、11和12显示寡核苷酸PRO-1F、PRO-2F、PRO-2F和PRO-4R的核苷酸序列。即,SEQIDNO.9-12为用作筛选本发明超耐热蛋白酶基因寡核苷酸一个实施例的核苷酸序列。通过使用寡核苷酸组合作为组合,蛋白酶基因可通过用各种超嗜热菌的染色体DNA作为模板的PCR来检测。作为超嗜热菌,可使用属于热球菌属、热球菌属、葡萄嗜热菌属、栖热拟杆菌属等的细菌。例如作为属于热球菌属的细菌,速生热球菌DSM2476可被使用且该菌株可从德意志菌种保藏中心获得。当用速生热球菌DSM2476作为模板并且用寡核苷酸PRO-1F和PRO-2R的组合或寡核苷酸PRO-2F和PRO-4R的组合作为引物进行PCR时,观测到DNA片段的特异扩增并且蛋白酶基因的存在可被鉴定。此外,由DNA片段编码的氨基酸序列可通过将该DNA片段插入到合适的质粒载体以制备重组质粒并且,之后,用双脱氧方法测定插入DNA片段的核苷酸序列而被估计。将用寡核苷酸PRO-1F与PRO-2R扩增的约150bp的DNA片段和用寡核苷酸PRO-2F和PRO-4R扩增的约550bp的DNA片段插入到质粒载体pUC18(由TakaraShuzo公司生产)的HincII位点。重组的质粒分别命名为质粒p1F-2R(2)和质粒p2F-4R。序列表中的SEQIDNO.13显示质粒p1F-2R(2)中插入DNA片段的核苷酸序列和由此推断的氨基酸序列并且序列表中的SEQIDNO.14显示质粒p2F-4R中插入DNA片段的核苷酸序列和由此推断的氨基酸序列。在序列表的SEQIDNO.13中,从第1到第21个核苷酸的核苷酸序列和第113到145个核苷酸的核苷酸序列与在序列表的SEQIDNO.14中,从第1到第32个核苷酸的核苷酸序列和第532到第564个核苷酸的核苷酸序列是来自用作PCR引物(每个分别相应于寡核苷酸PRO-1F,PRO-2R,PRO-2F和PRO-4R)寡核苷酸的核苷酸序列。与蛋白酶PFUL及来自各种微生物的碱性丝氨酸蛋白酶的氨基酸序列具有同源性的氨基酸序列存在于由序列表的SEQIDNO.13和SEQIDNO.14所代表的氨基酸序列中,表明上面的PCR扩增的DNA片段是以该蛋白酶基因作为模板而扩增的。质粒p2F-4R的限制性图谱显示于图.5。在图.5中,粗实线表示插入到质粒载体pUC18中的DNA片段。那么,超耐热蛋白酶基因,例如,通过速生热球菌产生的超耐热蛋白酶基因可用上面的寡核苷酸或通过上面的PCR而获得的扩增DNA片段作为探针通过筛选超耐热细菌的基因文库而获得。有一个速生热球菌基因文库的实例,该文库是这样制备的,即以限制性酶Sau3AI部分酶切速生热球菌DSM2476的染色体DNA以获得DNA片段,连接该片段与λGEM-11载体(由Promega生产)并用体外包装方法将其包装进入λ噬菌体颗粒。然后,该文库可转导入合适的大肠杆菌,例如,大肠杆菌LE392(由Promega生产)以允许在平板上形成噬菌斑,并且可用上面的PCR获得的扩增DNA片段作为探针进行噬菌斑杂交以获得含有感兴趣基因的噬菌体克隆。此外,从这样获得的噬菌体克隆制备的噬菌体DNA可以适当的限制酶酶切,并且可用上面的探针进行Southern杂交以检测含蛋白酶基因的DNA片段。当从由噬菌斑杂交而获得的噬菌体克隆制备的噬菌体DNA以KpnI和BamHI(两者均由TakaraShuzo公司生产)酶切时,一个约5kb的DNA片段与探针杂交,并且该约5kb的DNA片段可被分离并插入到质粒载体pUC119(由TakaraShuzo公司生产)的KpnI位点与BamHI位点之间以获得重组质粒。该质粒命名为质粒pTC3且以该质粒转化的大肠杆菌JM109命名为大肠杆菌JM109/pTC3。质粒pTC3的限制性图谱显示于图6。在图6中,粗实线代表插入到质粒载体pUC119中的DNA片段。插入到质粒pTC3中的DNA片段中不含蛋白酶基因的DNA片段可按下面的步骤加以去除。即,质粒pTC3以SacI(TakaraShuzo公司生产)酶切后,根据上述的类似步骤进行southern杂交,并发现约1.9kb的DNA片段与探针杂交。然后该约1.9kb的DNA片段可被分离并插入到质粒载体pUC118(由TakaraShuzo公司生产)的SacI位点以制备重组载体。该质粒命名为质粒pTCS6且以该质粒转化的大肠杆菌JMl09命名为大肠杆菌JM109/pTCS6。质粒pTCS6的限制性图谱显示于图7。在图7中,粗实线代表插入到质粒载体pUC118中的DNA片段。通过用双脱氧方法测定插入到质粒pTCS6中DNA片段的核苷酸序列,可证实蛋白酶基因存在于该DNA片段中。与这一样,源自速生热球菌,包含在质粒pTCS6中的超耐热蛋白酶基因缺少其中的一部分。然而,对于本领域的技术人员来说已众所周知,包括全长超耐热蛋白酶基因的DNA片段可通过以下方法获得(1)再次筛选基因文库,(2)用染色体DNA做southern杂交,或(3)用盒式(Cassette)和盒引物(TakaraShuzo公司,遗传工程产品指南,1994-1995年版,250-251页)通过PCR获得5′上游区的DNA片段。本发明人选择了方法(3)。即,速生热球菌的染色体DNA以几种限制性酶完全消化,接着用相当于所用限制性酶的盒(由TakaraShuzo公司)连接。用该连接产物作为模板且以引物TCE6R(序列表的序列6显示出引物TCE6R的核苷酸序列)和盒式引物Cl(由TakaraShuzo公司生产)作为引物进行PCR。当上面的步骤用限制酶HindIII(由TakaraShuzo公司生产)来加以完成时,扩增出约一条约1.8kb的DNA片段,并且以HindIII和SacI酶切上面的扩增片段而获得的约1.5kb的DNA片段可插入到质粒载体pUC119中的HindIII位点与SacI位点之间以获得重组质粒。该质粒命名为质粒pTC4且以该质粒转化的大肠杆菌JM109命名为大肠杆菌JM109/pTC4。质粒pTC4的限制性图谱显示于图8。在图8中,粗实线代表插入到质粒载体pUC119中的DNA片段。通过双脱氧方法测定插入到质粒pTC4中DNA片段的核苷酸序列,可以证实蛋白酶基因存在于该DNA片段中。序列表中的SEQIDNO.17显示该片段的核苷酸序列。通过比较由该核苷酸序列推导的氨基酸序列与各种蛋白酶的氨基酸序列。发现插入到质粒pTC4中的DNA片段包括质粒pTCS6中缺乏的超耐热蛋白酶基因的5′区。通过连接该核苷酸序列与序列表中的SEQIDNO.5所代表的插入到质粒pTCS6中DNA片段,可鉴定到源自速生热球菌的全长超耐热基因的核苷酸序列。存在于获得核苷酸序列中开放阅读框的核苷酸序列显示于序列表的SEQIDNO.2中且由该核苷酸序列推导的氨基酸序列显示于SEQIDNO.1中。因此,源自速生热球菌的超耐热蛋白酶命名为蛋白酶TCES,编码它的核苷酸序列及其氨基酸已被揭示。通过连接质粒pTC4中的插入DNA片段与质粒pTCS6中的插入DNA片段可重建全长的蛋白酶TCES基因。本来以为通过从pTC4与pTCS6中含有的两个DNA片段重建全长的蛋白酶TCES基因,并且将其插入到质粒乳糖启动子的下游以得到导入大肠杆菌的表达质粒来确证由该基因表达的蛋白酶活性。然而,该方法没有得到导入有感兴趣表达载体的转化子。并且预示该基因表达产物的产物对大肠杆菌有害或致命。例如,在这种场合,认为用枯草芽孢杆菌作为宿主将蛋白酶进行细胞外分泌以证实其活性。在枯草芽孢杆菌中作为表达蛋白酶TCES基因的宿主,枯草芽孢杆菌DB104可被使用,作为克隆载体,质粒pUB18-P43可被使用。然而,由于大肠杆菌的宿主载体系统具有含有各种载体且转化可简单而高度有效地进行的优点,故如果可能的话,尽可能用大肠杆菌完成构建表达载体的步骤。即,在大肠杆菌中,含有终止密码子的任意核苷酸序列插入到源自质粒pTC4与质粒pTCS6的两个蛋白酶基因片段之间从而重建的不是全长的蛋白酶TCES基因,这样,使基因产物的表达不可能并且,因此,完成质粒的构建。然后,在最后阶段去除该插入序列以使列于图10的感兴趣的质粒pSTC3表达。下面解释显示于图9的构建质粒pSTC3的步骤。首先,将插入在质粒pTCS6中的约1.8kb的HindIII-SspI片段插入到质粒载体pBR322(由TakaraShuzo公司生产)的HindIII位点与EcoRV位点之间以制备重组质粒pBTC5并且,在该质粒中,去除源自质粒载体pUC118多克隆位点的HindIII位点与KpnI位点之间的DNA片段以及存在于质粒载体pBR322的BamHI位点以制备质粒pBTC5HKB。然后,根据蛋白酶TCES基因的核苷酸序列,合成能在蛋白酶TCES起始密码子前面引入EcoRI位点与BamHI位点的引物TCE12,和能在仅含1个SacI位点的核苷酸序列的3′端引入ClaI位点和一终止密码子的引物TCE20R。序列表中的SEQIDNO.18与19分别显示引物TCE12和引物TCE20R的核苷酸序列。用速生热球菌染色体DNA作为模板且用这两条引物通过PCR而扩增到的约0.9kb的DNA片段以EcoRI和ClaI(由TakaraShuzo公司生产)酶切,并且插入到质粒pBTC5HKB的EcoRI位点与ClaI位点之间以获得质粒pBTC6,该质粒具有一个突变基因,其中的包括终止密码子的69bp的核苷酸序列插入到蛋白酶TCES基因的SacI位点。源自枯草芽孢杆菌P43启动子[生物化学杂志,259卷,第8019-8625页(1984)]的核糖体结合位点导入到质粒载体pUC18的KpnI位点与BamHI位点之间以制备质粒pUC-P43。合成寡核苷酸BS1与BS2的核苷酸序列分别显示于序列表中的SEQIDNO.20和21。然后,质粒pBTC6以BamHI和SphI(两者均由TakaraShuzo公司生产)酶切以获得含蛋白酶TCES突变基因的约3kb长的DNA片段,并将其插入到质粒pUC-P43的BamHI位点与SphI位点之间以构建质粒pTC12。所有上面用于构建质粒的步骤都可用大肠杆菌作为宿主来进行。用于克隆进入枯草芽孢杆菌的质粒载体pUC18-P43中的SacI位点被预先去除,并且获自pTC12的约3kb的KpnI-SphIDNA片段可插入到KpnI位点与SphI位点之间以制备用枯草芽孢杆菌DB104作为宿主的质粒pSTC2。该质粒含有蛋白酶TCES的突变基因,其5′端具有P43启动子和核糖体结合位点序列。质粒pSTC2以SacI酶切以后,进行分子内连接以获得重组质粒,其中的在上面突变基因的SacI位点里的插入序列已被去除。该重组质粒命名为质粒pSTC3,并且以该质粒转化的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pSTC3并且按照布达佩斯条约从1995年12月1日(最初保藏日期)以保藏于国家生命科学与人类技术研究所,Higashi1-1-3,Tsukuba-shi,Ibaraki-ken,日本登记号FERMBP-5635。培养转化子,并且测试细胞培养上清和提取物的蛋白酶活性。结果,两样品中均发现耐热蛋白酶活性。图10显示质粒pSTC3的限制性图谱。在图l0中,粗实线代表插入到质粒载体pUB18-P43中的DNA片段当比较蛋白酶PFUL、蛋白酶TCES和枯草蛋白酶的氨基酸序列以使具有同源性的区域相互匹配,如图11与12所示,发现蛋白酶PFUL在其C-末端以及具有同源性的区域之间具有与蛋白酶TCES序列及枯草蛋白酶序列不同源的区域。从这一点认识到,除了蛋白酶PFUL以外,一种比蛋白酶PFUL具有更小分子量的蛋白酶,如蛋白酶TCES或枯草蛋白酶也许存在于激烈热球菌。为了寻找编码这样蛋白酶的基因,用从激烈热球菌制备的染色体DNA作为靶子,并且用含蛋白酶TCES基因里核苷酸序列的DNA片段(该片段编码在三种蛋白酶中非常保守的氨基酸序列,例如,插入在质粒p1F-2R(2)中约150bp的DNA片段)作为探针进行southern杂交。虽然,由于用作探针的DNA片段也与蛋白酶PFUL基因具有同源性,但依据杂交条件该基因片段仍被检测为信号,源自该基因的信号位置可预先根据用于切割染色体DNA的每个限制酶,蛋白酶PFUL基因的核苷酸序列信息及限制性图谱来估计。当用一些酶时,除了根据蛋白酶PFUL基因预言的位置以外,又几乎在相同水平检测到另一个信号,意味着除了蛋白酶PFUL以外,在激烈热球菌中至少存在一个蛋白酶的可能性。对于分离相应于上面新信号的基因,首先克隆该基因的一部分以防止在如蛋白酶TCES情况中,由于基因产物表达对大肠杆菌有害或致命造成基因分离的失败。例如,当激烈、热球菌染色体DNA以限制酶SacI和SpeI(两者均由TakaraShuzo公司生产)酶切并且酶切产物用蛋白酶TCES基因的片段作为探针按上述用于进行southern杂交,发现从中观察到源自该新基因的相应于约0.6kb的新信号代替以在仅以SacI酶切情况中观察到的相应于约3kb的信号。这个约0.6kbSpeI-SacI的片段编码最多约200个残基的氨基酸序列并且不能预期表达具有活性的蛋白酶。将以SacI和SpeI酶切的激烈热球菌染色体DNA进行琼脂糖凝胶电泳以回收凝胶中相应于约0.6kb的DNA片段。然后,该片段插入到质粒载体pBluescriptSK(-)(由Stratagene生产)的SpeI位点与SacI位点之间并且得到的重组质粒用于转化大肠杆菌JM109。对于该转化子,可通过用与用于上面的southern杂交相同的探针的菌落杂交而获得插入有感兴趣片段的克隆。包含在得到的克隆中的质粒是否具有编码蛋白酶的序列可用根据上面各种蛋白酶共有的氨基酸序列制备的引物lFP1,lFP2,2RP1及2RP2(引物lFP1,lFP2,2RP1及2RP2的核苷酸序列显示于序列表中的SEQIDNO.22,23,24和25)进行PCR,或通过测定插入到由该克隆制备的质粒中的DNA片段的核苷酸序列来确证。用这种方式确证蛋白酶基因在其中存在的质粒命名为质粒pSS3。插入到该质粒中DNA片段的核苷酸序列,及由此推断的氨基酸序列显示于序列表中的SEQIDNO.26。由插入到质粒pSS3中DNA片段的核苷酸序列推断的氨基酸序列显示出与枯草蛋白酶、蛋白酶PFUL、蛋白酶TCES等具有同源性。新近获自激烈热球菌且不同于蛋白酶PFUL的蛋白酶基因产物命名为蛋白酶PFUS。编码该蛋白酶N-末端部分的区域,即,SpeI位点的5′区域,和编码C-末端部分的区域,即,上面SacI位点基因片段的3′区可通过反向PCR方法获得。如果预先揭示出蛋白酶PFUS基因及其染色体附近的限制酶位点,可用适当的限制酶进行反向PCR。通过以各种限制酶切割激烈热球菌的染色体DNA,且用插入到质粒pSS3中的DNA片段作为探针进行southern杂交来揭示限制酶位点。因而,显示出SacI位点位于SpeI位点5′一端约3kb的距离处且Xbal位点位于SacI位点3′一端约5kb的巨离处。用于反向PCR的引物可设计成在包含在质粒pSS3中SpeI-SacI片段的末端周围退火。设计在SacI位点周围退火的引物命名为NPF-1与NPF-2且设计在SpeI位点周围退火的引物命名为NPR-3。其核苷酸序列分别显示于序列表中的SEQIDNO.27、28和29。激烈热球菌染色体DNA分别以SacI或XbaI(两者均由TakaraShuzo公司生产)酶切,这将允许分子内连接,并且该反应混合物可用作反式PCR的模板。当以SacI酶切染色体DNA时,通过反式PCR扩增到一个约3kb的片段,将其插入到质粒载体pT7BlueT(由Novagen生产)以获得一个命名为质粒pS322的重组质粒。另一方面,以XbaI酶切染色体DNA时,扩增到一个约9kb的片段。扩增到的片段以XbaI酶切以获得一个约5kb的片段,将其回收并插入到质粒载体pBluescriptSK(-)以获得重组质粒,命名为质粒pSKX5。通过结合用包含在质粒pSS3中的SpeI-SacI片段作为探针而完成的Southern杂交结果,与用限制性酶对质粒pS322与pSKX5的分析结果,可获得蛋白酶PFUS基因及其在染色体中的附近区域的限制性图谱。该限制性图谱显示于图13。此外,通过以从SpeI位点开始的5′方向分析插入到质粒pS322的5′片段的核苷酸序列,可推断出由该区域编码的酶蛋白的氨基酸序列。得到的核苷酸序列及由此推断的氨基酸序列显示于序列表的SEQIDNO.30。由于该区域的氨基酸序列与如枯草蛋白酶等的蛋白酶的氨基酸序列具有同源性,根据该同源性可推断出蛋白酶PFUS的起始密码子并且,因此,可设计出能在蛋白酶PFUS起始密码子之前导入BamHI位点的引物NPF-4。另一方面,通过用从XbaI位点开始的5′方向来分析插入到质粒pSKX5中蛋白酶PFUS基因3′片段的核苷酸序列而测定的核苷酸序列显示于序列表中的SEQIDNO.31。根据该核苷酸序列,可设计出能将SphI位点插入到XbaI位点附近区域的引物NPR-4。引物NPF-4与NPR-4的核苷酸序列分别显示于序列表中的SEQIDNO.32和33。全长的蛋白酶PFUS基因可用这两对引物且用激烈热球菌的染色体DNA作为模板来加以扩增。与蛋白酶TCES一样,蛋白酶PFUS可在枯草芽孢杆菌系统中表达。用于表达蛋白酶PFUS的质粒可根据用于蛋白酶TCES的表达质粒pSTC3构建。首先,含有可用PCR扩增的全长蛋白酶PFUS基因的DNA片段以BamHI和SacI酶切以回收编码该酶N-末端部分约0.8kb的片段。以质粒pSTC3中也编码蛋白酶TCESN-末端部分的BamHI-SacI片段替代该片段。得到的编码蛋白酶TCES与蛋白酶PFUS基因杂交蛋白的表达质粒命名为质粒pSPT1。图14显示了质粒pSPT1的限制性图谱。然后,上面的PCR-扩增的DNA片段以SpeI和SphI酶切以得到约5.7kb的片段,将其分离并代替以质粒pSPT1中编码蛋白酶TCESC-末端部分的SpeI-SphI片段。这样构建的表达质粒命名为质粒pSNP1,并且以该质粒转化的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pSNP1且保藏于国家生命科学与人类技术(NIBH)研究所,Higashi1-1-3,Tsukuba-shi,Ibaraki-ken,日本于1995年12月1日(最初保藏日期)根据布达佩斯条约保藏号为FERMBP-5634。图15显示质粒pSNP1的限制性图谱。培养枯草芽孢杆菌DB104/pSNP1并且检测培养上清和细胞提取物的蛋白酶活性并且发现两个样品中均有耐热蛋白酶活性发现。编码蛋白酶PFUS基因的核苷酸序列可通过以限制酶将插入到质粒pSNP1中的DNA片段酶切成适当大小的片段,将该片段亚克隆进入适当的克隆载体,并且以该亚克隆片段作为模板进行的双脱氧方法加以测定。序列表的SEQIDNO.34显示了存在于这样获得的核苷酸序列中开放阅读框的核苷酸序列。此外,序列表中的SEQIDNO.35显示了由该核苷酸序列推断的蛋白酶PFUS的氨基酸序列。此外,当也培养以质粒pSPT1转化的枯草芽孢杆菌DB104,即枯草芽孢杆菌DB104/pSPT1时,在培养上清和细胞提取物中均发现有蛋白酶活性。序列表的SEQIDNO.6显示了编码蛋白酶TCES与蛋白酶PFUS杂交蛋白开放阅读框的核苷酸序列。此外,序列表的SEQIDNO.5显示了由该核苷酸序列推断的杂交蛋白的氨基酸序列。本发明的表达蛋白酶的产量可通过使用在枯草芽孢杆菌中高度表达的基因,尤其是分泌型蛋白的基因来提高、作为这样的基因,α-淀粉酶和各种细胞外蛋白酶的基因可被使用。例如,表达的蛋白酶PFUS的产量可通过使用枯草蛋白酶的启动子及信号序列来提高。即,通过连接全长蛋白酶PFUS基因到编码枯草蛋白酶基因信号序列区域的下游以使两个基因的翻译框架相互吻合,在枯草蛋白酶基因启动子的控制下蛋白酶PFUS可表达为融合蛋白。作为枯草蛋白酶的启动子和信号序列,在《细菌学杂志》,171卷,2657-2665页(1988)中所描述的插入到质粒pKWZ中的枯草蛋白酶基因的启动子和信号序列可被使用。该基因的核苷酸序列分别在上面的文献中被描述成其5′上游区含有启动子序列和在《细菌学杂志》,158卷,411-418(1984)被描述成其编码枯草蛋白酶的区域。根据这些序列,分别合成在该基因启动子序列的上游引入EcoRI位点的引物SUB4,和在编码枯草蛋白酶信号序列区域的后面引入BamHI位点的引物BmRI。序列表的SEQIDNO.36与37分别显示引物SUB4与BmR1的核苷酸序列。通过使用引物SUB4与BmR1,可用质粒pKWZ作为模板通过PCR扩增出一个含有编码枯草蛋白酶基因启动子到信号序列的区域的约0.3kb的DNA片段。连接到该DNA片段下游的蛋白酶PFUS基因可用PCR方法取自激烈热球菌的染色体DNA。作为与该基因5′部分杂交的引物,引物NPF-4可被使用。此外,与3′部分杂交的引物可在该基因终止密码子下游的核苷酸序列被测定以后制备。即,测定质粒pSNPD中该部分的核苷酸序列(该核苷酸序列在序列表中的SEQIDNO.38),该质粒通过亚克隆以BamHI酶切质粒pSNP1而制备的约O.6kb的片段进入质粒载体pUC119的BamHI位点而获得。根据该序列,合成与蛋白酶PFUS基因3′部分杂交且能导入SphI位点的引物NPM-1。序列表中的SEQIDNO.39显示了引物NPM-1的序列。另外,当用BamHI位点将蛋白酶PFUS基因连接到上面的0.3kb的DNA片段时,存在于该基因中的唯一一个BamHI位点成为该步骤的障碍。通过PCR-诱变方法去除该BamHI位点的引物mutRR和mutFR可根据列于序列表中的SEQIDNO.34里蛋白酶PFUS基因的核苷酸序列而制备。引物mutRR与mutRF的核苷酸序列分别显示于SEOIDNO.40和41。此外,当用这些引物去除BamHI位点时,存在于序列表中SEQIDNO.35里蛋白酶PFUS的氨基酸序列中560位置的甘氨酸由于导入到该位点的核苷酸替代而被缬氨酸所替代。通过用这些引物,可获得连接到启动子至信号序列-枯草蛋白酶基因编码区的蛋白酶PFUS基因。即,用激烈热球菌的染色体DNA作为模板并且用引物mutRR与NPF-4,和引物mutFR与NPM-I的两种引物对进行2种PCR。此外,通过混合两种PCR扩增的DNA片段而形成的双链体分子作为模板并且用引物NPF-4与NPM-1再将进行PCR。这样,可扩增到不含BamHI位点的全长约2.4kb的蛋白酶PFUS基因。分离以BamHI与SphI酶切上面PCR-扩增的DNA片段而获得约2.4kb的DNA片段,并且代替以含有质粒pSNP1中的蛋白酶PFUS基因的BamHI-SphI片段。这样构建的表达质粒命名为pPS1并且以该质粒转化的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pPS1。当培养转化子时,在培养上清与细胞提取物中均发现有与使用质粒pSNP1时类似的蛋白酶活性,并且证实该氨基酸替代不影响酶活性。图16显示了质粒pPS1的限制性图谱。含有枯草蛋白酶启动子至信号序列的约0.3kb的DNA片段以EcoRI与BamHI酶切,并且替代以含有质粒pPS1中P43启动子与核糖体结合位点的EcoRI-BamHI片段。这样构建的表达质粒命名为pNAPS1且以该质粒转化的枯草芽孢杆菌命名为枯草芽孢杆菌DB104/pNAPS1。培养该转化子,检查培养上清与细胞提取物的蛋白酶活性发现两种样品均有蛋白酶活性。与枯草芽孢杆菌DB104/pSN1相比表达的酶量更高。图17显示质粒pNAPS1的限制性图谱。通过与蛋白酶TCES基因与蛋白酶PFUS基因类似的方法,可从除激烈热球菌与速生热球菌之外的超嗜热菌中获得与这些基因具有同源性的蛋白酶基因。然而,在用上面的寡核苷酸PRO-1F,PRO-2F,PRO2R和PRO-4R作为引物并且用海葡萄嗜热菌DSM3639的染色体DNA与解蛋白栖热拟杆菌DSM5265的染色体DNA作为模板的PCR中,在速生热球菌中出现的DNA片段的扩增在此未被发现。此外,已知通过PCR的基因扩增效率主要受引物3′末端与模板DNA退火效率的影响。即使用PCR的DNA扩增未被观察到,但可通过合成和使用与这次用的寡核苷酸具有不同的核苷酸序列但编码相同氨基酸序列的寡核苷酸来加以检测。可替代地,蛋白酶基因也可通过用染色体DNA和用上面的寡核苷酸或其它超耐热蛋白酶基因的一部分作为探针而进行的southern杂交来加以检测。制备编码由序列表的SEQIDNO.8代表的蛋白酶PFUL的氨基酸序列中第323个残基至第650个残基序列的约1kb的DNA片段,并且它可用作探针以进行用海葡萄嗜热菌DSM3639染色体DNA与解蛋白栖热拟杆菌DSM5265染色体DNA的基因组southern杂交。结果,当使用以PstI(由TakaraShuzo公司生产)酶切的海葡萄嗜热菌染色体DNA时,在约4.8kb的位置观察到一个信号。另一方面,当使用以XbaI酶切的解蛋白栖热拟杆菌染色体DNA时,在约3.5kb的位置观察到一个信号。从这里揭示出与蛋白酶PFUL,蛋白酶PFUS及蛋白酶TCES具有同源性的序列也存在于海葡萄嗜热菌与解蛋白栖热拟杆菌的染色体DNA中。从这样检测到的DNA片段中,可用与分离和鉴定编码蛋白酶TCES或蛋白酶PFUS基因时相同的方法分离和鉴定编码存在于海葡萄嗜热菌或解蛋白栖热拟杆菌中的超耐热蛋白酶的基因。通过在37℃含10μg/ml卡那霉素的LB培养基中培养,导入有蛋白酶TCES基因,即本发明的超耐热蛋白酶基因的转化子(枯草芽孢杆菌DB104/pSTC3)在培养基中表达超耐热蛋白酶。培养完成以后,离心培养物以收集上清从而获得粗酶制剂,并以硫酸铵盐析和透析。这样,获自枯草芽孢杆菌DB104/pSTC3的粗酶制剂命名为TC-3。按照类似的步骤,可从导入有蛋白酶PFUS基因的转化子枯草芽孢杆菌DB101/pSNP1,或以导入有编码蛋白酶TCES和蛋白酶PFUS杂交蛋白酶基因的转化子枯草芽孢杆菌DB104/pSPT1中获得粗酶制剂。从枯草芽孢杆菌DB104/pSNP1与枯草芽孢杆菌DB104/pSPT1获得的粗酶制剂分别命名为NP-1和PT-1,在常规条件下,例如,通过在37℃含10μg/ml卡那霉素的LB培养基中培养,导入有蛋白酶PFUS基因,即本发明的超耐热蛋白酶基因的转化子枯草芽孢杆菌DB104/pNPAPS1在细胞或培养液中表达超耐热蛋白酶。培养完成以后,通过离心分离细胞和培养上清,可用下面的步骤从这两者中任何一个获得蛋白酶PFUS的粗酶制剂。当从细胞中纯化酶时,首先以溶菌酶裂解细胞,将裂解液热处理并离心以回收上清。该上清可用硫酸铵沉淀分级分离(fractionated)并进行疏水层析以获得纯化的酶。从枯草芽孢杆菌DB104/pNAPS1中这样获得的纯化酶制剂命名为NAPS-1。另一方面,透析培养上清并进行阴离子层析。收集洗脱的活性部分,热处理,从硫酸铵沉淀分级分离。并进行疏水层析以获得纯化的蛋白酶PFUS。该纯化的酶制品命名为NAPS-1S。当用这样获得的纯化产物NAPS-1与NAPS-1S进行SDS-聚丙烯酰胺凝胶电泳时,两种酶制制显示相应于约45kDa分子量的单一带。这两种酶制剂实质上是相同的酶制剂,它们在纯化过程中通过热处理去除了前肽序列而转变为成熟形式(活性形式)的酶。通过导入有由本发明获得的超耐热蛋白酶基因的转化子而制备的蛋白酶制剂,如TC-3,NP-1,PT-1,NAPS-1及NAPS-1S具有下面的酶学和理化特性。(1)活性本发明获得的酶水解明胶以制备短链多肽。此外,用这些酶水解酪蛋白以制备短链多肽。此外,用本发明获得的酶水解琥珀酰-L-亮氨酰-L-亮氨酰L-缬氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)以制备荧光材料(7-氨基-4-甲基香豆素)。此外,以本发明获得的酶水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸对-硝基苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)以制备黄色材料(p硝基苯胺)。(2)测定酶活性的方法由本发明获得的酶制剂的酶活性可用合成肽底物来加以测定。由本发明获得的酶制剂TC-3的酶活性可用Suc-Leu-Leu-Val-Tyr-MCA(由肽实验室生产)作为底物来加以测定。即,要被检测酶活性的酶制剂作适当稀释,向20μl该溶液中加入80μl0.1M含62.5μMSuc-Leu-Leu-Val-Tyr-MCA的磷酸钠缓冲液(pH7.0),然后在75℃孵育30分钟。通过加入20μl30%的醋酸终止反应以后,在355nm的激发波长与460nm的荧光波长处测量荧光密度以定量产生的7-氨基-4-甲基香豆素的量,并且将得到的数值与不加酶制剂时孵育所得的数值比较以检测酶的活性。在pH7.0和75℃时由本发明获得的酶制剂TC-3具有Suc-Leu-Leu-Val-Tyr-MCA水解活性。此外,酶制剂NP-1,PT-1,NAPS-1与NAPS-1S的酶活性可用Suc-Ala-Ala-Pro-Phe-p-NA(由Sigma生产)作为底物通过光度测量法加以测定。即,将要被进行酶活性检测的酶制剂适当稀释,向50μl的该溶液中加入含Suc-Ala-Ala-Pro-p-NA的50μl0.1M磷酸钾缓冲液(pH7.0)(Suc-Ala-Ala-Pro-Phe-p-NA溶液),接着在95℃孵育30分钟。在反应以冰冷却终止后,测量405nm处的吸收值以定量产生的p-硝基苯胺的量,并将得到的数值与未加酶制剂的孵育液测量所得的数值比较,从而检查该酶的活性。鉴于此,0.2M的Suc-Ala-Ala-Pro-Phe-p-NA溶液用于酶制剂NP-1和PT-1并且1M的溶液用于酶制剂NAPS-1和NAPS-1S。在pH7.0且95℃测量时,由本发明获得的酶制剂NP-1,PT-1,NAPS-1及NAPS-1S具有Suc-Ala-Ala-Pro-Phe-p-NA水解活性。(3)对各种底物活性的检测本发明获得的酶制剂对人工肽底物的活性用上述(2)中描述的测量酶活性的方法加以确证。即,本发明获得的酶制剂TC-3具有Suc-Leu-Leu-Val-Tyr-MCA水解活性,并且酶制剂NP-1、PT-1、NAPS-1及NAPS-1A分别具有Suc-Ala-Ala-Pro-Phe-p-NA水解活性。此外,通过上述(2)中描述的用于酶制剂TC-3的酶活性测量方法检查酶制剂NP-1、PT-1、NAPS-1及NAPS-1S的Suc-Leu-Leu-Val-Tyr-MCA水解活性,并且显示出这些酶制利具有降解该底物的活性。此外,通过上面(2)描述的用于酶制剂NP-1和PT-1的酶活性测量方法检查酶制剂TC-3的Suc-Ala-Ala-Pro-Phe-p-NA水解活性,并且发现有降解该底物的活性。此外,由本发明获得的酶制剂对明胶的活性可通过酶在SDS-聚丙烯酰胺凝胶上的电泳来确定明胶的降解而被检测。即,要被检测酶活性的酶制剂作适当解释,向10μl的样品中加入2.5μl样品缓冲液(50mMTris-HCl,pH7.5,5%SDS,5%2-巯基乙醇,0.005%溴酚蓝,50%的甘油),接着在100℃处理5分钟并用含0.05%明胶0.1%SDS-10%聚丙烯酰胺凝胶电泳。电泳完成以后,将凝胶浸入50mM磷酸钾缓冲液(pH7.0),并在95℃孵育3小时以完成酶反应。然后,以2.5%的考马斯亮蓝R-250,25%乙醇及10%醋酸染色30分钟,并转移至7%的醋酸中3至15小时以去除过多的染料。通过这样的事实来检测蛋白酶的活性,即明胶由蛋白酶水解成扩散到凝胶外的肽段,因此相应的凝胶部分未被考马斯亮蓝染色。由本发明获得的酶制剂TC-3,NP-1,PT-1,NAPS-1及NAPS-1S在95℃具有明胶水解活性。此外,在上面活性测量方法中发现源自蛋白酶PFUS基因的酶制剂NP-1、NAPS-1及NAPS-1S几乎在凝胶中的相同位置具有明胶水解活性。从这一点,显示出在这些酶制剂中,从前体酶到成熟形式酶的加工以类似的方式发生。另外,除了使用含0.05%酪蛋白的0.1%SDS-10%聚丙烯酰胺凝胶以外,对酪蛋白的水解活性可按照与用于检测对明胶活性相同的方法加以检测。由本发明获得的酶制剂TC-3、NP-1、PT-1、NAPS-1及NAPS-1S在95℃具有水解酪蛋白的活性。同样地,由本发明获得的酶制剂TC-3、NP-1、NAPS-1及NAPS-1S的酪蛋白水解活性可用下面方法测定。100μl适当稀释的酶制剂加入到100μl含0.2%酪蛋白的0.1M的磷酸钾缓冲液中,于95℃孵育1小时,并反应通过加入100μl15%的三氯乙酸终止。通过离心该反应混合物而获得的上清中含有的酸溶性短链多肽的量在280nm处测其吸收值并与不加酶制剂时孵育液测得的吸收值比较,以检查酶活性。由本发明获得的酶制剂TC-3、NP-1、NAPS-1及NAPS-1S在95℃具有酪蛋白水解活性。(4)最适温度除了改变温度外,由本发明获得的酶制剂TC-3的最适温度用上面(2)中所示的酶活性测量方法加以检测。如图18中所示,酶制剂TC-3在37至95℃的温度表现出活性并且其最适温度为70至80℃。即,图18为显示本发明获得的酶制剂TC-3的活性与温度关系的图,并且纵坐标显示对于最大活性(%)的相对活性且横坐标显示温度。此外,由本发明获得的酶制剂NAPS-1的最适温度,除了改变温度之外,用上面(2)显示的酶活性测量方法测定。如图19所示,在pH7.0的测量条件下,酶制剂NAPS-1在40至110℃的温度下具有活性,并且最适温度为80至95℃。即,图19为显示本发明获得的酶制剂NAPS-1的活性与温度之间的关系,并且纵坐标显示对于最大活性(%)的相对活性且横坐标显示温度。(5)最适pH由本发明获得的酶制品TC-3的最适pH通过上面(2)中所示的酶活性测定方法测定。即,用具有各种pHs的缓冲液制备Suc-Leu-Leu-Val-Tyr-MCA溶液,并比较用这些溶液获得的酶活性。作为缓冲液,醋酸钠缓冲液在pH3至6使用,磷酸钠缓冲液在pH6至8,硼酸钠缓冲液在pH8至9,且磷酸钠-氢氧化钠缓冲液在pH10至11使用。如图20所示,酶制剂TC-3在pH5.5~9时表现出活性,并且最适pH为7~8。即,图20为显示本发明获得的酶制剂TC-3的活性与pH关系的图,且纵坐标显示相对活性(%)而横座标显示pH。此外,本发明获得的酶制剂NP-1的最适pH用上面(2)所示的酶活性测量方法测定。即,用具有各种pHs的缓冲液制备Suc-Ala-A1a-Pro-Phe-pNA溶液,并比较用这些溶液获得的酶活性。作为缓冲液,醋酸钠缓冲液在pH4~6使用,磷酸钾在pH6~8,硼酸钠缓冲液在pH5~10,并且磷酸钠-氢氧化钠缓冲液在pH10.5。如图21所示,酶制剂NP-1在pH5~10显示活性,并且最适pH为pH5.5~8。即,图21为显示本发明获得的酶制剂NP-1活性与pH之间关系的图,并且纵座标代表相对活性(%)且横坐标代表pH。此外,本发明获得的酶制剂NAPS-1的最适pH用上面(2)中所示的酶活性测量方法测定。即,用具有各种pHs的缓冲液制备Suc-Ala-Ala-Pro-Phe-pNA溶液,并且比较用这些溶液获得的酶活性。作为缓冲液,醋酸钠缓冲液在pH4~6使用,磷酸钾在pH6~8,硼酸钠缓冲液在pH8.5~10。如图22所示,酶制剂NAPS-1在pH5~10显示出活性,并且最适pH为pH6~8。即,图22为显示本发明获得的酶制剂NAPS-1活性与pH关系的图,且纵坐标代表相对活性(%)而横坐标代表pH。(6)耐热性检测本发明获得的酶制剂TC-3的耐热性。即,该酶制剂在20mMTris-HCl中,各段时间pH均为7.5-80℃孵育,取其适当量的样品通过上面(2)中所示的方法测其酶活性,并将该活性与没有热处理的酶活性作比较。如图23所示,本发明获得的酶制剂TC-3甚至在热处理3小时之后具有不少于90%的活性且,因而,在上面热处理中是稳定的。即,图23是显示本发明获得的酶制剂TC-3的耐热性的图,并且纵坐标表示热处理以后的残余活性(%)而横坐标表示时间。此外,测定本发明获得的酶制剂NP-1的耐热性。即,该酶制剂在20mMTris-HCl中95℃孵育,各时间段pH为7.5,取其适量等分样品按上面(2)所示的方法测定其酶活性,并比较该酶活性与没有热处理的酶活性。如图24所示,当95℃孵育时观察到本发明获得的酶制剂NP-1具有异常升高的酶活性。这被认为是由于作为前体而产生的蛋白酶在热处理过程中产生自我催化激活。此外,在长达3小时的热处理之后没有发现酶活性的降低。即,图24为显示本发明获得的酶制剂NP-1的耐热性的图,并且纵坐标代表热处理后残余的活性(%)且横坐标代表时间。此外,测定上面经热处理而激活的酶制利NP-1的耐热性。即,该酶制剂NP-1通过95℃30分钟的热处理而激活,再以95℃孵育不同时间,并按上述测定酶活性以与没经热处理的酶活性相比较。同时,使用具有各种pHs(醋酸钠缓冲液在pH5,磷酸钾缓冲液在pH7,硼酸钠缓冲液在pH9,磷酸钠-氢氧化钠缓冲液在pH11,每种情况20mM)的缓冲液。如图25所示,当本发明获得的激活的酶制剂NP-1在pH为9的缓冲液中处理时,在经8小时的热处理之后其活性不少于90%并且甚至经24小时的热处理之后约有50%的酶活性,因此,对上面的热处理很稳定。即,图25为显示本发明获得的酶制剂NP-1耐热性的图,并且纵坐标表示经热处理之后残余的活性(%)且横坐标表示时间。此外,测定本发明获得的酶制剂NAPS-1的耐热性。即,该酶制剂在20mMTris-HCl中95℃处理,各时间段pH为7.5,取其适当等分样品按上面(2)所示的方法测定其酶活性以与未经热处理的酶活性相比较,如图26所示,本发明获得的酶制剂NAPS-1甚至在95℃热处理3小时以后仍具有不少于80%的活性并且,因此,对上面的热处理稳定。即,图26是显示本发明获得的酶制剂NAPS的耐热性的图,且纵坐标表示经热处理之后残余的活性(%)而横坐标表示时间。(7)pH稳定性本发明获得的酶制剂NP-1的pH稳定性按下面的步骤加以测定。含有通过95℃30分钟热处理而激活的酶制剂NP-1的50μl20mM的各种pHs的缓冲液以95℃处理60分钟,并取其适当样品按上面(2)所示的方法测定其酶活性以与未经处理时的酶活性相比较。作为缓冲液,醋酸钠缓冲液可在pH4~6时使用,磷酸钾缓冲液在pH6~8,硼酸钠缓冲液在pH9~10,磷酸钠-氢氧化钠缓冲液在pH11。如图27所示,本发明获得的酶制剂NP-1甚至在5~11之间的pH经95℃60分钟处理以后仍保留有不少于95%的活性。即,图27是显示本发明获得的酶pH稳定性的图,并且纵坐标表示残余的活性(%)且横坐标表示pH。(8)对去污剂的稳定性本发明获得的酶制剂NP-1对去污剂的稳定剂用SDS作为去污剂加以检测。该酶制剂经95℃热处理30分钟而激活。制备50μl仅含该酶制剂的溶液及进一步含有终浓度0.1%或1%SDS的溶液。这些溶液在95℃孵育不同时间,取其适当量的样品通过上面(2)中描述的方法测定该酶的活性以与未经处理的酶活性比较。如图28所示,由本发明获得的激活的酶制剂NP-1经95℃热处理8小时以后仍具有不少于80%的活性且甚至不管SDS存在与否经24小时处理以后仍具有约50%的活性并且,因此,甚至在SDS存在下仍具有高的稳定性。即,图28是显示本发明获得的酶制剂NP-1对SDS的稳定性,并且纵坐标表示残余的活性(%)且横坐标表示时间此外,本发明获得的酶制剂NAPS-1对去污剂的稳定性用SDS作为去污剂来测定。制备50μl仅含酶制剂NAPS-1的溶液及进一步含有终浓度为0.1%或1%SDS的溶液。这些溶液在95℃孵育不同时间,取适当量的样品按上面(2)中所述的方法测定其酶活性以与未经处理的酶活性相比较。如图29所示,本发明获得的酶制剂NAPS-1,不管SDS存在与否,经95℃热处理3小时以后仍具有约80%的活性。即,图29为显示本发明获得的激活的酶制剂NAPS-1对SDS稳定性的图,并且纵坐标表示残余的活性(%)而横坐标表示时间。当比较上面的结果时,显示出与酶制剂NP-1相比,酶制剂NAPS-1具有异常降低的残余活性。然而,该现象不可认为是基于包含在两种制品中酶蛋白本身对SDS稳定性的差异。认为上面的现象是由下面的原因所致,即纯化的酶制品NAPS-1与NP-1相比具有较少的杂质蛋白,因此,由于自我酶切而失活更易发生。(9)对有机溶剂的稳定性本发明获得的酶制剂NAPS-1对有机溶剂的稳定性用乙腈来检测。含乙腈至终浓度25%或50%的每50μl酶制剂NAPS-1溶液在95℃孵育不同时间,取其适当量的样品按上面(2)中所述的方法测定其活性从而与未处理的酶活性比较。如图30所示,本发明获得的酶制剂NAPS-1甚至在50%乙腈存在下经95℃处理1小时以后,其活性不少于处理前活性的80%。即,图30是显示本发明获得的酶制剂NAPS-1对乙腈稳定性的图。(10)对变性剂的稳定性本发明获得的酶制剂NAPS-1对各种变性剂的稳定性用尿素和盐酸胍来测定。制备含终浓度为3.2M或6.4M尿素或终浓度为1M、3.2M或6.4M盐酸胍的每50μl的酶制剂NAPS-1溶液。这些溶液在95℃孵育不同时间,取其适当量的样品用上面(2)中所述的方法测定其活性从而与未经处理时的活性相比较。如图31所示,本发明获得的酶制剂NAPS-1甚至在6.4M尿素存在下经95℃处理1小时之后仍具有不少于处理前的70%的活性。即,图31是显示对尿素稳定性的图且图32是显示对盐酸胍稳定性的图,并且纵坐标表示残余的活性且横坐标表示时间。(11)各种试剂的影响各种试剂对本发明获得的酶制剂TCFS及NAPS-1的影响被测定。即,上面的酶制剂在各种试剂以0.1mM终浓度存在下37℃处理30分钟,取其一部分按上面(2)所述的方法测定其酶活性以与没加试剂时的活性相比较。结果显示于表1。表1</tables>如表1所示,当以PMSF(苯甲磺酰氟)及抑糜蛋白酶素处理时,两个酶制品均具有异常降低的活性。此外,当以antipam处理时,在TCES中观察到酶活性的降低,且当以EDTA处理时,在NAPS-1中观察到活性降低。用其它试剂时,没有观察到活性的较大下降。(12)分子量本发明获得的酶制剂NAPS-1的分子量用0.1%SDS-10%聚丙烯酰胺凝胶的SDS-PAGE测定。在SDS-PAGE上,酶制剂NAPS1表现出约45kDa的分子量。另外,酶制剂NAPS-1S与酶制剂NAPS-1表现出相同的分子量。(3)N-末端氨基酸序列成熟蛋白酶PFUS的N-末端氨基酸序列用本发明获得的酶制剂NAPS-1来测定。电泳于0.1%SDS-10%聚丙烯酰胺凝胶上的酶制剂NAPS-1转移至PVDF膜上,并且膜上该酶的N-末端氨基酸序列用蛋白测序仪通过自动Edman降解来测定。这样测得的成熟型蛋白酶PFUS的N-末端氨基酸序列显示于序列表的SEQIDNO.42。该序列与序列表中的SEQIDNO.35所代表的蛋白酶PFUS氨基酸序列中氨基酸133~144的序列相一致,并且显示出成熟的蛋白酶PFUS是由包括在这部分的多肽所组成的酶。这样揭示的成熟蛋白酶PFUS的氨基酸序列列于序列表中的SEQIDNO.3。此外,如上述,第428个氨基酸(相应于序列表中SEQIDNO.35所代表的氨基酸序列中的第560个氨基酸)无论是甘氨酸还是缬氨酸都对蛋白酶PFUS的酶活性没有影响。此外,在序列表中的SEQIDNO.34所代表的蛋白酶PFUS基因的核苷酸序列中,编码成熟型酶的核苷酸序列显示于SEQIDNO.4。该序列中第1283个碱基可以是鸟嘌呤或胸腺嘧啶(thimine)。在用PCR的体外基因扩增时,核苷酸的错误掺入可能在延伸反应过程中发生,导致得到DNA的序列中核苷酸的替代。这个频率主要依赖于用于PCR的酶的种类、反应混合物的组成,反应条件,待扩增DNA的核苷酸序列等。然而,当基因中某一区域仅按正常扩增时,该频率至多约每400个核苷酸中出现一个这样的核苷酸。在本发明中,PCR用于蛋白酶TCES或蛋白酶PFUS基因的分离或其表达质粒的构建。得到基因中的核苷酸序列里核苷酸替代的数目如果有的话,也是少许几个。考虑到由于翻译密码子的兼并,基因中核苷酸的替代不一定导致表达蛋白氨基酸的替代的事实,可能的氨基酸替代的数目可估计为至多整个残基中2~3个。不可否认蛋白酶TCES及蛋白酶PFUS基因的核苷酸序列及这里公开的蛋白酶的氨基酸序列与天然状态会有所不同。然而,本发明的目的是公开在高温中具有高活性的超耐热蛋白酶及编码相同酶的基因并且,因此,蛋白酶和基因不限于与天然状态相同的酶及编码相同酶的相同基因。对本领域技术人员来说很明显甚至具有可能核苷酸替代的基因能在严格的条件下与天然基因杂交。此外,在本说明书中,用于获得感兴趣基因的方法已清楚地公开以致于(1)从超嗜热菌的染色体DNA中制备表达克隆的文库并且筛选出蛋白酶活性表达的克隆,(2)根据氨基酸序列的同源性用杂交或PCR分离可能表达超耐热蛋白酶的基因,并且用适当的微生物确证这些基因表达产物的酶的作用,即,超耐热蛋白酶的活性。因此,在用已知导入突变的方法将各种突变导入到本发明的超耐热蛋白酶基因中之后,容易通过上面的方法测定是否带有导入突变的基因序列编码超耐热蛋白酶。只要由于突变导入而获得的基因序列实质上表达与本发明超耐热蛋白酶活性相同的蛋白酶活性,待导入突变的种类不限于定义的哪几种。然而,为了使表达的蛋白保留蛋白酶活性,突变需要导入到除在丝氨酸蛋白酶中共同保守的四个区域以外的区域。突变可随机导入编码超耐热蛋白酶基因的任何区域(随机诱变),或同样地,所需突变可导入到定义的预先规定的位置(定点诱变)。作为随机导入突变的方法,例如,有一种化学处理DNA的方法。在该方法中,制备质粒以使待导入突变的区域为部分单链,并用亚硫酸氢钠作用于该部分单链的区域以将胞嘧啶域基转变为尿嘧啶并且,因此,导入一个从CG到TA的突变。此外,在[α-S]dNTP存在下单链部分修复成双链过程中用于产生碱基替代的方法也为已知。这些方法的细节在《美国国家科学院院报》,79各,1408~1412页(1982),及《基因》,64卷,313~319页(1988)中描述。随机突变也可通过在核苷酸掺入忠实性降低的条件下由PCR导入。尤其,向反应系统中加入锰是有效的方法且该方法的细节在《生化年刊》,224卷,347-355页(1995)中被描述。作为导入定点突变的方法,例如,有一种用将感兴趣基因制成单链的系统的方法,合成根据在该单链部分待导入的突变而设计的引物,并且该引物与该部分退火,将其导入仅导入有突变的链才被选择性复制的活体系统。该方法的细节在《酶学方法》,154卷,367页(1987)中被描述。例如,导入突变的试剂盒,可用TakaraShuzo公司生产的突变体(mutant)K。定点诱变也可用PCR来完成且其细节在《PCR技术方法》,61~70页(1989)中被描述,Ehlich编且由TakaraShuzo公司出版。可替代地,如,可用TakaraShuzo公司生产的用于体外诱变的试剂盒中的LAPCR。通过使用上面的方法,可导入替代、缺失及插入的突变。这样,通过导入用本发明超耐热蛋白酶基因作为基础的突变可在宿主中制备与本发明超耐热蛋白酶具有类似的耐热性及最适温度但具有略微不同的,如,最适pH的酶。在这种情况,超耐热蛋白酶基因的碱基核苷酸序列不一定限于源自一个超耐热蛋白酶的序列。通过交换同源序列,可通过重组两个或更多个相互具有同源序列的超耐热蛋白酶基因,如由本发明公开的这些基因,而制备杂合基因,并可在宿主中制备该基因编码的杂合酶,可通过测试基因产物的酶功能即,蛋白酶活性,而决定其是否为超耐热蛋白酶基因。例如,通过用上面的质粒pSPT1,可在枯草芽孢杆菌中制备其N-末端部分源自蛋白酶PFUS且C-末端部分源自蛋白酶TCES的杂合蛋白酶,并且该杂合蛋白酶在95℃具有蛋白酶活性。预期该杂合酶同时具有2个或更多个基础酶的特性。例如,当比较这里公布的蛋白酶TCES与蛋白酶PFUS时,蛋白酶TCES在细胞外分泌效率方面更优越且蛋白酶PFUS在耐热性方面更优越。由于位于蛋白N-末端的信号序列对细胞外分必效率具有巨大影响,如果构建一个表达质粒以便,与pSPT1相对照,具有源自蛋白酶TCESN-末端部分和源自蛋白酶PFUS的C-末端部分的蛋白得以制备,与蛋白酶PFUS具有相同耐热性的超耐热蛋白酶可以与蛋白酶TCES相同的分泌效率分泌。此外,当酶进行细胞外分泌后信号序列要从酶中切除,但其对酶本身性质几乎没有影响。因此,当用适温菌制备超耐热蛋白酶时,其信号序列不必要源自超嗜热菌且只要感兴趣部分以更高效率细胞外分泌时,源自适温菌的信号序列也没有问题尤其,当使用在宿主中高效表达的分泌蛋白的信号序列时,可期望更高效的分泌。对于上面杂合基因的构建,重组不必要是定向完成。同样地,例如,通过混合两种或更多种超耐热蛋白酶基因的DNAs,(它们是杂合基因构建的原材料),从DNA降解酶断裂这些DNA并用DNA聚合酶重建这些片段来制备杂合基因。该方法的细节在《美国国家科学院院报》,91卷,10747-10751页(1994)中被描述。在这里,也可分离编码超耐热蛋白酶的基因序列并按上述通过检测表达蛋白的超耐热蛋白酶活性以从得到的杂合基因中鉴定出编码超耐热蛋白酶基因的序列。此外,预期编码丝氨酸蛋白酶共有的4个区域的序列在这样获得的基因中也得以保存。因此,对于本领域的技术人员很明显,用适当的杂交条件,得到的杂合基因可与选自由具有序列表中的SEQIDNO.9、10、11和12所代表的核苷酸序列的寡核苷酸PRO-1F、PRO-2F、PRO-2R和PRO-4R的DNA杂交。此外,也很明显通过上面的突变导入而获得的新的超耐热蛋白酶基因用适当的杂交条件可与具有选自由序列表中的SEQIDNO.9、10、11和12所代表的核苷酸序列的DNA序列的基因杂交。在该说明书中,我们集中描述了超耐热基因的获得。然而,编码既具有高度耐热性又具有其它性质的新的蛋白酶的基因可这样制备,即通过构建本发明超耐热蛋白酶基因和与本发明超耐热蛋白酶基因具有同源序列但没有耐热性的蛋白酶基因的杂合基因,例如,通过构建具有枯草蛋白酶基因的杂合基因以提高枯草蛋白酶的耐热性从而获得编码具有原先为枯草蛋白酶拥有的特性及更高耐热性的蛋白酶的基因。在本发明中,为了检测基因编码的蛋白酶活性并制备酶制剂,我们用大肠杆菌和枯草芽孢杆菌作为待导入基因的宿主。然而,待导入基因的宿主不限于说明的种类。只要对该宿主的转化方法已建立,任何宿主可被使用,如短芽孢杆菌、乳杆菌属、酵母、霉菌、动物细胞、植物细胞、昆虫细胞等。时于这些,多肽的折叠以使表达的蛋白变为活性形式且这不会导致对宿主有害或致命作用是重要的。在上面列出的宿主中,除枯草芽孢杆菌之外,已知分泌其产物于培养基中的短芽孢杆菌,乳杆菌及霉菌可用作工业规模的感兴趣蛋白酶的批量生产。实施例下面的实施例更进一步详细描述本发明但又不限制其范围。实施例1(1)用于超耐热蛋白酶基因检测的寡核苷酸的制备通过比较序列表中SEQIDNO.8所代表的蛋白酶PFUL的氨基酸序列与源自已知细菌的碱性丝氨酸蛋白酶的氨基酸序列,证明它们中共同存在同源氨基酸序列。其中,选择三个区域并设计用于PCR引物的寡核苷酸以检测超耐热蛋白酶基因。图2、3和4显示了相应于蛋白酶PFUL上面三个区域氨基酸序列,编码该区域蛋白酶PFUL基因的核苷酸序列,及据其合成的寡核苷酸PRO-1F、PRO-2F、PRO-2R及PRO-4R的核苷酸序列之间的关系。SEQIDNO.9、10、11和12分别显示了寡核苷酸PRO-1F、PRO-2F、PRO-2R及PRO-4R的核苷酸序列。(2)速生热球菌染色体DNA的制备离心10ml获自德意志微生物保藏中心速生热球菌DSM2476培养物以收集细胞并悬浮于pH8.0含25%蔗糖的100μl50mMTris-HCl中。向该悬液中加入20μl0.5MEDTA和10μl10mg/ml溶菌酶,并于20℃孵育1小时,再向其中加入800μlSET溶液(150mMNaCl,1mMEDTA,20mMTris-HCl,pH8.0),50μl10%SDS及10μl20mg/ml的蛋白酶K,并在37℃孵育1小时。通过酚-氯仿抽提终止反应并以乙醇沉淀以回收DNA,将其溶于50μlTE缓冲液(10mMTris-HCl,pH8.0,0.1mMEDTA)以获得染色体DNA溶液。(3)通过PCR对超耐热蛋白酶基因的检测从上面速生热球菌染色体DNA和寡核苷酸PRO-1F与PRO2R,或PRO-2F与PRO-4R制备PCR反应混合物并进行35轮循环的反应,每轮循环由94℃1分钟-55℃1分钟-72℃1分钟所组成。当取这些反应混合物的一部分进行琼脂糖凝胶电泳时,观察到用寡核苷酸PRO-1F及PRO-2R时扩增出三个DNA片段,并且用寡核苷酸PRO-2F及PRO-4R时仅扩增出一个DNA片段。从凝胶中回收这些扩增片段,且其DNA末端用DNA补平试剂盒(由TakaraShuzo公司生产)补平并用T4多核苷酸激酶(由TakaraShuzo公司生产)磷酸化。然后,以HincII(由TakaraShuzo公司生产)酶切质粒载体pUC19(由TakaraShuzo公司生产),得到的片段末端以碱性磷酸酶(由TakaraShuzo公司生产)脱磷酸化,与上面的PCR扩增DNA片段混合以让其连接,接着导入大肠杆菌JM109从得到的转化子中提取质粒,并且选择插入有适当大小DNA片段的质粒,通过双脱氧方法对该插入片段测序。这些质粒中,从含有用寡核苷酸PRO-1F及PRO-2R扩增的约150bpDNA片段的质粒p1F-2R(2)中核苷酸序列推断的氨基酸序列,及从含有用寡核苷酸PRO-2F及PRO-4R扩增的约550bpDNA片段的质粒p2F-4R中核苷酸序列推断的氨基酸序列含有与蛋白酶PFUL,枯草蛋白酶等氨基酸序列具有同源性的序列。序列表中的SEQIDNO.13显示了质粒p1F-2R(2)中插入DNA片段的核苷酸序列以及由其推断的氨基酸序列并且序列表中的SEQIDNO.14显示了质粒p2F-4R中插入DNA片段的核苷酸序列及由其推断的氨基酸序列。在序列表的SEQIDNO.13所代表的核苷酸序列中,从第1~21个核苷酸的序列和第113~145个核苷酸的序列以及,在由序列表中的SEQIDNO.14所代表的核苷酸序列中,第1~32个核苷酸的序列和第532~564个核苷酸的序列为用作PCR引物的寡核苷酸(分别相应于寡核苷酸PRO-1F、PRO-2R、PRO-2F和PRO-4R)的序列。图5显示了质粒p2F-4R的限制性图谱。(4)筛选源自速生热球菌蛋白酶基四速生热球菌的染色体DNA以限制酶Sau3Al(由TakaraShuzo公司生产)部分酶切,接着在dATP及dGTP存在下用Klenow片段(由TakaraShuzo公司生产)对DNA末端做部分修复。将该DNA片段与λGEM11XhoIHalf-SiteArm载体(Vector)(由Promega生产)混和以让其连接,然后用GigapackGold(Stratagene生产)将其体外包装以制备含速生热球菌染色体DNA片段的λ噬菌体文库。部分该文库转化大肠杆菌LE392(由Promega生产)以在平板上形成噬菌斑,并将噬菌斑转移至Hybond-N+膜(由Amersham生产)上。转移完以后,该膜以含1.5MNaCl的0.5N的NaOH处理,然后以pH7.5,含3M的NaCl的0.5MTris-HCl处理,以6×SSC洗膜,空气干燥,并以紫外透射仪(UVtransilluminator)的紫外线照射以将噬菌体DNA固定至膜上。另一方面,质粒p2F-4R以PmaCI及StuI(两者均由TakaraShuzo公司生产)酶切,然后进行1%琼脂糖凝胶电泳以回收分离的约0.5kb的DNA片段。通过用此片段作为模板并用随机引物DNA标记试剂盒Ver.2(由TakaraShuzo公司生产)及[α-32P]dCTP(由Amersham生产),制备31P-标记的DNA探针。带有固定DNA的膜以杂交缓冲液(分0.5%SDS,0.1%BSA,0.1%聚乙烯吡咯烷酮,0.1%Ficoll400,0.01%变性鲑精DNA)在50℃处理2小时,并转移至含32P-标记的DNA探针的相同缓冲液中,接着在50℃杂交15小时。杂交完成以后,以含0.5%SDS的2×SSC在室温下洗膜,然后以含0.5%SDS的1×SSC在50℃洗膜。进一步以1×SSC洗膜,空气干燥并用X-线光片在-80℃曝光6小时以获得放射自显影。筛选出约3,000个噬菌体克隆并且,结果,得到一个含蛋白酶基因的克隆。根据放射自显影的信号,找出该噬菌体的位置并且分离相应于用于转膜平板上的噬菌体至1ml含1%氯仿的SM缓冲液(50mMTris-HCl,pH7.5,1MNaCl,8mMMgSO4,0.01%明胶)。(5)含源自速生热球菌蛋白酶基因噬菌体DNA片段的检测以上面的噬菌体克隆转导的大肠杆菌LE392于NZCMY培养基(由Biolol生产)中37℃培养15小时以获得培养物,收集其中的上清以用QIAGEN-λ试剂盒(由QlAGEN生产)制备噬菌体DNA。得到的噬菌体DNAs分别以BamHI、EcoRI、EcoRV、HincII、KpnI、NcoI、PstI、SalI、SmaI及SphI(全部由TakaraShuzo公司生产)酶切,接着以琼脂糖凝胶电泳。然后,按照《分子克隆;实验指南》,(第2版(1986),T.Maniatis等编,冷泉港实验室出版)中所述的southern转印方法将DNA从凝胶转印至Hybond-N+膜上。得到的膜在杂交缓冲液50℃处理4小时,并转移至用于实施例1-(4)的含32P-标记的DNA探针的相同缓冲液中,然后在50℃杂交18小时。杂交完成以后,以含0.5%SDS的1×SSC50℃洗膜,然后以1×SSC冲洗并空气干燥。该膜以X光片在-80℃曝光6小时以获得放射自显影。放射自显影表明在以KpnI酶切的噬菌体DNA中一个约9kb的DNA片段含有蛋白酶基因。然后,含有上面蛋白酶基因的噬菌体DNA以KpnI消化,并继尔进一步以BamHI、PstI及SphI酶切,接着用1%的琼脂糖凝胶电泳。按照上面所述的类似步骤,进行southern杂交并且表明一个约5kb的KpnI-BamHI片段含有蛋白酶基因(6)含有源自速生热球菌蛋白酶基因DNA片段的克隆含有上面蛋白酶基因的噬菌体DNA以KpnI和BamHI酶切,然后进行1%的琼脂糖凝胶电泳从而从凝胶中分离出约5kb的DNA片段。然后,然后以KpnI和BamHI酶切质粒载体pUC119(由TakaraShuzo公司生产),并与上面约5kb的DNA片段混合以让其连接,接着导入大肠杆菌JM109。从得到转化子中提取质粒,挑选含约5kb的DNA片段的质粒并命名为质粒pTC3图6显示了质粒pTC3的限制性图谱。(7)含源自速生热球菌蛋白酶基因的质粒pTCS6的制备以SacI酶切上面的质粒PTC3,然后1%琼脂糖凝胶电泳,并按照与上面实施例1-(5)所述的用于检测含蛋白酶基因的噬菌体DNA片段相同的方式进行southern杂交。得到的放射自显影信号表明通过以SacI酶切质粒pCT3而获得的一个约1.9kb的DNA片段含有超耐热蛋白酶基因。然后,以SacI酶切质粒pTC3,然后以1%琼脂糖凝胶电泳以分离出约1.9kb的DNA片段。然后,以SacI酶切质粒载体pUC118(由TakaraShuzo公司生产),以碱性磷酸酶去磷酸化并与约1.9kb的片段混合以让其连接,接着导入大肠杆菌JM109。从得到的转化子中提取质粒,并挑选出仅含一个分子的约1.9kb的片段的质粒且命名为质粒pTCS6。图7显示质粒pTCS6的限制性图谱。(8)源自速生热球菌包含在质粒pTCS6中DNA片段核苷酸序列的测定为了测定源自速生热球菌插入在质粒pTCS6中的蛋白酶基因的核苷酸序列,用Kilo序列缺失试剂盒(由TakaraShuzo公司生产)制备其中插入到质粒中的DNA片段部分以各种长度删除的缺失突变体。其中,挑选出具有适当缺失长度的几种突变体并用双脱氧方法测定每个插入DNA片段部分的核苷酸序列,并结合这些结果以决定包含在质粒pTCS6中插入DNA片段的核苷酸序列。序列表中的SEQIDNO.15显示得到的核苷酸序列(9)用盒及试剂盒引物的PCR对源自速生热球菌蛋白酶基因的5′上游区的克隆用LAPCR体外克隆试剂盒(由IakaraShuzo公司生产)获得源自速生热球菌的蛋白酶基因5′上游区。根据序列表中的SEQIDNO.15代表的包含在质粒pTCS6中插入DNA片段的核苷酸序列,合成用于试剂盒PCR的引物TCE6R。然后,以HindIII(由TakaraShuzo公司生产)完全酶切速生热球菌的染色体DNA,并通过连接反应将该片段与HindIII盒(cassette)(由TakaraShuzo公司生产)连接。通过用此作为模板,制备含引物TCE6R及盒引物Cl(由TakaraShuzo公司生产)的PCR反应混合物,进行一系列反应94℃1分钟的1个循环,94℃30秒-55℃1分钟-72℃3分钟的30个循环,以及72℃10分钟的一个循环。该反应混合物的一部分进行琼脂糖凝胶电泳并观察到扩增出的约1.8kb的片段。该扩增片段以HindIII和SacI酶切,并在琼脂糖凝胶电泳以后从凝胶中回收产生的约1.5kb的DNA片段。HindIII-SacI酶切的质粒载体pUC119与上面约1.5kb的DNA片段混合以让其连接,接着导入大肠杆菌JM109。检查得到转化子中带有的质粒,挑选出仅含一分子1.5kb插入片段的质粒并命名为质粒pTC4。图8显示质粒pTC4的限制性图谱。(10)包含在质粒pTC-4中及蛋白酶TCEs基因中源自速生热球菌DNA片段核苷酸序列的测定为了测定插入到质粒pTC-4中源自速生热球菌蛋白酶基因的核苷酸序列,用Kilo序列缺失试制盒制备其中的插入到质粒中的DNA片段以各种长度删除的缺失突变体。其中,挑选出几种具有适当缺失长度的突变体并用双脱氧方法测定每个插入DNA片段的核苷酸序列,并且结合这些结果以决定包含在质粒pTCS6中插入DNA片段的核苷酸序列。序列表中的SEQIDNO.15显示得到的核苷酸序列。通过结合该序列与实施例1-(8)中获得的包含在质粒pTCS6中插入DNA片段的核苷酸序列,决定源自速生热球菌蛋白酶基因的全部核苷酸序列。序列表中的SEQIDNO.1和2分别显示源自速生热球菌蛋白酶核苷酸序列中开放阅读框的核苷酸序列及由此推断的氨基酸序列。由该基因编码的源自速生热球菌的蛋白酶命名为蛋白酶TCES。(11)含蛋白酶TCES基因的质粒pBTC6的制备以HindIII和SspI(由TakaraShuzo公司生产)酶切质粒pTCS6,然后进行1%琼脂糖凝胶电泳以回收分离的约1.8kb的DNA片段。然后,质粒载体pBT322(由Takara公司生产)以HindIII及EcoRV酶切,并将其与约1.8kb的DNA片段混和以让其连接,接着导入大肠杆菌JM109。从得到的转化子中提取质粒,挑选仅含一分子的约1.8kb片段的质粒并命名为pBTC5。然后,以HindIII和Kpnl完全酶切质粒pBTC5,补平末端并进行分子内连接,接着导入大肠杆菌JM109。从得到的转化子中提取质粒,挑选出去除上面两个限制酶位点的质粒并命名为质粒pBTC5HK。此外,以BamHI酶切质粒pBTC5HK,将末端补平,并进行分子内连接,接着导入大肠杆菌JM109。从得到的转化子中提取质粒,挑选出去除BamHI位点的质粒并命名为质粒pBTC5HKB。合成能在蛋白酶TCES基因起始密码子之前导入EcoRI位点和BamHI位点的引物TCE12,及与质粒pTCS6SacI位点3′部分互补具有16bp-长核苷酸序列且能导入Clal位点及终止密码子的引物TCE20R。序列表中的SEQIDNO.18及19分别显示引物TCE12及引物TCE20R的核苷酸序列。用这两个引物并用速生热球菌染色体DNA作为模板制备PCR反应混合物。进行25个循环反应,每个循环包括94℃30秒-55℃1分钟-72℃1分钟以扩增出在两端具有这两个寡核苷酸并含有部分蛋白酶TCES基因的约0.9kb的DNA片段。以EcoRI及ClaI(由TakaraShuzo公司生产)酶切上面的约0.9kb的DNA片段,并与EcoRI-ClaI酶切的质粒pBTC5HKB混合以让其连接,接着导入大肠杆菌JM109。从得到的转化子中提取质粒,并挑选出仅含一分子约0.9kb的片段的质粒并命名为质粒pBTC6。(12)含有蛋白酶TCES基因的质粒pTC12的制备以BamHI和SphI酶切质粒pBTC6,并进行1%琼脂糖凝胶电泳以回收分离的约3kb的DNA片段。然后,从BamHI和SphI酶切质粒pUC-P43SD,该质粒是在质粒载体pUC18(由TakaraChuzo公司生产)的KpnI位点与BamHI位点之间导入源自枯草芽孢杆菌P43启动子核糖体结合位点序列而制备(用于序列导入的合成寡核苷酸BS1及BS2的核苷酸序列显示于序列表中的SEQIDNO.20和21),将该酶切产物与前面回收的约3kbDNA片段混合以让其连接,接着导入大肠杆菌JM109。从得到的转化子中提取质粒,挑选出仅含1分子上面约3kb的DNA片段的质粒并命名为质粒pTC12。(13)用于转化枯草芽孢杆菌含有蛋白酶TCES基因的质粒的制备以KpnI和SphI酶切上面的质粒pTC12,然后进行1%琼脂糖凝胶电泳以回收分离的约3kb的DNA片段。然后,以SacI酶切质粒载体pUB18-P43,补平末端并让其自我连接以得到SacI位点被去除的质粒载体pUB18-P43S。以KpnI和SphI消化该载体,并与前面回收的约3kb的DNA片段混合并让其连接,接着导入枯草芽孢杆菌DB104。从得到的卡那霉素抗性转化子中提取质粒,挑选出仅含1分子约3kbDNA片段的质粒并命名为质粒pSTC2然后,以SacI酶切质粒pSTC2并进行分子内连接,接着导入枯草芽孢杆菌DB104。从得到的卡那霉素抗性转化子中提取质粒,挑选出仅含1个SacI位点的质粒并命名为质粒pSTC3那么,具有质粒pSTC3的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pSTC3。图10显示质粒pSTC3的限制性图谱实施例2(1)激烈热球菌染色体DNA的制备按下述培养激烈热球菌DMS3638。具有如下成分的培养基置于2升的培养瓶,其成分为1%的胰蛋白胨,0.5%酵母提取物,1%可溶性淀粉,3.5%JamarinS.Solid(由Jamerin实验室制备),0.5%JamerinS.Liqmd(由Jamarin实验室制备),0.003%MgSO4,0.001%NaCl,0.0001%FeSO4·7H2O,0.0001%CoSO4,0.0001%CaCl2·7H2O,0.0001%ZnSO4,0.1ppmCuSO4·5H2O,0.1ppmH3BO3,0.1ppmKAl(SO4)2,0.1ppmNa2MoO4·2H2O,0.25ppmNiCl2·H2O,并于120℃灭菌20分钟,向培养基中充入氮气以排除溶解的氧气,并将上面的菌株接种入培养基,接着95℃静置培养16小时。培养完成以后,沉淀收集细胞。然后,得到的细胞悬浮于含25%蔗糖的4ml50mMTris-HCl(pH8.0),向该悬液中加入2ml0.2M的EDTA和0.8ml的溶菌酶(5mg/ml)并于20℃孵育1小时,向其中加入24ml的SET溶液(150mMNaCl,1mMEDTA,20mMTris-HCl,pH8.0),4ml5%SDS及400μl蛋白酶K(10mg/ml)并于37℃再孵育1小时。以酚-氯仿抽提以终止反应,接着以乙醇沉淀以获得约3.2mg的染色体DNA。(2)激烈热球菌染色体DNA基因组southern杂交激烈热球菌染色体DNA分别以SacI、NotI、XbaI、EcoRI及XhoI(所有均由TakaraShuzo公司生产)酶切。反应混合物的一部分进一步以SacI和EcoRI酶切,再进行1%琼脂糖凝胶电泳,接着用实施例1-(5)中所述的步骤进行southern杂交用EcoRI和PstI酶切上面的质粒p1F-2R(2)而得到的约0.3kb的DNA片段作为模板并BcaBESTDNA标记试剂盒(由TakaraShuzo公司生产)及[α-32P]dCTP而制备的32P-标记的DNA用作探针,以含有终浓度为0.5%SDS的2×SSC在室温洗膜,以2×SSC冲洗并得到放射自显影。结果,观察到在以SacI酶切激烈热球菌染色体DNA而得到约5.4kb和约3.0kb的两个DNA片段中具有信号并且表明在各自片段中具有蛋白酶基因。当SacI酶切的片段进一步以SpeI(TakaraShuzo公司生产)酶切时,上面约5.4kb片段中的信号没表现出变化但在约3.0kb的片段中信号丢失,并在约0.6kb的片段中新观察到一个信号。由于SpeI位点在序列表中的SEQIDNO.7所代表的蛋白酶PFUL基因中不存在,这标明由SacI及SpeI酶切而获得的约0.6kb片段中的信号是源自新的超耐热蛋白酶(此后称为“蛋白酶PFUS”)。此外,对于以XbaI酶切激烈热球菌染色体DNA的产物,在约3.3kb及约9.0kb两个DNA片段中观察到信号。从图1显示的蛋白酶PFUL基因的限制性图谱,认为约3.3kb的片段含有蛋白酶PFUL基因且约9.0kb的片段含有蛋白酶PFUS基因。当以XbaI及SacI酶切上面的染色体DNA时,在约2.0kb片段及约3.0kb片段中观察到信号。从序列表中SEQIDNO.7所示存在于蛋白酶PFUL基因中SacI及XbaI位点的位置,认为蛋白酶PFUL基因存在于约2.0kb的SacI-XbaI片段。另一方面,认为蛋白酶PFUS基因存在于约3.0kb的片段。与SacI酶切结果相结合,发现仅以SacI酶切而获得的约3.0kb的DNA片段中没有XbaI位点存在。(3)含有蛋白酶PFUS基因中0.6kbSpeI-SacI片段的克隆以SacI和SpeI酶切激烈热球菌染色体DNA,然后进行1%琼脂糖凝胶电泳以从凝胶中回收相应于约0.6kb的DNA片段。然后,以SacI和SpeI酶切质粒pBluescriptSK(-)(由Stratagene生产),并与上面约0.6kbDNA片段混合以让其连接,接着导入大肠杆菌JM109以获得含染色体DNA片段的质粒文库。接种转化的大肠杆菌JM109于平板以形成菌落,并将得到的菌落转到Hybond-N+膜,于新制的LB平板上37℃培养约2小时。以含1.5MNaCl的0.5NNaOH处理该膜,然后以含1.5MNaCl的0.5MTris-HCl(pH7.5)处理,以2×SSC处理,空气干燥并通过紫外交联仪的紫外线照射以将质粒DNA固定到膜上。该膜在杂交缓冲液中50℃处理2小时,并转移至含有用于实施例2-(2)中所述southern杂交的32P-标记DNA探针的相同缓冲液。杂交完成以后,以含0.5%SDS的2×SSC室温洗膜,并于37℃洗膜。此外,以2×SSC冲洗膜,空气干燥,与X-光片在-80℃曝光12小时以获得放射自显影。筛选出约500个克隆并且,结果,获得了3个含蛋白酶基因的克隆。根据放射自显影信号,检查这些克隆的位置并分离LB培养基中相应于用于转膜平板上的菌落(4)通过PCR对蛋白酶PFUS基因的检测根据蛋白酶PFUL基因中编码与源自已知微生物碱性丝氨酸蛋白酶氨基酸序列具有高度同源性两个区域的核苷酸序列设计用于通过PCR对超耐热蛋白酶基因检测探针的寡核苷酸。根据图2及图3所代表的蛋白酶PFUL的氨基酸序列,合成引物1FP1、1FP2、2RP1及2RP2。序列表中的SEQIDNO.22、23、24及25显示寡核苷酸1FP1、1FP2、2RP1及2RP2的核苷酸序列。制备含有从上面三个克隆得到的质粒以及寡核苷酸1FP1或2RP1、或1FP1和2RP2、或1FP2和2RP1、或1FP2及2RP2的PCR反应混合物,并进行30个循环的反应,每个循环由94℃30秒-37℃2分钟-72℃1分钟所组成。发现,当用部分这些反应混合物分别进行琼脂糖凝胶电泳时,当用引物1FP2和2RP2时在所有上面的3个质粒中均观察到约150bpDNA片段的扩增,表明蛋白酶基因在这些质粒中存在。挑选出上面三个克隆中的一个并命名为质粒pSS3。(5)包含在质粒pSS3中蛋白酶PFUS基因核苷酸序列的测定用质粒pSS3作为模板及引物M4和引物RV(由TakaraShuzo公司生产)通过双脱氧方法测定质粒中插入DNA片段的核苷酸序列。序列表中的SEQIDNO.26显示得到的核苷酸序列及推导的由该核苷酸编码的氨基酸序列。通过比较该氨基酸序列与蛋白酶PFUL、蛋白酶TCES及枯草蛋白酶的氨基酸序列,认为插入在质粒pSS3中的DNA片段编码与这些蛋白酶具有同源性的氨基酸。(6)通过反向PCR方法对蛋白酶N-末端编码区及C-末端编码区的克隆为了获得编码蛋白酶PFUSN-末端氨基酸序列及C-末端氨基酸序列的基因,进行反向PCR。用于反向PCR的引物根据质粒pSS3中插入DNA片段的核苷酸序列合成。序列表中的SEQIDNO.27、28及29显示引物NPF-1、NPF-2及NPR-3的核苷酸序列。以SacI及Xbal酶切激烈热球菌染色体DNA并进行分子内连接。制备含部分连接反应混合物及引物NPF-1与NPR-3,或NPF-2与NPR-3的PCR混合物并进行30轮循环的反应,每个循环由94℃30秒-67℃10分钟所组成。当该反应混合物的一部分进行琼脂糖凝胶电泳时,在用引物NPF-2与NPR-3的情况中观察到一个约3kb的扩增片段。从琼脂糖凝胶中回收扩增的片段,并与质粒载体pT7BlueT(由Novagen生产)以让其连接,接着导入到大肠杆菌JM109。从得到的转化子中提取质粒,挑选出含有约3kb片段的质粒并命名为质粒ps322。另一方面,在用引物NPF-1及NPR-3时,观察到一个约9kb的扩增片段。从琼脂糖凝胶中回收该扩增片段,用DNA补平试剂盒将DNA末端补平,接着以Xbal进一步酶切。将该片段与以XbaI及HincII酶切的质粒载体pBluescriptSK(-)混合以让其连接,接着导入大肠杆菌JM109。从得到的转化子中提取质粒,挑选出含有一个约5kbDNA片段的质粒并命名为质粒pSKX5(7)包含在质粒pS322和pSKX5中蛋白酶PFUS基因核苷酸序列的测定用质粒pS322作为模板及引物NPR-3用双脱氧方法测定编码蛋白酶PFUSN-末端区域基因的核苷酸序列。序列表的SEQIDNO.30显示部分得到的核苷酸序列及推断由该核苷酸序列编码的氨基酸序列。此外,用质粒pSKX5作为模板及引物RV,通过双脱氧方法测定相当于蛋白酶PFUS基因3′部分区域的核苷酸序列。序列表中的SEQIDNO.31显示部分得到的核苷酸序列。(8)用于全长蛋白酶PFUS基因扩增的引物的合成根据实施例2-(7)中获得的核苷酸序列,设计用于全长蛋白酶PFUS基因扩增的引物。根据显示于序列表中的SEQIDNO.30且编码蛋白酶PFUSN-末端部分的核苷酸序列,合成能在蛋白酶PFUS基因起始密码子之前导入BamHI位点的引物NPF-4。序列表中的SEQIDNO.32显示引物NPF-4的核苷酸序列。此外,根据序列表中的SEQIDNO.31显示的蛋白酶PFUS3′区域附近的核苷酸序列,合成与该核苷酸序列互补且具有一个SphI位点的引物NPR-4。序列表中的SEQIDNO.33显示引物NPR-4的核苷酸序列。(9)含有源自激烈热球菌蛋白酶和蛋白酶TCES杂合基因,用于纯化枯草芽孢杆菌的质粒pSPT1的制备通过用LAPCR试剂盒(由TakaraShuzo公司生产),制备含有引物NPF-4和NPR-4及激烈热球菌的染色体DNA的PCR反应混合物(从此以后用LAPCR试剂盒制备的PCR反应混合物称为“LA-PCR反应混合物”),并进行30轮循环的反应,每轮循环由94℃20秒-55℃1分钟-68℃7分钟所组成,以扩增出在其两端具有这两个引物且含有蛋白酶PFUS基因编码区的约6.0kb的DNA片段。以BamHI和SacI酶切该约6kb的DNA片段,然后以1%琼脂糖凝胶电泳以回收分离的约0.8kb的DNA片段该片段与以BamHI和SacI酶切的质粒pSTC3酶切以让其连接,接着导入枯草芽孢杆菌DB104。从得到的卡那霉素抗性的转化子中提取质粒,且挑选出仅含一分子约0.8kb片段的质粒并命名为质粒pSPT1。具有质粒pSPT1的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pSPT1。图14显示质粒pSPT1的限制性图谱。(10)包含有蛋白酶PFUS基因用于转化枯草芽孢杆菌的质粒pSNP1的制备以SpeI和SphI酶切实施例2-(9)中扩增的约6kb的DNA片段,然后进行1%琼脂糖凝胶电泳以回收分离的约5.7kb的DNA片段。将该片段与以SpeI和SphI酶切的质粒混合以让其连接,接着导入枯草芽孢杆菌DB104。从得到的卡那霉素抗性转化子中提取质粒,并且挑选出仅含1分子5.7kb片段的质粒并命名为质粒pSNP1。从质粒pSNP1转化的枯草芽孢杆菌命名为枯草芽孢杆菌DB104/pSNP1图15显示质粒pSNPI的限制性图谱。(11)包含在质粒pSNP1中蛋白酶PFUS基因核苷酸序列的测定插入在质粒pSNP1中含有蛋白酶基因的约6kb的DNA片段以各种限制酶酶切成适当的大小,并将这些片段亚克隆进入质粒载体pUC119或pBluescriptSK(-)。用得到的重组质粒作为模板并用商业上可得到的通用引物通过双脱氧方法测定该核苷酸序列。考虑到有可能得不到具有适当大小片段的部分,运用了利用合成引物的引物步移方法(primerwalkingmethod)。这样测定的存在于插入到质粒pSNP1中DNA片段核苷酸序列中开放阅读框的核苷酸序列,和由该核苷酸序列推断的源自激烈热球菌蛋白酶的氨基酸序列分别显示于序列34和35。(12)用于蛋白酶PFUS基因扩增的引物的合成为了设计用于全长蛋白酶PFUS基因扩增并与该基因3′部分杂交的引物,测定该基因3′部分的核苷酸序列。首先,通过以BamHI酶切质粒pSNP1而获得的含有蛋白酶PFUS基因3′区域约0.6kb的DNA片段与以BamHI酶切并以碱性磷酸酶脱磷酸化的质粒载体pUC119连接。得到的重组质粒命名为质粒pSNPD并且相应于蛋白酶PFUS基因3′部分区域的核苷酸序列以该质粒作为模板通过双脱氧方法加以测定。序列表中的SEQIDNO.38显示存在于该区域从BamHI位点至80bp上游核苷酸的核苷酸序列(互补链的序列)。然后,根据该序列,合成与蛋白酶PFUS基因3′部分杂交且含有SphI位点的引物NPM-1。序列表中的SEQIDNO.39显示引物NPM-1的核苷酸序列。此外,合成存在于蛋白酶PFUS基因中起始密码子下游约1.7kb处且用于去除BamHI位点的引物mutRR和mutFR。序列表中的SEQIDNO.40和41分别显示引物mutRR和mutFR的核苷酸序列。(13)含有全长蛋白酶PFUS基因的质粒pPS1的制备制备含有激烈热球菌染色体DNA作为模板和引物NPF-4与mutRR组合或引物mutFR与NPM-1组合的两套LA-PCR反应混合物,并进行30轮循环反应,每轮循环由94℃30秒-55℃1分钟-68℃3分钟所组成。当用部分该反应混合物进行琼脂糖凝胶电泳时,当用引物NPF-4与mutRR时扩增出一个约1.8kb的DNA片段,并且用引物mutFR和NMP-1时扩增出一个约0.6kb的DNA片段。从这两套PCR混合物中制备通过用SUPREC-02(由TakaraShuzo公司生产)而去除引物的每个扩增DNA片段。制备含有这两个扩增DNA片段而不含引物和LATaq的LA-PCR反应混合物,对其94℃热变性10分钟,接着经30分钟冷却至30℃并在30℃维持15分钟以形成异质双螺旋。然后,向该反应混合物中,加入LATaq并于72℃孵育3分钟,向其中加入引物NPF-4和NPM-1并进行25轮循环反应,每循环由94℃30秒-55℃1分钟-68℃3分钟所组成。在该反应混合物中观察到扩增出一个约2.4kb的DNA片段。以BamHI和SphI酶切该约2.4kb的DNA片段,将该片段与实施例2-(11)中所述的其中的全长蛋白酶PFUS基因预先通过BamHI和SphI酶切而去除的质粒pSNP1混合以让其连接,接着导入枯草芽孢杆菌DB104。从得到卡那霉素抗性转化子中提取质粒,并挑选出仅含1分子约2.4kb插入片段的质粒并命名为质粒pPS1。以质粒DB104转化的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pPS1。图16显示质粒pPS1的限制性图谱。(14)枯草蛋白酶基因启动子至信号序列区域DNA片段的扩增合成用于获得枯草蛋白酶基因启动子至信号序列的引物。首先,参照《细菌学杂志》,171卷,2657-2665(1989)页中描述的枯草蛋白酶基因启动子区域的核苷酸序列,合成与该区域上游部分杂交且含有EcoRI位点的引物SUB4(序列表中的SEQIDNO.36显示引物SUB4的核苷酸序列)。然后,参照《细菌学杂志》,158卷,411-418页(1984)描述的编码枯草蛋白酶区域的核苷酸序列,合成紧接在信号序列后面可导入BamHI位点的引物BmR1(序列表中的SEQIDNO.37显示引物BmR1的核苷酸序列)含有《细菌学杂志》,17卷,2657-2665页(1989)描述的枯草蛋白酶基因的质粒PKWZ用作模板以制备含有引物SUB4和BmR1的PCR反应混合物,并进行30轮循环反应,每轮循环由94℃30秒-55℃1分钟-68℃2分钟所组成。该反应混合物的一部分做琼脂糖凝胶电泳证实扩增出一个约0.3kb的DNA片段(15)含有蛋白酶PFUS基因用于转化枯草芽孢杆菌的质粒pNAPS1的制备以EcoRI和BamHI酶切该约0.3kb的DNA片段,并与实施例2-(13)中描述的预先以EcoRI和BamHI酶切的质粒混合以让其连接,接着导入枯草芽孢杆菌DB104。以得到的卡那霉素抗性转化子提取质粒并挑选出仅含1分子约0.3kb片段的质粒并命名为质粒pNAPS1。此外,以质粒pNAPS1转化的枯草芽孢杆菌DB104命名为枯草芽孢杆菌DB104/pNAPS1。图17显示质粒pNAPS1的限制性图谱实施例3(1)用于检测超耐热蛋白酶基因探针的制备以BalI和HincII酶切含有蛋白酶PFUL基因的质粒pTPR12(两种酶均由TakaraShuzo公司生产),然后以1%琼脂糖凝胶电泳以回收分离的约1kb的DNA片段。用该DNA片段作为模板且用BcaBESTDNA标记试剂盒和[α-32P]dCTP制备32P-标记的DNA探针。(2)存在于超嗜热菌海葡萄嗜热菌和解蛋白栖热拟杆菌中超耐热蛋白酶基因的检测按照实施例1-(3)中描述的步骤从每10ml获自德意志微生物保藏中心的海葡萄嗜热菌DSM3639和解蛋白栖热拟杆菌DSM5265培养中制备染色体DNA。分别以EcoRI,PstI,HindIII,XbaI和SacI酶切两种染色体DNA,然后进行1%琼脂糖凝胶电泳,接着按实施例1(5)中描述的步骤进行southern杂交,作为探针,使用了在实施例3-(1)中制备的32P-标记DNA探针,以含0.5%终浓度SDS的2×SSC在37℃洗膜,以2×SSC冲洗,并获得放射自显影。从该放射自显影中,在以PstI消化的海葡萄嗜热菌染色体DNA中观察到一个约4.8kbDNA片段处的信号,并且在以XbaI酶切的解蛋白栖热拟杆菌染色体DNA中观察到一个约3.5kbDNA片段处的信号,因此,表明与蛋白酶PFUL基因杂交的超耐热蛋白酶基因存在于海葡萄嗜热菌和解蛋白栖热拟杆菌染色体DNA中。实施例4(1)蛋白酶PFUS和TCES粗酶制剂的制备其中导入有含有本发明超耐热蛋白酶基因的质粒pSTC3的枯草芽孢杆菌DB104(枯草芽孢杆菌DB104/pSTC3)于37℃培养于5ml含10μg/ml卡那霉素的LB培养基(胰蛋白胨10g/升,酵母提取物5g/升,NaCl5g/升,pH7.2)中8小时。制备250ml类似的培养基于1升的锥形瓶flask中,接种5ml上面的培养物从而于37℃培养16小时。将硫酸铵加入到通过离心培养物至75%饱和度而获得的上清中,并通过离心回收得到的沉淀。回收的沉淀悬浮于4ml20mMpH7.5的Tris-HCl中,并与相同缓冲液中透析,且得到的透析产物用作粗酶制剂(酶制剂TC-3)按照上述步骤,从导入有含有本发明超耐热蛋白酶基因的质粒pSNP1的枯草芽孢杆菌DB104(枯草芽孢杆菌DB104/pSNP1)或导入有含有本发明超耐热蛋白酶基因的质粒pSPT1的枯草芽孢杆菌DB104中制备粗酶制剂,并且该酶制剂分别命名为NP-1和PT-1。通过用含明胶的SDS-聚丙烯酰胺凝胶酶活性检测方法或其它酶活性检测方法检测这些酶制剂的蛋白酶活性(2)纯化的蛋白酶PFUS酶制剂的序备两管含有10μg/ml卡那霉素的5mlLB培养基中接种其中导入有含有实施例2-(18)中获得的本发明超耐热蛋白酶基因质粒pNAPS1的枯草芽孢杆菌DB104(枯草芽孢杆菌DB104/pNAPS1),接着于37℃振荡培养7小时。制备每瓶含120ml类似培养基的6个锥形瓶(瓶体积为500ml),并且每瓶接种1ml上面培养物,接着在37℃振荡培养17小时。离心培养物以获得细胞和培养上清。将细胞悬浮于15ml50mM的pH7.5的Tris-HCl,且向其中加入30mg的溶菌酶(由Sigma生产),然后于37℃酶切1.5小时。95℃15分钟热处理酶切溶液,然后离心收集上清,向12ml得到的上清中加入4ml饱和的硫酸铵溶液,并以0.45μm过滤器(SterivexHV,Millipore生产)过滤,并将过滤产物装入POROSpH柱(4.6mm×150mm由PerSeptiveBiosystems生产),该柱以pH7.5,含25%饱和度硫酸铵的25mMTris-HCl平衡。以用于平衡的缓冲液洗柱,通过降低硫酸铵浓度从25%饱和度至0%饱和度并且同时增加乙腈浓度从0%至20%进行梯度洗脱以洗脱出PFUS蛋白酶,以获得纯化的酶制剂NAPS-1。750ml的培养上清于pH8.0的25mMTris-HCl中透析并吸附于以相同缓冲液平衡的Econo-PackQ柱(由BioRad生产)。然后,吸附的酶以0~1.5M的NaCl做线性梯度洗脱。得到的活性部分于95℃热处理1小时,并向其中加入1/3体积的饱和硫酸铵。在用0.45μm的滤器(SterivexHV)过滤以后,过滤产物装入POROSpH柱(4.6mm×150mm),该柱以pH7.5,含25%饱和度的硫酸铵的25mMTris-HCl平衡。吸附于柱上的PFUS蛋白酶按照酶制剂NAPS-1的步骤进行洗脱以获得纯化的酶制剂NAPS-1向适量的纯化酶制剂NAPS-1或NAPS-1S中加入三氯乙酸至8.3%的终浓度以沉淀酶制剂中的蛋白,通过离心回收蛋白。回收的沉淀蛋白溶于蒸馏水中,向其中加入1/4量的样品缓冲液(50mMTris-HCl,pH7.5,5%SDS,5%2-巯基乙醇,0.005%溴酚蓝,50%甘油),于100℃处理5分钟并用0.1%SDS-10%聚丙烯酰胺凝胶进行电泳。电泳完以后,凝胶以2.5%考马斯亮蓝R-250,25%乙醇,和10%的冰醋酸染色30分钟,转入25%的甲醇和7%的冰醋酸中且过多的染色经脱色3~15小时。两种酶制剂NAPS-1和NAPS-1S显示为单一的带,且从迁移距离推导的分子量约为4.5kDa。(3)成熟蛋白酶PUFSN-末端的测序实施例4-(2)中制备的纯化酶制剂NAPS-1用0.1%SDS10%聚丙烯酰胺凝胶进行电泳,并且凝胶中的蛋白用半干式印迹仪(由NihonEido生产)印迹至PVDF膜(由Millipore生产)上。印迹按照《电泳》,11卷,573-580页(1990)中描述的方法进行。印迹以后,该膜以1%考马斯亮蓝R250,50%甲醇溶液染色,并以60%的甲醇溶液脱色。切下被染膜的一部分,然后用G1000A蛋白测序仪(由HewlettePackard生产)通过自动的Edman降解法测定N-末端的氨基酸序列。SEQIDNO.42显示得到的N-末端氨基酸序列。序列表SEQIDNO1序列长度659序列类型氨基酸链型单链拓扑学线性分子类型肽序列描述MetLysArgLeuGlyAlaValValLeuAlaLeuValLeuValGly51015LeuLeuAlaGlyThrAlaLeuAlaAlaProValLysProValVal202530ArgAsnAsnAlaValGlnGlnLysAsnTyrGlyLeuLeuThrPro354045GlyLeuPheLysLysValGlnArgMetAsnTrpAsnGlnGluVal505560AspThrValIleMetPheGlySerTyrGlyAspArgAspArgAla657075ValLysValLeuArgLeuMetGlyAlaGlnValLysTyrSerTyr808590LysIleIleProAlaValAlaValLysIleLysAlaArgAspLeu95100105LeuLeuIleAlaGlyMetIleAspThrGlyTyrPheGlyAsnThr110115120ArgValSerGlyIleLysPheIleGlnGluAspTyrLysValGln125130135ValAspAspAlaThrSerValSerGlnIleGlyAlaAspThrVal140145150TrpAsnSerLeuGlyTyrAspGlySerGlyValValValAlaIle155160165ValAspThrGlyIleAspAlaAsnHisProAspLeuLysGlyLys170175180ValIleGlyTrpTyrAspAlaValASnGlyArgSerThrProTyr185190195AspAspGlnGlyHisGlyThrHisValAlaGlyIleValAlaGly200205210ThrGlySerValAsnSerGlnTyrIleGlyValAlaProGlyAla215220225LysLeuValGlyValLysValLeuGlyAlaAspGlySerGlySer230235240ValSerThrIleIleAlaGlyValAspTrpValValGlnAsnLys245250255AspLysTyrGlyIleArgValIleAsnLeuSerLeuGlySerSer260265270GlnSerSerAspGlyThrAspSerLeuSerGlnAlaValAsnAsn275280285AlaTrpAspAlaGlyIleValValCysValAlaAlaGlyAsnSer290295300GlyProAsnThrTyrThrValGlySerProAlaAlaAlaSerLys305310315ValIleThrValGlyAlaValAspSerAsnAspAsnIleAlaSer320325330PheSerSerArgGlyProThrAlaAspGlyArgLeuLysProGlu335340345ValValAlaProGlyValAspIleIleAlaProArgAlaSerGly350355360ThrSerMetGlyThrProIleAsnAspTyrTyrThrLysAlaSer365370375GlyThrSerMetAlaThrProHisValSerGlyValGlyAlaLeu380385390IleLeuGlnAlaHisProSerTrpThrProAspLysValLysThr395400405AlaLeuIleGluThrAlaAspIleValAlaProLysGluIleAla410415420AspIleAlaTyrGlyAlaGlyArgValAsnValTyrLysAlaIle425430435LysTyrAspAspTyrAlaLysLeuThrPheThrGlySerValAla440445450AspLysGlySerAlaThrHisThrPheAspValSerGlyAlaThr455460465PheValThrAlaThrLeuTyrTrpAspThrGlySerSerAspIle470475480AspLeuTyrLeuTyrAspProAsnGlyAsnGluValAspTyrSer485490495TyrThrAlaTyrTyrGlyPheGluLysValGlyTyrTyrAsnPro500505510ThrAlaGlyThrTrpThrValLysValValSerTyrLysGlyAla515520525AlaAsnTyrGlnValAspValValSerAspGlySerLeuSerGln530535540SerGlyGlyGlyAsnProAsnProAsnProAsnProAsnProThr545550555ProThrThrAspThrGlnThrPheThrGlySerValAsnAspTyr560565570TrpAspThrSerAspThrPheThrMetAsnValAsnSerGlyAla575580585ThrLysIleThrGlyAspLeuThrPheAspThrSerTyrAsnAsp590595600LeuAspLeuTyrLeuTyrAspProAsnGlyAsnLeuValAspArg605610615SerThrSerSerAsnSerTyrGluHisValGluTyrAlaAsnPro620625630AlaProGlyThrTrpThrPheLeuValTyrAlaTyrSerThrTyr635640645GlyTrpAlaAspTyrGlnLeuLysAlaValValTyrTyrGly650655SEQIDNO2序列长度1977序列类型核酸链型双链拓扑学线性分子类型基因组DNA最初来源速生热球菌菌株DSM2476序列描述ATGAAGAGGTTAGGTGCTGTGGTGCTGGCACTGGTGCTCGTGGGTCTTCTGGCCGGAACG60GCCCTTGCGGCACCCGTAAAACCGGTTGTCAGGAACAACGCGGTTCAGCAGAAGAACTAC120GGACTGCTGACCCCGGGACTGTTCAAGAAAGTCCAGAGGATGAACTGGAACCAGGAAGTG180GACACCGTCATAATGTTCGGGAGCTACGGAGACAGGGACAGGGCGGTTAAGGTACTGAGG240CTCATGGGCGCCCAGGTCAAGTACTCCTACAAGATAATCCCTGCTGTCGCGGTTAAAATA300AAGGCCAGGGACCTTCTGCTGATCGCGGGCATGATAGACACGGGTTACTTCGGTAACACA360AGGGTCTCGGGCATAAAGTTCATACAGGAGGATTACAAGGTTCAGGTTGACGACGCCACT420TCCGTCTCCCAGATAGGGGCCGATACCGTCTGGAACTCCCTCGGCTACGACGGAAGCGGT480GTGGTGGTTGCCATCGTCGATACGGGTATAGACGCGAACCACCCCGATCTGAAGGGCAAG540GTCATAGGCTGGTACGACGCCGTCAACGGCAGGTCGACCCCCTACGATGACCAGGGACAC600GGAACCCACGTTGCGGGTATCGTTGCCGGAACCGGCAGCGTTAACTCCCAGTACATAGGC660GTCGCCCCCGGCGCGAAGCTCGTCGGCGTCAAGGTTCTCGGTGCCGACGGTTCGGGAAGC720GTCTCCACCATCATCGCGGGTGTTGACTGGGTCGTCCAGAACAAGGACAAGTACGGGATA780AGGGTCATCAACCTCTCCCTCGGCTCCTCCCAGAGCTCCGACGGAACCGACTCCCTCAGT840CAGGCCGTCAACAACGCCTGGGACGCCGGTATAGTAGTCTGCGTCGCCGCCGGCAACAGC900GGGCCGAACACCTACACCGTCGGCTCACCCGCCGCCGCGAGCAAGGTCATAACCGTCGGT960GCAGTTGACAGCAACGACAACATCGCCAGCTTCTCCAGCAGGGGACCGACCGCGGACGGA1020AGGCTCAAGCCGGAAGTCGTCGCCCCCGGCGTTGACATCATAGCCCCGCGCGCCAGCGGA1080ACCAGCATGGGCACCCCGATAAACGACTACTACACCAAGGCCTCTGGAACCAGCATGGCC1140ACCCCGCACGTTTCGGGCGTTGGCGCGCTCATCCTCCAGGCCCACCCGAGCTGGACCCCG1200GACAAGGTGAAGACCGCCCTCATCGAGACCGCCGACATAGTCGCCCCCAAGGAGATAGCG1260GACATCGCCTACGGTGCGGGTAGGGTGAACGTCTACAAGGCCATCAAGTACGACGACTAC1320GCCAAGCTCACCTTCACCGGCTCCGTCGCCGACAAGGGAAGCGCCACCCACACCTTCGAC1380GTCAGCGGCGCCACCTTCGTGACCGCCACCCTCTACTGGGACACGGGCTCGAGCGACATC1440GACCTCTACCTCTACGACCCCAACGGGAACGAGGTTGACTACTCCTACACCGCCTACTAC1500GGCTTCGAGAAGGTCGGCTACTACAACCCGACCGCCGGAACCTGGACGGTCAAGGTCGTC1560AGCTACAAGGGCGCGGCGAACTACCAGGTCGACGTCGTCAGCGACGGGAGCCTCAGCCAG1620TCCGGCGGCGGCAACCCGAATCCAAACCCCAACCCGAACCCAACCCCGACCACCGACACC1680CAGACCTTCACCGGTTCCGTTAACGACTACTGGGACACCAGCGACACCTTCACCATGAAC1740GTCAACAGCGGTGCCACCAAGATAACCGGTGACCTGACCTTCGATACTTCCTACAACGAC1800CTCGACCTCTACCTCTACGACCCCAACGGCAACCTCGTTGACAGGTCCACGTCGAGCAAC1860AGCTACGAGCACGTCGAGTACGCCAACCCCGCCCCGGGAACCTGGACGTTCCTCGTCTAC1920GCCTACAGCACCTACGGCTGGGCGGACTACCAGCTCAAGGCCGTCGTCTACTACGGG1977SEQIDNO3序列长度522序列类型氨基酸链型单链拓扑学线性分子类型肽特征428位的Xaa为Gly或Val。序列描述AlaGluLeuGluGlyLeuAspGluSerAlaAlaGlnValMetAla510151ThrTyrValTrpAsnLeuGlyTyrAspGlySerGlyIleThrIle202530GlyIleIleAspThrGlyIleAspAlaSerHisProAspLeuGln354045GlyLysValIleGlyTrpValAspPheValAsnGlyArgSerTyr505560ProTyrAspAspHisGlyHisGlyThrHisValAlaSerIleAla657075AlaGlyThrGlyAlaAlaSerAsnGlyLysTyrLysGlyMetAla808590ProGlyAlaLysLeuAlaGlyIleLysValLeuGlyAlaAspGly95100105SerGlySerIleSerThrIleIleLysGlyValGluTrpAlaVal110115120AspAsnLysAspLysTyrGlyIleLysValIleAsnLeuSerLeu125130135GlySerSerGlnSerSerAspGlyThrAspAlaLeuSerGlnAla140145150ValAsnAlaAlaTrpAspAlaGlyLeuValValValValAlaAla155160165GlyAsnSerGlyProAsnLysTyrThrIleGlySerProAlaAla170175180AlaSerLysValIleThrValGlyAlaValAspLysTyrAspVal185190195IleThrSerPheSerSerArgGlyProThrAlaAspGlyArgLeu200205210LysProGluValValAlaProGlyAsnTrpIleIleAlaAlaArg215220225AlaSerGlyThrSerMetGlyGlnProIleAsnAspTyrTyrThr230235240AlaAlaProGlyThrSerMetAlaThrProHisValAlaGlyIle245250255AlaAlaLeuLeuLeuGlnAlaHisProSerTrpThrProAspLys260265270ValLysThrAlaLeuIleGluThrAlaAspIleValLysProAsp275280285GluIleAlaAspIleAlaTyrGlyAlaGlyArgValAsnAlaTyr290295300LysAlaIleAsnTyrAspAsnTyrAlaLysLeuValPheThrGly305310315TyrValAlaAsnLysGlySerGlnThrHisGlnPheValIleSer320325330GlyAlaSerPheValThrAlaThrLeuTyrTrpAspAsnAlaAsn335340345SerAspLeuAspLeuTyrLeuTyrAspProAsnGlyAsnGlnVal350355360AspTyrSerTyrThrAlaTyrTyrGlyPheGluLysValGlyTyr365370375TyrAsnProThrAspGlyThrTrpThrIleLysValValSerTyr380385390SerGlySerAlaAsnTyrGlnValAspValValSerAspGlySer395400405LeuSerGlnProGlySerSerProSerProGlnProGluProThr410415420ValAspAlaLysThrPheGlnXaaSerAspHisTyrTyrTyrAsp425430435ArgSerAspThrPheThrMetThrValAsnSerGlyAlaThrLys440445450IleThrGlyAspLeuValPheAspThrSerTyrHisAspLeuAsp455460465LeuTyrLeuTyrAspProAsnGlnLysLeuValAspArgSerGlu470475480SerProAsnSerTyrGluHisValGluTyrLeuThrProAlaPro485490495GlyThrTrpTyrPheLeuValTyrAlaTyrTyrThrTyrGlyTrp500505510AlaTyrTyrGluLeuThrAlaLysValTyrTyrGly515520SEQIDNO4序列长度1568序列类型核酸链型双链拓扑学线性分子类型基因组DNA最初来源激烈热球菌菌株DSM3638特征1283位的N为G或T序列描述GCAGAATTAGAAGGACTGGATGAGTCTGCAGCTCAAGTTATGGCAACTTACGTTTGGAAC60TTGGGATATGATGGTTCTGGAATCACAATAGGAATAATTGACACTGGAATTGACGCTTCT120CATCCAGATCTCCAAGGAAAAGTAATTGGGTGGGTAGATTTTGTCAATGGTAGGAGTTAT180CCATACGATGACCATGGACATGGAACTCATGTAGCTTCAATAGCAGCTGGTACTGGAGCA240GCAAGTAATGGCAAGTACAAGGGAATGGCTCCAGGAGCTAAGCTGGCGGGAATTAAGGTT300CTAGGTGCCGATGGTTCTGGAAGCATATCTACTATAATTAAGGGAGTTGAGTGGGCCGTT360GATAACAAAGATAAGTACGGAATTAAGGTCATTAATCTTTCTCTTGGTTCAAGCCAGAGC420TCAGATGGTACTGACGCTCTAAGTCAGGCTGTTAATGCAGCGTGGGATGCTGGATTAGTT480GTTGTGGTTGCCGCTGGAAACAGTGGACCTAACAAGTATACAATCGGTTCTCCAGCAGCT540GCAAGCAAAGTTATTACAGTTGGAGCCGTTGACAAGTATGATGTTATAACAAGCTTCTCA600AGCAGAGGGCCAACTGCAGACGGCAGGCTTAAGCCTGAGGTTGTTGCTCCAGGAAACTGG660ATAATTGCTGCCAGAGCAAGTGGAACTAGCATGGGTCAACCAATTAATGACTATTACACA720GCAGCTCCTGGGACATCAATGGCAACTCCTCACGTAGCTGGTATTGCAGCCCTCTTGCTC780CAAGCACACCCGAGCTGGACTCCAGACAAAGTAAAAACAGCCCTCATAGAAACTGCTGAT840ATCGTAAAGCCAGATGAAATAGCCGATATAGCCTACGGTGCAGGTAGGGTTAATGCATAC900AAGGCTATAAACTACGATAACTATGCAAAGCTAGTGTTCACTGGATATGTTGCCAACAAA960GGCAGCCAAACTCACCAGTTCGTTATTAGCGGAGCTTCGTTCGTAACTGCCACATTATAC1020TGGGACAATGCCAATAGCGACCTTGATCTTTACCTCTACGATCCCAATGGAAACCAGGTT1080GACTACTCTTACACCGCCTACTATGGATTCGAAAAGGTTGGTTATTACAACCCAACTGAT1140GGAACATGGACAATTAAGGTTGTAAGCTACAGCGGAAGTGCAAACTATCAAGTAGATGTG1200GTAAGTGATGGTTCCCTTTCACAGCCTGGAAGTTCACCATCTCCACAACCAGAACCAACA1260GTAGACGCAAAGACGTTCCAAGNATCCGATCACTACTACTATGACAGGAGCGACACCTTT1320ACAATGACCGTTAACTCTGGGGCTACAAAGATTACTGGAGACCTAGTGTTTGACACAAGC1380TACCATGATCTTGACCTTTACCTCTACGATCCTAACCAGAAGCTTGTAGATAGATCGGAG1440AGTCCCAACAGCTACGAACACGTAGAATACTTAACCCCCGCCCCAGGAACCTGGTACTTC1500CTAGTATATGCCTACTACACTTACGGTTGGGCTTACTACGAGCTGACGGCTAAAGTTTAT1560TATGGC1566SEQIDNO5序列长度659序列类型氨基酸链型单链拓扑学线性分子类型肽序列描述MetLysGlyLeuLysAlaLeuIleLeuValIleLeuValLeuGly51015LeuValValGlySerValAlaAlaAlaProGluLysLysValGlu202530GlnValArgAsnValGluLysAsnTyrGlyLeuLeuThrProGly354045LeuPheArgLysIleGlnLysLeuAsnProAsnGluGluIleSer505560ThrValIleValPheGluAsnHisArgGluLysGluIleAlaVal657075ArgValLeuGluLeuMetGlyAlaLysValArgTyrValTyrHis808590IleIleProAlalleAlaAlaAspLeuLysValArgAspLeuLeu95100105ValIleSerGlyLeuThrGlyGlyLysAlaLysLeuSerGlyVal110115120ArgPheIleGlnGluAspTyrLysValThrValSerAlaGluLeu125130135GluGlyLeuAspGluSerAlaAlaGlnValMetAlaThrTyrVal140145150TrpAsnLeuGlyTyrAspGlySerGlyIleThrIleGlyIleIle155160165AspThrGlyIleAspAlaSerHisProAspLeuGlnGlyLysVal170175180IleGlyTrpValAspPheValAsnGlyArgSerTyrProTyrAsp185190195AspHisGlyHisGlyThrHisValAlaSerIleAlaAlaGlyThr200205210GlyAlaAlaSerAsnGlyLysTyrLysGlyMetAlaProGlyAla215220225LysLeuAlaGlyIleLysValLeuGlyAlaAspGlySerGlySer230235240IleSerThrIleIleLysGlyValGluTrpAlaValAspAsnLys245250255AspLysTyrGlyIleLysValIleAsnLeuSerLeuGlySerSer260265270GlnSerSerAspGlyThrAspSerLeuSerGlnAlaValAsnAsn275280285AlaTrpAspAlaGlyIleValValCysValAlaAlaGlyAsnSer290295300GlyProAsnThrTyrThrValGlySerProAlaAlaAlaSerLys305310315ValIleThrValGlyAlaValAspSerAsnAspAsnIleAlaSer320325330PheSerSerArgGlyProThrAlaAspGlyArgLeuLysProGlu335340345ValValAlaProGlyValAspIleIleAlaProArgAlaSerGly350355360ThrSerMetGlyThrProIleAsnAspTyrTyrThrLysAlaSer365370375GlyThrSerMetAlaThrProHisValSerGlyValGlyAlaLeu380385390IleLeuGlnAlaHisProSerTrpThrProAspLysValLysThr395400405AlaLeuIleGluThrAlaAspIleValAlaProLysGluIleAla410415420AspIleAlaTyrGlyAlaGlyArgValAsnValTyrLysAlaIle425430435LysTyrAspAspTyrAlaLysLeuThrPheThrGlySerValAla440445450AspLysGlySerAlaThrHisThrPheAspValSerGlyAlaThr455460465PheValThrAlaThrLeuTyrTrpAspThrGlySerSerAspIle470475480AspLeuTyrLeuTyrAspProAsnGlyAsnGluValAspTyrSer485490495TyrThrAlaTyrTyrGlyPheGluLysValGlyTyrTyrAsnPro500505510ThrAlaGlyThrTrpThrValLysValValSerTyrLysGlyAla515520525AlaAsnTyrGlnValAspValValSerAspGlySerLeuSerGln530535540SerGlyGlyGlyAsnProAsnProAsnProAsnProAsnProThr545550555ProThrThrAspThrGlnThrPheThrGlySerValAsnAspTyr560565570TrpAspThrSerAspThrPheThrMetAsnValAsnSerGlyAla575580685ThrLysIleThrGlyAspLeuThrPheAspThrSerTyrAshAsp590595600LeuAspLeuTyrLeuTyrAspProAsnGlyAsnLeuValAspArg605610615SerThrSerSerAsnSerTyrGluHisValGluTyrAlaAsnPro620625630AlaProGlyThrTrpThrPheLeuValTyrAlaTyrSerThrTyr635640645GlyTrpAlaAspTyrGlnLeuLysAlaValValTyrTyrGly650655SEQIDNO6序列长度1977序列类型核酸链型双链拓扑学线性分子类型基因组DNA序列描述ATGAAGGGGCTGAAAGCTCTCATATTAGTGATTTTAGTTCTAGGTTTGGTAGTAGGGAGC60GTAGCGGCAGCTCCAGAGAAGAAAGTTGAACAAGTAAGAAATGTTGAGAAGAACTATGGT120CTGCTAACGCCAGGACTGTTCAGAAAAATTCAAAAATTGAATCCTAACGAGGAAATCAGC180ACAGTAATTGTATTTGAAAACCATAGGGAAAAAGAAATTGCAGTAAGAGTTCTTGAGTTA240ATGGGTGCAAAAGTTAGGTATGTGTACCATATTATACCCGCAATAGCTGCCGATCTTAAG300GTTAGAGACTTACTAGTCATCTCAGGTTTAACAGGGGGTAAAGCTAAGCTTTCAGGTGTT360AGGTTTATCCAGGAAGACTACAAAGTTACAGTTTCAGCAGAATTAGAAGGACTGGATGAG420TCTGCAGCTCAAGTTATGGCAACTTACGTTTGGAACTTGGGATATGATGGTTCTGGAATC480ACAATAGGAATAATTGACACTGGAATTGACGCTTCTCATCCAGATCTCCAAGGAAAAGTA540ATTGGGTGGGTAGATTTTGTCAATGGTAGGAGTTATCCATACGATGACCATGGACATGGA600ACTCATGTAGCTTCAATAGCAGCTGGTACTGGAGCAGCAAGTAATGGCAAGTACAAGGGA660ATGGCTCCAGGAGCTAAGCTGGCGGGAATTAAGGTTCTAGGTGCCGATGGTTCTGGAAGC720ATATCTACTATAATTAAGGGAGTTGAGTGGGCCGTTGATAACAAAGATAAGTACGGAATT780AAGGTCATTAATCTTTCTCTTGGTTCAAGCCAGAGCTCCGACGGAACCGACTCCCTCAGT840CAGGCCGTCAACAACGCCTGGGACGCCGGTATAGTAGTCTGCGTCGCCGCCGGCAACAGC900GGGCCGAACACCTACACCGTCGGCTCACCCGCCGCCGCGAGCAAGGTCATAACCGTCGGT960GCAGTTGACAGCAACGACAACATCGCCAGCTTCTCCAGCAGGGGACCGACCGCGGACGGA1020AGGCTCAAGCCGGAAGTCGTCGCCCCCGGCGTTGACATCATAGCCCCGCGCGCCAGCGGA1080ACCAGCATGGGCACCCCGATAAACGACTACTACACCAAGGCCTCTGGAACCAGCATGGCC1140ACCCCGCACGTTTCGGGCGTTGGCGCGCTCATCCTCCAGGCCCACCCGAGCTGGACCCCG1200GACAAGGTGAAGACCGCCCTCATCGAGACCGCCGACATAGTCGCCCCCAAGGAGATAGCG1260GACATCGCCTACGGTGCGGGTAGGGTGAACGTCTACAAGGCCATCAAGTACGACGACTAC1320GCCAAGCTCACCTTCACCGGCTCCGTCGCCGACAAGGGAAGCGCCACCCACACCTTCGAC1380GTCAGCGGCGCCACCTTCGTGACCGCCACCCTCTACTGGGACACGGGCTCGAGCGACATC1440GACCTCTACCTCTACGACCCCAACGGGAACGAGGTTGACTACTCCTACACCGCCTACTAC1500GGCTTCGAGAAGGTCGGCTACTACAACCCGACCGCCGGAACCTGGACGGTCAAGGTCGTC1560AGCTACAAGGGCGCGGCGAACTACCAGGTCGACGTCGTCAGCGACGGGAGCCTCAGCCAG1620TCCGGCGGCGGCAACCCGAATCCAAACCCCAACCCGAACCCAACCCCGACCACCGACACC1680CAGACCTTCACCGGTTCCGTTAACGACTACTGGGACACCAGCGACACCTTCACCATGAAC1740GTCAACAGCGGTGCCACCAAGATAACCGGTGACCTGACCTTCGATACTTCCTACAACGAC1800CTCGACCTCTACCTCTACGACCCCAACGGCAACCTCGTTGACAGGTCCACGTCGAGCAAC1860AGCTACGAGCACGTCGAGTACGCCAACCCCGCCCCGGGAACCTGGACGTTCCTCGTCTAC1920GCCTACAGCACCTACGGCTGGGCGGACTACCAGCTCAAGGCCGTCGTCTACTACGGG1980SEQIDNO7序列长度4765序列类型核酸链型双链拓扑学线性分子类型基因组DNA最初来源激烈热球菌菌株DSM3638序列描述TTTAAATTATAAGATATAATCACTCCGAGTGATGAGTAAGATACATCATTACAGTCCCAA60AATGTTTATAATTGGAACGCAGTGAATATACAAAATGAATATAACCTCGGAGGTGACTGT120AGAATGAATAAGAAGGGACTTACTGTGCTATTTATAGCGATAATGCTCCTTTCAGTAGTT180CCAGTGCACTTTGTGTCCGCAGAAACACCACCGGTTAGTTCAGAAAATTCAACAACTTCT240ATACTCCCTAACCAACAAGTTGTGACAAAAGAAGTTTCACAAGCGGCGCTTAATGCTATA300ATGAAAGGACAACCCAACATGGTTCTTATAATCAAGACTAAGGAAGGCAAACTTGAAGAG360GCAAAAACCGAGCTTGAAAAGCTAGGTGCAGAGATTCTTGACGAAAATAGAGTTCTTAAC420ATGTTGCTAGTTAAGATTAAGCCTGAGAAAGTTAAAGAGCTCAACTATATCTCATCTCTT480GAAAAAGCCTGGCTTAACAGAGAAGTTAAGCTTTCCCCTCCAATTGTCGAAAAGGACGTC540AAGACTAAGGAGCCCTCCCTAGAACCAAAAATGTATAACAGCACCTGGGTAATTAATGCT600CTCCAGTTCATCCAGGAATTTGGATATGATGGTAGTGGTGTTGTTGTTGCAGTACTTGAC660ACGGGAGTTGATCCGAACCATCCTTTCTTGAGCATAACTCCAGATGGACGCAGGAAAATT720ATAGAATGGAAGGATTTTACAGACGAGGGATTCGTGGATACATCATTCAGCTTTAGCAAG780GTTGTAAATGGGACTCTTATAATTAACACAACATTCCAAGTGGCCTCAGGTCTCACGCTG840AATGAATCGACAGGACTTATGGAATACGTTGTTAAGACTGTTTACGTGAGCAATGTGACC900ATTGGAAATATCACTTCTGCTAATGGCATCTATCACTTCGGCCTGCTCCCAGAAAGATAC960TTCGACTTAAACTTCGATGGTGATCAAGAGGACTTCTATCCTGTCTTATTAGTTAACTCC1020ACTGGCAATGGTTATGACATTGCATATGTGGATACTGACCTTGACTACGACTTCACCGAC1080GAAGTTCCACTTGGCCAGTACAACGTTACTTATGATGTTGCTGTTTTTAGCTACTACTAC1140GGTCCTCTCAACTACGTGCTTGCAGAAATAGATCCTAACGGAGAATATGCAGTATTTGGG1200TGGGATGGTCACGGTCACGGAACTCACGTAGCTGGAACTGTTGCTGGTTACGACAGCAAC1260AATGATGCTTGGGATTGGCTCAGTATGTACTCTGGTGAATGGGAAGTGTTCTCAAGACTC1320TATGGTTGGGATTATACGAACGTTACCACAGACACCGTGCAGGGTGTTGCTCCAGGTGCC1380CAAATAATGGCAATAAGAGTTCTTAGGAGTGATGGACGGGGTAGCATGTGGGATATTATA1440GAAGGTATGACATACGCAGCAACCCATGGTGCAGACGTTATAAGCATGAGTCTCGGTGGA1500AATGCTCCATACTTAGATGGTACTGATCCAGAAAGCGTTGCTGTGGATGAGCTTACCGAA1560AAGTACGGTGTTGTATTCGTAATAGCTGCAGGAAATGAAGGTCCTGGCATTAACATCGTT1620GGAAGTCCTGGTGTTGCAACAAAGGCAATAACTGTTGGAGCTGCTGCAGTGCCCATTAAC1680GTTGGAGTTTATGTTTCCCAAGCACTTGGATATCCTGATTACTATGGATTCTATTACTTC1740CCCGCCTACACAAACGTTAGAATAGCATTCTTCTCAAGCAGAGGGCCGAGAATAGATGGT1800GAAATAAAACCCAATGTAGTGGCTCCAGGTTACGGAATTTACTCATCCCTGCCGATGTGG1860ATTGGCGGAGCTGACTTCATGTCTGGAACTTCGATGGCTACTCCACATGTCAGCGGTGTC1920GTTGCACTCCTCATAAGCGGGGCAAAGGCCGAGGGAATATACTACAATCCAGATATAATT1980AAGAAGGTTCTTGAGAGCGGTGCAACCTGGCTTGAGGGAGATCCATATACTGGGCAGAAG2040TACACTGAGCTTGACCAAGGTCATGGTCTTGTTAACGTTACCAAGTCCTGGGAAATCCTT2100AAGGCTATAAACGGCACCACTCTCCCAATTGTTGATCACTGGGCAGACAAGTCCTACAGC2160GACTTTGCGGAGTACTTGGGTGTGGACGTTATAAGAGGTCTCTACGCAAGGAACTCTATA2220CCTGACATTGTCGAGTGGCACATTAAGTACGTAGGGGACACGGAGTACAGAACTTTTGAG2280ATCTATGCAACTGAGCCATGGATTAAGCCTTTTGTCAGTGGAAGTGTAATTCTAGAGAAC2340AATACCGAGTTTGTCCTTAGGGTGAAATATGATGTAGAGGGTCTTGAGCCAGGTCTCTAT2400GTTGGAAGGATAATCATTGATGATCCAACAACGCCAGTTATTGAAGACGAGATCTTGAAC2460ACAATTGTTATTCCCGAGAAGTTCACTCCTGAGAACAATTACACCCTCACCTGGTATGAT2520ATTAATGGTCCAGAAATGGTGACTCACCACTTCTTCACTGTGCCTGAGGGAGTGGACGTT2580CTCTACGCGATGACCACATACTGGGACTACGGTCTGTACAGACCAGATGGAATGTTTGTG2640TTCCCATACCAGCTAGATTATCTTCCCGCTGCAGTCTCAAATCCAATGCCTGGAAACTGG2700GAGCTAGTATGGACTGGATTTAACTTTGCACCCCTCTATGAGTCGGGCTTCCTTGTAAGG2760ATTTACGGAGTAGAGATAACTCCAAGCGTTTGGTACATTAACAGGACATACCTTGACACT2820AACACTGAATTCTCAATTGAATTCAATATTACTAACATCTATGCCCCAATTAATGCAACT2880CTAATCCCCATTGGCCTTGGAACCTACAATGCGAGCGTTGAAAGCGTTGGTGATGGAGAG2940TTCTTCATAAAGGGCATTGAAGTTCCTGAAGGCACCGCAGAGTTGAAGATTAGGATAGGC3000AACCCAAGTGTTCCGAATTCAGATCTAGACTTGTACCTTTATGACAGTAAAGGCAATTTA3060GTGGCCTTAGATGGAAACCCAACAGCAGAAGAAGAGGTTGTAGTTGAGTATCCTAAGCCT3120GGAGTTTATTCAATAGTAGTACATGGTTACAGCGTCAGGGACGAAAATGGTAATCCAACG3180ACAACCACCTTTGACTTAGTTGTTCAAATGACCCTTGATAATGGAAACATAAAGCTTGAC3240AAAGACTCGATTATTCTTGGAAGCAATGAAAGCGTAGTTGTAACTGCAAACATAACAATT3300GATAGAGATCATCCTACAGGAGTATACTCTGGTATCATAGAGATTAGAGATAATGAGGTC3360TACCAGGATACAAATACTTCAATTGCGAAAATACCCATAACTTTGGTAATTGACAAGGCG3420GACTTTGCCGTTGGTCTCACACCAGCAGAGGGAGTACTTGGAGAGGCTAGAAATTACACT3480CTAATTGTAAAGCATGCCCTAACACTAGAGCCTGTGCCAAATGCTACAGTGATTATAGGA3540AACTACACCTACCTCACAGACGAAAACGGTACAGTGACATTCACGTATGCTCCAACTAAG3600TTAGGCAGTGATGAAATCACAGTCATAGTTAAGAAAGAGAACTTCAACACATTAGAGAAG3660ACCTTCCAAATCACAGTATCAGAGCCTGAAATAACTGAAGAGGACATAAATGAGCCCAAG3720CTTGCAATGTCATCACCAGAAGCAAATGCTACCATAGTATCAGTTGAGATGGAGAGTGAG3780GGTGGCGTTAAAAAGACAGTGACAGTGGAAATAACTATAAACGGAACCGCTAATGAGACT3840GCAACAATAGTGGTTCCTGTTCCTAAGAAGGCCGAAAACATCGAGGTAAGTGGAGACCAC3900GTAATTTCCTATAGTATAGAGGAAGGAGAGTACGCCAAGTACGTTATAATTACAGTGAAG3910TTTGCATCACCTGTAACAGTAACTGTTACTTACACTATCTATGCTGGCCCAAGAGTCTCA4020ATCTTGACACTTAACTTCCTTGGCTACTCATGGTACAGACTATATTCACAGAAGTTTGAC4080GAATTGTACCAAAAGGCCCTTGAATTGGGAGTGGACAACGAGACATTAGCTTTAGCCCTC4140AGCTACCATGAAAAAGCCAAAGAGTACTACGAAAAGGCCCTTGAGCTTAGCGAGGGTAAC4200ATAATCCAATACCTTGGAGACATAAGACTATTACCTCCATTAAGACAGGCATACATCAAT4260GAAATGAAGGCAGTTAAGATACTGGAAAAGGCCATAGAAGAATTAGAGGGTGAAGAGTAA4320TCTCCAATTTTTCCCACTTTTTCTTTTATAACATTCCAAGCCTTTTCTTAGCTTCTTCGC4380TCATTCTATCAGGAGTCCATGGAGGATCAAAGGTAAGTTCAACCTCCACATCTCTTACTC4440CTGGGATTTCGAGTACTTTCTCCTCTACAGCTCTAAGAAGCCAGAGAGTTAAAGGACACC4500CAGGAGTTGTCATTGTCATCTTTATATATACCGTTTTGTCAGGATTAATCTTTAGCTCAT4560AAATTAATCCAAGGTTTACAACATCCATCCCAATTTCTGGGTCGATAACCTCCTTTAGCT4620TTTCCAGAATCATTTCTTCAGTAATTTCAAGGTTCTCATCTTTGGTTTCTCTCACAAACC4680CAATTTCAACCTGCCTGATACCTTCTAACTCCCTAAGCTTGTTATATATCTCCAAAAGAG4740TGGCATCATCAATTTTCTCTTTAAA3′4765SEQIDNO8序列长度1398序列类型氨基酸链型单链拓扑学线性分子类型肽序列描述MetAsnLysLysGlyLeuThrValLeuPheIleAlaIleMetLeu51015LeuSerValValProValHisPheValSerAlaGluThrProPro202530ValSerSerGluAsnSerThrThrSerIleLeuProAsnGlnGln354045ValValThrLysGluValSerGlnAlaAlaLeuAsnAlaIleMet505560LysGlyGlnProAsnMetValLeuIleIleLysThrLysGluGly657075LysLeuGluGluAlaLysThrGluLeuGluLysLeuGlyAlaGlu808590IleLeuAspGluAsnArgValLeuAsnMetLeuLeuValLysIle95100105LysProGluLysValLysGluLeuAsnTyrIleSerSerLeuGlu110115120LysAlaTrpLeuAsnArgGluValLysLeuSerProProIleVal125130135GluLysAspValLysThrLysGluProSerLeuGluProLysMet140145150TyrAsnSerThrTrpValIleAsnAlaLeuGlnPheIleGlnGlu155160165PheGlyTyrAspGlySerGlyValValValAlaValLeuAspThr170175180GlyValAspProAsnHisProPheLeuSerIleThrProAspGly185190195ArgArgLysIleIleGluTrpLysAspPheThrAspGluGlyPhe200205210ValAspThrSerPheSerPheSerLysValValAsnGlyThrLeu215220225IleIleAsnThrThrPheGlnValAlaSerGlyLeuThrLeuAsn230235240GluSerThrGlyLeuMetGluTyrValValLysThrValTyrVal245250255SerAsnValThrIleGlyAsnIleThrSerAlaAsnGlyIleTyr260265270HisPheGlyLeuLeuProGluArgTyrPheAspLeuAsnPheAsp275280285GlyAspGlnGluAspPheTyrProValLeuLeuValAsnSerThr290295300GlyAshGlyTyrAspIleAlaTyrValAspThrAspLeuAspTyr305310315AspPheThrAspGluValProLeuGlyGlnTyrAsnValThrTyr320325330AspValAlaValPheSerTyrTyrTyrGlyProLeuAsnTyrVal335340345LeuAlaGluIleAspProAsnGlyGluTyrAlaValPheGlyTrp350355360AspGlyHisGlyHisGlyThrHisValAlaGlyThrValAlaGly365370375TyrAspSerAsnAsnAspAlaTrpAspTrpLeuSerMetTyrSer380385390GlyGluTrpGluValPheSerArgLeuTyrGlyTrpAspTyrThr395400405AsnValThrThrAspThrValGlnGlyValAlaProGlyAlaGln410415420IleMetAlaIleArgValLeuArgSerAspGlyArgGlySerMet425430435TrpAspIleIleGluGlyMetThrTyrAlaAlaThrHisGlyAla440445450AspValIleSerMetSerLeuGlyGlyAsnAlaProTyrLeuAsp455460465GlyThrAspProGluSerValAlaValAspGluLeuThrGluLys470475480TyrGlyValValPheValIleAlaAlaGlyAsnGluGlyProGly485490495IleAsnIleValGlySerProGlyValAlaThrLysAlaIleThr500505510ValGlyAlaAlaAlaValProIleAsnValGlyValTyrValSer515520525GlnAlaLeuGlyTyrProAspTyrTyrGlyPheTyrTyrPhePro530535540AlaTyrThrAsnValArgIleAlaPhePheSerSerArgGlyPro545550555ArgIleAspGlyGluIleLysProAsnValValAlaProGlyTyr560565570GlyIleTyrSerSerLeuProMetTrpIleGlyGlyAlaAspPhe575580585MetSerGlyThrSerMetAlaThrProHisValSerGlyValVal590595600AlaLeuLeuIleSerGlyAlaLysAlaGluGlyIleTyrTyrAsn605610615ProAspIleIleLysLysValLeuGluSerGlyAlaThrTrpLeu620625630GluGlyAspProTyrThrGlyGlnLysTyrThrGluLeuAspGln635640645GlyHisGlyLeuValAsnValThrLysSerTrpGluIleLeuLys650655660AlaIleAsnGlyThrThrLeuProIleValAspHisTrpAlaAsp665670675LysSerTyrSerAspPheAlaGluTyrLeuGlyValAspValIle680685690ArgGlyLeuTyrAlaArgAsnSerIleProAspIleValGluTrp695700705HisIleLysTyrValGlyAspThrGluTyrArgThrPheGluIle710715720TyrAlaThrGluProTrpIleLysProPheValSerGlySerVal725730735IleLeuGluAsnAsnThrGluPheValLeuArgValLysTyrAsp740745750ValGluGlyLeuGluProGlyLeuTyrValGlyArgIleIleIle755760765AspAspProThrThrProValIleGluAspGluIleLeuAsnThr770775780IleValIleProGluLysPheThrProGluAsnAsnTyrThrLeu785790795ThrTrpTyrAspIleAsnGlyProGluMetValThrHisHisPhe800805810PheThrValProGluGlyValAspValLeuTyrAlaMetThrThr815820825TyrTrpAspTyrGlyLeuTyrArgProAspGlyMetPheValPhe830835840ProTyrGlnLeuAspTyrLeuProAlaAlaValSerAsnProMet845850855ProGlyAsnTrpGluLeuValTrpThrGlyPheAsnPheAlaPro860865870LeuTyrGluSerGlyPheLeuValArgIleTyrGlyValGluIle875880885ThrProSerValTrpTyrIleAsnArgThrTyrLeuAspThrAsn890895900ThrGluPheSerIleGluPheAsnIleThrAsnIleTyrAlaPro905910915IleAsnAlaThrLeuIleProIleGlyLeuGlyThrTyrAsnAla920925930SerValGluSerValGlyAspGlyGluPhePheIleLysGlyIle935940945GluValProGluGlyThrAlaGluLeuLysIleArgIleGlyAsn950955960ProSerValProAsnSerAspLeuAspLeuTyrLeuTyrAspSer965970975LysGlyAsnLeuValAlaLeuAspGlyAsnProThrAlaGluGlu980985990GluValValValGluTyrProLysProGlyValTyrSerIleVal99510001005ValHisGlyTyrSerValArgAspGluAsnGlyAsnProThrThr101010151020ThrThrPheAspLeuValValGlnMetThrLeuAspAsnGlyAsn102510301035IleLysLeuAspLysAspSerIleIleLeuGlySerAsnGluSer104010451050ValValValThrAlaAsnIleThrIleAspArgAspHisProThr105510601065GlyValTyrSerGlyIleIleGluIleArgAspAsnGluValTyr107010751080GlnAspThrAsnThrSerIleAlaLysIleProIleThrLeuVal108510901095IleAspLysAlaAspPheAlaValGlyLeuThrProAlaGluGly110011051110ValLeuGlyGluAlaArgAsnTyrThrLeuIleValLysHisAla111511201125LeuThrLeuGluProValProAsnAlaThrValIleIleGlyASn113011351140TyrThrTyrLeuThrAspGluAsnGlyThrValThrPheThrTyr114511501155AlaProThrLysLeuGlySerAspGluIleThrValIleValLys116011651170LysGluAsnPheAsnThrLeuGluLysThrPheGlnIleThrVal117511801185SerGluProGluIleThrGluGluAspIleAsnGluProLysLeu119011951200AlaMetSerSerProGluAlaAsnAlaThrIleValSerValGlu120512101215MetGluSerGluGlyGlyValLysLysThrValThrValGluIle122012251230ThrIleAsnGlyThrAlaAsnGluThrAlaThrIleValValPro123512401245ValProLysLysAlaGluAsnIleGluValSerGlyAspHisVal125012551260IleSerTyrSerIleGluGluGlyGluTyrAlaLysTyrValIle126512701275IleThrValLysPheAlaSerProValThrValThrValThrTyr128012851290ThrIleTyrAlaGlyProArgValSerIleLeuThrLeuAsnPhe129513001305LeuGlyTyrSerTrpTyrArgLeuTyrSerGlnLysPheAspGlu131013151320LeuTyrGlnLysAlaLeuGluLeuGlyValAspAsnGluThrLeu132513301335AlaLeuAlaLeuSerTyrHisGluLysAlaLysGluTyrTyrGlu134013451350LysAlaLeuGluLeuSerGluGlyAsnIleIleGlnTyrLeuGly135513601365AspIleArgLeuLeuProProLeuArgGlnAlaTyrIleAsnGlu137013751380MetLysAlaValLysIleLeuGluLysAlaIleGluGluLeuGlu138513901395GlyGluGluSEQIDNO9序列长度35序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述GGWWSDRRTGTTRRHGTHGCDGTDMTYGACACBGG35SEQIDNO10序列长度32序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述KSTCACGGAACTCACGTDGCBGGMACDGTTGC32SEQIDNO11序列长度33序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述ASCMGCAACHGTKCCVGCHACGTGAGTTCCGTG33SEQIDNO12序列长度34序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述CHCCGSYVACRTGBGGAGWDGCCATBGAVGTDCC34SEQIDNO13序列长度145序列类型核酸链型双链拓扑学线性分子类型其它核酸(PCR片段)序列描述AGTTGCGGTAATTGACACGGGTATAGACGCGAACCACCCCGATCTG46ValAlaValIleAspThrGlyIleAspAlaAsnHisProAspLeu51015AAGGGCAAGGTCATAGGCTGGTACGACGCCGTCAACGGCAGGTCG91LysGlyLysValIleGlyTrpTyrAspAlaValAsnGlyArgSer202530ACCCCCTACGATGACCAGGGACACGGAACTCACGTNGCNGGAACN136ThrProTyrAspAspGlnGlyHisGlyThrHisValAlaGlyThr354045GTTGCTGGT145ValAlaGlySEQIDNO14序列长度564序列类型核酸链型双链拓扑学线性分子类型其它核酸(PCR片段)序列描述TCTCACGGAACTCACGTGGCGGGAACAGTTGCCGGAACAGGCAGC45SerHisGlyThrHisValAlaGlyThrValAlaGlyThrGlySer51015GTTAACTCCCAGTACATAGGCGTCGCCCCCGGCGCGAAGCTCGTC90ValAsnSerGlnTyrIleGIyValAlaProGlyAlaLysLeuVal202530GGTGTCAAGGTTCTCGGTGCCGACGGTTCGGGAAGCGTCTCCACC135GIyValLysValLeuGlyAlaAspGlySerGlySerValSerThr354045ATCATCGCGGGTGTTGACTGGGTCGTCCAGAACAAGGATAAGTAC180IleIleAlaGlyValAspTrpValValGlnAsnLysAspLysTyr505560GGGATAAGGGTCATCAACCTCTCCCTCGGCTCCTCCCAGAGCTCC225GlyIleArgValIleAsnLeuSerLeuGlySerSerGlnSerSer657075GACGGAGCCGACTCCCTCAGTCAGGCCGTCAACAACGCCTGGGAC270AspGlyAlaAspSerLeuSerGlnAlaValAsnAsnAlaTrpAsp808590GCCGGTATAGTAGTCTGCGTCGCCGCCGGCAACAGCGGGCCGAAC315AlaGlyIleValValCysValAlaAlaGlyAsnSerGlyProAsn95100105ACCTACACCGTCGGCTCACCCGCCGCCGCGAGCAAGGTCATAACC360ThrTyrThrValGlySerProAlaAlaAlaSerLysValIleThr110115120GTCGGTGCAGTTGACAGCAACGACAACATCGCCAGCTTCTCCAGC405ValGlyAlaValAspSerAsnAspAsnIleAlaSerPheSerSer125130135AGGGGACCGACCGCGGACGGAAGGCTCAAGCCGGAAGTCGTCGCC450ArgGlyProThrAlaAspGlyArgLeuLysProGluValValAla140145150CCCGGCGTTGACATCATAGCCCCGCGCGCCAGCGGAACCAGCATG495ProGlyValAspIleIleAlaProArgAlaSerGlyThrSerMet155160165GGCACCCCGATAAACGACTACTACACCAAGGCCTCTGGAACCTCA540GlyThrProIleAsnAspTyrTyrThrLysAlaSerGlyThrSer170175180ATGGCCACTCCCCATGTTACCGGT564MetAlaThrProHisValThrGly185SEQIDNO15序列长度1859序列类型核酸链型双链拓扑学线性分子类型基因组DNA最初来源速生执球菌菌株DSM2476序列描述GAGCTCCGACGGAACCGACTCCCTCAGTCAGGCCGTCAACAACGCCTGGGACGCCGGTAT60AGTAGTCTGCGTCGCCGCCGGCAACAGCGGGCCGAACACCTACACCGTCGGCTCACCCGC120CGCCGCGAGCAAGGTCATAACCGTCGGTGCAGTTGACAGCAACGACAACATCGCCAGCTT180CTCCAGCAGGGGACCGACCGCGGACGGAAGGCTCAAGCCGGAAGTCGTCGCCCCCGGCGT240TGACATCATAGCCCCGCGCGCCAGCGGAACCAGCATGGGCACCCCGATAAACGACTACTA300CACCAAGGCCTCTGGAACCAGCATGGCCACCCCGCACGTTTCGGGCGTTGGCGCGCTCAT360CCTCCAGGCCCACCCGAGCTGGACCCCGGACAAGGTGAAGACCGCCCTCATCGAGACCGC420CGACATAGTCGCCCCCAAGGAGATAGCGGACATCGCCTACGGTGCGGGTAGGGTGAACGT480CTACAAGGCCATCAAGTACGACGACTACGCCAAGCTCACCTTCACCGGCTCCGTCGCCGA540CAAGGGAAGCGCCACCCACACCTTCGACGTCAGCGGCGCCACCTTCGTGACCGCCACCCT600CTACTGGGACACGGGCTCGAGCGACATCGACCTCTACCTCTACGACCCCAACGGGAACGA660GGTTGACTACTCCTACACCGCCTACTACGGCTTCGAGAAGGTCGGCTACTACAACCCGAC720CGCCGGAACCTGGACGGTCAAGGTCGTCAGCTACAAGGGCGCGGCGAACTACCAGGTCGA780CGTCGTCAGCGACGGGAGCCTCAGCCAGTCCGGCGGCGGCAACCCGAATCCAAACCCCAA840CCCGAACCCAACCCCGACCACCGACACCCAGACCTTCACCGGTTCCGTTAACGACTACTG900GGACACCAGCGACACCTTCACCATGAACGTCAACAGCGGTGCCACCAAGATAACCGGTGA960CCTGACCTTCGATACTTCCTACAACGACCTCGACCTCTACCTCTACGACCCCAACGGCAA1020CCTCGTTGACAGGTCCACGTCGAGCAACAGCTACGAGCACGTCGAGTACGCCAACCCCGC1080CCCGGGAACCTGGACGTTCCTCGTCTACGCCTACAGCACCTACGGCTGGGCGGACTACCA1140GCTCAAGGCCGTCGTCTACTACGGGTGAAGGTTTTTAATCCCCTTTTCTTTCCCCTTTTG1200AGGTGGTTGGGATGAAGCGGGTTCTTGCGGCGATCCTTGTAATCATGCTCATCGGATTAT1260CATTCCCTGCCGGAAGTGCTAAAATCGAGCCCTACGTTTACAGCCCCACCGTTCCGGATA1320CCGCCTTCGCGGTTCTCACCCTGTACAGGACCGGGGACTACGCCCGGGTTCTCGAGGGAT1380ACGAGTGGCTCCTCCAGATGAGAACTCCCATCGATTCGTGGGGGGTTTCCCGCGGGGAAA1440CGCACATGGCCAAGTACACGGCAATGGCGATGCTGGCCCTCATGCGCGGCGAGAACGTGG1500CGAGGGGGCGTTACAGGGATGTTCTCAACGACGCCGCGTACTGGTTAATATACAAACAGA1560ACCCGGACGGCTCGTGGGAGGACTACACCGGAACGGCGCTGGCCGTCATCGCGCTCGGGG1620AGTTCCTTAAGGGCGGGTACATCAACGCGAACCTGACCGGCTTCAAAAAGCAGGTTAAAG1680AGGCCGTAAACCGCGGGGAAGGCTGGCTGATGGATGCGGACCCAAAAACGGACGCGGATA1740GAATATTCGGCTACCTCGCCCTCGGTAAAAAGGACGAACTCAAAAAGATGAACCCTTCCG1800GTGACCTGAAGGCCTACCGCGCCTTTGCACTTGCCTACCTCGGGGAGAGGGTCGAGCTCü@1859SEQIDNO16序列长度20序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述TGTAGTAGTCGTTTATCGGG20SEQIDNO17序列长度1464序列类型核酸链型双链拓扑学线性分子类型基因组DNA序列描述AAGCTTAACATCGAGCGCTCCACCTCTAAAGTAGGTGAGTGTGGATACGAAGGTTAGGGC60CGCTATGACGACCTTCAGGATCCCAACGGCTTCTTTTATGGGGAGCCCGGCGAAGGTGAG120AATTGAAAGGATTACCATACTCCCTCCGCTCATCATGGAGCCTATGAATCCCCCTCCAAA180AGAGAGAAGTGCTATAAGGAGCGTCCTCATGTTCCATGCTATGTTTTGGTATTTAATGCT240TTTCCGCTTAATGTTACACCTCCTCATGACAATTTCGCGTTTAGGGATGGGGTTAATTGG300ACCCCTCCGAGCCACGGGTTGATGTCCATTATGTCGATATTCACCATCTTATCCCCAACT360TTGTGGGTTTCAAACATTACCCTACGTTATATTTTTATCGTCCTAATTAACTGCTGAAAC420GGGCGCTTATCGTTCATCGTTGATGGTTTTGGGTGACCGGGCATTAAGGAATTGTGTCGT480TTGCTGAAATTTATGAAACGGAGTTGGCTTCTTTATGTTACATAAAGATGTACATTACTG540TAATGTATATAAATGGAAGAAACACTGTTGCGTAAACTTTTTAATGTATCCAATATCAGT600ACTTCGATGTCCCGATATGGGACATGTTGGATAGGAGGGTACTGGAATGAAGAGGTTAGG660TGCTGTGGTGCTGGCACTGGTGCTCGTGGGTCTTCTGGCCGGAACGGCCCTTGCGGCACC720CGTAAAACCGGTTGTCAGGAACAACGCGGTTCAGCAGAAGAACTACGGACTGCTGACCCC780GGGACTGTTCAAGAAAGTCCAGAGGATGAACTGGAACCAGGAAGTGGACACCGTCATAAT840GTTCGGGAGCTACGGAGACAGGGACAGGGCGGTTAAGGTACTGAGGCTCATGGGCGCCCA900GGTCAAGTACTCCTACAAGATAATCCCTGCTGTCGCGGTTAAAATAAAGGCCAGGGACCT360TCTGCTGATCGCGGGCATGATAGACACGGGTTACTTCGGTAACACAAGGGTCTCGGGCAT1020AAAGTTCATACAGGAGGATTACAAGGTTCAGGTTGACGACGCCACTTCCGTCTCCCAGAT1080AGGGGCCGATACCGTCTGGAACTCCCTCGGCTACGACGGAAGCGGTGTGGTGGTTGCCAT1140CGTCGATACGGGTATAGACGCGAACCACCCCGATCTGAAGGGCAAGGTCATAGGCTGGTA1200CGACTCCGTCAACGGCAGGTCGACCCCCTACGATGACCAGGGACACGGAACCCACGTTGC1260GGGTATCGTTGCCGGAACCGGGAGCGTTAACTCCCAGTACATAGGCGTCGGCCCCGGCGC1320GAAGCTCGTCGGCGTCAAGGTTCTCGGTTCCGACGGTTCGGGAAGCGTCTCCACCATCAT1380CGCGGGTGTTGACTGGAACGTCCAGAACTAGGACAAGTACGGGATAAGGGTCATCAACCT1440CTCCCTCGGCTCCTCCCAGAGCTC1464SEQIDNO18序列长度33序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述AAAAGAATTCGGATCCATGAAGAGGTTAGGTGC33SEQIDNO19序列长度28序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述TTTTATCGATCAGGCGTCCCAGGCGTTG28SEQIDNO20序列长度22序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述CATTATAGGTAAGAGAGGAATG22SEQIDNO21序列长度30序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述GATCCATTCCTCTCTTACCTATAATGGTAC30SEQIDNO22序列长度19序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述TAGCAGTAATTGACACGGG19SEQIDNO23序列长度19序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述TAGCAGTAATTGACACTGG19SEQIDNO24序列长度22序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述CTGTTCCAGCTACGTGAGTTCC22SEQIDNO25序列长度22序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述CTGTTCCAGCTACATGAGTTCC22SEQIDNO26序列长度507序列类型核酸链型双链拓扑学线性分子类型基因组DNA最初来源激烈热球菌菌株DSM3638序列描述ACTAGTCATCTCAGGTTTAACAGGGGGTAAAGCTAAGCTTTCAGGT46LeuValIleSerGlyLeuThrGlyGlyLysAlaLysLeuSerG1y51015GTTAGGTTTATCCAGGAAGACTACAAAGTTACAGTTTCAGCAGAA91ValArgPheIleGlnGluAspTyrLysValThrValSerAlaGlu202530TTAGAAGGACTGGATGAGTCTGCAGCTCAAGTTATGGCAACTTAC136LeuGluGlyLeuAspGluSerAlaAlaGlnValMetAlaThrTyr354045GTTTGGAACTTGGGATATGATGGTTCTGGAATCACAATAGGAATA181ValTrpAsnLeuGIyTyrAspGIySerGlyIleThrIleGlyIle50505560ATTGAGACTGGAATTGACGCTTCTCATCCAGATCTCCAAGGAAAA226IleAspThrGlyIleAspAlaSerHisProAspLeuGlnGlyLys75657075GTAATTGGGTGGGTAGATTTTGTCAATGGTAGGAGTTATCCATAC271ValIleGlyTrpValAspPheValAsnGlyArgSerTyrProTyr90808590GATGACCATGGACATGGAACTCATGTAGCTTCAATAGCAGCTGGT316AspAspHisGlyHisGlyThrHisValAlaSerIleAlaAlaGly10595100105ACTGGAGCAGCAAGTAATGGCAAGTACAAGGGAATGGCTCCAGGA361ThrGlyAlaAlaSerAsnGlyLysTyrLysGlyMetAlaProGly120110115120GCTAAGCTGGCGGGAATTAAGGTTCTAGGTGCCGATGGTTCTGGA40683AlaLysLeuAlaGlyIleLysValLeuGlyAlaAspGlySerGly135125130135AGCATATCTACTATAATTAAGGGAGTTGAGTGGGCCGTTGATAAC451SerIleSerThrIleIleLysGlyValGluTrpAlaValAspAsn150140145150AAAGATAAGTACGGAATTAAGGTCATTAATCTTTCTCTTGGTTCA496LysAspLysTyrGlyIleLysValIleAsnLeuSerLeuGlySer165155160165AGCCAGAGCTC507SerGlnSer168SEQIDNO27序列长度30序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述TGACACTGGAATTGACGCTTCTCATCCAGA30SEQIDNO28序列长度30序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述TCTCCAAGGAAAAGTAATTGGGTGGGTAGA30SEQIDNO29序列长度30序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述GTTGCCATAACTTGAGCTGCAGACTCATCC30SEQIDNO30序列长度420序列类型核酸链型双链拓扑学线性分子类型其它核酸(PCR片段)序列描述TTTATTAAGCATAAAATAGCCATGCAACTTTGATCACTAATGTGCGGTGGTGCACATG59MetAAGGGGCTGAAAGCTCTCATATTAGTGATTTTAGTTCTAGGTTTG104LysGlyLeuLysAlaLeuIleLeuValIleLeuValLeuGlyLeu51015GTAGTAGGGAGCGTAGCGGCAGCTCCAGAGAAGAAAGTTGTTCAA149ValValGlySerValAlaAlaAlaProGluLysLysValValGln202530GTAAGAAATGTTGAGAAGAACTATGGTCTGCTAACGCCAGGACTG194ValArgAsnValGluLysAsnTyrGlyLeuLeuThrProGIyLeu354045TTCAGAAAAATTCCCAAATTGGATCCTAACGAGGGAATCAGCACA239PheArgLysIleProLysLeuAspProAsnGluGlyIleSerThr505560GTAATTGTATTTGTTAACCATAGGGGAAAAGAAATTGCAGTAAGA284ValIleValPheValAsnHisArgGlyLysGluIleAlaValArg657075GTTCTTGAGTTAATGGGTGCCCAAGTTAGGTATGTGTACCATATT329ValLeuGluLeuMetGlyAlaGlnValArgTyrValTyrHisIle808590ATACCCCCAATAGCTGCCGATCTTAAGGTTAGAGACTTACTAGTC374IleProProIleAlaAlaAspLeuLysValArgAspLeuLeuVal95100105ATCTCAGGTTTAACAGGGGGTGAAACTAAGCTTTCAGGTGTTAGGT420IleSerGlyLeuThrGlyGlyGluThrLysLeuSerGlyValArg110115120SEQIDNO31序列长度420序列类型核酸链型双链拓扑学线性分子类型其它核酸(PCR片段)序列描述GCTCTAGACTCTGGGAGGAGTAGTTATACTTGATGAAGCCTATTCTGAGTTTTCGGGAAA60AAGCTTCATACCAAAAATCAGTGAGTATGAAAATTTAGTAATTCTAAGGACGTTTTCAAA120GGCGTTTGGACTTGCTGGAATTAGATGTGGATATATGATAGCAAATGAAAAGATTATAGA180SEQIDNO32序列长度28序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述AGAGGGATCCATGAAGGGGCTGAAAGCT28SEQIDNO33序列长度28序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述AGAGGCATGCGCTCTAGACTCTGGGAGAGT28SEQIDNO34序列长度1962序列类型核酸链型双链拓扑学线性分子类型基因组DNA最初来源激烈热球菌菌株DSM3638序列描述ATGAAGGGGCTGAAAGCTCTCATATTAGTGATTTTAGTTCTAGGTTTGGTAGTAGGGAGC60GTAGCGGCAGCTCCAGAGAAGAAAGTTGAACAAGTAAGAAATGTTGAGAAGAACTATGGT120CTGCTAACGCCAGGACTGTTCAGAAAAATTCAAAAATTGAATCCTAACGAGGAAATCAGC180ACAGTAATTGTATTTGAAAACCATAGGGAAAAAGAAATTGCAGTAAGAGTTCTTGAGTTA240ATGGGTGCAAAAGTTAGGTATGTGTACCATATTATACCCGCAATAGCTGCCGATCTTAAG300GTTAGAGACTTACTAGTCATCTCAGGTTTAACAGGGGGTAAAGCTAAGCTTTCAGGTGTT360AGGTTTATCCAGGAAGACTACAAAGTTACAGTTTCAGCAGAATTAGAAGGACTGGATGAG420TCTGCAGCTCAAGTTATGGCAACTTACGTTTGGAACTTGGGATATGATGGTTCTGGAATC480ACAATAGGAATAATTGACACTGGAATTGACGCTTCTCATCCAGATCTCCAAGGAAAAGTA540ATTGGGTGGGTAGATTTTGTCAATGGTAGGAGTTATCCATACGATGACCATGGACATGGA600ACTCATGTAGCTTCAATAGCAGCTGGTACTGGAGCAGCAAGTAATGGCAAGTACAAGGGA660ATGGCTCCAGGAGCTAAGCTGGCGGGAATTAAGGTTCTAGGTGCCGATGGTTCTGGAAGC720ATATCTACTATAATTAAGGGAGTTGAGTGGGCCGTTGATAACAAAGATAAGTACGGAATT780AAGGTCATTAATCTTTCTCTTGGTTCAAGCCAGAGCTCAGATGGTACTGACGCTCTAAGT840CAGGCTGTTAATGCAGCGTGGGATGCTGGATTAGTTGTTGTGGTTGCCGCTGGAAACAGT900GGACCTAACAAGTATACAATCGGTTCTCCAGCAGCTGCAAGCAAAGTTATTACAGTTGGA960GCCGTTGACAAGTATGATGTTATAACAAGCTTCTCAAGCAGAGGGCCAACTGCAGACGGC1020AGGCTTAAGCCTGAGGTTGTTGCTCCAGGAAACTGGATAATTGCTGCCAGAGCAAGTGGA1080ACTAGCATGGGTCAACCAATTAATGACTATTACACAGCAGCTCCTGGGACATCAATGGCA1140ACTCCTCACGTAGCTGGTATTGCAGCCCTCTTGCTCCAAGCACACCCGAGCTGGACTCCA1200GACAAAGTAAAAACAGCCCTCATAGAAACTGCTGATATCGTAAAGCCAGATGAAATAGCC1260GATATAGCCTACGGTGCAGGTAGGGTTAATGCATACAAGGCTATAAACTACGATAACTAT1320GCAAAGCTAGTGTTCACTGGATATGTTGCCAACAAAGGCAGCCAAACTCACCAGTTCGTT1380ATTAGCGGAGCTTCGTTCGTAACTGCCACATTATACTGGGACAATGCCAATAGCGACCTT1440GATCTTTACCTCTACGATCCCAATGGAAACCAGGTTGACTACTCTTACACCGCCTACTAT1500GGATTCGAAAAGGTTGGTTATTACAACCCAACTGATGGAACATGGACAATTAAGGTTGTA1560AGCTACAGCGGAAGTGCAAACTATCAAGTAGATGTGGTAAGTGATGGTTCCCTTTCACAG1620CCTGGAAGTTCACCATCTCCACAACCAGAACCAACAGTAGACGCAAAGACGTTCCAAGGA1680TCCGATCACTACTACTATGACAGGAGCGACACCTTTACAATGACCGTTAACTCTGGGGCT1740ACAAAGATTACTGGAGACCTAGTGTTTGACACAAGCTACCATGATCTTGACCTTTACCTC1800TACGATCCTAACCAGAAGCTTGTAGATAGATCGGAGAGTCCCAACAGCTACGAACACGTA1860GAATACTTAACCCCCGCCCCAGGAACCTGGTACTTCCTAGTATATGCCTACTACACTTAC1920GGTTGGGCTTACTACGAGCTGACGGCTAAAGTTTATTATGGC1962SEQIDNO35序列长度654序列类型氨基酸链型单链拓扑学线性分子类型肽序列描述MetLysGlyLeuLysAlaLeuIleLeuValIleLeuValLeuGly51015LeuValValGlySerValAlaAlaAlaProGluLysLysValGlu202530GlnValArgAsnValGluLysAsnTyrGlyLeuLeuThrProGly354045LeuPheArgLysIleGlnLysLeuAsnProAsnGluGluIleSer505560ThrValIleValPheGluAsnHisArgGluLysGluIleAlaVal657075ArgValLeuGluLeuMetGlyAlaLysValArgTyrValTyrHis808590IleIleProAlaIleAlaAlaAspLeuLysValArgAspLeuLeu95100105ValIleSerGlyLeuThrGlyGlyLysAlaLysLeuSerGlyVal110115120ArgPheIleGlnGluAspTyrLysValThrValSerAlaGluLeu125130135GluGlyLeuAspGluSerAlaAlaGlnValMetAlaThrTyrVal140145150TrpAsnLeuGlyTyrAspGlySerGlyIleThrIleGlyIleIle155160165AspThrGlyIleAspAlaSerHisProAspLeuGlnGlyLysVal170175180IleGlyTrpValAspPheValAsnGlyArgSerTyrProTyrAsp185190195AspHisGlyHisGlyThrHisValAlaSerIleAlaAlaGlyThr200205210GlyAlaAlaSerAsnGlyLysTyrLysGlyMetAlaProGlyAla215220225LysLeuAlaGlyIleLysValLeuGlyAlaAspGlySerGlySer230235240IleSerThrIleIleLysGlyValGluTrpAlaValAspAsnLys245250255AspLysTyrGlyIleLysValIleAsnLeuSerLeuGlySerSer260265270GlnSerSerAspGlyThrAspAlaLeuSerGlnAlaValAsnAla275280285AlaTrpAspAlaGlyLeuValValValValAlaAlaGlyAsnSer290295300GlyProAsnLysTyrThrIleGlySerProAlaAlaAlaSerLys305310315ValIleThrValGlyAlaValAspLysTyrAspValIleThrSer320325330PheSerSerArgGlyProThrAlaAspGlyArgLeuLysProGlu335340345ValValAlaProGlyAsnTrpIleIleAlaAlaArgAlaSerGly350355360ThrSerMetGlyGlnProIleAsnAspTyrTyrThrAlaAlaPro365370375GlyThrSerMetAlaThrProHisValAlaGlyIleAlaAlaLeuAspHisGlyHisGlyThrHisValAlaSerIleAlaAlaGlyThr200205210GlyAlaAlaSerAsnGlyLysTyrLysGlyMetAlaProGlyAla215220225LysLeuAlaGlyIleLysValLeuGlyAlaAspGlySerGlySer230235240IleSerThrIleIleLysGlyValGluTrpAlaValAspAsnLys245250255AspLysTyrGlyIleLysValIleAsnLeuSerLeuGlySerSer260265270GlnSerSerAspGlyThrAspAlaLeuSerGlnAlaValAsnAla275280285AlaTrpAspAlaGlyLeuValValValValAlaAlaGlyAsnSer290295300GlyProAsnLysTyrThrIleGlySerProAlaAlaAlaSerLys305310315ValIleThrValGlyAlaValAspLysTyrAspValIleThrSer320325330PheSerSerArgGlyProThrAlaAspGlyArgLeuLysProGlu335340345ValValAlaProGlyAsnTrpIleIleAlaAlaArgAlaSerGly350355360ThrSerMetGlyGlnProIleAsnAspTyrTyrThrAlaAlaPro365370375GlyThrSerMetAlaThrProHisValAlaGlyIleAlaAlaLeu380385390LeuLeuGlnAlaHisProSerTrpThrProAspLysValLysThr395400405AlaLeuIleGluThrAlaAspIleValLysProAspGluIleAla10415420AspIleAlaTyrGlyAlaGlyArgValAsnAlaTyrLysAlaIle425430435AsnTyrAspAsnTyrAlaLysLeuValPheThrGlyTyrValAla440445450AsnLysGlySerGlnThrHisGlnPheValIleSerGlyAlaSer455460465PheValThrAlaThrLeuTyrTrpAspAsnAlaAsnSerAspLeu470475480AspLeuTyrLeuTyrAspProAsnGlyAsnGlnValAspTyrSer485490495TyrThrAlaTyrTyrGlyPheGluLysValGlyTyrTyrAsnPro500505510ThrAspGlyThrTrpThrIleLysValValSerTyrSerGlySer515520525AlaAsnTyrGlnValAspValValSerAspGlySerLeuSerGln530535540ProGlySerSerProSerProGlnProGluProThrValAspAla545550555LysThrPheGlnGlySerAspHisTyrTyrTyrAspArgSerAsp560565570ThrPheThrMetThrValAsnSerGlyAlaThrLysIleThrGly575580585AspLeuValPheAspThrSerTyrHisAspLeuAspLeuTyrLeu590595600TyrAspProAsnGlnLysLeuValAspArgSerGluSerProAsn605610615SerTyrGluHisValGluTyrLeuThrProAlaProGlyThrTrp620625630TyrPheLeuValTyrAlaTyrTyrThrTyrGlyTrpAlaTyrTyr635640645GluLeuThrAlaLysValTyrTyrGly650SEQIDNO36序列长度25序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述TCTGAATTCGTTCTTTTCTGTATGGü@25SEQIDNO37序列长度25序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述TGTACTGCTGGATCCGGCAGü@20SEQIDNO38序列长度80序列类型核酸链型双链拓扑学线性分子类型基因组DNA最初来源激烈热球菌菌株DSM3638序列描述GGATCCATCAGATTTTTGAGTGTAGATCAACCAGTATGCTGCATTTGTAATTGTGAGATA60ATATCTCCCGCGGGTAAGGT80SEQIDNO39序列长度30序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述AGAGGCATGCGTATCCATCAGATTTTTGAG30SEQIDNO40序列长度20序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述AGTGAACGGATACTTGGAAC20SEQIDNO41序列长度20序列类型核酸链型单链拓扑学线性分子类型其它核酸(合成DNA)序列描述GTTCCAAGTATCCGTTCACT20SEQIDNO42序列长度12序列类型氨基酸链型单链拓扑学线性分子类型肽序列描述AlaGluLeuGluGlyLeuAspGluSerAlaAlaGln510权利要求1.具有序列表中SEQIDNO.1表示的氨基酸序列的超耐热蛋白酶或其功能等价物。2.编码权利要求l中定义的超耐热蛋白酶或其功能等价物的超耐热蛋白酶基因。3.根据权利要求2的超耐热蛋白酶基因,其具有序列表中的SEQIDNO.2所表示的核苷酸序列。4.根据权利要求2的超耐热蛋白酶基因,其与权利要求3中定义的超耐热蛋白酶基因杂交。5.具有序列表中SEQIDNO.3表示的氨基酸序列的超耐热蛋白酶或其功能等价物。6.编码权利要求5中定义的超耐热蛋白酶或其功能等价物的超耐热蛋白酶基因。7.根据权利要求6的超耐热蛋白酶基因,其具有序列表中的SEQIDNO.4所代表的核苷酸序列8.根据权利要求6的超耐热蛋白酶基因,其与权利要求7中定义的超耐热蛋白酶基因杂交9.具有序列表中的SEQIDNO.5所表示的氨基酸序列的超耐热蛋白酶或其功能等价物。10.编码权利要求9中定义的超耐热蛋白酶或其功能等价物的超耐热蛋白酶基因。l1.根据权利要求10的超耐热蛋白酶基因,其具有序列表中的SEQIDNO.6所代表的核苷酸序列。12.根据权利要求10的超耐热蛋白酶基因,其与根据权利要求11的超耐热蛋白酶基因杂交。13.用于制备超耐热蛋白酶的方法,其中包括培养含有权利要求2-4、6-8和l0-l2中定义的任一超耐热蛋白酶基因的转化子,然后从培养物中收获超耐热蛋白酶。全文摘要具有SEQIDNO∶1、3或5中描述的氨基酸序列的超耐热蛋白酶或其功能等价物;编码相同蛋白酶的超耐热蛋白酶基因;和通过培养含有这些基因的转化子制备超耐热蛋白酶的方法。文档编号C12N15/57GK1189188SQ96192260公开日1998年7月29日申请日期1996年11月7日优先权日1995年12月12日发明者高藏晃,森下三保,山本克彦,三田正范,浅田起代藏,纲泽进,加藤郁之进申请人:宝酒造株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1