表达超热稳定蛋白酶的系统的制作方法

文档序号:452801阅读:609来源:国知局
专利名称:表达超热稳定蛋白酶的系统的制作方法
技术领域
本发明涉及一种在工业应用中作为酶使用的超热稳定蛋白酶,编码该酶的基因以及通过遗传工程技术产生该酶的方法。
背景技术
蛋白酶是一种切割蛋白中肽键的酶。许多上述酶已在动物、植物和微生物中发现。蛋白酶可作为实验室使用的试剂和作为药物以及在工业领域,如作为添加剂用于去垢剂,用于处理食品及用于利用逆反应进行化学合成。因此,可以说该蛋白酶是工业上极其重要的酶。由于用于工业领域的蛋白酶需要高度的物理和化学稳定性,在其它酶类中热稳定酶是优选使用的。因为芽孢杆菌属的细菌产生的蛋白酶表现为相对高的热稳定性,它们主要作为工业用途的蛋白酶。然而,在寻找更为优异的酶中,想方设法从高温下生长的微生物中获得该酶,例如,从芽孢杆菌属的嗜热细菌或超嗜热菌中获得。
例如,熟知的超嗜热菌激烈热球菌产生一种蛋白酶(应用环境微生物学,561992-1998(1990);FEMS微生物学通讯,7117-20(1990);遗传微生物学杂志,1371193-1199(1991))。
此外,据报道嗜热菌热球菌属菌株KOD1产生一种硫醇基蛋白酶(半胱氨酸蛋白酶)(应用环境微生物学,604559-4566(1994))。也已知超嗜热菌热球菌属、葡萄嗜热菌属、栖热拟芽孢杆菌属产生蛋白酶(应用微生物学生物技术,34715-719(1991))。
如上面描述的来自嗜热菌的蛋白酶具有高度热稳定性。因此,可预计它们可用于代替目前正使用的热稳定蛋白酶或用于还未考虑使用蛋白酶的领域。
然而,大部分产生这些酶的微生物仅在高温下生长。例如,激烈热球菌需要在90-100℃培养。在上述高温下培养从能量消耗的角度看是不利的。此外,来自超嗜热菌的蛋白酶生产力比常规微生物蛋白酶的生产力低。所以,工业上从超嗜热菌产生蛋白酶的方法存在问题。
另外,用遗传工程技术通过分离目的酶的基因并将其导入到容易培养的宿主微生物中产生该酶的方法,是本领域目前的常规方法。然而,该酶的基因导入到宿主中并不总是如预期的那样有效地表达。据信主要原因是导入基因的GC含量或密码子使用与宿主的基因不同。
因此,需要对导入的每个基因和/或每个宿主优化表达方法,以便达到符合设计用途的酶的合适生产力。
本发明的目的本发明的目的是提供工业使用有利的来自超嗜热菌的蛋白酶,从该超嗜热菌中分离编码该蛋白酶的基因和提供利用该基因通过遗传工程技术产生超热稳定性蛋白酶的方法,以便解决上面所述的问题。
本发明概述由超嗜热菌产生的蛋白酶中,一些种类根据其氨基酸序列的同源性分类为枯草杆菌蛋白酶型碱性蛋白酶。当编码该蛋白酶的基因被导入到枯草芽孢杆菌中时(枯草芽孢杆菌一般通过遗传工程技术用于生产),该酶的生产力比由枯草芽孢杆菌内源产生的蛋白的生产力更低。
本发明者经深入的研究并发现,通过把编码来源于枯草杆菌蛋白酶信号肽的基因(信号序列)置于来源于超嗜热菌待表达的蛋白酶基因的上游,然后修饰切割位点周围的氨基酸序列,该目的基因将在枯草芽孢杆菌中高效表达。此外,还发现通过把来源于目的超嗜热菌的蛋白酶基因中酶活性非必需的部分缺失、可增加所述的酶的表达水平。至此,完成了本发明。
本发明概括如下。本发明的第一个发明是一种具有由序列表SEQ IDNO1给出的氨基酸序列的热稳定蛋白酶和一种具有如下氨基酸序列及热稳定蛋白酶活性的蛋白酶,在该氨基酸序列中,一个或几个氨基酸残基被缺失、替换、插入或添加到序列表SEQ ID NO1给出的氨基酸序列中形成。
本发明的第二个发明是一种编码第一个发明的热稳定蛋白酶的基因和一种能与该基因杂交的热稳定蛋白酶基因。
本发明的第三个发明是通过遗传工程技术将来源于超嗜热菌的基因用于生产热稳定蛋白酶,其特征是该基因编码如通式I表示的氨基酸序列SIG-Ala-Gly-Gly-Asn-PRO [I]其中,SIG代表来源于枯草杆菌蛋白酶信号肽的氨基酸序列,PRO代表待表达的蛋白的氨基酸序列。优选地是,SIG是由序列表SEQ IDNO3给出的氨基酸序列。优选地是,PRO是来源于超嗜热菌的超热稳定蛋白酶的氨基酸序列,更优选地是,来源于激烈热球菌的蛋白酶的氨基酸序列。
本发明的第四个发明涉及一种通过遗传工程技术产生蛋白质的方法,其特征在于该方法包括培养已导入第三个发明的基因的芽孢杆菌属细菌,然后从培养物中收集目的蛋白。
本发明的第五个发明是用于通过遗传工程技术生产蛋白的一种质粒,其特征在于第三个发明的基因已插入到质粒中。
在氨基酸序列中一个至几个氨基酸残基诸如缺失、替换、插入或添加的突变,可在天然产生的蛋白及由本发明披露的蛋白中产生。上述突变可能由于编码该蛋白的基因的多态性或突变产生,或者由于蛋白的体内修饰或合成后纯化过程中产生。不过,已知上述突变蛋白表现的生理学和生物学活性与未突变的蛋白相等。这可用于如下蛋白中,在该蛋白中上述突变已人为地导入到其氨基酸序列中,在该情况下,可能产生大量的各种突变。例如,众所周知的在人白介素-2(IL-2)的氨基酸序列中的半胱氨酸残基被丝氨酸残基替换的多肽仍保持白介素-2的活性(科学,2241431(1984))。因此,具有在本发明披露的氨基酸序列中一个或几个氨基酸残基缺失、替换、插入或添加而形成的氨基酸序列及其蛋白酶活性与本发明的蛋白酶相等的蛋白酶也在本发明的范围之内。
至于本文所用的“(与特定的基因)杂交的基因”是一种具有的碱基序列与特定基因的序列相似的基因。有可能具有的碱基序列与特定基因的序列相似的基因编码一种具有氨基酸序列的蛋白,其功能与由特定基因编码的蛋白相似。基因碱基序列的相似性可通过在严格条件下确定基因或其部分互相之间是否形成杂交体(杂交)而检查出来。通过使用该方法,能获得所编码的蛋白与特定基因编码的蛋白具有相似功能的基因。这就是说具有与本发明的基因的碱基序列相似的基因可通过使用本发明获得的基因或其部分作为探针,按照熟知的方法进行杂交而获得。杂交可按如下方法进行,例如,T.Maniatis等编著,分子克隆实验室手册第二版,冷泉港实验室出版,1989,书中所描述的方法。更具体而言,杂交在下列条件下进行。简言之,固定有DNAs的杂交膜在含有0.5%SDS,0.1%牛血清白蛋白(BSA),0.1%聚乙烯吡咯烷酮,0.1%Ficoll 400,0.01%变性鲑精DNA的6×SSC(1×SSC表示为0.15MNaCl,0.015M柠檬酸钠,pH7.0)中,和探针在50℃温育12-20小时。温育后,洗涤杂交膜直到固定的DNAs信号与背景能区别为止,开始洗涤在含0.5%SDS的2×SSC中37℃下进行,然后降低SSC浓度至0.1×和提高温度至50℃。
另外,作为杂交的替代方法,可应用基因扩增方法(如,PCR方法),该法用本发明获得的基因的部分碱基序列作为引物。因此所获得的基因是否编码具有目的功能的蛋白,能通过利用合适的宿主和合适的表达系统表达该基因,然后检查所得到蛋白的活性的方法确定。
附图简述

图1是质粒pSTC 3的限制性酶图谱。
图2比较了蛋白酶PFUS、蛋白酶TCES和枯草杆菌蛋白酶的氨基酸序列。
图3比较了蛋白酶PFUS、蛋白酶TCES和枯草杆菌蛋白酶的氨基酸序列。
图4比较了蛋白酶PFUS、蛋白酶TCES和枯草杆菌蛋白酶的氨基酸序列。
图5比较了蛋白酶PFUS、蛋白酶TCES和枯草杆菌蛋白酶的氨基酸序列。
图6是质粒pSNP 1的限制性酶切图谱。
图7是质粒pPS 1的限制性酶切图谱。
图8是质粒pNAPS 1的限制性酶切图谱。
发明详述根据本发明的超热稳定蛋白酶包括来自各种超嗜热菌的蛋白酶。例如,WO 95/34645描述的来自激烈热球菌和速生热球菌的蛋白酶。
来自激烈热球菌DSM 3638的蛋白酶基因是从该菌株的基因组DNA文库中,根据表达热稳定蛋白酶活性而分离得到。含有该基因的质粒被命名为质粒pTPR 12。用该质粒转化的大肠杆菌JM 109被命名并且表示为大肠杆菌JM 109/pTPR 12,于1994年5月24日(最初保藏日期)根据布达佩斯条约保藏在日本茨城县筑波市东1丁目1番3号,通商产业省工业技术院生命工学和人体技术研究所,登记号FERM BP-5103。
该蛋白酶下文命名为蛋白酶PFUL。蛋白酶PFUL是一种具有高度热稳定性并且甚至在95℃下也表现蛋白酶活性的蛋白酶。
已经测定了来源于激烈热球菌插入到质粒pTPR 12的DNA片段的碱基序列。在该DNA片段中以2个DraI位点为边界大约4.8kb的部分碱基序列插入到质粒pTPR 12中,在序列表SEQ ID NO5中显示。此外,根据碱基序列推导的基因产物的氨基酸序列在序列表SEQ IDNO6中显示。换言之,在序列表SEQ ID NO6中显示的氨基酸序列是蛋白酶PFUL的氨基酸序列。如在序列中显示的那样,蛋白酶PFUL由1398个氨基酸残基组成,是一种超过150,000的高分子量蛋白酶。
将序列表SEQ ID NO6中显示的蛋白酶PFUL的氨基酸序列与熟知的来源于微生物的蛋白酶的氨基酸序列进行比较显示,蛋白酶PFUL的第一个半部分的氨基酸序列与以枯草杆菌蛋白酶为代表的系列碱性丝氨酸蛋白酶有同源性(蛋白工程,4719-737(1991)),所存在的大约4个氨基酸残基的极其高度同源性据信对蛋白酶的催化活性是重要的。
如上所述,发现来源于嗜温菌的蛋白酶中的共同区域在由超嗜热菌激烈热球菌产生的蛋白酶PFUL的氨基酸序列中是保守的。因此,可预期由不是激烈热球菌的超嗜热菌产生的同源蛋白酶也具有该区域。
例如进行PCR能筛选出编码超热稳定蛋白酶的基因,用来自各种超嗜热菌的染色体DNA作为模板,寡核苷酸PRO-1F、PRO-2F、PRO-2R和PRO-4R的组合作为引物。根据在蛋白酶PFUL基因中编码显示为与枯草杆菌蛋白酶高度同源的区域的碱基序列或蛋白酶PFUL的氨基酸序列之间相似的序列,合成这些寡核苷酸。寡核苷酸PRO-1F、PRO-2F、PRO-2R和PRO-4R的碱基序列分别在序列表SEQ ID NOS7、8、9和10中显示。
由于根据本发明的蛋白酶来源于超嗜热菌,能用属于激烈热球菌属、热球菌属、葡萄嗜热菌属、热拟芽孢杆菌属等细菌。至于属于热球菌属的细菌,例如能用速生热球菌DSM 2476。该菌株可从DeutscheSammlung Von Mikroorganismen und Zellkulturen GmbH得到。当用来源于速生热球菌DSM 2476的染色体DNA作为模板和寡核苷酸PRO-1F和PRO-2R或寡核苷酸PRO-2F和Pro-4R的组合作为引物进行PCR时,能扩增出特异的DNA片段,表明存在蛋白酶基因。此外,通过该DNA片段被插入到合适的质粒载体中创造重组质粒,然后用双脱氧法测定该插入DNA片段的碱基序列,能推导出由该片段编码的氨基酸序列。结果证明上述的DNA片段编码的氨基酸序列与蛋白酶PFUL和来自各种微生物的碱性丝氨酸蛋白酶的氨基酸序列同源,以及PCR扩增的DNA片段是从蛋白酶基因作为模板扩增的。
下一步,用该PCR-扩增的DNA片段或如上所述的寡核苷酸作为探针,筛选来自超嗜热菌的基因文库,能得到编码超热稳定蛋白酶的基因(例如,由速生热球菌产生的编码超热稳定蛋白酶的基因)。
例如,用PCR-扩增的DNA片段作为探针,针对文库进行噬菌斑杂交,能获得含有目的基因的噬菌体克隆。通过把λGEM-11载体(Promega)和来自速生热球菌DSM 2476用限制性酶Sau 3AI部分消化的染色体DNA的DNA片段连接起来,然后用体外包装方法将它们包装到λ噬菌体颗粒中,产生上述的文库。
通过分析由此获得的一个噬菌体克隆中含有的DNA片段,发现蛋白酶基因存在于大约1.9kb的SacI片段中。此外,还发现通过测定其碱基序列该片段缺乏蛋白酶基因的5′区。用盒和盒引物(Takara Shuzo基因技术产物指导,1994-1995,pp.250-251)用PCR能获得5′区。因此,能获得包括超热稳定蛋白酶5′区的DNA片段,在质粒pTCS 6中缺乏5′区。此外,来源于速生热球菌的整个超热稳定蛋白酶基因的碱基序列能从2个DNA片段的碱基序列确定。
在测定过的碱基序列中找到的可读框的碱基序列在序列表的SEOID NO11中显示,并且从该碱基序列推导的氨基酸序列在序列表的SEQ ID NO12中显示。因而确定了来源于速生热球菌编码超热稳定蛋白酶基因的碱基序列和该蛋白酶的氨基酸序列。该蛋白酶被命名为蛋白酶TCES。
可构建表达载体,在该载体中通过把2个DNA片段结合在一起重组整个蛋白酶TCES基因。然而,当用大肠杆菌作为宿主时,目的表达质粒导入其中的转化体没有得到,可能由于在细胞中来自基因表达的产物的产生对大肠杆菌可能是有害的或致死的。在上述情况下,例如,可用枯草芽孢杆菌作为宿主,使蛋白酶分泌到细胞外,然后测定其活性。
至于枯草芽孢杆菌菌株,可用枯草芽孢杆菌DB 104,它是在“基因”83215-233(1989)描述过的熟知的菌株。至于克隆载体,用质粒pUB 18-P43,它由Calgary大学Sui-Lam Wong博士馈赠。该质粒含有的卡那霉素抗性基因作为选择标志。
在质粒载体pUB 18-P43中P43启动子的下游插入蛋白酶TCES基因所形成的重组质粒被命名为质粒pSTC 3。用该质粒转化的枯草芽孢杆菌DB 104被命名并表示为枯草芽孢杆菌DB 104/pST 3,于1995年12月1日(最初的保藏日期)根据布达佩斯条约保藏在通产省工业技术院生命工学和人体技术研究所,日本,茨城县筑波市东1丁目1番3号,登记号为FERM BP-5635。
质粒pSTC 3的限制性酶图谱在图1显示。在图1中,粗线表示插入到质粒载体pUB 18-P43中的DNA片段。
热稳定蛋白酶活性可在枯草芽孢杆菌DB 104/pSTC 3的培养物上清液中和细胞抽提液中找到。
从转化体培养物中得到的蛋白酶粗酶制备物的主要特性如下(1)作用降解酪蛋白和明胶而产生短链多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-缬氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)产生荧光物质(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-对-硝基酰苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)产生黄色物质(对硝基苯胺)。
(2)最适温度在37-95℃下表现为酶活性,最适温度为70-80℃。
(3)最适pH在pH5.5-9下表现为酶活性,最适pH为pH7-8。
(4)热稳定性在80℃处理3小时后仍保持90%或更高的酶活性。
当把蛋白酶PFUL、蛋白酶TCES和枯草杆菌蛋白酶(枯草杆菌蛋白酶BNP′;核酸研究,117911-7925(1983))排列在一起,使同源区互相配对如在图2-5显示的那样时,发现蛋白酶PFUL的同源区之间和C-末端存在的序列,在蛋白酶TCES或枯草杆菌蛋白酶中未找到。根据这些结果,在激烈热球菌中,除了蛋白酶PFUL外可能存在具有的分子量比蛋白酶PFUL更低并与蛋白酶TCES或枯草杆菌蛋白酶相似的蛋白酶。
因此,用来自同源区的DNA探针进行针对从激烈热球菌制备的染色体DNA的Southern杂交,并观察到除蛋白酶PFUL基因外的信号,这表明存在另一种蛋白酶基因。
这种新型的蛋白酶基因通过下列方法分离。
例如,通过合适的限制性酶消化来自激烈热球菌的染色体DNA,然后按上面所述的方法对消化过的DNA进行Southern杂交,可获得含有编码新蛋白酶基因的DNA片段。测定该DNA片段的碱基序列,以确认该碱基序列编码的氨基酸序列与上面提到的蛋白酶同源。如果该DNA片段不含有整个目的基因,剩余的部分可通过逆向PCR法或相似的方法进一步获得。
例如,当用限制性酶SacI和SpeI(Takara Shuzo)消化来自激烈热球菌的染色体DNA然后用于Southern杂交时,观察到大小大约为0.6kb的信号。该大小的DNA片段被重新得到,插入到质粒载体pBluescriptSK(-)(Stratagene)中的SpeI-SacI位点之间,然后用产生的重组质粒转化大肠杆菌JM 109。用相同的探针,按上述Southern杂交所用的方法进行集落杂交,从转化体中能获得目的片段插入其中的克隆。从获得的克隆含有的质粒是否拥有编码所述的蛋白酶的序列,能用测定插入到质粒中的DNA片段的碱基序列确定。因而确认了在该质粒中存在蛋白酶基因。该质粒被命名为质粒pSS 3。
发现从插入到质粒pSS 3中的DNA片段的碱基序列推导的氨基酸序列与枯草杆菌蛋白酶、蛋白酶PFUL、蛋白酶TCES等的序列具有同源性。与蛋白酶PFUL基因不同的该蛋白酶基因的产物,其部分最近按上述的方法从激烈热球菌中得到,被命名为蛋白酶PFUS。编码该蛋白酶的N-末端和C-末端区的区域能用逆向PCR法获得。
用于逆向PCR的引物可根据插入在质粒pSS 3中的DNA片段的碱基序列制备。用合适的限制性酶消化来自激烈热球菌的染色体DNA,然后将产生的DNA片段进行分子内连接反应。通过用反应混合物作模板和上述提到的引物进行PCR,能获得在质粒pSS 3中含有的该蛋白酶基因片段侧翼区相应的DNA片段。由这些区域编码的酶蛋白的氨基酸序列可通过分析所获得的DNA片段的碱基序列而推导出来。此外,用来自激烈热球菌的染色体DNA为模板可制备能扩增整个蛋白酶PFUS基因的引物。可设计引物NPF-4和NPR-4。引物NPF-4拥有的碱基序列紧邻于蛋白酶PFUS基因的启动密码子上游处,能把BamHI 5′位点引入到该序列上。引物NPR-4拥有的序列与蛋白酶PFUS基因3′部分互补,可把SphI 5′位点引入到该序列上。
引物NPK-4和NPR-4的碱基序列在序列表的SEQ ID NOS13和14中显示。用来自激烈热球菌的染色体DNA为模板,这2个引物可用于扩增整个蛋白酶PFUS的基因。
与蛋白酶TCES一样,蛋白酶PFUS能在作为宿主的枯草芽孢杆菌中表达。表达蛋白酶PFUS的质粒可按用于蛋白酶TCES的表达质粒pSTC 3构建。具体来说,通过把质粒pSTC 3中的蛋白酶TCES基因用含有整个蛋白酶PFUS基因的DNA片段取代,可构建表达蛋白酶PFUS的质粒,所述的DNA片段用上述的引物由PCR扩增得到。因而所构建的表达质粒被命名为质粒pSNP 1。用该质粒转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pSNP 1,并于1995年12月1日(最初保藏的日期)根据布达佩斯条约,保藏在通产省工业技术院生命工学和人体技术研究所,日本,茨城县筑波市东1丁目1番3号,登记号为FERMBP-5634。质粒pSNP 1的限制性酶图谱在图6显示。
在编码蛋白酶PFUS基因中与可读框相应的碱基序列以及从该碱基序列推导的蛋白酶PFUS的氨基酸序列分别在序列表的SEQ ID NOS15和16中显示。
热稳定蛋白酶活性在来自枯草芽孢杆菌DB 104/pSNP 1培养物的上清液中和细胞抽提液中发现。即,部分表达的蛋白酶PFUS被分泌到培养物上清液中。
从转化体培养物中获得的蛋白酶的主要特性如下(1)作用降解酪蛋白和胶原以产生短链多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-缬氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)产生荧光物质(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-对-硝基酰替苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)产生黄色物质(对硝基苯胺)。
(2)最适温度在41-110℃下表现为酶活性,最适温度为80-95℃。
(3)最适pH在pH 5-10下表现酶活性,最适pH为pH 6-8。
(4)热稳定性在95℃处理8小时后仍有90%或更高的酶活性。
(5)pH稳定性在pH 5-11,95℃下处理60分钟后仍保持95%或更高的酶活性。
(6)分子量在SDS-PAGE上出现的分子量大约为45 kDa。
使用获得蛋白酶TCES基因和蛋白酶PFUS基因相似的方法,与蛋白酶TCES基因和蛋白酶PFUS基因同源的蛋白酶基因能从不是激烈热球菌和速生热球菌的超嗜热菌中得到。
可制备大约1kb的DNA片段,该片段编码在序列表SEQ ID NO6中显示的蛋白酶PFUL的氨基酸序列从残基323位至残基650的序列,用该片段作探针,针对来自海葡萄嗜热菌和解蛋白热拟杆菌DSM 5265的染色体DNAs进行基因组Southern杂交。结果,用PstI(TakaraShuzo)消化的来自海葡萄嗜热菌染色体DNA大约4.8kb的位置和用XbaI消化的来自解蛋白热拟杆菌染色体DNA大约3.5kb的位置观察到信号。
根据这些结果,证明从海葡萄嗜热菌和解蛋白热拟杆菌来的染色体DNAs存在编码蛋白酶PFUL、蛋白酶PFUS和蛋白酶TCES等基因同源的序列。用分离和鉴别编码蛋白酶TCES和蛋白酶PFUS基因相似的方法,检测DNA片段,可分离和鉴定在海葡萄嗜热菌和解蛋白热拟杆菌中编码超热稳定蛋白酶的基因。
一般来说,为了通过遗传工程技术大量制备蛋白,认为应用在宿主中有效地起作用的启动子而不用编码目的蛋白的基因内部结合的启动子是有利的。尽管用于构建蛋白酶TCES和蛋白酶PFUS表达系统的P43启动子是来自枯草芽孢杆菌的启动子,它不能足够有效地表达这2种蛋白酶。
因此,为了增加表达水平,可利用在枯草芽孢杆菌中高水平表达的基因,尤其是编码分泌蛋白的基因。可用编码α-淀粉酶或各种细胞外蛋白酶的基因。例如,可预期应用枯草杆菌蛋白酶基因的启动子和编码信号肽区可增加蛋白酶PFUS的表达水平。
具体而言,通过把整个蛋白酶PFUS基因置于编码枯草杆菌蛋白酶基因信号肽及包括启动子区的区域下游,这样2个基因的翻译框能互相匹配,在枯草杆菌蛋白酶的启动子控制下蛋白酶PFUS能作为融合蛋白表达。
例如,编码枯草杆菌蛋白酶E的基因能用作枯草杆菌蛋白酶基因,用在本发明中。可使用把枯草杆菌蛋白酶E基因的启动子和编码信号肽的区域插入到质粒pKW 2中,该质粒在“细菌学杂志”1712657-2665(1989)中描述。包括启动子序列的5′上游区的碱基序列在该参考文献(同上)中描述而编码枯草杆菌蛋白酶区的碱基序列在“细菌学杂志”158411-418(1984)中描述。
根据这些序列,合成引入EcoRI位点位于该基因启动子序列上游的引物SUB 4和引入BamHI位点位于编码枯草杆菌蛋白酶E的信号肽区下游的引物BmR1。引物SUB4和BmR1的碱基序列分别在序列表SEQID NOS17和18中显示。用质粒pKWZ作模板,经PCR用引物SUB4和BmR1扩增出大约0.3kb的DNA片段,该片段含有枯草杆菌蛋白酶E基因的启动子和编码信号肽区。
置于该DNA片段下游的蛋白酶PFUS基因,可通过PCR法从激烈热球菌的染色体DNA中获得。引物NPF-4能用作和该基因5′区杂交的引物。根据该基因终止密码子下游的碱基序列设计的引物NPM-1拥有SphI位点,能用作和该基因3′区杂交的引物。引物NPM-1的序列在序列表的SEQ ID NO19中显示。
存在于基因中的一个BamHI位点在所述的方法中会产生问题,在该方法中,BamHI位点是用于连接蛋白酶PFUS基因和0.3kb DNA片段。依据在序列表SEQ ID NO15中显示的蛋白酶PFUS基因的碱基序列,能制备经PCR-诱变法消除BamHI位点的引物mutRR和mutFR。引物mutRR和mutFR的碱基序列分别在序列表SEQ ID NOS20和21中显示。当用这些引物消除BamHI位点时,由该位点编码的氨基酸残基即甘氨酸,由于引入该位点的碱基替换,被缬氨酸所替换,所述的位点在序列表SEQ ID NO16中显示的蛋白酶PFUS氨基酸序列中560位。
用这些引物能获得连接有枯草杆菌蛋白酶E的启动子和编码信号肽区的蛋白酶PFUS基因。具体而言,用来自激烈热球菌的染色体DNA作模板及配对引物mutRR和NPF-4或配对引物mutFR和NPM-1,进行2次PCRs。此外,用各自PCR扩增的DNA片段作模板和引物NPF-4和NPM-1混合形成异源双链,进行第二轮PCR。因此,能扩增出不含有内部BamHI位点大约2.4kb的整个蛋白酶PFUS基因。
分离用BamHI和SphI消化的PCR扩增的DNA片段获得大约2.4kb的一个DNA片段,用该片段取代含有蛋白酶PFUS基因的质粒pSNP 1中的BamHI-SphI片段。由此构建的表达载体被命名为质粒pPS 1。用该质粒转化的枯草芽孢杆菌DB 104命名为枯草芽孢杆菌DB 104/PPS1。观察含有质粒pSNP 1的转化体,发现在该转化体培养物的上清液和抽提液中相似的蛋白酶活性,这表明该氨基酸替换不影响酶活性。质粒pPS 1的限制性酶图谱在图7中显示。
含有枯草杆菌蛋白酶E基因的启动子和编码信号肽区的大约0.3kbDNA片段用EcoRI和BamHI消化,用于取代在质粒pPS 1中含有的P43启动子和核糖体结合位点的EcoRI-BamHI片段。由此构建的表达质粒被命名为pNAPS 1。用该质粒转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pNAPS 1。热稳定蛋白酶活性在该转化体培养物的上清液,和细胞抽提液中找到,与枯草芽孢杆菌DB 104/pSNP 1相比较增加了表达水平。质粒pNAPS 1的限制性酶图谱在图8中显示。
从该转化体表达的蛋白酶表现的酶学特性与上述的由枯草芽孢杆菌DB 104/pSNP 1表达的蛋白酶的那些特性相等。纯化了由该转化体表达的蛋白酶。分析纯化蛋白酶N-末端氨基酸序列提出的氨基酸序列在序列表SEQ ID NO22中显示。该序列与在序列表SEQ ID NO15中显示的蛋白酶PFUS的氨基酸序列从133位至144位的序列相同,表明成熟的蛋白酶PFUS是从该部分开始的多肽所组成的酶。根据这些结果呈现的成熟蛋白酶PFUS的氨基酸序列在序列表SEQ ID NO4中显示。
尽管与枯草芽孢杆菌DB 104/pSNP 1(FERM BP-5634)产生的蛋白酶量相比较,由枯草芽孢杆菌DB 104/pNAPS 1产生的蛋白酶量增加,仍需要更高的生产力。通过修饰枯草芽孢杆菌信号肽和蛋白酶PFUS之间由pNAPS 1编码的融合肽结合部分,以更有效地移去信号肽,预计能增加该蛋白酶的表达水平。在质粒pNAPS 1中,由3个氨基酸残基Ala-Gly-Ser组成的肽插入在序列表SEQ ID NO3中显示的枯草杆菌蛋白酶E信号肽的C-末端氨基酸残基(Ala)和蛋白酶PFUS的N-末端氨基酸残基(Met)之间。通过把突变导入到质粒pNAPS 1中编码该肽的DNA中然后检查已导入突变质粒的转化体的蛋白酶生产性,能获得具有增加蛋白酶表达水平的转化体。
首先,制备突变质粒,其中在质粒pNAPS 1中编码融合蛋白,枯草杆菌蛋白酶E-蛋白酶PFUS的基因中3个氨基酸肽中编码Ser的部分被修饰,这样该部分的碱基序列编码随机的2个氨基酸残基。上述突变质粒可用PCR法产生。例如,具有用随机的6个碱基替换编码Ser密码子(TCC)-的序列的引物SPOFO和SPORO(引物SPOFO和SPORO的碱基序列分别在序列表SEQ ID NOS24和25中显示)和根据该区周围的碱基序列制备的引物SUB 3和NPR-10,用于进行PCR以获得一个DNA片段,在与编码Ser密码子(Ser)相应的部位的定向突变已引入了该DNA片段中。由得到的片段取代在质粒pNAPS 1中相应的区域能获得含有导入突变的蛋白酶基因的突变质粒。
通过由此获得的突变质粒导入到合适的宿主如枯草芽孢杆菌DB 104中,然后测定由转化体表达的蛋白酶水平,那么就能获得具有增加表达水平的转化体。由测定所分离的转化体独立培养物中的活性确定蛋白酶的表达水平。另外,具有增加表达水平的转化体可用含基质的琼脂平板方便地选出。
具体来说,突变质粒导入其中的转化体生长在含有脱脂乳的琼脂平板上。然后,平板培养在蛋白酶PFUS能表现其活性的温度下,如在70℃下。在表达蛋白酶的转化体集落周围的脱脂乳被降解而变得清亮。蛋白酶的表达水平能从清亮区的大小估计出来。
与枯草芽孢杆菌DB 104/pNAPS 1相比较由此得到的一种表达高水平蛋白酶活性的转化体,被命名为枯草芽孢杆菌DB 104/pSPO 124。制备含有该转化体的质粒(该质粒被命名为pSPO 124)。分析该质粒的碱基序列显示编码Ser的部分转变成碱基序列GGGAAT,那就是说,由该质粒编码的是一种Ser已转变为Gly-Asn的蛋白。
因此,通过把由4个氨基酸残基Ala-Gly-Gly-Asn组成的肽置于枯草杆菌蛋白酶信号肽的下游,将其与目的蛋白的N-末端融合,然后表达融合蛋白,证明目的蛋白的表达水平能在作为宿主的芽孢杆菌属细胞中增加。除了用于本发明的枯草杆菌蛋白酶E(来自枯草芽孢杆菌)外,来自解淀粉枯草杆菌的枯草杆菌蛋白酶BPN′(核酸研究,117911-7925(1983))、来自地衣枯草杆菌的枯草杆菌蛋白酶Carlsberg(核酸研究,138913-8926(1985))等都是熟知的由芽孢杆菌属细菌产生的枯草杆菌蛋白酶。来自它们的信号肽能优选地用于本发明,尽管它们的氨基酸序列互相间稍有不同。在芽孢杆菌属细菌中起作用的各种启动子能用在本发明为控制表达所用的来自枯草杆菌蛋白酶E基因的启动子的部位。
关于被表达的蛋白没有限制。只要获得编码蛋白的基因就可应用本发明通过遗传工程技术高水平地表达该蛋白。根据分类学上与芽孢杆菌属细菌不同的激烈热球菌的蛋白可高水平表达的事实,显然本发明能用于表达不是本发明宿主的生物来源的蛋白。通过遗传工程技术,本发明优选地用于生产蛋白酶PFUL、蛋白酶TCES以及结构上与蛋白酶PFUS相似,来源于海葡萄嗜热菌和解蛋白热拟杆菌的蛋白酶。
依据和枯草杆菌蛋白酶的同源性,可考虑将蛋白酶PFUS表达为具有信号肽和前肽的前体蛋白,然后进行加工以产生成熟的酶。此外,根据成熟蛋白酶PFUS酶的N-末端氨基酸序列分析的结果,可以设定该成熟酶是一种在序列表SEQ ID NO4中所示的氨基酸序列组成的酶。然而,纯化的成熟蛋白酶PFUS的分子量大约为45kDa,比根据氨基酸序列计算的分子量更小,表明也进行其C-末端肽的加工后,作为前肽表达的蛋白酶PFUS转变成成熟的蛋白酶。
如果由加工过程移去的C-末端肽对酶活性或酶蛋白折叠成合适的结构是非必需的,预期通过从该基因中缺失编码该部分的区域然后表达蛋白酶,也可增加蛋白酶PFUS的表达水平。
从枯草芽孢杆菌DB 104/pNAPS 1获得的成熟蛋白酶PFUS的分子量例如可用质子光谱仪精确地测定。根据测定的分子量和按上述方法确定的成熟蛋白酶PFUS的N-末端氨基酸序列,发现该蛋白酶是一种与序列表SEQ ID NO15中所示的氨基酸序列133位Ala至552位Thr相应的肽。此外,通过把终止密码子导入到在质粒pNAPS 1含有的蛋白酶PFUS基因中编码552位Thr部分的附近区域,能构建表达缺乏对其酶活性非必需的多肽的蛋白酶PFUS的质粒。具体而言,用引物NPR 544和引物NPFE 81经PCR获得具有所设计的终止密码子引入其中的碱基序列的DNA片段,引物NPR 544是在质粒pNAPS 1中的蛋白酶PFUS基因从起始密码子至第544位氨基酸残基编码密码子的C-末端侧(Ser)导入一个终止密码子(TGA)(引物NPR 544的碱基序列在序列表的SEQ ID NO28中显示),而引物NPFE 81拥有在该基因中从NspV位点上游区的碱基序列(引物NPFE 81的碱基序列在序列表的SEQ ID NO29中显示)。然后用该片段取代质粒pNAPS 1的相应区域能获得含有目的突变导入蛋白酶基因中的突变质粒。该质粒命名为质粒pNAPSΔC。用该质粒转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pNAPSΔC。
该转化体表达蛋白酶活性,具有的特性与蛋白酶PFUS相同,其表达水平比枯草芽孢杆菌DB 104/pNAPS 1更高。
因此,可以发现在质粒pNAPSΔC中含有的蛋白酶PFUS基因拥有表达该酶活性的足够区域。在质粒中存在的编码蛋白酶PFUS区的碱基序列在序列表的SEQ ID NO2中显示。由该碱基序列编码的氨基酸序列在序列表的SEQ ID NO2中显示。
此外,通过把在质粒pNAPSΔC中相似的突变导入到质粒pSPO 124的蛋白酶PFUS基因中,能表达缺乏其C-末端肽的蛋白酶PFUS。
具体而言,通过用NspV和SphI消化质粒pNAPSΔC获得的大约13kb的DNA片段和已被NspV和SphI消化的质粒pSPO 124混合并连接,而构建该目的质粒。该质粒被命名为质粒pSO124ΔC。用该质粒转化的枯草芽孢杆菌DB 104被命名并表示为枯草芽孢杆菌DB 104/pSO124ΔC,于1997年5月16日(最初的保藏日期)根据布达佩斯条约保藏在通产省工业技术院生命工学和人体技术研究所,日本,茨城县筑波市东1丁目1番3号,登记号为FERM BP-6294。该转化体的蛋白酶表达水平与枯草芽孢杆菌DB 104/pNAPS 1相比增加。
由转化体枯草芽孢杆菌DB 104/pNAPSΔC和枯草芽孢杆菌DB 104/pSPO124ΔC产生的蛋白酶的酶学特性以及物理和化学特性,似乎与由枯草芽孢杆菌DB 104/pSNP 1产生的蛋白酶的那些特性相同。从该2个转化体中的培养物中获得的蛋白酶的主要特性如下(1)作用降解酪蛋白和胶原产生短链多肽。
水解琥珀酰-L-亮氨酰-L-亮氨酰-L-缬氨酰-L-酪氨酸-4-甲基香豆素-7-酰胺(Suc-Leu-Leu-Val-Tyr-MCA)产生荧光物质(7-氨基-4-甲基香豆素)。
水解琥珀酰-L-丙氨酰-L-丙氨酰-L-脯氨酰-L-苯丙氨酸-对-硝基酰替苯胺(Suc-Ala-Ala-Pro-Phe-p-NA)产生黄色物质(对硝基苯胺)。
(2)最适温度在40-110℃下表现酶活性,最适温度为80-95℃。
(3)最适pH在pH 5-10下表现酶活性,最适pH为pH 6-8。
(4)热稳定性在95℃下处理8小时后保留90%或更高的酶活性。
(5)pH稳定性在95℃,pH 5-11下处理60分钟后保留95%或更高的酶活性。
(6)分子量在SDS-PAGE上表现的分子量大约45kDa。
因此,提供了具有高热稳定性的蛋白酶和其基因。此外,本发明披露了表达蛋白的新系统,该系统使蛋白酶大量表达。用遗传工程技术将该表达系统用于生产本发明的蛋白酶及各种蛋白。
下列的实施例更详细地说明本发明,但不能解释为限制本发明的范围。
实施例1(1)从激烈热球菌中制备染色体DNA按下列条件培养激烈热球菌DSM 3638。
含有1%蛋白胨,0.5%酵母抽提物,1%可溶性淀粉,3.5%Jamarine S固体物(Jamarine实验室),3.5%Jamarine S液体物(Jamarine实验室),0.003% MgSO4,0.001% NaCl,0.0001% FeSO4·7H2O,0.0001%CoSO4,0.0001% CaCl2·7H2O,0.0001% ZnSO4,0.1ppm CuSO4·5H2O,0.1ppm H3BO3,0.1ppm KAl(SO4)2,0.1ppm Na2MoO4·2H2O,0.25ppmNiCl2·H2O的培养基放在2L的培养瓶中,120℃灭菌20分钟,用氮气充泡以移去溶解的氧气,然后将菌株接种到培养基中,在95℃下非振荡条件培养16小时。培养后,通过离心收集细胞。
然后得到的细胞悬浮在4ml含有25%蔗糖的50mM Tris-HCl(pH8.0)中。加2ml的0.2M EDTA和0.8ml溶菌酶(5mg/ml)到悬液中。混合液在20℃下温育1小时。然后往混合液中加入24ml的SET溶液(150mM NaCl, 1mM EDTA,20mM Tris-HCl,pH8.0),4ml的5%SDS和400μl的蛋白酶K(10mg/ml)。继续在37℃下温育1小时。反应通过用苯酚-氯仿抽提混合物而终止。然后,进行乙醇沉淀获得大约3.2mg的染色体DNA。
实施例2(1)为构建质粒pNSP 1的引物合成为了合成用于扩增整个蛋白酶PFUS基因的引物,含有该整个基因的质粒pSNP 1从枯草芽孢杆菌DB 104/pSNP 1(FERM BP-5634)中分离,然后测定所获得区域的碱基序列。根据该碱基序列,合成引入BamHI位点紧邻于蛋白酶PFUS基因起始密码子上游的引物NPF-4和能与该基因3′区杂交并含有SphI识别位点的引物NPM-1。引物NPF-4和NPM-1的碱基序列分别在序列表SEQ ID NOS13和19中显示。
也合成移去BamHI位点的引物mutRR和mutFR,该BamHI位点位于蛋白酶PFUS基因中自起始密码子下游大约1.7kb处。引物mutRR和mutFR的碱基序列分别在序列表的SEQ ID NOS20和21中显示。
(2)制备质粒pPS 1制备2套LA-PCR反应混合液,然后进行94℃ 30秒-55℃ 1分钟-68℃ 3分钟的30个循环反应,每套LA-PCR反应混合液含有来自激烈热球菌的染色体DNA为模板和引物NPF-4和mutRR的组合或引物mutFR和NPM-1的组合。用LA PCR试剂盒Ver.2(TakaraShuzo)制备LA-PCR反应混合液。等份的反应混合物进行琼脂糖凝胶电泳,分别观察到用引物NPF-4和mutRR扩增出一条大约1.8kb的DNA片段而用引物mutFR和NPM-1扩增出一条大约0.6kb的DNA片段。
用SUPREC-02(Takara Shuzo)从2套PCR反应混合液中移去引物以制备扩增的DNA片段。制备含有这2种扩增的DNA片段但不含有引物或LA Taq的LA-PCR反应混合液,94℃下热变性10分钟,在30分钟内冷却至30℃,然后在30℃温育15分钟以形成异源双链。接着,把LA Taq(Takara Shuzo)加到反应混合液中,72℃下反应30分钟。然后把引物NPF-4和NPM-1加到反应混合液中,然后该反应混合液进行94℃ 30分钟-55℃ 1分钟-68℃ 3分钟的25个循环反应。在反应混合液中观察到扩增出一条大约2.4kb的DNA片段。
大约2.4kb的该DNA片段用BamHI和SphI(两者均来自TakaraShuzo)消化。该片段和已被BamHI和SphI消化过移去整个蛋白酶PFUS基因的质粒pSNP 1混合并连接,然后导入到枯草芽孢杆菌DB 104中。从产生的卡那霉素抗性的转化体中制备质粒,选出其中仅大约2.4kb片段一个分子插入的质粒,并且命名为质粒pPS 1。用该质粒pPS 1转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pPS 1。
质粒pPS 1的限制性酶图谱在图7中显示。
(3)对枯草杆菌蛋白酶E基因的启动子-编码信号肽区扩增DNA片段为获得枯草杆菌蛋白酶E基因的启动子-编码信号肽区而合成引物。首先,根据在细菌学杂志,1712657-2665(1989)所描述的枯草杆菌蛋白酶E基因启动子区的碱基序列合成引物SUB 4,该引物能与该区上游序列杂交并含有1个EcoRI位点(引物SUB 4的碱基序列在序列表的SEQ ID NO17中显示)。根据在细胞学杂志,158411-418(1984)中所描述的枯草杆菌蛋白酶E基因的碱基序列,合成能引入1个BamHI位点紧邻于编码信号肽区下游的引物BmR1(引物BmR1的碱基序列在序列表的SEQ ID NO18中显示)。
制备含有在细菌学杂志,1712657-2665中所描述的枯草杆菌蛋白酶E基因的质粒pKWZ作模板及引物SUB 4和BmR1的PCR反应混合液,然后进行94℃ 30秒-55℃ 1分钟-68℃ 2分钟的30个循环反应。等份的反应混合液进行琼脂糖凝胶电泳,并观察到扩增出一条大约0.3kb的DNA片段。
(4)构建蛋白酶表达质粒pNAPS 1用EcoRI(Takara Shuzo)和BamHI消化上述大约0.3kb的DNA片段,用实施例3中所述的方法已被EcoRI和BamHI消化的质粒pPS1与DNA片段混合并连接,然后导入到枯草芽孢杆菌DB 104中。从产生的卡那霉素抗性的转化体中制备质粒,然后挑选出仅大约0.3kb的片段一个分子插入的质粒,命名为质粒pNAPS 1。用该质粒pNAPS 1转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pNAPS 1。
质粒pNAPS 1的限制性酶图谱在图8中显示。
(5)构建质粒pSNP 2为引入BamHI位点位于在上面提到的质粒pNAPS 1中的枯草杆菌蛋白酶E基因的编码信号肽区上游,合成引物SUB17R(引物SUB17R的碱基序列在序列表的SEQ ID NO23中显示)。制备含有质粒pNAPS1作模板及引物SUB17R和SUB4的PCR反应混合液,进行94℃ 30秒-55℃ 1分钟-72℃ 1分钟的25个循环反应。用EcoRI和BamHI消化扩增的大约0.21kb的DNA片段,以获得一条大约0.2kb的DNA片段,该片段含有枯草杆菌蛋白酶E基因的启动子和SD序列。该片段和已被EcoRI和BamHI消化过的质粒pNAPS1混合并连接。用该反应混合液转化枯草芽孢杆菌DB 104。从产生的卡那霉素抗性的转化体中制备质粒,然后挑选出大约0.2 kb的DNA片段插入的质粒,命名为质粒pSNP 2。
(6)产生高水平表达蛋白酶的突变质粒为把位于质粒pNAPS 1中枯草杆菌蛋白酶E基因的编码信号肽区和蛋白酶PFUS基因的起始密码子之间的编码氨基酸残基Ser的序列(碱基序列TCC)用编码2个随机氨基酸残基的序列替换,合成引物SPOFO和SPORO(引物SPOFO和SPORO的碱基序列分别在序列表的SEQ ID NOS24和25中显示)。合成引入的BamHI位点紧邻于质粒pNAPS 1的枯草杆菌蛋白酶E基因中编码信号肽的上游的引物SUB3和在蛋白酶PFUS编码区中含有SpeI位点的引物NPR-10(引物SUB3和NPR-10的碱基序列分别在序列表的SEQ ID NOS26和27中显示)。
制备PCR反应混合液,每种混合液含有以质粒pNAPS 1作模板和引物SPOFP和NPR-10组合或引物SUB3和SPORO的组合,将反应混合液进行94℃ 30秒-50℃ 1分钟-72℃ 1分钟的20个循环反应。在2个反应混合液中扩增出的大约0.13kb和大约0.35kb的DNA片段混合在一起,在94℃变性10分钟,逐渐冷却到37℃以形成异源双链。然后用Taq聚合酶(Takara Shuzo)的方法从异源双链产生双链DNA。制备含有由上获得的双链DNA作模板及引物SUB3和NPR-10的PCR反应混合液,进行94℃ 30秒-50℃ 1分钟-72℃ 1分钟的25个循环反应。用BamHI和SpeI消化扩增的大约0.43kb的DNA片段所获得的一条DNA片段和用BamHI和SpeI消化过的质粒pSNP 2混合并连接。用反应混合液转化枯草芽孢杆菌DB 104。
将产生的卡那霉素抗性的转化体接种在脱脂乳的平板上(用于高温培养的LB-琼脂培养基含有10μg/ml的卡那霉素和1%脱脂乳)以形成集落。接着,平板培养在70℃下,根据在集落周围的脱脂乳的降解程度,检查由各个转化体表达的蛋白酶活性。结果,分离到一个表达特别高活性的克隆,从该克隆制备命名为质粒pSPO 124的质粒。用该质粒转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pSPO 124。分析质粒pSPO 124的碱基序列,发现在质粒pNAPS 1中编码Ser的碱基序列被碱基序列GGGAAT所替换,那就是说所编码的蛋白中,Ser被转换为2个氨基酸残基Gly-Asn。另外,证明与蛋白酶PFUS基因的Pro(CCA)相应的从起始密码子计算的第25位密码子转变为编码Leu的密码子(CTA),这是与上面所述的突变同时发生的。
(7)构建蛋白酶表达质粒pNAPSΔC1个终止密码子被导入在质粒pNAPS 1中从蛋白酶PFUS基因的起始密码子算起的第544位氨基酸残基的C-末端侧,以构建表达从该位点起缺乏下游区的蛋白酶的质粒。合成引物NPR 544,该引物在该基因中编码第544位氨基酸残基的密码子C-末端侧导入一个终止密码子(碱基序列TGA)和有一个SphI位点(引物NPR544的碱基序列在序列表的SEQ ID NO28中显示)。此外,根据在该基因中从NspV位点上游部分的碱基序列,合成引物NPFE 81(引物NPFE 81的碱基序列在序列表的SEQ ID NO29中显示)。
制备含有质粒pNAPS 1作模板及引物NPFE 81和NPR 544的PCR反应混合液,然后进行94℃ 30秒-50℃ 1分钟-72℃ 1分钟的20个循环反应。扩增出的大约0.61kb的DNA片段用NspV(Takara Shuzo)和SpeI消化,以获得一条含有终止密码子的大约0.13kb的DNA片段。该DNA片段和已被限制性酶NspV和SphI消化过的质粒pNAPS 1混合并连接。用反应混合液转化枯草芽孢杆菌DB 104。从产生的卡那霉素抗性的转化体中制备质粒,选出大约0.13kb的DNA片段插入其中的质粒,该质粒被命名为质粒pNAPSΔC。用该质粒pNAPSΔC转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pNAPSΔC。
(8)构建蛋白酶表达质粒pSPO124ΔC用NspV和SphI消化质粒pNAPSΔC分离得到一条大约1.3kb的DNA片段,然后该片段与已被NspV和SphI消化过的质粒pSPO 124混合并连接。用反应混合液转化枯草芽孢杆菌DB 104。从产生的卡那霉素抗性转化体中制备质粒,挑选出大约1.3kb的DNA片段插入的质粒,并被命名为质粒pSPO124ΔC。用该质粒pSPO124ΔC转化的枯草芽孢杆菌DB 104被命名为枯草芽孢杆菌DB 104/pSPO124ΔC。
实施例3(1)用含蛋白酶PFUS基因的质粒转化的枯草芽孢杆菌的培养和制备粗酶溶液用实施例2所述的方法将含有蛋白酶PFUS基因的质粒pNAPS 1导入到枯草芽孢杆菌DB 104中出现的枯草芽孢杆菌DB 104/pNAPS 1,在2ml含有10μg/ml卡那霉素的LB培养基(蛋白胨10g/L,酵母抽提物5g/L,NaCl 5g/L,pH7.2)中,37℃下培养24小时。离心培养物以得到培养上清液(制备物1-S)和细胞。
把细胞悬浮在100μl的50mM Tris-HCl,pH7.5中,加2mg溶菌酶(Sigma)后37℃消化45分钟。消化过的样品在95℃热处理10分钟,然后通过离心收集上清液以获得无细胞的抽提液(制备物1-L)。
相似地,从含有质粒pSPO 124的枯草芽孢杆菌DB 104/pSPO 124、含有质粒pNAPSΔC的枯草芽孢杆菌DB 104/pNAPSΔC或含有质粒pSPO124ΔC的枯草芽孢杆菌DB 104/pSPO124ΔC中,获得培养物上清液和无细胞的抽提液。来自枯草芽孢杆菌DB 104/pSPO 124的培养物上清液和无细胞抽提液分别称为124-S和124-L。来自枯草芽孢杆菌DB 104/pNAPSΔC的培养物上清液和无细胞抽提液分别称为ΔC-S和ΔC-L。来自枯草芽孢杆菌DB 104/pSPO124ΔC的培养物上清液和无细胞抽提液分别称为124ΔC-S和124ΔC-L。用这些制备物测定蛋白酶活性并测定在每个制备物中含有的蛋白酶浓度。
(2)比较蛋白酶的生产力用Suc-Ala-Ala-Pro-Phe-p-NA(Sigma)作底物光谱法测定酶水解反应中产生的p-硝基苯胺的量确定蛋白酶PFUS的活性。简言之,适当稀释待测定其酶活性的酶制备液。50μl在100mM磷酸盐缓冲液pH7.0中的1mM Suc-Ala-Ala-Pro-Phe-p-NA被加到50μl稀释过的样品溶液中。然后,使反应在95℃进行30分钟。通过在冰上冷却终止反应后,测定在405nm的吸收值以计算出产生的对硝基苯胺的量。该酶的一个单位被定义为95℃每1分钟产生1μmol对硝基苯胺的酶量。假定比活性为9.5单位/mg蛋白酶PFUS蛋白,根据所测定的酶活性计算在培养物上清液或细胞中表达的酶蛋白的量。
测定在实施例3-(1)制备的每种酶制备物的蛋白酶活性。根据测定结果计算的每种转化体每1L培养物的蛋白酶PFUS的生产力在表1显示。
在枯草芽孢杆菌DB 104/pSPO 124中,在细胞中的蛋白酶PFUS的生产力比枯草芽孢杆菌DB 104/pNAPS 1增加了3.6倍。在枯草芽孢杆菌DB 104/pNAPSΔC中,蛋白酶PFUS的生产力分别在培养物上清液中增加2.4倍而在细胞中增加2.2倍。此外,在枯草芽孢杆菌DB 104/pSPO124ΔC中,蛋白酶PFUS的生产力分别在培养物上清液中增加2倍而在细胞中增加2.4倍。每种细胞的生产力也增加。
在培养物上清液和细胞中产生的蛋白酶PFUS的总量,与枯草芽孢杆菌DB 104/pNAPS 1相比,分别在枯草芽孢杆菌DB 104/pSPO 124中增加2.1倍,在枯草芽孢杆菌DB 104/pNAPSΔC中增加2.1倍及在枯草芽孢杆菌DB 104/pSPO124ΔC中增加2.2倍。
表1蛋白酶PFUS的生产力(mg/L的培养物

>实施例4(1)制备纯化的成熟蛋白酶PFUS的酶制备物按实施例2中所述的方法将编码本发明的超热稳定蛋白酶的基因导入枯草芽孢杆菌DB 104中出现的2种菌株,枯草芽孢杆菌DB 104/pNAPS 1和枯草芽孢杆菌DB 104/pSPO124ΔC,分别接种到含有10μg/ml卡那霉素的5ml LB培养基中,37℃振荡培养7小时。5ml的培养物接种到5L锥形瓶中500ml含10μg/ml卡那霉素的TM培养基(大豆粉末5g/L,聚胨10g/L,肉膏5g/L,酵母抽提物2g/L,葡萄糖10g/L,FeSO4·7H2O 10mg/L,MnSO4·4H2O 10mg/L,ZnSO4·7H2O 1mg/L,pH7.0)中,30℃振荡培养3天。超声处理所产生的培养物,在95℃热处理30分钟,然后离心收集上清液。加过硫酸铵到上清液中至25%的饱和度,然后由下一步离心获得的上清液上样到用含25%饱和过硫酸铵的25mM Tris-HCl缓冲液平衡过的微量制备甲基HIC柱(Bio-Rad)上。用相同的缓冲液洗涤凝胶后,吸附到柱上的蛋白酶PFUS用含40%乙醇的25mM Tris-HCl缓冲液(pH7.6)用分步洗脱法洗脱下来。由此获得的含有蛋白酶PFUS的级分用NAP-25柱进行凝胶过滤,该NAP-25柱预先用含20%乙腈的0.05%三氟乙酸平衡,在变性蛋白酶PFUS的同时脱盐,然后获得纯化的蛋白酶PFUS的制备物。从枯草芽孢杆菌DB 104/pNAPS 1和枯草芽孢杆菌DB 104/pSPO124ΔC中得到的制备物分别称为NAPS-1和SPO-124ΔC。
2种纯化的酶制备物在0.1% SDS-10%聚丙烯酰胺凝胶上电泳,然后用考马斯亮蓝R-250染色,结果显示2种纯化的酶制备物NAPS-1和SPO-124ΔC为单一的泳带,估测的分子量大约为45kDa。
(2)成熟蛋白酶PFUS的N-末端氨基酸序列的分析用G1000A蛋白测序仪(Hewlett-Packard),通过自动Edman法分析纯化的酶制备物NAPS-1和SPO-124ΔC的N-末端氨基酸序列。2种纯化的酶制备物的2个N-末端氨基酸序列在序列表的SEQID NO22中显示。该序列与在序列表的SEQ ID NO15中所示的蛋白酶PFUS氨基酸序列从133位至144位的序列重合,表明NAPS-1和SPO-124ΔC二者是从该部分开始的多肽所组成的酶。
(3)成熟蛋白酶PFUS的质谱法分析对纯化的酶制备物NAPS-1和SPO-124ΔC的质谱法分析用API300四极三质子分光仪(Perkin-Elmer Sciex)进行。根据NAPS-1的估测分子量,43,744Da,说明由枯草芽孢杆菌DB 104/pNAPS 1产生的成熟蛋白酶PFUS是一种在序列表SEQ ID NO15中所示的蛋白酶氨基酸序列从133位Ala至552位Thr的多肽组成的酶。此外,根据SPO-124ΔC的估测分子量42,906Da,说明由枯草芽孢杆菌DB 104/pSPO124ΔC产生的成熟蛋白酶PFUS是一种由这样的一种多肽组成的酶,该多肽为在序列表SEQ ID NO15中所示的蛋白酶PFUS从133位Ala至544位Ser的氨基酸序列,即是序列表SEQ ID NO2中所示的氨基酸序列。
序列表申请人名称TAKARA SHUZO CO.,LTD发明题目表达超热稳定蛋白的系统参考/摘要号660782目前申请号目前申请日在先申请号151969/1997在先申请日1997,6月10日序列数29SEQ ID NO1的资料长度412类型氨基酸链型单链拓扑结构线性分子类型肽序列描述Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala5 10 15Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile20 25 30Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln35 40 45Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr50 55 60Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala65 70 75Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala80 85 90Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly95 100 105Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val110 115 120Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu125 130 135Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala140 145 150Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala155 160 165Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala170 175 180Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val185 190 195Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu200 205 210Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg215 220 225Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr230 235 240Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile245 250 255Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys260 265 270Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp275 280 285Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr290 295 300Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly305 310 315Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser320 325 330Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn335 340 345Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val350 355 360Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr365 370 375Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr380 385 390Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser395 400 405Leu Ser Gln Pro Gly Ser Ser410SEQ ID NO2的资料长度1236类型核酸链型双链拓扑结构线性分子类型基因组DNA原始来源生物激烈热球菌菌株DSM 3638序列描述GCAGAATTAG AAGGACTGGA TGAGTCTGCA GCTCAAGTTA TGGCAACTTA CGTTTGGAAC60TTGGGATATG ATGGTTCTGG AATCACAATA GGAATAATTG ACACTGGAAT TGACGCTTCT 120CATCCAGATC TCCAAGGAAA AGTAATTGGG TGGGTAGATT TTGTCAATGG TAGGAGTTAT 180CCATACGATG ACCATGGACA TGGAACTCAT GTAGCTTCAA TAGCAGCTGG TACTGGAGCA 240GCAAGTAATG GCAAGTACAA GGGAATGGCT CCAGGAGCTA AGCTGGCGGG AATTAAGGTT 300CTAGGTGCCG ATGGTTCTGG AAGCATATCT ACTATAATTA AGGGAGTTGA GTGGGCCGTT 360GATAACAAAG ATAAGTACGG AATTAAGGTC ATTAATCTTT CTCTTGGTTC AAGCCAGAGC 420TCAGATGGTA CTGACGCTCT AAGTCAGGCT GTTAATGCAG CGTGGGATGC TGGATTAGTT 480GTTGTGGTTG CCGCTGGAAA CAGTGGACCT AACAAGTATA CAATCGGTTC TCCAGCAGCT 540GCAAGCAAAG TTATTACAGT TGGAGCCGTT GACAAGTATG ATGTTATAAC AAGCTTCTCA 600AGCAGAGGGC CAACTGCAGA CGGCAGGCTT AAGCCTGAGG TTGTTGCTCC AGGAAACTGG 660ATAATTGCTG CCAGAGCAAG TGGAACTAGC ATGGGTCAAC CAATTAATGA CTATTACACA 720GCAGCTCCTG GGACATCAAT GGCAACTCCT CACGTAGCTG GTATTGCAGC CCTCTTGCTC 780CAAGCACACC CGAGCTGGAC TCCAGACAAA GTAAAAACAG CCCTCATAGA AACTGCTGAT 840ATCGTAAAGC CAGATGAAAT AGCCGATATA GCCTACGGTG CAGGTAGGGT TAATGCATAC 900AAGGCTATAA ACTACGATAA CTATGCAAAG CTAGTGTTCA CTGGATATGT TGCCAACAAA 960GGCAGCCAAA CTCACCAGTT CGTTATTAGC GGAGCTTCGT TCGTAACTGC CACATTATAC 1020TGGGACAATG CCAATAGCGA CCTTGATCTT TACCTCTACG ATCCCAATGG AAACCAGGTT 1080GACTACTCTT ACACCGCCTA CTATGGATTC GAAAAGGTTG GTTATTACAA CCCAACTGAT 1140GGAACATGGA CAATTAAGGT TGTAAGCTAC AGCGGAAGTG CAAACTATCA AGTAGATGTG 1200GTAAGTGATG GTTCCCTTTC ACAGCCTGGA AGTTCA1236SEQ ID NO3的资料长度29类型氨基酸链型单链拓扑结构线性分子类型肽序列描述Met Arg Ser Lys Lys Leu Trp Ile Ser Leu Leu Phe Ala Leu Thr5 10 15Leu Ile Phe Thr Met Ala Phe Ser Asn Met Ser Ala Gln Ala20 25SEQ ID NO4的资料长度522类型氨基酸链型单链拓扑结构线性分子类型肽特征其它资料在428位的Xaa是Gly或Val序列描述Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala5 10 15Thr Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile20 25 30Gly Ile Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln35 40 45Gly Lys Val Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr50 55 60Pro Tyr Asp Asp His Gly His Gly Thr His Val Ala Ser Ile Ala65 70 75Ala Gly Thr Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala80 85 90Pro Gly Ala Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly95 100 105Ser Gly Ser Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val110 115 120Asp Asn Lys Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu125 130 135Gly Ser Ser Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala140 145 150Val Asn Ala Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala155 160 165Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala170 175 180Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val185 190 195Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu200 205 210Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg215 220 225Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr230 235 240Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile245 250 255Ala Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys260 265 270Val Lys Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp275 280 285Glu Ile Ala Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr290 295 300Lys Ala Ile Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly305 310 315Tyr Val Ala Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser320 325 330Gly Ala Ser Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn335 340 345Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val350 355 360Asp Tyr Ser Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr365 370 375Tyr Asn Pro Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr380 385 390Ser Gly Ser Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser395 400 405Leu Ser Gln Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr410 415 420Val Asp Ala Lys Thr Phe Gln Xaa Ser Asp His Tyr Tyr Tyr Asp425 430 435Arg Ser Asp Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys
440 445 450Ile Thr Gly Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp455 460 465Leu Tyr Leu Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu470 475 480Ser Pro Asn Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro485 490 495Gly Thr Trp Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp500 505 510Ala Tyr Tyr Glu Leu Thr Ala Lys Val Tyr Tyr Gly515 520SEQ ID NO5的资料长度4765类型核酸链型双链拓扑结构线性分子类型基因组DNA原始来源生物激烈热球菌菌株DSM 3638序列描述TTTAAATTAT AAGATATAAT CACTCCGAGT GATGAGTAAG ATACATCATT ACAGTCCCAA 60AATGTTTATA ATTGGAACGC AGTGAATATA CAAAATGAAT ATAACCTCGG AGGTGACTGT 120AGAATGAATA AGAAGGGACT TACTGTGCTA TTTATAGCGA TAATGCTCCT TTCAGTAGTT 180CCAGTGCACT TTGTGTCCGC AGAAACACCA CCGGTTAGTT CAGAAAATTC AACAACTTCT 240ATACTCCCTA ACCAACAAGT TGTGACAAAA GAAGTTTCAC AAGCGGCGCT TAATGCTATA 300ATGAAAGGAC AACCCAACAT GGTTCTTATA ATCAAGACTA AGGAAGGCAA ACTTGAAGAG 360GCAAAAACCG AGCTTGAAAA GCTAGGTGCA GAGATTCTTG ACGAAAATAG AGTTCTTAAC 420ATGTTGCTAG TTAAGATTAA GCCTGAGAAA GTTAAAGAGC TCAACTATAT CTCATCTCTT 480GAAAAAGCCT GGCTTAACAG AGAAGTTAAG CTTTCCCCTC CAATTGTCGA AAAGGACGTC 540AAGACTAAGG AGCCCTCCCT AGAACCAAAA ATGTATAACA GCACCTGGGT AATTAATGCT 600CTCCAGTTCA TCCAGGAATT TGGATATGAT GGTAGTGGTG TTGTTGTTGC AGTACTTGAC 660ACGGGAGTTG ATCCGAACCA TCCTTTCTTG AGCATAACTC CAGATGGACG CAGGAAAATT 720ATAGAATGGA AGGATTTTAC AGACGAGGGA TTCGTGGATA CATCATTCAG CTTTAGCAAG 780GTTGTAAATG GGACTCTTAT AATTAACACA ACATTCCAAG TGGCCTCAGG TCTCACGCTG 840AATGAATCGA CAGGACTTAT GGAATACGTT GTTAAGACTG TTTACGTGAG CAATGTGACC 900ATTGGAAATA TCACTTCTGC TAATGGCATC TATCACTTCG GCCTGCTCCC AGAAAGATAC 960TTCGACTTAA ACTTCGATGG TGATCAAGAG GACTTCTATC CTGTCTTATT AGTTAACTCC 1020ACTGGCAATG GTTATGACAT TGCATATGTG GATACTGACC TTGACTACGA CTTCACCGAC 1080GAAGTTCCAC TTGGCCAGTA CAACGTTACT TATGATGTTG CTGTTTTTAG CTACTACTAC 1140GGTCCTCTCA ACTACGTGCT TGCAGAAATA GATCCTAACG GAGAATATGC AGTATTTGGG 1200TGGGATGGTC ACGGTCACGG AACTCACGTA GCTGGAACTG TTGCTGGTTA CGACAGCAAC 1260AATGATGCTT GGGATTGGCT CAGTATGTAC TCTGGTGAAT GGGAAGTGTT CTCAAGACTC 1320TATGGTTGGG ATTATACGAA CGTTACCACA GACACCGTGC AGGGTGTTGC TCCAGGTGCC 1380CAAATAATGG CAATAAGAGT TCTTAGGAGT GATGGACGGG GTAGCATGTG GGATATTATA 1440GAAGGTATGA CATACGCAGC AACCCATGGT GCAGACGTTA TAAGCATGAG TCTCGGTGGA 1500AATGCTCCAT ACTTAGATGG TACTGATCCA GAAAGCGTTG CTGTGGATGA GCTTACCGAA 1560AAGTACGGTG TTGTATTCGT AATAGCTGCA GGAAATGAAG GTCCTGGCAT TAACATCGTT 1620GGAAGTCCTG GTGTTGCAAC AAAGGCAATA ACTGTTGGAG CTGCTGCAGT GCCCATTAAC 1680GTTGGAGTTT ATGTTTCCCA AGCACTTGGA TATCCTGATT ACTATGGATT CTATTACTTC 1740CCCGCCTACA CAAACGTTAG AATAGCATTC TTCTCAAGCA GAGGGCCGAG AATAGATGGT 1800GAAATAAAAC CCAATGTAGT GGCTCCAGGT TACGGAATTT ACTCATCCCT GCCGATGTGG 1860ATTGGCGGAG CTGACTTCAT GTCTGGAACT TCGATGGCTA CTCCACATGT CAGCGGTGTC 1920GTTGCACTCC TCATAAGCGG GGCAAAGGCC GAGGGAATAT ACTACAATCC AGATATAATT 1980AAGAAGGTTC TTGAGAGCGG TGCAACCTGG CTTGAGGGAG ATCCATATAC TGGGCAGAAG 2040TACACTGAGC TTGACCAAGG TCATGGTCTT GTTAACGTTA CCAAGTCCTG GGAAATCCTT 2100AAGGCTATAA ACGGCACCAC TCTCCCAATT GTTGATCACT GGGCAGACAA GTCCTACAGC 2160GACTTTGCGG AGTACTTGGG TGTGGACGTT ATAAGAGGTC TCTACGCAAG GAACTCTATA 2220CCTGACATTG TCGAGTGGCA CATTAAGTAC GTAGGGGACA CGGAGTACAG AACTTTTGAG 2280ATCTATGCAA CTGAGCCATG GATTAAGCCT TTTGTCAGTG GAAGTGTAAT TCTAGAGAAC 2340AATACCGAGT TTGTCCTTAG GGTGAAATAT GATGTAGAGG GTCTTGAGCC AGGTCTCTAT 2400GTTGGAAGGA TAATCATTGA TGATCCAACA ACGCCAGTTA TTGAAGACGA GATCTTGAAC 2460ACAATTGTTA TTCCCGAGAA GTTCACTCCT GAGAACAATT ACACCCTCAC CTGGTATGAT 2520ATTAATGGTC CAGAAATGGT GACTCACCAC TTCTTCACTG TGCCTGAGGG AGTGGACGTT 2580CTCTACGCGA TGACCACATA CTGGGACTAC GGTCTGTACA GACCAGATGG AATGTTTGTG 2640TTCCCATACC AGCTAGATTA TCTTCCCGCT GCAGTCTCAA ATCCAATGCC TGGAAACTGG 2700GAGCTAGTAT GGACTGGATT TAACTTTGCA CCCCTCTATG AGTCGGGCTT CCTTGTAAGG 2760ATTTACGGAG TAGAGATAAC TCCAAGCGTT TGGTACATTA ACAGGACATA CCTTGACACT 2820AACACTGAAT TCTCAATTGA ATTCAATATT ACTAACATCT ATGCCCCAAT TAATGCAACT 2880CTAATCCCCA TTGGCCTTGG AACCTACAAT GCGAGCGTTG AAAGCGTTGG TGATGGAGAG 2940TTCTTCATAA AGGGCATTGA AGTTCCTGAA GGCACCGCAG AGTTGAAGAT TAGGATAGGC 3000AACCCAAGTG TTCCGAATTC AGATCTAGAC TTGTACCTTT ATGACAGTAA AGGCAATTTA 3060GTGGCCTTAG ATGGAAACCC AACAGCAGAA GAAGAGGTTG TAGTTGAGTA TCCTAAGCCT 3120GGAGTTTATT CAATAGTAGT ACATGGTTAC AGCGTCAGGG ACGAAAATGG TAATCCAACG 3180ACAACCACCT TTGACTTAGT TGTTCAAATG ACCCTTGATA ATGGAAACAT AAAGCTTGAC 3240AAAGACTCGA TTATTCTTGG AAGCAATGAA AGCGTAGTTG TAACTGCAAA CATAACAATT 3300GATAGAGATC ATCCTACAGG AGTATACTCT GGTATCATAG AGATTAGAGA TAATGAGGTC 3360TACCAGGATA CAAATACTTC AATTGCGAAA ATACCCATAA CTTTGGTAAT TGACAAGGCG 3420GACTTTGCCG TTGGTCTCAC ACCAGCAGAG GGAGTACTTG GAGAGGCTAG AAATTACACT 3480CTAATTGTAA AGCATGCCCT AACACTAGAG CCTGTGCCAA ATGCTACAGT GATTATAGGA 3540AACTACACCT ACCTCACAGA CGAAAACGGT ACAGTGACAT TCACGTATGC TCCAACTAAG 3600TTAGGCAGTG ATGAAATCAC AGTCATAGTT AAGAAAGAGA ACTTCAACAC ATTAGAGAAG 3660ACCTTCCAAA TCACAGTATC AGAGCCTGAA ATAACTGAAG AGGACATAAA TGAGCCCAAG 3720CTTGCAATGT CATCACCAGA AGCAAATGCT ACCATAGTAT CAGTTTAGAT GGAGAGTGAG 3780GGTGGCGTTA AAAAGACAGT GACAGTGGAA ATAACTATAA ACGGAACCGC TAATGAGACT 3840GCAACAATAG TGGTTCCTGT TCCTAAGAAG GCCGAAAACA TCGAGGTAAG TGGAGACCAC 3900GTAATTTCCT ATAGTATAGA GGAAGGAGAG TACGCCAAGT ACGTTATAAT TACAGTGAAG 3960TTTGCATCAC CTGTAACAGT AACTGTTACT TACACTATCT ATGCTGGCCC AAGAGTCTCA 4020ATCTTGACAC TTAACTTCCT TGGCTACTCA TGGTACAGAC TATATTCACA GAAGTTTGAC 4080GAATTGTACC AAAAGGCCCT TGAATTGGGA GTGGACAACG AGACATTAGC TTTAGCCCTC 4140AGCTACCATG AAAAAGCCAA AGAGTACTAC GAAAAGGCCC TTGAGCTTAG CGAGGGTAAC 4200ATAATCCAAT ACCTTGGAGA CATAAGACTA TTACCTCCAT TAAGACAGGC ATACATCAAT 4260GAAATGAAGG CAGTTAAGAT ACTGGAAAAG GCCATAGAAG AATTAGAGGG TGAAGAGTAA 4320TCTCCAATTT TTCCCACTTT TTCTTTTATA ACATTCCAAG CCTTTTCTTA GCTTCTTCGC 4380TCATTCTACT AGGAGTCCAT GGAGGATCAA AGGTAAGTTC AACCTCCACA TCTCTTACTC 4440CTGGGATTTC GAGTACTTTC TCCTCTACAG CTCTAAGAAG CCAGAGAGTT AAAGGACACC 4500CAGGAGTTGT CATTGTCATC TTTATATATA CCGTTTTGTC AGGATTAATC TTTAGCTCAT 4560AAATTAATCC AAGGTTTACA ACATCCATCC CAATTTCTGG GTCGATAACC TCCTTTAGCT 4620TTTCCAGAAT CATTTCTTCA GTAATTTCAA GGTTCTCATC TTTGGTTTCT CTCACAAACC 4680CAATTTCAAC CTGCCTGATA CCTTCTAACT CCCTAAGCTT GTTATATATC TCCAAAAGAG 4740TGGCATCATC AATTTTCTCT TTAAA4765SEQ ID NO6的资料长度1398类型氨基酸链型单链拓扑结构线性分子类型肽序列描述Met Asn Lys Lys Gly Leu Thr Val Leu Phe Ile Ala Ile Met Leu5 10 15Leu Ser Val Val Pro Val His Phe Val Ser Ala Glu Thr Pro Pro20 25 30Val Ser Ser Glu Asn Ser Thr Thr Ser Ile Leu Pro Asn Gln Gln35 40 45Val Val Thr Lys Glu Val Ser Gln Ala Ala Leu Asn Ala Ile Met50 55 60Lys Gly Gln Pro Asn Met Val Leu Ile Ile Lys Thr Lys Glu Gly65 70 75Lys Leu Glu Glu Ala Lys Thr Glu Leu Glu Lys Leu Gly Ala Glu80 85 90Ile Leu Asp Glu Asn Arg Val Leu Asn Met Leu Leu Val Lys Ile95 100 105Lys Pro Glu Lys Val Lys Glu Leu Asn Tyr Ile Ser Ser Leu Glu110 115 120Lys Ala Trp Leu Asn Arg Glu Val Lys Leu Ser Pro Pro Ile Val125 130 135Glu Lys Asp Val Lys Thr Lys Glu Pro Ser Leu Glu Pro Lys Met140 145 150Tyr Asn Ser Thr Trp Val Ile Asn Ala Leu Gln Phe Ile Gln Glu155 160 165Phe Gly Tyr Asp Gly Ser Gly Val Val Val Ala Val Leu Asp Thr170 175 180Gly Val Asp Pro Asn His Pro Phe Leu Ser Ile Thr Pro Asp Gly185 190 195Arg Arg Lys Ile Ile Glu Trp Lys Asp Phe Thr Asp Glu Gly Phe200 205 210Val Asp Thr Ser Phe Ser Phe Ser Lys Val Val Asn Gly Thr Leu215 220 225Ile Ile Asn Thr Thr Phe Gln Val Ala Ser Gly Leu Thr Leu Asn230 235 240Glu Ser Thr Gly Leu Met Glu Tyr Val Val Lys Thr Val Tyr Val245 250 255Ser Asn Val Thr Ile Gly Asn Ile Thr Ser Ala Asn Gly Ile Tyr260 265 270His Phe Gly Leu Leu Pro Glu Arg Tyr Phe Asp Leu Asn Phe Asp275 280 285Gly Asp Gln Glu Asp Phe Tyr Pro Val Leu Leu Val Asn Ser Thr290 295 300Gly Asn Gly Tyr Asp Ile Ala Tyr Val Asp Thr Asp Leu Asp Tyr305 310 315Asp Phe Thr Asp Glu Val Pro Leu Gly Gln Tyr Asn Val Thr Tyr320 325 330Asp Val Ala Val Phe Ser Tyr Tyr Tyr Gly Pro Leu Asn Tyr Val335 340 345Leu Ala Glu Ile Asp Pro Asn Gly Glu Tyr Ala Val Phe Gly Trp350 355 360Asp Gly His Gly His Gly Thr His Val Ala Gly Thr Val Ala Gly365 370 375Tyr Asp Ser Asn Asn Asp Ala Trp Asp Trp Leu Ser Met Tyr Ser380 385 390Gly Glu Trp Glu Val Phe Ser Arg Leu Tyr Gly Trp Asp Tyr Thr395 400 405Asn Val Thr Thr Asp Thr Val Gln Gly Val Ala Pro Gly Ala Gln410 415 420Ile Met Ala Ile Arg Val Leu Arg Ser Asp Gly Arg Gly Ser Met425 430 435Trp Asp Ile Ile Glu Gly Met Thr Tyr Ala Ala Thr His Gly Ala440 445 450Asp Val Ile Ser Met Ser Leu Gly Gly Asn Ala Pro Tyr Leu Asp455 460 465Gly Thr Asp Pro Glu Ser Val Ala Val Asp Glu Leu Thr Glu Lys470 475 480Tyr Gly Val Val Phe Val Ile Ala Ala Gly Asn Glu Gly Pro Gly485 490 495Ile Asn Ile Val Gly Ser Pro Gly Val Ala Thr Lys Ala Ile Thr500 505 510Val Gly Ala Ala Ala Val Pro Ile Asn Val Gly Val Tyr Val Ser515 520 525Gln Ala Leu Gly Tyr Pro Asp Tyr Tyr Gly Phe Tyr Tyr Phe Pro530 535 540Ala Tyr Thr Asn Val Arg Ile Ala Phe Phe Ser Ser Arg Gly Pro545 550 555Arg Ile Asp Gly Glu Ile Lys Pro Asn Val Val Ala Pro Gly Tyr560 565 570Gly Ile Tyr Ser Ser Leu Pro Met Trp Ile Gly Gly Ala Asp Phe575 580 585Met Ser Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Val590 595 600Ala Leu Leu Ile Ser Gly Ala Lys Ala Glu Gly Ile Tyr Tyr Asn605 610 615Pro Asp Ile Ile Lys Lys Val Leu Glu Ser Gly Ala Thr Trp Leu620 625 630Glu Gly Asp Pro Tyr Thr Gly Gln Lys Tyr Thr Glu Leu Asp Gln635 640 645Gly His Gly Leu Val Asn Val Thr Lys Ser Trp Glu Ile Leu Lys650 655 660Ala Ile Asn Gly Thr Thr Leu Pro Ile Val Asp His Trp Ala Asp665 670 675Lys Ser Tyr Ser Asp Phe Ala Glu Tyr Leu Gly Val Asp Val Ile680 685 690Arg Gly Leu Tyr Ala Arg Asn Ser Ile Pro Asp Ile Val Glu Trp695 700 705His Ile Lys Tyr Val Gly Asp Thr Glu Tyr Arg Thr Phe Glu Ile710 715 720Tyr Ala Thr Glu Pro Trp Ile Lys Pro Phe Val Ser Gly Ser Val
725 730 735Ile Leu Glu Asn Asn Thr Glu Phe Val Leu Arg Val Lys Tyr Asp740 745 750Val Glu Gly Leu Glu Pro Gly Leu Tyr Val Gly Arg Ile Ile Ile755 760 765Asp Asp Pro Thr Thr Pro Val Ile Glu Asp Glu Ile Leu Asn Thr770 775 780Ile Val Ile Pro Glu Lys Phe Thr Pro Glu Asn Asn Tyr Thr Leu785 790 795Thr Trp Tyr Asp Ile Asn Gly Pro Glu Met Val Thr His His Phe800 805 810Phe Thr Val Pro Glu Gly Val Asp Val Leu Tyr Ala Met Thr Thr815 820 825Tyr Trp Asp Tyr Gly Leu Tyr Arg Pro Asp Gly Met Phe Val Phe830 835 840Pro Tyr Gln Leu Asp Tyr Leu Pro Ala Ala Val Ser Asn Pro Met845 850 855Pro Gly Asn Trp Glu Leu Val Trp Thr Gly Phe Asn Phe Ala Pro860 865 870Leu Tyr Glu Ser Gly Phe Leu Val Arg Ile Tyr Gly Val Glu Ile875 880 885Thr Pro Ser Val Trp Tyr Ile Asn Arg Thr Tyr Leu Asp Thr Asn890 895 900Thr Glu Phe Ser Ile Glu Phe Asn Ile Thr Asn Ile Tyr Ala Pro905 910 915Ile Asn Ala Thr Leu Ile Pro Ile Gly Leu Gly Thr Tyr Asn Ala920 925 930Ser Val Glu Ser Val Gly Asp Gly Glu Phe Phe Ile Lys Gly Ile935 940 945Glu Val Pro Glu Gly Thr Ala Glu Leu Lys Ile Arg Ile Gly Asn950 955 960Pro Ser Val Pro Asn Ser Asp Leu Asp Leu Tyr Leu Tyr Asp Ser965 970 975Lys Gly Asn Leu Val Ala Leu Asp Gly Asn Pro Thr Ala Glu Glu980 985 990Glu Val Val Val Glu Tyr Pro Lys Pro Gly Val Tyr Ser Ile Val99510001005Val His Gly Tyr Ser Val Arg Asp Glu Asn Gly Asn Pro Thr Thr101010151020Thr Thr Phe Asp Leu Val Val Gln Met Thr Leu Asp Asn Gly Asn102510301035Ile Lys Leu Asp Lys Asp Ser Ile Ile Leu Gly Ser Asn Glu Ser104010451050Val Val Val Thr Ala Asn Ile Thr Ile Asp Arg Asp His Pro Thr105510601065Gly Val Tyr Ser Gly Ile Ile Glu Ile Arg Asp Asn Glu Val Tyr107010751080Gln Asp Thr Asn Thr Ser Ile Ala Lys Ile Pro Ile Thr Leu Val108510901095Ile Asp Lys Ala Asp Phe Ala Val Gly Leu Thr Pro Ala Glu Gly
110011051110Val Leu Gly Glu Ala Arg Asn Tyr Thr Leu Ile Val Lys His Ala111511201125Leu Thr Leu Glu Pro Val Pro Asn Ala Thr Val Ile Ile Gly Asn113011351140Tyr Thr Tyr Leu Thr Asp Glu Asn Gly Thr Val Thr Phe Thr Tyr114511501155Ala Pro Thr Lys Leu Gly Ser Asp Glu Ile Thr Val Ile Val Lys116011651170Lys Glu Asn Phe Asn Thr Leu Glu Lys Thr Phe Gln Ile Thr Val117511801185Ser Glu Pro Glu Ile Thr Glu Glu Asp Ile Asn Glu Pro Lys Leu119011951200Ala Met Ser Ser Pro Glu Ala Asn Ala Thr Ile Val Ser Val Glu120512101215Met Glu Ser Glu Gly Gly Val Lys Lys Thr Val Thr Val Glu Ile122012251230Thr Ile Asn Gly Thr Ala Asn Glu Thr Ala Thr Ile Val Val Pro123512401245Val Pro Lys Lys Ala Glu Asn Ile Glu Val Ser Gly Asp His Val125012551260Ile Ser Tyr Ser Ile Glu Glu Gly Glu Tyr Ala Lys Tyr Val Ile126512701275Ile Thr Val Lys Phe Ala Ser Pro Val Thr Val Thr Val Thr Tyr128012851290Thr Ile Tyr Ala Gly Pro Arg Val Ser Ile Leu Thr Leu Asn Phe129513001305Leu Gly Tyr Ser Trp Tyr Arg Leu Tyr Ser Gln Lys Phe Asp Glu131013151320Leu Tyr Gln Lys Ala Leu Glu Leu Gly Val Asp Asn Glu Thr Leu132513301335Ala Leu Ala Leu Ser Tyr His Glu Lys Ala Lys Glu Tyr Tyr Glu134013451350Lys Ala Leu Glu Leu Ser Glu Gly Asn Ile Ile Gln Tyr Leu Gly135513601365Asp Ile Arg Leu Leu Pro Pro Leu Arg Gln Ala Tyr Ile Asn Glu137013751380Met Lys Ala Val Lys Ile Leu Glu Lys Ala Ile Glu Glu Leu Glu138513901395Gly Glu GluSEQ ID NO7的资料长度35类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述GGWWSDRRTG TTRRHGTHGC DGTDMTYGAC ACBGG 35SEQ ID NO8的资料长度32类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述KSTCACGGAA CTCACGTDGC BGGHACDGTT GC 32SEQ ID NO9的资料长度33类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述ASCMGCAACH GTKCCVGCHA CGTGAGTTCC GTG 33SEQ ID NO10的资料长度34类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述CHCCGSYVAC RTGBGGAGWD GCCATBGAVG TDCC34SEQ ID NO11的资料长度1977类型核酸链型双链拓扑结构线性分子类型基因组DNA原始来源生物速生热球菌菌株DSM 2476序列描述ATGAAGAGGT TAGGTGCTGT GGTGCTGGCA CTGGTGCTCG TGGGTCTTCT GGCCGGAACG60GCCCTTGCGG CACCCGTAAA ACCGGTTGTC AGGAACAACG CGGTTCAGCA GAAGAACTAC 120GGACTGCTGA CCCCGGGACT GTTCAAGAAA GTCCAGAGGA TGAACTGGAA CCAGGAAGTG 180GACACCGTCA TAATGTTCGG GAGCTACGGA GACAGGGACA GGGCGGTTAA GGTACTGAGG 240CTCATGGGCG CCCAGGTCAA GTACTCCTAC AAGATAATCC CTGCTGTCGC GGTTAAAATA 300AAGGCCAGGG ACCTTCTGCT GATCGCGGGC ATGATAGACA CGGGTTACTT CGGTAACACA 360AGGGTCTCGG GCATAAAGTT CATACAGGAG GATTACAAGG TTCAGGTTGA CGACGCCACT 420TCCGTCTCCC AGATAGGGGC CGATACCGTC TGGAACTCCC TCGGCTACGA CGGAAGCGGT 480GTGGTGGTTG CCATCGTCGA TACGGGTATA GACGCGAACC ACCCCGATCT GAAGGGCAAG 540GTCATAGGCT GGTACGACGC CGTCAACGGC AGGTCGACCC CCTACGATGA CCAGGGACAC 600GGAACCCACG TTGCGGGTAT CGTTGCCGGA ACCGGCAGCG TTAACTCCCA GTACATAGGC 660GTCGCCCCCG GCGCGAAGCT CGTCGGCGTC AAGGTTCTCG GTGCCGACGG TTCGGGAAGC 720GTCTCCACCA TCATCGCGGG TGTTAGCTGG GTCGTCCAGA ACAAGGACAA GTACGGGATA 780AGGGTCATCA ACCTCTCCCT CGGCTCCTCC CAGAGCTCCG ACGGAACCGA CTCCCTCAGT 840CAGGCCGTCA ACAACGCCTG GGACGCCGGT ATAGTAGTCT GCGTCGCCGC CGGCAACAGC 900GGGCCGAACA CCTACACCGT CGGCTCACCC GCCGCCGCGA GCAAGGTCAT AACCGTCGGT 960GCAGTTGACA GCAACGACAA CATCGCCAGC TTCTCCAGCA GGGGACCGAC CGCGGACGGA 1020AGGCTCAAGC CGGAAGTCGT CGCCCCCGGC GTTGACATCA TAGCCCCGCG CGCCAGCGGA 1080ACCAGCATGG GCACCCCGAT AAACGACTAC TACACCAAGG CCTCTGGAAC CAGCATGGCC 1140ACCCCGCACG TTTCGGGCGT TGGCGCGCTC ATCCTCCAGG CCCACCCGAG CTGGACCCCG 1200GACAAGGTCA AGACCGCCCT CATCGGAGAC GCCGACATAG TCGCCCCCAA GGAGATAGCG 1260GACATCGCCT ACGGTGCGGG TAGGGTGAAC GTCTACAAGG CCATCAAGTA CGACGACTAC 1320GCCAAGCTCA CCTTCACCGG CTCCGTCGCC GACAAGGGAA GCGCCACCCA CACCTTCGAC 1380GTCAGCGGCG CCACCTTCGT GACCGCCACC CTCTACTGGG ACACGGGCTC GAGCGACATC 1440GACCTCTACC TCTACGACCC CAACGGGAAC GAGGTTGACT ACTCCTACAC CGCCTACTAC 1500GGCTTCGAGA AGGTCGGCTA CTACAACCCG ACCGCCGGAA CCTGGACGGT CAAGGTCGTC 1560AGCTACAAGG GCGCGGCGAA CTACCAGGTC GACGTCGTCA GCGACGGGAG CCTCAGCCAG 1620TCCGGCGGCG GCAACCCGAA TCCAAACCCC AACCCGAACC CAACCCCGAC CACCGACACC 1680CAGACCTTCA CCGGTTCCGT TAACGACTAC TGGGACACCA GCGACACCTT CACCATGAAC 1740GTCAACAGCG GTGCCACCAA GATAACCGGT GACCTGACCT TCGATACTTC CTACAACGAC 1800CTCGACCTCT ACCTCTACGA CCCCAACGGC AACCTCGTTG ACAGGTCCAC GTCGAGCAAC 1860AGCTACGAGC ACGTCGAGTA CGCCAACCCC GCCCCGGGAA CCTGGACGTT CCTCGTCTAC 1920GCCTACAGCA CCTACGGCTG GGCGGACTAC CAGCTCAAGG CCGTCGTCTA CTACGGG 1977SEQ ID NO12的资料长度659类型氨基酸链型单链拓扑结构线性分子类型肽序列描述Met Lys Arg Leu Gly Ala Val Val Leu Ala Leu Val Leu Val Gly5 10 15Leu Leu Ala Gly Thr Ala Leu Ala Ala Pro Val Lys Pro Val Val20 25 30Arg Asn Asn Ala Val Gln Gln Lys Asn Tyr Gly Leu Leu Thr Pro35 40 45Gly Leu Phe Lys Lys Val Gln Arg Met Asn Trp Asn Gln Glu Val50 55 60Asp Thr Val Ile Met Phe Gly Ser Tyr Gly Asp Arg Asp Arg Ala65 70 75Val Lys Val Leu Arg Leu Met Gly Ala Gln Val Lys Tyr Ser Tyr80 85 90Lys Ile Ile Pro Ala Val Ala Val Lys Ile Lys Ala Arg Asp Leu95 100 105Leu Leu Ile Ala Gly Met Ile Asp Thr Gly Tyr Phe Gly Asn Thr110 115 120Arg Val Ser Gly Ile Lys Phe Ile Gln Glu Asp Tyr Lys Val Gln125 130 135Val Asp Asp Ala Thr Ser Val Ser Gln Ile Gly Ala Asp Thr Val140 145 150Trp Asn Ser Leu Gly Tyr Asp Gly Ser Gly Val Val Val Alu Ile155 160 165Val Asp Thr Gly Ile Asp Ala Asn His Pro Asp Leu Lys Gly Lys170 175 180Val Ile Gly Trp Tyr Asp Ala Val Asn Gly Arg Ser Thr Pro Tyr185 190 195Asp Asp Gln Gly His Gly Thr His Val Ala Gly Ile Val Ala Gly200 205 210Thr Gly Ser Val Asn Ser Gln Tyr Ile Gly Val Ala Pro Gly Ala215 220 225Lys Leu Val Gly Val Lys Val Leu Gly Ala Asp Gly Ser Gly Ser230 235 240Val Ser Thr Ile Ile Ala Gly Val Asp Trp Val Val Gln Asn Lys245 250 255Asp Lys Tyr Gly Ile Arg Val Ile Asn Leu Ser Leu Gly Ser Ser260 265 270Gln Ser Ser Asp Gly Thr Asp Ser Leu Ser Gln Ala Val Asn Asn275 280 285Ala Trp Asp Ala Gly Ile Val Val Cys Val Ala Ala Gly Asn Ser290 295 300Gly Pro Asn Thr Tyr Thr Val Gly Ser Pro Ala Ala Ala Ser Lys305 310 315Val Ile Thr Val Gly Ala Val Asp Ser Asn Asp Asn Ile Ala Ser320 325 330Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu335 340 345Val Val Ala Pro Gly Val Asp Ile Ile Ala Pro Arg Ala Ser Gly350 355 360Thr Ser Met Gly Thr Pro Ile Asn Asp Tyr Tyr Thr Lys Ala Ser365 370 375Gly Thr Ser Met Ala Thr Pro His Val Ser Gly Val Gly Ala Leu380 385 390Ile Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr395 400 405Ala Leu Ile Glu Thr Ala Asp Ile Val Ala Pro Lys Glu Ile Ala410 415 420Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Val Tyr Lys Ala Ile425 430 435Lys Tyr Asp Asp Tyr Ala Lys Leu Thr Phe Thr Gly Ser Val Ala440 445 450Asp Lys Gly Ser Ala Thr His Thr Phe Asp Val Ser Gly Ala Thr455 460 465Phe Val Thr Ala Thr Leu Tyr Trp Asp Thr Gly Ser Ser Asp Ile470 475 480Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Glu Val Asp Tyr Ser485 490 495Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro500 505 510Thr Ala Gly Thr Trp Thr Val Lys Val Val Ser Tyr Lys Gly Ala515 520 525Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln530 535 540Ser Gly Gly Gly Asn Pro Asn Pro Asn Pro Asn Pro Asn Pro Thr545 550 555Pro Thr Thr Asp Thr Gln Thr Phe Thr Gly Ser Val Asn Asp Tyr560 565 570Trp Asp Thr Ser Asp Thr Phe Thr Met Asn Val Asn Ser Gly Ala575 580 585Thr Lys Ile Thr Gly Asp Leu Thr Phe Asp Thr Ser Tyr Asn Asp590 595 600Leu Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Leu Val Asp Arg605 610 615Ser Thr Ser Ser Asn Ser Tyr Glu His Val Glu Tyr Ala Asn Pro620 625 630Ala Pro Gly Thr Trp Thr Phe Leu Val Tyr Ala Tyr Ser Thr Tyr635 640 645Gly Trp Ala Asp Tyr Gln Leu Lys Ala Val Val Tyr Tyr Gly650 655SEQ ID NO13的资料长度28类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述AGAGGGATCC ATGAAGGGGC TGAAAGCT 28SEQ ID NO14的资料长度28类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述AGAGGCATGC GCTCTAGACT CTGGGAGAGT28SEQ ID NO15的资料长度1962类型核酸链型双链拓扑结构线性分子类型基因组DNA原始来源生物激烈热球菌菌株DSM 3638序列描述ATGAAGGGGC TGAAAGCTCT CATATTAGTG ATTTTAGTTC TAGGTTTGGT AGTAGGGAGC60GTAGCGGCAG CTCCAGAGAA GAAAGTTGAA CAAGTAAGAA ATGTTGAGAA GAACTATGGT 120CTGCTAACGC CAGGACTGTT CAGAAAAATT CAAAAATTGA ATCCTAACGA GGAAATCAGC 180ACAGTAATTG TATTTGAAAA CCATAGGGAA AAAGAAATTG CAGTAAGAGT TCTTGAGTTA 240ATGGGTGCAA AAGTTAGGTA TGTGTACCAT ATTATACCCG CAATAGCTGC CGATCTTAAG 300GTTAGAGACT TACTAGTCAT CTCAGGTTTA ACAGGGGGTA AAGCTAAGCT TTCAGGTGTT 360AGGTTTATCC AGGAAGACTA CAAAGTTACA GTTTCAGCAG AATTAGAAGG ACTGGATGAG 420TCTGCAGCTC AAGTTATGGC AACTTACGTT TGGAACTTGG GATATGATGG TTCTGGAATC 480ACAATAGGAA TAATTGACAC TGGAATTGAC GCTTCTCATC CAGATCTCCA AGGAAAAGTA 540ATTGGGTGGG TAGATTTTGT CAATGGTAGG AGTTATCCAT ACGATGACCA TGGACATGGA 600ACTCATGTAG CTTCAATAGC AGCTGGTACT GGAGCAGCAA GTAATGGCAA GTACAAGGGA 660ATGGCTCCAG GAGCTAAGCT GGCGGGAATT AAGGTTCTAG GTGCCGATGG TTCTGGAAGC 720ATATCTACTA TAATTAAGGG AGTTGAGTGG GCCGTTGATA ACAAAGATAA GTACGGAATT 780AAGGTCATTA ATCTTTCTCT TGGTTCAAGC CAGAGCTCAG ATGGTACTGA CGCTCTAAGT 840CAGGCTGTTA ATGCAGCGTG GGATGCTGGA TTAGTTGTTG TGGTTGCCGC TGGAAACAGT 900GGACCTAACA AGTATACAAT CGGTTCTCCA GCAGCTGCAA GCAAAGTTAT TACAGTTGGA 960GCCGTTGACA AGTATGATGT TATAACAAGC TTCTCAAGCA GAGGGCCAAC TGCAGACGGC 1020AGGCTTAAGC CTGAGGTTGT TGCTCCAGGA AACTGGATAA TTGCTGCCAG AGCAAGTGGA 1080ACTAGCATGG GTCAACCAAT TAATGACTAT TACACAGCAG CTCCTGGGAC ATCAATGGCA 1140ACTCCTCACG TAGCTGGTAT TGCAGCCCTC TTGCTCCAAG CACACCCGAG CTGGACTCCA 1200GACAAAGTAA AAACAGCCCT CATAGAAACT GCTGATATCG TAAAGCCAGA TGAAATAGCC 1260GATATAGCCT ACGGTGCAGG TAGGGTTAAT GCATACAAGG CTATAAACTA CGATAACTAT 1320GCAAAGCTAG TGTTCACTGG ATATGTTGCC AACAAAGGCA GCCAAACTCA CCAGTTCGTT 1380ATTAGCGGAG CTTCGTTCGT AACTGCCACA TTATACTGGG ACAATGCCAA TAGCGACCTT 1440GATCTTTACC TCTACGATCC CAATGGAAAC CAGGTTGACT ACTCTTACAC CGCCTACTAT 1500GGATTCGAAA AGGTTGGTTA TTACAACCCA ACTGATGGAA CATGGACAAT TAAGGTTGTA 1560AGCTACAGCG GAAGTGCAAA CTATCAAGTA GATGTGGTAA GTGATGGTTC CCTTTCACAG 1620CCTGGAAGTT CACCATCTCC ACAACCAGAA CCAACAGTAG ACGCAAAGAC GTTCCAAGGA 1680TCCGATCACT ACTACTATGA CAGGAGCGAC ACCTTTACAA TGACCGTTAA CTCTGGGGCT 1740ACAAAGATTA CTGGAGACCT AGTGTTTGAC ACAAGCTACC ATGATCTTGA CCTTTACCTC 1800TACGATCCTA ACCAGAAGCT TGTAGATAGA TCGGAGAGTC CCAACAGCTA CGAACACGTA 1860GAATACTTAA CCCCCGCCCC AGGAACCTGG TACTTCCTAG TATATGCCTA CTACACTTAC 1920GGTTGGGCTT ACTACGAGCT GACGGCTAAA GTTTATTATG GC 1962SEQ ID NO16的资料长度654类型氨基酸链型单链拓扑结构线性分子类型肽序列描述Met Lys Gly Leu Lys Ala Leu Ile Leu Val Ile Leu Val Leu Gly5 10 15Leu Val Val Gly Ser Val Ala Ala Ala Pro Glu Lys Lys Val Glu20 25 30Gln Val Arg Asn Val Glu Lys Asn Tyr Gly Leu Leu Thr Pro Gly35 40 45Leu Phe Arg Lys Ile Gln Lys Leu Asn Pro Asn Glu Glu Ile Ser50 55 60Thr Val Ile Val Phe Glu Asn His Arg Glu Lys Glu Ile Ala Val65 70 75Arg Val Leu Glu Leu Met Gly Ala Lys Val Arg Tyr Val Tyr His80 85 90Ile Ile Pro Ala Ile Ala Ala Asp Leu Lys Val Arg Asp Leu Leu95 100 105Val Ile Ser Gly Leu Thr Gly Gly Lys Ala Lys Leu Ser Gly Val110 115 120Arg Phe Ile Gln Glu Asp Tyr Lys Val Thr Val Ser Ala Glu Leu125 130 135Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr Tyr Val140 145 150Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile Ile155 160 165Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val170 175 180Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp185 190 195Asp His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr200 205 210Gly Ala Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala215 220 225Lys Leu Ala Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser230 235 240Ile Ser Thr Ile Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys245 250 255Asp Lys Tyr Gly Ile Lys Val Ile Asn Leu Ser Leu Gly Ser Ser260 265 270Gln Ser Ser Asp Gly Thr Asp Ala Leu Ser Gln Ala Val Asn Ala275 280 285Ala Trp Asp Ala Gly Leu Val Val Val Val Ala Ala Gly Asn Ser
290 295 300Gly Pro Asn Lys Tyr Thr Ile Gly Ser Pro Ala Ala Ala Ser Lys305 310 315Val Ile Thr Val Gly Ala Val Asp Lys Tyr Asp Val Ile Thr Ser320 325 330Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly Arg Leu Lys Pro Glu335 340 345Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala Arg Ala Ser Gly350 355 360Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr Ala Ala Pro365 370 375Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala Ala Leu380 385 390Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys Thr395 400 405Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp Glu Ile Ala410 415 420Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr Lys Ala Ile425 430 435Asn Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly Tyr Val Ala440 445 450Asn Lys Gly Ser Gln Thr His Gln Phe Val Ile Ser Gly Ala Ser455 460 465Phe Val Thr Ala Thr Leu Tyr Trp Asp Asn Ala Asn Ser Asp Leu470 475 480Asp Leu Tyr Leu Tyr Asp Pro Asn Gly Asn Gln Val Asp Tyr Ser485 490 495Tyr Thr Ala Tyr Tyr Gly Phe Glu Lys Val Gly Tyr Tyr Asn Pro500 505 510Thr Asp Gly Thr Trp Thr Ile Lys Val Val Ser Tyr Ser Gly Ser515 520 525Ala Asn Tyr Gln Val Asp Val Val Ser Asp Gly Ser Leu Ser Gln530 535 540Pro Gly Ser Ser Pro Ser Pro Gln Pro Glu Pro Thr Val Asp Ala545 550 555Lys Thr Phe Gln Gly Ser Asp His Tyr Tyr Tyr Asp Arg Ser Asp560 565 570Thr Phe Thr Met Thr Val Asn Ser Gly Ala Thr Lys Ile Thr Gly575 580 585Asp Leu Val Phe Asp Thr Ser Tyr His Asp Leu Asp Leu Tyr Leu590 595 600Tyr Asp Pro Asn Gln Lys Leu Val Asp Arg Ser Glu Ser Pro Asn605 610 615Ser Tyr Glu His Val Glu Tyr Leu Thr Pro Ala Pro Gly Thr Trp620 625 630Tyr Phe Leu Val Tyr Ala Tyr Tyr Thr Tyr Gly Trp Ala Tyr Tyr635 640 645Glu Leu Thr Ala Lys Val Tyr Tyr Gly650SEQ ID NO17的资料长度25类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述TCTGAATTCG TTCTTTTCTG TATGG 25SEQ ID NO18的资料长度20类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述TGTACTGCTG GATCCGGCAG 20SEQ ID NO19的资料长度25类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述AGAGGCATGC GTATCCATCA GATTTTTGAG 30SEQ ID NO20的资料长度20类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述AGTGAACGGA TACTTGGAAC 20SEQ ID NO21的资料长度20类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述GTTCCAAGTA TCCGTTCACT 20SEQ ID NO22的资料长度12类型氨基酸链型单链拓扑结构线性分子类型肽序列描述Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln5 10SEQ ID NO23的资料长度24类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)
序列描述TCATGGATCC ACCCTCTCCT TTTA 24SEQ ID NO24的资料长度26类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述GTCTGCGCAG GCTGCCGGAN NNNNNATGAA GGGGCTGAAA GCTCTC 26SEQ ID NO25的资料长度29类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述GAGAGCTTTC AGCCCCTTCA TNNNNNNTCC GGCAGCCTGC GCAGACATG 29SEQ ID NO26的资料长度27类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述AGAGGGGGAT CCGTGAGAAG CAAAAAA 27SEQ ID NO27的资料长度20类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述GATGACTAGT AAGTCTCTAA20SEQ ID NO28的资料长度20类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述AAGCCTGAGG TTGTTGCTCC20SEQ ID NO29的资料长度29类型核酸链型单链拓扑结构线性分子类型其它核酸(合成的DNA)序列描述GGGCATGCTC ATGAACTTCC AGGCTGTGA 2权利要求
1.一种由如下氨基酸序列组成并具有热稳定蛋白酶活性的蛋白酶,在该氨基酸序列中,一个或多个氨基酸残基从由序列表SEQ ID NO4表示的氨基酸序列的C-末端缺失。
2.根据权利要求1的蛋白酶,它由序列表SEQ ID NO1表示的氨基酸序列组成。
3.一种由如下氨基酸序列组成并具有热稳定蛋白酶活性的蛋白酶,在该氨基酸序列中,一至几个氨基酸残基被缺失、替换、插入或添加到由序列表SEQ ID NO1表示的氨基酸序列中。
4.一种编码由如下氨基酸序列组成并具有热稳定蛋白酶活性的蛋白的基因,在该氨基酸序列中,从序列表SEQ ID NO4表示的氨基酸序列的C-末端缺失一个或多个氨基酸残基。
5.根据权利要求4的蛋白酶基因,它编码由序列表SEQ ID NO1表示的氨基酸序列。
6.根据权利要求5的蛋白酶基因,它由序列表SEQ ID NO2表示的碱基序列组成。
7.一种编码由如下氨基酸序列组成并具有热稳定蛋白酶活性的蛋白的蛋白酶基因,在该氨基酸序列中,由序列表SEQ ID NO1表示的氨基酸序列缺失、替换、插入或添加一个至几个氨基酸残基。
8.一种与根据权利要求6的蛋白酶基因在严格条件下杂交且编码具有热稳定蛋白酶活性的蛋白的蛋白酶基因。
9.一种编码由通式I所示的氨基酸序列的基因SIG-Ala-Gly-Gly-Asn-PRO [I]其中SIG表示来源于枯草杆菌蛋白酶信号肽的氨基酸序列,PRO表示被表达的蛋白的氨基酸序列。
10.根据权利要求9的基因,其中SIG是由序列表SEQ ID NO3表示的氨基酸序列。
11.根据权利要求9的基因,其中PRO是一种来源于超嗜热菌的超热稳定蛋白酶的氨基酸序列。
12.根据权利要求11的基因,其中PRO是一种来源于激烈热球菌的蛋白酶的氨基酸序列。
13.根据权利要求12的基因,其中PRO包括根据权利要求1或2的蛋白酶的氨基酸序列。
14.根据权利要求13的基因,它包含在选自pSPO124或pSPO124ΔC的质粒中。
15.根据权利要求9的基因,其中PRO包括根据权利要求2的蛋白酶的氨基酸序列。
16.一种产生蛋白的方法,包括培养导入了根据权利要求9至15中任一项的基因的芽孢杆菌属细菌,并从该培养物中收集目的蛋白。
17.根据权利要求16产生蛋白的方法,其中芽孢杆菌属细菌是枯草芽孢杆菌。
18.根据权利要求16产生蛋白的方法,其中借助于质粒载体把根据权利要求9至15中任一项的基因导入到芽孢杆菌属的细菌中。
19.根据权利要求18产生蛋白的方法,其中选自pSPO124或pSPO124ΔC的质粒被导入到芽孢杆菌属细菌中。
20.根据权利要求19产生蛋白的方法,包括培养枯草芽孢杆菌DB104/pSPO124ΔC FERM BP-6294,并从该培养物中收集目的蛋白。
21.一种把根据权利要求9至15中任一项的基因插入其中的质粒载体。
22.根据权利要求21的质粒载体,它选自pSPO124或pSPO124ΔC。
全文摘要
一种具有由序列表SEQ ID NO:1表示的氨基酸序列或经缺失、替换、插入或添加一个至几个氨基酸残基从其产生的序列的超热稳定蛋白酶,一种编码该超热稳定蛋白酶的基因和一种制备该蛋白酶的方法,目的是通过遗传工程技术提供一种有利于工业应用的超热稳定的蛋白酶。
文档编号C12N15/75GK1260002SQ98805990
公开日2000年7月12日 申请日期1998年6月4日 优先权日1997年6月10日
发明者高蔵晃, 森下美绪, 下条智子, 浅田起代蔵, 加藤郁之进 申请人:宝酒造株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1