利用霉质菌微生物大量生产蛋白质或肽的体系的制作方法

文档序号:451311阅读:387来源:国知局
专利名称:利用霉质菌微生物大量生产蛋白质或肽的体系的制作方法
技术领域
本发明涉及在霉质菌(Humicola)属微生物,尤其是Humicola insolens中大量表达或大量分泌蛋白质或肽的生产体系。
人们已了解霉菌可以将蛋白质分泌到菌体外。因此,就霉菌,人们一直在研究和开发为使其高效生产蛋白质的高产率细胞或培养方法等。
研究和开发的主要手段是通过UV照射、诱变剂等作出人工突变株,然后从中选择出能大量生产目的蛋白质的菌株。
然而,这样的手段在利用多个蛋白质的协调作用表现活性的那样的酶的表达以及想使其活性提高时就变得困难了。而且在生产对长有不良影响的例如致死性蛋白质时,无论怎样对生产目的蛋白的细胞进行变异处理,也不能使生产率提高,这种现象经常遇到。
而最近,人们正在研究利用基因重组技术生产目的蛋白质的方法,在部分霉菌中,大量生产来自异种的蛋白质或在同种中微量存在的蛋白质已成为可能。例如在构巢曲霉Aspergillus nidulans(G.L.Gray,等,《基因》Gene,48,41,1986)、米曲霉Aspergillus oryzae(T.Christensen,等,Bio/Technology,6,1419,1988)、Trichoderma reesei(Taina Karhunen,等,《分子遗传学与普通遗传学》Mol.Gen.Genet,241,515-522,1993)、绿色木霉Trichoderma viride(C.Cheng,等,《农业生物化学》Agric.Biol.Chem.,55,1817,1991)等菌株中都获得了成功,其产率为每升培养液大约1.0~3.3g。
嗜温性霉菌Humicola insolens也具有出色的蛋白质分泌能力。人们已经知道Humicola insolens可以生产各种产业中有用的纤维素酶(WO/17243号公报(特表平5-509223号公报))。
然而,在Humicola insolens分泌的总蛋白质中有用成分大约只占百分之几。如果能够确立使这些微量有用成分大量表达、大量分泌的方法,就可以大幅度地提高生产最终产物的能力。而如果在Humicolainsolens中建立大量表达来自异种的基因的方法,就有可能利用单一的方法生产各种酶和有用的蛋白质,提供更便宜的产品。作为生产有用蛋白质的宿主Humicola insolens由于是嗜温性霉菌,所以最适培养温度在37℃附近,其优点是在培养时,不容易受到其它杂菌的污染。
另外,本发明人中的部分人就象特开平8-56663号公报记载的,已对Humicola insolens确立转化体系、可以使用基因重组技术。
然而可以说对于在Humicola insolens,能够高水平表达、分泌目的蛋白质的有效的表达载体体系的开发依然是人们所追求的。
本发明人等现在确立了大量生产霉质菌属微生物、尤其是Humicola insolens的目的蛋白质的方法。
因此,本发明的目的是提供可能大量生产霉质菌属微生物、尤其是Humicola insolens的目的蛋白质的表达体系、宿主-载体体系以及利用该体系制造蛋白质的方法。
根据本发明的优选状态,可以提供目的蛋白质的产率为亲本菌株的10~16倍,而其产量大约可达到每升培养液4.5g的效率很高的蛋白质生产体系。
附图的简单说明

图1为质粒pM3-1的限制性内切酶图。
图2为质粒pM14-1的限制性内切酶图。
图3为质粒载体-pMKD01的限制性内切酶图。
图4为质粒载体-pEGD01的限制性内切酶图。
图5为质粒载体-pIED02的限制性内切酶图。
微生物的保藏用图1表示的质粒pM3-1转化的大肠杆菌JM109菌株保藏于通商产业省工业技术院生命工程工业技术研究所(日本国茨城县筑波市东1-1-3),保藏号为FERM BP-5971(原保藏号FERM P-14459,原保藏日1994年8月3日)。
用图2表示的质粒pM14-1转化的大肠杆菌JM109菌株保藏于通商产业省工业技术院生命工程工业技术研究所,保藏号为FERM BP-5972(原保藏号FERM P-14585,原保藏日1994年10月18日)。
用本发明的表达载体pMKD01转化的大肠杆菌JM109菌株保藏于通商产业省工业技术院生命工程工业技术研究所,保藏号为FERM BP-5974(原保藏号FERM P-15730,现保藏日1996年7月12日)。
用本发明的表达载体pEGD01转化的大肠杆菌JM109菌株保藏于通商产业省工业技术院生命工程工业技术研究所,保藏号为FERM BP-5973(原保藏号FERM P-15729,原保藏日1996年7月12日)。
用本发明的表达载体pIED02转化的大肠杆菌JM109菌株保藏于通商产业省工业技术院生命工程工业技术研究所,保藏号为FERM BP-5975(原保藏号FERM P-15731,原保藏日1996年7月12日)。
用本发明的表达载体pNCE4Sal转化的大肠杆菌JM109菌株保藏于通商产业省工业技术院生命工程工业技术研究所,保藏号为FERMBP-5976(原保藏号FERM P-15732,原保藏日1996年7月12日)。
作为本发明的表达载体的宿主Humicola insolens MN200-1保藏于通商产业省工业技术院生命工程工业技术研究所,保藏号为FERMBP-5977(原保藏号FERM P-15736,原保藏日1996年7月15日)。
定义本说明书中的蛋白质以及肽只要没有事先说明,使用的含义都是一样的。而本说明书中,所谓的变化序列意思是指在碱基序列或氨基酸序列中,插入、置换、缺失或是在序列的一端或两端附加一~数个碱基或氨基酸后而形成的序列。
Humicola insolens的调控序列在本发明的霉质菌(Humicola)属微生物的表达体系中使用了来自Humicola insolens的调控序列。本发明中的所谓调控序列意思是指从启动子、信号序列、以及终止子组成的序列组中至少选择出的一个序列。
作为本发明的调控序列优选特开平8-56663号公报记载的来自Humicola insolens的纤维素酶NCE1基因的调控序列,特开平8-126492号公报记载的来自Humicola insolens的纤维素酶NCE2基因的调控序列。具体讲是处于以FERM BP-5971,FERM BP-5972保藏的菌株中的质粒pM3-1,质粒pM14-1内的NCE1和2的调控序列。
作为本发明中优选的启动子序列为存在于从图1表示的质粒pM3-1中的NCE1基因的N末端到上游大约1500bp区域内的序列,例如从图中的NCE1基因的N末端到上游的BglⅡ位点的序列。
另外,作为本发明中优选启动子序列的其它例子,有存在于从图2表示的质粒pM14-1中的NCE2基因的N末端到上游大约1500bp区域内的序列,例如从图中的NCE2基因的N末端到上游的EcoRⅠ位点的序列。
同时本发明的启动子序列不仅包括这些区域的整个序列,也包括保持高启动子活性的其变化的序列。本发明中,所谓的高启动子活性指的是在下文中的NCE4基因的表达中实现高表达的强的启动子活性,具体讲,是指实现每升培养液2.0g、优选4.0g、最好是4.5g的NCE4表达的启动子活性。很清楚,对于本领域技术人员来说,如果给出后续实施例记载的资料、以FERM BP-5971,FERM BP-5972号保藏的菌株以及图1或图2的话,则可以容易地预测那样变化序列的存在,而且可以容易地制造。
而作为本发明中优选信号序列的例子,有纤维素酶NCE1或2的信号序列。具体讲,是编码序列1记载的-22到-1氨基酸序列的碱基序列、以及编码序列2记载的-23到-1氨基酸序列的碱基序列。另外本发明中,作为其变化的序列也包括编码依然保持信号序列活性的氨基酸序列的碱基序列。很清楚,就这样变化的序列,对于本领域技术人员来说,如果给出下文实施例记载的资料、以FERM BP-5971,FERM BP-5972号保藏的菌株以及图1或图2的话,可以容易地预测那样变化序列的存在,而且可以容易地制造。
很明显,对于本领域技术人员来说,在实际利用这些序列时,即使在上述的信号序列上附加上NCE1或2的N末端一侧的若干氨基酸也是可以的。即,在利用这些信号序列时,得到的目的蛋白质是与NCE1或2的N末端一侧的若干氨基酸组成的多肽形成的融合蛋白质,即便是与NCE1或2形成的融合蛋白质也可以。
作为本发明中优选终止子序列是存在于从图1表示的质粒pM3-1中的NCE1基因的C端到下游大约1400bp的区域内的序列,例如从NCE1基因的C末端到下游的BglⅡ位点的序列。另外一个例子是存在于从图2表示的质粒pM14-1中的NCE2基因的C端到下游大约500bp的区域内的序列,例如从NCE1基因的C末端到下游的BglⅡ位点的序列。
另外本发明的终止子序列中不仅包括这些区域的全部序列,也包括保持其终止子活性的变化序列。
这些调控序列,尤其是NCE1或NCE2的启动子序列可以以极高的效率使NCE4表达。因此,根据本发明的优选实施方案,提供了在NCE4基因的表达中使用优选调控序列、尤其是NCE4基因的表达中使用优选启动子序列。根据本发明的优选实施方案,纤维素酶NCE4的产率可以达到生产该酶的亲本菌株的产率的10~16倍,其产量可达每升2.0g、优选达4.0g、更优选大约可达4.5g。
表达载体及其宿主根据本发明,提供了用于表达目的蛋白质上述调控序列1种实施方案所需的表达载体。
本发明的表达载体如果按照其优选实施方案,应当是包含上述调控序列,以及包含根据场合不同所需要的标记基因的载体。另外,本发明的表达载体,1种实施方案中的表达载体也含有编码于目的蛋白质的碱基序列,该序列与上述调控序列可操作地连接。因此,至少含有从上述本发明的启动子、信号序列、以及终止子构成的调控序列中选择出的一种序列的表达载体也包含在本发明的范围内。
如上所述,由于本发明的启动子序列是非常有用的,根据本发明的优选实施方案,可以提供至少含有本发明的启动子序列的表达载体。在该表达载体中,信号序列、终止子序列即使是本发明的信号序列和终止子序列以外的也可以,但优选是使用上述的本发明的信号序列和终止子序列。作为这些载体的具体例子,有从后续实施例中构建的表达载体pMKD01、pEGD01和pIED02中除去NCE3和NCE4基因的载体。
本发明的表达载体优选是在宿主细胞中能够复制的载体,例如,从基本上构建的质粒。这样的载体是在大肠杆菌中能够复制的载体,如pUC Vector、pTV Vector、pBluescript、pBR322等。构建本发明载体所必需的手段可以采用基因重组领域中惯用的方法。
而标记基因可以根据转化体的选择手段适当地选择,例如可以利用编码耐药性的基因、营养需求互补的基因。本发明使用的耐药性基因只要是宿主细胞表现出敏感性的药物都可以,并没有限定,例如,如果宿主使用的是Humicola insolens时,最好使用来自Streptomycesrimofaciens的越霉素抗性基因、来自埃希氏大肠杆菌Escherichia coli的潮霉素B抗性基因、Streptococcus hindustanus的博来霉素抗性基因、来自吸水链霉菌Streptomyces hygroscopicus的bialophos抗性基因。
根据本发明的优选实施方案,优选是利用通过众所周知的方法,得到来自构巢曲霉Aspergillus nidulans的trp C基因的启动子和终止子(Mullaney,E.J.等,《分子遗传学与普通遗传学》Mol.Gen.Genet.199:37-45,1985),然后用这些序列将越霉素抗性基因(特开昭59-175889)作成能够表达的盒(cassette)。
本发明的载体可以用于各种目的蛋白质或肽的表达生产。本发明中所谓的目的蛋白质或肽不仅是指Humicola insolens中不存在的所谓的外来蛋白质,也包括Humicola insolens中虽然能够表达,但其表达量很微量的蛋白质。例如,本发明的表达载体中作为编码目的蛋白质的基因有编码纤维素酶、淀粉酶、脂肪酶、蛋白酶、植酸酶等产业上有用的蛋白质的基因。这些基因经人为改造后的基因也同样可以作为目的蛋白质。
本发明的表达载体与作为宿主的腐质霉属微生物组合后作为表达体系。根据本发明的优选产施方案,作为腐质霉属微生物可以利用Humicola insolens。
NCE4基因根据本发明的优选实施方案,本发明的表达体系能很好地用在以来自Humicola insolens的纤维素酶NCE4或它们的变化蛋白质为目的蛋白质的生产上。所谓来自Humicola insolens的纤维素酶NCE4是指序列3记载的蛋白质。就象后续的实施例记载的那样,该蛋白质就是现在通过本发明人分离的纤维素酶。而所谓的变化的蛋白质是指在上述蛋白质的氨基酸序列中发生了附加、插入、剔除、缺失或置换氨基酸等变化而形成的蛋白质,但该蛋白质依然具有与NCE4同样的活性,尤其是保持着葡聚糖内切酶的活性。
根据本发明的优选实施方案,作为这些纤维素酶NCE4的表达体系的优选载体的具体例子有后续实施例中构建的表达载体pMKD01、pEGD01、或pIED02。
本发明表达载体对宿主细胞的转化可以利用具有重组领域中惯用的手段,例如,可以按照特开平8-56663号公报记载的方法实施。也可以按照电穿孔法实施。
目的蛋白质的生产本发明的目的蛋白质的生产是通过将上述本发明表达载体转化的宿主细胞在适当的培养基中培养,从培养物中获得目的蛋白质或肽的过程实施的。
根据本发明的优选实施方案,可以提供目的蛋白质的产率为亲本菌株产率的10~16倍,而且其产量每升培养液为2.0g、优选达4.0g、更优选大约可达4.5g的效率极高的蛋白质生产体系。例如,宿主细胞为Humicola insolens时,其每升培养液可以生产2.0g、优选达4.0g、更优选大约可达4.5g以上的目的蛋白质。该产量与以前所报道的蛋白质表达体系的产量比较高得多。这表明,本发明的目的蛋白质的表达体系具有极高的可利用性。
例如,目的蛋白质是纤维素酶NCE3或NCE4时,这些酶本来活性就很高,所以可以更大量地生产。其结果得到的好处是可能高效地生产在纤维素纤维细毛的除去、减量加工以及斜纹粗棉布染色中纤维素纤维的脱色加工中有用的纤维素酶制剂。
本发明的目的蛋白质的生产方法中的转化体的培养可以在含有惯用的成分,例如碳源、氮源、无机盐、增殖因子等成分的液体培养基中利用有氧条件下的培养法、振荡培养法、电搅拌培养法或深部培养法进行,培养基的pH值为7~8。宿主细胞是Humicola insolens时,培养是在Humicola insolens的培养惯用的条件,例如15℃~45℃,优选35℃~40℃,培养时间为24~240小时的条件下进行的。
当从培养物回收通过本发明得到的蛋白质或肽时,可以使用利用其性质的常用的分离手段,例如溶剂抽提法,离子交换树脂法、吸附或分配柱层析法、凝胶过滤法、透析法、沉淀法等,这些方法可以单独使用,或适当组合起来使用。
以下通过实施例更详细地说明本发明,但本发明并不限定于这些例子。
实施例A1从Humicola insolens分离纯化具有使Tencel细毛除去活性的成分将Humicola insolens MN 200-1于37℃下在(N)培养基(5.0%Avicel、2.0%酵母提取物、0.1%蛋白胨、0.03%氯化钙、0.03%硫酸镁、pH6.8)中培养。培养七天后,将得到的培养液用7000rpm离心20分钟,除去菌体,培养液的上清液就作为粗纤维素酶液。
将该粗纤维素酶液进行疏水层析(Phenyl-Sepharose High Performance 16/100,Phamacia Biotech公司制造),用浓度梯度为1-0 M硫酸铵的50mM磷酸缓冲液(pH7.0)洗脱,分级。其中,由于在浓度梯度为0.1-0 M硫酸铵洗脱时得到的级分表现出很强的去除Tencel细毛的活性,所以再将收集的该级分进行疏水层析(Phenyl-Sepharose High Performance 16/100),用浓度梯度为0.4-0 M硫酸铵的50mM磷酸缓冲液(pH7.0)洗脱,收集活性成分。
将收集的活性级分进行反相层析(Source15 ISO,Phamacia Biotech公司制),用浓度梯度为1-0 M硫酸铵的50mM磷酸缓冲液(pH7.0)洗脱,分级。其中,由于在0 M硫酸铵的50mM磷酸缓冲液洗脱时得到的级分表现出很强的去除Tencel细毛的活性,所以将该级分进行反相层析(Source15 PHE,Phamacia Biotech公司制),用浓度梯度为1-0 M硫酸铵的50mM磷酸缓冲液(pH7.0)洗脱,将分离出的表现出很强的去除Tencel细毛的活性的级分作为纯化酶NCE4。该NCE4在SDS-PAGE中显示出分子量为43kDa的单一一条带。
实施例A2纤维素酶NCE4的部分氨基酸序列(1)N末端氨基酸残基的确定为了确定实施例1中纯化的蛋白质的N末端氨基酸序列,使用FPLC系统(Phamacia Biotech公司制)进行柱层析(柱子RESOURCE(商品名)RPC3ml、含有0.1%的TFA的5%~60%乙腈梯度),分别收集主要的峰。
将收集的成分冷冻干燥后,溶解于少量的水中,使用小型电泳装置(Difco公司制造),进行胶浓度为8%的SDS-PAGE电泳。电泳后,利用Multi PhoreⅡ电泳装置(Phamacia Biotech公司制)将胶中的蛋白质电转移到PVDF膜(Millipore公司)上,然后用考马斯亮蓝R-250(Nakalytesk公司)染色后,再脱色,经水洗干净,最后风干。从PVDF膜上将分子量为43kDa的蛋白质斑剪下来供蛋白质序列仪Model 492(Perkin Elmer公司制造)进行序列分析。确定了N末端一侧15个氨基酸残基序列。得到的氨基酸序列如下所示。
N末端氨基酸序列Ala-Asp-Gly-Lys-Ser-Thr-Arg-Tyr-Trp-Asp-(Cys)-(Cys)-Lys-Pro-Ser(15个残基)(2)肽谱峰将通过上述(1)中FPLC纯化的蛋白质冷冻干燥后,溶解于100mM的碳酸铵缓冲液中(pH8.0)。然后添加大约相对于蛋白质摩尔量的1/20的胰蛋白酶(Promega公司制造),于37℃反应48小时。其分解产物用Model172μ制备型HPLC系统(Perkin Elmer公司制造)进行柱层析(柱子C8 220×2.1mm,0.1%TFA、0%乙腈~-0.085%TFA、35%乙腈梯度),分别获得3种肽。然后通过上述的蛋白质序列仪确定得到的肽段的氨基酸序列。其结果如下所示。
TP-1:Tyr-Gly-Gly-Ile-Ser-Ser(6个残基)TP-2:Phe-Pro-Asp-Ala-Leu-Lys(6个残基)TP-3:Phe-Asp-Trp-Phe-Lys-Asn-Ala-Asp-Asn-Pro-Ser-Phe-Ser-Phe-Arg(15个残基) * * * * * * *这些N末端氨基酸序列和通过肽谱峰得到的氨基酸序列由于与WO91/17243号公报记载的由Humicola insolens DSM1800得到的43kDa葡聚糖内切酶的氨基酸序列具有同源性,所以明显地暗示出该蛋白质是纤维素酶的一种。
另外,将上述序列与Protein Identification Resource(PIR) R44.0,March,1995,或者是SWISS-PROT R31.0,March 1995登录的序列比较,虽然具有表现出同源性的序列,但并不是同一种蛋白质,显然是一种新的蛋白质。
实施例A3基因组DNA文库的制作基因组DNA的分离按照Horiuchi等人的方法(Horiuchi Horiuchi等,《细菌学杂志》J.Bacteriol.,170:272-278,1988)进行。
首先将Humicola insolens MN 200-1于37℃下,在上述(N)培养基中培养。培养2天后,通过离心分离(3500rpm、10分钟)收集菌体。将得到的菌体进行苯酚处理、蛋白激酶K和核糖核酸酶A处理、再通过聚乙二醇(PEG)沉淀,得到基因组DNA。
接下来,用Sau3AⅠ消化Humicola insolens基因组DNA,通过琼脂糖凝胶电泳确认在9~23kbp的范围有部分分解带,然后利用乙醇沉淀回收该电泳带。使用T4连接酶(东洋纺绩社制造)将该DNA片段连接在噬菌体载体、EMBL3克隆试剂盒(Stratagene公司制造)中的BamHⅠ arm上。用乙醇沉淀后,溶解于TE(10mM Tris盐酸缓冲液(pH8.0)、1mMEDTA)中。
使用象Hohn,B.方法(Hohn,B.《酶学方法》Methods Enzymol.,68:299-309,1979)记载的那样冷冻干燥的包装成分和GigapackⅡ包装试剂盒(Stratagene公司制造),将上述连接后的混合物都包装在λ噬菌体头部,然后用得到的噬菌体感染大肠杆菌LE392菌株。使用通过这种方法得到的5×104个噬菌体文库进行目的基因的克隆。
实施例A4利用PCR方法制作长链探针作为DNA探针是通过以Humicola insolens全长DNA作模板利用PCR方法制备扩增的长链探针。
各个引物是对应于N末端和多肽TP-3中用*表示的氨基酸合成的DNA。制备的合成寡核糖核酸序列如下所示。
NCE4N1:5′-GCXGA(CT)GGXAA(AG)TC(AGCT)AC-3′(17mer)NCE4N2:5′-GCXGA(CT)GGXAA(AG)AG(CT)AC-3′(17mer)NCE4C:5′-CXGC(AG)TT(CT)TT(AG)AACCA(AG)TC-3′(19mer)(X次黄嘌呤核苷)PCR反应的条件如下。首先对于1μg Humicola insolens基因组DNA,一组的试管中加入引物NCE4N1、NCE4C各1μM,另一组试管中加入NCE4N2、NCE4C各1μM,在dNTP存在下,于95℃进行5分钟热变性,然后加入Taq聚合酶(重组Taq,宝酒造公司制造),通过25轮反复反应进行扩增,每次的反应条件都是94℃1分钟,45℃2分钟,72℃3分钟。扩增的结果是,只使用引物NCE4N1、NCE4C时,扩增得到大约750bp的DNA。这些DNA用作以下的筛选探针。
实施例A5纤维素酶成分NCE4基因的克隆(1)利用噬斑原位杂交进行筛选首先利用ECL Director DNA/RNA标记检测系统(Amersham公司制造)对通过PCR扩增的大约750bp的DNA片段100ng预先进行标记。
将按照实施例2记载的方法制作的噬菌体噬斑转移到杂交N+尼龙转移膜(Amersham公司制造)上,用0.4N的氢氧化钠变性后,用5倍浓度的SSC(15mM柠檬酸三钠盐,150mM氯化钠)洗净,干燥,使DNA固定。按照试剂盒的方法,进行1小时的预杂交(42℃)后,加入先前标记的探针,进行4小时(42℃)的杂交。按照上述试剂盒的方法洗净标记物。首先用加有0.4%SDS、6M尿素的0.5倍浓度的SSC于42℃反复洗2次,每次20分钟,然后再用2倍浓度的SSC于室温反复洗2次,每次5分钟。
洗过探针的尼龙膜浸入到附带的检测液中1分钟,然后使hyperfilm-ECL(Amersham公司制造)感光,得到4个阳性克隆。
(2)噬菌体DNA的制备使噬菌体感染E.coli LE392,8小时后收集噬菌体颗粒,按照Grossberger的方法(Grossberger,D.,《核酸研究》Nucleic Acids.Res.15 6737,1987)用蛋白激酶K和苯酚处理后,通过乙醇沉淀,分离出噬菌体DNA。
(3)目的基因的亚克隆4种噬菌体DNA用SalⅠ切,然后走琼脂糖电泳。
按照Southern的方法(Southern,E.M.,《分子生物学杂志》J.Mol.Biol.98:503-517,1975)将DNA转移到尼龙转移膜上,在与上述(1)的噬斑杂交相同的条件下,用大约750bp探针进行杂交,检测出含有5.2kbp的目的基因的DNA片段。其结果4种噬菌体DNA都有同样大小的SalⅠ片段。
用Sephaglas Band Prep试剂盒(Phamacia Biotech公司制造)分离5.2kbp DNA片段,使用E.coli JM109在质粒pUC119的SalⅠ部位进行亚克隆。得到的质粒定为pNCE4Sal。
实施例A6碱基序列的确定(1)基因组DNA碱基序列的解析碱基序列的确定按以下方式实施。
碱基序列解析设备使用的是A.L.F.DNA序列仪Ⅱ(Phamacia Biotech公司制造)。作为测序胶使用的是ReadyMix胶(Phamacia Biotech公司制造),或者使用可能作为Hydrolink Long Ranger(FMC公司制造)得到的丙烯酰胺载体。作胶用的各种试剂(N,N,N′,N′-四甲基乙二胺、尿素、过硫铵)可以使用A.L.F级试剂(Phamacia Biotech公司制造)。解读碱基序列反应使用的是自动解读测序试剂盒Autoread Sequencing Kit(Phamacia Biotech公司制造)。凝胶制作条件、反应条件和电泳条件等参照各说明书设定。
将作为模板DNA的pNCE4Sal用10μg的2M氢氧化钠进行碱变性后,与自动解读测序试剂盒附带的Universal引物退火,进行延长反应。反应产物用测序仪解读,判断有546bp碱基序列。从这一结果可以制作MNEG01的FITC标记的测序引物,与pNCE4Sal反应,可进一步进行解读。由得到的结果又可制作下一个引物,继续解读。其结果就可解读出NCE4的全长。制作的FITC标记测序引物如下所示。
MNEG-01:5′-GTGATGAGGGCTGGCGACAGGCC-3′(23mer)MNEG-02:5′-CTGCCACCTCTATTGCCGGCAGC-3′(23mer)MNEG-03:5′-CCCGACGCCCTCAAGCCCGGCTG-3′(23mer)MNEG-04:5′-GGCTGGAGCGGCTGCACCACCTG-3′(23mer)(2)碱基序列的确定以上述(1)的结果为基础,合成MNEG-05~MNEG-08的FITC标记测序引物DNA,制作的FITC标记测序引物如下所示。
MNEG-05:5′-GACCTGACGGAAGCTGAAGCTCG-3′(23mer)
MNEG-06:5′-AGCAGTGCAGCCGCTGGGAGTCG-3′-(23mer)MNEG-07:5′-TGGCAGATGAGGACGTGGTGTTG-3′-(23mer)MNEG-08:5′-CGCAGCCGGACTTGGCGTCGAAG-3′-(23mer)使这些引物与pNCE4Sal通过自动解读测序试剂盒进行反应。首先,对10μg的质粒进行碱变性,然后与各个引物进行退火,用T7聚合酶使其反应。其结果可以确定SalⅠ片段内的1257bp碱基序列。该序列如序列3所示。
实施例A7内含子的确定为了确定内含子,首先从Humicola insolens MN200-1制备mRNA,通过逆转录酶合成cDNA,将它与基因组的碱基序列比较,判断它们的相同区域。
(1)总RNA的制备对Humicola insolens MN200-1于纤维素酶诱导培养基培养,优选于上述(N)培养基中培养2天,通过离心分离(3500rpm、10分钟),收集菌体。取出其中的2g菌体用灭菌水洗净,于液氮冷冻状态下用搅拌机(日本精机公司制造的匀浆机AM-3)粉碎。然后悬浮于含有4M胍基硫氰酸盐的变性溶液10ml中(4M胍基硫氰酸盐、25mM柠檬酸三钠盐、0.5%N-十二烷基肌氨酸钠、0.1M巯基乙醇)。于室温搅拌数分钟后,用1ml的2M醋酸钠(pH4.5)中和,加入10ml的TE饱和的苯酚,继续搅拌。然后加入2ml的氯仿-异戊醇(24∶1),充分搅拌后,通过离心分离(3500rpm、10分钟),除去苯酚变性了的菌体成分。吸取上层液(水相),用10ml的异丙醇将核酸沉淀。通过离心分离(3500rpm、10分钟)从该沉淀中回收核酸,用70%乙醇通过再离心分离洗沉淀。
将该沉淀溶解于3.5ml的TE中后,向溶液中加入880μl的10M氯化锂溶液,于5℃冷藏2小时后,经离心分离(12000rpm、10分钟),回收沉淀。用70%乙醇洗该沉淀,得到沉淀即为总RNA级分。回收RNA的量为2.7mg,收率是0.14%。
(2)PolyA尾巴+RNA(=mRNA)的制备mRNA的制备是利用mRNA纯化试剂盒(Phamacia Biotech公司制造)进行的。
首先,从(1)中制备的总RNA中取出1mg溶解于1ml的洗脱缓冲液中,于65℃进行10分钟的热变性处理。然后于冰中骤冷后,加入0.2ml的样品缓冲液。将该总RNA溶液加到寡聚物(dT)纤维素柱上,用高盐缓冲液洗3次,再用低盐缓冲液洗3次,然后用于65℃加温的洗脱缓冲液洗脱。上述对柱子的操作反复进行2次。得到mRNA级分。得到的mRNA量为19.2μg,收率为2%。
(3)cDNA的合成使用Timesaver cDNA Synthesis试剂盒(Phamacia Biotech公司制造)进行cDNA合成。
首先将5μg的mRNA溶解于20μl的样品缓冲液。于65℃进行10分钟的热变性处理后,与二硫苏糖醇溶液以及寡聚物(dT)引物一起加到第一条链合成混合物中,于37℃反应1小时。然后再都加到第二条链合成混合物中,于12℃反应30分钟,再于22℃反应1小时,得到cDNA。
(4)通过PCR方法扩增纤维素酶NCE4 cDNA从合成的cDNA取出1μg作为模板,通过PCR方法只扩增目的cDNA。制作的N末端和C末端引物的寡核苷酸序列如下所示。
NCE4-CN:5′ATGCGTTCCTCCCCTCTCCTCCGCTCCGCC-3′(30mer)NCE4-CC:5′TACAGGCACTGATGGTACCAGTCATTAATC-3′(30mer)PCR反应按以下条件进行。首先对于1μg Humicola insolens基因组DNA,各加入1μM引物,在dNTP存在下,于94℃进行10分钟热变性,然后加入Taq聚合酶(重组Taq,宝酒造公司制造),通过30轮反复反应进行扩增,每次的反应条件都是94℃1分钟,50℃2分钟,72℃3分钟。扩增的片段经琼脂糖电泳确定为0.9bp大小的片段。通过乙醇沉淀浓缩该片段,利用pT7 Blue-T-vector试剂盒(Nobagine公司制造)进行克隆。该质粒定为pCNCE4。
(5)cDNA碱基序列的解析使用与上述一样的自动解读测序试剂盒进行测序反应。
质粒pCNCE4用2M的氢氧化钠进行碱变性后,用乙醇进行沉淀。该一条链质粒作为模板,用T7聚合酶进行聚合反应。利用前面合成的引物MNEG-01、MNEG-02、MNEG-03、MNEG-04、MNEG-05、MNEG-06、MNEG-07、MNEG-08以及试剂盒附带的Universal引物、Reverse引物进行反应,解读序列。
结果发现存在着一个56bp的内含子。在序列3中,非翻译开始序列以及终止序列、内含子内部的调控序列如下所示(数字为序列3中的序列位置号)。
内含子453~458、506~508、491~497实施例B1质粒pMKD01的制备(1)质粒pUC118BN的制备用BamHⅠ切1μg pUC118 DNA,利用苯酚使限制性内切酶失活。然后进行乙醇沉淀,将沉淀溶解于少量的TE(10mM Tris盐酸(pH8.0)、1mM EDTA)缓冲液中。使用DNA钝化试剂盒(bluntingkit)(宝酒造社制)使上述DNA的末端补平。再利用DNA连接试剂盒使平滑化的DNA连接,使其自身环化。用得到的连接混合物转化E.coli感受态细胞JM109(宝酒造社制)。转化菌可以在含有100μg/ml的氨苄青霉素、1mM IPTG、0.004%X-gal的LB琼脂培养基(1%蛋白胨、0.5%酵母提取物、1%NaCl、1.5%琼脂)上生长,选择白色的菌斑在含有100μg/ml的氨苄青霉素LB培养基(1%胨、0.5%酵母提取物、1%NaCl)上于37℃培养过夜。从得到的培养基中通过碱-SDS方法回收质粒DNA。将该质粒DNA用BamHⅠ切,走0.8%琼脂糖凝胶电泳,选择pUC118 DNA被BamHⅠ切断的质粒DNA。该质粒DNA被定为pUC118BN。
(2)质粒pUC118BSN的制备用SphⅠ切1μg pUC118BN DNA,利用与上述同样的方法获得pUC118BN DNA被BamHⅠ切断的质粒DNA。该质粒DNA被定为pUC118BSN。
(3)质粒pM21的制备(A)纤维素酶NCE2基因的分离将从Humicola insolens按照特开平8-126492号公报记载的方法得到的,作为纤维素酶NCE2基因以及其启动子和终止区的区域含有上游1.4kb、下游0.5kb的DNA序列的全长4.4kb的PstⅠ-Xba的酶切片段连接到先前的pUC118BSN PstⅠ-Xba位点上,得到的质粒DNA被定为pUC118BSN-PX。
(B)pUC118BSN-PX的指定部位的变异处理在紧靠NCE2基因的N末端的下游以及终止密码的下游象以下那样通过指定部位变异导入BamHⅠ位点。通过质粒pUC118BSN-PX转化E.coli JM109菌株,使辅助噬菌体M13KO7感染后,在含有氨苄青霉素和卡那霉素各150μg/ml、70μg/ml的30ml的2×YT液体培养基(1.6%细菌胰蛋白酶、0.8%酵母提取物、0.5%NaCl)上于37℃培养16~20小时。从培养上清中回收M13的单链DNA(ssDNA)。利用该ssDNA和两种合成的寡核苷酸,使用雕纹体外诱变系统(Sculpter InVitro Mutagenesis System)(Amersham公司制造)进行指定部位的变异处理。制备的合成寡核苷酸引物如下所示。
MNC-02 5′-GAGCGCCAGAACTGTGGATCCACTTGGTGAGCAATG-3′-(36mer)MNC-03 5′-TCCGCCGTTCTGAGCGGATCCAGGCGTTTGGCGCG-3′(35mer)将经指定部位变异处理的DNA混合液导入E.coli TG1,得到的转化菌株在含有100μg/ml氨苄青霉素的LB培养基(1%蛋白胨、0.5%酵母提取物、1%NaCl)中培养,回收质粒DNA。该质粒DNA用BamHⅠ切,走0.8%琼脂糖凝胶电泳,选择在pUC118BSN-PX中导入两个BamHⅠ位点的质粒DNA,该质粒DNA被定为pM21。
(4)纤维素酶NCE3基因的分离以来自众所周知的Humicola grisea纤维二糖水解酶基因(de Oliviera Alzevedo,M.等,《普通微生物学杂志》J.General Microbiol.,136:2569-2576,1990)为基础利用PCR方法分离来自Humicola insolens的纤维二糖水解酶基因(NCE3)。
(A)基因组DNA的分离利用上述实施例A3的方法得到Humicola insolensMN200-1的基因组。
(B)利用PCR方法扩增纤维素酶NCE3基因以来自Humicola grisea的纤维二糖水解酶基因的序列为基础利用PCR方法分离Humicola insolens的NCE3基因。为了能够使含有该NCE3的PCR产物连接在质粒pM21的BamHⅠ位点上,预先在各引物中设计了含有BamHⅠ位点,作为引物合成了如下的寡核苷酸序列。
MKA-05:5′GCCGCCCAGCAGGCGGGATCCCTCACCACCGAGAGG-3′(36mer)MKA-06:5′-TGATCGTCGAGTCAGGGATCCAGAATTTACAGGCAC-3′(36mer)PCR反应根据LA PCR Kit Ver.2(宝酒造社制),按照以下方法进行。首先对通过上述方法得到的1μg Humicola insolens基因组DNA,各加入1μM引物、400μM dNTP、LA Taq聚合酶2.5U,通过30轮重复反应进行扩增,每次的反应条件都是94℃1分钟,55℃2分钟,72℃3分钟。扩增的片段经0.8%琼脂糖凝胶电泳确认1.6Kbp DNA的扩增。该1.6Kbp DNA的片段用Sephaglass Band Prep试剂盒(Phamacia Biotech.公司制造)回收,并与pT Blue-T-vector kit(Novagen公司制造)连接。该质粒DNA定为pK2l。
(5)质粒pKM04的制备质粒pK21DNA用BamHⅠ消化,回收1.6Kbp片段。然后质粒pM21DNA用BamHⅠ消化,再于70℃处理10分钟,使限制性内切酶失活。再通过小牛碱性磷酸酶(宝酒造社)脱磷酸后,经0.8%琼脂糖凝胶电泳分离,回收5.2Kbp DNA片段。最后将来自pK21的1.6Kbp片段与来自pM21的5.2Kbp DNA片段连接,就得到质粒pKM04。
(6)质粒pMKD01的制备首先,使用通过众所周知的方法得到的来自构巢曲霉Aspergillus nidulans的trp C基因的启动子和终止子(Mullaney,E.J.等,《分子遗传学和普通遗传学》Mol.Gen.Genet.199:37-45,1985),将特开昭59-175889号公报记载的越霉素抗性基因制备成在Humicola insolens中能够表达的基因。将该基因导入质粒pMKD04的Xba位点,制备质粒pMKD01。
实施例B2由质粒pMKD01转化Humicola insolens(1)质粒pMKD01高浓度纯化样品的制备为了使质粒pMKD01导入Humicola insolens,首先要制备纯化的高浓度质粒pMKD01。将pMKD01导入E.coli JM109,在含有100μg/ml氨苄青霉素的LB培养基中于37℃培养过夜。得到的培养液用Flexiprep kit(Phamacia Biotech公司制造)纯化,得到1μg/μl的pMKD01质粒DNA。
(2)Humicola insolens的转化将Humicola insolens MN200-1在(S)培养基中于37℃培养24小时后,通过3000rpm、离心分离10分钟,收集菌体。其中(S)培养基的组成是上述(N)培养基中加了葡萄糖(3.0%),并除去Avicel后的培养基。得到的菌体用0.5M蔗糖洗净,悬浮于经0.45μm过滤的10ml的原生质体化酶液中(5mg/ml Novozyme 234(NLⅠ公司制造)、5mg/ml Cellulase Onozuka R-10(Yakult公司制造)、0.5M蔗糖)。于30℃振荡60~90分钟,使菌原生质体化。将该悬浊液过滤后,经2500rpm、10分钟离心分离,回收原生质体,用SUTC缓冲液(0.SM蔗糖、10mM氯化钙、10mM TRis盐酸(pH7.5))洗净。
将以上制备的原生质体悬浮于1ml的SUTC缓冲液中,向100μl该悬浮液中加入10μg的DNA(TE)溶液(10μl),静置于冰中5分钟。然后加入400μl的PEG溶液(60%PEG4000、10mM氯化钙、10mM TRis盐酸(pH7.5)),静置于冰中20分钟后,加入10ml的SUTC缓冲液,经2500rpm、10分钟离心分离,收集原生质体。将该原生质体悬浮于1ml的SUTC缓冲液后,经4000rpm、5分钟离心分离,将原生质体最终悬浮于100μl的SUTC缓冲液中。
将经以上处理的原生质体与YMG软琼脂一起铺在含有200μg/ml潮霉素B的YMG培养基(1%葡萄糖、0.4%酵母提取液、0.2%麦芽提取液、1%琼脂(pH6.8))上,于37℃培养5天后,形成的菌落就是转化体。
(3)pMKD01转化的菌株的培养以及经SDS-PAGE的评价象前述那样将质粒pMKD01导入Humicola insolens MN200-1,挑选50个潮霉素抗性菌株。将这些菌株在(N)培养基上于37℃培养5天。获得的培养液上清通过SDS-PAGE解析,pMKD01转化的菌株中的5个克隆推断为NCE3的蛋白质带比亲本菌株增加了3~4倍。
(4)重组NCE3的N末端氨基酸残基的鉴定为了进一步确认SDS-PAGE结果给出的大量表达的蛋白质带是来自NCE3基因的,所以要确定该蛋白质的N末端氨基酸序列。首先,就从亲本菌株和NCE3高表达菌株得到的培养上清按照前述实施例A2的方法进行FPLC柱层析,比较它们的主要峰。收集NCE3高表达菌株中特别增加的峰,并冷冻干燥。冷冻干燥的样品溶解于少量的水中,进行胶浓度为8%的微型SDS-PAGE(Difco公司)。然后按照前述实施例A2的方法,将胶中蛋白质电转移到PVDF膜上,用考马斯亮蓝R-250染色后,进行脱色,用水洗净。从膜中剪下印记为分子量66KD的蛋白质部分,将该印记蛋白质按照Podell,D.N等人的方法(Podell,D.N.等,《生物化学生物物理学研究通讯》Biochem.Biophys.Res.Commun.,81:176,1978),除去修饰N末端残基。首先,剪下目的蛋白质,在少量的0.5%聚乙烯吡咯烷酮(分子量40,000,Sigma公司制造)/10mM醋酸溶液中于37℃保温30分钟后,用水充分洗净。然后利用Pfu焦谷氨酸氨肽酶(宝酒造社制造)除去修饰的N末端残基,用水洗净、风干。利用蛋白质测序仪Model492,确定N末端的15个氨基酸残基序列。得到的序列如下所示。
N末端氨基酸序列Asn-Cys-Gly-Ser-Leu-Thr-Thr-Glu-Arg-His-Pro-Ser-Leu-Ser-Trp(15个残基)
该N末端氨基酸序列与由质粒pMKD01的碱基序列推测的纤维素酶NCE2、NCE3融合蛋白质的氨基酸序列一致。
(5)pMKD01转化菌株的FPLC评价为了进一步定量象上述那样用SDS-PAGE确认NCE3大量表达的5个菌落的培养上清,利用FPLC柱进行柱层析。层析条件与上述(4)的一样。分别收集NCE3的峰,并冷冻干燥,测定重量,比较高表达菌株与亲本菌株的产率。比较结果如下表所示。
表1NCE3产量*Humicola insolens MN200-1(亲本菌株)0.46gHumicola insolens pMKD01 1.8g*产量是每一升培养液的产量。
实施例B3;质粒pEGD01的制备质粒pMKD01经BamHⅠ消化,然后通过70℃的热处理使酶失活,经脱磷酸处理,回收8.2Kbp的DNA片段。
然后,以在上述实施例A1~7得到的来自Humicola insolens的NCE4基因的序列为基础,通过PCR方法扩增NCE4基因。按照在各个引物中预先含有BamHⅠ位点的形式设计该NCE4的PCR产物,使之能够符合读码框架连接于上述质粒pMKD01的8.2Kbp的BamHⅠ片段。制备了以下序列的合成寡核苷酸作为引物。
NCE4-N:5-′CCGGTGTTGGCCGGATCCGCTGATGGCAAG-3′(30mer)NCE4-C:5′-TAAGGCCCTCAAGGATCCCTGCGTCTACAG-3′(30mer)PCR反应如下。对于1μg Humicola insolens基因组DNA,各加入1μM引物、400μM dNTP、Pfu DNA聚合酶(Stratgene公司制造)2.5U,通过25轮重复反应扩增0.8Kbp的DNA片段,每次的反应条件都是94℃1分钟,55℃2分钟,72℃3分钟。回收该0.8Kbp的DNA片段,将该片段连接到上述pMKD01的8.2Kbp的BamHⅠ片段。该质粒DNA定为pEGD0l。
实施例B4质粒pEGD01的表达(1)质粒pEGD01对Humicola insolens的转化质粒pEGD01对Humicola insolensMN200-1的转化按照实施例B2的方法进行。首先制备纯化的高浓度的质粒pEGD01,得到1μg/μl的pEGD01质粒DNA。使用10μl该pEGD01溶液,转化Humicola insolensMN200-1,挑选50个潮霉素抗性菌株。将这些菌株在(N)培养基上于37℃培养5天。获得的培养液上清通过SDS-PAGE解析,pEGD01转化的菌株中的10个克隆中推断为NCE4蛋白质带,比亲本菌株增加了10~16倍。
(2)重组NCE4的N末端氨基酸残基的鉴定为了进一步确认SDSP-AGE结果给出的确认大量表达的蛋白质带是来自NCE4基因的,所以要确定该蛋白质的N末端氨基酸序列。首先,就从亲本菌株和NCE4高表达菌株得到的培养上清进行FPLC柱层析,比较它们的主要的峰。条件与上述实施例B2一样。收集NCE3高表达菌株中特别增加的峰,并冷冻干燥。冷冻干燥的样品溶解于少量的水中。按照实施例B2的方法除去修饰N末端残基后,通过上述蛋白质测序仪确定N末端的氨基酸序列。结果得到比例大约为7:3的如下所示的两种N末端氨基酸序列。而如果不除去修饰N末端残基,通过上述蛋白质测序仪确定N末端氨基酸序列,结果只得到如下所示的氨基酸序列1。
N末端氨基酸序列1:Val-Val-Glu-Glu-Arg-Gln-Asn-Cys-Gly-Ser-Ala-Asp-Gly-Lys-Ser-Thr-Arg-Tyr-Trp-Asp(20个残基)(20个残基)N末端氨基酸序列2:Asn-(Cys)-Gly-Ser-Ala-Asp-Gly-Lys-Ser-Thr-Arg-Tyr-Trp-Asp-(Cys)-(Cys)-Lys-Pro-Ser-(Cys)(20个残基)
这些N末端氨基酸序列与由质粒pMKD01的碱基序列推测的纤维素酶NCE2和NCE4融合蛋白质的氨基酸序列一致。因为得到的是两种N末端氨基酸序列,当切断该融合蛋白质的信号序列时,显然是在多个位置进行切断的。
(3)pEGD01转化的菌株的FPLC评价为了进一步定量象上述那样用SDS-PAGE确认NCE4大量表达的5个克隆的培养上清,利用FPLC柱进行柱层析。分别收集NCE4的峰,并冷冻干燥,测定重量,比较高表达菌株与亲本菌株的产率。比较结果如下表所示。
表2NCE4产量*Humicola insolens MN200-1(亲本菌株)0.28gHumicola insolens pMKEG01 4.5g*产量是每一升培养液的产量。
实施例B5;质粒pIED02的制备(1)质粒pID01的制备pEGD01经HindⅢ~BamHⅠ消化,回收7.2Kbp的DNA片段。
然后,以用特开平8-5663号公报中记载的方法得到的来自Humicola insolens的NCE1基因的序列为基础,通过PCR方法扩增NCE1基因的启动子和编码信号序列的部分DNA。含有该NCE1启动子和信号序列的PCR产物按照在各个引物中预先含有HindⅢ位点、BamHⅠ位点的形式设计,使之能够符合读码框架,连接于上述质粒pEGD01的7.2Kbp的HindⅢ~BamHⅠ片段。作为引物制备了如下的合成寡核苷酸。
PNCE1-N:5′-GTCATGAAGCTTCATTAAGGTACGTATGCAAC-3′(32mer)
PNCE1-C:5′~GGTGATGGATCCGGCCTGCTGGGCAGCGACGC-3′(32mer)PCR反应与实施例3一样。对于1μg Humicola insolens基因组DNA,各加入1μM引物、400μM dNTP、Pfu DNA聚合酶2.5U,通过23轮重复反应扩增1.5Kbp的DNA片段,每次的反应条件都是94℃1分钟,55℃2分钟,72℃4分钟。该PCR产物用HindⅢ和BamHⅠ消化,回收1.5Kbp的DNA片段,将该片段连接到上述pEGD01的7.2KbpHindⅢ~BamHⅠ片段。该质粒DNA定为pID01。
(2)质粒pIED02的制备质粒pID01经BamHⅠ消化,然后通过70℃的热处理使酶失活,经脱磷酸处理,回收8.6Kbp的DNA片段。然后质粒pEGD01经BamHⅠ消化后,回收含有NCE4基因的0.8Kbp的DNA片段。将两个片段连接起来,得到质粒pIED02。
实施例B6质粒pIED02的表达(1)质粒pIED02对Humicola insolens的转化质粒pIED02对Humicola insolens MN200-1的转化按照实施例B2的方法进行。首先制备纯化的高浓度的质粒pIED02,得到1μg/μlpIED02质粒DNA。使用10μl该pIED02溶液,转化Humicola insolensMN200-1,挑选50个潮霉素抗性菌株。将这些菌株在(N)培养基上于37℃培养5天。获得的培养液上清通过SDS-PAGE解析,pIED02转化的菌株中的5个克隆推断为NCE4蛋白质带,比亲本菌株增加了5~10倍。
(2)重组NCE4的N末端氨基酸残基的鉴定为了确认SDS-PAGE的结果给出的大量表达的蛋白质带是来自NCE4基因的,所以要确定该蛋白质的N末端氨基酸序列。首先,按照与实施例B2一样的方法,就从亲本菌株和NCE4高表达菌株得到的培养上清进行FPLC柱层析,收集NCE3高表达菌株中特别增加的峰,并冷冻干燥。冷冻干燥的样品溶解于少量的水中。按照实施例B2的方法除去修饰N末端残基后,通过上述蛋白质测序仪确定N末端的15个氨基酸残基序列。得到的序列如下所示。
N末端氨基酸序列(15个残基)该N末端氨基酸序列与由质粒pIED02的碱基序列推测的纤维素酶NCE1、NCE4融合蛋白质的氨基酸序列一致。
(3)pIED02转化的菌株的FPLC评价为了进一步定量象上述那样用SDS-PAGE确认的NCE4大量表达的5个菌落的培养上清,利用FPLC柱进行柱层析。分别收集NCE4的峰,并冷冻干燥,测定重量,比较高表达菌株与亲本菌株的产率。比较结果如下表所示。
表3NCE4产量*Humicola insolens MN200-1(亲本菌株)0.28gHumicola insolens pIED02 2.9g*产量是每一升培养液的产量。
序列表序列号1序列的长度2285序列类型核酸链数二条链拓扑型直链形序列种类基因组DNA起源生物名Humicola insolens序列特征表示特征的记号sig peptide存在位置310..375决定特征的方法E表示特征的记号mat peptide存在位置376..1890决定特征的方法E表示特征的记号内含子存在位置880..936决定特征的方法E表示特征的记号内含子存在位置1290..1348决定特征的方法E表示特征的记号内含子存在位置1780..1863决定特征的方法E表示特征的记号切割位点存在位置240..245其它信息SalⅠ
表示特征的记号切割位点存在位置603..608其它信息SalⅠ表示特征的记号切割位点存在位置760..765其它信息SalⅠ表示特征的记号切割位点存在位置1152..1157其它信息KpnⅠ表示特征的记号切割位点存在位置1267..1272其它信息SalⅠ序列TCTCCAATAA CGACGAAGCG ACTGTTGGCT GATCAATTAG CTGGCGATGG GTCTGTGGTA 60TGGAACGTCG GCTGAGTCTT CCATCTCCCA CCGTAGACGT GTTCCGCGGA TCAAGGTCTC120CCGCTCCGTA ACCGCCCAGG TGGCTCGGTT CTTGATGATG GGAAAGGGGC CGACGGCAGT180ATAAAGAGCC ATGGAAGCAT CCCTCGAGGC CGGAAGGAAA TCTTGCTCAG CCACCCGCAG240TCGACTTGTC TATCGATCTG AGCAGCAGTT GACCGGTCTT CTCTGTCATC TCAGCAGCAG300TCTTTCAAG ATG CAG ATC AAG AGC TAC ATC CAG TAC CTG GCC GCG345Met Gln Ile Lys Ser Tyr Ile Gln Tyr Leu Ala Ala-20 -15GCT CTG CCG CTC CTG AGC AGC GTC GCT GCC CAG CAG GCC GGC ACC ATC 393Ala Leu Pro Leu Leu Ser Ser Val Ala Ala Gln Gln Ala Gly Thr Ile-10 -5 15ACC GCC GAG AAC CAC CCC AGG ATG ACC TGG AAG AGG TGC TCG GGC CCC 441Thr Ala Glu Asn His Pro Arg Met Thr Trp Lys Arg Cys Ser Gly Pro10 15 20GGC AAC TGC CAG ACC GTG CAG GGC GAG GTC GTC ATC GAC GCC AAC TGG 489Gly Asn Cys Gln Thr Val Gln Gly Glu Val Val Ile Asp Ala Asn Trp25 30 35CGC TGG CTG CAC AAC AAC GGC CAG AAC TGC TAT GAG GGC AAC AAG TGG 537Arg Trp Leu His Ash Asn Gly Gln Asn Cys Tyr Glu Gly Asn Lys Trp40 45 50ACC AGC CAG TGC AGC TCG GCC ACC GAC TGC GCG CAG AGG TGC GCC CTC 585Thr Ser Gln Cys Ser Ser Ala Thr Asp Cys Ala Gln Arg Cys Ala Leu55 60 65 70GAC GGT GCC AAC TAC CAG TCG ACC TAC GGC GCC TCG ACC AGC GGC GAC 633Asp Gly Ala Asn Tyr Gln Ser Thr Tyr Gly Ala Ser Thr Ser Gly Asp75 80 85TCC CTG ACG CTC AAG TTC GTC ACC AAG CAC GAG TAC GGC ACC AAC ATC 681Ser Leu Thr Leu Lys Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile90 95 100GGC TCG CGC TTC TAC CTC ATG GCC AAC CAG AAC AAG TAC CAG ATG TTC 729Gly Ser Arg Phe Tyr Leu Met Ala Asn Gln Asn Lys Tyr Gln Met Phe105 110 115ACC CTG ATG AAC AAC GAG TTC GCC TTC GAT GTC GAC CTC TCC AAG GTT 777Thr Leu Met Asn Asn Glu Phe Ala Phe Asp Va1 Asp Leu Ser Lys Val120 125 130GAG TGC GGT ATC AAC AGC GCT CTG TAC TTC GTC GCC ATG GAG GAG GAT 825Glu Cys Gly Ile Asn Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp135 140 145 150GGT GGC ATG GCC AGC TAC CCG AGC AAC CGT GCT GGT GCC AAG TAC GGC 873Gly Gly Met Ala Ser Tyr Pro Ser Asn Arg Ala Gly Ala Lys Tyr Gly155 160 165ACG GGC GTACGTTCTC TCCGTCCCGC CCCTACCAAA AGTATGACTC GTGCTGACGT 929Thr GlyTTG ACAG TAC TGC GAT GCC CAA TGC GCC CGT GAC CTC AAG TTC ATT GGC978Tyr Cys Asp Ala Gln Cys Ala Arg Asp Leu Lys Phe Ile Gly170 175 180GGC AAG GCC AAC ATT GAG GGC TGG CGC CCG TCC ACC AAC GAC CCC AAC1026Gly Lys Ala Asn Ile Glu Gly Trp Arg Pro Ser Thr Asn Asp Pro Asn185 190 195GCC GGT GTC GGT CCC ATG GGT GCC TGC TGC GCT GAG ATC GAC GTT TGG1074Ala Gly Val Gly Pro Met Gly Ala Cys Cys Ala Glu Ile Asp Val Trp200 205 210GAG TCC AAC GCC TAT GCT TAT GCC TTC ACC CCC CAC GCC TGC GGC AGC1122Glu Ser Asn Ala Tyr Ala Tyr Ala Phe Thr Pro His Ala Cys Gly Ser215 220 225230AAG AAC CGC TAC CAC ATC TGC GAG ACC AAC AAC TGC GGT GGT ACC TAC 1170Lys Asn Arg Tyr His Ile Cys Glu Thr Asn Asn Cys Gly Gly Thr Tyr235 240 245TCG GAT GAC CGC TTC GCC GGC TAC TGC GAC GCC AAC GGC TGC GAC TAC1218Ser Asp Asp Arg Phe Ala Gly Tyr Cys Asp Ala Asn Gly Cys Asp Tyr250 255 260AAC CCC TAC CGC ATG GGC AAC AAG GAC TTC TAT GGC AAG GGC AAG ACC 1266Asn Pro Tyr Arg Met Gly Asn Lys Asp Phe Tyr Gly Lys Gly Lys Thr265 270 275GTC GAC ACC AAC CGC AAG TTC AC GTAAGTTCCC TGGCCGCCTC TTCGACGACG CAG 1322Val Asp Thr Asn Arg Lys Phe Th280 285AATGTCCGGA TGCTGACCCA GAACAG C GTT GTC TCC CGC TTC GAG CGT AAC AGG 1376r Val Val Ser Arg Phe Glu Arg Asn Arg290 295CTC TCT CAG TTC TTC GTC CAG GAC GGC CGC AAG ATC GAG GTG CCC CCT 1424Leu Ser Gln Phe Phe Val Gln Asp Gly Arg Lys Ile G1u Val Pro Pro300 305 310CCG ACC TGG CCC GGC CTC CCG AAC AGC GCC GAC ATC ACC CCT GAG CTC1472Pro Thr Trp Pro Gly Leu Pro Asn Ser Ala Asp Ile Thr Pro Glu Leu315 320 325TGC GAT GCT CAG TTC CGC GTC TTC GAT GAC CGC AAC CGC TTC GCC GAG1520Cys Asp Ala Gln Phe Arg Val Phe Asp Asp Arg Asn Arg Phe Ala Glu330 335 340ACC GGT GGC TTC GAT GCT CTG AAC GAG GCC CTC ACC ATT CCC ATG GTC 1568Thr Gly Gly Phe Asp Ala Leu Asn Glu Ala Leu Thr Ile Pro Met Val345 350 355CTT GTC ATG TCC ATC TGG GAT GAC GTATGTGGCA CCAACCTCCt ACCGGGCATG AG 1624Leu Val Met Ser Ile Trp Asp Asp360 365ACCTGTACTG ACGTGTCTTG ACAG CAC CAC TCC AAC ATG CTC TGG CTC GAC TCC 1678His His Ser Asn Met Leu Trp Leu Asp Ser370 375AGC TAC CCG CCC GAG AAG GCC GGC CTC CCC GGT GGC GAC CGT GGC CCG 1726Ser Tyr Pro Pro Glu Lys Ala Gly Leu Pro Gly Gly Asp Arg Gly Pro380 385 390TGC CCG ACC ACC TCT GGT GTC CCT GCC GAG GTC GAG GCT CAG TAC CCC 1774Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Gln Tyr Pro395 400 405AAT GC GTACGTTACT ACCGCCGCTG CATCTGCAAA AAATACCGGT GCTAACCATT GTG 1832Asn Al410CAG T CAG GTC GTC TGG TCC AAC ATC CGC TTC GGC CCC ATC GGC TCG ACC 1881a Gln Val Val Trp Ser Ash Ile Arg Phe Gly Pro Ile Gly Ser Thr415 420 425GTC AAC GTC TAAGCTATCA CGGCTCAAAA TCAGCGCCCG CTCTGCTCGT CCTGTTCGGC 1940Val Asn ValGCGCCAGTAG GGGGATATGG GGCATTTCTT TGTTCAAGCA TTTTTCTCTT CGTCCTGCTA 2000CATATTGAGA TTGTGTATCG TATGCACGCG TACAAAGTAG AAACCATGAT CAAGTCTCAT 2060TGAACTATAC TGCTGCTCCC AAGATTAATT ATGCCGTAAT GGTCTGTTTG CTTTTTTTTT 2120TTTTTTTTTT TGGTGCACTT GATCGTGTGG CACATTGGCC GCTGTATGTA TGGCTTCCCT 2180CAATCGCCGA CTGACTCAAA ACGGCAGTAC AACAGAAGCC CCATTGCATC AGAAGAGAGG 2240TTTTATAATG CCATGAGGTG TTCTCAGATG AAAGACTTCG AGTAT 2285序列号2序列的长度2409序列类型核酸链数二条链拓扑型直链形序列种类基因组DNA起源生物名Humicola insolens序列特征表示特征的记号sig peptide存在位置389..457决定特征的方法E表示特征的记号mat peptide存在位置458..2098决定特征的方法E表示特征的记号内含子存在位置478..535决定特征的方法E表示特征的记号内含子存在位置1030..1141决定特征的方法E表示特征的记号内含子存在位置1762..1815决定特征的方法E
表示特征的记号内含子存在位置1990..2044决定特征的方法E表示特征的记号切割位点存在位置688..693其它信息SmaⅠ表示特征的记号切割位点存在位置1253..1259其它信息BamHⅠ表示特征的记号切割位点存在位置1505..1510其它信息BglⅡ表示特征的记号切割位点存在位置1643..1648其它信息StuⅠ序列TGCTGGACCT TGGATGCGTC TGCCGAGCTG TGCGTGCGGA AGAGTCGAGC GTGATTCCGG 60CATCACTGAA CACTCGCTGG TTGCTGGTTC TGGAAGCGGT ACGTCCGGCG CAAACCAGCA 120AAAGCAGGTT TGCGCTGCCT TGGCCTCCGT GAGAGGCATG ATGCCAAGGA TGAATGGTTC 180CTCTGCGGAC TCAACCATCC GCACTTCGAG CCCGACGATC CGGGCCCCCT GCTCCGGCGC 240GGAGAGCCGT GGTGAGCTCC AAGTGATGCG GAATCGGTGA TGTGCAAGAT GCGGAGGGCA 300TAAAAAGGCT GTTTCCCACA CGAAGCATTC TCCAGCTTGT TTCCTCACGG CACACGGTCA 360AACAAGTCTG TGCAGTACCT GGGACAAG ATG GCC AAG TTC TTC CTT ACT GCT 412Met Ala Lys Phe Phe Leu Thr Ala-20GCC TTT GCG GCT GCC GCT CTC GCC GCT CCC GTT GTT GAG GAG CGC CAG 460Ala Phe Ala Ala Ala Ala Leu Ala Ala Pro Val Val Glu Glu Arg Gln-15 -10 -5 1AAC TGT GCC CCG ACT TG GTGAGCAATG GTGTTTCATG GATCGTGTCT TTGGATGTGC 517Asn Cys Ala Pro Thr Tr5GGCTAACAAC CATTCCAG G GGC CAG TGC GGT GGC ATC GGC TTC AAT GGC 566p Gly Gln Cys Gly Gly Ile Gly Phe Asn Gly10 15CCG ACT TGC TGC CAG TCT GGT AGC ACC TGC GTG AAG CAG AAC GAC TGG 614Pro Thr Cys Cys Gln Ser Gly Ser Thr Cys Val Lys Gln Asn Asp Trp20 25 30TAC TCC CAG TGC TTG CCC GGT AGC CAG GTC ACC ACG ACC TCG ACT ACG 662Tyr Ser Gln Cys Leu Pro Gly Ser Gln Val Thr Thr Thr Ser Thr Thr35 40 45TCG ACT TCG AGC TCG TCG ACC ACC TCC CGG GCC ACC TCG ACC ACC AGG 710Ser Thr Ser Ser Ser Ser Thr Thr Ser Arg Ala Thr Sar Thr Thr Arg50 55 60 65ACC GGT GGT GTG ACC TCG ATC ACC ACT GCT CCC ACC CGC ACC GTC ACC 758Thr Gly Gly Val Thr Ser Ile Thr Thr Ala Pro Thr Arg Thr Val Thr70 75 80ATC CCT GGC GGT GCC ACC ACC ACG GCC AGC TAC AAC GGC AAC CCC TTC 806Ile Pro Gly Gly Ala Thr Thr Thr Ala Ser Tyr Asn Gly Asn Pro Phe85 90 95GAG GGT GTC CAG CTC TGG GCC AAC AAC TAC TAC CGC TCT GAG GTC CAC 854Glu Gly Val Gln Leu Trp Ala Asn Asn Tyr Tyr Arg Ser Glu Val His100 105 110ACC CTC GCC ATT CCT CAG ATC ACC GAC CCT GCC TTG AGG GCT GCG GCC 902Thr Leu Ala Ile Pro Gln Ile Thr Asp Pro Ala Leu Arg Ala Ala Ala115 120 125TCG GCC GTC GCT GAG GTC CCG AGC TTC CAG TGG CTC GAC CGC AAC GTC 950Ser Ala Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val130 135 140 145ACG GTC GAC ACC CTG CTC GTC GAG ACC CTC TCT GAG ATC CGC GCC GCG 998Thr Val Asp Thr Leu Leu Val Glu Thr Leu Ser Glu Ile Arg Ala Ala150 155 160AAC CAG GCG GGC GCG AAC CCC CCG TAT GCC G GTAAGTGCGG TGTCACCACC1049Asn Gln Ala Gly Ala Asn Pro Pro Tyr Ala A165 170ACCAACCCTA ACCCTGACCC CTGACCACCA CATCATCAAC ATCACCACAC ATCTCCCACA ll09TCATTCTGGA CGCAAATTAA CGCCAAATCC AG CC CAG ATC GTC GTT TAC GAC 1161la Gln Ile Val Val Tyr Asp175CTT CCT GAC CGC GAC TGC GCT GCC GCG GCT TCG AAC GGC GAG TGG GCG1209Leu Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Trp Ala180 185 190ATC GCC AAC AAC GGC GCC AAC AAC TAC AAG GGA TAC ATC AAC CGG ATC1257I1e Ala Asn Asn Gly Ala Asn Asn Tyr Lys Gly Tyr Ile Asn Arg Ile195 200 205 210CGC GAG ATT CTC ATT TCG TTC TCG GAT GTC CGC ACG ATT CTG GTT ATC1305Arg Glu Ile Leu Ile Ser Phe Ser Asp Val Arg Thr Ile Leu Val Ile215 220 225GAG CCC GAC TCG CTG GCC AAC ATG GTC ACC AAC ATG AAC GTC GCC AAG1353Glu Pro Asp Ser Leu Ala Asn Met Val Thr Asn Met Asn Val Ala Lys230 235 240TGC AGC GGT GCC GCC TCG ACC TAC CGC GAG TTG ACC ATC TAT GCC CTC1401Cys Ser Gly Ala Ala Ser Thr Tyr Arg Glu Leu Thr Ile Tyr Ala Leu245 250 255AAG CAG CTC GAC CTC CCG CAC GTC GCC ATG TAC ATG GAC GCC GGC CAC1449Lys Gln Leu Asp Leu Pro His Val Ala Met Tyr Met Asp Ala Gly His260 265 270GCT GGC TGG CTT GGC TGG CCC GCC AAC ATC CAG CCC GCT GCT GAG CTC1497Ala Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Glu Leu275 280 285 290TTC GCC AAG ATC TAC GAG GAT GCC GGC AAG CCC CGC GCC GTC CGC GGT1545Phe Ala Lys Ile Tyr Glu Aap Ala Gly Lys Pro Arg Ala Val Arg Gly295 300 305CTC GCC ACC AAC GTC GCC AAC TAC AAC GCC TGG AGC ATC TCG AGC CCG1593Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ser Ser Pro310 315 320CCG CCG TAC ACC AGC CCC AAC CCC AAC TAC GAC GAG AAG CAC TAC ATC1641Pro Pro Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His Tyr Ile325 330 335GAG GCC TTC CGC CCT CTC CTC GAG GCC CCC GGC TTC CCC CCC CAG TTC1689Glu Ala Phe Arg Pro Leu Leu Glu Ala Arg Gly Phe Pro Ala Gln Phe340 345 350ATC GTC GAC CAG GGC CGC AGC GGC AAG CAG CCC ACC GGC CAG AAG GAA1737Ile Val Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly Gln Lys Glu355 360 365 370TGG GGC CAC TGG TGC AAT GCC ATT GTACGTTAAG GTTAGGGTTA CATATTTGCG 1791Trp Gly His Trp Cys Asn Ala Ile375TTCCCATGAC TAACATCCTT CCAG GGC ACC GGC TTC GGT ATG CGC CCG ACT 1842Gly Thr Gly Phe Gly Met Arg Pro Thr380 385GCC AAC ACC GGC CAC CAG TAC GTC GAC GCC TTC GTC TGG GTC AAG CCC1890Ala Asn Thr Gly His Gln Tyr Val Asp Ala Phe Val Trp Val Lys Pro390 395 400GGC GGT GAG TGC GAC GGC ACC AGC GAC ACG ACC GCT GCC CGC TAC GAC1938Gly Gly Glu Cys Asp Gly Thr Ser Asp Thr Thr Ala Ala Arg Tyr Asp405 410 415TAC CAC TGC GGT CTC GAG GAC GCC CTC AAG CCC GCC CCT GAG GCC GGC1986Tyr His Cys Gly Leu Glu Asp Ala Leu Lys Pro Ala Pro Glu Ala Gly420 425 430 435CAG GTGAGCACCA AACCCGACCA CAACAAGAAA TGTACCAAAG GCTAACCAAC TCCAG2044GlnTGG TTC CAA GCC TAC TTT GAG CAA TTA CTT CGT AAT GCC AAT CCG CCG 2092Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Arg Asn Ala Asn Pro Pro440 445 450TTC TGA GCGGTTTGAG GCGTTTGGCG CGATGTTGGC GATGTTTAGG ATCAAAAAGG 2148Phe ***GGGGGAAAAG GCGAAAAGGG GCCGGTCCGG GAGGCCCCAC AATATCGGCC CCACCCTCCG 2208ATCACGTGCT CCCCGCATCG GCACAGACGT CGCTTAATGC ATTGAGGGGG TTGACAAAAT 2268TCAAGTCTTC TTCTGTAAAT AGTTGGCATC TGCCATTGTT GGACAAGATT TAGTCTTTCG 2328AGTATATACA CTTTGTTCCA ACGGGGTCTA GTAACTTCCG AGGTCATCTC ATCAAGCATT 2388GTTTGAGTCT CGCGTTTATA C 2409序列号3序列的长度1257序列类型核酸链数二条链拓扑型直链形序列种类基因组DNA起源生物名Humicola insolens序列特征表示特征的记号内含子存在位置453..509决定特征的方法E序列AATGACGGGG CAACCTCCCG CCCGGGCCCA ACTCTTGGGT TTGGTTTGAC AGGCCGTCTG 60TCTCTTGCGT CCTCTTACTA CGCCTGCCTG GACCCTACGT CTCAACTCCG ATTCAAG117ATG CGT TCC TCC CCT CTC CTC CGC TCC GCC GTT GTG GCC GCC CTG CCG 165Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro-20 -15 -10GTG TTG GCC CTT GCC GCT GAT GGC AAG TCC ACC CGC TAC TGG GAC TGC 213Val Leu Ala Leu Ala Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys-515 10TGC AAG CCT TCG TGC GGC TGG GCC AAG AAG GCT CCC GTG AAC CAG CCT 261Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro15 20 25GTC TTC TCC TGC AAC GCC AAC TTC CAG CGT CTC ACT GAC TTC GAC GCC 309Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Leu Thr Asp Phe Asp Ala30 35 40AAG TCC GGC TGC GAG CCG GGC GGT GTC GCC TAC TCG TGC GCC GAC CAG 357Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln45 50 55ACC CCA TGG GCT GTG AAC GAC GAC TTC GCG TTC GGT TTT GCT GCC ACC 405Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Phe Gly Phe Ala Ala Thr6065 70 75TCT ATT GCC GGC AGC AAT GAG GCG GGC TGG TGC TGC GCC TGC TAC GA452Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Gl80 85 90GTAAGCTTTG GTCGCGTGTG TAACACTGTG CAGGCATAGC ACTAACCACC TCCCAG G 509uCTC ACC TTC ACA TCC GGT CCT GTT GCT GGC AAG AAG ATG GTC GTC CAG 557Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln95 100 105TCC ACC AGC ACT GGC GGT GAT CTT GGC AGC AAC CAC TTC GAT CTC AAC 605Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn110 115 120ATC CCC GGC GGC GGC GTC GGC ATC TTC GAC GGA TGC ACT CCC CAG TTC 653Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe125 130 135GGC GGT CTG CCC GGC CAG CGC TAC GGC GGC ATC TCG TCC CGC AAC GAG 701Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu140 145 150TGC GAT CGG TTC CCC GAC GCC CTC AAG CCC GGC TGC TAC TGG CGC TTC 749Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe160 165 170GAC TGG TTC AAG AAC GCC GAC AAC CCG AGC TTC AGC TTC CGT CAG GTC 797Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val175 180 185CAA TGC CCA GCC GAG CTC GTC GCT CGC ACC GGA TGC CGC CGC AAC GAC 845Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp190 195 200GAC GGC AAC TTC CCT GCC GTC CAG ATC CCC TCC AGC AGC ACC AGC TCT893Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser205 210 215CCG GTC GGC CAG CCT ACC AGT ACC AGC ACC ACC TCC ACC TCC ACC ACC941Pro Val Gly Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr220 225 230 235TCG AGC CCG CCC GTC CAG CCT ACG ACT CCC AGC GGC TGC ACT GCT GAG989Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu240 245 250AGG TGG GCT CAG TGC GGC GGC AAT GGC TGG ACC GGC TGC ACC ACC TGC 1037Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys255 260 265GTC GCT GGC AGC ACC TGC ACG AAG ATT AAT GAC TGG TAC CAT CAG TGC 1085Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys270 275 280CTG TAA ACGCAGGGCA GCCTGAGAAC CTTACTGGTT GCGCAACGAA ATGACACTCC1141LeuCAATCACTGT ATTAGTTCTT GTACATAATT TCGTCATCCC TCCAGGGATT GTCACATATA 1201TGCAATGATG AATACTGAAC ACAAACCTGG CCGCTTGAAC TGGCCGAAGG AATGCC 1257序列号4序列的长度16序列类型氨基酸拓扑型直链形序列种类肽片段类型N末端片段起源生物名Humicola insolens序列 Gln Asn Cys Gly Ser Leu Thr Thr Glu Arg His Pro Ser Leu Ser Trp1 5 10 15序列号5序列的长度20序列类型氨基酸拓扑型直链形序列种类肽片段类型N末端片段起源生物名Humicola insolens序列 Val Val Glu Glu Arg Gln Asn Cys Gly Ser Ala Asp Gly Lys Ser Thr1 5 10 15Arg Tyr Trp Asp20序列号6序列的长度21序列类型氨基酸拓扑型直链形序列种类肽片段类型N末端片段起源生物名Humicola insolens序列 Gln Asn Cys Gly Ser Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys1 5 10 15Cys Lys Pro Ser Cys20序列号7序列的长度16序列类型氨基酸拓扑型直链形序列种类肽片段类型N末端片段起源生物名Humicola insolens序列Gln Gln Ala Gly Ser Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys15 10 1权利要求
1.包含来自Humicola insolens的纤维素酶NCE1基因或NCE2基因的调控序列的表达载体。
2.权利要求1记载的表达载体,其中来自Humicola insolens的纤维素酶NCE1基因或NCE2基因的调控序列是位于质粒pM3-1或质粒pM14-1内的NCE1和NCE2的调控序列。
3.权利要求1或2记载的表达载体,其中上述调控序列至少有一个是从启动子、信号序列、以及终止子构成的调控序列中选择出来的。
4.权利要求3记载的表达载体,其中前述启动子序列是存在于质粒pM3-1中的从NCE1基因的N末端到上游的大约1500bp区域中的序列或是保持高启动子活性的其变化序列。
5.权利要求4记载的表达载体,其中从NCE1基因的N末端到上游的大约1500bp区域中的序列是质粒pM3-1中的从NCE1基因的N末端到上游的BglⅡ位点的序列。
6.权利要求3记载的表达载体,其中前述启动子序列是存在于质粒pM14-1中的从NCE2基因的N末端到上游的大约1500bp区域中的序列或是保持高启动子活性的其变化序列。
7.权利要求6记载的表达载体,其中从NCE2基因的N末端到上游的大约1500bp区域中的序列是质粒pM14-1中的从NCE2基因的N末端到游的EcoRⅠ位点的序列。
8.权利要求3记载的表达载体,其中上述信号序列是编码序列1记载的氨基酸序列的从-22到-1序列的碱基序列或者是编码序列2记载的氨基酸序列的从-23到-1序列的碱基序列,或者是这些碱基序列的变化序列,即编码保持信号序列活性的氨基酸序列的碱基序列。
9.权利要求3记载的表达载体,其中上述终止子序列是存在于质粒pM3-1中的从NCE1基因的C端到下游大约1400bp的区域内的序列或者是保持终止子功能的其变化序列。
10.权利要求9记载的表达载体,其中存在于从NCE1基因的C端到下游大约1400bp的区域内的序列是从NCE1基因的C末端到下游的BglⅡ位点的序列。
11.权利要求3记载的表达载体,其中上述终止子序列是存在于质粒pM14-1中的从NCE2基因的C端到下游大约500bp的区域内的序列或者是保持终止子功能的其变化序列。
12.权利要求11记载的表达载体,其中存在于从NCE2基因的C端到下游大约500bp的区域内的序列是从NCE2基因的C末端到下游的BglⅡ位点的序列。
13.权利要求1~12中任一项记载的表达载体,其特征是还包含编码目的蛋白质的碱基序列,该序列与上述调控序列上可操作地连接。
14.权利要求13记载的表达载体,其中上述目的蛋白质是纤维素酶NCE4或其变化的蛋白质。
15.权利要求1~14中任一项记载的表达载体,其特征是还包含标记基因。
16.权利要求15记载的表达载体,其中标记基因是耐药性基因。
17.权利要求15记载的表达载体,其中标记基因是来自Streptomycesrimofaciens的越霉素抗性基因。
18.表达载体pMKD01、pEGD01、或pIED02。
19.权利要求10~18任一项记载的表达载体转化的属于腐质霉属属的微生物。
20.权利要求18记载的微生物,其中属于腐质霉属的微生物是Humicola insolens。
21.于属于Humicola属的微生物中表达目的蛋白质的方法,该方法包括培养权利要求19~20记载的微生物,以及从培养物中提取上述目的蛋白质或肽的工序。
22.权利要求21记载的方法,其中使用的微生物是Humicola insolens,每升培养液可以生产4.5g以上的蛋白质。
23.利用权利要求21或22记载的方法生产的蛋白质或肽,或含有这些蛋白质或肽的组合物。
24.利用权利要求21或22记载的方法,以pMKD01作为表达载体得到的N末端为序列4记载的氨基酸序列的蛋白质。
25.利用权利要求21或22记载的方法,以pEGD01作为表达载体得到的N末端为序列5或6记载的氨基酸序列的蛋白质。
26.利用权利要求21或22记载的方法,以pIED02作为表达载体得到的N末端为序列7记载的氨基酸序列的蛋白质。
27.含有存在于质粒pM3-1中的从NCE1基因的N末端到上游的大约1500bp区域中的序列或是保持高启动子活性的其变化序列的启动子序列。
28.权利要求27记载的启动子序列,其中存在于从NCE1基因的N末端到上游的大约1500bp区域中的序列是质粒pM3-1中的从NCE1基因的N末端到上游的BglⅡ位点的序列。
29.含有存在于质粒pM14-1中的从NCE2基因的N末端到上游的大约1500bp区域中的序列或是保持高启动子活性的其变化序列的启动子序列。
30.权利要求29记载的启动子序列,其中存在于从NCE2基因的N末端到上游的大约1500bp区域中的序列是质粒pM14-1中的从NCE1基因的N末端到上游的EcoRⅠ位点的序列。
全文摘要
本发明给出了在属于腐质霉Humicola属的微生物,尤其是在Humicola insolens中可能大量生产蛋白质的表达体系,特别是给出了宿主-载体体系以及利用该体系制造蛋白质的方法。构建含有来自Humicola insolens的纤维素酶NCE1基因或NCE2基因的调控序列,即启动子、信号序列、以及终止子的表达载体,并利用该载体。例如,利用该表达载体,于Humicola insolens中可以极高效率地生产纤维素酶NCE4,每升培养液可生产4.5g以上的NCE4。
文档编号C12N1/21GK1230995SQ97198009
公开日1999年10月6日 申请日期1997年7月24日 优先权日1996年7月24日
发明者守屋达树, 青柳薰, 隅田奈绪美, 渡边学, 村上健, 村岛弘一郎, 浜谷彻, 古贺仁一郎, 河野敏明 申请人:明治制果株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1