耐表面活性剂的纤维素酶及其修饰方法

文档序号:426777阅读:987来源:国知局
专利名称:耐表面活性剂的纤维素酶及其修饰方法
技术领域
本发明涉及一种修饰具有内切糖苷酶活性的蛋白(特别是属于家族45并具有内切糖苷酶活性的纤维素酶)的N-末端为焦谷氨酸,从而使其成为在表面活性剂时内切糖苷酶活性降低很小的纤维素酶的方法,并涉及该纤维素酶。
背景技术
纤维素是自然资源中最丰富的资源,因此可有效分解纤维素的纤维素酶系统在各个领域具有广泛用途。在本发明过程中,纯化和测定了多种纤维素酶,进一步,克隆了多种纤维素酶的基因,并通过序列同源性分析而进行家族分类(参见非专利参考文献1)。
另一方面,根据其性质,可将纤维素酶应用于多个工业领域,特别是纺织品加工领域。例如,纤维素酶处理可改善含纤维素的织物的手感和/或外观,或通过“酵素洗涤”,赋予含纤维素的有色织物“石磨”外观,从而使织物的色彩局部性变化。另外,在莱塞尔加工过程中,可用纤维素酶除去加工过程中在织物表面产生的绒毛。在本文中,莱塞尔是一种来源于木浆的再生纤维素织物,最近由于其本身特性,例如高强度或吸水性,并且其生产过程造成的环境污染小而倍受关注。
目前认为纤维素酶是通过多个酶的共同作用,例如协同作用来分解纤维素的。在由多个酶组成的纤维素酶组中含有可降低织物韧性的酶等不适于纺织品加工领域的酶。因此,需要通过蛋白分离技术和/或基因工程技术从纤维素酶组中分离适于纺织品加工的酶组分,并生产这些酶组分。特别地,对来源于丝状真菌例如木霉属(Trichoderma)或腐质霉属(Humicola)的微生物的纤维素酶已进行了深入研究。例如,已分离到腐质霉属中的纤维素酶组分CBH I、EG V(参见专利文献1)、NCE2、NCE4和NCE5,及木霉属中的CBH I、CBH II、EG II和EG III等,因此,可通过基因工程技术制备过表达的酶或单一组分的酶等,从而来生产含一种或多种特定的纤维素酶组分为主要组分,适于不同目的的纤维素酶制品。另外,已表明属于家族45的纤维素酶,例如NCE4(参见专利文献2)、NCE5(参见专利文献3)、RCE1(参见专利文献4)或STCE1(参见国际专利申请PCT/JP2004/15733)在上述领域是非常有用的。
另一方面,当纤维素酶用于衣物洗涤剂时,则不仅要改善纤维素酶组分的量,而且要改善其性质。更具体地,衣物洗涤剂含多种表面活性剂,而且将其溶解于水所获得的溶液是碱性的(pH10-pH11)。因此,包含在衣物洗涤剂中的纤维素酶要在碱性条件下可耐受多种表面活性剂的作用。Otzen,D.E.等人已报道向来源于Humicola insolens的Cel45的内部氨基酸序列中引入一个突变,可使其在pH7,存在线性烷基苯磺酸(LAS)的条件下表现出约3.3倍于野生型Cel45的活性(参见非专利文献2)。但由该突变提供的在存在表面活性剂时抑制活性降低的作用仅限于Cel45或其同源蛋白,并不适于与Cel45同源性较低的,属于家族45的内切糖苷酶。
(专利文献1)国际专利WO91/17243(专利文献2)国际专利WO98/03667(专利文献3)国际专利WO01/90375(专利文献4)国际专利WO00/24879非专利文献1Henrissat B.,Bairoch A.Updating the sequence-based classification of glycosyl hydrolases.Biochem.J.316695-696(1996)非专利文献2Daniel E.Otzen,Lars Christiansen,Martin Schulein.
A comparative study of the unfolding of the endoglucanase Cel45 from Humicola insolens in denaturant and surfactant,ProteinSci.81878-1887(1999)发明描述本发明要解决的问题本发明的一个目标是提供将具有内切糖苷酶活性的蛋白(特别是属于家族45,并具有内切糖苷酶活性的蛋白)转变为具有内切糖苷酶活性,而且其活性在存在表面活性剂时降低很小的蛋白的方法;该方法中使用的载体;具有内切糖苷酶活性,而且其活性在存在表面活性剂时降低很小的蛋白;及其编码多核苷酸。本发明的另一个目标是用上述微生物提供一种可有效地生产用于洗涤衣物的酶蛋白的微生物。
解决问题的方法本发明人进行了广泛研究,发现将焦谷氨酸(以下有时以pQ表示)或含pQ的肽加到属于家族45,并具有内切糖苷酶活性的蛋白的N末端的蛋白,例如N末端添加型纤维素酶,与野生型纤维素酶相比较,其内切糖苷酶活性在表面活性剂存在时没有显著降低。
在存在阴离子表面活性剂时保持高内切糖苷酶活性的性质对用于衣物洗涤的酶来说是非常有用的,但没有发现这样的纤维素酶。另外,也没有关于通过添加焦谷氨酸或含焦谷氨酸的肽而在存在表面活性剂时保持酶活性的作用的报道。
本发明的另一个方面是关于所有N末端未被保护而在存在表面活性剂时保持酶活性的纤维素酶,可通过向纤维素酶中加入焦谷氨酸或含焦谷氨酸的肽来抑制在表面活性剂存在时活性降低。可添加焦谷氨酸或含焦谷氨酸的肽的纤维素酶无特别的限定,但优选属于家族45的纤维素酶。
因此,本发明包括以下方面(1)一种抑制在存在表面活性剂时内切糖苷酶活性降低的方法,其特征在于修饰具有内切糖苷酶活性、而N末端不是焦谷氨酸的蛋白的N末端,使其成为N末端具有焦谷氨酸的蛋白;(2)(1)中的方法,其中通过向具有内切糖苷酶活性、而N末端不是焦谷氨酸的蛋白的N末端加入焦谷氨酸或可转变为焦谷氨酸的氨基酸,或N末端含有焦谷氨酸或可转变为焦谷氨酸的氨基酸的肽来进行修饰;(3)(1)中的方法,其中通过用焦谷氨酸或可转变为焦谷氨酸的氨基酸,或N末端含有焦谷氨酸或可转变为焦谷氨酸的氨基酸的肽替换具有内切糖苷酶活性、而N末端不是焦谷氨酸的蛋白的N末端氨基酸或N末端区域来进行修饰;(4)(1)到(3)任一项中的方法,其中具有内切糖苷酶活性、而N末端不是焦谷氨酸的蛋白是属于家族45的纤维素酶;(5)一种具有内切糖苷酶活性的修饰蛋白,其N末端氨基酸通过氨基酸修饰转变为焦谷氨酸;(6)(5)中的修饰蛋白,其是通过(1)到(4)任一项中的方法获得的;(7)一种从以下组中选择的蛋白(a)包含SEQ ID NO2、4、38或40所示的氨基酸序列的蛋白;(b)包含在SEQ ID NO2、4、38或40所示的氨基酸序列中缺失、替换、插入或添加一个或多个氨基酸所得的氨基酸序列,而且其内切糖苷酶活性在存在表面活性剂时降低很小的修饰蛋白;及(c)同源蛋白,其氨基酸序列与包含SEQ ID NO2、4、38或40所示的氨基酸序列的蛋白的同源性至少为85%,并且,其内切糖苷酶活性在存在表面活性剂时降低很小;(8)编码(5)到(7)任一项中的蛋白的多核苷酸;(9)从以下组中选择的多核苷酸(a)包含SEQ ID NO1、3、37或39所示的核酸序列的多核苷酸;(b)包含在SEQ ID NO1、3、37或39所示的核酸序列中缺失、替换、插入或添加一个或多个碱基所得的碱基序列,而且其所编码蛋白的内切糖苷酶活性在存在表面活性剂时降低很小的多核苷酸;及(c)与SEQ ID NO1、3、37或39所示的核酸序列在严紧条件下杂交,而且编码内切糖苷酶活性在存在表面活性剂时降低很小的蛋白的多核苷酸;(10)含(8)或(9)所述的多核苷酸的表达载体;(11)用(10)所述的表达载体转化的宿主细胞;(12)(11)所述的宿主细胞,其中所述宿主细胞是酵母或丝状真菌;(13)(12)所述的宿主细胞,其中,所述丝状真菌是属于腐质霉属(Humicola)或木霉属的微生物;(14)(13)中的宿主细胞,其中,所述丝状真菌是Humicolainsolens或绿色木霉(Trichoderma viride);(15)一种生产(5)到(7)中任何一种蛋白的方法,包括培养(11)到(14)任一项中的宿主细胞,从培养的宿主细胞或培养物中回收蛋白;及一种由(15)所述的方法产生的蛋白。
发明效果根据本发明可有效产生用于衣物洗涤,而且其内切糖苷酶活性在存在表面活性剂时降低很小的新型纤维素酶。
发明的优选实施方案属于家族45并具有内切糖苷酶活性的蛋白(此后有时指“属于家族45的纤维素酶”)家族45此处所用术语“家族45”是指根据Henrissat B.等人.关于碳水化合物活性酶的疏水簇分析而划分为家族45的蛋白[Henrissat B.,Bairoch A.Updating the sequence-based classification of glcosylhydrolases.Biochem.J.316695-696(1996)]。
具有内切糖苷酶活性的蛋白此处所用术语“具有内切糖苷酶活性的蛋白”是指具有内切糖苷酶活性的酶,例如内切-1,4-β-糖苷酶(EC3.2.1.4),它可水解β-1,4-糖苷中的β-1,4-吡喃葡萄糖苷键。
表面活性剂此处所用术语“表面活性剂”是一种含在衣物洗涤剂中的洗涤剂成分,可广泛地分为阴离子、阳离子和非离子表面活性剂。通常使用的是阴离子表面活性剂。本发明中所用的优选阴离子表面活性剂可以是,例如线性烷基苯磺酸(以下有时以LAS表示)。
内切糖苷酶活性此处所用术语“内切糖苷酶(以下以“EGU”表示)活性”定义为通过以下流程测定的羧甲基纤维素溶液粘度的降低而得到的酶活性。
更具体地,作为底物溶液,将羧甲基纤维素(Hercules)溶解在0.1mol/L的Tris-HCl缓冲液(pH10.0)中,使终浓度为3.5%。预先将底物溶液(5mL)在40℃加热10分钟,然后加入0.15mL酶溶液,将整个溶液混匀,在40℃反应30分钟。通过R型粘度计(RE100;TOKISANGYO CO.,LTD.)在40℃测定混合液的粘度。“1单位”酶活性定义为在每个反应条件下,将最初粘度降低到1/2所用的酶量。使用的阴离子表面活性剂是线性烷基苯磺酸(Wako Pure Chemical Industries,Co.,Ltd.),将其加到羧甲基纤维素溶液中,至终浓度为800ppm。
存在表面活性剂时内切糖普酶活性降低的抑制此处所用术语“存在表面活性剂时其内切糖苷酶活性降低较小“是指将其N末端根据本发明进行修饰的蛋白(N末端修饰型蛋白)与修饰前的原始蛋白(以下简称为原始蛋白)在存在表面活性剂时,对其内切糖苷酶活性进行比较,N末端修饰型蛋白的内切糖苷酶活性比原始蛋白高。
原始蛋白本发明方法中所用的原始蛋白并无特别限定,只要N末端是除焦谷氨酸外的氨基酸,并具有内切糖苷酶活性的蛋白即可。原始蛋白优选地可以包括,例如纤维素酶(例如,内切糖苷酶、纤维二糖水解酶或β-葡糖醛酸苷酶),及属于家族45的纤维素酶。在本文中,只要原始蛋白至少具有内切糖苷酶活性即可,因此可以是只具有内切糖苷酶活性的蛋白,或具有除内切糖苷酶活性外其它一种或多种酶活性的蛋白。另外,原始蛋白可以是天然蛋白或经遗传修饰的蛋白。
属于家族45的纤维素酶的来源属于家族45的纤维素酶可通过基因工程技术,例如重组DNA技术或多肽合成技术产生,或从分离的野生型菌株获得。另外,纤维素酶包括属于家族45的野生型纤维素酶的突变体。
属于家族45的纤维素酶可从微生物,例如丝状真菌或接合菌获得。丝状真菌包括,例如属于腐质霉属(例如Humicola insolens)、木霉属(例如绿色木霉)、圆孢霉属(例如Staphylotrichumcoccosporum)或Myriococcum(例如Myriococcum thermophilum)的微生物。更具体地,来源于腐质霉属的纤维素酶包括,例如CBH I、EG V、NCE2、NCE4或NCE5等;来源于木霉属的纤维素酶包括,例如CBH I、CBH II、EG II和EG III等;来源于Staphylotrichum属的纤维素酶包括,例如STCE1和STCE3等;及来源于Myriococcum属的纤维素酶包括,例如MTE1等。接合菌包括,例如属于根霉属(Rhizopus)(例如米曲霉(Rhizopus oryzae))、毛霉属(Mucor)(例如卷枝毛霉(Mucor circinelloides))或须霉属(Phycomyces)(例如闪光须霉(Phycomyces nitens))的微生物。更具体地,包括来源于米曲霉的RCE I、RCE II或RCE III;来源于卷枝毛霉的MCE I或MCE II;或来源于闪光须霉的PCE I(WO00/24879)。
焦谷氨酸或含焦谷氨酸的肽此处所用术语“焦谷氨酸“是指通过成熟蛋白N末端谷氨酰胺或谷氨酸的环化而产生的焦谷氨酸。焦谷氨酸具有N末端氨基不暴露在外的性质。可在体内或体外进行焦谷氨酸的环化。体内,通过将编码经基因工程设计而使成熟蛋白的N末端为谷氨酰胺或谷氨酸的修饰蛋白的多核苷酸在宿主中进行表达,从而得到焦谷氨酸环化的蛋白。体外,将N末端具有谷氨酰胺或谷氨酸的蛋白用酸性溶液,例如甲酸进行处理,从而得到焦谷氨酸环化的蛋白。
此处所用术语“肽”是指含一个或多个氨基酸,而且氨基酸通过肽键聚合的化合物。因此,此处所用术语“含焦谷氨酸的肽”是指其N末端为焦谷氨酸的肽。含焦谷氨酸的肽包括两个或多个交联的氨基酸,例如2到40个氨基酸,优选地为2到30个氨基酸,更优选地为2到20个氨基酸,更优选地为2到10个氨基酸,更优选地为2到5个氨基酸,最优选地为2到4个氨基酸交联。氨基酸并无特别限定,只要他们可被本领域技术人员用于所述目的即可。
在本发明的方法中,对将原始蛋白修饰为N末端具有焦谷氨酸的蛋白的方法不进行限定,只要可进行蛋白修饰即可。这些方法包括,例如基因工程技术或化学技术。
根据基因工程技术,原始蛋白可通过,例如基因工程水平上的添加和/或替代合适的氨基酸或氨基酸序列而进行修饰。
在一个通过基因工程添加的实施例中,通过向原始蛋白(例如,具有内切糖苷酶活性,且N末端不是焦谷氨酸的蛋白)的N末端加入焦谷氨酸或N末端含焦谷氨酸的肽而进行蛋白修饰。
例如,更具体地,通过基因工程技术进行添加的实施例可包括以下步骤(1)向编码原始蛋白的多核苷酸的5’末端添加编码可转变为焦谷氨酸的氨基酸(谷氨酰胺或谷氨酸)的多核苷酸,或编码N末端具有可转变为焦谷氨酸的氨基酸的多肽的多核苷酸;及(2)在可使N末端氨基酸进行焦谷氨酸环化的宿主中表达(1)中所得的多核苷酸。
在通过基因工程替代的实施例中,通过将原始蛋白的N末端氨基酸或N末端区替代为焦谷氨酸或N末端含焦谷氨酸的肽而进行蛋白修饰。
例如,更具体地,通过基因工程替代的实施例可包括以下步骤(1)将编码原始蛋白的5’末端或含5’末端区的多核苷酸用编码可转变为焦谷氨酸的氨基酸(谷氨酰胺或谷氨酸)的多核苷酸,或编码N末端具有可转变为焦谷氨酸的氨基酸的肽的多核苷酸替代;及(2)在可使N末端氨基酸进行焦谷氨酸环化的宿主中表达(1)中所得的多核苷酸。
使用化学技术的实施例可包括,例如,(a)将焦谷氨酸(或N末端含焦谷氨酸的肽)直接加到原始蛋白的N末端的实施例;(b)将可转变为焦谷氨酸的氨基酸(或N末端具有可转变为焦谷氨酸的氨基酸的肽)通过化学方法加到原始蛋白N末端,并通过化学方法进行N末端氨基酸焦谷氨酸化的实施例;或(c)将N末端具有可转变为焦谷氨酸的氨基酸的原始蛋白的N末端氨基酸通过化学方法焦谷氨酸化的实施例。
在属于家族45的纤维素酶的N末端加入焦谷氨酸或含焦谷氨酸的肽的方法修饰方法可通过用属于家族45的纤维素酶在实施例中进行进一步阐述。在属于家族45的纤维素酶的N末端加入焦谷氨酸或含焦谷氨酸的肽的方法可通过基因工程技术进行。在通常所用的纤维素酶的生产中,编码所需纤维素酶的多核苷酸的编码区可连接到在丝状真菌等宿主中有功能的启动子和终止子之间,然后将得到的表达盒转入宿主中。另外,编码在宿主细胞中具有分泌功能的信号肽序列的多核苷酸也可以加到表达盒中。当将表达盒引入到宿主细胞中时,所需的纤维素酶可分泌到培养基中,从而可很容易地收集所需的纤维素酶。在这种情况下,可通过向紧邻分泌信号肽序列的下游加入编码氨基酸的多核苷酸而将所需氨基酸加到纤维素酶的N末端。另外,也可通过用宿主中的分泌信号序列进行N末端氨基酸的氨基基团的修饰。例如,在来源于绿色木霉的cbh1或cbh2,或来源于Humicola insolens的NCE2或NCE5中,N末端是焦谷酸化的,这种修饰可通过用来源于这种微生物的分泌信号序列并在绿色木霉或Humicola insolens中表达来制备。根据优选实施例,如上所述制备的属于家族45的修饰纤维素酶具有在存在表面活性剂时其内切糖苷酶活性降低很小的优势性质。
根据另一个实施例,整个序列可根据本领域技术人员常用的技术进行化学合成。在这种情况下,可用部分天然蛋白进行合成。
本发明中的蛋白本发明中的蛋白通过将具有内切糖苷酶活性的原始蛋白的N末端修饰为焦谷氨酸而进行制备(例如,通过获得属于家族45的纤维素酶,并向该成熟蛋白的N末端氨基酸中链加入焦谷氨酸(pQ)或含焦谷氨酸的肽而制备),而且其内切糖苷酶活性在存在表面活性剂时降低很小。另外,本发明包括通过上述方法制备的,其内切糖苷酶活性在存在表面活性剂时降低很小的蛋白。
更具体地,本发明中的蛋白包括从由以下蛋白组成的组中选择的蛋白(a)包含SEQ ID NO2、4、38或40所示的氨基酸序列的蛋白;(b)含有在SEQ ID NO2、4、38或40所示的氨基酸序列中缺失、替换、插入或添加一个或多个氨基酸所得的氨基酸序列,而且其内切糖苷酶活性在存在表面活性剂时降低很小的修饰蛋白;及(c)同源蛋白,其氨基酸序列与SEQ ID NO2、4、38或40所示的氨基酸序列的蛋白的同源性至少为85%,而且其内切糖苷酶活性在存在表面活性剂时降低很小。
SEQ ID NO2的氨基酸序列是N末端添加型NCE4的氨基酸序列(参见实施例A2),其中含有5个氨基酸(N末端为焦谷氨酸)的肽加到来源于Humicola insolens MN200-1的内切糖苷酶NCE4的N末端。
SEQ ID NO4的氨基酸序列是N末端替代型STCE1的氨基酸序列(参见实施例B2),其中含有4个氨基酸(N末端为焦谷氨酸)的肽替代来源于Staphylotrichum coccosporum IFO 31817的内切糖苷酶STCE1的N末端氨基酸(Ala)。
SEQ ID NO38的氨基酸序列是pQ添加型STCE1的氨基酸序列(参见实施例B3),其中焦谷氨酸加到来源于Staphylotrichumcoccosporum IFO 31817的内切糖苷酶STCE1的N末端。
SEQ ID NO40的氨基酸序列是N末端添加型STCE1的氨基酸序列(参见实施例B4),其中含有4个氨基酸(N末端为焦谷氨酸)的肽加到来源于Staphylotrichum coccosporum IFO 31817的内切糖苷酶STCE1的N末端。
此处所用术语“修饰蛋白”是指包含在SEQ ID NO2、4、38或40所示的氨基酸序列中缺失、替代、插入或添加一个或多个氨基酸(例如,一个或几个氨基酸)所得的氨基酸序列,而且其内切糖苷酶活性在存在表面活性剂时降低很小的蛋白。修饰例如“缺失、替代、插入或添加”的氨基酸的数目优选地是1到30,更优选地是1到10,最优选地是1到6。
另外,修饰蛋白是指包含在SEQ ID NO2、4、38或40所示的氨基酸序列中保守替代一个或多个氨基酸,而且其内切糖苷酶活性在存在表面活性剂时降低很小的蛋白。此处所用术语“保守替代”是指蛋白中一个或多个氨基酸残基可被具有相同化学性质的不同氨基酸替代,从而使其蛋白活性不发生实质性改变。保守替代可包括,例如将疏水残基替代为另一个疏水残基,或将极性残基替代为另一个具有相同电荷的极性残基。具有相同化学性质并可互相保守替代的氨基酸是本领域技术人员已知的。更具体地,非极性(疏水)氨基酸包括,例如丙氨酸、缬氨酸、异亮氨酸、亮氨酸、脯氨酸、色氨酸、苯丙氨酸或蛋氨酸。极性(中性)氨基酸包括,例如甘氨酸、丝氨酸、苏氨酸、酪氨酸、谷氨酰胺、天冬酰胺或半胱氨酸。带正电荷的碱性氨基酸包括,例如精氨酸、组氨酸或赖氨酸。带负电荷的酸性氨基酸包括,例如天冬氨酸或谷氨酸。
此处所用术语“同源蛋白”是指其与包含SEQ ID NO2、4、38或40所示的氨基酸序列的同源性(序列相似性)至少为85%(优选地是90%或以上,最优选地是95%或以上),且其内切糖苷酶活性在存在表面活性剂时降低很小的蛋白。此处所用同源性以用已知的同源性分析软件FASTA3,根据缺省参数计算出的值(相似性)表示[Science,227,1438-1441(1985);Proc.Natl.Acad.Sci.USA,85,2444-2448(1988);http://www.ddbj.nig.ac.jp/E-mail/homology-j.html]。
如上所述,在本发明的“由氨基酸序列SEQ ID NO2所示的蛋白”中,除了加到N末端的由5个氨基酸组成的肽外,其它部分来源于内切糖苷酶NCE4。另外,在本发明的“氨基酸序列SEQ ID NO4、38或40所示的蛋白”中,除了N末端氨基酸或肽外,其它部分来源于内切糖苷酶STCE1。内切糖苷酶NCE4和STCE1属于家族45。已知属于家族45的内切糖苷酶包括,例如来源于腐质霉属的NCE5(WO01/90375)。


图1和2中,所示的是内切糖苷酶STCE1的氨基酸序列[信号肽(SEQ ID NO43),成熟蛋白(SEQ ID NO44)]、内切糖苷酶NCE4的氨基酸序列[信号肽(SEQ ID NO45),成熟蛋白(SEQ ID NO46)]和内切糖苷酶NCE5的氨基酸序列[信号肽(SEQ ID NO47),成熟蛋白(SEQ ID NO48)]的比对结果。
图1所示的是前半部分(即N末端部分)的比对结果,图2所示的是后半部分(即C末端部分)的比对结果。图1和2中的符号“*”表示与STCE1一致的氨基酸。
如图1和2所示,属于家族45的内切糖苷酶包括作为共有结构域的催化结构域(1到207位),有些含有接头(208到258位)和/或纤维素结合结构域(CBD)(259到295位)。在本文中,以上结构域之后的括号中的数字表示内切糖苷酶STCE1的氨基酸序列(SEQ IDNO44)中的氨基酸编号。
在内切糖苷酶的催化结构域和纤维素结合结构域均存在保守氨基酸,但在接头没有明显的保守区存在。含多个保守氨基酸或在该区域所含的共有氨基酸的区域(例如,催化结构域或纤维素结合结构域,特别是催化结构域)是对内切糖苷酶(例如STCE1或NCE4)酶活性重要的区域或氨基酸。因此,在除了这种重要区域或氨基酸的其它区域或氨基酸处进行氨基酸修饰(例如缺失、替代、插入和/或添加,特别是保守替代),可高效率获得该酶活性得到维持的修饰蛋白质或同源蛋白质,而无需过度试验。。
另外,即使在内切糖苷酶含多个保守氨基酸的区域中,用不同的氨基酸对非共有氨基酸进行修饰(优选地是相同的氨基酸进行保守替代)也可以保持酶活性。因此,通过这种修饰,可高效率获得该酶活性得到维持的修饰蛋白质或同源蛋白质,而无需过度试验。。
即使是含有大量保守氨基酸的区域内的共有氨基酸,改变为其它氨基酸时,有时也可维持其酶活性,尤其是改变为可保守取代类似氨基酸的时候,其可能性增高。本发明的修饰蛋白质或同源蛋白质,只有是具有内切葡聚糖酶活性,可以是任意区域,例如催化区域、接头或纤维素结合区域所含的氨基酸改变的蛋白质。
编码本发明中蛋白的多核苷酸根据本发明,提供编码包含SEQ ID NO2、4、38或40所示的氨基酸序列的蛋白,或其修饰或同源蛋白(以下统称为本发明中的蛋白)的多核苷酸。当给定一个蛋白的氨基酸序列时,则可容易地选择编码该氨基酸序列的核苷酸序列,因此可选择多种编码本发明中蛋白的核苷酸序列。此处所用术语“多核苷酸”包括DNA和RNA,DNA是优选的。
本发明中的多核苷酸包括从由以下多核苷酸组成的组中选择的多核苷酸(a)包含核苷酸序列SEQ ID NO1、3、37或39的多核苷酸;(b)包含在核苷酸序列SEQ ID NO1、3、37或39中缺失、替代、插入或添加一个或多个碱基所得的碱基序列,而且其所编码蛋白的内切糖苷酶活性在存在表面活性剂时降低很小的多核苷酸;及(c)在严紧条件下与核苷酸序列SEQ ID NO1、3、37或39所示的多核苷酸杂交,而且其所编码蛋白的内切糖苷酶活性在存在表面活性剂时降低很小的多核苷酸。
在上述(b)中的核苷酸序列中,被缺失、替代、插入或添加的核苷酸的数目可以是例如1到90,优选地是1到30,更优选地是1到18,最优选地是1到9。
此处所用术语“在严紧条件下”是指以下条件。根据ECL直接DNA/RNA标记和检测系统(Amersham)的说明书所述,在42℃预杂交1小时后,加入核苷酸序列SEQ ID NO1、3、37或39所示的多核苷酸,并在42℃杂交14到16小时。杂交后,用含0.4%SDS和6mol/L尿素的0.5×SSC(1×SSC;15mmol/L柠檬酸钠,150mmol/L氯化钠)在42℃洗涤20分钟,并重复2次,然后用5×SSC在室温下洗涤5分钟,并重复2次。
本发明中的多核苷酸包括天然多核苷酸。也可以是全合成的多核苷酸。而且可用部分天然多核苷酸进行合成。典型地,本发明中的多核苷酸可从来源于微生物的基因组文库,通过基因工程的普通方法,例如用根据部分氨基酸序列信息设计的合适的DNA探针,进行筛选而获得。
本发明中的蛋白的产生本发明中的蛋白可通过用含编码本发明蛋白的多核苷酸片段的多核苷酸分子(优选以表达载体形式)转化宿主细胞,从而使多核苷酸分子在宿主细胞中复制,并进行基因表达而在宿主细胞中产生。
根据本发明,提供了含编码本发明中的蛋白的多核苷酸片段,从而使多核苷酸片段可在宿主微生物中复制并表达蛋白的表达载体。
本发明中的表达载体可基于存在于染色体外并能独立于染色体复制而进行复制的自主复制载体(例如质粒)进行构建。选择性地,本发明中的表达载体可以是用载体转化宿主时将其整合到宿主微生物基因组中,与染色体一起复制的载体。本发明中载体的构建可通过基因工程中通用流程或方法进行。
为了用本发明中的表达载体转化宿主微生物而表达具有所需活性的蛋白。优选地是表达载体除了本发明中的多核苷酸片段外还包括,例如可调控表达的多核苷酸,或筛选转化子的基因标记。
在本发明中可使用多种调控转录或翻译的信号作为可调控表达的多核苷酸,例如启动子、终止子或编码分泌信号肽的多核苷酸。可通过普通方法将调控的多核苷酸与其插入片段进行连接。
本发明中所用的启动子并无特别限定,只要其在宿主微生物中具有转录活性即可。启动子可以是调控来源于相同或不同宿主微生物的编码蛋白的基因表达的多核苷酸。例如,可在大肠杆菌中使用乳糖操纵子或色氨酸操纵子的启动子;在酵母中使用乙醇脱氢酶基因、酸性磷酸酶基因、半乳糖利用基因或甘油醛-3-磷酸脱氢酶基因的启动子;在真菌例如丝状真菌中使用α-淀粉酶基因、葡糖淀粉酶基因、纤维二糖水解酶基因或甘油醛-3-磷酸脱氢酶基因的启动子。
信号肽并无特别限定,只要其可在宿主微生物中提供蛋白分泌作用即可。信号肽多核苷酸可从与编码蛋白的基因相同或不同来源的宿主微生物中获得。
基因标记可根据筛选转化子的方法进行合适的选择。例如,在本发明中可使用抗药基因或与营养缺陷型突变互补的基因作为基因标记。例如,当宿主是细菌时,可使用氨苄青霉素抗性基因、卡那霉素抗性基因或四环素抗性基因。当宿主是酵母时,可使用色氨酸合成基因(trpI,trpC)、尿嘧啶合成基因(ura3)、亮氨酸合成基因(leu2)或组氨酸合成基因(his3)。当宿主是真菌例如丝状真菌时,可使用越霉素抗性基因、硝酸盐利用基因(niaD)、精氨酸合成基因(argB)、尿嘧啶合成基因(pyr4)、潮霉素抗性基因、除草剂抗性基因、博来霉素抗性基因或aureobasidin抗性基因。
根据本发明,提供用表达载体转化的微生物。本发明中所用的宿主-载体系统并无特别限定。例如,可使用大肠杆菌、放线菌、酵母或丝状真菌系统,或利用这种微生物进行融合蛋白表达的系统。当用酵母作为宿主时,包括,例如,使用酿酒酵母属(Saccharomyces)、汉逊酵母属(Hansenula)、或毕赤酵母属(Pichia)的微生物,优选地是酿酒酵母。当使用丝状真菌作为宿主时,可以使用任何丝状真菌,优选地是属于腐质霉属、木霉属、曲霉属(Aspergillus)、Acremonium或镰刀菌属(Fusarium)的微生物,更优选地是属于腐质霉或木霉属的微生物。更优选地是Humicola insolens、Humicola thermoidea、绿色木霉、里氏木霉(Trichoderma reesei)、长梗木霉(Trichodermalongibrachiatum)、Staphylotrichum coccosporum、黑曲霉(Aspergillusniger)、米曲霉(Aspergillus oryzae)、尖孢镰孢(Fusarium oxysporum)或Acremonium cellulolyticus,优选地是Humicola insolens或绿色木霉。
可通过普通方法,例如钙离子法、锂离子法、电穿孔法、PEG法、土壤杆菌法或基因枪法用表达载体转化微生物,根据待转化宿主选择合适的方法。
在本发明中,将本发明中的转化子进行培养,得到的培养物用来获得本发明的目的蛋白。本发明中的转化子可通过普通方法选择合适的培养基或培养条件进行培养。
可向培养基中补充例如可被本发明中的转化子代谢或利用的碳源或氮源、无机盐、各种维生素、各种氨基酸例如谷氨酸或天冬酰胺、微量营养物质例如核苷酸、或选择试剂例如抗生素。另外,可适当添加利于本发明中的转化子生长或促进本发明中的蛋白产生的有机和/或无机物质。另外,如果需要,可使用含其它营养物质的天然或合成培养基。
可在培养基中使用任何碳源和氮源,只要它可被本发明中的转化子利用即可。可利用碳源可使用例如蔗糖、淀粉、甘油、葡萄糖、果糖、麦芽糖、乳糖、纤维素、纤维二糖、糊精、动物油或植物油或其水解物。一般来说,其浓度在培养基中优选地是0.1%到5%。可利用氮源可使用例如动植物组分或其提取物、例如蛋白胨、肉提取物、玉米浸出液或脱脂豆粉、有机酸铵盐例如琥珀酸铵盐或酒石酸铵盐、尿素或其它多种含氮化合物例如无机酸或有机酸。无机盐可使用例如那些可产生钠、钾、钙、镁、钴、磷酸、硫酸或其它离子的无机盐。
可适当使用任何含其它组分,例如细胞、分泌液或微生物例如酵母提取物、或细小植物粉的培养基,只要这种培养基不干预本发明中的转化子生长和本发明中的蛋白的产生和积累即可。当培养具有营养需求的突变株时,通常向培养基中加入满足其营养需求的物质。在本文中,如果培养基中含天然底物,则不需加入这种营养物质。
根据所用的转化子和外部条件,对培养条件例如培养基成分、培养基流动性、培养温度、搅拌速率或通气速率进行合适的选择和控制,从而得到优选的结果。如果在液体培养基中产生泡沫,则可使用消泡剂例如硅树脂油、植物油、矿物油或表面活性剂。
在获得的培养物中积累的本发明中的蛋白包含于本发明中的转化子和培养物滤液中。因此,可通过离心分离培养物组分而从培养物滤液和转化子细胞中获得本发明中的蛋白。
本发明中的蛋白可通过普通方法从培养物滤液中回收。从培养物中回收本发明中的蛋白的流程可按单独或按任意顺序组合,或重复进行。例如,可使用萃取过滤、离心、透析、浓缩、干燥、冷冻、吸附、解吸附、基于在各种溶剂中溶解度不同的分离方法(例如沉淀、盐析、结晶、重结晶、反向溶解或层析)。
另外,本发明中的蛋白可从本发明中的转化子的培养物中获得。例如,通过普通方法从培养物中提取(例如,研磨处理或压力破碎)、回收(例如,过滤或离心)、或纯化(例如,盐析或溶剂沉淀)。
可根据普通方法对得到的粗物质进行纯化,例如用载体物质例如葡聚糖、纤维素、琼脂糖、合成多聚物或硅胶进行柱层析。本发明中的目的蛋白的纯品可从本发明中的转化子培养物中通过上述方法单独或以合适组合而获得。
如上所述,根据本发明的另一个实施例,提供本发明中的新型蛋白的生产过程。可以与制备转化子的原始宿主实质上相同的方式进行转化子的培养(包括培养条件)。转化子培养后的目的蛋白的回收方法可通过常用的方法进行。
保藏菌株用本发明的表达载体pEGD01转化的大肠杆菌JM109(FERMBP-5973)在1996年7月12日国内保藏于独立行政法人产业技术综合研究所特许生物寄托中心[(以前名称)通商产业省工业技术院生命工学工业技术研究所(地址 305-8566日本国茨城县筑波东1丁目1番地1中央第6)],并于1997年6月13日转为国际保藏。国际保藏号(国际保藏号后的括号[]中的数字是国内保藏号)是FERM BP-5973[FERM P-15729]。
用本发明的表达载体pMKD01转化的大肠杆菌JM109(FERMBP-5974)在1996年7月12日在国内保藏于独立行政法人产业技术综合研究所特许生物寄托中心[(以前名称)通商产业省工业技术院生命工学工业技术研究所(地址 305-8566日本国茨城县筑波东1丁目1番地1中央第6)],并于1997年6月13日转为国际保藏。国际保藏号(国际保藏号后的括号[]中的数字是国内保藏号)是FERM BP-5974[FERM P-15730]。
用本发明的表达载体pCB1-M2XR转化的大肠杆菌JM109(FERMBP-6045)在1996年9月9日在国内保藏于独立行政法人产业技术综合研究所特许生物寄托中心[(以前名称)通商产业省工业技术院生命工学工业技术研究所(地址 305-8566日本国茨城县筑波东1丁目1番地1中央第6)],并于1997年8月11日转为国际保藏。国际保藏号(国际保藏号后的括号[]中的数字是国内保藏号)是FERM BP-6045[FERM P-15840]。
在本文中,本发明中的质粒pCB1-M2不仅可通过实施例中描述的方法获得,而且也可以通过预先用限制性酶XbaI消化的质粒pCB1-M2XR的自连而获得。
作为本发明中的表达载体的宿主的Humicola insolens MN200-1(FERM BP-5977)在1996年7月15日在国内保藏于独立行政法人产业技术综合研究所特许生物寄托中心[(以前名称)通商产业省工业技术院生命工学工业技术研究所(地址 305-8566日本国茨城县筑波东1丁目1番地1中央第6)],并于1997年6月13日转为国际保藏。国际保藏号(国际保藏号后的括号[]中的数字是国内保藏号)是FERMBP-5977[FERM P-15736]。
作为本发明中的表达载体的宿主的绿色木霉MC300-1(FERMBP-6047)在1996年9月9日在国内保藏于独立行政法人产业技术综合研究所特许生物寄托中心[(以前名称)通商产业省工业技术院生命工学工业技术研究所(地址 305-8566本国茨城县筑波东1丁目1番地1中央第6)],并于1997年8月11日转为国际保藏。国际保藏号(国际保藏号后的括号[]中的数字是国内保藏号)是FERM BP-6047[FERM P-15842]。
用本发明的表达载体pUC118-STCEex转化的大肠杆菌JM109(FERM BP-10127)在2003年12月1日在国内保藏于独立行政法人产业技术综合研究所特许生物寄托中心(地址 305-8566日本国茨城县筑波东1丁目1番地1中央第6),并于2004年9月15日转为国际保藏。国际保藏号(国际保藏号后的括号[]中的数字是国内保藏号)是FERM BP-10127[FERM P-19602]。在本文中,质粒pUC118-STCEex是通过将STCE基因插入到质粒pUC118的BamHI位点而得到的质粒。包含在BamHI片段中的内切糖苷酶STCE1基因包括一个内含子,其序列为SEQ ID NO5。
实施例本发明将通过以下实施例进行进一步描述,但不作为对本发明的限制。
实施例A1在Humicola insolens中表达N末端添加型纤维素酶和野生型纤维素酶的表达载体的构建(1)用于表达N末端添加型纤维素酶的表达载体pMKD01的构建用BamHI消化质粒pUC118(Takara Bio)。得到的片段用DNA平端化试剂盒(Takara Bio)进行平端化,然后用DNA连接试剂盒(Takara Bio)进行自连,从而得到pUC118BN。将所得的pUC118BN用SphI消化,平末端化后自连得到pUC118BSN。然后,根据特开平No.8-126492中所述的方法从Humicola insolens MN200-1(FERMBP-5977)获得含纤维素酶NCE2基因全长的3.4kb PstI-XbaI片段。将该片段连接到预先用相同的限制性酶消化的pUC118BSN中,得到pUC118BSN-PX。用Sculptor体外突变系统(Amersham Bioscience)在pUC118BSN-PX引入定点突变,得到质粒pM21。用于突变的寡核苷酸使用的是寡核苷酸MNC-02和MNC-03。
MNC-025’-GAGCGCCAGAACTGTGGATCCACTTGGTGAGCAATG-3’(SEQ ID NO6)MNC-035’-TCCGCCGTTCTGAGCGGATCCAGGCGTTTGGCGCG-3’(SEQ ID NO7)用BamHI消化质粒pM21,并与来源于Humicola insolens MN200-1的纤维二糖水解酶基因(NCE3)的BamHI消化的PCR片段连接,得到质粒pKM04。用来源于Humicola insolens MN200-1(FERM BP-5977)的基因组DNA(WO98/03640)为模板,以下列引物MKA-05和MKA-06扩增NCE3的PCR片段。
MKA-055’-GCCGCCCAGCAGGCGGGATCCCTCACCACCGAGAGG-3’(SEQ ID NO8)MKA-O65’-TGATCGTCGAGTCAGGGATCCAGAATTTACAGGCAC-3’(SEQ ID NO9)然后,用来源于构巢曲霉(Aspergillus nidulans)的trpC基因的启动子和终止子(Mullaney,E.J.,et.al.,Mol.Gem.Genet.,199,37-45,1985)制备可在Humicola insolens中表达特开昭59-175889号公报记载的越霉素抗性基因的基因。将得到的基因连接到用XbaI消化的质粒pKM04中,得到表达N末端添加型纤维素酶的表达载体pKMD01(FERM BP-5974)。在pKMD01中,在距NCE2基因的成熟蛋白N末端下游10bp和其终止密码子下游3bp处引入BamHI识别位点,从而在属于家族45的纤维素酶的N末端加入5个氨基酸残基。
表1
BamHIBamHI5′-GAGCGCCAGAACTGTGGATCCCTC---TGCCTGTAAgcggatccagg-3’(SEQ ID NO10)GluArgGlnAsnCysGlySerLeu---CysLeu(SEQ ID NO11)1 成熟蛋白质的N末端(2)表达野生型纤维素酶的表达载体pJD01的构建向以上(1)中获得的质粒pM21中用寡核苷酸pMN-Bam引入定点突变,得到引入突变的质粒pM21-m-A1。
pMN-Bam5’-GGTCAAACAAGTCTGTGCGGATCCTGGGACAAGATGGCCAAGTTCT TCCTTAC-3’(SEQ ID NO12)用限制性酶HindIII和BamHI消化质粒pM21-m-A1,回收约1kb的片段。然后,将实施例A1(1)中获得的pMKD01用HindIII和BamHI消化,回收约7kb的片段。将这些片段连接,得到质粒pJD01。在该载体中,在距NCE2基因翻译起始位点上游15bp和其终止密码子下游3bp处引入BamHI识别位点,从而将属于家族45的纤维素酶从转录起始位点进行表达。
表2BamHIBamHI5′-tgcggatcctgggacaagATGGCC---CCGTTCTGAgcggatccagg-3’(SEQ ID NO13)MetAla---ProPhe (SEQ ID NO14)实施例A2表达野生型NCE4和N末端添加型NCE4的表达载体的构建,Humicola insolens的转化及活性评估(1)表达载体的构建将全长NCE4基因编码区连接到实施例A1(2)中获得的pJD01中,构建pN2EX-N4作为野生型NCE4的表达载体。
首先,用来源于Humicola insolens MN200-1的基因组DNA为模板,以引物组合NCE4-Ne和NCE4-Ce进行PCR扩增,得到NCE4基因的全长编码区。将得到的约0.9kb的PCR产物用BamHI消化,并连接到预先用相同的限制性酶消化的pJD01中,得到pN2EX-N4。
NCE4-Ne5’-GGGGGGATCCTGGGACAAGATGCGTTCCTCCCCTCTC-3’(SEQ ID NO15)NCE4-Ce5’-GGGGGGATCCCTGCGTTTACAGGCACTGATGG-3’(SEQ ID NO16)将已去除分泌信号序列的NCE4基因成熟蛋白的编码区连接到实施例A1(1)中获得的pMKD01(FREM BP-5974)中,得到pEGD01(FREM BP-5973)作为N末端添加型NCE4的表达载体。首先,用来源于Humicola insolens MN200-1的基因组DNA为模板,以引物组合NCE4-Ns和NCE4-Cs进行PCR扩增,得到NCE4基因的成熟蛋白编码区。将得到的约0.8kb的PCR产物用BamHI消化,并连接到预先用相同的限制性酶消化的pMKD01中,得到NCE4-Ns5’-CCGGTGTTGGCCGGATCCGCTGATGGCAAG-3’(SEQ ID NO17)NCE4-Cs5’-TAAGGCCCTCAAGGATCCCTGCGTCTACAG-3’(SEQ ID NO18)(2)含野生型NCE4和N末端添加型NCE4的转化子将Humicola insolens MN200-1在S培养基(3.0%葡萄糖,2.0%酵母提取物,0.1%聚胨,0.03%氯化钙和0.03%硫酸镁pH6.8)中37℃培养24小时。通过离心收集得到的菌丝体,用0.5mol/L蔗糖洗涤,并悬浮在含3mg/mL β-葡糖醛酸苷酶(Sigma)、1mg/mL几丁质酶和1mg/mL溶菌酶20T(Seikagaku Corp.)的0.5mol/L蔗糖溶液中。悬浮液在30℃轻轻振荡60到90分钟以得到原生质体。通过过滤和离心收集得到的原生质体,用SUTC缓冲液(0.5mol/L蔗糖,10mmol/L氯化钙和10mmol/L Tris-HCl,pH7.5)洗涤,并重悬到SUTC中而得到原生质体悬浮液。
向100μL原生质体悬浮液中加入10μL DNA溶液(pEGD01或pN2EX-N4)。每个在冰上静置5分钟,然后加入400μL PEG溶液(60%聚乙二醇4000,10mmol/L氯化钙和10mmol/L Tris-HCl,pH7.5),整个溶液在冰上静置20分钟。将得到的原生质体悬浮液用SUTC洗涤后,用含200μg/mL潮霉素B的YMG培养基(1%葡萄糖,0.4%酵母提取物,0.2%麦芽提取物及1%琼脂;pH6.8)与YMG软琼脂一起覆盖在原生质体悬浮液上。平板在37℃培养5天,以获得转化子克隆。
(3)培养基上清中野生型NCE4和N末端添加型NCE4的EGU活性比较根据WO98/03667中所述方法培养得到的转化子,得到培养上清。将培养上清进行SDS-PAGE,选择可清晰检测到约43kDa的NCE4带的培养上清。测定培养上清在pH10,存在或不存在LAS时的EGU活性,并比较活性的降低程度。结果如表3所示。在表3中,以pH10时的EGU活性为100,用相应的百分比来表示EGU活性。
表3

结果表明,从N末端添加型NCE4转化子获得的培养上清在存在LAS时活性降低很小。与存在LAS时的EGU活性相比较发现,N末端添加型NCE4的活性是野生型NCE4的2.1倍。另外,Humicolainsolens MN200-1的EGU活性约占转化子4%,从而表明几乎所有EGU活性均来源于整合表达载体表达的重组酶。
(4)野生型NCE4和N末端添加型NCE4N末端氨基酸序列分析将上述转化子的培养上清进行SDS-PAGE,并将电泳的蛋白电转移到PVDF膜(Immobilon-PSQ;Millipore)上。从blot上剪切下约43kDa的NCE4带,并用蛋白测序仪Model492(Applied Biosystems)分析氨基酸序列。
结果表明,从pN2EX-N4转化子获得的野生型NCE4序列与WO98/03667所述的来源于Humicola insolens MN200-1的NCE4的DNA序列一致。
但从pEGD01转化子获得的N末端添加型NCE4氨基酸序列不能用上述方法测定。用pfu焦谷酰胺氨肽酶(Takara Bio)除去N末端添加型NCE4修饰的N末端,然后测定其氨基酸序列(SEQ NO2)。
结果总结于表4中,比较野生型NCE4和N末端添加型NCE4的N末端氨基酸序列表明,每个NCE4的N末端氨基酸序列与从构建的相应表达载体预测的序列一致。
表4

实施例B1在绿色木霉中表达N末端替代型纤维素酶和野生型纤维素酶的表达载体的构建(1)表达载体的构建将来源于绿色木霉MC300-1(根据WO98/11239获得)含全长cbh1基因的7kb PstI片段、含cbh1启动子区的3.1kb HindIH片段和含cbh1终止子区的2.7kb SalI片段克隆到质粒pUC119中,分别构建质粒pCB1-H4和质粒pCB1-S1。用辅助噬菌体M13KO7转染含每种质粒的大肠杆菌JM109,从而获得单链DNA。以质粒pCB1-H4和pCB1-S1中得到的单链DNAs为模板,将磷酸化的寡核苷酸CBn-Stu和CBc-Xho退火,从而通过Sculptor体外突变系统(Amersham Bioscience)引入突变。分别得到质粒pCB1H4-19和质粒pCB1S1-17。将通过用XbaI和XhoI消化质粒pCB1H4-19而获得的约6kb的片段与用XbaI消化,然后用XhoI部分消化质粒pCB1S1-17而获得的约1.2kb片段连接,得到pCB1-M。
CBn-Stu5’-GATACATGATGCGCAGGCCTTAGTCGACTAGAATGC-3’(SEQ ID NO21)CBc-Xho5’-GATCCTCAAGCTTTTGCTCGAGTACCTTACAAGCAC-3’(SEQ ID NO22)然后将用SalI消化pCB1-M而得到的约2.7kb片段克隆到质粒pUC119中,得到质粒pCB1-SalM。对从质粒pCB1-SalM获得的单链DNA用磷酸化寡核苷酸CB1-SmSph、CB1-Bam和CB1-Pst退火,从而通过Sculptor体外突变系统引入突变。
CB1-SmSph5’-GGAGGGTGCATGCCGACTGAGCCCGGGCAGTAGCC-3’(SEQ ID NO23)CB1-Bam5’-GCCGGGAGAGGATCCAGTGGAGG-3’(SEQ ID NO24)CB1-Pst5’-GCTCGAGTACCTTACTGCAGGCACTGAGAG-3’(SEQ ID NO25)然后用XbaI和EcoRI消化质粒pUC118,用DNA平端化试剂盒进行平端化并自连,从而得到质粒pUC118-SBN。将预先用相同的限制性酶剪切的约1.4kb的cbh1启动子片段克隆到用HindIII和SalI消化的pUC118-SBN中。将得到的质粒用SalI消化,并与约2.8kb引入突变的cbh1编码区和终止子区连接,得到pCB2-M2。引入的突变(除BamHI突变外)如表5所示。
表5SalIStuI5′-ctatcgactaggcctgcgcatcATGTATCAAAAGTTGGCCCTCATCTCGGCCTTCTTGGCTACT (SEQ ID NO26)MetTyrGlnLysLeuAlaLeuIleSerAlaPheLeuAlaThr (SEQ ID NO27)SmaISphIPstIXhoIHindIII6-GCCCGGGCTCAGTCGGCATGCACC---CAGTGCCTGCACTAAggtactcgagcaaaagcttgag-3′(SEQ ID NO28)AlaArgAlaGlnSerAlaCysThr---GlnCysLeuGln (SEQ ID NO29)1成熟蛋白质的N末端实施例B2表达N末端替代型STCE1和野生型STCE1的表达载体的构建,绿色木霉的转化和活性评估(1)表达载体的构建将STCE1基因编码区连接到实施例1中获得的质粒pCB1-M2中,得到pCB-Ste作为野生型STCE1的表达载体。
首先,以质粒pUC118-STCEex(FERM BO-10127)为模板,用引物组合STCE1-TNERV和STCE1-TCET22I进行PCR,扩增STCE1基因的编码区。将得到的约1kbp的PCR产物用EcoRV和EcoT22I消化,并与预先用StuI和PstI消化的pCB1-M2连接,得到pCB-Ste。
STCE1-TNERVGGGGATATCGCGCATCATGCGTTCCTCCCCCGTCCTC(SEQ ID NO30)STCE1-TCET22IGGGATGCATTTAAAGGCACTGCGAGTACCAGTC(SEQ ID NO31)将去除分泌信号序列的STCE1基因成熟蛋白的编码区连接到实施例B1中获得的pCB1-M2中,得到pCB-Sts作为N末端替代型STCE1的表达载体。
首先,以质粒pUC118-STCEex(FERM BO-10127)为模板,用引物组合STCE1-TmNSph和STCE1-TCET22I进行PCR,扩增STCE1基因成熟蛋白的编码区。将得到的约1kbp的PCR产物用SphI和EcoT22I消化,并与预先用SphI和PstI消化的pCB1-M2连接,得到pCB-Sts。
STCE1-TmNSphGGGGCATGCGATGGCAAGTCGACCCGCTAC(SEQ ID NO32)(2)绿色木霉菌株2的产生将绿色木霉MC300-1(FERM BP-6047)孢子悬液(约109CFU/mL)用位于30cm处的两盏UV灯的UV进行照射,并轻轻振荡。将悬液铺在选择性培养基上,28℃培养7天。筛选长出的菌株作为具有尿嘧啶需求的绿色木霉菌株。
在本文中,选择培养基是补充10μg/mL尿嘧啶和1mg/mL 5-氟乳清酸的基本培养基

(3)含野生型STCE1或N末端替代型STCE1的转化子用实施例B2(1)中获得的pCB-Ste或pCB-Sts通过共转化方法,用实施例B2(2)中获得的绿色木霉菌株2和来源于Neurospora crassa的含pyr4基因的标记质粒pPYR4转化绿色木霉,得到在基本培养基上生长的菌株作为转化子。
首先,将绿色木霉菌株2接种到含50mL菌丝形成培养基[1%酵母提取物,1%麦芽提取物,2%聚胨,2.5%葡萄糖,0.1%磷酸氢二钾,0.05%七水硫酸镁和0.0001%尿嘧啶(pH7.0)]的200mL锥形瓶中,并在28℃培养2天。通过离心收集得到的细胞,并用0.5mol/L蔗糖洗涤,并悬浮在含3mg/mL β-葡糖醛酸苷酶(Sigma)、1mg/mL几丁质酶和1mg/mL溶菌酶20T(Seikagaku Corp.)的0.5mol/L蔗糖溶液中。悬浮液在30℃轻轻振荡60到90分钟以得到原生质体。通过过滤和离心收集得到的原生质体,用SUTC缓冲液洗涤,并重悬到SUTC中而得到原生质体悬浮液。
向100μL原生质体悬浮液中加入10μL DNA溶液(pCB-Ste或pCB-Sts)。在冰上静置5分钟,加入400μL PEG溶液,然后整个溶液在冰上静置20分钟。将得到的原生质体悬浮液用SUTC洗涤后,用含0.5mol/L蔗糖的基本培养基和软琼脂一起覆盖在原生质体悬浮液上。平板在28℃培养5天,然后将长出的克隆转移到基本培养基上,在其上获得转化子克隆。
(4)培养基上清中野生型STCE1和N末端替代型STCE1的EGU活性比较根据WO98/11239中所述方法培养得到的转化子,得到培养上清。将培养上清进行SDS-PAGE,选择可清晰检测到约45kDa的STCE1带的培养上清。测定培养上清在pH10,存在或不存在LAS时的EGU活性,并比较存在LAS时活性的降低程度。结果如表6所示。在表6中,以pH10时的EGU活性为100,用相应的百分比来表示EGU活性。
表6

结果表明,比较存在LAS时的EGU活性发现,N末端替代型STCE1的EGU活性约是野生型STCE1的1.8倍。另外,不能检测到绿色木霉菌株2的EGU活性,因此表明EGU活性均来源于整合表达载体表达的重组酶。
(5)野生型STCE1和N末端替代型STCE1N末端氨基酸分析用以上转化子的培养上清制备含0.05mol/L Tris-HCl(pH8.0)/1mol/L硫酸钠的溶液,并吸附在具有相等床体积(BV)的TOYOPEARLButyl-650S(Tosoh Corporation)上。用3个BVs的0.05mol/L Tris-HCl(pH8.0)/1mol/L硫酸钠洗去非吸附性成分,以除去非吸附性成分。然后用3个BVs的0.05mol/L Tris-HCl(pH8.0)/0.5mol/L硫酸钠进行洗脱,并将洗脱液用Pellicon XL(截留5000;Millipore)和Ultrafree-15(截留5000;Millipore)进行浓缩。用获得的浓缩液制备含0.1mol/L磷酸钠(pH5.8)/1mol/L硫酸铵溶液。将得到的溶液用Resource PHE(6mL;Amersham Bioscience)进行疏水层析,以回收非吸附组分。将非吸附组分浓缩,并用PD-10(Amersham Bioscience)脱盐,并用该组分制备含0.05mol/L Tris-HCl(pH7.5)的溶液。将该溶液通过Resource Q(6mL;Amersham Bioscience),回收非吸附组分。将非吸附组分脱盐,并制备含0.05mol/L醋酸钠(pH5.0)的溶液。将该溶液通过Resource S(6mL;Amersham Bioscience),回收非吸附组分。将非吸附组分浓缩,并用Superdex 75pg(16×60mm;Amersham Bioscience)进行凝胶过滤,以回收分子量约为45000的组分。每个组分(来源于以上转化子培养上清)仅含一条45kDa的带。
将纯化的组分进行SDS-PAGE,并将电泳的蛋白电转移到PVDF膜上。从blot上剪切下约45kDa的STCE1带,并用蛋白测序仪Model492(Applied Biosystems)分析氨基酸序列。
结果表明,从pCB1-Ste转化子获得的野生型STCE1序列(SEQ IDNO.5)与来源于Staphylotrichum coccosporum IFO(目前名称NBRC)31817的DNA序列一致。
但从N末端替代型STCE1转化子获得的STCE1的氨基酸序列不能用上述方法测定。用pfu焦谷酰胺氨肽酶(Takara Bio)除去N末端替代型STCE1修饰的N末端,然后测定其氨基酸序列(SEQ NO4)。
结果总结于表7中,比较野生型STCE1和N末端替代型STCE1的N末端氨基酸序列。结果表明,每个STCE1的N末端氨基酸序列与从构建的相应表达载体预测的序列一致。
表7

(6)纯化的野生型STCE1和纯化的N末端替代型STCE1的EGU活性比较测定实施例B2(5)中获得的纯化的野生型STCE1和纯化的N末端替代型STCE1在pH10,不存在或存在LAS时的EGU活性,并比较存在LAS时活性的降低程度。结果如表8所示。在表8中,以pH10时的EGU活性为100,用相应的百分比来表示EGU活性。
表8

结果表明,比较存在LAS时的EGU活性发现,纯化的N末端替代型STCE1的EGU活性约是纯化的野生型STCE1的1.9倍。
实施例B3添加到STCE1的N末端序列的改变,载体的构建,绿色木霉的转化及活性评估(1)仅向成熟蛋白N末端添加焦谷氨酸的表达载体的构建将去除分泌信号序列的STCE1基因成熟蛋白的编码区连接到实施例B1获得的质粒pCB1-M2中,得到pCB-Stm11作为仅添加焦谷氨酸的STCE1的表达载体。
首先,以质粒pUC118-STCEex(FERM BO-10127)为模板,用引物组合STCE-TmNSma和STCE1-TCET22I进行PCR,扩增STCE1基因成熟蛋白的编码区。将得到的约1kbp的PCR产物用SmaI和EcoT22I消化,并与预先用SmaI和PstI消化的pCB1-M2连接,得到pCB-Stm11。用上述载体pCB-Stm11转化的绿色木霉可产生N末端氨基酸序列为pQADGKSTR(SEQ ID NO41)的STCE1[即1个焦谷氨酸(pQ)加到野生型STCE1N末端的序列]。
STCE-TmNSmaGGCCCGGGCTCAGGCCGATGGCAAGTCGACCCG(SEQ ID NO35)(2)添加焦谷氨酸的STCE1的EGU活性比较用pCB-Stm11根据实施例B2(3)所述的方法转化绿色木霉菌株2。根据WO98/11239培养得到的转化子,得到培养上清。将培养上清进行SDS-PAGE,选择可清晰检测到约45kDa的STCE1带的培养上清。测定培养上清在pH10,存在或不存在LAS时的EGU活性,并与实施例B2(4)中野生型STCE1比较存在LAS时活性的降低程度。结果如表9所示。在表9中,以pH10时的EGU活性为100,用相应的百分比来表示EGU活性。
表9

结果表明,比较存在LAS时的EGU活性发现,焦谷氨酸添加型STCE1的EGU活性约是野生型STCE1的1.6倍。
实施例B4添加到STCE1的N末端序列的改变,载体的构建,绿色木霉的转化及活性评估(1)向成熟蛋白N末端添加含pQ的4个氨基酸的表达载体的构建将去除分泌信号序列的STCE1基因成熟蛋白的编码区连接到实施例B1获得的质粒pCB1-M2中,得到pCB-Stm12作为添加含焦谷氨酸的4个氨基酸的STCE1的表达载体。
首先,以质粒pUC118-STCEex(FERM BO-10127)为模板,用引物组合STCE-TmNSph-2和STCE1-TCET22I进行PCR,扩增STCE1基因成熟蛋白的编码区。将得到的约1kbp的PCR产物用SphI和EcoT22I消化,并与预先用SphI和PstI消化的pCB1-M2连接,得到pCB-Stm12。用上述载体pCB-Stm12转化的绿色木霉可产生N末端氨基酸序列为pQSACADGKSTR(SEQ ID NO42)[即含4个氨基酸(N末端为焦谷氨酸)的肽加到野生型STCE1N末端的序列)的STCE1。
STCE-TmNSph-2GGGCATGCGCCGATGGCAAGTCGACCCGC(SEQ ID NO36)(2)含4个氨基酸的pQ-STCE1的EGU活性比较用pCB-Stm12根据实施例B2(3)所述的方法转化绿色木霉菌株2。根据WO98/11239培养得到的转化子,得到培养上清。将培养上清进行SDS-PAGE,选择可清晰检测到约45kDa的STCE1带的培养上清。测定培养上清在pH10,存在或不存在LAS时的EGU活性,并与实施例B2(4)中野生型STCE1比较存在LAS时活性的降低程度。结果如表10所示。在表10中,以pH10时的EGU活性为100,用相应的百分比来表示EGU活性。
表10

结果表明,比较存在LAS时的EGU活性发现,含焦谷氨酸的4个氨基酸的添加型STCE1的EGU活性约是野生型STCE1的1.5倍。
工业应用与野生型纤维素酶相比较,本发明中的蛋白的内切糖苷酶活性在存在表面活性剂时降低较小,因此可作为衣物洗涤剂的成分。
虽然本发明通过特定实施例进行描述,但各种对本领域技术人员明显的改变和修饰并不偏离所附权利要求的范围。
附图的简要描述图1所示的是内切糖苷酶STCE1[信号肽(SEQ ID NO43),成熟蛋白(SEQ ID NO44)]的氨基酸序列与已知属于家族45的内切糖苷酶NCE4[信号肽(SEQ ID NO45),成熟蛋白(SEQ ID NO46)]和NCE5[信号肽(SEQ ID NO47),成熟蛋白(SEQ ID NO48)]的氨基酸序列关于N末端序列的比较结果。
图2所示的是图1描述的关于C末端序列的比较结果。
序列列表文本文件“人工序列”的特征在序列列表中以数字标识进行描述。每个核苷酸序列SEQ ID NOS6-10、12-13、15-18、21-26、28、30-32和35-36是引物MNC-02、引物MNC-03、引物MKA-05、引物MKA-06、pMKD01、引物pMN-Bam、pJD01、引物NCE4-Ne、引物NCE4-Ce、引物NCE4-Ns、引物NCE4-Cs、引物CBn-Stu、引物CBc-Xho、引物CB1-SmSph、引物CB1-Bam、引物CB1-Pst、pCB1-M2、pCB1-M2、引物STCE1-TNERV、引物STCE1-TCET22I、引物STCE1-TmNSph、引物STCE1-TmNSma和引物STCE1-TmNSph-2。每个氨基酸序列SEQID NOS11、14、27和29是pMKD01、pJD01、pCB1-M2和pCB1-M2。
序列表<110>MEIJI SEIKA KAISHA,LTD.
<120>耐表面活性剂的纤维素酶及其修饰方法<130>MEJ-719<150>JP 2003-409692<151>2003-12-08<160>48<170>PatentIn version 3.1<210>1<211>870<212>DNA<213>Humicola insolens MN200-1<220>
<221>CDS<222>(1)..(870)<223>
<220>
<221>misc_feature<222>(1)..(3)<223>焦谷氨酸<220>
<221>来源<222>(16)..(870)<223>Humicola insolens MN200-1<400>1cag aac tgt gga tcc gct gat ggc aag tcc acc cgc tac tgg gac tgc48Gln Asn Cys Gly Ser Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys1 5 10 15tgc aag cct tcg tgc ggc tgg gcc aag aag gct ccc gtg aac cag cct96Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro20 25 30
gtc ttc tcc tgc aac gcc aac ttc cag cgt ctc act gac ttc gac gcc144Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Leu Thr Asp Phe Asp Ala35 40 45aag tcc ggc tgc gag ccg ggc ggt gtc gcc tac tcg tgc gcc gac cag192Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln50 55 60acc cca tgg gct gtg aac gac gac ttc gcg ttc ggt ttt gct gcc acc240Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Phe Gly Phe Ala Ala Thr65 70 75 80tct att gcc ggc agc aat gag gcg ggc tgg tgc tgc gcc tgc tac gag288Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu85 90 95ctc acc ttc aca tcc ggt cct gtt gct ggc aag aag atg gtc gtc cag336Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln100 105 110tcc acc agc act ggc ggt gat ctt ggc agc aac cac ttc gat ctc aac384Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn115 120 125atc ccc ggc ggc ggc gtc ggc atc ttc gac gga tgc act ccc cag ttc432Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe130 135 140ggc ggt ctg ccc ggc cag cgc tac ggc ggc atc tcg tcc cgc aac gag480Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu145 150 155 160tgc gat cgg ttc ccc gac gcc ctc aag ccc ggc tgc tac tgg cgc ttc528Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe165 170 175gac tgg ttc aag aac gcc gac aac ccg agc ttc agc ttc cgt cag gtc576Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val180 185 190caa tgc cca gcc gag ctc gtc gct cgc acc gga tgc cgc cgc aac gac624Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp195 200 205
gac ggc aac ttc cct gcc gtc cag atc ccc tcc agc agc acc agc tct672Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser210 215 220ccg gtc ggc cag cct acc agt acc agc acc acc tcc acc tcc acc acc720Pro Val Gly Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr225 230 235 240tcg agc ccg ccc gtc cag cct acg act ccc agc ggc tgc act gct gag768Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu245 250 255agg tgg gct cag tgc ggc ggc aat ggc tgg agc ggc tgc acc acc tgc816Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys260 265 270gtc gct ggc agc acc tgc acg aag att aat gac tgg tac cat cag tgc864Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys275 280 285ctg taa870Leu<210>2<211>289<212>PRT<213>Humicola insolens MN200-1<220>
<221>misc_feature<222>(1)..(3)<223>焦谷氨酸<400>2Gln Asn Cys Gly Ser Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys1 5 10 15Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro20 25 30Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Leu Thr Asp Phe Asp Ala35 40 45
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln50 55 60Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Phe Gly Phe Ala Ala Thr65 70 75 80Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu85 90 95Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln100 105 110Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn115 120 125Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe130 135 140Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu145 150 155 160Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe165 170 175Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val180 185 190Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp195 200 205Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser210 215 220Pro Val Gly Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr225 230 235 240Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu245 250 255Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys260 265 270Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys
275 280 285Leu<210>3<211>897<212>DNA<213>Staphylotrichum coccosporum IFO 31817<220>
<221>CDS<222>(1)..(897)<223>
<220>
<221>misc_feature<222>(1)..(3)<223>焦谷氨酸<220>
<221>来源<222>(13)..(897)<223>Staphylotrichum coccosporum IFO 31817<400>3cag tcg gca tgc gat ggc aag tcc acc cgc tac tgg gac tgc tgc aag 48Gln Ser Ala Cys Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys Cys Lys1 5 10 15cct tcg tgc tcg tgg ccc ggc aag gcc tcg gtg aac cag ccc gtc ttc 96Pro Ser Cys Ser Trp Pro Gly Lys Ala Ser Val Asn Gln Pro Val Phe20 25 30gcc tgc agc gcc aac ttc cag cgc atc agc gac ccc aac gtc aag tcg144Ala Cys Ser Ala Asn Phe Gln Arg Ile Ser Asp Pro Asn Val Lys Ser35 40 45ggc tgc gac ggc ggc tcc gcc tac gcc tgc gcc gac cag acc ccg tgg192Gly Cys Asp Gly Gly Ser Ala Tyr Ala Cys Ala Asp Gln Thr Pro Trp50 55 60gcc gtc aac gac aac ttc tcg tac ggc ttc gcc gcc acg tcc atc tcg240Ala Val Asn Asp Asn Phe Ser Tyr Gly Phe Ala Ala Thr Ser Ile Ser
65 70 75 80ggc ggc aac gag gcc tcg tgg tgc tgt ggc tgc tac gag ctg acc ttc288Gly Gly Asn Glu Ala Ser Trp Cys Cys Gly Cys Tyr Glu Leu Thr Phe85 90 95acc tcg ggc ccc gtc gct ggc aag acc atg gtt gtc cag tcc acc tcg336Thr Ser Gly Pro Val Ala Gly Lys Thr Met Val Val Gln Ser Thr Ser100 105 110acc ggc ggc gac ctc ggc acc aac cac ttc gac ctg gcc atg ccc ggt384Thr Gly Gly Asp Leu Gly Thr Asn His Phe Asp Leu Ala Met Pro Gly115 120 125ggt ggt gtc ggc atc ttc gac ggc tgc tcg ccc cag ttc ggc ggc ctc432Gly Gly Val Gly Ile Phe Asp Gly Cys Ser Pro Gln Phe Gly Gly Leu130 135 140gcc ggc gac cgc tac ggc ggc gtc tcg tcg cgc agc cag tgc gac tcg480Ala Gly Asp Arg Tyr Gly Gly Val Ser Ser Arg Ser Gln Cys Asp Ser145 150 155 160ttc ccc gcc gcc ctc aag ccc ggc tgc tac tgg cgc ttc gac tgg ttc528Phe Pro Ala Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe Asp Trp Phe165 170 175aag aac gcc gac aac ccg acc ttc acc ttc cgc cag gtc cag tgc ccg576Lys Asn Ala Asp Asn Pro Thr Phe Thr Phe Arg Gln Val Gln Cys Pro180 185 190tcg gag ctc gtc gcc cgc acc ggc tgc cgc cgc aac gac gac ggc aac624Ser Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp Asp Gly Asn195 200 205ttc ccc gtc ttc acc cct ccc tcg ggc ggt cag tcc tcc tcg tct tcc672Phe Pro Val Phe Thr Pro Pro Ser Gly Gly Gln Ser Ser Ser Ser Ser210 215 220tcc tcc agc agc gcc aag ccc acc tcc acc tcc acc tcg acc acc tcc720Ser Ser Ser Ser Ala Lys Pro Thr Ser Thr Ser Thr Ser Thr Thr Ser225 230 235 240acc aag gct acc tcc acc acc tcg acc gcc tcc agc cag acc tcg tcg768Thr Lys Ala Thr Ser Thr Thr Ser Thr Ala Ser Ser Gln Thr Ser Ser
245 250 255tcc acc ggc ggc ggc tgc gcc gcc cag cgc tgg gcg cag tgc ggc ggc 816Ser Thr Gly Gly Gly Cys Ala Ala Gln Arg Trp Ala Gln Cys Gly Gly260 265 270atc ggg ttc tcg ggc tgc acc acg tgc gtc agc ggc acc acc tgc aac 864Ile Gly Phe Ser Gly Cys Thr Thr Cys Val Ser Gly Thr Thr Cys Asn275 280 285aag cag aac gac tgg tac tcg cag tgc ctt taa 897Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu290 295<210>4<211>298<212>PRT<213>Staphylotrichum coccosporum IFO 31817<220>
<221>misc_feature<222>(1)..(3)<223>焦谷氨酸<400>4Gln Ser Ala Cys Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys Cys Lys1 5 10 15Pro Ser Cys Ser Trp Pro Gly Lys Ala Ser Val Asn Gln Pro Val Phe20 25 30Ala Cys Ser Ala Asn Phe Gln Arg Ile Ser Asp Pro Asn Val Lys Ser35 40 45Gly Cys Asp Gly Gly Ser Ala Tyr Ala Cys Ala Asp Gln Thr Pro Trp50 55 60Ala Val Asn Asp Asn Phe Ser Tyr Gly Phe Ala Ala Thr Ser Ile Ser65 70 75 80Gly Gly Asn Glu Ala Ser Trp Cys Cys Gly Cys Tyr Glu Leu Thr Phe85 90 95
Thr Ser Gly Pro Val Ala Gly Lys Thr Met Val Val Gln Ser Thr Ser100 105 110Thr Gly Gly Asp Leu Gly Thr Asn His Phe Asp Leu Ala Met Pro Gly115 120 125Gly Gly Val Gly Ile Phe Asp Gly Cys Ser Pro Gln Phe Gly Gly Leu130 135 140Ala Gly Asp Arg Tyr Gly Gly Val Ser Ser Arg Ser Gln Cys Asp Ser145 150 155 160Phe Pro Ala Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe Asp Trp Phe165 170 175Lys Asn Ala Asp Asn Pro Thr Phe Thr Phe Arg Gln Val Gln Cys Pro180 185 190Ser Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp Asp Gly Asn195 200 205Phe Pro Val Phe Thr Pro Pro Ser Gly Gly Gln Ser Ser Ser Ser Ser210 215 220Ser Ser Ser Ser Ala Lys Pro Thr Ser Thr Ser Thr Ser Thr Thr Ser225 230 235 240Thr Lys Ala Thr Ser Thr Thr Ser Thr Ala Ser Ser Gln Thr Ser Ser245 250 255Ser Thr Gly Gly Gly Cys Ala Ala Gln Arg Trp Ala Gln Cys Gly Gly260 265 270Ile Gly Phe Ser Gly Cys Thr Thr Cys Val Ser Gly Thr Thr Cys Asn275 280 285Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu290 295<210>5<211>1037<212>DNA<213>Staphylotrichum coccosporum IF031817
<220>
<221>信号肽<222>(1)..(63)<223>
<220>
<221>外显子<222>(64)..(333)<223>
<220>
<221>内含子<222>(334)..(419)<223>
<220>
<221>外显子<222>(420)..(1037)<223>
<400>5atgcgttcct cccccgtcct ccgcacggcc ctggccgctg ccctccccct ggccgccctc 60gct gcc gat ggc aag tcg acc cgc tac tgg gac tgt tgc aag ccg tcg108Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys Cys Lys Pro Ser1 5 10 15tgc tcg tgg ccc ggc aag gcc tcg gtg aac cag ccc gtc ttc gcc tgc156Cys Ser Trp Pro Gly Lys Ala Ser Val Asn Gln Pro Val Phe Ala Cys20 25 30agc gcc aac ttc cag cgc atc agc gac ccc aac gtc aag tcg ggc tgc204Ser Ala Asn Phe Gln Arg Ile Ser Asp Pro Asn Val Lys Ser Gly Cys35 40 45gac ggc ggc tcc gcc tac gcc tgc gcc gac cag acc ccg tgg gcc gtc252Asp Gly Gly Ser Ala Tyr Ala Cys Ala Asp Gln Thr Pro Trp Ala Val50 55 60aac gac aac ttc tcg tac ggc ttc gcc gcc acg tcc atc tcg ggc ggc300Asn Asp Asn Phe Ser Tyr Gly Phe Ala Ala Thr Ser Ile Ser Gly Gly65 70 75
aac gag gcc tcg tgg tgc tgt ggc tgc tac gag tgagtgcttc cccccccccc 353Asn Glu Ala Ser Trp Cys Cys Gly Cys Tyr Glu80 85 90ccccccccac ccccggttcg gtcccttgcc gtgccttctt catactaacc gcctaccccc 413tcc agg ctg acc ttc acc tcg ggc ccc gtc gct ggc aag acc atg gtt461Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Thr Met Val95 100gtc cag tcc acc tcg acc ggc ggc gac ctc ggc acc aac cac ttc gac509Val Gln Ser Thr Ser Thr Gly Gly Asp Leu Gly Thr Asn His Phe Asp105 110 115 120ctg gcc atg ccc ggt ggt ggt gtc ggc atc ttc gac ggc tgc tcg ccc557Leu Ala Met Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Ser Pro125 130 135cag ttc ggc ggc ctc gcc ggc gac cgc tac ggc ggc gtc tcg tcg cgc605Gln Phe Gly Gly Leu Ala Gly Asp Arg Tyr Gly Gly Val Ser Ser Arg140 145 150agc cag tgc gac tcg ttc ccc gcc gcc ctc aag ccc ggc tgc tac tgg653Ser Gln Cys Asp Ser Phe Pro Ala Ala Leu Lys Pro Gly Cys Tyr Trp155 160 165cgc ttc gac tgg ttc aag aac gcc gac aac ccg acc ttc acc ttc cgc701Arg Phe Asp Trp Phe Lys Asn Ala Asp Asn Pro Thr Phe Thr Phe Arg170 175 180cag gtc cag tgc ccg tcg gag ctc gtc gcc cgc acc ggc tgc cgc cgc 749Gln Val Gln Cys Pro Ser Glu Leu Val Ala Arg Thr Gly Cys Arg Arg185 190 195 200aac gac gac ggc aac ttc ccc gtc ttc acc cct ccc tcg ggc ggt cag797Asn Asp Asp Gly Asn Phe Pro Val Phe Thr Pro Pro Ser Gly Gly Gln205 210 215tcc tcc tcg tct tcc tcc tcc agc agc gcc aag ccc acc tcc acc tcc845Ser Ser Ser Ser Ser Ser Ser Ser Ser Ala Lys Pro Thr Ser Thr Ser220 225 230acc tcg acc acc tcc acc aag gct acc tcc acc acc tcg acc gcc tcc893Thr Ser Thr Thr Ser Thr Lys Ala Thr Ser Thr Thr Ser Thr Ala Ser
235 240 245agc cag acc tcg tcg tcc acc ggc ggc ggc tgc gcc gcc cag cgc tgg 941Ser Gln Thr Ser Ser Ser Thr Gly Gly Gly Cys Ala Ala Gln Arg Trp250 255 260gcg cag tgc ggc ggc atc ggg ttc tcg ggc tgc acc acg tgc gtc agc 989Ala Gln Cys Gly Gly Ile Gly Phe Ser Gly Cys Thr Thr Cys Val Ser265 270 275 280ggc acc acc tgc aac aag cag aac gac tgg tac tcg cag tgc ctt tga1037Gly Thr Thr Cys Asn Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu285 290 295<210>6<211>36<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物MNC-02<400>6gagcgccaga actgtggatc cacttggtga gcaatg 36<210>7<211>35<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物MNC-03<400>7tccgccgttc tgagcggatc caggcgtttg gcgcg 35<210>8<211>36<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物MKA-05
<400>8gccgcccagc aggcgggatc cctcaccacc gagagg 36<210>9<211>36<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物MKA-06<400>9tgatcgtcga gtcagggatc cagaatttac aggcac 36<210>10<211>44<212>DNA<213>人工序列<220>
<223>人工序列序列描述pMKD01<220>
<221>misc_feature<222>(24)..(25)<223>不连续的碱基<400>10gagcgccaga actgtggatc cctctgcctg taagcggatc cagg 44<210>11<211>10<212>PRT<213>人工序列<220>
<223>人工序列序列描述pMKD01<220>
<221>NON_CONS<222>(8)..(9)<223>
<220>
<221>MOD_RES<222>(1)..(1)<223>吡咯烷酮羧酸<400>11Glu Arg Gln Asn Cys Gly Ser Leu Cys Leu1 5 10<210>12<211>53<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物pMN-Bam<400>12ggtcaaacaa gtctgtgcgg atcctgggac aagatggcca agttcttcct tac53<210>13<211>44<212>DNA<213>人工序列<220>
<223>人工序列序列描述pJD01<220>
<221>misc_feature<222>(24)..(25)<223>不连续的碱基<400>13tgcggatcct gggacaagat ggccccgttc tgagcggatc cagg 44<210>14<211>4<212>PRT<213>人工序列<220>
<223>人工序列序列描述pJD01
<220>
<221>NON_CONS<222>(2)..(3)<223>
<400>14Met Ala Pro Phe1<210>15<211>37<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物NCE4-Ne<400>15ggggggatcc tgggacaaga tgcgttcctc ccctctc 37<210>16<211>32<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物NCE4-Ce<400>16ggggggatcc ctgcgtttac aggcactgat gg 32<210>17<211>30<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物NCE4-Ns<400>17ccggtgttgg ccggatccgc tgatggcaag 30<210>18
<211>30<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物NCE4-Cs<400>18taaggccctc aaggatccct gcgtctacag 30<210>19<211>7<212>PRT<213>Humicola insolens MN200-1<400>19Ala Asp Gly Lys Ser Thr Arg1 5<210>20<211>12<212>PRT<213>Humicola insolens MN200-1<220>
<221>MOD_RES<222>(1)..(1)<223>吡咯烷酮羧酸<220>
<221>MUTAGEN<222>(1)..(5)<223>
<400>20Gln Asn Cys Gly Ser Ala Asp Gly Lys Ser Thr Arg1 5 10<210>21<211>36<212>DNA<213>人工序列
<220>
<223>人工序列序列描述引物CBn-Stu<400>21gatacatgat gcgcaggcct tagtcgacta gaatgc36<210>22<211>36<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物CBc-Xho<400>22gatcctcaag cttttgctcg agtaccttac aagcac36<210>23<211>35<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物CB1-SmSph<400>23ggagggtgca tgccgactga gcccgggcag tagcc 35<210>24<211>23<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物CB1-Bam<400>24gccgggagag gatccagtgg agg 23<210>25<211>30<212>DNA
<213>人工序列<220>
<223>人工序列序列描述引物CB1-Pst<400>25gctcgagtac cttactgcag gcactgagag 30<210>26<211>66<212>DNA<213>人工序列<220>
<223>人工序列序列描述pCB1-M2<400>26ctagtcgact aaggcctgcg catcatgtat caaaagttgg ccctcatctc ggccttcttg 60gctact 66<210>27<211>14<212>PRT<213>人工序列<220>
<223>人工序列序列描述pCB1-M2<400>27Met Tyr Gln Lys Leu Ala Leu Ile Ser Ala Phe Leu Ala Thr1 5 10<210>28<211>61<212>DNA<213>人工序列<220>
<223>人工序列序列描述pCB1-M2<220>
<221>misc_feature
<222>(24)..(25)<223>不连续的碱基<400>28gcccgggctc agtcggcatg cacccagtgc ctgcagtaag gtactcgagc aaaagcttga 60g 61<210>29<211>12<212>PRT<213>人工序列<220>
<223>人工序列序列描述pCB1-M2<220>
<221>NON_CONS<222>(8)..(9)<223>
<400>29Ala Arg Ala Gln Ser Ala Cys Thr Gln Cys Leu Gln1 5 10<210>30<211>37<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物STCE1-TNERV<400>30ggggatatcg cgcatcatgc gttcctcccc cgtcctc 37<210>31<211>33<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物STCE1-TCET22I
<400>31gggatgcatt taaaggcact gcgagtacca gtc 33<210>32<211>30<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物STCE1-TmNSph<400>32ggggcatgcg atggcaagtc gacccgctac 30<210>33<211>7<212>PRT<213>Staphylotrichum coccosporum IFO 31817<400>33Ala Asp Gly Lys Ser Thr Arg1 5<210>34<211>10<212>PRT<213>Staphylotrichum coccosporum IFO 31817<220>
<221>MOD_RES<222>(1)..(1)<223>吡咯烷酮羧酸<220>
<221>MUTAGEN<222>(1)..(4)<223>
<400>34Gln Ser Ala Cys Asp Gly Lys Ser Thr Arg1 5 10
<210>35<211>33<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物STCE1-TmNSma<400>35ggcccgggct caggccgatg gcaagtcgac ccg 33<210>36<211>29<212>DNA<213>人工序列<220>
<223>人工序列序列描述引物STCE1-TmNSph-2<400>36gggcatgcgc cgatggcaag tcgacccgc29<210>37<211>891<212>DNA<213>Staphylotrichum coccosporum IFO 31817<220>
<221>CDS<222>(1)..(891)<223>
<220>
<221>misc_feature<222>(1)..(3)<223>焦谷氨酸<220>
<221>来源<222>(4)..(891)<223>Staphylotrichum coccosporum IFO 31817<400>37
cag gcc gat ggc aag tcc acc cgc tac tgg gac tgc tgc aag cct tcg 48Gln Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys Cys Lys Pro Ser1 5 10 15tgc tcg tgg ccc ggc aag gcc tcg gtg aac cag ccc gtc ttc gcc tgc 96Cys Ser Trp Pro Gly Lys Ala Ser Val Asn Gln Pro Val Phe Ala Cys20 25 30agc gcc aac ttc cag cgc atc agc gac ccc aac gtc aag tcg ggc tgc 144Ser Ala Asn Phe Gln Arg Ile Ser Asp Pro Asn Val Lys Ser Gly Cys35 40 45gac ggc ggc tcc gcc tac gcc tgc gcc gac cag acc ccg tgg gcc gtc 192Asp Gly Gly Ser Ala Tyr Ala Cys Ala Asp Gln Thr Pro Trp Ala Val50 55 60aac gac aac ttc tcg tac ggc ttc gcc gcc acg tcc atc tcg ggc ggc 240Asn Asp Asn Phe Ser Tyr Gly Phe Ala Ala Thr Ser Ile Ser Gly Gly65 70 75 80aac gag gcc tcg tgg tgc tgt ggc tgc tac gag ctg acc ttc acc tcg 288Asn Glu Ala Ser Trp Cys Cys Gly Cys Tyr Glu Leu Thr Phe Thr Ser85 90 95ggc ccc gtc gct ggc aag acc atg gtt gtc cag tcc acc tcg acc ggc 336Gly Pro Val Ala Gly Lys Thr Met Val Val Gln Ser Thr Ser Thr Gly100 105 110ggc gac ctc ggc acc aac cac ttc gac ctg gcc atg ccc ggt ggt ggt 384Gly Asp Leu Gly Thr Asn His Phe Asp Leu Ala Met Pro Gly Gly Gly115 120 125gtc ggc atc ttc gac ggc tgc tcg ccc cag ttc ggc ggc ctc gcc ggc 432Val Gly Ile Phe Asp Gly Cys Ser Pro Gln Phe Gly Gly Leu Ala Gly130 135 140gac cgc tac ggc ggc gtc tcg tcg cgc agc cag tgc gac tcg ttc ccc 480Asp Arg Tyr Gly Gly Val Ser Ser Arg Ser Gln Cys Asp Ser Phe Pro145 150 155 160gcc gcc ctc aag ccc ggc tgc tac tgg cgc ttc gac tgg ttc aag aac 528Ala Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe Asp Trp Phe Lys Asn165 170 175
gcc gac aac ccg acc ttc acc ttc cgc cag gtc cag tgc ccg tcg gag576Ala Asp Asn Pro Thr Phe Thr Phe Arg Gln Val Gln Cys Pro Ser Glu180 185 190ctc gtc gcc cgc acc ggc tgc cgc cgc aac gac gac ggc aac ttc ccc624Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp Asp Gly Asn Phe Pro195 200 205gtc ttc acc cct ccc tcg ggc ggt cag tcc tcc tcg tct tcc tcc tcc672Val Phe Thr Pro Pro Ser Gly Gly Gln Ser Ser Ser Ser Ser Ser Ser210 215 220agc agc gcc aag ccc acc tcc acc tcc acc tcg acc acc tcc acc aag720Ser Ser Ala Lys Pro Thr Ser Thr Ser Thr Ser Thr Thr Ser Thr Lys225 230 235 240gct acc tcc acc acc tcg acc gcc tcc agc cag acc tcg tcg tcc acc768Ala Thr Ser Thr Thr Ser Thr Ala Ser Ser Gln Thr Ser Ser Ser Thr245 250 255ggc ggc ggc tgc gcc gcc cag cgc tgg gcg cag tgc ggc ggc atc ggg816Gly Gly Gly Cys Ala Ala Gln Arg Trp Ala Gln Cys Gly Gly Ile Gly260 265 270ttc tcg ggc tgc acc acg tgc gtc agc ggc acc acc tgc aac aag cag864Phe Ser Gly Cys Thr Thr Cys Val Ser Gly Thr Thr Cys Asn Lys Gln275 280 285aac gac tgg tac tcg cag tgc ctt taa891Asn Asp Trp Tyr Ser Gln Cys Leu290 295<210>38<211>296<212>PRT<213>Staphylotrichum coccosporum IFO 31817<220>
<221>misc_feature<222>(1)..(3)<223>焦谷氨酸<400>38
Gln Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys Cys Lys Pro Ser1 5 10 15Cys Ser Trp Pro Gly Lys Ala Ser Val Asn Gln Pro Val Phe Ala Cys20 25 30Ser Ala Asn Phe Gln Arg Ile Ser Asp Pro Asn Val Lys Ser Gly Cys35 40 45Asp Gly Gly Ser Ala Tyr Ala Cys Ala Asp Gln Thr Pro Trp Ala Val50 55 60Asn Asp Asn Phe Ser Tyr Gly Phe Ala Ala Thr Ser Ile Ser Gly Gly65 70 75 80Asn Glu Ala Ser Trp Cys Cys Gly Cys Tyr Glu Leu Thr Phe Thr Ser85 90 95Gly Pro Val Ala Gly Lys Thr Met Val Val Gln Ser Thr Ser Thr Gly100 105 110Gly Asp Leu Gly Thr Asn His Phe Asp Leu Ala Met Pro Gly Gly Gly115 120 125Val Gly Ile Phe Asp Gly Cys Ser Pro Gln Phe Gly Gly Leu Ala Gly130 135 140Asp Arg Tyr Gly Gly Val Ser Ser Arg Ser Gln Cys Asp Ser Phe Pro145 150 155 160Ala Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe Asp Trp Phe Lys Asn165 170 175Ala Asp Asn Pro Thr Phe Thr Phe Arg Gln Val Gln Cys Pro Ser Glu180 185 190Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp Asp Gly Asn Phe Pro195 200 205Val Phe Thr Pro Pro Ser Gly Gly Gln Ser Ser Ser Ser Ser Ser Ser210 215 220Ser Ser Ala Lys Pro Thr Ser Thr Ser Thr Ser Thr Thr Ser Thr Lys225 230 235 240
Ala Thr Ser Thr Thr Ser Thr Ala Ser Ser Gln Thr Ser Ser Ser Thr245 250 255Gly Gly Gly Cys Ala Ala Gln Arg Trp Ala Gln Cys Gly Gly Ile Gly260 265 270Phe Ser Gly Cys Thr Thr Cys Val Ser Gly Thr Thr Cys Asn Lys Gln275 280 285Asn Asp Trp Tyr Ser Gln Cys Leu290 295<210>39<211>900<212>DNA<213>Staphylotrichum coccosporum IF031817<220>
<221>CDS<222>(1)..(900)<223>
<220>
<221>来源<222>(13)..(900)<223>焦谷氨酸<220>
<221>misc_feature<222>(1)..(3)<223>焦谷氨酸<400>39cag tcg gca tgc gcc gat ggc aag tcc acc cgc tac tgg gac tgc tgc 48Gln Ser Ala Cys Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys Cys1 5 10 15aag cct tcg tgc tcg tgg ccc ggc aag gcc tcg gtg aac cag ccc gtc 96Lys Pro Ser Cys Ser Trp Pro Gly Lys Ala Ser Val Asn Gln Pro Val20 25 30ttc gcc tgc agc gcc aac ttc cag cgc atc agc gac ccc aac gtc aag 144Phe Ala Cys Ser Ala Asn Phe Gln Arg Ile Ser Asp Pro Asn Val Lys
35 40 45tcg ggc tgc gac ggc ggc tcc gcc tac gcc tgc gcc gac cag acc ccg192Ser Gly Cys Asp Gly Gly Ser Ala Tyr Ala Cys Ala Asp Gln Thr Pro50 55 60tgg gcc gtc aac gac aac ttc tcg tac ggc ttc gcc gcc acg tcc atc240Trp Ala Val Asn Asp Asn Phe Ser Tyr Gly Phe Ala Ala Thr Ser Ile65 70 75 80tcg ggc ggc aac gag gcc tcg tgg tgc tgt ggc tgc tac gag ctg acc288Ser Gly Gly Asn Glu Ala Ser Trp Cys Cys Gly Cys Tyr Glu Leu Thr85 90 95ttc acc tcg ggc ccc gtc gct ggc aag acc atg gtt gtc cag tcc acc336Phe Thr Ser Gly Pro Val Ala Gly Lys Thr Met Val Val Gln Ser Thr100 105 110tcg acc ggc ggc gac ctc ggc acc aac cac ttc gac ctg gcc atg ccc384Ser Thr Gly Gly Asp Leu Gly Thr Asn His Phe Asp Leu Ala Met Pro115 120 125ggt ggt ggt gtc ggc atc ttc gac ggc tgc tcg ccc cag ttc ggc ggc432Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Ser Pro Gln Phe Gly Gly130 135 140ctc gcc ggc gac cgc tac ggc ggc gtc tcg tcg cgc agc cag tgc gac480Leu Ala Gly Asp Arg Tyr Gly Gly Val Ser Ser Arg Ser Gln Cys Asp145 150 155 160tcg ttc ccc gcc gcc ctc aag ccc ggc tgc tac tgg cgc ttc gac tgg528Ser Phe Pro Ala Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe Asp Trp165 170 175ttc aag aac gcc gac aac ccg acc ttc acc ttc cgc cag gtc cag tgc576Phe Lys Asn Ala Asp Asn Pro Thr Phe Thr Phe Arg Gln Val Gln Cys180 185 190ccg tcg gag ctc gtc gcc cgc acc ggc tgc cgc cgc aac gac gac ggc624Pro Ser Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp Asp Gly195 200 205aac ttc ccc gtc ttc acc cct ccc tcg ggc ggt cag tcc tcc tcg tct672Asn Phe Pro Val Phe Thr Pro Pro Ser Gly Gly Gln Ser Ser Ser Ser
210 215 220tcc tcc tcc agc agc gcc aag ccc acc tcc acc tcc acc tcg acc acc720Ser Ser Ser Ser Ser Ala Lys Pro Thr Ser Thr Ser Thr Ser Thr Thr225 230 235 240tcc acc aag gct acc tcc acc acc tcg acc gcc tcc agc cag acc tcg768Ser Thr Lys Ala Thr Ser Thr Thr Ser Thr Ala Ser Ser Gln Thr Ser245 250 255tcg tcc acc ggc ggc ggc tgc gcc gcc cag cgc tgg gcg cag tgc ggc816Ser Ser Thr Gly Gly Gly Cys Ala Ala Gln Arg Trp Ala Gln Cys Gly260 265 270ggc atc ggg ttc tcg ggc tgc acc acg tgc gtc agc ggc acc acc tgc864Gly Ile Gly Phe Ser Gly Cys Thr Thr Cys Val Ser Gly Thr Thr Cys275 280 285aac aag cag aac gac tgg tac tcg cag tgc ctt taa900Asn Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu290 295<210>40<211>299<212>PRT<213>Staphylotrichum coccosporum IFO 31817<220>
<221>misc_feature<222>(1)..(3)<223>焦谷氨酸<400>40Gln Ser Ala Cys Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys Cys1 5 10 15Lys Pro Ser Cys Ser Trp Pro Gly Lys Ala Ser Val Asn Gln Pro Val20 25 30Phe Ala Cys Ser Ala Asn Phe Gln Arg Ile Ser Asp Pro Asn Val Lys35 40 45Ser Gly Cys Asp Gly Gly Ser Ala Tyr Ala Cys Ala Asp Gln Thr Pro
50 55 60Trp Ala Val Asn Asp Asn Phe Ser Tyr Gly Phe Ala Ala Thr Ser Ile65 70 75 80Ser Gly Gly Asn Glu Ala Ser Trp Cys Cys Gly Cys Tyr Glu Leu Thr85 90 95Phe Thr Ser Gly Pro Val Ala Gly Lys Thr Met Val Val Gln Ser Thr100 105 110Ser Thr Gly Gly Asp Leu Gly Thr Asn His Phe Asp Leu Ala Met Pro115 120 125Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Ser Pro Gln Phe Gly Gly130 135 140Leu Ala Gly Asp Arg Tyr Gly Gly Val Ser Ser Arg Ser Gln Cys Asp145 150 155 160Ser Phe Pro Ala Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe Asp Trp165 170 175Phe Lys Asn Ala Asp Asn Pro Thr Phe Thr Phe Arg Gln Val Gln Cys180 185 190Pro Ser Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp Asp Gly195 200 205Asn Phe Pro Val Phe Thr Pro Pro Ser Gly Gly Gln Ser Ser Ser Ser210 215 220Ser Ser Ser Ser Ser Ala Lys Pro Thr Ser Thr Ser Thr Ser Thr Thr225 230 235 240Ser Thr Lys Ala Thr Ser Thr Thr Ser Thr Ala Ser Ser Gln Thr Ser245 250 255Ser Ser Thr Gly Gly Gly Cys Ala Ala Gln Arg Trp Ala Gln Cys Gly260 265 270Gly Ile Gly Phe Ser Gly Cys Thr Thr Cys Val Ser Gly Thr Thr Cys275 280 285
Asn Lys Gln Asn Asp Trp Tyr Ser Gln Cys Leu290 295<210>41<211>8<212>PRT<213>Staphylotrichum coccosporum IFO 31817<220>
<221>MOD_RES<222>(1)..(1)<223>吡咯烷酮羧酸<220>
<221>MUTAGEN<222>(1)..(1)<223>
<400>41Gln Ala Asp Gly Lys Ser Thr Arg1 5<210>42<211>11<212>PRT<213>Staphylotrichum coccosporum IFO 31817<220>
<221>MOD_RES<222>(1)..(1)<223>吡咯烷酮羧酸<220>
<221>MUTAGEN<222>(1)..(4)<223>
<400>42Gln Ser Ala Cys Ala Asp Gly Lys Ser Thr Arg1 5 10<210>43
<211>21<212>PRT<213>Staphylotrichum coccosporum IF031817<400>43Met Arg Ser Ser Pro Val Leu Arg Thr Ala Leu Ala Ala Ala Leu Pro1 5 10 15Leu Ala Ala Leu Ala20<210>44<211>295<212>PRT<213>Staphylotrichum coccosporum IF031817<400>44Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys Cys Lys Pro Ser Cys1 5 10 15Ser Trp Pro Gly Lys Ala Ser Val Asn Gln Pro Val Phe Ala Cys Ser20 25 30Ala Asn Phe Gln Arg Ile Ser Asp Pro Asn Val Lys Ser Gly Cys Asp35 40 45Gly Gly Ser Ala Tyr Ala Cys Ala Asp Gln Thr Pro Trp Ala Val Asn50 55 60Asp Asn Phe Ser Tyr Gly Phe Ala Ala Thr Ser Ile Ser Gly Gly Asn65 70 75 80Glu Ala Ser Trp Cys Cys Gly Cys Tyr Glu Leu Thr Phe Thr Ser Gly85 90 95Pro Val Ala Gly Lys Thr Met Val Val Gln Ser Thr Ser Thr Gly Gly100 105 110Asp Leu Gly Thr Asn His Phe Asp Leu Ala Met Pro Gly Gly Gly Val115 120 125Gly Ile Phe Asp Gly Cys Ser Pro Gln Phe Gly Gly Leu Ala Gly Asp
130 135 140Arg Tyr Gly Gly Val Ser Ser Arg Ser Gln Cys Asp Ser Phe Pro Ala145 150 155 160Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe Asp Trp Phe Lys Asn Ala165 170 175Asp Asn Pro Thr Phe Thr Phe Arg Gln Val Gln Cys Pro Ser Glu Leu180 185 190Val Ala Arg Thr Gly Cys Arg Arg Asn Asp Asp Gly Asn Phe Pro Val195 200 205Phe Thr Pro Pro Ser Gly Gly Gln Ser Ser Ser Ser Ser Ser Ser Ser210 215 220Ser Ala Lys Pro Thr Ser Thr Ser Thr Ser Thr Thr Ser Thr Lys Ala225 230 235 240Thr Ser Thr Thr Ser Thr Ala Ser Ser Gln Thr Ser Ser Ser Thr Gly245 250 255Gly Gly Cys Ala Ala Gln Arg Trp Ala Gln Cys Gly Gly Ile Gly Phe260 265 270Ser Gly Cys Thr Thr Cys Val Ser Gly Thr Thr Cys Asn Lys Gln Asn275 280 285Asp Trp Tyr Ser Gln Cys Leu290 295<210>45<211>20<212>PRT<213>Humicola insolens<400>45Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro1 5 10 15Val Leu Ala Leu20
<210>46<211>286<212>PRT<213>Humicola insolens<400>46Ala Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys Cys Lys Pro Ser1 5 10 15Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro Val Phe Ser Cys20 25 30Asn Ala Asn Phe Gln Arg Leu Thr Asp Phe Asp Ala Lys Ser Gly Cys35 40 45Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln Thr Pro Trp Ala50 55 60Val Asn Asp Asp Phe Ala Phe Gly Phe Ala Ala Thr Ser Ile Ala Gly65 70 75 80Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu Leu Thr Phe Thr85 90 95Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln Ser Thr Ser Thr100 105 110Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn Ile Pro Gly Gly115 120 125Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe Gly Gly Leu Pro130 135 140Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu Cys Asp Arg Phe145 150 155 160Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe Asp Trp Phe Lys165 170 175Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val Gln Cys Pro Ala180 185 190
Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp Asp Gly Asn Phe195 200 205Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser Pro Val Gly Gln210 215 220Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr Ser Ser Pro Pro225 230 235 240Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu Arg Trp Ala Cys245 250 255Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys Val Ala Gly260 265 270Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys Leu275 280 285<210>47<211>17<212>PRT<213>Humicola insolens<400>47Met Gln Leu Pro Leu Thr Thr Leu Leu Thr Leu Leu Pro Ala Leu Ala1 5 10 15Ala<210>48<211>206<212>PRT<213>Humicola insolens<400>48Ala Gln Ser Gly Ser Gly Arg Thr Thr Arg Tyr Trp Asp Cys Cys Lys1 5 10 15Pro Ser Cys Ala Trp Pro Gly Lys Gly Pro Ala Pro Val Arg Thr Cys20 25 30
Asp Arg Trp Asp Asn Pro Leu Phe Asp Gly Gly Asn Thr Arg Ser Gly35 40 45Cys Asp Ala Gly Gly Gly Ala Tyr Met Cys Ser Asp Gln Ser Pro Trp50 55 60Ala Val Ser Asp Asp Leu Ala Tyr Gly Trp Ala Ala Val Asn Ile Ala65 70 75 80Gly Ser Asn Glu Arg Gln Trp Cys Cys Ala Cys Tyr Glu Leu Thr Phe85 90 95Thr Ser Gly Pro Val Ala Gly Lys Arg Met Ile Val Gln Ala Ser Asn100 105 110Thr Gly Gly Asp Leu Gly Asn Asn His Phe Asp Ile Ala Met Pro Gly115 120 125Gly Gly Val Gly Ile Phe Asn Ala Cys Thr Asp Gln Tyr Gly Ala Pro130 135 140Pro Asn Gly Trp Gly Gln Arg Tyr Gly Gly Ile Ser Gln Arg His Glu145 150 155 160Cys Asp Ala Phe Pro Glu Lys Leu Lys Pro Gly Cys Tyr Trp Arg Phe165 170 175Asp Trp Phe Leu Asn Ala Asp Asn Pro Ser Val Asn Trp Arg Gln Val180 185 190Ser Cys Pro Ala Glu Ile Val Ala Lys Ser Gly Cys Ser Arg195 200 20权利要求
1.一种抑制在存在表面活性剂时内切糖苷酶活性降低的方法,其特征在于通过修饰具有内切糖苷酶活性,且N末端氨基酸不是焦谷氨酸的蛋白,使其转变为N末端具有焦谷氨酸的蛋白。
2.权利要求1中的方法,其中修饰是通过向具有内切糖苷酶活性,且N末端氨基酸不是焦谷氨酸的蛋白的N末端加入焦谷氨酸或可转变为焦谷氨酸的氨基酸,或N末端为焦谷氨酸或可转变为焦谷氨酸的氨基酸的肽而进行的。
3.权利要求1中的方法,其中所述修饰是用焦谷氨酸或可转变为焦谷氨酸的氨基酸、或N末端为焦谷氨酸或可转变为焦谷氨酸的氨基酸的肽替代具有内切糖苷酶活性、且N末端氨基酸不是焦谷氨酸的蛋白N末端氨基酸或N末端区域而进行的。
4.权利要求1到3任一项中的方法,其中具有内切糖苷酶活性,且N末端氨基酸不是焦谷氨酸的蛋白是属于家族45的纤维素酶。
5.一种具有内切糖苷酶活性,且N末端氨基酸通过氨基酸修饰转变为焦谷氨酸的修饰蛋白。
6.权利要求5中的修饰蛋白,其是通过权利要求1到4任一项中的方法获得的。
7.一种从包含以下蛋白的组中选择的蛋白(a)包含SEQ ID NO2、4、38或40所示的氨基酸序列的蛋白;(b)包含在SEQ ID NO2、4、38或40所示的氨基酸序列中缺失、替换、插入或添加一个或多个氨基酸所得的氨基酸序列,且其内切糖苷酶活性在存在表面活性剂时降低很小的修饰蛋白;及(c)同源蛋白,其与包含SEQ ID NO2、4、38或40所示的氨基酸序列的蛋白的同源性至少为85%,而且其内切糖苷酶活性在存在表面活性剂时降低很小。
8.一种编码权利要求5到7任一项中的蛋白的多核苷酸。
9.一种从以下组中选择的多核苷酸(a)包含SEQ ID NO1、3、37或39所示的核酸序列多核苷酸;(b)包含在SEQ ID NO1、3、37或39所示的核酸序列中缺失、替换、插入或添加一个或多个碱基所得的碱基序列,且其编码蛋白的内切糖苷酶活性在存在表面活性剂时降低很小的多核苷酸;及(c)一种在严紧条件下与SEQ ID NO1、3、37或39所示的核酸序列杂交,而且其编码蛋白的内切糖苷酶活性在存在表面活性剂时降低很小的多核苷酸。
10.一种包含权利要求8或9中的多核苷酸的表达载体。
11.一种用权利要求10中的表达载体转化的宿主细胞。
12.权利要求11中的宿主细胞,其中所述宿主细胞是酵母或丝状真菌。
13.权利要求12中的宿主细胞,其中,所述丝状真菌是属于腐质霉或木霉属的微生物。
14.权利要求13中的宿主细胞,其中,所述丝状真菌是Humicolainsolens或绿色木霉(Trichoderma viride)。
15.一种生产权利要求5到7任一项中的蛋白的方法,包括培养权利要求11到14任一项中的宿主细胞,以及从培养获得的宿主细胞或培养物中回收蛋白的步骤。
16.一种根据权利要求15的方法生产的蛋白。
全文摘要
公开了一种抑制在存在表面活性剂时内切糖苷酶活性降低的方法,其特征在于通过修饰具有内切糖苷酶活性,N末端氨基酸不是焦谷氨酸的蛋白,使其转变为N末端具有焦谷氨酸的蛋白。另外,公开了一种具有内切糖苷酶活性,其N末端通过氨基酸修饰转变为焦谷氨酸的修饰蛋白,编码该蛋白的多核苷酸,包含该多核苷酸的表达载体,用该表达载体转化的宿主细胞和通过培养宿主细胞而生产蛋白的方法。
文档编号C12P21/02GK1890367SQ20048003645
公开日2007年1月3日 申请日期2004年12月7日 优先权日2003年12月8日
发明者渡边学, 矢内耕二, 露木由美子 申请人:明治制果株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1