增强的纤维素降解的制作方法

文档序号:1428126阅读:646来源:国知局
增强的纤维素降解的制作方法
【专利摘要】本发明提供了与降解纤维素和含纤维素材料有关的组合物和方法。其中提供了CDH-血红素结构域多肽和GH61多肽以及相关的多聚核苷酸和组合物。另外,本发明还提供了与CDH-血红素结构域多肽、GH61多肽和相关多聚核苷酸和组合物有关的方法。
【专利说明】增强的纤维素降解
[0001]相关申请的交叉引用
[0002]本申请要求2011年4月4日提交的美国临时专利61/471,627和2011年7月21日提交的美国临时专利61/510,463的权益,在此其内容通过全部引用的方式并入本文。
[0003]ASCII文本提交的序列表
[0004]在此,ASCII文本文件中提交的内容通过全部引用的方式并入本文:计算机可读形式(CRF)的序列表(文件名:677792001440SEQLIST.txt,记录日期:March29, 2012,大小:194ΚΒ) ο【技术领域】
[0005]本发明涉及降解纤维素和含纤维素的材料的方法。具体地,本发明涉及与纤维素的降解有关的多肽,多聚核苷酸和组合物,以及所用的方法。
【背景技术】
[0006]由于对能源安全,可持续发展和全球气候的改变逐渐关心,人们已开始对生物能源的深入研究。人们认为将植物基材料生物转化至生物燃料是化石燃料的化学生产的有吸引力的替换。纤维素,植物的主要成分和地球上最丰富的有机化合物之一,是一种由β(1-4)连接的D-葡萄糖分子的长链构成的多糖。由于其糖基组合物,纤维素是用于生产生物燃料和其它糖衍生产物的丰富的潜在源材料。例如,糖可以被发酵成生物燃料,例如乙醇。为了使纤维素内的糖用于生产生物燃料,必须将纤维素分解成更小的分子。
[0007]纤维素可以通过化学或酶方法降解。水解纤维素的酶被称为“纤维素酶”,并且包括,例如,内切葡聚糖酶、外切葡聚糖酶、和β -葡聚糖苷酶。
[0008]虽然存在分解纤维素的技术,但目前的技术是相对低效和昂贵的,这限制了基于纤维素的技术的实现。因此,人们对研发试剂和技术以提高纤维素降解有极大的兴趣。提高纤维素的降解效率的一个方法是提高纤维素酶的催化活性。一个替代的方法(该方法可以与提高纤维素酶的催化活性结合使用)是研发能与纤维素一起使用以增强纤维素的降解的组合物,并研发其使用方法。

【发明内容】

[0009]在此公开增强纤维素的降解的多肽、多聚核苷酸、组合物和方法。这些多肽、多聚核苷酸、组合物和方法比现有的多肽、多聚核苷酸、组合物和方法在纤维素的降解上有巨大的改进。
[0010]一种非天然存在的多肽,该非天然存在的多肽具有第一结构域和第二结构域,其中在此公开第一结构域包含CDH-血红素结构域并且第二结构域包含纤维素结合模块(CBM)0这些多肽在降解纤维素上比缺失CBM、含有⑶H-血红素结构域的多肽更有效。
[0011]还公布了一种非天然存在的多肽,该多肽缺失脱氢酶结构域但具有CBM血红素结构域和CBM结构域。纤维素酶反应利用这些多肽产生更少的活性氧簇从而减少氧化损伤。这种氧化损伤可以降解纤维素酶活性,在化学上改变酶底物或产物,和/或产生不想要的副产物。[0012]公布了包括重组GH61多肽和含有CBM的重组⑶H-血红素结构域多肽的组合物。这些组合物可以包括各种在此公布的GH61多肽和⑶H-血红素结构域多肽。这些组合物可以加入到含有纤维素酶和含纤维素的材料的混合物中,以提高含纤维素的材料的降解。
[0013]还公布了各种重组GH61多肽。这些多肽可以与包括纤维素酶和含纤维素的材料的混合物一起提供以增强含纤维素的材料的降解。
[0014]在此描述了与铜原子结合的重组GH61多肽。这些多肽在降解纤维素上比没有与铜原子结合的其它相当的GH61的多肽更有效。
[0015]还在此公布了各种含有CBM的重组⑶H-血红素结构域多肽。在一些方面,这些多肽在好氧条件下比在厌氧条件下具有更高的活性。如此,向反应提供足够的氧气可以改进该反应。可以通过在反应中鼓泡或其它标准方法提供这种氧气。
[0016]一种非天然存在的多肽,具有第一结构域和第二结构域,其中还公布了该第一结构域含有CDH-血红素结构域并且该第二结构域含有纤维素结合模块(CBM)。在一种形式中,该多肽不包括脱氢酶结构域。还公布了编码这些多肽的重组多聚核苷酸。
[0017]还公布了一种天然存在的多肽,该多肽具有第一、第二和第三结构域。该第一结构域可以含有CDH-血红素结构域,该第二结构域可以含有CBM结构域,并且该第三结构域可以含有脱氢酶结构域。还公布了编码这些多肽的重组多聚核苷酸。
[0018]还公布一种包括重组GH61多肽和含有CBM的重组⑶H-血红素结构域多肽的组合物。该重组GH61多肽可以包含基序H-X(4-8)-Q-X-Y。在另一形式中,该GH61多肽可以包含NCU02240/NCU01050进化枝的多肽。在另一形式中,该重组GH61多肽含有SEQ ID N0:24(NCU02240)或 30(NCU01050)。在另一形式中,该 GH61 多肽含有 SEQ IDN0:26(NCU07898),28
[0019](NCU08760)、SEQ ID NO: 90 (NCU00836)。这些组合物中的任何一种可以进一步包`含一种或更多种纤维素酶。
[0020]公布一种包括重组GH61多肽和含有CBM的⑶H-血红素结构域多肽的组合物,其中该 CBM 含有 SEQ ID NOs: 32 (N.crassa CDH-1)或 46 (M.thermophila CDH-1) ? 该组合物
可以进一步含有一种或更多种纤维素酶。
[0021]提供一种组合物,该组合物含有:A)重组GH61多肽;以及B)含有⑶H-血红素结构域和CBM结构域的非天然存在的重组多肽。该非天然存在的多肽可选地含有脱氢酶结构域。该组合物可以进一步含有一种或更多种纤维素酶。
[0022]还提供一种组合物,该组合物含有:A)第一多肽,该第一多肽包括⑶H-血红素结构域;以及B)第二多肽,该第二多肽含有CBM,其中该第一多肽和第二多肽稳定地相互作用但不是共价连接。在一种形式中,该第一多肽和第二多肽通过亮氨酸拉链基序相互作用。在一种形式中,该⑶H-血红素结构域含有选自如下的氨基酸序列:SEQ ID NOs: 70 (N.crassaCDH-1 血红素结构域);76(N.crassa CDH-2 血红素结构域);80 (M.thermophila CDH-1 血红素结构域);和86 (M.thermophila CDH-2血红素结构域),并且CBM含有SEQ ID NOs: 74 (N.crassa CDH-1CBM结构域)或84(M.thermophila CDH-1CBM结构域)的氨基酸序列。在另一种形式中,这些组合物中的任何一种与GH61多肽一起提供。在另一形式中,这些组合物中的任何一种可以进一步含有一种或更多种纤维素酶。
[0023]在此描述一种组合物,该组合物含有A)重组GH61多肽;以及B)含有CBM的重组⑶H-血红素结构域多肽,其中该⑶H-血红素结构域含有选自以下的氨基酸序列:SEQID NOs: 70 (N.crassa CDH-1 血红素结构域)、76 (N.crassa CDH-2 血红素结构域)、80 (M.thermophila CDH-1血红素结构域),和86 (M.thermophila CDH-2血红素结构域),并且其中 CBM 含有 SEQ ID NOs: 74 (N.crassa CDH-1CBM 结构域)或 84 (M.thermophila CDH-1CBM结构域)的氨基酸序列。在一种形式中,该组合物的重组GH61多肽含有NCU02240/NCU01050进化枝的多肽。在一种形式中,该组合物的重组GH61多肽含有SEQ ID NO: 24 (NCU02240)或30
[0024](NCU01050)。在另一形式中,该组合物的重组GH61多肽含有SEQ IDNO: 26 (NCU07898)或28 (NCU08760)。在另一形式中,该组合物的含有CBM的重组CDH-血红素结构域多肽含有 SEQ ID NOs: 32 (N.crassa CDH-1)或 46 (M.thermophila CDH-1) ? 这些组合物中的任何一种可以进一步含有一种或更多种纤维素酶。
[0025]在此描述一种组合物,该组合物含有A)重组GH61多肽;以及B)含有CBM并缺失脱氢酶结构域的非天然存在的CDH-血红素结构域多肽,其中该CDH-血红素结构域含有选自选自
[0026]SEQ ID NOs: 70 (N.crassa CDH-1 血红素结构域)、76 (N.crassa CDH-2 血红素结构域)、80 (M.thermophila CDH-1 血红素结构域),和 86 (M.thermophila CDH-2 血红素结构域)的氨基酸序列,并且其中该CBM含有SEQ ID NOs: 74 (N.crassa CDH-1CBM结构域)或84(M.thermophila⑶H-1CBM结构域)的氨基酸序列。该组合物可以进一步含有一种或更多种纤维素酶。
[0027]还在此描述一种组合物,该组合物含有A)重组GH61多肽;以及B)含有CBM并且含有脱氢酶结构域的非天然存在的CDH-血红素结构域多肽,其中该CDH-血红素结构域含有选自以下的氛基酸序列:SEQ ID NOs: 70 (N.crassa Q)H_1血红素结构域)、76 (N.crassaCDH-2 血红素结构域) 、80 (M.thermophila CDH-1 血红素结构域),和 86 (M.thermophilaCDH-2血红素结构域);并且该CBM含有SEQ ID NOs: 74 (N.crassa CDH-1CBM结构域)或84(M.thermophila⑶H-1CBM结构域)的氨基酸序列。该组合物可以进一步含有一种或更多种纤维素酶。
[0028]还在此提供一种组合物,该组合物含有A)重组GH61多肽;B)含有CBM的重组⑶H-血红素结构域多肽,以及C) 一种或更多种纤维素酶。在一种形式中,该组合物的重组GH61多肽含有NCU02240/NCU01050进化枝的多肽。在一种形式中,该组合物的重组GH61多肽含有SEQ ID NO: 24 (NCU02240)或30 (NCU01050)。在一种形式中,该组合物的重组GH61多肽含有SEQ ID NO: 26 (NCU07898)或28 (NCU08760)。在另一形式中,该组合物的含有CBM的重组CDH-血红素结构域多肽含有SEQ ID NOs: 32 (N.crassa CDH-1)或46 (M.thermophila⑶H-1)。在另一形式中,含有CBM的重组⑶H-血红素结构域为非天然存在的多肽。
[0029]还在此提供一种宿主细胞,该宿主细胞含有重组多聚核苷酸,该重组多聚核苷酸编码GH61多肽和含有CBM的CDH-血红素结构域多肽。在一种形式中,编码含有CBM的CDH-血红素结构域多肽的多聚核苷酸编码非天然存在的多肽。
[0030]本发明还提供一种降解纤维素的方法,该方法包括用一种或更多种纤维素酶和包括重组GH61多肽和含有CBM的重组CDH-血红素结构域多肽的组合物与纤维素接触,从而产生降解的纤维素。在一种形式中,该重组GH61多肽含有基序H-X(4-8)-Q-X_Y。在一种形式中,该方法的重组GH61多肽含有NCU02240/NCU01050进化枝的多肽。在一种形式中,该方法的重组GH61多肽含有SEQ ID NO: 24 (NCU02240)或30 (NCU01050)。在一种形式中,该方法的重组 GH61 多肽含有 SEQ ID NO: 26 (NCU07898)、28 (NCU08760),或 SEQ IDN0:90(NCU00836)。在另一种形式中,该方法的含有CBM的重组⑶H-血红素结构域多肽含有 SEQ ID NOs: 32 (N.crassa CDH-1)或 46 (M.thermophila CDH-1)。在另一形式中,该方法的含有CBM的重组CDH-血红素结构域多肽为非天然存在的多肽,该非天然存在的多肽含有第一结构域和第二结构域,该第一结构域含有CDH-血红素结构域,该第二结构域含有CBM,并且不包括脱氢酶结构域。在另一形式中,该方法的含有CBM的重组CDH-血红素结构域多肽为非天然存在的多肽,该非天然存在的多肽含有第一结构域、第二结构域,和第三结构域,该第一结构域含有CDH-血红素结构域,该第二结构域含有CBM,该第三结构域包括脱氢酶结构域。在上述任何方法中,该纤维素可以在生物质中。在这些方法中,该方法导致生物质的降解。在涉及生物质的方法中,可以对该生物质进行预处理步骤。
[0031]提供一种降解纤维素的方法,该方法包括用一种或更多种纤维素酶和组合物与纤维素接触,该组合物含有第一多肽和第二多肽,该第一多肽含有CDH-血红素结构域,该第二多肽含有CBM,其中,该第一多肽和第二多肽稳定地相互作用但不共价连接。在该方法的一种形式中,该第一多肽和第二多肽通过亮氨酸拉链基序相互作用。在该方法的另一种形式中,GH61多肽可以与纤维素酶和该组合物混合在一起。在上述任何方法中,该纤维素可以处在生物质中。在这些方法中,该方法导致生物质的降解。在涉及生物质的方法中,可以对该生物质进行预处理步骤。
[0032]本发明还提供一种将生物质转化为发酵产物的方法,该方法包括用一种或更多种纤维素酶和组合物与生物质接触,以产生糖溶液,该组合物包括重组GH61多肽和含有CBM的重组CDH-血红素结构域多肽;用发酵微生物在足以产生发酵产物的条件下培养该糖溶液。在该方法中,可以对该生物`质进行预处理步骤。在一种形式中,该方法的重组GH61多肽含有NCU02240/NCU01050进化枝的多肽。在一种形式中,该方法的重组GH61多肽含有SEQID N0:24(NCU02240)或30(NCU01050)。在一种形式中,该方法的重组GH61多肽含有SEQID N0:26(NCU07898)、28(NCU08760),或 SEQ ID NO: 90 (NCU00836)。在一种形式中,该方法的含有CBM的重组CDH-血红素结构域多肽含有SEQ ID NOs: 32 (N.crassa CDH-1)或46(Μ.thermophila⑶H_l)。在另一形式中,该方法的含有CBM的重组⑶H-血红素结构域多肽为非天然存在的多肽,该非天然存在的多肽含有第一结构域和第二结构域,该第一结构域含有CDH-血红素结构域,该第二结构域含有CBM,并且不含有脱氢酶结构域。在另一形式中,该方法的含有CBM的重组CDH-血红素结构域多肽为非天然存在的多肽,该非天然存在的多肽含有第一结构域、第二结构域,和第三结构域,该第一结构域包括CDH-血红素结构域,该第二结构域包括CBM,该第三结构域包括脱氢酶结构域。
[0033]在此进一步提供一种将生物质转化为发酵产物的方法,该方法包括用一种或更多种纤维素酶和组合物与该生物质接触,从而产生糖溶液,该组合物含有第一多肽和第二多肽,该第一多肽含有CDH-血红素结构域并且该第二多肽含有CBM,其中该第一多肽和第二多肽稳定地相互作用但不共价连接;以及用发酵微生物在足以产生发酵产物的条件下培养该糖溶液。在该方法中,可以对该生物质进行预处理步骤。在一种形式中,该第一多肽和第二多肽通过亮氨酸拉链基序相互作用。在该方法的另一形式中,GH61多肽可以与纤维素酶和该组合物混合在一起。
[0034]在此提供一种在含有纤维素和纤维素酶的混合物中提高纤维素的降解速率的方法,该方法包括用组合物与含有纤维素和纤维素酶的混合物接触,该组合物白静重组GH61多肽和含有CBM的重组CDH-血红素结构域多肽。在一种形式中,该方法的重组GH61多肽为N⑶02240/NCU01050进化枝的多肽。在一种形式中,该方法的重组GH61多肽含有SEQ IDN0:24(NCU02240)或30(NCU01050)。在另一形式中,该方法的重组GH61多肽含有SEQ IDN0:26(NCU07898)、28(NCU08760),或 SEQ ID NO: 90 (NCU00836)。在一种形式中,该方法的含有CBM的重组CDH-血红素结构域多肽含有SEQ ID NOs: 32 (N.crassa CDH-1)或46 (M.thermophila⑶H-1)。在另一形式中,该方法的含有CBM的重组⑶H-血红素结构域多肽为非天然存在的多肽,该非天然存在的多肽含有第一结构域和第二结构域,该第一结构域包括⑶H-血红素结构域,该第二结构域包括CBM,并且不含有脱氢酶结构域。在另一形式中,该方法的含有CBM的重组CDH-血红素结构域多肽为非天然存在的多肽,该非天然存在的多肽含有第一结构域、第二结构域,和第三结构域,该第一结构域包括CDH-血红素结构域,该第二结构域包括CBM,并且该第三结构域包括脱氢酶结构域。
[0035]在此提供一种在含有纤维素和纤维素酶的混合物中提高纤维素的降解速率的方法,该方法包括用组合物与含有纤维素和纤维素酶的混合物接触,该组合物含有第一多肽和第二多肽,该第一多肽含有CDH-血红素结构域,该第二多肽含有CBM,其中该第一多肽和第二多肽稳定地相互作用但不共价连接。在一种形式中,该第一多肽和第二多肽通过亮氨酸拉链基序相互作用。在该方法的另一形式中,GH61多肽可以与纤维素酶和该组合物混合在一起。
[0036]在此提供一种降低预处理生物质混合物的粘度的方法,该方法包括用纤维素酶和组合物与该混合物接触,从而产生具有降低的粘度的预处理的生物质混合物,该组合物包括重组GH61多肽和含有CBM的重组⑶H-血红素结构域多肽。在一种形式中,该方法的重组GH61多肽为NCU02240/N CU01050进化枝的多肽。在一种形式中,该方法的重组GH61多肽含有SEQID N0:24(NCU02240)或30 (NCU01050)。在另一形式中,该方法的重组GH61多肽含有 SEQID N0:26(NCU07898)、28(NCU08760),或SEQ ID NO: 90 (NCU00836)。在一种形式中,该方法的含有CBM的重组CDH-血红素结构域多肽含有SEQ ID NOs: 32 (N.crassa CDH-1)或46 (M.thermophila⑶H-1)。在另一形式中,该方法的含有CBM的重组⑶H-血红素结构域多肽为非天然存在的多肽,该非天然存在的多肽含有第一结构域和第二结构域,该第一结构域包括CDH-血红素结构域,该第二结构域包括CBM,并且不含有脱氢酶结构域。在另一形式中,该方法的含有CBM的重组CDH-血红素结构域多肽为非天然存在的多肽,该非天然存在的多肽含有第一结构域、第二结构域,和第三结构域,该第一结构域包括CDH-血红素结构域,该第二结构域包括CBM,并且该第三结构域包括脱氢酶结构域。
[0037]在此还公布了一种生产葡萄糖和4-酮基葡萄糖分子的方法,该方法包括用重组GH61多肽和含有CBM的重组⑶H-血红素结构域多肽与纤维素接触,其中,该重组GH61多肽与铜原子结合。在一种形式中,该方法的重组GH61多肽为NCU02240/NCU01050进化枝的多肽。在一种形式中,该方法的重组GH61多肽含有SEQ ID N0:24(NCU02240)或30(NCU01050) ο在另一形式中,该方法的重组GH61多肽含有SEQ ID NO: 26 (NCU07898)、28 (NCU08760),或 SEQ ID NO: 90 (NCU00836)。
[0038]还在此公开了一种裂解纤维素聚合物中1-4糖苷键的方法,该方法包括用重组GH61多肽和含有CBM的重组⑶H-血红素结构域多肽与纤维素接触,其中该重组GH61多肽与铜原子结合。在一种形式中,该方法的重组GH61多肽为NCU02240/NCU01050进化枝的多肽。在一种形式中,该方法的重组GH61多肽含有SEQ ID N0:24(NCU02240)或30(NCU01050) ο在另一形式中,该方法的重组GH61多肽含有SEQ ID NO: 26 (NCU07898)、28 (NCU08760),或 SEQ ID NO: 90 (NCU00836)。
[0039]还在此公布了一种裂解葡萄糖分子第4位碳的C-H键的方法,该方法包括用重组GH61多肽和含有CBM的重组⑶H-血红素结构域多肽与纤维素接触,其中该重组GH61多肽与铜原子结合。在一种形式中,该方法的重组GH61多肽为NCU02240/NCU01050进化枝的多肽。在一种形式中,该方法的重组GH61多肽含有SEQ ID N0:24(NCU02240)或30(NCU01050) ο在另一形式中,该方法的重组GH61多肽含有SEQ ID NO: 26 (NCU07898)、28 (NCU08760),或 SEQ ID NO: 90 (NCU00836)。
[0040]在一些方面,上述提供的方法或组合物中,至少50%的GH61多肽与铜原子结合。在一些方面,上述提供的方法或组合物中,至少90%的GH61多肽与铜原子结合。
[0041]还在此公开了一种组合物,该组合物含有多种重组GH61多肽,其中至少50%、60%、70%、80%、90%、95%、98%,或99%的GH61多肽与铜原子结合。在一种形式中,该组合物的重组GH61多肽为NCU02240/NCU01050进化枝的多肽。在一种形式中,该组合物的重组GH61多肽含有SEQ ID N0:24(NCU02240)或30 (NCU01050)。在另一形式中,该组合物的重组GH61多肽含有 SEQ ID NO: 26 (NCU07898)、28 (NCU08760),或 SEQ ID NO: 90 (NCU00836)。
[0042]在此提供一种生产GH61多肽的方法,该方法包括在含有0.1-1000 μ M铜的培养基中培养含有编码GH61多肽的重`组多聚核苷酸的细胞,并且使该细胞处于足以从编码GH61多肽的重组多聚核苷酸生产GH61多肽的条件。在该方法的一种形式中,该培养基含有100-800 μ M 铜。
[0043]还在此公布一种降解纤维素的方法,该方法包括用一种或更多种纤维素酶、含有CBM的重组⑶H-血红素结构域蛋白质,和重组GH61多肽与纤维素在具有浓度在0.1_500μΜ之间的铜的反应混合物中接触,其中该重组GH61多肽包括:i)NCU02240/NCU01050 进化枝的多肽,或 ii)选自 SEQ ID NO:90 (NCU00836)、SEQ ID NO: 26 (NCU07898),或SEQ ID N0:28(NCU08760)的氨基酸序列。在该方法的一种形式中,该反应混合物的铜浓度在1-50 μ M之间。还在此提供一种在含有纤维素、纤维素酶、含有CBM的⑶H-血红素结构域多肽,和GH61多肽的混合物中提高纤维素降解速率的方法,该方法包括在反应混合物中提供1-50 μ M的铜。
【专利附图】

【附图说明】
[0044]图1展示了 N.crassa CDH-1的缺失体。(A)在AVICEL(TM)上生长7天后,存在于N.crassa野生型和Λ cdh_l菌株的培养物滤液中的蛋白质的SDS-PAGE。用盒子标记缺失的与⑶H-1对应的蛋白质条带。(B)通过DCPIP的纤维二糖依赖型还原反应测量野生型的培养物滤液和Acdh-1培养物中的⑶H活性。值为三个生物重复样本的平均数。误差条为这些重复样本之间的SD。(C)野生型和Acdh-1培养物滤液的微晶纤维素酶(Avicelase)活性。值为以专业的一式三份进行的三个生物重复样本的平均数。误差条为这些复制样本之间的SD。
[0045]图2展不了通过添加M.thermophila⑶H-1至Δ cdh_l培养物滤液,刺激纤维素(AVICEL(TM))降解。(.)代表没有添加外源性⑶H的实验(〇)代表每克Avicel(TM)添加了 400 μ g M.thermophila CDH-1 的实验。向(A) Δ cdh-ΙΝ.crassa 培养物滤液(B)野生型N.crassa培养物滤液或(C)来自N.crassa的纯化的纤维素酶(CBH-1、GH6-2、GH5_1、GH3-4)的混合物添加或者不添加M.thermophila⑶H-1的微晶纤维素酶试验。值为三个重复样本的平均数。误差条为这些复制样本之间的SD。
[0046]图3展不了通过⑶H的其它亚型刺激纤维素降解。(A) M.thermophila⑶H-1和⑶H-2的结构域架构。⑶H-1上的红色C-末端结构域为真菌纤维素结合结构域(CBM1)。(B)M.thermophila CDH-1 和 CDH-2 的 AVICEL(TM)结合试验。泳道 I 为 M.thermophilaCDH-1,泳道 2 为 M.thermophila CDH-2,泳道 3 为与 AVICEL(TM)结合的 CDH-1,泳道 4 为与AVICEL(Tm)结合的CDH-2。(C)通过添加CDH-1 (〇),或CDH-2 ( ▼)刺激Λ cdh-1培养物滤液的纤维素降解能力(.)。(D)M.thermophila CDH-1 和 M.thermophila Q)H-2 浓度在Acdh-1培养物滤液的微晶纤维素酶活性上的效果。值为三个重复样本的平均数。误差条为这些复制样本之间的SD。
[0047]图4展示了通过⑶H-2的结构域截尾刺激纤维素降解。通过添加⑶H_2( ▃)、⑶H-2黄素结构域(▼),或重组⑶H-2血红素结构域(?)刺激Λ cdh-1培养物滤液的纤维素降解能力(籲)。值为三个重复样本的平均数。误差条为这些复制样本之间的SD。
[0048]图5展示了通过M.thermophila⑶Hl刺激微晶纤维素活性的金属和氧气依赖性。(A)用100 μ M EDTA处理10,000倍缓冲液交换的Λ cdh-1培养物滤液,接着用各种金属离子重建,并且在反应45小时之后分析微晶纤维素酶的活性。除最左两栏外,所有的样品用EDTA处理,接着用1.0mM 二价金属离子重建12小时。(B)⑶H刺激纤维素酶活性的氧气依依赖性。(黑色)实验在厌氧条件下进行,(灰色)实验在好氧条件下进行。值为三个重复样本的平均数。误差条为这些复制样本之间的SD。
[0049]图6展不了通过添加部分纯化的N.crassa⑶Hl至Δ cdh-1培养物滤液刺激纤维素降解。(A)部分纯化的N.crassa⑶Hl的SDS-PAGE。(B) Λ cdh_l培养物滤液的微晶纤维素活性。(〇)代表每克AVICEL(Tm)添加了 400 μ g N.crassa CDHl的实验。(.)代表没有添加外源性⑶H的实验。值为三个重复样本的平均数。误差条为这些复制样本之间的SD0
[0050]图7展示了用于全文的纯化的蛋白质的SDS-PAGE。所有的蛋白质以每条泳道5 μ g装入,顺序为:M.thermophila CDH-1> (2)M.thermophila CDH-2> (3)M.thermophila CDH-2黄素结构域、(4)Ν.crassa CBH-1> (5) N.crassa GH6-2、(6) N.crassa GH5-1、(7) N.crassaGH3-4。
[0051]图8展示了 Pichia pastoris中表达的重组⑶H_2血红素结构域的纯化和光谱性质。(A)纯化的重组⑶H-2血红素结构域的SDS-PAGE。(B)氧化的(黑色)和还原的(灰色)0)H-2血红素结构域的紫外可见光谱(UV-vis spectra)。
[0052]图9展示了当存在1.0mM EDTA(〇)时,WT N.crassa培养物肉汤的微晶纤维素酶活性(.)。值为三个重复样本的平均数。误差条为这些复制样本之间的SD。[0053]图10展示了 M.thermophila OTH-1刺激微晶纤维素酶活性的金属依赖性。(A)用100 μ M EDTA处理10,000倍缓冲液交换的Λ cdh_l培养物滤液,接着用各种金属离子重建,并且在反应45小时之后分析微晶纤维素酶活性。除最左两栏外,所有的样品用EDTA处理,接着用1.0mM金属离子重建12小时。值为三个重复样本的平均数。误差条为这些复制样本之间的SD。
[0054]图11展示了 GH61蛋白质的纯化方案。将N.crassa Δ cdh-1接种至添加2%AVICEL(TM)的Vogel’ s盐(Vogel’ s salt)中。7天后,过滤、浓缩培养物,并且在MonoQ柱上分离,接着用1.0mM EDTA处理,并且在MonoQ柱上重提纯。最后,在凝胶过滤柱上纯化含有活性依赖于CDH的存在而增强的纤维素酶的馏分。
[0055]图12展示了 Λ cdh-1培养物滤液的MonoQ分馏。Λ cdh-1培养物滤液通过缓冲液交换至25mMTris pH8.5,并且在MonoQ阴离子交换柱上用梯度的氯化钠分离。通过添加纯化的N.crassa纤维素酶和AVICEL(TM)的混合物,在存在⑶H的情况下,测试负载、连续流动馏分(flow-thixmgh)和所有的馏分刺激纤维素酶活性的能力。接着进行凝胶胰蛋白酶消化和LC-MS/MS,以鉴定活性馏分中所有的蛋白质;标记NCU01050、NCU02240、NCU07898、NCU08760。
[0056]图13展示了纯化的N.crassa GH61蛋白质的凝胶。纯化的天然的N.crassa GH61蛋白质的 SDS-PAGE。泳道指示如下:L-Benchmark 蛋白梯,1- NCU01050, 2 - NCU02240,3 - NCU07898,4 - NCU08760。
[0057]图14展不了锌重建的N.crassa GH61蛋白质的纤维素酶试验。纯化后,用ImM硫酸锌培养GH61蛋白质至少12小时。在存在M.thermophila CDH-1 (0.004mg/mL)的情况下,将纯的 GH61 蛋白质(0.02mg/mL)加入到 N.crassa 纤维素酶(0.05mg/mL CBH-1、GH6_2,和GH5-1 ;0.005mg/mL GH3-4)中,从而查寻刺激纤维素酶活性的能力。除非另有说明,所有的试验以10mg/mL AVICEL(TM),50mM乙酸钠ρΗ5.0和500 μ M硫酸锌,在40°C进行。数据以在24小时,相对于缺失CDH和G H61的试验的降解百分比表示。所有的试验以一式两份进行,并且误差条代表范围。
[0058]图15展示了 EDTA处理的N.crassa GH61蛋白质的纤维素酶试验。在存在M.thermophiIaCDH-1 (0.004mg/mL)的情况下,将 EDTA 处理的纯 GH61 蛋白质(0.02mg/mL)加入到 N.crassa 纤维素酶(0.05mg/mL CBH-1、GH6_2,和 GH5-1 ;0.005mg/mL GH3-4)中,从而查寻刺激纤维素酶活性的能力。所有的试验以10mg/mL AVICEL (TM), 50mM乙酸钠pH5.0和1.0mMEDTA,在40°C中进行。数据以在24小时,相对于缺失⑶H和GH61的试验的降解百分比表示。所有的试验以一式两份进行,并且误差条代表范围。
[0059]图16展示了 N.crassa GH61蛋白质的预处理玉米秸杆的试验。在存在(右柱条)和缺失(左柱条)M.thermophila CDH-1 (0.004mg/mL)的情况下,将锌重建的纯GH61蛋白质(NCU01050、NCU02240、NCU07898、NCU08760 ;各 0.01mg/mL)加入到 N.crassa 纤维素酶(0.045mg/mLCBH-UGH6-2 ;0.005mg/mL GH3-4)中,从而查寻刺激纤维素酶活性的能力。所有的试验均用14mg/mL洗漆的NREL稀酸预处理的玉米稻杆,置于50mM乙酸钠,在pH5.0,40°C条件下进行。数据以在24小时,相对于缺失CDH和GH61的试验的降解百分比表示。所有的试验以一式三份进行,并且误差条代表标准偏差。
[0060]图17展示了 GH61蛋白质和与NCU01050和NCU02240同源的序列的多重序列比对。用 T-COFFEE (Notredame C,et al., J.Mol.Biol.302, pp.205-217 (2000))局部进行多重序列比对,并且用 Jalview 多重比对编辑器(Waterhouse, A.Μ., et al.Bioinformatics25, ρρ? 1189-1191(2009))使比对可视化。比对的序列为SEQ ID NOs:52-69? GH61蛋白质的所有的多重序列比对以缺失N端信号肽的组织化的GH61序列进行,N端信号肽用于使天然蛋白质革巴向分泌。
[0061]图18展示了与NCU02240和NCU01050同源的序列的选定的GH61蛋白质的最大似然系统发育。通过系谱分析(phylogeny analysis) (Dereeper A, et al.Nucleic AcidsRes.36,pp.W465-W469 (2008))确定与NCU02240和NCU01050同源的各种蛋白质的最大似然系统发育。将T-COFFEE用于多重序列比对。利用最大似然方法和PhyML不会产生比对屏模(alignmentcuration)和树。用TreeDyn进行树的可视化。比对的序列为SEQ IDNOs:52-59。
[0062]图19展示了结合在GH61蛋白质中的天然金属的鉴定。含有cdh_l缺失体的Neurospora crassa 在添加 2%w/v AVICEL(TM)PH101 和 5 μ M 硫酸铜(II)的 Vogel’s 盐培养基上,在25°C和200RPM震荡中生长7天。通过在0.2微米PES过滤器上过滤从培养物中移除真菌。利用切向流动过滤浓缩培养物并且通过缓冲液交换至25mM TRIS pH8.5中。浓缩的和通过缓冲液交换的滤液装载到10/100GL MonoQ柱子并且以线性的盐梯度分馏成5懼分。接着分析每种懼分中铜或锌的存在。用拍金埃尔默(Perkin Elmer)电感稱合等离子体原子发射光谱仪进行金属分析。柱状图显示来自MonoQ柱子的每种馏分的锌和铜的量。对于每组2条柱条,左边为铜,而右边为锌。图片为每种馏分的SDS-PAGE。凝胶中的盒子围绕着已知的GH61蛋白质。这些实验结果表明在含有GH61蛋白质的馏分(连续流动馏分(FT)和馏分A2)中铜含量最高。
[0063]图20展示了纯化的NCU01050的金属化学计量。贮存在25mM TRIS pH8.5和150mM氯化钠中的Apo NCU01050稀释成~lmg/mL,总体积为lmL。将硫酸铜、硫酸锌,或1:1的硫酸铜和硫酸锌的混合物加入该`蛋白质中,各金属的终浓度为100 μ M,并且样品在室温下过夜(12-16小时)。接着用26/10脱盐柱将样品的缓冲液交换成25mM TRIS pH8.5。脱盐的蛋白质用3000MWC0聚醚砜自旋浓缩器浓缩成终体积为2-2.5mL。接着记录280nm的吸光度,并用于计算总的蛋白质浓度。从自旋浓缩器流出的连续流动馏分也保留为空白。用珀金埃尔默电感稱合等离子体原子发射光谱仪(Perkin Elmer inductively coupled plasmaatomic emission spectrometer)进行金属分析。柱状图显示用铜、锌,或铜和锌的混合物培养的NCU01050中锌和铜的量。对于每组2条柱条,左边为铜,而右边为锌。该实验的结果支持铜和锌都可以与NCU01050结合,但在存在等摩尔量的两种金属的情况下,铜是优选的金属。
[0064]图21展示了纯化的NCU07898的金属化学计量。贮存在25mM TRIS pH8.5和150mM氯化钠中的Apo NCU07898稀释成~lmg/mL,总体积为lmL。将硫酸铜、硫酸锌,或1:1的硫酸铜和硫酸锌的混合物加入该蛋白质中,各金属的终浓度为100 μ M,并且样品在室温下过夜(12-16小时)。接着用26/10脱盐柱将样品的缓冲液交换成25mM TRIS pH8.5。脱盐的蛋白质用3000MWC0聚醚砜自旋浓缩器浓缩成终体积为2-2.5mL。接着记录280nm的吸光度,并用于计算总的蛋白质浓度。从自旋浓缩器流出的连续流动馏分也保留为空白。用珀金埃尔默(Perkin Elmer)电感耦合等离子体原子发射光谱仪进行金属分析。柱状图显示用铜、锌,或铜和锌的混合物培养的NCU07898中锌和铜的量。对于每组2条柱条,左边为铜,而右边为锌。该实验的结果支持铜和锌都可以与NCU078980结合,但在存在等摩尔量的两种金属的情况下,铜是优选的金属。
[0065]图22展示了纯化的NCU08760的金属化学计量。贮存在25mM TRIS pH8.5和150mM氯化钠中的Apo NCU08760稀释成~lmg/mL,总体积为lmL。将硫酸铜、硫酸锌,或1:1的硫酸铜和硫酸锌的混合物加入该蛋白质中,各金属的终浓度为100 μ M,并且样品在室温下过夜(12-16小时)。接着用26/10脱盐柱将样品的缓冲液交换成25mM TRIS pH8.5。脱盐的蛋白质用3000MWC0聚醚砜自旋浓缩器浓缩成终体积为2-2.5mL。接着记录280nm的吸光度,并用于计算总的蛋白质浓度。从自旋浓缩器流出的连续流动馏分也保留为空白。用珀金埃尔默(Perkin Elmer)电感耦合等离子体原子发射光谱仪进行金属分析。柱状图显示用铜、锌,或铜和锌的混合物培养的NCU08760中锌和铜的量。对于每组2条柱条,左边为铜,而右边为锌。该实验的结果支持铜和锌都可以与NCU08760结合。
[0066]图23展示了通过NCU01050增强M thermophila CDH-2的活性。在该实验中,0.01mg/mL MTCDH-2与1.0mM纤维二糖一起培养30分钟,并且用HPLC (dionex)分析反应产物,纤维二糖酸。如果CDH与10 μ M铜和纤维二糖一起培养,那么仅产生0.24(任意单位)纤维二糖酸。如果加入NCU01050,产生的纤维二糖酸的量增加36倍达到8.74单位。如果将1.0mMEDTA加入⑶H/NCU01050/铜混合物中,仅形成0.56单位。该数据表明NCU01050的存在提高CDH-2氧化纤维二糖的速率。
[0067]图24展示了氧化产物的铜依赖性。从天然的N.crassa纯化出NCU01050/GH61-4并用EDTA彻底处理以移除所有的金属。通过ICP-AES将该蛋白质确定为>95%apo (不含金属),接着用超过10倍摩尔的硫酸锌或亚铜重建I小时。为了确定GH61反应的金属依赖性,在5mg/mLAVICEL(TM)上进行试验。所有的试验在IOmM乙酸钠pH5.0,40°C下进行并且含有 N.crassa CBH-1 (0.035mg/mL)和 CBH-2 (0.015mg/mL)。接着,将 CDH(0.005mg/mL)、NCU01050/GH61-4(浓度列`举在图上),或两者的结合加入纤维素酶中。培养30小时后,将反应物离心,试验上清液稀释5倍并且装入dionex HPAEC上。对于dionex分析,在0.1MNaOH中使用CarboPac PA200HPAEC柱子,0_160mM乙酸钠梯度跑16分钟,接着以300mM乙酸钠冲洗5分钟并且以OmM乙酸钠平衡3分钟。在20-23分钟洗脱一组明显的峰,并且这些峰仅存在于含有CDH和GH61两者的样品中。保留时间明显晚于纤维素酶产生的任何纤维寡糖或由CDH在Cl碳上氧化生成的纤维寡糖的酸产物。相对于结合锌的酶,结合铜的酶的Dionex上的新产物明显更大。在存在⑶H的情况下,I μ M锌结合GH61产生的新峰的面积大致与含有低40倍的铜结合GH61的相似反应的大小相同。柱状图展示了 Dionex上的新产物的峰面积的相对大小。对于每组2条柱条,左边为来自与锌重建的GH61蛋白质的反应的产物的量,而右边为来自与铜重建的GH61蛋白质的反应的产物的量。该试验中使用的所有试剂为Sigma Traceselect级别,并且酶和AVICEL(TM)用EDTA彻底地处理并且洗涤以移除试验中所有的金属污染。
[0068]图25 展示了 GH61 多肽的基序 H-X (4-8)-Q-X-Y 的 His、Gln,和 Tyr 残基对 GH61多肽的活性是重要的。制备具有H179A (“HA”)、Q188A (“QA”),或Y190F (“YF”)突变体的N.crassa NCU08760多肽。分析这些不同的突变型NCU08760多肽,以及野生型(“WT”)NCU08760在磷酸膨胀纤维素(“PASC”)上的活性。X轴表明酶和浓度(μ m),而Y轴表明Pk面积(酸)。
【具体实施方式】
[0069]本发明涉及降解纤维素的组合物和方法。这些组合物和方法在纤维素降解上比现有的多肽,多聚核苷酸,组合物和方法具有显著的改进。在一些实施例中,本发明涉及新颖的多肽,和编码该多肽的多聚核苷酸。在一些实施例中,本发明涉及鉴定CDH依赖性辅助型纤维素酶系统的方法。
[0070]在此公开涉及纤维二糖脱氢酶(⑶H)-血红素结构域多肽的组合物和方法。最初在 Phanerochaete chrysosporium( “P.chrysosporium”)鉴定蛋白质 CDH,并且已经在真菌的多个物种,包括Neurospora crassa( “N.crassa”)中鉴定⑶H直系同源物。
[0071]⑶H蛋白质包括N端血红素结构域和C端脱氢酶结构域。一些⑶H蛋白质也在蛋白质的C端含有纤维素结合模块(CBM)。仅在真菌蛋白质中发现了 CDH-血红素结构域的直系同源物,而在所有领域的生物的蛋白质中发现了脱氢酶结构域的直系同源物;该脱氢酶结构域是更大的GMC氧化还原酶超家族的一部分。已经确定来自P.chrysosporium的血红素和黄素结构域的晶体结构。(Zamocky et al., Curr.Prot.Pept.Sc1., Vol.7, N0.3, pp.255-280, (2006))。
[0072]在此提供一种非天然存在的多肽,该非天然存在的多肽具有第一结构域和第二结构域,该第一结构域含有CDH-血红素结构域,该第二结构域含有纤维素结合模块(CBM)。这些多肽在增强纤维素的降解上比缺失CBM的、含有CDH-血红素结构域的相应的多肽更有效。也可能以比缺失CBM的、含有⑶H-血红素结构域的相应的多肽更少的这些多肽增强纤维素的降解。
[0073]在此还提供一种非天然存在的多肽,该非天然存在的多肽具有第一结构域和第二结构域,该第一结构域含有CD H-血红素结构域,该第二结构域含有纤维素结合模块(CBM)并且不含有脱氢酶结构域。与具有CDH-血红素结构域和CBM,但也具有脱氢酶结构域的相应的多肽相比,这些多肽可以在纤维素酶反应中对分子引起更少的氧化损伤并且在纤维素酶反应中减少活性氧化簇的形成。在纤维素酶反应中,对分子的氧化损伤可以导致,例如,以下结果中的一种或更多种:损害酶活性、改变酶底物或产物的化学性质,或生成不想要的副产物。
[0074]在此公开的⑶H血红素多肽在好氧条件下比在厌氧条件下具有更高的活性。
[0075]在此使用的“CDH蛋白质”指的是具有 N.Crassa CDH-1 (SEQ ID NO:32)、N.CrassaCDH-2(SEQ ID NO:43)、Μ.thermophila CDH-1(SEQ ID NO:46)、M.thermophila CDH-2(SEQID NO:49)的氨基酸序列的多肽,或具有CDH-血红素结构域(如下所述)和脱氢酶结构域的在自然界中存在的其它多肽。可以通过与已知的CDH蛋白质的序列一致性/同源性鉴定不同生物体中的CDH蛋白质,CDH蛋白质的例子包括,但不限于,以下登录号的多肽:XM_411367、BAD32781、BAC20641、XM_389621、AF257654、AB187223、XM_360402、U46081、AF081574、AY187232、AF074951,和AF029668。“CDH蛋白质”也指天然存在的CDH蛋白质的保守修饰变体。“CDH蛋白质”也包括具有或不具有完整信号肽的CDH蛋白质。“CDH”蛋白质可以由细胞分泌,并且在cDNA翻译产物的N端具有短的(大约15-25个氨基酸)信号肽,该信号肽用于蛋白质的分泌,并且从成熟的CDH蛋白质中裂解。[0076]在此还公布涉及糖苷水解酶家族61多肽(“GH61”多肽)的组合物和方法。GH61多肽是一大组多肽,其序列分类为以下的NCBI保守结构域标识符:cl04076,NCBI名称:glycol_hydro_61, Pfam 蛋白质家族编号:pfam03443。
[0077]在此公布的GH61多肽可以与包括纤维素酶和含纤维素的材料的混合物一起提供,从而与没有添加GH61多肽的相应的混合物中含纤维素的材料的降解相比,增强在这些混合物中含纤维素的材料的降解。
[0078]还提供与铜原子结合的重组GH61多肽,这些GH61多肽在增强纤维素的降解上比没有与铜原子结合的相应的GH61多肽更有效。
[0079]还提供包括重组GH61多肽和含有CBM的重组⑶H-血红素结构域多肽的组合物。这些组合物可以包括在此公布的各种GH61多肽和⑶H-血红素结构域多肽。这些组合物可加入到含有纤维素酶和含纤维素的材料的混合物中,从而与没有添加这些组合物的相应的混合物相比,能够增强混合物中含纤维素的材料的降解。
[0080]变体、序列一致性和序列相似性
[0081 ] 本领域周知用于比较的序列比对方法。例如,确定任何两条序列之间的序列一致性百分比可以用数学算法实现。这种数学算法的非限制性例子为Myers和Miller (1988)CAB10S4:1117 算法、Smith 等人(1981) Adv.Appl.Math.2:482 的局部同源算法、Needleman和 Wunsch (1970) J.Mol.Biol.48:443453 的同源比对算法、Pearson 和 Lipman (1988) Proc.Natl.Acad.Sc1.85:24442448 的搜索相似性算法、在 Karlin 和 Altschul (1993) Proc.Natl.Acad.Sc1.USA90:58735877 中修改的 Karlin 和 Altschul (1990) Proc.Natl.Acad.Sc1.USA872264 算法。
[0082]这些数学算法的计`算机执行可以用于序列比较以确定序列一致性。这些执行包括,但不限于,PC/Gene程序中的CLUSTAL(可从加州山景城的Intelligenetics获得)、ALIGN 程序(第 2 版),和 Wisconsin Genetics 软件包中的 GAP, BESTFIT, BLAST, FASTA,和TFASTA,第8版(可从美国威斯康星州麦迪逊市575Science Drive的GeneticsComputer Group (GCG)获得)可以用缺省参数以这些程序进行比对。Higgins等人(1988)Gene73:237244(1988)、Higgins 等人(1989)CAB10S5:151153、Corpet 等人(1988)NucleicAcids Res.16:1088190、Huang 等人(1992) CAB10S8:15565,和 Pearson 等人(1994) MetLMol.Biol.24:307331中详细描述了 CLUSTAL程序。ALIGN程序是基于上述Myers和Miller (1988)的算法。当比较氨基酸序列时,可以将PAM120权重残基表、间隙长度罚分12,和间隙罚分 4 与 ALIGN 程序一起使用。Altschul 等人(1990) J.Mol.Biol.215:403 的BLAST程序是基于上述Karlin和Altschul (1990)的算法。BLAST核苷酸搜索能以BLASTN程序,得分=100,字长=12执行,以获得与编码本发明的蛋白的核苷酸序列同源的核苷酸序列。BLAST蛋白搜索能以BLASTX程序,得分=50,字长=3执行,以获得与本发明的蛋白或多肽同源的氨基酸序列。为了获得用于比较目的的间隙比对,可以利用Altschul等人(1997) Nucleic Acids Res.25:3389 中描述的 Gapped BLAST (在 BLAST2.0 中)。可选地,PS1-BLAST (在BLAST2.0中)可以用于执行迭代搜索,迭代搜索检测分子间的距离关系。参见上述 Altschul 等人(1997)的文献。当利用 BLAST、Gapped BLAST,或 PS1-BLAST 时,可以利用各个程序(例如,用于核苷酸序列的BLASTN,用于蛋白的BLASTX)的缺省参数。参见http:"www.ncb1.nlm.nih.rov。I:匕对也可以通过审视手动执--。[0083]在此使用的序列一致性或在两条核酸或多肽序列的背景下的一致性指的是当在指定的比较窗口比对最大相符度时,两条序列的残基相同。当序列一致性的百分比与蛋白相关时,不一致的并且通常是因保守的氨基酸替换而不同的残基位置不改变该分子的功能特性,其中氨基酸被具有相似化学性质(例如,电荷或疏水性)的其它氨基酸残基替换,这是公认的。当保守替换中的序列有区别时,可将序列一致性百分比向上调节以修正替换的保守性。在这些保守替换中有区别的序列被认为是具有序列相似性或相似性。本领域技术人员周知进行调节的方法。通常,这涉及将保守替换作为部分而不是完全错配打分,从而提高序列一致性百分比。因此,例如,一致的氨基酸给I分,而非保守替换给O分,保守替换给O和I之间的分数。例如,在程序PC/GENE中执行保守替换的打分(加州山景城的Intelligenetics)
[0084]可以用标准分子生物技术包括薄层色谱和高效液相色谱分析酶促产物,评估酶变体的功能活性。可以用底物包括纤维二糖,结晶纤维素,比如Avicel(TM)和木质纤维素材料确定酶催化活性。
[0085]CDH-血红素结构域
[0086]在此提供含有⑶H-血红素结构域的多肽。在此使用的“⑶H-血红素结构域”指的是具有与CDH蛋白质的血红素结构域的氨基酸序列一致或同源的氨基酸序列的多肽。CDH-血红素结构域特征明显并且对本领域技术人员是周知的。已经确定来自Phanerochaete chrysosporiumCDH蛋白质的CDH-血红素结构域的晶体结构(Hallberg, B.M.et al.Structure (9), pp.79-88 (2000);和(Zamocky, Μ.et al., Curr.Prot.Pept.Sc1.,(7),3, pp.255-280, (2006))),并且已经鉴定许多CDH-血红素结构域的序列。CDH-血红素结构域氨基酸序列的例子包括SEQ ID NOs: 1-23,70 (N.crassa CDH-1血红素)、76 (N.crassa CDH-2 血红素)>80 (M.thermophila CDH-1 血红素),和 86 (M.thermophila CDH-2血红素)。
[0087]⑶H-血红素结构域的长度为大约175-225个氨基酸,并且具有通过甲硫氨酸和组氨酸残基协调的血红素辅基。 此外,由于血红素基团的保守的甲硫氨酸/组氨酸的协调作用,⑶H-血红素结构域具有保守的光谱特性。可以通过各种技术,包括与已知的⑶H-血红素结构域的氨基酸或核酸序列的同源性、与已知的CDH-血红素结构域比较光谱特性,与已知的⑶H-血红素结构域比较三维结构,鉴定⑶H-血红素结构域。本领域技术人员可以理解,具有低氨基酸序列相似性的多肽仍可以具有高相似性的光谱特性和/或三维结构。
[0088]在此提供的“CDH-血红素结构域”包括具有SEQ ID NOs: 1-23、70 (N.crassaCDH-1 血红素)、76 (N.crassa CDH-2 血红素)、80 (M.thermophila CDH-1 血红素)、86 (M.thermophila⑶H-2血红素)中提供的氨基酸序列的多肽。“⑶H-血红素结构域”还包括与SEQ ID N0s:l-23、70、76、80、86 中的任何多肽具有至少约 4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,序列一致性 / 序列相似性的多肽。“⑶H-血红素结构域”还包括具有通过甲硫氨酸和组氨酸残基协调的血红素基团,并且具有使本领域技术人员将该多肽鉴定为SEQ ID N0s:l-23、70、76、80、86中的任何多肽的同源物或直系同源物的光谱特性和/或三维特征的多肽。
[0089]纤维素结合模块(CBM)
[0090]在此还提供含有纤维素结合模块(CBM)的多肽。CBM为采用具有碳水化合物结合活性的三维构造,并且可以为具有碳水化合物相关酶促活性的更大的蛋白质的一部分的氨基酸序列。在此使用的“CBM”指的是任何与碳水化合物结合活性具有非连续折叠的多肽。在一个方面,本公布的CBM可以结合纤维素。
[0091]基于氨基酸序列,蛋白质折叠结构,和/或结合特性,已经将CBM整理成各种CBM“家族”。例如,在 Boraston A.et al., Biochem.J.382, pp.769-781 (2004)和 Shoseyov0.et al., Micr0.Mol.Biol.Rev.(70) 2,pp.283-295 (2006)中提供关于 CBM 的信息。
[0092]本发明的CBM包括“CBM家族I”的CBM。CBM家族I的CBM的长度为约40个氨基酸,并且几乎只在真菌中天然存在。CBM家族I的CBM具有特征明显的纤维素结合特性。CBM家族I的CBM也具有美国国家生物技术信息中心(National Center forBiotechno logy Informat ion, NCBI)保守结构域的标识符:cl02521,和 NCBI 名称:CBM_1。CBM家族I的CBM还具有InterPro蛋白质数据库登录号:IPR000254,以及Pfam蛋白质数据库家族编号:pf00734。
[0093]本发明的CBM还包括“CBM家族2”的CBM。CBM家族2的CBM的长度为约100个氨基酸,并且主要在细菌中天然存在。CBM家族2的CBM具有特征明显的纤维素结合特性。CBM家族2的CBM也具有NCBI保守结构域的标识符:cl02709,和NCBI名称:CBM_2。CBM家族2的CBM还具有InterPro蛋白质数据库登录号:IPR001919,以及Pfam蛋白质数据库家族编号:pf00553。
`[0094]本发明的CBM还包括“CBM家族3”的CBM。CBM家族3的CBM的长度为约150个氨基酸,并且在细菌中天然存在。CBM家族3的CBM具有特征明显的纤维素结合特性。CBM家族3的CBM也具有NCBI保守结构域的标识符:cl03026,和NCBI名称:CBM_3。CBM家族3的CBM还具有InterPro蛋白质数据库登录号:IPR001956,以及Pfam蛋白质数据库家族编号:pfam00942。
[0095]本发明的CBM还包括“CBM家族8”的CBM。已经在黏液菌(slime mold)Dictyostelium discoideum 中鉴定 CBM 家族 8 的 CBM。例如,GenBank 登录号 AAA52077.1的多肽含有CBM家族8的CBM。
[0096]本发明的CBM还包括“CBM家族9”的CBM。CBM家族9的CBM的长度为约170个氨基酸,并且已经在木聚糖酶中鉴定。CBM家族9的CBM包括NCBI保守结构域的标识符:cd00005、cd09620,以及 cd09619,和 NCBI 名称:CBM9_like_l、CBM9_like_3,和 CBM9_like_4。CBM家族9的CBM还包括InterPro蛋白质数据库登录号:IPR003305,以及Pfam蛋白质数据库家族编号:pf02018。
[0097]本发明的CBM还包括“CBM家族10”的CBM。CBM家族10的CBM的长度为约50个氨基酸。CBM家族10的CBM具有NCBI保守结构域的标识符:cl07836,和NCBI名称:CBM_10。CBM家族10的CBM还具有InterPro蛋白质数据库登录号:IPR002883,以及Pfam蛋白质数据库家族编号:pfam02013。
[0098]本发明的CBM还包括“CBM家族11”的CBM。CBM家族11的CBM的长度为约180-200个氨基酸。CBM家族11的CBM具有NCBI保守结构域的标识符:cl04062,和NCBI名称:CBM_11。CBM家族11的CBM还具有Pfam蛋白质数据库家族编号:pfam03425。
[0099]本发明的CBM还包括“ CBM家族16”、“ CBM家族30”、“ CBM家族37”、“ CBM家族44”、“CBM 家族 46,,、“ CBM 家族 49,,、“ CBM 家族 59”,和 “CBM 家族 28” 的 CBM0
[0100]本发明的CBM还包括“CBM家族4”的CBM。CBM家族4的CBM的长度为约150个氨基酸,并且在细菌中天然存在。CBM家族4的CBM具有NCBI保守结构域的标识符:cl03406,和NCBI名称:CBM_4_9。CBM家族4的CBM还具有InterPro蛋白质数据库登录号:IPR003305,以及Pfam蛋白质数据库家族编号:pfam02018。
[0101]本发明的CBM还包括“CBM家族6”的CBM。CBM家族6的CBM的长度为约120个氨基酸。CBM家族6的CBM具有NCBI保守结构域的标识符:cl02697,和NCBI名称:CBM_6。CBM家族6的CBM还具有InterPro蛋白质数据库登录号:IPR005084,以及Pfam蛋白质数据库家族编号:pfam03422。
[0102]本发明的CBM还包括“CBM家族17”的CBM。CBM家族17的CBM的长度为约200个氨基酸。CBM家族17的CBM具有NCBI保守结构域的标识符:cl04061,和NCBI名称:CBM_17_28。CBM家族17的CBM还具有InterPro蛋白质数据库登录号:IPR005086,以及Pfam蛋白质数据库家族编号:pfam03424。
[0103]本发明的CBM还包括具有 N.crassa CDH-1 的 CBM 或 M.thermophila CDH-1 的 CBM的氨基酸序列的多肽。SEQ ID NO: 74提供了 N.crassa CDH-1的CBM的氨基酸序列,而SEQID N0:84 提供了 M.thermophila Q)H_1 的 CBM 的氨基酸序列。
[0104]本发明的CBM 结构域包括与 SEQ ID NO:74(N.crassa CDH-1 的 CBM)或 SEQ IDNO: 84 (M.thermophila C`DH-1 的 CBM)多肽具有至少约 50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,或全部(100%)序列一致性/或序列相似性的重组多肽。
[0105]脱氢酶结构域
[0106]在此还提供含有脱氢酶结构域的多肽。在此,脱氢酶结构域也指的是“氧化结构域”。在此,含有脱氢酶结构域的多肽也指的是“脱氢酶”。脱氢酶可以氧化底物(例如,使底物失去电子/增加氧化值),并且还原受体(例如,使受体获得电子/降低氧化值)。
[0107]本发明的脱氢酶结构域为GMC氧化还原酶超家族的脱氢酶结构域。本发明的脱氢酶结构域也包括GMC氧化还原酶N超家族的脱氢酶结构域。GMC氧化还原酶N超家族脱氢酶结构域的NCBI保守结构域标识符为:cl02950,和NCBI名称:GMC_oxred_N。GMC氧化还原酶N超家族脱氢酶结构域的Pfam蛋白质家族编号为:pf00732。本发明的脱氢酶结构域还包括GMC氧化还原C超家族的脱氢酶结构域。GMC氧化还原酶C超家族脱氢酶结构域的NCBI保守结构域标识符为:cl08434,和NCBI名称:GMC_oxred_C。GMC氧化还原酶C超家族脱氢酶结构域的Pfam蛋白质家族编号为:pf00732。
[0108]本发明的脱氢酶结构域包括N.crassa CDH-1> N.crassa CDH-2、M.thermophilaCDH-1, M.thermophila CDH-2 的脱氧酶结构域。在 N.crassa 和 M.thermophila CDH 脱氢酶结构域中存在黄素基团。在此使用的N.crassa CDH-1、M.thermophila Q)H_1的脱氢酶结构域和同源CDH蛋白质也指的是“黄素”结构域。[0109]本发明的另一脱氢酶结构域为Coprinopsis cinera( “C.cinera”)多肽XP_001837973.KSEQID NO:50)的葡萄糖/山梨糖酮(sorbosone)脱氢酶结构域,其具有CDH类血红素结构域、葡萄糖/山梨糖酮(sorbosone)脱氢酶结构域,和真菌纤维素结合结构域。SEQ ID NO:51中提供了 XP_001837973.1的脱氢酶结构域的序列。
[0110]本发明的脱氢酶结构域包括与SEQ ID NO: 72 (N.crassa CDH-1的脱氢酶结构域)、SEQ ID NO: 78 (N.crassa CDH-2 的脱氢酶结构域)、SEQ ID NO: 82 (M.thermophila CDH-1的脱氢酶结构域)、SEQ ID NO: 88 (M.thermophila CDH-2的脱氢酶结构域),或SEQ IDN0:51(C.cineraXP_001837973.1的脱氢酶结构域)的多肽具有至少约50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,或全部(100%)序列一致性/序列相似性的重组多肽。
[0111]本发明的多肽
[0112]在此使用的“多肽”为包括多个连续聚合的氨基酸残基(例如,至少约15个连续聚合的氨基酸残基)的氨基酸序列。该多肽可选择地包括修饰的氨基酸残基,不是密码子编码的天然存在的氨基酸残基,和非天然存在的氨基酸残基。
[0113]在此使用“蛋白质”指的是无论是天然存在还是合成的氨基酸序列、寡肽、肽、多肽、或者其部分。
[0114]在此使用的“非天然存在”的多肽指的是这样的多肽序列:在自然界中没有发现其全部氨基酸序列(即,即使多肽含有已经发现在自然界中存在的一个或更多个子序列,如果没有发现在自然界中存在该多肽的全部氨基酸序列,则该多肽被认为是在此使用的“非天然存在的”多肽)。
[0115]在此使用的“重组”多肽指的是以下至少一个为真的多肽序列:(a)多肽序列对给定的宿主细胞是外来的(即,不是宿主细胞中天然存在的);(b)可能在给定的宿主细胞中发现该多肽的序列天然存在,但其数量是非天然的(例如,比预期的更大);或(C)在自然界中不存在该多肽的全部序列。
[0116]在此使用的从天然存在的序列“衍生的”多肽序列可以与天然存在的序列一致,或其可以与天然存在的序列不同。
[0117]⑶H-血红素结构域多肽
[0118]在此提供⑶H-血红素结构域多肽。在此使用的“⑶H-血红素结构域多肽”包括具有⑶H-血红素结构域的任何多肽。
[0119]⑶H-血红素结构域多肽包括重组⑶H蛋白质。⑶H-血红素结构域多肽还包括非天然存在的⑶H-血红素结构域多肽(如下文所述)。⑶H-血红素结构域多肽可以缺失CBM和脱氢酶结构域。
[0120]非天然存在的⑶H-血红素结构域多肽
[0121]在此提供非天然存在的⑶H-血红素结构域多肽。非天然存在的⑶H-血红素结构域多肽为含有CDH-血红素结 构域并且在自然界中没有发现其全部氨基酸序列的任何多肽天然存在。
[0122]非天然存在的CDH-血红素结构域多肽可以含有两条或更多条这样的多肽子序列和/或结构域:在自然界中存在,但在非天然存在的CDH-血红素结构域多肽链中相互之间的关系与自然界中存在的相互之间的关系不同。在一种形式中,比起天然存在的多肽,非天然存在的CDH血红素多肽链中的非天然存在的子序列和/或结构域被更少的氨基酸分离。另一形式中,比起天然存在的多肽,在非天然存在的CDH血红素多肽链中非天然存在的子序列和/或结构域被更多的氨基酸分离。在另一形式中,在非天然存在的CDH血红素多肽链中,非天然存在多肽的子序列和/或结构域的顺序不同于天然存在的多肽的子序列和/或结构域的顺序。在另一形式中,在非天然存在的CDH血红素多肽链中,非天然存在的多肽的子序列和/或结构域的顺序不同于天然存在的多肽的子序列和/或结构域的顺序。在另一形式中,非天然存在的多肽的子序列和/或结构域不同时出现在天然存在的多肽中。
[0123]含有⑶H-血红素结构域和CBM的非天然存在的多肽
[0124]在此提供具有⑶H-血红素结构域和CBM的非天然存在的⑶H-血红素结构域多肽。具有⑶H-血红素结构域和CBM的⑶H-血红素结构域多肽能可选地包括脱氢酶结构域。
[0125]在具有⑶H-血红素结构域和CBM的非天然存在的多肽中,⑶H-血红素结构域可以直接与多肽链的CBM连接。在其它形式中,CDH-血红素结构域和CBM在多肽链中可以被一个或更多个氨基酸分开。在其它方面,CDH-血红素结构域和CBM可以被多肽链中约1、2、
3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950,或 1000 个氨基酸分开。
[0126]在具有CDH-血红素结构域和CBM的非天然存在的多肽的多肽链中可以以任何顺序设置⑶H-血红素结构域和CBM。例如,⑶H-血红素结构域可以在多肽链上的CBM的N端,或在多肽链上的CBM的C端。`
[0127]具有⑶H-血红素结构域和CBM的非天然存在的多肽的⑶H-血红素结构域和CBM可以从同类CDH蛋白质(例如,从相同的CDH基因冲衍生。例如,CDH-血红素结构域和CBM可以从N.crassa CDH-1 (SEQ ID NO:32)中衍生,使得CDH-血红素结构域具有SEQ ID NO:70序列并且CBM具有SEQ ID N0:74序列。作为另一例子,⑶H-血红素结构域和CBM可以从M.thermophila CDH-1 (SEQ ID NO: 46)中衍生,使得 CDH-血红素结构域具有 SEQ ID NO: 80序列并且CBM具有SEQ ID NO:84序列。
[0128]在另一形式中,具有⑶H-血红素结构域和CBM的非天然存在的多肽的⑶H-血红素结构域和CBM不是从同类⑶H蛋白质中衍生。例如,⑶H-血红素结构域可以从⑶H蛋白质衍生,并且CBM可以从非⑶H蛋白质衍生。在另一例子中,⑶H-血红素从一类⑶H蛋白质中衍生,并且CBM从不同类的⑶H蛋白质(例如,两种不同的⑶H基因的⑶H)中衍生。
[0129]具有CDH-血红素结构域和CBM的非天然存在的多肽在增强纤维素的降解上比缺失CBM的相应的或相似的多肽更有效。具有CDH-血红素结构域和CBM的非天然存在的多肽在增强纤维素的降解上比缺失CBM的相应的或相似的多肽效率高至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%、300%、350%、400%、450%、500%、550%、600%、650%、700%、750%、800%、850%、900%、950%,或 1000%。
[0130]第一多肽比第二多肽在增强纤维素的降解上更有效的例子包括,但不限于:i)如果将相同分子量的第一和第二多肽提供给反应条件相同的、含纤维素酶的、两个单独的反应(从而将第一多肽添加至一个反应,而第二多肽添加至另一反应),该第一多肽在其反应中,对纤维素降解速率的提高比该第二多肽在其反应中对纤维素降解速率的提高更多;ii)如果将相同分子量的第一和第二多肽提供给反应条件相同的、含纤维素酶的、两个单独的反应(从而将第一多肽添加至一个反应,而第二多肽添加至另一反应),该第一多肽在其反应中对纤维素降解范围的增加比该第二多肽在其反应中对纤维素降解范围的增加更多;iii)在含纤维素酶的反应中使纤维素降解速率提高至纤维素降解目标速率,所需的第一多肽比第二多肽更少。
[0131]还提供在纤维素降解上,比缺失CBM的相应或相似的多肽增强更多的、具有CDH-血红素结构域和CBM的非天然存在的多肽。例如,在相同的反应条件下,具有CDH-血红素结构域和CBM的非天然存在的多肽可以比缺失CBM的相应或相似的多肽在纤维素降解上增强约 10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%、300%、350%、400%、450%、500%、550%、600%、650%、700%、750%、800%、850%、900%、950%,或 1000%。
[0132]具有CDH-血红素结构域和CBM但缺失脱氢酶结构域的非天然存在的多肽在纤维素酶反应中可以比具有脱氢酶结构域的其它相应的多肽引起更少的氧化损伤。
[0133]含有⑶H-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽
[0134]还提供具有⑶H-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽。
[0135]在这些多肽中,⑶H-血红素结构域、CBM,和脱氢酶结构域可以直接连接在多肽链上。可选地,在多肽链中,CDH-血红素结构域、CBM,和脱氢酶结构域中的一个或多个可以被一个或多个氨基酸分开。例如,CDH-血红素结构域、CBM,和脱氢酶结构域可以通过多肽链中约 1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950,或 1000 个氨基酸使彼此分开。`
[0136]在具有⑶H-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽中,⑶H-血红素结构域、CBM,和脱氢酶结构域在多肽链中能以任何顺序排列。例如,CDH-血红素结构域可以在多肽链的CBM和脱氢酶结构域两者的N端,或其可以在多肽链的CBM和脱氢酶结构域两者的C端,或其可以在多肽链的CBM和脱氢酶结构域之间。类似地,CBM可以在多肽链的CDH-血红素结构域和脱氢酶结构域两者的N端,或其可以在多肽链的CDH-血红素结构域和脱氢酶结构域两者的C端,或其可以在多肽链的CDH-血红素结构域和脱氢酶结构域之间。类似地,脱氢酶结构域可以在多肽链的⑶H-血红素结构域和CBM两者的N端,或其可以在多肽链的⑶H-血红素结构域和CBM两者的C端,或其可以在多肽链的⑶H-血红素结构域和CBM之间。
[0137]在具有⑶H-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽中,⑶H-血红素结构域、CBM,和脱氢酶结构域可以从同类CDH蛋白质(例如,从相同的CDH基因)衍生。
[0138]可选地,在具有⑶H-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽中,⑶H-血红素结构域、CBM,和脱氢酶结构域不是从同类⑶H蛋白质衍生。在一种形式中,CDH-血红素结构域和脱氢酶结构域从同类CDH蛋白质衍生,而CBM从非CDH蛋白质衍生。在另一形式中,CDH-血红素结构域、CBM,和脱氢酶结构域各自从不同类的CDH蛋白质(例如,从三种不同的⑶H基因)衍生。在另一形式中,⑶H-血红素结构域和CBM从同类⑶H蛋白质衍生,并且脱氢酶结构域从非⑶H蛋白质衍生。
[0139]在具有⑶H-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽中,⑶H-血红素结构域和CBM可以从N.crassa CDH_1(分别为SEQ ID NO: 70和SEQ ID NO: 74)衍生,而脱氢酶结构域可以从非⑶H蛋白质衍生。在另一形式中,⑶H-血红素结构域和CBM从N.crassaO)H-l衍生,而脱氢酶结构域从来自C.cinerea(SEQ ID N0:51)的假定的葡萄糖/山梨糖脱氢酶衍生。
[0140]在另一形式中,在具有⑶H-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽中,CDH-血红素结构域和 CBM可以从M.thermophila CDH-1 ((SEQ ID N0:80 和 SEQ IDNO:84)衍生,而脱氢酶结构域可以从非⑶H蛋白质衍生。在另一形式中,⑶H-血红素结构域和CBM从M.thermophila CDH-1衍生,而脱氢酶结构域从来自C.cinerea(SEQ ID N0:51)的假定的葡萄糖/山梨糖脱氢酶衍生。
[0141]在具有⑶H-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽中,⑶H-血红素结构域和脱氢酶结构域可以从缺乏CBM的同类⑶H蛋白质衍生,而CBM可以从⑶H或非CDH蛋白质衍生。在一个方面,在具有CDH-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽中,⑶H-血红素结构域和脱氢酶结构域可以从N.crassa⑶H_2衍生,而CBM从⑶H或非⑶H蛋白质衍生。在另一方面,在具有⑶H-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽中,⑶H-血红素结构域和脱氢酶结构域从N.crassa⑶H_2衍生,而CBM从⑶H或非⑶H蛋白质衍生。在另一方面,在具有⑶H-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽中,⑶H-血红素结构域和脱氢酶结构域从M.thermophila⑶H-2衍生,而 CBM 从 N.crassa 或 M.thermophila CDH-1 蛋白质衍生。
[0142]在一种形式中,在具有⑶H-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽中,CDH-血红素结构域和脱氢酶结构域从N.crassa CDH_2(分别为SEQ ID N0:76和SEQ IDNO: 78)衍生,而 CBM 从 N.crassa 或 M.thermophila CDH-1 蛋白质(分别为 SEQ IDNO:74 或 SEQ ID NO:84)衍生。
[0143]在另一种形式中,在具有CDH-血红素结构域、CBM,和脱氢酶结构域的非天然存在的多肽中,⑶H-血红素结构域和脱氢酶结构域从M.thermophila⑶H_2(分别为SEQ IDNO:86 和 SEQ ID NO:88)衍生,而 CBM 从 N.crassa 或 M.thermophila CDH-1 蛋白质(分别为 SEQ ID NO:74 或 SEQ ID NO:84)衍生。
[0144]本发明的非天然存在的CDH-血红素结构域多肽可以进一步包括任何另外的多肽序列。本发明的非天然存在的CDH-血红素结构域多肽可以另外包括,但不限于,用于分泌多肽的信号肽,和/或用于蛋白质纯化的多肽“标签”。
[0145]提供一种含有⑶H-血红素结构域和CBM的组合物,其中⑶H-血红素结构域和CBM不是相同多肽链的一部分,并且不共价连接,但⑶H-血红素结构域和CBM通过非共价相互作用力稳定地相互作用。不是相同多肽链的一部分的CDH-血红素结构域和CBM可以在非共价地,例如,通过亮氨酸拉链基序,稳定地相互作用的两条单独的多肽上。
[0146]亮氨酸拉链基序对本领域技术人员来说是周知的,并且是参与多肽的二聚化的普通结构。亮氨酸拉链基序在基序的大约每第7位氨基酸具有亮氨酸残基,并且形成α螺旋,通过α螺旋,这两个二聚化部分相互作用。
[0147]GH61 多肽[0148]还在此提供重组GH61多肽。本发明的重组GH61多肽的例子为具有GH61-1/NCU02240(SEQID NO: 24)、GH61-2/NCU07898 (SEQ ID NO: 26)、GH61-4/NCU01050 (SEQ IDNO:30), GH61-5/NCU08760(SEQ ID NO: 28)、NCU02916 (SEQ ID NO: 64)、NCU00836 (SEQ IDNO: 90),或其子序列的氨基酸序列的多肽。
[0149]本发明提供与SEQ ID NO: 24 (GH61-1/NCU02240)、SEQ ID NO: 26 (GH61-2/NCU07898)、 SEQ ID NO:28(GH61-5/NCU08760), SEQ ID NO:30(GH61-4/NCU01050)、NCU00836 (SEQ ID N0:90),或 SEQ ID N0:64(NCU02916)的多肽具有至少约 0%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,或完全的(100%)序列一致性/序列相似性的重组多肽。
[0150]本发明的GH61多肽还包括重组多肽,该重组多肽为GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU00836,和 NCU02916 的多肽的保守修饰的变体。在此使用的“保守修饰的变体”包括单独的取代,缺失或插入至多肽序列,这导致氨基酸被化学性质相似的氨基酸取代。本领域已知提供功能相似的氨基酸的保守取代表。这种保守修饰的变体并不排除本发明的多态变体、种间同源物、等位基因。以下八组包含彼此为保守取代的氨基酸的例子:1)丙氨酸(A),甘氨酸(G) ;2)天冬氨酸(D),谷氨酸(E) ;3)天冬酰胺(N),谷氨酰胺(Q) ;4)精氨酸(R),赖氨酸(K) ;5)异亮氨酸(I),亮氨酸(L),蛋氨酸(M),缬氨酸(V) ;6)苯丙氨酸(F),酪氨酸(Y),色氨酸(W) ;7)丝氨酸(S),苏氨酸⑴;以及8)半胱氨酸(C),蛋氨酸(M)(参见,例如Creighton, Proteins (1984))。
[0151]本发明提供与NCU02240或NCU01050同源或直系同源的GH61多肽。图17提供与NCU02240或NCU01050同源的多肽的序列比对,而图18展示了选定的GH61蛋白质与NCU02240或NCU01050的最大似然系统系统发育。
[0152]共享与NCU02240`和NCU01050的多肽有一些区别的基序的蛋白质可以称为属于“NCU02240/NCU01050进化枝”。可以通过使第二序列与NCU02240或NCU01050参考序列比较,例如,通过BLAST序列比对,和通过鉴定在第二序列中的基序,鉴定作为NCU02240/NCUO1050进化枝成员的蛋白质。
[0153]在此提供的属于“NCU02240/NCU01050进化枝” GH61多肽在多肽序列中具有以下基序中的3个或更多个、四个或更多个、5个或更多个、6个或更多个,或所有的7个:
[0154]基序1:HTIF (SEQ ID N0:34),(与信号肽被剪切后的NCU02240多肽的第1_4位的残基对应)。
[0155]基序2:R-X-P-[ST]-Y-[ND]-G-P(SEQ ID NO: 35);(与信号肽被剪切后的NCU02240多肽的第21-28位的残基对应);其中X为任何氨基酸,[ST]为S或T,而[ND]为N或D。
[0156]基序3:C-N-G-X-P-N-[PT]-[TV](SEQ ID NO: 36);(与信号肽被剪切后的NCU02240多肽的第39-46位的残基对应);其中X为任何氨基酸,[PT]为P或T,而[TV]为T或V。
[0157]基序4:D-X-X-D-X-[ST]-H-K-G-P-[TV]-X-A-Y-[LM]-K-K-V (SEQ ID N0:37);(与信号肽被剪切后的NCU02240多肽的第75-92位的残基对应);其中X为任何氨基酸,[ST]为S或T,[TV]为T或V,而[LM]为L或M。在不被理论限制的情况下,从文献中的结构特征得知该基序中的组氨酸结合基本的金属离子。[0158]基序5:G-W-[FY]-K-1-[QS] (SEQ ID NO:38);(与信号肽被剪切后的 NCU02240 多肽的第104-109位的残基对应);其中[FY]为F或Y,而[QS]为Q或S。在不被理论限制的情况下,这些残基远离预测的活性位点,并且被认为对NCU02240/NCU01050进化枝的结构稳定性是重要的。
[0159]基序6:
[0160]1-P-X-C-1-X-X-G-Q-Y-L-L-R-[AG]-E-[ML]-[IL]-A-L-H-X-A-X-X-X-X-G-A-Q-[FL]-Y-M-E-C-A-Q-[IL]-N-[IV]-V-G-G (SEQ ID NO:39);(与信号肽被剪切后的 NCU02240 多肽的第134-177位的残基对应);其中X为任何氨基酸,[AG]为A或G,[ML]为M或L,[IL]为I或L,[FL]为F或L,[IL]为I或L,而[IV]为I或V。在该基序中的第一个半胱氨酸在二硫键中。基序中的组氨酸靠近预测的活性位点并且在几乎所有的GH61中高度保守。基序中部的谷氨酰胺在所述的GH61蛋白质中绝对保守并且从文献中可知,其对活性是重要的。基序中的第二个酪氨酸非常靠近基本的活性位点金属并且在许多GH61进化枝中高度保守。
[0161]基序7:T-[VY]-S-[FI]-P-G-[Al]-Y-X-X-X-D-P-G-X-X-X-X-[IL]-Y(SEQ IDNO:40);(与信号肽被剪切后的NCU02240多肽的第185-204位的残基对应);其中X为任何氨基酸,[VY]为V或Y,[FI]为F或I,并且[Al]为A或I。在不被理论限制的情况下,基序中最后的酪氨酸(在最后位置)被认为对底物结合是重要的。
[0162]在上述基序中,采用公认的IUPAC氨基酸单字母缩写。
[0163]作为“NCU02240/NCU01050进化枝”的成员的GH61多肽的例子包括,但不限于,SEQIDNOs:24、30、52、53、54、55、56、57、60、63、66、68,69 的多肽。
[0164]本发明进一步提供作为NCU02240/NCU01050进化枝成员的GH61多肽的保守修饰 变体。
[0165]在此公开的GH61多肽包括含有基序H-X(4_8)-Q-X-Y(SEQ ID N0:92)的多肽,其中X为任何氨基酸,而X(4-8)为从4至8的任何数目。该基序中的H与信号序列被剪切之后的NCU02240多肽的第153位残基对应。该基序的H、Q和Y残基对结合铜、底物结合/定位,和/或作为普通的酸可以是重要的。在GH61多肽中,该基序的H、Q和Y残基中的任何一个产生突变可以明显损害GH61多肽的功能。
[0166]本发明的GH61多肽包括GH61多肽序列的全长cDNA翻译本,以及缺失信号肽的相应的GH61多肽序列。当最初在细胞中翻译出来时,本发明的所有GH61多肽具有N端短信号肽,该信号肽用于该多肽的胞外分泌。当GH61多肽转运到细胞外时,裂解原翻译的GH61多肽得到该多肽。
[0167]本领域知晓鉴定GH61多肽上的信号肽的方法,比如利用SignalP预测工具,参见,例如 “Locating proteins in the cell using TargetP, SignalP, and relatedtools,,Olof EmanueIsson, Saren Brunak, Gunnar von Hei jne, Henrik Nielsen NatureProtocols〗, 953-971 (2007)。
[0168]预测的信号肽的手动验证应该显示在信号肽剪切之后所有成熟的GH61多肽含有N端组氨酸。如果SignalP预测的N端 残基不是组氨酸,应该进行GH61的手动预测,而这可以通过查找从N端算起第10-30位的氨基酸,通常为从N端算起第15-25位的氨基酸附近的组氨酸而完成。[0169]该组氨酸对金属结合是必须的,并且该组氨酸通过咪唑侧链和N端胺连接催化所需的金属。因此,缺失N端组氨酸的任何GH61序列因其缺失(或由于不合适的信号剪切事件产生的N端上的补充序列)而丧失功能。
[0170]信号肽构成SEQ ID:24(NCU02240)第 1-15 位的氨基酸、SEQ ID NO: 26 (NCU07898)第1-15位的氨基酸、SEQ ID N0:28(NCU08760)第1-20位的氨基酸、SEQ IDN0:30(NCU01050)第 1-15 位的氨基酸、SEQ ID NO:64(NCU02916)第 1-16 位的氨基酸,和SEQ ID N0:90(NCU00836)第 1-18 位的氨基酸。
[0171]在此提供NCU02240/NCU01050进化枝的GH61多肽和具有完整信号肽的GH61多肽NCU02240、NCU07898、NCU08760、NCUO1050、NCU02916 和 NCU00836。还在此提供 NCU02240/NCUO1050进化枝的GH61多肽和缺乏信号肽的GH61多肽NCU02240、NCU07898、NCU08760、NCUO1050、NCU02916 和 NCU00836。
[0172]GH61多肽与铜结合
[0173]在此提供与铜原子结合的GH61多肽。可以与铜原子结合的GH61多肽包括,但不限于:GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、GH61-6/NCU02916,和 GH61-3/NCU00836。
[0174]还在此提供含有多种重组GH61多肽的组合物,其中50%或更多的GH61多肽与铜原子结合。进一步在此提供含有多种重组GH61多肽的组合物,其中55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,或 100% 的 GH61 多肽与铜
原子结合。
[0175]还提供含有多种`重组GH61多肽的组合物,其中在该组合物中铜原子与GH61蛋白质的比率为0.5至I (即,每两个GH61蛋白质一个铜原子)或者更高。在一种形式中,提供含有多种重组GH61多肽的组合物,其中在该组合物中铜原子与GH61蛋白质的比率为0.6、0.7,0.8,0.9、I (即每个 GH61 蛋白质一个铜原子)、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、
1.9、2、3、4、5、6、7、8、9、10 (即,每个GH61蛋白质十个铜原子),或更高,至I。在铜原子与GH61蛋白质的比率在I以上的组合物中,在该组合物中至少一些铜原子不与GH61蛋白质结合。在不被理论限制的情况下,单个铜原子可以稳定地与每个GH61蛋白质结合。
[0176]本发明的多聚核苷酸
[0177]在此使用的术语“多聚核苷酸”,“核酸序列”,“核酸的序列”及其变体通用于多聚脱氧核糖核苷酸(含有2-脱氧-D-核糖),多聚核糖核苷酸(含有D-核糖),或是嘌呤或嘧啶碱基的N-糖苷的其他类型的多聚核苷酸,以及含有非核苷酸骨架的其他聚合物,唯有该聚合物含有核碱基,在该结构中允许碱基配对和碱基堆积,如DNA和RNA。因此,这些术语包括已知类型的核酸序列修饰,例如用类似物取代一个或多个天然存在的核苷酸;核苷酸间的修饰(inter-nucleotide modifications)。在此使用的用于核苷酸和多聚核苷酸的标记为生化命名委员会IUPAC-1UB推荐的那些标记。
[0178]可通过本领域已知的任何合适的方法制备本发明的多聚核苷酸,包括,例如直接化学合成或克隆。对于直接化学合成,核酸聚合物的形成通常涉及将3’-封闭和5’-封闭的核苷酸单体顺序加入核苷酸生长链的末端5’-羟基,其中通过生长链的末端5’ -羟基在添加的单体3’ -位点上的亲和攻击实现每次添加,加入的单体通常为磷衍生物,例如磷酸三酯,亚磷酰胺等。这种方法在本领域是已知的,并在相关文本或文献中有所描述[例如,在 Matteucci et al., (1980)Tetrahedron Lett21:719-722 ;U.S.Pat.Nos.4,500, 707; 5, 436,327,和5,700, 637中]。多聚核苷酸克隆技术在本领域中是周知的,并且,例如在 Sambrook, J.et al.2000Molecular Cloning: ALaboratory Manual (第三版)中所描述的那些。简单地,多聚核苷酸克隆技术包括,但不限于,通过聚合酶链反应(PCR)扩增多聚核苷酸,通过限制性内切酶对多聚核苷酸进行酶切,和通过连接酶对多聚核苷酸进行酶催化连接。可以通过一种技术或任何技术的结合制备本发明的多聚核苷酸。
[0179]可将本发明的每种多聚核苷酸引入表达载体中。“表达载体”或“载体”指的是这样的化合物和/或组合物:该化合物和/或组合物转导、转化、或转染宿主细胞,从而使该细胞表达不是天然存在于细胞中,或者说是以非天然存在于所述细胞的核酸和/或蛋白质;。“表达载体”包含宿主细胞将表达的核酸序列(通常为RNA或DNA)。可选择地,该表达载体还包括帮助核酸进入宿主细胞的物质,例如病毒、脂质体、蛋白质衣壳、或类似物。考虑用于本发明的该表达载体包括可以插入核酸序列的这些,以及任何优选的或需要的操作元件。进一步地,该表达载体必须是可以转化至宿主细胞并在其中复制的载体。优选的表达载体为质粒,特别是具有限制性位点,已详细记载并含有核酸序列的转录优选或必须的操作元件的质粒。这些质粒,以及其他表达载体在本领域是已知的。
[0180]可通过已知的方法实现将单个多聚核苷酸引入载体中,例如,使用限制性内切酶(如BamH1、EcoR1、Hha1、Xho1、XmaI等等)以在表达载体如质粒内使特定位点裂开。该限制性内切酶产生单链末端,可退火为多聚核苷酸,该多聚核苷酸具有或合成有,带有与裂开的表达载体的末端互补的序列的末端。使用合适的酶进行退火,例如DNA连接酶。本领域技术人员将理解,表达载体和理想多聚核苷酸通常通过相同的限制性内切酶来裂解,从而确保表达载体的末端和多聚核苷酸的末端彼此互补。此外,DNA接头可用于帮助将核酸序列连接至表达载体。
[0181]本发明并不限于多聚核苷酸引入表达载体中的方法。本领域技术人员熟知用于将多聚核苷酸纳入表达载体中的必要步骤。典型的表达载体包含理想多聚核苷酸,该理想多聚核苷酸前面带有一个或多个调控区,以及核糖体结合位点,例如3-9个核苷酸长度、位于大肠杆菌起始密码子的上游3`-11个核苷酸处的核苷酸序列。见Shine and Dalgarno (1975)Nature254(5495):34-38and Steitz (1979)Biological Regulation and Development(ed.Goldberger, R.F.), 1:349-399 (Plenum, New York)。
[0182]本文中使用的术语“可操作地连接”指的是一种结构,其中控制序列位于相对于DNA序列或多聚核苷酸的编码序列的合适位置,以使控制序列引导编码序列的表达。
[0183]调控区包括,例如含有启动子和操纵子的区域。启动子可操作地连接至理想多聚核苷酸,从而通过RNA聚合酶开始多聚核苷酸的转录。操纵子是与启动子相邻的核酸序列,其包括可结合阻遏蛋白的蛋白质结合域。当不存在阻遏蛋白时,通过启动子启动转录。当存在时,对操纵子的蛋白质结合域具有特异性的阻遏蛋白结合至该操纵子,从而抑制转录。这样,根据使用的特定的调控区,以及相应阻遏蛋白的存在与不存在,实现了对转录的控制。例子包括乳糖启动子(当与乳糖接触时,Lad阻遏蛋白将改变构象,从而防止Lad阻遏蛋白结合至操纵子)和色氨酸启动子(当与色氨酸络合时,TrpR阻遏蛋白具有结合至操纵子的构象;当不存在色氨酸时,该TrpR阻遏蛋白具有不能结合至操纵子的构象)。另外例子为tac启动子(见 de Boer et al., (1983)Proc Natl Acad Sci USA80 (I): 21-25)。本领域技术人员将理解,这些或其他表达载体可用于本发明,且本发明并不限于这些。
[0184]虽然任何合适的表达载体可用于引入理想序列,但是容易获得的表达载体包括,但不限于,质粒,如 pSClOl、PBR322、pBBRlMCS-3、pUR、pEX、pMRlOO、pCR4、pBAD24、pUC19 ;噬菌体,如M13噬菌体和λ噬菌体。当然,这种表达载体可以仅仅适用于特定的宿主细胞。然而,本领域技术人员通过常规实验可以容易地确定任何特定的表达载体是否适用于任何给定的宿主细胞。例如,可将表达载体引入宿主细胞,随后检测该载体中内含有的序列的存活率和表达。此外,可参照描述表达载体和它们对任何特定的宿主细胞的适应性的相关文本和文献。
[0185]在此使用的“重组核酸”或“异源核酸”或“重组多聚核苷酸”,“重组核苷酸”或“重组DNA”指的是核酸的聚合物,其中至少以下之一是正确的:(a)核酸序列与给定宿主细胞无关(即不能自然发现);(b)该序列可在给定的宿主细胞内自然发现,但是具有非天然的含量(例如大于预期);或(c )核酸序列包括两种或多种子序列,该子序列在自然界中未发现相同的彼此之间的关系。在一方面,本发明描述了向向宿主细胞引入表达载体,其中表达载体含有用于编码不常在宿主细胞内发现的蛋白质的核酸序列,或者含有编码常在细胞中发现、但是受不同调控序列控制的蛋白质的核酸。参照宿主细胞的基因组,编码蛋白质的核酸序列为重组的。
[0186]本领域周知多肽序列和多聚核苷酸序列之间的关系。氨基酸由三个核酸的“密码子”编码;例如,在 JM Berg, JL Tymoczko, and L Stryer, Biochemistry, 5th edition(2002)中提供了编码每个核酸的密码子。因此,对本领域技术人员来说,鉴定或生成编码感兴趣的多肽序列的多聚核苷酸序列是常规的。一些氨基酸由超过一个密码子编码。在本发明的多聚核苷酸中,编码理想的氨基酸的核酸的任何序列(任何密码子)可以用于多聚核苷酸序列中。在一些方面,在宿主生物体中,优选利用某些密码子而不是编码相同氨基酸的其它密码子。
[0187]编码⑶H-血红素结构域多肽的多聚核苷酸序列
[0188]在此提供编码⑶H-血红素结构域多肽的重组多聚核苷酸。本发明的重组多聚核苷酸可以通过在此公开的用于制备多聚核苷酸的方法制备。
[0189]本发明包括编码⑶H-血红素结构域多肽的任何重组多聚核苷酸。在一种形式中,本发明包括编码非天然存在的⑶H-血红素结构域多肽的任何重组多聚核苷酸。在一种形式中,本发明的重组多聚核苷酸编码包括CDH-血红素结构域和CBM,但不包括脱氢酶结构域的非天然存在的CDH-血红素结构域多肽。在一种形式中,本发明的重组多聚核苷酸编码包括⑶H-血红素结构域,CBM和脱氢酶结构域的非天然存在的⑶H-血红素结构域多肽。
[0190]编码CDH-血红素结构域多肽的多聚核苷酸包括SEQ ID NOs: 33 (N.crassaCDH-1)、42(N.crassa CDH-2)、45(M.thermophila CDH-1)、48(M.thermophila CDH-2)、71(N.crassa CDH-1heme domain)>77(N.crassa CDH-2heme domain)>81(M.thermophilaCDH-1),和 86 (M.thermophila CDH-2)。
[0191]编码GH61多肽的多聚核苷酸
[0192]本发明包括编码GH61多肽的重组多聚核苷酸。本发明的重组多聚核苷酸包括编码GH61多肽的重组多聚核苷酸。本发明的重组多聚核苷酸包括编码在此公开的GH61多肽的任何多聚核苷酸。编码GH61多肽的重组多聚核苷酸可以通过在此公开的用于制备多聚核苷酸的任何方法制备。
[0193]本发明的多聚核苷酸包括编码SEQ ID NO: 24 (GH61-1/NCU02240)、SEQ IDN0:26(GH61-2/NCU07898), SEQ ID NO:30(GH61-4/NCU01050)、 SEQ ID NO:28(GH61-5/NCU08760)、SEQ ID NO: 64 (NCU02916)或 SEQ ID NO: 90 (NCU00836)的多肽。本发明的多聚核苷酸还包括以下的多肽:SEQ ID N0:25 (编码GH61-1/NCU02240多肽)、SEQ ID N0:27(编码 GH61-2/NCU07898 多肽)、SEQ ID N0:31 (编码 GH61-4/NCU01050 多肽)、SEQ ID NO:29(编码GH61-5/NCU08760多肽),和SEQ ID NO:91(编码NCU00836多肽)。本发明的重组多肽还包括与 SEQ ID NO:25,SEQ ID NO:27,SEQ ID N0:31、SEQ ID N0:29 JPSEQ ID N0:91 的多聚核苷酸具有至少约 50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,或全部(100%)序列一致性/序列相似性的多聚核苷酸。
[0194]本发明的多聚核苷酸进一步包括编码NCU02240/NCU01050进化枝的成员的GH61多肽的多聚核苷酸。本发明的多聚核苷酸还包括编码含有基序H-X (4-8)-Q-X-Y的GH61多肽的多聚核苷酸。
[0195]本发明的多聚核苷酸进一步包括编码GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050,GH61-5/NCU08760,NCU02916,NCU00836 的多肽的保守修饰变体的多聚核苷酸和编码NCU02240/NCU01050进化枝的GH61蛋白质的保守修饰变体的多聚核苷酸。提供编码NCU02240/NCU01050进化枝的GH61多肽和具有完整信号肽的GH61多肽NCU02240、NCU07898、NCU08760、NCUO1050、NCU02916 和 NCU00836 的多聚核苷酸。
[0196]提供编码NCU02240/NCU01050进化枝的GH61多肽和缺失完整信号肽的GH61多肽NCU02240、NCU07898、NCU08760、NCUO1050、NCU02916 和 NCU00836 的多聚核苷酸。
_7] 本发明的重组多肽的表达`和本发明的宿主细胞
[0198]本发明进一步提供的是,本发明的多肽的表达。本发明的多肽可以通过标准分子生物技术制备,例如 Sambrook, J.et al.2000Molecular Cloning:A LaboratoryManual (Third Edition)中所描述的那些。重组多肽可在转基因表达系统中表达和纯化。转基因表达系统可以是原核或真核的。在一些方面,转基因宿主细胞可以在该宿主细胞外分泌该多肽。在一些方面,转基因宿主细胞可以在宿主细胞内保留表达的多肽。
[0199]本发明的重组多肽可以部分地或基本上从宿主细胞,或从宿主细胞的生长培养基中分离出。可以利用蛋白质“标签”制备具有本发明的重组多肽,以便于蛋白质纯化,例如GST-标签或多聚组氨酸标签,还可以制备具有信号肽序列的重组多肽以引导多肽输出到细胞外部。重组多肽可以仅部分地纯化(例如,<80%纯度、<70%纯度、<60%纯度、<50%纯度、<40%纯度、<30%纯度、<20%纯度、<10%纯度、〈5%纯度)或可以纯化至高纯度(例如>99%纯度、>98%纯度、>95%纯度、>90%纯度,等)。可以通过本领域本领域技术人员已知的各种技术纯化重组多肽,这些技术包括例如,离子交换色谱法、尺寸排阻色谱法、和亲和色谱法。
[0200]本发明进一步涉及宿主细胞,该宿主细胞含有编码一种或更多种本发明的多肽的多聚核苷酸。宿主细胞可以含有编码一种或更多种CDH-血红素结构域多肽的一种或更多种多聚核苷酸和/或编码一种或更多种重组GH61多肽的一种或更多种多聚核苷酸。
[0201]提供含有重组多聚核苷酸的宿主细胞,该重组多聚核苷酸编码具有GH61-1/NCU02240 (SEQ ID NO: 24)、GH61-2/NCU07898 (SEQ ID NO: 26)、GH61-4/NCU01050 (SEQ IDNO:30), GH61-5/NCU08760(SEQ ID NO: 28)、NCU02916 (SEQ ID NO: 64)、NCU00836 (SEQ IDNO: 90)、N.crassa CDH-1 (SEQ ID NO: 32),或 M.thermophila CDH-1 (SEQ ID NO:46)的氨基酸序列的多肽。在此还提供含有两种或更多种重组多聚核苷酸的宿主细胞,该两种或更多种重组多聚核苷酸编码具有 GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916,或 NCU00836 的一种或更多种多肽和具有 N.crassa CDH-1 或M.thermophila CDH-1的氨基酸的一种或更多种多肽。
[0202]“宿主细胞”和“宿主微生物”在本文中交替地用于指生物活细胞,该生物或细胞可以通过重组DNA或RNA的插入进行转化。这种重组DNA或RNA可以在表达载体中。在此描述的宿主微生物或细胞可以是原核生物或真核细胞。
[0203]任何原核或真核宿主细胞可用于本发明,只要它在核酸序列转化后能存活。优选地,该宿主细胞不会受到必要的核酸序列转导,随后的蛋白质(转运子)的表达,或所得中间体的不利影响。合适的真核细胞包括,但不限于,真菌,植物,昆虫或哺乳动物细胞。
[0204]在某些实施例中,该宿主为真菌菌株。在此使用的“真菌”包括子囊菌门、担子菌门、壶菌门、接合菌门以及卵菌门和所有有丝分裂孢子真菌。该宿主细胞可以为酵母菌株,包括
[0205]Candida、Hansenula、Kluyveromyces、Myceliophthora> Neurospora> Pichia、Saccharomyces、Schizosaccharomyces、Trichoderma 或 Yarrowia 菌株。
[0206]可选地,该宿主细胞可以是原核的,并且在某些方面,该原核生物为E.col1、Bacillus subtilis、Zymomonas mobilis、Clostridium sp.、Clostridiumphytofermentans、ClostridiumthermocelIum> Clostridium beijerincki1、Clostridiumacetobutylicum(Moorella thermoacetica)、Thermoanaerobacterium saccharoIyticum,或 Klebsiella oxytoca。
[0207]本发明的宿主细胞可以是转基因的,其中重组核酸引入到该宿主细胞中,且这种转基因的宿主细胞不存在于自然界。合适的宿主细胞是一种能够表达编码不同功能的一种或更多种蛋白质的一种或多种核酸构建体的宿主细胞。
[0208]宿主细胞可以自然产生由本发明的多聚核苷酸编码的多肽。编码所需多肽的多聚核苷酸可以与宿主细胞是异源的,或者该多聚核苷酸可以与宿主细胞具有内源性,但是可操作地连接至异源启动子和/或控制区,导致在宿主细胞内该多聚核苷酸的更高的表达。在另一形式中,该宿主细胞不能天然地产生所需的多肽,且包括能够表达产生该多肽所需的一种或多种多聚核苷酸的异源核酸构建体。
[0209]包括重组⑶H-血红素结构域多肽和/或重组GH61多肽的组合物
[0210]在此提供包括重组GH61多肽的组合物。还在此提供包括重组⑶H-血红素结构域多肽的组合物。进一步在此提供包括重组GH61多肽和重组CDH-血红素结构域多肽的组合物。
[0211]本发明的组合物可以包括具有GH61多肽的氨基酸序列的重组多肽。在一种形式中,具有该组合物的GH61多肽的氨基酸序列的重组多肽含有基序H-X(4-8)-Q-X-Y。在一种形式中,具有该组合物的GH61 多肽的氨基酸序列的重组多肽为NCU02240/NCU01050进化枝。在一种形式中,具有该组合物的GH61多肽的氨基酸序列的重组多肽具有GH61-1/NCU02240 或
[0212]GH61-4/NCU01050的氨基酸序列。在一种形式中,具有该组合物的GH61多肽的氨基酸序列的重组多肽具有 GH61-2/NCU07898、GH61-5/NCU08760、NCU02916,或 NCU00836 的
氨基酸序列。
[0213]本发明的组合物可以包括非天然存在的⑶H-血红素结构域多肽。在一种形式中,该组合物的非天然存在的⑶H-血红素结构域多肽可以含有CBM。在一种形式中,该组合物的非天然存在的CDH-血红素结构域多肽可以含有CBM并且缺失脱氢酶结构域。在一种形式中,该组合物的非天然存在的CDH-血红素结构域多肽可以含有CBM和脱氢酶结构域。
[0214]本发明的组合物可以包括具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCUO1050, GH61-5/NCU08760、NCU02916、NCU00836 的氨基酸序列的重组多肽,和重组⑶H-血红素结构域多肽。
[0215]在此提供组合物,该组合物包括具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916,和 NCU00836 的氨基酸序列的两种或更多
种重组多肽,和重组⑶H-血红素结构域多肽。
[0216]在此提供包括重组GH61多肽和含有CBM的重组⑶H-血红素结构域多肽的组合物。在一种形式中,该组合物的重组⑶H-血红素结构域多肽具有天然存在的⑶H蛋白质的氨基酸序列。在一种形式中,该组合物的重组⑶H-血红素结构域多肽具有N.crassa OTH-1或M.thermophila⑶H-1的氨基酸序列。在另一种形式中,该组合物的重组⑶H-血红素结构域多肽缺失脱氢酶结构域和CBM。
[0217]还在此提供组合物`,该组合物包括重组GH61多肽和两种或更多种重组⑶H-血红素结构域多肽,其中该两种或更多种重组CDH-血红素结构域多肽中的至少一种缺失脱氢酶结构域和CBM。
[0218]本发明的另一种组合物包括重组GH61多肽和非天然存在的⑶H-血红素结构域多肽。在一些形式中,这些组合物含有两种或更多种非天然存在的⑶H-血红素结构域多肽。
[0219]本发明的组合物还包括含有重组GH61多肽和非天然存在的⑶H-血红素结构域多肽的组合物,其中该非天然存在的⑶H-血红素结构域多肽含有⑶H-血红素结构域和CBM,但缺失脱氢酶结构域。
[0220]本发明的组合物还包括含有重组GH61多肽和非天然存在的⑶H-血红素结构域多肽的组合物,其中该非天然存在的CDH-血红素结构域多肽含有CDH-血红素结构域、CBM和脱氢酶结构域。
[0221]包括重组GH61多肽和重组⑶H-血红素结构域多肽的组合物可以进一步包括一种或更多种纤维素酶。
[0222]本发明的组合物还包括含有共价连接成多肽单链的重组GH61多肽和⑶H-血红素结构域多肽的组合物。这些组合物可以进一步包括一种或更多种纤维素酶。
[0223]纤维素酶
[0224]纤维素酶为可以水解纤维素的酶。该纤维素酶包括,但不限于外切葡聚糖酶(纤维二糖水解酶)、内切葡聚糖酶,和葡萄糖苷酶。纤维素酶由不同的生物体,主要是真菌和细菌类天然产生。
[0225]内切葡聚糖酶水解纤维素内部的1-4 β_糖苷键,从而使纤维素聚合物的长度缩短,并增加纤维素聚合物的裸露端的量。内切葡聚糖苷酶的例子包括,但不限于,来自Trichoderma reesei(“T.reesei”)的 EGI/Cel7B、EGII/Cel5A、EGIII/Cell2A、EGIV/Cel61A和 EGV/Cel45A 的多妝、来自 Phanerochaete chrysosporium(“P.chrysosporium”)的 EG28、EG34,和 EG44 的多肽,和来自 Neurospora crassa (“N.crassa,,)的 NCU00762、NCU05057,和NCU07190的多肽。
[0226]外切葡聚糖酶水解纤维素聚合物末端附近的1-4 β -糖苷键,从而产生短链的纤维素衍生的葡萄糖聚合物,被称为“纤维糊精”。最常生成的纤维糊精为“纤维二糖”(两个葡萄糖分子),但也可以产生更长的纤维糊精,包括纤维三糖(三个葡萄糖分子)、纤维四糖(四个葡萄糖分子)、纤维五糖(五个葡萄糖分子)、纤维六糖(六个葡萄糖分子),或更长的纤维糊精。外切葡聚糖酶包括,但不限于,Τ.reesei的CBHII/Cel6A和CBHI/Cel7A的多肽,和 N.crassa 的 NCU07340 和 NCU09680 的多肽。
[0227]葡聚糖苷酶将纤维糊精水解为葡萄糖,葡聚糖苷酶的例子包括,但不限于,Τ.reesei 的 TRBLG2、Clostridium cellulovorans 的 CCBGLA、N.crassa 的 GH3-4/NCU04952,和 Neotermeskoshunensis 的 NKBLl 的多妝。
[0228]本发明的纤维素酶包括天然存在的纤维素酶,和已经改造成具有改进的性能(例如,改良的催化效率、改良的热稳定性,等等)的纤维素酶。在一个方面,在此提供一种纤维素酶组合物,该纤维素酶组合物包括至少一种内切葡聚糖酶、至少一种外切葡聚糖酶,和至少一种葡萄糖苷酶。
[0229]可以从中纯化纤维素酶,和/或可以从中克隆编码纤维素酶的基因的生物体的例子包括,但不限于,真菌:Aspergillus niger、Aspergillus oryzae、Chaetomiumglobosum、Chaetomium thermophilum、Formitopsis palustris、Humicola insolens、Myceliophthora thermophila、Neurospora crassa、Penicillium spp.、Phanerochaetechrysosporium、Pisolithus tinctorius、Pleurotus ostreatus、Podospora anserine、Postia placenta、 Saccha`romyces cerevisiae、 Sporotrichum thermophile、Sporobolomyces singularis、Talaromyces emersoni1、Thielavia terrestris、Trametesversicolor、Trichoderma reesei (有性型:Hypocrea jecorina);和细菌:Acidothermuscellulolyticus、AnaerocelIum thermophilum、Bacillus pumilis、Caldibacilluscellovorans、 Caldicellulosiruptor saccharoIyticum> Clostridium thermocellum、Halocella cellulolytica、Streptomyces reticule、Thermotoga neapolitana。
[0230]在此提供组合物,该组合物包括一种或更多种非天然存在的⑶H-血红素结构域多肽和一种或更多种纤维素酶。还在此提供组合物,该组合物包括NCU02240/NCU01050进化枝的一种或更多种重组GH61多肽和一种或更多种纤维素酶。还在此提供组合物,该组合物包括具有NCU02240或NCU01050的氨基酸序列的重组多肽和一种或更多种纤维素酶。
[0231]本发明的组合物还包括含有一种或更多种天然存在的⑶H-血红素结构域多肽、一种或更多种重组GH61多肽,和一种或更多种纤维素酶的组合物。
[0232]还在此提供组合物,该组合物包括一种或更多种非天然存在的⑶H-血红素结构域多肽、具有 GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916或NCU00836的氨基酸序列的一种或更多种多肽,和一种或更多种纤维素酶。
[0233]还在此提供组合物,该组合物包括一种或更多种非天然存在的⑶H-血红素结构域多肽、含有基序H-X(4_8)-Q-X-Y的一种或更多种GH61多肽,和一种或更多种纤维素酶。
[0234]在此提供的包括一种或更多种天然存在的⑶H-血红素结构域多肽、一种或更多种重组GH61多肽,和纤维素酶的组合物在洁净含纤维素的材料上比含有纤维素酶但缺失一种或更多种非天然存在的⑶H-血红素结构域多肽和一种或更多种重组GH61的多肽的相应的组合物更有效。
[0235]另外的组合物
[0236]本发明组合物还包括含有⑶H-血红素结构域和CBM的组合物,并且进一步含有GH61多肽,其中该⑶H-血红素结构域和CBM不共价连接,但它们通过非共价相互作用力相
互作用。
[0237]还在此公布了组合物,该组合物含有⑶H-血红素结构域和CBM,其中该⑶H-血红素结构域和CBM不共价连接,但为通过亮氨酸拉链基序稳定地相互作用的两条多肽的一部分。该组合物进一步含有GH61多肽。
[0238]还在此公开组合物,该组合物含有⑶H-血红素结构域和CBM,其中该⑶H-血红素结构域和CBM不共价连接,但它们通过非共价相互作用力稳定地相互作用,该组合物并且进一步含有具有 GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916或NCU00836的氨基酸序列的一种或更多种多肽。
[0239]还在此提供组合物,该组合物含有⑶H-血红素结构域和CBM,其中该⑶H-血红素结构域和CBM不共价连接,但它们通过非共价相互作用力稳定地相互作用,并且该组合物进一步含有GH61多肽和一种或更多种纤维素酶。
[0240]还在此提供组合物,该组合物包括一种或更多种GH61多肽、一种或更多种重组⑶H-血红素结构域多肽,和来自 分泌纤维素酶的真菌的培养基。在这些组合物中,该一种或更多种重组⑶H-血红素结构域多肽可以为一种或更多种非天然存在的⑶H-血红素结构域多肽。
[0241]还在此提供组合物,该组合物包括一种或更多种重组GH61多肽、一种或更多种重组⑶H-血红素结构域多肽,和含有一种或更多种分泌纤维素酶的真菌分泌的一种或更多种的组合物。在这些组合物中,该一种或更多种重组CDH-血红素结构域多肽可以为一种或更多种非天然存在的CDH-血红素结构域多肽。
[0242]分泌纤维素酶的真菌包括,但不限于,Myceliophthora thermophila、Neurosporacrassa、Phanerochaete chrysosporium,和 Trichoderma reesei。
[0243]方法
[0244]在此提供降解纤维素和含纤维素的材料,比如讲生物质降解为单糖和寡糖的方法。另外,在此公开为了这些目的,例如,降解纤维素和含纤维素的材料以产生可溶性糖的本发明的多肽、多聚核苷酸,和组合物的方法和用途。
[0245]在此使用的纤维素和含纤维素的材料的“降解”和“分解”指的是导致纤维素解聚和/或从纤维素多糖中释放单糖或寡糖的任何机制。纤维素的降解包括,但不限于,纤维素的水解和纤维素氧化解离。
[0246]降解纤维素的方法
[0247]提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽和重组⑶H-血红素结构域多肽接触纤维素。[0248]在一个方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、具有 GH61-l/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916,或NCU00836的氨基酸序列的重组多肽,和重组⑶H-血红素结构域多肽接触纤维素。
[0249]在另一方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、具有NCU02240/NCU01050进化枝的多肽的氨基酸序列的重组多肽,和重组⑶H-血红素结构域多肽接触纤维素。
[0250]在另一方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、含有基序H-X(4_8)-Q-X-Y的重组GH61多肽,和非天然存在的⑶H-血红素结构域多肽接触纤维素。
[0251]在另一方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916,或NCU00836的氨基酸序列的两种或更多种重组多肽,和重组⑶H-血红素结构域多肽接触纤维素。
[0252]在另一方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和含有CBM的重组⑶H-血红素结构域多肽接触纤维素。
[0253]在另一方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和具有天然存在的CDH蛋白质的氨基酸序列的重组CDH-血红素结构域多肽接触纤维素。
[0254]在另一方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和N.crassa CDH-1或M.thermophila CDH-1的重组多肽接触纤维素。
[0255]在另一方面,提供降`解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和重组⑶H-血红素结构域多肽接触纤维素,其中该重组⑶H-血红素结构域多肽缺失脱氢酶结构域和CBM。
[0256]在另一方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和两种或更多种重组⑶H-血红素结构域多肽接触纤维素,其中该两种或更多种重组⑶H-血红素结构域多肽中的至少一种缺失脱氢酶结构域和CBM。
[0257]在另一方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和非天然存在的⑶H-血红素结构域多肽接触纤维素。
[0258]在另一方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和两种或更多种非天然存在的⑶H-血红素结构域多肽接触纤维素。
[0259]在另一方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和非天然存在的CDH-血红素结构域多肽接触纤维素,其中该非天然存在的CDH-血红素结构域多肽中含有CDH-血红素结构域和CBM,但缺失脱氢酶结构域。
[0260]在另一方面,提供降解纤维素的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和非天然存在的CDH-血红素结构域多肽接触纤维素,其中该非天然存在的CDH-血红素结构域多肽中含有CDH-血红素结构域、CBM,和脱氢酶结构域。
[0261]在另一方面,提供降解纤维素的方法,其中该方法包括用非天然存在的CDH-血红素结构域多肽和一种或更多种纤维素酶接触纤维素。
[0262]在另一方面,提供降解纤维素的方法,其中该方法包括用GH61多肽和一种或更多种纤维素酶接触纤维素。在一方面,提供降解纤维素的方法,其中该方法包括用具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916,或NCU00836的氨基酸的多肽和一种或更多种纤维素酶接触纤维素。在一方面,提供降解纤维素的方法,其中该方法包括用具有NCU02240/NCU01050进化枝的多肽的氨基酸序列的多肽和一种或更多种纤维素酶接触纤维素。
[0263]在另一方面,提供降解纤维素的方法,其中该方法包括用GH61多肽、含有血红素结构域和CBM的分子,和一种或更多种纤维素酶接触纤维素。在一些方面,含有血红素结构域的分子可以是含有能传递电子的血红素基团的任何分子。
[0264]在另一方面,提供降解纤维素的方法,其中该方法包括用路易斯酸、含有血红素结构域和CBM的分子,和一种或更多种纤维素酶接触纤维素。在一些方面,含有血红素结构域的分子可以是含有能传递电子的血红素基团的任何分子。路易斯酸为作为电子对受体的分子。
[0265]在另一方面,提供降解纤维素的方法,其中该方法包括用路易斯酸、具有CBM的CDH蛋白质,和一种或更多种纤维素酶接触纤维素。路易斯酸为作为电子对受体的分子。
[0266]增强纤维素的降解的方法
[0267]提供增强纤维素的降解的方法,其中该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供GH61多肽和CDH-血红素结构域多肽。在一个方面,提供增强纤维素的降解的方法,其中,该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供GH61多肽和非天然存在的CDH-血红素结构域多肽。在另一方面,提供增强纤维素的降解的方法,其中,该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供具有 GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916或NCU00836的氨基酸序列的多肽和CDH-血红素结构域多肽。在另一方面,提供增强纤维素的降解的方法,其中,该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供具有NCU02240/NCU01050进 化枝的多肽的氨基酸序列的多肽和CDH-血红素结构域多肽。在另一方面,提供增强纤维素的降解的方法,其中,该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供含有基序H-X(4_8)-Q-X-Y的GH61多肽和⑶H-血红素结构域多肽。
[0268]在另一方面,提供增强纤维素的降解的方法,其中,该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供GH61多肽和具有CBM的CDH-血红素结构域多肽。在另一方面,提供增强纤维素的降解的方法,其中,该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供GH61多肽和具有CBM的非天然存在的CDH-血红素结构域多肽。
[0269]通过具有CBM的⑶H-血红素结构域多肽比通过缺失CBM的相应的或相似的CDH-血红素结构域多肽可以使纤维素的降解增强到更大的程度。在这样的例子中,具有CBM的⑶H-血红素结构域多肽可以为非天然存在的。
[0270]增强纤维素的降解的例子包括,但不限于:增加纤维素的降解速率、增加纤维素的降解程度、增加纤维素在一定的反应时间内的降解程度、减少实现给定程度的纤维素的降解所需的纤维素酶的量,和减少在一定的反应时间内实现给定程度的纤维素的降解所需的纤维素酶的量。[0271]在另一方面,提供增强纤维素的降解的方法,其中该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供GH61多肽。在另一方面,提供增强纤维素的降解的方法,其中,该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供两种或更多种GH61多肽。在另一方面,提供增强纤维素的降解的方法,其中,该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916 或 NCU00836 的氨基酸序列的多肽。在另一方面,提供增强纤维素的降解的方法,其中,该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供具有NCU02240/NCU01050进化枝的多肽的氨基酸序列的多肽。在另一方面,提供增强纤维素的降解的方法,其中,该方法包括向含有纤维素和一种或更多种纤维素酶的反应混合物提供含有基序H-X(4_8)-Q-X-Y的GH61多肽。
[0272]包括用一种或更多种纤维素酶、重组GH61的和重组⑶H-血红素结构域多肽接触纤维素的降解纤维素的方法比不包括用重组GH61多肽和/或重组CDH-血红素结构域多肽接触纤维素的相应的方法在降解纤维素上更有效。
[0273]减少实现纤维素的增强的降解所需的CDH-血J工素结构域多肽的暈的方法
[0274]还在此提供减少实现纤维素的增强的降解所需的CDH-血红素结构域多肽的量的方法,其中在含有纤维素、纤维素酶,和GH61多肽的反应混合物中提供具有CBM的CDH-血红素结构域多肽以增强纤维素的降解,并且其中实现纤维素的增强的降解所需的具有CBM的CDH-血红素结构域多肽比缺失CBM的相似的或相应的CDH-血红素结构域多肽所需的更少。在这样的方法中,⑶H-血红素结构域多肽可以为非天然存在的⑶H-血红素结构域多肽。
[0275]在纤维素酶反应中减少对分子的氧化损伤的方法
[0276]还提供在纤维素酶反应中减少对分子的氧化损伤和在纤维素酶反应中减少活性氧簇的形成的方法。在纤维素酶`反应中的分子包括,但不限于,蛋白质和碳水化合物。
[0277]在一个方面,在纤维素酶反应中减少对分子的氧化损伤的方法包括在含有纤维素、纤维素酶,和GH61多肽的反应混合物中提供具有CDH-血红素结构域和CBM但缺失脱氢酶结构域的非天然存在的CDH-血红素结构域多肽。具有CDH-血红素结构域和CBM但缺失脱氢酶结构域的非天然存在的CDH-血红素结构域多肽可以比具有CDH-血红素结构域和CBM但具有脱氢酶结构域的相应或相似的非天然存在的CDH-血红素结构域多肽在纤维素酶反应中对分子产生更少的氧化损伤。
[0278]在纤维素酶反应中减少活性氧簇的形成的方法包括在含有纤维素、纤维素酶,和GH61多肽的反应混合物中提供具有CDH-血红素结构域和CBM但缺失脱氢酶结构域的非天然存在的CDH-血红素结构域多肽。具有CDH-血红素结构域和CBM但缺失脱氢酶结构域的非天然存在的⑶H-血红素结构域多肽可以比具有⑶H-血红素结构域和CBM但具有脱氢酶结构域的相应或相似的非天然存在的CDH-血红素结构域多肽在纤维素酶反应中产生更少的活性氧簇。降解生物质的方法
[0279]提供降解生物质的方法。在此使用的“生物质”指的是含有纤维素的任何材料。在此公开的涉及纤维素的方法也可应用于含有生物质的组合物。
[0280]提供降解生物质的方法,其中该方法包括用本发明的一种或更多种重组多肽接触生物质。在一个方面,提供降解生物质的方法,其中该方法包括用重组⑶H-血红素结构域多肽和重组GH61多肽接触生物质。在另一方面,提供降解生物质的方法,其中该方法包括用非天然存在的CDH-血红素结构域多肽和GH61多肽接触生物质。在另一方面,提供降解生物质的方法,其中该方法包括用⑶H-血红素结构域多肽和具有GH61-l/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916 和 NCU00836 的氨基酸序列的一种或更多种多肽接触生物质。在另一方面,提供降解生物质的方法,其中该方法包括用⑶H-血红素结构域多肽和具有NCU02240/NCU01050进化枝的多肽的氨基酸序列的一种或更多种多肽接触生物质。在另一方面,提供降解生物质的方法,其中该方法包括用CDH-血红素结构域多肽和含有基序H-X(4-8)-Q-X-Y的一种或更多种GH61多肽接触生物质。
[0281]适用于本发明的方法的生物质包括含纤维素的任何材料,并且包括,但不限于芒草(Miscanthus)、柳枝稷(switchgrass)、大米草(cord grass)、黑麦草(rye grass)、草芦(reed canary grass)、象草(elephant grass)、芦華(common reed)、小麦稻杆(wheatstraw)、大麦稻杆(barley straw)、油菜稻杆(canola straw)、燕麦杆(Oat Straw)、玉米稻杆(cornstover)、大豆稻杆(soybean stover)、燕麦壳(oat hull)、高粱、稻壳、黑麦壳(ryehul I )、大麦壳(wheat hul I )、鹿洛、椰子核粉、椰子球(copra pel let )、棕榈仁粉(palmkernel meal )、玉米纤维、干酒糟及其可溶物(Distillers Dried Grains with Solubles,DDGS)、蓝莖(BlueStem)、玉米芯、松木、桦木、柳木、山杨木(aspen wood)、杨木(poplarwood)、能源甘蔗、废纸、木屑、林业废料、城市固体废物、废纸、作物残茬、其他草和其他木材。
[0282]在用本发明的一种或更多种多肽接触生物质之前,对生物质进行一个或更多个预处理步骤。本领域技术人员知晓预处理步骤,并且预处理步骤包括生物和化学处理。预处理步骤包括,但不限于,酸水解、氨纤维膨胀(AFEX)、亚硫酸盐预处理以克服木质纤维素的顽抗性(SPORL)、蒸汽爆炸和臭氧预处理。
[0283]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽和重组⑶H-血红`素结构域多肽接触生物质。
[0284]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶,和含有重组GH61多肽和重组⑶H-血红素结构域多肽的组合物接触生物质。
[0285]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、具有 GH61-l/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916,或NCU00836的氨基酸序列的重组多肽,和重组⑶H-血红素结构域多肽接触生物质。
[0286]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、具有NCU02240/NCU01050进化枝的多肽的氨基酸序列的重组多肽,和重组⑶H-血红素结构域多肽接触生物质。
[0287]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、含有基序H-X(4_8)-Q-X-Y的重组GH61多肽,和非天然存在的⑶H-血红素结构域多肽接触生物质。
[0288]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916,或NCU00836的氨基酸序列的两种或更多种重组多肽,和重组⑶H-血红素结构域多肽接触生物质。[0289]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和含有CBM的重组⑶H-血红素结构域多肽接触生物质。
[0290]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和具有天然存在的CDH蛋白质的氨基酸序列的重组CDH-血红素结构域多肽接触生物质。
[0291]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和N.crassa CDH-1或M.thermophila CDH-1的重组多肽接触生物质。
[0292]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和重组⑶H-血红素结构域多肽接触生物质,其中该重组⑶H-血红素结构域多肽缺失脱氢酶结构域和CBM。
[0293]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和两种或更多种重组⑶H-血红素结构域多肽接触生物质,其中该两种或更多种重组⑶H-血红素结构域多肽中的至少一种缺失脱氢酶结构域和CBM。
[0294]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和非天然存在的⑶H-血红素结构域多肽接触生物质。
[0295]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和两种或更多种非天然存在的⑶H-血红素结构域多肽接触生物质。
[0296]在另一方面,提供降解生物质的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和非天然存在的CDH-血红素结构域多肽接触生物质,其中该非天然存在的CDH-血红素结构域多肽中含有CDH-血红素结构域和CBM,但缺失脱氢酶结构域。
[0297]在另一方面,提供降解生 物质的方法,其中该方法包括用一种或更多种纤维素酶、重组GH61多肽,和非天然存在的CDH-血红素结构域多肽接触生物质,其中该非天然存在的CDH-血红素结构域多肽中含有CDH-血红素结构域、CBM,和脱氢酶结构域。
[0298]在另一方面,提供降解生物质的方法,其中该方法包括用非天然存在的⑶H-血红素结构域多肽和一种或更多种纤维素酶接触生物质。
[0299]在另一方面,提供降解生物质的方法,其中该方法包括用GH61多肽和一种或更多种纤维素酶接触生物质。在一方面,提供降解生物质的方法,其中该方法包括用具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916,或NCU00836的氨基酸的多肽和一种或更多种纤维素酶接触生物质。在一方面,提供降解生物质的方法,其中该方法包括用具有NCU02240/NCU01050进化枝的多肽的氨基酸序列的多肽和一种或更多种纤维素酶接触生物质。
[0300]在另一方面,提供降解生物质的方法,其中该方法包括用GH61多肽、含有血红素结构域的分子,和一种或更多种纤维素酶接触生物质。在一些方面,含有血红素结构域的分子可以是含有能传递电子的血红素基团的任何分子。
[0301]在另一方面,提供降解生物质的方法,其中该方法包括用路易斯酸、含有血红素结构域和CBM的分子,和一种或更多种纤维素酶接触生物质。在一些方面,含有血红素结构域的分子可以是含有能传递电子的血红素基团的任何有机分子。路易斯酸是作为电子对受体的分子。
[0302]在另一方面,提供降解生物质的方法,其中该方法包括用路易斯酸、具有CBM的CDH蛋白质,和一种或更多种纤维素酶接触生物质。路易斯酸是作为电子对受体的分子。
[0303]另一方面,提供降解生物质的方法,其中该方法包括首先用CDH-血红素结构域多肽和GH61多肽接触生物质,接着将一种或更多种纤维素酶添加至反应混合物。
[0304]在生物质降解期间减少损伤的方法
[0305]提供在涉及生物质的降解的反应中减少分子的氧化损伤的方法,其中该方法包括首先用⑶H-血红素结构域多肽和GH61多肽接触生物质以产生反应混合物,并且接着将一种或更多种纤维素酶加入该反应混合物中,从而与同时在反应混合物中加入CDH-血红素结构域多肽、GH61多肽和一种或更多种纤维素酶以及生物质的反应中对分子将产生的氧化损伤相比,在反应中减少分子的氧化损伤。
[0306]增强生物质的降解的方法
[0307]提供增强生物质的降解的方法,其中该方法包括向含有生物质和一种或更多种纤维素酶的反应混合物提供GH61多肽。在一个方面,提供增强生物质的降解的方法,其中,该方法包括向含有生物质和一种或更多种纤维素酶的反应混合物提供两种或更多种GH61多肽。在另一方面,提供增强生物质的降解的方法,其中,该方法包括向含有生物质和一种或更多种纤维素酶的反应混合物提供具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916或NCU00836的氨基酸序列的多肽。在另一方面,提供增强生物质的降解的方法,其中,该方法包括向含有生物质和一种或更多种纤维素酶的反应混合物提供具有NCU02240/NCU01050进化枝的多肽的氨基酸序列的多肽。
[0308]在一个方面,提供增强生物质的降解的方法,其中该方法包括向含有生物质、一种或更多种纤维素酶,和非天然存在的CDH-血红素结构域多肽的反应混合物提供GH61多肽
[0309]将纤维素和生物质`转化成发酵产物的方法
[0310]还提供将纤维素和生物质转化成发酵产物的方法,其中用本发明的纤维素和一种或更多种多肽接触纤维素或生物质,以产生糖溶液(含有单糖、二糖、和寡糖),并且将糖转化成发酵产物。
[0311]可以通过化学或微生物发酵将糖转化成发酵产物。发酵微生物包括真菌和细菌类。在一个例子中,发酵生物体为Saccharomyces cerevisiae。
[0312]在此使用的“糖”包括单糖、二糖和寡糖。在一些方面,糖为葡萄糖单体。
[0313]本发明的发酵产物包括可以从通过纤维素的降解获得的糖中产生的化学产品。本发明的发酵产物可以为生物燃料。本发明的发酵产物可以为醇,包括,但不限于乙醇、正丙醇、异丁醇、3-甲基-1-丁醇、2-甲基-1-丁醇、3-甲基-1-戊醇,和辛醇,本发明的发酵产物可以为酮或醛。
[0314]降低预处理的生物质混合物的粘度的方法
[0315]在生物混合物降解成单糖和寡糖之前,例如,在生物燃料生产中,也可以将在此提供的⑶H-血红素结构域多肽和GH61多肽用于预处理生物质混合物。
[0316]用作原料,例如在生物燃料生产中,的生物质通常含有高水平的木质素,其能够阻止生物质的纤维素成分的水解。通常,用例如,高温和/或高压预处理生物质,以增加水解纤维素成分的可达性。但是,预处理通常产生高粘度的生物质混合物。预处理的生物质混合物的高粘度也可影响水解预处理的生物质的有效性。有利地,本发明的CDH-血红素结构域多肽和GH61多肽可与纤维素酶一起使用从而在进一步降解生物质之前降低预处理的生物质混合物的粘度。在一些方面,使用本发明的⑶H-血红素结构域多肽和具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916 或 NCU00836的氨基酸序列的多肽以降低预处理的生物质混合物的粘度。在一些方面,使用本发明的CDH-血红素结构域多肽、具有 GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916或NCU00836的氨基酸序列的多肽,和纤维素酶,以降低预处理的生物质混合物的粘度。在一些方面,使用本发明的非天然存在的CDH-血红素结构域多肽、含有基序H-X(4_8)-Q-X-Y的GH61多肽,和纤维素酶,以降低预处理的生物质混合物的粘度。
[0317]因此,本发明的一些方面涉及降低预处理的生物质混合物的粘度的方法,该方法用本发明的CDH-血红素结构域多肽和GH61多肽接触具有起始粘度的预处理的生物质混合物;并在足以降低该预处理的生物质混合物的起始粘度的条件下培养接触的生物质混合物。本发明还提供降低预处理的生物质混合物的浓度的方法,该方法用本发明的CDH-血红素结构域多肽和GH61多肽和纤维素酶接触具有起始粘度的预处理的生物质混合物;并在足以降低该预处理的生物质混合物的起始粘度的条件下培养接触的生物质混合物。
[0318]本发明的方法可以作为预处理过程的一部分进行。在预处理该生物质的步骤之后,该预处理过程可以包括向预处理的生物质混合物添加⑶H-血红素结构域多肽,并用本发明的CDH-血红素结构域多肽和GH61多肽和纤维素酶在足以降低混合物的粘度的条件下培养预处理的生物质的另外的步骤。可以在混合物高温时或在混合物的温度下降时将多肽或组合物添加至预处理的生物质。根据本发明的一些方面,所述方法在进行预处理的同一器皿或容器中实施。根据本发明的其它方面,所述方法在与进行预处理的器皿或容器不同的器皿或容器中实施。
[0319]在一些方面,该方法在存在高盐的情况下实施,比如含有饱和浓度的盐的溶液、含有浓度至少在或约 0.1Μ、0.2Μ、0.3Μ、0.4Μ、0.5Μ、1Μ、1.5Μ、2Μ、2.5Μ、3Μ、3.5Μ、or4M 的氯化钠,或浓度至少在或约 0.1Μ、0.2Μ、0.3Μ、0.4Μ、0.5Μ、1Μ、1.5Μ、2Μ、2.5Μ、3.0Μ,或 3.2Μ 的氯化钾(KCl),和/或离子液体比如1, 3-二甲基咪唑磷酸二甲酯([DMM]DMP)或[EMM]0Ac的溶液,或在存在一种或更多种清洁剂的情况下实施,比如离子清洁剂(例如,SDS,CHAPS)、巯基试剂,比如在饱和的硫酸铵,或者在或约O和IM之间的硫酸铵中。在另一方面,该方法在广泛的温度范围中实施,比如在或约20°C和50°C、25°C和55°C、30°C和60°C,或60°C和110°C之间。在一些方面,该方法可以在广泛的PH范围,例如,在约4.5和8.75之间的PH、在大于7的PH,或在PH8.5,或在至少5.0,5.5,6.0,6.5,7.0,7.5,8.0,或8.5的PH中进行。
[0320]将纤维素聚合物裂解为特定的产物的方法
[0321]进一步在此提供将纤维素聚合物裂解为特定的产物的方法。在一个方面,在此提供裂解纤维素聚合物以产生葡萄糖分子和4-酮基葡萄糖分子的方法。从纤维素聚合物的裂解中产生的葡萄糖和4-酮基葡萄糖分子可以保留为更短的纤维素聚合物的一部分,位于从更长的纤维素聚合物的裂解中产生的更短的纤维素聚合物的末端。在另一方面,在此提供裂解纤维素聚合物以产生纤维糊精的方法。在另一方面,在此提供裂解纤维素聚合物以产生带有含4-酮基葡萄糖的非还原性糖末端的纤维糊精的方法。
[0322]在将纤维素裂解为葡萄糖和4-酮基葡萄糖分子的方法中,可以通过本发明的GH61多肽接触纤维素。在一些方面,在将纤维素裂解为葡萄糖和4-酮基葡萄糖分子的方法中,通过本发明的GH61多肽和本发明的CDH-血红素结构域多肽接触纤维素。在另一方面,在将纤维素裂解为葡萄糖和4-酮基葡萄糖分子的方法中,通过本发明的GH61多肽、本发明的CDH-血红素结构域多肽,和一种或更多种纤维素酶接触纤维素。在另一方面,在将纤维素裂解为葡萄糖和4-酮基葡萄糖分子的方法中,通过本发明的GH61多肽和具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916 或 NCU00836的氨基酸序列的GH61多肽接触纤维素。在另一方面,在将纤维素裂解为葡萄糖和4-酮基葡萄糖分子的方法中,通过本发明的⑶H-血红素结构域多肽、具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916 或 NCU00836 的氨基酸序列的GH61多肽,和一种或更多种纤维素酶接触纤维素。
[0323]裂解纤维素中特定的键的方法
[0324]另外,在此提供裂解纤维素聚合物中特定的键和相关分子的方法,在一个方面,在此提供裂解连接纤维素聚合物中的葡萄糖分子的1-4糖苷键的方法。在另一方面,在此提供裂解在葡萄糖分子第4位置上的C-H键,从而促进4-酮基葡萄糖分子产生的方法。
[0325]在一些方面,在裂解连接纤维素聚合物中的葡萄糖分子的1-4糖苷键的方法中,通过本发明的GH61多肽接触纤维素。在另一方面,在裂解连接纤维素聚合物中的葡萄糖分子的1-4糖苷键的方法中,通过本发明的GH61多肽和本发明的CDH-血红素结构域多肽接触纤维素。在另一方面,在裂解连接纤维素聚合物中的葡萄糖分子的1-4糖苷键的方法中,通过本发明的GH61多肽、本发明的CDH-血红素结构域多肽,和一种或更多种纤维素酶接触纤维素。在另一方面,在裂解连接纤维素聚合物中的葡萄糖分子的1-4糖苷键的方法中,通过本发明的CDH-血红素结构域多肽和具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCUO1050、GH61-5/NCU08760、NCU02916 或 NCU00836 的氨基酸序列的 GH61 多肽接触纤维素。
[0326]在裂解在葡萄糖分子第4位置上的C-H键,从而促进4-酮基葡萄糖分子产生的方法中,通过本发明的GH61多肽接触纤维素。在一些方面,在裂解在葡萄糖分子第4位置上的C-H键,从而促进4-酮基葡`萄糖分子产生的方法中,通过本发明的GH61多肽和本发明的CDH-血红素结构域多肽接触纤维素。在另一方面,在裂解在葡萄糖分子第4位置上的C-H键,从而促进4-酮基葡萄糖分子产生的方法中,通过本发明的GH61多肽、本发明的CDH-血红素结构域多肽,和一种或更多种纤维素酶接触纤维素。在另一方面,在裂解在葡萄糖分子第4位置上的C-H键,从而促进4-酮基葡萄糖分子产生的方法中,通过本发明的⑶H-血红素结构域多肽和具有 GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916或NCU00836的氨基酸序列的GH61多肽接触纤维素。
[0327]生产与铜结合的GH61多肽的方法
[0328]在此提供生产与铜结合的GH61多肽的方法。在一个方面,在生长于含有铜原子的培养基中的细胞中生产与铜原子结合的GH61多肽。在另一方面,通过在含有铜的溶液中培养GH61多肽生产与铜原子结合的GH61多肽。可能产生的与铜原子结合的GH61多肽包括,但不限于 GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、GH61-6/NCU02916和GH61-3/NCU00836。可能产生的与铜原子结合的GH61多肽还包括,但不限于NCU02240/NCU01050进化枝的多肽和含有基序H-X (4_8)-Q-X-Y的GH61多肽。与铜原子结合的GH61多肽可以是重组的或天然存在的。
[0329]进一步在此提供生产含有多种重组GH61多肽的组合物的方法,其中50%或更多的GH61蛋白质与铜原子结合。还在此提供生产含有多种重组GH61多肽的组合物的方法,其中 55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,或100%的GH61多肽与铜原子结合。可以通过能使GH61多肽获得铜原子的任何方法生产与铜原子结合的GH61多肽。
[0330]可以在生长于含有铜原子的培养基的细胞中生产与铜原子结合的GH61多肽。生长在含有铜原子的培养基中的细胞可以在含有至少0.01、0.05,0.1,0.5、1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、2000、3000、4000、5000、6000、7000、8000、9000,或10,00(^1铜的培养基中生长。生长在含有铜原子的培养基中的细胞可以在含有不多于 0.05,0.1,0.5、1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、2000、3000、4000、5000、6000、7000、8000、9000,或 10,000 μ M 铜的培养基中生长。生长在含有铜原子的培养基中的细胞可以在含有0.1-1000 μ Μ、100-800 μ Μ、0.1-500 μ Μ,或1-50 μ M铜的培养基中生长。
[0331]还在此提供生产GH61多肽的方法,其中GH61多肽在含有铜的溶液中培养。在含有铜的溶液中培养之前,GH61多肽可以暴露于金属螯合剂,比如EDTA或EGTA,以便从GH61多肽中移除之前结合的金属。
[0332]在含有铜的溶液中培养的GH61多肽可以在含有至少0.01、0.05、0.1、0.5、1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、2000、3000、4000、5000、6000、7000、8000、9000,或10,00(^]\1铜的溶液中培养。在含有铜的溶液中培养的GH61多肽可以在含有不多于 0.05,0.1,0.5、1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、2000、3000、4000、5000、6000、7000、8000、9000,或 10,000 μ M 铜的溶液中培养。在一些方面,在含有`铜的溶液中培养的GH61多肽可以在含有0.1-1000 μ Μ,100-800 μ Μ、0.1-500 μ Μ,或 1-50 μ M 铜的溶液中培养。
[0333]在此提供的方法中,可以通过在液体中溶解铜盐将铜加入液体中。可以与在此公开的方法一起使用的铜盐包括在水中溶解的任何铜盐,包括,但不限于,硫酸铜、乙酸铜、碳酸铜、氯化铜、氢氧化铜,和硝酸铜。
[0334]用与铜结合的GH61多肽降解含纤维素的材料的方法
[0335]在此使用的“含纤维素的材料”包括含有纤维素的任何材料,包括生物质。在此提供降解含纤维素的材料的方法,其中该方法包括用本发明的重组CDH-血红素结构域多肽和重组GH61多肽接触含纤维素的材料,其中该GH61多肽与铜原子结合。进一步在此提供降解含纤维素的材料的方法,其中该方法包括用本发明的多种重组CDH-血红素结构域多肽和多种重组GH61多肽接触含纤维素的材料,其中,50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,或 100% 的 GH61 多肽与铜原子结合。进一步在此提供降解含纤维素的材料的方法,其中该方法包括用本发明的多种重组⑶H-血红素结构域多肽和多种重组GH61多肽接触含纤维素的材料,其中,55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,或 100% 的 GH61多肽与铜原子结合并且一种或更多种GH61多肽具有GH61-l/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916 或 NCU00836 的氨基酸序列。
[0336]还在此提供降解含纤维素的材料的方法,其中该方法包括用本发明的重组⑶H-血红素结构域多肽和重组GH61多肽,和一种或更多种纤维素酶接触含纤维素的材料,其中该GH61多肽与铜原子结合。进一步在此提供降解含纤维素的材料的方法,其中该方法包括用本发明的多种重组⑶H-血红素结构域多肽和多种重组GH61多肽,和一种或更多种纤维素酶接触含纤维素的材料,其中,50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,或100%的GH61多肽与铜原子结合。进一步在此提供降解含纤维素的材料的方法,其中该方法包括用本发明的多种重组CDH-血红素结构域多肽和多种重组GH61多肽,和一种或更多种纤维素酶接触含纤维素的材料,其中,55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,或 100%的GH61多肽与铜原子结合并且一种或更多种GH61多肽具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916 或 NCU00836 的氨基酸序列。
[0337]还在此提供降解含纤维素的材料的方法,其中该方法包括用本发明的重组CDH-血红素结构域多肽和重组GH61多肽接触含纤维素的材料,其中在反应混合物中存在铜原子。在包括含纤维素的材料、本发明的重组⑶H-血红素结构域多肽和重组GH61多肽的一些反应混合物中,铜的浓度是至少0.01,0.05,0.1,0.5、1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、2000、3000、4000、5000、6000、7000、8000、9000,或10, 000 μ M0在包括含纤维素的材料、本发明的重组⑶H-血红素结构域多肽和重组GH61多肽的一些反应混合物中,铜的浓度不多于0.05,0.1,0.5、1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、2000、3000、4000、5000、6000、7000、8000、9000,或
10,000 μ M0在包括含纤维素的材料、本发明的重组⑶H-血红素结构域多肽和重组GH61多肽的一些反应混合物中,铜的浓度在0.1-1000 μ Μ、100-800 μ Μ、0.1-500 μ Μ,或1-50 μ M之间。
[0338]还在此提供降解含纤维素的材料的方法,其中该方法包括用本发明的重组⑶H-血红素结构域多肽和重组GH61多肽,和一种或更多种纤维素酶接触含纤维素的材料,其中在反应混合物中存在铜原子。在包括含纤维素的材料、本发明的重组CDH-血红素结构域多肽和重组GH61多肽,和一种或更多种纤维素酶的一些反应混合物中,铜的浓度是至少
0.01,0.05,0.1,0.5、1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、2000、3000、4000、5000、6000、7000、8000、9000,或 10,000 μ Μ。在包括含纤维素的材料、本发明的重组⑶H-血红素结构域多肽和重组GH61多肽,和一种或更多种纤维素酶的一些反应混合物中,铜的浓度不多于 0.05,0.1,0.5、1、5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、10 00、2000、3000、4000、5000、6000、7000、8000、9000,或 10, 000 μ M0 在包括含纤维素的材料、本发明的重组CDH-血红素结构域多肽和重组GH61多肽,和一种或更多种纤维素酶的一些反应混合物中,铜的浓度在0.1-1000 μ Μ、100-800 μ Μ、0.1-500 μ Μ,或1-50 ii M 之间。
[0339]分析GH61多肽的铜含量的方法
[0340]另外,在此同分析GH61多肽的铜含量的方法。为了确定在含有多种GH61多肽的组合物中GH61多肽的铜含量,可以使用各种技术。通常,该技术涉及以下的步骤:1)获得感兴趣的含GH61多肽的组合物的样品;2)确定该组合物中GH61多肽的浓度;3)确定在该组合物中铜原子的浓度;以及4)基于存在于样品中的GH61多肽和铜原子的量,计算每条GH61多肽的铜原子的量。
[0341]样品中GH61多肽的浓度可以通过用于测量组合物的蛋白质含量的试验来确定,比如Bradford、Lowry,或二辛可宁酸(BCA)试验。给定组合物的蛋白质含量的质量和感兴趣的GH61多肽的分子量,本领域技术人员能轻而易举地确定样品中GH61多肽的浓度。
[0342]可以通过使用测量组合物的金属含量的任何技术确定样品中铜原子的浓度,t匕如,电感耦合等离子体原子发射光谱法或电感藕合等离子体质谱。
[0343]给定组合物中GH61多肽的浓度,和相同组合物中铜原子的浓度,本领域技术人员可以轻而易举地确定在组合物中与铜原子结合的GH61多肽的百分比。在不受限于理论的情况下,每条GH61多肽与一个铜原子结合,例如,含有纯化的GH61多肽的组合物的分析显示每微升样品张,该组合物含有约80,000条GH61多肽和100,000铜原子,这表明样品中80%的GH61多肽与铜原子结合。
[0344]减少用于降解含纤维素的材料的GH61多肽的量的方法
[0345]进一步在此提供减少用于降解含纤维素的材料的GH61多肽的量的方法。在一些方面,减少用于降解含纤维素的材料的GH61多肽的量的方法涉及提供多种重组GH61多肽,其中 50%、55%、60%、65%、7`0%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%,或更多,或100%的GH61多肽与铜原子结合。在一些方面,减少用于降解含纤维素的材料的GH61多肽的量的方法涉及提供多种重组GH61多肽,该多种重组GH61多肽具有GH61-1/NCU02240、GH61-2/NCU07898、GH61-4/NCU01050、GH61-5/NCU08760、NCU02916 或 NCU00836的序列,其中 50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%,99%,或更多,或100%的GH61多肽与铜原子结合。在一些方面,与铜原子结合的GH61多肽在促进纤维素的降解上比未与铜原子结合的GH61多肽更有效。因此,与未与铜原子结合的GH61多肽相比,如果与铜原子结合的GH61多肽用于降解纤维素,需要更少的与铜原子结合的GH61多肽以促进纤维素的降解。
[0346]⑶H-依赖性辅助型纤维素酶系统的鉴定
[0347]在另一实施例中,在此公开鉴定CDH-依赖性辅助型纤维素酶系统的方法。在此提供的辅助型纤维素酶系统为在含有纤维素、纤维素酶,和其它分子的反应中增强纤维素的降解的组合物。CDH-依赖性辅助型纤维素酶系统为通常需要存在CDH-血红素结构域多肽以增强纤维素的降解的组合物。在一些方面,CDH-依赖性辅助型纤维素酶系统有一类分子组成。在一些方面,⑶H-依赖性辅助型纤维素酶系统由两类或更多类分子组成。
[0348]在一个方面,鉴定⑶H-依赖性辅助型纤维素酶系统的方法包括以下步骤:i)获得分泌纤维素酶的真菌分泌的蛋白质的样品(“分泌蛋白质组(secretome)”);ii)用EDTA或氰化钾接触一部分样品;iii)测量用EDTA或氰化钾处理的样品的纤维素酶活性;iv)测量未用EDTA或氰化钾处理的样品的纤维素酶活性;v)比较用EDTA或氰化钾处理的样品的纤维素酶活性和未用EDTA或氰化钾处理的样品的纤维素酶活性,以便鉴定CDH-依赖性辅助型纤维素酶系统。使用该方法,EDTA或氰化钾处理的样品及其相应的未处理的样品之间在纤维素的降解程度上的显著差异的鉴定表明样品中存在CDH-依赖性辅助型纤维素酶系统。可以使用不同浓度的EDTA或氰化钾分析CDH-依赖性辅助型纤维素酶系统,包括,但不限于 0.0OlmM.0.01mM.0.1mM、ImM、10mM、和 IOOmM EDTA 或氰化钾。
[0349]在一个方面,鉴定⑶H-依赖性辅助型纤维素酶系统的方法包括以下步骤:i)获得分泌纤维素酶的真菌分泌的蛋白质的样品(“分泌蛋白质组(secretome)”);ii)使一部分样品处于厌氧条件;iii)测量厌氧条件下的纤维素酶活性;iv)测量未处于厌氧条件的样品的纤维素酶活性;v)比较处于厌氧条件的样品的纤维素酶活性和未处于厌氧条件的样品的纤维素酶活性,以便鉴定CDH-依赖性辅助型纤维素酶系统。使用该方法,处于厌氧条件的样品及其相应的未处于厌氧条件的样品之间在纤维素的降解程度上的显著差异的鉴定表明样品中存在
[0350]⑶H-依赖性辅助型纤维素酶系统。
[0351 ] 例如,可以通过使用厌氧培养室(比如,来自密歇根州Grass Lake的CoyLaboratory Products, Inc.)产生厌氧条件。在一些方面,可以将缓冲液与非氧气气体,t匕如氮气一起喷射,从而移除溶解的氧气。在一些方面,可以在延长的时间段,在厌氧培养室中,大力搅拌缓冲液以移除溶解的氧气。
[0352]实施例
[0353]以下实施例仅用于解释,而不以任何方式限制本发明的范围。
[0354]实施例1:含有NCU00206缺失体,cdh_l,的N.crassa的菌株的产生
[0355]Neurospora 功能基因组计划通过同源重组利用目的基因替换在N.crassa基因组中产生大部分基因的敲除菌株。通过真菌遗传库存中心(Fungal Genetic Stock Center,FGSC)获得Acdh-1的异核体菌株,但由于子囊孢子致死性连锁突变,尽管尝试无数次,还是不能产生同核体菌株。为了获得cdh-1的无杂质的缺失体,用Neurospora功能基因组计划提供的表达盒转化在非同源末端连接重组上有缺陷的N.crassa菌株。用PCR对显示了耐药性的异核转化体进行基因分型从而确定cdh-Ι缺失体。转化体与野生型N.crassa杂交,接着在20种潮霉素抗性后代中筛选出在纤维素上生长期间产生CDH的菌株。对培养物滤液中在微晶纤维素(Avicel)上生长得最好并且缺乏⑶H活性的菌株进行基因分型。通过PCR确定缺失cdh-Ι的多种同核体菌株。
[0356]在添加了 2%蔗糖的Vogel’ s盐上的液体培养物中Λ cdh-1菌株的生长与野生型的一致。在微晶纤维素一纯净的晶体状的纤维素上仅有轻微的生长缺陷。如光学显微镜所确定,在生长6-7天后,野生型和Λ cdh-Ι菌株都完全降解培养物中所有的微晶纤维素。通过SDS-PAGE分析存在于培养物滤液中的蛋白质(图la),并且除了缺失100和120kDa之间的CDH-1条带之外,Δ cdh-Ι菌株分泌的胞外蛋白质与野生型菌株分泌的胞外蛋白质相似。对于不同的转化体,Acdh-1菌株分泌的总蛋白质从比野生型菌株少~40%至与野生型相等,不一而足。Acdh-1菌株的培养物滤液中CDH活性比野生型培养物滤液中CDH活性平均低500倍(图lb)。接着比较Acdh-1菌株和野生型的具体的纤维素酶的标准活性。当加载了相等水平的总蛋白质,野生型和Λ cdh-1菌株在根据azo-CMC和MULAC试验分别测得的内切葡聚糖酶活性和纤维二糖 水解酶活性上是相似的。当加载相等的蛋白质时,Acdh-1菌株的培养物滤液比野生型培养物滤液的微晶纤维素酶(Avicelase)活性低37_49% (图lc)。在反应24小时后,水解产物的HPLC分析表明在△ cdh-1菌株的培养物滤液中,葡萄糖(>90%)是产生的主要的糖,接着是纤维二糖。在野生型培养物滤液中,葡萄糖依然是主要的产物(80%),接着是纤维二糖,纤维二糖酸(cellobionic acid)和微量的葡萄糖酸。色谱图中不存在另外的峰。
[0357]根据制造商的指示,将适当稀释的培养物滤液与azo-CMC试剂(Megazyme SCMCL)混合,确定内切葡聚糖酶活性。将适当稀释的培养物滤液加入1.0mM MULAC之后,通过监测突光的增强(激发' =360nm ;发射\ =465nm)确定4-甲基伞形酮基-D-半乳糖苷(4-Methylumbelliferyl P -D-lactoside, MULAC)的水解速率。
[0358]实施例2:通过⑶H刺激纤维素水解
[0359]为了更直接地评估CDH-1对纤维素降解的贡献,用纯化的CDH进行体外互补分析(in vitro complementation assay)。CDH-1难以从N.crassa培养上清液中以纯化的形式分离出来,并且可以分离仅有一部分纯化形式的N.crassa CDH-1(图6a)。在密切相关的嗜热真菌Myceliophthora thermophila中的直系同源蛋白更容易以纯化形式分离出来并且用于大部分的互补分析(图7XM.thermophila和N.crassa Q)H_1共有70%序列一致性和相同的结构域架构。两种酶都含有C端真菌纤维素结合结构域。单独地,来自M.thermophila的⑶H-1在微晶纤维素上没有可探测的活性,而部分纯化的N.crassa OTH-1由于低水平的污染物而具有少量的水解活性。
[0360]将M.thermophila CDH-1 或部分纯化的 N.crassa CDH-1 加入 A cdh_l 菌株的培养物滤液中刺激微晶纤维素充分地水解(图2a和图6b)。微晶纤维素酶活性比单独的△ cdh-1培养物滤液高1.6-2.0倍。将CDH-1加入野生型培养物滤液在微晶纤维素水解上不具有刺激性效果(图2b)。进一步地,⑶H-1不能刺激来自N.crassa的纯化的纤维素酶,包括纤维二糖水解酶(CBH-1和GH6-2)、`内切葡聚糖酶(GH5-1)和P -葡萄糖苷酶(GH3-4)(图7)的混合物(图2c)。
[0361]M.thermophila在纤维素上生长期间也产生第二⑶H—⑶H_2,⑶H_2不含有真菌纤维素结合结构域(图3a)。利用牵出试验(pull down experiment)和微晶纤维素分析M.thermophiIaCDH-1 和 CDH-2 的纤维素结合偏好(图 3b)。M.thermophila CDH-1 牢固地与微晶纤维素结合,而M.thermophila CDH-2仅具有非常微弱的亲和力。除了纤维素的亲和力不同之外,M.thermophila⑶H-1和⑶H-2具有非常相似的稳态动力学特性。在加载
0.4mg/g微晶纤维素的⑶H中,⑶H-2能将微晶纤维素的水解刺激至与⑶H-1相同的程度(图 3c)。
[0362]为了进一步调查纤维素结合结构域在CDH刺激微晶纤维素水解的能力上的作用,进行滴定实验(图3d)。⑶H-1能以比⑶H-2低10倍的负载刺激Acdh-1菌株培养物滤液的活性。在每克微晶纤维素加载5 ii g CDH-1可以看见对Acdh-1菌株培养物滤液中微晶纤维素酶活性的刺激效果,而对相似的刺激,需要50 iig CDH-2 (图3d)。相对于更低的负载,在4mg⑶H/g微晶纤维素中,M.thermophila⑶H-1和⑶H-2在微晶纤维素酶上具有抑制效果。
[0363]可通过用木瓜蛋白酶裂解,分离M.thermophila⑶H-2的黄素和血红素结构域。为了确定血红素结构域对活性的刺激的贡献,我们用木瓜蛋白酶裂解M.thermophila⑶H-2,并且用尺寸排阻色谱法使黄素结构域分懼(图7)。当2,6-二氯酹靛酹(2,6-dichlorophenolindophenol (DCPIP))用作电子受体时,黄素结构域能以与全长的酶相同的速率氧化纤维二糖,但当细胞色素C用作电子受体时,黄素结构域不具有活性,表明血红素结构域对转移至I个电子受体的重要性。当按照与全长CDH-2的相同的活性添加时,黄素结构域不能刺激Λ cdh-Ι菌株培养物滤液对微晶纤维素的水解,尽管产生纤维二糖酸(图4)。即使负载比全长CDH-2高10倍,黄素结构域依然不能刺激微晶纤维素的水解(数据没有显示),表明血红素结构域对刺激效果是必不可少的。
[0364]全长蛋白质的木瓜蛋白酶消化不足以纯化Μ.thermophila⑶H_2的血红素结构域,因此,在酵母Pichia pastoris中进行M.thermophila CDH-2的血红素结构域的重组表达。通过镍金属亲和层析纯化来自⑶H-2的血红素结构域,并且该血红素结构域具有与全长⑶H-2相同的光谱特性(图8)。接着测试重组血红素结构域刺激Acdh-1菌株培养物滤液的微晶纤维素水解的能力(图4)。加入与最大刺激所需的全长CDH-2相同的摩尔浓度的铁血红素结构域不会产生刺激效果。但是,以I μΜ的负载,铁血红素结构域对微晶纤维素酶的活性的刺激能达到与23ηΜ全长酶(200yg/g微晶纤维素)几乎相同的程度(图4)。
[0365]在室温下,将适当量的⑶H或培养物滤液加入含有1.0mM纤维二糖、200uM DCPIP,和IOOmM乙酸钠pH5.0的混合物进行⑶H活性试验。采用紫外分光光度法,通过在530nm的吸光度的下降监测DCPIP的还原。一个单位相当于每分钟还原的DCPIP的微摩尔量。
[0366]所有的微晶纤维素酶试验以10mg/mL AVICEL(TM)PHlOl(Sigma)在50mM乙酸钠pH5.0,40°C中,一式三份进行。试验在1.7mL微量离心管中以1.0mL总体积进行,并且每分钟颠倒20次。每个试验含有0.05mg/mL培养上清液或含有以6:2.5:1:0.5的比率存在的CBH-1、GH6-2、GH5-1,和GH3-4的0.05mg/mL重新组成的纤维素酶混合物。用于刺激试验的血红素结构域的浓度为根据充分还原的蛋白质在430nm的吸光度所确定的1.0 μ M。
[0367]将试验物以4000rpm离心2分钟,以使残留的微晶纤维素成团,并且从每个井中移除20 μ L试验混合物。使样`品在40°C用100 μ L稀释的、脱盐的Novozymesl88 (Sigma)培养20分钟,接着利用之前所述的葡萄糖氧化酶/过氧物酶试验(4)分析10-30 μ LNovozymesl88处理的微晶纤维素酶试验上清液的葡萄糖。相对于10mg/mL微晶纤维素的最大的理论转换,基于测得的葡萄糖的量,计算降解的百分比。
[0368]实施例3:CDH刺激纤维素降解对氧气和金属离子的依赖性
[0369]对⑶H的生物功能的主导假说假定来自⑶H的血红素结构域的电子转移至铁复合物、醌类、分子氧或导致产生能非特异性地降解纤维素或木质素的自由基的其它氧化还原介质。因此,针对我们在CDH加入Acdh-1培养物滤液中观察到的活性的刺激是否由于与纤维素的直接反应还是由于金属或小分子被CDH还原并接着对降解作出贡献的直接效果,我们进行了试验。
[0370]为了测试Acdh-1培养物中小分子的效果,我们用10,000MWC0自旋浓缩器通过缓冲液交换成10,000倍的培养物滤液。在通过缓冲液交换之后,⑶H-1依然能将Acdh-1培养物滤液的活性刺激至相同程度。为了测试刺激是否有金属依赖性,我们将来自于Δ cdh-Ι培养物的通过缓冲液交换的培养物滤液用100 μ M EDTA培养I小时,接着进行微晶纤维素酶试验。EDTA在Acdh-1培养物滤液的微晶纤维素酶活性上不具有效果;但是,当Μ.thermophila⑶Hl加入到EDTA处理的Acdh-1培养物滤液时,没有观察到刺激效果(图5a)。将EDTA加入野生型培养物滤液使微晶纤维素酶的活性降低~50%(图9)。综合起来,这些结果表明有一种结合金属离子的蛋白质对⑶H刺激纤维素的降解是必不可少的。以DCPIP或细胞色素C作为电子受体时,过夜培养M.thermophila CDH-1与l.0mM EDTA对其氧化纤维二糖的能力没有效果(数据没有展示)。
[0371]紧接着,通过将各种金属离子加入到通过缓冲液交换的和EDTA处理的、浓度为
1.0mM的A cdh-1培养物滤液中研究对CDH刺激微晶纤维素酶活性负责的金属的一致性(图5a)。硫酸钴或硫酸锌的加入能充分地援助CDH-1对活性的刺激。氯化钙和硫酸镁,没有刺激效果。还测试了已知抑制纤维素酶的氧化还原活性金属(Feng et al.AEM2010),包括硫酸亚铁、硫酸锰,和硫酸亚铜,并且在初步观察(12小时)刺激效果的同时,注意这些金属在更长的时间点(45小时)的抑制(图10)。
[0372]最后,揭露A cdh-1培养物滤液中分子氧在CDH-1对活性的刺激上的作用。A cdh-1培养物滤液的微晶纤维素酶活性不受分子氧的存在的影响,而在野生型培养物滤液中,在缺乏氧的情况下,活性降低~40%。纯化的M.thermophila⑶H-1加入到Acdh-1培养物滤液时,在厌氧条件下,在微晶纤维素酶活性上没有观察到刺激效果,而在好氧条件下,观察到刺激效果(图5b)。
[0373]除了在厌氧培养室(Coy),室温下进行所有试验外,如上文所述进行厌氧微晶纤维素酶试验。缓冲液与氮气一起喷射I小时,并且在引进厌氧培养室之前,将培养物滤液浓缩超过20倍,使体积小于300 u L0使用前,将所有的溶液打开在厌氧培养室中放置72小时,以完全移除溶解的氧气。在厌氧培养室,3mL反应瓶中准备好氧反应,接着从厌氧培养室移出,暴露于空气,密封,并放回厌氧培养室中。在特定的时间点,在气密隔离保护罩(glovebag)中离心试验物,且将100 试验混合物移出,并通过如上所述的葡萄糖-氧化酶过氧化酶试验分析试验物。
[0374]实施例4:具有增`强N.crassa中的纤维素酶的降解的能力的GH61蛋白质
[0375]N.crassa培养物滤液在微晶纤维素和Miscanthus上生长期间的蛋白质组学分析一致鉴定出N.crassa分泌蛋白质组中的至少4种GH61蛋白质:GH61_4/NCU01050 (SEQ IDNO: 30), GH61-1/NCU02240(SEQ ID NO: 24)、GH61-2/NCU07898 (SEQ ID NO: 26),和 GH61-5/NCU08760(SEQ ID NO:28)。
[0376]基因缺失体的EDTA处理
[0377]将ImM EDTA加入WT N.crassa培养物滤液,以抑制纤维素酶的活性,其抑制量是通过移除表面暴露二价金属而实现的推定抑制量的大约2倍,所述表面暴露二价金属是GH61催化活性所需要的。在EDTA处理后,一些二价金属(Zn、Co、Mn、Fe、Cu)的加入可以恢复纤维素酶的活性。我们确定EDTA使A NCUO1050和A NCU02240敲除菌株(knockout)的纤维素酶活性降低大约20-30%,并且在WT、A NCU07898和A NCU08760菌株中,EDTA使纤维素酶活性降低约50%。
[0378]系统发育分析
[0379]与N.erassa培养物滤液不同,在微晶纤维素上生长期间,用EDTA处理不抑制M.thermophila的培养物滤液。在微晶纤维素上生长的这些真菌的转录应答的比较分析表明虽然M.thermophila转录与NCU08760和NCU07898直系同源的基因,但其不表达与NCUO1050和NCU02240直系同源的基因。[0380]Biochemical Fractionation
[0381]生化分馏
[0382]通过缓冲液交换浓缩Λ cdh-1培养物滤液,并且利用离子交换色谱法和尺寸排阻色谱法分离Acdh-1培养物滤液。分析馏分展示基本的纤维素酶活性的CDH依赖性刺激的能力。通过SDS-PAGE和胰蛋白酶消化,接着通过液相色谱一串联质谱法(LC-MS/MS)进一步分析馏分,以鉴定存在于各馏分中的蛋白质(图11-13)。
[0383]纤维素酶分析
[0384]进行具有GH61蛋白质、M.thermophila CTH-1和纤维素酶的纤维素酶分析。在图14的实验中,使用锌重新组成的N.crassa GH61多肽与AVICEL(TM)。在图15的实验中,使用EDTA处理的N.crassa GH61多肽与AVICEL(TM)。在图16的实验中,使用锌重新组成的N.crassaGH61多肽与预处理的玉米秸杆。NCU01050和NCU02240在增强AVICEL(TM)的降解上有最好的效果,而NCU02240和NCU08760在增强玉米秸杆的降解上有最好的效果。
[0385]实施例5:GH61多肽的突变分析
[0386]制备并纯化具有His-179、Gln_188,或Tyr-190突变(基于信号肽的第一个氨基酸开始编号)的N.crassa NCU08760〔也称为N.crassa多糖单加氧酶I (“PM0-1”))多肽。具体地,制备具有H179A、Q188A,或Y190F突变的NCU08760多肽。接着分析这些不同的突变型NCU08760多肽在磷酸膨胀纤维素(“PASC”)上的活性。图25展示了各个H179A (“HA”)、Q188A (“QA”),或Y190F (“YF”)突变体的活性与野生型(“WT”)NCU08760的活性相比较的试验结果。试验条件为5mg/ml PASC, 2mM抗坏血酸,和50mM乙酸钠pH5,并且该试验在40°C,不搅拌的情况下进行,I小时终止。如图25所示,与WT NCU08760相比,各HA、QAjP YF突变体的活性降低超过10倍,并且与WT NCU08760相比,QA和YF突变体的活性降低超过50倍。因此,这些结果表明H-X `(4-8)-Q-X-Y基序的H、Q,和Y氨基酸中的各氨基酸对GH61活性的重要性。
【权利要求】
1.一种非天然存在的多肽,包括第一结构域和第二结构域,其中所述第一结构域包括⑶H-血红素结构域,所述第二结构域包括纤维素结合模块(CBM)。
2.根据权利要求1所述的非天然存在的多肽,其特征在于,所述多肽不含脱氢酶结构域。
3.根据权利要求1所述的非天然存在的多肽,其特征在于,所述多肽进一步包括第三结构域,并且所述第三结构域包括脱氢酶结构域。
4.一种编码权利要求1-3中任意一项所述的非天然存在的多肽的重组多聚核苷酸。
5.一种组合物,包括: A)重组GH61多肽;以及 B)含有CBM的重组⑶H-血红素结构域多肽。
6.根据权利要求5所述的组合物,其特征在于,所述重组GH61多肽包括NCU02240/NCUO1050进化枝的多肽。
7.根据权利要求6所述的组合物,其特征在于,所述重组GH61多肽包括SEQIDN0:24(NCU02240)或 30(NCU01050)。
8.根据权利要求5所述的组合物,其特征在于,所述重组GH61多肽包括SEQIDNO:26(NCU07898),28(NCU08760)或 SEQ ID NO:90(NCU00836)。
9.根据权利要求5所述的组合物,其特征在于,所述重组GH61多肽包括基序H-X(4-8)-Q-X-Y。
10.根据权利要求5-9中任意一项所述的组合物,其特征在于,所述含有CBM的重组 CDH-血红素结构域多肽包括 SEQ ID NOs: 32 (N.crassa CDH-1)或 46 (M.thermophilaCDH-1)。
11.根据权利要求5-9中任意一项所述的组合物,其特征在于,所述含有CBM的重组CDH-血红素结构域多肽为非天然存在的多肽,该非天然存在的多肽包括第一结构域和第二结构域,其中,所述第一结构域包括CDH-血红素结构域,所述第二结构域包括CBM,并且所述多肽不含脱氢酶结构域。
12.根据权利要求5-9中任意一项所述的组合物,其特征在于,所述含有CBM的重组CDH-血红素结构域多肽为非天然存在的多肽,该非天然存在的多肽包括第一结构域、第二结构域,和第三结构域,其中,所述第一结构域包括⑶H-血红素结构域,所述第二结构域包括CBM,并且所述第三结构域包括脱氢酶结构域。
13.—种组合物,所述组合物包括第一多肽和第二多肽,其特征在于,所述第一多肽和所述第二多肽稳定地相互作用,但不共价连接,其中所述第一多肽包括⑶H-血红素结构域,而所述第二多肽包括CBM。
14.根据权利要求13所述的组合物,其特征在于,所述第一多肽和所述第二多肽通过亮氨酸拉链基序相互作用。
15.根据权利要求14所述的组合物,其特征在于,进一步包括GH61多肽。
16.根据权利要求5-15中任意一项所述的组合物,其特征在于,所述⑶H-血红素结构域包括选自以下的氨基酸序列:SEQ ID NOs: 70 (N.crassa CDH-1血红素结构域);76 (N.crassa CDH-2 血红素结构域);80 (M.thermophila CDH-1 血红素结构域);和 86 (M.thermophila CDH-2血红素结构域),并且其中所述CBM包括SEQ ID NOs: 74 (N.crassaCDH-1CBM 结构域)或 84 (M.thermophila CDH-1CBM 结构域)。
17.根据权利要求5-15中任意一项所述的组合物,其特征在于,进一步包括一种或更多种纤维素酶。
18.一种宿主细胞,包括编码GH61多肽和包括CBM的CDH-血红素结构域多肽的重组多聚核苷酸。
19.一种降解纤维素的方法,所述方法包括使一种或更多种纤维素酶和权利要求5-15中任意一项所述的组合物与纤维素接触,以产生降解的纤维素。
20.一种降解生物质的方法,所述方法包括使一种或更多种纤维素酶和权利要求5-15中任意一项所述的组合物与生物质接触,以产生降解的生物质。
21.一种将生物质转化为发酵产物的方法,包括使一种或更多种纤维素酶和权利要求5-15中任意一项所述的组合物接触所述生物质,从而产生糖溶液;并且在足以产生发酵产物的条件下,用发酵微生物培养所述糖溶液。
22.根据权利要求20或21所述的方法,其特征在于,将所述生物质进行预处理步骤。
23.一种提高在包括纤维素和纤维素酶的混合物中的纤维素的降解速率的方法,所述方法包括使权利要求5-15中任意一项所述的组合物接触包括纤维素和纤维素酶的混合物。
24.一种降解纤维素的方法,所述方法包括用一种或更多种纤维素酶,路易斯酸,和包括血红素基团并且含有CBM的分子接触所述纤维素,以产生降解的纤维素。
25.根据权利要求24所述的方法,其特征在于,所述路易斯酸为重组GH61多肽。
26.根据权利要求24所述的方法,其特征在于,所述包括血红素基团并且含有CBM的分子为含有CBM的重组⑶H-血红素结构域多肽。
27.一种降低预处理的生物质混合物的粘度的方法,所述方法包括用一种或更多种纤维素酶和权利要求5-15中任意一项所述的组合物接触所述预处理的生物质混合物,以产生粘度减小的预处理生物质。
28.根据权利要求19-27所述的方法,其特征在于,至少50%的所述GH61多肽与铜原子结合。
29.根据权利要求19-28所述的方法,其特征在于,至少90%的所述GH61多肽与铜原子结合。
30.一种组合物,包括多种重组GH61多肽,其特征在于,至少50%的所述GH61多肽与铜原子结合。
31.根据权利要求30所述的组合物,其特征在于,至少90%的所述GH61多肽与铜原子结合。
32.根据权利要求30所述的组合物,其特征在于,所述重组GH61多肽的至少一种包括:i) NCU2240/NCU01050 进化枝的多肽,或 ii)由 SEQ ID NO:90 (NCU00836)、SEQ IDN0:26(NCU07898),或 SEQ ID NO: 28 (NCU08760)造成的氨基酸序列。
33.一种生产GH61多肽的方法,所述方法包括在含有0.1-1000 μ M铜的培养基中培养包括编码GH61多肽的重组多聚核苷酸的细胞,并且使该细胞处于足以从编码GH61多肽的重组多聚核苷酸生产GH61多肽的条件。
34.根据权利要求33所述的方法,其特征在于,所述细胞在含有100-800μ M铜的培养基中培养。
35.一种降解纤维素的方法,所述方法包括使所述纤维素在反应混合物中与以下物质接触: A)一种或更多种纤维素酶, B)含有CBM的重组⑶H-血红素结构域蛋白质,以及 C)重组GH61多肽,其中所述重组GH61多肽包括:i) NCU2240/NCU01050进化枝的多肽或 ii)选自 SEQ ID N0:90(NCU00836)、SEQ ID NO: 26 (NCU07898),或 SEQ IDN0:28(NCU08760)的氨基酸序列; 其中所述方法进一步包括使反应混合物中铜的浓度处在0.1-500 μ M之间。
36.根据权利要求35所述的方法,其特征在于,在所述反应混合物中,铜的浓度为1_50u Mo
37.一种提高混合物中纤维素的降解速率的方法,所述混合物包括纤维素、纤维素酶、含CBM的CDH-血红素 结构域多肽、和GH61多肽,所述方法包括在反应混合物中提供1-50 μ M 的铜。
【文档编号】C11D3/386GK103814128SQ201280027245
【公开日】2014年5月21日 申请日期:2012年4月4日 优先权日:2011年4月4日
【发明者】迈克尔·A.·马尔莱塔, 詹姆斯·H.·多德纳-凯特, 威廉·T.·毕森四世, 克里斯托弗·M.·菲利普斯 申请人:加利福尼亚大学董事会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1