纤维素酶cel5h相关试剂及其在微生物中的应用的制作方法

文档序号:581341阅读:595来源:国知局
专利名称:纤维素酶cel5h相关试剂及其在微生物中的应用的制作方法
技术领域
本发明涉及生物技术和遗传工程的领域,并且特别地关注借助于合适的酶试剂和表达所述酶试剂的微生物利用纤维素和木质素纤维素材料的策略。更特别地,本发明涉及 Saccharophagus degradans的纤维素酶Cel5H和其同源物、功能片段和/或变体在产溶剂微生物(solventogenic microorganism)的背景中的应用,以及涉及来源于Cel5H和其同源物的新结构域和试剂。
背景技术
纤维素和木质素纤维素材料是植物生物量的主要成分,并且其中发现的纤维素聚合物可以提供大量的葡萄糖或其他可发酵的单糖或寡糖的来源,它们可以随之被产溶剂微生物代谢以产生有用的溶剂,诸如乙醇、丙酮或丁醇。纤维素聚合物可以被纤维素解聚酶水解,所述纤维素解聚酶通常被称为纤维素水解酶(cellulolytic enzyme)或纤维素酶。例如,天然纤维素的水解主要涉及4种类型的纤维素酶纤维二糖水解酶(cellobiohydrolase) (1,4_β-D-葡聚糖纤维二糖水解酶, EC 3.2. 1.91),内切-β-1,4-葡聚糖酶(内切_1,4-β-D-葡聚糖4-葡聚糖水解酶,EC 3.2. 1.4),内切-加工性(processive)纤维素酶(EC 3.2. 1. 4. /3. 2. 1.91),和 β -葡萄糖苷酶(EC 3. 2. 1. 21)。纤维素酶和相关的酶已经广泛地用于生物技术的各个领域包括食品, 啤酒,葡萄酒,动物饲料,纺织品和洗涤品,纸浆和纸工业,农业生产和其他领域(关于综述参见 Bhat 2000. Biotechnical Advances (生物技术进展)18 :355-383)。纤维素酶的性质可以不同,诸如尤其是,它们可以充当内切葡聚糖酶或加工性外切葡聚糖酶,它们可以产生多种长度的单体或低聚体,它们可以具有水解不同的纤维素形式诸如结晶纤维素、半结晶纤维素、无定形纤维素或半纤维素的不同能力,它们可以进一步显示结合纤维素物质的不同的强度,不同的动力学参数等。因此,需要投入大量的努力来进一步表征纤维素酶,从而鉴定其功能部分或结构域,这些功能部分或结构域可能是这些酶的感兴趣的特性的基础。这样的功能结构域可以有利地与其他纤维素酶或其结构域组合以产生具有所需活性的嵌合酶。此外,在产溶剂微生物中重组表达纤维素酶,从而允许通过这些微生物直接从含纤维素材料中生产有用的溶剂包括,尤其是乙醇尚未得到满意的进展。为了实现进一步的改进,需要识别、表征和选择特别适合用于此类应用或在此类应用中有利的纤维素酶。Saccharophagus degradans 2-40 _ 以 Ilf 己失口为 Microbifulber degradans 2-40株,并且在美国典型培养物保藏中心(American Type Culture Collection)中以ATCC 43961的保藏号保藏,其是一种能够降解至少10种不同的复杂多糖包括尤其 M^f ^ # Y-7^W-M (proteobacterium) (Andrykovitch & Marx 1988. Appl Environ Microbiol (应用与环境微生物学)54 :3_4 ;Ensor 等.1999. J Ind Microbiol Biotechnol (工业微生物学和生物技术杂志)23 :123-126)。S. degradans基因组已经被测序并且其纤维素酶系统也被鉴定,其中包括被称为 Cel5H 的纤维素酶(Taylor 等 2006. J Bacteriol (细菌学杂志)188 :3849-61)。此外,US2007/0292929 一般性地设想包括表达来自S. degradans的纤维素降解蛋白的产乙醇 (ethanologenic)细菌的重组微生物。然而,仅证明了由S. degradans表达的酶的活性,且不清楚当在产乙醇细菌中表达时这些酶的任一种是否将适当地发挥作用。发明概述本发明人已经对S. degradans 2-40株的Cel5H纤维素酶的结构和活性进行了充分的表征并且已经结论性地确定Cel5H对结晶纤维素显示较高的活性。因此,Cel5H有利于在产生溶剂的(产溶剂)微生物,更特别地在产乙醇微生物诸如梭菌属(Clostridium species)的产乙醇细菌包括丙酮丁醇梭菌(C. acetobutylicum)中的异源制备。因此, Cel5H在这些微生物中的表达(和任选地分泌)使它们能够在包含或富含结晶、半结晶或无定形纤维素的纤维素物质上生长,从而允许从含纤维素的物质中直接产生有用的溶剂诸如乙醇。本发明人得到的更多数据已经表明Cel5H可以充当外切葡聚糖酶或内切加工性 (endoprocessive)纤维素酶,而不是如从其糖苷水解酶家族5 (GH5)催化结构域所预期的那样充当内切葡聚糖酶。此外,Cel5H似乎主要从纤维素中释放葡萄糖,纤维二糖和纤维三糖。假定Cel5H似乎具有的加工性天性并且因此产生低复杂度的纤维素衍生物,则其在产溶剂细菌中的重组表达可以是非常有利的。例如,Cel5H作用的产物可以直接被产溶剂微生物利用或需要其他异源纤维素的最小作用,从而简化了重组微生物的设计并增加了该过程的有效性。本发明在其多个方面中结合了上述出人意料的认识。因此,一个方面提供了一种重组微生物,其表达&iccharophagus degradans 2-40 株的Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体。更特别地,本发明提供了这样的重组微生物,其能够通过所述表达的Cel5H多肽降解纤维素或含纤维素材料。根据具体的实施方案,所述微生物是细菌,更特别地是产溶剂细菌。在具体的实施方案中,所述重组微生物包含编码Cel5H多肽或其同源物的重组核酸分子,或编码所述Cel5H多肽或所述同源物的功能片段和/或变体的重组核酸分子,所述重组核酸分子可操作地连接至允许在所述微生物中的表达的调节序列。在进一步具体的实施方案中,所述重组微生物产生一种或多种溶剂、燃料和/或化学中间体,更具体地选自乙醇,丙酮,丁醇,丙酸,丁酸,醚和甘油的溶剂。在进一步的实施方案中,重组产溶剂微生物可以产生,或可以被改造以产生,至少或主要乙醇。由于其作为环境可接受的燃料的效用,乙醇的工业重要性在很大程度上迅速地不断增加。因此,在一个实施方案中,所述重组产溶剂微生物可以是产乙醇微生物。在具体的实施方案中,所述重组微生物可以是细菌。在一个实施方案中,所述重组产溶剂细菌可以是产乙醇细菌。备选地,所述重组产溶剂微生物可以是酵母,更具体地,产乙醇酵母。例如,所述细菌可以是革兰氏阳性的,诸如例如梭菌属的细菌。因此本发明还包括将来源于革兰氏阴性细菌的纤维素酶引入至革兰氏阳性细菌中,这在以前没有被提过。备选地,所述细菌可以是革兰氏阴性的。在具体的实施方案中,所述重组的产溶剂微生物和优选的产乙醇微生物是梭菌属,优选丙酮丁醇梭菌(Clostridium acetobutylicum)。这些细菌特别地专用作产生溶剂和具体地产生乙醇的细菌。在一个实施方案中,Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体,可以由所述微生物分泌。这样分泌的多肽可以有利地直接作用于并且由此解聚所述微生物暴露在其中的纤维素聚合物或否则与该纤维素聚合物相互作用或改变该纤维素聚合物。然而,也考虑其中所述多肽在细胞内表达的实施方案。例如,这样表达的多肽可以作用于否则被微生物内化的纤维素聚合物,或可以在所述微生物的至少一部分溶解时被释放。本文设想的重组微生物可以包含编码Cel5H多肽或其同源物的重组核酸分子,或编码所述Cel5H多肽或所述同源物的功能片段和/或变体的重组核酸分子,所述重组核酸分子可操作地连接至允许在所述微生物中的分泌的分泌信号序列,任选地与一个或多个其他组件组合,并且所述重组核酸分子可操作地连接至允许在所述微生物中的表达的调节序列。如所述的那样,本发明还教导了 Cel5H的同源物和所述同源物的功能片段和/或变体,以及它们在重组微生物,更特别地产溶剂微生物中的应用。优选地,如本文中所考虑的Cel5H同源物可以包含与Cel5H的DZ结构域同源的结构域。具体实施方案提供了本文教导的重组微生物,其中Cel5H多肽的所述同源物是假单胞菌属物种(Pseudomonas sp. )ND137的ACLA多肽。此外,如由本发明人所认识到地,天然Ce 15H多肽的结构域结构可概括为 GH5-PSL-CBM6-EPR-DZ,其中GH5代表其糖苷水解酶家族5结构域,PSL代表聚丝氨酸接头, CBM6代表糖-结合组件(module)家族6结构域,EPR代表富含谷氨酸-脯氨酸的区域,以及不被这种解释所限制,DZ表示被本发明人鉴定为推测的糖-结合组件的C-末端结构域。因此,在具体实施方案中,本文教导的重组微生物可以表达包含一个或多个结构域的功能片段,所述结构域选自或对应于Cel5H的GH5结构域,CBM6结构域和DZ结构域。 在该片段中一个或多个所述结构域的存在可以赋予该片段以由各结构域引起的功能性。本发明进一步考虑Cel5H多肽、其同源物、功能片段和/或变体与一个或多个异源结构域融合的改造形式,所述异源结构域可以提供在糖聚合物代谢和特别地纤维素代谢中有用的其他功能和活性,诸如解聚纤维素的活性,结合纤维素的活性,形成多纤维素酶体 (cellulosome)的活性或其他活性。因此,具体实施方案提供了本文教导的重组产溶剂微生物,其中所述Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体,与一个或多个与所述Cel5H多肽或其同源物异源的结构域融合,所述结构域选自多纤维素酶体支架蛋白(eellulosomal scaffoldin protein)的糖苷水解酶(GH)催化结构域, 糖结合组件(CBM)结构域,黏结蛋白(cohesion)结合结构域诸如锚定(dockerin)结构域, 和亲水(X组件)结构域。另外地或备选地,该Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体与异源的或其天然信号肽融合。此外,本发明还考虑了共同表达Cel5H或相关多肽和其他多肽或酶的优势,所述其他多肽或酶优选地为重组多肽或酶,其有效用于糖聚合物代谢和特别地纤维素代谢中, 诸如解聚纤维素的多肽,结合纤维素的多肽,形成多纤维素酶体的多肽(诸如,例如,支架蛋白(scaffoldin))或其他多肽。这样的共表达,和任选地和特别地共分泌可以提供附加的或补充的活性和功能,导致本发明的微生物更有效地解聚和利用纤维素。因此进一步的实施方案提供了本文教导的重组微生物,其共表达和任选地共分泌 Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体,和一种或多种多肽(在本文中也称为共表达的多肽),所述一种或多种多肽优选地是参与糖聚合物代谢和特别地纤维素代谢的重组多肽,特别地是一种或多种能够降解木质素纤维素材料的酶,更特别地是一种或多种糖苷水解酶,甚至更特别地是一种或多种纤维素酶。在具体实施方案中,所述一种或多种共表达的多肽诸如共表达的酶,更特别地共表达的纤维素酶的催化作用对于Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体的酶活性可以是附加的或补充的,优选是补充的。通过举例而非限制,如果第一和第二纤维素酶优先作用于不同的物质(诸如,例如,结晶纤维素,半结晶纤维素,无定形纤维素或半纤维素),或如果第一和第二纤维素酶产生不同的产物(例如,糖单体和/或低聚体的不同群体),或如果第一纤维素酶优先地作用于第二纤维素酶的反应产物或反之亦然等,则第一纤维素酶可以被认为具有对第二纤维素酶补充的活性。在进一步的实施方案中,所述一种或多种共表达的纤维素酶可以选自家族_5, 6,8,9和48纤维素酶。在进一步的具体实施方案中,所述一种或多种共表达的纤维素酶可以选自解纤维素梭菌(Clostridium cellulolyticum)纤维素酶Cel48F,Cel9G, Cel9R, Cel9P, Cel9E, Cel9H, Cel9J, Cel9M, Cel8C, Cel5N 禾口 Cel5A,以及 Saccharophagus degradans 2-40 株纤维素酶 Cel9A,Cel9B, Cel5J, Cel5I, Cel5F, Cel5D, Cel5B, Cel9G, Cel5E, Cel5A, Cel5C和Cel6A,以及任一种所述纤维素酶的功能片段和/或变体。进一步的实施方案提供了本文教导的重组微生物,更特别地产溶剂重组微生物, 其中Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体,和任选地如上教导的一种或多种共表达的多肽,更特别地一种或多种共表达的纤维素酶,包含在杂交的和/或共价的多纤维素酶体或小型多纤维素酶体中(在此说明书全文中多纤维素酶体的总称中始终包括两者)。多纤维素酶体可以提供尤其是结合纤维素活性和解聚纤维素活性的超分子组织结构(organisation),从而实现糖聚合物代谢,特别地纤维素代谢的更高效率。在进一步的方面,本发明提供了降解包含纤维素的物质的方法,所述物质诸如木质素纤维素或纤维素材料或生物量,所述方法包括使所述物质与本文教导的重组生物体接触。在具体的实施方案中,该物质包含或富含结晶纤维素。相关的方面提供了从包含纤维素的物质中产生溶剂、燃料或化学中间体的方法, 所述物质诸如木质素纤维素或纤维素材料或生物量,所述方法包括用一种或多种本文教导的微生物处理所述物质。在具体的实施方案中,该物质包含或富含结晶纤维素。在最具体的实施方案中,该溶剂为乙醇,且该微生物为产乙醇微生物。在具体实施方案中,本发明的方法包括在纤维素物质上生长本文所述的重组微生物,从而确保从含纤维素的物质中直接产生有用的溶剂诸如乙醇,所述纤维素物质包含或富含结晶、半结晶或无定形纤维素。还应该理解尽管在前述的方面和实施方案中已经主要结合重组微生物公开了本发明,但本发明还包括涉及有效用于获得该重组微生物的重组手段和试剂,使用所述重组手段和试剂获得该重组微生物的方法,用于在该重组微生物中表达所需多肽的方法,以及表达的多肽及其组合本身和它们的制备方法的多个方面。因此,进一步的方面提供了 Saccharophagus degradans 2-40株的分离的Cel5H 多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体。另一个方面提供了重组核酸分子,所述重组核酸分子编码Cel5H多肽或其同源物,或编码所述Cel5H多肽或所述同源物的功能片段和/或变体。本发明此方面的进一步的实施方案提供了编码Cel5H多肽或其同源物的重组核酸分子,或编码所述Cel5H多肽或所述同源物的功能片段和/或变体的重组核酸分子,所述重组核酸分子可操作地连接至允许在目的宿主微生物中的表达的调节序列。在具体的实施方案中,所述宿主为产溶剂微生物。在更具体的实施方案中,所述宿主为本说明书中其他地方教导的产乙醇微生物。在本文提供的重组核酸分子的具体实施方案中,编码Cel5H多肽或其同源物,或编码所述Cel5H多肽或所述同源物的功能片段和/或变体的核酸序列适应宿主微生物的密码子偏倚。进一步的实施方案提供了编码Cel5H多肽或其同源物的重组核酸分子,或编码所述Cel5H多肽或所述同源物的功能片段和/或变体的重组核酸分子,所述重组核酸分子可操作地连接至允许在目的宿主微生物,特别地在重组微生物,更特别地在本说明书中其他地方教导的产溶剂微生物和更优选地产乙醇微生物中的分泌的分泌信号序列。进一步的实施方案提供了编码Cel5H多肽或其同源物的重组核酸分子,或编码所述Cel5H多肽或所述同源物的功能片段和/或变体的重组核酸分子,所述重组核酸分子可操作地连接至允许在目的宿主微生物中的分泌的分泌信号序列,且可操作地连接至允许在目的宿主微生物,特别地在本说明书中其他地方教导的产溶剂微生物和更特别地产乙醇微生物中的表达的调节序列。一个进一步的方面是载体,诸如例如克隆载体,穿梭载体和/或表达载体,其包含上面公开的一种或多种重组核酸。一个进一步的方面提供了用一种或多种所述重组核酸或用上述的载体转化的目的宿主微生物。在一个实施方案中,该微生物可以是细菌,更特别地选自下列的细菌 大肠杆菌(Escherichia coli), Salmonella tymphimurium,粘质沙雷氏菌(Serratia marcescens),鼠伤寒沙门氏菌(Salmonella typhimurium)禾口枯草芽孢杆菌(Bacillus subtilis)。所述细菌特别适合于过量产生重组多肽,例如为了纯化的目的。在具体实施方案中,该宿主微生物为本说明书中其他地方教导的产溶剂微生物且优选产乙醇微生物。一个进一步的方面提供了由这样转化的微生物直接获得或可由其获得的细胞溶胞产物或细胞提取物。因此,还提供了用于获得根据本发明的重组微生物,优选本说明书其他地方教导的产溶剂微生物和更优选产乙醇微生物的方法,该方法包括用本文教导的重组核酸或载体转化宿主微生物。进一步提供了用于产生,和任选地和最特别地分泌一种或多种Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体的方法,所述方法包括用本文教导的各种重组核酸或载体中的一种或多种转化宿主微生物,并且在有效引起所述各种多肽表达的条件下培养或保持这样转化的微生物。有利地,所述各种多肽以生物活性形式产生。任选地,该方法可以包括分离各种多肽的步骤。
因此,还考虑本文公开的重组核酸、载体或宿主细胞在产生,和任选地和特别地分泌Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体中的应用。优选所述各种多肽以生物活性形式产生。在上述多肽的具体实施方案中,重组核酸、载体、转化的宿主微生物、方法和应用的特征在于下面特征中的一种或多种-所述Cel5H同源物包含与Cel5H的DZ结构域同源的结构域;和/或-所述Cel5H同源物为假单胞菌属物种(I^seudomonassp. )ND137的ACLA多肽; 和/或-所述功能片段包含一个或多个结构域,所述结构域选自或对应于Cel5的GH5结构域,CBM6结构域和DZ结构域;和/或-所述一种或多种Cel5H多肽或其同源物,或所述一种或多种Cel5H多肽或所述同源物的功能片段和/或变体与一个或多个与Cel5H多肽或其同源物异源的结构域融合,所述异源的结构域选自多纤维素酶体支架蛋白的GH催化结构域,CBM结构域,黏结蛋白结合结构域诸如锚定结构域,和X组件结构域;和/或-所述一种或多种Cel5H多肽或其同源物,或所述一种或多种Cel5H多肽或所述同源物的功能片段和/或变体可以与一种或多种参与糖聚合物代谢,特别地参与纤维素代谢的多肽,优选重组多肽或酶,优选地与一种或多种能够降解木质素纤维素材料的酶,更优选地与一种或多种本文教导的异源纤维素酶共表达和任选地共分泌;和/或-所述一种或多种Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体,和任选地(如上面所教导的)一种或多种共表达的多肽,更特别地共表达的纤维素酶包含在杂交的和/或共价的多纤维素酶体中。因此,一个方面提供了分离的组合物,其包含Cel5H多肽或其同源物,或所述 Cel5H多肽或所述同源物的功能片段和/或变体,且还包含一种或多种参与糖聚合物代谢, 和特别地参与纤维素代谢的多肽,优选一种或多种能够降解木质素纤维素材料的酶,更优选本文教导的一种或多种异源纤维素酶。在所述组合物的具体实施方案中,所列举的组分作为离散的或游离的多肽存在。在其他实施方案中,所列举的多肽包含在杂交的和/或共价的多纤维素酶体中。本发明人对Cel5H多肽的结构和组织已经进一步进行了全面的分析,并且已经鉴定了在Cel5H多肽的C-末端附近存在以前未曾同样鉴定到的新结构域(此后称为结构域 DZ)。不受限制地,本发明人的数据提示了针对该DZ结构域的推测的糖结合组件(和/或低聚组件功能)并且指示其存在可能至少部分地是Cel5H解聚结晶纤维素的良好能力的原因。因此,本发明进一步认识到DZ结构域或Cel5H多肽的包含DZ结构域的部分可以用于多种酶体系中以改善它们消化和降解结晶纤维素的能力。因此,进一步的方面是Saccharophagus degradans 2-40株的Cel5H多肽的分离的结构域(DZ结构域),即所述Cel5H多肽(诸如,例如,在图IC中显示的示例性的成熟 Cel5H多肽SEQ ID NO :3中)的氨基酸496至氨基酸596或与其同源的分离的结构域,或所述DZ结构域或所述同源结构域的功能片段和/或变体。在具体实施方案中,与Cel5H DZ同源的结构域是假单胞菌属物种ND137的ACLA 多肽(诸如,例如,在图IE中显示的示例性的成熟ACLA多肽SEQ ID NO :5中)的从氨基酸463延伸至氨基酸558的结构域。具体实施方案提供了 Cel5H多肽或其同源物或变体的分离片段,其具有结构 EPR-DZ, CBM6-EPR-DZ或PSL-CBM6-EPR-DZ,其中EPR, CBM6和PSL具有本说明书中他处所解释的含义。这样的片段包含DZ结构域,所述DZ结构域提供其有利的功能,和任选地,这样的片段可以包括Cel5H糖结合组件CBM6,所述CBM6可以进一步促进降解结晶纤维素或半纤维素物质的能力。此外,内源性接头序列可以为将DZ和任选地CBM6结构域与其他多肽融合同时保留它们的结构和功能提供有利的手段。因此,具体实施方案提供ACLA多肽的分离片段,其包含与Cel5H的DZ结构域同源的结构域。此外考虑的是分离的DZ结构域或其功能片段和/或变体,或如上教导的分 离片段作为糖结合组件的应用。这样的应用可以对多种酶体系赋予新的糖_或纤维素_结合特性。另一个方面涉及嵌合多肽,所述嵌合多肽包含分离的DZ结构域,最特别地Cel5H 的分离的DZ结构域,或其功能片段和/或变体,或包含含有DZ结构域的Cel5H的分离片段, 并且还包含与Cel5H多肽或其同源物异源的一个或多个结构域,所述一个或多个结构域选自多纤维素酶体支架蛋白的GH催化结构域,CBM结构域,黏结蛋白结合结构域诸如锚定结构域,和X组件结构域。这样的组件组合允许生成新的纤维素降解酶,所述纤维素降解酶具有针对结晶纤维素或半纤维素物质的有用活性。其他方面提供了嵌合多肽,所述嵌合多肽包含分离的DZ结构域或其功能片段和/ 或变体,或包含DZ结构域的Cel5H的分离片段,所述嵌合多肽融合于与Cel5H多肽或其同源物异源的一种或多种参与糖聚合物代谢,特别地参与纤维素代谢的多肽,优选地融合于一种或多种能够降解木质素纤维素材料的酶,更优选融合于一种或多种糖苷水解酶,甚至更优选地融合于一种或多种纤维素酶。然而,也考虑另外的一个或多个DZ结构域与如本文所述的Cel5H多肽或其同源物,或其片段和/或变体的融合。一个进一步的方面提供了重组核酸分子,所述重组核酸分子编码分离的DZ结构域或与其同源的分离的结构域或其功能片段和/或变体,或编码包含DZ结构域或其同源物的Cel5H的分离片段,或编码如上所述的嵌合多肽。此方面的一个具体实施方案提供了重组核酸分子,所述重组核酸分子编码分离的 DZ结构域或与其同源的分离的结构域或其功能片段和/或变体,或编码包含DZ结构域或其同源物的Cel5H的分离片段,或编码如上所述的嵌合多肽,所述重组核酸分子可操作地连接至允许在目的宿主微生物中,优选地在本说明书中其他地方教导的产溶剂微生物中和更优选地在产乙醇微生物中的表达的调节序列。一个进一步的实施方案提供了重组核酸分子,所述重组核酸分子编码分离的DZ 结构域或与其同源的分离的结构域或其功能片段和/或变体,或编码包含DZ结构域或其同源物的Cel5H的分离片段,或编码如上所述的嵌合多肽,所述重组核酸分子可操作地连接至允许在目的宿主微生物中,优选地在本说明书中其他地方教导的产溶剂微生物中和更优选地在产乙醇微生物中的分泌的分泌信号序列。此方面的另一个进一步的实施方案提供了重组核酸分子,所述重组核酸分子编码分离的DZ结构域或与其同源的分离的结构域或其功能片段和/或变体,或编码包含DZ结构域或其同源物的Cel5H的分离片段,或编码如上所述的嵌合多肽,所述重组核酸分子可操作地连接至允许在目的宿主微生物中的分泌的分泌信号序列,和可操作地连接至允许在目的宿主微生物中,优选地在本说明书中其他地方教导的产溶剂微生物中和更优选地在产乙醇微生物中的表达的调节序列。 一个进一步的方面提供了载体,诸如例如克隆载体,穿梭载体和/或表达载体,其包含任一种上述重组核酸分子。一个进一步的方面提供了用上述重组核酸分子或载体转化的目的宿主微生物。 在具体实施方案中,该微生物是细菌,更优选地是选自下列的细菌大肠杆菌,Salmonella tymphimurium,粘质沙雷氏菌,鼠伤寒沙门氏菌和枯草芽孢杆菌。在具体实施方案中,该微生物可以是本说明书中其他地方教导的产溶剂微生物且优选产乙醇微生物。一个进一步的方面提供了由这样转化的微生物直接获得或可由其获得的细胞溶胞产物或细胞提取物。在具体实施方案中,分离的DZ结构域或与其同源的分离的结构域或其功能片段和/或变体,或包含DZ结构域或其同源物的Cel5H的分离片段,或如上所述的嵌合多肽,和任选地一种或多种共表达的参与糖聚合物代谢,特别地参与纤维素代谢的多肽可以包含在杂交的和/或共价的多纤维素酶体中。在进一步的方面,本发明提供了降解包含纤维素的物质诸如木质素纤维素或纤维素材料或生物量的方法,所述方法包括使所述物质与分离的DZ结构域或与其同源的分离的结构域或其功能片段和/或变体,或与包含DZ结构域或其同源物的Cel5H的分离片段, 或与如上所述的嵌合多肽,或与表达这些的重组微生物接触。在一个实施方案中,所述物质可以包含或富含结晶纤维素,半结晶纤维素或无定形纤维素。相关的方面提供了从包含纤维素的物质诸如木质素纤维素或纤维素材料或生物量中产生溶剂、燃料或化学中间体的方法,所述方法包括用分离的DZ结构域或与其同源的分离的结构域或其功能片段和/或变体,或用包含DZ结构域或其同源物的Cel5H的分离片段,或用如上所述的嵌合多肽,或用表达这些的重组的产溶剂微生物处理所述物质。在一个实施方案中,所述物质可以包含或富含结晶纤维素。在具体实施方案中,提供了产生溶剂, 更特别地产生乙醇的方法,并且该微生物可以是产乙醇微生物。一个进一步的方面提供了通过本文所述的方法获得的或可获得的包含纤维素降解产物和/或溶剂,更特别地乙醇的组合物。所述组合物可以是粗制培养基或针对Cel5H 多肽(或其同源物或片段)的产物进行(至少)部分地富集和/或纯化或针对溶剂、燃料或化学中间体进行部分地富集和/或纯化。在具体实施方案中,这样的组合物的特征在于增加的葡萄糖、纤维二糖和纤维三糖含量。在进一步具体的实施方案中,提供了这样的组合物,其中葡萄糖、纤维二糖和/或纤维三糖的含量大于IOwt %,大于20wt %,大于30wt %,大于40wt%,大于50wt%,大于60wt%,大于70wt%,大于80wt%,大于90wt%以上。在进一步具体的实施方案中,这样的组合物的特征在于高含量的目的溶剂、燃料或化学中间体。在进一步具体的实施方案中,提供了这样的组合物,其中溶剂、燃料或化学中间体的含量大于IOwt%,大于20wt%,大于30wt%,大于40wt%,大于50wt%,大于 60wt %,大于 70wt %,大于 80wt %,大于 90wt %,大于 90wt %,或 96 % -99,9wt %。在具体实施方案中,该组合物中溶剂、燃料或化学中间体的浓度大于约10g/L,和优选大于约15g/ L0本发明的这些和其他方面和实施方案在下面和在所附的权利要求中进一步解释,并通过非限制性实施例说明。附图简要说明

图1图示了 Saccharophagus degradans 2-40株的天然Cel5H多肽的示例性编码核酸序列(A)和氨基酸序列(B-C),所述氨基酸序列含有(B)或不含有(C) N-末端分泌信号序列;假单胞菌属物种ND137的天然ACLA蛋白的示例性氨基酸序列,所述序列含有(D)或不含有(E) N-末端分泌信号序列;示例性的改造的Cel5H-编码核酸序列(F)和适应丙酮丁醇梭菌密码子偏倚并在3’(C-末端)端处含有6xHis密码子或标签的氨基酸序列(G)。图2示意性地图示了根据本发明的具体实施方案,已被或被改造用于表达的 Cel5H的不同片段和衍生物。图3图示了根据本发明的具体实施方案,Cel5H的多种形式在37°下针对CMC的活性。图4图示了根据本发明的具体实施方案,Cel5H的多种形式在37°下针对磷酸溶胀纤维素(Phosphoric Acid Swollen Cellulose)的活性。图5图示了根据本发明的具体实施方案,Cel5H的多种形式在37°下针对Avicel PHlOl的活性。图6图示了根据本发明的具体实施方案,Cel5H微晶纤维素酶(avicelase)活性与来自解纤维素梭菌(C.cellulolyticum)的野生型和改造的纤维素酶的比较。图7图示了根据本发明的具体实施方案,来自解纤维素梭菌的Cel5A的改造形式的略图,所述改造形式包含附加的Cel5H的结构域。图例参见图2。图8图示了根据本发明的具体实施方案,来自解纤维素梭菌的Cel5A的不同改造形式对Avicel (3. 5g/L 20mM Tris-马来酸酯pH 6和ImM CaCl2)的降解,所述改造形式包含附加的Cel5H的结构域。图例参见图2。图9显示根据本发明的具体实施方案,Cel5H和至少一种其他的纤维素酶对 Avicel的降解。图10示意性地图示了根据本发明的具体实施方案,包含Cel5H的杂交小型多纤维素酶体(minicellulosome)。图11显示了根据本发明的具体实施方案,在含有3g/L 2YT-PASC和pH 5. 5的发酵罐中PASC的降解,剩余纤维二糖的消耗(consummation)和丙酮丁醇梭菌的细菌生长,其 Cel5H信号肽序列被解纤维素梭菌的Cel5H信号肽序列替换。图12显示了根据本发明的具体实施方案,在存在2YT和pH 5. 5但不含任何PASC 的发酵罐中剩余纤维二糖的消耗和丙酮丁醇梭菌的细菌生长,其Cel5H信号肽序列被解纤维素梭菌的Cel5H信号肽序列替换。图13图示了根据本发明具体实施方案的不同构建体。这些构建体包含融合到运载结构域(carrier domain)和信号序列的目的多肽(纤维素酶“Cel5H”)。运载结构域包含来自于多纤维素酶体支架蛋白的糖结合组件(CBM3a),该组件融合到一个或两个X组件 (Xa)0纤维素酶Cel5H包含糖苷水解酶家族5结构域(“5”)、聚丝氨酸接头(“sss”)、 糖-结合组件家族6结构域(“6”)、富含-谷氨酸-脯氨酸区(“印pv”)和C-末端结构域,该C-末端结构域被本发明人鉴定为推测的糖-结合组件(“DZ”)。图14证明与对照菌株相比野生型Cel5H以及融合到运载结构域的Cel5H的分泌。运载结构域包含来自多纤维素酶体支架蛋白的糖结合组件(CBM3a),该组件融合到两个亲水结构域(Xa)。测量培养物上清对可溶性物质对-硝基苯基-纤维二糖 (para-nitrophenyl-cellobiose)白勺 舌十生°图15证明不同蛋白(包括根据本发明具体实施方案的融合蛋白)对不同纤维素物质的活性;(a)包含Cel5H的蛋白对可溶性物质对-硝基苯基-纤维二糖的活性;野生型 Cel5H(实线),具有一个X组件的融合体(CBM-Xa-5H ;点线),具有两个X组件的融合蛋白 (CBM-Xa-Xa-5H,虚线)(b)包含cel5H的蛋白对结晶纤维素Avicel的活性。图16示意性地图示了根据本发明的具体实施方案,Cel5H和ACLA的结构域的比较。发明详述当用于本文时,单数形式“一个”、“一种”、和“所述”既包括单数也包括复数指示物,除非上下文另有清楚地说明。当用于本文时,术语“包含”(“comprising”、“comprises”和“comprisedof”)与 “包括”或“含有” (“including”、“includes” 或“containingWontains”)意思相同, 是包括的或开放式的,并且不排除另外的、未列举的成员、要素或方法步骤。通过端值列举的数值范围包括该范围内所包含的所有数字和分数,也包括所列举的端值。术语“大约”用于本文时,当指可测量的数值如参数、量、时间期间等时,是指包括标示数值的和偏离标示数值的+/-10%或更少,优选地+/-5%或更少,更优选地+/-1%或更少,还更优选地+/-0. 或更少的差异,只要此类差异在所公开的发明中适合于实施。要理解修饰语“大约”所指的值本身也被明确地和优选地公开。本说明书中引用的所有文献通过弓I用完整地并入本文。除非另外指定,用于公开本发明的所有术语,包括技术和科学术语具有本发明所属领域中普通技术人员所普遍理解的含义。借助于进一步的指导,包括术语定义以更好地理解本发明的教导。当用于本文时,术语“Cel5H”,“Cel5H多肽”或“Cel5H蛋白”指根据本领域中这些命名所普遍公知的Mccharophagus degradans 2-40株的多肽或蛋白(参见,特别是Taylor等,2006,见上)。上述命名特别地指具有天然序列的此类多肽,S卩,其基本序列与自然界中存在的或来源于自然界的S. degradans 2-40株的Cel5H蛋白的基本序列相同的多肽。专业技术人员理解Cel5H的天然序列由于遗传趋异或自发突变可能导致在 S. degradans 2_40株的不同次代菌株或传代培养物之间发生差异。Cel5H的天然序列可能由于转录后或翻译后修饰而进一步发生趋异。因此,自然界中存在或来源于自然界的所有 Cel5H序列均被认为是“天然的”。上述名称包括形成活生物体、微生物或细胞的一部分时的Cel5H多肽,以及至少部分地分离自所述来源时的Cel5H多肽。这些术语也包括通过重组或合成方式生产时的 Cel5H多肽。Cel5H多肽正常是分泌性的,并且可以以前体形式存在,所述前体形式包含可切割的N-末端分泌信号序列,或以缺少所述信号序列的成熟形式存在。取决于容易被专业技术人员理解的背景,本文提及的Cel5H多肽可以包括所述成熟形式和/或所述前体形式。
示例性Cel5H多肽包括但不限于由在下列各处标注的核酸编码序列编码的多肽 NCBI Entrez 基因数据库(http://www.ncbi.nlm.nih.gov/sites/entrez db = gene)基因座标签 Sde_3237 (GeneID :3965710),和 NCBI Genbank (http //www. ncbi. nlm. nih. gov/ Genbank/index. html)登录号NC 007912(序列版本1,数据库录入更新时间2008年7月 20目),也重现在图IA中(SEQ ID NO 1);和在下列各处标注的Cel5H多肽NCBI Genbank 登录号YP 528706(序列版本1,数据库录入更新时间:2008年7月20日)和Uniprot/ Swissprot (http://www. expasy. org/)登录号 Q21FN5(于 2006 年 4 月 18 日输入的序列版本1),如示例性地重现在图IB (SEQ ID NO 2)中。此序列对应于包含信号序列的Cel5H前体。示例性的成熟Cel5H多肽,S卩,信号序列被加工掉的多肽由所述前体序列的氨基酸位置35-630表示,其示例性地重新在图 IC(SEQ ID NO 3)中。人们将理解信号肽酶的实际切割可以潜在地在前体Cel5H的氨基酸34和35之间的预测切割位点附近的肽键处发生,所述前体Cel5H诸如图IB中所示。例如,实际的切割可能在前体Cel5H的位置30-40,优选31-39,更优选32-38,甚至更优选32-37,还更优选 33-36的氨基酸区内的任一个肽键处发生,所述前体Cel5H如图IB中所示。此外,除非明确地另外指明或通过上下文另外指明,每当本文参考氨基酸位置来鉴定Cel5H的结构域或其他基序时,这样的参考针对Cel5H的成熟形式,诸如特别地以SEQ ID NO 3显示的那种。当用于本文时,术语“同源性”是指来自相同或不同分类单位的两种大分子之间, 尤其是两种多肽或多核苷酸之间的结构相似性,其中所述相似性是由于共同祖先所产生的。因此,术语“同源物”是指具有所述结构相似性的如此相关的大分子。优选地,本文意指的Cel5H多肽的同源物包括所述具有天然序列的同源物。Cel5H多肽的多肽同源物可以优选地显示与Cel5H多肽的如本说明书中其他地方定义的至少约30 %,更优选至少40 %,甚至更优选至少50 %,还更优选至少60 %,仍更优选至少70%,诸如非常优选至少80%或至少90%或至少95%的序列同一性。备选地或优选另外地,Cel5H多肽的多肽同源物可以显示与Cel5H多肽的如本说明书中其他地方定义的至少约50 %,更优选至少60 %,甚至更优选至少70 %,还更优选至少80 %,仍更优选至少 90%,诸如非常优选至少95%的序列相似性。此外优选地,Cel5H多肽的多肽同源物可以包含与Cel5H多肽的结构域对应的一个或多个功能结构域,和优选地包含GH家族5催化结构域,CBM家族6结构域和DZ结构域中的一个或多个。优选地,所述结构域可以具有与Cel5H 类似的组织结构,尤其是GH5-CBM6-DZ,通常具有插入的接头。需注意,Cel5H多肽的优选同源物为假单胞菌属物种ND137的ACLA多肽。示例性的ACLA多肽包括但不限于Uniprot/Swissprot登录号Q8VUT3 (于2002年3月1日输入的序列版本1)所注释的序列,该序列也重现在图1D(SEQ ID NO 4)中。此序列对应于包含信号序列的ACLA前体。示例性的成熟ACLA多肽,即,信号序列被加工掉的多肽,由各个前体的氨基酸位置观-585表示,其示例性地重现在图IE (SEQ ID NO 5)中。人们将理解信号肽酶的实际切割可能潜在地在前体ACLA的氨基酸27和28之间的预测切割位点附近的肽键处发生,所述前体ACLA诸如图1D(SEQ ID NO 4)中所示。例如, 实际的切割可能在前体ACLA的位置23-32,优选对_31,更优选25-30,甚至更优选沈-四的氨基酸区内的任一个肽键处发生,所述前体ACLA如图ID中所示。取决于容易被专业技术人员理解的背景,本文提及的ACLA多肽可以包括所述成熟形式和/或所述前体形式。此外,除非明确地另外指明或通过上下文另外指明,每当本文参考氨基酸位置来鉴定ACLA的结构域或其他基序时,这样的参考针对ACLA的成熟形式,诸如特别地SEQ ID NO :5中显示的那种。术语“片段”当提及给定的多肽诸如Cel5H或其同源物,或提及给定的结构域诸如 Cel5H的DZ结构域或其同源物时,通常是指所述多肽的截短形式,其与所述多肽诸如所述 Cel5H或同源物或所述结构域相比具有一个或多个氨基酸残基的N-末端和/或C-末端缺失,但该片段剩余的基本序列与所述多肽诸如所述Cel5H或同源物或所述结构域的氨基酸序列中的相应位置相同。例如,给定多肽诸如Cel5H或其同源物的片段可以包含所述多肽诸如所述Cel5H 或同源物的约> 5个连续氨基酸,优选> 10个连续氨基酸,更优选> 20个连续氨基酸,甚至更优选> 30个连续氨基酸,例如,^ 40个连续氨基酸,和最优选> 50个连续氨基酸,例如,彡60,彡70,彡80,彡90,彡100,彡200或彡500个连续氨基酸的序列。例如,Cel5H的DZ结构域或其同源物的片段可以包含所述DZ结构域或其同源物的约> 5个连续氨基酸,优选> 10个连续氨基酸,更优选> 20个连续氨基酸,甚至更优选 ^ 30个连续氨基酸,例如,^ 40个连续氨基酸,和最优选> 50个连续氨基酸,例如,^ 60, 彡70,彡80,或彡90个连续氨基酸的序列。此外,给定多肽诸如Cel5H或其同源物或DZ结构域的片段可以代表所述多肽诸如所述Ce 15H或同源物或DZ结构域的氨基酸序列的至少约30 %,例如,至少50 %或至少 70 %,优选至少80 %,例如,至少85 %,更优选至少90 %,和仍更优选至少95 %或甚至约 99%。术语给定多肽诸如Cel5H或其同源物或DZ结构域的“变体(variant),,是指这样的多肽,其氨基酸序列与所述多肽诸如所述Cel5H或其同源物或DZ结构域的天然序列基本上相同(即,大部分但非全部相同)。“基本上相同”是指至少约85%相同,例如,优选至少 90%相同,例如,至少91%相同,92%相同,更优选至少93%相同,例如,94%相同,甚至更优选至少95 %相同,例如,至少96 %相同,仍更优选至少97 %相同,例如,至少98 %相同,和最优选至少99%相同。两个多肽之间的序列同一性可以通过多肽的氨基酸序列的最优比对(两个蛋白序列的最优比对是使配对得分减去关于引入空位的任何罚分的总和最大化的比对;并且可以优选地通过算法的计算机化执行来进行,诸如“Gap”,使用Needleman和^msch 1970 (J Mol Biol (分子生物学杂志)48 :443-453)的算法,或“Bestfit”,使用Smith和 Waterman 1981 (J Mol Biol (分子生物学杂志)147 195-197)的算法,它们可获自,例如, 来自Accelrys的GCG v. 11. 1. 2包),和一方面对该比对中多肽含有相同氨基酸残基的位置数目和另一方面对该比对中两个多肽的序列不同的位置数目评分来确定。当两个多肽在比对中的给定位置处含有不同的氨基酸残基(氨基酸置换)时或当多肽之一在比对中的给定位置处含有氨基酸残基而另一个多肽不含氨基酸残基或反之亦然(氨基酸插入或缺失) 时,这两个多肽在比对中的该位置处的序列不同。序列同一性计算为比对中多肽含有相同氨基酸残基的位置数相对于比对中的位置总数目的比例(百分比)。用于执行序列比对和确定序列同一性的更多合适的算法包括基于最初由Altschul等1990 (J Mol Biol(分子生物学杂志)215 :403-10)所述的基本局部比对搜索工具(Basic Local Alignment Search Tool) (BLAST)的那些,诸如由 Tatusova 和 Madden 1999 (FEMS Microbiol Lett (FEMS 微生物学通讯)174 :247-250)所述的〃 Blast 2序列"算法,诸如使用其缺省设置。给定多肽诸如Cel5H或其同源物或DZ结构域的变体当用于本文时也具体地包括与所述多肽诸如所述Cel5H或其同源物或DZ结构域具有一定程度的相似性的多肽。优选地,这样的变体可以为至少约90%相似,例如,优选至少91%相似,例如,至少92%相似, 93 %相似,更优选至少94 %相似,例如,95 %相似,甚至更优选至少96 %相似,例如,至少 97%相似,仍更优选至少98%相似,例如,至少99%相似。两个多肽之间的序列相似性可以通过多肽的氨基酸序列的最优比对(见上),和一方面对该比对中多肽含有相同或相似(即,保守置换的)氨基酸残基的位置数目和另一方面对该比对中两个多肽的序列另外不同的位置数目评分来确定。当两个多肽在比对中的给定位置处含有非保守氨基酸残基时或当多肽之一在比对中的给定位置处含有氨基酸残基而另一个多肽不含氨基酸残基或反之亦然(氨基酸插入或缺失)时,这两个多肽在比对中该位置处的序列另外不同。序列相似性计算为比对中多肽含有相同或相似氨基酸残基的位置数相对于比对中的位置总数目的比例(百分比)。应该理解提及片段和/或变体时,说明书也广泛地考虑给定多肽诸如Cel5H或其同源物或DZ结构域的变体的片段,以及所述多肽的片段的变体。术语“功能”当提及给定多肽诸如Cel5H或其同源物或DZ结构域的片段和/或变体时是指这样的片段和变体,其至少部分地保留了相应多肽诸如所述Cel5H或其同源物或 DZ结构域的生物活性或功能性。优选,这样的功能片段和/或变体可以保留至少约20%, 例如,至少30%,或至少40%,或至少50%,例如,至少60%,更优选至少70%,例如,至少 80 %,仍更优选至少85 %,还更优选至少90 %,和最优选至少95 %或甚至100 %的相应多肽诸如所述Cel5H或其同源物或DZ结构域的活性。有可能,这样的功能片段和/或变体可以甚至具有比相应多肽诸如所述Cel5H或同源物或DZ结构域更高的活性。给定多肽诸如Cel5H或其同源物或DZ结构域的功能片段和/或变体可以在其生物活性或功能的至少一个方面和优选更多或所有方面上与所述多肽的功能等同。所述 Cel5H或其同源物的生物学功能的相关方面包括特别地但不限于解聚纤维素活性或纤维素酶活性,关于不同纤维素物质(例如,结晶、半结晶或无定形纤维素或半纤维素)的活性谱, 降解结晶纤维素物质的能力或偏好,和与纤维素物质相互作用或结合的能力。Cel5H或其同源物的所述DZ结构域的生物学功能的相关方面包括特别地但不限于结合纤维素和特别地结合结晶纤维素,和/或低聚作用活性。Cel5H或其同源物或DZ结构域的给定片段和/或变体的生物活性,包括所述活性的上述方面,可以通过标准试验,诸如例如实施例章节中给出的酶活性试验来确定。术语“产溶剂的(solventogenic)” 或“产生溶剂的(solvent-producing) ” 具有其本领域已确定的含义并且特别地指微生物诸如细菌(即,产溶剂细菌)从糖源诸如例如己糖、戊糖或寡糖产生一种或多种非气态有机液体或溶剂,诸如,尤其是乙醇,丙酮,丁醇, 丙酸,丁酸,醚或甘油的能力。特别地,该术语包含天然存在的产溶剂生物体,带有天然存在的或诱导的突变的产溶剂生物体,和已经被遗传修饰的产溶剂生物体。
术语“产乙醇的(ethanologenic)”或“产生乙醇的(ethanol-producing) ” 意在表示微生物诸如细菌(即,产乙醇细菌)从糖源诸如例如己糖、戊糖或寡糖产生至少或优选地主要乙醇的能力,更优选地从糖类产生乙醇作为最丰富的非气态发酵产物的能力。特别地,该术语包括天然存在的产乙醇生物体,带有天然存在的或诱导的突变的产乙醇生物体, 和已经被遗传修饰的产乙醇生物体。合适的产溶剂微生物的实例包括但不限于梭菌属和发酵单胞菌属的菌株,诸如,但不限于本文例证的那些。术语“分离(isolating),,当提及具体组分时通常表示将该组分与组合物的至少一种其他组分分开,由此前一组分从该组合物中被“分离”。特别地,术语“分离”和“分离的(isolated)”在本文中可以指样品中增加量的所需的一种或多种蛋白或一种或多种多肽。相对量可以表示为待分离的所需一种或多种蛋白或一种或多种多肽的浓度或量和样品中总蛋白的浓度或量之间的比率。另外,该术语可以包括将所需的一种或多种蛋白或一种或多种多肽与非蛋白细胞组分(例如,细胞壁,液体,核酸,等)分开。术语“重组核酸”或“重组核酸分子”当用于本文时通常是指包含使用重组DNA技术(诸如例如分子克隆和核酸扩增)产生和/或连接在一起的区段的核酸分子(诸如,例如,DNA, cDNA或RNA分子)。通常,重组核酸分子可以包含一个或多个非天然存在的序列, 和/或可以包含与天然存在的序列对应的区段,所述区段不象它们在未被修饰的来源基因组中定位的那样被定位。当重组核酸分子在已经引入其的宿主生物体中复制时,子代核酸分子也包括在术语“重组核酸分子”的范围内。在具体实施方案中,重组核酸分子可以稳定地整合至宿主生物体的基因组中,诸如例如在一个或多个随机位置处整合或以靶向的方式,诸如,例如,借助于同源重组整合, 或重组核酸分子可以作为染色体外元件存在或包含在染色体外元件内,其中后者可以是自复制的。提出重组DNA技术的一般原理的标准参考文献包括Molecular Cloning =A Laboratory Manual (分子克隆实验室指南),第二版,第1_3卷,Sambrook等编辑,Cold Spring Harbor Laboratory Press,Cold Spring Harbor, N. Y. ,1989 ;Current Protocols in Molecular Biology (现代分子生物学实验技术),Ausubel 等编辑,Greene Publishing and ffiley-Interscience,New York (纽约),1992 (定期更新)Jnnis 等,PCR Protocols A Guide to Methods and Applications (PCR 实验技术方法和应用指南),Academic Press =San Diego (圣地亚哥),1990。微生物学的一般原理见,例如,Davis,B. D.等, Microbiology (微生物学),第三版,Harper & Row, publishers, Philadelphia (费城), Pa. (1980)。术语“重组多肽”当用于本文中时是指通过重组核酸分子的表达由宿主生物体产生的多肽或蛋白,所述重组核酸分子已经引入至所述宿主生物体或其祖先中,并且其包含编码所述多肽或蛋白的序列。此外,术语“重组的”或“转化的”当在本文中用于提及宿主生物体、微生物或细胞时,包括其中已经引入了重组核酸分子的宿主生物体、微生物或细胞,以及所述宿主生物体、微生物或细胞的重组子代。在此,术语“转化”包括将外来核酸诸如重组核酸引入或转移至宿主生物体、微生物或细胞中。这样引入的核酸可以优选地在所述宿主生物体、微生物或细胞的进一步生长和细胞分裂全程中得以保持。可以使用任何常规的基因转移方法来实现转化,诸如而不限于电穿孔,电渗透,化学转化,脂转染(lipofection),病毒-或噬菌体-介导的转染,等。“编码”的意思是核酸序列或其部分依靠被研究的生物体的遗传密码对应于特定的氨基酸序列,例如,所需多肽或蛋白的氨基酸序列。通过举例,“编码”特定多肽或蛋白的核酸可以包括基因组,hnRNA,前-mRNA,mRNA, cDNA,重组或合成的核酸。优选,编码特定多肽或蛋白的核酸可以包含编码所述多肽或蛋白的可读框(ORF)。 “可读框”或“0RF”是指一连串编码核苷酸三联体(密码子),其以本身已知的翻译起始密码子开始并以本身已知的翻译终止密码子结束,并且不包含任何内部的框内翻译终止密码子,和潜在地能够编码多肽。因此,该术语可以与本领域中使用的“编码序列”同义。在一个实施方案中,编码本发明的一种或多种多肽的核酸序列或ORF可以是以本身已知的方式为了在特定生物体例如,微生物,更特别地目的细菌中表达而最优化的密码子。可获得多种生物体的密码子使用偏好和密码子频率,例如,经由Nakamura等,2000 (Nucl Acids Res(核酸研究)28 : 所述的密码子使用数据库(Codon Usage Database) (http://www. kazusa. or. jp/codon/)。如本文教导的重组微生物中目的多肽的表达可以通过可操作地连接编码所述多肽的核酸序列或ORF与允许在所述微生物中的表达的调节序列来实现。就此而言,术语“表达”多肽当指重组生物体时包括能够,例如,在合适的培养条件下或在添加诱导物时(例如, 在使用可诱导的调节序列时)表达该多肽的重组生物体。“可操作的连接”是其中调节性核酸序列和要表达的序列以允许所述表达的方式连接的连接。例如,序列,诸如,例如,启动子和0RF,可以被称为可操作地连接,条件是所述序列之间的连接的性质不会(1)导致引入移码突变(frame-shift mutation), (2)干扰启动子指导ORF转录的能力,(3)干扰ORF从启动子序列转录的能力。表达所需的调节序列或元件的准确性质可以在生物体之间发生变化,但典型地包括启动子和转录终止子,和任选地增强子。提及“启动子”或“增强子”要在其最宽泛的背景中理解并且包括准确的转录起始所需的转录调节序列和当可适用时对基因表达的准确的空间和/或时间的控制或其对例如,内部或外部(例如,外源性)刺激物的反应。更特别地,“启动子”可以描述核酸分子,优选DNA分子上的一个区域,RNA聚合酶与所述区域结合并启动转录。启动子优选地,但非必需地,位于转录受其控制的序列的上游,即5’。典型性,在原核生物中,启动子区可以包含启动子本身和当转录为RNA时将发出蛋白质合成起始信号的序列(例如,Shine-Dalgarno序列)两者。在实施方案中,本文考虑的启动子可以是组成型的或可诱导型的。借助于举例,适合于在梭菌属诸如丙酮丁醇梭菌中的表达的组成型启动子包括而不限于丙酮丁醇梭菌的硫解酶基因的启动子(Pthl启动子),乙酰乙酸脱羧酶基因的启动子 (Pad。启动子),磷酸丁酰转移酶(phosphotransbutyrylase)基因的启动子(Pptb启动子),木糖葡萄球菌(Staphylococcus xylosus)木糖操纵子的木糖可诱导型启动子(Pxyl启动子)。因此,在具体实施方案中,提供了这样的启动子,其是受操纵基因控制的启动子。 当用于本文中时,术语“操纵基因”是指一种核苷酸序列,优选DNA序列,其控制序列从启动子转录的起始和/或维持。典型地,操纵基因通常可以位于启动子和其转录被启动子控制的下游序列之间。通常,操纵基因能够结合阻遏物多肽,由此其减少从所述启动子的转录。 有用的阻遏物可以在其结合操纵基因的状态和其不结合操纵基因的状态之间交替,并且这样的交替可以有利地受外部条件,例如,外部物质或特定代谢物的控制。因此,在包含相容性阻遏物的宿主细胞中,在本发明的核酸中包含操纵基因可以允许控制启动子的活性和从所述启动子的表达。操纵基因序列通常可以来源于细菌染色体。还应该理解本发明的核酸可以编码一种或多于一种的目的多肽。此外,在预期表达两种或多种多肽时,所述表达可以来自多个独立的表达单元,或可以来自单个表达单元 (即,多顺反子表达(multi-cistronic expression)),所述单个表达单元包含两个或多个连续的受常见的调节元件控制的0RF。借助于举例,编码两种或多种多肽的表达单元可以通过将各个ORF的翻译起始密码子与控制翻译起始的序列(例如,核糖体进入序列)缔合来产生。术语“终止子”或“转录终止子”通常是指在转录单元末端处的序列元件,其发出转录终止的信号。例如,终止子通常位于编码目的多肽的一个或多个ORF的下游,即3’。例如,在重组核酸包含两个或多个0RF,例如,连续排列并一起形成多顺反子转录单元的ORF 的情况下,转录终止子可以有利地位于最下游的ORF的3’。在优选的实施方案中,可以有利地针对要用于转化本发明的微生物的重组核酸提供控制本文教导的一种或多种多肽的表达的调节序列。然而,还考虑这样的实施方案,其中重组核酸提供缺少一个或多个调节序列的一个或多个编码序列,而需要的调节序列由被转化的微生物提供(诸如,例如,其中该重组核酸插入至包含合适的调节序列的染色体或附加体(印isomal)区域中)。梭菌属和丙酮丁醇梭菌当用于本文中时是指本领域中如所述那样已知的细菌分类单位,并且特别地包括属于所述分类单位的细菌、细菌菌种、菌株、亚种和培养物,以及天然存在的或野生型标本的修饰的或改造的,诸如例如突变的或遗传改造的衍生物。通过指导而非限制,可获自美国典型培养物保藏中心(ATCC)的梭菌属的分离菌株可以,尤其以关于丙酮丁醇梭菌的登录号ATCC 824, ATCC 4259, ATCC 39236或ATCC 43084来订购。例如, 拜氏梭菌(Clostridium bei jerinckii)的分离菌株可以,尤其以登录号ATCC 858和ATCC 25752来订购。需注意,由本发明的产溶剂微生物表达的多肽可以被靶定以用于分泌。为了实现分泌,编码多肽的核酸序列可以与编码分泌信号序列的序列可操作地连接。就此而言,“可操作地连接”表示编码信号序列的序列和编码待分泌的多肽的序列在框内(in frame)或同相(in phase)连接,从而在表达时,信号肽促进如此与其连接的多肽的分泌。应当理解,适当的信号序列可取决于期望在其中进行分泌的微生物的类型。例如, 相对于革兰氏阴性菌,在革兰氏阳性菌中可能需要不同信号序列。借助于实例而非限制,革兰氏阳性菌中的分泌,特别是梭菌属如丙酮丁醇梭菌中的分泌,可使用如下信号序列完成,所述信号序列为解纤维素梭菌的Cel5A前体多肽的信号序列(示例序列Aenbank登录号AAA51444,1994年10月31日修改的序列版本1),或解纤维素梭菌的CipC前体支架蛋白的信号序列(示例序列=Genbank登录号AAC28899,2005 年12月5日修改的序列版本2),或丙酮丁醇梭菌的CipA前体支架蛋白的信号序列(示例序列Genbank登录号AAK78886, 2006年1月19日修改的序列版本1)。
此外非限制地,革兰氏阴性菌中的分泌可以经由Sec途径,例如,使用运动发酵单胞菌(Z.mobilis)的葡糖酸内酯酶前体多肽的信号序列(示例序列Genbank登录号 CAA47637,2006年10月19日修改的序列版本1)或糖类选择性孔蛋白(porine)0prB的信号序列(示例序列=Genbank登录号AAV88688, 2005年1月25日修改的序列版本1)来实现,或经由双精氨酸转运(Tat)途径,例如,使用运动发酵单胞菌的葡萄糖果糖氧化还原酶前体多肽的信号序列(示例序列=Genbank登录号CAB02496, 2006年10月19日修改的序列版本1)来实现。还应当理解可以使用将要通过本文教导的微生物表达的多肽的天然(或同源的、 内源性)信号肽,只要它们在所述微生物中是有功能的。因此,借助于举例,可以使用Cel5H 前体多肽的内源性或同源的分泌信号序列来实现Cel5H或相关多肽的分泌。特别地,由于 S. degradans是一种革兰氏阴性菌,因此Cel5H的内源性或同源的信号序列可以特别适合于其在其他革兰氏阴性菌中的分泌。在其他实施方案中,多肽诸如Cel5H和相关多肽可以使用异源的信号序列进行分泌。天然Cel5H多肽的结构域结构可概括为GH5-PSL-CBM6-EPR-DZ,成熟Cel5H中的结构域边界的示意性指示显示在图9中。Cel5H或其同源物的功能片段优选地含有GH5, CBM6和DZ结构域中的一个或多个,或与其对应的结构域(例如,Cel5H的同源物和/或变体内的类似结构域)。优选地,包含在这些片段内的结构域可以如本文预期的那样是功能性的。因此,在具体实施方案中,本发明考虑了一些片段,诸如与下列结构域组织结构对应的那些:GH5, GH5-PSL, GH5-PSL-CBM6,GH5-PSL-CBM6-EPR, PSL-CBM6,PSL-CBM6-EPR, PSL-CBM6-EPR-DZ, CBM6, CBM6-EPR, CBM6-EPR-DZ,^P EPR-DZ, DZ。本发明还设想了与成熟 Cel5H的结构域的组合对应的片段,诸如,但不限于EPR-DZ-EPR-DZ。需注意,本发明还涉及Cel5H和具有有用的异源结构域的相关多肽的多种融合。 在此背景中,术语“异源的”表示所述一个或多个结构域来源于除Cel5H多肽或其同源物以外的多肽。因此,“异源的”当指结构域的组合时是指这样的事实,即不同的结构域不源自 (或不是天然地存在于)同一蛋白。然而,也可以考虑另外的Cel5H来源的结构域与Cel5H 多肽或其同源物、或其片段和/或变体的融合。术语“融合”在本文中被宽泛地预期为包括尤其是遗传融合(即,将不同的部分融合为单个可读框)以及通过化学和/或物理手段(例如,化学交联或光电耦合)诱导的融合。此外,融合包括直接融合或经由接头的融合。合适的接头可以包括而不限于至少3,优选至少4或5,更优选至少7和仍更优选至少12个氨基酸,诸如3-15个氨基酸,且优选包含非带电氨基酸,富含非带电氨基酸或由非带电氨基酸组成的肽序列,所述非带电氨基酸优选选自甘氨酸、丝氨酸、半胱氨酸、天冬酰胺、酪氨酸、谷氨酰胺、丙氨酸、缬氨酸、脯氨酸、苏氨酸,并且更优选甘氨酸或丝氨酸。示例性的糖苷水解酶(GH)催化结构域可以来源于本身已知的糖苷水解酶(糖苷酶)或尤其是使用已确定的程序鉴定和分离的未来糖苷水解酶。示例性的糖苷酶包括分组在NC-IUBMB的EC 3.2.1. “糖苷酶”分类中的那些,更优选能够解聚纤维素和木质纤维素(lingo-cellulosic)物质的糖苷酶,诸如,例如,纤维素酶(EC 3. 2. 1. 4.),纤维素 1,4-β-cellobiosidases(EC 3.2.1.91)和加工性内切纤维素酶(EC 3. 2. 1. 4. /EC 3 ■ 2 ■ 1· 91 ) ο
术语糖结合组件(CBM)在本领域中是已知的,并且普遍地广义地涵盖存在于糖苷水解酶中或来源于糖苷水解酶的所有非催化性糖(sugar)-或糖(carbohydrate)-结合组件。本文优选的CBM组件可以包括特异性结合纤维素或纤维素物质的那些并且备选地是指纤维素结合结构域(CBD)。CMB和它们的结构和功能特性的综述参见尤其是 Tomme 等-1995( "Cellulose-binding domains-classification and properties (纤维素结合结构域分类和特性)”,于Enzymatic Degradation of Insoluble Polysaccharides (不溶性多糖的酶降解),Saddler JN & Penner M,编辑,142-163 页, American Chemical Society (美国化学协、会),Washington (华盛顿))禾口 Boraston 等, 2004( "Carbohydrate-binding modules :fine tuning polysaccharide recognition ( H 结合组件精细调节的多糖识别)".Biochem J(生物化学杂志)382 :769-81)。黏结蛋白结合结构域当用于本文中时通常是指能够特异性结合多纤维素酶体支架蛋白亚基的一个或多个受体(黏结蛋白)结构域的所有多肽结构域。示例性的黏结蛋白结合结构域包括存在于组装成多纤维素酶体的糖苷水解酶中或来源于所述糖苷水解酶的锚定结构域。本文考虑I型和II型锚定结构域两者。对锚定结构域的解释参见尤其是 Lytle 等,2001 ( "Solution structure of a type I dockerin domain,a novel prokaryotic, extracellular calcium-binding domain(I 型锚定结构域,艮口一禾中新的原核生物细胞外钙结合结构域的溶液结构)”.J Mol Biol (分子生物学杂志)307: 745-753) ,Adams 等,2005 ("Structural characterization of type II dockerin module from the cellulosome of Clostridium thermocellum calcium-induced effects on conformation and target recognition(来自热纤梭菌的多纤维素酶体的II型锚定组件的结构表征钙诱导的对构象和靶标识别的作用)” .Biochemistry (生物化学)44 2173-82)禾口参见 Bayer 等,1998( "cellulosomes-structure and ultrastructure (多纤维素酶体-结构和超微结构)”.J Struct Biol (结构生物学杂志)124 :221-234)。用于测定锚定蛋白-黏结蛋白相互作用的合适的测定法,诸如用于指导选择本文中合适的锚定结构域,描述于尤其是 Haimovitz 等,2008 ( "Cohesin-dockerin microarray Diverse specificities between two complementary families of interacting protein modules(黏结蛋白-锚定蛋白微阵列两个互补家族的相互作用蛋白组件之间不同的特异性),,.Proteomics (蛋白组学)8 :968-979)。另外考虑的是本文教导的多肽与有效用于糖聚合物代谢,特别地有效用于纤维素代谢中的其他多肽或酶,优选重组多肽或酶的共表达和任选地共分泌。术语“共表达”通常涉及由相同的微生物,特别地由所述微生物的相同细胞表达两种或多种蛋白或多肽(称为被“共表达的”)。合适的用于实现两种或多种多肽的共表达的系统本身是已知的。非限制地,共表达的多肽可以由受相同或不同的调节元件控制的单独的顺反子编码,或可以由单个多顺反子元件编码;这样的顺反子可以在染色体上或在相同或不同的外遗传元件 (epigenetic element),或其组合等上。术语“糖苷水解酶”或“糖苷酶”通常包括能够水解糖苷键,更特别地0-,N-或S-糖苷键,甚至更优选在寡糖和/或多糖物质中的这样的键的酶和酶复合物。该术语包括外切糖苷酶以及内切糖苷酶。该术语特别地包括分组在NC-IUBMB的EC 3.2.1. “糖苷酶”分类中的糖苷酶。
术语“纤维素酶”通常包括能够水解纤维素和含纤维素物质的酶和酶复合物。该术语包括而不限于下列的纤维素酶类型纤维二糖水解酶(l,4-i3_D-葡聚糖纤维二糖水解酶,EC 3.2. 1.91),内切-0-1,4-葡聚糖酶(内切_1,4-β-D-葡聚糖4-葡聚糖水解酶, EC 3. 2. 1. 4),加工性内切纤维素酶(EC 3. 2. 1. 4. /EC 3. 2. 1. 91.)和β -葡萄糖苷酶(EC 3. 2. 1. 21)。纤维素酶进一步包括内切葡聚糖酶以及(加工性)外切葡聚糖酶,并且涵盖产生各种长度的单体和/或低聚体的酶。该术语还包括纤维二糖酶,氧化纤维素酶,葡萄糖苷酶,纤维素磷酸化酶,和通常由此表示的其他酶。该术语包括能够降解各种形式的纤维素的酶,所述纤维素诸如而不限于结晶纤维素,半结晶纤维素,无定形纤维素,半纤维素和/或化学或生物改性的纤维素形式。借助于举例且非限制地,解纤维素梭菌的纤维素分解系统已由B6laich等, 1997( "The cellulolytic system of Clostridium cellulolyticum(角军纤维素梭菌的纤维素分解系统)”· J Biotechnol(生物技术杂志)57 :3-14)综述;且Saccharophagus degradans的纤维素分解系统由Taylor等,2006(见上)综述。本发明进一步考虑了改造的多纤维素酶体,其包含本文教导的多肽,特别地Cel5H 和相关多肽(例如,DZ-结构域和包含该结构域的多肽)。如本领域中所已知的,天然的多纤维素酶体代表某些细菌分类单位,诸如尤其是梭菌属和拟杆菌属(Bacteroides)的细胞外的、多酶纤维素分解复合物。天然多纤维素酶体的基本组织结构包括组织化多肽(支架蛋白),通常包含一个或多个相同或不同的糖结合组件(CBM)和一个或多个相同或不同的受体(黏结蛋白)结构域,它们促进糖苷酶或纤维素分解酶通过与所述酶中的关联锚定结构域的相互作用而结合至多纤维素酶体复合物中。天然多纤维素酶体的这些结构特征也可以用于改造的多纤维素酶体中,由此所需的糖结合和糖解聚活性可以结合至改造的多纤维素酶体中。用于产生改造的多纤维素酶体的技术在本领域中已确定(参见,例如,Fierobe等,2002( "Degradation of cellulose substrates by cellulosome chimeras. Substrate targeting versus proximity of enzyme components (多纤维素酶体嵌合体降解纤维素底物。酶组分的底物靶向性与接近性的比较)”· J Biol Chem(生物化学杂志)277 =49621-30) ;Fierobe等, 2005("Action of designer cellulosomes on homogeneous versus complex substrates controlled incorporation of three distinct enzymes into a defined trifunctional SCaff0ldin(设计的多纤维素酶体对均质底物与复杂底物的作用比较三种不同的酶可控地结合至确定的三功能支架蛋白中)”.J Biol Chem(生物化学杂志)280 :16325-34); 以及 Perret 等,2004 ( "Production of heterologous and chimeric scaffoldins by Clostridium acetobutylicum ATCC 8 ”(丙酮丁醇梭菌ATCC8M产生异源和嵌合的支架蛋白)· J Bacteriol (细菌学杂志)186 :253-7))。通常,改造的多纤维素酶体可以含有杂交的或嵌合的支架蛋白多肽,其包含相同或不同的糖类底物特异性的一个或多个CBM组件,和一个或多个能够结合相同或不同的关联锚定结构域的黏结蛋白结构域。酶,诸如特别地糖苷酶或纤维素分解酶,可以借助于用于支架蛋白多肽中存在的黏结蛋白结构域的关联锚定组件(正常存在于所述酶中和/或被改造至所述酶中)结合至多纤维素酶体中。所述酶也可以包含CBM或其他非催化性结构域。 这样的改造的多纤维素酶体在本领域中通常被称为“嵌合的”或“杂交的”多纤维素酶体或“小型多纤维素酶体”。备选地或另外地,所述一种或多种酶,诸如糖苷酶或纤维素分解酶可以与支架蛋白主链,诸如,例如,通过作为同一多肽链的一部分表达(即,遗传融合)来共价连接。 这样多纤维素酶体通常被称为“共价的”(Mingardon等,2007,“Exploration of new geometries in cellulosome-like chimeras (在多纤维素酶体样嵌合体中研究新的几何学)” Appl. Environ. Microbiol.(应用和环境微生物学)73 :7138-7149)。因此,改造的多纤维素酶体,诸如杂交的,嵌合的,小型_,或共价的多纤维素酶体, 或这些形态的任意组合,或任意的其他改造的多纤维素酶体形式,被考虑与本文教导的多肽一起使用。术语“纤维素”本身在本领域中是已知的。借助于进一步的解释而非限制,该术语可以包括所有形式的纤维素,诸如而不限于天然存在和非天然存在的纤维素形式,诸如,例如,结晶纤维素,半结晶纤维素,微晶纤维素,无定形纤维素,半纤维素,再生纤维素,和/或化学或生物学改性或衍生的纤维素形式,诸如,例如,其醚或酯,等。富含结晶纤维素的物质可以包含而不限于,至少约(w/w),例如,彡5% (w/w), 优选至少约10% (w/w),例如,彡20%,彡30%或彡40% (w/w),更优选至少约50% (w/w), 例如,彡60%或彡70% (w/w),仍更优选至少约80% (w/w),例如,彡90% (w/w)的本领域中所理解的结晶纤维素,半结晶和/或微晶纤维素,更优选结晶纤维素。用重组微生物诸如本文教导的重组微生物处理或接触含纤维素物质的方法和过程在本领域中是普遍已知的,并且可以无限制地包括各种规模的工业发酵过程。要如此发酵的物质可以例如,以固体,半固体,液体或可溶形式提供,或作为勻浆物或提取物提供,或作为(水性)分散体或混悬液提供,或作为(部分)分离的或纯化的和/或预处理的(例如,通过稀酸预处理,氢氧化钠预处理,石灰(lime)预处理,用具有水的有机溶剂预处理, 热液过程,或AFEX)木质素纤维素物质或纤维素物质或纤维素提供,或以其他合适的本身用于纤维素材料和生物量的解聚和/或发酵的形式提供。因此,本发明还考虑起始培养物, 其包含本发明的微生物,任选地与一种或多种其他所需的微生物组合。用于纤维素利用的生物技术方法的综述参见尤其是Lynd等,2002( “Microbial cellulose utilization fundamentals and biotechnology (微生物纤维素利用原理和生物技术)” .Microbiol Mol Biol Rev (微生物学和分子生物学评论)66 :506-77),和 Himmel 等,2007 ( "Biomass recalcitrance !engineering plants and enzymes for biofuels production(生物量顽抗性改造用于生物燃料制备的植物和酶),,kience (科学)315 =804-807)。通过下面的非限制性实施例进一步支持上面的各个方面和实施方案。
实施例实施例1 :Cel5H的新DZ结构域的鉴定已发表的对由S. degradans产生的推测的纤维素酶的分析(Taylor等,2006,见上)表明关于Cel5H的下列组织结构(从酶的N-末端至C-末端)信号序列/催化性组件(GH-家族幻/富含丝氨酸的接头/属于CBM-家族6的糖结合组件/富含谷氨酸和脯氨酸的接头,其他的名称为信号序列-GH5-PSL-CBM6-Era。我们进行了更充分的序列分析,该分析揭示在Cel5H的C-末端处,S卩,SEQ ID N02 (图1B)中从位置496至位置596,存在新的约100个氨基酸长的称为DZ结构域的结构域。 因此,Cel5H的组织结构可以表示为信号序列-GH5-PSL-CBM6-EPR-DZ。由于DZ结构域富含芳香族残基(Trp,Tyr),因此其似乎可以代表新类型的糖结合组件(CBM)。在非冗余DNA序列数据库中对同源的结构域的搜索揭示了由来自细菌假单胞菌属物种ND137的aclA基因编码的推测的纤维素酶中高度同源的结构域(SEQ ID NO :4的位置465-558,图1D)。含有此特殊结构域的其他蛋白来源于S. degradans。Cel5H的另一个非典型特征与GH5催化性组件有关,该催化性组件的长度估计为 300个氨基酸,而其他家族-5酶显示380-450个残基的催化性组件。因此此组件异乎寻常地短,并且缺少家族-5酶中高度保守的残基的重要序列段。实施例2 在大肠杆菌中制备完整的(野生型),截短的Cel5H,和改造形式的 Cel5H使用分子生物学技术,编码Cel5H的成熟形式(无信号序列)的DNA在大肠杆菌 (E. coli)表达载体(pET22b(+),Novagen)中扩增和克隆。得到的载体用于转化大肠杆菌 BL21株(DE!3) (Novagen)。同样,编码截短形式或改造形式的Cel5H的修饰基因通过PCR 来获得并在pET22b(+)中克隆,然后转化大肠杆菌BL21株(DE3)。在所有情况下,在重组蛋白的C-末端终端处移植6个His密码子以促进它们在镍树脂(Nickel resin) (Ni-NTA, Qiagen)上的纯化。各种改造形式的Cel5H概括在图2中。重组菌株在LB培养基(Luria Bertani medium)中生长并且使用IPTG作为诱导物触发被克隆的基因的表达。通过变性聚丙烯酰胺凝胶电泳(SDS-PAGE)来验证重组Cel5H 的合成。将培养物离心并在弗氏压碎器(French press)中破坏收获的细胞。实施例3 各种形式的Cel5H的纯化和表征和评价对多种底物包括羧甲基纤维素 (CMC),磷酸溶胀纤维素(PASC),微晶纤维素(Avicel)和未加工底物,即孵化稻草(hatched straw)的活性通过在Ni-OTVUQiagen)上装载粗提取物纯化 Cel5H,Cel5Ht 和 Cel5Ht_CBM3a, 并使用渐增浓度的咪唑鐺(imidazolium)洗脱目的蛋白。如下所述使用FPLC Q-琼脂糖 (sepharose) (Hitrap Q HP 树脂,GE Healthcare)完成纯化。备选地,Cel5H以及Cel5H_CBM3a和CBM3a_Cel5H构建体使用不同的程序纯化。含有这些蛋白的粗提取物与PASC在4°C温育,并离心。纤维素沉淀物通过在磷酸盐缓冲液中离心洗涤数次,使用纯水或1 %三乙胺从基质上洗脱与纤维素酶特异性结合的蛋白。通过将含有目的蛋白的级分装载至阴离子交换树脂(Hitrap Q HP,GE healthcare)上在pH8下使用FPLC装置来完成纯化。使用线性梯度的NaCl将蛋白从柱上洗脱。在所有情况下,通过 SDS-PAGE检查纯度,并且浓缩蛋白,分成等分试样并保存在-80°C。使用标准条件(37°C )测试纯化酶对CMC,PASC,微晶纤维素(Avicel)和孵化稻草的活性。对于针对CMC的活性的测试,酶浓度为InM且底物浓度为8g/L CMC (pH 6. 0)。多种形式的Cel5H在37°下针对CMC的活性显示在图3中。在所有情况下获得的活性模式表明对Cel5H的外切(exo)作用模式而非内切(endo)作用模式。如图3中所示,所有酶如下进行表征,即通过糖类在动力学的首先几分钟或几秒钟内大量释放,然后酶活性大幅度减小(5分钟后观察到平稳期),这对于外切作用酶或加工性酶更典型。
基于初速度,Cel5H对CMC的比活性估计为20,OOOiu/μ mol。对于针对PASC的活性的测试,酶浓度为5nM且底物浓度为3. 5g/L(pH 6. 0)。多种形式的Cel5H在37°下针对PASC的活性显示在图4中。DZ结构域的去除(Cel5Ht)将比活性减少大约70%,显示此结构域在Cel5H水解 PASC过程中具有重要作用。基于这些动力学,Cel5Hwt对PASC的比活性为大约1,OOOiu/ μ mol ο 将 CBM3a 移植在 N-末端(CBM3a_Cel5H),C-末端(Cel5H_CBM3a)或代替 DZ 组件 (Cel5Ht-CBM3a)进一步减小了该酶的活性。对于针对微晶纤维素(Avicel)的活性的测试,酶浓度为IOOnM且底物浓度为 3. 5g/L(pH 6.0)。多种形式的Cel5H在37°下针对微晶纤维素(Avicel)的活性显示在图 5中。如对两种其他底物所观察到的那样,野生型Cel5H的活性高于改造形式,并且特别地与缺少C-末端DZ结构域的截短形式相比则更高,进一步证实DZ结构域在结晶纤维素降解中的作用。与野生型Cel5H相比,其被强效的CBM3a替换仅部分地恢复微晶纤维素酶 (avicelase)活性。Cel5H对微晶纤维素(Avicel)的活性升高,其根据动力学的第一个小时期间获得的数据计算,表明比活性为8. 5士2iu/ymol。也测试Cel5H对可溶性生色底物,对-硝基苯基-β -D-纤维二糖糖苷(para-nit rophenyl-^-D-cellobioside)的酶活性。在对硝基苯基和纤维二糖之间的连接被酶裂解后,对硝基酚和纤维二糖被释放,并且其浓度可以通过分光光度分析直接测定。Cel5H对此底物的比活性为约14ui/μ mol。此活性为来自解纤维素梭菌的Cel5A的活性的约13倍,所述Cel5A也属于糖苷水解酶的家族5。实施例4 来自解纤维素梭菌的野生型和改造的纤维素酶的Cel5H微晶纤维素酶活性的比较使用如实施例3中所述的测定设计,Cel5H微晶纤维素酶活性与来自解纤维素梭菌的野生型和改造的纤维素酶进行比较。酶浓度为IOOnM且底物浓度为3. 5g/L (pH 6. 0)。如图6中所示,Cel5Hwt对微晶纤维素(Avicel)的活性为Cel9G的几乎6倍,Cel9G 是来自解纤维素梭菌的活性最高的纤维素酶之一。与Cel9G的改造形式(其含有CBM3a和 X2 组件)(CBM-X-Cel9G,Mingardon 等,2007. Appl Environ Microbiol (应用和环境微生物学)73:7138-49.)相比,Cel5Hwt仍然保持了针对结晶纤维素的25%更多的活性。相反, 共价多纤维素酶体(其包含Cel9G和Cel48F的催化性组件和强效的CBM3a ;Mingardon等, 2007,见上)的活性仅比Cel5H多36%。通过戴安(dionex)对Cel5Hwt作用于微晶纤维素(Avicel)释放的可溶性糖类的分析表明温育M小时后,后一种酶主要释放纤维二糖(67% ),纤维三糖5% )和葡萄糖㈩.5% ),即,复杂性相对低的可溶性糖类,但没有纤维四糖。也测试Cel5H(Cel5HWt)对孵化稻草的活性(酶浓度和底物浓度分别为IOOnM和 3. 5g/L)。温育M小时后,通过Cel5Hwt释放大约70 μ M的可溶性糖类。通过戴安(dionex) 对可溶性糖类的分析表明Cel5H对此未加工底物的作用主要释放葡萄糖(90% )。上述的所有动力学实验在37°C下在20mM Tris-马来酸酯pH 6. 0, ImM CaCl2 (叠氮化物0.01% w/v)缓冲液中进行。Cel5H的微晶纤维素酶活性也在相同缓冲液中在存在氯化钠(171mM NaCl)的条件下测量。在NaCl的存在下,发现Cel5H的活性多10%。与37°C相比,在50°C下酶活性大幅度减小,可能是由于在50°C下酶的解折叠所引起的。得出结论,Cel5H显示对结晶纤维素较高的活性,并且因此是在产生溶剂细菌诸如丙酮丁醇梭菌中异源制备的合适候选物,其能够使此菌株在结晶纤维素或无定形纤维素上生长。我们的结果提示DZ组件充当纤维素结合组件(CBM),其可以有利地在底物的表面处锚定纤维素酶。迄今为止我们获得的数据表明此酶可能是外切葡聚糖酶或内切加工性纤维素酶(并且不是内切葡聚糖酶)。值得注意的是家族-5纤维素酶通常被描述为内切葡聚糖酶。Cel5H不从纯纤维素中释放任何纤维四糖,而是产生纤维二糖,葡萄糖和纤维三糖。实施例5 将Cel5H的附属结构域(accessory domains)和/或接头4_移植至其他(多个)酶使用分子遗传技术将S. degradans的DZ组件单独或与上游CBM6和任选地与接头 (参见图1中的Cel5Hwt) —起连接至缺少这些组件的其他(多个)酶。选择用于这些实验的纤维素酶是来自解纤维素梭菌的Cel5A,其类似于Cel5H,也显示N-末端处的家族-5催化性组件。Cel5A是一种真正的内切葡聚糖酶,其对微晶纤维素 (Avicel)具有中等活性(Fierobe 等,1991. J Bacteriol (细菌学杂志)173 :7956-62)。构建的杂交酶显示在图7中。纯化多种改造形式的Cel5A并且测试它们对微晶纤维素(Avicel)的活性,并与 Cel5Awt 和 Cel5At 进行比较(图 8)。DZ观察到的活性谱表明DZ结构域的存在改善了 Cel5A活性(即,Cel5A对微晶纤维素(Avicel)的水解)。特别地,温育M小时后,由Cel5At-DZ或Cel5At-DZ2释放的糖类的数量为由Cel5At释放的糖类的数量的3倍。这些结果提示该酶通过DZ结构域固定或附着在纤维素上。因此,提示DZ结构域是新类型的固定结构域。然而,观察到的活性比Cel5At_CBM3的活性低20%。因此支架蛋白CBM结构域似乎也与改善Cel5A对结晶纤维素的活性相关。与仅具有一个DZ结构域的酶构建体相比,加入两个DZ结构域没有明显地增加酶活性。也注意到,具有一个或多个附加的DZ结构域的Cel5A构建体对结晶纤维素的活性仍然为野生型Cel5H纤维素酶的4倍更低。因此,制成了包含CBM结构域(CBM6)和来自Cel5H的DZ结构域两者的Cel5A构建体。就结晶纤维素的降解而言,在催化性Cel5A结构域和Cel5H DZ结构域之间引入CBM6 结构域增加了酶活性。实施例6 :Cel5H活性以游离的状态或结合至杂交多纤维素酶体中来补充或增加其他纤维素酶对结晶纤维素的活性进行动力学试验以研究Cel5H活性是否补充或增加其他纤维素酶在降解纯结晶纤维素中的活性。在这些试验中,测试下列的酶-来自解纤维素梭菌的野生型酶Cel5A(内切),Cel9G(内切),Cel9M(内切), Cel9P(内切),Cel48F(加工性)和Cel9E(加工性)。
-来自解纤维素梭菌的修饰的酶CipO_G(内切)-从除解纤维素梭菌以外的生物体分离的酶=NeocaIlimastix patriciarum(muschroom)的 Cel6A (夕卜切)。在Avicel 结晶纤维素(3. 5g/L棉塞,20mMTris-马来酸酯pH 6,ImM CaCl2 1)上温育M小时后由所述酶释放的可溶性糖类的量显示在图9中。对于每个酶组合,第一个条形表示两种酶单独活性的总和,而第二个条形表示两种酶的混合物的活性(每种酶以0. ImM 的浓度存在)。这些结果表明在大多数情况下其他纤维素的活性补充或增加Cel5H纤维素的活性。进一步的试验包括由包含Cel5H的杂交小型多纤维素酶体降解微晶纤维素 (Avicel),所述Cel5H附加有合适的锚定组件(诸如,例如,在图2中),一种或两种带有关联锚定蛋白的其他补充性纤维素酶并结合至展示任选的CBM3a组件的杂交支架蛋白(参见图10)。证明与单独Cel5H或其他纤维素酶相比,底物的降解增加。实施例7 由丙酮丁醇梭菌产生和分泌单独的或与其他纤维素酶(和/或支架蛋白)一起的Cel5H(野生型,改造的,具有修饰的信号序列)编码Cel5H的野生型基因通过PCR从S. degradans菌株中扩增,并克隆至大肠杆菌-丙酮丁醇梭菌PS0S952穿梭载体中。此质粒是丙酮丁醇梭菌的表达载体(Perret等, 2004. J Bacteriol (细菌学杂志)186 :253-7)。目的基因的表达处于编码硫解酶的基因的强力和组成型启动子(Pthl)的控制下。两个Iac操纵基因引入至pthl的上游和下游以防止大肠杆菌中该基因的任何表达。随后载体被甲基化(体内使用菌株ER2275[pANl],体外使用甲基化酶CpG)并且如以前所述用来电转化丙酮丁醇梭菌菌株。获得重组克隆并且对菌落的PCR试验指示该载体在产溶剂梭菌中仍然是完整的。几个克隆在2YTC培养基中生长,但与对照菌株相比在培养上清中没有检测到附加的CMC酶活性,所述对照菌株带有 “空” PS0S952 (在平板上的CMC酶试验)。由于S. degradans的GC含量为约46 %,而丙酮丁醇梭菌显示31 %的GC含量, 我们预测编码Cel5H的野生型基因可能不能适应丙酮丁醇梭菌密码子偏倚。如上所述在 PS0S952中制备并克隆编码野生型Cel5H但适应丙酮丁醇梭菌密码子偏倚的合成基因。关于丙酮丁醇梭菌的密码子优化的Cel5H编码序列显示在图IF(SEQ ID NO 6) 中,并且相应的多肽序列显示在图IG(SEQ ID NO 7)中。该序列含有改造的C-末端6xHis 标签以促进检测和/或分离。用此新载体(甲基化后)转化丙酮丁醇梭菌生成重组菌落。在2YTC中生长后对上清液的分析揭示改善的CMC酶活性,由此显示该重组菌株分泌有活性的Cel5H。分泌产量似乎目前仍然低于lmg/L。S. degradans是一种革兰氏阴性菌,其显示两层膜(外膜和胞质膜),而丙酮丁醇梭菌(革兰氏阳性菌)仅拥有胞质膜。Cel5H的天然信号序列因此被设计为解决跨越两层膜分泌的问题但可能不适合于被丙酮丁醇梭菌有效分泌。为此,使用分子生物学技术,我们将Cel5H的天然信号序列替换为来自解纤维素梭菌的Cel5A的天然信号序列,因为后者被丙酮丁醇梭菌充分分泌(至多达5mg/L)。我们用包含杂交基因的载体转化丙酮丁醇梭菌。 研究使用Cel5A信号序列时Cel5H的分泌产量。显示通过用来自解纤维素梭菌的Cel5A的天然信号序列替换Cel5H的天然信号序列增加了分泌水平。由于对pNP-纤维二糖糖苷的强Cel5H活性,我们能够测量到约0. 5mg/L的分泌水平。在发酵罐中在3g/L 2YT-PASC,pH固定在5,5的环境中生长重组细菌菌株的培养物。我们测量到PASC的降解,剩余纤维二糖的消耗和细菌生长。结果显示在图11和12中。在首个40小时期间观察到明显的细菌生长,直至OD值达到0.45。随后,发生细胞溶解。此时,观察到PASC的降解不断增加。117小时后,68%的PASC被消耗,但未能检测到单糖或寡糖。这提示通过水解PASC由Cel5H释放的糖类立即被细菌消耗。这些结果显示我们成功地构建了能够在补充PASC的培养基上生长的菌株。该重组细菌菌株的第二个培养物在发酵罐中在2YT (然而不含有任何PASC),pH固定在5,5的环境中生长。此试验的目标是检查细菌生长和PASC的消耗之间的相关性。结果显示在图12中。如我们期望的那样,在此情况下不能观察到细菌生长。因此,我们可以得出结论,观察到的细菌生长是由于PASC的降解和随后消耗释放的糖类所引起的。此外,建立第三个培养物,以检查观察到的细菌生长是否是由于Cel5H的活性而非丙酮丁醇梭菌的内源性酶系统的活性引起的。因此,含有空载体(PSOS)的菌株的培养物在发酵罐中在3g/L 2YT-PASC,pH固定在5,5的环境中生长。最后,第四个培养物在发酵罐中在5g/L 2YT-PASC,pH固定在5,5的环境中生长, 以检查PASC浓度是否是细菌生长的限制因素。因此,较高浓度的PASC可以潜在地导致较高的OD值(即,高于在前面试验中观察到的0. 45的最大OD值)。编码Cel5H的基因与编码其他纤维素酶的基因组合进行克隆,所述其他纤维素酶以游离的状态独立于Cel5H起作用。备选地,在丙酮丁醇梭菌中克隆和表达编码包含 Cel5H(附加有锚定蛋白)的有效小型多纤维素酶体的基因,支架蛋白和一种或两种其他的携带合适的锚定蛋白的纤维素酶。当克隆三种或四种不同的基因时,也使用称为pMTL的第二表达载体。此载体显示在丙酮丁醇梭菌中与PS0S952相容。备选地,这些基因在特定的位点处(诸如尤其在已授权的PCT/EP/2006/066997中所教导的),或随机地整合至染色体中。此外,在丙酮丁醇梭菌中克隆和表达具有Cel5H的增加的组件(特别地DZ和任选地CBM6,参见实施例4)的纤维素酶,以实现结晶纤维素的降解和利用的增加。我们使用丙酮丁醇梭菌的野生型和多种改造的菌株,诸如,例如,具有改良的分泌机器(machinery),为异源蛋白的分泌进行优化,和/或为最优化地产生乙醇(或丁醇)而具有改良的代谢的菌株。相应的重组丙酮丁醇梭菌显示产生和分泌改造的酶,并且展示在一种或多种纤维素物质上生长和/或降解所述一种或多种纤维素物质的能力。实施例8 改善丙酮丁醇梭菌对Cel5H的分泌制备了多种构建体并且图示于图13,其中使用了从不同支架蛋白获得的组件。在第一构建体中,将适应丙酮丁醇梭菌密码子偏倚并编码来自于Saccharophagus degradans的纤维素酶Cel5H的合成多聚核酸融合到这样的多聚核酸,所述这样的多聚核酸编码运载结构域并包含CBM3a组件、从丙酮丁醇梭菌的CipA蛋白获得的第一(Xa)和第二(Xa’)X组件和解纤维素梭菌的CipC支架蛋白的信号肽。使用适当的接头序列将不同组件相互连接。天然Cel5H多肽的结构域结构可概括为GH5-PSL-CBM6-EPR-DZ,其中GH5代表其糖苷水解酶家族5结构域,PSL代表聚丝氨酸接头,CBM6代表糖-结合组件家族6结构域, EPR代表富含-谷氨酸-脯氨酸区,以及不被这种解释所限制,DZ表示被本发明人鉴定为推测的糖-结合组件的C-末端结构域。这种构建体使用重叠延伸PCR技术来构建,并克隆在穿梭表达载体PS0S952 (其赋予对抗生素红霉素(erythromycin)的抗性)中,由此产生质粒pS0S952-CBM-Xa_Xa,-5H。 该构建体通过测序验证,并在体内和体外甲基化。随后甲基化的载体用于电转化丙酮丁醇梭菌菌株ATCC 824。通过丙酮丁醇梭菌分泌的附加有来自于解纤维素梭菌的支架蛋白CipC的信号肽的野生型Cel5H蛋白为0. 5-0. 9mg/L(数值是基于培养物上清对于对-硝基苯基-纤维二糖糖苷(para-nitrophenyl-cellobioside)的活性)。然而,携带两个编码融合蛋白的构建体(该融合蛋白包含连接到运载结构域的Cel5H蛋白)的丙酮丁醇梭菌菌株在它们的生长培养基中以显著更高的量分泌含有纤维素酶5H的融合蛋白,更特别地达到6. lmg/L (数值是基于培养物上清对于对-硝基苯基-纤维二糖糖苷的活性,参见图14(3))。这些结果证明丙酮丁醇梭菌产生和分泌了 Cel5H。实施例9.证明根据本发明的融合蛋白对纤维素的活性。使用分子生物学技术将编码实施例8中描述的不同蛋白构建体的DNA扩增并克隆在大肠杆菌表达载体(pET22b(+),Novagen)中。使用所产生的载体转化大肠杆菌菌株 BL21(DE3) (Novagen)。在所有情况下,在重组蛋白的C-末端终端移植六个His密码子以促进它们在镍树脂(Ni-NTA,Qiagen)上的纯化。重组菌株在LB培养基(Luria Bertani medium)中生长并且使用IPTG作为诱导物触发被克隆基因的表达。通过变性聚丙烯酰胺凝胶电泳(SDS-PAGE)验证重组蛋白的合成。离心培养物并在弗氏压碎器(French press)中破坏收获的细胞。通过在Ni-NTAOliagen)上装载粗提取物纯化重组蛋白,使用渐增浓度的咪唑鐺 (imidazolium)洗脱目的蛋白。使用 FPLC Q-琼脂糖(sepharose) (Hitrap Q HP 树脂,GE Healthcare)完成纯化。测试纯化的Cel5H酶对于对-硝基苯基-纤维二糖糖苷的活性,并且结果显示在图15a中。备选地,使用标准条件(37°C)测量对微晶纤维素(Avicel)(微晶纤维素)的活性。结果图示在图15b中。实施例10 关于Cel5H同源物,特别地关于来自假单胞菌属物种ND137的由基因 aclA编码的ACLA采用如实施例2_7中所述的克隆和表达策略。对于显示与来自S. degradans的Cel5H具有很大的整体同源性并且特别具有DZ 结构域的酶应用相同的策略。这由来自假单胞菌属物种ND137的由基因aclA编码的酶(ACLA)来例证。图16 比较了 ACLA与Cel5H的一般组织结构。编码ACLA的基因已经在大肠杆菌中克隆和过度表
iMffilSWBI^^^^^iiE (Aoki & KEimei 2006. European Journal of Phycology ( ^ 洲藻类学杂志)41 =321-328) 0鉴于这两种酶之间的高度同源性(除了接头以外),预期它们共享类似的特性/活性。因此,对ACLA应用实施例2-7中所述的克隆和表达策略,并且特别地在丙酮丁醇梭菌中产生另外的纤维素降解系统。实施例11 评价ACLA对多种底物包括对-硝基苯基-β _D_纤维二糖糖苷(pNPC), 磷酸溶胀纤维素(PASC)和微晶纤维素(Avicel)的活性使用标准条件(37°C )测试纯化的ACLA酶对多种底物的活性,并与纯化的重组 Cel5H对相同底物的活性进行比较。测试ACLA对可溶性生色底物对-硝基苯基-β -D-纤维二糖糖苷(pNPC)的酶活性,并与Cel5H(以95%纯度)的酶活性相比较。在对硝基苯基和纤维二糖之间的连接被该酶裂解后,对硝基酚和纤维二糖被释放,并且其浓度可以通过分光光度分析直接测定。ACLA 对于对-硝基苯基-β -D-纤维二糖糖苷的酶活性为17,9ui/μ mol,而Cel5H对相同底物的酶活性为18,2ui/ymol。因此,与Cel5H对于对-硝基苯基-β-D-纤维二糖糖苷底物的酶活性相比,ACLA显示98 %的酶活性。对于针对PASC (无定形纤维素)的活性的测试,使用的酶浓度为5ηΜ且底物浓度为3. 5g/L(pH 6. 0)。ACLA对PASC的酶活性为780ui/μ mol, M Cel5H对相同底物的酶活性为1600ui/ymolo因此,与Cel5H对PASC的酶活性相比,ACLA显示49%的酶活性。对于针对Avicel (结晶纤维素)的活性的测试,酶浓度为IOOnM且底物浓度为 3. 5g/L(pH 6. 0)。ACLA对Avicel的酶活性为56 μ M/Mh,而Cel5H对相同底物的酶活性为 140yM/24ho因此,与Cel5H对Avicel的酶活性相比,ACLA显示40%的酶活性。
权利要求
1.一种重组细菌,其表达&iccharophagus degradans 2-40株的Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体,所述重组细菌能够降解纤维ο
2.根据权利要求1所述的重组细菌,其包含编码所述Cel5H多肽或其同源物的重组核酸分子,或编码所述Cel5H多肽或所述同源物的功能片段和/或变体的重组核酸分子,所述重组核酸分子可操作地连接至允许在所述微生物中的表达的调节序列。
3.根据权利要求1或2中任一项所述的重组细菌,其是产溶剂细菌,更特别地是产乙醇细菌。
4.根据权利要求1-3中任一项所述的重组细菌,其是丙酮丁醇梭菌(Clostridium acetobutylicum)0
5.根据权利要求1-4中任一项所述的重组细菌,其中所述Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体融合至与所述Cel5H多肽或其同源物异源的一个或多个结构域,所述一个或多个结构域选自多纤维素酶体支架蛋白的糖苷水解酶 (GH)催化结构域,糖结合组件(CBM)结构域,黏结蛋白结合结构域诸如锚定结构域,和亲水 (X组件)结构域。
6.根据权利要求1-5中任一项所述的重组细菌,其中所述Cel5H多肽或其同源物,或所述Cel5H多肽或所述同源物的功能片段和/或变体,和任选地一种或多种能够降解含纤维素物质的酶,包含在杂交的和/或共价的多纤维素酶体或小型多纤维素酶体中。
7.Saccharophagus degradans 2-40株的Cel5H多肽的分离的结构域(DZ结构域),即所述Cel5H多肽的氨基酸496至氨基酸596或与其同源的分离的结构域,或所述DZ结构域或所述同源的结构域的功能片段和/或变体。
8.—种Cel5H多肽或其同源物或变体的分离片段,其具有结构EPR-DZ,CBM6-EPR-DZ或 PSL-CBM6-EPR-DZ,其中EI3R代表富含谷氨酸-脯氨酸的区域,且PSL代表聚丝氨酸接头。
9.一种嵌合多肽,其包含根据权利要求7所述的分离的结构域或其功能片段和/或变体,或Cel5H多肽的根据权利要求8所述的分离片段,且还包含与Cel5H多肽或其同源物异源的一个或多个结构域,所述一个或多个结构域选自多纤维素酶体支架蛋白的GH催化结构域,CBM结构域,黏结蛋白结合结构域诸如锚定结构域,和亲水(X组件)结构域。
10.一种重组核酸,其编码根据权利要求7所述的分离的结构域或其功能片段和/或变体,或Cel5H多肽的根据权利要求8所述的分离片段,或根据权利要求9所述的嵌合多肽。
11.根据权利要求10所述的重组核酸,还包含调节序列,所述调节序列允许在宿主细菌中的表达。
12.—种用根据权利要求10或11所述的重组核酸转化的宿主细菌。
13.根据权利要求12所述的宿主细菌,其为丙酮丁醇梭菌。
14.一种降解包含纤维素的物质的方法,所述方法包括使所述物质与根据权利要求 1-6中任一项所述的重组细菌,或与根据权利要求7所述的分离的结构域或其功能片段和/ 或变体、或Cel5H多肽的根据权利要求8所述的分离片段、或根据权利要求9所述的嵌合多肽、或根据权利要求9所述的嵌合肽、或根据权利要求12或13所述的宿主细菌接触。
15.一种由包含纤维素的物质产生溶剂、燃料或化学中间体的方法,所述方法包括用根据权利要求1-6中任一项所述的重组微生物或用根据权利要求11或12所述的宿主细菌处理所述物质。
16.根据权利要求14或15所述的方法,其中所述物质包含或富含结晶纤维素。
全文摘要
本发明涉及Saccharophagus degradans的纤维素酶Cel5H和其同源物、功能片段和/或变体及其改造形式在重组的,更特别地产溶剂微生物,更特别地丙酮丁醇梭菌(C.acetobutylicum)的背景中的应用。本发明还表征了具有推测的纤维素结合组件功能的Cel5H纤维素酶的一个新结构域,和其在用于解聚含纤维素的物质的嵌合蛋白中的应用。
文档编号C12N9/42GK102227498SQ200980147476
公开日2011年10月26日 申请日期2009年11月26日 优先权日2008年11月28日
发明者亨利-皮埃尔·菲耶罗布, 吕克·德迪厄, 安热莉克·沙纳尔-维亚尔, 昌塔尔·塔迪夫, 阿内-洛尔·莫利尼耶 申请人:国家科学研究中心, 国立应用科学学院, 地中海大学, 普罗旺斯大学, 道达尔公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1