新型糖基水解酶及其用途的制作方法

文档序号:392799阅读:752来源:国知局
专利名称:新型糖基水解酶及其用途的制作方法
技术领域
本公开内容一般涉及糖基水解酶,包括此类酶的组合物,和使用所述酶和组合物的方法,例如用于将纤维素和半纤维素材料糖化或转化为糖。3.背景自20世纪70年代起,当OPEC减少原油输出造成石油危机时,将可再生的木质纤维素生物量生物转化为可发酵的糖类就已经吸引了研究人员的广泛关注(Bungay,H. R.,“Energy :the biomass options” · NY :Wiley, 1981 ;01sson L, Hahn-Hagerdal B. EnzymeMicrob Technol 1996,18 :312-31 ;Zaldivar, J 等人,Appl Microbiol Biotechnol 2001,56 :17-34 ;Galbe, M 等人,Appl Microbiol Biotechnol 2002,59 :618-28),所述糖类之后被发酵生产醇类(例如,乙醇),作为液体燃料的替代品。过去二十年间,乙醇已经在USA被广泛用作汽油的10%的掺合物,在巴西则被用作净燃料。生物乙醇燃料的重要性将随着石油价格飞涨和石油来源的逐渐耗竭而平行的增加。此外,可发酵的糖类正递增的用于生产塑料、聚合物和其他基于生物的产品,并且预期在未来数年该工业将得到实质性的扩展。因而,对于丰富的低成本可发酵糖类的需求不断增长,所述糖类可用作替代基于石油原料的原料。有用的可再生原料中主要是纤维素和半纤维素(木聚糖),其可以转化为可发酵的糖类。由于多种酶的组合作用,发生这些多糖向可溶性糖的酶促转化,例如葡萄糖、木糖、阿拉伯糖、半乳糖、甘露糖和/或其他己糖和戊糖。例如,内切-1,4-β-葡聚糖酶(EG)和外切纤维二糖水解酶(CBH)催化不可溶的纤维素水解为纤维寡糖(例如,以纤维二糖为主要产物),而葡糖苷酶(BGL)催化寡糖转化为葡萄糖。木聚糖酶与其他辅助蛋白(非限制性实例包括L-α -阿拉伯呋喃糖苷酶、阿魏酸和乙酰木聚糖酯酶、葡糖醛酸糖苷酶和β -木糖苷酶)一起催化半纤维素的水解。植物的细胞壁包括通过共价和非共价手段相互作用的复杂多糖的异源混合物。高等植物细胞壁的复杂多糖包括例如纤维素(β -I,4葡聚糖),纤维素一般构成35-50%的在细胞壁组分中发现的碳。纤维素多聚体本身通过氢键、范德华氏相互作用和疏水性相互作用相关联,形成半结晶状纤维素微纤丝。这些微纤丝还包括非结晶的区域,一般被称为无定型纤维素。纤维素微纤丝包埋在由半纤维素(包括例如木聚糖、阿拉伯聚糖和甘露聚糖)、果胶(例如,聚半乳糖醛酸和半乳聚糖)和各种其他β_1,3和β-I,4葡聚糖形成的基质中。这些基质聚合物通常被例如阿拉伯糖、半乳糖和/或木糖残基取代,产生高度复杂的阿拉伯木聚糖、阿拉伯半乳聚糖、半乳甘露聚糖和木葡聚糖。反过来,半纤维素基质被多酚木质素包围。
基质的复杂性使得难以通过微生物降解,在酶可以作用于核心的纤维素微纤丝之前,必须降解木质素和半纤维素组分。一般,降解细胞壁聚合物来释放组分单糖需要不同酶活性的联合。为了糖化植物细胞壁,必须渗透木质素且破坏半纤维素,允许纤维素降解酶可以作用于它们的底物。不论纤维素原料的类型,酶的成本和水解效率是限制生物量生物转化方法商业化的主要因素。微生物生产酶的生产成本与酶生产菌株的生产力及其在发酵培养基中的最终活性产量密切相关。多酶复合体的水解效率取决于每个酶的特性,它们之间的协同作用,以及它们在多酶掺合物中的比例。本领域中存在这样的需求,即鉴别能够以改善的效率和产量,将植物和/或其他纤维素或半纤维素材料转化为可发酵糖类的酶和/或酶掺合物/组合物。4.概述本公开内容提供了某些具有半纤维素水解活性的糖基水解酶多肽,包括例如木聚
糖酶(例如,内切木聚糖酶)、木糖苷酶(例如,β -木糖苷酶)、阿拉伯呋喃糖苷酶(例如,L-α-阿拉伯呋喃糖苷酶),编码这些多肽的核酸,和用于制造和使用所述多肽和/或核酸的方法。本公开内容是部分的基于发现具有木聚糖酶、β -木糖苷酶和/或L- α -阿拉伯呋喃糖苷酶活性的新型的酶和变体。本公开内容还基于鉴别出有效催化纤维素和半纤维素材料水解的酶掺合物(或组合物)。出于本公开内容的目的,酶可以定义为具有特定酶活性的多肽,或者是所述酶。例如木聚糖酶可以指具有木聚糖酶活性的多肽或是木聚糖酶,β_木糖苷酶可以指具有木糖苷酶活性的多肽或者木糖苷酶。本公开内容的酶和/或酶掺合物/组合物可用于从生物量生产糖类。如此生产的糖类可被微生物用于乙醇生产或可用于生产多种工业应用中的其他生物产品。因此,本公开内容还提供了使用本文所述的酶和/或酶掺合物/组合物的工业应用(例如,乙醇生产中的糖化方法)。本公开内容的酶和/或酶掺合物/组合物可用于减少生物燃料生产中的酶成本。在一个方面,本公开内容的发明涉及有效用于水解木质纤维素生物量的主要组分(包括例如,纤维素、半纤维素和木质素)或任何包含纤维素和/或半纤维素的材料的酶(包括其变体)或酶掺合物/组合物。此类木质纤维素生物量和/或包括纤维素和/或半纤维素的材料包括例如种子、谷类、块茎、食品加工或工业加工的植物废弃物或副产物(例如,茎)、玉米(包括例如,玉米棒、秸杆等)、草(例如,印度草,如印度落芒草(Sorghastrum nutans);或柳枝稷(switchgrass),如黍属(Panicum)物种,例如柳枝稷(Panicum virgatum))、木材(包括例如,木屑、下脚料)、纸、纸衆、再生纸(例如,报纸)。本发明的酶掺合物/组合物可用于水解在植物之间不相同的复杂结构的纤维素(其包含线性链状的β -1,4-连接的葡萄糖部分),或半纤维素。本发明的酶掺合物/组合物可包括多种不同的酶,包括例如纤维素酶和/或半纤维素酶。例如,本发明的酶掺合物/组合物可以用于水解生物量或适宜地原料。本发明的酶掺合物/组合物理想的包括酶的混合物,选自例如木聚糖酶、木糖苷酶、纤维二糖水解酶、阿拉伯呋喃糖苷酶和/或其他可以消化半纤维素为单体糖的酶。本发明的酶掺合物/组合物可包括两种或多种、三种或多种,或四种或多种的酶的混合物,所述酶选自一种或多种木聚糖酶、一种或多种木糖苷酶、一种或多种纤维二糖水解酶、一种或多种阿拉伯呋喃糖苷酶和一种或多种其他能够将半纤维素转化为单体糖的酶。可以消化半纤维素为单体糖的其他的酶包括但不限于纤维素酶、半纤维素酶或包含纤维素酶或半纤维素酶的组合物。本发明的酶掺合物/组合物可包括两种或多种、三种或多种,或四种或多种的酶的混合物,所述酶选自木聚糖酶、木糖苷酶、纤维二糖水解酶、阿拉伯呋喃糖苷酶和至少一种其他可以转化半纤维素为单体糖的酶。本发明的酶掺合物/组合物的非限制性实例包括木聚糖酶、木糖苷酶、纤维二糖水解酶、阿拉伯呋喃糖苷酶和β-葡糖苷酶的混合物。本发明的酶掺合物/组合物适合是非天然存在的。如本文中使用的,术语“天然存在的组合物”指由天然存在的来源生产的组合物,包括一种或多种酶组分或活性,其中每种这些组分或活性都被发现处于天然存在的来源所产生的比例和水平,如同在自然的、未被人工接触和修饰的条件下发现的。相应的,天然存在的组合物是例如由对于纤维素水解或半纤维素水解酶没有修饰的生物体所生产的组合物,使得所述组分酶的比例或水平与天然环境中的天然生物体所生产的没有变化。另一方面,“非天然存在的组合物”指由以下生产的组合物(1)以天然存在的比例或非天然存在的(即,改变的)比例组合的纤维素水解或半纤维素水解组分酶;或(2)修饰生物体使得表达、过表达或低表达一种或多种内源性或外源性酶;或⑶修饰生物体使得删除了至少一种内源性酶。“非天然存在的组合物”还可以指由天然存在的和未修饰的生物体所生产的组合物,但所述生物体培养在不同于生物体的天然环境的人造基质或环境中,使得组合物中特定酶的量或重量比不同于由天然栖息地中生长的天然生物体所制造的组合物中存在的量或重量比。本文所述的本发明的酶掺合物/组合物是例如发酵培养基。发酵培养基可以是丝状真囷之一,包括例如木霉属、腐质霉属、键抱霉属、曲霉属、脉抱囷属、青霉属、头抱霉属、绵霉属、柄孢壳属、内座壳属、毛霉属、旋孢腔菌、梨孢属(Pyricularia)或金孢子菌属(Chrysosporium)。木霉属物种的示例性真菌是里氏木霉(Trichoderma reesei)。青霉属物种的示例性真菌是绳状青霉(Penicillium funiculosum)。发酵培养基可以是例如无细胞的发酵培养基或全细胞培养基。在另一个实例中,本文所述的本发明的酶掺合物/组合物是纤维素酶组合物。纤维素酶组合物是丝状真菌的纤维素酶组合物,包括例如木霉,如里氏木霉的纤维素酶组合物。纤维素酶组合物可以由丝状真菌生产,例如木霉,如里氏木霉。例如,本发明的酶掺合物/组合物可包括(a) —种或多种木聚糖酶,其中所述一种或多种木聚糖酶的至少一种是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ; (b)一种或多种木糖苷酶,其中至少一种所述一种或多种木糖苷酶是I型β-木糖苷酶或2型β -木糖苷酶,其中I型β -木糖苷酶是Fv3A或Fv43A,2型β -木糖苷酶是Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A 或里氏木霉 Bxll ; (c) 一种或多种L-α -阿拉伯呋喃糖苷酶,其中至少一种所述一种或多种L-α -阿拉伯呋喃糖苷酶是Af43A、Fv43B、Pf51A、Pa51A或Fv51A ; (d) 一种或多种纤维素酶;和任选的(e) 一种或多种其他组分。酶掺合物/组合物适宜地是非天然存在的。根据calcofluor测定所确定的,(d)的一种或多种纤维素酶理想的能够达到至少O. 00005级分产物/毫克蛋白质/克磷酸溶胀的纤维素(PASC)。在非限制性的实例中,组合物中的木聚糖酶的组合重量可代表或构成组合物中组合的或总蛋白重量的5wt%至45wt% (例如,5wt%至25wt %, 5wt %至15wt%,15wt% ),而β -木糖苷酶的组合重量可代表或构成组合物中总蛋白重量的 2wt% 至 50wt% (例如,2wt% 至 30wt%, 5wt% 至 25wt%, 5wt% 至 10wt% ), L- α -阿拉伯呋喃糖苷酶的组合重量可代表或构成组合物中组合的或总蛋白重量的2 〖%至50wt%(例如,2¥七%至3(^七%,2¥七%至2(^七%,5¥七%至15¥七%,5¥七%至10wt% ),而纤维素酶的组合重量可代表或构成组合物中组合的或总蛋白重量的30wt %至80wt % (例如,40wt %至70被%,50被%至60wt% )。如本文所述的酶掺合物/组合物是例如发酵培养基组合物。发酵培养基是例如一种丝状真菌,包括但不限于木霉属、腐质霉属、镰孢霉、曲霉属、脉孢菌属、青霉属、头孢霉属、绵霉属、柄孢壳属、内座壳属、毛霉属、旋孢腔菌、梨孢属或金孢子菌属。木霉属物种的示例性真菌是里氏木霉。青霉属物种的示例性真菌是绳状青霉。发酵可以是例如无细胞的发酵培养基或全细胞培养基。如本文所述的酶掺合物/组合物还可以是纤维素酶组合物,例如丝状真菌的纤维素酶组合物。纤维素酶组合物可以由丝状真菌生产,例如木霉属。例如,本发明的酶掺合物/组合物可包括(a) —种或多种木聚糖酶,其中至少一种所述一种或多种木聚糖酶是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ; (b) 一种
或两种I型β -木糖苷酶Fv3A或Fv43A ; (c) 一种或多种选自Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A和/或里氏木霉Bxll的2型β -木糖苷酶;(d) 一种或多种纤维素酶;和任选的(e) —种或多种其他组分。根据calcofluor测定所确定的,(d)的一种或多种纤维素酶理想的能够达到至少O. 00005级分产物/毫克蛋白质/克磷酸溶胀的纤维素(PASC)。酶掺合物/组合物适宜地是非天然存在的。在非限制性的实例中,组合物中的木聚糖酶的组合重量可代表或构成组合物中组合的或总蛋白重量的5¥丨%至45wt% (例如,5wt%至25wt%, 5wt%至15wt%, IOwt %至15wt% ),而I型β -木糖苷酶的组合重量可构成组合物中总蛋白重量的2wt%至50wt% (例如,2wt%至30wt %, 5wt %至
至10wt% ),而2型β -木糖苷酶的组合重量可构成组合物中总蛋白重量的2¥七%至50界七%(例如,2wt%至30wt %, 5wt %至25wt %, 5wt %至10wt% ),其中纤维素酶的组合重量可代表或构成组合物中组合的或总蛋白重量的3(^七%至80wt% (例如,4(^七%至70wt%,50界七%至60wt% )。I型β -木糖苷酶的重量与2型β -木糖苷酶的重量的比例可以是例如 I : 10 至 10 1(例如,I 8 至 8 1、1 6 至 6 1、1 4 至 4 1、1 2 至 2 I或I : I)。酶掺合物/组合物可进一步包含额外的组分,可以是辅助蛋白或其他蛋白质/非蛋白质组分。额外的组分可以构成例如组合物中的总蛋白重量的^^%至50wt%、lwt%至lOwt^dwt1^至Swt^jwt^至IOwt %或5wt%至20wt%。如本文所述的酶掺合物/组合物是例如发酵培养基组合物。发酵培养基是例如一种丝状真菌,包括但不限于木霉属、腐质霉属、键抱霉、曲霉属、脉抱圃属、青霉属、头抱霉属、绵霉属、柄抱壳属、内座壳属、毛霉属、旋孢腔菌、梨孢属或金孢子菌属。木霉属物种的示例性真菌是里氏木霉。青霉属物种的示例性真菌是绳状青霉。发酵可以是例如无细胞的发酵培养基或全细胞培养基。如本文所述的酶掺合物/组合物还可以是纤维素酶组合物,例如丝状真菌的纤维素酶组合物。纤维素酶组合物可以由丝状真菌生产,例如木霉属。在其他实例中,本发明的酶掺合物/组合物可包括(a) —种或多种木聚糖酶,其中至少一种所述一种或多种木聚糖酶是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ;(b) 一种或多种β-木糖苷酶,其中至少一种所述一种或多种β_木糖苷酶是I型β_木糖苷酶或2型β-木糖苷酶,其中I型β-木糖苷酶是Fv3A或Fv43A,2型β -木糖苷酶是 Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A 和 / 或里氏木霉 Bxll ; (c) 一种或多种L-α -阿拉伯呋喃糖苷酶,其中至少一种所述一种或多种L-α -阿拉伯呋喃糖苷酶是Af43A、Fv43B、Pf51A或Fv51A ;(d) —种或多种β _葡糖苷酶;和任选的(e) —种或多种其他组分。酶掺合物/组合物适宜地是非天然存在的。在非限制性的实例中,组合物中的木聚糖酶的组合重量可代表或构成组合物中组合的或总蛋白重量的5¥丨%至45¥丨% (例如,5wt%至至15wt%, 10wt%至15wt% ),而β -木糖苷酶的组合重量可构成组合物中总蛋白重量的2wt%至50wt% (例如,2wt%至30wt %, 5wt %至至10wt% ),L-α-阿拉伯呋喃糖苷酶的组合重量可构成组合物中总蛋白重量的2¥丨%至50wt% (例如,2¥七%至3(^七%,5¥七%至25¥七%,5¥七%至1(^七%),其中,β-葡糖苷酶的组合重量可构成组合物中组合的或总蛋白重量的2wt%至50wt% (例如,多达SOwt^dwt1^至10wt%,或3 丨%至8 丨% )。酶掺合物/组合物可进一步包含额外的组分,可以是辅助蛋白或其他蛋白质/非蛋白质组分。额外的组分可以构成例如组合物中的总蛋白重量的
Iwt % 至 50wt %、Iwt % 至 IOwt %、2wt % 至 5wt %、5wt % 至 IOwt % 或 5wt % 至 20wt %。如本文所述的酶掺合物/组合物是例如发酵培养基组合物。发酵培养基是例如一种丝状真菌,包括但不限于木霉属、腐质霉属、键抱霉、曲霉属、脉抱圃属、青霉属、头抱霉属、绵霉属、柄孢壳属、内座壳属、毛霉属、旋孢腔菌、梨孢属或金孢子菌属。木霉属物种的示例性真菌是里氏木霉。青霉属物种的示例性真菌是绳状青霉。发酵可以是例如无细胞的发酵培养基或全细胞培养基。如本文所述的酶掺合物/组合物还可以是纤维素酶组合物,例如丝状真菌的纤维素酶组合物。纤维素酶组合物可以由丝状真菌生产,例如木霉属。本发明的酶掺合物/组合物还可包括例如(a) —种或多种木聚糖酶,其中至少一种所述一种或多种木聚糖酶是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ; (b) 一种或两种的I型β -木糖苷酶Fv3A或Fv43A ; (c) 一种或多种选自Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A和/或里氏木霉Bxll的2型β -木糖苷酶;(d) 一种或多种β_葡糖苷酶;和任选的(e) —种或多种其他组分。酶掺合物/组合物适宜地是非天然存在的。在非限制性的实例中,木聚糖酶的组合重量构成组合物中总蛋白重量的5wt%至 45wt% (例如,5wt% 至 25wt%, 5wt% 至 15wt%, IOwt % 至 15wt% ),而 I 型 β -木糖苷酶的组合重量构成组合物中总蛋白重量的2wt%至50wt% (例如,2wt%至SOwtWAwt1^至25¥七%,5¥七%至10wt% ),而2型β-木糖苷酶的组合重量构成组合物中总蛋白重量的2wt% 至 50wt% (例如,2wt% 至 30wt%, 5wt% 至 25wt%, 5wt% 至 10wt% ), β -葡糖苷酶的组合重量构成组合物中总蛋白重量的2wt%至50wt% (例如,2wt%至30wt %, 5wt %至至IOwt%)。I型β-木糖苷酶的重量与2型β -木糖苷酶的重量的比例可以是例如 I : 10 至 10 I (例如,I :8 至 8: I、1:6 至 6: I、1:4 至 4: I、1:2至2 I或I : I)。酶掺合物/组合物可进一步包含额外的组分,可以是辅助蛋白或其他蛋白质/非蛋白质组分。额外的组分可以构成例如组合物中的总蛋白重量的Iwt %至50wt %、Iwt %至10wt%、2wt%至5wt%、5wt%至IOwt %或5wt%至20wt%。如本文所述的酶惨合物/组合物是例如发酵培养基组合物。发酵培养基是例如一种丝状真菌的发酵培养基,包括但不限于木霉属、腐质霉属、键抱霉、曲霉属、脉抱圃属、青霉属、头抱霉属、绵霉属、柄抱壳属、内座壳属、毛霉属、旋孢腔菌、梨孢属或金孢子菌属。木霉属物种的示例性真菌是里氏木霉。青霉属物种的示例性真菌是绳状青霉。发酵可以是例如无细胞的发酵培养基或全细胞培养基。如本文所述的酶掺合物/组合物还可以是纤维素酶组合物,例如丝状真菌的纤维素酶组合物。纤维素酶组合物可以由丝状真菌生产,例如木霉属。此外,本发明的酶掺合物/组合物可包括,例如(a) —种或多种木聚糖酶,其中至少一种所述一种或多种木聚糖酶是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ; (b)一种或多种β -木糖苷酶,其中至少一种所述一种或多种木糖苷酶是I型β-木糖苷酶或2型β-木糖苷酶,其中I型β-木糖苷酶可以是Fv3A或Fv43A,2型β-木糖苷酶可以是 Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A 和 / 或里氏木霉 Bxll ;和(c)一种或多种L-α -阿拉伯呋喃糖苷酶,其中至少一种所述一种或多种L-α -阿拉伯呋喃糖苷酶是Af43A、Fv43B、Pf51A或Fv51A ;和任选的(d) —种或多种其他组分。酶掺合物/组合物适宜地是非天然存在的。在非限制性的实例中,组合物中的木聚糖酶的组合重量构成组合物中总蛋白重量的5wt%至45wt% (例如,5wt%至25wt%, 5wt%至15wt%, 10wt%至15wt%),而β-木糖苷酶的组合重量构成组合物中总蛋白重量的(例如,2wt%至30wt%, 5wt%至25wt%, 5wt%至IOwt % ) ,L-α -阿拉伯呋喃糖苷酶的组合重量构
成组合物中总蛋白重量的2wt%至50wt% (例如,2wt%至30wt %, 5wt %至
至10wt% )。酶掺合物/组合物可进一步包含额外的组分,可以是辅助蛋白或其他蛋白质/非蛋白质组分。额外的组分可以构成例如组合物中的总蛋白重量的Iwt %至50wt %、Iwt %至lOwt^dwt1^至Swt^jwt^至IOwt %或5wt%至20wt%。如本文所述的酶掺合物/组合物是例如发酵培养基组合物。发酵培养基是例如一种丝状真菌,包括但不限于木霉属、腐质霉属、键抱霉、曲霉属、脉抱圃属、青霉属、头抱霉属、绵霉属、柄抱壳属、内座壳属、毛霉属、旋孢腔菌、梨孢属或金孢子菌属。木霉属物种的示例性真菌是里氏木霉。青霉属物种的示例性真菌是绳状青霉。发酵可以是例如无细胞的发酵培养基或全细胞培养基。如本文所述的酶掺合物/组合物还可以是纤维素酶组合物,例如丝状真菌的纤维素酶组合物。纤维素酶组合物可以由丝状真菌生产,例如木霉属。本发明的酶掺合物/组合物还可以是包括(a) —种或多种木聚糖酶,其中至少一种所述一种或多种木聚糖酶是里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2或AfuXyn5 ; (b) 一种或两种的I型β -木糖苷酶Fv3A或Fv43A ; (c) 一种或多种选自Pf43A、Fv43D、Fv39A、Fv43E、Fo43A、Fv43B、Pa51A、Gz43A和/或里氏木霉Bxll的2型β-木糖苷酶;和任选的(d)一种或多种其他组分。酶掺合物/组合物适宜地是非天然存在的。在非限制性的实例中,木聚糖酶的组合重量构成组合物中总蛋白重量的5wt%至45wt% (例如,5wt%至25wt%,5wt%至15wt%, 10wt%至15wt% ),而I型β -木糖苷酶的组合重量构成组合物中总蛋白重量的 2wt % 至 50wt % (例如,2wt % 至 30wt %, 5wt % 至 25wt %, 5wt % 至 IOwt % ),而 2型木糖苷酶的组合重量构成组合物中总蛋白重量的(例如,2¥丨%至30界七%,5¥丨%至25¥丨%,5¥丨%至10wt% )。I型木糖苷酶的重量与2型β -木糖苷酶的重量的比例可以是例如I : 10至10 I (例如,I : 8至8 : 1、1 : 6至6 : 1、1 : 4至4 : 1、1 : 2至2 : I或I : I)。酶掺合物/组合物可进一步包含额外的组分,可以是辅助蛋白或其他蛋白质/非蛋白质组分。额外的组分可以构成例如组合物中的总蛋白重量的 Iwt %至 50wt%、Iwt %至 IOwt %、2wt%至 5wt%、5wt%至 IOwt %或 5wt%至 20wt%。如本文所述的酶掺合物/组合物是例如发酵培养基组合物。发酵培养基是例如一种丝状真囷,包括但不限于木霉属、腐质霉属、键抱霉、曲霉属、脉抱囷属、青霉属、头抱霉属、绵霉属、柄孢壳属、内座壳属、毛霉属、旋孢腔菌、梨孢属或金孢子菌属。木霉属物种的示例性真菌是里氏木霉。青霉属物种的示例性真菌是绳状青霉。发酵可以是例如无细胞的发酵培养基或全细胞培养基。如本文所述的酶掺合物/组合物还可以是纤维素酶组合物,例如丝状真菌的纤维素酶组合物。纤维素酶组合物可以由丝状真菌生产,例如木霉属。本公开内容的酶、酶掺合物/组合物可用于食品工业,例如烘焙、水果和蔬菜加工、降解农业废弃物、生产动物饲料、生产纸浆和纸、生产纺织物或者家用和工业清洁剂。本公开内容的酶和酶掺合物/组合物中的酶是例如由微生物独立生产的,例如由真菌或细菌。本公开内容的酶、酶掺合物/组合物还可用作消化任何合适来源的木质纤维素的商业酶或组合物,包括所有的生物学来源,例如植物生物量,如玉米、谷类、草(例如,印
度草,如印度落芒草(Sorghastrum nutans);或柳枝稷,如黍(Panicum)物种,例如柳枝稷(Panicum virgatum))或者,木材或木材加工的副产物,例如木材加工、纸衆和/或造纸业、纺织物生产、家用和工业清洁剂和/或生物量废弃物加工中的副产物。在另一个方面,本公开内容提供了分离的、合成的或重组的核酸,其与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49 或 50 的核酸序列,在至少约 10 个,例如至少约 15、20、25、30、35、40、45、50、75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1100、I150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950或2000个残基的区域,具有至少约70%,例如至少约71 %、72%、73%、74%、75%、76%,77%,78%,79%,80%,81 %,82%,83%,84%,85%,86%,87%,88% ;89%,90%,91%、92%、93%、94%、95%、96%、97%、98%、99%或完全(100%)的序列同一性。相关的,本公开内容提供了分离的、合成的或重组的核酸,其能够在高严紧条件下,与SEQ IDNO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49 或 50的核酸序列的97%、98%、99%或完全(100%)的序列同一性的互补体,或与其片段杂交。片段可以是例如长度上至少150个连续残基,例如长度是至少200、250或300个连续残基。本公开内容提供了编码具有半纤维素水解活性的多肽的核酸。示例性的半纤维素水解活性包括但不限于木聚糖酶、β_木糖苷酶和/或L-α-阿拉伯呋喃糖苷酶活性。示例性的具有半纤维素水解活性的多肽包括但不限于木聚糖酶、β -木糖苷酶和/或L- α -阿拉伯呋喃糖苷酶。本公开内容进一步提供了分离的、合成的或重组的核酸,其编码本公开内容的酶,包括包含SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43或44的氨基酸序列或其子序列(例如,催化结构域(“CD”)或碳水化合物结合模块(“CBM”))的多肽,或其适宜地变体。在一些实施方案中,本公开内容的核酸编码氨基酸序列为 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43或44的蛋白质的成熟部分,任选的与异源信号序列有效连接,例如里氏木霉CBHI信号序列。核酸理想的编码具有半纤维素水解活性的多肽,例如,木聚糖酶、β_木糖苷酶和/或L-α-阿拉伯呋喃糖苷酶活性。本公开内容的核酸编码半纤维素酶,例如木聚糖酶、β-木糖苷酶和/或L-α -阿拉伯呋喃糖苷酶,或其适宜地变体。本公开内容的其他核酸描述在下文6.2节中。本公开内容额外的提供了包含本公开内容的核酸或其子序列的表达盒。例如,核酸与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49或50的核酸序列,在至少约10个,例如至少约10、20、30、40、50、75、90、100、150、200、250、300、350、400或500个残基的区域,包括至少约70 %,例如至少约75 %、80 %、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性。在另一个实例中,核酸编码 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43或44的多肽,其中所述核酸任选的与启动子有效连接。启动子可以是例如真菌、病毒、细菌、哺乳动物或植物的启动子。启动子可以是组成型启动子或可诱导型启动子。示例性的合适启动子是在丝状真菌中可表达的启动子,例如在里氏木霉中可表达的启动子。适宜地启动子可以源自丝状真菌例如里氏木霉,如里氏木霉的纤维二糖水解酶I (cbhl)
基因的启动子。本公开内容进一步提供了重组细胞,所述细胞经改造表达本公开内容的核酸或本公开内容的表达盒。例如,核酸与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49或50的核酸序列,在至少约10个,例如至少约15、20、25、50、75、100、150、200、250、300、400或500个核苷酸残基的区域,包括至少约70 %,例如至少约 75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 的序列同一性。核酸可以编码SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43或44的多肽,其中所述核酸任选的与启动子有效连接。表达盒可以包括这样的核酸,所述核酸与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49或50的核酸序列,在至少约10个核苷酸残基的区域具有至少约 70% (例如至少约 75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的序列同一性。例如,表达盒可以包括编码SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43 或 44 的多肽的核酸,其中所述核酸任选的与启动子有效连接。重组细胞理想的是重组细菌细胞、重组哺乳动物细胞、重组真菌细胞、重组酵母细胞、重组昆虫细胞、重组藻类细胞或重组植物细胞。例如,重组细胞是重组的丝状真圃细胞,例如木霉属、腐质霉属、键抱霉、曲霉属、脉抱圃属、青霉属、头抱霉属、绵霉属、柄孢壳属、内座壳属、毛霉属、旋孢腔菌、梨孢属或金孢子菌属细胞。本公开内容提供了包含本公开内容的核酸或本公开内容的表达盒的转基因植物。本公开内容提供了分离的、合成的或重组的多肽,其包括与SEQ IDNO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43 或 44 的多肽在至少约 10个,例如至少约 15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325或350个残基的区域,或在全长的未成熟多肽、全长的成熟多肽、全长的⑶或全长的CBM上,具有至少约80%,例如至少约81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或 99% 或完全的(100% )序列同一性的氨基酸序列。示例性的多肽包括长度至少约10个,例如至少约 15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550、600个残基的片段。在特定的实施方案中,片段包括⑶和/或CBM。当片段同时包括本公开内容的酶的CD和CBM时,片段任选的包括分开CD和CBM的接头。接头可以是天然接头或异源的接头。在某些实施方案中,本公开内容的多肽具有一种或多种半纤维素酶活性。本公开内容的多肽或肽序列是由本公开内容的核酸编码的。示例性的多肽描述在6. I节中。本公开内容额外的提供了嵌合的或融合的蛋白质,所述蛋白质包括本公开内容的多肽的至少一个结构域(例如,CD、CBM或两者)。至少一个结构域可以与第二氨基酸序列有效连接,例如,信号肽序列。相反,本公开内容提供了嵌合的或融合的蛋白质,所述蛋白质包括本公开内容的多肽的信号序列与第二序列有效连接,例如编码不与信号序列天然相关的异源多肽的氨基酸序列。相应的,本公开内容提供了包括SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43 或 44 的残基 I 至 13、1 至 14、1 至 15、1 至 16、1 至 17、1至 18、1 至 19、1 至 20、1 至 21、1 至 22、1 至 23、1 至 24、1 至 25、1 至 26、1 至 27、1 至 28、1至 28、1 至 30、1 至 31、1 至 32、1 至 33、1 至 34、1 至 35、1 至 36、1 至 37、1 至 38 或 I 至 40的重组多肽。其他的示例性的嵌合或融合多肽描述在6. I. I节中。本公开内容还提供了生产重组多肽的方法,包括(a)培养经改造表达本公开内容的多肽的宿主细胞;和(b)回收所述多肽。多肽的回收包括例如回收包含多肽的发酵培养基。在某些实施方案中,多肽的回收可以包括其他纯化步骤。本公开内容提供了水解、降解或打断包含纤维寡糖、阿拉伯木聚糖寡聚物或葡聚糖或纤维素的组合物的方法,包括在适宜地条件下将所述组合物与本公开内容的酶、酶掺合物/组合物接触,其中所述酶或酶掺合物/组合物水解、降解或打断包含纤维寡糖、阿拉伯木聚糖寡聚物或葡聚糖或纤维素的组合物。本公开内容提供了酶“掺合物”或组合物(在本文中也称为“酶掺合物/组合物”),包括本公开内容的多肽,或由本公开内容的核酸编码的多肽。在一些实施方案中,本公开内容的多肽具有一种或多种选自木聚糖酶、β -木糖苷酶和L- α -阿拉伯呋喃糖苷酶活性的活性。在某些实施方案中,酶掺合物/组合物用于或有效用于纤维素和半纤维素聚合物解聚为可代谢的碳部分。本公开内容的酶掺合物可以是组合物的形式,例如作为生产的产品。组合物可以是例如制剂,并可以采用例如液体或固体的形式。在示例性的实施方案中,本公开内容的酶掺合物/组合物包括这样的纤维素酶,所述纤维素酶包含至少三种不同酶类型,选自(I)内切葡聚糖酶、(2)纤维二糖水解酶和(3) β-葡糖苷酶;或者包含至少三种不同的酶活性,选自(I)催化切割纤维素或半纤维素材料内部的β_1,4连接的内切葡聚糖酶活性,获得更短的葡寡糖,(2)以“外切”的方式,催化切割和释放纤维二糖单位(例如β_1,4葡萄糖-葡萄糖二糖)的纤维二糖水解酶活性,和(3)催化从短的纤维寡糖(例如,纤维二糖)中释放葡萄糖单体的葡糖苷酶活性。本公开内容的示例性的酶掺合物/组合物描述在下文6. 3. 4节中。在另一个方面,本公开内容提供了加工包含木质纤维素的生物量材料的方法,包括将包含纤维素和/或可发酵的糖的组合物与本公开内容的多肽、本公开内容的核酸编码的多肽、或本公开内容的酶掺合物/组合物(例如,制品)接触。适宜地含木质纤维素的生物量材料可源自农业作物、食品或饲料生产的副产品、木质纤维素废弃物产品、植物残余物或废纸或废纸产品。本公开内容的多肽可具有一种或多种选自纤维素酶、内切葡聚糖酶、纤维二糖水解酶、β -葡糖苷酶、木聚糖酶、甘露聚糖酶、木糖苷酶、阿拉伯呋喃糖苷酶和其他半纤维素酶活性的酶活性。适宜地植物残余物可包括谷类、种子、茎、叶、谷壳、外壳、玉米棒、玉米秸杆、稻草秸杆、草、木材、木屑、木浆和锯屑。草可以是例如印度草或柳枝稷。草还可以是例如芒属植物(Miscanthus)。纸废弃物可以是例如丢弃或使用过的影印纸、计算机打印纸、笔记本纸、记事本纸、打字机纸、报纸、杂志、纸板和各种基于纸的包装材料。纸废弃物还可以是例如纸浆。本公开内容提供了包含半纤维素水解酶和纤维素水解酶的混合物的组合物(包括酶、酶掺合物/组合物,例如本公开内容的制品),以及至少一种生物量材料。任选的,生物量材料包括源自农业作物的木质纤维素材料。可选的,生物量材料是食品或饲料生产的副产品。适宜地生物量材料还可以是木质纤维素废品、植物残余物、废纸或废纸产品,或包括植物残余物。植物残余物可以是例如包括谷类、种子、茎、叶、谷壳、外壳、玉米棒、玉米秸杆、草、稻草秸杆、木材、木屑、木浆和锯屑。示例性的草包括但不限于印度草或柳枝稷。示例性的草还可以包括芒属植物。示例性的纸废弃物包括但不限于丢弃或使用过的影印纸、
计算机打印纸、笔记本纸、记事本纸、打字机纸、报纸、杂志、纸板和各种基于纸的包装材料。示例性的纸废弃物还可以包括例如纸浆。本文引用的提交日前所有公众可获得的信息包括例如出版物、专利、专利申请、GenBank序列和ATCC保藏物都通过引用明确整合到本文中。5.附图和表格简介表1A-1B :表IA提供了本公开内容中用于糖基水解酶的序列名称的概括;表IB提供了实施例中提及的其他糖基水解酶的登录号。表2 :相对于里氏木霉四缺失(Quad-delete)的宿主背景活性,表达的蛋白质对合成底物PNPA和pNPX(如下文7. I. 6节所定义)的活性。四缺失的宿主背景(或“XQuad”)定义为所表达的蛋白质在四缺失的菌株中的活性,除以未表达该蛋白质的四缺失背景的菌株的活性。例如,> I的值表示所表达的蛋白质具有大于所述背景的活性。表3 :纯化的候选内切木聚糖酶与birchwood木聚糖在50°C, pH 5下孵育的木聚糖酶活性。表4 :根据酸水解确定的,基于可利用的总糖,玉米阿拉伯木聚糖寡聚物向单体产物的百分比转化。参见实施例4。表5 :定义半纤维素酶水解待处理的玉米棒为单体糖的活性的水平的实验结果(如实施例7所述)。命名为“run#”的列表示随机的实验顺序。命名为“trial#”的列表示标准实验的设计顺序。命名为“Quad”的列表示来自四缺失的里氏木霉菌株的培养上清液的总蛋白的部分。命名为“Xyn3”的列表示里氏木霉Xyn3的总蛋白的部分。命名为“Fv43D”的列表示Fv43D的总蛋白的部分。命名为“Fv51A”的列表示Fv51A的总蛋白的部分。命名为“Fv43A”的列表示是Fv43A的总蛋白的部分。命名为“Fv43B”的列表示是Fv43B的总蛋白的部分。命名为“加载(ug/mgcarbo) ”的列表示按微克蛋白质/毫克碳水化合物的单位,加入到糖化反应中的蛋白质。命名为“Xyl mg/mL、Glu mg/mL、Arab mg/mL和G+X+A mg/mL”的列表示在糖化反应结束时,检测到的木糖、葡萄糖、阿拉伯糖和这三种糖产物的组合的浓度。命名为“Xyl % theor、Glu% theor和Arab% theor”的列表示在糖化反应结束时,木糖、葡萄糖和阿拉伯糖达到理论产量的百分比。表6:用于从玉米棒水解的葡萄糖、木糖和阿拉伯糖的预测最大产量的七种酶组分的经计算的比例。“加载总mg/gr carb”列表示在计算预测值时的总酶剂量。命名为“总mg/ml G+X+A、%葡萄糖产量、%木糖产量和%阿拉伯糖产量”的行表示对所计算的最佳值的反应。命名为“模型拟合的r2数据(包括两种加载物)”的列表示用于表5所示数据拟合的模型的r平方的统计参数。命名为“Accellerase的部分、Quaddel sup的部分、纯化的里氏木霉Xyn3的部分、纯化的Fv43D的部分、纯化的Fv51A的部分、纯化的Fv43A的部分,和纯化的Fv43B的部分”的列表示通过对表5中的数据拟合的模型计算为最佳的组分的部分。表7 :在1.068、14%干燥固体的预处理的玉米棒反应中,使用包括?¥3么和?¥430酶的掺合物最大水解转化玉米棒的精制的酶加载物。糖化条件如实施例7所述。用酶名字标记的列表示每克葡聚糖或木聚糖使用的每种所列酶的毫克数。表8 :在I. 06gr、14%干燥固体的预处理的玉米棒反应中,使用含有Fv51A作为唯
一的L-α -阿拉伯呋喃糖苷酶的掺合物最大转化玉米棒的精制的酶加载物。用于糖化的条件如实施例7所述。用酶名字标记的列表示每克葡聚糖或木聚糖使用的每种所列酶的毫克数。用碳水化合物标记的列表示基于用尺寸排阻层析测量的所生产的每种碳水化合物产品的mg/ml数。> dp2列表示大于二糖的所有寡聚物。表9 :在I. 06g、14%干燥固体的预处理的玉米棒反应中测试的,由纯化的半纤维素酶的混合物A、B、C获得的糖产量。用于糖化的条件如实施例7所述。混合物A :每克木聚糖6mg里氏木霉Xyn3、4mg Fv3A、lmg Fv51A。混合物B :每克木聚糖6mg里氏木霉Xyn3、Img Fv43D、3mg Fv43A、3mg Fv43B。混合物 C :每克木聚糖 6mg 里氏木霉 Xyn3、3mg Fv3A、Img Fv43D、lmg Fv51A。用单体糖标记的列表示每种列举的单体的%产量。表10 :通过半纤维素酶混合物A、B、C处理由玉米棒、高粱、柳枝稷和鹿糖洛制造的半纤维素制品的糖产量。反应在48°C下,100- μ L规模的50mM pH 5. O醋酸钠缓冲液中运行6h,如实施例8所述。显示了每种单体糖的%产量。表11 :根据整合的HPLC面积百分比确定的,各种里氏木霉整合型表达菌株(命名为 H3A、39A、69A、A10A、G6A、102、44A、11A、G9A)表达的主要酶的浓度。表12 :柳枝稷预处理参数和各种预处理的糖化结果列表。表13 :在不同量的固体、酶和孵育时间下,用里氏木霉整合型菌株H3A生产的酶组合物糖化硬木衆(hardwood pulp)的结果。表14 :用整合型菌株H3A生产的酶组合物在一定温度范围和pH范围下对硬木浆的糖化作用。下文和附图中列举的信号序列是预测的。预测是使用SignalP算法(可获得自http://www. cbs. dtu. dk)进行的。结构域预测是基于Pfam、SMART或NCBI数据库的一个或多个而进行的。

图1A-1B :图 IA Fv3A 核苷酸序列(SEQ ID NO :1)。图 IB Fv3A 氨基酸序列(SEQID NO 2) ο SEQ ID NO 2是未成熟Fv3A的序列。Fv3A具有对应于SEQ ID NO :2的I至23位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO 2的24至766位的序列。预测的保守结构域用粗体字表示。图2A-2B :图 2A :Pf43A 核苷酸序列(SEQ ID NO 3)。图 2B :Pf43A氨基酸序列(SEQID NO 4)。SEQ ID NO 4是未成熟Pf43A的序列。Pf43A具有对应于SEQ ID NO :4的I至20位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQID NO 4的21至445位的序列。预测的保守结构域用粗体字表示,预测的碳水化合物结合模块(CBM)用大写字母表示,预测的分开CD和CBM的接头用斜体字表示。图3A-3B :图 3A :Fv43E 核苷酸序列(SEQ ID NO 5)。图 3B :Fv43E 氨基酸序列(SEQID NO 6)。SEQ ID NO 6是未成熟Fv43E的序列。Fv43E具有对应于SEQ ID NO :6的I至18位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQID NO 6的19至530位的序列。预测的保守结构域用粗体字表示。图4A-4B :图 4A :Fv39A 核苷酸序列(SEQ ID NO 7)。图 4B :Fv39A 氨基酸序列(SEQID NO 8)。SEQ ID NO 8是未成熟Fv39A的序列。Fv39A具有对应于SEQ ID NO :8的I至19位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO 8的20至439位的序列。预测的保守结构域用粗体字表示。图5A-5B :图 5A :Fv43A 核苷酸序列(SEQ ID NO 9)。图 5B :Fv43A 氨基酸序列(SEQID NO: 10)。SEQ ID NO : 10 是未成熟 Fv43A 的序列。Fv43A 具有对应于 SEQ ID NO : 10 的 I至22位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO : 10的23至449位的序列。预测的保守结构域用粗体字表示,预测的CBM用大写字母表示,预测的分开保守结构域和CBM的接头用斜体字表示。图6A-6B 图 6A Fv43B 核苷酸序列(SEQ ID NO :11)。图 6B Fv43B 氨基酸序列(SEQ ID NO: 12)。SEQ ID NO : 12 是未成熟 Fv43B 的序列。Fv43B 具有对应于 SEQ ID NO:12的I至16位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO 12的17至574位的序列。预测的保守结构域用粗体字表示。图7A-7B 图 7A Pa51A 核苷酸序列(SEQ ID NO :13)。图 7B Pa51A 氨基酸序列(SEQ ID N0:14)。SEQ ID NO : 14 是未成熟 Pa51A 的序列。Pa51A 具有对应于 SEQ ID NO:14的I至20位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO 14的21至676位的序列。预测的L- α -阿拉伯呋喃糖苷酶保守结构域用粗体字表示。出于表达目的,基因组DNA进行密码子优化用于在里氏木霉中的表达(参见图60Β) ο图8Α-8Β :图 8Α :Gz43A 核苷酸序列(SEQ ID NO: 15)。图 8B :Gz43A 氨基酸序列(SEQ ID NO: 16)。SEQ ID NO : 16 是未成熟 Gz43A 的序列。Gz43A 具有对应于 SEQ ID NO:16的I至18位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO : 16的19至340位的序列。预测的保守结构域用粗体字表示。出于表达目的,在里氏木霉中,用里氏木霉CBHl信号序列(myrklavisaflatara(SEQ ID NO:51))替代Gz43A预测的信号序列(参见图61)。图9A-9B :图 9A :Fo43A 核苷酸序列(SEQ ID NO: 17)。图 9B :Fo43A 氨基酸序列(SEQ ID NO: 18)。SEQ ID NO : 18 是未成熟 Fo43A 的序列。Fo43A 具有对应于 SEQ ID NO:18的I至20位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO: 18的21至348位的序列。预测的保守结构域用粗体字表示。出于表达目的,用里氏木霉CBHl信号序列(myrklavisaflatara(SEQ IDNO :51))替代Fo43A预测的信号序列(参见图62)。图IOA-1OB :图 IOA :Af43A 核苷酸序列(SEQ ID NO :19)。图 IOB :Af43A 氨基酸序列(SEQ ID NO :20)。SEQ ID NO :20是未成熟Af43A的序列。预测的保守结构域用粗体字表不。图11A-11B :图 IlA :Pf51A 核苷酸序列(SEQ ID NO :21)。图 IlB :Pf51A 氨基酸序列(SEQ ID N0:22)。SEQ ID NO :22是未成熟Pf51A的序列。Pf51A具有对应于SEQID NO 22的I至20位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO :22的21至642位的序列。预测的L-α -阿拉伯呋喃糖苷酶保守结构域用粗体字表示。出于表达目的,用密码子优化的里氏木霉CBHl信号序列(myrklavisaf latara (SEQ ID NO :51))替代预测的Pf51A信号序列(下划线的),并密码子优化Pf5IA核苷酸序列用于在里氏木霉中的表达(参见图63)。图12A-12B :图 12A AfuXyn2 核苷酸序列(SEQ ID NO 23)。图 12B AfuXyn2 氨基酸序列(SEQ ID NO: 24)。SEQ ID NO :24是未成熟AfuXyn2的序列。AfuXyn2具有对应于SEQ ID NO :24的I至18位的预测的信号序列(下划线的);预测切割信号序列产生成熟的
蛋白质,其具有对应于SEQ ID NO 24的19至228位的序列。预测的GHll保守结构域用粗
体子表不。图13A-13B :图 13A AfuXyn5 核苷酸序列(SEQ ID NO 25)。图 13B AfuXyn5 氨基酸序列(SEQ ID NO: 26)。SEQ ID NO :26是未成熟AfuXyn5的序列。AfuXyn5具有对应于SEQ ID NO :26的I至19位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO :26的20至313位的序列。预测的GHll保守结构域用粗
体子表不。图14A-14B :图 14A Fv43D 核苷酸序列(SEQ ID NO 27)。图 14B Fv43D 氨基酸序列(SEQ ID NO 28)。SEQ ID NO 28是未成熟Fv43D的序列。Fv43D具有对应于SEQ IDNO :28的I至20位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO :28的21至350位的序列。预测的保守结构域用粗体字表示。图15A-15B :图 15A Pf43B 核苷酸序列(SEQ ID NO 29)。图 15B Pf43B 氨基酸序列(SEQ ID NO 30)。SEQ ID NO 30是未成熟Pf43B的序列。Pf43B具有对应于SEQ IDNO :30的I至20位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO 30的21至321位的序列。预测的保守结构域用粗体字表示。图16A-16B 图 16A Fv51A 核苷酸序列(SEQ ID NO 31)。图 16B Fv51A 氨基酸序列(SEQ ID NO: 32)。SEQ ID NO : 32是未成熟Fv5 IA的序列。Fv5 IA具有对应于SEQ IDNO :32的I至19位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO :32的20至660位的序列。预测的L-α -阿拉伯呋喃糖苷酶保守结构域用粗体字表示。图17Α-17Β :图 17Α Cg51B 核苷酸序列(SEQ ID NO 33)。图 17B Cg51B 氨基酸序列(SEQ ID NO 34)。SEQ ID NO 34是未成熟Cg51B的序列。Cg51B具有对应于SEQ IDNO :34的I至20位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO 34的21至670位的序列。预测的保守结构域用粗体字表示。图18A-18B 图 18A Fv43C 核苷酸序列(SEQ ID NO 35)。图 18B Fv43C 氨基酸序列(SEQ ID NO: 36)。SEQ ID NO :36是未成熟Fv43C的序列。Fv43C具有对应于SEQ IDNO :36的I至22位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO :36的23至333位的序列。预测的保守结构域用粗体字表示。图19A-19B 图 19A Fv30A 核苷酸序列(SEQ ID NO 37)。图 19B Fv30A 氨基酸序列(SEQ ID NO: 38)。SEQ ID NO :38是未成熟Fv30A的序列。Fv30A具有对应于SEQ IDNO :38的I至19位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO 38的20至537位的序列。图20A-20B 图 20A Fv43F 核苷酸序列(SEQ ID NO 39)。图 20B Fv43F 氨基酸序列(SEQ ID N0:40)。SEQ ID NO :40是未成熟Fv43F的序列。Fv43F具有对应于SEQ IDNO :40的I至20位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO :40的21至315位的序列。图21A-21B :图21A :里氏木霉Xyn3核苷酸序列(SEQ ID NO :41)。图21B :里氏木霉Xyn3氨基酸序列(SEQ ID NO 42)。SEQ ID NO 42是未成熟里氏木霉Xyn3的序列。里
氏木霉Xyn3具有对应于SEQ IDNO 42的I至16位的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO 42的17至347位的序列。预测的保守结构域用粗体字表示。图22 :里氏木霉Xyn2的氨基酸序列(SEQ ID NO 43)。信号序列用下划线表示。预测的保守结构域用粗体字表示。编码序列可见于T6rr6lieil等人,Biotechnology, 1992,10 :1461-65 中。图23 :里氏木霉Bxll的氨基酸序列(SEQ ID NO 44)。信号序列用下划线表示。预测的保守结构域用粗体字表示。编码序列可见于Margolles-Clark等人,Appl. Environ.Microbiol. 1996,62(10) :3840-46 中。图24 :里氏木霉Bgll的氨基酸序列(SEQ ID NO 45)。信号序列用下划线表示。预测的保守结构域用粗体字表示。编码序列可见于Barnett等人,Bio-Technology, 1991,9(6) :562-567 中。图25 :使用用calcofluor检测的PASC水解的纤维素酶活性测定。图26 :木聚糖酶洗脱谱。图27 :两步分离的AfuXyn5的SDS-PAGE检测。道I :粗制样品;道2 =Phenyl柱的洗脱液;道3 :GF柱的洗脱液。图28 pENTR/D-T0P0 质粒。图29 :pTrex3gM。图30A-30B :不同的酶对玉米棒底物的性能。误差棒表示与重复三次的玉米棒测定相关的实验误差。沿X轴的括号中的数字表示按mg蛋白质/g纤维素计的酶剂量。图31 :不同的酶掺合物/组合物对玉米棒底物的性能。误差棒表示与重复三次的玉米棒测定相关的实验误差。沿X轴的括号中的数字表示按mg蛋白质/g纤维素计的酶剂量。图32 :不同的酶掺合物/组合物对玉米棒底物的性能。误差棒表示与重复三次的玉米棒测定相关的实验误差。沿X轴的括号中的数字表示按mg蛋白质/g纤维素计的酶剂量。图33 :不同的酶掺合物/组合物对玉米棒底物的性能。误差棒表示与重复三次的玉米棒测定相关的实验误差。沿X轴的括号中的数字表示按mg蛋白质/g纤维素计的酶剂量。图34 :不同的酶掺合物/组合物对玉米棒底物的性能。误差棒表示与重复三次的玉米棒測定相关的实验误差。沿X轴的括号中的数字表示按mg蛋白质/g纤维素计的酶剂量。图35A-35C :不同的酶掺合物/組合物对玉米棒底物的性能。误差棒表示与重复三次的玉米棒測定相关的实验误差。沿X轴的数字表示按mg蛋白质/g纤维素计的酶剂量。图36 :短的阿拉伯木聚糖寡聚物的异头质子NMR区,显示被Fv43A加Fv43B切割。图37 :短的阿拉伯木聚糖寡聚物的异头质子NMR区,显示被Fv3A从阿拉伯糖切割的3-1,2-连接的木糖。图38 :里氏木霉P -木糖苷酶和Fv3A的氨基酸序列之间的比对。图39 pENTR-T0P0-BglI (943/942)质粒。图40 pTrex3g 943/942Bgll 表达载体。图41 :pENTR_里氏木霉Xyn3质粒。图42 pTrex3g/里氏木霉Xyn3表达载体。图43 pENTR-Fv3A 质粒。图44 :pTrex6g/Fv3A 表达载体。图45 T0P0 Blunt/Pegll-Fv43D 质粒。图46 T0P0 Blunt/Pegll-FvSlA 质粒。图47A-47C :通过里氏木霉整合型表达菌株的分泌型酶发酵培养基,将葡聚糖(图47A)和木聚糖(图47B)转化为単体糖。分析3天的样品的葡聚糖和木聚糖转化为单体和可溶性寡聚物产物的程度(图47C)。图47D显示了三种里氏木霉整合型表达菌株的酶产物的层析比较。实验条件描述在实施例I中。转化子之间的蛋白质比例不同,可以定量为总整合峰面积的百分比。“EGL”标记了内切葡聚糖酶峰的总面积。EndoH被少量添加到蛋白质样品中,作为HPLC分析的试剂。图48A-48B 在氨(ammonia)预处理的玉米棒中,7mg总蛋白/克葡聚糖+木聚糖时,响应向整合型菌株生产的酶组合物中添加的半纤维素酶,在木糖单体产量方面增加的糖化作用。图48A :由整合型菌株生产的酶组合物中的串珠铼刀菌(Fusariumverticillioides)半纤维素酶成分。图48B :来自其他真菌的半纤维素酶。图49A-49B :在氨预处理的玉米棒中,7mg总蛋白/克葡聚糖+木聚糖时,响应向整合型菌株生产的酶组合物中添加的半纤维素酶,在葡萄糖单体产量方面増加的糖化作用。图49A :由整合型菌株生产的酶组合物中的轮枝样铼刀菌半纤维素酶成分。图49B :来自其他真菌的半纤维素酶。图50A-50B:在氨预处理的玉米棒中,7mg总蛋白/克葡聚糖+木聚糖时,响应向整合型菌株生产的酶组合物中添加的半纤维素酶,在阿拉伯糖单体产量方面增加的糖化作用。图50A:由整合型菌株生产的酶组合物中的轮枝样铼刀菌半纤维素酶成分。图50B:来自其他真菌的半纤维素酶。图51 :图示预处理条件下的糖化性能。X轴对应表12中列举的实验結果。产量是基于粗制柳枝稷中可利用的葡聚糖或木聚糖的理论量计算的。所有的产量都是基于用酶混合物糖化3天后释放的单体糖。
图52 :多个GH39P-木糖苷酶的氨基酸序列比对。粗体下划线表示的残基是预测的催化性普通酸碱残基(在比对上方用“ A”标记)和催化亲核残基(在比对上方用“ N”标记)。底部两条序列中普通字体的用下划线表示的残基是距各自3D结构(pdb :分别是Iuhv和2bs9)的活性位点中的底物4埃以内的。Fv39A序列中的下划线残基是预测距活性位点中的结合底物4埃以内的。图53 :多个GH43家族水解酶的氨基酸序列比对。在家族成员中高度保守的氨基酸残基显示为下划线和粗体。图54 :多个GHSl家族酶的氨基酸序列比对。在家族成员中高度保守的氨基酸残基显示为下划线和粗体。图55A-55B :多个GHlO和GHll家族内切木聚糖酶的氨基酸序列比对。图55A :GH10家族木聚糖酶的比对。粗体的下划线残基是催化亲核残基(在比对上方用“ N”标记)。图55B:GH11家族木聚糖酶的比对。粗体的下划线残基是催化亲核残基和普通酸碱残基(在
比对上方分别用“N”和“A”标记)。图56A-56B :用多种酶掺合物/组合物对稀释的氨预处理的柳枝稷的糖化作用。图56A:葡聚糖转化。图56B:木聚糖转化。附图下方X轴上的数字指每克葡聚糖或木聚糖的给定掺合物/组合物中每种蛋白质的总毫克量,如实施例13所述。图57A-57B :用整合型菌株H3A生产的酶组合物对稀释的氨预处理的柳枝稷的糖化作用。图57A:葡聚糖转化。图57B:木聚糖转化。实施例14中描述了实验条件。图58A-58C :用整合型菌株H3A生产的酶组合物,在不同酶剂量下对蒸汽膨胀的蔗糖渣的糖化作用。图58A :葡聚糖转化;图58B :木聚糖转化;图58C :3天的葡聚糖和木聚糖转化。实施例17中描述了实验条件。图59A-59C :用各种酶或酶掺合物对稀酸预处理的玉米纤维的糖化作用。图59A :葡聚糖转化;图59B :木聚糖转化;图59C 5天的葡聚糖和木聚糖转化。受调节的糖(葡萄糖或木糖)反映了由酶促步骤所产生的糖减去起始糖水平。沿X轴显示的比例代表按mg总蛋白/g纤维素计的酶剂量。实施例18中描述了实验条件。图60A-60B :图 60A :Pa51A 推导的 cDNA (SEQ ID NO 46)。图 60B :Pa51A 密码子优化的 cDNA(SEQ ID NO 47)。图61 :在编码成熟的Gz43A的基因组DNA的上游包含CBHl信号序列(下划线的)的构建体的编码序列(SEQ ID NO 48)。图62 :在编码成熟的Fo43A的基因组DNA的上游包含CBHl信号序列(下划线的)的构建体的编码序列(SEQ ID NO 49)。图63 :在编码成熟的Pf51A的密码子优化的DNA的上游包含CBHl信号序列(下划线的)的构建体的密码子优化的编码序列(SEQ IDNO :50)。图64 :多个GH3家族水解酶的氨基酸序列比对。家族成员中高度保守的氨基酸残基用下划线和粗体显示。方框标记了具有侧翼预测涉及底物结合的残基的预测催化残基。图65 :两条代表性的铼刀菌GH30家族水解酶的氨基酸序列比对。家族成员中保守的氨基酸残基用下划线和粗体显示。6.详述传统上,按底物特异性和反应产物将酶分类。在前基因组时代,功能被视为用于比较酶的最应服从(并且可能是最有效)的基础,用于多种酶活性的測定已开发多年,获得了熟悉的EC分类体系。纤维素酶和其他作用于两个碳水化合物部分之间(或者碳水化合物和非碳水化合物部分之间——如硝基酚-糖苷衍生物中存在的)的糖苷键的糖基水解酶在该分类体系中指定为EC 3.2. I. _,最后ー个数字表示切割的键的确切类型。例如,根据该方案,内切作用的纤维素酶(1,4-3-内切葡聚糖酶)被指定为EC 3. 2. 1.4。随着普遍的基因组测序计划的进展,测序数据促进了对相关基因和蛋白质的分析和比较。相应的,已经结晶了数量不断増加的能够作用于碳水化合物部分(即,碳水化合物酶)的酶,并解析了它们的3D结构。此类分析已鉴别出具有相关序列的细分的酶家族,含有可基于其氨基酸序列预测的保守三维折叠。此外,已显示具有相同或相似三维折叠的酶表现出相同或相似的水解的立体特异性,即使当其催化不同的反应时(Henrissat等人,1998, FEBS Lett 425(2) :352-4 ;Coutinho和Henrissat, 1999, in Genetics, biochemistryand ecology oi cellulose degradation. T. Kimura. Tokyo, Uni Puolishers Co:15_2j)0这些发现形成了基于序列分类碳水化合物酶模块的基础,所述模块可获得自http: //afmb. cnrs~mrs. fr/CAZY/index, html 的网络数据库 Carbohydrate-Active enZYme
服务器(CAZy),(碳水化合物活性酶整合的数据库方法)。參见Cantarel等人,2009,Nucleic Acids Res. 37(Database issue) :D233_38)。CAZy定义了四种主要类型的碳水化合物酶,可通过催化的反应类型区分糖基水解酶(GH)、糖基转移酶(GT)、多糖裂合酶(PL)和碳水化合物酯酶(CE)。本公开内容的酶是糖基水解酶。GH是ー类水解两个或多个碳水化合物之间或碳水化合物和非碳水化合物部分之间的糖苷键的酶。按序列相似性分组的糖基水解酶分类系统导致定义了超过85个不同的家族。该分类可获得自CAZy网站。本公开内容的酶尤其属于糖基水解酶家族3、10、11、30、39、43和/或51。糖苷水解酶家族3 ( “GH3”)的酶包括例如P -葡糖苷酶(EC :3. 2. I. 21) ; P -木糖苷酶(EC :3. 2. I. 37) ;N-こ酰¢-氨基葡糖苷酶(EC :3. 2. I. 52);葡聚糖¢-1, 3-葡糖苷酶(EC :3. 2. I. 58);纤维糊精酶(cellodextrinase) (EC :3. 2. I. 74);外切-1,3-1,4- 聚糖酶(EC :3. 2. I);和¢-半乳糖苷酶(EC 3.2. 1.23)。例如,GH3酶可以是具有P -葡糖苷酶、¢-木糖苷酶、N-こ酰¢-氨基葡糖苷酶、葡聚糖¢-1, 3-葡糖苷酶、纤维糊精酶、夕卜切1,3-1,4_葡聚糖酶和/或¢-半乳糖苷酶活性的酶。一般而言,GH3酶是球状蛋白质,可由两个或多个亚结构域构成。在¢-葡糖苷酶中,催化残基鉴别为位于肽N端第三位的天冬氨酸残基,位于氨基酸片段SDW中(Li等人,2001,Biochem. J. 355 :835-840)。里氏木霉Bgll中的相应序列是T266D267W268(从起始位置的甲硫氨酸开始计数),而催化残基天冬氨酸是D267。在测试的GH3P-木糖苷酶中,羟基/天冬氨酸序列也是保守的。例如在里氏木霉Bxll中的相应序列是S310D311,而在Fv3A中的相应序列是S290D291。糖苷水解酶家族39 ( “GH39”)的酶具有a -L-艾杜糖苷酸酶(EC :3. 2. I. 76)或 @ -木糖苷酶(EC 3. 2. I. 37)活性。已解析了来自 Thermoanaerobacteriumsaccharolyticum (Uniprot 登录号 P36906)和嗜热脂肪地芽抱杆菌(Geobacillusstearothermophilus) (Uniprot登录号Q9ZFM2)的2种GH39 0 -木糖苷酶的三维结构(參见Yang 等人,J. Mol. Biol. 2004,335(1) : 155-65 和 Cz jzek 等人,J. Mol. Biol. 2005,353(4)838-46)。这些酶中最高度保守的区域位于其N端部分,具有经典的(a/0)8TM桶状折叠,两个关键的活性位点谷氨酸位于¢-链4(酸/碱)和7(亲核)的C末端。基于上述的Thermoanaerobacteriumsaccharolyticum和嗜热脂肪地芽抱杆菌的GH39 ^ -木糖苷酶与Fv39A的比对,预测Fv39A的残基E168和E272分别作为催化性酸-碱和亲核基团发挥功能。糖苷水解酶家族43( “GH43”)的酶包括例如L-a-阿拉伯呋喃糖苷酶(EC3. 2. I. 55) 木糖苷酶(EC :3. 2. I. 37);内切阿拉伯聚糖酶(EC 3. 2. 1.99);和/或半乳聚糖1,3-卜半乳糖苷酶(EC 3.2.1.145)。例如,GH43酶可以是具有L-a-阿拉伯呋喃糖苷酶活性、^ -木糖苷酶活性、内切阿拉伯聚糖酶活性,和/或半乳聚糖1,3-0 -半乳糖苷酶活性的酶。GH43家族的酶表现出五叶片状的¢-螺旋桨样结构。螺旋桨样结构是基于叶片的五次重复,所述叶片由四条链的¢-片层组成。通过Cellvibriojaponicus CjAbn43A的晶体结构,鉴别出催化性的普通碱——天冬氨酸、催化性的普通酸——谷氨酸,和调节普通碱的pKa的天冬氨酸,并通过定点诱变验证(參见Nurizzo等人,Nat. Struct. Biol. 2002,9(9)665-8)。催化残基排列在广泛分布于氨基酸序列中的三个保守区段(blocks)中(Pons等人,Proteins !Structure, Function andBioinformatics, 2004, 54 :424-432)。在测试生
物量水解的有效活性的GH43家族酶中,预测的催化残基在图53的序列中显示为粗体和下划线的残基。嗜热脂肪地芽孢杆菌(Geobacillus stearothermophylus)的木糖苷酶的晶体结构(Brux等人,J. Mol. Bio.,2006,359 =97-109)提示若干其他残基可能对于该酶的底物结合是重要的。由于测试生物量水解的GH43家族酶具有不同的底物偏爱,这些残基在图53的比对序列中不是完全保守的。然而,在测试的木糖苷酶中,若干通过疏水性相互作用或通过氢键对底物结合有贡献的保守残基是保守的,并在图53中通过单下划线标记。糖苷水解酶家族51 ( “GH51”)的酶具有L-a -阿拉伯呋喃糖苷酶(EC 3. 2. I. 55)和/或内切葡聚糖酶(EC 3. 2. I. 4)活性。来自嗜热脂肪地芽孢杆菌T-6的GH51L- a -阿拉伯呋喃糖苷酶的高解析度晶体结构显示所述酶是六聚体,每个单体组织成2个结构域ー个8桶状(P/a)和ー个具有果酱卷(jelly-roll)拓扑学结构的12链状P夹心(參见HSvel等人,EMBO J. 2003,22(19) =4922-4932)。可以预期催化残基将是酸性的,并在该家族的酶之间是保守的。当将Fv51A、Pf51A和Pa51A的氨基酸序列与更多种序列的GH51酶比对吋,8个酸性残基仍然是保守的。在图54中显示为粗体和下划线。糖苷水解酶家族10 (“GH10”)的酶也具有8桶状(@/a)结构。它们以内切方式水解,其余机制在一般性酸/碱催化方法中使用至少ー个酸性催化残基(Pell等人,J.Biol.Chem.,2004,279 (10) :9597-9605)。已经解析了 简青霉(Penicillium simplicissimum)(Uniprot P56588)和 Thermoascus aurantiacus (Uniprot P23360)的 GHlO 木聚糖酶在活性位点与底物复合后的晶体结构(參见Schmidt等人,Biochem.,1999,38 =2403-2412 ;和Lo Leggio等人,FEBS Lett. 2001,509 :303-308)。对底物结合和催化重要的里氏木霉Xyn3残基可源自与上述简青霉和Thermoascus aurantiacus的GHlO木聚糖酶的序列的比对(图55A)。预测里氏木霉Xyn3的残基E282是催化性亲核残基,而预测残基E91、N92、K95、Q97、S98、H128、W132、Q135、N175、E176、Y219、Q252、H254、W312 和/或 W320 涉及底物结合和 /或催化。糖苷水解酶家族11( “GH11”)的酶具有果酱卷结构。它们以内切方式水解,其余机制在一般性酸/碱催化方法中使用至少ー个酸性催化残基。遍布整个结构中的若干其他残基可能对稳定底物中靠近被水解切割的成对木糖单体中的木糖単位有贡献。测试了三个GHll家族的内切木聚糖酶,其序列比对在图55B中。鉴别出E118 (或成熟的里氏木霉Xyn2中的E86)和E209 (或成熟的里氏木霉Xyn2中的E177)分别作为里氏木霉Xyn2中的催化亲核基团和一般性酸碱残基(參见Havukainen等人,Biochem.,1996,35 =9617-24)。糖苷水解酶家族30 (“GH30”)的酶属于具有葡糖神经酰胺酶(EC3. 2. I. 45) ; @ -1,6-葡聚糖酶(EC 3. 2. I. 75) ; P -木糖苷酶(EC 3. 2. I. 37) ; P -葡糖苷酶(3. 2. I. 21)活性的酶。第一个 GH30 晶体结构是 Grabowski、Gatt 和 Horowitz (Crit Rev Biochem MolBiol 1990 ;25 (6) 385-414)解析的Gaucher病相关性人^ -葡糖脑苷脂酶。GH30具有(a /3) JIM桶状折叠,两个关键的活性位点谷氨酸位于¢-链4(酸/碱)和7(亲核)的C末端(Henrissat B,等人,Proc Natl Acad Sci U S A, 92 (15) :7090-4,1995 ; Jordan 等人,Applied Microbiol Biotechnol,86 :1647,2010)。在 14 个比对的 GH30 蛋白中,Fv30A 的162位谷氨酸在14个中是保守的(13个细菌蛋白和I个来自真菌Biospora的内切-P -木聚糖酶——登录号ADG62369),Fv30A的250位谷氨酸在同样的14个蛋白的10个中是保守的,其他三个中是天冬氨酸,ー个中是非酸性的。存在其他的中等保守的酸性残基,但无ー
如此广泛保守。6. I本公开内容的多肽本公开内容提供了分离的、合成的或重组的多肽,其包括与SEQ IDNO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44 或 45 的多肽在至少约 10个,例如至少约 15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325或350个残基的区域,或在全长的未成熟多肽、全长的成熟多肽、全长的保守结构域和/或全长的CBM,具有至少约80%,例如至少约81 %、82%>83%,84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98% 或99%或完全的(100% )序列同一性的氨基酸序列。保守结构域可以是预测的催化结构域(“CD”)。示例性的多肽包括长度至少约10个,例如至少约15、20、25、30、35、40、45、50、75、80、85、90、95、100、150、200、250、300、350、400、450、500、550 或 600 个残基的片段。片段可以包括保守结构域和/或CBM。当片段包括酶的保守结构域和CBM吋,片段任选的包括分开两者的接头。接头可以是天然接头或异源的接头。考虑本公开内容的多肽可以是由这样的核酸序列编码,所述核酸序列与SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39或41具有至少约85 %、约86 %、约87 %、约88 %、约89 %或约90 %的序列同一性,或者由能够在高严紧条件下与SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39或41的互补体或其片段杂交的核酸序列编码。示例性的本公开内容的核酸描述在下文6. 2节中。本公开内容的多肽包括具有这样的氨基酸序列的蛋白质,所述氨基酸序列与SEQID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44 或 45的糖基水解酶序列的至少50个连续的氨基酸残基具有至少约85%,例如至少86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或 99% 的序列同一性。例如,本公开内容的多肽可以包括与 SEQ IDNO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44或45的糖基水解酶序列的至少10个,例如至少11、12、13、14、15、20、25、30、40、50、75、100、125、150、175、200、250、300 或 350 个连续的氨基酸残基具有至少 85%,例如至少 86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%、98%或99%的序列同一性的氨基酸序列。连续的氨基酸序列对应于保守结构域和/或CBM和/或信号序列。本文所述的任何氨基酸序列都可以与特定氨基酸序列的C-和/或N-末端每个侧翼的至少I个,例如至少2、3、5、10或20个异源氨基酸一起产生,或者与之结合产生,和/或从本公开内容的酶的C-和/或N-末端删除至少I个,例如至少2、3、5、10或20个氨基酸。其他变体也落入本公开内容的范围内。例如,可以修饰一个或多个氨基酸残基来増加或减少酶的P〗。可以通过去除谷氨酸残基或用另ー个氨基酸残基替代它,来实现Pl值的改变。本公开内容具体提供了Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B, Fv43B、Fv51A、里氏木霉 Xyn3、里氏
木霉Xyn2、里氏木霉Bxll和/或里氏木霉Bgll多肽。在本发明的酶掺合物/组合物中适合存在一种或多种这些酶的组合,例如非天然存在的。Fv3A Fv3A 的氨基酸序列(SEQ ID NO 2)显示在图 1B、38 和 64 中。SEQ ID NO 2是未成熟的Fv3A的序列。Fv3A具有对应于SEQID NO 2的残基I至23的预测的信号序列(下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID N0:2的残基24至766的序列。预测的保守结构域在图IB中用粗体字表示。Fv3A表现出具有¢-木糖苷酶活性,例如在使用对-硝基苯-木批喃糖苷、木ニ糖(xylobiose)、混合的线性木糖寡聚物、来自半纤维素的分支的阿拉伯木聚糖寡聚物或用稀释的氨预处理的玉米棒作为底物的酶学測定中。预测的催化残基是D291,而侧翼残基S290和C292预测涉及底物结合(图64)。E175和E213在其他GH3酶中是保守的,预测具有催化功能。如本文中使用的,“Fv3A多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID NO 2的残基24至 766 之间至少 50,例如至少 75、100、125、150、175、200、250、300、350、400、450、500、550、600、650或700个连续的氨基酸残基具有至少85 %,例如至少86 %、87 %、88 %、89 %、90 %、91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Fv3A 多肽与天然的Fv3A相比,优选在残基D291、S290、C292、E175和E213是没有改变的。Fv3A多肽优选至少 70%、75%、80%、85%、90%、95%、98%或 99%的在 Fv3A、里氏木霉 Bxll 和/或里氏木霉Bgll中保守的氨基酸残基是没有改变的,如图64的比对所示。Fv3A多肽适宜地包括图IB所示天然Fv3A的完整的预测保守结构域。示例性的本发明的Fv3A多肽包括与图IB所示成熟的 Fv3A 序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%、96%、97%、98%、99%或100%同一性的序列。本发明的Fv3A多肽优选具有¢-木糖苷酶活性。相应的,本发明的Fv3A多肽适宜地包括与SEQ ID NO :2,或与SEQID NO :2的残基(i) 24-766、(ii) 73-321、(iii) 73-394、(iv) 395-622、(v) 24-622 或(vi) 73-622 的氨基酸序列具有至少 90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性的氨基酸序列。多肽适宜地具有¢-木糖苷酶活性。Pf43A Pf43A 的氨基酸序列(SEQ ID NO 4)显示在图 2B 和 53 中。SEQ ID NO 4是未成熟的Pf43A的序列。Pf43A具有对应于SEQ IDNO 4的残基I至20的预测的信号序列(图2B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO4的残基21至445的序列。在图2B中,预测的保守结构域用粗体字表示,预测的CBM用大写字母表示,而预测的分开CD和CBM的接头用斜体字表示。Pf43A表现出具有P -木糖苷酶活性,例如在使用对-硝基苯-P -木吡喃糖苷、木ニ糖、混合的线性木糖寡聚物或用氨预处理的玉米棒作为底物的酶学测定中。预测的催化残基是D32或D60、D145和E206。图53中下划线的C端区域是预测的CBM。如本文中使用的,“Pf43A多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID NO :4的残基21至445之间至少50、75、100、125、150、175、200、250、300、350或400个连续的氨基酸残基具有至少85 %、86%、87%、88 %、89 %、90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Pf43A 多肽与天然的Pf43A相比,优选在残基D32或D60、D145和E206是没有改变的。Pf43A多肽优选至少70%、80%、90%、95%、98%或99%的在蛋白质家族中保守的氨基酸残基是没有改变的,该家族包括Pf43A和图53中比对的1、2、3、4、5、6、7或所有8条其他的氨基酸序列。本发明的Pf43A多肽适宜地包括两个或多个或所有的下列结构域(I)预测的CBM、⑵预测的保守结构域,和(3)图2B中所示的Pf43A的接头。示例性的本发明的Pf43A多肽包括与图2B所示成熟的Pf43A序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、
93%,94%,95%,96%,97%,98%,99%^; 100% 同一性的序列。本发明的 Pf43A 多肽优选具有¢-木糖苷酶活性。相应的,本发明的Pf43A多肽适宜地包括与SEQ ID NO :4,或与SEQ ID NO 4的残基(i)2 ト445、(ii)21-301、(iii)2 ト323、(iv) 21-444, (v) 302-444, (vi) 302-445,(vii) 324-444 或(viii) 324-445 的氨基酸序列具有至少 90 % ,91 % ,92 % ,93 % ,94 %,95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。多肽适宜地具有P -木糖苷酶活性。Fv43E Fv43E 的氨基酸序列(SEQ ID NO. 6)显示在图 3B 和 53 中。SEQ ID NO 6是未成熟的Fv43E的序列。Fv43E具有对应于SEQ IDNO 6的残基I至18的预测的信号序列(图3B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO 6的残基19至530的序列。在图3B中,预测的保守结构域用粗体字表示。Fv43E表现出具有@ -木糖苷酶活性,例如在使用4-硝基苯-P -D-木吡喃糖苷、木ニ糖和混合的线性木糖寡聚物或用氨预处理的玉米棒作为底物的酶学測定中。预测的催化残基是D40或D71、D155和E241。如本文中使用的,“Fv43E多肽”指包含这样的序列的多肽和/或其变体,所述序列与 SEQID NO 6 的残基19至530之间至少50、75、100、125、150、175、200、250、300、350、400、450或500个连续的氨基酸残基具有至少85 %、86 %、87 %、88 %、89 %、90 %、91 %、92 %、93%、94%、95%、96%、97%、98%、99%或100%序列同ー性。卩¥43£多肽与天然的?¥43£相比,优选在残基D40或D71、D155和E241是没有改变的。Fv43E多肽优选至少70%、80%、90%、95%、98%或99%的在酶家族中保守的氨基酸残基是没有改变的,包括Fv43E和图53中比对的1、2、3、4、5、6、7或所有8条其他的氨基酸序列。Fv43E多肽适宜地包括图3B所示天然Fv43E的完整的预测保守结构域。示例性的Fv43E多肽包括与图3B所示成熟的Fv43E序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%、99%或100%同一性的序列。本发明的Fv43E多肽优选具有¢-木糖苷酶活性。相应的,本发明的Fv43E多肽适宜地包括与SEQ ID NO :6,或与SEQ ID NO 6的残基(i) 19-530、(ii) 29-530、(iii) 19-300 或(iv) 29-300 的氨基酸序列具有至少90%,91%,92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。多肽适宜地具有¢-木糖苷酶活性。Fv39A Fv39A 的氡某酸序列(SEQ ID NO :8)显示在图 4B 和 52 中。SEQ ID NO:8是未成熟的Fv39A的序列。Fv39A具有对应于SEQ IDNO 8的残基I至19的预测的信号序列(图4B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ IDNO :8的残基20至439的序列。在图4B中,预测的保守结构域用粗体字表示。Fv39A表现出具有P -木糖苷酶活性,例如在使用对-硝基苯-木吡喃糖苷、木ニ糖或混合的线性木糖寡聚物作为底物的酶学测定中。基于Fv39A与上述来自Thermoanaerobacteriumsaccharolyticum (Uniprot登录号P36906)和嗜热脂肪地芽孢杆菌(Uniprot登录号Q9ZFM2)的GH39木糖苷酶的序列比对,预测Fv39A的残基E168和E272分别作为催化性酸-碱对和亲核基团发挥功能。如本文中使用的,“Fv39A多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID NO 8的残基20至439之间至少50、75、100、125、150、175、200、250、300、350或400个连续的氨基酸残基具有至少85%、86%、87%、88%、89%、90%、
91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Fv39A 多肽与天然的Fv39A相比,优选在残基E168和E272是没有改变的。Fv39A多肽优选至少70%、80%、90 %、95 %、98 %或99 %的在家族或酶之间保守的氨基酸残基是没有改变的,包括Fv39A与来自Thermoanaerobacterium saccharolyticum和嗜热脂肪地芽抱杆菌的木糖苷酶(见上文)。Fv39A多肽适宜地包括图4B所示天然Fv39A的完整的预测保守结构域。示例性的Fv39A多肽包括与图4B所示成熟的Fv39A序列具有至少85 %、86 %、87 %、88 %、89 %、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100% 同一性的序列。本发明的Fv39A多肽优选具有¢-木糖苷酶活性。相应的,本发明的Fv39A多肽适宜地包括与SEQ ID NO :8,或与SEQ ID NO :8的残基(i) 20-439、(ii) 20-291、(iii) 145-291 或 145-439 的氨基酸序列具有至少 90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。多肽适宜地具有¢-木糖苷酶活性。Fv43A Fv43A 的氨基酸序列(SEQ ID NO 10)显示在图 5B 和 53 中。SEQ ID NO 10是未成熟的Fv43A的序列。Fv43A具有对应于SEQID NO 10的残基I至22的预测的信号序列(图5B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ IDNO 10的残基23至449的序列。在图5B中,预测的保守结构域用粗体字表示,预测的CBM用大写字母表示,而预测的分开CD和CBM的接头用斜体字表示。Fv43A表现出具有P -木糖苷酶活性,例如在使用4-硝基苯-P -D-木吡喃糖苷、木ニ糖、混合的线性木糖寡聚物、来自半纤维素的分支的阿拉伯木聚糖寡聚物和/或线性木糖寡聚物作为底物的酶学測定中。预测的催化残基包括D34或D62、D148和E209。如本文中使用的,“ Fv43A多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID NO: 10的残基23至449之间至少50、75、100、125、150、175、200、250、300、350 或 400 个连续的氨基酸残基具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Fv43A多肽与天然的Fv43A相比,优选在残基D34或D62、D148和E209是没有改变的。Fv43A多肽优选至少70%、80%、90%、95%、98%或99%的在酶家族之间保守的氨基酸残基是没有改变的,包括Fv43A与图53中比对的1、2、3、4、5、6、7、8或所有9条其他氨基酸序列。Fv43A多肽适宜地包括图5B所示的天然Fv43A的完整的预测CBM,和/或天然Fv43A的完整的预测保守结构域,和/或Fv43A的接头。示例性的Fv43A多肽包括与图5B所示成熟的 Fv43A 序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%、97%、98%、99%或100%同一性的序列。本发明的Fv43A多肽优选具有P -木糖苷酶活性。相应的,本发明的Fv43A多肽适宜地包括与SEQ ID N0:10,或与SEQ ID NO 10的残基(i) 23-449、(ii) 23-302、(iii) 23-320、(iv) 23-448、(v) 303-448、(vi) 303-449、(vii) 321-448 或(viii) 321-449 的氨基酸序列具有至少 90 % ,91 % ,92 % ,93 % ,94 %,95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。多肽适宜地具有P -木糖苷酶活性。Fv43B Fv43B 的氨基酸序列(SEQ ID NO 12)显示在图 6B 和 53 中。SEQ ID NO 12是未成熟的Fv43B的序列。Fv43B具有对应于SEQID NO 12的残基I至16的预测的信
号序列(图6B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ IDNO 12的残基17至574的序列。在图6B中,预测的保守结构域用粗体字表示。Fv43B表现出同时具有P -木糖苷酶和L-a -阿拉伯呋喃糖苷酶活性,例如在使用4-硝基苯-D-木吡喃糖苷和对_硝基苯-a -L-阿拉伯呋喃糖苷作为底物的第一酶学測定中。在第二酶学测定中,表现出催化阿拉伯糖从分支的阿拉伯糖基-木糖寡聚物中释放,并在存在其他木糖苷酶的条件下,催化从寡聚物混合物中増加的木糖释放。预测的催化残基包括D38或D68、D151和E236。如本文中使用的,“Fv43B多肽”指包含这样的序列的多肽和/或其变体,所述序列与 SEQ ID NO 12 的残基17至574之间至少50、75、100、125、150、175、200、250、300、350、400、450、500或550个连续的氨基酸残基具有至少85%、86%、87%、88%、89%、90%、91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Fv43B 多肽与天然的Fv43B相比,优选在残基D38或D68、D151和E236是没有改变的。Fv43B多肽优选至少70%、80%、90%、95%、98%或99%的在酶家族之间保守的氨基酸残基是没有改变的,包括Fv43B与图53中比对的1、2、3、4、5、6、7、8或所有9条其他氨基酸序列。Fv43B多肽适宜地包括图6B和53所示的天然Fv43B的完整的预测保守结构域。示例性的Fv43B多肽包括与图 6B 所示成熟的 Fv43B 序列具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。本发明的Fv43B多肽优选具有^ -木糖苷酶活性、L- a -阿拉伯呋喃糖苷酶活性或同时具有P -木糖苷酶和L- a -阿拉伯呋喃糖苷酶活性。相应的,本发明的Fv43B多肽适宜地包括与SEQ ID NO :12,或与SEQ ID NO 12的残基⑴ 17-574、(ii) 27-574、(iii) 17-303 或(iv) 27-303 的氨基酸序列具有至少 90 %、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽适宜地具有¢-木糖苷酶活性、L-a-阿拉伯呋喃糖苷酶活性或同时具有¢-木糖苷酶和L- a -阿拉伯呋喃糖苷酶活性。Pa51A Pa51A 的氨基酸序列(SEQ ID NO 14)显示在图 7B 和 54 中。SEQ ID NO 14是未成熟的Pa51A的序列。Pa51A具有对应于SEQID NO 14的残基I至20的预测的信号序列(图7B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ IDNO 14的残基21至676的序列。在图7B中,预测的L-a -阿拉伯呋喃糖苷酶保守结构域用粗体字表示。Pa51A表现出同时具有¢-木糖苷酶和L-a-阿拉伯呋喃糖苷酶活性,例如在使用人工底物对-硝基苯-P -木吡喃糖苷和对-硝基苯-a -L-阿拉伯呋喃糖苷的酶学測定中。它表现出催化阿拉伯糖从分支的阿拉伯糖基-木糖寡聚物中释放,并在存在其他木糖苷酶的条件下,催化从寡聚物混合物中增加的木糖释放。保守的酸性残基包括E43、D50、E257、E296、E340、E370、E485和E493。如本文中使用的,“Pa51A多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID NO 14的残基21至676之间至少50、75、100、125、150、175、200、250、300、350、400、450、500、550、600 或 650 个连续的氨基酸残基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。Pa51A多肽与天然的?85认相比,优选在残基£43、050、£257』296、E340、E370、E485 和 E493 是没有改变的。Pa5 IA 多肽优选至少 70 %、80 %、90 %、95 %、98 % 或99%的在ー类酶之间保守的氨基酸残基是没有改变的,上述酶包括Pa51A、Fv51A和Pf51A,如图54的比对所示。Pa51A多肽适宜地包括图7B所示的天然Pa51A的预测的保守结构域。示例性的Pa51A多肽包括与图7B所示成熟的Pa51A序列具有至少85%、86%、87%、88%、89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100% 同一性的序列。本
发明的Pa51A多肽优选具有¢-木糖苷酶活性、L-a-阿拉伯呋喃糖苷酶活性或同时具有^ -木糖苷酶和L-a -阿拉伯呋喃糖苷酶活性。相应的,本发明的Pa51A多肽适宜地包括与SEQ ID N0:14,或与SEQ ID N0:14的残基(i) 21-676、(ii) 21-652、(iii) 469-652 或(iv) 469-676 的氨基酸序列具有至少 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽适宜地具有¢-木糖苷酶活性、L-a-阿拉伯呋喃糖苷酶活性或同时具有¢-木糖苷酶和L- a -阿拉伯呋喃糖苷酶活性。Gz43A Gz43A 的氨基酸序列(SEQ ID NO 16)显示在图 8B 和 53 中。SEQ ID NO 16是未成熟的Gz43A的序列。Gz43A具有对应于SEQID NO 16的残基I至18的预测的信号序列(图8B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ IDNO 16的残基19至340的序列。在图8B中,预测的保守结构域用粗体字表示。Gz43A表现出具有P -木糖苷酶活性,例如在使用对-硝基苯-P -木吡喃糖苷、木ニ糖或混合的和/或线性的木糖寡聚物作为底物的酶学测定中。预测的催化残基包括D33或D68、D154和E243。如本文中使用的,“Gz43A多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ IDNO 16的残基19至340之间至少50、75、100、125、150、175、200、250或300个连续的氨基酸残基具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%、99%或100%序列同一性。Gz43A多肽与天然的Gz43A相比,优选在残基D33或D68、D154和E243是没有改变的。Gz43A多肽优选至少70 %、80 %、90 %、95 %、98 %或99 %的在一类酶之间保守的氨基酸残基是没有改变的,上述酶包括Gz43A和图53中比对的I、2、3、4、
5、6、7、8或所有9条其他氨基酸序列。Gz43A多肽适宜地包括图8B所示的天然Gz43A的预测的保守结构域。示例性的Gz43A多肽包括与图8B所示成熟的Gz43A序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或 100%同一性的序列。本发明的Gz43A多肽优选具有¢-木糖苷酶活性。相应的,本发明的Gz43A多肽适宜地包括与SEQ ID N0:16,或与SEQ ID NO :16的残基(i) 19-340、(ii) 53-340、(iii) 19-383 或(iv) 53-383 的氨基酸序列具有至少 90 %、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽适宜地具有¢-木糖苷酶活性。Fo43A Fo43A 的氨基酸序列(SEQ ID NO 18)显示在图 9B 和 53 中。SEQ ID NO 18是未成熟的Fo43A的序列。Fo43A具有对应于SEQID NO 18的残基I至20的预测的信号序列(图9B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ IDNO 18的残基21至348的序列。在图9B中,预测的保守结构域用粗体字表示。Fo43A表现出具有¢-木糖苷酶活性,例如在使用对-硝基苯-¢-木吡喃糖苷、木ニ糖和/或混合的线性的木糖寡聚物作为底物的酶学测定中。预测的催化残基包括D37或D72、D159和E251。如本文中使用的,“Fo43A多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ IDNO 18的残基18至344之间至少50、75、100、125、150、175、200、250或300个连续的氨基酸残基具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%、99%或100%序列同一性。Fo43A多肽与天然的Fo43A相比,优选在残基D37或D72、D159和E251是没有改变的。Fo43A多肽优选至少70%、80%、90%、95%、98%或99%的在
一类酶之间保守的氨基酸残基是没有改变的,上述酶包括Fo43A和图53中比对的I、2、3、4、
5、6、7、8或所有9条其他氨基酸序列。Fo43A多肽适宜地包括图9B所示的天然Fo43A的预测的保守结构域。示例性的Fo43A多肽包括与图9B所示成熟的Fo43A序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99% 或 100%同一性的序列。本发明的Fo43A多肽优选具有¢-木糖苷酶活性。相应的,本发明的Fo43A多肽适宜地包括与SEQ ID N0:18,或与SEQ ID NO :18的残基(i)21-341、(ii) 107-341、(iii) 21-348 或(iv) 107-348 的氨基酸序列具有至少 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽适宜地具有¢-木糖苷酶活性。Af43A Af43A 的氨基酸序列(SEQ ID NO 20)显示在图 IOB 和 53 中。SEQ ID NO 20是未成熟的Af43A的序列。在图IOB中,预测的保守结构域用粗体字表示。Af43A表现出具有L- a -阿拉伯呋喃糖苷酶活性,例如在使用对-硝基苯-a -L-阿拉伯呋喃糖苷作为底物的酶学測定中。Af43A表现出催化阿拉伯糖从寡聚物集合中释放,所述寡聚物集合是通过内切木聚糖酶的作用从半纤维素中释放的。预测的催化残基包括D26或D58、D139和E227。如本文中使用的,“Af43A多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID勵20的至少50、75、100、125、150、175、200、250或300个连续的氨基酸残基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。Af43A多肽与天然的Af43A相比,优选在残基D26或D58、D139和E227是没有改变的。Af43A多肽优选至少70%、80%、90%、95%、98%或99%的在ー类酶之间保守的氨基酸残基是没有改变的,上述酶包括Af43A和图53中比对的1、2、3、4、5、
6、7、8或所有9条其他氨基酸序列。Af43A多肽适宜地包括图IOB所示的天然Af43A的预测的保守结构域。示例性的Af43A多肽包括与SEQ ID NO :20具有至少85%、86%、87%、88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99% 100%序列同一性的序列。本发明的Af43A多肽优选具有L-a -阿拉伯呋喃糖苷酶活性。相应的,本发明的Af43A多肽适宜地包括与SEQ ID N0:20,或与SEQ ID NO :20的残基(i) 15-558 或(ii) 15-295 的氨基酸序列具有至少 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的氨基酸序列。多肽适宜地具有L-a -阿拉伯呋喃糖苷酶活性。Pf51A Pf51A 的氨基酸序列(SEQ ID NO 22)显示在图 IIB 和 54 中。SEQ ID NO 22是未成熟的Pf51A的序列。Pf51A具有对应于SEQ IDNO 22的残基I至20的预测的信号序列(图IlB中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQID NO 22的残基21至642的序列。在图IlB中,预测的L-a -阿拉伯呋喃糖苷酶保守结构域用粗体字表示。Pf51A表现出具有L-a -阿拉伯呋喃糖苷酶活性,例如在使用4-硝基苯- a -L-阿拉伯呋喃糖苷作为底物的酶学測定中。Pf51A表现出催化阿拉伯糖从寡聚物集合中释放,所述寡聚物集合是通过内切木聚糖酶的作用从半纤维素中释放的。预测的保守酸性残基包括E43、D50、E248、E287、E331、E360、E472和E480。如本文中使用的,“Pf5IA多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID NO 22的残基21至642之间至少 50、75、100、125、150、175、200、250、300、350、400、450、500、550或600个连续的氨基酸残基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%或100%序列同一性。Pf51A多肽与天然的Pf51A相比,优选在残基E43、D50、E248、E287、E331、E360、E472 和 E480 是没有改变的。Pf51A 多肽优选至少 70%、80%、90 %、95 %、98 %或99 %的在Pf 51A、Pa5IA和Fv5IA之间保守的氨基酸残基是没有改变的,如图54的比对所示。Pf51A多肽适宜地包括图IlB所示的天然Pf51A的预测的保守结构域。示例性的Pf51A多肽包括与图1川所示成熟的?デ5认序列具有至少85%、86%、87%、88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%100% 同一性的序列。本发明的Pf51A多肽优选具有L-a -阿拉伯呋喃糖苷酶活性。相应的,本发明的Pf51A多肽适宜地包括与SEQ ID N0:22,或与SEQ ID NO :22的残基(i) 21-632、(ii)461-632、(iii) 2ト642 或(iv)461-642 的氨基酸序列具有至少 90%,91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽适宜地具有L- a -阿拉伯呋喃糖苷酶活性。AfuXyn2 AfuXyn2 的氨基酸序列(SEQ ID NO 24)显示在图 12B和 55B 中。SEQ IDNO 24是未成熟的AfuXyn2的序列。AfuXyn2具有对应于SEQ ID NO 24的残基I至18的预测的信号序列(图12B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ IDNO 24的残基19至228的序列。在图12B中,预测的GHll保守结构域用粗体字表示。通过观察AfuXyn2在存在木ニ糖酶(xylobiosidase)下作用于预处理的生物量或分离的半纤维素时,催化増加的木糖単体生产的能力,间接的表现出AfuXyn2具有内切木聚糖酶活性。保守的催化残基包括E124、E129和E215。如本文中使用的,“AfuXyn2多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID NO :24的残基19至228之间至少50、75、100、125、150、175或200个连续的氨基酸残基具有至少85 %、86 %、87 %、88 %、89 %、90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。AfuXyn2 多肽与天然的AfuXyn2相比,优选在残基E124、E129和E215是没有改变的。AfuXyn2多肽优选至少70 %、80 %、90 %、95 %、98 %或99 %的在AfuXyn2、AfuXyn5和里氏木霉Xyn2之间保守的氨基酸残基是没有改变的,如图55B的比对所示。AfuXyn2多肽适宜地包括图12B所示的天然AfuXyn2的完整的预测的保守结构域。示例性的AfuXyn2多肽包括与图12B所示成熟的 AfuXyn2 序列具有至少 85 % ,86 % ,87 % ,88 % ,89 % ,90 % ,91 % ,92 % ,93 % ,94 %,95%、96%、97%、98%、99%或100%同一性的序列。本发明的AfuXyn2多肽优选具有木聚糖酶活性。AfuXvn5 AfuXvn5 的氡某酸序列(SEQ ID NO :26)显示在图 13B 和 55B 中。SEQID NO 26是未成熟的AfuXyn5的序列。AfuXyn5具有对应于SEQ ID NO 26的残基I至19的预测的信号序列(图13B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ IDNO 26的残基20至313的序列。在图13B中,预测的GHll保守结构域用粗体字表示。通过观察AfuXyn5在存在木ニ糖酶(xylobiosidase)作用于预处理的生物量或分离的半纤维素的条件下,催化增加的木糖单体生产的能力,间接的表现出AfuXyn5具有内切木聚糖酶活性。保守的催化残基包括E119、E124和E210。预测的CBM靠近C末端,特征是多个疏水残基排在长的富含丝氨酸、苏氨酸的氨基酸序列后。所述区域以下划线显示在图55B中。如本文中使用的,“AfuXyn5多肽”指包含这样的序列的多肽和/或其变体,所述序列与 SEQ ID NO 26 的残基 20 至 313 之间至少 50、75、100、125、150、175、200、250 或 275个连续的氨基酸残基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%或100%序列同一性。AfuXyn5多肽与天然的AfuXyn5相比,优选在残基E119、E120和E210是没有改变的。AfuXyn5多肽优选至少70%、80%、90%、95%、98 %或99 %的在AfuXyn5、AfuXyn2和里氏木霉Xyn2之间保守的氨基酸残基是没有改变的,如图55B的比对所示。AfuXyn5多肽适宜地包括图13B所示的天然AfuXyn5的整个预测的CBM和/或天然AfuXyn5的完整的预测保守结构域(下划线示出)。示例性的AfuXyn5多肽包括与图13B所示成熟的AfuXyn5序列具有至少85%、86%、87%、88%、89%、90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或 100% 同一性的序列。本发明的 AfuXyn5 多肽优选具有木聚糖酶活性。Fv43D Fv43D 的氨基酸序列(SEQ ID NO 28)显示在图 14B 和 53 中。SEQ ID NO 28是未成熟的Fv43D的序列。Fv43D具有对应于SEQ ID NO :28的残基I至20的预测的信号序列(图14B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQID NO 28的残基21至350的序列。在图14B中,预测的保守结构域用粗体字表示。Fv43D表现出具有¢-木糖苷酶活性,在例如使用对-硝基苯-¢-木吡喃糖苷、木ニ糖和/或混合的线性的木糖寡聚物作为底物的酶学測定中。预测的催化残基包括D37或D72、D159和E251。如本文中使用的,“Fv43D多肽”指包含这样的序列的多肽和/或其变体,所述序列与 SEQ ID NO 28 的残基 21 至 350 之间至少 50、75、100、125、150、175、200、250、300 或 320个连续的氨基酸残基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。Fv43D多肽与天然的Fv43D相比,优选在残基D37或D72、D159和E251是没有改变的。Fv43D多肽优选至少70%、80%、90%、95%、
98%或99 %的在一类酶之间保守的氨基酸残基是没有改变的,所述酶包括Fv43D和图53的比对中的1、2、3、4、5、6、7、8或所有9个其它氨基酸序列。Fv43D多肽适宜地包括图14B所示的天然Fv43D的完整的预测⑶。示例性的Fv43D多肽包括与图14B所示成熟的Fv43D序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%、99%或100%同一性的序列。本发明的Fv43D多肽优选具有P -木糖苷酶活性。相应的,本发明的Fv43D多肽适宜地包括与SEQ ID NO :28,或与SEQ ID NO 28的残基(i) 20-341、(ii) 21-350、(iii) 107-341 或(iv) 107-350 的氨基酸序列具有至少 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多
肽适宜地具有¢-木糖苷酶活性。Pf43B Pf43B 的氨基酸序列(SEQ ID NO 30)显示在图 15B 和 53 中。SEQ ID NO 30是未成熟的Pf43B的序列。Pf43B具有对应于SEQ IDNO 30的残基I至20的预测的信号序列(图15B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQID NO 30的残基21至321的序列。在图15B中,预测的保守结构域用粗体字表示。保守结构域中的保守酸性残基包括D32、D61、D148和E212。Pf43B表现出具有P -木糖苷酶活性,在例如使用对-硝基苯-木批喃糖苷、木ニ糖(xylobiose)和/或混合的线性的木糖寡聚物作为底物的酶学测定中。如本文中使用的,“Pf43B多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID勵30的残基21至321之间至少50、75、100、125、150、175、200、250或280个连续的氨基酸残基具有至少85%、86%、87%、88%、89%、90%、91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。Pf43B 多肽与天然的Pf43B相比,优选在残基D32、D61、D148和E212是没有改变的。Pf43B多肽优选至少70%、80%、90%、95%、98%或99%的在ー类酶之间保守的氨基酸残基是没有改变的,所述酶包括Pf43B和图53的比对中的1、2、3、4、5、6、7、8或所有9个其它氨基酸序列。Pf43B多肽适宜地包括图15B所示的天然Pf43B的预测保守结构域。示例性的Pf43B多肽包括与图15B 所示成熟的 Pf43B 序列具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%同一性的序列。本发明的Pf43B多肽优选具有3 -木糖苷酶活性。相应的,本发明的Pf43B多肽适宜地包括与SEQ ID NO :30的氨基酸序列具有至少90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性的氨基酸序列。多肽适宜地具有¢-木糖苷酶活性。Fv51A Fv51A 的氨基酸序列(SEQ ID NO 32)显示在图 16B 和 54 中。SEQ ID NO 32是未成熟的Fv51A的序列。Fv51A具有对应于SEQ ID NO :32的残基I至19的预测的信号序列(图16B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQID NO 32的残基20至660的序列。在图16B中,预测的L-a -阿拉伯呋喃糖苷酶保守结构域用粗体字表示。Fv51A表现出具有L-a -阿拉伯呋喃糖苷酶活性,在例如使用4_硝基苯-a -L-阿拉伯呋喃糖作为底物的酶学測定中。Fv51A表现出从寡聚物集合中催化阿拉伯糖的释放,所述寡聚物通过内切木聚糖酶的作用从半纤维素释放。保守的残基包括E42、D49、E247、E286、E330、E359、E479和E487。如本文中使用的,“Fv51A多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID NO 32的残基20至660之间至少50、75、100、125、150、175、200、250、300、350、400、450、500、550、600 或 625 个连续的氨基酸残基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。Fv51A多肽与天然的?¥5认相比,优选在残基£42、049、£247』286、E330、E359、E479 和 E487 是没有改变的。Fv51A 多肽优选至少 70%、80%、90%、95%、98%或99%的在Fv51A、Pa51A和Pf51A之间保守的氨基酸残基是没有改变的,如图54的比对所示。Fv51A多肽适宜地包括图16B所示的天然Fv51A的预测保守结构域。示例性的Fv51A多肽包括与图16B所示成熟的Fv51A序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100% 同一性的序列。本发明的 Fv51A 多肽优选具有L- a -阿拉伯呋喃糖苷酶活性。相应的,本发明的Fv51A多肽适宜地包括与SEQ ID N0:32,或与SEQ ID NO :32的残基(i) 2ト660、(ii) 21-645、(iii) 450-645 或(iv) 450-660 氨基酸序列具有至少 90 %、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性的氨基酸序列。多肽适宜地具有L- a -阿拉伯呋喃糖苷酶活性。Xvn3 単氐木霍Xvn3的氡某酸序列(SEQ ID NO 42)显示在图21B中。SEQ ID NO 42是未成熟的里氏木霉Xyn3的序列。里氏木霉Xyn3具有对应于SEQ ID NO :42的残基I至16的预测的信号序列(图21B中下划线的);预测切割信号序列产生成熟的蛋白质,其具有对应于SEQ ID NO 42的残基17至347的序列。在图21B中,预测的保守结构域用粗体字表示。通过观察当酶作用于预处理的生物量或分离的半纤维素时,里氏木霉Xyn3在存在木ニ糖酶(xylobiosidase)的条件下催化增加的木糖单体生产的能力,间接的表现出里氏木霉
Xyn3具有内切木聚糖酶活性。保守的催化残基包括E91、E176、E180、E195和E282,如通过与另ー种GHlO家族酶比对所确定的,所述GHlO家族酶是霍耳斯特德氏链霉菌(Sti^ptomyceshalstedii)的 Xysl delta (Canals 等人,2003, Act Crystalogr. D Biol. 59 :1447_53),具有与里氏木霉Xyn3的33%序列同一性。如本文中使用的,“里氏木霉Xyn3多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID NO 42的残基17至347之间至少50、75、100、125、150、175、200、250或300个连续的氨基酸残基具有至少85 % ,86 % ,87 % ,88 %,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性。里氏木霉Xyn3多肽与天然的里氏木霉Xyn3相比,优选在残基E91、E176、E180、E195和E282是没有改变的。里氏木霉Xyn3多肽优选至少70 %、80 %、90 %、95 %、98 %或99 %的在里氏木霉Xyn3和Xysl delta之间保守的氨基酸残基是没有改变的。里氏木霉Xyn3多肽适宜地包括图21B所示的天然里氏木霉Xyn3的完整的预测保守结构域。示例性的里氏木霉Xyn3多肽包括与图21B所示成熟的里氏木霉Xyn3序列具有至少85 %、86 %、87 %、88 %、89 %、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100% 同一性的序列。本发明的里氏木霉Xyn3多肽优选具有木聚糖酶活性。Xyn2 里氏木霉Xyn2的氨基酸序列(SEQ ID NO 43)显示在图22和55B中。SEQID NO 43是未成熟的里氏木霉Xyn2的序列。里氏木霉Xyn2具有对应于SEQ ID NO 43的残基I至33的预测的前多肽原序列(图22中下划线的);预期切割在16和17位之间的预测信号序列产生原肽,所述原肽在32和33位之间被kexin样蛋白酶加工,产生具有对应于的序列SEQ ID NO 43的残基33至222的成熟蛋白质。在图22中,预测的保守结构域用粗体字表示。通过观察当酶作用于预处理的生物量或分离的半纤维素时,里氏木霉Xyn2在存在木ニ糖酶(xylobiosidase)的条件下,催化增加的木糖单体生产的能力,间接的表现出里氏木霉Xyn2具有内切木聚糖酶活性。保守的酸性残基包括E118、E123和E209。如本文中使用的,“里氏木霉Xyn2多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQID NO 43的残基33至222之间至少50、75、100、125、150或175个连续的氨基酸残基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100 %序列同一性。里氏木霉Xyn2多肽与天然的里氏木霉Xyn2相比,优选在残基El 18、E123和E209是没有改变的。里氏木霉Xyn2多肽优选至少70%、80%、90%、95%、98%或99%的在里氏木霉Xyn2、AfuXyn2和AfuXyn5之间保守的氨基酸残基是没有改变的,如图55B的比对中所示。里氏木霉Xyn2多肽适宜地包括图22所示的天然里氏木霉Xyn2的完整的预测保守结构域。示例性的里氏木霉Xyn2多肽包括与图22所示成熟的里氏木霉Xyn2序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98^,99%或100%同一性的序列。本发明的里氏木霉Xyn2多肽优选具有木聚糖酶活性。Bxll :単氏木霉BxlI的氨基酸序列(SEQ ID NO 44)显示在图23和64中。SEQ IDNO :44是未成熟的里氏木霉Bxll的序列。里氏木霉BxlI具有对应于SEQ ID NO :44的残基I至18的预测的信号序列(图23中下划线的);预期切割信号序列产生具有对应于的序列SEQ IDNO 44的残基19至797的序列的成熟蛋白质。在图23中,预测的保守结构域用粗体字表示。里氏木霉Bxll表现出具有@ -木糖苷酶活性,在例如使用对-硝基苯-P -木吡喃糖苷、木ニ糖和/或混合的线性的木糖寡聚物作为底物的酶学測定中。保守的酸性残基包括E193、E234和D310。如本文中使用的,“里氏木霉Bxll多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID NO 44的残基17至797之间至少50、75、100、125、150、
175、200、250、300、350、400、450、500、550、600、650、700 或 750 个连续的氨基酸残基具有至少 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。里氏木霉BxlI多肽与天然的里氏木霉BxlI相比,优选在残基E193、E234和D310是没有改变的。里氏木霉Bxll多肽优选至少70%、80%、90%、95%、98%或
99%的在里氏木霉Bxl I、Fv3A和里氏木霉Bgl I之间保守的氨基酸残基是没有改变的,如图64的比对中所示。里氏木霉Bxll多肽适宜地包括图23所示的天然里氏木霉Bxll的完整的预测保守结构域。示例性的里氏木霉Bxll多肽包括与图23所示成熟的里氏木霉Bxll序列具有至少 85%,86%,87%,88%,89%,90%,91%,92%,93%,94%,95%,96%,97%,98%、99%或100%同一性的序列。本发明的里氏木霉Bxll多肽优选具有¢-木糖苷酶活性。相应的,本发明的里氏木霉Bxll多肽适宜地包括与SEQ ID NO 44的氨基酸序列具有至少 90%,91%,92%,93%,94%,95%,96%,97%,98%,99%^; 100%序列同一性的
氨基酸序列。多肽适宜地具有¢-木糖苷酶活性。Bgll :里氏木霉Bgll的氨基酸序列(SEQ ID NO 45)显示在图24和64中。里氏木霉Bgll具有对应于SEQ ID NO 45的残基I至19的预测的信号序列(图24中下划线的);预期切割信号序列产生具有对应于SEQ ID NO :45的残基20至744的序列的成熟蛋白质。在图24中,预测的保守结构域用粗体字表示。通过观察其催化对硝基苯-P-D-吡喃葡萄糖苷水解生成对硝基苯酚的能力,和催化纤维ニ糖水解的能力,里氏木霉Bgll表现出具有¢-葡糖苷酶活性。保守的酸性残基包括D164、E197和D267。如本文中使用的,“里氏木霉Bgll多肽”指包含这样的序列的多肽和/或其变体,所述序列与SEQ ID NO 45的残基 20 至 744 之间至少 50、75、100、125、150、175、200、250、300、350、400、450、500、550、600、650、700、750或780个连续的氨基酸残基具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%序列同一性。里氏木霉Bgll 多肽与天然的Bgll相比,优选在残基D164、E197和D267是没有改变的。里氏木霉Bgll多肽优选至少70%、80%、90%、95%、98%或99%的在里氏木霉Bgll、Fv3A和里氏木霉Bxll之间保守的氨基酸残基是没有改变的,如图64的比对中所示。里氏木霉Bgll多肽适宜地包括图24所示的天然里氏木霉Bgll的完整的预测保守结构域。示例性的里氏木霉Bgll多肽包括与图24所示成熟的里氏木霉8§11序列具有至少85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100% 同一性的序列。本发明的里氏木霉Bgll多肽优选具有P -葡糖苷酶活性。相应的,本公开内容提供了多个分离的、合成的或重组的半纤维素水解多肽或变体,如下所述(I)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i)SEQ ID NO 2的24 至 766 位;(ii) SEQ ID NO 2 的 73 至 321 位;(iii) SEQ ID NO 2 的 73 至 394 位;(iv)SEQ ID NO 2 的 395 至 622 位;(v) SEQ ID NO 2 的 24 至 622 位;或(vi) SEQ ID NO 2 的73至622位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有P-木糖苷酶活性;或(2)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i)SEQ ID NO 4的21 至 445 位;(ii) SEQ ID NO :4 的 21 至 301 位;(iii) SEQ ID NO :4 的 21 至 323 位;(iv)SEQ ID NO :4 的 21 至 444 位;(v) SEQ ID NO 4 的 302 至 444 位;(vi) SEQ ID NO 4 的 302至 445 位;(vii) SEQ ID NO 4 的 324 至 444 位;或(viii) SEQ ID NO 4 的 324 至 445 位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有3-木糖苷酶活性;或(3)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i)SEQ ID NO 6的
19至 530 位;(ii) SEQ ID NO 6 的 29 至 530 位;(iii) SEQ ID NO 6 的 19 至 300 位;或(iv)SEQ ID NO :6的29至300位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有P -木糖苷酶活性;或(4)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i)SEQ ID NO 8的
20至 439 位;(ii) SEQ ID NO :8 的 20 至 291 位;(iii) SEQ ID NO :8 的 145 至 291 位;或(iv) SEQ ID NO :8的145至439位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有P -木糖苷酶活性;或(5)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i) SEQ ID N010的 23 至 449 位;(ii) SEQ ID NO :10 的 23 至 302 位;(iii) SEQ ID NO : 10 的 23 至 320 位;(iv) SEQ ID NO 10 的 23 至 448 位;(v) SEQ ID NO 10 的 303 至 448 位;(vi) SEQ ID NO 10的 303 至 449 位;(vii)SEQ ID NO 10 的 321 至 448 位;或(viii) SEQ ID NO :10 的 321 至449位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有¢-木糖苷酶活性;或(6)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i) SEQ ID NO 12的 17 至 574 位;(ii)SEQ ID NO :12 的 27 至 574 位;(iii) SEQ ID NO 12 的 17 至 303 位;或(iv)SEQ ID NO :12的27至303位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有P -木糖苷酶活性和L-a -阿拉伯呋喃糖苷酶活性;或(7)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i) SEQ ID NO 14的 21 至 676 位;(ii)SEQ ID NO :14 的 21 至 652 位;(iii) SEQ ID NO 14 的 469 至 652 位;或(iv)SEQ ID NO :14的469至676位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有P -木糖苷酶活性和L-a -阿拉伯呋喃糖苷酶活性;或(8)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i) SEQ ID NO 16的 19 至 340 位;(ii)SEQ ID NO :16 的 53 至 340 位;(iii) SEQ ID NO 16 的 19 至 383 位;或(iv)SEQ ID NO :16的53至383位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有P -木糖苷酶活性;或(9)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i) SEQ ID NO 18的 21 至 341 位;(ii)SEQ ID NO :18 的 107 至 341 位;(iii) SEQ ID NO 18 的 21 至 348 位;或(iv)SEQ ID NO :18的107至348位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有P -木糖苷酶活性;或(10)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i) SEQ ID NO :20的15至558位;或(ii) SEQ ID NO :20的15至295位的氨基酸序列具有至少90%、至少
95%、至少98%、至少99%或100%序列同一性;多肽优选具有L-a -阿拉伯呋喃糖苷酶活性;或(11)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i)SEQ ID NO :22的 21 至 632 位;(ii)SEQ ID NO :22 的 461 至 632 位;(iii) SEQ ID NO 22 的 21 至 642 位;或(iv)SEQ ID NO :22的461至642位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有L-a -阿拉伯呋喃糖苷酶活性;或(12)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i) SEQ ID NO :28的 20 至 341 位;(ii)SEQ ID NO :28 的 21 至 350 位;(iii) SEQ ID NO 28 的 107 至 341 位;或(iv)SEQ ID NO :28的107至350位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有P -木糖苷酶活性;或(13)包括这样的氨基酸序列的多肽,所述氨基酸序列与对应于(i) SEQ ID NO :32的 21 至 660 位;(ii)SEQ ID NO :32 的 21 至 645 位;(iii) SEQ ID NO 32 的 450 至 645 位;或(iv)SEQ ID NO :32的450至660位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性;多肽优选具有L-a -阿拉伯呋喃糖苷酶活性。本公开内容还提供了富含ー种或多种上述多肽的组合物(例如,纤维素酶组合物或酶掺合物/組合物)或发酵培养基。因而,酶掺合物/組合物是非天然存在的组合物。纤维素酶组合物可以是例如丝状真菌纤维素酶组合物,例如木霉的纤维素酶组合物。发酵培养基可以是丝状真菌的发酵培养基,例如木霉属、腐质霉属、铼孢霉属、曲霉属、脉孢菌属、青霉属、头孢霉属、绵霉属、柄孢壳属、内座壳属、毛霉属、旋孢腔菌、梨孢属或金孢子菌属的发酵培养基。特别的,发酵培养基可以是例如一种木霉属物种的,例如里氏木霉的,或者青霉属物种的,例如绳状青霉的发酵培养基。发酵培养基还可以适宜地是无细胞的发酵培养基。此外,本公开内容提供了经重组改造而表达上述多肽的宿主细胞。宿主细胞可以是例如丝状真菌宿主细胞,例如木霉属、腐质霉属、铼孢霉属、曲霉属、脉孢菌属、青霉属、头孢霉属、绵霉属、柄孢壳属、内座壳属、毛霉属、旋孢腔菌、梨孢属或金孢子菌属的细胞。特别的,宿主细胞可以是例如一种木霉属物种的细胞(例如里氏木霉细胞),或者青霉细胞(例如绳状青霉细胞)、曲霉细胞(例如米曲霉(Aspergillus oryzae)或构巢曲霉细胞(Aspergillus nidulans)),或铼孢霉细胞(例如轮孢铼刀菌(Fusarium verticilloides)或尖孢铼刀菌(Fusarium oxysporum)细胞)。6. I. I融合蛋白本公开内容还提供了这样的融合蛋白,所述融合蛋白包括与ー个或多个融合片段连接的本公开内容的蛋白质的结构域,所述融合片段典型的是与所述蛋白质异源的(即,源自与本公开内容的蛋白质的不同的来源)。适宜地融合片段包括但不限于可以增强蛋白质稳定性、提供其他理想的生物学活性和/或促进蛋白质纯化(例如,通过亲和层析)的片段。适宜地融合片段可以是具有理想功能的任何大小的结构域(例如,给予增加的稳定性、溶解度、作用或生物学活性;和/或简化蛋白质纯化)。融合片段可以与本公开内容的蛋白质的结构域的氨基和/或羧基端连接。融合片段可以是对切割敏感的。具有该敏感性可具有ー些优点,例如能够直接回收目标蛋白。融合蛋白优选是通过培养用编码蛋白质的融合核酸转染的重组细胞生产的,所述蛋白质包括与蛋白质或其结构域的羧基或氨基端连接的融合片段,或者同时与羧基和氨基端连接的融合片段。此外,本公开内容的蛋白质还包括基因融合体(例如,重组蛋白的过表达的、可溶的和活性的形式)的表达产物、诱变基因(例如具有密码子修饰以增强基因转录和翻译的基因)的表达产物,和截短的基因(例如,具有去除信号序列的或用异源信号序列取代的基因)的表达产物。利用不溶性底物的糖基水解酶通常是模块化酶。通常包括添加了一个或多个非催化性碳水化合物结合结构域(CBM)的催化模块。本质上,CBM被认为促进糖基水解酶与其靶底物多糖的相互作用。因而,本公开内容提供了具有改变的底物特异性的嵌合酶;包括例如,作为“切入”异源CBM的结果而具有多个底物的嵌合酶。本公开内容的嵌合酶的异源CBM还可以设计为模块化的,以便添加到催化性模块或催化性结构域(“CD”,例如在活性位点)上,同样其可以是与糖基水解酶异源或同源的。因而,本公开内容提供了由CBM/⑶模块组成的肽和多肽,或包括CBM/⑶模块的肽和多肽,所述模块可以是同源的配对或连接形成嵌合(异源)的CBM/CD对。因而,这些嵌合多肽/肽可用于改善或改变目标酶的性能。相应的,本公开内容提供了这样的嵌合酶,所述嵌合酶包括例如SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44或45的酶的至少ー个CBM。本公开内容的多肽例如包括这样的氨基酸序列,所述氨基酸序列包括 SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44或45的糖基水解酶序列的CD和/或CBM。因而,本公开内容的多肽可以适宜地是包括来自两个或多个不同蛋白质的功能结构域的融合蛋白(例如,ー种蛋白质的CBM与另ー种蛋白质的⑶连接)。本公开内容的多肽可以适宜地以“基本纯的”形式获得和/或使用。例如,本公开内容的多肽构成给定组合物中至少约80wt% (例如,至少约85wt WjOwt1^jlwt %、
或 99wt*% )的总蛋白,所述组合物
还包括其他成分,例如缓冲液或溶液。本公开内容的多肽还可以适宜地以重组培养物培养基(例如,丝状真菌培养物培养基)来获得和/或使用。重组培养物培养基可以是非天然存在的;例如,可以通过经改造表达本公开内容的异源多肽的重组宿主细胞,或通过经改造以比内源表达水平更大或更少的量(例如,以比内源表达水平大或小1、2、3、4、5或更多倍的量)表达本公开内容的内源多肽的重组宿主细胞来生产培养物培养基。此外,本公开内容的多肽可以作为重组培养物培养基获得和/或使用,所述重组培养物培养基是通过经改造以理想比例表达本公开内容多个多肽的“整合的”宿主细胞菌株生产的。示例性的理想比例描述在本文中,例如在下文的6. 3. 4节中。6. 2核酸和宿主细胞本公开内容提供了编码本公开内容的多肽的核酸,例如上文6. I节中描述的。本公开内容提供了包括这样的核酸序列的分离的、合成的或重组的核酸,所述核酸序列与 SEQ ID NO :1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、46、47、48、49或50的核酸序列,在至少约10个,例如至少约15、20、25、30、35、40、45、50、
75、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、I100、I150、1200、1250、1300、1350、1400、1450、1500、1550、1600、1650、1700、1750、1800、1850、1900、1950或2000个核苷酸的区域,具有至少约70%,例如至少约71 %、72%,73%,74%,75%,76%,77%,78%,79%,80%,81 %,82%,83%,84%,85%,86%,87%、88%;89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或完全(100% )的序列同一性。本公开内容还提供了编码至少ー种具有半纤维素水解活性(例如,木聚糖酶、P -木糖苷酶和/或L- a -阿拉伯呋喃糖苷酶活性)的多肽的核酸。本公开内容的核酸还包括分离的、合成的或重组的核酸,其编码具有SEQ ID NO
2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44 或 45 的序列的酶,及其子序列(例如保守结构域或碳水化合物结合结构域(CBM)),及其变体。本公开内容的核酸可以例如编码SEQ ID NO :2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、43、44或45的蛋白质的成熟部分。本公开内容具体提供了编码 Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B、Fv43B、Fv51A、里氏木霉 Xyn3、里氏木霉Xyn2、里氏木霉BxlI,或里氏木霉Bgll多肽的核酸。例如,本公开内容提供了分离的核酸分子,其中核酸分子编码(I)包括与对应于⑴ SEQ ID NO 2 的 24 至 766 位;(ii) SEQ IDNO 2 的 73 至 321位;(iii) SEQ ID NO 2 的 73 至 394 位;(iv) SEQID NO :2 的 395 至 622 位;(v) SEQ ID NO 2的24至622位;或(vi)SEQ ID NO :2的73至622位的氨基酸序列具有至少90 %、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(2)包括与对应于⑴ SEQ ID NO 4 的 21 至 445 位;(ii) SEQ IDNO 4 的 21 至 301位;(iii) SEQ ID NO :4 的 21 至 323 位;(iv) SEQID NO :4 的 21 至 444 位;(v) SEQ ID NO 4的 302 至 444 位;(vi) SEQ ID NO 4 的 302 至 445 位;(vii) SEQ ID NO 4 的 324 至 444 位;或(viii)SEQ ID NO :4的324至445位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(3)包括与对应于⑴ SEQ ID NO 6 的 19 至 530 位;(ii) SEQ IDNO 6 的 29 至 530位;(iii) SEQ ID NO 6的19至300位;或(iv) SEQID NO 6的29至300位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(4)包括与对应于⑴ SEQ ID NO 8 的 20 至 439 位;(ii) SEQ IDNO 8 的 20 至 291位;(iii) SEQ ID NO 8 的 145 至 291 位;或(iv)SEQ ID NO 8 的 145 至 439 位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(5)包括与对应于(i) SEQ ID NO :10 的 23 至 449 位;(ii) SEQID N0:10 的 23 至302 位;(iii) SEQ ID NO : 10 的 23 至 320 位;(iv) SEQ ID NO : 10 的 23 至 448 位;(v) SEQ IDNO :10 的 303 至 448 位;(vi)SEQ ID NO : 10 的 303 至 449 位;(vii) SEQ ID NO :10 的 321 至448位;或(viii)SEQ ID NO :10的321至449位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(6)包括与对应于⑴ SEQ ID NO : 12 的 17 至 574 位;(ii) SEQID NO: 12 的 27 至574 位;(iii) SEQ ID NO : 12 的 17 至 303 位;或(iv) SEQ ID NO : 12 的 27 至 303 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(7)包括与对应于(i) SEQ ID NO : 14 的 21 至 676 位;(ii) SEQID NO : 14 的 21 至652 位;(iii) SEQ ID NO 14 的 469 至 652 位;或(iv) SEQ ID NO :14 的 469 至 676 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(8)包括与对应于(i) SEQ ID NO : 16 的 19 至 340 位;(ii) SEQID NO: 16 的 53 至
340位;(iii) SEQ ID NO 16 的 19 至 383 位;或(iv)SEQ ID NO :16 的 53 至 383 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(9)包括与对应于(i) SEQ ID NO : 18 的 21 至 341 位;(ii) SEQID NO : 18 的 107 至
341位;(iii) SEQ ID NO 18 的 21 至 348 位;或(iv) SEQ ID NO :18 的 107 至 348 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(10)包括与对应于(i)SEQ ID NO :20 的 15 至 558 位;或(ii)SEQ ID NO :20 的15至295位的氨基酸序列具有至少90%、至少95%、至少98%、至少99%或100%序列同一性的氨基酸序列的多肽;或(11)包括与对应于(i) SEQ ID NO :22 的 21 至 632 位;(ii) SEQID N0:22 的 461 至632 位;(iii) SEQ ID NO 22 的 21 至 642 位;或(iv) SEQ ID NO :22 的 461 至 642 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(12)包括与对应于(i)SEQ ID NO :28 的 20 至 341 位;(ii) SEQID NO 28 的 21 至350 位;(iii) SEQ ID NO 28 的 107 至 341 位;或(iv) SEQ ID NO :28 的 107 至 350 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽;或(13)包括与对应于(i) SEQ ID NO :32 的 21 至 660 位;(ii) SEQID NO :32 的 21 至645 位;(iii) SEQ ID NO 32 的 450 至 645 位;或(iv) SEQ ID NO :32 的 450 至 660 位的氨基酸序列具有至少90 %、至少95 %、至少98 %、至少99 %或100 %序列同一性的氨基酸序列的多肽。
本公开内容还提供(I)与 SEQ ID N0:1 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 1的互补体或与其片段杂交的核酸;或(2)与 SEQ ID N0:3 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 3的互补体或与其片段杂交的核酸;或(3)与 SEQ ID N0:5 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 5的互补体或与其片段杂交的核酸;或(4)与 SEQ ID N0:7 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 7的互补体或与其片段杂交的核酸;或(5)与 SEQ ID N0:9 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 9的互补体或与其片段杂交的核酸;或(6)与 SEQ ID N0:11 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 11的互补体或与其片段杂交的核酸;或(7)与 SEQ ID N0:13 具有至少 90% (例如,至少 90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 13的互补体或与其片段杂交的核酸;或(8)与 SEQ ID N0:15 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 15的互补体或与其片段杂交的核酸;或(9)与 SEQ ID N0:17 具有至少 90% (例如,至少 90 %、91 %、92 %、93 %、94 %、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 17的互补体或与其片段杂交的核酸;或(10)与 SEQ ID NO : 19 具有至少 90 % (例如,至少 90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 19的互补体或与其片段杂交的核酸;或(11)与 SEQ ID N0:21 具有至少 90% (例如,至少 90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 21的互补体或与其片段杂交的核酸;或(12)与 SEQ ID NO :27 具有至少 90 % (例如,至少 90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 27的互补体或与其片段杂交的核酸;或(13)与 SEQ ID NO :31 具有至少 90 % (例如,至少 90%、91 %、92%、93%、94%、95%、96%、97%、98%、99%或更高)序列同一性的核酸,或能够在高严紧条件下与SEQ IDNO 31的互补体或与其片段杂交的核酸。本公开内容还提供了包含上述核酸的表达盒和/或载体。适宜地,将编码本公开内容的酶的核酸与启动子有效连接。具体是当需要在丝状真菌宿主中重组表达时,启动子可以是丝状真菌启动子。核酸可以是例如处于异源启动子的控制下。核酸还可以在组成型或诱导型启动子的控制下表达。可使用的启动子的实例包括但不限于纤维素酶启动子、木聚糖酶启动子、1818启动子(之前定义为由EST作图的木霉的高表达蛋白质)。例如,启动子可以适宜地是纤维ニ糖水解酶、内切葡聚糖酶或¢-葡糖苷酶的启动子。特别适宜地启动子可以是例如里氏木霉纤维ニ糖水解酶、内切葡聚糖酶或¢-葡糖苷酶的启动子。例如启动子是纤维ニ糖水解酶I (cbhl)启动子。启动子的非限制性实例包括 cbhl、cbh2、egll、egl2、egl3、egl4、egl5、pkil、gpdl、xynl 或 xyn2 启动子。启动子的其他非限制性实例包括里氏木霉cbhl、cbh2、egll、egl2、egl3、egl4、egl5、pkil、gpdl、xynl 或 xyn2 启动子。本公开内容还提供了经改造以表达ー种或多种本公开内容的酶的宿主细胞。适宜地宿主细胞包括任何微生物的细胞(例如,细菌、原生生物、藻类、真菌(例如酵母或丝状真菌)或其他微生物的细胞),优选细菌、酵母或丝状真菌的细胞。适宜地细菌属的宿主细胞包括但不限于埃希菌属、芽孢杆菌属、乳杆菌属、假单胞菌属和链霉菌属的细胞。适宜地细菌物种的宿主细胞包括但不限于大肠杆菌(Escherichiacoli)、枯草芽抱杆菌(Bacillussubtilis)、地衣芽抱杆菌(Bacillus licheniformis)、短乳杆菌(Lactobacillusbrevis)、绿胺假单胞菌(Pseudomonas aeruginosa)和浅青紫链霉菌(Streptomyces Iividans)的细胞。适宜地酵母属的宿主细胞包括但不限于酵母属(Saccharomyces)、裂埴酵母属(Schizosaccharomyces)、假丝酵母属(Candida)、汉森氏酵母属(Hansenula)、毕赤酵母属(Pichia)、克鲁维酵母属(Kluyveromyces)和法夫酵母属(Phaffia)的细胞。适宜地酵母物种的宿主细胞包括但不限于酿酒酵母(Saccharomyces cerevisiae)、栗酒裂埴酵母(Schizosaccharomyces pombe)、白色假丝酵母(Candidaalbicans)、多形汉森酵母(Hansenula polymorpha)、巴斯德毕赤酵母(Pichiapastoris)、P. canadensis、马克思克鲁维酵母(Kluyveromycesmarxianus)和法夫酵母(Phaffia rhodozyma)的细胞。适宜地丝状真菌的宿主细胞包括真菌亚门的所有丝状体形式。适宜地丝状真菌属的宿主细胞包括但不限于支顶孢属(Acremonium)、曲霉属、短梗霉属(Aureobasidium)、烟管菌属(Bjerkandera)、拟腊菌属(Ceriporiopsis)、金孢子菌属(Chrysoporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、Corynascus、毛壳菌属(Chaetomium)、隐球菌属(Cryptococcus)、线黑粉酵母属(Filobasidium)、铼孢霉属、赤霉菌属(Gibberella)、腐质霉属、肉座菌属(Hypocrea)、Magnaporthe、毛霉属、毁丝霉属(Myceliophthora)、毛霉属、Neocal I imastix、脉孢菌属、拟青霉属(Paecilomyces)、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、Piromyces、侧耳属(Pleurotus)、Scytaldium、裂裙菌属(Schizophyllum)、孢子丝菌属(Sporotrichum)、篮状菌属(Talaromyces)JiI热子囊菌(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)和木霉属的细胞。适宜地细胞还可以包括这些丝状真菌属的各种无性型和有性型形式的细胞。
适宜地丝状真菌物种的宿主细胞包括但不限于泡盛曲霉、烟曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、Chrysosporiumlucknowense^ Fusarium bactridioides、Fusarium cerealis、克地f廉刀菌(Fusarium crookwellense)、大刀f廉刀菌(Fusarium culmorum)、禾谷f廉抱菌(Fusarium graminearum)、Fusarium graminum、弁抱 廉刀-囷(Fusarium heterosporum)、Fusarium negundi、尖抱,廉刀菌(Fusariumoxysporum)、Fusarium reticulatum、粉红铼刀菌(Fusarium roseum)、接骨木铼刀菌(Fusarium sambucinum)、肤色f廉刀M (Fusariumsarcochroum)、拟分枝抱辛廉 ノ^)菌(Fusarium sporotrichioidesノ、硫色 廉 ノコ囷(Fusarium sulphureum ノ、Fusarium torulosum、拟丝抱,廉刀菌(Fusariumtrichothecioidesノ、Fusarium venenatum、黑管菌(Bjerkan deraadusta)、十拟錯M (Ceriporiopsis aneirina; ^ ¢0 ^ (Ceriporiopsisaneirina; ^ Ceriporiopsiscaregiea、ダ戈成拟錯菌(Ceriporiopsis gilvescens)、しeriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、 虫拟錯菌(Ceriporiopsissubvermispora)、灰盖鬼伞(Coprinus cinereus)、毛云芝菌(Coriolus hirsutus)、特
异腐质霉(Humicola insolens)、柔毛腐质霉(Humicola lanuginosa)、米赫毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糖脉抱霉(Neurospora crassa)、间型脉抱菌(Neurospora intermedia)、产紫青霉(Penicilliumpurpurogenum)、变灰青霉(Penicillium canescens)、离生青霉(Penicillium solitum)、绳状青霉(Penicilliumfuniculosum)、黄抱原毛平革菌(Phanerochaete chrysosporium)、白腐菌射脉侧菌(Phlebiaradiate)、杏鲍燕(Pleurotus eryngii)、黄色篮状菌(Talaromyces flavus)、太瑞斯梭抱壳霉(Thielavia terrestris)、长域毛栓霉(Trametes villosa)、云芝(Trametesversicolor)、哈茨木霉(Tricnoderma harzianum)、康氏木霉(Trichoderma koningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉或绿色木霉(Trichoderma viride)的細胞。本公开内容进ー步提供了重组的宿主細胞,所述宿主细胞经改造而表达ー种或多种、两种或多种、三种或多种、四种或多种,或五种或多种的Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B 和 Fv51A多肽。重组宿主细胞是例如重组的里氏木霉宿主細胞。在特定的实例中,本公开内容提供了重组真菌,例如经改造而表达ー种或多种、两种或多种、三种或多种、四种或多种,或五种或多种的 Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B和Fv51A多肽的重组里氏木霉。本公开内容提供了重组的里氏木霉宿主細胞,所述宿主细胞经改造而表达1、2、3、4、5或更多种的Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B 和 Fv51A 多肽。本公开内容提供了宿主細胞,例如重组的真菌宿主細胞或重组的丝状真菌,其经改造而重组的表达至少ー种木聚糖酶、至少ー种P -木糖苷酶和至少ー种L-a -阿拉伯呋喃糖苷酶。本公开内容还提供了重组的宿主細胞,例如重组的真菌宿主細胞或重组的丝状真菌,如重组的里氏木霉,所述重组的宿主細胞经过改造,除一种或多种的里氏木霉Xyn2、里氏木霉Xyn3、里氏木霉Bxll和/或里氏木霉Bgllタト,还表达1、2、3、4、5或更多种的Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、八血乂7115{430、?デ438和?¥5认多肽。重组宿主细胞是例如里氏木霉宿主细胞。重组真菌是例如重组的里氏木霉。本公开内容提供了里氏木霉宿主细胞,或重组的里氏木霉真菌,其经过改造,除了重组表达一种或多种的里氏木霉Xyn2、里氏木霉Xyn3、里氏木霉Bxll和/或里氏木霉Bgllタト,还重组表达1、2、3、4、5或更多种的Fv3A、Pf43A、Fv43E、Fv39A、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、Af43A、Pf51A、AfuXyn2、AfuXyn5、Fv43D、Pf43B 和 Fv51A 多肽。本公开内容还提供了重组的宿主细胞,例如重组的真菌宿主细胞或重组的生物体,例如丝状真菌,如重组的里氏木霉,其经改造而重组的表达里氏木霉Xyn3、里氏木霉BglU Fv3A、Fv43D和Fv51A多肽。例如,重组的宿主细胞适宜地是里氏木霉宿主细胞。重组的真菌适宜地是重组的里氏木霉。本公开内容提供了例如经改造而重组表达里氏木霉Xyn3、里氏木霉Bgll、Fv3A、Fv43D和Fv51A多肽的里氏木霉宿主细胞。此外,本公开内容提供了重组的宿主细胞或重组的真菌,其经改造而表达酶掺合物,所述酶掺合物以适合糖化的比例包含合适的酶。重组宿主细胞是例如真菌宿主细胞。重
组真菌是例如重组的里氏木霉。在合适的酶掺合物中存在的示例性的酶比例/量描述在下文6. 3. 4节中。本公开内容进ー步提供了包含本公开内容的核酸或本公开内容的表达盒的转基因植物。转基因植物可以是例如谷类植物、玉米植物、马铃薯植物、西红柿植物、小麦植物、油料种子植物、油菜籽植物、大豆植物、水稻植物、大麦植物或烟草植物。6. 3用于糖化的酶掺合物本公开内容提供了包含能够降解木质纤维素材料的酶掺合物/组合物的组合物。此类多酶掺合物/组合物包括至少ー种本公开内容的多肽,组合了一种或多种其他本公开内容的多肽,或一种或多种来自其他微生物、植物或生物体的酶。考虑了协同的酶组合和相关的方法。本公开内容包括用于鉴别包括在用于降解特定的木质纤维素材料的掺合物/组合物中的最佳酶比例的方法。这些方法包括例如这样的测试,所述测试鉴别最佳的酶掺合物/组合物和用于将给定的木质纤维素底物有效转化为其组分糖的比例。下列实施例包括可用于鉴别降解木质纤维素材料的酶的最佳比例和掺合物/组合物的測定。6. 3. I 背景高等植物的细胞壁包括多种碳水化合物聚合物(CP)组分。这些CP通过共价和非共价方式相互作用,提供了形成坚硬的细胞壁和抵抗植物膨压所需的结构完整性。在植物中发现的主要CP是纤维素,形成了细胞壁的结构骨架。在纤维素的生物合成过程中,聚-3 -1,4-D-葡萄糖链自身通过氢键和疏水相互作用相关联,形成纤维素微纤丝,微纤丝再进ー步自身关联形成更大的纤丝(fibri I s)。纤维素微纤丝通常是不规则结构的,并含有变化的结晶度的区域。纤维素微纤丝的结晶程度取决于其组分纤维素链之间和之中的氢键如何紧密排列的。具有较低有序结合的区域,因而具有更多可接近的葡萄糖链,被称为无定型区域。纤维素解聚为葡萄糖的一般模型最少涉及三种不同的酶活性。在増加可接触末端的数量的过程中,内切葡聚糖酶内部切割纤维素链为短链,所述末端比完整的纤维素链对外切葡聚糖酶活性更敏感。这些外切葡聚糖酶(例如,纤维ニ糖水解酶)特异性针对还原端或非还原端,在大多数情况下释放葡萄糖的ニ聚体纤维ニ糖。积累的纤维ニ糖然后经历纤维ニ糖酶(例如,0-1,4-葡糖苷酶)切割为葡萄糖。纤维素仅含有无水合葡萄糖。相反,半纤维素含有多个不同的糖単体。例如除葡萄糖外,半纤维素中的糖单体还可包括木糖、甘露糖、半乳糖、鼠李糖和阿拉伯糖。半纤维素大部分含有D-戊糖,偶尔含少量L-糖。典型的存在最大量的木糖,但也倾向于存在甘露糖醛酸和半乳糖醛酸。半纤维素包括木聚糖、葡糖醛酸木聚糖、阿拉伯木聚糖、葡糖甘露聚糖和木葡聚糖。本公开内容的酶和多酶组合物可用于半纤维素材料的糖化,包括例如,木聚糖、阿拉伯木聚糖,和含有木聚糖或阿拉伯木聚糖的底物。阿拉伯木聚糖是包括木糖和阿拉伯糖的多糖,其中L-a-阿拉伯呋喃糖残基作为分支点与¢-(1,4)-连接的木糖多聚体骨架相连接。大部分生物量来源是相当复杂的,其中含有纤维素、半纤维素、果胶、木质素、蛋白
质和灰质等。相应的,在某些方面,本公开内容提供了含有这样的酶的酶掺合物/组合物,所述酶当以最有效的方式共同作用降解生物量为可发酵糖时,产生多种底物特异性。本发明的多酶掺合物/组合物的一个实例是纤维ニ糖水解酶、木聚糖酶、内切葡聚糖酶、P -葡糖苷酶、3-木糖苷酶和任选的辅助蛋白质的混合物。酶掺合物/組合物适宜地是非天然存在的组合物。相应的,本公开内容提供了包含木聚糖水解酶、半纤维素水解酶和/或纤维素水解酶的混合物的酶掺合物/组合物(包含制备产物),包括至少ー种、若干种或所有的纤维素酶,包括葡聚糖酶、纤维ニ糖水解酶、L-a-阿拉伯呋喃糖苷酶、木聚糖酶、0 -葡糖苷酶和¢-木糖苷酶。优选的,本公开内容的每种酶掺合物/組合物包括至少ー种本公开内容的酶。本公开内容还提供了酶掺合物/組合物,其是非天然存在的组合物。如本文中使用的,术语“酶掺合物/组合物”指(I)通过组合组分酶制造的组合物,不论是以发酵培养基还是部分或完全分离或纯化的形式;(2)由经修饰而表达ー种或多种组分酶的生物体生产的组合物;在某些实施方案中,用于表达ー种或多种组分酶的生物体可以经修饰而删除了ー个或多个基因;在某些其他实施方案中,用于表达ー种或多种组分酶的生物体可以进一歩包括影响木聚糖水解、半纤维素水解和/或纤维素水解的蛋白质;(3)在糖化或发酵反应的过程中,同时、分别或顺序地组合组分酶而制造的组合物;(4)原位生产的酶混合物,例如在糖化或发酵反应的过程中;(5)根据任ー或所有的上述(1)-(4)生产的组合物。术语“发酵培养基”在本文中指通过发酵生产的酶制品,所述酶制品在发酵后没有经过或只经过最小程度的回收和/或纯化。例如,将微生物培养物生长至饱和,在碳限制条件下孵育,允许蛋白质合成(例如,表达酶)。然后,一旦酶被分泌到细胞培养基中,就可以使用发酵培养基。本公开内容的发酵培养基可以含有未分级的或分级的源自发酵末期的发酵材料内容物。例如,本发明的发酵培养基是未分级的,包括在微生物细胞(例如,丝状真菌细胞)经历发酵过程后存在的耗尽营养的培养基和细胞碎片。发酵培养基可以适宜地含有耗尽营养的细胞培养基、胞外酶,和活的或杀死的微生物细胞。可选的,可以分级发酵培养基以去除微生物细胞。在这些情况下,发酵培养基可以包括例如耗尽营养的细胞培养基和胞外酶。本文具体描述的任何酶都可与本文描述的任何一种或多种酶组合,或与任何其他可获得和合适的酶组合,来生产合适的多酶掺合物/组合物。本公开内容不限于下文列举的特定示例性组合。6. 3. 2 牛物量本公开内容提供了使用本公开内容的酶、酶掺合物/组合物进行生物量糖化的方法。如本文中使用的,术语“生物量”指包含纤维素和/或半纤维素(任选的还有在木质纤维素生物量材料中的木质素)的任何组合物。如本文中使用的,生物量包括但不限于种子、谷类、块茎、植物废弃物或食品加工或エ业加工的副产物(例如,茎)、玉米(包括例如玉米棒、稻杆等)、草(包括例如,印度草,印度落芒草(Sorgh astrum nutans);或柳枝稷,如黍
(Panicum)物种,例如柳枝稷(Panicum virgatum))、木材(包括例如,木屑、下脚料)、纸、纸浆、再生纸(例如,报纸、印刷纸等)。其他生物量包括但不限于马铃薯、大豆(例如,油菜)、大麦、黑麦、燕麦、小麦、甜菜和鹿糖洛。本公开内容提供了糖化方法,包括将包含生物量材料的组合物(例如包含木聚糖、半纤维素、纤维素和/或可发酵的糖的材料)与本公开内容的多肽、或与由本公开内容的核酸编码的多肽、或与本公开内容的任一种酶掺合物/组合物或制品接触。糖化的生物量(例如,通过本公开内容的酶加工的木质纤维素材料)可以通过例如微生物发酵和/或化学合成,制成多种生物产品。如本文中使用的,“微生物发酵”指在适宜地条件下培养和收获发酵微生物的方法。发酵微生物可以是任何适用于理想的生产生物产品的发酵方法的微生物。合适的发酵微生物包括但不限于丝状真菌、酵母和细菌。糖化生物量可以通过发酵和/或化学合成,制成例如燃料(例如,生物燃料,如生物こ醇、生物丁醇、生物甲醇、生物丙醇、生物柴油、航空煤油等)。糖化的生物量还可以通过发酵和/或化学合成,制成例如日用化学品(例如,抗坏血酸、异戊ニ烯、1,3_丙ニ醇)、脂类、氨基酸、蛋白质和酶。6. 3. 3 预处理在糖化前,为了使木聚糖、半纤维素、纤维素和/或木质素材料更加接近酶或对酶更敏感,优选将生物量(例如木质纤维素材料)进行ー个或多个预处理步骤,从而更易于被本公开内容的酶和/或酶掺合物/组合物水解。在示例性的实施方案中,预处理涉及使生物量材料在反应罐中经过包含强酸和金属盐的稀释溶液的催化剂处理。生物量材料可以是例如原材料或干燥的材料。该预处理可以降低纤维素水解的活化能或温度,最終允许更高的可发酵糖的产量。參见例如美国专利号 6,660,506 ;6,423,145。另ー个示例性的预处理方法涉及通过使生物量材料在含水基质中经过第一水解步骤,来水解生物量,所述第一水解步骤选择的温度和压カ主要实现解聚半纤维素而不显著解聚纤维素为葡萄糖。该步骤产生这样的浆料,所述浆料中的液体水相含有自半纤维素解聚获得的溶解单糖,以及含有纤维素和木质素的固相。然后,浆料在允许大部分纤维素解聚的条件下进行第二次水解,产生含有溶解的/可溶性纤维素解聚产物的液体水相。參见例如美国专利号5,536,325。进ー步的示例性方法涉及通过ー个或多个稀酸水解阶段加工生物量材料,使用约0. 4%至约2%的强酸;再用碱脱木质素化处理酸水解材料的未反应的固体木质纤维素组分。參见例如美国专利号6,409,841。另ー个示例性的预处理方法包括在预水解反应罐中预水解生物量(例如,木质纤维素材料);向固体的木质纤维素材料中添加酸性液体,产生混合物;加热混合物至反应温度;维持反应温度一段时间,所述时间足以将木质纤维素材料分馏为含有至少约20%的来自木质纤维素材料的木质素的可溶性部分,和含有纤维素的固体级分;在反应温度下或附近,将可溶性部分与固体级分分离,去除可溶性部分;回收可溶性部分。致使固体级分中的纤维素更易于被酶促消化。參见例如美国专利号5,705,369。其他预处理方法可涉及使用过氧化氢H202。參见Gould, 1984, Biotech, andBioengr. 26 :46_52。预处理还可以包括将生物量材料与理论配比量的氢氧化钠和极低浓度的氢氧化铵接触。參见。Teixeira 等人,1999, Appl. Biochem. andBiotech. 77-79 :19_34。预处理还可以包括在中等温度、压カ和pH下,将木质纤维素与pH约9至约14的化学品(例如碱,如碳酸钠或氢氧化钾)接触。參见PCT公开W02004/081185。在优选的预处理方法中使用例如氨。此类预处理方法包括使生物量材料在高固体的条件下接受低氨浓度处理。參见例如美国专利号20070031918和PCT公开WO 06110901。6. 3. 4示例件的酶掺合物本公开内容提供了包括本公开内容的一种或多种酶的酶掺合物/組合物。酶掺合物/组合物的ー种或多种酶可以通过重组宿主细胞或重组生物体生产。酶掺合物/组合物适宜地是非天然存在的组合物。本公开内容的酶掺合物/組合物可以适宜地包括具有¢-木糖苷酶活性的第一多肽,并进一歩包括1、2、3或4种具有0 -木糖苷酶活性的第二多肽、ー种或多种具有L-a-阿拉伯呋喃糖苷酶活性的多肽、ー种或多种具有木聚糖酶活性的多肽和ー种或多种具有纤维素酶活性的多肽。具有P -木糖苷酶活性的第一多肽是例如Fv3A、Pf43A、Fv43E、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A或Fv39A多肽。如果存在具有P -木糖苷酶活性的第ニ多肽,则其是例如不同于具有P -木糖苷酶活性的第一多肽,且适宜地是Fv3A、Pf43A、Fv43E、Fv43A、Fv43B、Pa51A、Gz43A、Fv43D、Fo43A、Fv39A 或里氏木霉 Bxll 多肽。如果存在具有L- a -阿拉伯呋喃糖苷酶活性的多肽的ー种或多种,则每种所述多肽是例如Af43A、Pf51A、Pa51A、Fv43B或Fv51A多肽。ー种或多种具有木聚糖酶活性的多肽中的每ー种是例如里氏木霉Xyn、里氏木霉Xyn2、AfuXyn2或AfuXyn5。如果存在ー种或多种具有纤维素酶活性的多肽,则每种所述多肽是例如内切葡聚糖酶,如里氏木霉EGl或EG2 ;纤维ニ糖水解酶,如里氏木霉CBHl或CBH2 ;或¢-葡糖苷酶,如里氏木霉BglI。本公开内容的另ー种酶掺合物/组合物可以适宜地包括具有L-a -阿拉伯呋喃糖苷酶活性的第一多肽,并进一歩包括1、2、3或4种具有L- a -阿拉伯呋喃糖苷酶活性的第ニ多肽、ー种或多种具有¢-木糖苷酶活性的多肽、ー种或多种具有木聚糖酶活性的多肽和/或ー种或多种具有纤维素酶活性的多肽。第一种L-a -阿拉伯呋喃糖苷酶是Af43A、Pf51A或Fv51A多肽。第二种L-a -阿拉伯呋喃糖苷酶不同于第ー种L- a -阿拉伯呋喃糖苷酶,且是例如4デ434、?デ5认、?&5认、?¥438或?¥5认多肽。ー种或多种P _木糖苷酶中的每ー种是例如 Fv3A、Pf43A、Fv43E、Fv43A、Fv43B、Pa51A、Fv43D、Gz43A、Fo43A、Fv39A 或里氏木霉Bxll多肽。在某些实施方案中,一种或多种木聚糖酶中的每ー种是里氏木霉Xyn3、里氏木霉Xyn2、AfuXyn2或AfuXyn5多肽。在某些实施方案中,ー种或多种纤维素酶中的每ー种分别是内切葡聚糖酶,如里氏木霉EGl或EG2多肽;纤维ニ糖水解酶,如里氏木霉CBHl或CBH2多肽;或¢-葡糖苷酶,如里氏木霉Bgll多肽。木聚糖酶木聚糖酶适宜地构成本公开内容的酶掺合物/组合物的酶的(即,木聚糖酶的百分比是相对于组合物中的所有蛋白质的重量的重量百分比)或相对重量基础(即,其中木聚糖酶的百分比是相对于木聚糖酶、¢-木糖苷酶、纤维素酶、L-a-阿拉伯呋喃糖苷酶和辅助蛋白的组合重量的重量百分比)的约0. 05wt%至约75wt%的酶。可以方便的计算本公开内容的酶掺合物/组合物中的任何ー对蛋白质相对于彼此的比例。考虑这样的掺合物/组合物,所述掺合物/组合物包含的酶的重量比例是可以从本文公开的重量百分比衍生的任何重量比例。木聚糖酶含量可以在这样的范围内,其中下限是酶掺合物/
组合物中的酶总重量的 0. 05wt% > Iwt % > 2wt % > 3wt % > 4wt % > 5wt % > 6wt % > 7wt % > 8wt % >9wt %、IOwt %、12wt %、15wt % >20wt % >25wt % >30wt % >40wt % >45wt % 或 50wt ,上限是酶掺合物/组合物中的酶总重量的IOwt %、15wt %、20wt %、25wt %、30wt %、35wt %、40wt 、50wt 、55wt 、60wt 、65wt 、70wt 或 75wt 。酶惨合物或组合物中的一种或多种木聚糖酶可以代表酶掺合物/组合物中的例如5wt %至20wt %、IOwt %至15wt %或15wt%至25wt%的总酶。包括在本公开内容的酶掺合物/组合物中的示例性的合适的木聚糖酶描述在下文的6. 3. 6节中。L-a -阿拉伯呋喃糖苷酶L_ a -阿拉伯呋喃糖苷酶适宜地构成给定的酶掺合物/组合物中所有酶总重量(即,其中L-a -阿拉伯呋喃糖苷酶的百分比是相对于掺合物/组合物中的所有蛋白质的重量的重量百分比)或相对重量基础(即,其中L-a -阿拉伯呋喃糖苷酶的百分比是相对于木聚糖酶、¢-木糖苷酶、纤维素酶、L-a-阿拉伯呋喃糖苷酶和辅助蛋白的组合重量的重量百分比)的约0. 05wt%至约75wt%的酶。基于本公开内容可以方便的计算任何ー对蛋白质相对于彼此的比例。考虑这样的掺合物/組合物,所述掺合物/组合物包含的酶的重量比例是可以从本文公开的重量百分比衍生的任何重量比例。L-a -阿拉伯呋喃糖苷酶含量可以在这样的范围内,其中下限是酶掺合物/组合物中的酶总重量的 0. 05wt %、Iwt % >2wt % >3wt % >4wt % >5wt % >6wt % >7wt % >8wt % >9wt %、IOwt %、12wt %、15wt % >20wt % >25wt % >30wt % >40wt % >45wt % 或 50wt %,上限是酶惨合物 / 组合物中的酶总重量的 IOwt %、15wt %、20wt % >25wt % >30wt % >35wt % >40wt %、50wt % >55wt % >60wt % >65wt % >70wt %或75wt %。例如,酶掺合物或组合物中的一种或多种L-a -阿拉伯呋喃糖苷酶可以适宜地代表掺合物/组合物中的例如2wt%至25wt%、5wt%至20wt%或5wt%至IOwt%的总酶。包括在本公开内容的酶掺合物/组合物中的示例性的合适的L-a -阿拉伯呋喃糖苷酶描述在下文的6. 3. 8节中。木糖苷酶木糖苷酶适宜地构成酶掺合物/组合物中酶总重量的约0. 05wt%至约75wt%。基于本公开内容可以方便计算任何ー对蛋白质相对于彼此的比例。考虑这样的掺合物/组合物,所述掺合物/组合物包含的酶的重量比例是可以从本文公开的重量百分比衍生的任何重量比例。¢-木糖苷酶含量可以在这样的范围内,其中下限是掺合物/组合物中的酶总重量的约0. 05wt % > Iwt % > 2wt % >3wt % >4wt % >5wt % >6wt % >7wt % >8wt % >9wt % > IOwt % > 12wt % > 15wt % >20wt % >25wt % >30wt % >40wt % >45wt %或50wt 上限是掺合物/组合物中的酶总重量的约IOwt %、15wt %、20wt %、25wt %、30wt*%、35wt*%、40wt*%、50wt*%、55wt*%、60wt*%、65wt*%、70wt*%或 75wt*%。例如,^ -木糖苷酶可以代表掺合物/组合物中的酶总重量的约0. 05wt %至约75wt %。此外,^ -木糖苷酶可以代表掺合物/组合物中的酶总重量的约0. 05wt%至约70wt%、约lwt%至约65wt%、约 Iwt % 至约 60wt *%、约 2wt % 至约 55wt *%、约 3wt % 至约 50wt *%、约 4wt % 至约 45wt %,或约5wt%至约40wt%。在仍然进一步的实例中,P -木糖苷酶适宜地代表掺合物/组合物中的酶总重量的2wt*%至30wt*% ;10wt*%至20wt*% ;或5wt*%至10wt*%。示例性的合适的^ -木糖苷酶描述在下文的6. 3. 7节中。纤维素酶纤维素酶适宜地构成酶掺合物/组合物中酶总重量的约0. 05wt%至约90wt%。基于本公开内容可以方便地计算任何ー对蛋白质相对于彼此的比例。考虑这样的掺合物/组合物,所述掺合物/组合物包含的酶的重量比例是可以从本文公开的重量
百分比衍生的任何重量比例。纤维素酶含量可以在这样的范围内,其中下限是掺合物/组合物中的酶总重量的约 0. 05wt% >5wt% > 10wt% >20wt% >30wt% >40wt% >50wt% >60wt% >70wt %,上限是掺合物/组合物中的酶总重量的约20wt % >30wt % >40wt % >50wt %、60wt%,70wt%,80wt%或90wt%。例如,纤维素酶适宜地代表掺合物/组合物中的酶总重量的30wt*%至80wt*% ;50wt*%至70wt*% ;或40wt*%至60wt*%。示例性的合适的纤维素酶描述在下文的6. 3. 5节中。根据calcofluor测定所确定的,本公开内容的酶掺合物/组合物中的纤维素酶组分适宜地能够达到至少约0. 005级分产物/mg蛋白质/克磷酸溶胀的纤维素(PASC)。例如,本公开内容的掺合物/组合物中的纤维素酶组分能够达到这样的每毫克蛋白质每克PASC的级分产物范围,其中范围的下限是约0. 005,0. 01,0. 015,0. 02、0. 03,0. 04,0. 05,0. 06,0. 075 或 0. 1,而其中范围的上限是 0. 03,0. 04,0. 05,0. 06,0. 075、0. U0. 2,0. 3,0. 4,0. 5,0. 6或0. 7。根据calcofluor测定所确定的,本公开内容的掺合物/组合物中的纤维素酶组分可以达到例如0. 00005-0. 0001,0. 0005-0. 001,0. 001-0. 005、0. 005-0. 03,0. 01-0. 06,0. 02-0. 04,0. 01-0. 03,0. 02-0. 05,0. 02-0. 04,0. 01-0. 05、0. 015-0. 035或0. 015-0. 075产物级分每毫克蛋白质每克PASC。纤维素酶可以是例如全纤维素酶。纤维素酶还可以例如适宜地富含¢-葡糖苷酶。辅助蛋白酶掺合物/组合物可以进ー步适宜地包括一种或多种辅助蛋白。酶掺合物/组合物的辅助蛋白含量的范围可以从酶掺合物/组合物中的蛋白质总重量的约Owt%至约60wt%。基于本公开内容可以方便地计算任何ー对蛋白质相对于彼此的比例。考虑这样的掺合物/组合物,所述掺合物/组合物包含的酶的重量比例是可以从本文公开的重量百分比衍生的任何重量比例。辅助蛋白的含量可以在这样的范围内,其中下限是酶掺合物/组合物中的蛋白质总重量的Owt%、Iwt%、%、7wt% >8wt% > IOwt % > 12wt% > 15wt*%、20wt*%、25wt*%或 35wt*%,上限是酶惨合物 / 组合物中的蛋白质总重量的约 2wt % >3wt % >4wt % >5wt % >6wt % >7wt % >8wt % >9wt %、IOwt %、llwt% > 12wt% > 13wt% > 14wt% > 15wt*%、20wt*%、30wt*%、40wt*%、50wt*%或 60wt*%。例如,辅助蛋白可以适宜地代表酶掺合物/组合物中的Owt%至2wt%、5wt%至IOwt%,20wt%至50wt%或2wt%至5wt%。包括在本公开内容的酶掺合物/组合物中的示例性的合适的辅助蛋白描述在下文的6. 3. 9节中。本公开内容提供了用于木质纤维素糖化的第一种酶掺合物/组合物,包括(I)约 30wt 至约 80wt % (例如,30wt % 至 80wt % >35wt % 至 75wt % >40wt %至70wt %、40wt %至60wt %、50wt %至70wt*%等)的纤维素酶,例如,全纤维素酶或富含^-葡糖苷酶的全纤维素酶;(2)约 3wt 至约 50wt % (例如,5wt % 至 40wt %、IOwt % 至 30wt % >5wt % 至20wt% > IOwt%至15wt*%、15wt*%至25wt*%等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者两种或多种上述酶的混合物;(3)约 2wt 至约 40wt % (例如,2wt % 至 35wt % >5wt % 至 30wt %、IOwt % 至25wt 、2wt 至 30wt *%、IOwt 至 20wt 、5wt 至 IOwt 等)的 P -木糖苷酶,例如,
Fv3A、Pf43A、Fv43D、Fv39A、Fv43E、Fv43A、Fv43B、Pa51A、Fo43A、Gz43A、里氏木霉 Bxll,或者两种或多种上述酶的混合物;(4)约 2wt 至约 40wt % (例如,2wt % 至 35wt % >5wt % 至 30wt %、IOwt % 至25wt*%、2wt*% 至 25wt*%、5wt*% 至 20wt *%、5wt 至 IOwt 等)的 L- a -阿拉伯呋喃糖苷酶,例如,Af43A、Fv43B、Pa51A、Pf51A、Fv51A,或者两种或多种上述酶的混合物;和(5)约 Owt 至约 50wt % (2wt % 至 40wt %、5wt % 至 30wt %、IOwt % 至 25wt %、Owt至 2wt*%、5wt*%至 10wt*%、20wt*%至 50wt*%、2wt至 5wt*%等)的辅助蛋白。本公开内容提供了用于木质纤维素糖化的第二种酶掺合物/组合物,包括(I)约 30wt 至约 80wt (例如,30wt 至 80wt 、35wt 至 75wt 、40wt至70wt %、40wt %至60wt %、50wt %至70wt*%等)的纤维素酶,例如,全纤维素酶或富含
3-葡糖苷酶的全纤维素酶,或约2wt %至约IOwt % (例如,2wt %至8wt %、4wt %至6wt %、2wt*%至4wt*%、6wt*%至8wt*%、8wt*%至 10wt*%、2wt*%至 10wt*%等)的 P -葡糖苷酶,例如,里氏木霉Bgll ;(2)约 3wt % 至约 50wt % (例如,5wt % 至 40wt %、IOwt % 至 30wt %、5wt % 至20wt% > IOwt%至15wt*%、15wt*%至25wt*%等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者两种或多种上述酶的混合物;(3)约 2wt 至约 40wt % (例如,2wt % 至 35wt % >5wt % 至 30wt %、IOwt % 至25wt*%、2wt*% 至 30wt*%、10wt*% 至 20wt*%、5wt*% 至 10wt*% 等)的至少两种 P -木糖苷酶,其中至少ー种¢-木糖苷酶选自组I和至少ー种¢-木糖苷酶选自组2;其中组I :Fv3A、Fv43A,或其混合物;组2 :Fv43D、Pa51A、Gz43A、里氏木霉 Bxl I、Pf 43A、Fv43E、Fv39A、Fo43A、Fv43B,或者两种或多种上述酶的混合物;(4)约 2wt%至约 25wt% (例如,2wt%至 25wt%、5wt%至 20wt%、5wt%至 IOwt%等)的L- a -阿拉伯呋喃糖苷酶,例如,Af43A、Fv43B、Pa51A、Pf51A、Fv51A,或者两种或多种上述酶的混合物;和(5)约 Owt 至约 50wt % (2wt % 至 40wt %、5wt % 至 30wt %、IOwt % 至 25wt %、Owt至 2wt、5wt至 IOwt、20wt至 50wt 、2wt至 5wt等)的辅助蛋白。本公开内容提供了用于木质纤维素糖化的第三种酶掺合物/组合物,包括
(I)约 3wt 至约 50wt % (例如,5wt % 至 40wt %、IOwt % 至 30wt % >5wt % 至20wt% > IOwt%至15wt*%、15wt*%至25wt*%等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者两种或多种上述酶的混合物;和(2)约 2wt至 40wt(例如,2wt至 35wt、5wt至 30wt*%、IOwt至 25wt*%、2wt*%至30wt*%、10wt*%至20wt*%、5wt*%至10wt*%等)的至少两种P -木糖苷酶,其中至少ー种P-木糖苷酶选自组I和至少ー种P-木糖苷酶选自组2 ;其中组I :Fv3A、Fv43A,或其混合物;组2 :Fv43D、Pa51A、Gz43A、里氏木霉 Bxl I、Pf 43A、Fv43E、Fv39A、Fo43A、Fv43B,或者两种或多种上述酶的混合物。本公开内容提供了用于木质纤维素糖化的第四种酶掺合物/组合物,包括(I)约 5wt*%至约 25wt*% (例如,2wt至 25wt、5wt至 20wt、5wt至 IOwt等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者两种或多种上述酶的混合物;(2)约 2wt 至约 30wt % (例如,2wt % 至 30wt %、IOwt % 至 20wt % >5wt % 至IOwt %等)的木糖苷酶,例如,Fv3A、a Pf43A、Fv43D、Fv39A、Fv43E、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、里氏木霉Bxl I,或者两种或多种上述酶的混合物;和(3)约 2wt 至约 50wt % (例如,2wt % 至 5wt % >5wt % 至 45wt %、IOwt % 至40wt*%、15wt*%至 30wt*%、10wt*%至25wt*%、5wt*%至20wt*%、15wt*%至40wt*%等)的 ¢-葡糖苷酶,例如,里氏木霉BglI。本公开内容提供了用于木质纤维素糖化的第五种酶掺合物/组合物,包括(I)约 5wt 至约 25wt (例如,2wt 至 25wt 、5wt 至 20wt 、5wt 至 IOwt等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者两种或多种上述酶的混合物;和 (2)约 2wt 至约 30wt % (例如,2wt % 至 30wt %、IOwt % 至 20wt %、5wt % 至10wt%—)的 P -木糖苷酶,例如,Fv3A、Pf43A、Fv43D、Fv39A、Fv43E、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、里氏木霉Bxl I,或者两种或多种上述酶的混合物。本公开内容提供了用于木质纤维素糖化的第六种酶掺合物/组合物,包括(I)约 2wt 至约 50wt % (例如,2wt % 至 5wt % >5wt % 至 45wt %、IOwt % 至40wt*%、15wt*%至 30wt*%、10wt*%至25wt*%、5wt*%至20wt*%、15wt*%至40wt*%等)的 ¢-葡糖苷酶,例如Bgll ;(2)约 3wt 至约 50wt % (例如,5wt % 至 40wt %、IOwt % 至 30wt % >5wt % 至20wt% > IOwt%至15wt*%、15wt*%至25wt*%等)的木聚糖酶,例如,里氏木霉Xyn2、里氏木霉Xyn3、AfuXyn2、AfuXyn5,或者两种或多种上述酶的混合物;(3)约 2wt至 40wt(例如,2wt至 35wt、5wt至 30wt*%、IOwt至 25wt*%、2wt*%至 30wt*%、10wt*%至 20wt*%、5wt*%至 10wt*%等)的 P -木糖苷酶,例如,Fv3A、Pf43A、Fv43D、Fv39A、Fv43E、Fv43A、Fv43B、Pa51A、Gz43A、Fo43A、里氏木霉 Bxl I,或者两种或多种上述酶的混合物;和(4)约 2wt*%至约 25wt*% (例如,2wt至 25wt、5wt至 20wt、5wt至 IOwt等)的L- a -阿拉伯呋喃糖苷酶,例如,Af43A、Fv43B、Pa51A、Pf51A、Fv51A,或者两种或多种上述酶的混合物。上述用于木质纤维素糖化的第六种酶掺合物/组合物可以包括例如约2wt%至约40wt%的至少两种P -木糖苷酶,其中至少ー种P -木糖苷酶选自组I和至少ー种¢-木糖苷酶选自组2 ;其中组I :Fv3A、Fv43A,或其混合物;组2 :Fv43D、Pa51A、Gz43A、里氏木霉 Bxl I、Pf 43A、Fv43E、Fv39A、Fo43A、Fv43B,或者两种或多种上述酶的混合物。当本公开内容的酶掺合物/組合物同时含有组I和组2的P -木糖苷酶时,组I与组2的¢-木糖苷酶的比例优先是I : 10至10 I。例如,比例适宜地是I : 2至2 : I、2 5 至 5 2、3 8 至 8 3、1 4 至 4 1、1 5 至 5 1、1 7 至 7 1,或任何在任何ー对上述终点之间的范围(例如,I : 10至2 : 1、4 : I至2 : 5、3 : 8至5 : 1,
等)。合适比例的特定实例是约I : I。当本公开内容的酶掺合物/组合物含有Fv43A作为P -木糖苷酶吋,掺合物/组合物可以进ー步含有Fv43B作为L-a -阿拉伯呋喃糖苷酶。本公开内容的酶掺合物/组合物适宜地是例如含有除酶掺合物/组合物的组分以外还含有生物量的糖化反应混合物的一部分。例如,糖化反应混合物的特征是可具有1、2、3或所有4个下列特征(i)在所述糖化反应混合物中的每千克半纤维素酶的木聚糖酶总重量是在这样的范围内,所述范围的下限是约0. 5g、lg、2g、3g、4g、5g、7g或IOg,上限独立的是约5g、7g、10g、15g、20g、30g_40g ;例如,反应混合物中的每千克半纤维素酶的木聚糖酶总重量可以是 0. 5g 至 40g、0. 5g 至 30g、0. 5g 至 20g、0. 5 至 10g、0. 5 至 5g、lg 至 40g、2g 至 40g、3g 至40g、5g 至 40g、7g 至 30g、IOg 至 30g、5g 至 20g 或 5g 至 30g。(ii)在所述糖化反应混合物中的每千克半纤维素酶的¢-木糖苷酶总重量是在这样的范围内,所述范围的下限是约0. 5g、lg、2g、3g、4g、5g、7g或IOg,上限独立的是约5g、7g、10g、15g、20g、30g、40g或50g ;例如,反应混合物中的每千克半纤维素酶的P _木糖苷酶总重量可以是 0. 5g 至 40g、0. 5 至 50g、0. 5g 至 30g、0. 5g 至 20g、0. 5g 至 10g、0. 5g 至 5g、Ig至 40g、2g 至 40g、3g 至 40g、5g 至 40g、7g 至 30g、IOg 至 30g、5g 至 30g、5g 至 20g。(iii)在所述糖化反应混合物中的每千克半纤维素酶的L-a -阿拉伯呋喃糖苷酶总重量是在这样的范围内,所述范围的下限是约0. 2g、0. 5g、lg、l. 5g、2g、2. 5g、3g、4g或5g,上限独立的是约2g、3g、4g、5g、7g、10g、15g或20g ;例如,反应混合物中的每千克半纤维素酶的L-a -阿拉伯呋喃糖苷酶总重量可以是0. 2g至20g、0. 5g至20g、lg至20g、2g至20g、2. 5g 至 20g、3g 至 15g、4g 至 20g、5g 至 15g、5g 至 10g、5g 至 20g 或 2. 5g 至 15g。(iv)在所述糖化反应混合物中的每千克纤维素酶的纤维素酶总重量是在这样的范围内,所述范围的下限是约lg、3g、5g、7g、10g、12g、15g、18g或20g,上限独立的是约10g、15g、18g、20g、25g、30g、50g、75g或IOOg ;例如,反应混合物中的每千克纤维素酶的纤维素酶总重量可以是 Ig 至 100g、3g 至 100g、5g 至 100g、7g 至 100g、12g 至 100g、15g 至 100g、18g 至 100g、3g 至 75g、5g 至 50g、7g 至 75g、IOg 至 75g、IOg 至 50g、12g 至 75g、12g 至 50g、15g 至 75g、15g 至 50g、18g 至 30g、18g 至 75g。
6. 3. 5纤維素酶本公开内容的酶掺合物/组合物可以包括一种或多种纤维素酶。纤维素酶是水解纤维素(0-1,4-葡聚糖或PD-糖苷连接)导致形成葡萄糖、纤维ニ糖、纤维寡糖等的酶。纤维素酶传统上被分为三大类内切葡聚糖酶(EC 3.2. 1.4) ( “EG”)、外切葡聚糖酶或纤维ニ糖水解酶(EC 3. 2. I. 91) ( “CBH”),和P -葡糖苷酶W -D-葡糖苷葡糖水解酶;EC 3. 2. I. 21) ( “BG”)(Knowles 等人,1987,Trends in Biotechnology 5(9) :255-261 ;Shulein,1988,Methods in Enzymology, 160 :234-242) □内切葡聚糖酶主要作用于纤维素纤维的无定型部分,而纤维ニ糖水解酶还能够降解結晶纤维素。根据本公开内容的方法和组合物使用的纤维素酶尤其可获得自,或重组的生产自ー种或多种下列生物Crinipellis scapella,菜豆壳球抱菌(Macrophominaphaseolina),嗜热毁丝菌(Myceliophthorathermophila),类生类壳菌(Sordariafimicola),Volutella colletotrichoides,太瑞斯梭抱壳霉(Thielavia terrestris),支顶孢属物种,黑耳(Exidiaglandulosa),木蹄层孔菌(Fomes fomentarius),绵皮
孔菌属物种(Spongipellis sp.),红根囊壶菌(Rhizophlyctis rosea)、微小根毛霉(Rhizomucor pusillus)、闪光须霉(Phycomyces niteus),弗雷生剌枝霉(Chaetostylumiresenn) , Diplodia gossypm a, Uiospora biigramii, Saccobolus dilutellus,优抱青 ft (Penicillium verruculosum)、广黄青霉(Penicillium chrysogenum)、优状顶抱霉(Thermomyces verrucosus), Diaporthe syngenesia,黄瓜炭徂抦(Colletotrichum Iagenarium),黑抱属物种(Nigrospora sp.),鹿角炭角菌(Xylariahypoxylon), Nectria pinea,^ordaria macrospora,Th lelavia thermoph I la,卷顶毛壳菌(Chaetomiummororum),变绿毛壳(Chaetomium virscens),巴西毛壳(しhaetomiumbrasiliensisノ, Cnaetomium cunicolorum, ^yspastospora boninensis,Cladorrhinum foecundissimum,Scytalidium thermophila,海洋真菌链T包粘借M (Gliociadium catenulatum), Fusarium oxysporum ssp.lycopersici, Fusariumoxysporum ssp. passiflora,腐皮,廉刀菌(Fusarium solani),fe 形 廉抱(Fusariumanguioides),早熟禾f廉刀菌(Fusarium poae),黑腐质霉(Humicola nigrescens)、灰腐质霉(Humicola grisea)、花糟伞(Panaeolusretirugis),血红色陀螺孔菌(Trametessanguine),裂糟菌(Schizophyllumcommune),粉红单端抱霉(Trichothecium roseum),Microsphaeropsis sp.,Acsobolus stictoideus spej.,点ずし座冗(Poronia punctata),Nodulisporumsp.,木霉属物种(例如,里氏木霉)和柱孢属(Cylindrocarpon)物种。例如,用于本公开内容的方法和/或组合物的纤维素酶是全纤维素酶和/或通过下文7. I. 10节所述的calcofluor测定所确定的,能够实现至少0. I (例如,0. I至0. 4)级分产物的。 6.3.5. I 葡糖苷酶本公开内容的酶掺合物/組合物可任选的包括ー种或多种¢-葡糖苷酶。术语“3-葡糖苷酶”在本文中指分类为EC 3.2. I. 21的P-D-葡糖苷葡糖水解酶,和/或某些GH家族的成员,包括但不限于GH家族1、3、9或48的成员,其催化纤维ニ糖水解释放P-D-葡萄糖。适宜地3 -葡糖苷酶可通过重组手段获得自多种微生物,或从商业来源购买。来自微生物的¢-葡糖苷酶的实例包括但不限于来自细菌和真菌的。例如,本公开内容的^-葡糖苷酶适宜地获得自丝状真菌。P -葡糖苷酶尤其可获得自,或重组的生产自棘孢曲霉(Aspergillusaculeatus)(Kawaguchi 等人,Gene 1996,173 :287_288)、泡盛曲霉(Aspergillus kawachi) (Iwashita等人,Appl. Environ. Microbiol. 1999,65 :5546-5553)、米曲霉(TO 2002/095014)、双氮纤维单胞菌(Cellulomonas biazotea) (Wong 等人,Gene, 1998, 207 :79_86)、绳状青霉(W02004/078919)、扣囊复膜抱酵母(Saccharomycopsisfibuligera) (Machida 等人,Appl.Environ. Microbiol. 1988,54 :3147-3155)、粟酒裂殖酵母(Wood 等人,Nature 2002,415 871-880),或里氏木霉(例如,^ -葡糖苷酶I (美国专利号6,022,725)、^ -葡糖苷酶3 (美国专利号6,982,159)、^ -葡糖苷酶4 (美国专利号7,045,332)、^ -葡糖苷酶5 (美国专利号7,005,289)、¢-葡糖苷酶6 (美国
发明者B·R·凯莱门, B·鲍尔, C·米奇森, E·A·拉雷纳斯, K·D·温, M·Y·席, M·恩普蒂奇, S·E·兰茨, S·基姆, T·卡佩尔, W·D·希茨 申请人:丹尼斯科美国公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1