能产生用于降解木质纤维素材料的酶的宿主细胞的制作方法

文档序号:406641阅读:443来源:国知局
专利名称:能产生用于降解木质纤维素材料的酶的宿主细胞的制作方法
技术领域
本发明涉及能生产从纤维素酶、半纤维素酶和果胶酶的组中选择的至少四种不同的酶的宿主细胞,制备所述宿主细胞的方法,通过所述宿主细胞产生的酶组合物,使用所述宿主细胞产生酶组合物的方法,使用酶组合物对木质纤维素材料糖化的方法和使用酶组合物制备发酵产物的方法。
_4]
背景技术
碳水化合物组成地球上最丰量的有机化合物。然而,许多这类碳水化合物隐蔽在 复杂聚合物中,包括淀粉(种子和谷物中的主要储存碳水化合物)和已知为木质纤维素的碳水化合物与木质素的集合。木质纤维素的主要碳水化合物组分是纤维素、半纤维素和果胶。这些复杂的聚合物通常被统称为木质纤维素。从由于OPEC减少石油输出而导致石油危机爆发的70年代开始,可再生的木质纤维素生物质成为可发酵的糖的生物转化吸引了研究人员强烈的注意力,所述可发酵的糖随后被发酵产生醇(例如乙醇),作为液体燃料的替代品。在过去二十年间,乙醇已被广泛使用,在美国作为与汽油的10%的掺合物,或在巴西作为车辆的纯燃料。更最近实现了E85(85%乙醇掺合物)的使用,特别是用于清洁城市应用。燃料生物乙醇的重要性将会随着油价的提高及其来源的逐渐耗尽而提高。另外,可发酵的糖被用于生产塑料、聚合物和其他基于生物的制品,并且预期这一工业将大幅增长,从而提高了对丰量的低成本可发酵糖的需求,所述可发酵糖可以被用作原料来代替基于石油的原料。大量碳水化合物在植物生物质中的隐蔽提供了糖(五碳糖以及六碳糖)形式的大量潜在的能量来源,所述糖能够被用于大量工业和农业过程。然而,这些碳水化合物的大量能源潜力目前利用不足,因为糖封闭在复杂聚合物中并因此不容易进行发酵。由植物生物质生产糖的方法会提供大量的、经济上有竞争性的原料,用于发酵成化学品、塑料、燃料。与纤维素原料的种类无关,酶的成本和水解效率是限制生物质的生物转化方法商业化的主要因素。微生物生产的酶的生产成本与产酶菌株的生产力密切相关。菌株的“生产力”表示每个时间在发酵液中产生的总蛋白或酶活性的量,例如kg蛋白/(m3发酵液 年)或酶单位/(m3发酵液 年)。“酶单位”是在某些确定的条件下确定量的蛋白转化确定底物的能力。

发明内容
为了产生用于微生物中生物质转化的酶,通常需要独立的“纤维素酶诱导物”的存在。由于下述原因,纤维素酶诱导物不是有优势的。第一,诱导物例如植物材料可具有可变组分,这对从编码纤维素酶、半纤维素酶和果胶酶的多核苷酸组中选择的异源多核苷酸的表达的可控性不是有优势的。第二,在诱导物可用于诱导从纤维素酶、半纤维素酶和果胶酶的组中选择的至少四种不同的酶产生之前,需要能量来灭菌用于诱导的植物材料。第三,植物材料会严重污染发酵设备。第四,诱导物可导致纤维素酶生产培养基的粘性较高,在所述培养基中宿主细胞表达从编码纤维素酶、半纤维素酶和果胶酶的多核苷酸组中选择的至少四种不同的多核苷酸。第五,存在诱导物时,特别是当其已被预处理时,可导致对宿主细胞有害的抑制剂产生。“纤维素酶诱导物”在本文中被定义为诱导宿主细胞中纤维素酶产生的化合物。纤维素酶诱导物的例子包括纯的纤维素、纤维二糖、槐糖和龙胆二糖或任何木质纤维素材料。因而,提供用于从植物生物质中生产糖的简单的经济上吸引人的酶方法是高度期望的。该目标通过提供下述宿主细胞而被实现,所述宿主细胞包含从编码纤维素酶、半纤维素酶和果胶酶的多核苷酸组中选择的至少四种不同的异源多核苷酸,其中宿主细胞能 产生从纤维素酶、半纤维素酶和果胶酶组中选择的至少四种不同的酶,其中所述宿主细胞是丝状真菌并能分泌所述至少四种不同的酶。由于用于降解木质纤维素材料的所有必要的酶在一种并且在同一种宿主细胞产生并分泌,即用型酶组合物可仅在一种发酵中产生。通过本发明的宿主细胞产生的酶组合物可适用在木质纤维素材料的糖化方法中。此外,本发明的宿主细胞可不需要纤维素酶诱导物来产生从纤维素酶、半纤维素酶和果胶酶的组中选择的至少四种不同的酶。在木质纤维素材料的糖化方法中使用本发明的宿主细胞的可能的优势在于,不必要以期望的比率掺杂/混合用于降解木质纤维素材料需要的多种酶。此外,在降解木质纤维素材料的方法中使用酶之前,没有必要存储单独的酶。此外,根据本发明的优选的实施方式通过选择宿主细胞和宿主细胞的遗传修饰,可实现酶的高生产力。此外,发酵液(包含从纤维素酶、半纤维素酶和果胶酶的组中选择的至少四种不同的酶)可在降解木质纤维素材料的方法中直接使用而不经任何纯化。因此,本发明提供了非常简单和经济有效的方法。


图I :在 T. emersonii 中表达 T. emersonii 纤维二糖水解酶 I (CBH I)的PGBT0PEBA205的图谱。描绘了从葡糖淀粉酶启动子(PglaA)表达的EBA205。此外,描绘了表达盒的葡糖淀粉酶侧翼(3’glaA)。对于编码T. emersonii EG的DNA-序列的pGBT0PEBA8和包含编码T. emersonii BG的DNA-序列的pGBT0PEBA4,pGBT0PEBA205是有代表性的。图2 :在 T. Emersonii 中表达 T. emersonii 纤维二糖水解酶 II (CBHII)的PGBFINEBA176的图谱。pGBFINEBA176是基于pGBFINll的质粒。描绘了从葡糖淀粉酶启动子(PglaA)表达的EBA176。此外,描绘了从AspergiIIus nidulans甘油醒3-磷酸脱氢酶启动子(Pgpd)表达的选择性标记物(amdS)和表达盒的葡糖淀粉酶侧翼(3’glaA和3”glaA)。图3 :在A. niger中的多种重组T. emersonii纤维素酶的检测(3A).在A. niger中表达的T. emersonii纤维素酶的SDS-PAGE检测。用PGBT0PEBA4、pGBT0PEBA8、pGBFINEBA176 和 pGBT0PEBA205 的混合物转化 A. niger。转化体在包含含麦芽糖的培养基的摇瓶中生长并通过SDS-PAGE分析法来分析从96小时培养物中收获的上清液中的蛋白。(3B)表示转化体中WSU活性的图。转化体在含麦芽糖的培养基中生长96小时并在培养物的上清液中测定WSU活性。图4.在T. emersonii中的多种重组T. emersonii纤维素酶的检测。(4A).在 T. emersonii 中表达的 T. emersonii 纤维素酶的 SDS-PAGE 检测。用PGBT0PEBA4、pGBT0PEBA8、pGBFINEBA176 和 pGBT0PEBA205 的混合物转化 T. emersonii。近400个转化体在96-孔平板中生长并通过E-PAGE凝胶分析法针对至少一种纤维素酶的表达进行筛选。感兴趣的转化体在含基于葡萄糖的培养基的摇瓶中生长并且从72小时培养物中收获的上清液中的蛋白被TCA-沉淀并通过SDS-PAGE分析法进行分析。FBG142是空菌株。
(4B).显示了转化体中的WSU活性的图。转化体在基于葡萄糖的培养基中生长72小时并在培养物的16-倍稀释的上清液中测定WSU活性。FBG142是空菌株。序列表简单描沭SEQ ID NO 1展示了来自Talaromyces emersonii的纤维二糖水解酶I的氨基酸序列。SEQ ID NO :2 :展不了来自 Talaromyces emersonii 的编码SEQ ID NO. I 的氨基酸序列的多核苷酸。SEQ ID NO :3 展示了来自 Talaromyces emersonii 的 P _ 葡聚糖酶 CEA 的氨基酸序列。SEQ ID NO :4 展不了来自 Talaromyces emersonii 的编码 SEQ ID NO. 3 的氨基酸序列的多核苷酸。SEQ ID NO :5展示了来自Talaromyces emersonii的P _葡萄糖苷酶的氨基酸序列。SEQ ID NO 6 展不了来自 Talaromyces emersonii 的编码 SEQ ID NO. 5 的氨基酸序列的多核苷酸。SEQ ID NO 7展示了来自Talaromyces emersonii的纤维二糖水解酶II的氨基酸序列。SEQ ID NO 8 展不了来自 Talaromyces emersonii 的编码 SEQ ID NO. 7 的氨基酸序列的多核苷酸。SEQ ID NO 9展示了来自T. emersonii的大小209个aa的未知蛋白的氨基酸序列。SEQ ID NO 10展示了来自T. emersonii的具有根据SEQ ID NO 9的氨基酸序列的未知蛋白的编码序列。SEQ ID NO 11展示了 T. emersonii膨胀因子的氨基酸序列。SEQ ID NO 12展示了 T. emersonii膨胀因子的编码序列。SEQ ID N0:13展示了 T. emersonii乙酰基木聚糖酯酶的氨基酸序列。SEQ ID N0:14展示了 T. emersonii乙酰基木聚糖酯酶的编码序列。
SEQ ID NO :15展示了 T. emersonii木聚糖酶的氨基酸序列。SEQ ID N0:16展示了 T. emersonii木聚糖酶的编码序列。本文中使用的表述“异源多核苷酸”表示不在未经转化的宿主细胞中存在的多核苷酸,而“同源多核苷酸”表示在未经转化的宿主细胞中存在的多核苷酸。本文中合成的多核苷酸被认为是异源多核苷酸,而不受它们可能存在于未经转化的宿主细胞中的影响。本文中使用的“转化体”表示已经是转化的客体的细胞。“转化体”、“宿主细胞”和“重组细胞”在本文中用作同义词。“转化”在本文中表示通过重组技术使细胞遗传改变。通过人为干预,这可导致遗传材料(DNA、RNA或蛋白)在细胞中吸收、插入和表达或遗传材料在细胞中突变或缺失。宿丰细朐
根据本发明的宿主细胞可从任何细胞中制备。针对在根据本发明的宿主细胞中产生的化合物的具体用途,可根据此类用途做出对将被转化的细胞的选择。其中例如在根据本发明的宿主细胞中产生的化合物被被用在食品应用中,宿主细胞可从食品级生物体比如Saccharomyces cerevisiae中选择。具体用途包括但不限于,食品、(动物)饲料、制药、农业比如作物保护和/或个人护理应用。根据一种实施方式,根据本发明的宿主细胞是真核宿主细胞。优选地,真核细胞是哺乳动物、昆虫、植物、真菌或海藻细胞。优选的哺乳动物细胞包括例如中国仓鼠卵巢(CHO)细胞、COS细胞、293细胞、PerC6 细胞和和杂交瘤。优选的昆虫细胞包括例如Sf9和Sf21细胞及其衍生物。更优选地,真核细胞是真菌细胞,即酵母细胞,比如Candida、Hansenula、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces 或 Yarrowia 菌株,更优选地来自 Kluyveromyces lactis、S. cerevisiae、Hansenula polymorpha、Yarrowialipolytica和Pich ia pastoris或丝状真菌细胞。最优选地,真核细胞是丝状真菌细胞。“丝状真菌”包括亚门Eumycota和Oomycota的所有丝状形式(如Hawksworthet al. , In, Ainsworth and Bisby; s Dictionary of The Fungi,8th edition,1995,CAB International, University Press, Cambridge, UK 确定的)。丝状真菌特征在于,由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其他复合多糖组成菌丝体壁。营养生长通过菌丝衍生且碳代谢是专性需氧的。丝状真菌菌株包括但不限于Acremonium、Agaricus、Aspergillus、Aureobasidium、Chrysosporium、Coprinus、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、MyceIiophthora、NeocalIimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Panerochaete、Pleurotus、Schizophyllum、Talaromyces、Thermoascus> Thielavia、Tolypocladium 和 Trichoderma 的菌株。丝状真菌的若干菌株在许多培养物收集处中对公众而言是容易得到的,所述培养物收集处比如美国典型培养物收集处(ATCC)、Deutsche德国微生物菌种保藏中心(DSM)、荷兰生物科技研究所培养物保藏中心(CBS)和美国农业研究中心培养物收集处、北方地区研究中心(NRRL)。此类菌株的例子包括 Aspergillus niger CBS 513. 88、Aspergillusoryzae ATCC 20423、IFO 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892、P. chrysogenum CBS 455. 95、Penicillium citrinum ATCC 38065、Penicilliumchrysogenum P2、Talaromyces emersonii CBS 393. 64、Acremonium chrysogenum ATCC36225 或 ATCC 48272、Trichoderma reesei ATCC 26921 或 ATCC 56765 或 ATCC 26921、Aspergillus sojae ATCCl 1906> Chrysosporium lucknowense ATCC44006 及其衍生物。优选的丝状真菌细胞属于Aspergillus、Chrysosporium、Penicillium、Talaromyces 或 Trichoderma genus,最优选地属于 Aspergillus niger、Aspergillusawamori、AspergiIIus foetidus、Aspergillus sojae、Aspergillus fumigatus、Talaromyces emersonii>AspergiIIus oryzae>Chrysosporium lucknowense>Trichodermareesei 或 Penicillium chrysogenum。最优选地,将被转化以形成宿主细胞的细胞是Aspergillus。多种酶(至少四种不同的纤维素酶、半纤维素酶和/或果胶酶)在Aspergillus中表达的优势是可在糖上的高酶产率。当将被转化形成根据本发明的宿主细胞的细胞是Aspergi I Ius菌株时, Aspergillus菌株优选地是CBS 513. 88或其衍生物,更优选地宿主细胞是Aspergillusniger CBS 513.88。根据另一实施方式,将被转化形成根据本发明的宿主细胞的细胞是原核细胞。优选地,原核宿主细胞是细菌细胞。术语“细菌细胞”包括革兰氏阴性和革兰氏阳性微生物二者。合适的细菌可从 Escherichia、Anabaena、Caulobactert、Gluconobacter>Rhodobacter> Pseudomonas> Paracoccus、Bacillus、Brevibacterium、Corynebacterium、Rhizobium(Sinorhizobium)、 Flavobacterium、 Klebsiella、 Enterobacter、Lactobacillus、Lactococcus、Methylobacterium、Staphylococcus 和 Streptomyces 的组中选择。优选地,细菌细胞选自由 B. subtilis、B. amyloliquefaciens、B. IicheniformiS、B.puntis、B.megaterium、B.halodurans、B. pum ilus、G.oxydans> Caulobactertcrescentus CB 15、Methylobacterium extorquens、Rhodobacter sphaeroides、Pseudomonas zeaxanthinifaciens、Paracoccus denitrificans> E. coli、C. glutamicum、Staphylococcus carnosus、 Streptomyces lividans、 Sinorhizobium melioti 和Rhizobium radiobacter 组成的组。酶在本发明中,从纤维素酶、半纤维素酶和果胶酶的组中,优选地从纤维素酶和半纤维素酶的组中,更优选地从纤维素酶的组中选择选择至少四种不同的酶。纤维素酶是水解纤维素(¢-1,4-葡聚糖或P D-葡糖苷键)导致葡萄糖、纤维二糖、纤维寡糖等等形成的酶。纤维素酶在传统上已被分为三个主要种类内切葡聚糖酶(EC 3.2.1. 4)("EG")、外切葡聚糖酶或纤维二糖水解酶(EC 3.2. 1.91) (" CBH")和P -葡萄糖苷酶([3 ]-D-葡糖苷葡糖水解酶;EC 3.2.1.21)(" BG")。见例如Knowles等人的TIBTECH 5,255-261,1987 ;Shulein,方法 s Enzymol.,160, 25, pp. 234-243,1988。内切葡聚糖酶主要在纤维素纤维的非晶态部分上起作用,而纤维二糖水解酶还能降解结晶纤维素(Nevalainenand Penttila,Mycota,303-319,1995)。因而,需要在纤维素酶系统中存在纤维二糖水解酶,用于有效溶解结晶纤维素(Suurnakki,et al. Cellulose 7 :189-209,2000)。¢-葡萄糖苷酶的作用是从纤维二糖、纤维-寡糖和其他葡糖苷中释放D-葡萄糖单位(Freer,J. Biol. Chem. vol. 268, no. 13, pp. 9337-9342,1993)。纤维素酶已知通过大量的细菌、酵母和真菌产生。某些真菌产生能降解纤维素结晶形式的完整的纤维素酶系统,使得纤维素酶容易通过发酵大量产生。丝状真菌发挥了特殊的作用,因为许多酵母,比如酿酒酵母菌,缺乏水解纤维素的能力。见,例如 ,Aubert et al. , 1988 ;ffood et al. , Methods in Enzymology, vol. 160,no. 9,pp. 87-116,1988 和 Coughlan, et al. , " Comparative Biochemistry of Fungal andBacterial Cellulolytic Enzyme Systems" Biochemistry and Genetics of CelluloseDegradation, pp.11-30 1988。
CBH、EG和BG的真菌纤维素酶分类可被进一步扩展为包括每一分类内的多种组分。例如,多种CBH、EG和BG已从多种真菌来源中分离,所述真菌来源包括Trichodermareesei,其含有编码 2 种 CBH(即,CBH I 和 CBH II)、至少 8 种 EG(即,EG I,EG II,EG III、EGIV、EGV、EGVI、EGVII 和 EGVI11)和至少 5 种 BG(即,BGl、BG2、BG3、BG4 和 BG5)的已知
多核苷酸。因此,本发明的酶组合物可包含任何纤维素酶,例如,纤维二糖水解酶、内切-¢-1,4-葡聚糖酶、¢-葡萄糖苷酶或¢-(1,3) (1,4)_葡聚糖酶。本文中,纤维二糖水解酶(EC 3.2. I. 91)是能够催化纤维素或纤维四糖中1,4-3-D-葡糖苷键水解、从链的非还原性末端释放纤维二糖的任何多肽。所述酶也可以被称作纤维素酶1,4-0 -纤维二糖苷酶(1,4-0 -cellobiosidase), 1,4-^ -纤维二糖水解酶,I,4- P -D-葡聚糖纤维二糖水解酶,微晶纤维素酶(avicelase),外切-I,4_ P -D-葡聚糖酶,外切纤维二糖水解酶或外切葡聚糖酶。本文中,内切-@ -1,4-葡聚糖酶(EC 3. 2. I. 4)是能够催化纤维素、地衣淀粉或谷类3-D-葡聚糖中1,4-0-D-葡糖苷键内切水解的任何多肽。此类多肽也可以能够水解还含有1,3_键的P-D-葡聚糖中的1,4_键。所述酶也可以被称作纤维素酶、微晶纤维素酶、^ -1,4-内切葡聚糖水解酶、^ -1,4-葡聚糖酶、羧甲基纤维素酶、纤维糊精酶、内切-1,4- ^ -D-葡聚糖酶、内切-I,4- P -D-葡聚糖水解酶、内切-I,4- P -葡聚糖酶或内切葡聚糖酶。本文中,¢-(1,3) (1,4)_葡聚糖酶(EC 3. 2. 1.73)是能够催化含有1,3_和1,4-键的P-D-葡聚糖中I,4-P-D-葡糖苷键水解的任何多肽。此类多肽可作用于地衣淀粉和谷类P-D-葡聚糖,但不作用于仅含1,3-或1,4-键的P-D-葡聚糖。所述酶也可以被称作地衣淀粉酶(11(*61^11&%),1,3-1,4-0-0-葡聚糖4-葡聚糖水解酶,¢-葡聚糖酶,内切-¢-1, 3-1,4葡聚糖酶,地衣多糖酶(Iichenase)或混合键P -葡聚糖酶。这类酶的替代方案是被描述为内切-1,3(4)-0-葡聚糖酶的EC 3. 2. 1.6。当下述葡萄糖残基在C-3处被自身取代时,这类酶水解P -D-葡聚糖酶中的I,3-键或I,4-键,所述葡萄糖残基的还原基团涉及要水解的键。替代性的名称包括内切-1,3-P-葡聚糖酶,昆布多糖酶,1,3-(1,3 ;1,4)-P-D-葡聚糖3(4)葡聚糖水解酶,底物包括昆布多糖,地衣淀粉和谷类P-D-葡聚糖。本文中,^ -葡糖苷酶(EC 3. 2. I. 21)是能够催化末端、非还原性P -D-葡萄糖残基水解并释放P-D-葡萄糖的任何多肽。这样的多肽可具有针对P-D-葡糖苷的广泛特异性,并且也可以水解以下一种或多种P -D-半乳糖苷、a -L-阿拉伯糖苷、P -D-木糖苷或
3-D-岩藻糖苷。所述酶也可以被称作苦杏仁苷酶、3-D-葡糖苷葡糖水解酶、纤维二糖酶或龙胆二糖酶。
宿主细胞可产生并分泌内切葡聚糖酶活性和/或纤维二糖水解酶活性和/或^-葡萄糖苷酶活性。宿主细胞可产生并分泌这些种类中的一种或多种中的超过一种酶活性。例如,宿主细胞可产生并分泌两种内切葡聚糖酶活性,例如,内切-1,3(1,4)-0葡聚糖酶活性和内切-I,4-葡聚糖酶活性。本文中,半纤维素酶是能够降解或改性半纤维素的任何多肽。也就是说,半纤维素酶可以能够降解或改性木聚糖、葡糖醛酸木聚糖、阿拉伯木聚糖、葡甘露聚糖和木葡聚糖之一种或多种。能够降解半纤维素的多肽是能够催化下述过程的多肽将半纤维素降解成更小的多糖,例如部分地降解成寡糖,或者完全降解成糖单体,例如己糖或戊糖单体。与半纤维素酶接触时,半纤维素酶可得到寡糖与糖单体的混合种群。此类降解将典型地通过水解反应而发生。本发明的组合物可以包含任何半纤维素酶,例如内切木聚糖酶、¢-木糖苷酶、a -L-阿拉伯呋喃糖苷酶、乙酰木聚糖酯酶、a -D-葡糖醛酸糖苷酶、纤维二糖水解酶、阿魏酸酯酶、香豆酸酯酶、a -半乳糖苷酶、3 -半乳糖苷酶、3 -甘露聚糖酶或3 -甘露糖苷酶。
本文中,内切木聚糖酶(EC 3. 2. I. 8)是能够催化木聚糖中1,4_0 -D-木糖苷键内切水解的任何多肽。所述酶也可以被称作内切-1,4-0 -木聚糖酶或1,4-P-D-木聚糖木聚糖水解酶。一种木聚糖内切酶是EC 3. 2. I. 136,葡糖醛酸阿拉伯木聚糖内切木聚糖酶,一种能够水解葡糖醛酸阿拉伯木聚糖中1,4木糖苷键的酶。本文中,P -木糖苷酶(EC 3. 2. I. 37)是能够催化1,4_P -D-木聚糖的水解、从非还原性末端去除相继的D-木糖残基的任何多肽。这类酶也可以水解木二糖。所述酶也可以被称作木聚糖1,4-0 -木糖苷酶、1,4-0 -D-木聚糖木糖水解酶、外切-1,4-0 -木糖苷酶或木二糖酶。本文中,a -L-阿拉伯呋喃糖苷酶(EC 3. 2. I. 55)是能够作用于a -L-阿拉伯呋喃糖苷、含(1,2)和/或(1,3)_和/或(1,5)_键的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖的任何多肽。所述酶也可以被称作a-N-阿拉伯呋喃糖苷酶、阿拉伯呋喃糖苷酶或阿拉伯糖苷酶。本文中,a -D-葡糖醛酸糖苷酶(EC 3. 2. I. 139)是能够催化以下形式反应的任何多肽a -D-葡糖醛酸苷+H2O —醇+D-葡糖醛酸酯。所述酶也被称作a -葡糖醛酸糖苷酶或a-葡糖苷酸酶。这些酶也可水解可作为木聚糖中取代基存在的4-0-甲基化的葡糖醛酸。替代方式是EC 3.2. I. 131 :木聚糖a-I,2-葡糖醛酸糖苷酶,其催化a-l,2-(4-0-甲基)葡糖醛酰基连接的水解。本文中,乙酰基木聚糖酯酶(EC 3. I. I. 72)是能特别水解天然木聚糖的木聚糖部分的2和/或3位置中的乙酰基的酯键的任何多肽。本文中,阿魏酸酯酶(EC 3. I. I. 73)是能够催化以下形式反应的任何多肽阿魏酸基-糖+H2o—阿魏酸酯+糖。糖可以是例如寡糖或多糖。其典型地可以催化来自酯化的糖的4-羟基-3-甲氧基肉桂酰(阿魏酰)基的水解,所述糖通常是“天然”底物中的阿拉伯糖,对硝基苯酚乙酸酯和阿魏酸甲基酯是典型地更弱的底物。所述酶也可以被称作肉桂酰基酯水解酶,阿魏酸酯酶或羟基肉桂酰基酯酶。也可以被称作半纤维素附属酶,因为其可帮助木聚糖酶和果胶酶分解植物细胞壁半纤维素和果胶。本文中,香豆酰基酯酶(EC 3. I. I. 73)是能够催化以下形式反应的任何多肽香豆酰基-糖+H2o—香豆酸酯+糖。糖可以是例如寡糖或多糖。所述酶也可以被称作反式-4-香豆酰基酯酶、反式-对香豆酰基酯酶、对香豆酰基酯酶或对香豆酸酯酶。所述酶也落入EC 3. I. I. 73中,从而也可以被称作阿魏酸酯酶。本文中,a -半乳糖苷酶(EC 3. 2. I. 22)是能够催化a -D-半乳糖苷(包括半乳糖寡糖、半乳甘露聚糖、半乳聚糖和阿拉伯半乳聚糖)中末端、非还原性a-D-半乳糖残基水解的任何多肽。此类多肽也可以能够水解a-D-岩藻糖苷。所述酶也可以被称作蜜二糖酶。本文中,P -半乳糖苷酶(EC 3. 2. I. 23)是能够催化P -D-半乳糖苷中末端非还原性P-D-半乳糖残基水解的任何多肽。这样的多肽也可以能够水解a-L-阿拉伯糖苷。所述酶也可以被称作外切- (I- > 4)-D-半乳聚糖酶或乳糖酶。P -半乳糖苷酶是可接受半纤维素和果胶作为其底物的酶,因此其被归类为半纤维素酶和果胶酶 本文中,^ -甘露聚糖酶(EC 3. 2. I. 78)是能够催化甘露聚糖、半乳甘露聚糖和葡 甘露聚糖中I,4-P-D-甘露糖苷键随机水解的任何多肽。所述酶也可以被称作甘露聚糖内切-1,4- P -甘露糖苷酶或内切-1,4-甘露聚糖酶。本文中,@ -甘露糖苷酶(EC 3. 2. I. 25)是能够催化@ -D-甘露糖苷中末端非还原性P-D-甘露糖残基水解的任何多肽。所述酶也可以被称作甘露聚糖酶或甘露糖酶。本文中,果胶酶是能够降解或改性果胶的任何多肽。能够降解果胶的多肽是能够催化下述过程的多肽将果胶降解成更小的单元,例如部分地降解成寡糖,或者完全降解成糖单体。与果胶酶接触时,根据本发明的果胶酶可得到寡糖与糖单体的混合种群。此类降解将典型地通过水解反应而发生。根据本发明的宿主细胞可包含下述异源多核苷酸,所述异源多核苷酸编码任何果胶酶,例如内切多聚半乳糖醛酸酶,果胶甲基酯酶,内切-半乳聚糖酶,¢-半乳糖苷酶,果胶乙酰基酯酶,内切-果胶裂合酶,果胶酸裂合酶,a -鼠李糖苷酶,外切-半乳糖醛酸酶,外切多聚半乳糖醛酸酯裂合酶,鼠李半乳糖醛酸聚糖水解酶,鼠李半乳糖醛酸聚糖裂合酶,鼠李半乳糖醛酸聚糖乙酰基酯酶,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶,木半乳糖醛酸酶。本文中,内切-多聚半乳糖醛酸酶(EC 3. 2. I. 15)是能够催化果胶酸酯和其他半乳糖醛酸聚糖中l,4-a-D-半乳糖醛酸键的随机水解的任何多肽。所述酶也可以被称作多聚半乳糖醒酸酶果胶解聚酶,内切多聚半乳糖醒酸酶,果胶酶(pectolase),果胶水解酶,果胶多聚半乳糖醛酸酶,多聚- a -I,4-半乳糖醛酸苷聚糖水解酶,内切半乳糖醛酸酶;内切-D-半乳糖醛酸酶或多聚(I,4-a-D-半乳糖醛酸苷)聚糖水解酶。在本文中,果胶甲基酯酶(EC 3. I. I. 11)是能够催化下述反应的任何酶果胶+nH2O — n甲醇+果胶酸酯。所述酶也已知为果胶酯酶(pectinesterase),果胶脱甲氧基酶,果胶甲氧基酶,果胶甲基酯酶,果胶酶,果胶酯酶(pectinoesterase)或果胶果酰基水解酶(pectin pectylhydrolase)。在本文中,内切-半乳聚糖酶(EC 3. 2. I. 89)是能够催化阿拉伯半乳聚糖中1,4-3-D-半乳糖苷键的内切水解的任何酶。所述酶也已知为阿拉伯半乳聚糖内切-I,4- 3 -半乳糖苷键,内切-I,4- 0 -半乳聚糖酶,半乳聚糖酶,阿拉伯半乳聚糖酶或阿拉伯半乳聚糖4- 3 -D-半乳聚糖水解酶。本文中,果胶乙酰基酯酶在本文中被定义为下述任何酶,所述酶具有催化果胶GaIUA残基羟基处乙酰基的脱乙酰基作用的乙酰基酯酶活性。本文中,内切-果胶裂合酶(EC 4.2.2. 10)是能够催化(I — 4) - a-D-半乳糖醛酸聚糖甲基酯的清除性切割,得到在其非还原末端具有4_脱氧-6-0-甲基-a -D-半乳-4-糖醒酰基的寡糖。所述酶也可已知为果胶裂合酶,果胶反式消除酶(trans-eliminase),内切果胶裂合酶,多聚甲基半乳糖醛酸反式消除酶,果胶甲基反式消除酶,果胶酶(pectolyase),PL, PNL或PMGL或(I — 4) -6-0-甲基-a -D-半乳糖醛酸聚糖裂合酶。本文中,果胶酸裂合酶(EC 4. 2. 2. 2)是能够催化(I — 4) - a -D-半乳糖醛酸聚糖的消除性切割,得到在其非还原性末端具有4-脱氧- a -D-半乳-4-糖醛酰基的任何酶。该酶也可以已知为多聚半乳糖醛酸反式消除酶,果胶酸反式消除酶,多聚半乳糖醛酸酯裂合酶,内切果胶甲基反式消除酶,果胶酸反式消除酶,内切半乳糖醛酸酯反式消除酶,果胶酸裂合酶,果胶裂合酶,a-l,4_D-内切多聚半乳糖醛酸裂合酶,PGA裂合酶,PPase-N,内切-a -1,4-多聚半乳糖醛酸裂合酶,多聚半乳糖醛酸裂合酶,果胶反式消除酶,多聚半乳糖醛酸反式消除酶或(I — 4)-a-D-半乳糖醛酸聚糖裂合酶。
本文中,a -鼠李糖苷酶(EC 3. 2. I. 40)是能够催化a -L-鼠李糖苷或鼠李半乳糖醛酸聚糖中末端非还原性a-L-鼠李糖残基水解的任何多肽。所述酶也可以已知为a -L-鼠李糖苷酶T,a -L-鼠李糖苷酶N或a -L-鼠李糖苷鼠李糖水解酶。本文中,外切-半乳糖醛酸酶(EC 3. 2. I. 82)是能够从非还原性末端水解果胶酸、释放二半乳糖醛酸的任何多肽。酶也可以已知为外切-多聚- a-半乳糖醒酸昔酶(exo-poly-a-galacturonosidase)、外切多聚半乳糖醒酸苷酶(exopolygalacturonosidase)或外切多聚聚半乳糖醒酸苷酶(exopolygalacturanosidase)。本文中,外切-半乳糖醛酸酶(EC 3.2. 1.67)是能够催化以下的任何多肽(1,
4-a -D-半乳糖醛酸苷)n+H20 — (I,4- a -D-半乳糖醛酸苷)n_i+D-半乳糖醛酸酯。所述酶也可以已知为半乳糖醒I,4_ a -半乳糖醒酸苷酶(galacturan 1,4_ a-galacturonidase),外切多聚半乳糖醛酸酶,多聚(半乳糖醛酸酯)水解酶,外切-D-半乳糖醛酸酶,外切-D-半乳糖醛酸聚糖酶,外切多聚-D-半乳糖醛酸酶或多聚(I,4-a-D-半乳糖醛酸苷)半乳糖醛酸水解酶。本文中,外切多聚半乳糖醛酸酯裂合酶(EC 4. 2. 2. 9)是能够催化从果胶酸(即脱脂化的果胶)的还原末端消除性切割4- (4-脱氧-a -D-半乳-4-糖醛酰基)-D-半乳糖醛酸酯的任何多肽。所述酶可已知为果胶酸二糖裂合酶,果胶酸外切裂合酶,外切果胶酸反式消除酶,外切果胶酸裂合酶,外切多聚半乳糖醛酸-反式-消除酶,PATE,外切-PATEjF切-PGL或(I — 4) - a -D-半乳糖醛酸聚糖还原末端二糖裂合酶。本文中,鼠李半乳糖醛酸聚糖水解酶是能够在严格交替出现的鼠李半乳糖醛酸聚糖结构中以内切方式水解半乳基糖醛酸酸和吡喃鼠李糖基之间键的任何多肽,所述鼠李半乳糖醛酸聚糖结构由二糖[(1,2-a-L-鼠李糖基_(1,4)-a-半乳糖醛酸]组成。本文中,鼠李半乳糖醛酸聚糖裂合酶是能够以内切方式在鼠李半乳糖醛酸聚糖中通过P -消除切割a -L-Rhap-(I — 4) - a -D-GalpA键的任何多肽。本文中,鼠李半乳糖醛酸聚糖乙酰基酯酶是能够催化鼠李半乳糖醛酸聚糖中交替出现的鼠李糖和半乳糖醛酸残基主链的脱乙酰化的任何多肽。
本文中,鼠李半乳糖醛酸聚糖半乳糖醛酸水解酶是能够以外切方式、从严格交替出现的鼠李半乳糖醛酸聚糖结构的非还原性末端水解半乳糖醛酸的任何多肽。本文中,木半乳糖醛酸酶是通过以内切方式切割¢-木糖取代的半乳糖醛酸主链而作用于木半乳糖醛酸聚糖的任何多肽。所述酶也可以已知为木半乳糖醛酸聚糖水解酶。a -L-阿拉伯糖呋喃糖苷酶可接受半纤维素和果胶作为其底物,因此其被归类为半纤维素酶和果胶酶二者。本文中,a -L-阿拉伯糖呋喃糖苷酶(EC 3. 2. I. 55)是能够作用于a -L-阿拉伯呋喃糖苷、含有(1,2)和/或(1,3)_和/或(1,5)_键的a-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖的任何多肽。所述酶也可以被称作a-N-阿拉伯糖呋喃糖苷酶,阿拉伯糖呋喃糖苷酶或阿拉伯糖苷酶。本文中,内切阿拉伯聚糖酶(EC 3. 2. I. 99)是能够催化1,5_阿拉伯聚糖中1,
5-a -阿拉伯呋喃糖苷键内切水解的任何多肽。所述酶也已知为内切阿拉伯糖酶,阿拉伯聚·糖内切-I,5- a -L-阿拉伯糖苷酶,内切-I,5- a -L-阿拉伯聚糖酶,内切-a -I,5_阿拉伯聚糖酶;内切-阿拉伯聚糖酶或I,5-a -L-阿拉伯聚糖I,5-a -L-阿拉伯聚糖水解酶。在本发明的特别的实施方式中,至少四种不同的酶是至少两种不同的纤维二糖水解酶,例如纤维二糖水解酶I和/或纤维二糖水解酶II,任选地至少内切葡聚糖酶,例如^ -葡聚糖酶CEA和至少P -葡萄糖苷酶。优选地,所述不同的纤维二糖水解酶之一与SEQ ID NO. I至少具有70%同一性且另一所述不同的纤维二糖水解酶与SEQ ID NO. 7具有至少70%同一性,其中内切葡聚糖酶与SEQ ID NO. 3具有至少70%同一性且其中P -葡萄糖苷酶与SEQ ID NO. 5具有至少70%同一I"生。例如,一种纤维二糖水解酶与SEQ ID NO. I可具有至少75%,例如至少80%、例如至少85%、例如至少90%、例如至少93%、例如至少95%、例如至少97%、例如至少98%、例如至少99%同一性。例如,另一纤维二糖水解酶可与SEQ ID NO. 7具有至少75%,例如至少80%、例如至少85%、例如至少90%、例如至少93%、例如至少95%、例如至少97%、例如至少98%、例如至少99%同一性。例如,内切葡聚糖酶可与SEQ ID NO. 3具有至少75%,例如至少80%、例如至少85%、例如至少90%、例如至少93%、例如至少95%、例如至少97%、例如至少98%、例如至少99%同一性。例如,¢-葡萄糖苷酶可与SEQ ID NO. 5具有至少75%,例如至少80%、例如至少85%、例如至少90%、例如至少93%、例如至少95%、例如至少97%、例如至少98%、例如至少99%同一性。优选地,通过本发明的宿主细胞产生的酶在16倍或更多倍稀释的上清液或发酵液中具有至少2WSU的纤维素酶活性,例如在16倍稀释的上清液或发酵液中至少3WSU的纤维素酶活性或至少5WSU或更多的纤维素酶活性。发酵液或上清液可以是例如10000倍稀释的、5000倍稀释的或2500倍稀释的。I “WSU”意味着在65 °C、pH 4. 50下20小时内通过200 的酶混合物从2. Iw/v%洗漆的预处理的麦稻中释放0. 119mg/ml葡萄糖。
当异源纤维素酶、半纤维素酶和/或果胶酶从宿主细胞分泌进培养基中时,适当的信号序列可被添加至多肽,以将重新合成的多肽导向宿主细胞的分泌路径。本领域技术人员知道针对具体宿主选择适当的信号序列。信号序列对宿主细胞而言可以是内源的或对宿主细胞而言可以是外源的。作为例子,可使用来自对宿主细胞而言天然的蛋白的信号序列。优选地,所述天然蛋白是高分泌蛋白,即以高于正被分泌的蛋白的总量的10%分泌的蛋白。作为信号序列的替代形式,本发明的多肽可与分泌的载体蛋白或其部分融合。通过载体蛋白或其部分的信号序列,此类嵌合构建体(chimeric construct)被导向分泌路径。此外,载体蛋白将向根据本发明的多肽提供稳定作用和/或可增强溶解性。此类载体多肽可以是任何蛋白。优选地,高分泌蛋白被用作载体蛋白。载体蛋白相对于根据本发明的多肽可以是内源或外源的。载体蛋白相对于宿主细胞可以是内源的或可以是外源的。此类载体蛋白的例子是葡萄糖淀粉酶、a -结合因子的前原序列、Clostridium cellulovorans纤维素结合蛋白A的纤维素结合域、谷胱甘肽S-转移酶、Bacillus circulans几丁质酶Al的几丁质结合域、由E. coli K12的malE基因编码的麦芽糖结合域、0 -半乳糖苷酶和碱性磷酸酶。用于在Aspergillus细胞中此类嵌合构建体表达的优选的载体蛋白是葡萄糖淀粉 酶。多核苷酸术语“多核苷酸”与术语“核酸分子”是等同的并且在本文中可互换使用。该术语是指多核苷酸分子,其是单链或双链的核糖核酸(RNA)或脱氧核糖核酸(DNA)分子。多核苷酸可以分离形式存在或包含在重组核酸分子或载体中或包含在宿主细胞中。多核苷酸可以是合成的或可以是从染色体DNA中分离的。在本文中使用时,术语“基因”是指核酸分子,其可从染色体DNA中分离或可以是基于序列表合成的,其包括编码多肽的开放阅读框。根据本发明的多核苷酸可以是合成的多核苷酸。合成的多核苷酸可以按照密码子使用被优化,优选地根据W02006/077258和/或PCT/EP2007/055943中所述的方法被优化,所述参考文献通过引用并入本文。PCT/EP2007/055943介绍了密码子对优化。密码子对优化是这样一种方法其中编码多肽的核苷酸序列根据其密码子使用、尤其是使用的密码子对而被修饰,以获得编码多肽的核苷酸序列经改进的表达和/或所编码的多肽的经改进的生产。密码子对被定义为编码序列中一组两个连续的三联体(密码子)。术语“编码序列”在本文中被定义为下述序列,所述序列被转录成mRNA并翻译成本发明的多肽。编码序列的界限通常由mRNA 5’-端的ATG起始密码子和mRNA 3'-端终止开放读码框的翻译终止密码子序列决定。编码序列可包括但不限于DNA、cDNA和重组核酸序列。编码从纤维素酶、半纤维素酶和果胶酶的组中选择的酶的至少四种不同的异源多核苷酸可从任何已知的多核苷酸中选择。优选地,多核苷酸是从编码纤维素酶、半纤维素酶和果胶酶的多核苷酸组中选择的,是从编码纤维素酶和半纤维素酶的多核苷酸组中选择的,更优选地从编码纤维素酶的多核苷酸组中选择。在一种实施方式中,根据本发明的多核苷酸是从编码热稳定酶的多核苷酸中选择的。本文中,这表示酶具有约60°C或更高,例如约70°C或更高比如约75°C或更高、例如约80°C或更高比如85°C或更高的最适温度。技术人员可使用普通知识选择合适的多核苷酸。它们可例如从嗜热微生物中分离或可由技术人员设计并人工合成。在一种实施方式中,多核苷酸可从嗜热丝状真菌中分离。可从中分离编码热稳定酶的多核苷酸的嗜热丝状真菌有Acremonium, Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neurospora、Paecilomyces、Penicillium、Schizophyllum、Talaromyces、Thermoascus、Thielavia和 Tolypocladium。在本发明的特别方面中,至少四种不同的多核苷酸是至少编码纤维二糖水解酶I和/或纤维二糖水解酶II、内切葡聚糖酶和P -葡萄糖苷酶的多核苷酸。优选地,编码纤维二糖水解酶I的多核苷酸与SEQ ID NO. 2具有至少70%、更优选地至少75 %、更优选地至少80 %、更优选地至少85 %、更优选地至少87 %,例如至少90 %、例如至少93%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%或100%的同一性(来自Talaromyces emersonii CBS 39364的编码纤维二糖水解 酶I的多核苷酸)。优选地,编码纤维二糖水解酶II的多核苷酸与SEQ ID NO. 8具有至少70%、更优选地至少75%、更优选地至少80%、更优选地至少85%、更优选地至少87%,例如至少90%、例如至少93%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%或100%的同一性(来自Talaromyces emersonii CBS 39364的编码纤维二糖水解酶II的多核苷酸)。优选地,编码内切葡聚糖酶的多核苷酸与SEQ ID NO. 4具有至少70%、更优选地至少75%、更优选地至少80%、更优选地至少85%、更优选地至少87%,例如至少90%、例如至少93%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%或100%的同一性(来自Talaromyces emersonii CBS 39364的编码内切葡聚糖酶的多核苷酸)。优选地,编码¢-葡萄糖苷酶的多核苷酸与SEQ ID NO. 6具有至少70%、更优选地至少75%、更优选地至少80%、更优选地至少85%、更优选地至少87%,例如至少90%、例如至少93%、例如至少95%、例如至少96%、例如至少97%、例如至少98%、例如至少99%或100%的%同一丨丨生(来自Talaromyces emersonii的编码P _葡萄糖苷酶的多核苷酸)。在本发明的特定实施方式中,编码与SEQ ID NO. 2具有至少70%同一性的纤维二糖水解酶I的多核苷酸(来自Talaromyces emersonii CBS 39364的编码纤维二糖水解酶I的多核苷酸)、与SEQ ID NO. 8具有至少70%同一性的多核苷酸(来自Talaromycesemersonii CBS 39364的编码纤维二糖水解酶II的多核苷酸)、与SEQ ID NO. 4具有至少70%同一性的多核苷酸(来自Talaromyces emersonii CBS 39364的编码内切葡聚糖酶的多核苷酸)和与SEQ ID NO. 6具有至少70%同一性的多核苷酸(来自Talaromycesemersonii的编码P _葡萄糖苷酶的多核苷酸)在宿主细胞中存在,优选地在Aspergillus宿主细胞中存在。Aspergillus 是Talaromyces emersonii 的多核苷酸(SEQ ID NO. 2 的纤维二糖水解酶I、SEQ ID NO. 8的纤维二糖水解酶II、SEQ ID NO. 4的内切葡聚糖酶和SEQ ID NO. 6的葡萄糖苷酶)和与其具有至少70%同一性的多核苷酸的非常好的宿主细胞。令人惊讶地,已发现SEQ ID NO. 2的纤维二糖水解酶I、SEQ ID NO. 8的纤维二糖水解酶II、SEQID NO. 4的内切葡聚糖酶和SEQ ID NO. 6的P -葡萄糖苷酶在Aspergillus中表达并由其分泌,而不需要针对AspergiIIu的优选的密码子使用和信号序列的对这些序列的任何适
应性改变。优选地,编码从纤维素酶、半纤维素酶和果胶酶的组中选择的至少四种不同的酶的多核苷酸是源自Talaromyces菌株,更优选地源自Talaromyces emersonii菌株,更优选地源自在 CENTRAAL BUREAU VOOR SCHIMMELCULTURES,Uppsalalaan 8,P.O.Box 85167,NL-3508AD Utrecht, The Netherlands 于 2009 年 7 月 I 日报藏的具有登录号 CBS 39364 的Talaromyces emersonii菌株的原始的多核苷酸或密码子优化的多核苷酸或其功能等同突变体。后一种菌株在本文中表不为Talaromyces emersonii CBS 39364。氨基酸或核苷酸序列当展示某些水平的相似性时被称为是同源的。两个同源序列 是密切相关的还是更远相关的,分别通过为高的或低的“百分比同一性”或同一性”表
/Jn o就本发明目的而言,在本文中定义为了测定两条氨基酸序列或两条核酸序列的百分比同一性,就最适比较的目的比对完整的序列。为了优化两条序列之间的比对,可在被比较的两条序列的任何一条中引入缺口。这种比对可以在被比较的序列的全长上进行。同一性是在报告的比对区域上的两条序列之间的同一匹配的百分比。可以使用数学算法完成两个序列之间的序列比较和同一性百分比测定。技术人员应当明白下述事实可获得比对两条序列的若干种不同的计算机程序并测定两条序列之间的同源性(Kruskal, J. B. (1983)An overview of sequence comparison In D.Sankoffand J. B. Kruskal, (ed. ), Time warps, string edits and macromolecules the theoryand practice of sequence comparison,pp. l_44Addison Wesley)。可使用用于I匕对两条序列的Needleman和Wunsch算法测定两条氨基酸序列之间的百分比同一性(Needleman,S.B.and Wunsch, C. D. (1970) J. Mol. Biol. 48,443-453)。算法比对氨基酸序列以及核苷酸序列。Needleman-Wunsch算法已在计算机程序NEEDLE中实施。就本发明目的而言,使用了来自 EMBOSS 包的 NEEDLE 程序(版本 2. 8. 0 或更高,EMBOSS The European MolecularBiology Open Software Suite (2000)Rice, P. Longden, I. and Bleasby, A. Trends inGenetics 16, (6)pp276~277, http://emboss, bioinformatics, nl/)。就蛋白序列而言,EBL0SUM62用于替换矩阵,就核苷酸序列而言,使用了 EDNAFULL。可指定其他矩阵。就本发明目的而言,用于比对氨基酸序列的参数是缺口开放惩罚为10和缺口延伸惩罚为0.5。技术人员会意识到所有这些不同的参数会产生些微不同的结果,但是当使用不同的算法时两条序列的总百分比同一性不显著改变本文中提到的蛋白序列还可用作“查询序列”以针对序列数据库进行搜索,例如来鉴定其他家族成员或相关序列。可使用BLAST程序进行此类搜索。进行BLAST分析的软件通过National Center for Biotechnology Information (http://www. ncbi. nlm. nih. rov)是公众可得到的。BLASTP用于氨基酸序列,BLASTN用于核苷酸序列。在BLAST程序中,可使用下述缺省设置-开放缺口的开销缺省=5用于核苷酸/II用于蛋白-延伸缺口的开销缺省=2用于核苷酸/I用于蛋白
-核苷酸错配惩罚缺省=-3-核苷酸匹配奖励缺省=I-期望值缺省=10-字长缺省=11用于核苷酸/28用于megablast/3用于蛋白
本文中提到的核酸序列还可用作“查询序列”以针对公用数据库进行搜索,例如,来鉴定其他家族成员或相关的序列。使用Altschul,et al. (1990) J. Mol. Biol. 215 :403-10的NBLAST和XBLAST程序(版本2. 0)进行此类搜索。BLAST核苷酸搜索可用NBLAST进行,评分=100,字长=12以获得与本发明的核酸分子同源的核苷酸序列。可以例如通过进行PCR分离同源的多核苷酸序列,所述PCR使用以本文提到的核苷酸序列为基础设计的两个简并寡核苷酸引物池。用于反应的模板可以是通过反转录mRNA获得的cDNA,所述mRNA从已知或怀疑表达本发明多核苷酸的菌株中制备。可以对PCR产物进行亚克隆和测序,以确保被扩增的序列代表了新核酸序列的序列或其功能等同物。然后可以通过多种已知方法,使用PCR片段来分离全长cDNA克隆。例如,被扩增的片段可以被标记,并用于筛选噬菌体或粘粒cDNA文库。或者,被标记的片段可以被用于筛选基因组文库。也可以用PCR技术来从其它生物中分离全长cDNA序列。例如,可以根据标准步骤从合适的细胞或组织来源中分离RNA。可以使用特异于被扩增片段最5’端的寡核苷酸引物,引导第一链合成,针对RNA进行反转录反应。然后可以使用标准的末端转移酶反应将得到的RNA/DNA杂交体“加尾”(例如用鸟嘌呤),可以用RNase H消化所述杂交体,然后(例如用多聚-C引物)引物起始第二链合成。因此,被扩增片段上游的cDNA序列可以容易地被分离。有用的克隆策略的综述,见例如下文提到的Sambrook et al.。例如,术语与氨基酸序列的序列表“至少70%同一性”意味着从按照上文描述的方法获得的百分比,获得的百分比是70%或更高。制备宿主细胞的方法在另一方面中,本发明涉及制备根据本发明的宿主细胞的方法,其包括下述步骤(a)提供一个或多个表达盒,所述表达盒包含从编码纤维素酶、半纤维素酶和果胶酶的多核苷酸组中选择的至少四种不同的异源多核苷酸和表达这些多核苷酸需要的控制序列。(b)提供选择性标记物(C)用所述一个或多个表达盒和来自步骤(b)的选择性标记物转化细胞(d)选择因而形成的能通过所述至少四种不同的异源多核苷酸编码产生至少四种不同的纤维素酶、半纤维素酶和/或果胶酶的宿主细胞。术语“核酸构建体”在本文中是指为单链或双链的核酸分子,其与天然存在的基因分离,或者已被修饰为含有下述核酸区段,所述核酸区段以天然不会存在的方式组合和并置。当核酸构建体含有表达编码序列所需的所有控制序列时,术语核酸构建体与术语“表达盒”同义,其中所述控制序列可操作地与所述编码序列连接。
术语“可操作地连接”在本文中被定义为一种连接,其中控制序列相对于DNA序列的编码序列被适当地置于一定位置上,使得控制序列指导多肽的生产。术语“控制序列”在本文中被定义为至少包括对mRNA和/或多肽表达而言必需和/或有利的任何组件。任何控制序列对于编码多肽的核酸序列而言可以是天然的或外源的。此类控制序列包括但不限于前导区、Shine-Delgarno序列、最适翻译起始序列(如Kozak,1991,J. Biol. Chem. 266 :19867-19870中所述)、多聚腺苷酸化序列、原-肽序列、前_原肽序列、启动子、信号序列和转录终止子。最低限度下,控制序列包括启动子、转录和翻译终止信号。控制序列可针对它们的具体目的而被优化。在本发明中使用的优选的优化的控制序列是在W02006/077258中描述的那些,其通过引用被并入本文。可以为了引入特定的限制性位点而对控制序列提供连接子,所述特定的限制性位点有助于将控制序列与编码多肽的核酸序列的编码区连接。控制序列可以是合适的启动子序列(启动子)。
控制序列也可以是合适的转录终止子(终止子)序列,这是被丝状真菌细胞识别为终止转录的序列。终止子序列与编码多肽的核酸序列的3'-端可操作地连接。本发明中可以使用在细胞中发挥功能的任何终止子。对丝状真菌细胞而言优选的终止子得自编码以下的多核苷酸A. oryzae TAKA淀粉酶、A. niger葡糖淀粉酶(glaA)、A. nidulans邻氨基苯甲酸合酶、A. niger a-葡糖苷酶、trpC和Fusarium oxysporum膜蛋白酶样蛋白酶。控制序列也可以是合适的前导序列(前导区)、对丝状真菌细胞翻译而言重要的mRNA非翻译区。前导序列与编码多肽的核酸序列的5'端可操作地连接。在细胞中发挥功能的任何前导序列可用于本发明中。对丝状真菌细胞而言优选的前导区得自编码以下的多核苷酸A. oryzae TAKA淀粉酶和A. nidulans磷酸丙糖异构酶和A. niger glaA和植酸酶。其他控制序列可分离自Penicillium IPNS基因,或pcbC基因,P微管蛋白基因。WO 01/21779中引用的所有控制序列通过引用并入本文。控制序列也可以是多聚腺苷酸化序列,这是与核酸序列3'-端可操作地连接的序列,其转录后被丝状真菌细胞识别为对所转录的mRNA添加多聚腺苷残基的信号。本发明中可以使用在细胞中有功能的任何多聚腺苷酸化序列。对丝状真菌细胞而言优选的多聚腺苷酸化序列得自编码以下的多核苷酸A. oryzae TAKA淀粉酶、A. niger葡糖淀粉酶、A. nidulans邻氨基苯甲酸合酶、Fusariumoxysporum胰蛋白酶样蛋白酶和A. niger a -葡糖苷酶。术语“启动子”在本文中被定义为结合RNA聚合酶并将聚合酶定向到编码生物化合物的核酸序列的正确下游转录起始位点处从而启动转录的DNA序列。RNA聚合酶有效地催化与编码区的适当DNA链互补的信使RNA的装配。术语“启动子”还可被理解为包括在转录成mRNA后用于翻译的5'-非编码区(启动子和翻译起点之间),顺式作用转录控制元件如增强子,和能够与转录因子相互作用的其他核苷酸序列。启动子可以是适用于真核或原核宿主细胞的任何合适的启动子序列,其显示转录活性,包括突变、截短和杂交的启动子,并且可得自编码对细胞而言同源(天然)或异源(外源)的细胞外或细胞内多肽的多核苷酸。启动子可以是组成型或诱导型启动子。
可以使用的诱导型启动子的例子是淀粉诱导型启动子、铜诱导型启动子、油酸诱导型启动子。启动子可选自下组,所述组包括但不限于,得自编码A. oryzae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A. niger中性a -淀粉酶、A. niger酸稳定性a -淀粉酶、A. niger或A. awamori葡糖淀粉酶(glaA)、R. miehei脂肪酶、A. oryzae碱性蛋白酶、A. oryzae磷酸丙糖异构酶、A. nidulans乙酰胺酶的多核苷酸的启动子,NA2_tpi启动子(来自编码A. niger中性a -淀粉酶和A. oryzae磷酸丙糖异构酶的多核苷酸的启动子的杂交),及其突变、截短和杂交的启动子。优选地,编码纤维素酶、半纤维素酶和/或果胶酶的至少四种多核苷酸是受启动子驱动的,所述启动子在含有葡萄糖的培养基中是活性的,所述启动子例如葡糖淀粉酶启动子,优选地glaA启动子,因为这使得不需要存在纤维素酶诱导物。因此,本发明还涉及在葡萄糖培养基中在缺乏纤维素酶诱导物时能产生纤维素酶的宿主细胞。 其他启动子是在W02006/092396和W02005/100573中描述的启动子,所述参考文献通过引用并入本文。为了有助于表达和/或翻译,多核苷酸或核酸构建体根据本发明可包含在表达载体中使得编码感兴趣的(一种或多种)酶的(一种或多种)多核苷酸与适当控制序列可操作地连接,用于体外或在原核或真核宿主细胞中表达和/或翻译。表达载体可以是任何载体(例如,质粒或病毒),其可方便地经受重组DNA程序并可带来编码感兴趣的多肽(多种)的核酸序列的表达。载体的选择典型地取决于载体和载体将被引入的细胞的相容性。载体可以是线性或闭合环的质粒。载体可以是自主复制的载体,即,载体,其作为额外的染色体实体存在,其复制不依赖染色体复制,例如,质粒(额外的染色体元件)、微型染色体或人工染色体。自主维护的克隆载体可包含AMAl-序列(见例如 Aleksenko and Clutterbuck(1997), Fungal Genet. Biol. 21 :373-397)。或者,载体可以是这样的载体,当被引入宿主细胞时,其被整合进基因组中并和已被整合进载体的染色一起复制。整合型克隆载体可在宿主细胞染色体中随机整合,或在预定的靶基因座处整合。在本发明的一个的实施方式中,整合型克隆载体可包含与宿主细胞基因组中预定的靶基因座中的DNA序列同源的DNA片段,用于将克隆载体的整合靶向至该预定的基因座。为了促进定向整合,在转化细胞之前优选地将克隆载体线性化。优选地进行下述线性化,所述线性化使得克隆载体的至少一端,优选地任一端的侧翼是与靶基因座同源的序列。靶基因座侧翼的同源序列的长度优选地至少30bp、优选地至少50bp、优选地至少0. Ikb、甚至优选地至少0. 2kb、更优选地至少0. 5kb、甚至更优选地至少Ikb、最优选地至少2kb。优选地,通过增强宿主细胞的同源重组能力,增加定向整合进宿主细胞基因组,SP在预定的靶基因座中整合的效率。优选地,与靶基因座同源的克隆载体中的同源侧翼DNA序列得自高表达基因座,意味着它们得自能在宿主细胞中高表达水平的基因。能高表达水平的基因,即高表达基因,本文中定义为下述基因,其mRNA可占总细胞mRNA的至少0. 5% (w/w),例如在诱导条件下或可选择地,其基因产物可占总细胞蛋白的至少1% (w/w)的基因,或在分泌的基因产物的情况下,可被分泌为至少0. lg/1的水平(如在EP 357 127B1中描述的)。多于一个拷贝核酸序列可被插进细胞中以提高通过所述序列编码的产物的生产。这可优选地通过整合进DNA序列的其基因组拷贝中,更优选地通过在前面段落中定义的高表达基因座之一上定向整合DNA序列来进行。或者,这通过包括具有核酸序列的扩增的可选择标记物基因来进行,其中通过在存在适当选择试剂情况下培养细胞,含有扩增的可选择标记物基因拷贝和因而额外的核酸序列拷贝的细胞可被选择。为增加将被过表达的甚至更多数目的DNA序列的拷贝,可使用如在W098/46772中描述的基因转变技术。载体系统可以是单个载体或质粒或一起含有将被引入宿主细胞基因组的总DNA的两个或多个载体或质粒,或转座子。载体优选地含有一个或多个选择性标记物,所述标记物允许转化的细胞容易选择。选择性标记物是下述基因,其基因产物提供杀生剂或病毒抗性、对重金属的抗性、营养缺陷型的原养型等等。选择性标记物可在作为表达盒的表达载体上被引入细胞或可在单独的表达载体上被引入。用在丝状真菌细胞中的选择性标记物可从下述组中选择,所述组包括但不限于amdS(乙酰胺酶)、argB (鸟氨酸氨甲酰转移酶)、bar (草胺膦乙酰基转移酶)、bleA(腐草霉素结合)、hygB (潮霉素磷酸转移酶)、niaD (硝酸盐还原酶)、pyrG (乳清酸核苷_5'-磷酸脱羧酶)、SC(硫酸腺苷转移酶)和trpC(邻氨基苯甲酸合酶)以及来自其他物种的等同物。优选的用在 Aspergillus 和 Penicillium 细胞中的是 A. nidulans 或 A. oryzae 的 amdS基因(见例如 EP 635574B1、EP0758020A2、EP1799821A2、WO 97/06261A2)和 pyrG 基因和Streptomyces hygroscopicus的bar基因。更优选地使用amdS基因,甚至更优选地来自A. nidulans或A. niger的amdS基因。最优选的选择性标记物基因是与A. nidulans gpdA启动子融合的A. nidulans amdS编码序列(见EP 635574B1)。其他优选的AmdS标记物是在W02006/040358中描述的那些。还可以使用来自其他丝状真菌的AmdS基因(W0 97/06261)。用来连接上述的元件以构建本发明的重组表达载体的程序对本领域技术人员而言是熟知的(见,例如 Sambrook&Russell,Molecular Cloning A Laboratory Manual, 3rdEd. ,CSHL Press,Cold Spring Harbor,NY. 2001 ;and Ausubel et al.,Current Protocolsin Molecular Biology, Wiley InterScience, NY,1995).此外,标准分子克隆技术比如DNA分离、凝胶电泳、核酸的酶限制性修饰、Southern分析、细胞转化等等对技术人员而言是已知的并被例如Sambrook etal. (1989) " Molecular Cloning a laboratory manual " , Cold Spring HarborLaboratories, Cold Spring Harbor, N ew York and Innis et al. (1990) " PCRprotocols, a guide to 方法 s and applications" Academic Press, San Diego 描述。使用期望的多核苷酸序列作为杂交探针,可使用标准杂交和克隆技术,分离根据本发明的核酸分子(e. g.,as described in Sambrook, J.,Fritsh, E. F.,and Maniatis,T. Molecular Cloning A Laboratory Manual. 2nd,ed. , Cold Spring Harbor Laboratory,Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)。可根据标准PCR扩增技术,使用cDNA、mRNA或者基因组DNA作为模板和适宜的寡核苷酸引物扩增核酸分子。这样扩增的核酸分子可被克隆进适宜的载体中并通过DNA序列分析表征。而且,可通过标准合成技术,例如使用自动DNA合成仪,制备与根据本发明的核苷酸序列对应的或可杂交的寡核苷酸。、
优选地,宿主细胞,例如Aspergillus被工程改造以改进感兴趣的多核苷酸表达。优选地,通过增强宿主细胞的同源重组能力,增加定向整合进宿主细胞,即在预定的靶基因座上整合的效率。此类细胞的表型优选地包括如在W02005/095624A2中描述的缺陷型hdfA或hdfB。W02005/095624A2公开了获得包含增加的定向整合效率的丝状真菌细胞的优选的方法。或者,宿主细胞包含与野生型细胞相比的提高的未折叠蛋白反应(UPR),以增强感兴趣的多肽的生产能力。通过在US2004/0186070A1和/或US2001/0034045A1和/或W001/72783A2和/或W02005/123763A1中描述的技术可增加UPR。更特定地,HACl和/或IREl和/或PTC2的蛋白水平已被调控,和/或SEC61蛋白已被工程改造,以获得具有提高的UPR的宿主细胞。或者,或与提高的UPR组合,对宿主细胞进行遗传修饰,以获得与野生型细胞相比展示更低蛋白酶表达和/或蛋白酶分泌的表型,从而增强感兴趣的多肽的生产能力。此类表型可以通过蛋白酶表达的转录调节子的缺失和/或修饰和/或失活来获得。此类转录调节子可以是例如prtT。通过调控prtT来降低蛋白酶的表达可以通过US2004/0191864A1中描述的技术进行。或者,或与提高的UPR和/或展示更低蛋白酶表达和/或蛋白酶分泌的表型组合,宿主细胞展示了草酸盐缺陷型表型,从而增强感兴趣的多肽的生产产量。草酸盐缺陷型表型可以通过W02004/070022A2中描述的技术获得。或者,或与提高的UPR和/或展示更低蛋白酶表达和/或蛋白酶分泌和/或草酸 盐缺陷的表型组合,宿主细胞展示了与野生型相比的表型差异的组合,以增强感兴趣的多肽的生产产率。这些差异可包括但不限于,降低的葡糖淀粉酶和/或中性a-淀粉酶A和/或中性a-淀粉酶B蛋白酶和草酸水解酶的表达。宿主细胞展示的所述表型差异可以通过根据US2004/0191864A1中所述技术的遗传修饰获得。或者,或与提高的UPR和/或展示更低蛋白酶表达和/或蛋白酶分泌和/或草酸盐缺陷的表型和雨野生型相比为了增强感兴趣的多肽生产产率的表型差异的组合相组合,宿主细胞展示毒素基因的缺陷,使得丝状真菌宿主细胞失去表达毒素的能力。此类毒素包括但不限于,赭曲毒素,烟曲霉毒素,环并偶氮酸(cyclapiazonic acid),3_硝基丙酸,布洛芬,畸形素,黄曲霉毒素和黑麦酸。此类缺陷优选地例如描述于W02000/039322A1中本领域技术人员知道怎样用一个或多个表达盒和选择性标记物转化细胞。例如,技术人员可使用一个或多个表达载体,其中一个或多个克隆载体包含表达盒和选择性标记物。细胞的转化可通过任何合适的已知方法进行,包括例如电穿孔法、粒子轰击或微粒轰击、原生质体法和Agrobacterium介导的转化(AMT)。优选地,使用原生质体方法° 转化的程序由 J. R. S. Fincham, Transformation in fungi. 1989, microbiologicalreviews. 53,148-170 描述。优选地,通过本领域熟知的技术进行通过多核苷酸表达载体或核酸构建体引入细胞的宿主细胞转化(见Sambrook & Russell ;Ausubel, supra)。转化可包括由下述组成的方法原生质体形成、原生质体转化和以自身已知的方式的细胞壁再生。Aspergillus细胞转化的合适的程序在 EP 238 023A2 和 Yelton et al. , 1984, Proceedings ofthe National Academy of Sciences USA 81 1470-1474 描述。使用 Agrobacteriumtumefaciens转化Aspergillus和其他丝状真菌宿主细胞的合适的程序在例如De Grootet al. ,Agrobacterium tumefaciens-mediated transformation of filamentous fungi.Nat Biotechnol. 1998,16 :839-842. Erratum in Nat Biotechnol 199816 :1074 中描述。转化 Fusarium 物种的合适的方法被 Malardier et al. , 1989, Gene 78:147156 or inWO 96/00787A2描述。可应用其他方法,比如使用如在Christiansen et al. , Biolistictransformation of the obiigate plant pathogenic fungus,Erysiphe graminis f. sp.hordei. 1995, Curr Genet. 29 100-102中描述的基因枪转化的方法。使用Becker andGuarente, In Abelson, J. N. and Simon, M. I. , editors, Guide to Yeast Genetics andMolecular Biology, Methods in Enzymology, Volume 194,pp 182—187, Academic Press,Inc. ,New York、Ito et al. ,1983,Journal of Bacteriology 153 :163和Hinnen et al.,1978,Proceedings of the National Academy of Sciences USA 75 :1920描述的程序,可转化酵母。为了增加感兴趣的多核苷酸在宿主细胞中的拷贝数目,可需要多种宿主细胞转化。以这种方式,通过宿主细胞生产的不同酶的比率可被影响。表达载体还可包含多个表达盒以增加将被转化的(一种或多种)多核苷酸的拷贝数目。另一方式可以是选择针对不同的多核苷酸的不同的控制序列,其取决于选择可引起期望的酶的生产更高或更低。本发明的宿主细胞的一个优势在于,本发明的宿主细胞用于制备具有一致组成的酶组合物。基于选择性标记物的存在与否,可选择用选择性标记物转化的细胞。在转化(Aspergillus)细胞的情况下,通常当在同时用所有的核酸材料转化细胞时,选择性标记物存在时,编码期望的(一种或多种)酶的(一种或多种)多核苷酸也存在。但是,为了确保期望的酶是通过宿主细胞产生的,可基于在发酵液中存在的酶选择宿主细胞。如在下文实验部分中描述的,期望的酶活性(WSU)的存在可在发酵液中检测至|J。或者,可使用如在下文实验部分中描述的SDS-PAGE分析,测定期望的酶的存在。酶组合物在另一方面中,本发明涉及酶组合物,所述酶组合物包含通过根据本发明的宿主细胞产生的至少四种不同的纤维素酶、半纤维素酶和/或果胶酶。酶组合物可以是未纯化的发酵液,其中宿主细胞已产生并分泌至少四种不同的纤维素酶、半纤维素酶和/或果胶酶,所述发酵液含有宿主细胞或其可以是发酵液的进一步的纯化形式。纯化酶的方法对本领域技术人员而言是已知的(如下文描述的下游处理)。在一种实施方式中,CBHI在包含BG、EG和CBHII的酶组合物中提供。在其一种实施方式中,选择酶量使得BG以2-12%、CBHI以10-65%、CBHII以10-40%且EG以12-70%存在,或在其一种实施方式中,BG以4-12%、EG以18-50%、CBHII以10-35%且CBHI以10-60%存在,基于总蛋白量(w/w)计算。
本发明的另一方面涉及培养发酵液的下游处理的选择。根据本发明应用的分批工艺有助于下游处理,尤其因为高产率的有价值化合物的和低量的副产物。下游处理可包括回收以及形成步骤。
培养过程结束后,使用针对回收感兴趣的有价值化合物开发的标准技术,有价值的产物可从培养发酵液中回收。将被应用的相关的下游处理技术因而取决于有价值化合物的性质和细胞定位和取决于感兴趣的产物的期望纯度水平。在典型的回收方法中,使用例如离心或过滤从培养液体中分离生物质。在有价值的产物在微生物细胞中累积或与微生物细胞关联时,有价值化合物接着从生物质中回收。术语“回收”包括从培养基中分离、提取、收获、分开或纯化化合物。可根据本领域中已知任何常规分离或纯化方法(包括但不限于PH改变、溶剂提取、透析、细胞过滤和超滤、浓缩、冷冻干燥等等)进行化合物分离。还在另一方面中,本发明涉及生产根据本发明的包含至少四种不同的纤维素酶、半纤维素酶和/或果胶酶的酶组合物的方法,所述方法包括下述步骤(a)提供本发明的宿主细胞(b)允许至少四种不同的纤维素酶、半纤维素酶和/或果胶酶经由宿主细胞生产和分泌,和
(C)任选的回收因此获得的酶组合物。本发明还涉及通过该方法可获得的酶组合物。例如,本发明的宿主细胞可在合适的培养基中在允许纤维素酶混合物将被表达和/或分离的条件下培养。使用本领域已知的程序(见,例如Bennett, J. W. and LaSure, L. , eds. ,More GeneManipulations in Fungi, Academic Press, CA, 1991),培养在包含碳源和氮源和无机盐的营养培养基中发生。合适的培养基购自商业供应商或可使用(美国典型培养物收集中心的目录中)公开的组成制备。在本文提到的培养基,对本发明不是关键的。假设养分供应过量,根据讨论的宿主细胞的需要可添加养分至工艺中。培养基适宜地含有碳源、氮源以及其他用于微生物生长和/或产物形成的额外的化合物。例如,可存在额外的化合物用于诱导产物产生。本领域中已知的合适的碳源的例子包括葡萄糖、麦芽糖、糊精、蔗糖、水解淀粉、糖蜜和油。本领域已知的氮源的例子包括大豆粉、玉米浆、酵母提取物、氨、铵盐和硝酸盐。额外的化合物的例子包括磷酸盐、硫酸盐、痕量元素和维生素。取决于例如宿主细胞的需要和/或允许酶表达和分泌的时间,将被添加的碳源和氮源的总量可改变。碳源和氮源之间的比率可相当大的改变,其中碳源和氮源之间的最佳比率的一个决定因素可以是将要形成的产物的元素组成。宿主细胞生长和/或产物形成需要的额外的化合物比如磷酸盐、硫酸盐或痕量元素可以在不同种类的宿主细胞之间(即真菌、酵母和细菌之间)可改变的量添加。此外,通过形成的产物类型,可确定将被添加的额外的化合物的量。“回收因而获得的酶组合物”意味着酶组合物可与宿主细胞和不是期望的酶的其他组分分开(见上文描述的下游处理)。优选地,宿主细胞被允许在含葡萄糖的培养基中产生和分泌至少四种不同的纤维素酶、半纤维素酶和/或果胶酶,由于本文中描述的原因,所述含葡萄糖的培养基优选地不含有纤维素酶诱导物。当然,本发明的酶组合物还可包含其他组分,例如蛋白,比如酶;或其他组分。在蛋白的情况下,这些蛋白已通过宿主细胞产生并分泌,但是它们还可被单独添加至酶组合物。
例如,酶组合物可包含辅助酶活性。此种额外的活性可源自典型来源和/或通过遗传修饰的生物体产生。 因此,再者,从下述组中选择的一个或多个(例如两种、三种、四种或所有)酶可在本发明的酶组合物中存在淀粉酶、蛋白酶(优选地来自不降解纤维素酶的蛋白酶组)、在酶组合物中存在的半纤维素酶和/或果胶酶;脂肪酶、木质酶、己糖基转移酶、葡糖醛酸糖苷酶、扩展蛋白、纤维素诱导的蛋白、纤维素整合蛋白和其他蛋白。“蛋白酶”包括水解肽键的酶(肽酶),以及水解肽和其它部分如糖之间键的酶(糖肽酶)。许多肽酶根据EC 3. 4表征,适合在本发明中使用并且通过引用并入本文。一些特定类型的蛋白酶包括半胱氨酸蛋白酶(包括胃蛋白酶,木瓜蛋白酶)和丝氨酸蛋白酶(包括糜蛋白酶,羧肽酶和金属内切蛋白酶)。“脂肪酶”包括水解脂质、脂肪酸和酰基甘油酯(包括磷酸甘油酯)、脂蛋白、二酰基甘油等等的酶。在植物中,脂质被用作结构组分,来限制水损失和病原体感染。这些脂质包括来自脂肪酸的蜡质,以及角质和木栓素(suberin)。“木质酶”包括能够水解或分解木质素聚合物结构的酶。能够分解木质素的酶包括木质素过氧化物酶、锰过氧化物酶、漆酶和阿魏酸酯酶,和在本领域中已知解聚或以其他方式分解木质素聚合物的描述的其他酶。还包括在内的是能够水解在半纤维素糖(主要是阿拉伯糖)和木质素之间形成的键的酶。木质酶包括但不限于以下组的酶木质素过氧化物酶(EC I. 11. I. 14)、锰过氧化物酶(EC I. 11. I. 13)、漆酶(EC I. 10. 3. 2)和阿魏酸酯酶(EC3. I. I. 73)。“己糖基转移酶”(2. 4. I-)包括能催化转移酶反应但还能催化纤维素和/或纤维素降解产物的水解反应的酶,可以在本发明中使用的己糖基转移酶的例子是¢-葡聚糖基转移酶。此类酶可以能够催化(1,3) (1,4)葡聚糖和/或纤维素和/或纤维素降解产物的降解。“葡糖醛酸糖苷酶”包括催化葡糖醛酸苷(例如P -葡糖醛酸苷)水解得到醇的酶。许多葡糖醛酸糖苷酶已被表征,并可适合在本发明中使用,例如3 -葡糖醛酸糖苷酶(EC 3.2. I. 31),透明质酸酶葡糖醛酸糖苷酶(EC 3.2. I. 36),葡糖醛酰基-二硫葡糖胺葡糖醛酸糖苷酶(3. 2. I. 56),甘草酸P -葡糖醛酸糖苷酶(3. 2. I. 128)或a -D-葡糖醛酸糖苷酶(EC 3. 2. I. 139)。本发明的组合物可包含扩展蛋白多肽或扩展蛋白样多肽,如膨胀因子(swollenin)(见 Salheimo et al. , Eur. J. Biohem. 269,4202-4211, 2002)或膨胀因子样多肽。扩展蛋白涉及植物细胞生长期间细胞壁结构的松弛。已经提出扩展蛋白破坏纤维素和其他细胞壁多糖之间的氢键,但不具有水解活性。认为它们通过这种方式允许纤维素纤维的滑动和细胞壁的扩大。一种扩展蛋白样蛋白——膨胀因子,含有N端碳水化合物结合模块家族I结构域(CBD)和C端扩展蛋白样结构域。就本发明的目的而言,扩展蛋白样蛋白或膨胀因子样蛋白可包含此类结构域中的一种或两种和/或可破坏细胞壁的结构(如破坏纤维素结构),任选地不生产可检测量的还原糖。本发明的组合物可包含纤维素整合蛋白、支架蛋白或支架样蛋白的多肽产物,例如分别来自 Clostridium thermocellum 或 Clostridium cellulolyticum 的 CipA 或 CipC
支架蛋白和纤维素整合蛋白是多功能整合亚基,其可将分解纤维素的亚基组合进多酶复合物中。这通过两类互补的结构域(即支架蛋白上的内聚结构域(cohesiondomain)和每个酶单元上的锚定结构域(dockerin domain))的相互作用完成。支架蛋白亚基还带有介导纤维体与其底物结合的纤维素结合模块(CBM)。就本发明的目的而言,支架蛋白或纤维素整合蛋白可包含此类结构域中的一种或两种。本发明的组合物可包含纤维素诱导的蛋白或调节蛋白,例如由来自Trichodermareesei/Hypocrea jacorina的cipl或cip2 基因或类似基因所编码的蛋白(见Foreman etal.,J. Biol. Chem. 278 (34) 31988-31997,2003)。这些基因的多肽产物是双模块蛋白,其含有纤维素结合模块和其功能或活性不与已知的糖基水解酶家族相关的结构域。而纤维素结合模块的存在和这些基因的表达与纤维素酶元件的共同调节表明在生物质降解中具有潜在作用的先前未被认识的活性。本发明的组合物可由上文提到的多肽种类的任一成员、一个多肽种类的若干成员、或这些多肽种类的任何组合组成。在本发明的组合物可以由来自以下的多肽(例如酶)组成(1)供应商;(2)克隆基因表达的多肽,例如酶;(3)复合发酵液(例如由培养基中微生物菌株的生长得到的,其中所述菌株向培养基中分泌蛋白和酶);(4)如(3)中生长的菌株的细胞裂解物;和/或(5)植物材料表达的多肽,例如酶。本发明组合物中不同的多肽,例如酶可得自不同的来源。酶组合物的可以是热稳定的。本文中,这表示活性具有约60°C或更高,例如约700C或更高比如约75°C或更高,例如约800C或更高比如85°C或更高的最适温度。酶组合物的活性典型地不具有相同的最适温度,但优选地仍然是热稳定的。再者,酶组合物中的酶活性可以能在低pH下工作。就本发明目的而言,低pH表示约5. 5或更低、约5或更低、约4. 5或更低、约4. 0或更低或约3. 8或更低或约3. 5或更低的pH。酶组合物中的活性可通过任何上文的最适温度和pH值的组合定义。酶组合物的工业应用原则上,本发明的酶组合物可以在任何需要处理包含非淀粉多糖的材料的方法中使用。因此,本发明的多肽或酶组合物可以在非淀粉多糖材料的处理中使用。本文中,非淀粉多糖材料是下述材料,所述材料包含一种或更典型地多种非淀粉多糖或者基本由一种或更典型地多种非淀粉多糖组成。典型地,植物和真菌和得自它们的材料包含大量非淀粉的多糖材料。因此,本发明的多肽可以用于植物或真菌材料或源自它们的材料的处理。植物非淀粉多糖材料的一个重要的组分是木质纤维素(在本文中也称作木质纤维素生物质)。木质纤维素是由纤维素和半纤维素和木质素组成的植物材料。碳水化合物聚合物(纤维素和半纤维素)与木质素通过氢键和共价键紧密结合。因此,本发明的多肽可以用于木质纤维素材料的处理。本文中,木质纤维素材料是包含木质纤维素或基本由木质纤维素组成的材料。因此,在用于处理非淀粉的多糖的本发明方法中,非淀粉的多糖可以是木质纤维素材料/生物质。因此,本发明提供了用于处理包含非淀粉多糖的方法,其中所述处理包括纤维素和/或半纤维素的降解和/或改性。
降解在本文上下文中表示导致产生纤维素和/或半纤维素和/或果胶物质的水解产物(即与类似的未经处理的非淀粉多糖中存在的相比,由于处理而存在更短链的糖)的处理。因此,降解在本文上下文中可以导致寡糖和/或糖单体的释放。所有植物和真菌都含有非淀粉的多糖,同样,基本上所有来自植物和真菌的多糖材料也含有非淀粉的多糖。因此,在本发明的用于处理非淀粉多糖的方法中,所述非淀粉多糖可以以植物或源自植物的材料或包含植物或源自植物的材料的形式提供,例如以植物浆体、植物提取物、食品或其成分、织物、纺织品或衣物。本发明的酶组合物能够极度有效地将木质纤维素材料,例如玉米杆或麦秸,水解成单体糖(木质纤维素材料的水解在本文中还被称为木质纤维素材料的糖化),所述单体糖随后可以被转化成有用的产物,如乙醇。因此,在另一方面中,本发明涉及糖化木质纤维素材料的方法,其包括下述步骤
-任选的预处理木质纤维素材料,和
-使木质纤维素材料与根据本发明的酶组合物接触以产生一种或多种糖。本发明的酶组合物可用来进行非常有效的木质纤维素底物的水解。鉴于需要较低量的酶(与当前可得到的产物比较),这在从木质纤维生物质生产燃料乙醇的商业可行方法情形下是非常重要的。另外,目前可获得的具有纤维素酶活性的酶(典型地源自Trichoderma)在嗜温温度(mesophilic temperatures)如45°C到50°C下和pH 5. 0下发挥功能。然而,这可导致降低产率的细菌感染,因此期望在65°C或更高的温度下进行糖化。另外,嗜温温度的使用提高了使用的生物质的粘度,从而限制了使用的干物质含量。另外,使用经酸预处理的生物质时,必须提高pH,使得酶能够糖化生物质中的糖。在商业可行的燃料乙醇工业的情形中,这意味着需要例如氢氧化钠或硫酸钙和生产大量相应的盐,例如在氢氧化钠情况下生产石膏。因此,期望使用能够在PH 4.0或更低的pH下工作的酶进行糖化。而且,如果从编码纤维素酶、半纤维素酶和果胶酶的多核苷酸组中选择的编码至少四种不同酶的多核苷酸是源自Talaromyces菌株,例如源自Talaromyces emersonii菌株的多核苷酸,该水解可尤其在高温下进行。在更高温度下,例如在65°C或更高温度下的木质纤维素底物水解是有利的,因为这(i)降低了细菌感染的风险,并且(ii)导致更不粘稠的生物质浆体。后者的效果是显著的,因为其使得能够更好地掺合酶,导致植物中更高的可加工的干物质,并允许因此实现更高的乙醇浓度。因此,需要使用更少的能量来提高可持续性(sustainability),并且需要更少的发酵过程,从而需要更低的投资。木质纤维素材料的预处理通常在高的温度下发生;如果从编码纤维素酶、半纤维素酶和果胶酶的多核苷酸组中选择的编码至少四种不同酶的多核苷酸是源自Talaromyces菌株,例如源自Talaromyces emersonii菌株的多核苷酸,在添加酶之前,不需要完全将木质纤维素材料冷却至低的温度,比如低于40°C。代替地,酶组合物可例如被添加至具有高至80°C的温度的木质纤维素材料,例如具有在从60至80°C的温度范围中例如在约65°C的木质纤维素材料。这相当大地缩短了糖化木质纤维素材料方法的时间并提供了更为绿色的途径。其原因是在更高温度下添加酶需要较少冷却预处理的木质纤维素材料,这节省了能源并且酶可被更早地添加至木质纤维素材料,这节省了时间。例如,通过本发明的酶组合物水解木质纤维素材料可在至少30°C,例如至少37°C、例如至少40°C、例如至少50°C、例如至少56°C、例如至少60°C、例如至少65°C、例如至少70°C的温度下进行。例如,通过本发明的酶组合物水解木质纤维素材料可在至多100°C,例如至多90°C、例如至多80°C、例如至多70°C的温度下进行。另外,所述水解可以在低pH,例如在pH 4.0或更低的pH下下进行。这是有利的,因为通常用酸预处理生物质。如果随后用于糖化的酶能够在低PH下作用,则用这种方式预处理的生物质不需要进行PH调节。这意味着对例如氢氧化钠或硫酸钙的更低需要,和其中没有废弃盐的方法。这在例如要生产乙醇的方法中是意义重大的,因为在此类方法中要消耗巨大量的材料。这允许进行不需要或需要小的PH调节的根据本发明的方法,即不需要添加酸或碱或添加酸或碱的需要减少。因此,所述方法可以作为零或低废弃物(无或低盐产 生)方法进行和/或作为其中不需要或需要少的无机化学品输入的方法来进行。另外,还表明了使用高干物质含量时,酶组合物能够有效水解生物质。高度期望在例如燃料乙醇生产中使用的酶能够作用于具有高粘度的底物(即高干重组合物),因为这允许实现更高量的终产物,例如燃料乙醇。显著地,在水解反应中可使用高水平的(木质纤维素材料)干物质,进行本发明的方法。因而,可用约5%或更高、约8%或更高、约10%或更高、约15%或更高、约20%或更高、约25%或更高、约30%或更高、约35%或更高或约40%或更高的干物质含量进行本发明。优选地,在所述方法中,木质纤维素材料是果园底料,树丛,磨坊废弃物,城市木材废弃物,市政废弃物,伐木废弃物,森林疏伐废弃物,短期轮种木本作物,工业废弃物,小麦秸,燕麦秸,水稻秸,大麦秸,黑麦秸,亚麻秸,大豆壳,稻壳,水稻秸,玉米谷蛋白饲料,甘蔗,玉米秸杆,玉米杆,玉米芯,玉米壳,芒属植物,甜高粱,油菜茎,大豆茎,牧场草,磨擦禾,狐尾草;甜菜浆,柑橘果实浆,种子壳,纤维素动物粪便,草坪修剪废弃物,棉花,海藻,针叶树,白杨,松树,灌木丛,草,小麦,小麦秸,甘蔗渣,玉米,玉米棒,玉米粒,来自玉米粒的纤维,来自谷物湿磨或干磨的产物和副产物,市政固体废弃物,废纸,庭院废弃物,草本材料,农业残余物,林业残余物,废纸,纸浆,造纸厂残余物,树枝,灌木,甘蔗,能源作物,森林,水果,鲜花,谷物,草,草本作物,树叶,树皮,针叶,原木,根,树苗,灌木丛,柳枝稷,树木,蔬菜,水果皮,藤蔓,甜菜浆,小麦麸皮,燕麦壳,硬木材或软木材,由农业加工产生的有机废弃物材料,林业木材废弃物,或其中任意两种或更多的组合。组合物与底物在任何适当条件下反应。例如,酶可在约25°C、约30°C、约35°C、约 37°C、约 40°C、约 45°C、约 50°C、约 55°C、约 60°C、约 65°C、约 70°C、约 75°C、约 80°C、约85°C、约90°C或更高温度下孵育。即,它们可在从约20°C至约95°C的温度下在例如从低至中等离子强度和/或从低至中性PH的缓冲液中孵育。“中等离子强度”表示对任何单个离子组分而言,缓冲液具有约200毫摩尔(mM)或更少的离子浓度。pH可在从约pH 2. 5、约pH3. O、约 pH 3. 5、约 pH 4. O、约 pH 4. 5、约 pH 5、约 pH 5. 5、约 pH 6、约 pH 6. 5、约 pH 7、约 pH7. 5、约pH 8. 0至约pH 8. 5的范围内。通常,pH范围会从约pH 3. 0到约pH 9。典型地,反应可以在上文定义的低pH条件下进行。因此,可以进行本发明的方法从而不需要调节pH(即调节至更中性的pH)。也就是说,可以使用经酸预处理的原料,因为在添加本发明的酶组合物之前不需要添加例如过氧化钠。可以在液化/水解之前洗涤原料。所述洗涤可以例如用水进行。在这些条件下孵育组合物导致大量糖从木质纤维素材料释放或解离。大量表示至少约20 %、至少约30 %、至少约40 %、至少约50 %、至少约60 %、至少约70 %、至少约80 %、至少约90%、至少约95%或更多的可利用的糖。可以使用涉及用酶或酶混合物孵育的液化/水解或预糖化步骤。所述步骤可以在许多不同的温度下进行,但是优选预糖化在最适合要测 试的酶混合物的温度下,或针对要测试的酶预测的酶最适温度下进行。预处理温度可以在从约10°C到约100°C,约30°C到约80 V,约40 V到约70 V,约50 V到约70 V,优选地约60 V到约70 V,更优选地约65 °C。缺失最适温度数据时,优选首先在37°C下,然后在更高温度如65°C下进行预处理反应。预糖化混合物的pH可以在从约2. 0到约10. 0,但是优选地约3. 0到约5. O。另外,在糖化之前可能不必须调节PH,因为酶组合物典型地适合在本文定义的低pH下使用。液化/水解或预糖化步骤反应可以进行数分钟到数小时,例如从约I小时到约120小时,优选地从约2小时到约48小时,更优选地从约2小时到约24小时,最优选地从约2小时到约6小时。液化/水解可进行数分钟到数小时,例如从约6小时到约168小时,优选地约12小时到约96小时,更优选地约24小时到约72小时,进一步更优选地从约24小时到约48小时。取决于应用,例如当酶或酶组合物用在液化/水解与发酵组合的方法中时,所述方法可作为分开的水解和发酵(SHF)和同时水解和发酵(SSF)进行。在SSF中,预糖化是适当的。SHF和SSF将在下文更详细描述。本发明还涉及将木质纤维素材料转化为有用产物的方法,其包括下述步骤a)预处理一种或多种木质纤维素材料以产生预处理的木质纤维素材料;b)酶处理预处理的木质纤维素材料以产生一种或多种糖;c)将糖转化为一种或多种有用的产物和d)分离一种或多种有用的产物,其中在步骤a)、b)或c)中,使用或添加了本发明的酶组合物。因此,本发明还涉及用于制备发酵产物的方法,所述发酵产物包括氨基酸、维生素、药物、动物饲料补充剂、特种化学品、化学原料、塑料、溶剂、燃料或其他有机聚合物、乳酸、乙醇、燃料乙醇或化学品、塑料、二羧酸(比如琥珀酸、衣康酸、己二酸)、(生物)燃料(包括乙醇、甲醇、丁醇、合成液体燃料和沼气),其中用发酵微生物,优选酵母,发酵根据本发明的方法生产的一种或多种糖,以生产发酵产物。“发酵微生物”表示具有能将一种或多种糖转化为发酵产物的能力的微生物。可以进行此类方法而不需要在所述方法期间调节pH。也就是说,所述方法是可以不添加任何酸或碱而进行的方法。然而,这排除了其中可以添加酸的预处理步骤。关键是本发明的组合物能够在低PH下发挥作用,因此不需要调节经酸预处理的原料的pH,从而可以发生糖化。因此,本发明的方法可以是仅使用有机产物而不需要输入无机化学品的零废弃物方法。优选地,在根据本发明的方法,有用的产物是下述的一种或多种乙醇、丁醇、乳酸、塑料、有机酸、溶剂、动物饲料补充剂、药物、维生素、氨基酸、酶或化学原料。本发明涉及下述组合物,所述组合物包含纤维素水解和/或半纤维素水解酶活性并且具有改性(例如降解)非淀粉的碳水化合物材料的能力。非淀粉的碳水化合物材料是包含一种或多种非淀粉的碳水化合物的材料、由一种或多种非淀粉的碳水化合物组成的材料或基本由一种或多种非淀粉的碳水化合物组成的材料。碳水化合物在本文上下文中包括所有糖,例如多糖、寡
糖、二糖或单糖。本文所述的组合物典型地通过此类材料的化学改性来改性非淀粉的碳水化合物材料。该碳水化合物材料的化学改性可例如通过水解、氧化或其他化学改性(例如通过裂合酶的作用)导致此类材料的降解。适用于被本文所述的组合物改性的非淀粉的碳水化合物是木质纤维素。可以被认为是潜在的可再生原料的、包含不同木质纤维素残基的主要的多糖是纤维素(葡聚糖)、半纤维素(木聚糖、杂木聚糖(heteroxylans)和木葡聚糖(xyloglucans))。另外,一些半纤维素可以作为葡甘露聚糖(glucomannans)存在于例如木材衍生的原料中。这些多糖成为可溶糖(包括单体和多体,例如葡萄糖、纤维二糖、木糖、阿拉伯糖、半乳糖、果糖、甘露糖、 鼠李糖、核糖、半乳糖醛酸、葡糖醛酸和其他己糖和戊糖)的酶促水解发生于共同作用的不同酶的作用下。另外,果胶和其他果胶物质如阿拉伯聚糖(arabinans)可占来自非木本植物组织典型的细胞壁干物质的可观的比例(约四分之一到一半的干物质可以是果胶)。纤维素是由通过¢-1,4键连接的葡萄糖残基组成的线性多糖。纤维素纤维的线性本质以及化学计量的¢-连接的葡萄糖(相对于a)产生比淀粉的高度枝化的a-连接的结构更倾向于链间(interstrand)氢键合的结构。因此,纤维素聚合物与淀粉中存在的纤维相比通常溶解度更小,并且形成更紧密结合的纤维。制备发酵产物的方法可任选地包括回收发酵产物。此类方法可在需氧或厌氧条件下进行。优选地,所述方法在微需氧或氧受限的条件下进行。厌氧发酵方法在本文中被定义为在不存在氧时运行的,或者其中基本不消耗氧,优选地消耗约5或更少、约2. 5或更少、或约lmmol/L/h或更少氧,并且其中有机分子既作为电子供体又作为电子受体的发酵方法。氧受限的发酵方法是其中氧消耗受到从气体到液体的氧转移限制的方法。氧限制程度由进入气流的量和组成以及使用的发酵设备的实际混合/物料转移性质决定。优选地,在氧受限条件下进行的方法中,氧消耗速率至少约5. 5,更优选地至少约6,进一步更优选地至少约7mmol/L/h。制备发酵产物的方法可任选地包括回收发酵产物。缺乏氧时,在糖酵解和生物质形成中产生的NADH不能通过氧化磷酸化被氧化。为解决这个问题,许多微生物使用丙酮酸盐或其衍生物作为电子和氢受体因而产生NAD+。因而,在优选的厌氧发酵方法中,丙酮酸盐被用作电子(和氢受体)并被还原为发酵产物比如乙醇、丁醇、乳酸、3-轻基-丙酸、丙烯酸、乙酸、琥m酸、梓檬酸、苹果酸、富马酸、氨基酸、1,3_丙烷-二醇、乙烯、甘油、¢-内酰胺抗生素和头孢菌素。发酵方法优选地在对细胞而言是最佳的温度下运行。因而,对于大多数酵母或真菌宿主细胞而言,发酵方法在小于约42°C、优选地小于约38°C的温度下进行。对于酵母或丝状真菌宿主细胞而言,发酵方法优选地在低于约35、约33、约30或约28°C的温度且高于约20、约22或约25 °C的温度下进行。
在方法中在木糖和/或葡萄糖上的乙醇产率优选地至少约50、约60、约70、约80、约90、约95或约98%。乙醇产率在本文中定义为理论最大产量的百分比。本发明还涉及用于产生发酵产物的方法。在优选的方法中,细胞发酵木糖和葡萄糖二者,优选地同时发酵,在这种情况下,优选地,使用对葡萄糖抑制不敏感的细胞,以防止二次生长。除了木糖来源作为碳源之外,发酵培养基还包含细胞生长需要的适当成分。用于微生物比如酵母生长的发酵培养基组成是本领域熟知的。发酵方法可以以分批、补料分批或连续模式进行。可应用单独的水解和发酵(SHF)方法或同时糖化和发酵(SSF)方法。这些发酵方法模式的组合对于最佳生产力而言也是可能的。这些方法在下文详细描述。SSF 樽式 对同时糖化和发酵(SSF)的模式而言,液化/水解或预糖化步骤的反应时间取决于实现期望产率(即纤维素成为葡萄糖的转化产率)的时间。这类产率优选地尽可能高,优选地为60%或更多,65%或更多,70%或更多,75%或更多,80%或更多,85%或更多,90%或更多,95%或更多,96%或更多,97%或更多,98%或更多,99%或更多,甚至99. 5%或更多或99. 9%或更多。根据本发明,在SHF模式下实现了非常高的糖浓度,在SSF模式下实现了非常高的产物浓度(例如乙醇)。在SHF操作中,葡萄糖浓度是25g/L或更高,30g/L或更高,35g/L或更高,40g/L或更高,45g/L或更高,50g/L或更高,55g/L或更高,60g/L或更高,65g/L或更高,70g/L或更高,75g/L或更高,80g/L或更高,85g/L或更高,90g/L或更高,95g/L或更高,100g/L或更高,110g/L或更高,120g/L或更高,或者可以例如是25g/L-250g/L,30gl/L-200g/L,40g/L-200g/L,50g/L-200g/L,60g/L-200g/L,70g/L-200g/L,80g/L-200g/L,90g/L,80g/L-200g/LoSSF樽式中的产物浓度在SSF操作中,产物浓度(g/L)取决于生产的葡萄糖量,但因为在SSF中糖被转化成产物,所以这是不可见的,并且糖浓度可以通过与理论最大产率(以gr产物/克葡萄糖计的Yps max)相乘而与潜在的葡萄糖浓度相关。发酵产物的理论最大产率(以gr产物/克葡萄糖计的Yps max)可得自生物化学教科书。对乙醇而言,I摩尔葡萄糖(ISOgr)根据酵母中正常的糖酵解发酵通路产生2摩尔乙醇(=2x46 = 92gr乙醇)。因此,基于葡萄糖的乙醇的理论最大产率为92/180 =0. 511gr乙醇/gr葡萄糖。对丁醇(MW 74gr/摩尔)或异丁醇而言,理论最大产率是每摩尔葡萄糖I摩尔丁醇。因此,(异)丁醇的Yps max = 74/180 = 0. 41 Igr (异)丁醇/gr葡萄糖。对乳酸而言,纯乳酸发酵(homolactic fermentatio)的发酵产率是每摩尔葡萄糖2摩尔乳酸(MW = 90gr/摩尔)。根据所述化学计量法,Yps max = Igr乳酸/gr葡萄糖。对其他发酵产物而言,可以进行类似的计算。SSF 樽式在SSF操作中,产物浓度为25g*Yps g/L/L或更高,30*Yps g/L或更高,35g*Yps/L或更高,40*Yps g/L或更高,45*Yps g/L或更高,50*Yps g/L或更高,55*Yps g/L或更高,60*Yps g/L 或更高,65*Yps g/L 或更高,70*Yps g/L 或更高,75*Yps g/L 或更高,80*Ypsg/L 或更高,85*Yps g/L 或更高,90*Yps g/L 或更高,95*Yps g/L 或更高,100*Yps g/L 或更高,110*Yps g/L或更高,120g/L*Yps或更高,或者可以例如是25*Yps g/L_250*Yps g/L,30*Yps gl/L_200*Yps g/L,40*Yps g/L_200*Yps g/L,50*Yps g/L_200*Yps g/L,60*Ypsg/L_200*Yps g/L,70*Yps g/L_200*Yps g/L,80*Yps g/L_200*Yps g/L,90*Yps g/L,80*Yps g/L_200*Yps g/L。因此,本发明提供了制备发酵产物的方法,所述方法包括a.使用本文所述的方法降解木质纤维素;和b.发酵所得到的材料,从而制备发酵产物。
发酵产物本发明的发酵产物可以是任何有用的产物。在一种实施方式中,其是选自下述组的产物乙醇、n-丁醇、异丁醇、乳酸、3-羟基-丙酸、丙烯酸、乙酸、琥珀酸、延胡索酸、苹果酸、衣康酸、马来酸、柠檬酸、己二酸、氨基酸(比如赖氨酸、甲硫氨酸、色氨酸、苏氨酸和天冬氨酸)、1,3-丙烷-二醇、乙烯、甘油、¢-内酰胺抗生素和头孢菌素、维生素、药物、动物饲料补充剂、特种化学品、化学原料、塑料、溶剂、燃料(包括生物燃料和沼气)或有机聚合物和工业酶(比如蛋白酶、纤维素酶、淀粉酶、葡聚糖酶、乳糖酶、脂肪酶、裂合酶氧化还原酶、转移酶或木聚糖酶)。回收发酵产物
对于回收发酵产物,可以使用现有技术。对于不同的发酵产物,不同的回收方法是适当的。从水性混合物中回收乙醇的现有技术通常使用分馏和吸附技术。例如,蒸馏釜可用来处理含有在水性混合物中的乙醇的发酵产物,以产生富集的含有乙醇的混合物,所述混合物接着经受分馏(例如分馏蒸馏或其他类似技术)。接下来,含有最高浓度的乙醇的馏分可通过吸附器,以从乙醇中去除(如果不是全部的话)大部分剩余的水。本发明将通过下述实施例的方式阐明,但不被这些实施例限制。
实施例实施例I多种 Talaromyces Emersonii 纤维素酶在 AsperRillus NiRer 中的表达该实施例描述了在A. niger WT-1中的T. emersonii CBS 39364纤维二糖水解酶-I (CBHI),T. emersonii CBS 39364 纤维二糖水解酶-II (CBHII),T. emersonii P -葡聚糖酶CEA CBS 39364(EG)和如在GenBank数据库中列出的具有登录号AAL69548的T. emersonii P -葡萄糖苷酶(BG)的克隆和表达。此外,菌株在摇瓶中生长后,将转化体的纤维素酶活性与空菌株的纤维素酶活性比较。T emersonii编码区在表达载体中的克隆通过DNA2.0 (Menlo Park, USA)合成编码 T. emersonii 纤维二糖水解酶-I (CBHI)、T. emersonii 0 -葡聚糖酶CEA(EG)和T. emersonii ¢-葡萄糖苷酶(BG)的多核苷酸(DNA-序列)并作为EcoRI/SnaBI片段克隆进包含包含葡糖淀粉酶(glaA)启动子和终止子序列的 pGBTOP-8 载体(EP 0635574A1),分别得到载体 pGBT0PEBA205、pGBT0PEBA8 和PGBT0PEBA4。为了克隆的目的,葡糖淀粉酶启动子的3’部分的198个核苷酸也与编码序列一起合成。T. emersonii 纤维二糖水解酶-I (CBHI)、T. emersonii beta-葡聚糖酶 CEA(EG)和T. emersonii P -葡萄糖苷酶(BG)的氨基酸序列分别由SEQ ID N0:l、3和5表示。DNA序列分别由SEQ ID N0:2、4和6表示。图I表示载体pGBT0P12内的glaA启动子的控制下的含有编码 T. emersonii CBHI 的 DNA-序列的 pGBT0PEBA205 的图谱。pGBT0PEBA205 对于包含编码T. emersonii EG的DNA-序列的pGBT0PEBA8和包含编码T. emersonii BG的DNA-序列的pGBT0PEBA4而言是代表性的。如在专利W02001/070998A1中描述的,编码T. emersonii纤维二糖水解酶-II (CBHII)的多核苷酸从T. emersonii cDNA文库中获得。图2表示含有载体PGBFINlKffO 9932617 (A2))内的 glaA 启动子的控制下的编码 T. emersonii CBHII 的DNA-序列的pGBFINEBA176的图谱。pGBFINl I载体还含有选择标记物AmdS (EP0758020 (A2),其针对使用乙酰胺作为唯一氮源的能力进行选择。氨基酸序列和核苷酸序列分别由SEQ IDNO 7和8表示。 具有多种纤维素酶的Aspergillus niger的转化Aspergillus niger WT-1 菌株用于转化。Aspergillus niger WT-1 菌株源自在CBS中心保藏的在保藏号CBS 513. 88下的A. niger菌株(Pel et al. , Genomesequencing and analysis of the versatile cell factory Aspergillus niger CBS513. 88. 2007, Nat Biotechnol. 25 :189-90)。如在 EP 0635574(A1)中描述的,其包含通过使用“MARKER-GENE FREE”方法构建的编码葡糖淀粉酶(glaA)的基因缺失。在该专利申请中,其广泛描述了怎样缺失CBS 513. 88基因组中glaA特异性DNA序列。该程序导致MARKER-GENE FREE A glaA重组体A. niger CBS513. 88菌株,其最终不具有任何外源DNA序列。为了将pGBTOPEBA 载体和 pGBFINEBA 176 引入 Aspergillus niger WT-1,基本上如TO 9846772 (A2)和WO 9932617 (A2)中描述的进行了转化和随后的转化体选择。简而言之,在用NotI消化后,载体的线性DNA被分离,以从载体去除E. coli序列。用线性DNA转化细胞后,在含有乙酰胺作为唯一氮源的培养基上选择转化体并进行菌落纯化。如EP 635 574A1中描述的,使用500ml带挡板的摇瓶在振荡孵育器中在34°C下在170rpm下于100ml CSM-MES培养基中培养转化体。在发酵的不同时间点下,收获上清液样品以通过SDS-PAGE分析测定表达。按照制造商的说明书,在NuPAGE 4-12%Bis-Tris (Invitrogen, Breda, The Netherlands)上在还原条件下分离蛋白样品并用 SyproRuby (Invitrogen, Breda, The Netherlands)染色。图3A显示了测试的表达多种纤维素酶的转化体的一个亚组的SDS-PAGE凝胶。通过 pGBT0PEBA4、pGBT0PEBA8、pGBFINEBA176 和 pGBT0PEBA205 编码的蛋白的理论分子量在表I中示出。表I :通过 pGBT0PEBA4,pGBT0PEBA8, pGBFINEBA176 和 pGBT0PEBA205 编码的蛋白
的理论分子量
权利要求
1.宿主细胞,其包含从编码纤维素酶、半纤维素酶和果胶酶的多核苷酸组中选择的至少四种不同的异源多核苷酸,其中所述宿主细胞能产生从纤维素酶、半纤维素酶和果胶酶的组中选择的至少四种不同的酶,其中宿主细胞是丝状真菌并能分泌所述至少四种不同的酶。
2.根据权利要求I的宿主细胞,其中所述宿主细胞是Aspergillus菌株。
3.根据权利要求I或权利要求2的宿主细胞,其中所述宿主细胞是从CBS513. 88及其衍生物中选择的Aspergillus菌株。
4.根据权利要求1-3的任一项的宿主细胞,其中所述至少四种不同的酶是从纤维素酶和半纤维素酶的组中选择的,优选地从纤维素酶组中选择的。
5.根据权利要求1-4的任一项的宿主细胞,其中所述至少四种不同的酶是至少两种不同的纤维二糖水解酶,任选地至少内切葡聚糖酶和至少β -葡萄糖苷酶。
6.根据权利要求1-5的任一项的宿主细胞,其中所述不同的纤维二糖水解酶之一与SEQ ID NO. I具有至少70%同一性且所述不同的纤维二糖水解酶中另一个与SEQ ID NO. 7具有至少70%同一性,其中所述内切葡聚糖酶与SEQ ID NO. 3具有至少70%同一性且其中所述β -葡萄糖苷酶与SEQ ID NO. 5具有至少70%同一性。
7.根据权利要求1-6的任一项的宿主细胞,其中所述至少四种不同的异源多核苷酸全球源自Talaromyces菌株,优选地源自Talaromyces emersonii菌株,更优选地源自Talaromyces emersonii CBS 39364。
8.根据权利要求1-7的任一项的宿主细胞,在16倍或更多倍稀释的上清液或发酵液中具有2WSU或更大的纤维素酶活性。
9.根据权利要求1-8的任一项的宿主细胞,其能在含葡萄糖的培养基中在缺乏纤维素酶诱导物时产生纤维素酶。
10.用于制备根据权利要求1-9的任一项的宿主细胞的方法,其包括下述步骤 (a)提供一个或更多个表达盒,其包含从多核苷酸组(b)中选择的至少四种不同的异源多核苷酸 (b)编码纤维素酶、半纤维素酶和果胶酶的多核苷酸和表达这些多核苷酸需要的控制序列 (C)提供选择性标记物 (d)用所述一个或多个表达盒和来自步骤(b)的选择性标记物转化细胞 (e)选择因而形成的能产生通过至少四种不同的异源多核苷酸编码的至少四种不同的纤维素酶、半纤维素酶和/或果胶酶的宿主细胞。
11.酶组合物,其包含通过根据权利要求任一项1-9的宿主细胞产生的至少四种不同的纤维素酶、半纤维素酶和/或果胶酶。
12.用于生产包含至少四种不同的纤维素酶、半纤维素酶和/或果胶酶的酶组合物的方法,所述方法包括下述步骤 (a)提供权利要求1-9的任一项的宿主细胞 (b)允许至少四种不同的纤维素酶、半纤维素酶和/或果胶酶经由所述宿主细胞生产并分泌,和 (c)任选的回收因此获得的酶组合物。
13.通过权利要求12的方法可获得的酶组合物。
14.用于糖化木质纤维素材料的方法,其包括下述步骤 -任选预处理木质纤维素材料,和 -使木质纤维素材料与权利要求11或权利要求13的酶组合物接触以产生一种或多种糖。
15.制备发酵产物的方法,所述发酵产物包括氨基酸、维生素、药物、动物饲料补充剂、特种化学品、化学原料、塑料、溶剂、燃料或其他有机聚合物、乳酸、乙醇、燃料乙醇或化学品、塑料、琥珀酸、衣康酸、己二酸、包括乙醇、甲醇、丁醇、合成液体燃料和沼气的(生物)燃料,其中用发酵微生物,优选酵母,发酵根据权利要求14的方法产生的一种或多种糖,以生产所述发酵产物。
全文摘要
本发明涉及宿主细胞,其包含从编码纤维素酶、半纤维素酶和果胶酶的多核苷酸组中选择的至少四种不同的异源多核苷酸,其中宿主细胞能产生从纤维素酶、半纤维素酶和果胶酶的组中选择的至少四种不同的酶,其中宿主细胞是丝状真菌并能分泌所述至少四种不同的酶。该宿主细胞可适用于生产可在纤维素材料的糖化方法中使用的酶组合物。
文档编号C12N1/15GK102762727SQ201180009426
公开日2012年10月31日 申请日期2011年2月11日 优先权日2010年2月11日
发明者埃里克·皮特·洛斯, 玛格特·伊丽莎白·弗兰克希斯·休恩瓦尔德-贝格曼斯, 科尼利斯·玛丽亚·雅各布斯·沙吉, 罗波图斯·安东尼厄斯·戴维尔德 申请人:帝斯曼知识产权资产管理有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1