具有纤维素分解增强活性的多肽以及编码它们的多核苷酸的制作方法

文档序号:16446920发布日期:2019-01-02 21:27阅读:412来源:国知局

本申请包括一个计算机可读形式的序列表,将其通过引用结合在此。

发明背景

发明领域

本发明涉及具有纤维素分解增强活性、催化结构域、和纤维素结合结构域的多肽,以及编码这些多肽、催化结构域、和纤维素结合结构域的多核苷酸。本发明还涉及包括这些多核苷酸的核酸构建体、载体、和宿主细胞,以及生产和使用这些多肽、催化结构域和纤维素结合结构域的方法。

相关技术说明

纤维素是单糖葡萄糖通过β-1,4-键共价连接的一种聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。内切葡聚糖酶在任意位置消化纤维素聚合物,使其打开而被纤维二糖水解酶攻击。纤维二糖水解酶从纤维素聚合物的末端顺序地释放纤维二糖分子。纤维二糖是葡萄糖的一种水溶性β-1,4-连接二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。一旦将纤维素转变成葡萄糖,就可容易通过酵母将葡萄糖发酵成乙醇。

将木质纤维素原料转化成乙醇具有如下优点,即易于获得大量原料、避免燃烧或填埋材料的期望性、以及乙醇燃料的清洁性。现在认为木材、农业残余物、草本作物、和城市固体废物是生产乙醇的原料。这些材料主要由纤维素、半纤维素和木质素组成。

WO 2005/074647、WO 2008/148131、以及WO 2011/035027披露了来自土生梭孢壳霉(Thielavia terrestris)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2005/074656和WO 2010/065830披露了来自金黄色嗜热子囊菌(Thermoascus aurantiacus)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2007/089290和WO 2012/149344披露了来自里氏木霉(Trichoderma reesei)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2009/085935、WO 2009/085859、WO 2009/085864、以及WO 2009/085868披露了来自嗜热毁丝霉(Myceliophthora thermophila)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2010/138754披露了来自烟曲霉(Aspergillus fumigatus)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2011/005867披露了来自嗜松青霉(Penicillium pinophilum)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2011/039319披露了来自嗜热子囊菌属物种(Thermoascus sp)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2011/041397披露了来自青霉属物种(Penicillium sp)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2011/041504披露了来自甲壳嗜热子囊菌的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2012/030799披露了来自棘孢曲霉(Aspergillus aculeatus)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2012/113340披露了来自疏棉状嗜热丝孢菌(Thermomyces lanuginosus)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2012/122477披露了来自Aurantiporus alborubescens、褐孢长毛盘菌(Trichophaea saccata)、以及托姆青霉(Penicillium thomii)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2012/135659披露了来自柄篮状菌(Talaromyces stipitatus)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2012/146171披露了来自特异腐质霉(Humicola insolens)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2012/101206披露了来自樟绒枝霉(Malbranchea cinnamomea)、Talaromyces leycettanus、以及嗜热毛壳菌(Chaetomium thermophilum)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2013/043910披露了来自梭孢端梗霉(Acrophialophora fusispora)以及瘤孢棒囊孢壳(Corynascus sepedonium)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2008/151043和WO 2012/122518披露了通过向包含具有纤维素分解增强活性的GH61多肽的组合物中添加二价金属阳离子来增加该多肽的活性的方法。

本领域需要新的酶以增加效率并且为纤维素材料的糖化提供成本有效的酶溶液。

本发明提供了具有纤维素分解增强活性的GH61多肽和编码这些多肽的多核苷酸。

发明概述

本发明涉及具有纤维素分解增强活性的分离的多肽,这些多肽选自下组,该组由以下各项组成:

(a)与SEQ ID NO:2的成熟多肽具有至少71%序列一致性或与SEQ ID NO:4的成熟多肽具有至少75%序列一致性的一种多肽;

(b)由以下多核苷酸编码的一种多肽,该多核苷酸在至少高严谨度条件下与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列、或SEQ ID NO:3或其全长互补体杂交;

(c)由以下多核苷酸编码的一种多肽,该多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少71%序列一致性,或与SEQ ID NO:3的成熟多肽编码序列具有至少75%序列一致性;

(d)SEQ ID NO:2或SEQ ID NO:4的成熟多肽的一种变体,该变体在一个或多个(例如,若干个)位置处包括一个取代、缺失和/或插入;以及

(e)(a)、(b)、(c)或(d)的多肽的一个片段,该片段具有纤维素分解增强活性。

本发明还涉及包括选自下组的催化结构域的分离的多肽,该组由以下各项组成:

(a)与SEQ ID NO:2的氨基酸26到250具有至少71%序列一致性,或与SEQ ID NO:4的氨基酸23到253具有至少83%序列一致性的一个催化结构域;

(b)由以下多核苷酸编码的一个催化结构域,该多核苷酸在至少高严谨度条件下与SEQ ID NO:1的核苷酸76至806或其cDNA序列杂交,或与SEQ ID NO:3的核苷酸67至759或其全长互补体杂交;

(c)由以下多核苷酸编码的一个催化结构域,该多核苷酸与SEQ ID NO:1的核苷酸76至806或其cDNA序列具有至少71%序列一致性,或与SEQ ID NO:3的核苷酸67至759具有至少83%序列一致性;

(d)SEQ ID NO:2的氨基酸26到250或SEQ ID NO:4的氨基酸23到253的一种变体,该变体在一个或多个(例如,若干个)位置处包含一个取代、缺失和/或插入;以及

(e)(a)、(b)、(c)、或(d)的催化结构域的一个片段,该片段具有纤维素分解增强活性。

本发明还涉及包括选自下组的纤维素结合结构域的分离的多肽,该组由以下各项组成:

(a)与SEQ ID NO:2的氨基酸317到378具有至少60%序列一致性,或与SEQ ID NO:4的氨基酸357到394具有至少85%序列一致性的一个纤维素结合结构域;

(b)由以下多核苷酸编码的一个纤维素结合结构域,该多核苷酸在至少高严谨度条件下与SEQ ID NO:1的核苷酸1005至1278或其cDNA序列,或SEQ ID NO:3的核苷酸1069至1182或其全长互补体杂交;

(c)由以下多核苷酸编码的一个纤维素结合结构域,该多核苷酸与SEQ ID NO:1的核苷酸1005至1278或其cDNA序列具有至少60%序列一致性,或与SEQ ID NO:3的核苷酸1069至1182具有至少85%序列一致性;

(d)SEQ ID NO:2的氨基酸317到378或SEQ ID NO:4的氨基酸357到394的一种变体,该变体在一个或多个(例如,若干个)位置处包含一个取代、缺失和/或插入;以及

(e)(a)、(b)、(c)、或(d)的纤维素结合结构域的一个片段,该片段具有结合活性。

本发明还涉及编码本发明多肽的分离的多核苷酸;涉及包括这些多核苷酸的核酸构建体、重组表达载体、以及重组宿主细胞;以及产生这些多肽的方法。

本发明还涉及用于降解纤维素材料的方法,这些方法包括:在本发明的具有纤维素分解增强活性的多肽的存在下,用一种酶组合物处理该纤维素材料。

本发明还涉及产生发酵产物的方法,包括:(a)在本发明的具有纤维素分解增强活性的多肽的存在下,用一种酶组合物糖化纤维素材料;(b)用一种或多种(例如,若干种)发酵微生物发酵该糖化的纤维素材料,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。

本发明还涉及发酵一种纤维素材料的方法,这些方法包括:用一种或多种(例如,若干种)发酵微生物发酵该纤维素材料,其中在本发明的具有纤维素分解增强活性的多肽的存在下用一种酶组合物使该纤维素材料糖化。

本发明还涉及一种编码信号肽的分离的多核苷酸,该信号肽包括SEQ ID NO:2的氨基酸1至25或SEQ ID NO:4的氨基酸1至22或由其组成,该信号肽被可操作地连接至编码一种蛋白质的基因上,其中该蛋白质对该信号肽而言是外源的;包括这些多核苷酸的核酸构建体、表达载体、以及重组宿主细胞;以及生产一种蛋白质的方法。

附图简要说明

图1显示丝衣霉状篮状菌P24GAB GH61多肽对通过一种纤维素分解酶组合物进行的碾磨的未洗涤的PCS的水解的影响。

图2显示丝衣霉状篮状菌P24GEH GH61多肽对通过一种纤维素分解酶组合物进行的碾磨的未洗涤的PCS的水解的影响。

定义

乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”的意思是一种羧酸酯酶(EC 3.1.1.72),其催化乙酰基自聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、α-萘基乙酸酯、和对硝基苯基乙酸酯的水解。出于本发明的目的,在含有0.01%TWEENTM20(聚氧乙烯脱水山梨糖醇单月桂酸酯)的50mM乙酸钠(pH 5.0)中使用0.5mM乙酸对硝基苯酯作为底物来测定乙酰木聚糖酯酶活性。一个单位的乙酰木聚糖酯酶被定义为,在pH 5,25℃,每分钟能够释放1μmol对硝基酚根阴离子的酶的量。

等位基因变体:术语“等位基因变体”意指占据同一染色体基因座的基因的两种或更多种可替代形式中的任一种。等位基因变异由突变天然产生,并且可以导致群体内的多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。

α-L-阿拉伯呋喃糖苷酶:术语“α-L-阿拉伯呋喃糖苷酶”意指一种α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC 3.2.1.55),其催化α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶对α-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)-键的α-L-阿拉伯聚糖、阿拉伯糖基木聚糖、以及阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶还被称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶、或α-L-阿拉伯聚糖酶。出于本发明的目的,使用每ml的100mM乙酸钠(pH 5)中5mg的中等粘度小麦阿拉伯糖基木聚糖(麦格酶国际爱尔兰股份有限公司(Megazyme International Ireland,Ltd.),爱尔兰威克洛郡布瑞公司(Bray,Co.Wicklow,Ireland)以总体积200μl在40℃下持续30分钟,接着通过HPX-87H柱色谱(伯乐实验室有限公司(Bio-Rad Laboratories,Inc.),赫拉克勒斯,加利福尼亚州,美国)进行阿拉伯糖分析来测定α-L-阿拉伯呋喃糖苷酶活性。

α-葡糖醛酸糖苷酶:术语“α-葡糖醛酸糖苷酶”是指可催化α-D-葡萄糖苷酸水解成为D-葡萄糖醛酸酯和醇的一种α-D-葡萄糖苷酸葡萄糖醛酸水解酶(EC 3.2.1.139)。出于本发明的目的,根据德弗里斯(de Vries),1998,细菌学杂志(J.Bacteriol.)180:243-249来测定α-葡糖醛酸糖苷酶活性。一个单位的α-葡糖醛酸糖苷酶等于能够在pH 5、40℃下每分钟释放1微摩尔的葡糖醛酸或4-O-甲基葡糖醛酸的酶的量。

β-葡糖苷酶:术语“β-葡糖苷酶”意指一种β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化末端非还原性β-D-葡萄糖残基的水解,并释放β-D-葡萄糖。出于本发明的目的,根据文丘里(Venturi)等人,2002,基础微生物学杂志(J.Basic Microbiol.)42:55-66的程序使用对硝基苯基-β-D-吡喃葡萄糖苷作为底物来测定β-葡糖苷酶活性。一个单位的β-葡糖苷酶被定义为在37℃、pH 5.0下,在100mM琥珀酸,100mM HEPES,100mM CHES,100mM CABS,1mM CaCl2,150mM KCl,0.01%X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)中从作为底物的1mM对硝基苯基-β-D-吡喃葡萄糖苷每分钟产生1.0微摩尔的对硝基苯酚阴离子。

β-木糖苷酶:术语“β-木糖苷酶”是指催化短β-(1→4)-低聚木糖的外切水解,以从非还原末端除去连续的D-木糖残基的β-D-木糖苷木糖苷酶(E.C.3.2.1.37)。为了本发明的目的,用1mM对硝基苯基-β-D-木糖苷作为底物,在含有0.01%20的100mM柠檬酸钠(pH5,40℃)中,对β-木糖苷酶的活性进行测定。一个单位的β-木糖苷酶定义为在40℃、pH 5下,在含有0.01%20的100mM柠檬酸钠中从1mM对硝基苯基-β-D-木糖苷每分钟产生1.0微摩尔的对硝基酚根阴离子。

碳水化合物结合结构域:术语“碳水化合物结合结构域”是指介导酶结合至纤维素底物的非晶区域的酶的区域。碳水化合物结合结构域(CBD)典型地发现于酶的N-末端处或C-末端的端点处。术语“碳水化物结合结构域”在此还称为“纤维素结合结构域”。

催化结构域:术语“催化结构域”意思指一种酶的包含该酶的催化机器的区域。

cDNA:术语“cDNA”是指可以通过从得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工,包括剪接。

纤维二糖水解酶:术语“纤维二糖水解酶”意指一种1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91和E.C.3.2.1.176),其催化纤维素、纤维寡糖、或任何含有β-1,4-连接葡萄糖的聚合物中的1,4-β-D-糖苷键的水解,从而从链的还原性末端(纤维二糖水解酶I)或非还原性末端(纤维二糖水解酶II)释放纤维二糖(泰里(Teeri),1997,生物技术趋势(Trends in Biotechnology)15:160-167;泰里等人,1998,生物化学学会会刊(Biochem.Soc.Trans.)26:173-178)。根据里弗(Lever)等人,1972,分析生物化学(Anal.Biochem.)47:273-279;范·帝伯赫(van Tilbeurgh)等人,1982,欧洲生化学会联合会快报(FEBS Letters),149:152-156;范·帝伯赫和克莱森斯(Claeyssens),1985,欧洲生化学会联合会快报,187:283-288;以及汤美(Tomme)等人,1988,欧洲生物化学杂志(Eur.J.Biochem.)170:575-581所描述的程序来测定纤维二糖水解酶活性。在本发明中,汤美等人的方法可以用于测定纤维二糖水解酶活性。

纤维素分解酶或纤维素酶:术语“纤维素分解酶”或“纤维素酶”意指一种或多种(例如,若干种)水解纤维素材料的酶。这类酶包括一种或多种内切葡聚糖酶、一种或多种纤维二糖水解酶、一种或多种β-葡糖苷酶、或它们的组合。用于测量纤维素分解酶活性的两种基本方法包括:(1)测定总纤维素分解酶活性,以及(2)测定个体纤维素分解酶活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),如在张(Zhang)等人,2006,生物技术进展(Biotechnology Advances)24:452-481中所述的。可使用不溶性底物,包括沃特曼(Whatman)№1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、预处理的木质纤维素等,测量总纤维素分解酶活性。最常用的总纤维素分解活性测定是使用沃特曼№1滤纸作为底物的滤纸测定。该测定法是由国际纯粹与应用化学联合会(IUPAC)建立的(高斯(Ghose),1987,纯粹与应用化学(Pure Appl.Chem.)59:257-68)。

出于本发明的目的,纤维素分解酶活性通过测量在以下条件下与未添加纤维素分解酶蛋白的对照水解相比较,在由一种或多种纤维素分解酶进行的纤维素材料水解的过程中糖的产生/释放的增加来测定:1-50mg的纤维素分解酶蛋白/g于经预处理的玉米秸秆(PCS)中的纤维素(或其他预处理的纤维素材料)在合适的温度(如40℃-80℃,例如50℃、55℃、60℃、65℃、或70℃)、以及合适的pH(如4-9,例如,5.0、5.5、6.0、6.5、或7.0)下持续3-7日。典型条件为:1ml反应,洗涤或未洗涤的PCS,5%不溶性固形物(干重),50mM乙酸钠(pH 5),1mM MnSO4,50℃、55℃、或60℃,72小时,通过HPX-87H柱(伯乐实验室有限公司,美国加州赫拉克勒斯)进行的糖分析。

纤维素材料:术语“纤维素材料”是指含纤维素的任何材料。生物质的初生细胞壁中的主要多糖是纤维素,第二丰富的是半纤维素,而第三丰富的是果胶。细胞停止生长后产生的次生细胞壁也包含多糖,并且它通过与半纤维素共价交联的聚合木质素得到强化。纤维素是脱水纤维二糖的均聚物,因此是一种线性β-(l-4)-D-葡聚糖,而半纤维素包括多种化合物,如具有一系列取代基以复杂支链结构存在的木聚糖、木葡聚糖、阿拉伯糖基木聚糖、以及甘露聚糖。尽管纤维素一般为多态的,但发现其在植物组织中主要以平行葡聚糖链的不溶性晶体基质存在。半纤维素通常氢键合至纤维素以及其他半纤维素,这有助于稳定细胞壁基质。

纤维素通常见于例如植物的茎、叶、壳、皮、以及穗轴,或树的叶、枝、以及木材中。纤维素材料可以是但不限于农业废弃物、草本材料(包括能源作物)、城市固体废物、纸浆和造纸厂废弃物、废纸、和木材(包括林业废弃物)(参见例如维塞劳格尔(Wiselogel)等人,1995,生物乙醇手册(Handbook on Bioethanol)(查尔斯E.怀曼(Charles E.Wyman),编著),pp.105-118,泰勒-弗朗西斯出版集团(Taylor&Francis),华盛顿特区;怀曼(Wyman),1994,生物资源技术(Bioresource Technology)50:3-16;林德(Lynd),1990,应用生物化学与生物技术(Applied Biochemistry and Biotechnology)24/25:695-719;莫西尔(Mosier)等人,1999,木质纤维素的生物转化的最近进展,生物化学工程/生物技术进展(Advances in Biochemical Engineering/Biotechnology),斯卡皮尔(T.Scheper),总编辑,第65卷,pp.23-40,施普林格出版公司(Springer-Verlag),纽约)。在此应该理解的是,纤维素可以处于木素纤维素,在混合基质中包含木质素、纤维素、和半纤维素的植物细胞壁材料的形式。在一个方面中,该纤维素材料是任何生物质材料。在另一个方面中,该纤维素材料是木质纤维素,该木质纤维素包括纤维素、半纤维素、以及木质素。

在一个实施例中,该纤维素材料是农业废弃物、草本材料(包括能源作物)、城市固体废物、纸浆和造纸厂废弃物、废纸、或木材(包括林业废弃物)。

在另一个实施例中,该纤维素材料是芦竹、甘蔗渣、竹子、玉米芯、玉米纤维、玉米秸秆、芒属、稻秸、柳枝稷或麦秸。

在另一个实施例中,该纤维素材料是山杨、桉树、冷杉、松树、白杨、云杉、或柳树。

在另一个实施例中,该纤维素材料是海藻纤维素、细菌纤维素、棉短绒、滤纸、微晶纤维素(例如)、或经磷酸处理的纤维素。

在另一个实施例中,纤维素材料是一种水生生物质。如在此所用的,术语“水生生物质(Aquatic Biomass)”是指在水生环境中通过光合作用过程产生的生物质。水生生物质可以是藻类、挺水植物、浮叶植物、或沉水植物。

纤维素材料可以按原样使用或可以使用本领域已知的常规方法进行预处理,如在此所描述。在一个优选方面,纤维素材料进行了预处理。

编码序列:术语“编码序列”意指直接指定一个多肽的氨基酸序列的多核苷酸。编码序列的边界一般由一个开放阅读框架决定,该开放阅读框架从一个起始密码子(如ATG、GTG或TTG)开始并且以一个终止密码子(如TAA、TAG或TGA)结束。编码序列可以是一种基因组DNA、cDNA、合成DNA或其组合。

控制序列:术语“控制序列”意指对于表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码一种多肽的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。

内切葡聚糖酶:术语“内切葡聚糖酶”意指一种4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键和混合β-1,3-1,4葡聚糖如谷类β-D-葡聚糖或木葡聚糖以及含有纤维素组分的其他植物材料中的β-1,4键的内切水解。可以通过测量底物粘度的降低或通过还原糖测定所确定的还原性末端的增加来确定内切葡聚糖酶活性(张(Zhang)等人,2006,生物技术进展(Biotechnology Advances)24:452-481)。出于本发明的目的,根据高斯,1987,纯粹与应用化学59:257-268的程序,在pH 5、40℃下,使用羧甲基纤维素(CMC)作为底物,确定内切葡聚糖酶活性。

表达:术语“表达”包括产生多肽涉及的任何步骤,包括但不局限于:转录、转录后修饰、翻译、翻译后修饰、和分泌。

表达载体:术语“表达载体”意指线性或环状DNA分子,该分子包括编码多肽的多核苷酸并且该多核苷酸可操作地与提供用于其表达的控制序列相连接。

家族61的糖苷水解酶:术语“家族61的糖苷水解酶”或“家族GH61”或“GH61”是指属于根据亨利萨塔B.(Henrissat B.),1991,生物化学期刊(Biochem.J.)280:309-316,以及亨利萨塔B.和巴洛赫A.(Bairoch A.),1996,生物化学期刊,316:695-696的糖苷水解酶家族61的一种多肽。这个家族中的酶最初基于在一个家族成员中测量到的非常弱的内切-1,4-β-D葡聚糖酶活性而被分类为糖苷水解酶家族。现在GH61多肽被归类为溶解性多糖单加氧酶(lytic polysaccharide monooxygenase)(昆兰(Quinlan)等人,2011,美国科学院院刊(Proc.Natl.Acad.Sci.USA)208:15079-15084;菲利普斯(Phillips)等人,2011,ACS化学生物学(ACS Chem.Biol.)6:1399-1406;林(Lin)等人,2012,结构(Structure)20:1051-1061)并放入一个认定为“辅助活性(Auxiliary Activity)9”或“AA9”的新家族。

阿魏酸酯酶:术语“阿魏酸酯酶”意指4-羟基-3-甲氧基肉桂酰基-糖水解酶(EC 3.1.1.73),其催化4-羟基-3-甲氧基肉桂酰基(阿魏酰基)基团从酯化的糖(其在天然生物质底物中通常为阿拉伯糖)的水解,以产生阿魏酸酯(4-羟基-3-甲氧基肉桂酸酯)。阿魏酸酯酶(FAE)也被称为阿魏酸酯酶(ferulic acid esterase)、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I、或FAE-II。出于本发明的目的,在50mM乙酸钠(pH 5.0)中使用0.5mM阿魏酸对硝基苯酯作为底物来测定阿魏酸酯酶活性。一个单位的阿魏酸酯酶等于,在pH 5,25℃,每分钟能够释放1μmol的对硝基酚根阴离子的酶的量。

片段:术语“片段”意指在一种成熟多肽的氨基和/或羧基末端缺失一个或多个(例如若干个)氨基酸的一种多肽,其中该片段具有纤维素分解增强活性。在一个方面中,一个片段包含SEQ ID NO:2的至少320个氨基酸残基,例如至少340个氨基酸残基或至少360个氨基酸残基。在另一个方面,一个片段含有SEQ ID NO:4的至少320个氨基酸残基,例如至少340个氨基酸残基或至少360个氨基酸残基。

半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”是指可对半纤维素材料进行水解的一种或多种(例如,若干种)酶。参见例如,沙鲁姆(Shallom)和沙哈姆(Shoham),微生物学当前观点(Current Opinion In Microbiology),2003,6(3):219-228)。半纤维素酶是在植物生物质的降解中的关键组分。半纤维素酶的实例包括但不局限于乙酰基甘露聚糖酯酶、乙酰基木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、以及木糖苷酶。这些酶的底物-半纤维素-是支链和直链多糖的异质性组,其可通过氢键与植物细胞壁中的纤维素微纤维相结合,交联成坚固的网络。半纤维素还共价附接至木质素,从而与纤维素一起形成高度复杂的结构。半纤维素的可变结构和组织要求许多酶的协同作用以使其完全降解。半纤维素酶的催化模块是水解糖苷键的糖苷水解酶(GH),或是水解乙酸或阿魏酸侧基的酯键的碳水化合物酯酶(CE)。这些催化模块基于它们一级序列的同源性,可以被分配到GH和CE家族中。具有总体相似的折叠的一些家族可以进一步被分组为以字母标记的氏族(例如,GH-A)。这些和其他碳水化合物活性酶的最具信息性和最新的分类可在碳水化合物活性酶(Carbohydrate-Active Enzymes)(CAZy)数据库中获得。根据高斯(Ghose)和比赛亚(Bisaria),1987,纯粹与应用化学(Pure&AppI.Chem.)59:1739-1752,在合适的温度,例如,40℃-80℃,例如50℃、55℃、60℃、65℃、或70℃,以及合适的pH例如4-9,例如5.0、5.5、6.0、6.5、或7.0,可以测量半纤维素分解酶活性。

高严谨度条件:术语“高严谨度条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在65℃下洗涤三次,每次15分钟。

宿主细胞:术语“宿主细胞”意指任何细胞类型,该细胞类型对于用包含本发明的多核苷酸的核酸构建体或表达载体进行转化、转染、转导等是易感的。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。

分离的:术语“分离的”意思指处于自然界中不存在的形式或环境中的一种物质。分离的物质的非限制性实例包括:(1)任何非天然存在的物质;(2)至少部分地从与其天然相关联的一种或多种或所有天然存在的成分中去除的任何物质,包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子;(3)相对于在自然界中发现的那种物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关联的其他组分增加该物质的量(例如,宿主细胞中的重组体产量;编码该物质的基因的多个拷贝;以及比与编码该物质的基因天然相关联的启动子更强的启动子的使用)而修饰的任何物质。

低严谨度条件:术语“低严谨度条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在50℃下洗涤三次,每次15分钟。

成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。在一方面,基于预测SEQ ID NO:2的氨基酸1至25是信号肽的SignaIP程序(尼尔森(Nielsen)等人,1997,蛋白质工程(Protein Engineering)10:1-6),成熟多肽是SEQ ID NO:2(P24GAB)的氨基酸26至408。在另一个方面中,基于预测SEQ ID NO:4的氨基酸1至22是信号肽的SignalP程序,成熟多肽是SEQ ID NO:4(P24GEH)的氨基酸23至395。本领域中已知的是,一个宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)的混合物。

成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有纤维素分解增强活性的成熟多肽的多核苷酸。在一方面,基于预测SEQ ID NO:1的核苷酸1至75编码信号肽的SignalP程序(尼尔森等人,1997,同上),成熟多肽编码序列是SEQ ID NO:1(D82Q6Q)的核苷酸76至1368或其cDNA序列。在另一个方面中,基于预测SEQ ID NO:3的核苷酸1至66编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:3(D82QGR)的核苷酸67至1185。

中严谨度条件:术语“中严谨度条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在55℃下洗涤三次,每次15分钟。

中-高严谨度条件:术语“中-高严谨度条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在60℃下洗涤三次,每次15分钟。

核酸构建体:术语“核酸构建体”意指单-链或双链的一种核酸分子,该核酸分子是从天然存在的基因中分离的,或者以一种本来不存在于自然界中的方式被修饰成含有核酸的区段,或者是合成的,该核酸分子包含一个或多个控制序列。

可操作地连接:术语“可操作地连接”意指如下的构造,其中,控制序列相对于多核苷酸的编码序列安置在适当位置处,从而使得该控制序列指导该编码序列的表达。

具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强活性的多肽”意指促进具有纤维素分解活性的酶对纤维素材料的水解的增强的GH61多肽。出于本发明的目的,纤维素分解增强活性通过测量来自由纤维素分解酶在以下条件下水解纤维素材料的还原糖的增加或纤维二糖与葡萄糖总量的增加来测定:1-50mg总蛋白质/g于预处理的玉米秸秆(PCS)中的纤维素,其中总蛋白质由50%w/w-99.5%w/w纤维素分解酶蛋白以及0.5%w/w-50%w/w具有纤维素分解增强活性的多肽的蛋白质组成,在合适的温度(如40℃-80℃,例如,50℃、55℃、60℃、65℃、或70℃)以及合适的pH(如4-9,例如,4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、或8.5)下持续1-7天,与用相等的总蛋白质负载量而无纤维素分解增强活性(1-50mg纤维素分解蛋白/g于PCS中的纤维素)的对照水解相比较。

GH61多肽增强活性可使用以下来确定:使用在总蛋白质重量的2%-3%的米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或总蛋白质重量的2%-3%的烟曲霉β-葡糖苷酶(如WO 02/095014中所描述在米曲霉中重组产生)的纤维素酶蛋白负载量存在的情况下1.5L(诺维信A/S),丹麦巴格斯瓦尔德(Bagsvaerd,Denmark))的混合物作为纤维素分解活性的来源。

GH61多肽增强活性还可通过以下来确定:在40℃下将GH61多肽与0.5%磷酸溶胀纤维素(PASC)、100mM乙酸钠(pH 5)、1mM MnSO4、0.1%没食子酸、0.025mg/ml的烟曲霉β-葡糖苷酶、以及0.01%X-100一起孵育24-96小时,接着测定从PASC释放的葡萄糖

还可以根据WO 2013/028928测定高温组合物的GH61多肽增强活性。

可替代地,纤维素分解增强活性还可根据如此处所述的实例5来确定。

具有纤维素分解增强活性的GH61多肽通过将达到相同的水解程度所需要的纤维素分解酶的量降低优选至少1.01倍,例如,至少1.05倍、至少1.10倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、或至少20倍,来增强由具有纤维素分解活性的酶催化的纤维素材料的水解。

本发明的GH61多肽具有SEQ ID NO:2或SEQ ID NO:4的成熟多肽的至少20%、例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、以及至少100%的纤维素分解增强活性。

预处理的玉米秸杆:术语“预处理的玉米秸杆”或“PCS”意指通过热和稀硫酸处理、碱预处理、中性预处理、或本领域已知的任何预处理从玉米秸杆得到的纤维素材料。

序列一致性:两个氨基酸序列之间或者两个核苷酸序列之间的关联度通过参数“序列一致性”来描述。

出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件(The European Molecular Biology Open Software Suite),赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选3.0.0、5.0.0版或更新版本)的尼德尔(Needle)程序中所实施的尼德尔曼-翁施(Needleman-Wunsch)算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来确定两个氨基酸序列之间的序列一致性。使用的这些参数是空位开放罚分10、空位延伸罚分0.5,以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。尼德尔标注的“最长的一致性”的输出(使用-非简化选项获得)被用作百分比一致性,并且如下计算:

((一致的残基X 100)/(比对长度-比对中的空位总数)

出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,同上)(优选3.0.0、5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼和翁施,1970,同上)来确定两个脱氧核糖核苷酸序列之间的序列一致性。使用的这些参数是空位开放罚分10、空位延伸罚分0.5以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。尼德尔标注的“最长的一致性”的输出(使用-非简化选项获得)被用作百分比一致性,并且如下计算:

(一致的脱氧核糖核苷酸X 100)/(比对长度-比对中的空位总数)

子序列:术语“子序列”意指使一个或多个(例如,若干个)核苷酸从成熟多肽编码序列的5'端和/或3'端缺失的多核苷酸;其中该子序列编码具有纤维素分解增强活性的片段。在一个方面中,子序列包含SEQ ID NO:1的至少960个核苷酸,例如至少1020个核苷酸或至少1080个核苷酸。在另一个方面中,子序列包含SEQ ID NO:3的至少960个核苷酸,例如至少1020个核苷酸或至少1080个核苷酸。

变体:术语“变体”意指在一个或多个(例如若干个)位置上包含改变,即取代、插入、和/或缺失的具有纤维素分解增强活性的多肽。取代意指用一个不同氨基酸置换占用一个位置的氨基酸;缺失意指去除占据一个位置的氨基酸;并且插入意指在邻接并且紧随占据一个位置的氨基酸之后添加一个氨基酸。

非常高严谨度条件:术语“非常高严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在70℃下洗涤三次,每次15分钟。

非常低严谨度条件:术语“非常低严谨度条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在45℃下洗涤三次,每次15分钟。

含有木聚糖的材料:术语“含有木聚糖的材料”意指包含含有β-(1-4)连接的木糖残基主链的植物细胞壁多糖的任何材料。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖主链的杂聚物,其通过短的碳水化合物链分支。它们包括D-葡糖醛酸或其4-O-甲基醚、L-阿拉伯糖、和/或不同的低聚糖,这些低聚糖由D-木糖、L-阿拉伯糖、D-或L-半乳糖、以及D-葡萄糖构成。可以将木聚糖类型的多糖分成同源木聚糖(homoxylan)和异源木聚糖(heteroxylan),包括葡糖醛酸木聚糖、(阿拉伯糖)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯糖基木聚糖、阿拉伯糖基木聚糖、以及复杂的异源木聚糖。参见,例如,埃伯林格罗瓦(Ebringerova)等人,2005,聚合物科学进展(Adv.Polym.Sci.)186:1–67。

在本发明的方法中,可以使用含有木聚糖的任何材料。在一个优选方面,含有木聚糖的材料是木质纤维素。

木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”意指水解含有木聚糖的材料的生物活性。用于测量木聚糖分解活性的两种基本方法包括:(1)测量总木聚糖分解活性,和(2)测量单独的木聚糖分解活性(例如内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、以及α-葡糖醛酸酯酶)。木聚糖分解酶的测定的最近进展总结于若干出版物中,这些出版物包括别雷(Biely)和普查德(Puchard),2006,食品与农业科学杂志(Journal of the Science of Food and Agriculture)86(11):1636-1647;斯帕尼克娃(Spanikova)和别雷,2006,欧洲生化学会联合会快报(FEBS Letters)580(19):4597-4601;赫尔曼(Herrmann)等人,1997,生物化学杂志B(iochemical Journal)321:375-381。

总木聚糖降解活性可以通过测定由不同类型的木聚糖(包括例如燕麦(oat spelt)木聚糖、山毛榉木木聚糖、以及落叶松木木聚糖)形成的还原糖,或通过光度法测定从不同共价染色的木聚糖释放的染色的木聚糖片段来测量。一种常见的总木聚糖分解活性测定基于由聚合4-O-甲基葡糖醛酸木聚糖产生的还原糖,如描述于别雷(Bailey),别雷,坡泰恩(Poutanen),1992,用于木聚糖酶活性测定的多个实验室测试方法(Interlaboratory testing of methods for assay of xylanase activity),生物技术杂志(Journal of Biotechnology)23(3):257-270中。木聚糖酶活性还可以在37℃下在0.01%X-100和200mM磷酸钠(pH 6)中用0.2%AZCL-阿拉伯糖基木聚糖作为底物来测定。将一个单位的木聚糖酶活性定义为在37℃、pH 6下在200mM磷酸钠(pH 6)中从作为底物的0.2%AZCL-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青蛋白。

出于本发明的目的,木聚糖降解活性通过测量由一种或多种木聚糖降解酶在以下典型条件下造成的桦木木聚糖(西格玛化学有限公司(Sigma Chemical Co.,Inc.),美国密苏里州圣路易斯(St.Louis,MO,USA))水解的增加来测定:1ml反应、5mg/ml底物(总固体),5mg木聚糖分解蛋白质/g底物、50mM乙酸钠(pH 5)、50℃、24小时,如里弗(Lever),1972,分析生物化学(Anal.Biochem)47:273-279所述使用对羟基苯甲酸酰肼(PHBAH)测定进行糖分析。

木聚糖酶:术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(E.C.3.2.1.8),其催化木聚糖中的1,4-β-D-木糖苷键的内切水解。出于本发明的目的,在37℃下在0.01%X-100和200mM磷酸钠(pH6)中用0.2%AZCL-阿拉伯糖基木聚糖作为底物来测定木聚糖酶活性。一个单位的木聚糖酶活性定义为在37℃、pH 6下在200mM磷酸钠(pH6)中从作为底物的0.2%AZCL-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青蛋白。

发明详细说明

具有纤维素分解增强活性的多肽

在一个实施例中,本发明涉及与SEQ ID NO:2的成熟多肽具有至少71%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,或与SEQ ID NO:4的成熟多肽具有至少75%,例如至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的分离的多肽,这些多肽具有纤维素分解增强活性。在一个方面中,这些多肽与SEQ ID NO:2或SEQ ID NO:4的成熟多肽具有多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸的差异。

本发明的多肽优选地包括SEQ ID NO:2或SEQ ID NO:4的氨基酸序列或其等位基因变体或由其组成;或是其具有纤维素分解增强活性的片段。在另一方面,该多肽包括SEQ ID NO:2或SEQ ID NO:4的成熟多肽或者由其组成。在另一个方面,该多肽包括SEQ ID NO:2的氨基酸26至408或SEQ ID NO:4的氨基酸23至395,或者由其组成。

在另一个实施例中,本发明涉及由在非常低严谨度条件、低严谨度条件、中严谨度条件、中高严谨度条件、高严谨度条件、或非常高严谨度条件下与以下各项杂交的多核苷酸编码的具有纤维素分解增强活性的分离多肽:(i)SEQ ID NO:1或SEQ ID NO:3的成熟多肽编码序列,(ii)SEQ ID NO:1的cDNA序列,或(iii)(i)或(ii)的全长互补体(萨姆布鲁克(Sambrook)等人,1989,分子克隆实验指南(Molecular Cloning,A Laboratory Manual),第二版,冷泉港(Cold Spring Harbor),纽约)。

可以使用SEQ ID NO:1或SEQ ID NO:3的多核苷酸或其子序列、连同SEQ ID NO:2或SEQ ID NO:4的多肽或其片段来设计核酸探针,以根据本领域熟知的方法来鉴定并克隆对来自不同属或种的菌株的具有纤维素分解增强活性的多肽进行编码的DNA。具体而言,可以根据标准DNA印迹程序,使用这类探针与感兴趣的细胞的基因组DNA或cDNA杂交,以便鉴别和分离其中的对应基因。这类探针可以明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,该核酸探针的长度为至少100个核苷酸,例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),以检测相应的基因。本发明涵盖此类探针。

可以针对与以上所描述的探针杂交并且编码具有纤维素分解增强活性的多肽的DNA对由这类其他菌株制备的基因组DNA或cDNA文库进行筛选。来自这类其他菌株的基因组DNA或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或其他分离技术来分离。来自文库的DNA或分离的DNA可转移到并固定在硝酸纤维素或其他适合的载体材料上。为了鉴定与SEQ ID NO:1或SEQ ID NO:3、其成熟多肽编码序列或其子序列杂交的克隆或DNA,将该载体材料用于DNA印迹中。

出于本发明的目的,杂交指示该多核苷酸在非常低到非常高严谨度条件下与对应于以下各项的经过标记的核酸探针杂交:(i)SEQ ID NO:1或SEQ ID NO:3;(ii)SEQ ID NO:1或SEQ ID NO:3的成熟多肽编码序列;(iii)SEQ ID NO:1的cDNA序列;(iv)其全长互补体;或(v)其子序列。可以使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下该核酸探针杂交的分子。

在一个方面中,该核酸探针是编码SEQ ID NO:2或SEQ ID NO:4的多肽;其成熟多肽;或其片段的多核苷酸。在另一个方面中,该核酸探针是SEQ ID NO:1或SEQ ID NO:3、其成熟多肽编码序列、或其cDNA序列。在另一个方面中,该核酸探针是包含在丝衣霉状篮状菌CBS 413.71中的多核苷酸,其中该多核苷酸编码具有纤维素分解增强活性的多肽。在另一个方面中,该核酸探针是包含在丝衣霉状篮状菌CBS 413.71中的成熟多肽编码区域。

在另一个实施例中,本发明涉及由以下多核苷酸编码的具有纤维素分解增强活性的分离的多肽,这些多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少71%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,或与SEQ ID NO:3的成熟多肽编码序列具有至少75%,例如至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。

在另一个实施例中,本发明涉及SEQ ID NO:2或SEQ ID NO:4的成熟多肽的变体,这些变体在一个或多个(例如,若干个)位置处包含一个取代、缺失和/或插入。在一个方面中,引入进SEQ ID NO:2或SEQ ID NO:4的成熟多肽中的氨基酸取代、缺失和/或插入的数目多达10个,例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个。这些氨基酸变化可以具有微小性质,即,不会显著地影响蛋白质的折叠和/或活性的保守氨基酸取代或插入;典型地是1-30个氨基酸的小缺失;小的氨基-或羧基-末端延伸,如氨基末端的甲硫氨酸残基;多达20-25个残基的小接头肽;或便于通过改变净电荷或另一种功能来纯化的小延伸,如聚组氨酸段(tract)、抗原表位或结合结构域。

保守取代的实例是在下组的范围内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。一般不会改变特异性活性的氨基酸取代是本领域已知的并且例如由H.诺伊拉特(Neurath)和R.L.希尔(Hill),1979在蛋白质(The Proteins),学术出版社(Academic Press),纽约中描述。常见取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。

可替代地,氨基酸改变具有这样一种性质:改变多肽的物理化学特性。例如,氨基酸改变可以提高多肽的热稳定性和/或多肽的热活性、改变底物特异性、改变最适pH,等等。

可以根据本领域中已知的程序,如定点诱变或丙氨酸扫描诱变(坎宁汉(Cunningham)和威尔斯(Wells),1989,科学(Science)244:1081-1085)来鉴定多肽中的必需氨基酸。在后一技术中,在分子中的每个残基中引入单个丙氨酸突变,并且针对纤维素分解增强活性测试所得突变分子,以鉴定对于该分子的活性关键的氨基酸残基。还参见,希尔顿(Hilton)等人,1996,生物化学杂志(J.Biol.Chem.)271:4699-4708。也可结合假定接触位点氨基酸的突变,如通过以下技术例如核磁共振、结晶学、电子衍射、或光亲和标记进行确定,对结构进行物理学分析,从而确定酶的活性位点或其他生物学相互作用。参见,例如,德弗斯(de Vos)等人,1992,科学255:306-312;史密斯(Smith)等人,1992,分子生物学杂志224:899-904;乌乐达维尔(Wlodaver)等人,1992,FEBS快报309:59-64。还可以从与相关多肽的比对来推断鉴别必需氨基酸。

可以做出单个或多个氨基酸取代、缺失和/或插入并且使用诱变、重组和/或改组的已知方法进行测试,随后进行相关筛选程序,如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer),1988,科学(Science)241:53-57;博维(Bowie)和萨奥尔,1989,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625披露的那些。其他可以使用的方法包括易错PCR、噬菌体展示(例如洛曼(Lowman)等人,1991,生物化学(Biochemistry)30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(德比什尔(Derbyshire)等人,1986,基因(Gene)46:145;内尔(Ner)等人,1988,DNA 7:127)。

可以结合诱变/改组方法与高通量自动化筛选方法来检测由宿主细胞表达的克隆的、诱变的多肽的活性(内斯(Ness)等人,1999,自然生物技术(Nature Biotechnology)17:893-896)。编码活性多肽的诱变的DNA分子可以回收自宿主细胞,并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。

该多肽可以是一种杂合多肽,其中一种多肽的一个区域在另一种多肽的一个区域的N-末端或C-末端处融合。

该多肽可以是融合多肽或可切割的融合多肽,其中另一种多肽在本发明多肽的N-末端或C-末端处融合。通过将编码另一多肽的多核苷酸融合到本发明的多核苷酸而产生融合多肽。用于产生融合多肽的技术在本领域是已知的,并包括连接编码多肽的编码序列,这样使得它们在框内并且使得融合多肽的表达处于相同的一个或多个启动子和终止子的控制下。融合多肽还可以使用内含肽技术来构建,其中融合多肽在翻译后产生(库珀(Cooper)等人,1993,欧洲分子生物学学会杂志(EMBO J.)12:2575-2583;道森(Dawson)等人,1994,科学(Science)266:776-779)。

融合多肽可以在两个多肽之间进一步包括一个切割位点。在融合蛋白分泌之时,该位点被切割,从而释放出这两个多肽。切割位点的实例包括但不限于在以下文献中披露的位点:马丁(Martin)等人,2003,工业微生物与生物技术杂志(J.Ind.Microbiol.Biotechnol.)3:568-576;斯维特娜(Svetina)等人,2000,生物技术杂志(J.Biotechnol.)76:245-251;拉斯穆森-威尔逊(Rasmussen-Wilson)等人,1997,应用与环境微生物学(Appl.Environ.Microbiol.)63:3488-3493;沃德(Ward)等人,1995,生物技术(Biotechnology)13:498-503;以及孔特雷拉斯(Contreras)等人,1991,生物技术9:378-381;伊顿(Eaton)等人,1986,生物化学(Biochemistry)25:505-512;柯林斯-拉西(Collins-Racie)等人,1995,生物技术13:982-987;卡特(Carter)等人,1989,蛋白质:结构、功能以及遗传学(Proteins:Structure,Function,and Genetics)6:240-248;以及史蒂文斯(Stevens),2003,药物发现世界(Drug Discovery World)4:35-48。

具有纤维素分解增强活性的多肽的来源

本发明的具有纤维素分解增强活性的多肽可以从任何属的微生物获得。出于本发明的目的,如在此结合一种给定的来源使用的术语“获得自”应意指由多核苷酸编码的多肽是由该来源或者由其中已经插入来自该来源的多核苷酸的一种菌株产生的。在一方面,获得自给定来源的多肽被分泌到细胞外。

该多肽可以是一种真菌多肽。在一个方面中,该多肽是一种篮状菌属多肽。在另一个方面中,该多肽是一种丝衣霉状篮状菌多肽。在另一个方面中,该多肽是一种丝衣霉状篮状菌CBS 413.71多肽。

将理解的是,对于以上提到的物种而言,本发明涵盖完全状态和不完全状态(perfect and imperfect states)二者、以及其他分类学等效物,例如无性型,而不管它们已知的物种名称是什么。本领域的普通技术人员将容易地识别适当等效物的身份。

这些物种的株系可以容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(Centraalbureau Voor Schimmelcultures,CBS)、以及美国农业研究菌种保藏中心,北方地区研究中心(NRRL)。

可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等等)获得的DNA样品鉴定和获得多肽。用于从自然生活环境中直接分离微生物和DNA的技术是本领域熟知的。然后可以通过类似地筛选另一微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码该多肽的多核苷酸。一旦已经用这个或这些探针检测到编码多肽的多核苷酸,就可以通过利用本领域的普通技术人员已知的技术对该多核苷酸进行分离或克隆(参见,例如,萨姆布鲁克等,1989,同上文)。

催化结构域

在一个实施例中,本发明还涉及与SEQ ID NO:2的氨基酸26到250具有至少71%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,或与SEQ ID NO:4的氨基酸23到253具有至少83%,例如至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的催化结构域。在一个方面中,这些催化结构域包括的氨基酸序列与SEQ ID NO:2的氨基酸26到250或SEQ ID NO:4的氨基酸23到253具有多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸的差异。

这些催化结构域优选地包括SEQ ID NO:2的氨基酸26至250或SEQ ID NO:4的氨基酸23至253或其等位基因变体,或者由其组成;或是其具有纤维素分解增强活性的片段。

在另一个实施例中,本发明还涉及由在非常低严谨度条件、低严谨度条件、中严谨度条件、中高严谨度条件、高严谨度条件、或非常高严谨度条件下(如上所定义)与SEQ ID NO:1的核苷酸76到806;其cDNA序列;或其全长互补体、或SEQ ID NO:3的核苷酸67到759或其全长互补体杂交的多核苷酸编码的催化结构域(萨拉布鲁克等人,1989,同上)。

在另一个实施例中,本发明还涉及由与SEQ ID NO:1的核苷酸76到806或其cDNA序列具有至少71%,例如至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,或与SEQ ID NO:3的核苷酸67到759具有至少83%,例如至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多核苷酸编码的催化结构域。

编码该催化结构域的多核苷酸优选地包括SEQ ID NO:1的核苷酸76到806或其cDNA序列,SEQ ID NO:3的核苷酸67到759,或为包含在丝衣霉状篮状菌CBS 413.71中的序列,或由其组成。

在另一个实施例中,本发明还涉及SEQ ID NO:2的氨基酸26到250或SEQ ID NO:4的氨基酸23到253的催化结构域变体,这些变体在一个或多个(例如,若干个)位置处包含一个取代、缺失和/或插入。在一个方面中,引入SEQ ID NO:2的氨基酸26到250或SEQ ID NO:4的氨基酸23到253的序列中的氨基酸取代、缺失和/或插入的数目多达10个,例如1个、2个、3个、4个、5个、6个、8个、9个、或10个。

结合结构域

在一个实施例中,本发明还涉及与SEQ ID NO:2的氨基酸317到378具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,或与SEQ ID NO:6的氨基酸357到394具有至少85%,例如至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的纤维素结合结构域。在一个方面中,这些纤维素结合结构域包括的氨基酸序列与SEQ ID NO:2的氨基酸317到378或SEQ ID NO:4的氨基酸357到394具有多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸的差异。

这些纤维素结合结构域优选地包括SEQ ID NO:2的氨基酸317至378或SEQ ID NO:4的氨基酸357至394或其等位基因变体,或者由其组成;或是其具有纤维素结合活性的片段。

在另一个实施例中,本发明还涉及由在非常低严谨度条件、低严谨度条件、中严谨度条件、中高严谨度条件、高严谨度条件、或非常高严谨度条件下(如上所定义)与SEQ ID NO:1的核苷酸1005到1278;其cDNA序列;或其全长互补体、或SEQ ID NO:3的核苷酸1069到1182或其全长互补体杂交的多核苷酸编码的纤维素结合结构域(萨拉布鲁克等人,1989,同上)。

在另一个实施例中,本发明还涉及由与SEQ ID NO:1的核苷酸1005到1278或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,或与SEQ ID NO:3的核苷酸1069到1182具有至少85%,例如至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多核苷酸编码的纤维素结合结构域。

编码该纤维素结合结构域的多核苷酸优选地包括SEQ ID NO:1的核苷酸1005到1278或其cDNA序列、SEQ ID NO:3的核苷酸1069到1182、或由其组成,或为包含在丝衣霉状篮状菌细胞CBS 413.71中的序列。

在另一个实施例中,本发明还涉及SEQ ID NO:2的氨基酸317到378或SEQ ID NO:4的氨基酸357到394的纤维素结合结构域变体,这些变体在一个或多个(例如,若干个)位置处包含一个取代、缺失和/或插入。在一个方面中,引入SEQ ID NO:2的氨基酸317到378或SEQ ID NO:4的氨基酸357到394的序列中的氨基酸取代、缺失和/或插入的数目多达10个,例如1个、2个、3个、4个、5个、6个、8个、9个、或10个。

可操作地连接到该纤维素结合结构域的催化结构域可以来自水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶,例如氨肽酶、淀粉酶、碳水化合物酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶或β-木糖苷酶。编码催化结构域的多核苷酸可以从任何原核、真核或其他来源获得。

多核苷酸

本发明还涉及编码如在此所述的本发明的多肽、催化结构域或纤维素结合结构域的分离的多核苷酸。

用于分离或克隆多核苷酸的技术是本领域中已知的并且包括从基因组DNA或cDNA,或其组合进行分离。来自基因组DNA的多核苷酸的克隆可以例如通过使用众所周知的聚合酶链反应(PCR)或用以对具有共有的结构特征的克隆的DNA片段进行检测的表达库抗体筛选来实现。参见例如,伊尼斯(Innis)等人,1990,PCR:方法和应用指南(PCR:A Guide to Methods and Application),学术出版社(Academic Press),纽约。可以使用其他核酸扩增程序例如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可以由篮状菌属菌株或相关有机体克隆,并且因此,例如可以是该多核苷酸的多肽编码区的等位基因或种变体。

编码本发明多肽的多核苷酸的修饰对于合成实质上类似于该多肽的多肽可能是必需的。术语“实质上类似”于该多肽是指该多肽的非天然发生的形式。这些多肽可能以某种工程化方式而不同于从其天然来源分离的多肽,例如在比活性、热稳定性、最优pH等方面不同的变体。这些变体可以基于以SEQ ID NO:1的成熟多肽编码序列或其cDNA序列或SEQ ID NO:3呈现的多核苷酸,通过引入不会改变该多肽的氨基酸序列,但对应于预定用于产生该酶的宿主有机体的密码子用法的核苷酸取代,或通过引入可能产生不同氨基酸序列的核苷酸取代来构建。对于核苷酸取代的一般描述,参见例如福德(Ford)等人,1991,蛋白表达与纯化(Protein Expression and Purification)2:95-107。

核酸构建体

本发明还涉及核酸构建体,这些核酸构建体包括可操作地连接至一个或多个控制序列的本发明的多核苷酸,在与控制序列相容的条件下,这些控制序列指导编码序列在合适的宿主细胞中的表达。

该多核苷酸可以按各种方式操纵以提供该多肽的表达。取决于表达载体,在其插入载体以前操纵多核苷酸可以是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

该控制序列可以是一个启动子,即,被宿主细胞识别以对编码本发明多肽的多核苷酸进行表达的一种多核苷酸。该启动子包含转录控制序列,这些序列介导了该多肽的表达。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括突变型、截短型及杂合型启动子,并且可以是由编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。

用于在细菌宿主细胞中指导本发明的核酸构建体的转录的合适启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(阿盖塞(Agaisse)和勒尔克吕(Lereclus),1994,分子微生物学(Molecular Microbiology)13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(埃贡(Egon)等人,1988,基因69:301-315)、天蓝色链霉菌琼脂水解酶基因(dagA)、以及原核β-内酰胺酶基因(维拉-卡马洛夫(Villa-Kamaroff)等人,1978,美国国家科学院院刊75:3727-3731)、以及tac启动子(德波尔(DeBoer)等人,1983,美国国家科学院院刊80:21-25)。另外的启动子描述于吉尔伯特(Gilbert)等人,1980,科学美国人(Scientific American)242:74-94中的“来自重组细菌的有用蛋白”(“Useful proteins from recombinant bacteria”)、以及萨姆布鲁克(Sambrook)等人,1989,见上文。串联启动子的实例披露在WO 99/43835中。

用于指导本发明的核酸构建体在丝状真菌宿主细胞中的转录的合适启动子的实例是从以下各项的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucor miehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、以及里氏木霉翻译延长因子,以及NA2-tpi启动子(一种修饰的启动子,其来自曲霉属中性α-淀粉酶基因,其中未翻译的前导序列由曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替代;非限制性实例包括修饰的启动子,其来自黑曲霉中性α-淀粉酶的基因,其中未翻译的前导序列由构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替代);以及其突变型启动子、截短型启动子、以及杂合型启动子。其他启动子描述于美国专利号6,011,147中。

在酵母宿主中,有用的启动子从以下的基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、以及酿酒酵母3-磷酸甘油酸激酶。罗马诺斯(Romanos)等人,1992,酵母(Yeast)8:423-488描述了酵母宿主细胞的其他有用的启动子。

控制序列还可以是由宿主细胞识别以终止转录的一种转录终止子。该终止子可操作地连接到编码该多肽的多核苷酸的3'-末端。在该宿主细胞中起作用的任何终止子都可以用于本发明中。

用于细菌宿主细胞的优选终止子是从克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)、以及大肠杆菌核糖体RNA(rrnB)的基因获得。

用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、以及里氏木霉翻译延长因子。

用于酵母宿主细胞的优选终止子从以下各项的基因获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子由罗马努斯等人,1992,见上文描述。

控制序列还可以是启动子下游和基因的编码序列上游的mRNA稳定子区,其增加该基因的表达。

适合的mRNA稳定区的实例是从以下获得的:苏云金芽孢杆菌cryIIIA基因(WO 94/25612)和枯草芽孢杆菌SP82基因(化(Hue)等人,1995,细菌学杂志(Journal of Bacteriology)177:3465-3471)。

该控制序列还可以是一个前导序列,一种对宿主细胞翻译很重要的非翻译mRNA区域。该前导序列可操作地连接到编码该多肽的多核苷酸的5'-末端。可以使用在宿主细胞中具有功能的任何前导序列。

用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。

适用于酵母宿主细胞的前导序列从以下各项的基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、以及酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

控制序列还可以是一种聚腺苷酸化序列,可操作地连接至该多核苷酸的3’-末端并且当转录时由宿主细胞识别为将聚腺苷酸残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中起作用的任何多腺苷酸化序列。

用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下各项的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、以及尖镰孢胰蛋白酶样蛋白酶。

有用于酵母宿主细胞的多腺苷酸化序列在郭(Guo)和谢尔曼(Sherman),1995,分子细胞生物学(Mol.Cellular Biol.)15:5983-5990中描述。

控制序列也可以是编码与多肽的N-端连接并指导多肽进入细胞的分泌通路的信号肽的信号肽编码区。多核苷酸的编码序列的5’-端可以固有地包括在翻译阅读框架中与编码多肽的编码序列的区段天然地连接的一个信号肽编码序列。可替代地,编码序列5’末端可以包括对于该编码序列是外源的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可简单地替换天然的信号肽编码序列以便增强该多肽的分泌。然而,可以使用指导所表达多肽进入宿主细胞的分泌通路的任何信号肽编码序列。

用于细菌宿主细胞的有效信号肽编码序列是从以下各项的基因获得的信号肽编码序列:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)、以及枯草芽孢杆菌prsA。西蒙纳(Simonen)和帕尔瓦(Palva),1993,微生物学评论(Microbiological Reviews)57:109-137描述了另外的信号肽。

用于丝状真菌宿主细胞的有效信号肽编码序列是获得自以下项的基因的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶以及米黑根毛霉天冬氨酸蛋白酶。

对于酵母宿主细胞有用的信号肽获得自以下项的基因:酿酒酵母α-因子和酿酒酵母转化酶。见上文,罗马诺斯等人(1992)描述了其他有用的信号肽编码序列。

该控制序列还可以是编码位于多肽的N-末端处的前肽的一个前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或者在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过从该多肽原上催化切割或自动催化切割前肽而被转化成一种活性多肽。前肽编码序列可以从以下各项的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、以及酿酒酵母α因子。

在信号肽序列和前肽序列二者都存在的情况下,该前肽序列定位成紧邻多肽的N-末端并且该信号肽序列定位成紧邻该前肽序列的N-末端。

还可能希望地是添加调控序列,这些调控序列相对于宿主细胞的生长来调节多肽的表达。调控序列的实例是使得基因的表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些序列。原核系统中的调控序列包括lac、tac、以及trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子、以及里氏木霉纤维二糖水解酶II启动子。调控序列的其他实例是允许基因扩增的那些。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸将与调控序列可操作地连接。

表达载体

本发明还涉及包括本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。不同的核苷酸和控制序列可以连接在一起以产生一个重组表达载体,这一重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该变体的多核苷酸。可替代地,该多核苷酸可以通过将该多核苷酸或包括该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时,该编码序列是位于该载体中,这样使得该编码序列与该供表达的适当控制序列可操作地连接。

重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA程序,并且能够引起多核苷酸的表达。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是一种线性的或闭合的环状质粒。

载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体、或人工染色体。该载体可以包含用于确保自我复制的任何装置。可替代地,该载体可以是这样一种载体,当它被引入该宿主细胞中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含有待引入到宿主细胞的基因组中的总DNA)或转座子。

该载体优选包含允许容易选择转化细胞、转染细胞、转导细胞或类似细胞的一个或多个选择性标记。选择性标记是一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型、等。

细菌性选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因,或赋予抗生素抗性(例如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。用于酵母宿主细胞的适合的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1、以及URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于:adeA(磷酸核糖氨基咪唑-琥珀甲酰胺合酶)、adeB(磷酸核糖-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶)、以及其等效物。优选在曲霉属细胞中使用的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选在木霉属细胞中使用的是adeA、adeB、amdS、hph、以及pyrG基因。

选择性标记可以是在W02010/039889中描述的双选择性标记系统。在一方面,双选择性标记是hph-tk双选择性标记系统。

载体优选含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。

为整合到宿主细胞基因组中,该载体可以依赖于编码多肽的多核苷酸的序列或该载体中通过同源或非同源重组而整合到该基因组中的任何其他元件。可替代地,该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,这些整合的元件应包含足够数量的核酸,例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外,这些整合元件可以是非编码多核苷酸或编码多核苷酸。另一方面,该载体可以通过非同源重组整合到宿主细胞的基因组中。

为自主复制,载体可以进一步包含使该载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、以及pACYC184的复制起点,以及允许在芽孢杆菌中复制的质粒pUB110、pE194、pTA1060、以及pAMβ1的复制起点。

用于在酵母宿主细胞中使用的复制起点的实例是2微米复制起点ARS1、ARS4、ARS1与CEN3的组合、以及ARS4与CEN6的组合。

适用于丝状真菌细胞的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡伦(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可以根据披露于WO 00/24883中的方法完成。

可以将本发明的多核苷酸的多于一个的拷贝插入到宿主细胞中以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包含一个与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。

用于连接以上所描述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,萨姆布鲁克(Sambrook)等人,1989,见上文)。

宿主细胞

本发明还涉及重组宿主细胞,这些宿主细胞包含了可操作地连接到一个或多个控制序列的本发明的多核苷酸,该一个或多个控制序列引导本发明的多肽的产生。将包含多核苷酸的构建体或载体引入到宿主细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早前所描述。术语“宿主细胞”涵盖由于复制期间发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上取决于编码该多肽的基因及其来源。

该宿主细胞可以是有用于重组产生本发明的多肽的任何细胞,例如原核细胞或真核细胞。

原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于:芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属、链球菌属、以及链霉菌属。革兰氏阴性细菌包括但不限于:弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺旋杆菌属、泥杆菌属、奈瑟球菌属、假单胞菌属、沙门氏菌属、以及脲原体属。

细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于:嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、以及苏云金芽孢杆菌细胞。

细菌宿主细胞还可以是任何链球菌细胞,包括但不限于:似马链球菌、酿脓链球菌、乳房链球菌、以及马链球菌兽瘟亚种细胞。

细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于:不产色链霉菌、阿维链霉菌、天蓝色链霉菌、灰色链霉菌以及变铅青链霉菌细胞。

将DNA引入芽孢杆菌属细胞中可通过以下来实现:原生质体转化(参见例如,张(Chang)和科恩(Cohen),1979,分子遗传学与基因组学(Mol.Gen.Genet.)168:111-115)、感受态细胞转化(参见,例如,杨格(Young)和斯皮宰曾(Spizizen),1961,细菌学杂志(J.Bacteriol.)81:823-829;或杜拜努(Dubnau)以及大卫杜夫-阿贝尔森(Davidoff-Abelson),1971,分子生物学杂志56:209-221)、电穿孔(参见,例如,茂川(Shigekawa)和道尔(Dower),1988,生物技术(Biotechniques)6:742-751)、或者接合(参见,例如克勒(Koehler)和索恩(Thorne),1987,细菌学杂志169:5271-5278)。将DNA引入大肠杆菌细胞中可通过以下来实现:原生质体转化(参见例如,哈纳汗(Hanahan),1983,分子生物学杂志166:557-580)或电穿孔(参见例如,道尔(Dower)等人,1988,核酸研究16:6127-6145)。将DNA引入链霉菌属细胞中可通过以下来实现:原生质体转化、电穿孔(参见例如,贡(Gong)等人,2004,叶线形微生物学(Folia Microbiol.)(Praha(布拉格))49:399-405)、接合(参见例如,马佐迪耶(Mazodier)等人,1989,细菌学杂志171:3583-3585)、或转导(参见例如,伯克(Burke)等人,2001,美国国家科学院院刊98:6289-6294)。将DNA引入假单孢菌属细胞中可通过以下来实现:电穿孔(参见,例如,蔡(Choi)等人,2006,微生物学方法杂志(J.Microbiol.Methods)64:391-397)、或者接合(参见,例如,皮内多(Pinedo)和斯梅茨(Smets),2005,应用与环境微生物学71:51-57)。将DNA引入链球菌属细胞中可通过以下来实现:天然感受态(参见例如,佩里(Perry)和藏满(Kuramitsu),1981,感染与免疫(Infect.Immun.)32:1295-1297)、原生质体转化(参见,例如,凯特(Catt)和乔力克(Jollick),1991,微生物学(Microbios)68:189-207)、电穿孔(参见,例如,巴克利(Buckley)等人,1999,应用与环境微生物学65:3800-3804)、或者接合(参见,例如,克莱威尔(Clewell),1981,微生物学评论(Microbiol.Rev.)45:409-436)。然而,可以使用本领域已知的用于将DNA引入宿主细胞中的任何方法。

宿主细胞还可以是真核细胞,如哺乳动物、昆虫、植物、或真菌细胞。

宿主细胞可以是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、以及接合菌门(Zygomycota)、连同卵菌门(Oomycota)和全部有丝分裂孢子真菌(如由霍克斯沃思(Hawksworth)等人在安斯沃思和拜斯比真菌词典(Ainsworth and Bisby’s Dictionary of The Fungi),第8版,1995,国际应用生物科学中心(CAB International),大学出版社(University Press),英国剑桥(Cambridge,UK)中进行定义的)。

该真菌宿主细胞可以是酵母细胞。如在此所使用的“酵母”包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)、以及属于不完全真菌(Fungi Imperfecti)(芽生菌目(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,因此出于本发明的目的,酵母应如酵母的生物学和活性(Biology and Activities of Yeast)(斯金纳(Skinner)、帕斯莫尔(Passmore)、以及达文波特(Davenport)编辑,应用细菌学学会讨论会系列号9(Soc.App.Bacteriol.Symposium Series No.9),1980)中所描述来定义。

酵母宿主细胞可以是假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞,如乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂耶氏酵母(Yarrowia lipolytica)细胞。

该真菌宿主细胞可以是一种丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由霍克斯沃思等人,1995,见上文所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),而碳分解代谢可以是发酵的。

丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)、或木霉属细胞。

例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、拉克淖金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。

可以将真菌细胞通过涉及原生质体形成、原生质体转化、以及细胞壁再生的方法以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的适合程序描述于EP 238023、约尔顿(Yelton)等人,1984,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474、以及克里斯滕森(Christensen)等人,1988,生物/技术(Bio/Technology)6:1419-1422中。用于转化镰刀菌属物种的适合方法由马拉迪尔(Malardier)等人,1989,基因(Gene)78:147-156和WO 96/00787描述。酵母可以使用以下各文献中所描述的程序转化:贝克尔(Becker)和古伦特(Guarente),艾本尔森J.N.(Abelson,J.N.)和塞蒙M.I.(Simon,M.I.)编辑,酵母遗传学与分子生物学指南(Guide to Yeast Genetics and Molecular Biology),酶学方法(Methods in Enzymology),第194卷,第182-187页,纽约学术出版社有限公司;埃托(Ito)等人,1983,细菌学杂志(J.Bacteriol.)153:163;以及辛伦(Hinnen)等人,1978,美国国家科学院院刊75:1920。

产生方法

本发明还涉及产生本发明的多肽的方法,包括(a)在有益于产生该多肽的条件下培养一种细胞,该细胞以其野生型形式产生该多肽;并且可任选地(b)回收该多肽。在一个方面中,该细胞是一个篮状菌属细胞。在另一个方面中,该细胞是一种丝衣霉状篮状菌细胞。在另一个方面中,该细胞是一种丝衣霉状篮状菌CBS 174.70细胞。

本发明还涉及产生本发明的多肽的方法,包括(a)在有益于产生该多肽的条件下培养一种本发明的重组宿主细胞;并且可任选地(b)回收该多肽。

这些宿主细胞是在适合于使用本领域中已知的方法产生该多肽的一种营养培养基中培养的。例如,可以通过在适合的培养基中和在允许表达和/或分离该多肽的条件下,进行摇瓶培养,或者在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续,分批,分批补料,或固态发酵)来培养细胞。该培养是使用本领域中已知的程序,在一种适合营养培养基中发生,该培养基包含碳和氮来源及无机盐。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果多肽分泌到该营养培养基中,那么可直接从培养基中直接回收多肽。如果多肽不分泌,那么其可从细胞裂解液中进行回收。

可以使用特异性针对该多肽的本领域已知的方法来检测该多肽。这些检测方法包括但不限于,特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定该多肽的活性。

可以使用本领域已知的方法来回收多肽。例如,该多肽可以通过常规程序,包括但不限于,收集、离心、过滤、萃取、喷雾干燥、蒸发或沉淀,从该营养培养基回收。在一个方面,回收包含多肽的整个发酵液。

可以通过本领域中已知的多种程序来纯化该多肽以获得基本上纯的多肽,这些程序包括但不限于:色谱法(例如,离子交换色谱、亲和色谱、疏水作用色谱、色谱聚焦、以及尺寸排阻色谱)、电泳程序(例如,制备型等电点聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见例如,蛋白质纯化(Protein Purification),詹森(Janson)和赖登(Ryden)编辑,VCH出版社(VCH Publishers),纽约,1989)。

植物

本发明还涉及分离的植物,例如转基因植物、植物部分或植物细胞,这些植物包括本发明的多肽,从而表达并且产生可回收的量的多肽或结构域。多肽或结构域可从植物或植物部分回收。作为替代方案,包括该多肽或结构域的植物或植物部分可以按原样用于改善食品或饲料的质量,例如改善营养价值、可口性及流变学特性,或破坏抗营养因素。

转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草,如草甸草(蓝草,早熟禾属);饲草,如羊茅属(Festuca)、黑麦草属(Lolium);温带草,如翦股颖属(Agrostis);以及谷类,例如小麦、燕麦、黑麦、大麦、稻、高粱、以及玉蜀黍(玉米)。

双子叶植物的实例是烟草、豆类(如羽扇豆(lupins)、马铃薯、糖甜菜(sugar beet)、豌豆、豆(bean)和大豆(soybean))、以及十字花科植物(十字花科(family Brassicaceae))(如花椰菜、油菜籽、以及紧密相关的模式生物拟南芥)。

植物部分的实例是茎、愈伤组织、叶、根、果实、种子、以及块茎、以及包括这些部分的独立组织,例如,表皮、叶肉、薄壁组织(parenchyme)、维管组织、分生组织。特定植物细胞区室,如叶绿体、质外体(apoplast)、线粒体、液泡、过氧化物酶体以及细胞质也被认为是植物部分。此外,任何植物细胞,无论是何种组织来源,都被认为是植物部分。同样地,植物部分,如分离以有助于本发明的利用的特定组织和细胞也被认为是植物部分,例如胚、胚乳、糊粉和种皮。

同样包含于本发明范围内的是这类植物、植物部分以及植物细胞的子代。

可以根据本领域已知方法构建表达该多肽或结构域的转基因植物或植物细胞。简而言之,通过将编码该多肽或结构域的一个或多个表达构建体结合到植物宿主基因组或叶绿体基因组中并且将所得改性植物或植物细胞繁殖成转基因的植物或植物细胞来构建植物或植物细胞。

表达构建体方便地是核酸构建体,它包括编码多肽或结构域的多核苷酸,该多核苷酸可操作地与选择的植物或植物部分中表达该多核苷酸所需的适当调节序列连接。而且,表达构建体可包含用于鉴别整合了此表达构建体的植物细胞的选择性标记,和将此构建体引入所讨论的植物所必需的DNA序列(后者取决于所用的引入DNA的方法)。

调节序列(如启动子和终止子序列及可任选的信号或转运序列)的选择例如基于何时、在何处并且如何表达所希望的多肽或结构域来决定(斯蒂克伦(Sticklen),2008,自然评论(Nature Reviews)9:433-443)。例如编码多肽或结构域的基因的表达可以是组成型的或诱导型的,或者可以是发育、阶段或组织特异性的,并且基因产物可以被靶向至特定组织或植物部分,例如种子或叶。调节序列由例如塔格(Tague)等人,1988,植物生理学(Plant Physiology)86:506描述。

对于组成型表达,可以使用35S-CaMV、玉米泛素1、或稻肌动蛋白1启动子(弗兰克(Franck)等人,1980,细胞(Cell)21:285-294;克里斯滕森(Christensen)等人,1992,植物分子生物学(Plant Mol.Biol.)18:675-689;张(Zhang)等人,1991,植物细胞(Plant Cell)3:1155-1165)。器官特异性启动子可以是例如:来自贮藏库组织(storage sink tissue)(如种子、马铃薯块茎、以及果实)的启动子(爱德华兹(Edwards)和科鲁兹(Coruzzi),1990,遗传学年评(Ann.Rev.Genet.)24:275-303);或来自代谢库组织(如分生组织)的启动子(伊托(Ito)等人,1994,植物分子生物学24:863-878);种子特异性启动子,如来自稻的谷蛋白、醇溶蛋白、球蛋白、或白蛋白启动子(吴(Wu)等人,1998,植物细胞生理学(Plant Cell Physiol.)39:885-889);来自豆球蛋白B4和蚕豆的未知种子蛋白基因的蚕豆启动子(康拉德(Conrad)等人,1998,植物生理学杂志(J.Plant Physiol.)152:708-711);来自种子油体蛋白的启动子(陈(Chen)等人,1998,植物细胞生理学39:935-941);来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子;或本领域已知的任何其他种子特异性启动子,例如,如在WO 91/14772中所描述。此外,启动子可以是叶特异性启动子,如来自稻或番茄的rbcs启动子(京冢(Kyozuka)等人,1993,植物生理学(Plant Physiol.)102:991-1000)、小球藻病毒腺嘌呤甲基转移酶基因启动子(麦卓(Mitra)和希金斯(Higgins),1994,植物分子生物学26:85-93)、来自稻的aldP基因启动子(加贺屋(Kagaya)等人,1995,分子遗传学与基因组学(Mol.Gen.Genet.)248:668-674)、或伤口诱导型启动子(如马铃薯pin2启动子)(许(Xu)等人,1993,植物分子生物学22:573-588)。同样地,启动子可以通过非生物处理来诱导,如温度、干旱、或盐度变化,或通过外源施加的激活该启动子的物质来诱导,例如乙醇、雌激素、植物激素(如乙烯、脱落酸和赤霉酸)、以及重金属。

还可使用启动子增强子元件,从而在植物中达到多肽或结构域的更高表达。例如,启动子增强子元件可以是位于启动子和编码多肽或结构域的多核苷酸序列之间的内含子。例如,许等人,1993,见上文,披露了使用稻肌动蛋白1基因的第一内含子以增强表达。

该选择性标记基因及该表达构建体的任何其他部分可以选自本领域中可用的那些。

可以根据本领域中已知的常规技术将核酸构建体结合到植物基因组中,这些常规技术包括农杆菌介导的转化、病毒介导的转化、微注射、粒子轰击、生物射弹转化、以及电穿孔(加塞尔(Gasser)等人,1990,科学244:1293;波特里库斯(Potrykus),1990,生物/技术8:535;岛本(Shimamoto)等人,1989,自然338:274)。

目前根癌农杆菌介导的基因转移是一种用于产生转基因双子叶植物(关于综述,请参见霍伊卡(Hooykas)和施尔伯鲁特(Schilperoort),1992,植物分子生物学19:15-38)并且用于转化单子叶植物的方法,但对于这些植物还常常使用其他的转化方法。用于产生转基因单子叶植物的方法是粒子(涂覆有转化DNA的微观金或钨粒子)轰击胚愈伤组织或发育中的胚(克里斯托(Christou),1992,植物杂志(Plant J.)2:275-281;岛本,1994,生物技术当前述评(Curr.Opin.Biotechnol.)5:158-162;瓦西尔(Vasil)等人,1992,生物/技术10:667-674)。用于转化单子叶植物的替代方法是基于原生质体转化,如由奥米儒勒(Omirulleh)等人,1993,植物分子生物学21:415-428所描述。另外的转化方法包括美国专利号6,395,966和7,151,204(两者都通过引用以其全文结合于此)中所描述的那些。

在转化后,根据本领域熟知的方法选出已并入了表达构建体的转化体,并使其再生成为完整植物。通常设计转化程序用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两个独立的T-DNA构建体的共转化或利用特异性重组酶位点特异性地切除选择基因。

除用本发明的构建体直接转化特定植物基因型外,还可以通过使具有该构建体的植物与缺乏该构建体的第二植物进行杂交来产生转基因植物。例如,可以通过杂交将编码多肽或结构域的构建体引入特定植物品种中,无需总是直接地转化该给定品种的植物。因此,本发明不仅涵盖了从根据本发明已经转化的细胞直接再生的植物,而且还涵盖了这类植物的后代。如在此使用的,后代可以是指根据本发明制备的亲本植物的任何代的后代。此类后代可以包含根据本发明制备的DNA构建体。杂交导致通过供体植物系与起始系交叉授粉,将转基因引入植物系。此类步骤的非限制性实例描述于美国专利号7,151,204中。

植物可以通过回交转化方法生成。例如,植物包含被称为回交转化的基因型、种系、近交体、或杂交体的植物。

可以使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景渗入到另一个。标记协助的选择提供了相对于常规育种的优势,在于其可以用于避免由表型变异导致的错误。另外,遗传标记可以在具体杂交的个别后代中提供有关良种种质相对程度的数据。例如,当具有所希望性状并且另外具有非农艺学所希望的遗传背景的植物与良种亲本杂交时,可以使用遗传标记来选择不仅具有感兴趣的性状,还具有相对较大比例所希望种质的后代。以此方式,使一种或多种性状渗入特定遗传背景所需的世代数得以最小化。

本发明还涉及产生本发明的多肽或结构域的方法,这些方法包括(a)在有益于产生该多肽或结构域的条件下培养一个转基因植物或植物细胞,该转基因植物或植物细胞包含编码该多肽或结构域的多核苷酸;并且可任选地(b)回收该多肽或结构域。

纤维素分解增强活性的除去或降低

本发明还涉及产生亲本细胞的突变体的方法,该方法包括破坏或缺失编码本发明的多肽的多核苷酸或其部分,这导致突变体细胞比在相同条件下培养的亲本细胞产生的多肽少。

可以使用本领域熟知的方法通过降低或消除该多核苷酸的表达来构建突变体细胞,例如插入、破坏、替换、或缺失。在一个优选方面,将该多核苷酸失活。例如,待修饰或失活的多核苷酸可以是活性必需的编码区或其部分,或编码区的表达所需的调节元件。这种调节或控制序列的实例可以是启动子序列或其功能部分,即足以影响该多核苷酸的表达的部分。可修饰的其他控制序列包括但不局限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子、和转录激活因子。

该多核苷酸的修饰或失活可以通过使亲本细胞经受诱变,并且选择该多核苷酸的表达被降低或消除的突变体细胞来进行。所述诱变可以是特异的或随机的,例如可以通过使用适宜的物理或化学诱变剂、通过使用适宜的寡核苷酸、或通过对DNA序列PCR产生诱变来进行。此外,诱变可通过使用这些诱变剂的任意组合来进行。

适用于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射,羟胺,N-甲基-N'-硝基-N-亚硝基胍(MNNG),邻甲基羟胺,亚硝酸,乙基甲磺酸(EMS),亚硫酸氢钠,甲酸和核苷酸类似物。

当使用这些试剂时,诱变一般是在适宜条件下在所选的诱变处理试剂的存在下通过孵育有待诱变的亲本细胞并筛选和/或选择展示基因表达降低或不表达的突变体细胞来进行的。

该多核苷酸的修饰或失活也可以通过在基因中或在其转录或翻译所需的调节元件中插入、取代、或缺失一个或多个核苷酸来完成。例如,可插入或除去核苷酸从而形成终止密码子的引入、起始密码子的除去、或开放读码框的改变。这些修饰或失活可根据本领域已知的方法通过定点诱变或PCR产生的诱变来完成。尽管原则上,修饰可以在体内进行,即直接在表达待修饰的多核苷酸的细胞上进行,但是优选的是如下所示例地在体外进行修饰。

便利的消除或降低多核苷酸的表达的方法的实例是基于基因替换、基因缺失、或基因破坏技术的。例如,在基因破坏方法中,将对应于内源多核苷酸的核酸序列在体外进行诱变以产生缺陷的核酸序列,然后将其转化到亲本细胞中以产生缺陷基因。通过同源重组,该缺陷的核酸序列替换内源多核苷酸。令人希望的是,缺陷的多核苷酸还编码可用于选择其中该多核苷酸已经被修饰或破坏的转化体的标记。在一个方面,用例如在此描述的那些选择性标记来破坏该多核苷酸。

本发明还涉及抑制具有纤维素分解增强活性的多肽在细胞中的表达的方法,这些方法包括向该细胞给予或在其中表达一种双链RNA(dsRNA)分子,其中该dsRNA包括本发明的多核苷酸的一个子序列。在一个优选方面,该dsRNA长约15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个或更多个双核苷酸。

该dsRNA优选是一个小干扰RNA(siRNA)或微小RNA(miRNA)。在一个优选方面,该dsRNA是用于抑制转录的小干扰RNA。在另一个优选方面,该dsRNA是用于抑制翻译的微小RNA。

本发明还涉及此类双链RNA(dsRNA)分子,包括用于抑制该多肽在细胞中的表达的SEQ ID NO:1的成熟多肽编码序列的部分。虽然本发明不局限于任何具体的作用机制,但是该dsRNA可以进入一个细胞并且导致相似的或相同的序列的单链RNA(ssRNA)(包括内源mRNA)的降解。当细胞被暴露于dsRNA时,来自同源基因的mRNA选择性地被一种叫做RNA干扰(RNAi)的过程所降解。

本发明的dsRNA可以用于基因沉默。在一个方面,本发明提供了使用本发明的dsRNAi来选择性地降解RNA的方法。可以在体外、离体或体内进行该过程。在一个方面,可以使用这些dsRNA分子来在细胞、器官或动物中产生功能缺失突变。用于制备并使用dsRNA分子选择性降解RNA的方法在本领域中是熟知的;参见例如美国专利号6,489,127;6,506,559;6,511,824;以及6,515,109。

本发明进一步涉及包括编码该多肽的多核苷酸或其控制序列或编码该多肽的沉默基因的破坏或缺失的亲本细胞的突变体细胞,这导致与亲本细胞相比,该突变体细胞产生的多肽少或不产生多肽。

这些多肽缺陷的突变体细胞作为用于原生和异源多肽的表达的宿主细胞尤其有用。因此,本发明进一步涉及产生原生或异源多肽的方法,包括(a)在有益于产生该多肽的条件下培养该突变体细胞;并且(b)回收该多肽。术语“异源多肽”是指对该宿主细胞来说不是原生的多肽,例如天然蛋白质的变体。该宿主细胞可以包括多于一个拷贝的编码该原生或异源多肽的多核苷酸。

可使用本领域已知的方法进行培养和目的产物的纯化。

本发明用于生产基本上无纤维素分解增强活性的产物的方法在真核多肽的生产中特别有利,尤其是真菌蛋白质,例如酶。纤维素分解增强活性缺陷的细胞还可用于表达药学感兴趣的异源蛋白,例如激素、生长因子、受体等。术语“真核多肽”不仅包括原生多肽,还包括经过氨基酸替代、缺失或添加的修饰或用以增强活性、热稳定性、pH耐受性等的其他此类修饰的多肽,例如酶。

在另一个方面,本发明涉及通过本发明的方法生产的基本上不含纤维素分解增强活性的蛋白产物。

发酵液配制品或细胞组合物

本发明还涉及包括本发明的多肽的一种发酵液配制品或细胞组合物。发酵液产物进一步包含在发酵过程中使用的另外的成分,例如像,细胞(包括含有编码本发明的多肽的基因的宿主细胞,这些宿主细胞被用于产生多肽)、细胞碎片、生物质、发酵介质和/或发酵产物。在一些实施例中,该组合物是含有一种或多种有机酸、杀死的细胞和/或细胞碎片、以及培养基的细胞杀死全培养液。

如在此使用的术语“发酵液”是指由细胞发酵产生、不经历或经历最低限的回收和/或纯化的制剂。举例来说,当微生物培养物生长至饱和,在碳限制条件下孵育以允许蛋白质合成(例如,由宿主细胞表达酶)并且分泌到细胞培养基中时,产生发酵液。发酵液可以包含在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地,发酵液是未分级的并且包含用过的培养基以及例如通过离心去除微生物细胞(例如,丝状真菌细胞)之后存在的细胞碎片。在一些实施例中,发酵液包含用过的细胞培养基、胞外酶、以及有活力的和/或无活力的微生物细胞。

在一个实施例中,该发酵液配制品和细胞组合物包括一种第一有机酸组分(包括至少一种1-5碳的有机酸和/或其盐)以及一种第二有机酸组分(包括至少一种6碳或更多碳的有机酸和/或其盐)。在一个具体实施例中,该第一有机酸组分是乙酸、甲酸、丙酸、其盐,或前述酸中的两种或更多种的混合物;并且该第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐,或前述酸中的两种或更多种的混合物。

在一方面,该组合物包含一种或多种有机酸,并且任选地进一步包含杀死的细胞和/或细胞碎片。一个实施例中,从细胞杀死全培养液中去除这些杀死的细胞和/或细胞碎片,以提供不含这些组分的组合物。

这些发酵液配制品或细胞组合物可以进一步包含一种防腐剂和/或抗微生物(例如抑菌)剂,包括但不限于山梨糖醇、氯化钠、山梨酸钾、以及本领域中已知的其他试剂。

发酵液配制品或细胞组合物可以进一步包含多种酶活性,例如一种或多种(例如若干种)选自下组的酶,该组由以下各项组成:纤维素酶、半纤维素酶、CIP、酯酶、扩张蛋白、漆酶、木质素分解酶、果胶酶、过氧化氢酶、过氧化物酶、蛋白酶、以及膨胀蛋白(swollenin)。这些发酵液配制品或细胞组合物还可以包含选自由下组的一种或多种(例如,若干种)酶,该组由以下各项组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶,例如,α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、碳水化物酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白分解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。

该细胞杀死全培养液或组合物可以包含在发酵终止时得到的发酵物质的未分级的内容物。典型地,该细胞杀死全培养液或组合物包含用过的培养基以及在微生物细胞(例如,丝状真菌细胞)生长至饱和、在碳限制条件下孵育以允许蛋白质合成(例如,纤维素酶和/或一种或多种葡糖苷酶的表达)之后存在的细胞碎片。在一些实施例中,细胞杀死全培养液或组合物含有耗尽的细胞培养基、胞外酶、和杀死的丝状真菌细胞。在一些实施例中,可以使用本领域已知方法来使细胞杀死全培养液或组合物中存在的微生物细胞透性化和/或裂解。

在此描述的全培养液或细胞组合物典型地是液体,但是可以含有不溶组分,例如杀死的细胞、细胞碎片、培养基组分、和/或一种或多种不溶性酶。在一些实施例中,可以除去不溶性组分以提供澄清的液体组合物。

可以通过WO 90/15861或WO 2010/096673所述的方法产生本发明的全培养液配制品和细胞组合物。

下面给出了本发明的组合物的优选用途的实例。可以基于本领域已知的方法来确定组合物的剂量和使用该组合物的其他条件。

酶组合物

本发明还涉及包含本发明的一种多肽的组合物。优选地,这些组合物富含这种多肽。术语“富集”表明该组合物的纤维素分解增强活性(例如)增加了以至少1.1的富集因子。

这些组合物可以包含本发明的多肽作为主要酶组分,例如单组分组合物。可替代地,这些组合物可以包含多种酶活性,如选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:纤维素酶、半纤维素酶、CIP、酯酶、扩张蛋白、漆酶、木质素分解酶、果胶酶、过氧化氢酶、过氧化物酶、蛋白酶、以及膨胀蛋白。这些组合物还可以包含选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶,例如,α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、碳水化物酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白分解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。这些组合物可根据本领域已知的方法制备并且可以是液体或干燥组合物的形式。可以根据本领域中已知的方法稳定这些组合物。

下文中给出本发明的组合物的优选用途的实例。可以基于本领域已知的方法来确定组合物的剂量和使用该组合物的其他条件。

用途

本发明还针对使用具有纤维素分解增强活性的多肽、或其组合物的以下方法。

本发明还涉及用于降解纤维素材料的方法,这些方法包括:在本发明的具有纤维素分解增强活性的多肽的存在下,用一种酶组合物处理该纤维素材料。在一个方面,这些方法进一步包括回收降解的或转化的纤维素材料。该纤维素材料的降解或转化的可溶性产物可以使用本领域中已知的方法与不溶性纤维素材料分离,例如像离心、过滤、或重力沉降。

本发明还涉及用于产生发酵产物的方法,这些方法包括:(a)在本发明的具有纤维素分解增强活性的多肽的存在下,用一种酶组合物糖化该纤维素材料;(b)用一种或多种(例如,若干种)发酵微生物发酵该糖化的纤维素材料,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。

本发明还涉及发酵一种纤维素材料的方法,这些方法包括:用一种或多种(例如,若干种)发酵微生物发酵该纤维素材料,其中在本发明的具有纤维素分解增强活性的多肽的存在下用一种酶组合物使该纤维素材料糖化。在一个方面,发酵纤维素材料产生发酵产物。在另一个方面中,这些方法进一步包括从发酵中回收该发酵产物。

本发明的方法可以用于将纤维素材料糖化为可发酵糖,并且将可发酵糖转化为多种有用的发酵产物,例如燃料(乙醇、正丁醇、异丁醇、生物柴油、喷气燃料)和/或平台化合物(例如酸、醇、酮、气体、油、等)。由该纤维素材料产生所希望的发酵产物典型地涉及预处理、酶水解(糖化)、以及发酵。

根据本发明的纤维素材料的加工可以使用本领域常规的方法来完成。此外,本发明的方法可以使用被配置成根据本发明来操作的任何常规生物质加工设备来实施。

分开或同时的水解(糖化)和发酵包括但不限于:分开水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、杂合的水解和发酵(HHF)、分开水解和共发酵(SHCF)、杂合的水解和共发酵(HHCF),以及直接微生物转化(DMC),有时还被称为合并的生物加工(CBP)。SHF使用分开的处理步骤,以首先将纤维素材料酶促水解为可发酵糖(例如,葡萄糖、纤维二糖、以及戊糖单体),并且然后将可发酵糖发酵为乙醇。在SSF中,纤维素材料的酶水解和糖发酵成乙醇被组合在一个步骤中(菲利皮迪斯·G.P.(Philippidis,G.P.),1996,纤维素生物转化技术(Cellulose bioconversion technology),生物乙醇手册:生产和利用(Handbook on Bioethanol:Production and Utilization),怀曼·C.E(Wyman,C.E.)编辑,泰勒-弗朗西斯出版集团(Taylor&Francis),华盛顿特区(Washington,DC),179-212))。SSCF涉及多种糖的共发酵(希恩(Sheehan)和希默尔(Himmel),1999,生物技术进展(Biotechnol.Prog.)15:817-827)。HHF涉及一个分开的水解步骤,并且另外涉及一个同时糖化和水解步骤,这些步骤可以在同一反应器中进行。HHF过程中的步骤可以在不同的温度下进行,即高温酶糖化,接着在发酵菌株能够耐受的更低温度下进行SSF。DMC在一个或多个(例如,若干个)步骤中合并了所有的三个过程(酶生产、水解、和发酵),其中使用相同的生物生产用于将纤维素材料转化为可发酵糖的酶并且用于将可发酵糖转化为终产物的酶(林德(Lynd)等人,2002,微生物学与分子生物学评论(Microbiol.Mol.Biol.Reviews)66:506-577)。在此应理解的是,本领域中已知的包括预处理、酶水解(糖化)、发酵、或其组合的任何方法,可以用于实施本发明的方法。

常规的装置可以包括一个分批补料搅拌反应器、一个批式搅拌反应器、一个具有超滤作用的连续流搅拌反应器、和/或一个连续活塞流柱式反应器(continuous plug-flow column reactor)(德卡斯特胡斯克拉兹(de Castilhos Corazza)等人,2003,技术学报(Acta Scientiarum.Technology)25:33-38;古萨考瓦(Gusakov)和斯尼特森(Sinitsyn),1985,酶学与微生物学技术(Enz.Microb.Technol.)7:346-352)、一个碾磨反应器(刘(Ryu)和李(Lee),1983,生物技术与生物工程(Biotechnol.Bioeng.)25:53-65)。另外的反应器类型包括:用于水解和/或发酵的流化床反应器、升流层(upflow blanket)反应器、固定化反应器、以及挤出机型反应器。

预处理。在实践本发明的工艺中,可以使用本领域中已知的任何预处理工艺来破坏纤维素材料的植物细胞壁组分(钱德拉(Chandra)等人,2007,生化工程/生物技术进展(Adv.Biochem.Engin./Biotechnol.)108:67-93;盖博(Galbe)和小林(Zacchi),2007,生化工程/生物技术进展,108:41-65;亨德里克斯(Hendriks)和塞曼(Zeeman),2009,生物资源技术(Bioresource Technol.)100:10-18;莫西尔(Mosier)等人,2005,生物资源技术96:673-686;泰和拉德(Taherzadeh)和卡里米(Karimi),2008,分子科学国际杂志(Int.J.of Mol.Sci.)9:1621-1651;杨(Yang)和怀曼,2008,生物燃料,生物产品和生物精制Biofpr.(Biofuels Bioproducts and Biorefining-Biofpr.)2:26-40)。

纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、筛分、预浸泡、润湿、洗涤、和/或调理。

常规预处理包括但不限于:蒸汽预处理(伴随或不伴随爆发)、稀酸预处理、热水预处理、碱预处理、石灰预处理、湿氧化、湿爆发、氨纤维爆发、有机溶剂预处理、以及生物预处理。另外的预处理包括氨渗滤、超声、电穿孔、微波、超临界CO2、超临界H2O、臭氧、离子性液体、以及γ辐射预处理。

可以在水解和/或发酵之前对纤维素材料进行预处理。优选在水解前进行预处理。可替代地,可以同时用酶水解进行预处理,以释放可发酵糖,例如葡萄糖、木糖、和/或纤维二糖。在多数情况下,预处理步骤自身导致将生物质转化为可发酵糖(即使在没有酶的情况下)。

蒸汽预处理。在蒸汽预处理中,加热纤维素材料以破坏植物细胞壁成分,包括木质素、半纤维素、以及纤维素,以使纤维素和其他级分,例如,半纤维素可接近酶。纤维素材料经过或穿过反应容器,将蒸汽注入该反应容器以增加温度至所需温度和压力,并且将蒸汽保持在其中持续希望的反应时间。优选在140℃-250℃,例如160℃-200℃或170℃-190℃进行蒸汽预处理,其中最佳温度范围取决于化学催化剂的任选添加。蒸汽预处理的停留时间优选是1-60分钟,例如1-30分钟、1-20分钟、3-12分钟、或4-10分钟,其中最适停留时间取决于温度和化学催化剂的任选添加。蒸汽预处理允许相对较高的固体加载量,这样使得纤维素材料在预处理过程中通常仅变得潮湿。蒸汽预处理经常与预处理后的材料的爆发放料组合,这被称为蒸汽爆发,即,快速闪变至大气压和材料湍流,以通过破碎增加可及的表面积(达夫(Duff)和默里(Murray),1996,生物资源技术855:1-33;盖博(Galbe)和小林(Zacchi),2002,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)59:618-628;美国专利申请号2002/0164730)。在蒸汽预处理过程中,半纤维素乙酰基被裂解,并且所得到的酸自催化半纤维素部分水解成单糖和寡糖。仅在有限的程度上去除木质素。

化学预处理:术语“化学处理”是指促进纤维素、半纤维素、和/或木质素的分离和/或释放的任何化学预处理。这种预处理可以将结晶纤维素转化为无定形纤维素。适合的化学预处理方法的实例包括例如稀酸预处理、石灰预处理、湿法氧化、氨纤维/冷冻膨胀(AFEX)、氨渗滤(APR)、离子液体、以及有机溶剂预处理。

有时在蒸汽预处理之前添加一种化学催化剂(例如H2SO4或SO2)(典型地是0.3%至5%w/w),该催化剂减少时间并降低温度、增加回收率、并改进酶水解(巴列斯特罗斯(Ballesteros)等人,2006,应用生物化学与生物技术129-132:496-508;瓦尔加(Varga)等人,2004,应用生物化学与生物技术113-116:509-523;塞斯尼尔(Sassner)等人,2006,酶与微生物技术(Enzyme Microb.Technol.)39:756-762)。在稀酸预处理中,纤维素材料与稀酸(典型地是H2SO4)和水混合,以形成浆液,由蒸汽加热至希望的温度,并且在停留时间后闪变至大气压。可采用多种反应器设计来进行稀酸预处理,例如活塞流反应器、逆流反应器或连续逆流收缩床反应器(达夫(Duff)和默里(Murray),1996,同上;谢尔(Schell)等人,2004,生物资源技术(Bioresource Technology)91:179-188;李(Lee)等人,1999,生物化学工程/生物技术进展(Adv.Biochem.Engin./Biotechnol.)65:93-115)。

还可以使用在碱性条件下的若干种预处理方法。这些碱性预处理包括但不限于:氢氧化钠、石灰、湿氧化、氨渗滤(APR)、以及氨纤维/冷冻膨胀(AFEX)预处理。

用氧化钙或氢氧化钙,在85℃-150℃的温度下进行石灰预处理,并且停留时间为从1小时到几天(怀曼等人,2005,生物资源技术96:1959-1966;莫西尔等人,2005,生物资源技术96:673-686)。WO 2006/110891、WO 2006/110899、WO 2006/110900、以及WO 2006/110901披露了使用氨的预处理方法。

湿氧化是一种热预处理,其典型地在添加氧化剂(如过氧化氢或过压氧)的情况下在180℃-200℃下持续5-15分钟进行(施密特(Schmidt)和汤姆森(Thomsen),1998,生物资源技术64:139-151;帕罗内(Palonen)等人,2004,应用生物化学与生物技术117:1-17;瓦尔加等人,2004,生物技术与生物工程(Biotechnol.Bioeng.)88:567-574;马丁(Martin)等人,2006,化学技术与生物技术杂志(J.Chem.Technol.Biotechnol.)81:1669-1677)。优选在1%-40%干物质,例如2%-30%干物质或5%-20%干物质进行预处理,并且通常通过添加碱,例如碳酸钠提高初始pH。

湿氧化预处理方法的修改,称为湿爆发(湿氧化与蒸汽爆发组合)可以处理高达30%的干物质。在湿爆发中,在某一停留时间后,在预处理期间引入氧化剂(oxidizing agent)。然后通过闪变至大气压结束预处理(WO 2006/03228)。

氨纤维爆发(AFEX)涉及在如90℃-150℃的中等温度和如17至20巴的高压下,用液体或气态氨处理纤维素材料5至10分钟,其中干物质含量可以高达60%(格拉帕里(Gollapalli)等人,2002,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)98:23-35;俊达瓦特(Chundawat)等人,2007,生物技术与生物工程(Biotechnol.Bioeng.)96:219-231;阿里扎德(Alizadeh)等人,2005,应用生物化学与生物技术121:1133-1141;泰莫里(Teymouri)等人,2005,生物资源技术(Bioresource Technol.)96:2014-2018)。在AFEX预处理过程中,纤维素和半纤维素保持相对完整。木质素-碳水化合物复合物被裂解。

有机溶剂预处理通过使用含水乙醇(40%-60%乙醇)在160℃-200℃下萃取30-60分钟而将纤维素材料脱木质素(潘(Pan)等人,2005,生物技术与生物工程(Biotechnol.Bioeng.)90:473-481;潘等人,2006,生物技术与生物工程94:851-861;库拉比(Kurabi)等人,2005,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)121:219-230)。通常加入硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素和木质素被去除。

适合的预处理方法的其他实例由谢尔等人,2003,应用生物化学与生物技术105-108:69-85,和莫西尔等人,2005,生物资源技术96:673-686,以及美国专利申请2002/0164730进行描述。

在一方面,化学预处理优选作为稀酸处理,并且更优选作为连续稀酸处理进行。酸通常是硫酸,但也可以使用其他酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢、或其混合物。弱酸处理优选在1至5,例如1至4或1至2.5的pH范围中进行。在一方面,酸浓度在优选从0.01wt%至10wt%酸,例如0.05wt%至5wt%酸或0.1wt%至2wt%酸的范围中。使酸与纤维素材料相接触,并且保持在优选140℃-200℃,例如165℃-190℃范围内的温度下,持续从1至60分钟范围内的时间。

在另一个方面中,预处理在水性浆料中进行。在优选方面,在预处理过程中纤维素材料以优选在10wt.%至80wt.%之间,例如20wt.%至70wt.%或30wt.%至60wt.%,如大约40wt.%的量存在。预处理的纤维素材料可以不洗涤或使用本领域已知的任何方法洗涤,例如,用水洗涤。

机械预处理或物理预处理:术语“机械预处理”或“物理预处理”是指促进颗粒尺寸减缩的任何预处理。例如,这种预处理可以涉及各种类型的研磨或碾磨(例如,干磨、湿磨、或振动球磨)。

纤维素材料可以物理地(机械地)且化学地预处理。机械或物理预处理可以与以下相结合:蒸汽/蒸汽爆发、水热解(hydrothermolysis)、稀酸或弱酸处理、高温、高压处理、辐射(例如微波福射)、或其组合。在一方面,高压意指在优选约100至约400psi,例如约150至约250psi范围中的压力。在另一个方面中,高温意指温度在大约100℃至大约300℃,例如大约140℃至大约200℃的范围内。在一个优选方面,机械或物理预处理在分批过程中使用蒸汽枪水解器系统,例如从顺智公司(Sunds Defibrator AB),瑞典(Sweden)可获得的顺智水解器(Sunds Hydrolyzer)来进行,该系统使用如上所定义的高压和高温。这些物理预处理和化学预处理可以根据需要顺序地进行或同时进行。

因此,在一个优选方面,使纤维素材料经受物理(机械)或化学预处理、或其任何组合,以促进纤维素、半纤维素、和/或木质素的分离和/或释放。

生物预处理:术语“生物预处理”是指促进纤维素、半纤维素、和/或木质素从纤维素材料中分离和/或释放的任何生物预处理。生物预处理技术可以涉及应用溶解木质素的微生物和/或酶(参见例如,舒(Hsu),T.-A.,1996,生物质的预处理(Pretreatment of biomass),在生物乙醇:生产与利用手册中,怀曼,C.E.,编辑,泰勒-弗朗西斯出版集团,华盛顿特区,179-212;高希(Ghosh)和辛格(Singh),1993,应用微生物学进展(Adv.Appl.Microbiol.)39:295-333;麦克米伦(McMillan),J.D.,1994,预处理木质纤维素生物质:评论(Pretreating lignocellulosic biomass:a review),在用于燃料生产的生物质的酶转化(Enzymatic Conversion of Biomass for Fuels Production)中,希默尔(Himmel),M.E.,贝克(Baker),J.O.,和欧沃尼(Overend),R.P.,编辑,研讨会丛刊(ACS Symposium Series)566,美国化学学会,华盛顿特区,第15章;宫(Gong),C.S.,曹(Cao),N.J.,杜(Du),J.,和查奥(Tsao),G.T.,1999,从可再生资源生产乙醇(Ethanol production from renewable resources),在生化工程/生物技术进展(Advances in Biochemical Engineering/Biotechnology)中,斯卡皮尔(Scheper),T.,编辑,施普林格出版社(Springer-Verlag)柏林海德堡,德国,65:207-241;奥尔森(Olsson)和哈恩-海格达尔(Hahn-Hagerdal),1996,酶与微生物技术(Enz.Microb.Tech.)18:312-331;以及瓦兰德(Vallander)和埃里克森(Eriksson),1990,生化工程/生物技术进展(Adv.Biochem.Eng./Biotechnol.)42:63-95)。

糖化。在水解步骤(还称为糖化)中,将(例如预处理的)纤维素材料水解,以将纤维素和/或半纤维素分解成可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖、和/或可溶性寡糖。水解由如在此描述的一种酶组合物在本发明的具有纤维素分解增强活性的多肽的存在下酶促地进行。这些组合物的酶可以同时或依次添加。

酶水解优选在易于由本领域技术人员确定的条件下、在合适的含水环境中执行。在一方面,水解在适合于一种或多种酶的活性,即对于该一种或多种酶来说最佳的条件下进行。水解可以作为进料分批过程或连续过程进行,其中将纤维素材料逐渐进料至例如含酶的水解溶液中。

糖化通常在受控的pH、温度以及混合条件下在搅拌釜反应器或发酵罐中进行。适合的处理时间、温度以及pH条件可以由本领域技术人员容易地确定。例如,糖化可以持续长达200小时,但是典型地进行优选约12至约120小时,例如约16至约72小时或约24至约48小时。温度在优选约25℃至约70℃,例如约30℃至约65℃、约40℃至约60℃、或约50℃至55℃的范围中。pH在优选约3至约8,例如约3.5至约7、约4至约6、或约4.5至约5.5范围中。干固体含量在大约5到大约50wt.%的范围内,例如大约10至大约40wt.%,或大约20到大约30wt.%。

这些酶组合物可以包含有用于降解纤维素材料的任何蛋白。

在一方面,该酶组合物包含或进一步包含选自下组的一种或多种(例如,若干种)蛋白质,该组由以下各项组成:纤维素酶、半纤维素酶、CIP、酯酶、扩张蛋白、漆酶、木质素分解酶、果胶酶、过氧化氢酶、过氧化物酶、蛋白酶、以及膨胀蛋白。在另一方面,该纤维素酶优选是选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。在另一方面,该半纤维素酶优选是选自下组的一种或多种(例如,若干种)酶,该组由以下各项组成:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、以及木糖苷酶。

在另一方面,该酶组合物包含一种或多种(例如,若干种)纤维素分解酶。在另一方面,该酶组合物包含或进一步包含一种或多种(例如,若干种)半纤维素分解酶。在另一方面,该酶组合物包含一种或多种(例如,若干种)纤维素分解酶和一种或多种(例如,若干种)半纤维素分解酶。在另一方面,该酶组合物包含选自纤维素分解酶和半纤维素分解酶的组的一种或多种(例如,若干种)酶。在另一方面,该酶组合物包含一种内切葡聚糖酶。在另一方面,该酶组合物包含一种纤维二糖水解酶。在另一方面,该酶组合物包含一种纤维二糖水解酶I、一种纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II一种组合。在另一方面,该酶组合物包含一种β-葡糖苷酶。在另一方面,该酶组合物包含一种内切葡聚糖酶和一种纤维二糖水解酶。在另一方面,该酶组合物包含一种内切葡聚糖酶和一种纤维二糖水解酶I、一种纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II一种组合。在另一方面,该酶组合物包含一种内切葡聚糖酶和一种β-葡糖苷酶。在另一方面,该酶组合物包含一种β-葡糖苷酶和一种纤维二糖水解酶。在另一方面,该酶组合物包含一种β-葡糖苷酶和一种纤维二糖水解酶I、一种纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II一种组合。在另一方面,该酶组合物包含一种内切葡聚糖酶、一种β-葡糖苷酶和一种纤维二糖水解酶。在另一方面,该酶组合物包含一种内切葡聚糖酶、一种β-葡糖苷酶和一种纤维二糖水解酶I、一种纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II一种组合。

在另一方面,该酶组合物包含一种乙酰甘露聚糖酯酶。在另一方面,该酶组合物包含一种乙酰木聚糖酯酶。在另一方面,该酶组合物包含一种阿拉伯聚糖酶(例如,α-L-阿拉伯聚糖酶)。在另一方面,该酶组合物包含一种阿拉伯呋喃糖苷酶(例如,α-L-阿拉伯呋喃糖苷酶)。在另一个方面中,该酶组合物包括一种香豆酸酯酶。在另一个方面中,该酶组合物包括一种阿魏酸酯酶。在另一方面,该酶组合物包含一种半乳糖苷酶(例如,α-半乳糖苷酶和/或β-半乳糖苷酶)。在另一方面,该酶组合物包含一种葡糖醛酸糖苷酶(例如,α-D-葡糖醛酸糖苷酶)。在另一个方面中,该酶组合物包括一种葡萄糖醛酸酯酶。在另一个方面中,该酶组合物包括一种甘露聚糖酶。在另一方面,该酶组合物包含一种甘露糖苷酶(例如,β-甘露糖苷酶)。在另一个方面中,该酶组合物包括一种木聚糖酶。在一个实施例中,木聚糖酶是家族10的木聚糖酶。在另一个实施例中,木聚糖酶是家族11的木聚糖酶。在另一个方面中,该酶组合物包括一种木糖苷酶(例如β-木糖苷酶)。

在另一个方面中,该酶组合物包括一种酯酶。在另一个方面中,该酶组合物包括一种扩张蛋白。在另一个方面中,该酶组合物包括一种漆酶。在另一个方面,该酶组合物包含一种木质素分解酶。在一个优选方面,该木质素分解酶是一种锰过氧化物酶。在另一个优选方面,该木质素分解酶是一种木质素过氧化物酶。在另一个优选方面,该木质素分解酶是一种H2O2产生酶。在另一个方面中,该酶组合物包括一种果胶酶。在另一个方面,该酶组合物包含一种过氧化氢酶。在另一个方面,该酶组合物包含一种过氧化物酶。在另一个方面,该酶组合物包含一种蛋白酶。在另一个方面,该酶组合物包含一种膨胀蛋白。

在本发明的方法中,可以在糖化、糖化和发酵、或发酵之前或期间添加该一种或多种酶。

酶组合物的一种或多种(例如若干种)组分可以是天然蛋白、重组蛋白或天然蛋白与重组蛋白的组合。例如,一种或多种(例如,若干种)组分可以是用作宿主细胞以重组表达该酶组合物的一种或多种(例如,若干种)其他组分的细胞的天然蛋白质。在此应理解的是,重组蛋白对于宿主细胞可以是异源的(例如,外源的)和/或原生的。可以作为单组分生成酶组合物的一种或多种(例如若干种)组分,然后将它们组合以形成酶组合物。酶组合物可以是多组分和单组分蛋白制剂的组合。

在本发明的方法中使用的酶可以是以任何适于使用的形式存在的,例如像发酵液配制品或细胞组合物、具有或不具有细胞碎片的细胞裂解物、半纯化或纯化的酶制剂、或作为酶的来源的宿主细胞。酶组合物可以是干粉或颗粒、非尘颗粒、液体、稳定化的液体、或稳定化的受保护的酶。可以根据已建立的方法例如通过添加稳定剂(如糖、糖醇或其他多元醇)、和/或乳酸或另一种有机酸,对液体酶制剂进行稳定化。

酶和具有纤维素分解加强活性的多肽的最佳量取决于若干因素,包括但不限于:纤维素分解酶和/或半纤维素分解酶的混合物、纤维素材料、纤维素材料的浓度、纤维素材料的一种或多种预处理、温度、时间、pH、以及发酵生物体(例如,用于同时糖化和发酵)的纳入。

在一个方面中,纤维素分解酶或半纤维素分解酶对于纤维素材料的有效量是每克纤维素材料大约0.5至大约50mg,例如大约0.5至大约40mg、大约0.5至大约25mg、大约0.75至大约20mg、大约0.75至大约15mg、大约0.5至大约10mg、或大约2.5至大约10mg。

在另一方面,具有纤维素分解增强活性的多肽对纤维素材料的有效量是约0.01至约50.0mg,例如,约0.01至约40mg、约0.01至约30mg、约0.01至约20mg、约0.01至约10mg、约0.01至约5mg、约0.025至约1.5mg、约0.05至约1.25mg、约0.075至约1.25mg、约0.1至约1.25mg、约0.15至约1.25mg、或约0.25至约1.0mg/g纤维素材料。

在另一方面,具有纤维素分解增强活性的多肽对纤维素分解酶或半纤维素分解酶的有效量是约0.005至约1.0g,例如,约0.01至约1.0g、约0.15至约0.75g、约0.15至约0.5g、约0.1至约0.5g、约0.1至约0.25g、或约0.05至约0.2g/g纤维素分解酶或半纤维素分解酶。

具有纤维素分解酶活性或半纤维素分解酶活性的多肽以及有用于降解纤维素材料的其他蛋白/多肽(在下文中统称为“具有酶活性的多肽”)可以从任何合适的来源衍生或获得,包括古细菌、细菌、真菌、酵母、植物或哺乳动物来源。术语“获得的”在此还意指该酶可能已在宿主生物体中采用在此所描的方法重组产生,其中重组产生的酶对于宿主生物体是原生的或外源的,或具有修饰的氨基酸序列,例如,具有一个或多个(例如,数个)缺失、插入和/或取代的氨基酸,即重组产生的酶为天然氨基酸序列的突变体和/或片段,或通过本领域已知的核酸改组方法产生的酶。原生酶的含义中涵盖天然变体,而外源酶的含义中涵盖如通过定点诱变或改组获得的变体。

具有酶活性的多肽可以是一种细菌多肽。例如,该多肽可以是具有酶活性的革兰氏阳性细菌多肽,例如芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳酸杆菌属、乳球菌属、梭菌属、土芽孢杆菌属、热解纤维素菌属、热酸菌属、热裂菌属(Thermobifidia)、或海洋芽孢杆菌属多肽,或具有酶活性的革兰氏阴性细菌多肽,例如大肠杆菌、假单孢菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属、或脲原体属多肽。

在一方面,该多肽是具有酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌多肽。

在另一方面,该多肽是具有酶活性的似马链球菌、酿脓链球菌、乳房链球菌、或马链球菌兽疫亚种多肽。

在另一方面,该多肽是具有酶活性的不产色链霉菌、阿维链霉菌、天蓝色链霉菌、灰色链霉菌、或变铅青链霉菌多肽。

该具有酶活性的多肽也可以是一种真菌多肽,并且更优选地是一种酵母多肽,例如具有酶活性的念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或耶氏酵母属(Yarrowia)多肽;或更优选地是一种丝状真菌多肽,例如枝顶孢霉属、伞菌属、链格孢属、曲霉属、短梗霉属、葡萄座腔菌属(Botryospaeria)、拟蜡菌属、毛喙壳属、金孢子菌属、麦角菌属、旋孢腔菌属、鬼伞属、乳白蚁属、棒囊壳属、隐丛赤壳菌属、隐球菌属、色二孢属、黑耳属、线黑粉酵母属(Filibasidium)、镰刀菌属、赤霉属、全鞭毛虫属、腐质霉属、耙齿菌属、香菇属(Lentinula)、小腔球菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、黑果菌属(Melanocarpus)、亚灰树花菌属(Meripilus)、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉菌属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、假披发虫属、根毛霉菌属、裂褶菌属、柱顶孢属、篮状菌属、嗜热子囊菌属、梭孢壳霉属、弯颈霉属、木霉属、长毛盘菌属、轮枝孢属、小包脚菇属、或炭角菌属具有酶活性的多肽。

在一个方面,多肽是具有酶活性的卡尔斯伯酵母、酿酒酵母、糖化酵母、道格拉斯酵母、克鲁费酵母、诺地酶母、或卵形酵母多肽。

在另一方面,该多肽是具有酶活性的解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、卢克诺文思金孢子菌、热带金孢子菌、莫达瑞姆金孢子菌、狭边金孢子菌、租金抱子菌、昆士兰金孢子菌、带纹金孢子菌、杆孢状镰孢、谷类镰抱、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、柔毛腐质霉、白耙齿菌、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、绳状青霉菌、产紫青霉菌、黄孢平革菌、无色梭孢壳霉、阿波梭孢壳菌、白毛梭孢壳霉、澳洲梭孢壳霉、菲美蒂梭孢壳菌、小孢梭孢壳霉、卵孢梭孢壳霉、秘鲁梭孢壳霉、瘤孢梭孢壳霉、毛梭孢壳霉、耐热梭孢壳、土生梭孢壳霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉、或褐孢长毛盘菌多肽。

还可以使用具有酶活性的多肽的化学修饰的或蛋白工程化的突变体。

酶组合物的一种或多种(例如,若干种)组分可以是重组组分,即,通过克隆编码该单一组分的DNA序列并且随后用该DNA序列转化细胞并且在宿主中表达产生(参见,例如,WO 91/17243和WO 91/17244)。该宿主可以是异源宿主(酶对于宿主来说是外源的),但该宿主在某些条件下也可以是同源宿主(酶对于宿主来说是原生的)。还可以通过纯化来自发酵液的这样一种蛋白来制备单组分纤维素分解蛋白。

在一方面,该一种或多种(例如,若干种)纤维素分解酶包含商业纤维素分解酶制剂。适用于本发明的商业纤维素分解酶制剂的实例包括例如:CTec(诺维信A/S公司(Novozymes A/S))、CTec2(诺维信A/S公司)、CTec3(诺维信A/S公司)、CELLUCLASTTM(诺维信A/S公司)、NOVOZYMTM 188(诺维信A/S公司)、SPEZYMETM CP(杰能科国际(Genencor Int.))、ACCELERASETM TRIO(杜邦公司(DuPont))、NL(DSM公司);S/L 100(DSM公司)、ROHAMENTTM 7069W(罗姆公司(GmbH))、或CMAX3TM(Dyadic国际有限公司(Dyadic International,Inc.))。以从约0.001wt.%至约5.0wt.%的固体,例如0.025wt.%至约4.0wt.%的固体、或约0.005wt.%至约2.0wt.%的固体的有效量添加纤维素分解酶制剂。

可在本发明的方法中使用的细菌内切葡聚糖酶的实例包括但不限于:解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO 91/05039;WO 93/15186;美国专利申请号5,275,944;WO 96/02551;美国专利申请号5,536,655,WO 00/70031,WO 05/093050)、胡萝卜软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(萨里拉赫蒂(Saarilahti)等人,1990,基因(Gene)90:9-14)、嗜热裂孢菌(Thermobifida fusca)内切葡聚糖酶III(WO 05/093050)、以及嗜热裂孢菌(Thermobifida fusca)内切葡聚糖酶V(WO 05/093050)。

可以用于本发明的真菌内切葡聚糖酶的实例包括但不限于:里氏木霉内切葡聚糖酶I(彭蒂莱(Penttila)等人,1986,基因,45:253-263,里氏木霉Cel7B内切葡聚糖酶I(基因银行(GenBank):M15665);里氏木霉内切葡聚糖酶II(萨洛黑莫(Saloheimo)等人,1988,基因,63:11-22),里氏木霉Cel5A内切葡聚糖酶II(基因银行:M19373);里氏木霉内切葡聚糖酶III(奥卡达(Okada)等人,1988,应用与环境微生物学(Appl.Environ.Microbiol.)64:555-563,基因银行:AB003694);里氏木霉内切葡聚糖酶V(萨洛黑莫等人,1994,分子微生物学(Molecular Microbiology)13:219-228,基因银行:Z33381);棘孢曲霉内切葡聚糖酶(黄(Ooi)等人,1990,核酸研究18:5884);白曲霉(Aspergillus kawachii)内切葡聚糖酶(坂元(Sakamoto)等人,1995,当代遗传学(Current Genetics)27:435-439);尖镰孢内切葡聚糖酶(基因银行:L29381);灰腐质霉高温变种(Humicola grisea var.thermoidea)内切葡聚糖酶(基因银行:AB003107);热白丝菌(Melanocarpus albomyces)内切葡聚糖酶(基因银行:MAL515703);粗糙脉孢菌内切葡聚糖酶(基因银行:XM_324477);特异腐质霉内切葡聚糖酶V;嗜热毁丝霉CBS 117.65内切葡聚糖酶;金黄色嗜热子囊菌内切葡聚糖酶I(基因银行:AF487830);以及里氏木霉菌株号VTT-D-80133内切葡聚糖酶(基因银行:M15665)。

可用在本发明中的纤维二糖水解酶的实例包括但不限于:棘孢曲霉纤维二糖水解酶II(WO 2011/059740)、嗜热毛壳菌纤维二糖水解酶I、嗜热毛壳菌纤维二糖水解酶II、特异腐质霉纤维二糖水解酶I、嗜热毁丝霉纤维二糖水解酶II(WO 2009/042871)、Penicillium occitanis纤维二糖水解酶I(基因银:AY690482)、埃默森篮状菌纤维二糖水解酶I(基因银行:AF439936)、赫卡尼亚梭孢壳霉(Thielavia hyrcanie)纤维二糖水解酶II(WO 2010/141325)、土生梭孢壳霉(Thielavia terrestris)纤维二糖水解酶II(CEL6A,WO 2006/074435)、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、以及褐孢长毛盘菌纤维二糖水解酶II(WO 2010/057086)。

适用于本发明的β-葡糖苷酶的实例包括但不限于来自以下各项的β-葡糖苷酶:棘孢曲霉(川口(Kawaguchi)等人,1996,基因173:287-288)、烟曲霉(WO 2005/047499)、黑曲霉(丹(Dan)等人,2000,生物化学杂志(J.Biol.Chem.)275:4973-4980)、米曲霉(WO 02/095014)、巴西青霉菌IBT 20888(WO 2007/019442和WO 2010/088387)、土生梭孢壳霉(WO 2011/035029)、以及褐孢长毛盘菌(WO 2007/019442)。

该β-葡糖苷酶可以是一种融合蛋白。在一方面,β-葡糖苷酶是米曲霉β-葡糖苷酶变体BG融合蛋白(WO 2008/057637)或米曲霉β-葡糖苷酶融合蛋白(WO 2008/057637)。

其他有用的内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶在采用根据下述文献的分类的很多糖基水解酶家族中披露:亨利萨塔(Henrissat),1991,生物化学期刊(Biochem.J.)280:309-316,以及亨利萨塔和巴洛赫(Bairoch),1996,生物化学期刊(Biochem.J.)316:695-696。

可以用于本发明的其他纤维素分解酶描述于以下文献中:WO 98/13465、WO 98/015619、WO 98/015633、WO 99/06574、WO 99/10481、WO 99/025847、WO 99/031255、WO 2002/101078、WO 2003/027306、WO 2003/052054、WO 2003/052055、WO 2003/052056、WO 2003/052057、WO 2003/052118、WO 2004/016760、WO 2004/043980、WO 2004/048592、WO 2005/001065、WO 2005/028636、WO 2005/093050、WO 2005/093073、WO 2006/074005、WO 2006/117432、WO 2007/071818、WO 2007/071820、WO 2008/008070、WO 2008/008793、美国专利号5,457,046、美国专利号5,648,263、以及美国专利号5,686,593。

在一方面,具有纤维素分解增强活性的GH61多肽在根据WO 2008/151043的可溶性活化二价金属阳离子(例如锰或铜)的存在下使用。

在另一方面,具有纤维素分解增强活性的GH61多肽在二氧基化合物、双环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从预处理的纤维素材料(如预处理的玉米秸杆(PCS))获得的液剂的存在下使用。

二氧基化合物可以包括包含两个或更多个氧原子的任何适合化合物。在一些方面,二氧基化合物包含一个如在此所述的被取代的芳基部分。二氧基化合物可以包含一个或多个(例如若干个)羟基和/或羟基衍生物,而且包括缺乏羟基和羟基衍生物的取代的芳基部分。二氧基化合物的非限制性实例包括邻苯二酚或儿茶酚;咖啡酸;3,4-二羟基苯甲酸;4-叔丁基-5-甲氧基-1,2-苯二醇;连苯三酚;没食子酸;3,4,5-三羟基苯甲酸甲酯;2,3,4-三羟基二苯甲酮;2,6-二甲氧基苯酚;芥子酸;3,5-二羟基苯甲酸;4-氯-1,2-苯二醇;4-硝基-1,2-苯二醇;丹宁酸;没食子酸乙酯;羟乙酸甲酯;二羟基富马酸;2-丁炔-1,4-二醇;克酮酸;1,3-丙二醇;酒石酸;2,4-戊二醇;3-乙氧基-1,2-丙二醇;2,4,4'-三羟基二苯甲酮;顺-2-丁烯-1,4-二醇;3,4-二羟基-3-环丁烯-1,2-二酮;二羟基丙酮;丙烯醛缩醛;4-羟基苯甲酸甲酯;4-羟基苯甲酸;以及3,5-二甲氧基-4-羟基苯甲酸甲酯;或其盐或溶剂化物。

双环化合物可以包括如在此所描述的任何适合的取代的稠合环系统。这些化合物可以包含一个或多个(例如,数个)另外的环,并且除非另外说明,否则不限于具体数目的环。在一方面,双环化合物是一种类黄酮。在另一方面,双环化合物是一种任选取代的异类黄酮。在另一方面,双环化合物是一种任选取代的花色离子(flavylium ion),如一种任选取代的花色素或任选取代的花色素苷、或其衍生物。双环化合物的非限制性实例包括:表儿茶素、槲皮素、杨梅黄酮、紫衫叶素、堪非醇、桑色素、刺槐素、柚皮素、异鼠李素、芹黄素、矢车菊素、矢车菊素苷、黑豆多酚、花青素鼠李葡糖苷、或其盐或溶剂合物。

杂环化合物可以是如在此所描述的任何适合的化合物,如包含一个杂原子的一种任选取代的芳香族或非芳香族环。在一个方面中,杂环是包含一个任选地被取代的杂环烷基部分或一个任选地被取代的杂芳基部分的一种化合物。在另一个方面,任选地被取代的杂环烷基部分或任选地被取代的杂芳基部分是一个任选地被取代的5-元杂环烷基或一个任选地被取代的5-元杂芳基部分。在另一个方面,任选地被取代的杂环烷基或任选地被取代的杂芳基部分是一个选自以下的任选地被取代的部分:吡唑基、呋喃基、咪唑基、异噁唑基、噁二唑基、噁唑基、吡咯基、吡啶基、嘧啶基、哒嗪基、噻唑基、三唑基、噻吩基、二氢噻吩并吡唑基、硫茚基、咔唑基、苯并咪唑基、苯并噻吩基、苯并呋喃基、吲哚基、喹啉基、苯并三唑基、苯并噻唑基、苯并噁唑基、苯并咪唑基、异喹啉基、异吲哚基、吖啶基、苯并异唑基、二甲基乙内酰脲、吡嗪基、四氢呋喃基、吡咯啉基、吡咯烷基、吗啉基、吲哚基、二氮杂卓基、氮杂卓基、硫杂卓基、哌啶基以及氧杂卓基。在另一个方面中,任选地被取代的杂环烷基部分或任选地被取代的杂芳基部分是一个任选地被取代的呋喃基。杂环化合物的非限制性实例包括(1,2-二羟基乙基)-3,4-二羟基呋喃-2(5H)-酮;4-羟基-5-甲基-3-呋喃酮;5-羟基-2(5H)-呋喃酮;[1,2-二羟基乙基]呋喃-2,3,4(5H)-三酮;α-羟基-γ-丁内酯;核糖酸γ-内酯;己糖醛酸(aldohexuronicaldohexuronic acid)γ-内酯;葡萄糖酸δ-内酯;4-羟基香豆素;二氢苯并呋喃;5-(羟基甲基)糠醛;联糠醛;2(5H)-呋喃酮;5,6-二氢-2H-吡喃-2-酮;以及5,6-二氢-4-羟基-6-甲基-2H-吡喃-2-酮;或其盐或溶剂化物。

含氮化合物可以是具有一个或多个氮原子的任何适合化合物。在一个方面中,含氮化合物包含一个胺、亚胺、羟胺或氮氧化物部分。含氮化合物的非限制性实例包括丙酮肟;紫尿酸;吡啶-2-醛肟;2-氨基苯酚;1,2-苯二胺;2,2,6,6-四甲基-1-哌啶基氧基;5,6,7,8-四氢生物蝶呤;6,7-二甲基-5,6,7,8-四氢蝶呤;以及顺丁烯酰胺酸;或其盐或溶剂化物。

醌化合物可以是包含一个如在此所述的醌部分的任何适合化合物。醌化合物的非限制性实例包括:1,4-苯醌、1,4-萘醌、2-羟基-1,4-萘醌、2,3-二甲氧基-5-甲基-1,4-苯醌或辅酶Q0、2,3,5,6-四甲基-1,4-苯醌或杜醌、1,4-二羟基蒽醌、3-羟基-1-甲基-5,6-二氢吲哚二酮或肾上腺素红、4-叔丁基-5-甲氧基-1,2-苯醌、吡咯并喹啉醌、或其盐或溶剂化物。

含硫化合物可以是包括一个或多个硫原子的任何适合化合物。在一个方面中,含硫化合物包含一个选自以下各项的部分:亚硫酰基、硫醚、亚磺酰基、磺酰基、硫酰胺、磺酰胺、磺酸以及磺酸酯。含硫化合物的非限制性实例包括乙硫醇;2-丙硫醇;2-丙烯-1-硫醇;2-巯基乙磺酸;苯硫酚;苯-1,2-二硫酚;半胱氨酸;蛋氨酸;谷胱甘肽;胱氨酸;或其盐或溶剂化物。

在一方面,以上所描述的这种化合物对纤维素材料的有效量,作为与纤维素的葡糖基单元的摩尔比是约10-6至约10,例如,约10-6至约7.5、约10-6至约5、约10-6至约2.5、约10-6至约1、约10-5至约1、约10-5至约10-1、约10-4至约10-1、约10-3至约10-1、或约103至约10-2。在另一方面,以上所描述的这种化合物的有效量是约0.1μM至约1M,例如,约0.5μM至约0.75M、约0.75μM至约0.5M、约1μM至约0.25M、约1μM至约0.1M、约5μM至约50mM、约10μM至约25mM、约50μM至约25mM、约10μM至约10mM、约5μM至约5mM、或约0.1mM至约1mM。

术语“液剂(liquor)”意指在如在此所描述的条件下,由处理浆料中的木质纤维素和/或半纤维素材料、或其单糖(例如木糖、阿拉伯糖、甘露糖等)所产生的溶液相(水相、有机相或其组合)、以及其可溶性内容物。用于GH61多肽的纤维素分解增强的液剂可以通过,任选在催化剂(例如酸)的存在下、任选在有机溶剂的存在下、并且任选与物理破坏一种木质纤维素或半纤维素材料(或原料)组合,通过施加热和/或压力来对该材料进行处理,并且然后将溶液与残余固体分离来产生。在由纤维素酶制剂对纤维素底物的水解过程中,从液剂与GH61多肽的组合中可得到纤维素分解增强的程度是由这类条件决定的。可以使用本领域的标准方法,如过滤、沉淀或离心,而将液剂与经过处理的材料进行分离。

在一方面,该液剂对纤维素的有效量是约10-6至约10g/g纤维素,例如,约10-6至约7.5g、约10-6至约5g、约10-6至约2.5g、约10-6至约1g、约10-5至约1g、约10-5至约10-1g、约10-4至约10-1g、约10-3至约10-1g、或约10-3至约10-2g/g纤维素。

在一方面,该一种或多种(例如,若干种)半纤维素分解酶包含商业半纤维素分解酶制剂。适于在本发明中使用的商业化半纤维素分解酶制剂的实例包括例如SHEARZYMETM(诺维信公司)、HTec(诺维信公司)、HTec2(诺维信公司)、HTec3(诺维信公司)、(诺维信公司)、(诺维信公司)、HC(诺维信公司)、木聚糖酶(杰能科公司)、XY(杰能科公司)、XC(杰能科公司)、TX-200A(AB酶公司(AB Enzymes))、HSP 6000木聚糖酶(DSM)、DEPOLTM 333P(生物催化剂有限公司(Biocatalysts Limit),威尔士,英国)、DEPOLTM740L(生物催化剂有限公司,威尔士,英国)、以及DEPOLTM 762P(生物催化剂有限公司,威尔士,英国),ALTERNA FUEL 100P(Dyadic公司),以及ALTERNA FUEL 200P(Dyadic公司)。

在本发明的方法中有用的木聚糖酶的实例包括但不限于来自以下的木聚糖酶:棘孢曲霉(Aspergillus aculeatus)(基因SeqP:AAR63790;WO 94/21785)、烟曲霉(Aspergillus fumigatus)(WO 2006/078256)、嗜松青霉(Penicillium pinophilum)(WO 2011/041405)、青霉属(Penicillium sp.)(WO 2010/126772)、疏棉状嗜热丝孢菌GH11(WO 2012/130965)、嗜热篮状菌(Talaromyces thermophilus)GH11(WO 2012/13095)、土生梭孢壳霉(Thielavia terrestris)NRRL 8126(WO 2009/079210)、以及褐孢长毛盘菌(Trichophaea saccata)GH10(WO 2011/057083)。

在本发明的方法中有用的β-木糖苷酶包括但不限于来自以下的β-木糖苷酶:粗糙脉孢菌(Neurospora crassa)(SwissProt:Q7SOW4)、里氏木霉(Trichoderma reesei)(UniProtKB/TrEMBL:Q92458)、埃默森篮状菌(Talaromyces emersonii)(SwissProt:Q8X212)、以及嗜热篮状菌GH11(WO 2012/13095)。

在本发明的方法中有用的乙酰木聚糖酯酶的实例包括但不限于来自以下的乙酰木聚糖酯酶:棘孢曲霉(Aspergillus aculeatus)(WO 2010/108918),球毛壳菌(Chaetomium globosum)(UniProt:Q2GWX4),细丽毛壳(Chaetomium gracile)(GeneSeqP:AAB82124),特异腐质霉(Humicola insolens)DSM 1800(WO 2009/073709),红褐肉座菌(Hypocrea jecorina)(WO 2005/001036),嗜热毁丝菌(Myceliophtera thermophila)(WO 2010/014880),粗糙脉孢菌(Neurospora crassa)(UniProt:q7s259),颖枯壳针孢(Phaeosphaeria nodorum)(UniProt:Q0UHJ1),以及土生梭孢壳霉(Thielavia terrestris)NRRL8126(WO 2009/042846)。

在本发明的方法中有用的阿魏酰酯酶(阿魏酸酯酶)的实例包括但不限于来自以下的阿魏酰酯酶:特异腐质霉(Humicola insolens)DSM1800(WO 2009/076122),费希新萨托菌(Neosartorya fischeri)(UniProt:A1D9T4),粗糙脉孢菌(Neurospora crassa)(UniProt:Q9HGR3),黄灰青霉(Penicillium aurantiogriseum)(WO 2009/127729),以及土生梭孢壳霉(Thielavia terrestris)(WO 2010/053838和WO 2010/065448)。

在本发明的方法中有用的阿拉伯呋喃糖苷酶的实例包括但不限于来自以下的阿拉伯呋喃糖苷酶:黑曲霉(Aspergillus niger)(GeneSeqP:AAR94170),特异腐质霉(Humicola insolens)DSM 1800(WO 2006/114094和WO 2009/073383),以及巨多孔菌(M.giganteus)(WO 2006/114094)。

在本发明的方法中有用的α-葡糖醛酸糖苷酶的实例包括但不限于来自以下的α-葡糖醛酸糖苷酶:棒曲霉(UniProt:alcc12)、烟曲霉(SwissProt:Q4WW45)、黑曲霉(UniProt:Q96WX9)、土曲霉(SwissProt:Q0CJP9)、特异腐质霉(WO 2010/014706)、黄灰青霉(WO 2009/068565)、埃默森篮状菌(UniProt:Q8X211)、以及里氏木霉(UniProt:Q99024)。

在一个优选实施例中,该酶组合物是一种高温组合物,即可以在约55℃至约70℃的范围内水解纤维素材料的组合物。在另一个优选实施例中,该酶组合物是一种高温组合物,即可以在以下温度下水解纤维素材料的组合物:约55℃、约56℃、约57℃、约58℃、约59℃、约60℃、约61℃、约62℃、约63℃、约64℃、约65℃、约66℃、约67℃、约68℃、约69℃、或约70℃。在另一个优选实施例中,该酶组合物是一种高温组合物,即可以在以下温度下水解纤维素材料的组合物:至少55℃、至少56℃、至少57℃、至少58℃、至少59℃、至少60℃、至少61℃、至少62℃、至少63℃、至少64℃、至少65℃、至少66℃、至少67℃、至少68℃、至少69℃、或至少70℃。

在另一优选实施例中,该酶组合物是一种如在WO 2011/057140(将其通过引用以其全文结合在此)中披露的高温组合物。

用于本发明的方法的具有酶活性的多肽可以通过在含有适合碳源和氮源以及无机盐的营养培养基上,使用本领域中已知的程序发酵上述微生物菌株来产生(参见,例如,班尼特·J.W.(Bennett,J.W.)和拉热·L.(LaSure,L.)(编辑),真菌中的更多基因操纵(More Gene Manipulations in Fungi),学术出版社,加利福尼亚州,1991)。适合的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。适合于生长和酶产生的温度范围和其他条件在本领域中是已知的(参见,例如,贝利·J.E.(Bailey,J.E.)和奥利斯·D.F.(Ollis,D.F.),生物化学工程基础(Biochemical Engineering Fundamentals),麦格劳-希尔图书公司(McGraw-Hill Book Company),纽约,1986)。

发酵可以是导致酶或蛋白质的表达或分离的培养细胞的任何方法。所以,可以将发酵理解为包括摇瓶培养,或者在一种适合的培养基中并且在允许表达或分离该酶的条件下在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)。通过上述方法产生的所得酶可以从发酵培养基回收并且通过常规程序纯化。

发酵。可以通过能够将糖直接或间接发酵成所希望的发酵产物的一种或多种(例如,若干种)发酵微生物发酵从水解的纤维素材料获得的可发酵糖。“发酵”或“发酵过程”是指任何发酵过程或包括发酵步骤的任何过程。发酵方法还包括用于消费性醇工业(例如啤酒和葡萄酒)、乳品工业(例如发酵的乳制品)、皮革工业和烟草工业的发酵方法。发酵条件取决于所希望的发酵产物和发酵生物体,并且可以由本领域的普通技术人员容易地确定。

在发酵步骤中,预处理和酶水解步骤所导致的从纤维素材料释放的糖由发酵生物体(如酵母)发酵成一种产物,例如,乙醇。水解(糖化)和发酵可以是分开的或同时的。

在实践本发明的发酵步骤中可以使用任何适合的水解的纤维素材料。该材料一般是基于经济学,即,每当量糖势的成本,以及对酶致转变的难降解性而进行选择。

术语“发酵培养基”在此可理解为指在添加一种或多种发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及在同时糖化和发酵过程(SSF)中使用的培养基。

“发酵微生物”是指适用于所希望的发酵方法以产生发酵产物的任何微生物,包括细菌和真菌生物体。发酵生物体可以是己糖和/或戊糖发酵生物体、或其组合。己糖和戊糖发酵生物体二者均是本领域中所熟知的。适合的发酵微生物能够将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖、和/或寡糖)直接或间接地发酵(即,转化)成所希望的发酵产物。产生乙醇的细菌和真菌发酵生物的实例由林(Lin)等人,2006,应用微生物学与生物技术69:627-642描述。

能够发酵己糖的发酵微生物的实例包括细菌生物体和真菌生物体,如酵母。酵母包括以下各项的菌株:假丝酵母属、克鲁维酵母属、以及酵母菌属,例如萨纳瑞西斯假丝酵母(Candida sonorensis)、马克斯克鲁维酵母、以及酿酒酵母。

可以发酵处于其原生状态的戊糖的发酵微生物的实例包括细菌和真菌生物体,例如一些酵母。发酵木糖的酵母包括假丝酵母属的菌株,优选是休哈塔假丝酵母(C.sheatae)或萨纳瑞西斯假丝酵母(C.sonorensis);以及毕赤酵母属的菌株,例如是树干毕赤酵母,像树干毕赤酵母CBS 5773。发酵戊糖的酵母包括管囊酵母属的菌株,优选是嗜鞣管囊酵母(P.tannophilus)。不能发酵戊糖(如木糖和阿拉伯糖)的生物体可以通过本领域已知方法来进行遗传修饰而发酵戊糖。

能够有效地将己糖和戊糖发酵成乙醇的细菌的实例包括,例如,凝结芽孢杆菌、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维梭菌(Clostridium thermocellum)、发酵植物多糖梭菌(Clostridium phytofermentans)、土芽孢杆菌属种、解糖热厌氧杆菌(Thermoanaerobacter saccharolyticum)、以及运动发酵单胞菌(Zymomonas mobilis)(菲利皮迪斯,1996,见上文)。

其他发酵生物体包括以下各项的菌株:芽孢杆菌属,如凝结芽孢杆菌;假丝酵母属,如萨纳瑞西斯假丝酵母、甲醇山梨糖假丝酵母(C.methanosorbosa)、迪丹斯假丝酵母(C.diddensiae)、近平滑假丝酵母(Candida parapsilosis)、C.naedodendra、布朗克假丝酵母(C.blankii)、嗜虫假丝酵母(C.entomophilia)、芸薹假丝酵母(C.brassicae)、假热带假丝酵母(C.pseudotropicalis)、博伊丁假丝酵母(C.boidinii)、产朊假丝酵母(C.utilis)、以及休哈塔假丝酵母;梭菌属,如丙酮丁醇梭菌、热纤维梭菌、以及发酵植物多糖梭菌;大肠杆菌,特别是已被遗传修饰以改善乙醇产率的大肠杆菌菌株;土芽孢杆菌属种;汉逊酵母属,如异常汉逊酵母(Hansenula anomala);克雷伯氏菌属(Klebsiella),如产酸克雷伯氏菌(K.oxytoca);克鲁维酵母属,如马克斯克鲁维酵母(K.marxianus)、乳酸克鲁维酵母(K.lactis)、耐热克鲁维酵母(K.thermotolerans)、以及脆壁克鲁维酵母(K.fragilis);裂殖酵母属,如粟酒裂殖酵母(S.pombe);热厌氧杆菌属(Thermoanaerobacter)、如解糖热厌氧杆菌、以及发酵单胞菌属(Zymomonas),如运动发酵单胞菌。

适用于乙醇产生的可商购的酵母包括,例如,BIOFERMTM AFT和XR(NABC-北美生物产品基团(North American Bioproducts Corporation),美国佐治亚州(GA,USA))、ETHANOL REDTM酵母(弗曼迪斯/乐斯福(Fermentis/Lesaffre),美国)、FALITM(菲氏酵母(Fleischmann’s Yeast),美国)、FERMIOLTM(帝斯曼配料部(DSM Specialties))、GERT STRANDTM(Gert Strand AB,瑞典(Sweden))、以及SUPERSTARTTM和THERMOSACCTM新鲜酵母(乙醇技术(Ethanol Technology),美国威斯康辛州(WI,USA))。

在一个方面,发酵微生物已经经过遗传修饰,以提供发酵戊糖的能力,如利用木糖的微生物、利用阿拉伯糖的微生物、以及共同利用木糖和阿拉伯糖的微生物。

将异源基因克隆到多种发酵微生物中已经构建出能够将己糖和戊糖转化成乙醇(共发酵)的生物体(陈(Chen)和霍(Ho),1993,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)39-40:135-147;霍等人,1998,应用与环境微生物学64:1852-1859;科特(Kotter)和西拉塞(Ciriacy),1993,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)38:776-783;维尔福森(Walfridsson)等人,1995,应用与环境微生物学61:4184-4190;凯珀(Kuyper)等人,2004,欧洲微生物学会联合会酵母研究(FEMS Yeast Research)4:655-664;比尔(Beall)等人,1991,生物技术与生物工程(Biotech.Bioeng.)38:296-303;英格拉姆(Ingram)等人,1998,生物技术与生物工程58:204-214;张(Zhang)等人,1995,科学(Science)267:240-243;狄安妲(Deanda)等人,1996,应用与环境微生物学62:4465-4470;WO 2003/062430)。

在一个方面,该发酵微生物包括一种分离的多核苷酸,该多核苷酸编码本发明的一种具有纤维素分解增强活性的多肽。

本领域中熟知的是,以上所描述的生物还可以用于产生其他物质,如在此所描述。

典型地向降解的纤维素材料或水解物中添加发酵微生物,并且进行发酵持续约8至约96小时,例如约24至约60小时。温度典型地在约26℃至约60℃之间,例如约32℃或50℃,并且pH为约pH 3至约pH 8,例如pH 4至5、6、或7。

在一个方面,应用酵母和/或另一种微生物至降解的纤维素材料并且进行发酵,持续约12至约96小时,例如典型地24-60小时。在另一方面,温度优选在约20℃至约60℃之间,例如约25℃至约50℃、约32℃至约50℃、或约32℃至约50℃,并且pH通常是从约pH 3至约pH 7,例如约pH 4至约pH 7。然而,一些发酵生物(例如细菌)具有更高的最适发酵温度。酵母或另一种微生物优选以每ml发酵液大约105至1012,优选从大约107至1010,特别是大约2×108个活细胞计数的量施用。关于使用酵母进行发酵的进一步指南可以见于例如“醇教材”(“The Alcohol Textbook”)(K·雅克(K.Jacques)、T.P.里昂(T.P.Lyons)以及D.R.凯尔索尔(D.R.Kelsall)编辑,诺丁汉大学出版社(Nottingham University Press),联合王国(United Kingdom)1999),其通过引用结合在此。

发酵刺激剂可以与在此所描述的任何方法组合使用,以进一步改进发酵方法,特别是改进发酵微生物的性能,如,提高速度和乙醇产率。“发酵刺激剂”是指用于发酵微生物(特别是酵母)生长的刺激剂。用于生长的优选发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯酸、叶酸、核黄素、以及维生素A、B、C、D和E。例如参见阿尔弗雷多(Alfenore)等人,通过在进料分批方法过程中的一种维生素进料策略改进乙醇产生和酿酒酵母的存活力(Improving ethanol production and viability of Saccharomyces cerevisia by a vitamin feeding strategy during fed-batch process),施普林格(2002),其通过引用结合在此。矿物质的实例包括可以供应包含P、K、Mg、S、Ca、Fe、Zn、Mn和Cu营养素的矿物质和矿物盐。

发酵产品:发酵产品可以是由发酵得到的任何物质。发酵产物可以是而不限于:醇(例如,阿拉伯糖醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨糖醇、以及木糖醇);烷烃(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、以及十二烷);环烷烃(例如,环戊烷、环己烷、环庚烷、以及环辛烷);烯烃(例如,戊烯、己烯、庚烯、以及辛烯);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、以及苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)、以及一氧化碳(CO));异戊二烯;酮(例如,丙酮);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸、以及木糖酸);以及聚酮化合物。发酵产品还可以是作为高价值产品的蛋白。

在一方面,发酵产物是一种醇。应理解的是,术语“醇”涵盖包含一个或多个羟基部分的物质。醇可以是而不限于:正丁醇、异丁醇、乙醇、甲醇、阿拉伯糖醇、丁二醇、乙二醇、甘油(glycerin)、丙三醇(glycerol)、1,3-丙二醇、山梨糖醇、木糖醇。参见例如,宫(Gong)等人,1999,由可再生资源生产乙醇(Ethanol production from renewable resources),在生化工程/生物技术进展(Advances in Biochemical Engineering/Biotechnology)中,舍佩尔·T.(Scheper,T.)编辑,施普林格出版社德国海德堡柏林(Berlin Heidelberg,Germany),65:207-241;西尔维拉(Silveira)和乔纳斯(Jonas),2002,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)59:400-408;尼加姆(Nigam)和辛格,1995,加工生物化学(Process Biochemistry)30(2):117-124;埃塞吉(Ezeji)等人,2003,微生物与生物技术世界杂志(World Journal of Microbiology and Biotechnology)19(6):595-603。

在另一个方面中,发酵产品是一种烷烃。该烷烃可以是非支链或支链烷烃。烷烃可以是而不限于:戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、或十二烷。

在另一方面,发酵产物是一种环烷烃。环烷烃可以是而不限于:环戊烷、环己烷、环庚烷或环辛烷。

在另一个方面中,发酵产品是一种烯烃。该烯烃可以是非支链或支链烯烃。烯烃可以是而不限于:戊烯、己烯、庚烯或辛烯。

在另一个方面中,发酵产品是一种氨基酸。有机酸可以是而不限于:天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、或苏氨酸。参见例如理查德(Richard)和马加里蒂(Margaritis),2004,生物技术和生物工程(Biotechnology and Bioengineering)87(4):501-515。

在另一方面,发酵产物是一种气体。气体可以是而不限于:甲烷、H2、CO2、或CO。参见例如,片冈(Kataoka)等人,1997,水科学与技术(Water Science and Technology)36(6-7):41-47;以及古纳森兰(Gunaseelan),1997,生物质与生物能源(Biomass and Bioenergy)13(1-2):83-114。

在另一个方面中,发酵产品是异戊二烯。

在另一个方面中,发酵产品是一种酮。应理解的是,术语“酮”涵盖包含一个或多个酮部分的物质。酮可以是而不限于:丙酮。

在另一个方面中,发酵产品是一种有机酸。有机酸可以是而不限于:乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸、或木糖酸)。参见,例如,陈(Chen)和李(Lee),1997,生物化学与生物技术(Biochem.Biotechnol.)63-65:435-448。

在另一个方面中,发酵产品是聚酮化合物。

回收。可以使用本领域中已知的任何方法可任选地从发酵培养基回收一种或多种发酵产物,这些方法包括但不限于,色谱法、电泳程序、差别溶解度、蒸馏、或萃取。例如,通过常规蒸馏方法从发酵的纤维素材料中分离和纯化醇。可以获得具有高达约96vol.%的纯度的乙醇,这可以用作例如燃料乙醇、饮用乙醇,即可饮用的中性烈酒、或工业乙醇。

信号肽

本发明还涉及编码信号肽的分离多核苷酸,所述信号肽包含SEQ ID NO:2的氨基酸1至25或SEQ ID NO:4的氨基酸1至22或由其组成。该多核苷酸可以进一步包括一个编码蛋白质的基因,该蛋白质可操作地连接到该信号肽。该蛋白质优选地对于该信号肽来说是外源的。在一个方面中,编码该信号肽的多核苷酸是SEQ ID NO:1的核苷酸1至75或SEQ ID NO:3的核苷酸1至66。

本发明还涉及包括这些多核苷酸的核酸构建体、表达载体及重组宿主细胞。

本发明还涉及产生蛋白质的方法,包括(a)对包含这种多核苷酸的重组宿主细胞进行培养;并且可任选地(b)回收该蛋白质。

该蛋白质对于宿主细胞来说可以是原生的或异源的。术语“蛋白质”在此不意图是指一种特定长度的编码产物,并且因此涵盖肽、寡肽及多肽。术语“蛋白质”还涵盖组合形成编码的产物的两个或更多个多肽。这些蛋白质还包括杂合多肽和融合多肽。

优选地,该蛋白质是一种激素、酶、受体或其部分、抗体或其部分,或报告基因。例如,该蛋白质可以是一种水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶,例如α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。

该基因可以从任何原核、真核或其他来源获得。

通过以下实例进一步描述本发明,这些实例不应当解释为限制本发明的范围。

实例

菌株

使用丝衣霉状篮状菌CBS 413.71作为GH61多肽的来源。使丝衣霉状篮状菌CBS 413.71在PDA板上在26℃下繁殖。

培养基和溶液

COVE蔗糖板由342g的蔗糖、20g的琼脂粉、20ml的COVE盐溶液及补足到1升的去离子水构成。该培养基通过在15psi下高压杀菌15分钟来进行灭菌(细菌学分析手册,第8版,修订A,1998)。将该培养基冷却至60℃并且然后添加10mM乙酰胺、15mM CsCl以及X-100(50μl/500ml)。

COVE顶层琼脂糖是由342.3g的蔗糖、20ml的COVE盐溶液、10mM乙酰胺、15mM CsCl、6g的琼脂糖(龙沙集团有限公司(Lonza Group Ltd.),巴塞尔,瑞士)及补足到1升的去离子水构成的。

用于分离的COVE-2板是由30g的蔗糖、20ml的COVE盐溶液、10mM乙酰胺、30g的高贵级琼脂(Noble agar)及补足到1升的去离子水构成的。

COVE盐溶液由26g的MgSO4·7H2O、26g的KCl,26g的KH2PO4、50ml的COVE痕量金属溶液、以及加至1升的去离子水构成。

COVE痕量金属溶液由0.04g的Na2B4O7·10H2O、0.4g的CuSO4·5H2O、1.2g的FeSO4·7H2O、0.7g的MnSO4·H2O、0.8g的Na2MoO4·2H2O、10g的ZnSO4·7H2O及补足到1升的去离子水构成。

LB培养基由10g的胰蛋白胨、5g的酵母提取物、5g的氯化钠、以及加至1升的去离子水构成。

LB琼脂板由LB培养基和每升15g的细菌用琼脂构成。

MEX-1培养基是由20g的脱脂大豆粉、15g的小麦麸皮、10g的微晶纤维素10g的麦芽糊精、3g的细菌蛋白胨、0.2ml的消泡剂、以及补足到1升的去离子水构成的。

PDA板由马铃薯浸出液构成,该马铃薯浸出液是通过将300g切片的马铃薯(洗涤但未削皮)在水中煮沸30分钟,并且然后将该培养液倾析或滤过粗滤布而制成。然后添加蒸馏水,直到悬浮液的总体积为一升,随后添加20g(w/v)的右旋糖和20g(w/v)的琼脂粉。该培养基通过在15psi下高压杀菌15分钟来进行灭菌(细菌学分析手册,第8版,修订A,1998)。

60%PEG溶液是由去离子水中60%(w/v)聚乙二醇(PEG)4000、10mM CaCl2、以及10mM Tris-HCl pH 7.5构成的。使用0.22μm PES膜滤器(密理博(Millipore)公司,比勒利卡(Billerica),MA,USA)过滤该溶液,用于灭菌。在过滤灭菌后,将该PEG 60%以等分试样在-20℃下储存直至使用。

YP培养基是由去离子水中的1%酵母萃取物和2%蛋白胨构成的。

实例1:从丝衣霉状篮状菌CBS 413.71克隆P24GAB GH61多肽编码序列

通过PCR从丝衣霉状篮状菌CBS 413.71基因组DNA克隆P24GAB GH61多肽编码序列。

在26℃,将丝衣霉状篮状菌CBS 413.71在1000ml锥形摇瓶中在100ml MEX-1培养基中培养5日。通过由衬有(EMD密理博,比勒利卡,MA,USA)的布氏真空漏斗对培养基进行过滤从这些瓶中收获菌丝。将菌丝冷冻于液氮中并在-80℃储存直至进一步使用。根据制造商的说明书,使用植物大提试剂盒(Plant Maxi Kit)(凯杰公司(QIAGEN GMBH),希尔登,德国)分离基因组DNA。

在瑞士Fasteris SA,瑞士普朗莱乌特(Plan-les-Ouates)通过亿明达(Illumina)HiSeq 2000设备生成基因组序列信息。总体上,将3.4μg的分离的丝衣霉状篮状菌基因组DNA送到Fasteris用于制备和分析,并且采用100bp配对端策略,文库插入尺寸为200-500bp。针对总计2x 109,656,624100bp的所获得的原始读数,使用一个HiSeq运行的一半。随后将该读数分级为25%(留下2x 27,414,156读数),随后修正(提取最长的、具有10或更多Phred-得分的子序列)。使用Idba版本0.18集合这些读数。丢弃短于200bp的叠连群,得到29,644,592bp,N-50为36,685。使用GeneMark.hmm ES版本2.3a调用基因,并且使用由Pfam提供的“Glyco_hydro_61”隐马尔可夫模型(Hidden Markov Model)进行该催化结构域的鉴别。

使用以下所述的引物通过PCR从丝衣霉状篮状菌CBS 413.71基因组DNA克隆P24GAB GH61多肽编码序列,这些引物是基于以上获得的编码序列设计的。

引物KKSC0110F:

5’-ACACAACTGGGGATCCACCATGCTGTCTTCCGCCCTCGC-3’(SEQ ID NO:5)

引物KKSC0110R:

5’-AGATCTCGAGAAGCTTACTACTCGTTAGTCGAGATAGCTC-3’(SEQ ID NO:6)

粗体字母代表丝衣霉状篮状菌P24GAB GH61多肽编码序列。限制位点是已加下划线的。这些限制位点左方的序列与pDau109的插入位点是同源的(WO 2005/042735)。

扩增反应(40μl)是由25μl的2X IPROOFTM HF Master Mix(伯乐实验室有限公司(Bio-Rad Laboratories,Inc.),赫拉克勒斯,加利福尼亚州,美国)、1μl的引物KKSC0110F(100μM)、1μl的引物KKSC0110R(100μM)、1μl的丝衣霉状篮状菌基因组DNA(100ng/μl)、以及22μl的去离子水构成的。将PCR反应在Dual-Block热循环仪(MJ研究公司(MJ Research Inc.),沃尔萨姆,马萨诸塞州,美国)中进行孵育,编程为:1个循环,在98℃持续30秒;30个循环,每个在98℃持续10秒、在55℃持续20秒并且在72℃持续30秒;以及1个循环,在72℃持续10分钟。在去除之前将样品冷却至10℃并且进一步处理。

使用40mM Tris碱、20mM乙酸钠、1mM EDTA二钠(TAE)缓冲液,通过1%琼脂糖凝胶电泳分析三μl的PCR反应,这里观察到了在859bp的一个主条带。根据制造商的说明,直接使用ILLUSTRATM GFXTM PCR DNA和凝胶带纯化试剂盒(ILLUSTRATM GFXTM PCR DNA and Gel Band Purification Kit)(GE医疗公司,皮斯卡塔韦(Piscataway),新泽西州,美国)纯化剩余的PCR反应。

将两μg的质粒pDau109用Bam HI和Hind III进行消化,并且在1%琼脂糖凝胶上使用50mM Tris碱-50mM硼酸-1mM EDTA二钠(TBE)缓冲液运行该消化的质粒,以从该限制质粒去除填充片段。通过添加安全DNA凝胶染液(Safe DNA gel stain)(生命技术公司(Life Technologies Corporation),格兰德岛(Grand Island),新泽西州,美国)将条带可视化并在470下进行检测。将对应于该限制质粒的条带切下,并且使用ILLUSTRATM GFXTMPCR DNA和凝胶条带纯化试剂盒进行纯化。将该质粒洗脱到10mM Tris pH 8.0中,并将其浓度调节至20ng/μl。使用PCR克隆试剂盒(克罗泰克实验室有限公司(Clontech Laboratories,Inc.),山景城(Mountain View),加利福尼亚州,美国)以将该1224bp PCR片段克隆到用Bam HI和Hind III(20ng)消化的pDau109中。该总反应体积是10μl。根据制造商的方案,将该反应转化进FUSION-BLUETM大肠杆菌细胞(克罗泰克实验室有限公司,山景城,加利福尼亚州,美国)中,并且将其铺板在补充有50μg的氨比西林/ml的LB琼脂板上。在37℃下孵育过夜之后,观察到转化菌落在这些板上生长。

选择若干菌落用于通过菌落PCR使用以下所述的pDau222载体引物进行分析。用黄色的接种针(能肯公司(Nunc)A/S,丹麦)从该补充有50μg的氨比西林/ml的LB板上将四个菌落转移到补充有50μg的氨比西林/ml的新的LB板上,并在37℃孵育过夜。

引物8653:

5’-GCAAGGGATGCCATGCTTGG-3’(SEQ ID NO:7)

引物8654:

5’-CATATAACCAATTGCCCTC-3’(SEQ ID NO:8)

将这四个菌落中的每个直接转移到200μl PCR管中,该PCR管中由6μl的2X HiFi REDDYMIXTM PCR Master Mix(赛默飞世尔科技公司(Thermo Fisher Scientific),罗克福德(Rockford),伊利诺伊州,美国)、0.5μl的引物8653(10pm/μl)、0.5μl的引物8654(10pm/μl)、以及5μl的去离子水构成。每个菌落PCR在Dual-Block热循环仪中进行孵育,编程为:1个循环,在94℃持续60秒;30个循环,每个为在94℃持续30秒、在55℃持续30秒、在68℃持续60秒、在68℃持续10分钟、以及在10℃持续10分钟。

将四μl的每个完成的PCR反应使用TAE缓冲液提交到1%琼脂糖凝胶电泳。四个大肠杆菌转化体都显示1.2kb的PCR条带。使用QIAprep质粒小提试剂盒(Spin Miniprep Kit)(凯杰公司,希尔登,德国)从这四个菌落的每个中分离质粒DNA。将所得质粒DNA使用一种应用生物系统模型3700自动DNA测序仪和3.1版BIG-DYETM终止子化学(应用生物系统公司(Applied Biosystems,Inc.),福斯特市(Foster City),加利福尼亚州,美国),用引物8653和8654进行测序。选择一种质粒,指定为pKKSC0110-3,用于转化米曲霉MT3568。米曲霉MT3568是米曲霉JaL355的amdS(乙酰胺酶)破坏的基因衍生物(WO 2002/40694),其中通过钝化米曲霉amdS基因来修复pyrG营养缺陷型。根据EP 0238023B1,第14-15页中所述的方法来制备米曲霉MT3568的原生质体。

根据制造商的说明书(凯杰公司,希尔登,德国),使包含pKKSC0110-3的大肠杆菌KKSC0110-3生长过夜,并且根据制造商的说明书,使用质粒小提试剂盒(凯杰公司,希尔登,德国)分离pKKSC0110-3的质粒DNA。根据WO 2005/042735中所述的方法,将纯化的质粒DNA转化进米曲霉MT3568中。简而言之,将代表3μg的DNA的8μl的质粒DNA添加到100μl的米曲霉MT3568原生质体中。然后添加250ul的60%PEG溶液,并且将这些管轻轻地混合,并且在37℃下孵育30分钟。将混合物添加到10ml的预熔化的COVE顶层琼脂糖中,在添加该原生质体混合物之前,将其在热水浴中平衡到40℃。然后将合并的混合物铺板在两个COVE蔗糖板上。将这些板在37℃下孵育4天。通过在作为碳源的乙酰胺上生长来鉴别单个转化菌落。将这些米曲霉转化体中的若干个接种到96深孔板中补充有2%葡萄糖的750μl的YP培养基和补充有2%麦芽糊精的750μl的YP培养基中,并在37℃静止孵育4天。还将相同的转化体再划线到COVE-2板上。

然后根据制造商,使用10%Bis-Tris SDS凝胶(英杰公司,卡尔斯巴德,加利福尼亚州,美国)通过SDS-PAGE,针对P24GAB GH61多肽的产生,对来自米曲霉转化体的培养液进行分析。对于这些米曲霉转化体中每个,在大约50kDa观察到一个条带。将产生P24GAB GH61多肽的一个米曲霉转化体指定为米曲霉EXP04087。

将米曲霉EXP04087在26℃下在包含补充有2%葡萄糖的100ml的YP培养基的1000ml锥形摇瓶中在85rpm搅拌下培养4天。使用0.22μm EXPRESSTM Plus膜(密理博公司,贝德福德,马萨诸塞州,美国)过滤丝衣霉状篮状菌P24GAB GH61多肽的培养液。使用20(10KDa MWCO)自旋浓缩器(赛多利斯斯蒂奥生物科技公司(Sartorius Stedim Biotech),哥廷根(Goettingen),德国)将100ml体积的过滤的培养液浓缩到约10ml,并将其在3000rpm下以持续15分钟的间隔反复离心(索瓦尔(Sorvall),传奇RT+离心机,赛默科技公司(Thermo Scientific),德国)。在定量脱盐之后通过凝胶定量确定GH61多肽的总蛋白含量。使用10-DG脱盐柱(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国),将3ml体积的浓缩GH61多肽培养液脱盐并缓冲液交换到50mM乙酸钠pH5.0缓冲液中。通过SDS-PAGE(8%-16%Tris-HCl CRITERION STAIN FREETM,伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)使用CRITERION STAIN FREETM成像系统(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)确定蛋白质浓度,其中将青霉属(埃默森青霉)GH61A多肽用作蛋白质标准品。根据WO 2011/041397重组地制备并纯化青霉属(埃默森青霉)GH61A多肽(SEQ ID NO:9[DNA序列]以及SEQ ID NO:10[推导的氨基酸序列])。

实例2:丝衣霉状篮状菌P24GAB GH61多肽基因组编码序列的表征

丝衣霉状篮状菌P24GAB GH61多肽基因组编码序列的基因组DNA序列和推导的氨基酸序列分别在SEQ ID NO:1和SEQ ID NO:2中示出。编码序列是1371bp(包括终止密码子),它被56bp(核苷酸206至261)和88bp(核苷酸1077至1164)的2个内含子间断。编码的预测蛋白质是408个氨基酸。使用SignalP程序(尼尔森等人,1997,同上)预测出25个残基的信号肽。SignalP预测与在N-末端具有一个组氨酸残基以便进行适当金属结合并且因此蛋白质功能出现的必然性相符(参见,哈里斯(Harris)等人,2010,生物化学(Biochemistry)49:3305,和昆兰(Quinlan)等人,2011,美国科学院院刊(Proc.Natl.Acad.Sci.USA)108:15079)。预测的成熟蛋白包含383个氨基酸,具有41.002kDa的预测分子量和4.08的预测等电点。通过使用BLAST将全长蛋白质的氨基酸序列与所有CAZY-定义的子家族模块子序列进行比对,GH61催化结构域子序列和CBM结构域子序列分别被预测为氨基酸26至250和氨基酸317至378(康塔雷尔(Cantarel)等人,2009,核酸研究(Nucleic Acids Res.)37:D233-238),其中使用子家族内单个最显著比对来预测GH61催化结构域和CBM结构域的位置。

使用尼德曼和翁施算法(尼德曼和翁施,1970,同上)确定氨基酸序列的比较性成对地总体比对,使用空位开放罚分10、空位延伸罚分0.5以及EBLOSUM62矩阵。比对显示编码P24GAB GH61多肽的丝衣霉状篮状菌基因组DNA的推导的氨基酸序列与来自甲壳嗜热子囊菌(GENESEQP AZG67670)的GH61多肽的推导的氨基酸序列享有70.73%的一致性(排除空位)。

实例3:从丝衣霉状篮状菌CBS 413.71克隆P24GEH GH61多肽编码序列

通过PCR从丝衣霉状篮状菌CBS 413.71基因组DNA克隆P24GEH GH61多肽编码序列。

如实例1中所述制备丝衣霉状篮状菌CBS 413.71基因组DNA。

基因组的序列信息如实例1中所述。

使用以下所述的引物通过PCR从丝衣霉状篮状菌CBS 413.71基因组DNA克隆P24GEH GH61多肽编码序列,这些引物是基于以上获得的编码序列设计的。

引物KKSC0109F:

5’-ACACAACTGGGGATCCACCATGCCTCGCTTCCAGTCCGC-3’(SEQ ID NO:11)

引物KKSC0109R:

5’-AGATCTCGAGAAGCTTATTAGGCTGCAGTAGCCACAC-3’(SEQ ID NO:12)

粗体字母代表丝衣霉状篮状菌P24GEH GH61多肽编码序列。限制位点是已加下划线的。这些限制位点左方的序列与质粒pDau109的插入位点是同源的。

扩增反应(40μl)是由25μl的2X IPROOFTM HF Master Mix、1μl的引物KKSC109F(100μM)、1μl的引物KKSC109R(100μM)、1μl的丝衣霉状篮状菌基因组(100ng/μl)、以及22μl的去离子水构成的。将PCR反应在Dual-Block热循环仪中进行孵育,编程为:1个循环,在98℃持续30秒;30个循环,每个为在98℃持续10秒、在55℃持续20秒和在72℃持续30秒;以及1个循环,在72℃持续10分钟。在去除之前将样品冷却至10℃并且进一步处理。

将三μl的PCR反应通过1%琼脂糖凝胶电泳使用TAE缓冲液进行分析。在大约1224bp观察到一个主条带。根据制造商的说明,直接使用ILLUSTRATM GFXTM PCR DNA和凝胶带纯化试剂盒纯化剩余的PCR反应。

如在实例1中所述制备限制pDau109质粒,并在克隆反应中使用5μl的纯化插入片段(约200ng)。使用PCR克隆试剂盒以将该1224bp PCR片段克隆到用Bam HI和Hind III(20ng)消化的pDau109中。总反应体积是10μl。根据制造商的方案,将该反应转化进FUSION-BLUETM大肠杆菌细胞中,并且将其铺板在补充有50μg的氨比西林/ml的LB琼脂板上。在37℃下孵育过夜之后,观察到转化菌落在这些板上在选择下生长。

使用引物8653和8654,如在实例1中详述,在四个分离的菌落上进行菌落PCR。选择包含插入片段的三个质粒并根据实例1进行测序。选择带有无PCR错误的插入片段的单个质粒并指定为pKKSC0109-3用于进一步的工作。

根据实例1中所述程序将质粒pKKSC0109-3转化到米曲霉MT3568中,并选择指定为米曲霉EXP04086的单个米曲霉转化体用于酶生产。

发酵条件与实例1中一致,除了YP培养基中使用的碳源。将米曲霉EXP04086在26℃下在各自包含补充有2%葡萄糖的100ml的YP培养基的1000ml锥形摇瓶中在85rpm搅拌下培养4天。使用0.22μm EXPRESSTM Plus膜过滤丝衣霉状篮状菌P24GEH GH61多肽的培养液。使用20(10KDa MWCO)自旋浓缩器将100ml体积的过滤的培养液浓缩到约10ml,并将其在3000rpm下以持续15分钟的间隔反复离心(索瓦尔(Sorvall),传奇RT+离心机,赛默科技公司,德国)。在定量脱盐之后通过凝胶定量确定GH61多肽的总蛋白含量。使用10-DG脱盐柱,将3ml体积的浓缩GH61多肽培养液脱盐并缓冲液交换到50mM乙酸钠pH 5.0缓冲液中。通过SDS-PAGE(8%-16%Tris-HCl CRITERION STAIN FREETM)使用CRITERION STAIN FREETM成像系统确定蛋白质浓度,其中将青霉属(埃默森青霉)GH61A多肽用作蛋白质标准品。

实例4:丝衣霉状篮状菌P24GEH GH61多肽基因组编码序列的表征

丝衣霉状篮状菌P24GEH GH61多肽基因组编码序列的基因组DNA序列和推导的氨基酸序列分别在SEQ ID NO:3和SEQ ID NO:4中示出。编码序列是1188bp,包括终止密码子,其未被内含子打断。编码的预测蛋白质是395个氨基酸。使用SignalP程序(尼尔森等人,1997,同上)预测出22个残基的信号肽。SignalP预测与在N-末端具有一个组氨酸残基以便进行适当金属结合并且因此蛋白质功能出现的必然性相符(参见,哈里斯(Harris)等人,2010,见上文,和昆兰(Quinlan)等人,2011,见上文)。通过使用BLAST将全长蛋白质的氨基酸序列与所有CAZY-定义的子家族模块子序列进行比对,GH61催化结构域和CBM结构域分别被预测为氨基酸23至253和氨基酸357至394(康塔雷尔(Cantarel)等人,2009,核酸研究(Nucleic Acids Res.)37:D233-238),其中使用子家族内单个最显著比对来预测GH61催化结构域和CBM结构域的位置。预测的成熟蛋白包含373个氨基酸,具有26.501kDa的预测分子量和4.44的预测等电点。

使用尼德曼和翁施算法(尼德曼和翁施,1970,同上)确定氨基酸序列的比较性成对地总体比对,使用空位开放罚分10、空位延伸罚分0.5以及EBLOSUM62矩阵。比对显示编码P24GEH GH61多肽的丝衣霉状篮状菌基因组DNA的推导的氨基酸序列与来自甲壳嗜热子囊菌(GENESEQP AZT52143)的GH61多肽的推导的氨基酸序列享有71.6%的一致性(排除空位)。

实例5:预处理的玉米秸杆水解测定

在美国能源部国家可再生能源实验室(NREL)中使用1.4wt%硫酸在165℃和107psi下对玉米秸秆进行预处理持续8分钟。预处理的玉米秸秆(PCS)中的水不溶性固形物含有56.5%纤维素、4.6%半纤维素、以及28.4%木质素。纤维素和半纤维素通过两段硫酸水解、以及随后通过使用NREL标准分析程序#002的高效液相色谱法的分析进行测定。在用硫酸水解纤维素和半纤维素级分后,使用NREL标准分析程序#003通过重量分析法测定木质素。

通过在剧烈混合下添加10M NaOH将PCS的pH调节至5.0,并且然后在120℃下高压杀菌20分钟来制备未碾磨、未洗涤PCS(全浆料PCS)。该全浆料PCS的干重是29%。通过在Cosmos ICMG 40多效用湿研磨机(EssEmm公司,印度泰米尔纳德邦(Tamil Nadu,India))中碾磨全浆料PCS来制备碾磨的未洗涤的PCS(干重32.35%)。

PCS的水解使用2.2ml深孔平板(爱思进(Axygen),美国加州联合市(Union City,CA,USA))在1.0ml的总反应体积中进行。用50mg的不溶性PCS固形物/ml的含有1mM硫酸锰和不同酶组合物的不同蛋白负载量(表示为mg蛋白质/克纤维素)的50mM乙酸钠(pH 5.0)缓冲液进行水解。制备酶组合物并且然后以从50μl至200μl范围的体积同时添加到所有孔中,以使各反应中的最终体积为1ml。然后使用ALPS-300TM板式热封机(ALPS-300TM plate heat sealer)(阿博基因公司(Abgene),埃普索姆,英国)将板密封,充分混合,并且在特定温度下孵育72小时。一式三份地重复所有报道的实验。

在水解后,使用0.45μm96孔过滤器板(密理博,美国麻萨诸塞州新贝德福德)过滤样品并且如以下所描述分析滤液的糖含量。在不立即使用时,将过滤的等分部分冷冻在-20℃下。通过以下方式测量稀释于0.005M H2SO4中的样品的糖浓度:使用4.6X250mmHPX-87H柱(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国),通过用0.05%w/w苯甲酸-0.005M H2SO4在65℃、以0.6ml/分钟的流速洗脱,并且通过整合来自由纯糖样品标定的折射指数检测(1100HPLC,安捷伦科技(Agilent Technologies),美国加州圣克拉拉(Santa Clara,CA,USA))的葡萄糖信号进行定量。使用所得葡萄糖来计算每种反应的纤维素转化百分比。

针对适当稀释因子来调节所测量的葡萄糖浓度。通过针对零时间点时未洗涤的PCS中的相应背景葡萄糖浓度调节所测量的葡萄糖浓度来确定从未洗涤的PCS酶促产生的葡萄糖的净浓度。使用MICROSOFT EXCELTM软件(微软,美国华盛顿里奇兰(Richland,WA,USA))来进行所有HPLC数据处理。

使用以下等式来计算纤维素转化成葡萄糖的程度:转化%=(葡萄糖浓度/限制消化中的葡萄糖浓度)X 100。为了计算转化%,基于纤维素酶对照(100mg里氏木霉纤维素酶/克纤维素)设定一个100%转化点,并且将所有值除以这个数并且然后乘以100。将三份数据点取平均值并且计算标准差。

实例6:酶组合物的制备

如在WO 2011/057140中所描述,在米曲霉中重组地制备烟曲霉GH7A纤维二糖水解酶I(SEQ ID NO:13[DNA序列]以及SEQ ID NO:14[推导的氨基酸序列])。烟曲霉纤维二糖水解酶I的过滤的培养液使用配备有10kDa聚醚砜膜(颇尔滤清器公司(Pall Filtron),美国麻萨诸塞州诺斯伯勒(Northborough,MA,USA))的切向流动浓缩器(颇尔滤清器公司,美国麻萨诸塞州诺斯伯勒)进行浓缩并且用20mM Tris-HCl pH 8.0进行缓冲液交换。将烟曲霉纤维二糖水解酶I的脱盐培养液装载到在20mM Tris-HCl pH 8中平衡的Q离子交换柱(GE医疗公司,美国新泽西州皮斯卡特维)中,并且用从0至1mM NaCl线性梯度进行洗脱。收集级分并且使用8%-16%无染色(Stain-free)SDS-PAGE凝胶(伯乐实验室公司,赫拉克勒斯,加利福尼亚州,美国)、基于SDS-PAGE分析以合并包含纤维二糖水解酶I的部分。

如WO 2011/057140中所描述在米曲霉中重组制备烟曲霉GH6A纤维二糖水解酶II(SEQ ID NO:15[DNA序列]和SEQ ID NO:16[推导的氨基酸序列])。将烟曲霉纤维二糖水解酶II的过滤的培养液使用400ml SEPHADEXTM G-25柱(通用电气医疗集团,英国)缓冲液交换进20mM Tris(pH 8.0)中。合并级分并且调节至1.2M硫酸铵-20mM Tris(pH 8.0)。将平衡的蛋白质装载在用1.2M硫酸铵在20mM Tris(pH8.0)中平衡的PHENYL SEPHAROSETM 6快流柱(高载量)(通用电气医疗集团,皮斯卡塔韦,新泽西州,美国)中,并且用不具有硫酸铵的20mM Tris(pH 8.0)洗脱结合的蛋白质。合并级分。

将米曲霉用作宿主,根据WO 2011/057140重组地制备里氏木霉GH5内切葡聚糖酶II(SEQ ID NO:17[DNA序列]和SEQ ID NO:18[推导的氨基酸序列])。将里氏木霉内切葡聚糖酶II的过滤的培养液脱盐并且使用切向流(10K膜,颇尔公司(Pall Corporation))缓冲液交换进20mM Tris pH 8.0中。

将米曲霉BECh2(WO 2000/39322)用作宿主,根据WO 2006/078256重组地制备烟曲霉GH10木聚糖酶(xyn3)(SEQ ID NO:19[DNA序列]和SEQ ID NO:20[推导的氨基酸序列])。使用26/10脱盐柱(GE医疗公司,美国新泽西州皮斯卡特维)将烟曲霉木聚糖酶的过滤的培养液脱盐并缓冲液交换进50mM乙酸钠pH 5.0中。

将米曲霉用作宿主,根据WO 2005/047499重组制备烟曲霉NN055679Cel3Aβ-葡糖苷酶(SEQ ID NO:21[DNA序列]和SEQ ID NO:22[推导的氨基酸序列])。用20%乙酸钠将过滤的培养液调节至pH8.0,这使得该溶液浑浊。为了去除浑浊,将该溶液在20000x g下离心20分钟,并且通过0.2μm过滤单元(耐洁公司(Nalgene),美国纽约罗切斯特(Rochester,NY,USA))过滤上清液。用去离子水稀释该滤液,以达到与50mM Tris-HCl(pH 8.0)相同的传导性。将调节的酶溶液施加到在50mM Tris-HCl(pH 8.0)中平衡的Q快流柱(通用电气医疗集团,美国新泽西州皮斯卡特维)中,并且用从0至500mM氯化钠的线性梯度进行洗脱。合并各部分并且用1%(w/v)活性炭处理,以从β-葡糖苷酶池去除颜色。通过经由0.2μm过滤装置过滤悬浮液去除炭。将滤液用20%乙酸调节至pH 5.0并且用去离子水稀释10倍。将调节的滤液施加到在10mM琥珀酸(pH 5.0)中平衡的SP快流柱中,并且用0至500mM氯化钠的线性梯度进行洗脱。

如在WO 2011/057140中所描述,在米曲霉中重组地制备烟曲霉NN051616GH3β-木糖苷酶(SEQ ID NO:23[DNA序列]以及SEQ ID NO:24[推导的氨基酸序列])。使用26/10脱盐柱将烟曲霉β-木糖苷酶的过滤的培养液脱盐并缓冲液交换进50mM乙酸钠pH 5.0中。

使用微板BCATM蛋白测定试剂盒(Microplate BCATM Protein Assay Kit)(赛默飞世尔科技,沃尔瑟姆,马萨诸塞州,美国)确定上述每种单组分的蛋白浓度,在该试剂盒中将牛血清白蛋白用作蛋白标准品。制备一种酶组合物,其由如下各单组分构成:37%烟曲霉Cel7A纤维二糖水解酶I、25%烟曲霉Cel6A纤维二糖水解酶II、10%里氏木霉GH5内切葡聚糖酶II、5%烟曲霉GH10木聚糖酶、5%烟曲霉β-葡糖苷酶、以及3%烟曲霉β-木糖苷酶。在此将该酶组合物指定未“纤维素分解酶组合物”。

实例7:丝衣霉状篮状菌GH61多肽对通过纤维素分解酶组合物进行的碾磨的未洗涤的PCS的水解的影响

针对在50℃、55℃、60℃、以及65℃在2.55mg总蛋白质/g纤维素的情况下通过纤维素分解酶组合物(实例6)增强碾磨的未洗涤的PCS(实例5)的水解的能力评价丝衣霉状篮状菌P24GAB和P24GEH GH61多肽。以0.45mg蛋白质/g纤维素添加丝衣霉状篮状菌GH61多肽。该纤维素分解酶组合物也在未以3.0mg蛋白质/g纤维素添加GH61多肽的情况下运行。

如在实例5中所描述进行测定。将具有碾磨的未洗涤的PCS(5%不溶性固形物)的1ml反应在含有1mM硫酸锰的50mM乙酸钠(pH5.0)缓冲液中进行72小时。所有反应一式三份地进行并且涉及在水解开始时的单一混合。

如图1中所示,包括丝衣霉状篮状菌P24GAB GH61多肽的纤维素分解酶组合物显著胜过不含GH61多肽的纤维素分解酶组合物(2.55mg蛋白质/g纤维素和3.0mg蛋白质/g纤维素)。在50℃、55℃、60℃、以及65℃,尤其在50℃、55℃、以及60℃下,添加了丝衣霉状篮状菌GH61多肽的纤维素分解酶组合物的纤维素转化为葡萄糖的程度显著高于未添加GH61的纤维素分解酶组合物的情况。

如图2中所示,包括丝衣霉状篮状菌P24GEH GH61多肽的纤维素分解酶组合物显著胜过不含GH61多肽的纤维素分解酶组合物(2.55mg蛋白质/g纤维素和3.0mg蛋白质/g纤维素)。在50℃、55℃、60℃、以及65℃,尤其在50℃、55℃、以及60℃下,添加了GH61多肽的纤维素分解酶组合物的纤维素转化为葡萄糖的程度显著高于未添加GH61的纤维素分解酶组合物的情况。

通过以下编号的段落进一步说明本发明:

[1]一种具有纤维素分解增强活性的分离的多肽,该分离的多肽选自下组,该组由以下各项组成:(a)与SEQ ID NO:2的成熟多肽具有至少71%序列一致性或与SEQ ID NO:4的成熟多肽具有至少75%序列一致性的一种多肽;(b)由以下多核苷酸编码的一种多肽,该多核苷酸在至少高严谨度条件下与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列、或SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交;(c)由以下多核苷酸编码的一种多肽,该多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少71%序列一致性,或与SEQ ID NO:3的成熟多肽编码序列具有至少75%序列一致性;(d)SEQ ID NO:2或SEQ ID NO:4的成熟多肽的一种变体,该变体在一个或多个位置处包括一个取代、缺失和/或插入;以及(e)(a)、(b)、(c)、或(d)的多肽的一个片段,该片段具有纤维素分解增强活性。

[2]如段落1所述的多肽,该多肽与SEQ ID NO:2的成熟多肽具有至少71%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,或与SEQ ID NO:4的成熟多肽具有至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。

[3]如段落1所述的多肽,其由如下一种多核苷酸编码,该多核苷酸在至少高严谨度条件下或至少非常高严谨度条件下与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列、SEQ ID NO:3的成熟多肽编码序列或其全长互补体杂交。

[4]如段落1所述的多肽,其由如下一种多核苷酸编码,该多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少71%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,或与SEQ ID NO:3的成熟多肽编码序列具有至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。

[5]如段落1-4中任一项所述的多肽,该多肽包括SEQ ID NO:2、SEQ ID NO:4,SEQ ID NO:2的成熟多肽或SEQ ID NO:4的成熟多肽或由其组成。

[6]如段落5所述的多肽,其中该成熟多肽是SEQ ID NO:2的氨基酸26至408或SEQ ID NO:4的氨基酸23至395。

[7]如段落1所述的多肽,该多肽是SEQ ID NO:2或SEQ ID NO:4的成熟多肽的一种变体,该变体在一个或多个位置处包括一个取代、缺失和/或插入。

[8]如段落1-7中任一项所述的多肽,该多肽是SEQ ID NO:2或SEQ ID NO:4的一个片段,其中该片段具有纤维素分解增强活性。

[9]如段落1-8中任一项所述的多肽,该多肽是由丝衣霉状篮状菌CBS 413.71中包含的多核苷酸编码。

[10]一种包括一个催化结构域的分离的多肽,该催化结构域选自下组,该组由以下各项组成:(a)与SEQ ID NO:2的氨基酸26到250具有至少71%序列一致性,或与SEQ ID NO:4的氨基酸23到253具有至少83%序列一致性的一个催化结构域;(b)由以下多核苷酸编码的一个催化结构域,该多核苷酸在至少高严谨度条件下与SEQ ID NO:1的核苷酸76至806或其cDNA序列,或SEQ ID NO:3的核苷酸67至759或其全长互补体杂交;(c)由以下多核苷酸编码的一个催化结构域,该多核苷酸与SEQ ID NO:1的核苷酸76至806或其cDNA序列具有至少71%序列一致性,或与SEQ ID NO:3的核苷酸67至759具有至少83%序列一致性;(d)SEQ ID NO:2的氨基酸26到250或SEQ ID NO:4的氨基酸23到253的一种变体,该变体在一个或多个位置处包括一个取代、缺失和/或插入;以及(e)(a)、(b)、(c)、或(d)的催化结构域的一个片段,该片段具有纤维素分解增强活性。

[11]如段落10所述的多肽,该多肽进一步包括一个纤维素结合结构域。

[12]一种分离的多肽,该分离的多肽包括可操作地连接至一个催化结构域的纤维素结合结构域,其中该结合结构域选自下组,该组由以下各项组成:(a)与SEQ ID NO:2的氨基酸317到378具有至少60%序列一致性,或与SEQ ID NO:4的氨基酸357到394具有至少85%序列一致性的一个纤维素结合结构域;(b)由以下多核苷酸编码的一个纤维素结合结构域,该多核苷酸在至少高严谨度条件下与SEQ ID NO:1的核苷酸1005至1278或其cDNA序列,或SEQ ID NO:3的核苷酸1069至1182或其全长互补体杂交;(c)由以下多核苷酸编码的一个纤维素结合结构域,该多核苷酸与SEQ ID NO:1的核苷酸1005至1278或其cDNA序列具有至少60%序列一致性,或与SEQ ID NO:3的核苷酸1069至1182具有至少85%序列一致性;(d)SEQ ID NO:2的氨基酸317到378或SEQ ID NO:4的氨基酸357到394的一种变体,该变体在一个或多个位置处包括一个取代、缺失和/或插入;以及(e)(a)、(b)、(c)、或(d)的纤维素结合结构域的一个片段,该片段具有结合活性。

[13]如段落12所述的多肽,其中该催化结构域获得自水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶,例如氨肽酶、淀粉酶、碳水化合物酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、木聚糖酶或β-木糖苷酶。

[14]一种组合物,该组合物包括如段落1-13中任一项所述的多肽。

[15]一种分离的多核苷酸,该多核苷酸编码如段落1-13中任一项所述的多肽。

[16]一种核酸构建体或表达载体,该核酸构建体或表达载体包括如段落15所述的多核苷酸,该多核苷酸可操作地连接至指导多肽在一个表达宿主内产生的一个或多个控制序列。

[17]一种重组宿主细胞,该重组宿主细胞包括如段落15所述的多核苷酸,该多核苷酸可操作地连接至指导多肽的产生的一个或多个控制序列。

[18]一种产生如段落1-13中任一项所述的多肽的方法,该方法包括:在有益于产生该多肽的条件下培养一种细胞,该细胞以其野生型形式产生该多肽。

[19]如段落18所述的方法,该方法进一步包括回收该多肽。

[20]一种产生具有纤维素分解增强活性的多肽的方法,该方法包括:在有益于产生该多肽的条件下培养如段落17所述的宿主细胞。

[21]如段落20所述的方法,该方法进一步包括回收该多肽。

[22]用编码如段落1-13中任一项所述的多肽的多核苷酸转化的一种转基因植物、植物部分或植物细胞。

[23]一种产生具有纤维素分解增强活性的多肽的方法,该方法包括:在有益于产生该多肽的条件下培养如段落22所述的转基因植物或植物细胞。

[24]如段落23所述的方法,该方法进一步包括回收该多肽。

[25]一种产生亲本细胞的突变体的方法,该方法包括使编码如段落1-13中任一项所述的多肽的多核苷酸失活,这导致突变体比该亲本细胞产生的多肽少。

[26]一种通过如段落25所述的方法产生的突变体细胞。

[27]如段落26所述的突变体细胞,该突变体细胞进一步包括一个编码天然或异源蛋白质的基因。

[28]一种产生蛋白质的方法,该方法包括:在有益于产生该蛋白质的条件下培养如段落26或27所述的突变体细胞。

[29]如段落28所述的方法,该方法进一步包括回收该蛋白质。

[30]一种包括如段落15所述的多核苷酸的子序列的双链抑制性RNA(dsRNA)分子,其中可任选地,该dsRNA是一个siRNA或miRNA分子。

[31]如段落30所述的双链抑制性RNA(dsRNA)分子,该分子长约15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个或更多个双核苷酸。

[32]一种抑制具有纤维素分解增强活性的多肽在细胞中的表达的方法,该方法包括向该细胞给予或在该细胞中表达如段落30或31所述的双链抑制性RNA(dsRNA)分子。

[33]一种通过如段落32所述的方法产生的细胞。

[34]如段落33所述的细胞,该细胞进一步包括一个编码天然或异源蛋白质的基因。

[35]一种产生蛋白质的方法,该方法包括:在有益于产生该蛋白质的条件下培养如段落33或34所述的细胞。

[36]如段落35所述的方法,该方法进一步包括回收该蛋白质。

[37]一种编码信号肽的分离的多核苷酸,该信号肽包含SEQ ID NO:2的氨基酸1至25或SEQ ID NO:4的氨基酸1至22或由其组成。

[38]一种核酸构建体或表达载体,该核酸构建体或表达载体包括一个编码可操作地连接至如段落37所述的多核苷酸上的蛋白质的基因,其中该基因对于编码该信号肽的多核苷酸来说是异源的。

[39]一种重组宿主细胞,该重组宿主细胞包括一个编码可操作地连接至如段落37所述的多核苷酸上的蛋白质的基因,其中该基因对于编码该信号肽的多核苷酸来说是异源的。

[40]一种产生蛋白质的方法,该方法包括:在有益于产生该蛋白质的条件下培养一种重组宿主细胞,该重组宿主细胞包括一个编码可操作地连接至如段落37所述的多核苷酸上的蛋白质的基因,其中该基因对于编码该信号肽的多核苷酸来说是异源的。

[41]如段落40所述的方法,该方法进一步包括回收该蛋白质。

[42]一种用于降解纤维素材料的工艺,包括:在如段落1-13中任一项所述的具有纤维素分解增强活性的多肽的存在下,用一种酶组合物处理该纤维素材料。

[43]如段落42所述的工艺,其中该纤维素材料经过了预处理。

[44]如段落42或43所述的工艺,其中该酶组合物包含选自下组的一种或多种酶,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、CIP、酯酶、扩张蛋白、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及膨胀蛋白。

[45]如段落44所述的工艺,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。

[46]如段落44所述的工艺,其中该半纤维素酶是一种或多种选自下组的酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。

[47]如段落42-46中任一项所述的工艺,该工艺进一步包括回收降解的纤维素材料。

[48]如段落47所述的工艺,其中该降解的纤维素材料是一种糖。

[49]如段落48所述的工艺,其中该糖选自下组,该组由以下各项组成:葡萄糖、木糖、甘露糖、半乳糖、以及阿拉伯糖。

[50]一种用于产生发酵产物的工艺,该工艺包括:(a)在如段落1-13中任一项所述的具有纤维素分解增强活性的多肽的存在下,用一种酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物对糖化的纤维素材料进行发酵,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。

[51]如段落50所述的工艺,其中该纤维素材料经过了预处理。

[52]如段落50或51所述的工艺,其中该酶组合物包含选自下组的一种或多种酶,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、CIP、酯酶、扩张蛋白、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及膨胀蛋白。

[53]如段落52所述的工艺,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。

[54]如段落52所述的工艺,其中该半纤维素酶是一种或多种选自下组的酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。

[55]如段落50-54中任一项所述的工艺,其中步骤(a)和步骤(b)是在同时发生的糖化和发酵中同时进行。

[56]如段落50-55中任一项所述的工艺,其中该发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。

[57]一种发酵纤维素材料的工艺,包括:用一种或多种发酵微生物发酵该纤维素材料,其中在如段落1-13中任一项所述的具有纤维素分解增强活性的多肽的存在下,用一种酶组合物糖化该纤维素材料。

[58]如段落57所述的工艺,其中发酵该纤维素材料产生一种发酵产物。

[59]如段落58所述的工艺,进一步包括从发酵中回收该发酵产物。

[60]如段落57-59中任一项所述的工艺,其中在糖化之前,对该纤维素材料进行预处理。

[61]如段落57-60中任一项所述的工艺,其中该酶组合物包含选自下组的一种或多种酶,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、CIP、酯酶、扩张蛋白、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及膨胀蛋白。

[62]如段落61所述的工艺,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。

[63]如段落61所述的工艺,其中该半纤维素酶是一种或多种选自下组的酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。

[64]如段落58-63中任一项所述的工艺,其中该发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。

[65]一种全培养液配制品或细胞培养组合物,包括如段落1-13中任一项所述的多肽。

在此描述并且要求的本发明不限于在此披露的具体方面的范围,因为这些方面意图作为本发明若干方面的说明。预期任何等效方面都处于本发明的范围内。实际上,除在此所示和描述的那些之外,本发明的不同修改对于本领域普通技术人员而言从前述描述将变得清楚。这类修改也旨在落入所附权利要求书的范围内。在有冲突的情况下,以包括定义的本披露为准。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1