具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸的制作方法

文档序号:3563004阅读:654来源:国知局

专利名称::具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸的制作方法
技术领域
:本发明涉及具有纤维素分解增强活性的分离的多肽和编码该多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用所述多肽的方法。相关技术描述纤维素是单糖葡萄糖通过β-1,4_键连接的聚合物。许多微生物产生水解β_连接葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化所述纤维素聚合物,使其开放以受到纤维二糖水解酶的攻击。纤维二糖水解酶按顺序自所述纤维素聚合物末端释放纤维二糖分子。纤维二糖是葡萄糖水溶性的β-1,4-连接二聚体。β-葡糖苷酶将纤维二糖水解为葡萄糖。将木素纤维素原料转化为乙醇具有如下优点大量原料现成可得,期望避免焚烧或填埋所述材料,以及乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物已经被考虑作为供乙醇产生的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦纤维素转换为葡萄糖,葡萄糖即容易地由酵母发酵为乙醇。在本领域中,改善转化纤维素原料的能力应是有利的。WO2005/074647公开了来自土生梭孢霉(Thielaviaterrestris)的具有纤维素分解增强活性的分离的多肽及其多核苷酸。WO2005/074656公开了来自橙色热子囊菌(Thermoascusaurantiacus)的具有纤维素分解增强活性的分离的多肽及其多核苷酸。WO2007/089290公开了来自里氏木霉(Trichodermareesei)的具有纤维素分解增强活性的分离的多肽及其多核苷酸。本发明涉及具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸。
发明内容本发明涉及选自下组的具有纤维素分解增强活性的分离的多肽(a)一种多肽,其包含与SEQIDNO2的成熟多肽具有至少60%同一性的氨基酸序列;(b)一种由如下多核苷酸编码的多肽,所述多核苷酸在至少中等严紧条件下与以下杂交(i)SEQIDNO1的成熟多肽编码序列,(ii)包含于SEQIDNO1的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;4(c)一种由如下多核苷酸编码的多肽,所述多核苷酸包含与SEQIDN0:1的成熟多肽编码序列具有至少60%同一性的核苷酸序列;和(d)一种变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQIDNO2的成熟多肽。本发明还涉及选自下组的分离的多核苷酸,其编码具有纤维素分解增强活性的多肽(a)一种多核苷酸,其编码包含与SEQIDNO2的成熟多肽具有至少60%同一性的氨基酸序列的多肽;(b)一种多核苷酸,其在至少中等严紧条件下与以下杂交(i)SEQIDNO1的成熟多肽编码序列,(ii)包含于SEQIDNO1的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(c)一种多核苷酸,其包含与SEQIDNO=I的成熟多肽编码序列具有至少60%同一性的核苷酸序列;和(d)一种多核苷酸,其编码一种变体,该变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQIDNO2的成熟多肽。本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体、重组宿主细胞,和产生具有纤维素分解增强活性的多肽的方法。本发明还涉及抑制细胞中具有纤维素分解增强活性的多肽表达的方法,包括向所述细胞施用或在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含本发明的多核苷酸的亚序列。本发明还涉及这样的双链抑制性RNA(dsRNA)分子,其中任选地所述dsRNA是siRNA或miRNA分子。本发明还涉及供降解或转化纤维素材料的方法,包括用纤维素分解酶组合物在这样的具有纤维素分解增强活性的多肽存在下处理所述纤维素材料,其中所述具有纤维素分解增强活性的多肽的存在与该具有纤维素分解增强活性的多肽不存在时相比,增加了纤维素材料的降解。本发明还涉及产生发酵产物的方法,包括(a)用纤维素分解酶组合物在具有纤维素分解增强活性的多肽存在下糖化纤维素材料,其中所述具有纤维素分解增强活性的多肽的存在与该具有纤维素分解增强活性的多肽不存在时相比,增加了纤维素材料的降解;(b)用一种或多种发酵微生物发酵步骤(a)中糖化的纤维素材料以产生所述发酵产物;和(c)自发酵回收所述发酵产物。本发明还涉及发酵纤维素材料的方法,包括用一种或多种发酵微生物发酵所述纤维素材料,其中所述纤维素材料是用纤维素分解酶组合物在本发明的具有纤维素分解增强活性的多肽存在下糖化的,且所述具有纤维素分解增强活性的多肽的存在与该具有纤维素分解增强活性的多肽不存在时相比,增加了所述纤维素材料的降解。本发明还涉及包含编码具有纤维素分解增强活性的多肽的分离多核苷酸的植物。本发明还涉及产生具有纤维素分解增强活性的多肽的方法,包括(a)在有助于下述多肽产生的条件下,培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码所述具有纤维素分解增强活性的多肽的多核苷酸;和(b)回收所述多肽。本发明进一步涉及包含编码蛋白质的基因的核酸构建体,其中所述基因可操作地连接于编码信号肽的核苷酸序列,所述信号肽包含SEQIDNO:2的氨基酸1到15或由其组成,其中所述基因对所述核苷酸序列是外源的。附图简述图1显示具有纤维素分解增强活性的嗜热毁丝霉(Myceliophthorathermophila)CBS202.75GH61B多肽的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNOs1禾口2)。图2显示pSMail93的限制图谱。图3显示pSMail89的限制图谱。定义纤维素分解增强活性术语“纤维素分解增强活性”在本文中定义为下述生物学活性,即其增强具有纤维素分解活性的蛋白质对纤维素材料的水解。就本发明而言,纤维素分解增强活性通过测定由于纤维素酶蛋白对纤维素材料在下述条件下进行的水解导致的还原糖的增加或总纤维二糖和葡萄糖的增加所确定l_50mg的总蛋白质/gPCS中的纤维素,其中总蛋白质包含80-99.5%w/w纤维素酶蛋白/gPCS中的纤维素和0.2-20%w/w具有纤维素分解增强活性的蛋白质,在50°C下进行1-7日,与下述对照水解相比较,即其具有相等的总蛋白质上样,但无纤维素分解增强活性(l-50mg的纤维素分解蛋白/gPCS中的纤维素)。在优选的方面,将在3%总蛋白质重量的米曲霉(Aspergillusoryzae)β-葡糖苷酶(根据WO02/095014在米曲霉中重组产生)或3%总蛋白质重量的烟曲霉(Aspergillusfumigatus)β-葡糖苷酶(根据WO02/095014的实施例22在米曲霉中重组产生)的纤维素酶蛋白上样存在下的CELLUCLAST1.5L(NovozymesA/S,Bagsvaerd,Denmark)混合物用作所述纤维素分解活性的来源。具有纤维素分解增强活性的多肽具有SEQIDNO2的成熟多肽的纤维素分解增强活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%。所述具有纤维素分解增强活性的多肽通过将达到同等程度所需的水解纤维素分解酶的量减少至少0.1倍,更优选至少0.2倍,更优选至少0.3倍,更优选至少0.4倍,更优选至少0.5倍,更优选至少1倍,更优选至少3倍,更优选至少4倍,更优选至少5倍,更优选至少10倍,更优选至少20倍,甚至更优选至少30倍,最优选至少50倍,且甚至最优选至少100倍来增强具有纤维素分解活性的蛋白质催化的对纤维素材料的水解。纤维素分解活性术语“纤维素分解活性”在本文中定义为水解纤维素材料的生物学活性。纤维素分解蛋白可水解或会水解羧甲基纤维素(CMC),由此减少温育混合物的粘度。所导致的粘度减少可通过振动粘度计(vibrationviscosimeter)(例如,来自Sofraser,France的MIVI3000)来确定。以CellulaseViscosityUnit(纤维素酶粘度单位)(CEVU)的形式测量纤维素酶活性,是通过测定样品减少羧甲基纤维素(CMC)溶液粘度的能力来量化存在于该样品中的催化活性的量。所述分析法在适于所述纤维素分解蛋白与底物的温度与PH下进行。对于CELLUCLAST(NovozymesA/S,Bagsvaerd,Denmark),该分析法在40°C下在0.IM磷酸盐pH9.0缓冲液中以CMC作为底物(33.3g/L羧甲基纤维素Hercules7LFD)以及大约3.3-4.2CEVU/ml的酶浓度进行。所述CEVU活性相对于已公知的酶标准,例如CELLUZYMEStandard17_1194(得自NovozymesA/S,Bagsvaerd,Denmark)来计算。为了本发明的目标,纤维素分解活性通过测定在下述条件下由纤维素分解混合物进行的纤维素材料水解的增加来确定=I-IOmg的纤维素分解蛋白/g的PCS纤维素在50°C下进行5-7日,与未添加纤维素分解蛋白的对照水解相比较。内切葡聚糖酶术语“内切葡聚糖酶”在本文中定义为内-1,4_(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(Ε.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉中的1,4-β-D-糖苷联结,混合型β-1,3-葡聚糖如谷物β-D-葡聚糖或木葡聚糖,以及其它含有纤维素成分的植物材料中β-1,4-键的内水解。就本发明而言,内切葡聚糖酶活性使用羧甲基纤维素(CMC)水解根据Ghose,1987,PureandApp1.Chem.59:257_268的方法加以确定。纤维二糖水解酶术语“纤维二糖水解酶”在本文中定义为一种1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化水解纤维素、纤维寡糖、或任何含β-1,4-连接的葡萄糖的聚合物中1,4-β-D-葡糖苷联结,从链的还原端或非还原端释放纤维二糖。就本发明而言,纤维二糖水解酶活性是依照Lever等,1972,Anal.Biochem.47:273_279和vanTilbeurgh等,1982,FEBSLetters149:152_156;vanTilbeurgh禾口Claeyssens,1985,FEBSLetters187:283_288记载的程序加以测定的。在本发明中,所述Lever等的方法用于估计玉米秸秆中纤维素的水解,而vanTilbeurgh等的方法用于依靠荧光性的二糖衍生物来确定纤维二糖水解酶活性。β-葡糖苷酶术语“β-葡糖苷酶”在本文中定义为一种β-D-葡糖苷葡糖水解酶(Ε.C.3.2.1.21),其催化水解末端非还原性β-D-葡萄糖残基,并释放β-D-葡萄糖。就本发明而言,β-葡糖苷酶活性是根据Venturi等,2002,J.BasicMicrobiol.42:55_66记载的基本方法来测定的,除非如此处所述使用了不同的条件。一个单位的葡糖苷酶活性定义为在IOOmM柠檬酸钠、0.01%TWEEN20中,50°C、pH5条件下每分钟从作为底物的4mM对硝基苯基-β-D-吡喃葡萄糖苷产生1.0微摩尔对硝基苯酚。家族61糖苷水解酶术语“家族61糖苷水解酶”或“家族GH61”在本文中定义为根据HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316,禾口HenrissatB.,andBairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316:695_696落入糖苷水解酶家族61的多肽。目前,Henrissat将GH61家族列为未分类的,这指明对属于该家族的多肽,如机理,催化性亲核体/碱,催化性质子供体,以及3D结构等性质尚在未知之数。纤维素材料所述纤维素材料可以是任何含有纤维素的材料。生物质的初生细胞壁中主要的多糖是纤维素,丰度第二高的是半纤维素,第三是果胶。在细胞停止生长后产生的次生细胞壁也含有多糖,并且通过与半纤维素共价交联的多聚体木质素而加强。纤维素是脱水纤维二糖的均聚物,并因此是一种直链i3-(l_4)-D-葡聚糖,而半纤维素包括多种化合物,如木聚糖、木葡聚糖、阿拉伯木聚糖和甘露聚糖,具有复杂的分枝结构和一系列取代基。虽然纤维素一般是无定形的,但植物组织中发现的纤维素主要为由平行葡聚糖链构成的不溶性晶体基质。半纤维素通常通过氢键键合于纤维素以及其他半纤维素上,这有助于细胞壁基质的稳定化。纤维素通常存在于例如植株的茎、叶、果/种壳(hulls)、果/种皮(husks)和穗轴(cobs),或者树的叶、枝、和木材等之中。纤维素材料可以是,但不限于,草本材料(herbaceousmaterial)、农业残余物(agriculturalresidues)、林业残余物(forestryresidues)、城市固体废物(municipalsolidwastes)、废氏(wastepaper),以及氏楽禾口造纸厂残余物(pulpmdpapermillresidue)。纤维素材料可以是任何类型的生物质,包括但不限于木材资源、城市固体废物、废纸、作物和作物残余物(见例如Wiselogel等,1995,《HandbookonBioethanol》(CharlesE.Wyman编),第105-118页,Taylor&Francis,WashingtonD.C.;Wyman,1994,BioresourceTechnology50:3_16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25:695_719;Mosier等,1999,RecentProgressinBioconversionofLignocellulosics,((AdvancesinBiochemicalEngineering/Biotechnology》,!1·Scheper总编,第65卷,第23-40页,Springer-Verlag,NewYork)。在本文中应当理解,纤维素可为木素纤维素的形式,即在混合的基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。在优选的方面,所述纤维素材料是木素纤维素。在一方面,所述纤维素材料为草本材料。在另一方面,所述纤维素材料为农业残余物。在另一方面,所述纤维素材料为林业残余物。在另一方面,所述纤维素材料为城市固体废物。在另一方面,所述纤维素材料为废纸。在另一方面,所述纤维素材料为纸浆和造纸厂残余物。在另一方面,所述纤维素材料为玉米秸秆。在另一优选的方面,所述纤维素材料为玉米纤维。在另一方面,所述纤维素材料为玉米穗轴。在另一方面,所述纤维素材料为橙皮。在另一方面,所述纤维素材料为稻秆。在另一方面所述纤维素材料为麦秆。在另一方面,所述纤维素材料为柳枝稷(switchgrass)。在另一方面,所述纤维素材料为芒草(miscanthus)。在另一方面,所述纤维素材料为甘蔗渣。在另一个优选的方面,所述纤维素材料是微晶纤维素。在另一个方面,所述纤维素材料是细菌纤维素。纤维素材料可以直接使用,或者可以使用本文中描述的本领域已知的常规方法对其进行预处理。在优选的方面,所述纤维素材料经预处理。预处理玉米秸秆术语“PCS”或“预处理的玉米秸秆”在本文中定义为通过用热和稀酸处理从玉米秸秆衍生的纤维素材料。分离的多肽术语“分离的多肽”用于本文中指从来源分离的多肽。在优选的方面,如通过SDS-PAGE测定的,所述多肽为至少纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且最优选至少90%纯。基本上纯的多肽术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的(associated)其它多肽材料。因此,优选所述基本上纯的多肽按存在于制备物中的全部多肽材料的重量计是至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选是8基本上纯的形式,即所述多肽制备物基本上(essentially)不含与其天然或重组结合的其它多肽材料。例如,这能够通过如下实现通过公知的重组方法或通过经典纯化方法制备多肽。成熟多肽术语“成熟多肽”在本文中定义为以其在翻译和任何翻译后修饰(如N-末端加工、C-末端截短、糖基化、磷酸化等)之后的最终形式存在的多肽。在优选的方面,基于预测SEQIDNO:2的氨基酸1-15是信号肽的SignalP程序(Nielsen等,1997,ProteinEngineering101-6),所述成熟多肽是SEQIDNO:2的氨基酸16-310。成熟多肽编码序列术语“成熟多肽编码序列”在本文中定义为编码具有纤维素分解增强活性的成熟多肽的核苷酸序列。在优选的方面,基于SignalP程序所述成熟多肽编码序列是SEQIDNO:1的核苷酸46-1250,该程序预测SEQIDNO1的核苷酸1_45编码信号肽。同一性两个氨基酸序列之间或两个核苷酸序列之间的相关性由参数“同一性”来描述。就本发明而言,两个氨基酸序列之间的同一性程度是使用如EMBOSS程序包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276_277)(优选版本3.0.0或更新的版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443_453)来测定的。使用的可选参数是缺口产生罚分为10,缺口延伸罚分为0.5,和EBL0SUM62(BL0SUM62的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的(相同的残基XlOO)/(比对的长度-比对中的缺口总数)就本发明而言,两个脱氧核糖核苷酸序列之间的同一性程度使用如EMBOSS程序包(EMBOSSTheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,见上)(优选版本3.0.0或更新的版本)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上)测定。使用的可选参数是缺口产生罚分为10,缺口延伸罚分为0.5,和EDNAFULL(NCBINUC4.4的EMBOSS版本)取代矩阵。将标记为“最长同一性”的Needle输出(使用-nobrief选项获得)用作百分比同一性并且是如下计算的(相同的脱氧核糖核苷酸XlOO)/(比对的长度-比对中的缺口总数)同源序列术语“同源序列”在本文中定义为用SEQIDN0:2的具有纤维素分解增强活性的嗜热毁丝霉多肽或其成熟多肽,在tfasty检索(Pearson,W.R.,1999,于BioinformaticsMethodsandProtocols,S.Misener禾口S.A.Krawetz编,185-219页)中具有小于0.001的E值(或预期分数)的预测蛋白质。多肽片段术语“多肽片段”在本文定义为从SEQIDNO2的成熟多肽或其同源序列的氨基和/或羧基末端缺失了一个或多个(几个)氨基酸的多肽;其中所述片段具有纤维素分解增强活性。在优选的方面,片段含有SEQIDNO:2的成熟多肽或其同源序列的至少250个氨基酸残基,更优选至少265个氨基酸残基,并且最优选至少280个氨基酸残基。亚序列术语“亚序列(subsequence)”在本文中定义为从SEQIDNO1的成熟多肽编码序列的5'和/或3'端缺失了一个或多个(几个)核苷酸的核苷酸序列;或其同源序列;其中所述亚序列编码具有纤维素分解增强活性的多肽片段。在优选的方面,亚序列含有SEQIDNO:1的成熟多肽编码序列或其同源序列的至少750个核苷酸,更优选至少795个核苷酸,并且最优选至少840个核苷酸。等位变体(allelicvariant)术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。分离的多核苷酸术语“分离的多核苷酸”用于本文中指从来源分离的多核苷酸。在优选的方面,如通过琼脂糖电泳测定的,所述多核苷酸为至少纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,并且最优选至少90%纯。基本上纯的多核苷酸术语“基本上纯的多核苷酸”用于本文指多核苷酸制备物,其不含其它外来的或不期望的核苷酸,并且处于适合于在遗传工程蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明的多核苷酸优选为基本上纯的形式,即所述多核苷酸制备物基本上(essentially)不含与其天然或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。编码序列当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始,并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。cDNA术语“cDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少可能存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA的cDNA没有任何内含子序列。核酸构建体术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子以本来不存在于(nototherwiseexist)自然界中的方式修饰以含有核酸的区段或所述核酸分子是合成的。当所述核酸构建体含有表达本发明的编码序列所需的控制序列时,术语核酸构建体与术语“表达盒”同义。控制序列(controlsequence)术语“控制序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的所有组分。各个控制序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各个控制序列对于彼此可以是天然的或外源的。这些控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,控制序列包括启动子和转录和翻译的终止信号。控制序列可以和目的为引入特异10性限制位点的接头一起提供,所述特异性限制位点促进控制序列与编码多肽的核苷酸序列编码区的连接。可操作地连接术语“可操作地连接”在本文表示这样的构型,其中将控制序列置于相对于多核苷酸序列的编码序列的适当位置,使得控制序列指导多肽编码序列的表达。表达术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。宿主细胞如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)0修饰术语“修饰”在本文的意思是,对由SEQIDNO2的成熟多肽组成的多肽或其同源序列的任何化学修饰,以及对编码这样的多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入,以及一个或多个(几个)氨基酸侧链的置换。人工变体当用在本文时,术语“人工变体”的意思是具有纤维素分解增强活性的多肽,所述多肽由表达SEQIDNO:1的成熟多肽编码序列的修饰的多核苷酸序列或其同源序列的生物体产生。所述修饰的核苷酸序列通过人为干预(humanintervention),通过修饰公开于SEQIDNO:1的多核苷酸序列或其同源序列来获得。发明详述具有纤维素分解增强活性的多肽在第一个方面,本发明涉及包含下述氨基酸序列的分离的多肽,所述氨基酸序列与SEQIDNO:2的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、至少97%、至少98%或至少99%的同一性程度,所述多肽具有纤维素分解增强活性(下文中的“同源多肽”)。在优选的方面,所述同源多肽具有的氨基酸序列与SEQIDNO:2的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。本发明的多肽优选包含SEQIDNO2的氨基酸序列或其等位变体;或它们的具有纤维素分解增强活性的片段。在优选的方面,多肽包含SEQIDNO:2的氨基酸序列。在另一优选的方面,多肽包含SEQIDNO:2的成熟多肽。在另一优选的方面,多肽包含SEQIDNO:2的氨基酸16至310,或其等位变体;或它们的具有纤维素分解增强活性的片段。在另一优选的方面,多肽包含SEQIDNO:2的氨基酸16至310。在另一优选的方面,多肽由SEQIDNO2的氨基酸序列或其等位变体,或它们的具有纤维素分解增强活性的片段组成。在另一优选的方面,多肽由SEQIDNO:2的氨基酸序列组成。在另一优选的方面,多肽由SEQIDNO2的成熟多肽组成。在另一优选的方面,多肽由SEQIDNO2的氨基酸16至310或其等位变体,或它们的具有纤维素分解增强活性的片段组成。在另一优选的方面,多肽由SEQIDNO2的氨基酸16至310组成。在第二个方面,本发明涉及具有纤维素分解增强活性的分离的多肽,其由多核苷酸编码,所述多核苷酸在优选极低严紧条件、更优选低严紧条件、更优选中严紧条件、更优选中_高严紧条件、甚至更优选高严紧条件、和最优选非常高严紧条件下与下列杂交(i)SEQIDNO:1的成熟多肽编码序列,(ii)包含于SEQIDNO:1的成熟多肽编码序列中的cDNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch禾口T.Maniatis,1989,MolecularCloning,ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。SEQIDNO1的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可以编码具有纤维素分解增强活性的多肽片段。在优选的方面,所述互补链是SEQIDNO1的成熟多肽编码序列的全长互补链。SEQIDNO1的核苷酸序列或其亚序列;以及SEQIDNO2的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有纤维素分解增强活性的多肽的DNA。具体而言,可将这些探针用于根据标准的Southern印迹方法与感兴趣的属或种的基因组或cDNA杂交,以鉴定并从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14个,优选至少25个,更优选至少35个,并且最优选至少70个核苷酸。然而,优选所述核酸探针长度上是至少100个核苷酸。例如,所述核酸探针长度上可以是至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以使用更长的探针,例如,长度是优选至少600个核苷酸,更优选至少700个核苷酸,或最优选至少800个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。将这些探针包含于本发明中。因而,可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有纤维素分解增强活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQIDNO:1或其亚序列同源的克隆或DNA,将所述载体材料优选用在Sounthern印迹中。就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQIDNO:1的成熟多肽编码序列;包含于SEQIDN01的成熟多肽编码序列中的cDNA序列;其全长互补链;或其亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。在优选的方面,核酸探针是SEQIDNO1的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQIDNO:1的核苷酸46-1250。在另一优选的方面,核酸探针是编码SEQIDNO:2的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQIDNO:1。在另一优选的方面,核酸探针是包含在大肠杆菌(E.coli)NRRLB-50086中的质粒pSMail93中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有纤维素分解增强活性的多肽。在另一优选的方面,核酸探针是包含在大肠杆菌NRRLB-50086中的质粒pSMail93中含有的成熟多肽编码区。对于长度至少100个核苷酸的长探针,将非常低至非常高的严紧条件定义为在42°C,在5XSSPE、0.3%SDS、200yg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%的甲酰胺、对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。对于长度为至少100个核苷酸的长探针,使用2XSSC、0.2%SDS优选在45°C(非常低严紧性),更优选在50°C(低严紧性),更优选在55°C(中严紧性),更优选在60°C(中-高严紧性),甚至更优选在65°C(高严紧性),并且最优选在70°C(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定义为在比使用根据Bolton和McCarthy计算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)计算得出的Tm低大约5°C至大约10°C,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,IXDenhardt溶液,ImM焦磷酸钠(sodiumpyrophosphate),ImM舞酸二Mi内(sodiummonobasicphosphate),0.ImMATP禾口0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6XSSC加0.1%SDS中洗涤一次15分钟,并用6XSSC在比计算得出的T1Jg5°C至10°C的温度洗涤两次,每次15分钟。在第三个方面,本发明涉及由如下多核苷酸编码的具有纤维素分解增强活性的分离的多肽,所述多核苷酸包含与SEQIDNO:1的成熟多肽编码序列具有优选至少60%、更优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、甚至更优选至少90%、最优选至少95%、并且甚至最优选至少96%、至少97%、至少98%、或至少99%同一性程度的核苷酸序列或由所述核苷酸序列组成,其编码活性多肽。参见本文多核苷酸部分。在第四个方面,本发明涉及人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(或几个)氨基酸的SEQIDNO:2的成熟多肽;或其同源序列。优选地,氨基酸改变对性质是较不重要的(ofaminornature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(poly-histidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。保守取代的实例是在以下组之内碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的,并且由例如H.Neuratt^PR.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu禾口Asp/Gly。除了20个基本氨基酸,非基本氨基酸(如4-羟脯氨酸、6-N-甲基赖氨酸、2_氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上可得到的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烧羧酸(thiazolidinecarboxylicacid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适PH等。能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081_1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,纤维素分解增强活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699_4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如deVos等,1992,Science255306-312;Smith等,1992,J.Mol.Biol.224:899_904;Wlodaver等,1992,FEBSLett.30959-64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson禾ΠSauer,1988,Science241:53_57;Bowie禾ΠSauer,1989,Proc.Natl.Acad.Sci.USA862152-2156;WO95/17413;或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失、和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochem.30:10832_10837;美国专利5,223,409号;WO92/06204)和区域定向的诱变(Derbyshire等,1986,Gene46145;Ner等,1988,DNA7127)。诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。SEQIDNO:2的成熟多肽的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。具有纤维素分解增强活性的多肽的来源本发明的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思是核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是胞外分14泌的。本发明具有纤维素分解增强活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽如芽孢杆菌属(Bacillus)、链球菌属(Str印tococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)>?LIf菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)多肽,所述多肽具有纤维素分解增强活性;或革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)>iMlfliiM(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽,所述多肽具有纤维素分解增强活性。在优选的方面,所述多肽是具有纤维素分解增强活性的嗜碱芽孢杆菌(Bacillusalkalophilus)、!军i^^yUfelf胃(Bacillusamyloliquefaciens)^M^^^fM(Bacillusbrevis)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacilluscoagulms)、坚强芽孢杆菌(Bacillusfirmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、短小芽孢杆菌(Bacilluspumilus)、嗜热月旨肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillussubtilis)或苏云金芽孢杆菌(Bacillusthuringiensis)多肽。在另一个优选的方面,所述多肽是具有纤维素分解增强活性的似马链球菌(Streptococcusequisimilis)、酉良月农链球菌(Streptococcuspyogenes)、乳房链球菌(Streptococcusuberis)或马链球菌兽痕亚禾中(Streptococcusequisubsp.Zooepidemicus)多月太。在另一个优选的方面,所述多肽是具有纤维素分解增强活性的不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomycesavermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomycesgriseus)或浅青紫链霉菌(Streptomyceslividans)多月太。本发明具有纤维素分解增强活性的多肽也可以是真菌多肽,并且更优选酵母多肽如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽,其具有纤维素分解增强活性;或更优选丝状真菌多肽如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟錯菌属(Ceriporiopsis)、Chaetomidium、金抱子菌属(Chrysosporium)、Claviceps、Cochliobolus、Coprinopsis、Coptotermes、Corynascus、Cryphonectria、係急球菌属(Cryptococcus)、Diplodia、Exidia、Filibasidium、,廉抱属(Fusarium)、赤霉属(Gibberella)、Holomastigotoides、腐质毒属(Humicola)、奉巴菌属(Irpex)、Lentinula、Leptospaeria、梨抱菌属(Magnaporthe)、Melanocarpus、多孑L菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假漂盘菌属(Pseudoplectania)、Pseudotrichonympha>根毛霉属(Rhizomucor)、裂裙菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)(Tolypocladium)(Trichoderma)、Trichophaea、f^|^i包属(Verticillium)、Volvariella或Xylaria多肽,其具有纤维素分解增强活性。在优选的方面,所述多肽是具有纤维素分解增强活性的卡尔酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一优选的方面,所述多肽是具有纤维素分解增强活性的解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、烟曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、热带金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChrysosporiumzonatum、杆抱状德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、库威,廉抱(Fusariumcrookwellense)、大刀,廉抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、异抱德抱(Fusariumheterosporum)、合欢木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉红德抱(Fusariumroseum)、接骨木德抱(Fusariumsambucinum)、肤色德抱(Fusariumsarcochroum)、拟分枝抱德抱(Fusariumsporotrichioides)、硫色,廉抱(Fusariumsulphureum)、圆德抱(Fusariumtorulosum)、拟丝抱,廉抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰腐质霉(Humicolagrisea)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicolalanuginosa)、Irpexlacteus、米黑毛霉(Mucormiehei)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicilliumfuniculosum)、产紫青霉(Penicilliumpurpurogenum)、黄抱平革菌(Phanerochaetechrysosporium)、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、Thielaviaaustraleinsis、Thielaviafimeti、Thielaviamicrospora、Thielaviaovispora、Thielaviaperuviana、罾包冑(Thielaviaspededonium)、^ι包冑(Thielaviasetosa)、Thielaviasubthermophila、zht—胃(Thielaviaterrestris)Λ哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichodermaviride)多月太。在另一优选的方面,所述多肽是具有纤维素分解增强活性的黄褐毁丝霉(Myceliophthorahinnulea)、Myceliophthoralutea、嗜热毁丝霉、或Myceliophthoravellerea多月太。在一个最优选的方面,所述多肽是具有纤维素分解增强活性的嗜热毁丝霉多肽。16在一个最优选的方面,所述多肽是具有纤维素分解增强活性的嗜热毁丝霉CBS202.75多肽,例如,包含SEQIDNO2的成熟多肽的多肽。可理解的是对于前述的种,本发明包含完全和不完全阶段(perfectandimperfectstates),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域的技术人员会容易地识别适合的等同物的身份(identity)。这些种的菌株在许多培养物保藏机构对于公众能够容易地取得,所述保藏机构如美国典型培养物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物禾口细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌种保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上)。本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使所述融合多肽的表达在相同启动子和终止子的控制下。融合多肽还可以包括切割位点。一旦分泌了融合多肽,就切割所述位点,从融合蛋白释放具有纤维素分解增强活性的多肽。切割位点的实例包括,但不限于,编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568_76;Svetina,2000,J.Biotechnol.76245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488_3493;Ward等,1995,Biotechnology13:498_503;和Contreras等,1991,Biotechnology9:378-381);Ile_(Glu或Asp)-Gly-Arg位点,其在精氨酸残基后通过因子Xa蛋白酶切割(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位点,其在赖氨酸后通过肠激酶切割(Collins-Racie等,1995,Biotechnology13:982_987);His-Tyr-Glu位点或His-Tyr-Asp位点,其通过GenenaseI切割(Carter等,1989,ProteinsStructure,Function,andGenetics6:240_248);Leu-Val-Pro-Arg-Gly-Ser位点,其在Arg后通过凝血酶切割(Stevens,2003,DrugDiscoveryWorld435-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点,其在Gln后通过TEV蛋白酶切割(Stevens,2003,见上);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点,其在Gln后通过遗传工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,见上)。多核苷酸本发明还涉及分离的多核苷酸,其包含编码本发明具有纤维素分解增强活性的多肽的核苷酸序列,或由该核苷酸序列组成。在优选的方面,核苷酸序列包含SEQIDNO1或由SEQIDNO=I组成。在另一更优选的方面,核苷酸序列包含大肠杆菌NRRLB-50086中所含质粒pSMail93中含有的序列,或由该序列组成。在另一优选的方面,核苷酸序列包含SEQIDNO:1的成熟多肽编码序列或由SEQIDNO:1的成熟多肽编码序列组成。在另一优选的方面,核苷酸序列包含SEQIDNO:1的核苷酸46-1250或由SEQIDNO1的核苷酸46-1250组成。在另一更优选的方面,核苷酸序列包含大肠杆菌NRRLB-50086中所含质粒pSMail93中含有的成熟多肽编码序列或由该成熟多肽编码序列组成。本发明还包含编码如下多肽的核苷酸序列,所述多肽包含SEQIDNO:2的氨基酸序列或其成熟多肽,或由SEQIDNO:2的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列不同于SEQIDNO:1或其成熟多肽编码序列。本发明还涉及SEQIDNO:1的亚序列,所述亚序列编码具有纤维素分解增强活性的SEQIDNO2的片段。本发明还涉及突变的多核苷酸,其在SEQIDNO1的成熟多肽编码序列中包含至少一个突变或由具有至少一个突变的SEQIDNO:1的成熟多肽编码序列组成,其中突变的核苷酸序列分别编码SEQIDNO2的成熟多肽。用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,且包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的多核苷酸。参见,例如,Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从毁丝霉属菌株,或另外的或相关的生物体克隆所述多核苷酸,并且因此可以是例如所述核苷酸序列的多肽编码区的等位基因变体或种变体(speciesvariant)。本发明还涉及分离的多核苷酸,其包含下述核苷酸序列或由其组成,所述核苷酸序列与SEQIDNO:1的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、至少97%、至少98%或至少99%的同一性程度,所述多核苷酸编码具有纤维素分解增强活性的多肽。修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适PH等方面不同的人工变体。可以在作为SEQIDNO1的成熟多肽编码序列存在的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,ProteinExpressionandPurification2一107。对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,如定位诱变或丙氨酸分区诱变法(参见,例如,Cunningham和Wells,1989,见上)来鉴定。在后一技术中,将突变引入到分子中的每个荷正电的残基处,并且测试所得突变分子的纤维素分解增强活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物_酶相互作用的位点也能够通过分析三维结构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见,例如,deVos等,1992,见上;Smith等,1992,见上;Wlodaver等,1992,见上)。本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低严紧条件下,优选低严紧条件,更优选中严紧条件,更优选中_高严紧条件,甚至更优选高严紧条件,并且最优选非常高的严紧条件下,与以下杂交(i)SEQIDNO:1的成熟多肽编码序列,()包含于SEQIDNO1的成熟多肽编码序列中的cDNA序列,或(iii)⑴或()的全长互补链,或它们的等位变体和亚序列(Sambrook等,1989,同上),如本文所定义的。在优选的方面,互补链是SEQIDNO:1的成熟多肽编码序列的全长互补链。本发明还涉及通过如下获得的分离的多核苷酸(a)在非常低、低、中、中-高、高或非常高严紧条件下,将DNA的群体与以下杂交(i)SEQIDNO:1的成熟多肽编码序列,()包含于SEQIDNO1的成熟多肽编码序列中含有的cDNA序列,或(iii)⑴或()的全长互补链;和(b)分离杂交的多核苷酸,其编码具有纤维素分解增强活性的多肽。在优选的方面,所述互补链是SEQIDNO1的成熟多肽编码序列的全长互补链。核酸构建体本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸与一个或多个(几个)控制序列可操作地连接,所述控制序列在合适的宿主细胞中在与该控制序列相容的条件下指导编码序列的表达。可以用许多方式操作编码本发明多肽的分离的多核苷酸以供多肽的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。控制序列可以是适当的启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录控制序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子大肠杆菌Iac操纵子、天蓝链霉菌琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α_淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(ViIla-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),\)JsRtac(DeBoer1983,ProceedingsoftheNationalAcademyofSciencesUSA80:21—25)。另外的启动子在〃Usefulproteinsfromrecombinantbacteria"于ScientificAmerican,1980,242:74_94中;和在Sambrook等,1989,见上中描述。用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(W000/56900)、镶片镰孢Daria(WC)00/56900)、镶片镰孢Quirm(W000/56900)、尖镰孢胰蛋白酶样蛋白酶(W096/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截短的和杂合的启动子。在酵母宿主中,有用的启动子从如下酶的基因获得酿酒酵母烯醇化酶(ΕΝ0-1)、酿酒酵母半乳糖激酶(GALl)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUPl)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞有用的其它启动子由Romanos等,1992,Yeast8:423_488描述。控制序列也可以是合适的转录终止子序列,其是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。对于酵母宿主细胞优选的终止子从如下酶的基因获得酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYCl)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞有用的其它终止子由Romanos等,1992,见上描述。控制序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。对于酵母宿主细胞合适的前导序列从如下酶的基因获得酿酒酵母烯醇化酶(ΕΝ0-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。控制序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3,末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为向转录的mRNA添加聚腺苷残基的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,MolecularCellularBiology15:5983_5990描述。控制序列还可以是信号肽编码序列,其编码与多肽的氨基末端相连的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码序列,该信号肽编码序列与编码分泌多肽的编码序列区段一起天然地连接在翻译阅读框中。或者,编码序列5’端可含有对于所述编码序列为外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码序列可在本发明中使用。对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列芽孢杆菌属NCIB11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,MicrobiologicalReviews57109-137描述。对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上描述。在优选的方面,信号肽包含SEQIDNO2的氨基酸1至15或由SEQIDNO2的氨基酸1至15组成。在另一优选的方面,信号肽编码序列包含SEQIDNO1的核苷酸1至45或由SEQIDNO1的核苷酸1至45组成。控制序列还可以是前肽编码序列,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolyp印tide)(或在某些情况下称为酶原(zymogen))0前(多)肽通常是无活性的并且能够通过从前多肽催化或自催化切割所述前肽而转化为成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(W095/33836)的基因获得前肽编码区。当信号肽和前肽序列二者均出现在多肽的氨基末端时,使前肽序列的位置紧接着(nextto)多肽氨基末端,并且使信号肽序列的位置紧接着前肽序列的氨基末端。同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可以使用ADH2系统或GALl系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(withheavymetal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列与调节序列可操作地连接。表达载体本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。本文所述的多种核酸和控制序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的多核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达用控制序列可操作地连接。重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(totalDNA),或可以使用转座子(transposon)。本发明的载体优选地含有一个或多个(几个)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRPl和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitratereductase)、pyrG(乳清酸核苷-5,-磷酸脱羧酶)(orotidine-5,-phosphatedecarboxylase),sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因禾口吸水链霄菌(Streptomyceshygroscopicus)的bar基因。本发明的载体优选含有元件,其允许载体整合入宿主细胞基因组或允许载体在细胞中独立于基因组自主复制。为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。为了自主复制,载体可以还包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(r印licator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷酸序列。22细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌中复制的质粒pUB110、pE194、pTA1060和ρΑΜβ1的复制起点。用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARSl,ARS4,ARSl和CEN3的组合,和ARS4和CEN6的组合。在丝状真菌细胞中有用的复制起点的实例是AMAl和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch159163-9175;WO00/24883)。分离AMAl基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,从而也含有多核苷酸的额外拷贝的细胞。用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上)。宿主细胞本发明还涉及重组宿主细胞,其包含本发明的分离的多核苷酸,将所述重组宿主细胞有利地用于多肽的重组产生。将包含本发明的多核苷酸的载体引入宿主细胞从而将所述载体作为染色体整合体或作为自复制的染色体外载体保持,如前文所述。术语“宿主细胞”包含亲本细胞的任何子代,其因为在复制过程中发生的突变而与该亲本细胞不同。宿主细胞的选择在很大程度上会依赖于编码多肽的基因及其来源。宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真核细胞。原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属和海洋芽孢杆菌属。革兰氏阴性细菌包括但不限于,大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属和脲原体属。细菌宿主细胞可以是任何芽孢杆菌细胞。在本发明的实施中有用的芽孢杆菌属细胞包括但不限于,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。在优选的方面,细菌宿主细胞是解淀粉芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在更优选的方面,细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是枯草芽孢杆菌细胞。细菌宿主细胞还可以是任何链球菌属细胞。在本发明的实施中有用的链球菌属细胞包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。在优选的方面,细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,细菌宿主细胞是马链球菌兽瘟亚种细胞。细菌宿主细胞还可以是任何链霉菌属细胞。在本发明的实施中有用的链霉菌属细胞包括但不限于,不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。在优选的方面,细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是除虫链霉菌细胞。在另一个优选的方面,细菌宿主细胞是天蓝链霉菌细胞。在另一个优选的方面,细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是浅青紫链霉菌细胞。可通过如下方法实现将DNA引入到芽孢杆菌属细胞例如原生质体转化(参见,例如,Chang和Cohen,1979,MolecularGeneralGenetics168:111_115),使用感受态细胞(参见,例如,Young禾口Spizizen,1961,JournalofBacteriology81:823_829或Dubnau和Davidoff-Abelson,1971,JournalofMolecularBiology56:209_221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques6:742_751)或接合(参见,例如,Koehler和Thorne,1987,JournalofBacteriology169:5271—5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞例如原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166557-580)或电穿孔(参见,例如,Dower等,1988,NucleicAcidsRes.166127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞例如原生质体转化和电穿孔(参见,例如,Gong等,2004,FoliaMicrobiol.(Praha)49:399_405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.171:3583_3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98=6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞例如电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51_57)。可通过如下方法实现将DNA引入到链球菌属细胞例如天然感受态(naturalcompetence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.321295-1297),原生质体转化(参见,例如,Catt和Jollick,1991,Microbios.68189-207),电穿孔(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.653800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45409-436)。然而,可以使用任何本领域已知的将DNA引入宿主细胞的方法。宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。在优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)禾口接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisby'sDictionaryofTheFungi,第八版,1995,CABInternational,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,见上)。在更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内抱霉目(Endomycetales))、产担子酵母(basidiosporogenousyeast)禾口属于半知菌类(FungiImperfecti)(芽抱纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,会将酵母定义为如BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,禾口Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。在甚至更加优选的方面,酵母宿主细胞是假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyceslactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowialipolytica)细胞。在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。在甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、Ceriporiopsis、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个最优选方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)>Ceriporiopsisaneirina>Ceriporiopsisaneirina>Ceriporiopsiscaregiea>Ceriporiopsisgilvescens>Ceriporiopsispannocinta>Ceriporiopsisrivulosa、Ceriporiopsissubrufa>Ceriporiopsissubvermispora、B誉角质金抱子菌、Ghrysosporiumlucknowense、热带金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、粗金抱子菌、Chrysosporiumqueenslandicum>Chrysosporiumzonatum、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium)、辐射射脉胃(Phlebiaradiata)JrfIlJ(Pleurotuseryngii)、土生—胃、Trametesvillosa>Trametesversicolor、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton等,1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147_156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母=Becker和Guarente,于Abelson,J.N.禾口Simon,Μ.I.编,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,182-187页,AcademicPress,Inc.,NewYork;Ito等,1983,JournalofBacteriolagy153:163;禾口Hinnen等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920o产生方法本发明还涉及产生本发明多肽的方法,其包括(a)在有益于产生多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。在优选的方面,所述细胞是毁丝霉属的。在更优选的方面,所述细胞是嗜热毁丝霉。在最优选的方面,所述细胞是嗜热毁丝霉CBS202.75。在另一个最优选的方面,所述细胞是嗜热毁丝霉CBS117.65。本发明还涉及产生本发明的多肽的方法,其包括(a)在有益于产生多肽的条件下培养如本文所述的重组宿主细胞;和(b)回收所述多肽。本发明还涉及产生本发明的多肽的方法,包括(a)在有益于产生多肽的条件下培养重组宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQIDNO:1的成熟多肽编码序列中具有至少一个突变,其中所述突变核苷酸序列编码多肽,所述多肽包含SEQIDNO2的成熟多肽或由SEQIDNO2的成熟多肽组成,和(b)回收所述多肽。在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂解物(Iysate)回收。可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzymeassay)可用于测定如本文所述的多肽的活性。所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(pr印arative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS_PAGE或提取(参见,例如,ProteinPurification,J.-C.Janson禾口LarsRyden编,VCHPublishers,NewYork,1989)。植物本发明还涉及植物,例如,转基因植物、植物部分或植物细胞,其包含分离的多核苷酸,所述多核苷酸编码本发明具有纤维素分解增强活性的多肽,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有该重组多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheologicalproperties),或用于破坏抗营养因子。转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadowgrass)(蓝草(bluegrass),早熟禾属(Poa));饲用牧草(foragegrass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperategrass),如Agrostis(剪股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familyBrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和紧密相关的模型生物体拟南芥(Arabidopsisthaliana)。植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf),^(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质夕卜体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如为了促进本发明的应用而分离的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seedcoat)0同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞将编码本发明多肽的一个或多个(几个)表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。表达构建体便利地是包含编码本发明多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该核苷酸序列所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定在其中整合了该表达构建体的宿主细胞有用的选择性标记和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码本发明多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,PlantPhysiology86:506所述。对于组成性表达,可以使用35S_CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell21:285_294,Christensen等,1992,PlantMo.Biol.18:675_689;Zhang等,1991,PlantCell3:1155_1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesinktissue)例如种子、马铃薯块莲和果实的启动子(EdwardsandCoruzzi,1990,Ann.27Rev.Genet.24:275_303),或来自代谢库组织(metabolicsinktissue)例如分生组织的启动子(Ito等,1994,PlantMol.Biol.24:863_878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,PlantandCellPhysiology39:885_889),来自豆球蛋白(Iegumin)B4和蚕豆(Viciafaba)的未知种子蛋白基因的蚕豆启动子(Conrad等,1998,JournalofPlantPhysiology152:708_711)、来自种子油体蛋白(oilbodyprotein)的启动子(Chen等,1998,PlantandCellPhysiology39:935_941),来自欧洲油菜(Braasicanapus)的贮藏蛋白napA启动子,或本
技术领域
公知的任何其它种子特异性的启动子,例如,在TO91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiology102:991_1000),小球藻病毒(chlorellavirus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,PlantMolecularBiology26:85_93),或来自稻的aldP基因启动子(Kagaya等,1995,MolecularandGeneralGenetics248:668_674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,PlantMolecularBiology22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金属。启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamoto等,1989,Nature338274)。目前,根癌土壤杆菌(Agrobacteriumtumefaciens)介导的基因转移(genetransfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,PlantMolecularBiology19:15_38),而且它也可以用于转化单子叶植物,虽然对于这些植物常常使用其它的转化方法。目前,产生转基因单子叶植物的优选的方法,是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryoniccalli)或发育中的胚(developingembryos)(Christou,1992,PlantJournal2275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasilφ,1992,Bio/Technology10667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993,PlantMolecularBiology21:415_428所描述的。转化之后,根据本领域熟知的方法选择并入了表达构建体的转化体并且再生成为完整植株。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因例如,使用带有两种独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。本发明还涉及产生本发明多肽的方法,其包括(a)在有益于产生多肽的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码本发明具有纤维素分解增强活性的多肽;和(b)回收所述多肽。去除或减少纤维素分解增强活性本发明还涉及产生亲本细胞突变体的方法,其包括破坏或缺失编码本发明的多肽的多核苷酸序列或其部分,这导致在相同条件下培养时,与亲本细胞相比突变的细胞产生较少的所述多肽。可以使用本领域熟知的方法通过减少或消除编码本发明多肽的核苷酸序列的表达来构建突变细胞,所述方法例如,插入、破坏、替代或缺失。在优选的方面,所述核苷酸序列是被失活的。待修饰或失活的核苷酸序列可以是,例如,编码区或其中对活性关键的部分,或表达编码区所需的调节元件。这种调节或控制序列的实例可以是启动子序列或其功能部分,即,足以影响核苷酸序列表达的部分。用于可能的修饰的其它控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。核苷酸序列的修饰或失活可以通过向亲本细胞施以诱变,并且选择其中已将所述核苷酸序列的表达减少或消除的突变细胞来进行。诱变可能是特异性的或随机的,可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变。此外,可以通过使用这些诱变剂的任何组合来进行诱变。适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、0_甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethylmethanesulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。当使用这些试剂时,通常通过如下方法来进行所述诱变在合适条件下存在优选的诱变剂时温育待诱变的亲本细胞,并筛选和/或选择显示基因表达减少的或无基因表达的突变体细胞。通过导入、取代或去除基因中的一个或多个(几个)核苷酸或其转录或翻译所需的调节元件可以实现所述核苷酸序列的修饰或失活。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开放阅读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以实现这种修饰或失活。尽管在理论上所述修饰可以在体内进行,即,直接对表达待修饰核苷酸序列的细胞进行,但优选如下面所示例的那样在体外进行所述修饰。消除或减少核苷酸序列通过细胞表达的便利方式的例子是基于基因替代,基因缺失,或基因破坏的技术。例如,在基因破坏方法中,将相应于内源核苷酸序列的核酸序列在体外进行诱变以产生缺陷性的核酸序列,随后将其转化入亲本细胞中以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代了内源性核苷酸序列。可能理想的是所述缺陷性核苷酸序列还编码标记,其可用于选择其中核苷酸序列被修饰或破坏的转化子。在特别优选的方面,用可选择的标记(如本文所述的那些)来破坏所述核苷酸序列。或者,可以使用与所述核苷酸序列互补的序列通过确定的反义或RNAi技术来进行所述核苷酸序列的修饰或失活。更具体地,通过导入与所述基因的核苷酸序列互补的序列可以减少或消除所述核苷酸序列通过细胞的表达,所述互补序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许所述互补反义核苷酸序列与mRNA杂交的条件下,由此减少或消除翻译的蛋白质的量。29本发明进一步涉及亲本细胞的突变体细胞,其包含编码多肽的核苷酸序列或其控制序列的破坏或缺失,这导致与亲本细胞相比突变体细胞产生更少的多肽或不产生多肽。这样生成的多肽缺陷型突变体细胞作为表达天然和/或异源多肽的宿主细胞特别有用。所以,本发明进一步涉及产生天然或异源多肽的方法,其包括(a)在有益于产生多肽的条件下培养突变细胞;和(b)回收所述多肽。术语“异源多肽”在本文中定义为对宿主细胞不是天然的多肽,进行了修饰以改变天然序列的天然蛋白,或作为通过重组DNA技术对宿主细胞操作的结果其表达在量上改变的天然蛋白。在另一方面,本发明涉及通过发酵产生本发明的多肽以及目标蛋白产物的细胞来生产基本上无纤维素分解增强活性的蛋白质产物的方法,通过在发酵之前、之中或发酵完成之后向发酵液(fermentationbroth)中添加有效量的能够抑制纤维素分解增强活性的试剂,从发酵液中回收目标产物,并且任选地将回收的产物进行进一步纯化。在另一方面,本发明涉及如下生产基本上无纤维素分解增强活性的蛋白质产物的方法在允许产物表达的条件下培养细胞,将得到的培养液进行组合的PH和温度处理以实质上(substantially)减少纤维素分解增强活性,和从发酵液中回收产物。或者,可以将从培养液回收的酶制备物进行组合的PH和温度处理。所述组合的PH和温度处理可任选地与内切葡聚糖酶抑制剂处理组合使用。依照本发明的这个方面,可能去除至少60%,优选至少75%,更优选至少85%,还更优选至少95%,并且最优选至少99%的纤维素分解增强活性。可使用此方法获得纤维素分解增强活性的完全去除。组合的pH和温度处理优选在2-4或9-11范围内的pH和至少60_70°C范围内的温度进行一段足够的时间以达到期望的效果,通常30至60分钟是足够的。用于培养和纯化感兴趣的产物的方法可以通过本领域已知的方法进行。本发明用于产生基本上无纤维素分解增强性的产物的方法在真核多肽,特别是真菌蛋白质例如酶的产生中是特别令人有兴趣的。所述酶可以选自,例如,淀粉分解酶(anxiolyticenzyme)、脂肪分解酶、蛋白水解酶、纤维素分解酶(cellulolyticenzyme)、氧化还原酶或植物细胞壁降解酶。这些酶的实例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、几丁质酶(chitinase)、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、商素过氧化酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶或木聚糖酶。纤维素分解增强缺陷细胞(cellulolyticenhancing-deficientcell)也可以用于表达在制药上引起兴趣的异源蛋白如激素、生长因子、受体等。可理解的是术语“真核多肽”不仅包括天然多肽,也包括通过氨基酸取代、缺失或添加或其它这样的修饰而被修饰以增强活性、热稳定性、PH耐受性等的多肽,例如酶。在另外的方面,本发明涉及基本上无纤维素分解增强活性的蛋白质产物,其是通过本发明的方法产生的。抑制多肽表达的方法本发明还涉及抑制多肽在细胞中表达的方法,其包括对所述细胞施用双链RNA(dsRNA)分子或者在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含本发明多核苷酸的亚序列。在优选的方面,dsRNA长约15、16、17、18、19、20、21、22、23、24、25或更多的双链体核苷酸。dsRNA优选是小干扰RNA(siRNA)或微RNA(miRNA)。在优选的方面,dsRNA是用于抑制转录的小干扰RNA(siRNA)。在另一优选的方面,dsRNA是用于抑制翻译的微RNA(miRNA)。本发明还涉及这样的双链RNA(dsRNA)分子,其包含SEQIDNO1成熟多肽编码序列的部分,用于抑制细胞中的多肽表达。虽然本发明不受限于任何特定作用机制,但dsRNA能进入细胞,并引起相似或相同序列的单链RNA(ssRNA)的降解,所述RNA包括内源mRNA。当细胞接触dsRNA时,来自同源基因的mRNA选择性地受到称为RNA干扰(RNAi)的过程的降解。本发明的dsRNA可以用于基因沉默疗法。在一个方面,本发明提供使用本发明的dsRNAi选择性地降解RNA的方法。所述方法可以在体外、回体(exvivo)或在体内进行。在一个方面,dsRNA分子能够用于在细胞、器官或动物中产生功能丧失突变(loss-of-functionmutation)。制备和使用选择性降解RNA的dsRNA分子的方法在本领域中公知,参见,例如,美国专利号6,506,559;美国专利号6,511,824;美国专利号6,515,109;和美国专利号6,489,127。组合物本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的纤维素分解增强活性得到了增加,例如,以至少1.1的富集因数(enrichmentfactor)±曾力口。所述组合物可以包含本发明的多肽作为主要酶成分,例如,单成分组合物。或者,所述组合物可以包含多种酶活性,例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(ρ印tidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。额外的酶可以通过例如属于以下属或种的微生物产生曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木毒ο可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法将包括于所述组合物中的多肽稳定化。下面给出的是本发明多肽组合物的优选用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法确定。纤维素材料的加工本发明还涉及供降解或转化纤维素材料的方法,包括用纤维素分解酶组合物在本发明的具有纤维素分解增强活性的多肽存在的情况下处理所述纤维素材料。在优选的方面,所述方法进一步包括回收经降解或转化的纤维素材料。本发明还涉及产生发酵产物的方法,包括(a)用纤维素分解酶组合物在本发明的具有纤维素分解增强活性的多肽存在的情况下糖化纤维素材料;(b)用一种或多种发酵微生物发酵经糖化的步骤(a)的纤维素材料以产生发酵产物;以及(c)从发酵回收发酵产物。本发明还涉及发酵纤维素材料的方法,包括用一种或多种发酵微生物发酵所述纤维素材料,其中将所述纤维素材料用纤维素分解酶组合物在本发明具有纤维素分解增强活性的多肽存在下进行糖化,且所述具有纤维素分解增强活性的多肽的存在与该具有纤维素分解增强活性的多肽不存在时相比较,增加了所述纤维素材料的降解。在优选的方面,所述纤维素材料的发酵产生发酵产物。在另一个优选的方面,所述方法进一步包括从发酵回收所述发酵产物。包含所述具有纤维素分解增强活性的多肽的组合物可以以细胞移除或不移除的粗发酵液的形式,或以经半纯化或纯化的酶制备物的形式存在,或者所述组合物可包含本发明的宿主细胞在用生物质进行的发酵工艺中作为具有纤维素分解增强活性的多肽的来源。本发明的方法可用于将纤维素材料糖化成为可发酵的糖,并将该可发酵的糖转化为多种有用的物质,例如,化学品与燃料。自纤维素材料产生所期望的发酵产物通常涉及预处理,酶水解(糖化)与发酵。根据本发明对所述纤维素材料的加工可使用本领域常规方法达成。此外,本发明的方法可使用任何经配置以依照本发明运转的常规生物质加工设备加以实施。分别或同时的水解(糖化)与发酵包括但不仅限于分别水解与发酵(SHF);同时糖化与发酵(SSF);同时糖化与共发酵(SSCF);混合水解与发酵(HHF);SHCF(分别水解与共发酵);HHCF(混合水解与共发酵(hybridhydrolysisandcofermentation)),以及直接微生物转化(DMC)。SHF使用分开的过程步骤以首先将木素纤维素酶水解为可发酵的糖,例如,葡萄糖,纤维二糖,纤维三糖与戊糖,并随即将所述可发酵的糖发酵为乙醇。在SSF中,木素纤维素的酶水解,以及糖发酵为乙醇合并为一步(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,((HandbookonBioethanol-ProductionandUtilization》,Wyman,C.E.编辑,Taylor&Francis,Washington,DC,179-212)。SSCF涉及多种糖类的共发酵(Sheehan,J.,andHimmel,Μ.,1999,Enzymes,energyandtheenvironment:AstrategicperspectiveontheU.S.DepartmentofEnergy'sresearchanddevelopmentactivitiesforbioethanol,Biotechnol·Prog·15:817_827)。HHF涉及分别的水解分离步骤,并另外涉及同时的糖化与水解步骤,其可在同一个反应器中进行。在HHF过程中的步骤可在不同温度下进行,亦即,高温酶糖化继以在较低的、发酵菌株可容忍的温度下的SSF。DMC将所有三个过程(酶产生,木素纤维素水解与发酵)合并于一个或多个步骤,其中使用相同生物体来产生酶以供将木素纤维素转化为可发酵的糖并将所述可发酵的糖转化为终产物(Lynd,L.R.,ffeimer,P.J.,vanZyl,W.H.,andPretorius,I.S.,2002,MicrobialcelluloseutilizationFundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66:506-577)。在本文中应理解本领域任何包括预处理,酶水解(糖化),发酵或其组合的已知方法可用于实施本发明的方法。常规设备可包括分批补料搅拌反应器(fed-batchstirredreactor),分批搅拌反应器(batchstirredreactor),带超滤的连续流动搅拌反应器(continuousflowstirredreactorwithultrafiltration)和/或连续的活塞流柱式反应器(continuousplug-flowcolumnreactor)(FernandadeCastilhosCorazza,FlavioFariadeMoraes,GisellaMariaZaninandIvoNeitzel,2003,Optimalcontrolinfed-batchreactorforthecellobiosehydrolysis,ActaScientiarum.Technology25:33_38;Gusakov,A.V.,andSinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose1.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346_352),磨胃反(anattritionreactor)(Ryu,S.K.,andLee,J.M.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.25:53_65),或者带有由电磁场诱导的剧烈搅拌的反应器(areactorwithintensivestirringinducedbyanelectromagneticfield)(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,0.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56:141_153)。其他类型的反应器包括流化床(fluidizedbed)、上流床(upflowblanket)、固定化的以及挤压器(extruder)类型反应器以供水解和/或发酵。预处理在实施本发明的方法时,本领域已知的任何预处理过程可用于破坏植物细胞壁组分。所述纤维素材料还可在预处理之前使用本领域已知方法对其进行预浸(pre-soaking),润湿(wetting),或调理(conditioning)。常规预处理包括但不限于,蒸汽预处理(爆炸或不爆炸),稀酸预处理,热水预处理,石灰预处理,湿氧化,湿爆炸,氨纤维爆炸,有机溶剂预处理以及生物预处理。其它预处理包括超声,电穿孔,微波,超临界CO2,超临界H2O,与氨渗滤预处理。所述纤维素材料可在水解和/或发酵前进行预处理。预处理优选在水解前进行。或者,所述预处理可与水解过程同时进行,例如与用一种或多种纤维素分解酶,或其它酶活性处理纤维素材料同时进行,以释放可发酵的糖,例如葡萄糖和/或麦芽糖。在多数情况下,所述预处理步骤本身导致生物质部分转化为可发酵的糖(甚至酶不存在时亦如此)。蒸汽预处理。在蒸汽预处理中,将所述纤维素材料加热以破坏其植物细胞壁组分,包括木质素,半纤维素与纤维素,以使所述纤维素与其它部分(例如,半纤维素)易受酶作用(accessibletoenzymes)0使所述木素纤维素材料经过或通过反应容器,在该反应容器中注入蒸汽以增加温度至所需温度并增加压力,并在其中保持到所期望的反应时间。蒸汽预处理优选在140-230°C下进行,更优选为160-200°C,且最优选为170-190°C,其中最佳温度范围取决于任何化学催化剂的添加。蒸汽预处理的滞留时间优选为1-15分钟,更优选为3-12分钟,且最优选为4-10分钟,其中最佳滞留时间取决于温度范围和任何化学催化剂的添加。蒸汽预处理允许相对较高的固体装载,从而使得所述纤维素材料通常仅在预处理过程中为潮湿的。所述蒸汽预处理常常与预处理之后对所述材料的爆炸性排出(explosivedischarge)组合,其称为蒸汽爆炸,亦即,所述材料迅速闪露于大气压力与湍流以通过碎裂增加其可接触表面积(DuffandMurray,1996,BioresourceTechnology8551-33;GalbeandZacchi,2002,Appl.Microbiol.Biotechnol.59:618_628;美国专利申请No.20020164730)。在蒸汽预处理过程中,半纤维素乙酰基团遭剪切,且所得的酸自催化半纤维素部分水解为单糖与寡糖。木质素仅以有限的程度移除。如H2SO4或SO2等的催化剂(通常为0.3到3%w/w)常常在蒸汽预处理前添加,其减少时间与温度,增加回收,并改善酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132496-508;Varga^,2004,Appl.Biochem.Biotechnol.113-116509-523;Sassner等,2006,EnzymeMicrob.Technol.39:756_762)。化学预处理术语“化学预处理”指任何促进纤维素,半纤维素和/或木质素分离和/或释放的化学预处理。合适的化学预处理过程的示例包括,例如,稀酸预处理,石灰预处理,湿氧化,氨纤维/冷冻爆炸(ammoniafiber/freezeexplosion,AFEX),氨渗滤(APR)以及有机溶剂预处理。在稀酸预处理中,将所述纤维素材料与稀酸,通常为H2SO4,以及水混合以形成浆料,由蒸汽加热至所期望的温度,并在滞留时间后闪露于大气压力。所述稀酸预处理可用多种反应器设计来实施,例如,活塞流反应器,逆流反应器(counter-currentreactor)或连续逆、流收缩床反应器(continuouscounter-currentshrinkingbedreactor)(DuffandMurray,1996,见上;Schell等,2004,BioresourceTechnol.91179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93_115)。亦可使用数种碱性条件下的预处理方法。这些碱性预处理包括但不限于,石灰预处理,湿氧化,氨渗滤(APR)与氨纤维/冷冻爆炸(AFEX)。石灰预处理使用碳酸钙,氢氧化钠或氨在85-150°C的低温下以及自1小时到数日的滞留时间下进行(Wyman等,2005,BioresourceTechnol.961959-1966;Mosier等,2005,BioresourceTechnol.96:673_686)。WO2006/110891,WO2006/11899,WO2006/11900与WO2006/110901公开了使用氨的预处理方法。湿氧化为一种热预处理,其通常在180-200°C下进行5_15分钟,加以如过氧化S或氧气超压(over-pressure)等的氧化剂(SchmidtandThomsen,1998,BioresourceTechnol.64:139—151;Palonen2004,Appl.Biochem.Biotechnol.117:1_17;Varga^,2004,Biotechnol.Bioeng.88567-574;Martin^,2006,J.Chem.Technol.Biotechnol.81:1669_1677)。该预处理优选以1_40%干物质,更优选2-30%干物质,且最优选5-20%干物质进行,且起始pH常常通过添加碱性物质,例如碳酸钠来增加。所述湿氧化预处理方法的改进,称为湿爆炸(合并湿氧化与蒸汽爆炸),可处理多达30%的干物质。在湿爆炸中,氧化剂在预处理过程中一定滞留时间之后导入。所述预处理随即通过闪露于大气压力来终止(W02006/032282)。氨纤维爆炸(AFEX)涉及用液态或气态氨在中等温度,例如90-100°C,以及高压,例如17-20巴下对纤维素材料处理5-10分钟,其中干物质含量可高达60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.9823-35;Chundawatφ,2007,Biotechnol.Bioeng.96219-231;Alizadeh^,2005,Appl.Biochem.Biotechnol.1211133-1141;Teymouri等,2005,BioresourceTechnol.962014-2018)。AFEX预处理导致纤维素的解聚,以及半纤维素的部分水解。木质素_碳水化合物复合物遭剪切。有机溶剂预处理通过用乙醇水溶液(40-60%乙醇)在160-200°C下提取30_6034分钟来将纤维素材料脱木质化(Pan等,2005,Biotechnol.Bioeng.90:473_481;Pan等,2006,Biotechnol.Bioeng.94:851_861;Kurabi等,2005,Appl.Biochem.Biotechnol.121219-230)。通常添加硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素得到移除。合适的预处理方法的其它示例由Schell等,2003,Appl.Biochem.andBiotechnol.Vol.105-108,p.69-85与Mosier等,2005,BioresourceTechnology96:673-686,以及公布的美国申请2002/0164730描述。在一方面,所述化学预处理优选作为酸处理来进行,且更优选作为连续性稀酸和/或温和酸处理进行。所述酸通常为硫酸,但亦可使用其它酸,例如,乙酸,柠檬酸,硝酸,磷酸,酒石酸,琥珀酸,盐酸或其混合物。温和酸处理在PH范围优选为1-5,更优选为1-4,且最优选为1-3下进行。在一方面,所述酸浓度范围为优选0.01到20wt%的酸,更优选0.05到IOwt%的酸,甚至更优选0.1到5衬%的酸,且最优选0.2到2.Owt%的酸。所述酸与纤维素材料接触,并保持在范围优选为160-220°C,且更优选为165-195°C的温度下数秒至数分钟范围的时间段,例如,1秒到60分钟。在另一方面,预处理作为氨纤维爆炸步骤(AFEX预处理步骤)进行。在另一方面,预处理在水性浆料中进行。在优选的方面,所述纤维素材料在预处理过程中以优选为10-80wt%,更优选为20-70wt%,且最优选为30-60wt%,例如约50wt%的量存在。所述经预处理的纤维素材料可不经洗涤,或使用本领域任何已知方法洗涤,例如,用水洗涤。机械预处理术语“机械预处理”指不同类型的磨碎或碾磨(grindingormilling)(例如,干碾磨,湿碾磨,或振动球碾磨(vibratoryballmilling))。物理预处理术语“物理预处理”指任何改善自纤维素材料分离和/或释放纤维素,半纤维素和/或木质素的预处理。举例而言,物理预处理可涉及辐射(例如,微波辐射),汽蒸/蒸汽爆炸,湿热分解以及其组合。物理预处理可涉及高压和/或高温(蒸汽爆炸)。在一方面,高压意为范围在优选约300到约600psi,更优选约350到约550psi,且最优选约400到约500psi,例如约450psi的压力。在另一方面,高温意为范围在约100到约300°C,优选约140到约235°C的温度。在优选方面,机械预处理在分批过程,蒸汽枪水解仪系统中进行,所述系统使用如上所述定义的高压与高温,例如,可自SundsDefibratorAB,Sweden获取的SundsHydrolyzer。物理和化学联合预处理所述纤维素材料可经物理与化学方法两者预处理。举例而言,所述预处理步骤可涉及稀酸或温和酸处理以及高温和/或高压处理。所述物理与化学预处理可视需要顺次或同时进行。亦可包含机械预处理。相应的,在优选方面,可对所述纤维素材料进行机械,化学或物理预处理,或其任意组合以促进纤维素,半纤维素和/或木质素的分离和/或释放。生物预处理术语“生物预处理”指任何促进自纤维素材料分离和/或释放纤维素,半纤维素和/或木质素的生物预处理。生物预处理技术可涉及施用溶解木质素的微生物(参见,例如,Hsu,Τ·-Α.,1996,Pretreatmentofbiomass,《HandbookonBioethanolProductionandUtilization》,Wyman,C.E.编辑,Taylor&Francis,Washington,DC,179-212;GhoshandSingh,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionofcellulosicbiomass,Adv.Appl.Microbiol.39295-333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomass:areview,《EnzymaticConversionofBiomassforFuelsProduction》,Himmel,Μ.E.,Baker,J.0.,andOverend,R.P.编辑,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,chapter15;Gong,C.S.,Cao,N.J.,Du,J.,andTsao,G.T.,1999,Ethanolproductionfromrenewableresources,《AdvancesinBiochemicalEngineering/Biotechnology》,Scheper,T.编辑,Springer-VerlagBerlinHeidelberg,Germany,65:207_241;OlssonandHahn—Hagerdal,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18:312_331;禾口VallanderandEriksson,1990,Productionofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.Biochem.Eng./Biotechnol.42:63_95)。'M^在亦称为糖化的水解步骤中,将所述经预处理的纤维素材料水解以分解纤维素,并且可选地还将半纤维素分解为可发酵的糖,例如葡萄糖,木糖,木酮糖,阿拉伯糖,麦芽糖,甘露糖,半乳糖或可溶性寡糖。所述水解用酶法通过纤维素分解酶组合物进行,所述组合物包含本发明具有纤维素分解增强活性的多肽,其可进一步包含一种或多种分解半纤维素的酶。该组合物的酶亦可顺次添加。酶水解优选在合适的含水环境中在本领域技术人员可容易地确定的条件下进行。在优选的方面,水解在适于所述酶活性,亦即,对于所述酶为最佳的条件下进行。所述水解可以按分批补料或连续过程的方式进行,在后者中将经预处理的纤维素材料(底物)逐渐进料至,例如,含有酶的水解溶液。所述糖化通常在搅拌釜式反应器或发酵罐中在受控的pH,温度和混合条件下进行。合适的过程时间,温度与PH条件可由本领域技术人员容易地确定。举例而言,所述糖化可持续长达200小时,但通常优选进行约12到约96小时,更优选约16到约72小时,且最优选约24到约48小时。温度范围优选约25°C到约70°C,更优选约30°C到约65°C,且最优选约40°C到60°C,特别是50°C。pH范围优选约3到约8,更优选约3.5到约7,且最优选约4到约6,特别为约pH5。干物质含量范围优选约5到约50wt%,更优选约10到约40wt%,且最优选约20到约30wt%。除本发明具有纤维素分解增强活性的多肽之外,所述组合物的纤维素分解酶成分优选是具有内切葡聚糖酶,纤维二糖水解酶与葡糖苷酶活性的酶。在优选的方面,所述纤维素分解酶组合物包含一种或多种(几种)选自下组的纤维素分解酶纤维素酶、内切葡聚糖酶、纤维二糖水解酶和葡糖苷酶。在另一个优选方面,所述纤维素分解酶制备物补充有一种或多种额外的选自下组的酶活性半纤维素酶,酯酶(例如,脂肪酶,磷脂酶和/或角质酶),蛋白酶,漆酶,过氧化物酶或其混合物。在本发明的方法中,所述额外的酶可在发酵之前或之中添加,包括在发酵微生物繁殖过程之中或之后添加。所述酶可源自或得自任何合适的来源,包括细菌,真菌,酵母,植物或哺乳动物来源。在本文中术语“获得”意为该酶可分离自天然产生该酶作为天然酶的生物。在本文中术语“获得”亦意为所述酶可在宿主生物中使用本文所描述的方法重组产生,其中所述重组产生的酶对于所述宿主生物可为天然的或外源的,或具有经修饰的氨基酸序列,例如,缺失,插入和/或取代了一个或多个氨基酸,亦即,该重组产生的酶为天然氨基酸序列的突变体和/或片段,或者其为通过本领域已知的核酸改组过程(nucleicacidshufflingprocess)产生的酶。天然酶含意所涵盖的范围包括天然变体,而外源酶含意所涵盖的范围包括重组获得的变体,例如,通过定位诱变或改组得到的变体。用于本发明中的酶可为任何适用于本文所描述的方法中的形式,例如,有或无细胞的粗发酵培养液,或基本上纯的多肽。所述酶可为干粉或颗粒,无尘颗粒,液体,稳定化的液体或受保护的酶。颗粒可以,例如,如美国专利Nos.4106991与4661452中公开的来产生,且可任选地通过本领域已知的过程包被。液体酶制备物可,例如,通过添加稳定剂,例如糖,糖醇或其它多元醇,和/或乳酸或另一有机酸根据已经建立的过程加以稳定化。经保护的酶可根据公开于EP238216中的过程加以制备。所述具有纤维素分解增强活性的酶和多肽的最佳量取决于多种因素,包括但不限于,组分纤维素分解酶的混合物,纤维素底物,纤维素底物的浓度,对纤维素底物的预处理,温度,时间,PH以及发酵生物的包括(例如,供同时糖化与发酵的酵母)。在优选方面,针对纤维素材料的纤维素分解酶的有效量为每g纤维素材料约0.5到约50mg,优选约0.5到约40mg,更优选约0.5到约25mg,更优选约0.75到约20mg,更优选约0.75到约15mg,甚至更优选约0.5到约10mg,且最优选约2.5到约10mg。在另一个优选方面,对于纤维素材料,具有纤维素分解增强活性的多肽的有效量是每克的纤维素材料约0.01到约50mg,优选约0.5到约40mg,更优选约0.5到约25mg,更优选约0.75到约20mg,更优选约0.75到约15mg,甚至更优选约0.5到约10mg,且最优选约2.5到约IOmg0在另一个优选方面,针对纤维素材料具有纤维素分解增强活性的多肽的有效量为每g纤维素材料约0.01到约50.Omg,优选约0.01到约40mg,更优选约0.01到约30mg,更优选约0.01到约20mg,更优选约0.01到约10mg,更优选约0.01到约5mg,更优选约0.025到约1.5mg,更优选约0.05到约1.25mg,更优选约0.075到约1.25mg,更优选约0.1到约1.25mg,甚至更优选约0.15到约1.25mg,且最优选约0.25到约1.Omgo在另一个优选方面,针对纤维素分解酶的具有纤维素分解增强活性的多肽的有效量为每g纤维素分解酶约0.005到约1.Og,优选约0.01到约1.Og,更优选约0.15到约0.75g,更优选约0.15到约0.5g,更优选约0.1到约0.5g,甚至更优选约0.1到约0.5g,且最优选约0.05到约0.2g。发醛得自所述经预处理与水解的纤维素材料的可发酵的糖可由一种或多种能够将所述糖直接或间接发酵为所期望的发酵产物的发酵微生物进行发酵。“发酵”或“发酵过程”指任何发酵过程或任何包含发酵步骤的过程。发酵过程亦包括用于醇类消费品工业(例如,啤酒与葡萄酒),乳制品工业(例如,发酵的乳制品),皮革工业与烟草工业的发酵过程。发酵条件取决于所期望的发酵产物以及发酵生物,且可由本领域技术人员简单地确定。在所述发酵步骤中,作为预处理与酶水解步骤的结果自所述纤维素材料释放的糖由发酵生物,例如酵母,发酵为产物,例如乙醇。可分别或同时进行水解(糖化)与发酵。上述方法包括但不限于,分别水解与发酵(SHF);同时糖化与发酵(SSF);同时糖化与共发酵(SSCF);混合水解与发酵(HHF);SHCF(分别水解与共发酵);HHCF(混合水解与共发酵),以及直接微生物转化(DMC)。任何合适的经水解的纤维素材料可在实行本发明时用于所述发酵步骤。所述材料通常基于所期望的发酵产物(即,自发酵获取的物质),以及所用的过程选择,如本领域为37众所周知的。适用于本发明方法的底物实例包括纤维素材料,如木材或植物残余物或得自经处理的纤维素材料的低分子糖DP1-3,所述纤维素材料可由发酵微生物进行代谢,且其可通过直接添加至发酵培养基中进行供应。在本文中术语“发酵培养基”应理解为指在添加发酵微生物之前的培养基,例如,由糖化过程产生的培养基,以及用于同时糖化与发酵过程(SSF)的培养基。“发酵微生物”指任何微生物,包括细菌与真菌生物,其适用于所期望的发酵过程以产生发酵产物。所述发酵生物可为C6和/或C5发酵生物,或其组合。C6与C5发酵生物均在本领域为众所周知。合适的发酵微生物能够将糖,例如葡萄糖,木糖,木酮糖,阿拉伯糖,麦芽糖,甘露糖,半乳糖或寡糖直接或间接发酵(即转化)为所期望的发酵产物。产生乙醇的细菌与真菌发酵生物的示例描述于Lin等,2006,Appl.Microbiol.Biotechnol.69:627_642。可发酵C6糖的发酵微生物的示例包括细菌与真菌生物,例如酵母。优选的酵母包括酵母属菌禾中(Saccharomycesspp.),优选为酉良酒酵母(Saccharomycescerevisiae)的菌株。可发酵C5糖的发酵生物的示例包括细菌与真菌生物,例如酵母。优选的C5发酵酵母包括毕赤氏酵母属(Pichia)的菌株,优选为具柄毕赤氏酵母(Pichiastipitis),例如具柄毕赤酵母CBS5773)的菌株;假丝酵母属(Candida)的菌株,优选为博伊丁氏假丝酵母(Candidaboidinii),芸薹假丝酵母(Candidabrassicae),休哈塔假丝酵母(Candidashehatae),迪丹氏假丝酵母(Candidadiddensii),假热带假丝酵母(Candidapseudotropicalis)或产朊假丝酵母(Candidautilis)的菌株。其它发酵生物包括发酵单胞菌属(Zymomonas)的菌株,例如运动发酵单胞菌(Zymomonasmobilis);汉逊氏酵母属(Hansenula)的菌株,例如异常汉逊氏酵母(Hansenulaanomala);克鲁维酵母属(Kluyveromyces)的菌株,例如脆壁克鲁维酵母(K.fragilis);裂殖酵母属(Schizosaccharomyces)的菌株,例如粟酒裂殖酵母(S.pombe);以及大肠杆菌(E.coli),特别是经遗传修饰而改善了乙醇产量的大肠杆菌菌株。在优选的方面,所述酵母是酵母属菌种。在更优选的方面,所述酵母为酿酒酵母。在另一个更优选的方面,所述酵母为糖化酵母(Saccharomycesdistaticus)0在另一个更优选的方面,所述酵母为葡萄汁酵母(Saccharomycesuvarum)。在另一个优选的方面,所述酵母属于克鲁维酵母属。在另一个更优选的方面,所述酵母为马克斯克鲁维酵母(Kluyveromycesmarxianus)0在另一个更优选的方面,所述酵母为脆壁克鲁维酵母。在另一个优选的方面,所述酵母属于假丝酵母属。在另一个更优选的方面,所述酵母为博伊丁氏假丝酵母。在另一个更优选的方面,所述酵母为芸薹假丝酵母。在另一个更优选的方面,所述酵母为迪丹氏假丝酵母。在另一个更优选的方面,所述酵母为假热带假丝酵母。在另一个更优选的方面,所述酵母为产朊假丝酵母。在另一个优选的方面,所述酵母属于棍孢属(Clavispora)。在另一个更优选的方面,所述酵母为葡萄牙棍孢(Clavisporalusitaniae)。在另一个更优选的方面,所述酵母为仙人掌棍孢(Clavisporaopuntiae)。在另一个优选的方面,所述酵母属于管囊酵母属(Pachysolen)。在另一个更优选的方面,所述酵母为嗜鞣管囊酵母(Pachysolentannophilus)0在另一个优选的方面,所述酵母属于毕赤氏酵母属。在另一个更优选的方面,所述酵母为具柄毕赤氏酵母。在另一个优选的方面,所述酵母属于酒香酵母属(Bretarmomyces)。在另一个更优选的方面,所述酵母为克劳森酒香酵母(Bretannomycesclausenii)(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,((HandbookonBioethanolProductionandUtilization)),ffyman,C.E.编辑,Taylor&Francis,Washington,DC,179-212)。可有效将己糖与戊糖发酵为乙醇的细菌包括,例如,运动发酵单胞菌与热纤维梭菌(Clostridiumthermocellum)(Philippidis,1996,见上)。在优选的方面,所述细菌属于发酵单胞菌属。在更优选的方面,所述细菌为运动发酵单胞菌。在另一个优选的方面,所述细菌属于梭菌属(Clostridium)。在另一个更优选的方面,所述细菌为热纤维梭菌。适用于产生乙醇的可市购的酵母包括,例如,ETHANOLRED酵母(可得自Fermentis/Lesaffre,USA),FALI(可得自FleischmannsYeast,USA),SUPERSTART与THERMOSACC新鲜酵母(可得自EthanolTechnology,WI,USA),BIOFERMAFT与XR(可得自NABC-NorthAmericanBioproductsCorporation,GA,USA),GERTSTRAND(可得自GertStrandAB,Sweden),以及FERMIOL(可得自DSMSpecialties)。在优选的方面,所述发酵微生物可经遗传修饰以提供发酵戊糖的能力,例如使用木糖,使用阿拉伯糖以及共同使用木糖与阿拉伯糖的微生物。将异源基因克隆入多种发酵微生物导致能够将己糖与戊糖转化为乙醇(共发酵)的生物的构建(ChenandHo,1993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,Appl.Biochem.Biotechnol.39-40135-147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,Appl.Environ.Microbiol.641852-1859;KotterandCiriacy,1993,XylosefermentationbySaccharomycescerevisiae,Appl.Microbiol.Biotechnol.38:776_783;Walfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKLlandTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.61:4184_4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentation:aproofofprinciple,FEMSYeastResearch4655-664;Beall1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38296~303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58:204_214;Zhang等,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240_243;Deanda等,1996,Developmentofanarabinose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.624465-4470)。在优选的方面,所述经遗传修饰的发酵微生物为酿酒酵母。在另一个优选的方面,所述经遗传修饰的发酵微生物为运动发酵单胞菌。在另一个优选的方面,所述经遗传修饰的发酵微生物为大肠杆菌。在另一个优选的方面,所述经遗传修饰的发酵微生物为产酸克雷伯氏菌(Klebsiellaoxytoca)。在本领域众所周知上述生物亦可用于产生其它物质,如本文所述。所述发酵微生物通常添加至经降解的木素纤维素或水解物,且将所述发酵进行约8到约96小时,例如约24到约60小时。温度通常为约26°C到约60°C之间,特别是约32°C或50°C,且在约pH3到约pH8,例如约pH4_5,6或7。在优选方面,将所述酵母和/或另一微生物施用于经降解的木素纤维素或水解物,且所述发酵进行约12到约96小时,例如通常24-60小时。在优选方面,温度优选在约20°C到约60°C之间,更优选约25°C到约50°C,且最优选约32°C到约50°C,特别是约32°C或50°C,且pH通常为约pH3到约pH7之间,优选约pH4_7。然而,其中一些,例如,细菌发酵生物具有较高的最佳发酵温度。酵母或其它微生物优选以每ml发酵培养液大约IO5到1012,优选大约IO7到101(1,特别是大约2xl08活细胞计数的量施用。关于使用酵母以供发酵的进一步指导可见于,例如“TheAlcoholTextbook”(编辑K.Jacques,Τ.P.LyonsandD.R.Kelsall,NottinghamUniversityPress,UnitedKingdom1999),将其通过提述并入本文中。本领域最广泛使用的工艺是同时糖化和发酵(SSF)工艺,其中对糖化没有保持期(holdingstage),说明酵母和酶同时添加。对于乙醇产生,在发酵之后,蒸馏经发酵的浆料以提取乙醇。根据本发明的方法获得的乙醇可用作,例如,燃料乙醇,饮用乙醇,亦即,可饮用的中性酒精饮料,或工业乙醇。发酵刺激剂(fermentationstimulator)可与任何本文所述的酶方法并用以进一步改善所述发酵过程,并且特别是所述发酵微生物的表现,例如,提高速率与乙醇产量。“发酵刺激剂”指针对所述发酵微生物(具体而言,酵母)生长的刺激剂。优选的针对生长的发酵刺激剂包括维生素与矿物质。维生素的示例包括多种维生素,生物素,泛酸,烟酸,内消旋肌醇,硫胺素,吡哆醇,对氨基苯甲酸,叶酸,核黄素和维生素A,B,C,D及E0参见,例如,Alfenore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag(2002),将其通过提述并入本文中。矿物质的示例包括矿物质与无机盐,其可供应包括P,K,Mg,S,Ca,Fe,Zn,Mn与Cu的营养物。发酵产物发酵产物可为任何源自发酵的物质。所述发酵产物可为,醇(例如,阿拉伯糖醇,丁醇,乙醇,甘油,甲醇,1,3-丙二醇,山梨醇与木糖醇);有机酸(例如,乙酸,醋酮酸,己二酸,抗坏血酸,柠檬酸,2,5-二酮-D-葡萄糖酸,甲酸,富马酸,葡萄糖二酸,葡萄糖酸,葡糖醛酸,戊二酸,3-羟基丙酸,衣康酸,乳酸,苹果酸,丙二酸,草酸,丙酸,琥珀酸与木糖酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸,谷氨酸,甘氨酸,赖氨酸,丝氨酸和苏氨酸);以及气体(例如,甲烷,氢气(H2),二氧化碳(CO2)与一氧化碳(CO)),但不仅限于此。所述发酵产物亦可为作为高价值产物的蛋白质。在优选方面,所述发酵产物为醇。应理解术语“醇”涵盖下述物质,即其包含一个或更多羟基部分(moiety)。在更优选方面,所述醇为阿拉伯糖醇。在另一个更优选方面,所述醇为丁醇。在另一个更优选方面,所述醇为乙醇。在另一个更优选方面,所述醇为甘油。在另一个更优选方面,所述醇为甲醇,在另一个更优选方面,所述醇为1,3_丙二醇。在另一个更优选方面,所述醇为山梨醇。在另一个更优选方面,所述醇为木糖醇。参见,例如Gong,C.S.,Cao,N.J.,Du,J.,andTsao,G.Τ.,1999,Ethanolproductionfromrenewableresources,((AdvancesinBiochemicalEngineering/Biotechnology)),Scheper,T.编辑,Springer-VerlagBerlinHeidelberg,Germany,65:207_241;Silveira,Μ.M.,andJonas,R.,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59400-408;Nigam,P.,andSingh,D.,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2):117_124;Ezeji,T.C.,Qureshi,N.andBlaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBAlOlandinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnology19(6):595_603o在另一个优选方面,所述发酵产物为有机酸。在另一个更优选方面,所述有机酸为乙酸。在另一个更优选方面,所述有机酸为醋酮酸。在另一个更优选方面,所述有机酸为己二酸。在另一个更优选方面,所述有机酸为抗坏血酸。在另一个更优选方面,所述有机酸为柠檬酸。在另一个更优选方面,所述有机酸为2,5-二酮-D-葡萄糖酸。在另一个更优选方面,所述有机酸为甲酸。在另一个更优选方面,所述有机酸为富马酸。在另一个更优选方面,所述有机酸为葡萄糖二酸。在另一个更优选方面,所述有机酸为葡萄糖酸。在另一个更优选方面,所述有机酸为葡糖醛酸。在另一个更优选方面,所述有机酸为戊二酸。在另一个更优选方面,所述有机酸为3-羟基丙酸。在另一个更优选方面,所述有机酸为衣康酸。在另一个更优选方面,所述有机酸为乳酸。在另一个更优选方面,所述有机酸为苹果酸。在另一个更优选方面,所述有机酸为丙二酸。在另一个更优选方面,所述有机酸为草酸。在另一个更优选方面,所述有机酸为丙酸。在另一个更优选方面,所述有机酸为琥珀酸。在另一个更优选方面,所述有机酸为木糖酸。参见,例如,Chen,R.,andLee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63-65:435_448。在另一个优选方面,所述发酵产物为酮。应理解术语“酮”涵盖含有一个或更多酮部分的物质。在另一个更优选方面,所述酮为丙酮。参见,例如,QureshiandBlaschek,2003,见上。在另一个优选方面,所述发酵产物为氨基酸。在另一个更优选方面,所述有机酸为天冬氨酸。在另一个更优选方面,所述氨基酸为谷氨酸。在另一个更优选方面,所述氨基酸为甘氨酸。在另一个更优选方面,所述氨基酸为赖氨酸。在另一个更优选方面,所述氨基酸为丝氨酸。在另一个更优选方面,所述氨基酸为苏氨酸。参见,例如,Richard,Α.,andMargaritis,Α.,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4):501_515o在另一个优选方面,所述发酵产物为气体。在另一个更优选方面,所述气体为甲烷。在另一个更优选方面,所述气体为H2。在另一个更优选方面,所述气体为co2。在另一个更优选方面,所述气体为⑶。参见,例如,Kataoka,N.,A.Miya,andK.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7)41-47;禾口GunaseelanV.N.《BiomassandBioenergy》,Vol.13(1—2),pp.83—114,1997,41Anaerobicdigestionofbiomassformethaneproduction:Areview。Ml所述发酵产物可任选地自所述发酵培养基使用任何本领域已知方法加以回收,所述方法包括但不仅限于,层析,电泳方法,差示溶解度(differentialsolubility),蒸馏或提取。举例而言,醇自经发酵的纤维素材料分离并通过常规蒸馏方法纯化。可获取纯度高至约96vol.%的乙醇,其可用作,例如,燃料乙醇,饮用乙醇,亦即,可饮用的中性酒精饮料,或工业乙醇。纤维素分解酶组合物在本发明的方法中,所述纤维素分解酶组合物可包含将含纤维素材料加工为葡萄糖,或将半纤维素加工为木糖、甘露糖、半乳糖和阿拉伯糖,其聚合物,或者如下所述由其衍生的产物中涉及的任何蛋白质。一个方面,所述纤维素分解酶组合物包含选自下组的一种或多种酶内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在另一个方面,所述纤维素分解酶组合物进一步包含一种或多种额外的酶活性以改善所述含纤维素材料的降解。优选的额外的酶是半纤维素酶、酯酶(例如,脂肪酶、磷脂酶,和/或角质酶(cutinase))、蛋白酶、漆酶、过氧化物酶或其混合物。所述纤维素分解酶组合物可以是单组分制备物,例如,一种内切葡聚糖酶,多组分制备物,例如,一种或多种内切葡聚糖酶、一种或多种纤维二糖水解酶和一种或多种β_葡糖苷酶,或多组分和单组分蛋白质制备物的混合物。所述纤维素分解蛋白可具有活性,亦即,可在酸性、中性或碱性的PH范围水解所述含纤维素材料。如上所述,本发明所用的纤维素分解蛋白质可以是单组分制备物,亦即,基本上不含其它纤维素分解组分的一种组分。该单独组分可以是重组组分,亦即,由克隆编码所述单独组分的DNA序列并随即用该DNA序列转化细胞并在宿主中表达(参见,例如,WO91/17243和WO91/17244)产生。所述宿主细胞可以是异源宿主(酶对宿主是异源的)或该宿主还可以是野生型宿主(酶对宿主是内源的)。单组分纤维素分解蛋白还可以通过自发酵液提纯这样的蛋白质来制备。本发明所用的酶可以是任何适用于本文所描述的方法的形式,如,举例而言,含或不含细胞的粗发酵液、干粉或颗粒、无粉尘颗粒(non-dustinggranulate)、液体、稳定化的液体或受保护的酶。颗粒可依照,例如,美国专利4106991和4661452的公开来产生,并可视需要通过本领域已知的方法进行包覆。液体酶制备物可以,举例而言,通过添加稳定剂如糖、糖醇或其它多元醇,和/或乳酸或其它有机酸根据既有方法的进行稳定化。受保护的酶可以根据EP238216中公开的方法进行制备。具有纤维素分解酶活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽如芽孢杆菌属(Bacillus)、链球菌属(Str印tococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)多肽,所述多肽具有纤维素分解酶活性;或革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽,所述多肽具有纤维素分解酶活性。在优选的方面,所述多肽是具有纤维素分解酶活性的嗜碱芽孢杆菌(Bacillusalkalophilus)、!军定^1Ur包!f胃(Bacillusamyloliquefaciens)lif(Bacillusbrevis)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillusfirmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、短小芽孢杆菌(Bacilluspumilus)、嗜热月旨肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillussubtilis)或苏云金芽孢杆菌(Bacillusthuringiensis)多肽。在另一个优选的方面,所述多肽是具有纤维素分解酶活性的似马链球菌(Streptococcusequisimilis)、酉良月农链球菌(Streptococcuspyogenes)、乳房链球菌(Streptococcusuberis)或马链球菌兽痕亚禾中(Streptococcusequisubsp.Zooepidemicus)多月太。在另一个优选的方面,所述多肽是具有纤维素分解酶活性的不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomycesavermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomycesgriseus)或浅青紫链霉菌(Streptomyceslividans)多月太。本发明具有纤维素分解酶活性的多肽也可以是真菌多肽,并且更优选酵母多肽如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽,其具有纤维素分解酶活性;或更优选丝状真菌多肽如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟錯菌属(Ceriporiopsis)、Chaetomidium、金抱子菌属(Chrysosporium)、Claviceps、Cochliobolus、Coprinopsis、Coptotermes、Corynascus、Cryphonectria、係急球菌属(Cryptococcus)、Diplodia、Exidia、Filibasidium、,廉抱属(Fusarium)、赤霉属(Gibberella)、Holomastigotoides、腐质毒属(Humicola)、奉巴菌属(Irpex)、Lentinula、Leptospaeria、梨抱菌属(Magnaporthe)、Melanocarpus、多孑L菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假漂盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂糟菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、Trichophaea、轮枝抱属(Verticillium)、Volvariella或Xylaria多肽,其具有纤维素分解酶活性。在优选的方面,所述多肽是具有纤维素分解酶活性的卡尔酵母(Saccharomycescarlsbergensis)、酉良酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)多月太。在另一优选的方面,所述多肽是具有纤维素分解酶活性的解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、烟曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、曰本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、热带金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、租金抱子菌(Chrysosporiumpannicola)、ChrysosporiumqueenslandicumΛChrysosporiumzonatum、杆抱状德抱(Fusariumbactridioides)、禾谷德抱(Fusariumcerealis)、库威,廉抱(Fusariumcrookwellense)、大刀,廉抱(Fusariumculmorum)、禾本禾斗德抱(Fusariumgraminearum)、禾赤德抱(Fusariumgraminum)、异抱德抱(Fusariumheterosporum)、合欢木德抱(Fusariumnegundi)、尖德抱(Fusariumoxysporum)、多枝德抱(Fusariumreticulatum)、粉红德抱(Fusariumroseum)、接骨木,廉抱(Fusariumsambucinum)、肤色德抱(Fusariumsarcochroum)、拟分枝抱德抱(Fusariumsporotrichioides)、硫色,廉抱(Fusariumsulphureum)、圆德抱(Fusariumtorulosum)、拟丝抱,廉抱(Fusariumtrichothecioides)、壤片德抱(Fusariumvenenatum)、灰腐质霉(Humicolagrisea)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicolalanuginosa)、Irpexlacteus、米黑毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicillliumfuniculosum)、产紫青霉(Penicilliumpurpurogenum)、黄抱平革菌(Phanerochaetechrysosporium)、Thielaviaachromatica、Thielaviaalbomyces、Thielaviaalbopilosa、Thielaviaaustraleinsis、ThielaviafimetiλThielaviamicrospora、Thielaviaovispora、Thielaviaperuviana、瘤抱梭抱壳(Thielaviaspededonium)、€—冑(Thielaviasetosa)ΛThielaviasubthermophila、土生梭抱霉(Thielaviaterrestris)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)、绿色木霉(Trichodermaviride)或Trichophaeasaccata多月太。还可以使用纤维素分解蛋白经化学修饰或蛋白质工程改造的突变体。所述纤维素分解酶组合物的一种或多种组分可以是重组组分,亦即,通过克隆编码所述单独组分的DNA序列并随即用该DNA序列转化细胞并在宿主中表达(参见,例如,W091/17243和W091/17244)产生。所述宿主优选是异源宿主(酶对宿主是异源的),但该宿主在一定条件下也可以是同源宿主(酶对宿主是同源的)。单组分纤维素分解蛋白还可以通过从发酵液中提纯这样的蛋白质来制备。适用于本发明的商业性的纤维素分解蛋白制备物的实例包括,举例而言,CELLUCLAST(可自NovozymesA/S获得)和N0V0ZYM188(可自NovozymesA/S获得)。其它包含纤维素酶的可以使用的可市购的制备物包括CELLUZYME、CEREFL0和ULTRAFLO(NovozymesA/S),LAMINEX和SPEZYMECP(GenencorInt.),R0HAMENT7069W(RohmGmbH)以及FIBREZYMELDI、FIBREZYMELBR或VISCOSTAR150L(DyadicInternational,Inc.,Jupiter,FL,USA)。所述纤维素酶以从固体的约0.001%到约5.0%wt.,更优选从固体的0.025%到约4.O%wt.,且最优选从固体的约0.005%到约2.O%wt.的有效量添加。可以用于本发明的方法的细菌内切葡聚糖酶的实例包括但不仅限于,解纤维热酸菌(Acidothermuscellulolyticus)内切葡聚糖酶(W091/05039;WO93/15186;美国专利5,275,944;W096/02551;美国专利5,536,655,WO00/70031,WO05/093050);Thermobifidafusca内切葡聚糖酶III(W005/093050)JPThermobifidafusca内切葡聚糖酶V(W005/093050)。可以用于本发明的方法的真菌内切葡聚糖酶的实例包括但不仅限于,里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene45:253_263;GENBANK登录号M15665);里氏木霉内切葡聚糖酶II(Saloheimo等,1988,Gene6311-22;GENBANK登录号M19373);里氏木霉内切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555_563;GENBANK登录号AB003694);里氏木霉内切葡聚糖酶IV(Saloheimo等,1997,Eur.J.Biochem.249584-591;GENBANK登录号Y11113);以及里氏木霉内切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiology13:219_228;GENBANK登录号Z33381);棘孢曲霉内切葡聚糖酶(Ooi等,1990,NucleicAcidsResearch18:5884);川地曲霉(Aspergilluskawachii)内切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27:435-439);Erwiniacarotovara内切葡聚糖酶(SaariIahti等,1990,Gene90:9_14);尖镰孢内切葡聚糖酶(GENBANK登录号L29381);灰腐质霉thermoidea变种内切葡聚糖酶(GENBANK登录号AB003107);Melanocarpusalbomyces内切葡聚糖酶(GENBANK登录号MAL515703);粗糙脉孢菌内切葡聚糖酶(GENBANK登录号XM_324477);特异腐质霉内切葡聚糖酶V(SEQIDNO17);嗜热毁丝霉CBS117.65内切葡聚糖酶(SEQIDNO19);担子菌纲(basidiomycete)CBS495.95内切葡聚糖酶(SEQIDNO21);担子菌纲CBS494.95内切葡聚糖酶(SEQIDNO23);土生梭孢霉NRRL8126CEL6B内切葡聚糖酶(SEQIDNO25);土生梭孢霉NRRL8126CEL6C内切葡聚糖酶(SEQIDNO27);土生梭孢霉NRRL8126CEL7C内切葡聚糖酶(SEQIDNO29);土生梭孢霉NRRL8126CEL7E内切葡聚糖酶(SEQIDNO31);土生梭孢霉NRRL8126CEL7F内切葡聚糖酶(SEQIDNO33);CladorrhinumfoecundissimumATCC62373CEL7A内切葡聚糖酶(SEQIDNO35);以及里氏木霉菌株VTT-D-80133内切葡聚糖酶(SEQIDNO37;GENBANK登录号Ml5665)。上述SEQIDNO17,SEQIDNO19,SEQIDNO:21、SEQIDNO:23、SEQIDNO:25、SEQIDNO:27、SEQIDNO:29、SEQIDNO:31、SEQIDNO:33、SEQIDN0:35和SEQIDNO37的内切葡聚糖酶分别由SEQIDN0:16、SEQIDNO:18、SEQIDNO:20、SEQIDNO:22、SEQIDNO:24、SEQIDNO:26、SEQIDNO:28、SEQIDNO:30、SEQIDNO32,SEQIDNO:34禾口SEQIDNO36的成熟多肽编码序列所编码。可用于本发明的方法的纤维二糖水解酶的示例包括但不仅限于,里氏木霉纤维二糖水解酶I(SEQIDNO39);里氏木霉纤维二糖水解酶II(SEQIDNO41);特异腐质霉纤维二糖水解酶I(SEQIDNO43)、嗜热毁丝霉纤维二糖水解酶II(SEQIDNO45和SEQIDNO47)、土生梭孢霉纤维二糖水解酶II(CEL6A)(SEQIDNO49)、嗜热毛壳霉(Chaetomiumthermophilum)纤维二糖水解酶I(SEQIDNO51)以及嗜热毛壳霉纤维二糖水解酶II(SEQIDNO53)。上述SEQIDNO:39、SEQIDNO:41、SEQIDNO:43、SEQIDNO:45、SEQIDNO:47、SEQIDNO:49、SEQIDNO51和SEQIDNO53的纤维二糖水解酶分别由SEQIDNO38,SEQIDNO40、SEQIDNO42、SEQIDNO44、SEQIDNO46、SEQIDNO48、SEQIDNO50和SEQIDNO52的成熟多肽编码序列所编码。可用于本发明的方法的葡糖苷酶的实例包括但不仅限于米曲霉葡糖苷酶(SEQIDNO55);烟曲霉β-葡糖苷酶(SEQIDNO57);巴西青霉(Penicilliumbrasilianum)IBT20888β-葡糖苷酶(SEQIDNO59);黑曲霉β-葡糖苷酶(SEQIDNO:61);以及棘孢曲霉β-葡糖苷酶(SEQIDΝ0:63)。所述SEQIDNO55、SEQIDNO:57、SEQIDNO59,SEQIDNO:61禾口SEQIDNO:63的β-葡糖苷酶分别由SEQIDNO54、SEQIDNO:56、SEQIDNO:58、SEQIDNO60和SEQIDNO62的成熟多肽编码序列所编码。具有β-葡糖苷酶活性的米曲霉多肽可根据WO2002/095014获取。具有β-葡糖苷酶活性的烟曲霉多肽可根据WO2005/047499获取。具有β-葡糖苷酶活性的巴西青霉多肽可根据WO2007/019442获取。具有β_葡糖苷酶活性的黑曲霉多肽可根据Dan等,2000,J.Biol.Chem.275=4973-4980获取。具有β-葡糖苷酶活性的棘孢曲霉多肽可根据Kawaguchi等,1996,Gene173:287_288获取。所述β-葡糖苷酶可以是融合蛋白。在一个方面,所述β-葡糖苷酶是SEQIDNO65的米曲霉β-葡糖苷酶变体BG融合蛋白或SEQIDNO:67的米曲霉β-葡糖苷酶融合蛋白。在另一个方面,所述米曲霉β-葡糖苷酶变体BG融合蛋白是由SEQIDΝ0:64的多核苷酸编码的,或所述米曲霉β-葡糖苷酶融合蛋白是由SEQIDNO:66的多核苷酸编码的。其它内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶使用根据HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280:309_316禾口HenrissatB.,andBairochΑ.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695~696的分类公开于许多糖基水解酶家族中。其它可用于本发明的纤维素分解酶描述于EP495,257,EP531,315,EP531,372、WO89/09259、WO94/07998、WO95/24471、WO96/11262、WO96/29397、WO96/034108、WO97/14804、WO98/08940、WO98/012307、WO98/13465、WO98/015619、WO98/015633、WO98/028411、WO99/06574、WO99/10481、WO99/025846、WO99/025847、WO99/031255、WO2000/009707、WO2002/050245,WO2002/0076792、WO2002/101078、WO2003/027306、WO2003/052054,WO2003/052055,WO2003/052056,WO2003/052057,WO2003/052118、WO2004/016760、WO2004/043980、WO2004/048592、WO2005/001065、WO2005/028636、WO2005/093050,WO2005/093073、WO2006/074005,WO2006/117432,WO2007/071818,WO2007/071820、WO2008/008070、WO2008/008793、美国专利4435307、美国专利5457046、美国专禾Ij5648263、美国专利5686593、美国专利5691178、美国专利5763254以及美国专利5776757。可用于本发明方法的纤维素分解酶可以通过在含有合适的碳源和氮源以及无机盐的营养培养基上,使用本领域已知的步骤,对上面指出的微生物菌株进行发酵而产生(参见,例如,Bennett,J.W.andLaSure,L.编,MoreGeneManipulationsinFungi,AcademicPress,CA,1991)。合适的培养基可从供应商获取或可根据已公开的组成(例如,公开于美国典型培养物保藏中心的目录中的)来制备。适于生长和纤维素分解酶产生的温度范围和其它条件在本领域是已知的(参见,例如,Bailey,J.Ε.,andOllis,D.F.,BiochemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。所述发酵可以是任何其结果为纤维素分解酶的表达或分离的培养细胞的方法。因此,发酵可以理解为包括在合适的培养基中并在允许所述纤维素分解酶得以表达或分离的条件下进行的摇瓶培养,或在实验室或工业发酵罐中的小-或大规模发酵(包括连续、分批、补料分批或固态发酵)。信号月太本发明还涉及核酸构建体,所述核酸构建体包含编码蛋白质的基因,其中所述基因与编码信号肽的核苷酸序列可操作地连接,所述信号肽包含SEQIDN0:2的氨基酸1到15,或者由SEQIDNO2的氨基酸1至15组成,其中所述基因对于所述核苷酸序列是外源的。在优选的方面,所述核苷酸序列包含SEQIDNO1的核苷酸1_45或由SEQIDNO1的核苷酸1-45组成。本发明还涉及包含这样的核苷酸构建体的重组表达载体和重组宿主细胞。本发明还涉及产生蛋白质的方法,包括(a)在适合于产生所述蛋白质的条件下培养这样的重组宿主细胞;和(b)回收所述蛋白质。所述蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在本文的意思不是指特定长度的编码产物,并因此包括肽、寡肽和蛋白质。术语“蛋白质”还包括组合以形成编码产物的两种或更多种多肽。所述蛋白质还包括杂合多肽,其包含部分或全部从至少两种不同的蛋白质获得的多肽序列的组合,其中一种或多种(几种)对于宿主细胞可以是异源或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白质天然存在的等位基因变异和工程的变异。蛋白质优选是激素或其变体、酶、受体或其部分、抗体或其部分,或报告蛋白(r印orter)。在更优选的方面,所述蛋白质是氧化还原酶、转移酶、水解酶、裂合酶(lyase)、异构酶或连接酶。在更加优选的方面,所述蛋白质是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α"半乳糖苷酶、β"半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、另外的脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。基因可以获得自任何原核、真核或其它来源。通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。实施例材料用作缓冲液和底物的化学品是至少试剂级的商业产品。菌株使用嗜热毁丝霉CBS202.75作为编码具有纤维素分解增强活性的多肽的家族61基因的来源。培养基BA培养基由每升IOg的玉米浸液(cornsteepliquor)干物质、IOg的NH4N03、IOg的ΚΗ2Ρ04、0·75g的MgSO4·7Η20、0·Iml的普流罗尼(pluronic)以及0.5g的CaCO3组成。pH在高压灭菌前调至6.5。YEG培养基由每升20克的右旋糖(dextrose)和5g的酵母提取物组成。基本培养基由每升6g的NaNO3、0.52g的KCl、1.52g的KH2PO4、Iml的COVE痕量元素溶液、20g的Noble琼脂、20ml的50%葡萄糖、2.5ml的MgSO4·7H20以及20ml的0.02%生物素溶液组成。COVE痕量金属溶液由每升0.04g的Na2B4O7·10H20、0.4g的CuSO4·5Η20、1·2g的FeSO4·7Η20、0·7g的MnSO4·H20,0.8g的Na2MoO2·2H20以及IOg的ZnSO4·7H20组成。M410培养基由每升50g的麦芽糖、50g的葡萄糖、2g的MgSO4·7H20、2g的ΚΗ2Ρ04、4g的无水柠檬酸、8g的酵母提取物、2g的尿素、0.5g的CaCl2以及0.5ml的AMG痕量金属溶液组成。AMG痕量金属溶液由每升14.3g的ZnSO4·7H20、2.5g的CuSO4·5Η20、0·5g的NiCl2·6Η20、13·8g的FeSO4·7Η20、8·5g的MnSO4·7H20以及3g的柠檬酸组成。实施例1家族61肽的鉴定SDS-PAGE分析商品产物用水按110稀释。将20μ1在CRITERI0N8_16%Tris-HClSDS-PAGE凝胶上根据生产商建议的条件(Bio-RadLaboratories,Hercules,CA,USA)进行分离。使用PRECISIONPLUSPROTEIN标准品(Bio-RadLaboratories,Hercules,CA,USA)作为分子量标记。所得凝胶用BIO-SAFECoomassieStain(Bio-RadLaboratories,Hercules,CA,USA)进行染色,并用刀片将可见的条带切出用于蛋白质鉴定分析。为了肽测序进行的多肽胶内消化(in-geldigestion)使用MultiPROBEIILiquidHandlingRobot(PerkinElmerLifeandAnalyticalSciences,Boston,MA,USA)进行胶内消化。含有蛋白质的凝胶条带用50μ1的溶于IOOmM碳酸氢铵ρΗ8.0中的IOmM二硫苏糖醇(DTT)还原30分钟。经还原后,将所述凝胶块用50μ1的溶于IOOmM碳酸氢铵ρΗ8.0中的55mM碘乙酰胺烷基化20分钟。允许经干燥的凝胶块在25μ1(50mM碳酸氢铵ρΗ8.0中6ng/y1)测序级胰蛋白酶(Promega,Madison,WI,USA))的胰蛋白酶消化溶液中在室温下溶涨(swell)30分钟,之后是在40°C消化8小时。上述每个反应步骤之后都用合适的溶液遵循生产商的标准规程进行多次洗涤与预洗涤。使用50μ1乙腈以在反应之间使所述凝胶块脱水,且将所述凝胶块在步骤之间空气干燥。用HPLC级水中的1%甲酸/2%乙腈提取肽两次30分钟。将肽提取溶液转移至已经冷却至10-15°C的96孔有缘的(skirted)PCR型板(ABGene,Rochester,NY,USA),并且用96孔板盖(PerkinElmerLifeandAnalyticalSciences,Boston,MA,USA)覆盖以防止蒸发。将板进一步储藏于4°C直至可进行质谱分析。蛋白质鉴定。为了通过串联质谱术进行肽的从头测序,使用Q-T0FMICR0(WatersMicromassMSTechnologies,Milford,MA,USA),一种混合型正交四极飞行时间质谱仪(hybridorthogonalquadrupoletime—of—flightmassspectrometer)用于LC/MS/MS分析。Q-TOFMICRO使用MASSLYNX软件版本4.1(WatersMicromassMSTechnologies,Milford,MA,USA)完全由微处理器控制。所述Q-TOFMICRO配以ULTIMATE毛细管和纳米流(nano-flow)HPLC系统,其与FAM0S微型自动采样器和SWITCH0SII柱变换装置(LCPackings/Dionex,Sunnyvale,CA,USA)偶联用于对样品进行浓缩与脱盐。将样品加载至装在注入回路(injectionloop)中的保护柱(300μmIDX5cm,PEPMAPC18)上,并用0.甲酸水溶液以每分钟40μ1用SwitchosII泵洗涤2分钟。肽在75μmIDχ15cm,C18,3μm,100APEPMAP(LCPackings,SanFrancisco,CA,USA)纳米流融合的毛细管柱上以175nl/分钟的流速,从175μ1/分钟的分流(splitflow)使用NAN-75校准器(Dionex,Sunnyvale,CA,USA)分离。在45分钟期间施加0.1%甲酸中5%到80%乙腈的分步洗脱梯度(st印elutiongradient)。在215nm处监视柱洗脱液,并通过装有纳米喷射接Π(nanosprayinterface)的电喷身寸离子源(electrosprayionsource)导入所述Q-T0FMICRO中。以检查扫描模式(surveyscanmode)并自m/z400到1990的范围及MS到MS/MS的转化标准获取数据,以包括高于每秒10.0计数的离子强度和+2、+3和+4的电荷状态。用1.9秒的扫描时间和0.1秒的扫描间时间可获取多至4个同时洗脱物种的分析谱。通常使用45伏特的锥形电压(conevoltage),而碰撞能量(collisionenergy)编程为根据洗脱肽的质量和电荷状态而改变,且在10-60伏特的范围内。所得的谱以自动的方式组合、平滑化(smoothed)并中心化(centered),并产生峰列表(peaklist)。将该峰列表针对所选的数据库使用PR0TEINLYNXGlobalServer2.2.05软件(WatersMicromassMSTechnologies,Milford,MA,USA)和PEAKSStudio4.5版本(SPl)(BioinformaticSolutionsInc.,Waterloo,Ontario,Canada)进行搜索。评价由PR0TEINLYNX和PEAKSStudio搜索所得的结果,并进一步通过评价每个目标离子的MS/MS谱来分析未鉴别的蛋白质,并通过鉴定y与b离子系列以及将质量差异与合适的氨基酸匹配来确定从头序列(denovosequence)0从经所述胶内消化的大约24kDa多肽凝胶条带的数个带多电荷的离子获得肽序列。871.56m/z序列的带两个电荷的胰蛋白酶肽离子确定为[Leu]-Pro-Ala-Ser-Asn-Ser-Pro-Val-Thr-Asp-Val-Thr-Ser-Asn-Ala-[Leu]-Arg(SEQIDNO:3)。615.84m/z序列的带两个电荷的胰蛋白酶肽离子确定为Val-Asp-Asn-Ala-Ala-Thr-Ala-Ser-Pro-Ser-Gly-[Leu]-Lys(SEQIDNO:4)。715.44m/z序列的带两个电荷的胰蛋白酶肽离子确定为[LeuJ-Pro-Ala-Asp-[Leu]-Pro-Ser-Gly-Asp-Tyr-[Leu]-[Leu]-Arg(SEQIDNO:5)。988.58m/z序列的带两个电荷的胰蛋白酶肽离子确定为Gly-Pro-[Leu]-[Gin]-Val-Tyr-[Leu]-Ala-Lys(SEQIDNO6)01272.65m/z序列的带两个电荷的胰蛋白酶肽离子确定为Val-Ser-Val-Asn-Gly-[Gin]-Asp-[Gin]-Gly-[Gin]-[Leu]-Lys(SEQIDNO:7)。上面的[Leu]可以是lie或Leu,而上面的[Gin]可以是Gln或Lys,这是因为它们质量相同无法区分。实施例2制备嗜热毁丝霉CBS117.65cDNA汇集嗜热毁丝霉CBS117.65在200ml的BA培养基中在30°C下以200rpm培养五日。来自摇瓶培养的菌丝体通过用内衬MIRACL0TH(CalBiochem,SanDiego,CA,USA)的漏斗过滤内含物来收获。然后将菌丝体夹在两片MIRACL0TH片之间并用吸水纸塔吸干。随即将菌丝体物质转移到塑料的离心管中,并在液氮中冷冻。冷冻的菌丝体在-80°C冷冻柜中储藏直至使用。对总RNA的提取用硫氰酸胍继以通过5.7MCsCl垫(cushion)的超离心来进行,而多聚(A)+RNA的分离通过寡聚(dT)-纤维素亲和层析来进行,其使用描述于WO94/14953中的步骤。双链cDNA自5μg的多聚(A)+RNA通过RNaseH方法(Gubler和Hoffman,1983,Gene25:263-269,Sambrook等,1989,Molecularcloning:Alaboratorymanual,ColdSpringHarborlab.,ColdSpringHarbor,NY,USA)合成。将所述多聚(A)+RNA(5yg在5μ1经DEPC(0.焦碳酸二乙酯)处理的水)在预硅化的、无RNase的EPPEND0RF管中在70°C下加热8分钟,在冰上骤冷(quench),并与由50mMTris_HCl,pH8.3、75mMKCl、3mMMgCl2UOmM二硫苏糖醇(DTT)(BethesdaResearchLaboratories,Bethesda,MD,USA)>ImM的dATP,dGTP和dTTP以及0.5mM5-甲基-dCTP(GEHealthcare,Piscataway,NJ,USA)、40单位的人胎盘核糖核酸酶抑制剂(RNasin;Promega,Madison,WI,USA)U.45μg的寡聚(dT)18-NotI引物(GEHealthcare,Piscataway,NJ,USA)以及1000单位的SuperScriptIIRNaseH逆转录酶(BethesdaResearchLaboratories,Bethesda,MD,USA)组成的逆转录酶缓冲液合并使终体积为50μ1。第一链cDNA通过将反应混合物在45°C下温育1小时来合成。在合成后,将所得mRNA:cDNA杂交混合物通过MICR0SPINS-400HR离心柱(spincolumn)(GEHealthcare,Piscataway,NJ,USA)根据生严商的指示进行凝胶过滤。在凝胶过滤后,将所得杂交物稀释于250μ1含有200μM的每种dNTP、60单位的大肠杆菌DNA聚合酶I(GEHealthcare,Piscataway,NJ,USA),5.25单位的RNaseH(Promega,Madison,WI,USA)以及15单位的大肠杆菌DNA连接酶(BoehringerMannheim,Manheim,Germany)的第二链缓冲液中(20mMTris-HCl,ρΗ7·4、90mMKCl、4.6mMMgCl2,IOmM(NH4)2SO4^O.16mMNAD)。第二链cDNA合成通过将所述反应管在16°C下温育2小时并在25°C下另行温育15分钟来进行。所述反应通过添加EDTA至终浓度为20mM加以终止,继以苯酚和氯仿的提取。将所述双链cDNA通过添加2体积的96%乙醇和0.2体积的10M乙酸铵在_20°C下沉淀12小时,通过在13000xg下离心来回收,在70%乙醇中洗涤,干燥并重新悬浮于30μ1含有25单位的绿豆核酸酶(GEHealthcare,Piscataway,NJ,USA)的绿豆核酸酶缓冲液(30mM乙酸铵pH4.6、300mMNaCl、lmMZnSO4、0.35mMDTT、2%甘油)中。如下使所得单链发夹DNA成夹(clip),即通过将反应物在30°C下温育30分钟,继以添加70μ1的IOmMTris-HCl-ImMEDTAρΗ7.5,苯酚提取,并用2体积的96%乙醇和0.1体积的3Μ乙酸钠ρΗ5.2在冰上沉淀30分钟。所得双链cDNA通过在13000xg下离心来回收,并在30μ1含有0.5mM的每种dNTP和5单位的T4DNA聚合酶(NewEnglandBiolabs,Ipswich,MA,USA)的T4DNA聚合酶缓冲液(20mMTris-乙酸,pH7.9、IOmM乙酸镁、50mM乙酸钾、ImMDTT)中通过将所述反应混合物在16°C下温育1小时来平端化(blunt-end)。所述反应通过添加EDTA至终浓度为20mM加以终止,继以苯酚和氯仿提取,并通过添加2体积的96%乙醇和0.1体积的3M乙酸钠pH5.2在-20°C下沉淀12小时。在所述填补(fill-in)反应后,通过在13000xg下离心,在70%乙醇中洗涤,并干燥来回收所述cDNA。实施例3嗜热毁丝霉CBS202.75和嗜热毁丝霉CBS117.65基因组DNA提取将嗜热毁丝霉CBS202.75和嗜热毁丝霉CBS117.65菌株在100ml的YEG培养基中在带挡板的摇瓶(baffledshakeflask)中在45°C下以200rpm培养2天。菌丝体通过使用MIRACL0TH(Calbiochem,LaJolla,CA,USA)过滤来收获,在去离子水中洗涤两次,并在液氮下冷冻。将冷冻的菌丝体用臼和杵磨成细微的粉末,而总DNA使用DNEASYPlantMaxiKit(QIAGENInc.,Valencia,CA,USA)进行分离。实施例4对来自嗜热毁丝霉的家族61基因的分子筛选如下所示,基于通过如实施例1中所描述的串联质谱术(tandemmassspectrometry)获得的肽序列设计了简并引物。引物061564(C161B有义)5,-TCTCGGTCAACGGCCAGGAYCARGGNCA-3,(SEQIDNO8)引物061565(C161B反义)5,-GCGAGGCGGTGGCGGCRTTRTCNACYTT-3,(SEQIDNO9)将C161B有义和C161B反义引物各五十皮摩尔用于由IOOng的嗜热毁丝霉CBS202.75基因组DNA、或嗜热毁丝霉CBS117.65cDNA汇集DNA,IXADVANTAGEGC-MeltLABuffer(ClontechLaboratories,Inc.,MountainView,CA,USA),*禾中0.4mM白勺dATP>dTTP、dGTP和dCTP,以及1.25单位的ADVANTAGEGCGenomicPolymeraseMix(ClontechLaboratories,Inc.,MountainView,CA,USA)组成的最终体积为25μ1的PCR反应。所述扩增使用EPPENDORFMASTERCYCLER5333(EppendorfScientific,Inc.,ffestbury,NY,USA)来进行,其程序设置为一个循环在94°C下一分钟,以及30个循环,每个循环为在94°C下30秒,56.5°C下30秒和72°C下30秒,继以在72°C下5分钟的最终延伸。所得反应产物通过琼脂糖凝胶电泳在40mMTris碱_20mM乙酸钠-ImMEDTA二钠(TAE)缓冲液中进行分级,并将大于300bp的条带切出,使用MINELUATEGelExtractionKit(QIAGENInc.,Valencia,CA,USA)根据生产商的指示纯化,并使用Τ0Ρ0TAKitdnVitrogen,Carlsbad,CA,USA)进行亚克隆。质粒DNA自多种大肠杆菌转化体提取并加以测序。所述大肠杆菌克隆的测序分析显示所述序列包含家族61gh61i基因的编码区。实施例5自嗜热毁丝霉CBS202.75分离全长家族61基因(gh61i)来自嗜热毁丝霉CBS202.75的全长家族61gh61i基因使用GEN0MEWALKERUniversalKit(ClontechLaboratories,Inc.,MountainView,CA,USA)根据生产商的指示分离。简言之,将来自嗜热毁丝霉CBS202.75的总基因组DNA用四种不同的产生平端的限制性酶(DraI.EcoRV.PvuII和StuI)分别进行消化。将每批经消化的基因组DNA随即分别连接至GEN0MEWALKERAdaptor(ClontechLaboratories,Inc.,MountainView,CA,USA)以构建四个文库。这些文库随即在使用嗜热毁丝霉家族61gh61i基因的基因特异性引物的PCR反应中用作模板。如下所示的引物是基于在实施例4中获得的部分家族61gh61i基因序列设计的。上游区域引物MtGH6II-Rl:5,-AGGCGGCGATCGGGTTGTCCGGGTCGTT-3,(SEQIDNO10)MtGH61I-R2:5,-GTTGCAGGCCATGTTGGCATCGTTGACG-3,(SEQIDNO11)下游区域引物MtGH61I-Fl:5,-GTCGAGCAACTCCCCGATCCAGAACGTCAAC-3,(SEQIDNO12)MtGH61I-F2:5,-GACCCGGACAACCCGATCGCCGCCTCCCACAA-3,(SEQIDNO13)进行两个初步的PCR扩增,一个分离嗜热毁丝霉gh61i基因的上游区域,而另一个分离其下游区域。每个PCR扩增反应物(25μ1)由作为模板的每种Ιμ(大约6ng)的文库,每种0.4mM的dATP、dTTP、dGTP和dCTP,IOpmol的AdaptorPrimer1(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol的引物MtGH6II-Rl或引物MtGH61I-Fl,IXADVANTAGEGC-MeItLABuffer以及1.25单位的ADVANTAGEGCGenomicPolymeraseMix组成。所述扩增使用EPPENDORFMASTERCYCLER5333来进行,其程序设置为94°C下预变性1分钟,7个循环,每个循环为在94°C的变性温度下进行30秒、在72°C下退火并延伸5分钟,以及32个循环,每个循环为在94°C的变性温度下进行30秒、在67°C下退火并延伸5分钟,继以67°C下最终延伸7分钟。二次扩增反应物由作为模板的每种1μ1的初步PCR产物,每种0.4mM的dATP、dTTP、dGTP禾口dCTP,IOpmol的AdaptorPrimer2(ClontechLaboratories,Inc.,MountainView,CA,USA),IOpmol的嵌套引物(nestedprimer)MtGH61I-R2或MtGH61I_F2,IXADVANTAGEGC-MeltLABuffer以及1.25单位的ADVANTAGEGCGenomicPolymeraseMix组成,终体积为25μ1。所述扩增使用EPPENDORFMASTERCYCLER5333来进行,其程序设置为94°C下预变性1分钟,5个循环,每个循环为在94°C的变性温度下进行30秒、在72°C下退火并延伸5分钟,以及20个循环,每个循环为在94°C的变性温度下进行30秒,在67°C下退火并延伸5分钟,继以67°C下最终延伸7分钟。所得反应产物通过1.0%琼脂糖凝胶电泳在TAE缓冲液中进行分离,其中将来自StuI文库的2kbPCR产物(上游区域)和来自EcoRV文库的1.2kbPCR片段(下游区域)自所述凝胶切出,使用MINELUTEGelExtractionKit(QIAGENInc.,Valencia,CA,USA)根据生产商的指示进行纯化。将所得PCR产物直接测序或使用Τ0Ρ0TAKit亚克隆后再进行测序。实施例6编码具有纤维素分解增强活性的家族GH61I多肽的嗜热毁丝霉基因组序列的表征对PCR片段的DNA测序用Perkin-ElmerAppliedBiosystemsModel377XLAutomatedDNASequencer(Perkin-Elmer/AppliedBiosystems,Inc.,FosterCity,CA,USA)使用染料终止化学(Giesecke等,1992,JournalofVirologyMethods38:47_60)和引物步移策略来进行。细查核苷酸序列数据的质量,并在PHRED/PHRAP软件(UniversityofWashington,Seattle,WA,USA)的协助下将所有序列相互比较。基于编码的蛋白质与来自土生梭孢霉(登录号GENESEQP:ADM97933、GENESEQP:AEB90517)、球毛壳霉(Chaetomiumglobosum)(UNIPR0TQ2HGH1,UNIPR0T:Q2GW98)和粗糙脉孢霉(UNIPR0T:Q7S439)的同源糖苷水解酶家族61蛋白质的相似性构建了具有纤维素分解增强活性的嗜热毁丝霉GH61I多肽的基因模型。为验证获取的所述嗜热毁丝霉gh61i基因的序列信息,使用一对基因特异性引物(如下所示)进行了进一步的PCR反应,所述引物对涵盖了整个基因。引物MtGH61I_F55,-ACTGGATTTACCATGAAGCCTTTTAGCCTCGTCGCC-3,(SEQIDNO14)引物MtGH61I_R35,-TCACCTCTAGTTAATTAACTAGGGGAGGCACTGGCTGT-3,(SEQIDNO15)粗体字母代表编码序列。剩余序列与pAILo2(W02004/099228)的插入位点同源。所述PCR由在终体积50μ1中,由IOOng的嗜热毁丝霉CBS202.75基因组DNA、PfxAmplificationBuffer(Invitrogen,Carlsbad,CA,USA)、禾中0.4mM白勺dATP>dTTP、dGTP禾ΠdCTPUmMMgCl2以及2·5单位的PfxDNA聚合酶(Invitrogen,Carlsbad,CA,USA)组成的PCR反应物中的50皮摩尔的正向和反向引物组成。所述扩增使用EPPENDORFMASTERCYCLER.5333来进行,其程序设置为1个循环的98°C下3分钟,以及30个循环,每个循环为在98°C下30秒、60°C下30秒和72°C下1.5分钟,继以72°C下最终延伸15分钟。加热块随即进行4°C的浸泡循环(soakcycle)。所得反应产物通过1.0%琼脂糖凝胶电泳在TAE缓冲液中进行分离,并使用MINELUTEGelExtractionKit根据生产商的指示进行纯化。为了将所述PCR片段克隆入pCR2.1-T0P0载体(Invitrogen,Carlsbad,CA,USA),使用TaqDNA聚合酶(NewEnglandBiolabs,Ipswich,MA,USA)进行了3,A-突出端(overhang)的添加。将1293bp的嗜热毁丝霉gh61i基因片段使用Τ0Ρ0TACloningKit克隆入pCR2.I-TOPO载体以产生pSMai193(图2)。所得嗜热毁丝霉gh61i插入物通过DNA测序来确证。大肠杆菌pSMail93在2007年12月5日保藏于农业研究机构专利培养物保藏中心,亦称农业研究培养物保藏中心(AgriculturalResearchServicePatentCultureCollection),北区石if究中心(NorthernRegionalResearchCenter),Peoria,IL,USA并被指定了登录号B—50086。具有纤维素分解增强活性的嗜热毁丝霉GH61I多肽的核苷酸序列(SEQIDNO1)和推导的氨基酸序列(SEQIDNO2)示于图1。所述基因组多核苷酸编码310个氨基酸的多肽,其由91和229bp的两个内含子打断。全长编码序列和成熟编码序列的%G+C含量分别为62.2%和68.0%。使用SignalP软件程序(Nielsen等,1997,ProteinEngineering10:1-6),预测出15个残基的信号肽。预测的成熟蛋白质含有295个氨基酸,其分子量为30.2kDa。对具有纤维素分解增强活性的GH61I多肽的推导的氨基酸序列用Interproscan程序(Mulder等,2007,NucleicAcidsRes.35:D224_D228)的分析显示所述GH61I多肽含有真菌纤维素结合域(InterPro登录号IPR000254)的序列特征(sequencesignature)。该序列特征大约存在于所述成熟多肽(SMART登录号SM00236)的残基277到309处。对氨基酸序列的比较性配对全局比对(comparativepairwiseglobalalignment)使用如EMBOSS的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443_453)来确定,使用缺口产生罚分10,缺口延伸罚分0.5以及EBL0SUM62矩阵。所述比对显示了所述嗜热毁丝霉GH61I成熟多肽推导的氨基酸序列与来自粗糙脉孢菌的家族61糖苷水解酶蛋白推导的氨基酸序列(UniProt登录号Q7S439)分享83.2%的同一性(排除缺口)。实施例7构建含有编码具有纤维素分解增强活性的家族GH61I多肽的嗜热毁丝霉CBS202.75基因组序列的米曲霉表达载体将在实施例6中产生的同一个1293bp嗜热毁丝霉gh61iPCR片段使用InfusionCloningKit(BDBiosciences,PaloAlto,CA,USA)克隆入经NcoI和PacI消化的pAILo2(W02004/099228),得到pSMail89(图3),其中嗜热毁丝霉gh61i基因的转录在来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体(NA2_tpi启动子)控制下。连接反应物(50μ1)由IXInFusionBuffer(BDBiosciences,PaloAlto,CA,USA),IXBSA(BDBiosciences,PaloAlto,CA,USA),1μ1的Infusion酶(110稀释)(BDBiosciences,PaloAlto,CA,USA)、IOOng经NcoI和PacI消化的pAlLo2以及50ng的嗜热毁丝霉gh61i纯化PCR产物组成。所述反应物在室温下温育30分钟。将1μ1的反应物用于转化大肠杆菌XLlOS0L0PACKGoldSupercompetent细胞(Stratagene,LaJolla,CA,USA)0含有pSMail89的大肠杆菌转化体通过限制性酶消化检测出来,并使用BI0R0B0T9600(QIAGENInc.,Valencia,CA,USA)制备了质粒DNA。通过DNA测序来确认了pSMail89中的嗜热毁丝霉gh61i插入物。实施例8在米曲霉JaL355中表达嗜热毁丝霉家族61糖基水解酶基因(gh61i)米曲霉JaL355(W02002/40694)原生质体根据Christensen等,1988,Bio/Technology61419-1422的方法来制备。将3μg的pSMail89转化入米曲霉JaL355原生质体。自所述转化实验,将二十个转化体分离到单独的基本培养基平板上。将每种转化体的汇合的基本培养基平板用5ml的0.01%TffEEN20进行洗涤,并分别接种入25ml在125ml玻璃摇瓶中的M410培养基中,并在34°C下以250rpm温育。在温育5天后,对来自每个培养物的5μ1上清在CRITERI0N8-16%Tris-HClSDS-PAGE凝胶上使用CRITERIONCell(Bio-RadLaboratories,Hercules,CA,USA)根据生产商的指示进行分析。所得的凝胶用BIO-SAFECoomassieStain(Bio-RadLaboratories,Hercules,CA,USA)进行染色。所述培养物的SDS-PAGE概貌(profile)显示大多数转化体具有期待的30kDa的条带尺寸。生物材料的保藏依据布达佩斯条约的条款,下述的生物材料已经保藏于农业研究机构专利培养物保藏中心,亦称农业研究培养物保藏中心(AgriculturalResearchServicePatentCultureCollection),北区石if究中心(NorthernRegionalResearchCenter),1815UniversityStreet,Peoria,Illinois,61604,并给予下述的登录号保藏物登录号保藏日期大肠杆菌pSMail93NRRLB-500862007年12月5日所述菌株于下述条件下保藏确保在本专利申请未决期间,由外国专利法律决定授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了题述申请的对应申请或其子申请(progeny)的国家中,依据该外国专利法律的要求,可以获得所述保藏物。然而,应当理解,保藏物的可获得性并不构成对实施题述发明的许可,实施题述发明是对政府行为所授予的专利权的侵犯。本发明进一步由下述编号的段落描述[1]一种具有纤维素分解增强活性的分离的多肽,其选自下组(a)一种多肽,其包含与SEQIDNO2的成熟多肽具有至少60%同一性的氨基酸序列;(b)一种由如下多核苷酸编码的多肽,所述多核苷酸在至少中等严紧条件下与以下杂交(i)SEQIDNO1的成熟多肽编码序列,(ii)包含于SEQIDNO1的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(c)一种由如下多核苷酸编码的多肽,所述多核苷酸包含与SEQIDN0:1的成熟多肽编码序列具有至少60%同一性;和(d)一种变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQIDNO2的成熟多肽。[2]段落1的多肽,其包含与SEQIDNO2的成熟多肽具有至少60%同一性的氨基酸序列。[3]段落2的多肽,其包含与SEQIDNO2的成熟多肽具有至少65%同一性的氨基酸序列。[4]段落3的多肽,其包含与SEQIDNO2的成熟多肽具有至少70%同一性的氨基酸序列。[5]段落4的多肽,其包含与SEQIDNO2的成熟多肽具有至少75%同一性的氨基酸序列。[6]段落5的多肽,其包含与SEQIDNO2的成熟多肽具有至少80%同一性的氨基酸序列。[7]段落6的多肽,其包含与SEQIDNO2的成熟多肽具有至少85%同一性的氨基酸序列。[8]段落7的多肽,其包含与SEQIDNO2的成熟多肽具有至少90%同一性的氨基酸序列。[9]段落8的多肽,其包含与SEQIDNO2的成熟多肽具有至少95%同一性的氨基酸序列。[10]段落1的多肽,其包含SEQIDNO2的氨基酸序列或其具有纤维素分解增强活性的片段,或者由SEQIDNO:2的氨基酸序列或其具有纤维素分解增强活性的片段组成。[11]段落10的多肽,其包含SEQIDNO2的氨基酸序列,或者由SEQIDNO2的氨基酸序列组成。[12]段落10的多肽,其包含SEQIDNO2的成熟多肽,或者由SEQIDNO2的成熟多肽组成。[13]段落1的多肽,其是由在至少中等严紧条件下与以下杂交的多核苷酸编码的(i)SEQIDNO1的成熟多肽编码序列,(ii)包含于SEQIDNO1的成熟多肽编码序列中的cDNA序列,或(iii)⑴或()的全长互补链。[14]段落13的多肽,其是由在至少中等严紧条件下与以下杂交的多核苷酸编码的(i)SEQIDNO1的成熟多肽编码序列,(ii)包含于SEQIDNO1的成熟多肽编码序列中的cDNA序列,或(iii)⑴或()的全长互补链。[15]段落14的多肽,其是由在至少中等严紧条件下与以下杂交的多核苷酸编码的(i)SEQIDNO1的成熟多肽编码序列,(ii)包含于SEQIDNO1的成熟多肽编码序列中的cDNA序列,或(iii)⑴或()的全长互补链。[16]段落1的多肽,其是由包含与SEQIDNO1的成熟多肽编码序列具有至少60%同一性的核苷酸序列的多核苷酸编码的。[17]段落16的多肽,其是由包含与SEQIDNO1的成熟多肽编码序列具有至少5565%同一性的核苷酸序列的多核苷酸编码的。[18]段落17的多肽,其是由包含与SEQ70%同一性的核苷酸序列的多核苷酸编码的。[19]段落18的多肽,其是由包含与SEQ75%同一性的核苷酸序列的多核苷酸编码的。[20]段落19的多肽,其是由包含与SEQ80%同一性的核苷酸序列的多核苷酸编码的。[21]段落20的多肽,其是由包含与SEQ85%同一性的核苷酸序列的多核苷酸编码的。[22]段落21的多肽,其是由包含与SEQ90%同一性的核苷酸序列的多核苷酸编码的。[23]段落22的多肽,其是由包含与SEQ95%同一性的核苷酸序列的多核苷酸编码的。[24]段落1的多肽,其是由如下多核苷酸编码的,所述多核苷酸包含SEQIDNO1的核苷酸序列或其编码具有纤维素分解增强活性的片段的亚序列,或由SEQIDN0:1或其编码具有纤维素分解增强活性的片段的亚序列组成。[25]段落24的多肽,其是由如下多核苷酸编码的,所述多核苷酸包含SEQIDNO1的核苷酸序列,或由SEQIDNO1的核苷酸序列组成。[26]段落24的多肽,其是由如下多核苷酸编码的,所述多核苷酸包含SEQIDNO1的成熟多肽编码序列,或由SEQIDNO1的成熟多肽编码序列组成。[27]段落1的多肽,其中所述多肽是变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQIDNO2的成熟多肽。[28]段落1的多肽,其是由包含于质粒pSMail93中的多核苷酸编码的,所述质粒pSMail93包含于大肠杆菌NRRLB-50086中。[29]段落1-28任一所述的多肽,其中所述成熟多肽为SEQIDNO2的氨基酸16到310。[30]段落1-29任一所述的多肽,其中所述成熟多肽编码序列为SEQIDN0:1的核苷酸46到1250。[31]一种分离的多核苷酸,其包含编码段落1-30任一所述的多肽的核苷酸序列。[32]段落31的分离的多核苷酸,其在SEQIDNO1的成熟多肽编码序列中包含至少一个突变,其中所述突变核苷酸序列编码SEQIDNO:2的成熟多肽。[33]一种核酸构建体,其包含段落31或32的多核苷酸,所述多核苷酸可操作地连接于一个或多个(几个)控制序列,所述控制序列在表达宿主中指导该多肽的产生。[34]一种重组表达载体,其包含段落33的核酸构建体。[35]一种重组宿主细胞,其包含段落33的核酸构建体。[36]一种产生段落1-30任一所述多肽的方法,包括(a)在有助于该多肽产生的条件下培养细胞,所述细胞以其野生型形式产生该多肽;和(b)回收所述多肽。[37]一种产生段落1-30任一所述多肽的方法,包括(a)在有助于该多肽产生的条件下培养宿主细胞,所述宿主细胞包含核酸构建体,所述核酸构建体包含编码该多肽的IDNO1的成熟多肽编码序列具有至少IDNO1的成熟多肽编码序列具有至少IDNO1的成熟多肽编码序列具有至少IDNO1的成熟多肽编码序列具有至少IDNO1的成熟多肽编码序列具有至少IDNO1的成熟多肽编码序列具有至少核苷酸序列;和(b)回收所得多肽。[38]一种产生亲本细胞的突变体的方法,包括破坏或缺失编码段落1-30任一所述多肽的核苷酸序列,其导致所述突变体与所述亲本细胞相比产生较少的该多肽。[39]一种突变体细胞,其是由段落38的方法产生的。[40]段落39的突变体细胞,进一步包含编码天然或异源蛋白质的基因。[41]一种产生蛋白质的方法,包括(a)在有助于产生所述蛋白质的条件下培养段落40的突变体细胞;和(b)回收该蛋白质。[42]段落31或32所述的分离的多核苷酸,通过下述方法获取(a)在至少高严紧条件下将DNA群体与下述杂交(i)SEQIDNO=I的成熟多肽编码序列;(ii)包含于SEQIDNO1的成熟多肽编码序列中的cDNA序列,或(iii)⑴或(ii)的全长互补链;和(b)分离所得杂交的多核苷酸,其编码具有纤维素分解增强活性的多肽。[43]段落42的分离的多核苷酸,其中所述成熟多肽编码序列为SEQIDNO=I的核苷酸46到1250。[44]一种产生包含突变体核苷酸序列的多核苷酸的方法,所述突变体核苷酸序列编码具有纤维素分解增强活性的多肽,所述方法包括(a)将至少一种突变导入SEQIDNO1的成熟多肽编码序列中,其中所述突变体核苷酸序列编码包含SEQIDNO:2的成熟多肽或由SEQIDNO2的成熟多肽组成的多肽;和(b)回收包含所述突变体核苷酸序列的多核苷酸。[45]一种由段落44的方法产生的突变体多核苷酸。[46]一种产生多肽的方法,包括(a)在有助于所述多肽产生的条件下培养包含编码所述多肽的段落45的突变体多核苷酸的细胞;和(b)回收所述多肽。[47]一种产生段落1-30任一所述多肽的方法,包括(a)在有助于产生所述多肽的条件下培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码所述多肽的多核苷酸;和(b)回收所述多肽。[48]一种转基因植物、植物部分或植物细胞,其使用编码段落1-30任一所述的多肽的多核苷酸转化的。[49]一种双链抑制性RNA(dsRNA)分子,其包含段落31或32的多核苷酸的亚序列,其中所述dsRNA任选地为siRNA或miRNA分子。[50]段落49的双链抑制性RNA(dsRNA)分子,其在长度上为约15、16、17、18、19、20、21、22、23、24、25或更多个双链核苷酸。[51]一种在细胞中抑制具有纤维素分解增强活性的多肽表达的方法,其包括对所述细胞施用或在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含段落31或32的多核苷酸的亚序列。[52]段落51的方法,其中所述dsRNA在长度上为约15、16、17、18、19、20、21、22、23、24、25或更多个双链核苷酸。[53]一种核酸构建体,其包含与编码信号肽的核苷酸序列可操作地连接的编码蛋白质的基因,所述信号肽包含SEQIDNO2的氨基酸1到15,或由SEQIDNO:2的氨基酸1到15组成,其中所述基因对于所述核苷酸序列为外源的。[54]一种重组表达载体,其包含段落53的核酸构建体。[55]一种重组宿主细胞,其包含段落53的核酸构建体。[56]一种产生蛋白质的方法,包括(a)在有助于产生所述蛋白质的条件下培养段落55所述的重组宿主细胞;和(b)回收所述蛋白质。[57]一种降解或转化纤维素材料的方法,包括用纤维素分解酶组合物在段落1-30任一所述的具有纤维素分解增强活性的多肽存在下处理所述纤维素材料,其中所述具有纤维素分解增强活性的多肽的存在与所述具有纤维素分解增强活性的多肽不存在时相比增加了纤维素材料的降解。[58]段落57的方法,其中所述纤维素材料是经预处理的。[59]段落57或58的方法,其中所述纤维素分解酶组合物包含一种或多种纤维素分解酶,其选自下组纤维素酶、内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。[60]段落57-59任一所述的方法,进一步包括用一种或多种选自下组的酶处理所述纤维素材料半纤维素酶、酯酶、蛋白酶、漆酶或过氧化物酶。[61]段落57-60任一所述的方法,进一步包括回收所述降解的纤维素材料。[62]段落61的方法,其中所述降解的纤维素材料是糖。[63]段落62的方法,其中所述糖选自下组葡萄糖、木糖、甘露糖、半乳糖和阿拉伯糖。[64]一种产生发酵产物的方法,包括(a)用纤维素分解酶组合物在段落1-20任一所述的具有纤维素分解增强活性的多肽存在下糖化纤维素材料,其中所述具有纤维素分解增强活性的多肽的存在与所述具有纤维素分解增强活性的多肽不存在时相比增加了纤维素材料的降解;(b)用一种或多种发酵微生物发酵步骤(a)的经糖化的纤维素材料以产生所述发酵产物;和(c)自所述发酵回收所述发酵产物。[65]段落64的方法,其中所述纤维素材料是经预处理的。[66]段落64或65的方法,其中所述纤维素分解酶组合物包含一种或多种选自下组的纤维素分解酶纤维素酶、内切葡聚糖酶、纤维二糖水解酶和β“葡糖苷酶。[67]段落64-66任一所述的方法,进一步包括用一种或多种选自下组的酶处理所述纤维素材料半纤维素酶、酯酶、蛋白酶、漆酶或过氧化物酶。[68]段落64-67任一所述的方法,其中步骤(a)和(b)在同时糖化和发酵中同时进行。[69]段落64-68任一所述的方法,其中所述发酵产物是醇、有机酸、酮、氨基酸或气体。[70]一种发酵纤维素材料的方法,包括用一种或多种发酵微生物发酵所述纤维素材料,其中将所述纤维素材料用纤维素分解酶组合物在段落1-30任一所述的具有纤维素分解增强活性的多肽的存在下糖化,且所述具有纤维素分解增强活性的多肽的存在与所述具有纤维素分解增强活性的多肽不存在时相比增加了纤维素材料的降解。[71]段落70的方法,其中所述纤维素材料的发酵产生发酵产物。[72]段落71的方法,进一步包括从所述发酵回收所述发酵产物。[73]段落70-72任一所述的方法,其中所述纤维素材料在糖化前经预处理。[74]段落70-73任一所述的方法,其中所述纤维素分解酶组合物包含一种或多种选自下组的纤维素分解酶纤维素酶、内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。[75]段落70-74任一所述的方法,其中所述纤维素分解酶组合物进一步包含一种或多种选自下组的酶半纤维素酶、酯酶、蛋白酶、漆酶或过氧化物酶。[76]段落70-75任一所述的方法,其中所述发酵产物是醇、有机酸、酮、氨基酸或气体。在本文中描述和要求保护的发明在范围上并不受本文公开的特定方面所限,这是因为这些方面的意图为说明本发明的数个方面。任何等价的方面应认为在本发明的范围内。事实上,除本文中显示和描述的那些之外,数种对本发明的修改从前述的描述而言对本领域技术人员将显而易见。上述修改亦意欲符合所附权利要求的范围。在出现冲突的情况下,以包括定义在内的本公开为准。59权利要求一种具有纤维素分解增强活性的分离的多肽,其选自下组(a)一种多肽,其包含与SEQIDNO2的成熟多肽具有至少60%同一性的氨基酸序列;(b)一种由如下多核苷酸编码的多肽,所述多核苷酸在至少中等严紧条件下与以下杂交(i)SEQIDNO1的成熟多肽编码序列,(ii)包含于SEQIDNO1的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;(c)一种由如下多核苷酸编码的多肽,所述多核苷酸包含与SEQIDNO1的成熟多肽编码序列具有至少60%同一性的核苷酸序列;和(d)一种变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQIDNO2的成熟多肽。2.权利要求1的多肽,其包含SEQIDNO:2的氨基酸序列或其具有纤维素分解增强活性的片段,或由SEQIDNO:2的氨基酸序列或其具有纤维素分解增强活性的片段组成。3.权利要求1的多肽,其是由包含于质粒pSMail93中的多核苷酸编码的,所述质粒pSMail93包含于大肠杆菌NRRLB-50086中。4.一种分离的多核苷酸,其包含编码权利要求1-3任一所述的多肽的核苷酸序列。5.一种核酸构建体,其包含权利要求4的多核苷酸,所述多核苷酸可操作地连接于一个或多个(几个)控制序列,所述控制序列在表达宿主中指导该多肽的产生。6.一种重组宿主细胞,其包含权利要求5的核酸构建体。7.—种产生权利要求1-3任一所述多肽的方法,包括(a)在有助于该多肽产生的条件下培养细胞,所述细胞以其野生型形式产生该多肽;和(b)回收所述多肽。8.—种产生权利要求1-3任一所述多肽的方法,包括(a)在有助于该多肽产生的条件下培养宿主细胞,所述宿主细胞包含含有编码该多肽的核苷酸序列的核酸构建体;和(b)回收所述多肽。9.一种产生亲本细胞突变体的方法,包括破坏或缺失编码权利要求1-3任一所述多肽的核苷酸序列,其导致所述突变体与所述亲本细胞相比产生较少的该多肽。10.一种产生权利要求1-3任一所述多肽的方法,包括(a)在有助于产生所述多肽的条件下培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码所述多肽的多核苷酸;和(b)回收所述多肽。11.一种转基因植物、植物部分或植物细胞,其是用编码权利要求1-3任一所述的多肽的多核苷酸转化的。12.—种双链抑制性RNA(dsRNA)分子,其包含权利要求4的多核苷酸的亚序列,其中所述dsRNA任选地为siRNA或miRNA分子。13.—种在细胞中抑制具有纤维素分解增强活性的多肽表达的方法,包括对所述细胞施用或将在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含权利要求4的多核苷酸的亚序列。14.一种核酸构建体,其包含与编码信号肽的核苷酸序列可操作地连接的编码蛋白质的基因,所述信号肽包含SEQIDNO2的氨基酸1到15,或由SEQIDNO2的氨基酸1到15组成,其中所述基因对于所述核苷酸序列是外源的。15.一种重组宿主细胞,其包含权利要求14的核酸构建体。16.一种产生蛋白质的方法,包括(a)在有助于产生所述蛋白质的条件下培养权利要求15的重组宿主细胞;和(b)回收所述蛋白质。17.一种降解或转化纤维素材料的方法,包括用纤维素分解酶组合物在权利要求1-3任一所述的具有纤维素分解增强活性的多肽存在下处理所述纤维素材料,其中所述具有纤维素分解增强活性的多肽的存在与所述具有纤维素分解增强活性的多肽不存在时相比增加了所述纤维素材料的降解。18.权利要求17的方法,进一步包括回收所述经降解的纤维素材料。19.一种产生发酵产物的方法,包括(a)用纤维素分解酶组合物在权利要求1-3任一所述的具有纤维素分解增强活性的多肽存在下糖化纤维素材料,其中所述具有纤维素分解增强活性的多肽的存在与所述具有纤维素分解增强活性的多肽不存在时相比增加了所述纤维素材料的降解;(b)用一种或多种发酵微生物发酵步骤(a)的经糖化的纤维素材料以产生所述发酵产物;和(c)自所述发酵回收所述发酵产物。20.一种发酵纤维素材料的方法,包括用一种或多种发酵微生物发酵所述纤维素材料,其中在权利要求1-3任一所述的具有纤维素分解增强活性的多肽存在下将所述纤维素材料用纤维素分解酶组合物糖化,并且所述具有纤维素分解增强活性的多肽的存在与所述具有纤维素分解增强活性的多肽不存在时相比增加了所述纤维素材料的降解。全文摘要本发明涉及具有纤维素分解增强活性的分离的多肽和编码该多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞以及产生和使用所述多肽的方法。文档编号C07K14/39GK101952304SQ200880127100公开日2011年1月19日申请日期2008年12月17日优先权日2007年12月19日发明者保罗·哈里斯,苏钦德拉·梅尤兰,金伯利·布朗申请人:诺维信公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1