具有纤维素分解增强活性的多肽和编码它的多核苷酸的制作方法

文档序号:570608阅读:270来源:国知局

专利名称::具有纤维素分解增强活性的多肽和编码它的多核苷酸的制作方法
技术领域
:本发明涉及具有纤维素分解增强活性的分离的多肽和编码这些多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用这些多肽的方法。相关技术的说明纤维素是一种由简单糖类葡萄糖通过P-l,4-联结共价键合而成的聚合物。许多微生物可产生水解P-联结的葡聚糖的酶。这些酶包括内切葡聚糖酶(endoglucanases)、纤维二糖水解酶(cellobiohydrolases)和P_葡糖苷酶(P-glucosidases)。内切葡聚糖酶在随机的部位消化纤维素聚合物,使其暴露于纤维二糖水解酶的攻击之下。纤维二糖水解酶从该纤维素聚合物的末端顺序地释放纤维二糖分子。纤维二糖是一种水溶性的葡萄糖13_1,4-联结二聚物。13-葡糖苷酶将纤维二糖水解成葡萄糖。将含纤维素原料转化为乙醇具有大量原料易得、可理想地避免材料的焚烧和填埋,以及乙醇燃料的清洁性等优势。木材、农业残余物、草本作物,以及城市固体废物已被考虑用来作为生产乙醇的原料。这些材料主要由纤维素、半纤维素和木质素构成。一旦纤维素被转化为葡萄糖,葡萄糖即被酵母容易地转化为乙醇。提高转化含纤维素原料的能力在本领域中将会是有利的。W02005/074647公开了来自土生梭孢壳(Thielaviaterrestris)的具有纤维素分解增强活性的分离的多肽及其多核苷酸。W02005/074656公开了来自橙色嗜热子囊菌(Thermoascusaurantiacus)的具有纤维素分解增强活性的分离的多肽及其多核苷酸。公布的美国专利申请序列号2007/0077630公开了来自里氏木霉(Trichodermareesei)的具有纤维素分解增强活性的分离的多肽及其多核苷酸。本发明提供具有纤维素分解增强活性的多肽和编码这些多肽的多核苷酸。
发明内容本发明涉及具有纤维素分解增强活性的分离的多肽,其选自下组(a)包含与SEQIDNO:2的成熟多肽具有至少60%同一性之氨基酸序列的多肽;(b)由与(i)SEQIDN0:1的成熟多肽编码序列、(ii)包含SEQIDNO:1的成熟多肽编码序列之基因组DNA序列、或(iii)(i)或(ii)的全长互补链在至少中等严紧度条件下杂交的多核苷酸所编码的多肽;(c)由包含与SEQIDNO:1的成熟多肽编码序列具有至少60%同一性之核苷酸序列的多核苷酸所编码的多肽;禾口(d)SEQIDNO:2的成熟多肽包含一个或多个(数个)氨基酸的取代、缺失和/或插入的变体。本发明还涉及编码具有纤维素分解增强活性的多肽的分离的多核苷酸,它们选自下组(a)编码包含与SEQIDNO:2的成熟多肽具有至少60%同一性的氨基酸序列之多肽的多核苷酸;(b)与(i)SEQIDNO:1的成熟多肽编码序列、(ii)包含SEQIDNO:1的成熟多肽编码序列之基因组DNA序列、或(iii)(i)或(ii)的全长互补链在至少中等严紧度条件下杂交的多核苷酸;(c)包含与SEQIDNO:1的成熟多肽编码序列具有至少60%同一性之核苷酸序列的多核苷酸;禾口(d)编码SEQIDNO:2的成熟多肽包含一个或多个(数个)氨基酸的取代、缺失和/或插入的变体的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体、重组宿主细胞,以及产生具有纤维素分解增强活性的多肽的方法。本发明还涉及抑制多肽在细胞中的表达的方法,包括对细胞施用或者在细胞中表达双链RNA(dsRNA)分子,其中该dsRNA包含本发明的多核苷酸的子序列。本发明还涉及这样的双链抑制性RNA(dsRNA)分子,其中任选地该dsRNA是siRNA或miRNA分子。本发明还涉及用于降解或转化含纤维素材料的方法,包括在有效量的此类具有纤维素分解增强活性的多肽的存在下用有效量的纤维素分解酶组合物处理含纤维素材料,其中与不存在所述具有纤维素分解增强活性的多肽时相比,该具有纤维素分解增强活性的多肽的存在增加含纤维素材料的降解。本发明还涉及产生发酵产物的方法,包括(a)在有效量的此类具有纤维素分解增强活性的多肽的存在下,用有效量的纤维素分解酶组合物糖化含纤维素材料,其中与不存在所述具有纤维素分解增强活性的多肽时相比,该具有纤维素分解增强活性的多肽的存在增加含纤维素材料的降解;(b)用一种或多种发酵微生物将步骤(a)的经糖化的含纤维素材料发酵以产生发酵产物;和(c)从发酵回收发酵产物。本发明还涉及包含编码此类具有纤维素分解增强活性的多肽的分离的多核苷酸的植物。本发明还涉及产生此类具有纤维素分解增强活性的多肽的方法,包括(a)在有助于产生此类具有纤维素分解增强活性的多肽的条件下培养包含编码该多肽的多核苷酸的转基因植物或植物细胞;和(b)回收所述多肽。本发明还涉及包含编码蛋白质的基因的核酸构建体,其中所述基因可操作地连接于编码信号肽的核苷酸序列,所述信号肽包含SEQIDN0:2的氨基酸1-15或者由SEQIDNO:2的氨基酸1-15组成,其中所述基因对于所述核苷酸序列而言是外源的。附图简要说明图1显示一种具有纤维素分解增强活性的土生梭孢壳NRRL8126多肽的cDNA序列及推定的氨基酸序列(分别为SEQIDNO:1和2)。图2显示pTter6IF的限制性酶切图。图3显示pAlLo23的限制性酶切图。图4显示pMJ04的限制性酶切图。图5显示pCaHj527的限制性酶切图。图6显示pMT2188的限制性酶切图。图7显示pCaHj568的限制性酶切图。图8显示pMJ05的限制性酶切图。图9显示pSMail30的限制性酶切图。图10显示米曲霉(Aspergillusoryzae)P-葡糖苷酶的天然信号序列的DNA序列及氨基酸序列(SEQIDNO:37和38)。图11显示特异腐质霉(Humicolainsolens)内切葡聚糖酶V信号序列的DNA序列及氨基酸序列(SEQIDNO:41和42)。图12显示pSMail35的限制性酶切图。定义纤维素分解增强活性(cellulolyticenhancingactivity):术语"纤维素分解增强活性"在此定义为增强具有纤维素分解活性的蛋白质对含纤维素材料的水解的生物学活性。为本发明的目的,纤维素分解增强活性是通过测量纤维素分解性蛋白质在下述条件下水解含纤维素材料所致的还原糖增加或纤维二糖与葡萄糖的总量增加来加以确定的l-50mg总蛋白/gPCS中的纤维素,其中总蛋白包含80-99.5%w/w的纤维素分解蛋白/gPCS中的纤维素,及0.5-20%w/w的具有纤维素分解增强活性的蛋白质,5(TC历时1_7天,与用相等的无纤维素分解增强活性的总蛋白加载量(l-50mg纤维素分解蛋白/gPCS中的纤维素)所进行的对照水解反应作比较。在一个优选的方面,加载的纤维素酶蛋白是在有3%总蛋白重量的米曲霉P-葡糖苷酶(根据W002/095014在米曲霉中重组表达的)或3%总蛋白重量的烟曲霉(Aspergillusfumigatus)P-葡糖苷酶(根据WO02/095014的实施例22在米曲霉中重组表达的)存在的CELLUCLAST1.5L(NovozymesA/S,BagSVaerd,Denmark)的混合物,将其用作纤维素分解活性的来源。所述具有纤维素分解增强活性的多肽具有SEQIDNO:2的成熟多肽的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,进一步更优选至少90%,最优选至少95%,进一步最优选至少100%的纤维素分解增强活性。所述具有纤维素分解增强活性的多肽以下述方式增强由具有纤维素分解活性的蛋白质所催化的含纤维素材料的水解将为达到同样水解程度所需的纤维素分解酶的量减少优选至少0.1倍,更优选至少0.2倍、更优选至少0.3倍、更优选至少0.4倍、更优选至少0.5倍、更优选至少1倍、更优选至少3倍、更优选至少4倍、更优选至少5倍、更优选至少10倍、更优选至少20倍、进一步更优选至少30倍、最优选至少50倍、进一步最优选至少100倍。纤维素分解活性(cellulolyticactivity):术语"纤维素分解活性"在本文中定义为水解含纤维素材料的生物学活性。纤维素分解蛋白可水解或水解羧甲基纤维素(CMC),从而降低温育混合物的粘度。由此造成的粘度下降可以用振动粘度计(例如Sofraser,France产的MIVI3000)来测定。纤维素酶活性(以纤维素粘度单位(CellulaseViscosityUnit,CEVU)作为量度)测定是通过测量样品降低羧甲基纤维素(CMC)溶液粘度的能力来确定样品中催化活性的量。测定在适合纤维素分解蛋白和底物的温度和PH进行。对于CELLUCLASTTM(NovozymesA/S,BagSVaerd,Denmark),进行测定的条件为40°C、于0.1M磷酸盐pH9.0缓冲液中,历时30分钟,以CMC为底物(33.3g/L羧甲基纤维素Hercules7LFD),且酶浓度为大约3.3-4.2CEVU/ml。CEVU活性是相对于公认的酶标准品,例如CELLUZ预ETMStandard17-1194(获自NovozymesA/S,BagSV2erd,Denmark)来计算的。为本发明的目的,纤维素分解活性是通过测量在下述条件下纤维素分解性混合物对含纤维素材料的水解的增加来确定的l-10mg纤维素分解蛋白质/gPCS中的纤维素,历时5-7天,50°C,与不加纤维素分解蛋白的对照水解相比较。内切葡聚糖酶术语"内切葡聚糖酶"在本文中定义为一种内切-1,4-(1,3;1,4)-P-D-葡聚糖4-葡聚糖水解酶(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(诸如羧甲基纤维素和羟甲基纤维素)、地衣淀粉中的1,4-P-D-糖苷联结;混合型P-l,3葡聚糖如谷物(cereal)P-D-葡聚糖或木葡聚糖,和其他含纤维素性组分的植物材料中的P-1,4键的内水解(endohydrolysis)。为本发明的目的,内切葡聚糖酶活性是根据Ghose,1987,PureandAppl.Chem.59:257-268所述的程序利用羧甲基纤维素(CMC)水解来确定的。纤维二糖水解酶术语"纤维二糖水解酶"在本文中定义为一种1,4-13-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化水解纤维素、纤维寡糖、或任何含P-l,4-连接的葡萄糖的聚合物中1,4-e-D-葡糖苷联结,从链的还原端或非还原端释放纤维二糖。为本发明的目的,纤维二糖水解酶活性是依照Lever等,1972,Anal.Biochem.47:273-279和vanTilbeurgh等,1982,FEBSLetters149:152—156;vanTilbeurgh禾PClaeyssens,1985,FEBSLetters187:283-288中记载的程序加以测定的。在本发明中,Lever等人的方法被用来评估玉米秸秆中纤维素的水解,而vanTilbeurgh等人的方法被用于测定对一种荧光性二糖衍生物的纤维二糖水解酶活性。|3-葡糖苷酶术语"13-葡糖苷酶"在本文中定义为一种13-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化水解末端非还原性13-D-葡萄糖残基,释放13-D-葡萄糖。为本发明的目的,P_葡糖苷酶活性是根据Venturi等,2002'J.BasicMicrobiol.42:55-66记载的基本程序来测定的,只是使用了如本文所述的不同条件。一个单位的P-葡糖苷酶活性定义为在100mM拧檬酸钠、0.01^TWEEN⑧20中,5(TC、pH5条件下每分钟从作为底物的4mM对硝基苯基-13-D-吡喃葡萄糖苷产生1.0微摩尔对硝基苯酚。家族61糖苷水解酶术语"家族61糖苷水解酶"或"家族GH61"在本文中定义为落入根据HenrissatB.,1991,Aclassificationofglycosylhydorlasesbasedonamino_acidsequencesimilarities,Biochem.J.280:309-316以及HenrissatB.禾口BairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydorlases,Biochem.J.316:695-696所述的糖苷水解酶家族61的多肽。目前,Henrissat将GH61家族归于未分类之列,表明该家族所属的多肽的机制、催化性亲核体/碱、催化性质子供体以及3D结构等性质均系未知。GH61蛋白又被称为CEL61蛋白。含纤维素材料生物质的初生细胞壁中主要的多糖是纤维素,丰度第二高的是半纤维素,第三是果胶。在细胞停止生长后产生的次生细胞璧也含有多糖,并且被与半纤维素共价交联的多聚体木质素所增强。纤维素是脱水纤维二糖的同聚物,因此是一种直链P-(l-4)-D-葡聚糖,而半纤维素包括多种化合物,如木聚糖、木葡聚糖、阿拉伯木聚糖和甘露聚糖,具有复杂的分枝结构和一系列取代基。虽然纤维素一般是无定形的,但植物组织中发现的纤维素主要呈现为由平行葡聚糖链构成的不溶性晶体基质。半纤维素通常通过氢键连接于纤维素以及其他半纤维素上,这有助于细胞壁基质的稳定化。含纤维素材料可以是任何含有纤维素的材料。纤维素通常存在于例如植株的茎、叶、果/种壳(hulls)、果/种皮(husks)和穗轴(cobs),或者树的叶、枝、和木材等之中。含纤维素材料可以是,但不限于,草质材料(herbaceousmaterial)、农业残余物(agriculturalresidues)、林业残余物(forestryresidues),城市固体废物(municipalsolidwastes)、废纸(wastepaper),以及纸桨和造纸厂残余物(pulpandpapermillresidues)。含纤维素材料可以是任何类型的生物质,包括但不限于木材资源、城市固体废物、废纸、作物和作物残余物(见例如Wiselogel等,1995,《HandbookonBioethanol》(CharlesE.Wyman编),第105-118页,Taylor&Francis,WashingtonD.C.;Wyman,1994,BioresourceTechnology50:3_16丄ynd,1990,AppliedBiochemistryandBiotechnology24/25:695-719;Mosier等,1999,RecentProgressinBioconversionofLignocellulosics,《AdvancesinBiochemicalEngineering/Biotechnology》,T.Sch印er总编,第65巻,第23-40页,Springer-Verlag,NewYork)。在本文中应该理解,纤维素可以是木素纤维素的形式,它是一种植物细胞壁材料,在混合的基质中包含木质素、纤维素和半纤维素。在一个优选的方面,含纤维素材料是玉米秸秆(cornstover)。在另一个优选的方面,含纤维素材料是玉米纤维。在另一个优选的方面,含纤维素材料是玉米穗轴。在另一个优选的方面,含纤维素材料是稻草(ricestraw)。在另一个优选的方面,含纤维素材料是纸和纸浆加工废物。在另一个优选的方面,含纤维素材料是木本或草本植物。在另一个优选的方面,含纤维素材料是甘蔗渣。含纤维素材料可以直接使用,或者可以使用本领域已知的常规技术对其进行预处理。例如,物理预处理技术可包括各种类型的粉碎(milling)、辐射(irradiation)、汽蒸/蒸汽爆石皮(steaming/steamexplosion)、禾口湿热分角牟作用(hydrothermolysis);化学预处理技术可包括稀酸、碱、有机溶剂、氨、二氧化硫、二氧化碳、和pH受控的湿热分解作用;而生物预处理技术可涉及施加溶木质素性微生物(参见,例如Hsu,T.-A.,1996,Pretreatmentofbiomass,《HandbookonBioethanol-ProductionandUtilization》,Wyman,C.E.编,Taylor&Francis,Washington,DC,179—212;Ghosh,P.和Singh,A.,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomass:areview,《EnzymaticConversionofBiomass8forFuelsProduction》,Himmel,M.E.,Baker,J.0.禾口0verend,R.P.编,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.禾口Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,《AdvancesinBiochemicalEngineering/Biotechnology》,Sch印er,T.编,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;01sson,L禾口Hahn-Hagerdal,B.,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18:312-331;以及Vallander,L.禾口Eriksson,K._E.L.,1990,Productionofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.Biochem.Eng./Biotechnol.42:63-95)。预处理的玉米秸秆术语"PCS"或"预处理的玉米秸秆"在本文中定义为通过热和稀酸处理从玉米秸秆获得的含纤维素材料。为本发明的目的,PCS是通过本文中说明的方法制备的。分离的多肽本文所用的术语"分离的多肽"是指从一个来源分离的多肽。在一个优选的方面,所述多肽是通过SDS-PAGE测定为至少1%纯、优选至少5%纯、更优选至少10%纯、更优选至少20%纯、更优选至少40%纯、更优选至少60%纯、进一步更优选至少80%纯、最优选至少90%纯的。基本上纯的多肽术语"基本上纯的多肽"在本文是指这样的多肽制备物,其含有以重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,进一步更优选至多2%,最优选至多1%,进一步最优选至多0.5%的与其天然地或重组地相伴随的其他多肽物质。因此,优选的是,基本上纯的多肽以制备物中存在的总多肽物质的重量计是至少92%纯、优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少96%纯、更优选至少97%纯、更优选至少98%纯、进一步更优选至少99%、最优选至少99.5%纯、进一步最优选100%纯的。本发明的多肽优选是基本上纯的形式,即,多肽制备物实质上不含与其天然地或重组地相伴随的其他多肽物质。这可以通过例如用公知的重组技术或通过经典的纯化方法制备所述多肽来实现。成熟多肽术语"成熟多肽"在本文中定义为经过翻译和任何翻译后修饰(如N末端加工、C末端截短、糖基化、磷酸化等)之后,处于其最终形式的具有纤维素分解增强活性的多肽。在一个优选的方面,基于SignalP程序所作的SEQIDNO:2的氨基酸1_15为信号肽的预测,成熟多肽是SEQIDNO:2的氨基酸16-317。成熟多肽编码序列术语"成熟多肽编码序列"在本文中定义为编码成熟的具有纤维素分解增强活性的多肽的核苷酸序列。在一个优选的方面,基于SignalP程序所作的SEQIDN0:1的核苷酸1-45编码信号肽的预测,成熟多肽编码序列是SEQIDNO:l的核苷酸46-951。同一性两个氨基酸序列之间或者两个核苷酸序列之间的相关性用参数"同一性"来描述。为本发明的目的,两个氨基酸序列之间同一性程度的确定使用如EMBOSS软件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,TrendsinGenetics16:276-277),优选3.0.0或更新的版本中的Needle程序所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)。所用的可选参数为缺口形成罚分(g即openpenalty)10、缺口延伸罚分(g即extensionpenalty)0.5、和EBL0SUM62(BL0SUM62的EMBOSS版)取代矩阵。将Needle的标记为"longestidentity"("最长同一性")(使用-nobrief(无简述)选项获得)的输出结果作为百分比同一性使用,它是这样计算出来的(相同的残基数x100)/(比对长度-比对中的缺口总数)为本发明的目的,两个脱氧核糖核苷酸序列之间的同一性程度的确定使用如EMBOSS软件包(EMBOSS:TheEuropeanMolecularBiologyOpenSoftwareSuite,Rice等,2000,同上),优选3.0.0或更新的版本中的Needle程序所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,同上)。所用的可选参数为缺口形成罚分10、缺口延伸罚分0.5、和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。将Needle的标记为"longestidentity"("最长同一性")(使用-nobrief选项获得)的输出结果作为百分比同一性使用,它是这样计算出来的(相同的脱氧核糖核苷酸数x100)/(比对长度-比对中的缺口总数)同源序列术语"同源序列"在本文中定义为用SEQIDNO:2的成熟多肽进行tfasty搜索(Pearson,W.R.,1999,《BioinformaticsMethodsandProtocols》,S.Misener和S.A.Krawetz编,第185-219页)时,给出的E值(或称期望值)小于O.OOl的预测蛋白质。多肽片段术语"多肽片段"在本文中定义为从SEQIDNO:2的成熟多肽的氨基端和/或羧基端缺失一个或多个(数个)氨基酸而得到的多肽;或其同源序列;其中所述片段具有纤维素分解增强活性。在一个优选的方面,片段含有SEQIDN0:2的成熟多肽或其同源序列的至少255个氨基酸残基、更优选至少270个氨基酸残基、最优选至少285个氨基酸残基。子序列术语"子序列"在本文中定义为从SEQIDNO:1的成熟多肽编码序列的5'端和/或3'端缺失了一个或多个(数个)核苷酸的核苷酸序列;或者其同源序列;其中所述子序列编码具有纤维素分解增强活性的多肽片段。在一个优选的方面,子序列含有SEQIDNO:1的成熟多肽编码序列或其同源序列的至少765个核苷酸、更优选至少810个核苷酸、最优选至少855个核苷酸。等位变体(allelicvariant):术语"等位变体"是指基因的占据同一染色体座位的两种或更多种可选形式中的任一种。等位变异在天然情况下通过突变产生,并可导致群体中的多态性。基因突变可以是沉默的(被编码的多肽中没有变化),或者可以编码氨基酸序列被改变的多肽。多肽的等位变体是基因的等位变体所编码的多肽。分离的多核苷酸本文中所用的术语"分离的多核苷酸"是指从一个来源分离而来的多核苷酸。在一个优选的方面,所述多核苷酸通过琼脂糖凝胶电泳测定为至少1%纯、优选至少5%纯、更优选至少10%纯、更优选至少20%纯、更优选至少40%纯、更优选至少60%纯、进一步更优选至少80%纯、最优选至少90%纯。基本上纯的多核苷酸本文中所用的术语"基本上纯的多核苷酸"是指这样的多核苷酸制备物,其不含有其他无关或不需要的核苷酸,并且处于适合在经基因工程改造的蛋白质的生产系统中使用的形式。因此,基本上纯的多核苷酸含有以重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,进一步更优选至10多2%,最优选至多1%,进一步最优选至多0.5%的与其天然地或重组地相伴随的其他多核苷酸物质。但是,基本上纯的多核苷酸可以包括天然存在的5'和3'非翻译区,如启动子和终止子。优选的是,基本上纯的多核苷酸以重量计为至少90%纯、优选至少92%纯、更优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少97%纯、进一步更优选至少98%纯、最优选至少99%纯、进一步最优选至少99.5%纯。本发明的多核苷酸优选是处于基本上纯的形式,即多核苷酸制备物基本上不含与其天然地或重组地相伴随的其他多核苷酸物质。多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或者上述来源的任意组合。编码序列当用于本文时,术语"编码序列"是指这样的核苷酸序列,它直接规定其蛋白质产物的氨基酸序列。编码序列的边界一般是由可读框决定的,后者通常以ATG起始密码子或其他可选的起始密码子如GTG及TTG开始,而以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的、或重组的核苷酸序列。cDNA:术语"cDNA"在本文中定义为这样的DNA分子,它能够从获自真核细胞的成熟的、经剪接的mRNA分子通过逆转录制备得到。cDNA缺少在对应的基因组DNA中通常存在的内含子序列。最初的初级RNA转录物是mRNA的前体,它经历一系列步骤被加工之后作为成熟的、经剪接的mRNA出现。这些步骤包括通过一个称为剪接的过程去除内含子序列。因此,从mRNA衍生而来的cDNA缺少任何内含子序列。核酸构建体术语"核酸构建体"在用于本文时是指这样的单链或双链核酸分子其是从天然存在的基因分离的,或者经过修饰而以原本不会存在于自然界中的方式包含核酸的片段,或者是合成的。当核酸构建体包含本发明的编码序列的表达所需的控制序列时,术语"核酸构建体"与术语"表达盒"是同义的。控制序列术语"控制序列"在本文中定义为包括编码本发明多肽的多核苷酸的表达所必需的所有组件。每个控制序列对于编码多肽的核苷酸序列而言,或者对于其它控制序列而言,可以是天然的或者外来的。这样的控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽(prop印tide)序列、启动子、信号肽序列和转录终止子。在最低程度上,控制序列包括启动子以及转录和翻译终止信号。控制序列可以具有接头,用来引入特异性限制性位点以帮助将控制序列与编码多肽的核苷酸序列的编码区连接。可操作地连接术语"可操作地连接"在本文中是指这样一种构型,其中控制序列相对于多核苷酸序列的编码序列被置于合适的位置上,使得该控制序列指导多肽编码序列的表达。表达术语"表达"包含多肽产生过程中涉及的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、以及分泌。表达载体术语"表达载体"在本文中定义为一种线性或环状DNA分子,其包含编码本发明多肽的多核苷酸,且可操作地连接于为其表达提供条件的其他核苷酸。宿主细胞术语"宿主细胞"在用于本文时包括任何易于被包含本发明的多核苷酸的核酸构建体或表达载体所转化、转染、转导等的细胞类型。修饰术语"修饰"在本文中意指对由SEQIDNO:2的成熟多肽组成的多肽或其同源序列进行的任何化学修饰;以及对编码此类多肽的DNA进行的遗传操作。修饰可以是一个或多个(数个)氨基酸的取代、缺失和/或插入,以及一个或多个(数个)氨基酸侧链的替换。人工变体当在本文中使用时,术语"人工变体"是指由这样的生物体所产生的具有纤维素分解增强活性的多肽所述生物体表达SEQIDN0:1的成熟多肽编码序列或其同源序列的修饰型多核苷酸序列。所述修饰型多核苷酸序列是对SEQIDN0:1公开的多核苷酸序列或其同源序列通过修饰加以人工干预而获得的。发明详细说明具有纤维素分解增强活性的多肽在第一个方面,本发明涉及包含如下所述的氨基酸序列或由这样的氨基酸序列组成,且具有纤维素分解增强活性的分离的多肽(下文称为"同源多肽)所述氨基酸序列与SEQIDNO:2的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,进一步更优选至少90%,最优选至少95%,进一步最优选至少96%,至少97%,至少98%,或至少99%的同一性程度。在一个优选的方面,同源多肽包含如下所述的氨基酸序列或由这样的氨基酸序列组成所述氨基酸序列与SEQIDN0:2的成熟多肽有10个氨基酸、优选5个氨基酸、更优选4个氨基酸、进一步更优选3个氨基酸、最优选2个氨基酸、进一步最优选1个氨基酸不同。本发明的多肽优选包含SEQIDNO:2的氨基酸序列或其等位变体、或它们具有纤维素分解增强活性的片段。在一个优选的方面,所述多肽包含SEQIDN0:2的氨基酸序列。在另一个优选的方面,所述多肽包含SEQIDN0:2的成熟多肽。在另一个优选的方面,所述多肽包含SEQIDN0:2的氨基酸16-317或其等位变体、或它们具有纤维素分解增强活性的片段。在另一个优选的方面,所述多肽包含SEQIDN0:2的氨基酸16-317。在另一个优选的方面,所述多肽由SEQIDN0:2的氨基酸序列或其等位变体、或它们具有纤维素分解增强活性的片段组成。在另一个优选的方面,所述多肽由SEQIDN0:2的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQIDN0:2的成熟多肽组成。在另一个优选的方面,所述多肽由SEQIDNO:2的氨基酸16-317或其等位变体、或它们具有纤维素分解增强活性的片段组成。在另一个优选的方面,所述多肽由SEQIDN0:2的氨基酸16-317组成。在第二个方面,本发明涉及由包含如下所述的核苷酸序列或由这样的核苷酸序列组成的多核苷酸所编码的、具有纤维素分解增强活性的分离的多肽所述核苷酸序列在优选极低严紧度条件下,更优选低严紧度条件下,更优选中等极严紧度条件下,更优选中_高严紧度条件下,进一步更优选高严紧度条件下,最优选极高严紧度条件下与(i)SEQIDNO:l的成熟多肽编码序列,(ii)包含SEQIDN0:1的成熟多肽编码序列之基因组DNA序列,(iii)(i)或(ii)的子序列,或(iv)(i)、(ii)或(iii)的全长互补链杂交(J.Sambrook,E.F.Fritsch禾口T.Maniatis,1989,MolecularCloning,ALaboratoryMa皿al,第二片反,ColdSpringHarbor,NewYork)。SEQIDNO:1的成熟多肽编码序列的子序列含有至少100个连续的核苷酸,或者优选至少200个连续的核苷酸。而且,子序列可编码具有纤维素分解增强活性的多肽片段。在一个优选的方面,所述互补链是SEQIDNO:l的成熟多肽编码序列的全长互补链。可以利用SEQIDNO:1的核苷酸序列或其子序列以及SEQIDNO:2的氨基酸序列或其片段来设计核酸探针,根据本领域公知的方法从不同属或种的菌株中鉴定并克隆出编码具有纤维素分解增强活性的多肽的DNA。具体的,可以使用这样的探针,依照标准Southern印迹程序与感兴趣的属或种的基因组或cDNA进行杂交,来从其中鉴定和分离出相应的基因。这样的探针可以显著地短于整个序列,但其长度应当为至少14个、优选至少25个、更优选至少35个、最优选至少70个核苷酸。不过,优选的是核酸探针长度为至少100个核苷酸。例如,核酸探针长度可以为至少200个核苷酸、优选至少300个核苷酸、更优选至少400个核苷酸、或最优选至少500个核苷酸。可以用更长的探针,例如优选至少600个核苷酸、更优选至少700个核苷酸、进一步更优选至少800个核苷酸、或最优选至少900个核苷酸长的核酸探针。DNA和RNA探针都可以使用。通常将探针加以标记用于检测相应的基因(例如用32P、3H、35S、生物素和抗生物素蛋白(avidin)标记)。本发明涵盖这样的探针。因此,对于从这样的其他菌株制备的基因组DNA或者cDNA文库,可以从中筛选与上文描述的探针杂交且编码具有纤维素分解增强活性的多肽的DNA。来自这样的其他菌株的基因组或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术来加以分离。对于来自所述文库的DNA或者分离的DNA,可以将其转移并固定在硝酸纤维素或者其他合适的载体材料上。为了鉴定与SEQIDN0:1或其子序列同源的克隆或DNA,优选将所述载体材料用于Southern印迹中。为本发明的目的,"杂交"表示所述核苷酸序列在极低到极高严紧度条件与对应于下述序列的带标记的核酸探针杂交SEQIDNO:1的成熟多肽编码序列;包含SEQIDNO:1的成熟多肽编码序列之基因组DNA序列;其全长互补链;或它们的子序列。在这些条件下与所述核酸探针杂交的分子可以用例如x射线胶片来检测。在一个优选的方面,所述核酸探针是SEQIDN0:1的成熟多肽编码序列。在另一个优选的方面,所述核酸探针是SEQIDNO:1的核苷酸46-951。在另一个优选的方面,所述核酸探针是编码SEQIDN0:2的多肽的多核苷酸,或其子序列。在另一个优选的方面,所述核酸探针是SEQIDN0:1。在另一个优选的方面,所述核酸探针是大肠杆菌NRRLB-50044中所含的质粒pTter61F中包含的多核苷酸序列,其中其多核苷酸编码具有纤维素分解增强活性的多肽。在另一个优选的方面,所述核酸探针是大肠杆菌NRRLB-50044中所含的质粒pTter61F中包含的成熟多肽编码区。对于长度为至少100个核苷酸的长探针而言,极低到极高严紧度条件定义为42t:下在5XSSPE,0.3%SDS,200yg/ml变性剪切的鲑鱼精子DNA,及25%甲酰胺(对于极低和低严紧度)、35%甲酰胺(对于中等和中-高严紧度)、或50%甲酰胺(对于高和极高严紧度)的条件下,按照标准的Southern印迹程序以最优条件进行历时12-24小时的预杂交和杂交。对于长度为至少100个核苷酸的长探针而言,最后在优选45t:(极低严紧度)、更优选50°C(低严紧度)、更优选55°C(中等严紧度),更优选60°C(中-高严紧度)、进一步更优选65t:(高严紧度)、最优选7(TC(极高严紧度)下,用2XSSC、0.2%SDS将载体材料洗涤3次,每次15分钟。对于长度为约15个核苷酸到约70个核苷酸的短探针而言,严紧度条件定义为在比^吏用丰艮据Bolton禾口McCarthy(1962,ProceedingsoftheNationalAcademyofSciencesUSA48:1390)的计算方法算出的Tm低大约5。C到大约10°C的温度下,在0.9MNaCl、0.09MTris-HClpH7.6、6mMEDTA、0.5%NP-40、1XDenhardt氏溶液、lmM焦磷酸钠、lmM磷酸二氢钠、0.lmMATP和0.2mg/ml酵母RNA中,按照标准的Southern印迹程序以最优条件进行历时12-24小时的预杂交、杂交和杂交后洗涤。对于长度为约15个核苷酸到约70个核苷酸的短探针而言,在比算出的Tm低5°C到10°C的温度下,用6XSCC+0.1%SDS洗涤1次15分钟,再用6XSSC洗涤两次,每次15分钟。在第三个方面,本发明涉及由包含如下所述核苷酸序列或者由这样的核苷酸序列组成的多核苷酸所编码,且具有纤维素分解增强活性的分离的多肽所述核苷酸序列与SEQIDNO:1的成熟多肽编码序列具有优选至少60%,更优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、进一步更优选至少90%、最优选至少95%、进一步最优选96%、97%、98%或99%的同一性程度,且编码活性多肽。参见本文中"多核苷酸"部分。在第四个方面,本发明涉及包含SEQIDN0:2的成熟多肽中一个或多个(数个)氨基酸的取代、缺失和/或插入的人工变体;或其同源序列。优选地,氨基酸改变在性质上是不重要的,即为不会显著影响蛋白质的折叠和/或活性的保守氨基酸取代或者插入;小的缺失,通常为l个到大约30个氨基酸的缺失;小的氨基端或羧基端延伸,如一个氨基端的甲硫氨酸残基;最多约20-25个残基的小接头肽;或通过改变静电荷或其他功能来方便纯化的小延伸,如多聚组氨酸序列段、抗原性表位或结合结构域。保守取代的例子是下述各组之内进行的取代碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。一般不会改变特定活性的氨基酸取代是本领域已知的,并且在例如H.Neurath和R.L.Hill,1979于TheProteins,AcademicPress,NewYork—书中有描述。最常出现的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/11e、Leu/Val、Ala/Glu和Asp/Gly。除了20种标准的氨基酸之外,可以用非标准氨基酸(例如4-羟脯氨酸、6_^甲基赖氨酸、2-氨基异丁酸、异缬氨酸和a-甲基丝氨酸)来取代野生型多肽的氨基酸残基。可以用有限数目的非保守氨基酸、不由遗传密码编码的氨基酸、以及非天然氨基酸来取代氨基酸残基。"非天然氨基酸"系在蛋白质合成之后被修饰过,和/或在其侧链中具有与标准氨基酸不同的化学结构。非天然氨基酸可以是化学合成的,优选地是可商购的,包括哌啶酸&1。6(3011(^(^(1)、噻唑烷羧酸、脱氢脯氨酸、3-和4-甲基脯氨酸、和3,3-二甲基脯氨酸。或者,氨基酸改变具有这样的性质,以至于多肽的物理化学性质被改变。例如,氨基酸改变可改善多肽的热稳定性、改变底物特异性、改变最适PH,等等。可以根据本领域已知的程序,如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science244:1081-1085)来鉴定亲本多肽中的关键氨基酸。在上述后一种技术中,在分子中每个残基处引入单一的丙氨酸突变,然后测试所得的突变分子的生物学活性(即纤维素分解增强活性),来鉴定对该分子的活性有关键作用的氨基酸残基。另见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其他生物学相互作用也可以通过对结构的物理学分析来加以确定,如通过核磁共振、晶体学、电子衍射或光亲和标记等技术,与针对推定的接触部位氨基酸的突变相结合来加以确定。参见例如deVos等,1992,Science255:306-312;Smith等,1992'J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBSLett.309:59-64。也可以分析与本发明多肽之亲缘多肽的同一性,据此推测关键氨基酸的身份。可以使用已知的诱变、重组和/或改组方法来进行和测试单个或多个氨基酸的取代、缺失和/或插入,然后进行相关的筛选程序,例如Reidhaar-01son和Sauer,1988,Science241:53—57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152—2156;W095/17413;或W095/22625中公开的那些。其它可用的方法包括易错PCR、噬菌体展示(例如Lowman等,1991,Biochem.30:10832-10837;美国专利5,223,409;W092/06204)和区域定向诱变(Derbyshire等,1986,Gene46:145;Ner等,1988,DNA7:127)。诱变/改组方法可以与高通量自动化筛选方法结合起来用于检测宿主细胞表达的经克隆、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。对于编码活性多肽的诱变DNA,可以使用本领域中的标准方法从宿主细胞中加以回收并快速测序。这些方法使人们能够快速地确定感兴趣的多肽中个别氨基酸残基的重要性,而且可以用于结构未知的多肽。SEQIDNO:2的成熟多肽(如SEQIDNO:2的氨基酸19-317)的氨基酸取代、缺失和/或插入的总数为10个、优选9个、更优选8个、更优选7个、更优选至多6个、更优选5个、更优选4个、进一步更优选3个、最优选2个、进一步最优选1个。具有纤维素分解增强活性的多肽的来源具有纤维素分解增强活性的本发明的多肽可以从任何属的微生物获得。为本发明的目的,术语"从...获得"(或"获自...")在本文中与特定的来源联用时,意思应该是指由核苷酸序列编码的多肽是由所述来源产生的,或者是由插入了来自该来源的所述核苷酸序列的菌株产生的。在一个优选的方面,从特定来源获得的多肽是胞外分泌的。具有纤维素分解增强活性的本发明的多肽可以是细菌多肽。例如,该多肽可以是革兰氏阳性细菌多肽,诸如芽孢杆菌属(Bacillus)、链球菌属(Str印tococcus)、链霉菌属(Str印tomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Xactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(0ceanobacillus)的具有纤维素分解增强活性的多肽,或革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏球菌属(Neisseria)或尿枝原体属(Ure即lasma)的具有纤维素分解增强活性的多肽。在一个优选的方面,所述多肽是嗜碱芽孢杆菌(Bacillusalkalophilus)、解淀粉芽包杆菌(Bacillus咖yloliquefaciens)、短芽孢杆菌(Bacillusbrevis)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillusfirmus)、灿烂芽孢杆菌(Bacilluslautus)、缓慢芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillusmegateri咖)、短小芽孢杆菌(Bacillusp咖ilus)、嗜热月旨肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillussubtilis)或苏云金芽孢杆菌(Bacillusthuringiensis)的具有纤维素分解增强活性的多肽。15在另一个优选的方面,所述多肽是似马链球菌(Str印tococcusequisimilis)、酿脓链球菌(Streptococcuspyogenes)、乳房链球菌(Str印tococcusuberis)或马链球菌兽瘟亚种(Str印tococcusequisubsp.Zoo印idemicus)的具有纤维素分解增强活性的多肽。在另一个优选的方面,所述多肽是不产色链霉菌(Str印tomycesachromogenes)、除虫链霉菌(Str印tomycesavermitilis)、天蓝色链霉菌(Str印tomycescoelicolor)、灰色链霉菌(Str印tomycesgriseus)或浅青紫链霉菌(Str印tomyceslividans)的具有纤维素分解增强活性的多肽。具有纤维素分解增强活性的本发明的多肽还可以是真菌多肽,更优选酵母多肽,如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)的具有纤维素分解增强活性的多肽;或者更优选丝状真菌多肽,诸如枝顶孢霉属(Acremonium)、蘑燕属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛壳菌属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角属(Clavic印s)、旋孢腔菌属(Cochliobolus)、Coprinopsis、Coptotermes、棒囊壳属(Corynascus)、栗疫病菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、网孢菌属(Filibasidium)、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质毒属(Humicola)、孝巴菌属(Irpex)、香燕属(Lentinula)、小球腔菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、Melanocarpus、多孑L菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉包菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(PeniciIlium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、Trichophaea、轮枝抱属(Verticillium)、小包脚菇属(Volvariella)或炭角菌属(Xylaria)的具有纤维素分解增强活性的多肽。在一个优选的方面,所述多月太是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)的具有纤维素分角率增强活性的多肽。在另一个优选的方面,所述多肽是解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘抱曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、烟曲霉、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、嗜角质金抱子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、热带金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、Chrysosporiumpa皿icola、Chrysosporiumqueenslandicum、Chrysosporiumzonatum、杆抱状嫌抱(Fusariumbactridioides)、禾谷嫌抱(Fusariumcerealis)、库成嫌抱(Fusariumcrookwellense)、大刀嫌抱(Fusariumculmorum)、禾本禾斗嫌抱(Fusariumgraminearum)、禾赤嫌抱(Fusariumgrami皿m)、异抱嫌抱(Fusariumheterosporum)、合欢木嫌抱(Fusariumnegundi)、尖嫌抱(Fusariumoxysporum)、多枝嫌抱(Fusariumreticulatum)、粉红嫌抱(Fusariumroseum)、接骨木嫌抱(Fusariumsambuci皿m)、肤色嫌抱(Fusariumsarcochroum)、拟分枝包嫌包(Fusariumsporotrichioides)、硫色嫌抱(Fusariumsulphureum)、圆镰包(Fusariumtorulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusariumvenenatum)、灰色腐质酶(Humicolagrisea)、特异腐质霉、疏棉状腐质毒(Humicolalanuginosa)、乳白孝巴菌(Irpexlacteus)、米赫毛毒(Mucormiehei)、嗜热毁丝霉(Myceliophthorathe擺phila)、粗糙脉孢菌(Ne訓sporacrassa)、绳状青霉(Penicilliumf皿iculosum)、产紫青霉(Penicilliumpurpuroge皿m)、黄抱平革菌(Phanerochaetechrysosporium)、哈茨木霉(Trichodermaharzia皿m)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichodermaviride)的具有纤维素分解增强活性的多肽。在另一个优选的方面,所述多肽是无色梭孢壳(Thielaviaachromatica)、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭包壳(Thielaviaaustraleinsis)、Thielaviafimeti、小抱子梭抱壳(Thielaviamicrospora)、Thielaviaovispora、Thielaviaperuviana、Thielaviaspededonium、毛梭抱壳(Thielaviasetosa)、Thielaviasubthermophila或土生梭孢壳的具有纤维素分解增强活性的多肽。在一个更优选的方面,所述多肽是土生梭孢壳的具有纤维素分解增强活性的多肽。在一个最优选的实施方案中,所述多肽是土生梭孢壳NRRL8126的具有纤维素分解增强活性的多肽,例如包含SEQIDN0:2的氨基酸序列的多肽,或它的片段,例如成熟蛋白。应当理解的是,就前文所述的物种而言,本发明涵盖了它们的完全和不完全状态,以及其它分类学上的等同物,例如无性型,不管它们已知的种名是什么。本领域技术人员可以很容易地识别出合适的等同物的身份。公众可以在若干保藏机构容易地获取这些物种的菌株,这样的机构诸如美国典型培养物保藏中心(ATCC)、德意志微生物和细胞培养物保藏中心(DSM)、真菌菌种保藏中心(CBS)和北方区域研究中心农业研究机构专利培养物保藏中心(NRRL)。此外,还可以使用上文所述的探针,从包括从自然界(例如土壤、堆肥、水等等)分离的微生物在内的来源鉴定和获取这样的多肽。用于从天然生境分离微生物的技术是本领域中公知的。然后可以通过类似地筛选此类微生物的基因组文库或cDNA文库来获得所述多核苷酸。一旦用探针检测到了编码多肽的多核苷酸序列,就可以使用本领域普通技术人员公知的技术(参见例如Sambrook等,1989同上)分离或者克隆该多核苷酸。本发明的多肽还包括融合的多肽或者可切割的融合多肽,其中另一多肽融合在所述多肽或其片段的N-末端或C-末端。融合的多肽是通过将编码另一多肽的核苷酸序列(或其部分)融合到本发明的核苷酸序列(或其部分)而产生的。产生融合多肽的技术是本领域已知的,包括将编码各多肽的编码序列连接起来使它们符合阅读框,并使得被融合的多肽的表达处于相同的启动子和终止子的控制之下。融合多肽还可以包含切割位点。融合蛋白一旦被分泌,该位点就被切割,从融合蛋白中释放出具有纤维素分解增强活性的多肽。切割位点的实例包括但不限于Kex2位点,其编码二肽Lys-Arg(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381);Ile-(Glu或Asp)-Gly-Arg位点,其被因子Xa蛋白酶在精氨酸残基之后切割(Eaton等,1986,Biochem.25:505-512);Asp_Asp_Asp_Asp_Lys位点,其被肠激酶在赖氨酸之后切割(Collins-Racie等,1995,Biotechnology13:982-987);His-Tyr-Glu位点或His-Tyr-Asp位点,其被GenenaseI切割(Carter等,1989,Proteins-Structure,Function,andGenetics6:240-248);Leu_Val_Pro_Arg_Gly_Ser位点,其被凝血酶在Arg之后切割(Stevens,2003,DrugDiscoveryWorld4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点,其被TEV蛋白酶在Gin之后切割(Stevens,2003,同上);以及Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点,其被一种基因工程形式的人鼻病毒3C蛋白酶在Gln之后切割(Stevens,2003,同上)。多核苷酸本发明还涉及分离的多核苷酸,它们包含编码本发明具有纤维素分解增强活性的多肽的核苷酸序列或者由这样的核苷酸序列组成。在一个优选的方面,所述核苷酸序列包含SEQIDN0:1或者由其组成。在另一个更优选的方面,所述核苷酸序列包含大肠杆菌NRRLB-50044所含的质粒pTter61F中包含的序列,或者由该序列组成。在另一个优选的方面,所述核苷酸序列包含SEQIDN0:1的成熟多肽编码序列,或者由其组成。在另一个优选的方面,所述核苷酸序列包含SEQIDNO:l的氨基酸46-951,或者由其组成。在另一个更优选的方面,所述核苷酸序列包含大肠杆菌NRRLB-50044所含的质粒pTter61F中包含的成熟多肽编码序列,或者由该序列组成。本发明还涵盖编码这样的核苷酸序列,它们编码包含SEQIDN0:2的氨基酸序列或其成熟多肽或由SEQIDNO:2的氨基酸序列或其成熟多肽组成的多肽,并且与SEQIDNO:1或其成熟多肽编码序列存在基于遗传密码简并性的差异。本发明还涉及SEQIDNO:l的编码SEQIDNO:2的具有纤维素分解增强活性的片段的子序列。本发明还涉及突变的多核苷酸,其包含SEQIDNO:1的成熟多肽编码序列中至少一处突变或由其构成,其中突变的核苷酸序列编码SEQIDN0:2的成熟多肽。用于分离或克隆编码多肽的多核苷酸的技术是本领域已知的,包括从基因组DNA分离,从cDNA制备,或它们的组合。从这样的基因组DNA克隆本发明的多核苷酸可以例如这样实现通过使用公知的聚合酶链式反应(PCR)或对表达文库进行抗体筛选以检测具有共同的结构特征的克隆的DNA片段。参见例如Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸扩增程序诸如连接酶链式反应(LCR)、连接激活的转录(LAT)和基于核苷酸序列的扩增(NASBA)。多核苷酸可以从梭孢壳属的菌株或其它的或近缘的生物体分离,因此,例如,可以是所述核苷酸序列的多肽编码区域的等位变体或种变体(speciesvariant)。本发明还涉及包含下述核苷酸序列或由其组成的分离的多核苷酸,所述核苷酸序列与SEQIDN0:1的成熟多肽编码序列具有优选至少60%的同一性程度、更优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、进一步更优选至少90%、最优选至少95%、进一步最优选至少96%、至少97%、至少98%、或至少99%的同一性,并且编码活性多肽。为了合成与所述多肽基本上相似的多肽,可能需要对编码本发明的多肽的核苷酸序列进行修饰。术语与多肽"基本上相似"是指所述多肽的非天然存在的形式。这些多肽与分离自其天然来源的多肽可能存在一些经过工程化改造的差异,例如,在特异性活性、热稳定性、最适pH等方面有所不同的人工变体。变体序列可以基于作为SEQIDN0:1的成熟多肽编码序列呈示的核苷酸序列而构建,例如其子序列,和/或通过导入这样的核苷酸取代来构建此类核苷酸取代不会使该核苷酸序列编码的多肽具有其它氨基酸序列,而是对应于要用来产生酶的宿主生物体的密码子选择;或者可以通过引入可能产生不同的氨基酸序列的核苷酸取代来构建。核苷酸取代的一般说明可参见例如Ford等,1991,ProteinExpressionandPurification2:95_107。本领域技术人员将容易想到,可以在对于分子的功能有关键作用的区域之外进行这样的取代,而仍然产生活性的多肽。对于由本发明分离的多核苷酸编码的多肽的活性所必需的、因此优选不予以取代的氨基酸残基,可以根据本领域已知的程序,诸如定点诱变或丙氨酸分区诱变(参见例如C皿ningham和Wells,1989,同上),来加以鉴定。在后一种技术中,在分子中每一个带正电的残基处引入突变,并测试所得的突变分子的纤维素分解增强活性,从而鉴定出对该分子活性有关键作用的氨基酸残基。还可以通过对使用核磁共振分析、晶体学或光亲和标记等技术(参见例如deVos等,1992,同上文;Smith等,1992,同上文;Wlodaver等,1992,同上文)所确定三维结构的分析来确定底物_酶相互作用的位点。本发明还涉及如下所述的编码本发明多肽的分离的多核苷酸所述多核苷酸在如本文定义的极低严紧度条件下,优选低严紧度条件下,更优选中等严紧度条件下,更优选中_高严紧度条件下,进一步更优选高严紧度条件下,最优选极高严紧度条件下与(i)SEQIDN0:1的成熟多肽编码序列,(ii)包含SEQIDN0:1的成熟多肽编码序列之基因组DNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和子序列杂交(Sambrook等,1989,同上文)。在一个优选的方面,所述互补链是SEQIDN0:1的成熟多肽编码序列的全长互补链。本发明还涉及通过下述方式获得的分离的多核苷酸(a)使DNA群体在极低、低、中等、中-高、高、或极高严紧度条件下与(i)SEQIDN0:1的成熟多肽编码序列;(ii)包含SEQIDN0:1的成熟多肽编码序列之基因组DNA序列;或(iii)(i)或(ii)的全长互补链杂交,且(b)分离编码具有纤维素分解增强活性的多肽的杂交多核苷酸。在一个优选的方面,所述互补链是SEQIDN0:1的成熟多肽编码序列的全长互补链。核酸构建体本发明还涉及核酸构建体,其包含与一种或多种(数种)控制序列可操作连接的本发明的分离的多核苷酸,所述控制序列指导编码序列在合适的宿主细胞中在与这些控制序列相容的条件下表达。可以对编码本发明多肽的分离的多核苷酸进行多种方式的操作以便于表达所述多肽。取决于表达载体,在插入载体之前对多核苷酸的序列进行操作可能是理想的或者必要的。使用重组DNA方法修饰多核苷酸序列的技术是本领域公知的。控制序列可以是合适的启动子序列,启动子序列是被宿主细胞所识别来表达编码本发明多肽的多核苷酸的核苷酸序列。启动子序列含有介导多肽表达的转录控制序列。启动子序列可以是任何在所选择的宿主细胞中显示转录活性的核苷酸序列,包括突变的、截短的和杂合的启动子,而且可以从对宿主细胞而言为同源或异源的胞外或胞内多肽获得。适于指导本发明的核酸构建体的转录,尤其是在细菌宿主细胞中转录的启动子的例子是获自大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌a-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌a_淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、以及原核P_内酰胺酶基因的启动子(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731),禾口tac启动子(DeBoer等,1983,ProceedingsoftheNationalAcademyofSciencesUSA80:21-25)。ScientificAmerican,1980,242:74-94中〃Usefulproteinsfromrecombi薩tbacteria"禾口Sambrook等,1989(同上)中描述了其它启动子。适于在丝状真菌宿主细胞中指导本发明的核酸构建体的转录的启动子的实例是从下列酶的基因获得的启动子米曲霉TAKA淀粉酶、米赫根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶、黑曲霉中性a-淀粉酶、黑曲霉酸稳定性a-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(W000/56900)、镶片镰孢Daria(W000/56900)、镶片镰孢Quinn(W000/56900)、尖镰孢胰蛋白酶样蛋白酶(W096/00787)、里氏木霉P-葡糖苷酶、里氏木霉纤维二糖水解酶1、里氏木霉纤维二糖水解酶11、里氏木霉内切葡聚糖酶1、里氏木霉内切葡聚糖酶n、里氏木霉内切葡聚糖酶ni、里氏木霉内切葡聚糖酶iv、里氏木霉内切葡聚糖酶v、里氏木霉木聚糖酶i、里氏木霉木聚糖酶n、里氏木霉e-木糖苷酶;以及NA2-tpi启动子(来自黑曲霉中性a-淀粉酶基因和米曲霉磷酸丙糖异构酶基因的启动子的杂合体);以及它们的突变、截短和杂合的启动子。在酵母宿主中,有用的启动子是从酿酒酵母烯醇化酶(EN0-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶的基因获得的。对酵母宿主细胞有用的其他启动子在Romanos等,1992,Yeast8:423-488中有记载。控制序列还可以是合适的转录终止子序列。终止子序列是被宿主细胞识别来终止转录的序列。终止子序列可操作地连接于编码多肽的核苷酸序列的3'末端。任何可在所选的宿主细胞中发挥功能的终止子都可以用于本发明。优选的用于丝状真菌宿主细胞的终止子是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉a-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶的基因获得的。优选的用于酵母宿主细胞的终止子是从酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得的。对酵母宿主细胞有用的其他终止子在Romanos等,1992(同上)中有记载。控制序列也可以是合适的前导序列,前导序列是mRNA中的一种不被翻译的区域,它对于宿主细胞进行的翻译而言是重要的。前导序列可操作地连接于编码多肽的核苷酸序列的5'末端。任何可在所选择的宿主细胞中发挥功能的前导序列都可以用于本发明。优选的用于丝状真菌宿主细胞的前导序列是从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得的。用于酵母宿主细胞的前导序列是从酿酒酵母烯醇化酶(EN0-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母a_因子和酿酒酵母醇脱氢酶/甘油醛_3-磷酸脱氢酶(ADH2/GAP)的基因获得的。控制序列还可以是聚腺苷酸化序列,聚腺苷酸化序列是一段与核苷酸序列的3'末端可操作连接的序列,转录后被宿主细胞所识别,作为向被转录的mRNA添加聚腺苷酸残基的信号。任何可在所选择的宿主细胞中发挥功能的聚腺苷酸化序列都可以用于本发明。优选的用于丝状真菌宿主细胞的聚腺苷酸化序列是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉a-葡糖苷酶的基因获得的。Guo禾口Sherman,1995,MolecularCellularBiology15:5983-5990记载了在酵母宿主细胞中有用的聚腺苷酸化序列。控制序列还可以是信号肽编码序列,其编码的氨基酸序列连接于多肽的氨基末端,并引导被编码的多肽进入细胞的分泌途径。核苷酸序列的编码序列的5'端可以固有地包含信号肽编码序列,该序列天然地以符合翻译阅读框的方式连接于编码序列中编码分泌型多肽的区段。或者,编码序列的5'端可以包含对该编码序列而言为外源的信号肽编码序列。在编码序列天然地不包含信号肽编码序列的场合,可能需要外源信号肽编码序列。或者,可以简单地用外源信号肽编码序列取代天然信号肽编码序列以增强多肽的分泌。然而,引导被表达的多肽进入所选的宿主细胞的分泌途径,即分泌到培养基中的任何信号肽编码序列都可以用于本发明。对细菌宿主细胞有效的信号肽编码序列是从芽孢杆菌NCIB11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌a-淀粉酶、地衣芽孢杆菌枯草蛋白酶、地衣芽孢杆菌P_内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)、和枯草芽孢杆菌prsA的基因获得的信号肽编码序列。Simonen禾PPalva,1993,MicrobiologicalReviews57:109-137记载了其它信号肽。对丝状真菌宿主细胞有效的信号肽编码序列是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、和疏棉状腐质霉脂肪酶的基因获得的信号肽编码序列。对酵母宿主细胞有用的信号肽是从酿酒酵母a-因子和酿酒酵母转化酶获得的。其它有用的信号肽编码序列在Romanos等,1992,同上文中有记载。在一个优选的方面,信号肽包含SEQIDNO:2的氨基酸1_15或者由SEQIDNO:2的氨基酸1-15组成。在另一个优选的方面,信号肽编码序列包含SEQIDNO:1的核苷酸1-45或者由SEQIDNO:1的核苷酸1_45组成。控制序列还可以是前肽编码序列,其编码位于多肽的氨基末端的氨基酸序列。所得的多肽被称为酶原(proenzyme)或原多肽(propolyp印tide)(或者在某些情况下称为酶原(zymogen))。前肽通常是没有活性的,并且通过将前肽从原多肽中催化或自催化切割出来可以转化为成熟的活性多肽。前肽编码序列可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母a-因子、米赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶的基因获得(W095/33836)。在信号肽和前肽序列都存在于多肽氨基末端的场合,前肽序列位于多肽氨基末端的相邻位置,而信号肽序列位于前肽序列的氨基末端的相邻位置。添加这样的调控序列可能也是理想的该序列容许相对于宿主细胞的生长调节多肽的表达。调控系统的例子有导致基因的表达响应于化学或物理剌激(包括调控性化合物的存在)而开启或关闭的那些调控系统。原核系统中的调控系统包括lac、tac、和trp操纵基因系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKAa-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调控序列。其他调控序列的例子有使基因能够扩增的调控序列。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因,和在重金属存在下被扩增的金属硫蛋白基因。在这些场合,编码多肽的核苷酸序列将与调控序列可操作地连接。表达载体本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。可以将本文中描述的各种核酸和控制序列连接起来产生重组表达载体,后者可包括一个或多个(数个)便利的限制性位点以便于在这些位点上插入或替换编码多肽的核苷酸序列。或者,可以将核苷酸序列或包含该序列的核酸构建体插入合适的表达用载体来表达本发明的多核苷酸序列。在生成表达载体的过程中,将编码序列置于载体中使得该编码序列与合适的表达用控制序列可操作地连接。重组表达载体可以是任何可便利地进行重组DNA程序并且能够带来核苷酸序列的表达的载体(例如质粒或病毒)。载体的选择通常将取决于载体与该载体要导入的宿主细胞的相容性。载体可以是线性的或者闭合环状的质粒。所述载体可以是自主复制的载体,即作为染色体外实体存在,其复制不依赖于染色体复制的载体,例如质粒、染色体外元件、微型染色体、或人工染色体。载体可含有任何用于保证自我复制的工具。或者,载体可以是这样的载体,当它被导入宿主细胞时,整合到基因组中并随同它整合到其中的染色体一起复制。另外,可以使用单一的载体或质粒,或两个或更多个共同包含要导入宿主细胞基因组的总DNA的载体或质粒,或者转座子。本发明的载体优选含有一个或多个(数个)选择标记,这些标记容许容易地选择经过转化、转染、转导等的细胞。选择标记是这样的基因,其产物可提供杀生物剂或病毒抗性、对重金属的抗性,对营养缺陷型的原养性,等等。细菌选择标记的例子有来自枯草芽孢杆菌或者地衣芽孢杆菌的dal基因,或者赋予抗生素抗性如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。用于酵母宿主细胞的合适标记有ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5'-磷酸脱羧酶)、sC(硫酸腺苷转移酶),和trpC(邻氨基苯甲酸合酶),以及它们的等同物。优选用于曲霉细胞的是构巢曲霉或米曲霉的amdS和pyrG基因,以及吸水链霉菌(Str印tomyceshygroscopicus)的bar基因。本发明的载体优选包含容许载体整合到宿主细胞的基因组或者容许载体在细胞中不依赖基因组自主复制的元件。为了整合到宿主细胞基因组中,载体可能依赖多核苷酸的编码多肽的序列或者载体的任何其它元件来通过同源或异源重组整合到基因组中。或者,载体可含有附加的核苷酸序列,用来指导通过同源重组在染色体上的精确位置整合到宿主细胞的基因组中。为了增加在精确位置上整合的机率,整合元件优选应含有足够数目的与相应靶序列具有高度同一性的核酸,诸如100-10,000个碱基对,优选400-10,000个碱基对,最优选800-10,000个碱基对,以提高同源重组的概率。整合元件可以是任何与宿主细胞基因组中的靶序列同源的序列。此外,整合元件可以是非编码的或者编码的核苷酸序列。此外,载体可以通过非同源重组整合到宿主细胞基因组中。为了自主复制,载体可进一步包含复制起点,该起点使得载体能够在所讨论的宿主细胞中自主地复制。复制起点可以是在细胞中发挥功能的任何介导自主复制的质粒复制子。术语"复制起点"或"质粒复制子"在本文中定义为使质粒或载体能够在体内复制的核苷酸序列。细菌复制起点的实例有容许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,以及容许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMP1的复制起点。用于在酵母宿主细胞中的复制起点的例子有2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合,以及ARS4和CEN6的组合。在丝状真菌细胞中有用的复制起点的例子有AMA1和ANSI(Gems等,1991,Gene98:61-67;Cullen等,1987,NucleicAcidsResearch15:9163-9175;W000/24883)。AMA1基因的分离,以及包含该基因的质粒或载体的构建,可以根据WO00/24883中公开的方法来实现。可以向宿主细胞中插入本发明多核苷酸的多于一个拷贝以增加基因产物的生产。可以通过下述方法获得多核苷酸的拷贝数的增加向宿主细胞基因组中插入至少一个额外拷贝的序列;或者纳入伴随该多核苷酸的可扩增选择标记基因,由此通过在合适的选择剂的存在下培养细胞,可以选择出含有扩增拷贝数的选择标记基因,从而也就含有更多拷贝的所述多核苷酸的细胞。用于连接上述元件来构建本发明的重组表达载体的程序是本领域技术人员公知的(参见例如Sambrook等,1989,同上文)。宿主细胞本发明还涉及重组宿主细胞,它们包含本发明的分离的多核苷酸,有利地用于多肽的重组生产中。将包含本发明多核苷酸的载体导入宿主细胞使得载体作为染色体整合子或者如前文所述的自复制的染色体外载体被保持。术语"宿主细胞"涵盖亲本细胞的任何因复制过程中的突变而与亲本细胞不同的后代。宿主细胞的选择在很大程度上将取决于编码多肽的基因及其来源。宿主细胞可以是任何在本发明的多肽的重组生产中有用的细胞,例如原核生物或真核生物。原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属和海洋芽孢杆菌属。革兰氏阴性细菌包括但不限于大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏球菌属或尿枝原体属。细菌宿主细胞可以是任何芽孢杆菌属细胞。本发明的实践中可以使用的芽孢杆菌属细胞包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、缓慢芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。在一个优选的方面,所述细菌宿主细胞是解淀粉芽孢杆菌、缓慢芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在一个更优选的方面,所述细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,所述细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,所述细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,所述细菌宿主细胞是枯草芽孢杆菌细胞。细菌宿主细胞也可以是任何链球菌属细胞。本发明的实践中可以使用的链球菌属细胞包括但不限于似马链球菌、酿脓链球菌、乳房链球菌、和马链球菌兽瘟亚种细胞。在一个优选的方面,所述细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,所述细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,所述细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,所述细菌宿主细胞是马链球菌兽瘟亚种细胞。细菌宿主细胞也可以是任何链霉菌属细胞。本发明的实践中可以使用的链霉菌属细胞包括但不限于不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌和浅青紫链霉菌细胞。在一个优选的方面,所述细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是除虫链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是天蓝色链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,所述细菌宿主细胞是浅青紫链霉菌细胞。向芽孢杆菌属细胞中导入DNA可以通过例如原生质体转化(参见例如Chang和Cohen,1979,MolecularGeneralGenetics168:111-115)、使用感受态细胞(参见例如Young禾口Spizizen,1961,JournalofBacteriology81:823—829,或Dubnau禾口Davidoff-Abelson,1971,JournalofMolecularBiology56:209-221)、通过电穿孑L(参见例如Shigekawa禾口Dower,1988,Biotechniques6:742—751),或通过接合(参见例如Koehler禾PThorne,1987JournalofBacteriology169:5271—5278)来实现。向大肠杆菌细胞中导入DNA可以通过例如原生质体转化(参见例如Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见例如Dower等,1988,NucleicAcidsRes.16:6127-6145)来实现。向链霉菌属细胞中导入DNA可以通过例如原生质体转化和电穿孔来实现(参见例如Gong等,2004,FoliaMicrobiol.(Praha)49:399-405)、接合(参见例如Mazodier等,1989,J.Bacteriol.171:3583-3585)、或转导(参见例如Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)来实现。向假单胞菌属细胞中导入DNA可以通过例如电穿孔(参见例如Choi等,2006,J.Microbiol.Methods64:391-397)、或接合(参见例如Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)来实现。向链球菌属细胞中导入DNA可以通24过例如天然感受态(参见例如Perry和Kuramitsu,1981,Infect.Immun.32:1295—1297)、原生质体转化(参见例如Catt和Jollick,1991,Microbios.68:189-2070)、电穿孔(参见例如Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)、或接合(参见例如Clewell,1981,Microbiol.Rev.45:409-436)来实现。尽管如此,本领域已知的任何用于将DNA导入宿主细胞的方法都可以使用。宿主细胞也可以是真核生物,诸如哺乳动物、昆虫、植物、或真菌细胞。在一个优选的方面,所述宿主细胞是真菌细胞。本文所用的"真菌"包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)禾口接合菌门(Zygomycota)(如Hawksworth等在AinsworthandBisby'sDictionaryofTheF皿gi,第八版,1995,CABInternational,UniversityPress,Cambridge,UK中定义的),禾口卵菌门(Oomycota)(如Hawksworth等,1995,同上文,第171页引用的)等门,以及全部有丝分裂包子真菌(mitosporicfungi)(Hawksworth等,1995,同上文)。在一个更优选的方面,真菌宿主细胞是酵母细胞。本文所用的"酵母"包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子孢子囊酵母(basidiosporogenousyeast)禾口属于半知菌类(FungiImperfecti)(芽包纟冈(Blastomycetes))的酵母。由于酵母的分类在将来可能有所改变,为了本发明的目的,酵母将如BiologyandActivitiesofYeast(Ski皿er,F.A.,Passmore,S.M.禾口Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述加以定义。在一个进一步更优选的方面,酵母宿主细胞是假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。在一个最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳克鲁维酵母(Kluyveromyceslactis)细胞。在另一个最优选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowialipolytica)细胞。在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。"丝状真菌"包括真菌(Eumycota)和卵菌(Oomycota)亚门的所有丝状形式(如Hawksworth等,1995,同上文定义)。丝状真菌的一般特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其它复杂多糖组成的菌丝壁。营养生长是通过菌丝延伸,且碳分解代谢是专性需氧的。相反,酵母如酿酒酵母的营养生长是通过单细胞菌体的芽殖,且碳分解代谢可以是发酵的。在一个进一步更优选的方面,丝状真菌宿主细胞枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子属、鬼伞属(Copri皿s)、革盖菌属(Coriolus)、隐球菌属、网孢菌属、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)、或木霉属细胞。在一个更优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个更优选的方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)、干拟錯菌(Ceriporiopsisaneirina)、干拟錯菌(Ceriporiopsisaneirina)、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispa皿ocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、虫拟錯菌(Ceriporiopsissubvermispora)、嗜角质金抱子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、热带金抱子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、Chrysosporiumpa皿icola、Chrysosporiumqueenslandicum、Chrysosporiumzonatum、灰盖鬼伞(Copri皿scinereus)、毛革盖菌(Coriolushirsutus)、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebiaradiata)、剌芹侧耳(Pleurotuseryngii)、土生梭孢壳、长绒毛栓菌(Trametesvillosa)、杂色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。真菌细胞可以用包括方式本身已知的原生质体形成、原生质体转化和细胞壁再生的方法来加以转化。用于曲霉属和木霉属宿主细胞转化的合适方法描述于EP238023禾口Yelton等,1984,ProceedingsoftheNational.AcademyofSciencesUSA81:1470-1474。Malardier等,1989,Gene78:147-156和WO96/00787描述了转化镰孢属的种的合适方法。酵母可用Becker和Guarente在Abelson,J.N.和Simon,M.I.编的GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,第194巻,第182-187页,AcademicPress,NewYork;Ito等,1983,JournalofBacteriology153:163;禾口Hi騰n等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:1920中所述的方法转化。生产方法本发明还涉及生产本发明的多肽的方法,所述方法包括(a)在有助于产生所述多肽的条件下培养细胞,所述细胞以野生型形式可产生所述多肽;和(b)回收该多肽。在一个优选的方面,所述细胞属于梭孢壳属。在一个更优选的方面,所述细胞是土生梭孢壳。在一个更优选的方面,所述细胞是土生梭孢壳NRRL8126。本发明还涉及生产本发明的多肽的方法,所述方法包括(a)在有助于产生所述多肽的条件下培养如本文所述的重组宿主细胞,和(b)回收所述多肽。本发明还涉及生产本发明的多肽的方法,所述方法包括(a)在有助于产生所述多肽的条件下培养如本文所述的重组宿主细胞,其中该宿主细胞包含在SEQIDNO:l的成熟多肽编码序列中具有至少1个突变的突变核苷酸序列,其中所述突变的核苷酸序列编码包含SEQIDNO:2的成熟多肽或由其组成的多肽;和(b)回收所述多肽。在本发明的生产方法中,用本领域中公知的方法在适于多肽产生的营养培养基中培养细胞。例如,可在实验室或工业发酵罐中通过摇瓶培养、和小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)培养细胞,这在合适的培养基中和使多肽能被表达和/或分离的条件下进行。用本领域中已知的程序,在含有碳源和氮源和无机盐的合适营养培养基中进行培养。合适的培养基可从商业供应商得到或根据公开的组成(例如,于美国典型培养物保藏中心的目录中)制备。如果多肽分泌到营养培养基中,则可直接从培养基中回收该多肽。如果该多肽不被分泌,则可从细胞裂解产物中回收它。可使用本领域中已知的、对所述多肽为特异性的方法检测所述多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可如本文所述地使用酶测定法确定多肽的活性。可以使用本领域已知的方法回收得到的多肽。例如,可以通过常规方法,包括,但不限于,离心、过滤、抽提、喷雾干燥、蒸发或沉淀将多肽从营养培养基中回收出来。本发明的多肽可通过本领域中已知的多种方法进行纯化,所述方法包括,但不限于,层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度法(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(见,例如,ProteinPurificationJ._C.Janson禾口LarsRyden编,VCHPublishers,NewYork,1989),来获得基本上纯的多肽。植物本发明还涉及包含编码本发明具有纤维素分解增强活性的多肽的分离的多核苷酸而以可回收量表达和产生所述多肽的植物,例如转基因植物、植株部分、或植物细胞。所述多肽可从植物或植株部分回收。或者,可以将含有重组多肽的植物或植株部分直接用于改善食物或饲料的质量,例如提高营养价值、可口性、和流变性,或破坏抗营养因子。转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例有禾草(grasses),例如草地草(蓝草,早熟禾属(Poa));草料草,诸如羊矛属(Festuca)、黑麦草属(Lolium);温带草(temperategrass),例如剪股颖属(Agrostis);和谷类(cereals),例如小麦、燕麦、黑麦、大麦、水稻、高粱、和玉蜀黍(玉米)。双子叶植物的实例有烟草、豆科作物诸如羽扇豆、马铃薯、甜菜、豌豆、菜豆、和大豆,和十字花科植物(十字花科(Brassicaceae)),诸如花椰菜、油菜籽(rapeseed)、和十分近缘的模式生物体拟南芥(Arabidopsisthaliana)。植株部分的实例有茎、愈伤组织、叶、根、果实、种子、和块茎,以及构成这些部分的单独组织,例如表皮、叶肉、薄壁组织、脉管组织、分生组织。特殊的植物细胞小室,诸如叶绿体、质外体、线粒体、液泡、过氧化物酶体、和细胞质也认为是植株部分。此外,任何植物细胞,无论组织来源如何,也认为是植株部分。类似的,植株部分,诸如有利于本发明应用而分离的特定组织和细胞也认为是植株部分,例如胚、胚乳、糊粉、和种皮。这些植物、植株部分、和植物细胞的后代也包括在本发明范围之内。表达本发明多肽的转基因植物或植物细胞的构建可根据本领域已知的方法进行。简而言之,植物或植物细胞的构建可通过将一种或多种(数种)编码本发明多肽的表达构建体掺入植物宿主基因组或叶绿体基因组中并将所得的经修饰植物或植物细胞繁殖成转基因植物或植物细胞来进行。表达构建体便利地是核酸构建体,它含有编码本发明多肽的多核苷酸且该多核苷酸与所选定的植物或植株部分中表达此核苷酸序列所需的适当调控序列可操作地连接。而且,表达构建体可包含用于鉴定整合了该表达构建体的宿主细胞的选择标记,和将此构建体导入所讨论的植物所需要的DNA序列(后者取决于所用的DNA导入方法)。例如,根据希望在何时、在何处、和怎样表达多肽来决定调控序列的选择,所述调控序列诸如启动子和终止子序列和任选的信号或转运序列。例如,编码本发明多肽的基因的表达可以是组成性的或可诱导的,或者是发育、阶段、或组织特异性的,基因产物可以靶27向特定组织或植株部分诸如种子或叶。调控序列在例如Tague等,1988,PlantPhysiology86:506有描述。对于组成性表达,可使用35S-CaMV、玉蜀黍遍在蛋白1、和稻肌动白l启动子(Franck等,1980,Cell21:285-294;Christensen等,1992,PlantMol.Biol.18:675-689;Zhang等,1991,PlantCell3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesinktissues)诸如种子、马铃薯i央茎、和果实(Edwards和Coruzzi,1990,AnnRevGenet24:275-303),或来自于代谢库(metabolicsinktissues)组织诸如分生组织(Ito等,1994,PlantMolBiol24:863-878),种子特异性启动子诸如来自稻的谷蛋白、醇溶谷蛋白(prolamin)、球蛋白、或清蛋白启动子(Wu等,1998,PlantandCellPhysiology39:885-889),来自蚕豆(Viciafaba)豆球蛋白B4和未知种子蛋白基因的蚕豆启动子(Conrad等,1998,JournalofPlantPhysiology152:708-711),来自种子油体(seedoilbody)蛋白的启动子(Chen等,1998,PlantandCellPhysiology39:935-941),来自欧洲油菜(Brassican即us)的贮藏蛋白n即A启动子,或者本领域已知的任何其它种子特异启动子,例如W091/14772中所述。此外,启动子可以是叶特异性启动子,诸如来自水稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiology102:991-1000),小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra和Higgins,1994,PlantMolecularBiology26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,MolecularandGeneralGenetics248:668-674),或者伤口诱导性启动子诸如马铃薯pin2启动子(Xu等,1993,PlantMolecularBiology22:573-588)。同样,启动子可通过非生物处理例如温度、干旱、或盐度变化来诱导,或通过外源施加能激活启动子的物质,例如乙醇、雌激素、植物激素诸如乙烯、脱落酸和赤霉酸以及重金属来诱导。还可使用启动子增强子元件以在植物中获得本发明多肽的更高表达。例如,启动子增强子元件可以是位于启动子和编码本发明多肽的核苷酸序列之间的内含子。例如Xu等,1993,同上中公开了利用水稻肌动蛋白1基因的第一个内含子来增强表达。选择标记基因和表达构建体的任何其它部分可选自本领域中可利用的那些。根据本领域已知的常规技术将核酸构建体掺入植物基因组中,包括土壤杆菌(Agrobacterium)介导的转化、病毒介导的转化、显微注射、粒子轰击、生物射弹转化(biolistictransformation)、禾口电穿孑L(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,1989,Nature338:274)。目前,根瘤土壤杆菌(Agrobacteriumt咖efaciens)介导的基因转移是用于产生转基因双子叶植物的首选方法(其综述可参见Hooykas和Schilperoort,1992,PlantMolecularBiology19:15_38),而且也可用于转化单子叶植物,尽管这些植物常使用其它转化方法。目前,选择用于产生转基因单子叶植物的方法是粒子轰击(以转化用DNA包被的金或钨微粒)胚的愈伤组织或发育中的胚(Christou,1992,PlantJournal2:275-281;Shimamoto,1994,CurrentOpinionBiotechnology5:158-162;Vasil等,1992,Bio/Technology10:667-674)。一种备选的单子叶植物转化方法是基于原生质体转化来进行,如0mirulleh等,1993,PlantMolecularBiology21:415-428中所描述的。在转化后,根据本领域熟知的方法选出已掺入了表达构建体的转化体,并使其再生成为完整植株。通常转化程序设计成在再生期间或在后代中选择性清除选择基因,例如28通过两种单独T-DNA构建体的共转化或通过特异重组酶进行的选择基因的位点特异切除来进行。本发明还涉及产生本发明的多肽的方法,所述方法包括(a)在有利于产生所述多肽的条件下,培养转基因植物或植物细胞,所述植物或植物细胞包含编码具有纤维素分解增强活性的本发明的多肽的多核苷酸;和(b)回收所述多肽。纤维素分解增强活性的去除或降低本发明还涉及产生亲本细胞的突变体的方法,所述方法包括破坏或缺失编码本发明的多肽的多核苷酸序列或其部分,结果生成当在同样条件下培养时较该亲本细胞产生较少的所述多肽的突变体细胞。突变体细胞可以通过使用本领域公知的方法,例如插入、破坏、替换或缺失,降低或消除编码本发明多肽的核苷酸序列的表达,来加以构建。在一个优选的方面,所述核苷酸序列是失活的。要加以修饰或失活的核苷酸序列可以是,例如,编码区或者编码区中对活而言必需的部分,或者编码区表达所需的调控元件。此类调控或控制序列的例子可以是启动子序列或其功能部分,即足以影响核苷酸序列表达的部分。其他用于可能的修饰的控制序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录活化子。核苷酸序列的修饰或失活可以通过对亲本细胞进行诱变并选择该核苷酸序列的表达已降低或消除的突变细胞来进行。诱变可以是特异性的或者是随机性的,可以使用例如合适的物理或化学诱变剂、使用合适的寡核苷酸、或者通过使DNA序列经受PCR生成的诱变来实施。此外,可以使用这些诱变剂的任何组合来实施诱变。适于本目的的物理或化学诱变剂的例子包括紫外(UV)照射、羟胺、N-甲基-N'-硝基-N-亚硝基胍(MNNG)、0-甲基羟胺、亚硝酸、甲基磺酸乙酯(EMS)、亚硫酸氢钠、甲酸、以及核苷酸类似物。当使用此类作用剂时,诱变通常如下进行将要诱变的亲本细胞在所选择的诱变剂存在下在合适的条件下温育,并筛选和/或选择展现所述基因的表达降低或无表达的突变细胞。核苷酸序列的修饰或失活可通过在基因中或在其转录或翻译所需要的调控元件中引入、替换、或去除一个或多个(数个)核苷酸来进行。例如,可插入或去除核苷酸从而导致终止密码子的引入、起始密码子的去除、或可读框的改变。这些修饰或灭活可根据本领域已知的方法通过定点诱变或PCR产生诱变来完成。虽然,原则上,修饰可在体内进行,即直接在表达要修饰的核苷酸序列的细胞上进行,优选的是如下文例示的那样在体外进行修饰。便利的消除或降低细胞核苷酸序列表达的方法的一个实例是基于基因替换、基因缺失、或基因破坏技术。例如,在基因破坏方法中,将对应于内源核苷酸序列的核酸序列在体外进行诱变以产生缺陷的核酸序列,然后将其转化到亲本细胞中以产生缺陷基因。通过同源重组,缺陷的核酸序列替换内源核苷酸序列。可能理想的是,缺陷的核苷酸序列还编码可用于选择核苷酸序列已经被修饰或破坏了的转化体的标记。在一个特别优选的方面,利用选择标记,诸如用本文所述的那些,来破坏核苷酸序列。或者,核苷酸序列的修饰或失活可通过已建立的反义或RNAi技术使用与核苷酸29序列互补的序列来进行。更具体的说,细胞核苷酸序列的表达可通过引入与基因核苷酸序列互补的序列来降低或消除,其中该引入的序列可在细胞中转录并能与细胞中所产生的mRNA发生杂交。在允许互补的反义核苷酸序列与mRNA发生杂交的条件下,所翻译蛋白质的量由此被降低或消除。本发明还涉及在编码所述多肽的核苷酸序列或其控制序列中包含破坏或缺失的亲本细胞的突变细胞,这导致该突变细胞与亲本细胞相比产生的所述多肽较少或不产生多肽。这样构建的多肽缺陷的突变细胞作为宿主细胞用于天然和/或异源多肽的表达特别有用。因此,本发明还涉及生产天然或异源多肽的方法,所述方法包括(a)在有助于产生多肽的条件下培养突变细胞;并(b)回收所述多肽。术语"异源多肽"在本文中定义为对宿主细胞来说不是天然的多肽,经过修饰改变了天然序列的天然蛋白质,或是经过重组DNA技术对宿主细胞的处理从而使其表达发生了量变的天然蛋白质。在另一个方面,本发明涉及通过发酵生成本发明多肽和感兴趣的蛋白质产物二者的细胞来生产基本上没有纤维素分解增强活性的蛋白质产物的方法,其中在发酵完成之前、当中、或之后往发酵液中加入有效量的可抑制纤维素分解增强活性的试剂,并从发酵液中回收目的产物,以及任选地对回收产物进行进一步纯化。在另一个方面,本发明涉及通过下列步骤来生产基本上没有纤维素分解增强活性的蛋白质产物的方法,在允许产物表达的条件下培养细胞,并对所得培养液进行PH和温度联合处理以便显著地降低纤维素分解增强活性,并从培养液中回收产物。或者,pH和温度联合处理可对从培养液中回收的酶制备物进行。任选地,pH和温度联合处理增强可与纤维素分解增强抑制剂处理结合使用。根据本发明的这个方面,可能消除至少60%、优选至少75%、更优选至少85%、仍更优选至少95%、且最优选至少99%的纤维素分解增强活性。通过使用这种方法可实现纤维素分解增强活性的完全消除。优选地,在pH为2-4或9-11和至少60-7(TC的温度范围内进行足够时间的pH和温度联合处理以达到预期的效果,其中30-60分钟通常是足够的。可使用本领域已知的方法进行培养和目的产物的纯化。本发明的产生基本上没有纤维素分解增强性的产物的方法在真核多肽,尤其是真菌蛋白质例如酶的生产中特别令人感兴趣。所述酶可以选自,例如,淀粉分解酶、脂肪分解酶、蛋白水解酶、纤维素分解酶、氧化还原酶、或植物细胞壁降解酶。此类酶的例子包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、半乳糖苷酶、P_半乳糖苷酶、葡糖淀粉酶、葡萄糖氧化酶、葡糖苷酶、卣素过氧化物酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶、或木聚糖酶。纤维素分解增强性缺陷的细胞也可以用来表达有药用意义的异源蛋白质如激素、生长因子、和受体等。应当理解,术语"真核多肽"不但包括天然多肽,还包括通过氨基酸取代、缺失或添加或其他这类修饰形式进行了修饰而提高活性、热稳定性、pH耐受性等的多肽,例如酶。30在一个进一步的方面,本发明涉及一种基本上没有纤维素分解增强活性的蛋白质产物,其是通过本发明的方法产生的。抑制多肽表达的方法本发明还涉及抑制细胞中多肽表达的方法,所述方法包括对细胞施用或者在细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含本发明的多核苷酸的子序列。在一个优选的方面,所述dsRNA的长度为大约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。所述dsRNA优选是小干扰RNA(siRNA)或微RNA(miRNA)。在一个优选的方面,所述dsRNA是用于抑制转录的小干扰RNA(siRNA)。在另一个优选的方面,所述dsRNA是用于抑制转录的微RNA(miRNA)。本发明还涉及这样的双链RNA(dsRNA)分子,它们包含SEQIDNO:1的成熟多肽编码序列的一部分,用于在细胞中抑制多肽表达。虽然本发明不限于任何具体的作用机制,dsRNA可以进入细胞并导致具有相似或相同序列的包括内源mRNA在内的单链RNA(ssRNA)的降解。当细胞被暴露于dsRNA时,来自同源基因的mRNA通过一种称为RNA干扰(RNAi)的过程被选择性地降解。本发明的dsRNA可以用于基因沉默性治疗(gene-silencingther即eutics)。在一个方面,本发明提供使用本发明的dsRNA来选择性降解RNA的方法。该方法可以在体外、离体或体内实施。在一个方面,dsRNA分子可用来在细胞、器官或动物中生成功能丧失突变。制备和使用dsRNA用于选择性降解RNA的方法是本领域中公知的,参见例如美国专利6,506,559、美国专利6,511,824、美国专利6,515,109、和美国专利6,489,127。组合物本发明还涉及包含本发明多肽的组合物。优选的是,组合物是富集了这类多肽的。术语"富集"是指组合物的纤维素分解增强活性已经被增加,例如以至少1.1的富集因子增加。所述组合物可包含本发明的多肽作为主要组分,例如单一组分组合物。或者,组合物还可含有多种酶活性,诸如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酷酶、a_半乳糖苷酶、13-半乳糖苷酶、葡糖淀粉酶、a-葡糖苷酶、|3-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。在一个优选的方面,所述组合物包含一种或多种如本文所述的纤维素分解酶和本发明的多肽。通过例如下列微生物可产生其它酶,例如属于曲霉属的微生物,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、或镶片镰孢;腐质霉属,优选特异腐质酶或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉。可根据本领域已知的方法来制备多肽组合物,并且它可以是液体或干燥组合物的形式。例如,多肽组合物可以是颗粒或微粒的形式。可以根据本领域已知的方法对要包含在组合物中的多肽加以稳定化。下文给出了本发明多肽组合物的优选用途的实例。本发明多肽组合物的剂量和使用组合物的其它条件可根据本领域已知的方法来确定。含纤维素材料的加工方法本发明还涉及降解或转化含纤维素材料的方法,所述方法包括在有效量的本发明的具有纤维素分解增强活性的多肽存在下,用有效量的纤维素分解酶组合物处理含纤维素材料,其中与不存在具有纤维素分解增强活性的多肽时相比,具有纤维素分解增强活性的多肽的存在增加所述含纤维素材料的降解。本发明还涉及用于产生发酵产物的方法,所述方法包括(a)在有效量的本发明的具有纤维素分解增强活性的多肽存在下,用有效量的纤维素分解酶组合物糖化含纤维素材料,其中与没有所述具有纤维素分解增强活性的多肽存在时相比,所述具有纤维素分解增强活性的多肽的存在增加所述含纤维素材料的降解;(b)用一种或多种发酵微生物发酵步骤(a)的经糖化的含纤维素材料以产生发酵产物;和(c)从发酵中回收发酵产物。本发明的方法可以用来将含纤维素材料例如木素纤维素水解(糖化)成可发酵糖,并将可发酵糖转化为许多有用的物质例如化学品和燃料。从含纤维素材料生产期望的发酵产品通常涉及预处理、酶促水解(糖化)和发酵。本发明的含纤维素材料的加工可以使用本领域已知的方法来完成。此外,本发明的方法可以使用任何为了依照本发明运行而配置的生物质加工装置来实现。单独或同时进行的水解(糖化)和发酵包括,但不限于单独水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(hybridhydrolysisandfermentation,HHF)、SHCF(单独水解和共发酵)、HHCF(混合水解和发酵)、及直接微生物转化(匿C)。本文中应当理解,本领域中任何包括预处理、酶促水解(糖化)、发酵或它们的组合的方法都可用于实施本发明的方法。常规装置可以包括补料分批搅拌反应器、分批搅拌反应器、带超滤的连续流动搅拌反应器、和/或连续活塞流动柱反应器(FernandadeCastilhosCorazza,Fl6vioFariadeMoraes,GisellaMariaZanin禾口IvoNeitzel,2003,Optimalcontrolinfed—batchreactorforthecellobiosehydrolysis,ActaScientiarum.Technology25:33_38;Gusakov,A.V.禾口Sinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose:1.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7:346-352)、碾磨反应器(Ryu,S.K.禾PLee,J.M.,1983,Bioco読rsionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.25:53-65)、或具有电磁场诱发的强烈搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,0.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,A卯l.Biochem.Biotechnol.56:141-153)。其它反应器类型包括,例如,用于水解和/或发酵的流化床型、厌氧污泥床(upflowblanket)型、固定化型、以及挤出机型反应器。预处理.在本发明的方法的实施中,本领域已知的任何预处理方法都可以用来破坏含纤维素材料的植物细胞壁组分。在预处理之前还可以使用本领域已知的方法对含纤维素材料进行预浸泡、润湿、或调制(conditioning)。常规的预处理包括但不限于蒸汽预处理(有或没有爆破)、稀酸预处理、热水预处理、石灰预处理、湿氧化、湿爆破、氨纤维爆石皮(ammoniafiberexplosion)、有机溶剂予页处理(organosolvpretreatment)、和生物预处理。其它预处理包括超声、电穿孔、微波、超临界0)2、超临界1120、和氨渗滤(ammoni即ercolation)。可以在水解和/或发酵之前预处理含纤维素材料。预处理优选在水解之前进行。或者,预处理可以和水解同时进行,诸如在用一种或多种纤维素分解酶或其它酶活性处理含纤维素材料以释放可发酵糖如葡萄糖和/或麦芽糖的同时进行预处理。在大多数情况下预处理步骤本身会导致一些生物质转化成可发酵糖(即使没有酶存在)。蒸汽预处理.在蒸汽预处理中,将含纤维素材料加热以破坏植物细胞壁组分,包括木质素、半纤维素、和纤维素,以使得纤维素和其它部分如半纤维素(hemicellulase)暴露于酶。使纤维素材料通至或通过反应容器,在那里喷射蒸汽以升温到需要的温度和压力,并在其中保持需要的反应时间。蒸汽预处理优选在140-23(TC、更优选160-20(TC、最优选170-19(TC进行,其中最优的温度范围取决于化学催化剂的添加。蒸汽预处理的停留时间优选1-15分钟、更优选3-12分钟、最优选4-10分钟,其中最优的停留时间取决于温度范围和化学催化剂的添加。蒸汽预处理容许相对较高的固形物载量,使得含纤维素材料在预处理过程中一般仅是轻微潮湿的。蒸汽预处理通常与预处理后对材料的爆破性出料(explosivedischarge)相结合,后者被称为蒸汽爆破(steamexplosion),即将材料急速瞬时置于大气压和湍流下,以通过碎裂作用增加暴露的表面积(Duff和Murray,1996,BioresourceTechnology855:1-33;Galbe禾卩Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美国专利申请20020164730)。在蒸汽预处理之前往往添加催化剂如H2S04或S02(典型地为0.3_3%w/w),催化剂可减少时间和温度,增加收率,以及改善酶促水解(Ballesteros等,2006,A卯l.Biochem.Biotechnol.129-132:496-508;Varga等,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等,2006,EnzymeMicrob.Technol.39:756-762)。化学预处理术语"化学预处理"是指任何可促进纤维素、半纤维素和/或木质素的分离和/或释放的化学预处理。合适的化学预处理过程的例子包括稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆破(AFEX)、氨渗滤(APR)、和有机溶剂预处理。在稀酸预处理中,将含纤维素材料与稀酸,通常是H2S04,以及水混合形成浆液,蒸汽加热到希望的温度,然后经过一段停留时间瞬时变化到大气压。稀酸预处理可以用多种反应器设计来实施,例如活塞流动反应器、逆流反应器、或连续逆流收縮床反应器(Duff和Murray,1996,同上文;Schell等,2004,BioresourceTechnol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。还可以采用数种碱性条件下的预处理方法。这些碱性预处理包括,但不限于石灰预处理、湿氧化、氨渗滤(APR)和氨纤维/冷冻爆破(AFEX)。石灰预处理用碳酸钙、氢氧化钠或氨在85-15(TC的低温下进行,停留时间为1小时至数日(Wyman等,2005,BioresourceTechnol.96:1959-1966;Mosier等,2005,BioresourceTechnol.96:673-686)。W02006/110891、W02006/11899、W02006/11900和W02006/110901公开了使用氨的预处理方法。湿氧化是一种热预处理,典型地在180-20(TC进行5-15分钟,同时添加氧化剂如过氧化氢或氧过压(Schmidt和Thomsen,1998,BioresourceTechnol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等,2004,Biotechnol.Bioeng.88:567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。预处理优选在1-40%干物质、更优选2-30%干物质、最优选5-20%干物质的条件下进行,并且经常通过添加碱,如碳酸钠来提高初始pH。湿氧化预处理方法的一种变化形式,称为湿爆破(湿氧化和蒸汽爆破的结合),可以处理高达30%的干物质。在湿爆破中,在预处理过程中经过一定的停留时间后引入氧化剂。然后瞬间变化到大气压而终止预处理(W02006/032282)。氨纤维爆破(AFEX)涉及用液态或气态的氨在中等温度如90-10(TC和高压如17-20巴的条件下处理含纤维素材料5-10分钟,其中干物质含量可高达60%(Goll即alli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96:219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,BioresourceTechnol.96:2014-2018)。有机溶剂预处理通过使用乙醇水溶液(40-60%乙醇)在160-20(TC萃取30_60分钟来使含纤维素材料脱木质素(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,Biotechnol.Bioeng.94:851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121:219-230)。通常添加硫酸作为催化剂。在有机溶剂预处理中,大部分的半纤维素被去除。Schell等,2003,A卯l.Biochem.andBiotechnol.第105-108巻,第69-85页和Mosier等,2005,BioresourceTechnology96:673-686以及美国专利申请公布2002/0164730描述了其他合适的预处理方法的例子。在一个方面,化学预处理作为酸处理,更优选作为连续稀酸和/或弱酸(mildacid)处理来实施。所述酸通常是硫酸,但也可以用其它的酸,如乙酸、拧檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢或它们的混合物。弱酸处理在优选1-5,更优选1-4,最优选1-3的pH范围内进行。在一个方面,酸浓度在优选0.01-20wt%酸,更优选0.05-10wt%酸,进一步更优选O.l-5wt^酸,最优选0.2-2.0wt^酸的范围。将所述酸与含纤维素材料接触,并在一定温度如160-20(TC,优选165-195t:的范围内保持自若干秒到若干分钟不等的时间,例如1秒至60分钟。在另一个方面,预处理作为氨纤维爆破步骤(AFEX预处理步骤)来实施。在另一个方面,预处理在水浆液中进行。在优选的方面,含纤维素材料在预处理过程中以优选10-80wt%之间,更优选20-70wt%之间,最优选30-60wt%之间,诸如50wt%左右的量存在。经过预处理的含纤维素材料可以不予洗涤,或者可以用任何本领域已知的方法洗涤,例如用水洗涤。机械预处理术语"机械预处理"是指各类研磨(grinding)或粉碎(milling)(例如干粉碎,湿粉碎或振动球粉碎(vibratoryballmilling))。物理预处理术语"物理预处理"是指任何可促进纤维素、半纤维素和/或木质素从含纤维素材料分离和/或释放的预处理。例如,物理预处理可涉及辐射(例如微波辐射)、蒸汽处理/蒸汽爆破、湿热分解作用,和它们的组合。物理预处理可涉及高压和/或高温(蒸汽爆破)。在一个方面,高压是指在优选约300-约600psi,更优选约350-约550psi,最优选约400-约500psi的范围,如450psi左右。在另一个方面,高温意指约100-约30(TC,优选约140-约235t:范围的温度。在一个优选的方面,机械预处理在使用如上定义的高压及高温的分批过程式蒸汽喷射水解装置系统(batch-process,steamgunhydrolyzersystem)中,如可获自SundsDefibratorAB,Sweden的SundsHydrolyzer中进行。物理和化学联合预处理可以既以物理方式又以化学方式处理含纤维素材料。例如,预处理步骤可涉及稀酸或弱酸处理以及高温和/或高压处理。根据需要,物理预处理和化学预处理可以顺序地或同时地进行。还可以包含机械预处理。于是,在一个优选的方面,对含纤维素材料进行机械、化学、或物理预处理,或它们的任何组合,来促进纤维素、半纤维素和/或木质素的分离和/或释放。生物预处理术语"生物预处理"是指任何可促进纤维素、半纤维素和/或木质素从含纤维素材料分离和/或释放的生物预处理。生物预处理技术可涉及施用溶木质素微生物(参见例如Hsu,T.-A.,1996,Pretreatmentofbiomass,《HandbookonBioethanol-ProductionandUtilization》,Wyman,C.E.编,Taylor&Francis,Washington,DC,179-212;Ghosh禾卩Singh,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomass:areview,《EnzymaticConversionofBiomassforFuelsProduction》,Himmel,M.E.,Baker,J.0.禾口0verend,R.P.编,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.禾口Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,《AdvancesinBiochemicalEngineering/Biotechnology》,Sch印er,T.编,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;01sson禾卩Hahn_Hagerdal,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18:312-331,及Vallander禾口Eriksson,1990,Productionofethanolfromlignocellulosicmaterials:Stateoftheart,Adv.Biochem.Eng./Biotechnol.42:63-95)。MiL.在水解步骤,又称糖化中,经过预处理的含纤维素材料被水解以将纤维素或者半纤维素降解成可发酵糖,如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖、和/或可溶性寡糖。水解以酶促方式进行,使用包含有效量的具有纤维素分解增强活性的本发明的多肽的纤维素分解酶组合物。该组合物的酶组分也可以顺序地添加。在本发明的方法中,纤维素分解酶组合物可以包含在将含纤维素材料加工成葡萄糖,或将半纤维素加工成木糖、甘露糖、半乳糖和阿拉伯糖、它们的聚合物,或如下所述的它们的衍生产物的加工中涉及的任何蛋白质。在一个方面,所述纤维素分解酶组合物包含内切葡聚糖酶、纤维二糖水解酶、P_葡糖苷酶,或它们的组合。在另一个方面,所述纤维素分解酶组合物还包含一种或多种附加的用于改善含纤维素材料降解的酶活性。优选的附加酶有半纤维素酶、酯酶(例如脂肪酶、磷脂酶、和/或角质酶)、蛋白酶、漆酶、过氧化物酶、或它们的混合物。纤维素分解酶组合物可以是单组分制备物,例如一种内切葡聚糖酶,多组分制备物,例如一种或多种内切葡聚糖酶,一种或多种纤维二糖水解酶;和一种或多种P-葡糖苷酶,或者多组分蛋白制备物与单组分蛋白制备物的组合。纤维素分解蛋白可在酸性、中性或碱性pH范围内具有活性,即,水解含纤维素材料。如上文所述,本发明中使用的纤维素分解蛋白可以是单组分制备物,即基本上不含其它纤维素分解性组分的组分。单个组分可以是重组组分,即通过克隆编码该单个组分的DNA序列,然后用该DNA序列转化细胞,并在宿主中表达而产生的(参见例如WO91/17243和WO91/17244)。宿主细胞可以是异源宿主(酶对宿主而言是外来的)或者宿主也可以是野生型宿主(酶对宿主而言是天然的)。单组分纤维素分解蛋白还可以通过从发酵液中纯化此类蛋白来加以制备。添加了有效量的具有纤维素分解增强活性的多肽的纤维素分解酶组合物可以是任何适合在本文所述的方法中使用的形式,例如含或不含细胞的粗发酵液、干粉或颗粒剂、非粉化性颗粒剂(non-dustinggranulate)、液体、稳定化液体、或经保护的酶。颗粒剂例如可如在美国专利4,106,991和4,661,452中所公开的方法制备,并可任选使用本领域已知的方法进行包衣。例如,液体酶制备物可根据既定的方法通过加入稳定剂诸如糖、糖醇或其它多元醇、和/或乳酸或其它有机酸来稳定化。经保护的酶可根据EP238,216中所公开的方法制备。具有纤维素分解酶活性的多肽可以从任何属的微生物获得。术语"从...获得"(或"获自...")在此处意思是指所述酶可以是从天然产生所述酶作为天然酶的生物体分离而来的。"从...获得"(或"获自...")在此处还意指所述酶可以是在宿主生物体中重组产生的,其中重组产生的酶对于宿主生物体而言为天然的或外来的,或者具有经修饰的氨基酸序列,例如缺失、插入和/或取代了一个或多个氨基酸,即作为天然氨基酸序列的突变体和/或片段的重组产生的酶或通过本领域已知的核酸改组方法产生的酶。天然酶的意义中涵盖天然变体,外来酶的意义中涵盖通过化学或重组诱变,如通过定点诱变或改组获得的变体。因此,纤维素分解性蛋白的经过化学修饰或蛋白质工程改造的突变体也可以用于本发明。在一个优选的方面,获自给定来源的多肽是胞外分泌的。具有纤维素分解酶活性的多肽可以是细菌多肽。例如,该多肽可以是革兰氏阳性细菌多肽,诸如芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或海洋芽孢杆菌属的具有纤维素分解酶活性的多肽,或革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏球菌属或尿枝原体属的具有纤维素分解酶活性的多肽。在一个优选的方面,所述多肽是嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、缓慢芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌的具有纤维素分解酶活性的多肽。在另一个优选的方面,所述多肽是似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种的具有纤维素分解酶活性的多肽。在另一个优选的方面,所述多肽是不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌、或浅青紫链霉菌的具有纤维素分解酶活性的多肽。具有纤维素分解酶活性的多肽还可以是真菌多肽,更优选酵母多肽,如假丝酵母36属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属的具有纤维素分解酶活性的多肽;或者更优选丝状真菌多肽,如枝顶孢霉属、蘑菇属、链格孢属、曲霉属、短梗霉属、葡萄座腔菌属、拟蜡菌属、毛壳菌属、金孢子菌属、麦角属、旋孢腔菌属、Coprinopsis、Coptotermes、棒囊壳属、栗疫病菌属、隐球菌属、色二孢属、黑耳属、网孢菌属、镰孢属、赤霉属、全鞭毛虫属、腐质霉属、耙菌属、香菇属、小球腔菌属、梨孢菌属、Melanocarpus、多孔菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、Pseudotrichonympha、根毛霉属、裂褶菌属、柱顶孢属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、木霉属、Trichophaea、轮枝孢属、小包脚菇属、或小包脚菇属的具有纤维素分解酶活性的多肽。在一个优选的方面所述多肽是卡尔酵母、酿酒酵母(Saccharomycescerevisiae)、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母的具有纤维素分解酶活性的多肽。在另一个优选的方面,所述多肽是解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporiumlucknowense、热带金抱子菌、Chrysosporiummerdarium、Chrysosporiuminops、Chrysosporiumpa皿icola、Chrysospori咖queenslandic咖、Chrysosporiumzonat咖、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰色腐质酶、特异腐质霉、疏棉状腐质霉、乳白耙菌、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉、产紫青霉、黄孢平革菌、无色梭孢壳、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲|梭孢壳、Thielaviafimeti、小孢子梭孢壳、Thielavia0visp0r3、Thiel3vi即eruviMi3、Thielaviaspededonium、毛梭抱壳、Thielaviasubthermophila、土生梭孢壳、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaeasaccata的具有纤维素分解酶活性的多肽。在本发明的方法中,可以使用任何一种或多种内切葡聚糖酶,一种或多种纤维二糖水解酶,和/或一种或多种P_葡糖苷酶,以及其他纤维素分解性蛋白质,例如一种或多种半纤维素酶。可以用于本发明的细菌内切葡聚糖酶的例子包括但不限于解纤维热酸菌(Acidothermuscellulolyticus)内切葡聚糖酶(W091/05039;W093/15186;美国专利5,275,944;W096/02551;美国专利5,536,655,W000/70031,W005/093050);褐色喜热裂孢菌(Thermobifidafusca)内切葡聚糖酶III(W005/093050);和褐色喜热裂孢菌内切葡聚糖酶V(W005/093050)。可以用于本发明的真菌内切葡聚糖酶的例子包括但不限于里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene45:253-263;GenBank登录号M15665);里氏木霉内切葡聚糖酶II(Saloheimo等,1988,Gene63:11-22;GenBank登录号M19373);里氏木霉内切葡聚糖酶III(0kada等,1988,Appl.Environ.Microbiol.64:555-563;GenBank登录号AB003694);里氏木霉内切葡聚糖酶IV(Saloheimo等,1997,Eur.J.Biochem.249:584-591;GenBank登录号Yl1113);和里氏木霉内切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiology13:219-228;GenBank登录号Z33381);棘孢曲霉内切葡聚糖酶(0oi等,1990,NucleicAcidsResearch18:5884);川地曲霉(Aspergilliskawachii)内切葡聚糖酶(Sakamoto等,1995,CurrentGenetics27:435-439);金孢子菌属菌种(Chrysosporiumsp.)CI(美国专利6,573,086;GenP印t登录号AAQ38150);Corynascusheterothallicus(美国专利6,855,531;GenP印t登录号AAY00844);Erwiniacarotovara内切葡聚糖酶(Saarilahti等,1990,Gene90:9-14);尖镰孢内切葡聚糖酶(GenBank登录号L29381);灰腐质霉thermoidea变体菌株内切葡聚糖酶(GenBank登录号AB003107);Melanocarpusalbomyces内切葡聚糖酶(GenBank登录号MAL515703);粗糙脉孢菌内切葡聚糖酶(GenBank登录号XM—324477);马瘤胃弧菌(Piromycesequi)(Eberhardt等,2000,Microbiology146:1999-2008;GenP印t登录号CAB92325);米根霉(Rhizopusoryzae)(Moriya等,2003,J.Bacteriology185:1749-1756;GenBankTM登录号AB047927,AB056667、AB056668);和土生梭孢壳(W02004/053039;EMBL登录号CQ827970)。公开了使用依照HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino_acidsequencesimilarities,Biochem.J.280:309-316;以及HenrissatB.禾口BairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolasess,Biochem.J.316:695-696的分类法分类的超过13个糖基水解酶家族中的其它内切葡聚糖酶。在一个优选的方面,所述内切葡聚糖酶是里氏木霉内切葡聚糖酶I(CEL7B)。在另一个优选的方面,所述内切葡聚糖酶是里氏木霉内切葡聚糖酶II(CEL5A)。在另一个优选的方面,所述内切葡聚糖酶是里氏木霉内切葡聚糖酶III(CEL12A)。在另一个优选的方面,所述内切葡聚糖酶是里氏木霉内切葡聚糖酶V(CEL45A)。在另一个优选的方面,所述内切葡聚糖酶是嗜热毁丝霉CEL7内切葡聚糖酶。在另一个优选的方面,所述内切葡聚糖酶是ChrysosporiumlucknowenseCEL12内切葡聚糖酶。在另一个优选的方面,所述内切葡聚糖酶是Chrysosporiumluck丽enseCEL45内切葡聚糖酶。在一个更优选的方面,所述里氏木霉内切葡聚糖酶I(CEL7B)是SEQIDN0:46的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶11(CEL5A)是SEQIDNO:48的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶III(CEL12A)是SEQIDNO:50的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶V(CEL45A)是SEQIDNO:52的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述嗜热毁丝霉CEL7内切葡聚糖酶是SEQIDN0:54的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述ChrysosporiumlucknowenseCEL12内切葡聚糖酶是SEQIDNO:56的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述ChrysosporiumlucknowenseCEL45内切葡聚糖酶是SEQIDNO:58的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶1(CEL7B)由SEQIDNO:45的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶11(CEL5A)由SEQIDNO:47的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶III(CEL12A)由SEQIDNO:49的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述里氏木霉内切葡聚糖酶V(CEL45A)由SEQIDNO:51的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述嗜热毁丝霉CEL7内切葡聚糖酶由SEQIDNO:53的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述ChrysosporiumlucknowenseCEL12内切葡聚糖酶由SEQIDNO:55的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述ChrysosporiumlucknowenseCEL45内切葡聚糖酶由SEQIDNO:57的成熟多肽编码序列或其直向同源物或变体所编码。所述里氏木霉内切葡聚糖酶1(CEL7B)可根据Penttila等,1986,Gene45:253-263获得。所述里氏木霉内切葡聚糖酶11(CEL5A)可根据Saloheimo等,1988,Gene63:11-22获得。所述里氏木霉内切葡聚糖酶111(CEL12A)可根据0kada等,1988,A卯l.Environ.Microbiol.64:555-563获得。所述里氏木霉内切葡聚糖酶V(CEL45A)可根据Saloheimo等,1994,MolecularMicrobiology13:219-228获得。所述嗜热毁丝霉CEL7内切葡聚糖酶可根据WO95/024471获得。所述ChrysosporiumlucknowenseCEL12内切葡聚糖酶可根据W02001/25468获得。所述ChrysosporiumlucknowenseCEL45内切葡聚糖酶可根据WO2000/20555获得。在另一个优选的方面,所述纤维二糖水解酶是里氏木霉纤维二糖水解酶1(CEL7A)。在另一个优选的方面,所述纤维二糖水解酶是里氏木霉纤维二糖水解酶II(CEL6A)。在另一个优选的方面,所述纤维二糖水解酶是具有纤维素结合域的ChrysosporiumlucknowenseCEL7纤维二糖水解酶。在另一个优选的方面,所述纤维二糖水解酶是不具有纤维素结合域的嗜热毁丝霉CEL7纤维二糖水解酶。在另一个优选的方面,所述纤维二糖水解酶是土生梭孢壳纤维二糖水解酶。在另一个更优选的方面,所述里氏木霉纤维二糖水解酶I(CEL7A)是SEQIDNO:60的成熟多肽或其直向同源物或变体。在另一个优选的方面,所述里氏木霉纤维二糖水解酶II(CEL6A)是SEQIDNO:62的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述具有纤维素结合域的ChrysosporiumlucknowenseCEL7纤维二糖水解酶是SEQIDNO:64的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述不具有纤维素结合域的嗜热毁丝霉CEL7纤维二糖水解酶是SEQIDNO:66的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述土生梭孢壳纤维二糖水解酶是SEQIDN0:68的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述里氏木霉纤维二糖水解酶1(CEL7A)纤维二糖水解酶由SEQIDN0:59的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述里氏木霉纤维二糖水解酶II(CEL6A)纤维二糖水解酶由SEQIDNO:61的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述具有纤维素结合域的ChrysosporiumlucknowenseCEL7纤维二糖水解酶由SEQIDNO:63的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述不具有纤维素结合域的嗜热毁丝霉CEL7纤维二糖水解酶由SEQIDNO:65的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述土生梭孢壳纤维二糖水解酶由SEQIDNO:67的成熟多肽编码序列或其直向同源物或变体所编码。所述里氏木霉纤维二糖水解酶I(CEL7A)可以依照Shoemaker等,1983,Biotechnology(N.Y.)l:691-696获得。所述里氏木霉纤维二糖水解酶II(CEL6A)可以依照Terri等,1987,Gene51:43-52获得。所述具有纤维素结合域的ChrysosporiumlucknowenseCEL7纤维二糖水解酶可以依照W02001/79507获得。所述不具有纤维素结合域的嗜热毁丝霉CEL7纤维二糖水解酶可以依照W02003/000941获得。所述土生梭孢壳纤维二糖水解酶可以依照WO2006/074435获得。在另一个优选的方面,所述e-葡糖苷酶获自米曲霉。在另一个优选的方面,所述e-葡糖苷酶获自烟曲霉。在另一个优选的方面,所述e-葡糖苷酶获自巴西青霉(Penicilliumbrasilia皿m),例如巴西青霉IBT20888株。在另一个优选的方面,所述e-葡糖苷酶获自黑曲霉。在另一个优选的方面,所述e-葡糖苷酶获自棘孢曲霉。在一个更优选的方面,所述米曲霉13-葡糖苷酶是SEQIDNO:70的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述烟曲霉P-葡糖苷酶是SEQIDNO:72的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述巴西青霉P-葡糖苷酶是SEQIDN0:74的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述黑曲霉P-葡糖苷酶是SEQIDN0:76的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述棘孢曲霉P-葡糖苷酶是SEQIDN0:78的成熟多肽或其直向同源物或变体。在另一个更优选的方面,所述米曲霉P-葡糖苷酶由SEQIDNO:69的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述烟曲霉P-葡糖苷酶由SEQIDN0:71的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述巴西青霉P-葡糖苷酶由SEQIDNO:73的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述黑曲霉P-葡糖苷酶由SEQIDNO:75的成熟多肽编码序列或其直向同源物或变体所编码。在另一个更优选的方面,所述棘孢曲霉P-葡糖苷酶由SEQIDNO:77的成熟多肽编码序列或其直向同源物或变体所编码。所述具有P-葡糖苷酶活性的米曲霉多肽可以根据WO2002/095014获得。所述具有P-葡糖苷酶活性的烟曲霉多肽可以根据WO2005/047499获得。所述具有P_葡糖苷酶活性的巴西青霉多肽可以根据WO2007/019442获得。所述具有P_葡糖苷酶活性的黑曲霉多肽可以根据Dan等,2000,J.Biol.Chem.275:4973-4980获得。所述具有P_葡糖苷酶活性的棘孢曲霉多肽可以根据Kawaguchi等,1996,Gene173:287-288获得。在另一个优选的方面,所述P-葡糖苷酶是SEQIDNO:80的米曲霉P-葡糖苷酶变体BG融合蛋白。在另一个优选的方面,所述米曲霉P-葡糖苷酶变体BG融合蛋白由SEQIDN0:79的多核苷酸编码。在另一个优选的方面,所述P-葡糖苷酶是SEQIDNO:82的米曲霉P-葡糖苷酶融合蛋白。在另一个优选的方面,所述米曲霉P-葡糖苷酶融合蛋白由SEQIDNO:81的多核苷酸编码。在一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;P-葡糖苷酶;里氏木霉纤维二糖水解酶I(CEL7A);里氏木霉纤维二糖水解酶11(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B)。在另一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;P_葡糖苷酶;里氏木霉纤维二糖水解酶I(CEL7A),里氏木霉纤维二糖水解酶II(CEL6A),里氏木霉内切葡聚糖酶I(CEL7B),并进一步包含(1)选自里氏木霉内切葡聚糖酶II(CEL5A)、里氏木霉内切葡聚糖酶V(CEL45A)、和里氏木霉内切葡聚糖酶111(CEL12A)的一种或多种酶,和/或进一步包含(2)土生梭孢壳纤维二糖水解酶。在另一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;SEQIDN0:82的P-葡糖苷酶融合蛋白;具有SEQIDNO:60的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),具有SEQIDNO:62的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和具有SEQIDNO:46的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。在另一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;SEQIDN0:82的P-葡糖苷酶融合蛋白;具有SEQIDNO:60的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),具有SEQIDNO:62的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和具有SEQIDNO:46的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),且进一步包含选自下组的一种或多种酶具有SEQIDN0:47的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A),具有SEQIDNO:51的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A),以及具有SEQIDNO:49的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)。在另一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;SEQIDN0:82的P-葡糖苷酶融合蛋白;具有SEQIDNO:60的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),具有SEQIDNO:62的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和具有SEQIDNO:46的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并进一步包含具有SEQIDNO:68的成熟多肽的土生梭孢壳纤维二糖水解酶。在另一个优选的方面,所述纤维素分解酶组合物包含具有纤维素分解增强活性的本发明的多肽;SEQIDN0:82的P-葡糖苷酶融合蛋白;具有SEQIDNO:60的成熟多肽的里氏木霉纤维二糖水解酶1(CEL7A),具有SEQIDNO:62的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),以及具有SEQIDNO:46的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并进一步包含(l)选自具有SEQIDNO:47的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A)、具有SEQIDNO:51的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A)、和具有SEQIDN0:49的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)的一种或多种酶,和/或进一步包含(2)具有SEQIDNO:68的成熟多肽的土生梭孢壳纤维二糖水解酶。在另一个优选的方面,所述纤维素分解酶组合物包含选自下组的一种或多种(数种)组分有内切葡聚糖酶活性的嗜热毁丝霉CEL7多肽,有内切葡聚糖酶活性的ChrysosporiumlucknowenseCEL12多肽,有内切葡聚糖酶活性的ChrysosporiumlucknowenseCEL45多肽,有纤维二糖水解酶活性并具有纤维素结合域的ChrysosporiumlucknowenseCEL7多肽,和有纤维二糖水解酶活性而没有纤维素结合域的嗜热毁丝霉CEL7多肽。在另一个优选的方面,所述纤维素分解酶组合物包含有内切葡聚糖酶活性的嗜热毁丝霉CEL7多肽,有内切葡聚糖酶活性的ChrysosporiumlucknowenseCEL12多肽,有内切葡聚糖酶活性的ChrysosporiumlucknowenseCEL45多肽,有纤维二糖水解酶活性并具有纤维素结合域的CEL7多肽,和有纤维二糖水解酶活性而没有纤维素结合域的嗜热毁丝霉CEL7多肽。在另一个优选的方面,上述组合物还包含一种或多种(数种)具有P-葡糖苷酶的多肽。所述纤维素分解酶组合物还可以是商业制备物。适用于本发明的商业纤维素分解酶制备物的实例包括,例如,CELLUCLAST(可获自NovozymesA/S)和NOVOZYM188(可获自NovozymesA/S)。其它可用的商品化制备物包括CELLUZYME、CEREFLO和ULTRAFLO(NovozymesA/S),LAMINEX禾PSPEZYMECP(GenencorInt.),ROHAMENT7Q69W(R6hmGmbH),和FIBREZYME⑧LDI,FIBREZYMELBR,或VISCOSTAR⑧150L(DyadicInternational,Inc.,Jupiter,FL,USA)。可用于本发明的其它纤维素分解蛋白在下列文献中有记载EP495,257、EP531,315、EP531,372、WO89/09259、WO94/07998、W095/24471、WO96/11262、WO96/29397、WO96/034108、WO97/14804、WO98/08940、WO98/012307、WO98/13465、WO98/015619、WO98/015633、WO98/028411、WO99/06574、WO99/10481、WO99/025846、WO99/025847、WO99/031255、WO2000/009707、WO2002/050245、WO2002/0076792、WO2002/101078、WO2003/027306、WO2003/052054、WO2003/052055、WO2003/052056、WO2003/052057、WO2003/052118、WO2004/016760、WO2004/043980、WO2004/048592、WO2005/001065、WO2005/028636、WO2005/093050、WO2005/093073、WO2006/074005、WO2006/117432、WO2007/071818、WO2007/071820、WO2008/008070、WO2008/008793、美国专利4,435,307、美国专利5,457,046、美国专利5,648,263、美国专利5,686,593、美国专利5,691,178、美国专利5,763,254、和美国专利5,776,757。本发明的方法中使用的纤维素分解蛋白可以通过利用本领域已知的程序,用含有合适的碳源及氮源和无机盐的营养培养基发酵上文提到的微生物菌株来加以生产(参见例如Bennett,J.W.禾口LaSure,L.(编车葺),MoreGeneManipulationsinFungi,AcademicPress,CA,1991)。合适的培养基可以从供应商获得,或者可以依照公开的组成(例如美国典型培养物保藏中心的目录中)来制备。适于生长和纤维素分解蛋白产生的温度范围及其它条件是本领域已知的(参见例如Bailey,J.E.和Ollis,D.F.,BiochemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。发酵可以是任何培养细胞而导致纤维素分解蛋白的表达或分离的方法。因此,发酵可以理解为包括在实验室或工业发酵罐中实施的摇瓶培养、或小规模或大规模发酵(包括连续、分批、补料分批或固态发酵),其在合适的培养基中,在容许纤维素分解蛋白表达或分离的条件下进行。依照上述方法所得的纤维素分解蛋白可以从发酵培养基回收并通过如本文描述的常规程序加以纯化。酶促水解优选在合适的含水环境中于本领域技术人员可容易确定的条件下进行。在一个优选的方面,水解在适合于一种或多种酶的活性的条件,即对一种或多种酶而言最适的条件下进行。水解可以作为补料分批或者连续过程进行,例如经预处理的含纤维素材料(底物)被逐渐添加到例如含酶的水解溶液中。糖化通常在搅拌槽式反应器或发酵罐中在受控的pH、温度和混合条件下进行。合适的过程时间、温度和pH条件可以由本领域技术人员容易地确定。例如,糖化可持续最多达200个小时,但通常进行优选约12个到约96个小时,更优选约16个到约72个小时,最优选约24个到约48个小时。温度范围为优选约25°C-约70°C,更优选约30°C-约65°C,更优选约40°C-60°C,尤其是约50°C。pH范围为优选约3-约8,更优选约3.5-约7,最优选约4-约6,尤其是大约pH5。干固形物含量范围为优选约5-约50wt^,更优选约10-约40wt%,最优选约20-约30wt%。具有纤维素分解增强活性的酶和多肽的最适量取决于数种因素,包括但不限于作为成分的纤维素分解蛋白的混合物,含纤维素底物,含纤维素底物的浓度,含纤维素底物的一种或多种预处理,温度,时间,PH,以及发酵生物的选用(例如用于同时糖化和发酵的酵母)。42在一个优选的方面,一种或多种纤维素分解蛋白对含纤维素材料的有效量为大约0.5-约50mg,优选约0.5-约40mg,更优选约0.5-约25mg,更优选约0.75-约20mg,更优选约0.75-约15mg,进一步更优选约0.5-约10mg,最优选约2.5-约10mg每克含纤维素材料。在另一个优选的方面,具有纤维素分解增强活性的多肽对含纤维素材料的有效量为约0.5-约50mg,优选约0.5-约40mg,更优选约0.5-约25mg,更优选约0.75-约20mg,更优选约0.75-约15mg,进一步更优选约0.5-约10mg,最优选约2.5-约10mg每克含纤维素材料。在另一个优选的方面,具有纤维素分解增强活性的一种或多种多肽对含纤维素材料的有效量为约0.01-约50.Omg,优选约0.01-约40mg,更优选约0.01-约30mg,更优选约0.01-约20mg,更优选约0.01-约10mg,更优选约0.01-约5mg,更优选约0.025-约1.5mg,更优选约0.05-约1.25mg,更优选约0.075-约1.25mg,更优选约0.1-约1.25mg,进一步更优选约0.15-约1.25mg,最优选约0.25-约1.Omg每克含纤维素材料。在另一个优选的方面,一种或多种具有纤维素分解增强活性的多肽对纤维素分解蛋白的有效量为约0.005-约1.Og,优选约0.01-约1.Og,更优选约0.15-约0.75g,更优选约0.15-约0.5g,更优选约0.1-约0.5g,进一步更优选约0.1-约0.5g,最优选约0.05-约0.2g每克一种或多种纤维素分解蛋白。皿.对于从经过预处理和水解的含纤维素材料获得的可发酵糖,可以用一种或多种能够直接或间接将糖发酵为期望的发酵产物的发酵微生物来加以发酵。"发酵"或"发酵过程"是指任何发酵过程或任何包含发酵步骤的过程。发酵过程还包括生物燃料工业、食用酒精工业(例如啤酒和葡萄酒)、乳品工业(例如发酵乳产品)、皮革工业及烟草工业上使用的发酵过程。发酵条件取决于期望的发酵产物及发酵生物,可以由本领域技术人员容易地予以确定。在发酵步骤中,作为预处理和酶促水解步骤的结果从含纤维素材料释放的糖被发酵生物如酵母发酵成产物,例如乙醇。水解(糖化)和发酵可以分别或同时进行。这样的方法包括,但不限于,分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和发酵)、以及直接微生物转化(匿C)。任何合适的经水解的含纤维素材料都可以用于本发明实施中的发酵步骤。如本领域中公知的,所述材料的选择通常基于期望的发酵产物,即要通过发酵获得的物质,以及所采用的过程。术语"发酵培养基"在本文中理解为指添加一种或多种发酵微生物之前的培养基,例如由糖化过程得到的培养基,以及例如在同时糖化和发酵过程(SSF)中使用的培养基。"发酵微生物"是指适合在期望的发酵过程中使用来产生发酵产物的任何微生物,包括细菌和真菌生物。发酵微生物可以是Ce和/或Cs发酵生物,或它们的组合。Ce和G发酵生物都是本领域中公知的。合适的发酵微生物能够将糖类,如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖,直接或间接发酵,即转化成期望的发酵产物。Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642记载了产生乙醇的细菌及真菌发酵微生物的例子。能够发酵C6糖的发酵微生物的例子包括细菌和真菌生物,如酵母。优选的酵母包括酵母属一些种,优选酿酒酵母的菌株。能够发酵C5糖的发酵微生物的例子包括细菌和真菌生物,如酵母。优选的发酵C5的酵母包括毕赤酵母属的菌株,优选树干毕赤酵母(Pichiastipitis),如树干毕赤酵母CBS5773;假丝酵母属的菌株,优选博伊丁假丝酵母(Candidaboidinii)、芸苔假丝酵母(Candidabrassicae)、休哈塔假丝酵母(Candidasheatae)、迪丹斯假丝酵母(Candidadiddensii)、假热带假丝酵母(Candidapseudotropicalis)或产朊假丝酵母(Candidautilis)。其它发酵生物包括发酵单孢菌属(Zymomonas)如运动发酵单胞菌(Zymomonasmobilis)的菌株;汉逊酵母属(Hansenula)如异常汉逊酵母(Hansenulaanomala)的菌株;克鲁维酵母属如脆壁克鲁维酵母(K.fragilis)的菌株;裂殖酵母属如粟酒裂殖酵母的菌株;以及大肠杆菌,尤其是已经过遗传修饰而改善了乙醇产率的大肠杆菌菌株。在一个优选的方面,所述酵母是酵母属的一些种(Saccharomycesspp)。在一个更优选的方面,所述酵母是酿酒酵母。在另一个更优选的方面,所述酵母是糖化酵母。在另一个更优选的方面,所述酵母是葡萄汁酵母(Saccharomycesuvarum)。在另一个优选的方面,所述酵母是克鲁维酵母。在另一个更优选的方面,所述酵母是马克斯克鲁维酵母(Kluyveromycesmarxia皿s)。在另一个更优选的方面,所述酵母是脆壁克鲁维酵母。在另一个优选的方面,所述酵母是假丝酵母。在另一个更优选的方面,所述酵母是博伊丁假丝酵母。在另一个更优选的方面,所述酵母是芸苔假丝酵母。在另一个更优选的方面,所述酵母是迪丹斯假丝酵母。在另一个更优选的方面,所述酵母是假热带假丝酵母。在另一个更优选的方面,所述酵母是产朊假丝酵母。在另一个优选的方面,所述酵母是棍孢属(Clavispora)。在另一个更优选的方面,所述酵母是葡萄牙棍孢(Clavisporalusitaniae)。在另一个更优选的方面,所述酵母是仙人掌棍孢(Clavisporaop皿tiae)。在另一个优选的方面,所述酵母是管囊酵母属(Pachysolen)。在另一个更优选的方面,所述酵母是嗜鞣管囊酵母(Pachysolenta皿ophilus)。在另一个优选的方面,所述酵母是毕赤酵母。在另一个更优选的方面,所述酵母是树干毕赤酵母。在另一个优选的方面,所述酵母是酒香酵母属(Bretannomyces)。在另一个更优选的方面,所述酵母是克劳森酒香酵母(Breta翻mycesclausenii)(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,在Wyman,C.E.编的《HandbookonBioethanol-ProductionandUtilization》中,Taylor&Francis,Washington,DC,179-212)。能够高效地将己糖和戊糖发酵成乙醇的细菌包括,运动发酵单胞菌和热纤维梭菌(Clostridiumthermocellum)(Philippidis,1996,同上文)。在一个优选的方面,所述细菌是发酵单胞菌。在一个更优选的方面,所述细菌是运动发酵单胞菌。在另一个优选的方面,所述细菌是梭菌。在另一个更优选的方面,所述细菌是热纤维梭菌。适用于乙醇生产的商品化酵母包括,例如,ETHANOLRED酵母(可获自Fermentis/Lesaffre,USA)、FALI(可获自Fleischmann,sYeast,USA),SUPERSTART和THERM0SACC鲜酵母(可获自EthanolTechnology,WI,USA)、BI0FERMAFT和XR(可获自NABC-NorthAmericanBioproductsCorporation,GA,USA)、GERTSTRAND(可获自GertStrandAB,44Sweden),以及FERMI01"(可获自DSMSpecialties)。在一个优选的方面,所述发酵微生物经过了遗传修饰来提供发酵戊糖的能力,例如利用木糖的、利用阿拉伯糖的、以及共利用木糖和阿拉伯糖的微生物。通过克隆异源基因到各种发酵微生物中,已经构建出了能够将己糖和戊糖转化为乙醇(共发酵)的生物(Chen和Ho,l993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等,1998,GeneticallyengineeredSaccharomycesyeastcapableofeffectivelycofermentingSaccharomycescerevisiaeandxylose,Appl.Environ.Microbiol.64:1852—1859;KotterandCiriacy,1993,XylosefermentationbySaccharomycescerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizingSaccharomycescerevisiaestrainsoverexpressingtheTKL1andTALIgenesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,MinimalmetabolicengineeringofSaccharomycescerevisiaeforefficientanaerobicxylosefermentation:aproofofprinciple,FEMSYeastResearch4:655-664;Beall等,1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58:204-214;Zhang等,1995,Metabolicengineeringof即entosemetabolismpathwayinethanologenicZymomonasmobilis,Science267:240-243;Deanda等,1996,Developmentofanarabinose_fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.62:4465-4470)。在一个优选的方面,所述经过了遗传修饰的发酵微生物是酿酒酵母。在另一个优选的方面,所述经过了遗传修饰的发酵微生物是运动发酵单胞菌。在另一个优选的方面,所述经过了遗传修饰的发酵微生物是大肠杆菌。在另一个优选的方面,所述经过了遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiellaoxytoca)。通常将一种或多种发酵微生物添加到经降解的纤维素或水解产物中,进行约8小时至约96小时,例如约24-约60小时的发酵。温度通常为约26°C-约60°C,尤其是约32°C或50°C,pH为约3-8,如大约pH4-5,6,或7左右。在一个优选的方面,将一种或多种发酵微生物施加到经降解的纤维素或水解产物,并进行大约12小时至大约96小时,如通常24-60小时的发酵。在一个优选的方面,温度优选为大约2(TC至大约6(TC,更优选大约25t:至大约5(TC,最优选大约32。C至大约50°C,特别是大约32t:或5(rC,pH—般为大约pH3至大约pH7,优选pH4_7左右。然而,某些发酵微生物如细菌发酵生物,具有更高的最适发酵温度。一种或多种发酵微生物施加的量优选为每ml发酵液大约105至1012,优选大约107至101Q,特别是大约2xl08个活细胞计数。关于使用酵母进行发酵的更多指导可见例如"TheAlcoholTextbook"(K.Jacques,T.P.Lyons禾口D.R.Kelsall编,NottinghamUniversityPress,UnitedKingdom1999),本文援弓l并入该文献。为了生产乙醇,在发酵之后将经发酵的浆液蒸馏以提取乙醇。依照本发明的方法获得的乙醇可以用作,例如,燃料乙醇、饮用乙醇即可饮用酒精(potableneutralspirits);或工业乙醇。发酵剌激物(fermentationstimulator)可与本文描述的任何酶促过程组合使用以进一步改进发酵方法,特别是发酵微生物的性能,诸如速率提高和乙醇产量。"发酵剌激物"指用于发酵微生物特别是酵母的生长的剌激物。优选的用于生长的发酵剌激物包括维生素和矿物质。维生素的实例包括多种维生素(multivitamins)、生物素、泛酸、烟酸、内消旋肌醇(meso-inositol)、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素、及维生素A、B、C、D禾口E。参见例如Alfenore等,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag,2002,本文援引并入该文献。矿物质的实例包括能够提供营养的矿物质和矿物质盐,包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。^M^ll:发酵产物可以是任何来源于发酵的物质。所述发酵产物包括,但不限于,醇类(例如阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、l,3-丙二醇、山梨糖醇和木糖醇);有机酸(例如乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸和木糖酸);酮类(例如丙酮);醛类(例如甲醛);氨基酸(例如天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);和气体(例如甲烷、氢(H》、二氧化碳(C02)和一氧化碳(CO))。发酵产物还可以是作为高价值产物的蛋白质。在一个优选的方面,所述发酵产物是醇。应理解的是术语"醇"涵盖含有一个或多个羟基部分的物质。在一个更优选的方面,所述醇是阿拉伯糖醇。在另一个更优选的方面,所述醇是丁醇。在另一个更优选的方面,所述醇是乙醇。在另一个更优选的方面,所述醇是甘油。在另一个更优选的方面,所述醇是甲醇。在另一个更优选的方面,所述醇是l,3-丙二醇。在另一个更优选的方面,所述醇是山梨糖醇。在另一个更优选的方面,所述醇是木糖醇。参见例如Gong,C.S.、Cao,N.J.、Du,J.和Tsao,G.T.,1999,Ethanolproductionfromrenewableresources,在《AdvancesinBiochemicalEngineering/Biotechnology》中,Sch印er,T.编,Springer-VerlagBerlinHeidelberg,Germany,65:207-241;Silveira,M.M.,禾口Jonas,R.,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,禾口Singh,D.,1995,Processesforfermentativeproductionofxylitol_asugarsubstitute,ProcessBiochemistry30(2):117-124;Ezeji,T.C.、Qureshi,N.禾口Blaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBA101andinsiturecoverybygasstripping,WorldjournalofMicrobiologyandBiotechnology19(6):595-603。在另一个优选的方面,所述发酵产物是有机酸。在另一个更优选的方面,所述有机酸是乙酸。在另一个更优选的方面,所述有机酸是醋酮酸。在另一个更优选的方面,所述有机酸是己二酸。在另一个更优选的方面,所述有机酸是抗坏血酸。在另一个更优选的方面,所述有机酸是柠檬酸。在另一个更优选的方面,所述有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的方面,所述有机酸是甲酸。在另一个更优选的方面,所述有机酸是富马酸。在另一个更优选的方面,所述有机酸是葡糖二酸。在另一个更优选的方面,所述有机酸是葡糖酸。在另一个更优选的方面,所述有机酸是葡糖醛酸。在另一个更优选的方面,所述有机酸是戊二酸。在另一个优选的方面,所述有机酸是3-羟基丙酸。在另一个更优选的方面,所述有机酸是衣康酸。在另一个更优选的方面,所述有机酸是乳酸。在另一个更优选的方面,所述有机酸是苹果酸。在另一个更优选的方面,所述有机酸是丙二酸。在另一个更优选的方面,所述有机酸是草酸。在另一个更优选的方面,所述有机酸是丙酸。在另一个更优选的方面,所述有机酸是琥珀酸。在另一个更优选的方面,所述有机酸是木糖酸。参见例如Chen,R.,禾口Lee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63_65:435—448。在另一个优选的方面,所述发酵产物是酮。可以理解的是术语"酮"涵盖含有一个或多个酮部分的物质。在另一个更优选的方面,所述酮是丙酮。参见例如Qureshi和Blaschek,2003,同上文。在另一个优选的方面,所述发酵产物是醛。在另一个更优选的方面,所述醛是甲醛。在另一个优选的方面,所述发酵产物是氨基酸。在另一个更优选的方面,所述有机酸是天冬氨酸。在另一个更优选的方面,所述氨基酸是谷氨酸。在另一个更优选的方面,所述氨基酸是甘氨酸。在另一个更优选的方面,所述氨基酸是赖氨酸。在另一个更优选的方面,所述氨基酸是丝氨酸。在另一个更优选的方面,所述氨基酸是苏氨酸。参见例如Richard,A.,禾卩Margaritis,A.,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4):501-515。在另一个优选的方面,所述发酵产物是气体。在另一个更优选的方面,所述气体是甲烷。在另一个更优选的方面,所述气体是4。在另一个更优选的方面,所述气体是(》2。在另一个更优选的方面,所述气体是CO。参见例如Kataoka,N.、A.Miya,和K.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6_7):41-47;及GunaseelanV.N.,BiomassandBioe證gyVol.13(1-2),第83-114页,1997,Anaerobicdigestionofbiomassformethaneproduction:Areview。回收.任选地可以使用任何本领域已知的方法从发酵培养基回收一种或多种发酵产物,这些方法包括但不限于层析(例如离子交换、亲和、疏水、层析聚焦、和大小排阻)、电泳程序(例如制备性等电聚焦)、差异溶解度(例如硫酸铵沉淀)、蒸馏、或萃取。例如,从经过发酵的含纤维素材料通过常规蒸馏方法分离乙醇并纯化。可以获得纯度最高达约96vol%的乙醇,它可以用作,例如,燃料乙醇、饮用乙醇即可饮用酒精(po),或工业乙醇。信号月太本发明还涉及包含编码蛋白质的基因的核酸构建体,其中所述基因可操作地连接于编码信号肽的核苷酸序列,所述信号肽包含SEQIDN0:2的氨基酸1-15或者由SEQIDNO:2的氨基酸1-15组成,其中所述基因对所述核苷酸序列而言是外来的。在一个优选的方面,所述核苷酸序列包含SEQIDNO:1的核苷酸1_45或者由SEQ47IDN0:1的核苷酸1-45组成。本发明还涉及包含这样的核酸构建体的重组表达载体和重组宿主细胞。本发明还涉及用于产生蛋白质的方法,所述方法包括(a)在适合于蛋白质产生的条件下培养这样的重组宿主细胞;和(b)回收所述蛋白质。所述蛋白质对于宿主细胞而言可以是天然的或者异源的。术语"蛋白质"在本文中并不意指被编码产物的具体长度,因此涵盖了肽、寡肽和蛋白质。术语"蛋白质"还涵盖结合形成被编码产物的两个或更多个多肽。蛋白质还包括杂合多肽,其包含从至少两种不同蛋白质(其中一种或多种(数种)可以是对宿主细胞而言为异源或天然的)获得的部分或完整多肽序列的组合。蛋白质还包括上述蛋白质和杂合蛋白的天然存在的等位变化形式以及工程改造的变化形式。优选的,所述蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分、或报道分子。在一个更优选的方面,所述蛋白质是氧化还原酶、转移酶、水解酶、裂合酶、异构酶或连接酶。在一个进一步更优选的方面,所述蛋白质是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、a-半乳糖苷酶、P-半乳糖苷酶、葡糖淀粉酶、a-葡糖苷酶、P-葡糖苷酶、转化酶、漆酶、其他脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。所述基因可以从任何原核、真核或其他来源获得。下面用实施例进一步描述本发明,这些实施例不应解释为对本发明范围的限制。实施例材料用作缓冲剂和底物的化学品是至少试剂级的商品。培养基PDA平板的组成为每升39克马铃薯葡萄糖琼脂。NNCYP培养基的组成为每升5.0gNH4N03、0.5gMgS047H20、0.3gCaCl2、2.5g拧檬酸、1.0g细菌用蛋白胨(BactoP印tone)、5.0g酵母提取物,lmlCOVE痕量金属溶液、以及足量的K2HP04使最终pH达到约5.4。NNCYPmod培养基的组成为每升1.0gNaC1、5.0gNH4N03、0.2gMgS047H20、0.2gCaCl2、2.0g柠檬酸、1.0g细菌用蛋白胨、5.0g酵母提取物,lmlofCOVE痕量金属溶液、以及足量的K2HP04使最终pH达到约5.4。COVE痕量金属溶液的组成为每升0.04gNa2B40710H20、0.4gCuS045H20、1.2gFeS047H20、0.7gMnS04.H20、0.8gNa2Mo022H20^P10gZnS047H20。LB平板的组成为每升10g胰蛋白胨、5g酵母提取物,5g氯化钠、和15g细菌用琼脂(BactoAgar)。MDU2BP培养基的组成为每升45g麦芽糖、lgMgS047H20、lgNaCl、2gK2HS04、12gKH2P04、2g尿素、和500ii1AMG痕量金属溶液,然后将pH调整到5.0,用0.22ym过滤元件进行过滤除菌。AMG痕量金属溶液的组成为每升14.3gZnS047H20、2.5gCuS045H20、0.5gNiCl26H20、13.8gFeS04H20、8.5gMnS047叫、禾口3g拧檬酸。S0C培养基的组成为2X胰蛋白胨、0.5%酵母提取物、10慮NaCl、2.5mMKCl、10mMMgC^和10mMMgS(V然后在高压蒸汽灭菌后添加经过滤除菌的葡萄糖至20mM。冷冻培养基的组成为60%SOC和40%甘油。2XYT培养基的组成为每升16g胰蛋白胨、10g酵母提取物,5gNaCl、和15g细菌用琼脂。实施例1:从土生梭孢壳NRRL8126鉴定G朋1F多肽从在NNCYPmod培养基(添加有1%SIGMACELLType20纤维素(SigmaChemicalCo.,St.Louis,MO,USA))上培养土生梭孢壳NRRL8126所得的新鲜平板取琼脂糖块,接种到50ml添加了1%葡萄糖的NNCYPmod培养基中,45°C、200rpm温育25小时。然后对15个500ml烧瓶和两个250ml烧瓶分别接种2ml上述的培养物,其中每个500ml烧瓶和250ml烧瓶分别含100ml和50ml添加有2%SIGMACELLType20纤维素的NNCYPmod培养基。将这些烧瓶在45°C、200rpm条件下温育4天。将培养物合并后于3000xg离心10分钟,将上清液通过NALGENE⑧玻璃纤维预滤器(NalgeNuncInt'1.,Rochester,NY,USA)过滤。滤液冷却到4t:保存。二维聚丙烯酰胺凝胶电泳.取1ml滤液,添加100y1饱和(4°C)三氯乙酸(TCA),在冰上温育10分钟,然后添加9ml冰冷的丙酮,再在冰上温育20分钟,来加以沉淀。将经过沉淀的溶液在10,OOOxgfC离心10分钟,倾去上清液,用冰冷的丙酮洗涤离心沉淀两次,让其风干。将干燥的离心沉淀溶于0.2ml等电聚焦(IEF)样品缓冲液。IEF样品缓冲液的组成为9.0M尿素、3.0Xw/v3-[(3-胆酰胺丙基)二甲基-铵]-l-丙磺酸盐(3_[(3-cholamidopropyl)dimethyl-ammonium]_l_propanesulfonate)(CHAPS,PierceChemicalCo.Rockford,IL,USA)、1%(v/v)pH4-7两性电解质、1%P_巯基乙醇,和0.005%溶于蒸馏水的溴酚蓝。尿素储液用八0501^8(0),20-5-目,混合床树脂(Bio-Rad,Hercules,CA,USA)去离子。去离子后的溶液保存在_20°C。将所得的混合物在LABQUAKE(g).摇床(LabIndustries,Berkeley,CA,USA)上轻柔混合数小时让其溶解。将样品缓冲液-蛋白质混合物加到IPG复水皿(AmershamBiosciences,Piscataway,NJ,USA)中的11cmIPG凝胶条(strip)(Bio-Rad,Hercules,CA,USA)上。在IPG凝胶条上覆盖一层750ill等份的干凝胶条覆盖液(AmershamBiosciences,Piscataway,NJ,USA)以防止蒸发,让其在2(TC复水12小时,与此同时使用IPGPHOR⑧等电聚焦单元(AmershamBiosciences,Piscataway,NJ,USA)施加30伏电压。该IPGPHOR⑧被编程以提供恒定电压且使每条凝胶条的最大电流为50A。复水12小时后,等电聚焦条件如下200伏1小时,500伏1小时,和1000伏1小时。然后施加从1000伏到8000伏历时30分钟的梯度,编程使等电聚焦在8000伏运行并在达到>30,000伏小时完结。在第二维分析之前将IPG凝胶条还原并烷基化,方法是首先用每10mlSDS平衡缓冲液lOOmg的二硫苏糖醇还原15分钟,然后在黑暗中用每10ml平衡缓冲液250mg的碘乙酰胺烷基化15分钟。SDS平衡缓冲液的组成为50mMTrisHClpH8.8、6.0M尿素、2%w/v十二烷基硫酸钠(SDS)、30%甘油、以及0.002%w/v溴酚蓝。将IPG凝胶条在SDS-PAGE运行缓冲液(Invitrogen/Novex,Carlsbad,CA,USA)中快速清洗,放在一条llcm,l孔8_16%Tris-甘氨酸SDS-PAGE凝胶(Bio-Rad,Hercules,CA,USA)上,用CRITERJON⑧电泳单元(Bio-Rad,Hercules,CA,USA)以50伏电泳直到样品进入凝胶,然后增加电压到200伏,运行直到溴酚蓝染料达到凝胶底部。多肽检测.二维凝胶用荧光SYPRO必橙色蛋白染色剂(MolecularProbes,Eugene,0R,USA)染色。荧光染色方法来自Malone等,2001,Electrophoresis,22,919-932并经过优化和调适。在平台式振荡器上将SDS-PAGE凝胶在40%乙醇、2%乙酸和0.0005%SDS中固定1小时到过夜。通过重复3次洗涤步骤来去除并更换固定溶液,每个步骤由2%乙酸和0.0005%SDS,30分钟构成。将凝胶在黑暗中用2%乙酸、0.0005%SDS和0.02%SYPRO⑧橙色蛋白染色剂染色l.5小时到过夜。在HOEFER⑧processorplus"染色单元(AmershamBiosciences,Piscataway,NJ,USA)上对染色禾口脱色进一步优化以改善再现性和自动化。在MOLECULARDYNAMICSSTORM860成像系统(AmershamBiosciences,Piscataway,NJ,USA)上进行扫描,使用蓝色荧光,像素大小200iim,光电倍增管增益800V,以获得经过荧光染色的SDS-PAGE凝胶的图像。用IMAGEQUANT⑧软件第5版(AmershamBiosciences,Piscataway,NJ,USA)观察和调整图像。进一步将凝胶在使用橙色滤光片的DARKREADER(g)蓝光透照仪上可视化。用2mmACU-PUNCH⑧活检冲孔器(AcudermInc.,Ft.Lauderdale,FL,USA)切出观察到的蛋白凝胶斑点,保存在预先用含0.1%三氟乙酸(TFA)的60%乙腈洗涤、再用HPLC级水洗涤过两次的96孔板中。经过染色的二维凝胶斑点在预洗过的平板上的25-50ml的水中保存于_201:直到消化。凝胶内多肽消化用于肽测序.使用MULTIPROBE11液体操作机器人(PerkinElmerLifeandAnalyticalSciences,Boston,MA,USA)进行凝胶内消化。将含有感兴趣多肽的二维凝胶斑点用50iU含lOmM二硫苏糖醇(DTT)的100mM碳酸氢铵、pH8.0室温还原30分钟。还原之后,将凝胶片用50ill含55mM碘乙酰胺的lOOmM碳酸氢铵、pH8.0烷基化20分钟。让干燥的凝胶片在组成为6ng测序级胰蛋白酶(Promega,Madison,WI,USA)/iU50mM碳酸氢铵pH8的胰蛋白酶消化溶液中室温溶胀30分钟,然后在4(TC消化8小时。上述每个反应步骤之后都按照生产商的标准规程用合适的溶液进行多次洗涤和预洗涤。在反应与反应之间用50iU乙腈使凝胶脱水,在步骤和步骤之间将凝胶片风干。用含1^甲酸/2^乙腈的HPLC级水抽提肽两次,历时30分钟。将肽抽提液转移到已冷却至10-15°C的THERMO-FAST96孔带裙边小规格PCR平板(skirtedPCRlowprofileplate)(ABGene,Rochester,NY,USA)中并盖上96孑L板盖(PerkinElmerLifeandAnalyticalSciences,Boston,MA,USA)以防止蒸发。进一步将平板保存在4。C直到能够进行质谱分析。采用串联质谱的肽测序.对于采用串联质谱的肽测序,使用Q-TOFMICRO混合正交四极飞行时间质谱仪(WATERSMICROMASSMSTechnol0gies,Milford,MA,USA)进行LC-MS/MS分析。Q-TOFMICRO质谱仪配置有ULTIMATE毛细管和纳米流HPLC系统(Dionex,Sunnyvale,CA,USA),该系统耦联于FAMOS微型自动采样器(Dionex,Sunnyvale,CA,USA)和SWITCHOSII柱切换装置(Dionex,Sunnyvale,CA,USA)用于样品的浓縮和脱盐。将6iU自凝胶内消化回收的肽溶液加载到设置于注射环中的保护柱(300iimIDx5cm,C18PEPMAP,Dionex,Sunnyvale,CA,USA)上,利用SWITCHOSII泵(Dionex,Sunnyvale,CA,USA)用含0.1%甲酸的水以40yl/min洗涤2分钟。在一根75iimIDxl5cm、C18、3iim、100APEPMAP⑧纳米流融合型毛细管柱(nanoflowfusedcapillarycol醫)(Dio證,Sunnyvale,CA,USA)上分离肽,其中流速为175nl/min,来自用NAN-75校准器(Dionex,Sunnyvale,CA,USA)产生的175iU/min的分流。线性洗脱梯度为从含5%乙腈到含60%乙腈的0.1%甲酸,在45分钟的时间段内施加。对柱洗脱液在215nm进行监测,并将其通过设置在纳米喷射界面上的电喷射离子源引入Q-TOFMICRO质谱仪中。质谱仪完全由微处理器控制,使用MASSLYNXTM软件第3.5版(WATERSMICROMASSMSTechnologies,Milford,MA,USA)。数据获取在全范围扫描(surveyscan)模式下进行,质量范围从50-2000m/z,设有从MS到MS/MS的切换标准,采纳大于10.0个离子/秒的离子强度及+2、+3和+4的电荷状态。能够获得多达4个共洗脱类型的扫描时间1.9秒、扫描间隔时间0.1秒的分析谱。典型地使用65伏的锥孔电压(conevoltage),并对碰撞能量(collisionenergy)编程使其依照洗脱肽的质量和电荷状态在10-60伏的范围内变化。将所得的多个谱合并、平滑化、并自动集中生成一个峰列表。利用R0TEINLYNXGlobalServer1.1软件(:WATERSMICROMASSMSTechnologies,Milford,MA,USA)将所得的峰列表对选定的数据库进行搜索。对PROTEINLYNXTM检索结果进行评估,对于未鉴定的蛋白通过评估每个感兴趣离子的MS/MS谱加以进一步分析,并通过鉴定y和b离子序列并将质量差与合适的氨基酸匹配来确定从头序列。将一个对应于近似分子量40kDa、近似等电点4.5的2D凝胶点用胰蛋白酶进行凝胶内消化,进行如所述的从头测序。一个431.782m/z的二价电荷胰蛋白酶肽离子被确定为Gly-Pro-[Ile/Leu]-Ala-Tyr-[Ile-Leu]-Lys(SEQIDNO:2的氨基酸98-105)。另一个570.976m/z的二价电荷胰蛋白酶肽离子被确定为His-Thr-[Ile/Leu]-Thr-Ser-Gly-Pro-Asp-Asp-Val-Met-Asp-Ala-Ser-His-Lys(SEQIDNO:2的氨基酸82-97)。第三个825.9517的二价电荷胰蛋白酶肽离子被确定为Val-Asp-Asp-Ala-[Ile/Leu]-Thr-Asp-Thr-Gly-[Ile/Leu]-Gly-Gly-Gly-Trp-Phe-Lys(SEQIDNO:2的氨基酸107-122)。实施例2:表达序列标签(EST)cDNA文库构建用来自土生梭孢壳NRRL8126的24小时液体培养物(50ml添加了1%葡萄糖的NNCYPmod,于250ml烧瓶中45。C温育,200rpm)的2ml等份试样接种装有100ml添加了2%SIGMACELLType20纤维素的NNCYPmod培养基的500ml烧瓶。培养物在45°C、200rpm温育3天。用带有玻璃纤维预滤器(Nalgene,RochesterNY,USA)的布氏漏斗过滤收集菌丝体,用10mMTris-HCl-lmMEDTApH8(TE)洗涤两次,然后在液氮中速冻。用下述方法收集总RNA。将冷冻的土生梭孢壳NRRL8126菌丝体在电动咖啡磨中磨碎。将磨碎的材料在50mlFALCON⑧管中以1:1v/v与20mlFenazo1(Ambion,Inc.,Austin,TX,USA)混合。一旦菌丝体被悬浮,即用氯仿抽提它们,再用苯酚_氯仿_异戊醇的25:24:1v/v/v混合物抽提3次。从所得的水相中通过添加1/10体积的3M乙酸钠pH5.2和1.25倍体积的异丙醇将RNA沉淀出来。在12,000xgfC离心30分钟收集沉淀的RNA。最终的离心沉淀用冷的70%乙醇洗涤、风干、并重悬于500ml用焦碳酸二乙酯处理过的水(DEPC水)中。用2100Bioanalyzer(生物分析仪)(AgilentTechnologies,Inc.,PaloAlto,CA,USA)评估纯化的RNA的数量和质量。借助POLY(A)PURISTMAGKit(Ambion,Inc.,Austin,TX,USA),依照供应商的说明,从360yg总RNA中分离出聚腺苷酸化mRNA。为了产生cDNA文库,采用CLONEMINERKit(Invitrogen,Carlsbad,CA,USA)来构建不需要使用限制酶克隆的定向文库,从而减少嵌合克隆的数目和大小偏好。为了保证cDNA的成功合成,用两种不同浓度的mRNA(2.2禾P4.4iigpoly(A)+mRNA)平行进行两个反应。将mRNA样品与Biotin-attB2-01igo(dt)引物(CLONEMINERKit,Invitrogen,Carlsbad,CA,USA),IX第一链缓冲液(Invitrogen,Carlsbad,CA,USA),2ii10.1M二硫苏糖醇(DTT),10mM每种dNTP、以及水混合至终体积分别为18和16yl。小心地混合反应混合物,然后加入2ill和4illSUPERSCRIPT逆转录酶(Invitrogen,Carlsbad,CA,USA),45。C温育60分钟以合成第一互补链。第二链合成是向每个第一链反应加入30ii15X第二链缓冲液(Invitrogen,Carlsbad,CA,USA)、3ii1的10mM各种dNTP、10单位大肠杆菌DNA连接酶(Invitrogen,Carlsbad,CA,USA),40单位大肠杆菌DNA聚合酶I(Invitrogen,Carlsbad,CA,USA),和2单位的大肠杆菌RNaseH(Invitrogen,Carlsbad,CA,USA),总体积为150yl。然后在16"将混合物温育2小时。在2小时温育之后将2ii1T4DNA聚合酶(Invitrogen,Carlsbad,CA,USA)加入每个反应中,16。C温育5分钟以生成平末端cDNA(bunt-endedcDNA)。对cDNA反应物用苯酚_氯仿_异戊醇25:24:1v/v/v混合物抽提,并在20iig糖原、120ii15M乙酸铵及660乙醇的存在下沉淀。12,OOOxg4。C离心30分钟后用冷70%乙醇洗涤cDNA离心沉淀,真空干燥2_3分钟,并重悬于18iUDEPC水中。向每个重悬的cDNA样品中加入105X衔接缓冲液(adaptedbuffer)、10iig的每种attBl衔接子(CLONEMINERKit中提供)、7ii10.1MDTT、和5单位T4DNA连接酶。将连接反应物在16。C温育过夜。过量的衔接子通过用lmlSEPHACRYLS-500HR树脂(AmershamBiosciences,Piscataway,NJ,USA)进行大小排阻层析来予以去除。根据试剂盒的说明收集柱级分,将第3-14个级分用AGILENT⑧2100Bioanalyzer进行分析来确定attBl衔接子开始被洗脱的级分。该分析显示衔接子大约在第10或11个级分开始被洗脱。第一文库合并了第6-11个级分,第二文库合并了第4-11个级分。依照GATEWAY⑧技术(Invitrogen,Carlsbad,CA,USA)通过同源DNA重组来进行cDNA克隆,使用BPCLONASE(Invitrogen,Carlsbad,CA,USA)作为重组酶。每个BPCL0NASETM重组反应物含有大约70ng被attB侧翼包围的cDNA、250ngpDONR222、2iU5XBPCL0NASETM缓冲液、2iUTE和3iUBPCL0NASE。将重组反应在25。C温育过夜。然后将热灭活的BP重组反应物分成6个等份,电穿孔到ELECTROMAXDH10B电感受态细胞(Invitrogen,Carlsbad,CA,USA)中,其中电穿孔使用GENEPULSERIIElectroporationSystem(GENEPULSERII电穿孔系统)(Bio-Rad,Hercules,CA,USA),参数如下电压2.0kV,电阻200Q,电容25iiF。将经过电穿孔的细胞重悬在lmlSOC培养基中,在恒定振荡(200rpm)下于37。C温育60分钟。温育期之后,将经转化的细胞合并,并以l:l与冷冻培养基混合。取出200iU等份用于实验室滴定,然后将每个文库剩余的部分等份分到1.8ml冷冻管(WheatonScienceProducts,Millville,NJ,USA)中,-80。C冷冻保存。每个文库制备了四个系列稀释度1/100、1/1000、1/104、1/105。从每个稀释度取100ii1涂布到每ml添加有50iig卡那霉素的150mmLB平板上,37"温育过夜。计算每个稀释物平板上菌落的数目,用它来计算每个文库中转化子的总数。第一文库显示有大约540万个独立克隆,第二文库显示有大约900万个独立克隆。实施例3:模板制备和cDNA克隆的核苷酸测序将来自两个文库的等份试样混合并涂布到每ml添加有50iig卡那霉素的25x25cmLB平板上。借助QPixRobot(GenetixInc.,Boston,MA,USA)将菌落个体排列(array)到含100ill每ml添加有50iig卡那霉素的LB培养基的96孔板上。对于总共4320个克隆个体,获得了45个96孔板。将这些平板37t:、200rpm振荡下温育过夜。温育之后,向每个孔里加lOOii1无菌50%甘油。借助一种96针工具(Boekel,Feasterville,PA,USA)将转化子影印到第二组深盘型(de印-dish)96孔微量培养板(AdvancedGeneticTechnologiesCorporation,Gaithersburg,MD,USA)中,后者每孑L中含有lml添力口了50ug/ml卡那霉素的MAGNIFICENTBROTH(MacConne11Research,SanDiego,CA,USA)。将第一组微量滴定板冷冻保存在-8(TC。将第二组深盘型平板在回转摇床上剧烈振荡(300rpm)下37t:温育过夜。为了防止洒出和交叉污染,且容许充分的通气,第二组的每个培养板都用聚丙條垫板(AdvancedGeneticTechnologiesCorporation,Gaithersburg,MD,USA)禾口塑茅斗微量滴定盘盖加以覆盖。用Robot-Smart384(丽GBiotechInc.,HighPoint,NC,USA)禾口MONTAGEPlasmidMinipr印96Kit(MONTAGE质粒小量制备96型试剂盒)(Millipore,Billerica,MA,USA)制备质粒DNA。测序反应使用BIGDYE⑧Terminatorv3.0ReadyReactionCycleSequencingKit(BIGDYE⑧终止物v3.0就绪反应循环测序试剂盒)(AppliedBiosystems,Inc.,FosterCity,CA,USA),采用终止物化学(terminatorchemistry)(Giesecke等,1992,JournalofVirologyMethods38:47—60)禾口如下所示的M13Forward(正向)(一20)测序引物进行。5'-GTAAAACGACGGCCAG-3'(SEQIDNO:3)测序反应使用Robot-Smart384(丽GBiotechInc.,HighPoint,NC,USA)以384孑L规格进行,并用MULTISCREENSeq384SequencingClean-upKit(MULTISCREENSeq384测序清洁试剂盒)(Mi11ipore,Bi1lerica,MA,USA)去除终止物。反应物包含6ill质粒DNA和4ill测序预混剂,其中预混剂含1yl5X测序缓冲液(Millipore,Billerica,MA,USA)、lii1BIGDYE⑧终止物(AppliedBiosystems,Inc.,FosterCity,CA,USA)、1.6皮摩尔M13正向引物和1ii1水。用ABIPRISM3700DNASequencer(ABIPRISM3700DNA测序仪)(AppliedBiosystems,FosterCity,CA,USA)进行单程(Single-pass)DNA测序。实施例4:cDNA克隆的DNA序列数据的分析借助PHRED/PHRAP软件(UniversityofWashington,Seattle,WA,USA)进行碱基判定(basecalling)、特性值指定(qualityvalueassignment)禾口载体修剪(vectortrimming)。用TranscriptAssemblerv.2.6.2.软件(Paracel,Inc.,Pasadena,CA,USA)对EST进行聚类分析。对EST聚类的分析显示有395个独立的簇。将组装的EST序列面向多个数据库(如PIR)进行序列同源性分析,该分析通过Blastx程序(Altschulet.al.,1990,J.Mol.Biol.215:403-410)在一个32节点的Linux集群(Paracel,Inc.,Pasadena,CA,USA)上实施,使用BL0SUM62矩阵(Henikoff,1992,Proc.Natl.Acad.Sci.USA89:10915-10919)。它们中的246个命中了公共或专有蛋白数据库中的已知基因,149个在这些数据库中没有显著的命中。在这246个基因中,有13个命中了已知的糖基水解酶基因。实施例5:编码具有纤维素分解增强活性的家族61多肽(GH61F)的cDNA克隆的鉴定首先根据其与一种来自粗糙脉孢菌的家族61蛋白(UniProtQ7S439)的同一性鉴定了一个编码具有纤维素分解增强活性的家族61多肽(GH61F)的cDNA克隆。该初始分析显示这两种蛋白质在蛋白质水平上有57.67%的同一性,分布在一段211个氨基酸(663个碱基对)的序列上。在该初始分析之后,从原始的冻存平板上取得克隆Tterl8A8,在添加了50yg/ml卡那霉素的LB平板上划线。将平板37t:温育过夜,第二天用来自平板上的一个单菌落接种添加了50iig/ml卡那霉素的3mlLB。将该液体培养物37。C温育过夜,用BIOROBOT⑧9600(QIAGENInc.,Valencia,CA,USA)制备质粒DNA。利用上文所述的BIGDYE⑧终止物化学对克隆Tter08C4质粒DNA再次测序,使用所述M13正向引物及如下所示的Poly-T引物来对该克隆的3'端测序。5'-TTTTTTTTTTTTTTTTTTTTTTTVN-3'(SEQIDN0:4)其中V=G、A、C;N=G、A、C、T对新序列信息的Blastp同源性分析显示,由克隆Tterl8A8编码的蛋白质与一种粗糙脉孢菌假定蛋白NCU02240.l(UniRefQ7S439)相似。这两种蛋白有74%同一性,分布在一段316个氨基酸的序列上。用Interproscan禾呈序(Zdobnov禾口Apweiler,2001,Bioinformatics17:847-848)分析克隆18A8的推定蛋白质序列显示,克隆18A8编码的基因含有家族61蛋白的序列签名。该序列签名名称为Pfam模式F03443(Bateman,A.等,2002,NucleicAcidsResearch30:276-280),在距离起始氨基酸甲硫氨酸119个氨基酸处被发现,这确证了克隆Tterl8A8编码土生梭孢壳家族61蛋白。该分析还表明该蛋白包含一个真菌纤维素结合域(34个氨基酸长),其位于距离起始氨基酸甲硫氨酸283个氨基酸处。cDNA序列(SEQIDN0:1)和推定的氨基酸序列(SEQIDNO:2)如图1所示。该cDNA克隆编码317个氨基酸的多肽。该基因的cDNA克隆的%G+C含量为64.9%,成熟蛋白编码区(SEQIDNO:1的核苷酸46-955)的%G+C含量也是64.9%。用SignalP软件程序(Nielsen等,1997,ProteinEngineering10:1-6)预测了一条15个残基的信号肽。预测的成熟蛋白含302个氨基酸,分子量为31.14kDa。使用ClustalW法(Higgins,1989,同上文)确定了家族61序列的比较性比对,其中使用矢量NTIAdvance10.3软件(Invitrogen,Carlsbad,CA,USA)的AlignX模i央,使用blos咖62mt2评分矩阵和下列多重比对参数K-元组大小(K-tuplesize)1;最佳对角线(bestdiagonals)5;窗口大小(windowsize)5;缺口罚分(gappenalty)5;缺口形成罚分(g即openingpenalty)10;缺口延伸罚分(g即extensionpenalty)0.1。该比对显示成熟土生梭孢壳gh61f基因的推定氨基酸序列与具有纤维素分解增强活性的土生梭孢壳Cel61G多肽(W02005/074647)的成熟区域具有43%的同一性。确认了克隆Tterl8A8的身份之后,将一份O.5iU的来自该克隆的质粒DNA(命名为pTer61F,见图2)转移到一小管ONESHOT⑧大肠杆菌T0P10细胞(Invitrogen,Carlsbad,CA,USA)中,轻柔混合,在冰上温育10分钟。然后将细胞42。C热激30秒,再在冰上温育2分钟。将细胞重悬在250ii1S0C培养基中,在恒定震荡(200rpm)下37。C温育60分钟。温育期之后,取两个30ii1等份涂布在添加了50iig/ml卡那霉素的LB平板上,37t:温育过夜。第二天挑取单菌落,在含有约1.5ml添加了50iig/ml卡那霉素的LB琼脂糖的1.8ml冷冻小管上划线。小管用PETRISEAL(DiversifiedBiotech,Boston,MA,USA)密封,保藏于北方区域研究中心农业研究机构专利培养物保藏中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter),1815UniversityStreet,Peoria,IL,USA,保藏号为NRRLB-50044,保藏日为2007年5月25日。实施例6:克隆家族gh61f基因到米曲霉表达载体中设计了两条合成寡核苷酸引物(如下所示)来从编码家族GH61F具有纤维素分解增强活性的多肽的土生梭孢壳ESTTterl8A8PCR扩增全长可读框。使用IN-FUSIONPCRCloningKit(IN-FUSIONPCR克隆试剂盒)(BDBiosciences,PaloAlto,CA,USA)将该片段直接克隆到质粒pAlLo2(W02004/099228)中。正向引物5'-ACTGGATTTACCATGAAGGGCCTCAGCCTCCTCG-3'(SEQIDNO:5)反向引物5'-TCACCTCTAGTTAATTAATTACTGGCATTGCGAGTAATAG-3'(SEQIDNO:6)加粗的字母代表编码序列。其余的序列与pAlLo2的插入位点相比含有序列同一性。将上述引物各50皮摩尔用于终体积为50iU的PCR反应物中,其中包含50ngpTterl8A8DNA;1XPfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA);6ii1dATP、dTTP、dGTP及dCTP的10mM合剂;2.5单位PLATINUMPfxDNA聚合酶(Invitrogen、Carlsbad、CA、USA);lyl50mMMgS04;和5110XpCRxEnhancerSolution(加强溶液)(Invitrogen,Carlsbad,CA,USA)。用如下编程的EPPENDORF⑧MASTERCYCLER⑧5333(EppendorfScientific,Inc.,Westbury,NY,USA)扩增该片段98。C2分钟循环一次,而后94t:30秒、62.1°C30秒、68t:1.0分钟循环35次。35个循环后,将反应物在68°C温育10分钟,然后在l(TC冷却备用。使用40mMTris碱_20mM乙酸钠-ImMEDTA二钠(TAE)缓冲液和0.1g/ml的溴化乙锭在0.8XSEAKEM⑧GTG⑧琼脂糖凝胶(CambrexBioproducts,EastRutherford,NJ,USA)上分离了一个984bp的PCR反应产物。借助DARKREADER(ClareChemicalResearch,Dolores,C0,USA)显现DNA条带以避免UV诱发的突变。用一次性剃刀片切下DNA条带,用UL丁RAFREE⑧-DA转杯(Millipore,Billerica,MA,USA)根据制造商的说明加以纯化。通过NcoI和PacI消化来使质粒pAlLo2线性化。通过如上所述进行的凝胶电泳和超滤来纯化片段。用IN-FUSIONPCRCloningKit将纯化后的PCR片段克隆到经过线性化和纯化的pAlLo2中。反应物(201)包含211XIN-FUSION⑧缓冲液、21IXBSA、11IN-FUSION⑧酶(1:10稀释的)、100ng经NcoI和PacI消化的pAlLo2,和100ng土生梭孢壳gh61f纯化PCR产物。将反应物在室温温育30分钟。使用该反应物的2y1样品依照制造商的说明转化大肠杆菌XL10SOLOPACKGold细胞(Stratagene,LaJolla,CA,USA)。经过一段恢复期之后,将来自转化反应物的两个100等分试样涂布到添加有100iig/ml氨苄青霉素的150mm2XYT平板上。将平板37。C温育过夜。从选择平板上收集4个推定的重组克隆,从每一个克隆使用BIOROBOT⑧9600(QIAGENInc.,Valencia,CA,USA)制备质粒DNA。通过PstI限制性消化分析这些克隆。然后对两个具有预期的限制性消化模式的克隆进行测序来确认克隆的插入序列中没有突变存在。测序用ABIPRISM3130x1DNASequencer(AppliedBiosystems,FosterCity,CA,USA)进行。选择第3号克隆并命名为pAlLo23(图3)。实施例7:米曲霉JaL250中土生梭孢壳家族gh61f基因的表达根据Christensen等,1988,Bio/Technology6:1419-1422的方法制备米曲霉JaL250(W099/61651)原生质体。用5微克的pAlLo23(以及作为质粒对照的pAlLo2)转化米曲霉JaL250原生质体。用pAlLo22转化米曲霉JaL250产生了大约50个转化子。将8个转化子分离到单独的PDA平板上,在34"温育5天。汇合孢子平板用5ml0.01%TWEEN80洗涤,用孢子悬液接种125ml玻璃摇瓶中的25mlMDU2BP培养基。转化子培养物在200rpm恒定震荡下于34。C温育。接种后第五天,将培养物6000xg离心,收集它们的上清液。将每种上清液7.5微升与等体积的2X上样缓冲液(10%13-巯基乙醇)混合,上样到1.5mm8%-16%Tris-甘氨酸SDS-PAGE凝胶上,用BI0-SAFETMCoomassieBlueG250(Bio-Rad,Hercules,CA,USA)染色。培养液的SDS-PAGE概貌显示,8个转化子中的7个具有一条大约45kDa的新蛋白条带。选择了第4号转化子用于进一步研究,并将其命名为米曲霉JaL250AlLo23。实施例8:米曲霉JaL250AlLo23的发酵将100ml摇瓶培养基加入500ml摇瓶中。摇瓶培养基的组成为每升50g蔗糖、10gKH2P04、0.5gCaCl2、2gMgS04*7H20、2gK2S04、2g尿素、10g酵母提取物、2g柠檬酸、和0.5ml痕量金属溶液。痕量金属溶液组成为每升13.8gFeS04*7H20、14.3gZnS047H20、8.5gMnS04*H20、2.5gCuS04*51120和3g柠檬酸。在所述摇瓶中接种两个来自米曲霉JaL250AlLo23固体平板培养物的琼脂块,在回转摇床上200rpm34。C温育24小时。将50ml摇瓶培养液接种到含1.8升发酵分批培养基的3升发酵容器,所述发酵分批培养基的组成为每升10g酵母提取物、24g蔗糖、5g(NH山S(V2gKH2P04、0.5gCaCl22H20、2gMgS04.7H20、lg柠檬酸、2gK2S04、0.5ml消泡齐U、和0.5ml痕量金属溶液。痕量金属溶液组成为每升13.8gFeS047H20、14.3gZnS047H20、8.5gMnS04H20、2.5gCuS0^5H20、和3g柠檬酸。发酵补料培养基组成为麦芽糖和消泡剂。发酵补料培养基以0-4.4g/l/hr的速率在185小时的时间内定量添加。发酵容器保持在34。C的温度,pH控制在6.1+/-0.1的固定点。以lvvm的速率向容器中通入空气,并用转速为1100-1300rpm的Rushton叶轮搅拌发酵液。发酵结束时,从容器中收集所有发酵液,3000xg离心去除生物质。上清液无菌过滤后保存在35-40°C。实施例9:pMJ04表达载体的构建使用如下所示的引物993429(反义)和993428(有义)从里氏木霉RutC30基因组DNAPCR扩增里氏木霉外切纤维二糖水解酶1基因(cbhl,CEL7A)终止子,构建了表达载56体pMJ04。经过工程改造,所述反义引物在5'末端具有一个PacI位点,有义引物在3'末端具有一个Spel位点。引物993429(反义):5'-AACGTTAATTAAGGAATCGTTTTGTGTTT-3,(SEQIDNO:7)引物993428(有义):5'-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3,(SEQIDNO:8)用DNEASY⑧PlantMaxiKit(QIAGENInc.,Valencia,CA,USA)分离里氏木霉RutC30基因组DNA。扩增反应物(50ill)的组成为IXThermoPolReactionBuffer(ThermoPol反应缓冲液)(NewEnglandBiolabs,Beverly,MA,USA)、0.3mMdNTP、100ng里氏木霉RutC30基因组DNA、0.3iiM引物993429、0.3iiM引物993428、和2单位的VentDNA聚合酶(NewEnglandBiolabs,Beverly,MA,USA)。将这些反应物在如下编程的EPPENDORFMASTERCYCLER5333中温育进行94。C30秒、50。C30秒、72。C60秒的循环5次,然后进行94°C30秒、65。C30秒、72。C120秒的循环25次(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下229bp的产物条带,使用QIAQUICKGelExtractionKit(:QIAQUICK⑧凝胶提取试剂盒)(QIAGENInc.,Valencia,CA,USA)依照生产商的说明进行纯化。所得的PCR片段用Pad和Spel消化后,用RapidLigationKit(快速连接试剂盒)(Roche,Indian即olis,IN,USA)连接到经相同的限制酶消化过的pAlLol(WO05/067531)中,产生pMJ04(图4)。实施例10:pCaHj568的构建从pCaHjl70(美国专利5,763,254)和pMT2188出发构建质粒pCaHj568。质粒pCaHj170包含特异腐质霉内切葡聚糖酶V(CEL45A)全长编码区(SEQIDN0:9,编码SEQIDNO:10的氨基酸序列)。pMT2188的构建最先是用如下所示的引物142779和142780从pCaHj483(W098/00529)PCR扩增出pUC19复制起点。引物142780在PCR片段中引入Bbul位点。142779:5'-TTGAATTGAAAATAGATTGATTTAAAACTTC-3,(SEQIDNO:11)142780:5'-TTGCATGCGTAATCATGGTCATAGC-3,(SEQIDNO:12)该扩增使用EXPANDPCRSystem(RocheMolecularBiochemicals,Basel,Switzerland)依照制造商的说明进行。在琼脂糖凝胶上分离PCR产物,使用JetquickGelExtractionSpinKit(离心式快速凝胶提取试剂盒)(Ge謹ed,Wielandstr,Germany)分离并纯化出一个1160bp的片段。使用如下所示的引物140288和142778,利用EXPAND⑧PCRSystem从通用酿酒酵母克隆载体pYES2(Invitrogen,Carlsbad,CA,USA)中扩增出URA3基因。引物140288在PCR片段中引入一个EcoRI位点。140288:5'-TTGAATTCATGGGTAATAACTGATAT-3'(SEQIDNO:13)142778:5'-AAATCAATCTATTTTCAATTCAATTCATCATT-3'(SEQIDNO:14)在琼脂糖凝胶上分离PCR产物,使用JetquickGelExtractionSpinKit(离心式快速凝胶提取试剂盒)分离并纯化出一个U26bp的片段。通过混合所述两个PCR片段并用如上所示的引物142780和140288依照重叠剪接(overl即splicing)法(Horton等,1989,Gene77:61-68)进行扩增,将这两个片段融合起来。在琼脂糖凝胶上分离PCR产物,使用JetquickGelExtractionSpinKit(离心式快速凝胶提取试剂盒)分离并纯化出一个2263bp的片段。所得的片段用EcoRI和Bbul消化,并使用标准规程连接到用相同的限制酶消化过的pCaHj483的最大片段中。将连接混合物转化到依照Mandel和Higa,1970,J.Mol.Biol.45:154的方法制成感受态的pyrF阴性大肠杆菌菌株DB6507(ATCC35673)中。在每升添加了lg酪蛋白氨基酸、500iig硫胺素和10mg卡那霉素的M9培养基(Sambrook等,1989,MolecularCloning,ALaboratoryManual,2ndedition,ColdSpringHarborLaboratoryPress)上选择转化子。分离了来自于一个转化子的质粒,命名为pCaHj527(图5)。使用EXPAND⑧PCRSystem并依照制造商的说明,通过PCR对pCaHj527上存在的NA2-tpi启动子进行定点诱变。利用如下所示的诱变引物141223,将核苷酸134-144从GTACTAAAACC(SEQIDNO:15)转变为CCGTTAAATTT(SEQIDNO:16)。引物141223:5'-GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3,(SEQIDNO:17)利用如下所示的诱变引物141222,将核苷酸423-436从ATGCAATTTAAACT(SEQIDNO:18)转变为CGGCAATTTAACGG(SEQIDNO:19)。引物141222:5'-GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3,(SEQIDNO:20)[O459]所得的质粒命名为pMT2188(图6)。将特异腐质霉内切葡聚糖酶V编码区从pCaHjl70作为BamHI-SalI片段转移到用BamHI和XhoI消化过的pMT2188中,生成pCaHj568(图7)。质粒pCaHj568包含与特异腐质霉内切葡聚糖酶V全长编码序列可操作地连接的突变的NA2-tpi启动子。实施例11:pMJ05的构建质粒pMJ05的构建是通过使用如下所示的引物HiEGV-F和HiEGV-R从pCaHj568PCR扩增出915bp的特异腐质霉内切葡聚糖酶V全长编码区。HiEGV-F(有义)5'-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3'(SEQIDNO:21)HiEGV-R(反义)5'-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3'(SEQIDNO:22)扩增反应物(50ii1)的组成为IXThermoPolReactionBuffer(ThermoPol反应缓冲液)、0.3mMd證、10ng/ii1pCaHj568、0.3iiMHiEGV-F引物、0.3yMHiEGV-R引物、和2单位VentDNA聚合酶。将这些反应物在如下编程的EPPENDORFMASTERCYCLER5333中温育进行94°C30秒、5(TC30秒、72t:60秒的循环5次,然后进行94°C30秒、65。C30秒、72。C120秒的循环25次(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下937bp的产物条带,使用QIAQUICKGelExtractionKit依照生产商的说明进行纯化。用937bp的纯化片段作为模板DNA继续用下述引物进行扩增HiEGV-R(反义)5'-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3'(SEQIDNO:23)HiEGV-F-overl即(有义)5,-ACCGCGGACTGCGCATCATGCGTTCCTCCCCCCTCC-3,(SEQIDNO:24)斜体表示的引物序列与里氏木霉纤维二糖水解酶I基因(cbhl)启动子的17bp同源,下划线的引物序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间36bp的重叠使得包含里氏木霉cbhl启动子的994bp片段能够精确的融合于包含特异腐质霉内切葡聚糖酶V编码区的918bp片段。扩增反应物(50ill)的组成为IXThermoPolReactionBuffer(ThermoPol反应缓冲液)、0.3mMdNTP、1ii1纯化的937bpPCR片段、0.3iiMHiEGV-F-overl即引物、0.3iiMHiEGV-R引物、和2单位VentDNA聚合酶。将这些反应物在如下编程的EPPENDORF⑧MASTERCYCLER5333中温育进行94。C30秒、50。C30秒、72。C60秒的循环5次,然后进行94°C30秒、65。C30秒、72。C120秒的循环25次(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下945bp的产物条带,使用QIAQUICKGelExtractionKit依照生产商的说明进行纯化。另外使用如下所示的引物(该有义引物经工程改造在5'末端具有一个Sail限制位点)进行PCR,来从里氏木霉RutC30基因组DNA扩增里氏木霉cbhl启动子序列,该序列从所述基因的ATG起始密码子上游994bp开始延伸。里氏木霉RutC30基因组DNA是用DNEASYPlantMaxiKit分离的。TrCBHIpro-F(有义)5'-AAACGTCGACCGAATGTAGGATTGTTATC-3,(SEQIDNO:25)TrCBHIpro-R(反义)5'-GATGCGCAGTCCGCGGT-3,(SEQIDNO:26)扩增反应物(50ii1)的组成为IXThermoPolReactionBuffer(ThermoPol反应缓冲液)、0.3mMdNTP、lOOng/ii1里氏木霉RutC30基因组DNA、0.3iiMTrCBHIpro-F引物、0.3iiMTrCBHIpro-R引物、和2单位VentDNA聚合酶。将这些反应物在如下编程的EPPENDORFMASTERCYCLER5333中温育94°C30秒、55°C30秒、72°C120秒的循环30次(最终延伸5分钟)。将反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下998bp的产物条带,使用QIAQUICK⑧GelExtractionKit(:QIAQUICK⑧凝胶提取试剂盒)依照生产商的说明进行纯化。用纯化的998bpPCR片段作为模板DNA继续用下述引物进行扩增。TrCBHIpro-F:5'-AAACGTCGACCGAATGTAGGATTGTTATC-3'(SEQIDNO:27)TrCBHIpro_R_overlap:5,-GGAGGGGGGAGGAACGCATGATGCGCAGTCCGCGGT-3,(SEQIDNO:28)斜体表示的序列与里氏木霉cbhl启动子的17bp同源,下划线的序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间36bp的重叠使得包含里氏木霉cbhl启动子的994bp片段能够精确的融合于包含特异腐质霉内切葡聚糖酶V全长编码区的918bp片段。扩增反应物(50ii1)的组成为IXThermoPolReactionBuffer(ThermoPol反应缓冲液)、0.3mMdNTP、lii1纯化的998bpPCR片段、0.3iiMTrCBHlpro-F引物、0.3yMTrCBHlpro-R-overl即引物、和2单位VentDNA聚合酶。将这些反应物在如下编程的EPPENDORFMASTERCYCLER5333中温育进行94°C30秒、50。C30秒、72。C60秒的循环5次,然后进行94°C30秒、65。C30秒、72。C120秒的循环25次(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1017bp的产物条带,使用QIAQUICK⑧GelExtractionKit(:QIAQUICK⑧凝胶提取试剂盒)依照生产商的说明进行纯化。用1017bp里氏木霉cbhl启动子PCR片段和945bp特异腐质霉内切葡聚糖酶VPCR片段作为模板DNA继续用下述引物进行扩增,以利用重叠PCR精确地将994bpcbhl启动子融合于918bp内切葡聚糖酶V全长编码区。TrCBHIpro-F:5'-AAACGTCGACCGAATGTAGGATTGTTATC-3,(SEQIDNO:29)HiEGV-R:5'-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3'(SEQIDNO:30)扩增反应物(50ii1)的组成为IXThermoPolReactionBuffer(ThermoPol反应缓冲液)、0.3mMdNTP、0.3iiMTrCBHlpro-F引物、0.3iiMHiEGV-R引物和2单位VentDNA聚合酶。将这些反应物在如下编程的EPPENDORF⑧MASTERCYCLER⑧5333中温育进行94。C30秒、50。C30秒、72。C60秒的循环5次,然后进行94°C30秒、65。C30秒、72t:120秒的循环25次(最终延伸5分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1926bp的产物条带,使用QIAQUICK⑧GelExtractionKit(QIAQUICK⑧凝胶提取试剂盒)依照生产商的说明进行纯化。将所得的1926bp片段使用ZEROBLUNTTOPOPCRCloningKit('ZEROBLUNTTOPOPCR克隆试剂盒)(Invitrogen,Carlsbad,CA,USA)依照制造商的规程克隆到pCR-Blunt-II-TOPO载体(Invitrogen,Carlsbad,CA,USA)中。所得的载体用NotI和SalI消化,使用QIAQUICKGelExtractionKit(QIAQUICK⑧凝胶提取试剂盒)凝胶纯化1926bp片段,然后使用T4DNA连接酶(Roche,Indianapolis,IN,USA)连接到pMJ04(其也用同样两种限制酶消化过)中,产生pMJ05(图8)。质粒pMJ05包含与特异腐质霉内切葡聚糖酶V全长编码序列可操作地连接的里氏木霉纤维二糖水解酶I启动子及终止子。实施例12:pSMail30表达载体的构建从作为模板的pJaL660(W02002/095014)用如下所示的引物993467(有义)和993456(反义)PCR扩增了米曲霉P_葡糖苷酶全长编码序列(cDNA序列SEQIDNO:31;推定的氨基酸序列SEQIDNO:32;大肠杆菌DSM14240)中从ATG起始密码子直到TAA终止密码子的2586bp的DNA片段。一个SpeI位点被工程构建到反义引物的5'末端以便于连接。斜体字的引物序列与里氏木霉cbhl启动子的24bp同源,下划线的序列与米曲霉P-葡糖苷酶编码区的22bp同源。引物993467:5,-ATAGTCAACCGCGGACTGCGCATCATGAAGCTTGGTTGGATCGAGG-3,(SEQIDNO:33)[O499]引物993456:5'-ACTAGTTTACTGGGCCTTAGGCAGCG-3,(SEQIDNO:34)扩增反应物(50ii1)的组成为Pfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA),0.25mMdNTP,lOngpJaL660,6.4iiM引物993467,3.2iiM引物993456,ImMMgCl2和2.5单位PfxDNA聚合酶(Invitrogen,Carlsbad,CA,USA)。将这些反应物在如下编程的EPPENDORFMASTERCYCLER5333中温育进行94°C60秒、55°C60秒、72t:180秒的循环30次(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下2586bp的产物条带,使用OIAQUICK⑧GelExtractionKit(:QIAQUICK⑧凝胶提取试剂盒)依照生产商的说明进行纯化。另外使用如下所示的引物993453(有义)和引物993463(反义)进行PCR,来扩增里氏木霉cbhl启动子序列(其从该基因ATG起始密码子上游lOOObp处开始延伸),产生一个1000bp的PCR片段。引物993453:5,-GTCGACTCGAAGCCCGAATGTAGGAT-3'(SEQIDNO:35)引物993463:5,-CCTCGATCCAACCAAGCTTCATGATGCGCAGTCCGCGGTTGACTA-3,(SEQIDNO:36)斜体表示的引物序列与里氏木霉cbhl启动子的24bp同源,下划线的引物序列与米曲霉P_葡糖苷酶全长编码区的22bp同源。启动子和编码序列之间46bp的重叠使得包含里氏木霉cbhl启动子的lOOObp片段能够精确的融合于包含米曲霉13-葡糖苷酶编码区的2586bp片段。扩增反应物(50iU)的组成为Pfx扩增缓冲液、0.25mMdNTP、lOOng里氏木霉RutC30基因组DNA、6.4iiM引物993453、3.2iiM引物993463、lmMMgCl2和2.5单位PfxDNA聚合酶。将这些反应物在如下编程的EPPENDORF⑧MASTERCYCLER⑧5333中温育进行94°C60秒、55t:60秒、72。C180秒的循环30次(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1000bp的产物条带,使用QIAQUICKGelExtractionKit(:QIAQUICK⑧凝胶提取试剂盒)依照生产商的说明进行纯化。用纯化的片段作为模板DNA,进一步通过使用上文所示的引物993453(有义)和引物993456(反义)的重叠PCR进行扩增,来将包含里氏木霉cbhl启动子的1000bp片段精确地融合于包含米曲霉P_葡糖苷酶全长编码区的2586bp片段。扩增反应物(50ii1)的组成为Pfx扩增缓冲液、0.25mMdNTP、6.4yM引物99353、3.2iiM引物993456、lmMMgCl2和2.5单位PfxDNA聚合酶。将这些反应物在如下编程的EPPENDORF⑧mastercycLER⑧5333中温育进行94"60秒、60。C60秒、72。C240秒的循环30次(最终延伸15分钟)。将所得的3586bp片段用SalI和SpeI消化,并连接到用同样两种限制酶消化过的pMJ04中,产生pSMail30(图9)。质粒pSMail30包含与米曲霉天然P_葡糖苷酶信号序列及编码序列(即全长米曲霉P-葡糖苷酶编码序列)可操作地连接的里氏木霉纤维二糖水解酶I基因启动子及终止子。实施例13:pSMail35的构建从作为模板的pJaL660利用如下所示的引物993728(有义)及引物993727(反义)PCR扩增出从Lys-20到TAA终止密码子的米曲霉P-葡糖苷酶成熟编码区(减去天然信号序列,见图10;SEQIDNO:37和38代表信号肽和它的编码序列)。引物993728:5'-TGCCGGTGTTGGCCCTTGCCAAGGATGATCTCGCGTACTCCC-3'(SEQIDNO:39)引物993727:5'-GACTAGTCTTACTGGGCCTTAGGCAGCG-3'(SEQIDNO:40)斜体字的序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源,下划线的序列与米曲霉P-葡糖苷酶编码区的22bp同源。将一个SpeI位点工程化到反义引物的5'端中。扩增反应物(50ii1)的组成为Pfx扩增缓冲液、0.25mMd證、10ng/iilpjal660、6.4iiM引物993728、3.2iiM引物993727、lmMMgCl^P2.5单位PfxDNA聚合酶。将这些反应物在如下编程的EPPENDORF⑧MASTERCYCLER⑧5333中温育进行94°C60秒、55°C60秒、72t:180秒的循环30次(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下2523bp的产物条带,使用QIAQUICK⑧GelExtractionKit(QIAQUICK⑧凝胶提取试剂盒)依照生产商的说明进行纯化。另外使用如下所示的引物993724(有义)和引物993729(反义)进行PCR扩增来扩增里氏木霉cbhl启动子的1000bp和特异腐质霉内切葡聚糖酶V信号序列的63bp(ATG起始密码子到Ala-21,图11,SEQIDNO:41和42)。引物993724:5,-ACGCGTCGACCGAATGTAGGATTGTTATCC-3'(SEQIDNO:43)引物993729:5,-GGGAGTACGCGAGATCATCCTTGGCAAGGGCCAACACCGGCA-3,(SEQIDNO:44)斜体字的引物序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源,下划线的引物序列与米曲霉P_葡糖苷酶编码区的22bp同源。用包含cbhl启动子控制下的特异腐质霉内切葡聚糖酶V编码区的质粒pMJ05作为模板,产生了一条包含里氏木霉cbhl启动子和特异腐质霉内切葡聚糖酶V信号序列片段的1063bp片段。里氏木霉cbhl启动子和特异腐质霉内切葡聚糖酶V信号序列与米曲霉P_葡糖苷酶成熟编码序列之间有42&。的重叠,以提供所述启动子与2523bp米曲霉13-葡糖苷酶编码区的ATG起始密码子之间的完美连结。扩增反应物(50ii1)的组成为Pfx扩增缓冲液、0.25mMd證、10ng/iilpMJ05、6.4iiM引物993728、3.2iiM引物993727、lmMMgCl^P2.5单位PfxDNA聚合酶。将这些反应物在如下编程的EPPENDORF⑧MASTERCYCLER⑧5333中温育进行94°C60秒、6260°C60秒、72t:240秒的循环30次(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下1063bp的产物条带,使用QIAQUICK⑧GelExtractionKit(QIAQUICK⑧凝胶提取试剂盒)依照生产商的说明进行纯化。用纯化的重叠片段作为模板,用如上所述的引物993724(有义)和引物993727(反义)进行扩增,通过重叠PCR将所述包含里氏木霉cbhl启动子和特异腐质霉内切葡聚糖酶V信号序列的1063bp片段精确地融合于所述包含米曲霉P-葡糖苷酶成熟编码区框的2523bp片段。扩增反应物(50ii1)的组成为Pfx扩增缓冲液、0.25mMdNTP、6.4yM引物993724、3.2iiM引物993727、lmMMgCl2和2.5单位PfxDNA聚合酶。将这些反应物在如下编程的EPPENDORF⑧MASTERCYCLER⑧5333中温育进行94。C60秒、60。C60秒、72°C240秒的循环30次(最终延伸15分钟)。反应产物在1.0%琼脂糖凝胶上用TAE缓冲液分离,从凝胶上切下3591bp的产物条带,使用QIAQUICK⑧GelExtractionKit(QIAQUICK⑧凝胶提取试剂盒)依照生产商的说明进行纯化。将所得的3591bp片段用SalI和SpeI消化,连接到用相同的限制酶消化过的pMJ04中产生pSMai135(图12)。质粒pSMail35包含可操作地连接于特异腐质霉内切葡聚糖酶v信号序列和米曲霉e-葡糖苷酶成熟编码序列的里氏木霉纤维二糖水解酶I基因启动子和终止子。实施例14:带有特异腐质霉内切葡聚糖酶V分泌序列的米曲霉P-葡糖苷酶的表达通过PEG-介导的转化(Penttila等,1987,Gene61155-164)将编码与特异腐质霉内切葡聚糖酶V分泌序列连接的成熟米曲霉P-葡糖苷酶的质粒pSMail35(图11)导入里氏木霉RutC30中。该质粒含有构巢曲霉amdS基因,使得转化子可以利用乙酰胺作为唯一氮源生长。将里氏木霉RutC30在25ml添加了2%(w/v)葡萄糖和10mM尿苷的YP培养基中27。C、90rpm条件下培养17个小时。用Vac誦DrivenDisposableFiltrationSystem(—次性真空驱动过滤系统)(Millipore,Bedford,MA,USA)过滤收集菌丝体,用去离子水和1.2M山梨醇各洗涤两次。将经过洗涤的菌丝体重悬在含15mg/mlGLUCANEX(NovozymesA/S,Bagsvard,Denmark)禾口0.36单位/ml壳多糖酶(SigmaChemicalCo.,St.Louis,MO,USA)的20ml1.2M山梨醇中,90rpm轻柔震荡下34。C温育15-25分钟来生成原生质体。400xg离心7分钟收集原生质体,用冷的1.2M山梨醇洗涤两次。原生质体用血细胞计数器计数后重悬于STC中至终浓度1X108个原生质体/ml。多余的原生质体在Cryo1CFreezingContainer(1C冷冻柜)(Nalgene,Rochester,NY,USA)中-80。C保存。将大约7iig经PmeI消化的pSMai135加入100ii1原生质体溶液中,轻柔混合,然后加入260ii1PEG缓冲液,混合,室温温育30分钟。然后加入STC(3ml),混合,将转化溶液涂布到使用构巢曲霉amdS选择的COVE平板上。将平板在2『C温育5_7天。将转化子分培到C0VE2平板上,使其在28t:生长。将用pSMail35获得的67个转化子(称为SMA135)分培到含有乙酰胺的新鲜平板上,让它们在28t:产生孢子7天。将这67个SMA135里氏木霉转化子在含25mlpH6.0纤维素酶诱导培养基的125ml带挡板烧瓶中培养,其中用所述转化子的孢子接种培养基,在28°C、200rpm条件下温育7天。用里氏木霉RutC30作为对照。在第7天取出培养液样品。将每种培养液lml在微量离心管中15,700xg离心5分钟,将上清液转移到新管中。样品保存在4t:直到进行酶测定。用对硝基苯基-P-D-吡喃葡萄糖苷作为底物测定上清液的P-葡糖苷酶活性,如下所述。|3-葡糖苷酶活性测定在环境温度下进行,使用25ii1等份的在50mM琥珀酸盐(succinate)pH5.0中1:10稀释过的培养上清液,在作为底物的200iUO.5mg/ml对硝基苯基-p-D-吡喃葡萄糖苷(溶于50mM琥珀酸盐pH5.0)中实施。温育15分钟后加入100iil1MTris-HClpH8.0终止反应,用分光光度计读取405nm吸光度。l个单位的P-葡糖苷酶活性对应于环境温度、pH5.0条件下每升每分钟产生liimol对硝基苯。用黑曲霉P-葡糖苷酶(NOVOZ预TM188,NovozymesA/S,Bagsvaerd,Denmark)作为酶标准品。若干个SMA135转化子显示了比里氏木霉RutC30高数倍的P-葡糖苷酶活性。转化子SMA135-04产生了最高的P-葡糖苷酶活性。用CRITERION系统(Bio-Rad,Hercules,CA,USA)使用CRITERIONTris-HCl(5%分离型)凝胶(Bio-Rad,Hercules,CA,USA)进行SDS-PAGE。将5ii1第7天上清液(见上文)重悬在2X浓度的LaemmliSampleBuffer(Laemmli样品缓冲液)(Bio-Rad,Hercules,CA,USA)中,在5%P_巯基乙醇存在下煮沸3分钟。将上清液样品加载到聚丙烯酰胺凝胶上,用IXTris/甘氨酸/SDS作为运行缓冲液(Bio-Rad,Hercules,CA,USA)进行电泳。所得的凝胶用BIO-SAFE(DCoomassieStain(考马斯染料)染色。总的说来,38个里氏木霉SMA135转化子中的26个产生了一个大约110kDa的蛋白质,其未见于作为对照的里氏木霉RutC30中。转化子里氏木霉SMA135-04产生的P-葡糖苷酶水平最高。实施例15:里氏木霉SMA135-04的发酵将100ml的下述摇瓶培养基加入500ml摇瓶中。摇瓶培养基的组成为每升20g葡萄糖、10g玉米浸浆固形物、1.45g(NH4)2S04、2.08gKH2P04、0.36gCaCl2、0.42gMgS047H20和0.42ml痕量金属溶液。痕量金属溶液的组成为每升216gFeCl3*6H20、58gZnS04*7H20、27gMnS04H20、10gCuS045H20、2.4gH3B03和336g拧檬酸。用来自里氏木霉SMA135-04固体平板培养物的两块琼脂块接种摇瓶,在回转摇床上200rpm2『C温育48小时。用50ml的该摇瓶培养液接种含1.8升发酵分批培养基(fermentationbatchmedium)的3升发酵容器,所述发酵分批培养基的组成为每升30g纤维素、4g葡萄糖、10g玉米浸浆固形物、3.8g(NH4)2S04、2.8gKH2P04、2.64gCaCl2、1.63gMgS04.7H20、1.8ml消泡剂和0.66ml痕量金属溶液。痕量金属溶液组成为每升216gFeCl36H20、58gZnS047H20、27gMnS04*H20、10gCuS04*5H20、2.4gH3B0^P336g拧檬酸。发酵补料培养基(fermentationfeedmedium)由葡萄糖和纤维素组成,以0_4g/l/hr的速率定量添加165小时。发酵容器保持在28t:的温度,pH控制在4.75+/-0.1的设定点。以lvvm的速率向容器中通入空气,并用转速为1100-1300rpm的Rushton叶轮搅拌发酵液。发酵结束时,从容器中收集所有发酵液,3000xg离心去除生物质。上清液无菌过滤后保存在35-40°C。实施例16:具有纤维素分解增强活性的土生梭孢壳GH61F多肽的表征玉米秸秆在美国能源部国立可再生能源实验室(NREL),Golden,CO使用稀硫酸进行预处理。预处理使用下述条件0.048g硫酸/g干生物量、19(TC、25Xw/w干固形物、历时大约1分钟。据NREL称,经预处理的玉米秸秆(PCS)中的水不溶性固形物含有53.2%纤维素、3.2%半纤维素和31.5%木质素。通过下述方法测定纤维素和半纤维素使用NRELStandardAnalyticalProcedure#002(NREL标准分析流程002号),在二阶段硫酸水解后通过高效液相层析来分析糖。木质素的测定是使用NRELStandardAnalyticalProcedure糾03(NREL标准分析流程003号),在用硫酸水解了纤维素和半纤维素部分之后通过重量分析测定的。在酶促水解之前,用大量的去离子水洗涤PCS以去除酸预处理过程中产生的可溶性化合物。如实施例7中所述在米曲霉中表达土生梭孢壳GH61F多肽,将培养液9500xg离心,然后将上清液通过O.22iim滤器(Millipore,Billerica,MA,USA)过滤。经过过滤的培养液用ECONO-PAC10DG柱(Bio-Rad,Hercules,CA,USA)脱盐。如实施例15所述获得了一种含米曲霉13-葡糖苷酶(W002/095014)的里氏木霉纤维素酶制备物,下文中称其为Tr/AoBG。PCS(45mg/ml,于50mM乙酸钠pH5.0缓冲液中)的水解使用96孔深孔型平板(AxygenScientific,Inc.,UnionCity,CA,USA)进行,这些平板用ALPS300自动化实验室用平板密封仪(ABgeneInc.,Rochester,NY,USA)密封,总反应体积为l.Oml。测试了土生梭孢壳G朋1F多肽增强含米曲霉13-葡糖苷酶的里氏木霉纤维素酶制备物的水解能力的能力。PCS的水解如下进行,每克纤维素使用2.25、4.5和6.75mg含米曲霉P-葡糖苷酶的里氏木霉纤维素酶制备物,分别添加了每克纤维素0.25、0.5和0.75mg的土生梭孢壳GH61F多肽,与分别为每克纤维素2.5、5.0及7.5mg的单独的含米曲霉P-葡糖苷酶的里氏木霉纤维素酶制备物比较。在TSAutoflowC02WaterjacketedIncubator(TS自动流程式C02水蒸汽保温箱)(NuAireInc.,Plymouth,MN,USA)中于50。C和60。C进行PCS水解。反应一式三份进行,在水解过程中取等份样品。通过将每个水解产物的20iU等份样品与180ill0.l丽aOH(终止试剂)混合来终止PCS水解反应。为每个样品制备合适的系列稀释物,并利用一种适用于96孔微量板规格的对羟基苯甲酸酰肼(para-hydroxybenzoicacidhydrazide)(PHBAH,SigmaChemicalCo.,St.Louis,M0,USA)测定法来测定还原糖量,该测定法如下所述。简单地说,将1001等份的合适稀释的样品置于96孔锥底微量平板中。加入50iil溶于0.5MNa0H的1.5%(w/v)PHBAH到每个孔中启动反应。平板不加盖95t:加热10分钟。让平板冷却到室温(RT),向每个孔中加入50iU蒸馏水。从每个孔取100ii1等份转移到平底96孔板中,用SPECTRAMAX⑧MicroplateReader(微量平板读数器)(MolecularDevices,Sunnyvale,CA,USA)测定410nm吸光度。用葡萄糖标准品(0.l-0.0125mg/ml,用0.1M氢氧化钠稀释)制作标准曲线,用来将所得的A41Qnm值换算成葡萄糖当量。用所得的当量来计算每个反应的PCS纤维素转化率百分比。用下面的等式计算纤维素转化为还原糖的程度(转化率,%):转化率(%)=RS(叫局xl00x162/(纤维素(mg/nil)X180)==RS(mg/nil)X100/(纤维素(Dlg/m"xl.ll"在该等式中,RS是以葡萄糖当量(mg/ml)计的溶液中还原糖浓度,因子1.Ill反映纤维素到葡萄糖的转化中的重量增加。单独的含米曲霉13-葡糖苷酶的里氏木霉纤维素酶制备物(2.5、5和7.5mg/g纤维素)或者有10%替换成土生梭孢壳GH61F多肽(2.25+0.25,4.5+0.5,6.75+0.75mg/g纤维素)的纤维素转化率总结于表l。表l.单独或添加有土生梭孢壳GH61F多肽的含米曲霉P-葡糖苷酶的里氏木霉纤维素酶制备物在5(TC及60°C、pH5.0条件下120小时的纤维素转化率表l中所示的结果显示,土生梭孢壳GH61F多肽增强了含米曲霉P_葡糖苷酶的里氏木霉纤维素酶制备物对PCS的活性。该土生梭孢壳GH61F多肽自身(0.75mg/g纤维素)在5(TC和6(TC下120小时后分别产生了1.6%和0.9%的纤维素转化。在5(TC和60°C下,向6.75mg含米曲霉13-葡糖苷酶的里氏木霉纤维素酶制备物添加0.75mg土生梭孢壳GH61F多肽都产生了比7.5mgTr/AoBG高的纤维素转化,表明含米曲霉P-葡糖苷酶的里氏木霉纤维素酶制备物对PCS的活性被土生梭孢壳GH61F多肽增强,并且含米曲霉13_葡糖苷酶的里氏木霉纤维素酶制备物与土生梭孢壳GH61F多肽之间有协同作用。生物材料的保藏下列生物材料已经根据布达佩斯条约的规定保藏于北方区域研究中心农业研究机构专禾U培养物保藏中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter),1815UniversityStreet,Peoria,Illinois,61604,并被给予下列保藏号保藏物保藏号保藏日大肠杆菌pTter61FNRRLB-500442007年5月25日该菌株在这样的条件下被保藏,以确保在本专利申请的审批过程中,由美国专利与商标局长根据联邦法规汇编第37编第1.14节及美国法典第35编第122条的规定确定为有资格者可获取该培养物。该保藏物是被保藏菌株的基本上纯的培养物。本主题申请在其他国家提交了对应申请或其子申请的,该保藏物可应这些国家专利法的要求予以提供。然而应当理解,提供保藏物并不构成对于实施本发明而损害由政府授予的专利权的行为的许可。本文中所描述并要求保护的发明的范围不应受到本文中公开的具体方面的限制,因为公开这些方面是为了举例说明本发明的一些方面。任何等同的方面都应落入本发明的范围。事实上,除了本文中显示和描述的那些之外,本领域技术人员根据前面的说明书可以容易地想到本发明的各种修改。这些修改也应落入本发明的范围。在冲突的情况下,应以包括定义在内的本公开内容为准。6权利要求一种具有纤维素分解增强活性的分离的多肽,其选自下组(a)包含与SEQIDNO2的成熟多肽具有优选至少60%,更优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、进一步更优选至少85%、最优选至少90%、进一步最优选至少95%同一性之氨基酸序列的多肽;(b)由与(i)SEQIDNO1的成熟多肽编码序列、(ii)包含SEQIDNO1的成熟多肽编码序列之基因组DNA序列、或(iii)(i)或(ii)的全长互补链在优选至少低严紧度条件,更优选至少中等严紧度条件,进一步更优选至少中-高严紧度条件,最优选至少高严紧度条件下杂交的多核苷酸所编码的多肽;(c)由包含与SEQIDNO1的成熟多肽编码序列具有优选至少60%、更优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、进一步更优选至少85%、最优选至少90%、进一步最优选至少95%同一性之核苷酸序列的多核苷酸所编码的多肽;和(d)SEQIDNO2的成熟多肽包含一个或多个(数个)氨基酸的取代、缺失和/或插入的变体。2.权利要求1的多肽,其包含SEQIDNO:2的氨基酸序列或其具有纤维素分解增强活性的片段,或者由SEQIDN0:2的氨基酸序列或其具有纤维素分解增强活性的片段组成。3.权利要求2的多肽,其包含SEQIDNO:2的成熟多肽或者由SEQIDNO:2的成熟多肽组成。4.权利要求1的多肽,其由大肠杆菌(E.coli)NRRLB-50044中包含的质粒pTter61F中所含的多核苷酸所编码。5.—种分离的多核苷酸,其包含编码权利要求1-4中任一项之多肽的核苷酸序列。6.—种核酸构建体,其包含与一个或多个(数个)指导所述多肽在表达宿主中产生的控制序列可操作连接的权利要求5的多核苷酸。7.包含权利要求6的核酸构建体的重组表达载体。8.包含权利要求6的核酸构建体的重组宿主细胞。9.一种产生权利要求l-4中任一项的多肽的方法,包括(a)在有助于产生所述多肽的条件下培养在其野生型形式中产生所述多肽的细胞,和(b)回收所述多肽。10.—种产生权利要求1-4中任一项的多肽的方法,包括(a)在有助于产生所述多肽的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序列,和(b)回收所述多肽。11.一种产生亲本细胞的突变体的方法,包括破坏或缺失编码权利要求1-4中任一项的多肽的核苷酸序列,导致该突变体产生的所述多肽比亲本细胞少。12.通过权利要求11的方法产生的突变细胞。13.权利要求12的突变细胞,其还包含编码天然或异源蛋白的基因。14.一种产生蛋白质的方法,包括(a)在有助于产生该蛋白质的条件下培养权利要求13的突变细胞,和(b)回收该蛋白质。15.权利要求5的分离的多核苷酸,其是通过下述方式获得的(a)在优选至少低严紧度条件,更优选中等严紧度条件,进一步更优选中_高严紧度条件,最优选至少高严紧度条件下使DNA群体与(i)SEQIDN0:1的成熟多肽编码序列,(ii)包含SEQIDN0:1的成熟多肽编码序列之基因组DNA序列,或(iii)(i)或(ii)的全长互补链杂交,和(b)分离发生杂交的多核苷酸,其编码具有纤维素分解增强活性的多肽。16.—种产生权利要求1-4中任一项的多肽的方法,包括(a)在有助于产生所述多肽的条件下培养包含编码所述多肽的多核苷酸的转基因植物或植物细胞;和(b)回收所述多肽。17.用编码权利要求1-4中任一项的多肽的多核苷酸转化的转基因植物、植物部分或植物细胞。18.—种双链抑制性RNA(dsRNA)分子,包含权利要求5的多核苷酸的子序列,其中任选地该dsRNA是siRNA或miRNA分子。19.权利要求18的双链抑制性RNA(dsRNA)分子,其长度为大约15、16、17、18、19、20、21、22、23、24、25个或更多个双链体核苷酸。20.—种抑制细胞中多肽的表达的方法,包括对细胞施用或在细胞中表达权利要求18或19的双链抑制性RNA(dsRNA)分子。21.—种核酸构建体,其包含与编码信号肽的核苷酸序列可操作连接的编码蛋白质的基因,所述信号肽包含SEQIDNO:2的氨基酸1-15或者由SEQIDNO:2的氨基酸1_15组成,其中所述基因对于所述核苷酸序列而言是外源的。22.包含权利要求21的核酸构建体的重组表达载体。23.包含权利要求21的核酸构建体的重组宿主细胞。24.—种产生蛋白质的方法,包括(a)在有助于产生所述蛋白质的条件下培养权利要求23的重组宿主细胞;和(b)回收所述蛋白质。25.—种降解或转化含纤维素材料的方法,包括在有效量的权利要求1-4中任一项所述的具有纤维素分解增强活性的多肽的存在下用有效量的纤维素分解酶组合物处理含纤维素材料,其中与不存在所述具有纤维素分解增强活性的多肽时相比,该具有纤维素分解增强活性的多肽的存在增加含纤维素材料的降解。26.—种用于产生发酵产物的方法,包括(a)在有效量的权利要求1-4中任一项所述的具有纤维素分解增强活性的多肽的存在下,用有效量的纤维素分解酶组合物糖化含纤维素材料,其中与不存在所述具有纤维素分解增强活性的多肽时相比,该具有纤维素分解增强活性的多肽的存在增加含纤维素材料的降解;(b)用一种或多种发酵微生物将步骤(a)的经糖化的含纤维素材料发酵以产生发酵产物;和(c)从发酵回收发酵产物。全文摘要本发明涉及具有纤维素分解增强活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用这些多肽的方法。文档编号C12N15/11GK101784659SQ200880101361公开日2010年7月21日申请日期2008年5月30日优先权日2007年5月31日发明者丁晗澍,金伯利·布朗,阿尔弗雷多·洛佩斯德利昂申请人:诺维信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1