具有分解纤维增强活性的多肽及其编码多核苷酸的制作方法

文档序号:430517阅读:899来源:国知局

专利名称::具有分解纤维增强活性的多肽及其编码多核苷酸的制作方法关于在联邦政府资助的研究和开发下所产生的发明权利的声明本发明是在能源部授予的主要合同DE-AC36-98GO10337,NREL副合同号ZCO-30017-02的政府支持下产生的。政府具有本发明的某些权利。
背景技术
:发明领域本发明涉及具有分解纤维(cellulolytic)增强活性的分离多肽和编码该多肽的分离多核苷酸。本发明也涉及包括该多核苷酸的核酸构建体、载体、和宿主细胞以及生产和使用该多肽的方法。相关技术的说明纤维素是通过β-1,4-键共价结合的单糖葡萄糖聚合物。许多微生物生产水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡萄糖苷酶。内切葡聚糖酶在随机的位置消化纤维素聚合物,使其打开而受到纤维二糖水解酶的攻击。继而纤维二糖水解酶从该纤维素聚合物的末端释放纤维二糖分子。纤维二糖是葡萄糖的水溶性β-1,4-连接的二聚物。β-葡萄糖苷酶水解纤维二糖为葡萄糖。纤维素原料(feedstock)转化成为乙醇的好处是准备好可利用的大量原料、可以避免燃烧或掩埋该材料,并且乙醇燃料非常洁净。木材、农业废物、草本作物、和城市固体废物已经被认为是乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦纤维素被转化为葡萄糖,该葡萄糖通过酵母被轻易地发酵成为乙醇。这在改善纤维素原料转化的技术中是非常有益的。本发明的目的是提供具有分解纤维增强活性的分离多肽和编码该多肽的分离核酸序列来改善纤维素原料的转化。发明概述本发明涉及具有分解纤维增强活性的分离多肽,选自(a)具有与SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸有至少75%同一性的氨基酸序列的多肽;(b)由至少在中等严谨条件下与(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链杂交的核苷酸序列编码的多肽;以及(c)包括SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸中一个或多个氨基酸的保守取代、缺失、和/或插入的变体。本发明也涉及编码具有分解纤维增强活性多肽的分离多核苷酸,选自(a)编码具有与SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸有至少75%同一性的氨基酸序列的多肽的多核苷酸;(b)与SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸有至少75%同一性的多核苷酸;以及(c)由至少在中等严谨条件下与(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链杂交的多核苷酸。本发明也涉及包括该多核苷酸的核酸构建体、重组表达载体、和重组宿主细胞。本发明还涉及用于生产这种具有分解纤维增强活性的多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括包含编码该多肽的多核苷酸的核酸构建体的重组宿主细胞;以及(b)回收该多肽。本发明也涉及包括编码蛋白质的基因的核酸构建体,其中该基因可操作地连接由SEQIDNO1的第330至387位核苷酸、SEQIDNO3的第47至97位核苷酸、SEQIDNO5的第69至125位核苷酸、SEQIDNO7的第1至54位核苷酸、或SEQIDNO9的第1至57位核苷酸组成的编码信号肽的核苷酸序列,其中该基因与该核苷酸序列是异源的。本发明也涉及用于降解或转换纤维素物质(cellulosicmaterial)的方法,包括在存在有效量的具有分解纤维增强活性的多肽时,用有效量的分解纤维蛋白质处理纤维素物质,其中该具有分解纤维增强活性的多肽的存在与缺少具有分解纤维增强活性的多肽相比增加了纤维素物质的降解。本发明进一步涉及用于生产有机物质的方法,包括(a)在存在有效量的具有分解纤维增强活性的多肽时,用有效量的分解纤维蛋白质糖化纤维素物质,其中存在具有分解纤维增强活性的多肽与缺少该具有分解纤维增强活性的多肽相比增加了纤维素物质的降解;(b)用一种或多种发酵微生物发酵步骤(a)的糖化的纤维素物质;以及(c)从该发酵物回收有机物质。附图简述图1A和1B显示具有分解纤维增强活性的ThielaviaterrestrisNRRL8126GH61B多肽的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNOs1和2)。预测的内含子用斜体字印刷。预测的信号肽加下划线。图2显示具有分解纤维增强活性的ThielaviaterrestrisNRRL8126GH61C多肽的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNOs3和4)。预测的内含子用斜体字印刷。预测的信号肽加下划线。图3显示具有分解纤维增强活性的ThielaviaterrestrisNRRL8126GH61D多肽的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNOs5和6)。预测的内含子用斜体字印刷。预测的信号肽加下划线。图4显示具有分解纤维增强活性的ThielaviaterrestrisNRRL8126GH61E多肽的cDNA序列和推导的氨基酸序列(分别为SEQIDNOs7和8)。预测的信号肽加下划线。图5显示具有分解纤维增强活性的ThielaviaterrestrisNRRL8126GH61G多肽的cDNA序列和推导的氨基酸序列(分别为SEQIDNOs9和10)。预测的信号肽加下划线。图6显示pAlLo1的限制性图谱。图7显示pBANe10的限制性图谱。图8显示pAlLo2的限制性图谱。图9显示pPH27的限制性图谱。图10显示pPH29的限制性图谱。图11显示pPH28的限制性图谱。图12显示pEJG120的限制性图谱。图13显示pEJG111的限制性图谱。图14显示pEJG112的限制性图谱。图15显示pTter61C的限制性图谱。图16显示pTter61D的限制性图谱。图17显示pTter61E的限制性图谱。图18显示pTter61G的限制性图谱。图19显示pEJG108的限制性图谱。图20显示pAlLo24的限制性图谱。图21显示pAlLo28的限制性图谱。图22显示pMJ04的限制性图谱。图23显示pMJ06的限制性图谱。图24显示pMJ09的限制性图谱。图25显示pEmY10的限制性图谱。图26显示pSMAI155的限制性图谱。图27显示pEJG110的限制性图谱。图28显示pEJG114的限制性图谱。图29显示pCW076的限制性图谱。图30显示pCW078的限制性图谱。图31显示pEJG97的限制性图谱。图32A和32B显示烟曲霉(Aspergillusfumigatus)β-葡糖苷酶的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNOs75和76)。预测的信号肽加下划线且预测的内含子用斜体字印刷。图33显示pEJG107的限制性图谱图34显示在50-60℃,具有分解纤维增强活性的ThielaviaterrestrisGH61B多肽(1mg/gPCS)通过表达分解纤维活性的里氏木霉(Trichodermareesei)的发酵肉汤和烟曲霉β-葡糖苷酶(5mg/gPCS)对PCS(1%w/v)水解的作用。图35显示在50℃,具有分解纤维增强活性的ThielaviaterrestrisGH61B多肽(1mg/gPCS)通过表达分解纤维活性的里氏木霉的发酵肉汤和烟曲霉β-葡糖苷酶(5mg/gPCS)对PCS(1%w/v)水解的作用。图36显示单独的Tr/AoBG或补充有具有分解纤维活性的ThielaviaterrestrisGH61多肽的Tr/AoBG在50℃,pH5.0进行115小时的纤维素转化。定义术语”分解纤维增强活性”(cellulolyticenhancingactivity)在此定义为通过具有分解纤维活性的蛋白质增加纤维素物质水解的生物活性。为了本发明的目的,通过在下列条件下测量来自被分解纤维的蛋白质水解的纤维素物质的还原糖增加来确定分解纤维增强活性与具有相等总蛋白质加载(loading)但没有分解纤维增强活性的对照水解(5.01-7.5mg分解纤维的蛋白质/gPCS中的纤维素(protein/gofcelluloseinPCS))相比较,在存在和缺少每gPCS中的纤维素0.01-2.5mg分解纤维增强活性时,于50℃5-7天,5.0mg分解纤维的蛋白质/gPCS中的纤维素。在优选的方面,使用存在纤维素酶蛋白质加载的3%米曲霉(Aspergillusoryzae)β-葡糖苷酶(根据WO02/095014在米曲霉中重组生产)或3%烟曲霉β-葡糖苷酶(根据实施例22在米曲霉中重组生产)的Celluclast1.5L样品(NovozymesA/S,Bagsvrd,丹麦)的混合物作为分解纤维活性的来源。术语“分解纤维活性”在此定义为水解纤维素物质的生物活性。为了本发明的目的,通过测量在下列条件下被分解纤维的混合物水解的纤维素物质增加来确定分解纤维的活性与没有加入分解纤维的蛋白质的对照水解相比较于50℃5-7天,1-10mg分解纤维的蛋白质/gPCS中的纤维素。在优选的方面,使用存在纤维素酶蛋白质加载的3%米曲霉β-葡糖苷酶(根据WO02/095014在米曲霉中重组生产)或3%烟曲霉β-葡糖苷酶(根据实施例22在米曲霉中重组生产)的Celluclast1.5L样品(NovozymesA/S,Bagsvrd,丹麦)的混合物作为分解纤维活性的来源。术语“PCS”或“预处理的玉米秸”在此定义为用加热和稀酸处理而来源于玉米秸(或谷物秸)(cornstover)的纤维素物质。为了本发明的目的,通过实施例24中描述的方法,或变化其时间、温度和酸量来制备PCS。术语“家族61糖苷水解酶”或“家族GH61”在此定义为属于HenrissatB.,1991,Aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,Biochem.J.280309-316,andHenrissatB.,andBairochA.,1996,Updatingthesequence-basedclassificationofglycosylhydrolases,Biochem.J.316695-696所述的糖苷水解酶家族61的多肽。目前,Henrissat列出了未分类的GH61家族,表明属于这个家族的多肽的性质,例如机制、催化亲核基团/碱基、催化质子供体、和3-D结构尚未知晓。纤维素物质可以是包含纤维素的任何材料。纤维素一般存在于例如,植物的茎、叶、荚壳、果壳和穗轴或树木的叶、枝和木料。纤维素物质还可以是但不限于,草本材料、农业废物、林业残渣、城市固体废物、废纸、以及纸浆和造纸厂残渣。在此可理解纤维素可以是木质纤维素的形式、包含木质素、纤维素和半纤维素混合基质的植物细胞壁材料。在优选的实施方案中,纤维素物质是玉米秸。在另一个优选的实施方案中,纤维素物质是玉米纤维。在另一个优选的实施方案中,纤维素物质是稻草。在另一个优选的实施方案中,纤维素物质是纸和纸浆加工废料。在另一个优选的实施方案中,纤维素物质是木本或草本植物。在另一个优选的实施方案中,纤维素物质是甘蔗渣(bagasse)。纤维素物质可利用本领域已知的传统方法经受预处理或以被预处理的形式加以使用。例如,物理的预处理技术可包括各种型式的碾压、照射、蒸汽/蒸汽喷发、和水热解作用;化学预处理技术可包括稀酸、碱、有机溶剂、氨、二氧化硫、二氧化碳、和pH-控制的水热解作用;以及生物预处理技术可涉及应用木质素-溶解的微生物(参见例如,Hsu,T.-A.,1996,Pretreatmentofbiomass,inHandbookonBioethanolProductionandUtilization,Wyman,C.E.,ed.,Taylor&amp;Francis,Washington,DC,179-212;Ghosh,P.,andSingh,A.,1993,Physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,Adv.Appl.Microbiol.39295-333;McMillan,J.D.,1994,Pretreatinglignocellulosicbiomassareview,inEnzymaticConversionofBiomassforFuelsProduction,Himmel,M.E.,Baker,J.O.,andOverend,R.P.,eds.,ACSSymposiumSeries566,AmericanChemicalSociety,Washington,DC,chapter15;Gong,C.S.,Cao,N.J.,Du,J.,andTsao,G.T.,1999,Ethanolproductionfromrenewableresources,inAdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.,ed.,Springer-VerlagBerlinHeidelberg,Germany,65207-241;Olsson,L.,andHahn-Hagerdal,B.,1996,Fermentationoflignocellulosichydrolysatesforethanolproduction,Enz.Microb.Tech.18312-331;andVallander,L.,andEriksson,K.-E.L.,1990,ProductionofethanolfromlignocellulosicmaterialsStateoftheart,Adv.Biochem.Eng./Biotechnol.4263-95)。本发明的多肽具有的分解纤维增强活性是由如SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸所示氨基酸序列组成的多肽的至少20%、优选至少40%、更优选至少50%、更优选至少60%、更优选至少70%、更优选至少80%、更优选至少90%、最优选至少95%、以及最优选至少100%。分离的多肽术语“分离的多肽”如在此使用的,是指如通过SDS-PAGE所测定的,为至少20%纯、优选至少40%纯、更优选至少60%纯、更优选至少80%纯、最优选至少90%纯、以及最优选至少95%纯的多肽。基本上纯的多肽术语“基本上纯的多肽”在此表示按重量计算包含至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、更优选至多2%、最优选至多1%、以及最优选至多0.5%的与其天然缔合的其他多肽物质的多肽制品。因此,优选基本上纯的多肽按重量计算是存在于该制品中的总的多肽的至少92%纯、至少93%纯、优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少96%纯、更优选至少97%纯、更优选至少98%纯、更优选至少99%、最优选至少99.5%纯、以及最优选100%纯。本发明的多肽优选是基本上纯的形式。特别地,优选多肽是“本质上纯的形式”,即,该多肽制品本质上不含与其天然缔合的其他多肽物质。这可例如通过众所周知的重组法方式或通过经典的纯化方法来制备该多肽而实现。在此,术语“基本上纯的多肽”和术语“分离的多肽”以及“分离形式的多肽”同义。同一性通过参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。为了本发明的目的,两个氨基酸序列之间同一性的程度可通过利用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)的Clustal方法(Higgins,1989,CABIOS5151-153)来确定,其具有同一性表格和下列多重排列参数缺口罚分为10,缺口长度罚分为10。成对地排列参数是Ktuple=1,缺口罚分=3,窗口(window)=5,以及对角线(diagonals)=5。两个氨基酸序列之间同一性的程度也可通过Smith-Waterman算法确定(Watermanetal.,1976,Adv.Math.20367),其中缺口开放罚分(gapopenpenalty)为11,缺口延伸(extension)罚分为1,且具有BLOSUM62矩阵。为了本发明的目的,两个核苷酸序列之间的同一性程度通过利用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)的Wilbur-Lipman方法来确定(WilburandLipman,1983,ProceedingsoftheNationalAcademyofScienceUSA80726-730),其具有同一性表格和下列多重排列参数缺口罚分为10,缺口长度罚分为10。成对地排列参数是Ktuple=3,缺口罚分=3,以及窗口=20。多肽片段术语“多肽片段”在此定义为具有从SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸;或其同源序列的氨基和/或羧基末端缺失一个或多个氨基酸的多肽,其中该片段具有分解纤维增强活性。优选地,SEQIDNO2的第20至326位氨基酸的片段包含至少277个氨基酸残基,更优选至少287个氨基酸残基,以及最优选至少297个氨基酸残基。优选地,SEQIDNO4的第18至240位氨基酸的片段包含至少185个氨基酸残基,更优选至少195个氨基酸残基,以及最优选至少205个氨基酸残基。优选地,SEQIDNO6的第20至258位氨基酸的片段包含至少200个氨基酸残基,更优选至少212个氨基酸残基,以及最优选至少224个氨基酸残基。优选地,SEQIDNO8的第19至226位氨基酸的片段包含至少175个氨基酸残基,更优选至少185个氨基酸残基,以及最优选至少195个氨基酸残基。优选地,SEQIDNO10的第20至304位氨基酸的片段包含至少240个氨基酸残基,更优选至少255个氨基酸残基,以及最优选至少270个氨基酸残基。亚序列术语“亚序列”在此定义为从SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸;或其同源序列的5′和/或3′末端缺失一个或多个核苷酸的核苷酸序列,其中该亚序列编码具有分解纤维增加活性的多肽片段。优选地,SEQIDNO1的第388至1332位核苷酸的亚序列包含至少831个核苷酸,更优选至少861个核苷酸,以及最优选至少891个核苷酸。优选地,SEQIDNO3的第98至821位核苷酸的亚序列包含至少555个核苷酸,更优选至少585个核苷酸,以及最优选至少615个核苷酸。优选地,SEQIDNO5的第126至978位核苷酸的亚序列包含至少600个核苷酸,更优选至少636个核苷酸,以及最优选至少672个核苷酸。优选地,SEQIDNO7的第55至678位核苷酸的亚序列包含至少525个核苷酸,更优选至少555个核苷酸,以及最优选至少585个核苷酸。优选地,SEQIDNO9的第58至912位核苷酸的亚序列包含至少720个核苷酸,更优选至少765个核苷酸,以及最优选至少810个核苷酸。等位变体术语“等位变体”在此表示占据相同染色体位点的基因的两种或多种备选形式中的任何一种。等位变化通过突变天然发生,并且可导致群体内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。分离的多核苷酸术语“分离的多核苷酸”如在此使用的,是指如通过琼脂糖电泳所测定的,为至少20%纯、优选至少40%纯、更优选至少60%纯、更优选至少80%纯、最优选至少90%纯、以及最优选至少95%纯的多核苷酸。基本上纯的多核苷酸术语“基本上纯的多核苷酸”如在此使用的,是指不含其他外来或不需要的核苷酸,并且为适用于遗传工程化的蛋白质生产系统内形式的多核苷酸制品。因此,基本上纯的多核苷酸按重量计算包含至多10%、优选至多8%、更优选至多6%、更优选至多5%、更优选至多4%、更优选至多3%、更优选至多2%、最优选至多1%、以及最优选至多0.5%的与其天然缔合的其他多核苷酸物质。然而基本上纯的多核苷酸可能包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计算为至少90%纯、优选至少92%纯、更优选至少94%纯、更优选至少95%纯、更优选至少96%纯、更优选至少97%纯、更优选至少98%纯、最优选至少99%、以及最优选至少99.5%纯的。本发明的多核苷酸优选是基本上纯的形式。特别地,优选在此公开的多核苷酸是“本质上纯的形式”,即,该多核苷酸制品本质上不含与其天然缔合的其他多核苷酸物质。在此,术语“基本上纯的多核苷酸”和术语“分离的多核苷酸”以及“分离形式的多核苷酸”同义。多核苷酸可以是基因组、cDNA、RNA、半合成的、合成起源,或其任何组合。cDNA术语“cDNA”在此定义为可通从获得自真核细胞的成熟拼接的mRNA分子逆转录制备的DNA分子。cDNA缺乏通常存在于相应基因组DNA中的内含子序列。起始的初级RNA转录本是在作为成熟拼接的mRNA出现前通过一系列步骤被加工的mRNA前体。这些步骤包括通过称为拼接的过程除去内含子序列。因此来源于mRNA的cDNA缺乏任何内含子序列。核酸构建体术语“核酸构建体”如在此使用的,是指从天然存在的基因分离,或被改变以否则不会天然存在的方式包含核酸节段的单-或双链的核酸分子。当核酸构建体包含为表达本发明的编码序列所需要的调控序列时,术语核酸构建体和术语“表达盒”同义。调控序列术语“调控序列”在此定义为包括为表达编码本发明多肽的多核苷酸所必需的或有益的所有成分。各个调控序列可以是与编码该多肽的核苷酸序列同源或异源的或相互之间是同源或异源的。这种调控序列包括但不限于,前导序列、多腺苷酸化序列、前肽序列、启动子、信号肽序列、和转录终止子。至少,该调控序列包括启动子、和转录及翻译终止信号。为了引入促进该调控序列与编码多肽的核苷酸序列的编码区连接的特异性限制酶切位点,该调控序列可具有接头。可操作地连接术语“可操作地连接”在此表示其中调控序列相对于多核苷酸序列的编码序列被置于适当的位置以使得该调控序列指导多肽的编码序列表达的构型。编码序列当在此使用时,术语“编码序列”是指直接确定其蛋白质产品的氨基酸序列的核苷酸序列。编码序列的边界一般通过开放阅读框确定,通常从ATG起始密码子或例如GTG和TTG的备选起始密码子开始,并且以例如TAA、TAG和TGA的终止密码子结束。编码序列可以是DNA、cDNA或重组核苷酸序列。表达术语“表达”包括涉及生产多肽的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰、和分泌。表达载体术语“表达载体”在此定义为线性或环状的DNA分子,其包括编码本发明多肽的多核苷酸,并且其可操作地连接提供用于其表达的附加核苷酸。宿主细胞术语“宿主细胞”,如在此使用的,包括对用包括本发明多核苷酸的核酸构建体或表达载体转化、转染、转导等敏感的任何细胞类型。修饰术语“修饰”在此是指包括或由SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸组成的多肽;或其同源序列的任何化学修饰,以及编码该多肽的DNA的遗传操作。修饰可以是一个或多个氨基酸的取代、缺失和/或插入,以及一个或多个氨基酸侧链的替换。人工变体当在此使用时,术语“人工变体”是指通过表达SEQIDNO1、3、5、7、或9;或其同源序列、或其成熟编码区的改变核苷酸序列的生物体而生产的具有分解纤维增强活性的多肽。改变的(modified)核苷酸序列是通过在SEQIDNO1、3、5、7、或9中公开的核苷酸序列;或其同源序列、或其成熟编码区的修饰而获得的。发明详述具有分解纤维增强活性的多肽在第一个方面,本发明涉及包括下列基序的具有分解纤维增强活性的分离多肽[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV],其中X是任何氨基酸,X(4,5)是在4或5个连续位置的任何氨基酸,以及X(4)是在4个连续位置的任何氨基酸。包括上文记录的基序的分离多肽可进一步包括H-X(1,2)-G-P-X(3)-[YW]-[AILMV],[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],其中X是任何氨基酸,X(1,2)是在1个位置或2个连续位置的任何氨基酸X(3)是在3个连续位置的任何氨基酸,以及X(2)是在2个连续位置的任何氨基酸。在上述基序中,使用已接受的IUPAC单字母氨基酸缩写。在优选的实施方案中,具有分解纤维增强活性的分离多肽进一步包括H-X(1,2)-G-P-X(3)-[YW]-[AILMV]。在另一个优选的实施方案中,具有分解纤维增强活性的分离多肽进一步包括[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一个优选的实施方案中,具有分解纤维增强活性的分离多肽进一步包括H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在第二个方面,本发明涉及具有与SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸(即,成熟多肽)的同一性程度为至少75%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%、98%、或99%的氨基酸序列,且具有分解纤维增强活性的分离多肽(在下文中为″同源多肽″)。在优选的方面,该同源多肽具有与SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸相差10个氨基酸,优选5个氨基酸,更优选4个氨基酸,更优选3个氨基酸,最优选2个氨基酸,以及最优选1个氨基酸的氨基酸序列。本发明的多肽优选包括SEQIDNO2或其等位变体的氨基酸序列;或具有分解纤维增强活性的其片段。在优选的方面,多肽包括SEQIDNO2的氨基酸序列。在另一个优选的方面,多肽包括SEQIDNO2的第20至326位氨基酸或其等位变体;或具有分解纤维增强活性的其片段。在另一个优选的方面,多肽包括SEQIDNO2的第20至326位氨基酸。在另一个优选的方面,多肽由SEQIDNO2的第20至326位氨基酸或其等位变体的氨基酸序列;或具有分解纤维增强活性的其片段组成。在另一个优选的方面,多肽由SEQIDNO2的氨基酸序列组成。在另一个优选的方面,多肽由SEQIDNO2的第20至326位氨基酸或其等位变体;或具有分解纤维增强活性的其片段组成。在另一个优选的方面,多肽由SEQIDNO2的第20至326位氨基酸组成。本发明的多肽优选包括SEQIDNO4或其等位变体的氨基酸序列;或具有分解纤维增强活性的其片段。在优选的方面,多肽包括SEQIDNO4的氨基酸序列。在另一个优选的方面,多肽包括SEQIDNO4的第18至240位氨基酸或其等位变体;或具有分解纤维增强活性的其片段。在另一个优选的方面,多肽包括SEQIDNO4的第18至240位氨基酸。在另一个优选的方面,多肽由SEQIDNO4或其等位变体的氨基酸序列;或具有分解纤维增强活性的其片段组成。在另一个优选的方面,多肽由SEQIDNO4的氨基酸序列组成。在另一个优选的方面,多肽由SEQIDNO4的第18至240位氨基酸或其等位变体;或具有分解纤维增强活性的其片段组成。在另一个优选的方面,多肽由SEQIDNO4的第18至240位氨基酸组成。本发明的多肽优选包括SEQIDNO6或其等位变体的氨基酸序列;或具有分解纤维增强活性的其片段。在优选的方面,多肽包括SEQIDNO6的氨基酸序列。在另一个优选的方面,多肽包括SEQIDNO6的第20至258位氨基酸或其等位变体;或具有分解纤维增强活性的其片段。在另一个优选的方面,多肽包括SEQIDNO6的第20至258位氨基酸。在另一个优选的方面,多肽由SEQIDNO6或其等位变体的氨基酸序列;或具有分解纤维增强活性的其片段组成。在另一个优选的方面,多肽由SEQIDNO6的氨基酸序列组成。在另一个优选的方面,多肽由SEQIDNO6的第20至258位氨基酸或其等位变体;或具有分解纤维增强活性的其片段组成。在另一个优选的方面,多肽由SEQIDNO6的第20至258位氨基酸组成。本发明的多肽优选包括SEQIDNO8或其等位变体的氨基酸序列;或具有分解纤维增强活性的其片段。在优选的方面,多肽包括SEQIDNO8的氨基酸序列。在另一个优选的方面,多肽包括SEQIDNO8的第19至226位氨基酸或其等位变体;或具有分解纤维增强活性的其片段。在另一个优选的方面,多肽包括SEQIDNO8的第19至226位氨基酸。在另一个优选的方面,多肽由SEQIDNO8或其等位变体的氨基酸序列;或具有分解纤维增强活性的其片段组成。在另一个优选的方面,多肽由SEQIDNO8的氨基酸序列组成。在另一个优选的方面,多肽由SEQIDNO8的第19至226位氨基酸或其等位变体;或具有分解纤维增强活性的其片段组成。在另一个优选的方面,多肽由SEQIDNO8的第19至226位氨基酸组成。本发明的多肽优选包括SEQIDNO10或其等位变体的氨基酸序列;或具有分解纤维增强活性的其片段。在优选的方面,多肽包括SEQIDNO10的氨基酸序列。在另一个优选的方面,多肽包括SEQIDNO10的第20至304位氨基酸或其等位变体;或具有分解纤维增强活性的其片段。在另一个优选的方面,多肽包括SEQIDNO10的第20至304位氨基酸。在另一个优选的方面,多肽由SEQIDNO10或其等位变体的氨基酸序列;或具有分解纤维增强活性的其片段组成。在另一个优选的方面,多肽由SEQIDNO10的氨基酸序列组成。在另一个优选的方面,多肽由SEQIDNO10的第20至304位氨基酸或其等位变体;或具有分解纤维增强活性的其片段组成。在另一个优选的方面,多肽由SEQIDNO10的第20至304位氨基酸组成。在第三个方面,本发明涉及由至少在极低严谨条件,优选低严谨条件,更优选中等严谨条件,更优选中等-高严谨条件,更优选高严谨条件,以及最优选极高严谨条件下,与(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii),或(iii)的互补链杂交的多核苷酸编码的、具有分解纤维增强活性的分离多肽(J.Sambrook,E.F.Fritsch,andT.Maniatus,1989,MolecularCloning,ALaboratoryManual,2dedition,ColdSpringHarbor,NewYork)。SEQIDNO1、3、5、7、或9的亚序列包含至少100个连续的核苷酸或优选至少200个连续核苷酸。此外,该亚序列可编码具有分解纤维增强活性的多肽片段。SEQIDNO1、3、5、7、或9的核苷酸序列;或其亚序列;以及SEQIDNO2、4、6、8、或10的氨基酸序列;或其片段,可用于设计核酸探针来根据本领域众所周知的方法从不同种属的菌株鉴定和克隆编码具有分解纤维增强活性的多肽的DNA。特别地,这种探针可用于按照标准的Southern印迹方法与感兴趣种属的基因组或cDNA杂交,以鉴定和分离其相应的基因。这种探针比起全部的序列来可以是相当短的,但长度应该是至少14个、优选至少25个、更优选至少35个、以及最优选至少70个核苷酸。然而优选该核酸探针是至少100个核苷酸长度。例如,该核酸探针可以是至少200个核苷酸、优选至少300个核苷酸、更优选至少400个核苷酸、或最优选至少500个核苷酸长度。可使用更长的探针,例如,至少600个核苷酸、优选至少700个核苷酸、更优选至少800个核苷酸、或最优选至少900个核苷酸长度的核酸探针。DNA和RNA探针都可使用。生物素、或抗生物素蛋白)。这种探针被包括在本发明内。因此从这种其他生物体制备的基因组DNA或cDNA文库可用于筛选与上述探针杂交且编码具有分解纤维增强活性的多肽的DNA。可通过琼脂糖或聚丙烯酰胺凝胶电泳,或其他分离技术来分离来自这种其他生物体的基因组或其他DNA。来自文库的DNA或分离的DNA可被转移至和固定至硝化纤维或其他的合适载体材料上。为了鉴定与SEQIDNO1、3、5、7、或9或其亚序列同源的克隆或DNA,该载体材料被用于Southern印迹。为了本发明的目的,杂交表明该核苷酸序列与相应于SEQIDNO1、3、5、7、或9所示的核苷酸序列、包含于SEQIDNO1、3、或5的cDNA序列、或包括SEQIDNO7或9的基因组序列、其互补链、或其亚序列的标记核酸探针在极低至极高的严谨条件下杂交。可利用X射线胶片检测在这些条件下与该核酸探针杂交的分子。在优选的实施方案中,该核酸探针是编码SEQIDNO2、或其亚序列的多肽的核酸序列。在另一个优选的实施方案中,该核酸探针是SEQIDNO1。在另一个优选的实施方案中,该核酸探针是SEQIDNO1的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRLB-30699的质粒pEJG120中的核酸序列,其中该核酸序列编码具有分解纤维增强活性的多肽。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRLB-30699的质粒pEJG120中的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是编码SEQIDNO4、或其亚序列的多肽的核酸序列。在另一个优选的实施方案中,该核酸探针是SEQIDNO3。在另一个优选的实施方案中,该核酸探针是SEQIDNO3的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRLB-30813的质粒pTter61C中的核酸序列,其中该核酸序列编码具有分解纤维增强活性的多肽。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRLB-30813的质粒pTter61C中的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是编码SEQIDNO6、或其亚序列的多肽的核酸序列。在另一个优选的实施方案中,该核酸探针是SEQIDNO5。在另一个优选的实施方案中,该核酸探针是SEQIDNO5的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRLB-30812的质粒pTter61D中的核酸序列,其中该核酸序列编码具有分解纤维增强活性的多肽。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRLB-30812的质粒pTter61D中的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是编码SEQIDNO8、或其亚序列的多肽的核酸序列。在另一个优选的实施方案中,该核酸探针是SEQIDNO7。在另一个优选的实施方案中,该核酸探针是SEQIDNO7的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRLB-30814的质粒pTter61E中的核酸序列,其中该核酸序列编码具有分解纤维增强活性的多肽。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRLB-30814的质粒pTter61E中的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是编码SEQIDNO10、或其亚序列的多肽的核酸序列。在另一个优选的实施方案中,该核酸探针是SEQIDNO9。在另一个优选的实施方案中,该核酸探针是SEQIDNO9的成熟多肽编码区。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRLB-30811的质粒pTter61G中的核酸序列,其中该核酸序列编码具有分解纤维增强活性的多肽。在另一个优选的实施方案中,该核酸探针是在包含于大肠杆菌NRRLB-30811的质粒pTter61G中的成熟多肽编码区。对于至少100个核苷酸长度的长探针,极低至极高的严谨条件定义为在42℃,在5XSSPE,0.3%SDS,200μg/ml剪切和变性的鲑精DNA中,以及对于极低和低严谨为25%甲酰胺,对于中等和中等-高严谨为35%甲酰胺或对于高和极高严谨为50%甲酰胺,按照标准的Southern印迹方法最佳地预杂交和杂交12至24小时。对于至少100个核苷酸长度的长探针,利用2XSSC,0.2%SDS,优选至少在45℃(极低严谨),更优选在至少50℃(低严谨),更优选在至少55℃(中等严谨),更优选在至少60℃(中等-高严谨),更优选在至少65℃(高严谨),以及最优选在至少70℃(极高严谨)最终洗涤载体材料3次,每次15分钟。对于大约15个核苷酸至大约70个核苷酸长度的短探针,严谨条件定义为在低于利用Bolton和McCarthy所述的计算法(1962,ProceedingsoftheNationalAcademyofSciencesUSA481390)计算的Tm大约5℃至大约10℃,在0.9MNaCl,0.09MTris-HClpH7.6,6mMEDTA,0.5%NP-40,1XDenhardt′s溶液,1mM焦磷酸钠,1mM一元磷酸钠(sodiummonobasicphosphate),0.1mMATP,和每ml0.2mg的酵母RNA,按照标准的Southern印迹方法最佳地预杂交、杂交、和杂交后洗涤12至24小时。对于大约15个核苷酸至大约70个核苷酸长度的短探针,在低于计算的Tm5℃至10℃,在6XSCC加0.1%SDS中洗涤载体材料15分钟一次,以及利用6XSSC洗涤2次,每次15分钟。在第四个方面,本发明包括SEQIDNO2或其同源序列;或其成熟多肽中保守取代、缺失、和/或插入一个或多个氨基酸的人工变体。优选地,氨基酸变化具有不重要(minor)的特性,其是不显著影响蛋白质的折叠和/或活性的保守的氨基酸取代或插入;一般为一个至大约30个氨基酸的小的缺失;氨基或羧基末端的小的延伸,例如氨基末端的甲硫氨酸残基;达到大约20-25个残基的小的接头肽;或通过改变净电荷或另一个功能,例如多组氨酸段、抗原表位或结合结构域而促进纯化的小的延伸。保守取代的实例在碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天门冬酰胺)、疏水氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、和小的氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)组的范围之内。一般不改变特异活性的氨基酸取代是本领域已知的,并且在例如H.NeurathandR.L.Hill,1979,In,TheProteins,AcademicPress,NewYork中有描述。最通常发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。除20种标准氨基酸之外,非标准氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸、和α-甲基丝氨酸)可被野生型多肽的氨基酸残基替代。有限数目的非保守的氨基酸、不由遗传密码编码的氨基酸、和非天然的氨基酸可被氨基酸残基替代。蛋白质合成后“非天然的氨基酸”已经被改变,和/或在其侧链中具有不同于标准氨基酸的化学结构。可化学合成非天然的氨基酸,并且优选地,可商业购买非天然的氨基酸,并且包括哌啶酸(pipecolicacid)、四氢噻唑羧酸、脱氢脯氨酸、3-和4-甲基脯氨酸、和3,3-二甲基脯氨酸。备选地,该氨基酸变化具有的这种特性是该多肽的理化性质被改变。例如,氨基酸变化可改善该多肽的热稳定性,改变底物特异性、变化最适的pH等。可根据本领域已知的方法,例如定点诱变或丙氨酸-扫描诱变来鉴定亲本多肽中的必需氨基酸(CunninghamandWells,1989,Science2441081-1085)。在后者的技术中,在分子中的每个残基导入单丙氨酸突变,并且测试所得到的突变分子的生物活性(即,分解纤维的增强活性)来鉴定决定该分子活性的氨基酸残基。也参见,Hiltonetal.,1996,J.Biol.Chem.2714699-4708。也可通过结构的物理分析来确定酶的活性位点或其他的生物学相互作用,例如通过核磁共振、晶体学、电子衍射、或光亲合标记、结合推定的接触位点氨基酸突变这些技术来加以确定。参见例如,deVosetal.,1992,Science255306-312;Smithetal.,1992,J.Mol.Biol.224899-904;Wlodaveretal.,1992,FEBSLett.30959-64。也可从与本发明所述多肽相关的多肽的同一性分析推测必需氨基酸的同一性。可利用诱变、重组、和/或改组,然后是相关筛选步骤的已知方法产生和测试单个或多个氨基酸取代,所述方法例如在Reidhaar-OlsonandSauer,1988,Science24153-57;BowieandSauer,1989,Proc.Natl.AcadSci.USA862152-2156;WO95/17413;或WO95/22625中有公开。可使用的其他方法包括易错PCR,噬菌体显示(display)(例如,Lowmanetal.,1991,Biochem.3010832-10837;美国专利号5,223,409;WO92/06204),和定区域诱变(Derbyshireetal.,1986,Gene46145;Neretal.,1988,DNA7127)。诱变/改组方法可与高通量、自动筛选方法组合以检测由宿主细胞表达的克隆、诱变处理多肽的活性(Nessetal.,1999,NatureBiotechnology17893-896)。编码活性多肽的诱变处理的DNA分子可从宿主细胞回收并利用本领域的标准方法快速测序。这些方法提供感兴趣多肽中单独氨基酸残基重要性的快速测定,并且可被用于未知结构的多肽。SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸的氨基酸取代、缺失和/或插入的总数是10个、优选9个、更优选8个、更优选7个、更优选最多6个、更优选5个、更优选4个、更优选3个、更优选2个、以及最优选1个。具有分解纤维增强活性的多肽的来源本发明的多肽可从任何属的微生物获得。为了本发明的目的,术语“获得自”如在此使用的与给定来源结合,是指由核苷酸序列编码的多肽是通过该来源或通过其中已经插入了来自该来源的核苷酸序列的菌株而生产的。在优选的方面,获得自给定来源的多肽是细胞外分泌的。本发明的多肽可以是细菌多肽。例如,该多肽可以是革兰氏阳性细菌多肽,例如杆菌多肽,例如,嗜碱芽孢杆菌(Bacillusalkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillusbrevis)、环状杆菌(Bacilluscirculans)、凝结芽孢杆菌(Bacilluscoagulans)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillussubtilis)、或苏云金杆菌(Bacillusthuringiensis)多肽;或链霉菌属(Streptomyces)多肽,例如,浅青紫链霉菌(Streptomyceslividans)或鼠灰链霉菌(Streptomycesmurinus)多肽;或革兰氏阴性细菌多肽,例如,大肠杆菌(E.coli)或假单胞菌(Pseudomonas)种属多肽。本发明的多肽也可以是真菌多肽,且更优选地是酵母多肽例如,假丝酵母属(Candida)、克鲁维氏酵母属(Kluyveromyces)、毕赤氏酵母属(Pichia)、糖酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或耶氏酵母(Yarrowia)多肽;或更优选丝状真菌多肽,例如支顶孢属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、隐球酵母属(Cryptococcus)、Filibasidium、镰刀菌属(Fusarium)、腐殖菌属(Humicola)、稻瘟霉属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、瘤胃真菌(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃真菌(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、草根霉属(Thielavia)、弯颈霉(Tolypocladium)、或木霉属(Trichoderma)多肽。在优选的方面,该多肽是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomycescerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉斯糖酵母(Saccharomycesdouglasii)、克鲁弗糖酵母(Saccharomyceskluyveri)、诺地糖酵母(Saccharomycesnorbensis)、或卵形糖酵母(Saccharomycesoviformis)的具有分解纤维增强活性的多肽。在另一个优选的方面,该多肽是棘孢曲霉(Aspergillusaculeatus)、泡盛曲霉(Aspergillusawamori)、烟曲霉(Aspergillusfumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillusoryzae)、灰盖鬼伞(Coprinuscinereus)、Diplodiagossyppina、杆孢状镰孢(Fusariumbactridioides)、Fusariumcerealis、Fusariumcrookwellense、大刀镰孢(Fusariumculmorum)、禾谷镰孢(Fusariumgraminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusariumnegundi)、尖孢镰孢(Fusariumoxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusariumroseum)、接骨木镰孢(Fusariumsambuccinum)、肤色镰孢(Fusariumsarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、硫色镰孢(Fusariumsulphureum)、Fusariumtorulosum、Fusariumtrichothecioides、Fusariumvenenatum、Humicolainsolens、Humicolalanuginosa、Magnaporthegrisea、米赫毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙链孢霉(Neurosporacrassa)、产紫青霉(Penicilliumpurpurogenum)、Phanerochaetechrysosporium、淡黑假黑盘菌(Pseudoplectanianigrella)、Thermoascusaurantiacus、哈茨木霉(Trichodermaharzianum)、康氏木霉(Trichodermakoningii)、Trichodermalongibrachiatum、里氏木霉(Trichodermareesei)、绿色木霉(Trichodermaviride)、或Trichophaeasaccata多肽。在更优选的方面,该多肽是Thielaviaterrestris多肽。在最优选的实施方案中,该多肽是ThielaviaterrestrisNRRL8126多肽,例如具有SEQIDNO2、4、6、8、或10的氨基酸序列的多肽,或其片段,例如成熟蛋白质。可理解对于上述的种属,本发明包括完全的和不完全的状态,和其它分类学的同等物,例如,无性型,不管其已知的种属名称。本领域的技术人员可容易地识别适当同等物的同一性。这些种属的菌株以其菌种保藏号对于公众来说是易得到的,例如美国典型培养物保藏中心(ATCC)、德国微生物保藏中心(DSM)、真菌菌种保藏中心(CBS)、和农业研究机构培养物保藏中心(NRRL)。此外,这种多肽可从其他来源被鉴定和获得,包括利用上述探针从自然界(例如,土壤、堆肥、水等)分离的微生物。用于从天然生境分离微生物的技术是本领域已知的。可通过类似地筛选这种微生物的基因组或cDNA文库获得该多核苷酸。一旦已经用探针检测到编码多肽的多核苷酸序列,可利用本领域普通技术人员公知的技术分离或克隆该多核苷酸(参见例如,Sambrooketal.,1989,同上).本发明的多肽也包括融合的多肽或可切割的融合多肽,其中另一个多肽融合在该多肽或其片段的N-末端或C-末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合至本发明的核苷酸序列(或其部分)来生产融合的多肽。用于生产融合多肽的技术是本领域已知的,包括连接编码该多肽的编码序列以使得其处于框内并且使该融合多肽的表达处于相同启动子和终止子的调控之下。多核苷酸本发明也涉及具有编码本发明多肽的核苷酸序列的分离多核苷酸。在优选的方面,该核苷酸序列如SEQIDNO1所示。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRLB-30699的质粒pEJG120中的序列。在另一个优选的方面,该核苷酸序列是SEQIDNO1的成熟多肽编码区。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRLB-30699的质粒pEJG120中的成熟多肽编码区。本发明也包括编码具有SEQIDNO2的氨基酸序列的多肽或由于遗传密码简并性而不同于SEQIDNO1的其成熟多肽的核苷酸序列。本发明也涉及编码具有分解纤维增强活性的SEQIDNO2片段的SEQIDNO1的亚序列。在另一个优选的方面,该核苷酸序列如SEQIDNO3所示。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRLB-30813的质粒pTter61C中的序列。在另一个优选的方面,该核苷酸序列是SEQIDNO3的成熟多肽编码区。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRLB-30813的质粒pTter61C中的成熟多肽编码区。本发明也包括编码具有SEQIDNO4的氨基酸序列的多肽或由于遗传密码简并性而不同于SEQIDNO3的其成熟多肽的核苷酸序列。本发明也涉及编码具有分解纤维增强活性的SEQIDNO4片段的SEQIDNO3的亚序列。在另一个优选的方面,该核苷酸序列如SEQIDNO5所示。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRLB-30812的质粒pTter61D中的序列。在另一个优选的方面,该核苷酸序列是SEQIDNO5的成熟多肽编码区。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRLB-30812的质粒pTter61D中的成熟多肽编码区。本发明也包括编码具有SEQIDNO6的氨基酸序列的多肽或由于遗传密码简并性而不同于SEQIDNO5的其成熟多肽的核苷酸序列。本发明也涉及编码具有分解纤维增强活性的SEQIDNO6片段的SEQIDNO5的亚序列。在另一个优选的方面,该核苷酸序列如SEQIDNO7所示。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRLB-30814的质粒pTter61E中的序列。在另一个优选的方面,该核苷酸序列是SEQIDNO7的成熟多肽编码区。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRLB-30814的质粒pTter61E中的成熟多肽编码区。本发明也包括编码具有SEQIDNO8的氨基酸序列的多肽或由于遗传密码简并性而不同于SEQIDNO7的其成熟多肽的核苷酸序列。本发明也涉及编码具有分解纤维增强活性的SEQIDNO8片段的SEQIDNO7的亚序列。在另一个优选的方面,该核苷酸序列如SEQIDNO9所示。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRLB-30811的质粒pTter61G中的序列。在另一个优选的方面,该核苷酸序列是SEQIDNO9的成熟多肽编码区。在另一个更优选的方面,该核苷酸序列是在包含于大肠杆菌NRRLB-30811的质粒pTter61G中的成熟多肽编码区。本发明也包括编码具有SEQIDNO10的氨基酸序列的多肽或由于遗传密码简并性而不同于SEQIDNO9的其成熟多肽的核苷酸序列。本发明也涉及编码具有分解纤维增强活性的SEQIDNO10片段的SEQIDNO9的亚序列。本发明也涉及在SEQIDNO1、3、5、7、或9的成熟多肽编码序列中具有至少一个突变的突变多核苷酸,其中该突变的核苷酸序列分别编码由SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸组成的多肽。用于分离或克隆编码多肽的多核苷酸的技术是本领域已知的,包括来自基因组DNA的分离物、来自cDNA的制品、或其组合。从这种基因组DNA克隆本发明的多核苷酸可受到例如,利用众所周知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共用结构特征的克隆DNA片段的影响。参见例如,Innisetal.,1990,PCRAGuidetoMethodsandApplication,AcademicPress,NewYork。可使用其他的核酸扩增方法,例如连接酶链式反应(LCR)、连接活化转录(LAT)和基于核苷酸序列的扩增(NASBA)。该多核苷酸可克隆自Thielavia的菌株、或另一种或相关的生物体,因此例如可以是核苷酸序列的多肽编码区的等位或种属变体。本发明也涉及具有与SEQIDNO1(即,第388至1332位核苷酸)的成熟多肽编码序列有至少75%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%同一性程度,且编码活化多肽的核苷酸序列的多核苷酸。本发明也涉及具有与SEQIDNO3(即,第98至821位核苷酸)的成熟多肽编码序列有至少75%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%同一性程度,且编码活化多肽的核苷酸序列的多核苷酸。本发明也涉及具有与SEQIDNO5(即,第126至978位核苷酸)的成熟多肽编码序列有至少75%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%同一性程度,且编码活化多肽的核苷酸序列的多核苷酸。本发明也涉及具有与SEQIDNO7(即,第55至678位核苷酸)的成熟多肽编码序列有至少75%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%同一性程度,且编码活化多肽的核苷酸序列的多核苷酸。本发明也涉及具有与SEQIDNO9(即,第58至912位核苷酸)的成熟多肽编码序列有至少95%、优选至少80%、更优选至少85%、更优选至少90%、最优选至少95%、以及最优选至少97%同一性程度,且编码活化多肽的核苷酸序列的多核苷酸。编码本发明多肽的核苷酸序列的修饰可能是为合成基本上类似于该多肽的多肽所必需的。术语“基本上类似”于该多肽是指非天然存在形式的多肽。这些多肽可能在一些工程化方式方面不同于分离自其天然来源的多肽,例如在特异活性、热稳定性、最适pH等方面不同的人工变体。可根据如SEQIDNO1、3、5、7、或9的多肽编码区所示的核苷酸序列,例如其亚序列,和/或通过导入不会产生另一种由该核苷酸序列编码的氨基酸序列多肽,但相应于设计用于酶生产的宿主生物体的密码子利用率的核苷酸取代,或通过导入可能产生不同氨基酸序列的核苷酸取代来构建该变体序列。对于核苷酸取代的概述,参见例如,Fordetal.,1991,ProteinExpressionandPurification295-107。对本领域技术人员显而易见的是可在决定分子功能且仍然产生活化多肽的区域外侧产生这种取代。对由本发明的分离多核苷酸编码的多肽的活性重要、且因此优选不被取代的氨基酸残基可根据本领域已知的方法加以鉴定,例如定点诱变或丙氨酸-扫描诱变(参见例如,CunninghamandWells,1989,Science2441081-1085)。在后者的技术中,在分子中的每个带阳电的残基导入突变,并且测试所得到的突变分子的分解纤维增强活性来鉴定决定该分子活性的氨基酸残基。底物酶相互作用的位点还可通过三维结构分析确定,例如通过核磁共振分析、晶体学或光亲合标记的这种技术进行测定(参见例如,deVosetal.,1992,Science255306-312;Smithetal.,1992,JournalofMolecularBiology224899-904;Wlodaveretal.,1992,FEBSLetters30959-64)。本发明也涉及编码本发明多肽的分离多核苷酸,如在此所定义的,其至少在极低严谨条件,优选低严谨条件,更优选中等严谨条件,更优选中等-高严谨条件,更优选高严谨条件,以及最优选极高严谨条件下,与(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,(iii)(i)或(ii)的互补链;或其等位变体和亚序列(Sambrooketa1.,1989,同上)。本发明也涉及分离的多核苷酸,其通过(a)在极低、低、中等、中等-高、高、或极高的严谨条件下,使DNA群与(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链杂交;以及(b)分离该编码具有分解纤维增强活性的多肽的杂交多核苷酸来获得。核酸构建体本发明也涉及包括本发明分离多核苷酸的核酸构建体,其中该分离多核苷酸可操作地连接指导该编码序列在合适的宿主细胞中,在与该调控序列相兼容的条件下表达的一种或多种调控序列。编码本发明多肽的分离多核苷酸可以保证该多肽表达的各种方式被操作。在其插入载体之前该多核苷酸序列的操作可能根据表达载体是合乎需要或必需的。利用重组DNA方法改变多核苷酸序列的技术是本领域已知的。该调控序列可以是合适的启动子序列,由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。该启动子序列包含介导该多肽表达的转录调控序列。启动子可以是在所选择的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的、和杂交的(hybrid)启动子,并且可从编码与该宿主细胞同源或异源的细胞外或胞内多肽的基因获得。用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例是从大肠杆菌乳糖操纵子、天蓝色链霉菌(Streptomycescoelicolor)琼脂水解酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌生麦芽糖淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、和原核的β-内酰胺酶基因获得的启动子(Villa-Kamaroffetal.,1978,ProceedingsoftheNationalAcademyofSciencesUSA753727-3731),以及tac启动子(DeBoeretal.,1983,ProceedingsoftheNationalAcademyofSciencesUSA8021-25)。进一步的启动子在″Usefulproteinsfromrecombinantbacteria″inScientificAmerican,1980,24274-94;和Sambrooketal.,1989,supra中有描述。用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从米曲霉TAKA淀粉酶、米黑根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定的α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉乙酰胺酶、Fusariumvenenatum淀粉葡萄糖苷酶(WO00/56900)、FusariumvenenatumDaria(WO00/56900)、FusariumvenenatumQuinn(WO00/56900)、尖孢镰孢胰蛋白酶样蛋白酶(WO96/00787)、里氏木霉p-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉葡聚糖内切酶I、里氏木霉葡聚糖内切酶II、里氏木霉葡聚糖内切酶III、里氏木霉葡聚糖内切酶IV、里氏木霉葡聚糖内切酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶的基因获得的启动子,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的启动子的杂合体);以及其突变的、截短的、和杂合的启动子。在酵母宿主中,有用的启动子是从酿酒酵母烯醇酶(ENO1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶的基因获得的。用于酵母宿主细胞的其他有用的启动子在Romanosetal.,1992,Yeast8423-488中有描述。调控序列也可以是合适的转录终止子序列,由宿主细胞识别来终止转录的序列。终止子序列可操作地连接编码该多肽的核苷酸序列的3’末端。在所选择的宿主细胞中起作用的任何终止子都可用于本发明。优选用于丝状真菌宿主细胞的终止子是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸酯合酶、黑曲霉α-葡糖苷酶、和尖孢镰孢胰蛋白酶样蛋白酶的基因获得的。优选用于酵母宿主细胞的终止子是从酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、和酿酒酵母甘油醛-3-磷酸脱氢酶的基因获得的。用于酵母宿主细胞的其他有用的终止子在Romanosetal.,1992,supra中有描述。调控序列也可以是合适的前导序列,对宿主细胞的翻译重要的mRNA的非翻译区域。前导序列可操作地连接编码该多肽的核苷酸序列的5’末端。在所选择的宿主细胞中起作用的任何前导序列都可用于本发明。用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得的。用于酵母宿主细胞的合适前导序列是从酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、和酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)的基因获得的。调控序列也可以是多腺苷酸化序列,可操作连接核苷酸序列3’末端的序列,当其转录时,被宿主细胞识别为向转录的mRNA添加多聚腺苷酸残基的信号。在所选择的宿主细胞中起作用的任何多腺苷酸化序列都可用于本发明。用于丝状真菌宿主细胞的优选多腺苷酸化序列是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸酯合酶、尖孢镰孢胰蛋白酶样蛋白酶、和黑曲霉α-葡糖苷酶的基因获得的。用于酵母宿主细胞的有用的多腺苷酸化序列在GuoandSherman,1995,MolecularCellularBiology155983-5990中有描述。调控序列也可以是编码氨基酸序列的、与多肽氨基末端连接的信号肽编码区,并且指导该编码的多肽进入细胞分泌途径。核苷酸序列的编码序列的5’端可固有地包含与编码分泌多肽的编码区段天然连接在翻译阅读框中的信号肽编码区。备选地,编码序列的5’端可包含与编码序列异源的信号肽编码区。当该编码序列非天然包含信号肽编码区时,该外源的信号肽编码区可能是必需的。备选地,该外源的信号肽编码区可完全替换天然的信号肽编码区以增加该多肽的分泌。然而,指导该表达的多肽进入所选择的宿主细胞的分泌途径,即分泌进入培养基的任何信号肽编码区可用于本发明。用于细菌宿主细胞的有效的信号肽编码区是从芽胞杆菌NCIB11837生麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)、和枯草芽孢杆菌prsA的基因获得的信号肽编码区。进一步的信号肽在SimonenandPalva,1993,MicrobiologicalReviews57109-137中有描述。用于丝状真菌宿主细胞的有效的信号肽编码区是从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、Humicolainsolens纤维素酶、Humicolainsolens葡聚糖内切酶V、和Humicolalanuginosa脂肪酶的基因获得的信号肽编码区。在优选的方面,信号肽编码区是编码SEQIDNO2的第1至19位氨基酸的SEQIDNO1的第330至387位核苷酸。在优选的方面,信号肽编码区是编码SEQIDNO4的第1至17位氨基酸的SEQIDNO3的第47至97位核苷酸。在优选的方面,信号肽编码区是编码SEQIDNO6的第1至19位氨基酸的SEQIDNO5的第69至125位核苷酸。在优选的方面,信号肽编码区是编码SEQIDNO8的第1至18位氨基酸的SEQIDNO7的第1至54位核苷酸。在优选的方面,信号肽编码区是编码SEQIDNO10的第1至19位氨基酸的SEQIDNO9的第1至57位核苷酸。用于酵母宿主细胞的有用的信号肽是从酿酒酵母α-因子和酿酒酵母转化酶的基因获得的。其他有用的信号肽编码区在Romanosetal.,1992,supra中有描述。调控序列也可以是编码位于多肽氨基末端的氨基酸序列的前肽编码区。所得到的多肽被称为原酶或前多肽(或有时候为酶原)。前多肽一般是非活性的并且可通过从前多肽催化或自催化切割为前肽而被转变为成熟活化的多肽。前肽编码区可从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶、和嗜热毁丝霉漆酶(WO95/33836)的基因获得。当信号肽和前肽区都存在于多肽的氨基末端时,前肽区的位置紧靠多肽的氨基末端,而信号肽区的位置紧靠前肽区的氨基末端。也可能需要添加容许调节该多肽相对于宿主细胞生长而表达的调节序列。调节系统的实例是响应于化学或物理刺激,包括调节化合物的存在而导致打开或关闭基因表达的调节系统。原核系统中的调节系统包括lac、tac、和trp操纵子系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、和米曲霉葡糖淀粉酶启动子可用作调节序列。调节序列的其他实例是容许基因扩增的调节序列。在真核系统中,这些包括在存在氨甲蝶呤时被扩增的二氢叶酸还原酶基因、和由于重金属被扩增的金属硫蛋白基因。在这些情况中,编码该多肽的核苷酸序列被可操作地连接该调节序列。表达载体本发明也涉及包括本发明多核苷酸、启动子、和转录和翻译终止信号的重组表达载体。在此描述的各种核酸和调控序列可被连接在一起以产生可包括容许编码该多肽的核苷酸序列在这些位点插入或取代的一个或多个适当的限制酶切位点的重组表达载体。备选地,本发明的核苷酸序列可通过将该核苷酸序列或包括该序列的核酸构建体插入用于表达的合适载体而被表达。为了产生该表达载体,编码序列位于载体中以使得该编码序列可操作地连接用于表达的合适的调控序列。该重组表达载体可以是能够方便地经受重组DNA方法并且能够导致该核苷酸序列表达的任何载体(例如,质粒或病毒)。载体的选择一般取决于载体与将被导入该载体的宿主细胞的相容性。载体可以是线性的或封闭环形质粒。载体可以是自主复制的载体,即作为染色体外实体存在的载体,其复制与染色体的复制无关,例如质粒,染色体外的元件、微型染色体、或人工染色体。载体可包含用于确保自我复制的任何方式。备选的,载体可以是当被导入宿主细胞时,整合到基因组中并与其已经整合的染色体一起复制的载体。此外,可使用单个载体或质粒或一起包含将被导入宿主细胞基因组的总DNA的两个或多个载体或质粒、或转座子。本发明的载体优选包含容许容易选择转化、转染、转导等细胞的一个或多个可选择的标记。可选择的标记是提供抗微生物或病毒抗性、对重金属的耐受性、原养型至营养缺陷型等的基因产物。细菌可选择标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因、或赋予抗生素抗性,例如氨苄青霉素、卡那霉素、氯霉素、或四环素抗性的标记。用于酵母宿主细胞的合适标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1、和URA3。用于丝状真菌宿主细胞的选择标记包括但不限于,amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸酯(orotidine-5’-phosphate)脱羧酶)、sC(硫酸腺苷转移酶)、和trpC(邻氨基苯甲酸合酶),及其等同物。优选用于曲霉属细胞的是构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyceshygroscopicus)的bar基因。本发明的载体优选包含容许该载体整合进入宿主细胞基因组或容许该载体在细胞中不依赖于基因组而自主复制的元件。为了整合进入宿主细胞基因组,该载体可依赖于编码多肽的多核苷酸序列或通过同源或非同源重组整合进入基因组的载体的任何其他元件。备选地,该载体可包含指导通过同源重组在染色体的准确位置整合进入宿主细胞基因组的附加核苷酸序列。为了增加在准确位置整合的可能性,该整合元件应优选包含足够数目的核酸,例如100至10,000个碱基对,优选400至10,000个碱基对,以及最优选800至10,000个碱基对,其与相应的靶序列具有高度的同一性以增强同源重组的可能性。该整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,载体可通过非同源重组被整合到宿主细胞的基因组中。为了自主复制,载体可进一步包括能够使该载体在所述的宿主细胞中自主复制的复制原点。复制原点可以是在细胞中有功能的调节自主复制的任何质粒复制子。术语“复制原点”或“质粒复制子”在此定义为能够使质粒或载体体内复制的核苷酸序列。细菌复制原点的实例是容许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、和pACYC184,以及容许在芽孢杆菌中复制的pUB110、pE194、pTA1060、和pAMβ1的复制原点。用于酵母宿主细胞的复制原点的实例是2个微粒复制原点,ARS1、ARS4,ARS1和CEN3的组合,以及ARS4和CEN6的组合。用于丝状真菌细胞的复制原点的实例是AMA1和ANS1(Gemsetal.,1991,Gene9861-67;Cullenetal.,1987,NucleicAcidsResearch159163-9175;WO00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可根据WO00/24883中公开的方法来实现。多于一个拷贝的本发明多核苷酸可被插入宿主细胞以增加基因产物的生产。多核苷酸拷贝数的增加可通过将至少一个附加拷贝的序列整合进入宿主细胞基因组或通过伴随该多核苷酸包括可扩增的选择标记基因来获得,其中可通过在存在合适的选择试剂时培养该细胞来选择包含扩增拷贝的选择标记基因和附加拷贝的多核苷酸的细胞。用于连接上述元件以构建本发明的重组表达载体的方法对本领域的技术人员来说是众所周知的(参见例如,Sambrooketal.,1989,同上)。宿主细胞本发明也涉及包括本发明多核苷酸的重组宿主细胞,其可被有利地用于多肽的重组生产。包括本发明多核苷酸的载体被导入宿主细胞以使得该载体保持为如早先所描述的染色体整合物或自我复制的染色体外的载体。术语″宿主细胞″包括由于在复制期间发生突变而不同于亲本细胞的亲本细胞的任何子代。宿主细胞的选择在很大程度上取决于编码该多肽的基因及其来源。宿主细胞可以是单细胞微生物,例如原核生物,或非单细胞微生物,例如真核生物。有用的单细胞微生物是细菌细胞,例如革兰氏阳性细菌,包括但不限于芽胞杆菌属细胞,例如,嗜碱芽胞杆菌、解淀粉芽胞杆菌、短芽孢杆菌、环状杆菌、Bacillusclausii、凝结芽孢杆菌、灿烂芽胞杆菌、迟缓芽胞杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、和苏云金杆菌细胞;或链霉菌属细胞,例如,浅青紫链霉菌和鼠灰链霉菌,或革兰氏阴性细菌,例如大肠杆菌和假单胞菌属。在优选的方面,细菌宿主细胞是迟缓芽胞杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌、或枯草芽孢杆菌细胞。在另一个优选的方面,芽胞杆菌属细胞是嗜碱的芽胞杆菌属。载体进入细菌宿主细胞的导入可能受到例如原生质体转化(参见例如,ChangandCohen,1979,MolecularGeneralGenetics168111-115)、利用感受态细胞(参见例如,YoungandSpizizin,1961,JournalofBacteriology81823-829,orDubnauandDavidoff-Abelson,1971,JournalofMolecularBiology56209-221)、电穿孔(参见例如,ShigekawaandDower,1988,Biotechniques6742-751)、或接合作用(参见例如,KoehlerandThorne,1987,JournalofBacteriology1695771-5278)的影响。宿主细胞也可以是真核生物,例如哺乳动物、昆虫、植物、或真菌细胞。在优选的方面,宿主细胞是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)(如由Hawksworthetal.,In,AinsworthandBisby’sDictionaryofTheFungi,8thedition,1995,CABInternational,UniversityPress,Cambridge,UK所定义的)以及卵菌门(Oomycota)(如Hawksworthetal.,1995,supra,page171所引用的)和所有的分生孢子(mitosporic)真菌(Hawksworthetal.,1995,supra)。在更优选的方面,真菌宿主细胞是酵母细胞。如在此使用的“酵母”包括产子囊酵母(内孢霉目(Endomycetales))、产生担子孢子(basidiosporogenous)的酵母、和属于半知菌类(FungiImperfecti)的酵母(芽生菌目(Blastomycetes))。由于今后酵母的分类可能会有变化,为了本发明的目的,酵母应被定义为如在BiologyandActivitiesofYeast(Skinner,F.A.,Passmore,S.M.,andDavenport,R.R.,eds,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所描述的。在更优选的方面,酵母宿主细胞是假丝酵母属、汉逊氏酵母属(Hansenula)、克鲁维氏酵母属、毕赤氏酵母属、糖酵母属、裂殖酵母属、或耶氏酵母属(Yarrowia)。在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉斯糖酵母、克鲁弗糖酵母、诺地糖酵母、或卵形糖酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维氏酵母(Kluyveromyceslactis)细胞。在另一个最优选的方面,酵母宿主细胞是Yarrowialipolytica细胞。在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌亚门(Eumycota)和卵菌亚门(Oomycota)的全部丝状体形式(如Hawksworthetal.,1995,supra所定义的)。丝状真菌的一般特征为由壳多糖、纤维素、葡聚糖、脱乙酰几丁质、甘露聚糖、和其他复合多糖组成的菌丝体壁。营养生长是通过菌丝的伸长,而碳分解代谢是专性需氧的。相比之下,通过酵母,例如酿酒酵母的营养生长是通过单细胞叶状体的出芽,而碳分解代谢可能是发酵性的。在更优选的方面,丝状真菌宿主细胞是支顶孢属、曲霉属、短梗霉属、Bjerkandera、Ceriporiopsis、鬼伞属(Coprinus)、采绒革盖菌(Coriolus)、隐球酵母属、Filibasidium、镰刀菌属、腐殖菌属、稻瘟霉属、毛霉属、毁丝霉属、瘤胃真菌、脉孢菌属、拟青霉属、青霉属、Phanerochaete、Phlebia、瘤胃真菌(Piromyces)、Pleurotus、裂褶菌属、踝节菌属、热子囊菌属、草根霉属、弯颈霉属、Trametes、或木霉属细胞。在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个最优选的方面,丝状真菌宿主细胞是杆孢状镰孢、Fusariumcerealis、Fusariumcrookwellense、大刀镰孢、、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、Fusariumtorulosum、Fusariumtrichothecioides、或Fusariumvenenatum细胞。在另一个最优选的方面,丝状真菌宿主细胞是Bjerkanderaadusta、Ceriporiopsisaneirina、Ceriporiopsisaneirina、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、Ceriporiopsissubvermispora、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、Humicolainsolens、Humicolalanuginosa、米赫毛霉、嗜热毁丝霉、粗糙链孢霉、产紫青霉、Phanerochaetechrysosporium、Phlebiaradiata、Pleurotuseryngii、Thielaviaterrestris、Trametesvillosa、Trametesversicolor、哈茨木霉、康宁氏木霉(Trichodermakoningii)、Trichodermalongibrachiatum、里氏木霉、或绿色木霉细胞。真菌细胞可通过涉及本来已知方式的原生质体形成、原生质体转化、和细胞壁再生的过程被转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yeltonetal.,1984,ProceedingsoftheNationalAcademyofSciencesUSA811470-1474中有描述。用于转化镰孢种属的合适方法在Malardieretal.,1989,Gene78147-156和WO96/00787中有描述。酵母可利用BeckerandGuarente,InAbelson,J.N.andSimon,M.I.,editors,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,pp182-187,AcademicPress,Inc.,NewYork;Itoetal.,1983,JournalofBacteriology153163;andHinnenetal.,1978,ProceedingsoftheNationalAcademyofSciencesUSA751920描述的方法被转化。生产方法本发明也涉及用于生产本发明多肽的方法,包括(a)在有助于生产该多肽的条件下培养其野生型能够生产该多肽的细胞;以及(b)回收该多肽。优选地,该细胞属于Thielavia属,以及更优选地为Thielaviaterrestris。本发明也涉及用于生产本发明多肽的方法,包括(a)在有助于生产该多肽的条件下培养宿主细胞;以及(b)回收该多肽。本发明也涉及生产本发明多肽的方法,包括(a)在有助于生产该多肽的条件下培养宿主细胞,其中该宿主细胞包括在SEQIDNO1的成熟多肽编码区中具有至少一个突变的突变核苷酸序列,其中该突变的核苷酸序列编码由SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸组成的多肽,以及(b)回收该多肽。在本发明的生产方法中,在适于利用本领域众所周知的方法生产该多肽的培养基中培养该细胞。例如,该细胞可通过在实验室或工业发酵罐,在合适的培养基中和在容许该多肽表达和/或分离的条件下进行摇瓶培养法、和小规模或大规模的发酵(包括连续的、分批、分批饲养、或固态发酵)来培养。该培养法利用本领域已知的方法发生在包括碳和氮源和无机盐的合适营养培养基中。合适的培养基可从商品供应商获得或可根据公开的组合物制备(例如,美国典型培养物保藏中心的目录)。如果该多肽分泌进入营养培养基,可从培养基直接回收该多肽。如果该多肽不分泌进入培养基,其可从细胞裂解物回收。利用在此描述的方法检测具有分解纤维增强活性的多肽。可利用本领域已知的方法回收所得到的多肽。例如,该多肽可从营养培养基通过常规方法回收,包括但不限于离心、过滤、萃取、喷雾干燥、蒸发、或沉淀。本发明的多肽可通过本领域已知的各种方法纯化,包括但不限于色谱法(例如,离子交换、亲合的、疏水的、色谱聚焦、和大小排阻)、电泳方法(例如,预备性等电点聚焦)、差异溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见例如,ProteinPurification,J.-C.JansonandLarsRyden,editors,VCHPublishers,NewYork,1989)来获得基本上纯的多肽。植物本发明也涉及已经用编码本发明具有分解纤维增强活性的多肽的核苷酸序列转化,以使得表达和生产可回收数量的多肽的转基因植物、植物部分、或植物细胞。多肽可从植物或植物部分回收。备选地,包含重组多肽的植物或植物部分可用于改善食物或饲料的质量,例如,提高营养价值、可口性、和流变性,或破坏抗营养因子。转基因的植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草,例如草地早熟禾(meadowgrass)(蓝草(bluegrass),早熟禾属(Poa))、饲用牧草,例如羊茅属(Festuca)、黑麦草属(Lolium)、寒地型牧草(temperategrass),例如剪股颖属(Agrostis),和谷类,例如,小麦、燕麦、黑麦、大麦、稻、高粱,和玉蜀黍(玉米)。双子叶植物的实例是烟草、豆类,例如羽扇豆,马铃薯、糖用甜菜、豌豆、菜豆和大豆,以及十字花科植物(十字花科家族),例如花椰菜、油菜籽(rapeseed)、和紧密相关的模式生物体拟南芥。植物部分的实例是茎、愈伤组织、叶、根、果实、种子、和块茎以及包括这些部分的单独组织,例如,表皮、叶肉、薄壁组织、维管组织、分生组织。特异的植物细胞隔室,例如叶绿体、非原质体、线粒体、液泡、过氧物酶体和细胞质也被认为是植物部分。此外,任何植物细胞,无论其组织起源,都被认为是植物部分。同样,植物部分,例如特异组织和被分离以促进本发明应用的细胞,也被认为是植物部分,例如,胚芽、胚乳、糊粉(aleurone)和种皮。也包括在本发明范围内的是这种植物、植物部分和植物细胞的子代。表达本发明多肽的转基因植物或植物细胞可根据本领域已知的方法构建。简而言之,植物或植物细胞通过将编码本发明多肽的一个或多个表达构建体整合到植物宿主基因组或叶绿体基因组中来构建并且使所得到的改进植物或植物细胞繁殖成为转基因的植物或植物细胞。表达构建体便利地是包括编码本发明多肽、可操作地连接为该核苷酸序列在所选择的植物或植物部分中表达所需要的合适调节序列的多核苷酸的核酸构建体。此外,该表达构建体可包括用于鉴定其中已经被整合入表达构建体和为将该构建体导入所述植物所必需的DNA序列的宿主细胞的选择标记(后者取决于所使用的DNA导入方法)。调节序列,例如启动子和终止子序列以及任选地信号或转运序列的选择是例如根据何时、何处以及怎样需要表达该多肽来确定的。例如,编码本发明多肽的基因的表达可以是组成性的或可诱导的,或可以是发育、阶段或组织特异的,并且该基因产物可靶向于特异的组织或植物部分,例如种子或叶子。调节序列在例如Tagueetal.,1988,PlantPhysiology86506中有描述。对于组成性的表达,可使用35S-CaMV,玉米泛素1、和水稻肌动蛋白1启动子(Francketal.,1980,Cell21285-294,Christensenetal.,1992,PlantMo.Biol.18675-689;Zhangetal.,1991,PlantCell31155-1165)。器官特异性启动子可以是例如,来自贮存库组织,例如种子、马铃薯块茎和果实(Edwards&amp;Coruzzi,1990,Ann.Rev.Genet.24275-303),或来自代谢库组织,例如分生组织(Itoetal.,1994,PlantMol.Biol.24863-878)的启动子,种子特异的启动子,例如来自水稻的谷蛋白、醇溶谷蛋白(prolamin)、球蛋白、或白蛋白的启动子(Wuetal.,1998,PlantandCellPhysiology39885-889),来自豆球蛋白(legumin)B4和蚕豆(Viciafaba)的未知种子蛋白基因的蚕豆启动子(Conradetal.,1998,JournalofPlantPhysiology152708-711),来自种子油体蛋白质的启动子(Chenetal.,1998,PlantandCellPhysiology39935-941),来自欧洲油菜(Brassicanapus)的贮藏蛋白napA启动子,或本领域已知的任何其他的种子特异性启动子,例如在WO91/14772中有描述。此外,启动子可以是叶子特异的启动子,例如来自水稻或番茄的rbcs启动子(Kyozukaetal.,1993,PlantPhysiology102991-1000、小球藻病毒腺嘌呤甲基转移酶基因启动子(MitraandHiggins,1994,PlantMolecularBiology2685-93)、或来自水稻的aldP基因启动子(Kagayaetal.,1995,MolecularandGeneralGenetics248668-674)、或创伤可诱导的启动子,例如马铃薯pin2启动子(Xuetal.,1993,PlantMolecularBiology22573-588)。同样,可通过非生物的处理诱导启动子,例如温度、干旱、或盐度改变,或通过外源地施加活化该启动子的物质来进行诱导,例如,乙醇、雌激素、植物激素,例如乙烯、脱落酸、和赤霉酸,以及重金属。也可使用启动子增强元件来实现本发明多肽在植物中的更高表达。例如,启动子增强元件可以是位于启动子和编码本发明多肽的核苷酸序列之间的内含子。例如Xuetal.,1993,同上公开了利用水稻肌动蛋白1基因的第一个内含子来增强表达。可从本领域可获得的选择该表达构建体的选择标记基因和任何其他部分。核酸构建体根据本领域已知的传统方法被整合到植物基因组中,包括土壤杆菌-介导的转化、病毒-介导的转化、微注射、粒子轰击、生物射弹转化、和电穿孔(Gasseretal.,1990,Science2441293;Potrykus,1990,Bio/Technology8535;Shimamotoetal.,1989,Nature338274)。目前,根瘤土壤杆菌-介导的基因转移是选择用于产生转基因双子叶植物的方法(关于综述,参见HooykasandSchilperoort,1992,PlantMolecularBiology1915-38)并且也可用于转化单子叶植物,尽管对于这些植物经常使用其他的转化方法。目前,选择用于产生转基因单子叶植物的方法是胚芽愈伤组织或发育胚芽的粒子轰击(涂有转化DNA的显微的金或钨颗粒)(Christou,1992,PlantJournal2275-281;Shimamoto,1994,CurrentOpinionBiotechnology5158-162;Vasiletal.,1992,Bio/Technology10667-674)。用于转化单子叶植物的备选方法是以由Omirullehetal.,1993,PlantMolecularBiology21415-428描述的原生质体转化为基础的。转化后,根据本领域已知的方法选择具有整合的表达构建体的转化体,并使其再生成为完整的植株。该转化过程经常被设计用于在再生或随后的世代期间,通过利用例如共同转化两个分开的T-DNA构建体或通过特异重组酶的位点特异切除选择基因来选择性地消除选择基因。本发明也涉及用于生产本发明多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括编码本发明具有分解纤维增强活性的多肽的多核苷酸的转基因植物或植物细胞;以及(b)回收该多肽。除去或减少分解纤维增强活性本发明也涉及生产亲本细胞突变体的方法,其包括断裂或缺失编码本发明多肽的多核苷酸序列、或其部分,其结果形成当在相同条件下比亲本细胞生产更少多肽的突变细胞。突变细胞可通过利用本领域已知的方法,例如插入、破坏、替换或缺失减少或消除编码本发明多肽的核苷酸序列的表达来构建。在优选的方面,该核苷酸序列是非活化的。被改变或失活的核苷酸序列可以是例如为活性所必需的编码区或其部分,或为表达该编码区所需要的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即足够影响该核苷酸序列表达的部分。用于可能改变的其他调控序列包括但不限于,前导序列、多腺苷酸化序列、前肽序列、信号肽序列、转录终止子、和转录活化子。核苷酸序列的改变或失活可通过使亲本细胞经受诱变并且选择其中该核苷酸序列的表达已经被减少或消除的突变细胞来进行。可以是特异的或随机的诱变可通过例如使用合适的物理或化学诱变剂,利用合适的寡核苷酸,或通过使DNA序列经受产生诱变的PCR来进行。此外,诱变可通过使用这些诱变剂的任何组合来进行。适于本目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N′-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、乙基甲烷磺酸盐(EMS)、亚硫酸氢钠、甲酸、和核苷酸类似物。当使用这种试剂时,一般通过在适宜条件下,在存在所选择的诱变剂时培养待诱变的亲本细胞来进行诱变,并且筛选和/或选择显示减少或没有该基因表达的突变细胞。核苷酸序列的改变或失活可通过导入、取代、或除去基因或为其转录或翻译所需要的调节元件中的一个或多个核苷酸来实现。例如,核苷酸可被插入或除去以使得产生终止密码子的导入、起始密码子的去除、或开放阅读框的变化。这种改变或失活可根据本领域已知的方法通过定点诱变或产生诱变的PCR来实现。虽然原则上可在体内,即直接在表达待改变的核苷酸序列的细胞上进行改变,优选如下列举例说明的在体外进行改变。消除或减少细胞表达核苷酸序列的便利方法的实例是以基因替换、基因缺失、或基因破坏的技术为基础的。例如,在基因破坏方法中,在体外诱变处理相当于内源核苷酸序列的核酸序列以产生然后被转变成亲本细胞的缺陷性核酸序列以生产缺陷性基因。通过同源重组,缺陷性核酸序列替换内源的核苷酸序列。可能需要缺陷性核苷酸序列也编码可用来选择其中该核苷酸序列已经被改变或破坏的转化体的标记物。在特别优选的实施方案中,用例如在此所描述的选择性标记断裂该核苷酸序列。备选地,核苷酸序列的改变或失活可通过已建立的利用与该核苷酸序列互补的序列的反义或RNAi技术进行。更具体地,通过细胞的核苷酸序列的表达可通过导入与可在细胞中转录并能够与细胞中产生的mRNA杂交的基因核苷酸序列互补的序列来减少或消除。在容许互补的反义核苷酸序列与mRNA杂交的条件下,由此翻译的蛋白质的数量被减少或消除。本发明进一步涉及包括断裂或缺失编码本发明多肽的多核苷酸序列、或其调控序列的亲本细胞的突变细胞,其结果形成比该亲本细胞生产更少多肽的突变细胞。如此产生的缺陷多肽的突变细胞特别可用作表达天然和/或异源蛋白质的宿主细胞。因此,本发明进一步涉及用于生产天然或异源蛋白质的方法,包括(a)在有助于生产该蛋白质的条件下培养突变细胞;以及(b)回收该多肽。术语″异源蛋白质″在此定义为与宿主细胞非天然的蛋白质,其中已经产生修饰以改变该天然序列的天然蛋白质,或由于重组DNA技术操作宿主细胞的结果其表达被定量地改变的天然蛋白质。在进一步的方面,本发明涉及通过使生产本发明多肽的细胞发酵以及通过在发酵已经完成前、期间或之后向发酵液添加能够抑制分解纤维增强活性的有效量试剂来生产感兴趣的蛋白质产品,从发酵液回收感兴趣的产品,和任选地使该回收产品经受进一步的纯化来生产基本上无分解纤维增强活性的蛋白质产物的方法。在进一步的方面,本发明涉及通过在容许表达该产品的条件下培养细胞,使所得到的培养肉汤经受组合的pH和温度处理使得基本上减少分解纤维增强活性,并从培养肉汤回收该产品来生产基本上无分解纤维增强活性的蛋白质产品。备选地,组合的pH和温度处理可在从培养肉汤回收的酶制剂上进行。组合的pH和温度处理可任选地与分解纤维增强抑制剂的处理组合使用。根据本发明的这个方面,可能除去至少60%、优选至少75%、更优选至少85%、更优选至少95%、以及最优选至少99%的分解纤维增强活性。可利用这个方法实现分解纤维增强活性的完全去除。组合的pH和温度处理优选在pH4-5和温度为80-90℃进行足够的时段以达到所需要的效果。用于培养和纯化感兴趣的产品的方法可通过本领域已知的方法进行。本发明的用于生产基本上无分解纤维增强的产物的方法对于生产真核多肽,特别是例如酶的真菌蛋白质有特别的重要性。该酶可选自,例如,淀粉分解酶、脂肪分解酶、蛋白水解酶、溶细胞酶、氧化还原酶、或植物细胞壁降解酶。这些酶的实例包括氨肽酶、淀粉酶、淀粉葡萄糖苷酶、碳水化合物分解酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡萄糖氧化酶、葡糖苷酶、盐过氧化物酶(haloperoxidase)、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶、或木聚糖酶。分解纤维增强-欠缺的细胞也可用于表达药物学上感兴趣的异源蛋白质,例如激素、生长因子、受体等。可理解的是术语″真核多肽″不仅包括天然多肽,而且包括例如已经通过氨基酸取代、缺失或添加、或其他这种修饰以增强活性、热稳定性、pH耐受性等而改变的酶的多肽。在进一步的方面,本发明涉及通过本发明的方法生产的基本上无分解纤维增强活性的蛋白质产品。组合物本发明也涉及包括本发明多肽的组合物。优选地,该组合物富集这种多肽。术语″富集″表明该组合物的分解纤维增强活性已经增加,例如,其富集系数为至少1.1。该组合物可包括本发明的多肽作为主要成分,例如,单组分组合物。备选地,该组合物可进一步包括一种或多种酶促活性,例如氨肽酶、淀粉酶、碳水化合物分解酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、盐过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。可例如通过属于下列属的微生物生产另外的酶,曲霉属、优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、或米曲霉;镰孢属,优选杆孢状镰孢、Fusariumcerealis、Fusariumcrookwellense、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、Fusariumtoruloseum、Fusariumtrichothecioides、或Fusariumvenenatum;腐殖菌属、优选Humicolainsolens或Humicolalanuginosa;或木霉属、优选哈茨木霉属、康宁氏木霉、Trichodermalongibrachiatum、里氏木霉、或绿色木霉。该多肽组合物可根据本领域已知的方法来制备并且可以是液体或干组合物的形式。例如,该多肽组合物可以是粒化或微粒化的形式。包括在该组合物中的多肽可根据本领域已知的方法被稳定化。如下给出优选使用本发明多肽组合物的实例。本发明多肽组合物的剂量和使用该组合物的条件可根据本领域已知的方法确定。降解或转化生物质为单糖、二糖、和多糖本发明也涉及用于降解或转换纤维素物质的方法,包括在存在有效量的具有分解纤维增强活性的多肽时,用有效量的分解纤维蛋白质处理纤维素物质,其中该具有分解纤维增强活性的多肽的存在与缺少具有分解纤维增强活性的多肽相比增加了纤维素物质的降解。本发明的多肽和宿主细胞可用于生产单糖、二糖、和多糖作为用于生产乙醇、塑料、其他产品或中间物的来自生物质的化合物或发酵原料。特别地,本发明的多肽和宿主细胞可用于通过纤维素或半纤维素的部分或完全的溶解作用增加工艺残渣(干燥的蒸馏谷类物、来自酿造的酒糟(spentgrain)、甘蔗渣(bagasse)等)的价值。在通过分解纤维素物质为葡萄糖、木糖、甘露糖、半乳糖、和阿拉伯糖的分解纤维蛋白质促进该过程中,它们的聚合物、或产品如下所述来源于它们。该多肽可以是有或没有细胞的粗制发酵液形式,或是半纯化或纯化酶制剂的形式。分解纤维增强的蛋白质可以是单组分制品,例如家族61蛋白质,多组分的蛋白质制品,例如许多家族61蛋白质或多组分和单组分蛋白质制品的组合。分解纤维增强的蛋白质可在酸性、中性、或碱性pH-范围中促进分解纤维蛋白质的活性备选地,本发明的宿主细胞可用作生物质发酵过程中多肽的来源。宿主细胞也可包含编码分解纤维蛋白质以及其他用于生物质加工的其他酶的天然或异源基因。生物质可包括但不限于,木材资源、城市固体废物、废纸、农作物、和作物残渣(参见,例如,Wiselogeletal.,1995,inHandbookonBioethanol(CharlesE.Wyman,editor),pp.105-118,Taylor&amp;Francis,WashingtonD.C.;Wyman,1994,BioresourceTechnology503-16;Lynd,1990,AppliedBiochemistryandBiotechnology24/25695-719;Mosieretal.,1999,RecentProgressinBioconversionofLignocellulosics,inAdvancesinBiochemicalEngineering/Biotechnology,T.Scheper,managingeditor,Volume65,pp.23-40,Springer-Verlag,NewYork)。生物质初生细胞壁中的主要多糖是纤维素,第二最充足的是半纤维素,而第三位的是果胶。在细胞已经停止生长后产生的次生胞壁也包含多糖,并且通过共价交联于半纤维素的聚合木质素被加强。纤维素是脱水纤维二糖的同聚物,并且因此是线性的β-(1-4)-D-葡聚糖,而半纤维素包括具有广谱取代的复杂分支结构的各种化合物,例如木聚糖、木糖葡萄糖、阿拉伯糖基木聚糖、和甘露聚糖。虽然一般是多形态的,纤维素在植物组织中主要作为平行葡聚糖链的不溶结晶基体存在。半纤维素通常以氢键连接纤维素,以及其他的半纤维素,其帮助稳定该细胞壁基质。在本发明的方法中,分解纤维的蛋白质可以是涉及纤维素物质至葡萄糖、或半纤维素至木糖、甘露糖、半乳糖、和阿拉伯糖、其聚合物、如下所述来源于其的产物的过程的任何蛋白质。分解纤维的蛋白质可以是如下定义的单组分制品,例如纤维素酶,多组分的制品,例如,葡聚糖内切酶、纤维二糖水解酶、葡萄糖水解酶、β-葡糖苷酶或多组分和单组分蛋白质制品的组合。分解纤维的蛋白质可具有活性,即在酸性、中性或碱性pH-范围内水解纤维素的活性。分解纤维的蛋白质可以是真菌或细菌起源,其可从已知能够生产纤维素分解酶的微生物获得或分离和纯化,例如,芽胞杆菌属、假单胞菌属、腐殖菌属、鬼伞属、草根霉属、镰孢属、毁丝霉属、支顶孢属、头孢属、柱霉属(Scytalidium)、青霉属或曲霉属(参见例如,EP458162)的种属,特别是通过选自Humicolainsolens(二级分类为嗜热柱霉(Scytalidiumthermophilum),参见例如美国专利号4,435,307)灰盖鬼伞、尖孢镰孢、嗜热毁丝霉、Meripilusgiganteus、Thielaviaterrestris、支顶孢种属、Acremoniumpersicinum、Acremoniumacremonium、Acremoniumbrachypenium、Acremoniumdichromosporum、Acremoniumobclavatum、Acremoniumpinkertoniae、Acremoniumroseogriseum、Acremoniumincoloratum、和Acremoniumfuratum的菌株生产的;优选来自种属HumicolainsolensDSM1800、尖孢镰孢DSM2672、嗜热毁丝霉CBS117.65、头孢种属RYM-202、支顶孢种属CBS478.94、支顶孢属CBS265.95、AcremoniumpersicinumCBS169.65、AcremoniumacremoniumAHU9519、头孢属CBS535.71、AcremoniumbrachypeniumCBS866.73、AcremoniumdichromosporumCBS683.73、AcremoniumobclavatumCBS311.74、AcremoniumpinkertoniaeCBS157.70、AcremoniumroseogriseumCBS134.56、AcremoniumincoloratumCBS146.62、和AcremoniumfuratumCBS299.70H。分解纤维的蛋白质也可获得自木霉属(特别是绿色木霉、里氏木霉、和康宁氏木霉)、嗜碱芽胞杆菌(参见例如,美国专利号3,844,890和EP458162)、和链霉菌属(参见例如,EP458162)。包括化学改变的或蛋白质工程化的突变体。特别合适的分解纤维的蛋白质是碱性或中性的纤维素酶。这种纤维素酶的实例是在EP495,257、EP531,372、WO96/11262、WO96/29397、WO98/08940中描述的纤维素酶。其他的实例是在例如WO94/07998、EP531,315、美国专利号4,435,307、美国专利号5,457,046、美国专利号5,648,263、美国专利号5,686,593、美国专利号5,691,178、美国专利号5,763,254、美国专利号5,776,757、WO89/09259、WO95/24471、WO98/12307和PCT/DK98/00299中描述的纤维素酶变体。用于本发明方法的分解纤维的蛋白质和分解纤维增强的蛋白质可通过在包含合适碳和氮源和无机盐的营养培养基上,利用本领域已知的方法发酵上述记录的微生物菌株生产(参见例如,Bennett,J.W.andLaSure,L.(eds.),MoreGeneManipulationsinFungi,AcademicPress,CA,1991)。合适的培养基可从商品供应商获得或可根据公开的组合物制备(例如,美国典型培养物保藏中心的目录)。适于生长和分解纤维蛋白质生产的温度范围及其他条件是本领域已知的(参见例如,Bailey,J.E.,andOllis,D.F.,BiochemicalEngineeringFundamentals,McGraw-HillBookCompany,NY,1986)。该发酵可以是导致表达或分离分解纤维蛋白质或分解纤维增强蛋白质的细胞培养的任何方法。因此发酵可理解为包括在实验室或工业发酵罐中,在合适的培养基和容许分解纤维蛋白质或分解纤维增强蛋白质表达或分离的条件下进行摇瓶培养法、小-或大规模的发酵(包括连续的、分批的、分批饲养、或固态发酵)。通过上述方法生产所得到的分解纤维蛋白质或分解纤维增强的蛋白质可通过常规方法从发酵培养基中回收,包括但不限于离心、过滤、喷雾干燥、蒸发或沉淀。回收的蛋白质可进一步通过各种色谱分析方法纯化,例如离子交换色谱法、凝胶过滤色谱法、亲和色谱法等。分解纤维的蛋白质可水解或羧甲基纤维素(CMC),由此降低培养混合物的粘性。所得到的粘性降低可通过振动粘度计测定(例如,来自Sofraser,法国的MIVI3000)。按术语纤维素酶粘度单位(CEVU)计量的纤维素酶活性的测定通过测量该样品降低羧甲基纤维素(CMC)溶液粘度来定量存在于样品中的催化活性数量。在适于分解纤维蛋白质和底物的温度和pH进行该分析。对于CelluclastTM(NovozymesA/S,Bagsvrd,Denmark),该分析在40℃,0.1M磷酸盐pH9.0缓冲液中,以CMC作为底物(33.3g/L羧甲基纤维素Hercules7LFD)和酶浓度为大约3.3-4.2CEVU/ml进行30分钟。相对于发表的酶标准例如CELLUZYMETM标准17-1194(获得自NovozymesA/S,Bagsvrd,Denmark)计算CEVU活性。适用于本发明的分解纤维制品的实例包括例如,CELLUCLASTTM(获得自NovozymesA/S)和NOVOZYMTM188(获得自NovozymesA/S)。包括可使用的纤维素酶的其他商业上可购买的制剂包括CELLUZYMETM、CEREFLOTM和ULTRAFLOTM(NovozymesA/S)、LAMINEXTM和SPEZYMETMCP(GenencorInt.)、以及ROHAMENTTM7069W(RhmGmbH)。纤维素酶以固体的大约0.001%至大约5.0%wt.,更优选固体的大约0.025%至大约4.0%wt.,以及最优选固体的大约0.005%至大约2.0%wt.的有效量添加。如上所述,用于本发明方法的分解纤维蛋白质或分解纤维增强的蛋白质可以是单组分制剂,即基本上无其他分解纤维组分的成分。单组分可以是重组的成分,即通过克隆编码该单组分的DNA序列,随后用该DNA序列转化细胞并且在宿主中表达来生产的成分(参见例如,WO91/17243和WO91/17244)。单组分分解纤维蛋白质的其他实例包括但不限于在JP-07203960-A和WO-9206209中公开的那些。宿主优选是异源的宿主(酶对于宿主是外来的),但在一定条件下该宿主也可以是同源的宿主(酶对于宿主是天然的)。单组分分解纤维的蛋白质也可通过从发酵液纯化这种蛋白质来制备。用于实现本发明方法的单组分分解纤维蛋白质的实例包括但不限于葡聚糖内切酶、纤维二糖水解酶、葡萄糖水解酶、和β-葡糖苷酶。术语“葡聚糖内切酶”在此定义为内-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenin)、混合β-1,3的β-1,4键葡聚糖,例如谷物β-D-葡聚糖或木糖葡萄糖、及包含纤维素成分的其他植物材料中1,4-β-D-糖苷键的内水解。为了本发明的目的,葡聚糖内切酶活性利用羧甲基纤维素(CMC)水解根据Ghose,1987,PureandAppl.Chem.59257-268的方法来确定。外-1,4-β-D-葡聚糖酶包括纤维二糖水解酶和葡萄糖水解酶。术语“纤维二糖水解酶”在此定义为1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化纤维素、纤维寡糖、或包含从还原或非还原的链末端释放纤维二糖的聚合物的任何β-1,4-连接的葡萄糖中1,4-β-D-糖苷键的水解。为了本发明的目的,纤维二糖水解酶活性根据Leveretal.,1972,Anal.Biochem.47273-279和vanTilbeurghetal.,1982,FEBSLetters149152-156;vanTilbeurghandClaeyssens,1985,FEBSLetters187283-288描述的方法确定。在本发明中,Leveretal.方法用来评估玉米秸中纤维素的水解,而vanTilbeurghetal.的方法用来确定纤维二糖水解酶对荧光二糖衍生物的活性。术语“葡萄糖水解酶”在此定义为1,4-β-D-葡聚糖葡萄糖水解酶(E.C.3.2.1.74),其催化1,4-β-D-葡聚糖中1,4-键(O-糖基键)的水解以使得移除连续的葡萄糖单体。为了本发明的目的,外葡聚糖酶活性根据Himmeletal.,1986,J.Biol.Chem.26112948-12955描述的方法确定。术语“β-葡糖苷酶”在此定义为β-D-糖苷葡萄糖水解酶(E.C.3.2.1.21),其催化伴随有β-D-葡萄糖释放的末端非还原的β-D-葡萄糖残基的水解。为了本发明的目的,β-葡糖苷酶活性根据Venturietal.,2002,J.BasicMicrobiol.4255-66描述的基本方法确定,除了使用如在此描述的不同条件。一单位的β-葡糖苷酶活性定义为在50℃,pH5,在100mM柠檬酸钠,0.01%Tween-20中,从4mMp-硝基酚基-β-D-glucopyranoside底物每分钟生产的1.0μ摩尔的p-硝基酚。本发明的多肽用于连接分解纤维的蛋白质以降解生物质底物的纤维素成分,(参见例如,Brighametal.,1995,inHandbookonBioethanol(CharlesE.Wyman,editor),PP.119-141,Taylor&amp;Francis,WashingtonD.C.;Lee,1997,JournalofBiotechnology561-24)。具有分解纤维增强活性的多肽和分解纤维蛋白质的最适宜数量取决于几个因素,包括但不限于,构成分解纤维蛋白质的混合物、纤维素底物、纤维素底物的浓度、纤维素底物的预处理、温度、时间、pH、和包含的发酵生物(例如,用于同时糖化和发酵的酵母)。术语“分解纤维的蛋白质”在此定义为显示能够在测试条件下水解或转化或降解纤维素的蛋白质或蛋白质混合物。它们的数量通常通过常见的分析来测量例如BCA(bicinchoninicacid,P.K.Smithetal.,1985,Anal.Biochem.15076),并且优选添加的数量与待水解的生物质的数量成比例。在优选的方面,每g纤维素物质中具有分解纤维增强活性的多肽的数量是每g纤维素物质大约0.01至大约2.0mg,优选大约0.025至大约1.5mg,更优选大约0.05至大约1.25mg,更优选大约0.075至大约1.25mg,更优选大约0.1至大约1.25mg,更优选大约0.15至大约1.25mg,以及最优选大约0.25至大约1.0mg。在另一个优选的方面,每g纤维素物质中分解纤维蛋白质的数量是每g纤维素物质大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg更优选大约0.5至大约10mg以及最优选大约2.5至大约10mg。在优选的方面,每g分解纤维的蛋白质中具有分解纤维增强活性的多肽的数量是每g分解纤维的蛋白质大约0.005至大约1.0g,优选大约0.01至大约1.0g,更优选大约0.15至大约0.75g,更优选大约0.15至大约0.5g,更优选大约0.1至大约0.5g,更优选大约0.1至大约0.5g,以及最优选大约0.05至大约0.2g。本发明的方法可用于加工纤维素物质成为许多有用的有机产品、化学品和燃料。除乙醇之外,可从纤维素生产的一些商品和特殊化学品包括木糖、丙酮、乙酸酯、甘氨酸、赖氨酸、有机酸(例如,乳酸)、1,3-丙二醇、丁二醇、甘油、乙二醇、糠醛、polyhydroxyalkanoates、cis、顺式己二烯二酸、和动物饲料(Lynd,L.R.,Wyman,C.E.,andGerngross,T.U.,1999,BiocommodityEngineering,Biotechnol.Prog.,15777-793;Philippidis,G.P.,1996,Cellulosebioconversiontechnology,inHandbookonBioethanolProductionandUtilization,Wyman,C.E.,ed.,Taylor&amp;Francis,Washington,DC,179-212;andRyu,D.D.Y.,andMandels,M.,1980,Cellulasesbiosynthesisandapplications,Enz.Microb.Technol.,291-102)。潜在的共生产利益延伸超过来自发酵性碳水化合物的多种有机产品的合成。生物过程后剩余的富含木质素的残渣可被转化为木质素衍生的化学品,或用于电力生产。根据本发明的方法,用于加工纤维素物质的常用方法是本领域技术人员充分了解的。本发明的方法可利用根据本发明操作而配置的任何传统的生物质加工设备来实施。这种设备可包括分批搅拌的反应器、具有超滤作用的连续流动搅拌的反应器、连续推流柱(plug-flow)的反应器(Gusakov,A.V.,andSinitsyn,A.P.,1985,Kineticsoftheenzymatichydrolysisofcellulose1.Amathematicalmodelforabatchreactorprocess,Enz.Microb.Technol.7346-352)、摩擦反应器(Ryu,S.K.,andLee,J.M.,1983,Bioconversionofwastecellulosebyusinganattritionbioreactor,Biotechnol.Bioeng.2553-65)、或具有通过电磁场感应诱导的密集搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,Appl.Biochem.Biotechnol.56141-153)。传统方法包括但不限于,糖化、发酵、分开的水解和发酵(SHF)、同时的糖化和发酵(SSF)、同时的糖化和共同发酵(SSCF)、混合的水解和发酵(HHF)、和直接的微生物转化(DMC)。SHF使用分开的加工步骤,首先酶促水解纤维素至葡萄糖,然后发酵葡萄糖至乙醇。在SSF中,纤维素的酶促水解和葡萄糖发酵至乙醇被组合为一个步骤(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,inHandbookonBioethanolProductionandUtilization,Wyman,C.E.,ed.,Taylor&amp;Francis,Washington,DC,179-212)。SSCF包括多种糖的共同发酵(Sheehan,J.,andHimmel,M.,1999,Enzymes,energyandtheenvironmentAstrategicperspectiveontheU.S.DepartmentofEnergy’sresearchanddevelopmentactivitiesforbioethanol,Biotechnol.Prog.15817-827)。HHF包括在相同反应器中但在不同温度下进行的两个分开的步骤,即高温酶促糖化,然后是在发酵菌株可忍受的较低温度下的SSF。DMC将全部3个过程(纤维素酶生产、纤维素水解、和发酵)合而为一个步骤(Lynd,L.R.,Weimer,P.J.,vanZyl,W.H.,andPretorius,I.S.,2002,MicrobialcelluloseutilizationFundamentalsandbiotechnology,Microbiol.Mol.Biol.Reviews66506-577)。“发酵”或“发酵过程”是指任何发酵过程或包括发酵步骤的任何过程。发酵过程不加限制地包括,用于生产发酵产品的发酵过程,包括醇类(例如,阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨糖醇、和木糖醇);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、甲叉丁二酸(衣康酸)、乳酸、苹果酸、丙二酸、草酸、丙酸、丁二酸、和木糖酸);酮类(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸,和苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2),和一氧化碳(CO))。发酵过程也包括用于可消费醇类工业(例如,啤酒和葡萄酒)、乳品工业(例如,发酵乳制品)、皮革工业、和烟草工业的发酵过程。本发明进一步涉及生产有机物质的方法,包括(a)在存在有效量的具有分解纤维增强活性的多肽时用有效量的分解纤维蛋白质糖化纤维素物质,其中具有分解纤维增强活性的多肽的存在与缺少具有分解纤维增强活性的多肽相比增加纤维素物质的降解;(b)用一种或多种发酵微生物发酵步骤(a)中糖化的纤维素物质;和(c)从发酵物回收有机物质。该具有分解纤维增强活性的多肽可以是有或没有细胞的粗制发酵液形式,或是半纯化或纯化的酶制剂形式。分解纤维增强的蛋白质可以是单组分制品,例如家族61蛋白质,多组分的蛋白质制品,例如许多家族61蛋白质或多组分和单组分蛋白质制品的组合。有机物质可以是来源于发酵物的任何物质。在优选的实施方案中,该有机物质是醇类。可理解术语“醇类”包括包含一个或多个羟基部分的有机物质。在更优选的实施方案中,该醇类是阿拉伯糖醇。在另一个更优选的实施方案中,醇类是丁醇。在另一个更优选的实施方案中,醇类是乙醇。在另一个更优选的实施方案中,醇类是甘油。在另一个更优选的实施方案中,醇类是甲醇。在另一个更优选的实施方案中,醇类是1,3-丙二醇。在另一个更优选的实施方案中,醇类是山梨糖醇。在另一个更优选的实施方案中,醇类是木糖醇。参见例如,Gong,C.S.,Cao,N.J.,Du,J.,andTsao,G.T.,1999,Ethanolproductionfromrenewableresources,inAdvancesinBiochemicalEngineering/Biotechnology,Scheper,T.,ed.,Springer-VerlagBerlinHeidelberg,Germany,65207-241;Silveira,M.M.,andJonas,R.,2002,Thebiotechnologicalproductionofsorbitol,Appl.Microbiol.Biotechnol.59400-408;Nigam,P.,andSingh,D.,1995,Processesforfermentativeproductionofxylitol-asugarsubstitute,ProcessBiochemistry30(2)117-124;Ezeji,T.C.,Qureshi,N.andBlaschek,H.P.,2003,Productionofacetone,butanolandethanolbyClostridiumbeijerinckiiBA101andinsiturecoverybygasstripping,WorldJournalofMicrobiologyandBiotechnology19(6)595-603。在另一个优选的实施方案中,有机物质是有机酸。在另一个更优选的实施方案中,有机酸是乙酸。在另一个更优选的实施方案中,有机酸是醋酮酸。在另一个更优选的实施方案中,有机酸是己二酸。在另一个更优选的实施方案中,有机酸是抗坏血酸。在另一个更优选的实施方案中,有机酸是柠檬酸。在另一个更优选的实施方案中,有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的实施方案中,有机酸是甲酸。在另一个更优选的实施方案中,有机酸是富马酸(延胡索酸)。在另一个更优选的实施方案中,有机酸是葡糖二酸。在另一个更优选的实施方案中,有机酸是葡糖酸。在另一个更优选的实施方案中,有机酸是葡糖醛酸。在另一个更优选的实施方案中,有机酸是戊二酸。在另一个更优选的实施方案中,有机酸是3-羟基丙酸。在另一个更优选的实施方案中,有机酸是甲叉丁二酸。在另一个更优选的实施方案中,有机酸是乳酸。在另一个更优选的实施方案中,有机酸是苹果酸。在另一个更优选的实施方案中,有机酸是丙二酸。在另一个更优选的实施方案中,有机酸是草酸。在另一个更优选的实施方案中,有机酸是丙酸。在另一个更优选的实施方案中,有机酸是琥珀酸。在另一个更优选的实施方案中,有机酸是木糖酸。参见例如,Chen,R.,andLee,Y.Y.,1997,Membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,Appl.Biochem.Biotechnol.63-65435-448。在另一个优选的实施方案中,有机物质是酮类。可理解术语“酮类”包括包含一个或多个酮类部分的有机物质。在另一个更优选的实施方案中,酮类是丙酮。参见例如,QureshiandBlaschek,2003,supra.在另一个优选的实施方案中,有机物质是氨基酸。在另一个更优选的实施方案中,有机酸是天冬氨酸。在另一个更优选的实施方案中,氨基酸是谷氨酸。在另一个更优选的实施方案中,氨基酸是甘氨酸。在另一个更优选的实施方案中,氨基酸是赖氨酸。在另一个更优选的实施方案中,氨基酸是丝氨酸。在另一个更优选的实施方案中,氨基酸是苏氨酸。参见例如,Richard,A.,andMargaritis,A.,2004,Empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,BiotechnologyandBioengineering87(4)501-515。在另一个优选的实施方案中,有机物质是气体。在另一个更优选的实施方案中,气体是甲烷。在另一个更优选的实施方案中,气体是H2。在另一个更优选的实施方案中,气体是CO2。在另一个更优选的实施方案中,气体是CO。参见例如Kataoka,N.,A.Miya,andK.Kiriyama,1997,Studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,WaterScienceandTechnology36(6-7)41-47;andGunaseelanV.N.inBiomassandBioenergy,Vol.13(1-2),pp.83-114,1997,AnaerobicdigestionofbiomassformethaneproductionAreview。从纤维素物质生产有机物质一般需要四个主要步骤。这四个步骤是预处理、酶促水解、发酵和回收。下列的例证是用于生产乙醇的方法,但可理解相似的方法可用于生产其他的有机物质,例如如上所述的物质。预处理在预处理或预水解步骤中,纤维素物质受热断裂木质素和碳水化合物结构,大部分半纤维素溶解,并产生可接近纤维素分解酶的纤维素部分。用蒸汽直接进行加热或在也可向材料加入催化剂以加速反应的浆液中进行加热。催化剂包括强酸,例如硫酸和SO2,或碱,例如氢氧化钠。预处理阶段的目的是促进酶和微生物的渗透。纤维素生物质也可经受水热蒸汽喷发预处理(参见美国专利申请号20020164730)。糖化在酶促水解,亦称为糖化的步骤中,在此描述的酶被加入预先处理的材料以使纤维素部分转化为葡萄糖和/或其他的糖。糖化一般在搅拌罐式反应器或发酵罐中,在控制的pH、温度、和混合条件下进行。糖化步骤最后可达到200小时。糖化也可在大约30℃至大约65℃,特别是大约50℃的温度,以及在pH范围为大约4和大约5之间,特别是大约pH4.5进行。为了生产可被酵母代谢的葡萄糖,一般在存在β-葡糖苷酶时进行水解。发酵在发酵步骤中,由于预处理和酶促水解步骤从纤维素物质释放的糖通过发酵生物,例如酵母被发酵为乙醇。发酵还可与酶促水解在相同的容器中,也在控制的pH、温度、和混合条件下同时进行。当糖化和发酵在相同容器中同时进行时,该过程一般定义为同时的糖化和发酵或SSF。任何合适的纤维素底物或原料可用于本发明的发酵过程。一般根据所需要的发酵产品,即将从发酵获得的有机物质,和如本领域已知的使用的方法来选择底物。适用于本发明方法的底物的实例,包括包含纤维素的材料,例如从可被发酵微生物代谢的加工的纤维素物质获得的木材或植物残余物或低分子糖DP1-3,并且其可通过直接加入发酵培养基来供给。术语“发酵培养基”可理解为是指在加入发酵微生物前的培养基,例如,由糖化过程产生的培养基,以及在同时的糖化和发酵过程(SSF)中使用的培养基。“发酵微生物”是指适用于所需要发酵过程的任何微生物。本发明所述的合适发酵微生物能够发酵,即直接或间接地转化糖,例如葡萄糖、木糖、阿拉伯糖、甘露糖、半乳糖、或低聚糖成为所需要的发酵产品。发酵微生物的实例包括真菌生物体,例如酵母。优选的酵母包括酵母属的菌株,以及特别是酿酒酵母。可商业购买的酵母包括,例如,RedStar/TM/LesaffreEthanolRed(可从RedStar/Lesaffre,USA商业购买)FALI(可从Fleischmann’sYeast,adivisionofBurnsPhilpFoodInc.,USA商业购买)、SUPERSTART(可从Alltech商业购买)、GERTSTRAND(可从GertStrandAB,Sweden商业购买)和FERMIOL(可从DSMSpecialties商业购买)。在优选的实施方案中,酵母是酵母种属。在更优选的实施方案中,酵母是酿酒酵母。在另一个更优选的实施方案中,酵母是糖化糖酵母(Saccharomycesdistaticus)。在另一个更优选的实施方案中,酵母是葡萄汁酵母(Saccharomycesuvarum)。在另一个更优选的实施方案中,酵母是克鲁维氏酵母(Kluyveromyces)。在另一个更优选的实施方案中,酵母是Kluyveromycesmarxianus。在另一个更优选的实施方案中,酵母是脆壁克鲁维氏酵母(Kluyveromycesfragilis)。在另一个优选的实施方案中,酵母是假丝酵母。在另一个更优选的实施方案中,酵母是Candidapseudotropicalis。在另一个更优选的实施方案中,酵母是Candidabrassicae。在另一个优选的实施方案中,酵母是Clavispora。在另一个更优选的实施方案中,酵母是Clavisporalusitaniae。在另一个更优选的实施方案中,酵母是Clavisporaopuntiae。在另一个优选的实施方案中,酵母是Pachysolen。在另一个更优选的实施方案中,酵母是Pachysolentannophilus。在另一个优选的实施方案中,酵母是Bretannomyces。在另一个更优选的实施方案中,酵母是Bretannomycesclausenii(Philippidis,G.P.,1996,Cellulosebioconversiontechnology,inHandbookonBioethanolProductionandUtilization,Wyman,C.E.,ed.,Taylor&amp;Francis,Washington,DC,179-212)。可有效发酵葡萄糖为乙醇的细菌包括例如,Zymomonasmobilis和Clostridiumthermocellum(Philippidis,1996,supra)。本领域已知如上所述的生物体也可用于生产如在此所描述的其他有机物质。酿酒酵母(Chen,Z.,Ho,N.W.Y.,1993,CloningandimprovingtheexpressionofPichiastipitisxylosereductasegeneinSaccharomycescerevisiae,Appl.Biochem.Biotechnol.39-40135-147;Ho,N.W.Y.,Chen,Z,Brainard,A.P.,1998,GeneticailyengineeredSaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,Appl.Environ.Microbiol.641852-1859)、或例如大肠杆菌的细菌(Beall,D.S.,Ohta,K.,Ingram,L.O.,1991,ParametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantEscherichiacoli,Biotech.Bioeng.38296-303)、Klebsiellaoxytoca(Ingram,L.O.,Gomes,P.F.,Lai,X.,Moniruzzaman,M.,Wood,B.E.,Yomano,L.P.,York,S.W.,1998,Metabolicengineeringofbacteriaforethanolproduction,Biotechnol.Bioeng.58204-214)、和Zymomonasmobilis(Zhang,M.,Eddy,C.,Deanda,K.,Finkelstein,M.,andPicataggio,S.,1995,MetabolicengineeringofapentosemetabolismpathwayinethanologenicZymomonasmobilis,Science267240-243;Deanda,K.,Zhang,M.,Eddy,C.,andPicataggio,S.,1996,Developmentofanarabinose-fermentingZymomonasmobilisstrainbymetabolicpathwayengineering,Appl.Environ.Microbiol.624465-4470)中异源基因的克隆已经导致构建能够转化己糖和戊糖为乙醇(共同发酵)的生物体。酵母或另一种微生物一般被加入降解纤维素或水解物,并且进行发酵大约24至大约96小时,例如大约35至大约60小时。温度一般为大约26℃至大约40℃之间,特别是在大约32℃,以及在大约pH3至大约pH6,特别是在大约pH4-5。在优选的实施方案中,酵母或另一种微生物一般被施用于降解纤维素或水解物,并且进行发酵大约24至大约96小时,例如一般为35-60小时。在优选的实施方案中,温度一般是大约26至大约40℃之间,特别是在大约32℃,并且pH一般是大约pH3至大约pH6,优选大约pH4-5。酵母或另一种微生物优选施用的数量为大约105至1012,优选大约107至1010,特别是每ml发酵液大约5×107活菌计数。在乙醇生产阶段期间,酵母细胞计数优选应处于大约107至1010的范围中,特别是大约2×108。关于利用酵母进行发酵的进一步的指导可在例如“TheAlcoholTextbook”(EditorsK.Jacques,T.P.LyonsandD.R.Kelsall,NottinghamUniversityPress,UnitedKingdom1999)中找到,其在此引入作为参考。本领域中最广泛使用的方法是同时的糖化和发酵(SSF)方法,其中没有糖化保持阶段,意味着酵母和酶被一起加入。对于乙醇生产,发酵后,蒸馏糊状物以提取乙醇。根据本发明方法获得的乙醇可用作例如,燃料乙醇;饮料乙醇,即,可饮用的高纯中性酒精(spirit)、或工业酒精。可与在此描述的任何酶促方法组合使用发酵刺激物以进一步改善发酵过程,以及特别是发酵微生物的特性,例如增加速率和乙醇产量。“发酵刺激物”是指用于发酵微生物,特别是酵母的生长的刺激物。用于生长的优选发酵刺激物包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸酯(pantothenate)、烟酸、内消旋(meso)肌醇、硫胺、吡哆醇、对氨基苯甲酸、叶酸、核黄素、和维生素A、B、C、D、和E。参见例如,Alfenoreetal.,ImprovingethanolproductionandviabilityofSaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,Springer-Verlag(2002),其在此引入作为参考。矿物质的实例包括可补充营养的矿物质和无机盐,包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。回收从发酵的纤维素物质分离醇类并通过蒸馏的传统方法纯化。可获得纯度达到大约96vol.%乙醇的乙醇,其可用作例如燃料乙醇、饮料乙醇,即可饮用的高纯中性酒精、或工业乙醇。对于其他的有机物质,可使用本领域已知的任何方法,包括但不限于色谱法(例如,离子交换、亲合的、疏水的、色谱聚焦、和大小排阻)、电泳方法(例如,预备性的等电点聚焦)、差异溶解度(例如,硫酸铵沉淀)、SDS-PAGE、蒸馏、或萃取法。在本发明的方法中,分解纤维的蛋白质和分解纤维增强的多肽可通过一种或多种附加的酶活性补充以增加纤维素物质的降解。优选附加的酶是半纤维素酶、酯酶(例如,脂肪酶、磷脂酶、和/或角质酶)、蛋白酶、漆酶、过氧化物酶、或其混合物。在本发明的方法中,附加的酶可在发酵之前或发酵期间加入,包括在发酵微生物的繁殖期间或之后加入。在此参考的酶可从任何合适的起源,包括细菌、真菌、酵母或哺乳动物起源衍生或得到。术语“获得的”在此是指该酶已经从天然生产该酶作为天然酶的生物体分离。术语“获得的”在此也指该酶可能已经在宿主生物体中重组生产,其中重组生产的酶对于该宿主生物体是天然的或外来的或具有改变的氨基酸序列、例如,具有被缺失、插入和/或取代的一个或多个氨基酸,即重组生产的酶,其是突变体和/或天然氨基酸序列的片段或通过本领域已知的核酸改组方法生产的酶。包括在天然酶的含义之内的是天然的变体,并且外来酶含义内的是重组获得,例如通过定点诱变或改组获得的变体。酶也可以是纯化的。术语″纯化的″如在此使用的,涵盖了无来自衍生其的生物体的其他成分的酶。术语″纯化的″也涵盖了无来自获得其的天然生物体的其他成分的酶。该酶可以是纯化的,只伴随存在次要数量的其他蛋白质。措词“其他蛋白质”特别涉及其他的酶。术语″纯化的″如在此使用的,也是指除去其他的成分,特别是其他的蛋白质以及最特别地是存在于本发明酶起源的细胞中的其他酶。酶可以是″基本上纯的″,也就是说无来自生产其的生物体,例如用于重组生产酶的宿主生物体的其他成分。在优选的实施方案中,酶是至少75%(w/w)、优选至少80%、更优选至少85%、更优选至少90%、更优选至少95%、更优选至少96%、更优选至少97%、更优选至少98%、或最优选至少99%纯的。在另一个优选的实施方案中,酶是100%纯的。用于本发明的酶可以是适用于在此所描述的方法的任何形式,例如有或没有细胞的粗制发酵物、干燥粉末或颗粒、无粉尘的颗粒、液体、稳定的液体、或被保护的酶。颗粒可例如,如在美国专利号4,106,991和4,661,452中公开的生产,并且可任选地通过本领域已知的方法被包被。液体酶制剂可例如,根据已建立的方法通过添加稳定剂,例如糖、糖醇或另一种多元醇、和/或乳酸或另一种有机酸而被稳定化。被保护的酶可根据EP238,216中公开的方法制备。半纤维素酶半纤维素酶的酶促水解可通过多种真菌和细菌进行。与纤维素降解相似,半纤维素水解需要许多酶的协同作用。半纤维素酶可被分为三个总的种类攻击多糖链内的内在键的内部起作用的酶,从多糖链的还原或非还原末端渐进作用的外部起作用的酶,和水解木质素糖苷键的辅助酶、乙酰酯酶和酯酶例如香豆酸(coumaricacid)酯酶和阿魏酸酯酶(Wong,K.K.Y.,Tan,L.U.L.,andSaddler,J.N.,1988,Multiplicityofβ-1,4-xylanaseinmicroorganismsFunctionsandapplications,Microbiol.Rev.52305-317;Tenkanen,M.,andPoutanen,K.,1992,Significanceofesterasesinthedegradationofxylans,inXylansandXylanases,Visser,J.,Beldman,G.,Kuster-vanSomeren,M.A.,andVoragen,A.G.J.,eds.,Elsevier,NewYork,NY,203-212;Coughlan,M.P.,andHazlewood,G.P.,1993,Hemicelluloseandhemicellulases,Portland,London,UK;Brigham,J.S.,Adney,W.S.,andHimmel,M.E.,1996,HemicellulasesDiversityandapplications,inHandbookonBioethanolProductionandUtilization,Wyman,C.E.,ed.,Taylor&amp;Francis,Washington,DC,119-141)。半纤维素酶包括木聚糖酶、阿拉伯呋喃糖酶、乙酰基木聚糖酯酶、葡糖苷酸酶、内半乳聚糖酶、甘露聚糖酶、内或外阿拉伯糖酶、外半乳聚糖酶、及其混合物。内部起作用的半纤维素酶和辅助酶的实例包括内阿拉伯糖酶、内阿拉伯糖半乳聚糖酶、葡聚糖内切酶、甘露聚糖内切酶、木聚糖内切酶、和feraxan木聚糖内切酶。外部起作用的半纤维素酶和辅助酶的实例包括α-L-阿拉伯糖苷酶、β-L-阿拉伯糖苷酶、α-1,2-L-岩藻糖苷酶、α-D-半乳糖苷酶、β-D-半乳糖苷酶、β-D-葡糖苷酶、β-D-葡糖醛酸酶、β-D-甘露糖苷酶、β-D-木糖苷酶、糖苷外切酶、外纤维二糖酶、外甘露二糖水解酶、外甘露聚糖酶、外木聚糖酶、木聚糖α-葡糖醛酸酶、和松柏苷β-葡糖苷酶。酯酶的实例包括乙酰基酯酶(乙酰基半乳聚糖酯酶、乙酰基甘露聚糖、和乙酰基木聚糖酯酶)和芳基酯酶(香豆酸酯酶和阿魏酸酯酶)。优选地,半纤维素酶是外部起作用的半纤维素酶,以及更优选地,外部起作用的半纤维素酶,其具有在低于pH7的酸性条件下水解半纤维素的能力。适用于本发明的半纤维素酶的实例包括VISCOZYMETM(可从NovozymesA/S,Denmark商业购买)。半纤维素酶的加入有效量是固体的大约0.001%至大约5.0%wt.,更优选固体的大约0.025%至大约4.0%,以及最优选固体的大约0.005%至大约2.0%wt.。木聚糖酶(E.C.3.2.1.8)可从任何合适的来源获得,包括真菌和细菌生物体,例如曲霉属、Disporotrichum、青霉属、脉孢菌属、镰孢属、木霉属、腐殖菌属、THermomyces、和芽胞杆菌属。包括木聚糖酶的优选可商品购买的制剂包括SHEARZYME、BIOFEEDWHEAT、BIO-FEEDPlusL、CELLUCLAST、ULTRAFLO、VISCOZYME、PENTOPANMONOBG、和PULPZYMEHC(NovozymesA/S);和LAMINEX和SPEZYMECP(GenencorInt.)。酯酶可用于生物转化纤维素的酯酶包括乙酰基酯酶,例如乙酰基半乳聚糖、乙酰基甘露聚糖酯酶、和乙酰基木聚糖酯酶、和水解木质素糖苷键的酯酶,例如香豆酸酯酶和阿魏酸酯酶。如在此使用的,“酯酶”亦称为羧酸酯水解酶,是指作用于酯键的酶,并且包括根据酶命名法分类在EC3.1.1羧酸酯水解酶中的酶(EnzymeNomenclature,1992,AcademicPress,SanDiego,California,withSupplement1(1993),Supplement2(1994),Supplement3(1995),Supplement4(1997)andSupplement5,inEur.J.Biochem.2231-5,1994;Eur.J.Biochem.2321-6,1995;Eur.J.Biochem.2371-5,1996;Eur.J.Biochem.2501-6,1997,andEur.J.Biochem.264610-650,1999;respectively)。酯酶的非限制性的实例包括芳基酯酶、三酰基甘油酯酶、乙酰酯酶、乙酰胆碱酯酶、胆碱酯酶、托品酯酶(tropinesterase)、果胶酯酶、固醇酯酶、叶绿素酶、L-阿拉伯糖内酯酶、葡糖酸内酯酶、尿内酯酶、鞣酸酶(tannase)、视黄基棕榈酸酯酶(retinyl-palmitateesterase)、羟基丁酸酯-二聚物水解酶、甘油酯脂肪酶、3-含氧己二酸烯醇-内酯酶、1,4-内酯酶、半乳糖脂酶、4-吡哆醇内酯酶、酰基肉毒碱水解酶、氨酰基-tRNA水解酶、D-阿拉伯糖内酯酶、6-磷酸葡萄糖酸内酯酶、磷脂酶A1、6-乙酰基葡萄糖脱乙酰基酶、脂蛋白脂肪酶、二氢香豆素脂肪酶、柠檬苦素-D-环-内酯酶、类固醇-内酯酶、三乙酸酯-内酯酶,放线菌素内酯酶、苔色酸缩酚酸水解酶(orsellinate-depsidehydrolase)、头孢菌素-C脱乙酰基酶、氯原酸水解酶(chlorogenatehydrolase)、α-氨基酸酯酶、4-甲基草酰乙酸酯酶、羧基次甲基丁烯羟酸内酯酶(carboxymethylenebutenolidase)、脱氧柠檬酸A-环-内酯酶、2-乙酰基-1-烷基甘油磷酸胆碱酯酶、镰孢氨酸-C鸟氨酸酯酶、芥子碱酯酶、蜡-酯水解酶、佛波醇-二酯水解酶、磷脂酰肌醇脱酰基酶、唾液酸O-乙酰酯酶、乙酰氧基丁酰基二噻吩脱乙酰基酶、乙酰水杨酸脱乙酰基酶、甲基伞形基-乙酸酯脱乙酰基酶(methylumbelliferyl-acetatedeacetylase)、2-吡喃酮-4,6-乙基酯内酯酶(2-pyrone-4,6-dicarboxylatelactonase)、N-乙酰基半乳糖单聚糖脱乙酰基酶(N-acetylgalactosaminoglycandeacetylase)、青少年激素酯酶bis(2-乙基己基)邻苯二甲酸酯酶(bis(2-ethylhexyl)phthalateesterase)、蛋白质-谷氨酸甲基酯酶、11-顺式-视黄基-棕榈酸水解酶、全-反式-视黄基-棕榈酸水解酶、L-鼠李糖-1,4-内酯酶(L-rhamnono-1,4-lactonase)、5-(3,4-二乙酰氧基丁-1-基)-2,2′-联噻吩脱乙酰基酶(5-(3,4-diacetoxybut-1-ynyl)-2,2′-bithiophenedeacetylase)、脂肪-酰基-乙基-酯合酶(fatty-acyl-ethyl-estersynthase)、木聚糖-1,4-内酯酶、N-乙酰基葡萄糖胺基磷脂酰肌醇脱乙酰酶(N-acetylglucosaminylphosphatidylinositoldeacetylase)、二甲苯西曲酸酯酶(cetraxatebenzylesterase)、乙酰基烷基甘油乙酰基水解酶、和乙酰基木聚糖酯酶。用于本发明的优选酯酶是脂肪分解酶,例如脂肪酶(被分类为EC3.1.1.3、EC3.1.1.23、和/或EC3.1.1.26)和磷酸酯酶(被分类为EC3.1.1.4和/或EC3.1.1.32,包括被分类为EC3.1.1.5的溶血磷脂酶)。其他优选的酯酶是角质酶(被分类为EC3.1.1.74)。酯酶可以获得改善发酵微生物特性的所需要益处的有效量被加入,例如改变发酵微生物内部和/或外部或发酵微生物细胞膜中的脂类组成/浓度,导致在发酵期间改善溶解物进入和/或离开发酵微生物的移动,和/或提供更多的可代谢能量来源(例如通过转化成分,例如来自玉米底物的油类成为对发酵微生物有用的成分,例如,不饱和脂肪酸和甘油),以增加乙醇产量。有效量酯酶的实例是大约0.01至大约400LU/gDS(干物质)。优选地,酯酶的使用量为大约0.1至大约100LU/gDS,更优选大约0.5至大约50LU/gDS,以及更优选大约1至大约20LU/gDS。此后酯酶数量的进一步优化可利用本领域已知的标准方法获得。一个脂肪酶单位(LU)是以三丁酸甘油酯作为底物和以阿拉伯树胶作为乳化剂在30摄氏度,pH7.0(磷酸盐缓冲液)每分钟解放1.0μmol的可滴定脂肪酸的酶量。在优选的实施方案中,酯酶是脂肪分解酶、更优选是脂肪酶。如在此使用的,“脂肪分解酶”是指脂肪酶和磷脂酶(包括溶-磷脂酶)。脂肪分解酶优选是微生物起源的,特别是细菌、真菌或酵母起源。所使用的脂肪分解酶可来源于任何来源,包括例如,腐化米霉菌(Absidia)的菌株特别是Absidiablakesleena和Absidiacorymbifera,无色杆菌属(Achromobacter)的菌株,特别是Achromobacteriophagus,产气单孢菌属(Aeromonas)的菌株,链格孢属(Alternaria)的菌株,特别是Alternariabrassiciola,曲霉属的菌株,特别是黑曲霉、米曲霉、烟曲霉、和黄曲霉(Aspergillusflavus)、无色杆菌属的菌株,特别是Achromobacteriophagus,短梗霉属(Aureobasidium)的菌株,特别是出芽短梗霉(Aureobasidiumpullulans),芽胞杆菌属的菌株,特别是短小芽胞杆菌(Bacilluspumilus)、嗜热脂肪芽孢杆菌、和枯草芽孢杆菌,Beauveria的菌株,Brochothrix的菌株,特别是Brochothrixthermosohata,假丝酵母的菌株,特别是Candidacylindracea(皱褶假丝酵母)、Candidaparalipolyica、和南极假丝酵母(CandidaAntarctica),Chromobacter的菌株,特别是Chromobacterviscosum,鬼伞属(Coprinus)的菌株,特别是灰盖鬼伞(Coprinuscinereus),镰孢属的菌株,特别是禾谷镰孢、尖孢镰孢、腐皮镰孢(Fusariumsolani)、豌豆腐皮镰孢(Fusariumsolanipisi)、Fusariumroseumculmorum、和Fusariumvenenatum,Geotricum的菌株、特别是Geotricumpenicillatum,汉逊氏酵母属(Hansenula)的菌株,特别是异常汉逊氏酵母(Hansenulaanomala),腐殖菌属(Humicola)的菌株,特别是Humicolabrevispora、Humicolabrevisvar.thermoidea,和Humicolainsolens,Hyphozyma的菌株,乳杆菌属(Lactobacillus)的菌株,特别是Lactobacilluscurvatus,Metarhizium的菌株,毛霉属的菌株,拟青霉属(Paecilomyces)的菌株,青霉属(Pencillium)的菌株,特别是圆弧青霉(Penicilliumcyclopium)、Penicilliumcrustosum和扩展青霉(Penicilliumexpansum),假单胞菌属(Pseudomonas)的菌株,特别是绿脓假单胞菌(Pseudomonasaeruginosa)、产碱假单胞菌(Pseudomonasalcaligenes)、洋葱假单胞菌(Pseudomonascepacia)(同义为,Burkholderiacepacia)、荧光假单胞菌(Pseudomonasfluorescens)、Pseudomonasfragi、Pseudomonasmaltophilia、门多萨假单胞菌(Pseudomonasmendocina)、Pseudomonasmephiticalipolyica、产碱假单胞菌、Pseudomonasplantari、类产碱假单胞菌(Pseudomonaspseudoalcaligenes)、恶臭假单胞菌(Pseudomonasputida)、施氏假单胞菌(Pseudomonasstutzeri)、和Pseudomonaswisconsinensis,RHizooctonia的菌株,特别是Rhizooctoniasolani,根毛霉属(Rhizomucor)的菌株,特别是米黑根毛霉(Rhizomucormiehei),根霉属(Rhizopus)的菌株,特别是Rhizopusjaponicus、小孢根霉(Rhizopusmicrosporus)、和结节根霉(Rhizopusnodosus),红冬孢酵母属(Rhodosporidium)的菌株,特别是念珠状红冬孢酵母(Rhodosporidiumtoruloides)、红酵母属(Rhodotorula)的菌株,特别是粘红酵母(Rhodotorulaglutinis),掷孢酵母属(Sporobolomyces)的菌株,特别是Sporobolomycesshibatanus,Thermomyces的菌株,特别是Thermomyceslanuginosus(以前为Humicolalanuginosa)、Thiarosporella的菌株,特别是Thiarosporellaphaseolina,木霉属的菌株,特别是哈茨木霉和里氏木霉,和/或轮枝孢菌属(Verticillium)的菌株。在优选的实施方案中,脂肪分解酶来源于曲霉属、无色杆菌属、芽胞杆菌属、假丝酵母属、Chromobacter、镰孢属、腐殖菌属、Hyphozyma、假单胞菌属、根毛霉、根霉,或Thermomyces的菌株。在更优选的实施方案中,脂肪分解酶是脂肪酶。在此脂肪酶可由于其能改变发酵培养基(包括发酵酵母)中,例如由玉米底物产生的甘油三酸酯油类和脂肪的结构和组成的能力而被应用。脂肪酶催化不同类型的甘油三酸酯转化,例如水解、酯化作用和酯基转移作用。如本领域众所周知的,合适的脂肪酶包括酸性、中性、和碱性的脂肪酶,尽管酸性的脂肪酶(例如,可从Amano商业购买的脂肪酶GAMANO50)在更低浓度的脂肪酶时与中性或碱性脂肪酶相比似乎是更有效的。用于本发明的优选脂肪酶包括Candidaantarcitca脂肪酶和Candidacylindracea脂肪酶更优选的脂肪酶是纯化的脂肪酶,例如Candidaantarcitca脂肪酶(脂肪酶A)、Candidaantarcitca脂肪酶(脂肪酶B)、Candidacylindracea脂肪酶、和Penicilliumcamembertii脂肪酶。脂肪酶可以是在EP258,068-A中公开的脂肪酶,或可以是脂肪酶变体,例如在WO00/60063或WO00/32758中公开的变体,其在此引入作为参考。优选的可商业购买的脂肪酶包括LECITASETM、LIPOLASETM、和LIPEXTM(可从NovozymesA/S,Denmark商业购买)和GAMANOTM50(可从Amano商业购买)。优选地脂肪酶的使用量为大约1至大约400LU/gDS,优选大约1至大约10LU/gDS,以及更优选大约1至大约5LU/gDS。在本发明另一个优选的实施方案中,酯酶是角质酶。角质酶是能够降解角质的酶。角质酶可来源于任何来源。在优选的实施方案中,角质酶来源于曲霉属的菌株,特别是米曲霉,链格孢属的菌株,特别是Alternariabrassiciola,镰孢属的菌株,特别是腐皮镰孢、豌豆腐皮镰孢、Fusariumroseumculmorum、或Fusariumroseumsambucium,Helminthosporum的菌株,特别是Helminthosporumsativum,腐殖菌属的菌株,特别是Humicolainsolens,假单胞菌属的菌株,特别是门多萨假单胞菌或恶臭假单胞菌,Rhizooctonia的菌株,特别是Rhizooctoniasolani,链霉菌属的菌株,特别是疮痂病链霉菌(Streptomycesscabies),或Ulocladium的菌株,特别是Ulocladiumconsortiale。在最优选的实施方案中,角质酶来源于Humicolainsolens的菌株特别是菌株HumicolainsolensDSM1800。Humicolainsolens角质酶在WO96/13580中有描述,其在此引入作为参考。角质酶可以是变体,例如在WO00/34450和WO01/92502中公开的变体之一,其在此引入作为参考。优选的角质酶变体包括在WO01/92502的实施例2中列出的变体,其在此具体地引入作为参考。酯酶的有效量为大约0.01至大约400LU/gDS,优选大约0.1至大约100LU/gDS,以及更优选大约1至大约50LU/gDS。此后角质酶数量的进一步优化可利用本领域已知的标准方法获得。在另一个优选的实施方案中,酯酶是磷脂酶。如在此使用的,术语“磷脂酶”是对磷脂具有活性,例如水解活性的酶。磷脂,例如卵磷脂或磷脂酰胆碱,由在外部(sn-1)和中间(sn-2)位置用两个脂肪酸酯化和在第三位用磷酸酯化的甘油组成。磷酸可被酯化为氨基醇。可鉴别几种类型的磷脂酶活性,包括水解一个脂酰基(分别在sn-1和sn-2位)以形成溶血磷脂的磷脂酶A1和A2;和水解溶血磷脂中保留的脂酰基的溶血磷脂酶(或磷脂酶B)。磷脂酶C和磷脂酶D(磷酸二酯酶)分别释放二酰基甘油或磷脂酸。术语“磷脂酶”包括具有磷脂酶活性,例如磷脂酶A(A1或A2),磷脂酶B活性,磷脂酶C活性,或磷脂酶D活性的酶。术语“磷脂酶A”如在此使用的,是指涵盖具有磷脂酶A1和/或磷脂酶A2活性的酶。磷脂酶活性可由同时具有其他活性的酶,例如具有磷脂酶活性的脂肪酶来提供。磷脂酶活性可例如来自于具有磷脂酶副活性的脂肪酶。在其他的实施方案中,磷脂酶的酶活性由基本上只具有磷脂酶活性,并且其中该磷脂酶的酶活性不是副活性的酶提供。磷脂酶可以是任何起源的,例如动物来源(例如哺乳动物,例如牛或猪的胰腺),或蛇毒或蜂毒起源。备选地,磷脂酶可以是微生物起源的,例如来自丝状真菌、酵母或细菌,例如曲霉属,例如泡盛曲霉、臭曲霉、日本曲霉、黑曲霉或米曲霉,Dictyostelium,例如,D.discoideum;镰孢属,例如,大刀镰孢、禾谷镰孢、异孢镰孢、腐皮镰孢、尖孢镰孢、或F.venenatum;毛霉属,例如M.javanicus,M.mucedo、或M.subtilissimus;链孢霉属,例如,粗糙链孢霉;根毛霉属,例如R.pusillus;根霉属,例如,R.arrhizus,R.japonicus、或R.srolonifer;Sclerotinia,例如S.libertiana;Trichophyton,例如,T.rubrum;Whetzelinia,例如,W.sclerotiorum;芽孢杆菌属,例如,巨大芽孢杆菌或枯草芽孢杆菌;柠檬酸细菌属(Citrobacter),例如,C.freundii;肠道杆菌属,例如,产气肠杆菌(E.aerogenes)或E.cloacae;爱德华氏菌属(Edwardsiella),E.tarda;Erwinia,例如,E.herbicola;埃希氏杆菌属,例如,大肠杆菌;克雷伯氏杆菌属(Klebsiella),例如,肺炎克雷伯氏杆菌(Klebsiellpneumoniae);变形杆菌(Proteus),例如,P.vulgaris;Providencia,例如,P.stuartii;沙门氏菌属(Salmonella),例如,S.typhimurium;沙雷氏菌属(Serratia),例如,S.liquefasciens,S.marcescens;志贺氏杆菌属(Shigella),例如,S.flexneri;链霉菌属,例如,S.violeceoruber;或耶尔森氏(Yersinia)菌属,例如,Y.enterocolitica。优选的可商业购买的磷脂酶包括LECITASETM和LECITASETMULTRA(可从NovozymesA/S,Denmark商业购买)。磷脂酶的有效量为大约0.01至大约400LU/gDS,优选大约0.1至大约100LU/gDS,以及更优选大约1至大约50LU/gDS。此后磷脂酶数量的进一步优化可利用本领域已知的标准方法获得。蛋白酶在本发明的另一个优选实施方案中,产生酶的至少一种表面活性剂和至少一种碳水化合物与至少一种蛋白酶组合使用。可使用该蛋白酶例如,消化蛋白质来生产游离的氨基氮(FAN)。这种游离的氨基酸起酵母营养物的作用,由此增加酵母的生长并且因此增加乙醇的生产。用于发酵过程的发酵微生物可通过在存在至少一种蛋白酶时繁殖发酵微生物来生产。尽管不限于任何一个操作原理,认为当该发酵微生物随后被用于发酵方法时,伴随有效量的至少一种蛋白酶的发酵微生物的繁殖与在相同条件下没有加入该蛋白酶而繁殖的发酵微生物相比减少了发酵微生物的延迟时间。增长过程中蛋白酶的作用被认为直接或间接地导致分别在发酵期间对发酵微生物有害或有益的基因的抑制或表达,由此减少延迟时间并产生更快速的发酵循环。蛋白酶是本领域已知的,并且是指催化肽键断裂的酶。合适的蛋白酶包括真菌和细菌蛋白酶。优选的蛋白酶是酸性蛋白酶,即,特征在于在低于pH7的酸性条件下能够水解蛋白质的蛋白酶。合适的酸性真菌蛋白酶包括,来源于曲霉属、毛霉属、根霉属、假丝酵母属、采绒革盖菌(Coriolus)、Endothia、Enthomophtra、Irpex、青霉属、Sclerotium、和球拟酵母属(Torulopsis)的真菌蛋白酶。特别关注的是来源于黑曲霉(参见例如,Koazeetal.,1964,Agr.Biol.Chem.Japan28216)、Aspergillussaitoi(参见例如Yoshida,1954,J.Agr.Chem.Soc.Japan2866)、泡盛曲霉(Hayashidaetal.,1977,Agric.Biol.Chem.42927-933、棘孢曲霉(WO95/02044)、或米曲霉的蛋白酶;和来自Mucorpusillus或米赫毛霉(Mucormiehei)的酸性蛋白酶。不是酸性蛋白酶的细菌蛋白酶包括可商业购买的产品ALCALASETM和NEUTRASETM(可从NovozymesA/S获得)。其他的蛋白酶包括来自GenencorInternational,Inc.,USA的GC106和来自NovozymesA/S的NOVOZYMTM50006。优选地,蛋白酶是天冬氨酸蛋白酶,如在例如HandbookofProteolyticEnzymes,EditedbyA.J.Barrett,N.D.RawlingsandJ.F.Woessner,AcademicPress,SanDiego,1998,Chapter270)中所描述的。天冬氨酸蛋白酶的合适实例包括例如,由Berkaetal.,1990,Gene96313;Berkaetal.,1993,Gene125195-198;andGomietal.,1993,Biosci.Biotech.Biochem.571095-1100中所公开的。过氧化物酶具有过氧化物酶活性的其他化合物可以是任何过氧化物酶(EC1.11.1.7),或由此衍生的具有过氧化物酶活性,显示过氧化物酶活性的任何片段。优选地,过氧化物酶由植物(例如,辣根或大豆过氧化物酶)或例如真菌或细菌的微生物生产。一些优选的真菌包括属于半知菌亚门(subdivisionDeuteromycotina)、丝孢菌纲(classHyphomycetes)的菌株,例如镰孢属、腐殖菌属、Tricoderma、漆斑菌属(Myrothecium)、Verticillum、Arthromyces、Caldariomyces、Ulocladium、Embellisia、芽枝霉属(Cladosporium)、或Dreschlera,特别是尖孢镰孢(DSM2672)、Humicolainsolens、里氏木霉、Myrotheciumverrucaria(IFO6113)、Verticillumalboatrum、Verticillumdahlie、Arthromycesramosus(FERMP-7754)、Caldariomycesfumago、Ulocladiumchartarum、Embellisiaalli、或Dreschlerahalodes。其他优选的真菌包括属于担子菌亚门(Basidiomycotina),担子菌纲(Basidiomycetes)的菌株,例如,鬼伞属(Coprinus)、Phanerochaete、采绒革盖菌、或Trametes,特别是灰盖鬼伞f.microsporus(IFO8371)、Coprinusmacrorhizus、Phanerochaetechrysosporium(例如NA-12)、或Trametes(先前称为多孔菌),例如T.versicolor(例如,PR428-A)。进一步优选的真菌包括属于接合菌亚门(Zygomycotina),Mycoraceae纲的菌株的菌株,例如根霉属或毛霉属,特别是Mucorhiemalis。一些优选的细菌包括放线菌目(orderActinomycetales)的菌株,例如球状链霉菌(Streptomycessphereoides)(ATTC23965)、Streptomycesthermoviolaceus(IFO12382)、或Streptoverticillumverticilliumssp.verticillium。其他优选的细菌包括Rhodobactersphaeroides、Rhodomonaspalustri、乳链球菌(Streptococcuslactis)、Pseudomonaspurrocinia(ATCC15958)、荧光假单胞菌(NRRLB-11)、和芽胞杆菌属菌株,例如,短小芽胞杆菌(ATCC12905)和嗜热脂肪芽孢杆菌。进一步优选的细菌包括属于粘球菌属(Myxococcus)的菌株,例如,M.virescens。过氧化物酶也可以是通过包括在培养基中,在容许过氧化物酶表达的条件下培养用携带编码过氧化物酶的DNA序列以及用于表达编码过氧化物酶的DNA序列的DNA序列的重组DNA载体转化的宿主细胞和从该培养物回收过氧化物酶的方法生产的。在优选的实施方案中,重组生产的过氧化物酶是根据WO92/16634来源于鬼伞属,特别是C.macrorhizus或灰盖鬼伞的过氧化物酶。在本发明中,具有过氧化物酶活性的化合物包括过氧化物酶和来源于细胞色素、血红蛋白、或过氧化物酶的过氧化物酶活性片段。一个过氧化物酶单位(POXU)是在下列条件下,于30℃,在0.1M磷酸盐缓冲液pH7.0,0.88mM过氧化氢,和1.67mM2,2’-连氮基-bis(3-乙基苯并噻吩(ethylbenzothiazoline)-6-磺酸酯(sulfonate))(ABTS)中每分钟催化1μmole过氧化氢转化的酶量。追踪反应60秒(混合后15秒),在418nm处吸光率变化应在0.15至0.30的范围内。为了计算活性,使用氧化的ABTS为36mM-1cm-1的吸收系数和每2μmoleABTS氧化有1μmoleH2O2转化的化学当量(stochiometry)。漆酶在本发明中,漆酶和漆酶相关的酶包括被分类为EC1.10.3.2的任何漆酶、被分类为EC1.10.3.1的任何儿茶酚氧化酶、被分类为EC1.3.3.5的任何胆红素氧化酶、或被分类为EC1.14.18.1的任何单酚单加氧酶。上述的酶可以是微生物的,即从细菌或真菌(包括丝状真菌和酵母)获得的,或它们可来源于植物。来自真菌的合适实例包括从曲霉属、脉孢菌属,例如,N.crassa,Podospora,Botrytis,Collybia,Fomes,Lentinus,Pleurotus,Trametes,例如,T.villosa和T.versicolor,Rhizooctonia,例如,R.solani,Coprinus,例如,C.cinereus,C.comatus,C.friesii,和C.plicatilis,Psathyrella,例如,P.condelleana,Panaeolus,例如,P.papilionaceus,Myceliophthora,例如,M.thermophila,Schytalidium,例如,S.thermophilum,Polyporus,例如,P.pinsitus,Pycnoporus,例如,P.cinnabarinus,Phlebia,例如,P.radita(WO92/01046),或采绒革盖菌,例如,毛革盖菌(JP2-238885)的菌株获得的漆酶。来自细菌的合适实例包括从芽胞杆菌属菌株获得的漆酶。获得自Coprinus、Myceliophthora、Polyporus、Pycnoporus、Scytalidium或Rhizoctonia的漆酶是优选的;特别是获得自灰盖鬼伞,Myceliophthorathermophila,Polyporuspinsitus,Pycnoporuscinnabarinus,Scytalidiumthermophilum、或Rhizoctoniasolani的漆酶。可商业购买的漆酶是NS51001(Polyporuspinsitius漆酶,获得自NovozymesA/S,Denmark)和NS51002(Myceliopthorathermophia的漆酶,获得自NovozymesA/S,Denmark)。漆酶或漆酶相关的酶也可以是通过包括在培养基中,在容许漆酶表达的条件下培养用携带编码漆酶的DNA序列以及用于表达编码漆酶的DNA序列的DNA序列的重组DNA载体转化的宿主细胞,和从该培养物回收漆酶的方法生产的。漆酶活性(LACU)是在好气条件下,在pH5.5从syringaldazin的氧化测定的。产生的紫色在530nm处以分光计计量。分析条件是19mMsyringaldazin,23mM乙酸酯缓冲液,pH5.5,30℃,1分钟反应时间。一个漆酶单位(LACU)是在上述条件下每分钟催化1.0μmolesyringaldazin转化的酶量。漆酶活性(LACU)是在好气条件下,在pH7.5从syringaldazin的氧化测定的。产生的紫色在530nm处以分光计计量。分析条件是19mMsyringaldazin,23mMTris/马来酸酯pH7.5,30℃,1分钟反应时间。一个漆酶单位(LACU)是在上述条件下每分钟催化1.0μmolesyringaldazin转化的酶量。本发明的多肽可用于结合上述记录的酶或分解纤维素的蛋白质以进一步降解生物质底物的纤维素成分,(参见例如,Brighametal.,1995,inHandbookonBioethanol(CharlesE.Wyman,editor),pp.119-141,Taylor&amp;Francis,WashingtonD.C.;Lee,1997,JournalofBiotechnology561-24)。本发明的多肽可用于结合上述记录的酶和/或分解纤维素的蛋白质以进一步降解生物质底物的纤维素成分,(参见例如,Brighametal.,1995,inHandbookonBioethanol(CharlesE.Wyman,editor),pp.119-141,Taylor&amp;Francis,WashingtonD.C.;Lee,1997,JournalofBiotechnology561-24)。具有分解纤维增强活性的多肽和分解纤维蛋白质的最适宜数量取决于几个因素,包括但不限于,组成酶的混合物、纤维素底物、纤维素底物的浓度、纤维素底物的预处理、温度、时间、pH、和包含的发酵生物(例如,用于SSF的酵母)。在优选的方面,对纤维素物质具有分解纤维增强活性的多肽的有效量是每g纤维素物质大约0.01至大约2.0mg,优选大约0.025至大约1.5mg,更优选大约0.05至大约1.25mg,更优选大约0.075至大约1.25mg,更优选大约0.1至大约1.25mg,更优选大约0.15至大约1.25mg,以及最优选大约0.25至大约1.0mg。在另一个优选的方面,对纤维素物质的分解纤维蛋白质的有效量是每g纤维素物质大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg,更优选大约0.5至大约10mg,以及最优选大约2.5至大约10mg。在优选的方面,对分解纤维蛋白质具有分解纤维增强活性的多肽的有效量是每g分解纤维的蛋白质大约0.005至大约1.0g,优选大约0.01至大约1.0g,更优选大约0.15至大约0.75g,更优选大约0.15至大约0.5g,更优选大约0.1至大约0.5g,更优选大约0.1至大约0.5g,以及最优选大约0.05至大约0.2g。清洁剂组合物本发明具有分解纤维增加活性的多肽可被加入清洁剂组合物并因此成为清洁剂组合物的组分。本发明的清洁剂组合物可配制为例如手洗或机洗的洗衣店清洁剂组合物,其包括适于染色织物的洗涤添加剂组合物和漂洗添加的织物软化剂组合物,或配制为用于普通家庭坚硬表面清洗操作的清洁剂组合物,或配制用于手洗或机器洗涤的操作。在特定的方面,本发明提供包括本发明多肽的去垢添加剂。去垢添加剂以及清洁剂组合物可包括一种或多种酶,例如蛋白酶、脂肪酶、角质酶、淀粉酶、碳水化合物分解酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶,例如漆酶、和/或过氧化物酶。一般说来,所选择的酶的特性应与所选择的清洁剂相适合,(即,最适pH、与其他酶促和非酶促成分的相容性等),并且该酶应以有效量存在。纤维素酶合适的纤维素酶包括细菌或真菌起源的纤维素酶。也包括化学改变的或蛋白质工程化的突变体。合适的纤维素酶包括来自芽胞杆菌属、假单胞菌属、腐殖菌属、镰孢属、Thielavia、支顶孢属的纤维素酶,例如,在US4,435,307、US5,648,263、US5,691,178、US5,776,757和WO89/09259中公开的从Humicolainsolens、Myceliophthorathermophila和尖孢镰孢产生的真菌纤维素酶。特别合适的纤维素酶是具有颜色关注好处的碱性或中性的纤维素酶。这种纤维素酶的实例是在EP0495257、EP0531372、WO96/11262、WO96/29397、WO98/08940中描述的纤维素酶。其他的实例是例如在WO94/07998、EP0531315、US5,457,046、US5,686,593、US5,763,254、WO95/24471、WO98/12307和PCT/DK98/00299中描述的纤维素酶变体。可商业购买的纤维素酶包括CelluzymeTM、和CarezymeTM(NovozymesA/S)、ClazinaseTM、和PuradaxHATM(GenencorInternationalInc.)、和KAC-500(B)TM(KaoCorporation)。蛋白酶合适的蛋白酶包括动物、植物或微生物起源的蛋白酶。微生物起源是优选的。也包括化学改变的或蛋白质工程化的突变体。蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶,优选碱性的微生物蛋白酶或胰蛋白酶-样蛋白酶。碱性蛋白酶的实例是枯草杆菌蛋白酶,特别是来源于芽孢杆菌,例如,枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(在WO89/06279中有描述)。胰蛋白酶-样蛋白酶的实例是胰蛋白酶(例如,猪或牛起源的)以及在WO89/06270和WO94/25583中描述的镰孢属蛋白酶。有用蛋白酶的实例是在WO92/19729、WO98/20115、WO98/20116、和WO98/34946中描述的变体,特别是在下列的一个或多个位置具有取代的变体27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235、和274。优选的可商业购买的蛋白酶包括AlcalaseTM、SavinaseTM、PrimaseTM、DuralaseTM、EsperaseTM、和KannaseTM(NovozymesA/S)、MaxataseTM、MaxacalTM、MaxapemTM、ProperaseTM、PurafectTM、PurafectOxPTM、FN2TM、和FN3TM(GenencorInternationalInc.)。脂肪酶合适的脂肪酶包括细菌或真菌起源的脂肪酶。也包括化学改变的或蛋白质工程化的突变体。有用脂肪酶的实例包括来自腐殖菌属(同义于Thermomyces)的脂肪酶,例如,如在EP258068中描述的来自H.lanuginosa(T.lanuginosus),或如在WO96/13580中描述的来自H.insolens,例如来自P.alcaligenes或P.pseudoalcaligenes(EP218272)、P.cepacia(EP331376)、P.stutzeri(GB1,372,034)、P.fluorescens、Pseudomonassp.菌株SD705(WO95/06720和WO96/27002)、P.wisconsinensis(WO96/12012)、芽孢杆菌脂肪酶,例如,来自枯草芽孢杆菌(Dartoisetal.,1993,BiochemicaetBiophysicaActa,1131253-360)、嗜热脂肪芽孢杆菌(JP64/744992)或B.pumilus(WO91/16422)。其他的实例是在例如WO92/05249,WO94/01541,EP407225,EP260105,WO95/35381,WO96/00292,WO95/30744,WO94/25578,WO95/14783,WO95/22615,WO97/04079和WO97/07202中描述的脂肪酶变体。优选的可商业购买的脂肪酶包括LipolaseTM和LipolaseUltraTM(NovozymesA/S)。淀粉酶合适的淀粉酶(α和/或β)包括细菌或真菌起源的淀粉酶。也包括化学改变的或蛋白质工程化的突变体。淀粉酶包括,例如,从芽孢杆菌获得的α-淀粉酶,例如在GB1,296,839中详细描述的地衣芽孢杆菌的特定菌株。有用淀粉酶的实例是在WO94/02597、WO94/18314、WO96/23873、和WO97/43424中描述的变体,特别是在下列位置具有一个或多个取代的变体15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。可商业购买的淀粉酶是DuramylTM、TermamylTM、FungamylTM和BANTM(NovozymesA/S)、RapidaseTM和PurastarTM(来自GenencorInternationalInc.)。过氧化物酶/氧化酶合适的过氧化物酶/氧化酶包括植物、细菌或真菌起源的酶。也包括化学改变的或蛋白质工程化的突变体。有用的过氧化物酶的实例包括来自鬼伞属,例如,来自灰盖鬼伞的过氧化物酶,以及如在WO93/24618、WO95/10602、和WO98/15257中描述的其变体。可商业购买的过氧化物酶包括GuardzymeTM(NovozymesA/S)。清洁剂酶可通过添加包含一种或多种酶的单独的添加剂,或通过添加包括所有这些酶的组合添加剂而包括在清洁剂组合物内。本发明的去垢添加剂,即,单独的添加剂或组合添加剂,可配制为例如颗粒、液体、浆液等。优选的去垢添加剂制剂是颗粒,特别是无粉尘的颗粒、液体,特别是稳定的液体或浆液。可例如,如在US4,106,991和4,661,452中所公开的来生产无粉尘的颗粒,并且可任选地通过本领域已知的方法包被。蜡状包被材料的实例是平均摩尔重量为1000至20000的聚(环氧乙烷)产品(聚乙二醇,PEG);具有16至50个环氧乙烷单位的乙氧基壬基酚;其中醇类包含12至20个碳原子并且其中存在15至80个环氧乙烷单位的乙氧基脂肪醇;脂肪醇;脂肪酸;以及脂肪酸的单-和二-和甘油三酸酯。适用于通过流化床技术应用的成膜包被材料的实例在GB1483591中给出。液体酶制剂可例如,根据已建立的方法通过添加多元醇,例如丙二醇、糖或糖醇,乳酸或硼酸而被稳定化。被保护的酶可根据EP238,216中公开的方法制备。本发明的清洁剂组合物可以是任何便利的形式,例如条状、片剂、粉剂、颗粒、糊剂或液体。液体洗涤剂可以是含水的,一般包含达到70%的水和0-30%的有机溶剂,或是无水的。清洁剂组合物包括一种或多种表面活性剂,其可以是非离子的,包括半极性的和/或阴离子的和/或阳离子的和/或两性离子的。表面活性剂一般按重量计算以0.1%至60%的水平存在。当包括在其中时,清洁剂通常包含大约1%至大约40%的阴离子表面活性剂,例如线性的烷基苯磺酸酯、α-烯烃磺酸酯、烷基硫酸酯(脂肪醇硫酸酯)、脂肪醇乙氧基硫酸酯、次级烷基磺酸盐(secondaryalkanesulfonate)、α-磺基脂肪酸甲酯、烷基或烯基琥珀酸、或肥皂。当包括在其中时,清洁剂通常包含大约0.2%至大约40%的非离子型表面活性剂,例如脂肪醇乙氧基化合物、羟乙基壬基酚酯、烷基多糖苷、烷基二甲基胺氧化物、乙氧基脂肪酸单乙醇胺(monoethanolamide)、脂肪酸乙醇胺、多羟基烷基脂肪酸酰胺、或葡糖胺的N-酰基N-烷基衍生物(“葡萄糖胺”)。清洁剂可包含0-65%的洗涤剂增效助剂或络合剂,例如沸石、二磷酸酯(盐)、三磷酸酯(盐)、磷酸酯(盐)、碳酸酯(盐)、柠檬酸酯(盐)、次氮基三乙酸、乙二胺四乙酸、二亚乙基三胺五乙酸、烷基-或烯基琥珀酸、可溶性硅酸盐、或分层(layered)的硅酸盐(例如,来自Hoechst的SKS-6)。清洁剂可包括一种或多种聚合物。实例是羧甲基纤维素、聚(乙烯基吡硌烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯基咪唑)、聚羧化物,例如聚丙烯酸酯、马来酸/丙烯酸酯类(acrylicacid)共聚物、和甲基丙烯酸月桂酯/丙烯酸酯类共聚物。清洁剂(detergent)可包含可能包括例如过硼酸盐或过碳酸盐的H2O2来源的漂白系统,其可与形成过酸的漂白活化剂,例如四乙酰基乙二胺或壬酰基苯酚磺酸酯相组合。备选地,该漂白系统可包括例如酰胺、酰亚胺、或砜类型的过氧酸。本发明的清洁剂组合物的酶可利用传统的稳定剂被稳定,例如,多元醇,例如丙二醇或丙三醇,糖或糖醇,乳酸,硼酸,或硼酸衍生物,例如,芳香族硼酸酯,或苯基硼酸衍生物,例如4-甲酰苯基硼酸,而且该组合物可如例如WO92/19709和WO92/19708中所描述的配制。该清洁剂也可包含其他传统的清洁剂成分,例如织物调节剂,包括粘土、发泡剂、抑泡剂(subssuppressors)、抗腐蚀剂、污垢悬浮剂、抗污垢再沉积试剂、染料、杀菌剂、光增白剂(opticalbrighteners)、水溶助长剂(hydrotropes)、晦暗抑制剂(tamishinhibitor)、或芳香剂。在清洁剂组合物中,任何酶可以相当于每升洗涤液0.01-100mg酶蛋白,优选每升洗液0.05-5mg酶蛋白,特别是每升洗液0.1-1mg酶蛋白的数量添加。在清洁剂组合物中,本发明的具有分解纤维增加活性的多肽可以相当于每升洗涤液0.001-100mg蛋白质,优选0.005-50mg蛋白质,更优选0.01-25mg蛋白质,更优选0.05-10mg蛋白质,最优选0.05-5mg蛋白质,以及最优选0.01-1mg蛋白质的数量添加。本发明具有分解纤维增加活性的多肽也可被掺入WO97/07202中公开的清洁剂配方,其在此引入作为参考。其他用途一般说来,任何植物细胞壁材料的处理可通过补充本发明的具有分解纤维增加活性的多肽来增强。信号肽本发明也涉及包括编码蛋白质的基因的核酸构建体,其中该基因可操作地连接编码由SEQIDNO2的第1至19位氨基酸组成的信号肽的由SEQIDNO1的第241至1331位核苷酸组成的核酸序列、编码由SEQIDNO4的第1至17位氨基酸组成的信号肽的SEQIDNO3的第47至97位核苷酸、编码由SEQIDNO6的第1至19位氨基酸组成的信号肽的SEQIDNO5的第69至125位核苷酸、编码由SEQIDNO8的第1至18位氨基酸组成的信号肽的SEQIDNO7的第1至54位核苷酸、或编码由SEQIDNO10的第1至19位氨基酸组成的信号肽的SEQIDNO9的第1至57位核苷酸核酸序列,其容许蛋白质分泌进入培养基,其中该基因对于核酸序列是外源的。本发明也涉及包括这种核酸构建体的重组表达载体和重组宿主细胞。本发明也涉及用于生产蛋白质的方法,包括(a)在适于生产该蛋白质的条件下培养这种重组宿主细胞;以及(b)回收该蛋白质。蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在此不是意味着是指特定长度的编码产物,并且因此包括肽、寡肽、和蛋白质。术语“蛋白质”也包括组合形成编码产物的两个或多个多肽。该蛋白质也包括杂合的多肽,其包括从至少两个不同的蛋白质获得的部分或完全的多肽序列的组合,其中一个或多个蛋白质对于宿主细胞可以是异源的或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白的天然存在的等位的和工程化的变异。优选地,蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分、或报告子。在更优选的方面,蛋白质是氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。在更优选的方面,蛋白质是氨肽酶、淀粉酶、碳水化物分解酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶,肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。基因可从任何原核的、真核的、或其他的来源获得。本发明通过下列不应被认为限制本发明范围的实施例来进一步加以描述。实施例材料用作缓冲液和底物的化学品是至少为试剂级的商业化产品。菌株ThielaviaterrestrisNRRL8126被用作具有分解纤维增强活性的家族61多肽的来源。米曲霉JaL250菌株(WO99/61651)和里氏木霉RutC30(ATCC56765;MontenecourtandEveleigh,1979,Adv.Chem.Ser.181289-301)用于表达具有分解纤维增强活性的家族61多肽。培养基YEG培养基的组成为每升0.5%的酵母提取物和2%的葡萄糖。马铃薯葡萄糖培养基的组成为每升39克的马铃薯葡萄糖(Difco)。PDA平板的组成为每升39克的马铃薯葡萄糖琼脂。MDU2BP培养基的组成为每升45g麦芽糖,1gMgSO4·7H2O,1gNaCl,2gK2SO4,12gKH2PO4,7g酵母提取物,2g尿素,和0.5mlAMG痕量金属溶液,pH为5.0。AMG痕量金属溶液的组成为每升14.3gZnSO4·7H2O,2.5gCuSO4·5H2O,0.5gNiCl2·6H2O,13.8gFeSO4·7H2O,8.5gMnSO4·H2O,和3g柠檬酸。COVE平板的组成为每升342.3g蔗糖,20mlofCOVE盐溶液,10ml1M乙酰胺,10ml1.5MCsCl2,和25gNoble琼脂。COVE盐溶液的组成为每升26gKCl,26gMgSO4·7H2O,76gKH2PO4,和50mlCOVE痕量金属溶液。COVE痕量金属溶液的组成为每升0.04gNa2B4O7·10H2O,0.4gCuSO4·5H2O,1.2gFeSO4·7H2O,0.7gMnSO4·H2O,0.8gNa2M0O2·2H2O,和10gZnSO4·7H2O。CIM培养基的组成为每升20g纤维素,10g玉米浸泡固体,1.45g(NH4)2SO4,2.08gKH2PO4,0.28gCaCl2,0.42gMgSO4·7H2O,和0.42ml痕量金属溶液,pH到6.0。痕量金属溶液的组成为每升41.2mgFeCl3·6H2O,11.6mgZnSO4·7H2O,5.4mgMnSO4·H2O,2.0mgCuSO4·SH2O,0.48mgH3BO3,和67.2mg柠檬酸。NNCYP培养基的组成为每升5.0gNH4NO3,0.5gMgSO4·7H2O,0.3gCaCl2,2.5g柠檬酸,1.0gBacto蛋白胨,5.0g酵母抽提物,COVE痕量金属溶液,和足够的K2HPO4以达到最终pH为大约5.4。NNCYPmod培养基的组成为每升1.0gNaCl,5.0gNH4NO3,0.2gMgSO4·7H2O,0.2gCaCl2,2.0g柠檬酸,1.0gBacto蛋白胨,5.0g酵母提取物,COVE痕量金属溶液,和足够的K2HPO4以达到pH为大约5.4。LB平板的组成为每升10g胰蛋白胨,5g酵母提取物,5g氯化钠,和15gBacto琼脂。SOC培养基由2%胰蛋白胨,0.5%酵母提取物,10mMNaCl,2.5mMKCl,10mMMgCl2,和10mMMgSO4组成,并且高压灭菌后加入过滤杀菌的葡萄糖至20mM。冷冻培养基由60%的SOC和40%的丙三醇组成。2XYT培养基的组成为每升16g胰蛋白胨,10g酵母提取物,5gNaCl,和15gBacto琼脂。实施例1鉴定来自ThielaviaterrestrisNRRL8126的具有分解纤维增强活性的多肽来自生长在补充有1%Sigmacell(SigmaChemicalCo.,St.Louis,MO)的NNCYPmod培养基上的ThielaviaterrestrisNRRL8126新鲜平板的琼脂糖栓(plug)被接种入补充有1%葡萄糖的50mlNNCYPmod培养基中并且在45℃,200rpm培养25小时。使用2-ml的这种培养物接种入15×100ml(500ml培养瓶)和2×50ml(250ml培养瓶)补充有2%Sigmacell-20的NNCYPmod培养基,并且在45℃,200rpm培养4天。汇集的培养物在3000xg离心10分钟,并且上清液过滤通过Nalgene281-5000玻璃纤维预过滤器(NalgeNuncInt’l.,Rochester,NY)。过滤物冷却至4℃保藏。二维的聚丙烯酰胺凝胶电泳.通过在4℃加入100μl的饱和三氯乙酸(TCA),并且在冰上孵育10分钟,然后加入9ml冰冷的丙酮,进一步在冰上孵育20分钟来沉淀1ml的滤出液。沉淀的溶液于4℃,在10,000xg离心10分钟,弃去上清液,并且用冰冷的丙酮漂洗沉淀颗粒两次并空气干燥。干燥的沉淀颗粒溶解在0.2ml等电聚焦(IEF)样品缓冲液(9.0M尿素,3.1%(wt/v)3-[(3-胆氨基丙基)二甲基-铵基]-1-磺化丙烷(CHAPS,PierceChemicalCo.Rockford,IL),1%(v/v)pH4-7两性电解质,50mM二硫苏糖醇(DTT),和在水中稀释的0.005%溴酚蓝)中。利用来自BioRadLaboratories(Hercules,CA)的AG501-X8(D),20-5-目,混合床树脂,使尿素原液去离子化。去离子化的溶液储存在-20℃。以在LabQuakeTM振荡器上(LabIndustries,Berkeley,CA)轻柔混合使得所得到的混合物溶解几小时。200μl的各个IEF样品缓冲液蛋白质混合物被施加到在IPG再水化盘(AmershamBiosciences,Piscataway,NJ)中的11cmIPG条(BioRadLaboratories,Hercules,CA)上。750μl等分的干条覆盖液体(AmershamBiosciences,Piscataway,NJ)被铺覆在IPG条上以防止蒸发,并利用IPGPhor等电聚焦装置(AmershamBiosciences,Piscataway,NJ)在20℃,施加30伏特容许再水合化12小时。IPGPhor装置被程序设置为恒定电压但每条的最大电流为50μA。再水合作用12小时后,等电聚焦条件如下在200伏特1小时,在500伏特1小时,以及在1000伏特1小时。然后施加的梯度是1000伏特至8000伏特30分钟,并且等电聚焦被程序设置为在8000伏特泳动,当达到>30,000伏特小时,完成泳动。在二维分析前通过在每10mlSDS-平衡缓冲液(50mMTrisHClpH8.8,6.0M尿素,2%(w/v)十二烷基磺酸钠(SDS),30%丙三醇,和0.002%(w/v)溴酚蓝)100mg二硫苏糖醇中首先还原15分钟,然后于黑暗中,在每10ml平衡缓冲液250mg碘乙酰胺中烷基化15分钟,使IPG凝胶条还原和烷基化。IPG条在SDS-PAGE电泳缓冲液(Invitrogen/Novex,Carlsbad,CA)中快速漂洗,并置于11cm,1孔8-16%Tris-甘氨酸SDS-PAGE凝胶(BioRadLaboratories,Hercules,CA)上,利用标准电泳装置(BioRadLaboratories,Hercules,CA)在50伏特电泳直到样品进入凝胶,然后电压增加至200伏特,再电泳直到溴酚蓝染料到达凝胶底部。多肽检测。用荧光SYPRO橙色蛋白质染色剂(MolecularProbes,Eugene,OR)染色该二维凝胶。从Maloneetal.,2001,Electrophoresis,22,919-932优化和改变荧光染色方法。SDS-PAGE凝胶固定在平台摇摆器上的40%乙醇,2%乙酸,和0.0005%SDS中1小时至过夜。除去固定溶液,并且用重复三次的洗涤步骤替代,每次步骤由2%乙酸和0.0005%SDS,30分钟组成。凝胶在黑暗中用2%乙酸,0.0005%SDS,和0.02%SYPRO橙色蛋白质染色剂染色1.5小时至过夜。进一步优化染色和脱色以增加在HoeferProcessorPlus染色装置(AmershamBiosciences,Piscataway,NJ)上的可重复性和自动化程度。利用蓝色荧光和200μm像素(pixel)大小,以及800V的光电倍增管增益,通过在MolecularDynamicsSTORM860成像系统(AmershamBiosciences,Piscataway,NJ)上扫描获得荧光染色的SDS-PAGE凝胶的图像。利用ImageQuant5.0版(AmershamBiosciences,Piscataway,NJ)观察和调整图像。在具有橙色滤光镜的DarkReaderBlue透照镜(ClareChemicalCo,Denver,CO)上进一步观察凝胶。利用2mmAcu-PunchBiopsyPunch(AcudermInc.,Ft.Lauderdale,FL)切下观察到的蛋白质凝胶斑点,并保存在用在60%乙腈中的0.1%三氟乙酸(TFA)预洗涤,然后用HPLC级的水附加洗涤两次的96孔平板中。染色的二维凝胶斑点于-20℃保存在预洗涤平板中的25-50μl水中直到被消化。用于肽测序的多肽的凝胶中消化。使用MultiPROBEIILiquidHandlingRobot(PerkinElmerLifeandAnalyticalSciences,Boston,MA)进行凝胶中消化。含有感兴趣多肽的二维凝胶斑点用在100mM碳酸氢铵pH8.0中的50μl10mMDTT还原30分钟。还原后,凝胶块用在100mM碳酸氢铵pH8.0缓冲液中的50μl55mM碘乙酰胺烷基化20分钟。容许干凝胶块于室温下,在胰蛋白酶消化溶液中膨胀(在50mM碳酸氢铵pH8缓冲液中的6ng/μl测序级胰蛋白酶(Promega,Madison,WI))30分钟,然后在40℃消化8小时。所描述的各个反应步骤后按照制造商的标准方案用适当的溶液进行多次洗涤和预洗涤。反应之间使用50μl乙腈使凝胶脱水,并且步骤之间凝胶块被空气干燥。用在HPLC级水中的1%甲酸/2%乙腈提取肽两次,每次30分钟。肽提取溶液被转移至已经被冷却至10-15℃,并且用96-孔平板盖(PerkinElmerLifeandAnalyticalSciences,Boston,MA)覆盖以防止蒸发的96孔带边的PCR型平板(ABGene,Rochester,NY)中。平板被进一步保存在4℃直到可以进行质谱分析。通过串联质谱分析法的肽测序。对于通过串联质谱分析法的肽测序,Q-TofmicroTM混合的正交四极飞行时间质谱仪(WatersMicromassMSTechnologies,Milford,MA)被用于LC-MS/MS分析。Q-TofmicroTM质谱仪备有UltimateTM毛细管和纳流HPLC系统(Dionex,Sunnyvale,CA),其已经偶连有FAMOS微自动取样器(Dionex,Sunnyvale,CA)和SwitchosII柱转换装置(Dionex,Sunnyvale,CA)用于浓缩和使样品脱盐。样品被加载到固定在注射环中的保卫柱(300μmIDX5cm,C18PepMapTM)(Dionex,Sunnyvale,CA)上,并用在水中的0.1%甲酸,利用SwitchosII泵(Dionex,Sunnyvale,CA),以40μl/分钟洗涤2分钟。肽在75μmIDX15cm,C18,3μm,100PepMapTM纳流融合的毛细管柱(Dionex,Sunnyvale,CA)上,利用NAN-75校准器(Dionex,Sunnyvale,CA)以来自175μl/分钟分流的175nl/分钟流速分离。线性洗提梯度是在45分钟期间,在施加的0.1%甲酸中5%至60%的乙腈。在215nm处监测柱洗脱液,并且通过装备有纳喷射接口的电喷射离子源被导入Q-TofmicroTM质谱仪。Q-TofmicroTM质谱仪利用MassLynxTM软件3.5版(WatersMicromassMSTechnologies,Milford,MA)被完全地为处理控制。以查勘扫描方式获得数据并且随着MS至MS/MS的转换准则质量范围为50至2000m/z,以包括大于10.0计数/秒的离子强度和+2、+3、和+4的电荷状态。可获得达到4个共同洗提种类,具有1.9秒扫描时间和0.1秒内扫描时间的分析谱。一般使用65伏特的锥形电压,跃迁能源被程序设计为根据被洗提肽的质量和电荷状态而变化并且在10-60伏特范围内。所获得的谱是混合的、平滑的、并且以自动化方式定中心而产生峰值列表。相对于所选择的数据库利用ProteinLynxTMGlobalServer1.1软件(WatersMicromassMSTechnologies,Milford,MA)搜索产生的峰值列表。评估来自ProteinLynxTM搜索的结果,通过评估感兴趣的各个离子的MS/MS谱以及通过鉴定y和b离子系列和与适当氨基酸的相配质量差异确定的开头(denovo)序列来进一步分析未鉴定的蛋白质。从大约40kDa多肽凝胶斑点的若干倍增电荷的离子获得来自质谱从头测序的ThielaviaterrestrisGH61B的肽序列。878.422m/z序列的成两倍电荷的胰蛋白酶肽离子被确定为是[Ile或Leu]-Pro-Ala-Ser-Asn-Ser-Pro-Val-Thr-Asn-Val-Ala-Ser-Asp-Asp-[Ile或Leu]-Arg(SEQIDNO11)。765.460的第二个成两倍电荷的胰蛋白酶肽离子被确定为是[Ile或Leu]-Pro-Glu-Asp-[Ile或Leu]-Glu-Pro-Gly-Asp-Tyr-[Ile或Leu]-[Ile或Leu]-Arg(SEQIDNO12)。在实施例24中描述的苯基琼脂糖凝胶纯化步骤后,20μl含有最高分解纤维增加活性的汇集部分与具有50mMDTT的20μl2XSDS-PAGE加样缓冲液混合,并煮沸4分钟。40μl通过SDS-PAGE,利用11cm8-16%Tris-甘氨酸SDS-PAGE梯度凝胶(BioRadLaboratories,Hercules,CA)和Tris-甘氨酸电泳缓冲液(Invitrogen,Carlsbad,CA)分离。SDS-PAGE在还原条件和制造商推荐的方案下电泳(BioRadLaboratories,Hercules,CA)。从盒中移出凝胶,用水漂洗3次,每次至少5分钟,并用Bio-Safe考马斯染色剂(BioRadLaboratories,Hercules,CA)染色1小时,然后用双蒸水脱色超过30分钟。如上所述用胰蛋白酶凝胶内消化明显在大约27kDa处的蛋白条带。如上所述使从消化回收的肽经受串联质谱分析法的肽测序。903.895m/z的成两倍电荷的胰蛋白酶肽离子被确定为具有Cys-Pro-Gly-Ser-Phe-Ser-Ser-Cys-Asp-Gly-Ser-Gly-Ala-Gly-Trp-Phe-Lys(SEQIDNO13,家族GH61D)的序列。415.553m/z的三倍电荷的胰蛋白酶肽离子被确定为是[Ile或Leu]-Asp-Glu-Ala-Gly-Phe-His-Gly-Asp-Gly-Val-Lys(SEQIDNO14,家族GH61D)。另一个565.857m/z的成两倍电荷的胰蛋白酶肽离子被确定为是X-X-Ala-Pro-Gly-Asn-Tyr-[Ile或Leu]-[Ile或Leu]-Arg(SEQIDNO15,家族GH61C)。这些肽序列用来设计用于克隆的引物。实施例2Thielaviaterrestris基因组DNA提取ThielaviaterrestrisNRRL8126于37℃,以250rpm在25mlYEG培养基中生长24小时。然后通过MiraclothTM(Calbiochem,LaJolla,CA)过滤收集菌丝体,并用25ml10mMTris-1mMEDTA(TE)缓冲液洗涤一次。从随后被冷冻在液氮中的菌丝体制品排干过量的缓冲液。冷冻的菌丝体制品在电动咖啡磨碎机中被磨碎成精细粉末,并且该粉末被加入含有20mlTE缓冲液和5ml20%w/v十二烷基磺酸钠(SDS)的一次性塑料离心管中。混合物被轻轻地翻转几次以确保混匀,用等体积的苯酚∶氯仿∶异戊醇(25∶24∶1v/v/v)提取两次。乙酸钠(3M溶液)被加入提取的样品至终浓度为0.3M,然后加入2.5体积的冰冷乙醇以沉淀DNA。试管在15,000xg离心30分钟以沉淀DNA。在重悬在0.5mlTE缓冲液中之前,使DNA沉淀空气干燥30分钟。无DNA酶的核糖核酸酶A被加入重悬的DNA沉淀至浓度为每ml100μg,然后该混合物在37℃孵育30分钟。加入蛋白酶K(200μg/ml),在37℃孵育该试管附加的1小时。最后,样品在12,000xg离心15分钟,上清液被施加于Qiaprep8manifold(QIAGENInc.,Valencia,CA)。柱子用1mlPB(QIAGENInc.,Valencia,CA)和1mlPE(QIAGENInc.,Valencia,CA)在真空下洗涤两次。分离的DNA用100μlTE洗涤,用乙醇沉淀,用70%乙醇洗涤,在真空下干燥,重悬在TE缓冲液中,并于4℃保存。为了产生用于PCR扩增的基因组DNA,Thielaviaterrestris于42℃,在含有补充有1%葡萄糖的50mlNNCYP培养基的带挡板摇瓶中,以200rpm生长24小时。通过过滤收获菌丝体,在TE(10mMTris-1mMEDTA)中洗涤两次,并冷冻在液氮中。豌豆大小的冷冻菌丝体块被悬浮在0.7ml含1%十二烷基硫酸锂的TE中,通过与等体积的0.1mm氧化锆/硅石珠(BiospecProducts,Inc.,Bartlesville,OK)在FastPrepFP120(ThermoSavant,Holbrook,NY)中搅拌45秒而破裂。通过在13,000xg离心10分钟除去碎片,使澄清的上清液加入2.5M乙酸铵,并在冰上孵育20分钟。孵育期后,通过加入2体积乙醇沉淀核酸。于4℃在微离心机中离心15分钟后,沉淀用70%乙醇洗涤并空气干燥。DNA重悬在120μl0.1XTE中,与1μl无DNA酶的RNaseA在37℃孵育20分钟。乙酸铵被加至2.5M,用2体积的乙醇沉淀DNA。在70%乙醇中洗涤沉淀,空气干燥,并重悬在TE缓冲液中。实施例3pAlLo2表达载体的构建通过改变包括来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶(NA2-tpi启动子)基因的启动子杂合体、黑曲霉淀粉葡萄糖苷酶终止子序列(AMG终止子)、和构巢曲霉乙酰胺酶基因(amdS)的pBANe6(U.S.专利号6,461,837)构建表达载体pAlLo1。利用Big-DyeTM终止剂化学(AppliedBiosystems,Inc.,FosterCity,CA)的测序验证全部的诱变步骤。首先通过定点诱变消除从amdS选择标记在第2051、2722、和3397bp位置的3个NcoI限制酶切位点来进行pBANe6的改变。所有的变化被设计为是“沉默的”,使得amdS基因产物的实际蛋白质序列没有变化。根据制造商的指导利用下列引物(加下划线的核苷酸表示变化的碱基),用GeneEditorTM体外定点诱变试剂盒(Promega,Madison,WI)同时除去这3个位点AMDS3NcoMut(2050)5’-GTGCCCCATGATACGCCTCCGG-3’(SEQIDNO16)AMDS2NcoMut(2721)5’-GAGTCGTATTTCCAAGGCTCCTGACC-3’(SEQIDNO17)AMDS1NcoMut(3396)5’-GGAGGCCATGAAGTGGACCAACGG-3’(SEQIDNO18)然后利用QuickChangeTM定点诱变试剂盒(Stratagene,LaJolla,CA)使包括全部3个预期序列变化的质粒经受定点诱变,以消除在第1643位的AMG终止子末端的NcoI限制酶切位点。下列引物(加下划线的核苷酸表示变化的碱基)用于诱变诱变AMG终止子序列的上游引物5’-CACCGTGAAAGCCATGCTCTTTCCTTCGTGTAGAAGACCAGACAG-3’(SEQIDNO19)诱变AMG终止子序列的下游引物5’-CTGGTCTTCTACACGAAGGAAAGAGCATGGCTTTCACGGTGTCTG-3’(SEQIDNO20)pBANe6改变中最后的步骤是在多接头的开始利用QuickChangeTM定点诱变试剂盒和下列引物(加下划线的核苷酸表示变化的碱基)加入新的NcoI限制酶切位点以产生pAlLo1(图6)。诱变NA2-tpi启动子的上游引物5’-CTATATACACAACTGGATTTACCATGGGCCCGCGGCCGCAGATC-3’(SEQIDNO21)诱变NA2-tpi启动子的下游引物5’-GATCTGCGGCCGCGGGCCCATGGTAAATCCAGTTGTGTATATAG-3’(SEQIDNO22)用构巢曲霉pyrG基因替换pAlLo1的amdS基因。质粒pBANe10(图7)被用作作为选择标记的pyrG基因的来源。pBANe10的序列分析显示pyrG标记包含在NsiI限制片段内,并且不包含NcoI或PacI限制酶切位点。由于amdS也侧接NsiI限制酶切位点,开关选择标记的策略是简单替换NsiI限制片段。来自pAlLo1和pBANe10的质粒DNA用限制酶NsiI消化,产物通过琼脂糖凝胶电泳纯化。来自包含pyrG基因的pBANe10的NsiI片段被连接至pAlLo1骨架以替换包含amdS基因的原始NsiIDNA片段。通过限制酶消化分析重组的克隆以确定其具有正确的插入及其方向。选择具有以逆时针方向转录的pyrG基因的克隆。新的质粒被命名为pAlLo2(图8)。实施例4从ThielaviaterrestrNRRL8126基因组DNAPCR扩增GH61B基因片段基于如实施例1所描述的通过串联质谱分析法获得的肽序列设计引物。特定的肽序列如下[L,I]PASNSPVTNVASDD[L,I]R(SEQIDNO23)[L,I]PED[L,I]EPGDY[L,I][L,I]R(SEQIDNO24)选择以粗体显示的序列区用于DNA引物设计。在该序列中邻近氨基酸是丙氨酸的假设之下(以同系物中的序列保守性为基础)工程化第二个序列的更长5’延伸。引物是正义引物5’-CCTCCAACTCCCCCGTCACNAAYGTNGC-3’(SEQIDNO25)反义引物5’-GGCGCGGAGGAGGTARTCNCCNGGYTC-3’(SEQIDNO26)PCR扩增以包含1XAmpliTaq缓冲液(AppliedBiosystems,FosterCity,CA),2.5单位AmpliTaqDNA聚合酶(AppliedBiosystems,FosterCity,CA),1μM各个有义和反义引物,和大约1μg来自ThielaviaterrestrisNRRL8126的基因组DNA的50μl体积进行。扩增在Robocycler(Stratagene,LaJolla,CA)中,利用循环参数为3分钟,96℃和3分钟,72℃(其中加入DNA聚合酶),35个循环的45秒,94℃;45秒,58℃;和1分钟,72℃;然后是7分钟,72℃的最终延伸。反应产物在3%琼脂糖凝胶上利用40mMTrisbase-20mM乙酸钠-1mM二钠EDTA(TAE)缓冲液分级,切下大约450bp的条带,利用QIAEXII凝胶提取试剂盒(QIAGENInc.,Valencia,CA)纯化,并利用TOPOTA试剂盒(Invitrogen,Carlsbad,CA)亚克隆。测序来自一个大肠杆菌转化体的质粒,并且发现包含编码家族61蛋白质(GH61B)的452bp的插入。该质粒被命名为pPH27(图9)。实施例5从基因组DNAPCR扩增GH61C和GH61D基因片段基于如实施例1所描述的通过串联质谱分析法获得的肽序列设计引物,除了多肽的来源是从一维SDS-PAGE凝胶(Novex4-12%Bis-Tris,Invitrogen,Carlsbad,CA)切下的大约27kDa条带,然后如实施例24所描述的通过Q琼脂糖凝胶部分纯化。GH61C和GH61D多肽的相似分子质量导致了用于质谱分析法的凝胶切下部分中多肽的交叉污染,因此在质谱分析期间确定的肽序列来源于两个多肽。一个引物设计为两个可能相邻的胰蛋白酶肽序列与序列SGAGWFKIDEAGFHGD(SEQIDNO27)组合。这变为是GH61D的正确序列,然而设计的引物充分接近于GH61C序列(GDGWFKIDE)以同时扩增该基因。反义引物是基于质谱来源的序列APGNY[I,L][I,L]R(SEQIDNO28)。这根据对APGNYLIRHEL(SEQIDNO29)的多重序列排列中的保守性被延伸和精炼。这变为是GH61C的正确序列,但充分接近于GH61D序列(APGNYLVRHEL,SEQIDNO30)以扩增该基因。用于引物设计的特定肽序列如下GAGWFKIDE(SEQIDNO31)APGNYLIRHEL(SEQIDNO29)引物是正义引物5’-CGGCGCGGGCTGGTTTAARATHGAYGA-3’(SEQIDNO32)反义引物5’AGTTCATGGCGAATCAGATARTTNCCNGGNGC-3’(SEQIDNO33)PCRG增以包含1XAmpliTaq缓冲液,2.5单位的AmpliTaqDNA聚合酶,1μM各个正义和反义引物,和大约1μg来自ThielaviaterrestrisNRRL8126的基因组DNA的50μl体积进行。扩增在StratageneRobocycler中,利用循环参数为3分钟,96℃和3分钟,72℃(其中加入DNA聚合酶),35个循环的45秒,94℃;45秒,53、56、或59℃和1分钟,72℃,然后是7分钟,72℃的最后延伸。反应产物在3%琼脂糖凝胶上分级,切下大约150-200bp的两个条带,利用QIAEXII凝胶提取试剂盒(QIAGENInc.,Valencia,CA)纯化,利用TopoTA试剂盒(Invitrogen,Carlsbad,CA)一起亚克隆。测序来自一个大肠杆菌转化子的质粒,发现包含编码家族61蛋白质(GH61C)的156bp的插入。这个质粒被命名为pPH29(图10)。测序来自另一个大肠杆菌转化子的质粒,发现包含编码另一个家族61蛋白质(GH61D)的180bp的插入。这个质粒被命名为pPH28(图11)。实施例6基因组DNA文库构建利用噬菌体克隆载体λZipLox(LifeTechnologies,Gaithersburg,MD)与作为用于培养和纯化重组噬菌体宿主的大肠杆菌Y1090ZL细胞(LifeTechnologies,Gaithersburg,MD)和用于切除包含GH61B基因的单独pZL1克隆的大肠杆菌DH10Bzip(LifeTechnologies,Gaithersburg,MD)来构建基因组DNA文库。ThielaviaterrestrisNRRL8126基因组DNA用Tsp509I部分消化,并利用TAE缓冲液在1%琼脂糖凝胶上进行大小-分级。切下以大小范围3-7kb迁移的DNA片段并利用Prep-a-Gene试剂(BioRadLaboratories,Hercules,CA)从凝胶洗提。洗提的DNA片段与EcoRI-切割且脱去磷酸的λZipLox载体臂(LifeTechnologies,Gaithersburg,MD)连接,利用商业包装的提取物(Stratagene,LaJolla,CA)包装该连接混合物。接种包装的DNA文库,并在大肠杆菌Y1090ZL细胞中扩增。未扩增的基因组DNA文库包含3.1×106pfu/ml(没有DNA的背景滴度是2.0×104pfu/ml)。实施例7ThielaviaterrestrisGH61B、GH61C和GH61D克隆的鉴定利用与TOPO载体同源的引物和HerculaseDNA聚合酶(Stratagene,LaJolla,CA)分别从pPH27、pPH29和pPH28扩增ThielaviaterrestrisGH61B、GH61C、和GH61D探针片段,如下所示5′-CTTGGTACCGAGCTCGGATCCACTA-3′(SEQIDNO34)5′-ATAGGGCGAATTGGGCCCTCTAGAT-3′(SEQIDNO35)50皮摩尔的各个引物用于PCR反应,其中包含10pPH27、pPH28、或pPH29,1XHerculase扩增缓冲液(Stratagene,LaJolla,CA),1μl10mMdATP、dTTP、dGTP、和dCTP混合物,和2.5单位的HerculaseDNA聚合酶,终体积为50μl。扩增条件是一个循环的94℃,1分钟,20个循环的94℃,30秒;55℃,30秒;和72℃,1分钟。然后加热决达到4℃保温(soak)循环。反应产物在1.0%琼脂糖凝胶上利用TAE缓冲液分离,其中从凝胶切下3个<500bp的产物条带,根据制造商的指导利用QIAquick凝胶提取试剂盒(QIAGENInc.,Valencia,CA)纯化。用32P,利用PrimeItII试剂盒(Stratagene,LaJolla,CA)放射性标记25ng的各个片段。利用3个标记的PCR片段作为探针的噬菌斑-杂交筛选来自实施例6中描述文库的大约90,000个噬菌斑。利用UVStratalinker(Stratagene,LaJolla,CA),DNA被交联到膜(HybondN+,Amersham,ArlingtonHeights,IL)上。通过加入氢氧化钠至终浓度为0.1M使各个32P-放射性标记的基因片段变性,并且加入每ml杂交溶液包含6XSSPE,7%SDS,活性为大约1×106cpm的杂交溶液。各个混合物于55℃在摇动的水浴中培养过夜。培养后,于65℃在具有0.1%SDS的0.2XSSC中洗涤膜3次,每次15分钟。膜在吸滤纸上干燥15分钟,包裹在SaranWrapTM中,和增感屏(intensifyingscreen)一起(Kodak,Rochester,NY)于70℃对X-光胶片曝光过夜。根据与如上所述的GH61探针产生强烈的杂交信号,选择几个噬菌斑作进一步研究。在大肠杆菌Y1090ZL细胞中纯化噬菌斑两次,随后通过感染大肠杆菌DH10BZL细菌(LifeTechnologies,Gaithersburg,MD)利用体内切除从作为pZL1-衍生物的λZipLox载体(D’Alessioetal.,1992,Focus1476)切下插入的基因和pZL1质粒。菌落被接种入3ml的LB加50μg/ml氨苄青霉素的培养基并于37℃生长过夜。利用BioRobot9600(QIAGENInc.,Valencia,CA)从这些培养物中的每一个制备小提的DNA。通过DNA测序显示克隆pEJG120(图12)包含GH61B的全长基因组基因。以如对于GH61B所描述的相同方法分离GH61C和GH61D的全长基因组基因。包含质粒pEJG120的E.colipEJG120以NRRLB-30699保藏在农业研究机构培养物保藏中心,1815UniversityStreet,Peoria,Illinois,61604,保藏日期为2003年12月19日。对于保藏物,用下文所示的引物从其表达构建体pEJG111(参见实施例13,图13)PCR扩增Tter61C基因。融合内的正向引物5’-ACAACTGGATTTACCATGCGGTTCGACGCCTC-3’(SEQIDNO36)融合内的反向引物5’-GTCAGTCACCTCTAGTTACTAAAACTCGAAGCC-3’(SEQIDNO37)粗体字表示编码序列。剩余的序列包含与pAlLo2的插入位点的序列同一性。50皮摩尔的上述各个引物用于PCR反应,其中包含50ngpEJG111DNA,1XPfx扩增缓冲液(Invitrogen,Carlsbad,CA),6μl10mMdATP、dTTP、dGTP、和dCTP的混合物,1μl50mMMgSO4,5μl10XpCRx增强溶液(Invitrogen,Carlsbad,CA),和2.5单位的PlatinumPfxDNA聚合酶(Invitrogen,Carlsbad,CA),终体积为50μl。使用EppendorfMastercycler5333(EppendorfScientific,Inc.,Westbury,NY)扩增DNA片段,程序设置为一个循环的98℃,2分钟;和35个循环的94℃,30秒,60℃,30秒,和68℃,1分钟。35个循环后,反应物在68℃孵育10分钟,然后冷却至10℃直到进一步的处理。大约800bp的PCR反应产物在0.8%GTG-琼脂糖凝胶(CambrexBioproducts,EastRutherford,NJ)上,利用TAE缓冲液和每ml0.1μg的溴化乙锭分离。通过DarkReaderTM(ClareChemicalResearch,Dolores,CO)的帮助观察DNA条带以避免UV-诱导的突变。用一次性刀片切下800bpDNA条带并用Ultrafree-DASpinCup(Millipore,Billerica,MA)根据制造商的指导纯化。根据制造商的指导将纯化的DNA条带克隆到pCR4-BluntTOPO载体(Invitrogen,Carlsbad,CA)中。根据制造商的指导将2μl的TOPO-反应物转化入E.coliTOP10细胞(Invitrogen,Carlsbad,CA)中。将转化的细胞接种到补充有每ml100μg氨苄青霉素的2XYT琼脂平板上,于37℃培养过夜。随机选择8个克隆用于质粒DNA制备。各个克隆在补充有每ml100μg氨苄青霉素的3mlLB上生长过夜。从这些培养物,使用10μl接种于补充有每ml100μg氨苄青霉素的2XYT琼脂堂平板,以具有各个克隆的细菌原种。其余的培养物用于以QIAGENBioRobot9600制备质粒DNA。通过EcoRI限制酶消化分析克隆。8个克隆具有预期的限制消化模式。从这些克隆,3个如上所述用Big-DyeTM终止剂化学,利用标准的M13正反向引物测序。全部3个克隆显示具有Tter61E基因的正确序列。克隆#7被重命名为pTter61C(图15),其细菌原种再划线接种到补充有每ml100μg氨苄青霉素的新鲜2XYT平板上,于37℃培养过夜。从这个平板,将细胞用于接种2个包含补充有每ml100μg氨苄青霉素的大约1.5mlLB琼脂糖的1.8ml冷冻小管。小管用PetriSealTM(DiversifiedBiotech,BostonMA)密封,并保藏在农业研究机构培养物保藏中心,1815UniversityStreet,Peoria,Illinois,61604,保藏号为pTter61GNRRLB-30811,保藏日期为2005年1月21日。对于保藏物,用下列引物从其表达构建体pEJG112(参见实施例13,图14)PCR扩增Tter61D基因。正向引物5’-CATGCCATGGATGCTTCTCAC-3’(SEQIDNO38)反向引物5’-CCTTAATTAATCAGGCGGTGAAGTC-3’(SEQIDNO39)粗体字表示编码序列。剩余序列包含用于将来克隆实验的独特的限制酶切位点。除用pEJG112外,如上所述进行PCR反应。在0.8%GTG-琼脂糖凝胶上利用TAE缓冲液和每ml0.1μg溴化乙锭分离大约1kb的PCR反应产物。借助于DarkReaderTM观察DNA条带以避免UV-诱导的突变。用一次性刀片切下1kbDNA条带,根据制造商的指导用QIAquickPCR纯化试剂盒(QIAGENInc.,Valencia,CA)纯化。根据制造商的指导将纯化的DNA条带克隆到pCR4-BluntTOPO载体中,如上所述分离E.coliTOP10细胞的转化体。随机选择10个克隆用于质粒DNA制备。各个克隆在补充有每ml100μg氨苄青霉素的3mlLB上生长过夜,并用于以QIAGENBioRobot9600制备质粒DNA。通过EcoRI限制酶消化分析克隆以证实存在克隆的插入。全部10个克隆具有预期的限制消化模式。从这些克隆,随后如上所述用Big-DyeTM终止剂化学,利用标准的M13正反向引物测序5个。这些克隆中的一个显示具有Tter61D基因的正确序列。这个克隆被重命名为pTter61D(图16),并如上所述再转化E.coliTOP10细胞。从单个菌落划线,将细胞用于接种2个包含补充有每ml100μg/ml氨苄青霉素的大约1.5mlLB琼脂糖的1.8ml冷冻小管。小管用PetriSealTM密封,并保藏在农业研究机构培养物保藏中心,1815UniversityStreet,Peoria,Illinois,61604,保藏号为pTter61DNRRLB-30812,保藏日期为2005年1月21日。实施例8表达序列标签(EST)cDNA文库构建使用2ml等分来自ThielaviaterrestrisNRRL8126的24-小时液体培养物(250ml培养瓶中补充有1%葡萄糖的50mlNNCYPmod培养基,45℃,200rpm)接种包含补充有2%Sigmacell-20的100mlNNCYPmod培养基的500ml培养瓶。培养物在45℃,200rpm培养3天。通过具有玻璃纤维预过滤器的一次性过滤装置(Nalgene,RochesterNY)过滤收获菌丝体,用10mMTris-HCl-1mMEDTApH8(TE)洗涤两次,在液氮中快速冷冻。利用下列方法分离总RNA。ThielaviaterrestrisNRRL8126的冷冻菌丝体在电动咖啡磨碎机中磨碎。磨碎的材料在50mlFalcon试管中与20mlFenazol(Ambion,Inc.,Austin,TX)以1∶1v/v混合。一旦菌丝体悬浮,用氯仿提取它们,并且用苯酚-氯仿-异戊醇的25∶24∶1v/v/v混合物提取3次。从所得到的水相,通过加入1/10体积的3M乙酸钠pH5.2和1.25体积的异丙醇来沉淀RNA。通过于4℃在12,000xg离心30分钟来回收沉淀的RNA。最终的沉淀用冷的70%乙醇洗涤,空气干燥,并重悬在500ml焦碳酸二乙酯(diethylpyrocarbonate)-处理的水(DEPC-水)中。纯化RNA的数量和质量用AgilentBioanalyzer2100(AgilentTechnologies,Inc.,PaloAlto,CA)评估。根据制造商的指导,借助于Poly(A)PuristMagnetic试剂盒(Ambion,Inc.,Austin,TX),从360μg总RNA分离多聚腺苷酸化的mRNA。为了产生cDNA文库,使用CloneMinerTM使用(Invitrogen,Carlsbad,CA)构建不需要利用限制酶克隆的定向文库,由此降低嵌合克隆的数目和大小偏移。为了确保cDNA的成功合成,用2个不同浓度的mRNA(2.2和4.4μgpoly(A)+mRNA)平行进行2个反应。将mRNA样品与Biotin-attB2-Oligo(dt)引物(CloneMinerTMKit,Invitrogen,Carlsbad,CA),1X第一链缓冲液(Invitrogen,Carlsbad,CA),2μl0.1MDTT,10mM各个dNTP混合,分别加水至终体积为18和16μl。仔细混合反应混合物,然后加入2和4μlSuperScriptTM逆转录酶(Invitrogen,Carlsbad,CA),45℃孵育60分钟以合成第一互补链。对于第二链的合成,向各个第一链反应物加入30μl5X第二链缓冲液(Invitrogen,Carlsbad,CA),3μl10mM各个dNTP,10单位的E.coliDNA连接酶(Invitrogen,Carlsbad,CA),40单位的E.coliDNA聚合酶I(Invitrogen,Carlsbad,CA),以及2单位的E.coliRNaseH(Invitrogen,Carlsbad,CA),总体积为150μl。然后使混合物在16℃孵育2小时。2小时孵育后,向各个反应物加入2μlT4DNA聚合酶(Invitrogen,Carlsbad,CA),在16℃孵育5分钟以产生钝末端的cDNA。用苯酚-氯仿-异戊醇的25∶24∶1v/v/v混合物提取cDNA反应物,在存在20μg糖原,120μl5M乙酸铵,和660μl乙醇时沉淀。在12,000xg,4℃离心30分钟后,用冷的70%乙醇洗涤cDNA沉淀,真空下干燥2-3分钟,重悬在18μlDEPC-水中。向各个重悬的cDNA样品加入10μl5X连接缓冲液(Invitrogen,Carlsbad,CA),10μgattB1连接物(Invitrogen,Carlsbad,CA),7μl0.1MDTT,和5单位的T4DNA连接酶(Invitrogen,Carlsbad,CA)。5′-TCGTCGGGGACAACTTTGTACAAAAAAGTTGG-3′(SEQIDNO40)3′-CCCCTGTTGAAACATGTTTTTTCAACCp-5′(SEQIDNO41)连接反应在16℃孵育过夜。通过用1mlSephacrylTMS-500HR树脂(AmershamBiosciences,Piscataway,NJ)的大小排阻色谱法除去过量的连接物。根据CloneMinerTM试剂盒的指导收集柱形级分,用AgilentBioanalyzer分析级分3至14以确定在哪个级分attB1连接物开始洗提。分析显示连接物在级分10或11附近开始洗提。对于第一个文库,汇集级分6至11,对于第二文库,汇集级分4-11。根据Gateway系统方案(Invitrogen,Carlsbad,CA),利用BPClonaseTM(Invitrogen,Carlsbad,CA)作为重组酶,通过同源DNA重组进行cDNA的克隆。各个BPClonaseTM重组反应包含大约70ngattB-flanked-cDNA,250ngpDONRTM222(Invitrogen,Carlsbad,CA),2μl5XBPClonaseTM缓冲液(Invitrogen,Carlsbad,CA),2μlTE,和3μlBPClonaseTM。重组反应物在25℃孵育过夜。将热-失活的BP重组反应物分为6等分,利用BioRadGenePulserII(BioRad,Hercules,CA)电穿孔进入ElectroMaxTMDH10B电感受态细胞(Invitrogen,Carlsbad,CA),其中使用下列参数2.0kV,200Ω,和25μF。电穿孔的细胞重悬在1mlSOC中,并在37℃伴随恒定振荡(200rpm)培养60分钟。培养期后,汇集转化的细胞,与冷冻培养基以1∶1混合。移出200μl等分用于文库滴定,余下的各个文库等分进入1.8ml冷冻小管(WheatonScienceProducts,Millville,NJ),并冷冻储存在-80℃。制备各个文库4个连续稀释度1/100、1/1000、1/104、1/105。从各个稀释度,将100μl接种到补充有每ml50μg卡那霉素的150mmLB平板上,在37℃培养过夜。计数各个稀释度平板上的菌落数目,并用于计算各个文库中转化体的总数。第一个文库显示具有5,400,000个独立克隆,第二个文库显示具有9,000,000个独立克隆。实施例9cDNA克隆的模板和核苷酸测序混合来自两个文库的等分样品并接种在补充有每ml50μg卡那霉素的25×25cmLB平板上。借助于GenetixQPixrobot(GenetixInc.,Boston,MA)将单独的菌落排列在含有补充有每ml50μg卡那霉素的100μlLB培养基的96-孔平板上。对于总的4320个单独克隆获得45个96-孔平板。使平板在37℃以200rpm振荡培养过夜。培养后,向每个孔加入100μl无菌的50%甘油。借助于96-针工具(Boekel,Feasterville,PA)复制转化体进入每个孔含有补充有每ml50μg卡那霉素的1mlMagnificentBrothTM(MacConnellResearch,SanDiego,CA)的第二代的、深碟96-孔微培养平板(AdvancedGeneticTechnologiesCorporation,Gaithersburg,MD)。第一个微量滴定板冷冻储存在-80℃。第二个深碟平板在旋转的振荡器上以剧烈搅动(300rpm)于37℃培养过夜。为了防止溢出和交叉污染,并容许足够的通气,各个第二代培养平板用聚丙烯缓冲垫(AdvancedGeneticTechnologiesCorporation,Gaithersburg,MD)和塑料的微滴定碟盖覆盖。质粒DNA用MWGRobot-Smart384(MWGBiotechInc.,HighPoint,NC)和MontagePlasmidMiniprepKits(Millipore,Billerica,MA)制备。利用Big-DyeTM终止剂化学(Gieseckeetal,1992,JournalofVirologyMethods3847-60)和M13正向(-20)测序引物5’-GTAAAACGACGGCCAG-3’(SEQIDNO42)进行测序反应。测序以384-孔规格用Robot-Smart384(MWGBiotechInc.,HighPoint,NC)进行。用MilliporeMultiScreenSeq384SequencingClean-upKits(Millipore,Billerica,MA)进行终端除去。反应包含6μl质粒DNA和4μl包含1μl5X测序缓冲液(Millipore,Billerica,MA),1μlBig-DyeTM终止剂(AppliedBiosystems,Inc.,FosterCity,CA)、1.6皮摩尔M13正向引物和1μl水的测序标准混合物。用ABIPRISMAutomatedDNASequencerModel3700(AppliedBiosystems,Fostercity,CA)进行单通脱氧测序。实施例10cDNA克隆DNA序列数据的分析借助于PHRED/PHRAP软件(UniversityofWashington,Seattle,WA)进行碱基召集、性质赋值、和向量修整。用ParcelTranscriptAssemblerv.2.6.2.(Paracel,Inc.,Pasadena,CA)进行ESTs的聚簇分析。EST簇的分析表明存在395个独立的簇。在利用BLOSUM62矩阵(Henikoff,1992,Proc.Natl.AcadSci.USA8910915-10919)的32-节点Linuxcluster(Paracel,Inc.,Pasadena,CA)上,用Blastx程序(Altschulet.al.,1990,J.Mol.Biol.215403-410)进行集合EST序列针对PIR数据库的序列同源性分析。从395个簇,246个与公共蛋白质数据库中的已知基因具有显著同一性,而149个相对于这个数据库没有显著的同一性。在这246个簇当中,13个击中已很好表征的糖基水解酶基因同系物。实施例11鉴定编码具有分解纤维增强活性的两个家族61多肽(GH61E和GH61G)的cDNA克隆最初通过其与来自Volvariellavolvacea(GenPeptg49333361)的家族61蛋白质的同一性鉴定出编码具有分解纤维增强活性的家族61多肽(GH61E和GH61G)的两个cDNA克隆。这个分析表明该蛋白质在289氨基酸延伸(867bp)的蛋白质水平与V.volvacea分别是41%和38%相同。初始鉴定后,从其最初的冷冻原种平板挽救EST克隆Tter39E1和Tter39H8,并且划线接种在补充有每ml50μg卡那霉素的LB平板上。平板在37℃培养过夜,并且次日来自各个平板的单个克隆被用于接种入补充有每ml50μg卡那霉素的3mlLB中。液体培养物在37℃培养过夜,用QIAGENBioRobot9600制备质粒DNA。如上所述用Big-DyeTM终止剂化学再次测序来自各个EST克隆的质粒DNA,利用下列所示的M13正向和Poly-T引物测序该克隆的3’端。5′-TTTTTTTTTTTTTTTTTTTTTTTVN-3′(SEQIDNO43)其中V=G、A、或C,以及N=G、A、C、或T克隆Tter39E1的序列分析表明这个克隆不是全长,并且缺失5’端的一些核苷酸,因为它不具有起始密码子“ATG”。为了获得全长克隆,设计一对引物从用于构建该文库的最初cDNA库来扩增这个基因的5’端。设计正向或正义引物与构建cDNA文库期间所使用的attB1连接物相匹配,设计反向引物从截短的5’端的大约350bp扩增,引物如下所示。attB1引物5’-GGGGACAACTTTGTACAAAAAAGTTGG-3’(SEQIDNO44)反向引物5’-AAAGGTAGGATGGTCCTCGTACACCTT-3’(SEQIDNO45)50皮摩尔的上述每一引物用于PCR反应,其中含有1μl汇集的cDNA,1XTaq扩增缓冲液(NewEnglandBioLabs,Beverly,MA),6μl10mMdATP、dTTP、dGTP、和dCTP混合物,和2.5单位的TaqDNA聚合酶(NewEnglandBioLabs,Beverly,MA),最终体积为50μl。使用EppendorfMastercycler5333来扩增片段,程序为一个循环的98℃,2分钟;5个循环的96℃,30秒,55℃,30秒,和68℃,1分钟;以及35个循环的96℃,30秒,61℃,30分钟,和68℃,1分钟。35个循环后,反应物在68℃孵育10分钟,然后冷却至10℃直到进一步的处理。PCR反应产物(大约400bp)利用TAE缓冲液和每ml0.1μg溴化乙锭在0.8%GTG-琼脂糖凝胶上分离。借助于DarkReaderTM观察DNA条带以避免UV-诱导的突变。用一次性刀片切下400bp的DNA条带并根据制造商的指导用Ultrafree-DASpinCup纯化。根据制造商的指导(Invitrogen,Carlsbad,CA)将纯化的DNA条带克隆到pCR2.1TA-TOPO载体中。根据制造商的指导将2微升的TA-反应物转化进入E.coliTOP10细胞。将转化的细胞接种到补充有100μg/ml氨苄青霉素的2XYT琼脂平板上,并于37℃培养过夜。随机选择8个克隆用于质粒DNA制备。各个克隆在补充有每ml100μg氨苄青霉素的3mlLB培养基中生长过夜,并利用QIAGENBioRobot9600从各个克隆制备质粒DNA。通过EcoRI限制酶消化分析克隆。全部8个克隆具有预期的限制消化模式。然后如上所述,从这些克隆取3个利用标准的M13反向引物,用Big-DyeTM终止剂化学测序。序列分析表明全部的3个克隆具有完全的5’端,并且最初的EST克隆pTter39E1只在5’端缺失5个核苷酸。从Tter61E基因的全长序列设计如下所示的融合中的PCR引物来扩增截断的基因,用于克隆进入表达载体pAlLo2,同时在其5’端加入缺失的5个核苷酸。融合中的正向引物5’-ACTGGATTACCATGCTCGCAAACGGTGCCATCGTCT-3’(SEQIDNO46)融合中的反向引物5’-TCACCTCTAGTTAATTAATCAGCAGCTGAAGACGGCCG-3’(SEQIDNO47)粗体字表示编码序列。粗体和加下划线的字母表示如上所述基因5’端的缺失的5个核苷酸。剩余的序列包含与pAlLo2插入位点相同的序列。除了使用pTter39E1之外,如实施例7所描述的进行PCR反应。大约700bp的PCR反应产物利用TAE缓冲液和每ml0.1μg的溴化乙锭在0.8%GTG-琼脂糖凝胶上分离。借助于DarkReaderTM观察DNA条带以避免UV-诱导的突变。用一次性刀片切下700bp的DNA条带并根据制造商的指导用Ultrafree-DASpinCup纯化。纯化的DNA条带根据制造商的指导被克隆进入pCR4-BluntTOPO载体,如实施例7中所描述的分离E.coliTOP10细胞的转化体。随机选择8个克隆用于质粒DNA制备。各个克隆在补充有每ml100μg氨苄青霉素的3mlLB中生长过夜,并用于以QIAGENBioRobot9600制备质粒DNA。通过PacI/PstI限制酶消化分析克隆。8个克隆中有7个具有预期的限制消化模式。然后如上所述,从这些克隆中取3个用Big-DyeTM终止剂化学,利用标准的M13正反向引物测序。全部3个克隆显示具有Tter61E基因的正确序列。克隆#2被重命名为pTter61E(图17),并如上所述再被转化进入E.coliTOP10细胞。从单个菌落划线,将细胞用于接种2个包含补充有每ml100μg/m氨苄青霉素的大约1.5mlLB琼脂糖的1.8ml冷冻小管。小瓶用PetriSealTM密封,并保藏在农业研究机构培养物保藏中心,1815UniversityStreet,Peoria,Illinois,61604,保藏号pTter61ENRRLB-30814,保藏日期为2005年1月21日。一旦证实克隆Tter39H8的身份,该质粒被重命名为pTter61G(图18)。将0.5μl等分来自这个克隆的质粒DNA转染进入E.coliTOP10细胞小瓶,轻轻混合,并且在冰上培养10分钟。然后细胞在42℃热休克30秒并且再次在冰上孵育2分钟。使细胞重悬在250μlSOC中,并在37℃以恒定摇动(200rpm)培养60分钟。培养期后,将2个30μl等分接种到补充有每ml50μg卡那霉素的LB平板上,并在37℃培养过夜。次日挑出单个克隆开划线接种到补充有每ml50μg卡那霉素的新鲜2XYT平板上,并在37℃培养过夜。从这个平板,将细胞用于接种2个包含补充有每ml50μg卡那霉素的大约1.5mlLB琼脂糖的1.8ml冷冻小管中。小瓶用PetriSealTM密封,并保藏在农业研究机构培养物保藏中心,1815UniversityStreet,Peoria,Illinois,61604,保藏号pTter61GNRRLB-30811,保藏日期为2005年1月21日。实施例12编码具有分解纤维增加活性的家族GH61B、GH61C和GH61D多肽的Thielaviaterrestris基因组序列和编码具有分解纤维增加活性的家族GH61E和GH61G多肽的cDNA序列的表征用AppliedBiosystemsModel3700AutomatedDNASequencer,利用3.1版BigDyeTM终止剂化学和dGTP化学(AppliedBiosystems,Inc.,FosterCity,CA)和引物步行策略进行ThielaviaterrestrisGH61B基因组克隆(克隆15)和多重叠的GH61C和GH61D基因组克隆的DNA测序。核对核苷酸序列数据的性质,并且全部的序列借助于PHRED/PHRAP软件(UniversityofWashington,Seattle,WA)相互比较。根据来自Diplodiagossypina、Trichophaeasaccata、和Pseudoplectanianigrella的同源基因的相似性,构建ThielaviaterrestrisGH61B、GH61C、和GH61D基因组DNA序列的基因模型。ThielaviaterrestrisGH61B基因的核苷酸序列(SEQIDNO1)和推导的氨基酸序列(SEQIDNO2)显示在图1A和1B中。编码序列是包括终止密码子的1104bp,并被60和63bp的内含子间断。编码的预测蛋白质是326个氨基酸。编码区是65.8%G+C。利用SignalP程序(Nielsenetal.,1997,ProteinEngineering101-6)预测19个残基的信号肽。预测的成熟蛋白质包含分子量为31.3kDa的307个氨基酸。使用Interproscan程序(ZdobnovandApweiler,2001,Bioinformatics17847-848)的GH61B基因的推导氨基酸序列分析显示GH61B基因包含真菌纤维素结合结构域的序列标记。称为Prosite模式PS00562的这个序列标记(Sigristetal.,2002,BriefBioinform.3265-274)被发现是成熟多肽的大约第271至307位残基。氨基酸序列的比较排列利用Smith-Waterman算法(Watermanetal.,1976,Adv.Math.20367)确定,其中缺口开放罚分为11,缺口延伸罚分为1,且使用BLOSUM62矩阵。该排列显示编码具有分解纤维增强活性的家族GH61B多肽的Thielaviaterrestris基因的推导氨基酸序列与来自Neurosporacrassa(登录号EAA26873和EAA36262)的两个家族61蛋白质的推导氨基酸序列共享70%和64%的同一性(包括缺口)。ThielaviaterrestrisGH61C基因的核苷酸序列(SEQIDNO3)和推导的氨基酸序列(SEQIDNO4)显示在图2中。编码序列是包括终止密码子的778bp,并被58bp的一个内含子间断。编码的预测蛋白质是240个氨基酸。编码区是66.2%G+C。利用SignalP程序,预测17个残基的信号肽。预测的成熟蛋白质包含分子量为24.1kDa的223个氨基酸。氨基酸序列的比较排列利用Smith-Waterman算法(Watermanetal.,1976,Adv.Math.20367)确定,其中缺口开放罚分为11,缺口延伸罚分为1,并且使用BLOSUM62矩阵。该排列显示编码具有分解纤维增强活性的家族GH61C多肽的Thielaviaterrestris基因的推导氨基酸序列与来自Neurosporacrassa(分别为登录号Q9P3R7和Q7RV41)的两个家族61蛋白质的推导氨基酸序列共享76%和72%同一性。ThielaviaterrestrisGH61D基因的核苷酸序列(SEQIDNO5)和推导的氨基酸序列(SEQIDNO6)显示在图3中。编码序列是包括终止密码子的913bp,并被70和66bp的内含子间断。编码的预测蛋白质是258个氨基酸。编码区是63.1%G+C。利用SignalP程序,预测19个残基的信号肽。预测的成熟蛋白质包含分子量为25.7kDa的239个氨基酸。氨基酸序列的比较排列利用Smith-Waterman算法(Watermanetal.,1976,Adv.Math.20367)确定,其中缺口开放罚分为11,缺口延伸罚分为1,并且使用BLOSUM62矩阵。该排列显示编码具有分解纤维增强活性的家族GH61D多肽的Thielaviaterrestris基因的推导氨基酸序列与来自Neurosporacrassa(分别为登录号Q9P3R7和Q7RV41)的两个家族61蛋白质的推导氨基酸序列共享53%和53%同一性。ThielaviaterrestrisGH61E基因的cDNA序列(SEQIDNO7)和推导的氨基酸序列(SEQIDNO8)显示在图4中。编码序列是包括终止密码子的681bp。编码的预测蛋白质是226个氨基酸。GH61EcDNA克隆的%G+C含量是65.6%,而成熟蛋白质编码区(SEQIDNO7的第55至681位核苷酸)的%G+C含量是65.4%。利用SignalP程序,预测18个残基的信号肽。预测的成熟蛋白质包含分子量为22.3kDa的208个氨基酸。氨基酸序列的比较排列利用Smith-Waterman算法(Watermanetal.,1976,Adv.Math.20367)确定,其中缺口开放罚分为11,缺口延伸罚分为1,且使用BLOSUM62矩阵。该排列显示编码具有分解纤维增强活性的家族GH61E多肽的Thielaviaterrestris基因的推导氨基酸序列与来自Neurosporacrassa(登录号Q873G1)和另一个来自Magnaporthegrisea(登录号EAA54517)的家族61蛋白质的推导氨基酸序列分别共享73%和53%同一性。ThielaviaterrestrisGH61G基因的核苷酸序列(SEQIDNO9)和推导的氨基酸序列(SEQIDNO10)显示在图5中。编码序列是包括终止密码子的915bp。编码的预测蛋白质是304个氨基酸。GH61GcDNA克隆的%G+C含量是64.5%,而成熟蛋白质编码区(SEQIDNO9的第58至912位核苷酸)的%G+C含量是64.4%。利用SignalP程序,预测19个残基的信号肽。预测的成熟蛋白质包含分子量为30.0kDa的285个氨基酸。使用Interproscan程序的GH61G基因的推导氨基酸序列分析显示GH61G基因包含真菌纤维素结合结构域的序列标记。这个序列标记存在于成熟多肽的大约第271至304位残基。氨基酸序列的比较排列利用Smith-Waterman算法(Watermanetal.,1976,Adv.Math.20367)确定,缺口开放罚分为11,缺口延伸罚分为1,且使用BLOSUM62矩阵。该排列显示编码具有分解纤维增强活性的家族GH61G多肽的Thielaviaterrestris基因的推导氨基酸序列与来自Neurosporacrassa(登录号Q7SCJ5)和另一个来自Gibberellazeae(登录号EAA72972)的家族61蛋白质的推导氨基酸序列分别共享61%和61%同一性。来自THielaviaterrestrisNRRL8126的家族61序列的比较排列利用迭代加工(iterativerefinement)和缺省参数的MAFFTNW方法确定(Katohetal.,2002,NucleicAcidsResearch303059)。利用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)计算同一性矩阵。排列结果如表1所示。表1.ThielaviaterrestrisGH61多肽序列的序列对比同一性百分数实施例13构建Thielaviaterrestris家族GH61B、GH61C、Gh61D、GH61E、和GH61G基因的米曲霉表达载体设计如下所示的2个合成寡核苷酸引物来从基因组克隆PCR扩增Thielaviaterrestris家族GH61B基因。使用InFusionCloningKit(BDBiosciences,PaloAlto,CA)将该片段直接克隆进入表达载体,pAILo2,而不需要限制消化和连接。正向引物5’-ACTGGATTTACCATGAAGTCGTTCACCATTG-3’(SEQIDNO48)反向引物5’-AGTCACCTCTAGTTAGAGGCACTGCGAGTAG-3’(SEQIDNO49)粗体字表示编码序列。剩余的序列与pAlLo2的插入位点相同。50皮摩尔的上述各个引物用于PCR反应,其中包含100ngThielaviaterrestris基因组克隆15DNA(如实施例2中描述的制备),1XPfx扩增缓冲液,1.5μl10mMdATP、dTTP、dGTP、和dCTP的混合物,2.5单位的PlatinumPfxDNA聚合酶,1μl50mMMgSO4和5μl10XpCRx增强溶液,最终体积为50μl。扩增条件是一个循环的94℃,2分钟;和30个循环的94℃,15秒,55℃,30秒,和68℃,3分钟。然后加热块达到4℃保温循环。反应产物利用TAE缓冲液在1.0%琼脂糖凝胶上分离,其中从凝胶切下3kb的产物条带并利用QIAquickGelExtractionKit根据制造商的指导进行纯化。利用InFusionCloningKit将片段克隆进入pAlLo2表达载体。载体用限制内切核酸酶NcoI和PacI消化(利用制造商说明的条件)。片段通过凝胶电泳和QIAquick凝胶纯化进行纯化。将基因片段和消化的载体在产生表达质粒pEJG108(图19)的反应中连接在一起,其中家族GH61B基因的转录是在NA2-tpi启动子的调控之下。连接反应(20μl)由1XInFusion缓冲液(BDBiosciences,PaloAlto,CA),1XBSA(BDBiosciences,PaloAlto,CA),1μlInFusion酶(1∶10稀释)(BDBiosciences,PaloAlto,CA),100ng用NcoI和PacI消化的pAlLo2,和100ngThielaviaterrestrisGH61B纯化的PCR产物组成。反应在室温下孵育30分钟。使用1μl反应物转化E.coliXL10SolopacGold细胞(Stratagene,LaJolla,CA)。通过限制酶消化检测含有pEJG108(GH61B基因)的E.coli转化子,且利用QIAGENBioRobot9600制备质粒DNA。以与上述相同的方式,利用下列引物产生Thielaviaterrestris家族GH61C和GH61D基因。对于Tter61C融合中的正向引物5’-ACAACTGGATTTACCATGCGGTTCGACGCCTC-3’(SEQIDNO50)融合中的反向引物5’-GTCAGTCACCTCTAGTTACTAAAACTCGAAGCC-3’(SEQIDNO51)对于Tter61D融合中的正向引物5′-ACTGGATTACCATGCTTCTCACATCAG-3′(SEQIDNO52)融合中的反向引物5′-AGTCACCTCTAGTTATCAGGCGGTGAAGTC-3′(SEQIDNO53)粗体字表示编码序列。剩余的序列与pAlLo2的插入位点相同。通过限制酶消化分析鉴定包含正确重组表达构建体pEJG111(GH61C基因)和pEJG112(GH61D基因)的E.coli转化体,且利用QIAGENBioRobot9600制备质粒DNA。设计如下所示的2个合成寡核苷酸引物来从编码家族GH61G基因的ThielaviaterrestrisESTpTter61GPCR扩增全长的开放阅读框。使用In-FusionCloningKit(BDBiosciences,PaloAlto,CA)将片段直接克隆进入pAILo2。融合中的正向引物5’-ACTGGATTACCATGAAGGGACTTTTCAGTGC-3’(SEQIDNO54)融合中的反向引物5’-TCACCTCTAGTTAATTAATTACAAGCACTGCGAGTAGT-3’(SEQIDNO55)粗体字表示编码序列。剩余的序列包含与pAlLo2的插入位点相同的序列。50皮摩尔的上述各个引物用于PCR反应,其中包含50ngpTter61GDNA,1XPfx扩增缓冲液,6μl10mMdATP、dTTP、dGTP、和dCTP的混合物,2.5单位的PlatinumPfxDNA聚合酶,1μl50mMMgSO4,和5μl10XpCRx增强溶液,最终体积为50μl。使用EppendorfMastercycler5333扩增片段,程序为一个循环的98℃,2分钟;和35个循环的94℃,30秒,65℃,30秒,和68℃,1.5分钟。35个循环后,反应物在68℃孵育10分钟,然后冷却至10℃直到进一步的处理。1kb的PCR反应产物利用TAE缓冲液和每ml0.1μg的溴化乙锭在0.8%GTG-琼脂糖凝胶上分离。借助于DarkReaderTM观察DNA条带以避免UV-诱导的突变。用一次性刀片切下1kb的DNA条带并用Ultrafree-DASpinCup根据制造商的指导纯化。通过用NcoI和PacI消化使载体pAlLo2线性化。如上所述通过凝胶电泳和超滤作用纯化片段。用InFusionCloningKit将纯化的PCR片段克隆进入线性化且纯化的pAlLo2载体。该反应(20μl)包含1XInFusion缓冲液,1XBSA,1μlInFusion酶(1∶10稀释),100ng用NcoI和PacI消化的pAlLo2,和50ngThielaviaterrestrisGH61G纯化的PCR产物。反应在室温下孵育30分钟。根据制造商的指导使用2微升的反应物转化E.coliXL10SoloPacGold细胞(Stratagene,LaJolla,CA)。恢复期后,将来自转化反应的两个100μl等分接种到补充有每ml100μg氨苄青霉素的150mm2XYT平板上。平板在37℃培养过夜。从选择平板随机选择6个推定的重组克隆,并利用QIAGENBioRobot9600从各个克隆制备质粒DNA。通过PstI限制酶消化分析克隆。6个克隆中的5个具有预期的限制消化模式,然后测序2个克隆以证实在克隆的插入物中没有突变。选择克隆#1并命名为pAlLo24(图20)。如实施例11中所描述的,用设计为在其5’端添加缺失的5个核苷酸的融合中特异引物来PCR扩增截短的Tter61E基因。然后如上所述将凝胶纯化的条带克隆进入pAlLo2。根据制造商的指导将2微升的TOPO反应物转化E.coliTOP10细胞。将转化的细胞接种到补充有100μg/ml氨苄青霉素的2xYT琼脂平板上,并在37℃培养过夜。随机选择8个克隆,如上所述制备质粒DNA。通过SacI限制酶消化分析克隆。8个克隆中的7个具有预期的限制消化模式,然后测序4个克隆以证实在克隆的插入物中没有突变。选择克隆#5并命名为pAlLo28(图21)。实施例14在米曲霉JaL250中表达编码具有分解纤维增强活性的家族GH61B、GH61C、GH61D、GH61E、和GH61G多肽的Thielaviaterrestris基因根据Christensenetal.,1988,Bio/Technology61419-1422的方法制备米曲霉JaL250原生质体。使用5μgpEJG108(以及pAlLo2作为载体对照)转化米曲霉JaL250。用pEJG108(GH61B基因)转化米曲霉JaL250产生大约100个转化体。分离10个转化体至单独的PDA平板。用5ml0.01%Tween80洗涤全部转化体的汇合的PDA平板,分别接种到125ml玻璃摇瓶中的25mlMDU2BP培养基中,在34℃,200rpm培养。培养后5天,根据制造商的指导,利用8-16%Tris-GlycineSDS-PAGE凝胶(Invitrogen,Carlsbad,CA)分析来自各个培养物的5μl上清液。培养物的SDS-PAGE分布显示10个转化体中的9个具有大约42kDa的新的主要条带。用10ml0.01%Tween20洗涤转化体10(生长在PDA上)的汇合平板,接种到含有500mlMDU2BP培养基的2升Fernbach中以产生用于表征酶的发酵液。在第5天收获培养瓶,利用0.22μmGPExpressplusMembrane(Millipore,Bedford,MA)过滤。利用如上所述相同的方案,质粒pEJG111(GH61C基因)和pEJG112(GH61D基因)在米曲霉JaL250中表达。根据Christensenetal.,1988,同上文的方法制备米曲霉Jal250(WO99/61651)原生质体。使用5微克的pAlLo24和pAlLo28(以及pAlLo2作为载体对照)转化米曲霉JaL250原生质体。米曲霉Jal250的转化每个表达构建体产生大约50个转化体。从各个转化分离8个转化体至单独的PDA平板并且在34℃培养5天。用3ml0.01%Tween80洗涤汇合的孢子平板,使用孢子悬液接种到125ml玻璃摇瓶中的25mlMDU2BP培养基中。转化体培养物在34℃,以200rpm的恒定摇动培养。接种后第5天,培养物在6000xg离心,并收集其上清液。将5微升的各个上清液与等体积的2X加样缓冲液(10%β-巯基乙醇)混合,并加载到1.5mm8%-16%Tris-甘氨酸SDS-PAGE凝胶上,用SimplyBlueSafeStain(Invitrogen,Carlsbad,CA)染色。培养发酵液的SDS-PAGE分布显示8个pAlLo24转化体中的7个具有大约45kDa的新的蛋白质条带。这个新的蛋白质在SDS-聚丙烯酰胺凝胶上电泳为粗大的拖尾而不是界限分明的条带,暗示或许由于例如糖基化的翻译后修饰而存在多重形式。修饰的这个类型可解释T.terrestrisGH61G的推导分子量-33.7kDa-和这些转化体中新出现的蛋白质的表观分子量之间的差异。选择克隆#3用于进一步的研究。在pAlLo28转化体的情况下,8个pAlLo28转化体中的6个具有非常接近于22.5kDa成熟蛋白质计算重量的大约25kDa的新的蛋白质条带。实施例15pMJ09的构建载体pMJ04通过从里氏木霉RutC30基因组DNA,利用下列所示的引物993429(反义)和993428(正义),PCR扩增里氏木霉Cel7A纤维二糖水解酶1基因(cbhl)终止子来构建。反义引物被工程化而在5’-端具有PacI位点,在正义引物的5’-端具有SpeI位点。引物993429(反义)5’-AACGTTAATTAAGGAATCGTTTTGTGTTT-3’(SEQIDNO56)引物993428(正义)5’-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3’(SEQIDNO57)扩增反应(50μl)由1XThermoPol反应缓冲液(NewEnglandBioLabs,Beverly,MA),0.3mMdNTPs,100ng里氏木霉RutC30基因组DNA(其利用DNeasyPlantMaxiKit,QIAGENInc.,Valencia,CA分离),0.3μM引物993429,0.3μM引物993428,和2单位的Vent聚合酶(NewEnglandBioLabs,Beverly,MA)组成。反应物孵育在EppendorfMastercycler5333中,程序如下30个循环的94℃,30秒,55℃,30秒,和72℃,30秒(15分钟的最终延伸)。反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下229bp的产物条带并根据制造商的指导利用QIAGENQIAquickGelExtractionKit纯化。所得到的PCR片段用PacI和SpeI消化,并且利用快速连接试剂盒(Roche,Indianapolis,IN)连接进入用相同限制酶消化的pAlLo1以产生pMJ04(图22)。载体pMJ06通过从里氏木霉RutC30基因组DNA,利用下列所示的引物993696(反义)和993695(正义),PCR扩增里氏木霉Cel7A纤维二糖水解酶1基因(cbhl)启动子来构建。反义引物被工程化以在正义引物的5’-端具有SalI位点,而在反义引物的5’-端具有NcoI位点。引物993695(正义)5’-ACTAGTCGACCGAATGTAGGATTGTT-3’(SEQIDNO58)引物993696(反义)5’-TGACCATGGTGCGCAGTCC-3’(SEQIDNO59)扩增反应(50μl)由1XThermoPol反应缓冲液,0.3mMdNTPs,100ng里氏木霉RutC30基因组DNA(其利用QIAGENDNeasyPlantMaxiKit制备),0.3μM引物993696,0.3μM引物993695,和2单位的Vent聚合酶组成。反应物孵育在EppendorfMastercycler5333中,程序如下30个循环的94℃,30秒,55℃,30秒,和72℃,60秒(15分钟的最终延伸)。反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下988bp的产物条带并利用QIAGENQIAquickGelExtractionKit,根据制造商的指导纯化。所得到的PCR片段用NcoI和SalI消化,并利用快速连接试剂盒连接进入用相同限制酶消化的pMJ04以产生pMJ06(图23)。表达载体pMJ09通过从里氏木霉RutC30基因组DNA,利用下列所示的引物993843(反义)和99344(正义),PCR扩增里氏木霉Cel7A纤维二糖水解酶1基因(cbhl)终止子来构建。反义引物被工程化以在5’-端具有PacI和SpeI位点,而在正义引物的5’-端具有PvuI位点。引物993844(正义)5’-CGATCGTCTCCCTATGGGTCATTACC-3’(SEQIDNO60)引物993843(反义)5’-ACTAGTTAATTAAGCTCCGTGGCGAAAG-3’(SEQIDNO61)扩增反应(50μl)由1XThermoPol反应缓冲液,0.3mMdNTPs,100ng里氏木霉RutC30基因组DNA(其利用QIAGENDNeasyPlantMaxiKit提取),0.3μM引物993844,0.3μM引物993843,和2单位的Vent聚合酶组成。反应物孵育在EppendorfMastercycler5333中,程序如下30个循环的94℃,30秒,55℃,30秒,和72℃,60秒(15分钟的最终延伸)。反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下473bp的产物条带并利用QIAGENQIAquickGelExtractionKit,根据制造商的指导纯化。所得到的PCR片段用PvuI和SpeI消化并且利用快速连接试剂盒连接进入用PacI和SpeI消化的pMJ06以产生pMJ09(图24)。实施例16表达载体pSMAi155的构建根据存在于质粒pPHTI中的E.colihpt基因(Cummingsetal.,1999,CurrentGenetics36371-82),设计下列引物用于扩赠正向(993863)5’-GGGttcgaaTTCATTTAAACGGCT-3’(SEQIDNO62)BstBI反向(993864)5’-GGGagcgctCAATATTCATCTCTC-3’(SEQIDNO63)Eco47III使用VentDNA聚合酶系统(NewEnglandBioLabs,Inc.,Beverly,MA)来利用RobocyclerGradient40(Stratagene,LaJolla,CA)在下列梯度热循环条件下扩增感兴趣的基因一个循环的95℃,2分钟;25个循环的95℃,1分钟,51℃-65℃,1分钟,和72℃,2分钟;以及1个循环的72℃,7分钟。所得到的1.8kb片段在51℃退火温度被成功扩增并利用QIAquickGelExtractionKit凝胶纯化。然后凝胶纯化的片段被克隆进入pCR-BluntII-TOPO(Invitrogen,Carlsbad,CA)而产生pEmY10(图25)。质粒pMJ09用NsiI消化以移出amdS标记基因。消化物在利用TAE缓冲液的0.7%琼脂糖凝胶上分离,切下3.9kb条带,利用QIAquickGelExtractionKit根据制造商建议的方案纯化。根据制造商的方案,该载体利用虾碱性磷酸酶(RocheDiagnosticsCorporation,Indianapolis,IN)脱去磷酸。通过用NsiI消化从质粒pEmY10移出潮霉素抗性基因且如上所述纯化2.0kb片段。这个片段与来自pMJ09的3.9kb片段连接。连接混合物被转化进入E.coliSURE细胞(Stratagene,LaJolla,CA),通过限制分析和DNA测序筛选8个所得到的克隆的正确连接。一个检验的克隆被命名为pSMai149。利用QuickchangeSite-DirectedMutagenesisKit(Stratagene,LaJolla,CA),根据制造商的方案,从pSMai149移出潮霉素抗性基因中的NcoI位点。突变/扩增引物具有下列序列,其中加下划线的G表示突变的位点。5’-GGTCGCGGAGGCGATGGATGCGATCG-3’(SEQIDNO64)5’-CGATCGCATCCATCGCCTCCGCGACC-3’(SEQIDNO65)通过用NcoI消化筛选8个随机选择的克隆,并且其中之一,显示丢失NcoI位点的标明的克隆7通过DNA测序进一步加以验证并且命名为pSMai155(图26)。实施例17在里氏木霉中表达编码具有分解纤维增强活性的家族GH61B、GH61C、GH61D、GH61E和GH61G多肽的Thielaviaterrestris基因设计如下所示的2个合成寡核苷酸引物从基因组克隆PCR扩增编码推定的家族GH61B的Thielaviaterrestris基因。使用InFusionCloningKit使片段直接克隆表达载体,pSMAI155,而不需要限制消化和连接。正向引物5’-cgcggactgcgcaccATGAAGTCGTTCACCATTG-3’(SEQIDNO66)反向引物5’-tcgccacggagcttaGAGGCACTGCGAGTAG-3’(SEQIDNO67)粗体字表示编码序列。剩余的序列与pSMAI155克隆7的插入位点相同。50皮摩尔的上述各个引物用于PCR反应,其中含有10ngThielaviaterrestris基因组克隆15DNA,1XPfx扩增缓冲液,1.5μl10mMblendofdATP、dTTP、dGTP、和dCTP的混合物,2.5单位的PlatinumPfxDNA聚合酶,1μl50mMMgSO4和5μl10XpCRx增强溶液,最终体积为50μl。扩增条件是一个循环的94℃,2分钟;和30个循环的94℃,15秒,55℃,30秒,和68℃,3分钟。然后加热块达到4℃保温循环。反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下3kb的产物条带并利用QIAquickGelExtractionKit,根据制造商的指导纯化。利用InFusionCloningKit将片段克隆进入pSMAI155表达载体。载体用限制内切核酸酶NcoI和PacI消化。片段通过凝胶电泳和QIAquick纯化而被纯化。在产生表达质粒pEJG110(图27)的反应中将基因片段和消化的载体连接在一起,其中家族GH61B基因的转录里氏木霉CBHI启动子和终止子的调控之下。连接反应物(20μl)由1XInFusion缓冲液,1XBSA(BDBiosciences,PaloAlto,CA),1μlInFusion酶(1∶10稀释),用NcoI和PacI消化的100ngpSma155,和100ngThielaviaterrestrisGH61B纯化的PCR产物组成。反应在室温下孵育30分钟。使用1μl反应物转化E.coliXL10SolopacGold细胞(Stratagene,LaJolla,CA)。通过限制酶消化检测含有pEJG110质粒的E.coli转化体,利用QIAGENBioRobot9600制备质粒DNA。用AppliedBiosystemsModel3700AutomatedDNASequencer,利用3.0版Big-DyeTM终止剂(AppliedBiosystems,Inc.,FosterCity,CA)和引物步行策略进行pEJG110的DNA测序。核对核苷酸序列数据的性质全部的序列借助于PHRED/PHRAP软件(UniversityofWashington,Seattle,WA)相互比较。为了在里氏木霉中表达,从其表达构建体pAlLo28利用下列引物PCR扩增Tter61E基因。正向引物5’-GCCCATGGACCATGCTCGCAAAC-3’(SEQIDNO68)反向引物5’-CCTCTAGTTAATTAATCAGCAGC-3’(SEQIDNO69)同样从其表达构建体pAlLo24利用下列引物PCR扩增Tter61G基因。正向引物5’-GCCCATGGACCATGAAGGGACTT-3’(SEQIDNO70)反向引物5’-CCTCTAGTTAATTAATTACAAGC-3’(SEQIDNO71)如下进行两个实验50皮摩尔的上述各个引物用于PCR反应,其中含有50ngpAlLo28DNA,1μl10mMdATP、dTTP、dGTP、和dCTP的混合物,5μl10XAmpliTaqDNA聚合酶缓冲液I(Perkin-Elmer/AppliedBiosystems,Inc.,FosterCity,CA),和5单位的AmpliTaqDNA聚合酶(Perkin-Elmer/AppliedBiosystems,Inc.,FosterCity,CA),最终体积为50μl。使用EppendorfMastercycler5333扩增DNA片段,程序为1个循环的95℃,3分钟;和25循环的95℃,45秒,55℃,60秒,以及72℃,1分30秒。25个循环后,反应物在72℃孵育10分钟,然后冷却至4℃直到进一步的处理。大约681个碱基的PCR反应产物利用TAE缓冲液和每ml0.1μg溴化乙锭,在0.8%GTG-琼脂糖凝胶上分离。借助于DarkReaderTM观察DNA条带以避免UV-诱导的突变。用一次性刀片切下合适的DNA条带,用QIAquickPCRPurificationKit根据制造商的指导纯化。根据制造商的指导(Invitrogen,Carlsbad,CA)将纯化的DNA条带克隆到pCR2.1-TOPO载体中。根据制造商的指导将2微升TOPO-反应物转化进入E.coliTOP10细胞。将转化的细胞接种到补充有100μg/ml氨苄青霉素的2XYT琼脂平板,并于37℃培养过夜。随机选择8个克隆用于质粒DNA制备。各个克隆在补充有每ml100μg氨苄青霉素的3mlLB培养基中生长过夜,并用于以QIAGENBioRobot9600制备质粒DNA。通过限制图谱分析质粒DNA以利用限制内切核酸酶PacI和NcoI鉴定GH61E或GH61G阳性插入的克隆。一旦确认克隆具有GH61E或GH61G基因的成功插入,该克隆利用BigDyeTerminatorVersion3测序保真度,并利用ABI3700DNAAnalyzer(FosterCity,CA)根据制造商的指导进行分析。含有证实的GH61E或GH61G序列的E.coliTOPO克隆DNA用PacI和NcoI消化,然后反应产物在0.8%琼脂糖凝胶上分辨。用一次性刀片切下合适的DNA条带,用QIAquickPCRPurificationKit根据制造商的指导纯化。质粒pSMai155以相同的方式用PacI和NcoI消化以产生与GH61片段相容的末端。消化产物在0.8%琼脂糖凝胶上分辨,切下线性的质粒,并用QIAquickPCRPurificationKit根据制造商的指导纯化。根据制造商的指导,利用快速DNA连接试剂盒(Roche,Indianapolis,IN),PacI/NcoIGH61E或GH61G基因片段被连接进入PacI/NcoI消化的pSMai155质粒。这个连接物根据制造商的指导用于转化E.coliSURE细胞。选择、培养克隆,如上所述制备质粒。通过限制图谱分析质粒DNA以利用PacI和NcoI鉴定GH61E或GH61G插入阳性的克隆。具有GH61E基因的正确限制性图谱的克隆之一被命名为pCW095,而具有GH61G基因的正确限制性图谱的一个克隆被命名为pCW096。产生表达载体,pCW076,以利用里氏木霉CBHII启动子用于基因表达。表达载体pSMai155用限制内切核酸酶SalI和NcoI消化以移出CBHI启动子片段。表达构建体pEJG114(图28)也用SalI和NcoI消化以分离CBHII启动子用于连接进入SalI/NcoI消化的pSMai155质粒。利用快速DNA连接试剂盒根据制造商的指导,SalI/NcoICBHII被连接进入SalI/NcoI消化的pSMai155。根据制造商的指导,这个连接物用于转化E.coliSURE细胞。选择、培养克隆,如上所述制备质粒。通过限制酶消化分析质粒DNA以利用SalI和NcoI鉴定CBHII启动子插入阳性的克隆。然后利用下列所示的引物TrCBH2PrSeqF1测序这些克隆以证实CBHII启动子的存在。具有正确序列的克隆之一被命名为pCW076(图29)。TrCBH2PrSeqF15′-GGATGAAGCTCATTAGCCG-3′(SEQIDNO72)为了在里氏木霉中表达,从pTter61D分离Tter61D基因(如实施例7中所描述的,使用限制内切核酸酶PacI和NcoI)。质粒pCW076以相同的方式用PacI和NcoI消化以产生与GH61D片段相容的末端。消化产物利用TAE缓冲液,在0.8%琼脂糖凝胶上分辨,切下线性的片段并利用QIAquickPCRPurificationKit根据制造商的指导纯化。PacI/NcoIGH61D基因片段利用快速DNA连接试剂盒根据制造商的指导被连接进入PacI/NcoI消化的pCW076。1微升的连接反应物根据制造商的指导用于转化E.coliSURE细胞。选择、培养克隆,如上所述制备质粒。通过限制酶消化分析质粒DNA以利用PacI和NcoI鉴定GH61D插入阳性的克隆。具有正确限制性图谱的克隆之一被命名为pCW078(图30)。根据Christensenetal.,1988,同上文的方法制备里氏木霉RutC30原生质体。5μgpEJG110、pCW095、pCW096、或pCW078用于转化里氏木霉RutC30。各个单独的转化产生大约100个转化体。从各个转化分离60个转化体至单独的Cove/10mM尿嘧啶平板,并在28℃培养7天。一次8个一批地分析转化体菌株。用无菌环从8个单独的平板收集孢子,分别接种进入125ml玻璃摇瓶中的25mlCIM培养基中,并在28℃,250rpm培养。接种后5天,利用7.5%TrisSDS-PAGE凝胶(BioRad,Hercules,CA),根据制造商的指导分析来自各个培养物的0.5μl上清液。培养物的SDS-PAGE图谱显示20%至50%的转化体生产相应于新导入基因的新的蛋白质条带。从各个表达构建体选择合适的转化体用于进一步的研究。实施例18鉴定烟曲霉基因组序列中β-葡糖苷酶家族GH3A基因烟曲霉的部分基因组序列(TheInstituteforGenomicResearch,Rockville,MD)的Blast搜索(Altschuletal.,1997,NucleicAcidsRes.253389-3402)利用查询来自棘孢曲霉的β-葡糖苷酶蛋白质序列(登录号P48825)来进行。基于与询问序列在氨基酸水平的高度相似性,几个基因被鉴定为推定的家族GH3A同系物。选择与询问序列在氨基酸水平具有大于70%同一性的大约3000bp的一个基因组区用于进一步的研究。实施例19烟曲霉基因组DNA提取烟曲霉于37℃和240rpm生长在带有挡板的摇瓶中的250ml马铃薯右旋糖培养基中。通过过滤收获菌丝体,在TE(10mMTris-1mMEDTA)中洗涤两次,并在液氮下冷冻。通过研钵和研棒磨碎冷冻的菌丝体至精细粉末,将其重悬在含有10mMTris,100mMEDTA,1%TritonX-100,0.5M胍-HCl,和200mMNaCl的pH8.0缓冲液中。将无Dnase的RNaseA以20mg/升的浓度加入,且裂解物在37℃孵育30分钟。通过离心除去细胞碎片,利用Maxi500柱(QIAGENInc.,Valencia,CA)分离DNA。该柱在用30mlQC洗涤的10mlQBT中平衡,并用15mlQF(全部缓冲液来自QIAGENInc.,Valencia,CA)洗提。DNA在异丙醇中沉淀,在70%乙醇中洗涤,并通过离心回收。DNA重悬在TE缓冲液。实施例20家族GH3Aβ-葡糖苷酶基因的克隆和米曲霉表达载体的构建设计如下所示的2个合成寡核苷酸引物从实施例19中制备的基因组DNA来PCR扩增编码家族GH3Aβ-葡糖苷酶的烟曲霉基因。使用InFusionCloningKit将片段直接克隆进入表达载体,pAILo2,而不需要限制消化和连接。正向引物5’-ACTGGATTTACCATGAGATTCGGTTGGCTCG-3’(SEQIDNO73)反向引物5’-AGTCACCTCTAGTTACTAGTAGACACGGGGC-3’(SEQIDNO74)粗体字表示编码序列。剩余的序列与pAlLo2的插入位点相同。50皮摩尔的上述各个引物用于PCR反应,其中含有100ng烟曲霉基因组DNA,1XPfx扩增缓冲液,1.5μl10mMdATP、dTTP、dGTP、和dCTP的混合物,2.5单位的PlatinumPfxDNA聚合酶,1μl50mMMgSO4,和2.5μl10XpCRx增强溶液,最终体积为50μl。扩增条件是一个循环的94℃,2分钟;和30个循环的94℃,15秒,55℃,30秒,和68℃,3分钟。然后加热块达到4℃保温循环。反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下3kb的产物条带并利用QIAquick凝胶提取试剂盒根据制造商的指导纯化。然后利用InFusionCloningKit将片段克隆进入pAlLo2表达载体。载体用限制内切核酸酶NcoI和PacI(利用制造商说明的条件)消化。片段通过凝胶电泳和QIAquick凝胶纯化来进行纯化。在产生表达质粒pEJG97(图31)的反应中将基因片段和消化的载体连接在一起,其中家族GH3Aβ-葡糖苷酶基因的转录在NA2-tpi启动子调控之下。连接反应物(20μl)由1XInFusion缓冲液,1XBSA(BDBiosciences,PaloAlto,CA),1μlInFusion酶(1∶10稀释),用NcoI和PacI消化的150ngpAlLo2,和50ng烟曲霉β-葡糖苷酶纯化的PCR产物组成。反应在室温下孵育30分钟。使用1ul反应物转化E.coliXL10SolopacGold细胞(Stratagene,LaJolla,CA)。通过限制酶消化检测含有pEJG97质粒的E.coli转化体,利用QIAGENBioRobot9600制备质粒DNA。实施例21编码家族GH3Aβ-葡糖苷酶的烟曲霉基因组序列的表征来自pEJG97的烟曲霉β-葡糖苷酶基因的DNA测序用Perkin-ElmerAppliedBiosystemsModel377XLAutomatedDNASequencer(Perkin-Elmer/AppliedBiosystems,Inc.,FosterCity,CA),利用染料-终止剂化学(Gieseckeetal.,1992,JournalofVirologyMethods3847-60)和引物步行策略进行。核对核苷酸序列数据的性质,全部的序列借助于PHRED/PHRAP软件(UniversityofWashington,Seattle,WA)相互比较。根据与来自棘孢曲霉、黑曲霉、和Aspergilluskawachii的同源基因的相似性构建烟曲霉序列的基因模型。核苷酸序列(SEQIDNO75)和推导的氨基酸序列(SEQIDNO76)显示在图32A和32B中。该基因组片段编码由62、55、58、63、58、58、63和51个bp的8个内含子间隔的863个氨基酸的多肽。该基因的%G+C含量是54.3%。利用SignalP软件程序(Nielsenetal,1997,同上文),预测19个残基的信号肽。预测的成熟蛋白质包含分子量为91.7kDa的844个氨基酸。利用ClustalW方法(Higgins,1989,CABIOS5151-153),利用LASERGENETMMEGALIGNTM软件(DNASTAR,Inc.,Madison,WI)确定β-葡糖苷酶序列的比较排列,其中使用同一性表格和下列多个排列参数缺口罚分为10,缺口长度罚分为10。成对排列参数是Ktuple=1,缺口罚分=3,窗口=5,以及对角线=5。排列对比显示烟曲霉β-葡糖苷酶基因的推导氨基酸序列与棘孢曲霉(登录号P48825)、黑曲霉(O00089)、和Aspergilluskawachii(P87076)β-葡糖苷酶的推导氨基酸序列共享78%、76%、和76%的同一性。实施例22烟曲霉家族GH3Aβ-葡糖苷酶基因在米曲霉JaL250中的表达米曲霉JaL250原生质体根据Christensenetal.,1988,同上文的方法制备。使用5μgpEJG97(以及pAlLo2作为载体对照)转化米曲霉JaL250。用pEJG97转化米曲霉JaL250产生大约100个转化体。分离10个转化体至单独的PDA平板。10个转化体中取5个汇合的PDA平板用5ml0.01%Tween80洗涤,分别接种到125ml玻璃摇瓶中的25mlMDU2BP培养基中,于34℃,200rpm培养。培养后5天,利用8-16%Tris-甘氨酸SDS-PAGE凝胶(Invitrogen,Carlsbad,CA)根据制造商的指导分析来自各个培养物的0.5μl上清液。培养物的SDS-PAGE分布图显示转化体中的一个(命名为转化体1)具有大约130kDa的主要条带。转化体1(生长在PDA上)的汇合平板用10ml0.01%Tween20洗涤,接种进入含有400mlMDU2BP培养基的2升Fembach以产生用于表征该酶的发酵液。在第5天收获培养瓶,利用0.22μmGPExpressplusMembrane(Millipore,Bedford,MA)过滤。实施例23烟曲霉家族GH3Aβ-葡糖苷酶基因在里氏木霉中的表达设计如下所示的2个合成寡核苷酸引物来从实施例20中描述的pEJG97PCR扩增烟曲霉β-葡糖苷酶。使用InFusionCloningKit将该片段直接克隆进入表达载体,pMJ09,而不需要限制消化和连接。正向引物5’-GGACTGCGCACCATGAGATTCGGTTGGCTC-3’(SEQIDNO77)反向引物5’-TCGCCACGGAGCTTACTAGTAGACACGGGG-3’(SEQIDNO78)粗体字表示编码序列。剩余的序列与pMJ09的插入位点相同。50皮摩尔的上述各个引物用于PCR反应(50μl),其中包含100ngpEJG97DNA,1XPfx扩增缓冲液,1.5μl10mMdATP、dTTP、dGTP、和dCTP的混合物,2.5单位的PlatinumPfxDNA聚合酶,1μl50mMMgSO4,和2.5μl10XpCRx增强溶液。扩增条件是一个循环的94℃,2分钟;和30个循环的94℃,15秒,55℃,30秒,和68℃,3分钟。然后加热块达到4℃保温循环。反应产物利用TAE缓冲液,在1.0%琼脂糖凝胶上分离,其中从凝胶切下3kb的产物条带并利用QIAGENQIAquick凝胶提取试剂盒根据制造商的指导纯化。然后纯化的3kb片段利用InFusionCloningKit被克隆进入pMJ09。载体用NcoI和PacI消化。如上所述片段通过凝胶电泳和QIAquick凝胶纯化来进行纯化。在产生表达质粒pEJG107(图33)的反应中将基因片段和消化的载体连接在一起,其中家族GH3Aβ-葡糖苷酶基因的转录在里氏木霉cbhI启动子的调控之下。连接物(50μl)由1XInFusion缓冲液,1XBSA,1μlInFusion酶(1∶10稀释),100ng用NcoI和PacI消化的pMJ09,和100ng烟曲霉β-葡糖苷酶纯化的PCR产物组成。反应在室温下孵育30分钟。使用1μl反应物转化E.coli电感受态的SURE细胞(Stratagene,LaJolla,CA)。通过限制酶消化检测含有pEJG107质粒的E.coli转化体,利用QIAGENBioRobot9600制备质粒DNA。利用染料终止剂化学(Gieseckeetal.,1992,JournalofVirologyMethods3847-60)和引物步行策略,用Perkin-ElmerAppliedBiosystemsModel377XLAutomatedDNASequencer(Perkin-Elmer/AppliedBiosystems,Inc.,FosterCity,CA)进行来自pEJG107的烟曲霉β-葡糖苷酶基因的DNA测序。核对核苷酸序列数据的性质,全部的序列借助于PHRED/PHRAP软件(UniversityofWashington,Seattle,WA)相互比较。根据Christensenetal.,1988,同上文的方法制备里氏木霉RutC30原生质体。使用5μgpEJG107转化里氏木霉RutC30。该转化产生大约100个转化题。分离60个转化体至单独的COVE/10mM尿嘧啶平板并于28℃培养。从用无菌环将60个转化体中的8个击打3次的平板收集孢子,分别接种进入125ml玻璃摇瓶中的25mlCIM培养基中并在28℃,250rpm培养。培养后5天,利用7.5%TrisSDS-PAGE凝胶(Biorad,Hercules,CA),根据制造商的指导分析来自各个培养物的0.5μl上清液。培养物的SDS-PAGE分布图显示转化体之一(命名为转化体1)具有大约130kDa的新的主要条带。实施例24具有分解纤维增强活性的Thielaviaterrestris多肽的纯化和表征ThielaviaterrestrisNRRL8126摇瓶培养物生长于44℃,175rpm在500ml带有挡板的摇瓶中的100mlNNCYPmod培养基中。培养瓶用来自相同培养基的新鲜琼脂平板的栓塞(大约2平方cm)接种,在收获前容许生长大约3-5天。通过在9500xg离心培养物大约10分钟获得未加工的发酵液样品以除去细胞物质和任何残余碳源。然后如上所述再次离心所得到的上清液。使用上清液作为生化分析的原材料,当不用时储存在4℃。通过将Thielaviaterrestris培养在具有每升52g纤维素的NNCYP培养基上,使Thielaviaterrestris发酵罐培养物生长,其在42℃发酵期间分批(没有附加的碳源)并保持在pH5.0。容许发酵流动直到分批的纤维素已经耗尽(一般为大约40小时)时收获发酵液,并如上所述离心除去菌丝体。在进行蛋白质纯化实验前,通过利用CentriconPlus20(Millipore,Bedfprd,MA)过滤装置,在浮桶式转头离心机上(Sorvall,RC3BPlus)浓缩澄清的上清液样品来制备Thielaviaterrestris发酵液的小规模制品。将大约3ml各个浓缩物加载到10DGEconoPAC(BioRad,Hercules,CA)用50mM乙酸钠pH5.0平衡的脱盐柱上,利用4ml50mM乙酸钠pH5.0洗提样品。对于Thielaviaterrestris发酵液(大约0.5升至10升)的大规模制备,利用如下所述的方案。通过在9500xg.离心培养物大约20分钟来清除未加工发酵液样品的细胞碎片。然后过滤(GPExpressmembrane,聚醚砜,0.22μm,Millipore,Bedford,MA)澄清的发酵液样品,缓冲交换50mM乙酸钠pH5.0(PallFiltron,NorthBorough,MA,10kDa聚醚砜膜,大约10-20psi),利用Amicon超滤装置(Millipore,Bedford,MA,10kDa膜,40psi,4℃)浓缩。利用其中牛血清白蛋白用作蛋白质标准的BCA蛋白质分析试剂盒(Pierce,Rockford,IL)来确定蛋白质浓度。一般在其中包括精确分子量标准(BioRad,Hercules,CA)的8-16%SDS-PAGE凝胶(Invitrogen,Carlsbad,CA;200V,1小时)上检验来自脱盐步骤的等分样品。利用Biosafe考马斯染色剂(BioRad,Hercules,CA)染色凝胶的蛋白质,并用去离子的H2O脱色。将Thielaviaterrestris上清液加载到用20mMTris-HClpH8.2平衡的QSepharoseBigBead柱(AmershamPharmacia,UppsalaSweden)上。收集流过的物质并储存在4℃备用。在洗提前,柱子用5个柱体积的起始缓冲液洗涤。结合材料用20mMTris-HClpH8.2缓冲液中线性梯度为0至0.40M的NaCl(15个柱体积;10ml级分)洗提。根据UV图谱(A280nm),汇集表示可分辨蛋白质峰的单独级分用于表征,并且缓冲交换50mM乙酸钠pH5.0(UltrafreeBiomax10kDaNMWL膜,Millipore,Bedford,MA)。然后利用PhenylSuperose柱(HR16/10PharmaciaBiotech,UppsalaSweden),利用如下所述的方案进一步分离标明为ThielaviaterrestrisQSepharoseBigBead的级分。将固体硫酸铵加入待分离的样品产生最后浓度为1.7M的(NH4)2SO4。然后离心和过滤(10分钟,5,000xg,RT;0.22μmGPExpressmembrane,Millipore,Bedford,MA)样品,以在加载到用含1.7M(NH4)2SO4的20mMTris-HClpH8.2平衡的PhenylSuperose柱上之前除去颗粒物质。利用20mMTris-HClpH8.2中递减线性梯度(利用去离子的H2O,15个柱体积)为1.7M的(NH4)2SO4实现结合物质的洗提。根据A280nm吸光率汇集级分以富集可分辨峰的面积。利用Amicon超滤装置(聚醚砜膜,5kDaNMWL,Bedford,MA),汇集物被缓冲交换进入50mM乙酸钠pH5.0。利用BCA蛋白质分析试剂盒确定蛋白质浓度,如实施例1中所描述的在8-16%Tris-甘氨酸SDS-PAGE凝胶上分析。玉米秸在美国能源部国家可更新能源实验室(NREL)利用稀硫酸预处理。下列条件用于预处理1.4wt%硫酸,在165℃和107psi,8分钟。根据NREL,预处理的玉米秸(PCS)中不溶于水的固体包含56.5%纤维素、4.6%半纤维素和28.4%木质素。纤维素和半纤维素利用NREL标准分析方法#002,通过两步的硫酸水解,以及随后通过高效液相色谱法分析糖而测定。木质素利用NREL标准分析方法#003,在用硫酸水解纤维素和半纤维素级分后重量分析测定。在酶促水解前,PCS用大体积的DDI水在玻璃滤器上洗涤;发现水洗PCS的干重是24.54%。碾磨的PCS(干重32.35%)通过在咖啡-研磨机中碾磨,以及随后用去离子水在22μmMillipore过滤器(6PExpressMembrane,Stericup,Millipore,Bedford,MA)上洗涤从水洗PCS制备。利用1.1mlImmunoware微试管(Pierce,Rockford,IL),利用1.0ml的总反应体积进行PCS的水解。在这个方案中,在存在纤维素酶蛋白质加样的3%米曲霉β-葡糖苷酶(根据WO02/095014在米曲霉中重组生产)或3%烟曲霉β-葡糖苷酶(根据实施例22在米曲霉中重组生产)时,利用Thielaviaterrestris发酵液的不同蛋白质加样(表示为每克PCS的mg酶)或Celluclast1.5L样品(NovozymesA/S,Bagsvrd,Denmark)进行PCS的水解(10mg/ml,在50mM乙酸钠pH5.0缓冲液中)。Thielaviaterrestris蛋白质级分的PCS水解能力的筛选在50℃进行(Isotemp102S水浴或TSAutoflowCO2JacketedIncubator)。一般地,反应以一式四份进行,在水解过程中取等分样品。PCS水解反应通过混合20μl等分量的各个水解产物和180μl0.11MNaOH(停止反应剂)而停止。对于各个样品产生合适的连续稀释,利用下列所述适合96孔微平板规格的对羟基苯甲酸酰肼(PHBAH,Sigma,St.Louis,MO)分析来测定还原糖含量。简要地,将90μl等分量的适当稀释样品置于96孔锥形底微平板中。反应通过向各个孔加入在2%NaOH中的60μl1.5%(w/v)PHBAH起始。平板在95℃无盖加热10分钟。容许平板冷却至室温(RT),向各个孔加入50μl蒸馏的H2O。从各个孔取100μl等量转移至平底的96孔平板,利用SpectraMaxMicroplateReader(MolecularDevices,Sunnyvale,CA)测量在A410nm处的吸光率。使用葡萄糖标准(用0.4%氢氧化钠稀释为0.1-0.0125mg/ml)制备标准曲线以转化所得到的A410nm值为葡萄糖当量。使用所得到的当量计算各个反应中PCS纤维素转化的百分比。利用下列等式计算纤维素转化至还原糖的程度(转化率,%)转化率(%)=RS(mg/ml)*100*162/(纤维素(mg/ml)*180)==RS(mg/ml)*100/(纤维素(mg/ml)*1.111)在这个等式中,RS是按葡萄糖当量计量的溶液中还原糖的浓度(mg/ml),而因子1.111反映转化纤维素至葡萄糖中的重量增加。为了重新构成最初Thielaviaterrestris发酵液PCS水解活性,来自QSepharoseBigBead柱的选择汇集物(汇集物A到F)以相等的比率混合,并且检验其PCS水解活性。最接近起始原材料PCS活性的混合物(Thielaviaterrestris发酵液,5mg酶加载=77%PCS纤维素转化)是由汇集物A+B+C+E组成的混合物(5mg酶加载=83%PCS纤维素转化)。其中ThielaviaterrestrisQSepharoseBigBead汇集物(流过物质)在PhenylSuperose柱上分离的FPLC流动(AKTADesign,AmershamPharmaciaBiotech,UppsalaSweden)产生随后被汇集的多个级分,且如先前所述进行缓冲交换。根据各个汇集样品的蛋白质浓度(BCA蛋白质分析试剂盒),从这个分级分离步骤回收总蛋白质加载的大约43%。为了筛选能够增强Celluclast1.5L性能的Thielaviaterrestris样品,进行PCS水解反应(1.0ml方案,每升10gPCS,50℃,通过添加3%的总加载的米曲霉β-葡糖苷酶补充),其中2.5mg酶加载Celluclast1.5L与2.5mg酶加载的各个汇集的样品(每个反应5mg酶加载的总蛋白)混合。Celluclast1.5L对照反应由分别产生86%、75%和53%的PCS纤维素转化值的10mg酶加载、5mg酶加载和2.5mg酶加载组成。所得到的PCS水解的分析显示一个汇集的样品当以50∶50的蛋白质比率加入Celluclast1.5L时,5mg酶的总加载超过5mg酶加载的Celluclast1.5L对照反应(79%对75%)。当在8-16%丙烯酰胺梯度凝胶上分析时,这个样品显示包括大约42kDa的主要蛋白质条带。实施例25通过表达烟曲霉β-葡糖苷酶里氏木霉发酵肉汤ThielaviaterrestrisGH61B对预处理玉米秸水解的影响使ThielaviaterrestrisGH61B(如实施例12中所描述的在米曲霉中重组表达)脱盐并在水解实验前利用具有Biomax-5膜(5000NMWL;Millipore,Bedford,MA)的CentriconPlus-20离心滤器交换至50mM乙酸钠pH5.0。表达烟曲霉β-葡糖苷酶(参见实施例23)的无细胞里氏木霉发酵肉汤用于水解试验而没有脱盐或缓冲交换。酶样品中的蛋白质浓度通过如BCA蛋白质分析反应剂试剂盒(PierceChemicalCo.,Rockford,IL)的指导所描述的BCA微平板分析确定。表达烟曲霉β-葡糖苷酶(参见实施例23)的无细胞里氏木霉发酵肉汤另外在测定蛋白质浓度之前根据制造商的指导通过BioSpin6柱(Bio-RadLaboratories,Hercules,CA)而脱盐。在各个实验前从储存在-20℃的酶储液新鲜制备酶稀释物。还原糖(RS)利用被改进和适应于96-孔微平板规格的p-羟基苯甲酸酰肼(PHBAH)分析(Lever,M.,1972,Anewreactionforcolorimetricdeterminationofcarbohydrates,Anal.Biochem.,47273-279)测定。将90-μl等分量的稀释样品置于96-孔锥形底微平板(ComingInc.,Acton,MA,Costar,clearpolycarbonate)的各个孔中。分析通过向各个孔加入60μl在2%氢氧化钠中的1.25%PHBAH而开始。无盖的平板在定制的加热块上于95℃加热10分钟。微平板冷却至室温后,向各个孔加入35μl去离子水。从各个孔移出100-μl等分,转移至平底的96-孔平板(CorningInc.,Acton,MA,Costar,结合培养基的聚苯乙烯)。利用SpectraMAX微平板读取仪(MolecularDevices,Sunnyvale,CA)测量在410nm(A410)处的吸光率。利用标准曲线将A410值转化成为葡萄糖当量。由6个与样品相似处理的葡萄糖标准(0.005、0.010、0.025、0.050、0.075、和0.100mg/ml)获得标准曲线。通过用去离子水稀释10mg/ml的葡萄糖储液制备葡萄糖标准。利用实施例24中描述的相同等式计算纤维素转化为还原糖的程度(转化率,%)。碾磨的PCS(按干重为1%w/v)通过以每gPCS2.5、5、10、和20mg蛋白质表达烟曲霉β-葡糖苷酶的无细胞里氏木霉发酵肉汤(见实施例23)的水解在用DeepwellMats96(Brinkmann,Westbury,NY)覆盖的DeepwellPlates96(1.2ml,Brinkmann,Westbury,NY)中进行。初始体积为1ml的全部反应物在50mM乙酸钠pH5.0中泳动,其中在50℃、55℃、和60℃间歇搅拌。每gPCS5mg的包含里氏木霉发酵肉汤的反应物用每gPCS1mg(20%纤维素酶蛋白质加载)的ThielaviaterrestrisGH61B(如在此描述的在米曲霉中重组生产)补充,并且该结果与未补充的反应物相比较。利用8-道移液器在特定的时间点从PCS水解反应物移出20μl等分,并加入MultiScreenHV96-孔过滤平板(Millipore,Bedford,MA)中的180μl碱性混合物(102mMNa2CO3和58mMNaHCO3)以终止反应。样品被真空过滤进入另一个平底微平板以除去PCS残余物。适当稀释后,利用PHBAH分析如实施例24中所描述的分析滤出液的RS。如图34和35所示的结果表明补充表达烟曲霉β-葡糖苷酶(参见实施例23)的里氏木霉发酵肉汤,其中ThielaviaterrestrisGH61B蛋白质与未补充的肉汤相比提高94小时的水解产量16-30%并且降低酶加载的需要量。在50℃和55℃,94小时的相同纤维素转化率(conversion)可利用总蛋白质加载为每gPCS6mg的补充的发酵肉汤和每gPCS10mg的总蛋白质加载的非补充发酵肉汤获得。实施例26用在米曲霉中重组表达的ThielaviaterrestrisGH61B水解预处理的玉米秸(PCS)表达ThielaviaterrestrisGH61B的米曲霉转化体如下生长在摇瓶(SF)培养物中。用5毫升0.01%Tween80的含水溶液收集孢子,用MDU2BP洗涤一次或两次以上以最大化收集孢子的数目。孢子悬浮液用于接种到2升Fernbach培养瓶中的500毫升MDU2BP培养基中。转化体培养物在34℃以恒定振荡(200rpm)培养。接种后5天,通过在具有孔径大小为0.45μm的500毫升,75mm尼龙过滤装置上过滤来收集培养肉汤。通过SDS-PAGE分析5μl发酵液样品。含有rGH61B的发酵液包含一个大约42,000MW的主要条带。在通过在搅拌细胞中加压超滤(Amicon,PM10membranewith10kDMWCO)浓缩至大约15X浓缩,然后利用Econo-Pac10DG柱(BioRad)脱盐/缓冲交换成为柠檬酸缓冲液(50mM,pH5.0)前,该发酵液储存在-20℃。通过BCA蛋白质分析试剂盒分析蛋白质浓度后,酶原液储存在-20℃。蛋白质没有进一步纯化,根据测量的总蛋白质,原液被加入反应混合物。PCS的水解利用1.1mlImmunoware微试管或1ml深孔块(VWR),利用1.0ml的总反应体积进行。PCS的水解(在50mM乙酸钠pH5.0缓冲液中为10mg/ml)利用有或没有加入Celluclast1.5L的重组ThielaviaterrestrisGH61B蛋白质的不同蛋白质加载(表示为每克PCSmg酶),在存在3%烟曲霉β-葡糖苷酶(BG,3%纤维素酶蛋白质加载)时进行。水解混合物的孵育在50℃进行(Isotemp102S水浴或具有增湿作用的TSAutofiowCO2Jacketed培养箱)。一般地,反应以一式三份进行,在水解过程中取等分样品。报道的数据是三份的平均数。PCS水解反应通过混合20μl等分的各个水解产物和180μlPCS终止缓冲液(0.102MNa2CO3,0.058MNaHCO3,pH~10)停止。立即分析样品或冷冻储存在-20℃。还原糖含量利用适应于96孔微平板规格的p-对羟基苯甲酸酰肼(PHBAH)分析测定。简要地,将100μl等分适当稀释的样品置于96孔锥形底微平板中。反应通过向各个孔添加在2%NaOH中的50μl1.5%(w/v)PHBAH而起始。平板在95℃无盖加热10分钟。容许平板冷却至RT并向各个孔加入50ulddH2O。将来自各个孔的100μl等分转移至平底的96孔平板,并利用SpectraMax微平板读取仪(MolecularDevices)测量在A410nm处的吸光率。使用葡萄糖标准(用0.4%氢氧化钠稀释为0.1-0.0125mg/ml)制备标准曲线以转化所得到的A410值成为葡萄糖当量(基于从理论上纤维素至葡萄糖的完全转化率预期的产量)。使用所得到的当量计算各个反应中PCS纤维素转化的百分比。以葡萄糖当量(转化百分比)对总蛋白质加载(mg酶/gPCS)对结果进行作图。为了检验ThielaviaterrestrisGH61B蛋白质增强Celluclast1.5L活性的能力,利用1.0mlPCS微方案,测试2.5mgCelluclast1.5L加每gPCS0.078至1.25mg的GH61B蛋白质混合物的剂量依赖的PCS水解。为了比较的目的,对于没有加入GH61B蛋白质的Celluclast1.5L进行相似的总蛋白质加载。全部样品具有3%总纤维素酶加载的补充的烟曲霉β-葡糖苷酶。表2中所示的结果证明加入不同量的ThielaviaterrestrisGH61B蛋白质至所得到的总酶加载为2.578至3.75mg/gPCS的2.5mg/gPCSCelluclast1.5L,增加葡萄糖转化率超过通过没有GH61B蛋白质的Celluclast1.5L,在2.5或3.75mg/gPCS酶加载水平所得到的转化率。将仅仅0.078mgGH61B蛋白质加入2.5mgCelluclast1.5L提高PCS水解超过没有GH61B蛋白质的3.75mgCelluclast1.5L所测得的数量。因此,将GH61B蛋白质加入含有Celluclast1.5L的溶液,当水解酸预处理的玉米秸(PCS)时,增加还原糖(主要为葡萄糖和残余纤维二糖)的产量。产量增加高于通过添加等于或少于Celluclast1.5L数量所获得的产量,导致降低酶加载的需要量并且增加酶的效率。表2.Celluclast和GH61B值是mg酶/gPCS,而葡萄糖是理论产量的百分比。全部混合物包含3%w/w加入的β-葡糖苷酶以增加纤维二糖至葡萄糖的转化率。葡萄糖转化率显示为通过PCS水解可得到的理论上葡萄糖的百分比。实施例27用在米曲霉中重组生产的GH61B、GH61E和GH61G多肽水解预处理的玉米秸(PCS)以如实施例24和25中描述的相同系列的PCS水解反应来测试3个家族61多肽,包括ThielaviaterrestrisGH61B、GH61E、和GH61G。全部的家族61多肽如实施例14中所描述的在米曲霉中表达,利用装有PM10膜,10kDa截留(Millipore,Billerica,MA)的Amiconstirredcell浓缩发酵液,并利用Econo-Pac10DG柱(BioRadLaboratories,Hercules,CA)脱盐。通过BCA(Pierce,BSA用作标准)分析蛋白质浓度后,这些酶原液储存在-20℃。蛋白质没有进一步纯化,根据测量的总蛋白质,原液被加入反应混合物。PCS的水解(在50mM乙酸钠pH5.0缓冲液中为10mg/ml)利用总反应体积为1.0ml的1.1mlImmunoware微试管(Pierce,Rockford,IL)进行。测试家族61多肽增强来源于表达米曲霉β-葡糖苷酶(WO02/095014)的里氏木霉发酵液的纤维酶制剂水解性能的能力,该酶制剂在此称为Tr/AoBG,获得自NovozymesA/S,Bagsvaerd,Denmark。PCS的水解利用补充有每克PCS0.2mgGH61多肽的每克PCS2.5mgTr/AoBG进行。PCS水解在50℃(TSAutoflowCO2Jacketed培养箱)进行。重复进行反应,在水解过程中取等分样品。PCS水解反应通过混合20μl等分的各个水解产物和180μl0.11MNaOH(终止试剂)来停止。对于各个样品产生适当的连续稀释,还原糖含量如下所述利用适应于96孔微平板规格的对羟基苯甲酸酰肼(PHBAH,Sigma,St.Louis,MO)分析来测定。简要地,将90μl等分适当稀释的样品置于96孔锥形底微平板中。反应通过向各个孔添加在2%NaOH中的60μl1.5%(w/v)PHBAH起始。平板在95℃无盖加热10分钟。容许平板冷却至室温(RT),向各个孔加入50μl蒸馏H2O。从各个孔取100μl等分转移至平底的96孔平板,利用SpectraMax微平板读取仪(MolecularDevices,Sunnyvale,CA)测量A410nm处的吸光率。使用葡萄糖标准(用0.4%氢氧化钠稀释为0.1-0.0125mg/ml)制备标准曲线以转化所获得的A410nm值为葡萄糖当量。使用所得到的当量计算各个反应中PCS纤维素转化的百分比。利用实施例24中描述的相同等式计算纤维素转化为还原糖的程度(转化率,%)。经单独的Tr/AoBG(2.5mg/gPCS)或各自补充有3个GH61多肽(0.2mg/gPCS)之一的纤维素转化率概括在表3和图36中。表3.经单独的Tr/AoBG或在115h,50℃,pH5.0补充GH61多肽的Tr/AoBG的纤维素转化率。表3和图36显示全部的3个GH61多肽增加Tr/AoBG对PCS的活性。向2.5mgTr/AoBG补充0.2mgT.t.GH61B、T.t.GH61E、或T.t.GH61G产生接近或高于经3.5mgTr/AoBG的转化水平,表明Tr/AoBG对PCS的活性受到3个GH61多肽的促进。在单独的试验中利用2.5mg/gPCSTr/AoBG和0.125mg/gPCST.t.GH61C,孵育120小时来评估ThielaviaterrestrisGH61C。对于单独的Tr/AoBG,转化率是63.1%,而加入T.t.GH61C,转化率是66.2%。实施例28用在米曲霉中重组生产的GH61D多肽水解预处理的玉米秸(PCS)如实施例14中所描述的,ThielaviaterrestrisGH61D多肽在米曲霉中表达,如实施例27浓缩和脱盐发酵液。PCS的水解利用1ml深孔块(VWR),利用1.0ml的总反应体积进行。PCS的水解(10mg/ml,在50mM乙酸钠pH5.0缓冲液中)利用有或没有加入Celluclast1.5L的重组Thielaviaterrestris蛋白质的不同蛋白质加载(表示为每克PCSmg酶),在存在3%烟曲霉β-葡糖苷酶(BG,3%的纤维素酶蛋白质加载)时进行。水解混合物的孵育在50℃(具有增湿作用的TSAutoflowCO2Jacketed培养箱)进行。一般地,反应以一式三份进行,在水解过程中取等分样品。报道的数据是三份的平均数。PCS水解反应通过混合20μl等分各个水解物和180μlPCS终止缓冲液(0.102MNa2Co3,0.058MNaHCO3,pH~10)停止。立即分析样品或冷冻储存在-20℃。还原糖含量利用适应于96孔微平板规格的p-对羟基苯甲酸酰肼(PHBAH)分析来测定。简要地,将100μl等分适当稀释的样品置于96孔锥形底平板。反应通过向各个孔添加在2%NaOH中的50μl1.5%(w/v)PHBAH起始。平板在95℃无盖加热10分钟。容许平板冷却至RT并向各个孔加入50μlddH2O。从各个孔取100μl等分转移至平底的96孔平板,利用SpectraMax微平板读取仪(MolecularDevices)测量A410nm处的吸光率。使用葡萄糖标准(用0.4%氢氧化钠稀释为0.1-0.0125mg/ml)制备标准曲线以转化所获得的A410值为葡萄糖当量(基于从理论上纤维素至葡萄糖的完全转化率预期的产量)。使用所得到的当量计算各个反应中PCS纤维素转化的百分比。以葡萄糖当量(转化百分比)对总蛋白质加载(loading)(mg酶/gPCS)对结果进行作图。为了检验GH61D增强Celluclast1.5L活性的能力,利用1.0mlPCS微方案来测试2.5mgCelluclast加0.1至0.8mgGH61D/gPCS混合物的PCS水解剂量依赖性。为了比较的目的,也对没有加入GH61D的Celluclast1.5L进行相似的总蛋白质加载。全部的样品具有以3%总纤维素酶加载补充的烟曲霉β-葡糖苷酶。向2.5mg/gPCSCelluclast加入不同数量的GH61D,得到总酶加载为2.6至3.3mg/gPCS使葡萄糖转化率增加超过通过酶加载水平为3.4mg/gPCS而没有GH61D的Celluclast所获得的转化率(表4)。表4.通过单独的Celluclast或补充GH61D的Celluclast的纤维素转化率生物材料的保藏下列生物材料已经按照布达佩斯条约的规定保藏在农业研究机构培养物保藏中心,1815UniversityStreet,Peoria,Illinois,61604,并给出下列保藏号保藏物保藏号保藏日期E.coli菌株pEJG120NRRLB-306992003年12月19日E.coli菌株pTter61CNRRLB-308232005年1月21日E.coli菌株pTter61DNRRLB-308122005年1月21日E.coli菌株pTter61ENRRLB-308142005年1月21日E.coli菌株pTter61GNRRLB-308112005年1月21日该菌株于下述条件下保藏确保在本专利申请未决期间,由专利与商标委员依据37C.F.R.§1.14和35U.S.C.§122授权的人能够获得该培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了该主题申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。在此描述并要求的本发明不局限于本文公开的具体方面的范围内,因为这些方面旨在作为本发明的某些方面的说明。任何等同的方面确定地包含在本发明的范围内。实际上,除去在这里显示和描述的那些之外,对本发明前述的说明书的各种更改,对于本领域的那些技术人员是显而易见的。这样的更改也确定地落在所附权利要求的范围内。在有冲突的情况下,以包含定义的本公开为准。在此引用各种参考文献,其公开整体地并入作为参考。关于微生物保藏的说明(细则13之二)PCT/RO/134表(1992年7月)关于微生物保藏的说明(细则13之二)PCT/RO/134表(1992年7月)<tablesid="table8"num="008"><tablewidth="817">申请人或代理人档案号国际申请号PCT/US2005/003525</table></tables>关于微生物保藏的说明(细则13之二)<tablesid="table9"num="009"><tablewidth="818">A.对说明书第117页,第11行所述的微生物的说明。B.保藏事项其它保藏在补充页中□农业研究机构保藏中心保藏单位名称AgriculturalResearchServicePatentCultureCollection(NRRL)保藏单位地址(包括邮政编码和国名)美国伊利诺斯州皮奥里亚市大学街1815号北方区域研究中心邮政编码61604NortheruRegionalResearchCenter,1815UniversityStreet,Peotia,IL61604,US保藏日期2005年1月21日保藏编号B-30812C.补充说明(必要时)本栏内容有补充页□在专利申请期间,关于欧洲和澳大利亚专利申请的指定,所保藏的微生物的样本只向由要求此样本的人所指定的独立鉴定人提供(Rule28(4)EPC/Regulation3.25ofAustraliaStatutoryRule1991No.71)。D.本说明是为下列指定国作的(如果说明不是为所有指定国而作的)E.补充说明(必要时)下列说明将随后向国际局提供(写出说明的类别,例如“保藏的编号”)</table></tables><tablesid="tabl0004"num="0004"></tables>PCT/RO/134表(1992年7月)关于微生物保藏的说明(细则13之二)PCT/RO/134表(1992年7月)关于微生物保藏的说明(细则13之二)PCT/RO/134表(1992年7月)序列表&lt;110&gt;诺维信股份有限公司(NOVOZYMESBIOTECH,INC.)&lt;120&gt;具有分解纤维增强活性的多肽及其编码多核苷酸&lt;130&gt;10587.204-WO&lt;150&gt;60/540,661&lt;151&gt;2004-01-30&lt;160&gt;78&lt;170&gt;PatentInversion3.2&lt;210&gt;1&lt;211&gt;1846&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;1aattgaaggagggagtggcggagtggccaccaagtcaggcggctgtcaactaaccaagga60tgggaacagttcggctcgccttgcccgagggcagcgttccctgatggggacgaaccatgg120gactggggtcagctgctgtataaaagttcaaatcgatgatctctcagatggcgctgctgg180ggtgttctgcgcttttccatcctcgcaacctggtatcccactagtccagcgttcggcacc240atgaagtcgttcaccattgccgccttggcagccctatgggcccaggaggccgccgcccac300gcgaccttccaggacctctggattgatggagtcgactacggctcgcaatgtgtccgcctc360ccggcgtccaactcccccgtcaccaatgttgcgtccgacgatatccgatgcaatgtcggc420acctcgaggcccaccgtcaagtgcccggtcaaggccggctccacggtcacgatcgagatg480caccaggttcgcacgcctctctgcgtaggccccccagctactatatggcactaacacgac540ctccagcaacctggcgaccggtcttgcgccaacgaggctatcggcggcgaccactacggc600cccgtaatggtgtacatgtccaaggtcgatgacgcggtgacagccgacggttcatcgggc660tggttcaaggtgttccaggacagctgggccaagaacccgtcgggttcgacgggcgacgac720gactactggggcaccaaggacctcaactcgtgctgcggcaagatgaacgtcaagatcccc780gaagacatcgagccgggcgactacctgctccgcgccgaggttatcgcgctgcacgtggcc840gccagctcgggcggcgcgcagttctacatgtcctgctaccagctgaccgtgacgggctcc900ggcagcgccaccccctcgaccgtgaatttcccgggcgcctactcggccagcgacccgggc960atcctgatcaacatccacgcgcccatgtcgacctacgtcgtcccgggcccgaccgtgtac1020gcgggcggctcgaccaagtcggctggcagctcctgctccggctgcgaggcgacctgcacg1080gttggttccggccccagcgcgacactgacgcagcccacctccaccgcgaccgcgacctcc1140gcccctggcggcggcggctccggctgcacggcggccaagtaccagcagtgcggcggcacc1200ggctacactgggtgcaccacctgcgctgtaagttccctcgtgatatgcagcggaacaccg1260tctggactgttttgctaactcgcgtcgtagtccgggtctacctgcagcgccgtctcgcct1320ccgtactactcgcagtgcctctaagccgggagcgcttgctcagcgggctgctgtgaagga1380gctccatgtccccatgccgccatggccggagtaccgggctgagcgcccaattcttgtata1440tagttgagttttcccaatcatgaatacatatgcatctgcatggactgttgcgtcgtcagt1500ctacatcctttgctccactgaactgtgagaccccatgtcatccggaccattcgatcggtg1560ctcgctctaccatctcggttgatgggtctgggcttgagagtcactggcacgtcctcggcg1620gtaatgaaatgtggaggaaagtgtgagctgtctgacgcactcggcgctgatgagacgttg1680agcgcggcccacactggtgttctgtaagccagcacacaaaagaatactccaggatggccc1740atagcggcaaatatacagtatcagggatgcaaaaagtgcaaaagtaaggggctcaatcgg1800ggatcgaacccgagacctcgcacatgacttatttcaagtcaggggt1846&lt;210&gt;2&lt;211&gt;326&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;400&gt;2MetLysSerPheThrIleAlaAlaLeuAlaAlaLeuTrpAlaGlnGlu151015AlaAlaAlaHisAlaThrPheGlnAspLeuTrpIleAspGlyValAsp202530TyrGlySerGlnCysValArgLeuProAlaSerAsnSerProValThr354045AsnValAlaSerAspAspIleArgCysAsnValGlyThrSerArgPro505560ThrValLysCysProValLysAlaGlySerThrValThrIleGluMet65707580HisGlnGlnProGlyAspArgSerCysAlaAsnGluAlaIleGlyGly859095AspHisTyrGlyProValMetValTyrMetSerLysValAspAspAla100105110ValThrAlaAspGlySerSerGlyTrpPheLysValPheGlnAspSer115120125TrpAlaLysAsnProSerGlySerThrGlyAspAspAspTyrTrpGly130135140ThrLysAspLeuAsnSerCysCysGlyLysMetAsnValLysIlePro145150155160GluAspIleGluProGlyAspTyrLeuLeuArgAlaGluValIleAla165170175LeuHisValAlaAlaSerSerGlyGlyAlaGlnPheTyrMetSerCys180185190TyrGlnLeuThrValThrGlySerGlySerAlaThrProSerThrVal195200205AsnPheProGlyAlaTyrSerAlaSerAspProGlyIleLeuIleAsn210215220IleHisAlaProMetSerThrTyrValValProGlyProThrValTyr225230235240AlaGlyGlySerThrLysSerAlaGlySerSerCysSerGlyCysGlu245250255AlaThrCysThrValGlySerGlyProSerAlaThrLeuThrGlnPro260265270ThrSerThrAlaThrAlaThrSerAlaProGlyGlyGlyGlySerGly275280285CysThrAlaAlaLysTyrGlnGlnCysGlyGlyThrGlyTyrThrGly290295300CysThrThrCysAlaSerGlySerThrCysSerAlaValSerProPro305310315320TyrTyrSerGlnCysLeu325&lt;210&gt;3&lt;211&gt;880&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;3accccgggatcactgcccctaggaaccagcacacctcggtccaatcatgcggttcgacgc60cctctccgccctcgctcttgcgccgcttgtggctggccacggcgccgtgaccagctacat120catcggcggcaaaacctatcccggctacgagggcttctcgcctgcctcgagcccgccgac180gatccagtaccagtggcccgactacaacccgaccctgagcgtgaccgacccgaagatgcg240ctgcaacggcggcacctcggcagagctcagcgcgcccgtccaggccggcgagaacgtgac300ggccgtctggaagcagtggacccaccagcaaggccccgtcatggtctggatgttcaagtg360ccccggcgacttctcgtcgtgccacggcgacggcaagggctggttcaagatcgaccagct420gggcctgtggggcaacaacctcaactcgaacaactggggcaccgcgatcgtctacaagac480cctccagtggagcaacccgatccccaagaacctcgcgccgggcaactacctcatccgcca540cgagctgctcgccctgcaccaggccaacacgccgcagttctacgccgagtgcgcccagct600ggtcgtctccggcagcggctccgccctgcccccgtccgactacctctacagcatccccgt660ctacgcgccccagaacgaccccggcatcaccgtgagtgggcttccgttccgcggcgagct720ctgtggaaatcttgctgacgatgggctaggttgacatctacaacggcgggcttacctcct780acaccccgcccggcggccccgtctggtctggcttcgagttttaggcgcattgagtcgggg840gctacgaggggaaggcatctgttcgcatgagcgtgggtac880&lt;210&gt;4&lt;211&gt;478&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;400&gt;4MetArgPheAspAlaLeuSerAlaLeuAlaLeuAlaProLeuValAla151015GlyHisGlyAlaValThrSerTyrIleIleGlyGlyLysThrTyrPro202530GlyTyrGluGlyPheSerProAlaSerSerProProThrIleGlnTyr354045GlnTrpProAspTyrAsnProThrLeuSerValThrAspProLysMet505560ArgCysAsnGlyGlyThrSerAlaGluLeuSerAlaProValGlnAla65707580GlyGluAsnValThrAlaValTrpLysGlnTrpThrHisGlnGlnGly859095ProValMetValTrpMetPheLysCysProGlyAspPheSerSerSer100105110HisGlyAspGlyLysGlyTrpPheLysIleAspGlnLeuGlyLeuTrp115120125GlyAsnAsnLeuAsnSerAsnAsnTrpGlyThrAlaIleValTyrLys130135140ThrLeuGlnTrpSerAsnProIleProLysAsnLeuAlaProGlyAsn145150155160TyrLeuIleArgHisGluLeuLeuAlaLeuHisGlnAlaAsnThrPro165170175GlnPheTyrAlaGluCysAlaGlnLeuValValSerGlySerGlySer180185190AlaLeuProProSerAspTyrLeuTyrSerIleProValTyrAlaPro195200205GlnAsnAspProGlyIleThrValAspIleTyrAsnGlyGlyLeuThr210215220SerTyrThrProProGlyGlyProValTrpSerGlyPheGluPheMet225230235240ArgPheAspAlaLeuSerAlaLeuAlaLeuAlaProLeuValAlaGly245250255HisGlyAlaValThrSerTyrIleIleGlyGlyLysThrTyrProGly260265270TyrGluGlyPheSerProAlaSerSerProProThrIleGlnTyrGln275280285TrpProAspTyrAsnProThrLeuSerValThrAspProLysMetArg290295300CysAsnGlyGlyThrSerAlaGluLeuSerAlaProValGlnAlaGly305310315320GluAsnValThrAlaValTrpLysGlnTrpThrHisGlnGlnGlyPro325330335ValMetValTrpMetPheLysCysProGlyAspPheSerSerSerHis340345350GlyAspGlyLysGlyTrpPheLysIleAspGlnLeuGlyLeuTrpGly355360365AsnAsnLeuAsnSerAsnAsnTrpGlyThrAlaIleValTyrLysThr370375380LeuGlnTrpSerAsnProIleProLysAsnLeuAlaProGlyAsnTyr385390395400LeuIleArgHisGluLeuLeuAlaLeuHisGlnAlaAsnThrProGln405410415PheTyrAlaGluCysAlaGlnLeuValValSerGlySerGlySerAla420425430LeuProProSerAspTyrLeuTyrSerIleProValTyrAlaProGln435440445AsnAspProGlyIleThrValAspIleTyrAsnGlyGlyLeuThrSer450455460TyrThrProProGlyGlyProValTrpSerGlyPheGluPhe465470475&lt;210&gt;5&lt;211&gt;1000&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;5ctcctgttcctgggccaccgcttgttgcctgcactattggtagagttggtctattgctag60agttggccatgcttctcacatcagtcctcggctcggctgccctgcttgctagcggcgctg120cggcacacggcgccgtgaccagctacatcatcgccggcaagaattacccggggtgggtag180ctgattattgagggcgcattcaaggttcataccggtgtgcatggctgacaaccggctggc240agataccaaggcttttctcctgcgaactcgccgaacgtcatccaatggcaatggcatgac300tacaaccccgtcttgtcgtgcagcgactcgaagcttcgctgcaacggcggcacgtcggcc360accctgaacgccacggccgcaccgggcgacaccatcaccgccatctgggcgcagtggacg420cacagccagggccccatcctggtgtggatgtacaagtgcccgggctccttcagctcctgt480gacggctccggcgctggctggttcaagatcgacgaggccggcttccacggcgacggcgtc540aaggtcttcctcgacaccgagaacccgtccggctgggacatcgccaagctcgtcggcggc600aacaagcagtggagcagcaaggtccccgagggcctcgcccccggcaactacctcgtccgc660cacgagttgatcgccctgcaccaggccaacaacccgcagttctacccggagtgcgcccag720gtcgtcatcaccggctccggcaccgcgcagccggatgcctcatacaaggcggctatcccc780ggctactgcaaccagaatgacccgaacatcaaggtgagatccaggcgtaatgcagtctac840tgctggaaagaaagtggtccaagctaaaccgcgctccaggtgcccatcaacgaccactcc900atccctcagacctacaagattcccggccctcccgtcttcaagggcaccgccagcaagaag960gcccgggacttcaccgcctgaagttgttgaatcgatggag1000&lt;210&gt;6&lt;211&gt;516&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;400&gt;6MetLeuLeuThrSerValLeuGlySerAlaAlaLeuLeuAlaSerGly151015AlaAlaAlaHisGlyAlaValThrSerTyrIleIleAlaGlyLysAsn202530TyrProGlyTyrGinGlyPheSerProAlaAsnSerProAsnValIle354045GlnTrpGlnTrpHisAspTyrAsnProValLeuSerCysSerAspSer505560LysLeuArgCysAsnGlyGlyThrSerAlaThrLeuAsnAlaThrAla65707580AlaProGlyAspThrIleThrAlaIleTrpAlaGlnTrpThrHisSer859095GlnGlyProIleLeuValTrpMetTyrLysCysProGlySerPheSer100105110SerCysAspGlySerGlyAlaGlyTrpPheLysIleAspGluAlaGly115120125PheHisGlyAspGlyValLysValPheLeuAspThrGluAsnProSer130135140GlyTrpAspIleAlaLysLeuValGlyGlyAsnLysGlnTrpSerSer145150155160LysValProGluGlyLeuAlaProGlyAsnTyrLeuValArgHisGlu165170175LeuIleAlaLeuHisGlnAlaAsnAsnProGlnPheTyrProGluCys180185190AlaGlnValValIleThrGlySerGlyThrAlaGlnProAspAlaSer195200205TyrLysAlaAlaIleProGlyTyrCysAsnGlnAsnAspProAsnIle210215220LysValProIleAsnAspHisSerIleProGlnThrTyrLysIlePro225230235240GlyProProValPheLysGlyThrAlaSerLysLysAlaArgAspPhe245250255ThrAlaMetLeuLeuThrSerValLeuGlySerAlaAlaLeuLeuAla260265270SerGlyAlaAlaAlaHisGlyAlaValThrSerTyrIleIleAlaGly275280285LysAsnTyrProGlyTyrGlnGlyPheSerProAlaAsnSerProAsn290295300ValIleGlnTrpGlnTrpHisAspTyrAsnProValLeuSerCysSer305310315320AspSerLysLeuArgCysAsnGlyGlyThrSerAlaThrLeuAsnAla325330335ThrAlaAlaProGlyAspThrIleThrAlaIleTrpAlaGlnTrpThr340345350HisSerGlnGlyProIleLeuValTrpMetTyrLysCysProGlySer355360365PheSerSerCysAspGlySerGlyAlaGlyTrpPheLysIleAspGlu370375380AlaGlyPheHisGlyAspGlyValLysValPheLeuAspThrGluAsn385390395400ProSerGlyTrpAspIleAlaLysLeuValGlyGlyAsnLysGlnTrp405410415SerSerLysValProGluGlyLeuAlaProGlyAsnTyrLeuValArg420425430HisGluLeuIleAlaLeuHisGlnAlaAsnAsnProGlnPheTyrPro435440445GluCysAlaGlnValValIleThrGlySerGlyThrAlaGlnProAsp450455460AlaSerTyrLysAlaAlaIleProGlyTyrCysAsnGlnAsnAspPro465470475480AsnIleLysValProIleAsnAspHisSerIleProGlnThrTyrLys485490495IleProGlyProProValPheLysGlyThrAlaSerLysLysAlaArg500505510AspPheThrAla515&lt;210&gt;7&lt;211&gt;681&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;7atgctcgcaaacggtgccatcgtcttcctggccgccgccctcggcgtcagtggccactac60acctggccacgggttaacgacggcgccgactggcaacaggtccgtaaggcggacaactgg120caggacaacggctacgtcggggatgtcacgtcgccacagatccgctgtttccaggcgacc180ccgtccccggccccatccgtcctcaacaccacggccggctcgaccgtgacctactgggcc240aaccccgacgtctaccaccccgggcctgtgcagttttacatggcccgcgtgcccgatggc300gaggacatcaactcgtggaacggcgacggcgccgtgtggttcaaggtgtacgaggaccat360cctacctttggcgctcagctcacatggcccagcacgggcaagagctcgttcgcggttccc420atccccccgtgcatcaagtccggctactacctcctccgggcggagcaaatcggcctgcac480gtcgcccagagcgtaggcggagcgcagttctacatctcatgcgcccagctcagcgtcacc540ggcggcggcagcaccgagccgccgaacaaggtggccttccccggcgcttacagtgcgacg600gacccgggcattctgatcaacatctactaccctgttcccacgtcctaccagaaccccggc660ccggccgtcttcagctgctga681&lt;210&gt;8&lt;211&gt;452&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;400&gt;8MetLeuAlaAsnGlyAlaIleValPheLeuAlaAlaAlaLeuGlyVal151015SerGlyHisTyrThrTrpProArgValAsnAspGlyAlaAspTrpGln202530GlnValArgLysAlaAspAsnTrpGlnAspAsnGlyTyrValGlyAsp354045ValThrSerProGlnIleArgCysPheGlnAlaThrProSerProAla505560ProSerValLeuAsnThrThrAlaGlySerThrValThrTyrTrpAla65707580AsnProAspValTyrHisProGlyProValGlnPheTyrMetAlaArg859095ValProAspGlyGluAspIleAsnSerTrpAsnGlyAspGlyAlaVal100105110TrpPheLysValTyrGluAspHisProThrPheGlyAlaGlnLeuThr115120125TrpProSerThrGlyLysSerSerPheAlaValProIleProProCys130135140IleLysSerGlyTyrTyrLeuLeuArgAlaGluGlnIleGlyLeuHis145150155160ValAlaGlnSerValGlyGlyAlaGlnPheTyrIleSerCysAlaGln165170175LeuSerValThrGlyGlyGlySerThrGluProProAsnLysValAla180185190PheProGlyAlaTyrSerAlaThrAspProGlyIleLeuIleAsnIle195200205TyrTyrProValProThrSerTyrGlnAsnProGlyProAlaValPhe210215220SerCysMetLeuAlaAsnGlyAlaIleValPheLeuAlaAlaAlaLeu225230235240GlyValSerGlyHisTyrThrTrpProArgValAsnAspGlyAlaAsp245250255TrpGlnGlnValArgLysAlaAspAsnTrpGlnAspAsnGlyTyrVal260265270GlyAspValThrSerProGlnIleArgCysPheGlnAlaThrProSer275280285ProAlaProSerValLeuAsnThrThrAlaGlySerThrValThrTyr290295300TrpAlaAshProAspValTyrHisProGlyProValGlnPheTyrMet305310315320AlaArgValProAspGlyGluAspIleAsnSerTrpAsnGlyAspGly325330335AlaValTrpPheLysValTyrGluAspHisProThrPheGlyAlaGln340345350LeuThrTrpProSerThrGlyLysSerSerPheAlaValProIlePro355360365ProCysIleLysSerGlyTyrTyrLeuLeuArgAlaGluGlnIleGly370375380LeuHisValAlaGlnSerValGlyGlyAlaGlnPheTyrIleSerCys385390395400AlaGlnLeuSerValThrGlyGlyGlySerThrGluProProAsnLys405410415ValAlaPheProGlyAlaTyrSerAlaThrAspProGlyIleLeuIle420425430AsnIleTyrTyrProValProThrSerTyrGlnAsnProGlyProAla435440445ValPheSerCys450&lt;210&gt;9&lt;211&gt;960&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;9atgaagggacttttcagtgccgccgccctctccctggccgtcggccaggcttcggcccat60tacatcttccagcaactctccatcaacgggaaccagtttccggtgtaccaatatattcgc120aagaacaccaattataacagtcccgttaccgatctcacgtccgacgatcttcggtgcaat180gtcggcgcccagggtgctgggacagacaccgtcacggtgaaggccggcgaccagttcacc240ttcacccttgacacccctgtttaccaccaggggcccatctccatctacatgtccaaggcc300ccgggcgcggcgtcagactacgatggcagcggcggctggttcaagatcaaggactggggc360ccgactttcaacgccgacggcacggccacctgggacatggccggctcatacacctacaac420atcccgacctgcattcccgacggcgactatctgctccgcatccagtcgctggccatccac480aacccctggccggcgggcatcccgcagttctacatctcctgcgcccagatcaccgtgacc540ggcggcggcaacggcaaccctggcccgacggccctcatccccggcgccttcaaggacacc600gacccgggctacacggtgaacatctacacgaacttccacaactacacggttcccggcccg660gaggtcttcagctgcaacggcggcggctcgaacccgcccccgccggtgagtagcagcacg720cccgcgaccacgacgctggtcacgtcgacgcgcaccacgtcctccacgtcctccgcctcg780acgccggcctcgaccggcggctgcaccgtcgccaagtggggccagtgcggcggcaacggg840tacaccggctgcacgacctgcgcggccgggtccacctgcagcaagcagaacgactactac900tcgcagtgcttgtaagggaggccgcaaagcatgaggtgtttgaagaggaggagaggggtc960&lt;210&gt;10&lt;211&gt;608&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;400&gt;10MetLysGlyLeuPheSerAlaAlaAlaLeuSerLeuAlaValGlyGln151015AlaSerAlaHisTyrIlePheGlnGlnLeuSerIleAsnGlyAsnGln202530PheProValTyrGlnTyrIleArgLysAsnThrAsnTyrAsnSerPro354045ValThrAspLeuThrSerAspAspLeuArgCysAsnValGlyAlaGln505560GlyAlaGlyThrAspThrValThrValLysAlaGlyAspGlnPheThr65707580PheThrLeuAspThrProValTyrHisGlnGlyProIleSerIleTyr859095MetSerLysAlaProGlyAlaAlaSerAspTyrAspGlySerGlyGly100105110TrpPheLysIleLysAspTrpGlyProThrPheAsnAlaAspGlyThr115120125AlaThrTrpAspMetAlaGlySerTyrThrTyrAsnIleProThrCys130135140IleProAspGlyAspTyrLeuLeuArgIleGlnSerLeuAlaIleHis145150155160AsnProTrpProAlaGlyIleProGlnPheTyrIleSerCysAlaGln165170175IleThrValThrGlyGlyGlyAsnGlyAsnProGlyProThrAlaLeu180185190IleProGlyAlaPheLysAspThrAspProGlyTyrThrValAsnIle195200205TyrThrAsnPheHisAsnTyrThrValProGlyProGluValPheSer210215220CysAsnGlyGlyGlySerAsnProProProProValSerSerSerThr225230235240ProAlaThrThrThrLeuValThrSerThrArgThrThrSerSerThr245250255SerSerAlaSerThrProAlaSerThrGlyGlyCysThrValAlaLys260265270TrpGlyGlnCysGlyGlyAsnGlyTyrThrGlyCysThrThrCysAla275280285AlaGlySerThrCysSerLysGlnAsnAspTyrTyrSerGlnCysLeu290295300MetLysGlyLeuPheSerAlaAlaAlaLeuSerLeuAlaValGlyGln305310315320AlaSerAlaHisTyrIlePheGlnGlnLeuSerIleAsnGlyAshGln325330335PheProValTyrGlnTyrIleArgLysAsnThrAsnTyrAsnSerPro340345350ValThrAspLeuThrSerAspAspLeuArgCysAsnValGlyAlaGln355360365GlyAlaGlyThrAspThrValThrValLysAlaGlyAspGlnPheThr370375380PheThrLeuAspThrProValTyrHisGlnGlyProIleSerIleTyr385390395400MetSerLysAlaProGlyAlaAlaSerAspTyrAspGlySerGlyGly405410415TrpPheLysIleLysAspTrpGlyProThrPheAsnAlaAspGlyThr420425430AlaThrTrpAspMetAlaGlySerTyrThrTyrAsnIleProThrCys435440445IleProAspGlyAspTyrLeuLeuArgIleGlnSerLeuAlaIleHis450455460AsnProTrpProAlaGlyIleProGlnPheTyrIleSerCysAlaGln465470475480IleThrValThrGlyGlyGlyAsnGlyAsnProGlyProThrAlaLeu485490495IleProGlyAlaPheLysAspThrAspProGlyTyrThrValAsnIle500505510TyrThrAsnPheHisAsnTyrThrValProGlyProGluValPheSer515520525CysAsnGlyGlyGlySerAsnProProProProValSerSerSerThr530535540ProAlaThrThrThrLeuValThrSerThrArgThrThrSerSerThr545550555560SerSerAlaSerThrProAlaSerThrGlyGlyCysThrValAlaLys565570575TrpGlyGlnCysGlyGlyAsnGlyTyrThrGlyCysThrThrCysAla580585590AlaGlySerThrCysSerLysGlnAsnAspTyrTyrSerGlnCysLeu595600605&lt;210&gt;11&lt;211&gt;17&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(1)..(1)&lt;223&gt;Xaa=Ile或Leu&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(16)..(16)&lt;223&gt;Xaa=Ile或Leu&lt;400&gt;11XaaProAlaSerAsnSerProValThrAsnValAlaSerAspAspXaa151015Arg&lt;210&gt;12&lt;211&gt;13&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(1)..(1)&lt;223&gt;Xaa=Ile或Leu&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(5)..(5)&lt;223&gt;Xaa=Ile或Leu&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(11)..(12)&lt;223&gt;Xaa=Ile或Leu&lt;400&gt;12XaaProGluAspXaaGluProGlyAspTyrXaaXaaArg1510&lt;210&gt;13&lt;211&gt;17&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;400&gt;13CysProGlySerPheSerSerCysAspGlySerGlyAlaGlyTrpPhe151015Lys&lt;210&gt;14&lt;211&gt;12&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(1)..(1)&lt;223&gt;Xaa=Ile或Leu&lt;400&gt;14XaaAspGluAlaGlyPheHisGlyAspGlyValLys1510&lt;210&gt;15&lt;211&gt;10&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(1)..(2)&lt;223&gt;Xaa=任何氨基酸&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(8)..(9)&lt;223&gt;Xaa=Ile或Leu&lt;400&gt;15XaaXaaAlaProGlyAsnTyrXaaXaaArg1510&lt;210&gt;16&lt;211&gt;22&lt;212&gt;DNA&lt;213&gt;构巢曲霉(Aspergillusnidulans)&lt;400&gt;16gtgccccatgatacgcctccgg22&lt;210&gt;17&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;构巢曲霉(Aspergillusnidulans)&lt;400&gt;17gagtcgtatttccaaggctcctgacc26&lt;210&gt;18&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;构巢曲霉(Aspergillusnidulans)&lt;400&gt;18ggaggccatgaagtggaccaacgg24&lt;210&gt;19&lt;211&gt;45&lt;212&gt;DNA&lt;213&gt;黑曲霉(Aspergillusniger)&lt;400&gt;19caccgtgaaagccatgctctttccttcgtgtagaagaccagacag45&lt;210&gt;20&lt;211&gt;45&lt;212&gt;DNA&lt;213&gt;黑曲霉(Aspergillusniger)&lt;400&gt;20ctggtcttctacacgaaggaaagagcatggctttcacggtgtctg45&lt;210&gt;21&lt;211&gt;44&lt;212&gt;DNA&lt;213&gt;黑曲霉(Aspergillusniger)&lt;400&gt;21ctatatacacaactggatttaccatgggcccgcggccgcagatc44&lt;210&gt;22&lt;211&gt;44&lt;212&gt;DNA&lt;213&gt;黑曲霉(Aspergillusniger)&lt;400&gt;22gatctgcggccgcgggcccatggtaaatccagttgtgtatatag44&lt;210&gt;23&lt;211&gt;17&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(1)..(1)&lt;223&gt;Xaa=Ile或Leu&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(16)..(16)&lt;223&gt;Xaa=Ile或Leu&lt;400&gt;23XaaProAlaSerAsnSerProValThrAsnValAlaSerAspAspXaa151015Arg&lt;210&gt;24&lt;211&gt;13&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(1)..(1)&lt;223&gt;Xaa=Ile或Leu&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(5)..(5)&lt;223&gt;Xaa=Ile或Leu&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;(11)..(12)&lt;223&gt;Xaa=Ile或Leu&lt;400&gt;24XaaProGluAspXaaGluProGlyAspTyrXaaXaaArg1510&lt;210&gt;25&lt;211&gt;28&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(20)..(20)&lt;223&gt;N=A,C,G,或T&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(26)..(26)&lt;223&gt;N=A,C,G,或T&lt;400&gt;25cctccaactcccccgtcacnaaygtngc28&lt;210&gt;26&lt;211&gt;27&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(19)..(19)&lt;223&gt;N=A,C,G,或T&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(22)..(22)&lt;223&gt;N=A,C,G,或T&lt;400&gt;26ggcgcggaggaggtartcnccnggytc27&lt;210&gt;27&lt;211&gt;16&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;400&gt;27SerGlyAlaGlyTrpPheLysIleAspGluAlaGlyPheHisGlyAsp151015&lt;210&gt;28&lt;211&gt;8&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;220&gt;&lt;221&gt;MISC_FEATURE&lt;222&gt;6)..(7)&lt;223&gt;Xaa=Ile或Leu&lt;400&gt;28AlaProGlyAsnTyrXaaXaaArg15&lt;210&gt;29&lt;211&gt;11&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;400&gt;29AlaProGlyAsnTyrLeuIleArgHisGluLeu1510&lt;210&gt;30&lt;211&gt;11&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;400&gt;30AlaProGlyAsnTyrLeuValArgHisGluLeu1510&lt;210&gt;31&lt;211&gt;9&lt;212&gt;PRT&lt;213&gt;Thielaviaterrestris&lt;400&gt;31GlyAlaGlyTrpPheLysIleAspGlu15&lt;210&gt;32&lt;211&gt;27&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(19)..(19)&lt;223&gt;R=A或G&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(22)..(22)&lt;223&gt;H=A,C,或T&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(25)..(25)&lt;223&gt;Y=C或T&lt;400&gt;32cggcgcgggctggtttaarathgayga27&lt;210&gt;33&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(21)..(21)&lt;223&gt;R=A或G&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(24)..(24)&lt;223&gt;N=A,C,G,或T&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(27)..(27)&lt;223&gt;N=A,C,G,或rT&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(30)..(30)&lt;223&gt;N=A,C,G,或T&lt;400&gt;33agttcatggcgaatcagatarttnccnggngc32&lt;210&gt;34&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;34cttggtaccgagctcggatccacta25&lt;210&gt;35&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;35atagggcgaattgggccctctagat25&lt;210&gt;36&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;36acaactggatttaccatgcggttcgacgcctc32&lt;210&gt;37&lt;211&gt;33&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;37gtcagtcacctctagttactaaaactcgaagcc33&lt;210&gt;38&lt;211&gt;21&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;38catgccatggatgcttctcac21&lt;210&gt;39&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;39ccttaattaatcaggcggtgaagtc25&lt;210&gt;40&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;40tcgtcggggacaactttgtacaaaaaagttgg32&lt;210&gt;41&lt;211&gt;27&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;41cccctgttgaaacatgttttttcaacc27&lt;210&gt;42&lt;211&gt;16&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;42gtaaaacgacggccag16&lt;210&gt;43&lt;211&gt;25&lt;212&gt;DNA&lt;213&gt;大肠杆菌(Escherichiacoli)&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(24)..(27)&lt;223&gt;V=A,C,或G&lt;220&gt;&lt;221&gt;misc_feature&lt;222&gt;(25)..(25)&lt;223&gt;N=A,C,G,或T&lt;400&gt;43tttttttttttttttttttttttvn25&lt;210&gt;44&lt;211&gt;27&lt;212&gt;DNA&lt;213&gt;大肠杆菌(Escherichiacoli)&lt;400&gt;44ggggacaactttgtacaaaaaagttgg27&lt;210&gt;45&lt;211&gt;27&lt;212&gt;DNA&lt;213&gt;大肠杆菌(Escherichiacoli)&lt;400&gt;45aaaggtaggatggtcctcgtacacctt27&lt;210&gt;46&lt;211&gt;36&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;46actggattaccatgctcgcaaacggtgccatcgtct36&lt;210&gt;47&lt;211&gt;38&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;47tcacctctagttaattaatcagcagctgaagacggccg38&lt;210&gt;48&lt;211&gt;31&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;48actggatttaccatgaagtcgttcaccattg31&lt;210&gt;49&lt;211&gt;31&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;49agtcacctctagttagaggcactgcgagtag31&lt;210&gt;50&lt;211&gt;32&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;50acaactggatttaccatgcggttcgacgcctc32&lt;210&gt;51&lt;211&gt;33&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;51gtcagtcacctctagttactaaaactcgaagcc33&lt;210&gt;52&lt;211&gt;27&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;52actggattaccatgcttctcacatcag27&lt;210&gt;53&lt;211&gt;30&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;53agtcacctctagttatcaggcggtgaagtc30&lt;210&gt;54&lt;211&gt;31&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;54actggattaccatgaagggacttttcagtgc31&lt;210&gt;55&lt;211&gt;31&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;55agtcacctctagttagaggcactgcgagtag31&lt;210&gt;56&lt;211&gt;29&lt;212&gt;DNA&lt;213&gt;里氏木霉(Trichodermareesei)&lt;400&gt;56aacgttaattaaggaatcgttttgtgttt29&lt;210&gt;57&lt;211&gt;29&lt;212&gt;DNA&lt;213&gt;里氏木霉(Trichodermareesei)&lt;400&gt;57agtactagtagctccgtggcgaaagcctg29&lt;210&gt;58&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;里氏木霉(Trichodermareesei)&lt;400&gt;58actagtcgaccgaatgtaggattgtt26&lt;210&gt;59&lt;211&gt;19&lt;212&gt;DNA&lt;213&gt;里氏木霉(Trichodermareesei)&lt;400&gt;59tgaccatggtgcgcagtcc19&lt;210&gt;60&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;里氏木霉(Trichodermareesei)&lt;400&gt;60cgatcgtctccctatgggtcattacc26&lt;210&gt;61&lt;211&gt;28&lt;212&gt;DNA&lt;213&gt;里氏木霉(Trichodermareesei)&lt;400&gt;61actagttaattaagctccgtggcgaaag28&lt;210&gt;62&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;大肠杆菌(Escherichiacoli)&lt;400&gt;62gggttcgaattcatttaaacggct24&lt;210&gt;63&lt;211&gt;24&lt;212&gt;DNA&lt;213&gt;大肠杆菌(Escherichiacoli)&lt;400&gt;63gggagcgctcaatattcatctctc24&lt;210&gt;64&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;大肠杆菌(Escherichiacoli)&lt;400&gt;64ggtcgcggaggcgatggatgcgatcg26&lt;210&gt;65&lt;211&gt;26&lt;212&gt;DNA&lt;213&gt;大肠杆菌(Escherichiacoli)&lt;400&gt;65cgatcgcatccatcgcctccgcgacc26&lt;210&gt;66&lt;211&gt;34&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;66cgcggactgcgcaccatgaagtcgttcaccattg34&lt;210&gt;67&lt;211&gt;31&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;67tcgccacggagcttagaggcactgcgagtag31&lt;210&gt;68&lt;211&gt;23&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;68gcccatggaccatgctcgcaaac23&lt;210&gt;69&lt;211&gt;23&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;69cctctagttaattaatcagcagc23&lt;210&gt;70&lt;211&gt;23&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;70gcccatggaccatgaagggactt23&lt;210&gt;71&lt;211&gt;23&lt;212&gt;DNA&lt;213&gt;Thielaviaterrestris&lt;400&gt;71cctctagttaattaattacaagc23&lt;210&gt;72&lt;211&gt;19&lt;212&gt;DNA&lt;213&gt;里氏木霉(Trichodermareesei)&lt;400&gt;72ggatgaagctcattagccg19&lt;210&gt;73&lt;211&gt;31&lt;212&gt;DNA&lt;213&gt;烟曲霉(Aspergillusfumigatus)&lt;400&gt;73actggatttaccatgagattcggttggctcg31&lt;210&gt;74&lt;211&gt;31&lt;212&gt;DNA&lt;213&gt;烟曲霉(Aspergillusfumigatus)&lt;400&gt;74agtcacctctagttactagtagacacggggc31&lt;210&gt;75&lt;211&gt;3060&lt;212&gt;DNA&lt;213&gt;烟曲霉(Aspergillusfumigatus)&lt;400&gt;75atgagattcggttggctcgaggtggccgctctgacggccgcttctgtagccaatgcccag60gtttgtgatgctttcccgtcattgtttcggatatagttgacaatagtcatggaaataatc120aggaattggctttctctccaccattctacccttcgccttgggctgatggccagggagagt180gggcagatgcccatcgacgcgccgtcgagatcgtttctcagatgacactggcggagaagg240ttaaccttacaacgggtactgggtgggttgcgacttttttgttgacagtgagctttcttc300actgaccatctacacagatgggaaatggaccgatgcgtcggtcaaaccggcagcgttccc360aggtaagcttgcaattctgcaacaacgtgcaagtgtagttgctaaaacgcggtggtgcag420acttggtatcaactggggtctttgtggccaggattcccctttgggtatccgtttctgtga480gctatacccgcggagtctttcagtccttgtattatgtgctgatgattgtctctgtatagc540tgacctcaactccgccttccctgctggtactaatgtcgccgcgacatgggacaagacact600cgcctaccttcgtggcaaggccatgggtgaggaattcaacgacaagggcgtggacatttt660gctggggcctgctgctggtcctctcggcaaatacccggacggcggcagaatctgggaagg720cttctctcctgatccggttctcactggtgtacttttcgccgaaactatcaagggtatcca780agacgcgggtgtgattgctactgccaagcattacattctgaatgaacaggagcatttccg840acaggttggcgaggcccagggatatggttacaacatcacggagacgatcagctccaacgt900ggatgacaagaccatgcacgagttgtacctttggtgagtagttgacactgcaaatgagga960ccttgattgatttgactgacctggaatgcaggccctttgcagatgctgtgcgcggtaaga1020ttttccgtagacttgacctcgcgacgaagaaatcgctgacgaaccatcgtagctggcgtt1080ggcgctgtcatgtgttcctacaatcaaatcaacaacagctacggttgtcaaaacagtcaa1140actctcaacaagctcctcaaggctgagctgggcttccaaggcttcgtcatgagtgactgg1200agcgctcaccacagcggtgtcggcgctgccctcgctgggttggatatgtcgatgcctgga1260gacatttccttcgacgacggactctccttctggggcacgaacctaactgtcagtgttctt1320aacggcaccgttccagcctggcgtgtcgatgacatggctgttcgtatcatgaccgcgtac1380tacaaggttggtcgtgaccgtcttcgtattccccctaacttcagctcctggacccgggat1440gagtacggctgggagcattctgctgtctccgagggagcctggaccaaggtgaacgacttc1500gtcaatgtgcagcgcagtcactctcagatcatccgtgagattggtgccgctagtacagtg1560ctcttgaagaacacgggtgctcttcctttgaccggcaaggaggttaaagtgggtgttctc1620ggtgaagacgctggttccaacccgtggggtgctaacggctgccccgaccgcggctgtgat1680aacggcactcttgctatggcctggggtagtggtactgccaacttcccttaccttgtcacc1740cccgagcaggctatccagcgagaggtcatcagcaacggcggcaatgtctttgctgtgact1800gataacggggctctcagccagatggcagatgttgcatctcaatccaggtgagtgcgggct1860cttagaaaaagaacgttctctgaatgaagttttttaaccattgcgaacagcgtgtctttg1920gtgtttgtcaacgccgactctggagagggtttcatcagtgtcgacggcaacgagggtgac1980cgcaaaaatctcactctgtggaagaacggcgaggccgtcattgacactgttgtcagccac2040tgcaacaacacgattgtggttattcacagtgttgggcccgtcttgatcgaccggtggtat2100gataaccccaacgtcactgccatcatctgggccggcttgcccggtcaggagagtggcaac2160tccctggtcgacgtgctctatggccgcgtcaaccccagcgccaagaccccgttcacctgg2220ggcaagactcgggagtcttacggggctcccttgctcaccgagcctaacaatggcaatggt2280gctccccaggatgatttcaacgagggcgtcttcattgactaccgtcactttgacaagcgc2340aatgagacccccatttatgagtttggccatggcttgagctacaccacctttggttactct2400caccttcgggttcaggccctcaatagttcgagttcggcatatgtcccgactagcggagag2460accaagcctgcgccaacctatggtgagatcggtagtgccgccgactacctgtatcccgag2520ggtctcaaaagaattaccaagtttatttacccttggctcaactcgaccgacctcgaggat2580tcttctgacgacccgaactacggctgggaggactcggagtacattcccgaaggcgctagg2640gatgggtctcctcaacccctcctgaaggctggcggcgctcctggtggtaaccctaccctt2700tatcaggatcttgttagggtgtcggccaccataaccaacactggtaacgtcgccggttat2760gaagtccctcaattggtgagtgacccgcatgttccttgcgttgcaatttggctaactcgc2820ttctagtatgtttcactgggcggaccgaacgagcctcgggtcgttctgcgcaagttcgac2880cgaatcttcctggctcctggggagcaaaaggtttggaccacgactcttaaccgtcgtgat2940ctcgccaattgggatgtggaggctcaggactgggtcatcacaaagtaccccaagaaagtg3000cacgtcggcagctcctcgcgtaagctgcctctgagagcgcctctgccccgtgtctactag3060&lt;210&gt;76&lt;211&gt;863&lt;212&gt;PRT&lt;213&gt;烟曲霉(Aspergillusfumigatus)&lt;400&gt;76MetArgPheGlyTrpLeuGluValAlaAlaLeuThrAlaAlaSerVal151015AlaAsnAlaGlnGluLeuAlaPheSerProProPheTyrProSerPro202530TrpAlaAspGlyGlnGlyGluTrpAlaAspAlaHisArgArgAlaVal354045GluIleValSerGlnMetThrLeuAlaGluLysValAsnLeuThrThr505560GlyThrGlyTrpGluMetAspArgCysValGlyGlnThrGlySerVal65707580ProArgLeuGlyIleAsnTrpGlyLeuCysGlyGlnAspSerProLeu859095GlyIleArgPheSerAspLeuAsnSerAlaPheProAlaGlyThrAsn100105110ValAlaAlaThrTrpAspLysThrLeuAlaTyrLeuArgGlyLysAla115120125MetGlyGluGluPheAsnAspLysGlyValAspIleLeuLeuGlyPro130135140AlaAlaGlyProLeuGlyLysTyrProAspGlyGlyArgIleTrpGlu145150155160GlyPheSerProAspProValLeuThrGlyValLeuPheAlaGluThr165170175IleLysGlyIleGlnAspAlaGlyValIleAlaThrAlaLysHisTyr180185190IleLeuAsnGluGlnGluHisPheArgGlnValGlyGluAlaGlnGly195200205TyrGlyTyrAsnIleThrGluThrIleSerSerAsnValAspAspLys210215220ThrMetHisGluLeuTyrLeuTrpProPheAlaAspAlaValArgAla225230235240GlyValGlyAlaValMetCysSerTyrAsnGlnIleAsnAsnSerTyr245250255GlyCysGlnAsnSerGlnThrLeuAsnLysLeuLeuLysAlaGluLeu260265270GlyPheGlnGlyPheValMetSerAspTrpSerAlaHisHisSerGly275280285ValGlyAlaAlaLeuAlaGlyLeuAspMetSerMetProGlyAspIle290295300SerPheAspAspGlyLeuSerPheTrpGlyThrAsnLeuThrValSer305310315320ValLeuAsnGlyThrValProAlaTrpArgValAspAspMetAlaVal325330335ArgIleMetThrAlaTyrTyrLysValGlyArgAspArgLeuArgIle340345350ProProAsnPheSerSerTrpThrArgAspGluTyrGlyTrpGluHis355360365SerAlaValSerGluGlyAlaTrpThrLysValAsnAspPheValAsn370375380ValGlnArgSerHisSerGlnIleIleArgGluIleGlyAlaAlaSer385390395400ThrValLeuLeuLysAsnThrGlyAlaLeuProLeuThrGlyLysGlu405410415ValLysValGlyValLeuGlyGluAspAlaGlySerAsnProTrpGly420425430AlaAsnGlyCysProAspArgGlyCysAspAsnGlyThrLeuAlaMet435440445AlaTrpGlySerGlyThrAlaAsnPheProTyrLeuValThrProGlu450455460GlnAlaIleGlnArgGluValIleSerAsnGlyGlyAsnValPheAla465470475480ValThrAspAsnGlyAlaLeuSerGlnMetAlaAspValAlaSerGln485490495SerSerValSerLeuValPheValAsnAlaAspSerGlyGluGlyPhe500505510IleSerValAspGlyAsnGluGlyAspArgLysAsnLeuThrLeuTrp515520525LysAsnGlyGluAlaValIleAspThrValValSerHisCysAsnAsn530535540ThrIleValValIleHisSerValGlyProValLeuIleAspArgTrp545550555560TyrAspAsnProAsnValThrAlaIleIleTrpAlaGlyLeuProGly565570575GlnGluSerGlyAsnSerLeuValAspValLeuTyrGlyArgValAsn580585590ProSerAlaLysThrProPheThrTrpGlyLysThrArgGluSerTyr595600605GlyAlaProLeuLeuThrGluProAsnAsnGlyAsnGlyAlaProGln610615620AspAspPheAsnGluGlyValPheIleAspTyrArgHisPheAspLys625630635640ArgAsnGluThrProIleTyrGluPheGlyHisGlyLeuSerTyrThr645650655ThrPheGlyTyrSerHisLeuArgValGlnAlaLeuAsnSerSerSer660665670SerAlaTyrValProThrSerGlyGluThrLysProAlaProThrTyr675680685GlyGluIleGlySerAlaAlaAspTyrLeuTyrProGluGlyLeuLys690695700ArgIleThrLysPheIleTyrProTrpLeuAsnSerThrAspLeuGlu705710715720AspSerSerAspAspProAsnTyrGlyTrpGluAspSerGluTyrIle725730735ProGluGlyAlaArgAspGlySerProGlnProLeuLeuLysAlaGly740745750GlyAlaProGlyGlyAsnProThrLeuTyrGlnAspLeuValArgVal755760765SerAlaThrIleThrAsnThrGlyAsnValAlaGlyTyrGluValPro770775780GlnLeuTyrValSerLeuGlyGlyProAsnGluProArgValValLeu785790795800ArgLysPheAspArgIlePheLeuAlaProGlyGluGlnLysValTrp805810815ThrThrThrLeuAsnArgArgAspLeuAlaAsnTrpAspValGluAla820825830GlnAspTrpValIleThrLysTyrProLysLysValHisValGlySer835840845SerSerArgLysLeuProLeuArgAlaProLeuProArgValTyr850855860&lt;210&gt;77&lt;211&gt;30&lt;212&gt;DNA&lt;213&gt;烟曲霉(Aspergillusfumigatus)&lt;400&gt;77ggactgcgcaccatgagattcggttggctc30&lt;210&gt;78&lt;211&gt;30&lt;212&gt;DNA&lt;213&gt;烟曲霉(Aspergillusfumigatus)&lt;400&gt;78tcgccacggagcttactagtagacacgggg30权利要求1.具有增强的纤维素分解活性的分离多肽,包括[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV],其中X是任何氨基酸,X(4,5)是在4或5个连续位置的任何氨基酸,以及X(4)是在4个连续位置的任何氨基酸。2.权利要求1的分离多肽,进一步包括H-X(1,2)-G-P-X(3)-[YW]-[AILMV],[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],其中X是任何氨基酸,X(1,2)是在1个位置或2个连续位置的任何氨基酸,X(3)是在3个连续位置的任何氨基酸,以及X(2)是在2个连续位置的任何氨基酸。3.包括编码权利要求1或2所述多肽的核苷酸序列的分离多核苷酸。4.核酸构建体,其包括与指导所述多肽在表达宿主中产生的一个或多个调控序列可操作连接的权利要求4所述的多核苷酸。5.包括权利要求4的核酸构建体的重组表达载体。6.包括权利要求4的核酸构建体的重组宿主细胞。7.用于生产权利要求1或2所述的多肽的方法,包括(a)在有助于生产该多肽的条件下培养细胞;以及(b)回收该多肽。8.具有增强的纤维素分解活性的分离多肽,选自(a)具有与SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸有至少75%同一性的氨基酸序列的多肽;(b)由至少在中等严谨条件下与下列杂交的多核苷酸编码的多肽(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链;以及(c)包括SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸中一个或多个氨基酸保守取代、缺失、和/或插入的变体。9.权利要求8的多肽,具有与SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸有至少75%同一性的氨基酸序列。10.权利要求9的多肽,具有与SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸有至少80%同一性的氨基酸序列。11.权利要求10的多肽,具有与SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸有至少85%同一性的氨基酸序列。12.权利要求11的多肽,具有与SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO11的第20至304位氨基酸有至少90%同一性的氨基酸序列。13.权利要求12的多肽,具有与SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO12的第20至304位氨基酸有至少95%同一性的氨基酸序列。14.权利要求13的多肽,具有与SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO13的第20至304位氨基酸有至少97%同一性的氨基酸序列。15.权利要求8-14中任一项的多肽,包括SEQIDNO2、SEQIDNO4、SEQIDNO6、SEQIDNO8、或SEQIDNO10的氨基酸序列。16.权利要求8-15中任一项的多肽,其由SEQIDNO2、SEQIDNO4、SEQIDNO6、SEQIDNO8、或SEQIDNO10;或其具有增强的纤维素分解活性的片段组成。17.权利要求16的多肽,由SEQIDNO2、SEQIDNO4、SEQIDNO6、SEQIDNO8、或SEQIDNO10组成。18.权利要求16的多肽,由SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸组成。19.权利要求8的多肽,其由至少在中等严谨条件下与下列杂交的多核苷酸编码(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链。20.权利要求19的多肽,其由至少在中-高严谨条件下与下列杂交的多核苷酸编码(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链。21.权利要求20的多肽,其由至少在高严谨条件下与下列杂交的多核苷酸编码(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链。22.权利要求8的多肽,其中该多肽是包括SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸中一个或多个氨基酸的保守取代、缺失、和/或插入的变体。23.权利要求8的多肽,其由在包含于大肠杆菌NRRLB-30699中的质粒pEJG120、包含于大肠杆菌NRRLB-30813的质粒pTter61C、包含于大肠杆菌NRRLB-30812中的质粒pTter61D、包含于大肠杆菌NRRLB-30814中的质粒pTter61E、或包含于大肠杆菌NRRLB-30811中的质粒pTter61G中的多核苷酸编码。24.包括编码权利要求8-23中任一项的多肽的核苷酸序列的分离多核苷酸。25.权利要求24的分离多核苷酸,其在SEQIDNO1、3、5、7、或9的成熟多肽编码序列中具有至少一个突变,其中该突变的核苷酸序列编码由SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸组成的多肽。26.核酸构建体,其包括与指导所述多肽在表达宿主中产生的一个或多个调控序列可操作连接的权利要求24所述的多核苷酸。27.包括权利要求26的核酸构建体的重组表达载体。28.包括权利要求26的核酸构建体的重组宿主细胞。29.用于生产权利要求8-23中任一项的多肽的方法,包括(a)在有助于生产该多肽的条件下培养其野生型能够生产该多肽的细胞;以及(b)回收该多肽。30.用于生产权利要求8-23中任一项的多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括含有编码该多肽的核苷酸序列的核酸构建体的宿主细胞;以及(b)回收该多肽。31.用于生产亲代细胞的突变体的方法,其包括断裂或缺失编码权利要求8-23中任一项的多肽的核苷酸序列,其导致该突变体比所述母细胞生产更少的该多肽。32.通过权利要求31的方法生产的突变体细胞。33.权利要求32的突变体细胞,其进一步包括编码天然或异源蛋白质的基因。34.用于生产蛋白质的方法,包括(a)在有助于生产该蛋白质的条件下培养权利要求33的突变体细胞;以及(b)回收该蛋白质。35.权利要求24的分离多核苷酸,其通过(a)在中等严谨条件下使DNA群与下列杂交(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链;以及(b)分离所述杂交的多核苷酸,其编码具有分解纤维增强活性的多肽来获得。36.权利要求35的分离多核苷酸,其通过(a)在中-高严谨条件下使DNA群与下列杂交(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链;以及(b)分离该编码具有分解纤维增强活性的多肽的杂交多核苷酸来获得。37.权利要求36的分离多核苷酸,其通过(a)在高严谨条件下使DNA群与下列杂交(i)SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、SEQIDNO5的第126至978位核苷酸、SEQIDNO7的第55至678位核苷酸、或SEQIDNO9的第58至912位核苷酸,(ii)包含于SEQIDNO1的第388至1332位核苷酸、SEQIDNO3的第98至821位核苷酸、或SEQIDNO5的第126至978位核苷酸中的cDNA序列、或包括SEQIDNO7的第55至678位核苷酸或SEQIDNO9的第58至912位核苷酸的基因组DNA序列,或(iii)(i)或(ii)的互补链;以及(b)分离杂交多核苷酸,其编码具有分解纤维增强活性的多肽来获得。38.用于生产具有突变核苷酸序列的多核苷酸的方法,包括(a)将至少一个突变导入SEQIDNO1的成熟多肽编码序列,其中该突变的核苷酸序列编码由SEQIDNO2的第20至326位氨基酸、SEQIDNO4的第18至240位氨基酸、SEQIDNO6的第20至258位氨基酸、SEQIDNO8的第19至226位氨基酸、或SEQIDNO10的第20至304位氨基酸组成的多肽;以及(b)回收包括该突变的核苷酸序列的多核苷酸。39.通过权利要求38的方法生产的突变的多核苷酸。40.用于生产多肽的方法,包括(a)在有助于生产该多肽的条件下培养包括权利要求39的突变的多核苷酸的细胞;以及(b)回收该多肽。41.包含编码蛋白的基因的核酸构建体,所述基因编码与由SEQIDNO1的第330至387位核苷酸、SEQIDNO3的第47至97位核苷酸、SEQIDNO5的第69至125位核苷酸、SEQIDNO7的第1至54位核苷酸、或SEQIDNO9的第1至57位核苷酸组成的编码信号肽的核苷酸序列可操作连接,其中该基因与该核苷酸序列是异源的。42.包括权利要求41的核酸构建体的重组表达载体。43.包括权利要求41的核酸构建体的重组宿主细胞。44.用于生产蛋白质的方法,包括(a)在有助于生产该蛋白质的条件下培养权利要求43的重组宿主细胞;以及(b)回收该蛋白质。45.用于生产权利要求1、2、和8-23中任一项的多肽的方法,包括(a)在有助于生产该多肽的条件下培养转基因植物或植物细胞,其包括编码本发明的具有增强的纤维素分解活性的多肽的多核苷酸;以及(b)回收该多肽。46.转基因的植物、植物部分或植物细胞,其已经用编码权利要求1、2和8-23中任一项的多肽的多核苷酸转化。47.包括权利要求1、2、和8-23中任一项的具有增强的纤维素分解活性的多肽、纤维素分解活性和表面活性剂的清洁剂组合物。48.用于降解或转换纤维素物质的方法,其包括在存在有效量的权利要求1、2、和8-23中任一项的具有增强的纤维素分解活性的多肽时,用有效量的纤维素分解蛋白质处理纤维素物质,其中存在该具有增强的纤维素分解活性的多肽与缺少该具有增强的纤维素分解活性的多肽相比增加了纤维素物质的降解。49.权利要求48的方法,其中该纤维素物质选自草本物质、农业残余物、林业残余物、城市固体废物、废纸、以及纸浆和造纸厂残余物。50.权利要求48的方法,其中该纤维素物质是玉米秸。51.权利要求48-50中任一项的方法,其中该一种或多种纤维素分解酶选自纤维素酶、葡聚糖内切酶、纤维二糖水解酶、和β-葡糖苷酶。52.权利要求48-51中任一项的方法,进一步包括用选自半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶、或其混合物的有效量的一种或多种酶处理纤维素物质。53.权利要求48-52中任一项的方法,其中该方法是预处理过程。54.权利要求48-52中任一项的方法,其中该方法是同时糖化和发酵过程(SSF)中的步骤。55.权利要求48-52中任一项的方法,其中该方法是混合水解和发酵过程(HHF)中的步骤。56.权利要求48-55中任一项的方法,进一步包括回收降解的纤维素物质。57.权利要求53的方法,其中该降解的纤维素物质是糖。58.权利要求54的方法,其中该糖选自葡萄糖、木糖、甘露糖、半乳糖和阿拉伯糖。59.权利要求48的方法,其中该纤维素分解蛋白质和/或具有增强的纤维素分解活性的多肽以含有或不含有细胞的发酵液形式存在。60.用于生产有机物质的方法,包括(a)在存在有效量的权利要求1、2、和8-23中任一项具有增强的纤维素分解活性的多肽时,用有效量的纤维素分解蛋白质糖化纤维素物质,其中存在该具有增强的纤维素分解活性的多肽与缺少该具有增强的纤维素分解活性的多肽相比增加了纤维素物质的降解;(b)用一种或多种发酵微生物发酵步骤(a)的糖化的纤维素物质;以及(c)从该发酵物回收有机物质。61.权利要求60的方法,其中该纤维素物质选自草本物质、农业残余物、林业残余物、城市固体废物、废纸、以及纸浆和造纸厂残余物。62.权利要求60的方法,其中该纤维素物质是玉米秸。63.权利要求60-62中任一项的方法,其中所述的一种或多种纤维素分解酶选自纤维素酶、葡聚糖内切酶、纤维二糖水解酶、和β-葡糖苷酶。64.权利要求60-63中任一项的方法,进一步包括用选自半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶、或其混合物的有效量的一种或多种酶处理纤维素物质。65.权利要求64的方法,其中该酯酶是脂肪酶、磷脂酶、角质酶或其混合物。66.权利要求60-65中任一项的方法,其中在同时糖化和发酵中同时进行步骤(a)和(b)。67.权利要求60-66中任一项的方法,其中该有机物质是醇类、有机酸、酮类、氨基酸或气体。68.权利要求67的方法,其中所述醇类是阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨糖醇或木糖醇。69.权利要求67的方法,其中所述有机酸是乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸或木糖酸。70.权利要求67的方法,其中所述酮类是丙酮。71.权利要求67的方法,其中所述氨基酸是天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸或苏氨酸。72.权利要求67的方法,其中所述气体是甲烷、氢气、二氧化碳和一氧化碳。73.权利要求60的方法,其中该纤维素分解蛋白质和/或具有增强的纤维素分解活性的多肽以含有或不含有细胞的发酵液形式存在。全文摘要本发明涉及具有分解纤维增强活性的分离多肽和编码该多肽的分离多核苷酸。本发明也涉及包括该多核苷酸的核酸构建体、载体、和宿主细胞以及生产和使用该多肽的方法。文档编号C12N1/21GK1980953SQ200580010730公开日2007年6月13日申请日期2005年1月28日优先权日2004年1月30日发明者金伯利·布朗,保罗·哈里斯,伊丽莎白·扎雷特斯基,爱德华·雷,埃琳娜·弗拉森科,基思·麦克法兰,艾尔弗雷多·洛佩兹德利昂申请人:诺维信股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1