具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸的制作方法

文档序号:14937571发布日期:2018-07-13 19:41阅读:265来源:国知局
对于在联邦资助的研究和开发下完成的发明的权利的声明本发明是部分地在由能源部授予的合作协议(cooperativeagreement)de-fc36-08go18080下以政府支持完成的。政府在本发明中具有一定权利。涉及序列表本申请包含计算机可读形式的序列表,其通过提述并入本文。发明背景发明领域本发明涉及具有纤维二糖水解酶活性的多肽和编码所述多肽的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及产生和使用所述多肽的方法。相关领域描述纤维素是简单糖葡萄糖通过β-1,4-键共价连接的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,将其打开(openingit)以受到纤维二糖水解酶攻击(attack)。纤维二糖水解酶顺序地从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。将含木素纤维素原料(lignocellulosicfeedstock)转化为乙醇具有以下优势:大量原料现成可用,避免燃烧或填埋材料的合意性和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物被认为是用于乙醇产生的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将木素纤维素转化成可发酵的糖例如葡萄糖,所述可发酵的糖容易地由酵母发酵成乙醇。本发明提供了具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸。具有纤维二糖水解酶活性的t.byssochlamydoidesgh7多肽(seqidno:2)与来自埃默森踝节菌(talaromycesemersonii)的纤维二糖水解酶的推导的氨基酸序列(geneseqp:ayl28232)共享87.41%同一性(排除缺口)。具有纤维二糖水解酶活性的t.byssochlamydoidesgh7多肽(seqidno:4)与来自neosartoryafischeri的糖基水解酶家族7蛋白的推导的氨基酸序列(swissprot:a1dap8)共享78.94%同一性(排除缺口)。技术实现要素:本发明涉及具有纤维二糖水解酶活性的分离的多肽,其选自下组:(a)多肽,其与seqidno:2的成熟多肽具有至少90%序列同一性;或多肽,其与seqidno:4的成熟多肽具有至少80%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸与seqidno:1的成熟多肽编码序列或其cdna序列具有至少90%序列同一性;或多肽,其由多核苷酸编码,所述多核苷酸与seqidno:3的成熟多肽编码序列或其cdna序列具有至少80%序列同一性;(c)seqidno:2或seqidno:4的成熟多肽的包含一个或多个(例如几个)氨基酸的取代、缺失和/或插入的变体;和(d)(a)、(b)或(c)的多肽的具有纤维二糖水解酶活性的片段。本发明亦涉及分离的多肽,其包含催化域,所述催化域选自下组:(a)催化域,其与seqidno:2的催化域具有至少90%序列同一性;或催化域,其与seqidno:4的催化域具有至少80%序列同一性;(b)催化域,其由多核苷酸编码,所述多核苷酸与seqidno:1的催化域编码序列具有至少90%序列同一性;或催化域,其由多核苷酸编码,所述多核苷酸与seqidno:3的催化域编码序列具有至少80%序列同一性;(c)seqidno:2或seqidno:4的催化域的包含一个或多个(几个)氨基酸的取代、缺失和/或插入的催化域变体;和(d)(a)、(b)或(c)的催化域的具有纤维二糖水解酶活性的片段。本发明还涉及包含本发明多肽的酶组合物;编码本发明多肽的分离的多核苷酸;包含所述多核苷酸的核酸构建体、重组表达载体和重组宿主细胞;和产生所述多肽的方法。本发明还涉及降解或转化纤维素材料的方法,包括:在本发明的具有纤维二糖水解酶活性的多肽的存在下用酶组合物处理纤维素材料。在一个方面,所述方法进一步包括回收经降解或转化的纤维素材料。本发明还涉及产生发酵产物的方法,包括:(a)在本发明的具有纤维二糖水解酶活性的多肽的存在下用酶组合物糖化纤维素材料;(b)用一种或多种(几种)发酵微生物发酵经糖化的纤维素材料以产生发酵产物;和(c)从发酵回收所述发酵产物。本发明还涉及发酵纤维素材料的方法,包括:用一种或多种(几种)发酵微生物发酵纤维素材料,其中所述纤维素材料是在本发明的具有纤维二糖水解酶的多肽的存在下用酶组合物糖化的。在一个方面,所述纤维素材料的发酵产生发酵产物。在另一个方面,所述方法进一步包括从发酵回收发酵产物。具体地,本发明涉及如下各项:1.一种具有纤维二糖水解酶活性的分离的多肽,其选自下组:(a)多肽,其与seqidno:2的成熟多肽具有至少90%序列同一性;或多肽,其与seqidno:4的成熟多肽具有至少80%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸与seqidno:1的成熟多肽编码序列或其cdna序列具有至少90%序列同一性;或多肽,其由多核苷酸编码,所述多核苷酸与seqidno:3的成熟多肽编码序列或其基因组dna序列具有至少80%序列同一性;(c)seqidno:2或seqidno:4的成熟多肽的包含一个或多个(几个)氨基酸的取代、缺失和/或插入的变体;和(d)(a)、(b)或(c)的多肽的具有纤维二糖水解酶活性的片段。2.项1的多肽,其与seqidno:2的成熟多肽具有至少90%,例如至少92%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。3.项1的多肽,其与seqidno:4的成熟多肽具有至少80%,例如至少85%,至少87%,至少90%,至少92%,至少95%,例如至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。4.项1-3任一项的多肽,其包含或组成为seqidno:2或seqidno:4。5.项4的多肽,其包含或组成为seqidno:2或seqidno.4的成熟多肽。6.项5的多肽,其中所述成熟多肽是seqidno:2的氨基酸19至455或seqidno:4的氨基酸26至537。7.一种分离的多肽,其包含催化域,所述催化域选自下组:(a)催化域,其与seqidno:2的催化域具有至少90%序列同一性;或催化域,其与seqidno:4的催化域具有至少80%序列同一性;(b)催化域,其由多核苷酸编码,所述多核苷酸与seqidno:1的催化域编码序列具有至少90%序列同一性;或催化域,其由多核苷酸编码,所述多核苷酸与seqidno:3的催化域编码序列具有至少80%序列同一性;(c)seqidno:2或seqidno:4的催化域的包含一个或多个(几个)氨基酸的取代、缺失和/或插入的催化域变体;和(d)(a)、(b)或(c)的催化域的具有纤维二糖水解酶活性的片段。8.项7的多肽,其包含或组成为seqidno:2或seqidno:4的催化域。9.项8的多肽,其中所述催化域是seqidno:2的氨基酸19至455或seqidno:4的氨基酸26至465。10.项7-9任一项的多肽,其进一步包含纤维素结合域。11.一种组合物,其包含项1-10任一项的多肽。12.一种分离的多核苷酸,其编码项1-10任一项的多肽。13.一种核酸构建体或表达载体,其包含项12的多核苷酸,所述多核苷酸可操作地连接于一个或多个(几个)调控序列,所述调控序列指导所述多肽在表达宿主中的产生。14.一种重组宿主细胞,其包含项12的多核苷酸,所述多核苷酸可操作地连接于一个或多个调控序列,所述调控序列指导多肽的产生。15.一种产生具有纤维二糖水解酶活性的多肽的方法,其包括:(a)在有助于所述多肽产生的条件下培养项14的重组宿主细胞;和(b)回收所述多肽。16.一种降解或转化纤维素材料的方法,其包括:在项1-10中任一项的具有纤维二糖水解酶活性的多肽存在下用酶组合物处理所述纤维素材料。17.项16的方法,其中所述纤维素材料经过预处理。18.项16或17的方法,进一步包括回收经降解的纤维素材料。19.一种产生发酵产物的方法,其包括:(a)在项1-10中任一项的具有内切葡聚糖酶活性的多肽存在下,用酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵经糖化的纤维素材料以产生发酵产物;和(c)从发酵回收所述发酵产物。20.项19的方法,其中步骤(a)和(b)在同步糖化和发酵中同时进行。21.项19或20的方法,其中所述发酵产物是醇、有机酸、酮、氨基酸或气体。22.一种发酵纤维素材料的方法,其包括:用一种或多种发酵微生物发酵纤维素材料,其中所述纤维素材料是在项1-10中任一项的具有纤维二糖水解酶活性的多肽的存在下用酶组合物糖化的。定义纤维二糖水解酶:术语“纤维二糖水解酶”意指1,4-β-d-葡聚糖纤维二糖水解酶(1,4-beta-d-glucancellobiohydrolase)(e.c.no.3.2.1.91),其催化纤维素、纤维素寡糖,或任何包含β-1,4-连接的葡萄糖的聚合物中的1,4-β-d-糖苷键的水解,从链的还原或非还原末端释放纤维二糖(teeri,1997,crystallinecellulosedegradation:newinsightintothefunctionofcellobiohydrolases,trendsinbiotechnology15:160-167;teeri等,1998,trichodermareeseicellobiohydrolases:whysoefficientoncrystallinecellulose?,biochem.soc.trans.26:173-178)。就本发明而言,根据lever等,1972,anal.biochem.47:273-279;vantilbeurgh等,1982,febsletters,149:152-156;vantilbeurgh和claeyssens,1985,febsletters,187:283-288;以及tomme等,1988,eur.j.biochem.170:575-581描述的方法确定纤维二糖水解酶活性。在本发明中,可采用lever等的方法来评价玉米秸秆中的纤维素水解,而vantilbeurgh等和tomme等的方法可用于确定对荧光性二糖衍生物4-甲基伞形基-β-d-乳糖苷(4-methylumbelliferyl-β-d-lactoside)的纤维二糖水解酶活性。优选地,本发明的纤维二糖水解酶是家族7糖基水解酶(gh7)。在本发明中,实施例部分中所述的测定法可用于测量纤维二糖水解酶活性。本发明的多肽具有seqidno:2或seqidno:4的成熟多肽的纤维二糖水解酶活性的至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%和至少100%。纤维素分解酶或纤维素酶:术语“纤维素分解酶”或“纤维素酶”意指一种或多种(几种)水解纤维素材料的酶。此类酶包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶或其组合。测量纤维素分解活性的两种基本方法包括:(1)测量总纤维素分解活性,和(2)测量单独的纤维素分解活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),如zhang等,outlookforcellulaseimprovement:screeningandselectionstrategies,2006,biotechnologyadvances24:452-481所综述的。总纤维素分解活性通常是使用不溶性底物来测定的,所述底物包括whatmanno.1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、经预处理的木素纤维素等。最常见的总纤维素分解活性测定法是使用whatmanno.1滤纸作为底物的滤纸测定法。该测定法是由internationalunionofpureandappliedchemistry(iupac)(ghose,1987,measurementofcellulaseactivities,pureappl.chem.59:257-68)确立的。就本发明而言,纤维素分解酶活性通过测量在下述条件下由纤维素分解酶进行的纤维素材料水解的增加来确定:1-20mg的纤维素分解酶蛋白/g的pcs中纤维素在50℃进行3-7日,与未添加纤维素分解酶蛋白的对照水解相比较。典型条件为:1ml反应液,经洗涤或未洗涤的pcs,5%不溶性固形物,50mm乙酸钠ph5,1mmmnso4,50℃,72小时,通过hpx-87h柱(bio-radlaboratories,inc.,hercules,ca,usa)进行糖分析。内切葡聚糖酶:术语“内切葡聚糖酶”意指内切-1,4-(1,3;1,4)-β-d-葡聚糖4-葡聚糖水解酶(endo-1,4-β-d-glucan4-glucanohydrolase)(e.c.3.2.1.4),其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenin)中的1,4-β-d-糖苷键、混合的β-1,3葡聚糖例如谷类β-d-葡聚糖或木葡聚糖和含有纤维素组分的其它植物材料中的β-1,4键的内水解(endohydrolysis)。内切葡聚糖酶活性可通过测量底物粘度的减少或由还原糖测定法(zhang等,2006,biotechnologyadvances24:452-481)确定的还原端增加来确定。就本发明而言,根据ghose,1987,pureandappl.chem.59:257-268的方法,在ph5,40℃,使用羧甲基纤维素(cmc)作为底物来确定内切葡聚糖酶活性。β-葡糖苷酶:术语“β-葡糖苷酶”意指β-d-葡糖苷葡糖水解酶(beta-d-glucosideglucohydrolase)(e.c.no.3.2.1.21),其催化末端非还原β-d-葡萄糖残基的水解,并释放β-d-葡萄糖。就本发明而言,β-葡糖苷酶活性是根据由venturi等,2002,extracellularbeta-d-glucosidasefromchaetomiumthermophilumvar.coprophilum:production,purificationandsomebiochemicalproperties,j.basicmicrobiol.42:55-66所述的基本步骤确定的。一单位的β-葡糖苷酶定义为在25℃,ph4.8从作为底物的1mm对硝基苯基-β-d-葡糖吡喃糖苷在含有0.01%20的50mm柠檬酸钠中每分钟产生1.0微摩尔的对硝基苯酚阴离子。具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强活性的多肽”意指催化具有纤维素分解活性的酶水解纤维素材料的增强的gh61多肽。就本发明而言,通过测量由纤维素分解酶在下述条件下水解纤维素材料所导致的还原糖增加或纤维二糖与葡萄糖的总量增加来确定纤维素分解增强活性:1-50mg总蛋白/gpcs中的纤维素,其中总蛋白包含50-99.5%w/w的纤维素分解酶蛋白,及0.5-50%w/w的具有纤维素分解增强活性的gh61多肽的蛋白质,在50℃历时1-7天,与用等量的总蛋白加载量而无纤维素分解增强活性(1-50mg纤维素分解蛋白/gpcs中的纤维素)所进行的对照水解相比。在一个优选的方面,使用在总蛋白重量的2-3%的米曲霉(aspergillusoryzae)β-葡糖苷酶(根据wo02/095014在米曲霉中重组产生)或者总蛋白重量的2-3%的烟曲霉(aspergillusfumigatus)β-葡糖苷酶(如wo2002/095014所述在米曲霉中重组产生)的纤维素酶蛋白加载量存在下的1.5l(novozymesa/s,denmark)的混合物作为纤维素分解活性的来源。具有纤维素分解增强活性的gh61多肽通过降低达到相同水解程度所需的纤维素分解酶的量而增强由具有纤维素分解活性的酶催化的纤维素材料的水解,优选降低至少1.01倍,更优选至少1.05倍,更优选至少1.10倍,更优选至少1.25倍,更优选至少1.5倍,更优选至少2倍,更优选至少3倍,更优选至少4倍,更优选至少5倍,甚至更优选至少10倍,并且最优选至少20倍。家族7或家族61糖苷水解酶:术语“家族gh7”或“gh7”或“家族7糖苷水解酶”,或者“家族gh61”或“gh61”或“家族61糖苷水解酶”意指根据henrissat,1991,aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,biochem.j.280:309-316,及henrissat和bairoch,1996,updatingthesequence-basedclassificationofglycosylhydrolases,biochem.j.316:695-696分别属于糖苷水解酶家族7或家族61的多肽。半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”意指一种或多种(几种)水解半纤维素材料的酶。参见,例如shallom和shoham2003,microbialhemicellulases.currentopinioninmicrobiology,6(3):219-228)。半纤维素酶是植物生物质降解中的关键成分。半纤维素酶的实例包括但不限于乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。这些酶的底物,半纤维素,是支化和直链多糖的混杂集团,这些多糖通过氢键键合于植物细胞壁中的纤维素微纤维,将其交联为鲁棒(robust)的网络。半纤维素亦共价地附接于木质素,与纤维素一同形成高度复杂的结构。半纤维素的可变的结构和组织形式需要许多酶的协同作用使其完全降解。半纤维素酶的催化模块为水解糖苷键的糖苷水解酶(gh),或水解乙酸或阿魏酸侧基酯连接的糖酯酶(ce)。这些催化模块,基于其一级结构的同源性,可指定为以数字标记的gh和ce家族。一些家族,具有总体上类似的折叠,可进一步归类为宗族(clan),以字母标记(例如,gh-a)。最具信息性和最新的这些和其他糖活性酶的分类可在carbohydrate-activeenzymes(cazy)数据库获得。半纤维素分解酶活性可根据ghose和bisaria,1987,pure&appl.chem.59:1739-1752测量。木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”意指水解含木聚糖材料的生物学活性。两种测定木聚糖分解活性的基础方法包括:(1)测定总木聚糖分解活性,和(2)测定单独的木聚糖分解活性(例如,内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(α-glucuronylesterase))。最近在木聚糖分解酶测定法的进展总结于几个公开文献中,包括biely和puchard,recentprogressintheassaysofxylanolyticenzymes,2006,journalofthescienceoffoodandagriculture86(11):1636-1647;spanikova和biely,2006,glucuronoylesterase-novelcarbohydrateesteraseproducedbyschizophyllumcommune,febsletters580(19):4597-4601;herrmann等,1997,thebeta-d-xylosidaseoftrichodermareeseiisamultifunctionalbeta-d-xylanxylohydrolase,biochemicaljournal321:375-381。总木聚糖降解活性可通过确定从多种类型的木聚糖形成的还原糖来测量,所述木聚糖包括例如燕麦小麦(oatspelt)、山毛榉木(beechwood)和落叶松木(larchwood)木聚糖,或者可通过光度法确定从多种共价染色的木聚糖释放出的染色的木聚糖片段来测量。最常见的总木聚糖分解活性测定法基于从多聚的4-o-甲基葡糖醛酸木聚糖产生还原糖,如bailey等,1992,interlaboratorytestingofmethodsforassayofxylanaseactivity,journalofbiotechnology23(3):257-270中所述。木聚糖酶活性亦可用0.2%azcl-阿拉伯木聚糖作为底物在37℃在0.01%x-100和200mm磷酸钠缓冲液ph6中确定。一单位的木聚糖酶活性定义为在37℃,ph6从200mm磷酸钠ph6缓冲液中作为底物的0.2%azcl阿拉伯木聚糖每分钟产生1.0微摩尔的天青蛋白(azurine)。就本发明而言,木聚糖降解活性是通过测量由木聚糖降解酶在下述典型条件下造成的桦木木聚糖(sigmachemicalco.,inc.,st.louis,mo,usa)水解的增加来确定的:1ml反应,5mg/ml底物(总固形物),5mg木聚糖分解蛋白/g底物,50mm乙酸钠,ph5,50℃,24小时,如lever,1972,anewreactionforcolorimetricdeterminationofcarbohydrates,anal.biochem47:273-279所述使用对羟基苯甲酸酰肼(phbah)测定法进行糖分析。木聚糖酶:术语“木聚糖酶”意指催化木聚糖中1,4-β-d-木糖苷键的内水解的1,4-β-d-木聚糖-木糖水解酶(e.c.3.2.1.8)。就本发明而言,木聚糖酶活性是以0.01%x-100和200mm磷酸钠缓冲液ph6中0.2%azcl-阿拉伯木聚糖作为底物在37℃确定的。一个单位的木聚糖酶活性定义为在37℃,ph6从200mm磷酸钠ph6缓冲液中作为底物的0.2%azcl-阿拉伯木聚糖每分钟产生1.0微摩尔的天青蛋白。β-木糖苷酶:术语“β-木糖苷酶”意指β-d-木糖苷木糖水解酶(β-d-xylosidexylohydrolase)(e.c.3.2.1.37),其催化短β(1→4)木寡糖(xylooligosaccharide)的外水解以从非还原端去除连续的d-木糖残基。就本发明而言,一个单位的β-木糖苷酶定义为在40℃,ph5从1mm对硝基苯基-β-d-木糖苷作为底物在含有0.01%20的100mm柠檬酸钠中每分钟产生1.0微摩尔对硝基苯酚阴离子。乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”意指羧基酯酶(ec3.1.1.72),其催化乙酰基从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α-萘酯(alpha-napthylacetate)和乙酸对硝基苯酯(p-nitrophenylacetate)的水解。就本发明而言,乙酰木聚糖酯酶活性是使用0.5mm乙酸对硝基苯酯作为底物,在含有0.01%tweentm20的50mm乙酸钠ph5.0中确定的。一个单位的乙酰木聚糖酯酶定义为能够在ph5,25℃每分钟释放1微摩尔对硝基苯酚阴离子(p-nitrophenolateanion)的酶量。阿魏酸酯酶:术语“阿魏酸酯酶(feruloylesterase)”意指4-羟基-3-甲氧基肉桂酰-糖水解酶(ec3.1.1.73),其催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基团从酯化的糖(其在“天然”底物中通常为阿拉伯糖)的水解,以产生阿魏酸(4-羟基-3-甲氧基肉桂酸)。阿魏酸酯酶也称作阿魏酸酯酶(ferulicacidesterase)、羟基肉桂酸酯酶(hydroxycinnamoylesterase)、fae-iii、肉桂酸酯水解酶、faea、cinnae、fae-i或fae-ii。就本发明而言,阿魏酸酯酶是使用50mm乙酸钠ph5.0中的0.5mm阿魏酸对硝基苯酯作为底物确定的。一个单位的阿魏酸酯酶活性等于能够在ph5,25℃每分钟释放出1微摩尔对硝基苯酚阴离子的酶量。α-葡糖醛酸糖苷酶:术语“α-葡糖醛酸糖苷酶”意指α-d-葡糖苷酸葡糖醛酸水解酶(alpha-d-glucosiduronateglucuronohydrolase)(ec3.2.1.139),其催化α-d-葡糖醛酸糖苷水解为d-葡糖醛酸和醇。就本发明而言,α-葡糖醛酸糖苷酶活性是根据devries,1998,j.bacteriol.180:243-249确定的。一个单位的α-葡糖醛酸糖苷酶等于能够在ph5,40℃每分钟释放出1微摩尔葡糖醛酸或4-o-甲基葡糖醛酸的酶量。α-l-阿拉伯呋喃糖苷酶:术语“α-l-阿拉伯呋喃糖苷酶活性”意指α-l-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(ec3.2.1.55),其催化对α-l-阿拉伯糖苷中的末端非还原性α-l-阿拉伯呋喃糖苷残基的水解。该酶对α-l-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)-键的α-l-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-l-阿拉伯呋喃糖苷酶也称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-l-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-l-阿拉伯呋喃糖苷酶、α-l-阿拉伯呋喃糖苷水解酶、l-阿拉伯糖苷酶或α-l-阿拉伯聚糖酶。就本发明而言,α-l-阿拉伯呋喃糖苷酶活性是使用总体积200μl中的每ml的100mm乙酸钠ph5中5mg的中等粘度小麦阿拉伯木聚糖(megazymeinternationalireland,ltd.,bray,co.wicklow,ireland)在40℃进行30分钟,接着通过hpx-87h柱层析(bio-radlaboratories,inc.,hercules,ca,usa)的阿拉伯糖分析来确定的。纤维素材料:术语“纤维素材料”意指包含纤维素的任何材料。生物质的初生细胞壁(primarycellwall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondarycellwall)在细胞停止生长后产生,其同样含有多糖并通过共价交联至半纤维素的聚合木质素而加强。纤维素是脱水纤维二糖的均聚物,并且因此是直链β-(1-4)-d-葡聚糖,而半纤维素包括多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的复杂分支结构。尽管通常是多形的,存在于植物组织中的纤维素主要是平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键键合,其帮助稳定细胞壁基质。纤维素通常见于例如植物的茎、叶、壳、皮和穗轴,或树的叶、枝和木材。纤维素材料可为但不限于,草本材料、农业残余物、林业残余物、城市固体废物、废纸和纸浆与造纸厂残余物(参见,例如,wiselogel等,1995,于handbookonbioethanol(charlese.wyman编),pp.105-118,taylor&francis,washingtond.c.;wyman,1994,bioresourcetechnology50:3-16;lynd,1990,appliedbiochemistryandbiotechnology24/25:695-719;mosier等,1999,recentprogressinbioconversionoflignocellulosics,于advancesinbiochemicalengineering/biotechnology,t.scheper主编,volume65,pp.23-40,springer-verlag,newyork)。在本文中应理解的是,纤维素可以是以木素纤维素的形式,在混合基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。在一个优选的方面,纤维素材料是木素纤维素,其包含纤维素、半纤维素和木质素。在一个方面,纤维素材料是草本材料。在另一个方面,纤维素材料是农业残余物。在另一个方面,纤维素材料是林业残余物。在另一个方面,纤维素材料是城市固体废物。在另一个方面,纤维素材料是废纸。在另一个方面,纤维素材料是纸浆和造纸厂残余物。在另一个方面,纤维素材料是玉米秸秆。在另一个方面,纤维素材料是玉米纤维。在另一个方面,纤维素材料是玉米穗轴。在另一个方面,纤维素材料是橙皮。在另一个方面,纤维素材料是稻杆。在另一个方面,纤维素材料是麦杆。在另一个方面,纤维素材料是柳枝稷(switchgrass)。在另一个方面,纤维素材料是芒草属(miscanthus)。在另一个方面,纤维素材料是甘蔗渣。在另一个方面,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是细菌纤维素。在另一个方面,纤维素材料是藻类纤维素。在另一个方面,纤维素材料是棉绒(cottonlinter)。在另一个方面,纤维素材料是无定形的磷酸处理的纤维素。在另一个方面,纤维素材料是滤纸。纤维素材料可以直接使用或进行预处理,使用本领域已知的常规方法,如本文所述。在一个优选的方面,预处理纤维素材料。预处理的玉米秸秆:术语“pcs”或“预处理的玉米秸秆”意指通过用热和稀硫酸处理的源自玉米秸秆的纤维素材料。非常低严格条件:术语“非常低严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5xsspe、0.3%sds、200微克/ml已剪切并且变性的鲑精dna和25%的甲酰胺中,根据标准的southern印迹法进行预杂交和杂交12至24小时。使用2xssc、0.2%sds在45℃将载体材料最终洗涤三次,每次15分钟。低严格条件:术语“低严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5xsspe、0.3%sds、200微克/ml已剪切并且变性的鲑精dna和25%的甲酰胺中,根据标准的southern印迹法进行预杂交和杂交12至24小时。使用2xssc、0.2%sds在50℃将载体材料最终洗涤三次,每次15分钟。中等严格条件:术语“中等严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5xsspe、0.3%sds、200微克/ml已剪切并且变性的鲑精dna和35%的甲酰胺中,根据标准的southern印迹法进行预杂交和杂交12至24小时。使用2xssc、0.2%sds在55℃将载体材料最终洗涤三次,每次15分钟。中等-高严格条件:术语“中等-高严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5xsspe、0.3%sds、200微克/ml已剪切并且变性的鲑精dna和35%的甲酰胺中,根据标准的southern印迹法进行预杂交和杂交12至24小时。使用2xssc、0.2%sds在60℃将载体材料最终洗涤三次,每次15分钟。高严格条件:术语“高严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5xsspe、0.3%sds、200微克/ml已剪切并且变性的鲑精dna和50%的甲酰胺中,根据标准的southern印迹法进行预杂交和杂交12至24小时。使用2xssc、0.2%sds在65℃将载体材料最终洗涤三次,每次15分钟。非常高严格条件:术语“非常高严格条件”意指对于长度至少100个核苷酸的探针,在42℃,在5xsspe、0.3%sds、200微克/ml已剪切并且变性的鲑精dna和50%的甲酰胺中,根据标准的southern印迹法进行预杂交和杂交12至24小时。使用2xssc、0.2%sds在70℃将载体材料最终洗涤三次,每次15分钟。分离的:术语“分离的”意指以不在自然界出现的形式或环境存在的物质。分离的物质的非限定性实例包括(1)任何非天然存在的物质,(2)任何至少部分地从一种或多种或全部与其天然结合的天然存在的成分移出的物质,包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子;(3)任何相对于见于自然界的该物质经人工修饰的物质;或(4)任何通过相对于与其自然结合的其他组分增加该物质的量(例如,编码该物质的基因的多拷贝;比与编码该物质的基因自然结合的启动子更强的启动子的使用)而修饰的物质。分离的物质可存在于发酵液样品中。成熟多肽:术语“成熟多肽”意指以其在翻译和任何翻译后修饰之后的最终形式存在的多肽,所述修饰例如n-末端加工、c-末端截短、糖基化、磷酸化等。在一个方面,根据预测seqidno:2的氨基酸1至18是信号肽的signalp程序(nielsen等,1997,proteinengineering10:1-6),成熟多肽是seqidno:2的氨基酸19至455。本领域中已知宿主细胞可产生两种或更多种由相同多核苷酸表达的不同成熟多肽(即,具有不同的c端和/或n端氨基酸)的混合物。在另一个方面,根据预测seqidno:4的氨基酸1至25是信号肽的signalp程序(nielsen等,1997,proteinengineering10:1-6),成熟多肽是seqidno:4的氨基酸26至537。本领域中已知宿主细胞可产生两种或更多种由相同多核苷酸表达的不同成熟多肽(即,具有不同的c端和/或n端氨基酸)的混合物。成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有纤维二糖水解酶活性的成熟多肽的多核苷酸。在一个方面,根据预测seqidno:1的核苷酸1至54编码信号肽的signalp程序(nielsen等,1997,见上),成熟多肽编码序列是seqidno:1的核苷酸55至603、668至1235、1311至1507。在另一个方面,根据预测seqidno:3的核苷酸1至75编码信号肽的signalp程序(nielsen等,1997,见上),成熟多肽编码序列是seqidno:3的核苷酸76至1614。催化域:术语“催化域”意指含有酶的催化机构(catalyticmachinery)的酶的部分。纤维素结合域:术语“纤维素结合域”意指介导酶对纤维素底物的无定形区的结合的酶的部分。纤维素结合域(cbd)通常见于酶的n末端或c末端。cbd亦称作纤维素结合模块(cellulosebindingmodule)或cbm。在一个实施方案中,cbm是seqidno:4的氨基酸502至537。cbm与催化域由接头序列分隔。所述接头在一个实施方案中是seqidno:4的氨基酸452至495。序列同一性:参数“序列同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。就本发明而言,两个氨基酸序列之间的序列同一性程度使用如emboss软件包(emboss:theeuropeanmolecularbiologyopensoftwaresuite,rice等,2000,trendsgenet.16:276-277),优选5.0.0版或更高版本的needle程序中所执行的needleman-wunsch算法(needleman和wunsch,1970,j.mol.biol.48:443-453)来测定。使用的可选参数为缺口开放罚分(gapopenpenalty)10,缺口延伸罚分(gapextensionpenalty)0.5和eblosum62(blosum62的emboss版)取代矩阵。使用needle标记为“最高同一性(longestidentity)”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:(同样的残基×100)/(比对长度-比对中缺口的总数)就本发明而言,两个脱氧核苷酸序列之间的序列同一性程度使用如emboss软件包(emboss:theeuropeanmolecularbiologyopensoftwaresuite,rice等,2000,见上文),优选5.0.0版或更高版本的needle程序中所执行的needleman-wunsch算法(needleman和wunsch,1970,见上文)来测定。使用的可选参数为缺口开放罚分10,缺口延伸罚分0.5和ednafull(ncbinuc4.4的emboss版)取代矩阵。使用needle标记为“最高同一性”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:(同样的脱氧核糖核苷酸×100)/(比对长度-比对中缺口的总数)片段:术语“片段”意指从成熟多肽的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽;其中所述片段具有纤维二糖水解酶活性。在一个方面,片段含有至少390个氨基酸残基,例如至少400个氨基酸残基,或至少430个氨基酸残基。亚序列:术语“亚序列(subsequence)”意指从成熟多肽编码序列的5’和/或3’端缺失一个或多个(几个)核苷酸的多核苷酸;其中所述亚序列编码具有纤维二糖水解酶活性的片段。在一个方面,亚序列含有至少1170个核苷酸,例如至少1230个核苷酸,或至少1290个核苷酸。等位变体(allelicvariant):术语“等位变体”意指占据相同染色体基因座的基因的任何两种或更多种可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。编码序列:术语“编码序列”意指直接指定多肽氨基酸序列的多核苷酸。编码序列的边界通常由开读框决定,所述开读框通常以atg起始密码子或其他起始密码子例如gtg和ttg开始,并且以终止密码子例如taa、tag和tga结束。编码序列可以是dna、cdna、合成的或重组的多核苷酸。cdna:术语“cdna”意指能够通过反转录从得自真核细胞的成熟的、已剪接的mrna分子制备的dna分子。cdna缺少通常存在于相应基因组dna中的内含子序列。起始的(initial)、初级的rna转录物是mrna的前体,其通过一系列的包括剪接的步骤加工然后作为成熟的已剪接的mrna出现。核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,其分离自天然存在的基因,或受修饰以本来不存在于(nototherwiseexist)自然界中的方式含有核酸的区段,或其为合成的。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。调控序列(controlsequence):术语“调控序列”意指对编码本发明多肽的多核苷酸表达是必需的所有成分。各个调控序列对于编码所述多肽的多核苷酸可以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的多核苷酸编码区的连接。可操作地连接:术语“可操作地连接”意指这样的构型,其中将调控序列置于相对于多核苷酸的编码序列的适当位置,使得调控序列指导编码序列的表达。表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。表达载体:术语“表达载体”意指线性的或环状的dna分子,其包含编码多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。宿主细胞:“宿主细胞”意指任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。术语“宿主细胞”涵盖亲本细胞的任何后代,所述后代由于在复制中发生的突变而不同于亲本细胞。变体:术语“变体”意指具有纤维二糖水解酶活性的多肽,其包含改变,即在一个或多个(几个)位置的取代、插入和/或缺失一个或多个(几个)氨基酸残基。取代意指用不同的氨基酸取代占据某位置的氨基酸;缺失意指去除占据某位置的氨基酸;而插入意指邻接于占据某位置的氨基酸添加一个或多个(几个)氨基酸,例如1-5个氨基酸。发明详述具有纤维二糖水解酶活性的多肽本发明涉及具有纤维二糖水解酶活性的分离的多肽,所述多肽选自下组:(a)多肽,其与seqidno:2的成熟多肽具有至少90%序列同一性;或多肽,其与seqidno:4的成熟多肽具有至少80%序列同一性(b)多肽,其由多核苷酸编码,所述多核苷酸与seqidno:1的成熟多肽编码序列或其cdna序列具有至少90%序列同一性;或多肽,其由多核苷酸编码,所述多核苷酸与seqidno:3的成熟多肽编码序列或其cdna序列具有至少80%序列同一性;(c)seqidno:2或seqidno:4的成熟多肽的包含一个或多个(例如几个)氨基酸的取代、缺失和/或插入的变体;和(d)(a)、(b)或(c)的多肽的具有纤维二糖水解酶活性的片段。本发明涉及分离的多肽,所述分离的多肽与seqidno:2的成熟多肽具有至少90%,例如至少92%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性,所述多肽具有纤维二糖水解酶活性。在一个方面,所述多肽与seqidno:2的成熟多肽相差不超过十个氨基酸,例如相差五个氨基酸、相差四个氨基酸、相差三个氨基酸、相差两个氨基酸和相差一个氨基酸。本发明的多肽优选包含或组成为(consistof)seqidno:2的氨基酸序列或其等位变体;或为其具有纤维二糖水解酶活性的片段。在另一个方面,所述多肽包含或组成为seqidno:2的成熟多肽。在另一个优选方面,所述多肽包含或组成为seqidno:2的氨基酸19至469。本发明涉及分离的多肽,所述分离的多肽与seqidno:4的成熟多肽具有至少80%,例如至少85%,至少87%,至少90%,至少92%,至少95%,例如至少96%,至少97%,至少98%,至少99%,或100%的序列同一性,所述多肽具有纤维二糖水解酶活性。在一个方面,所述多肽与seqidno:4的成熟多肽相差不超过十个氨基酸,例如相差五个氨基酸、相差四个氨基酸,相差三个氨基酸、相差两个氨基酸相差一个氨基酸。本发明的多肽优选包含或组成为(consistof)seqidno:4的氨基酸序列或其等位变体;或为其具有纤维二糖水解酶活性的片段。在另一个方面,所述多肽包含或组成为seqidno:4的成熟多肽。在另一个优选方面,所述多肽包含或组成为seqidno:4的氨基酸26至537。在另一个方面,所述多肽包含或组成为seqidno:4的氨基酸26至465。所述片段包含催化域。本发明还涉及具有纤维二糖水解酶活性的分离的多肽,所述分离的多肽由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件或非常高严格条件下,与以下杂交:(i)seqidno:1的成熟多肽编码序列,(ii)seqidno:1的成熟多肽编码序列中包含的cdna序列,或(iii)(i)或(ii)的全长互补链(j.sambrook,e.f.fritsch,和t.maniatis,1989,molecularcloning,alaboratorymanual,第2版,coldspringharbor,newyork)。本发明还涉及具有纤维二糖水解酶活性的分离的多肽,所述分离的多肽由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件或非常高严格条件下,与以下杂交:(i)seqidno:3的成熟多肽编码序列,(ii)seqidno:3的基因组dna序列,或(iii)(i)或(ii)的全长互补链(j.sambrook,e.f.fritsch,和t.maniatis,1989,molecularcloning,alaboratorymanual,第2版,coldspringharbor,newyork)。seqidno:1或seqidno:3的多核苷酸或其亚序列,以及seqidno:2或seqidno:4的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码具有纤维二糖水解酶活性的多肽的dna。具体而言,根据标准的southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组dna或cdna杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,例如至少25,至少35,或至少70个核苷酸。优选地,所述核酸探针是至少100个核苷酸的长度,例如,至少200个核苷酸,至少300个核苷酸,至少400个核苷酸,至少500个,至少600个核苷酸,至少700个核苷酸,至少800个核苷酸,或至少900个核苷酸的长度。dna和rna探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32p、3h、35s、生物素或抗生物素蛋白(avidin)标记)。这些探针涵盖于本发明中。可从由这些其它株(strain)制备的基因组dna或cdna文库中筛选dna,所述dna与上述探针杂交并且编码具有纤维二糖水解酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它株的基因组或其它dna。可以将来自文库的dna或分离的dna转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与seqidno:1或其亚序列同源的克隆或dna,将所述载体材料优选用在sounthern印迹中。就本发明而言,杂交表示多核苷酸在非常低至非常高的严格条件下与标记的核酸探针杂交,所述核酸探针对应于seqidno:1或seqidno:3;seqidno:1或seqidno:3的成熟多肽编码序列;seqidno:1的成熟多肽编码序列中包含的cdna序列或seqidno:3的基因组dna序列;其全长互补链;或它们的亚序列。可使用例如x射线片(x-rayfilm)检测在这些条件下与核酸探针杂交的分子。在一个方面,核酸探针是seqidno:1的成熟多肽编码序列或其cdna序列。在另一个方面,核酸探针是seqidno:1的核苷酸55至1507或其cdna序列。在另一个方面,核酸探针是编码seqidno:2的多肽或其成熟多肽,或它们的片段的多核苷酸。在另一个优选的方面,核酸探针是seqidno:1或其cdna序列。在一个方面,核酸探针是seqidno:3的成熟多肽编码序列或其基因组dna序列。在另一个方面,核酸探针是seqidno:3的核苷酸76至1614或其基因组序列。在另一个方面,核酸探针是编码seqidno:4的多肽或其成熟多肽,或它们的片段的多核苷酸。在另一个优选的方面,核酸探针是seqidno:3或其基因组序列。对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42℃,在5xsspe、0.3%sds、200微克/ml已剪切并且变性的鲑精dna中,并且对于非常低和低严格性为25%的甲酰胺、对于中和中等-高严格性为35%的甲酰胺、或对于高和非常高严格性为50%的甲酰胺,根据标准的southern印迹法进行预杂交和杂交最佳12至24小时。使用2xssc、0.2%sds在45℃(非常低严格性)、在50℃(低严格性)、在55℃(中严格性)、在60℃(中等-高严格性)、在65℃(高严格性)和在70℃(非常高严格性)将载体材料最终洗涤三次,每次15分钟。对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严格条件定义为在比使用根据bolton和mccarthy计算法(1962,proc.natl.acad.sci.usa48:1390)计算的tm低大约5℃至大约10℃,在0.9mnacl,0.09mtris-hclph7.6,6mmedta,0.5%np-40,1×denhardt溶液,1mm焦磷酸钠(sodiumpyrophosphate),1mm磷酸二氢钠(sodiummonobasicphosphate),0.1mmatp和每ml0.2mg的酵母rna中,根据标准的southern印迹步骤进行预杂交和杂交最佳12至24小时。将所述载体材料在6×ssc加0.1%sds中最终洗涤一次15分钟,并用6×ssc在比计算的tm低5℃至10℃的温度洗涤两次,每次15分钟。本发明还涉及由多核苷酸编码的具有纤维二糖水解酶活性的分离的多肽,所述多核苷酸与seqidno:1的成熟多肽编码序列或其cdna序列具有至少90%,例如至少92%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。本发明还涉及由多核苷酸编码的具有纤维二糖水解酶活性的分离的多肽,所述多核苷酸与seqidno:3的成熟多肽编码序列或其基因组序列具有至少80%,例如至少85%,至少87%,至少90%,至少92%,至少95%,例如至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。本发明还涉及seqidno:2或seqidno:4的成熟多肽或其同源序列的包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。优选地,氨基酸改变对性质是较不重要的(ofaminornature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的,并且由例如h.neurath和r.l.hill,1979,于theproteins,academicpress,newyork中描述。最普遍发生的交换是ala/ser、val/ile、asp/glu、thr/ser、ala/gly、ala/thr、ser/asn、ala/val、ser/gly、tyr/phe、ala/pro、lys/arg、asp/asn、leu/ile、leu/val、ala/glu和asp/gly。可供选择的是,氨基酸改变具有这样的性质:使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适ph等。能够根据本领域已知的方法,例如定位诱变或丙氨酸扫描诱变法(cunningham和wells,1989,science244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的纤维二糖水解酶活性以鉴定对于所述分子的活性关键的氨基酸残基。同样参见hilton等,1996,j.biol.chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如devos等,1992,science255:306-312;smith等,1992,j.mol.biol.224:899-904;wlodaver等,1992,febslett.309:59-64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断,所述多肽与亲本多肽相关。能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如由reidhaar-olson和sauer,1988,science241:53-57;bowie和sauer,1989,proc.natl.acad.sci.usa86:2152-2156;wo95/17413;或wo95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错pcr、噬菌体展示(例如,lowman等,1991,biochemistry30:10832-10837;美国专利no.5,223,409;wo92/06204)和区域定向的诱变(derbyshire等,1986,gene46:145;ner等,1988,dna7:127)。诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(ness等,1999,naturebiotechnology17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的dna分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定多肽中单个氨基酸残基的重要性。在一个实施方案中,seqidno:2或seqidno:4的成熟多肽的氨基酸取代、缺失和/或插入的总数不多于10,例如1,2,3,4,5,6,7,8或9。所述多肽可为杂合多肽,其中一种多肽的一部分融合于另一种多肽的一部分的n端或c端。所述多肽可为融合多肽或可切割的融合多肽,其中另一种多肽融合于本发明多肽的n端或c端。通过将编码另一个多肽的多核苷酸融合于本发明的多核苷酸来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。融合蛋白亦可使用内蛋白(intein)技术构建,其中融合物在翻译后产生(cooper等,1993,emboj.12:2575-2583;dawson等,1994,science266:776-779)。融合多肽还可以包含在两个多肽之间的切割位点。在分泌融合多肽时,就切割所述位点,释放所述两个多肽。切割位点的实例包括,但不限于,公开于martin等,2003,j.ind.microbiol.biotechnol.3:568-76;svetina等,2000,j.biotechnol.76:245-251;rasmussen-wilson等,1997,appl.environ.microbiol.63:3488-3493;ward等,1995,biotechnology13:498-503;和contreras等,1991,biotechnology9:378-381;eaton等,1986,biochem.25:505-512);collins-racie等,1995,biotechnology13:982-987;carter等,1989,proteins:structure,function,andgenetics6:240-248;以及stevens,2003,drugdiscoveryworld4:35-48中的位点。具有纤维二糖水解酶活性的多肽的来源本发明的具有纤维二糖水解酶活性的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思应为多核苷酸编码的多肽由所述来源产生,或由其中插入了来自所述来源的多核苷酸的菌株产生。在一个方面,获得自给定来源的多肽是胞外分泌的。所述多肽可为踝节菌属(talaromyces)多肽。在另一个方面,所述多肽是talaromycesbyssochlamydoides多肽。在另一个方面,所述多肽是talaromycesbyssochlamydoidescbs413.71多肽。会理解的是对于前述的种,本发明包含完全和不完全阶段(perfectandimperfectstates),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域技术人员将容易地识别适合的等同物的身份。这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(theamericantypeculturecollection)(atcc)、德意志微生物和细胞培养物保藏中心(deutschesammlungvonmikroorganismenundzellkulturengmbh)(dsmz)、真菌菌种保藏中心(centraalbureauvoorschimmelcultures)(cbs)和农业研究机构专利培养物保藏中心北区研究中心(agriculturalresearchservicepatentculturecollection,northernregionalresearchcenter)(nrrl)。可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得所述多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选另一种微生物的基因组dna或cdna文库或混合的dna样品来获得编码所述多肽的多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸,就能够使用本领域普通技术人员熟知的技术分离或克隆所述多核苷酸(参见,例如,sambrook等,1989,见上文)。催化域本发明亦涉及分离的多肽,其包含催化域,所述催化域选自下组:(a)催化域,其与seqidno:2的催化域具有至少90%序列同一性;或催化域,其与seqidno:4的催化域具有至少80%序列同一性;(b)催化域,其由多核苷酸编码,所述多核苷酸与seqidno:1的催化域编码序列具有至少90%序列同一性;或催化域,其由多核苷酸编码,所述多核苷酸与seqidno:3的催化域编码序列具有至少80%序列同一性;(c)seqidno:2或seqidno:4的催化域的包含一个或多个(例如几个)氨基酸的取代、缺失和/或插入的催化域变体;和(d)(a)、(b)或(c)的催化域的具有纤维二糖水解酶活性的片段。所述催化域优选与seqidno:2的催化域具有至少90%,例如至少92%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性程度。在一个方面,所述催化域包含氨基酸序列,所述氨基酸序列与seqidno:2的催化域相差十个氨基酸,例如相差五个氨基酸、相差四个氨基酸,相差三个氨基酸、相差两个氨基酸相差一个氨基酸。所述催化域优选包含或组成为(consistof)seqidno:2的催化域或其等位变体;或为其具有纤维二糖水解酶活性的片段。在另一个方面,所述催化域包含或组成为seqidno:2的催化域。在另一个优选方面,所述催化域包含或组成为seqidno:2的氨基酸19至455。所述催化域与seqidno:4的催化域具有至少80%,例如至少85%,至少87%,至少90%,至少92%,至少95%,例如至少96%,至少97%,至少98%,至少99%,或100%的序列同一性程度。在一个方面,所述催化域包含氨基酸序列,所述氨基酸序列与seqidno:4的催化域相差十个氨基酸,例如相差五个氨基酸、相差四个氨基酸、相差三个氨基酸、相差两个氨基酸和相差一个氨基酸。所述催化域优选包含或组成为(consistof)seqidno:4的催化域或其等位变体;或为其具有纤维二糖水解酶活性的片段。在另一个方面,所述催化域包含或组成为seqidno:4的催化域。在另一个优选方面,所述催化域包含或组成为seqidno:4的氨基酸26至465。在一个实施方案中,所述催化域可由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件或非常高严格条件下(如上文定义),与以下杂交:(i)seqidno:1的催化域编码序列,(ii)seqidno:1的催化域编码序列中包含的cdna序列,或(iii)(i)或(ii)的全长互补链(j.sambrook等,1989,见上文)。所述催化域可由多核苷酸编码,所述多核苷酸与seqidno:1的催化域编码序列具有至少90%,例如至少92%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性程度,其编码具有纤维二糖水解酶活性的多肽。在一个方面,所述编码催化域的多核苷酸包含或组成为seqidno:1的核苷酸55至1507,或其cdna序列。具体而言,所述编码催化域的多核苷酸包含或组成为seqidno:1的核苷酸55至603,668至1235,1311至1507。在另一个实施方案中,所述催化域可由多核苷酸编码,所述多核苷酸在非常低严格条件,低严格条件,中等严格条件,中等-高严格条件,高严格条件或非常高严格条件下(如上文定义),与以下杂交:(i)seqidno:3的催化域编码序列,(ii)seqidno:3的基因组dna序列,或(iii)(i)或(ii)的全长互补链(j.sambrook等,1989,见上文)。所述催化域可由多核苷酸编码,所述多核苷酸与seqidno:3的催化域编码序列具有至少80%,例如至少85%,至少87%,至少90%,至少92%,至少95%,例如至少96%,至少97%,至少98%,至少99%,或100%的序列同一性程度,其编码具有纤维二糖水解酶活性的多肽。在一个方面,所述编码催化域的多核苷酸包含或组成为seqidno:3的核苷酸76至1395,或其cdna序列。多核苷酸本发明还涉及编码本发明多肽的分离的多核苷酸。用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组dna分离,从cdna制备,或其组合。可通过例如使用熟知的聚合酶链式反应(pcr)或表达文库的抗体筛选来检测具有共有结构特性的克隆dna片段,从而实现从这种基因组dna克隆多核苷酸。参见,例如,innis等,1990,pcr:aguidetomethodsandapplication,academicpress,newyork。可以使用其它核酸扩增方法,如连接酶链式反应(lcr)、连接活化转录(ligatedactivatedtranscription;lat)和基于多核苷酸的扩增(nasba)。可以从青霉属(penicillium)菌株,或相关生物体克隆所述多核苷酸,并且因此可为例如所述多核苷酸的多肽编码区的等位基因变体或种变体(speciesvariant)。本发明还涉及分离的多核苷酸,其包含或组成为下述多核苷酸,所述多核苷酸与seqidno:1的成熟多肽编码序列或其cdna序列具有至少90%,例如至少92%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性程度,其编码具有纤维二糖水解酶活性的多肽。本发明还涉及分离的多核苷酸,其包含或组成为下述多核苷酸,所述多核苷酸与seqidno:3的成熟多肽编码序列或其基因组dna序列具有至少80%,例如至少85%,至少87%,至少90%,至少92%,至少95%,例如至少96%,至少97%,至少98%,至少99%,或100%的序列同一性程度,其编码具有纤维二糖水解酶活性的多肽。修饰编码本发明多肽的多核苷酸对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适ph等方面不同的变体。可以在作为seqidno:1的成熟多肽编码序列或其cdna序列呈现的多核苷酸,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体:所述取代不导致多肽氨基酸序列的改变,但是符合意欲产生酶的宿主生物体的密码子使用;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,ford等,1991,proteinexpressionandpurification2:95-107。本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低严格条件、低严格条件、中等严格条件、中等-高严格条件、高严格条件或非常高严格条件下,与以下杂交:(i)seqidno:1的成熟多肽编码序列,(ii)包含于seqidno:1的成熟多肽编码序列的cdna序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(sambrook等,1989,见上文),如本文所定义的。在一个方面,所述多核苷酸包含或组成为seqidno:1,seqidno:1的成熟多肽编码序列,或编码seqidno:2的具有纤维二糖水解酶活性的片段的seqidno:1的亚序列,如seqidno:1的核苷酸55至1507的多核苷酸,以及它们的cdna序列。在另一个方面,所述多核苷酸包含或组成为seqidno:1的催化域编码序列,如seqidno:1的核苷酸55至603,668至1235,1311至1507。本发明亦涉及编码本发明的多肽的分离的多核苷酸,所述多核苷酸在非常低严格条件、低严格条件、中等严格条件、中等-高严格条件、高严格条件或非常高严格条件下,与以下杂交:(i)seqidno:3的成熟多肽编码序列,(ii)包含于seqidno:3的成熟多肽编码序列的基因组dna序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(sambrook等,1989,见上文),如本文所定义的。在一个方面,所述多核苷酸包含或组成为seqidno:3,seqidno:3的成熟多肽编码序列,或编码seqidno:4的具有纤维二糖水解酶活性的片段的seqidno:3的亚序列,如seqidno:3的核苷酸76至1614的多核苷酸,以及它们的基因组dna序列。在另一个方面,所述多核苷酸包含或组成为seqidno:3的催化域编码序列,如seqidno:3的核苷酸76至1395的多核苷酸,以及它们的基因组dna序列。核酸构建体本发明还涉及包含本发明的多核苷酸的核酸构建体,所述多核苷酸与一个或多个(几个)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。可以用许多方式操作所述多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸插入载体之前对其进行操作可能是理想的或必需的。使用重组dna方法修饰多核苷酸的技术是本领域熟知的。调控序列可为启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞所识别的多核苷酸。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何多核苷酸,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。用于在细菌宿主细胞中指导本发明的核酸构建体转录的合适启动子的实例是从下述获得的启动子:解淀粉芽孢杆菌(bacillusamyloliquefaciens)α-淀粉酶基因(amyq)、地衣芽孢杆菌(bacilluslicheniformis)α-淀粉酶基因(amyl)、地衣芽孢杆菌青霉素酶基因(penp)、嗜热脂肪芽孢杆菌(bacillusstearothermophilus)产麦芽淀粉酶基因(amym)、枯草芽孢杆菌(bacillussubtilis)果聚糖蔗糖酶基因(sacb)、枯草芽孢杆菌xyla和xylb基因、大肠杆菌lac操纵子、天蓝链霉菌(streptomycescoelicolor)琼脂糖酶基因(daga)和原核β-内酰胺酶基因(villa-kamaroff等,1978,proceedingsofthenationalacademyofsciencesusa75:3727-3731),以及tac启动子(deboer等,1983,proc.natl.acad.sci.usa80:21-25)。另外的启动子在"usefulproteinsfromrecombinantbacteria"于gilbert等,1980,scientificamerican,242:74-94中;和在sambrook等,1989,见上文中描述。用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子:构巢曲霉(aspergillusnidulans)乙酰胺酶、黑曲霉(aspergillusniger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(aspergillusawamori)葡糖淀粉酶(glaa)、米曲霉(aspergillusoryzae)taka淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢(fusariumoxysporum)胰蛋白酶样蛋白酶(wo96/00787)、镶片镰孢(fusariumvenenatum)淀粉葡糖苷酶(wo00/56900)、镶片镰孢daria(wo00/56900)、镶片镰孢quinn(wo00/56900)、曼赫根毛霉(rhizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉(trichodermareesei)β-葡糖苷酶、里氏木霉纤维二糖水解酶i、里氏木霉纤维二糖水解酶ii、里氏木霉内切葡聚糖酶i、里氏木霉内切葡聚糖酶ii、里氏木霉内切葡聚糖酶iii、里氏木霉内切葡聚糖酶iv、里氏木霉内切葡聚糖酶v、里氏木霉木聚糖酶i、里氏木霉木聚糖酶ii、里氏木霉β-木糖苷酶,以及na2-tpi启动子(一种修饰的启动子,其来自在曲霉属中编码中性α-淀粉酶的基因,其中未翻译的前导序列由在曲霉属(aspergilli)中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代;非限制性实例包括修饰的启动子,其来自在黑曲霉中编码中性α-淀粉酶的基因,其中未翻译的前导序列由在构巢曲霉或米曲霉中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代);和它们的突变的、截短的和杂合的启动子。在酵母宿主中,有用的启动子从如下酶的基因获得:酿酒酵母烯醇化酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh1,adh2/gap)、酿酒酵母丙糖磷酸异构酶(tpi)、酿酒酵母金属硫蛋白(cup1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由romanos等,1992,yeast8:423-488描述。调控序列也可以是合适的转录终止子序列,其由宿主细胞识别以终止转录。所述终止子序列与编码所述多肽的多核苷酸的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉taka淀粉酶和尖镰孢胰蛋白酶样蛋白酶。对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素c(cyc1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由romanos等,1992,见上文描述。调控序列还可以是合适的前导序列,当被转录时其为对于宿主细胞的翻译重要的mrna非翻译区。前导序列可操作地连接于编码多肽的多核苷酸的5’-末端。可使用在所选宿主细胞中有功能的任何前导序列。对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉taka淀粉酶和构巢曲霉丙糖磷酸异构酶。对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(eno-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh2/gap)。调控序列也可以是聚腺苷酸化序列,其是与多核苷酸的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mrna的信号。可使用在所选宿主细胞中有功能的任何聚腺苷酸化序列。对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉taka淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。对于酵母宿主细胞有用的聚腺苷酸化序列由guo和sherman,1995,mol.cellularbiol.15:5983-5990描述。调控序列还可以是信号肽编码区,其编码与多肽的n端相连的信号肽,并且指导所述多肽进入细胞分泌途径。多核苷酸的编码序列5’端可固有地包含信号肽编码序列,其与编码所述多肽的编码序列的区段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列异源的信号肽编码序列。异源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而,可使用指导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码序列。对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:芽孢杆菌属ncib11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprt,nprs,nprm)和枯草芽孢杆菌prsa。另外的信号肽由simonen和palva,1993,microbiologicalreviews57:109-137描述。对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉taka淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶v、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由romanos等,1992,见上文描述。调控序列还可以是前肽编码序列,其编码位于多肽n端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的,并且能够通过前肽的催化或自催化切割从前多肽转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(apre)、枯草芽孢杆菌中性蛋白酶(nprt)、嗜热毁丝霉漆酶(wo95/33836)、曼赫根毛霉天冬氨酸蛋白酶和酿酒酵母α因子的基因获得前肽编码序列。当信号肽和前肽序列二者均出现在多肽的n端时,将前肽序列置于紧接着(nextto)多肽n端,并且将信号肽序列置于紧接着前肽序列的n端。同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可使用adh2系统或gal1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉takaα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(withheavymetal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的多核苷酸将与调节序列可操作地连接。表达载体本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。多种核苷酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或取代编码多肽的多核苷酸。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述序列的多核苷酸或核酸构建体来表达所述多核苷酸。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达调控序列可操作地连接。重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组dna步骤,并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整dna(totaldna),或可以使用转座子(transposon)。所述载体优选地含有一个或多个(几个)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、氯霉素、卡那霉素或四环素抗性。对于酵母宿主细胞合适的标记是ade2、his3、leu2、lys2、met3、trp1和ura3。用于丝状真菌宿主细胞的选择性标记包括但不限于amds(乙酰胺酶)、argb(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niad(硝酸还原酶)(nitratereductase)、pyrg(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sc(硫酸腺苷酰转移酶)和trpc(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amds和pyrg基因和吸水链霉菌(streptomyceshygroscopicus)的bar基因。所述载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的多核苷酸,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应含有足够数量的核酸,如100至10,000碱基对、400至10,000碱基对800至10,000碱基对,其与相应的目标序列具有高度序列同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”意指能够使质粒或载体体内复制的多核苷酸。细菌复制起点的实例是允许在大肠杆菌中复制的质粒pbr322、puc19、pacyc177和pacyc184的复制起点,和允许在芽孢杆菌属中复制的质粒pub110、pe194、pta1060和pamβ1的复制起点。用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ars1,ars4,ars1和cen3的组合,和ars4和cen6的组合。在丝状真菌细胞中有用的复制起点的实例是ama1和ans1(gems等,1991,gene98:61-67;cullen等,1987,nucleicacidsres.15:9163-9175;wo00/24883)。分离ama1基因和构建包含该基因的质粒或载体能够根据公开于wo00/24883中的方法完成。可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,且由此含有多核苷酸的额外拷贝的细胞。用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,sambrook等,1989,见上文)。宿主细胞本发明还涉及重组宿主细胞,其包含本发明的多核苷酸可操作地连接于一个或多个(几个)指导本发明多肽的产生的调控序列。将包含多核苷酸的构建体或载体导入宿主细胞,使所述构建体或载体如前所述作为染色体整合体或者作为自复制的染色体外载体维持。术语“宿主细胞”包括亲本细胞的任何后代,其由于复制过程中发生的突变而不同于亲本细胞。宿主细胞的选择将在很大程度上依赖于编码多肽的基因及其来源。宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真核细胞。原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属(bacillus)、梭菌属(clostridium)、肠球菌属(enterococcus)、地芽孢杆菌属(geobacillus)、乳杆菌属(lactobacillus)、乳球菌属(lactococcus)、海洋芽孢杆菌属(oceanobacillus)、葡萄球菌属(staphylococcus)、链球菌属(streptococcus)和链霉菌属(streptomyces)。革兰氏阴性细菌包括但不限于,弯曲杆菌属(campylobacter)、大肠杆菌(e.coli)、黄杆菌属(flavobacterium)、梭杆菌属(fusobacterium)、螺杆菌属(helicobacter)、泥杆菌属(ilyobacter)、奈瑟氏菌属(neisseria)、假单胞菌属(pseudomonas)、沙门氏菌属(salmonella)和脲原体属(ureaplasma)。细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于嗜碱芽孢杆菌(bacillusalkalophilus)、解淀粉芽孢杆菌(bacillusamyloliquefaciens)、短芽孢杆菌(bacillusbrevis)、环状芽孢杆菌(bacilluscirculans)、克劳氏芽孢杆菌(bacillusclausii)、凝结芽孢杆菌(bacilluscoagulans)、坚强芽孢杆菌(bacillusfirmus)、灿烂芽孢杆菌(bacilluslautus)、迟缓芽孢杆菌(bacilluslentus)、地衣芽孢杆菌(bacilluslicheniformis)、巨大芽孢杆菌(bacillusmegaterium)、短小芽孢杆菌(bacilluspumilus)、嗜热脂肪芽孢杆菌(bacillusstearothermophilus)、枯草芽孢杆菌(bacillussubtilis)和苏云金芽孢杆菌(bacillusthuringiensis)细胞。细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于似马链球菌(streptococcusequisimilis)、酿脓链球菌(streptococcuspyogenes)、乳房链球菌(streptococcusuberis)和马链球菌兽瘟亚种(streptococcusequisubsp.zooepidemicus)细胞。细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于不产色链霉菌(streptomycesachromogenes)、除虫链霉菌(streptomycesavermitilis)、天蓝链霉菌(streptomycescoelicolor)、灰色链霉菌(streptomycesgriseus)和浅青紫链霉菌(streptomyceslividans)细胞。可通过如下方法实现将dna引入到芽孢杆菌属细胞:例如原生质体转化(参见,例如,chang和cohen,1979,mol.gen.genet.168:111-115),使用感受态细胞(参见,例如,young和spizizen,1961,j.bacteriol.81:823-829或dubnau和davidoff-abelson,1971,j.mol.biol.56:209-221),电穿孔(参见,例如,shigekawa和dower,1988,biotechniques6:742-751)或接合(参见,例如,koehler和thorne,1987,j.bacteriol.169:5771-5278)。可通过如下方法实现将dna引入到大肠杆菌细胞:例如原生质体转化(参见,例如,hanahan,1983,j.mol.biol.166:557-580)或电穿孔(参见,例如,dower等,1988,nucleicacidsres.16:6127-6145)。可通过如下方法实现将dna引入到链霉菌属细胞:例如原生质体转化和电穿孔(参见,例如,gong等,2004,foliamicrobiol.(praha)49:399-405),接合(参见,例如,mazodier等,1989,j.bacteriol.171:3583-3585),或转导(参见,例如,burke等,2001,proc.natl.acad.sci.usa98:6289-6294)。可通过如下方法实现将dna引入到假单胞菌属细胞:例如电穿孔(参见,例如,choi等,2006,j.microbiol.methods64:391-397)或接合(参见,例如,pinedo和smets,2005,appl.environ.microbiol.71:51-57)。可通过如下方法实现将dna引入到链球菌属细胞:例如天然感受态(naturalcompetence)(参见,例如,perry和kuramitsu,1981,infect.immun.32:1295-1297),原生质体转化(参见,例如,catt和jollick,1991,microbios.68:189-207),电穿孔(参见,例如,buckley等,1999,appl.environ.microbiol.65:3800-3804)或接合(参见,例如,clewell,1981,microbiol.rev.45:409-436)。然而,可以使用本领域已知的将dna引入宿主细胞的任何方法。宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。宿主细胞可为真菌细胞。“真菌”用在本文包括以下门:子囊菌门(ascomycota)、担子菌门(basidiomycota)、壶菌门(chytridiomycota)和接合菌门(zygomycota)(如由hawksworth等,于ainsworthandbisby’sdictionaryofthefungi,第8版,1995,cabinternational,universitypress,cambridge,uk中所定义)以及卵菌门(oomycota)(如hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporicfungi)(hawksworth等,1995,见上文)。真菌宿主细胞可为酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内孢霉目(endomycetales))、产担子酵母(basidiosporogenousyeast)和属于半知菌类(fungiimperfecti)(芽孢纲(blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如biologyandactivitiesofyeast(skinner,f.a.,passmore,s.m.,和davenport,r.r.编,soc.app.bacteriol.symposiumseriesno.9,1980)中所述。酵母宿主细胞可假丝酵母属(candida)、汉逊酵母属(hansenula)、克鲁维酵母属(kluyveromyces)、毕赤酵母属(pichia)、酵母属(saccharomyces)、裂殖酵母属(schizosaccharomyces)或西洋蓍霉属(yarrowia)细胞,如乳酸克鲁维酵母(kluyveromyceslactis)、卡尔酵母(saccharomycescarlsbergensis)、酿酒酵母(saccharomycescerevisiae)、糖化酵母(saccharomycesdiastaticus)、道格拉氏酵母(saccharomycesdouglasii)、克鲁弗酵母(saccharomyceskluyveri)、诺地酵母(saccharomycesnorbensis)、卵形酵母(saccharomycesoviformis)或解脂西洋蓍霉(yarrowialipolytica)细胞。真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(eumycota)和卵菌门的亚门(如由hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖构成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。丝状真菌宿主细胞可为枝顶孢霉属(acremonium)、曲霉属(aspergillus)、短梗霉属(aureobasidium)、烟管霉属(bjerkandera)、拟蜡菌属(ceriporiopsis)、金孢子菌属(chrysosporium)、鬼伞属(coprinus)、革盖菌属(coriolus)、隐球菌属(cryptococcus)、filibasidium、镰孢属(fusarium)、腐质霉属(humicola)、梨孢菌属(magnaporthe)、毛霉属(mucor)、毁丝霉属(myceliophthora)、新考玛脂霉属(neocallimastix)、脉孢菌属(neurospora)、拟青霉属(paecilomyces)、青霉属(penicillium)、平革菌属(phanerochaete)、射脉菌属(phlebia)、瘤胃壶菌属(piromyces)、侧耳属(pleurotus)、裂褶菌属(schizophyllum)、踝节菌属(talaromyces)、嗜热子囊菌属(thermoascus)、梭孢壳属(thielavia)、弯颈霉属(tolypocladium)、栓菌属(trametes)或木霉属(trichoderma)细胞。例如,丝状真菌宿主细胞可为泡盛曲霉(aspergillusawamori)、烟曲霉(aspergillusfumigatus)、臭曲霉(aspergillusfoetidus)、日本曲霉(aspergillusjaponicus)、构巢曲霉(aspergillusnidulans)、黑曲霉(aspergillusniger)、米曲霉(aspergillusoryzae)、黑刺烟管菌(bjerkanderaadusta)、干拟蜡菌(ceriporiopsisaneirina)、ceriporiopsiscaregiea、ceriporiopsisgilvescens、ceriporiopsispannocinta、ceriporiopsisrivulosa、ceriporiopsissubrufa、虫拟蜡菌(ceriporiopsissubvermispora)、chrysosporiuminops、嗜角质金孢子菌(chrysosporiumkeratinophilum)、chrysosporiumlucknowense、chrysosporiummerdarium、毡金孢子菌(chrysosporiumpannicola)、chrysosporiumqueenslandicum、热带金孢子菌(chrysosporiumtropicum)、chrysosporiumzonatum、灰盖鬼伞(coprinuscinereus)、毛革盖菌(coriolushirsutus)、杆孢状镰孢(fusariumbactridioides)、禾谷镰孢(fusariumcerealis)、库威镰孢(fusariumcrookwellense)、大刀镰孢(fusariumculmorum)、禾本科镰孢(fusariumgraminearum)、禾赤镰孢(fusariumgraminum)、异孢镰孢(fusariumheterosporum)、合欢木镰孢(fusariumnegundi)、尖镰孢(fusariumoxysporum)、多枝镰孢(fusariumreticulatum)、粉红镰孢(fusariumroseum)、接骨木镰孢(fusariumsambucinum)、肤色镰孢(fusariumsarcochroum)、拟分枝孢镰孢(fusariumsporotrichioides)、硫色镰孢(fusariumsulphureum)、圆镰孢(fusariumtorulosum)、拟丝孢镰孢(fusariumtrichothecioides)、镶片镰孢(fusariumvenenatum)、特异腐质霉(humicolainsolens)、疏棉状腐质霉(humicolalanuginosa)、米黑毛霉(mucormiehei)、嗜热毁丝霉(myceliophthorathermophila)、粗糙脉孢菌(neurosporacrassa)、产紫青霉(penicilliumpurpurogenum)、黄孢平革菌(phanerochaetechrysosporium)、辐射射脉菌(phlebiaradiata)、刺芹侧耳(pleurotuseryngii)、土生梭孢霉(thielaviaterrestris)、长绒毛栓菌(trametesvillosa)、变色栓菌(trametesversicolor)、哈茨木霉(trichodermaharzianum)、康宁木霉(trichodermakoningii)、长枝木霉(trichodermalongibrachiatum)、里氏木霉(trichodermareesei)或绿色木霉(trichodermaviride)细胞。可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在ep238023,yelton等,1984,proc.natl.acad.sci.usa81:1470-1474,和christensen等,1988,bio/technology6:1419-1422中描述。用于转化镰孢属菌种的合适方法由malardier等,1989,gene78:147-156和wo96/00787描述。可以使用由如下文献描述的方法转化酵母:becker和guarente,于abelson,j.n.和simon,m.i.编,guidetoyeastgeneticsandmolecularbiology,methodsinenzymology,volume194,pp182-187,academicpress,inc.,newyork;ito等,1983,j.bacteriol.153:163;和hinnen等,1978,proc.natl.acad.sci.usa75:1920。产生方法本发明还涉及用于产生本发明多肽的方法,其包括:(a)在有助于产生所述多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。在一个优选的方面,所述细胞是踝节菌属的细胞。在一个更优选的方面,所述细胞是talaromycesbyssochlamydoides。在一个最优选的方面,所述细胞是talaromycesbyssochlamydoides菌株cbs413.71。本发明还涉及用于产生本发明的多肽的方法,其包括:(a)在有助于产生所述多肽的条件下培养本发明的重组宿主细胞;和(b)回收所述多肽。使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌,则其能够从细胞裂解物(lysate)回收。可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzymeassay)可用于测定多肽的活性。多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、sds-page或提取(参见,例如,proteinpurification,j.-c.janson和larsryden编,vchpublishers,newyork,1989)。在一个可选的方面,不回收多肽,而将表达所述多肽的本发明宿主细胞作为多肽的来源。植物本发明还涉及分离的植物,例如,转基因植物、植物部分或植物细胞,其包含本发明的分离的多核苷酸,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有所述多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheologicalproperties),或用于破坏抗营养因子。转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadowgrass)(蓝草(bluegrass),早熟禾属(poa));饲用牧草(foragegrass)如羊茅属(festuca)、黑麦草属(lolium);寒地型牧草(temperategrass),如agrostis(翦股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugarbeet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(familybrassicaceae)),如花椰菜(cauliflower),油菜籽(rapeseed)和紧密相关的模型生物体拟南芥(arabidopsisthaliana)。植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seedcoat)。同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的后代。表达多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞:将编码多肽的一个或多个(几个)表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的经修饰的植物或植物细胞繁殖为转基因植物或植物细胞。表达构建体便利地是包含编码多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定宿主细胞有用的选择性标记,在所述宿主细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的dna序列(后者依赖于使用的dna引入方法)。调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如tague等,1988,plantphysiology86:506所述。对于组成性表达,可以使用35s-camv、玉米泛素1和稻肌动蛋白1启动子(franck等,1980,cell21:285-294,christensen等,1992,plantmo.biol.18:675-689;zhang等,1991,plantcell3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesinktissue)例如种子、马铃薯块茎和果实的启动子(edwards和coruzzi,1990,ann.rev.genet.24:275-303),或来自代谢库组织(metabolicsinktissue)例如分生组织的启动子(ito等,1994,plantmol.biol.24:863-878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(wu等,1998,plantcellphysiol.39:885-889),来自豆球蛋白(legumin)b4和蚕豆(viciafaba)的未知的种子蛋白基因的蚕豆启动子(conrad等,1998,j.ofplantphysiol.152:708-711)、来自种子油体蛋白(oilbodyprotein)的启动子(chen等,1998,plantcellphysiol.39:935-941),来自欧洲油菜(brassicanapus)的贮藏蛋白napa启动子,或本
技术领域
:公知的任何其他种子特异性的启动子,例如,在wo91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(kyozuka等,1993,plantphysiology102:991-1000),小球藻病毒(chlorellavirus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(mitra和higgins,1994,plantmol.biol.26:85-93),来自稻的aldp基因启动子(kagaya等,1995,mol.gen.genet.248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(xu等,1993,plantmol.biol.22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脱落酸(abscisicacid)和赤霉酸(gibberellicacid),和重金属。启动子增强子元件也可以用于实现多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码多肽的多核苷酸之间。例如xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(gasser等,1990,science244:1293;potrykus,1990,bio/technology8:535;shimamoto等,1989,nature338:274)。根癌土壤杆菌(agrobacteriumtumefaciens)介导的基因转移(genetransfer)是产生转基因双子叶植物的方法(为了参考,见hooykas和schilperoort,1992,plantmol.biol.19:15-38),而且它也可用于转化单子叶植物,虽然对于这些植物其他的转化方法是常用的。产生转基因单子叶植物的方法,是用粒子(用转化dna涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryoniccalli)或发育中的胚(developingembryos)(christou,1992,plantj.2:275-281;shimamoto,1994,currentopin.biotech.5:158-162;vasil等,1992,bio/technology10:667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由omirulleh等,1993,plantmol.biol.21:415-428所描述的。其他用于依照本公开使用的转化方法包括那些描述于美国专利6,395,966和7,151,204的那些(两者均通过提述全文并入本文)。转化之后,根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两个独立的t-dna构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。除了用根据本发明制备的构建体直接转化具体植物基因型之外,还可通过将具有所述构建体的植物与缺乏该构建体的第二植物杂交来制备转基因植物。举例而言,可将编码多肽的构建体通过杂交而引入特定植物品种,而根本无需直接转化该给定品种的植物。因此,本发明不仅涵盖从依照本发明经转化的细胞直接再生的植物,还包括此类植物的后代(progeny)。如用于本文,后代可指依照本发明制备的亲本植物任何世代的后裔(offspring)。此种后代可包含依据本发明制备的dna构建体,或依据本发明制备的dna构建体的一部分。杂交导致转基因通过将起始种系与供体植物种系交叉授粉而引入植物种系。此类步骤的非限制性实例进一步阐述于美国专利7,151,204号。植物可通过回交转化方法生成。举例而言,植物包括称作回交转化的基因型、种系、近交体(inbred)或杂交体(hybrid)的植物。可使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景基因渗入(introgression)至另一个。标记协助的选择提供了相对于常规育种的优势,在于其可用于避免由表型变异导致的错误。进一步,遗传标记可在特定杂交的个体后代中提供有关良种种质相对程度的数据。举例而言,当具有所需性状但除此之外(otherwise)具有非农艺学所需的遗传背景的植物与良种亲本杂交时,可使用遗传标记来选择不仅具有该目标性状,还具有相对较大比例所需种质的后代。以此方式,使一种或多种性状基因渗入特定遗传背景所需的世代数得到最小化。本发明还涉及产生本发明多肽的方法,包括:(a)在有助于产生所述多肽的条件下培养包含编码所述多肽的多核苷酸的转基因植物或植物细胞;和(b)回收所述多肽。组合物本发明还涉及包含本发明多肽的酶组合物。优选地,所述组合物富集此种多肽。术语“富集”表明组合物的纤维二糖水解酶活性,例如,以至少1.1的富集因数(enrichmentfactor)增加。所述组合物可以包含本发明的多肽作为主要酶成分,例如,单成分组合物。或者,所述组合物可以包含多种酶活性,如一种或多种(几种)选自下组的酶:纤维素酶、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。在一个优选实施方案中,所述酶组合物包含至少本发明的纤维二糖水解酶,至少一种内切葡聚糖酶、至少一种β-葡糖苷酶和至少一种具有纤维素分解增强活性的gh61多肽。可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法使包含于所述组合物中的多肽稳定化。酶组合物可包含任何可用于降解或转化纤维素材料的蛋白。在一个方面,所述酶组合物包含或进一步包含一种或多种(几种)选自下组的蛋白:纤维素酶、具有纤维素分解增强活性的gh61多肽,半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。在另一个方面,所述纤维素酶优选为一种或多种(几种)选自下组的酶:内切葡聚糖酶、其它纤维二糖水解酶和β-葡糖苷酶。在另一个方面,所述半纤维素酶优选为一种或多种(几种)选自下组的酶:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。在另一个方面,所述酶组合物包含一种或多种(几种)纤维素分解酶。在另一个方面,所述酶组合物包含或进一步包含一种或多种(几种)半纤维素分解酶。在另一个方面,所述酶组合物包含一种或多种(几种)纤维素分解酶和一种或多种(几种)半纤维素分解酶。在另一个方面,所述酶组合物包含一种或多种(几种)选自下组的酶:纤维素分解酶和半纤维素分解酶。在另一个方面,所述酶组合物包含内切葡聚糖酶。在另一个方面,所述酶组合物包含纤维二糖水解酶。在另一个方面,所述酶组合物包含β-葡糖苷酶。在另一个方面,所述酶组合物包含具有纤维素分解增强活性的gh61多肽。在另一个方面,所述酶组合物包含内切葡聚糖酶和纤维二糖水解酶。在另一个方面,所述酶组合物包含内切葡聚糖酶和β-葡糖苷酶。在另一个方面,所述酶组合物包含纤维二糖水解酶和β-葡糖苷酶。在另一个方面,所述酶组合物包含内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在另一个方面,所述酶组合物包含内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶和具有纤维素分解增强活性的gh61多肽。在另一个方面,所述酶组合物包含乙酰甘露聚糖酯酶。在另一个方面,所述酶组合物包含乙酰木聚糖酯酶。在另一个方面,所述酶组合物包含阿拉伯聚糖酶(例如α-l-阿拉伯聚糖酶)。在另一个方面,所述酶组合物包含阿拉伯呋喃糖苷酶(例如α-l-阿拉伯呋喃糖苷酶)。在另一个方面,所述酶组合物包含香豆酸酯酶。在另一个方面,所述酶组合物包含阿魏酸酯酶。在另一个方面,所述酶组合物包含半乳糖苷酶(例如α-半乳糖苷酶和/或β-半乳糖苷酶)。在另一个方面,所述酶组合物包含葡糖醛酸糖苷酶(例如α-d-葡糖醛酸糖苷酶)。在另一个方面,所述酶组合物包含葡糖醛酸酯酶。在另一个方面,所述酶组合物包含甘露聚糖酶。在另一个方面,所述酶组合物包含甘露糖苷酶(例如β-甘露糖苷酶)。在另一个方面,所述酶组合物包含木聚糖酶。在一个优选的方面,所述木聚糖酶是家族10木聚糖酶。在另一个方面,所述酶组合物包含木糖苷酶(例如β-木糖苷酶)。另一个方面,所述酶组合物包含棒曲霉素。在另一个方面,所述酶组合物包含酯酶。在另一个方面,所述酶组合物包含漆酶。在另一个方面,所述酶组合物包含木质素分解酶。在一个优选的方面,所述木质素分解酶是锰过氧化物酶。在另一个优选的方面,所述木质素分解酶是木质素过氧化物酶。在另一个优选的方面,所述木质素分解酶是产生h2o2的酶。在另一个方面,所述酶组合物包含果胶酶。在另一个方面,所述酶组合物包含过氧化物酶。在另一个方面,所述酶组合物包含蛋白酶。在另一个方面,所述酶组合物包含膨胀素。在本发明的方法中,酶可在发酵之前或过程中添加,例如在糖化过程中,或在发酵生物繁殖过程中或之后添加。所述酶组合物的一种或多种(几种)组分可为野生型蛋白、重组蛋白或野生型蛋白和重组蛋白的组合。举例而言,一种或多种(几种)组分可为细胞的天然蛋白,其用作宿主细胞以重组表达酶组合物的一种或多种(几种)其他组分。酶组合物的一种或多种(几种)组分可作为单组分产生,然后将其组合以形成酶组合物。所述酶组合物可为多组分和单组分蛋白制备物的组合。用于本发明方法中的酶可为任何适于使用的形式,如例如去除或不去除细胞的发酵原液,含或不含细胞碎片的细胞裂解液,半纯化或纯化的酶制备物,或宿主细胞,作为酶的来源。所述酶组合物可为干粉或颗粒,无粉尘的颗粒,液体,稳定化液体或稳定化受保护的酶。液体酶制备物可根据确立的工艺,例如通过添加稳定剂如糖、糖醇或其他多元醇,和/或乳酸或其他有机酸来稳定化。具有纤维二糖水解酶活性的酶和多肽的最适量取决于几个因素,其包括但不限于,组分纤维素分解酶的混合物、纤维素材料、纤维素材料的浓度、纤维素材料的预处理、温度、时间、ph和包括发酵生物体(例如,同步糖化和发酵的酵母)。在一个优选的方面,纤维素分解酶对于纤维素材料的有效量是约0.5至约50mg,优选约0.5至约40mg,更优选约0.5至约25mg,更优选约0.75至约20mg,更优选约0.75至约15mg,甚至更优选约0.5至约10mg,并且最优选约2.5至约10mg每g纤维素材料。在另一个优选的方面,具有纤维二糖水解酶活性的多肽对于纤维素材料的有效量是约0.01至约50.0mg,优选约0.01至约40mg,更优选约0.01至约30mg,更优选约0.01至约20mg,更优选约0.01至约10mg,更优选约0.01至约5mg,更优选约0.025至约1.5mg,更优选约0.05至约1.25mg,更优选约0.075至约1.25mg,更优选约0.1至约1.25mg,甚至更优选约0.15至约1.25mg,并且最优选约0.25至约1.0mg每g纤维素材料。在另一个优选的方面,具有纤维二糖水解酶活性的多肽对于纤维素分解酶的有效量是约0.005至约1.0g,优选约0.01至约1.0g,更优选约0.15至约0.75g,更优选约0.15至约0.5g,更优选约0.1至约0.5g,甚至更优选约0.1至约0.5g,并且最优选约0.05至约0.2g每g纤维素分解酶。具有纤维素分解酶活性或半纤维素分解酶活性的多肽,以及其它可用于纤维素材料的降解的蛋白/多肽,例如具有纤维素分解增强活性的多肽(在本文中称为具有酶活性的多肽)可源自或获得自任何合适的来源,包括细菌、真菌、酵母、植物或哺乳动物来源。术语“获得的”在本文中意指所述酶可从将该酶作为天然酶天然产生的生物体分离。术语“获得的”在本文中还意指该酶可在宿主生物中使用本文中所述的方法重组产生,其中经重组产生的酶对于宿主生物是天然的或异源的,或具有修饰的氨基酸序列,例如,具有一个或多个(几个)缺失、插入和/或取代的氨基酸,即重组产生的酶,其为天然氨基酸序列的片段和/或突变体或通过本领域已知的氨基酸改组方法产生的酶。天然酶的含义中涵盖的是天然变体,而外来酶的含义中涵盖的是重组(如通过定位诱变或改组)获得的变体。所述酶组合物的一种或多种(几种)组分可以是重组组分,亦即,通过克隆编码所述单独组分的dna序列并随后用该dna序列转化细胞并在宿主中表达(参见,例如,wo91/17243和wo91/17244)产生。所述宿主优选是异源宿主(酶对宿主是异源的),但该宿主在一定条件下也可以是同源宿主(酶对宿主是天然的)。单组分纤维素分解蛋白还可以通过从发酵液中提纯这样的蛋白来制备。在一个方面,所述一种或多种(几种)纤维素分解酶包括商业性纤维素分解酶制备物。适用于本发明的商业的纤维素分解酶制备物的实例包括,例如,cellictmctec(novozymesa/s)、cellictmctec2(novozymesa/s)、celluclasttm(novozymesa/s)、novozymtm188(novozymesa/s)、celluzymetm(novozymesa/s)、cereflotm(novozymesa/s)和ultraflotm(novozymesa/s),accelerasetm(genencorint.)、laminextm(genencorint.)、spezymetmcp(genencorint.),rohamenttm7069w(gmbh),ldi(dyadicinternational,inc.)、lbr(dyadicinternational,inc.)或150l(dyadicinternational,inc.)。所述纤维素酶以固体的约0.001到约5.0wt%,更优选固体的约0.025到约4.0wt%,且最优选固体的约0.005到约2.0wt%的有效量添加。可以用于本发明的方法的细菌内切葡聚糖酶的实例包括但不仅限于,解纤维热酸菌(acidothermuscellulolyticus)内切葡聚糖酶(wo91/05039;wo93/15186;美国专利5,275,944;wo96/02551;美国专利5,536,655,wo00/70031,wo05/093050);thermobifidafusca内切葡聚糖酶iii(wo05/093050);和thermobifidafusca内切葡聚糖酶v(wo05/093050)。可以用于本发明的真菌内切葡聚糖酶的实例包括但不仅限于,里氏木霉内切葡聚糖酶i(penttila等,1986,gene45:253-263;里氏木霉cel7b内切葡聚糖酶i;genbanktm登录号m15665);里氏木霉内切葡聚糖酶ii(saloheimo等,1988,gene63:11-22;里氏木霉cel5a内切葡聚糖酶ii;genbanktm登录号m19373);里氏木霉内切葡聚糖酶iii(okada等,1988,appl.environ.microbiol.64:555-563;genbanktm登录号ab003694);里氏木霉内切葡聚糖酶v(saloheimo等,1994,molecularmicrobiology13:219-228;genbanktm登录号z33381);棘孢曲霉内切葡聚糖酶(ooi等,1990,nucleicacidsresearch18:5884);川地曲霉(aspergilluskawachii)内切葡聚糖酶(sakamoto等,1995,currentgenetics27:435-439);胡萝卜软腐欧文氏菌(erwiniacarotovara)内切葡聚糖酶(saarilahti等,1990,gene90:9-14);尖镰孢内切葡聚糖酶(genbanktm登录号l29381);灰腐质霉thermoidea变种内切葡聚糖酶(genbanktm登录号ab003107);melanocarpusalbomyces内切葡聚糖酶(genbanktm登录号mal515703);粗糙脉孢菌内切葡聚糖酶(genbanktm登录号xm_324477);特异腐质霉内切葡聚糖酶v;嗜热毁丝霉cbs117.65内切葡聚糖酶;担子菌纲(basidiomycete)cbs495.95内切葡聚糖酶;担子菌纲cbs494.95内切葡聚糖酶;土生梭孢霉nrrl8126cel6b内切葡聚糖酶;土生梭孢霉nrrl8126cel6c内切葡聚糖酶;土生梭孢霉nrrl8126cel7c内切葡聚糖酶;土生梭孢霉nrrl8126cel7e内切葡聚糖酶;土生梭孢霉nrrl8126cel7f内切葡聚糖酶;cladorrhinumfoecundissimumatcc62373cel7a内切葡聚糖酶;以及里氏木霉菌株no.vtt-d-80133内切葡聚糖酶(genbanktm登录号m15665)。可用于生物质水解的其它纤维二糖水解酶的实例包括但不仅限于,里氏木霉纤维二糖水解酶i;里氏木霉纤维二糖水解酶ii;特异腐质霉纤维二糖水解酶i;嗜热毁丝霉纤维二糖水解酶ii;土生梭孢霉纤维二糖水解酶ii(cel6a);嗜热毛壳菌(chaetomiumthermophilum)纤维二糖水解酶i;以及嗜热毛壳菌纤维二糖水解酶ii。可用于本发明的β-葡糖苷酶的实例包括但不仅限于米曲霉β-葡糖苷酶;烟曲霉β-葡糖苷酶;巴西青霉(penicilliumbrasilianum)ibt20888β-葡糖苷酶;黑曲霉β-葡糖苷酶;以及棘孢曲霉β-葡糖苷酶。具有具有β-葡糖苷酶活性的米曲霉多肽可根据wo2002/095014获取。具有β-葡糖苷酶活性的烟曲霉多肽可根据wo2005/047499获取。具有β-葡糖苷酶活性的巴西青霉多肽可根据wo2007/019442获取。具有β-葡糖苷酶活性的黑曲霉多肽可根据dan等,2000,j.biol.chem.275:4973-4980获取。具有β-葡糖苷酶活性的棘孢曲霉多肽可根据kawaguchi等,1996,gene173:287-288获取。β-葡糖苷酶可为融合蛋白。在一个方面,所述β-葡糖苷酶为根据wo2008/057637获得的米曲霉β-葡糖苷酶融合蛋白或米曲霉β-葡糖苷酶变体bg融合蛋白。其它可用的内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶使用根据henrissat,1991,aclassificationofglycosylhydrolasesbasedonamino-acidsequencesimilarities,biochem.j.280:309-316和henrissat和bairoch,1996,updatingthesequence-basedclassificationofglycosylhydrolases,biochem.j.316:695-696的分类公开于许多糖基水解酶家族中。其它可用于本发明的纤维素分解酶描述于ep495,257、ep531,315、ep531,372、wo89/09259、wo94/07998、wo95/24471、wo96/11262、wo96/29397、wo96/034108、wo97/14804、wo98/08940、wo98/012307、wo98/13465、wo98/015619、wo98/015633、wo98/028411、wo99/06574、wo99/10481、wo99/025846、wo99/025847、wo99/031255、wo2000/009707、wo2002/050245、wo2002/0076792、wo2002/101078、wo2003/027306、wo2003/052054、wo2003/052055、wo2003/052056、wo2003/052057、wo2003/052118、wo2004/016760、wo2004/043980、wo2004/048592、wo2005/001065、wo2005/028636、wo2005/093050、wo2005/093073、wo2006/074005、wo2006/117432、wo2007/071818、wo2007/071820、wo2008/008070、wo2008/008793、美国专利no.4,435,307、美国专利no.5,457,046、美国专利no.5,648,263、美国专利no.5,686,593、美国专利no.5,691,178、美国专利no.5,763,254以及美国专利no.5,776,757。在本发明的方法中,可使用任何具有纤维素分解增强活性的gh61多肽。可用于本发明的方法的具有纤维素分解增强活性的多肽的实例包括但不限于来自土生梭孢霉的具有纤维素分解增强活性的多肽(wo2005/074647);来自桔橙嗜热子囊菌的具有纤维素分解增强活性的多肽(wo2005/074656);来自里氏木霉的具有纤维素分解增强活性的多肽(wo2007/089290);和来自嗜热毁丝霉的具有纤维素分解增强活性的多肽(wo2009/085935,wo2009/085859,wo2009/085864,wo2009/085868)。在一个方面,所述一个或多个(几个)半纤维素分解酶包含商业性半纤维素分解酶制备物。适用于本发明的商业性半纤维素分解酶制备物的实例包括,例如shearzymetm(novozymesa/s)、cellictmhtec(novozymesa/s)、cellictmhtec2(novozymesa/s)、(novozymesa/s)、(novozymesa/s)、hc(novozymesa/s)、xylanase(genencor)、tx-200a(abenzymes)、hsp6000xylanase(dsm)、depoltm333p(biocatalystslimit,wales,uk)、depoltm740l.(biocatalystslimit,wales,uk)和depoltm762p(biocatalystslimit,wales,uk)。可用于本发明方法的木聚糖酶的实例包括但不限于棘孢曲霉(aspergillusaculeatus)木聚糖酶(geneseqp:aar63790;wo94/21785)、烟曲霉(aspergillusfumigatus)木聚糖酶(wo2006/078256)和土生梭孢霉(thielaviaterrestris)nrrl8126木聚糖酶(wo2009/079210)。可用于本发明方法的β-木糖苷酶的实例包括但不限于里氏木霉(trichodermareesei)β-木糖苷酶(uniprotkb/trembl登录号q92458)、埃默森踝节菌(talaromycesemersonii)(swissprot登录号q8x212)和粗糙脉孢菌(neurosporacrassa)(swissprot登录号q7sow4)。可用于本发明方法的乙酰木聚糖酯酶的实例包括但不限于红褐肉座菌(hypocreajecorina)乙酰木聚糖酯酶(wo2005/001036)、粗糙脉孢菌乙酰木聚糖酯酶(uniprot登录号q7s259)、土生梭孢霉nrrl8126乙酰木聚糖酯酶(wo2009/042846)、球毛壳菌(chaetomiumglobosum)乙酰木聚糖酯酶(uniprot登录号q2gwx4)、细丽毛壳菌(chaetomiumgracile)乙酰木聚糖酯酶(geneseqp登录号aab82124)、颖枯壳针孢(phaeosphaerianodorum)乙酰木聚糖酯酶(uniprot登录号q0uhj1)和特异腐质霉(humicolainsolens)dsm1800乙酰木聚糖酯酶(wo2009/073709)。可用于本发明方法的阿魏酸酯酶的实例包括但不限于特异腐质霉dsm1800阿魏酸酯酶(wo2009/076122)、粗糙脉孢菌阿魏酸酯酶(uniprot登录号q9hgr3)和费希新萨托菌(neosartoryafischer)阿魏酸酯酶(uniprot登录号a1d9t4)。可用于本发明方法的阿拉伯呋喃糖苷酶的实例包括但不限于特异腐质霉(humicolainsolens)dsm1800阿拉伯呋喃糖苷酶(wo2009/073383)和黑曲霉(aspergillusniger)阿拉伯呋喃糖苷酶(geneseqp登录号aar94170)。可用于本发明方法的α-葡糖醛酸糖苷酶的实例包括但不限于棒曲霉(aspergillusclavatus)α-葡糖醛酸糖苷酶(uniprot登录号alcc12)、里氏木霉α-葡糖醛酸糖苷酶(uniprot登录号q99024)、埃默森踝节菌α-葡糖醛酸糖苷酶(uniprot登录号q8x211)、黑曲霉α-葡糖醛酸糖苷酶(uniprot登录号q96wx9)、土曲霉(aspergillusterreus)α-葡糖醛酸糖苷酶(swissprot登录号q0cjp9)和烟曲霉α-葡糖醛酸糖苷酶(swissprot登录号q4ww45)。用于本发明方法的酶和蛋白可通过使用本领域已知方法(参见,例如bennett,j.w.和lasure,l.(编),moregenemanipulationsinfungi,academicpress,ca,1991),在含有合适碳源和氮源和无机盐的营养培养基上发酵上述指出的微生物菌株来产生。合适的培养基可从供应商获得,或可根据已公开的组成制备(例如美国典型培养物保藏中心的目录)。适于生长和酶产生的温度范围和其他条件在本领域是已知的(参见,例如bailey,j.e.和ollis,d.f.,biochemicalengineeringfundamentals,mcgraw-hillbookcompany,ny,1986)。所述发酵可以是任何其结果为表达或分离酶或蛋白的培养细胞的方法。因此,发酵可以理解为包括在合适的培养基中并在允许所述酶得以表达或分离的条件下进行的摇瓶培养,或在实验室或工业发酵罐中的小-或大规模发酵(包括连续、分批、补料分批或固态发酵)。通过上述方法产生的所得的酶可从发酵培养基回收并通过常规方法纯化。下面给出本发明的多肽组合物的优选用途。本发明的多肽组合物的剂量和其他使用所述组合物的条件可基于本领域已知方法来确定。用途本发明还涉及下述使用具有纤维二糖水解酶活性的多肽或其组合物的方法。本发明还涉及降解或转化纤维素材料的方法,包括:在本发明的具有纤维二糖水解酶的多肽的存在下用酶组合物处理纤维素材料。在一个方面,对所述纤维素材料进行预处理。在另一个方面,所述方法还包括回收经降解或转化的纤维素材料。纤维素材料的降解或转化的可溶性产物可从不溶性纤维素材料使用本领域中公知的技术如例如离心、过滤和重力沉降来分离。本发明还涉及产生发酵产物的方法,其包括:(a)在存在本发明的具有纤维二糖水解酶的多肽的条件下,用酶组合物糖化纤维素材料;(b)用一种或多种(几种)发酵微生物发酵经糖化的纤维素材料以产生发酵产物;和(c)从发酵回收发酵产物。本发明还涉及发酵纤维素材料的方法,其包括:用一种或多种(几种)发酵微生物发酵纤维素材料,其中在存在本发明的具有纤维二糖水解酶的多肽的条件下,用酶组合物糖化纤维素材料。在一个方面,纤维素材料的发酵产生发酵产物。在另一个方面,所述方法进一步包括从发酵回收发酵产物。本发明的方法可用于将纤维素材料糖化为可发酵的糖,并将可发酵的糖转化为许多有用物质,例如燃料、饮用乙醇和/或发酵产物(例如酸、醇、酮、气体等)。从纤维素材料产生所需的发酵产物通常涉及预处理、酶水解(糖化)和发酵。根据本发明的纤维素材料的处理可以使用本领域的常规过程完成。此外,本发明的方法能使用经配置以依照发明操作的任何常规生物质处理设备进行。水解(糖化)和发酵,分别或同时,包括但不限于,分开的水解和发酵(shf)、同步糖化和发酵(ssf)、同步糖化和共发酵(sscf)、混合的水解和发酵(hhf)、分开的水解和共发酵(shcf)、混合的水解和共发酵(hhcf),和直接微生物转化(dmc)。shf使用分开的处理步骤以首先将纤维素材料酶水解为可发酵糖,例如,葡萄糖,纤维二糖、纤维三糖和戊糖,然后将可发酵糖发酵成为乙醇。在ssf中,纤维素材料的酶水解和糖变为乙醇的发酵组合在一个步骤中(philippidis,g.p.,1996,cellulosebioconversiontechnology,于handbookonbioethanol:productionandutilization,wyman,c.e编,taylor&francis,washington,dc,179-212)。sscf包括多种糖的共发酵(sheehan,j.,和himmel,m.,1999,enzymes,energyandtheenvironment:astrategicperspectiveontheu.s.departmentofenergy’sresearchanddevelopmentactivitiesforbioethanol,biotechnol.prog.15:817-827)。hhf在同步糖化和水解步骤之外,还涉及单独的水解步骤,所述步骤可以在同一个反应器中进行。hhf过程中的步骤可以在不同的温度进行,即,高温酶糖化,然后在发酵菌株能够耐受的较低温度进行ssf。dmc在一个或多个(几个)步骤中组合了所有三个过程(酶产生、水解和发酵),其中使用相同的生物体产生用于将纤维素材料转化成可发酵糖并将可发酵糖转化成终产物的酶(lynd等,2002,microbialcelluloseutilization:fundamentalsandbiotechnology,microbiol.mol.biol.reviews66:506-577)。在本文可以理解的是,本领域中任何已知的方法,包括预处理、酶水解(糖化)、发酵,或它们的组合,可用于实施本发明的方法。常规设备包括补料分批搅拌反应器、分批搅拌反应器、具有超滤的连续流搅拌反应器和/或连续活塞流柱式反应器(corazza等,2003,optimalcontrolinfed-batchreactorforthecellobiosehydrolysis,actascientiarum.technology25:33-38;gusakov和sinitsyn,1985,kineticsoftheenzymatichydrolysisofcellulose:1.amathematicalmodelforabatchreactorprocess,enz.microb.technol.7:346-352)、研磨反应器(ryu和lee,1983,bioconversionofwastecellulosebyusinganattritionbioreactor,biotechnol.bioeng.25:53-65),或者具有由电磁场引起的强烈搅拌的反应器(gusakov等,1996,enhancementofenzymaticcellulosehydrolysisusinganoveltypeofbioreactorwithintensivestirringinducedbyelectromagneticfield,appl.biochem.biotechnol.56:141-153)。其它反应器类型包括:流化床、升流层(upflowblanket)、固定化和挤出机型反应器以供水解和/或发酵。预处理。在本发明的方法的实施中,可以使用本领域已知的任何预处理过程破坏植物细胞壁的纤维素材料组分(chandra等,2007,substratepretreatment:thekeytoeffectiveenzymatichydrolysisoflignocellulosics?adv.biochem.engin./biotechnol.108:67-93;galbe和zacchi,2007,pretreatmentoflignocellulosicmaterialsforefficientbioethanolproduction,adv.biochem.engin./biotechnol.108:41-65;hendriks和zeeman,2009,pretreatmentstoenhancethedigestibilityoflignocellulosicbiomass,bioresourcetechnol.100:10-18;mosier等,2005,featuresofpromisingtechnologiesforpretreatmentoflignocellulosicbiomass,bioresourcetechnol.96:673-686;taherzadeh和karimi,2008,pretreatmentoflignocellulosicwastestoimproveethanolandbiogasproduction:areview,int.j.ofmol.sci.9:1621-1651;yang和wyman,2008,pretreatment:thekeytounlockinglow-costcellulosicethanol,biofuelsbioproductsandbiorefining-biofpr.2:26-40)。纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、预浸泡、润湿、洗涤和/或调节。常规的预处理包括但不限于,蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、碱性预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理和生物预处理。其它预处理包括氨渗滤、超声、电穿孔、微波、超临界co2、超临界h2o、臭氧和γ辐射预处理。可以在水解和/或发酵之前预处理纤维素材料。预处理优选在水解前进行。或者,预处理可以与酶水解同时进行以释放可发酵糖,如葡萄糖、木糖和/或纤维二糖。在大多数情况下,预处理步骤本身使一些生物质转化成可发酵糖(甚至在不存在酶的情况下)。蒸汽预处理:在蒸汽预处理中,加热纤维素材料以破坏植物细胞壁成分,包括木质素、半纤维素和纤维素,使酶可接触纤维素和其它部分,例如,半纤维素。使所述纤维素材料通过或穿过反应容器,其中注入蒸汽以增加温度至需要的温度和压力,并且在其中保持期望的反应时间。蒸汽预处理优选在140-230℃,更优选160-200℃,并且最优选170-190℃进行,其中最优的温度范围依赖于任何化学催化剂的添加。蒸汽预处理的停留时间优选1-15分钟,更优选3-12分钟,并且最优选4-10分钟,其中最优的停留时间依赖于温度范围和任何化学催化剂的添加。蒸汽预处理允许相对较高的固体加载量,使纤维素材料在预处理过程中通常仅仅变得潮湿。蒸汽预处理经常与预处理后的物质的爆炸放料(explosivedischarge)组合,这称为蒸汽爆炸,即,快速闪变至大气压和物质的湍流,以通过破碎增加可接触的表面积(duff和murray,1996,bioresourcetechnology855:1-33;galbe和zacchi,2002,appl.microbiol.biotechnol.59:618-628;美国专利申请号2002/0164730)。在蒸汽预处理过程中,切割半纤维素乙酰基团,并且得到的酸自催化半纤维素部分水解成单糖和寡糖。去除木质素至有限的程度。经常在蒸汽预处理之前加入催化剂如h2so4或so2(通常0.3至3%w/w),其可减少时间,降低温度,增加回收率,并改进酶水解(ballesteros等,2006,appl.biochem.biotechnol.129-132:496-508;varga等,2004,appl.biochem.biotechnol.113-116:509-523;sassner等.,2006,enzymemicrob.technol.39:756-762)。化学预处理:术语“化学处理”指促进纤维素、半纤维素和/或木质素分离和/或释放的任何化学预处理。合适的化学预处理过程的实例包括例如稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(afex)、氨渗滤(apr)和有机溶剂预处理。在稀酸预处理中,将纤维素材料与稀酸(通常是h2so4)和水混合以形成浆料,由蒸汽加热至期望的温度,并在一段停留时间后闪变至大气压。可以用很多反应器设计进行稀酸预处理,例如,活塞流反应器、逆流反应器或连续逆流收缩床反应器(duff和murray,1996,supra;schell等,2004,bioresourcetechnol.91:179-188;lee等,1999,adv.biochem.eng.biotechnol.65:93-115)。还可以使用碱性条件下的几种预处理方法。这些碱预处理包括,但不限于,石灰预处理、湿氧化、氨渗滤(apr)和氨纤维/冷冻爆炸(afex)。用碳酸钙、氢氧化钠或氨,在85-150℃的低温进行石灰预处理,停留时间从1小时到几天(wyman等,2005,bioresourcetechnol.96:1959-1966;mosier等,2005,bioresourcetechnol.96:673-686)。wo2006/110891、wo2006/110899、wo2006/110900和wo2006/110901公开了使用氨的预处理方法。湿法氧化是热预处理,通常在180-200℃进行5-15分钟,加入氧化剂如过氧化氢或过压氧(schmidt和thomsen,1998,bioresourcetechnol.64:139-151;palonen等,2004,appl.biochem.biotechnol.117:1-17;varga等,2004,biotechnol.bioeng.88:567-574;martin等,2006,j.chem.technol.biotechnol.81:1669-1677)。预处理以优选1-40%干物质,更优选2-30%干物质,并且最优性5-20%干物质进行,并且由于加入碱如碳酸钠,初始ph经常会增加。湿法氧化预处理方法的修改方法,称为湿爆炸(湿氧化和蒸汽爆炸的组合),能够处理高达30%的干物质。在湿爆炸中,在预处理过程中,在一定的停留时间后引入氧化剂。然后通过闪变至大气压而结束预处理(wo2006/032282)。氨纤维爆炸(afex)涉及在温和温度如90-100℃和高压如17-20bar,用液体或气体氨将纤维素材料处理5-10分钟,其中干物质含量可以高达60%(gollapalli等,2002,appl.biochem.biotechnol.98:23-35;chundawat等,2007,biotechnol.bioeng.96:219-231;alizadeh等,2005,appl.biochem.biotechnol.121:1133-1141;teymouri等,2005,bioresourcetechnol.96:2014-2018)。afex预处理导致纤维素解聚,和半纤维素的部分水解。木质素-糖复合物得到切割。有机溶剂预处理通过用含水乙醇(40-60%乙醇)在160-200℃提取30-60分钟而将纤维素材料去木质素化(pan等,2005,biotechnol.bioeng.90:473-481;pan等,2006,biotechnol.bioeng.94:851-861;kurabi等,2005,appl.biochem.biotechnol.121:219-230)。经常加入硫酸作为催化剂。在有机溶剂预处理中,去除大部分半纤维素。合适的预处理方法的其他实例如schell等,2003,appl.biochemandbiotechn.vol.105-108:69-85,和mosier等,2005,bioresourcetechnology96:673-686,和美国已公开的申请2002/0164730所述。在一个方面,化学预处理优选作为酸处理,并且更优选作为连续稀酸和/或弱酸(mildacid)处理进行。酸通常是硫酸,但也可以使用其它酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢或其混合物。弱酸处理在优选1-5,更优选1-4,并且最优选1-3的ph范围内进行。在一个方面,酸浓度在优选0.01至20wt%酸,更优选0.05至10wt%酸,甚至更优选0.1至5wt%酸,并且最优选0.2至2.0wt%酸的范围内。酸与纤维素材料接触,并在优选160-220℃,和更优选165-195℃范围内的温度保持数秒到数分钟,例如1秒-60分钟的时间。在另一个方面,预处理作为氨纤维爆炸步骤(afex预处理步骤)进行。在另一个方面,预处理发生在含水浆料中。在优选的方面,在预处理过程中纤维素材料以优选10-80wt%,更优选20-70wt%,并且最优选30-60wt%,如约50wt%的量存在。预处理的纤维素材料可以不洗涤或者使用本领域任何已知的方法洗涤,例如,用水洗涤。机械预处理:术语“机械预处理”指各种类型的磨制(grinding)或粉碎(milling)(例如,干磨、湿磨或振动球磨)。物理预处理:术语“物理预处理”指促进纤维素、半纤维素和/或木质素从纤维素材料分离和/或释放的任何预处理。例如,物理预处理可涉及辐射(例如,微波辐射)、汽蒸/蒸汽爆炸、水热解(hydrothermolysis)和它们的组合。物理预处理可以涉及高压和/或高温(蒸汽爆炸)。在一个方面,高压指范围在优选约300至约600psi,更优选约350至约550psi,并且最优选约400至约500psi,如约450psi的压强。在另一个方面,高温指范围在约100至约300℃,优选约140至约235℃的温度。在一个优选的方面,机械预处理在使用如上所定义的高温和高压的分批过程、蒸汽枪水解器系统,例如来自sundsdefibratorab,sweden的sundshydrolyzer中进行。组合的物理和化学预处理:可以对纤维素材料进行物理和化学预处理。例如,预处理步骤可以涉及稀酸或弱酸处理和高的温度和/或压力处理。根据需要,可以顺序或同时进行物理和化学预处理。还可以包括机械预处理。因此,在一个优选的方面,对纤维素材料进行机械、化学或物理预处理,或者它们的任意组合,以促进纤维素、半纤维素和/或木质素的分离和/或释放。生物预处理:术语“生物预处理”指促进纤维素、半纤维素和/或木质素从纤维素材料分离和/或释放的任何生物预处理。生物预处理技术可以包括应用溶解木质素的微生物(参见,例如,hsu,t.-a.,1996,pretreatmentofbiomass,于handbookonbioethanol:productionandutilization,wyman,c.e编,taylor&francis,washington,dc,179-212;ghosh和singh,1993,physicochemicalandbiologicaltreatmentsforenzymatic/microbialconversionoflignocellulosicbiomass,adv.appl.microbiol.39:295-333;mcmillan,j.d.,1994,pretreatinglignocellulosicbiomass:areview,于enzymaticconversionofbiomassforfuelsproduction,himmel,m.e.,baker,j.o.,和overend,r.p.,编,acssymposiumseries566,americanchemicalsociety,washington,dc,第15章;gong,c.s.,cao,n.j.,du,j.,和tsao,g.t.,1999,ethanolproductionfromrenewableresources,于advancesinbiochemicalengineering/biotechnology,scheper,t.,编,springer-verlagberlinheidelberg,germany,65:207-241;olsson和hahn-hagerdal,1996,fermentationoflignocellulosichydrolysatesforethanolproduction,enz.microb.tech.18:312-331;和vallander和eriksson,1990,productionofethanolfromlignocellulosicmaterials:stateoftheart,adv.biochem.eng./biotechnol.42:63-95)。糖化。在水解(也称作糖化)步骤中,将纤维素材料(例如经预处理的)水解以将纤维素或亦将半纤维素分解成可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的寡糖。水解由酶组合物以酶法在本发明的具有纤维二糖水解酶活性的多肽的存在下进行。组合物的酶可顺序加入。酶水解优选在易于由本领域技术人员确定的条件下,在合适的含水环境中进行。在一个方面,水解在适于酶的活性,即对于酶最优的条件下进行。水解可以以补料分批或连续的工艺进行,其中将纤维素材料逐渐补入,例如,含酶的水解溶液中。糖化通常在搅拌釜反应器或发酵罐中,在受控的ph、温度和混合条件下进行。合适的处理时间、温度和ph条件可以由本领域技术人员容易地确定。例如,糖化可以持续长达200小时,但是通常优选进行约12至约96小时,更优选约16至约72小时,并且最优选约24至约48小时。温度优选约25℃至约70℃,更优选约30℃至约65℃,并且更优选约40℃至约60℃,特别是约50℃。ph优选约3至约8,更优选约3.5至约7,并且最优选约4至约6,特别是约ph5。干燥固体含量优选约5至约50wt%,更优选约10至约40wt%,并且最优选约20至约30wt%。发酵。可通过一种或多种(几种)能将糖直接或间接发酵成所需发酵产物的发酵微生物发酵自经水解的纤维素材料获得的可发酵糖。“发酵”或“发酵方法”指任何发酵方法或包含发酵步骤的任何方法。发酵方法还包括用于消费品醇工业(例如,啤酒和葡萄酒)、乳品业(例如,发酵乳制品)、皮革业和烟草业的发酵方法。发酵条件依赖于期望的发酵产物和发酵生物体,并且能由本领域的技术人员容易地确定。在发酵步骤中,作为预处理和酶水解步骤的结果从纤维素材料释放的糖,通过发酵生物体(如酵母)发酵成为产物,例如,乙醇。如本文中所述,水解(糖化)和发酵可以是分开的或同时的。在实施本发明时,在发酵步骤中可以使用任何合适的经水解的纤维素材料。通常根据所需的发酵产品(即,要从发酵获得的物质)和使用的方法来选择所述材料,如本领域中所公知的。术语“发酵培养基”在本文中可理解为指加入发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及同步的糖化和发酵方法(ssf)中使用的培养基。“发酵微生物”指适用于理想的发酵方法产生发酵产物的任何微生物,包括细菌和真菌生物体。发酵生物体可以是c6和/或c5发酵生物体,或它们的组合。c6和c5发酵生物体均在本领域公知。合适的发酵微生物能将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖)直接或间接地发酵(即,转化)成所需的发酵产品。产生乙醇的细菌和真菌发酵生物体的实例如lin等,2006,appl.microbiol.biotechnol.69:627-642所述。能发酵c6糖的发酵微生物的实例包括细菌和真菌生物体,如酵母。优选的酵母包括酵母属菌种,优选酿酒酵母。能发酵c5糖的发酵生物体的实例包括细菌和真菌生物体,如一些酵母。优选的c5发酵酵母包括毕赤酵母属,优选树干毕赤酵母(pichiastipitis)的菌株,如树干毕赤酵母cbs5773;假丝酵母属,优选博伊丁假丝酵母(candidaboidinii)、芸薹假丝酵母(candidabrassicae)、休哈塔假丝酵母(candidasheatae)、迪丹斯假丝酵母(candidadiddensii)、假热带假丝酵母(candidapseudotropicalis)或产朊假丝酵母(candidautilis)的菌株。其它发酵生物体包括发酵单胞菌属(zymomonas),如运动发酵单胞菌(zymomonasmobilis);汉逊酵母属,如异常汉逊酵母(hansenulaanomala);克鲁维酵母属,如脆壁克鲁维酵母;裂殖酵母属,如粟酒裂殖酵母(s.pombe);大肠杆菌,特别是已经经过遗传修饰而改进乙醇产量的大肠杆菌;梭菌属(clostridium),如丙酮丁醇梭菌(clostridiumacetobutylicum)、热纤维梭菌(chlostridiumthermocellum)和chlostridiumphytofermentans;地芽孢杆菌属菌种(geobacillussp.);热厌氧杆菌属(thermoanaerobacter),如解糖热厌氧杆菌(thermoanaerobactersaccharolyticum);和芽孢杆菌属,如凝结芽孢杆菌。在一个优选的方面,酵母是酵母属菌种。在一个更优选的方面,酵母是酿酒酵母。在另一个更优选的方面,酵母是糖化酵母(saccharomycesdistaticus)。在另一个更优选的方面,酵母是葡萄汁酵母(saccharomycesuvarum)。在另一个优选的方面,酵母是克鲁维酵母属。在另一个更优选的方面,酵母是马克斯克鲁维酵母(kluyveromycesmarxianus)。在另一个更优选的方面,酵母是脆壁克鲁维酵母。在另一个优选的方面,酵母是假丝酵母属。在另一个更优选的方面,酵母是博伊丁假丝酵母。在另一个更优选的方面,酵母是芸薹假丝酵母。在另一个更优选的方面,酵母是迪丹斯假丝酵母。在另一个更优选的方面,酵母是假热带假丝酵母。在另一个更优选的方面,酵母是产朊假丝酵母。在另一个优选的方面,酵母是棒孢酵母属(clavispora)。在另一个更优选的方面,酵母是葡萄牙棒孢酵母(clavisporalusitaniae)。在另一个更优选的方面,酵母是仙人掌棒孢酵母(clavisporaopuntiae)。在另一个优选的方面,酵母是管囊酵母属(pachysolen)。在另一个更优选的方面,酵母是嗜鞣管囊酵母(pachysolentannophilus)。在另一个优选的方面,酵母是毕赤酵母属。在另一个更优选的方面,酵母是树干毕赤酵母。在另一个优选的方面,酵母是酒香酵母属(bretannomyces)。在另一个更优选的方面,酵母是克劳森酒香酵母(bretannomycesclausenii)(philippidis,g.p.,1996,cellulosebioconversiontechnology,于handbookonbioethanol:productionandutilization,wyman,c.e.编,taylor&francis,washington,dc,179-212)。能有效地将己糖和戊糖发酵成乙醇的细菌包括,例如,运动发酵单胞菌和丙酮丁醇梭菌,热纤维梭菌,chlostridiumphytofermentans,地芽孢杆菌属菌种,解糖热厌氧杆菌和凝结芽孢杆菌(philippidis,1996,见上文)。在一个优选的方面,细菌是发酵单胞菌属。在更优选的方面,细菌是运动发酵单胞菌。在另一个优选的方面,细菌是梭菌属。在另一个更优选的方面,细菌是热纤维梭菌。商业上可得到的适合乙醇产生的酵母包括,例如ethanolredtm酵母(redstar/lesaffre,usa)、falitm(fleischmann’syeast,usa)、superstarttm和thermosacctm新鲜酵母(ethanoltechnology,wi,usa)、biofermtmaft和xr(nabc-northamericanbioproductscorporation,ga,usa)、gertstrandtm(gertstrandab,sweden)和fermioltm(dsmspecialties)。在一个优选的方面,发酵微生物已经经过遗传修饰,提供发酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。通过将异源基因克隆入多种发酵微生物已经构建了能将己糖和戊糖转化成乙醇(共发酵)的生物体(chen和ho,1993,cloningandimprovingtheexpressionofpichiastipitisxylosereductasegeneinsaccharomycescerevisiae,appl.biochem.biotechnol.39-40:135-147;ho等,1998,geneticallyengineeredsaccharomycesyeastcapableofeffectivelycofermentingglucoseandxylose,appl.environ.microbiol.64:1852-1859;kotter和ciriacy,1993,xylosefermentationbysaccharomycescerevisiae,appl.microbiol.biotechnol.38:776-783;walfridsson等,1995,xylose-metabolizingsaccharomycescerevisiaestrainsoverexpressingthetkl1andtal1genesencodingthepentosephosphatepathwayenzymestransketolaseandtransaldolase,appl.environ.microbiol.61:4184-4190;kuyper等,2004,minimalmetabolicengineeringofsaccharomycescerevisiaeforefficientanaerobicxylosefermentation:aproofofprinciple,femsyeastresearch4:655-664;beall等,1991,parametricstudiesofethanolproductionfromxyloseandothersugarsbyrecombinantescherichiacoli,biotech.bioeng.38:296-303;ingram等,1998,metabolicengineeringofbacteriaforethanolproduction,biotechnol.bioeng.58:204-214;zhang等,1995,metabolicengineeringofapentosemetabolismpathwayinethanologeniczymomonasmobilis,science267:240-243;deanda等,1996,developmentofanarabinose-fermentingzymomonasmobilisstrainbymetabolicpathwayengineering,appl.environ.microbiol.62:4465-4470;wo2003/062430,xyloseisomerase)。在一个优选的方面,经过遗传修饰的发酵微生物是酿酒酵母。在另一个优选的方面,经过遗传修饰的发酵微生物是运动发酵单胞菌。在另一个优选的方面,经过遗传修饰的发酵微生物是大肠杆菌。在另一个优选的方面,经过遗传修饰的发酵微生物是产酸克雷伯氏菌(klebsiellaoxytoca)。在另一个优选的方面,所述经遗传修饰的发酵微生物是克鲁维酵母菌种。本领域中公知的是,上述生物体还能用于产生其它物质,如本文所述。通常向降解的木素纤维素或水解物加入发酵微生物,并进行约8至约96小时,如约24至约60小时发酵。温度通常为约26℃至约60℃,特别是约32℃或50℃,并且在约ph3至约ph8,如约ph4-5、6或7。在一个优选的方面,对降解的纤维素材料施用酵母和/或另一种微生物,并进行约12至约96小时,如通常为24-60小时发酵。在一个优选的方面,温度优选为约20℃至约60℃,更优选约25℃至约50℃,并且最优选约32℃至约50℃,特别是约32℃或50℃,并且ph通常为约ph3至约ph7,优选约ph4-7。然而,一些发酵生物体例如细菌,具有更高的最适发酵温度。酵母或另一种微生物优选以约105-1012,优选约107-1010,特别是约2x108活细胞计数每ml发酵液的量施用。关于使用酵母进行发酵的进一步指导可以在例如“thealcoholtextbook”(k.jacques,t.p.lyons和d.r.kelsall编,nottinghamuniversitypress,unitedkingdom1999)中找到,其通过提述并入本文。对于乙醇生产,在发酵后蒸馏发酵的浆料以提取乙醇。根据本发明的方法获得的乙醇可以用作,例如燃料乙醇;饮料乙醇,即,中性饮料酒,或工业乙醇。发酵刺激剂可以与本文所述的任何方法组合使用,以进一步改进发酵工艺,而且特定地,改进发酵微生物的性能,如,速率增加和乙醇得率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸(盐)、烟酸、内消旋肌醇(meso-inositol)、硫胺素、吡哆醇(pyridoxine)、对氨基苯甲酸、叶酸、核黄素和维生素a、b、c、d和e。参见,例如,alfenore等,improvingethanolproductionandviabilityofsaccharomycescerevisiaebyavitaminfeedingstrategyduringfed-batchprocess,springer-verlag(2002),其通过提述并入本文。矿物质的实例包括能够提供营养物的矿物质和矿物质盐,所述营养物包括p、k、mg、s、ca、fe、zn、mn和cu。发酵产物:发酵产物可以是源自发酵的任何物质。发酵产物可以是,不限于,醇(例如,阿拉伯醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨醇和木糖醇);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-d-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);和气体(例如,甲烷、氢气(h2)、二氧化碳(co2)和一氧化碳(co))。发酵产物还可以是作为高价值产品的蛋白质。在一个优选的方面,发酵产物是醇。可理解的是,术语“醇”包括包含一个或多个羟基基团(moiety)的物质。在更优选的方面,所述醇是阿拉伯醇。在另一个更优选的方面,所述醇是丁醇。在另一个更优选的方面,所述醇是乙醇。在另一个更优选的方面,所述醇是甘油。在另一个更优选的方面,所述醇是甲醇。在另一个更优选的方面,所述醇是1,3-丙二醇。在另一个更优选的方面,所述醇是山梨醇。在另一个更优选的方面,所述醇是木糖醇。参见,例如,gong,c.s.,cao,n.j.,du,j.,和tsao,g.t.,1999,ethanolproductionfromrenewableresources,于advancesinbiochemicalengineering/biotechnology,scheper,t.编,springer-verlagberlinheidelberg,germany,65:207-241;silveira,m.m.,和jonas,r.,2002,thebiotechnologicalproductionofsorbitol,appl.microbiol.biotechnol.59:400-408;nigam和singh,1995,processesforfermentativeproductionofxylitol–asugarsubstitute,processbiochemistry30(2):117-124;ezeji等,2003,productionofacetone,butanolandethanolbyclostridiumbeijerinckiiba101andinsiturecoverybygasstripping,worldjournalofmicrobiologyandbiotechnology19(6):595-603。在另一个优选的方面,所述发酵产物是有机酸。在另一个更优选的方面,所述有机酸是乙酸。在另一个更优选的方面,所述有机酸是醋酮酸。在另一个更优选的方面,所述有机酸是己二酸。在另一个更优选的方面,所述有机酸是抗坏血酸。在另一个更优选的方面,所述有机酸是柠檬酸。在另一个更优选的方面,所述有机酸是2,5-二酮-d-葡糖酸。在另一个更优选的方面,所述有机酸是甲酸。在另一个更优选的方面,所述有机酸是反丁烯二酸。在另一个更优选的方面,所述有机酸是葡糖二酸。在另一个更优选的方面,所述有机酸是葡糖酸。在另一个更优选的方面,所述有机酸是葡糖醛酸。在另一个更优选的方面,所述有机酸是戊二酸。在另一个优选的方面,所述有机酸是3-羟基丙酸。在另一个更优选的方面,所述有机酸是衣康酸。在另一个更优选的方面,所述有机酸是乳酸。在另一个更优选的方面,所述有机酸是苹果酸。在另一个更优选的方面,所述有机酸是丙二酸。在另一个更优选的方面,所述有机酸是草酸。在另一个更优选的方面,所述有机酸是丙酸。在另一个更优选的方面,所述有机酸是琥珀酸。在另一个更优选的方面,所述有机酸是木糖酸。参见,例如,chen和lee,1997,membrane-mediatedextractivefermentationforlacticacidproductionfromcellulosicbiomass,appl.biochem.biotechnol.63-65:435-448。在另一个优选的方面,所述发酵产物是酮。可理解的是术语“酮”涵盖含有一个或多个酮基团的物质。在另一个更优选的方面,所述酮是丙酮。参见,例如,qureshi和blaschek,2003,见上文。在另一个优选的方面,所述发酵产物是氨基酸。在另一个更优选的方面,所述有机酸是天冬氨酸。在另一个更优选的方面,所述氨基酸是谷氨酸。在另一个更优选的方面,所述氨基酸是甘氨酸。在另一个更优选的方面,所述氨基酸是赖氨酸。在另一个更优选的方面,所述氨基酸是丝氨酸。在另一个更优选的方面,所述氨基酸是苏氨酸。参见,例如,richard和margaritis,2004,empiricalmodelingofbatchfermentationkineticsforpoly(glutamicacid)productionandothermicrobialbiopolymers,biotechnologyandbioengineering87(4):501-515。在另一个优选的方面,所述发酵产物是气体。在另一个更优选的方面,所述气体是甲烷。在另一个更优选的方面,所述气体是h2。在另一个更优选的方面,所述气体是co2。在另一个更优选的方面,所述气体是co。参见,例如,kataoka等,1997,studiesonhydrogenproductionbycontinuousculturesystemofhydrogen-producinganaerobicbacteria,waterscienceandtechnology36(6-7):41-47;和gunaseelan,1997,于biomassandbioenergy,13(1-2),83-114,anaerobicdigestionofbiomassformethaneproduction:areview。回收。可以使用本领域已知的任何方法,任选地从发酵培养基回收发酵产物,所述方法包括,但不限于,层析、电泳方法、差示溶解度、蒸馏或提取。例如,通过常规蒸馏方法从发酵的纤维素材料分离并纯化醇。可以获得纯度高达约96vol%的乙醇,其能用作,例如,燃料乙醇、饮用乙醇,即,中性饮料酒,或工业乙醇。信号肽本发明还涉及编码信号肽的分离的多核苷酸,所述信号肽包含或组成为seqidno:2的氨基酸1至18或seqidno:4的1至25。在一个方面,所述多核苷酸是seqidno:1的核苷酸1至54或seqidno:3的1至75。所述多核苷酸还可包含编码蛋白质的基因,其可操作地连接于所述信号肽。本发明还涉及包含此种多核苷酸的核酸构建体、表达载体和重组宿主细胞。本发明还涉及产生蛋白质的方法,包括:(a)培养重组宿主细胞,所述重组宿主细胞包含此种可操作地连接于编码蛋白的基因的多核苷酸;和(b)回收所述蛋白质。所述蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在本文的意思不是指特定长度的编码产物,并且因此包含肽、寡肽和多肽。术语“蛋白质”还包含组合以形成编码产物的两种或更多种多肽。所述蛋白质还包括杂合多肽和融合多肽。优选地,所述蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分,或报道蛋白(reporter)。例如,所述蛋白质可为氧化还原酶、转移酶、水解酶、裂合酶(lyase)、异构酶或连接酶,如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、另外的脂肪酶、甘露糖苷酶、变聚糖酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。基因可以从任何原核、真核或其它来源获得。优选实施方案的列表实施方案1.一种具有纤维二糖水解酶活性的分离的多肽,其选自下组:(a)多肽,其与seqidno:2的成熟多肽具有至少90%序列同一性;或多肽,其与seqidno:4的成熟多肽具有至少80%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸与seqidno:1的成熟多肽编码序列或其cdna序列具有至少90%序列同一性;或多肽,其由多核苷酸编码,所述多核苷酸与seqidno:3的成熟多肽编码序列或其基因组dna序列具有至少80%序列同一性;(c)seqidno:2或seqidno:4的成熟多肽的包含一个或多个(几个)氨基酸的取代、缺失和/或插入的变体;和(d)(a)、(b)或(c)的多肽的具有纤维二糖水解酶活性的片段。实施方案2.实施方案1的多肽,其与seqidno:2的成熟多肽具有至少90%,例如至少92%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。实施方案3.实施方案1的多肽,其与seqidno:4的成熟多肽具有至少80%,例如至少85%,至少87%,至少90%,至少92%,至少95%,例如至少96%,至少97%,至少98%,至少99%,或100%的序列同一性。实施方案4.实施方案1-3任一项的多肽,其包含或组成为seqidno:2或seqidno.4。实施方案5.实施方案4的多肽,其包含或组成为seqidno:2或seqidno.4的成熟多肽。实施方案6.实施方案5的多肽,其中所述成熟多肽是seqidno:2的氨基酸19至455或seqidno:4的氨基酸26至537。实施方案7.一种分离的多肽,其包含催化域,所述催化域选自下组:(a)催化域,其与seqidno:2的催化域具有至少90%序列同一性;或催化域,其与seqidno:4的催化域具有至少80%序列同一性;(b)催化域,其由多核苷酸编码,所述多核苷酸与seqidno:1的催化域编码序列具有至少90%序列同一性;或催化域,其由多核苷酸编码,所述多核苷酸与seqidno:3的催化域编码序列具有至少80%序列同一性;(c)seqidno:2或seqidno:4的催化域的包含一个或多个(几个)氨基酸的取代、缺失和/或插入的催化域变体;和(d)(a)、(b)或(c)的催化域的具有纤维二糖水解酶活性的片段。实施方案8.实施方案7的多肽,其包含或组成为seqidno:2或seqidno:4的催化域。实施方案9.实施方案8的多肽,其中所述催化域是seqidno:2的氨基酸19至455或seqidno:4的氨基酸26至465。实施方案10.实施方案7-9任一项的多肽,其进一步包含纤维素结合域。实施方案11.一种组合物,其包含实施方案1-10任一项的多肽。实施方案12.一种分离的多核苷酸,其编码实施方案1-10任一项的多肽。实施方案13.一种核酸构建体或表达载体,其包含实施方案12的多核苷酸,所述多核苷酸可操作地连接于一个或多个(几个)调控序列,所述调控序列指导所述多肽在表达宿主中的产生。实施方案14.一种重组宿主细胞,其包含实施方案12的多核苷酸,所述多核苷酸可操作地连接于一个或多个调控序列,所述调控序列指导多肽的产生。实施方案15.一种产生实施方案1-10中任一项的多肽的方法,其包括:(a)在有助于所述多肽产生的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。实施方案16.一种产生具有纤维二糖水解酶活性的多肽的方法,其包括:(a)在有助于所述多肽产生的条件下培养实施方案14的重组宿主细胞;和(b)回收所述多肽。实施方案17.一种降解或转化纤维素材料的方法,其包括:在实施方案1-10中任一项的具有纤维二糖水解酶活性的多肽存在下用酶组合物处理所述纤维素材料。实施方案18.实施方案17的方法,其中所述纤维素材料经过预处理。实施方案19.实施方案17或18的方法,进一步包括回收经降解的纤维素材料。实施方案20.实施方案17-19任一项的方法,其中所述酶组合物包含一种或多种(几种)选自下组的酶:纤维素酶、具有纤维素分解增强活性的gh61多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。实施方案21.实施方案20的方法,其中所述纤维素酶是一种或多种选自下组的酶:内切葡聚糖酶、其它纤维二糖水解酶和β-葡糖苷酶。实施方案22.实施方案21的方法,其中所述半纤维素酶是一种或多种选自下组的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。实施方案23.一种产生发酵产物的方法,其包括:(a)在实施方案1-10中任一项的具有内切葡聚糖酶活性的多肽存在下,用酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵经糖化的纤维素材料以产生发酵产物;和(c)从发酵回收发酵产物。实施方案24.实施方案23的方法,其中所述纤维素材料经过预处理。实施方案25.实施方案23或24的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的gh61多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。实施方案26.实施方案25的方法,其中所述纤维素酶是一种或多种选自下组的酶:内切葡聚糖酶、其它纤维二糖水解酶和β-葡糖苷酶。实施方案27.实施方案25的方法,其中所述半纤维素酶是一种或多种选自下组的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。实施方案28.实施方案23-27中任一项的方法,其中步骤(a)和(b)在同步糖化和发酵中同时进行。实施方案29.实施方案23-28中任一项的方法,其中发酵产物是醇、有机酸、酮、氨基酸或气体。实施方案30.一种发酵纤维素材料的方法,其包括:用一种或多种发酵微生物发酵纤维素材料,其中所述纤维素材料是在实施方案1-10中任一项的具有纤维二糖水解酶活性的多肽的存在下用酶组合物糖化的。实施方案31.实施方案30的方法,其中所述纤维素材料在糖化前经过预处理。通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。实施例菌株talaromycesbyssochlamydoides菌株cbs413.71用作家族gh7基因的来源。米曲霉mt3568菌株用于异源表达家族gh7基因,所述基因编码与具有纤维二糖水解酶活性的多肽具有同源性的多肽。米曲霉mt3568是米曲霉jal355(wo2002/40694)的amds(乙酰胺酶)破坏的基因衍生物,其中通过用pyrg基因破坏米曲霉乙酰胺酶(amds)基因而恢复了pyrg营养缺陷。培养基yp+2%葡萄糖培养基包含1%酵母提取物,2%蛋白胨和2%葡萄糖。pda琼脂平板包含马铃薯浸出物(马铃薯浸出物通过将300g切片的(经洗涤,但未经剥皮)的马铃薯在水中煮沸30分钟,然后将汤液倾去或通过干酪包布过滤来制备)。然后添加蒸馏水直至悬液的总体积为一升,接着添加20g的右旋糖和20g的琼脂粉。培养基通过在15psi蒸汽灭菌15分钟来灭菌(bacteriologicalanalyticalmanual,8thedition,revisiona,1998)。lb平板包含10g的bacto-tryptone、5g的酵母提取物、10g的氯化钠、15g的bacto-琼脂,和去离子水加至1升。lb培养基包含10g的bacto-tryptone、5g的酵母提取物和10g的氯化钠,和去离子水加至1升。cove蔗糖平板包含342g的蔗糖,20g的琼脂粉,20ml的cove盐溶液,和去离子水加至1升。培养基通过在15psi蒸汽灭菌15分钟来灭菌(bacteriologicalanalyticalmanual,8thedition,revisiona,1998)。将培养基冷却至60℃,并添加10mm乙酰胺,15mmcscl,tritonx-100(50μl/500ml)。cove盐溶液包含26g的mgso4·7h2o,26g的kcl,26g的kh2po4,50ml的cove微量金属溶液,和去离子水加至1升。cove微量金属溶液包含0.04g的na2b4o7·10h2o,0.4g的cuso4·5h2o,1.2g的feso4·7h2o,0.7g的mnso4·h2o,0.8g的na2moo4·2h2o,10g的znso4·7h2o,和去离子水加至1升。实施例1:从talaromycesbyssochlamydoides克隆两个家族gh7基因根据rose等,1998,nucleicacidsresearch26:1628-1635所述的策略设计了一组下示的简并引物以靶向编码属于家族gh7的纤维二糖水解酶的基因。for1gtcgttcttgatgcgaaytggmgntggseqidno:5for2cctgcgcccagaactgygcnbtngaseqidno:6for3tgacgtcgatgtctccaatytnccntgyggseqidno:7rev1gcatccgtcgggtagtcgswrtcnarccaseqidno:8rev2gtcgggtagtcggaatccarccanwncatseqidno:9rev3gcctggcgtgtcgcanggrtgnggseqidno:10大写字母核苷酸代表引物的共同箍(consensusclamp),而小写字母核苷酸代表寡核苷酸的简并核心(rose等,1998,nucleicacidsresearch26:1628-1635)。pcr筛选使用两个连续的pcr进行。用引物对for1/rev1,for1/rev2,for2/rev1,for2/rev2,for3/rev1,for3/rev2,for1/rev3,for2/rev3,和for3/rev3进行九个pcr反应。将正向引物(0.33μl的10μm储液)与其对应的反向引物(0.33μl的10μm储液)在10μl混合物中合并,所述混合物含有0.33μl基因组dna和5μl的reddymixtmextensorpcrmastermix1(abgeneltd.,surrey,unitedkingdom)。基因组dna从根据spinkit(q-biogene,carlsbad,ca,usa)中所述的步骤在pda(参见培养基部分)上生长的talaromycesbyssochlamydoides(参见菌株部分)的新鲜菌丝体获得。pcr反应使用thermalcycler(bio-radlaboratories,inc.,hercules,ca,usa)进行,其程序如下:一个循环,在94℃进行2分钟;9个循环,每个在94℃进行15秒,68℃进行30秒,每循环降低1℃,和68℃进行1分45秒;24个循环,每个在94℃进行15秒,68℃进行30秒,和68℃进行1分45秒;和在68℃延伸7分钟。将在第一pcr过程中获得的pcr产物用其相应的引物重新扩增,即将0.5μl的第一pcr反应物转移至含有相同浓度的引物、dntp、dna聚合酶,和缓冲液的第二20μl混合物。第二pcr使用thermalcycler进行,其程序如下:一个循环,在94℃进行2分钟;34个循环,每个在94℃进行15秒,58℃进行30秒,和68℃进行1分45秒;和在68℃最终延伸7分钟。将在第二扩增过程中获得的pcr产物通过使用40mmtris碱-20mm乙酸钠-1mmedta二钠盐(tae)缓冲液的1%琼脂糖凝胶电泳进行分析。将大小范围为200至1200个核苷酸的单个条带从凝胶切出并使用pcrdnaandgelbandpurificationkit(gehealthcare,denmark)根据生产商的指示进行纯化。将纯化的dna样品用用于扩增的引物直接测序。序列通过seqmanv7.2.1(dnastar,madison,wi,usa)汇编为重叠群,将重叠群用作模板遵循genewalkingspeeduptmkit实验方案(seegene,inc.,seoul,korea)中所述的限制条件设计下示的genewalking引物。5220cbh1-1tsp1faacaactttgatacacacggcggseqidno:115220cbh1-1tsp2fctgcagcagggtatggttctggseqidno:125220cbh1-1tsp3ftggtgatgagtctgtgggacggseqidno:135220cbh1-1tsp1rgtcagcagccatggtaacaaggseqidno:145220cbh1-1tsp2rtggtaacaaggtacagagcgccgseqidno:155220cbh1-1tsp3rgtacagagcgccgtttaatccgcseqidno:165220cbh1-2tsp1factgtaccgctgagaattctgtcseqidno:175220cbh1-2tsp2fgcatgagtggtgtcagtgaggcseqidno:185220cbh1-2tsp3ftggtgtcagtgaggctctgtccseqidno:195220cbh1-2tsp1rccataacaacgaggtagagggcseqidno:205220cbh1-2tsp2rcagggcaggtttgagacatccacseqidno:215220cbh1-2tsp3rtctggtagtgggtgtcatccgcseqidno:22genewalking基于来自genewalkingspeeduptmkit的实验方案,有一些不重要的变更。进行了三次pcr扩增,并在所有情况下,使用reddymixtmextensorpcrmastermix1(abgeneltd.,surrey,unitedkingdom)替代试剂盒中存在的pcr酶混合物。genewalkingpcr步骤1在15μl的总体积中进行,即将来自genewalkingspeeduptmkit的1.2μl的引物1至4(2.5μm)和0.3μl的引物seqidno:11或seqidno:14(10μm)在7.5μl的reddymixtmextensorpcrmastermix1,和0.4μl的t.byssochlamydoides基因组dna的存在下混合。pcr使用thermalcycler进行,其程序如下:一个循环,在94℃进行3分钟,接着在42℃进行1分钟和68℃进行2分钟;30个循环,每个在94℃进行30秒,58℃进行30秒,和68℃进行1分40秒;和在68℃延伸7分钟。将扩增反应物的0.5μl等分试样转移至含有20μl混合物的第二pcr试管,所述混合物包含10μl的reddymixtmextensorpcrmastermix1,1μl的来自试剂盒的引物5(10μm),1μl的引物seqidno:12或seqidno:15(10μm)。扩增在thermalcycler中进行,其程序如下:在94℃变性3分钟;35个循环,每个在94℃进行30秒,58℃进行30秒,和68℃进行1分40秒;和在68℃延伸7分钟。将第二扩增反应物的0.5μl等分试样转移至含有20μl混合物的第三pcr试管,所述混合物包含10μl的reddymixtmextensorpcrmastermix1,1μl的来自试剂盒的引物6(10μm),1μl的引物seqidno:13或seqidno:16(10μm)。扩增在thermalcycler中进行,其程序如下:在94℃变性3分钟;35个循环,每个在94℃进行30秒,58℃进行30秒,和68℃进行1分40秒;和在68℃延伸7分钟。类似地使用引物seqidno:17至22进行了三次连续的pcr反应以鉴定来自talaromycesbyssochlamydoides的第二基因的5’端和3’端。pcr产物使用用于最后pcr的两个特定引物直接测序。所得的序列谱图通过seqmanv7.2.1(dnastar,madison,wi,usa)汇编,并通过针对蛋白数据库(包括uniprot)的blastx分析所得的重叠群。对不同的重叠群就其与属于gh7家族的蛋白的同一性进行分析。基于blastx分析,鉴定了基因的起始密码子,并设计了下示的引物以使用in-fusiontmdry-downpcrcloningkit(bdbiosciences,paloalto,ca,usa)将基因克隆入表达载体pdau109(wo2005/042735)。5220cbhi1facacaactggggatccaccatgtttcgacgggctcttttcctgtcc(seqidno:23)5220cbhi2facacaactggggatccaccatgtccgcctctctttcttacagactctacg(seqidno:24)类似地,对于基因的3’端的blastx分析的结果对于在talaromycesbyssochlamydoides中鉴定出的两个家族gh7基因的每一个鉴定出一个终止密码子。设计了下示的反向引物以使用in-fusiontmdry-downpcrcloningkit(bdbiosciences,paloalto,ca,usa)将基因克隆入表达载体pdau109(wo2005/042735)。5220cbhi1ragatctcgagaagcttacgaagtggtgaaggtcgagttgattg(seqidno:25)5220cbhi2ragatctcgagaagcttacagacactgggagtagtaagggttc(seqidno:26)使用上述的正向和反向克隆引物(seqidno23至26)用t.byssochlamydoides菌株cbs413.71基因组dna通过pcr扩增了两个纤维二糖水解酶基因。所述pcr包含1μl的基因组dna,2.5μl的正向克隆引物(10μm),2.5μl的反向克隆引物(10μm),10μl的5xhf缓冲液(finnzymesoy,finland),1.6μl的50mmmgcl2,2μl的10mmdntp,0.5μl的dna聚合酶(finnzymesoy,finland),和pcr级水至50μl。扩增反应使用thermalcycler进行,其程序如下:在98℃进行2分钟,接着进行19个下降(touchdown)循环,每个在98℃进行15秒,70℃(-1℃/循环)进行30秒,和72℃进行2分30秒;和25个循环,每个在98℃进行15秒,60℃进行30秒,72℃进行2分30秒,和在72℃进行5分钟。pcr产物在使用tae缓冲液的1.0%琼脂糖凝胶电泳上分离,其中将1.5至1.6kbpcr条带从凝胶切出并使用pcrdnaandgelbandpurificationkit(gehealthcare,denmark)根据生产商的指示进行纯化。将对应于talaromycesbyssochlamydoides和纤维二糖水解酶基因的片段使用in-fusiontmdry-downpcrcloningkit(bdbiosciences,paloalto,ca,usa)根据生产商的指示克隆入之前用bamhi和hindiii直链化的表达载体pdau109(wo2005/042735)。使用2.5μl体积的稀释的连接混合物转化大肠杆菌top10化学感受态细胞(invitrogen,carlsbad,ca,usa)。在含有100μg每ml的氨苄青霉素的lb琼脂平板上选择了三个菌落,并将其在3ml的补充100μg每ml的氨苄青霉素的lb培养基中培养过夜。质粒dna使用plasmidminikit(omegabio-tek,inc.,norcross,ga,usa)根据生产商的指示进行纯化。在异源表达之前,两个talaromycesbyssochlamydoides纤维二糖水解酶基因序列通过sanger测序进行验证。选择了两个命名为if317#1(含有基因seqidno:1),和if314#1(含有基因seqidno:3)的质粒用于在米曲霉宿主细胞中异源表达其纤维二糖水解酶。实施例2:对编码家族gh7多肽的talaromycesbyssochlamydoides基因组dna的表征talaromycesbyssochlamydoidesgh7基因的基因组dna序列(seqidno:1)和推导的氨基酸序列(seqidno:2)列于序列表。第一(seqidno:1)编码序列为1507bp,包括终止密码子,具有两个预测的内含子(604至667和1236至1310)。编码的预测的蛋白为455个氨基酸。使用signalp程序版本3.0(nielsen等,1997,proteinengineering10:1-6),预测了18个残基的信号肽。预测的催化域鉴定为由cazy组(www.cazy.org)定义的位置19至455。该预测的成熟蛋白含有437个氨基酸,具有46.4kda的预测的分子量和3.9的等电点。使用needleman-wunsch算法(needleman和wunsch,1970,j.mol.biol.48:443-453)以缺口开放罚分为10,缺口延伸罚分为0.5和eblosum62矩阵确定了氨基酸序列(seqidno:2)的比较性逐对全局比对。该比对显示编码与具有纤维二糖水解酶活性的蛋白具有同源性的家族gh7多肽的t.byssochlamydoidescdna的推导的氨基酸序列与来自埃默森踝节菌的纤维二糖水解酶的推导的氨基酸序列(geneseqp:ayl28232)共享87.41%同一性(排除缺口)。talaromycesbyssochlamydoidesgh7基因的基因组dna序列(seqidno:3)和推导的氨基酸序列(seqidno:4)列于序列表。第二(seqidno:3)编码序列为1614bp,包括终止密码子。编码的预测的蛋白为537个氨基酸。使用signalp程序(nielsen等,1997,proteinengineering10:1-6),预测了25个残基的信号肽。在该蛋白上亦预测出了不同的域(由cazy组(www.cazy.org)定义):seqidno:4的催化域位置26至465,seqidno:4的接头位置452至495,和seqidno:4的纤维素结合基序(cbm1)位置502至537。该预测的成熟蛋白含有512个氨基酸,具有53.5kda的预测的分子量和3.7的等电点。使用needleman-wunsch算法(needleman和wunsch,1970,j.mol.biol.48:443-453)以缺口开放罚分为10,缺口延伸罚分为0.5和eblosum62矩阵确定了氨基酸序列(seqidno:4)的比较性逐对全局比对。该比对显示编码与具有纤维二糖水解酶活性的蛋白具有同源性的家族gh7多肽的t.byssochlamydoidescdna的推导的氨基酸序列与来自neosartoryafischeri的糖基水解酶家族7蛋白的推导的氨基酸序列(swissprot:a1dap8)共享78.94%同一性(排除缺口)。实施例3:用编码来自talaromycesbyssochlamydoides的纤维二糖水解酶的基因转化米曲霉米曲霉mt3568的原生质体根据wo95/002043制备。将一百μl的原生质体与2.5-15μg的曲霉属表达载体if317#1,和if314#1(实施例1)和250μl的60%peg4000(applichem,darmstadt,germany)(聚乙二醇,分子量为4,000),10mmcacl2,和10mmtris-hclph7.5混合,并轻柔地混合。将混合物在37℃温育30分钟,并将原生质体铺板于cove平板以供选择。在37℃温育4-7日之后,将八个转化体的孢子接种入96深孔板中的0.5ml补充有2%麦芽糊精的yp培养基。在30℃培养4日之后,通过sds-page分析培养液以鉴定产生最大量来自talaromycesbyssochlamydoides的重组纤维二糖水解酶的转化体。将最佳转化体的孢子铺板于含有0.01%x-100的cove平板以分离单菌落。铺板在含有10mm硝酸钠的cove平板上重复两次。实施例4:talaromycesbyssochlamydoidesgh7纤维二糖水解酶的纯化含有talaromycesbyssochlamydoidesgh7纤维二糖水解酶i(p247b5,作为seqidno:2公开)的米曲霉培养液使用0.22μmexpresstmplusmembrane(millipore,bedford,ma,usa)过滤。过滤的培养液使用配置有10kda聚醚砜膜(sartoriusstedimbiotechs.a.,aubagnecedex,france)的vivacell100旋转浓缩器浓缩并用20mmtris-hclph8.5缓冲液交换,然后在20mmtris-hclph8.5中的monoqtmhr16/10离子交换层析柱(gehealthcare,piscataway,nj,usa)上在0至.6mnacl的线性梯度上纯化。基于8-16%stain-freesds-page(bio-radlaboratories,inc.,hercules,ca,usa)汇集含有纤维二糖水解酶i的级分。蛋白浓度使用microplatebcatmproteinassaykit(thermofischerscientific,waltham,ma,usa)确定,其中使用牛血清白蛋白作为蛋白标样。实施例5:经预处理的玉米秸秆水解测定在u.s.departmentofenergynationalrenewableenergylaboratory(美国能源部国家可再生能源实验室)(nrel)使用1.4wt%硫酸在165℃和107psi预处理玉米秸秆8分钟。预处理的玉米秸秆(pcs)中的水不溶性固形物含有56.5%纤维素,4.6%半纤维素和28.4%木质素。通过两阶段硫酸水解,及随后通过使用nrelstandardanalyticalprocedure#002的高效液相色谱分析糖来确定纤维素和半纤维素。在用硫酸水解纤维素和半纤维素级分之后使用nrelstandardanalyticalprocedure#003以重量分析法确定木质素。通过在cosmosicmg40湿式多用途研磨器(essemmcorporation,tamilnadu,india)中磨制全浆料pcs来制备磨制的、未洗涤的pcs(干重量32.35%)。pcs的水解使用2.2ml深孔板(axygen,unioncity,ca,usa)在1.0ml的总反应体积中进行。水解用50mg的不溶性pcs固形物每ml的含有1mm硫酸锰的50mm乙酸钠ph5.0缓冲液和多种蛋白加载量的多种酶组合物(表示为mg蛋白每克纤维素)进行。如实施例6中所述制备酶组合物,然后以50μl至200μl范围的体积同时添加至所有孔,至各反应中终体积为1ml。然后使用alps-300tm平板热密封器(abgene,epsom,unitedkingdom)密封平板,充分混合,并在特定温度温育72小时。所有报道的反应重复三次进行。在水解之后,使用0.45μm96孔过滤板(millipore,bedford,ma,usa)过滤样品,然后如下所述就糖含量分析滤过物。当不立即使用时,将过滤的等分试样冻结于-20℃。稀释于0.005mh2so4的样品的糖浓度使用4.6x250mmhpx-87h柱(bio-radlaboratories,inc.,hercules,ca,usa)通过在65℃用0.05%w/w苯甲酸-0.005mh2so4以0.6ml每分钟的流速洗脱,和通过从由纯糖样品校正的折光率检测(1100hplc,agilenttechnologies,santaclara,ca,usa)所得的葡萄糖、纤维二糖和木糖信号的积分的定量来进行测量。使用所得的葡萄糖和纤维二糖当量对于每个反应计算纤维素转化的百分比。分别测量葡萄糖、纤维二糖和木糖。就合适的稀释因子调整测得的糖浓度。在未洗涤的pcs的情况下,酶法产生的糖的净浓度通过就在零时点未洗涤的pcs中相应的背景糖浓度调整测得的糖浓度来确定。所有hplc数据处理使用microsoftexceltm软件(microsoft,richland,wa,usa)进行。使用下式计算纤维素转化为葡萄糖的程度:%转化=(葡萄糖浓度/限制消化中的葡萄糖浓度)x100。为了计算%转化,基于纤维素酶对照(100mg的里氏木霉纤维素酶每克纤维素)设定100%转化点,并将所有值除以该数值并接着乘以100。将三次重复数据点取平均值,并计算标准偏差。实施例6:高温酶组合物的制备烟曲霉纤维二糖水解酶ii的制备。烟曲霉gh6a纤维二糖水解酶ii(wo2011/057140中的seqidno:18)如wo2011/057140中所述在米曲霉中重组制备。将烟曲霉gh6a纤维二糖水解酶ii经过滤的培养液使用400mlsephadextmg-25柱(gehealthcare,unitedkingdom)根据生产商的指示缓冲液交换入20mmtrisph8.0。将级分汇集并调整至1.2m硫酸铵-20mmtrisph8.0。将经平衡的蛋白加载于在含1.2m硫酸铵的20mmtrisph8.0中平衡的phenylsepharosetm6fastflow柱(highsub)之上,并将结合的蛋白用不含硫酸铵的20mmtrisph8.0洗脱。将级分汇集。具有纤维素分解增强活性的青霉属菌种(emersonii)gh61a多肽的制备。青霉属菌种(emersonii)gh61a多肽(wo2011/041397中的seqidno:2)根据wo2011/041397重组制备和纯化。里氏木霉gh5内切葡聚糖酶ii的制备。里氏木霉gh5内切葡聚糖酶ii(wo2011/057140中的seqidno:22)根据wo2011/057140重组制备。将里氏木霉gh5内切葡聚糖酶ii经过滤的培养液使用切向流(10k膜,pallcorporation)根据生产商的指示脱盐并缓冲液交换入20mmtrisph8.0。烟曲霉cel3aβ-葡糖苷酶的制备。烟曲霉cel3aβ-葡糖苷酶(wo2005/047499中的seqidno:2)根据wo2005/047499使用米曲霉作为宿主来重组制备。将烟曲霉cel3aβ-葡糖苷酶经过滤的培养液使用配置有10kda聚醚砜膜的切向流浓缩器浓缩并用20mmtris-hclph8.5缓冲液交换。将样品加载于在20mmtrisph8.5中平衡的qhighperformance柱(gehealthcare,piscataway,nj,usa)上,并将结合的蛋白用0-600mm氯化钠的线性梯度洗脱。将级分浓缩并加载于用20mmtris-150mm氯化钠ph8.5平衡的75hr26/60柱上。烟曲霉gh10木聚糖酶的制备。烟曲霉gh10木聚糖酶(xyn3)(wo2011/057140中的seqidno:48)根据wo2006/078256使用米曲霉bech2(wo2000/39322)作为宿主重组制备。将烟曲霉nn055679gh10木聚糖酶(xyn3)经过滤的培养液使用26/10desaltingcolumn根据生产商的指示脱盐并缓冲液交换入50mm乙酸钠ph5.0。埃默森踝节菌gh3β-木糖苷酶的制备。埃默森踝节菌gh3β-木糖苷酶(wo2011/057140中的seqidno:60)在米曲霉中如wo2011/057140中所述重组制备。将埃默森踝节菌gh3β-木糖苷酶使用切向流(10k膜,pallcorporation)根据生产商的指示脱盐并缓冲液交换入50mm乙酸钠ph5.0。对于每种上述的单组分的蛋白浓度使用microplatebcatmproteinassaykit确定,其中使用牛血清白蛋白作为蛋白标样。高温酶组合物如下所述包含每种如上所述制备的单组分:25%烟曲霉cel6a纤维二糖水解酶ii,15%具有纤维素分解增强活性的penicilliumemersoniigh61a多肽、10%里氏木霉gh5内切葡聚糖酶ii、5%烟曲霉gh10木聚糖酶(xyn3)、5%烟曲霉β-葡糖苷酶突变体3%埃默森踝节菌β-木糖苷酶。高温酶组合物在本文中命名为“不含纤维二糖水解酶i的高温酶组合物”。实施例7:在50-65℃使用经磨制、未经洗涤的pcs时talaromycesbyssochlamydoidesgh7纤维二糖水解酶i(seqidno:2,p247b5)对高温酶组合物的作用使用经磨制、未经洗涤的pcs作为底物在50℃,55℃,60℃和65℃在不含纤维二糖水解酶i的高温酶组合物中评估talaromycesbyssochlamydoidesgh7纤维二糖水解酶i(p247b5)。将不含纤维二糖水解酶i的高温酶组合物(实施例6)以1.9mg总蛋白每克纤维素和3.0mg总蛋白每克纤维素添加至pcs水解反应,并将水解结果与对于添加gh7纤维二糖水解酶i(3.0mg蛋白每g纤维素)的类似的高温酶组合物的结果相比较。测定如实施例5中所述进行。用经磨制、未经洗涤的pcs(5%不溶性固体)的1ml反应在含有1mm硫酸锰的50mm乙酸钠ph5.0中进行72小时。所有反应进行一式三次,并涉及在水解开始时的单次混合。表1中所示的结果说明在50℃,55℃,60℃和65℃,含有talaromycesbyssochlamydoidesgh7纤维二糖水解酶i(p247b5)的高温酶组合物与不含纤维二糖水解酶i的酶组合物相比显著地性能更佳。表1:%转化(纤维素至葡萄糖)序列表<110>诺维信公司(novozymesa/s)诺维信股份有限公司(novozymes,inc.)<120>具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸<130>12186-cn-pcd<160>26<170>patentinversion3.5<210>1<211>1507<212>dna<213>talaromycesbyssochlamydoides<400>1atgtttcgacgggctcttttcctgtcctcttccgccttccttgctgtcaaagcccagcag60atcggcacggtcagtccggagaaccatccgcccctggcatgggagcagtgcactgcccct120gggagttgcacgactgtgaatggtgcggtcgtccttgatgcgaactggcgttgggtccac180aatgttgggggatacaccaactgctacactggcaatacctgggacaccacgtactgccct240gacgacgtgacctgcgcagagaattgtgcgctggatggcgcagattacgagggcacctac300ggcgtgaccacctcgggcagctccctgaagctcgatttcgtcaccgggtctaacgtcgga360tctcgtctctacctgttggagaatgattcgacctatcagatcttcaagcttctgaaccag420gaattcacctttgacgtcgacgtttccaatcttccgtgcggattaaacggcgctctgtac480cttgttaccatggctgctgacggcggggtgtctcagtacccgaataacaaggccggcgca540gcgtatggaaccggttattgcgattcccagtgtccaagggacttgaagtttatcgatggc600caggtatgtagagctgtaatcacccatgttgtgaaatcactctcctactgacatggtcga660tttataggccaacgttgagggctggcagccgtcttcgaacaacgccaatacaggtattgg720caaccatggctcctgctgtgcggagatggatatctgggaagccaacagcatctccaatgc780ggtgactccgcacccatgcgacacacccggccagacaatgtgcgaggggaacgactgtgg840tggcacgtattccaccaatcgctatgcaggcacctgcgatcctgacggctgcgacttcaa900cccctaccgcatgggcaaccattctttctacggccctggggagattgtcgatactaccca960gcccttcactgtcgtgacacagttccttaccgatgatggcacggatactggcactctcag1020cgagatcaaacgcttctacgtccaaaacgggaaagtcattcctcagccgaactccgacat1080tgccggcgtgactggcaactcgatcaccagcgagttttgcgatgcccagaagacggcttt1140cggcgacattaacaactttgatacacacggcggtctggccagtatgggagctgcgctgca1200gcagggtatggttctggtgatgagtctgtgggacggtaggtccttgggagacacccggac1260gttctatatcaaccagaactgccagaactgacgaattaaaacacttttagattacgcggc1320aaacatgctgtggttggacagcatttatccaacaaatgcatctgctagcactcctggtgc1380tgctcgtggaacctgttcgacgagctccggtgtcccatcgcaagtcgagtcgcagagccc1440caacgcctacgtgacgtactccaacattaaagttggaccaatcaactcgaccttcaccac1500ttcgtaa1507<210>2<211>455<212>prt<213>talaromycesbyssochlamydoides<400>2metpheargargalaleupheleuserserseralapheleualaval151015lysalaglnglnileglythrvalserprogluasnhisproproleu202530alatrpgluglncysthralaproglysercysthrthrvalasngly354045alavalvalleuaspalaasntrpargtrpvalhisasnvalglygly505560tyrthrasncystyrthrglyasnthrtrpaspthrthrtyrcyspro65707580aspaspvalthrcysalagluasncysalaleuaspglyalaasptyr859095gluglythrtyrglyvalthrthrserglyserserleulysleuasp100105110phevalthrglyserasnvalglyserargleutyrleuleugluasn115120125aspserthrtyrglnilephelysleuleuasnglngluphethrphe130135140aspvalaspvalserasnleuprocysglyleuasnglyalaleutyr145150155160leuvalthrmetalaalaaspglyglyvalserglntyrproasnasn165170175lysalaglyalaalatyrglythrglytyrcysaspserglncyspro180185190argaspleulyspheileaspglyglnalaasnvalgluglytrpgln195200205proserserasnasnalaasnthrglyileglyasnhisglysercys210215220cysalaglumetaspiletrpglualaasnserileserasnalaval225230235240thrprohisprocysaspthrproglyglnthrmetcysgluglyasn245250255aspcysglyglythrtyrserthrasnargtyralaglythrcysasp260265270proaspglycysasppheasnprotyrargmetglyasnhisserphe275280285tyrglyproglygluilevalaspthrthrglnprophethrvalval290295300thrglnpheleuthraspaspglythraspthrglythrleuserglu305310315320ilelysargphetyrvalglnasnglylysvalileproglnproasn325330335seraspilealaglyvalthrglyasnserilethrsergluphecys340345350aspalaglnlysthralapheglyaspileasnasnpheaspthrhis355360365glyglyleualasermetglyalaalaleuglnglnglymetvalleu370375380valmetserleutrpaspasptyralaalaasnmetleutrpleuasp385390395400seriletyrprothrasnalaseralaserthrproglyalaalaarg405410415glythrcysserthrserserglyvalproserglnvalglusergln420425430serproasnalatyrvalthrtyrserasnilelysvalglyproile435440445asnserthrphethrthrser450455<210>3<211>1614<212>dna<213>talaromycesbyssochlamydoides<400>3atgtccgcctctctttcttacagactctacgaaaatgctctcattctctgttccctcgtg60gttgctgcccagggccagcagattggcaccttgcaggctgaggtccacccttctctgact120tgggagacctgcagcaccggcggcagttgtaccaccatcgacggctctatcgtccttgat180gccaactggcgctgggtccaccaggtcggcaccagcaccaactgctataccggcaatacc240tgggatacctccatctgcgataccgatacgacctgtgcccaagaatgcgctgtcgatggt300gctgactacgagagcacctacggtatcaccaccagcggcaatgaagttcgtctcaacttt360gtcaccgacaactcgaatggagcgaacgtcggctcccgtgtctacctaatggcggatgac420acccactaccagatcttcaatctgctgaaccaggagtttaccttcacagtggatgtctca480aacctgccctgcggtctcaacggcgccctctacctcgttgttatggatgccgacggtggt540gtatccgagtatacgaataatgcggctggtgctcagtatggtgtgggctactgtgactcg600cagtgtccccgagatctcaagttcatccaaggccaggccaacgttgagggctggacacct660tcctccaataatgccaatactggtgttgggaacctcgggtcctgctgtgcagaaatagat720atctgggaatcgaacagcatttctcaagcgcttaccgcccatccgtgcaacactcccaca780aatacggtgtgtgatggcaacgcctgcggtggcacatacagcactactcgctatgctggc840acttgtgatcctgatggctgtgatttcaacccgtaccggttgggcaacacgactttctat900ggtcctggcatgactattgataccacccagccgatcaccgttgtcactcagttcatcact960gatgatggaacttccactggcaccttgtctgaaattaagcgctactacattcagaacgac1020gtcgtgtatgcccagcccaactccgacatcgctggcattactggaaatgtcattgatgcc1080gcttactgtaccgctgagaattctgtcttccaagaagaaggttccttcgcacaacacggt1140ggcatgagtggtgtcagtgaggctctgtccgctggtatggtcttggtcatgagcgtgtgg1200gatgactacgacgccaatatgctgtggctcgacagcgactacccaaccaacgagtctaca1260agcacccccggtgtggcccgaggtagctgttccacttcctctggtgttcccgccaccgtt1320gaatcccagagccctaactcctatgtgatctactcgaacatcaaggttggtcccatcggc1380tcgaccttcagttccggtggttctggcagtggctctggcggcggttccggtggctctagc1440accactacaaccaccacttcgtccacgcccacgactaccagctcttccggctctggcagt1500ggcgtcgctcagcactggggacagtgcggtggtgagggctggactggcccaactacctgt1560gcctccccgtacacctgtcaggagcagaacccttactactcccagtgtctgtaa1614<210>4<211>537<212>prt<213>talaromycesbyssochlamydoides<400>4metseralaserleusertyrargleutyrgluasnalaleuileleu151015cysserleuvalvalalaalaglnglyglnglnileglythrleugln202530alagluvalhisproserleuthrtrpgluthrcysserthrglygly354045sercysthrthrileaspglyserilevalleuaspalaasntrparg505560trpvalhisglnvalglythrserthrasncystyrthrglyasnthr65707580trpaspthrserilecysaspthraspthrthrcysalaglnglucys859095alavalaspglyalaasptyrgluserthrtyrglyilethrthrser100105110glyasngluvalargleuasnphevalthraspasnserasnglyala115120125asnvalglyserargvaltyrleumetalaaspaspthrhistyrgln130135140ilepheasnleuleuasnglngluphethrphethrvalaspvalser145150155160asnleuprocysglyleuasnglyalaleutyrleuvalvalmetasp165170175alaaspglyglyvalserglutyrthrasnasnalaalaglyalagln180185190tyrglyvalglytyrcysaspserglncysproargaspleulysphe195200205ileglnglyglnalaasnvalgluglytrpthrproserserasnasn210215220alaasnthrglyvalglyasnleuglysercyscysalagluileasp225230235240iletrpgluserasnserileserglnalaleuthralahisprocys245250255asnthrprothrasnthrvalcysaspglyasnalacysglyglythr260265270tyrserthrthrargtyralaglythrcysaspproaspglycysasp275280285pheasnprotyrargleuglyasnthrthrphetyrglyproglymet290295300thrileaspthrthrglnproilethrvalvalthrglnpheilethr305310315320aspaspglythrserthrglythrleusergluilelysargtyrtyr325330335ileglnasnaspvalvaltyralaglnproasnseraspilealagly340345350ilethrglyasnvalileaspalaalatyrcysthralagluasnser355360365valpheglnglugluglyserphealaglnhisglyglymetsergly370375380valserglualaleuseralaglymetvalleuvalmetservaltrp385390395400aspasptyraspalaasnmetleutrpleuaspserasptyrprothr405410415asngluserthrserthrproglyvalalaargglysercysserthr420425430serserglyvalproalathrvalgluserglnserproasnsertyr435440445valiletyrserasnilelysvalglyproileglyserthrpheser450455460serglyglyserglyserglyserglyglyglyserglyglyserser465470475480thrthrthrthrthrthrserserthrprothrthrthrserserser485490495glyserglyserglyvalalaglnhistrpglyglncysglyglyglu500505510glytrpthrglyprothrthrcysalaserprotyrthrcysglnglu515520525glnasnprotyrtyrserglncysleu530535<210>5<211>27<212>dna<213>人工的<220><223>pcr引物<220><221>misc_feature<222>(24)..(24)<223>n是a,c,g,或t<400>5gtcgttcttgatgcgaaytggmgntgg27<210>6<211>25<212>dna<213>人工的<220><223>pcr引物<220><221>misc_feature<222>(20)..(20)<223>n是a,c,g,或t<220><221>misc_feature<222>(23)..(23)<223>n是a,c,g,或t<400>6cctgcgcccagaactgygcnbtnga25<210>7<211>30<212>dna<213>人工的<220><223>pcr引物<220><221>misc_feature<222>(22)..(22)<223>n是a,c,g,或t<220><221>misc_feature<222>(25)..(25)<223>n是a,c,g,或t<400>7tgacgtcgatgtctccaatytnccntgygg30<210>8<211>29<212>dna<213>人工的<220><223>pcr引物<220><221>misc_feature<222>(24)..(24)<223>n是a,c,g,或t<400>8gcatccgtcgggtagtcgswrtcnarcca29<210>9<211>29<212>dna<213>人工的<220><223>pcr引物<220><221>misc_feature<222>(24)..(24)<223>n是a,c,g,或t<220><221>misc_feature<222>(26)..(26)<223>n是a,c,g,或t<400>9gtcgggtagtcggaatccarccanwncat29<210>10<211>24<212>dna<213>人工的<220><223>pcr引物<220><221>misc_feature<222>(16)..(16)<223>n是a,c,g,或t<220><221>misc_feature<222>(22)..(22)<223>n是a,c,g,或t<400>10gcctggcgtgtcgcanggrtgngg24<210>11<211>23<212>dna<213>人工的<220><223>pcr引物<400>11aacaactttgatacacacggcgg23<210>12<211>22<212>dna<213>人工的<220><223>pcr引物<400>12ctgcagcagggtatggttctgg22<210>13<211>22<212>dna<213>人工的<220><223>pcr引物<400>13tggtgatgagtctgtgggacgg22<210>14<211>22<212>dna<213>人工的<220><223>pcr引物<400>14gtcagcagccatggtaacaagg22<210>15<211>23<212>dna<213>人工的<220><223>pcr引物<400>15tggtaacaaggtacagagcgccg23<210>16<211>23<212>dna<213>人工的<220><223>pcr引物<400>16gtacagagcgccgtttaatccgc23<210>17<211>23<212>dna<213>人工的<220><223>pcr引物<400>17actgtaccgctgagaattctgtc23<210>18<211>22<212>dna<213>人工的<220><223>pcr引物<400>18gcatgagtggtgtcagtgaggc22<210>19<211>22<212>dna<213>人工的<220><223>pcr引物<400>19tggtgtcagtgaggctctgtcc22<210>20<211>22<212>dna<213>人工的<220><223>pcr引物<400>20ccataacaacgaggtagagggc22<210>21<211>23<212>dna<213>人工的<220><223>pcr引物<400>21cagggcaggtttgagacatccac23<210>22<211>22<212>dna<213>人工的<220><223>pcr引物<400>22tctggtagtgggtgtcatccgc22<210>23<211>46<212>dna<213>人工的<220><223>pcr引物<400>23acacaactggggatccaccatgtttcgacgggctcttttcctgtcc46<210>24<211>50<212>dna<213>人工的<220><223>pcr引物<400>24acacaactggggatccaccatgtccgcctctctttcttacagactctacg50<210>25<211>43<212>dna<213>人工的<220><223>pcr引物<400>25agatctcgagaagcttacgaagtggtgaaggtcgagttgattg43<210>26<211>42<212>dna<213>人工的<220><223>pcr引物<400>26agatctcgagaagcttacagacactgggagtagtaagggttc42当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1