用于使用工程化酵母菌株从含有木糖的纤维素基质生产乙醇的改善方法与流程

文档序号:18514572发布日期:2019-08-24 09:22阅读:698来源:国知局
用于使用工程化酵母菌株从含有木糖的纤维素基质生产乙醇的改善方法与流程
本申请含有处于计算机可读形式的序列表,将其通过引用结合在此。
背景技术
:乙醇是通常共混入汽油中的运输燃料。纤维素材料用作乙醇生产方法中的原料。在本领域中存在若干种用于制造含有葡萄糖、甘露糖、木糖和阿拉伯糖的纤维素和半纤维素水解产物的方法。葡萄糖和甘露糖在天然无氧代谢过程中有效地转化为乙醇。然而,为了以工业规模获得经济上相关的方法,水解产物中的木糖必须发酵成乙醇。已经报道了建立和改善酵母(酿酒酵母)的戊糖(例如,木糖)利用方面的努力(kim等人,2013,biotechnoladv.[生物技术进展]31(6):851-61)。这些包括来自天然发酵木糖的酵母如树干毕赤酵母(scheffersomyces(pichia)stipitis)和各种假丝酵母属(candida)菌种的木糖还原酶(xr)和木糖醇脱氢酶(xdh)的异源表达,以及木酮糖激酶(xk)和非氧化性戊糖磷酸途径(ppp)中的四种酶,即转酮酶(tkl)、转醛酶(tal)、核糖-5-磷酸酮醇异构酶(rki)和d-核酮糖-5-磷酸3-差向异构酶(rpe)的过表达。已经发现在此类系统中修饰树干毕赤酵母xr对nadh的辅因子偏好提供代谢优势以及改善厌氧生长。还已经报道了用异源木糖异构酶(xi)替换xr/xdh的途径。这些和其他修饰已描述于,例如wo2003/062430、wo2009/017441、wo2010/059095、wo2012/113120、和wo2012/135110中。尽管在过去十年中对从纤维素材料的乙醇生产方法进行了改善,但是跨酵母膜摄取戊糖(例如木糖)仍然是一个挑战。在一种办法中,具有木糖还原酶(xr)/木糖醇脱氢酶(xdh)途径的酿酒酵母宿主细胞经过工程化以过表达各种己糖转运体(hxt1、hxt2、hxt5和hxt7),但显示在葡萄糖和木糖的共发酵过程中较差的木糖消耗(<60%)(goncalves等人,2014,enzymemicrob.technol.[酶与微生物技术],63:13-20)。该研究报道,过表达hxt2的菌株产生不完全的厌氧发酵,其中乙醇比率与表达任何其他转运体(hxt1、hxt5或hxt7)的菌株相比显著降低。因此,仍然需要可以用于使用含有木糖的纤维素植物废物基质来改善乙醇生产的新工业方法,例如在氧限制条件下同时利用戊糖(例如木糖)和葡萄糖的发酵方法。技术实现要素:本文描述了包含编码己糖转运体(例如hxt2)的异源多核苷酸的重组宿主细胞,其中所述细胞能够发酵戊糖(例如木糖)。在一个方面,所述重组细胞进一步包含编码木糖异构酶的异源多核苷酸。在一些实施例中,所述己糖转运体与seqidno:2具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。在一些实施例中,所述己糖转运体具有以下氨基酸序列,该氨基酸序列包含seqidno:2的氨基酸序列或由seqidno:2的氨基酸序列组成。在一些实施例中,所述木糖异构酶与seqidno:18具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。在一些实施例中,所述木糖异构酶具有以下氨基酸序列,该氨基酸序列包含seqidno:18的氨基酸序列或由seqidno:18的氨基酸序列组成。在一些实施例中,与没有编码己糖转运体的异源多核苷酸的相同细胞相比,在孵育约4天或孵育4天后(例如在实例2中描述的条件下),重组细胞能在戊糖(例如木糖)上有更高的厌氧生长速率。在一些实施例中,与没有编码己糖转运体的异源多核苷酸的相同细胞相比,在发酵约40小时或发酵40小时后(例如在实例3中描述的条件下),重组细胞能有更高的戊糖(例如木糖)消耗。在一些实施例中,在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),重组细胞能够消耗培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的戊糖(例如木糖),和/或能够消耗培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的葡萄糖。在一些实施例中,与没有编码己糖转运体的异源多核苷酸的相同细胞相比,在发酵约40小时或发酵40小时后(例如在实例3中描述的条件下),重组细胞能有更高的乙醇生产。在一些实施例中,所述重组细胞进一步包含编码木酮糖激酶(xk),例如与seqidno:22具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的xk的异源多核苷酸。在一些实施例中,所述重组细胞进一步包含编码选自以下的多肽的异源多核苷酸:核酮糖5磷酸3-差向异构酶(rpe1)、核酮糖5磷酸异构酶(rki1)、转酮酶(tkl1)、转醛酶(tal1)。在一些实施例中,重组细胞包含对编码gpd和/或gpp的一种或多种内源基因的破坏。在一些实施例中,重组细胞选自酵母属(saccharomyces)、红酵母属(rhodotorula)、裂殖酵母属(schizosaccharomyces)、克鲁维酵母属(kluyveromyces)、毕赤酵母属(pichia)、汉逊酵母属(hansenula)、红冬孢酵母属(rhodosporidium)、假丝酵母属(candida)、耶氏酵母属(yarrowia)、油脂酵母属(lipomyces)、隐球菌属(cryptococcus)或德克拉酵母属(dekkera)菌种细胞。在一些实施例中,重组细胞是酿酒酵母细胞,例如菌株酿酒酵母cibts1260(在美国伊利诺伊州(illinois)61604农业研究服务菌种保藏中心(nrrl)登录号nrrly-50973下保藏)的衍生物。还描述了使用重组细胞生产乙醇的方法。一个方面是用于生产乙醇的方法,该方法包括在适合的条件下,在可发酵培养基中培养本文描述的重组细胞以生产乙醇。在另一方面,是用于生产乙醇的方法,该方法包括:(a)用酶组合物糖化含纤维素材料和/或含淀粉材料;和(b)用本文描述的重组细胞发酵步骤(a)的经糖化的材料。在所述方法的一些实施例中,在相同条件(例如在发酵约40小时或发酵40小时后,如实例3中描述的条件)下,当与使用没有该编码己糖转运体的异源多核苷酸的相同细胞的发酵相比时,发酵消耗了增加量的葡萄糖和戊糖(例如木糖)。在一个实施例中,在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的戊糖(例如木糖)被消耗,和/或培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的葡萄糖被消耗。在所述方法的一些实施例中,在相同条件(例如在发酵约40小时或发酵40小时后,如实例3中描述的条件)下,当与使用没有该编码己糖转运体的异源多核苷酸的相同细胞的发酵相比时,发酵提供更高的乙醇产率。在所述方法的一些实施例中,发酵在厌氧条件下进行。在所述方法的一些实施例中,进一步包括从发酵回收发酵产物。在所述方法的一些实施例中,糖化发生在纤维素材料上,且该纤维素材料是经预处理的。在一些实施例中,预处理是稀酸预处理。在所述方法的一些实施例中,糖化发生在纤维素材料上,且酶组合物包含一种或多种选自以下的酶:纤维素酶、aa9多肽、半纤维素酶、cip、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶、以及膨胀素。在一些实施例中,该纤维素酶是选自以下的一种或多种酶:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。在一些实施例中,该半纤维素酶是选自以下的一种或多种酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。在所述方法的一些实施例中,糖化和发酵在同时糖化和发酵(ssf)中同时进行。在一些实施例中,顺序地进行糖化和发酵(shf)。附图说明图1示出了pfyd1090的质粒图。图2示出了pfyd1092的质粒图。图3示出了pfyd1497的质粒图。图4示出了来自在sd2(葡萄糖)和sx2(木糖)琼脂板上在30℃孵育的厌氧点样测试的结果。制备每种菌株的稀释系列以将约2000、200、20和2个菌落形成单位(cfu)点样到板上,以板的左侧上2000cfu开始。图5示出了来自sx2.5培养基中厌氧注射器发酵的结果。◆和▲:fyd853发酵的木糖和etoh分别的浓度(g/l)。◇和△:fyd1547发酵的木糖和etoh分别的浓度(g/l)。实线表示fyd853发酵的中值,并且虚线表示fyd1547发酵的中值。图6示出了来自sd5x2.5培养基中厌氧注射器发酵的结果。■、◆和▲:fyd853发酵的葡萄糖、木糖和etoh分别的浓度(g/l)。□、◇和△:fyd1547发酵的葡萄糖、木糖和etoh分别的浓度(g/l)。实线表示fyd853发酵的中值,并且虚线表示fyd1547发酵的中值。图7示出了sd2(葡萄糖)培养基中酵母菌株fyd853和fyd1547的有氧生长。图8示出了sx1/sd1(木糖+葡萄糖)培养基中酵母菌株fyd853和fyd1547的有氧生长。图9示出了sx2(木糖)培养基中酵母菌株fyd853和fyd1547的有氧生长。图10示出了sd2(葡萄糖)培养基中酵母菌株mbg4982和mcts1084-1087的有氧生长。图11示出了sx1/sd1(木糖+葡萄糖)培养基中酵母菌株mbg4982和mcts1084-1087的有氧生长。图12示出了sx2(木糖)培养基中酵母菌株mbg4982和mcts1084-1087的有氧生长。图13示出了来自sx6、sd6或sx3/sd3培养基中酵母菌株fyd853和fyd1547的发酵样品的乙醇浓度。图14示出了来自sx6、sd6或sx3/sd3培养基中酵母菌株mbg4982和mcts1084-1087的发酵样品的乙醇浓度。图15示出了p51-f11背景的具有xr/xdh木糖利用途径的菌株在sd2培养基中的生长。图16示出了p51-f11背景的具有xr/xdh木糖利用途径的菌株在sx1/sd1培养基中的生长。图17示出了p51-f11背景的具有xr/xdh木糖利用途径的菌株在sx2培养基中的生长。图18示出了p52-b02背景的具有xr/xdh木糖利用途径的菌株在sd2培养基中的生长。图19示出了p52-b02背景的具有xr/xdh木糖利用途径的菌株在sx1/sd1培养基中的生长。图20示出了p52-b02背景的具有xr/xdh木糖利用途径的菌株在sx2培养基中的生长。图21示出了p55-h01背景的具有xr/xdh木糖利用途径的菌株在sd2培养基中的生长。图22示出了p55-h01背景的具有xr/xdh木糖利用途径的菌株在sx1/sd1培养基中的生长。图23示出了p55-h01背景的具有xr/xdh木糖利用途径的菌株在sx2培养基中的生长。定义等位基因变体:术语“等位基因变体”意指占据同一染色体基因座的基因的两种或更多种替代形式中的任一种。等位基因变异通过突变而自然产生,并且可以导致群体内部的多态性。基因突变可以是沉默的(所编码的多肽无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。辅助活性9:术语“辅助活性9”或“aa9”意指分类为溶解性多糖单加氧酶(quinlan等人,2011,proc.natl.acad.sci.usa[美国国家科学院院刊]208:15079-15084;phillips等人,2011,acschem.biol.[acs化学生物学]6:1399-1406;lin等人,2012,structure[结构]20:1051-1061)的多肽。根据henrissat,1991,biochem.j.[生物化学杂志]280:309-316以及henrissat和bairoch,1996,biochem.j.[生物化学杂志]316:695-696,aa9多肽之前被分类为糖苷水解酶家族61(gh61)。aa9多肽通过具有纤维素分解活性的酶增强纤维素材料的水解。可以通过测量在以下条件下来自由纤维素分解酶水解纤维素材料的还原糖的增加或纤维二糖与葡萄糖总量的增加来确定纤维素分解增强活性:1-50mg总蛋白/g预处理的玉米秸秆(pcs)中的纤维素,其中总蛋白包括50%w/w-99.5%w/w纤维素分解酶蛋白和0.5%w/w-50%w/waa9多肽蛋白,在适合的温度(例如40℃-80℃,例如,50℃、55℃、60℃、65℃、或70℃)、和适合的ph(例如4-9,例如,4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、或8.5)下持续1-7天,与不具有纤维素分解增强活性的相等的总蛋白负载的对照水解(1-50mg纤维素分解蛋白/gpcs中的纤维素)进行比较。可以使用celluclasttm1.5l(诺维信公司,巴格斯瓦德(bagsvaerd),丹麦)和β-葡糖苷酶的混合物作为纤维素分解活性的来源来确定aa9多肽增强活性,其中该β-葡糖苷酶是以纤维素酶蛋白负载的至少2%-5%蛋白质的重量存在的。在一个实施例中,该β-葡糖苷酶是米曲霉(aspergillusoryzae)β-葡糖苷酶(例如,根据wo02/095014,在米曲霉中重组产生的)。在另一个实施例中,该β-葡糖苷酶是烟曲霉(aspergillusfumigatus)β-葡糖苷酶(例如,如在wo02/095014中所述的,在米曲霉中重组产生的)。aa9多肽增强活性还可通过以下来确定:在40℃,将aa9多肽与0.5%磷酸溶胀纤维素(pasc)、100mm乙酸钠(ph5)、1mmmnso4、0.1%没食子酸、0.025mg/ml的烟曲霉β-葡糖苷酶,以及0.01%x-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)一起孵育24-96小时,接着确定从pasc释放的葡萄糖。还可以根据wo2013/028928确定高温组合物的aa9多肽增强活性。aa9多肽通过将达到相同的水解程度所需要的纤维素分解酶的量降低优选至少1.01倍,例如,至少1.05倍、至少1.10倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、或至少20倍,来增强由具有纤维素分解活性的酶催化的纤维素材料的水解。β-葡糖苷酶:术语“β-葡糖苷酶”意指β-d-葡糖苷葡糖水解酶(beta-d-glucosideglucohydrolase)(e.c.3.2.1.21),其催化末端非还原β-d-葡萄糖残基的水解,并释放β-d-葡萄糖。可以根据venturi等人,2002,j.basicmicrobiol.[基础微生物学杂志]42:55-66的程序使用对硝基苯基-β-d-吡喃葡萄糖苷作为底物来测定β-葡糖苷酶活性。一个单位的β-葡糖苷酶定义为在25℃、ph4.8下,在含有0.01%20的50mm柠檬酸钠中从作为底物的1mm对硝基苯基-β-d-吡喃葡萄糖苷每分钟产生1.0微摩尔的对硝基苯酚阴离子。β-木糖苷酶:术语“β-木糖苷酶”意指β-d-木糖苷木糖水解酶(β-d-xylosidexylohydrolase)(e.c.3.2.1.37),其催化短β(1→4)-低聚木糖的外切水解,以将连续的d-木糖残基从非还原端移除。可以在含有0.01%20的100mm柠檬酸钠中,在ph5,40℃,使用1mm对硝基苯基-β-d-木糖苷作为底物来确定β-木糖苷酶活性。一个单位的β-木糖苷酶定义为在40℃、ph5,在含有0.01%20的100mm柠檬酸钠中从1mm对硝基苯基-β-d-木糖苷每分钟产生1.0微摩尔的对硝基酚根阴离子。过氧化氢酶:术语“过氧化氢酶”意指过氧化氢:过氧化氢氧化还原酶(ec1.11.1.6),该酶催化2h2o2转化为o2+2h2o。出于本发明的目的,根据美国专利号5,646,025确定过氧化氢酶活性。一个单位的过氧化氢酶活性等于在测定条件下催化1微摩尔的过氧化氢氧化的酶的量。纤维二糖水解酶:术语“纤维二糖水解酶”意指1,4-β-d-葡聚糖纤维二糖水解酶(e.c.3.2.1.91和e.c.3.2.1.176),其催化纤维素、纤维寡糖、或任何含β-1,4-连接的葡萄糖的聚合物中的1,4-β-d-糖苷键的水解,从该链的还原端(纤维二糖水解酶i)或非还原端(纤维二糖水解酶ii)释放纤维二糖(teeri,1997,trendsinbiotechnology[生物技术趋势]15:160-167;teeri等人,1998,biochem.soc.trans.[生物化学学会会刊]26:173-178)。可以根据由以下描述的规程来测定纤维二糖水解酶活性:lever等人,1972,anal.biochem.[分析生物化学]47:273-279;vantilbeurgh等人,1982,febsletters[欧洲生化学会联合会快报]149:152-156;vantilbeurgh和claeyssens,1985,febsletters[欧洲生化学会联合会快报]187:283-288;和tomme等人,1988,eur.j.biochem.[欧洲生物化学杂志]170:575-581。纤维素分解酶组合物或纤维素酶:术语“纤维素分解酶组合物”或“纤维素酶”意指水解纤维素材料的一种或多种(例如若干种)酶。这类酶包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、或其组合。用于测量纤维素分解酶活性的两种基本方法包括:(1)测量总纤维素分解酶活性,以及(2)测量个体纤维素分解酶活性(内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶),如在zhang等人,2006,biotechnologyadvances[生物技术进展]24:452-481中所述的。可使用不溶性底物,包括沃特曼(whatman)№1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、预处理的木质纤维素等,测量总纤维素分解酶活性。最常见的总纤维素分解活性测定法是使用whatman№1滤纸作为底物的滤纸测定法。该测定是由国际纯粹与应用化学联合会(iupac)建立的(ghose,1987,pureappl.chem.[纯粹与应用化学]59:257-68)。可以通过测量在以下条件下,由一种或多种纤维素分解酶进行的纤维素材料水解期间,糖的产生/释放的增加来确定纤维素分解酶活性:1-50mg纤维素分解酶蛋白/g预处理的玉米秸秆(pcs)中的纤维素(或其他预处理的纤维素材料),在适合的温度(例如40℃-80℃,例如,50℃、55℃、60℃、65℃、或70℃),以及在适合的ph(例如4-9,例如,5.0、5.5、6.0、6.5、或7.0)下持续3-7天,与未添加纤维素分解酶蛋白的对照水解相比。典型条件为:1ml反应,洗涤或未洗涤的pcs,5%不溶性固体(干重),50mm乙酸钠(ph5),1mmmnso4,50℃、55℃、或60℃,72小时,通过hpx-87h柱层析(伯乐实验室有限公司(bio-radlaboratories,inc.),赫拉克勒斯,加利福尼亚州,美国)进行糖分析。纤维素材料:术语“纤维素材料”意指包含纤维素的任何材料。生物质的初生细胞壁中的主要多糖是纤维素,第二丰富的是半纤维素,而第三丰富的是果胶。细胞停止生长后产生的次生细胞壁也含有多糖,并且它通过与半纤维素共价交联的聚合木质素得到强化。纤维素是脱水纤维二糖的均聚物,因此是线性β-(1-4)-d-葡聚糖,而半纤维素包括多种化合物,例如具有一系列取代基以复杂支链结构存在的木聚糖、木葡聚糖、阿拉伯糖基木聚糖、以及甘露聚糖。尽管纤维素一般为多形态的,但发现其在植物组织中主要作为平行葡聚糖链的不溶性晶体基质存在。半纤维素通常氢键结合至纤维素以及其他半纤维素,这有助于稳定细胞壁基质。纤维素通常见于例如植物的茎、叶、壳、皮和穗轴或树的叶、枝和木材(wood)中。纤维素材料可为,但不限于:农业残余物、草本材料(包括能量作物)、城市固体废物、纸浆与造纸厂残余物、废纸和木材(包括林业残余物)(参见,例如,wiselogel等人,1995,于handbookonbioethanol[生物乙醇手册](charlese.wyman编辑),第105-118页,taylor和francis,华盛顿;wyman,1994,bioresourcetechnology[生物资源技术]50:3-16;lynd,1990,appliedbiochemistryandbiotechnology[应用生物化学与生物技术]24/25:695-719;mosier等人,1999,recentprogressinbioconversionoflignocellulosics[木质纤维素的生物转化的最近进展],advancesinbiochemicalengineering/biotechnology[生物化学工程/生物技术的进展],t.scheper主编,第65卷,第23-40页,纽约斯普林格出版社(springer-verlag),纽约。在本申请中应理解的是,纤维素可为任何形式的木质纤维素,在混合基质中含有木质素、纤维素和半纤维素的植物细胞壁材料。在一个实施例中,纤维素材料是任何生物质材料。在另一个实施例中,纤维素材料是木质纤维素,该木质纤维素包含纤维素、半纤维素、以及木质素。在一个实施例中,该纤维素材料是农业废弃物、草本材料(包括能源作物)、城市固体废物、纸浆和造纸厂废弃物、废纸或木材(包括林业废弃物)。在另一实施例中,该纤维素材料是芦竹、甘蔗渣、竹子、玉米芯、玉米纤维、玉米秸秆、芒属、稻秸、柳枝稷或麦秸。在另一实施例中,该纤维素材料是山杨、桉树、冷杉、松树、白杨、云杉或柳树。在另一实施例中,该纤维素材料是海藻纤维素、细菌纤维素、棉短绒、滤纸、微晶纤维素(例如,)、或经磷酸处理的纤维素。在另一个实施例中,该纤维素材料是水生生物质。如本文所用的,术语“水生生物质(aquaticbiomass)”意指在水生环境中通过光合作用过程产生的生物质。水生生物质可为藻类、挺水植物(emergentplant)、浮叶植物(floating-leafplant)或沉水植物(submergedplant)。纤维素材料可按原样使用或可使用本领域已知的常规方法进行预处理,如在本申请中所描述的。在一个优选的实施例中,该纤维素材料进行了预处理。编码序列:术语“编码序列”或“编码区”意指指定一个多肽的氨基酸序列的多核苷酸序列。编码序列的边界一般由开放阅读框决定,该开放阅读框通常以atg起始密码子或替代起始密码子(如gtg和ttg)开始,并且以终止密码子(如taa、tag、和tga)结束。编码序列可以是基因组dna、cdna、合成的多核苷酸、和/或重组多核苷酸的一个序列。控制序列:术语“控制序列”意指多肽表达所必需的核酸序列。控制序列对于编码多肽的多核苷酸可以是天然的或外源的,并且彼此可以是天然的或外源的。此类控制序列包括但不限于,前导子序列、多聚腺苷酸化序列、前肽序列、启动子序列、信号肽序列及转录终止子序列。出于引入有利于将控制序列与编码多肽的多核苷酸的编码区连接的特异性限制性酶切位点的目的,这些控制序列可以提供有多个接头。破坏:术语“破坏”意指参照基因的编码区和/或控制序列被部分或完全修饰(例如通过缺失、插入和/或取代一个或多个核苷酸),从而使得编码的多肽的表达不存在(失活)或降低,和/或编码的多肽的酶活性不存在或降低。可以使用本领域已知的技术测量破坏效果,如使用来自本文参照的无细胞提取物测量值检测酶活性的不存在或降低;或通过对应的mrna的不存在或降低(例如,至少25%降低、至少50%降低、至少60%降低、至少70%降低、至少80%降低或至少90%降低);具有酶活性的对应多肽的量的不存在或降低(例如,至少25%降低、至少50%降低、至少60%降低、至少70%降低、至少80%降低或至少90%降低);或具有酶活性的对应多肽的比活性的不存在或降低(例如,至少25%降低、至少50%降低、至少60%降低、至少70%降低、至少80%降低或至少90%降低)。可以通过本领域已知的方法破坏感兴趣的具体基因,例如通过定向同源重组(directedhomologousrecombination)(参见methodsinyeastgenetics[酵母遗传学方法](1997版),adams,gottschling,kaiser和stems,冷泉港出版社(coldspringharborpress)(1998))。内源基因:术语“内源基因”意指对参照宿主细胞而言天然的基因。“内源基因表达”意指内源基因的表达。内切葡聚糖酶:术语“内切葡聚糖酶”意指4-(1,3;1,4)-β-d-葡聚糖4-葡聚糖水解酶(e.c.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-d-糖苷键,混合β-1,3-1,4葡聚糖如谷类β-d-葡聚糖或木葡聚糖以及含有纤维素组分的其他植物材料中的β-1,4键的内切水解。可以通过测量底物粘度的降低或通过还原糖测量所确定的还原性末端的增加来确定内切葡聚糖酶活性(zhang等人,2006,biotechnologyadvances[生物技术进展]24:452-481)。还可以根据ghose,1987,pureandappl.chem.[纯粹与应用化学]59:257-268的程序,在ph5、40℃,使用羧甲基纤维素(cmc)作为底物来测确内切葡聚糖酶活性。表达:术语“表达”包括在多肽的产生中涉及的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰、以及分泌。可以对表达进行测量—例如,来检测增加的表达—通过本领域已知的技术,例如测量mrna和/或翻译的多肽的水平。表达载体:术语“表达载体”意指线性或环形的dna分子,该分子包括编码多肽的多核苷酸并且被可操作地连接至控制序列,其中这些控制序列提供编码该多肽的多核苷酸的表达。最低限度上,该表达载体包括启动子序列,以及转录和翻译终止信号序列。可发酵的培养基:术语“可发酵的培养基”或“发酵培养基”是指包括一种或多种(例如,两种、若干种)糖的培养基,例如葡萄糖、果糖、蔗糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶性低聚糖,其中该培养基能够部分地被宿主细胞转化(发酵)为希望的产物,例如乙醇。在一些情况下,这种发酵培养基来源于天然来源,例如甘蔗、淀粉、或纤维素;并且可以来自这种来源的酶水解(糖化作用)的预处理。术语发酵培养基在本文理解为指在添加一种或多种发酵微生物之前的培养基,例如,由糖化过程产生的培养基,以及在同时糖化和发酵过程(ssf)中使用的培养基。半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”意指可对半纤维素材料进行水解的一种或多种(例如,若干种)酶。参见,例如,shallom和shoham,2003,currentopinioninmicrobiology[微生物学当前观点]6(3):219-228)。半纤维素酶是植物生物质降解中的关键组分。半纤维素酶的实例包括但不限于:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、以及木糖苷酶。这些酶的底物半纤维素是支链和直链多糖的异质性组,其可通过氢键与植物细胞壁中的纤维素微纤维相结合,交联成坚固的网络。半纤维素还共价附接至木质素,从而与纤维素一起形成高度复杂的结构。半纤维素的可变结构和组织要求许多酶的协同作用以使其完全降解。半纤维素酶的催化模块是水解糖苷键的糖苷水解酶(gh),或是水解乙酸或阿魏酸侧基团的酯键的碳水化合物酯酶(ce)。这些催化模块,基于其一级序列的同源性,可以分配到gh和ce家族。一些家族,具有总体上类似的折叠,可以进一步归类为宗族(clan),以字母标记(例如,gh-a)。在碳水化合物活性酶(cazy)数据库中可得到这些以及其他碳水化合物活性酶的最翔实和更新的分类。半纤维素分解酶活性可根据ghose和bisaria,1987,pure&appi.chem.[纯粹与应用化学]59:1739-1752,在适合的温度(如40℃-80℃,例如,50℃、55℃、60℃、65℃或70℃)以及适合的ph(如4-9,例如,5.0、5.5、6.0、6.5或7.0)下测量。异源多核苷酸:术语“异源多核苷酸”在本文定义为对宿主细胞不是天然的多核苷酸;天然多核苷酸,其中对编码区已进行了结构修饰;天然多核苷酸,其表达由于通过重组dna技术(例如不同的(外源)启动子)操纵dna而被定量改变;或宿主细胞中的一种天然多核苷酸,该宿主细胞具有该多核苷酸的一个或多个额外拷贝以定量改变表达。“异源基因”是包括异源多核苷酸的基因。高严格条件:术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃在5xsspe、0.3%sds、200微克/ml剪切并变性的鲑鱼精子dna和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2xssc、0.2%sds,在65℃洗涤三次,每次15分钟。宿主细胞:术语“宿主细胞”意指对用核酸构建体或表达载体进行的转化、转染、转导等是易感的任何细胞类型。术语“宿主细胞”涵盖由于复制期间出现的突变而与亲本细胞不完全相同的任何亲本细胞子代。本文将术语“重组细胞”定义为包括一种或多种(例如,两种、若干种)异源多核苷酸的非天然存在的宿主细胞。低严格条件:术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃、于5xsspe、0.3%sds、200微克/ml剪切并且变性的鲑鱼精子dna以及25%甲酰胺中预杂交和杂交12小时至24小时。载体材料最终使用0.2xssc、0.2%sds,在50℃下洗涤三次,每次15分钟。中严格条件:术语“中严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃在5xsspe、0.3%sds、200微克/ml剪切并变性的鲑鱼精子dna和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2xssc、0.2%sds,在55℃下洗涤三次,每次15分钟。中-高严格条件:术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃在5xsspe、0.3%sds、200微克/ml剪切并变性的鲑鱼精子dna和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2xssc、0.2%sds,在60℃下洗涤三次,每次15分钟。核酸构建体:术语“核酸构建体”意指一种包括一个或多个(例如,两个、若干个)控制序列的多核苷酸。多核苷酸可以是单链的或双链的,并且可以分离自天然存在的基因、可以被修饰成以另外的不会在自然界中存在的方式包含核酸的区段,或可以是合成的。可操作地连接:术语“可操作地连接”意指如下的构型,在该构型中,控制序列被放置在相对于多核苷酸的编码序列适当的位置处,使得该控制序列引导该编码序列的表达。戊糖:术语“戊糖”意指五碳单糖(例如,木糖、阿拉伯糖、核糖、来苏糖、核酮糖和木酮糖)。戊糖(例如d-木糖和l-阿拉伯糖)可以例如通过植物细胞壁多糖的糖化来衍生得到。预处理的玉米秸秆:术语“预处理的玉米秸秆”或“pcs”意指通过热和稀硫酸处理、碱预处理、中性预处理、或本领域已知的任何预处理从玉米秸秆得到的纤维素材料。序列同一性:两个氨基酸序列之间或两个核苷酸序列之间的关联度通过参数“序列同一性”来描述。出于本文描述的目的,使用尼德曼-翁施算法(needleman-wunschalgorithm)(needleman和wunsch,j.mol.biol.[分子生物学杂志]1970,48,443-453)来确定两个氨基酸序列之间的序列同一性的程度,该算法如emboss软件包(emboss:欧洲分子生物学开放软件套件(theeuropeanmolecularbiologyopensoftwaresuite),rice等人,trendsgenet.[遗传学趋势]2000,16,276-277)(优选3.0.0版或更新版本)的尼德尔(needle)程序中所实施的。所用的可选参数是空位开放罚分10、空位延伸罚分0.5和eblosum62(blosum62的emboss版本)替代矩阵。使用尼德尔标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且如下计算:(一致的残基x100)/(参考序列的长度-比对中的空位总数)出于本文描述的目的,使用尼德曼-翁施算法(needleman和wunsch,1970,见上文)来确定两个脱氧核糖核苷酸序列之间的序列同一性的程度,该算法如emboss软件包(emboss:欧洲分子生物学开放软件套件,rice等人,2000,见上文)(优选3.0.0版或更新版本)的尼德尔程序中所实施的。所用的可选参数是空位开放罚分10、空位延伸罚分0.5和ednafull(ncbinuc4.4的emboss版本)替代矩阵。使用尼德尔标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且如下计算:(一致的脱氧核糖核苷酸x100)/(参考序列的长度-比对中的空位总数)非常高严格条件:术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃在5xsspe、0.3%sds、200微克/ml剪切并变性的鲑鱼精子dna和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2xssc、0.2%sds,在70℃洗涤三次,每次15分钟。非常低严格条件:术语“非常低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准dna印迹程序,在42℃在5xsspe、0.3%sds、200微克/ml剪切并变性的鲑鱼精子dna和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2xssc、0.2%sds,在45℃下洗涤三次,每次15分钟。木聚糖酶:术语“木聚糖酶”意指1,4-β-d-木聚糖-木糖水解酶(1,4-β-d-xylan-xylohydrolase)(e.c.3.2.1.8),其催化木聚糖中1,4-β-d-木糖苷键的内水解。木聚糖酶活性可以在37℃在0.01%x-100和200mm磷酸钠(ph6)中用0.2%azcl-阿拉伯糖基木聚糖作为底物来确定。一个单位的木聚糖酶活性定义为在37℃、ph6,在200mm磷酸钠(ph6)中从作为底物的0.2%azcl-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青蛋白。木糖异构酶:术语“木糖异构酶”或“xi”意指可以在体内将d-木糖催化为d-木酮糖,并且在体外将d-葡萄糖转化为d-果糖的酶。木糖异构酶也称为“葡萄糖异构酶”,并且被分类为e.c.5.3.1.5。由于该酶的结构非常稳定,木糖异构酶是研究蛋白质结构和功能之间关系的良好模型之一(karimaki等人,proteinengdessel[蛋白质工程、设计与选择],12004,17(12):861-869)。此外,极其重要的工业应用价值使得木糖异构酶被视为蛋白酶和淀粉酶的重要工业酶(tianshen等人,microbiologybulletin[微生物学通报],2007,34(2):355-358;bhosale等人,microbiolrev[微生物学评论],1996,60(2):280-300)。科学家保持高度关注并对木糖异构酶进行了广泛的研究。自20世纪70年代以来,木糖异构酶的应用已经集中在高果糖浆和燃料乙醇的生产。近年来,科学家已经发现在某些条件下,木糖异构酶可用于生产许多重要的稀有糖,它们是制药工业中的生产材料,例如核糖、甘露糖、阿拉伯糖和来苏糖(karlmaki等人,proteinengdessel[蛋白质工程、设计与选择]12004,17(12):861-869)。这些发现在木糖异构酶的研究中带来新的活力。本文提及“约”值或参数包括指向该值或参数本身的实施例。例如,提及“约x”的描述包括实施例“x”。当与测量值组合使用时,“约”包括涵盖至少与测量该具体数值的方法相关的不确定性的范围,并且可以包括在给定的数值附近正或负两个标准差的范围。如本文和所附权利要求书中所使用,单数形式“一种/个”、“或”以及“该”包括复数指示物,除非上下文以另外的方式清楚表明。应该理解的是本文描述的实施例包括“由……实施例组成”和/或“基本由……实施例组成”。除非由上下文以另外的方式定义或清楚表明,本文使用的所有技术术语和科学术语具有如本领域普通技术人员所通常理解的相同的含义。具体实施方式本文尤其描述的是重组细胞(例如酵母),其能够同时将己糖和戊糖转化为乙醇,例如,在如下所述的方法中。申请人已经发现hxt2己糖转运体在细胞(例如酿酒酵母)中的适合表达(还表达木糖异构酶)在厌氧生长条件下显示出在木糖上令人惊讶的高生长、在葡萄糖存在下增加的木糖消耗、增加的葡萄糖消耗、和改善的乙醇生产。在一个方面是重组细胞(例如酵母),该重组细胞包含编码己糖转运体的异源多核苷酸,并且其中该酵母细胞能够发酵木糖。在一个实施例中,该己糖转运体包含seqidno:2的hxt2转运体的氨基酸序列或由其组成。在另一个实施例中,己糖转运体是seqidno:2的hxt2转运体的多肽片段(例如,其中该片段具有己糖转运体活性)。在一个实施例中,片段中的氨基酸残基的数目是seqidno:2的氨基酸残基的数目的至少75%,例如,至少80%、85%、90%、或95%。己糖转运体可以是seqidno:2的hxt2转运体的变体。在一个实施例中,己糖转运体与seqidno:2的hxt2转运体具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。在一个实施例中,己糖转运体序列与seqidno:2的hxt2转运体的氨基酸序列相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸或相差一个氨基酸。在一个实施例中,己糖转运体具有seqidno:2的hxt2转运体的氨基酸序列中的一个或多个(例如,两个,若干个)氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。氨基酸改变的性质通常较小,也就是说不会显著影响蛋白质折叠和/或活性的保守氨基酸取代或插入;典型地为一个至约30个氨基酸的小缺失;小氨基末端或羧基末端延伸,如氨基末端甲硫氨酸残基;多至约20-25个残基的小接头肽;或小的延伸,其通过改变净电荷或另一官能(如聚组氨酸段、抗原表位或结合结构域)来促进纯化。保守取代的实例在下组之内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸以及甲硫氨酸)。一般不会改变比活性的氨基酸取代是本领域已知的并且例如由h.neurath和r.l.hill,1979,于theproteins[蛋白质],学术出版社(academicpress),纽约中描述。最普遍发生的交换是ala/ser、val/ile、asp/glu、thr/ser、ala/gly、ala/thr、ser/asn、ala/val、ser/gly、tyr/phe、ala/pro、lys/arg、asp/asn、leu/ile、leu/val、ala/glu和asp/gly。可替代地,这些氨基酸改变具有这样一种性质:改变多肽的物理化学特性。例如,氨基酸改变可以改善己糖转运体的热稳定性、改变底物特异性、改变最适ph等。可以根据本领域已知的程序来鉴定必需氨基酸,例如定点诱变或丙氨酸扫描诱变(cunningham和wells,1989,science[科学]244:1081-1085)。在后一项技术中,在该分子中的每个残基处引入单个丙氨酸突变,并且对所得突变体分子的活性进行测试以鉴定对于该分子的活性至关重要的氨基酸残基。还参见,hilton等人,1996,j.biol.chem.[生物化学杂志]271:4699-4708。活性部位或其他生物学相互作用还可通过对结构的物理分析来确定,如由下述技术确定:核磁共振、晶体学(crystallography)、电子衍射、或光亲和标记,连同对推定的接触位点氨基酸进行突变。参见,例如,devos等人,1992,science[科学]255:306-312;smith等人,1992,j.mol.biol.[分子生物学杂志]224:899-904;wlodaver等人,1992,febslett.[欧洲生化学会联合会快报]309:59-64。还可以从与参考己糖转运体相关的其他己糖转运体的同一性的分析推断必需氨基酸的身份。可以使用本领域所熟知的多重序列比对(msa)技术来确定另外的有关本文的己糖转运体的结构-活性关系的指导。基于本文的教导,本领域的技术人员可以与本文描述的或本领域已知的任何数量的己糖转运体做相似的比对。此类比对帮助技术人员确定潜在的相关结构域(例如,结合域或催化结构域),并且在不同的己糖转运体序列中确定哪些氨基酸残基是保守的和不是保守的。本领域中应理解的是,改变在所披露的多肽之间的特定位置处是保守的氨基酸将更有可能导致生物活性的改变(bowie等人,1990,science[科学]247:1306-1310:“residuesthataredirectlyinvolvedinproteinfunctionssuchasbindingorcatalysiswillcertainlybeamongthemostconserved[直接涉及到蛋白功能如结合或催化的残基将一定是在最保守的残基中]”)。相比之下,取代在多肽之间不是高度保守的氨基酸将不太可能或不显著地改变生物活性。使用已知的诱变、重组和/或改组方法、随后进行一个相关的筛选程序可以做出单或多氨基酸取代、缺失和/或插入并对其进行测试,这些相关的筛选程序例如由reidhaar-olson和sauer,1988,science[科学]241:53-57;bowie和sauer,1989,proc.natl.acad.sci.usa[美国国家科学院院刊]86:2152-2156;wo95/17413;或wo95/22625。其他可以使用的方法包括易错pcr、噬菌体展示(例如lowman等人,1991,biochemistry[生物化学]30:10832-10837;美国专利号5,223,409;wo92/06204)以及区域定向诱变(derbyshire等人,1986,gene[基因]46:145;ner等人,1988,dna7:127)。诱变/改组方法可以与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(ness等人,1999,naturebiotechnology[自然生物技术]17:893-896)。可从宿主细胞回收编码活性己糖转运体的诱变的dna分子,并使用本领域的标准方法快速测序。这些方法允许快速确定多肽中各个氨基酸残基的重要性。在另一个实施例中,编码己糖转运体的异源多核苷酸包含与seqidno:1的核苷酸具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的编码序列。在一个实施例中,编码己糖转运体的异源多核苷酸包含seqidno:1的编码序列或由其组成。在另一个实施例中,编码己糖转运体的异源多核苷酸包含seqidno:1的编码序列的子序列(例如,其中该子序列编码具有己糖转运体活性的多肽)。在一个实施例中,该编码子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。本文描述的任何相关方面或实施例的参考编码序列可以是天然编码序列或简并序列,例如为特定宿主细胞设计的密码子优化的编码序列。可以使用seqidno:1的多核苷酸编码序列或其子序列、连同seqidno:2的多肽或其片段来设计核酸探针以根据本领域熟知的方法来鉴别并克隆对来自不同属或物种的菌株的亲本进行编码的dna。特别地,可以遵循标准dna印迹程序,使用此类探针来与感兴趣的细胞的基因组dna或cdna杂交,以便鉴定和分离其中的相应基因。此类探针可明显短于完整序列,但是长度应为至少15,如至少25、至少35、或至少70个核苷酸。优选地,该核酸探针长度为至少100个核苷酸,例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。dna和rna探针两者都可使用。典型地将探针进行标记(例如,用32p、3h、35s、生物素、或抗生物素蛋白),用于检测相应的基因。可以针对与上文所述的探针杂交并编码亲本的dna来筛选由此类其他菌株制备的基因组dna或cdna文库。来自此类其他菌株的基因组dna或其他dna可通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术来分离。可将来自文库的dna或分离的dna转移到并固定在硝化纤维素或其他适合的运载体材料上。为了鉴定与seqidno:1或其子序列杂交的克隆或dna,在dna印迹中使用载体材料。在一个实施例中,核酸探针是包含seqidno:1的多核苷酸;或其子序列。在另一个实施例中,核酸探针是编码以下项的多核苷酸:seqidno:2的多肽;或其片段。出于上述探针的目的,杂交是指,在非常低至非常高严格条件下,多核苷酸杂交至标记的核酸探针或其全长互补链或前述各项的子序列。可使用例如x射线片(x-rayfilm)检测在这些条件下与核酸探针杂交的分子。严格性和洗涤条件如上述所定义。在一个实施例中,己糖转运体由多核苷酸编码,该多核苷酸在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与seqidno:1的全长互补链杂交。(sambrook等人,1989,molecularcloning,alaboratorymanual[分子克隆:实验室手册],第2版coldspringharbor,newyork[冷泉港,纽约])。己糖转运体可以获得自任何适合的属的微生物,这些微生物包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。己糖转运体可以是细菌己糖转运体。例如,己糖转运体可以是革兰氏阳性细菌多肽,如芽孢杆菌属(bacillus)、梭菌属(clostridium)、肠球菌属(enterococcus)、土芽孢杆菌属(geobacillus)、乳杆菌属(lactobacillus)、乳球菌属(lactococcus)、海洋芽孢杆菌属(oceanobacillus)、葡萄球菌属(staphylococcus)、链球菌属(streptococcus)或链霉菌属(streptomyces)己糖转运体;或革兰氏阴性细菌多肽,如弯曲杆菌属(campylobacter)、大肠杆菌(e.coli)、黄杆菌属(flavobacterium)、梭杆菌属(fusobacterium)、螺杆菌属(helicobacter)、泥杆菌属(ilyobacter)、奈瑟氏菌属(neisseria)、假单胞菌属(pseudomonas)、沙门氏菌属(salmonella)或脲原体属(ureaplasma)己糖转运体。在一个实施例中,己糖转运体是嗜碱芽孢杆菌(bacillusalkalophilus)、解淀粉芽孢杆菌(bacillusamyloliquefaciens)、短芽孢杆菌(bacillusbrevis)、环状芽孢杆菌(bacilluscirculans)、克劳氏芽孢杆菌(bacillusclausii)、凝结芽孢杆菌(bacilluscoagulans)、坚硬芽孢杆菌(bacillusfirmus)、灿烂芽孢杆菌(bacilluslautus)、迟缓芽孢杆菌(bacilluslentus)、地衣芽孢杆菌(bacilluslicheniformis)、巨大芽孢杆菌(bacillusmegaterium)、短小芽孢杆菌(bacilluspumilus)、嗜热脂肪芽孢杆菌(bacillusstearothermophilus)、枯草芽孢杆菌(bacillussubtilis)、或苏云金芽孢杆菌(bacillusthuringiensis)己糖转运体。在另一个实施例中,己糖转运体是似马链球菌(streptococcusequisimilis)、酿脓链球菌(streptococcuspyogenes)、乳房链球菌(streptococcusuberis)、或马链球菌兽瘟亚种(streptococcusequisubsp.zooepidemicus)己糖转运体。在另一个实施例中,己糖转运体是不产色链霉菌(streptomycesachromogenes)、除虫链霉菌(streptomycesavermitilis)、天蓝链霉菌(streptomycescoelicolor)、灰色链霉菌(streptomycesgriseus)或浅青紫链霉菌(streptomyceslividans)己糖转运体。己糖转运体可以是真菌己糖转运体。例如,己糖转运体可以是酵母己糖转运体,如假丝酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属、耶氏酵母属或伊萨酵母属(issatchenkia)己糖转运体;或丝状真菌己糖转运体,例如枝顶孢霉属(acremonium)、伞菌属(agaricus)、链格孢属(alternaria)、曲霉属(aspergillus)、短梗霉属(aureobasidium)、葡萄座腔菌属(botryospaeria)、拟蜡菌属(ceriporiopsis)、毛喙壳属(chaetomidium)、金孢子菌属(chrysosporium)、麦角菌属(claviceps)、旋孢腔菌属(cochliobolus)、鬼伞属(coprinopsis)、乳白蚁属(coptotermes)、棒囊壳属(corynascus)、隐丛赤壳菌属(cryphonectria)、隐球菌属(cryptococcus)、色二孢属(diplodia)、黑耳属(exidia)、线黑粉酵母属(filibasidium)、镰孢属(fusarium)、赤霉属(gibberella)、全鞭毛虫属(holomastigotoides)、腐质霉属(humicola)、耙齿菌属(irpex)、香菇属(lentinula)、小腔球菌属(leptospaeria)、梨孢菌属(magnaporthe)、黑果菌属(melanocarpus)、亚灰树花菌属(meripilus)、毛霉属(mucor)、毁丝霉属(myceliophthora)、新美鞭菌属(neocallimastix)、链孢菌属(neurospora)、拟青霉属(paecilomyces)、青霉菌属(penicillium)、平革菌属(phanerochaete)、瘤胃壶菌属(piromyces)、poitrasia、假黑盘菌属(pseudoplectania)、假披发虫属(pseudotrichonympha)、根毛霉菌属(rhizomucor)、裂褶菌属(schizophyllum)、柱顶孢属(scytalidium)、篮状菌属(talaromyces)、嗜热子囊菌属(thermoascus)、梭孢壳霉属(thielavia)、弯颈霉属(tolypocladium)、木霉属(trichoderma)、长毛盘菌属(trichophaea)、轮枝孢属(verticillium)、小包脚菇属(volvariella)、或炭角菌属(xylaria)己糖转运体。在另一个实施例中,己糖转运体是卡尔酵母(saccharomycescarlsbergensis)、酿酒酵母(saccharomycescerevisiae)、糖化酵母(saccharomycesdiastaticus)、道格拉氏酵母(saccharomycesdouglasii)、克鲁弗酵母(saccharomyceskluyveri)、诺地酶母(saccharomycesnorbensis)、或卵形酵母(saccharomycesoviformis)己糖转运体。在另一个实施例中,己糖转运体来自酵母属,例如seqidno:2的酿酒酵母己糖转运体。在另一个实施例中,己糖转运体是解纤维枝顶孢霉(acremoniumcellulolyticus)、棘孢曲霉(aspergillusaculeatus)、泡盛曲霉(aspergillusawamori)、臭曲霉(aspergillusfoetidus)、烟曲霉(aspergillusfumigatus)、日本曲霉(aspergillusjaponicus)、构巢曲霉(aspergillusnidulans)、黑曲霉(aspergillusniger)、米曲霉(aspergillusoryzae)、狭边金孢子菌(chrysosporiuminops)、嗜角质金孢子菌(chrysosporiumkeratinophilum)、卢克诺文思金孢子菌(chrysosporiumlucknowense)、粪状金孢子菌(chrysosporiummerdarium)、毡金孢子菌(chrysosporiumpannicola)、昆士兰金孢子菌(chrysosporiumqueenslandicum)、热带金孢子菌(chrysosporiumtropicum)、带纹金孢子菌(chrysosporiumzonatum)、杆孢状镰孢(fusariumbactridioides)、谷类镰孢(fusariumcerealis)、库威镰孢(fusariumcrookwellense)、大刀镰孢(fusariumculmorum)、禾谷镰孢(fusariumgraminearum)、禾赤镰孢(fusariumgraminum)、异孢镰孢(fusariumheterosporum)、合欢木镰孢(fusariumnegundi)、尖孢镰孢(fusariumoxysporum)、多枝镰孢(fusariumreticulatum)、粉红镰孢(fusariumroseum)、接骨木镰孢(fusariumsambucinum)、肤色镰孢(fusariumsarcochroum)、拟分枝孢镰孢(fusariumsporotrichioides)、硫色镰孢(fusariumsulphureum)、圆镰孢(fusariumtorulosum)、拟丝孢镰孢(fusariumtrichothecioides)、镶片镰孢(fusariumvenenatum)、灰腐质霉(humicolagrisea)、特异腐质霉(humicolainsolens)、疏棉状腐质霉(humicolalanuginosa)、白耙齿菌(irpexlacteus)、米黑毛霉(mucormiehei)、嗜热毁丝霉(myceliophthorathermophila)、粗糙链孢菌(neurosporacrassa)、绳状青霉菌(penicilliumfuniculosum)、产紫青霉菌(penicilliumpurpurogenum)、黄孢原毛平革菌(phanerochaetechrysosporium)、无色梭孢壳霉(thielaviaachromatica)、成层梭抱壳菌(thielaviaalbomyces)、白毛梭孢壳霉(thielaviaalbopilosa)、澳洲梭孢壳霉(thielaviaaustraleinsis)、菲美蒂梭抱壳菌(thielaviafimeti)、小孢梭孢壳霉(thielaviamicrospora)、卵孢梭孢壳霉(thielaviaovispora)、秘鲁梭孢壳霉(thielaviaperuviana)、毛梭孢壳霉(thielaviasetosa)、瘤孢梭孢壳霉(thielaviaspededonium)、耐热梭孢壳(thielaviasubthermophila)、土生梭孢壳霉(thielaviaterrestris)、哈茨木霉(trichodermaharzianum)、康宁木霉(trichodermakoningii)、长枝木霉(trichodermalongibrachiatum)、里氏木霉(trichodermareesei)、或绿色木霉(trichodermaviride)己糖转运体。应理解的是对于前述的种,本发明涵盖完全和不完全阶段(perfectandimperfectstates),和其他分类学的等同物(equivalent),例如无性型(anamorph),而与它们已知的种名无关。本领域的技术人员将容易地识别适当等效物的身份。这些物种的菌株可容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(americantypeculturecollection,atcc)、德国微生物和细胞培养物保藏中心(deutschesammlungvonmikroorganismenundzellkulturengmbh,dsmz)、荷兰菌种保藏中心(centraalbureauvoorschimmelcultures,cbs)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(agriculturalresearchservicepatentculturecollection,northernregionalresearchcenter,nrrl)。这些物种的菌株可以容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(atcc)、德国微生物菌种保藏中心(deutschesammlungvonmikroorganismenundzellkulturengmbh,dsm)、荷兰菌种保藏中心(centraalbureauvoorschimmelcultures,cbs)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(nrrl)。也可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水、青贮等)分离的微生物或直接从天然材料(例如,土壤、堆肥、水、青贮等)获得的dna样品鉴定并获得己糖转运体。用于从天然生境中直接分离微生物和dna的技术是本领域熟知的。随后可以通过类似地筛选另一种微生物的基因组或cdna文库或混合dna样品衍生出编码己糖转运体的多核苷酸。一旦用如本文所述的适合探针检测到编码己糖转运体的多核苷酸,就可以通过使用本领域普通技术人员已知的技术来分离或克隆该序列(参见例如,sambrook等人,1989,见上文)。用于分离或克隆编码己糖转运体的多核苷酸的技术包括从基因组dna分离、从cdna制备或其组合。可以例如通过使用熟知的聚合酶链反应(pcr)或表达文库的抗体筛选来检测具有共有结构特征的克隆dna片段,实现从这样的基因组dna克隆多核苷酸。参见例如,innis等人,1990,pcr:aguidetomethodsandapplication[pcr:方法和应用指南],学术出版社(academicpress),纽约。还可以使用其他核酸扩增程序,诸如连接酶链式反应(lcr)、连接激活转录(lat)和基于核苷酸序列的扩增(nasba)。己糖转运体可以是融合多肽或可切割的融合多肽,其中另一个多肽融合在己糖转运体的n-末端或c-末端处。可以通过将编码另一多肽的多核苷酸融合于编码己糖转运体的多核苷酸来产生融合的多肽。用于产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列,这样使得它们在阅读框中,并且使所述融合的多肽的表达在相同的一个或多个启动子和终止子的控制下。还可以使用内含肽技术构建融合蛋白,其中在翻译后产生融合(cooper等人,1993,emboj.[欧洲分子生物学学会杂志]12:2575-2583;dawson等人,1994,science[科学]266:776-779)。在一个方面,重组细胞(例如酵母细胞)进一步包含编码木糖异构酶(xi)的异源多核苷酸。木糖异构酶可以是适合宿主细胞和本文所述的方法的任何木糖异构酶,例如天然存在的木糖异构酶或其保留木糖异构酶活性的变体。在一个实施例中,木糖异构酶存在于宿主细胞的胞液中。在一些实施例中,当在相同条件下培养时,与不具有编码木糖异构酶的异源多核苷酸的宿主细胞相比,包括编码木糖异构酶的异源多核苷酸的重组细胞具有增加水平的木糖异构酶活性。在一些实施例中,当在相同条件下培养时,与不具有编码木糖异构酶的异源多核苷酸的宿主细胞相比,宿主细胞具有增加至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%的木糖异构酶活性水平。可与本文描述的重组宿主细胞和使用方法一起使用的例示性木糖异构酶包括但不限于,来自真菌瘤胃壶菌属菌种(wo2003/062430)或其他来源(madhavan等人,2009,applmicrobiolbiotechnol.[应用微生物学与生物技术]82(6),1067-1078)的xi,已在酿酒酵母宿主细胞中表达。适用于酵母中表达的另外的其他xi已在us2012/0184020(来自黄化瘤胃球菌(ruminococcusflavefaciens)的xi),wo2011/078262(来自黄胸散白蚁(reticulitermessperatus)和达尔文澳白蚁(mastotermesdarwiniensis)的若干种xi)和wo2012/009272(含有来自软弱贫养菌(abiotrophiadefectiva)的xi的构建体和真菌细胞)中描述。us8,586,336描述了表达通过牛瘤胃液获得的xi(在本文显示为seqidno:18)的酿酒酵母宿主细胞。编码适合的木糖异构酶的另外的多核苷酸可以获得自任何属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。在一个实施例中,木糖异构酶是细菌、酵母或丝状真菌木糖异构酶,例如,获自本文所述的任何微生物,如上文在与己糖转运体相关的部分下描述的。木糖异构酶编码序列也可用于设计核酸探针以鉴定和克隆编码来自不同属或种的菌株的木糖异构酶的dna,如上文所述的。还可以从其他来源,包括从自然界(例如,土壤、堆肥、水等等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等等)获得的dna样品鉴定和获得编码木糖异构酶的多核苷酸,如上文所述的。用于分离或克隆编码木糖异构酶的多核苷酸的技术在上文中描述。在一个实施例中,木糖异构酶与本文描述的任何木糖异构酶(例如seqidno:18的木糖异构酶)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一个方面,木糖异构酶序列与本文描述的任何木糖异构酶(例如seqidno:18的木糖异构酶)相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸或相差一个氨基酸。在一个实施例中,木糖异构酶包含以下或由其组成:本文描述的任何木糖异构酶的氨基酸序列(例如seqidno:18的木糖异构酶)、等位变体、或其具有木糖异构酶活性的片段。在一个实施例中,木糖异构酶具有一个或多个(例如,两个、若干个)氨基酸的氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。在一些实施例中,木糖异构酶在相同条件下具有本文描述的任何木糖异构酶(例如seqidno:18的木糖异构酶)的木糖异构酶活性的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。在一个实施例中,木糖异构酶编码序列在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与来自本文描述的任何木糖异构酶(例如seqidno:18的木糖异构酶)的编码序列的全长互补链杂交。在一个实施例中,木糖异构酶编码序列与来自本文描述的任何木糖异构酶(例如seqidno:18的木糖异构酶)的编码序列具有至少65%,例如至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一个实施例中,编码木糖异构酶的异源多核苷酸包含本文描述的任何木糖异构酶(例如seqidno:18的木糖异构酶)的编码序列。在一个实施例中,编码木糖异构酶的异源多核苷酸包含来自本文描述的任何木糖异构酶的编码序列的子序列,其中该子序列编码具有木糖异构酶活性的多肽。在一个实施例中,子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。木糖异构酶还可以包括融合多肽或可切割的融合多肽,如上文所描述的。在一个方面,重组细胞(例如酵母细胞)进一步包含编码木酮糖激酶(xk)的异源多核苷酸。如本文所用的,木酮糖激酶提供了将d-木酮糖转化为木酮糖5-磷酸的酶活性。木酮糖激酶可以是适合宿主细胞和本文所述的方法的任何木酮糖激酶,例如天然存在的木酮糖激酶或其保留木酮糖激酶活性的变体。在一个实施例中,木酮糖激酶存在于宿主细胞的胞液中。在一些实施例中,当在相同条件下培养时,与不具有编码木酮糖激酶的异源多核苷酸的宿主细胞相比,包含编码木酮糖激酶的异源多核苷酸的重组细胞具有增加水平的木酮糖激酶活性。在一些实施例中,当在相同条件下培养时,与不具有编码木酮糖激酶的异源多核苷酸的宿主细胞相比,宿主细胞具有增加至少5%,例如至少10%、至少15%、至少20%、至少25%、至少50%、至少100%、至少150%、至少200%、至少300%或至少500%的木糖异构酶活性水平。可以与本文描述的重组宿主细胞和使用方法一起使用的示例性木酮糖激酶包括但不限于,seqidno:22的酿酒酵母木酮糖激酶。编码适合的木酮糖激酶的另外的多核苷酸可以获得自任何属的微生物,包括在uniprotkb数据库(www.uniprot.org)内可容易获得的那些。在一个实施例中,木酮糖激酶是细菌、酵母或丝状真菌木酮糖激酶,例如,获自本文所述的任何微生物,如上文在与己糖转运体相关的部分下描述的。木酮糖激酶编码序列也可用于设计核酸探针以鉴定和克隆编码来自不同属或种的菌株的木酮糖激酶的dna,如上文所述的。还可以从其他来源,包括从自然界(例如,土壤、堆肥、水等等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等等)获得的dna样品鉴定和获得编码木酮糖激酶的多核苷酸,如上文所述的。用于分离或克隆编码木酮糖激酶的多核苷酸的技术在上文中描述。在一个实施例中,木酮糖激酶与本文描述的任何木酮糖激酶(例如seqidno:22的酿酒酵母木酮糖激酶)具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一个实施例中,木酮糖激酶序列与本文描述的任何木酮糖激酶(例如seqidno:22的酿酒酵母木酮糖激酶)相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸相差不超过三个氨基酸相差不超过两个氨基酸或相差一个氨基酸。在一个实施例中,木酮糖激酶包含以下或由其组成:本文描述的任何木酮糖激酶的氨基酸序列(例如seqidno:22的酿酒酵母木酮糖激酶)、等位变体、或其具有木酮糖激酶活性的片段。在一个实施例中,木酮糖激酶具有一个或多个(例如,两个、若干个)氨基酸的氨基酸取代、缺失和/或插入。在一些实施例中,氨基酸取代、缺失和/或插入的总数不超过10,例如不超过9、8、7、6、5、4、3、2或1。在一些实施例中,木酮糖激酶在相同条件下具有本文描述的任何木酮糖激酶(例如seqidno:22的酿酒酵母木酮糖激酶)的木酮糖激酶活性的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%。在一个实施例中,木酮糖激酶编码序列在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与来自本文描述的任何木酮糖激酶(例如seqidno:22的酿酒酵母木酮糖激酶)的编码序列的全长互补链杂交。在一个实施例中,木酮糖激酶编码序列与来自本文描述的任何木酮糖激酶(例如seqidno:22的酿酒酵母木酮糖激酶)的编码序列具有至少65%,例如至少70%、至少75%、至少80%、至少85%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性。在一个实施例中,编码木酮糖激酶的异源多核苷酸包含本文描述的任何木酮糖激酶(例如seqidno:22的酿酒酵母木酮糖激酶)的编码序列。在一个实施例中,编码木酮糖激酶的异源多核苷酸包含来自本文描述的任何木酮糖激酶的编码序列的子序列,其中该子序列编码具有木酮糖激酶活性的多肽。在一个实施例中,子序列中的核苷酸残基的数目是参照编码序列的数目的至少75%,例如至少80%、85%、90%或95%。木酮糖激酶还可以包括融合多肽或可切割的融合多肽,如上文所描述的。在一个方面,重组细胞(例如酵母细胞)进一步包含编码核酮糖5磷酸3-差向异构酶(rpe1)的异源多核苷酸。如本文所用的,核酮糖5磷酸3-差向异构酶提供了将l-核酮糖5-磷酸转化为l-木酮糖5-磷酸的酶活性(ec5.1.3.22)。rpe1可以是适合宿主细胞和本文所述的方法的任何rpe1,例如天然存在的rpe1或其保留rpe1活性的变体。在一个实施例中,rpe1存在于宿主细胞的胞液中。在一个实施例中,重组细胞包含编码核酮糖5磷酸3-差向异构酶(rpe1)的异源多核苷酸,其中该rpe1是酿酒酵母rpe1,或者是与酿酒酵母rpe1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的rpe1。在一个方面,重组细胞(例如酵母细胞)进一步包含编码核酮糖5磷酸异构酶(rki1)的异源多核苷酸。如本文所用的,核酮糖5磷酸异构酶提供了将核糖-5-磷酸转化为核酮糖-5-磷酸的酶活性。rki1可以是适合宿主细胞和本文所述的方法的任何rki1,例如天然存在的rki1或其保留rki1活性的变体。在一个实施例中,rki1存在于宿主细胞的胞液中。在一个实施例中,重组细胞包含编码核酮糖5磷酸异构酶(rki1)的异源多核苷酸,其中该rki1是酿酒酵母rki1,或者是与酿酒酵母rki1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的rki1。在一个方面,重组细胞(例如酵母细胞)进一步包含编码转酮酶(tkl1)的异源多核苷酸。tkl1可以是适合宿主细胞和本文所述的方法的任何tkl1,例如天然存在的tkl1或其保留tkl1活性的变体。在一个实施例中,tkl1存在于宿主细胞的胞液中。在一个实施例中,重组细胞包含编码转酮酶(tkl1)的异源多核苷酸,其中该tkl1是酿酒酵母tkl1,或者是与酿酒酵母tkl1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的tkl1。在一个方面,重组细胞(例如酵母细胞)进一步包含编码转醛酶(tal1)的异源多核苷酸。tal1可以是适合宿主细胞和本文所述的方法的任何tal1,例如天然存在的tal1或其保留tal1活性的变体。在一个实施例中,tal1存在于宿主细胞的胞液中。在一个实施例中,重组细胞包含编码转醛酶(tal1)的异源多核苷酸,其中该tal1是酿酒酵母tal1,或者是与酿酒酵母tal1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的tal1。在一个方面,本文描述的重组细胞(例如,包含编码本文所述的己糖转运体和木糖异构酶的异源多核苷酸的细胞)在戊糖(例如木糖)上具有改善的厌氧生长。在一个实施例中,与没有编码己糖转运体的异源多核苷酸的相同细胞相比,在孵育约4天或孵育4天后(例如在实例2中描述的条件下),重组细胞能在戊糖(例如木糖)上有更高的厌氧生长速率。在一个方面,本文描述的重组细胞(例如,包含编码本文所述的己糖转运体和木糖异构酶的异源多核苷酸的细胞)具有更高的戊糖(例如木糖)消耗。在一个实施例中,与没有编码己糖转运体的异源多核苷酸的相同细胞相比,在发酵约40小时或发酵40小时后(例如在实例3中描述的条件下),重组细胞能有更高的戊糖(例如木糖)消耗。在一个实施例中,在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),重组细胞能够消耗培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的戊糖(例如木糖)。在一个实施例中,在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),重组细胞能够消耗培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的葡萄糖。在一个实施例中,在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),重组细胞能够消耗培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的戊糖(例如木糖),且能够消耗培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的葡萄糖。在一个方面,本文描述的重组细胞(例如,包含编码本文所述的己糖转运体和木糖异构酶的异源多核苷酸的细胞)具有更高的乙醇生产。在一个实施例中,与没有编码己糖转运体的异源多核苷酸的相同细胞相比,在发酵约40小时或发酵40小时后(例如在实例3中描述的条件下),该重组细胞能有更高的乙醇生产。基因破坏本文描述的重组细胞还可以包含一个或多个(例如,两个、若干个)基因破坏,例如以将糖代谢从不希望的产物转移至乙醇。在一些方面,当在相同条件下培养时,与没有这一个或多个破坏的细胞相比,重组宿主细胞产生更大量的乙醇。在一些方面,使被破坏的内源基因中的一个或多个失活。在某些实施例中,本文提供的重组细胞包含一个或多个内源基因的破坏,这一个或多个内源基因编码在生产替代发酵产物(例如甘油)或其他副产物(例如乙酸或二醇)中涉及的酶。例如,本文提供的细胞可以包括以下一个或多个中的破坏:甘油3-磷酸脱氢酶(gpd,催化二羟丙酮磷酸反应为甘油3-磷酸)、甘油3-磷酸酶(gpp,催化甘油-3磷酸转化为甘油)、甘油激酶(催化甘油3-磷酸转化为甘油)、二羟丙酮激酶(催化二羟丙酮磷酸转化为二羟丙酮)、甘油脱氢酶(催化二羟丙酮转化为甘油)、和醛脱氢酶(ald,例如,将乙醛转化为乙酸)。可以使用模型分析来设计另外的优化途径利用的基因破坏。用于鉴定并设计有利于生物合成希望的产物的代谢改变的一种示例性计算方法是optknock计算框架(optknockcomputationalframework),burgard等人,2003,biotechnol.bioeng.[生物技术与生物工程]84:647-657。可以使用本领域熟知的方法(包括本文描述的那些方法)构建包括基因破坏的重组细胞。可以破坏该基因的一部分,例如编码区或为编码区的表达所需的控制序列。该基因的这样一种控制序列可以是启动子序列或其功能部分,即足以影响该基因的表达的部分。例如,可以将启动子序列失活从而无表达或可以将天然启动子替换为较弱的启动子以减少编码序列的表达。可修饰的其他控制序列包括但不限于前导子、前肽序列、信号序列、转录终止子以及转录激活因子。可以通过基因缺失技术来构建包括基因破坏的重组细胞,以消除或减少该基因的表达。基因缺失技术使得可以部分或完全除去该基因,从而消除其表达。本文类方法中,使用已经构建为邻接地包含侧翼于该基因的5'和3'区的质粒,通过同源重组完成该基因的缺失。还可以通过引入、取代和/或除去该基因中的或为其转录或翻译所需的其控制序列中的一个或多个(例如,两个、若干个)核苷酸来构建包括基因破坏的重组细胞。例如,可以插入或除去核苷酸,用于引入终止密码子、除去起始密码子或移码开放阅读框。可以根据本领域已知的方法,通过定点诱变或pcr产生的诱变完成这样的修饰。参见例如,botstein和shortle,1985,science[科学]229:4719;lo等人,1985,proc.natl.acad.sci.u.s.a.[美国国家科学院院刊]81:2285;higuchi等人,1988,nucleicacidsres[核酸研究]16:7351;shimada,1996,meth.mol.biol.57:157;ho等人,1989,gene[基因]77:61;horton等人,1989,gene[基因]77:61;以及sarkar和sommer,1990,biotechniques[生物技术]8:404。还可以通过将破坏性核酸构建体插入该基因中而构建包括基因破坏的重组细胞,该破坏性核酸构建体包括与该基因同源的核酸片段,该片段将产生具有同源性的区域的重复并且在重复的区域之间掺入构建体dna。这样的一种基因破坏可以消除基因表达,如果插入的构建体将该基因的启动子与编码区分离或打断编码序列,这样使得产生无功能性基因产物。破坏构建体可以简单地是伴有与该基因同源的5’和3’区的选择性标记基因。该选择性标记使得可以鉴定包含破坏的基因的转化株。还可以通过基因转化过程构建包括基因破坏的重组细胞(参见,例如,iglesias和trautner,1983,moleculargeneralgenetics[分子普通遗传学]189:73-76)。例如,在基因转化方法中,将对应于该基因的核苷酸序列体外诱变,以产生缺陷核苷酸序列,然后将其转化进重组菌株中以产生缺陷基因。通过同源重组,该缺陷核苷酸序列替换该内源基因。该缺陷核苷酸序列还包括一种用于选择含有缺陷基因的转化株的标记可以是令人希望的。可以使用本领域熟知的方法(包括但不限于化学诱变),通过随机或特异诱变进一步构建包括基因破坏的重组细胞(参见,例如,hopwood,theisolationofmutantsinmethodsinmicrobiology[微生物学方法中的突变体分离](j.r.norris和d.w.ribbons,编辑))第363-433页,学术出版社(academicpress),纽约,1970)。可以通过使亲本菌株经受诱变并筛选其中该基因的表达已经被减少或失活的突变菌株来修饰该基因。诱变可以是特异的或随机的,例如通过使用适合的物理或化学诱变剂、使用适合的寡核苷酸或使dna序列经受pcr产生的诱变来进行。此外,诱变可以通过使用这些诱变方法的任何组合来进行。适合本发明目的的物理或化学诱变剂的实例包括紫外线(uv)照射,羟胺,n-甲基-n’-硝基-n-亚硝基胍(mnng),n-甲基-n’-亚硝基胍(ntg)邻甲基羟胺,亚硝酸,乙基甲磺酸(ems),亚硫酸氢钠,甲酸和核苷酸类似物。当使用此类试剂时,诱变典型地是在适合条件下在所选的诱变剂的存在下通过孵育有待诱变的亲本菌株并选择展现出该基因的减少表达或无表达的突变体来进行的。可以使用来自其他微生物来源的与本文描述的基因同源或互补的核苷酸序列来破坏所选的重组体菌株中的对应基因。在一个方面中,重组细胞中的基因修饰未用选择性标记加以标记。可以通过将突变体在反向选择培养基中进行培养来除去选择性标记基因。在该选择性标记基因包含侧翼于其5'和3'端的重复序列的情况下,当该突变体菌株经受反向选择时,这些重复序列将有助于该选择性标记基因通过同源重组而环出。还可以通过向该突变体菌株中引入一个核酸片段,该核酸片段包括缺陷基因的5'和3'区但是缺乏该选择性标记基因,随后在反向选择培养基上进行选择,通过同源重组来除去该选择性标记基因。通过同源重组,包含该选择性标记基因的缺陷基因被缺乏该选择性标记基因的核酸片段替换。还可以使用本领域已知的其他方法。宿主细胞和重组方法本文描述的重组细胞可以选自能够乙醇发酵的任何宿主细胞。本领域普通技术人员应该理解,遗传改变(包括本文示例的代谢修饰)可以参考适合的宿主生物及其相应的代谢反应或用于希望的遗传材料(例如希望的代谢途径的基因)的适合的来源生物加以描述。然而,考虑到多种多样的生物的全基因组测序以及基因组学领域中的较高水平的技能,本领域普通技术人员可以将本文提供的教导和指导应用于其他生物中。例如,可以通过掺入相同的或来自不同于参考物种的物种的类似编码核酸而容易地将本文示例的代谢改变应用于其他物种中。用于制备本文描述的重组细胞的宿主细胞可以来自任何适合的宿主,例如酵母菌株,包括但不限于,酵母属、红酵母属、裂殖酵母属、克鲁维酵母属、毕赤酵母属、汉逊酵母属、红冬孢酵母属、假丝酵母属、耶氏酵母属、油脂酵母属、隐球菌属或德克拉酵母属菌种细胞。特别地,涵盖酵母属宿主细胞,例如酿酒酵母、贝酵母(saccharomycesbayanus)或卡氏酵母细胞。优选地,酵母细胞是酿酒酵母细胞。适合的细胞可以例如,衍生自商业可获的菌株和多倍体或非整倍体工业菌株,包括但不限于,来自superstarttm、c5fueltm、xylo等(莱蒙特集团(lallemand));redstar和ethanol(弗曼迪斯/乐斯福集团(fermentis/lesaffre));fali(英联马利集团(abmauri));baker'sbestyeast、baker'scompressedyeast等(弗雷希曼酵母(fleishmann'syeast));biofermaft、xp、cf和xr(北美生物制品公司(northamericanbioproductscorp.));turboyeast(格特链ab(gertstrandab));和(dsm专业公司(dsmspecialties))的那些。其他可用的酵母菌株可获自生物保藏,例如美国典型培养物保藏中心(atcc)或德国微生物菌种保藏中心(deutschesammlungvonmikroorganismenundzellkulturengmbh(dsmz)),如例如by4741(例如atcc201388);y108-1(atccpta.10567)和nrrlyb-1952(美国农业研究菌种保藏中心(arsculturecollection))。还有其他适合作为宿主细胞的酿酒酵母菌株dby746、[alpha][eta]22、s150-2b、gpy55-15ba、cen.pk、usm21、tmb3500、tmb3400、vtt-a-63015、vtt-a-85068、vtt-c-79093及其衍生物以及酵母属菌种1400、424a(lnh-st)、259a(lnh-st)及其衍生物。在一个实施例中,重组细胞是菌株酿酒酵母cibts1260(在美国伊利诺伊州61604农业研究服务菌种保藏中心(nrrl)登录号nrrly-50973下保藏)的衍生物。本文描述的重组细胞可以利用以下表达载体,这些表达载体包括一个或多个(例如,两个、若干个)异源基因的编码序列,这些编码序列被连接至一个或多个控制序列,这一个或多个控制序列指导在与这一个或多个控制序列相容的条件下在适合的细胞中的表达。可以在任何于此描述的细胞和方法中使用此类表达载体。本文描述的多核苷酸可以按多种方式操纵,以提供希望的多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可以是理想的或必需的。用于利用重组dna方法修饰多核苷酸的技术是本领域熟知的。可以将一个构建体或载体(或多个构建体或载体)引入细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早前所述;该构建体或载体(或这些构建体或载体)包括一个或多个(例如,两个、若干个)异源基因。各种核苷酸和控制序列可以连接在一起以产生重组表达载体,该重组表达载体可以包括一个或多个(例如,两个、若干个)合宜的限制性位点以允许本文类位点插入或取代该多核苷酸。可替代地,可以通过将这种或这些多核苷酸或者包括该序列的核酸构建体插入用于表达的适当载体中而表达这种或这些多核苷酸。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该用于表达的适当控制序列可操作地连接。重组表达载体可以是可以方便地经受重组dna程序并且可以引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是直链或闭合环状质粒。载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以包含用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含待引入到细胞的基因组中的总dna)或转座子。表达载体可以包含任何适合的启动子序列,启动子序列可被细胞识别以表达本文描述的基因。启动子序列包含转录控制序列,其介导多肽的表达。该启动子可以是在选择的细胞中显示出转录活性的任何多核苷酸,包括突变型、截短型及杂合型启动子,并且可以是由编码与该细胞同源或异源的细胞外或细胞内多肽的基因获得。本文描述的每种异源多核苷酸都可以被可操作地连接至对于该多核苷酸而言外源的启动子上。例如,在一个实施例中,编码己糖转运体的异源多核苷酸被可操作地连接至对于该多核苷酸而言外源的启动子。这些启动子可以与所选的天然启动子相同或与其具有较高水平的序列同一性(例如,至少约80%、至少约85%、至少约90%、至少约95%或至少约99%)。用于指导核酸构建体在酵母细胞中的转录的适合的启动子的实例包括但不限于获得自以下的基因的启动子:烯醇酶(例如,酿酒酵母烯醇酶或东方伊萨酵母烯醇酶(eno1))、半乳糖激酶(例如,酿酒酵母半乳糖激酶或东方伊萨酵母半乳糖激酶(gal1))、醇脱氢酶/甘油醛-3磷酸脱氢酶(例如,酿酒酵母醇脱氢酶/甘油醛-3磷酸脱氢酶或东方伊萨酵母醇脱氢酶/甘油醛-3磷酸脱氢酶(adh1、adh2/gap))、磷酸甘油醛异构酶(例如,酿酒酵母磷酸甘油醛异构酶或东方伊萨酵母磷酸甘油醛异构酶(tpi))、金属硫蛋白(例如,酿酒酵母金属硫蛋白或东方伊萨酵母金属硫蛋白(cup1))、3-磷酸甘油酸激酶(例如,酿酒酵母3磷酸甘油酸激酶或东方伊萨酵母3-磷酸甘油酸激酶(pgk))、pdc1、木糖还原酶(xr)、木糖醇脱氢酶(xdh)、l-(+)-乳酸-细胞色素c氧化还原酶(cyb2)、翻译延长因子-1(tef1)、翻译延长因子-2(tef2)、甘油醛-3-磷酸脱氢酶(gapdh)、和乳清酸核苷5'-磷酸脱羧酶(ura3)基因。酵母宿主细胞的其他有用的启动子由romanos等人,1992,yeast[酵母]8:423-488描述。控制序列也可以是被宿主细胞识别以终止转录的适合转录终止子序列。该终止子序列被可操作地连接至编码该多肽的多核苷酸的3’-末端。可以使用在所选的酵母细胞中具有功能的任何终止子。该终止子可以与所选的天然终止子相同或与其具有较高水平的序列同一性(例如,至少约80%、至少约85%、至少约90%、至少约95%或至少约99%)。酵母宿主细胞的适合的终止子可以获得自以下的基因:烯醇酶(例如,酿酒酵母或东方伊萨酵母烯醇酶)、细胞色素c(例如,酿酒酵母或东方伊萨酵母细胞色素(cyc1))、甘油醛-3磷酸脱氢酶(例如,酿酒酵母或东方伊萨酵母甘油醛-3-磷酸脱氢酶(gpd))、pdc1、xr、xdh、转醛醇酶(tal)、转酮醇酶(tkl)、核糖5-磷酸-酮醇异构酶(rki)、cyb2、以及半乳糖基因家族(尤其是gal10终止子)。酵母宿主细胞的其他有用的终止子由romanos等人,1992,同上描述。控制序列还可以是启动子下游和基因的编码序列上游的mrna稳定子区域,其增加该基因的表达。适合的mrna稳定子区域的实例从以下获得:苏云金芽孢杆菌cryiiia基因(wo94/25612)和枯草芽孢杆菌sp82基因(hue等人,1995,journalofbacteriology[细菌学杂志]177:3465-3471)。控制序列也可以是适合的前导子序列,其中转录时,所述前导子序列是对由宿主细胞翻译重要的mrna的非翻译区。该前导子序列可操作地连接至编码该多肽的多核苷酸的5’-末端。可以使用在选择的酵母细胞中具有功能的任何前导子序列。酵母宿主细胞的适合的前导子获得自以下的基因:烯醇酶(例如,酿酒酵母或东方伊萨酵母烯醇酶(eno-1))、3-磷酸甘油酸激酶(例如,酿酒酵母或东方伊萨酵母3-磷酸甘油酸激酶)、α-因子(例如,酿酒酵母或东方伊萨酵母α-因子)、以及醇脱氢酶/甘油醛-3-磷酸脱氢酶(例如,酿酒酵母或东方伊萨酵母醇脱氢酶/甘油醛-3磷酸脱氢酶(adh2/gap))。该控制序列还可以是多腺苷酸化序列;与多核苷酸3’末端可操作地连接并在转录时由宿主细胞识别为向转录的mrna添加聚腺苷酸残基的信号的序列。可以使用在选择的宿主细胞中具有功能的任何聚腺苷酸化序列。对于酵母细胞有用的聚腺苷酸化序列描述于以下文献:guo和sherman,1995,mol.cellularbiol.[分子细胞生物学]15:5983-5990。也可能令人希望的是添加调节序列,该调节序列允许相对于宿主细胞的生长而调节多肽的表达。调节系统的实例是引起将响应于化学或物理刺激(包含调节性化合物的存在)而开启或关闭的基因表达的那些系统。原核系统中的调节系统包括lac、tac和trp操纵子系统。在酵母中,可以使用adh2系统或gal1系统。这些载体可以包含一个或多个(例如,两个、若干个)允许方便地选择转化细胞、转染细胞、转导细胞等细胞的选择性标记。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。酵母宿主细胞的适合的标志包括但不限于:ade2、his3、leu2、lys2、met3、trp1和ura3。这些载体可以包含一个或多个(例如,两个、若干个)允许将该载体整合进宿主细胞的基因组中或在该细胞中独立于基因组而自主复制的元件。对于整合到该宿主细胞基因组中,该载体可以依靠编码该多肽的多核苷酸序列或用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可包含用于指导通过同源重组而整合入宿主细胞基因组中的染色体中的精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性,整合元件应当包含足够数目的核酸,如100至10,000个碱基对、400至10,000个碱基对和800至10,000个碱基对,这些核酸与对应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。潜在整合位点包括本领域所描述的那些(例如,参见us2012/0135481)。对于自主复制,载体可以进一步包含使该载体能够在所讨论的酵母细胞中自主复制的复制起点。复制起点可以是在细胞中发挥作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ars1、ars4、ars1与cen3的组合、及ars4与cen6的组合。可以将本文描述的多核苷酸的多于一个的拷贝插入到宿主细胞中以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到酵母细胞基因组中或者通过包含一个与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。用于连接以上所描述的元件以构建本文描述的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如,sambrook等人,1989,见上文)。本领域已知的用于制备用于乙醇发酵的重组细胞的另外的程序和技术描述于例如wo2016/045569中,将其内容通过引用结合在此。乙醇生产的方法本文描述的重组细胞可用于乙醇的生产。一个方面是用于生产乙醇的方法,该方法包括在适合的条件下,在可发酵培养基中培养本文描述的重组细胞以生产乙醇。在另一方面,是用于生产乙醇的方法,该方法包括(a)用酶组合物糖化纤维素材料和/或含淀粉材料;(b)用本文描述的任一种重组细胞(例如,包含编码本文描述的己糖转运体和木糖异构酶的异源多核苷酸的细胞)发酵步骤(a)的经糖化的材料。在一个实施例中,该方法包括从发酵培养基中回收乙醇。可以使用本领域常规的方法来完成纤维素材料和/或含淀粉材料的加工。此外,该方法可以使用任何常规生物质和/或配置为实施该方法的淀粉加工装置来执行。分开的或同时的糖化(即水解)和发酵包括但不限于:分开的水解和发酵(shf);同时的糖化和发酵(ssf);同时的糖化和共发酵(sscf);混合的水解和发酵(hhf);分开的水解和共发酵(shcf);混合的水解和共发酵(hhcf)。shf使用分开的处理步骤,以首先将纤维素材料酶促水解为可发酵糖(例如,葡萄糖、纤维二糖、以及戊糖单体),并且然后将可发酵糖发酵为乙醇。在ssf中,纤维素材料的酶水解和糖发酵成乙醇被组合在一个步骤中(philippidis,g.p.,1996,纤维素生物转化技术(cellulosebioconversiontechnology),handbookonbioethanol:productionandutilization[生物乙醇手册:生产和利用],wyman,c.e.编辑,泰勒-弗朗西斯出版集团(taylor&francis),华盛顿特区(washington,dc),179-212))。sscf涉及多种糖的共发酵(sheehan和himmel,1999,biotechnol.prog.[生物技术进展]15:817-827)。hhf涉及分开的水解步骤并且另外涉及同时的糖化和水解步骤,其可在同一反应器中进行。hhf过程中的步骤可以在不同的温度下进行,即高温酶糖化,随后在发酵生物耐受的更低温度下进行ssf。本文应理解的是,本领域中已知的包含预处理、酶法水解(糖化)、发酵、或其组合的任何方法,可以用于实施本文描述的方法。常规的装置可以包括一个分批补料搅拌反应器、一个批式搅拌反应器、一个具有超滤作用的连续流搅拌反应器、和/或一个连续活塞流柱式反应器(continuousplug-flowcolumnreactor)(decastilhoscorazza等人,2003,actascientiarum.technology[技术学报]25:33-38;gusakov和sinitsyn,1985,enz.microb.technol.[酶学与微生物学技术]7:346-352)、一个碾磨反应器(ryu和lee,1983,biotechnol.bioeng.[生物技术与生物工程]25:53-65)。另外的反应器类型包括:用于水解和/或发酵的流化床、升流式(upflowblanket)反应器、固定化反应器、以及挤出机型反应器。纤维素预处理在一个实施例中,在步骤(a)中的糖化之前对纤维素材料进行预处理。在实践本文描述的方法中,可以使用本领域中已知的任何预处理工艺来破坏纤维素材料的植物细胞壁组分(chandra等人,2007,adv.biochem.engin./biotechnol[生化工程/生物技术进展]108:67-93;galbe和zacchi,2007,生化工程/生物技术进展,108:41-65;hendriks和zeeman,2009,bioresourcetechnology[生物资源技术]100:10-18;mosier等人,2005,生物资源技术96:673-686;taherzadeh和karimi,2008,int.j.mol.sci.[分子科学国际杂志]9:1621-1651;yang和wyman,2008,biofuelsbioproductsandbiorefining-biofpr.[生物燃料,生物产品和生物精制biofpr.]2:26-40)。纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、筛分、预浸泡、润湿、洗涤和/或调理。常规预处理包括但不限于:蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、碱预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理、以及生物预处理。另外的预处理包括氨渗滤、超声、电穿孔、微波、超临界co2、超临界h2o、臭氧、离子液体以及γ辐射预处理。在一个实施例中,在糖化(即水解)和/或发酵之前对纤维素材料进行预处理。预处理优选在水解前进行。可替代地,预处理可以与酶水解同时进行,以释放可发酵的糖,例如葡萄糖、木糖、和/或纤维二糖。在多数情况下,预处理步骤自身导致将生物质转化为可发酵糖(甚至在不存在酶的情况下)。在一个实施例中,将纤维素材料用蒸汽预处理。在蒸汽预处理中,加热纤维素材料以破坏植物细胞壁成分,包括木质素、半纤维素、以及纤维素,以使纤维素和其他级分,例如,半纤维素可接近酶。纤维素材料经过或穿过反应容器,将蒸汽注入该反应容器以增加温度至所需温度和压力,并且将蒸汽保持在其中持续希望的反应时间。优选地在140℃-250℃,例如,160℃-200℃或170℃-190℃进行蒸汽预处理,其中最佳温度范围取决于化学催化剂的任选添加。蒸汽预处理的停留时间优选是1-60分钟,例如1-30分钟、1-20分钟、3-12分钟、或4-10分钟,其中最适停留时间取决于温度和化学催化剂的任选添加。蒸汽预处理允许相对较高的固体加载量,这样使得纤维素材料在预处理过程中通常仅变得潮湿。蒸汽预处理经常与预处理后的材料的爆发放料(explosivedischarge)合并,这被称为蒸汽爆炸,即,快速急骤蒸发至大气压和材料的湍流,以通过破碎增加可接触的表面积(duff和murray,1996,bioresourcetechnology[生物资源技术]855:1-33;galbe和zacchi,2002,appl.microbiol.biotechnol.[应用微生物学与生物技术]59:618-628;美国专利申请号2002/0164730)。在蒸汽预处理过程中,半纤维素乙酰基基团被裂解,并且得到的酸自催化半纤维素部分水解成单糖和寡糖。仅在有限的程度上去除木质素。在一个实施例中,使纤维素材料经受化学预处理。术语“化学处理”指能促进纤维素、半纤维素和/或木质素分离和/或释放的任何化学处理。这种预处理可以将结晶纤维素转化为无定形纤维素。适合的化学预处理方法的实例包括例如稀酸预处理、石灰预处理、湿法氧化、氨纤维/冷冻膨胀(afex)、氨渗滤(apr)、离子液体、以及有机溶剂预处理。有时在蒸汽预处理之前添加一种化学催化剂(例如h2so4或so2)(典型地是0.3%w/w至5%w/w),该催化剂减少时间并降低温度、增加回收率、并改善酶水解(ballesteros等人,2006,appl.biochem.biotechnol[应用生物化学与生物技术]129-132:496-508;varga等人,2004,appl.biochem.biotechnol.[应用生物化学与生物技术]113-116:509-523;sassner等人,2006,enzymemicrob.technol.[酶与微生物技术]39:756-762)。在稀酸预处理中,纤维素材料与稀酸(典型地是h2so4)和水混合,以形成浆料,由蒸汽加热至希望的温度,并且在停留时间后闪变至大气压。可采用多种反应器设计来进行稀酸预处理,例如,活塞流反应器、逆流反应器或连续逆流收缩床反应器(duff和murray,1996,bioresourcetechnology[生物资源技术]855:1-33;schell等人,2004,bioresourcetechnology[生物资源技术]91:179-188;lee等人,1999,adv.biochem.eng.biotechnol.[生物化学工程/生物技术进展]65:93-115)。在一个具体实施例中,在180℃下使用4%w/w硫酸持续5分钟来进行纤维素材料的稀酸预处理。还可以使用碱性条件下的若干种预处理方法。这些碱性预处理包括但不限于:氢氧化钠、石灰、湿氧化、氨渗滤(apr)、以及氨纤维/冷冻膨胀(afex)预处理。用氧化钙或氢氧化钙,在85℃-150℃的温度下进行石灰预处理,并且停留时间为从1小时到若干天(wyman等人,2005,bioresourcetechnology[生物资源技术]96:1959-1966;mosier等人,2005,bioresourcetechnology[生物资源技术]96:673-686)。wo2006/110891、wo2006/110899、wo2006/110900、和wo2006/110901披露了使用氨的预处理方法。湿氧化是一种热预处理,其典型地在添加氧化剂(例如过氧化氢或过压氧)的情况下在180℃-200℃下持续5分钟-15分钟进行(schmidt和thomsen,1998,bioresourcetechnology[生物资源技术]64:139-151;palonen等人,2004,appl.biochem.biotechnol.[应用生物化学与生物技术]117:1-17;varga等人,2004,biotechnol.bioeng.[生物技术与生物工程]88:567-574;martin等人,2006,j.chem.technol.biotechnol.[化学技术与生物技术杂志]81:1669-1677)。优选地在1%-40%干物质,例如2%-30%干物质或5%-20%干物质下进行预处理,并且通常通过添加碱,例如碳酸钠提高初始ph。被称为湿爆炸(湿氧化和蒸汽爆炸的组合)的湿氧化预处理方法的修改方案能够处理高达30%的干物质。在湿爆炸中,在某一停留时间后,在预处理期间引入氧化剂。然后通过急骤蒸发至大气压结束预处理(wo2006/032282)。氨纤维爆发(afex)涉及在中等温度如90℃-150℃和高压如17巴-20巴下,用液体或气态氨处理纤维素材料5分钟-10分钟,其中干物质含量可以高达60%(gollapalli等人,2002,appl.biochem.biotechnol.[应用生物化学与生物技术]98:23-35;chundawat等人,2007,biotechnol.bioeng.[生物技术与生物工程]96:219-231;alizadeh等人,2005,appl.biochem.biotechnol.[应用生物化学与生物技术]121:1133-1141;teymouri等人,2005,bioresourcetechnology[生物资源技术]96:2014-2018)。在afex预处理期间,纤维素和半纤维素保持相对完整。木质素-碳水化合物复合物被裂解。有机溶剂预处理通过使用含水乙醇(40%-60%乙醇)在160℃-200℃下提取30分钟-60分钟而将纤维素材料脱木质素(pan等人,2005,biotechnol.bioeng.[生物技术与生物工程]90:473-481;pan等人,2006,biotechnol.bioeng.[生物技术与生物工程]94:851-861;kurabi等人,2005,appl.biochem.biotechnol.[应用生物化学与生物技术]121:219-230)。通常添加硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素和木质素被去除。适合的预处理方法的其他实例由schell等人,2003,appl.biochem.biotechnol.[应用生物化学与生物技术]105-108:69-85,和mosier等人,2005,bioresourcetechnology[生物资源技术]96:673-686,以及美国专利申请2002/0164730进行了描述。在一个实施例中,化学预处理作为稀酸处理,并且更优选作为连续稀酸处理进行。酸典型地是硫酸,但也可以使用其他酸,例如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢、或其混合物。弱酸处理优选地在1-5,例如,1-4或1-2.5的ph范围中进行。在一方面,酸浓度优选地在从0.01wt.%至10wt.%酸,例如,0.05wt.%至5wt.%酸或0.1wt.%至2wt.%酸的范围内。使酸与纤维素材料相接触,并且保持在优选地140℃-200℃,例如,165℃-190℃范围内的温度下,持续从1分钟至60分钟范围内的时间。在另一个实施例中,预处理在水性浆料中进行。在优选方面,在预处理过程中纤维素材料以优选在10wt.%-80wt.%之间,例如20wt.%-70wt.%或30wt.%-60wt.%,如约40wt.%的量存在。预处理的纤维素材料可以不洗涤或使用本领域已知的任何方法洗涤,例如,用水洗涤。在一个实施例中,使纤维素材料经受机械或物理预处理。术语“机械预处理”或“物理预处理”是指促进颗粒粒度减小的任何预处理。例如,这种预处理可以涉及各种类型的研磨或碾磨(例如,干磨、湿磨、或振动球磨)。纤维素材料可以物理地(机械地)且化学地预处理。机械或物理预处理可以与蒸汽/蒸汽爆炸、水热解(hydrothermolysis)、稀酸或弱酸处理、高温、高压处理、辐射(例如,微波福射)或其组合相结合。在一方面,高压意指在优选约100至约400psi,例如约150至约250psi范围中的压力。在另一方面,高温意指在约100℃至约300℃,例如约140℃至约200℃范围内的温度。在一个优选方面,机械或物理预处理在分批过程中使用蒸汽枪水解器系统,例如从顺智公司(sundsdefibratorab),瑞典可获得的顺智水解器(sundshydrolyzer)来进行,该系统使用如上所定义的高压和高温。根据需要,可以顺序或同时进行物理和化学预处理。因此,在一个实施例中,使纤维素材料经受物理(机械)或化学预处理、或其任何组合,以促进纤维素、半纤维素和/或木质素的分离和/或释放。在一个实施例中,经受纤维素材料经受生物预处理。术语“生物预处理”是指促进纤维素、半纤维素、和/或木质素从纤维素材料中分离和/或释放的任何生物预处理。生物预处理技术可以涉及应用溶解木质素的微生物和/或酶(参见,例如,hsu,t.-a.,1996,pretreatmentofbiomass[生物质的预处理],在handbookonbioethanol:productionandutilization[生物乙醇手册:生产和利用],wyman,c.e.编辑,泰勒-弗朗西斯出版集团,华盛顿特区,179-212;ghosh和singh,1993,adv.appl.microbiol.[应用微生物学进展]39:295-333;mcmillan,j.d.,1994,pretreatinglignocellulosicbiomass:areview[预处理木质纤维素生物质:综述],在enzymaticconversionofbiomassforfuelsproduction[用于燃料生产的生物质的酶转化],himmel,m.e.,baker,j.o.,和overend,r.p.编辑,acssymposiumseries566[美国化学学会讨论会系列566],americanchemicalsociety[美国化学学会],华盛顿特区,第15章;gong,c.s.,cao,n.j.,du,j.,和tsao,g.t.,1999,ethanolproductionfromrenewableresources[由可再生资源生产乙醇],在advancesinbiochemicalengineering/biotechnology[生物化学工程/生物技术的进展],scheper,t.编辑,施普林格出版社(springer-verlag),柏林,海德堡,德国,65:207-241;olsson和hahn-hagerdal,1996,enz.microb.tech.[酶与微生物技术]18:312-331;以及vallander和eriksson,1990,adv.biochem.eng./biotechnol.[生物化学工程/生物技术的进展]42:63-95)。糖化在糖化步骤(即,水解步骤)中,纤维素材料和/或含淀粉材料(例如预处理的)被水解,来分解纤维素、半纤维素和/或淀粉为可发酵糖,例如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖、和/或可溶寡糖。水解由例如纤维素分解酶组合物酶促进行。这些组合物的酶可以同时或顺序添加。酶水解可以在易于由本领域技术人员确定的条件下,在适合的含水环境中进行。在一方面,水解在适合于一种或多种酶的活性,即,对于这种或这些酶来说最佳的条件下进行。水解能以分批补料或连续的过程进行,其中将纤维素材料和/或含淀粉材料逐渐补入,例如,包含酶的水解溶液中。糖化通常在搅拌釜反应器或发酵罐中,在受控的ph、温度、和混合条件下进行。适合的处理时间、温度以及ph条件可以由本领域技术人员容易地确定。例如,糖化可以持续长达200小时,但是典型地进行优选约12至约120小时,例如约16至约72小时或约24至约48小时。温度优选约25℃至约70℃,例如约30℃至约65℃,约40℃至约60℃,或约50℃至55℃的范围。ph优选约3至约8,例如约3.5至约7,约4至约6,或约ph4.5至约ph5.5的范围。干固体含量在约5wt.%到约50wt.%的范围内,例如约10wt.%至约40wt.%,或约20wt.%到约30wt.%。可以使用纤维素分解酶组合物进行在步骤(a)中的糖化。这样的酶组合物在下面的“纤维素分解酶组合物”部分中进行了描述。纤维素分解酶组合物可以包括有用于降解纤维素材料的任何蛋白。在一个方面,纤维素分解酶组合物包括或进一步包括选自下组的一种或多种(例如,若干种)蛋白质,该组由以下组成:纤维素酶、aa9(gh61)多肽、半纤维素酶、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶、以及膨胀素。在另一个实施例中,纤维素酶优选是选自下组的一种或多种(例如,若干种)酶,该组由以下组成:内切葡聚糖酶、纤维二糖水解酶以及β-葡糖苷酶。在另一个实施例中,半纤维素酶优选是选自下组的一种或多种(例如若干种)酶,该组由以下组成:乙酰基甘露聚糖酯酶、乙酰基木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡萄糖醛酸酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、和木糖苷酶。在另一个实施例中,该氧化还原酶是选自下组的一种或多种(例如,若干种)酶,该组由以下组成:过氧化氢酶、漆酶以及过氧化物酶。在本发明的方法中使用的酶或酶组合物可以是以任何适于使用的形式存在的,例如像发酵液配制品或细胞组合物、具有或不具有细胞碎片的细胞裂解物、半纯化或纯化的酶制剂、或作为酶的来源的宿主细胞。该酶组合物可为干粉或颗粒,无粉尘的颗粒,液体,稳定化液体或稳定化受保护的酶。可以根据已建立的方法例如通过添加稳定剂(如糖、糖醇或其他多元醇)、和/或乳酸或另一种有机酸,对液体酶制剂进行稳定化。在一个实施例中,纤维素分解或半纤维素分解酶组合物对于纤维素材料的有效量是约0.5mg至约50mg,例如,约0.5mg至约40mg、约0.5mg至约25mg、约0.75mg至约20mg、约0.75mg至约15mg、约0.5mg至约10mg、或约2.5mg至约10mg/g的该纤维素材料。在一个实施例中,以这样一种化合物对纤维素的葡糖基单元的以下摩尔比添加该化合物:约10-6至约10,例如约10-6至约7.5、约10-6至约5、约10-6至约2.5、约10-6至约1、约10-5至约1、约10-5至约10-1、约10-4至约10-1、约10-3至约10-1、或约10-3至约10-2。在另一方面,这样一种化合物的有效量是约0.1μm至约1m,例如约0.5μm至约0.75m、约0.75μm至约0.5m、约1μm至约0.25m、约1μm至约0.1m、约5μm至约50mm、约10μm至约25mm、约50μm至约25mm、约10μm至约10mm、约5μm至约5mm、或约0.1mm至约1mm。术语“液体(liquor)”意指在如描述于wo2012/021401中的条件下,由处理浆料中的木质纤维素和/或半纤维素材料、或其单糖(例如,木糖、阿拉伯糖、甘露糖等)所产生的溶液相(水相、有机相或其组合)、及其可溶性内容物。可以通过对木质纤维素或半纤维素材料(或原料)加热和/或加压进行处理,任选地是在一种催化剂例如酸的存在下、任选地是在有机溶剂的存在下、和任选地与材料的物理破坏相结合,然后将溶液与残余固形物分离,来产生一种用于加强aa9多肽(gh61多肽)纤维分解的液体。在由纤维素分解酶制剂对纤维素底物的水解过程中,从液体与aa9多肽的组合中可得到纤维素分解增强的程度是由这类条件确定的。可以使用本领域的标准方法,如过滤、沉淀或离心,而将液体与经过处理的材料进行分离。在一个实施例中,对于纤维素来说的液体的有效量是约10-6至约10g/g的纤维素,例如约10-6至约7.5g、约10-6至约5g、约10-6至约2.5g、约10-6至约1g、约10-5至约1g、约10-5至约10-1g、约10-4至约10-1g、约10-3至约10-1g、或约10-3至约10-2g/g的纤维素。纤维素分解酶组合物纤维素分解酶组合物可以是在步骤(a)中的糖化过程中存在的或添加的。纤维素分解酶组合物是包含水解纤维素材料的一种或多种(例如若干种)酶的酶制剂。此类酶包括内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、和/或其组合。纤维素分解酶组合物可以具有任何来源。在一个实施例中,纤维素分解酶组合物来源于木霉属的菌株,例如里氏木霉的菌株;腐质霉属的菌株,例如特异腐质霉的菌株,和/或金孢子菌属的菌株,例如卢克诺文思金孢子菌的菌株。在一个优选的实施例中,纤维素分解酶制剂来源于里氏木霉的菌株。纤维素分解酶组合物可进一步包括以下多肽(例如酶)中的一种或多种:具有纤维素分解增强活性的aa9多肽(gh61多肽)、β-葡糖苷酶、木聚糖酶、β-木糖苷酶、cbhi、cbhii、或其两种、三种、四种、五种、或六种的混合物。另外的一种或多种多肽(例如,aa9多肽)和/或一种或多种酶(例如,β-葡糖苷酶、木聚糖酶、β-木糖苷酶、cbhi和/或cbhii)对于该纤维素分解酶组合物生产生物(例如,里氏木霉)可以是外来的。在一个实施例中,纤维素分解酶制剂包括具有纤维素分解增强活性的aa9多肽和β-葡糖苷酶。在另一实施例中,该纤维素分解酶制剂包括具有纤维素分解增强活性的aa9多肽、β-葡糖苷酶、以及cbhi。在另一实施例中,该纤维素分解酶制剂包括具有纤维素分解增强活性的aa9多肽、β-葡糖苷酶、cbhi以及cbhii。其他酶(例如内切葡聚糖酶),还可以包括在纤维素分解酶组合物中。如以上提到的,纤维素分解酶组合物可以包括多种不同的多肽,包括酶。在一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的橙色嗜热子囊菌(thermoascusaurantiacus)aa9(gh61a)多肽(例如,wo2005/074656),以及米曲霉β-葡糖苷酶融合蛋白(例如,披露于wo2008/057637中的一种,特别是如seqidno:59和seqidno:60中所示)。在另一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的金黄色嗜热子囊菌aa9(gh61a)多肽(例如,wo2005/074656中的seqidno:2)以及烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2)。在另一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的埃默森青霉菌aa9(gh61a)多肽,特别是披露于wo2011/041397中的一种,以及烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2)。在另一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的埃默森青霉菌(penicilliumemersonii)aa9(gh61a)多肽,特别是披露于wo2011/041397中的一种,以及烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2),或披露于wo2012/044915(通过引用结合本文)的变体,特别是包括一个或多个(例如所有)的以下取代的变体:f100d、s283g、n456e、f512y。在一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的aa9(gh61a)多肽,特别是衍生自埃默森青霉菌菌株的一种(例如wo2011/041397中的seqidno:2),烟曲霉β-葡糖苷酶(例如,wo2005/047499中的seqidno:2)变体,该变体具有一个或多个(特别是所有)的以下取代:f100d、s283g、n456e、f512y且披露于wo2012/044915中;烟曲霉cel7acbh1,例如在wo2011/057140中披露为seqidno:6的一种和烟曲霉cbhii,例如在wo2011/057140中披露为seqidno:18的一种。在一个优选的实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括半纤维素酶或半纤维素分解酶组合物,例如,烟曲霉木聚糖酶和烟曲霉β-木糖苷酶。在一个实施例中,纤维素分解酶组合物还包括木聚糖酶(例如,衍生自曲霉属,特别是棘孢曲霉或烟曲霉的菌株;或篮状菌属,特别是talaromycesleycettanus的菌株)和/或β-木糖苷酶(例如,衍生自曲霉属,特别是烟曲霉,或篮状菌属,特别是埃默森篮状菌(talaromycesemersonii)的菌株)。在一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的橙色嗜热子囊菌aa9(gh61a)多肽(例如,wo2005/074656),米曲霉β-葡糖苷酶融合蛋白(例如,披露于wo2008/057637中的一种,特别是如seqidno:59和seqidno:60),以及棘孢曲霉木聚糖酶(例如,在wo94/21785中的xylii)。在另一个实施例中,纤维素分解酶制剂包括里氏木霉纤维分解制剂,该里氏木霉纤维分解制剂进一步包括具有纤维素分解增强活性的橙色嗜热子囊菌gh61a多肽(例如wo2005/074656中的seqidno:2)、烟曲霉β-葡糖苷酶(例如wo2005/047499的seqidno:2)、以及棘孢曲霉木聚糖酶(披露于wo94/21785中的xylii)。在另一个实施例中,该纤维素分解酶组合物包括里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的橙色嗜热子囊菌aa9(gh61a)多肽(例如wo2005/074656中的seqidno:2)、烟曲霉β-葡糖苷酶(例如wo2005/047499的seqidno:2)、以及棘孢曲霉木聚糖酶(例如披露于wo94/21785中的xylii)。在另一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的埃默森青霉菌aa9(gh61a)多肽(特别是披露于wo2011/041397中的一种)、烟曲霉β-葡糖苷酶(例如wo2005/047499的seqidno:2)、以及烟曲霉木聚糖酶(例如wo2006/078256中的xyliii)。在另一个实施例中,纤维素分解酶组合物包括里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的埃默森青霉菌aa9(gh61a)多肽,特别是披露于wo2011/041397中的一种,烟曲霉β-葡糖苷酶(例如,wo2005/047499的seqidno:2),烟曲霉木聚糖酶(例如,在wo2006/078256中的xyliii),以及来自烟曲霉的cbhi,特别是披露为wo2011/057140中的seqidno:2的cel7acbh1。在另一个实施例中,纤维素分解酶包括里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的埃默森青霉菌aa9(gh61a)多肽,特别是披露于wo2011/041397中的一种,烟曲霉β-葡糖苷酶(例如,wo2005/047499中的seqidno:2),烟曲霉木聚糖酶(例如,wo2006/078256中的xyliii),来自烟曲霉的cbhi,特别是披露为wo2011/057140中的seqidno:2的cel7acbh1,以及来源于烟曲霉的cbhii,特别是披露为wo2013/028928中的seqidno:4的一种。在另一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物进一步包括具有纤维素分解增强活性的埃默森青霉菌aa9(gh61a)多肽(特别是披露于wo2011/041397中的一种)、烟曲霉β-葡糖苷酶(例如wo2005/047499的seqidno:2)或其变体,该变体具有一个或多个(特别是所有)的以下取代:f100d、s283g、n456e、f512y;烟曲霉木聚糖酶(例如wo2006/078256中的xyliii)、来自烟曲霉的cbhi(特别是在wo2011/057140中披露为seqidno:2的cel7acbhi),以及源自于烟曲霉的cbhii(特别是在wo2013/028928中披露的一种)。在另一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物包含cbhi(genseqp登录号azy49536(wo2012/103293);cbhii(genseqp登录号azy49446(wo2012/103288);β-葡糖苷酶变体(genseqp登录号azu67153(wo2012/44915)),特别是具有一个或多个(特别是所有)的以下取代:f100d、s283g、n456e、f512y;以及aa9(gh61多肽)(genseqp登录号bal61510(wo2013/028912))。在另一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物包含cbhi(genseqp登录号azy49536(wo2012/103293));cbhii(genseqp登录号azy49446(wo2012/103288);gh10木聚糖酶(genseqp登录号bak46118(wo2013/019827));以及β-木糖苷酶(genseqp登录号azi04896(wo2011/057140))。在另一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物包含cbhi(genseqp登录号azy49536(wo2012/103293));cbhii(genseqp登录号azy49446(wo2012/103288));以及aa9(gh61多肽;genseqp登录号bal61510(wo2013/028912))。在另一个实施例中,纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物包含cbhi(genseqp登录号azy49536(wo2012/103293));cbhii(genseqp登录号azy49446(wo2012/103288)),aa9(gh61多肽;genseqp登录号bal61510(wo2013/028912)),以及过氧化氢酶(genseqp登录号bac11005(wo2012/130120))。在一个实施例中,该纤维素分解酶组合物是里氏木霉纤维素分解酶组合物,该里氏木霉纤维素分解酶组合物包含cbhi(genseqp登录号azy49446(wo2012/103288);cbhii(genseqp登录号azy49446(wo2012/103288)),β-葡糖苷酶变体(genseqp登录号azu67153(wo2012/44915)),具有一个或多个(特别是所有)的以下取代:f100d、s283g、n456e、f512y;aa9(gh61多肽;genseqp登录号bal61510(wo2013/028912)),gh10木聚糖酶(genseqp登录号bak46118(wo2013/019827)),以及β-木糖苷酶(genseqp登录号azi04896(wo2011/057140))。在一个实施例中,纤维素分解组合物是里氏木霉纤维素分解酶制剂,该里氏木霉纤维素分解酶组合物包含egi(swissprot登录号p07981)、egii(embl登录号m19373)、cbhi(见上文);cbhii(见上文);具有以下取代的β-葡糖苷酶变体(见上文):f100d、s283g、n456e、f512y;aa9(gh61多肽;见上文),gh10木聚糖酶(见上文);以及β-木糖苷酶(见上文)。也考虑披露于wo2013/028928中的所有的纤维素分解酶组合物并且通过引用结合本文。该纤维素分解酶组合物包括或可以进一步包括选自下组的一种或多种(若干种)蛋白质,该组由以下组成:纤维素酶、具有纤维素分解增强活性的aa9(即gh61)多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及膨胀素。在一个实施例中,纤维素分解酶组合物是商业纤维素分解酶组合物。适合用于本发明的方法的商业纤维素分解酶组合物的实例包括:ctec(诺维信公司)、ctec2(诺维信公司)、ctec3(诺维信公司)、celluclasttm(诺维信公司)、spezymetmcp(杰能科国际公司(genencorint.))、accellerasetm1000、accellerase1500、accellerasetmtrio(杜邦公司(dupont))、nl(dsm);s/l100(dsm)、rohamenttm7069w(罗姆公司(gmbh))、或cmax3tm(并矢国际公司(dyadicinternational,inc.))。可以按从约0.001wt.%至约5.0wt.%的固体,例如,约0.025wt.%至约4.0wt.%的固体、或约0.005wt.%至约2.0wt.%的固体的有效量添加纤维素分解酶组合物。另外的酶及其组合物可见于wo2016/0455569(其内容通过引用以其整体结合在此)。发酵可以通过一种或多种(例如,若干种)能够将糖直接或间接发酵为乙醇的本文描述的发酵微生物来发酵自水解的纤维素材料和/或含淀粉材料获得的可发酵糖。“发酵”或“发酵过程”指任何发酵过程或包含发酵步骤的任何方法。在发酵步骤中,例如作为预处理和酶水解步骤的结果的由纤维素材料和/或含淀粉材料释放的糖,由发酵生物体(例如本文描述的酵母)发酵为乙醇。水解(糖化)和发酵可以是分开的或同时的。在实施本文描述的方法的发酵步骤中可以使用任何适合的经水解的纤维素材料和/或含淀粉材料。这类原料包括但不限于碳水化合物(例如,木质纤维素、木聚糖、纤维素、淀粉等)。该材料一般是基于经济学,即,每当量糖势的成本,以及对酶致转变的难降解性而进行选择。使用纤维素材料通过发酵微生物生产乙醇是由糖(单糖)的代谢产生的。经水解的纤维素材料的糖组成和发酵微生物利用不同糖的能力对工艺产率具有直接影响。在申请人在本文的公开之前,本领域已知的菌株有效地利用葡萄糖但不(或非常有限地)代谢戊糖(如木糖,其为通常在水解材料中发现的单糖)。发酵培养基的组成和发酵条件取决于发酵生物,并且可以由本领域技术人员容易地确定。通常,发酵在已知适于产生发酵产物的条件下进行。在一些实施例中,发酵过程在有氧或微需氧条件下(即,氧气浓度小于空气中的氧气浓度)或厌氧条件下进行。在一些实施例中,发酵在厌氧条件下(即没有可检测的氧气)或小于约5、约2.5或约1mmol/l/h的氧气中进行。在没有氧的情况下,糖酵解中产生的nadh不能通过氧化磷酸化氧化。在厌氧条件下,宿主细胞可利用丙酮酸或其衍生物作为电子和氢受体以产生nad+。发酵过程通常在对重组真菌细胞最佳的温度进行。例如,在一些实施例中,发酵过程在约25℃至约42℃的范围内的温度进行。通常,该方法在低于约38℃,低于约35℃,低于约33℃,或低于约38℃,但至少约20℃、22℃或25℃的温度进行。发酵刺激剂可以用在本文所描述的方法中,以进一步改善发酵,并且特别是改善发酵生物的性能,例如速率增加和产物产率(例如乙醇产率)。“发酵刺激剂”是指用于发酵生物(特别是酵母)生长的刺激剂。用于生长的优选发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯酸、叶酸、核黄素、以及维生素a、b、c、d和e。例如,参见alfenore等人,improvingethanolproductionandviabilityofsaccharomycescerevisiabyavitaminfeedingstrategyduringfed-batchprocess[通过在进料分批方法过程中的一种维生素进料策略改善乙醇产生和酿酒酵母(saccharomycescerevisiae)的存活力],springer-verlag[施普林格出版社](2002),将其通过引用结合本文。矿物质的实例包括可以供应包含p、k、mg、s、ca、fe、zn、mn、和cu营养素的矿物质和矿物盐。可以使用本领域已知的任何方法,任选地从发酵培养基中回收发酵产物(即,乙醇),该方法包括但不限于:层析法、电泳程序、差别溶解度、蒸馏或萃取。例如,通过常规蒸馏方法从发酵的纤维素材料中分离和纯化醇。可以获得具有高达约96vol.%的纯度的乙醇,这可以用作例如燃料乙醇、饮用乙醇,即可饮用的中性烈酒、或工业乙醇。在所述方法的一些方面中,回收后的乙醇是基本上纯的。关于生产乙醇的方法,“基本上纯的”意指回收的制剂包含不超过15%的杂质,其中杂质意指除乙醇以外的化合物。在一种变体中,提供了基本上纯的制剂,其中该制剂包含至多25%杂质、或至多20%杂质、或至多10%杂质、或至多5%杂质、或至多3%杂质、或至多1%杂质、或至多0.5%杂质。在本文所述的方法的一些实施例中,在相同条件下(例如在发酵约40小时或发酵40小时后,如在实例3中描述的条件下),当与使用没有编码己糖转运体的异源多核苷酸的相同细胞的发酵相比时,步骤(b)的发酵消耗了增加量的葡萄糖和戊糖(例如木糖)。在本文所述的方法的一个实施例中,在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的木糖被消耗。在本文所述的方法的一个实施例中,在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的葡萄糖被消耗。在本文所述的方法的一个实施例中,在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的戊糖(例如木糖)被消耗,且培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的葡萄糖被消耗。在本文所述的方法的一些实施例中,在相同条件下(例如在发酵约40小时或发酵40小时后,如在实例3中描述的条件下),当与使用没有编码己糖转运体的异源多核苷酸的相同细胞的发酵相比时,步骤(b)的发酵提供更高的乙醇产率。可以使用本领域已知的方法实施适合的测定来测试乙醇和污染物的产生以及糖消耗。例如,可以通过方法(例如hplc(高效液相色谱法)、gc-ms(气相色谱-质谱法)和lc-ms(液相色谱-质谱法))或使用本领域熟知的常规程序的其他适合的分析方法对乙醇产物以及其他有机化合物进行分析。还可以用培养上清液测试发酵液中的乙醇的释放。可以使用例如针对葡萄糖和醇类的折光率检测器、以及针对有机酸的uv检测器通过hplc(lin等人,biotechnol.bioeng.[生物技术与生物工程]90:775-779(2005))、或使用本领域熟知的其他适合的测定和检测方法量化在发酵培养基中的副产物和残余的糖(例如,葡萄糖或木糖)。可在以下编号的段落中进一步描述本发明:段落[1].一种重组酵母细胞,该重组酵母细胞包含编码己糖转运体的异源多核苷酸,其中该己糖转运体与seqidno:2具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性;并且其中所述酵母细胞能够发酵木糖。段落[2].如段落[1]所述的重组细胞,其中该异源多核苷酸编码的己糖转运体与seqidno:2相差不超过十个氨基酸,例如相差不超过五个氨基酸、相差不超过四个氨基酸、相差不超过三个氨基酸、相差不超过两个氨基酸或相差一个氨基酸。段落[3].如段落[1]所述的重组细胞,其中该异源多核苷酸编码的己糖转运体具有以下氨基酸序列,该氨基酸序列包含seqidno:2的氨基酸序列或由seqidno:2的氨基酸序列组成。段落[4].如段落[1]-[3]中任一项所述的重组细胞,其中该编码己糖转运体的异源多核苷酸包含与seqidno:1具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列同一性的编码序列。段落[5].如段落[4]所述的重组细胞,其中该编码己糖转运体的异源多核苷酸具有由seqidno:1组成的编码序列。段落[6].如段落[1]-[5]中任一项所述的重组细胞,其中该编码己糖转运体的异源多核苷酸包含以下编码序列,该编码序列在至少低严格条件下,例如中严格条件下、中-高严格条件下、高严格条件下、或非常高严格条件下与seqidno:1的全长互补链杂交。段落[7].如段落[1]-[6]中任一项所述的重组细胞,该重组细胞进一步包含编码木糖异构酶的异源多核苷酸。段落[8].如段落[7]所述的重组细胞,其中所述木糖异构酶与seqidno:18具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性。段落[9].如段落[1]-[8]中任一项所述的重组细胞,其中与没有该编码己糖转运体的异源多核苷酸的相同细胞相比,在孵育约4天或孵育4天后(例如在实例2中描述的条件下),菌株在戊糖(例如木糖)上具有更高的厌氧生长速率。段落[10].如段落[1]-[9]中任一项所述的重组细胞,其中与没有该编码己糖转运体的异源多核苷酸的相同细胞相比,在发酵约40小时或发酵40小时后(例如在实例3中描述的条件下),菌株具有更高的戊糖(例如木糖)消耗。段落[11].如段落[1]-[10]中任一项所述的重组细胞,其中与没有该编码己糖转运体的异源多核苷酸的相同细胞相比,在发酵约40小时或发酵40小时后(例如在实例3中描述的条件下),菌株具有更高的乙醇产生。段落[12].如段落[1]-[11]中任一项所述的重组细胞,该重组细胞进一步包含编码木酮糖激酶(xk)的异源多核苷酸。段落[13].如段落[12]所述的重组细胞,其中所述木酮糖激酶(xk)是酿酒酵母xk,或者是与seqidno:22具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的xk。段落[14].如段落[1]-[13]中任一项所述的重组细胞,该重组细胞进一步包含编码核酮糖5磷酸3-差向异构酶(rpe1)的异源多核苷酸。段落[15].如段落[14]所述的重组细胞,其中该核酮糖5磷酸3-差向异构酶(rpe1)是酿酒酵母rpe1,或者是与酿酒酵母rpe1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的rpe1。段落[16].如段落[1]-[15]中任一项所述的重组细胞,该重组细胞进一步包含编码核酮糖5磷酸异构酶(rki1)的异源多核苷酸。段落[17].如段落[16]所述的重组细胞,其中所述核酮糖5磷酸异构酶(rki1)是酿酒酵母rki1,或者是与酿酒酵母rki1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的rki1。段落[18].如段落[1]-[17]中任一项所述的重组细胞,该重组细胞进一步包含编码转酮酶(tkl1)的异源多核苷酸。段落[19].如段落[18]所述的重组细胞,其中所述转酮酶(tkl1)是酿酒酵母tkl1,或者是与酿酒酵母tkl1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的tkl1。段落[20].如段落[1]-[19]中任一项所述的重组细胞,该重组细胞进一步包含编码转醛酶(tal1)的异源多核苷酸。段落[21].如段落[20]所述的重组细胞,其中该转醛酶(tal1)是酿酒酵母tal1,或者是与酿酒酵母tal1具有至少60%,例如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的tal1。段落[22].如段落[1]-[21]中任一项所述的重组细胞,该重组细胞进一步包含对编码甘油3-磷酸脱氢酶(gpd)的内源基因的破坏。段落[23].如段落[1]-[23]中任一项所述的重组细胞,该重组细胞进一步包含对编码甘油3-磷酸酶(gpp)的内源基因的破坏。段落[24].如段落[1]-[23]中任一项所述的重组细胞,该重组细胞为酵母属、红酵母属、裂殖酵母属、克鲁维酵母属、毕赤酵母属、汉逊酵母属、红冬孢酵母属、假丝酵母属、耶氏酵母属、油脂酵母属、隐球菌属或德克拉酵母属菌种细胞。段落[25].如段落[1]-[24]中任一项所述的重组细胞,该重组细胞是酿酒酵母细胞。段落[26].如段落[25]所述的重组细胞,其中该酿酒酵母是菌株酿酒酵母cibts1260(在美国伊利诺伊州61604农业研究服务菌种保藏中心(nrrl)登录号nrrly-50973下保藏)的衍生物。段落[27].如段落[1]-[26]中任一项所述的重组细胞,其中在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),该细胞能够消耗培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的戊糖(例如木糖)。段落[28].如段落[1]-[27]中任一项所述的重组细胞,其中在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),该细胞能够消耗培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的葡萄糖。段落[29].如段落[1]-[28]中任一项所述的重组细胞,其中在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),该细胞能够消耗培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的戊糖(例如木糖),且能够消耗培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的葡萄糖。段落[30].一种用于生产乙醇的方法,该方法包括在适合的条件下,在可发酵的培养基中培养如段落[1]-[29]中任一项所述的重组细胞以生产乙醇。段落[31].如段落[30]所述的方法,其中该培养在低氧(例如厌氧)条件下进行。段落[32].如段落[31]或[32]所述的方法,其中在相同条件下(例如在发酵约40小时或发酵40小时后,如在实例3中描述的条件下),当与使用没有该编码己糖转运体的异源多核苷酸的相同细胞的方法相比时,消耗了增加的量的葡萄糖和戊糖(例如木糖)。段落[33].如段落[30]-[32]中任一项所述的方法,其中在发酵约66小时或发酵66小时之后(例如在实例4中描述的条件下),培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的戊糖(例如木糖)被消耗,且培养基中超过65%,例如至少70%、75%、80%、85%、90%、95%的葡萄糖被消耗。段落[34].如段落[30]-[33]中任一项所述的方法,其中在相同条件下(例如在发酵约40小时或发酵40小时后,如在实例3中描述的条件下),当与使用没有编码己糖转运体的异源多核苷酸的相同细胞的方法相比时,该方法导致更高的乙醇产率。段落[35].如段落[30]-[34]中任一项所述的方法,该方法包括从发酵中回收发酵产物。段落[36].如段落[30]-[35]中任一项所述的方法,该方法包括用酶组合物糖化纤维素材料和/或含淀粉材料以产生发酵培养基。段落[37].如段落[36]所述的方法,其中糖化发生在纤维素材料上,且其中所述纤维素材料是经预处理的。段落[38].如段落[37]所述的方法,其中该预处理是稀酸预处理。段落[39].如段落[36]-[38]中任一项所述的方法,其中糖化发生在纤维素材料上,且其中该酶组合物包含一种或多种选自以下的酶:纤维素酶、aa9多肽、半纤维素酶、cip、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶、和膨胀素。段落[40].如段落[39]所述的方法,其中该纤维素酶是选自以下的一种或多种酶:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。段落[41].如段落[39]或[40]所述的方法,其中该半纤维素酶是选自以下的一种或多种酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。段落[42].如段落[36]-[41]中任一项所述的方法,其中在同时糖化和发酵(ssf)中同时进行发酵和糖化。段落[43].如段落[36]-[41]中任一项所述的方法,其中顺序进行(shf)发酵和糖化。本文描述和要求保护的本发明不限于本文披露的特定方面的范围,因为这些方面旨在作为本发明若干方面的说明。任何等效方面旨在处于本发明的范围之内。实际上,除了本文所示和描述的那些之外,对于本领域的技术人员而言本发明的各种修改将从前述说明变得显而易见。此类修改也旨在落入所附权利要求书的范围内。在冲突的情况下,以包括定义的本披露为准。本文引用了多个参考,其披露内容通过援引以其全部内部结合本文。实例用作缓冲液和底物的化学品是至少试剂级的商业产品。菌株(ethanol)是在整个生物燃料工业中使用的工业酿酒酵母菌株,并根据herskowitz(1988)的方法产生孢子以生成单倍体。其中一个单倍体ygt40被用作tef1启动子(ptef1-sc)、hxt2基因和tip1终止子(ttip1)序列的pcr扩增的模板。使用菌株酿酒酵母jg169(wo2008/008967)作为模板用于扩增质粒pfyd1092中的左侧翼和右侧翼。菌株酿酒酵母fyd853(参见wo2016/045569,菌株cibts1260)是表达木糖异构酶的工程化菌株,其用作模板以扩增质粒pfyd1497中的左侧翼和右侧翼以及用作hxt2表达的宿主。菌株酿酒酵母cibts1260由诺维信公司根据布达佩斯条约的条款在农业研究服务菌种保藏中心(nrrl),1815北部大学街(northuniversitystreet),皮奥瑞亚(peoria),伊利诺伊州61604,美国)保藏,并给出以下登录号:保藏物登录号保藏日期cibts1260nrrly-509732014年9月5日菌株酿酒酵母mbg4982从酿酒酵母fyd853产生,其使用与wo2005/121337中描述的那些类似的方法,通过使能够在木糖基本(xyloseminimal)培养基上厌氧生长的单倍体与衍生自酵母的长期培养物(针对它们对纤维素水解产物中发现的抑制剂的抗性来选择)的互补单倍体交配进行。杂交菌株产生孢子,且单倍体在厌氧条件下在木糖基本培养基上发芽。从这些单倍体产生大规模交配培养物,并进行几轮选择,选择在木糖上生长的能力和耐受水解产物的能力。选择后,基于发酵木糖的能力和对水解产物培养基中抑制剂的耐受性鉴定出mbg4982。培养基和溶液lb+amp培养基由以下项构成:10g的胰蛋白胨、5g的酵母提取物、10g的nacl、去离子水补足至1l、以及100mg/l的氨苄青霉素。对于lb+amp琼脂板,使用15g/l的细菌用琼脂,并且氨苄青霉素的浓度增加至150mg/l。ypd培养基由10g的酵母提取物、20g的蛋白胨、20g的葡萄糖和去离子水补足至1l组成。对于板,使用20g/l的细菌用琼脂,并在适当时添加潮霉素b至200mg/l。2xypd培养基由以下构成:20g的酵母提取物、40g的蛋白胨、40g的葡萄糖、以及去离子水补足至1l。1mk2hpo4缓冲液由以下构成:228.23g的k2hpo4x3h2o、和去离子水补足至1l。1mkh2po4缓冲液由以下构成:136.09g的kh2po4、和去离子水补足至1l。1m磷酸盐缓冲液(ph=6.0)由以下构成:132ml的1mk2hpo4和868ml的1mkh2po4。sd2培养基由以下构成:6.7g的没有氨基酸的酵母氮基,100ml的1m磷酸盐缓冲液(ph=6.0)、20g的葡萄糖、和去离子水补足至1l。对于板,添加20g/l的细菌用琼脂。sx2培养基由以下构成:6.7g的没有氨基酸的酵母氮基,100ml的1m磷酸盐缓冲液(ph=6.0)、20g的木糖(bioultra,西格玛奥德里奇公司(sigma-aldrich))、和去离子水补足至1l。对于板,添加20g/l的细菌用琼脂。sx2.5培养基由以下构成:6.7g的没有氨基酸的酵母氮基,100ml的1m磷酸盐缓冲液(ph=6.0)、25g的木糖(bioultra,西格玛奥德里奇公司)、和去离子水补足至1l。sd5x2.5培养基由以下构成:6.7g的没有氨基酸的酵母氮基,100ml的1m磷酸盐缓冲液(ph=6.0)、50g的葡萄糖、25g的木糖(bioultra,西格玛奥德里奇公司)、和去离子水补足至1l。sx1/sd1培养基由以下构成:6.7g的没有氨基酸的酵母氮基、100ml的1m磷酸盐缓冲液(ph=6.0)、10g的葡萄糖、10g的木糖(bioultra,西格玛奥德里奇公司)、和去离子水补足至1l。sx6培养基由以下构成:6.7g的没有氨基酸的酵母氮基,100ml的1m磷酸盐缓冲液(ph=6.0)、60g的木糖(bioultra,西格玛奥德里奇公司)、和去离子水补足至1l。sd6培养基由以下构成:6.7g的没有氨基酸的酵母氮基,100ml的1m磷酸盐缓冲液(ph=6.0)、60g的葡萄糖(bioultra,西格玛奥德里奇公司)、和去离子水补足至1l。sx3/sd3培养基由以下构成:6.7g的没有氨基酸的酵母氮基,100ml的1m磷酸盐缓冲液(ph=6.0)、30g的葡萄糖、30g的木糖(bioultra,西格玛奥德里奇公司)、和去离子水补足至1l。tbe缓冲液由以下构成:10.8g的tris碱、5.5g的硼酸、4ml的0.5medtaph=8.0、以及去离子水补足至1l。表1.引物序列hplc方案通过alliance2695hplc(沃特世公司(waterscorp.))和waters2414ri检测器(沃特世公司)的方式并且并由empowertm3软件(沃特世公司)控制来确定乙酸盐、葡萄糖、木糖、甘油和乙醇的含量。仪器设置列于下表2中。表2.用于在以下实例中分析样品的hplc仪器设置。柱rezexroa-有机酸h+柱规格300x7.8mm粒径8μm防护罩securityguardtmcarbo-h+防护罩规格4x3.0mm制造商菲罗门公司(phenomenex)柱温度60℃流速0.7ml/min流动相5mm硫酸洗脱等度注射体积10μl检测ri,35℃运行时间25min.实例1:酵母菌株fyd1547的构建本实例描述了表达木糖异构酶的酵母菌株fyd1547的构建,该菌株还含有在tef1启动子(ptef1-sc)控制下的一个拷贝的hxt2基因(包含seqidno:1的编码序列,编码seqidno:2的己糖转运体2),该基因整合在fyd1547基因组中的chrxi-1基因座处。质粒pfyd1090(图1;seqidno:19)作为合成基因从geneart(赛默飞世尔科技公司(thermofisherscientific))订购,该质粒含有潮霉素抗性标记(hph)和用于破坏gal1基因的侧翼。第一个克隆步骤是将pfyd1090(图1;seqidno:19)中的“上游gal1”和“下游gal1”同源区替换为pfyd1090中的5'chrxi-1和3'chrxi-1侧翼区,并插入tef1启动子(ptef1-sc)、hxt2基因和tip1终止子(ttip1)以产生pfyd1092。分别使用引物组oy1481+oy1482和oy1483+oy1484扩增gal1上游和下游同源区以及用于克隆的另外限制性位点和侧翼dna。使用热启动flexdna聚合酶(新英格兰生物实验室公司(newenglandbiolabs))根据制造商的说明书进行扩增反应。gal1上游和下游区域的每个pcr由1μl的jg169基因组dna制备物、1xhf缓冲液、200μm的每种dntp、500nm正向引物、500nm反向引物和1单位的热启动flexdna聚合酶组成。分别使用引物组oy796+oy1476、oy1477+oy1478和oy1479+oy1485扩增tef1启动子(ptef1-sc)、hxt2基因和tip1终止子(ttip1)以及用于克隆的另外的侧翼dna。使用热启动flexdna聚合酶(新英格兰生物实验室公司(newenglandbiolabs))根据制造商的说明书进行扩增反应。每个pcr由1μl的ygt40基因组dna制备物、1xhf缓冲液、200μm的每种dntp、500nm正向引物、500nm反向引物和1单位的热启动flexdna聚合酶组成。将反应在编程为如下的bio-radc1000touchtm热循环仪(伯乐实验室公司)中孵育:1个循环,在98℃持续3分钟;35个循环,每个循环在98℃持续10秒、55℃持续30秒、并且在72℃持续1.5分钟;以及1个循环,在72℃持续5分钟。热循环后,pcr产物通过tbe缓冲液中的1%琼脂糖凝胶电泳分离,且将对应不同的pcr产物(分别是gal1上游、gal1下游、ptef1-sc、hxt2和ttip1)的条带(569bp、603bp、557bp、1646bp和331bp)从凝胶上切下并纯化,其根据制造商的说明使用illustragfxpcrdna和凝胶条带纯化试剂盒(ge医疗生命科学(gehealthcarelifesciences))。用asci/noti-hf/paci/pmei消化质粒pfyd1090,并通过tbe缓冲液中的1%琼脂糖凝胶电泳分离限制酶消化条带。从凝胶上切下对应于质粒骨架的2349bpasci/noti片段和对应于潮霉素抗性盒的1781bppaci/pmei片段并纯化,其根据制造商的说明使用illustragfxpcrdna和凝胶条带纯化试剂盒(ge医疗生命科学)。使用in-hdecodrytm克隆试剂盒(克隆技术实验室有限公司(clontechlaboratories,inc.))将两种限制酶消化片段和pcr产物连接在一起,总体积为10μl,由以下组成:45ng2349bp的asci/notipfyd1090片段、68ng1781bppaci/pmei片段、21ngptef1-scpcr产物、63ng的hxt2pcr产物和13ng的ttip1pcr产物。将反应物在37℃孵育15分钟,在50℃孵育15分钟,并且然后放置在冰上。根据制造商的说明,将反应物用于转化stellartm感受态细胞(克隆技术实验室有限公司(clontechlaboratories,inc.))。将转化反应物涂布到2个lb+amp板上并在37℃孵育过夜。将推定的转化体菌落从选择板中分离,并且使用qiaprep96turbo试剂盒(凯杰公司(qiagen))从每种中制备质粒dna,并且针对用pvuii消化的片段的适当插入进行筛选。由dna测序确认产生所希望条带大小的质粒为正确的,并命名为质粒pfyd1092(图2;seqidno:20)。为了确保将hxt2表达盒正确整合到fyd853中,通过在pfyd1092(见上文)中将来自jg169的5'chrxi-1和3'chrxi-1侧翼区与来自fyd853的相应区交换来制备质粒pfyd1497(图3;seqidno:21)。分别使用引物组oy1481+oy2357和oy1483+oy1484扩增5'chrxi-1和3'chrxi-1侧翼区以及用于克隆的另外限制性位点和侧翼dna。使用热启动flexdna聚合酶(新英格兰生物实验室公司(newenglandbiolabs))根据制造商的说明书进行扩增反应。用于5'chrxi-1和3'chrxi-1的每个pcr由1μl的fyd853基因组dna制备物、1xhf缓冲液、200μm的每种dntp、500nm正向引物、500nm反向引物和1单位的热启动flexdna聚合酶组成。将反应在编程为如下的bio-radc1000touchtm热循环仪(伯乐实验室公司(bio-radlaboratories))中孵育:1个循环,在98℃持续30秒;30个循环,每个循环在98℃持续10秒、55℃持续30秒、并且在72℃持续2分钟;以及1个循环,在72℃持续10分钟。热循环后,pcr产物通过tbe缓冲液中的1%琼脂糖凝胶电泳分离,且将对应5'chrxi-1和3'chrxi-1侧翼区的条带(561bp和598bp)从凝胶上切下并纯化,其根据制造商的说明使用illustragfxpcrdna和凝胶条带纯化试剂盒(ge医疗生命科学(gehealthcarelifesciences))。用asci/asisi/noti-hf/pmei消化质粒pfyd1092,并通过tbe缓冲液中的1%琼脂糖凝胶电泳分离限制酶消化条带。从凝胶上切下对应于质粒骨架的2349bpasci/noti片段和对应于潮霉素抗性盒和hxt2表达盒的4227bpasisi/pmei片段并纯化,其根据制造商的说明使用illustragfxpcrdna和凝胶条带纯化试剂盒(ge医疗生命科学(gehealthcarelifesciences))。使用in-hdecodrytm克隆试剂盒(克隆技术实验室有限公司(clontechlaboratories,inc.))将两种限制酶消化片段和pcr产物连接在一起,总体积为10μl,由以下组成:57ng2349bp的asci/notipfyd1092片段、207ng的4227bpasisi/pmei片段、27ng的5'chrxi-1pcr产物和29ng的3'chrxi-1pcr产物。将反应物在37℃孵育15分钟,在50℃孵育15分钟,并且然后放置在冰上。根据制造商的说明,将反应物用于转化stellartm感受态细胞(克隆技术实验室有限公司(clontechlaboratories,inc.))。将转化反应物涂布到2个lb+amp板上并在37℃孵育过夜。将推定的转化体菌落从选择板中分离,并且使用qiaprep96turbo试剂盒(凯杰公司(qiagen))从每种中制备质粒dna,并且针对用hindiii-hf/pmli消化的片段的适当插入进行筛选。由dna测序确认携带所希望条带大小的质粒为正确的,并命名为质粒pfyd1497(图3;seqidno:21)。根据gietz&schiestl(2008)中描述的方案制备感受态fyd853细胞,只不过使用2xypd培养基而非2xypad培养基。用noti-hf和asci消化pfyd1497质粒,并使用约2μgdna来转化感受态fyd853细胞。转化后,将细胞以15,000×g团沉淀30秒。将细胞重悬于1ml2xypd培养基中,并在30℃在热混合器中振荡孵育4.5小时。将细胞涂布在ypd+200μg/ml潮霉素板上(每个板涂布200μl细胞)并在30℃孵育2天。将推定的转化体在新的ypd+200μg/ml潮霉素板上划线,并在30℃孵育3天。使用引物组oy2394+oy474(5'chrxi-1侧翼的验证)和oy1492+oy2395(3'chrxi-1侧翼的验证),通过pcr筛选hxt2表达盒正确整合的转化体。使用phireplantdirectpcrmastermix(赛默飞世尔科技公司)根据制造商的说明进行扩增反应,并且正确的转化体对于oy2394+oy4745'chrxi-1pcr应产生1094bp的条带且对于oy1492+oy23953'chrxi-1pcr应产生795bp的条带。保存具有所希望的扩增子大小的四个转化体用于将来的测试,并称为fyd1547#1-4。实例2:评估包含表达hxt2的异源多核苷酸的遗传工程化菌株的厌氧生长为了测试木糖利用和厌氧生长,将来自实例1的fyd853菌株和fyd1547转化体(#1-4)在新鲜的ypd琼脂板上划线,并在30℃孵育2天。制备独立的5mlypd培养物用于来自fyd853的4个菌落和来自每个fyd1547菌株候选的1个菌落,并在30℃振荡孵育过夜。第二天,通过离心(7,000xg,3分钟)收集来自1mlypd过夜培养物的细胞,并重悬于1mlsx2.5培养基中。记录每种细胞悬浮液在600nm处的光密度(od600nm),并将15mlsx2.5培养基接种至od600nm=0.1。从每种细胞悬浮液制备10倍系列稀释液,直至od600nm=0.0001(1,000倍稀释度),并将包括od600nm=0.1的原液在内的2μl的每种稀释液点样到sd2和sx2琼脂板上。一旦液体被吸收,将板与oxoidtmanaerogentm2.5l小袋和oxoidtmresazurin厌氧指示剂(赛默飞世尔科技公司(thermoscientific),oxoid微生物产品)一起置于密封的塑料容器中,并在30℃孵育。每天检查容器以确保条件保持厌氧。在第4天、第5天、第6天和第7天拍摄了板的照片。一旦已拍照,立即将板置于塑料容器中,并添加新的oxoidtmanaerogentm2.5l小袋和oxoidtmresazurin厌氧指示剂(赛默飞世尔科技公司(thermoscientific),oxoid微生物产品),并且继续在30℃孵育。如图4所示,与亲本fyd853菌株(缺乏hxt2表达盒)相比,hxt2转运体在fyd1547中的组成型表达极大地增加了fyd1547分离物的木糖利用和生长。到第5天,fyd1547分离物展现出显著的生长,而fyd853显示出非常少的生长。在第7天,三个fyd1547分离物在稀释系列的所有斑点上均形成了大的菌落,而fyd853菌株通常仅在来自两个第一稀释的斑点上显示出可见的生长。实例3:评估来自包含表达hxt2的异源多核苷酸的遗传工程化菌株的厌氧木糖利用为了测试hxt2转运体的组成型表达如何在厌氧条件下影响液体培养物中的木糖利用,将fyd853菌株和fyd1547分离物(#1-4)在新鲜的ypd琼脂板上划线,并在30℃孵育2天。制备独立的5mlypd培养物用于来自fyd853的4个菌落和来自每个fyd1547分离物的1个菌落,并在30℃振荡孵育过夜。第二天,通过离心(7,000xg,3分钟)收集来自1mlypd过夜培养物的细胞,并重悬于1mlsx2.5培养基中。记录每种细胞悬浮液在600nm处的光密度(od600nm),并将15mlsx2.5培养基接种至od600nm=0.1。对于每种分离物,准备含有3mlsx2.5细胞悬浮液的4个bdplastipaktm塑料同心luer-lock50ml注射器(赛默飞世尔科技(fisherscientific))。在每次接种之前,取出每个注射器的活塞并添加3mlsx2.5细胞悬浮液。然后小心地重新插入活塞并通过按压柱塞除去残余空气,直到在注射器尖端可见液体的弯液面。然后用bdtmcombitmluer-lock塞(赛默飞世尔科技)密封注射器。将接种的注射器在30℃以200rpm振荡孵育。在实验开始时(0小时)和40.6小时、52.9小时和67.6小时后取样进行hplc分析。在指定的时间点,将培养液通过具有pes膜(默克密理博公司(merckmillipore))的0.22μmmillex-gpmed注射器过滤单元过滤,并收集在1.5mleppendorf管中。对于hplc分析,将过滤的培养液以1:1的比例与5mmh2so4混合,并送至丹麦的诺维信公司处的分析开发(analyticaldevelopment)部进行hplc分析。来自hplc分析的结果示于下表3和图示于图5中。fyd1547中hxt2转运体的组成型表达极大地改善了木糖消耗和乙醇(etoh)的产生,因为fyd1547分离物到40.6小时消耗了超过50%的木糖,相比之下缺乏组成型表达的hxt2转运体的fyd853菌株消耗了约5%。在实验结束时,fyd1547分离物消耗了所有木糖,而在fyd853发酵中仍留有0.6g/l的木糖(中值)。表3.sx2.5培养基中的厌氧注射器发酵。*etoh产率计算为etoh每g消耗的木糖。**未检测到etoh。***未检测到木糖。实例4:评估来自包含表达hxt2的异源多核苷酸的遗传工程化菌株的厌氧木糖和葡萄糖利用为了测试hxt2转运体的组成型表达如何影响含有葡萄糖和木糖(以与经预处理的玉米秸秆(pcs)大致相同的比率)的液体培养基中的木糖利用和发酵性能,制备了含有50g/l葡萄糖和25g/l木糖的合成培养基(对应于约11%总固体nrelpcs)。将fyd853菌株和fyd1547分离物(#1-4)在新鲜的ypd琼脂板上划线,并在30℃孵育2天。制备独立的5mlypd培养物用于来自fyd853的4个菌落和来自每个fyd1547分离物的1个菌落,并在30℃振荡孵育过夜。第二天,通过离心(7,000xg,3分钟)收集来自1mlypd过夜培养物的细胞,并重悬于1mlsd5x2.5培养基中。记录每种细胞悬浮液在600nm处的光密度(od600nm),并将10mlsd5x2.5培养基接种至od600nm=0.1。对于每种分离物,制备含有2mlsd5x2.5细胞悬浮液的4个bdplastipaktm塑料同心luer-lock50ml注射器(赛默飞世尔科技公司(fisherscientific))。在每次接种之前,取出每个注射器的活塞并添加2mlsd5x2.5细胞悬浮液。然后小心地重新插入活塞并通过按压柱塞除去残余空气,直到在注射器尖端可见液体的弯液面。然后用bdtmcombitmluer-lock塞(赛默飞世尔科技)密封注射器。将接种的注射器在30℃以200rpm振荡孵育。在实验开始时(0小时)和19.9小时、28.8小时、41.6小时、52小时和66.3小时后取样进行hplc分析。在指定的时间点,将培养液通过具有pes膜(默克密理博公司(merckmillipore))的0.22μmmillex-gpmed注射器过滤单元过滤,并收集在1.5mleppendorf管中。为了获得对发酵动力学的充分覆盖,在28.8小时、41.6小时、52小时和66.3小时(在0小时和19.9小时对所有分离物进取样)对来自每个菌株的4个分离物中的仅2个进行取样。对于hplc分析,将过滤的培养液以1:1的比例与5mmh2so4混合,并送至丹麦的诺维信公司处的分析开发(analyticaldevelopment)部进行hplc分析。来自hplc分析的结果示于下表4和图示于图6中。组成型hxt2表达改善了sd5x2.5发酵中的木糖消耗,因为在实验结束时(66.3小时)在fyd1547发酵中仅留下4.37g/l木糖,相比之下fyd853发酵为8.17g/l。表4.sx2.5培养基中的厌氧注射器发酵。*etoh产率计算为etoh每g消耗的木糖。**未检测到etoh。***未检测到木糖。实例5:酵母菌株mcts1084-1087的构建本实例描述了酵母菌株mcts1084、mcts1085、mcts1086和mcts1087的构建,这些菌株表达木糖异构酶并含有在tef2启动子控制下的整合在二倍体菌株的两个xii-2基因座处的一个拷贝的hxt2基因。含有位于xii-2基因座5’侧翼的50bp、tef2启动子(seqidno:50)、hxt2基因、tip1终止子(seqidno:51)和xii-3基因座3’侧翼的50bp的合成dna作为线性dna串(string)订购自赛默飞世尔科技公司(thermofisher)并命名为17aapwnp(seqidno:29)。使用引物1222569和1222570通过pcr扩增该合成dna。根据制造商的说明,使用热启动dna聚合酶(赛默飞世尔科技公司(thermofisher))进行pcr扩增反应。每个pcr由5ng的17aapwnp(seqidno:29)合成线性dna作为模板,50pmol的引物1225569,50pmol对引物1225570,0.1mm的每种datp、dgtp、dctp、dttp,1xphusionhf缓冲液和2个单位的phusion热启动dna聚合酶组成,终体积为50μl。在t100tm热循环仪(伯乐实验室有限公司)中进行pcr,其被编程为:1个循环,在98℃持续3分钟;随后10个循环,每个循环在98℃持续10秒、50℃持续20秒、以及72℃持续2分钟;随后是25个循环,每个循环在98℃持续10秒、58℃持续20秒、以及72℃持续2分钟;以及最终延长,在72℃持续5分钟。热循环后,凝胶分离2.7kb的pcr反应产物,并使用nucleospin凝胶和pcr纯化试剂盒(马奇纳格尔公司(machery-nagel))进行纯化(cleanup)。用pcr扩增的17aapwnpdna转化酵母菌株酿酒酵母mbg4982。为了帮助含有hxt2的盒同源重组到xii-2基因座中,还在转化中使用含有cas9和对xii_2特异的指导rna的质粒(pmlba359)。使用酵母电穿孔方案将质粒和pcr扩增的17aapwnpdna转化到酿酒酵母菌株mbg4982中。在ypd+clonat上选择转化体以选择含有crispr/cas9质粒pmlba359的转化体。为了确保将hxt2表达盒正确整合到xii-2基因座mbg4982中,进行了跨基因座的pcr。为了从转化体产生基因组模板dna,将菌落重悬于10μl无菌水中,然后添加40μly-裂解缓冲液(zymo研究公司(zymoresearch))和2μl裂解酶(zymo研究公司)。将样品在37℃孵育30分钟,然后将1μl裂解的细胞用于以下pcr反应。根据制造商的说明,使用热启动dna聚合酶(赛默飞世尔科技公司(thermofisher))进行pcr扩增反应。每个pcr由1μl的经裂解酶处理的细胞作为dna模板,50pmol的引物xii-2外部正向,50pmol的引物xii-2外部反向,0.1mm的每种datp、dgtp、dctp、dttp,1xphusionhf缓冲液和2个单位的phusion热启动dna聚合酶组成,终体积为50μl。在t100tm热循环仪(伯乐实验室有限公司(bio-radlaboratories,inc.))中进行pcr,其被编程为:1个循环,在98℃持续3分钟;随后32个循环,每个循环在98℃持续10秒、54℃持续20秒、以及72℃持续2分钟;以及最终延长,在72℃持续5分钟。热循环后,在具有溴化乙锭的0.7%tbe琼脂糖凝胶上可视化来自每个pcr反应的5μl。使用引物1220142和1222570对具有3.8kb的正确大小pcr产物的菌落进行桑格测序。选择通过测序具有正确整合盒的四种分离物并命名为mcts1084、mcts1085、mcts1086和mcts1087。实例6:评估包含表达hxt2的异源多核苷酸的遗传工程化菌株的有氧生长为了评估有氧生长中的木糖利用,将来自实例1和5的菌株在新鲜的ypd琼脂板上划线,并在30℃孵育2天。为每个菌株制备3mlypd培养物,然后将150μl这种接种的ypd培养物添加至96孔透明平底聚苯乙烯微板(科宁公司(corning))的10-11个孔中。在以300rpm振荡下,将板在32℃生长3天。通过用来自前一板的4μl接种96孔透明平底聚苯乙烯未处理微板(科宁公司)中的150μl新鲜ypd来制备该板的复制。在以300rpm振荡下,将该新的复制板在32℃孵育1天。该板用于接种含有150μl培养基的96孔板,该培养基中有木糖(sx2)、葡萄糖(sd2)或木糖+葡萄糖(sx1/sd1)作为唯一的碳源。使用beckmancoulter机器人系统将培养基分配到每个板中。对于每种培养基,以相同方式制备三个重复板。在32℃以300rpm震荡将板孵育0h、21.5hr或27.5hr。在每个时间点,通过beckmancoulterdtx880多模式检测器读板器中od595nm评估孔的生长。在每个时间点,酵母菌株fyd853和fyd1547在板内的重复孔的平均值显示在图7-9中(分别对于sd2、sx1/sd1和sx2培养基)。在sx2培养基中,含有异源hxt2盒的菌株fyd1547在21.5小时和27.5小时比其亲本菌株fyd853具有增加18%和11%的生长。菌株mcts1084-1087和mbg4982的结果显示在图10-12中。与亲本菌株mbg4982相比,具有异源hxt2盒的四种分离物的平均改善范围在21.5小时为5%-11%,且在27.5小时为3.9%-5.5%。实例7:包含表达hxt2的异源多核苷酸的遗传工程化菌株的发酵为了评估厌氧发酵中的对于乙醇生产的木糖利用,将菌株在新鲜的ypd琼脂板上划线,并在30℃孵育2天。为每个菌株制备3mlypd培养物,然后将150μl这种接种的ypd培养物添加至96孔透明平底聚苯乙烯微板(科宁公司(corning))的10-11个孔中。在以300rpm振荡下,将板在32℃生长3天。通过用来自前一板的4μl接种96孔透明平底聚苯乙烯未处理微板(科宁公司)中的150μl新鲜ypd来制备该板的复制。在以300rpm振荡下,将该新的复制板在32℃孵育1天。该板用于接种含有500μl培养基的96深孔板,该培养基中有6%木糖(sx6)、6%右旋糖(sd6)或木糖+右旋糖(sx3/sd3)作为唯一的碳源。使用beckmancoulter机器人系统将培养基分配到每个板中。将板用co2释放夹心盖(酶筛选公司(enzyscreen))覆盖,夹紧,并在32℃无振荡地孵育50hr。通过添加100μl的8%h2so4终止发酵,然后以3000rpm离心10min。通过hplc分析上清液中的乙醇和木糖。图13显示来自菌株fyd853和fyd1547在sd6、sx6、sx3/sd3培养基中发酵的乙醇滴度。与缺乏异源hxt2盒的亲本菌株fyd853相比,含有异源hxt2盒的菌株fyd1547在6%木糖培养基(sx6培养基)中显示出增加35%的乙醇滴度。图14显示来自菌株mcts1084-1087和mbg4982在sd6、sx6、sx3/sd3培养基中发酵的乙醇滴度。与亲本菌株mbg4982相比,含有异源hxt2盒的菌株显示出3%-12%的乙醇滴度增加。表5显示了含有异源hxt2盒的菌株比不含异源hxt2盒的其亲本菌株在木糖消耗中的增加。菌株fyd1547的木糖消耗增加为18.4%,且菌株mcts1084-1087的范围为比亲本菌株高4.1%-12.7%(取决于分离物)。表5.厌氧发酵中的木糖消耗。实例8:构建表达xr/xdh木糖利用途径的酵母菌株本实例描述了酵母菌株p51-f11、p52-b02、p55-h01的构建,这些菌株缺乏木糖异构酶但在二倍体菌株乙醇红(乙醇红)中的两个x-3基因座处含有d-木糖还原酶/木糖醇脱氢酶(xr/xdh)木糖利用途径。将含有d-木糖还原酶(xr)、木糖醇脱氢酶(xdh)、木酮糖激酶(xk)、转醛酶(tal)和磷酸葡萄糖变位酶(来自酿酒酵母的pgm2)的木糖利用途径整合到二倍体菌株乙醇红的两个x-3基因座中。用于表达每个基因的启动子是:用于木糖醇脱氢酶的tdh3启动子,用于木酮糖激酶的adh1启动子,用于d-木糖还原酶的pgk1,用于转醛酶的rpl18b,和用于磷酸葡萄糖变位酶的tef2(seqidno:50)。将含有不同的xr、xdh、xk和/或tal基因的三种菌株命名为p51-f11、p52-b02和p55-h01。菌株p55-h01在二倍体菌株乙醇红中的两个x-3基因座处含有以下基因:酿酒酵母tal(编码seqidno:40)、spathasporagirioixdh(编码seqidno:43)、荧光假单胞菌(pseudomonasfluorescens)xk(编码seqidno:45)、和黑曲霉xr(编码seqidno:47)。菌株p51-f11在二倍体菌株乙醇红中的两个x-3基因座处含有以下基因:光滑假丝酵母(candidaglabrate)tal(编码seqidno:41)、spathasporagirioixdh(编码seqidno:43)、树干毕赤酵母xk(编码seqidno:46)、米曲霉xr(编码seqidno:48)。菌株p52-b02在二倍体菌株乙醇红中的两个x-3基因座处含有以下基因:saccharomycesdairenensistal(编码seqidno:42)、纤维假丝酵母(candidatenuis)xdh(编码seqidno:44)、树干毕赤酵母xk(编码seqidno:46)、黑曲霉xr(编码seqidno:47)。所有菌株还在二倍体菌株乙醇红中的两个x-3基因座处具有来自酿酒酵母的磷酸葡萄糖变位酶基因(编码seqidno:49)。使用编码每种启动子、基因和终止子的合成dna制备含有五基因途径(xr、xdh、xk、tal和pgm2)的菌株。含有启动子和终止子片段的合成dna作为质粒中克隆的dna从geneart订购,并如下表中指示的。16aczjxp(x-3位点5’侧翼的500bp和tdh3启动子),16act3qp(pdc6终止子和adh1启动子),16aczjwp(tef1终止子和pgk1启动子),以及16aczjvp(adh3终止子和rpl18b启动子)。含有pgm2基因的片段也作为克隆的dna订购并命名为16aczjyp。该质粒含有prm9终止子、tef2启动子、pgm2基因、eno2终止子和300bp3'x-3侧翼dna。用表6中所示的寡聚体通过pcr产生用于转化的线性片段。表6.用于扩增在表达xr/xdh木糖途径的酵母菌株中使用的片段的pcr寡聚体。geneart质粒5’pcr寡聚体3’pcr寡聚体16aczjxp1221575122147016act3qp1221475122174616aczjwp1221471122175416aczjvp1221756122147216aczjyp12214731221747除了通过pcr从合成dna质粒产生的上述五个线性dna片段之外,还有四个另外的dna用于转化中以将五基因途径整合到乙醇红中的两个x-3基因座处。对于每次转化,将一个tal、xdh、xk和xr片段与上述五个接头片段组合使用。片段在5'和3'末端与其邻接片段具有同源性。使用酵母电穿孔方案,使用含有针对x-3位点的grna和cas9的crisprcas9质粒pmcts442来帮助将9个dna片段同源重组到二倍体乙醇红中的两个x-3基因座中。在ypd+clonat上选择转化体以选择含有crispr/cas9质粒pmcts442的转化体。通过pcr针对途径的整合筛选转化体并通过测序确认。表7和8显示了途径基因和相应菌株的详情。表7.编码用于生成表达xr/xdh木糖途径的酵母菌株的基因的线性dna串。表8.xr/xdh途径酵母菌株。实例9:构建表达xr/xdh木糖利用途径且包含表达hxt2的异源多核苷酸的酵母菌株本实例描述了酵母菌株mcts1100、mcts1101、mcts1102、mcts1103、mcts1104、mcts1105、mcts1106、mcts1107、mcts1108的构建,这些菌株含有在tef2启动子控制下表达hxt2基因的异源多核苷酸,在xr/xdh木糖途径菌株p51-f11、p52-b02和p55-h01中的两个xii-2基因座处整合。用pcr扩增的17aapwnpdna(见上文)转化酵母菌株p51-f11、p52-b02和p55-h01mbg4982。为了帮助含有hxt2的盒同源重组到xii-2基因座中,还在转化中使用含有cas9和对xii-2特异的指导rna的质粒(pmlba359)。使用酵母电穿孔方案将质粒和pcr扩增的17aapwnpdna转化到酿酒酵母菌株p51-f11、p52-b02和p55-h01中。在ypd+clonat上选择转化体以选择含有crispr/cas9质粒pmlba359的转化体。为了确保将异源hxt2表达盒正确整合到xii-2基因座mbg4982中,进行了跨基因座的pcr。为了从转化体产生基因组模板dna,将菌落重悬于10μl无菌水中,然后添加40μly-裂解缓冲液(zymo研究公司(zymoresearch))和2μl裂解酶(zymo研究公司)。将样品在37℃孵育30分钟,然后将1μl裂解的细胞用于以下pcr反应。根据制造商的说明,使用热启动dna聚合酶(赛默飞世尔科技公司(thermofisher))进行pcr扩增反应。每个pcr由1μl的经裂解酶处理的细胞作为dna模板,50pmol的引物xii-2外部正向,50pmol的引物xii-2外部反向,0.1mm的每种datp、dgtp、dctp、dttp,1xphusionhf缓冲液和2个单位的phusion热启动dna聚合酶组成,终体积为50μl。在t100tm热循环仪(伯乐实验室有限公司(bio-radlaboratories,inc.))中进行pcr,其被编程为:1个循环,在98℃持续3分钟;随后32个循环,每个循环在98℃持续10秒、54℃持续20秒、以及72℃持续2分钟;以及最终延长,在72℃持续5分钟。热循环后,在具有溴化乙锭的0.7%tbe琼脂糖凝胶上可视化来自每个pcr反应的5μl。使用引物1220142和1222570对具有3.8kb的正确大小pcr产物的菌落进行桑格测序。对三种菌株背景的每种通过测序选择具有正确整合盒的三种分离物。来自具有hxt2盒的菌株p51-f11的三种分离物被命名为mcts1100、mcts1101、mcts1102。来自具有hxt2盒的菌株p52-b02的三种分离物被命名为mcts1103、mcts1104、mcts1105。来自具有hxt2盒的菌株背景p55-h01的三种分离物被命名为mcts1106、mcts1107、mcts1108。实例10:评估表达xr/xdh木糖利用途径且包含表达hxt2的异源多核苷酸的遗传工程化菌株的有氧生长为了评估有氧生长中的木糖利用,将来自实例9的菌株在新鲜的ypd琼脂板上划线,并在30℃孵育2天。为每个菌株制备3mlypd培养物,然后将150μl这种接种的ypd培养物添加至96孔透明平底聚苯乙烯微板(科宁公司)的10-11个孔中。在以300rpm振荡下,将板在32℃生长3天。通过用来自前一板的4μl接种96孔透明平底聚苯乙烯未处理微板(科宁公司)中的150μl新鲜ypd来制备该板的复制。在以300rpm振荡下,将该新的复制板在32℃孵育1天。该板用于接种含有150μl培养基的96孔板,该培养基中有2%木糖(sx2)、2%右旋糖(sd2)或1%木糖+1%葡萄糖(sx1/sd1)作为唯一的碳源。使用beckmancoulter机器人系统将培养基分配到每个板中。对于每种培养基,以相同方式制备五个重复板。在32℃以300rpm震荡将板孵育0h、21.5hr或27.5hr、45hr、或52hr。在每个时间点,通过beckmancoulterdtx880多模式检测器读板器中od595nm评估孔的生长。对于菌株背景p51-f11,在每个时间点和三种培养基中每种的板内的重复孔的平均值显示在图15-17中。与上文对于包含表达hxt2和木糖异构酶(xi)的异源多核苷酸的菌株的结果不同,在任何时间点,在sd2、sx1/sd1或sx2培养基中,包含表达hxt2的异源多核苷酸与xr/xdh木糖利用途径的菌株(mcts1100、mcts1101、mcts1102)的生长与亲本p51-f11相比没有改善。类似地,图18-20显示,当与xr/xdh木糖利用途径一起表达时(mcts1103、mcts1104、mcts1105),包含表达hxt2的异源多核苷酸的菌株的生长与亲本p52-b02相比没有益处。同样地,图21-23显示,当与xr/xdh木糖利用途径一起表达时(mcts1106、mcts1107、mcts1108),包含表达hxt2的异源多核苷酸的菌株的生长与亲本p55-h01相比没有益处。另外,如表5所示,当与xr/xdh木糖利用途径一起表达时,包含表达hxt2的异源多核苷酸的菌株在sx2培养基中的木糖消耗与缺乏该异源多核苷酸的亲本菌株相比没有增加。虽然出于清楚理解的目的,已经通过说明以及实例的方式相当详细描述了上文,本领域普通技术人员将清楚的是,可以实施任何等效方面或修饰。因此,该说明和实例不应当解释为限制本发明的范围。序列表<110>诺维信公司(novozymesa/s)mouillon,jean-mariejochumsen,nicholasarnau,josetassone,monica<120>用于使用工程化酵母菌株从含有木糖的纤维素基质生产乙醇的改善方法<130>14287-wo-pct<150>us62/430,690<151>2016-12-06<160>51<170>patentin版本3.5<210>1<211>1626<212>dna<213>酿酒酵母<400>1atgtctgaattcgctactagcggcgttgaaagtggctctcaacaaacttctatccactct60actccgatagtgcagaaattagagacggatgaatctcctattcaaaccaaatctgaatac120actaacgctgaactcccagcaaagccaatcgccgcatattggactgttatctgtttatgt180ctaatgattgcatttggtgggtttgtctttggttgggatactggtaccatctctggtttt240gttaatcaaaccgatttcaaaagaagatttggtcaaatgaaatctgatggtacctattat300ctttcggacgtccggactggtttgatcgttggtatcttcaatattggttgtgccattggt360gggttaaccttaggacgtctgggtgatatgtatggacgtagaattggtttgatgtgcgtc420gttctggtatacatcgttggtattgtgattcaaattgcttctagtgacaaatggtaccag480tatttcattggtagaattatctctggtatgggtgtcggtggtattgctgtcctatctcca540actttgatttccgaaacagcaccaaaacacattagaggtacctgtgtttctttctatcag600ttaatgatcactctaggtattttcttaggttactgtaccaactatggtactaaagactac660tccaattcagttcaatggagagtgcctttgggtttgaactttgccttcgctattttcatg720atcgctggtatgctaatggttccagaatctccaagattcttagtcgaaaaaggcagatac780gaagacgctaaacgttctttggcaaaatctaacaaagtcaccattgaagatccaagtatt840gttgctgaaatggatacaattatggccaacgttgaaactgaaagattagccggtaacgct900tcttggggtgagttattctccaacaaaggtgctattttacctcgtgtgattatgggtatt960atgattcaatccttacaacaattaactggtaacaattacttcttctattatggtactact1020attttcaacgccgtcggtatgaaagattctttccaaacttccatcgttttaggtatagtc1080aacttcgcatccactttcgtggccctatacactgttgataaatttggtcgtcgtaagtgt1140ctattgggcggttctgcttccatggccatttgttttgttatcttctctactgtcggtgtc1200acaagcttatatccaaatggtaaagatcaaccatcttccaaggctgccggtaacgtcatg1260attgtctttacctgtttattcattttcttcttcgctattagttgggccccaattgcctac1320gttattgttgccgaatcttatcctttgcgtgtcaaaaatcgtgctatggctattgctgtt1380ggtgccaactggatttggggtttcttgattggtttcttcactcccttcattacaagtgca1440attggattttcatacgggtatgtcttcatgggctgtttggtattttcattcttctacgtg1500tttttctttgtctgtgaaaccaagggcttaacattagaggaagttaatgaaatgtatgtt1560gaaggtgtcaaaccatggaaatctggtagctggatctcaaaagaaaaaagagtttccgag1620gaataa1626<210>2<211>541<212>prt<213>酿酒酵母<400>2metsergluphealathrserglyvalgluserglyserglnglnthr151015serilehisserthrproilevalglnlysleugluthraspgluser202530proileglnthrlysserglutyrthrasnalagluleuproalalys354045proilealaalatyrtrpthrvalilecysleucysleumetileala505560pheglyglyphevalpheglytrpaspthrglythrileserglyphe65707580valasnglnthraspphelysargargpheglyglnmetlysserasp859095glythrtyrtyrleuseraspvalargthrglyleuilevalglyile100105110pheasnileglycysalaileglyglyleuthrleuglyargleugly115120125aspmettyrglyargargileglyleumetcysvalvalleuvaltyr130135140ilevalglyilevalileglnilealaserserasplystrptyrgln145150155160tyrpheileglyargileileserglymetglyvalglyglyileala165170175valleuserprothrleuilesergluthralaprolyshisilearg180185190glythrcysvalserphetyrglnleumetilethrleuglyilephe195200205leuglytyrcysthrasntyrglythrlysasptyrserasnserval210215220glntrpargvalproleuglyleuasnphealaphealailephemet225230235240ilealaglymetleumetvalprogluserproargpheleuvalglu245250255lysglyargtyrgluaspalalysargserleualalysserasnlys260265270valthrilegluaspproserilevalalaglumetaspthrilemet275280285alaasnvalgluthrgluargleualaglyasnalasertrpglyglu290295300leupheserasnlysglyalaileleuproargvalilemetglyile305310315320metileglnserleuglnglnleuthrglyasnasntyrphephetyr325330335tyrglythrthrilepheasnalavalglymetlysaspserphegln340345350thrserilevalleuglyilevalasnphealaserthrphevalala355360365leutyrthrvalasplyspheglyargarglyscysleuleuglygly370375380seralasermetalailecysphevalilepheserthrvalglyval385390395400thrserleutyrproasnglylysaspglnproserserlysalaala405410415glyasnvalmetilevalphethrcysleupheilephephepheala420425430ilesertrpalaproilealatyrvalilevalalaglusertyrpro435440445leuargvallysasnargalametalailealavalglyalaasntrp450455460iletrpglypheleuileglyphephethrpropheilethrserala465470475480ileglyphesertyrglytyrvalphemetglycysleuvalpheser485490495phephetyrvalphephephevalcysgluthrlysglyleuthrleu500505510glugluvalasnglumettyrvalgluglyvallysprotrplysser515520525glysertrpileserlysglulysargvalsergluglu530535540<210>3<211>24<212>dna<213>人工序列<220><223>人工dna引物<400>3ggttgtttatgttcggatgtgatg24<210>4<211>51<212>dna<213>人工序列<220><223>人工dna引物<400>4acattatacgaagttatttaattaacatataatacatatcacataggaagc51<210>5<211>43<212>dna<213>人工序列<220><223>人工dna引物<400>5attcagacattttgtaattaaaacttagattagattgctatgc43<210>6<211>32<212>dna<213>人工序列<220><223>人工dna引物<400>6taattacaaaatgtctgaattcgctactagcg32<210>7<211>41<212>dna<213>人工序列<220><223>人工dna引物<400>7aggttcccttttattcctcggaaactcttttttcttttgag41<210>8<211>37<212>dna<213>人工序列<220><223>人工dna引物<400>8cgaggaataaaagggaaccttttacaacaaatatttg37<210>9<211>43<212>dna<213>人工序列<220><223>人工dna引物<400>9cgtcaaggccgcatgcggccgcggaatagtgacgttgtgatgc43<210>10<211>44<212>dna<213>人工序列<220><223>人工dna引物<400>10tgctatacgaagttatgtttaaacctaaactaacatcgcgatgc44<210>11<211>41<212>dna<213>人工序列<220><223>人工dna引物<400>11aatatgggcgcgatcgctaagtacagacggaaactcacacc41<210>12<211>42<212>dna<213>人工序列<220><223>人工dna引物<400>12cccatgaggcccagggcgcgccctacagatgttgctgcaacc42<210>13<211>32<212>dna<213>人工序列<220><223>人工dna引物<400>13ttagcgatcgcgcccatatttagctcgtttgg32<210>14<211>19<212>dna<213>人工序列<220><223>人工dna引物<400>14gctggctactcgttgctcg19<210>15<211>44<212>dna<213>人工序列<220><223>人工dna引物<400>15tgctatacgaagttatgtttaaacctaaactaacatcgcattgc44<210>16<211>22<212>dna<213>人工序列<220><223>人工dna引物<400>16tgatctgcagtagaatcagtgg22<210>17<211>19<212>dna<213>人工序列<220><223>人工dna引物<400>17acttgtgtggatgccaacg19<210>18<211>439<212>prt<213>家牛(bostaurus)<400>18metalalysglutyrpheprophethrglylysilepropheglugly151015lysaspserlysasnvalmetalaphehistyrtyrgluproglulys202530valvalmetglylyslysmetlysasptrpleulysphealametala354045trptrphisthrleuglyglyalaseralaaspglnpheglyglygln505560thrargsertyrglutrpasplysalaglucysprovalglnargala65707580lysasplysmetaspalaglyphegluilemetasplysleuglyile859095glutyrphecysphehisaspvalaspleuvalgluglualaprothr100105110ilealaglutyrglugluargmetlysalailethrasptyralagln115120125glulysmetlysglnpheproasnilelysleuleutrpglythrala130135140asnvalpheglyasnlysargtyralaasnglyalaserthrasnpro145150155160asppheaspvalvalalaargalailevalglnilelysasnserile165170175aspalathrilelysleuglyglythrasntyrvalphetrpglygly180185190arggluglytyrmetserleuleuasnthraspglnlysargglulys195200205gluhismetalathrmetleuglymetalaargasptyralaargala210215220lysglyphelysglythrpheleuilegluprolysprometglupro225230235240serlyshisglntyraspvalaspthrgluthrvalileglypheleu245250255lysalahisglyleuasplysaspphelysvalasnilegluvalasn260265270hisalathrleualaglyhisthrphegluhisgluleualacysala275280285valaspalaglymetleuglyserileaspalaasnargglyaspala290295300glnasnglytrpaspthraspglnpheproileaspasnphegluleu305310315320thrglnalametleugluileileargasnglyglyleuglyasngly325330335glythrasnpheaspalalysileargargasnserthraspleuglu340345350aspleupheilealahisileserglymetaspalametalaargala355360365leumetasnalaalaaspileleugluasnsergluleuproalamet370375380lyslysalaargtyralaserpheaspserglyileglylysaspphe385390395400gluaspglylysleuthrphegluglnvaltyrglutyrglylyslys405410415valglugluprolysglnthrserglylysglnglulystyrgluthr420425430ilevalalaleuhiscyslys435<210>19<211>4945<212>dna<213>大肠杆菌<400>19ctaaattgtaagcgttaatattttgttaaaattcgcgttaaatttttgttaaatcagctc60attttttaaccaataggccgaaatcggcaaaatcccttataaatcaaaagaatagaccga120gatagggttgagtggccgctacagggcgctcccattcgccattcaggctgcgcaactgtt180gggaagggcgtttcggtgcgggcctcttcgctattacgccagctggcgaaagggggatgt240gctgcaaggcgattaagttgggtaacgccagggttttcccagtcacgacgttgtaaaacg300acggccagtgagcgcgacgtaatacgactcactatagggcgaattggcggaaggccgtca360aggccgcatgcggccgcgtgcgtcctcgtcttcaccggtcgcgttcctgaaacgcagatg420tgcctcgcgccgcactgctccgaacaataaagattctacaatactagcttttatggttat480gaagaggaaaaattggcagtaacctggccccacaaaccttcaaattaacgaatcaaatta540acaaccataggatgataatgcgattagttttttagccttatttctggggtaattaatcag600cgaagcgatgatttttgatctattaacagatatataaatggaaaagctgcataaccactt660taactaatactttcaacattttcagtttgtattacttcttattcaaatgtcataaaagta720tcaacaaaaaattgttaatatacctctatactttaacgtcaaggagaaaaaactatagtt780taaacataacttcgtatagcatacattatacgaagttatattaactcgagtcgacggatc840cagcttgcctcgtccccgccgggtcacccggccagcgacatggaggcccagaataccctc900cttgacagtcttgacgtgcgcagctcaggggcatgatgtgactgtcgcccgtacatttag960cccatacatccccatgtataatcatttgcatccatacattttgatggccgcacggcgcga1020agcaaaaattacggctcctcgctgcagacctgcgagcagggaaacgctcccctcacagac1080gcgttgaattgtccccacgccgcgcccctgtagagaaatataaaaggttaggatttgcca1140ctgaggttcttctttcatatacttccttttaaaatcttgctaggatacagttctcacatc1200acatccgaacataaacaaccatggacaggtccggtaagccggagttaaccgcaacatccg1260tcgagaagtttttgattgagaagtttgattctgtttccgacttaatgcaactttcagagg1320gagaagagtcaagagccttctctttcgacgtaggtggaagaggttacgtactaagagtga1380acagttgtgcagacggcttttacaaagataggtatgtataccgtcactttgcatctgctg1440ccttgcctatcccggaggtattagatatcggggagttttctgaatcattgacctactgca1500tttcaaggagagcccagggcgttacattgcaagacttgccggagaccgaattacctgctg1560ttctgcaacctgtcgctgaggcaatggacgcaatagctgcagcagacttatctcaaacct1620ctgggtttggtcctttcggtcctcaaggtattggtcaatacactacatggcgtgatttca1680tatgtgccatcgcagacccacacgtttaccattggcagactgtcatggatgatacagttt1740ccgccagtgtagcacaagctttagacgagttaatgctatgggctgaagattgtcccgaag1800tgagacatttagtgcatgcagatttcggtagcaacaacgttcttacagataatggacgta1860tcaccgcagttattgattggtctgaggctatgtttggtgattcacaatatgaagtggcca1920atatcttcttttggaggccatggctggcttgcatggagcaacagacaaggtacttcgaaa1980gaagacaccctgaattggctggtagtccaaggttgagagcctatatgctgagaattggct2040tagatcagttataccaaagtttagtagatggtaactttgacgatgctgcctgggcacaag2100gtagatgcgatgcaatagttaggtctggtgctggcacggtaggtagaacgcaaattgcca2160gaagaagtgcagccgtttggacggacggatgtgtagaagttctagccgattctggaaata2220gacgtccctccacgcgtccaagagctaaagaataatcagtactgacaataaaaagattct2280tgttttcaagaacttgtcatttgtatagtttttttatattgtagttgttctattttaatc2340aaatgttagcgtgatttatattttttttcgcctcgacatcatctgcccagatgcgaagtt2400aagtgcgcagaaagtaatatcatgcgtcaatcgtatgtgaatgctggtcgctatactgct2460gtcgattcgatactaacgccgccatccagtgtcgagaattcctcgaggatatcgaactga2520ttcataacttcgtatagcatacattatacgaagttatttaattaagtatacttctttttt2580ttactttgttcagaacaacttctcatttttttctactcataactttagcatcacaaaata2640cgcaataataacgagtagtaacacttttatagttcatacatgcttcaactacttaataaa2700tgattgtatgataatgttttcaatgtaagagatttcgattatccacaaactttaaaacac2760agggacaaaattcttgatatgctttcaaccgctgcgttttggatacctattcttgacatg2820atatgactaccattttgttattgtacgtggggcagttgacgtcttatcatatgtcaaagt2880catttgcgaagttcttggcaagttgccaactgacgagatgcagtaaaaagagattgccgt2940cttgaaactttttgtccttttttttggcgcgccctgggcctcatgggccttccgctcact3000gcccgctttccagtcgggaaacctgtcgtgccagctgcattaacatggtcatagctgttt3060ccttgcgtattgggcgctctccgcttcctcgctcactgactcgctgcgctcggtcgttcg3120ggtaaagcctggggtgcctaatgagcaaaaggccagcaaaaggccaggaaccgtaaaaag3180gccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcga3240cgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttccccct3300ggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcc3360tttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcg3420gtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgc3480tgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgcca3540ctggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacagag3600ttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcgct3660ctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaacc3720accgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaagga3780tctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaactca3840cgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaaat3900taaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacagttac3960caatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccatagtt4020gcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccccagt4080gctgcaatgataccgcgagaaccacgctcaccggctccagatttatcagcaataaaccag4140ccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatccagtct4200attaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaacgtt4260gttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcattcagc4320tccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagcggtt4380agctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcactcatg4440gttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttctgtg4500actggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttgctct4560tgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgctcatc4620attggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatccagt4680tcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccagcgtt4740tctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgacacgg4800aaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcagggttat4860tgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggttccg4920cgcacatttccccgaaaagtgccac4945<210>20<211>7678<212>dna<213>大肠杆菌<400>20ttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccat60agttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccc120cagtgctgcaatgataccgcgagaaccacgctcaccggctccagatttatcagcaataaa180ccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatcca240gtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaa300cgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcatt360cagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagc420ggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcact480catggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttc540tgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttg600ctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgct660catcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatc720cagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccag780cgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgac840acggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcaggg900ttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggt960tccgcgcacatttccccgaaaagtgccacctaaattgtaagcgttaatattttgttaaaa1020ttcgcgttaaatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaa1080atcccttataaatcaaaagaatagaccgagatagggttgagtggccgctacagggcgctc1140ccattcgccattcaggctgcgcaactgttgggaagggcgtttcggtgcgggcctcttcgc1200tattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccag1260ggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgacgtaatacgactca1320ctatagggcgaattggcggaaggccgtcaaggccgcatgcggccgcggaatagtgacgtt1380gtgatgcggtgagttcggcggttaggggaatggtatatgataaaaaacggaaacgtgctt1440ctttaatttaattgtttaatattgttgcagatatataaaaagggggaaagaaccaaagat1500gtaattatttctttattgcctcaacctaaagcaagcaataaggtatagagatcaggacgt1560ctcgagagctgatatcaaatttgaagccacgcaagtaactacgtaggtcagagggcacaa1620ggaataacacgtgacatttttcttttttcttttttttttttttttttttttttgttagtc1680ttggcttctgtgccgtagtctgtatacggttttagatgcggtatgtttatcatcgcccag1740aaatttgcggggtgcaaagaaataaaatccgtgctgaaacccgtgctgaaatccgtgcac1800cgcatcaaattttctcggaggattctttgcgccggttttcattttcttccacggaatacc1860aagcccattgcatcgcgatgttagtttaggtttaaacataacttcgtatagcatacatta1920tacgaagttatattaactcgagtcgacggatccagcttgcctcgtccccgccgggtcacc1980cggccagcgacatggaggcccagaataccctccttgacagtcttgacgtgcgcagctcag2040gggcatgatgtgactgtcgcccgtacatttagcccatacatccccatgtataatcatttg2100catccatacattttgatggccgcacggcgcgaagcaaaaattacggctcctcgctgcaga2160cctgcgagcagggaaacgctcccctcacagacgcgttgaattgtccccacgccgcgcccc2220tgtagagaaatataaaaggttaggatttgccactgaggttcttctttcatatacttcctt2280ttaaaatcttgctaggatacagttctcacatcacatccgaacataaacaaccatggacag2340gtccggtaagccggagttaaccgcaacatccgtcgagaagtttttgattgagaagtttga2400ttctgtttccgacttaatgcaactttcagagggagaagagtcaagagccttctctttcga2460cgtaggtggaagaggttacgtactaagagtgaacagttgtgcagacggcttttacaaaga2520taggtatgtataccgtcactttgcatctgctgccttgcctatcccggaggtattagatat2580cggggagttttctgaatcattgacctactgcatttcaaggagagcccagggcgttacatt2640gcaagacttgccggagaccgaattacctgctgttctgcaacctgtcgctgaggcaatgga2700cgcaatagctgcagcagacttatctcaaacctctgggtttggtcctttcggtcctcaagg2760tattggtcaatacactacatggcgtgatttcatatgtgccatcgcagacccacacgttta2820ccattggcagactgtcatggatgatacagtttccgccagtgtagcacaagctttagacga2880gttaatgctatgggctgaagattgtcccgaagtgagacatttagtgcatgcagatttcgg2940tagcaacaacgttcttacagataatggacgtatcaccgcagttattgattggtctgaggc3000tatgtttggtgattcacaatatgaagtggccaatatcttcttttggaggccatggctggc3060ttgcatggagcaacagacaaggtacttcgaaagaagacaccctgaattggctggtagtcc3120aaggttgagagcctatatgctgagaattggcttagatcagttataccaaagtttagtaga3180tggtaactttgacgatgctgcctgggcacaaggtagatgcgatgcaatagttaggtctgg3240tgctggcacggtaggtagaacgcaaattgccagaagaagtgcagccgtttggacggacgg3300atgtgtagaagttctagccgattctggaaatagacgtccctccacgcgtccaagagctaa3360agaataatcagtactgacaataaaaagattcttgttttcaagaacttgtcatttgtatag3420tttttttatattgtagttgttctattttaatcaaatgttagcgtgatttatatttttttt3480cgcctcgacatcatctgcccagatgcgaagttaagtgcgcagaaagtaatatcatgcgtc3540aatcgtatgtgaatgctggtcgctatactgctgtcgattcgatactaacgccgccatcca3600gtgtcgagaattcctcgaggatatcgaactgattcataacttcgtatagcatacattata3660cgaagttatttaattaacatataatacatatcacataggaagcaacaggcgcgttggact3720tttaattttcgaggaccgcgaatccttacatcacacccaatcccccacaagtgatccccc3780acacaccatagcttcaaaatgtttctactccttttttactcttccagattttctcggact3840ccgcgcatcgccgtaccacttcaaaacacccaagcacagcatactaaatttcccctcttt3900cttcctctagggtggcgttaattacccgtactaaaggtttggaaaagaaaaaagagaccg3960cctcgtttctttttcttcgtcgaaaaaggcaataaaaatttttatcacgtttctttttct4020tgaaaaattttttttttgatttttttctctttcgatgacctcccattgatatttaagtta4080ataaatggtcttcaatttctcaagtttcagtttcgtttttcttgttctattacaactttt4140tttacttcttgctcattagaaagaaagcatagcaatctaatctaagttttaattacaaaa4200tgtctgaattcgctactagcggcgttgaaagtggctctcaacaaacttctatccactcta4260ctccgatagtgcagaaattagagacggatgaatctcctattcaaaccaaatctgaataca4320ctaacgctgaactcccagcaaagccaatcgccgcatattggactgttatctgtttatgtc4380taatgattgcatttggtgggtttgtctttggttgggatactggtaccatctctggttttg4440ttaatcaaaccgatttcaaaagaagatttggtcaaatgaaatctgatggtacctattatc4500tttcggacgtccggactggtttgatcgttggtatcttcaatattggttgtgccattggtg4560ggttaaccttaggacgtctgggtgatatgtatggacgtagaattggtttgatgtgcgtcg4620ttctggtatacatcgttggtattgtgattcaaattgcttctagtgacaaatggtaccagt4680atttcattggtagaattatctctggtatgggtgtcggtggtattgctgtcctatctccaa4740ctttgatttccgaaacagcaccaaaacacattagaggtacctgtgtttctttctatcagt4800taatgatcactctaggtattttcttaggttactgtaccaactatggtactaaagactact4860ccaattcagttcaatggagagtgcctttgggtttgaactttgccttcgctattttcatga4920tcgctggtatgctaatggttccagaatctccaagattcttagtcgaaaaaggcagatacg4980aagacgctaaacgttctttggcaaaatctaacaaagtcaccattgaagatccaagtattg5040ttgctgaaatggatacaattatggccaacgttgaaactgaaagattagccggtaacgctt5100cttggggtgagttattctccaacaaaggtgctattttacctcgtgtgattatgggtatta5160tgattcaatccttacaacaattaactggtaacaattacttcttctattatggtactacta5220ttttcaacgccgtcggtatgaaagattctttccaaacttccatcgttttaggtatagtca5280acttcgcatccactttcgtggccctatacactgttgataaatttggtcgtcgtaagtgtc5340tattgggcggttctgcttccatggccatttgttttgttatcttctctactgtcggtgtca5400caagcttatatccaaatggtaaagatcaaccatcttccaaggctgccggtaacgtcatga5460ttgtctttacctgtttattcattttcttcttcgctattagttgggccccaattgcctacg5520ttattgttgccgaatcttatcctttgcgtgtcaaaaatcgtgctatggctattgctgttg5580gtgccaactggatttggggtttcttgattggtttcttcactcccttcattacaagtgcaa5640ttggattttcatacgggtatgtcttcatgggctgtttggtattttcattcttctacgtgt5700ttttctttgtctgtgaaaccaagggcttaacattagaggaagttaatgaaatgtatgttg5760aaggtgtcaaaccatggaaatctggtagctggatctcaaaagaaaaaagagtttccgagg5820aataaaagggaaccttttacaacaaatatttgaaaaattacctccattattataccttct5880ctttatgtaattgttagttcgaaaattttttcttcattaatataatcaacttctaaaact5940ttctaaaaacgttctctttttcgagattagtgcttcttcccaatccgtaagaaatgtttc6000ctttcttgacaattggcaccagctggctactcgttgctcgaaaactactctcttttattt6060ttaatttacgaacgattatctttcgaaggaacgaccaaacgagctaaatatgggcgcgat6120cgctaagtacagacggaaactcacaccgccgcgaagactggtcagtggcaaaaaaaaaat6180aaaaatatagaaaataactattacgtatgttactgtttctggtagttgatatgaagttgg6240agttgtatattgtacgctttaggaacagggaagtgaatattatttactctgctgcacatt6300ctggctaggtcgaagccggaacttgagaagacgccgcgctagaactatggaccaagctgt6360tgacaatgttcagatggtgatgcactaccctgtgcggggagtggccacggacgcgagcgg6420aaggtgcggaaggtgcggaaggtgcgggagttgcgggaggttcttcgctaagcgtgaggg6480ttgctagctggggcggcggggtttccctaagtgtaaataaggcctcgccgctggcacatg6540agtgcgccggaggaggcggcggaggcgacgacgctaaaaccgtggccgttggggaaggat6600gggcggctatatctaccattgacctgatggggactcggttcttaaggaatgggtttgagg6660tgggtgtggttgcagcaacatctgtagggcgcgccctgggcctcatgggccttccgctca6720ctgcccgctttccagtcgggaaacctgtcgtgccagctgcattaacatggtcatagctgt6780ttccttgcgtattgggcgctctccgcttcctcgctcactgactcgctgcgctcggtcgtt6840cgggtaaagcctggggtgcctaatgagcaaaaggccagcaaaaggccaggaaccgtaaaa6900aggccgcgttgctggcgtttttccataggctccgcccccctgacgagcatcacaaaaatc6960gacgctcaagtcagaggtggcgaaacccgacaggactataaagataccaggcgtttcccc7020ctggaagctccctcgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccg7080cctttctcccttcgggaagcgtggcgctttctcatagctcacgctgtaggtatctcagtt7140cggtgtaggtcgttcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgacc7200gctgcgccttatccggtaactatcgtcttgagtccaacccggtaagacacgacttatcgc7260cactggcagcagccactggtaacaggattagcagagcgaggtatgtaggcggtgctacag7320agttcttgaagtggtggcctaactacggctacactagaagaacagtatttggtatctgcg7380ctctgctgaagccagttaccttcggaaaaagagttggtagctcttgatccggcaaacaaa7440ccaccgctggtagcggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaag7500gatctcaagaagatcctttgatcttttctacggggtctgacgctcagtggaacgaaaact7560cacgttaagggattttggtcatgagattatcaaaaaggatcttcacctagatccttttaa7620attaaaaatgaagttttaaatcaatctaaagtatatatgagtaaacttggtctgacag7678<210>21<211>7665<212>dna<213>大肠杆菌<400>21ttaccaatgcttaatcagtgaggcacctatctcagcgatctgtctatttcgttcatccat60agttgcctgactccccgtcgtgtagataactacgatacgggagggcttaccatctggccc120cagtgctgcaatgataccgcgagaaccacgctcaccggctccagatttatcagcaataaa180ccagccagccggaagggccgagcgcagaagtggtcctgcaactttatccgcctccatcca240gtctattaattgttgccgggaagctagagtaagtagttcgccagttaatagtttgcgcaa300cgttgttgccattgctacaggcatcgtggtgtcacgctcgtcgtttggtatggcttcatt360cagctccggttcccaacgatcaaggcgagttacatgatcccccatgttgtgcaaaaaagc420ggttagctccttcggtcctccgatcgttgtcagaagtaagttggccgcagtgttatcact480catggttatggcagcactgcataattctcttactgtcatgccatccgtaagatgcttttc540tgtgactggtgagtactcaaccaagtcattctgagaatagtgtatgcggcgaccgagttg600ctcttgcccggcgtcaatacgggataataccgcgccacatagcagaactttaaaagtgct660catcattggaaaacgttcttcggggcgaaaactctcaaggatcttaccgctgttgagatc720cagttcgatgtaacccactcgtgcacccaactgatcttcagcatcttttactttcaccag780cgtttctgggtgagcaaaaacaggaaggcaaaatgccgcaaaaaagggaataagggcgac840acggaaatgttgaatactcatactcttcctttttcaatattattgaagcatttatcaggg900ttattgtctcatgagcggatacatatttgaatgtatttagaaaaataaacaaataggggt960tccgcgcacatttccccgaaaagtgccacctaaattgtaagcgttaatattttgttaaaa1020ttcgcgttaaatttttgttaaatcagctcattttttaaccaataggccgaaatcggcaaa1080atcccttataaatcaaaagaatagaccgagatagggttgagtggccgctacagggcgctc1140ccattcgccattcaggctgcgcaactgttgggaagggcgtttcggtgcgggcctcttcgc1200tattacgccagctggcgaaagggggatgtgctgcaaggcgattaagttgggtaacgccag1260ggttttcccagtcacgacgttgtaaaacgacggccagtgagcgcgacgtaatacgactca1320ctatagggcgaattggcggaaggccgtcaaggccgcatgcggccgcggaatagtgacgtt1380gtgatgcggtgagttcggcggttaggggaatggtatatgataaaaaacggaaacgtgctt1440ctttaatttaattgtttaatattgttgcagatatataaaaagggggaaagaaccgaagat1500gtaattatttttttatcgcctcaacctaaagcaagcaataaggtataaagatcaggacgt1560ctcgagcgctgatatctaaatttgaagccacgcaagtaactacgtaggtcagaggggaca1620aggaataacacttgacatttttcttttttctttttttttcttttttttttttttgttaat1680cttggcttctgtaccgtagcctcctgtatacggttttagatgcagtatgtttatcatcgc1740cgagaaatttggggggtgcaaaggaataaaatccgtgctgaaatccgtgcaccgcatcaa1800actttctcggaggattctttgcaccggttttcattttcttccacggaataccaagcccat1860tgcaatgcgatgttagtttaggtttaaacataacttcgtatagcatacattatacgaagt1920tatattaactcgagtcgacggatccagcttgcctcgtccccgccgggtcacccggccagc1980gacatggaggcccagaataccctccttgacagtcttgacgtgcgcagctcaggggcatga2040tgtgactgtcgcccgtacatttagcccatacatccccatgtataatcatttgcatccata2100cattttgatggccgcacggcgcgaagcaaaaattacggctcctcgctgcagacctgcgag2160cagggaaacgctcccctcacagacgcgttgaattgtccccacgccgcgcccctgtagaga2220aatataaaaggttaggatttgccactgaggttcttctttcatatacttccttttaaaatc2280ttgctaggatacagttctcacatcacatccgaacataaacaaccatggacaggtccggta2340agccggagttaaccgcaacatccgtcgagaagtttttgattgagaagtttgattctgttt2400ccgacttaatgcaactttcagagggagaagagtcaagagccttctctttcgacgtaggtg2460gaagaggttacgtactaagagtgaacagttgtgcagacggcttttacaaagataggtatg2520tataccgtcactttgcatctgctgccttgcctatcccggaggtattagatatcggggagt2580tttctgaatcattgacctactgcatttcaaggagagcccagggcgttacattgcaagact2640tgccggagaccgaattacctgctgttctgcaacctgtcgctgaggcaatggacgcaatag2700ctgcagcagacttatctcaaacctctgggtttggtcctttcggtcctcaaggtattggtc2760aatacactacatggcgtgatttcatatgtgccatcgcagacccacacgtttaccattggc2820agactgtcatggatgatacagtttccgccagtgtagcacaagctttagacgagttaatgc2880tatgggctgaagattgtcccgaagtgagacatttagtgcatgcagatttcggtagcaaca2940acgttcttacagataatggacgtatcaccgcagttattgattggtctgaggctatgtttg3000gtgattcacaatatgaagtggccaatatcttcttttggaggccatggctggcttgcatgg3060agcaacagacaaggtacttcgaaagaagacaccctgaattggctggtagtccaaggttga3120gagcctatatgctgagaattggcttagatcagttataccaaagtttagtagatggtaact3180ttgacgatgctgcctgggcacaaggtagatgcgatgcaatagttaggtctggtgctggca3240cggtaggtagaacgcaaattgccagaagaagtgcagccgtttggacggacggatgtgtag3300aagttctagccgattctggaaatagacgtccctccacgcgtccaagagctaaagaataat3360cagtactgacaataaaaagattcttgttttcaagaacttgtcatttgtatagttttttta3420tattgtagttgttctattttaatcaaatgttagcgtgatttatattttttttcgcctcga3480catcatctgcccagatgcgaagttaagtgcgcagaaagtaatatcatgcgtcaatcgtat3540gtgaatgctggtcgctatactgctgtcgattcgatactaacgccgccatccagtgtcgag3600aattcctcgaggatatcgaactgattcataacttcgtatagcatacattatacgaagtta3660tttaattaacatataatacatatcacataggaagcaacaggcgcgttggacttttaattt3720tcgaggaccgcgaatccttacatcacacccaatcccccacaagtgatcccccacacacca3780tagcttcaaaatgtttctactccttttttactcttccagattttctcggactccgcgcat3840cgccgtaccacttcaaaacacccaagcacagcatactaaatttcccctctttcttcctct3900agggtggcgttaattacccgtactaaaggtttggaaaagaaaaaagagaccgcctcgttt3960ctttttcttcgtcgaaaaaggcaataaaaatttttatcacgtttctttttcttgaaaaat4020tttttttttgatttttttctctttcgatgacctcccattgatatttaagttaataaatgg4080tcttcaatttctcaagtttcagtttcgtttttcttgttctattacaactttttttacttc4140ttgctcattagaaagaaagcatagcaatctaatctaagttttaattacaaaatgtctgaa4200ttcgctactagcggcgttgaaagtggctctcaacaaacttctatccactctactccgata4260gtgcagaaattagagacggatgaatctcctattcaaaccaaatctgaatacactaacgct4320gaactcccagcaaagccaatcgccgcatattggactgttatctgtttatgtctaatgatt4380gcatttggtgggtttgtctttggttgggatactggtaccatctctggttttgttaatcaa4440accgatttcaaaagaagatttggtcaaatgaaatctgatggtacctattatctttcggac4500gtccggactggtttgatcgttggtatcttcaatattggttgtgccattggtgggttaacc4560ttaggacgtctgggtgatatgtatggacgtagaattggtttgatgtgcgtcgttctggta4620tacatcgttggtattgtgattcaaattgcttctagtgacaaatggtaccagtatttcatt4680ggtagaattatctctggtatgggtgtcggtggtattgctgtcctatctccaactttgatt4740tccgaaacagcaccaaaacacattagaggtacctgtgtttctttctatcagttaatgatc4800actctaggtattttcttaggttactgtaccaactatggtactaaagactactccaattca4860gttcaatggagagtgcctttgggtttgaactttgccttcgctattttcatgatcgctggt4920atgctaatggttccagaatctccaagattcttagtcgaaaaaggcagatacgaagacgct4980aaacgttctttggcaaaatctaacaaagtcaccattgaagatccaagtattgttgctgaa5040atggatacaattatggccaacgttgaaactgaaagattagccggtaacgcttcttggggt5100gagttattctccaacaaaggtgctattttacctcgtgtgattatgggtattatgattcaa5160tccttacaacaattaactggtaacaattacttcttctattatggtactactattttcaac5220gccgtcggtatgaaagattctttccaaacttccatcgttttaggtatagtcaacttcgca5280tccactttcgtggccctatacactgttgataaatttggtcgtcgtaagtgtctattgggc5340ggttctgcttccatggccatttgttttgttatcttctctactgtcggtgtcacaagctta5400tatccaaatggtaaagatcaaccatcttccaaggctgccggtaacgtcatgattgtcttt5460acctgtttattcattttcttcttcgctattagttgggccccaattgcctacgttattgtt5520gccgaatcttatcctttgcgtgtcaaaaatcgtgctatggctattgctgttggtgccaac5580tggatttggggtttcttgattggtttcttcactcccttcattacaagtgcaattggattt5640tcatacgggtatgtcttcatgggctgtttggtattttcattcttctacgtgtttttcttt5700gtctgtgaaaccaagggcttaacattagaggaagttaatgaaatgtatgttgaaggtgtc5760aaaccatggaaatctggtagctggatctcaaaagaaaaaagagtttccgaggaataaaag5820ggaaccttttacaacaaatatttgaaaaattacctccattattataccttctctttatgt5880aattgttagttcgaaaattttttcttcattaatataatcaacttctaaaactttctaaaa5940acgttctctttttcgagattagtgcttcttcccaatccgtaagaaatgtttcctttcttg6000acaattggcaccagctggctactcgttgctcgaaaactactctcttttatttttaattta6060cgaacgattatctttcgaaggaacgaccaaacgagctaaatatgggcgcgatcgctaagt6120acagacggaaactcacaccgccgcgaagactggtcagtggcaaaaaaaaaaaaattaaaa6180aaataaaaaataactattacgtatgatactgtttctggtagttgatatgaggttggtgtt6240gtatattgtacgttttaggaacagggaagtgaatattatttactctgctgcacattctgg6300ctaggtcgaagccggaacctgagaagacgccgcgctagaactatggaccaagctgttgac6360aatgtttagatggtgatgcactaccctgtgcggggagtggccacgaacgcgagcggaagg6420tgcgggtgttgcgggaattgcgggaggttcttcgctaagcgtgagggttgctagctgggg6480cggcggggtttccctaagtgtaaatagggcctcgccgctggcacatgagtgcgccggagg6540aggcggcggaggcgacgacgctaaaaccgtggccgttggggaaggatgggcggctatatc6600taccattgacctgatggggactcggctcttaaggaatgggttcgaggtgggtgtggttgc6660agcaacatctgtagggcgcgccctgggcctcatgggccttccgctcactgcccgctttcc6720agtcgggaaacctgtcgtgccagctgcattaacatggtcatagctgtttccttgcgtatt6780gggcgctctccgcttcctcgctcactgactcgctgcgctcggtcgttcgggtaaagcctg6840gggtgcctaatgagcaaaaggccagcaaaaggccaggaaccgtaaaaaggccgcgttgct6900ggcgtttttccataggctccgcccccctgacgagcatcacaaaaatcgacgctcaagtca6960gaggtggcgaaacccgacaggactataaagataccaggcgtttccccctggaagctccct7020cgtgcgctctcctgttccgaccctgccgcttaccggatacctgtccgcctttctcccttc7080gggaagcgtggcgctttctcatagctcacgctgtaggtatctcagttcggtgtaggtcgt7140tcgctccaagctgggctgtgtgcacgaaccccccgttcagcccgaccgctgcgccttatc7200cggtaactatcgtcttgagtccaacccggtaagacacgacttatcgccactggcagcagc7260cactggtaacaggattagcagagcgaggtatgtaggcggtgctacagagttcttgaagtg7320gtggcctaactacggctacactagaagaacagtatttggtatctgcgctctgctgaagcc7380agttaccttcggaaaaagagttggtagctcttgatccggcaaacaaaccaccgctggtag7440cggtggtttttttgtttgcaagcagcagattacgcgcagaaaaaaaggatctcaagaaga7500tcctttgatcttttctacggggtctgacgctcagtggaacgaaaactcacgttaagggat7560tttggtcatgagattatcaaaaaggatcttcacctagatccttttaaattaaaaatgaag7620ttttaaatcaatctaaagtatatatgagtaaacttggtctgacag7665<210>22<211>591<212>prt<213>酿酒酵母<400>22metleucysservalileglnargglnthrarggluvalserasnthr151015metserleuaspsertyrtyrleuglypheaspleuserthrglngln202530leulyscysleualaileasnglnaspleulysilevalhisserglu354045thrvalglupheglulysaspleuprohistyrhisthrlyslysgly505560valtyrilehisglyaspthrileglucysprovalalamettrpleu65707580glyalaleuaspleuvalleuserlystyrargglualalysphepro859095leuasnlysvalmetalavalserglysercysglnglnhisglyser100105110valtyrtrpserserglnalagluserleuleugluglnleuasnlys115120125lysproglulysaspleuleuhistyrvalserservalalapheala130135140argglnthralaproasntrpglnasphisserthralalysglncys145150155160glngluphegluglucysileglyglyproglulysmetalaglnleu165170175thrglyserargalahispheargphethrglyproglnileleulys180185190ilealaglnleugluproglualatyrglulysthrlysthrileser195200205leuvalserasnpheleuthrserileleuvalglyhisleuvalglu210215220leugluglualaaspalacysglymetasnleutyraspileargglu225230235240arglysphemettyrgluleuleuhisleuileaspserserserlys245250255asplysthrileargglnlysleumetargalaprometlysasnleu260265270ilealaglythrilecyslystyrpheileglulystyrglypheasn275280285thrasncyslysvalserprometthrglyaspasnleualathrile290295300cysserleuproleuarglysasnaspvalleuvalserleuglythr305310315320serthrthrvalleuleuvalthrasplystyrhisproserproasn325330335tyrhisleupheilehisprothrleuproasnhistyrmetglymet340345350ilecystyrcysasnglyserleualaarggluargileargaspglu355360365leuasnlysgluarggluasnasntyrglulysthrasnasptrpthr370375380leupheasnglnalavalleuaspaspserglusersergluasnglu385390395400leuglyvaltyrpheproleuglygluilevalproservallysala405410415ileasnlysargvalilepheasnprolysthrglymetilegluarg420425430gluvalalalysphelysasplysarghisaspalalysasnileval435440445gluserglnalaleusercysargvalargileserproleuleuser450455460aspserasnalaserserglnglnargleuasngluaspthrileval465470475480lyspheasptyraspgluserproleuargasptyrleuasnlysarg485490495progluargthrphephevalglyglyalaserlysasnaspalaile500505510vallyslysphealaglnvalileglyalathrlysglyasnphearg515520525leugluthrproasnsercysalaleuglyglycystyrlysalamet530535540trpserleuleutyraspserasnlysilealavalpropheasplys545550555560pheleuasnaspasnpheprotrphisvalmetgluserileserasp565570575valaspasngluasntrpilealaileileproargleuserpro580585590<210>23<211>18<212>dna<213>人工序列<220><223>人工dna引物<400>23gggccctccttactgctc18<210>24<211>20<212>dna<213>人工序列<220><223>人工dna引物<400>24tagacgcagtacaaggacgc20<210>25<211>27<212>dna<213>人工序列<220><223>人工dna引物<400>25tgcaattcaataaatgggatgtgattg27<210>26<211>33<212>dna<213>人工序列<220><223>人工dna引物<400>26gagcgaacgtaagagaggttaatgtcctctaac33<210>27<211>22<212>dna<213>人工序列<220><223>人工dna引物<400>27gatgatcgagccggtagttaac22<210>28<211>20<212>dna<213>人工序列<220><223>人工dna引物<400>28tagacgcagtacaaggacgc20<210>29<211>2649<212>dna<213>人工序列<220><223>人工dna序列<400>29gggccctccttactgctctccttccgtgtaacgcgttatgaaactctaatagctacctat60attccaccataatatcaatcatgcggttgctggtgtatttaccaataatgtttaatgtat120atatattaggggccgtatacttacatatagtagatgtcaagcgtaggcgcttcccctgcc180ggctgtgacggcgccataaccaaggtatctatagaccgccaatcagcaaactacctccgt240acattcatgttgcacccacacatgtacacacccagaccgcaacaaattacccataaggtt300gtttgtgacggcgtcgtacaagagaacgtgggaactttttaggctcaccaaaaaagaaag360gaaaaatacgagttgctgacagaagcctcaagaaaaaaaaaattcttcttcgactatgct420ggaggcagagatgatcgagccggtagttaactatatatagctaaattggttccatcacct480tcttttctggtgtcgctccttctagtgctatttctggcttttcctattttttttttttcc540atttttctttctctctttctaatatataaattctcttgcattttctatttttctctctat600ctattctacttgtttattcccttcaaggtttttttttaaggagtacttgtttttagaata660tacggtcaacgaactataattaaatgtctgaattcgctactagcggcgttgaaagtggct720ctcaacaaacttctatccactctactccgatagtgcagaaattagagacggatgaatctc780ctattcaaaccaaatctgaatacactaacgctgaactcccagcaaagccaatcgccgcat840attggactgttatctgtttatgtctaatgattgcatttggtgggtttgtctttggttggg900atactggtaccatctctggttttgttaatcaaaccgatttcaaaagaagatttggtcaaa960tgaaatctgatggtacctattatctttcggacgtccggactggtttgatcgttggtatct1020tcaatattggttgtgccattggtgggttaaccttaggacgtctgggtgatatgtatggac1080gtagaattggtttgatgtgcgtcgttctggtatacatcgttggtattgtgattcaaattg1140cttctagtgacaaatggtaccagtatttcattggtagaattatctctggtatgggtgtcg1200gtggtattgctgtcctatctccaactttgatttccgaaacagcaccaaaacacattagag1260gtacctgtgtttctttctatcagttaatgatcactctaggtattttcttaggttactgta1320ccaactatggtactaaagactactccaattcagttcaatggagagtgcctttgggtttga1380actttgccttcgctattttcatgatcgctggtatgctaatggttccagaatctccaagat1440tcttagtcgaaaaaggcagatacgaagacgctaaacgttctttggcaaaatctaacaaag1500tcaccattgaagatccaagtattgttgctgaaatggatacaattatggccaacgttgaaa1560ctgaaagattagccggtaacgcttcttggggtgagttattctccaacaaaggtgctattt1620tacctcgtgtgattatgggtattatgattcaatccttacaacaattaactggtaacaatt1680acttcttctattatggtactactattttcaacgccgtcggtatgaaagattctttccaaa1740cttccatcgttttaggtatagtcaacttcgcatccactttcgtggccctatacactgttg1800ataaatttggtcgtcgtaagtgtctattgggcggttctgcttccatggccatttgttttg1860ttatcttctctactgtcggtgtcacaagcttatatccaaatggtaaagatcaaccatctt1920ccaaggctgccggtaacgtcatgattgtctttacctgtttattcattttcttcttcgcta1980ttagttgggccccaattgcctacgttattgttgccgaatcttatcctttgcgtgtcaaaa2040atcgtgctatggctattgctgttggtgccaactggatttggggtttcttgattggtttct2100tcactcccttcattacaagtgcaattggattttcatacgggtatgtcttcatgggctgtt2160tggtattttcattcttctacgtgtttttctttgtctgtgaaaccaagggcttaacattag2220aggaagttaatgaaatgtatgttgaaggtgtcaaaccatggaaatctggtagctggatct2280caaaagaaaaaagagtttccgaggaataaaagggaaccttttacaacaaatatttgaaaa2340attacctccattattataccttctctttatgtaattgttagttcgaaaattttttcttca2400ttaatataatcaacttctaaaactttctaaaaacgttctctttttcgagattagtgcttc2460ttcccaatccgtaagaaatgtttcctttcttgacaattggcaccagctggctactcgttg2520ctcgaaaactactctcttttatttttaatttacgaacgattatctttcgaaggaacgacc2580aaacgagctaaatatgggcatcggcgactctctcgaaatttttcttaacgcgtccttgta2640ctgcgtcta2649<210>30<211>26<212>dna<213>人工序列<220><223>人工dna引物<400>30agcacaatccaaggaaaaatctggcc26<210>31<211>34<212>dna<213>人工序列<220><223>人工dna引物<400>31gccattagtagtgtactcaaacgaattattgttg34<210>32<211>40<212>dna<213>人工序列<220><223>人工dna引物<400>32tcagtactgacaataaaaagattcttgttttcaagaactt40<210>33<211>21<212>dna<213>人工序列<220><223>人工dna引物<400>33tagcgtgttacgcacccaaac21<210>34<211>22<212>dna<213>人工序列<220><223>人工dna引物<400>34acagaagacgggagacactagc22<210>35<211>38<212>dna<213>人工序列<220><223>人工dna引物<400>35tttgtttgtttatgtgtgtttattcgaaactaagttct38<210>36<211>35<212>dna<213>人工序列<220><223>人工dna引物<400>36agttgattgtatgcttggtatagcttgaaatattg35<210>37<211>49<212>dna<213>人工序列<220><223>人工dna引物<400>37tgttttatatttgttgtaaaaagtagataattacttccttgatgatctg49<210>38<211>48<212>dna<213>人工序列<220><223>人工dna引物<400>38tttgttttttgttttcttctaattgattttttctttctatttcctttg48<210>39<211>18<212>dna<213>人工序列<220><223>人工dna引物<400>39ggggtcgcaacttttccc18<210>40<211>335<212>prt<213>酿酒酵母<400>40metsergluproalaglnlyslysglnlysvalalaasnasnserleu151015gluglnleulysalaserglythrvalvalvalalaaspthrglyasp202530pheglyserilealalyspheglnproglnaspserthrthrasnpro354045serleuileleualaalaalalysglnprothrtyralalysleuile505560aspvalalavalglutyrglylyslyshisglylysthrthrgluglu65707580glnvalgluasnalavalaspargleuleuvalglupheglylysglu859095ileleulysilevalproglyargvalserthrgluvalaspalaarg100105110leuserpheaspthrglnalathrileglulysalaarghisileile115120125lysleuphegluglngluglyvalserlysgluargvalleuilelys130135140ilealaserthrtrpgluglyileglnalaalalysgluleugluglu145150155160lysaspglyilehiscysasnleuthrleuleupheserphevalgln165170175alavalalacysalaglualaglnvalthrleuileserpropheval180185190glyargileleuasptrptyrlysserserthrglylysasptyrlys195200205glyglualaaspproglyvalileservallyslysiletyrasntyr210215220tyrlyslystyrglytyrlysthrilevalmetglyalaserphearg225230235240serthraspgluilelysasnleualaglyvalasptyrleuthrile245250255serproalaleuleuasplysleumetasnserthrgluprophepro260265270argvalleuaspprovalseralalyslysglualaglyasplysile275280285sertyrileseraspgluserlyspheargpheaspleuasngluasp290295300alametalathrglulysleusergluglyilearglyspheserala305310315320aspilevalthrleupheaspleuileglulyslysvalthrala325330335<210>41<211>334<212>prt<213>光滑假丝酵母(candidaglabrata)<400>41metsergluprovalglnlyslysglnlysthrasnserserleuasp151015glnleulysalaserglythrvalvalvalalaaspthrglyaspphe202530gluserilealalyspheglnproglnaspserthrthrasnproser354045leuileleualaalaalalysglnproalatyralalysleuileasp505560valalavalglutyrglylyslyshisglylysthrvalgluglugln65707580thrglualaalavalaspargleuleuvalglupheglylysgluile859095leulysilevalproglyargvalserthrgluvalaspalaargleu100105110serpheasplysglualathrilealalysalaleuglnileilelys115120125leutyrglugluglnglyileserlysserargvalleuilelysile130135140alaserthrtrpgluglyileglnalaalaarggluleugluserlys145150155160hisglyilehiscysasnleuthrleuleupheasnphealaglnala165170175valalacysalaglualaasnilethrleuileserprophevalgly180185190argilemetasptyrtyrlysalalysthrglygluthrtyrthrgly195200205gluthraspproglyvallysservalargalailetyrasntyrtyr210215220lyslystyrglytyrlysthrilevalmetglyalaserpheargasn225230235240ileaspgluilelysalaleualaglyvalasptyrleuthrileser245250255proasnleuleuaspglnleuleuasnserasnaspprovalprolys260265270ileleuaspproalathralalysaspglualaglyglulysvalthr275280285phevalaspasngluseralapheargphealaleuasnaspaspala290295300metalathrasplysleuseraspglyilearglyspheseralaasp305310315320ileilethrleupheaspmetileglulyslysvallysala325330<210>42<211>335<212>prt<213>saccharomycesdairenensi<400>42metsergluprovalglnlyslysglnlysvalthrserserserleu151015gluglnleulysalaserglythrvalvalvalalaaspthrglyasp202530phealaserilealalysphethrproglnaspalathrthrasnpro354045serleuileleualaalaalalysglnseralatyralalysleuile505560aspvalalavalglutyrglylyslyshisglylysthrthrgluglu65707580lysthrgluilealavalaspargleuleuvalglupheglylysglu859095ileleualailevalproglyargvalserthrgluvalaspalaarg100105110leuserpheasplysglualathrilealalysalaleugluileile115120125lysleutyrlysaspileglyileserlysgluargvalleuilelys130135140ilealaserthrtrpgluglyileglnalaalaarggluleugluser145150155160lyshisglyilehiscysasnleuthrleuleupheserphesergln165170175alavalalacysalaglualaasnvalthrleuileserpropheval180185190glyargilemetasptrphislysalalysthrglygluthrtyrthr195200205glyargasnaspproglyvalleuservallyslysiletyrasntyr210215220tyrlyslystyrasptyrlysthrilevalmetglyalaserphearg225230235240asnvalaspgluilelysasnleualaglyvalasppheleuthrile245250255serproserleuleuaspgluleuleuasnserglngluprovalpro260265270argvalleuaspvalalaseralalyslysgluasnileprolysval275280285serpheileaspaspgluserthrpheargphegluleuasngluasp290295300alametalathrglulysleualagluglyilearglyspheserala305310315320aspilevalthrleupheaspleuileglulyslysvalalaala325330335<210>43<211>363<212>prt<213>spathasporagirioi<400>43metvalalaasnproserleuvalleulyslysileaspgluileval151015phegluthrproglualaprogluilesergluprothraspvalile202530valglnvallyslysthrglyilecysglyseraspilehisphetyr354045alahisglylysileglyasntyrileleuthrlysprometvalleu505560glyhisgluseralaglyvalvalthrglnileglyserglyvallys65707580asnleuargvalglyaspasnvalalailegluproglyvalproser859095argtyrserasnalatyrlysserglyargtyrasnleucysprophe100105110metargphealaalathrprothrserglulysaspgluproasnpro115120125proglythrleucyslystyrphelysserprogluasppheleuval130135140lysleuproasphisvalserleugluleuglyalametvalglupro145150155160leuservalglyvalhisalacyslysleuglyservallysphegly165170175aspthrvalalavalpheglyalaglyprovalglyileleuthrala180185190alathralalysthrpheglyalaserlysvalileileileaspval195200205pheaspasnlysleuglnmetalalysaspileglyvalvalthrhis210215220thrpheasnserlysseraspglyasptyrasnaspleuilelyshis225230235240pheglygluglnproservalvalleuglucysthrglyalaasppro245250255cysvalglymetglyvalasnilecysalaproglyglyargpheile260265270glnvalglyasnalaalaalaprovallyspheproilethrvalphe275280285alametlysgluleuthrleupheglyserpheargtyrglytyrgly290295300asptyrglnaspalavalasnilepheaspalaasntyrlysasngly305310315320lysgluasnalaproileaspphegluargleuilethrhisargphe325330335lyspheaspaspalailelysalatyraspleuvalargserglycys340345350glyservallyscysleuileaspglyproglu355360<210>44<211>362<212>prt<213>纤维假丝酵母(candidatenuis)<400>44metvalserasnproserleuvalleuasngluilelysasnleuglu151015pheglnthrhisglnalaproglualathrgluasppheaspvalleu202530valgluvallyslysthrglyilecysglyseraspvalhistyrtyr354045leuhisglygluileglyserphelysleuasnlysprometvalmet505560glyhisgluserserglyilevalserlysileglyprolysvalthr65707580serleulysvalglyaspargvalalailegluproglyleuproser859095argpheseraspglutyrlysserglyhistyrasnleucysprohis100105110metcysphealaalathrproalaprogluglythrproasnpropro115120125glythrleucyslystyrtyrlyscysprogluasppheleuvallys130135140leuprogluthrvalserleugluleuglyalaleuvalgluproleu145150155160thrvalglyvalhisalaserlysleualaasnvallyspheglyasp165170175valvalvalilepheglyalaglyprovalglyleuleualaalaser180185190valalathrvalpheglyalaseralavalcysvalvalaspilephe195200205aspasnlysleuglnmetalalysaspileglyalaalathrhisval210215220pheasnserlysthrgluglyglytyrthrglnleuvallyslysleu225230235240glylysserprothrvalvalleuglucysthrglyalagluvalcys245250255ileglnmetglyvalleualaleualathrglyglyargphevalgln260265270valglyasnalaglnglytyrvallyspheproilethrglupheala275280285thrlysgluleuglnleupheglyserpheargtyrglytyrasnasp290295300tyrlysthralavalalaleuleuglulysasntyrargasnglylys305310315320gluasnvalilevalasppheglulysleuilethrhisargtyrser325330335phelysaspalailelysalatyrglugluvalalaalaglyasngly340345350alavallyscysmetileaspglyproglu355360<210>45<211>498<212>prt<213>荧光假单胞菌(pseudomonasfluorescens)<400>45metthrglnproalaleupheleuglyleuaspcysglythrglngly151015thrlysalaleuileleuaspserargserglythrvalleuglyarg202530glyalaalaprohisserleuileserglyalaasnglycysargglu354045glnaspproalaglntrpleuglnalacysthrseralathrarggln505560alaleuglnalaalaglyvalaspglyargglnvalleuglyvalgly65707580valcysglyglnglnhisglyleuvalleuleuaspaspglnglygln859095valleuargproalalysleutrpcysaspthrglnserseralaglu100105110asnglnargleuleuasptrpleuglyglythrglnglyserleuglu115120125argleuglyleualailealaproglytyrthrvalserlysleuleu130135140trpthrarggluglnhisprogluleupheglnargilealahisile145150155160leuleuprohisasptyrleuasnphetrpleuthrglyargcyscys165170175serglutyrglyaspalaserglyserglytyrpheaspvalargarg180185190argasptrpaspargalaleuleualahisileaspproserglyarg195200205leugluargalaleuproproleuleuglualahisglnprovalgly210215220argileleualaprovalalaargglnleuglyileseralaaspala225230235240trpvalalaserglyglyglyaspasnmetleuglyalaileglythr245250255glyasnileglnproglyileilethrmetserleuglysersergly260265270thrvaltyralatyralagluargproleuileserprogluproser275280285valalathrphecysserserserglyglytrpleuproleuilecys290295300thrmetasnleuthrasnalathrthrleuvalarggluleuleugly305310315320leuaspleualaalapheasnglnargleugluglnalaproilegly325330335alagluglyleucysleuleuprophepheasnglygluargvalpro340345350alaleuproglnalaglnglyserleuhisglymetthrleuaspasn355360365leuthrproalaasnleucysargalavalvalgluglythrthrphe370375380glyleuargtyrglyleuaspleuleuargalaalaglyleuhisser385390395400glnserileargleuileglyglyglyalalysserleuleutrparg405410415glnmetvalalaasnilemethisalaprovalilecysproargglu420425430alaglualaalaalaleuglyalaalaileglnalaalatrpcyshis435440445glyargglnaspaspproaspleuaspleuglnglnleucysgluarg450455460cysvalargleuaspproglysergluthrglnproargalagluhis465470475480valalaalatyrgluprovaltyrglnargtyrargglnglnleuala485490495serleu<210>46<211>623<212>prt<213>树干毕赤酵母(scheffersomycesstipitis)<400>46metthrthrthrpropheaspalaproasplysleupheleuglyphe151015aspleuserthrglnglnleulysileilevalthraspgluasnleu202530alaalaleulysthrtyrasnvalglupheaspserileasnserser354045valglnlysglyvalilealaileasnaspgluileserlysglyala505560ileileserprovaltyrmettrpleuaspalaleuasphisvalphe65707580gluaspmetlyslysaspglyphepropheasnlysvalvalglyile859095serglysercysglnglnhisglyservaltyrtrpserargthrala100105110glulysvalleusergluleuaspalagluserserleusersergln115120125metargseralaphethrphelyshisalaproasntrpglnasphis130135140serthrglylysgluleuglugluphegluargvalileglyalaasp145150155160alaleualaaspileserglyserargalahistyrargphethrgly165170175leuglnilearglysleuserthrargphelysproglulystyrasn180185190argthralaargileserleuvalserserphevalalaservalleu195200205leuglyargilethrserilegluglualaaspalacysglymetasn210215220leutyraspileglulysargglupheasnglugluleuleualaile225230235240alaalaglyvalhisprogluleuaspglyvalgluglnaspglyglu245250255iletyrargalaglyileasngluleulysarglysleuglyproval260265270lysproilethrtyrglusergluglyaspilealasertyrpheval275280285thrargtyrglypheasnproaspcyslysiletyrserphethrgly290295300aspasnleualathrileileserleuproleualaproasnaspala305310315320leuileserleuglythrserthrthrvalleuileilethrlysasn325330335tyralaproserserglntyrhisleuphelyshisprothrmetpro340345350asphistyrmetglymetilecystyrcysasnglyserleualaarg355360365glulysvalargaspgluvalasnglulyspheasnvalgluasplys370375380lyssertrpasplyspheasngluileleuasplysserthraspphe385390395400asnasnlysleuglyiletyrpheproleuglygluilevalproasn405410415alaalaalaglnilelysargservalleuasnserlysasngluile420425430valaspvalgluleuglyasplysasntrpglnprogluaspaspval435440445serserilevalgluserglnthrleusercysargleuargthrgly450455460prometleuserlysserglyaspserseralaserserseralaser465470475480proglnprogluglyaspglythraspleuhislysvaltyrglnasp485490495leuvallyslyspheglyaspleutyrthraspglylyslysglnthr500505510phegluserleuthralaargproasnargcystyrtyrvalglygly515520525alaserasnasnglyserileilearglysmetglyserileleuala530535540provalasnglyasntyrlysvalaspileproasnalacysalaleu545550555560glyglyalatyrlysalasertrpsertyrglucysglualalyslys565570575glutrpileglytyraspglntyrileasnargleuphegluvalser580585590aspglumetasnserphegluvallysasplystrpleuglutyrala595600605asnglyvalglymetleualalysmetglusergluleulyshis610615620<210>47<211>319<212>prt<213>黑曲霉<400>47metalaserprothrvallysleuasnserglytyraspmetproleu151015valglypheglyleutrplysvalasnasnaspthrcysalaaspgln202530iletyrhisalailelysgluglytyrargleupheaspglyalacys354045asptyrglyasngluvalglualaglyglnglyilealaargalaile505560lysaspglyleuvallysargglugluleupheilevalserlysleu65707580trpasnserphehisaspglyaspargvalgluproilecysarglys859095glnleualaasptrpglyileasptyrpheaspleutyrilevalhis100105110pheproileserleulystyrvalaspproalavalargtyrpropro115120125glytrplysserglulysaspgluleuglupheglyasnalathrile130135140glngluthrtrpthralametgluserleuvalasplyslysleuala145150155160argserileglyileserasnpheseralaglnleuvalmetaspleu165170175leuargtyralaargileargproalathrleuglnilegluhishis180185190protyrleuthrglnthrargleuvalglutyralaglnlysglugly195200205leuthrvalthralatyrserserpheglyproleuserpheleuglu210215220leuservalglnasnalavalaspserproproleuphegluhisgln225230235240leuvallysserilealaglulyshisglyargthrproalaglnval245250255leuleuargtrpalathrglnargglyilealavalileprolysser260265270asnasnproglnargleulysglnasnleuaspvalthrglytrpasn275280285leuglugluglugluilelysalaileserglyleuaspargglyleu290295300argpheasnaspproleuglytyrglyleutyralaproilephe305310315<210>48<211>319<212>prt<213>米曲霉<400>48metalaproprothrvallysleuasnserglypheaspmetproleu151015valglypheglyleutrplysvalasnasngluthrcysalaaspgln202530valtyrglualailelysalaglytyrargleupheaspglyalacys354045asptyrglyasngluvalglucysglyglnglyvalalaargalaile505560lysgluglyilevallysarggluaspleupheilevalserlysleu65707580trpasnserphehisgluglyaspargvalgluprovalcysarglys859095glnleualaasptrpglyvalglutyrpheaspleutyrilevalhis100105110pheprovalalaleulystyrvalaspproalavalargtyrpropro115120125glytrpasnsergluserglylysileglupheserasnalaserile130135140glngluthrtrpthralametgluserleuvalasplyslysleuala145150155160argserileglyvalserasnpheseralaglnleuleumetaspleu165170175leuargtyralaargvalargproalathrleuglnilegluhishis180185190protyrleuthrglnproargleuvalglutyralaglnlysglugly195200205ilealavalthralatyrserserpheglyproleuserpheleuglu210215220leugluvallysasnalavalasnthrthrproleuphegluhisasn225230235240thrilelysserleualaglulystyrglylysthrproalaglnval245250255leuleuargtrpalathrglnargglyilealavalileprolysser260265270asnasnprothrargleualaleuasnleugluvalthrglytrpasp275280285leuglulysthrgluleuglualaileserserleuaspglnglyleu290295300argpheasnaspproleuglytyrglymettyrvalproilephe305310315<210>49<211>569<212>prt<213>酿酒酵母<400>49metserpheglnilegluthrvalprothrlysprotyrgluaspgln151015lysproglythrserglyleuarglyslysthrlysvalphelysasp202530gluproasntyrthrgluasnpheileglnserilemetglualaile354045progluglyserlysglyalathrleuvalvalglyglyaspglyarg505560tyrtyrasnaspvalileleuhislysilealaalaileglyalaala65707580asnglyilelyslysleuvalileglyglnhisglyleuleuserthr859095proalaalaserhisilemetargthrtyrgluglulyscysthrgly100105110glyileileleuthralaserhisasnproglyglyprogluasnasp115120125metglyilelystyrasnleuserasnglyglyproalaprogluser130135140valthrasnalailetrpgluileserlyslysleuthrsertyrlys145150155160ileilelysasppheprogluleuaspleuglythrileglylysasn165170175lyslystyrglyproleuleuvalaspileileaspilethrlysasp180185190tyrvalasnpheleulysgluilepheasppheaspleuilelyslys195200205pheileaspasnglnargserthrlysasntrplysleuleupheasp210215220sermetasnglyvalthrglyprotyrglylysalailephevalasp225230235240glupheglyleuproalaaspgluvalleuglnasntrphisproser245250255proasppheglyglymethisproaspproasnleuthrtyralaser260265270serleuvallysargvalaspargglulysileglupheglyalaala275280285seraspglyaspglyaspargasnmetiletyrglytyrglyproser290295300phevalserproglyaspservalalaileilealaglutyralaala305310315320gluileprotyrphealalysglnglyiletyrglyleualaargser325330335pheprothrserglyalaileaspargvalalalysalahisglyleu340345350asncystyrgluvalprothrglytrplysphephecysalaleuphe355360365aspalalyslysleuserilecysglyglugluserpheglythrgly370375380serasnhisvalargglulysaspglyvaltrpalailemetalatrp385390395400leuasnileleualailetyrasnlyshishisprogluasngluala405410415serilelysthrileglnasngluphetrpalalystyrglyargthr420425430phephethrargtyrasppheglulysvalgluthrglulysalaasn435440445lysilevalaspglnleuargalatyrvalthrlysserglyvalval450455460asnseralapheproalaaspgluserleulysvalthraspcysgly465470475480aspphesertyrthraspleuaspglyservalserasphisglngly485490495leutyrvallysleuserasnglyalaargphevalleuargleuser500505510glythrglyserserglyalathrileargleutyrileglulystyr515520525cysaspasplysserglntyrglnlysthralagluglutyrleulys530535540proileileasnservalilelyspheleuasnphelysglnvalleu545550555560glythrglugluprothrvalargthr565<210>50<211>633<212>dna<213>酿酒酵母<400>50agctacctatattccaccataatatcaatcatgcggttgctggtgtatttaccaataatg60tttaatgtatatatattaggggccgtatacttacatatagtagatgtcaagcgtaggcgc120ttcccctgccggctgtgacggcgccataaccaaggtatctatagaccgccaatcagcaaa180ctacctccgtacattcatgttgcacccacacatgtacacacccagaccgcaacaaattac240ccataaggttgtttgtgacggcgtcgtacaagagaacgtgggaactttttaggctcacca300aaaaagaaaggaaaaatacgagttgctgacagaagcctcaagaaaaaaaaaattcttctt360cgactatgctggaggcagagatgatcgagccggtagttaactatatatagctaaattggt420tccatcaccttcttttctggtgtcgctccttctagtgctatttctggcttttcctatttt480ttttttttccatttttctttctctctttctaatatataaattctcttgcattttctattt540ttctctctatctattctacttgtttattcccttcaaggtttttttttaaggagtacttgt600ttttagaatatacggtcaacgaactataattaa633<210>51<211>290<212>dna<213>酿酒酵母<400>51aagggaaccttttacaacaaatatttgaaaaattacctccattattataccttctcttta60tgtaattgttagttcgaaaattttttcttcattaatataatcaacttctaaaactttcta120aaaacgttctctttttcgagattagtgcttcttcccaatccgtaagaaatgtttcctttc180ttgacaattggcaccagctggctactcgttgctcgaaaactactctcttttatttttaat240ttacgaacgattatctttcgaaggaacgaccaaacgagctaaatatgggc290当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1