在高温下表达和分泌异源蛋白的酵母菌株的制作方法

文档序号:14957073发布日期:2018-07-17 23:46阅读:407来源:国知局
本申请要求2015年9月4日提交的美国临时专利申请序列号62/214,412和2016年2月25日提交的62/299,897的优先权,这两者在此整体引入。本申请与电子形式的序列表一同提交。所述序列表的内容在此整体并入。本公开涉及维持高温稳健性的重组酵母用于表达和分泌异源蛋白的用途。本公开还涉及所述重组酵母和/或其表达的异源蛋白用于水解底物(例如像木质纤维素生物质)的用途。
背景技术
:酿酒酵母(saccharomycescerevisiae)是燃料乙醇的商业生产中使用的主要生物催化剂。此生物体擅长将葡萄糖发酵成乙醇,常常至大于20%w/v的浓度。然而,天然酿酒酵母缺乏水解多糖的内在能力,且因此需要外源性添加酶(当使用玉米时,例如像α-淀粉酶和葡萄糖淀粉酶)以便将复合糖转化为葡萄糖。使用能够表达功能性葡萄糖淀粉酶的经遗传修饰的酿酒酵母(例如像wo2011153516中所述的那些)意在降低酶的总成本。然而,异源蛋白在酿酒酵母中的过度表达可引起若干应激反应,这可对生物体的总体发酵性能产生显著影响。与发酵过程已有的高应激(即,高乙醇、温度、渗透压、ph应激)结合,任何代谢干扰都可对宿主产生有害的生理限制(gassser等人,2008;mattanovich等人,2004)。酵母的一般发酵稳健性的任何下降都可引起有害的加工干扰,如发酵停滞、可造成污染的动力学降低、乙醇滴定度降低、或带来许多下游加工问题的高残余糖分。由于酵母是兼性厌氧菌,所以代谢状态也可影响蛋白质表达,如发酵期间异源蛋白的定时表达可以影响适当的功能并且影响转录/翻译应激。已在重组蛋白的分泌方面进行了许多改进,不管是靶向发酵过程的优化、宿主分泌途径的代谢工程改造、或异源蛋白的蛋白质工程改造,以符合天然酵母过程(idiris等人,2010;martinez等人,2012)。已显示在异源蛋白的n末端区域中的糖基化位点的定向工程改造通过阻止多肽的暴露的疏水性残基在er中的聚集来改善分泌(sagt等人,2000)。尽管在改善分泌方面的所有这些进展,但对特别是在燃料乙醇的高浓度发酵期间恢复或维持细胞应激耐受性仍然存在技术挑战。非常需要提供一种重组酵母菌株,其能够减轻重组蛋白生产和分泌对生长速率、特别是高温生长速率的影响。还非常需要提供制造和使用此类重组酵母菌株的方法。技术实现要素:本公开涉及一种异源核酸分子,其能够恢复或提高表达异源蛋白的重组酵母宿主细胞的高温稳健性。所述异源核酸分子可包括使用一个或多个厌氧调节性启动子来表达异源蛋白和/或对异源蛋白的氨基酸序列和/或糖基化模式进行修饰。在第一方面,本公开涉及一种包含异源核酸分子的重组酵母宿主细胞,所述异源核酸分子具有可操作地连接至编码第一异源蛋白的第一核酸分子的第一启动子。在所述重组酵母宿主细胞中,第一启动子可基于以下来选择:当与重组酵母宿主细胞置于需氧条件下获得的第一异源蛋白的表达水平相比时,当重组酵母宿主细胞处于至少部分厌氧条件下时所述第一启动子能够增加(例如能够增加)第一异源蛋白的表达。作为替代或补充,在重组酵母宿主细胞中,第一异源蛋白可包含至少一个氨基酸取代(当与相应的第一天然异源蛋白相比时),这恢复、维持或提高了重组酵母宿主细胞在高温下的稳健性。在一个实施方案中,异源核酸分子还包含第二启动子,当重组酵母宿主细胞处于至少部分厌氧条件下时所述第二启动子能够增加第一异源蛋白的表达,并且其中第二启动子可操作地连接至第一核酸分子。在这样的实施方案中,第一启动子和/或第二启动子可选自由以下组成的组:tdh1p、pau5p、hor7p、adh1p、tdh2p、tdh3p、gpd1p、cdc19p、eno2p、pdc1p、hxt3p及tpi1p。在又一个实施方案中,第一异源蛋白与相应的第一天然异源蛋白相比包含引入(推定的)糖基化位点的第一氨基酸取代。在一些实施方案中,第一氨基酸取代可位于第一异源蛋白的n末端区域中。在又一个实施方案中,第一氨基酸取代可在第一异源蛋白中引入天冬酰胺残基作为(推定的)糖基化位点。在再一个实施方案中,第一异源蛋白是裂解酶,例如像糖解酶(例如,葡萄糖淀粉酶或α-淀粉酶)。在其中第一异源蛋白是葡萄糖淀粉酶的实施方案中,相应的第一天然蛋白可具有seqidno:1的氨基酸序列。在这样的实施方案中,第一异源蛋白可具有seqidno:2、seqidno:3或seqidno:4的氨基酸序列。在又一个实施方案中,第一异源蛋白不具有m6423的氨基酸序列。在其中第一异源蛋白是α-淀粉酶的实施方案中,相应的第一天然蛋白可具有seqidno:6的氨基酸序列。在这样的实施方案中,第一异源蛋白可具有seqidno:7的氨基酸序列。在再一个实施方案中,重组酵母宿主细胞(其可为酿酒酵母)包含至少两个厌氧调节性启动子(pau5p和tdh1p)并且编码具有seqidno:4的氨基酸序列的异源蛋白。在一些实施方案中,重组酵母宿主细胞可来自于酵母属(例如来自酿酒酵母种)。在其它实施方案中,重组酵母宿主细胞可来自于克鲁维酵母属(kluyveromyces)、arxula属、德巴利酵母属(debaryomyces)、假丝酵母属(candida)、毕赤酵母属(pichia)、法夫酵母属(phaffia)、裂殖酵母属(schizosaccharomyces)、汉逊酵母属(hansenula)、克勒克酵母属(kloeckera)、许旺氏酵母属(schwanniomyces)或耶氏酵母属(yarrowia)。根据第二方面,本公开提供一种分离的葡萄糖淀粉酶,其具有seqidno:2、seqidno:3或seqid:4的氨基酸序列或其功能片段。在一个实施方案中,分离的葡萄糖淀粉酶不具有m6423的氨基酸序列。根据第三方面,本公开提供一种分离的α-淀粉酶,其具有seqidno:7的氨基酸序列或其功能片段。根据第四方面,本公开提供一种重组核酸分子,其包含如本文所定义的第一启动子和如本文所定义的第一核酸分子。根据第五方面,本公开提供一种用于水解木质纤维素生物质的方法。概括地说,所述方法包括在允许底物被由重组酵母宿主细胞表达的第一异源蛋白、分离的葡萄糖淀粉酶和/或分离的α-淀粉酶裂解的条件下,将木质纤维素生物质与(i)本文所定义的重组酵母宿主细胞或(ii)本文所定义的分离的葡萄糖淀粉酶和/或本文所定义的分离的α-淀粉酶合并。在一个实施方案中,所述方法还包括:当将木质纤维素生物质与重组酵母宿主细胞合并时,(b)在允许由重组酵母宿主细胞生成发酵产物的条件下培养重组酵母宿主细胞。或者,在另一个实施方案中,所述方法还可包括:当木质纤维在重组酵母细胞不存在下合并时将底物与酵母细胞(例如,非遗传修饰的酵母细胞)合并及(b)在允许由酵母细胞生成发酵产物的条件下培养酵母细胞。在一个实施方案中,发酵产物是乙醇。在再一个实施方案中,木质纤维素生物质包括淀粉(其可例如以胶化形式或未加工形式(rawform)提供)。当淀粉以胶化形式提供时,第一异源蛋白和/或分离的葡萄糖淀粉酶可具有seqidno:3的氨基酸序列。当淀粉以未加工形式提供时,第一异源蛋白和/或葡萄糖淀粉酶可具有seqidno:4的氨基酸序列。在一个实施方案中,第一异源蛋白和/或α-淀粉酶具有seqidno:7的氨基酸序列。根据第六方面,本公开提供一种用于提高第一重组酵母宿主细胞的温度稳健性的方法。概括地说,所述方法包括(a)提供第一重组酵母宿主细胞和(b)将至少一种修饰引入所述第一异源核酸分子中以获得包含第二异源核酸分子的第二重组宿主细胞。步骤(a)的第一重组酵母宿主细胞包含具有编码第一异源蛋白的第一核酸分子的第一异源核酸分子;当与缺乏第一异源核酸分子的相应第一酵母宿主细胞相比时展现在高温下减少的生长;及与相应的第一酵母宿主细胞相比分泌较高量的第一异源蛋白。在所述方法中,步骤(b)包括修饰编码第一异源蛋白的第一核酸分子以获得编码第二异源蛋白的第二核酸分子,其中第二异源蛋白的氨基酸序列当与第一异源蛋白的氨基酸序列相比时具有至少一个氨基酸取代且所述至少一个氨基酸取代在第二修饰的异源蛋白中引入(推定的)糖基化位点;和/或将编码第一异源蛋白的第一核酸分子或编码第二异源蛋白的第二核酸分子与第一启动子可操作地连接,所述第一启动子当第一重组酵母宿主细胞被置于至少部分厌氧条件下时能够增加第一异源蛋白或第二异源蛋白的表达。在一个实施方案中,所述至少一个氨基酸取代位于第一或第二异源蛋白的n末端区域中。在另一个实施方案中,第一异源蛋白的至少一个氨基酸残基被第二异源蛋白中的天冬酰胺残基替换。在再一个实施方案中,所述方法还包括通过以下操作修饰第二重组酵母宿主细胞:i)通过将至少一个核酸修饰引入多个突变重组酵母宿主细胞的每个的第二异源核酸分子中以生成编码相应的多个突变异源蛋白的多个突变异源核酸分子来生成第一代突变重组酵母宿主细胞;ii)从所述第一代中选择至少两个突变重组酵母宿主细胞,其中所述两个突变重组酵母宿主细胞中的每个表达突变的异源蛋白,所述突变的异源蛋白各自具有至少一个不同于所述第二异源蛋白的氨基酸修饰且具有所述第二异源蛋白的生物活性;iii)生成包含编码第三异源蛋白的第三异源核酸分子的第三重组酵母宿主细胞,其中所述第三异源蛋白具有至少两个由所述至少两个选出的突变重组酵母宿主细胞的突变异源核酸分子编码的氨基酸修饰;及iv)用所述第三重组酵母宿主细胞重复步骤i)和ii)以生成第二代突变重组酵母宿主细胞,v)从所述第二代中选择至少两个另外的突变重组酵母宿主细胞;以及vi)生成包含编码第四异源蛋白的第四异源核酸分子的第四重组酵母宿主细胞,其中所述第四异源核酸分子包含由所述至少两个另外选出的突变重组酵母宿主细胞的另外突变异源核酸分子编码的氨基酸修饰。附图说明现在将参照附图,对本发明的性质进行一般性说明,将以示例方式示出其优选实施方案,且其中:图1示出了被基因工程改造以在厌氧条件下在组成型启动子(tef2p或○)或厌氧调节性启动子(tdh1p或●)控制下表达扣囊复膜酵母(s.fibuligera)葡萄糖淀粉酶的酿酒酵母菌株的生长曲线。结果显示为随培育时间(小时)变化的在600nm下的光密度(od(600nm))。培育是在38℃下在ypd培养基中进行。使用tdh1启动子的酿酒酵母菌株当与使用tef2启动子的酿酒酵母菌株相比时展现改进的生长。图2示出了被基因工程改造以在组成型启动子(tef2p)或厌氧调节性启动子(tdh1p)控制下表达扣囊复膜酵母葡萄糖淀粉酶的酿酒酵母的两个菌株的降解分泌淀粉的活性。结果显示为随菌株和发酵条件(斜线阴影柱=需氧生长,黑色柱=厌氧生长)变化的淀粉酶活性(测量为540nm下的吸光度(abs540nm))。在厌氧条件下,使用tdh1启动子的酿酒酵母菌株比使用tef2启动子的菌株产生更多的葡萄糖淀粉酶。图3示出了被基因工程改造以在组成型启动子(tef2p)、厌氧调节性启动子(tdh1p或pau5p)或葡萄糖调节性启动子(hxt7p)控制下表达扣囊复膜酵母葡萄糖淀粉酶的酿酒酵母菌株的降解分泌淀粉的活性。为了比较,纳入野生型(非转基因)酿酒酵母(m2390)的降解分泌淀粉的活性。结果显示为随菌株和发酵条件(斜线阴影柱=需氧生长,黑色柱=厌氧生长)变化的淀粉酶活性(测量为540nm下的吸光度(abs540nm))。图4a和图4b比较了在启动子的不同组合的控制下在厌氧条件下表达野生型(seqidno:1)或突变的(seqidno:3)扣囊复膜酵母葡萄糖淀粉酶基因的不同转基因酿酒酵母的葡萄糖淀粉酶蛋白质产生(a)和生长曲线(b)。(图4a)结果提供为需氧或厌氧生长的基因工程改造的菌株的降解分泌的凝胶淀粉的活性(由540nm下的吸光度(abs540nm)所测量)。(图4b)结果显示为随所用酿酒酵母菌株(m10156=空心圆;m9897=灰色圆;m8841=黑色圆)变化的光密度(在600nm(od)下测量)。在每个突变体以及此图中所示的菌株所用的启动子中鉴别的氨基酸突变(当使用野生型扣囊复膜酵母葡萄糖淀粉酶基因(seqidno:1)的编号和氨基酸序列时)如下:表a.图4a-图4b中示出的菌株的氨基酸突变和启动子。图5a至图5e示出了实施例中所示的一些菌株的各种基因图谱。(图5a)描绘了含有用于单个易错pcr产物的整合的单个fcy1位点的酿酒酵母菌株m4251的fcy1基因座的基因图谱。(图5b)描绘了由tef2p/adh3t调节的两个拷贝glu011-co盒的图谱。(图5c)描绘了由tdh1p/idp1t调节的两个拷贝glu011-co盒的图谱。(图5d)描绘了由tef2p/adh3t和hxt7p/pma1t序列调节的glu0111-co盒,在m8841菌株中所见的fcy1基因座处整合的图谱。(图5e)描绘了由pau5p/dit1t和tdh1p/idp1t序列调节的工程改造的mp743盒,在m10156菌株中所见的fcy1基因座处整合的图谱。图6示出了用碘蒸气染色的ypd-5fc淀粉选择平板以指示功能性突变体(+)和无效突变体(-)周围的透明带的代表性图。图7提供了描绘实施例ii中所示的重复组合突变过程的流程图。在此图中所示的每个突变体中鉴别的氨基酸突变(当使用野生型扣囊复膜酵母葡萄糖淀粉酶基因(seqidno:1)的编号和氨基酸序列时)如下:表b.图7中示出的突变葡萄糖淀粉酶的氨基酸突变。图8比较了经基因工程改造以表达葡萄糖淀粉酶基因的酿酒酵母的不同菌株(m3744□;m6423δ;m8867○)的生长曲线(如在38℃下于ypd培养基中所测量)与野生型酿酒酵母(m2390◇)的生长曲线。生长速率在38℃下在ypd上测定。结果显示为随培育时间(小时)变化的600nm下的光密度(od(600nm))。在此图中所示的每个突变体中鉴别的氨基酸突变(当使用野生型扣囊复膜酵母葡萄糖淀粉酶基因(seqidno:1)的编号和氨基酸序列时)如下:表c.图8中示出的突变葡萄糖淀粉酶的氨基酸突变。菌株氨基酸取代m2390未确定-野生型酿酒酵母m3744无(seqidno:1)m6423l8s;f101l;k277em8867l8s;f12i;g36n;f101l;k277e;f487i图9a和图9b比较了表达扣囊复膜酵母葡萄糖淀粉酶基因(mp9)或突变的扣囊复膜酵母葡萄糖淀粉酶基因的野生型或转基因酿酒酵母的降解分泌淀粉的活性。结果显示为随用胶化淀粉(图9a)或生淀粉(图9b)培养的酵母菌株变化的淀粉酶活性(测量为540nm下的吸光度(dnsa540))。野生型或突变葡萄糖淀粉酶基因的两个拷贝被纳入每个菌株中。在此图中所示的每个突变体中鉴别的氨基酸突变(当使用野生型扣囊复膜酵母葡萄糖淀粉酶基因(seqidno:1)的编号和氨基酸序列时)如下:表d.图9a-图9b中示出的突变葡萄糖淀粉酶的氨基酸突变。图10a至图10c示出了表达野生型扣囊复膜酵母葡萄糖淀粉酶基因(mp9)或突变的扣囊复膜酵母葡萄糖淀粉酶基因的野生型或转基因酿酒酵母菌株的降解分泌淀粉的活性的结果。结果显示为鉴于在胶化淀粉(图10a和图10b)或生淀粉(图10c)中生长的不同菌株的淀粉酶活性(如由540nm下的光密度所测量)。野生型或突变葡萄糖淀粉酶基因的两个拷贝被纳入每个菌株中。在此图中所示的每个突变体中鉴别的氨基酸突变(当使用野生型扣囊复膜酵母葡萄糖淀粉酶基因(seqidno:1)的编号和氨基酸序列时)如下:表e.图10a-图10c和11a-图11b中示出的突变葡萄糖淀粉酶的氨基酸突变。菌株氨基酸取代m2390(wt)未确定–野生型酿酒酵母mp3744(mp9)无m6423l8s;f101l;k277emp8498(mp743)a40nm8861(mp732)l8s;g36n;f101l;k277e图11a和图11b比较了经基因工程改造以表达扣囊复膜酵母葡萄糖淀粉酶基因的酿酒酵母的不同菌株的生长曲线(在38℃下在ypd培养基中)与野生型酿酒酵母的生长曲线。结果显示为随培育时间(小时)变化的600nm下的光密度(od(600nm))。所用的不同菌株描述于表e中。(图11a)示出关于基因工程改造的mp3744(δ)和mp8498(◇)以及野生型(x)菌株的结果。(图11b)示出关于基因工程改造的mp3744(□)、mp6423(δ)和mp8861(+)以及野生型(◇)菌株的结果。在此图中所示的每个突变体中鉴别的氨基酸突变(当使用野生型扣囊复膜酵母葡萄糖淀粉酶基因(seqidno:1)的编号和氨基酸序列时)描述于表e中。图12比较了野生型酿酒酵母或经基因工程改造以表达野生型解淀粉芽孢杆菌(b.amyloliquefaciens)α-淀粉酶基因(mp85◇)和突变的解淀粉芽孢杆菌α-淀粉酶基因(mp775□)的酿酒酵母的生长曲线。生长速率在38℃下在ypd上测定。结果显示为随培育时间(小时)变化的600nm下的光密度(od(600nm))。在此图中所示的突变体中鉴别的氨基酸突变(当使用野生型解淀粉芽孢杆菌α-淀粉酶基因(seqidno:6)的编号和氨基酸序列时)如下:表f.图12中示出的突变葡萄糖淀粉酶的氨基酸突变。菌株氨基酸取代m9900(mp85)无m10074(mp775)k34n图13比较了野生型(m2390)酿酒酵母、经基因工程改造以表达突变的葡萄糖淀粉酶的酿酒酵母(m10156)或经基因工程改造以表达突变的葡萄糖淀粉酶和突变的α-淀粉酶的酿酒酵母(m10624)的乙醇产生。发酵在34%玉米粉和500ppm尿素中在30-32℃的温度下进行88小时。结果显示为随所用酿酒酵母菌株变化的乙醇产量(g/l)。表g.由图13中示出的菌株表达的转基因。菌株葡萄糖淀粉酶α-淀粉酶m2390无无m10156a40n无m10624a40nk34n具体实施方式根据本公开,提供当在被置于高温下的宿主细胞中表达时较不易诱发宿主细胞稳健性下降的核酸分子。在一个实施方案中,这些核酸分子当引入宿主细胞中并在其中表达时不在宿主细胞中诱发敏感性或稳健性的丧失。核酸分子可包含启动子,所述启动子的活性在厌氧(部分或完全)期间得到提高。核酸分子可包含重组蛋白,所述重组蛋白由宿主细胞表达且包含一个或多个突变(例如,一个或多个氨基酸取代)。本公开还提供了包含核酸分子的宿主细胞,由所述核酸分子编码的重组蛋白以及使用其来产生产物的方法。本公开还包括一种制造编码异源蛋白的核酸分子的方法以及包含所述核酸分子的重组宿主细胞。展现稳健性的重组酵母菌株本公开提供重组酵母菌株(包含并表达异源核酸分子)且与缺乏异源核酸分子的相应酵母菌株相比具有基本上类似或更佳的稳健性。在本公开的上下文中,术语“稳健性”是指重组酵母耐受或缺乏对与应激有关的干扰的敏感性的能力,所述应激例如像培育/发酵温度的升高和/或重组异源蛋白的表达。在本公开的上下文中,稳健性可通过测量细胞生长、细胞生长速率或细胞生长曲线来测定。当暴露于应激物时,较稳健的重组酵母菌株的生长将比较不稳健的菌株的生长较少受影响(且在一些实施方案中,不受影响)。例如,当暴露于应激物时,较稳健的菌株的细胞生长、细胞生长速率和/或细胞生长曲线与暴露于相同应激物的较不稳健菌株的细胞生长、细胞生长速率和/或细胞生长曲线相比将较不受限(或在一些实施方案中,不受限)。如本文所公开,重组酵母细胞的稳健性在异源核酸分子存在下保持基本上相同,这是由于异源核酸分子的特征。更具体地,异源核酸分子可使用启动子,与在需氧条件下相应的重组酵母宿主细胞相比,所述启动子能够增加当重组宿主细胞处于至少部分厌氧下时异源蛋白的表达。替代地或以组合形式,核酸分子可被设计以便允许表达异源蛋白,所述异源蛋白与相应的天然异源蛋白相比包含至少一个氨基酸突变(例如取代),由此维持重组酵母宿主细胞在高温下的稳健性。在本公开的上下文中,“高温度”或“高温”是指超过重组酵母的最佳生长温度的温度。在其中用作宿主细胞的酵母来自于酵母属(其具有介于30℃与35℃之间的最佳温度)的实施方案中,高温可超过35℃(例如介于35℃与40℃之间),且在一些实施方案中,高温为约38℃。在其中用作宿主细胞的酵母来自于克鲁维酵母属(其具有介于35℃与40℃之间的最佳温度)的实施方案中,高温可超过40℃(例如介于40℃与45℃之间),且在一些实施方案中,高温是在约42℃下。在其中用作宿主细胞的酵母来自于假丝酵母属(其具有介于30℃与35℃之间的最佳温度)的实施方案中,高温可超过35℃(例如介于35℃与40℃之间),且在一些实施方案中,高温是在约38℃下。在其中用作宿主细胞的酵母来自于毕赤酵母属(其具有介于25℃与35℃之间的最佳温度)的实施方案中,高温可超过35℃(例如介于35℃与40℃之间),且在一些实施方案中,高温是在约38℃下。在其中用作宿主细胞的酵母来自于裂殖酵母属(其具有介于25℃与35℃之间的最佳温度)的实施方案中,高温可超过35℃(例如介于35℃与40℃之间),且在一些实施方案中,高温是在约38℃下。在其中用作宿主细胞的酵母来自于汉逊酵母属(其具有介于45℃与50℃之间的最佳温度)的实施方案中,高温可超过50℃(例如介于50℃与55℃之间),且在一些实施方案中,高温是在约53℃下。在其中用作宿主细胞的酵母来自于裂殖酵母属(其具有介于25℃与35℃之间的最佳温度)的实施方案中,高温可超过35℃(例如介于35℃与40℃之间),且在一些实施方案中,高温是在约38℃下。在其中用作宿主细胞的酵母来自于汉逊酵母属(其具有介于45℃与50℃之间的最佳温度)的实施方案中,高温可超过50℃(例如介于50℃与55℃之间),且在一些实施方案中,高温是在约53℃下。在其中用作宿主细胞的酵母来自于克勒克酵母属(其具有介于30℃与35℃之间的最佳温度)的实施方案中,高温可超过35℃(例如介于35℃与40℃之间),且在一些实施方案中,高温是在约38℃下。在其中用作宿主细胞的酵母来自于许旺氏酵母属(其具有介于35℃与40℃之间的最佳温度)的实施方案中,高温可超过40℃(例如介于40℃与45℃之间),且在一些实施方案中,高温是在约43℃下。在其中用作宿主细胞的酵母来自于耶氏酵母属(其具有介于30℃与35℃之间的最佳温度)的实施方案中,高温可超过35℃(例如介于35℃与40℃之间),且在一些实施方案中,高温是在约38℃下。由于其重组性质,具有稳健性的重组酵母菌株包含用于表达“异源”蛋白的“异源”核酸分子。当提及核酸分子(如启动子或编码序列)或多肽(如酶)时使用的术语“异源”是指并非天然地见于宿主生物体或细胞中的核酸分子或蛋白质。“异源”还包括天然编码区或其部分,它们从源生物体中被除去且随后以不同于相应天然基因的形式再引入到源生物体中,例如,不在生物体基因组的其天然位置处。异源核酸分子被有目的地引入宿主细胞中。“异源”核酸分子或蛋白质可由任何来源获得,例如真核生物、原核生物、病毒等。在一个实施方案中,异源核酸分子可由真核生物(例如像另一种酵母)或原核生物(例如像细菌)获得。如本文所用的术语“异源”还指的是由除内源性来源以外的来源获得的元件(核酸或蛋白质)。因此,例如,异源元件可由以下获得:宿主细胞的不同菌株、或不同分类组的生物体(例如,不同的界、门、纲、目、科、属或种、或这些分类的一个内的任何亚组)。术语“异源”在本文中还与术语“外源”同义使用。在本公开的上下文中,异源核酸分子可被整合到酵母宿主细胞的基因组中。如本文所用的术语“整合”是指遗传元件经由分子生物学技术被置于宿主细胞的基因组中。例如,与在载体(如由宿主细胞携带的质粒)中相对比,遗传元件可置于宿主细胞的染色体中。用于将遗传元件整合到宿主细胞的基因组中的方法是本领域中公知的且包括同源重组。异源核酸分子可以一个或多个拷贝存在于酵母宿主细胞基因组中。替代地,异源核酸分子可独立地从酵母基因组中复制。在这样的实施方案中,所述核酸分子可为稳定的和自我复制的。可使用载体将异源核酸分子引入酵母宿主细胞中。“载体”,例如“质粒”、“粘粒”或“yac”(酵母人工染色体)指的是染色体外元件且通常呈环状双链dna分子形式。此类载体可为自主复制序列、基因组整合序列、噬菌体或核苷酸序列、线性、环状或超螺旋的单链或双链dna或rna,由任何来源获得,其中许多核苷酸序列已连接或重组到独特的结构中,所述独特的结构能够将启动子片段和所选基因产物的dna序列连同适当的3'非翻译序列一起引入细胞中。在异源核酸分子中,启动子与编码异源蛋白的核酸分子可操作地彼此连接。在本公开的上下文中,表述“可操作地连接”或“可操作地缔合”是指以下事实:启动子以允许在一定条件下由核酸分子表达异源蛋白的方式与编码异源蛋白的核苷酸分子在物理上相缔合。在一个实施方案中,启动子可位于编码异源蛋白的核酸序列的上游(5’)。在又一个实施方案中,启动子可位于编码异源蛋白的核酸序列的下游(3’)。在本公开的上下文中,一个或多个启动子可包括在异源核酸分子中。当一个以上启动子包括在异源核酸分子中时,每个启动子可操作地连接于编码异源蛋白的核酸序列。启动子可位于编码异源蛋白的核酸分子的上游、下游以及上游和下游两者处。“启动子”是指能够控制编码序列(如编码异源蛋白的核酸分子)或功能性rna的表达的dna片段。如本文所用的术语“表达”是指来自本文所述的异源核酸分子的有义(mrna)的转录和稳定积聚。表达还可指的是mrna翻译为多肽。启动子可整体上来源于天然基因,或包含由自然界中所见的不同启动子获得的不同元件,或甚至包含合成的dna区段。本领域技术人员应理解,不同启动子可在不同发育阶段,或响应于不同的环境或生理条件指导表达。促使基因在大多数细胞中在大部分时间以基本上相似的水平表达的启动子通常被称为“组成型启动子”。还认识到,由于在大多数情况下调节性序列的精确边界没有完全定义,所以不同长度的dna片段可具有相同的启动子活性。启动子一般在其3'端与转录起始位点结合,并且向上游(5'方向)延伸,以包括引发在背景以上的可检测水平的转录所需的最少数目的碱基或元件。在启动子内将发现转录起始位点(例如用核酸酶s1制图方便地确定),以及负责结合聚合酶的蛋白结合结构域(共有序列)。可包括在异源核酸分子中的启动子允许或促成异源蛋白在部分或完全厌氧条件下的表达(例如,厌氧调节性启动子)。因此,所用的启动子促成异源蛋白在其中氧含量与环境空气中的氧含量(例如,其中氧通常在环境空气中以约21体积%存在的需氧条件)相比降低的环境中的表达。当重组酵母宿主细胞被置于需氧条件下时,启动子可允许异源蛋白的表达,然而,在启动子的控制下,异源蛋白在被置于需氧条件下的重组酵母宿主细胞中的表达水平低于被置于(部分或完全)厌氧条件下的相同重组酵母宿主细胞的表达水平。因而,当重组酵母宿主细胞被置于至少部分厌氧条件下时,启动子允许异源蛋白的优先表达。如本公开的上下文中所用,术语“厌氧条件”是指其中氧含量(按体积)低于21%(例如,低于或等于约20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、1或0%)的条件。异源核酸分子可包含一个以上启动子。在这种情况下,每个启动子共价连接至编码异源蛋白的核酸分子且为厌氧调节性启动子。可操作地连接至编码异源蛋白的核酸分子的启动子可包括但不限于:tdh1基因的启动子(tdh1p,参见,例如seqidno:9的核酸序列)、pau5基因的启动子(pau5p,参见,例如seqidno:10的核酸序列)、anb1基因的启动子(anb1p,参见,例如seqidno:11的核酸序列)、hor7基因的启动子(hor7p,参见,例如seqidno:12的核酸序列)、adh1基因的启动子(adh1p,参见,例如seqidno:13的核酸序列)、tdh2基因的启动子(tdh2p,参见,例如seqidno:14的核酸序列)、tdh3基因的启动子(tdh3p,参见,例如seqidno:15的核酸序列)、gpd1基因的启动子(gpd1p,参见,例如seqidno:16的核酸序列)、cdc19基因的启动子(cdc19p,参见,例如seqidno:17的核酸序列)、eno2基因的启动子(eno2p,参见,例如seqidno:18的核酸序列)、pdc1基因的启动子(pdc1p,参见,例如seqidno:19的核酸序列)、hxt3基因的启动子(hxt3p,参见,例如seqidno:20的核酸序列)、tpi1基因的启动子(tpi1p,参见,例如seqidno:21的核酸序列)、kwast等人,2002,terlind等人,1999及tai等人,2002中所列基因的厌氧调节性启动子。可包括在异源核酸分子中的启动子的组合可包括但不限于以下任何两个或更多个启动子的组合:tdh1基因的启动子(tdh1p)、pau5基因的启动子(pau5p)、anb1基因的启动子(anb1p)、hor7基因的启动子(hor7p)、adh1基因的启动子(adh1p)、tdh2基因的启动子(tdh2p)、tdh3基因的启动子(tdh3p)、gpd1基因的启动子(gpd1p)、cdc19基因的启动子(cdc19p)、eno2基因的启动子(eno2p)、pdc1基因的启动子(pdc1p)、hxt3基因的启动子(hxt3p)、tpi1基因的启动子(tpi1p)、kwast等人、2002,terlind等人、1999及tai等人、2002中所列基因的厌氧调节性启动子。在一个实施方案中,包括在异源核酸分子中的启动子的组合包含或由以下组成:tdh1基因的启动子(tdh1p)和pau5基因的启动子(pau5p)。启动子对编码异源蛋白的核酸分子可为异源的。启动子可为异源的或由来自于与重组酵母宿主细胞相同属或种的菌株获得。在一个实施方案中,启动子来源于与酵母宿主细胞相同的属或种且异源蛋白来源于与酵母宿主细胞不同的属。重组酵母宿主细胞可用于产生各种异源蛋白。在一个实施方案中,重组酵母宿主细胞可用于产生酶,特别是参与其底物的裂解或水解的酶(例如,裂解酶,且在一些实施方案中,糖解酶)。在又一个实施方案中,所述酶可以是糖苷水解酶。在本公开的上下文中,术语“糖苷水解酶”是指参与碳水化合物消化、代谢和/或水解的酶,包括淀粉酶、纤维素酶、半纤维素酶、分解纤维素和分解淀粉的辅助酶、菊粉酶、果聚糖酶、海藻糖酶、果胶酶及戊糖利用酶。在另一个实施方案中,所述酶可以是蛋白酶。在本公开的上下文中,术语“蛋白酶”是指参与蛋白质消化、代谢和/或水解的酶。在再一个实施方案中,所述酶可以是酯酶。在本公开的上下文中,术语“酯酶”是指参与来自酸或醇的酯水解的酶,包括磷酸酶,如植酸酶。异源蛋白可为“淀粉分解酶”,即,参与淀粉酶消化、代谢和/或水解的酶。术语“淀粉酶”是指将淀粉分解成糖的酶。所有淀粉酶都是糖苷水解酶且作用于α-1,4-糖苷键。一些淀粉酶,如γ-淀粉酶(葡萄糖淀粉酶)还作用于α-1,6-糖苷键。淀粉酶包括α-淀粉酶(ec3.2.1.1)、β-淀粉酶(ec3.2.1.2)、及γ-淀粉酶(ec3.2.1.3)。α-淀粉酶是钙金属酶,在钙不存在下不能起作用。通过作用于沿淀粉链的随机位置,α-淀粉酶分解长链碳水化合物,最终由直链淀粉产生麦芽三糖和麦芽糖,或由支链淀粉产生麦芽糖、葡萄糖和“极限糊精”。因为α-淀粉酶可作用于底物上的任何位置,所以其倾向于比β-淀粉酶更快地起效。在一个实施方案中,异源蛋白衍生自α-淀粉酶,例如衍生自解淀粉芽孢杆菌(bacillusamyloliquefacens)的α-淀粉酶。另一种形式的淀粉酶,β-淀粉酶也是由细菌、真菌和植物合成。从非还原端开始,β-淀粉酶催化第二α-1,4糖苷键的水解,每次裂解出两个葡萄糖单位(麦芽糖)。许多微生物产生淀粉酶来降解细胞外淀粉。除了裂解直链淀粉和支链淀粉的非还原端处的最后一个α(1-4)糖苷键从而产生葡萄糖之外,γ-淀粉酶还将裂解α(1-6)糖苷键。在一个实施方案中,异源蛋白衍生自γ-淀粉酶,例如扣囊复膜酵母的葡萄糖淀粉酶(例如,由glu0111基因编码)。另一种淀粉分解酶为α-葡糖苷酶,其作用于麦芽糖及由α-、β-和γ-淀粉酶产生的其它短的低聚麦芽糖,将它们转化为葡萄糖。另一种淀粉分解酶为支链淀粉酶。支链淀粉酶为特定种类的葡聚糖酶,即一种淀粉分解胞外酶,其降解支链淀粉。支链淀粉被认为是由α-1,6-糖苷键连接的麦芽三糖单位的链。支链淀粉酶(ec3.2.1.41)也称为支链淀粉-6-葡聚糖水解酶(脱支酶)。另一种淀粉分解酶,即异支链淀粉酶,将支链淀粉水解为异葡糖基麦芽糖(6-α-麦芽糖基葡萄糖)。异支链淀粉酶(ec3.2.1.57)也称为支链淀粉4-葡聚糖水解酶。“淀粉酶”可为参与淀粉酶消化、代谢和/或水解的任何酶,包括α-淀粉酶、β-淀粉酶、葡萄糖淀粉酶、支链淀粉酶、异支链淀粉酶及α-葡糖苷酶。异源蛋白可为“纤维素分解酶”,即,参与纤维素消化、代谢和/或水解的酶。术语“纤维素酶”是指催化纤维素的纤维溶解(即水解)的一类酶。若干不同种类的纤维素酶是已知的,其在结构和机理上是不同的。基于所催化的反应类型存在一般类型的纤维素酶:内切纤维素酶打断内部键以破坏纤维素的结晶结构并暴露单独的纤维素多糖链;外切纤维素酶从由内切纤维素酶产生的暴露链的末端上裂解2-4个单位,产生四糖或二糖,如纤维二糖。存在两个主要类型的外切纤维素酶(或纤维二糖水解酶,缩写为cbh)-一种类型进行性地从纤维素的还原端处起作用,且一种类型进行性地从纤维素的非还原端处起作用;纤维二糖酶或β-葡糖苷酶将外切纤维素酶产物水解为单独的单糖;氧化纤维素酶通过自由基反应使纤维素解聚,例如纤维二糖脱氢酶(受体);纤维素磷酸化酶使用磷酸酯代替水使纤维素解聚。在纤维素酶活性最熟悉的情况下,酶复合物将纤维素分解为β-葡萄糖。“纤维素酶”可为参与纤维素消化、代谢和/或水解的任何酶,包括内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、木聚糖内切酶、葡糖醛酸酶、乙酰木聚糖酯酶、阿拉伯糖呋喃水解酶、膨胀素(swollenin)、葡糖醛酸酯酶、苹果菌素、果胶酶及阿魏酸酯酶(feruoylesterase)酯酶蛋白。异源蛋白可具有“半纤维素分解活性”,即,参与半纤维素消化、代谢和/或水解的酶。术语“半纤维素酶”是指催化纤维素水解的一类酶。已知若干不同种类的酶具有半纤维素溶解活性,包括但不限于木聚糖酶和甘露聚糖酶。异源蛋白可具有“木聚糖分解活性”,即,具有水解寡戊糖和聚戊糖中的糖苷键的能力的酶。术语“木聚糖酶”是一类酶的名称,这类酶将线性多糖β-1,4-木聚糖降解为木糖,由此分解半纤维素,即,植物细胞壁的主要组分之一。木聚糖酶包括对应于酶委员会编号(enzymecommissionnumber)3.2.1.8的那些酶。异源蛋白也可为“木糖代谢酶”,即,参与木糖消化、代谢和/或水解的酶,包括木糖异构酶、木酮糖激酶、木糖还原酶、木糖脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶及木糖转二羟丙酮基酶蛋白。“戊糖利用酶”可为参与戊糖消化、代谢和/或水解的任何酶,包括木聚糖酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶及阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-磷酸4-表异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木糖脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转二羟丙酮基酶。异源蛋白可具有“甘露聚糖活性”,即,具有水解β-d-甘露糖苷中的末端、非还原β-d-甘露糖残基的能力的酶。甘露聚糖酶能够分解半纤维素,即,植物细胞壁的主要组分之一。木聚糖酶包括对应于酶委员会编号3.2.25的那些酶。异源蛋白可为“果胶酶”,即一种酶,如,果胶裂解酶、果胶酶(pectozyme)和多聚半乳糖醛酸酶,通常在酿造中称为果胶酶。这些酶分解果胶,即,见于植物细胞壁中的多糖底物。异源蛋白可具有“海藻糖分解活性,即,催化海藻糖转化为葡萄糖的酶。海藻糖酶(ec3.2.1.28)可基于它们的最佳ph值被分为中性海藻糖酶(约7.0的最佳ph值)或酸性海藻糖酶(约4.5的最佳ph值)。异源蛋白可具有“植酸分解(phytolytic)活性”,即,催化植酸转化为无机磷的酶。植酸酶(ec3.2.3)可属于组氨酸酸性磷酸酶、β-螺旋桨(propeller)植酸酶、紫色酸性磷酸酶或蛋白质酪氨酸磷酸酶样植酸酶家族。异源蛋白可具有“蛋白分解活性”,即,参与蛋白质消化、代谢和/或水解的酶,包括丝氨酸蛋白酶、苏氨酸蛋白酶、半胱氨酸蛋白酶、天冬氨酸蛋白酶、谷氨酸蛋白酶及金属蛋白酶。如上所指出,异源蛋白自其天然的氨基酸序列有目的地被修饰以引入至少一个氨基酸取代(当与天然蛋白质相比时)且这种氨基酸取代维持或提高表达修饰的异源蛋白的酵母菌株的稳健性(当与表达天然未修饰蛋白质的相应酵母菌株的稳健性相比时)。在一个实施方案中,异源蛋白被修饰以引入额外的(推定的)糖基化位点以便维持或提高其在高温下的稳健性。在一些实施方案中,异源蛋白被修饰以取代未被糖基化的氨基酸,所述氨基酸是可被糖基化的氨基酸。术语“糖基化”是指其中碳水化合物连接到氨基酸的官能团(在一些实施方案中,位于氨基酸的侧链上)的化学反应。可被糖基化的氨基酸的一个实例是具有酰胺官能团(例如像天冬酰胺)的氨基酸。在某些实施方案中,天冬酰胺可通过将聚糖连接到酰胺官能团(位于氨基酸残基侧链或氨基中)的有效氮原子上而被糖基化。在这样的实施方案中,糖基化被称为n-糖基化且糖基化的氨基酸被称为n-糖基化氨基酸。可被糖基化的氨基酸残基的另一个实例是在其侧链上具有羟基氧的氨基酸(例如像丝氨酸、苏氨酸、酪氨酸、羟基赖氨酸或羟基脯氨酸)。在这样的实施方案中,糖基化被称为o-糖基化且糖基化的氨基酸残基被称为o-糖基化氨基酸。可被糖基化的氨基酸残基的另一个例子是具有芳族侧链的氨基酸残基且糖基化原子为碳原子(例如像色氨酸)。在这样的实施方案中,糖基化(例如甘露糖基化)被称为c-糖基化且糖基化的氨基酸残基被称为c-糖基化氨基酸残基。在本公开的上下文中,可对天然蛋白质进行一个或多个取代以在异源蛋白上包括一个或多个糖基化位点。额外的糖基化位点可位于异源蛋白中的任何位置,只要糖基化位点的引入基本上不改变异源蛋白的生物活性(在一些实施方案中,酶活性),并且其位于一定的位置处以便在合成或折叠期间保护异源蛋白的疏水性区域。糖基化位点的鉴别。在一些实施方案中,潜在的n-连接糖基化位点可通过氨基酸序列分析联合靶蛋白的同源性建模来鉴别。蛋白质的无序区域是通过同源性建模和/或二级结构预测来鉴别,并且鉴别了目标无序区域。这些区域可位于蛋白质的n-或c-端区域或其它中间区域中。关于潜在点突变对所述区域的氨基酸序列进行分析,这些点突变引入天冬酰胺、丝氨酸或苏氨酸,从而产生n-连接的糖基化基序nx[s/t],其中x是除脯氨酸之外的任何氨基酸。除点突变之外,插入共有序列nx[s/t](其中x是除脯氨酸之外的任何氨基酸)的也可用于维持侧接氨基酸序列,同时仍然引入糖基化位点基序。在一些实施方案中,推定的糖基化位点被引入异源蛋白的n末端区域中。当异源蛋白是淀粉酶时,此实施方案尤其有利。在本公开的上下文中,术语“n末端区域”是指位于异源蛋白的n末端附近处的异源蛋白的部分。在一些实施方案中,n末端区域分布在异源蛋白的第一(当从异源蛋白的第一编码的氨基酸残基开始时)至第100、第90、第80、第70、第60、第50或第40个上游氨基酸残基之间。在本公开的上下文中,n末端区域包含异源蛋白的信号肽。在替代或补充实施方案中,推定的糖基化位点被引入异源蛋白的c末端区域。在本公开的上下文中,术语“c末端区域”是指位于异源蛋白的c末端附近处的异源蛋白的部分。在一些实施方案中,c末端区域分布在异源蛋白的最后一个(当从异源蛋白的最后一个编码的氨基酸残基开始时)至倒数第100、第90、第80、第70、第60、第50或第40个氨基酸残基之间。在其中异源蛋白展现淀粉酶活性(例如当异源蛋白是seqidno:1的葡萄糖淀粉酶时)的实施方案中,可添加用天冬酰胺、丝氨酸或苏氨酸残基的取代,其将产生n-连接的糖基化位点基序nx[s/t]。在这样的实施方案中,n末端区限于第一天然存在的n-连接的糖基化基序(例如,当异源蛋白是葡萄糖淀粉酶(glu0111),第一天然存在的n-连接的糖基化基序是seqidno:1中的n43时)之前的氨基酸,或始于第一α-螺旋(例如,当异源蛋白是葡萄糖淀粉酶(glu0111)时,第一α螺旋的开始是seqidno:1的f44时),通过同源性建模/二级结构预测所确定。在一个实施例中,额外的糖基化位点可通过用天冬酰胺、丝氨酸和/或苏氨酸残基取代对应于seqidno:1的位置36和/或40处的氨基酸残基来添加。在另一个实施例中,异源蛋白具有对应于seqidno:1或2的位置36和/或40处的精氨酸残基。在仍另一个实施方案中,异源蛋白具有seqidno:3或4的氨基酸序列。在又一个实施方案中,异源蛋白不具有6423突变体的氨基酸序列(例如,当与seqidno:1的氨基酸序列相比时包含氨基酸取代l8s;f101l;k277e)。在其中异源蛋白是α-淀粉酶的实施方案中(例如,在其中天然蛋白质是解淀粉芽孢杆菌的α-淀粉酶的实施方案中),额外的糖基化位点可通过用精氨酸、丝氨酸和/或苏氨酸残基取代对应于seqidno:6的位置26、27、34、35、36和/或37处的氨基酸残基来添加。在仍另一个实施例中,异源蛋白具有对应于seqidno:6的位置26、34、36和/或37处的精氨酸残基。在再一个实施方案中,异源蛋白具有对应于seqidno:6的位置27和/或35处的丝氨酸残基。在仍又一个实施方案中,异源蛋白具有seqidno:7的氨基酸序列。异源蛋白也可被修饰以与天然蛋白质相比引入额外的取代并且维持或提高重组酵母细胞的稳健性。这种额外的取代不一定产生额外的糖基化位点并且可为了其维持或提高重组酵母细胞的稳健性的能力而被引入。可对天然蛋白质进行一个或多个取代以维持或提高表达第一异源蛋白的重组酵母的稳健性。在其中异源蛋白是葡萄糖淀粉酶的实施方案中(例如,在其中天然蛋白质是扣囊复膜酵母的由如seqidno:1中所示的glu0111基因编码的葡萄糖淀粉酶的实施方案中),额外的取代可位于对应于seqidno:1的8、12、40、101、277和/或487的位置处。额外的取代可为不同于位于seqidno:1的位置8、12、40、101、277和/或487处的氨基酸残基的任何氨基酸残基。例如,异源蛋白可具有seqidno:2的氨基酸序列。在一个实施方案中,位于seqidno:2的异源蛋白的位置8处的氨基酸残基是除亮氨酸之外的任何氨基酸残基,且在一个实施方案中,是具有极性和不带电侧链的氨基酸残基,例如像丝氨酸、苏氨酸、天冬酰胺、谷氨酰胺、酪氨酸或半胱氨酸残基。在又一个实施方案中,位于seqidno:2的异源蛋白的位置8处的氨基酸残基是丝氨酸残基。在一个实施方案中,位于seqidno:2的异源蛋白的位置12处的氨基酸残基是除苯丙氨酸之外的任何氨基酸残基,且在一个实施方案中,是具有疏水性侧链的氨基酸残基,例如像异亮氨酸、丙氨酸、亮氨酸、苯丙氨酸、缬氨酸、脯氨酸或甘氨酸残基。在又一个实施方案中,位于seqidno:2的异源蛋白的位置12处的氨基酸残基是异亮氨酸残基。在又一个实施方案中,位于seqidno:2的异源蛋白的位置40处的氨基酸残基是除丙氨酸之外的任何氨基酸残基,且在一个实施方案中,是具有极性和带电侧链的氨基酸残基,例如像谷氨酸、赖氨酸、精氨酸、组氨酸、天冬氨酸或谷氨酸残基。在仍又一个实施方案中,位于seqidno:2的位置40处的氨基酸残基是天冬氨酸残基。在又一个实施方案中,位于seqidno:2的异源蛋白的位置101处的氨基酸残基是除苯丙氨酸之外的任何氨基酸残基,且在一个实施方案中,是具有疏水性侧链的氨基酸残基,例如像异亮氨酸、丙氨酸、亮氨酸、苯丙氨酸、缬氨酸、脯氨酸或甘氨酸残基。在又一个实施方案中,位于seqidno:2的异源蛋白的位置101处的氨基酸残基是亮氨酸残基。在又一个实施方案中,位于seqidno:2的异源蛋白的位置277处的氨基酸残基是除赖氨酸之外的任何氨基酸残基,且在一个实施方案中,是具有极性和带电侧链的氨基酸残基,例如像谷氨酸、赖氨酸、精氨酸、组氨酸、天冬氨酸或谷氨酸残基。在又一个实施方案中,位于seqidno:2的异源蛋白的位置277处的氨基酸残基是谷氨酸残基。在又一个实施方案中,位于seqidno:2的异源蛋白的位置487处的氨基酸残基是除苯丙氨酸之外的任何氨基酸残基,且在一个实施方案中,是具有疏水性侧链的氨基酸残基,例如像异亮氨酸、丙氨酸、亮氨酸、苯丙氨酸、缬氨酸、脯氨酸或甘氨酸残基。在又一个实施方案中,位于seqidno:2的异源蛋白的位置487处的氨基酸残基是异亮氨酸残基。在本公开的上下文中,异源蛋白可进一步被修饰以包含连接区域(tetheringregion)(以便允许分泌的异源蛋白定位在酵母宿主细胞的外表面处)和/或融合至另一个实体(以产生融合蛋白)。在本公开的上下文中,宿主细胞可为酵母。合适的酵母宿主细胞可例如来自于酵母属、克鲁维酵母属、arxula属、德巴利酵母属、假丝酵母属、毕赤酵母属、法夫酵母属、裂殖酵母属、汉逊酵母属、克勒克酵母属、许旺氏酵母属或耶氏酵母属。合适的酵母种可包括例如酿酒酵母、博伊丁酵母(s.bulderi)、s.barnetti、少孢酵母(s.exiguus)、葡萄汁酵母(s.uvarum)、糖化酵母(s.diastaticus)、乳酸克鲁维斯酵母(k.lactis)、马克斯克鲁维酵母(k.marxianus)或脆壁克鲁维酵母(k.fragilis)。在一些实施方案中,酵母选自由以下组成的组:酿酒酵母、粟酒裂殖酵母(schizzosaccharomycespombe)、白假丝酵母(candidaalbicans)、巴斯德毕赤酵母(pichiapastoris)、树干毕赤酵母(pichiastipitis)、解脂耶氏酵母(yarrowialipolytica)、多形汉逊酵母(hansenulapolymorpha)、红法夫酵母(phaffiarhodozyma)、产朊假丝酵母(candidautilis)、arxulaadeninivorans、汉逊德巴利酵母(debaryomyceshansenii)、多形德巴利酵母菌(debaryomycespolymorphus)、粟酒裂殖酵母及许旺氏酵母(schwanniomycesoccidentalis)。在一个具体实施方案中,酵母为酿酒酵母。在一些实施方案中,宿主细胞可为含油酵母细胞。例如,含油酵母宿主细胞可来自于布拉氏霉属(blakeslea)、假丝酵母属、隐球菌属(cryptococcus)、小坎宁安霉属(cunninghamella)、油脂酵母属(lipomyces)、被孢霉属(mortierella)、毛霉菌属(mucor)、须霉属(phycomyces)、腐霉属(pythium)、红冬孢酵母属(rhodosporidum)、红酵母属(rhodotorula)、毛孢子菌属(trichosporon)或耶氏酵母属。在一些替代实施方案中,宿主细胞可为含油微藻宿主细胞(例如,来自于破囊壶菌属(thraustochytrium)或裂壶藻属(schizochytrium))。在一些实施方案中,在异源核酸分子不存在下,宿主细胞是耐热性宿主细胞。耐热性宿主细胞可通过允许外部产生的纤维素酶和产乙醇的宿主细胞在类似的温度范围下最佳地工作而尤其适用于同时糖化和发酵过程。在一些实施方案中,耐热性宿主细胞可在超过以下的温度下生长:约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃或约42℃。在另外的实施方案中,耐热性宿主细胞在超过以下的温度下表达异源蛋白:约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃或约50℃。在再一个实施方案中,耐热性宿主细胞可在以下温度下生长:约30℃至60℃、约30℃至55℃、约30℃至50℃、约40℃至60℃、约40℃至55℃或约40℃至50℃。在一些实施方案中,耐热性宿主细胞可在以下温度下产生异源蛋白:约30℃至60℃、约30℃至55℃、约30℃至50℃、约40℃至60℃、约40℃至55℃或约40℃至50℃。耐热性宿主细胞可包括例如东方伊萨酵母(issatchenkiaorientalis)、密西西比毕赤酵母(pichiamississippiensis)、墨西哥毕赤酵母(pichiamexicana)、粉状毕赤酵母(pichiafarinosa)、仙人掌棒孢酵母(clavisporaopuntiae)、葡萄牙棒孢酵母(clavisporalusitaniae)、墨西哥假丝酵母(candidamexicana)、多形汉逊酵母或克鲁维酵母属种宿主细胞。如本文所述,用编码异源蛋白的异源核酸分子基因工程改造(转导或转化或转染)宿主细胞。核酸分子可在载体上被引入宿主细胞中,所述载体可为例如包含编码异源蛋白的序列的克隆载体或表达载体。宿主细胞可包含一个或多个异源核酸分子,各自作为整合拷贝或独立复制拷贝而存在。宿主细胞还可包含额外的异源核酸分子,其有助于由木质纤维素生物质产生乙醇。例如,wo2011/153516(表达一种或多种糖解酶)或wo2012/138942(包含参与甘油产生的酶中的缺失)中所述的宿主细胞可用于本公开的上下文中。在仍另一个实施例中,wo2011/153516中所述的异源蛋白可进一步被修饰以恢复表达它们的重组酵母宿主细胞的稳健性。如上所述的转化的宿主细胞或细胞培养物可关于以下进一步分析:纤维素或淀粉的水解或戊糖利用(例如,通过糖检测测定);具体类型的糖解酶活性(例如,通过测量单独的内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、木聚糖内切酶、葡糖醛酸酶、乙酰木聚糖酯酶、阿拉伯糖呋喃水解酶、膨胀素、葡糖醛酸酯酶、苹果菌素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡萄糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-磷酸4-表异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木糖脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转二羟丙酮基酶);或关于总纤维素酶活性。内切葡聚糖酶活性可例如通过测量内切葡聚糖酶特异性cmc或羟乙基纤维素(hec)底物中还原端的增加来测定。纤维二糖水解酶活性可例如通过使用不溶性纤维素底物如无定形底物磷酸溶胀纤维素(pasc)或微晶纤维素(avicel)并测定底物水解程度来测量。β-葡糖苷酶活性可通过多种测定,例如使用纤维二糖来测量。关于其它糖解酶类型的活性的测定是本领域中已知的且在下文中例示。总糖解酶活性可协同地水解生物质原料,所述活性可包括以下的活性:内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、木聚糖内切酶、葡糖醛酸酶、乙酰木聚糖酯酶、阿拉伯糖呋喃水解酶、膨胀素、葡糖醛酸酯酶、苹果菌素、果胶酶、阿魏酸酯酶蛋白、α-淀粉酶、β-淀粉酶、葡萄糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、支链淀粉酶、异支链淀粉酶、阿拉伯糖异构酶、核酮糖-5-磷酸4-表异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木糖脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶以及木糖转二羟丙酮基酶。例如,总纤维素酶活性因此可使用包括以下的不溶性底物来测量,包括纯的纤维素底物,如whatman1号滤纸、棉绒、微晶纤维素、细菌纤维素、海藻纤维素、及含有纤维素的底物(如染色纤维素)、α-纤维素或预处理的木质纤维素。纤维素酶的比活性也可通过本领域普通技术人员已知的方法、如通过avicel测定(上文所述)来检测,所述avicel测定是由针对样品测量的蛋白质(纤维素酶)浓度来归一化。总糖解活性也可使用含有淀粉、纤维素及半纤维素如玉米醪的复合底物,通过测量释放的单体糖来测量。本公开的一方面因此涉及裂解酶的有效产生以帮助淀粉、纤维素及戊糖的消化和利用,以及如乙醇的产物的生成。“糖解酶”可为参与碳水化合物消化、代谢和/或水解的任何酶,包括淀粉酶、纤维素酶、半纤维素酶、分解纤维素和分解淀粉的辅助酶、菊粉酶、果聚糖酶及戊糖水解酶。“纤维素酶”可为参与纤维素酶消化、代谢和/或水解的任何酶,包括内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、木聚糖内切酶、葡糖醛酸酶、乙酰木聚糖酯酶、阿拉伯糖呋喃水解酶、膨胀素、葡糖醛酸酯酶、苹果菌素、果胶酶及阿魏酸酯酶蛋白。“淀粉酶”可为参与淀粉酶消化和/或代谢的任何酶,包括α-淀粉酶、β-淀粉酶、葡萄糖淀粉酶、支链淀粉酶、异支链淀粉酶及α-葡糖苷酶。戊糖水解酶可为参与戊糖消化和/或代谢的任何酶,包括木聚糖酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶及阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-磷酸4-表异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木糖脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转二羟丙酮基酶。“蛋白酶”可为参与蛋白质消化和/或代谢的任何酶。“酯酶”可为参与来自酸或醇的酯的水解的任何酶(如肌醇六磷酸酶)。在另外的实施方案中,可测定重组宿主细胞或细胞培养物产生乙醇的能力。乙醇产生可通过本领域普通技术人员已知的技术,例如通过标准hplc折射率方法来测量。经修饰的裂解酶及用于其产生的工具本公开还提供经修饰的异源蛋白(如上面描述的裂解酶)以及相应的片段和/或变体,其在重组酵母宿主细胞中表达。在一个实施方案中,分离的异源蛋白(以及其相应片段和变体)可以纯化形式、至少以部分纯化形式提供。例如,分离的异源蛋白可作为细胞上清液提供。在某些实施方案中,分离的异源蛋白(以及其相应片段和变体)是以分离形式提供,例如纯化至均质。在某些实施方案中,高分子量材料可通过丙酮沉淀或通过用一次性脱盐套件(desaltingcartridge)缓冲样品从酵母细胞上清液中回收。分离的异源蛋白还可通过包括例如原生质球制备和溶解、使用玻璃珠进行细胞破环以及使用液氮进行细胞破环从重组酵母细胞培养物中回收和纯化。另外的蛋白质纯化方法包括硫酸铵或乙醇沉淀、酸萃取、阴离子或阳离子交换色谱法、磷酸纤维素色谱法、疏水性相互作用色谱法、亲和色谱法、羟基磷灰石色谱法、凝胶过滤以及凝集素色谱法。需要时,可以成熟蛋白质的完成构型使用蛋白质重折叠步骤。最后,高效液相色谱法(hplc)可用于最终纯化步骤。可分析分离的异源蛋白(以及其相应片段和变体)。蛋白质分析方法包括如下方法,如传统lowry法、bca测定、280nm下的吸光度、或根据biorad制造商方案的蛋白质测定法。使用所述方法,可估计修饰的裂解酶的蛋白质含量。另外,为了精确地测量蛋白质浓度,分离的异源蛋白可与标签(例如his标签或ha标签)一起表达并且通过使用例如针对标签的抗体的标准方法来纯化,即,一种标准镍树脂纯化技术或类似方法。分离的异源蛋白变体与本文所述的分离的异源蛋白具有至少70%、80%、85%、90%、95%、96%、97%、98%或99%同一性。当与修饰的裂解酶的氨基酸序列相比时,变体包含至少一个氨基酸差异。此外,表达一种或多种分离的异源蛋白的重组酵母比不表达一种或多种修饰的分离的异源蛋白变体的相应酵母展现更佳或类似的稳健性。如本领域中已知的术语“同一性百分比”是两个或更多个多肽序列或两个或更多个多核苷酸序列之间的关系,如通过比较序列所测定。可按常规使用已知的计算机程序测定同一性水平。用于测定同一性百分比的方法也是评估多肽序列同一性相关的,如下文关于多核苷酸同一性更详细地论述。“同一性”可易于通过已知方法来计算,所述已知方法包括但不限于以下文献中所述的那些:computationalmolecularbiology(lesk,a.m.编著)oxforduniversitypress,ny(1988);biocomputing:informaticsandgenomeprojects(smith,d.w.编著)academicpress,ny(1993);computeranalysisofsequencedata,部分i(griffin,a.m.和griffin,h.g.编著)humanapress,nj(1994);sequenceanalysisinmolecularbiology(vonheinje,g.编著)academicpress(1987);以及sequenceanalysisprimer(gribskov,m.和devereux,j.编著)stocktonpress,ny(1991)。测定同一性的优选方法经设计以得到测试序列之间的最佳匹配。测定同一性和相似性的方法汇编于公众可获得的计算机程序中。可使用lasergene生物信息学计算软件包(dnastarinc.,madison,wis.)的megalign程序进行序列比对和同一性百分比计算。使用具有默认参数(空位罚分(gappenalty)=10,空位长度罚分(gaplengthpenalty)=10)的clustal比对方法(higgins和sharp(1989)cabios.5:151-153)进行本文所公开的序列的多重比对。使用clustal方法用于成对比对的默认参数是ktuplb1,空位罚分=3,窗口(window)=5及保留对角线(diagonalssaved)=5。本文所述的变体可为(i)其中氨基酸残基中的一个或多个被保守或非保守氨基酸残基(优选是保守氨基酸残基)取代且这种取代的氨基酸残基可由或不由遗传密码编码的变体;或(ii)其中氨基酸残基中的一个或多个包括取代基团的变体;或(iii)其中成熟多肽与另一种化合物融合,如提高多肽的半衰期的化合物(例如聚乙二醇)的变体;或(iv)其中另外的氨基酸融合至成熟多肽以便于多肽的纯化的变体;或(v)其中多肽的片段是可溶性的,即不是膜结合的,但仍使配体结合至膜结合受体的变体。分离的异源蛋白的“变体”可为保守变体或等位基因变体。如本文所用,保守变体是指不会不利地影响分离的异源蛋白的生物功能的氨基酸序列中的改变。当改变的序列防碍或破坏与分离的异源蛋白有关的生物功能时,取代、插入或缺失据说会不利地影响蛋白质。例如,可改变蛋白质的总电荷、结构或疏水-亲水性质,而不会不利地影响生物活性。因此,可以改变氨基酸序列,以例如赋予肽以更多的疏水或亲水性,但又不会不利地影响分离的异源蛋白的生物活性。本公开还提供分离的异源蛋白的片段。分离的异源蛋白“片段”具有分离的异源蛋白的至少10、20、30、40、50、60、70、80、90、100、200、300、400或500个或更多个连续氨基酸。当与分离的异源蛋白的氨基酸序列相比时,片段包含至少一个更少的氨基酸残基。此外,表达一个或多个分离的异源蛋白片段的重组酵母比不表达一个或多个分离的异源蛋白片段的相应酵母展现更佳或类似的稳健性。在一些实施方案中,分离的异源蛋白的片段可用于通过肽合成产生相应的全长修饰的裂解酶。因此,片段可用作用于产生全长蛋白质的中间体。本公开还提供编码本文所述的分离的异源蛋白、变体及片段的核酸分子(也称为异源核酸分子)。核酸分子可为dna(如互补dna、合成dna或基因组dna)或rna(包括合成rna)且可以单链(有义链或反义链)或双链形式提供。预期的核酸分子可在编码区、非编码区或这两者中包含改变。实例是含有改变的核酸分子变体,所述改变产生沉默取代、添加或缺失,但不改变所编码的分离异源蛋白的性质或活性,也不改变包含其的重组宿主细胞的稳健性。在某些实施方案中,核苷酸变体是通过由遗传密码的简并性所致的沉默取代产生。在一些实施方案中,核酸分子关于预期的受体酵母宿主细胞而进行密码子优化。如本文所用,术语“密码子优化的编码区”意指通过用一个或多个更经常在给定生物体的基因中使用的密码子置换至少一个或一个以上密码子而适于在所述生物体的细胞中表达的核酸编码区。一般说来,生物体中高度表达的基因偏向于由所述生物体中最丰富的trna种类识别的密码子。此偏向的一个量度是“密码子适应指数”或“cai”,其衡量具体基因中用于编码每个氨基酸的密码子最常出现于从生物体中高度表达的基因的参考集中的程度。本文所述的密码子优化序列的cai对应于介于约0.8与1.0之间、约0.8与0.9之间、或约1.0。密码子优化的序列可被进一步被修饰以便于在特定生物体中的表达,这取决于那个受体的生物限制。例如,“a”或“t”的大轮次(例如,大于4、5、6、7、8、9或10个连续碱基的轮次)可从序列中除去,如果已知这些轮次消极地影响转录的话。此外,特异性限制酶位点可出于分子克隆目的而被除去。另外,可检查核酸分子的具有十个碱基或更长长度的定向重复、反向重复及镜面重复,其可通过用“第二最佳”密码子置换密码子而被人工修饰,“第二最佳”密码子即以第二最高频率出现在序列被优化的特定生物体内的密码子。本公开还提供可与本文所述的互补核酸分子杂交的核酸分子。当单链形式的核酸分子在适当的温度和溶液离子强度条件下可与其它核酸分子时退火,核酸分子“可杂交”至另一核酸分子,如cdna、基因组dna或rna。杂交和洗涤条件是公知的且例示于例如以下文献中:sambrook,j.,fritsch,e.f.和maniatis,t.molecularcloning:alaboratorymanual,第二版,coldspringharborlaboratorypress,coldspringharbor(1989),尤其是其中的第11章和表11.1。温度和离子强度条件决定杂交的“严格性”。严格性条件可被调整以筛选中等相似片段,如来自关系较远的生物体的同源序列,至高度相似片段,如复制来自关系较近的生物体的功能性酶的基因。杂交后洗涤决定严格性条件。一组条件使用一系列洗涤:从在室温下6xssc、0.5%sds持续15分钟开始,然后在45℃下用2xssc、0.5%sds重复持续30分钟,接着在50℃下用0.2xssc、0.5%sds重复两次持续30分钟。对于更严格的条件,在较高温度下进行洗涤,其中洗涤与上述那些相同,例外的是在0.2xssc、0.5%sds中的最后两个30分钟洗涤的温度增至60℃。另一组高度严格条件使用在65℃下在0.1xssc、0.1%sds中的两个最后洗涤。又一组高度严格条件是由以下来定义:在0.1xssc、0.1%sds、65℃下杂交且用2xssc、0.1%sds、然后是0.1xssc、0.1%sds来洗涤。杂交需要两个核酸分子含有互补序列,虽然取决于杂交的严格性,但碱基之间的错配也是可能的。用于使核酸杂交的适当严格性取决于核酸的长度和互补程度,这些变量是本领域中公知的。两个核苷酸序列之间的相似度或同源性越大,具有那些序列的核酸的杂交体的tm值就越大。核酸杂交的相对稳定性(对应于较高tm)按以下顺序下降:rna:rna、dna:rna、dna:dna。对于大于100个核苷酸长度的杂交体,已经推导出计算tm的方程式。对于与较短核酸(即e.寡核苷酸)的杂交,错配位置变得更重要,且寡核苷酸的长度决定其特异性。在一个实施方案中,可杂交核酸的长度为至少约10个核苷酸。优选地,可杂交核酸的最小长度为至少约15个核苷酸;更优选,至少约20个核苷酸;且最优选,长度为至少30个核苷酸。此外,熟练技术人员将认识到,温度和洗涤溶液盐浓度可根据如探针长度等因素在必要时进行调整。本文所述的核酸分子编码分离的异源蛋白,其与分离的异源蛋白的氨基酸序列具有至少约70%至75%同一性;与分离的异源蛋白的氨基酸序列具有至少约80%、85%或90%同一性;或与分离的异源蛋白的氨基酸序列具有至少约95%、96%、97%、98%、99%或100%同一性。合适的核酸片段与本文报道的核酸序列具有至少约70%、75%或80%同一性;与本文报道的核酸序列具有至少约80%、85%或90%同一性;或与本文报道的核酸序列具有至少约95%、96%、97%、98%、99%或100%同一性。合适的核酸片段不仅具有上述同一性/相似性,而且通常编码具有至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸或至少250个氨基酸的蛋白质。本文所述的核酸分子包含分离的异源蛋白的编码区及其变体和片段。dna或rna“编码区”是当被置于适当的调控序列控制下在细胞中体外或体内转录和/或翻译为多肽的dna或rna分子。“合适的调控区”是指位于编码区上游(5'非编码序列)、之中或下游(3'非编码序列)的核酸区域,其影响相关编码区的转录、rna加工或稳定性、或翻译。调控区可包括启动子、翻译前导序列、rna加工位点、效应子结合位点及茎-环结构。编码区的边界是由5'(氨基)末端处的起始密码子与3'(羧基)末端处的翻译终止密码子决定。编码区可包括但不限于原核区、来自mrna的cdna、基因组dna分子、合成dna分子或rna分子。如果编码区意图用于在真核细胞中表达,那么多腺苷酸化信号和转录终止序列通常将位于编码区的3'。在一个实施方案中,编码区可被称为开放阅读框。“开放阅读框”缩写为orf且意指dna、cdna或rna的一段核酸,其包含翻译起始信号或起始密码子,如atg或aug;和终止密码子,并且可潜在地被翻译成多肽序列。本文所述的核酸分子可包含转录和/或翻译控制区。“转录和翻译控制区”为dna调控区,如启动子、增强子、终止子等,其提供编码区在宿主细胞中的表达。在真核细胞中,多腺苷酸化信号为控制区。另一方面,本公开涉及包含本文所述的核酸分子的载体、用本文所述的载体进行基因工程改造的宿主细胞以及通过重组技术实现的异源蛋白产生。宿主细胞可用载体进行基因工程改造(转导、转化或转染),载体可为例如克隆载体、整合载体或表达载体。载体可例如呈质粒、粘粒、人工染色体、病毒颗粒、噬菌体等形式。基因工程改造的宿主细胞可在常规的营养培养基中培养,所述培养基可视情况经改良以便于激活启动子、选择转化体或扩增本文所述的基因。如温度、ph等培养条件为先前与为了表达而选出的宿主细胞一起使用的那些,且将为普通熟练技术人员显而易见。载体可含有一个或多个可选标记基因以提供为了选择转化宿主细胞的表型性状,例如像ura3、his3、leu2、trp1、lys2或ade2、二氢叶酸还原酶、针对真核细胞培养的新霉素(g418)抗性或博来霉素(zeocin)抗性、或在大肠杆菌中的四环素或氨苄青霉素抗性。载体还可含有用于翻译起始的核糖体结合位点和/或转录终止子。示例性终止子包括但不限于adh3基因的终止子(例如,adh3t,参见,例如seqidno:54)、idp1基因的终止子(例如,idp1t,参见,例如seqidno:55)、dit1基因的终止子(例如,dit1t,参见,例如seqidno:56)以及pma1基因的终止子(例如,pma1t,参见,例如seqidno:57)。载体还可包含用于扩增表达的适当序列。使用重组酵母宿主细胞制备乙醇的方法另一方面,本公开涉及重组酵母宿主细胞和/或分离的异源蛋白从包括淀粉、木质纤维素物质、己糖及戊糖的生物质原料中产生乙醇或其它产物的用途。所述方法可例如通过使生物质原料与重组酵母宿主细胞和/或由重组酵母宿主细胞表达的异源蛋白(如重组裂解酶)接触而实现。发酵产物包括但不限于如乙醇、丁醇、乙酸盐、氨基酸及维生素的产物。许多生物质原料可由重组酵母宿主细胞发酵和/或由修饰的裂解酶处理。在一些实施方案中,底物基于其在水中的溶解度可分成两个类别:可溶性和不溶性。可溶性底物包括α-糊精、纤维糊精或衍生物、羧甲基纤维素(cmc)或羟乙基纤维素(hec)。不溶性底物包括不溶性淀粉(生或胶化)、结晶纤维素、微晶纤维素(aviceltm)、非晶形纤维素如磷酸溶胀纤维素(pasc)、染料或荧光纤维素、及木质纤维素生物质。这些底物一般是高度有序的纤维素材料且因此仅仅微溶。应当理解,合适的木质纤维素材料可为含有可溶性和/或不溶性纤维素的任何原料,其中不溶性纤维素可呈结晶或非结晶形式。在各种实施方案中,木质纤维素生物质包括例如木材、玉米、玉米秸、锯屑、树皮、叶子、农业和林业废物、草类如柳枝稷、反刍动物消化产物、城市废物、造纸厂流出物、基于再生纸的产物(例如像报纸、纸板)或其组合。在一些实施方案中,本公开提供一种通过使生物质原料与重组宿主细胞和/或修饰的裂解酶接触来水解生物质原料(例如,如上所述的生物质原料)的方法。在一些实施方案中,向发酵培养基中添加“外部”修饰的裂解酶的必要性通过本文所述的方法得以降低或取消。所述方法包括将待水解的底物与修饰的裂解酶源合并。在一个实施方案中,待水解的底物为木质纤维素生物质,且在一些实施方案中,其包括淀粉(呈胶化或未加工形式)。修饰的裂解酶可以表达修饰的裂解酶的重组酵母宿主细胞形式提供。此实施方案是有利的,因为其可减少补充具有外部或纯化酶的发酵培养基的需要,同时允许木质纤维素生物质发酵成发酵产物(如乙醇)。替代地(或以组合形式),修饰的裂解酶可以至少部分纯化形式提供。在这样的实施方案中,可能必须进一步提供能够将木质纤维素生物质发酵成发酵产物的酵母细胞。在一些实施方案中,所述方法可用于发酵底物以制备乙醇。在所述方法的一些实施方案中,当底物是淀粉且以胶化形式提供时,第一异源蛋白和/或分离的葡萄糖淀粉酶可具有seqidno:3的氨基酸序列。替代地,当底物是淀粉且以未加工形式提供时,第一异源蛋白和/或葡萄糖淀粉酶可具有seqidno:4的氨基酸序列。在仍又一个实施方案中,当底物是淀粉时,第一异源蛋白和/或葡萄糖淀粉酶可具有seqidno:7的氨基酸序列。乙醇的生产可在以下温度下进行:至少约25℃、约28℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃或约50℃。在一些实施方案中,当耐热性酵母细胞用于方法中时,所述方法可在超过以下的温度下进行:约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃或约50℃。在一些实施方案中,耐热性酵母细胞可在以下温度下由纤维素产生乙醇:约30℃至60℃、约30℃至55℃、约30℃至50℃、约40℃至60℃、约40℃至55℃或约40℃至50℃。在一些实施方案中,所述方法可用于以特定的速率产生乙醇。举例来说,在一些实施方案中,乙醇是以下列速率产生:至少约0.1mg/小时/升、至少约0.25mg/小时/升、至少约0.5mg/小时/升、至少约0.75mg/小时/升、至少约1.0mg/小时/升、至少约2.0mg/小时/升、至少约5.0mg/小时/升、至少约10mg/小时/升、至少约15mg/小时/升、至少约20.0mg/小时/升、至少约25mg/小时/升、至少约30mg/小时/升、至少约50mg/小时/升、至少约100mg/小时/升、至少约200mg/小时/升或至少约500mg/小时/升。可使用本领域中已知的任何方法测量乙醇产生。例如,可使用hplc分析评价发酵样品中的乙醇的量。许多乙醇测定试剂盒是可商购获得的,其使用例如基于醇氧化酶的测定。用于制备重组酵母宿主细胞和分离的异源蛋白的方法本公开还提供一种用于制备稳健的酵母宿主细胞的方法,所述重组酵母宿主细胞能够在适当的条件下表达异源蛋白(例如像裂解酶)。所述方法尤其适用于提高重组酵母宿主细胞的稳健性,所述重组酵母宿主细胞一旦引入编码异源蛋白的异源核酸分子,便会丧失其在高温下生长期间的一定稳健性。此方法的第一步包括提供第一重组酵母宿主细胞,其展现在高温下生长稳健性的降低。第一重组酵母宿主细胞包含第一异源核酸分子,其包括编码第一异源蛋白的第一核酸分子。第一异源核酸分子可包含用于表达第一异源蛋白的调控元件。在一些实施方案中,第一异源蛋白从重组酵母宿主细胞中分泌且,在仍又一个实施方案中,第一异源蛋白是裂解酶(如上所述,例如像葡萄糖淀粉酶或α-淀粉酶)。当与不包含第一异源核酸分子的相应第一酵母宿主细胞相比时,第一重组酵母宿主细胞展现减少的生长(这包括降低的生长速率)。在一些实施方案中,相应的第一酵母宿主细胞可使用与第一异源核酸分子不同的核酸分子表达第一异源蛋白。在另一个实施方案中,相应的第一酵母宿主细胞不是重组的且不包含任何异源核酸分子。当两种酵母细胞在相似条件下培养时,当与相应的第一酵母宿主细胞相比时,第一重组酵母宿主细胞还能够分泌较高量的第一异源蛋白。一旦提供了第一重组酵母宿主细胞,其第一异源核酸分子便被修饰以生成第二异源核酸分子。在一个实施方案中,第一异源核酸分子可被修饰以引入厌氧调节性启动子,所述启动子可操作地连接至编码第一异源蛋白的第一异源核酸分子。在另一个实施方案中,第一异源核酸分子可被修饰以在第一异源蛋白中包含至少一个氨基酸取代(例如,以包含另一个推定的糖基化位点)。在仍又一个实施方案中,第一核酸分子可被修饰以在第一异源蛋白中包含厌氧调节性启动子以及至少一个氨基酸取代。第二异源核酸分子也可通过用一个或一个以上如本文所述的厌氧调节性蛋白置换第一异源核酸分子的启动子而获得。第二异源核酸分子可通过将一个或一个以上如本文所述的厌氧调节性蛋白插入第一异源核酸分子中而获得。包含在第二异源核酸分子中的启动子被可操作地连接至编码异源蛋白的核酸分子。在一些实施方案中,引入第一异源核酸分子中的所述一个或一个以上厌氧启动子位于编码异源蛋白的核酸分子的上游(例如5’)。第二异源核酸分子可通过修饰第一异源核酸分子的核酸序列、特别是编码第一异源蛋白的第一核酸分子的核酸序列而获得。在本公开的上下文中,修饰的第一核酸分子被称为第二核酸分子并且编码第二异源蛋白。第一异源核酸分子的核酸序列中的修饰位于第一核酸分子中并且在第一异源蛋白中引入一个或多个氨基酸取代。氨基酸取代可造成推定的糖基化位点添加到第二异源蛋白中。添加的推定的糖基化位点可位于异源蛋白的n末端区域中(在第一异源蛋白的第一糖基化位点之前或在第一异源蛋白的第一α-螺旋区域之前)。添加的推定的糖基化位点优选地是n-糖基化位点并且可通过用在其侧链中具有羟基氧的氨基酸(例如像丝氨酸、苏氨酸、酪氨酸、羟基赖氨酸或羟基脯氨酸)或用精氨酸取代氨基酸而获得。如本文所示,这种修饰的引入可恢复,且在一些实施方案中,维持在高温下生长的酵母的稳健性。所述方法任选地包括以下步骤:将包含第一异源核酸分子的第一重组酵母宿主细胞的稳健性与包含第二异源核酸分子的第二重组酵母宿主细胞的稳健性相比较。此确定优选在高温下进行。在高温下,第二重组酵母宿主细胞的稳健性当与第一重组酵母宿主细胞的稳健性相比时应该是提高的。如果确定第二重组酵母宿主细胞在高温下不比第一重组酵母宿主细胞更稳健,那么第一重组酵母宿主细胞可用所述方法再处理,并且可引入不同于引入第二重组酵母宿主细胞中的修饰的其它修饰。所述方法还可包括以下步骤:比较由第一和第二重组酵母宿主细胞表达的第一与第二异源蛋白的量和/或活性(例如,酶活性)。第一与第二异源蛋白的量和/或是基本上类似的。如果确定第二异源蛋白的量和/或活性低于第一异源蛋白的量和/或活性,那么第一重组酵母宿主细胞可用所述方法再处理,并且可引入不同于引入第二重组酵母宿主细胞中的修饰的其它修饰。在一些实施方案中,有益的做法是向第二异源核酸分子中引入另外的修饰以进一步提高第二重组酵母宿主细胞对高温的稳健性。所述另外的修饰可例如随机地引入第二异源核酸分子中并针对其进一步改善酵母宿主细胞在高温下的稳健性的能力进行筛选。例如,所述方法可进一步包括由第二重组酵母宿主细胞生成第一代突变重组酵母宿主细胞。这第一代突变重组酵母宿主细胞的每个(当与第二异源核酸分子的核酸序列相比时)在其所具有的异源核酸分子中带有一个或多个修饰。这至少一个修饰优选位于编码异源蛋白的核酸分子中。在一些实施方案中,这些修饰在异源蛋白中引入至少一个氨基酸取代。在第一代突变重组酵母宿主细胞中,有可能相同的修饰被引入一个以上突变体中。在一个实施方案中,第一代突变重组酵母宿主细胞可通过在细胞外生成多个突变的异源核酸分子(例如,使用基于pcr的方法)并在突变重组酵母宿主细胞中引入一个或多个突变的异源核酸分子而获得。在又一个实施方案中,每个突变重组酵母宿主细胞仅引入单拷贝的突变异源核酸分子。在再一个实施方案中,将单拷贝的突变异源核酸分子整合到突变重组酵母宿主细胞的基因组中。如下实施例中所示,有可能使用修饰的酵母菌株以允许将单拷贝的突变异源核酸分子整合到单个fcy1位点处。一旦已经生成了第一代突变重组酵母宿主细胞,便必须确定它们是否编码展现第二异源蛋白的生物活性的“功能性”突变异源蛋白。预期使用随机诱变方法将产生不再展现第二异源蛋白的生物活性的突变的异源蛋白。在本文所述方法的上下文中,术语“生物活性”是指第二异源蛋白的活性。当第二异源蛋白为酶时,其生物活性指的是其酶活性。为了确定哪些突变体具有功能性,所述方法可包括以下步骤:从第一代中选择能够表达具有第二异源蛋白的生物活性的突变异源蛋白的突变重组酵母宿主细胞。第一代突变体将基于以下来选择:它们能够表达与第二异源蛋白相比具有相同或改进的生物活性的突变的异源蛋白。在其中第二异源蛋白编码淀粉酶的实施方案中,可使用与碘蒸气的使用组合的淀粉选择平板来完成选择。然后进一步表征第一代的“功能性”突变体并且可测定它们所表达的突变异源蛋白的氨基酸序列。此测定可例如通过以下操作完成:测定突变异源核酸分子(全部或一部分)的序列并确定突变异源蛋白(全部或一部分)的氨基酸序列。此测定允许选择两个或更多个功能性突变体,其各自表达具有不同氨基酸序列的突变异源蛋白。一旦已选择了两个或更多个功能性突变体,便将由突变异源核酸分子编码的突变异源蛋白的氨基酸修饰组合在单个异源核酸分子(称为第三异源核酸分子)内,然后将其再引入宿主细胞中以产生第三重组酵母宿主细胞。第三重组酵母宿主细胞将因此包含编码第三异源蛋白的第三异源核酸分子,所述第三异源蛋白带有来自第一代的所选突变重组酵母宿主细胞的修饰(例如,氨基酸取代)。然后将第三重组酵母宿主细胞用于产生第二代突变重组酵母宿主细胞并针对其它功能性突变重组酵母宿主细胞进行筛选。因而,所述方法进一步包括由第三重组酵母宿主细胞产生第二代突变重组酵母宿主细胞。这第二代突变重组酵母宿主细胞的每个(当与第三异源核酸分子的核酸序列相比时)在其所具有的异源核酸分子中带有一个或多个修饰。这至少一个修饰优选地位于编码异源蛋白的核酸分子中。在一些实施方案中,这些修饰在异源蛋白中引入至少一个氨基酸取代。在第二代突变重组酵母宿主细胞中,有可能相同的修饰被引入一个以上突变体中。如上所指出,第二代突变重组酵母宿主细胞可通过在细胞外生成多个突变的异源核酸分子(例如,使用基于pcr的方法)并在突变重组酵母宿主细胞中引入一个或多个突变的异源核酸分子而获得。在又一个实施方案中,每个突变重组酵母宿主细胞仅引入单拷贝的突变异源核酸分子。在再一个实施方案中,将单拷贝的突变异源核酸分子整合到突变重组酵母宿主细胞的基因组中。如下实施例中所示,有可能使用经修饰的酵母菌株以允许单拷贝的突变异源核酸分子整合到单个fcy1位点处。一旦已生成了第二代突变重组酵母宿主细胞,便必须确定它们是否编码展现第三异源蛋白的生物活性的“功能性”突变异源蛋白。预期使用随机诱变方法将生成不再展现第三异源蛋白的生物活性的突变的异源蛋白。在本文所述方法的上下文中,术语“生物活性”是指第二异源蛋白的活性。当第三异源蛋白为酶时,其生物活性指的是其酶活性。为了确定哪些突变体具有功能性,所述方法可包括以下步骤:从第二代中选择能够表达具有第三异源蛋白的生物活性的突变异源蛋白的突变重组酵母宿主细胞。第二代突变体将基于以下来选择:它们能够表达与第三异源蛋白相比具有相同或改进的生物活性的突变的异源蛋白。在其中第三异源蛋白编码淀粉酶的实施方案中,可使用与碘蒸气的使用组合的淀粉选择平板来完成选择。然后进一步表征第二代的“功能性”突变体并且可测定它们所表达的突变异源蛋白的氨基酸序列。此测定可例如通过以下操作完成:测定突变异源核酸分子(全部或一部分)的序列并确定突变异源蛋白(全部或一部分)的氨基酸序列。此测定允许选择两个或更多个功能性突变体,其各自表达具有不同氨基酸序列的突变异源蛋白。一旦两个或更多个功能性突变体已选自第二代,便将由突变异源核酸分子编码的突变异源蛋白的氨基酸修饰组合在单个异源核酸分子(称为第四异源核酸分子)内,然后将该异源核酸分子再引入宿主细胞中以产生第四重组酵母宿主细胞。第四重组酵母宿主细胞将因此包含编码第四异源蛋白的第四异源核酸分子,所述第四异源蛋白带有选自第二代的突变重组酵母宿主细胞的修饰(例如,氨基酸取代)。所述方法还可包括由第三、第四及甚至第五代重组酵母宿主细胞产生并选择突变重组酵母宿主细胞。通过参考下列实施例将更容易理解本发明,提供这些实施例来举例说明本发明而不是限制其范围。实施例i–材料和方法菌株构建。葡萄糖淀粉酶基因glu0111-co(seqidno:1)是通过基于来自扣囊复膜酵母(genbank登录号cac83969)的野生型葡萄糖淀粉酶基因glu0111的氨基酸序列形成合成的dna序列(针对酿酒酵母而进行密码子)来设计。首先使用如先前在wo2011/153516和wo2012/138942中所述的基于标准酵母重组的pcr克隆实践将合成的glu0111-co基因装配到酿酒酵母表达质粒中。具体说来,使用定向整合构建在组成型启动子tef2p的控制下表达glu0111-co的菌株,其中glu0111-co的两个拷贝经由与非编码fcy1侧翼序列的同源重组整合到二倍体酿酒酵母宿主菌株的fyc1基因座中。用重叠末端工程改造这些pcr产物以促进体内同源重组。用pcr产物共转化具有潮霉素抗性标记(hph)的2微米质粒以使得能够针对未转化的细胞进行选择。首先将转化的细胞在ypd+潮霉素(300μg/ml)肉汤中培养过夜,然后铺板于含有5-氟胞嘧啶的培养基上以针对fcy1进行选择并且将glu0111-co盒同时装配并整合到染色体中。类似地,使用相同方法构建在厌氧受控tdh1启动子的控制下表达glu0111-co的菌株,但使用天然酿酒酵母idp1终止子序列代替adh3终止子。使用相同方法构建表达glu0111-co基因的4个拷贝的菌株,然而,将所述构建体反转以形成会聚定向以便促进稳定性并防止可造成glu0111-co序列重组的序列同源性。表g.用于构建两拷贝和四拷贝菌株的引物由tef2p/adh3t调控的2拷贝glu011-co盒由tdh1p/idp1t调控的2拷贝glu011-co盒由tef2p/adh3t和hxt7p/pma1t调控的4拷贝glu0111-co盒由tef2p/adh3t和hxt7p/pma1t调控的4拷贝glu0111-co盒由pau5p/dit1t和tdh1p/idp1t调控的4拷贝glu0111-co盒由pau5p/dit1t和tdh1p/idp1t调控的4拷贝glu0111-co盒各种工程改造的盒的图谱示于图5b至图5e中。淀粉测定表征。对于表达分泌的淀粉酶和葡萄糖淀粉酶的菌株的评估,进行基于平板的淀粉测定。目标菌株在ypd中生长24-72h。然后将培养物在3000rpm下离心以将细胞从含有分泌酶的培养上清液中分离。接着将上清液添加到在50mm乙酸钠缓冲液(ph5.0)中的1%玉米淀粉溶液中。对于胶化淀粉测定,将玉米淀粉溶液在99℃下加热5分钟。对于生淀粉测定,不包括加热步骤。使用4:1淀粉溶液:上清液比率进行测定并在35℃下培育1-4h。使用二硝基水杨酸试剂溶液(dns)方法,使用2:1dns:淀粉测定比率测量还原糖并且在100℃下沸腾5分钟。在540nm下测量吸光度。酶标仪(生长)测定。使用biotek酶标仪进行生长测定以在动力学上监测od600nm。将细胞在ypd中培养过夜并于新鲜培养基中以大约1:1000稀释,从而获得0.01的初始od。在厌氧室中,在38℃下进行高温生长测定持续24-48h。实施例ii–用于提高高温稳健性的厌氧启动子此实施例中使用的一些材料和方法示于实施例i中。将带有密码子优化型式的扣囊复膜酵母glu0111葡萄糖淀粉酶基因(例如,seqidno:5,参见wo2011/153516)的酿酒酵母整合到工业用酵母宿主中并且测定各种启动子类型对生长、葡萄糖淀粉酶产生及活性的影响。首先,将强组成型启动子(例如,tef2基因的组成型启动子(在本文中称为“tef2p”))与厌氧调节性启动子(例如,来自tdh1基因的厌氧调节性启动子,在本文中称为“tdh1p”)相比以驱使扣囊复膜酵母glu0111葡萄糖淀粉酶基因在酿酒酵母中的表达。如图1中所示,在高温下,使用组成型启动子tef2p致使转基因酵母菌株的生长速率与使用厌氧调节性tdh1p启动子的那些相比减小(也称为稳健性降低)。用其它组成型启动子(cwp2p、ssa1p、eno1p、pgk1p)得到的结果表明,观察到在高温下相似的生长减少(数据未示出)。然后在需氧和厌氧条件下测定两种菌株的降解分泌淀粉的活性。如图2所示,在厌氧条件下,使用厌氧调节性tdh1p启动子产生比组成型tef2p启动子更高的淀粉降解活性。其次,已关于允许扣囊复膜酵母glu0111葡萄糖淀粉酶基因在转基因酿酒酵母中的分泌的能力对另外的启动子(pau5基因的酿酒酵母厌氧调节性启动子(例如,“pau5p”)或htx7基因的酿酒酵母葡萄糖调节性启动子(例如,“htx7p”))进行筛选。如图3所示,在厌氧条件下,使用厌氧调节性tdh1p启动子产生比所测试的其它启动子更高的淀粉降解活性。再者,已将启动子组合(tef2p与hxt7p或pau5p与tdh1p)并且测定它们对葡萄糖淀粉酶在转基因酿酒酵母中的产生的影响。如图4a-图4b所示,在厌氧条件下,pau5p与tdh1p启动子的组合增加葡萄糖淀粉酶蛋白产生(图4a),同时保持高温下的稳健性(图4b)。实施例iii–耐热性葡萄糖淀粉酶突变体此实施例中使用的一些材料和方法示于实施例i中。重复组合诱变。此过程涉及经由易错pcr的多轮随机诱变,其中筛选单个突变并且在组合之前单独评估以评估叠加效应。使用可商购获得的clontechdiversifytmpcr随机诱变试剂盒进行易错pcr。选择条件以靶向每1kb大约2.7个突变(由缓冲条件确定的体积:pcr级水38μl;10xtitaniumtmtaq缓冲液5μl;8mmmnso43μl;2mmdgtp1μl;50xdiversifytmdntp混合物1μl;引物混合物1μl;模板dna1μl;titaniumtmtaq聚合酶1μl)。设置易错反应以便仅扩增野生型扣囊复膜酵母glu0111基因(seqidno:5)的开放阅读框。同时,使用常规taq聚合酶设置反应以扩增调控元件(tef2基因的启动子(tef2p,seqidno:8)和adh3基因的终止子(adh3t,seqidno:54)。这些元件被转化进酿酒酵母菌株m4251的fcy1位点,所述菌株即一种被工程改造以仅具有一个fcy1位点以便每细胞仅整合一个突变构建体的菌株。先前用clonattm抗生素标记(诺尔丝菌素)标记fcy1等位基因的第二拷贝以防止二次整合,因此,将整合并评估仅一个突变型式的glu0111基因(参见图5a)。使用酵母介导的连接将pcr产物转化到m4251宿主细胞中。一旦随机突变体已转化,便在含有淀粉(0.5%玉米淀粉)、clonattm(100μg/ml)及5-氟胞嘧啶(100μg/ml的5-fc)的ypd平板上选择菌落,是针对fcy1基因的缺失和clonattm基因的保持来对其选择。在35℃下生长24h之后,在大约0.5g干燥的碘片存在下培育选择性平板。碘蒸气使淀粉的直链淀粉组分染色,从而形成暂时的蓝色。然而,碘蒸气避免菌落之间的任何交叉污染并且允许目测已成功地分泌功能性葡萄糖淀粉酶(其形成透明带)的菌落(图6)。透明带使得能够便于区分转化体,对比具有非功能突变的转化体,一些转化体已接受功能性突变体。仅挑取功能性突变体以便于使用胶化淀粉测定来进一步分析,从而测量降解分泌淀粉的活性。在两个连续轮次的易错pcr之后,单独筛选顶部突变体并且对其测序以鉴别它们的开放阅读框中的点突变(参见图7和表b)。然后将一些突变组合到单个开放阅读框中以设计高分泌葡萄糖淀粉酶突变体。然而,这些突变的组合破坏转基因菌株在高温下的生长(参见如图8所述,当与菌株m2390相比时,由菌株m6423获得的结果)。为了减少温度稳健性的损失,将糖基化位点引入n末端区域附近(通过将残基40定向突变为天冬酰胺残基)。此额外糖基化位点的引入不仅提供分泌活性的轻微上升(参见图4a-图4b中当与菌株m8841相比时,由菌株m9694和m10052获得的结果),而且恢复高温生长(参见图11a-图11b中当与菌株m6423相比时,由菌株m8861获得的结果)。观察到mp738中的突变影响对生淀粉底物的活性(图10a-图10c)。蛋白质分析鉴别出两个突变位于推定的淀粉结合域内(例如,引入糖基化位点nx[s/t]的天冬酰胺取代(g36n)和突变f487i,其已经由同源性建模显示位于g36n的内),由此可解释对生淀粉的此活性降低。为了减轻此活性损失,将n端糖基化位点整合到野生型扣囊复膜酵母葡萄糖淀粉酶(seqidno:1)中。通过蛋白质的n末端区域的序列分析鉴别潜在的突变。包括取代天冬酰胺、丝氨酸或苏氨酸的单个突变,其将产生n-连接的糖基化位点基序nx[s/t]。目标区限于在第一天然存在的n-连接的糖基化基序之前的氨基酸,或由同源性建模/二级结构预测服务器(如果不存在其它糖基化位点的话)所确定的第一α-螺旋的开始。在此测定之后,构建所有可能的突变体,然后评估活性及细胞稳健性影响。设计在位置40处带有被天冬酰胺残基取代的氨基酸残基的若干酵母菌株。此定向突变改善了分泌活性(图10a至图10c),而不影响高温生长(图11a和图11b)。实施例iv-耐热性α-淀粉酶突变体此实施例中使用的一些材料和方法示于实施例i中。糖基化位点的添加也成功地恢复了显著生长缺陷,同时还有mp85α-淀粉酶的表达(图12),表明其可适用于多种糖解酶。实施例v-乙醇发酵此实施例中使用的一些材料和方法示于实施例i中。使用添加有500ppm尿素的34%总固体(ts),用酿酒酵母菌株m10624、m10156或m2390进行发酵。在发酵期间添加商用生淀粉酶(对于m2390,添加0.427μl/gts商用生淀粉酶;对于m10156是0.171μl/gts且对于mm8841是0.043μl/gts)。使用0.3g/l干细胞重量的接种物。发酵持续88h。在发酵期间,温度保持在32℃下持续24h,然后降至30℃持续发酵的剩余时间。通过hplc分析样品的乙醇浓度。如图13所示,在这些实验条件下,菌株m10624和m10156产生相似的乙醇产率。虽然本发明已经结合其具体实施方案进行了描述,但应当理解,权利要求书的范围不限于实施例中列出的优选实施方案,而应按照整体描述给予最宽的解释。参考文献gasserb,saloheimom,rinasu,dragositsm,rodriguez-carmonae,baumannk,giulianim,parrillie,branduardip,langc,porrod,ferrerp,tutinoml,mattanovichd,villaverdea.proteinfoldingandconformationalstressinmicrobialcellsproducingrecombinantproteins:ahostcomparativeoverview.microbcellfact.2008apr4;7:11.idirisa,tohdah,kumagaih,takegawak.engineeringofproteinsecretioninyeast:strategiesandimpactonproteinproduction.applmicrobiolbiotechnol.2010mar;86(2):403-17.kwastke,lailc,mendan,jamesdt3rd,arefs,burkepv.genomicanalysesofanaerobicallyinducedgenesinsaccharomycescerevisiae:functionalrolesofrox1andotherfactorsinmediatingtheanoxicresponse.jbacteriol.2002jan;184(1):250-65.martinezjl,liul,petranovicd,nielsenj.pharmaceuticalproteinproductionbyyeast:towardsproductionofhumanbloodproteinsbymicrobialfermentation.curropinbiotechnol.2012dec;23(6):965-71.mattanovichd,gasserb,hohenblumh,sauerm.stressinrecombinantproteinproducingyeasts.jbiotechnol.2004sep30;113(1-3):121-35.taisl,boervm,daran-lapujadep,walshmc,dewindejh,daranjm,pronkjt.two-dimensionaltranscriptomeanalysisinchemostatcultures.combinatoriaeffectsofoxygenavailabilityandmacronuthentlimitationinsaccharomycecerevisiae.jbiolchem.2005jan7;280(1):437-47.terlindejj,liangh,davisrw,steensmahy,vandijkenjp,pronkjt.genome-widetranscriptionalanalysis0faerobicandanaerobicchemostatculturesofsaccharomycescerevisiae.jbacteriol.1999dec;181(24):7409-13.序列表<110>拉勒曼德匈牙利流动性管理有限责任公司(lallemandhungaryliquiditymanagementllc)<120>在高温下表达和分泌异源蛋白的酵母菌株<130>55729550-3pct<150>62/214,412<151>2015-09-04<150>62/299,897<151>2016-02-25<160>57<170>patentin3.5版<210>1<211>515<212>prt<213>扣囊复膜酵母(saccharomycopsisfibuligera)<400>1metileargleuthrvalpheleuthralavalphealaalavalala151015sercysvalprovalgluleuasplysargasnthrglyhisphegln202530alatyrserglytyrthrvalalaargserasnphethrglntrpile354045hisgluglnproalavalsertrptyrtyrleuleuglnasnileasp505560tyrprogluglyglnphelysseralalysproglyvalvalvalala65707580serproserthrsergluproasptyrphetyrglntrpthrargasp859095thralailethrpheleuserleuilealagluvalgluasphisser100105110pheserasnthrthrleualalysvalvalglutyrtyrileserasn115120125thrtyrthrleuglnargvalserasnproserglyasnpheaspser130135140proasnhisaspglyleuglygluprolyspheasnvalaspaspthr145150155160alatyrthralasertrpglyargproglnasnaspglyproalaleu165170175argalatyralaileserargtyrleuasnalavalalalyshisasn180185190asnglylysleuleuleualaglyglnasnglyileprotyrserser195200205alaseraspiletyrtrplysileilelysproaspleuglnhisval210215220serthrhistrpserthrserglypheaspleutrpglugluasngln225230235240glythrhisphephethralaleuvalglnleulysalaleusertyr245250255glyileproleuserlysthrtyrasnaspproglyphethrsertrp260265270leuglulysglnlysaspalaleuasnsertyrileasnsersergly275280285phevalasnserglylyslyshisilevalgluserproglnleuser290295300serargglyglyleuaspseralathrtyrilealaalaleuilethr305310315320hisaspileglyaspaspaspthrtyrthrpropheasnvalaspasn325330335sertyrvalleuasnserleutyrtyrleuleuvalaspasnlysasn340345350argtyrlysileasnglyasntyrlysalaglyalaalavalglyarg355360365tyrprogluaspvaltyrasnglyvalglythrsergluglyasnpro370375380trpglnleualathralatyralaglyglnthrphetyrthrleuala385390395400tyrasnserleulysasnlyslysasnleuvalileglulysleuasn405410415tyraspleutyrasnserpheilealaaspleuserlysileaspser420425430sertyralaserlysaspserleuthrleuthrtyrglyseraspasn435440445tyrlysasnvalilelysserleuleuglnpheglyaspserpheleu450455460lysvalleuleuasphisileaspaspasnglyglnleuthrgluglu465470475480ileasnargtyrthrglypheglnalaglyalavalserleuthrtrp485490495serserglyserleuleuseralaasnargalaargasnlysleuile500505510gluleuleu515<210>2<211>515<212>prt<213>人工序列(artificialsequence)<220><221>mutagen<223>seqidno:9的突变型式<220><221>variant<222>(8)..(8)<223>除l外的任何氨基酸,优选为s<220><221>variant<222>(11)..(11)<223>除f外的任何氨基酸,优选为i<220><221>variant<222>(12)..(12)<223>xaa可为任何天然存在的氨基酸<220><221>variant<222>(36)..(36)<223>除g外的任何氨基酸,优选为n、s、t、y、k、p、w<220><221>variant<222>(40)..(40)<223>除a外的任何氨基酸,优选为n、s、t、y、k、p、w<220><221>variant<222>(101)..(101)<223>除f外的任何氨基酸,优选为l<220><221>variant<222>(277)..(277)<223>除k外的任何氨基酸,优选为e<220><221>variant<222>(487)..(487)<223>除f外的任何氨基酸,优选为i<400>2metileargleuthrvalphexaathralavalxaaalaalavalala151015sercysvalprovalgluleuasplysargasnthrglyhisphegln202530alatyrserxaatyrthrvalxaaargserasnphethrglntrpile354045hisgluglnproalavalsertrptyrtyrleuleuglnasnileasp505560tyrprogluglyglnphelysseralalysproglyvalvalvalala65707580serproserthrsergluproasptyrphetyrglntrpthrargasp859095thralailethrxaaleuserleuilealagluvalgluasphisser100105110pheserasnthrthrleualalysvalvalglutyrtyrileserasn115120125thrtyrthrleuglnargvalserasnproserglyasnpheaspser130135140proasnhisaspglyleuglygluprolyspheasnvalaspaspthr145150155160alatyrthralasertrpglyargproglnasnaspglyproalaleu165170175argalatyralaileserargtyrleuasnalavalalalyshisasn180185190asnglylysleuleuleualaglyglnasnglyileprotyrserser195200205alaseraspiletyrtrplysileilelysproaspleuglnhisval210215220serthrhistrpserthrserglypheaspleutrpglugluasngln225230235240glythrhisphephethralaleuvalglnleulysalaleusertyr245250255glyileproleuserlysthrtyrasnaspproglyphethrsertrp260265270leuglulysglnxaaaspalaleuasnsertyrileasnsersergly275280285phevalasnserglylyslyshisilevalgluserproglnleuser290295300serargglyglyleuaspseralathrtyrilealaalaleuilethr305310315320hisaspileglyaspaspaspthrtyrthrpropheasnvalaspasn325330335sertyrvalleuasnserleutyrtyrleuleuvalaspasnlysasn340345350argtyrlysileasnglyasntyrlysalaglyalaalavalglyarg355360365tyrprogluaspvaltyrasnglyvalglythrsergluglyasnpro370375380trpglnleualathralatyralaglyglnthrphetyrthrleuala385390395400tyrasnserleulysasnlyslysasnleuvalileglulysleuasn405410415tyraspleutyrasnserpheilealaaspleuserlysileaspser420425430sertyralaserlysaspserleuthrleuthrtyrglyseraspasn435440445tyrlysasnvalilelysserleuleuglnpheglyaspserpheleu450455460lysvalleuleuasphisileaspaspasnglyglnleuthrgluglu465470475480ileasnargtyrthrglyxaaglnalaglyalavalserleuthrtrp485490495serserglyserleuleuseralaasnargalaargasnlysleuile500505510gluleuleu515<210>3<211>515<212>prt<213>人工序列(artificialsequence)<220><221>mutagen<223>mp738<400>3metileargleuthrvalpheserthralavalilealaalavalala151015sercysvalprovalgluleuasplysargasnthrglyhisphegln202530alatyrserasntyrthrvalalaargserasnphethrglntrpile354045hisgluglnproalavalsertrptyrtyrleuleuglnasnileasp505560tyrprogluglyglnphelysseralalysproglyvalvalvalala65707580serproserthrsergluproasptyrphetyrglntrpthrargasp859095thralailethrleuleuserleuilealagluvalgluasphisser100105110pheserasnthrthrleualalysvalvalglutyrtyrileserasn115120125thrtyrthrleuglnargvalserasnproserglyasnpheaspser130135140proasnhisaspglyleuglygluprolyspheasnvalaspaspthr145150155160alatyrthralasertrpglyargproglnasnaspglyproalaleu165170175argalatyralaileserargtyrleuasnalavalalalyshisasn180185190asnglylysleuleuleualaglyglnasnglyileprotyrserser195200205alaseraspiletyrtrplysileilelysproaspleuglnhisval210215220serthrhistrpserthrserglypheaspleutrpglugluasngln225230235240glythrhisphephethralaleuvalglnleulysalaleusertyr245250255glyileproleuserlysthrtyrasnaspproglyphethrsertrp260265270leuglulysglngluaspalaleuasnsertyrileasnsersergly275280285phevalasnserglylyslyshisilevalgluserproglnleuser290295300serargglyglyleuaspseralathrtyrilealaalaleuilethr305310315320hisaspileglyaspaspaspthrtyrthrpropheasnvalaspasn325330335sertyrvalleuasnserleutyrtyrleuleuvalaspasnlysasn340345350argtyrlysileasnglyasntyrlysalaglyalaalavalglyarg355360365tyrprogluaspvaltyrasnglyvalglythrsergluglyasnpro370375380trpglnleualathralatyralaglyglnthrphetyrthrleuala385390395400tyrasnserleulysasnlyslysasnleuvalileglulysleuasn405410415tyraspleutyrasnserpheilealaaspleuserlysileaspser420425430sertyralaserlysaspserleuthrleuthrtyrglyseraspasn435440445tyrlysasnvalilelysserleuleuglnpheglyaspserpheleu450455460lysvalleuleuasphisileaspaspasnglyglnleuthrgluglu465470475480ileasnargtyrthrglyileglnalaglyalavalserleuthrtrp485490495serserglyserleuleuseralaasnargalaargasnlysleuile500505510gluleuleu515<210>4<211>515<212>prt<213>人工序列(artificialsequence)<220><221>mutagen<223>mp743<400>4metileargleuthrvalpheleuthralavalphealaalavalala151015sercysvalprovalgluleuasplysargasnthrglyhisphegln202530alatyrserglytyrthrvalasnargserasnphethrglntrpile354045hisgluglnproalavalsertrptyrtyrleuleuglnasnileasp505560tyrprogluglyglnphelysseralalysproglyvalvalvalala65707580serproserthrsergluproasptyrphetyrglntrpthrargasp859095thralailethrpheleuserleuilealagluvalgluasphisser100105110pheserasnthrthrleualalysvalvalglutyrtyrileserasn115120125thrtyrthrleuglnargvalserasnproserglyasnpheaspser130135140proasnhisaspglyleuglygluprolyspheasnvalaspaspthr145150155160alatyrthralasertrpglyargproglnasnaspglyproalaleu165170175argalatyralaileserargtyrleuasnalavalalalyshisasn180185190asnglylysleuleuleualaglyglnasnglyileprotyrserser195200205alaseraspiletyrtrplysileilelysproaspleuglnhisval210215220serthrhistrpserthrserglypheaspleutrpglugluasngln225230235240glythrhisphephethralaleuvalglnleulysalaleusertyr245250255glyileproleuserlysthrtyrasnaspproglyphethrsertrp260265270leuglulysglnlysaspalaleuasnsertyrileasnsersergly275280285phevalasnserglylyslyshisilevalgluserproglnleuser290295300serargglyglyleuaspseralathrtyrilealaalaleuilethr305310315320hisaspileglyaspaspaspthrtyrthrpropheasnvalaspasn325330335sertyrvalleuasnserleutyrtyrleuleuvalaspasnlysasn340345350argtyrlysileasnglyasntyrlysalaglyalaalavalglyarg355360365tyrprogluaspvaltyrasnglyvalglythrsergluglyasnpro370375380trpglnleualathralatyralaglyglnthrphetyrthrleuala385390395400tyrasnserleulysasnlyslysasnleuvalileglulysleuasn405410415tyraspleutyrasnserpheilealaaspleuserlysileaspser420425430sertyralaserlysaspserleuthrleuthrtyrglyseraspasn435440445tyrlysasnvalilelysserleuleuglnpheglyaspserpheleu450455460lysvalleuleuasphisileaspaspasnglyglnleuthrgluglu465470475480ileasnargtyrthrglypheglnalaglyalavalserleuthrtrp485490495serserglyserleuleuseralaasnargalaargasnlysleuile500505510gluleuleu515<210>5<211>1548<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>针对在酿酒酵母中表达seqidno:1的密码子优化序列<400>5atgatcagattgaccgttttcttgaccgctgtttttgctgctgttgcttcttgtgttcca60gttgaattggataagagaaacaccggtcatttccaagcttattctggttataccgttgct120agatctaacttcacccaatggattcatgaacaaccagctgtttcttggtactacttgttg180caaaacatcgattacccagaaggtcaattcaaatctgctaaaccaggtgttgttgttgct240tctccatctacatctgaaccagattacttctaccaatggactagagataccgctattacc300ttcttgtccttgattgctgaagttgaagatcattctttctccaacactaccttggctaag360gttgtcgaatattacatttccaacacctacaccttgcaaagagtttctaatccatccggt420aacttcgattctccaaatcatgatggtttgggtgaacctaagttcaacgttgatgatact480gcttatacagcttcttggggtagaccacaaaatgatggtccagctttgagagcttacgct540atttctagatacttgaacgctgttgctaagcacaacaacggtaaattattattggccggt600caaaacggtattccttattcttctgcttccgatatctactggaagattattaagccagac660ttgcaacatgtttctactcattggtctacctctggttttgatttgtgggaagaaaatcaa720ggtactcatttcttcaccgctttggttcaattgaaggctttgtcttacggtattccattg780tctaagacctacaatgatccaggtttcacttcttggttggaaaaacaaaaggatgccttg840aactcctacattaactcttccggtttcgttaactctggtaaaaagcacatcgttgaatct900ccacaattgtcatctagaggtggtttggattctgctacttatattgctgccttgatcacc960catgatatcggtgatgatgatacttacaccccattcaatgttgataactcctacgttttg1020aactccttgtattacctattggtcgacaacaagaacagatacaagatcaacggtaactac1080aaagctggtgctgctgttggtagatatcctgaagatgtttacaacggtgttggtacttct1140gaaggtaatccatggcaattggctactgcttatgctggtcaaactttttacaccttggcc1200tacaattccttgaagaacaagaagaacttggtcatcgaaaagttgaactacgacttgtac1260aactccttcattgctgatttgtccaagattgattcttcctacgcttctaaggattctttg1320actttgacctacggttccgataactacaagaacgttatcaagtccttgttgcaattcggt1380gactcattcttgaaggttttgttggatcacatcgatgacaacggtcaattgactgaagaa1440atcaacagatacaccggttttcaagctggtgcagtttctttgacttggtcatctggttct1500ttgttgtctgctaatagagccagaaacaagttgatcgaattattgtga1548<210>6<211>652<212>prt<213>解淀粉芽孢杆菌(bacillusamyloliquefaciens)<400>6metleuleuglnalapheleupheleuleualaglyphealaalalys151015ileseralaglyproalaalaalaasnalagluthralaasnlysser202530asnlysvalthralaserservallysasnglythrileleuhisala354045trpasntrpserpheasnthrleuthrglnasnmetlysaspilearg505560aspalaglytyralaalaileglnthrserproileasnglnvallys65707580gluglyasnglnglyasplyssermetargasntrptyrtrpleutyr859095glnprothrsertyrglnileglyasnargtyrleuglythrglugln100105110gluphelysaspmetcysalaalaalaglulystyrglyvallysval115120125ilevalaspalavalileasnhisthrthrserasptyrglyalaile130135140seraspgluilelysargileproasntrpthrhisglyasnthrgln145150155160ilelysasntrpseraspargtrpaspvalthrglnasnserleuleu165170175glyleutyrasptrpasnthrglnasnthrgluvalglnvaltyrleu180185190lysargpheleugluargalaleuasnaspglyalaaspglyphearg195200205tyraspalaalalyshisilegluleuproaspaspglyasntyrgly210215220serglnphetrpproasnilethrasnthrseralaglupheglntyr225230235240glygluileleuglnaspseralaserargaspthralatyralaasn245250255tyrmetasnvalthralaserasntyrglyhisserileargserala260265270leulysasnargasnleuservalserasnileserhistyralaser275280285aspvalseralaasplysleuvalthrtrpvalgluserhisaspthr290295300tyralaasnaspaspglugluserthrtrpmetseraspaspaspile305310315320argleuglytrpalavalileglyserargserglyserthrproleu325330335phepheserargprogluglyglyglyasnglyvalargpheprogly340345350lysserglnileglyaspargglyseralaleuphelysaspglnala355360365ilethralavalasnthrphehisasnvalmetalaglyglnproglu370375380gluleuserasnproasnglyasnasnglnvalphemetasnglnarg385390395400glyserlysglyvalvalleualaasnalaglyserserservalthr405410415ileasnthrseralalysleuproaspglyargtyraspasnargala420425430glyalaglyserpheglnvalalaasnglylysleuthrglythrile435440445asnalaargseralaalavalleutyrproaspaspileglyasnala450455460prohisvalpheleugluasntyrglnthrglyalavalhisserphe465470475480asnaspglnleuthrvalthrleuargalaasnalalysthrthrlys485490495alavaltyrglnileasnasnglyglnglnthralaphelysaspgly500505510aspargleuthrileglylysglyaspproileglythrthrtyrasn515520525ilelysleuthrglythrasnglygluglyalaalaargthrglnglu530535540tyrthrphevallyslysaspproserglnthrasnileileglytyr545550555560glnasnproasphistrpglyglnvalasnalatyriletyrlyshis565570575aspglyglyargalailegluleuthrglysertrpproglylysala580585590metthrlysasnalaasnglymettyrthrleuthrleuprogluasn595600605thraspthralaasnalalysvalilepheasnasnglyseralagln610615620valproglyglnasnglnproglypheasptyrvalglnasnglyleu625630635640tyrasnasnserglyleuasnglytyrleuprohis645650<210>7<211>652<212>prt<213>人工序列(artificialsequence)<220><221>mutagen<223>mp775<400>7metleuleuglnalapheleupheleuleualaglyphealaalalys151015ileseralaglyproalaalaalaasnalagluthralaasnlysser202530asnasnvalthralaserservallysasnglythrileleuhisala354045trpasntrpserpheasnthrleuthrglnasnmetlysaspilearg505560aspalaglytyralaalaileglnthrserproileasnglnvallys65707580gluglyasnglnglyasplyssermetargasntrptyrtrpleutyr859095glnprothrsertyrglnileglyasnargtyrleuglythrglugln100105110gluphelysaspmetcysalaalaalaglulystyrglyvallysval115120125ilevalaspalavalileasnhisthrthrserasptyrglyalaile130135140seraspgluilelysargileproasntrpthrhisglyasnthrgln145150155160ilelysasntrpseraspargtrpaspvalthrglnasnserleuleu165170175glyleutyrasptrpasnthrglnasnthrgluvalglnvaltyrleu180185190lysargpheleugluargalaleuasnaspglyalaaspglyphearg195200205tyraspalaalalyshisilegluleuproaspaspglyasntyrgly210215220serglnphetrpproasnilethrasnthrseralaglupheglntyr225230235240glygluileleuglnaspseralaserargaspthralatyralaasn245250255tyrmetasnvalthralaserasntyrglyhisserileargserala260265270leulysasnargasnleuservalserasnileserhistyralaser275280285aspvalseralaasplysleuvalthrtrpvalgluserhisaspthr290295300tyralaasnaspaspglugluserthrtrpmetseraspaspaspile305310315320argleuglytrpalavalileglyserargserglyserthrproleu325330335phepheserargprogluglyglyglyasnglyvalargpheprogly340345350lysserglnileglyaspargglyseralaleuphelysaspglnala355360365ilethralavalasnthrphehisasnvalmetalaglyglnproglu370375380gluleuserasnproasnglyasnasnglnvalphemetasnglnarg385390395400glyserlysglyvalvalleualaasnalaglyserserservalthr405410415ileasnthrseralalysleuproaspglyargtyraspasnargala420425430glyalaglyserpheglnvalalaasnglylysleuthrglythrile435440445asnalaargseralaalavalleutyrproaspaspileglyasnala450455460prohisvalpheleugluasntyrglnthrglyalavalhisserphe465470475480asnaspglnleuthrvalthrleuargalaasnalalysthrthrlys485490495alavaltyrglnileasnasnglyglnglnthralaphelysaspgly500505510aspargleuthrileglylysglyaspproileglythrthrtyrasn515520525ilelysleuthrglythrasnglygluglyalaalaargthrglnglu530535540tyrthrphevallyslysaspproserglnthrasnileileglytyr545550555560glnasnproasphistrpglyglnvalasnalatyriletyrlyshis565570575aspglyglyargalailegluleuthrglysertrpproglylysala580585590metthrlysasnalaasnglymettyrthrleuthrleuprogluasn595600605thraspthralaasnalalysvalilepheasnasnglyseralagln610615620valproglyglnasnglnproglypheasptyrvalglnasnglyleu625630635640tyrasnasnserglyleuasnglytyrleuprohis645650<210>8<211>499<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>tef2p<400>8gggcgccataaccaaggtatctatagaccgccaatcagcaaactacctccgtacattcct60gttgcacccacacatttatacacccagaccgcgacaaattacccataaggttgtttgtga120cggcgtcgtacaagagaacgtgggaactttttaggctcaccaaaaaagaaaggaaaaata180cgagttgctgacagaagcctcaagaaaaaaaaaattcttcttcgactatgctggagccag240agatgatcgagccggtagttaactatatatagctaaattggttccatcaccttcttttct300ggtgtcgctccttctagtgctatttctggcttttcctatttttttttttccatttttctt360tctctctttctaatatataaattctcttgcattttctatttttctctctatctattctac420ttgtttattcccttcaaggttttttttaaggactacttgtttttagaatatacggtcaac480gaactataattaactaaac499<210>9<211>750<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>tdh1p<400>9agaaacgaatgtatatgctcatttacactctatatcaccatatggaggataagttgggct60gagcttctgatccaatttattctatccattagttgctgatatgtcccaccagccaacact120tgatagtatctactcgccattcacttccagcagcgccagtagggttgttgagcttagtaa180aaatgtgcgcaccacaagcctacatgactccacgtcacatgaaaccacaccgtggggcct240tgttacgctaggaataggatatgcgacgaagacgcttctgcttagtaaccacaccacatt300ttcaaggggtcgatctgcttgcttcctttactgtcacgagcggcccataatcgcgctttt360tttttaaaatgcgcgagacagcaaacaggaagctcgggtttcaaccttcggagtggtcgc420agatctggagactggatccttacaatacagtaaggcaagccaccatctgcttcttaggtg480catgcgacggtatccacgtgcagaacaacatagtctgaagaagggggggaggagcatgtt540cattctctgtagcactaagagcttggtgataatgaccaaaactggagtctcgaaatcata600taaatagacaatatattttcacacaatgtgatttgtagtacagttctactctctctcttg660cataaataagaaattcatcaagaacttggtttgatatttcaccaacacacacaaaaaaca720gtacttcactaaatttacacacaaaacaaa750<210>10<211>750<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>pau5p<400>10atacgaatcagatactgttcggtacacgatatctaattaaaatgattcaaaactttgtaa60caggtaaagttttcactagaaccaatcaatccaagtgaattaggggaaaccatagttgtt120gatttgtagaaacctcacattgtacattgttggtttgttgggcatatcagaacgagagat180tttccaacattcaatatacactaaaccctatgacgagtcccacagatggcgtaaggtttt240tatgatttcagcagggtacgacgactagtaccatattaacattttttagtgtttctaatt300tgggaaaaggtccgtgttttttctcctagcaaccgtttagtgccaagggttaggcaattg360aacgaggccaagacaatattggctttgcttctattacttggctaacattgtgtctgcagg420tcgaaaggcacctttactgtaaggaacattcttgcgctctaaacatacgaagatatgggg480aatatgaagcgtgtttcttatacgaagtgcagcatcgttcaaggaaaatacatccccata540gtaataatggctaagtggccaggaattagaatatgtgagatatgagtgcaaaatgagtga600ccagtaatagcctgtttgggatgtaattgctcaaaaaatttatataaatacagcggtttg660atcagctttgtttgagacatttctctgttcttttccttccagttaagcttatatctccac720taagcaacaacccaaaaaacaacaaataca750<210>11<211>750<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>anb1p<400>11gttgcctggccatccacgctatatatacacgcctggcggatctgctcgaggattgcctac60gcgtgggcttgatccaccaaccaacgctcgccaaatgaactggcgctttggtcttctgcc120atcgtccgtaaaccccggccaaagagaccggaaagatcggtgaaaacatcttgatcttgc180tcccgggaattttagattcaggtaggaaattgattacatcaatactgttaccctgaatca240tattcgacgatgtcgtctcacacggaaatataattcatttcttggttttccaaaaaaatt300ttcattttttttcacttttttgtttcgtcctcctttttttttttttgttttattttttgt360cctgtgttcacctttttttttttcagtttacatctttctgcattcttttctgtgtttttt420tttttttttcgtttttccattgttcgttcgttgcctgttttttcgccctattgttctcga480gcctaaaaattttttcctttcctgctttcctttcttcgttcaaagtttcctattccattg540ttctctttggtaaactcattgttgtcggaactcagatatattcaggtcaatttactgtac600ttcaattgacttttttcttgaaatttcaacttgccttttcaacttgttcttcttttttaa660tcttattctacactttagttcccttaccttgttcctaattattgtctagcaaaaagaaaa720catacacctatttcattcacacactaaaac750<210>12<211>750<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>hor7p<400>12acctccatgaaatttttttttttctttcgattagcacgcacacacatcacatagactgcg60tcataaaaatacactacggaaaaaccataaagagcaaagcgatacctacttggaaggaaa120aggagcacgcttgtaagggggatgggggctaagaagtcattcactttcttttcccttcgc180ggtccggacccgggacccctcctctccccgcacaatttcttcctttcatatcttcctttt240attcctatcccgttgaagcaaccgcactatgactaaatggtgctggacatctccatggct300gtgacttgtgtgtatctcacagtggtaacggcaccgtggctcggaaacggttccttcgtg360acaattctagaacaggggctacagtctcgataatagaataataagcgcatttttgttagc420gccgccgcggcgcccgtttcccaatagggaggcgcagtttatcggcggagctttacttct480tcctatttgggtaagcccctttctgttttcggccagtggttgctgcaggctgcgccggag540aacatagtgataagggatgtaactttcgatgagagaattagcaagcggaaaaaaaactat600ggctagctgggagttgtttttcaatcatataaaagggagaaattgttgctcactatgtga660cagtttctgggacgtcttaacttttattgcagaggactatcaaatcatacagatattgtc720aaaaaaaaaaaaaaagactaataataaaaa750<210>13<211>749<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>adh1p<400>13cgatttttttctaaaccgtggaatatttcggatatccttttgttgtttccgggtgtacaa60tatggacttcctcttttctggcaaccaaacccatacatcgggattcctataataccttcg120ttggtctccctaacatgtaggtggcggaggggagatatacaatagaacagataccagaca180agacataatgggctaaacaagactacaccaattacactgcctcattgatggtggtacata240acgaactaatactgtagccctagacttgatagccatcatcatatcgaagtttcactaccc300tttttccatttgccatctattgaagtaataataggcgcatgcaacttcttttcttttttt360ttcttttctctctcccccgttgttgtctcaccatatccgcaatgacaaaaaaatgatgga420agacactaaaggaaaaaattaacgacaaagacagcaccaacagatgtcgttgttccagag480ctgatgaggggtatctcgaagcacacgaaactttttccttccttcattcacgcacactac540tctctaatgagcaacggtatacggccttccttccagttacttgaatttgaaataaaaaaa600gtttgctgtcttgctatcaagtataaatagacctgcaattattaatcttttgtttcctcg660tcattgttctcgttccctttcttccttgtttctttttctgcacaatatttcaagctatac720caagcatacaatcaactatctcatataca749<210>14<211>750<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>tdh2p<400>14tggaaagtaccaacatcggttgaaacagtttttcatttacatatggtttattggtttttc60cagtgaatgattatttgtcgttaccctttcgtaaaagttcaaacacgtttttaagtattg120tttagttgctctttcgacatatatgattatccctgcgcggctaaagttaaggatgcaaaa180aacataagacaactgaagttaatttacgtcaattaagttttccagggtaatgatgttttg240ggcttccactaattcaataagtatgtcatgaaatacgttgtgaagagcatccagaaataa300tgaaaagaaacaacgaaactgggtcggcctgttgtttcttttctttaccacgtgatctgc360gccatttacaggaagtcgcgcgttttgcgcagttgttgcaacgcagctacggctaacaaa420gcctagtggaactcgactgatgtgttagggcctaaaactggtggtgacagctgaagtgaa480ctattcaatccaatcatgtcatggctgtcacaaagaccttgcggaccgcacgtacgaaca540catacgtatgctaatatgtgttttgatagtacccagtgatcgcagacctgcaattttttt600gtaggtttggaagaatatataaaggttgcactcattcaagatagtttttttcttgtgtgt660ctattcacattattttttttttgattaaatgttaaaaaaaccaagaacttagtttcaaat720taaattcatcacacaaacaaacaaaacaaa750<210>15<211>750<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>tdh3p<400>15ggccaaggcaaaaagattccttgattacgtaagggagttagaatcattttgaataaaaaa60cacgctttttcagttcgagtttatcattatcaatactgccatttcaaagaatacgtaaat120aattaatagtagtgattttcctaactttatttagtcaaaaaattagccttttaattctgc180tgtaacccgtacatgcccaaaatagggggcgggttacacagaatatataacatcataggt240gtctgggtgaacagtttattcctggcatccactaaatataatggagcccgctttttaagc300tggcatccagaaaaaaaaagaatcccagcaccaaaatattgttttcttcaccaaccatca360gttcataggtccattctcttagcgcaactacagagaacaggggcacaaacaggcaaaaaa420cgggcacaacctcaatggagtgatgcaacctgcctggagtaaatgatgacacaaggcaat480tgacccacgcatgtatctatctcattttcttacaccttctattaccttctgctctctctg540atttggaaaaagctgaaaaaaaaggttgaaaccagttccctgaaattattcccctacttg600actaataagtatataaagacggtaggtattgattgtaattctgtaaatctatttcttaaa660cttcttaaattctacttttagagttagtcttttttttagttttaaaacaccaagaactta720gtttcgaataaacacacataaacaaacaaa750<210>16<211>750<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>gpd1p<400>16aaggaaaatatatactctttcccaggcaaggtgacagcggtccccgtctcctccacaaag60gcctctcctggggtttgagcaagtctaagtttacgtagcataaaaattctcggattgcgt120caaataataaaaaaagtaactccacttctacttctacatcggaaaaacattccattcaca180tatcgtctttggcctatcttgttttgtccttggtagatcaggtcagtacaaacgcaacac240gaaagaacaaaaaaagaagaaaaacagaaggccaagacagggtcaatgagactgttgtcc300tcctactgtccctatgtctctggccgatcacgcgccattgtccctcagaaacaaatcaaa360cacccacaccccgggcacccaaagtccccacccacaccaccaatacgtaaacggggcgcc420ccctgcaggccctcctgcgcgcggcctcccgccttgcttctctcccctcccttttctttt480tccagttttccctattttgtccctttttccgcacaacaagtatcagaatgggttcatcaa540atctatccaacctaattcgcacgtagactggcttggtattggcagtttcgcagttatata600tatactaccatgagtgaaactgttacgttaccttaaattctttctccctttaattttctt660ttatcttactctcctacataagacatcaagaaacaattgtatattgtacacccccccccc720tccacaaacacaaatattgataatataaag750<210>17<211>750<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>cdc19p<400>17tttttccggcagaaagattttcgctacccgaaagtttttccggcaagctaaatggaaaaa60ggaaagattattgaaagagaaagaaagaaaaaaaaaatgtacacccagacatcgggcttc120cacaatttcggctctattgttttccatctctcgcaacggcgggattcctctatggcgtgt180gatgtctgtatctgttacttaatccagaaactggcacttgacccaactctgccacgtggg240tcgttttgctatcgacagattgggagatgttcatagtagagttcagcatgatagctacgt300aaatgtgttccgcaccgtcacaaagtgttttctactgttctttcttctttcgttcattca360gttaagttgagtgagtgctttgttcaatggatcttagctaaaatgcatattttttctctt420ggtaaatgaatgcttgtgatgtcttccaagtgatttcctttccttcccatatgatgctag480gtacctttagtgtcttcctgaaaaaaaaggctcgccatcaaaacgatattcgttggcttt540tttttctgaattataaatactctttagtaactttccattttcaagaacctcttttttcca600gttatatcatggtcccctttcaaagttattctctactctttttcatattcattctttttc660atcctttggttttttattcttaacttgtttattattctctcttgtttctatttacaagac720accaatcaaaacaaataaaacatcatcaca750<210>18<211>750<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>eno2p<400>18aagatgttggttaccaagaagatgccgccctggaattaattcagaagctgattgaataca60ttagcaacgcgtccagcatttttcggaagtgtctcataaactttactcaagagttaagta120ctgaaaaattcgacttttatgatagttcaagtgtcgacgctgcgggtatagaaagggttc180tttactctatagtgcctcctcgctcagcatctgcttcttcccaaagatgaacgcggcgtt240atgtcactaacgacgtgcaccatttttgcggaaagtggaatcccgttccaaaactggcat300ccactaattgatacatctacacaccgcacgccttttttctgaagcccactttcgtggact360ttgccatatgcaaaattcatgaagtgtgataccaagtcagcatacacctcactagggtag420tttctttggttgtattgatcatttggttcatcgtggttcattaattttttttctccattg480ctttctggctttgatcttactatcatttggatttttgtcgaaggttgtagaattgtatgt540gacaagtggcaccaagcatatataaaaaaaaaagcattatcttcctaccagagttaattg600ttaaaaacgtatttatagcaaacgcaattgtaattaattcttattttgtatcttttcttc660ccttgtctcaatcttttatttttattttatttttcttttcttagtttctttcataacacc720aagcaactaatactataacatacaataata750<210>19<211>750<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>pdc1p<400>19aagcaaggcagaaactaacttcttcttcatgtaataaacacaccccgcgtttatttacct60atctttaaacttcaacaccttatatcataactaatatttcttgagataagcacactgcac120ccataccttccttaaaaacgtagcttccagtttttggtggttccggcttccttcccgatt180ccgcccgctaaacgcatatttttgttgcctggtggcatttgcaaaatgcataacctatgc240atttaaaagattatgtatgctcttctgacttttcgtgtgatgaggctcgtggaaaaaatg300aataatttatgaatttgagaacaattttgtgttgttacggtattttactatggaataatc360aatcaattgaggattttatgcaaatatcgtttgaatatttttccgaccctttgggtactt420ttcttcataattgcataatattgtccgctgcccctttttctgttagacggtgtcttgatc480tacttgctatcgttcaacaccaccttattttctaactattttttttttagctcatttgaa540tcagcttatggtgatggcacatttttgcataaacctagctgtcctcgttgaacataggaa600aaaaaaatatataaacaaggctctttcactctccttgcaatcagatttgggtttgttccc660tttattttcatatttcttgtcatattcctttctcaattattattttctactcataacctc720acgcaaaataacacagtcaaatcaatcaaa750<210>20<211>750<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>hxt3p<400>20gccttcatcttctcgagataacacctggaggaggagcaatgaaatgaaaggaaaaaaaaa60aatactttctttttcttgaaaaaagaaaaaaattgtaagatgagctattcgcggaacatt120ctagctcgtttgcatcttcttgcatttggttggttttcaatacttgggtaatattaacgg180atacctactattatcccctagtaggctcttttcacggagaaattcgggagtgcttttttt240ccgtgcgcattttcttagctatattcttccagcttcgcctgctgcccggtcatcgttcct300gtcacgtagtttttccggattcgtccggctcatataataccgcaataaacacggaatatc360tcgttccgcggattcggttaaactctcggtcgcggattatcacagagaaagcttcgtgga420gaatttttccagattttccgctttccccgatgttggtatttccggaggtcattatactga480ccgccattataatgactgtacaacgaccttctggagaaagaaacaactcaataacgatgt540gggacattggaggcccactcaaaaaatctggggactatatccccagagaatttctccaga600agagaagaaagtcaaagtttttttcacttgggggttgcatataaatacaggcgctgtttt660atcttcagcatgaatattccataagtttacttaatagcttttcataaataatagaatcac720aaacaaaatttacatctgagttaaacaatc750<210>21<211>450<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>tpi1<400>21ctacttattcccttcgagattatatctaggaacccatcaggttggtggaagattacccgt60tctaagacttttcagcttcctctattgatgttacacctggacaccccttttctggcatcc120agtttttaatcttcagtggcatgtgagattctccgaaattaattaaagcaatcacacaat180tctctcggataccacctcggttgaaactgacaggtggtttgttacgcatgctaatgcaaa240ggagcctatatacctttggctcggctgctgtaacagggaatataaagggcagcataattt300aggagtttagtgaacttgcaacatttactattttcccttcttacgtaaatatttttcttt360ttaattctaaatcaatctttttcaattttttgtttgtattcttttcttgcttaaatctat420aactacaaaaaacacatacataaactaaaa450<210>22<211>30<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x28001<400>22ctgactcgttggtggggtccacaccataga30<210>23<211>24<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27580<400>23tagctatgaaatttttaactcttc24<210>24<211>35<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27581<400>24agcacgcagcacgctgtatttacgtatttaatttt35<210>25<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27582<400>25agccagctttttgaagagttaaaaatttcatagctagggcgccataaccaaggtatctat60<210>26<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x28015<400>26aacagcggtcaagaaaacggtcaatctgatcatgtttagttaattatagttcgttgaccg60<210>27<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x20072<400>27aatatacggtcaacgaactataattaactaaacatgatcagattgaccgttttcttgacc60<210>28<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x20071<400>28agactttcataaaaagtttgggtgcgtaacacgctatcacaataattcgatcaacttgtt60<210>29<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x31384<400>29gctaatagagccagaaacaagttgatcgaattattgtgatagcgtgttacgcacccaaac60<210>30<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x31385<400>30aattaaatacgtaaatacagcgtgctgcgtgctatgaggaagaaatccaaatcctaatga60<210>31<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x26468<400>31aattaaatacgtaaatacagcgtgctgcgtgctatgaggaagaaatccaaatcctaatga60<210>32<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27405<400>32ccagctttttgaagagttaaaaatttcatagctaagaaacgaatgtatatgctcatttac60<210>33<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x28699<400>33aaacagcggtcaagaaaacggtcaatctgatcattttgttttgtgtgtaaatttagtgaa60<210>34<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x24018<400>34acagtacttcactaaatttacacacaaaacaaaatgatcagattgaccgttttcttgacc60<210>35<211>59<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27282<400>35gaaaaaaaaagtggtagattgggctacgtaaattcgatcacaataattcgatcaacttg59<210>36<211>56<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27283<400>36gagccagaaacaagttgatcgaattattgtgatcgaatttacgtagcccaatctac56<210>37<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x25154<400>37tatataaaattaaatacgtaaatacagcgtgctgcgtgctcaaatgacgtcaaaagaagt60<210>38<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x28017<400>38gcttgaaggtcattaggatttggatttcttcctcataaattagtgtgtgtgcattatata60<210>39<211>25<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x24678<400>39tcctgttgaagtagcatttaatcat25<210>40<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x20066<400>40caaaaattatgattaaatgctacttcaacaggattacaataattcgatcaacttgtttct60<210>41<211>59<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x19705<400>41aaaacaaaaagtttttttaattttaatcaaaaaatgatcagattgaccgttttcttgac59<210>42<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27998<400>42caaaaacagcggtcaagaaaacggtcaatctgatcattttttgattaaaattaaaaaaac60<210>43<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x25201<400>43aattaaatacgtaaatacagcgtgctgcgtgctccagaaaggcaacgcaaaatttttttt60<210>44<211>59<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27379<400>44gagccagctttttgaagagttaaaaatttcatagctaatacgaatcagatactgttcgg59<210>45<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x28186<400>45caaaaacagcggtcgagaaaacggtcaatctgatcattgtatttgttgttttttgggttg60<210>46<211>24<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x25892<400>46atgatcagattgaccgttttctcg24<210>47<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27996<400>47aacaaaaaggtagaccaatgtagcgctcttactttatcacaataattcgatcaacttgtt60<210>48<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27458<400>48ctaatagagccagaaacaagttgatcgaattattgtgataaagtaagagcgctacattgg60<210>49<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27812<400>49cataggctcatataatacttcttttgacgtcatttgaagtgagttctattcacgcaatcg60<210>50<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27811<400>50tcttctttgatactaccgattgcgtgaatagaactcacttcaaatgacgtcaaaagaagt60<210>51<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x27995<400>51gctaatagagccagaaacaagttgatcgaattattgtgatcgaatttacgtagcccaatc60<210>52<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x28187<400>52gcaaaaacagcggtcgagaaaacggtcaatctgatcattttgttttgtgtgtaaatttag60<210>53<211>60<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>寡核苷酸x28152<400>53tatataaaattaaatacgtaaatacagcgtgctgcgtgctagaaacgaatgtatatgctc60<210>54<211>500<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>adh3t<400>54tagcgtgttacgcacccaaactttttatgaaagtctttgtttataatgatgaggtttata60aatatatagtggagcaaagattaatcactaaatcaagaagcagtaccagtatttttttta120tatcaagtagtgataatggaaatagcccaaatttggcttccgtcggcacatagcacgttt180gagagacattatcaccatcaagcatcgagccgcccaaacctaactgtataagttttttca240cgtttttgatttttccttgcacacttcgatattactctcacgataaaagggccgaagaga300atatttttcttgaacatccagaattttaattcggagaaatttcacaagccgccgatttaa360gggtcctgtgttcttaataatcagcctctctcaaagcaggtaagaggcagtctttctttt420aacaataggagacattcgaactaaaacatcagccccaaaaatgcgcttgaaggtcattag480gatttggatttcttcctcat500<210>55<211>500<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>idp1t<400>55tcgaatttacgtagcccaatctaccactttttttttcattttttaaagtgttatacttag60ttatgctctaggataatgaactacttttttttttttttactgttatcataaatatatata120ccttattgatgtttgcaaccgtcggttaattccttatcaaggttccccaagttcggatca180ttaccatcaatttccaacatcttcatgagttcttcttcttcattaccgtgttttaggggg240ctgttcgcacttctaatagggctatcaccaagctgttctaattcgtccaaaagttcagta300acacgatctttatgcttcagttcgtcataatctttcaattcataaatatttacaatttcg360tctacgatattaaattgcctcttgtaggtgcctatcttttccttatgctcttcattttca420ccgttttcttgaaaccaaacaccgaactcactacgcatttctttcataggctcatataat480acttcttttgacgtcatttg500<210>56<211>500<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>dit1t<400>56taaagtaagagcgctacattggtctacctttttgttcttttacttaaacattagttagtt60cgttttctttttctcatttttttatgtttcccctcaaaagttctgattttataatatttt120atttcacacaattccaattaacagagggggaatagattctttagcttagaaaattagtga180tcaatatatatttgcctttcttttcatcttttcagtgatattaatggtttcgagacactg240caatggccctagttgtctaagaggatagatgttactgtcaaagatgatattttgaatttc300aattgacgtaattaatgatactattaataatacagagcgtatatgaagtattgcaaataa360catgcacagttcttttgggatgagaatgagaatgagaggcgaaggcgggcgttcagaaaa420gcgttgcggagtaacaagtgattaaatagcacccaaataatcttctttgatactaccgat480tgcgtgaatagaactcactt500<210>57<211>500<212>dna<213>人工序列(artificialsequence)<220><221>misc_feature<223>pma1t<400>57tcctgttgaagtagcatttaatcataatttttgtcacattttaatcaacttgatttttct60ggtttaatttttctaattttaattttaatttttttatcaatgggaactgatacactaaaa120agaattaggagccaacaagaataagccgcttatttcctactagagtttgcttaaaatttc180atctcgaattgtcattctaatattttatccacacacacaccttaaaatttttagattaaa240tggcatcaactcttagcttcacacacacacacacaccgaagctggttgttttatttgatt300tgatataattggtttctctggatggtactttttctttcttggttatttcctattttaaaa360tatgaaacgcacacaagtcataattattctaatagagcacaattcacaacacgcacattt420caactttaatatttttttagaaacactttatttagtctaattcttaatttttaatatata480taatgcacacacactaattt500当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1