甜菊醇糖苷转运的制作方法

文档序号:14186016阅读:389来源:国知局

发明领域

本发明涉及能够产生甜菊醇糖苷的重组宿主。本发明还涉及使用这种重组宿主制备甜菊醇糖苷的方法。本发明还涉及包含甜菊醇糖苷的发酵液、甜菊醇糖苷和包含两种或更多种甜菊醇糖苷的组合物。本发明还涉及包含甜菊醇糖苷或含有两种或更多种甜菊醇糖苷的组合物的食品、饲料或饮料。

发明背景

多年生草本植物甜叶菊(steviarebaudianabert.)的叶子积聚大量被称为甜菊醇糖苷的具有强烈甜味的化合物。虽然这些化合物的生物功能尚不清楚,但它们作为替代性高效甜味剂具有商业意义。

这些甜的甜菊醇糖苷的功能和感官特性表现为优于许多高效甜味剂的功能和感官特性。此外,研究表明甜菊苷能够降低ii型糖尿病患者的血糖水平,并且能够降低轻度高血压患者的血压。

甜菊醇糖苷积聚在甜叶菊叶中,其中它们可占叶干重的10%至20%。甜菊苷和莱鲍迪甙a均是热和ph稳定的,并且适用于碳酸饮料和许多其他食物。甜菊苷比蔗糖甜110与270倍之间,莱鲍迪甙a比蔗糖甜150与320倍之间。此外,莱鲍迪甙d也是在甜叶菊叶中积聚的高效二萜糖苷甜味剂。它可比蔗糖甜约200倍。莱鲍迪甙m是另一种高效二萜糖苷甜味剂。它在某些甜叶菊品种叶中以痕量存在,但已表明其具有优异的味道特征。

传统上已从甜叶菊植物中提取了甜菊醇糖苷。在甜叶菊中,(-)-贝壳杉烯酸(赤霉酸(ga)生物合成中的中间体)被转化成四环二萜甜菊醇,其然后通过多步糖基化途径进行以形成各种甜菊醇糖苷。然而,产率可以是可变的,并且受到农业和环境条件的影响。此外,甜叶菊种植需要大量的土地面积、在收获前的很长时间、密集劳动以及用于提取和纯化糖苷的额外成本。

最近,使用发酵工艺生产甜菊醇糖苷的兴趣日益增长。wo2013/110673和wo2015/007748中描述了可用于产生至少甜菊醇糖苷莱鲍迪甙a、莱鲍迪甙d和莱鲍迪甙m的微生物。

此类微生物的进一步改进是令人希望的,以便可产生更高量的甜菊醇糖苷和/或另外或新的甜菊醇糖苷和/或更高量的特异性甜菊醇糖苷和/或具有期望比例的不同甜菊醇糖苷的甜菊醇糖苷的混合物。

发明概述

本发明基于鉴定能够介导甜菊醇糖苷转运的蛋白质。

因此,可以在重组宿主(例如微生物细胞)中过表达所述蛋白质以增加甜菊醇糖苷转运出宿主。或者,可以修饰宿主(例如微生物细胞),以相较于相应的未修饰版本的宿主表达更少所述蛋白质。在这种情况下,宿主内可以保留更多甜菊醇糖苷,其然后被糖基化成包含更高数量的糖部分的甜菊醇糖苷。

因此,本发明涉及重组宿主,例如细胞,诸如微生物细胞,其产生甜菊醇糖苷到宿主外的程度高于不过表达所述蛋白质的相应宿主。这可便于更容易地回收甜菊醇糖苷。本发明还涉及能够产生甜菊醇糖苷的重组宿主,其过表达介导甜菊醇糖苷转运的异源多肽。

因此,本发明涉及能够产生甜菊醇糖苷的重组宿主,其过表达介导甜菊醇糖苷转运的多肽,并且所述多肽包含seqidno:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。

本发明还涉及能够产生甜菊醇糖苷的重组宿主,其已被修饰,优选在其基因组中被修饰,以导致介导甜菊醇糖苷转运的多肽的产生缺陷,并且所述多肽包含seqidno:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。

本发明还涉及(在宿主内和/或在宿主外)包含甜菊醇糖苷的重组宿主,所述甜菊醇糖苷相较于未根据本发明修饰的相应宿主具有更高或更低的平均糖基化数。

本发明还涉及:

-一种制备甜菊醇糖苷的方法,其包括在合适的发酵培养基中发酵根据前述权利要求中任一项所述的重组宿主,以及任选地回收所述甜菊醇糖苷;

-发酵液,其包含能够通过本发明的方法获得的甜菊醇糖苷;

-通过本发明的方法或发酵液获得的甜菊醇糖苷;

-组合物,其包含两种或更多种本发明的或通过本发明的方法能够获得的甜菊醇糖苷;

-包含本发明的甜菊醇糖苷或组合物的食品、饲料或饮料。

附图简介

图1示出了编码thmg、ugt2_1a、hph的质粒mb6969的示意图。

图2示出了编码thmg的质粒mb6856的示意图。

图3示出了编码thmg的质粒mb6857的示意图。

图4示出了编码ggs的质粒mb6948的示意图。

图5示出了编码ggs的质粒mb6958的示意图。

图6示出了编码ugt1、ugt3、ugt4、nat的质粒mb7015的示意图。

图7示出了编码thmg、ura3、ggs的质粒mb6986的示意图。

图8示出了编码tcps_sr、tks_sr、kah_4、ko_gib、cpr_3、leu2的质粒mb7059的示意图。

图9示出了编码tcps_sr、tks_sr、kah_4、ko_gib、cpr_3、ura3的质粒mb7100的示意图。

图10示出了编码thmg、ura2、ggs的质粒mb6988的示意图。

图11示出了编码tcps_sr、tks_sr、kah_4、ko_gib、cpr_3、leu2的质粒mb7044的示意图。

图12示出了编码tcps_sr、tks_sr、kah_4、ko_gib、cpr_3、ura2的质粒mb7094的示意图。

图13示出了编码cre、neor的质粒mb6128的示意图。

图14示出了含有kah和hph的构建体的示意图。

图15示出了包含tcps_sr的构建体的示意图。

图16示出了编码thmg、ura3、ggs的质粒mb6986的示意图。

图17示出了质粒prs417con5-3的示意图。

图18示出了hygb标记与转运体内部片段在质粒prs4175-3中组装的示意图。

图19示出了从含有hyg标记和转运体内部片段的质粒prs4175-3pcr扩增转运体破坏构建体的示意图。

图20示出了导致转运体基因的破坏和hygb标记的整合的基因组上重组事件的示意图。

图21示出了导致甜菊醇糖苷生物合成的潜在途径的示意图。以星号显示的化合物是13-[(β-d-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-o-β-d-吡喃葡萄糖基-β-d-吡喃葡萄糖基酯。

序列表说明

表14中示出了序列说明。可以参考序列表或者参考也示于表14中的数据库登录号来定义本文所述的序列。

发明详述

在本说明书和所附权利要求书中,词语“包含”、“包括”和“具有”以及变化形式应被解释为包含性的。也就是说,这些词语意图表达在上下文允许的情况下可包含未具体叙述的其他要素或整数。

不使用数量词修饰时在本文中指代一个/种或多于一个/种(即一个/种或至少一个/种)的语法对象。举例来说,“要素”可意指一个/种要素或多于一个/种要素。

本发明涉及鉴定能够介导甜菊醇糖苷转运的多肽。这种多肽可以直接介导甜菊醇糖苷转运,即可以是转运体蛋白,或者可以间接介导甜菊醇糖苷转运。这种多肽可以能够介导一种或更多种甜菊醇糖苷的转运。

本发明涉及过表达或具有降低表达的这种多肽的重组宿主。根据上下文,术语重组宿主或重组细胞可以互换使用。

如本文所述的这种多肽可以在能够产生一种或多种甜菊醇糖苷的重组宿主(例如重组宿主细胞)中过表达。这种细胞与不过表达所述多肽的相应细胞相比可以能够产生更多的一种或多种细胞外甜菊醇糖苷。也就是说,与相应的非重组细胞相比,根据本发明的重组细胞可以具有增加或减少的甜菊醇糖苷转运。

因此,本发明提供了能够产生甜菊醇糖苷的重组宿主,其过表达多肽,所述多肽是能够介导甜菊醇糖苷转运的多肽,并且所述多肽包含seqidno:29所示的氨基酸序列或者与其具有至少约50%序列同一性的氨基酸序列。

还可以在宿主(例如重组宿主细胞)中修饰这种多肽的表达,使得与未经类似修饰的相应细胞相比,这种多肽的表达降低。以这种方式,与未经类似修饰的相应细胞相比,一种或多种细胞外甜菊醇糖苷的量可降低。这可以允许:与未经类似修饰的相应细胞相比,一种或多种细胞内甜菊醇糖苷的糖基化增加。因此,这种宿主与未经类似修饰的相应细胞相比可以包含具有更高平均糖基化数的甜菊醇糖苷。

因此,本发明提供了能够产生甜菊醇糖苷的重组宿主,其已被修饰,优选在其基因组中被修饰,以导致多肽的产生缺陷,所述多肽是能够介导甜菊醇糖苷转运的多肽,并且所述多肽包含seqidno:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。

本发明的宿主细胞是重组宿主细胞。从这个意义上讲,“重组”表示宿主细胞是非天然存在的宿主细胞,例如通过使用重组技术引入一个或多个核酸而被修饰。用于修饰宿主细胞以获得本发明重组宿主细胞的核酸可以是天然存在的核酸或非天然存在的核酸。

因此,关于本发明的宿主使用时,“重组”表示细胞已通过引入一种或多种异源核酸或蛋白质或改变天然核酸或蛋白质而被修饰,或者细胞来源于如此修饰的细胞。在本文中使用时,术语“异源”是指并非天然存在于宿主细胞中的核酸或氨基酸序列。换句话说,核酸或氨基酸序列与宿主细胞中天然存在的核酸或氨基酸序列不同。

本发明涉及能够产生甜菊醇糖苷的重组宿主,其过表达介导甜菊醇糖苷转运的异源多肽。这种异源多肽可以获自或来源于不同于宿主的属或种的属或种。因此,如果重组宿主是酵母,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于不同的酵母属或种。

例如,如果宿主细胞是saccharomyces(例如s.cerevisiae、s.bayanus、s.pastorianus、s.carlsbergensis),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于candida(例如c.krusei、c.revkaufi、c.pulcherrima、c.tropicalis、c.utilis)、issatchenkia(例如i.orientalis)或yarrowia(例如y.lipolytica(以前归类为candidalipolytica))。

例如,如果宿主细胞是candida(例如c.krusei、c.revkaufi、c.pulcherrima、c.tropicalis、c.utilis),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于saccharomyces(例如s.cerevisiae、s.bayanus、s.pastorianus、s.carlsbergensis)、issatchenkia(例如i.orientalis)或yarrowia(例如y.lipolytica(以前归类为candidalipolytica))。

例如,如果宿主细胞是issatchenkia(例如i.orientalis),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于saccharomyces(例如s.cerevisiae、s.bayanus、s.pastorianus、s.carlsbergensis)、candida(例如c.krusei、c.revkaufi、c.pulcherrima、c.tropicalis、c.utilis)或yarrowia(例如y.lipolytica(以前归类为candidalipolytica))。

例如,如果宿主细胞是yarrowia(例如y.lipolytica(以前归类为candidalipolytica)),则介导甜菊醇糖苷转运的异源多肽可以获自或来源于saccharomyces(例如s.cerevisiae、s.bayanus、s.pastorianus、s.carlsbergensis)、candida(例如c.krusei、c.revkaufi、c.pulcherrima、c.tropicalis、c.utilis)或issatchenkia(例如i.orientalis))。

如果宿主细胞是saccharomycescerevisiae,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于yarrowialipolytica(以前归类为candidalipolytica)、candidakrusei或issatchenkiaorientalis。

如果宿主细胞是yarrowialipolytica,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于saccharomycescerevisiae、yarrowialipolytica(以前归类为candidalipolytica)或candidakrusei或issatchenkiaorientalis。

如果宿主细胞是candidakrusei或issatchenkiaorientalis,则介导甜菊醇糖苷转运的异源多肽可以获自或来源于saccharomycescerevisiae或yarrowialipolytica。

术语“来源于”也涵盖术语“源自”、“获自”、“能够获自”、“分离自”和“由……产生”,其通常表示一种指定材料来源于另一种指定材料或者具有可以参照另一种指定材料描述的特征。在本文中使用时,“来源于”微生物的物质(例如,核酸分子或多肽)可以表示该物质对于该微生物是天然的或者是该微生物的天然物质,但也可以表示已从天然版本改变的物质。

因此,例如,重组细胞可表达在天然(非重组)形式的细胞内不存在的本文所定义的多肽。或者,可修饰重组细胞以使编码本文所定义的多肽的天然基因的表达程度高于天然“非重组”形式的细胞内发生的程度。

或者,可修饰重组细胞以使编码本文所定义的多肽的天然基因的表达程度低于天然“非重组”形式的细胞内发生的程度。

在本发明的细胞中,可以过表达本文所定义的多肽。在本文中,“过表达的”、“过表达”等意味着重组宿主细胞比不过表达所述多肽的相应细胞表达更多的多肽,或者所述多肽在通常不表达该蛋白质的细胞中表达。或者,可以通过表达具有更高比活性的变体多肽来实现过表达。

本发明的重组细胞可以被修饰,优选在其基因组中,以导致如本文所定义的多肽的产生缺陷。

这种细胞可以来自亲本宿主细胞并且与亲本宿主细胞相比被修饰,优选在其基因组中被修饰,以获得与其所来源自的亲本宿主细胞相比不同的基因型和/或不同的表型。

已被修饰(优选在其基因组中)以导致如本文所定义的多肽产生缺陷的这种细胞是已被修饰(优选在其基因组中)以导致表型特征的突变宿主细胞,其中当与未被修饰的亲本微生物宿主细胞相比并且在相同条件下分析时,所述细胞:a)产生更少产物或基本上不产生产物,和/或b)产生具有降低的活性或降低的比活性的产物或者没有活性或没有比活性的产物,以及这些可能性中的一种或多种的组合。

术语“重组”与“经遗传修饰”同义。

这种重组宿主可以是编码如本文所述的多肽的核酸序列的全部或部分敲除。

因此,本发明涉及过表达被鉴定为具有甜菊醇糖苷转运介导活性的多肽或所述多肽缺陷的重组宿主:通常,宿主是可用于产生甜菊醇糖苷的宿主。给定的重组宿主产生甜菊醇糖苷的能力可以是非重组形式的宿主的性质,或者可以是引入一种或多种重组核酸序列(即编码导致产生甜菊醇糖苷的酶)的结果。

出于本发明的目的,具有甜菊醇糖苷转运介导活性的多肽(即介导甜菊醇糖苷转运的多肽)是对穿过细胞膜转运一种或多种甜菊醇糖苷有影响的多肽。影响可以是直接的,即多肽可以是转运体蛋白或包含功能性转运体区域。或者,影响可以是间接的,即多肽不是转运体蛋白,但其活性仍然对甜菊醇糖苷转运有影响。

通常,效果是这样的:提高多肽的表达水平增加穿过细胞膜转运一种或多种甜菊醇糖苷的量(与多肽的表达水平更低的相应细胞相比)。相反,降低多肽的表达水平可以降低穿过细胞膜转运一种或多种甜菊醇糖苷的量(与多肽的表达水平更高的相应细胞相比)。

通常,本发明的重组宿主能够产生甜菊醇糖苷。例如,本发明的重组宿主可以能够产生例如但不限于甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-d-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-o-β-d-吡喃葡萄糖基-β-d-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、reba、rebb、rebc、rebd、rebe或rebm中的一种或更多种。本发明的重组宿主可以能够产生在ceunen和geuns,journalofnaturalproducts76(6),1201-1228,2013中所示的甜菊醇糖苷中的一种或多种。

因此,本发明的细胞可以是这样的细胞,其中相较于不过表达或不具有本发明细胞的降低水平的表达的相应细胞,与细胞内相比的细胞外甜菊醇糖苷的总量更高或更低。

或者,相较于不过表达或不具有本发明细胞的降低水平的表达的相应细胞,本发明的细胞可以具有相同的与细胞内相比的细胞外甜菊醇糖苷的总量,但在细胞内外可以具有改变的甜菊醇糖苷分布。

因此,本发明的重组宿主能够产生甜菊醇糖苷。例如,本发明的重组宿主可以能够产生例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-d-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-o-β-d-吡喃葡萄糖基-β-d-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、reba、rebb、rebc、rebd、rebe或rebm中的一种或更多种。

因此,本发明的重组宿主可以是这样的,其中细胞产生的reba的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%在细胞外。

因此,本发明的重组宿主可以是这样的,其中细胞产生的rebd的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%在细胞外。

因此,本发明的重组宿主可以是这样的,其中细胞产生的rebm的至少约10%、至少约20%、至少约30%、至少约40%、至少约50%在细胞外。

本发明的重组宿主可以是这样的,其中细胞产生的reba的不超过约50%、不超过约40%、不超过约30%、不超过约20%、不超过约10%在细胞外。

本发明的重组宿主可以是这样的,其中细胞产生的rebd的不超过约50%、不超过约40%、不超过约30%、不超过约20%、不超过约10%在细胞外。

本发明的重组宿主可以是这样的,其中细胞产生的rebm的不超过约50%、不超过约40%、不超过约30%、不超过约20%、不超过约10%在细胞外。

本发明的重组细胞可以是这样的,其中甜菊醇糖苷的平均糖基化数为至少3、至少4、至少5、至少6或更大。与未根据本发明修饰的相应细胞相比,平均糖基化数可以增加或降低。例如,当过表达如本文所述的多肽时,平均糖基化可降低。例如,当本发明多肽的表达降低时,平均糖基化可增加(特别是在细胞本身中)。

平均糖基化可以指本发明的重组细胞的上清液中的平均糖基化或培养液(沉淀+上清液)中的平均糖基化。

因此,本发明提供了能够产生甜菊醇糖苷的重组细胞,所述重组细胞或者过表达下述多肽或者在下述多肽的表达方面有缺陷,所述多肽包含seqidno:29所示的氨基酸序列或者与其具有至少约50%序列同一性的氨基酸序列。这种氨基酸序列具有甜菊醇糖苷转运的作用,即是甜菊醇糖苷转运的介导物。

所述多肽还可以被定义为包含以下氨基酸序列(或与其具有至少约45%序列同一性的氨基酸序列)的多肽:

mgktevtqeslecgsvtsslgkkpfsiitlftgrrippvptekpdsaeeragilskltwqwlspllktgylrnieredlykvrernsaaviqqrlesnlekqyakyhakllkkglseqeahlklqdsakplvlalnqtffwkfwlaglfalvkdlcgiasamvsrvlieyiqdrylyrgtdrepkvgrgvgpsiglfllavgvtfffnhmfynvkmvgaqaraalvaviyskstrlsakgraqyttgkitnlaaidahrvdlscesfhyitiflpvvgcaiavlvvnlkvaalvgiatmivlifvvagitifsmklraiivkltdkrvtyirealqsiriikyygwevpycdkikkvrldetrnyakmgsirgtaigmfqalpilagalsfityaalghgtdparmfssltlfnlllpalavlpqalqaagdarvalrriqrflgaeestpttvfdatlestddavivedasfiwpevvddksdkekakdakkeekdkkkaekkakkaakkaakeiavvveeevehektegssesekgtlkstfkgfnnlsfkikrgefvvvtgpigsgkssllaaitgsmvltggsvrvsstewigclepwiqnatvrdnivfgrkfdsewyrtvvtacqlsqdlkimthgdntmigergitvsggqkarinlaraiygnpeilimddvlsavdarvgagivddclrglaknstrilathqlsvlpkadhvifmdaegqfhigtyqeleadneqfkallaagsmskeevvavdetevviegdleddcdnkeeyedaaetisiladatqelqkvtttvsafeendnmmeeeermrdavglhvywqyfrqanpsrvkvmmfigmifismiviaflfvftsvwlsfwtgdrfhasrnfytgiyimlgillllavagymivneinsamaarnlhnhaldsvfaartsffdttpqgriinrftrdtdsldnelamrltmlffgvsaffsnflltcvyvpyvtlvlvpvgfvfyvslgyyrksarevkridsiershmmsvfnesisgmpviimykaqhrlmnklqatlddmdsayfltaanqrwlslrldglgslvvlvatilvavgvfdltpsnmgliisaasfipevmsmvaqavaelencmnaierilyykdnipaeaarevdgieldqrpnwpeqgaisfnnvsmkyrdglpyvlkslsvdfqgghkvgicgrtgagkstilqtlyrivelaegsitidgvdistiglhqlrsqlsiipqepvlflgtirsnldpleqysdaelwgslrrsglldegetegkfhldqkveadgsnfslgerqlltlarallrntkilvldeatsnvdyktdklvqetisrefghctilciahrlrtiakydrilvlesgeinqydtpwnlyndkegifrgmcdtsglnevdfnk(seqidno:29).

通常具有甜菊醇糖苷转运介导活性的多肽可以包含这样的氨基酸序列,所述氨基酸序列与seqidno:29具有至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%或至少约99%的序列同一性。

由存在于本发明的重组宿主中的重组核酸编码的、通常具有甜菊醇糖苷转运介导活性的多肽可以包含氨基酸序列,所述氨基酸序列是本文所述氨基酸序列的片段,例如这种氨基酸序列的截短版本。

也就是说,本发明还涉及重组宿主,其过表达如本文所述的具有甜菊醇糖苷转运介导活性的多肽的生物学活性片段。

本发明多肽的生物活性片段包括这样的多肽,其包含与seqidno:29的氨基酸序列足够同一或来源于seqidno:29的氨基酸序列的氨基酸序列,其比seqidno:29中给出的全长多肽包含更少氨基酸,但展示出相应全长多肽的至少一种生物学活性。

通常,生物活性片段包含具有本发明多肽的至少一种活性的结构域或基序。本发明多肽的生物活性片段可以是这样的多肽,例如,其长度为约10、约25、约50、约100或更多个氨基酸或至少约100个氨基酸、至少150、200、250、300、350、400、600、1000个氨基酸或长度达到本发明多肽的氨基酸总数。此外,多肽的其他区域缺失的其他生物学活性部分可以通过重组技术制备,并且可以评估其的一种或多种天然形式本发明多肽的生物学活性。本发明的特征还在于编码本发明多肽的上述生物活性片段的核酸片段。

本发明的重组宿主可以过表达这种多肽或所述多肽缺陷。

本发明的重组宿主可以包含编码多于一种这种多肽(例如两种、三种、四种或更多种这种多肽)的重组核酸序列。如此编码的多肽可以相同或不同。

可以修饰本发明的重组细胞以降低多于一种这种多肽(例如2、3、4或更多种这种多肽)的表达水平。

由存在于重组宿主中的重组核酸编码的过表达的多肽可以是可获自或来源于或发现于yarrowia属的生物体中的多肽,例如可获自或来源于或发现于yarrowialipolytica的多肽。

如本文所用,术语“多肽”是指包含通过肽键连接的氨基酸残基并含有多于五个氨基酸残基的分子。氨基酸由单字母或三字母名称标识。如本文所用的术语“蛋白质”与术语“多肽”同义,并且还可指两种或更多种多肽。因此,术语“蛋白质”、“肽”和“多肽”可互换使用。多肽可任选地进行修饰(例如,糖基化、磷酸化、酰化、法尼基化、异戊二烯化、磺化等)以增加官能度。展现活性的多肽可被称为酶。应理解,作为遗传密码简并的结果,可产生编码给定多肽的许多核苷酸序列。

由用于本发明的重组宿主的重组核酸所编码的多肽可以包含信号肽和/或前肽序列。如果本发明的多肽包含信号肽和/或前肽,可以在成熟多肽序列上计算序列同一性。

用于在本发明的重组宿主中使用的重组核酸序列可以以核酸构建体的形式提供。术语“核酸构建体”是指单链或双链的核酸分子,其从天然存在的基因中分离或已经被修饰以含有以否则将不会在自然中存在的方式组合和并置的核酸的区段。当核酸构建体含有表达编码序列所需要的所有控制序列时,术语核酸构建体与术语“表达盒”的含义相同,其中所述控制序列可操作地连接至所述编码序列。

用于在本发明的重组宿主中使用的重组核酸序列可以以表达载体的形式提供,其中多核苷酸序列可操作地连接到至少一个控制序列用于在重组宿主细胞中表达多核苷酸序列。

如本文所用的术语“可操作地连接”是指物理地连接并且彼此有功能性关系的两个或多个核酸序列元件。例如,如果启动子能够起始或调控编码序列的转录或表达,则启动子可操作地连接至编码序列,在这种情况下,所述编码序列应被理解为在启动子的“控制下”。通常,当两个核酸序列可操作地连接时,它们将处于相同的取向并且通常也在同一阅读框中。它们通常将是基本上连续的,尽管这可能不是必需的。

表达载体包含编码本文所述多肽的多核苷酸,其可操作地连接至用于在体外或在宿主细胞中表达和/或翻译多核苷酸的适当控制序列(如启动子以及转录和翻译终止信号)。

表达载体可以是能够方便地进行重组dna程序并能使多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择通常将取决于所述载体与待引入所述载体的细胞的相容性。载体可以是线性或闭合的环状质粒。载体可以是自主复制型载体,即作为染色体外实体而存在、其复制独立于染色体复制的载体,例如,质粒、染色体外元件、微型染色体或人工染色体。

或者,载体可以是当被引入宿主细胞时整合至基因组中并与其已整合至其中的染色体一起复制的载体。整合型克隆载体可随机或在预定靶基因座处整合在宿主细胞的染色体中。载体可包含一个或多个选择性标记,其允许容易地选择转化的细胞。

可以根据本领域技术人员熟知的方法生成能够产生甜菊醇糖苷的重组宿主,所述重组宿主已被修饰(优选在其基因组中被修饰)以导致本文所述多肽的产生缺陷。可以修饰编码本文所述多肽的序列,使得发生更少或不发生多肽的表达。例如,可以部分或全部缺失编码本文所述多肽的序列。

本发明的重组宿主可以包含如本文所述的任何多肽。本发明的重组宿主可以过表达本文所述的任何多肽或有本文所述的任何多肽的缺陷。通常,本发明的重组宿主能够产生甜菊醇糖苷。例如,本发明的重组宿主可以能够产生例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-d-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-o-β-d-吡喃葡萄糖基-β-d-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、reba、rebe、rebd或rebm中的一种或更多种。

本发明的重组宿主可包含编码具有udp-糖基转移酶(ugt)活性的一种或多种多肽的一种或多种重组核酸序列。

为了本发明的目的,具有ugt活性的多肽是具有糖基转移酶活性(ec2.4)的多肽,即可以充当催化剂以将单糖单元从活化的核苷酸糖(又称“糖基供体”)转移到糖基受体分子(通常是醇)的多肽。ugt的糖基供体典型地是核苷酸糖尿苷二磷酸葡萄糖(尿嘧啶-二磷酸葡萄糖,udp-葡萄糖)。

可以选择这种另外的ugt以产生期望的甜菊醇糖苷。humphrey等人,plantmolecularbiology(2006)61:47-62和mohamed等人,j.plantphysiology168(2011)1136-1141中示出了甜菊醇糖苷形成的示意图。另外,图21示出了甜菊醇糖苷形成的示意图。

因此,本发明的重组宿主可包含一个或多个编码以下项中的一种或多种的重组核酸序列:

(i)具有ugt74g1活性的多肽;

(ii)具有ugt2活性的多肽;

(iii)具有ugt85c2活性的多肽;和

(iv)具有ugt76g1活性的多肽。

适用于本发明的重组酵母可包含编码能够催化向甜菊醇中添加c-13-葡萄糖的多肽的核苷酸序列。也就是说,适用于本发明方法的重组酵母可包含能够催化将甜菊醇转化为甜菊单糖苷的反应的ugt。

适用于本发明方法的这种重组酵母可包含编码具有由udp-糖基转移酶(ugt)ugt85c2所示的活性的多肽的核苷酸序列,由此酵母转化后,核苷酸序列赋予所述酵母将甜菊醇转化为甜菊单糖苷的能力。

ugt85c2活性是将葡萄糖单元转移至甜菊醇的13-oh。因此,合适的ugt85c2可充当尿苷5'-二磷酸葡糖基:甜菊醇13-oh转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-o-糖苷13-oh转移酶。功能性ugt85c2多肽还可催化葡糖基转移酶反应,所述反应利用除甜菊醇和甜菊醇-19-o-糖苷以外的甜菊醇糖苷底物。此类序列可在本文中称为ugt1序列。

适用于本发明的重组酵母可以包含编码具有ugt2活性的多肽的核苷酸序列。

具有ugt2活性的多肽是充当尿苷5'-二磷酸葡萄糖基:甜菊醇-13-o-糖苷转移酶(又称甜菊醇-13-单葡萄糖苷1,2-转葡萄糖基酶)的多肽,其将葡萄糖部分转移到受体分子甜菊醇-13-o-糖苷的13-o-葡萄糖的c-2'。典型地,适合的ugt2多肽还可以充当将葡萄糖部分转移到受体分子甜茶苷的13-o-葡萄糖的c-2’的尿苷5'-二磷酸葡萄糖基:甜茶苷转移酶。

具有ugt2活性的多肽也可以催化利用除甜菊醇-13-o-糖苷和甜茶苷以外的甜菊醇糖苷底物的反应,例如,功能性ugt2多肽可利用甜菊苷作为底物,从而将葡萄糖部分转移至19-o-葡萄糖残基的c-2'以产生莱鲍迪甙e。功能性ugt2多肽也可以利用莱鲍迪甙a作为底物,从而将葡萄糖部分转移至19-o-葡萄糖残基的c-2'以产生莱鲍迪甙d。然而,功能性ugt2多肽可以是这样的多肽,其不将葡萄糖部分转移至在c-13位具有1,3-结合的葡萄糖的甜菊醇化合物,即将葡萄糖部分转移至甜菊醇1,3-双糖苷和1,3-甜菊苷通常不会发生。

具有ugt2活性的多肽也可以从除尿苷二磷酸葡萄糖以外的供体转移糖部分。例如,具有ugt2活性的多肽充当尿苷5'-二磷酸d-木糖基:甜菊醇-13-o-糖苷转移酶,其将木糖部分转移至受体分子甜菊醇-13-o-糖苷的13-o-葡萄糖的c-2'。作为另一个实例,具有ugt2活性的多肽可充当尿苷5'-二磷酸l-鼠李糖基:甜菊醇-13-o-糖苷转移酶,其将鼠李糖部分转移至受体分子甜菊醇的13-o-葡萄糖的c-2'。

适用于本发明方法的重组酵母可以包含编码具有ugt活性的多肽的核苷酸序列,可以包含编码能够催化向甜菊双糖苷添加c-19-葡萄糖的多肽的核苷酸序列。也就是说,本发明的重组酵母可以包含能够催化将甜菊双糖苷转化成甜菊苷的反应的ugt。因此,这种重组酵母可以能够将甜菊双糖苷转化为甜菊苷。这种核苷酸序列的表达可以赋予重组酵母生产至少甜菊苷的能力。

因此,适用于本发明方法的重组酵母还可以包含编码具有由udp-糖基转移酶(ugt)ugt74g1所示的活性的多肽的核苷酸序列,由此当转化酵母后,所述核苷酸序列赋予细胞将甜菊双糖苷转化为甜菊苷的能力。

合适的ugt74g1多肽可以能够将葡萄糖单元分别转移至甜菊醇的13-oh和/或19-cooh。合适的ugt74g1多肽可充当尿苷5'-二磷酸葡糖基:甜菊醇19-cooh转移酶和/或尿苷5'-二磷酸葡糖基:甜菊醇-13-o-糖苷19-cooh转移酶。功能性ugt74g1多肽还可催化使用除甜菊醇和甜菊醇-13-o-糖苷以外的甜菊醇糖苷底物或者从除尿苷二磷酸葡萄糖以外的供体转移糖部分的糖基转移酶反应。此类序列可在本文中称为ugt3序列。

适用于本发明方法的重组酵母可包含编码能够催化甜菊苷的c-13位置处的葡萄糖的c-3'的葡糖基化的多肽的核苷酸序列。也就是说,适用于本发明方法的重组酵母可包含ugt,所述ugt能够催化甜菊苷转化至莱鲍迪甙a的反应。因此,这种重组酵母可以能够将甜菊苷转化为莱鲍迪甙a。这种核苷酸序列的表达可赋予酵母产生至少莱鲍迪甙a的能力。

适用于本发明方法的重组酵母可以因此还包含编码具有由udp-糖基转移酶(ugt)ugt76g1所示的活性的多肽的核苷酸序列,由此当转化酵母后所述核苷酸序列赋予该酵母将甜菊苷转化为莱鲍迪甙a的能力。

合适的ugt76g1向受体分子甜菊醇1,2糖苷的c-13-o-葡萄糖的c-3'添加葡萄糖部分。因此,ugt76g1充当例如尿苷5'-二磷酸葡糖基:甜菊醇13-o-1,2葡糖苷c-3'葡糖基转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-o-葡萄糖、13-o-1,2双糖苷c-3'葡糖基转移酶。功能性ugt76g1多肽还可催化葡糖基转移酶反应,所述反应使用含有除葡萄糖以外的糖的甜菊醇糖苷底物,例如甜菊醇鼠李糖苷和甜菊醇木糖苷。此类序列可在本文中称为ugt4序列。ugt4可以替代地或者另外地能够将rebd转化为rebm。

适用于本发明方法的重组酵母通常包含编码至少一种具有ugt1活性的多肽、至少一种具有ugt2活性的多肽、至少一种具有ugt3活性的多肽和至少一种具有ugt4活性的多肽的核苷酸序列。这些核酸序列中的一种或更多种可以是重组的。给定的核酸可编码具有一种或更多种上述活性的多肽。例如,核酸编码具有两种、三种或四种上述活性的多肽。优选地,用于本发明方法的重组酵母包含ugt1、ugt2和ugt3以及ugt4活性。合适的ugt1、ugt2、ugt3和ugt4序列在wo2015/007748的表1中进行了描述。

本发明的重组宿主可以包含两种或更多种编码具有任何一种ugt活性(例如,ugt1、ugt2、ugt3或ugt4活性)的多肽的核酸序列。当本发明的重组宿主包含两种或更多种编码具有任何一种ugt活性的多肽的核酸序列时,这些核酸序列可以相同或不同,和/或可编码相同或不同的多肽。特别地,本发明的重组宿主可以包含编码两种不同ugt2多肽的核酸序列。

根据本发明的重组宿主可以包含编码以下项中的一种或更多种的一种或更多种重组核苷酸序列:

具有对映-柯巴基焦磷酸合酶活性的多肽;

具有对映-贝壳杉烯合酶活性的多肽;

具有对映-贝壳杉烯氧化酶活性的多肽;以及

具有贝壳杉烯酸13-羟化酶活性的多肽。

出于本发明的目的,具有对映-柯巴基焦磷酸合酶(ec5.5.1.13)的多肽能够催化化学反应:

所述酶具有一种底物,香叶基香叶基焦磷酸;以及一种产物,对映-柯巴基焦磷酸。所述酶参与赤霉素生物的合成。所述酶属于异构酶家族,特别是分子内裂解酶的类别。所述酶类别的系统名称是对映-柯巴基-二磷酸裂解酶(脱环)。通常使用的其他名称包括具有对映-柯巴基焦磷酸合酶、对映-贝壳杉烯合酶a和对映-贝壳杉烯合成酶a。

编码对映-柯巴基焦磷酸合酶的合适核酸序列可例如包含在wo2015/007748的seqid.no:1、3、5、7、17、19、59、61、141、142、151、152、153、154、159、160、182或184中列出的序列。

出于本发明的目的,具有对映-贝壳杉烯合酶活性(ec4.2.3.19)的多肽是能够催化以下化学反应的多肽:

对映-柯巴基二磷酸对映-贝壳杉烯+二磷酸

因此,所述酶具有一种底物,对映-柯巴基二磷酸;以及两种产物,对映-贝壳杉烯和二磷酸。

所述酶属于裂解酶家族,特别是作用于磷酸盐/酯的碳-氧裂解酶。所述酶类别的系统名称是对映-柯巴基二磷酸二磷酸-裂解酶(环化,对映-贝壳杉烯形成)。常用的其它名称包括对映-贝壳杉烯合酶b、对映-贝壳杉烯合成酶b、对映-柯巴基-二磷酸二磷酸-裂解酶和(环化)。所述酶参与双萜类生物合成。

编码对映-贝壳杉烯合酶的合适核酸序列可例如包含在wo2015/007748的seqid.no:9、11、13、15、17、19、63、65、143、144、155、156、157、158、159、160、183或184中列出的序列。

对映-柯巴基二磷酸合酶还可具有与相同蛋白质分子相关联的不同对映-贝壳杉烯合酶活性。由对映-贝壳杉烯合酶催化的反应是赤霉素的生物合成途径中的下一步骤。两种类型的酶活性是不同的,并且定点诱变以抑制蛋白质的对映-贝壳杉烯合酶活性导致对映-柯巴基焦磷酸的积累。

因此,本发明重组宿主中使用的单个核苷酸序列可编码具有对映-柯巴基焦磷酸合酶活性和对映-贝壳杉烯合酶活性的多肽。或者,两种活性可被两个不同的分离的核苷酸序列编码。

出于本发明的目的,具有对映-贝壳杉烯氧化酶活性(ec1.14.13.78)的多肽是能够催化对映-贝壳杉烯的4-甲基的三次连续氧化以产生贝壳杉烯酸的多肽。这种活性通常需要细胞色素p450的存在。

编码对映-贝壳杉烯氧化酶的合适核酸序列可例如包含在wo2015/007748的seqid.no:21、23、25、67、85、145、161、162、163、180或186中列出的序列。

出于本发明的目的,具有贝壳杉烯酸13-羟化酶活性(ec1.14.13)的多肽是能够催化使用nadph和o2形成甜菊醇(对映-贝壳杉-16-烯-13-醇-19-酸)的多肽。这种活性也可称为对映-贝壳杉烯酸13-羟化酶活性。

编码贝壳杉烯酸13-羟化酶的合适核酸序列可例如包含在wo2015/007748的seqid.no:27、29、31、33、69、89、91、93、95、97、146、164、165、166、167或185中列出的序列。

本发明的重组宿主可包含编码具有nadph-细胞色素p450还原酶活性的多肽的重组核酸序列。也就是说,本发明的重组宿主可能够表达编码具有nadph-细胞色素p450还原酶活性的多肽的核苷酸序列。出于本发明的目的,具有nadph-细胞色素p450还原酶活性(ec1.6.2.4;也称为nadph:高铁血红蛋白氧化还原酶、nadph:血红素蛋白氧化还原酶、nadph:p450氧化还原酶、p450还原酶、por、cpr、cypor)的多肽通常是一种这样的多肽,其为膜结合酶,从而允许电子从含有fad和fmn的酶nadph:细胞色素p450还原酶(por;ec1.6.2.4)转移至真核细胞的微粒体中的细胞色素p450。

在本发明的重组宿主中,可上调宿主产生香叶基香叶基二磷酸(ggpp)的能力。在本发明的上下文中上调意味着重组宿主比等同的非重组宿主产生更多的ggpp。

因此,本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶a还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶的一个或多个核苷酸序列,由此宿主转化后的所述核苷酸序列赋予宿主产生提高水平的ggpp的能力。因此,根据本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶a还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶中的一种或多种的一个或多个重组核酸序列。

因此,本发明的重组宿主可包含编码以下中的一种或多种的核酸序列:

具有羟甲基戊二酰基-辅酶a还原酶活性的多肽;

具有法尼基-焦磷酸合成酶活性的多肽;和

本发明的重组宿主可以是例如多细胞生物或其细胞或单细胞生物。本发明的宿主可以是原核、古细菌或真核宿主细胞。

原核宿主细胞可以是但不限于细菌宿主细胞。真核宿主细胞可以是但不限于酵母、真菌、变形虫、藻类、动物、昆虫宿主细胞。

真核宿主细胞可以是真菌宿主细胞。“真菌”包括真菌(eumycotina)亚门的所有物种(alexopoulos,c.j.,1962,在introductorymycology,johnwiley&sons,inc.(约翰威立出版有限公司),纽约)。因此,术语真菌包括丝状真菌和酵母等等。

“丝状真菌”在本文中定义为真核微生物,其包括真菌和卵菌亚门的所有丝状形式(如由hawksworth等人,1995,同上所定义)。丝状真菌是以由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖以及其它复合多糖构成的菌丝壁为特征。营养体生长是通过菌丝延长,并且碳代谢是专性需氧的。丝状真菌菌株包括但不限于以下各项的菌株:acremonium、aspergillus、agaricus、aureobasidium、cryptococcus、corynascus、chrysosporium、filibasidium、fusarium、humicola、magnaporthe、monascus、mucor、myceliophthora、mortierella、neocallimastix、neurospora、paecilomyces、penicillium、piromyces、phanerochaete、podospora、pycnoporus、rhizopus、schizophyllum、sordaria、talaromyces、rasmsonia、thermoascus、thielavia、tolypocladium、trametes以及trichoderma。可充当宿主细胞的优选丝状真菌菌株属于以下物种:aspergillusniger、aspergillusoryzae、aspergillusfumigatus、penicilliumchrysogenum、penicilliumcitrinum、acremoniumchrysogenum、trichodermareesei、rasamsoniaemersonii(先前称为talaromycesemersonii)、aspergillussojae、chrysosporiumlucknowense、myceliophtorathermophyla。用于比较转化和未转化细胞的发酵特征的参考宿主细胞包括例如aspergillusnigercbs120.49、cbs513.88;aspergillusoryzaeatcc16868、atcc20423、if04177、atcc1011、atcc9576、atcc14488-14491、atcc11601、atcc12892;aspergillusfumigatusaf293(cbs101355);p.chrysogenumcbs455.95;penicilliumcitrinumatcc38065;penicilliumchrysogenump2;acremoniumchrysogenumatcc36225、atcc48272;trichodermareeseiatcc26921、atcc56765、atcc26921;aspergillussojaeatcc11906;chrysosporiumlucknowenseatcc44006以及所有这些菌株的衍生株。作为丝状真菌宿主细胞特别优选的是aspergillusnigercbs513.88及其衍生株。

真核宿主细胞可以是酵母细胞。优选的酵母宿主细胞可选自以下属:酵母属(例如,s.cerevisiae、s.bayanus、s.pastorianus、s.carlsbergensis)、brettanomyces、kluyveromyces、candida(例如,c.krusei、c.revkaufi、c.pulcherrima、c.tropicalis、c.utilis)、issatchenkia(例如,i.orientalis)、pichia(例如,p.pastoris和p.kudriavzevii)、schizosaccharomyces、hansenula、kloeckera、pachysolen、schwanniomyces、trichosporon、yarrowia(例如,y.lipolytica)(先前分类为candidalipolytica))、yamadazyma。

原核宿主细胞可以是细菌宿主细胞。细菌宿主细胞可以是革兰氏阴性或革兰氏阳性细菌。细菌的实例包括但不限于,属于以下属的细菌:bacillus(例如,b.subtilis、b.amyloliquefaciens、b.licheniformis、b.puntis、b.megaterium、b.halodurans、b.pumilus)、acinetobacter、nocardia、xanthobacter、escherichia(例如,大肠杆菌(例如,菌株dh1ob、stbl2、dh5-α、db3、db3.1)、db4、db5、jdp682和ccda-over(例如,美国申请号09/518,188)))、streptomyces、erwinia、klebsiella、serratia(s.marcessans)、pseudomonas(例如,p.aeruginosa)、salmonella(例如,s.typhimurium、s.typhi)。细菌还包括但不限于光合细菌(例如,绿色非硫细菌(例如,choroflexus细菌(例如c.aurantiacus)、chloronema(例如,c.gigateum))、绿色硫细菌(例如,chlorobium细菌(例如,c.limicola)、pelodictyon(例如,p.luteolum)、紫色硫细菌(例如,chromatium(例如,c.okenii))以及紫色非硫细菌(例如,rhodospirillum(例如,r.rubrum)、rhodobacter(例如r.sphaeroides、r.capsulatus)和rhodomicrobium细菌(例如r.vanellii))。

宿主细胞可以是来自非微生物生物体的宿主细胞。此类细胞的实例包括但不限于昆虫细胞(例如,drosophila(例如,d.melanogaster)、spodoptera(例如,s.frugiperdasf9或sf21细胞)和trichoplusa(例如,high-five细胞));线虫细胞(例如,c.elegans细胞);禽类细胞;两栖动物细胞(例如,xenopuslaevis细胞);爬行动物细胞;以及哺乳动物细胞(例如nih3t3、293、cho、cos、vero、c127、bhk、per-c6、bowes黑色素瘤和hela细胞)。

根据本发明的重组宿主可能够在本领域中已知的任何合适的碳源上生长,并且将其转化为甜菊醇糖苷。重组宿主可能够直接转化植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖和甘油。因此,优选的宿主表达酶如用于将纤维素转化成葡萄糖单体和将半纤维素转化成木糖和阿拉伯糖单体所需的纤维素酶(内切纤维素酶和外切纤维素酶)和半纤维素酶(例如内切和外切木聚糖酶、阿拉伯糖酶),能够将果胶转化成葡萄糖醛酸和半乳糖醛酸的果胶酶或将淀粉转化成葡萄糖单体的淀粉酶。优选地,宿主能够转化选自由以下各项组成的组的碳源:葡萄糖、木糖、阿拉伯糖、蔗糖、乳糖和甘油。宿主细胞可例如是wo03/062430、wo06/009434、ep1499708b1、wo2006096130或wo04/099381中所描述的真核宿主细胞。

因此,另一方面,本发明还提供了一种用于制备甜菊醇糖苷的方法,所述方法包括发酵本发明的重组宿主,所述重组宿主能够在合适的发酵培养基中产生至少一种甜菊醇糖苷;以及任选地回收所述甜菊醇糖苷。

在用于产生甜菊醇糖苷的方法中使用的发酵培养基可以是允许特定真核宿主细胞生长的任何合适的发酵培养基。发酵培养基的基本要素是本领域的技术人员已知的,并且可适用于所选择的宿主细胞。

优选地,发酵培养基包含选自由以下各项组成的组的碳源:植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、果糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖、脂肪酸、甘油三酯和甘油。优选地,发酵培养基还包含氮源,如尿素;或铵盐,如硫酸铵、氯化铵、硝酸铵或磷酸铵。

根据本发明的发酵方法可以分批、分批补料或连续模式进行。也可应用单独的水解和发酵(shf)方法或同时糖化和发酵(ssf)方法。这些发酵方法模式的组合对于最佳生产率来说也可以是可行的。如果在发酵方法中使用淀粉、纤维素、半纤维素或果胶作为碳源,则ssf方法可以是特别有吸引力的,其中可需要添加水解酶如纤维素酶、半纤维素酶或果胶酶以水解底物。

在用于制备甜菊醇糖苷的方法中使用的重组宿主可以是如上文所定义的任何合适的重组宿主。在所述方法中使用根据本发明的重组真核重组宿主可以是有利的,因为大多数真核细胞不需要用于繁殖的无菌条件并且对噬菌体感染不敏感。此外,真核宿主细胞可在低ph下生长以防止细菌污染。

根据本发明的重组宿主可以是兼性厌氧微生物。兼性厌氧重组宿主可以需氧方式繁殖至高细胞浓度。然后可在高细胞密度下进行这种厌氧阶段,这显著地降低了所需的发酵体积并且可使需氧微生物污染的风险最小化。

用于产生根据本发明的甜菊醇糖苷的发酵方法可以是需氧或厌氧发酵方法。

厌氧发酵方法可在本文中定义为在不存在氧的情况下运行或者基本上不消耗氧(优选小于5、2.5或1mmol/l/h),并且其中有机分子充当电子供体和电子受体两者的发酵方法。根据本发明的发酵方法也可首先在需氧条件下运行,且随后在厌氧条件下运行。

发酵方法也可在限氧或微需氧条件下进行。或者,发酵方法可首先在需氧条件下运行,且随后在限氧条件下运行。限氧发酵方法是其中氧消耗受到从气体到液体的氧传递的限制的过程。氧限制的程度由进入气流的量和组成以及所用发酵设备的实际混合/传质特性决定。

在根据本发明的方法中产生甜菊醇糖苷可在宿主细胞的生长阶段期间、固定(稳定状态)阶段期间或在两个阶段期间发生。在不同的温度下运行发酵方法可以是可行的。

用于产生甜菊醇糖苷的方法可在对于重组宿主来说最佳的温度下进行。对于每种转化的重组宿主而言,最佳生长温度可不同并且是本领域的技术人员已知的。最佳温度可高于野生型生物的最适温度以在非无菌条件下在最低感染敏感性和最低冷却成本的条件下有效生长生物体。或者,所述方法可在对于重组宿主的生长来说不是最佳的温度下进行。

用于产生根据本发明的甜菊醇糖苷的方法可在任何合适的ph值下进行。如果重组宿主是酵母,则发酵培养基中的ph优选具有低于6、优选低于5.5、优选低于5、优选低于4.5、优选低于4、优选低于ph3.5或低于ph3.0或低于ph2.5、优选高于ph2的值。在这些低ph值下进行发酵的优点是可防止发酵培养基中污染细菌的生长。

这种方法可在工业规模上进行。这种方法的产物是一种或多种甜菊醇糖苷。

从发酵培养基中回收甜菊醇糖苷可通过本领域已知的方法进行,例如通过蒸馏、真空萃取、溶剂萃取或蒸发。

在用于产生根据本发明的甜菊醇糖苷的方法中,实现高于5mg/l发酵液、优选高于10mg/l、优选高于20mg/l、优选高于30mg/l发酵液、优选高于40mg/l、更优选高于50mg/l、优选高于60mg/l、优选高于70、优选高于80mg/l、优选高于100mg/l、优选高于1g/l、优选高于5g/l、优选高于10g/l,例如至少约15g/l,例如至少约20g/l的浓度是可行的。

本发明还提供了一种包含能够通过本发明的用于制备甜菊醇糖苷的方法获得的甜菊醇糖苷的发酵液。

在本发明的重组宿主中表达一种或多种甜菊醇糖苷的情况下,可需要处理此类细胞以释放它们。优选地,在细胞外产生至少一种甜菊醇糖苷,例如reba或rebm。

本发明还提供了一种通过根据本发明的用于制备甜菊醇糖苷的方法获得的或能够从本发明的发酵液获得的甜菊醇糖苷。这种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷,也就是说不在植物中产生的甜菊醇糖苷。

还提供了通过本发明的方法能够获得的组合物(其通常包含一种或多种甜菊醇糖苷)。本发明还提供了一种包含能够通过用于制备甜菊醇糖苷的本发明的方法获得的或能够从本发明的发酵液获得的两种或更多种甜菊醇糖苷的组合物。在这种组合物中,一种或多种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷,也就是说不在植物中产生的甜菊醇糖苷。这些都是本发明的组合物。

本发明的组合物可用于对于此类化合物来说已知的任何应用中。特别地,这样的组合物可例如用作甜味剂,例如用于食品或饮料中。因此,根据本发明,提供了一种包含本发明的组合物的食品、饲料或饮料。

例如,本发明的组合物可被配制成软饮料、配制为桌面甜味剂、口香糖、乳制品如酸奶(例如原味酸奶)、蛋糕、谷物或基于谷类的食物、营养食品、药物、食用凝胶、糖果产品、化妆品、牙膏或其它口腔组合物等。此外,本发明的组合物可用作甜味剂,不仅用于饮料、食品和其它专门用于人消费的产品,而且用于具有改进的特性的动物饲料和草料中。

因此,本发明尤其提供了一种包含本发明的组合物的食品、饲料或饮料。

在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。

本发明的组合物可以干或液体的形式使用。它可在食品热处理之前或之后加入。甜味剂的量取决于使用目的。它可单独添加或与其它化合物组合添加。

本发明的组合物可与一种或多种其它非热量或热量甜味剂掺混。这种掺混可用于改进风味或时间特征或稳定性。广泛范围的非热量和热量甜味剂二者可适用于与本发明的组合物掺混。例如,非热量甜味剂如罗汉果苷、莫纳甜、阿斯巴甜、安赛蜜盐、环磺酸盐、三氯蔗糖、糖精盐或赤藓糖醇。适用于与本发明的甜菊醇糖苷或组合物掺混的热量甜味剂包括糖醇和碳水化合物如蔗糖、葡萄糖、果糖和hfcs。还可使用甜味氨基酸,如甘氨酸、丙氨酸或丝氨酸。

本发明的组合物可与甜味剂抑制剂如天然甜味剂抑制剂组合使用。它可与鲜味增强剂如氨基酸或其盐组合。

本发明的组合物可与多元醇或糖醇、碳水化合物、生理活性物质或功能成分(例如类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、营养品、类黄酮、异硫氰酸酯、苯酚、植物甾醇或甾烷醇(植物甾醇和植物甾烷醇)、多元醇、益生元、益生菌、植物雌激素、大豆蛋白、硫化物/硫醇、氨基酸、蛋白质、维生素、矿物质和/或基于健康益处如心血管、降胆固醇或抗炎分类的物质组合。

本发明的组合物可包括调味剂、芳香组分、核苷酸、有机酸、有机酸盐、无机酸、苦味化合物、蛋白质或蛋白质水解产物、表面活性剂、类黄酮、收敛剂化合物、维生素、膳食纤维、抗氧化剂、脂肪酸和/或盐。

本发明的组合物可作为高强度甜味剂应用,以产生具有改进的味道特征的零卡路里、低卡路里或糖尿病人用饮料和食品。它也可用于不能使用糖的饮料、食品、药物和其他产品中。

此外,本发明的组合物可用作甜味剂,不仅用于饮料、食品和其它专门用于人消费的产品,而且用于具有改进的特性的动物饲料和草料中。

本发明的组合物可用作甜味化合物的产品的实例可以是酒精饮料,如伏特加酒、葡萄酒、啤酒、烈酒、清酒等;天然果汁、提神饮料、碳酸软饮料、减肥饮料、零卡路里饮料、低卡路里饮料和食物、酸奶饮料、速溶果汁、速溶咖啡、粉末型速溶饮料、罐装产品、糖浆、发酵大豆酱、酱油、醋、调味品、蛋黄酱、番茄酱、咖喱、汤、速食肉汤、酱油粉、醋粉、多种类型的饼干、香米饼、咸饼干、面包、巧克力、焦糖、糖果、口香糖、果冻、布丁、蜜饯和腌菜、鲜奶油、果酱、橘子酱、糖花膏、奶粉、冰淇淋、冰糕、包装在瓶中的蔬菜和水果、罐装和煮熟的豆类、在甜味酱中煮熟的肉和食物、农业蔬菜食品、海鲜、火腿、香肠、鱼火腿、鱼香肠、鱼酱、油炸鱼制品、干制海产品、冷冻食品、腌渍海带、腊肉、烟草、医药产品等。原则上它可具有无限应用。

甜味组合物包括饮料,其非限制性实例包括非碳酸和碳酸饮料,如可乐、姜汁汽水、根汁汽水、苹果汁、水果味软饮料(例如柑橘味软饮料,如柠檬莱姆或橙汁)、软饮料粉等;来自水果或蔬菜的汁、包括榨汁等的汁、含有果粒的果汁、水果饮料、果汁饮料、含果汁的饮料、具有水果调味料的饮料、蔬菜汁、含蔬菜的汁以及含水果和蔬菜的混合汁;运动饮料、能量饮料、近水(nearwater)等的饮料(例如具有天然或合成调味剂的水);茶类或喜好型饮料如咖啡、可可、红茶、绿茶、乌龙茶等;含乳成分饮料如乳饮料、含乳成分咖啡、牛奶咖啡、奶茶、果奶饮料、饮用酸奶、乳酸菌饮料等;以及乳制品。

通常,甜味组合物中存在的甜味剂的量取决于甜味组合物的具体类型及其所需的甜度而广泛变化。本领域的普通技术人员可容易确定加入到甜味组合物中的甜味剂的适当量。

在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。

因此,掺入了本发明的组合物的组合物可通过本领域的技术人员已知的提供成分的均匀或均质混合物的任何方法来制备。这些方法包括干混、喷雾干燥、团聚、湿法制粒、压实、共结晶等。

呈固体形式时,本发明的组合物可以适于递送到待甜化的食物中的任何形式提供给消费者,所述形式包括小袋、小包、散装袋或盒、方块、片剂、喷雾或可溶解的条。所述组合物可以单位剂量或散装形式递送。

对于液体甜味剂体系和组合物而言,应开发方便范围的流体、半流体、糊状和膏状形式、使用任何形状或形式的适当包装材料的适当包装,其便于携带或分配或储存或运输含有任何上述甜味剂产品或上述产生的产品的组合的任何组合。

本发明的组合物可包含多种填充剂、功能成分、着色剂、调味剂。

术语“序列同源性”或“序列同一性”或“同源性”或“同一性”在本文中可互换使用。出于本发明的目的,在此定义为了确定两个氨基酸序列或两个核酸序列的序列同源性或序列同一性的百分比,出于最佳比较目的比对所述序列。为了优化两个序列之间的比对,可在比较的两个序列中的任一个中引入空位。这种比对可在所比较的序列的全长上进行。或者,比对可在更短的长度上进行,例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一性是在所报告的比对区域上两个序列之间的相同匹配的百分比。

两个序列之间的序列比较和序列同一性百分比的确定可使用数学算法来完成。本领域的技术人员将意识到以下事实:若干不同的计算机程序可用于比对两个序列并确定两个序列之间的同一性(kruskal,j.b.(1983)anoverviewofsequencecomparisonind.sankoffandj.b.kruskal,(编辑),timewarps,stringeditsandmacromolecules:thetheoryandpracticeofsequencecomparison,第1-44页addisonwesley)。两个氨基酸序列之间或两个核苷酸序列之间的序列同一性百分比可使用用于两个序列的比对的needleman和wunsch算法来确定(needleman,s.b.和wunsch,c.d.(1970)j.mol.biol.48,443-453)。氨基酸序列和核苷酸序列两者均可通过所述算法进行比对。needleman-wunsch算法已在计算机程序needle中实现。出于本发明的目的,使用了来自emboss包的needle程序(2.8.0版或更高版本,emboss:theeuropeanmolecularbiologyopensoftwaresuite(2000)rice,p.longden,i.和bleasby,a.trendsingenetics16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列而言,eblosum62用于取代矩阵。对于核苷酸序列而言,使用ednafull。所使用的任选参数是空位开放罚分为10,以及空位延伸罚分为0.5。技术人员将理解的是,所有这些不同的参数将产生稍微不同的结果,但是当使用不同的算法时,两个序列的总体同一性百分比没有显著改变。

在通过如上所述的程序needle进行比对后,查询序列与本发明的序列之间的序列同一性的百分比计算如下:在两个序列中显示相同氨基酸或相同核苷酸的比对中的相应位置的数目除以在减去比对中的总空位数后比对的总长度。如本文定义的同一性可通过使用nobrief选项从needle获得,并且在程序的输出中标记为“最长同一性”。

本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行针对公共数据库的检索,以例如鉴定其它家族成员或相关序列。此类搜索可使用altschul等人(1990)j.mol.biol.215:403—10的nblast和xblast程序(2.0版)进行。blast核苷酸搜索可用nblast程序(得分=100、字长=12)来进行,以获得与本发明的核酸分子同源的核苷酸序列。blast蛋白质搜索可用xblast程序(得分=50、字长=3)来进行,以获得与本发明的蛋白分子同源的氨基酸序列。为了获得用于比较目的的空位比对,可利用如在altschul等人,(1997)nucleicacidsres.25(17):3389-3402中描述的空位blast。当利用blast和空位blast程序时,可使用相应程序(例如xblast和nblast)的默认参数。参见美国国家生物技术信息中心http://www.ncbi.nlm.nih.gov/的主页。

标准遗传技术,例如在宿主细胞中过表达酶、宿主细胞的遗传修饰或杂交技术是本领域已知的方法,例如sambrook和russel(2001)“molecularcloning:alaboratorymanual(第3版),coldspringharborlaboratory,coldspringharborlaboratorypress或f.ausubel等编,“currentprotocolsinmolecularbiology”,greenpublishingandwileyinterscience,newyork(1987)中所述。转化、遗传修饰真菌宿主细胞的方法等从例如ep-a-0635574、wo98/46772、wo99/60102和wo00/37671、wo90/14423、ep-a-0481008、ep-a-0635574和us6,265,186中获知。

本发明的一些实施方式:

1.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主过表达介导甜菊醇糖苷转运的多肽,并且所述多肽包含seqidno:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。

2.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主已被修饰,优选在其基因组中被修饰,以导致介导甜菊醇糖苷转运的多肽的产生缺陷,并且所述多肽包含seqidno:29所示的氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。

3.根据权利要求1所述的重组宿主,所述重组宿主包含编码多肽的重组核酸,所述多肽包含seqidno:29所示氨基酸序列或与其具有至少约50%序列同一性的氨基酸序列。

4.根据前述实施方式中任一种所述的重组宿主,其包含一种或更多种编码以下多肽的重组核苷酸序列:

具有对映-柯巴基焦磷酸合酶活性的多肽;

具有对映-贝壳杉烯合酶活性的多肽;

具有对映-贝壳杉烯氧化酶活性的多肽;以及

具有贝壳杉烯酸13-羟化酶活性的多肽。

5.根据前述实施方式中任一种所述的重组宿主,其包含编码具有nadph-细胞色素p450还原酶活性的多肽的重组核酸序列。

6.根据前述实施方式中任一种所述的重组宿主,其包含编码以下项中的一种或更多种的重组核酸序列:

(i)具有ugt74g1活性的多肽;

(ii)具有ugt2活性的多肽;

(iii)具有ugt85c2活性的多肽;和

(iv)具有ugt76g1活性的多肽。

7.根据前述实施方式中任一种所述的重组宿主,其中所述宿主属于saccharomyces、aspergillus、pichia、kluyveromyces、candida、hansenula、humicola、issatchenkia、trichosporon、brettanomyces、pachysolen、yarrowia、yamadazyma或escherichia属中的一种。

8.根据实施方式7所述的重组宿主,其中所述重组宿主是saccharomycescerevisiae细胞、yarrowialipolytica细胞、candidakrusei细胞、issatchenkiaorientalis细胞或escherichiacoli细胞。

9.根据前述实施方式中任一种所述的重组宿主,其中所述宿主产生香叶基香叶基二磷酸(ggpp)的能力被上调。

10.根据前述实施方式中任一种所述的重组宿主,其包含编码以下项中的一种或多种的核酸序列:

具有羟甲基戊二酰基-辅酶a还原酶活性的多肽;或者

具有法尼基-焦磷酸合成酶活性的多肽

11.一种能够产生甜菊醇糖苷的重组宿主,所述重组宿主过表达介导甜菊醇糖苷转运的异源多肽。

12.一种制备甜菊醇糖苷的方法,所述方法包括在合适的发酵培养基中发酵根据前述实施方式中任一种所述的重组宿主,以及任选地回收所述甜菊醇糖苷。

13.根据实施方式12所述的制备甜菊醇糖苷的方法,任选地其中所述方法以工业规模进行。

14.一种发酵液,其包含通过根据实施方式12或13所述的方法能够获得的甜菊醇糖苷。

15.通过根据实施方式12或13所述的方法获得的或者从根据实施方式14所述的发酵液获得的甜菊醇糖苷。

16.通过根据实施方式12或13所述的方法能够获得的组合物,包含两种或更多种通过根据实施方式12或13所述的方法获得的甜菊醇糖苷的组合物或从根据实施方式14所述的发酵液获得的组合物。

17.一种食品、饲料或饮料,其包含根据权利要求15所述的甜菊醇糖苷或根据权利要求16所述的组合物。

在本文对专利文件或作为现有技术给出的其他材料的引用不应被认为承认该文件或材料是已知的或它包含的信息是任何这些权利要求的优先权日时公知常识的一部分。

在本文所述的每个参考文献的披露均通过引用以其全部内容并入本文。

本发明通过以下实施例来进一步说明:

实施例

概述

标准遗传技术(如在宿主细胞中过表达酶以及宿主细胞的另外遗传修饰)是本领域已知的方法,例如在sambrook和russel(2001)"molecularcloning:alaboratorymanual(第3版),coldspringharborlaboratory,coldspringharborlaboratorypress,或f.ausubel等人编辑,"currentprotocolsinmolecularbiology",greenpublishingandwileyinterscience,newyork(1987)中所描述的。用于真菌宿主细胞的转化和遗传修饰的方法从例如ep-a-0635574、wo98/46772、wo99/60102和wo00/37671中获知。

实施例1:甜菊醇糖苷产生菌株ml14094(mat-a谱系)的描述

将接合型mata和matb的两种yarrowialipolytica菌株工程化以用于甜菊醇糖苷的产生。将这些菌株接合,二倍体孢子形成,并选择具有甜菊醇糖苷产生的孢子。将这些孢子中的一个进一步开发用于产生甜菊醇糖苷,包括产生莱鲍迪甙a。

步骤1:用5个限定的dna片段转化菌株ml10371(mat-a、lys1-、ura3-、leu2-)。所有转化通过乙酸锂/peg真菌转化方案方法进行,并在适当的基本培养基ypd+100μg/ml诺尔丝菌素或ypd+100μg/ml潮霉素上选择转化体。

1)在质粒mb6969(图1)的hindiii/noti消化后通过凝胶纯化分离的7.0kbdna片段。此构建体编码用于过表达连接至一起侧接lox位点(guldener等人,1996,lambert等人,2007)的ppgm启动子(seqidno:2)和xprt终止子(seqidno:9)以及hph潮霉素抗性基因的ugt2_1a(seqidno:1)的合成构建体,以及用于过表达缺乏连接至phsp启动子(seqidno:3)和cwpt终止子(seqidno:10)的5'膜锚定序列(thmgopt:seqidno:15)的密码子优化的y.lipolytica羟甲基戊二酰基-辅酶a还原酶开放阅读框的合成构建体。

2)在mb6856(图2)的hindiii/sspi消化后通过凝胶纯化分离的2.7kbdna片段。此构建体编码连接至phypo启动子(seqidno:4)和gpdt终止子(seqidno:11)的thmgopt(seqidno:15)。

3)在mb6857(图3)的sspi消化后通过凝胶纯化分离的2.5kbdna片段。此构建体编码连接至phsp启动子(seqidno:3)和cwpt终止子(seqidno:10)的thmgopt(seqidno:15)。

4)在mb6948(图4)的sspi消化后通过凝胶纯化分离的2.0kbdna片段。此构建体编码用于过表达连接至phsp启动子(seqidno:3)和cwpt终止子(seqidno:10)的密码子优化的y.lipolytica香叶基-香叶基-焦磷酸合成酶(ggsopt:seqidno:16)的合成构建体。

5)在mb6958(图5)的hindiii/sspi消化后通过凝胶纯化分离的2.2kbdna片段。此构建体编码连接至phypo启动子(seqidno:4)和gpdt终止子(seqidno:11)的ggsopt(seqidno:16)。所得菌株被指定为ml13462。

步骤2.用在质粒mb7015(图6)的sfii消化后通过凝胶纯化分离的9.7kb片段转化菌株ml13462。此构建体编码用于过表达连接至peno(seqidno:5)启动子和gpdt终止子(seqidno:11)的ugt1(seqidno:17),连接至phsp启动子(seqidno:3)和pgmt终止子(seqidno:12)的ugt3(seqidno:18),连接至pcwp(seqno:6)启动子和pgkt终止子(seqidno:13)的ugt4(seqidno:19),以及lox-侧接的诺尔丝菌素抗性标记(nat)的合成构建体。注意,lox位点的放置允许随后通过cre重组酶介导的重组去除诺尔丝菌素抗性。诺尔丝菌素抗性分离株被指定为ml13500。

步骤3.用在质粒mb6986(图7)的pvui/sapi消化后通过凝胶纯化分离的9.1kb片段转化菌株ml13500。此构建体编码连接至phsp启动子(seqidno:3)和cwpt终止子(seqidno:10)的thmgopt(seqidno:15)、lox侧接的ura3冲击(ura3blaster)原养型标记以及连接至phypo启动子(seqidno:4)和gpdt终止子(seqidno:11)的ggsopt(seqidno:16)。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的尿嘧啶原养型被指定为ml13723。

步骤4.用在质粒mb7059(图8)的sfii消化后通过凝胶纯化分离的18.1kb片段转化菌株ml13723。mb7059编码连接至pcwp启动子(seqidno:6)和cwpt终止子(seqidno:10)的tcps_sr(seqidno:20),连接至phypo启动子(seqidno:4)和gpdt终止子(seqidno:11)的tks_sr(seqidno:21),连接至phsp启动子(seqidno:3)和pgmt终止子(seqidno:12)的kah_4(seqidno:22),连接至ptpi启动子(seqidno:7)和pgkt终止子(seqidno:13)的ko_gib(seqidno:23),连接至peno启动子(seqidno:5)和xprt终止子(seqidno:9)的cpr_3(seqidno:24),以及天然y.lipolyticaleu2基因座。一种选择的莱鲍迪甙a产生转化体被指定为ml14032。

步骤5.将菌株ml14032划线至ypd并生长过夜,然后划线至5-foa板,以允许以前引入的ura3标记的重组介导的丧失。一种选择的5-foa抗性转化体被指定为ml14093。

步骤6.用在质粒mb7100(图9)的sfii消化后通过凝胶纯化分离的19.0kb片段转化菌株ml14093。mb7100编码连接至phypo启动子(seqidno:4)和cwpt终止子(seqidno:10)的tcps_sr(seqidno:20),连接至pcwp启动子(seqidno:6)和gpdt终止子(seqidno:11)的tks_sr(seqidno:21),连接至phsp启动子(seqidno:3)和pgmt终止子(seqidno:12)的kah_4(seqidno:22),连接至peno启动子(seqidno:5)和pgkt终止子(seqidno:13)的ko_gib(seqidno:23),连接至ptpi启动子(seqidno:7)和xprt终止子(seqidno:9)的cpr_3(seqidno:24),以及ura3冲击原养型标记。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的莱鲍迪甙a产生尿嘧啶原养型被指定为ml14094。

实施例2.甜菊醇糖苷产生菌株ml14087(mat-b谱系)的描述:

步骤1.用5个限定的dna片段转化菌株ml13206(mat-b、ade1-、ure2-、leu2-)。所有转化通过乙酸锂/peg真菌转化方案方法进行,并在适当的基本培养基ypd+100μg/ml诺尔丝菌素或ypd+100μg/ml潮霉素上选择转化体。

1)在质粒mb6969(图1)的hindiii/noti消化后通过凝胶纯化分离的7.0kbdna片段。此构建体编码用于过表达连接至一起侧接lox位点(guldener等人,1996,lambert等人,2007)的ppgm(seqidno:2)启动子和xprt终止子(seqidno:9)以及hph潮霉素抗性基因的ugt2_1a(seqidno:1)的密码子对优化的(cpo)orf的合成构建体,以及用于过表达缺乏连接至phsp启动子(seqidno:3)和cwpt终止子(seqidno:10)的5'膜锚定序列(thmgopt:seqidno:15)的密码子优化的解脂耶氏酵母羟甲基戊二酰基-辅酶a还原酶开放阅读框的合成构建体。

2)在mb6856(图2)的hindiii/sspi消化后通过凝胶纯化分离的2.7kbdna片段。此构建体编码连接至phypo启动子(seqidno:4)和gpdt终止子(seqidno:11)的thmgopt(seqidno:15)。

3)在mb6857(图3)的sspi消化后通过凝胶纯化分离的2.5kbdna片段。此构建体编码连接至phsp启动子(seqidno:3)和cwpt终止子(seqidno:10)的thmgopt(seqidno:15)。

4)在mb6948的sspi消化后通过凝胶纯化分离的2.0kbdna片段(图4)。此构建体编码用于过表达连接至phsp启动子(seqidno:3)和cwpt终止子(seqidno:10)的密码子优化的y.lipolytica香叶基-香叶基-焦磷酸合成酶(ggsopt:seqidno:16)的合成构建体。

5)在mb6958(图5)的hindiii/sspi消化后通过凝胶纯化分离的2.2kbdna片段。此构建体编码连接至phypo(seqidno:4)启动子和gpdt终止子(seqidno:11)的ggsopt(seqidno:16)。所得菌株被指定为ml13465。

步骤2.用2个限定的dna片段转化菌株ml13465:

1).在质粒mb7015(图6)的sfii消化后通过凝胶纯化分离的9.7kb片段。此构建体编码用于过表达连接至peno启动子(seqidno:5)和gpdt(seqidno:11)终止子的ugt1(seqidno:17),连接至phsp启动子(seqidno:3)和pgmt终止子(seqidno:12)的ugt3(seqidno:18),连接至pcwp启动子(seqno:6)和pgkt终止子(seqidno:13)的ugt4(seqidno:19),以及lox-侧接的诺尔丝菌素抗性标记(nat)的合成构建体。注意,lox位点的放置允许随后通过cre重组酶介导的重组去除诺尔丝菌素抗性。

2).在质粒mb6988(图10)的pvui/sapi消化后通过凝胶纯化分离的9.1kb片段。此构建体编码连接至phsp启动子(seqidno:3)和cwpt终止子(seqidno:10)的thmgopt(seqidno:15)、lox侧接的ura2冲击原养型标记以及连接至phypo启动子(seqidno:4)和gpdt终止子(seqidno:11)的ggsopt(seqidno:16)。在ypd+100μg/ml诺尔丝菌素上选择菌株,并将复制物接种到缺乏尿嘧啶的基本培养基上。一种诺尔丝菌素抗性尿嘧啶原养型分离株被指定为ml13490

步骤3.将菌株ml13490划线至ypd并生长过夜,然后划线至5-foa板,以允许以前引入的ura2标记的重组介导的丧失。一种选择的5-foa抗性转化体被指定为ml13501。

步骤4.用在质粒mb6988(图10)的pvui/sapi消化后通过凝胶纯化分离的9.1kb片段转化菌株ml13501。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的尿嘧啶原养型微生物被指定为ml13724。

步骤5.用在质粒mb7044(图11)的sfii消化后通过凝胶纯化分离的18.1kb片段转化菌株ml13724。mb7044编码连接至phypo启动子(seqidno:4)和cwpt终止子(seqidno:10)的tcps_sr(seqidno:20),连接至pcwp启动子(seqidno:6)和gpdt终止子(seqidno:11)的tks_sr(seqidno:21),连接至phsp启动子(seqidno:3)和pgmt终止子(seqidno:12)的kah_4(seqidno:22),连接至peno启动子(seqidno:5)和pgkt终止子(seqidno:13)的ko_gib(seqidno:23),连接至ptpi启动子(seqidno:7)和xprt终止子(seqidno:9)的cpr_3(seqidno:24)以及leu2基因座。一种选择的莱鲍迪甙a产生转化体被指定为ml14044。

步骤6.将菌株ml14044划线至ypd并生长过夜,且然后划线至5-foa板,以允许以前引入的ura2标记的重组介导的损失。一种选择的5’-foa抗性转化体被指定为ml14076。

步骤7.用在质粒mb7094(图12)的sfii消化后通过凝胶纯化分离的19.0kb片段转化菌株ml14076。mb7094编码连接至phypo启动子(seqidno:4)和cwpt终止子(seqidno:10)的tcps_sr(seqidno:20),连接至pcwp启动子(seqidno:6)和gpdt终止子(seqidno:11)的tks_sr(seqidno:21),连接至phsp启动子(seqidno:3)和pgmt终止子(seqidno:12)的kah_4(seqidno:22),连接至peno启动子(seqidno:5)和pgkt终止子(seqidno:13)的ko_gib(seqidno:23),连接至ptpi启动子(seqidno:7)和xprt终止子(seqidno:9)的cpr_3(seqidno:24)以及ura2冲击原养型标记。在缺乏尿嘧啶的基本培养基上选择转化体。一种选择的莱鲍迪甙a产生尿嘧啶原养型被指定为ml14087。

实施例3.接合mata和matb谱系并选择甜菊醇糖苷产生子代

允许具有互补营养缺陷(ade1+lys1-和ade1-lys1+)的相对接合型(ml14094和ml14087)的菌株接合,然后接种在仅允许二倍体生长的选择性培养基(缺乏腺嘌呤和赖氨酸的基本培养基)上。然后诱导二倍体细胞(ml14143)通过饥饿进行减数分裂和孢子形成,并将所得的单倍体子代复制接种以鉴定具有潮霉素和诺尔丝菌素抗性的原养型分离株。一种选择的莱鲍迪甙a产生菌株被指定为ml14737

实施例4.使菌株不含ugt21a

在用mb6128(图13)转化后从菌株ml14737去除潮霉素抗生素标记和诺尔丝菌素抗生素标记,所述mb6128编码用于组成型过表达cre重组酶的构建体。cre重组酶通过在lox66和lox71位点上的重组而缺失抗生素标记。非活性lox72位点留在基因组中(guldener等人,1996,lambert等人,2007)。质粒mb6128是一种cen质粒,其在解脂耶氏酵母中以附加体的形式复制并且其含有在天然y.lipolyticaphhf启动子和hhft终止子控制下的cre重组酶编码区以及在天然y.lipolyticaptef1启动子和xprt终止子控制下的neor(编码g418抗性)。在ypd+g418上选择mb6128转化体并通过成功的cre-lox重组筛选丧失潮霉素和诺尔丝菌素抗性的转化体后,将敏感菌落生长在非选择性培养基上以去除mb6128cen质粒(cen质粒自发丧失)。所得到的不含抗生素标记的变体被指定为ml14869。由于ugt2_1a连同潮霉素抗性的丧失,此菌株不再产生莱鲍迪甙a,而是产生中间体甜茶苷。

实施例5.引入ugt2_10b

用通过pcr产生且在凝胶电泳后纯化的4.2kbdna片段转化ml14869。该片段编码潮霉素抗性和ugt2_10b(seqidno:25)的序列优化变体。如下所述通过融合pcr产生dna片段。ugt2_10b是针对y.lipolytica中的表达而密码子对优化的,其由dna2.0合成,与天然y.lipolyticaphsp启动子和gpdt终止子相连且侧翼是是连接子序列。使用合适的寡核苷酸扩增该1.4kbdna片段,并通过凝胶电泳纯化。hph标记侧翼为lox位点,与ashbyagossypiiptef1启动子和tef1t终止子相连且侧翼是是连接子序列。使用合适的寡核苷酸扩增该1.8kbdna片段,并通过凝胶电泳纯化。通过使用这两个dna片段进行pcr,随后进行凝胶电泳和纯化来获得4.2kbdna片段。用这种确定的dna片段转化ml14869并在ypd+100ug/ml潮霉素上进行选择,得到了产生莱鲍迪甙a的菌株ml14937。

实施例6.使菌株ml14937不含标记

在用编码用于组成型过表达cre重组酶的构建体的mb6128(图13)转化之后,从菌株ml14937中除去潮霉素抗生素标记。cre重组酶通过在lox66和lox71位点上重组使抗生素标记缺失。失活的lox72位点留在基因组中(güldener等,1996;lambert等,2007)。质粒mb6128是一种cen质粒,其在y.lipolytica中附加性复制,并含有受天然y.lipolyticaphhf启动子控制的cre重组酶编码区、hhft终止子、受天然y.lipolyticaptef1启动子控制的neor(编码g418抗性)以及xprt终止子。在于ypd+g418上选择mb6128转化体并筛选通过成功的cre-lox重组而丢失潮霉素和诺尔丝菌素抗性的转化体后,使敏感性菌落在非选择性培养基上生长以除去mb6128cen质粒(cen质粒自发丢失)。所得到的不含抗生素标记的变体被指定为ml14958。

实施例7.用额外的基因拷贝进行转化

将菌株ml14958划线到ypd上并生长过夜,然后划线到5-foa板上以允许ura2标记的重组介导的丢失。一个选择的5'-foa抗性转化体被指定为ml15075。用3个确定的dna片段转化菌株ml15075,并在含有100μg/ml潮霉素的ypd上选择转化。所述三个片段如下:

1)4.6kbdna片段,其编码与天然y.lipolyticaphypo启动子和xprt终止子相连的kah开放阅读框,还编码侧翼为lox位点的hph潮霉素抗性基因,其是通过pcr产生的并在凝胶电泳后纯化。在saccharomycescerevisiae中组装序列,来自该s.cerevisiae菌株的dna被用作pcr模板,产生了用于转化ml15075的4.6kbdna片段(参见图14)。

2)3.3kbdna片段,其编码与天然y.lipolyticaphsp启动子和xprt终止子相连的tcps开放阅读框,其是通过pcr产生的并在凝胶电泳后纯化。在saccharomycescerevisiae中组装序列,来自该s.cerevisiae菌株的dna被用作pcr模板,产生了用于转化ml15075的3.3kbdna片段(图15)。

3)9.1kb片段,其是在pvui/sapi消化质粒mb6986后通过凝胶纯化分离的(图16)。该构建体编码与天然y.lipolyticahsp启动子和cwp终止子相连的thmg、侧翼为lox的ura3冲击原养型标记以及与天然y.lipolyticahypo启动子和gpd终止子相连的ggs1。由于ura2的突变使ml15075是营养缺陷型,因此未选择该片段。

一种选择的潮霉素抗性转化体被指定为ml15085。

实施例8.转化thmg和ggs的额外拷贝

用8.4kb片段转化菌株ml15085,所述8.4kb片段是在pvui/sapi消化质粒mb6988后通过凝胶纯化分离的(图10)。该构建体编码与天然y.lipolytica的phsp启动子和cwpt终止子相连的thmgopt、侧翼为lox的ura2冲击原养型标记以及与天然y.lipolyticahypo启动子和gpdt终止子相连的ggsopt。在缺乏尿嘧啶的基本培养基上选择转化体。一个选择的尿嘧啶原养型被指定为ml15086。

实施例9.使菌株ml15086不含标记

在用编码用于组成型过表达cre重组酶的构建体的mb6128(图13)转化之后,从菌株ml15086中除去潮霉素抗生素标记。cre重组酶通过在lox66和lox71位点上重组使抗生素标记缺失。失活的lox72位点留在基因组中(güldener等,1996;lambert等,2007)。质粒mb6128是一种cen质粒,其在y.lipolytica中附加性复制,并含有受天然y.lipolyticaphhf启动子控制的cre重组酶编码区、hhft终止子、受天然y.lipolyticaptef1启动子控制的neor(编码g418抗性)以及xprt终止子。

在于ypd+g418上选择mb6128转化体并筛选通过成功的cre-lox重组而丢失潮霉素和诺尔丝菌素抗性的转化体后,使敏感性菌落在非选择性培养基上生长以除去mb6128cen质粒(cen质粒自发丢失)。一种原养型、不含抗生素标记的变体被指定为ml15087。

实施例10.破坏y.lipolyticaml15087中的yali0c08701

为了提高靶向转运体破坏的效率并避免基因组中不被靶向的其它基因座上的整合事件,破坏yali0c08701(seqidno:26),其是非同源末端连接中的重要因子。基于单交换整合设计破坏构建体,其中使用内部同源片段将破坏构建体靶向yali0c08701orf。使用利用恰当的连接子序列延伸的合适引物从y.lipolytica基因组dnapcr扩增用于组装破坏构建体的内部同源片段。pcr片段的总长度为600bp。这些片段的500bp与靶向的yali0c08701同源,50bp与载体骨架和kanmx标记盒同源。用合适的引物pcr扩增kanmx标记盒。对于两个侧翼和标记盒,使用phusion聚合酶(newenglandbiolabs)根据供应商的说明进行六个50μl的pcr反应。使用nucleospingel和pcrclean-up试剂盒(macherynagel)纯化和浓缩pcr产物。

通过将两个侧翼、kanmx片段和线性prs4175_3穿梭载体转化到s.cerevisiaecen.pk113-7d中,在体内将侧翼和标记组装在snabi/pmei消化的prs4175_3(图17)穿梭载体骨架中。转化并在30℃下在yephd中恢复2小时后,将细胞涂布在含有200μg/mlg418(invitrogen)的yephd琼脂上。将板在30℃下孵育2天。在30℃下在yepd+200μg/mlg418中培养转化体。分离并纯化质粒dna。

利用诊断pcr确定破坏盒的正确组装。在六个50μlpcr反应中pcr扩增表达盒。使用nucleospingel和pcrclean-up试剂盒(macherynagel)纯化和浓缩pcr产物。将1μgpcr扩增的破坏盒转化到y.lipolytica菌株ml15087中。转化并在30℃下在yephd中恢复2小时后,将细胞涂布在含有400μg/mlg418的yephd琼脂上。将板在30℃下孵育2天。通过将转化体重新划线在含有400μg/mlg418的yephd琼脂上来对其进行纯化。其中一个转化体被命名为stv2049。使用适当的寡核苷酸,利用诊断pcr确定正确的整合。

实施例11.破坏y.lipolyticastv2049中的转运体yali0e25201

基于单交换整合设计破坏构建体,其中使用内部同源片段将破坏构建体靶向yali0e25201orf(seqidno:27)。用于组装破坏构建体的内部同源片段以总长度为700bp的gblocks(idt)的形式的合成dna订购。这些片段的600bp与靶向转运体yali0e25201同源,50bp与载体骨架(5和3连接子序列,图18)和hygb标记盒(c和d连接子序列,图18)同源。使用phusion聚合酶(newenglandbiolabs)根据供应商的说明,利用合适的引物pcr扩增hygb标记盒。使用nucleospingel和pcrclean-up试剂盒(macherynagel)纯化和浓缩pcr产物。

通过将两个侧翼、hygb片段和线性prs4175_3穿梭载体转化到s.cerevisiaecen-pk-7d中,在体内将侧翼和标记组装在snabi/pmei消化的prs4175_3穿梭载体骨架中。参见图18。

转化并在30℃下在yephd中恢复2小时后,将细胞涂布在含有200μg/mlg418(invitrogen)的yephd琼脂上。将板在30℃下孵育2天。在30℃、550rpm和80%湿度下,在yepd+200μg/mlg418中培养转化体。分离并纯化质粒dna。利用诊断pcr确定破坏盒的正确组装。

在6个50μlpcr反应中pcr扩增(图19)表达盒。使用nucleospingel和pcrclean-up试剂盒(macherynagel)纯化和浓缩pcr产物。将1μgpcr扩增的破坏盒转化到至y.lipolyticastv2049中。转化并在30℃下在yephd中恢复2小时后,将细胞涂布在含有100μg/mlhygb(invitrogen)的yephd琼脂上。将板在30℃下孵育2天。通过将转化体重新划线在含有100μg/mlhygb的yephd琼脂上来对其进行纯化。使用适当的寡核苷酸,利用诊断pcr确定正确的整合,如图20所示。

实施例12.发酵y.lipolyticastv2049和stv2049yali0e25201破坏转化体

用来自yeph-d琼脂的菌落物质接种预培养物。使预培养物在每个孔含有200μl0.5xyep的96半深孔板中生长,所述0.5xyep含有2%葡萄糖。用透气密封物密封板,并在30℃、80%湿度、750rpm的infors培养箱中孵育48小时。

使用40μl96孔预培养物接种每个孔含有2.5ml0.25×yep的24孔深孔板,所述0.25xyep含有5%葡萄糖。用透气密封物密封板,并在30℃、80%湿度、500rpm的infors培养箱中孵育120小时。

在mtp离心机中离心24孔板并收集1ml上清液。从沉淀中倾析剩余的上清液。

将上清液级分在33%乙腈中稀释1000倍。将沉淀悬浮在2.5mlmilli-q中,并将1ml转移到96孔dwp中。用铝密封物密封板并在90℃下孵育10分钟。将板冷却至室温,加入0.5ml100%乙腈并均化。将板在2088xg下离心10分钟以沉淀细胞材料和碎片。将沉淀级分的上清液在33%乙腈中稀释33倍,从而导致了组合的50倍稀释。使用lc/ms分析样品的莱鲍迪甙a和其他甜菊醇糖苷。

我们发现:与亲本菌株相比,具有yali0e25201破坏的菌株在上清液中产生了更低滴度的莱鲍迪甙a。与亲本菌株相比,转运体破坏菌株中莱鲍迪甙a的浓度低约三倍(见表1)。

表1.24孔发酵中的莱鲍迪甙a上清液浓度。对亲本菌株stv2049进行六个重复培养。进行三个独立的stv2049δyali0e25201转化体的重复培养。表1中的数据为取的平均值。

观察到:与参考菌株相比,转运体破坏菌株的上清液中莱鲍迪甙a的浓度较低对于甜菊苷、甜茶苷同样如此;对于莱鲍迪甙d和甜菊醇-19-单糖苷程度较小(参见表2至表5)。

表2.24孔发酵中的甜菊苷上清液浓度。对亲本菌株stv2049进行六个重复培养。进行三个独立的stv2049δyali0e25201转化体的重复培养。表2中的数据为取的平均值。

表3.24孔发酵中的甜茶苷上清液浓度。对亲本菌株stv2049进行六个重复培养。进行三个独立的stv2049δyali0e25201转化体的重复培养。表3中的数据为取的平均值。

表4.24孔发酵中的莱鲍迪甙d上清液浓度。对亲本菌株stv2049进行六个重复培养。进行三个独立的stv2049δyali0e25201转化体的重复培养。表4中的数据为取的平均值。

表5.24孔发酵中的甜菊醇-19-单糖苷上清液浓度。对亲本菌株stv2049进行六个重复培养。进行三个独立的stv2049δyali0e25201转化体的重复培养。表5中的数据为取的平均值。

破坏转运体基因的效果对上述甜菊醇糖苷的转运最为显著,且不是甜菊醇糖苷产生总体减少的结果。当在沉淀级分中测量所有甜菊醇糖苷的浓度时(表6),就说明了这一点。此处,可以看出:在yali0e25201破坏菌株中,转运体破坏菌株的沉淀级分中所有甜菊醇糖苷的浓度增加,指示转运减少。

表6.24孔发酵中的沉淀级分中所有甜菊醇糖苷(莱鲍迪甙a、甜菊苷、莱鲍迪甙b、莱鲍迪甙d、甜菊醇双糖苷、甜茶苷、甜菊醇-19-单糖苷、甜菊醇-13-单糖苷和莱鲍迪甙m)总和的浓度。对亲本菌株stv2049进行六个重复培养。进行三个独立的stv2049δyali0e25201转化体的重复培养。表6中的数据为取的平均值。

实施例13.在产生甜菊醇糖苷的y.lipolytica菌株中过表达yali0e25201转运体

为了进一步证明yali0e25201转运体的功能性,将yali0e25201orf与y.lipolyticayp006启动子和y.lipolyticatef4终止子组装在表达盒中。将盒与诺尔丝菌素标记一起组装在prs4175_3载体中。作为阴性对照,构建仅包含诺尔丝菌素标记的相同盒。pcr扩增表达盒,并将获得的片段转化到三种不同的菌株中:菌株stv2049是主要产生reba的菌株,如上所述。另外,还包括转运体缺失菌株(stv2049δyali0e25201(如上所述))。第三种菌株是stv2170,一种主要产生rebm的菌株。stv2170的构建与菌株stv2049相似,基因型列于下表7中。

表7.菌株stv2170的基因型。括号之间表示菌株中存在的基因拷贝数

针对菌株和表达盒的每种组合选择六个转化体。使转化体在24孔发酵中生长,并通过lc-ms分析上清液和沉淀级分,如实施例12中所述。

表8.对照菌株(具有natmx标记的stv2049)和yali0e25201转运体过表达菌株(具有转运体和natmx标记的stv2049)在24孔发酵中的reba上清液浓度和沉淀浓度

这些数据说明:yali0e25201转运体的过表达对细胞外reba产生具有正面影响。

表9.对照菌株(具有natmx标记的stv2049)和yali0e25201转运体过表达菌株(具有转运体和natmx标记的stv2049)在24孔发酵中的rebm上清液浓度和沉淀浓度

该菌株中的rebm产生低于reba产生,但即使如此,就rebm浓度也可以看出转运体过表达的效果。由于在yali0e25201过表达菌株中reba被更有效地输出到细胞外,所以细胞内进一步糖基化可用的reba较少,因此导致rebm产生较低,在沉淀级分中尤为如此。

表10.转运体缺失菌株(具有natmx标记的stv2049δyali0e25201)和过表达yali0e25201转运体的相同背景(具有转运体和natmx标记的stv2049δyali0e25201)在24孔发酵中的reba上清液浓度和沉淀浓度。

在yali0e25201缺失菌株中过表达yali0e25201转运体后,reba的细胞外产生大幅提高,并且回复至与没有转运体缺失的参考菌株相似的水平。

表11.转运体缺失菌株(具有natmx标记的stv2049δyali0e25201)和过表达yali0e25201转运体的相同背景(stv2049δyali0e25201yali0e25201o.e.)在24孔发酵中的rebm上清液浓度和沉淀浓度。

在转运体缺失菌株中,甜菊醇糖苷(包括reba)在细胞中积累,从而允许在细胞内继续糖基化。因此,rebm浓度可增加。在转运体缺失菌株中,沉淀级分中的rebm浓度远高于上清液中的rebm浓度。回复转运后,这被逆转:更少累积细胞内rebm,且更多输出rebm。

表12.rebm生产对照菌株(具有natmx标记的stv2170)和yali0e25201转运体过表达菌株(具有转运体和natmx标记的stv2170)在24孔发酵中的reba上清液浓度和沉淀浓度

yali0e25201转运体的过表达导致reba的细胞外产生大幅增加,以及沉淀中reba的积累大幅减少。

表13.rebm产生对照菌株(具有natmx标记的stv2170)和yali0e25201转运体过表达菌株(具有转运体和natmx标记的stv2170)在24孔发酵中的rebm上清液浓度和沉淀浓度

yali0e25201转运体的过表达导致rebm的细胞外产生增加,以及沉淀中rebm的积累减少。

这些数据共同表明:yali0e25201转运体的过表达对细胞外reba和rebm产生具有正面影响。当转运体过表达时,不仅相对于沉淀级分上清液级分中reba和rebm产生的分布是有利的,而且yali0e25201转运体的过表达也对reba和rebm产生的总量具有正面影响。

表14序列表说明

序列表

<110>帝斯曼知识产权资产管理有限公司

<120>甜菊醇糖苷转运

<130>31189-wo-pct

<150>62/204702

<151>2015-08-13

<160>34

<170>patentinversion3.5

<210>1

<211>1422

<212>dna

<213>artificialsequence

<220>

<223>ugt2_1acpofory.lipolitica

<400>1

atggccacctccgactccattgtcgacgaccgaaagcagctgcacgttgccaccttcccc60

tggctcgcctttggccacattctgccctacctccagctctccaagctcattgctgagaag120

ggccacaaggtttctttcctgtccaccacccgaaacatccagcgactctcctcccacatc180

tctcctctcatcaacgttgtccagctcaccctcccccgagtccaggagctccccgaggat240

gccgaggccaccactgatgtccaccccgaggacatcccctacctcaagaaggcctccgac300

ggtctgcagcccgaggtcacccgattcctcgagcagcactctcccgactggatcatctac360

gactacacccactactggctcccctccattgctgcttctctcggtatctctcgagcccac420

ttctccgtcaccaccccctgggccattgcttacatgggcccctctgctgacgccatgatc480

aacggttccgacggccgaaccaccgtcgaggatctcaccacccctcccaagtggttcccc540

ttccccaccaaggtctgctggcgaaagcacgatctcgcccgactcgtcccctacaaggcc600

cccggtatctccgacggttaccgaatgggtctggttctcaagggctccgactgtctgctc660

tccaagtgctaccacgagtttggtacccagtggctccccctgctcgagactctgcaccag720

gtccccgttgtccccgtcggtctgctccctcccgagatccccggtgacgagaaggacgag780

acttgggtttccatcaagaagtggctcgacggcaagcagaagggctccgtcgtctacgtt840

gctctcggctccgaggttcttgtctcccagactgaggtcgtcgagctcgccctcggtctg900

gagctctccggtctgcccttcgtctgggcctaccgaaagcccaagggtcccgccaagtcc960

gactccgtcgagctccccgacggtttcgtcgagcgaactcgagatcgaggtctggtctgg1020

acctcttgggctccccagctccgaatcctctcccacgagtccgtctgcggtttcctgacc1080

cactgtggttccggctccattgtcgagggcctcatgttcggccaccccctcatcatgctg1140

cccatcttcggtgaccagcccctcaacgcccgactcctcgaggacaagcaggtcggtatc1200

gagatcccccgaaacgaagaggacggctgcctcaccaaggagtctgttgcccgatctctg1260

cgatctgttgttgtcgagaaagagggtgagatctacaaggccaacgcccgagagctctcc1320

aagatctacaacgacaccaaggtcgagaaggagtacgtttcccagtttgtcgactacctc1380

gagaagaacgcccgagctgtcgccattgaccacgagagttaa1422

<210>2

<211>803

<212>dna

<213>yarrowialipolytica

<400>2

taccaaccacagattacgacccattcgcagtcacagttcactagggtttgggttgcatcc60

gttgagagtggtttgtttttaaccttctccatgtgctcactcaggttttgggttcagatc120

aaatcaaggcgtgaaccactgtttgaggacaaatgtgacacaaccaaccagtgtcagggg180

caagtccgtgacaaaggggaagatacaatgcaattactgacagttacggactgcctcgat240

gccctaaccttgccccaaaataagacaactgtcctcgtttaagcgcaaccctattcagcg300

tcacgtcataatagcgtttggatagcactagtctatgaggagcgttttatgttgcggtga360

gggcgattggtgctcatatgggttcaattgaggtggtggaacgagcttagtcttcaattg420

aggtgcgagcgacacaattgggtgtcacgtggcctaattgacctcggatcgtggagtccc480

cagttatacagcaaccacgaggtgcatgagtaggagacgtcaccagacaatagggttttt540

ttggactggagagggtagggcaaaagcgctcaacgggctgtttggggagctatgggggag600

gaattggcgatatttgtgaggttgacggctccgatttgcgtgttttgtcgcttctgcatc660

tccccatacccatatcttccctccccacctctttccacgataattttacggatcagcaat720

aaggttccttctcctagtttccacgtccatatatatctatgctgcgtcgtccttttcgtg780

acatcaccaaaacacatacaaaa803

<210>3

<211>995

<212>dna

<213>yarrowialipolytica

<400>3

ctgtacctgctgtggaccacgcacggcggaacgtaccgtacaaatattttcttgctcaca60

tgactctctctcggccgcgcacgccggtggcaaattgctcttgcattggctctgtctcta120

gacgtccaaaccgtccaaagtggcagggtgacgtgatgcgacgcacgaaggagatggccc180

ggtggcgaggaaccggacacggcgagccggcgggaaaaaaggcggaaaacgaaaagcgaa240

gggcacaatctgacggtgcggctgccaccaacccaaggaggctattttgggtcgctttcc300

atttcacattcgccctcaatggccactttgcggtggtgaacatggtttctgaaacaaccc360

cccagaattagagtatattgatgtgtttaagattgggttgctatttggccattgtggggg420

agggtagcgacgtggaggacattccagggcgaattgagcctagaaagtggtaccattcca480

accgtctcagtcgtccgaattgatcgctataactatcacctctctcacatgtctacttcc540

ccaaccaacatccccaacctcccccacactaaagttcacgccaataatgtaggcactctt600

tctgggtgtgggacagcagagcaatacggaggggagattacacaacgagccacaattggg660

gagatggtagccatctcactcgacccgtcgacttttggcaacgctcaattacccaccaaa720

tttgggctggagttgaggggaccgtgttccagcgctgtaggaccagcaacacacacggta780

tcaacagcaaccaacgcccccgctaatgcacccagtactgcgcaggtgtgggccaggtgc840

gttccagatgcgagttggcgaaccctaagccgacagtgtactttttgggacgggcagtag900

caatcgtgggcggagaccccggtgtatataaaggggtggagaggacggattattagcacc960

aacacacacacttatactacatgctagccacaaaa995

<210>4

<211>1004

<212>dna

<213>yarrowialipolytica

<400>4

gtcagaaggggcagctctaaacgaagaactgcggtcaggtgacacaactttttccatctc60

agggtgtgtcgcgtgtgcttcatccaaactttagttggggttcgggttcgcgcgagatga120

tcacgtgccctgatttggtgtcgtcccccgtcgcgctgcgcacgtgatttatttatttcc180

ggtggctgctgtctacgcggggccttctctgcccttctgtttcaaccttcgggcggttct240

cgtaaccagcagtagcaatccatttcgaaactcaaagagctaaaaacgttaaacctcagc300

agtcgctcgacgaatgggctgcggttgggaagcccacgaggcctatagccagagcctcga360

gttgacaggagcccagacgccttttccaacggcaacttttatataaaatggcaatgtatt420

catgcaattgcggccgtgtcaggttggagacactggaccacactctccattgcttcctga480

ggagatggatcattgctagtgcatctacgcgcagcaatcccgcaagctcgacaaccgtag540

atgggctttggtgggccaatcaattacgcaacccgcacgttaaattgtatgaggaaggaa600

ggccacggtacaaagtgggtggtcttcacccagtggttgttggtggcgtcatgcagacca660

tgcattggggatagcacagggttggggtgtcttgtggactcaatgggtgaaaggagatgg720

aaaagggcggtgaaaagtggtagaatcgaaatccctgacgtcaatttataaagtaaaatg780

cgtttctgccattttgctcccctccttctttcgcaatcgcctccccaaaagttgtcgtgg840

cagtacacatgcttgcatacaatgaagctaatccggcttgctcagtagttgctatatcca900

ggcatggtgtgaaacccctcaaagtatatataggagcggtgagccccagtctggggtctt960

ttctctccatctcaaaactactttctcacatgctagccacaaaa1004

<210>5

<211>1422

<212>dna

<213>yarrowialipolytica

<400>5

atttcttgtgtgtgcggcaaacgtagcaattgcaactgcataaacgatgattgtaaaagt60

atcacactttgctcagacaggttagattcacctggtacgagggcagtgtcttaaaggttc120

catctacctcggcccttgtttcttgaagagtggtcaatatgtgttttatacagctgaaat180

ttcccctgtatgttgagatcgtgtatattggtcataatctgggctctttagtcgatccca240

gttttctcgggcaagtttttttctccacaaagtaccgctggaaaactctatgtgacttgt300

tgacagattacttgggttatctgcgggatatgtcttggataggcaaccgggcatatatca360

ccgggcggactgttggttctgtacgtacatacagcactttgagctcatgtctcacacgca420

accatggtgcgtggaggctttggcatcctttctacttgtagtggctatagtacttgcagt480

ccaagcaaacatgagtatgtgcttgtatgtactgaaacccgtctacggtaatattttaga540

gtgtggaactatgggatgagtgctcattcgatactatgttgtcacccgatttgccgtttg600

cgaggtaagacacattcggtggttcaggcggctacttgtatgtagcatccacgttcatgt660

tttgtggatcagattaatggtatggatatgcacggggcgtttccccggtaacgtgtaggc720

agtccagtgcaacccagacagctgagctctctatagccgtgcgtgtgcggtcatatcacg780

ctacacttagctacagaataaagctcggtagcgccaacagcgttgacaaatagctcaagg840

gcgtggagcacagggtttaggaggttttaatgggcgagaaggcgcgtagatgtagtcttc900

ctcggtcccatcggtaatcacgtgtgtgccgatttgcaagacgaaaagccacgagaataa960

accgggagaggggatggaagtccccgaacagcaaccagcccttgccctcgtggacataac1020

ctttcacttgccagaactctaagcgtcaccacggtatacaagcgcacgtagaagattgtg1080

gaagtcgtgttggagactgttgatttgggcggtggaggggggtatttgagagcaagtttg1140

agatttgtgccattgagggggaggttattgtggccatgcagtcggatttgccgtcacggg1200

accgcaacatgcttttcattgcagtccttcaactatccatctcacctcccccaatggctt1260

ttaactttcgaatgacgaaagcacccccctttgtacagatgactatttgggaccaatcca1320

atagcgcaattgggtttgcatcatgtataaaaggagcaatcccccactagttataaagtc1380

acaagtatctcagtatacccgtctaaccacacatttatcacc1422

<210>6

<211>865

<212>dna

<213>yarrowialipolytica

<400>6

atgctcacttttgttgtcctgatgatctcccgttatttcgccgctcctctggaaaccatc60

cgcccgcaaatcccctctgcccatcttgacaatgcacaatgcatcattctcagcctgcat120

gaatgcgaaagatggcaatattggtggaggaggcgacggcggtaaacaatggagatagag180

accacaaaagagacctggagacccaaaatggactcacgacaactcccccactcccccact240

ccccatctccccctgggcatcagttgcccatcggtatctcaactgtcgcactagttagcg300

caaccatcacatactttagacgccaaacaatgggacaactcatcgcgccgaactatgggc360

agattttaactcgcacaacattaccccaactctaaaaggtaacctcgaccggaaaacggg420

aagacaggatcagcaaccgtgatcgacagaatcttcagggcactacagttgatagacata480

ggttatgttggtaggtctagacgggcctcggggaattgaccccaccagttgcaagtcacg540

tgcccctgatacagctagtttagcacatctgcccactacgtctggacgcaccatggtggt600

gccagtcgcgtgaactcaaacacccactagcctcgggaaggattcagttaaatccgcacc660

ttatttccaacacaaagaagcggttggcggacaaagaacatgtcctttctggggcactgt720

acattccaggactctgttcaaggtcaaatatacaaaacacagatagagaaacatagacag780

ctgcggccttataaatacctgggcgcacttctctctttttccctcctcatcacacattcg840

ttcaccactaagtcactcgttcaaa865

<210>7

<211>880

<212>dna

<213>yarrowialipolytica

<400>7

aaacaaaagagctgaaatcatatccttcagtagtagtatagtcctgttatcacagcatca60

attacccccgtccaagtaagttgattgggatttttgtttacagatacagtaatatacttg120

actatttctttacaggtgactcagaaagtgcatgttggaaatgagccacagaccaagaca180

agatatgacaaaattgcactattcgatgcagaattcgacggtgtttccattggtgttatg240

acattcatctgcattcatacaaaaaagtcttggtagtggtacttttgcgttattacctcc300

gatatctacgcaccccccaacccccctgctacagtaaagagtgtgagtctactgtacatg360

cttactaaaccacctactgtacagcgaaacccctcagcaaaatcacacaatcagctcatt420

acaacacacccaatgacctcaccacaaattctatacgccttttgacgccattattacagt480

agcttgcaacgccgttgtcttaggttccatttttagtgctctattacctcacttaacccg540

tataggcagatcaggccatggcactaagtgtagagctagaggttgatatcgccacgagtg600

ctccatcagggctagggtggggttagaaatacagtccgtgcgcactcaaaaggcgtccgg660

gttagggcatccgataatatcgcctggactcggcgccatattctcgacttctgggcgcgt720

tgtattcatctcctccgcttcccaacacttccacccgtttctccatcccaaccaatagaa780

tagggtaaccttattcgggacactttcgtcatacatagtcagatatacaagcaatgtcac840

tctccttcgtactcgtacatacaacacaactacattcaaa880

<210>8

<211>1000

<212>dna

<213>yarrowialipolytica

<400>8

caattcatgtatcgtgtcaattcatgtatcgtgtcaattcatgtatcgtgtcaatactta60

tatctcaagtggttgcatcgcaaacagccatcgcatactccactctactctcactgagtt120

cactcttacccggctccaccttctagaagccaccaccgatccaccgacgatgatcagtcc180

accacttgctctgaatgtgcgttggagctgcaccatgattgatgacgtcaccgccattca240

gatagggcaaaagacgagcgccaatcgcaacaatgggcgagtgtcgacgactcccccgct300

ctctgcggtttcagcgactccaaccgtcgccaaaagaccgtcattttcgtctaaagcgca360

gcccagcccatctcttctaaaagattccagaaagatagggttcaccaactacgcaccaat420

atgtacagtatcgtagctactccggcttggctgatctgagagatagagatggctccgaaa480

cgcggaaaacggcggggtcggaccgatcacgtgacacgtactcatccgtcgcgccccgag540

cgccatttcaacaccaaatactcccggtcacgtgccaccccgcccgctctacccacgaga600

tgtttctacactatacactgccacgccgtcatacctgcagctaggttaacattcgattaa660

ttagtggagtcaccagtgtacaggactatggcggaaaccgggttacacaaaccggcccgg720

aatagcagcattataccgctggacgagatcaccgtcaataaattgcgtcgttactcggga780

caaccattgctcctccggctacacctgctcaaaggacttgttccacactcttccccagct840

ctcccacgcaaacaaagagagcaaccttaagtggacagctcatgagcactcccctcgttt900

gctgcccacgctcgattatataaagaccagcggatccccttctatttggacttgcatcaa960

ccaaccacaacccacaccaagcacacaaagcacaagaaca1000

<210>9

<211>127

<212>dna

<213>yarrowialipolytica

<400>9

aattaacagatagtttgccggtgataattctcttaacctcccacactcctttgacataac60

gatttatgtaacgaaactgaaatttgaccagatattgttgtaaatagaaaatctggcttg120

taggtgg127

<210>10

<211>200

<212>dna

<213>yarrowialipolytica

<400>10

gttttttgatcaatgatccaatggctttcacatacccccccacgcctataattaaaacac60

agagaaatataatctaacttaataaatattacggagaatctttcgagtgttcagcagaaa120

tatagccattgtaacaaaagccggctatcgaccgctttatcgaagaatatttcccgcccc180

ccagtggccaaacgatatcg200

<210>11

<211>200

<212>dna

<213>yarrowialipolytica

<400>11

ctatccgaagatcaagagcgaagcaagttgtaagtccaggacatgtttcccgcccacgcg60

agtgatttataacacctctcttttttgacacccgctcgccttgaaattcatgtcacataa120

attatagtcaacgacgtttgaataacttgtcttgtagttcgatgatgatcatatgattac180

attaatagtaattactgtat200

<210>12

<211>200

<212>dna

<213>yarrowialipolytica

<400>12

acttcgagctaatccagtagcttacgttacccaggggcaggtcaactggctagccacgag60

tctgtcccaggtcgcaatttagtgtaataaacaatatatatattgagtctaaagggaatt120

gtagctattgtgattgtgtgattttcgtcttgctggttcttattgtgtcccattcgtttc180

atcctgatgaggacccctgg200

<210>13

<211>200

<212>dna

<213>yarrowialipolytica

<400>13

gctatttacagcatgtgtaatgaggaatataacgttgattgaattgtttgtgaaaaatgt60

agaaaatttcagtgaagttgtgttttctatatagtaagcacttttggtacaagtatctgc120

acatccctgcatgttacaagcctgatcatgcagggcaatattctgactataaatatacct180

cgatattttagcaagctata200

<210>14

<211>300

<212>dna

<213>yarrowialipolytica

<400>14

atgtggtgattgctgttgtgcaagcctttgctcgttttctgctgtatgtaatttaaagaa60

cgattgtatgaatcgaagtcaaggtgagtgtagtttgagaagtgtaaccccagtgtcata120

gctgtgtactccattcattgaagggtgtagtcgtgttttattgcatgagcgcctattact180

cgtataagtaactgttttgtaacacttcatgaacggagatggtatgaacagaagtaataa240

tatcctggaagtcagctgtgcccagaggtgtgtgtgggtgtggcatactttgggacaaca300

<210>15

<211>1503

<212>dna

<213>artificialsequence

<220>

<223>thmgcpoforyarrowialipolitica

<400>15

atgacccagtctgtgaaggtggttgagaagcacgttcctatcgtcattgagaagcccagc60

gagaaggaggaggacacctcttctgaagactccattgagctgactgtcggaaagcagccc120

aagcccgtgaccgagacccgttctctggacgacttggaggctatcatgaaggcaggtaag180

accaagctcctggaggaccacgaggttgtcaagctctctctcgaaggcaagctccctttg240

tatgctcttgagaagcagcttggtgacaacacccgagctgttggcatccgacgatctatc300

atctcccagcagtctaataccaagactcttgagacctcaaagctcccttacctgcactac360

gactacgaccgtgtttttggagcctgttgcgagaacgttattggttacatgcctctcccc420

gttggtgttgctggccccatgaacattgatggcaagaactaccacattcctatggccacc480

actgagggttgtcttgttgcctcaaccatgcgaggttgcaaggccatcaacgccggtggc540

ggtgttaccactgtgcttactcaggacggtatgacacgaggtccttgtgtttccttcccc600

tctctcaagcgggctggagccgctaagatctggcttgattccgaggagggtctcaagtcc660

atgcgaaaggccttcaactccacctctcgatttgctcgtctccagtctcttcactctacc720

cttgctggtaacctgctgtttattcgattccgaaccaccactggtgatgccatgggcatg780

aacatgatctccaagggcgtcgaacactctctggccgtcatggtcaaggagtacggcttc840

cctgatatggacattgtgtctgtctcgggtaactactgcactgacaagaagcccgcagcg900

atcaactggatcgaaggccgaggcaagagtgttgttgccgaagccaccatccctgctcac960

attgtcaagtctgttctcaaaagtgaggttgacgctcttgttgagctcaacatcagcaag1020

aatctgatcggtagtgccatggctggctctgtgggaggtttcaatgcacacgccgcaaac1080

ctggtgaccgccatctaccttgccactggccaggatcctgctcagaatgtcgagtcttcc1140

aactgcatcacgctgatgagcaacgtcgacggtaacctgctcatctccgtttccatgcct1200

tctatcgaggtcggtaccattggtggaggtactattttggagccccagggtgctatgctg1260

gagatgcttggcgtgcgaggtcctcacatcgagacccccggtgccaacgcccaacagctt1320

gctcgcatcattgcttctggagttcttgcagcggagctttcgctgtgttctgctcttgct1380

gccggccatcttgtgcaaagtcatatgacccacaaccgttcccaggctcctactccggcc1440

aagcagtctcaggccgatctgcagcgtctccaaaacggttcgaatatctgcattcggtca1500

tag1503

<210>16

<211>984

<212>dna

<213>artificialsequence

<220>

<223>ggscpoforyarrowialipolitica

<400>16

atggattataacagcgcggatttcaaggagatctggggcaaggccgccgacaccgcgctg60

ctgggaccgtacaactacctcgccaacaaccggggccacaacatcagagaacacttgatc120

gcagcgttcggagcggttatcaaggtggacaagagcgatctcgaaaccatttcgcacatc180

accaagattttgcataactcgtcgctgcttgttgatgacgtggaagacaactcgatgctc240

cgacgaggcctgccggcagcccattgtctgtttggagtcccccaaaccatcaactccgcc300

aactacatgtactttgtggctctgcaggaggtgctcaagctcaagtcttatgatgccgtc360

tccattttcaccgaggaaatgatcaacttgcatagaggtcagggtatggatctctactgg420

agagaaacactcacttgcccctcggaagacgagtatctggagatggtggtgcacaagacc480

ggaggactgtttcggctggctctgagacttatgctgtcggtggcatcgaaacaggaggac540

catgaaaagatcaactttgatctcacacaccttaccgacacactgggagtcatttaccag600

attctggatgattacctcaacctgcagtccacggaattgaccgagaacaagggattctgc660

gaagatatcagcgaaggaaagttttcgtttccgctgattcacagcatccggaccaacccg720

gataaccacgagattctcaacattctcaaacagcgaacaagcgacgcttcactcaaaaag780

tacgccgtggactacatgagaacagaaaccaagagtttcgactactgcctcaagagaatc840

caggccatgtcactcaaggcaagttcgtacattgatgatctcgcagcagccggccacgat900

gtctccaagttgcgagccattttgcattattttgtgtccacctctgactgtgaggagaga960

aagtactttgaggatgcgcagtga984

<210>17

<211>1446

<212>dna

<213>artificialsequence

<220>

<223>ugt1cpoforyarrowialipolitica

<400>17

atggacgccatggccaccaccgagaagaagccccacgtcatcttcatccccttccccgcc60

cagtcccacatcaaggccatgctcaagctcgcccagctcctccaccacaagggcctccag120

atcacctttgtcaacaccgacttcatccacaaccagttcctcgagtcctccggcccccac180

tgtctggacggtgctcccggtttccgatttgagactatccccgatggtgtctcccactcc240

cccgaggcctccatccccatccgagagtctctgctccgatccattgagactaacttcctc300

gaccgattcattgatctcgtcaccaagctccccgatcctcccacctgtatcatctccgac360

ggtttcctgtccgttttcaccattgatgctgccaagaagctcggtatccccgtcatgatg420

tactggactctggctgcctgtggtttcatgggtttctaccacatccactctctgatcgag480

aagggctttgctcctctcaaggacgcctcctacctcaccaacggttacctcgacaccgtc540

attgactgggtccccggtatggagggtatccgactcaaggacttccccctcgactggtcc600

accgacctcaacgacaaggttctcatgttcaccaccgaggctccccagcgatcccacaag660

gtttcccaccacatcttccacaccttcgacgagctcgagccctccatcatcaagactctg720

tctctgcgatacaaccacatctacaccattggccccctccagctcctcctcgaccagatc780

cccgaggagaagaagcagaccggtatcacctctctgcacggctactctctcgtcaaggaa840

gagcccgagtgcttccagtggctccagtccaaggagcccaactccgttgtctacgtcaac900

tttggctccaccaccgtcatgtctctcgaggacatgaccgagtttggctggggtctggcc960

aactccaaccactacttcctgtggatcatccgatccaacctcgtcattggcgagaacgcc1020

gttctgcctcccgagctcgaggagcacatcaagaagcgaggcttcattgcctcttggtgc1080

tcccaggagaaggttctcaagcacccctccgtcggtggtttcctgacccactgcggctgg1140

ggctccaccattgagtctctgtccgctggtgtccccatgatctgctggccctactcctgg1200

gaccagctcaccaactgccgatacatctgcaaggagtgggaggttggtctggagatgggt1260

accaaggtcaagcgagatgaggtcaagcgactcgtccaggagctcatgggcgagggtggt1320

cacaagatgcgaaacaaggccaaggactggaaggagaaggcccgaattgccattgccccc1380

aacggctcttcttctctcaacattgacaagatggtcaaggagatcactgttctcgctcga1440

aactaa1446

<210>18

<211>1383

<212>dna

<213>artificialsequence

<220>

<223>ugt3cpoforyarrowialipolitica

<400>18

atggccgagcagcagaagatcaagaagtctccccacgttctgctcatccccttccctctg60

cagggccacatcaaccccttcatccagttcggcaagcgactcatctccaagggtgtcaag120

accactctggtcaccaccatccacaccctcaactccactctcaaccactccaacaccacc180

accacctccatcgagatccaggccatctccgacggctgtgacgagggtggtttcatgtct240

gctggtgagtcttacctcgagactttcaagcaggtcggttccaagtctctggctgacctc300

atcaagaagctccagtccgagggtaccaccattgacgccatcatctacgactccatgacc360

gagtgggttctcgatgtcgccatcgagtttggtattgacggtggctccttcttcacccag420

gcctgtgtcgtcaactctctctactaccacgtccacaagggtctgatctctctgcccctc480

ggcgagactgtctccgtccccggtttccccgttctgcagcgatgggagactcctctcatt540

ctccagaaccacgagcagatccagtccccctggtcccagatgctcttcggccagttcgcc600

aacattgaccaggcccgatgggttttcaccaactccttctacaagctcgaggaagaggtc660

attgagtggacccgaaagatctggaacctcaaggtcattggccccaccctcccctccatg720

tacctcgacaagcgactcgatgacgacaaggacaacggtttcaacctctacaaggccaac780

caccacgagtgcatgaactggctcgacgacaagcccaaggagtccgttgtctacgttgcc840

tttggctctctggtcaagcacggccccgagcaggttgaggagatcacccgagctctgatt900

gactccgatgtcaacttcctgtgggtcatcaagcacaaggaagagggtaagctccccgag960

aacctgtccgaggtcatcaagaccggcaagggcctcattgttgcctggtgcaagcagctc1020

gacgttctcgcccacgagtccgtcggctgctttgtcacccactgcggtttcaactccacc1080

ctcgaggctatctctctcggtgtccccgttgttgccatgccccagttctccgaccagacc1140

accaacgccaagctcctcgatgagattctcggtgtcggtgtccgagtcaaggctgacgag1200

aacggtattgtccgacgaggtaacctggcttcttgtatcaagatgatcatggaggaagag1260

cgaggtgtcatcatccgaaagaacgccgtcaagtggaaggatctggccaaggttgctgtc1320

cacgagggtggctcttccgacaacgacattgtcgagtttgtctccgagctcatcaaggcc1380

taa1383

<210>19

<211>1377

<212>dna

<213>artificialsequence

<220>

<223>ugt4cpoforyarrowialipolitica

<400>19

atggagaacaagaccgagactaccgtccgacgacgacgacgaatcattctcttccccgtc60

cccttccagggccacatcaaccccattctgcagctcgccaacgttctgtactccaagggc120

ttctccatcaccatcttccacaccaacttcaacaagcccaagacctccaactacccccac180

ttcactttccgattcatcctcgacaacgacccccaggacgagcgaatctccaacctgccc240

acccacggtcctctggctggtatgcgaatccccatcatcaacgagcacggtgctgacgag300

ctccgacgagagctcgagctgctcatgctcgcctccgaagaggacgaggaagtctcctgt360

ctgatcaccgatgctctgtggtactttgcccagtccgtcgccgactctctcaacctgcga420

cgactcgttctcatgacctcctctctgttcaacttccacgcccacgtttctctgccccag480

tttgacgagctcggttacctcgaccccgatgacaagacccgactcgaggagcaggcttcc540

ggtttccccatgctcaaggtcaaggacatcaagtccgcctactccaactggcagattctc600

aaggagattctcggcaagatgatcaagcagaccaaggcctcctccggtgtcatctggaac660

tccttcaaggagctcgaggagtccgagctcgagactgtcatccgagagatccccgctccc720

tctttcctcatccccctgcccaagcacctcaccgcttcctcctcttctctgctcgaccac780

gaccgaaccgtctttcagtggctcgaccagcagcccccttcctccgtcctctacgtttcc840

ttcggctccacctccgaggtcgacgagaaggacttcctcgagattgctcgaggcctcgtt900

gactccaagcagtccttcctgtgggttgtccgacccggctttgtcaagggctccacctgg960

gttgagcccctgcccgatggtttcctcggtgagcgaggccgaattgtcaagtgggtcccc1020

cagcaggaagttctggcccacggtgccattggtgccttctggacccactccggctggaac1080

tccactctcgagtccgtctgcgagggtgtccccatgatcttctccgactttggcctcgac1140

cagcccctcaacgcccgatacatgtccgatgttctcaaggtcggtgtctacctcgagaac1200

ggctgggagcgaggtgagattgccaacgccatccgacgagtcatggtcgacgaggaaggt1260

gagtacatccgacagaacgcccgagtcctcaagcagaaggccgatgtctctctcatgaag1320

ggtggttcttcttacgagtctctcgagtctctcgtttcctacatctcttctttgtaa1377

<210>20

<211>2232

<212>dna

<213>artificialsequence

<220>

<223>tcps_srcpoforyarrowialipolitica

<400>20

atgtgcaaggctgtttccaaggagtactccgatctgctccagaaggacgaggcctctttc60

accaagtgggacgacgacaaggtcaaggaccacctcgacaccaacaagaacctctacccc120

aacgacgagatcaaggagtttgtcgagtccgtcaaggccatgttcggctccatgaacgac180

ggcgagattaatgtctctgcttacgacaccgcctgggttgctctggtccaggatgtcgac240

ggttccggctctcctcagttcccttcctctctcgagtggatcgccaacaaccagctgtcc300

gacggttcttggggtgaccacctgctcttctctgctcacgaccgaatcatcaacaccctg360

gcctgtgtcattgctctgacctcttggaacgtccacccctccaagtgcgagaagggtctg420

aacttcctccgagagaacatctgcaagctcgaggacgagaacgccgagcacatgcccatt480

ggcttcgaggtcaccttcccctctctgattgacattgccaagaagctcaacattgaggtc540

cccgaggacacccccgctctcaaggagatctacgctcgacgagacatcaagctcaccaag600

atccccatggaggttctccacaaggtccccaccactctcctccactctctcgagggtatg660

cccgatctcgagtgggagaagctgctcaagctgcagtgcaaggacggctctttcctcttc720

tccccctcttccactgccttcgccctcatgcagaccaaggacgagaagtgtctccagtac780

ctcaccaacattgtcaccaagttcaacggtggtgtccccaacgtctaccccgttgacctc840

tttgagcacatctgggttgttgaccgactccagcgactcggtatcgcccgatacttcaag900

tccgagatcaaggactgtgtcgagtacatcaacaagtactggaccaagaacggtatctgc960

tgggcccgaaacacccacgtccaggacattgacgacaccgccatgggcttccgagttctg1020

cgagcccacggctacgatgtcacccccgatgtctttcgacagtttgagaaggacggcaag1080

tttgtctgtttcgccggtcagtccacccaggccgtcaccggtatgttcaacgtctaccga1140

gcttctcagatgctcttccccggtgagcgaatcctcgaggacgccaagaagttctcctac1200

aactacctcaaggagaagcagtccaccaacgagctgctcgacaagtggatcattgccaag1260

gatctgcccggtgaggttggctacgccctcgacatcccctggtacgcctctctgccccga1320

ctggagactcgatactacctcgagcagtacggtggtgaggacgatgtctggatcggtaag1380

accctgtaccgaatgggctacgtttccaacaacacctacctcgagatggccaagctcgac1440

tacaacaactacgttgccgtcctccagctcgagtggtacaccatccagcagtggtacgtc1500

gacattggtatcgagaagttcgagtccgacaacatcaagtccgtccttgtctcctactac1560

ctcgctgctgcctccatcttcgagcccgagcgatccaaggagcgaattgcctgggccaag1620

accaccatcctcgtcgacaagatcacctccatcttcgactcctcccagtcctccaaggaa1680

gatatcaccgccttcattgacaagttccgaaacaagtcctcctccaagaagcactccatc1740

aacggcgagccctggcacgaggtcatggttgctctcaagaaaactctccacggctttgcc1800

ctcgacgctctgatgacccactctcaggacatccacccccagctccaccaggcctgggag1860

atgtggctcaccaagctccaggacggtgttgatgtcactgctgagctcatggtccagatg1920

atcaacatgaccgccggccgatgggtttccaaggagctcctcacccacccccagtaccag1980

cgactctccactgtcaccaactctgtctgccacgacatcaccaagctccacaacttcaag2040

gagaactccaccaccgtcgactccaaggtccaggagctggtccagctcgttttctccgac2100

acccccgatgatctcgaccaggacatgaagcagaccttcctgactgtcatgaaaactttc2160

tactacaaggcctggtgcgaccccaacaccatcaacgaccacatctccaaggtctttgag2220

attgtgatttaa2232

<210>21

<211>2274

<212>dna

<213>artificialsequence

<220>

<223>tks-srcpoforyarrowialipolitica

<400>21

atgacctcccacggcggccagaccaaccccaccaacctcatcattgacaccaccaaggag60

cgaatccagaagcagttcaagaacgtcgagatctccgtttcctcctacgacaccgcctgg120

gtcgccatggtcccctctcccaactcccccaagtctccctgcttccccgagtgtctcaac180

tggctcatcaacaaccagctcaacgacggctcttggggtctggtcaaccacacccacaac240

cacaaccaccccctcctcaaggactctctctcttccactctcgcctgcattgttgctctc300

aagcgatggaacgttggcgaggaccagatcaacaagggtctgtctttcattgagtccaac360

ctcgcctccgccaccgagaagtcccagccctcccccattggctttgatatcatcttcccc420

ggtctgctcgagtacgccaagaacctcgatatcaacctgctctccaagcagaccgacttc480

tctctcatgctgcacaagcgagagctcgagcagaagcgatgccactccaacgagatggac540

ggctacctggcctacatttccgagggtctgggtaacctctacgactggaacatggtcaag600

aagtaccagatgaagaacggttccgttttcaactccccctctgccaccgctgctgccttc660

atcaaccaccagaaccccggctgtctcaactacctcaactctctgctcgacaagtttggt720

aacgccgtccccactgtctacccccacgatctcttcatccgactctccatggtcgacacc780

attgagcgactcggtatttcccaccacttccgagtcgagatcaagaacgttctcgatgag840

acttaccgatgctgggttgagcgagatgagcagatcttcatggacgttgtcacctgtgct900

ctggccttccgactcctccgaatcaacggttacgaggtttcccccgaccccctcgccgag960

atcaccaacgagctggctctcaaggacgagtacgccgccctcgagacttaccacgcttct1020

cacattctgtaccaagaggatctgtcctccggcaagcagattctcaagtccgccgacttc1080

ctcaaggagatcatctccactgactccaaccgactctccaagctcatccacaaggaagtc1140

gagaacgctctcaagttccccatcaacaccggtctggagcgaatcaacacccgacgaaac1200

atccagctctacaacgtcgacaacacccgaattctcaagaccacctaccactcttccaac1260

atctccaacaccgactacctgcgactcgccgtcgaggacttctacacctgccagtccatc1320

taccgagaggagctcaagggtctggagcgatgggttgtcgagaacaagctcgaccagctc1380

aagtttgcccgacaaaagactgcctactgctacttctccgttgctgccaccctctcttct1440

cccgagctctccgacgcccgaatctcttgggccaagaacggtatcctgaccactgttgtc1500

gacgacttctttgacattggtggcaccattgacgagctgaccaacctcatccagtgcgtc1560

gagaagtggaacgtcgacgttgacaaggactgttgttccgagcacgtccgaatcctcttc1620

ctggctctcaaggacgccatctgctggatcggtgacgaggccttcaagtggcaggctcga1680

gatgtcacttcccacgtcatccagacctggctcgagctcatgaactccatgctgcgagag1740

gccatctggacccgagatgcctacgtccccaccctcaacgagtacatggagaacgcctac1800

gtcagctttgctctcggtcccattgtcaagcccgccatctactttgtcggtcccaagctg1860

tccgaggagattgtcgagtcctccgagtaccacaacctcttcaagctcatgtccacccag1920

ggccgactcctcaacgatatccactccttcaagcgagagttcaaggaaggtaagctcaac1980

gccgttgctctgcacctgtccaacggtgagtccggcaaggtcgaggaagaggtcgtcgag2040

gagatgatgatgatgatcaagaacaagcgaaaggagctcatgaagctcatcttcgaggag2100

aacggctccattgtcccccgagcctgcaaggacgccttctggaacatgtgccacgtcctc2160

aacttcttctacgccaacgacgacggtttcaccggcaacaccattctcgacaccgtcaag2220

gacatcatctacaaccctctggttctggtcaacgagaacgaggagcagaggtaa2274

<210>22

<211>1578

<212>dna

<213>artificialsequence

<220>

<223>kah_4cpoforyarrowialipolitica

<400>22

atggagtctctggttgtccacaccgtcaacgccatctggtgcattgtcattgtcggtatc60

ttctccgtcggctaccacgtctacggccgagctgttgtcgagcagtggcgaatgcgacga120

tctctcaagctccagggtgtcaagggtcctcctccctccatcttcaacggtaacgtttcc180

gagatgcagcgaatccagtccgaggccaagcactgctccggtgacaacatcatctcccac240

gactactcttcttctctgttcccccactttgaccactggcgaaagcagtacggccgaatc300

tacacctactccactggcctcaagcagcacctctacatcaaccaccccgagatggtcaag360

gagctctcccagaccaacaccctcaacctcggccgaatcacccacatcaccaagcgactc420

aaccccattctcggtaacggtatcatcacctccaacggcccccactgggcccaccagcga480

cgaatcattgcctacgagttcacccacgacaagatcaagggtatggtcggtctgatggtc540

gagtccgccatgcccatgctcaacaagtgggaggagatggtcaagcgaggtggtgagatg600

ggctgtgacatccgagtcgacgaggacctcaaggatgtctccgctgacgtcattgccaag660

gcctgtttcggctcttccttctccaagggcaaggccatcttctccatgatccgagatctg720

ctcaccgccatcaccaagcgatccgtcctcttccgattcaacggtttcaccgacatggtt780

ttcggctccaagaagcacggtgacgttgacattgacgctctcgagatggagctcgagtcc840

tccatctgggagactgtcaaggagcgagagattgagtgcaaggacacccacaagaaggac900

ctcatgcagctcattctcgagggtgccatgcgatcttgtgacggtaacctgtgggacaag960

tctgcttaccgacgattcgttgtcgacaactgcaagtccatctactttgccggccacgac1020

tccaccgccgtttccgtttcttggtgcctcatgctgctcgctctcaacccctcttggcag1080

gtcaagatccgagatgagattctgtcctcctgcaagaacggtatccccgacgccgagtcc1140

atccccaacctcaagaccgtcaccatggtcatccaggagactatgcgactctaccctccc1200

gctcccattgtcggccgagaggcctccaaggacattcgactcggtgatctggttgtcccc1260

aagggtgtctgtatctggaccctcatccccgctctgcaccgagatcccgagatctggggt1320

cccgacgccaacgacttcaagcccgagcgattctccgagggtatctccaaggcctgcaag1380

tacccccagtcctacatcccctttggcctcggcccccgaacctgtgtcggcaagaacttt1440

ggtatgatggaggtcaaggtcctcgtttctctgattgtctccaagttctccttcactctg1500

tctcccacctaccagcactctccctcccacaagctgctcgtcgagccccagcacggtgtt1560

gtcatccgagttgtataa1578

<210>23

<211>1578

<212>dna

<213>artificialsequence

<220>

<223>ko_gibcpoforyarrowialipolitica

<400>23

atgtccaagtccaactccatgaactccacctcccacgagactctcttccagcagctcgtt60

ctcggcctcgaccgaatgcccctcatggacgtccactggctcatctacgttgcctttggt120

gcctggctctgctcctacgtcatccacgttctgtcctcttcctccactgtcaaggtcccc180

gtcgtcggttaccgatccgttttcgagcccacctggctcctccgactgcgattcgtctgg240

gagggtggttccatcattggccagggctacaacaagttcaaggactccatcttccaggtc300

cgaaagctcggtaccgacattgtcatcatccctcccaactacattgacgaggtccgaaag360

ctctcccaggacaagacccgatccgtcgagcccttcatcaacgactttgccggccagtac420

acccgaggtatggtctttctgcagtccgatctccagaaccgagtcatccagcagcgactc480

acccccaagcttgtctctctcaccaaggtcatgaaggaagagctcgactacgctctgacc540

aaggagatgcccgacatgaagaacgacgagtgggttgaggtcgacatctcttccatcatg600

gtccgactcatctctcgaatctccgcccgagttttcctcggccccgagcactgccgaaac660

caggagtggctcaccaccaccgccgagtactccgagtctctcttcatcaccggcttcatc720

ctccgagttgtcccccacattctccgacccttcattgctcctctgctgccctcttaccga780

accctgctgcgaaacgtttcttccggccgacgagtcattggtgatatcatccgatcccag840

cagggtgacggtaacgaggacatcctctcttggatgcgagatgctgccactggtgaggag900

aagcagatcgacaacattgcccagcgaatgctcattctgtctctcgcctccatccacacc960

accgccatgaccatgacccacgccatgtacgatctgtgtgcctgccccgagtacattgag1020

cccctccgagatgaggtcaagtccgtcgttggtgcttctggctgggacaagaccgctctc1080

aaccgattccacaagctcgactctttcctcaaggagtcccagcgattcaaccccgttttc1140

ctgctcaccttcaaccgaatctaccaccagtccatgaccctctccgatggtaccaacatc1200

ccctccggtacccgaattgctgtcccctctcacgccatgctccaggactccgcccacgtc1260

cccggtcccactcctcccactgagttcgacggtttccgatactccaagatccgatccgac1320

tccaactacgcccagaagtacctcttctccatgaccgactcttccaacatggcctttggc1380

tacggtaagtacgcctgccccggccgattctacgcctccaacgagatgaagctgactctg1440

gccattctgctcctccagtttgagttcaagctccccgacggtaagggccgaccccgaaac1500

atcaccatcgactccgacatgatccccgacccccgagctcgactctgtgtccgaaagcga1560

tctctgcgtgacgagtaa1578

<210>24

<211>2133

<212>dna

<213>artificialsequence

<220>

<223>cpr_3cpoforyarrowialipolitica

<400>24

atgtcctcctcttcttcttcttccacctccatgattgatctcatggctgccatcatcaag60

ggtgagcccgtcattgtctccgaccccgccaacgcctccgcctacgagtccgttgctgcc120

gagctgtcctccatgctcatcgagaaccgacagtttgccatgatcgtcaccacctccatt180

gctgttctcattggctgcattgtcatgctcgtctggcgacgatctggctccggtaactcc240

aagcgagtcgagcccctcaagcccctggtcatcaagccccgagaagaggagatcgacgac300

ggccgaaagaaggtcaccatcttctttggcacccagaccggtactgctgagggcttcgcc360

aaggctctcggtgaggaagccaaggctcgatacgaaaagacccgattcaagattgtcgac420

ctcgatgattacgctgccgatgacgacgagtacgaggagaagctcaagaaagaggacgtt480

gccttcttcttcctcgccacctacggtgacggtgagcccaccgacaacgctgcccgattc540

tacaagtggttcaccgagggtaacgaccgaggcgagtggctcaagaacctcaagtacggt600

gttttcggtctgggcaaccgacagtacgagcacttcaacaaggttgccaaggttgtcgac660

gacatcctcgtcgagcagggtgcccagcgactcgtccaggtcggcctcggtgatgatgac720

cagtgcatcgaggacgacttcactgcctggcgagaggctctgtggcccgagctcgacacc780

attctgcgagaggaaggtgacaccgccgttgccaccccctacaccgccgccgtcctcgag840

taccgagtctccatccacgactccgaggatgccaagttcaacgacatcaacatggccaac900

ggtaacggctacaccgtctttgacgcccagcacccctacaaggccaacgtcgccgtcaag960

cgagagctccacacccccgagtccgaccgatcttgtatccacctcgagtttgacattgct1020

ggttccggtctgacctacgagactggtgaccacgttggtgtcctctgtgacaacctgtcc1080

gagactgtcgacgaggctctgcgactcctcgacatgtcccccgacacttacttctctctg1140

cacgccgagaaagaggacggtactcccatctcttcttctctgccccctcccttccctccc1200

tgcaacctgcgaaccgctctgacccgatacgcctgcctcctctcttctcccaagaagtct1260

gctctcgttgctctggccgcccacgcctccgaccccaccgaggctgagcgactcaagcac1320

ctcgcctctcccgctggcaaggacgagtactccaagtgggttgtcgagtcccagcgatct1380

ctgctcgaggtcatggccgagttcccctccgccaagccccctctcggtgttttcttcgcc1440

ggtgttgctccccgactccagccccgattctactccatctcctcttcccccaagatcgcc1500

gagactcgaatccacgttacctgtgctctggtctacgagaagatgcccaccggccgaatc1560

cacaagggtgtctgctccacctggatgaagaacgccgttccctacgagaagtccgagaac1620

tgttcctctgctcccatctttgtccgacagtccaacttcaagctcccctccgactccaag1680

gtccccatcatcatgattggccccggtaccggcctcgcccccttccgaggcttcctgcag1740

gagcgactcgccctcgtcgagtccggtgtcgagctcggcccctccgtcctcttctttggc1800

tgccgaaaccgacgaatggacttcatctacgaagaggagctccagcgattcgtcgagtcc1860

ggtgctctcgccgagctctccgttgccttctcccgagagggtcccaccaaggagtacgtc1920

cagcacaagatgatggacaaggcctccgacatctggaacatgatctcccagggcgcctac1980

ctctacgtctgcggtgacgccaagggtatggcccgagatgtccaccgatctctgcacacc2040

attgcccaggagcagggctccatggactccaccaaggccgagggtttcgtcaagaacctc2100

cagacctccggccgatacctccgagatgtctgg2133

<210>25

<211>1419

<212>dna

<213>artificialsequence

<220>

<223>ugt2_10bcpofory.lipolitica

<400>25

atggccacctccgactccattgttgacgaccgaaagaagctccacattgtcatgttcccc60

tggctcgcctttggccacatcatcccctatctcgagctttccaagctcattgcccagaag120

ggccacaaggtttccttcctctccaccaccaagaacattgaccgactctcctcccacatc180

tctcccctcatcaactttgtcaagctcaccctcccccgagtccaggagctgcccgaggac240

gccgaggccaccactgatgtccaccccgaggatatcccctacctcaagaaggcctccgac300

ggcctccagcccgaggtcactgagttcctcgagcagcactctcccgactggatcatctac360

gactacacccactactggctccccgagattgccaagtctctcggtgtctctcgagcccac420

ttctccgtcaccaccccctgggccattgcttacatgggtcccactgccgatgccatgatc480

aacggttccgactaccgaaccgagcttgaggacttcaccgtccctcccaagtggttcccc540

ttccccaccaccgtctgctggcgaaagcacgatctggcccgactcgtcccctacaaggct600

cccggtatctccgacggttaccgaatgggcctcgtcatcaagggctgcgactgtctgctc660

tccaagacctaccacgagttcggtactcagtggctccgacttctcgaggagctgcaccga720

gtccccgtcatccccgttggtctgctccctccctccatccccggctctgacaaggacgac780

tcttgggtttccatcaaggagtggctcgacggccaggagaagggctccgttgtctacgtt840

gctctcggttccgaggttctcgtcacccaggaagaggttgtcgagcttgctcacggtctg900

gagctgtccggtctgcccttcttctgggcctaccgaaagcccaagggtcccgccaagtcc960

gactccgtcgagcttcccgatggtttcgtcgagcgagtccgagatcgaggtctggtctgg1020

acctcttgggctccccagctccgaatcctctcccacgagtccgttgctggtttcctcacc1080

cactgcggttccggctccattgtcgagggcctcatgttcggccaccctctcatcatgctc1140

cccatcttcggtgaccagcccctcaacgcccgactccttgaggacaagcaggtcggtatc1200

gagatcccccgaaacgaggaagatggttctttcacccgagactctgttgccgagtctctg1260

cgactcgtcatggtcgaggaagagggtaagatctaccgagagaaggccaaggagatgtcc1320

aagctctttggcgacaaggacctccaggaccagtacgtcgacgactttgtcgagtacctc1380

cagaagcaccgacgagctgttgccattgaccacgaaagc1419

<210>26

<211>1758

<212>dna

<213>yarrowialipolytica

<400>26

atggaatggatttcacatctggagaacgatgacgatgtgctggaaatcgaggactacaag60

gtgcgcaaggacgcgctgctgatcgccattcaagtaacccagaacgccattaacaacgga120

actcttcataaggccttggaggcagccttcgatgctgtgactgacagaatcgtcatatcg180

ccgcaagattacaccggcgttatgctgttcggtgcctccatgcagtctgaggacgacggt240

gacgagttcgatgatgagtcagatacacatttcattctcaagctgggccttcctaccgct300

gctcagatcaaacgactcaaacgactggcagaggaccctgatctgggtgagaggttcaag360

gtgcaggaagagcctcacctgatggacgtgtttttcgacatgaaccgccattttatcaac420

atggcacccaacttcgcgtccagacgaatcatctatatcacagacgacgatacccccacg480

acgaatgaggacgatatcaacaagacacgagttcgaattgaggatctaagccatctcaag540

gtgaaggtcgagcctcttttgatcaacccttcggaagacaagacgttcgactcctccaaa600

ttctacgctcttgtgttcaacgaagacacatctgtggagccggttgaggcgatcgatttg660

aagcagtttatcaacaaaagaaacgtgctcaatcgatcactgttcaatgtcaaaatggaa720

atcggagaaggtcttgttgtcggagtaagaggataccttctttatgcggaacaaaaggct780

acttcaacaacccgaaaggcctgggtttacactggaggtgagaaacccgagattgccaaa840

ttagaatcgcaggccgtcactattgaaagtggcagaagcgtggacaaggcagatctgaga900

aagactttcaagtttggaaatgactatgttcctttcacagaagaacagctgacgcaaatc960

cggtactttggagagccaattattcgaattctcggcttccacaattcctcggacttctcc1020

gagctcttcatccacagtgtccgatcgtcaatgttcctatatcccactgatgagaagctt1080

gtgggttcgattcgagccttttcagcactctatcagagtctcaagaacaaggataagatg1140

gctctggcctgggttattgtccgcaagggcgccaaacctattctggctcttcttattcct1200

tcaactaaggagatcgaaggtcttcatatggtcttcttgccttttacagatgatattcga1260

caagaaccaaagactgaacttgtgtctgccgcccctgagctcgtggacgcaaccaagaat1320

attttcactcgtctacgcatgcctggcggatttgagtcgcaaagataccccaacccccgt1380

ctacagtggcattaccgagttgtacgagccatggcccttcaggaggaggttcccaaggta1440

cccgaagacaagacgacaccaaagtatcggtctattgatactcgagttggtgatgccatc1500

gaggaatggaacaaggtgttgcagagcagctccaagcgacctgcggaggatatctgtaag1560

gctgagaagaaagtcaagagttctgacgcgggccctccgtccaacgagcaaatgcaaaat1620

atggttgagaatgacattgtcggcaagctgaccgtcgcagaactcagggcttggggtgct1680

gctaacaatgttgagcccaatggtagcaagttgaagaaggactgggttgaggtggtcaaa1740

aagtactatgggaagtga1758

<210>27

<211>4245

<212>dna

<213>yarrowialipolytica

<400>27

atgggtaaaaccgaagtgacacaggagagtctagaatgcgggtcggtcacgtcctcgctg60

gggaaaaagcccttctccatcatcacactcttcaccggcagacgcattcctccggtacct120

actgaaaaaccagattcggccgaagaacgggccgggattctgtcaaaattgacctggcaa180

tggcttagtccattgttgaaaactggttacttacgaaacattgaacgtgaggatctgtat240

aaagtgagagagagaaactcggcggctgtgatccagcagcgacttgaatccaatctcgaa300

aaacaatacgccaagtaccacgccaaactgctcaagaaaggactctcggagcaagaggcg360

catctcaagctgcaagattcagccaaacccctcgtcttggctcttaaccagacgtttttt420

tggaagttctggctagccggactgtttgccctagtcaaggacctctgtggaatcgcctca480

gctatggtgtcacgtgttctgatcgaatacattcaagacagatatctctacagggggaca540

gaccgggaacctaaggtcggccgaggagtcggcccctcgataggcctatttctactggcc600

gtaggagtcactttcttcttcaaccacatgttctacaatgtcaagatggttggagctcag660

gctcgtgcagctctggtggccgtcatctacagcaagagtacccgtttgagcgccaagggc720

cgagctcaatacaccacaggcaagatcacaaacttggcagctattgacgcacatcgagtt780

gatctcagttgtgaatctttccactacattactatctttttgcctgttgtgggttgtgcc840

attgctgtactcgtggtcaacctcaaggtcgcagctctagttggaattgcgaccatgatt900

gtcttgatctttgtcgtcgcaggcatcaccatcttctctatgaagctgcgagccatcatt960

gtcaagctcacggataagcgagtcacgtatatccgagaagctctgcagtcgattagaatc1020

atcaagtactacggctgggaggttccttactgtgacaagatcaagaaggtgcgtcttgac1080

gagacccgtaactacgccaagatgggctcgattcgaggaacagccattggtatgtttcag1140

gcactccctattttggcaggagcgttgtctttcatcacctacgctgctctaggtcatgga1200

actgatcctgctcgaatgttctcttctctgacgcttttcaatttactcctgcctgctctt1260

gctgttcttccccaggccctccaggctgctggagacgctcgagtggctctcagacgtatc1320

cagcggttccttggggccgaggagtcgactcccactacagtttttgacgctactcttgaa1380

tctactgatgacgctgtgattgtggaagacgcctctttcatctggccagaagttgtcgat1440

gataagagcgacaaagagaaggctaaagatgcaaagaaggaggaaaaggataagaagaag1500

gccgagaagaaggccaagaaggcggccaagaaggcggccaaggagatcgcggtggttgtg1560

gaagaggaggtggaacacgaaaagaccgagggatccagtgagtctgaaaagggtactctt1620

aagtcgactttcaagggcttcaacaacctgtctttcaaaatcaagcggggtgaatttgtc1680

gttgttaccggtcccattggttctggaaagtcgtctcttcttgctgccatcactggatct1740

atggttttgacaggcggttccgtgcgagtgtcgtccacagagtggattggatgtctggag1800

ccgtggattcaaaacgccacagttcgagataacattgtgtttgggcgaaaattcgactct1860

gaatggtatagaactgtggttactgcctgtcagctgagccaggatctcaaaataatgact1920

cacggagacaataccatgattggagagcgaggcatcacagtttcgggcggtcaaaaagct1980

cgaatcaacctcgcacgtgctatatatggaaaccccgagattctcatcatggacgacgtc2040

ctgtcggctgtggacgctcgagtaggtgctggtattgtggacgattgtcttcgaggctta2100

gccaagaactccactcgaattctggccacccatcagctgtctgtgctgcctaaggctgat2160

catgtgattttcatggatgccgaaggccagtttcatattggtacgtaccaagagctggag2220

gctgacaatgagcagttcaaggctcttttggcggctggttccatgtccaaggaggaggtg2280

gttgctgtcgacgagactgaggttgttattgaaggcgatcttgaagacgactgcgataac2340

aaggaggagtatgaggatgcagctgagaccatttccattttggcagatgccactcaagag2400

ctgcaaaaggtgaccactacagtctcggcatttgaggagaacgataacatgatggaggaa2460

gaagagcgaatgagagatgcagttggtttgcatgtgtactggcagtattttcgtcaggcc2520

aaccccagtagggtcaaggtaatgatgttcattggcatgatcttcatttccatgattgtg2580

attgcctttctgtttgtcttcacatctgtatggctctcgttctggacaggtgaccgtttc2640

catgcctccagaaacttctacaccggaatttacatcatgctgggtattcttctgcttctt2700

gctgtggcaggatacatgattgtcaatgagatcaactctgccatggcagcaagaaatcta2760

cacaatcatgctttggactcggtgttcgctgcacgaacttctttcttcgataccactcct2820

cagggtcgtatcatcaaccggttcacccgagacacagactctctggataacgagctggct2880

atgcgattgactatgttgttctttggcgtctccgcattcttctccaacttcctgcttact2940

tgtgtctacgttccttatgtgactcttgtgcttgtccctgtcggttttgtcttctacgtt3000

tctctaggttactaccgaaagtcagctcgtgaagtcaagcgaattgactccattgaacgg3060

tcgcacatgatgagtgtcttcaacgagtccatttccggtatgcccgtcatcatcatgtac3120

aaggcccagcatcggctcatgaacaagcttcaggctactctcgatgatatggacagtgcc3180

tacttcctcactgctgcaaaccagcgatggctgtctctccgtctggatggtctgggttct3240

ttggtcgttctggtggccactattcttgttgctgtcggagtctttgatctcaccccttcc3300

aacatgggtctgatcatttccgcggcctcctttatccccgaagtcatgtctatggttgcc3360

caggccgttgctgaactcgaaaactgcatgaacgccacagagcgaattctttactacaag3420

gacaacattcctgctgaggctgctcgagaagtggacggtacagagctcgaccagcgaccc3480

aactggcctgagcagggagccatcagcttcaacaatgtgtccatgaagtaccgagatgga3540

cttccttacgtgctcaagtcattgtctgtcgactttcagggaggacacaaggtgggtatc3600

tgtggacgaacaggagccggtaagagtaccatcttgcagactctgtatcgaattgtggag3660

cttgctgagggttctattactattgatggtgttgacatttcgactattggactgcatcag3720

cttcggtctcagttgtccatcattccccaggagccagttttgttcctgggcaccatccgg3780

tctaatttggatcctctggagcaatactctgatgctgagctatggggttctctacgacgg3840

tctggacttctcgatgaaggagagactgagggtaagtttcatctggatcaaaaggtggag3900

gctgacggcagcaacttctctctaggtgagcgacagctgctgactctagcccgagcactg3960

cttagaaacaccaaaattttggtgctggacgaagccacatcaaatgtcgactacaagacg4020

gacaagctggttcaggagaccatttcacgggagtttggccactgcacgattctgtgtatc4080

gcccatcgactgcgaaccattgccaagtatgatcgtattttggtgcttgagtccggcgag4140

atcaaccagtacgacacgccctggaacttgtacaacgacaaggagggtattttccgaggt4200

atgtgtgacacctccgggttgaacgaggtagacttcaacaagtaa4245

<210>28

<211>4245

<212>dna

<213>artificialsequence

<220>

<223>yali0e25201gcpofory.lipolitica

<400>28

atgggtaagaccgaggtcactcaggagtctctcgagtgcggttccgtcacctcctctctc60

ggcaagaagcccttctccatcatcactctcttcaccggccgacggatccctcccgtcccc120

actgagaagcccgactccgctgaggagcgagccggcatcctctccaagctgacctggcag180

tggctctctcctctgctcaagaccggttacctccgaaacatcgagcgagaggatctgtac240

aaggtccgagagcgaaactccgctgccgttatccagcagcgacttgagtccaacctggag300

aagcagtacgccaagtaccacgccaagctcctcaagaagggtctgtctgagcaagaggcc360

cacctcaagctgcaggactctgccaagccccttgtcctggccctcaaccagaccttcttc420

tggaagttctggctcgctggtctgttcgccctcgtcaaggacctctgtggcattgcttcc480

gccatggtttcccgagttctcattgagtacatccaggaccgatacctctaccgaggtacc540

gaccgagagcccaaggtcggccgaggtgtcggtccctccatcggactcttcctgctggcc600

gttggtgtcactttcttcttcaaccacatgttctacaacgtcaagatggttggtgcccag660

gcccgagctgccctcgtcgctgtcatctactccaagtccacccgactgtccgccaagggt720

cgagcccagtacaccaccggcaagatcaccaacctcgccgccattgatgcccaccgagtc780

gatctgtcttgcgagtcttttcactacatcactatcttccttcccgtcgtcggctgcgcc840

attgccgtcctcgttgtcaacctcaaggttgctgctctcgtcggtattgccactatgatt900

gtcctcatctttgtcgttgctggtatcaccatcttctccatgaagctccgagccatcatc960

gtcaagctcaccgacaagcgagtcacctacatccgagaggctctccagtccatccgaatc1020

atcaagtactacggctgggaggttccctactgcgacaagattaagaaggtccgactcgac1080

gagactcgaaactacgccaagatgggctccattcgaggaaccgctattggtatgttccag1140

gctctccccatcctcgccggcgctctgtcttttatcacctacgccgccctcggtcacggc1200

accgaccccgcccgaatgttctcttctctcaccctcttcaacctgctgctccccgctctt1260

gccgttctcccccaggccctccaggccgctggtgacgcccgagtcgccctgcgacgaatc1320

cagcgattcctcggtgctgaggagtccacccccaccactgtcttcgatgctactcttgag1380

tctaccgacgacgccgtcatcgtcgaggacgcctccttcatttggcccgaggtcgttgac1440

gacaagtccgacaaggagaaggccaaggatgctaagaaagaggagaaggacaagaagaag1500

gctgagaagaaagccaagaaggccgctaagaaggcagccaaggagatcgccgttgttgtt1560

gaggaagaggtcgagcacgagaagaccgaaggctcctccgagtccgagaaaggtaccctc1620

aagtccacgttcaagggtttcaacaacctgtctttcaagatcaagcgaggtgagttcgtt1680

gtcgtcactggtcccatcggctccggtaagtcctctctgctcgctgccattaccggttcc1740

atggttctgaccggtggttctgtccgagtctcttccaccgagtggatcggttgcctcgag1800

ccttggatccagaacgccaccgtccgagacaacattgtcttcggccgtaagtttgactcc1860

gagtggtaccgaaccgttgtcaccgcctgccagctctcccaggacctcaagatcatgacc1920

cacggcgataacaccatgattggtgagcgaggtatcactgtctccggtggtcagaaggcc1980

cgaatcaacctggcccgcgcgatctacggtaaccccgagattctcatcatggacgacgtc2040

ctctccgccgtcgacgccagggtcggagccggtatcgtcgatgactgtctgagaggcctc2100

gccaagaactctacccgaatcctcgccacccaccagctctctgttctccccaaggccgac2160

cacgtcatctttatggacgccgagggtcagttccacattggcacctaccaagagctcgag2220

gctgataacgagcagttcaaggctctcctcgctgccggctctatgtccaaagaggaagtc2280

gttgccgttgacgagactgaggttgtcattgagggtgacctcgaggacgactgtgacaac2340

aaggaagagtacgaggatgctgccgagactatctccattctcgccgacgccacccaggag2400

ctccagaaggttaccaccaccgtttctgcttttgaggagaacgacaacatgatggaggaa2460

gaagaacgaatgcgagatgccgtcggtctgcacgtctactggcagtacttccgacaggcc2520

aacccctctcgagtcaaggtcatgatgttcattggtatgattttcatctccatgattgtc2580

attgccttcctcttcgtcttcacctccgtctggctctccttttggaccggtgaccgattc2640

cacgcttcccgaaacttctacaccggcatctacatcatgctcggtatcctccttctgctc2700

gccgtcgccggttacatgatcgtcaatgagatcaactctgccatggccgcccgaaacctg2760

cacaaccacgccctcgactccgtcttcgccgctcgaacttctttcttcgacaccactccc2820

cagggccgaatcattaaccgattcacccgggacaccgactccctcgataacgaactggcc2880

atgcgactcaccatgctctttttcggtgtttccgcctttttctccaacttcctcctcacc2940

tgtgtctacgttccctacgtcaccctggttcttgtccccgttggtttcgtcttctacgtt3000

tccctcggttactaccgaaagtccgcccgagaggtcaagcgaatcgactccattgagcga3060

tcccacatgatgtccgtcttcaacgagtccatctccggtatgcccgttatcatcatgtac3120

aaggcccagcaccgactcatgaacaagctccaggccaccctcgacgacatggactccgcc3180

tacttcctgaccgctgccaaccagcgatggctctccctccgactggacggtcttggctct3240

cttgttgtcctcgtcgccaccattcttgtcgccgtcggtgtctttgacctcaccccctcc3300

aacatgggcctcatcatctctgctgcctctttcatccccgaggtcatgtccatggtcgcc3360

caggccgttgctgagctcgagaactgcatgaacgctaccgagcgaatcctctactacaag3420

gacaacatccccgccgaggctgctcgagaggtcgacggtaccgagcttgatcagcgaccc3480

aactggcccgagcagggcgccatctccttcaacaacgtgtccatgaagtaccgagatggt3540

ctgccctacgtcctcaagtctctctccgtcgacttccagggcggccacaaggtcggtatc3600

tgcggacgaaccggtgccggcaagtccactatcctccagaccctgtaccgaatcgtcgag3660

ctggccgagggctccatcaccattgatggtgtcgacatctccaccattggcctgcaccag3720

ctccgatcccagctgtccatcatcccccaggagcccgttctgttccttggcaccatccga3780

tccaacctcgatcccctcgagcagtactccgacgccgagctctggggttctctccgacga3840

tccggccttctggacgagggtgaaaccgagggtaagttccacctcgaccagaaggtcgag3900

gccgatggttccaacttctctctgggtgagcgacagctcctcaccctcgcccgagccctt3960

ctgcgaaacaccaagattcttgttctcgacgaggctacctccaacgtcgactacaagacc4020

gataagctcgtccaggagacaatctcccgagagttcggtcactgcaccattctctgtatc4080

gcccaccgactgcgaaccatcgctaagtacgaccgaattctcgttctcgagtccggcgag4140

atcaaccagtacgacaccccctggaacctctacaacgacaaggaaggtatcttccgaggc4200

atgtgcgacacctccggcctcaacgaggtcgactttaataaataa4245

<210>29

<211>1414

<212>prt

<213>yarrowialipolytica

<400>29

metglylysthrgluvalthrglngluserleuglucysglyserval

151015

thrserserleuglylyslyspropheserileilethrleuphethr

202530

glyargargileproprovalprothrglulysproaspseralaglu

354045

gluargalaglyileleuserlysleuthrtrpglntrpleuserpro

505560

leuleulysthrglytyrleuargasnilegluarggluaspleutyr

65707580

lysvalarggluargasnseralaalavalileglnglnargleuglu

859095

serasnleuglulysglntyralalystyrhisalalysleuleulys

100105110

lysglyleusergluglnglualahisleulysleuglnaspserala

115120125

lysproleuvalleualaleuasnglnthrphephetrplysphetrp

130135140

leualaglyleuphealaleuvallysaspleucysglyilealaser

145150155160

alametvalserargvalleuileglutyrileglnaspargtyrleu

165170175

tyrargglythrasparggluprolysvalglyargglyvalglypro

180185190

serileglyleupheleuleualavalglyvalthrphephepheasn

195200205

hismetphetyrasnvallysmetvalglyalaglnalaargalaala

210215220

leuvalalavaliletyrserlysserthrargleuseralalysgly

225230235240

argalaglntyrthrthrglylysilethrasnleualaalaileasp

245250255

alahisargvalaspleusercysgluserphehistyrilethrile

260265270

pheleuprovalvalglycysalailealavalleuvalvalasnleu

275280285

lysvalalaalaleuvalglyilealathrmetilevalleuilephe

290295300

valvalalaglyilethrilephesermetlysleuargalaileile

305310315320

vallysleuthrasplysargvalthrtyrileargglualaleugln

325330335

serileargileilelystyrtyrglytrpgluvalprotyrcysasp

340345350

lysilelyslysvalargleuaspgluthrargasntyralalysmet

355360365

glyserileargglythralaileglymetpheglnalaleuproile

370375380

leualaglyalaleuserpheilethrtyralaalaleuglyhisgly

385390395400

thraspproalaargmetpheserserleuthrleupheasnleuleu

405410415

leuproalaleualavalleuproglnalaleuglnalaalaglyasp

420425430

alaargvalalaleuargargileglnargpheleuglyalagluglu

435440445

serthrprothrthrvalpheaspalathrleugluserthraspasp

450455460

alavalilevalgluaspalaserpheiletrpprogluvalvalasp

465470475480

asplysserasplysglulysalalysaspalalyslysgluglulys

485490495

asplyslyslysalaglulyslysalalyslysalaalalyslysala

500505510

alalysgluilealavalvalvalgluglugluvalgluhisglulys

515520525

thrgluglysersergluserglulysglythrleulysserthrphe

530535540

lysglypheasnasnleuserphelysilelysargglyglupheval

545550555560

valvalthrglyproileglyserglylysserserleuleualaala

565570575

ilethrglysermetvalleuthrglyglyservalargvalserser

580585590

thrglutrpileglycysleugluprotrpileglnasnalathrval

595600605

argaspasnilevalpheglyarglyspheaspserglutrptyrarg

610615620

thrvalvalthralacysglnleuserglnaspleulysilemetthr

625630635640

hisglyaspasnthrmetileglygluargglyilethrvalsergly

645650655

glyglnlysalaargileasnleualaargalailetyrglyasnpro

660665670

gluileleuilemetaspaspvalleuseralavalaspalaargval

675680685

glyalaglyilevalaspaspcysleuargglyleualalysasnser

690695700

thrargileleualathrhisglnleuservalleuprolysalaasp

705710715720

hisvalilephemetaspalagluglyglnphehisileglythrtyr

725730735

glngluleuglualaaspasngluglnphelysalaleuleualaala

740745750

glysermetserlysglugluvalvalalavalaspgluthrgluval

755760765

valilegluglyaspleugluaspaspcysaspasnlysgluglutyr

770775780

gluaspalaalagluthrileserileleualaaspalathrglnglu

785790795800

leuglnlysvalthrthrthrvalseralapheglugluasnaspasn

805810815

metmetglugluglugluargmetargaspalavalglyleuhisval

820825830

tyrtrpglntyrpheargglnalaasnproserargvallysvalmet

835840845

metpheileglymetilepheilesermetilevalilealapheleu

850855860

phevalphethrservaltrpleuserphetrpthrglyaspargphe

865870875880

hisalaserargasnphetyrthrglyiletyrilemetleuglyile

885890895

leuleuleuleualavalalaglytyrmetilevalasngluileasn

900905910

seralametalaalaargasnleuhisasnhisalaleuaspserval

915920925

phealaalaargthrserphepheaspthrthrproglnglyargile

930935940

ileasnargphethrargaspthraspserleuaspasngluleuala

945950955960

metargleuthrmetleuphepheglyvalseralaphepheserasn

965970975

pheleuleuthrcysvaltyrvalprotyrvalthrleuvalleuval

980985990

provalglyphevalphetyrvalserleuglytyrtyrarglysser

99510001005

alaarggluvallysargileaspserilegluargserhismet

101010151020

metservalpheasngluserileserglymetprovalileile

102510301035

mettyrlysalaglnhisargleumetasnlysleuglnalathr

104010451050

leuaspaspmetaspseralatyrpheleuthralaalaasngln

105510601065

argtrpleuserleuargleuaspglyleuglyserleuvalval

107010751080

leuvalalathrileleuvalalavalglyvalpheaspleuthr

108510901095

proserasnmetglyleuileileseralaalaserpheilepro

110011051110

gluvalmetsermetvalalaglnalavalalagluleugluasn

111511201125

cysmetasnalathrgluargileleutyrtyrlysaspasnile

113011351140

proalaglualaalaarggluvalaspglythrgluleuaspgln

114511501155

argproasntrpprogluglnglyalaileserpheasnasnval

116011651170

sermetlystyrargaspglyleuprotyrvalleulysserleu

117511801185

servalasppheglnglyglyhislysvalglyilecysglyarg

119011951200

thrglyalaglylysserthrileleuglnthrleutyrargile

120512101215

valgluleualagluglyserilethrileaspglyvalaspile

122012251230

serthrileglyleuhisglnleuargserglnleuserileile

123512401245

proglngluprovalleupheleuglythrileargserasnleu

125012551260

aspproleugluglntyrseraspalagluleutrpglyserleu

126512701275

argargserglyleuleuaspgluglygluthrgluglylysphe

128012851290

hisleuaspglnlysvalglualaaspglyserasnpheserleu

129513001305

glygluargglnleuleuthrleualaargalaleuleuargasn

131013151320

thrlysileleuvalleuaspglualathrserasnvalasptyr

132513301335

lysthrasplysleuvalglngluthrileserarggluphegly

134013451350

hiscysthrileleucysilealahisargleuargthrileala

135513601365

lystyraspargileleuvalleugluserglygluileasngln

137013751380

tyraspthrprotrpasnleutyrasnasplysgluglyilephe

138513901395

argglymetcysaspthrserglyleuasngluvalasppheasn

140014051410

lys

<210>30

<211>1000

<212>dna

<213>yarrowialipolytica

<400>30

cggttgagagttcaagaacacgaccaagtaaccccgagaaagtgtcgatggatacagaga60

aaacaatatcgcagatattgacaacaaacttgcaacgagagccctctacatgctccaata120

ttcttcttccagacctacccgttcacacaactacaagttgccgccttaaacaacaacgtg180

gtcaactccggagttaacagaagcataataatgtgatggaatttggaggttggggagaga240

cagtttggaccggagacacgccacggggaaatcatcataaacattggtaaaatgccaaaa300

aaaatttatacatggtagcaaaagcatcctggagaactcctaagtatgtcagggtcccaa360

aaacctcgttaatggaggcctgcggacttcttccgtgacattgtgaaccattaatacaac420

ctgaaaagaccatctgcaaaacaccagtgatagtggttccaacgcaacttcgtgcacact480

caacgctaccactgctagacctaccgccgttagacctattgtatcgccgccaccgttctt540

aaatgcagatgaagtaaacactgccgttcggtccaataattaatgttgctccgccatgct600

cagttttttttcttttctttcggcaaaataaccttcgcagtcatgtgagatatcgcacga660

caagatgtgactaacatgccaacggcggctgcccccaaggtgtatatgagtaccaaatta720

gggcatgatacaagaatacctttcgaaaagccggaacaagataaagcagcccaaccctta780

taacggccagctagcgccaaacttgctcgccccgagccccacccgcttctcatccgtacg840

ccatttcgtgccacgtatccagaaagttctactcccagcacagggttaggggtgttgcca900

ttctgggtcactccccaccaccacagcatgttttttcctctctcccgacaaccacaactc960

tctagtttacactaaccacacacgacaccaattttaaaaa1000

<210>31

<211>300

<212>dna

<213>yarrowialipolytica

<400>31

atgcaaaccaagtaatttattgtgtagtctaggattgacatttgattaccgtgtacatta60

aatgaatgattgtaaattgaaagaggaagtgtagcaatggttgaatggggagtaatgggt120

tactgtaattgcatgtcccaccttctttgcaccgttcttgttgtatacagtacaatacat180

acataccctatgtatgttttttgtgaatatgatgagtctactactacagtaaatcagctt240

tgatccctgccagaatgtgtgtacacagtatgggactctcatcccctgtacaatataata300

<210>32

<211>912

<212>dna

<213>artificialsequence

<220>

<223>cargnucleicacidsequencecodonoptimizedfory.lipolitica

<400>32

atgctcaactctcacaaccgaaccgaggagcgatccaccgaggatattattctcgagcct60

tacacctacctcatttctcagcccggaaaggacattcgagctaagctcatttctgccttt120

gacctctggctgcacgttcctaaggatgttctttgcgtcatcaacaagattatcggtatg180

ctgcacaacgcctctcttatgattgacgatgttcaggacgactctgatctccgacgagga240

gtccccgttgctcaccacatttacggtgtccctcagactattaacaccgctaactacgtg300

attttcctcgcccttcaggaggttatgaagctgaacatcccttctatgatgcaggtgtgt360

accgaggagcttattaacctccaccgaggtcagggaattgagctgtactggcgagattcc420

ctcacttgtcccactgaggaggagtacattgatatggttaacaacaagacctctggcctc480

cttcgacttgccgtccgactgatgcaggctgcttctgagtccgacatcgactacacccct540

ctcgtcaacattatcggaattcacttccaggttcgagatgactacatgaacctccagtcc600

acctcttacactaacaacaagggcttttgcgaggacctgaccgagggaaagttctccttc660

cctattattcacgctattcgaaaggacccctctaaccgacagctcctgaacattatctct720

cagaagcccacctccattgaggttaagaagtacgctcttgaggtgatccgaaaggctgga780

tcttttgagtacgttcgagagttccttcgacagaaggaggctgagtccctgaaggagatc840

aagcgacttggcggcaaccctctcctcgagaagtacattgagactattcgagtcgaggct900

actaacgactaa912

<210>33

<211>1419

<212>dna

<213>artificialsequence

<220>

<223>ugt2_6bcpofory.lipolitica

<400>33

atggctacttccgactccattgtcgacgaccgaaagaagctccacattgtcatgttcccc60

tggctcgcctttggccacatcattccctacctcgagctttccaagctcattgcccagaag120

ggccacaaggtttctttcctctccaccaccaagaacattgaccgactctcctcccacatc180

tctcctctcatcaacgttgtccagctcaccctcccccgagtccaggagctgcccgaggac240

gccgaggccaccaccgatgtccaccccgaggatatcccctacctcaagaaggcctccgac300

ggtctgcagcccgaggtcaccgagttcctcgagcagcactctcccgactggatcatctac360

gactacacccactactggctcccctccattgccaccaagcacggtgtctctcgagcccac420

ttctccgtcaccaccccctgggccattgcctacatgggccccactgctgacgccatgatc480

aacggttccgatggccgaaccacccccgaggacttcactgtccctcccaagtggttcccc540

ttccccaccaaggtctgctggcgaaagcacgatctggcccgactcgttccctacaaggcc600

cccggtatctccgacggctaccgaatgggtctggtcatcaagggctgcgactgtctgctc660

tccaagacctaccacgagtttggcacccagtggctccgactcctcgagactctccaccga720

aagcccgtcatccccgtcggtctgctccctccctccatccccggctccgacaaggacgac780

tcttgggtttccatcaaggagtggctcgacggccaggagaagggctctgttgtctacgtt840

gctctcggttccgaggttctcgtcacccaggacgaggttgttgagctggcccacggtctg900

gagctgtccggcctccccttcgtctgggcttaccgaaaccccaagggtcccgccaagtcc960

gactccgtcgagcttcccgatggtttcgtcgagcgagtccgagatcgaggtctggtctgg1020

acctcttgggctccccagctccgaatcctctcccacgagtccgtctgtggtttcctcacc1080

cactgcggttccggctccatcgtcgagggtctgatgttcggccaccccctcatcatgctc1140

cccatcttcggtgaccagcccctcaacgcccgactccttgaggacaagcaggtcggtatc1200

gagatcccccgaaacgaagaggacggttccttcacccgagactctgttgctgagtctctc1260

cgactcgtcatggtcgaggaagagggtaagatctaccgagagaaggccaaggagatgtcc1320

aagctgttcggtgacaaggatctccaggaccagtacgtcgacgactttgtcgagtacctc1380

cagaagcaccgacgagctgttgccattgaccacgagtct1419

<210>34

<211>1341

<212>dna

<213>artificialsequence

<220>

<223>rt18nucleicacidsequencecpofory.lipolitica

<400>34

atgtccaccaccctcaaggtcctcatgttccccttcctcgcttacggccacatctctccc60

tacctcaacgttgccaagaagctcgccgaccgaggcttcctcatctacctctgttccacc120

cccatcaacctcaagtccaccatcaacaagatccccgagaagtacgccgactccatccag180

ctcatcgaactccatctccccgagcttcccgagctgcctccccactaccacaccaccaac240

ggtctgcctcccaacctcaaccacatcctccgacgagccctcaagatgtccaagcccaac300

ttctccaagatcatgcagaacctgaagcccgatctgctcatctacgacattctccagcag360

tgggccgaggatgtcgccaccgagcttaacatccccgccgtcaagctgctcacctctggt420

gttgctgttttctcttacttcttcaacctcaccaagaagcccgaggtcgagttcccctac480

cccgctatctacctccgaaagatcgagctggtccgatggtgcgagactctgtccaagcac540

aacaaggaaggtgaggagcacgacgacggcctcgcctacggcaacatgcagatcatgctc600

atgtccacttccaagatcctcgaggccaagtacattgactactgcattgagctgaccaac660

tggaaggtcgtccccgtcggctctctcgtccaggactccatcaccaacgacgccgctgac720

gacgacatggaactcattgactggctcggtactaaggacgagaactccaccgtctttgtc780

tcttttggctccgagtacttcctctccaaagaggacgttgaagaggttgccttcggtctg840

gagctgtccaacgtcaacttcatctgggttgtccgattccccaagggtgaggagaagaac900

ctcgaggacgttctgcccaagggcttcttcgagcgaatcggtgagcgaggccgagtcctc960

gacaagtttgctccccagccccgaattctcaaccacccctctaccggtggtttcatctct1020

cactgtggctggaactccgccatggagtccattgactttggtgtccccattgtcgccatg1080

cccatgcagctcgaccagcccatgaacgcccgactcattgtcgagcttggtgttgccgtc1140

gagattgtccgagatgatgatggtaagatctaccgaggtgagattgctgagactctcaag1200

ggtgtcatcaccggcgagattggtgagatcctccgagccaaggtccgagacatctccaag1260

aacctcaaggccatcaaggacgaggagatggacgttgctgcccaggagctgatccagctc1320

tgccgaaactccaataaataa1341

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1