用于高效生成瑞鲍迪苷的UDP依赖性糖基转移酶的制作方法

文档序号:17743651发布日期:2019-05-24 20:26阅读:729来源:国知局
用于高效生成瑞鲍迪苷的UDP依赖性糖基转移酶的制作方法
本申请要求并享有于2016年8月12日提交的美国临时申请号62/374,408的优先权,其内容通过引用其整体并入本文。2.发明领域本发明涉及某些尿苷二磷酸依赖性糖基转移酶(ugt),包含所述尿苷二磷酸依赖性糖基转移酶的组合物,包含所述尿苷二磷酸依赖性糖基转移酶的宿主细胞,以及它们用于生成瑞鲍迪苷(包括瑞鲍迪苷d和瑞鲍迪苷m)的方法。3.发明背景需要源自天然来源的零热量甜味剂来限制高糖消耗(例如,糖尿病类和肥胖症)的不良影响。瑞鲍迪苷m(rebm)是由甜叶菊植物(steviarebaudianabertoni)生成的许多甜味化合物之一。在所有的瑞鲍迪苷中,rebm具有最高的效力(比蔗糖甜约200-300倍),口感最纯净。然而,rebm仅由甜叶菊植物少量生成,并且仅占甜菊糖苷(steviolglycoside)总含量的一小部分(<1.0%),ohtaetal.,2010,j.appl.glycosci.,57,199-209(2010)。因此,希望使用生物技术途径来生成rebm,从而使其能够大量且高纯度地生成。为了使用生物技术经济地生成产品,从原料到产品的生物转化中的每个步骤需有利地具有高转化效率(理想地>90%)。在用于生成rebm的酵母工程中,在倒数第二个生物合成步骤中发现了限制,即瑞鲍迪苷a(reba)向瑞鲍迪苷d(rebd)的转化,参见图1a。观察到天然酶(ono,ep2826861a1,ugt91d_like3或近似同源物)将约3%的reba转化为rebd。已鉴定了另外两种能够将reba转化为rebd的ugt酶。其中一种是来自稻(oryzasativa)的os_ugt_91c1(在houghton-larsen等人的专利申请wo2013/022989a2中也被称为eugt11),另一种是来自番茄(solanumlycopersicum)的sl_ugt_101249881(在markosyan等人的专利申请wo2014/193888a1中也被称为ugtsl2)。然而,本申请发明人最初观察到os_ugt_91c1和s1_ugt_101249881均具有低于期望的转化效率,分别为约53%和70%。所有这三种酶,ugt91d_like3、os_ugt_91c1和sl_ugt_101249881,均是尿苷二磷酸依赖性糖基转移酶(ugt),其通过形成β(1->2)连接键将葡萄糖基团部分转移至19-o-葡萄糖残基的c-2'位置(图1a)。为了有效且高纯度地生成rebm,需要能够以高效率将reba转化为rebd的改进的酶。本发明提供的组合物和方法解决了此种需求,并且还提供了相关优点。4.发明概述本发明提供了改善的将reba转化为rebd和改善的rebd和/或rebm生成量的组合物和方法。所述这些组合物和方法部分基于某些尿苷二磷酸依赖性糖基转移酶(ugt)的惊人发现,所述尿苷二磷酸依赖性糖基转移酶能够以非常高的效率将reba转化为rebd。假设市场对rebm的需求为每年50亿吨,即使使用新的ugt进行应变性能的适度改进(例如改进10%),则也可能在未来节省超过一千万美元的生产成本。本发明所述的某些ugt还能够生成具有很少或不含非天然糖苷类化合物(例如,rebm2副产物,即rebm的异构体)的rebm。参见ceunens.etal.steviolglycosides:chemicaldiversity,metabolism,andfunction.j.nat.prod.,76,1201-1228(2013),可获悉目前已知的甜菊糖苷类化合物列表。因此,在某些实施方案,本发明所述的组合物和方法可降低下游加工成本,以得到含有高纯度rebm的组合物。本发明还提供了用于替代酶的组合物和方法,所述替代酶能够生成具有与先前已知的ugt不同的底物特异性的甜菊糖苷类化合物。与由其他已知酶类生成的那些相比,所述新的替代酶可潜在地生成不同混合物或不同比例的甜菊糖苷类化合物。具有不同混合物或不同比例的甜菊糖苷类化合物的组合物可潜在地赋予替代的甜味特征,其可用于配制各种消费品或食品。因此,本发明提供了经遗传修饰的宿主细胞及其用于生成工业上有用的化合物的方法。一方面,本发明提供了经遗传修饰的宿主细胞,其包含:编码udp-糖基转移酶(ugt40087,也称为si_ugt_40087)的异源性核酸。在一些实施方案,所述经遗传修饰的宿主细胞还包含能够生成甜菊醇和/或甜菊糖苷类化合物的一种或多种酶途径。在一些实施方案,本发明提供了经遗传修饰的宿主细胞,其包含编码udp-糖基转移酶的异源性核酸,所述udp-糖基转移酶包含与ugt40087的序列(例如,seqidno:1或seqidno:11)具有至少80%、85%、90%、或95%序列同一性的氨基酸序列。在一些实施方案,所述经遗传修饰的宿主细胞能够以大于90%、95%、96%、或97%的效率将reba转化为rebd。在一些实施方案,所述经遗传修饰的宿主细胞包含udp-糖基转移酶,所述udp-糖基转移酶包含糖受体结构域,其中所述糖受体结构域的所述氨基酸序列与seqidno:1或seqidno:11的糖受体结构域的氨基酸序列具有至少84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%序列同一性。在一些实施方案,所述经遗传修饰的宿主细胞包含udp-糖基转移酶,所述udp-糖基转移酶包含loop1氨基酸序列,变体loop1氨基酸序列,loop2氨基酸序列,变体loop2氨基酸序列,loop3_1氨基酸序列,变体loop3_1氨基酸序列,loop3_2氨基酸序列,变体loop3_2氨基酸序列,loop4_1氨基酸序列,变体loop4_1氨基酸序列,loop4_2氨基酸序列,或其任何组合。在一些实施方案,所述经遗传修饰的宿主细胞包含udp-糖基转移酶,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的所述糖受体结构域具有至少61%、65%、70%、75%、80%、85%、90%、或95%序列同一性的氨基酸序列,和进一步包含seqidno:1或seqidno:11的所述loop4_1氨基酸序列。在一些实施方案,本发明提供了经遗传修饰的宿主细胞,其包含编码udp-糖基转移酶的异源性核酸,所述udp-糖基转移酶包含与seqidno:2、seqidno:5或seqidno:6的序列具有至少80%、85%、90%、或95%序列同一性的氨基酸序列。在一些实施方案,所述经遗传修饰的宿主细胞能够以大于60%、65%、70%、75%、80%、85%、90%、95%、96%、或97%的效率将reba转化为rebd。在一些实施方案,所述经遗传修饰的宿主细胞包含udp-糖基转移酶,所述udp-糖基转移酶包含糖受体结构域,其中所述糖受体结构域的所述氨基酸序列与seqidno:2、seqidno:5或seqidno:6的所述糖受体结构域的所述氨基酸序列具有至少84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%序列同一性。在一些实施方案,所述经遗传修饰的宿主细胞包含udp-糖基转移酶,所述udp-糖基转移酶包含loop1氨基酸序列,变体loop1氨基酸序列,loop2氨基酸序列,变体loop2氨基酸序列,loop3_1氨基酸序列,变体loop3_1氨基酸序列,loop3_2氨基酸序列,变体loop3_2氨基酸序列,loop4_1氨基酸序列,变体loop4_1氨基酸序列,loop4_2氨基酸序列,或其任何组合。在一些实施方案,所述经遗传修饰的宿主细胞包含udp-糖基转移酶,所述udp-糖基转移酶包含与seqidno:2、seqidno:5或seqidno:6的糖受体结构域具有至少61%、65%、70%、75%、80%、85%、90%、或95%序列同一性的氨基酸序列,和进一步包含seqidno:2、seqidno:5或seqidno:6的loop4_1氨基酸序列。另一方面,本发明提供了生成异源性甜菊糖苷的方法,所述方法包括:在适于制备所述甜菊糖苷类化合物的条件下,在含有碳源的培养基中培养本发明提供的经遗传修饰的宿主细胞群,所述经遗传修饰的宿主细胞群能够生成如本发明所述的甜菊糖苷;和从所述培养基中回收所述甜菊糖苷。在一些实施方案,所述异源性甜菊糖苷是选自由rebd和rebm组成的组。另一方面,本发明提供了增加宿主细胞中甜菊糖苷类化合物生成量的方法,所述方法包含:在所述宿主细胞中表达编码ugt40087的异源性核酸;在适于生成所述甜菊糖苷的条件下培养所述宿主细胞。在一些实施方案,所述宿主细胞不包含ugt91d_like3酶,os_ugt_91c1酶或sl_ugt_101249881酶。另一方面,本发明提供了用于生成rebd的方法,所述方法包含:在适于制备所述rebd的条件下,在含有碳源的培养基中培养本发明提供的经遗传修饰的宿主细胞群,所述经遗传修饰的宿主细胞群能够生成如本发明所述的rebd;和从所述培养基中回收所述rebd。另一方面,本发明提供了用于生成rebm的方法,所述方法包含:在适于制备所述rebm的条件下,在含有碳源的培养基中培养本发明提供的经遗传修饰的宿主细胞群,所述经遗传修饰的宿主细胞群能够生成如本发明所述的rebm;和从所述培养基中回收所述rebm。另一方面,本发明提供了用于生成rebd的方法,所述方法包含:在适于形成rebd的条件下,使reba与葡萄糖以及本发明所述的udp-糖基转移酶接触,所述udp-糖基转移酶能够将reba转化为rebd。另一方面,本发明提供了用于生成rebm的方法,所述方法包含:使reba与葡萄糖和本发明所述的udp-糖基转移酶,所述udp-糖基转移酶能够在适于形成rebd的条件下将reba转化为rebd,以及本发明所述的udp-糖基转移酶接触,所述udp-糖基转移酶能够将rebd转化为rebm。在一些实施方案,所述宿主细胞是酵母细胞。在一些实施方案,所述酵母是酿酒酵母(saccharomycescerevisiae)。在一些实施方案,所述宿主细胞以高效率生成rebd或rebm。在一些实施方案,与不包含所述ugt40087酶的酵母细胞相比,所述宿主细胞可生成增加量的rebd或rebm。在一些实施方案,与不包含所述ugt40087酶的酵母细胞相比,所述宿主细胞生成增加量的rebm,相对于rebm2生成量。另一方面,本发明提供的其他udg-糖基转移酶可作为ugt40087的补充或替代进行使用。所述这些包括,譬如,sr.ugt_9252778、bd_ugt10840、hv_ugt_v1、bd_ugt10850、和ob_ugt91b1_like。5.附图简要说明图1a提供了将reba转化为rebd,进而转化为rebm的示意图。图1b提供了rebm2的结构。图1c提供了所述甲羟戊酸途径的示意图。图2a提供了法呢基焦磷酸(fpp)转化为甜菊醇的示例性途径。图2b提供了甜菊醇转化为rebm的示例性途径。图2c提供了酶促生成rebm的示例性途径。图3提供了在体内将reba转化为rebd的转化率,通过reb(d+m)的微摩尔数/reb(a+d+m)的微摩尔数进行测定。亲本对照菌株标记为91d_like3(来自甜叶菊(steviarebaudiana));此菌株除了空的着陆垫(landingpad)之外还含有ugt:仅85c2、74g1、91d_like3和76g1。值得注意的是,91d_like3具有非常低的将reba转化为rebd的转化率(~3%,见表5)。将每个ugt酶的单拷贝插入所述亲本对照菌株中并筛选改进的reba向rebd的转化。示出了六种ugt酶可将reba转化为rebd,其至少等于或优于先前已知的酶os_ugt_91c1和s1_ugt_101249881。三种ugt酶(si_ugt_40087、ob_ugt91b1_like和hv_ugt_v1在将reba转化为rebd时优于先前鉴定的两种ugt酶。误差棒均是标准误差。图4提供了用于插入单个ugt酶以筛选酵母中reba向rebd转化的“着陆垫”设计的示意图。图5a-h示出了用于生成表5和图3中所示数据的每个ugt基因的体内生成的reba、rebd、rebm、rebm2的色谱图。选择色谱峰以示出与reba、rebd、rebm和rebm2相关的峰。每个图示出了真实标准品、对照亲本菌株y31062和具有额外ugt酶的y31062的保留时间与%强度的关系。y31062是亲本对照菌株,含有ugt74g1、ugt85c2、ugt91d_like3和ugt76g1,带有空的着陆垫。图5a:si_ugt_40087的数据;此图还包括rebe真实标准品的色谱图。图5b:ob_ugt91b1_like的数据。图5c:hv_ugt_v1的数据。图5d:sl_ugt_101249881的数据。图5e:ugt_g252778的数据。图5f:os_ugt_91c1的数据。图5g:bd_ugt10850的数据。图5h:bd_ugt10840的数据。图5i示出了仅用于si_ugt_40087的rebe峰的色谱图与用于确认此峰为rebe的真实标准品之间关系的放大视图。图6示出了ugt40087结构的同源模型。其n-末端和c-末端结构域以浅灰色和深灰色示出,并且在环路(loop)交换实验中使用的四个环路也在所述结构上进行了标记。图7示出了ugt结构域交换构建体的示意性概述。图8示出了四种udp-糖基转移酶(ugt40087(seqidno:1);os_ugt_91c1(seqidno:8);91dlike3(seqidno:7);si91dlike(seqidno:12))的序列比对。图9a示出了亲本对照细胞(包含ugt74g1、ut85c2、ugt76g1和ugt91d_like3)在体内生成的甜菊糖苷类化合物的色谱图。图9b示出了含有ugt40087的亲本对照菌株在体内生成的甜菊糖苷类化合物的色谱图。图9c示出了含有ob_ugt91b1_like的亲本对照菌株在体内生成的甜菊糖苷类化合物的色谱图。6.具体实施方式6.1术语定义本发明使用的术语“异源的/异源性/异源”是指通常在自然界中不存在的物质。术语“异源性核苷酸序列”是指自然界中在给定细胞中通常不存在的核苷酸序列。因此,异源性核苷酸序列可以是:(a)相对于其宿主细胞是外源的(即,对所述细胞而言是“外源的”);(b)天然存在于所述宿主细胞中(即“内源性/內源的”),但在所述细胞中以非天然量存在(即,比所述宿主细胞中天然存在的量更多或更少);或(c)天然存在于所述宿主细胞中,但位于其天然基因座之外。术语“异源性酶”是指自然界中通常在给定细胞中不存在的酶。所述术语包括以下酶:(a)对给定细胞而言是外源的(即,由天然存在于所述宿主细胞中或不在所述宿主细胞的给定环境中天然存在的核苷酸序列编码);和(b)天然存在于所述宿主细胞中(例如,所述酶由细胞内源的核苷酸序列编码),但在所述宿主细胞中以非天然量(例如,大于或小于所述天然存在的量)生成。另一方面,本发明使用的术语“天然的”或“内源的/内源性”涉及分子,特别是酶和核酸,表示在它们起源或在自然界中发现的生物体中表达的分子,与表达水平无关,所述表达水平可低于、等于或高于天然微生物体中分子的表达水平。应理解,天然酶或天然多核苷酸的表达可在重组微生物中进行修饰。本发明使用的术语“亲本细胞”是指与本发明公开的经遗传修饰的宿主细胞具有相同遗传背景的细胞,除了其不包含工程化到所述经修饰的宿主细胞中的一种或多种特定遗传修饰,譬如,选自由以下组成的组的一种或多种修饰:甜菊醇途径的酶的异源表达,甜菊糖苷途径的酶的异源表达,香叶基香叶基焦磷酸合酶的异源表达,柯巴基焦磷酸合酶的异源表达,贝壳杉烯合酶的异源表达,贝壳杉烯氧化酶的异源表达,甜菊醇合成酶(异贝壳杉烯酸羟化酶)的异源表达,细胞色素p450还原酶的异源表达,ugt74g1的异源表达,ugt76g1的异源表达,ugt85c2的异源表达,ugt91d的异源表达,和ugt40087的异源表达。本发明使用的术语“天然存在的”是指天然存在的那些物质。譬如,存在于生物体中的udp-糖基转移酶是天然存在的udp-糖基转移酶,其可从自然界中的来源分离得到并且在实验室中未被人有意修饰。相反,本发明使用的术语“非天然存在的”是指在自然界中未发现但通过人为干预生成的那些物质。术语“培养基”是指培养基和/或发酵培养基。术语“发酵组合物”是指组合物,所述组合物包含经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的产物或代谢物。发酵组合物的实例是全细胞培养液,其可以是容器(例如,烧瓶、平板或发酵罐)的全部内容物,包括细胞、水相和由所述经遗传修饰的宿主细胞生成的化合物。术语“生成量”通常是指由本发明提供的经遗传修饰的宿主细胞生成的甜菊醇或甜菊糖苷的量。在一些实施方案,生成量表示为由所述宿主细胞生成的甜菊醇或甜菊糖苷的产量。在其他实施方案,生成量表示为生成所述甜菊醇或甜菊糖苷时所述宿主细胞的生产率。本发明使用的术语“生产率/生产力”是指由宿主细胞生成甜菊醇或甜菊糖苷的量,表示为每单位量的发酵液中生成的甜菊醇或甜菊糖苷的量(按重量计),其中所述宿主细胞根据时间(每小时)进行培养(按体积计)。本发明使用的术语“产量/产率”是指由宿主细胞生成的甜菊醇或甜菊糖苷的量,表示为宿主细胞消耗的每单位量的碳源生成的甜菊醇或甜菊糖苷的量,按重量计。本发明使用的术语化合物(例如,rebm2、甜菊糖苷类化合物或其他化合物)的“不可检测水平”是指化合物的水平太低而不能通过标准技术来测定和/或分析所述化合物。譬如,所述术语包括由实施例7中所述的分析方法无法检测的化合物的水平。本发明使用的术语“甜菊糖苷/甜菊糖苷类化合物”是指通过添加一个或多个糖基团部分而进行酶促改变的甜菊醇,所述糖基团部分诸如甜菊醇的糖苷,包括但不限于,天然存在的甜菊糖苷类化合物,例如天然存在的甜菊单糖苷、甜菊双糖苷、甜茶苷、杜克苷b、杜克苷a、瑞鲍迪苷b、瑞鲍迪苷g、甜菊苷(stevioside)、瑞鲍迪苷c、瑞鲍迪苷f、瑞鲍迪苷a、瑞鲍迪苷i、瑞鲍迪苷e、瑞鲍迪苷h、瑞鲍迪苷l、瑞鲍迪苷k、瑞鲍迪苷j、瑞鲍迪苷m、瑞鲍迪苷d、瑞鲍迪苷n、瑞鲍迪苷o,合成甜菊糖苷类化合物例如酶促糖基化的甜菊糖苷类化合物及其组合。本发明使用的术语“尿苷二磷酸(udp)-糖基转移酶”或“udp依赖性糖基转移酶”是指具有将单糖基团部分从糖基供体转移至糖基受体的活性的酶,特别是,利用udp-糖作为糖基供体的酶。术语“udp-糖基转移酶”可与“ugt”互换使用。本发明使用的术语“功能结构域”是指udp-糖基转移酶的“糖受体结构域”或“糖供体结构域”。植物udp-糖基转移酶(ugt)属于糖基转移酶超家族的家族1。它们采取gt-b结构折叠。ugt的这种共有结构特征由两个结构域组成,即c-末端结构域和具有类似罗斯曼样(rossmann-like)折叠的n-末端结构域,其由结构域间连接体分开。所述c-末端结构域结合udp-葡萄糖(“糖供体”),因此也称为糖供体结构域,而所述n-末端结构域结合非糖底物(“受体”),因此也称为受体结构域。本发明使用的术语“变体”是指通过氨基酸插入、缺失、突变和/或置换而不同于具体列举的“参考”多肽(例如,野生型序列)的多肽,但保留与所述参考多肽基本相似的活性。譬如,变体ugt40087保留与具有seqidno:11的参考ugt40087基本相似的活性,因为变体ugt40087也能够催化reba向rebd转化、和/或甜菊苷(stevioside)向rebe转化的反应。在一些实施方案,所述变体通过重组dna技术(例如诱变)而产生。在一些实施方案,变体多肽与其参考多肽的不同之处在于一个碱基残基置换另一个碱基残基(即,arg置换lys),一个疏水残基置换另一个疏水残基(即,leu置换ile),或一个芳香族残基置换另一个芳香族残基(即,phe置换tyr)等。在一些实施方案,变体包括类似物,其中实现保守置换导致所述参考序列的基本结构类似。此类保守置换的实例包括但不限于,谷氨酸置换天冬氨酸,反之亦然;谷氨酰胺置换天冬酰胺,反之亦然;丝氨酸置换苏氨酸,反之亦然;赖氨酸置换精氨酸,反之亦然;或者任何异亮氨酸、缬氨酸或亮氨酸之间的彼此置换。本发明使用的术语“变体loop1”氨基酸序列是指与seqidno:1或seqidno:11的参考loop1氨基酸序列(或具有seqidno:28的所述序列的ugt40087的经修饰的loop1序列)相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列,但允许包含变体loop1氨基酸序列的udp-糖基转移酶,插入分别对应于seqidno:1或seqidno:11的loop1氨基酸序列位置的位置处,以催化reba向rebd转化、和/或甜菊苷向rebe转化。本发明使用的术语“变体loop2”氨基酸序列是指与seqidno:1或seqidno:11的参考loop2氨基酸序列相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列,但允许包含变体loop2氨基酸序列的udp-糖基转移酶,插入分别对应于seqidno:1或seqidno:11的loop2氨基酸序列位置的位置处,以催化reba向rebd转化、和/或甜菊苷向rebe转化。本发明使用的术语“变体loop3_1”氨基酸序列是指与seqidno:1或seqidno:11的参考loop3_1氨基酸序列相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列,但允许包含变体loop3_1氨基酸序列的udp-糖基转移酶,插入分别对应于seqidno:1或seqidno:11的loop3_1氨基酸序列位置的位置处,以催化reba向rebd转化、和/或甜菊苷向rebe转化。本发明使用的术语“变体loop3_2”氨基酸序列是指与seqidno:1或seqidno:11的参考loop3_2氨基酸序列相差1、2、3、4、5、6、7、8、9或10个氨基酸插入、缺失、突变和/或置换的氨基酸序列,但允许包含变体loop3_2氨基酸序列的udp-糖基转移酶,插入分别对应于seqidno:1或seqidno:11的loop3_2氨基酸序列位置的位置处,以催化reba向rebd转化、和/或甜菊苷向rebe转化。在某些实施方案,变体loop3_2氨基酸序列与所述参考loop3_2氨基酸序列相差1、2、3、4、5、6、7、8、9、10个、或多达30个氨基酸插入、缺失、突变和/或置换。本发明使用的术语“变体loop4_1”氨基酸序列是指与seqidno:1或seqidno:11的参考loop4_1氨基酸序列相差1、2、3、4、5、6、7、8、9、10个、或多达30个氨基酸插入、缺失、突变和/或置换的氨基酸序列,但允许包含变体loop4_1氨基酸序列的udp-糖基转移酶,插入对应于seqidno:11的loop4_1氨基酸序列位置的位置处,以催化reba向rebd转化、和/或甜菊苷向rebe转化。在上下文中或两个或更多个核酸或蛋白质序列中,本发明使用的术语“序列同一性”或“同一性百分比”是指两个或更多个序列或子序列是相同,或所述序列或子序列具有特定百分比的相同的氨基酸残基或核苷酸。譬如,当进行比较和比对以在比较窗口上进行最大对应,或者使用序列比较算法或通过手动比对和目视检查进行测定的指定区域时,所述序列可在所述指定区域与参考序列具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或更高的同一性,或者使用序列比较算法或通过手动比对测量的指定区域和视觉检查。譬如,通过计算所述序列中相同核苷酸(或氨基酸残基)的数量除以总核苷酸(或氨基酸残基)的长度减去任何空位(gap)的长度的比值来确定同一性百分比。为方便起见,可使用本领域已知的计算机程序和数学算法来确定两个序列之间的同一性程度。计算序列同一性百分比的此类算法通常考虑所述比较区域上的序列空位和错配。比较和比对序列的程序,如clustalw(序列比对w)(thompsonetal.,(1994)nucleicacidsres.,22:4673-4680),clustalomega(序列比对ω)(sieversetal.,(2011)molecularsystemsbiology.,7:539),align(myersetal.,(1988)cabios,4:11-17),fasta(pearsonetal.,(1988)pnas,85:2444-2448;pearson(1990),methodsenzymol.,183:63-98),以及空位的blast(altschuletal.,(1997)nucleicacidsres.,25:3389-3402),均可用于此目的。所述blast或blast2.0(altschuletal.,j.mol.biol.215:403-10,1990)可从若干来源得到,包括国家生物信息中心(ncbi)和因特网,用于与序列分析程序blastp、blastn、blastx、tblastn和tblastx结合使用。更多信息可从ncbi网站上获悉。在一些实施方案,序列比对和同一性百分比计算可使用blast程序采用其标准默认参数来确定。对于核苷酸序列比对和序列同一性计算,blastn程序可以其默认参数(空位开放罚分=5,空位延伸罚分=2,核匹配=1,核不匹配=-3,期望值=10.0,字大小=11,查询范围中的最大匹配数=0)进行使用。在一些实施方案,对于核苷酸序列比对和序列同一性计算,blastp程序可以这些默认参数(空位开放罚分=5,空位延伸罚分=2,核匹配=1,核不匹配=-3,期望值=10.0;字大小=11)进行使用。对于多肽序列比对和序列同一性计算,blastp程序可以其默认参数(比对矩阵=blosum62;空位损失(gapcosts):存在(existence)=11,扩展(extension)=1;组成调整(compositionaladjustments)=条件组成得分(conditionalcompositionalscore),矩阵调整;期望值=10.0;字大小(wordsize)=6;查询范围中的最大匹配数=0)进行使用。或者,使用以下程序和参数:克隆管理组件(clonemanagersuite)的比对加强版(alignplus)软件,版本5(sci-ed软件);dna比较:总体比较(globalcomparison),标准线性评分矩阵(standardlinearscoringmatrix),不匹配罚分=2,开放空位罚分=4,延伸空位罚分=1。在本发明所述的实施方案中,使用blastn或blastp程序使用其默认参数来计算序列同一性。在本发明所述的实施方案中,使用clustalomega使用建议的默认参数进行两个或更多个序列的序列比对(dealign输入序列:无;mbed样聚类引导树(mbed-likeclusteringguide-tree):是;mbed样聚类迭代(mbed-likeclusteringiteration):是;组合迭代次数:默认(0);最大引导树迭代:默认;最大hmm迭代:默认;顺序:比对)。6.2宿主细胞本发明提供了能够以高效率从瑞鲍迪苷a(reba)生成瑞鲍迪苷d(rebd)的宿主细胞。在某些实施方案,所述宿主细胞可从作为起始物料的reba生成rebd。在优选实施方案中,所述宿主细胞可从培养基中的碳源生成reba,并可进一步由reba生成rebd。在特定实施方案中,所述宿主细胞可进一步由rebd生成瑞鲍迪苷m(rebm)。在特定实施方案中,所述宿主细胞包含尿苷二磷酸糖基转移酶87(ugt40087)的酶活性。ugt40087酶能够高效地将reba转化为rebd。在某些实施方案,ugt40087酶能够以大于80%的效率将reba转化为rebd。在某些实施方案,ugt40087酶能够以大于85%的效率将reba转化为rebd。在某些实施方案,ugt40087酶能够以大于90%的效率将reba转化为rebd。在某些实施方案,ugt40087酶能够以大于95%的效率将reba转化为rebd。在某些实施方案,ugt40087酶能够以大于96%的效率将reba转化为rebd。在某些实施方案,ugt40087酶能够以大于97%的效率将reba转化为rebd。在某些实施方案,ugt40087酶能够将甜菊苷转化为rebe。在某些实施方案,所述宿主细胞能够以大于80%的效率将reba转化为rebd。在某些实施方案,所述宿主细胞能够以大于85%的效率将reba转化为rebd。在某些实施方案,所述宿主细胞能够以大于90%的效率将reba转化为rebd。在某些实施方案,所述宿主细胞能够以大于95%的效率将reba转化为rebd。在某些实施方案,所述宿主细胞能够以大于96%的效率将reba转化为rebd。在某些实施方案,所述宿主细胞能够以大于97%的效率将reba转化为rebd。在某些实施方案,所述宿主细胞能够将甜菊苷转化为rebe。可通过本领域技术人员显而易见的任何技术来测定转化效率。在某些实施方案,转化效率可通过在合适的条件下使reba与酶或宿主细胞接触以形成rebd来测定。效率可以通过比较所得组合物中生成的rebd的摩尔量与reba和rebd的总量之比来测定。效率还可通过比较所得组合物中的rebd和rebd的下游产物的总量与reba、rebd和rebd的下游产物的总量来测量。譬如,效率还可通过比较所得组合物中的rebd、rebm和rebm2的总量与reba、rebd、rebm和rebm2的总量之比来测定。在某些实施方案,本发明提供了包含ugt40087的宿主细胞,所述ugt40087包含seqidno:1或seqidno:11的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列基本上相同的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少60%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少65%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少70%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少75%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少85%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少90%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少95%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少96%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少97%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少98%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少99%同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的氨基酸序列具有至少60%,至少99%,或至少60%和99%之间的任何百分比同一性的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含本发明所述的氨基酸序列,并能够将reba转化为rebd。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含本发明所述的氨基酸序列,并能够对甜菊糖苷的19-o葡萄糖的c2'位置进行β-1,2糖基化。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶能够以大于90%、95%、96%、或97%的效率将reba转化为rebd,和其中所述udp-糖基转移酶包含氨基酸序列,所述氨基酸序列与seqidno:1或seqidno:11的氨基酸序列具有至少95%序列同一性。在某些实施方案,本发明提供了包含编码ugt40087的核酸的宿主细胞,所述ugt40087包含seqidno:1或seqidno:11的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列基本上相同的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少60%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少65%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少70%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少75%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少85%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少90%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少95%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少96%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少97%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少98%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少99%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的氨基酸序列具有至少60%,至少99%,或60%和99%之间的任何百分比同一性的氨基酸序列。在某些实施方案,本发明提供了包含异源性核酸的宿主细胞,所述异源性核酸包含seqidno:13的核苷酸序列,其编码具有seqidno:11序列的ugt40087。在某些实施方案,本发明提供了包含异源性核酸的宿主细胞,所述异源性核酸包含与seqidno:13的核苷酸序列具有至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,或至少99%同一性的核苷酸序列。在某些实施方案,本发明提供了包含异源性核酸的宿主细胞,所述异源性核酸包含与seqidno:11的核苷酸序列具有至少90%,至少99%,或60%和99%之间的任何百分比同一性的核苷酸序列。在某些实施方案,本发明提供了包含ugt40087的功能结构域的宿主细胞,其中所述ugt40087包含seqidno:1或seqidno:11的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含ugt40087的n-末端糖受体结构域,所述ugt40087包含seqidno:1或seqidno:11的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含ugt40087的c-末端糖供体结构域,所述ugt40087包含seqidno:1或seqidno:11的氨基酸序列。在某些实施方案,ugt40087的所述糖受体结构域包含seqidno:11的约1至214位氨基酸位置(其对应于seqidno:1的氨基酸位置1至215)。在某些实施方案,ugt40087的所述糖供体结构域包含seqidno:11的约215至435位氨基酸位置(其对应于seqidno:1的氨基酸位置216至436)。在某些实施方案,ugt40087的所述糖受体结构域包含seqidno:1的约1至215位氨基酸位置。在某些实施方案,ugt40087的所述糖供体结构域包含seqidno:1的约216至436位氨基酸位置。在某些实施方案,相对于seqidno:11,ugt40087的所述糖受体结构域和所述糖供体结构域分别包含比1至214或215至435更窄的氨基酸残基范围。在某些实施方案,相对于seqidno:1,ugt40087的所述糖受体结构域和所述糖供体结构域分别包含比1至215或216至436更窄的氨基酸残基范围。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列基本上相同的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少60%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少65%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少70%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少75%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少85%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少90%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少95%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少96%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少97%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少98%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少99%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少60%,至少99%,或60%和99%之间的任何百分比同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码ugt40087的核酸的宿主细胞,所述ugt40087包含seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列基本上相同的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少60%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少65%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少70%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少75%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少85%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少90%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少95%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少96%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少97%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少98%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少99%同一性的氨基酸序列。在某些实施方案,当比较和分析ugt40087和另一udp-糖基转移酶的三维模型结构时,它们揭示了在n-末端糖受体结构域具有显著构象差异的四个环路(loop)(即,loop1、loop2、loop3和loop4)。参见图6和实施例12。来自所述两个ugt之间相应环路(loop)序列交换的实验结果表明ugt40087的loop1、loop2、loop3_1、loop3_2和loop4_1可以与其各自、来自其他udp-糖基转移酶的相应环路(loop)序列进行置换,所述其他udp-糖基转移酶能够将reba转化为rebd。在所述这些实施方案中,设计了两个版本的loop3(即,loop3_1和loop3_2)和loop4(即,loop4_1和loop4_2)来考虑两个可能的环路(loop)长度。因此,在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。因此,在某些实施方案,本发明提供了包含编码udp-糖基转移酶的异源性核酸的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列。在某些实施方案,所述udp-糖基转移酶在分别对应于seqidno:1或seqidno:11的所述loop1位置的所述udp-糖基转移酶的位置处还包含ugt40087(即,seqidno:1或seqidno:11)的loop1氨基酸序列。在某些实施方案,seqidno:1或seqidno:11的所述loop1氨基酸序列具有seqidno:30的氨基酸序列。在某些实施方案,所述loop1氨基酸序列具有seqidno:28的序列。在某些实施方案,所述udp-糖基转移酶在分别对应于seqidno:1或seqidno:11的所述loop1位置的所述udp-糖基转移酶的位置处还包含变体loop1氨基酸序列。所述变体loop1氨基酸序列是指与seqidno:1或seqidno:11的所述参考loop1氨基酸序列或具有seqidno:28的所述loop1氨基酸序列不同的氨基酸序列,但允许包含所述变体loop1氨基酸的所述udp-糖基转移酶保留其将reba转化为rebd和/或将甜菊苷转化为rebe的活性。在某些实施方案,所述udp-糖基转移酶在分别对应于seqidno:1或seqidno:11的所述loop2位置的所述udp-糖基转移酶的位置处还包含ugt40087(即,seqidno:1或seqidno:11)的loop2氨基酸序列。在某些实施方案,seqidno:1或seqidno:11的所述loop2氨基酸序列具有seqidno:19的氨基酸序列。在某些实施方案,所述udp-糖基转移酶在分别对应于seqidno:1或seqidno:11的所述loop2位置的所述udp-糖基转移酶的位置处还包含变体loop2氨基酸序列。所述变体loop2氨基酸序列是指与seqidno:1或seqidno:11的所述参考loop2氨基酸序列不同的氨基酸序列,但允许包含所述变体loop2氨基酸的所述udp-糖基转移酶保留其将reba转化为rebd和/或将甜菊苷转化为rebe的活性。在某些实施方案,所述udp-糖基转移酶在分别对应于seqidno:1或seqidno:11的所述loop3_1位置的所述udp-糖基转移酶的位置处还包含ugt40087(即,seqidno:1或seqidno:11)的loop3_1氨基酸序列。在某些实施方案,seqidno:1或seqidno:11的所述loop3_1氨基酸序列具有seqidno:20的氨基酸序列。在某些实施方案,所述udp-糖基转移酶在分别对应于seqidno:1或seqidno:11的所述loop3_1位置的所述udp-糖基转移酶的位置处还包含变体loop3_1氨基酸序列。所述变体loop3_1氨基酸序列是指与seqidno:1或seqidno:11的所述参考loop3_1氨基酸序列不同的氨基酸序列,但允许包含所述变体loop3_1氨基酸的所述udp-糖基转移酶保留其将reba转化为rebd和/或将甜菊苷转化为rebe的活性。在某些实施方案,所述udp-糖基转移酶在分别对应于seqidno:1或seqidno:11的所述loop3_2位置的所述udp-糖基转移酶的位置处还包含ugt40087(即,seqidno:1或seqidno:11)的loop3_2氨基酸序列。在某些实施方案,seqidno:1或seqidno:11的所述loop3_2氨基酸序列具有seqidno:21的氨基酸序列。在某些实施方案,所述udp-糖基转移酶在分别对应于seqidno:1或seqidno:11的所述loop3_2位置的所述udp-糖基转移酶的位置处还包含变体loop3_2氨基酸序列。所述变体loop3_2氨基酸序列是指与seqidno:1或seqidno:11的所述参考loop3_2氨基酸序列不同的氨基酸序列,但允许包含所述变体loop3_2氨基酸的所述udp-糖基转移酶保留其将reba转化为rebd和/或将甜菊苷转化为rebe的活性。在某些实施方案,所述udp-糖基转移酶在分别对应于seqidno:1或seqidno:11的所述loop4_1位置的所述udp-糖基转移酶的位置处还包含ugt40087(即,seqidno:1或seqidno:11)的loop4_1氨基酸序列。在某些实施方案,seqidno:1或seqidno:11的所述loop4_1氨基酸序列具有seqidno:22的氨基酸序列。在某些实施方案,所述udp-糖基转移酶在分别对应于seqidno:1或seqidno:11的所述loop4_1位置的所述udp-糖基转移酶的位置处还包含变体loop4_1氨基酸序列。所述变体loop4_1氨基酸序列是指与seqidno:1或seqidno:11的所述参考loop4_1氨基酸序列不同的氨基酸序列,但允许包含所述变体loop4_1氨基酸的所述udp-糖基转移酶保留其将reba转化为rebd和/或将甜菊苷转化为rebe的活性。在某些实施方案,所述udp-糖基转移酶在分别对应于seqidno:1或seqidno:11的所述loop4_2位置的所述udp-糖基转移酶的位置处还包含ugt40087(即,seqidno:1或seqidno:11)的loop4_2氨基酸序列。seqidno:1或seqidno:11的所述loop4_2氨基酸序列具有seqidno:23的氨基酸序列。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的n-末端糖受体结构域的氨基酸序列具有至少84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列,或包含编码其udp-糖基转移酶的异源性核酸,和进一步包含以下的任何组合:(a)位于分别对应于seqidno:1或seqidno:11的所述loop1位置的所述udp-糖基转移酶的位置处的seqidno:1或seqidno:11的所述loop1氨基酸序列、seqidno:28的序列、或变体loop1氨基酸序列;(b)位于分别对应于seqidno:1或seqidno:11的所述loop2位置的所述udp-糖基转移酶的位置处的seqidno:1或seqidno:11的所述loop2氨基酸序列、或变体loop2氨基酸序列;(c)位于分别对应于seqidno:1或seqidno:11的所述loop3_1位置的所述udp-糖基转移酶的位置处的seqidno:1或seqidno:11的所述loop3_1氨基酸序列、或变体loop3_1氨基酸序列;(d)位于分别对应于seqidno:1或seqidno:11的所述loop3_2位置的所述udp-糖基转移酶的位置处的seqidno:1或seqidno:11的所述loop3_2氨基酸序列、或变体loop3_2氨基酸序列;(e)位于分别对应于seqidno:1或seqidno:11的所述loop4_1位置的所述udp-糖基转移酶的位置处的seqidno:1或seqidno:11的所述loop4_1氨基酸序列、或变体loop4_1氨基酸序列;和(f)位于分别对应于seqidno:1或seqidno:11的所述loop4_2位置的所述udp-糖基转移酶的位置处的seqidno:1或seqidno:11的所述loop4_2氨基酸序列。在某些实施方案,当比较和分析能够将reba转化为rebd的udp-糖基转移酶的三维模型结构时,发现ugt40087的loop4_1,当掺入另一udp-糖基转移酶的相应loop4_1位置(和置换其天然loop4_1氨基酸序列)时,导致变体udp-糖基转移酶在其将reba转化为rebd的能力方面具有优异活性。参见实施例12。所述这些结果表明,任何合适的udp-糖基转移酶的所述loop4_1氨基酸序列可用seqidno:1或seqidno:11的所述loop4_1氨基酸序列置换,从而将reba转化为rebd。因此,在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的所述n-末端糖受体结构域的所述氨基酸序列具有至少61%、65%、70%、75%、80%、85%、90%、或95%同一性的氨基酸序列,和进一步包含ugt40087(即,seqidno:1或seqidno:11)的所述loop4_1氨基酸序列(即,seqidno:22)。在某些实施方案,本发明提供了包含编码udp-糖基转移酶的异源性核酸的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的所述n-末端糖受体结构域的所述氨基酸序列具有至少61%、65%、70%、75%、80%、85%、90%、或95%同一性的氨基酸序列,和进一步包含seqidno:1或seqidno:11的所述loop4_1氨基酸序列(即,seqidno:22)。在某些实施方案中,包含与seqidno:1或seqidno:11具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、或95%同一性的氨基酸序列的任何合适的udp-糖基转移酶可用于将来自seqidno:1或seqidno:11的所述loop4_1氨基酸序列整合到其相应的loop4_1位置(置换其天然loop4_1氨基酸序列)。譬如,ob_ugt91b_like、hv_ugt_v1、sl_ugt_101249881、sr.ugt_g252778、os_ugt_91c1、bd_ugt10840、bd_ugt10850、或si91dlike可用作碱基以将来自seqidno:1或seqidno:11的所述loop4_1氨基酸序列整合在其相应的loop4_1位置。在某些实施方案,所述udp-糖基转移酶包含seqidno:25的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的c-末端糖供体结构域的氨基酸序列基本上相同的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少60%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少65%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少70%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少75%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少85%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少90%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少95%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少96%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少97%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少98%同一性的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少99%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码ugt40087的核酸的宿主细胞,所述ugt40087包含seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列基本上相同的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少60%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少65%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少70%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少75%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少80%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少85%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少90%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少95%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少96%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少97%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少98%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码多肽的核酸的宿主细胞,所述多肽包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的氨基酸序列具有至少99%同一性的氨基酸序列。在某些实施方案,重组所述n-末端糖受体结构域和所述c-末端糖供体结构域以改变底物特异性或催化活性。具体如实施例11中所述,确定当来自能够将reba转化为rebd的另一udp-糖基转移酶的糖供体结构域与seqidno:1或seqidno:11的所述糖受体结构域进行重组时,所述嵌合udp-糖基转移酶均保留了其将reba转化为rebd的能力。因此,在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少60%、65%、70%、75%、80%、85%、90%、或95%同一性的氨基酸序列。在某些实施方案,本发明提供了包含编码udp-糖基转移酶的异源性核酸的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的所述c-末端糖供体结构域的所述氨基酸序列具有至少60%、65%、70%、75%、80%、85%、90%、或95%同一性的氨基酸序列。如实施例11中所示,所述c-末端糖供体结构域可与其他udp-糖基转移酶进行相对交换,所述其他udp-糖基转移酶包含至少50%、55%、60%、65%、70%、75%、80%、85%、90%、或95%序列同一性。在某些实施方案,所述udp-糖基转移酶还包含来自其他udp-糖基转移酶的c-末端糖供体结构域。具有合适的c-末端糖供体结构域的其他udp-糖基转移酶的实例包括ob_ugt91b_like、hv_ugt_v1、si_ugt_101249881、sr.ugt_g252778、os_ugt_91c1、bd_ugt10840、bd_ugt10850、或si91dlike。在某些实施方案,发现所述n-末端糖受体结构域中的某些氨基酸残基可将非功能性、推定的udp-糖基转移酶的催化活性恢复为活性udp-糖基转移酶。因此,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含与seqidno:1或seqidno:11的所述n-末端糖受体结构域的所述氨基酸序列具有至少60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性的氨基酸序列,和进一步包含一个或多个以下氨基酸残基:(a)缬氨酸,所述缬氨酸位于对应于seqidno:11的氨基酸位置11的所述udp-糖基转移酶的氨基酸位置处;(b)异亮氨酸,所述异亮氨酸位于对应于seqidno:11的氨基酸位置12的所述udp-糖基转移酶的氨基酸位置处;(c)脯氨酸,所述脯氨酸位于对应于seqidno:11的氨基酸位置55的所述udp-糖基转移酶的氨基酸位置处;(d)谷氨酸,所述谷氨酸位于对应于seqidno:11的氨基酸位置90的所述udp-糖基转移酶的氨基酸位置处;(e)丝氨酸,所述丝氨酸位于对应于seqidno:11的氨基酸位置203的所述udp-糖基转移酶的氨基酸位置处;(f)谷氨酸,所述谷氨酸位于对应于seqidno:11的氨基酸位置223的所述udp-糖基转移酶的氨基酸位置处;或(g)缬氨酸,所述缬氨酸位于对应于seqidno:11的氨基酸位置413的所述udp-糖基转移酶的氨基酸位置处,其中,对应于seqidno:11的所述氨基酸位置的所述udp-糖基转移酶的所述氨基酸位置均通过序列比对进行确定。在某些实施方案,本发明提供了包含udp-糖基转移酶的宿主细胞,所述udp-糖基转移酶包含seqidno:24的氨基酸序列。在某些实施方案,所述宿主细胞包含上述ugt40087多肽的变体。在某些实施方案,相对于所述ugt40087多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2、或1个氨基酸置换。在某些实施方案,相对于所述ugt40087多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2、或1个保守氨基酸置换。在某些实施方案,可针对所述宿主细胞优化本发明所述的任何核酸,例如进行密码子优化。在本发明所述的实施方案中,任何合适的方法可用于确定两种多肽的相应氨基酸位置或相应环路(loop)位置。在某些实施方案,udp-糖基转移酶和参考序列seqidno:11的所述序列均可采用clustalomega(序列比对ω)使用其默认参数进行比对。在其他实施方案,udp-糖基转移酶和参考序列seqidno:11的所述序列均可采用结构比对进行比对,例如swiss-model,其是蛋白质结构同源性建模服务器,可通过expasy网络服务器或deepview(swisspdb-viewer)程序访问。虽然seqidno:11称为用于确定udp-糖基转移酶的相应氨基酸位置或环路(loop)位置的参考序列,但在某些实施方案,seqidno:1也可用作序列比对的参考序列。在某些实施方案,reba如图1a中所示。在某些实施方案,ugt40087或变体ugt40087能够催化形成β连接键的糖残基与reba的19-o-葡萄糖的c-2'位置反应以生成rebd,如图1a所示。在某些实施方案,所述ugt40087或变体ugt40087能够催化β形成中的己糖残基与reba的19-o-葡萄糖的c-2'的反应。在某些实施方案,所述ugt40087能够催化β形成中的葡萄糖残基与reba的19-o-葡萄糖的c-2'的反应。在某些实施方案,rebe如图2b中所示。在某些实施方案,ugt40087或变体ugt40087能够催化形成β连接键的糖残基与甜菊苷的19-o-葡萄糖的c-2'位置反应以生成rebe,如图2b所示。在某些实施方案,所述ugt40087或变体ugt40087能够催化β形成中的己糖残基与甜菊苷的19-o-葡萄糖的c-2'的反应。在某些实施方案,所述ugt40087或变体ugt40087能够催化β形成中的葡萄糖残基与甜菊苷的19-o-葡萄糖的c-2'的反应。在某些实施方案,ugt40087或变体ugt40087不催化以可检测水平将第二糖基团部分添加至甜菊单糖苷(即,13-o-甜菊糖苷)的反应。在某些实施方案,所述ugt40087或变体ugt40087不催化以可检测水平将第二糖基团部分添加至甜茶苷(即,19-o-甜菊糖苷)的反应。在某些实施方案,rebd如图1a中所示。在某些实施方案,所述宿主细胞还包含能够将reba转化为rebd的一种或多种酶。在某些实施方案,所述宿主细胞包含ugt40087和/或变体ugt40087,用于将reba转化为rebd。在某些实施方案,ugt76g1能够催化糖残基的反应以将rebd转化为rebm,如图1a中所示。在某些实施方案,所述宿主细胞还包含能够将rebd转化为rebm的一种或多种酶。在某些实施方案,所述宿主细胞还包含能够将rebd转化为rebm的ugt76g1。在某些实施方案,rebm2如图1b中所示。rebm2是rebm的异构体,具有单个错误的葡萄糖连接键,如图1b所示。rebm2在19碳位置(cooh)具有glcβ(1-2)[glcβ(1-6)]glcβ1-,而非rebm所需的glcβ(1-2)[glcβ(1-3)]glcβ1-。本领域技术人员将认识到,在某些应用中,rebm2可能是不需要的副产物。有利的是,在某些实施方案,本发明提供的ugt40087(或变体ugt40087)和宿主细胞均能够生成很少或不生成rebm2。rebm2的量可以表示为rebm与rebm2的比例。在某些实施方案,rebm与rebm2之比为至少2:1。在某些实施方案,rebm与rebm2之比为至少3:1。在某些实施方案,rebm与rebm2之比为至少4:1。在某些实施方案,rebm与rebm2之比为至少5:1。在某些实施方案,rebm与rebm2之比为至少10:1。在某些实施方案,rebm与rebm2之比为至少100:1。在某些实施方案,rebm与rebm2之比为至少1000:1。在某些实施方案,rebm与rebm2之比为至少10000:1。在某些实施方案,本发明提供的ugt40087(或变体ugt40087)和宿主细胞均生成不可检测水平的rebm2。虽然所述宿主细胞的ugt40087或任何变体ugt40087接受reba作为底物,但reba的来源可以是本领域技术人员认为合适的任何来源。在某些实施方案,可使ugt40087或任何变体ugt40087与reba接触。在某些实施方案,所述宿主细胞可以与reba接触。在某些实施方案,所述ugt40087或ugt40087的任何变体可与包含一种或多种甜菊糖苷的组合物接触。在某些实施方案,所述组合物包含reba。在某些实施方案,所述组合物包含甜菊苷。在某些实施方案,所述组合物衍生自从甜叶菊(steviarebaudiana)叶中分离的天然产物。在某些实施方案,所述组合物是微生物衍生的。在某些实施方案,所述宿主细胞可与包含一种或多种甜菊糖苷的组合物接触。在某些实施方案,可筛选适于催化所需反应的任何变体ugt40087用于本领域已知的任何合适方法。譬如,合适的变体ugt40087可通过表达编码变体ugt40087的异源性核酸并筛选细胞进行体内测定,所述细胞生成能够在底物的所需位置(例如,甜菊糖苷或其他底物的19-o-葡萄糖的c2'位置)添加糖的功能性变体ugt40087。示例性筛选方法如下文实施例3-7中所述。在另一实施例,可通过使变体ugt40087与诸如reba的底物接触来进行体外筛选合适的变体ugt40087。在此实施例中,测定rebd的存在可用作测试以确定变体ugt40087是否是合适的酶。可通过lc-ms或本领域的其他已知方法(参见,例如wo2013/022989)来分析所述反应。在某些实施方案,如果变体ugt40087能够在体内以大于30%、40%、50%、60%、70%、80%、90%、95%、96%、或97%的效率将reba转化为rebd,则认为变体ugt40087适于将reba转化为rebd(或通过糖基化将任何合适的底物转化为其产物)。在一些实施方案,本申请中发现的其他合适的udp-糖基转移酶可作为ugt40087的补充或替代进行使用。所述这些包括,例如,udp-糖基转移酶sr.ugt_9252778、bd_ugt10840、hv_ugt_v1、bd_ugt10850和ob_ugt91b1_like。在某些实施方案,udp-糖基转移酶sr.ugt_9252778包含seqidno:2。在某些实施方案,udp-糖基转移酶bd_ugt10840包含seqidno:3。在某些实施方案,udp-糖基转移酶hv_ugt_v1包含seqidno:4。在某些实施方案,udp-糖基转移酶bd_ugt10850包含seqidno:5。在某些实施方案,udp-糖基转移酶ob_ugt91b1_like包含seqidno:6。涉及与本发明所述的ugt40087相关的组合物和方法的任何讨论也可适用于所述这些其他udp-糖基转移酶。譬如,在一些实施方案,所述宿主细胞包含尿苷二磷酸糖基转移酶sr.ugt_9252778、bd_ugt10840、hv_ugt_v1、bd_ugt10850、和/或ob_ugt91b1_like的酶活性。在某些实施方案,所述这些酶中的一种或多种能够以大于40%的效率将reba转化为rebd。在某些实施方案,所述这些酶中的一种或多种能够以大于45%的效率将reba转化为rebd。在某些实施方案,所述这些酶中的一种或多种能够以大于50%的效率将reba转化为rebd。在某些实施方案,所述这些酶中的一种或多种能够以大于55%的效率将reba转化为rebd。在某些实施方案,所述这些酶中的一种或多种能够以大于60%的效率将reba转化为rebd。在某些实施方案,所述这些酶中的一种或多种能够以大于65%的效率将reba转化为rebd。在某些实施方案,所述这些酶中的一种或多种能够以大于70%的效率将reba转化为rebd。在某些实施方案,所述这些酶中的一种或多种能够以大于75%的效率将reba转化为rebd。在某些实施方案,所述这些酶中的一种或多种能够以大于80%的效率将reba转化为rebd。在某些实施方案,所述这些酶中的一种或多种能够以大于85%的效率将reba转化为rebd。在某些实施方案,所述这些酶中的一种或多种能够以大于90%的效率将reba转化为rebd。在某些实施方案,所述这些酶中的一种或多种能够以大于95%的效率将reba转化为rebd。在某些实施方案,本发明提供的宿主细胞包含sr.ugt_9252778、bd_ugt10840、hv_ugt_v1、bd_ugt10850、和/或ob_ugt91b1_like中的任一种或多种,所述sr.ugt_9252778、bd_ugt10840、hv_ugt_v1、bd_ugt10850、和/或ob_ugt91b1_like分别包含seqidno:2、seqidno:3、seqidno:4、seqidno:5或seqidno:6的氨基酸序列。在某些实施方案,本发明提供了包含多肽的宿主细胞,所述多肽包含与seqidno:2、seqidno:3、seqidno:4、seqidno:5或seqidno:6的氨基酸序列具有至少60%,至少70%,至少75%,至少80%,至少85%,至少90%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%同一性的氨基酸序列。在有利的实施方案中,所述宿主细胞可包含能够制备reba的一种或多种酶途径,所述途径可单独或一起采用。在某些实施方案,所述宿主细胞包含能够将香叶基香叶基焦磷酸转化为reba的一种或多种酶。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。特别有用的酶和核酸均描述于以下部分中,并进一步描述于例如us2014/0329281a1、us2014/0357588a1、us2015/0159188、wo2016/038095a2和us2016/0198748a1中。在进一步的实施方案中,所述宿主细胞还包含能够由碳源制备香叶基香叶基焦磷酸的一种或多种酶。所述这些包括dxp途径的酶类和mev途径的酶类。有用的酶和编码所述酶的核酸均是本领域技术人员已知的。每种途径的示例性酶类描述如下,并进一步描述于例如us2016/0177341a1中。所述mev途径也如图1c中所示。在某些实施方案,所述另外的酶是天然的。在有利的实施方案中,所述另外的酶是异源的。在某些实施方案,两种酶可在一种多肽中进行组合。6.3非天然存在的udp-糖基转移酶多肽和核酸另一方面,本发明提供的是非天然存在的变体udp-糖基转移酶,所述变体udp-糖基转移酶包括与参考序列(例如,seqidno:1)相比的氨基酸残基的修饰,但仍保留udp-糖基转移酶将reba转化为rebd和/或将甜菊苷转化为rebe的活性。在某些实施方案,与参考序列(例如,seqidno:1或seqidno:11)相比,非天然存在的变体udp-糖基转移酶可在某些氨基酸位置或位点包括多达30、25、20、15、10、9、8、7、6、5、4、3、2或1个氨基酸置换、缺失、添加和/或插入。在某些实施方案,非天然存在的变体udp-糖基转移酶包含本发明所述的任何变体udp-糖基转移酶,特别是6.2节中所述的那些。另一方面,本发明提供了非天然存在的变体udp-糖基转移酶,所述变体udp-糖基转移酶包括与参考序列(例如,seqidno:26)相比的核酸残基的修饰,然而,当翻译成蛋白质时,所述蛋白质保持udp-糖基转移酶将reba转化为rebd和/或将甜菊苷转化为rebe的活性。在某些实施方案,非天然存在的变体udp-糖基转移酶可编码本发明所述的任何变体udp-糖基转移酶,特别是6.2节中所述的那些。6.4细胞株本发明提供的宿主细胞有用的组合物和方法包括古细菌细胞、原核细胞或真核细胞。合适的原核宿主包括但不限于,多种革兰氏阳性、革兰氏阴性或革兰氏变种细菌中的任一种。实例包括但不限于,属于以下属的细胞:土壤杆菌属(agrobacterium),脂环酸芽孢杆菌属(alicyclobacillus),鱼腥藻属(anabaena),蓝细菌属(anacystis),节细菌属(arthrobacter),固氮菌属(azobacter),芽孢杆菌属(bacillus),短杆菌属(brevibacterium),着色菌属(chromatium),梭菌属(clostridium),棒状杆菌属(corynebacterium),肠杆菌属(enterobacter),欧文氏菌属(erwinia),埃希氏杆菌属(escherichia),乳酸杆菌属(lactobacillus),乳球菌属(lactococcus),中慢生根瘤菌属(mesorhizobium),甲基杆菌属(methylobacterium),细杆菌属(microbacterium),席藻属(phormidium),假单胞菌属(pseudomonas),红细菌属(rhodobacter),红假单胞菌属(rhodopseudomonas),红螺菌属(rhodospirillum),红球菌属(rhodococcus),沙门氏菌属(salmonella),栅藻属(scenedesmun),沙雷氏菌属(serratia),志贺氏菌属(shigella),葡萄球菌属(staphlococcus),链霉菌属(strepromyces),synnecoccus和发酵单胞菌属(zymomonas)。原核菌株的实例包括但不限于:枯草芽孢杆菌(bacillussubtilis),解淀粉芽孢杆菌(bacillusamyloliquefacines),产氨短杆菌(brevibacteriumammoniagenes),嗜氨短杆菌(brevibacteriumimmariophilum),拜氏梭菌(clostridiumbeigerinckii),阪崎肠杆菌(enterobactersakazakii),大肠杆菌(escherichiacoli),乳酸乳球菌(lactococcuslactis),百脉根根瘤菌(mesorhizobiumloti),绿脓假单胞菌(pseudomonasaeruginosa),迈氏假单胞菌(pseudomonasmevalonii),普迪卡假单胞菌(pseudomonaspudica),荚膜红细菌(rhodobactercapsulatus),类球红细菌(rhodobactersphaeroides),深红红螺菌(rhodospirillumrubrum),肠道沙门氏菌(salmonellaenterica),伤寒沙门氏菌(salmonellatyphi),鼠伤寒沙门氏菌(salmonellatyphimurium),痢疾志贺氏杆菌(shigelladysenteriae),福氏志贺菌(shigellaflexneri),宋内志贺菌(shigellasonne)和金黄色葡萄球菌(staphylococcusaureus)。在特定实施方案中,所述宿主细胞是大肠杆菌(escherichiacoli)细胞。合适的古细菌宿主包括但不限于属于以下属的细胞:气火菌属(aeropyrum),古菌状菌属(archaeglobus),盐杆菌属(halobacterium),产甲烷球菌属(methanococcus),甲烷细菌属(methanobacterium),火球菌属(pyrococcus),硫化叶菌属(sulfolobus),和热原体属(thermoplasma)。古细菌菌株的实例包括但不限于:闪烁古生球菌(archaeoglobusfulgidus),盐杆菌属(halobacteriumsp.),詹氏甲烷球菌(methanococcusjannaschii),嗜热自养甲烷杆菌(methanobacteriumthermoautotrophicum),嗜酸热原体(thermoplasmaacidophilum),火山热原体(thermoplasmavolcanium),嗜热古菌(pyrococcushorikoshii),pyrococcusabyssi,和敏捷气热菌(aeropyrumpernix)。合适的真核宿主包括但不限于真菌细胞、藻类细胞、昆虫细胞和植物细胞。在一些实施方案,可用于本发明方法的酵母包括已经与微生物保藏中心(例如,ifo、atcc等)一起保藏并属于以下属的酵母:芽孢酵母属(aciculoconidium),神食酵母属(ambrosiozyma),节束酵母属(arthroascus),arxiozyma,阿舒囊霉属(ashbya),babjevia,本森顿酵母属(bensingtonia),botryoascus,botryozyma,酒香酵母属(brettanomyces),布勒掷孢酵母属(bullera),布勒担孢酵母属(bulleromyces),念珠菌属(candida),固囊酵母属(citeromyces),棒孢酵母属(clavispora),隐球菌属(cryptococcus),cystofilobasidium,德巴利氏酵母属(debaryomyces),dekkara,dipodascopsis,双足囊菌属(dipodascus),eeniella,endomycopsella,eremascus,假囊酵母属(eremothecium),担孢酵母属(erythrobasidium),fellomyces,filobasidium,耐碱酵母属(galactomyces),地丝菌属(geotrichum),季氏酵母属(guilliermondella),孢汉逊酵母属(hanseniaspora),汉逊酵母属(hansenula),hasegawaea,胶珊瑚属(holtermannia),hormoascus属,生丝毕赤酵母属(hyphopichia),伊萨酵母属(issatchenkia),克勒克酵母属(kloeckera),孢克勒克酵母属(kloeckeraspora),克鲁维酵母属(kluyveromyces),kondoa属,kuraishia属,克氏担孢酵母属(kurtzmanomyces),白冬孢酵母属(leucosporidium),油脂酵母属(lipomyces),娄德酵母属(lodderomyces),马拉色氏霉菌属(malassezia),梅奇酵母属(metschnikowia),木拉克酵母属(mrakia),myxozyma,拿逊酵母属(nadsonia),nakazawaea,针孢酵母属(nematospora),ogataea,卵孢酵母属(oosporidium),管囊酵母属(pachysolen),phachytichospora,巴西仙草(phaffia),毕赤酵母属(pichia),红冬孢酵母属(rhodosporidium),红酵母属(rhodotorula),酵母属(saccharomyces),类酵母属(saccharomycodes),覆膜孢酵母属(saccharomycopsis),saitoella,sakaguchia,saturnospora,裂芽酵母孢子菌属(schizoblastosporion),裂殖酵母属(schizosaccharomyces),许旺酵母属(schwanniomyces),锁掷酵母属(sporidiobolus),掷孢酵母属(sporobolomyces),原孢酵母属(sporopachydermia),冠孢酵母属(stephanoascus),梗孢酵母属(sterigmatomyces),sterigmatosporidium,symbiotaphrina,合轴酵母属(sympodiomyces),sympodiomycopsis,有孢圆酵母属(torulaspora),trichosporiella,毛孢子菌属(trichosporon),三角酵母属(trigonopsis),tsuchiyaea,udeniomyces,waltomyces,威克酵母属(wickerhamia),wickerhamiella,拟威尔酵母属(williopsis),yamadazyma,耶氏酵母属(yarrowia),接合囊酵母属(zygoascus),接合酵母属(zygosaccharomyces),接合拟威尔酵母属(zygowilliopsis),和zygozyma等等。在一些实施方案,所述宿主微生物是酿酒酵母(saccharomycescerevisiae),巴斯德毕赤酵母(pichiapastoris),粟酒裂殖酵母(schizosaccharomycespombe),布鲁赛尔德克酵母(dekkerabruxellensis),乳酸克鲁维酵母(kruyveromyceslactis),马克斯克鲁维酵母(kluveromycesmarxianus),arxulaadeninivorans或多形汉逊酵母(hansenulapolymorpha)(现称为毕赤酵母(pichiaangusta))。在一些实施方案,所述宿主微生物是念珠菌属的菌株,例如解脂假丝酵母(candidalipolytica),吉利蒙假丝酵母(candidaguilliermondii),克鲁斯假丝酵母(candidakrusei),假热带假丝酵母(candidapseudotropicalis)或产朊假丝酵母(candidautilis)的菌株。在特定实施方案中,所述宿主微生物是酿酒酵母(saccharomycescerevisiae)。在一些实施方案,所述宿主是酿酒酵母(saccharomycescerevisiae)的菌株,所述酿酒酵母是选自由贝克氏(baker’s)酵母、cbs7959、cbs7960、cbs7961、cbs7962、cbs7963、cbs7964、iz-1904、ta、bg-1、cr-1、sa-1、m-26、y-904、pe-2、pe-5、vr-1、br-1、br-2、me-2、vr-2、ma-3、ma-4、cat-1、cb-1、nr-1、bt-1、和al-1组成的组。在一些实施方案,所述宿主微生物是酿酒酵母(saccharomycescerevisiae)的菌株,所述酿酒酵母是选自由pe-2、cat-1、vr-1、bg-1、cr-1、和sa-1组成的组。在特定实施方案中,酿酒酵母(saccharomycescerevisiae)的菌株是pe-2。在另一特定实施方案中,酿酒酵母(saccharomycescerevisiae)的菌株是cat-1。在另一特定实施方案中,酿酒酵母(saccharomycescerevisiae)的菌株是bg-1。在一些实施方案,所述宿主微生物是适于工业发酵的微生物。在特定实施方案中,所述微生物被调节为在高溶剂浓度、高温、扩大的底物利用、营养限制、由糖和盐引起的渗透应力、酸度、亚硫酸盐和细菌污染、或其组合下存活,所述这些是公认的工业发酵环境的应力条件。6.5甜菊醇和甜菊糖苷生物合成途径在一些实施方案,通过工程化所述细胞以表达编码所述途径的一种或多种酶的多核苷酸和/或多肽,在本发明提供的经遗传修饰的宿主细胞中激活甜菊醇生物合成途径和/或甜菊糖苷生物合成途径。图2a示出了示例性甜菊醇生物合成途径。图2b示出了以甜菊醇作为起始物料转化得到各种甜菊糖苷类化合物的示例性甜菊糖苷生物合成途径。因此,在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源性多核苷酸,所述多肽具有香叶基香叶基焦磷酸合酶(ggpps)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源性多核苷酸,所述多肽具有柯巴基焦磷酸合酶或内根-柯巴基焦磷酸合酶(cdps;也称为内根-柯巴基二磷酸合酶或cps)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源性多核苷酸,所述多肽具有贝壳杉烯合酶(ks;也称为内根-贝壳杉烯合酶)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源性多核苷酸,所述多肽具有贝壳杉烯氧化酶(ko;也称为内根-贝壳杉烯19-氧化酶)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源性多核苷酸,所述多肽具有甜菊醇合酶(也称为内根-异贝壳杉烯酸13-羟化酶或kah)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码多肽的异源性多核苷酸,所述多肽具有细胞色素p450还原酶(cpr)活性。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有ugt74g1活性的多肽的异源性多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有ugt76g1活性的多肽的异源性多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有ugt85c2活性的多肽的异源性多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有ugt91d活性的多肽的异源性多核苷酸。在一些实施方案,本发明提供的经遗传修饰的宿主细胞包含编码具有ugt40087活性的多肽的异源性多核苷酸。在某些实施方案,所述宿主细胞包含变体。在某些实施方案,相对于相关多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个氨基酸置换。在某些实施方案,相对于参考多肽,所述变体可包含多达15、10、9、8、7、6、5、4、3、2或1个保守氨基酸置换。在某些实施方案,可针对所述宿主细胞优化本发明所述的任何核酸,例如进行密码子优化。以下描述了甜菊醇生物合成途径和/或甜菊糖苷生物合成途径的示例性核酸和酶。6.5.1香叶基香叶基焦磷酸合酶(ggpps)香叶基香叶基焦磷酸合酶(ec2.5.1.29)催化法呢基焦磷酸转化为香叶基香叶基二磷酸(也称为香叶基香叶基焦磷酸)。酶的示例性实例包括甜叶菊(steviarebaudiana,登录号abd92926),藤仓赤霉(gibberellafujikuroi,登录号caa75568),小家鼠(musmusculus,登录号aah69913),假微型海链藻(thalassiosirapseudonana,登录号xp_002288339),棒状链霉菌(streptomycesclavuligerus,登录号zp_05004570),嗜酸热硫化叶菌(sulfulobusacidocaldarius,登录号baa43200),聚球藻属(synechococcussp.,登录号abc98596),拟南芥(arabidopsisthaliana,登录号np_195399),和三孢布拉霉(blakesleatrispora,登录号afc92798.1)的那些酶,以及us2014/0329281a1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些ggpps核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些ggpps酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。6.5.2柯巴基焦磷酸合酶(cdps)柯巴基焦磷酸合酶(ec5.5.1.13)催化香叶基香叶基焦磷酸转化为柯巴基焦磷酸。酶的示例性实例包括甜叶菊(steviarebaudiana,登录号aab87091),棒状链霉菌(streptomycesclavuligerus,登录号edy51667),慢生型大豆根瘤菌(bradyrhizobiumjaponicum,登录号aac28895.1),玉米(zeamays,登录号ay562490),拟南芥(arabidopsisthaliana,登录号nm_116512),和稻(oryzasativa,登录号q5mq85.1)的那些酶,以及us2014/0329281a1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些cdps核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些cdps酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。6.5.3贝壳杉烯合酶(ks)贝壳杉烯合酶(ec4.2.3.19)催化柯巴基焦磷酸转化为贝壳杉烯和二磷酸。酶的示例性实例包括慢生型大豆根瘤菌(bradyrhizobiumjaponicum,登录号aac28895.1),暗球腔菌属(phaeosphaeriasp.,登录号o13284),拟南芥(arabidopsisthaliana,登录号q9sak2),和白云杉(piceaglauca,登录号adb55711.1)的那些酶,以及us2014/0329281a1中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些ks核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些ks酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。6.5.4双功能柯巴基焦磷酸合酶(cdps)和贝壳杉烯合酶(ks)还可使用cdps-ks双功能酶(ec5.5.1.13和ec4.2.3.19)。酶的示例性实例包括桃拟茎点霉(phomopsisamygdali,登录号bag30962),小立碗藓(physcomitrellapatens,登录号baf61135),和藤仓赤霉(gibberellafujikuroi,登录号q9uvy5.1)的那些酶,以及us2014/0329281a1、us2014/0357588a1、us2015/0159188和wo2016/038095a2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些cdps-ks核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些cdps-ks酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。6.5.5内根-贝壳杉烯氧化酶(ko)内根-贝壳杉烯氧化酶(ec1.14.13.78;本发明也称为贝壳杉烯氧化酶)催化贝壳杉烯转化为异贝壳杉烯酸。酶的示例性实例包括稻(oryzasativa,登录号q5z5r4),藤仓赤霉(gibberellafujikuroi,登录号o94142),拟南芥(arabidopsisthaliana,登录号q93zb2),甜叶菊(steviarebaudiana,登录号aaq63464.1),和豌豆(pisumsativum,uniprot号q6xaf4)的那些酶,以及us2014/0329281a1、us2014/0357588a1、us2015/0159188和wo2016/038095a2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些ko核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些ko酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。6.5.6甜菊醇合酶(kah)甜菊醇合酶或异贝壳杉烯酸羟化酶(kah,ec1.14.13)催化异贝壳杉烯酸转化为甜菊醇。酶的示例性实例包括甜叶菊(steviarebaudiana,登录号acd93722),甜叶菊(steviarebaudiana,seqidno:10),拟南芥(arabidopsisthaliana,登录号np_197872),葡萄(vitisvinifera,登录号xp_002282091),和紫花苜蓿(medicagotrunculata,登录号abc59076)的那些酶,以及us2014/0329281a1、us2014/0357588a1、us2015/0159188和wo2016/038095a2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些kah核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些kah酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。6.5.7细胞色素p450还原酶(cpr)细胞色素p450还原酶(ec1.6.2.4)能够帮助或促进上述ko和/或kah的活性。酶的示例性实例包括甜叶菊(steviarebaudiana,登录号abb88839),拟南芥(arabidopsisthaliana,登录号np_194183),藤仓赤霉(gibberellafujikuroi,登录号cae09055),青蒿(artemisiaannua,登录号abc47946.1)的那些酶,以及us2014/0329281a1、us2014/0357588a1、us2015/0159188和wo2016/038095a2中示出的那些酶。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些cpr核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些cpr酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。6.5.8udp糖基转移酶74g1(ugt74g1)ugt74g1能够作为尿苷5'-二磷酸葡糖基:甜菊醇19-cooh转移酶起作用和作为尿苷5'-二磷酸葡糖基:甜菊醇-13-o-葡糖苷19-cooh转移酶起作用。如图2b所示,ugt74g1能够将甜菊醇转化为19-糖苷。ugt74g1还能够将甜菊单糖苷转化为甜茶苷。ugt74g1还可将甜菊双糖苷转化为甜菊苷。酶的示例性实例包括甜叶菊(steviarebaudiana)的那些酶(例如,richmanetal.,2005,plantj.41:56-67和us2014/0329281和wo2016/038095a2以及登录号aar06920.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些ugt74g1核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些ugt74g1酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。6.5.9udp糖基转移酶76g1(ugt76g1)ugt76g1能够将葡萄糖基团部分转移至受体分子(即甜菊醇1,2-糖苷)的c-13-o-葡萄糖的c-3'处。因此,ugt76g1能够作为尿苷5'-二磷酸葡萄糖基:甜菊醇13-o-1,2葡萄糖苷c-3'葡萄糖基转移酶起作用和作为尿苷5'-二磷酸葡萄糖基:甜菊醇-19-o-葡萄糖、13-o-1,2双糖苷c-3'葡萄糖基转移酶起作用。如图2a所示,ugt76g1能够将甜菊双糖苷转化为rebb。ugt76g1还能够将甜菊苷转化为reba。ugt76g1还能够将rebd转换为rebm。酶的示例性实例包括甜叶菊(steviarebaudiana)的那些酶(例如,richmanetal.,2005,plantj.41:56-67和us2014/0329281和wo2016/038095a2以及登录号aar06912.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些ugt76g1核酸中的至少一种具有至少80%、85%、90%、或95%序列同一性。在某些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些ugt76g1酶中的至少一种具有至少80%、85%、90%、或95%序列同一性的多肽。6.5.10udp糖基转移酶85c2(ugt85c2)ugt85c2能够作为尿苷5'-二磷酸葡糖基:甜菊醇13-oh转移酶起作用和作为尿苷5'-二磷酸葡糖基:甜菊醇-19-o-葡糖苷13-oh转移酶起作用。因此,如图2b所示,ugt85c2能够将甜菊醇转化为甜菊单糖苷,并还能够将19-糖苷转化为甜茶苷。酶的示例性实例包括甜叶菊(steviarebaudiana)的那些酶(例如richmanetal.,2005,plantj.41:56-67和us2014/0329281a1、wo2016/038095a2以及登录号aar06916.1描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在一些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些ugt85c2核酸中的至少一种具有至少80%、85%、90%或95%序列同一性。在一些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些ugt85c2酶中的至少一种具有至少80%、85%、90%或95%序列同一性的多肽。6.5.11udp-糖基转移酶91d(ugt91d)ugt91d能够作为尿苷5'-二磷酸葡糖基:甜菊醇-13-o-葡糖苷转移酶起作用,将葡萄糖基团部分转移至受体分子(甜菊醇-13-o-葡萄糖苷(甜菊单糖苷))的13-o-葡萄糖的c-2'处,以生成甜菊双糖苷。ugt91d还能够作为尿苷5'-二磷酸葡糖基:甜茶苷转移酶起作用,将葡萄糖基团部分转移至受体分子(即,甜茶苷)的13-o-葡萄糖的c-2'处,以提供甜菊苷,如图2b所示。ugt91d还能够将葡萄糖基团部分转移至reba的19-o-葡萄糖的c-2'位置以生成rebd,如图2b所示。ugt91d也称为ugt91d2、ugt91d2e或ugt91d-like3。ugt91d酶的示例性实例包括甜叶菊(steviarebaudiana)的那些酶(例如,ugt序列的登录号为ace87855.1,以及us2014/0329281a1,wo2016/038095a2和seqidno:7中描述的那些)。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在一些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与这些ugt91d核酸中的至少一种具有至少80%、85%、90%或95%序列同一性。在一些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些ugt91d酶中的至少一种具有至少80%、85%、90%或95%序列同一性的多肽。6.5.12udp-糖基转移酶40087(ugt40087)ugt40087能够将葡萄糖基团部分转移至reba的19-o-葡萄糖的c-2'位置以生成rebd,如图2b中所示。ugt40087还能够将葡萄糖基团部分转移至甜菊苷的19-o-葡萄糖的c-2'位置以生成rebe。ugt40087的示例性实例如上文5.2节中所述。本发明所述的任何ugt40087变体可用于本发明所述的组合物和方法中。编码所述这些酶的核酸可用于本发明提供的细胞和方法。在一些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸与所述ugt40087酶中的至少一种具有至少80%、85%、90%或95%序列同一性。在一些实施方案,本发明提供了使用核酸的细胞和方法,所述核酸编码与这些ugt40087酶中的至少一种具有至少80%、85%、90%或95%序列同一性的多肽。在某些实施方案,本发明提供了编码本发明所述ugt40087变体的核酸。6.6mev途径生成fpp和/或ggpp在一些实施方案中,本发明提供的经遗传修饰的宿主细胞包含mev途径的一种或多种异源性酶,其可用于形成fpp和/或ggpp。在一些实施方案,所述mev途径的一种或多种酶包含使乙酰-coa与丙二酰-coa缩合以形成乙酰乙酰-coa的酶。在一些实施方案,所述mev途径的一种或多种酶包含使两分子乙酰-coa缩合以形成乙酰乙酰-coa的酶。在一些实施方案,所述mev途径的一种或多种酶包含使乙酰乙酰-coa与乙酰-coa缩合以形成hmg-coa的酶。在一些实施方案,所述mev途径的一种或多种酶包含使hmg-coa转化为甲羟戊酸的酶。在一些实施方案,所述mev途径的一种或多种酶包含使甲羟戊酸磷酸化为甲羟戊酸5-磷酸的酶。在一些实施方案,所述mev途径的一种或多种酶包含使甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸的酶。在一些实施方案,所述mev途径的一种或多种酶包含使甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸的酶。在一些实施方案,所述mev途径的一种或多种酶选自乙酰-coa硫解酶,乙酰乙酰-coa合酶,hmg-coa合酶,hmg-coa还原酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶和甲羟戊酸焦磷酸脱羧酶。在一些实施方案,关于能够催化形成乙酰乙酰-coa的所述mev途径的酶,所述经遗传修饰的宿主细胞包含使两分子乙酰-coa缩合以形成乙酰乙酰-coa的酶,例如乙酰-coa硫解酶;或者使乙酰-coa与丙二酰-coa缩合以形成乙酰乙酰-coa的酶,例如乙酰乙酰-coa合酶。在一些实施方案,所述经遗传修饰的宿主细胞包含使两分子乙酰-coa缩合以形成乙酰乙酰-coa的酶,例如乙酰-coa硫解酶;和使乙酰-coa与丙二酰-coa缩合以形成乙酰乙酰-coa的酶,例如乙酰乙酰-coa合酶。在一些实施方案,所述宿主细胞包含编码所述mev途径的一种以上酶的一种或多种异源性核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述mev途径的两种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述宿主细胞包含一种或多种异源性核苷酸序列,所述异源性核苷酸序列编码可将hmg-coa转化为甲羟戊酸的酶和可将甲羟戊酸转化为甲羟戊酸5-磷酸的酶。在一些实施方案,所述宿主细胞包含编码所述mev途径的三种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述mev途径的四种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述mev途径的五种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述mev途径的六种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述mev途径的七种酶的一种或多种异源性核苷酸序列。在一些实施方案,所述宿主细胞包含编码所述mev途径的所有酶的多种异源性核酸。在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源性核酸,所述酶可将异戊烯焦磷酸(ipp)转化为二甲基烯丙基焦磷酸(dmapp)。在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源性核酸,所述酶可使ipp和/或dmapp分子缩合以形成聚异戊二烯基化合物。在一些实施方案,所述经遗传修饰的宿主细胞还包含编码酶的异源性核酸,所述酶可修饰ipp或聚异戊二烯基以形成类异戊二烯化合物,例如法呢烯。6.6.1乙酰-coa转化为乙酰乙酰-coa在一些实施方案,所述经遗传修饰的宿主细胞包含编码酶的异源性核苷酸序列,所述酶可使两分子的乙酰辅酶a缩合以形成乙酰乙酰-coa,例如乙酰-coa硫解酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(nc_000913region:2324131.2325315;大肠杆菌(escherichiacoli)),(d49362;脱氮副球菌(paracoccusdenitrificans))和(l20428;酿酒酵母(saccharomycescerevisiae))。乙酰-coa硫解酶催化两分子乙酰-coa的可逆缩合反应以生成乙酰乙酰-coa,但此反应在热力学上是不利的;乙酰乙酰-coa硫解作用优于乙酰乙酰-coa合成。乙酰乙酰-coa合酶(aacs)(或者称为乙酰-coa:丙二酰-coa酰基转移酶;ec2.3.1.194)使乙酰-coa与丙二酰-coa缩合以形成乙酰乙酰-coa。与乙酰-coa硫解酶相反,由于丙二酰-coa的相关脱羧反应,aacs催化的乙酰乙酰-coa合成基本上是能量有利的反应。此外,aacs对乙酰乙酰-coa未显示出硫解活性,因此所述反应是不可逆的。在包含乙酰-coa硫解酶和异源性ada和/或磷酸转乙酰酶(pta)的宿主细胞中,有利于乙酰乙酰-coa硫解的乙酰-coa硫解酶催化的可逆反应可导致大的乙酰-coa库。鉴于ada的可逆活性,此乙酰-coa库可反过来驱动ada朝向将乙酰-coa转化为乙醛的逆向反应,从而减少了ada对乙酰-coa生成提供的益处。类似地,pta的活性是可逆的,因此,大的乙酰-coa库可驱使pta朝向将乙酰-coa转化为乙酰磷酸的逆向反应。因此,在一些实施方案,为了提供对乙酰-coa的强拉力以驱动ada和pta的正向反应,本发明提供的经遗传修饰的宿主细胞的所述mev途径利用乙酰乙酰-coa合酶使乙酰-coa和丙二酰-coa形成乙酰乙酰-coa。在一些实施方案中,aacs是来自链霉菌属(streptomycessp.)菌株cl190(okamuraetal.,procnatlacadsciusa107(25):11265-70(2010))。链霉菌属(streptomycessp.)菌株cl190的代表性aacs核苷酸序列包括登录号ab540131.1。链霉菌属(streptomycessp.)菌株cl190的代表性aacs蛋白序列包括登录号d7urv0、baj10048。可用于本发明提供的组合物和方法的其他乙酰乙酰-coa合酶包括但不限于,链霉菌属(streptomycessp.)(ab183750;ko-3988bad86806);s.anulatus菌株9663(fn178498;cax48662);链霉菌属ko-3988(ab212624;bae78983);游动放线菌属(actinoplanessp.)a40644(ab113568;bad07381);链霉菌属c(nz_acew010000640;zp_05511702);达松维尔拟诺卡氏菌(nocardiopsisdassonvillei)dsm43111(nz_abui01000023;zp_04335288);溃疡分枝杆菌(mycobacteriumulcerans)agy99(nc_008611;yp_907152);海鱼分枝杆菌(mycobacteriummarinum)m(nc_010612;yp_001851502);链霉菌属mg1(nz_ds570501;zp_05002626);链霉菌属aa4(nz_acev01000037;zp_05478992);玫瑰孢链霉菌(s.roseosporus)nrrl15998(nz_abyb01000295;zp_04696763);链霉菌属acte(nz_adfd01000030;zp_06275834);产绿色链霉菌(s.viridochromogenes)dsm40736(nz_acez01000031;zp_05529691);弗兰克氏菌属(frankiasp.)cci3(nc_007777;yp_480101);巴西诺卡菌(nocardiabrasiliensis)(nc_018681;yp_006812440.1);和chelonae放线菌(austwickiachelonae)(nz_bagz01000005;zp_10950493.1)。其他合适的乙酰乙酰-coa合酶包括美国专利申请公开号2010/0285549和2011/0281315中描述的那些,其内容通过引用其整体并入本文。也可用于本发明提供的组合物和方法的乙酰乙酰-coa合酶包括那些被称为本发明所述的任何乙酰乙酰-coa合酶的“衍生物”的分子。此种“衍生物”具有以下特征:(1)它与本发明所述的任何乙酰乙酰-coa合酶具有基本同源性;(2)能够催化乙酰-coa与丙二酰-coa的不可逆缩合反应以生成乙酰乙酰-coa。如果衍生物的氨基酸序列与乙酰乙酰-coa合酶的氨基酸序列为至少80%、更优选至少90%、最优选至少95%相同,则称乙酰乙酰-coa合酶的衍生物与乙酰乙酰-coa合酶具有“基本同源性”。6.6.2乙酰乙酰-coa转化为hmg-coa在一些实施方案,所述宿主细胞包含编码酶的异源性核苷酸序列,所述酶可使乙酰乙酰-coa与另一分子的乙酰-coa缩合以形成3-羟基-3-甲基戊二酰-coa(hmg-coa),例如hmg-coa合成酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(nc_001145.互补19061.20536;酿酒酵母),(x96617;酿酒酵母),(x83882;拟南芥),(ab037907;griseola北里孢菌(kitasatosporagriseola)),(bt007302;智人(homosapiens)),和(nc_002758,基因座标签为sav2546,geneid(基因id)为1122571;金黄色葡萄球菌(staphylococcusaureus))。6.6.3hmg-coa转化为甲羟戊酸在一些实施方案,所述宿主细胞包含编码酶的异源性核苷酸序列,所述酶可使hmg-coa转化为甲羟戊酸,例如hmg-coa还原酶。在一些实施方案,hmg-coa还原酶是使用nadh的羟甲基戊二酰-coa还原酶-coa还原酶。hmg-coa还原酶(ec1.1.1.34;ec1.1.1.88)催化(s)-hmg-coa还原脱酰为(r)-甲羟戊酸,并可以分为两类,i类和ii类hmg-coa还原酶。i类包括来自真核生物和大多数古细菌的酶,ii类包括某些原核生物和古细菌的hmg-coa还原酶。除了序列的差异外,两类酶在其辅因子特异性方面也不同。与仅使用nadph的i类酶不同,ii类hmg-coa还原酶在区分nadph和nadh的能力方面不同。参见,例如hedletal.,journalofbacteriology186(7):1927-1932(2004)。选择的ii类hmg-coa还原酶的辅因子特异性提供如下。表1.选择的ii类hmg-coa还原酶的辅因子特异性用于本发明提供的组合物和方法的有用的hmg-coa还原酶包括能够利用nadh作为辅因子的hmg-coa还原酶,例如来自迈氏假单胞菌(p.mevalonii),闪烁古生球菌(a.fulgidus)或金黄色葡萄球菌(s.aureus)的hmg-coa还原酶。在特定实施方案中,所述hmg-coa还原酶仅能够利用nadh作为辅因子,例如来自迈氏假单胞菌(p.mevalonii),波美罗伊硅杆菌(s.pomeroyi)或食酸代尔夫特菌(d.acidovorans)的hmg-coa还原酶。在一些实施方案,使用nadh的hmg-coa还原酶来自迈氏假单胞菌(pseudomonasmevalonii)。先前已描述了编码hmg-coa还原酶(ec1.1.1.88)的迈氏假单胞菌(pseudomonasmevalonii)的野生型mvaa基因的序列。参见beachandrodwell,j.bacteriol.171:2994-3001(1989)。代表性的迈氏假单胞菌(pseudomonasmevalonii)的mvaa核苷酸序列包括登录号m24015。代表性的迈氏假单胞菌(pseudomonasmevalonii)的hmg-coa还原酶蛋白序列包括登录号aaa25837、p13702、mvaa_psemv。在一些实施方案,使用nadh的hmg-coa还原酶来自波美罗伊硅杆菌(silicibacterpomeroyi)。代表性的波美罗伊硅杆菌(silicibacterpomeroyi)的hmg-coa还原酶核苷酸序列包括登录号nc_006569.1。波美罗伊硅杆菌(silicibacterpomeroyi)的代表性hmg-coa还原酶蛋白序列包括登录号yp_164994。在一些实施方案,所述使用nadh的hmg-coa还原酶来自食酸代尔夫特菌(delftiaacidovorans)。食酸代尔夫特菌(delftiaacidovorans)的代表性hmg-coa还原酶核苷酸序列包括nc_010002region:互补(319980..321269)。食酸代尔夫特菌(delftiaacidovorans)的代表性hmg-coa还原酶蛋白序列包括登录号yp_001561318。在一些实施方案,所述使用nadh的hmg-coa还原酶来自马铃薯(solanumtuberosum)(craneetal.,j.plantphysiol.159:1301-1307(2002))。在本发明提供的组合物和方法中还可采用的使用nadh的hmg-coa还原酶包括那些被称为任何本发明所述的使用nadh的hmg-coa还原酶的“衍生物”的分子,例如来自迈氏假单胞菌(p.mevalonii),波美罗伊硅杆菌(s.pomeroyi)和食酸代尔夫特菌(d.acidovorans)的使用nadh的hmg-coa还原酶的“衍生物”的分子。此种“衍生物”具有以下特征:(1)它与任何本发明所述的使用nadh的hmg-coa还原酶具有基本同源性;(2)能够催化(s)-hmg-coa还原脱酰为(r)-甲羟戊酸,同时优先使用nadh作为辅因子。如果所述衍生物的氨基酸序列与使用nadh的hmg-coa还原酶的氨基酸序列为至少80%,更优选至少90%,最优选至少95%相同,则使用nadh的hmg-coa还原酶的衍生物与使用nadh的hmad-coa还原酶具有“基本同源性”。本发明使用的短语“使用nadh/nadh-使用的”是指所述使用nadh的hmg-coa还原酶对nadh作为辅因子相对nadph作为辅因子具有选择性,譬如,通过证明对nadh的比活性高于对nadph的比活性。在一些实施方案,对作为辅因子的nadh的选择性表示为kcat(nadh)/kcat(nadph)比值。在一些实施方案,所述使用nadh的hmg-coa还原酶具有至少5、10、15、20、25或大于25的kcat(nadh)/kcat(nadph)比值。在一些实施方案,所述使用nadh的hmg-coa还原酶仅使用nadh。譬如,仅使用nadh的使用nadh的hmg-coa还原酶显示出一些活性,其中nadh作为体外唯一的辅助因子提供,并且当nadph作为唯一辅因子提供时不显示可检测的活性。可利用本领域已知的任何确定辅因子特异性的方法来鉴定优先选择nadh作为辅因子的hmg-coa还原酶,包括kimetal.,proteinscience9:1226-1234(2000);和wildingetal.,j.bacteriol.182(18):5147-52(2000)中描述的那些,其内容均通过引用其整体并入本文。在一些实施方案,所述使用nadh的hmg-coa还原酶被设计为对nadh相较napdh具有选择性,例如,通过辅因子结合口袋的定点诱变来设计。工程化设计nadh选择性的方法记载在watanabeetal.,microbiology153:3044-3054(2007)中,用于确定hmg-coa还原酶的辅因子特异性的方法记载在kimetal.,proteinsci.9:1226-1234(2000)中,其内容均通过引用其整体并入本文。在一些实施方案,所述使用nadh的hmg-coa还原酶衍生自天然包含甲羟戊酸降解途径的宿主物种,例如,使作为其唯一碳源的甲羟戊酸分解代谢的宿主物种。在所述这些实施方案中,所述使用nadh的hmg-coa还原酶,其通常催化在其天然宿主细胞内的内化的(r)-甲羟戊酸氧化酰化为(s)-hmg-coa,用于催化所述逆向反应,即,在包含甲羟戊酸生物合成途径的经遗传修饰的宿主细胞中,使(s)-hmg-coa还原脱酰为(r)-甲羟戊酸。能够在甲羟戊酸作为其唯一碳源上生长的原核生物已记载在:andersonetal.,j.bacteriol,171(12):6468-6472(1989);beachetal.,j.bacteriol.171:2994-3001(1989);benschetal.,j.biol.chem.245:3755-3762;fimongnarietal.,biochemistry4:2086-2090(1965);siddiqietal.,biochem.biophys.res.commun.8:110-113(1962);siddiqietal.,j.bacteriol.93:207-214(1967);和takatsujietal.,biochem.biophys.res.commun.110:187-193(1983)中,其内容均通过引用其全部并入本文。在本发明提供的组合物和方法的一些实施方案中,所述宿主细胞包含使用nadh的hmgr(hmg-coa还原酶)和使用nadph的hmg-coa还原酶。编码使用nadph的hmg-coa还原酶的核苷酸序列的示例性实例包括但不限于:(nm_206548;黑腹果蝇(drosophilamelanogaster)),(nc_002758,基因座标签为sav2545,基因id(geneid)为1122570;金黄色葡萄球菌(staphylococcusaureus)),(ab015627;链霉菌属(streptomycessp.)ko3988),(ax128213,提供编码截短的hmg-coa还原酶的序列;酿酒酵母(saccharomycescerevisiae)),和(nc_001145:互补(115734.118898;酿酒酵母(saccharomycescerevisiae))。6.6.4甲羟戊酸转化为甲羟戊酸-5-磷酸在一些实施方案,所述宿主细胞包含编码酶的异源性核苷酸序列,所述酶可将甲羟戊酸转化为甲羟戊酸5-磷酸,例如甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(l77688;拟南芥(arabidopsisthaliana)),和(x55875;酿酒酵母(saccharomycescerevisiae))。6.6.5甲羟戊酸-5-磷酸转化为甲羟戊酸-5-焦磷酸在一些实施方案,所述宿主细胞包含编码酶的异源性核苷酸序列,所述酶可将甲羟戊酸5-磷酸转化为甲羟戊酸5-焦磷酸,例如磷酸甲羟戊酸激酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(af429385;巴西橡胶树(heveabrasiliensis)),(nm_006556;智人(homosapiens)),和(nc_001145.互补712315.713670;酿酒酵母(saccharomycescerevisiae))。6.6.6甲羟戊酸-5-焦磷酸转化为ipp在一些实施方案,所述宿主细胞包含编码酶的异源性核苷酸序列,所述酶可将甲羟戊酸5-焦磷酸转化为异戊烯焦磷酸(ipp),例如甲羟戊酸焦磷酸脱羧酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(x97557;酿酒酵母(saccharomycescerevisiae)),(af290095;屎肠球菌(enterococcusfaecium)),和(u49260;智人(homosapiens))。6.6.7ipp转化为dmapp在一些实施方案,所述宿主细胞还包含编码酶的异源性核苷酸序列,所述酶可将通过mev途径生成的ipp转化为二甲基烯丙基焦磷酸(dmapp),例如ipp异构酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(nc_000913,3031087.3031635;大肠杆菌(escherichiacoli)),和(af082326;雨生红球藻(haematococcuspluvialis))。6.6.8聚异戊二烯合酶在一些实施方案,所述宿主细胞还包含编码聚异戊二烯合酶的异源性核苷酸序列,所述聚异戊二烯合酶可使ipp和/或dmapp分子缩合以形成含有多于5个碳的聚异戊二烯基化合物。在一些实施方案,所述宿主细胞包含编码酶的异源性核苷酸序列,所述酶可将一分子ipp与一分子dmapp缩合以形成一分子的香叶基焦磷酸(“gpp”),例如gpp合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(af513111;巨冷杉(abiesgrandis)),(af513112;巨冷杉),(af513113;巨冷杉),(ay534686;金鱼草(antirrhinummajus)),(ay534687;金鱼草),(y17376;拟南芥(arabidopsisthaliana)),(ae016877,基因座ap11092;蜡样芽胞杆菌(bacilluscereus);atcc14579),(aj243739;甜橙(citrussinensis)),(ay534745;仙女扇(clarkiabreweri)),(ay953508;齿小蠹(ipspini)),(dq286930;番茄(lycopersiconesculentum)),(af182828;胡椒薄荷(menthaxpiperita)),(af182827;胡椒薄荷),(mpi249453;胡椒薄荷),(pze431697,基因座cad24425;玉米黄质副球菌(paracoccuszeaxanthinifaciens)),(ay866498;胡黄连(picrorhizakurrooa)),(ay351862;葡萄(vitisvinifera)),和(af203881,基因座aaf12843;运动发酵单胞菌(zymomonasmobilis))。在一些实施方案,所述宿主细胞包含编码酶的异源性核苷酸序列,所述酶可将两分子ipp与一分子dmapp缩合,或者将ipp分子添加至gpp分子中,以形成法呢基焦磷酸(“fpp”)分子,例如fpp合酶。编码此种酶的核苷酸序列的示例性实例包括但不限于:(atu80605;拟南芥),(athfps2r;拟南芥),(aau36376;青蒿(artemisiaannua)),(af461050;欧洲普通牛(bostaurus)),(d00694;大肠杆菌k-12),(ae009951,基因座aal95523;具核梭杆菌聚核亚种(fusobacteriumnucleatumsubsp.nucleatum)atcc25586),(gffppsgen;藤仓赤霉(gibberellafujikuroi)),(cp000009,基因座aaw60034;氧化葡萄糖杆菌(gluconobacteroxydans)621h),(af019892;向日葵(helianthusannuus)),(humfaps;智人(homosapiens)),(klpfpsqcr;乳酸克鲁维酵母(kluyveromyceslactis)),(lau15777;白羽扇豆(lupinusalbus)),(lau20771;白羽扇豆),(af309508;小鼠(musmusculus)),(ncfppsgen;粗糙脉孢菌(neurosporacrassa)),(pafps1;灰白银胶菊(partheniumargentatum)),(pafps2;灰白银胶菊),(ratfaps;褐家鼠(rattusnorvegicus)),(yscfpp;酿酒酵母),(d89104;粟酒裂殖酵母(schizosaccharomycespombe)),(cp000003,基因座aat87386;酿脓链球菌(streptococcuspyogenes)),(cp000017,基因座aaz51849;酿脓链球菌),(nc_008022,基因座yp_598856;酿脓链球菌mgas10270),(nc_008023,基因座yp_600845;酿脓链球菌mgas2096),(nc_008024,基因座yp_602832;酿脓链球菌mgas10750),(mzefps;玉米(zeamays)),(ae000657,基因座aac06913;风产液菌(aquifexaeolicus)vf5),(nm_202836;拟南芥),(d84432,基因座baa12575;枯草芽孢杆菌(bacillussubtilis)),(u12678,基因座aac28894;慢生型大豆根瘤菌(bradyrhizobiumjaponicum)usda110),(bacfdps;嗜热脂肪土芽孢杆菌(geobacillusstearothermophilus)),(nc_002940,基因座np_873754;杜克雷嗜血杆菌(haemophilusducreyi)35000hp),(l42023,基因座aac23087;流感嗜血杆菌(haemophilusinfluenzae)rdkw20),(j05262;智人(homosapiens)),(yp_395294;沙克乳酸杆菌沙克亚种(lactobacillussakeisubsp.sakei)23k),(nc_005823,基因座yp_000273;copenhagenistr.fiocruz钩端螺旋体血清变型(leptospirainterrogansserovarcopenhagenistr.fiocruz)l1-130),(ab003187;藤黄微球菌(micrococcusluteus)),(nc_002946,基因座yp_208768;淋病奈瑟氏菌(neisseriagonorrhoeae)fa1090),(u00090,基因座aab91752;根瘤菌属(rhizobiumsp.)ngr234),(j05091;酿酒酵母),(cp000031,基因座aav93568;silicibacterpomeroyidss-3),(ae008481,基因座aak99890;肺炎链球菌(streptococcuspneumoniae)r6),和(nc_004556,基因座np779706;木质部难养菌特曼库拉1(xylellafastidiosatemecula1)。在一些实施方案,所述宿主细胞还包含编码酶的异源性核苷酸序列,所述酶将ipp和dmapp或ipp和fpp进行组合以形成香叶基香叶基焦磷酸(“ggpp”)。编码此种酶的核苷酸序列的示例性实例包括但不限于:(athgerpyrs;拟南芥),(bt005328;拟南芥),(nm_119845;拟南芥),(nz_aajm01000380,基因座zp_00743052;苏云金芽孢杆菌血清变型(bacillusthuringiensisserovarisraelensis),atcc35646sq1563),(crggpps;长春花(catharanthusroseus)),(nz_aabf02000074,基因座zp_00144509;具核梭杆菌文森特亚种(fusobacteriumnucleatumsubsp.vincentii),atcc49256),(gfggppsgn;藤仓赤霉(gibberellafujikuroi)),(ay371321;银杏(ginkgobiloba)),(ab055496;巴西橡胶树(heveabrasiliensis)),(ab017971;智人(homosapiens)),(mci276129;卢西坦毛霉(mucorcircinelloidesf.lusitanicus)),(ab016044;小鼠(musmusculus)),(aabx01000298,基因座ncu01427;粗糙脉孢菌(neurosporacrassa)),(ncu20940;粗糙脉孢菌),(nz_aakl01000008,基因座zp_00943566;青枯雷尔氏菌(ralstoniasolanacearum)uw551),(ab118238;褐家鼠(rattusnorvegicus)),(scu31632;酿酒酵母),(ab016095;细长聚球藻(synechococcuselongates)),(saggps;白芥子(sinapisalba)),(ssogds;嗜酸热硫化叶菌(sulfolobusacidocaldarius)),(nc_007759,基因座yp_461832;aciditrophicus互养菌(syntrophusaciditrophicus)sb),(nc_006840,基因座yp_204095;费氏弧菌(vibriofischeri)es114),(nm_112315;拟南芥),(erwcrte;成团泛菌(pantoeaagglomerans)),(d90087,基因座baa14124;菠萝泛菌(pantoeaananatis)),(x52291,基因座caa36538;荚膜红细菌(rhodobactercapsulatus)),(af195122,基因座aaf24294;类球红细菌(rhodobactersphaeroides)),和(nc_004350,基因座np_721015;变异链球菌(streptococcusmutans)ua159)。虽然上文描述了甲羟戊酸途径的酶的实例,但在某些实施方案,所述dxp途径的酶在本发明所述的宿主细胞、组合物和方法中可用作生成dmapp和ipp的替代途径或另外的途径。酶以及编码所述dxp途径的酶的核酸是本领域公知的以及在现有技术wo2012/135591a2表征的那些。6.7生成甜菊糖苷类化合物的方法另一方面,本发明提供了通过使用任何本发明所述的udp-糖基转移酶(例如,ugt40087或任何变体ugt40087)将一种甜菊糖苷转化为另一种甜菊糖苷来生成甜菊糖苷的方法。在某些实施方案,本发明提供了生成rebd的方法,其包括使用任何本发明所述的udp-糖基转移酶将reba转化为rebd,所述udp-糖基转移酶能够将reba转化为rebd。在某些实施方案,本发明提供了生成rebm的方法,其包括:使用任何本发明所述的udp-糖基转移酶将reba转化为rebd,所述udp-糖基转移酶能够将reba转化为rebd;使用能够将rebd转化为rebm的udp-糖基转移酶将rebd转化为rebm。在某些实施方案,甜菊糖苷(例如,reba或rebd)或包含甜菊糖苷的组合物可在合适的条件下与任何本发明所述的udp-糖基转移酶以及udp-糖接触以生成所需的甜菊糖苷(例如,rebm)。此类方法可在体内或体外进行。示例性的udp-糖包括udp-葡萄糖、udp-木糖或udp-鼠李糖。另一方面,本发明提供了生成甜菊糖苷的方法,所述方法包括以下步骤:(a)培养任何本发明所述的经遗传修饰的宿主细胞群,所述宿主细胞能够在适于制备所述甜菊糖苷化合物的条件下在含有碳源的培养基中生成甜菊糖苷;(b)从所述培养基中回收所述甜菊糖苷化合物。在一些实施方案,与不包含一种或多种修饰的亲本细胞相比,或者与仅包含所述经遗传修饰的宿主细胞的一种或多种修饰的子集,但在遗传上是相同的亲本细胞相比,所述经遗传修饰的宿主细胞生成增加量的甜菊糖苷。在一些实施方案,所述增加的量为至少1%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、100%、或大于100%,例如,以产量、生成量、生产率计,或以克/升细胞培养物,毫克/克干细胞重量计,或者基于每单位体积的细胞培养物,基于每单位干细胞重量,基于每单位时间的每单位体积的细胞培养物,或基于每单位时间的每单位干细胞重量计。在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约10克/升发酵培养基。在一些此类实施方案中,所述甜菊糖苷以从约10至约50克/升细胞培养物,超过约15克/升细胞培养物,超过约20克/升细胞培养物,超过约25克/升细胞培养物,超过约30克/升细胞培养物,超过约35克/升细胞培养物,超过约40克/升细胞培养物,超过约45克/升细胞培养物,或超过约50克/升细胞培养物的量生成。在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其大于约50毫克每克干细胞重量。在一些实施方案,所述甜菊糖苷以从约50至约1500毫克,超过约100毫克,超过约150毫克,超过约200毫克,超过约250毫克,超过约500毫克,超过约750毫克,或超过约1000毫克每克干细胞重量的量生成。在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位体积细胞培养物。在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位干细胞重量。在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位时间的每单位体积细胞培养物。在一些实施方案,所述宿主细胞生成升高水平的甜菊糖苷,其比由亲本细胞生成的甜菊糖苷水平高至少约10%,至少约15%,至少约20%,至少约25%,至少约30%,至少约35%,至少约40%,至少约45%,至少约50%,至少约60%,至少约70%,至少约80%,至少约90%,至少约2倍,至少约2.5倍,至少约5倍,至少约10倍,至少约20倍,至少约30倍,至少约40倍,至少约50倍,至少约75倍,至少约100倍,至少约200倍,至少约300倍,至少约400倍,至少约500倍,或至少约1000倍或更多,基于每单位时间的每单位干细胞重量。在大多实施方案中,所述宿主细胞生成的升高水平的甜菊糖苷是由抑制化合物进行控制。在所述抑制化合物存在下,可容易地操作此种宿主细胞。然后除去所述抑制化合物以诱导所述宿主细胞生成升高水平的甜菊糖苷。在其他实施方案,通过改变培养条件,例如改变生长温度、培养基成分等,可诱导所述宿主细胞生成升高水平的甜菊糖苷。6.8培养基和培养条件用于微生物培养物的维持和生长的物料和方法是微生物学或发酵科学领域的技术人员所熟知的(参见,例如baileyetal.,biochemicalengineeringfundamentals,secondedition,mcgrawhill,newyork,1986)。根据宿主细胞、发酵和过程/方法的特定要求,必须考虑适当的培养基,ph值,温度,以及需氧、微需氧或厌氧条件的要求。本发明提供的生成甜菊糖苷类化合物的方法可在合适的容器(包括但不限于细胞培养板、烧瓶或发酵罐)中在合适的培养基(例如,含或不含泛酸补充)中进行。此外,所述方法可以本领域已知的任何发酵规模进行,以支持微生物产物的工业生产。可使用任何合适的发酵罐,包括搅拌槽发酵罐,气升式发酵罐,气泡发酵罐或其任何组合。在利用酿酒酵母(saccharomycescerevisiae)作为宿主细胞的特定实施方案中,菌株可在发酵罐中生长,详细记载如kosaric,etal,ullmann'sencyclopediaofindustrialchemistry,sixthedition,volume12,pages398-473,wiley-vchverlaggmbh&co.kdaa,weinheim,germany中所述。在一些实施方案,所述培养基是其中能够生成甜菊糖苷的经遗传修饰的微生物可以存活,即保持生长和活力的任何培养基。在一些实施方案,所述培养基是包含可同化的碳源、氮源和磷酸盐源的水性介质。此种培养基还可包括适当的盐类、矿物质类、金属类和其他营养物类。在一些实施方案,将所述碳源和每种必需细胞营养物增量地或连续地添加到发酵培养基中,并将每种所需营养物通过使细胞生长,譬如,根据基于将碳源转化成生物量的细胞的代谢或呼吸功能的预定细胞生长曲线,保持在基本有效同化所需的最低水平。用于培养微生物的合适条件和合适的培养基是本领域熟知的。在一些实施方案,所述合适的培养基补充有一种或多种另外的试剂,例如诱导物(例如,当编码基因产物的一个或多个核苷酸序列受诱导型启动子的控制时),阻遏物(例如,当编码基因产物的一个或多个核苷酸序列受阻抑型启动子的控制时),或选择剂(例如,选择包含所述经遗传修饰的微生物的抗生素)。在一些实施方案,所述碳源是单糖(简单糖)、二糖、多糖、不可发酵的碳源、或其一种或多种组合。合适的单糖的非限制性实例包括葡萄糖、甘露糖、果糖、木糖、核糖、和其组合。合适的二糖的非限制性实例包括蔗糖、乳糖、麦芽糖、半乳糖、海藻糖、纤维二糖、和其组合。合适的多糖的非限制性实例包括淀粉、糖原、纤维素、几丁质、和其组合。合适的不可发酵碳源的非限制性实例包括乙酸盐和甘油。所述培养基中碳源(例如葡萄糖)的浓度应促进细胞生长,但不能高到抑制所用微生物的生长。通常,发酵培养物采用碳源(例如葡萄糖)进行,所述碳源以达到所需生长水平和生物量的水平、但在不可检测水平下(检测限为约<0.1g/l)进行添加。在其他实施方案,所述培养基中碳源(例如葡萄糖)的浓度大于约1g/l,优选大于约2g/l,更优选大于约5g/l。此外,所述培养基中碳源(例如葡萄糖)的浓度通常小于约100g/l,优选小于约50g/l,更优选小于约20g/l。应当注意,对培养组分浓度的提及可以指初始和/或正在进行的组分浓度。在一些情况下,可能需要在培养期间使所述培养基耗尽碳源。可用于合适培养基的可同化氮的来源包括但不限于简单氮源、有机氮源和复合氮源。此类氮源包括无水氨,铵盐类,以及动物、植物和/或微生物来源的物质。合适的氮源包括但不限于,蛋白质水解产物类,微生物生物量水解产物类,蛋白胨,酵母提取物,硫酸铵,尿素和氨基酸类。通常,所述培养基中所述氮源的浓度大于约0.1g/l,优选大于约0.25g/l,更优选大于约1.0g/l。然而,超过一定浓度,向所述培养基中添加氮源对于微生物的生长是不利的。因此,所述培养基中所述氮源的浓度小于约20g/l,优选小于约10g/l,更优选小于约5g/l。此外,在某些情况下,可能需要在培养期间使所述培养基耗尽所述氮源。有效的培养基可含有其他化合物,例如无机盐类、维生素类、痕量金属类、或生长促进剂类。此类其他化合物也可存在于有效培养基中的碳源、氮源或矿物源中,或者可特异性地添加至所述培养基中。所述培养基还可含有合适的磷酸盐源。此类磷酸盐源包括无机和有机磷酸盐源。优选的磷酸盐源包括但不限于磷酸的盐类,例如单或二元磷酸钠和磷酸钾、磷酸铵、和其混合物。通常,所述培养基中磷酸盐的浓度大于约1.0g/l,优选大于约2.0g/l,更优选大于约5.0g/l。然而,超过一定浓度,向所述培养基中添加磷酸盐对于微生物的生长是不利的。因此,所述培养基中所述磷酸盐的浓度通常小于约20g/l,优选小于约15g/l,更优选小于约10g/l。合适的培养基还可包括镁源,优选地以生理学上可接受的盐的形式,例如七水合硫酸镁,尽管可使用浓度为贡献相似量的镁的其他镁源。通常,所述培养基中镁的浓度大于约0.5g/l,优选大于约1.0g/l,更优选大于约2.0g/l。然而,超过一定浓度,向所述培养基中添加镁对于微生物的生长是不利的。因此,所述培养基中镁的浓度通常小于约10g/l,优选小于约5g/l,更优选小于约3g/l。此外,在某些情况下,可能需要在培养期间使所述培养基耗尽镁源。在一些实施方案,所述培养基还可包含生物学上可接受的螯合剂,例如柠二水合檬酸三钠。在此种情况下,所述培养基中螯合剂的浓度大于约0.2g/l,优选大于约0.5g/l,更优选大于约1g/l。然而,超过一定浓度,向所述培养基中添加螯合剂对于微生物的生长是不利的。因此,所述培养基中螯合剂的浓度通常小于约10g/l,优选小于约5g/l,更优选小于约2g/l。所述培养基最初还可包括生物学上可接受的酸或碱以维持所述培养基的所需ph值。生物学上可接受的酸包括但不限于,盐酸、硫酸、硝酸、磷酸、和其混合物。生物学上可接受的碱包括但不限于,氢氧化铵、氢氧化钠、氢氧化钾、和其混合物。在一些实施方案,使用的碱是氢氧化铵。所述培养基还可包括生物学上可接受的钙源,包括但不限于氯化钙。通常,所述培养基中所述钙源(例如氯化钙二水合物)的浓度在约5mg/l至约2000mg/l的范围内,优选在约20mg/l至约1000mg/l的范围内,更优选在约50mg/l至约500mg/l的范围内。所述培养基还可包括氯化钠。通常,所述培养基中氯化钠的浓度在约0.1g/l至约5g/l的范围内,优选在约1g/l至约4g/l的范围内,更优选在约2g/l至约4g/l的范围内。在一些实施方案,所述培养基还可包含痕量金属。此类痕量金属可作为储备溶液添加至所述培养基中,为方便起见,可与其余培养基分开制备。通常,添加至所述培养基中的此痕量金属溶液的量大于约1ml/l,优选大于约5ml/l,更优选大于约10ml/l。然而,超过一定浓度,向所述培养基中添加痕量金属对于微生物的生长是不利的。因此,添加至所述培养基中的此痕量金属溶液的量通常小于约100ml/l,优选小于约50ml/l,更优选小于约30ml/l。应注意的是,除了在储备溶液中添加痕量金属之外,各个组分可单独进行添加,各自在与上述痕量金属溶液范围所规定的组分的量相对应的范围内。所述培养基可包括其他维生素类,例如泛酸、生物素、钙、泛酸盐、肌醇、吡哆醇-hcl和硫胺素-hcl。此类维生素可作为储备溶液添加至所述培养基中,为方便起见,可与其余培养基分开制备。然而,超过一定浓度,向所述培养基中添加维生素类不利于微生物的生长。本发明所述的发酵方法可以常规培养模式进行,所述培养模式包括但不限于分批、补料分批、细胞再循环、连续和半连续。在一些实施方案,所述发酵以补料分批模式进行。在此种情况下,所述培养基中的一些组分在培养期间被耗尽,所述组分包括在发酵的生成阶段期间的泛酸。在一些实施方案,所述培养物可在开始时(例如,生成阶段)补充相对高浓度的此类组分,使得在需要添加之前支持生长和/或甜菊糖苷生成一段时间。所述这些组分的优选范围在整个培养过程中通过添加来维持,所述添加以培养物耗尽的水平进行添加。可通过例如定期对培养基取样并测定浓度来监测所述培养基中组分的水平。或者,一旦开发出标准培养程序,所述添加可在整个培养期间的特定时间对应于已知水平以定时间隔进行。如本领域技术人员将认识到的,随着所述培养基的细胞密度增加,培养期间营养物的消耗速率亦将增加。此外,为了避免将外来微生物引入培养基中,可使用本领域已知的无菌添加方法进行添加。此外,在培养期间可加入少量消泡剂。所述培养基的温度可以是适于经遗传修饰的细胞生长和/或甜菊糖苷生成的任何温度。譬如,在用接种物接种培养基之前,所述培养基可保持在约20℃至约45℃的温度范围内,优选保持在约25℃至约40℃的温度范围内,更优选保持在约28℃至约32℃的温度范围内。可通过向所述培养基中添加酸或碱来控制所述培养基的ph值。在此种情况下,当氨用于控制ph时,其也方便地用作所述培养基中的氮源。优选地,所述ph值保持在约3.0至约8.0,更优选保持在约3.5至约7.0,最优选保持在约4.0至约6.5。在一些实施方案,在培养期间监测所述培养基的碳源浓度,例如葡萄糖浓度。可使用已知技术监测所述培养基的葡萄糖浓度,例如,采用葡萄糖氧化酶试验或高压液相色谱,其可用于监测上清液(例如,所述培养基的无细胞组分)中的葡萄糖浓度。如前所述,所述碳源浓度应保持低于发生细胞生长抑制的水平。虽然此浓度可能因生物体而异,但对于葡萄糖作为碳源,细胞生长抑制发生在葡萄糖浓度大于约60g/l时,并可通过试验容易地确定。因此,当葡萄糖用作碳源时,优选将葡萄糖加入发酵罐中并保持在检测限以下。或者,所述培养基中的葡萄糖浓度维持在约1g/l至约100g/l的范围内,更优选地维持在约2g/l至约50g/l的范围内,更优选地维持在约5g/l至约20g/l的范围内。尽管通过添加例如基本上纯的葡萄糖溶液,可将所述碳源浓度维持在所需水平,但通过添加初始培养基的等分试样来维持的所述培养基的所述碳源浓度是可接受的,并且可能是优选的。使用初始培养基的等分试样是可取的,因为可同时维持所述培养基中的其他营养物(例如氮源和磷酸盐源)的浓度。同样,通过添加痕量金属溶液的等份试样,亦可在所述培养基中维持所述痕量金属浓度。其他合适的发酵培养基和方法记载在例如wo2016/196321中。6.9发酵组合物另一方面,本发明提供了发酵组合物,其包含本发明所述的经遗传修饰的宿主细胞和由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物。所述发酵组合物可进一步包含培养基。在某些实施方案,所述发酵组合物包含经遗传修饰的宿主细胞,和进一步包含reba、rebd和rebm。在某些实施方案,本发明提供的发酵组合物包含rebm,作为由所述经遗传修饰的宿主细胞生成的甜菊糖苷类化合物的主要组分。在某些实施方案,所述发酵组合物包含reba:rebd:rebm比例为至少1:7:50的reba、rebd和rebm。在其他实施方案,所述发酵组合物包含(reba+rebd):rebm比例为至少8:50的(reba+rebd)和rebm。在某些实施方案,所述发酵组合物包含reba:rebd:rebm比例为至少1:7:50至1:100:1000的reba、rebd和rebm。在其他实施方案,所述发酵组合物包含(reba+rebd):rebm比例为至少8:50至101:1000的(reba+rebd)和rebm。在某些实施方案,所述发酵组合物包含reba:rebd:rebm比例为至少1:7:50至1:200:2000的reba、rebd和rebm。在其他实施方案,所述发酵组合物包含(reba+rebd):rebm比例为至少8:50至201:2000的(reba+rebd)和rebm。在某些实施方案,所述reba、rebd和rebm的比例是基于与所述经遗传修饰的宿主细胞和所述培养基相关的这三种甜菊糖苷的总含量。在某些实施方案,所述reba、rebd和rebm的比例是基于所述培养基中这三种甜菊糖苷的总含量。在某些实施方案,所述reba、rebd和rebm的比例是基于与所述经遗传修饰的宿主细胞相关的这三种甜菊糖苷的总含量。在其他实施方案,所述发酵组合物包含经遗传修饰的宿主细胞,和进一步包含reba和rebm。在某些实施方案,所述发酵组合物包含reba和rebm,其reba:rebm之比为至少1:50。在某些实施方案,所述发酵组合物包含reba和rebm,其reba:rebm之比为至少1:50至1:1000。在某些实施方案,所述发酵组合物包含reba和rebm,其reba:rebm之比为至少1:50至1:2000。在某些实施方案,所述reba和rebm的比例是基于与所述经遗传修饰的宿主细胞和所述培养基相关的这两种甜菊糖苷的总含量。在某些实施方案,所述reba和rebm的比例是基于所述培养基中这两种甜菊糖苷的总含量。在某些实施方案,所述reba和rebm的比例是基于与所述经遗传修饰的宿主细胞相关的这两种甜菊糖苷的总含量。在进一步的实施方案,所述发酵组合物包含经遗传修饰的宿主细胞,和进一步包含rebd和rebm。在某些实施方案,所述发酵组合物包含rebd和rebm,其rebd:rebm之比为至少7:50。在某些实施方案,所述发酵组合物包含rebd和rebm,其rebd:rebm之比为至少7:50至7:100。在某些实施方案,所述发酵组合物包含rebd和rebm,其rebd:rebm之比为至少7:50至7:200。在某些实施方案,所述rebd和rebm的比例是基于与所述经遗传修饰的宿主细胞和所述培养基相关的这两种甜菊糖苷的总含量。在某些实施方案,所述rebd和rebm的比例是基于所述培养基中这两种甜菊糖苷的总含量。在某些实施方案,所述rebd和rebm的比例是基于与所述经遗传修饰的宿主细胞相关的这两种甜菊糖苷的总含量。在某些实施方案,本发明提供的发酵组合物包含不可检测水平的rebm2。在某些实施方案,本发明提供的发酵组合物包含不可检测水平的非天然存在的甜菊糖苷类化合物。在某些实施方案,当进行gc色谱法时,本发明提供的发酵组合物在可检测水平下,不在reba峰和rebb峰之间产生“甜菊醇+2葡萄糖”峰。6.10甜菊糖苷类化合物的回收一旦甜菊糖苷由所述宿主细胞生成,便可使用任何合适的分离和纯化方法(包括本领域已知的任何合适的甜菊糖苷分离和纯化方法)将其回收或分离用于后续应用。合适的方法记载在例如美国专利号7,838,044和8,981,081;美国专利申请号14/603,941,14/033,563,14/362,275,14/613,615,14/615,888;pct申请号pct/us12/070562和pct/us14/031129中。所述这些文献的内容均通过引用其整体并入本文。在一些实施方案,通过离心将包含甜菊糖苷的水相从发酵物分离得到。在其他实施方案,包含甜菊糖苷的水相自发地从发酵物中分离得到。在其他实施方案,通过将破乳剂和/或成核剂添加至发酵反应中,将包含甜菊糖苷的水相从发酵物分离得到。破乳剂的示例性实例包括絮凝剂类和凝结剂类。成核剂的示例性实例包括甜菊糖苷本身的液滴和有机溶剂类,例如十二烷、肉豆蔻酸异丙酯和油酸甲酯。在所述这些细胞中生成的甜菊糖苷可存在于培养物上清液中和/或与所述宿主细胞结合。在甜菊糖苷与宿主细胞结合的实施方案中,所述甜菊糖苷的回收可包括透化或裂解所述细胞的方法。或者或同时,可使用回收方法来回收所述培养基中的甜菊糖苷,所述回收方法包括但不限于,色谱法、吸附色谱法、萃取法、溶剂萃取法、膜分离法、电渗析法、反渗透法、蒸馏法、化学衍生化方法和结晶法。在一些实施方案,将甜菊糖苷与可存在于水相中的其他产物进行分离。在一些实施方案,使用吸附法、蒸馏法、气液萃取(汽提)法、液-液萃取(溶剂萃取)法、真空萃取法、蒸发、超滤法和标准色谱技术来实现分离。其他合适的发酵培养基和方法记载在例如美国专利申请公开号2016/0185813,2017/0190728,wo/2017/093895中。其他合适的方法记载在例如美国专利号7,838,044和8,981,081;美国专利申请号14/603,941,14/033,563,14/362,275,14/613,615和14/615,888;pct申请号pct/us12/070562和pct/us14/031129中。所述这些文献的内容均通过引用其整体包括在本文中。在某些实施方案,所述回收的甜菊糖苷类化合物可用于各种终端产品中。譬如,纯化的rebm化合物或包含rebm的组合物可用于任何可消费产品,例如可用于食品类、药品类、膳食补充剂类、或营养补充剂类。在特定实施方案中,包含rebm的消费品是通过在适于制备rebm的条件下在含有碳源的培养基中培养本发明所述的经遗传修饰的宿主细胞群;和从所述培养基中回收所述rebm化合物的方法制备得到。本发明使用的甜味剂组合物是指含有至少一种甜味组分与至少一种其他物质(例如,另一种甜味剂或添加剂)组合的组合物。本发明使用的可甜化组合物是指与人或动物的口腔接触的物质,包括从口腔摄入并随后从口腔排出的物质,以及饮用、食用、吞咽或以其他方式摄取的物质,并且当在通常可接受的范围内使用时,对人类或动物食用是安全的。本发明使用的经甜化的组合物是指含有可甜化组合物和甜味剂或甜味剂组合物的物质。譬如,不含甜味剂组分的饮品是可甜化组合物的一种。可将包含由本发明方法生成的rebm的甜味剂组合物以及赤藓糖醇添加至未经甜化的饮品中,从而提供经甜化的饮品。所述经甜化的饮品是经甜化组合物的一种。合适的甜味剂组合物、经甜化的组合物、和其制备方法记载在例如pct申请pct/us12/070562中,其内容通过引用其整体包括在本文中。在一个实施方案,包含rebm的甜味剂是通过在适于制备rebm的条件下,在含有碳源的培养基中培养本发明所述的经遗传修饰的宿主细胞群;和从所述培养基中回收所述rebm化合物的方法制备得到。在另一实施方案,包含至少一种其他物质和rebm的甜味剂组合物是通过在适于制备rebm的条件下,在含有碳源的培养基中培养本发明所述的经遗传修饰的宿主细胞群;和从所述培养基中回收所述rebm化合物的方法制备得到。在另一实施方案,包含rebm的经甜化的组合物是通过在适于制备rebm的条件下,在含有碳源的培养基中培养本发明所述的经遗传修饰的宿主细胞群;和从所述培养基中回收所述rebm化合物的方法制备得到。一个实施方案包含制备甜味剂组合物的方法,所述方法包括将至少一种其他物质与rebm组合,所述rebm通过在适于制备rebm的条件下,在含有碳源的培养基中培养本发明所述的经遗传修饰的宿主细胞群;和从所述培养基中回收所述rebm化合物的方法制备得到。另一实施方案包含制备经甜化的组合物的方法,所述方法包括将至少一种可甜化组合物与rebm组合,所述rebm通过在适于制备rebm的条件下,在含有碳源的培养基中培养本发明所述的经遗传修饰的宿主细胞群;和从所述培养基中回收所述rebm化合物的方法制备得到。6.11制备经遗传修饰的细胞的方法本发明还提供了用于生成宿主细胞的方法,所述宿主细胞经遗传工程改造以包含一种或多种上述修饰,例如编码ugt40087的一种或多种异源性核酸,和/或生物合成途径酶,例如用于甜菊糖苷化合物的生物合成途径酶。异源性酶在宿主细胞中的表达可通过在所述宿主细胞中引入包含编码所述酶的核苷酸序列的核酸来实现,编码所述酶的所述核苷酸序列受允许在所述宿主细胞中表达的调节元件的控制。在一些实施方案,所述核酸是染色体外质粒。在其他实施方案,所述核酸被整合到所述宿主细胞的染色体中。可通过本领域技术人员已知的任何方法,且不限于这些方法,将编码蛋白的核酸引入所述宿主细胞中(参见,例如hinnenetal.(1978)proc.natl.acad.sci.usa75:1292-3;creggetal.(1985)mol.cell.biol.5:3376-3385;goeddeletal.eds,1990,methodsinenzymology,vol.185,academicpress,inc.,ca;krieger,1990,genetransferandexpression--alaboratorymanual,stocktonpress,ny;sambrooketal.,1989,molecularcloning--alaboratorymanual,coldspringharborlaboratory,ny;和ausubeletal.,eds.,currentedition,currentprotocolsinmolecularbiology,greenepublishingassociatesandwileyinterscience,ny)。示例性技术包括但不限于原生质球法、电穿孔法、peg1000介导的转化、和乙酸锂或氯化锂介导的转化。可通过修饰编码所述酶的基因的转录来改变宿主细胞中酶的活性。其可通过例如修饰编码所述酶的所述核苷酸序列的拷贝数(例如,通过使用包含所述核苷酸序列的更高或更低拷贝数的表达载体,或通过将所述核苷酸序列另外的拷贝引入所述宿主细胞的基因组中,或通过删除或破坏所述宿主细胞基因组中的所述核苷酸序列),通过改变操纵子的多顺反子mrna上的编码序列的顺序或将操纵子分解成各自具有其自身控制元件的单个基因,或通过增加核苷酸序列可操作连接的启动子或操纵子的强度来实现。或者或另外,可通过改变编码酶的mrna的翻译水平来改变宿主细胞中酶的活性。其可通过譬如改变mrna的稳定性,改变核糖体结合位点的序列,改变核糖体结合位点和酶编码序列的起始密码子之间的距离或序列,改变位于酶编码区起始密码子“上游”或邻接5'侧的整个跨顺反子区域,使用发夹和特化序列稳定mrna转录物的3'末端,修改酶的密码子使用,改变用于酶的生物合成的稀有密码子trna的表达,和/或增加酶的稳定性,例如通过其编码序列的突变来实现。宿主细胞中酶的活性可以多种方式改变,包括但不限于,表达在宿主细胞中表现出增加或降低的溶解度的酶的修饰形式;表达酶的改变形式,所述酶缺乏抑制所述酶活性的结构域;表达酶的修饰形式,所述酶具有更高或更低的kcat或更低或更高的km的底物;或表达酶的改变形式,所述酶或多或少受到所述途径中另一分子的反馈或前馈调节的影响。在一些实施方案,用于经遗传修饰的宿主细胞的核酸包含一种或多种选择标记,所述选择标记可用于选择转化的宿主细胞和对所述宿主细胞施加选择性压力以维持外源dna。在一些实施方案,所述选择标记是抗生素抗性标记。抗生素抗性标记的示例性实例包括但不限于,bla、nat1、pat、aur1-c、pdr4、smr1、cat、小鼠dhfr、hph、dsda、kanr、和shble基因产物。来自大肠杆菌的bla基因产物对β-内酰胺抗生素(例如,窄谱头孢菌素类、头孢霉素类、和碳青霉烯类(厄他培南)、头孢孟多和头孢哌酮)具有抗性,以及对除了替莫西林(temocillin)之外的所有抗革兰氏阴性细菌青霉素类具有抗性;来自诺尔斯链霉菌(s.noursei)的nat1基因产物对诺尔丝菌素具有抗性;来自产绿色链霉菌(s.viridochromogenes)tu94的pat基因产物对双丙氨膦(bialophos)具有抗性;来自酿酒酵母的aur1-c基因产物对auerobasidina(aba)具有抗性;pdr4基因产物对浅蓝菌素具有抗性;smr1基因产物对甲嘧磺隆具有抗性;来自tn9转座子的cat基因产物对氯霉素具有抗性;小鼠dhfr基因产物对甲氨蝶呤具有抗性;肺炎克雷伯氏菌(klebsiellapneumonia)的hph基因产物对潮霉素b具有抗性;大肠杆菌的dsda基因产物使细胞在d-丝氨酸作为唯一氮源的平板上生长;tn903转座子的kanr基因对g418具有抗性;和来自印度斯坦异壁链霉菌(streptoalloteichushindustanus)的shble基因产物对zeocin(博来霉素)具有抗性。在一些实施方案,在分离本发明公开的经遗传修饰的宿主细胞后,删除所述抗生素抗性标记。在一些实施方案,所述选择标记拯救所述经遗传修饰的微生物中的营养缺陷型(例如,营养性营养缺陷型)。在此类实施方案中,亲本微生物包含一种或多种基因产物中的功能性破坏,所述一种或多种基因产物在氨基酸或核苷酸生物合成途径中起作用,并且当非功能性使得亲本细胞不能在培养基中生长而不补充一种或多种营养素时。此类基因产物包括但不限于酵母中的his3、leu2、lys1、lys2、met15、trp1、ade2、和ura3基因产物。然后可通过用编码所述破坏的基因产物的功能性拷贝的表达载体或染色体整合构建体来转化亲本细胞,从而拯救营养缺陷型表型,并可基于所述亲本细胞的所述营养缺陷型表型来选择生成的经遗传修饰的宿主细胞。利用ura3、trp1和lys2基因作为选择标记具有显著的优势,因为正选择和负选择均是可能的。通过ura3、trp1和lys2突变的营养缺陷型互补进行正选择,而负选择则基于特异性抑制剂,即5-氟-乳清酸(foa)、5-氟邻氨基苯甲酸、和氨基己二酸(aaa),其分别阻止原养型菌株生长但分别使ura3、trp1和lys2突变体生长。在其他实施方案,所述选择标记拯救可通过已知选择方法鉴定的其他非致死缺陷或表型。本发明描述了可用于本发明公开的方法、组合物和生物体的特定基因和蛋白;然而,人们将认识到这些基因的绝对同一性是不必要的。譬如,可对包含编码多肽或酶的序列的特定基因或多核苷酸进行变化并筛选活性。通常,此类变化包括保守突变和沉默突变。可使用本领域已知的方法筛选此类经修饰或经突变的多核苷酸和多肽以表达功能性酶。由于遗传密码的固有简并性,编码基本上相同或功能等同的多肽的其他多核苷酸也可用于克隆和表达编码这些酶的多核苷酸。如本领域技术人员将理解的,修饰编码序列以增强其在特定宿主中的表达可能是有利的。所述遗传密码是冗余的,具有64个可能的密码子,但大多数生物体通常使用这些密码子的子集。在物种中最常使用的密码子称为最佳密码子,而那些未经常使用的密码子被分类为稀有密码子或低使用密码子。在有时被称为“密码子优化”或“控制物种密码子偏倚”的过程中,密码子可被置换以反映所述宿主的优选密码子使用。可使用密码子使用表容易地确定其他宿主细胞的密码子优化,或者可使用商业上可获得的软件,例如来自integrateddnatechnologies的codonop(www.idtdna.com/codonoptfrom)进行密码子优化。可制备含有特定原核或真核宿主(murrayetal.,1989,nuclacidsres.17:477-508)优选的密码子的优化编码序列,例如,与由非优化序列生成的转录物相比,以提高翻译速率或以生成具有所需特性(例如更长的半衰期)的重组rna转录物。还可修改翻译终止密码子以反映宿主偏好。譬如,酿酒酵母和哺乳动物的典型终止密码子分别是uaa和uga。单子叶植物类的典型终止密码子是uga,而昆虫和大肠杆菌通常使用uaa作为终止密码子(dalphinetal.,1996,nuclacidsres.24:216-8)。本领域技术人员将认识到,由于遗传密码的简并性质,可使用与其核苷酸序列不同的多种dna分子来编码本发明给定的酶。引用编码上述生物合成酶的天然dna序列在本发明中仅用于说明本发明的实施方案,并且本发明包括任何序列的dna分子,所述序列编码本发明方法中所用酶的多肽和蛋白的氨基酸序列。以类似的方式,多肽通常可在其氨基酸序列中耐受一个或多个氨基酸置换、缺失和插入,而不会损失或显著损失所需活性。本发明包括具有与本发明所述特定蛋白不同的氨基酸序列的此类多肽,只要所述经修饰的或变体多肽具有所述参照多肽的酶促合成代谢活性或分解代谢活性即可。此外,由本发明所示的dna序列编码的氨基酸序列仅阐明了本发明的实施方案。此外,可用于本发明提供的组合物和方法的酶的同源物包含在本发明公开内容中。在一些实施方案,当氨基酸序列具有至少约30%、40%、50%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%同一性时,两种蛋白(或所述蛋白的区域)基本上是同源的。为了确定两个氨基酸序列或两个核酸序列的同一性百分比,比对所述序列以达到最佳比较目的(例如,可在第一和第二氨基酸或核酸序列中的一个或两个中引入空位用于最佳比对,并且可忽略非同源序列用于比较目的)。在一个实施方案,为比较目的而比对的参考序列的长度为所述参考序列长度的至少30%,通常至少40%,更通常至少50%,甚至更通常至少60%,甚至更通常至少70%、80%、90%、100%。然后比较相应氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当所述第一序列中的位置被与所述第二序列中的相应位置的相同氨基酸残基或核苷酸占据时,那么所述分子在此位置具有同一性(本发明使用的氨基酸或核酸“同一性”等同于氨基酸或核酸“同源性”)。两个序列之间的同一性百分比是所述序列共有的相同位置的数量的函数,考虑到空位的数量和每个空位的长度,需引入这些空位以实现所述两个序列的最佳比对。当“同源/同源性”用于提及蛋白或肽时,将认识到不相同的残基位置通常因保守氨基酸置换而不同。“保守氨基酸置换”是其中氨基酸残基被具有相似化学性质(例如,电荷或疏水性)的侧链(r基团)的另一氨基酸残基置换的氨基酸置换。通常,保守氨基酸置换不会显著改变蛋白的功能特性。在通过保守置换使两个或更多个氨基酸序列彼此不同的情况下,可以向上调节序列同一性百分比或同源性程度以校正所述置换的保守性质。进行此种调节的方法是本领域技术人员所熟知的(参见,例如pearsonw.r.,1994,methodsinmolbiol25:365-89)。以下六组各自含有彼此保守置换的氨基酸:1)丝氨酸(s),苏氨酸(t);2)天冬氨酸(d),谷氨酸(e);3)天冬酰胺(n),谷氨酰胺(q);4)精氨酸(r),赖氨酸(k);5)异亮氨酸(i),亮氨酸(l),丙氨酸(a),缬氨酸(v);和6)苯丙氨酸(f),酪氨酸(y),色氨酸(w)。通常使用序列分析软件来测定多肽的序列同源性,其也称为序列同一性百分比。用于将分子序列与含有来自不同生物体的大量序列的数据库进行比较的典型算法是计算机程序blast。当搜索含有来自大量不同生物体的序列的数据库时,通常比较氨基酸序列。此外,编码前述酶(或本发明提及的任何其他酶类(或控制或调节其表达的任何调节元件))的任何基因可通过遗传/蛋白质工程技术进行优化,例如本领域普通技术人员已知的定向进化或合理诱变。此种作用使本领域普通技术人员能够优化所述酶在酵母中的表达和活性。此外,编码所述这些酶的基因可从其他真菌和细菌物种中鉴定得到,并且可表达此途径的调节。多种生物体可作为所述这些酶的来源,包括但不限于,酵母属(saccharomycesspp.),包括酿酒酵母(s.cerevisiae)和葡萄汁酵母(s.uvarum);克鲁维酵母菌属(kluyveromycesspp.),包括耐热克鲁维酵母(k.thermotolerans),乳酸克鲁维酵母(k.lactis),和马修斯克鲁维酵母(k.marxianus);毕赤酵母属(pichiaspp.);汉逊酵母属(hansenulaspp.),包括多型汉逊酵母(h.polymorpha);假丝酵母属(candidaspp.);丝孢酵母属(trichosporonspp.);yamadazyma酵母属,包括y.spp.stipitis,球有孢圆酵母(torulasporapretoriensis),东方伊萨酵母(issatchenkiaorientalis);裂殖酵母属(schizosaccharomycesspp.),包括粟酒裂殖酵母(s.pombe);隐球菌属(cryptococcusspp.);曲霉属(aspergillusspp.);脉孢菌属(neurosporaspp.);或黑粉菌属(ustilagospp.)。来自厌氧真菌的基因来源包括但不限于,梨囊鞭菌属(piromycesspp.),根囊鞭菌属(orpinomycesspp.),或新美鞭菌属(neocallimastixspp.)。可用的原核酶的来源包括但不限于,大肠杆菌(escherichiacoli),运动发酵单胞菌(zymomonasmobilis),金黄色葡萄球菌(staphylococcusaureus),芽孢杆菌属(bacillusspp.),梭菌属(clostridiumspp.),棒状杆菌属(corynebacteriumspp.),假单胞菌属(pseudomonasspp.),乳球菌属(lactococcusspp.),肠杆菌属(enterobacterspp.)和沙门氏菌属(salmonellaspp.)。本领域技术人员已知的技术可适于鉴定其他同源基因和同源酶。通常,类似基因和/或类似酶可通过功能分析进行鉴定,并具有功能相似性。本领域技术人员已知的技术可适用于鉴定类似基因和类似酶。譬如,为了鉴定同源或类似的udp糖基转移酶,pta,或任何生物合成途径基因、蛋白或酶,技术可包括但不限于使用基于目的基因/酶的公开序列的引物通过pcr来克隆基因的技术,或通过使用设计用于扩增目的基因中的保守区域的简并引物的简并pcr技术。此外,本领域技术人员可使用技术来鉴定具有功能同源性或相似性的同源或类似的基因、蛋白或酶。技术包括通过用于所述活性的体外酶测定法来检查细胞或细胞培养物的酶的催化活性(例如,如本发明所述或如kiritani,k.,branched-chainaminoacidsmethodsenzymology,1970中所述),然后通过纯化技术来分离具有所述活性的酶,通过诸如埃德曼(edman)降解、设计可能的核酸序列的pcr引物、通过pcr来扩增所述dna序列以及克隆所述核酸序列等技术来确定所述酶的所述蛋白质序列。为了鉴定同源或类似基因和/或同源或类似酶、类似基因和/或类似酶或蛋白,技术还包括将关于候选基因或酶的数据同诸如brenda、kegg或metacyc的数据库进行比较。可根据本发明的教导,在上述数据库中鉴定候选基因或酶。7.实施例实施例1:能够高通量生成法呢基焦磷酸(fpp)和类异戊二烯法呢烯的基础酵母菌株的生成通过在gal1或gal10启动子的控制下表达甲羟戊酸途径的基因(图1c),从野生型酿酒酵母菌株(cen.pk2)产生法呢烯生成菌株。所述菌株包含来自酿酒酵母的以下染色体整合的甲羟戊酸途径基因:乙酰辅酶a硫解酶,hmg-coa合酶,hmg-coa还原酶,甲羟戊酸激酶,磷酸甲羟戊酸激酶,甲羟戊酸焦磷酸脱羧酶,和ipp:dmapp异构酶。本发明所述的所有基因使用公众可获得的算法或其他合适算法进行密码子优化。此外,所述菌株包含来自青蒿(artemisininannua)的法呢烯合酶的六个拷贝,也受gal1或gal10启动子的控制。所述菌株还含有gal80基因的缺失和受gal4oc启动子控制的gal4的另外拷贝,其中酿酒酵母的gal4基因的编码序列受其天然启动子(pgal4oc;参见例如griggs&johnston(1991)pnas88(19):8597-8601)的“有效组成型”形式的调节控制。最后,编码鲨烯合成酶的erg9基因通过用酵母基因met3的启动子置换所述天然启动子而进行下调(westfalletalpnas2012)。实施例2.能够高通量生成reba的基础酵母菌株的生成图2a示出了从fpp至甜菊醇的示例性生物合成途径。图2b示出了从甜菊醇至糖苷rebm的示例性生物合成途径。为了将上述法呢烯基础菌株高通量转化为c-20类异戊二烯的贝壳杉烯,将香叶基香叶基焦磷酸合酶(ggpps)的六个拷贝整合到基因组中,然后将柯巴基焦磷酸合酶和贝壳杉烯合酶各自的四个拷贝整合到基因组中。此时,从所述菌株中除去法呢烯合酶的六个拷贝。一旦证实新菌株生成了内根-贝壳杉烯,则将用于将内根-贝壳杉烯转化为reba的剩余基因插入所述基因组中。表4列出了用于将fpp转化为reba的所有基因和启动子。除了具有两个拷贝的sr.kah酶之外,将贝壳杉烯合酶之后的每个基因与单拷贝整合(表4)。包含表1中所述的所有基因的菌株主要生成reba。酶ugt91d_like3具有某些将reba转化为瑞鲍迪苷d(rebd)的低活性。我们测定了ugt91d_like3的单拷贝能够在上述酵母菌株中在体内将菌株中大约(3%)的reba转化为rebd(图3和表5)。然后,ugt76g1可将rebd转化为最终产品rebm。实施例3.用于筛选将reba转化为rebd的新型udp-糖基转移酶(ugt)酶类的菌株的生成为了制备筛选菌株以在体内快速筛选reba至rebd的转化,将着陆垫插入上述reba菌株中。所述着陆垫由构建体任一端的500bp基因座靶向dna序列组成,位于alg1开放阅读框下游的基因组区域(图4)。在内部,所述着陆垫包含位于核酸内切酶(f-cphi)识别位点侧翼的pgal1启动子和酵母终止子。实施例4.筛选在体内将reba高效转化为rebd的ugt基因从genbank(基因库)得到的一百多种ugt酶经密码子优化以在酿酒酵母中进行最佳表达,并同与上述着陆垫中f-cphi序列侧翼的pgal1和酵母终止子同源的60bp序列进行合成。每个合成的ugt基因采用单拷贝对在上述酵母菌株中在体内将reba转化为rebd的能力进行单独测试。采用ugt供体dna和含有核酸内切酶f-cphi的质粒对酵母进行转化,以切割着陆垫中的dna。通过菌落pcr技术,使用每个转化中特定ugt基因内部的反向引物和alg1orf末端的通用正向引物,来验证整合的正确性。实施例5.酵母转化的方法在优化的乙酸锂(liac)转化过程中,使用标准分子生物学技术将每种dna构建体整合到酿酒酵母(cen.pk2)中。简言之,将细胞在酵母提取物蛋白胨葡萄糖(ypd)培养基中于30℃下振荡(200rpm)培养过夜,在100mlypd中稀释至od600为0.1,并生长至od600为0.6-0.8。对于每次转化,通过离心收获5ml培养物,在5ml无菌水中洗,再次离心,重悬浮于1ml100mmliac中,并转移至微量离心管中。将细胞离心(13,000×g)30秒,除去上清液,将所述细胞重悬浮于由240μl50%peg、36μl1mliac、10μl煮沸的鲑鱼精dna和74μl供体dna组成的转化混合物中。对于需要表达核酸内切酶f-cph1的转化,所述供体dna包括携带在酵母tdh3启动子下表达的所述f-cphi基因的质粒用于表达。这将切割着陆垫中的f-cphi核酸内切酶识别位点,以促进ugt基因的整合。在42℃下热震40分钟后,在ypd培养基中回收细胞过夜,然后在选择性培养基上铺板。通过菌落pcr技术,结合对所述整合特异的引物,来确认dna整合。实施例6.酵母培养条件将经验证含有预期的ugt基因的酵母菌落挑选到含有鸟种培养基(birdseedmedia,bsm,originallydescribedbyvanhoeketal.,biotechnologyandbioengineering68(5),2000,pp.517-523)的96孔微量滴定板中,所述鸟种培养基(birdseedmedia)含有20g/l蔗糖和37.5g/l硫酸铵。将细胞在30℃下在高容量微量滴定板孵化器中进行培养,在1000rpm和80%湿度下振荡3天,直至所述培养物耗尽碳。通过从饱和培养物中取14.4μl并稀释至360μl新鲜培养基中,将生长饱和的培养物传代培养至含有bsm的新鲜平板中,所述bms含有40g/l蔗糖和150g/l硫酸铵。在提取和分析之前,将所述生成培养基中的细胞在30℃下在高容量微量滴定板振荡器中,在1000rpm和80%湿度下再培养3天。培养完成后,将全细胞培养液用360μl100%乙醇稀释,用箔纸进行密封,并以1250rpm振荡30分钟以提取甜菊糖苷类化合物。将490μl50:50的乙醇:水加入到新的1.1ml测定板中,并将10μl培养物/乙醇混合物加入所述测定板中。将所述混合物离心以使任何固体沉淀,将400μl溶液转移至新的1.1ml板中并通过lc-ms进行测定。实施例7.分析方法通过lc-ms质谱仪(abqtrap4000),使用sigmaascentisexpresspeptidees-c18(5cm,2.1mm,2.7um;part#53301-u),采用以下梯度(流动相a:0.1%甲酸的h2o溶液;流动相b:0.1%甲酸的乙腈溶液)来分析样品:表2.时间(min)%b102522.5025310.0060410.50100512.50100612.5125质谱仪在负离子多反应监测模式下进行操作。根据真实标准品以及mrm转换来测定,通过保留时间来确定每种瑞鲍迪苷异构体:表3.来自质谱仪的色谱图的峰面积用于生成校准曲线。相关化合物(即,reba、rebd、rebm)的摩尔比是通过使用真实标准品通过外部校准定量每种化合物的摩尔量,然后取适当的比例来确定。进行nmr分析以证实rebm是由经遗传修饰的菌株生成的。发酵后,从所述发酵液中除去菌株。从剩余的液体培养基中纯化甜菊糖苷类化合物。可使用任何合适的nmr分析方法,包括在例如wo/2017/093895和wo/2016/028899中记载的那些分析方法。实施例8.发现ugt酶具有将reba转化为rebd的高活性发现六种ugt酶具有将reba转化为rebd的高活性(图3)。所述这些酶的性能与文献中记载的两种其他ugt酶os_ugt_91c1(即,wo2013/022989a2中记载的eugt11)和s1_ugt_101249881(即,wo2014/193888a1中记载的ugtsl2)进行基准比较,同时还进行reba向rebd的转化。表5列出了[reb(d+m)的微摩尔量/(a+d+m)的微摩尔量]的中值比值;如上所述在体内对reba、rebd和rebm进行测定。所述比值是reba向rebd转化效率的量度。[reb(a+d+m)]的μm之和测定在细胞中生成的reba总量。[reb(d+m)]的μm之和测定在细胞中生成的rebd总量。图5a-i示出了图3和表2中所有ugt基因的rebe、reba、rebd、rebm和rebm2的色谱图。rebm2是具有单个错误葡萄糖连接键的rebm的异构体。rebm2在19碳位置(cooh)具有glcβ(1-2)[glcβ(1-6)]glcβ1-,而非rebm所需的glcβ(1-2)[glcβ(1-3)]glcβ1-。使用实施例7中所述的nmr方法,通过1d和2dnmr光谱,将由包含ugt40087的菌株生成的样品产物与标准rebm进行比较。在甲醇和吡啶中记录的1d和2dnmr光谱的重叠证实了此两种化合物是相同的。2dnmr数据的详细剖析和与文献中公布的数据的比较证实了此两种样品均是rebm。在0.5或2.0升的发酵容器中,当在不同的菌株背景中表达时,ugt40087生成reba、rebd和rebm,其reba:rebd:rebm之比为约1:7:50。表4.用于将fpp转化为reba的酶的基因、启动子和氨基酸序列酶名称登录号或序列id启动子btrispora.ggppsafc92798.1pgal1内根-cdps_osq5mq85.11pgal1ks_pgadb55711.1pgal1sr.koaaq63464.1pgal1sr.kahseqid:10pgal1aa.cprabc47946.1pgal3ugt85c2aar06916.1pgal1ugt74g1aar06920.1pgal10ugt91d_like3seqidno:7pgal1ugt76g1aar06912.1pgal101去除前65个氨基酸并用蛋氨酸置换表5.不同ugt酶将reba转化为rebd的中值转化率、其蛋白登录号或序列id实施例9.表5中将reba转化为rebd的酶的特异性通过形成β-1,2-连接的糖苷键,通过在reba的19-o-葡萄糖的c-2'位置上添加葡萄糖糖部分,表5中列出的酶能够催化reba向rebd转化。在某些实施方案,期望在异源宿主中通过生物技术生成rebm,从而(1)以高纯度生成rebm,和(2)而不生成任何“非天然”甜菊糖苷类化合物。任何进入市场的产品均可能需要极高的纯度,以确保最佳风味特征,并符合多种人类食品监管标准。除rebm之外的甜菊糖苷类化合物的存在可能会增加下游加工以获得高纯度rebm的成本。如果存在大量非rebm甜菊糖苷类化合物,则可能会影响rebm产品的最终纯度。在某些实施方案,所述异源酶不生成任何“非天然”甜菊糖苷类化合物可能是有利的。“非天然”甜菊糖苷在本发明中定义为已知在植物甜叶菊(steviarebaudiana)中并非天然存在的任何甜菊糖苷。由于上述原因,检查表5中列出的所有酶的杂质谱,以确定它们是否生成图2b中未示出的任何意料之外的或非天然甜菊糖苷类化合物。进一步分析表2中列出的所有酶的较长保留时间的色谱迹线。在所有转化效率高于50%的酶中,唯一没有产生意外产物的酶是ugt40087和os_ugt_91c1(eugt11)。不出所料,ugt91d_like3在色谱图中没有产生意外的峰。在转化效率高于50%的酶中,所述这些酶的色谱迹线产生一个或多个意外的峰,其与非天然存在的糖苷相关。譬如,ob_ugt91b1_like的色谱迹线在reba峰和rebb峰之间产生意外的峰(甜菊醇+2葡萄糖),保留时间为约6.61分钟。ob_ugt91b1_like的意外峰值的强度比reba峰值的强度高至少31倍,参见图9c。来自亲本对照菌株(含有ugt74g1、ugt85c2、ugt76g1和ugt91d_like3)或来自包含ugt40087的菌株的色谱迹线中不存在意外的峰(甜菊醇+2葡萄糖),参见图9b和图9c。在另一个实施例,hv_ugt_v1的色谱迹线在reba峰和rebb峰之间产生意外的峰(甜菊醇+2葡萄糖),保留时间为约6.61分钟。hv_ugt_v1的意外峰值的强度比reba峰值的强度低0.6个因子。在另一个实施例,sl_ugt_101249881的色谱迹线在reba峰和rebb峰之间产生意外的峰(甜菊醇+2葡萄糖),保留时间为约6.67分钟。sl_ugt_101249881的意外峰值的强度比reba峰值的强度高约1.11倍。在另一个实施例,sr.ugt_g252778的色谱迹线在reba峰和rebb峰之间产生意外的峰(甜菊醇+2葡萄糖),保留时间为约6.67分钟。sr.ugt_g252778的意外峰值的强度比reba峰值的强度低约0.96个因子。所述这些酶中的一些还产生其他意外的峰。省略了hv_ugt_v1、sl_ugt_101249881和sr.ugt_g252778的色谱迹线。所述这些结果表明,与这两种酶ugt40087和os_ugt_91c1(eugt11)相比,具有将a转化为d的大于50%转化效率的其他三种酶(即hv_ugtv1、si_ugt_101249881和sr.ugt_g252778)可催化其他反应,可能生成通常不在植物甜叶菊(steviarebaudiana)的rebm制备途径中生成的甜菊糖苷类化合物。表6.ugt酶特异性实施例10.ugt40087酶活性对19-o-葡萄糖甜菊糖苷的c-2'位置的特异性ugt40087催化将第二糖基团部分添加至甜菊苷或reba的19-o-葡萄糖的c-2'位的反应。如图5a和图5i所示,不含ugt40087的亲本对照菌株(如实施例2中所述)能够生成reba,但不生成可检测量的rebe、rebd或rebm。将ugt40087添加至亲本细胞中即可产生可检测量的rebe,表明ugt40087催化将第二葡萄糖基团部分添加至甜菊苷的β-1,2连接键中的19-o-葡萄糖的c-2'位置以制备rebe。此外,rebd和rebm的两个新的峰出现在包含ugt40087的菌株的色谱图中,而与不含ugt40087的亲本菌株相比,reba的峰值显著降低。因此,ugt40087能够催化将第二葡萄糖基团部分添加至瑞鲍迪苷a与瑞鲍迪苷d的β-1,2连接键中的19-o-葡萄糖的c-2'位置。然后,菌株中ugt76g1的存在催化添加最终的葡萄糖以将rebd转化为rebm。为了筛选将糖添加至甜菊单糖苷或甜茶苷的β-1,2连接键中的13-o-葡萄糖的c-2'位置的能力,制备的基础菌株仅含有高通量生成的甜茶苷。除了甜茶苷基础菌株不含酶ugt91d_like3外,所述甜茶苷基础菌株在遗传上与实施例2中所述的reba基础菌株相同。如表7所示,具有ugt74g1、ugt85c2和ugt76g1的甜茶苷基础菌株仅能够制备19-糖苷、甜菊单糖苷和甜茶苷。将ugt40087添加至所述菌株中根本不会改变此特征。如果ugt40087能够将糖添加至甜菊单糖苷或甜茶苷的β-1,2连接键中的13-o-葡萄糖的c-2'位置,那么应该存在可检测量的甜菊双糖苷或甜菊苷中的一种或两种。当用ugt91d_like3转化菌株时,可观察到甜菊双糖苷、甜菊苷以及reba,所述ugt91d_like3能够将糖添加至甜菊单糖苷和甜茶苷的β-1,2连接键中的13-o-葡萄糖的c-2'位置。eugt11(os_ugt_91c1)之前的其他特征在于催化将第二糖基团部分添加至19-o-甜菊糖苷或13-o-甜菊糖苷的c-2'位置。参见wo2013/022989中的图5。如上所述,在可检测水平上,ugt40087似乎不会催化将糖添加至甜菊单糖苷或甜茶苷的β-1,2连接键中的13-o-葡萄糖的c-2'位置。所述这些结果表明ugt40087是udp-糖基转移酶,与eugt11相比,其是功能可区分的并且产生不同的结果。表7.将制备rebm的途径中的所有甜菊糖苷中间体的滴度归一化为在甜茶苷基础菌株中生成的甜菊单糖苷的μm(黑体)实施例11.通过交换n-末端结构域来设计ugt嵌合体植物udp-糖基转移酶(ugt)具有高度保守的蛋白结构,即使它们具有相对低的氨基酸序列同源性。所述这些ugt采用所谓的gt-b结构折叠,由两个结构域组成,大致在其一级氨基酸序列的中点处断裂。n-末端结构域是糖受体结构域,其主要决定底物特异性。正如所料,就其氨基酸序列而言,所述结构域是更可变的结构域,反映了可被ugt糖基化的多种底物。更保守的c-末端结构域是糖供体结构域,udp-葡萄糖在其中结合。这两个结构域通常通过柔性连接体进行连接,产生分裂所述蛋白的理想区域,以进行结构域交换设计(图6)。鉴于ugt的高度保守结构域结构的特性,来自任何两个ugt的结构域可进行重组,以改变底物特异性或增强所需功能如催化活性。在本实施例中,我们研究了ugt40087的n-末端结构域在赋予底物特异性方面的作用,即赋予底物通过结构域交换来设计几种ugt嵌合体而将reba转化为rebd的活性。设计结构域交换实验的一般方法涉及以下步骤:1)选择交换候选对,2)选择结构域交换位点以在ugt对之间产生嵌合体(使c-末端结构域突变以改善与靶向底物和n-末端结构域的相互作用的选项),和3)针对所需活性创建、测试和进化嵌合蛋白。在本实施例中采用此方法来进行结构域交换,如下所述。选择四种ugt作为构建嵌合体的亲本:ugt40087(seqidno.11),ugtsi91dlike(seqidno.12),os_ugt_91c1(seqidno.8)和91dlike3(seqidno.7)。ugt40087的n-末端结构域用于置换si91dlike、os_ugt_91c1和91dlike3的n-末端结构域,产生三种嵌合体,其与ugt40087分别具有97%、79%和71%的整体序列同一性。swiss-model用于生成所有四种ugt的结构模型。基于结构比对和序列比对来选择确切的氨基酸位置(“交换位点”)。为了使对嵌合蛋白的三维折叠的扰动最小化,位于n-末端和c-末端结构域之间的柔性区域(其构成酶的两个不同的半部分(图6))用作交换位点。此区域中的gly215和leu216(氨基酸编号是指ugt40087)在所有ugt中高度保守,所述所有ugt包括本实施例中的四种ugt。因此,所述两个结构域在这两个残基之间分开,进行结构域交换(图6)。为了测试结构域交换的效果,本实验在遗传上相同的酵母菌株中进行,只是所述酵母菌株包括不同的ugt。然而,所述这些酵母菌株在遗传上不同于实施例4中所述的ugt多样性筛选中使用的那些。实施例4至7中所述的一般方法用于菌株转化、培养和分析。各种结构域交换设计的将reba转化为rebd的转化率均示于下表8中。表8.ugt40087结构域交换结果ugt40087与si91dlike、os_ugt_91c1和91dlike3分别具有90%、54%和36%的总体序列同一性。除了在ugt40087的n-末端和c-末端序列中均具有约40%序列同一性的91dlike3外,ugt40087n-末端结构域的嵌合体与si91dlike和os_ugt_91c1的c-末端结构域的嵌合体在将reba转化为rebd方面均是有效的(表8)。尽管si91dlike不具有可检测的活性,但用ugt40087的n-末端结构域置换si91dlike的n-末端结构域将使其具有全部ugt40087活性,表明ugt40087的n-末端结构域对于将reba转化为rebd是非常重要的。四个亲本ugt的比对还揭示了六个n-末端氨基酸残基(ugt40087中的v11、i12、p55、e90、s203、e223和v413;图8–序列比对图),其由两种可将reba转化为rebd的活性酶(ugt40087和os_ugt_91c1)共有,但不同于两种无活性酶(si91dlike和91dlike3)中的那些。实施例12.通过交换n-末端环路(loop)来设计ugt变体ugt40087和os_ugt_91c1的模拟结构的比较揭示了在n-末端糖受体结构域具有显著构象差异的四个环路(loop)。所述环路位置如图6所示。为了识别可能有助于ugt40087将reba转化rebd的优异活性的环路,将所述这些环路中的每一个在这两种蛋白中进行交换,以产生总共12种ugt变体。设计了两个版本的loop_3和loop_4来考虑两个可能的环路长度。详细设计列于表9和表10中。表9.基于ugt40087的环路(loop)交换设计(具有下标编号的氨基酸之间的序列是从os_ugt_91c1中进行交换的区域)在表9中,具有下标的两个氨基酸残基之间的序列id号的氨基酸序列是从os_ugt_91c中交换到ugt40087碱基中的环路(loop)区域。在掺入所述交换的环路区域之前,具有与来自os_ugt_91c的所述交换的环路区域相邻的下标的两个氨基酸残基和下标编号分别对应于ugt40087的氨基酸残基和氨基酸位置。在表9中列出的新的嵌合ugt中,来自os_ugt_91c的所述交换的环路区域替换了ugt40087碱基的相应环路区域。应注意,整合到ugt40087_loop1中的所述交换的环路区域的seqidno:27的氨基酸序列,是os_ugt_91c1的原始loop1的修饰形式。更具体地,seqidno:27的序列中的第12个氨基酸残基是脯氨酸(而非存在于具有seqidno:8的os_ugt_91c的原始loop1中的相应位置的精氨酸)。因此,在ugt40087_loop1中,与具有seqidno:11的ugt40087的原始序列相比,在位置51处存在单个氨基酸置换,即脯氨酸置换。ugt40087_loop1中的位置51处的所述置换的脯氨酸的位置在表9中以黑体示出。表10.基于os_ugt_91c1的环路(loop)交换设计(具有下标编号的氨基酸之间的序列是从ugt40087中进行交换的区域)环路编号交换序列os_ugt_91c1_loop1s49---tprnisrlrpvrpalap(seqidno:28)---l67os_ugt_91c1_loop2v78---dglpdgaeatsdippgkt(seqidno:19)---e100os_ugt_91c1_loop3_1f113---aafldaacadgstnkvd(seqidno:20)---w124os_ugt_91c1_loop3_2f113---aafldaacadgstnkvdwlfldnfqy(seqidno:21)---w133os_ugt_91c1_loop4_1i159---gvprveppvdgsta(seqidno:22)---s203os_ugt_91c1_loop4_2a146---lnltfaastsaeygvprveppvdgsta(seqidno:23)---s203在表10中,具有下标的两个氨基酸残基之间的序列id号的氨基酸序列是从ugt40087中交换到os_ugt_91c1碱基中的环路区域。在掺入所述交换的环路区域之前,具有与来自ugt40087的所述交换的环路区域相邻的下标的两个氨基酸残基和下标编号分别对应于os_ugt_91c1的氨基酸残基和氨基酸位置。在表10中列出的新的嵌合ugt中,来自ugt40087的所述交换的环路区域替换了os_ugt_91c1碱基的相应环路区域。应注意,整合到os_ugt_91c1_loop1中的所述交换的环路区域的seqidno:28的氨基酸序列,是ugt40087的原始loop1的修饰形式。更具体地,seqidno:28的序列中的第12个氨基酸残基是精氨酸(而非存在于具有seqidno:11的ugt40087的原始loop1中的相应位置的脯氨酸)。因此,在os_ugt_91c1_loop1中,与具有seqidno:8的os_ugt_91c1的原始序列相比,在位置58处存在单个氨基酸置换,即精氨酸置换。os_ugt_91c1_loop1中的位置58处的所述置换的精氨酸的位置在表10中以黑体示出。通过twistbioscience公司合成变体蛋白质,其中60bp的序列与gal1启动子同源,并且酵母终止子位于实施例4中所述的着陆垫中的f-cphi序列的侧翼。针对在与实施例11中相同的菌株背景中将reba转化为rebd的活性,将每种合成的ugt变体作为单个染色体拷贝单独进行测试,从而用于所述ugt结构域交换嵌合体实验。为了生成菌株,将所述ugt嵌合体供体dna和包含核酸内切酶f-cphi的质粒转化到所述酵母宿主中。通过菌落pcr技术,使用特异性ugt基因内部的反向引物和整合基因座末端的通用正向引物,来验证整合的正确性。对经确认的菌株进行reba向rebd转化的试验,如上所述。表11.基于ugt40087的环路(loop)交换结果表12.基于os_ugt_91c1的环路(loop)交换结果在使用ugt40087作为亲本的情况下,除了ugt40087_loop4_2之外,所述环路交换变体在将reba转化为rebd方面均是有效的(表11)。loop4_2是长序列,其位于n-末端和c-末端结构域界面附近,并且其置换可对所述变体的整体结构产生显著扰动。在所有活性变体中,与ugt40087的n-末端序列同一性的范围为84%(loop4_1)至99%(loop1)。在使用os_ugt_91c1作为亲本的情况下,大多数环路交换变体也表现出将reba转化为rebd的活性(表12)。同样,loop4_2交换消除了所述活性,支持了这样的假设,即,其置换可能影响所述变体的结构完整性。值得注意的是,掺入loop4_1导致reba转化为rebd的转化率增加(从88%增加到97%),表明loop4_1负责赋予ugt40087优越的活性。此外,两个蛋白作为亲本的环路交换实验的结果也表明,所述这些环路区域对于赋予ugt的活性和底物特异性的差异是非常重要的,其中所述ugt具有将reba转化为rebd的活性,以及可采用同源环路变体的另外的交换或所述这些环路区域的诱变来生成用于将reba转化为rebd的改进的ugt变体。本说明书中引用的所有出版物、专利和专利申请均通过引用并入本文,如同每个单独的出版物或专利申请被具体和单独地指出通过引用并入。尽管为了清楚理解的目的,已通过举例说明和实施例详细地描述了前述发明,但根据本发明的教导,对本领域普通技术人员显而易见的是,在不脱离所附权利要求的精神或范围的情况下,可对其进行某些改变/变化和修改/修饰。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1