用于提高莱鲍迪苷D和莱鲍迪苷M之产生的方法与流程

文档序号:18618561发布日期:2019-09-06 22:16阅读:289来源:国知局
本文中公开的本发明一般地涉及重组产生甜菊醇糖苷(steviolglycoside)的领域。特别地,本发明提供了用于重组产生甜菊醇糖苷的方法和包含甜菊醇糖苷的组合物。
背景技术
::甜味剂作为最常用于食品、饮料或糖果业的成分是公知的。甜味剂既可以在生产过程中加入最终食品,也可以在适当稀释的情况下或作为佐餐甜味剂(tabletopsweeter)单独使用。甜味剂包括天然甜味剂(例如蔗糖、高果糖玉米糖浆、糖蜜、枫糖浆和蜂蜜)和人工甜味剂(例如阿斯帕坦、糖精和三氯半乳蔗糖(sucralose))。甜菊提取物(steviaextract)是可从多年生灌木甜菊(Steviarebaudiana)中分离和提取的天然甜味剂。甜菊在南美洲和亚洲被普遍种植用于商业生产甜菊提取物。纯化程度各不相同的甜菊提取物在商业中用作食品中的高甜度甜味剂,以及在共混物中或单独地作为佐餐甜味剂。甜菊属植物的提取物含有莱鲍迪苷(Rebaudioside)和其他带来甜味的甜菊醇糖苷,但不同生产批次之间每种糖苷的量往往不同。现有的商业化产品中主要是莱鲍迪苷A,和量少一些的其他糖苷,例如莱鲍迪苷C、D和F。甜菊提取物还可含有污染物,例如造成异味或具有其他不期望影响的来自植物的化合物。这些污染物根据食物系统或应用选择可带来或多或少的问题。潜在的污染物包括:色素、脂质、蛋白质、酚类、糖类、斯巴醇和其他倍半萜、半日花烷型二萜(labdanediterpene)、单萜、癸酸、8,11,14-二十碳三烯酸、2-甲基十八烷、二十五烷、二十八烷、二十四烷、十八醇、豆甾醇、β-谷甾醇、α-香树素和β-香树素、羽扇豆醇、β-香树醇乙酸酯(β-amryinacetate)、五环三萜、矢车菊黄素(centauredin)、槲皮素、表-α-杜松醇(epi-alpha-cadinol)、石竹烯(carophyllene)及衍生物、β-蒎烯(beta-pinene)、β-谷甾醇、以及赤霉素(gibberellin)。由于已经证明从甜菊属植物中回收和纯化甜菊醇糖苷是劳动密集且低效的,依然需要可产生高产率的具有较少的基于植物之污染物(包括但不限于甜菊苷(stevioside))的期望的甜菊醇糖苷(例如莱鲍迪苷D和莱鲍迪苷M)的重组产生系统。产生甜菊醇糖苷的酿酒酵母(Saccharomycescerevisiae)菌株以及生物转化和体外生物合成描述在PCT申请No.PCT/US2012/050021和PCT/US2011/038967中,其通过引用整体并入本文。本质上,甜菊属尿苷二磷酸依赖性糖基转移酶76G1(uridinediphosphatedependentglycosyltransferase76G1,UGT76G1)催化甜菊醇骨架上的多个糖基化反应,这导致产生甜菊醇糖苷。最近,已经表明UGT76G1可将1,2-甜菊苷转化成莱鲍迪苷A以及将1,2-二糖苷(1,2-bioside)转化成莱鲍迪苷B(参见Richman等,2005,ThePlantJournal41:56-67)。因此,本领域中需要鉴定针对通过UGT76G1或其他UGT酶产生糖基化莱鲍迪苷的反应。特别地,需要探索或鉴定通过UGT76G1催化的其他反应以及需要提高UGT76G1的催化能力以产生更高产率的甜菊醇糖苷,例如莱鲍迪苷D和莱鲍迪苷M。发明概述在上述背景下,本发明提供了超过现有技术的某些优点和改进。特别地,本发明涉及由遗传修饰细胞生物合成莱鲍迪苷D和莱鲍迪苷M以及莱鲍迪苷D和莱鲍迪苷M制备物。在一些特定实施方案中,本发明涉及来自遗传修饰细胞的具有显著改进的生物合成速率和产率的莱鲍迪苷D和莱鲍迪苷M制备物。本公开内容涉及甜菊醇糖苷的产生。特别地,本公开内容涉及通过但不限于重组宿主(例如重组微生物)、通过生物转化以及体外产生甜菊醇糖苷,其包括莱鲍迪苷M:(1R,5R,9S,13R)-13-{[(2S,3R,4S,5R,6R)-5-羟基-6-(羟甲基)-3,4-双({[(2S,3R,4S,5S,6R)-3,4,5-三羟基-6-(羟甲基)氧杂环己烷-2-基]氧基})氧杂环己烷-2-基]氧基}-5,9-二甲基-14-亚甲基四环[11.2.1.01,10.04,9]十六烷-5-羧酸(2S,3R,4S,5R,6R)-5-羟基-6-(羟甲基)-3,4-双({[(2S,3R,4S,5S,6R)-3,4,5-三羟基-6-(羟甲基)氧杂环己烷-2-基]氧基})氧杂环己烷-2-基酯以及莱鲍迪苷D:13-{[5-羟基-6-(羟甲基)-3,4-双({[3,4,5-三羟基-6-(羟甲基)氧杂环己烷-2-基]氧基})氧杂环己烷-2-基]氧基}-5,9-二甲基-14-亚甲基四环[11.2.1.01,10.04,9]十六烷-5-羧酸4,5-二羟基-6-(羟甲基)-3-{[3,4,5-三羟基-6-(羟甲基)氧杂环己烷-2-基]氧基}氧杂环己烷-2-基酯因此,在一个方面,本公开内容提供了重组宿主(例如微生物),其包含一种或更多种生物合成基因,其中一种或更多种生物合成基因的表达导致产生甜菊醇糖苷,包括莱鲍迪苷M和莱鲍迪苷D。特别地,一种或更多种本文中所述尿苷5′-二磷酸(UDP)糖基转移酶(例如EUGT11、UGT74G1、UGT76G1、UGT85C2和UGT91D2)的表达有助于重组宿主或某些体外系统中莱鲍迪苷M或莱鲍迪苷D的产生和积累。尽管本文中公开的本发明不限于特定优点或功能,本发明提供了包含约1%至约99%w/w莱鲍迪苷M的组合物,其中所述组合物具有相对于甜菊提取物降低水平的来自甜菊的污染物,其中至少一种所述污染物是来自植物的化合物。在某些情况下,所述来自植物的污染性化合物尤其可造成异味。在一些方面,包含约1%至约99%w/w莱鲍迪苷M的组合物具有相对于甜菊提取物少于0.1%的来自甜菊的污染物,其中至少一种所述污染物是来自植物的化合物。在某些情况下,所述来自植物的污染性化合物尤其可造成异味。本发明还提供了包含上述组合物的食品。在一些方面,所述食品是饮料或饮料浓缩物。本发明还提供了重组宿主细胞,其表达:(a)编码GGPPS的重组基因;(b)编码内部柯巴基二磷酸合酶(ent-copalyldiphosphatesynthase,CDPS)多肽的重组基因;(c)编码贝壳杉烯氧化酶(kaureneoxidase,KO)多肽的重组基因;(d)编码贝壳杉烯合酶(kaurenesynthase,KS)多肽的重组基因;(e)编码甜菊醇合酶(KAH)多肽的重组基因;(f)编码细胞色素P450还原酶(cytochromeP450reductase,CPR)多肽的重组基因;(g)编码UGT85C2多肽的重组基因;(h)编码UGT74G1多肽的重组基因;(i)编码UGT76G1多肽的重组基因;(j)编码UGT91d2多肽的重组基因;以及(k)编码EUGT11多肽的重组基因;其中至少一种所述基因是重组基因,并且其中所述细胞产生莱鲍迪苷D、莱鲍迪苷M、莱鲍迪苷Q和/或莱鲍迪苷I。本发明还提供了重组宿主细胞,其包含含有以下的外源核酸:(a)编码GGPPS的重组基因;(b)编码内部柯巴基二磷酸合酶(CDPS)多肽的重组基因;(c)编码贝壳杉烯氧化酶(KO)多肽的重组基因;(d)编码贝壳杉烯合酶(KS)多肽的重组基因;(e)编码甜菊醇合酶(KAH)多肽的重组基因;(f)编码细胞色素P450还原酶(CPR)多肽的重组基因;(g)编码UGT85C2多肽的重组基因;(h)编码UGT74G1多肽的重组基因;(i)编码UGT76G1多肽的重组基因;(j)编码UGT91d2多肽的重组基因;以及(k)编码EUGT11多肽的重组基因;其中所述细胞产生莱鲍迪苷D、莱鲍迪苷M、莱鲍迪苷Q和/或莱鲍迪苷I。本发明还提供了重组宿主细胞,其表达GGPPS、内部柯巴基二磷酸合酶(CDPS)多肽、贝壳杉烯氧化酶(KO)多肽、贝壳杉烯合酶(KS)多肽、甜菊醇合酶(KAH)多肽、细胞色素P450还原酶(CPR)多肽、UGT74G1多肽、UGT76G1多肽、UGT91d2多肽和EUGT11多肽,其中至少一种所述多肽由已引入所述细胞的外源或异源基因编码;其中所述细胞产生二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)。在一些实施方案中,可通过控制UDP-糖基转移酶活性的相对水平实现个别莱鲍迪苷的定向产生(参见图1)。在一些方面,可通过重组细胞中不同拷贝数的UGT-重组基因(参见图1)、不同启动子强度和/或通过使用对目标产物具有提高的特异性/活性的突变体来实现个别莱鲍迪苷的定向产生。例如,如果与其他有利于莱鲍迪苷A形成的UGT相比EUGT11以低水平表达,则将形成低水平的莱鲍迪苷D、E和M。高EUGT11表达水平导致产生更多19-O1,2二糖苷,其可充当UGT76G1的底物以形成莱鲍迪苷M。在某些有利实施方案中,本发明重组细胞中UGT76G1的额外拷贝或突变形式可提高由莱鲍迪苷D形成莱鲍迪苷M的速率。在一些实施方案中,UGT76G1催化甜菊醇和甜菊醇糖苷在19-O位的糖基化。因此,在一些实施方案中,在表达编码UGT76G1多肽的重组基因的重组宿主中通过生物转化或在体外通过UGT76G1的催化产生RebM、RebQ、RebI、二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)中的一种或更多种。在一些实施方案中,UGT76G1催化甜菊醇和甜菊醇糖苷在13-O位糖基化,并且优先得使13-O位1,2-二糖基化或13-O位单糖基化的甜菊醇糖苷底物糖基化。在一些实施方案中,UGT76G1并不对19-O位的糖基化状态表现出优先性。在一些方面,GGPPS包含SEQIDNO:24中所示聚球藻属(Synechococcussp)GGPPS。在一些方面,CDP多肽包含SEQIDNO:13中所示玉米(Z.mays)CDPS多肽,其中所述多肽缺少叶绿体转运肽(cloroplasttransitpeptide)。在一些方面,KO多肽包含与SEQIDNO:25中所示甜菊KO多肽的氨基酸序列具有70%或更高同一性的KO多肽。在一些方面,KS多肽包含与SEQIDNO:21中所示拟南芥(A.thaliana)KS多肽的氨基酸具有40%或更高同一性的KS多肽。在一些方面,KAH多肽包含与SEQIDNO:11中所示甜菊KAH氨基酸序列具有60%或更高同一性的KAH多肽。在一些方面,CPR多肽包含与SEQIDNO:4中所示甜菊CPR氨基酸序列、SEQIDNO:9中所示氨基酸序列的拟南芥CPR多肽具有65%或更高同一性的CPR多肽、或其组合。在一些方面,UGT85C2多肽包含与SEQIDNO:26中所示氨基酸序列具有55%或更高同一性的UGT85C2多肽。在一些方面,UGT74G1多肽包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽。在一些方面,UGT76G1多肽包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽。在一些方面,UGT91d2多肽包含与SEQIDNO:26中所示氨基酸序列或其功能同源物具有90%或更高同一性的UGT91d2多肽、在SEQIDNO:15的第211和286位残基处具有替换的UGT91d2e多肽、或其组合。在一些方面,EUGT11多肽包含与SEQIDNO:16中所示Os03g0702000氨基酸序列具有65%或更高同一性的EUGT11多肽。在一些方面,UGT76G1多肽包含一种或更多种UGT76G1多肽变体,其包括:SEQIDNO:2的T55K、T55E、S56A、Y128S、Y128E、H155L、H155R、Q198R、S285R、S285T、S253W、S253G、T284R、T284G、S285G、K337E、K337P和L379V。在一些方面,UGT76G1多肽包含一种或更多种UGT76G1多肽变体,其包括:SEQIDNO:2的Q23G、Q23H、I26F、I26W、T146A、T146G、T146P、H155R、L257P、L257W、L257T、L257G、L257A、L257R、L257E、S283G和S283N。在一些方面,重组宿主细胞是酵母细胞、植物细胞、哺乳动物细胞、昆虫细胞、真菌细胞或细菌细胞。在一些方面,酵母细胞是来自酿酒酵母(Saccharomycescerevisiae)、粟酒裂殖酵母(Schizosaccharomycespombe)、解脂耶氏酵母(Yarrowialipolytica)、光滑念珠菌(Candidaglabrata)、棉阿舒囊霉(Ashbyagossypii)、产朊假丝酵母(Cyberlindnerajadinii)、巴斯德毕赤酵母(Pichiapastoris)、乳酸克鲁维酵母(Kluyveromyceslactis)、多形汉逊酵母(Hansenulapolymorpha)、博伊丁念珠菌(Candidaboidinii)、Arxulaadeninivorans、红发夫酵母(Xanthophyllomycesdendrorhous)或白色念珠菌(Candidaalbicans)物种的细胞。在一些方面,酵母细胞为酵母纲。在一些方面,酵母细胞是来自酿酒酵母物种的细胞。本发明还提供了本文中公开的细胞,其产生莱鲍迪苷D。本发明还提供了本文中公开的细胞,其产生莱鲍迪苷M、莱鲍迪苷Q或莱鲍迪苷I。本发明还提供了本文中公开的细胞,其产生二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)。在一些方面,以约1,000mg/L至约2,900mg/L的浓度在本文中公开的细胞中产生莱鲍迪苷D。在一些方面,以约1∶1至约1.7∶1的比例在本文中公开的细胞中产生莱鲍迪苷D和莱鲍迪苷M。在一些方面,以约600mg/L至约2,800mg/L的浓度在本文中公开的细胞中产生莱鲍迪苷M。在一些方面,以约0.6∶1至约1.1∶1的比例在本文中公开的细胞中产生莱鲍迪苷M和莱鲍迪苷D。本发明还提供了产生莱鲍迪苷D、莱鲍迪苷M、莱鲍迪苷Q、莱鲍迪苷I、二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)的方法,其包括:(a)在其中编码GGPPS、内部柯巴基二磷酸合酶(CDPS)多肽、贝壳杉烯氧化酶(KO)多肽、贝壳杉烯合酶(KS)多肽、甜菊醇合酶(KAH)多肽、细胞色素P450还原酶(CPR)多肽、UGT85C2多肽、UGT74G1多肽、UGT76G1多肽、UGT91d2多肽和EUGT11多肽的基因表达的条件下,在培养基中培养重组细胞,包括诱导所述基因的表达或组成性地表达所述基因;以及(b)在所述细胞中合成莱鲍迪苷D、莱鲍迪苷M、莱鲍迪苷Q、莱鲍迪苷I、二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯);以及任选地(c)分离莱鲍迪苷D、莱鲍迪苷M、莱鲍迪苷Q、莱鲍迪苷I、二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)。在一些方面,由本文中公开的细胞产生莱鲍迪苷D。在一些方面,由本文中公开的细胞产生莱鲍迪苷M、莱鲍迪苷Q或莱鲍迪苷I。在一些方面,由本文中公开的细胞产生二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)。在一些方面,以约1,000mg/L至约2,900mg/L的浓度产生莱鲍迪苷D。在一些方面,以约1∶1至约1.7∶1的比例产生莱鲍迪苷D和莱鲍迪苷M。在一些方面,以约600mg/L至约2,800mg/L的浓度产生莱鲍迪苷M。在一些方面,以约0.6∶1至约1.1∶1的比例产生莱鲍迪苷M和莱鲍迪苷D。在一些方面,用于实施本文中公开的方法的细胞是酵母细胞、植物细胞、哺乳动物细胞、昆虫细胞、真菌细胞或细菌细胞。在一些方面,酵母细胞是来自酿酒酵母、粟酒裂殖酵母、解脂耶氏酵母、光滑念珠菌、棉阿舒囊霉、产朊假丝酵母、巴斯德毕赤酵母、乳酸克鲁维酵母、多形汉逊酵母、博伊丁念珠菌、Arxulaadeninivorans、红发夫酵母或白色念珠菌物种的细胞。在一些方面,酵母细胞为酵母纲。在一些方面,酵母细胞是来自酿酒酵母物种的细胞。本发明还提供了用于使用一种或更多种UGT多肽通过来自植物的或合成的甜菊醇或甜菊醇糖苷的体外生物转化产生莱鲍迪苷D、莱鲍迪苷M、莱鲍迪苷Q、莱鲍迪苷I、二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)的方法。在一些方面,用于产生莱鲍迪苷D或莱鲍迪苷M的所述方法包括使用以下的至少一种UGT多肽:UGT85C2多肽,其包含与SEQIDNO:26中所示氨基酸序列具有55%或更高同一性的UGT85C2多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽;UGT91d2多肽,其包含与SEQIDNO:26中所示氨基酸序列或其功能同源物具有90%或更高同一性的UGT91d2多肽、在SEQIDNO:15的第211和286位残基处具有替换的UGT91d2e多肽、或其组合;或EUGT11多肽,其包含与SEQIDNO:16中所示Os03g0702000氨基酸序列具有65%或更高同一性的EUGT11多肽。在一些方面,用于产生莱鲍迪苷D的甜菊醇糖苷包括甜菊苷、RebA、RebB、RebE或其混合物。在一些方面,用于产生莱鲍迪苷M的甜菊醇糖苷包括甜菊苷、RebA、RebB、RebE、RebD或其混合物。在一些方面,用于产生莱鲍迪苷Q的方法包括使用以下的至少一种UGT多肽:UGT85C2多肽,其包含与SEQIDNO:26中所示氨基酸序列具有55%或更高同一性的UGT85C2多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽。在一些方面,用于产生莱鲍迪苷Q的甜菊醇糖苷包括覆盆子苷(rubusoside)、RebG或其混合物。在一些方面,用于产生莱鲍迪苷I的方法包括使用以下的至少一种UGT多肽:UGT85C2多肽,其包含与SEQIDNO:26中所示氨基酸序列具有55%或更高同一性的UGT85C2多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽;UGT91d2多肽,其包含与SEQIDNO:26中所示氨基酸序列或其功能同源物具有90%或更高同一性的UGT91d2多肽、在SEQIDNO:15的第211和286位残基处具有替换的UGT91d2e多肽、或其组合。在一些方面,用于产生莱鲍迪苷I的甜菊醇糖苷包含1,2-甜菊苷、RebA或其混合物。在一些方面,用于产生二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)的方法包括使用以下的至少一种UGT多肽:UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;或EUGT11多肽,其包含与SEQIDNO:16中所示Os03g0702000氨基酸序列具有65%或更高同一性的EUGT11多肽。在一些方面,用于产生二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)的甜菊醇糖苷包括甜菊醇-19-O-葡糖苷。在一些方面,用于产生三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)的方法包括使用以下的至少一种UGT多肽:UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;或EUGT11多肽,其包含与SEQIDNO:16中所示Os03g0702000氨基酸序列具有65%或更高同一性的EUGT11多肽。在一些方面,用于产生三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)的甜菊醇糖苷包含二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)、甜菊醇-19-O-葡糖苷或其混合物。在一些方面,本文中公开的生物转化方法包括酶促生物转化或全细胞生物转化。在一些方面,用于实施本文中公开的方法的细胞是酵母细胞、植物细胞、哺乳动物细胞、昆虫细胞、真菌细胞或细菌细胞。在一些方面,酵母细胞是来自酿酒酵母、粟酒裂殖酵母、解脂耶氏酵母、光滑念珠菌、棉阿舒囊霉、产朊假丝酵母、巴斯德毕赤酵母、乳酸克鲁维酵母、多形汉逊酵母、博伊丁念珠菌、Arxulaadeninivorans、红发夫酵母或白色念珠菌物种的细胞。在一些方面,酵母细胞为酵母纲。在一些方面,酵母细胞是来自酿酒酵母物种的细胞。本发明还提供了包含含有以下的外源核酸的重组宿主细胞:(a)编码GGPPS的重组基因;(b)编码内部柯巴基二磷酸合酶(CDPS)多肽的重组基因;(c)编码贝壳杉烯氧化酶(KO)多肽的重组基因;(d)编码贝壳杉烯合酶(KS)多肽的重组基因;(e)编码甜菊醇合酶(KAH)多肽的重组基因;(f)编码细胞色素P450还原酶(CPR)多肽的重组基因;(g)编码一种或更多种UGT多肽的一种或更多种重组基因;其中所述细胞产生莱鲍迪苷D、莱鲍迪苷M、莱鲍迪苷Q或莱鲍迪苷I、二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)。在所述重组宿主细胞的一些方面,GGPPS包含SEQIDNO:24中所示聚球藻属GGPPS;CDP多肽包含SEQIDNO:13所述玉米CDPS多肽,其中所述多肽缺少叶绿体转运肽;KO多肽包含与SEQIDNO:25中所示甜菊KO多肽的氨基酸序列具有70%或更高同一性的KO多肽;KS多肽包含与SEQIDNO:21中所示拟南芥KS多肽的氨基酸序列具有40%或更高同一性的KS多肽;KAH多肽包含与SEQIDNO:11中所示甜菊KAH氨基酸序列具有60%或更高同一性的KAH多肽;CPR多肽包含与SEQIDNO:4中所示甜菊CPR氨基酸序列、SEQIDNO:9中所示氨基酸序列的拟南芥CPR多肽具有65%或更高同一性的CPR多肽、或其组合。在一些方面,细胞产生莱鲍迪苷D或莱鲍迪苷M,其中所述UGT多肽是以下的至少一种UGT多肽:UGT85C2多肽,其包含与SEQIDNO:26中所示氨基酸序列具有55%或更高同一性的UGT85C2多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽;UGT91d2多肽,其包含与SEQIDNO:26中所示氨基酸序列或其功能同源物具有90%或更高同一性的UGT91d2多肽、在SEQIDNO:15的第211和286位残基处具有替换的UGT91d2e多肽、或其组合;或EUGT11多肽,其包含与SEQIDNO:16中所示Os03g0702000氨基酸序列具有65%或更高同一性的EUGT11多肽。在一些方面,所述细胞产生莱鲍迪苷Q,其中所述UGT多肽是以下的至少一种UGT多肽:UGT85C2多肽,其包含与SEQIDNO:26中所示氨基酸序列具有55%或更高同一性的UGT85C2多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;或UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽。在一些方面,所述细胞产生莱鲍迪苷I,其中所述UGT多肽是以下的至少一种UGT多肽:UGT85C2多肽,其包含与SEQIDNO:26中所示氨基酸序列具有55%或更高同一性的UGT85C2多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽;UGT91d2多肽,其包含与SEQIDNO:26中所示氨基酸序列或其功能同源物具有90%或更高同一性的UGT91d2多肽、在SEQIDNO:15的第211和286位残基处具有替换的UGT91d2e多肽、或其组合。在一些方面,所述细胞产生二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯),其中所述UGT多肽是以下的至少一种UGT多肽:UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;或EUGT11多肽,其包含与SEQIDNO:16中所示Os03g0702000氨基酸序列具有65%或更高同一性的EUGT11多肽。在一些方面,所述细胞产生三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯),其中所述UGT多肽是以下的至少一种UGT多肽:UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;或EUGT11多肽,其包含与SEQIDNO:16中所示Os03g0702000氨基酸序列具有65%或更高同一性的EUGT11多肽。在一些方面,UGT76G1多肽包括一种或更多种UGT76G1多肽变体,其包括:SEQIDNO:2的Q23G、Q23H、I26F、I26W、T146A、T146G、T146P、H155R、L257P、L257W、L257T、L257G、L257A、L257R、L257E、S283G和S283N。在一些方面,UGT76G1多肽包括一种或更多种UGT76G1多肽变体,其包括:SEQIDNO:2的T55K、T55E、S56A、Y128S、Y128E、H155L、H155R、Q198R、S285R、S285T、S253W、S253G、T284R、T284G、S285G、K337E、K337P和L379V。在一些方面,重组宿主细胞是酵母细胞、植物细胞、哺乳动物细胞、昆虫细胞、真菌细胞或细菌细胞。在一些方面,酵母细胞是来自酿酒酵母、粟酒裂殖酵母、解脂耶氏酵母、光滑念珠菌、棉阿舒囊霉、产朊假丝酵母、巴斯德毕赤酵母、乳酸克鲁维酵母、多形汉逊酵母、博伊丁念珠菌、Arxulaadeninivorans、红发夫酵母或白色念珠菌物种的细胞。在一些方面,酵母细胞为酵母纲。在一些方面,酵母细胞是来自酿酒酵母物种的细胞。本发明还提供了用于使用本文中公开的重组细胞通过发酵产生莱鲍迪苷D的方法。本发明还提供了用于使用本文中公开的重组细胞通过发酵产生莱鲍迪苷M的方法。本发明还提供了用于使用本文中公开的重组细胞通过发酵产生莱鲍迪苷Q的方法。本发明还提供了用于使用本文中公开的重组细胞通过发酵产生莱鲍迪苷I的方法。本发明还提供了用于使用本文中公开的重组细胞通过发酵产生二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)的方法。本发明还提供了用于使用本文中公开的重组细胞通过发酵产生三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)的方法。在一些方面,用于实施本文中公开的方法的细胞是酵母细胞、植物细胞、哺乳动物细胞、昆虫细胞、真菌细胞或细菌细胞。在一些方面,酵母细胞是来自酿酒酵母、粟酒裂殖酵母、解脂耶氏酵母、光滑念珠菌、棉阿舒囊霉、产朊假丝酵母、巴斯德毕赤酵母、乳酸克鲁维酵母、多形汉逊酵母、博伊丁念珠菌、Arxulaadeninivorans、红发夫酵母或白色念珠菌物种的细胞。在一些方面,酵母细胞为酵母纲。在一些方面,酵母细胞是来自酿酒酵母物种的细胞。本发明还提供了用于产生莱鲍迪苷D或莱鲍迪苷M的体外方法,其包括:(a)向反应混合物中添加以下的一种或更多种:UGT85C2多肽,其包含与SEQIDNO:26中所示氨基酸序列具有55%或更高同一性的UGT85C2多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽;UGT91d2多肽,其包含与SEQIDNO:26中所示氨基酸序列或其功能同源物具有90%或更高同一性的UGT91d2多肽、在SEQIDNO:15的第211和286位残基处具有替换的UGT91d2e多肽、或其组合;EUGT11多肽,其包含与SEQIDNO:16中所示Os03g0702000氨基酸序列具有65%或更高同一性的EUGT11多肽,以及来自植物的或合成的甜菊醇或甜菊醇糖苷;以及(b)在反应混合物中合成莱鲍迪苷D或莱鲍迪苷M;以及任选地(c)分离反应混合物中的莱鲍迪苷D或莱鲍迪苷M。本发明还提供了用于产生莱鲍迪苷Q的体外方法,其包括:(a)向反应混合物中添加以下的一种或更多种:UGT85C2多肽,其包含与SEQIDNO:26中所示氨基酸序列具有55%或更高同一性的UGT85C2多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽,以及来自植物的或合成的甜菊醇或甜菊醇糖苷,以及(b)在反应混合物中合成莱鲍迪苷Q;以及任选地(c)分离反应混合物中的莱鲍迪苷Q。本发明还提供了用于产生莱鲍迪苷I的体外方法,其包括:(a)向反应混合物中添加以下的一种或更多种:UGT85C2多肽,其包含与SEQIDNO:26中所示氨基酸序列具有55%或更高同一性的UGT85C2多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽;UGT91d2多肽,其包含与SEQIDNO:26中所示氨基酸序列或其功能同源物具有90%或更高同一性的UGT91d2多肽、在SEQIDNO:15的第211和286位残基处具有替换的UGT91d2e多肽、或其组合,以及来自植物的或合成的甜菊醇或甜菊醇糖苷;以及(b)在反应混合物中合成莱鲍迪苷I;以及任选地(c)分离反应混合物中的莱鲍迪苷I。本发明还提供了用于产生二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)的体外方法,其包括:(a)向反应混合物中添加以下的一种或更多种:UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;EUGT11多肽,其包含与SEQIDNO:16中所示Os03g0702000氨基酸序列具有65%或更高同一性的EUGT11多肽,以及来自植物的或合成的甜菊醇或甜菊醇糖苷;以及(b)在反应混合物中合成二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯);以及任选地(c)分离反应混合物中的二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)。本发明还提供了用于产生三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)的体外方法,其包括:(a)向反应混合物中添加以下的一种或更多种:UGT76G1多肽,其包含与SEQIDNO:2中所示氨基酸序列具有50%或更高同一性的UGT76G1多肽;UGT74G1多肽,其包含与SEQIDNO:19中所示氨基酸序列具有55%或更高同一性的UGT74G1多肽;EUGT11多肽,其包含与SEQIDNO:16中所示Os03g0702000氨基酸序列具有65%或更高同一性的EUGT11多肽,以及来自植物的或合成的甜菊醇或甜菊醇糖苷,以及(b)在反应混合物中合成三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯);以及任选地(c)分离反应混合物中的三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)。在一些方面,用于产生莱鲍迪苷D的UGT76G1多肽包括选自以下的一种或更多种UGT76G1多肽变体:SEQIDNO:2的Q23G、Q23H、I26F、I26W、T146A、T146G、T146P、H155R、L257P、L257W、L257T、L257G、L257A、L257R、L257E、S283G和S283N。在一些方面,用于产生莱鲍迪苷M、莱鲍迪苷Q、莱鲍迪苷I、二糖基化甜菊醇糖苷和三糖基化甜菊醇糖苷的UGT76G1多肽是选自以下的一种或更多种UGT76G1多肽变体:SEQIDNO:2的T55K、T55E、S56A、Y128S、Y128E、H155L、H155R、Q198R、S285R、S285T、S253W、S253G、T284R、T284G、S285G、K337E、K337P和L379V。在一些方面,本文中公开的体外方法是酶促体外方法或全细胞体外方法。在一些方面,用于实施本文中公开的方法的细胞是酵母细胞、植物细胞、哺乳动物细胞、昆虫细胞、真菌细胞或细菌细胞。在一些方面,酵母细胞是来自酿酒酵母、粟酒裂殖酵母、解脂耶氏酵母、光滑念珠菌、棉阿舒囊霉、产朊假丝酵母、巴斯德毕赤酵母、乳酸克鲁维酵母、多形汉逊酵母、博伊丁念珠菌、Arxulaadeninivorans、红发夫酵母或白色念珠菌物种的细胞。在一些方面,酵母细胞为酵母纲。在一些方面,酵母细胞是来自酿酒酵母物种的细胞。本发明还提供了通过本文中公开的方法产生的莱鲍迪苷Q。本发明还提供了通过本文中公开的方法产生的莱鲍迪苷I。本发明还提供了通过本文中公开的方法产生的二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)。本发明还提供了通过本文中公开的方法产生的三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)。本发明还提供了用于产生莱鲍迪苷M、莱鲍迪苷Q、莱鲍迪苷I、二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)的UGT76G1多肽,其中所述UGT76G1多肽包含SEQIDNO:2的UGT76G1多肽或一种或更多种UGT76G1多肽变体,其包括:SEQIDNO:2的T55K、T55E、S56A、Y128S、Y128E、H155L、H155R、Q198R、S285R、S285T、S253W、S253G、T284R、T284G、S285G、K337E、K337P和L379V。本发明还提供了用于产生莱鲍迪苷D的UGT76G1多肽,其中所述UGT76G1多肽包括UGT76G1多肽或一种或更多种UGT76G1多肽变体,其包括:SEQIDNO:2的Q23G、Q23H、I26F、I26W、T146A、T146G、T146P、H155R、L257P、L257W、L257T、L257G、L257A、L257R、L257E、S283G和S283N。本发明还提供了包含编码UGT76G1多肽的重组基因的重组宿主细胞,其中UGT76G1多肽包含一种或更多种UGT76G1多肽变体,其包括:SEQIDNO:2的T55K、T55E、S56A、Y128S、Y128E、H155L、H155R、Q198R、S285R、S285T、S253W、S253G、T284R、T284G、S285G、K337E、K337P和L379V。在一些方面,本文中公开的重组宿主细胞产生莱鲍迪苷D。本发明还提供了包含编码UGT76G1多肽的重组基因的重组宿主细胞,其中所述UGT76G1多肽包括一种或更多种UGT76G1多肽变体,其包括:SEQIDNO:2的Q23G、Q23H、I26F、I26W、T146A、T146G、T146P、H155R、L257P、L257W、L257T、L257G、L257A、L257R、L257E、S283G和S283N。在一些方面,本文中公开的重组宿主细胞产生莱鲍迪苷M、莱鲍迪苷Q、莱鲍迪苷I、二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)。在一些方面,所述重组宿主细胞是酵母细胞、植物细胞、哺乳动物细胞、昆虫细胞、真菌细胞或细菌细胞。在一些方面,酵母细胞是来自酿酒酵母、粟酒裂殖酵母、解脂耶氏酵母、光滑念珠菌、棉阿舒囊霉、产朊假丝酵母、巴斯德毕赤酵母、乳酸克鲁维酵母、多形汉逊酵母、博伊丁念珠菌、Arxulaadeninivorans、红发夫酵母或白色念珠菌物种的细胞。在一些方面,酵母细胞为酵母纲。在一些方面,酵母细胞是来自酿酒酵母物种的细胞。本发明还提供了组合物,其包含约1%至约99%w/w的莱鲍迪苷D,其中所述组合物具有相对于甜菊提取物降低水平的来自甜菊的污染物。在某些情况下,至少一种所述污染物是来自植物的化合物,其尤其造成甜菊醇糖苷产品中的异味。在一些方面,所述组合物具有相对于甜菊提取物小于0.1%的来自甜菊的污染物。在某些情况下,至少一种所述污染物是来自植物的化合物,其尤其造成甜菊醇糖苷产品中的异味。本发明还提供了包含本文中公开的组合物的食品。在一些方面,所述食品是饮料或饮料浓缩物。任何本文中所述宿主均可以是微生物(例如,酵母属(例如酿酒酵母)或大肠杆菌(Escherichiacoli))或者植物或植物细胞(例如,甜菊属(例如甜菊)或藓属(Physcomitrella))。通过本发明以下的发明详述并结合所附权利要求,本发明的这些以及其他特征和优点将被更充分地理解。应注意,权利要求的范围由本文中的记载限定,而不是由本说明书中所示的特征和优点的具体讨论限定。附图简述当结合以下附图阅读时,可最好地理解本发明一些实施方案的以下详细描述,其中相同结构以相同标号表示,其中:图1示出了甜菊醇糖苷糖基化反应和催化所述反应的酶。图2示出了莱鲍迪苷M(RebM)的化学结构。图3示出了莱鲍迪苷D(RebD)的化学结构。图4示出了用于产生甜菊醇的生化途径。图5是液相色谱-质谱(LC-MS)分析的代表性色谱图,其示出了1.31分钟保留时间时六糖基化甜菊醇糖苷的形成。从上到下的迹线对用于表12中指示的m/z。图6是用于分离六糖基化甜菊醇糖苷的方法的示意图。图7是在快速色谱后来自半纯化六糖基化甜菊醇糖苷的液相色谱-四极杆飞行时间(LC-QTOF)分析的代表性色谱图和质谱。图8A是色谱图,其指示酵母菌株EFSC3044中通过发酵产生的化合物。图8B是所指示的二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)(甜菊醇-1,2-二糖苷的类似物)的NMR结构。二糖基化甜菊醇糖苷的IUPAC名称为(1R,4S,5R,9S,10R,13S)-13-羟基-5,9-二甲基-14-亚甲基四环[11.2.1.0^{1,10}.0^{4,9}]十六烷-5-羧酸(2S,3R,4S,5S,6R)-4,5-二羟基-6-(羟甲基)-3-{[(2S,3R,4S,5S,6R)-3,4,5-三羟基-6-(羟甲基)氧杂环己烷-2-基]氧基}氧杂环己烷-2-基酯。图8C是所指示的三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)(RebB的异构体)的NMR结构的结构。三糖基化甜菊醇糖苷的IUPAC名称为(1R,4S,5R,9S,10R,13S)-13-羟基-5,9-二甲基-14-亚甲基四环[11.2.1.0^{1,10}.0^{4,9}]十六烷-5-羧酸(2S,3R,4S,5R,6R)-5-羟基-6-(羟甲基)-3,4-双({[(2S,3R,4S,5S,6R)-3,4,5-三羟基-6-(羟甲基)氧杂环己烷-2-基]氧基})氧杂环己烷-2-基酯。图9示出了EFSC3261酵母菌株的RebD产生。示出了基本培养基(minimalmedium,MM)中的EFSC3261酵母菌株的4份发酵。图10示出了通过EFsC3297酵母菌株的RebD和RebM产生。图11示出了EFSC3841酵母菌株的RebD、RebM和RebA产生。图12比较了利用1个或2个UGT76G1拷贝产生的RebD/RebM。图13A示出了UGT76G1的RebD的消耗与RebM的产生的相对速率。图13B示出了UGT76G1的RebE的消耗与RebD和RebM的产生的相对速率。图14示出了三种同源UGT76G1模型的差异。图15A是96孔板和4×24深孔板中的RebD和RebM产生的散点图;图15B是96孔板和4×24深孔板中的RebD和RebM产生的方框图,并且图15C是96孔板和4×24深孔板中的RebD/RebM产生的方框图。图16示出了初始UGT76G1位置饱和筛选的所有数据点,野生型产量以黑色三角形表示。图17示出了所选择用于进一步研究的靠前的产生RebD和RebM的菌落。图18示出了一式三份进行的UGT76G1RebD和RebM靠前的产生菌落(图17中所示)的再筛选,其表现出与初始筛选相同的趋势。图19A示出了通过UGT76G1的覆盆子苷的消耗与1,3-甜菊苷(RebG)和莱鲍迪苷Q(“RebQ”)的产生的相对速率。图19B示出了通过UGT76G1的1,2-甜菊苷的消耗与RebA的产生的相对速率。图19C示出了通过UGT76G1的1,2-二糖苷的消耗与RebB的产生的相对速率。图20示出了指示RebI产生的具有或不具有UGT76G1峰的1,2-甜菊苷和RebA的色谱图。技术人员将理解,图中的元件是为了简要和清楚而举例说明的,不一定是按比例绘制的。例如,图中的一些元件的尺寸可相对于其他元件扩大以有助于理解本发明的实施方案。发明详述本文中引用的所有出版物、专利和专利申请均通过引用在此明确地并入,用于所有目的。可使用本领域技术人员公知的方法来构建根据本发明的遗传表达构建体和重组细胞。这些方法包括体外重组DNA技术、合成技术、体内重组技术和聚合酶链式反应(PCR)技术。参见,例如,Maniatis等,1989,MolecularCloning:ALaboratoryManual,ColdSpringHarborLaboratory,NewYork;Ausubel等,1989,CurrentProtocolsinMolecularBiology,GreenePublishingAssociatesandWileyInterscience,NewYork,以及PCRProtocols:AGuidetoMethodsandApplications(Innis等,1990,AcademicPress,SanDiego,CA)中描述的技术。在详细描述本发明之前,将限定若干术语。除非上下文明确的另有指示,本文中使用的没有数量词修饰的名词表示一个/种或更多个/种。例如,提到“核酸”意指一个/种或更多个/种核酸。应注意,术语如“优选”、“一般”和“通常”在本文中并不是用于限制要求保护的发明的范围,或暗示某些特征对于要求保护的发明的结构或功能是关键的、必要的或甚至是重要的。相反,这些术语仅旨在突出可使用或不使用在本发明的特定实施方案中的替选的或额外的特征。为了描述和限定本发明的目的,应注意术语“基本上”在本文中用于表示可归因于任何数量比较、值、测量或其他陈述的固有的不确定程度。术语“基本上”在本文中也用于表示在不导致所讨论主题的基本功能改变的情况下,数量表达可不同于所表述的参考的程度。本文中使用的术语“多核苷酸”、“核苷酸”、“寡核苷酸”和“核酸”可互换使用,是指核酸,包括DNA、RNA、其衍生物或其组合。本文中使用的术语“和/或”用于描述彼此组合或排斥的多种组分。例如,“x、y和/或z”可指单独“x”、单独“y”、单独“z”、“x、y和z”、“(x和y)或z”、或“x或y或z”。在一些实施方案中,“和/或”用于指示重组细胞所包含的外源核酸,其中重组细胞包含选自一组的一种或更多种外源核酸。在一些实施方案中,“和/或”用于指示产生甜菊醇糖苷,其中产生选自一组的一种或更多种甜菊醇糖苷。在一些实施方案中,“和/或”用于指示产生菊醇糖苷,其中通过一个或更多个以下步骤产生一种或更多种甜菊醇糖苷:培养重组细胞,在细胞中合成一种或更多种甜菊醇糖苷,以及分离一种或更多种甜菊醇糖苷。高糖基化甜菊醇糖苷可以痕量存在于甜菊属植物中,但是所述水平过低使得从植物中提取用于在食品和饮料系统中使用的这种糖苷是不切实际的。参见,Hellfritsch等,J.Agric.FoodChem.60:6782-6793(2012);DuBoisGE,StephensonRA.,JMedChem.Jan;28:93-98(1985);和美国专利公开2011-0160311。通常来说,甜菊苷和莱鲍迪苷A是在商业上生产的甜菊提取物中的主要化合物。据报道,甜菊苷的味道比莱鲍迪苷A更苦并且甜味更小。根据种植植物的土壤和气候,甜菊提取物的组成可大不相同。据报道,根据植物来源、气候条件和提取工艺,商业制备物中莱鲍迪苷A的量为甜菊醇糖苷总含量的20%至97%不等。在甜菊提取物中,其他甜菊醇糖苷以不同的量存在。例如,莱鲍迪苷B通常以小于1%至2%存在,而莱鲍迪苷C可以以高至7%-15%的水平存在。莱鲍迪苷D通常以2%或更低的水平存在,莱鲍迪苷F通常在组合物中以总甜菊醇糖苷的3.5%或更低存在。次要甜菊醇糖苷的量影响甜菊提取物的风味特征(flavorprofile)。此外,认为莱鲍迪苷D和其他较高糖化甜菊醇糖苷是与莱鲍迪苷A相比质量更高的甜味剂。因此,本文中所述的重组宿主和方法特别可用于产生具有提高量的莱鲍迪苷D的甜菊醇糖苷组合物,该甜菊醇糖苷组合物例如用作无热量的甜味剂,其功能特性和感觉特性优于许多高效甜味剂。已报道六糖基化甜菊醇糖苷莱鲍迪苷M存在于甜菊属植物中,并且具有以下IUPAC名称:(1R,5R,9S,13R)-13-{[(2S,3R,4S,5R,6R)-5-羟基-6-(羟甲基)-3,4-双({[(2S,3R,4S,5S,6R)-3,4,5-三羟基-6-(羟甲基)氧杂环己烷-2-基]氧基})氧杂环己烷-2-基]氧基}-5,9-二甲基-14-亚甲基四环[11.2.1.01,10.04,9]十六烷-5-羧酸(2S,3R,4S,5R,6R)-5-羟基-6-(羟甲基)-3,4-双({[(2S,3R,4S,5S,6R)-3,4,5-三羟基-6-(羟甲基)氧杂环己烷-2-基]氧基})氧杂环己烷-2-基酯。参见,Ohta等,MassBankrecord:FU000341,FU000342,FU000343(2010)和Ohta等(J.AppliedGlycosides,57(3):199-209,2010)。莱鲍迪苷M具有CAS号1220616-44-3。莱鲍迪苷M的结构参见图2。还报道了五糖基化甜菊醇糖苷莱鲍迪苷D存在于甜菊属植物中,并且具有以下IUPAC名称:13-{[5-羟基-6-(羟甲基)-3,4-双({[3,4,5-三羟基-6-(羟甲基)氧杂环己烷-2-基]氧基})氧杂环己烷-2-基]氧基}-5,9-二甲基-14-亚甲基四环[11.2.1.01,10.04,9]十六烷-5-羧酸4,5-二羟基-6-(羟甲基)-3-{[3,4,5-三羟基-6-(羟甲基)氧杂环己烷-2-基]氧基}氧杂环己烷-2-基酯。莱鲍迪苷D具有CAS号64849-39-4。莱鲍迪苷D的结构参见图3。本文中提供了表达可用于莱鲍迪苷M或莱鲍迪苷D之从头生物合成的多肽的重组宿主细胞,例如微生物。本文中所述宿主表达适于产生甜菊醇糖苷的一种或更多种尿苷5′-二磷酸(UDP)糖基转移酶。多种微生物系统中这些生物合成多肽的表达允许以一致的可重复方式由能量和碳源(例如糖、甘油、CO2、H2和日光)产生甜菊醇糖苷。可通过向宿主中引入预选的生物合成酶以及使其以适当水平表达来调节重组宿主产生的每种甜菊醇糖苷的比例,以产生具有一致的味道特征的甜味剂组合物。此外,预期重组宿主产生的甜菊醇糖苷的浓度高于甜菊属植物中产生的甜菊醇糖苷的水平,其提高了下游纯化的效率。相对于甜菊提取物中存在的污染物的量,这样的甜味剂组合物有利地包含很少或不包含基于植物的污染物。提供了所公开方法和重组宿主细胞的实施,其中编码UGT85C2多肽、UGT74G1多肽、UGT76G1多肽或UGT91d2多肽的基因中至少一种是重组基因,根据所选使用的物种或菌株的特定重组基因。可包括额外的基因或生物合成模块以提高甜菊醇糖苷产率,提高能量和碳源转化成甜菊醇及其糖苷的效率,和/或增强细胞培养物的生产率。本文中使用的“生物合成模块”是指作为常用生物合成途径的一部分因此通常在重组生物中共表达的基因的集合。如本文中使用的,这种额外的生物合成模块包括参与合成类帖前体异戊烯基二磷酸和二甲基烯丙基二磷酸的基因。额外的生物合成模块包括萜合酶和萜环化酶基因,例如编码牻牛儿基牻牛儿基二磷酸合酶和柯巴基二磷酸合酶的基因,这些基因可以是外源基因或重组基因。I.甜菊醇和甜菊醇糖苷生物合成多肽A.甜菊醇生物合成多肽产生甜菊醇的生化途径涉及形成前体牻牛儿基牻牛儿基二磷酸(由GGDPS催化),环化成(-)-柯巴基二磷酸(由CDPS催化),然后形成(-)-贝壳杉烯(由KS催化),然后氧化(由KO催化)和羟基化(由KAH催化)以形成甜菊醇。参见图4。因此,重组微生物中牻牛儿基牻牛儿基二磷酸转变为甜菊醇包括编码贝壳杉烯合酶(KS)的基因、编码贝壳杉烯氧化酶(KO)的基因、编码甜菊醇合成酶(KAH)的基因的表达。甜菊醇合成酶也被称为异贝壳杉烯酸13-羟化酶。合适的KS多肽是已知的。例如,合适的KS酶包括由甜菊、玉米、毛果杨(Populustrichocarpa)和拟南芥所产生的那些。参见表2以及PCT申请No.PCT/US2012/050021和PCT/US2011/038967,其通过引用整体并入本文。SEQIDNO:6中示出了编码拟南芥KS多肽的核苷酸序列,并且SEQIDNO:21中示出了拟南芥KS多肽的氨基酸序列。表2.贝壳杉烯合酶(KS)克隆。合适的KO多肽是已知的。例如,合适的KO酶包括甜菊、拟南芥、藤仓赤霉(Gibberellafujikuroi)和变色栓菌(Trametesversicolor)所产生的那些。参见例如表3以及PCT申请No.PCT/US2012/050021和PCT/US2011/038967,其通过引用整体并入本文。表3.贝壳杉烯氧化酶(KO)克隆。合适的KAH多肽是已知的。例如,合适的KAH酶包括甜菊、拟南芥、葡萄(Vitisvinifera)和蒺藜苜蓿(Medicagotrunculata)所产生的那些。参见例如表4、PCT申请No.PCT/US2012/050021和PCT/US2011/038967、美国专利申请No.2008/0271205和2008/0064063、以及Genbank登录号gi189098312(SEQIDNO:37)和GenBank登录ABD60225;GI:89242710(SEQIDNO:38),其通过引用整体并入本文。来自拟南芥的甜菊醇合成酶被归类为CYP714A2。表4.甜菊醇合成酶(KAH)克隆*=序列由示于美国专利公开No.2008-0064063中的序列辨识码2辨识。此外,在如PCT申请No.PCT/US2012/050021(其通过引用整体并入本文)中所述鉴定的来自甜菊的KAH多肽特别地可用于重组宿主。SEQIDNO:91中示出了编码甜菊KAH(SrKAHe1)的核苷酸序列。SEQIDNO:8中示出了编码密码子经过优化用于在酵母中表达的甜菊KAH的核苷酸序列,并且SEQIDNO:11中示出了甜菊KAH多肽的氨基酸序列。当在酿酒酵母中表达时,与Yamaguchi等(美国专利公开No.2008/0271205A1)所述的拟南芥内部-贝壳杉烯酸羟化酶(ent-kaurenoicacidhydroxylase)以及美国专利公开No.2008/0064063中所述其他甜菊KAH酶以及以ACD93722存放在GenBank的蛋白质序列相比,所述甜菊KAH(SEQIDNO:11)表现出显著更高的甜菊醇合酶活性。所述甜菊KAH多肽(SEQIDNO:11)与美国专利公开No.2008/0271205的KAH具有小于20%的同一性,并且与美国专利公开No.2008/0064063的KAH具有小于35%的同一性。例如,由基因NCP1(YHR042W)编码的酿酒酵母CPR激活由SrKAHe1编码的甜菊醇合酶。当由基因ATR2(SEQIDNO:10)编码的拟南芥CPR和由基因CPR8(SEQIDNO:5)编码的甜菊醇CPR共表达时,观察到由SrKAHe1编码的甜菊醇合酶的激活水平更高。SEQIDNO:9中示出了拟南芥ATR2的氨基酸序列,并且SEQIDNO:4中示出了甜菊CPR8多肽的氨基酸序列。在一些实施方案中,重组微生物含有编码KO、KS和KAH多肽的重组基因。这样的微生物通常还含有编码细胞色素P450还原酶(CPR)多肽的重组基因,因为某些KO和/或KAH多肽的组合需要外源CPR多肽的表达。特别地,通过包含编码外源CPR多肽的重组基因可以显著地提高来自植物的KO和/或KAH多肽的活性。合适的CPR多肽是已知的。例如,合适的CPR酶包括甜菊和拟南芥所产生的那些。参见例如,表5以及PCT申请No.PCT/US2012/050021和PCT/US2011/038967,其通过引用整体并入本文。表5.细胞色素P450还原酶(CPR)克隆酵母基因DPP1和/或酵母基因LPP1可降低通过这些酶转化GGPP和FPP前体的甜菊醇产率。可破坏或缺失这些基因以降低法尼基焦磷酸(farnesylpyrophosphateFPP)向法尼醇的降解,以及降低牻牛儿基牻牛儿基焦磷酸(geranylgeranylpyrophosphate,GGPP)向牻牛儿基牻牛儿醇(geranylgeraniol,GGOH)的降解。或者,可改变编码磷酸酶的内源基因的启动子或增强子元件,从而改变其所编码的蛋白质的表达。可以采用同源重组来破坏内源基因。例如,可以以这样的方式构建“基因替代”载体以包括选择标记基因。使用本领域技术人员已知的方法,选择标记基因可以在其5’端和3’端二者处可操作地连接具有足以介导同源重组之长度的基因部分。选择标记可以是任意数目的补充宿主细胞营养缺陷体、提供抗生素抗性或导致颜色改变的基因之一。于是,使用本领域中公知的方法将基因替代载体的线性DNA片段引入细胞中(参见下文)。线性片段整合到基因组中并且基因的破坏可以基于选择标记来确定,并且可以通过例如Southern印迹分析来验证。在选择标记在选择中使用之后,可以通过例如Cre-loxP系统(参见,例如Gossen等(2002)Ann.Rev.Genetics36:153-173和美国申请公开No.20060014264)来从宿主细胞的基因组中移除选择标记。或者,可以以这样的方式构建基因替代载体,即:包含待破坏基因的一部分或基因编码序列的无活性片段,其中所述部分不含任何内源基因启动子序列并且不进行编码。“无活性片段(inactivefragment)”是编码蛋白质之基因的片段,所述蛋白的活性是由基因之全长编码序列所产生的蛋白质之活性的例如小于约10%(例如,小于约9%、小于约8%、小于约7%、小于约6%、小于约5%、小于约4%、小于约3%、小于约2%、小于约1%或0%)。这样的基因部分以下述方式插入载体中,即:没有已知启动子序列与基因序列可操作地连接,但终止密码子和转录终止序列与基因序列部分可操作地连接。随后,可以将该载体在基因序列部分中线性化并转化入细胞中。然后通过单一同源重组,将该线性化载体整合到基因的内源对应物(counterpart)中,使其失活。这些基因在重组微生物中的表达可导致牻牛儿基牻牛儿基二磷酸转化为甜菊醇。B甜菊醇糖苷生物合成多肽本文描述了可以将甜菊醇转化为甜菊醇糖苷的重组宿主细胞。这样的宿主(例如微生物)含有编码一种或更多种UDP糖基转移酶(也称为UGT)的基因。UGT将活化的核苷酸糖上的单糖单元转移到接受体部分,在这种情况下,甜菊醇或甜菊醇衍生物上的-OH或-COOH部分,或者已经连接在甜菊醇骨架上的葡萄糖的-OH部分。基于序列同源性,UGT被划分为家族和亚家族。参见Li等2001,J.Biol.Chem.276:4338-4343。覆盆子苷生物合成多肽覆盆子苷的生物合成涉及甜菊醇13-OH和19-COOH的糖基化。参见图1。重组宿主(例如微生物)中甜菊醇转化为覆盆子苷可以通过编码UGTs85C2和74G1之基因的表达来实现,其分别向甜菊醇的13-OH或者19-COOH转移葡萄糖单元。合适的UGT85C2作为尿苷5’-二磷酸葡糖基:甜菊醇13-OH转移酶和尿苷-5’-二磷酸葡糖基:甜菊醇-19-O-葡糖苷13-OH转移酶起作用。UGT85C2的示例性反应包括甜菊醇和UDP-葡萄糖向甜菊醇-13-O-葡糖苷转化或甜菊醇-19-O-葡糖苷和UDP-葡萄糖向覆盆子苷转化。参见图1。功能性UGT85C2多肽还可以催化葡萄糖基转移酶反应,该反应使用甜菊醇和甜菊醇-19-O-糖苷以外的甜菊醇糖苷底物。合适的UGT74G1多肽作为尿苷5’-二磷酸葡糖基:甜菊醇19-COOH转移酶和尿苷-5’-二磷酸葡糖基:甜菊醇-13-O-葡糖苷19-COOH转移酶起作用。74G1的示例性反应包括甜菊醇向甜菊醇19-O-葡糖苷转化和甜菊醇-13-O-葡糖苷向覆盆子苷转化。参见图19的UGT74G1反应的这些以及其他非限制性实例。功能性UGT74G1多肽还可以催化糖基转移酶反应,该反应使用甜菊醇和甜菊醇-13-O-葡糖苷以外的甜菊醇糖苷底物,或者转移来自尿苷二磷酸葡萄糖以外的供体的糖部分。当将甜菊醇用作培养基中的原料时,表达功能性UGT74G1和功能性UGT85C2的重组微生物可以产生覆盆子苷和两种甜菊醇单糖苷(即,甜菊醇13-O-单葡糖苷和甜菊醇19-O-单葡糖苷)。但通常来说,编码UGT74G1和UGT85C2的基因是被转化到天然情况下不具备这些基因的宿主(例如微生物)中的重组基因。本文中使用的术语“重组宿主”意在指(包括但不限于)这样的宿主细胞,其基因组提高了至少一个整合的DNA序列;染色体外实例如细菌中的质粒和酵母中的包含2微米圈的附加体。这样的DNA序列包括但不限于天然情况下不存在的基因、通常不会被转录为RNA或翻译为蛋白质(“表达”)的DNA序列,以及希望引入非重组宿主中的其他基因或DNA序列。应理解,通常来说,本文中所述重组宿主的基因组通过稳定引入一个或更多个重组基因来增大。一般来说,引入的DNA本来不存在于DNA受体宿主中,但本发明的范围包括从给定宿主中分离DNA区段,并随后将该DNA的一个或更多个额外拷贝引入同一宿主中,例如以提高基因产物的产量或者改变基因的表达模式。在一些情况下,所引入的DNA会通过例如同源重组或定点诱变来修饰或者甚至替代内源基因或DNA序列。合适的重组宿主包括微生物、哺乳动物细胞、昆虫细胞、真菌细胞、植物细胞和植物。术语“重组基因”是指被引入受体宿主的基因或DNA序列,无论这样的宿主中是否可能已经存在相同或类似的基因或DNA序列。上下文中的“引入”或“提高”在本领域中是已知意为人为引入或提高。因此,重组基因可以是来自另一个物种的DNA序列;或者可以是来自同一物种或存在于同一物种中但已通过重组方法整合到宿主中从而形成重组宿主的DNA序列。应理解,被引入宿主的重组基因可以与转化宿主中正常存在的DNA序列相同,并且引入它是为了提供该DNA的一个或更多个额外拷贝,从而使得允许过表达或者修饰(包括但不限于调节的或可诱导的)该DNA之基因产物的表达。合适的UGT74G1和UGT85C2多肽包括甜菊产生的那些。Richman等,2005,PlantJ.41:56-67中报道了来自甜菊的编码功能性UGT74G1和UGT85C2多肽的基因。PCT申请No.PCT/US2012/050021的SEQIDNO:1和3中分别给出了甜菊UGT74G1(SEQIDNO:19)和UGT85C2多肽(SEQIDNO:26)的氨基酸序列,经过优化用于在酵母中表达的编码UGT74G1和UGT85C2的核苷酸序列,以及UGT85C2、91D2e、74G1和76G1的DNA2.0密码子优化序列。SEQIDNO:3中示出了编码甜菊UGT85C2的GeneArt密码子优化的核苷酸序列。另参见在下文的“功能同源物”部分描述的UGT85C2和UGT74G1变体。例如,UGT85C2多肽可以在第65、71、270、289和389(例如,A65S、E71Q、T270M、Q289H和A389V)或其组合位处包含替换。在一些实施方案中,所述重组宿主是微生物。可以将重组微生物培养在含有甜菊醇的培养基中以产生覆盆子苷。但在另一些实施方案中,重组微生物表达参与甜菊醇生物合成的重组基因,例如CDPS基因、KS基因、KO基因和/或KAH基因。合适的CDPS多肽是已知的。例如,合适的CDPS酶包括甜菊、棒状链霉菌(Streptomycesclavuligerus)、大豆慢生根瘤菌(Bradyrhizobiumjaponicum)、玉米和拟南芥属所产生的那些。参见例如表6以及PCT申请No.PCT/US2012/050021和PCT/US2011/038967,其通过引用整体并入本文。在一些实施方案中,可以使用在未经修饰多肽的氨基末端处缺少叶绿体转运肽的CDPS多肽。例如,可以移除玉米CDPS编码序列(SEQIDNO:12)之5’端的前150个核苷酸,这种截短的核苷酸序列示出在SEQIDNO:133中。这样做移除SEQIDNO:13所示之氨基酸序列的氨基末端的50个残基,其编码叶绿体转运肽,这种截短的核苷酸序列示出在SEQIDNO:134中。截短的CDPS基因可以适合新的ATG翻译起始位点并且与启动子可操作地连接,所述启动子通常为组成型启动子或高表达启动子。当将截短的编码序列的多个拷贝(包括但不限于1个拷贝、2个拷贝或3个拷贝)引入微生物中时,CDPS多肽由启动子表达导致朝向内部-贝壳杉烯生物合成提高的碳通量。表6.CDPS克隆。还可以使用CDPS-KS双功能蛋白质。表7中示出的编码CDPS-KS双功能酶的核苷酸序列被修饰用于在酵母中表达(参见,PCT申请No.PCT/US2012/050021,其通过引用整体并入本文)。还可以使用来自藤仓赤霉的双功能酶。表7.CDPS-KS克隆。因此,除了UGT74G1和UGT85C2基因外还含有CDPS基因、KS基因、KO基因和KAH基因的微生物不需要使用甜菊醇作为原料就能够产生甜菊醇单糖苷和覆盆子苷二者。在一些实施方案中,重组微生物还表达编码牻牛儿基牻牛儿基二磷酸合酶(GGPPS)的重组基因。合适的GGPPS多肽是已知的。例如,合适的GGPPS酶包括甜菊、藤仓赤霉、小鼠、假微型海链藻(Thalassiosirapseudonana)、棒状链霉菌、嗜酸热硫化叶菌(Sulfulobusacidocaldarius)、聚球藻属以及拟南芥所产生的那些。参见表8和以及PCT申请No.PCT/US2012/050021和PCT/US2011/038967,其通过引用整体并入本文。表8.GGPPS克隆。在一些方面,本发明的重组细胞中包含的编码SEQIDNO:11中所示KAH多肽的KAH基因过表达。在一个方面,KAH基因可存在(但不限于)1个、2个或3个拷贝。在一些方面,本发明重组细胞中包含的编码SEQIDNO:21中所示KS多肽的KS基因过表达。在一些方面,KS基因可存在(但不限于)1个、2个或3个拷贝。在一些实施方案中,重组微生物还可表达参与二萜生物合成或类萜前体产生的重组基因,例如下文中讨论的甲基赤藓糖醇4-磷酸(methylerythritol4-phosphate,MEP)途径中的基因或者甲羟戊酸(mevalonate,MEV)途径中的基因,所述重组基因具有降低的磷酸酶活性和/或表达如本文中所讨论的蔗糖合酶(sucrosesynthase,SUS)。莱鲍迪苷A、莱鲍迪苷D和莱鲍迪苷E生物合成多肽莱鲍迪苷A的生物合成涉及糖苷配基甜菊醇的葡糖基化。具体地,莱鲍迪苷A可以通过甜菊醇的13-OH的葡糖基化形成13-O-甜菊醇单糖苷、甜菊醇单糖苷之13-O-葡萄糖的C-2’的葡糖基化形成甜菊醇-1,2-二糖苷、甜菊醇-1,2-二糖苷之C-19羧基的葡糖基化形成甜菊苷、以及甜菊苷之C-13-O-葡萄糖的C-3’的葡糖基化以产生RebA来形成。各葡糖基化反应发生的顺序可以改变。参见图1。莱鲍迪苷E和/或莱鲍迪苷D的生物合成涉及糖苷配基甜菊醇的葡糖基化。具体地,莱鲍迪苷E可以通过甜菊醇的13-OH的葡糖基化形成甜菊醇-13-O-葡糖苷、甜菊醇13-O-葡糖苷之13-O-葡萄糖的C-2’的葡糖基化形成甜菊醇-1,2-二糖苷、1,2-二糖苷之C-19羧基的葡糖基化形成1,2-甜菊苷、以及1,2-甜菊苷之19-O-葡萄糖的C-2’的葡糖基化形成莱鲍迪苷E来形成。莱鲍迪苷D可以通过莱鲍迪苷E的C-13-O-葡萄糖之C-3’的葡糖基化来形成。各糖基化反应发生的顺序可以改变。例如19-O-葡萄糖的C-2’的葡糖基化可以是该途径的最后一个步骤,其中莱鲍迪苷A是该途径的中间体。参见图1。莱鲍迪苷M多肽如本文中提供的,重组宿主中甜菊醇转化成莱鲍迪苷M可通过表达以下功能性UGT的组合来实现:91D2、EUGT11、74G1、85C2和76G1。参见图1。特别有用的是使用高拷贝数质粒或使用强启动子或多重整合的基因拷贝或用于高拷贝数基因的选择下的附加体来高水平地表达EUGT11。因此,表达这些UGT的组合的重组微生物可产生莱鲍迪苷A(85C2;76G1;74G1;91D2e)、莱鲍迪苷D(85C2;76G1;74G1;91D2e;EUGT11)、莱鲍迪苷E(85C2;74G1;91D2e;EUGT11)或莱鲍迪苷M(85C2;76G1;74G1;91D2e;EUGT11)。参见图1。通常来说,这些基因中的一个或更多个是被转化到天然情况下不具备这些基因的微生物中的重组基因。还发现在本文中命名为SM12UGT的UGT可以替换成UGT91D2。通过重组细胞中UGT编码基因(参见图1)的不同拷贝数、不同启动子强度和/或使用对目的产物的特异性/活性提高的突变体,可实现个别莱鲍迪苷的定向产生。例如,如果与有利于莱鲍迪苷A形成的其他UGT相比EUGT11以低水平表达,则将形成低水平的莱鲍迪苷D、E和M。高EUGT11表达水平导致产生更多19-O1,2二葡糖苷,其可用作UGT76G1的底物以形成莱鲍迪苷M。在某些有利的实施方案中,本发明重组细胞中UGT76G1的额外拷贝或突变形式可提高由莱鲍迪苷D形成莱鲍迪苷M的速率。在一些实施方案中,UGT76G1催化甜菊醇和甜菊醇糖苷在19-O位的糖基化。因此,在一些实施方案中,在表达编码UGT76G1多肽的重组基因的重组宿主中通过生物转化或在体外通过UGT76G1的催化产生RebM、RebQ、RebI、二糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)或三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡萄糖基-3-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基]酯)中的一种或更多种。在一些实施方案中,UGT76G1催化甜菊醇和甜菊醇糖苷在13-O位糖基化,并且优先得使1,2-二糖基化的甜菊醇糖苷底物在13-O位或单糖基化的甜菊醇糖苷底物在13-O位糖基化。在一些实施方案中,UGT76G1并不对19-O位的糖基化状态表现出优先性。在一些方面,本发明的重组宿主细胞包含编码SEQIDNO:2中所示UGT76G1多肽的基因。在一些方面,包含在本发明重组细胞中的编码SEQIDNO:2中所示UGT76G1多肽的基因过表达。在一些方面,所述基因可存在(包括但不限于)2或3个拷贝。在一些实施方案中,编码SEQIDNO:2中所示UGT76G1多肽的基因存在1个拷贝。如图12(实施例9)中所示,低拷贝数(1个拷贝)的编码UGT76G1多肽的基因导致UGT76G1表达降低,并提高了莱鲍迪苷D/莱鲍迪苷M比例。在一些实施方案中,宿主中表达少于5种(例如,1种、2种、3种或4种)UGT。例如,当使用莱鲍迪苷A作为原料时,表达功能性EUGT11的重组微生物可以产生莱鲍迪苷D。当使用莱鲍迪苷D或莱鲍迪苷E作为原料时,表达功能性UGT76G1的重组微生物可产生莱鲍迪苷M。莱鲍迪苷M可通过莱鲍迪苷D或莱鲍迪苷E的19-O-葡萄糖的C-3’的葡糖基化由莱鲍迪苷D或莱鲍迪苷E形成,在莱鲍迪苷E的情况下,需要13-O-葡萄糖的第二葡糖基化以产生莱鲍迪苷M。当使用覆盆子苷或1,2-甜菊苷作为原料时,表达EUGT11、74G1或76G1、和91D2的重组微生物可产生莱鲍迪苷D或莱鲍迪苷M。作为另一个替选,当向培养基中添加单糖苷甜菊醇-13-O-糖苷时,表达EUGT11、74G1、76G1和91D2的重组微生物可产生莱鲍迪苷D或莱鲍迪苷M。类似地,在供给甜菊醇-19-O-糖苷时,甜菊醇-19-O-糖苷在重组微生物中转化为莱鲍迪苷D可以通过细胞中编码UGTEUGT11、85C2、76G1和91D2之基因的表达来实现。合适的UGT74G1和UGT85C2多肽包括在上文中讨论过的那些。合适的UGT76G1向接受体分子(甜菊醇1,2糖苷)的C-13-O-葡萄糖的C-3’添加葡萄糖部分。例如,UGT76G1作为尿苷5’-二磷酸葡糖基:甜菊醇13-O-1,2葡糖苷C-3’葡萄糖基转移酶和尿苷5’-二磷酸葡糖基:甜菊醇-19-O-葡萄糖、13-O-1,2二糖苷C-3’葡糖基转移酶起作用。功能性UGT76G1多肽还可催化糖基转移酶反应,所述反应利用含有葡萄糖以外的糖的甜菊醇糖苷底物,例如甜菊醇鼠李糖苷和甜菊醇木糖苷。参见图1。合适的UGT76G1多肽包括甜菊产生的和Richman等,2005,PlantJ.41:56-67中报道的那些。SEQIDNO:14中示出了编码经过优化用于在酵母菌中表达的甜菊UGT76G1多肽的核苷酸序列。另参见“功能同源物”部分中给出的UGT76G1变体。合适的EUGT11或UGT91D2多肽作为尿苷5’-二磷酸葡糖基:甜菊醇-13-O-葡糖苷转移酶(也称为甜菊醇-13-单葡糖苷1,2-糖基化酶)起作用,将葡萄糖部分转移至接受体分子甜菊醇-13-O-葡糖苷之13-O-葡萄糖的C-2’处。合适的EUGT11或UGT91D2多肽还作为尿苷5’-二磷酸葡糖基:覆盆子苷转移酶起作用,将葡萄糖部分转移至接受体分子覆盆子苷之13-O-葡萄糖的C-2’处,以产生甜菊苷。EUGT11多肽还可将葡萄糖部分转移至接受体分子覆盆子苷之19-O-葡萄糖的C-2’处,以产生19-O-1,2-二糖基化覆盆子苷(参见图1)。功能性EUGT11或UGT91D2多肽还可以催化利用除甜菊醇-13-O-葡糖苷和覆盆子苷以外的甜菊醇糖苷底物的反应。例如,功能性EUGT11多肽可以利用甜菊苷作为底物,将葡萄糖部分转移至19-O-葡萄糖残基的C-2’处从而产生莱鲍迪苷E(参见图1)。功能性EUGT11和UGT91D2多肽还可以利用莱鲍迪苷A作为底物,将葡萄糖部分转移至莱鲍迪苷A之19-O-葡萄糖残基的C-2’处从而产生莱鲍迪苷D。当反应在类似的条件(即,类似的时间、温度、纯度和底物浓度)下进行时,EUGT11可以以比野生型UGT91D2e(SEQIDNO:15)的相应速率快至少20倍的速率(例如,快至少25倍或至少30倍)将莱鲍迪苷A转化为莱鲍迪苷D。因此,在温度敏感性EUGT11稳定的条件下,在细胞内或体外的类似条件下,EUGT11产生与UGT91D2e相比更大量的RebD。此外,在使用覆盆子苷或甜菊苷作为底物时,功能性EUGT11表现出显著的C-2’19-O-二糖基化活性,而在在一些情况下使用这些底物时,UGT91D2e未检测到二糖基化活性。因此,可以通过甜菊醇糖苷底物特异性的差异来区分功能性EUGT11与UGT91D2e。功能性EUGT11或UGT91D2多肽不将葡萄糖部分转移至在C-13位处具有1,3-结合的葡萄糖的甜菊醇化合物,即,不发生葡萄糖部分转移至甜菊醇1,3-二糖苷和1,3-甜菊苷(RebG)。功能性EUGT11和UGT91D2多肽还可以从除尿苷二磷酸葡萄糖以外的供体转移糖部分。例如,功能性EUGT11或UGT91D2多肽可以充当尿苷5’-二磷酸D-木糖基:甜菊醇-13-O-葡糖苷转移酶,将木糖部分转移至接受体分子甜菊醇-13-O-葡糖苷之13-O-葡萄糖的C-2’处。作为另一实例,功能性EUGT11或UGT91D2多肽可以充当尿苷5’-二磷酸L-鼠李糖基:甜菊醇-13-O-葡糖苷转移酶,将鼠李糖部分转移至接受体分子甜菊醇-13-O-葡糖苷之13-O-葡萄糖的C-2’处。本文中描述了合适的EUGT11多肽,并且可以包括来自稻(Oryzasativa)的EUGT11多肽(GenBank登录号:AC133334;SEQIDNO:16)。例如,EUGT11多肽可以具有与SEQIDNO:16中所示氨基酸序列具有至少70%序列同一性(例如,至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性)的氨基酸序列。在SEQIDNO:17中示出了编码EUGT11之氨基酸序列的核苷酸序列,以及用于在酵母中表达的密码子优化的核苷酸序列(SEQIDNO:18)。合适的功能性UGT91D2多肽包括例如本文中描述的命名为UGT91D2e和UGT91D2m的多肽及其功能同源物。SEQIDNO:15中示出了来自甜菊的示例性UGT91D2e多肽的氨基酸序列,以及经过密码子优化用于在酵母中表达的编码UGT91D2e多肽的核苷酸序列(SEQIDNO:89)。PCT申请No.PCT/US2012/050021(其通过引用整体并入本文)的SEQIDNO:10中示出了来自甜菊的示例性UGT91D2m多肽的氨基酸序列(SEQIDNO:86)。另外,还可以使用在第206、207和343位氨基酸残基处包含替换的UGT91D2变体。例如,可以使用相对于野生型UGT92D2e具有以下突变的氨基酸序列:G206R、Y207C和W343R。另外,还可以使用在第211和286位氨基酸残基处包含替换的UGT91D2变体。例如,UGT91D2变体可以包括第211位处的甲硫氨酸替换为亮氨酸和第286位处的丙氨酸替换为缬氨酸(也称为UGT91D2e-b)。这些变体L211M和V286A是来自PCT/US2012/050021的SEQIDNO:5的变体,其在本文中公开为SEQIDNO:66。另外的变体可包括PCT/US2012/050021的表12和实施例11中描述的变体(除T144S、M152L、L213F、S364P和G384C变体外),其通过引用整体并入本文。如上文中所表明的,在本文中命名为SM12UGT的UGT可以替换为UGT91D2。合适的功能性SM12UGT多肽包括圆叶牵牛(Ipomoeapurpurea)(日本牵牛花)产生的和Morita等.2005,PlantJ.42,353-363中所述的那些。编码圆叶牵牛IP3GGT多肽的氨基酸序列(SEOIDNO:67)(在PCT申请No.PCT/US2012/050021中示出,其通过引用整体并入本文),经过密码子优化用于在酵母中表达的编码所述多肽的核苷酸序列(SEOIDNO:68)。另一种合适的SM12UGT多肽是具有R25S突变的UGT94B1多肽(Bp94BN1多肽)。参见Osmani等.2008,PlantPhys.148:1295-1308(2008)和Sawada等,2005,J.Biol.Chem.280:899-906。PCT申请No.PCT/US2012/050021中示出了雏菊(Beilisperennis)(红色雏菊)UGT94B1的氨基酸序列(SEQIDNO:69),以及经过密码子优化用于在酵母中表达的核苷酸序列(SEQIDNO:70),其通过引用整体并入本文。在一些实施方案中,为了生产莱鲍迪苷M,将重组微生物培养在含有甜菊醇-13-O-葡糖苷或甜菊醇-19-O-葡糖苷的培养基上。在这样的一些实施方案中,微生物含有并表达编码功能性EUGT11、功能性UGT74G1、功能性UGT85C2、功能性UGT76G1和功能性UGT91D2的基因,并且能够在使用甜菊醇、甜菊醇单糖苷或覆盆子苷中之一或二者作为原料时依赖于UDP-糖基转移酶活性的相对水平累积莱鲍迪苷A、莱鲍迪苷D、莱鲍迪苷M或其组合。在另一些实施方案中,为了生产莱鲍迪苷A、D或M,将重组微生物培养在含有覆盆子苷的培养基上。在这样的一些实施方案中,微生物含有并表达编码功能性EUGT11、功能性UGT76G1和功能性UGT91D2的基因,并且能够在使用覆盆子苷作为原料时根据UDP-糖基转移酶活性的相对水平产生莱鲍迪苷A、D和/或M或其组合。在另一些实施方案中,重组微生物表达参与甜菊醇生物合成的基因,例如CDPS基因、KS基因、KO基因和/或KAH基因。因此,例如,除了EUGT11、UGT74G1、UGT85C2、UGT76G1和功能性UGT91D2(例如,UGT91D2e)外,还含有CDPS基因、KS基因、KO基因和KAH基因的微生物不需要在培养基中包含甜菊醇即能够产生莱鲍迪苷A、D、E和/或M。在一些实施方案中,为了提供提高水平的二萜前体牻牛儿基牻牛儿基二磷酸,所述重组宿主还含有并表达重组GGPPS基因,以便提高经甜菊醇生物合成途径的流量。在一些实施方案中,所述重组宿主还含有构建体以沉默消耗牻牛儿基牻牛儿基二磷酸、内部-异贝壳杉烯酸或法尼基焦磷酸的非甜菊醇途径的表达,从而提供提高的经甜菊醇和甜菊醇糖苷生物合成途径的流量。如下文中讨论的,可以通过下调ERG9基因来降低向产生固醇途径(例如麦角固醇)的流量。在产生赤霉素的细胞中,可以下调赤霉素合成来提高内部-异贝壳杉烯酸到甜菊醇的流量。在产生类胡萝卜素的生物中,通过下调一个或更多个类胡萝卜素生物合成基因可以提高到甜菊醇的流量。在一些实施方案中,重组微生物还可以表达参与二萜生物合成或者类萜前体产生的重组基因,例如在下文中讨论的MEP或MEV途径中的基因,所述重组微生物具有降低的磷酸酶活性,和/或表达在下文中讨论的SUS。本领域技术人员将理解,通过调节不同UGT基因的相对表达水平,可以使重组宿主适合特异地以期望比例产生甜菊醇糖苷产物。甜菊醇生物合成基因和甜菊醇糖苷生物合成基因的转录调节可以利用本领域技术人员已知的技术将转录的活化与抑制相组合来实现。就体外反应而言,本领域技术人员可以认识到,添加不同水平的UGT酶组合或者在影响组合中不同UGTS相对活性的条件下,会使合成朝向每种甜菊醇糖苷按照期望比例的方向进行。本领域技术人员将理解,可以使用与13-O-葡糖苷反应(底物莱鲍迪苷A和甜菊苷)相比对19-O-葡糖苷反应具有更高活性的二糖基化酶获得更高比例的莱鲍迪苷D或M或者更高效地转化为莱鲍迪苷D或M。在一些实施方案中,重组宿主(例如微生物)产生富含莱鲍迪苷M的甜菊醇糖苷组合物,其含有占甜菊醇糖苷总重量的大于至少3%的莱鲍迪苷M,例如至少4%的莱鲍迪苷M、至少5%的莱鲍迪苷M、10%至20%的莱鲍迪苷M、20%至30%的莱鲍迪苷M、30%至40%的莱鲍迪苷D、40%至50%的莱鲍迪苷M、50%至60%的莱鲍迪苷M、60%至70%的莱鲍迪苷M、或至少70%至80%莱鲍迪苷M。其他存在的甜菊醇糖苷可能包括图1中示出的那些,例如甜菊醇单糖苷、甜菊醇葡糖二糖苷、莱鲍迪苷A、莱鲍迪苷D、莱鲍迪苷E和甜菊苷。在一些实施方案中,可以进一步纯化宿主(例如微生物)产生的富含莱鲍迪苷M的组合物,然后可以将这样纯化的莱鲍迪苷M与其他甜菊醇糖苷、矫味剂或甜味剂混合从而得到期望的矫味体系或甜味组合物。例如,可以将重组宿主产生的富含莱鲍迪苷M的组合物与不同重组微生物产生的富含莱鲍迪苷A、C、D或E的组合物,与从甜菊提取物纯化的莱鲍迪苷A、C、D或E,或者与在体外产生的莱鲍迪苷A、C、D或E组合。在一些实施方案中,可以在提供合适的UDP糖和/或用于UDP糖再生的无细胞系统同时使用体外方法来生产莱鲍迪苷M。在一些实施方案中,可以在反应容器中提供蔗糖和蔗糖合酶以由糖基化反应期间产生的UDP再生UDP-葡萄糖。蔗糖合酶可以来自任何合适的生物。例如,可以将编码来自拟南芥、甜菊或小果咖啡之序列的蔗糖合酶在合适的启动子的控制下克隆入表达质粒中,并在宿主(例如微生物或植物)中表达。需要多个反应的转化可以一起进行,或者分步进行。例如,莱鲍迪苷M可以由作为富集提取物市售的莱鲍迪苷D或莱鲍迪苷E生产或者通过生物合成生产,其中添加化学计量之量的或过量的UDP-葡萄糖和UGT76G1。作为替选,可以使用EUGT11和合适的UGT76G1酶由富含甜菊苷和莱鲍迪苷A的甜菊醇糖苷提取物生产莱鲍迪苷D和莱鲍迪苷M。在一些实施方案中,使用磷酸酶来除去次级产物并提高反应产率。UGT和其他用于体外反应的酶可以以可溶性形式或固定化形式提供。在一些实施方案中,可以使用供给包含前体分子例如甜菊醇和/或甜菊醇糖苷之原料(包括来自植物提取物的甜菊醇糖苷的混合物)的全细胞来生产莱鲍迪苷M。所述原料可以在细胞生长期间或细胞生长之后供给。所述全细胞可以是悬浮的或固定化的。所述全细胞可以截留在珠中,例如藻酸钙珠或藻酸钠珠。所述全细胞可以与中空纤维管反应器系统相连。所述全细胞可以浓缩并截留在膜反应器系统中。所述全细胞可以在发酵液中或者在反应缓冲液中。可使用类似方法来发酵重组细胞。在一些实施方案中,使用通透剂(permeabilizingagent)来使底物高效转移入细胞中。在一些实施方案中,使用溶剂(例如甲苯)或去污剂(例如Triton-X或Tween)来使细胞通透化。在一些实施方案中,使用表面活性剂来使细胞通透化,所述表面活性剂例如阳离子表面活性剂,例如十六烷基三甲基溴化铵(CTAB)。在一些实施方案中,用周期性机械冲击(例如电穿孔或轻微渗透冲击)来使细胞通透化。所述细胞可以含有一种重组UGT或多种重组UGT。例如,所述细胞可含有UGT76G1、91D2e、85C2、74G1和EUGT11,使得甜菊醇和甜菊醇糖苷的混合物高效地转化为莱鲍迪苷M。在一些实施方案中,所述全细胞是下文中所述的宿主细胞。在一些实施方案中,所述全细胞是革兰氏阴性菌例如大肠杆菌。在一些实施方案中,所述全细胞是革兰氏阳性菌,例如芽孢杆菌属(Bacillus)。在一些实施方案中,所述全细胞是真菌物种,例如曲霉菌(Aspergillus),或酵母例如酵母属(Saccharomyces)。在一些实施方案中,术语“全细胞生物催化”用于指如下过程:其中按照如上所述培养全细胞(例如,在培养基中并且任选地通透化),提供底物例如莱鲍迪苷D、莱鲍迪苷E或甜菊苷,并使用来自细胞的酶转化成终产物。所述细胞可以是活的或者可以不是活的,并且在生物转化反应期间可以生长或者可以不生长。相比之下,在发酵中,将细胞培养在生长培养基中,并供给碳和能量源例如葡萄糖,并且用活细胞产生终产物。C.其他多肽还可向重组宿主中导入其表达有利于更高效或更大规模地产生甜菊醇或甜菊醇糖苷的另外多肽的基因。例如,重组微生物、植物或植物细胞还可包含一个或更多个编码牻牛儿基牻牛儿基焦磷酸合酶(GGPPS,也称为GGDPS)的基因。作为另一个实例,重组宿主可包含一个或更多个编码鼠李糖合成酶的基因,或一个或更多个编码UDP-葡萄糖脱氢酶和/或UDP-葡萄糖醛酸脱羧酶的基因。作为另一个实例,重组宿主可包含一个或更多个编码细胞色素P450还原酶(CPR)的基因。重组CPR的表达促进NADP+的循环以再生NADPH,而NADPH用作萜类化合物生物合成的辅因子。还可使用其他方法来再生NADHP水平。在其中NADPH变得有限的情况下,例如,可将菌株进一步改造成包含外源转氢酶基因。参见,例如,Sauer等,2004,J.Biol.Chem.279:6613-6619。减小或以其他方式改变NADH/NADPH的比例使得期望的辅因子水平得以提高的其他方法是本领域技术人员已知的。作为另一个实例,重组宿主可包含一个或更多个编码蔗糖合酶的基因,并且另外地可包含蔗糖摄取基因(如有期望的话)。可使用蔗糖合酶反应来在发酵宿主或在全细胞生物转化工艺中提高UDP-葡萄糖库。这样由在糖基化期间产生的UDP和蔗糖再生UDP-葡萄糖从而允许高效的糖基化。在一些生物中,破坏内源转化酶有利于防止蔗糖降解。例如,可破坏酿酒酵母(S.cerevisiae)SUC2转化酶。蔗糖合酶(sucrosesynthase,SUS)可来自任何合适的生物。例如,可将来自但不限于拟南芥(A.thaliana)、甜菊(S.rebaudiana)或小果咖啡(C.arabica)蔗糖合酶编码序列克隆到受控于合适启动子的表达质粒中并在宿主(例如,微生物或植物)中表达。将蔗糖合酶在这样的菌株中与蔗糖转运蛋白(例如,拟南芥SUC1转运蛋白或其功能同源物)和一种或更多种UGT(例如,UGT85C2、UGT74G1、UGT76G1和UGT91D2e、EUGT11或其功能同源物)组合表达。在包含蔗糖的培养基中培养宿主可促进UDP-葡萄糖以及一种或更多种糖苷(例如,甜菊醇糖苷)的产生。还可降低宿主细胞中编码角鲨烯合酶(squalenesynthase,SQS)的ERG9基因的表达,从而使重组宿主中聚集角鲨烯合酶的前体。SQS归类于EC2.5.1.21之下并且是导致固醇产生的生物合成途径中的第一种定型酶(committedenzyme)。SQS催化由法尼基焦磷酸经由中间体前角鲨烯焦磷酸合成角鲨烯,其中两个法尼基焦磷酸单元转化成角鲨烯。该酶是萜类化合物/类异戊二烯生物合成中的分支点酶并且被认为调节异戊二烯中间体经由固醇途径的通量。有时将该酶称为法尼基二磷酸法尼基转移酶(farnesyl-diphosphatefarnesyltransferase,FDFT1)。此外,重组宿主可具有如本文中所讨论的降低的磷酸酶活性。MEP生物合成多肽作为另一个实例,重组宿主可包含一个或更多个编码MEP途径或甲羟戊酸途径中的一种或更多种酶的基因。这样的基因是有用的因为他们可提高碳进入二萜生物合成途径的通量,从而由通过该途径所产生的异戊烯基二磷酸和二甲基烯丙基二磷酸产生牻牛儿基牻牛儿基二磷酸。如此产生的牻牛儿基牻牛儿基二磷酸由于甜菊醇生物合成多肽和甜菊醇糖苷生物合成多肽的表达可定向于甜菊醇和甜菊醇糖苷生物合成。参见,例如,Brandle等,2007,Phytochemistry68:1855-1863。在一些实施方案中,重组宿主细胞可包含一个或更多个编码参与用于类异戊二烯生物合成之甲基赤藓糖4-磷酸(MEP)途径的酶的基因。MEP途径中的酶包括脱氧木酮糖5-磷酸合酶(DXS)、D-1-脱氧木酮糖5-磷酸还原异构酶(DXR)、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇合酶(CMS)、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇激酶(CMK)、4-二磷酸胞苷-2-C-甲基-D-赤藓糖醇2,4-环二磷酸合酶(MCS)、1-羟基-2-甲基-2(E)-丁烯基4-二磷酸合酶(HDS)以及1-羟基-2-甲基-2(E)-丁烯基4-二磷酸还原酶(HDR)。可向重组微生物中导入一个或更多个DXS基因、DXR基因、CMS基因、CMK基因、MCS基因、HDS基因和/或HDR基因。参见,Rodríguez-ConcepciónandBoronat,PlantPhys.130:1079-1089(2002)。编码DXS、DXR、CMS、CMK、MCS、HDS和/或HDR多肽的合适基因包括通过大肠杆菌、拟南芥和聚球藻(Synechococcusleopoliensis)产生的那些。编码DXR多肽的核苷酸序列(例如,SEQIDNO:71)在例如美国专利No.7,335,815中进行了描述。甲羟戊酸生物合成多肽酿酒酵母包含编码用于类异戊二烯合成之功能甲羟戊酸途径的酶的内源基因。在一些实施方案中,重组宿主还包含一个或更多个编码参与甲羟戊酸途径的酶的异源基因。适用于被转化到宿主中的基因编码甲羟戊酸途径中的酶,例如截短的3-羟基-3-甲基-戊二酸单酰(HMG)-CoA还原酶(tHMG),和/或编码甲羟戊酸激酶(MK)的基因,和/或编码磷酸甲羟戊酸激酶(PMK)的基因,和/或编码甲羟戊酸焦磷酸脱羧酶(MPPD)的基因。因此,可向重组宿主(例如微生物)中掺入一个或更多个HMG-CoA还原酶基因、MK基因、PMK基因和/或MPPD基因。编码甲羟戊酸途径多肽的合适基因是已知的。例如,合适的多肽包括通过大肠杆菌、脱氮副球菌(Paracoccusdenitrificans)、酿酒酵母、拟南芥、灰北里孢菌(Kitasatosporagriseola)、人(Homosapiens)、黑腹果蝇(Drosophilamelanogaster)、鸡(Gallusgallus)、链霉菌属KO-3988、渐窄叶烟草(Nicotianaattenuate)、灰北里孢菌、巴西橡胶树(Heveabrasiliensis)、屎肠球菌(Enterococcusfaecium)以及雨生红球藻(Haematococcuspluvialis)产生的那些。参见,例如,表9;美国专利No.7,183,089、5,460,949和5,306,862;和PCT申请No.PCT/US2012/050021和PCT/US2011/038967,其通过引用整体并入文本。表9HMGCoA还原酶以及其他甲羟戊酸基因的来源蔗糖合酶多肽蔗糖合酶(SUS)可用作用于产生UDP-糖(特别是UDP-葡萄糖)的工具。SUS(EC2.4.1.13)催化由蔗糖和UDP形成UDP-葡萄糖和果糖。因此,在蔗糖存在下SUS可将通过UGT之反应产生的UDP转化为UDP-葡萄糖。参见,例如Chen等,2001,J.Am.Chem.Soc.123:8866-8867;Shao等,2003,Appl.Env.Microbiol.69:5238-5242;Masada等,2007,FEBSLett.581:2562-2566;和Son等,2009,J.Microbiol.Biotechnol.19:709-712。蔗糖合酶可用于产生UDP-葡萄糖并去除UDP,从而有利于多种系统中的化合物被高效糖基化。例如,可通过导入蔗糖转运蛋白和SUS来将缺乏利用蔗糖之能力的酵母改造成在蔗糖上生长。例如,酿酒酵母没有高效的蔗糖摄取系统并且依靠胞外SUC2来利用蔗糖。将破坏内源酿酒酵母SUC2转化酶和表达重组SUS相组合产生能够代谢胞内蔗糖而非胞外蔗糖的酵母菌株(Riesmeieretal.,1992,EMBOJ.11:4705-4713)。该菌株用于通过用cDNA表达文库转化并选择已获得蔗糖摄取能力的转化子来分离蔗糖转运蛋白。重组蔗糖合酶和蔗糖转运蛋白在体内的组合表达可导致UDP-葡萄糖的利用率提高并去除不想要的UDP。例如,重组蔗糖合酶、蔗糖转运蛋白和糖基转移酶的功能性表达与敲除天然蔗糖降解系统(SUC2,在酿酒酵母的情况下)之组合可用于产生能够产生提高量的糖基化化合物(例如甜菊醇糖苷)的细胞。这种较高的糖基化能力归因于至少(a)以较高能量高效的方式产生UDP-葡萄糖的较高能力和(b)UDP被从生长培养基除去,因为UDP可抑制糖基化反应。蔗糖合酶可来自任何合适的生物。例如,来自但不限于拟南芥(例如,SEQIDNO:79或80)或小果咖啡(例如,SEQIDNO:81)(参见,PCT/US2012/050021的SEQIDNO:178、179和180,其通过引用整体并入文本)的蔗糖合酶编码序列包括来自拟南芥之蔗糖转运蛋白SUC1的氨基酸序列(SEQIDNO:80)和来自咖啡之蔗糖合酶的氨基酸序列(SEQIDNO:81)。蔗糖合酶可来自任何合适的生物。例如,可将来自但不限于拟南芥、甜菊或小果咖啡的蔗糖合酶编码序列(参见例如,SEQIDNO:79-81)克隆到受控于合适载体的表达质粒中并在宿主(例如,微生物或植物)中表达。可将SUS编码序列在SUC2(蔗糖水解酶)缺陷型酿酒酵母菌株中表达以避免酵母胞外蔗糖被酵母降解。可将蔗糖合酶在这样的菌株中与蔗糖转运蛋白(例如,拟南芥SUC1转运蛋白或其功能同源物)和一种或更多种UGT(例如,UGT85C2、UGT74G1、UGT76G1、EUGT11和UGT91D2e或其功能同源物)组合表达。在包含蔗糖的培养基培养宿主可促进UDP-葡萄糖以及一种或更多种葡糖苷(例如,甜菊醇糖苷)的产生。应指出,在一些情况下,可将蔗糖合酶和蔗糖转运蛋白与UGT一起在用于产生特定化合物(例如,甜菊醇)之也是重组的宿主细胞中表达。调节ERG9基因的表达可使用核酸构建体来在本文中所述的重组宿主中改变内源ERG9基因的表达。所述构建体可包含两个分别与ERG9启动子或ERG9开放阅读框(ORF)5’端内的基因组序列部分同源的区域。所述构建体还可包含启动子,例如野生型ScKex2或野生型ScCyc1,并且所述启动子还可在其3’端包含异源插入片段,例如发夹。由该ORF编码的多肽有利地与角鲨烯合酶(EC2.5.1.21)或其生物活性片段具有至少70%的同一性,所述片段与所述角鲨烯合酶在至少100个氨基酸的重叠范围内具有至少70%的序列同一性。参见例如PCT/US2012/050021(出于所有目的而整体并入文本)。所述异源插入片段可适合具有发夹环的发夹二级结构元件。所述异源插入序列具有通式(I):-X1-X2-X3-X4-X5,其中X2包含与X4的至少4个连续核苷酸互补并与其形成发夹二级结构元件的至少4个连续核苷酸,并且X3是任选的,并且如果存在的话包含参与形成X2与X4之间的发夹环的核苷酸,并且X1和X5分别地且任选地包含一个或更多个核苷酸,并且X2和X4可分别由任意合适数目的核苷酸组成,只要X2的至少4个核苷酸的连续序列与X4的至少4个核苷酸的连续序列互补即可。在一些实施方案中,X2和X4由相同数目的核苷酸组成。所述异源插入片段足够长从而允许完成发夹,但也足够短从而允许框内和紧邻异源插入片段3’存在的ORF的翻译受限。通常来说,所述异源插入片段的长度为10至50个核苷酸,例如长度为10至30个核苷酸、15至25个核苷酸、17至22个核苷酸、18至21个核苷酸、18至20个核苷酸,或19个核苷酸。如本文中所提供的:X2可例如由4至25个核苷酸(例如4至20个、4至15个、6至12个、8至12个、9至11个核苷酸)组成。X4可例如由4至25个核苷酸(例如4至20个、4至15个、6至12个、8至12个、9至11个核苷酸)组成。在一些实施方案中,X2由与X4的核苷酸序列互补的核苷酸序列组成,X2的所有核苷酸均与X4的核苷酸序列互补。X3可不存在,即,X3可由零个核苷酸组成。还可能的是X3由1至5个核苷酸(例如1至3个核苷酸)组成。X1可不存在,即,X1可由零个核苷酸组成。还可能的是X1由1至25个核苷酸(例如1至20、1至15、1至10、1至5或1至3个核苷酸)组成。X5可不存在,即,X5可由零个核苷酸组成。还可能的是X5由1至5个核苷酸(例如1至3个核苷酸)组成。所述异源插入片段可以是满足本文中所限定的要求的任意合适序列。例如,所述异源插入片段可包含tgaattcgttaacgaattc(SEQIDNO:82)、tgaattcgttaacgaactc(SEQIDNO:83)、tgaattcgttaacgaagtc(SEQIDNO:84)或tgaattcgttaacgaaatt(SEQIDNO:85)。不受特定机制的限制,通过至少部分地在空间上阻碍核糖体与RNA的结合由此降低角鲨烯合酶的翻译来降低ERG9表达。因此,例如可降低功能性角鲨烯合酶(EC2.5.1.21)的翻译速率。使用这样的构建体还可降低法尼基焦磷酸向角鲨烯的转换和/或增强选自以下的化合物的累积:法尼基-焦磷酸、异戊烯基-焦磷酸、二甲基烯丙基-焦磷酸、牻牛儿基-焦磷酸和牻牛儿基牻牛儿基-焦磷酸。在一些情况下,当培养本文中所述的重组宿主时可有利地包含角鲨烯合酶抑制剂。角鲨烯合酶的化学抑制(例如,通过拉帕司他(lapaquistat)的化学抑制)是本领域中已知的。其他的角鲨烯合酶抑制剂包括萨拉哥酸(Zaragozicacid)和RPR107393。因此,在一个实施方案中,在角鲨烯合酶抑制剂的存在下进行本文中所限定方法的培养步骤。在一些实施方案中,本文中所述的重组宿主包含ERG9开放阅读框中的突变。在一些实施方案中,本文中所述的重组宿主包含ERG9[Δ]::HIS3缺失/插入等位基因。D.功能同源物上述多肽的功能同源物也适用于在重组宿主中产生甜菊醇或甜菊醇糖苷。功能同源物是与参照多肽具有序列相似性并且行使参照多肽的一项或更多项生化或物理功能的多肽。功能同源物和参照多肽可以是天然存在的多肽,并且序列相似性可由收敛性或发散性进化事件引起。因此,功能同源物有时在文献中被命名为同源物或直向同源物(ortholog)或旁系同源物(paralog)。天然存在功能同源物的变体(例如由野生型编码序列的突变体编码的多肽)本身也可以是功能同源物。功能同源物还可通过对多肽的编码序列进行定点诱变或者通过组合来自不同天然存在多肽的编码序列的结构域(“结构域交换”)产生。用于修饰编码本文中所述之功能UGT多肽的基因的技术已知的并且包括尤其是定向进化技术、定点诱变技术和随机诱变技术,并且可用于以期望的方式提高多肽的比活、改变底物特异性、改变表达水平、改变亚细胞定位或者修饰多肽:多肽相互作用。认为这样的经修饰多肽是功能同源物。术语“功能同源物”有时适用于编码功能上同源的多肽的核酸。可通过进行核苷酸分析和多肽序列比对来鉴定功能同源物。例如,对核苷酸或多肽序列数据库进行查询可鉴定甜菊醇或甜菊醇糖苷生物合成多肽的同源物。序列分析可包括使用GGPPS、CDPS、KS、KO或KAH氨基酸序列作为参照序列对非冗余数据库进行BLAST、ReciprocalBLAST或PSI-BLAST分析。在一些情况下,氨基酸序列由核苷酸序列推导出。数据库中序列同一性大于40%的那些多肽是用于进一步评价其作为甜菊醇或甜菊醇糖苷生物合成多肽的适合性的候选多肽。氨基酸序列相似性允许保守的氨基酸替换,例如将一个疏水残基替换成另一个,或者将一个极性残基替换成另一个。如果期望的话,可以对这类候选多肽进行人工检查,以便缩小需要进一步评价的候选多肽的数量。人工检查可通过选择看来具有甜菊醇生物合成多肽中存在的结构域(例如保守的功能结构域)的那些候选多肽来进行。可通过定位甜菊醇或甜菊醇糖苷生物合成多肽的一级氨基酸序列中的区域来鉴定保守区,所述区域是重复序列、形成一些二级结构(例如螺旋和β折叠)、建立带正电或带负电的结构域或代表蛋白质模体或结构域。参见例如互联网上描述多种蛋白质模体和结构域之共有序列的Pfam网站,sanger.ac.uk/Software/Pfam/和pfam.janeIia.org/。Pfam数据库中包含的信息在Sonnhammer等,Nucl.AcidsRes.,26:320-322(1998);Sonnhammer等,Proteins,28:405-420(1997);以及Bateman等,Nucl.AcidsRes.,27:260-262(1999)中进行了描述。还可通过将来自紧密相关物种的相同或相关多肽的序列进行比对来确定保守区。紧密相关的物种优选来自同一家族。在一些实施方案中,对来自两个不同物种的序列进行比对就足够了。通常来说,表现出至少约40%氨基酸序列同一性的多肽可用于鉴定保守区。相关多肽的保守区表现出至少45%的氨基酸序列同一性(例如,至少50%、至少60%、至少70%、至少80%或至少90%的氨基酸序列同一性)。在一些实施方案中,保守区表现出至少92%、94%、96%、98%或99%的氨基酸序列同一性。例如,适用于在重组宿主中产生甜菊醇糖苷的多肽包括EUGT11(SEQIDNO:16)、UGT91D2e(SEQIDNO:15)、UGT91D2m(SEQIDNO:86)、UGT85C(SEQIDNO:26)和UGT76G(SEQIDNO:2)的功能同源物。这样的同源物与本文或PCT申请No.PCT/US2012/050021中公开的EUGT11、UGT91D2e、UGT91D2m、UGT85C或UGT76G的氨基酸序列具有大于90%(例如,至少95%或99%)的序列同一性,所述PCT申请通过引用整体并入文本。EUGT11、UGT91D2、UGT85C和UGT76G多肽变体通常在一级氨基酸序列中具有10个或更少的氨基酸替换,例如7个或更少的氨基酸替换、5个或保守的氨基酸替换、或1至5个替换。但在一些实施方案中,EUGT11、UGT91D2、UGT85C和UGT76G多肽变体可以含有10个或更多个氨基酸替换(例如10、15、20、25、30、35、10-20、10-35、20-30或25-35个氨基酸替换)。替换可以是保守的,或者在一些实施方案中,是非保守的。UGT91D2e多肽中的非保守改变的非限制性实例包括甘氨酸至精氨酸和色氨酸至精氨酸。UGT76G多肽中的非保守替换的非限制性实例包括缬氨酸至谷氨酸、甘氨酸至谷氨酸、谷氨酰胺至丙氨酸和丝氨酸至脯氨酸。UGT85C多肽中的改变的非限制性实例包括组氨酸至天冬氨酸、脯氨酸至丝氨酸、赖氨酸至苏氨酸和苏氨酸至精氨酸。在一些实施方案中,可用UGT91D2同源物可具有在该多肽之预测环外部的区域中的氨基酸替换,例如20-26、39-43、88-95、121-124、142-158、185-198和203-214位残基是91D2e(参见SEQIDNO:15)的N端结构域中的预测环,而381-386位残基是91D2e(参见SEQIDNO:15)的C端结构域中的预测环。例如,可用的UGT91D2同源物可包含在第1-19位、第27-38位、第44-87位、第96-120位、第125-141位、第159-184位、第199-202位、第215-380位或第387-473位残基处的至少一个氨基酸替换。在一些实施方案中,UGT91D2同源物可具有在选自第30、93、99、122、140、142、148、153、156、195、196、199、206、207、211、221、286、343、427和438位残基的一个或更多个残基处的氨基酸替换。例如,UGT91D2功能同源物可具有在第206位、第207位和第343位残基中的一个或更多个残基处含有氨基酸替换,例如第206位残基处的精氨酸、第207位处的半胱氨酸和第343位处的精氨酸。UGT91D2的其他功能同源物可具有下列中的一个或更多个:第30位残基处的酪氨酸或苯丙氨酸、第93位残基处的脯氨酸或谷氨酰胺、第99位残基处的丝氨酸或缬氨酸、第122位残基处的酪氨酸或苯丙氨酸、第140位残基处的组氨酸或酪氨酸、第142位残基处的丝氨酸或半胱氨酸、第148位残基处的丙氨酸或苏氨酸、第152位残基处的甲硫氨酸、第153位残基处的丙氨酸、第156位残基处的丙氨酸或丝氨酸、第162位残基处的甘氨酸、第195位残基处的亮氨酸或甲硫氨酸、第196位残基处的谷氨酸、第199位残基处的赖氨酸或谷氨酸、第211位残基处的亮氨酸或甲硫氨酸、第213位残基处的亮氨酸、第221位残基处的丝氨酸或苯丙氨酸、第253位残基处的缬氨酸或异亮氨酸、第286位残基处的缬氨酸或丙氨酸、第427位残基处的赖氨酸或天冬酰胺、第438位残基处的丙氨酸和第462位残基处的丙氨酸或苏氨酸。在另一个实施方案中,UGT91D2功能同源物包含第211位残基处的甲硫氨酸和第286位残基处的丙氨酸。在一些实施方案中,可用的UGT85C同源物可具有在第9、10、13、15、21、27、60、65、71、87、91、220、243、270、289、298、334、336、350、368、389、394、397、418、420、440、441、444和471位残基处的一个或更多个氨基酸替换。可用UGT85C同源物的非限制性实例包括具有以下替换(相对于SEQIDNO:26)的多肽:第65位残基(例如,第65位残基处的丝氨酸)处的替换;第65位残基与第15(第15位残基处的亮氨酸)、270(例如,第270位残基处的甲硫氨酸、精氨酸或丙氨酸)、418(例如,第418位残基处的缬氨酸)、440(例如,第440位残基处的天冬氨酸)或441(例如,第441位残基处的天冬酰胺)位残基组合处的替换;第13(例如,第13位残基处的苯丙氨酸)、15、60(例如,第60位残基处的天冬氨酸)、270、289(例如,第289位残基处的组氨酸)和418位残基;第13、60和270位残基处的替换;第60和87(例如,第87位残基处的苯丙氨酸)位残基处的替换;第65、71(例如,第71位残基处的谷氨酰胺)、220(例如,第220位残基处的甲硫氨酸)、243(例如,243位残基处的色氨酸)和270位处的替换;位于第65、71、220、243、270和441位残基处的替换;第65、71、220、389(例如,第389位残基处的缬氨酸)和394(例如,第394位残基处的缬氨酸)位残基处的替换;第65、71、270和289位残基处的替换;第220、243、270和334(例如,第334位残基处的丝氨酸)位残基处的替换;或第270和289位残基处的替换。以下氨基酸突变不导致85C2多肽活性的丧失:V13F、F15L、H60D、A65S、E71Q、I87F、K220T、R243W、T270M、T270R、Q289H、L334S、A389V、I394V、P397S、E418V、G440D和H441N。在活性克隆中观察到的另外突变包括K9E、K10R、Q21H、M27V、L91P、Y298C、K350T、H368R、G420R、L431P、R444G和M471T。在一些实施方案中,UGT85C2包含在第65(例如,丝氨酸)、71(谷氨酰胺)、270(甲硫氨酸)、289(组氨酸)和389(缬氨酸)位的替换。在一些实施方案中,可用的UGT76G1同源物(SEQIDNO:2)可具有在第29、74、87、91、116、123、125、126、130、145、192、193、194、196、198、199、200、203、204、205、206、207、208、266、273、274、284、285、291、330、331、以及346位残基处的一个或更多个氨基酸替换(参见表10)。可用的UGT76G1同源物的非限制性实例包括具有在以下残基处的替换的多肽:第74、87、91、116、123、125、126、130、145、192、193、194、196、198、199、200、203、204、205、206、207、208和291位残基;第74、87、91、116、123、125、126、130、145、192、193、194、196、198、199、200、203、204、205、206、207、208、266、273、274、284、285和291位残基;或第74、87、91、116、123、125、126、130、145、192、193、194、196、198、199、200、203、204、205、206、207、208、266、273、274、284、285、291、330、331和346位残基。参见表10。表10用于改变例如EUGT11或UGT91D2e的底物特异性的方法是本领域技术人员已知的,并且包括但不限于定点/合理诱变方法、随机定向进化方法以及其中在酶的活性位点附近进行随机诱变/饱和技术的组合。例如参见SarahA.Osmani等.Phytochemistry70(2009)325-347。候选序列的长度通常是参照序列长度的80%至200%,例如参照序列长度的82%、85%、87%、89%、90%、93%、95%、97%、99%、100%、105%、110%、115%、120%、130%、140%、150%、160%、170%、180%、190%或200%。功能同源物多肽的长度通常是参照序列长度的95%至105%,例如参考序列长度的90%、93%、95%、97%、99%、100%、105%、110%、115%或120%,或之间的任意范围。可如下确定任意候选核酸或多肽相对于参照核酸或多肽的同一性百分数。使用计算机程序ClustalW(1.83版本,默认参数)将参照序列(例如,本文中所述核酸序列或氨基酸序列)与一条或更多条候选序列进行比对,该程序允许核酸或多肽序列在其全长上进行比对(全局比对)。Chenna等.,Nucl.AcidsRes.,31(13):3497-500(2003)。ClustalW计算参照序列与一条或更多条候选序列之间的最佳匹配,并对他们进行比对,从而可确定同一性、相似性和差异。可向参照序列、候选序列或者两者中插入一个或更多个残基的空位以使序列比对最大化。对于核酸序列的快速逐对比对,使用以下默认参数:字长:2;窗口大小:4;评分方法:百分数;顶部对角线的数目:4;和空位罚分:5。对于核酸序列的多重比对,使用以下参数:空位开放罚分:10.0;空位延伸罚分:5.0;和权重转换:是。对于蛋白质序列的快速逐对比对,使用以下参数:字长:1;窗口大小:5;评分方法:百分数;顶部对角线的数目:5;空位罚分:3。对于蛋白质序列的多重比对,使用以下参数:权重矩阵:替换矩阵;空位开放罚分:10.0;空位延伸罚分:0.05;亲水性空位:开;亲水残基:Gly、Pro、Ser、Asn、Asp、Gln、Glu、Arg和Lys;残基特异性空位罚分:开。ClustalW的输出是反映序列间关系的序列比对。ClustalW可在例如BaylorCollegeofMedicineSearchLauncher互联网站(searchlauncher,bcm.tmc.edu/mult1-align/mult1-align.html)和EuropeanBioinformaticsInstitute互联网站(eb1.ac.uk/clustalw)运行。为了确定候选核酸或氨基酸序列与参照序列的同一性百分数,用ClustalW对序列进行比对,将比对中的相同匹配的数目除以参照序列的长度并将结果乘以100。应指出,可以将同一性百分比数值四舍五入到最接近的十分位。例如,将78.11、78.12、78.13和78.14下舍到78.1,而78.15、78.16、78.17、78.18和78.19上入到78.2。应理解,功能性UGT可含有不参与葡糖基化或者通过酶进行的其他酶促活性的另外氨基酸,并且因此与不含另外氨基酸的情况相比,这样的多肽可以更长。例如,EUGT11多肽可包含纯化标签(例如,HIS标签或GST标签)、叶绿体转运肽、线粒体转运肽、造粉体肽(amyloplastpeptide)、信号肽或者添加至氨基或羧基末端的分泌标签。在一些实施方案中,EUGT11多肽包含用作报道分子(例如,绿色荧光蛋白或黄色荧光蛋白)的氨基酸序列。II.甜菊醇和甜菊醇糖苷生物合成核酸编码本文中所述之多肽的重组基因包含针对该多肽并与适合表达该多肽的一个或更多个调节区以有义方向可操作地连接的编码序列。由于很多微生物能够由多顺反子mRNA表达多个基因产物,因此对于这些微生物而言,如果期望的话,可在单个调节区的控制之下表达多个多肽。当调节区和编码序列被定位成使得调节区有效地调节所述序列的转录或翻译时,认为该编码序列和调节区被可操作地连接。通常来说,对于单顺反子基因,将编码序列的翻译阅读框的翻译起始位点位于调节区下游的1至约50个核苷酸。在很多情况下,本文中所述多肽的编码序列可在除重组宿主以外的物种中鉴定到,即,其是异源核酸。因此,如果重组宿主是微生物,则编码序列可来自其他原核或真核微生物、植物或动物。然而,在一些情况下,编码序列是宿主天然具有的但被重新导入到该生物中的序列。天然序列与天然存在的序列的区别通常在于存在与外源核酸连接的非天然序列,例如例如位于重组核酸构建体中天然序列侧翼的非天然调节序列。此外,通常将稳定转化的外源核酸整合到不同于天然序列所在位置的位置。“调节区”指具有影响转录或翻译起始和速率以及转录或翻译产物的稳定性和/或的移动性之核苷酸序列的核酸。调节区包括但不限于:启动子序列、增强子序列、应答元件、蛋白质识别位点、诱导型元件、蛋白质结合序列、5’和3’非翻译区(UTR)、转录起始位点、终止序列、多腺苷酸化序列、内含子及其组合。调节区通常包含至少一个核心(基本)启动子。调节区还可以包含至少一个控制元件,例如增强子序列、上游元件或者上游激活区(UAR)。通过将调节区与编码序列定位成使得调节区有效地调节序列的转录或翻译来使调节区与编码序列可操作地连接。例如,为了将编码序列和启动子序列可操作地连接,通常将编码序列的翻译阅读框的翻译起始位点定位于启动子下游的1至约50个核苷酸。然而,可将调节区定位于翻译起始位点上游的多达约5000个核苷酸,或者转录起始位点上游的约2000核苷酸。对所包含调节区的选择取决于数个因素,包括但不限于:效率、选择性、可诱导性、期望表达水平和在某些培养阶段的优先表达。对本领域技术人员而言,通过相对于编码序列而适当选择和定位调节区来调节编码序列的表达是常规问题。应理解,可存在一个以上调节区,例如内含子、增强子、上游激活区、转录终止子和诱导型元件。可以将一个或更多个基因组合在可用于甜菊醇和/或甜菊醇糖苷之产生的离散方面的“模块(modules)”的重组核酸构建体中。将多个基因组合在模块(特别是多顺反子模块)中有利于在多种物种中使用该模块。例如,可以将甜菊醇生物合成基因簇或者UGT基因簇组合在多顺反子模块中,从而使在插入合适的调节区后,可将该模块导入众多物种中。作为另一个实例,可以将UGT基因簇组合使得每个UGT编码序列与独立的调节区可操作地连接从而形成UGT模块。这样的模块可用在其中必需或者期望单顺反子表达的那些物种中。除了可用于甜菊醇或甜菊醇糖苷之产生的基因以外,重组构建体通常还含有复制起点和用于使构建体维持在合适物种中的一个或更多个选择标记。应理解,由于遗传密码的简并性,多个核酸可编码特定的多肽;即,对于很多氨基酸,有一个以上的核苷酸三联体用作该氨基酸的密码子。因此,可使用针对特定宿主(例如微生物)的合适密码子偏爱表将给定多肽的编码序列中的密码子修饰成使得在所述宿主中获得最佳表达。作为分离的核酸,这些经修饰的序列可以以经纯化分子的形式存在并且可将其导入到用于构建重组核酸构建体之模块的载体或病毒。在一些情况下,为了使代谢中间体转向甜菊醇或甜菊醇糖苷生物合成,期望抑制内源多肽的一项或更多项功能。例如,可期望通过例如下调角鲨烯氧化酶来下调酵母菌株中的固醇合成以便进一步提高甜菊醇或甜菊醇糖苷的产生。作为另一个实例,可期望抑制某些内源基因产物(例如,去除次级代谢物的葡萄糖部分的糖基水解酶或如本文中所讨论的磷酸酶)的降解功能。作为另一个实例,可以抑制参与甜菊醇糖苷转运的膜转运蛋白的表达,从而抑制糖基化甜菊苷的分泌。这样的调节的有益之处在于可在微生物的培养过程中将甜菊醇糖苷的分泌抑制期望的时间,从而在收获时提高糖苷产物的产率。在这样的情况下,被转化到菌株中的重组构建体中可包含抑制多肽或基因产物表达的核酸。或者,可利用诱变来产生期望抑制其功能的基因的突变体。III.宿主微生物可利用重组宿主来表达用于产生甜菊醇糖苷的多肽,所述重组宿主包括哺乳动物、昆虫和植物细胞。很多原核细胞和真核细胞也适用于构建本文中所述的重组微生物,例如革兰氏阴性细菌、酵母菌和真菌。首先对被选定用作甜菊醇或甜菊醇糖苷之产生菌株的物种和菌株进行分析,以确定哪些产生基因是该菌株内源的且哪些基因不存在。将菌株中不存在其内源对应物的那些基因装配在一个或更多个重组构建体中,然后转化到菌株中以补充缺失的功能。在下文中对示例性的原核物种和真核物种进行更详细的描述。然而,应理解,其他物种可能也是合适的。例如,合适的物种可属于选自以下的属:伞菌属(Agaricus)、曲霉属(Aspergillus)、芽孢杆菌属(Bacillus)、念珠菌属(Candida)、棒状杆菌属(Corynebacterium)、假囊酵母属(Eremotheeium)、埃希菌属(Escherichia)、镰孢菌(Fusarium)/赤霉属(Gibberella)、克鲁维酵母属(Kluyveromyce)、硫磺菌属(Laetiporus)、香菇属(Lentinus)、红发夫酵母属(Phaffia)、平革菌属(Phanerochaete)、毕赤氏酵母属(Pichia)、藓属(Physcomitrella)、红酵母属(Rhodoturula)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、痂圆孢属(Sphaceloma)、红发夫酵母属(Xanthophyllomyces)和耶氏酵母属。来自这些属的示例性物种包括虎皮香菇(Lentinustigrinus)、硫磺菌(Laetiporussulphureus)、黄孢原毛平革菌(Phanerochaetechrysosporium)、巴斯德毕赤酵母(Pichiapastoris)、产朊假丝酵母(Cyberlindnerajadinii)、小立碗藓(Physcomitrellapatens)、粘红酵母32(Rhodoturulaglutinis32)、胶红酵母(Rhodoturulamucilaginosa)、红发夫酵母(Phaffiarhodozyma)UBV-AX、红发夫酵母(XanthophyIlomycesdendrorhous)、藤仓镰刀菌(Fusariumfujikuroi)/藤仓赤霉(Gibberellafujikuroi)、产朊念珠菌(Candidautilis)、光滑念珠菌(Candidaglabrata)、白色念珠菌(Candidaalbicans)和解脂耶氏酵母(Yarrowialipolytica)。在一些实施方案中,微生物可以是子囊菌(Ascomycete),例如藤仓赤霉、乳酸克鲁维酵母(Kluyveromyceslactis)、粟酒裂殖酵母(Schizosaccharomycespombe)、黑曲霉(Aspergillusniger)、解脂耶氏酵母、棉阿舒囊霉(Ashbyagossypii)或酿酒酵母。在一些实施方案中,微生物可以是原核生物,例如大肠杆菌、球形红细菌(Rhodobactersphaeroides)或者荚膜红细菌(Rhodobactercapsulatus)。可以理解,某些微生物可用于以高通量的方式对目的基因进行筛选和测试,而具有期望产率或生长特征的另一些微生物可用于大规模生产甜菊醇糖苷。酿酒酵母酿酒酵母是合成生物学中广泛使用的载体生物(chassisorganism),并且可以用作重组微生物平台。酿酒酵母拥有可供使用的突变体文库、质粒、代谢的详细计算机模型以及其他信息,从而允许合理设计多种模块以提高产物的产率。制备重组微生物的方法是已知的。可使用众多已知启动子中的任一种来在酵母中表达甜菊醇生物合成基因簇。过量产生萜的菌株是已知的,并且可用于提高牻牛儿基牻牛儿基二磷酸的量,以供产生甜菊醇和甜菊醇糖苷。曲霉属曲霉属物种(例如米曲霉(A.oryzae)、黑曲霉(A.niger)和酱油曲霉(A.sojae))是食品生产中广泛使用的微生物,并且可用作重组微生物平台。构巢曲霉(A.nidulans)、烟曲霉(A.fumigatus)、米曲霉、棒曲霉(A.clavatus)、黄曲霉(A.flavus)、黑曲霉和土曲霉(A.terreus)的基因组核苷酸序列是均是可获得的,从而允许合理设计和改变内源途径以提高通量和提高产物产率。已经开发了用于曲霉属的代谢模型,以及转录组学研究和蛋白组学研究。黑曲霉被培养用于工业化生产多种食物成分,例如柠檬酸和葡糖酸,并且因此例如黑曲霉的物种通常适用于生产食品成分例如甜菊醇和甜菊醇糖苷。大肠杆菌大肠杆菌是合成生物学中广泛使用的另一种平台生物并且也可用作重组微生物平台。与酵母属类似,大肠杆菌拥有可供使用的突变体文库、质粒、代谢的详细计算机模型以及其他信息,从而允许合理设计多种模块以增强产物的产率。可使用与上文针对酵母属所述的那些类似的方法来制备重组大肠杆菌微生物。伞菌属、赤霉属和平革菌属伞菌属、赤霉属和平革菌属是可用的,因为已知它们在培养物中产生大量赤霉素。因此用于大量产生甜菊醇和甜菊醇糖苷的萜前体已由内源基因产生。因此,可将包含甜菊醇或甜菊醇糖苷生物合成多肽的重组基因的模块导入来自这些属的物种中,而无需导入甲羟戊酸或MEP途径基因。Arxulaadeninivorans(Blastobotrysadeninivorans)Arxulaadeninivorans是具有独特生化特征的二态酵母(其在高至42℃的温度下生长为类似于面包酵母的出芽酵母,高于该阈值时,其以丝状形式生长)。Arxulaadeninivorans可在多种底物上生长,并且可同化硝酸盐。Arxulaadeninivorans已成功地应用于产生能够产生天然塑料的菌株或者应用于开发用于环境试样中的雌激素的生物传感器。解脂耶氏酵母解脂耶氏酵母是可在多种底物上生长的二态酵母(参见Arxulaadeninivorans)。解脂耶氏酵母具有高的工业应用的潜力,但仍没有市售可得的重组产品。红细菌属红细菌(Rhodobacter)可用作重组微生物平台。与大肠杆菌类似,红细菌拥有可供使用的突变体文库以及合适的质粒载体,从而允许合理设计多种模块以提高产物产率。红细菌之膜状细菌物种中的类异戊二烯途径己经过改造并且类胡萝卜素和CoQ10的产生提高。参见美国专利公开No.20050003474和20040078846。可使用与上文针对大肠杆菌所述的那些类似的方法来制备重组红细菌微生物。博伊丁念珠菌(Candidaboidinii)博伊丁念珠菌是甲基营养型酵母(其可在甲醇上生长)。与其他的甲基营养型物种(例如多形汉逊酵母(Hansenulapolymorpha)和巴斯德毕赤酵母)类似,博伊丁念珠菌为异源蛋白质的产生提供优异的平台。已报道了外源分泌蛋白的多克级范围的产率。最近,计算方法IPRO预测了在实验上将博伊丁念珠菌木糖还原酶的辅因子特异性从NADPH改变至NADH的突变。多形汉逊酵母(安格斯毕赤酵母,Pichiaangusta)多形汉逊酵母是另一种甲基营养型酵母(参见,博伊丁念珠菌)。其还可在多种其他底物上生长;其耐热并且可以同化硝酸盐(另参见乳酸克鲁维酵母)。多形汉逊酵母已被应用于产生乙型肝炎疫苗、胰岛素和用于治疗丙型肝炎的干扰素α-2a,还用于一系列技术酶。乳酸克鲁维酵母乳酸克鲁维酵母是常规地应用于产生克非尔(kefir)的酵母。其可在数种糖上生长,最重要的是可在存在于牛奶和乳清中的乳糖上生长。乳酸克鲁维酵母已被成功地应用于产生凝乳酶(通常存在于牛的胃中的一种酶)等以生产奶酪。生产以40,000L的规模在发酵罐中进行。巴斯德毕赤酵母巴斯德毕赤酵母是一种甲基营养型酵母(参见博伊丁念珠菌和多形汉逊酵母)。巴斯德毕赤酵母为外源蛋白质的产生提供高效的平台。平台元件可作为试剂盒获得并且在世界范围内在学术界中被用于产生蛋白质。已将菌株改造成可产生复杂的人N-多糖(酵母多糖与在人中发现的那些类似但不相同)。小立碗藓属小立碗藓苔藓当在混悬培养物中培养时具有与酵母或其他真菌培养物类似的特征。该属正成为用于产生在其他细胞类型中难以产生的植物次级代谢物的重要细胞类型。IV.产生甜菊醇糖苷的方法本文中所述的重组宿主可用在产生甜菊醇糖苷(例如莱鲍迪苷M)的方法中。例如,如果重组宿主是微生物,则所述方法可以包括将重组微生物在甜菊醇和/或甜菊醇糖苷生物合成基因得以表达的条件下培养在培养基中。可将重组微生物用补料分批或连续方法培养。通常来说,将重组微生物在限定的温度下在发酵罐中培养期望的时间。在某些实施方案中,微生物包括,但不限于酿酒酵母、黑曲霉、米曲霉、大肠杆菌、乳酸乳球菌和枯草芽孢杆菌。可使用常规的发酵方法培养来培养本发明提供的经构建和遗传改造的微生物,所述发酵方法包括尤其是恒化器、分批、补料分批培养、连续灌注发酵和连续灌注细胞培养。根据所述方法中使用的具体微生物,还可存在并表达其他重组基因,例如异戊二烯生物合成基因以及萜合酶和环化酶基因。可根据所公开的方法通过从培养基中提取试样并分析来确定底物和中间体(例如异戊二烯基二磷酸、二甲基烯丙基二磷酸、牻牛儿基牻牛儿基二磷酸、贝壳杉烯和异贝壳杉烯酸)的水平。在已将重组微生物培养在培养物中期望的时间后,可使用本领域中已知的多种技术从培养物中回收甜菊醇和/或一种或更多种甜菊醇糖苷。在一些实施方案中,可添加透化剂以辅助原料进入宿主和产物出去。如果重组宿主是植物或植物细胞,则可采用本领域中已知的多种技术从植物组织中提取甜菊醇或甜菊醇糖苷。例如,可将经培养的微生物或植物组织的粗裂解物离心以获得上清液。然后,将所得上清液加样到色谱柱(例如,C-18柱,例如来自Phenomenex的C18柱或SynergiTMHydroRP柱)中,并用水洗涤以去除亲水化合物,之后用溶剂(例如乙腈或甲醇)洗脱目的化合物。然后,可将化合物通过制备型HPLC进行进一步纯化。另参见WO2009/140394。所产生的甜菊醇糖苷(例如,莱鲍迪苷M)的量可以是约1mg/L至约2800mg/L,例如约1mg/L至约10mg/L、约3mg/L至约10mg/L、约5mg/L至约20mg/L、约10mg/L至约50mg/L、约10mg/L至约100mg/L、约25mg/L至约500mg/L、约100mg/L至约1,500mg/L,或约200mg/L至约1,000mg/L。一般来说,较长的培养时间将产生较大量的产物。因此,可将重组微生物培养1天至7天、1天至5天、3天至5天、约3天、约4天或约5天。应理解,本文中所讨论的多种基因和模块可存在于两种或更多种重组微生物中,而非单一微生物中。当使用多种重组微生物时,可将它们培养在混合培养物中来产生甜菊醇和/或甜菊醇糖苷。例如,第一微生物可包含一个或更多个用于产生甜菊醇的生物合成基因,而第二微生物包含甜菊醇糖苷生物合成基因。或者,可将两种或更多种微生物分别培养在独立的培养基中,并可将第一培养基中的产物(例如甜菊醇)导入第二培养基中以将其转化成后续的中间体或终产物(例如莱鲍迪苷A)。然后,回收第二微生物或最终微生物所产生的产物。还应理解,在一些实施方案中,可使用除培养基以外的营养源并利用除发酵罐以外的系统来培养重组微生物。甜菊醇糖苷在不同的食物系统中不一定具有等同的性能。因此,期望能够指导合成所选甜菊醇糖苷组合物。本文中所述的重组宿主可产生选择性地富集了特定甜菊醇糖苷(例如,莱鲍迪苷M)并具有一致口味特征的组合物。因此,本文中所述的重组微生物、植物和植物细胞可有利于产生这样的组合物,所述组合物能够适于满足给定食品所期望的甜化特性并且批次之间每种甜菊醇糖苷的比例是一致的。本文中所述的微生物不会产生甜菊提取物中存在的不期望的植物副产物。因此,通过本文中所述重组微生物产生的甜菊醇糖苷组合物与来自甜菊属植物的组合物是可区别的。V.食品通过本文中所公开的方法获得的甜菊醇糖苷可用于制作食品和饮料产品、膳食补充剂和甜味剂组合物。例如,可将基本纯的甜菊醇糖苷(例如莱鲍迪苷M)包含在食品中,例如冰淇淋、碳酸饮料、果汁、酸奶、烘培食品(bakedgoods)、口香糖、硬糖和软糖以及调味汁。还可将基本纯的甜菊醇糖苷包含在非食物产品中,例如药物产品、药品、膳食补充剂和营养补充剂。还可将基本纯的甜菊醇糖苷包含在农业和陪伴动物业二者的动物饲料产品中。或者,可以如下制备甜菊醇糖苷的混合物:分开培养重组微生物或者培养不同的植物/植物细胞,所述不同的植物/植物细胞分别产生特定的甜菊醇或甜菊醇糖苷;从每种微生物或植物/植物细胞中回收基本纯形式的甜菊醇或甜菊醇糖苷;并然后将化合物合并以获得含有期望比例的每种化合物(例如,莱鲍迪苷M与一种或更多种其他甜菊醇糖苷)的混合物。与现有的甜菊产品相比,本文中所述的重组微生物、植物和植物细胞允许获得更精确和一致的混合物。在另一种替代方案中,可将基本纯的甜菊醇或甜菊醇糖苷与其他甜味剂一起掺入到食品中,所述甜味剂例如糖精、右旋糖、蔗糖、果糖、赤藓糖醇、阿斯帕坦、三氯半乳蔗糖、莫那甜(monatin)或乙酰磺胺酸钾(acesulfamepotassium)。甜菊醇糖苷相对于其他甜味剂的重量比可根据需要而改变以实现最终食物产品中的满意口味。参见例如,美国专利公开No.2007/0128311。在一些实施方案中,可以将甜菊醇糖苷与调味物(例如,柑橘)一起提供作为调味剂。可将通过本文中所述的重组微生物、植物或植物细胞产生的组合物掺入到食品中。例如,根据甜菊醇糖苷和食品的类型,可将通过重组微生物、植物或植物细胞产生的甜菊醇糖苷组合物按照基于干重的约20mg甜菊醇糖苷/kg食品至约1800mg甜菊醇糖苷/kg食品的量掺入到食品中。例如,可将通过重组微生物、植物或植物细胞产生的甜菊醇糖苷组合物掺入到甜点、冷甜品(例如,冰淇淋)、奶制品(例如,酸奶)或者饮料(例如,碳酸饮料)中,使食品含有基于干重的最多500mg甜菊醇糖苷/kg食物。可将通过重组微生物、植物或植物细胞产生的甜菊醇糖苷组合物掺入到烘培食品(例如,饼干)中,使食品含有基于干重的最多300mg甜菊醇糖苷/kg食物。可将通过重组微生物、植物或植物细胞产生的甜菊醇糖苷组合物掺入到调味汁(例如,巧克力糖浆)或蔬菜制品(例如,腌菜)中,使食品含有基于干重的最多1000mg甜菊醇糖苷/kg食物。可将通过重组微生物、植物或植物细胞产生的甜菊醇糖苷组合物掺入到面包中,使食品含有基于干重的最多160mg甜菊醇糖苷/kg食物。可将通过重组微生物、植物或植物细胞产生的甜菊醇糖苷组合物掺入到硬糖或软糖中,使食品含有基于干重的最多1600mg甜菊醇糖苷/kg食物。可将通过重组微生物、植物或植物细胞产生的甜菊醇糖苷组合物掺入到经加工的水果制品(例如,果汁、果馅、果酱和果冻)中,使食品含有基于干重的最多1000mg甜菊醇糖苷/kg食物。在一些实施方案中,将基本纯的甜菊醇或甜菊醇糖苷掺入到桌面甜味剂或“杯杯(cup-for-cup)”产品中。通常将这样的产品用本领域技术人员已知的一种或更多种膨化剂(例如麦芽糊精)稀释到合适的甜度水平。可将富含莱鲍迪苷M的甜菊醇糖苷组合物以例如基于干重的10,000mg至30,000mg甜菊醇糖苷/kg产品包装在小袋中供桌面使用。在以下实施例中对本发明进行进一步描述,这些实施例并不限制权利要求书中所述的本发明的范围。实施例以下实施例用于举例说明本发明的特定实施方案及其多种用途。这些实施例仅出于说明性目的而提出并不应认为是限制本发明。实施例1:EFSC3044的菌株工程化和发酵酵母菌EFSC3044来自含有三种营养缺陷型修饰(即缺失URA3、LEU2和HIS3)的野生型酿酒酵母菌株。该菌株可采用标准遗传方法进行操作并且可用作常规的二倍体或单倍体酵母菌株。通过5种DNA构建体的基因组整合将该菌株转变成产生甜菊醇糖苷的酵母。每种构建体都包含多个基因,并将其通过同源重组导入酵母基因组中。此外,在酵母中第一、第二和第五构建体通过同源重组进行装配。第一构建体含有八个基因,并且插入DPP1基因座中,其破坏并部分地缺失DPP1(磷酸酶)。所插入的DNA包含:棉阿舒囊霉TEF1启动子表达的并且其后是来自棉阿舒囊霉的TEF1终止子的natMX基因(选择标记);由天然酵母GPD1启动子表达的并且其后是天然酵母CYC1终止子的GeneArt密码子优化的甜菊UGT85C2(GenBankAAR06916.1;SEQIDNO:3);使用天然酵母TPI1启动子表达并且其后是天然酵母TDH1终止子的甜菊CPR-8(SEQIDNO:5);由天然酵母PDC1启动子表达的并且其后是天然酵母FBA1终止子的拟南芥贝壳杉烯合酶(SEQIDNO:6,与GenBankAEE36246.1类似);使用天然酵母TEF2启动子表达并且其后是天然酵母PFI1终止子的合成聚球藻属GGPPS(SEQIDNO:22,GenBankABC98596.1);由天然酵母TEF1启动子表达的并且其后是天然酵母ENO2终止子的DNA2.0密码子优化的甜菊KAHe1(SEQIDNO:8);使用天然酵母FBA1启动子表达并且其后是天然酵母TDH2终止子的合成甜菊KO-1(SEQIDNO:23;GenBankABA42921.1);以及使用天然酵母PGK1启动子表达的并且其后是天然酵母ADH2终止子的玉米的截短的CDPS(SEQIDNO:133)。第二构建体插入在YPRCΔ15基因座处,并且含有:其前是来自棉阿舒囊霉的TEF1启动子并且其后是来自棉阿舒囊霉的TEF1终止子的kanMX基因(选择标记);由天然PGK1启动子表达并且其后是天然酵母ADH2终止子的GeneArt密码子优化的拟南芥ATR2(SEQIDNO:10);由天然酵母TPI1启动子表达的并且其后是天然酵母TDH1终止子的甜菊UGT74G1(SEQIDNO:135,GenBankAAR06920.1);由天然酵母TEF1启动子表达的并且其后是天然酵母ENO2终止子的GeneArt密码子优化的甜菊UGT76G1(SEQIDNO:14,编码GenBankAAR06912);以及编码具有氨基酸修饰L211M和V286A的甜菊UGT91D2e-b、由天然酵母GPD1启动子表达的并且其后是天然酵母CYC1终止子的GeneArt密码子优化的序列(SEQIDNO:15是野生型序列的UGT91D2e氨基酸序列;密码子优化的核苷酸序列示于SEQIDNO:90中)。UGT91D2e-b在本文中作为SEQIDNO:66公开,其具有第211位残基甲硫氨基酸残基和第286位残基丙氨酸残基处的突变。通过接合和剥离将第一构建体和第二构建体组合在同一孢子克隆中。随后,在两个连续事件中用构建体三和四转化该酵母菌株。构建体三被整合在基因PRP5与YBR238C之间,并且包含:乳酸克鲁维酵母leu2启动子表达的并且其后是来自乳酸克鲁维酵母的leu2终止子的乳酸克鲁维酵母leu2基因;天然酵母GPD1启动子表达的并且其后是天然酵母CYC1终止子的DNA2.0优化的甜菊KAHe1(SEQIDNO:8);以及天然酵母TPI1启动子表达的并且其后是天然酵母TPI1终止子的玉米的截短的CDPS(SEQIDNO:133)。构建体四被整合在基因组中的ECM3与YOR093C之间,其中表达盒包含来自棉阿舒囊霉之TEF1启动子表达的并且其后是来自棉阿舒囊霉之TEF1终止子的肺炎克雷伯菌(K.pneumoniae)hphMX基因;由天然酵母GPD1启动子表达的并且其后是天然酵母CYC1终止子的聚球藻属GGPPS(SEQIDNO:22);以及天然酵母TPI1启动子表达的并且其后是天然酵母TPI1终止子的拟南芥KS(SEQIDNO:6)。然后,通过重组去除所导入的4个选择标记natMX、kanMX、乳酸克鲁维酵母LEU2和肺炎克雷伯菌hphMX以及在选择标记基因之前的启动子和其后的终止子。在该酵母菌株中,插入第五构建体并通过酵母转化和同源重组装配。第五构建体包含7个基因并且被插入在YORWΔ22基因座处。所插入的DNA包含:棉阿舒囊霉TEF1启动子表达的并且其后是来自棉阿舒囊霉之TEF1终止子的粟酒裂殖酵母HIS5基因(选择标记);由天然酵母GPD1启动子表达的并且其后是天然酵母CYC1终止子的甜菊KO-1(SEQIDNO:23;GenBankABA42921.1);使用天然酵母TPI1启动子表达的并且其后是天然酵母TDH1终止子的甜菊CPR-8(SEQIDNO:5);由天然酵母PDC1启动子表达的并且其后是天然酵母FBA1终止子的拟南芥贝壳杉烯合酶(SEQIDNO:6,与GenBankAEE36246.1类似);使用天然酵母TEF2启动子表达的并且其后是天然酵母PGI1终止子的稻基因Os03g0702000的密码子优化形式(SEQIDNO:18,编码EUGT11);由天然酵母TEF1启动子表达的并且其后是天然酵母ENO2终止子的DNA2.0密码子优化的甜菊KAHe1(SEQIDNO:8);以及使用天然酵母PGK1启动子表达的并且其后是天然酵母ADH2终止子的玉米的截短的CDPS(SEQIDNO:133)。通过导入两种质粒EPSC2182和EPSC2308来使所述酵母菌株成为原养型的。EPSC2182来自具有LEU2标记的p415TEFCEN/ARS穿梭质粒并且包含另一拷贝的由天然酵母TEF1启动子表达并且其后是天然酵母ENO2终止子的甜菊KAHe1。EPSC2308是具有URA3标记之基于p416TEF的CEN/ARS穿梭质粒,其中EUGT11基因由天然酵母TEF1启动子克隆并表达并且其后是天然酵母CYC1终止子。然后,将该酵母菌株命名为EFSC3044。菌株EFSC3044中的重组基因的列表基因名称酵母位置构建体No.UGT85C2基因组1甜菊CPR-8基因组1拟南芥贝壳杉烯合酶基因组1聚球藻属GGPPS基因组1甜菊KAHe1基因组1甜菊KO-1基因组1玉米的截短的CDPS基因组1拟南芥ATR2基因组2甜菊UGT74G1基因组2甜菊UGT76G1基因组2改变的甜菊属UGT91D2e-b基因组2甜菊KAHe1基因组3玉米的截短的CDPS基因组3基因名称酵母位置构建体No.聚球藻属GGPPS基因组4拟南芥贝壳杉烯合酶基因组4甜菊KO-1基因组5甜菊CPR-8基因组5拟南芥贝壳杉烯合酶基因组5Os03g0702000(EUGT11)基因组5甜菊KAHe1基因组5玉米的截短的CDPS基因组5甜菊KAHe1质粒6EUGT11质粒7在有氧条件下在2L(工作容积)发酵罐中进行补料分批发酵,其包括在基础培养基(合成完全培养基)中的约16小时生长阶段,之后利用葡萄糖作为碳源和能源并组合痕量金属、维生素、盐和酵母氮碱(YeastNitrogenBase,YNB)和/或氨基酸补充物进行约100小时的补料。使PH保持在接近pH5,并且温度定点为30℃。对补料速率加以控制以防止氧消耗和使乙醇形成最小化(葡萄糖限制的条件)。将全部培养物试样(不去除细胞)取出并在等体积的DMSO中煮沸以用于总糖苷水平。除非另有指出,否则使用以下方法来分析甜菊醇糖苷和甜菊醇途径的中间体。使用装配有AcquityBEHC18柱(100x2.1mm,1.7μm颗粒;Waters,Milford,MA)并与具有加热电喷雾离子(HESI)源的TSQQuantumAccess(ThermoFisherScientific)三重四极杆质谱仪连接的3000UPLC系统(Dionex,Sunnyvale,CA)来进行LC-MS分析。使用含有洗脱剂B(含有0.1%甲酸的MeCN)和洗脱剂A(含有0.1%甲酸的水)的流动相如下来进行洗脱:第0.0至4.0分钟提高梯度29%→48%B;第4.0至4.2分钟提高梯度48%→100%B;第4.2至6.2分钟保持100%B;并用29%洗脱剂B再平衡。流量为0.4ml/分钟并使柱温度保持在55℃。采用SIM(SingleIonMonitoring,单离子监测)以正电模式用表12中的下述m/z轨迹来检测甜菊醇糖苷。表12:通过LC/MS检测到的分析化合物的总结通过与用来自LGC标准品公司(LGCStandards)的真正标准物获得的校准曲线进行比较来量化甜菊醇糖苷的水平。例如,通常使用0.5μM至100μM莱鲍迪苷A(RebA)的标准溶液来构建校准曲线。图5包含导致六糖基化甜菊醇糖苷形成的发酵的代表性质谱(保留时间1.31,质量示踪对应于六葡萄糖甜菊醇糖苷和甜菊苷)。采用经改进的LC-MS方法(使用BEHRPshieldC18HPLC柱(50x2.1mm,1.7μm颗粒;Waters,Milford,MA)来分析实施例5和体外实验中所述的化合物以确定UGT76G1的相对速率。使用含有洗脱剂B(含有0.1%甲酸的MeCN)和洗脱剂A(含有0.1%甲酸的水)的流动相如下来进行洗脱:第0.0至4.0分钟提高梯度25%→47%B;第4.0至5.0分钟提高梯度47%→100%B;第5.0至6.5分钟保持100%B;最后用25%B再平衡。流量为0.4ml/分钟并使柱温度保持在35℃。经改进的LC-MS方法导致表12中所示的化合物具有较短的保留时间。使用经改进的LC-MS方法的典型保留时间(tR以分钟表示)是:19-SMG,3.34;13-SMG,3.54;覆盆子苷,2.55;甜菊醇-1,2-二糖苷,2.95;甜菊醇-1,3-二糖苷,3.31;1,2-甜菊苷,2.04;1,3-甜菊苷,2.42;莱鲍迪苷B,2.91;莱鲍迪苷A,2.03;莱鲍迪苷D,1.1;和莱鲍迪苷M,1.32。实施例2:产生六糖基化甜菊醇糖苷的反应的体外表征如实施例1中所述,当EUGT11在产生甜菊醇糖苷的酵母菌株中以高水平表达时观察到六葡萄糖基甜菊醇糖苷。为了表征正发生产生该分子的反应,用单独的UGT进行进一步的体外工作。将UGT76G1(SEQIDNO:1)克隆到pET30a质粒(EMDMillipore)中。将所得载体转化到合适的DE3大肠杆菌菌株中,并根据生产商的方案培养和诱导转化子。将相应的融合蛋白(6XHIS标记的)采用标准方法通过固定化金属亲和色谱纯化。将约0.08μg经纯化的UGT76G1/μL反应液用100μMRebD、300μMUDP-葡萄糖和10U/mL碱性磷酸酶(Fermentas/ThermoFisher,Waltham,MA)孵育。在30℃下在20mMHepes-NaOH,pH7.6中进行反应24小时。在进行LC-MS分析之前,向每个反应添加1体积的100%DMSO并涡旋,将试样在16,000Xg下离心1分钟。在反应期间出现1个新峰,其质量对应于甜菊醇+6葡萄糖部分、在1.31分钟洗脱并且对应于在体内过量表达EUGT11时发现的六葡萄糖基甜菊醇糖苷之一的轨迹。该结果表明UGT76G1可使RebD进一步糖基化,从而产生六糖苷。假设UGT76G1除与甜菊醇骨架C13位的主要葡萄糖形成1,3-葡萄糖键之外还具有向C19位的主要葡萄糖加成1,3-键合葡萄糖的第二活性。可能的是,RebD中可供UGT76G1使用的唯一可获得糖基化位点是C19位的葡萄糖,其会导致产生命名为RebM的六糖苷。将所检测到的六糖苷分离并确定是莱鲍迪苷M,如实施例3和4中所示。实施例3:六糖基化分子的分离根据图6中所概括的方案,通过与实施例1中针对结构分析所述之类似的发酵来分离六葡糖基甜菊醇糖苷产物。在发酵后,将培养肉汤在4℃下以7000rpm离心30分钟并如下纯化上清液:将玻璃柱用150mLHP20树脂(Supelco)填充,将等量份的300mL上清液上样到柱上并用2X250mLMilliQ水洗涤。通过逐步增量式提高MilliQ水中的甲醇浓度来洗脱糖苷产物(250mL部分中-以0%开始→10%→40%→60%→80%→100%MeOH)。通过LC-MS分析每个级分中的甜菊醇糖苷的水平。将最有希望的级分(60%至80%MeOH)合并,并用真空蒸发器缩减到总共10mL。将经600mL球形C18键合闪光硅胶(45至70um,/Supelco)填充的玻璃柱用5%水性乙腈(乙腈:HPLC级-水:MilliQ)平衡。将来自HP20纯化的浓缩残余物上样到柱上并通过逐步提高乙腈贡献洗脱。初始洗脱剂是水中的5%乙腈。每步骤使乙腈水平升高5%(每步骤400mL)。在达到50%乙腈后,完成10%步骤。将所有级分通过LC-MS分析、根据其甜菊醇糖苷组合物合并,并真空干燥。表13包含对在每个级分中发现的糖苷的总结。图7包含通过在快速色谱后对经半纯化的六糖基化化合物进行LC-QTOF分析的色谱和质谱。表13.对甜菊醇糖苷的分级的总结mg级分说明321.12-11RebD和一些6X糖基化甜菊醇糖苷138.312-20RebD和一些6X糖基化甜菊醇糖苷357.421-27大量6X糖基化甜菊醇糖苷98.928-30RebA68.431-36覆盆子苷,甜菊醇-1,2-二糖苷14.834-45大部分是13-SMG852.8洗液乙腈洗液实施例4:结构的NMR确认为了产生用于NMR的纯试样,在半制备型HPLC系统上对实施例3中获得的约50mg六糖基化富集残余物进行进一步纯化。该系统配备有C18柱(Phenomenex:尺寸250x21.2mm,5微米)。使用含有洗脱剂B(含有0.1%三氟乙酸的MeCN)和洗脱剂A(含有0.1%三氟乙酸的水)的流动相如下进行洗脱:第0.0至21分钟提高梯度1%→50%B;第21.0至27.0分钟50%→100%;最后用100%B洗涤并再平衡。流量为室温下14ml/分钟。随时间收集级分并通过LC-QTOF-MS分析甜菊醇糖苷的存在。所使用的系统是与MicrOTOFII质谱仪(Bruker)耦合的UPLC(Waters)。所使用的柱是AcquityBEHC18,100x2.1mm,1.7μm(Waters)。流动相是A:水中的0.1%甲酸和B:乙腈中的0.1%甲酸。所采用的梯度是12分钟内1%B至50%B,然后3分钟内到达100%B。流量是0.4ml/分钟。使用级分93来进行NMR分析。所有的NMR实验都用配备有1.7mm低温TCI探头的BrukerAvanceIII600MHzNMR波谱仪在25C下在DMSO-d6中进行。借助于标准的同核或异核多脉冲NMR实验(即1H,1H-COSY;1H,13C-HSQC;和1H,13C-HMBC实验)来解析结构。所获得的NMR数据如下:1HNMR(600MHz,DMSO-d6)δppm0.78(br.s.,1H)0.83(s,3H)0.92(d,J=7.39Hz,2H)0.97-1.04(m,1H)1.17(s,3H)1.30-1.54(m,6H)1.67(d,J=10.40Hz,1H)1.72-1.86(m,4H)1.92(d,J=6.49Hz,1H)1.96-2.05(m,2H)2.08(d,J=10.82Hz,1H)2.32(d,J=12.71Hz,1H)2.91(t,J=8.82Hz,1H)2.95-3.01(m,1H)3.02-3.27(m,14H)3.31-3.55(m,10H)3.57-3.86(m,10H)4.47(d,J=7.86Hz,1H)4.51(d,J=8.00Hz,1H)4.53(d,J=7.62Hz,1H)4.66(d,J=7.81Hz,1H)4.73(br.s.,1H)4.80(d,J=7.86Hz,1H)5.11(br.s.,1H)5.53(d,J=8.19Hz,1H)13CNMR(150.91MHz,DMSO-d6)δppm16.4,19.4,19.9,21.8,28.3,36.7,37.2,39.3,40.3,41.5,41.6,43.2,43.7,47.0,47.2,53.2,57.0,60.7,61.2,61.4,61.8,62.0,62.1,68.5,68.9,70.4(3C),71.2,71.6,74.1-74.3(4C),74.8,75.8,76.9-77.1(6C),77.6,79.6,85.8,86.8,87.1,92.1,96.2,102.1,102.8,103.2,103.3,104.5,153.1,175.1所确认的RebM(系统名称:13-[β-D-吡喃葡糖基-(1→3)-[β-D-吡喃葡糖基-(1→2)]-β-D-吡喃葡糖基-1-氧基]贝壳杉-16-烯-18-酸,18-[β-D-吡喃葡糖基-(1→3)-[β-D-吡喃葡糖基-(1→2))]-β-D-吡喃葡糖基-1-酯])的结构示于图2中。实施例5:EFSC3044的另外发酵产物的分离和确定除RebM之外,EFSC3044的发酵还导致形成保留时间为2.31的二糖基化糖苷(13-羟基贝壳杉-16-烯-18-酸,[2-O-β-D-吡喃葡糖基-β-D-吡喃葡糖基]酯)(图8B)和保留时间为2.15的三糖基化甜菊醇糖苷(13-羟基贝壳杉-16-烯-18-酸;[2-O-β-D-吡喃葡糖基-3-O-β-D-吡喃葡糖基-β-D-吡喃葡糖基]酯)(图8C)。根据以下方法分离这些化合物。在发酵后,将培养肉汤在4℃下以5000rpm离心10分钟并如下纯化上清液:将玻璃柱用300mLHP20树脂(Supelco)填充,将等分的1700mL上清液上样到柱上并用3.5升ddH2O洗涤。通过使用2LMeOH来洗脱化合物并分别收集500mL级分。在LC-MS分析后,将包含大部分靶化合物的级分合并,并在旋转蒸发系统(Rotavap,Büchi,Switzerland)上蒸发,得到1.85克深灰色物质。将粗提取物再溶解于3.5mLDMSO中并以0.7mL的等分试样注入半制备型LC-MS中以进行进一步纯化。所使用的柱是XBridgeC18,19x250mm,5um(WatersCorporation)。流动相是A:水中的0.1%TFA和B:乙腈中的0.1%TFA。通过44分钟内1%B到60%B的线性梯度进行洗脱。在运行期间连续收集2.1mL级分。通过LC-MS分析所收集的级分以评价靶分析物的存在和纯度。将包含经鉴定为“峰8”和“峰9”的化合物的级分通过添加0.8mLNH3(水溶液)中和、合并并通过Genevac离心蒸发系统干燥。通过NMR采用实施例4的方法来确定这些化合物的结构。所获得的二糖基化甜菊醇糖苷的NMR数据如下:1HNMR(600MHz,DMSO-d6)δppm0.72-0.79(m,1H)0.81(s,3H)0.93(d,J=8.07Hz,1H)0.98-1.05(m,1H)1.17(s,3H)1.20(d,J=11.37Hz,1H)1.36(d,J=4.03Hz,2H)1.40-1.52(m,1H)1.55-1.70(m,1H)1.77(d,J=9.54Hz,3H)1.84-1.90(m,1H)2.03(d,J=8.07Hz,1H)2.31-2.41(m,1H)2.79-2.87(m,1H)2.89-2.96(m,1H)3.08(s,2H)3.12-3.18(m,3H)3.19-3.24(m,1H)3.34(d,J=4.77Hz,2H)3.41-3.45(m,2H)3.46-3.55(m,1H)3.65(d,J=11.37Hz,1H)3.73(dd,J=15.41,8.44Hz,4H)4.26-4.40(m,1H)4.48(d,J=7.70Hz,1H)4.52-4.62(m,1H)4.69(br.s.,1H)4.81(d,J=7.70Hz,1H)4.88(br.s.,1H)4.91-5.03(m,1H)5.05-5.26(m,2H)5.51(d,J=7.70Hz,1H)555(br.s.,1H;分子式为C32H50O13;式量为642.7316)。所获得的三糖基化甜菊醇糖苷的NMR数据如下:1HNMR(600MHz,DMSO-d6)δppm0.73-0.79(m,1H)0.81(s,3H)0.89-0.97(m,2H)0.99-1.05(m,1H)1.17(s,3H)1.19(d,J=11.37Hz,1H)1.24(s,2H)1.31-1.40(m,4H)1.40-1.51(m,3H)1.55-1.63(m,1H)1.67(dd,J=14.12,5.32Hz,1H)1.71-1.82(m,5H)1.88(d,J=11.00Hz,1H)1.98-2.08(m,2H)2.23-2.30(m,1H)2.94(t,J=8.44Hz,1H)3.01-3.11(m,3H)3.12-3.17(m,1H)3.19-3.28(m,3H)3.44-3.52(m,5H)3.54-3.60(m,1H)3.61-3.71(m,3H)4.36(br.s.,1H)4.49(br.s.,1H)4.55(d,J=7.70Hz,1H)4.69(s,1H)4.73(br.s.,1H)4.88(br.s.,1H)4.91-5.05(m,2H)5.17(br.s.,1H)5.31(br.s.,1H)5.44(d,J=8.07Hz,1H)5.55(br.s.,1H;分子式为C38H60O18;式量为804.8722)。经确定二糖基化甜菊醇糖苷酯为甜菊醇-1,2-二糖苷的类似物(图8B),并且经确定三糖基化甜菊醇糖苷为RebB的异构体,两者均在19-O位被糖基化(图8C)而非其各自异构体的13-O位。该数据表明当UGT85C的活性比EUGT11、UGT76G1或UGT74G1的活性低时,形成这些化合物。实施例6:EFSC3261的工程化和发酵将实施例1中所使用的野生型酵母菌株改造成包含表14中的异源基因,这些异源基因参与甜菊醇糖苷的产生。采用实施例1中所述的类似方法将这些基因全部整合到宿主菌株的染色体中。表14:菌株EFSC3261中使用的重组基因和启动子的列表.在有氧条件下在2L(工作容积)发酵罐中进行补料分批发酵,其包括在基础培养基(包含葡萄糖、硫酸铵、痕量金属、维生素、盐和缓冲剂的基本培养基)中的约16小时生长阶段,之后用含有葡萄糖的确定成分补料培养基进行约100小时的补料。利用葡萄糖作为碳源和能源,并与痕量金属、维生素和盐组合。使pH保持在接近pH5,并且温度设定点为30℃。对补料速率加以控制以防止氧消耗和使乙醇形成最小化(葡萄糖限制的条件)。将全部培养物试样(不去除细胞)取出并在等体积的DMSO中煮沸以用于总糖苷水平。图9示出了4个独立实验中EFSC3261的RebD产量。总产量(胞内和胞外合并)的平均滴定度是800至1200mg/L。对于发酵实验58,123小时的最终总滴定度是1109mg/LRebD,695mg/LRebM;D∶M的质量比是1.6。还产生394mg/LRebA。实施例7:EFSC3297的菌株工程化和发酵以提高RebD和RebM的产生将实施例1中所使用的相同野生型酵母菌株改造成包含表15中的异源基因,这些异源基因参与甜菊醇糖苷的产生。采用实施例1中所述的类似方法将这些基因全部整合到宿主菌株的染色体中。尽管所使用的基因与实施例1中的那些相同,但是提高甜菊醇途径中瓶颈酶的拷贝数允许提高RebD和RebM的产生。以与上文针对菌株3261所述的方式类似的方式进行菌株3297的发酵。表15.菌株EFSC3297中使用的重组基因和启动子的列表.EFSC3297的RebD和RebM产量示于图10中。D∶M的质量比是1.1。发酵结束后产生1517mg/LRebD(总量,胞内加胞外)并产生1375mg/LRebM。实施例8:具有两个UGT76G1基因拷贝的EFSC3841的菌株工程化和发酵将实施例1中所使用的野生型酵母菌株改造成包含表16中的异源基因,这些异源基因参与甜菊醇糖苷的产生。采用实施例1中所述的类似方法将这些基因全部整合到宿主菌株的染色体中。3841的发酵条件与上文针对菌株3261所述的那些条件类似。表16.菌株EFSC3841中使用的重组基因和启动子的列表.异源途径基因拷贝数使用的启动子GGPPS7(聚球藻属)合成基因3TEF2(X3)CDPS(截短的,玉米)天然基4PGK1(X4)异源途径基因拷贝数使用的启动子因KS5(拟南芥)天然基因4PDC1(X4)KO(甜菊KO1)合成基因3FBA1,GPD1,TPI1ATR2合成基因2PGK1(X2)KAH(甜菊KAHe1)合成基因4GPD1,TEF1(X3)甜菊CPR8天然基因3TPI1(X3)85C2(甜菊)合成基因2GPD1(X2)74G1天然基因(甜菊)2TPI1(X2)76G1合成基因(甜菊)2TEF1(X2)来自甜菊的91d2e-b2X突变体2GPD1(X2)EUGT11合成基因(稻)2TEF2,TEF1EFSC3841的RebD、RebM和RebA的产量示于图11中。其中,RebD的总产量是2786mg/L并且RebM的总产量为2673mg/L,D∶M比值为1.04(g/g)。还产生703.7mg/LRebA。实施例9:敲除EFSC3841的一个UGT76G1基因并且RebD和RebM的产生下降将上述EFSC3841菌株的营养缺陷型(leu2,ura3)形式(命名为EFSC3643)进一步改造成缺失一个野生型76G1UGT基因。相对于含有2个UGT76G1拷贝之未经改造菌株的4个菌落测试含有1个UGT76G1拷贝的3个菌落的表现。采用PCR来验证新菌株只携带1个76G1拷贝。简言之,通过两个PCR反应如下验证一个UGT76G1拷贝得到破坏:使用用于破坏之整合盒的一部分扩增插入位点上游的区域并用该整合盒的一部分扩增插入位点下游的区域。针对野生型76G1设计的PCR引物证明野生型76G1仍是完整的并存在于菌株中。将菌落在30℃和400RPM下在96深孔板中培养96小时。通过LC/MS分析确定RebD和RebM的总量。由图12可知,76G1的拷贝数显著改变RebD/RebM比值。绘制只含有一个76G1拷贝之3个菌落(图的左手侧柱)相对于包含2个76G1UGT拷贝之亲本菌株的4个菌落(图的右手侧柱)的RebD/RebM比值的图。实施例10:确定RebD和RebM产生的相对速率将含有WT-76G1的p416GPD在SC-ura培养基中在蛋白酶缺陷型酵母菌株DSY6中表达48小时。然后,将100μL细胞重新接种在3mLSC-ura培养基中16小时。根据生产商的说明,将细胞用200μLCelLyticTMY裂解。将6μL裂解液添加至24μL由20mMTris缓冲液(pH8.0)、0.3μMUDPG和0.1μMRebD或RebE组成的反应混合物。将反应在30℃下孵育并在0、1、2和18小时通过将30μL反应混合物中的25μL转移至25μLDMSO停止。通过LC-MS分析RebD、RebE和RebM的量并将其作为“曲线下的面积”在数据处理期间通过峰积分进行评估。图13显示大部分的RebD被消耗但并未产生相应量的RebM。还显示RebE在2小时内被消耗并转化成RebD。这一发现证明从甜菊醇经由RebE而非RebA形成RebM的替代糖基化途径是可能的,这一发现在18小时时间点首次观察到。实施例11:对UGT76G1中参与RebM和RebD结合的氨基酸的预测作为用于鉴定对RebM或RebD之活性和区域选择性提高的UGT76G1变体的方式,进行同源建模和对接研究。在SybylX程序中以PDB文件2PQ6(%ID=31)、2C1X(%ID=28)、3HBF(%ID=28)、2VCE(%ID=35)的组合作为模板采用标准设置产生3个同源模型。在产生主链和侧链期间使用PDB2VCE中存在的配体,但在能量最小化之前将其移出。为了生成质量最高的结构,使用MBERFF99力场以标准设置或下列梯度终止使模型能量最小化:阈值0.1kJ,截断半径和最大迭代5000个循环。模型的统计量示于表17中并且模型间的差异可见于图14中。表17:对UGT76G1同源模型的总结。在模型生成后,利用SybylX中的SurflexDock套件将底物对接到酶的活性位点以预测形成结合口袋的氨基酸。通过将76G1模型与PDB2VCE进行比对并直接从模板输入配体UDPF2G来定位UGT76G1结合槽中的UDPG部分。为了对接受体底物,使用覆盖结合位点其余部分的标准值来生成方案。使用GeomX设置在包含允许具有蛋白质柔性(模型1)或无柔性(模型2)的甜菊醇糖苷的配体文库上进行对接。采用SybylX中的评分功能组合用基础模型中的前3个对接结果和具有蛋白质柔性时的前1个对接结果来分析对接结果。所有的UGT76G1氨基酸示于下文中的表18中。通过选择在对两个或更多个模型的对接分析中发现在RebD和RebM的内的所有残基来确定饱和文库的位点(以粗体“x”表示)。此外,选择在RebM和RebD19-O-葡萄糖部分的内的所有残基,这些残基位于RebD→RebM反应的结合位点中。将在类似酶间完全保守的残基从筛选中忽略,将这些残基以粗体和“!”表示。表18.对UGT76G1中参与RebM和RebD结合的氨基酸的预测。粗体表示氨基酸完全保守。粗体“!”表示在类似酶间完全保守并且在筛选中被忽略的氨基酸残基。实施例12:UGT76G1位点饱和文库预筛选在进行如本文中所述的UGT76G1位点饱和文库筛选之前,监测96和4x24深孔板中RebM和RebD的培养物生长和产生。采用标准的乙酸锂方案,用含有WT-76G1的p416GPD转化EFSC3385菌株,并将转化子平板接种在SC-URA平板上。EFSC3385是一种UGT76G1缺陷型菌株,因此直到被含有活性UGT76G1的质粒转化后才会产生RebE。该菌株的UGT76G1编码区遭到破坏(该编码区被spHIS5标记替代)并且还包含整合拷贝的UGT91D2e-2X突变体、UGT74G1、ATR2、UGT85C2、甜菊CPR8(2个拷贝)、拟南芥KS5(2个拷贝)、聚球藻属GGPPS7、经密码子优化的甜菊KAHe1(2个拷贝)、甜菊KO(2个拷贝)、截短的玉米CDPS5(2个拷贝)和EUGT11。对于96深孔板条件,将96个菌落转移至含有1mLSC-URA的96深孔板,并将该板在30℃和400RPM下孵育96小时。对于4x24深孔板处理,将96个菌落转移至含有3mLSC-URA的板。将该板在30℃和320RPM下孵育96小时,随后将每个孔中的200μL转移至96深孔板。将每个板中的50μL培养物转移至96孔聚合酶链式反应(PCR)板并用100%二甲基亚砜(DMSO)以1∶1稀释。将该板热密封、在80℃下孵育10分钟并随后冷却至25℃。将该板以4000RPM旋转10分钟,并将50μL转移至新的板以进行LC-MS分析。UGT76G1位点饱和文库预筛选的结果可见于图15中。RebD和RebM产量方面的差异可由在96小时孵育期过程中发生蒸发来解释,特别是位于板边缘的孔中。与4x24深孔板相比,于96深孔板中培养的菌落产生较高浓度的RebM和RebD表明这些板更适合进行LC-MS分析,因此被选定用于进行UGT76G1位点饱和文库筛选。实施例13:UGT76G1位点饱和文库筛选通过Baseclear公司,使用限制性位点SpeI和XhoI将UGT76G1从EPSC2060(p423GPD)亚克隆到EPSB492(p416GPD)上并使用简并NNS引物产生位点饱和文库。采用标准的乙酸锂方案,将EFSC3385菌株用该文库或含有WT-76G1的对照质粒转化并将转化子平板接种在SC-URA板上。向96深孔板加入1mLSC-URA培养基,挑选实施例9中鉴定的38个位点饱和文库残基中每一个的菌落并将其在30℃和400RPM下在96深孔板中孵育96小时。然后,将每份培养物试样中的50μL转移至含有50μL100%DMSO的96孔PCR板。随后,将该板热密封、在80℃下孵育10分钟、随后冷却至12℃并以4000RPM旋转10分钟。将每份上清液中的70μL培养混合物转移至新的板以进行LC-MS分析。图16示出了UGT76G1位点饱和文库筛选的所有数据点,其中野生型产量以黑色三角形表示。变体编号系统可见于表19中。表19.对UGT76G1位点饱和文库变体的编号编号残基1VAL202PHE223GLN234GLY245ILE266ASN497PHE508ASN519PRO5310LYS5411THR5512SER5613LEU8514LEU12615TRP12716TYR12817MET14518THR14619SER14720ASN15121HIS15522LYS191编号残基23SER19524GLN19825ILE19926LEU20027GLU20228ILE20329SER25330LEU25731SER28332THR28433SER28534PHE31435LYS33736GLY37837LEU37938ASP380表20和图17示出了对RebM或RebD的产生具有最高选择性的UGT76G1变体菌落,将这些菌落选定用于进行进一步研究。在图17中,具有“WT”前缀的所有数据点表示野生型酶的RebM和RebD产量。显示,与野生型对照相比,所选择的酶变体表现出抑制的RebD/RebM活性或提高的RebM产量。表20.靠前的产生RebM-和RebD的菌落菌落RebM(μM)RebD(μM)A116.2823.35A24.8324.12A32.9225.13菌落RebM(μM)RebD(μM)A434.0712.24A55.6623.72A611.0823.50A75.3324.35A838.3611.90A942.1813.76A1033.808.95A1134.6610.13A1240.449.30B136.8613.64B234.889.05B338.616.64B420.8424.42B522.7023.28B635.499.63B734.558.71B835.4711.31B935.629.17B1037.597.80B1136.7612.41B122.3126.75C12.2123.66C29.2424.56C31.9323.18菌落RebM(μM)RebD(μM)C410.4724.70C54.9123.09C62.3827.11C711.0628.32C813.7723.07C935.589.92C1033.515.02C1133.874.24C126.0430.20D133.514.93D243.1812.50D334.048.06D435.9212.38D537.117.14D644.6611.19D733.6113.36D836.198.68D936.8816.12D1011.2530.00D1111.6831.55E156.607.58E212.1830.41E313.7533.16E48.7927.90菌落RebM(μM)RebD(μM)E58.6925.33E611.7828.56E78.3123.67E89.1925.35E97.7727.41E108.9624.06E1111.2531.88E1210.1824.20F19.9423.65F238.3612.57F337.3715.35F48.8925.59F510.7823.51F611.4127.57F710.9626.18F835.8614.67F95.6929.07F1013.8432.85F112.8127.27F1239.8610.64G137.948.80G29.5623.64G333.809.62G43.0125.15菌落RebM(μM)RebD(μM)G59.8125.41G642.719.96G71.6524.20G89.6324.28G933.6522.69G1034.879.69G1133.6611.49G123.5824.04H133.949.84H210.3923.59H343.649.40H433.508.73H536.329.39H634.617.69H736.739.20H835.494.09H934.254.82H1035.364.10H1119.8725.19实施例14:UGT76G1位点饱和文库再筛选和变体测序以一式三份方式对47个RebD或RebM产量最高的UGT76G1变体菌落进行再筛选,并且再筛选与初始筛选显示出相同的趋势(图19)。通过汇编筛选和再筛选的结果来选择进行测序的菌落。当不能直接比较筛选和再筛选的产生水平时,将菌落分别从最高的产生RebD和RebM的菌落至最低的产生RebD和RebM的菌落排序,并计算筛选和再筛选排名的平均值。由平均值鉴定出前16个产生RebD的菌落、前16个产生RebM的菌落和前16个产生RebD/M的菌落(总共48个菌落)。当发现靠前的产生RebD的菌落和靠前的产生RebM的菌落是相同菌落时,将重复菌落只计数一次并选择另外的菌落以达到总共48个测序菌落。然后,将这些菌落以一式两份方式用下文所示的GPDseq_正向和CYC1seq-反向引物进行测序。GPDseq_正向引物序列:CGGTAGGTATTGATTGTAATT(SEQIDNO:87)CYC1seq_反向引物序列:CTTTTCGGTTAGAGCGGATGT(SEQIDNO:88)表21-23示出了由指定变体产生的RebD、RebM和RebD/RebM的量和排名,并且表24总结了选择性地提高RebD或RebM的产量的突变。野生型和UGT76G1变体菌落产生的RebM、RebD、RebA、覆盆子苷和RebB的量示于表25中。表21.靠前的产生RebD的UGT76G1变体的身份。表22.靠前的产生RebM的UGT76G1变体的身份。表23.靠前的产生RebD/M的UGT76G1变体的身份。表24.对获得产生RebD和产生RebM的UGT76G1变体的总结。表25.UGT76G1变体的甜菊醇糖苷产量实施例15:UGT76G1糖基化的相对速率的确定在文献中,仅知道UGT76G1催化1,2-甜菊苷被1,3-糖基化以将其转化成RebA并将1,2-二糖苷转化成RebB。本发明人新发现UGT76G1催化表26中所示的反应。表26.新发现的UGT76G1反应。与实施例9类似,将含有WT-76G1的p416GPD在SC-ura培养基中在蛋白酶缺陷型酵母菌株DSY6中表达48小时。然后,将100μL细胞重新接种在3mLSC-ura培养基中16小时。根据生产商的说明,将细胞用200μLCelLyticTMY裂解。将6μL裂解液添加至24μL由20mMTris缓冲液(pH8.0)、0.3μMUDPG和0.1μM覆盆子苷、0.2μM1,2-二糖苷、0.2μM1,2-甜菊苷、0.2μMRebA或0.1μMRebE组成的反应混合物。将反应在30℃下孵育并在0、1、2和18小时通过将30μL反应混合物中的25μL转移至25μLDMSO停止。通过LC-MS分析甜菊醇糖苷的量并将其作为“曲线下的面积”在数据处理期间通过峰积分进行评估。图19中显示,在18小时内覆盆子苷的“曲线下面积”降低约50%导致显著产生1,3-甜菊苷(RebG)。在18小时首次检测到本发明人新发现的RebQ。另外,图19显示1,2-甜菊苷在18小时内并未被完全消耗用于产生RebA,因为1,2-二糖苷用于产生RebB。此外,使用1,2-甜菊苷或RebA作为底物时,在甜菊醇+5葡萄糖色谱图上在1.96分钟出现洗脱峰(图20)。由于RebD在1.11分钟被洗脱并且UGT76G1只催化1,3-糖基化反应,所以在1.96分钟洗脱的峰看来是RebI。然而,不能对RebI峰进行积分因为其位于底物伪影峰中(图20)。这些结果共同表明UGT76G1优先催化在13-O-位被1,2-糖基化的甜菊醇糖苷底物的糖基化,之后是在13-O-位被单糖基化的甜菊醇糖苷底物。看来几乎不会优先发生19-O-位的糖基化状态。图1总结了甜菊醇糖苷的糖基化反应以及已知催化这些反应的酶。实施例16.UGT76G1变体的甜菊醇糖苷产量每种甜菊醇糖苷的定量标准物都不能市售获得,这妨碍了一些浓度测量。因此,可在数据处理期间通过峰积分来评估与野生型酶相比酶变体的另外甜菊醇糖苷的产量。将每种变体的“曲线下面积”根据野生型UGT76G1归一化并示于表27中。这些数据与前述实施例相一致,但是另外显示一些变体不产生1,3-甜菊苷(RebG)、覆盆子苷、“RebQ”和/或1.43分钟洗脱的甜菊醇-四糖苷,而野生型对照却产生。这一观察可解释RebM和RebD产量的提高。表27.作为相对于野生型UGT76G1产量之UGT76G1变体的甜菊醇产量的量度的“曲线下面积”。表28总结了与野生型对照的归一化产量相比通过RebD优化和RebM优化的突变之甜菊醇糖苷产量的趋势。RebD产量提高的变体看来主要是抑制RebD→RebM反应的结果。另外的RebD产量可能由覆盆子苷→RebG→RebQ甜菊醇糖基化分支受到抑制以及RebB和1.43分钟洗脱的四葡糖苷降低引起。出乎意料的是,1,2-甜菊苷提高4倍并且RebE提高7倍,但是RebE提高可能是野生型对照中存在的很少量副产物提高7倍。尽管如此,这一发现表明RebD优化的突变已部分地抑制甜菊苷→RebA反应,表现为RebA中间体降低。表28.通过UGT76G1野生型或RebD和RebM优化的突变的甜菊醇糖苷产量与野生型相比,导致最高RebD水平的突变L257G产生接近4倍的RebD,并且存在于所测序的6个菌落中。另一些L257突变证明具有几乎相同的生产力。突变体I26W和S283G表现出最高的RebD/甜菊苷比值,表明这些突变导致最大程度地抑制RebD→M反应而不减缓甜菊苷→RebA反应。这两个突变还完全消除覆盆子苷→RebG→RebQ途径并降低1.43分钟洗脱的四葡糖苷的量,而对RebB的产量具有最小影响。发现T146G和S283N突变体具有最佳RebD/RebM比值,与野生型相比,其表现出40至50倍的提高。经发现具有L257R的S389F突变证明比单独的L257R具有更高的RebD产量。一般来说,RebM的提高还导致RebD提高,同时降低或者完全阻断覆盆子苷→RebG→RebQ糖基化途径和1.43分钟洗脱的四葡糖苷。然而,所研究的其余甜菊醇糖苷看来不受影响。与野生型相比,靠前的产生的RebM突变体T55K和K337分别使RebM提高1.3倍,并使覆盆子苷降低0.6倍。由于野生型中只存在0.7μM的覆盆子苷,所以该观察到的降低并不足以解释RebM的提高。覆盆子苷→RebG→RebQ途径几乎被去除,并且不存在由这些突变体产生的1,3-甜菊苷(RebG)。而且,与野生型相比,具有K337P突变的变体产生0.6倍的RebQ水平。突变H155L和L379V分别产生更高的RebM/RebD,其中野生型UGT76G1产生约4.58的RebM/RebD,而H155L和L379分别产生约6.66和5.88的RebM/RebD。通过本研究未涵盖的数据,UGT76G1酶可被筛选用于鉴定对RebD和RebM的动力学具有改善并且使副产物尽可能少的物种,从而提高向期望甜菊醇糖苷的通量。尽管已经参照本发明的一些具体实施方案对其进行了详细描述,但显而易见的是可对本发明进行更改和改变而不背离所附权利要求书中所限定的本发明范围。更具体地,虽然本发明的一些方面在本文中被认为是特别有利的,但是应想到本发明不必需局限于本发明的这些具体方面。参考文献1.CriticalReviewsinFoodScienceandNutrition,52:11,988-998,DOI:10.1080/10408398.2010.519447.2.JNatProd.2013Jun28;76(6):1201-28.doi:10.1021/np400203b.Epub2013May28.3.PlantPhysiologyandBiochemistry63(2013)245e253.4.PraveenGuleriaandSudeshKumarYadav,2013.InsightsintoSteviolGlycosideBiosynthesisPathwayEnzymesThroughStructuralHomologyModelling.AmericanJournalofBiochemistryandMolecularBiology,3:1-19.5.ThePlantJournal(2005)41,56-67doi:10.1111/j.1365-313X.2004.02275.6.Madhavetal.,“Functionalandstructuralvariationofuridinediphosphateglycosyltransferase(UGT)geneofSteviarebaudianaeUGTSrinvolvedinthesynthesisofrebaudiosideA”PlantPhysiologyandBiochemistry63(2013)245e253.7.JewettMC,etal.,MolecularSystemsBiology,Vol.4,article220(2008).8.MasadaSetal.,FEBSLetters,Vol.581,2562-2566(2007).当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1