用于产生补身醇及其混合物的倍半萜合酶的制作方法

文档序号:19429296发布日期:2019-12-17 16:12阅读:440来源:国知局
用于产生补身醇及其混合物的倍半萜合酶的制作方法

本文提供了产生补身醇和相关化合物和衍生物以及包含补身醇的混合物的生化方法,该方法包括使用新型多肽。



背景技术:

萜烯发现于大多数生物体(微生物、动物和植物)中。这些化合物由称为异戊二烯单元的五碳单元构成并且通过存在于它们结构中的这些单元的数目进行分类。因此,单萜、倍半萜和二萜是分别含有10、15和20个碳原子的萜烯。例如,在植物界中广泛地发现有倍半萜。许多倍半萜分子因为它们的风味和芳香特性以及它们的美容、医疗和抗菌效果而众所周知。已经鉴定出许多倍半萜烃和倍半萜类化合物。

萜烯的生物合成产生涉及称为萜合酶的酶。在植物界中存在多种倍半萜合酶,它们均使用相同的底物(法呢基二磷酸酯,fpp),但是具有不同的产品构造。已经克隆了编码倍半萜合酶的基因和cdna并且表征了相应的重组酶。

目前,补身醇的主要来源是天然含有补身醇的植物。但是,这些天然来源中的补身醇含量很低。已经开发了化学合成途径,但是仍然很复杂并且不具有成本效益。仍然需要发现新的萜烯、萜合酶以及从中产生补身醇及其衍生物和包含补身醇的混合物的更具成本效益的方法。



技术实现要素:

本文提供了一种产生补身醇或包含补身醇的混合物的方法,包括:

a.使无环法呢基二磷酸酯(fpp)前体与具有倍半萜合酶活性的多肽接触,以产生补身醇或包含补身醇与一种或多种萜烯的混合物,其中该多肽包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,或包含seqidno:2的氨基酸序列;和

b.任选地,分离补身醇。

还提供了一种方法,该方法包括用编码具有补身醇合酶活性的多肽的核酸转化宿主细胞或非人宿主生物体,其中该多肽包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,或包含seqidno:2。

还提供了一种方法,其进一步包括在允许产生多肽的条件下,培养能够产生fpp并经转化以表达多肽的非人宿主生物体或宿主细胞,其中该多肽包含与seqidno:2有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。

在一个形态中,分离了由上述方法产生的补身醇。

在另一形态中,该方法进一步包括使补身醇与至少一种酶接触以产生补身醇衍生物。

在另一方面,该方法包括使用化学合成或生物化学合成将补身醇转化为补身醇衍生物。

本文还提供了一种分离的多肽,其具有补身醇合酶活性,包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列或包含seqidno:2的氨基酸序列。

本文进一步提供了一种分离的核酸分子,其包含编码多肽的核苷酸序列,该多肽具有补身醇合酶活性,并且包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列或包含seqidno:2的氨基酸序列。

还提供了一种分离的核酸,其包含与seqidno:1或seqidno:3有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的核苷酸序列,或包含seqidno:1和seqidno:3的核苷酸序列。

还提供了一种分离的核酸分子,其编码本文提供的多肽。

本文提供的一个形态是一种载体,其包含本文所述的核酸分子。在另一形态中,该载体是表达载体。在另一形态中,该载体是原核载体、病毒载体或真核载体。

还提供了非人宿主生物体或宿主细胞,其包含(1)上述核酸分子,或(2)包含所述核酸分子的表达载体。在一个形态中,非人生体物或宿主细胞是原核或真核细胞。在另一形态中,宿主细胞是细菌细胞、植物细胞、真菌细胞或酵母。在另一形态中,细菌细胞是大肠杆菌,而酵母细胞是啤酒酵母。

进一步提供了本文所述的多肽在产生补身醇或包含补身醇与一种或多种萜烯的混合物中的用途。

在一个形态中,以上方法或用途中产生的混合物包含补身醇和橙花叔醇。

在另一形态中,分离了补身醇和/或橙花叔醇。

附图说明

图1.(-)-补身醇的结构。

图2.真实的(-)-补身醇的质谱图。

图3.真实的(-)-补身醇的13cnmr谱。

图4.真实的(-)-补身醇的x射线(cukα辐射)结构。

图5显示了窄叶芍药(paeoniaanomala)根的二氯甲烷提取物的gc/ms色谱图。箭头表示补身醇的峰。

图6.显示了patps3的大肠杆菌表达实验的gc/ms色谱图(仅显示倍半萜区域)。

图7.显示了图6中的补身醇峰的质谱图。

图8.显示了patps3体外测定的gc/ms色谱图(仅显示倍半萜区域)。

图9.显示了图8中的补身醇峰的质谱图。

具体实施方式

使用的缩写

bp碱基对

kb千碱基

dna脱氧核糖核酸

cdna互补dna

dtt二硫苏糖醇

fpp法呢基二磷酸酯

gc气相色谱

iptg异丙基-d-硫代半乳糖-吡喃糖苷

lb溶源性肉汤

ms质谱/质谱法

mva甲羟戊酸

pcr聚合酶链反应

rna核糖核酸

mrna信使核糖核酸

mirna微rna

sirna小干扰rna

rrna核糖体rna

trna转移rna

定义

术语“多肽”是指连续聚合的氨基酸残基,例如至少15个残基,至少30个残基,至少50个残基的氨基酸序列。在本文的一些实施方案中,多肽包含作为酶、其片段或其变体的氨基酸序列。

术语“蛋白”是指任何长度的氨基酸序列,其中氨基酸通过共价肽键连接,并且包括寡肽、肽、多肽和全长蛋白,不管天然生成的还是合成的。

术语“分离的”多肽是指通过本领域已知的任何方法或这些方法(包括重组、生物化学和合成法)的组合从天然环境中取出的氨基酸序列。

术语“倍半萜合酶”或“具有倍半萜合酶活性的多肽”涉及一种多肽,其能够从无环萜烯焦磷酸酯,尤其是法呢基二磷酸酯(fpp)开始,催化倍半萜或包含一种或多种倍半萜(例如补身醇和/或橙花叔醇)的混合物的合成。

术语“补身醇合酶”或“具有补身醇合酶活性的多肽”或“补身醇合酶蛋白”涉及一种多肽,其能够从无环萜烯焦磷酸酯,尤其是法呢基二磷酸酯(fpp)开始,催化补身醇(非立体异构体或其混合物的形式)的合成。补身醇可以是唯一的产品,或者可以是倍半萜混合物的一部分。

术语“生物学功能”,“功能”,“生物学活性”或“活性”是指补身醇合酶催化形成补身醇或包含补身醇与一种或多种萜烯的化合物混合物的能力。

术语“包含补身醇的萜烯的混合物”或“包含补身醇的倍半萜的混合物”是指萜烯或倍半萜的混合物,其包含补身醇与一种或多种另外的萜烯或倍半萜。

术语“核酸序列”、“核酸”、“核酸分子”和“多核苷酸”可互换使用,是指核苷酸的序列。核酸序列可以是任意长度的单链或双链脱氧核糖核苷酸或核糖核苷酸,并且包括基因、外显子、内含子、有义和反义互补序列、基因组dna、cdna、mirna、sirna、mrna、rrna、trna、重组核酸序列、分离的和纯化的天然产生的dna和/或rna序列、合成的dna和rna序列、片段、引物和核酸探针的编码和非编码序列。技术人员了解rna的核酸序列与dna序列相同,差异在于胸腺嘧啶(t)被替代为尿嘧啶(u)。术语“核苷酸序列”也应理解为包含单独的片段形式或作为较大核酸组分的多核苷酸分子或寡核苷酸分子。

“分离的核酸”或“分离的核酸序列”涉及一种核酸或核酸序列,其所处的环境与天然产生的核酸或核酸序列所处的环境不同,并且可以包括基本上不含污染内源性物质的那些。如本文使用的应用于核酸的术语“天然产生的”是指一种核酸,其在自然界的生物的细胞中发现,并且未经人类在实验室中进行有意的修饰。

“重组核酸序列”是使用实验室方法(例如分子克隆)将来自多于一个源的遗传物质组合在一起所生成的核酸序列,由此创造出或修饰出不是天然产生并且不能以其他方式在生物有机体中发现的核酸序列。

“重组dna技术”是指用于制备重组核酸序列的分子生物学方法,例如描述于由weigel和glazebrook编辑的laboratorymanuals,2002,coldspringharborlabpress;和sambrook等,1989coldspringharbor,ny:coldspringharborlaboratorypress。

术语“基因”是指一种dna序列,其包含可操作地连接到适当调控区域(例如启动子)的被转录为rna分子(例如细胞中的mrna)的区域。因此,基因可以包含几个可操作地连接的序列,诸如启动子、5’前导序列(包含例如参与翻译初始化的序列)、cdna或基因组dna的编码区、内含子、外显子和/或3’非翻译序列(包含例如转录终止位点)。

“嵌合基因”是指通常不能在自然界的物种中发现的任何基因,特别是这样一种基因,其中核酸序列存在一个或多个部分在性质上彼此不相关联。例如,启动子在性质上与转录区的部分或全部或与另一调控区不相关联。术语“嵌合基因”应当被理解为包括表达构建体,其中启动子或转录调控序列被可操作地连接到一个或多个编码序列或反义(即有义链的反向互补链)或反向重复序列(有义和反义,由此rna转录物在转录后形成双链rna)。术语“嵌合基因”还包括通过组合一个或多个编码序列的部分以产生新基因而获得的基因。

“3’urt”或“3’非翻译序列”(也称为“3’未翻译区”或“3’末端”)是指在基因编码序列的下游发现的核酸序列,其包含例如转录终止位点和(在大多数但非全部的真核mrna中)多聚腺苷酸化信号,例如aauaaa或其变体。在转录终止后,mrna转录物可以在多聚腺苷酸化信号的下游切去,并且可以添加poly(a)尾,其参与了mrna向翻译位点例如细胞质的转运。

“基因的表达”涵盖“异源表达”和“过表达”,并且涉及基因的转录和mrna向蛋白质的翻译。过表达是指在转基因细胞或生物体中,以mrna、多肽和/或酶活性水平测量的基因产物的产生超过了相似遗传背景的非转化细胞或生物体中的产生水平。

如本文中使用的“表达载体”是指这样一种核酸分子,其使用分子生物学方法和重组dna技术工程化以将外来或外源dna递送到宿主细胞中。表达载体典型地包括正确转录核苷酸序列所需的序列。编码区通常编码目的蛋白,但是也可以编码rna,例如反义rna、sirna等。

如本文所使用的“表达载体”包括任何线性的或环状的重组载体,包括但不限于病毒载体、噬菌体和质粒。技术人员根据表达系统能够选择适合的载体。在一个实施方案中,表达载体包括本文实施方案的核酸,其可操作地连接到至少一个调控序列,其控制转录、翻译、起始和终止,例如转录启动子、操纵子或增强子,或mrna核糖体结合位点,并且可选地包括至少一个选择标记。当调控序列功能性地涉及本文实施方案的核酸时,核苷酸序列是“可操作地连接的”。

“调控序列”是指这样一种核酸序列,其确定本文实施方案的核酸序列的表达水平、并且能够调控可操作地连接到该调控序列的核酸序列的转录速率。调控序列包含启动子、增强子、转录因子、启动子元件等。

“启动子”是指一种核酸序列,其通过提供rna聚合酶用的结合位点以及适合转录所需的其它因子,包括但不限于转录因子结合位点、抑制子和活化子蛋白结合位点,来控制编码序列的表达。术语启动子的含义还包括术语“启动子调控序列”。启动子调控序列可以包括可能影响转录、rna加工或相关编码核酸序列的稳定性的上游和下游元件。启动子包括天然来源的和合成的序列。编码核酸序列通常位于启动子相对于以转录起始位点为起始的转录方向的下游。

术语“组成型启动子”是指不受调控的启动子,其允许其可操作地连接的核酸序列的持续转录。

如本文所使用的,术语“可操作地连接”是指处于功能性关系的多核苷酸元件的连接。当核酸与另一核酸序列处于功能性关系时,那么该核酸是“可操作地连接”的。例如,如果启动子或者转录调控序列能够影响编码序列的转录,那么该启动子或者转录调控序列是可操作地连接到该编码序列的。可操作地连接意味着被连接的dna序列通常是邻接的。与启动子序列有关的核苷酸序列相对于要被转化的植物可以是同源或异源来源的。所述序列还可以是完全或部分合成的。不管来源如何,与启动子序列有关的核酸序列将根据在结合到本文实施方案的多肽后所连接的启动子性质而表达或沉默。相关核酸在所有时间或替代地在特定时间在整个生物体中或在特定组织、细胞或细胞室中可以编码需要表达或抑制的蛋白。此种核苷酸序列特别地编码将所需表型性状赋予给由其改变或转化的宿主细胞或生物体的蛋白质。更特别地,相关的核苷酸序列导致在细胞或生物体中产生补身醇或者包含补身醇与一种或多种萜烯的混合物。特别地,核苷酸序列编码具有补身醇合酶活性的多肽。

“靶肽”是指一种氨基酸序列,其将蛋白质或多肽靶向细胞内细胞器(即,线粒体或质体)或细胞外空间(分泌信号肽)。编码靶肽的核酸序列可以被融合到编码蛋白或多肽的氨基末端(例如n-末端)的核酸序列,或者可以被用来替换原有的靶多肽。

术语“引物”是指短的核酸序列,其被杂交到模板核酸序列并且被用于与该模板互补的核酸序列的聚合。

如本文所使用的,术语“宿主细胞”或“经转化的细胞”是指被改变以包藏至少一种核酸分子的细胞(或生物体),例如,编码所需蛋白质或核酸序列的重组基因,其在转录时产生补身醇合酶蛋白,该蛋白可用于产生补身醇或包含补身醇与一种或多种萜烯的混合物。宿主细胞特别是细菌细胞、真菌细胞或植物细胞。宿主细胞可包含已整合到宿主细胞的核或细胞器基因组中的重组基因。或者,宿主可以在染色体外含有重组基因。

同源序列包括直系同源或旁系同源序列。鉴别直系同源物或旁系同源物的方法包括现有技术中已知且在本文中描述的系统发生学方法、序列相似性和杂交方法。

旁系同源物来源于基因复制,其产生具有相似序列和相似功能的两种或更多种基因。旁系同源物典型地聚簇在一起并且通过基因在相关植物物种内的复制而形成。使用成对blast分析或在基因家族的系统发生分析过程中使用程序诸如clustal在类似基因的组中发现旁系同源物。在旁系同源物中,共有序列可被鉴定为其特征在于相关基因中的序列并且具有基因的类似功能。

直系同源物或直系同源序列是彼此相似的序列,因为它们发现于由共同的祖先传下的物种中。例如,已知具有共同祖先的植物物种含有许多具有相似序列和功能的酶。技术人员能够鉴定直系同源序列并预测直系同源的功能,例如通过使用clustal或blast程序构建一个物种的基因族的系统发生树。一种用于鉴定或确认同源序列间的相似功能的方法是通过比较过表达或缺乏(在基因敲除/敲减中)相关多肽的宿主细胞或生物体(如植物)中的转录物概况。技术人员能够理解,具有相似转录物概况的基因(具有大于50%调控的共同转录物,或具有大于70%调控的共同转录物,或大于90%调控的共同转录物)会具有相似的功能。本文所述序列的同源物、旁系同源物、直系同源物以及任何其他变体预期通过使宿主细胞、生物体例如植物产生补身醇合酶蛋白从而以类似的方式发挥作用。

术语“选择性标记物”是指在表达后能够被用来选择包括该选择性标记物的(一种或多种)细胞的任何基因。以下描述了选择性标记物的例子。技术人员了解不同的抗生素、杀真菌剂、营养缺陷型或除草剂选择性标记物可适用于不同的目标物种。

本申请目的的“补身醇”是指(-)-补身醇(cas:468-68-8)(还可参见图1-图4)。

术语“生物体”是指任何非人的多细胞或单细胞生物体,例如植物或微生物。特别地,微生物是细菌、酵母、藻类或真菌。

术语“植物”可互换使用以包括植物细胞,包括植物原生质体、植物组织、产生再生植物或植物部分的植物细胞组织培养物、或植物器官诸如根、茎、叶、花、花粉、胚珠、胚、果实等。任何植物均可以用来实施本文实施方案的方法。

当特定的生物体或细胞天然地产生fpp或当其不天然地产生fpp但是在使用本文所述的核酸转化之前或与所述核酸一起被转化以产生fpp时意味着“能够产生fpp”。经转化以比天然存在的生物体或细胞产生更高量的fpp的生物体或细胞也被“能够产生fpp的生物体或细胞”所涵盖。

对于本文和所附权利要求的描述,除非另有说明,否则“或”的使用意味着“和/或”。类似地,各种时态的“含”、“含有”、“包含”和“包括”是可互换的而不是限制性的。

应当进一步理解的是,在各种实施方案的描述使用术语“包含”的情况下,本领域技术人员将理解,在一些特定情况下,可以使用“基本上由……组成”或“由……组成”的语言来替代地描述实施方案。

详细说明

本发明具体涉及以下实施方案:

a.使无环法呢基二磷酸酯(fpp)前体与具有倍半萜合酶活性的多肽接触,以产生补身醇或包含补身醇与一种或多种萜烯的混合物,其中该多肽包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,或包含seqidno:2的氨基酸序列;和

b.任选地,分离补身醇。

2.实施方案1的方法,包括用编码具有补身醇合酶活性的多肽的核酸转化宿主细胞或非人宿主生物体,其中该多肽包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,或包含seqidno:2。

3.前述实施方案之一的方法,其进一步包括在允许产生多肽的条件下,培养能够产生fpp并经转化以表达多肽的非人宿主生物体或宿主细胞,其中该多肽包含与seqidno:2有至少55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。

4.根据实施方式1所述的方法,其中,分离了该补身醇。

5.前述实施方案之一的方法,其包括使补身醇与至少一种酶接触以产生补身醇衍生物。

6.前述实施方案之一的方法,包括使用化学合成或生物化学合成将补身醇转化为补身醇衍生物。

7.一种分离的多肽,其具有补身醇合酶活性,包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列或包含seqidno:2的氨基酸序列。

8.一种分离的核酸分子,

a.包含编码实施方案7的多肽的核苷酸序列;

b.包含与seqidno:1或seqidno:3的核苷酸序列有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的核苷酸序列;或者

c.包含seqidno:1或seqidno:3的核苷酸序列。

9.一种载体,包含:

a.实施方案8的核酸分子;或者

b.编码实施方案7的多肽的核酸。

10.实施方案9的载体,其中该载体是原核载体、病毒载体或真核载体。

11.前述实施方案之一的载体,其中该载体是表达载体。

12.一种宿主细胞或非人宿主生物体,包含:

a.实施方案8的分离的核酸;或者

b.实施方案9至11中任一项的载体。

13.实施方案2或3中任一项的方法,其中该细胞是原核细胞。

14.实施方案13的方法,其中该原核细胞是细菌细胞。

15.实施方案14的方法,其中该细菌细胞是大肠杆菌。

16.实施方案2或3中任一项的方法,其中该细胞是真核细胞。

17.实施方案16的方法,其中该真核细胞是酵母细胞或植物细胞。

18.实施方案17的方法,其中该酵母细胞是啤酒酵母。

19.实施方案7的多肽在产生补身醇或包含补身醇与一种或多种萜烯的混合物中的用途。

20.实施方案19的用途,其中该混合物包含补身醇和橙花叔醇。

21.实施方案1的方法,其中该混合物包含补身醇和橙花叔醇。

22.实施方案21的方法,其中,分离了所产生的补身醇和/或橙花叔醇。

另外,本文提供了一种核酸分子,其包含与seqidno:1或seqidno:3有至少75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的核苷酸序列,或包含seqidno:1或seqidno:3的核苷酸序列或其反向互补序列。

根据一个实施方案,该核酸分子由核苷酸序列seqidno:1或seqidno:3或其反向互补序列组成。

在一个实施方案中,本文实施方案的核酸可以天然存在于芍药属(paeonia)植物中或其他植物物种中,或通过修饰seqidno:1或seqidno:3或其反向互补序列而获得。

在另一个实施方案中,核酸分离自或衍生自芍药(paeoniaceae)科植物。在另一个实施方案中,核酸分离自或衍生自窄叶芍药(paeoniaanomala)。

进一步提供了通过修饰seqidno:1或seqidno:3或其反向互补序列获得的核苷酸序列,其包括使用本领域已知的任何方法,例如通过引入任何类型的突变例如缺失、插入和/或取代突变,通过修饰seqidno:1或seqidno:3或其反向互补序列获得的任何序列。包含通过seqidno:1或seqidno:3的突变获得的序列或其反向互补序列的核酸也包括在本文实施方案中,条件是它们所包含的序列共有seqidno:1或seqidno:3或其反向互补序列的至少定义的序列同一性,并且条件是它们编码如上述任何一个实施方案中所定义的具有补身醇合酶活性的多肽。突变可以是这些核酸的任何种类的突变,例如,seqidno:1或seqidno:3的dna序列的一个或多个核苷酸的点突变、缺失突变、插入突变和/或移码突变。在一个实施方案中,本文的一个实施方案的核酸可以被截短,条件是其编码本文所述的多肽。

可以制备变体核酸以使其核苷酸序列适应特定的表达系统。例如,如果氨基酸由特定的密码子编码,则已知细菌表达系统可更有效地表达多肽。

由于遗传密码的简并性,多于一个密码子可以编码相同的氨基酸序列,多个核酸序列能够编码相同的蛋白或多肽,所有这些dna序列均被涵盖在本文实施方案中。在适当的情况下,编码补身醇合酶的核酸序列可以被优化以增加在宿主细胞中的表达。例如,可以使用宿主特异性的密码子合成本文实施方案的核苷酸以改善表达。

在一个实施方案中,本文提供了一种分离的,重组的或合成的核酸序列,其为seqidno:1或seqidno:3的编码具有补身醇合酶活性的多肽的序列,该多肽包含seqidno:2的氨基酸序列或其片段,其能催化在细胞中从fpp前体至补身醇或包含补身醇与一种或多种萜烯的混合物的产生。

本文还提供了cdna,基因组dna和rna序列。编码补身醇合酶或其变体的任何核酸序列在本文中也称为补身醇合酶编码序列。

根据一个实施方案,seqidno:1或seqidno:3的核酸是补身醇合酶基因的编码序列,其编码实施例中所述获得的补身醇合酶。

seqidno:1或seqidno:3的多核苷酸的片段是指特别地为本文实施方案的多核苷酸的至少15bp、至少30bp、至少40bp、至少50bp和/或至少60bp长度的连续核苷酸。特别地,多核苷酸的片段包含本文实施方案的多核苷酸的至少25、更特别地至少50、更特别地至少75、更特别地至少100、更特别地至少150、更特别地至少200、更特别地至少300、更特别地至少400、更特别地至少500、更特别地至少600、更特别地至少700、更特别地至少800、更特别地至少900、更特别地至少1000个连续核苷酸。不受限制地,本文的多核苷酸的片段可以用作pcr引物和/或用作探针、或用于反义基因沉默或rnai。

本领域技术人员清楚的是,基因(包括本文实施方案的多核苷酸)可以通过本领域已知的方法基于可获得的核苷酸序列信息(诸如在所附的序列表中所见)进行克隆。这些包括例如设计表示此种基因的侧翼序列的dna引物,所述基因的一种是在有义取向上产生的并且发起有义链的合成,而另一种以反向互补的方式创造并且产生反义链。诸如在聚合酶链反应中使用的那些热稳定的dna聚合酶通常被用来进行此种实验。替代地,代表基因的dna序列可以被化学合成并且随后导入到dna载体分子中,所述dna载体分子可以通过例如相容性细菌(诸如大肠杆菌)来繁殖。

在本文提供的一个相关实施方案中,提供了用于检测编码补身醇合酶的核酸序列的pcr引物和/或探针。技术人员将能够了解基于seqidno:1或seqidno:3合成简并的或特异性pcr引物对,以扩增编码补身醇合酶的核酸序列或其片段的方法。用于编码补身醇合酶的核酸序列的检测试剂盒可以包括对编码补身醇合酶的核酸序列有特异性的引物和/或探针,以及使用该引物和/或探针来检测样品中编码补身醇合酶的核酸序列的相关方案。此种检测试剂盒可以用来确定植物、生物体或细胞是否已被修饰,即是否已使用编码补身醇合酶的序列转化。

为了测试根据本文一个实施方案的变体dna序列的功能,将目标序列可操作地连接到可选择的或可筛选的标记基因,并且在使用原生质体进行的瞬时表达分析中或在稳定转化的植物中测试报告基因的表达。技术人员将认识到,能够驱动表达的dna序列被构建为模块。因此,来自较短dna片段的表达水平可能不同于来自最长片段的表达水平,并且可能彼此不同。本文还提供了编码本文提供的补身醇合酶的核酸序列的功能性等同物,即在严格条件下与seqidno:1或seqidno:3的核酸序列杂交的核苷酸序列。

技术人员将知道鉴定其他生物体中同源序列的方法和确定同源序列之间的序列同一性百分比的方法。然后可以对此类新鉴定的dna分子进行测序,并将该序列与seqidno:1或seqidno:3的核酸序列进行比较。

两个肽或核苷酸序列之间的同一性百分比是当产生这两个序列的比对时,两个序列中相同的氨基酸或核苷酸残基的数目的函数。相同的残基被定义为两个序列中在比对的给定位置的相同的残基。本文使用的序列同一性的百分比是从最佳比对中通过将两个序列之间相同的残基数除以最短序列中的残基总数并乘以100计算得到的。最佳比对是同一性百分比最高可能性的比对。可以将空位引入到一个或两个序列中的比对的一个或多个位置中以获得最佳比对。然后将这些空位考虑为用于计算序列同一性百分比的不相同的残基。用于确定氨基酸或核酸序列同一性百分比的比对可以使用计算机程序以及例如在互联网上可公开获得的计算机程序以多种方式实现。优选地,可使用可从nationalcenterforbiotechnologyinformation(ncbi)于http://www.ncbi.nlm.nih.gov/blast/bl2seq/wblast2.cgi获得的设定为默认参数的blast程序(tatiana等,femsmicrobiollett.,1999,174:247-250,1999)来获得蛋白或核酸序列的最佳比对并计算序列同一性的百分比。

本文提供的相关实施方案提供了与根据seqidno:1或seqidno:3的核酸序列互补的核酸序列(诸如抑制性rna),或者在严格条件下杂交至根据seqidno:1或seqidno:3的核苷酸序列的至少一部分的核酸序列。本文实施方案的替代实施方案提供了一种改变宿主细胞中基因表达的方法。例如,在某些背景下(例如,暴露于一定温度或培养条件下),在宿主细胞或宿主生物体中可以增强或过表达或诱导本文实施方案的多核苷酸。

本文提供的多核苷酸的表达的改变还会产生异位表达,其是在改变的以及在对照或野生型生物体中的一种不同的表达模式。表达的改变是由本文实施方案的多肽与外源性或内源性调节剂的接触而发生的或者是由于多肽的化学修饰导致的。该术语还指本文实施方案的多核苷酸的改变的表达模式,其被改变至低于检测水平或者完全被抑制活性。

在一个实施方案中,本文还提供了编码本文提供的多肽或变体多肽的分离的、重组的或合成的多核苷酸。

在一个实施方案中,提供了一种分离的核酸分子,其编码多肽,该多肽具有补身醇合酶活性并且包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列或包含seqidno:2的氨基酸序列。

在一个实施方案中,本文提供了一种分离的多肽,其具有倍半萜合酶活性和/或补身醇合酶活性,并且包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列或包含seqidno:2的氨基酸序列。

根据一个实施方案,该多肽由seqidno:2的氨基酸序列组成。

在一个实施方案中,本文实施方案的多肽可以天然存在于芍药属(paeonia)植物中或其他植物物种中,或包含氨基酸序列,其为seqidno:2的变体,其可通过遗传工程获得或在芍药属(paeonia)植物中或其他植物物种中天然发现。

根据另一个实施方案,该多肽是分离自或衍生自芍药(paeoniaceae)科植物。在另一个实施方案中,该多肽分离自或衍生自窄叶芍药(paeoniaanomala)。

在一个实施方案中,在本文描述的任何实施方案中使用的或由在本文描述的任何实施方案中使用的核酸编码的至少一种具有倍半萜合酶活性和/或补身醇合酶活性的多肽包含以下氨基酸序列:其是通过遗传工程获得的seqidno:2的变体。在一个实施方案中,该多肽包含由核苷酸序列编码的氨基酸序列,该核苷酸序列是通过修饰seqidno:1或seqidno:3或其反向互补序列而获得的。

多肽还意指包括变体和截短的多肽,条件是它们具有倍半萜合酶活性和/或补身醇合酶活性。

根据另一个实施方案,在本文描述的任何实施方案中使用的或由在本文描述的任何实施方案中使用的核酸编码的具有补身醇合酶活性的至少一种多肽包含以下氨基酸序列:其是通过遗传工程获得的seqidno:2的变体,条件是所述变体具有补身醇合酶活性,并且具有与本文所述的seqidno:2所需的同一性百分比。

根据另一个实施方案,在本文描述的任何实施方案中使用的或由本文描述的任何实施方案中使用的核酸编码的具有补身醇合酶活性的至少一种多肽是seqidno:2的变体,其可以在其他生物体(例如其他植物物种)中天然发现,条件是它具有补身醇合酶活性。如本文所用,多肽包括涵盖本文中鉴定的氨基酸序列的多肽或肽片段,以及截短的或变体多肽,条件是它们具有倍半萜合酶活性和/或补身醇合酶活性,并且它们与seqidno:2的相应片段共有至少所定义的同一性百分比。

变体多肽的例子是由交替mrna剪接事件或本文所述多肽的蛋白水解切割产生的天然存在的蛋白。归因于蛋白水解的变种包括例如在不同类型的宿主细胞中表达时n-或c-末端的差异,这是由于从本文实施方案的多肽中蛋白水解去除一个或多个末端氨基酸引起的。本文实施方案还涵盖了如下文所描述的本文实施方案的核酸通过天然或人工突变获得的核酸所编码的多肽。

由在氨基和羧基末端融合额外的肽序列产生的多肽变体也可以用在本文实施方案的方法中。特别地,此种融合能够增强多肽的表达,有用于蛋白的纯化或改善多肽在期望环境或表达系统中的酶活性。此种额外的肽序列例如可以是信号肽。因此,本发明包括使用变体多肽(例如通过与其他寡肽或多肽融合所获得的那些和/或连接到信号肽的那些)的方法。由与另一种功能肽(例如来自萜烯生物合成路径的另一种蛋白)融合产生的多肽也可以有利地用于本文实施方案的方法中。

变体也可以通过附接共价或非共价连接到多肽主链的修饰基团而不同于本文实施方案的多肽。所述变体还包括通过引入n-连接的或o-连接的糖基化位点、和/或添加半胱氨酸残基而与本文提供的多肽不同的多肽。技术人员能够了解如何修饰氨基酸序列并保留生物活性。

除了本文公开的序列中显示的基因序列之外,对于本领域技术人员显而易见的是,dna序列多态性可存在于给定群体内,这可导致本文公开的多肽的氨基酸序列的变化。由于天然等位基因变异,这种遗传多态性可能存在于来自不同群体或群体内的细胞中。等位基因变体还可包括功能等同物。

进一步的实施方案还涉及通过来自具体公开的核酸的此类序列多态性衍生的分子。这些天然变异通常在基因的核苷酸序列或本文公开的多肽的氨基酸序列中产生约1至5%的变化。如上所述,编码本文实施方案的多肽或其变体的核酸是修饰非人宿主生物体或细胞并修饰打算用于本文所述方法的非人宿主生物或细胞的有用工具。

本文提供的一个实施方案提供了补身醇合酶蛋白(包括直系同源物和旁系同源物)的氨基酸序列,以及用于在其他生物体中鉴定和分离补身醇合酶的直系同源物和旁系同源物的方法。特别地,如此鉴定的补身醇合酶的直系同源物和旁系同源物保留了补身醇合酶的活性,并且能够从无环萜烯焦磷酸盐前体例如fpp开始产生补身醇或包含补身醇与一种或多种萜烯的混合物。

在体外要与无环萜烯焦磷酸酯(例如fpp)接触的多肽可以使用标准蛋白或酶提取技术从表达它的任何生物体中提取得到。如果宿主生物体是将本文实施方案的多肽释放到培养基中的单细胞生物体或细胞,那么可以简单地从所述培养基收集该多肽,例如,通过离心,任选地随后进行洗涤步骤和再悬浮于适合的缓冲液中。如果所述生物体或细胞将多肽累积于其细胞中,那么可以通过破裂或裂解所述细胞并且进一步从细胞裂解液中提取多肽来获得所述多肽。完整细胞、细胞裂解物或经提取的多肽可用于接触无环萜烯焦磷酸酯,以产生萜烯或萜烯混合物。

然后,可以将具有补身醇合酶活性的多肽(为分离的形式或与其他蛋白在一起的形式,例如处于从培养的细胞或微生物中获得的粗制蛋白提取物中)悬浮于处在最佳ph的缓冲液中。如果适合,可以加入盐、dtt、无机阳离子及其他种类的酶促辅因子以便使酶活性最佳化。向多肽悬浮液中加入前体fpp,然后在最佳的温度(例如15至40℃,特别地25至35℃,更特别地30℃)下进行温育。在温育之后,可以通过标准分离工序例如溶剂提取和蒸馏,并且任选地在从所述溶液中取出多肽之后,从所温育的溶液中分离出所产生的补身醇。

根据另一个实施方案,具有补身醇合酶活性的至少一种多肽可用于产生补身醇或包含补身醇的萜烯混合物。在另一个实施方案中,包含补身醇的混合物也可以包含橙花叔醇。

实施本文实施方案的方法的一种特定工具是本文所述的多肽本身。

根据一个具体的实施方案,该多肽能够产生包含补身醇的倍半萜混合物。在另一个实施方案中,该合酶能够产生包含补身醇的倍半萜混合物,其中补身醇占所产生的倍半萜的至少20%、特别是至少30%、特别是至少35%、特别是至少90%、特别是至少95%、更特别地至少98%。在本文提供的另一个形态中,以大于或等于95%、更特别地98%的选择性产生补身醇。

根据另一个实施方案,该倍半萜合酶能够产生包含补身醇和橙花叔醇的倍半萜混合物。在另一个实施方案中,该合酶能够产生包含补身醇和橙花叔醇的倍半萜混合物,其中橙花叔醇占所产生的倍半萜的至少5%至约80%、特别是至少10%至约80%、特别是至少15%至约80%、特别是至少16%至约80%、特别是至少50%至约80%、特别是至少60%至约80%、特别是至少70%至约80%、特别是约79%。

可以使用各种方法来确定任何倍半萜合酶或补身醇合酶蛋白、变体或片段的功能性或活性。例如,在植物、细菌或酵母细胞中瞬时或稳定的过表达可以用来测试蛋白是否具有活性,即从产生无环萜烯焦磷酸酯前体例如fpp前体来产生一种或多种倍半萜,例如补身醇或包含补身醇的倍半萜混合物或包含补身醇和橙花叔醇的倍半萜混合物。可以在指示功能性的微生物表达系统(例如本文实施例2中描述的对补身醇产生的测定)中评估补身醇合酶活性。本文实施方案的补身醇合酶多肽的变体或衍生物保留了从fpp前体产生补身醇包含补身醇的混合物的能力。本文提供的补身醇合酶的氨基酸序列变体可以具有附加的期望生物学功能,包括例如改变的底物利用、反应动力学、产品分布或其他改变。

可以例如通过进行例如实施例1和2中详述的酶分析来简单地确认多肽催化特定倍半萜(例如补身醇)的合成的能力。

还提供了至少一种包含本文描述的核酸分子的载体。

本文还提供了选自原核载体、病毒载体和真核载体的载体。

这里还提供了一种载体,其为表达载体。

在一个实施方案中,在单一宿主中共表达多种补身醇合酶编码核酸序列,特别是在不同启动子的控制下。在另一个实施方案中,编码核酸序列的几种补身醇合酶蛋白可以存在于单个转化载体上,或者可以使用分离的载体并选择包含两种嵌合基因的转化子同时进行共转化。类似地,一种或多种补身醇合酶编码基因可以在单一植物、细胞、生物体或微生物中与其他嵌合基因一起进行表达。

可将编码补身醇合酶蛋白的本文实施方案的核酸序列插入到表达载体中和/或包含在插入到表达载体中的嵌合基因中,以在宿主细胞或非人宿主生物体中产生补身醇合酶蛋白。用于将转基因插入到宿主细胞的基因组中的载体是本领域众所周知的,并且包括质粒、病毒、粘粒和人工染色体。插入了嵌合基因的二元或共整合载体也可用于转化宿主细胞。

本文提供的一个实施方案提供了重组表达载体,其包含补身醇合酶基因的核酸序列、或可操作地连接到相关核酸序列(诸如例如启动子序列)的包含补身醇合酶基因的核酸序列的嵌合基因。例如,包含seqidno:1或seqidno:3或其变体的核酸序列的嵌合基因可以可操作地连接到适合于在植物细胞、细菌细胞或真菌细胞中表达的启动子序列,任选地连接到3’非翻译的核酸序列。

替代地,启动子序列可以已经存在于载体中,以便将待转录的核酸序列插入到载体中启动子序列的下游。可以对载体进行工程化以使其具有复制起点、多克隆位点和选择性标记物。

在一个实施方案中,包含如本文所述核酸的表达载体可用作工具,用于转化适于在体内进行本文实施方案的方法的非人宿主生物体或宿主细胞。

本文提供的表达载体可用于制备遗传转化的非人宿主生物体和/或宿主细胞的方法,用于包藏本文实施方案的核酸的非人宿主生物体和/或宿主细胞,以及用于制备本文所述具有补身醇合酶活性的多肽的方法。

重组的非人宿主生物体和宿主细胞——其经转化可包藏本文一个实施方案的至少一种核酸,从而使其异源表达或过表达本文实施方案的至少一种多肽——也是实施本文实施方案的方法的非常有用的工具。因此,本文提供了此类非人宿主生物体和宿主细胞。

在一个实施方案中,提供了一种宿主细胞或非人宿主生物体,其包含本文所述的至少一种核酸分子或包含至少一种包含至少一种所述核酸分子的载体。

根据任何上述实施方案的核酸可用于转化非人宿主生物体和细胞,并且经表达的多肽可以是任何上述多肽。

在一个实施方案中,非人宿主生物体或宿主细胞是原核细胞。在另一个实施方案中,非人宿主生物体或宿主细胞是细菌细胞。在另一个实施方案中,非人宿主生物体或宿主细胞是大肠杆菌。

在一实施方案中,非人宿主生物体或宿主细胞是真核细胞。在另一个实施方案中,非人宿主生物体或宿主细胞是酵母细胞。在另一个实施方案中,非人宿主生物体或细胞是酿酒酵母。

在另一个实施方案中,非人生物体或宿主细胞是植物细胞。

在一个实施方案中,非人宿主生物体或宿主细胞表达一种多肽,条件是该生物体或细胞经转化以包藏编码所述多肽的核酸,该核酸被转录成mrna,并且该多肽在宿主生物体或细胞中发现。

先前已经描述了转化非人宿主生物体或宿主细胞的合适方法,并且在本文中也提供了这些方法。

为了在体内进行本文的一个实施方案,宿主生物体或宿主细胞在有利于产生倍半萜如补身醇或包含补身醇的混合物的条件下培养。因此,如果宿主是转基因植物,则可以提供最佳的生长条件,例如最佳的光照、水和营养条件。如果宿主是单细胞生物,则有利于补身醇或包含补身醇的混合物产生的条件可以包括向宿主的培养基中添加合适的辅因子。另外,可以选择培养基,以使补身醇的合成最大化。最佳培养条件的例子在实施例中有更详细的描述。

适合在体内进行本文实施方案的方法的非人宿主生物体可以是任何非人多细胞或单细胞生物。在一个实施方案中,用于在体内进行本文实施方案的非人宿主生物体是植物、原核生物或真菌。可以使用任何植物、原核生物或真菌。特别有用的植物是天然产生大量萜烯的植物。在另一个实施方案中,用于在体内进行本文实施方案的方法的非人宿主生物体是微生物。可以使用任何微生物,例如,该微生物可以是细菌或酵母,例如大肠杆菌或酿酒酵母。

这些生物中有些不能天然产生fpp。为了适合于实施本文的一个实施方案的方法,不天然产生无环萜烯焦磷酸酯前体(例如fpp)的生物体或细胞被转化以产生所述前体。如上所述,它们可以在用根据上述任何一个实施方案所述的核酸修饰之前或同时这样转化。转化生物体例如微生物以使它们产生无环萜烯焦磷酸酯前体例如fpp的方法是本领域已知的。

也可以使用分离的高等真核细胞来代替完整的生物体作为宿主,以在体内进行本文实施方案的方法。合适的真核细胞可以是任何非人类细胞,例如植物或真菌细胞。

本文还提供了一种产生补身醇或包含补身醇的混合物的方法,包括:

i)使无环萜烯焦磷酸酯,特别是法呢基二磷酸酯(fpp)与多肽接触,以产生补身醇或包含补身醇与一种或多种萜烯的混合物,该多肽具有补身醇合酶活性并且包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,或包含seqidno:2的氨基酸序列;和

ii)任选地,分离补身醇。

在一个形态中,分离了补身醇。

在本文提供的另一个形态中,所产生的补身醇具有大于或等于所产生的倍半萜的20%、30%、35%、40%、50%、60%、80%或90%或甚至95%的选择性。

本文还提供了一种方法,该方法包括用编码多肽的核酸转化宿主细胞或非人宿主生物体,该多肽具有补身醇合酶活性并且包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,或包含seqidno:2的氨基酸序列。

在一个实施方案中,本文提供的方法包括在允许产生多肽的条件下,培养能够产生fpp并经转化以表达多肽的非人宿主生物体或宿主细胞,其中该多肽包含与seqidno:1或seqidno:3有至少75%、80%、85%、90%、95%、98%、99%或100%序列同一性的氨基酸序列。

在另一个实施方案中,本文提供的方法包括使倍半萜例如补身醇与至少一种酶接触以产生倍半萜衍生物。补身醇的此类衍生物的例子包括但不限于乙酸补身酯(drimenylacetate)(cas40266-93-1)、补身醛(drimenal)(cas105426-71-9)、补身酸(drimenicacid)(cas111319-84-7)。

根据另一个特别的实施方案,任何上述实施方案的方法在体内进行。在这种情况下,步骤a)包括在有利于产生一种或多种倍半萜如补身醇或包含补身醇的混合物的条件下,培养能够产生fpp并经转化以表达至少一种多肽的非人宿主生物体或宿主细胞,该多肽包含含有seqidno:2的氨基酸或其功能变体并且具有补身醇合酶活性。补身醇可以是唯一的产品,或者可以是倍半萜混合物的一部分。在一个实施方案中,倍半萜的混合物包含补身醇和橙花叔醇。

根据另一个实施方案,该方法进一步包括在步骤a)之前,用至少一种核酸转化能产生fpp的非人生物体或细胞,该核酸编码多肽,该多肽包含含有seqidno:2的氨基酸,或者该核酸编码多肽,该多肽具有补身醇合酶活性并且包含与seqidno:2有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,使得所述生物体表达所述多肽。

本文的一个实施方案的这些实施方案是特别有利的,因为可以在体内进行该方法而无需事先分离该多肽。该反应直接发生在经转化以表达所述多肽的生物体或细胞内。

本文的一个实施方案提供了在通过使fpp前体与本文的一个实施方案的多肽在体外或体内接触而产生补身醇或包含补身醇的混合物的方法中使用的本文实施方案的多肽。

还提供了如本文所述的多肽在产生补身醇或包含补身醇与一种或多种萜烯的混合物或包含补身醇和橙花叔醇的混合物中的用途。在一个实施方案中,分离了所产生的补身醇和/或橙花叔醇。

以下实施例仅是说明性的,并不旨在将权利要求的范围限制在本文所述的实施方案内。

实施例

实施例1

窄叶芍药(paeoniaanomala)植物材料溯源和根转录组测序。

窄叶芍药(paeoniaanomala)植物材料来自中国青海大同。为了确定窄叶芍药是否含有补身醇,收集其根部,然后用二氯甲烷新鲜萃取以进行化学分析。通过gc-ms分析萃取物,gc-ms分析的参数描述如下:使用配备了db1-ms柱(30m×0.25mm×0.25μm膜厚,p/n122-0132(j&wscientificinc,folsom,ca))并与5975系列质谱仪连接的agilent6890系列gc系统。载气是0.7ml/min的恒定流量的氦气。进样采用分流(1:5)模式,进样器温度设定为250℃。烘箱温度程序升温,以5℃/分钟的速率从50℃(保持5分钟)升至300℃,然后以50℃/分钟的速率升至340℃并保持3分钟。产品鉴定基于质谱和保留指数。窄叶芍药的根部含有少量补身醇(图5)。

使用窄叶芍药的新鲜根部用于转录组分析。使用columnplantrnaout(tiandz,中国)提取总rna。使用illuminatotalrna-seq技术处理该总rna并在illuminamiseq测序仪上测序。总共产生了900万条2×251bp的配对末端读数(reads)。这些读数使用trinity(http://trinityrnaseq.sf.net/)软件进行组装。获得平均大小为1109bp的26457个unigene。这些unigene由ncbiblast(http://www.ncbi.nlm.nih.gov/)以及interproscan软件(http://www.ebi.ac.uk/tools/pfa/iprscan/)注释。这种方法提供了包括patps3在内的7种新的假定的倍半萜合酶的序列。如以下实施例所述评估patps3的酶活性。

实施例2

patps3的功能表达和表征。

首先使用superscriptiiifirst-strandsynthesis试剂盒(invitrogen,中国上海)将由columnplantrnaout试剂盒提取的总rna逆转录为cdna。然后将产物用作模板,使用正向引物(5'-atgtctgtcaaagttcctcaatc-3')(seqidno:4)和反向引物(5'-tcacattgcaataggatcggtg-3')(seqidno:5)从窄叶芍药的cdna文库中扩增基因。

通过遵循大肠杆菌的遗传密码子频率来优化patps3的序列并进行合成。将ndei的限制性酶切位点添加到patps3的5'端,同时将kpni的限制性酶切位点添加到3'端。将patps3亚克隆到pj401(dna2.0)质粒中,用于随后在大肠杆菌中表达。

将krx大肠杆菌细胞(promega)与质粒pacyc/scmva(包含编码异种甲羟戊酸途径的基因)以及质粒pj401-patps3共转化。为了构建pacyc/scmva质粒,我们将8个生物合成基因分为2个合成操纵子,称为“上”和“下”甲羟戊酸(mva)途径。作为上mva途径,我们创建了一个合成操纵子,该操纵子由atob编码的来自大肠杆菌的乙酰乙酰-coa硫解酶、分别由erg13和erg19编码的来自啤酒酵母的hmg-coa合酶和截短形式的hmg-coa还原酶组成。该操纵子将主要代谢物乙酰-coa转化为(r)-甲羟戊酸酯。作为“下”甲羟戊酸途径,我们创建了第二个合成操纵子,其编码甲羟戊酸激酶(erg12,酿酒酵母)、磷酸甲羟戊酸激酶(erg8,酿酒酵母)、磷酸甲羟戊酸脱羧酶(mvd1,酿酒酵母)、二磷酸异戊烯酯异构酶(idi,大肠杆菌)和法呢基焦磷酸(fpp)合酶(ispa,大肠杆菌)。最后,将来自酿酒酵母的第二种fpp合酶(erg20)引入到上途径操纵子中,以改善类异戊二烯c5单元(ipp和dmapp)向法呢基焦磷酸(fpp)的转化。在细菌噬菌体t7启动子(pacycduet-1,invitrogen)的控制下,将每个操纵子亚克隆到低拷贝表达质粒的多克隆位点之一。

在含有卡那霉素(终浓度50μg/ml)和氯霉素(终浓度34μg/ml)的lb琼脂平板上选择经共转化的细胞。使用单个菌落接种5ml含有卡那霉素(终浓度25μg/ml)和氯霉素(终浓度34μg/ml)的液体lb培养基。将培养物在37℃和200rpm摇动下孵育过夜。第二天,用0.6ml过夜培养物接种补充有相同抗生素和甘油(终浓度3%w/v)的6mltb培养基。在37℃下孵育4小时并以200rpm摇动后,将培养物冷却至25℃保持1小时。对于每个试管,将培养物的体积调节至2ml,并添加iptg(终浓度0.1mm),并覆盖以200μl十二烷。将培养物在25℃和200rpm摇动下再孵育48小时。然后将培养物用1ml乙酸乙酯萃取,并加入2μg/ml的50μl异长叶烯(内标)作为内标,然后通过gc/ms分析样品。gc/ms分析使用与实施例1中所述相同的方法。载气为氦气,流速恒定为0.7ml/min。进样采用分流(1:5)模式,进样器温度设定为250℃。烘箱温度程序升温,以5℃/分钟的速率从50℃(保持5分钟)升至300℃,然后以50℃/分钟的速率升至340℃并保持3分钟。产品鉴定基于质谱和保留指数。gc/ms分析表明,patps3产生的主要成分为补身醇,选择性为73%(不包括法呢醇和乙酸法呢酯),效价为18.4mg/l(图6和图7)。

进行体外测定以确认patps3的上述体内表征。用质粒pj401-patps3转化bl21(de3)大肠杆菌细胞。在含有卡那霉素(终浓度50μg/ml)的lb琼脂平板上选择经转化的细胞。使用单个菌落接种补充有相同抗生素的25ml液体lb培养基。将培养物在37℃和200rpm振荡下孵育直至混浊(od约0.5)。孵育5小时后,将培养物冷却至20℃保持30分钟,并加入iptg(终浓度0.1mm)。将培养物在20℃和200rpm下孵育过夜,然后离心并重悬于5ml50mmmopso缓冲液(含10%甘油w/v和5mmdtt,ph7)中。通过在冰上超声处理10秒共3次将重悬的细胞破碎,并在4℃、12000rpm下离心30分钟,将上清液(包含粗蛋白)用于体外测定。将总共2ml50mmmopso反应缓冲液(含10%甘油w/v、15mmmgcl2、0.1mmmncl2、1mmdtt、6mmna3vo4,ph7),10μl145μmfpp溶液和1ml粗蛋白混合并用1ml庚烷覆盖,然后温育16小时以进行体外反应。然后将反应物用1ml乙酸乙酯萃取,并添加2mg/ml的50μl异长叶烯(内标)作为内标,之后通过gc/ms分析样品。gc/ms分析使用与实施例1中所述相同的方法。载气为氦气,流速恒定为0.7ml/min。进样采用分流(1:5)模式,进样器温度设定为250℃。烘箱温度程序升温,以5℃/分钟的速率从50℃(保持5分钟)升至300℃,然后以50℃/分钟的速率升至340℃并保持3分钟。产品鉴定基于质谱和保留指数。gc/ms分析表明,patps3产生补身醇,选择性为21%,并有79%的(e)-橙花叔醇(图8和图9)。

序列表

seqidno:1

patps3的cdna序列:

atgtctgtcaaagttcctcaatctcagaatgctcctacagaggttggacgtcggtccgtaaattttcatcctactgtttggggagatcggtttatcacatacaataaccagtcagttgatgatgatgtggaaaagagattaacaaaagaactaaaatcccaagtgaggagaaagttggtggatgctgctgaaaatacatgtcagaagcttaacacaatcgatgcaatcgagagattaggcttggcttatcatttcgaaacagagattgaagaagcactgcaaaatatttataattcctctcaggttgttggaaataatgtggaagaagatgacctctactctgttgccttacgctttaggcttctcagacaacagggctacaatatttcatctgatgtgtttaacaaattcaaagatgataaagataacttcaaggtatctttaattggtgatgcatcaagcttgctaagcctatatgaagctgcacaccttcgagtacacggagaacacatactggatgaagctctaactttctcagttaataatctggaatcaatggcaacccaattaagtccaccccttgcaacacatgtaacccatgcactaaacagaccacttcgaaagggcattccaaggctagaagcaaggcactacatttctgtctacgaacaagatcctttacacgatgaagatctattgaagctcgcaaagttagatttcaaccaattacagaaaattcaccagaaggagctaagcgagatctcaaagtggtggaaagatataaactttgtatcaaagctaccttttgcaagggacagagtggtggagtgctacttttggataatgtcagtgcatagcgagcccgagaactggcttgcacgaaggacagctgcaaaaatagctgcggtaacctccattatagatgatatctatgatgtgcatggtacaattgacgaactgacgctatttacagaagccgtcaacaggtgggatataaacaacattgatcaactcccggagtacatgaaaatatgttataaggcgctcttgggcgtttttagtgaattaggggaagagttggaaaaacaaggaagatcttaccgcctcgatcatacaattgaacttatgaaagatctagttgggaactattttactgaatcgaaatggttaagcgaaaaatatgtgcccacaatagaggagtatatgcgtgctgcagaagtcaccataggttacaacaatgctataactgcatcttttgccacagccaaagccggagatattgcaaccaaggagacctttgaatgggtgttgagtgaacctaaaattgttaaggcttcctcagtaatttgcaggttgatggatgacttatcatcccacaagtttgagcaaaagagaggacatgttgcatctgctattgaatgctacatgaagcaacatgatgctacagaggaaaaggtgcgtgcggagtttaataaacaagtcaccgacgcctggaaggtgataaatcaagaatgtctccacccaacagccattccaatgcctcttcttacatgtgttctcaactatgcacgtgtggctgatgtcatgtacaaggatggagatgcttatacatttgcccagatcttactgaaagatcatttatcggcattgttcaccgatcctattgcaatgtga

seqidno:2

patps3的氨基酸序列:

msvkvpqsqnaptevgrrsvnfhptvwgdrfitynnqsvdddvekrltkelksqvrrklvdaaentcqklntidaierlglayhfeteieealqniynssqvvgnnveeddlysvalrfrllrqqgynissdvfnkfkddkdnfkvsligdassllslyeaahlrvhgehildealtfsvnnlesmatqlspplathvthalnrplrkgiprlearhyisvyeqdplhdedllklakldfnqlqkihqkelseiskwwkdinfvsklpfardrvvecyfwimsvhsepenwlarrtaakiaavtsiiddiydvhgtideltlfteavnrwdinnidqlpeymkicykallgvfselgeelekqgrsyrldhtielmkdlvgnyfteskwlsekyvptieeymraaevtigynnaitasfatakagdiatketfewvlsepkivkassvicrlmddlsshkfeqkrghvasaiecymkqhdateekvraefnkqvtdawkvinqeclhptaipmplltcvlnyarvadvmykdgdaytfaqillkdhlsalftdpiam

seqidno:3

用于在大肠杆菌中表达的patps3的密码子优化的cdna序列:

atgtccgttaaagttccgcaaagccaaaatgcccctaccgaagttggccgtcgttccgtcaacttccacccgacggtctggggtgatcgtttcattacctacaataaccagagcgttgacgacgatgtggaaaagcgtttgaccaaagaattgaagtcccaggtccgtcgtaaactggttgacgctgcagagaacacttgccagaaactgaacaccatcgacgcgatcgagcgcctgggtctggcttaccatttcgagactgagattgaagaggcactgcagaacatctacaattccagccaagtcgtgggcaataatgtagaggaagatgatttatatagcgtggcgctgcgttttcgtctgctgcgtcaacagggttataacatcagctccgatgtctttaacaagttcaaagatgataaagacaatttcaaggttagcctgatcggtgacgcaagctctttgttatctctgtatgaagccgcgcatctgcgcgtgcatggcgagcatatcttggatgaagcgctgacctttagcgttaataatctggaatcgatggcaacccagctgagcccgccgctggcaacgcacgttacgcacgcgttgaaccgcccgctgcgcaagggtatcccgcgtctggaagcgcgtcattacatttctgtgtacgaacaagatccactgcacgacgaagatttgcttaaactggcgaaactggattttaatcaactgcaaaagattcaccagaaagaactgagcgagattagcaaatggtggaaagacattaatttcgtcagcaagctgccgttcgcccgcgaccgtgttgtggagtgctatttctggattatgagcgttcacagcgagcctgagaactggctggcgcgccgcaccgcggctaagattgcggcagtcacgtcgattatcgacgatatctatgacgtccacggcaccatcgatgaactgacgctgttcaccgaagccgttaaccgctgggacatcaacaacattgatcagctgccggaatacatgaagatctgctacaaagcgctgctgggcgtgttcagcgagctgggtgaagaactggagaaacagggtcgtagctatcgcttggatcataccattgagctgatgaaagatctggtcggtaattacttcaccgagtccaagtggctgagcgagaaatacgttccgacgatcgaagagtacatgcgtgctgccgaagtgaccatcggttacaacaatgccattacggcatcttttgccacggcaaaggccggtgatatcgctaccaaagaaacctttgaatgggtgctgagcgaaccgaagattgtcaaagcctccagcgttatttgtcgtctgatggacgatttgagcagccataagtttgagcaaaagcgtggccacgtcgcgagcgcgatcgagtgctatatgaaacagcacgacgcgaccgaggaaaaagttcgtgcagagttcaataaacaagtcaccgatgcgtggaaagtcattaaccaagagtgcttgcacccgacggcgatcccgatgccactgctgacctgtgtgctcaattatgcacgtgttgcggacgttatgtataaggatggtgacgcgtatacctttgcgcaaattctgctgaaagaccacctgagcgcactgttcacggacccgatcgcgatgtaa

seqidno:4

正向引物

atgtctgtcaaagttcctcaatc

seqidno:5

反向引物

tcacattgcaataggatcggtg。

序列表

<110>firmenichsa

li,pan

wang,qi

he,xiu-feng

haefliger,olivier

<120>用于产生补身醇及其混合物的倍半萜合酶(sesquiterpenesynthasesforproductionofdrimenolandmixtures

thereof)

<130>10110_pct

<150>pct/cn2017/082803

<151>2017-05-03

<150>ep17174791.8

<151>2017-06-07

<160>5

<170>patentinversion3.5

<210>1

<211>1674

<212>dna

<213>窄叶芍药(paeoniaanomala)

<223>cdna

<400>1

atgtctgtcaaagttcctcaatctcagaatgctcctacagaggttggacgtcggtccgta60

aattttcatcctactgtttggggagatcggtttatcacatacaataaccagtcagttgat120

gatgatgtggaaaagagattaacaaaagaactaaaatcccaagtgaggagaaagttggtg180

gatgctgctgaaaatacatgtcagaagcttaacacaatcgatgcaatcgagagattaggc240

ttggcttatcatttcgaaacagagattgaagaagcactgcaaaatatttataattcctct300

caggttgttggaaataatgtggaagaagatgacctctactctgttgccttacgctttagg360

cttctcagacaacagggctacaatatttcatctgatgtgtttaacaaattcaaagatgat420

aaagataacttcaaggtatctttaattggtgatgcatcaagcttgctaagcctatatgaa480

gctgcacaccttcgagtacacggagaacacatactggatgaagctctaactttctcagtt540

aataatctggaatcaatggcaacccaattaagtccaccccttgcaacacatgtaacccat600

gcactaaacagaccacttcgaaagggcattccaaggctagaagcaaggcactacatttct660

gtctacgaacaagatcctttacacgatgaagatctattgaagctcgcaaagttagatttc720

aaccaattacagaaaattcaccagaaggagctaagcgagatctcaaagtggtggaaagat780

ataaactttgtatcaaagctaccttttgcaagggacagagtggtggagtgctacttttgg840

ataatgtcagtgcatagcgagcccgagaactggcttgcacgaaggacagctgcaaaaata900

gctgcggtaacctccattatagatgatatctatgatgtgcatggtacaattgacgaactg960

acgctatttacagaagccgtcaacaggtgggatataaacaacattgatcaactcccggag1020

tacatgaaaatatgttataaggcgctcttgggcgtttttagtgaattaggggaagagttg1080

gaaaaacaaggaagatcttaccgcctcgatcatacaattgaacttatgaaagatctagtt1140

gggaactattttactgaatcgaaatggttaagcgaaaaatatgtgcccacaatagaggag1200

tatatgcgtgctgcagaagtcaccataggttacaacaatgctataactgcatcttttgcc1260

acagccaaagccggagatattgcaaccaaggagacctttgaatgggtgttgagtgaacct1320

aaaattgttaaggcttcctcagtaatttgcaggttgatggatgacttatcatcccacaag1380

tttgagcaaaagagaggacatgttgcatctgctattgaatgctacatgaagcaacatgat1440

gctacagaggaaaaggtgcgtgcggagtttaataaacaagtcaccgacgcctggaaggtg1500

ataaatcaagaatgtctccacccaacagccattccaatgcctcttcttacatgtgttctc1560

aactatgcacgtgtggctgatgtcatgtacaaggatggagatgcttatacatttgcccag1620

atcttactgaaagatcatttatcggcattgttcaccgatcctattgcaatgtga1674

<210>2

<211>557

<212>prt

<213>窄叶芍药(paeoniaanomala)

<400>2

metservallysvalproglnserglnasnalaprothrgluvalgly

151015

argargservalasnphehisprothrvaltrpglyaspargpheile

202530

thrtyrasnasnglnservalaspaspaspvalglulysargleuthr

354045

lysgluleulysserglnvalargarglysleuvalaspalaalaglu

505560

asnthrcysglnlysleuasnthrileaspalailegluargleugly

65707580

leualatyrhisphegluthrgluilegluglualaleuglnasnile

859095

tyrasnserserglnvalvalglyasnasnvalglugluaspaspleu

100105110

tyrservalalaleuargpheargleuleuargglnglnglytyrasn

115120125

ileserseraspvalpheasnlysphelysaspasplysaspasnphe

130135140

lysvalserleuileglyaspalaserserleuleuserleutyrglu

145150155160

alaalahisleuargvalhisglygluhisileleuaspglualaleu

165170175

thrpheservalasnasnleuglusermetalathrglnleuserpro

180185190

proleualathrhisvalthrhisalaleuasnargproleuarglys

195200205

glyileproargleuglualaarghistyrileservaltyrglugln

210215220

aspproleuhisaspgluaspleuleulysleualalysleuaspphe

225230235240

asnglnleuglnlysilehisglnlysgluleusergluileserlys

245250255

trptrplysaspileasnphevalserlysleuprophealaargasp

260265270

argvalvalglucystyrphetrpilemetservalhisserglupro

275280285

gluasntrpleualaargargthralaalalysilealaalavalthr

290295300

serileileaspaspiletyraspvalhisglythrileaspgluleu

305310315320

thrleuphethrglualavalasnargtrpaspileasnasnileasp

325330335

glnleuproglutyrmetlysilecystyrlysalaleuleuglyval

340345350

phesergluleuglyglugluleuglulysglnglyargsertyrarg

355360365

leuasphisthrilegluleumetlysaspleuvalglyasntyrphe

370375380

thrgluserlystrpleuserglulystyrvalprothrilegluglu

385390395400

tyrmetargalaalagluvalthrileglytyrasnasnalailethr

405410415

alaserphealathralalysalaglyaspilealathrlysgluthr

420425430

pheglutrpvalleusergluprolysilevallysalaserserval

435440445

ilecysargleumetaspaspleuserserhislysphegluglnlys

450455460

argglyhisvalalaseralaileglucystyrmetlysglnhisasp

465470475480

alathrgluglulysvalargalaglupheasnlysglnvalthrasp

485490495

alatrplysvalileasnglnglucysleuhisprothralailepro

500505510

metproleuleuthrcysvalleuasntyralaargvalalaaspval

515520525

mettyrlysaspglyaspalatyrthrphealaglnileleuleulys

530535540

asphisleuseralaleuphethraspproilealamet

545550555

<210>3

<211>1674

<212>dna

<213>人工序列(artificialsequence)

<223>密码子优化的序列

<400>3

atgtccgttaaagttccgcaaagccaaaatgcccctaccgaagttggccgtcgttccgtc60

aacttccacccgacggtctggggtgatcgtttcattacctacaataaccagagcgttgac120

gacgatgtggaaaagcgtttgaccaaagaattgaagtcccaggtccgtcgtaaactggtt180

gacgctgcagagaacacttgccagaaactgaacaccatcgacgcgatcgagcgcctgggt240

ctggcttaccatttcgagactgagattgaagaggcactgcagaacatctacaattccagc300

caagtcgtgggcaataatgtagaggaagatgatttatatagcgtggcgctgcgttttcgt360

ctgctgcgtcaacagggttataacatcagctccgatgtctttaacaagttcaaagatgat420

aaagacaatttcaaggttagcctgatcggtgacgcaagctctttgttatctctgtatgaa480

gccgcgcatctgcgcgtgcatggcgagcatatcttggatgaagcgctgacctttagcgtt540

aataatctggaatcgatggcaacccagctgagcccgccgctggcaacgcacgttacgcac600

gcgttgaaccgcccgctgcgcaagggtatcccgcgtctggaagcgcgtcattacatttct660

gtgtacgaacaagatccactgcacgacgaagatttgcttaaactggcgaaactggatttt720

aatcaactgcaaaagattcaccagaaagaactgagcgagattagcaaatggtggaaagac780

attaatttcgtcagcaagctgccgttcgcccgcgaccgtgttgtggagtgctatttctgg840

attatgagcgttcacagcgagcctgagaactggctggcgcgccgcaccgcggctaagatt900

gcggcagtcacgtcgattatcgacgatatctatgacgtccacggcaccatcgatgaactg960

acgctgttcaccgaagccgttaaccgctgggacatcaacaacattgatcagctgccggaa1020

tacatgaagatctgctacaaagcgctgctgggcgtgttcagcgagctgggtgaagaactg1080

gagaaacagggtcgtagctatcgcttggatcataccattgagctgatgaaagatctggtc1140

ggtaattacttcaccgagtccaagtggctgagcgagaaatacgttccgacgatcgaagag1200

tacatgcgtgctgccgaagtgaccatcggttacaacaatgccattacggcatcttttgcc1260

acggcaaaggccggtgatatcgctaccaaagaaacctttgaatgggtgctgagcgaaccg1320

aagattgtcaaagcctccagcgttatttgtcgtctgatggacgatttgagcagccataag1380

tttgagcaaaagcgtggccacgtcgcgagcgcgatcgagtgctatatgaaacagcacgac1440

gcgaccgaggaaaaagttcgtgcagagttcaataaacaagtcaccgatgcgtggaaagtc1500

attaaccaagagtgcttgcacccgacggcgatcccgatgccactgctgacctgtgtgctc1560

aattatgcacgtgttgcggacgttatgtataaggatggtgacgcgtatacctttgcgcaa1620

attctgctgaaagaccacctgagcgcactgttcacggacccgatcgcgatgtaa1674

<210>4

<211>23

<212>dna

<213>人工序列(artificialsequence)

<223>引物

<400>4

atgtctgtcaaagttcctcaatc23

<210>5

<211>22

<212>dna

<213>人工序列(artificialsequence)

<223>引物

<400>5

tcacattgcaataggatcggtg22

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1