涉及三萜合成的酶的制作方法

文档序号:516320阅读:363来源:国知局
涉及三萜合成的酶的制作方法
【专利摘要】本发明公开了涉及三萜合成的酶。具体地,涉及分离的多核苷酸,所述多核苷酸编码由羧肽酶类蛋白、甲基转移酶和葡糖基转移酶组成的酶,所述酶涉及植物和种子中的β-香树素衍生的三萜的生物合成。本发明也涉及重组DNA构建体的构建,所述构建体包含全部或部分本发明的分离多核苷酸,所述多核苷酸以有义或反义方向可操作地连接至少一个调控序列。
【专利说明】涉及三萜合成的酶
[0001]本申请是申请日为2007年6月25日的中国专利申请200780053491.4“涉及三萜合成的酶”的分案申请。
【技术领域】
[0002]本发明涉及植物分子生物学领域。更具体地讲,本发明涉及编码植物和种子中^-香树素衍生的三萜生物合成中涉及的酶的多核苷酸。本发明也包括转基因植物,其中本发明多核苷酸的表达水平改变导致(6-香树素衍生的三萜(包括皂苷)的水平或结构改变。
【背景技术】
[0003]萜类化合物也称为类异戊二烯,它们组成了最大的天然产物家族,该类产物已有超过22,000种单独化合物被描述。三萜或萜类化合物(半萜、单萜、倍半萜烯、二萜、三萜、四萜、聚异戊烯醇等)在植物中起到各种不同的功能,如激素、光合作用色素、电子载体、多糖组分调节剂、和膜结构组分。植物萜类化合物主要存在于树脂、胶乳、蜡和油中。
[0004]三萜系化合物与多种植物特性相关,包括动物嗜食性、以及对病原体和掠食者的抗性。三萜主要储存在植物根部,储存形式为它们的配醣,皂苷(参见Price K.R.等人,1987,CRC Crit.Rev.Food Sc1.Nutr.26:27—133)。因此,例如,二倍体燕麦的突变体,黑燕麦,它缺乏主要的燕麦根皂苷,燕麦根皂苷A-1 (所谓的皂苷缺乏或“Sad”突变体),已经证明缺乏疾病抗性(Papadopoulou K.等人,1999, Proc.Natl.Acad.Sc1.U.S.A.96: 12923一12928)。这些突变体更易于受到许多不同的根感染真菌的侵害,包括小麦全蚀病菌,它对燕麦来说通常是非致病的。遗传分析表明疾病易感性提高和燕麦根皂苷水平降低有因果关系。此外,当接种小麦全蚀病菌时,燕麦根皂苷水平降低的sad突变体(约为野生型水平的15% )与其它完全缺乏燕麦根皂苷的突变体相比仅有有限的疾病症状,这进一步将燕麦根皂苷水平和疾病抗性联系起来。
[0005]有累积的数据表明饮食中的皂苷可能是有益的(参见例如Shi,J.A.等人(2004)J.Med.Food7:67-78 和 Vis, E.H.等人(2005)Nutr.Cancer 51:37-44)。同样的,已经证明大豆膳食皂苷对预防大鼠血胆脂醇过多和动脉粥样硬化有益(Oakenfull等人(1984),Nutr.Rep.1nt.29:1039—1046)。因为皂苷在从大豆到大豆分离物的过程中仅有轻微损失,大豆中的皂苷水平提高将导致分离物中的皂苷水平提高(Berhow,M.A.等人(2002)Phytochem.Anal.13:343— 348 ;Hu J.等人(2002),J.Agric.Food Chem.50:2587-2594)。因此提高大豆中的皂苷水平将是提高人类饮食中皂苷量的有效方法。此外,皂苷水平的提高可为药物开发中使用的化合物提供来源。
[0006]三萜以及留醇经由类异戊二烯途径合成。在此途径中,两分子的焦磷酸法尼酯头-头相连形成角鲨烯,这是一种三萜。角鲨烯然后转化为2,3-环氧角鲨烯。多种环氧角鲨烯环化酶催化2,3-环氧角鲨烯环化形成多种多环骨架,包括一种或多种环阿屯醇、羊毛甾醇、羽扇豆醇、 异复合精油醇(isomultif1renol)(—种三職化合物)、^ -香树素、a _香树素、和拟南芥醇(thalianol)(—种三萜化合物)。该由环氧角鲨烯环化酶催化的环化事件在留醇和三萜皂苷生物合成途径之间形成形成分枝点。多种环氧角鲨烯环化酶是进化相关的(Kushiro, T.等人(1998),Eur.J.Biochem.256 =238-244)并产生多种三环、四环、和五环结构,该结构能进行进一步修饰。
[0007]三萜系化合物皂苷经由类异戊二烯途径,通过环化2,3-环氧角鲨烯形成五环三萜系化合物,主要是齐墩果烷-香树素)或达玛烷骨架合成。三萜系化合物主链随后经受多种修饰(氧化、取代、和糖基化),所述修饰由细胞色素P450依赖型单氧酶、糖基转移酶(GT)、和其它酶介导。通常关于皂苷生物合成中涉及的酶和生物化学途径了解的不多。尽管在此类重要的天然产物中存在可观的商业利益,产生此重要的植物次级代谢产物家族所需的遗传机制很大程度上仍然是未知的。这可能是部分由于分子的复杂性以及缺乏用于生物化学研究的途径中间体。然而,目前已经了解了在皂苷生物合成中的第一个关键步骤,它通过环氧角鲨烯环化酶(6-香树素合酶(Sadl基因的产物)进行,最近已经克隆了该基因并描述了其特征(Haralampidis K.等人,2001, Proc.Natl.Acad.Sc1.U.S.A.98:13431一13436)。另一个关键步骤由细胞色素P450酶AsCYP51H10介导(由Sad2基因编码),最近已经受到研究(Qi X.等人,2006,Proc.Natl.Acad.Sc1.U.S.A103:18848-18853) oAsCYP51H10(SAD2)是燕麦根皂苷合成所需要的。AsCYP51H10的精确生物化学功能是未知的。然而Sad2突变体积累P -香树素,因此AsCYP51H10可能是在一个或多个位点(C12、C13、C16、C21和/或C30)氧化P -香树素(或其衍生物)所必需的(图1)。
[0008]结构比较(图1)预测除细胞色素P450之外的其它类的酶也将是把P -香树素转化成燕麦根皂苷A-1所需要的。这些酶包括糖基转移酶(GT)、酰基转移酶、和甲基转移酶(MT)。糖基转移酶属于一个大的酶家族,该家族的酶将糖单元从活化供体分子转移到广谱潜在受体分子上。潜在受体包括蛋白质、脂质、多糖和小分子,它们可涉及各种不同的细胞过程如细胞壁合成和信号转导(Coutinho PM等人,2003,J.Mol.Biol.,328:307-317)。在具有代表性的跨越全部区域的七`十七个GT家族中,GT家族I是其中最大的一个(CoutinhoPM 和 Henrissat B, 1999:Carbohydrate active enzymes website http: / / afmb.cnrs-mrs.fr / CAZY / )家族I由经由糖转移的反转催化机制运作的GT组成,通常作用于低分子量受体分子(Vogt T 和 Jones P,2000,Trends Plant Sc1.5:380-386 ;Lim E-K和Bowles DJ, 2004,EMBO J23:2915-2922)。通过与其它糖基化小分子的类比,预测燕麦根皂苷A-1的支链化糖链通过连续将糖单位加到糖苷配基组分上合成,最可能的通过三个不同的糖基转移酶(GT)活性合成。糖基化的第一个步骤涉及将L-阿拉伯糖加到糖苷配基的C3羟基上,由阿糖胞苷转移酶介导。此后加入两个D-葡萄糖分子,一个在阿拉伯糖的C2位点,另一个在C4位点,由一个(或可能两个)葡糖基转移酶介导(Townsend B等人,2006,Phytochemistry Revs.5: 109—114)。
[0009]酰基是植物来源的天然产物的常见部分,并能改变它们的化学和物理特性。因此可能影响天然产物在生态相互作用中的生物效应,并影响其它关键过程如亚细胞交换和螯合作用(例如通过作用于液泡摄入或驻留标记)。最近已经发现了一类新的植物酰基转移酶。这些酶-丝氨酸羧肽酶样酰基转移酶-与肽酶具有同源性,但缺乏肽酶活性,相反能够酸化天然产物(Milkowski C&Strack D, (2003), Phytochemistry65:517 ;Fraser CM 等人(2005)Plant Physi0l0gyl38:1136)。虽然其它植物酰基转移酶一般使用辅酶硫酯作为酰基供体,这些SCPL使用酰基葡萄糖供体。SCPL酰基转移酶家族的特征描述最佳的成员是番茄酶GAC-Lp,该酶催化葡萄糖聚酯的形成,所述葡萄糖聚酯有助于野生番茄中的昆虫抗性(Li AX&Steffens JC,2000,PNAS97:6902);拟南芥酶SNGl,它是合成苯基丙酸类芥子酰苹果酸酯(一种UV保护剂)所必需的(Landry LG等人,1995, Plant Physiologyl09:1159 ;LehfeIdt C 等人,2000,Plant Celll2:1295);第二拟南芥酶 SNG2,它涉及合成种子中的芥子酰胆碱(Shirley AM等人,2001,Plant J28:83);和甘蓝型油菜酰基转移酶BnSCT,它催化芥子酸酯的形成,该酯与苦味、收敛性和种子油萃取问题有关(Milkowski C等人,2004, Plant J.38:80 ;Baumert A 等人,2005, Phytochemistry66:1334)。虽然在这些修饰中涉及的酶和基因仍未能了解其特征,许多其它重要的植物来源的天然产物通过生物化学分析已知如何通过葡萄糖-酯-依赖性的酰基转移酶反应进行制备。实例包括在甘薯(Ipomoea batatas)中的抗氧化剂绿原酸、在野生胡萝卜(Daucus carota)中的花青苷、在橡树(Quercus robur)中的没食子单宁酸和在芸苔(Milkowski C&Strack D(2003)Phytochemistry65:517 ;Fraser CM 等人(2005)Plant Physiologyl38:1136)中的芥子酰-和苯甲酰-酯化的芥子油苷。有四种不同的结构相关的燕麦根皂苷[14]。燕麦根皂苷A-1 (存在于燕麦根部的主要燕麦根皂苷)和B-1用N-甲基邻氨基苯甲酸进行酰化,而燕麦根阜苷A-2和B-2用苯甲酸进行酸化(Hostettmann K和Marston A, 1995, Saponins,Cambridge University Press, Cambridge, UK)。
[0010]s-腺苷-L-甲硫氨酸-依赖性的甲基转移酶涉及许多植物天然产物的0-甲基化(Frick S.等人,2001,Phytochemistry56:1—4)。这些酶在木质素前体和其它植物防御所需的化合物合成中起到重要作用(Gang DR等人,2002,Plant Celll4:505— 519。

【发明内容】

[0011]本发明涉及编码三萜合成中涉及的酶的分离多核苷酸。具体地讲,本发明涉及编码新的丝氨酸羧肽酶样酰基转移酶、新的甲基转移酶、和新的葡糖基转移酶家族I的分离多核苷酸。这些分离自黑燕`麦的新酶称为AsSCPLI (丝氨酸羧肽酶样酰基转移酶)、AsMTl (甲基转移酶)和AsGT2 (葡糖基转移酶)。
[0012]编码负责多种谷物中三萜合成的酶的基因鉴定将允许它们的操纵。三萜合成操纵将引起三萜皂苷水平或结构的改变。皂苷产量的提高将引起植物抗害虫能力的提高。来源于具有高三萜水平的植物的食物被认为具有降低胆固醇的效应,然而三萜水平降低据信会使得食物具有更好的风味。因此,具有改变的三萜水平的转基因植物可对害虫产生抗性,而用三萜水平或结构发生改变的种子制备的食物将具有提高的营养价值或更好的风味。
[0013]在另一个实施方案中,本发明涉及分离的多核苷酸,所述多核苷酸包含编码丝氨酸羧肽酶样酰基转移酶多肽的核苷酸序列,所述多肽的氨基酸序列当与SEQ ID N0:2比较时,基于Clustal V比对方法具有至少95%的序列同一性;或编码甲基转移酶多肽的核苷酸序列,所述多肽的氨基酸序列当与SEQ ID NO:4比较时,基于Clustal V比对方法具有至少95%的序列同一性;或编码葡糖基转移酶的核苷酸序列,所述酶的氨基酸序列当与SEQID NO:6比较时,基于Clustal V比对方法具有至少95%的序列同一性;或包含(a)、(b)或(C)的全长互补序列的核苷酸序列。
[0014]在另一个实施方案中,本发明涉及包含本发明分离多核苷酸的载体。[0015]在另一个实施方案中,本发明涉及重组DNA构建体,该构建体包含编码三萜途径的第一种酶的本发明的多核苷酸的至少一部分,所述部分可操作地连接至少一种调控序列上。
[0016]在另一个实施方案中,本发明涉及重组DNA构建体,该构建体包含编码三萜途径的第一种酶的本发明的多核苷酸的至少一部分,所述部分可操作地连接至少一种调控序列上,还包含至少第二多核苷酸的至少一部分,所述第二多核苷酸编码调节三萜途径至少第二种酶的表达的多肽。
[0017]在另一个实施方案中,本发明涉及包含本发明的重组DNA构建体的分离宿主细胞。该宿主细胞可以是酵母细胞、细菌细胞、或植物细胞。
[0018]本发明也包括包括植物和植物部分的组合物,所述组合物包含本发明的分离多肽或多核苷酸。本发明也包括转化过的植物,所述植物来源于高等植物和种子或谷物的转化过的宿主细胞,它们来源于此类转化过的植物。此类转基因植物包括那些具有水平改变的^ -香树素衍生的三萜、或具有改性三萜的植物。
[0019]在另一个实施方案中,本发明涉及包含本发明重组体的转基因植物,其中调节序列是异源启动子,其中转基因植物当与野生型植物的三萜水平相比时具有改变的三萜水平。
[0020]本发明也涉及改变植物细胞中多肽表达水平的方法,所述方法包括:用来自至少一部分本发明的分离多核苷酸的核酸片段转化植物组织,其中所述多核苷酸能够改变天然丝氨酸羧肽酶样酰基转移酶、甲基转移酶、或葡糖基转移酶;将所述植物组织再生到转基因植物中;并评估当与具有对应的天然丝氨酸羧肽酶样酰基转移酶、甲基转移酶、或葡糖基转移酶的野生型表达水平的植物比较时,所述转基因植物的丝氨酸羧肽酶样酰基转移酶、甲基转移酶、或葡糖基转移酶的表达水平改变。
[0021]本发明也涉及产生对至少一种真菌具有抗性的植物的方法,所述方法包括:用至少一个本发明编码三萜途径第一种酶的重组DNA构建体转化植物细胞;在促进转基因植物再生的条件下使来自步骤(a)的转化植物细胞生长;并评估步骤(b)的转基因植物当与相同物种的未受所述重组DNA构建体转化过的植物比较时,对至少一种真菌的抗性提高情况。重组构建体还可包含至少一个第二多核苷酸,所述多核苷酸编码调节三萜途径至少一个第二种酶表达的多肽,期望该多核苷酸包括但不限于本发明的多核苷酸以及编码途径中前两个步骤的酶的核苷酸序列,所述酶为环氧角鲨烯环化酶(6-香树素合酶(Sadl基因的产物;Haralampidis K.等人,2001,Proc.Natl.Acad.Sc1.U.S.A.98:13431—13436)和 /或细胞色素 P450 酶 CYP51H10 (由 Sad2 基因编码;Qi X.等人,2006,Proc.Natl.Acad.Sc1.U.S.A.103:18848—18853)。
[0022]本发明也涉及生产具有改变水平的丝氨酸羧肽酶样酰基转移酶、甲基转移酶、或葡糖基转移酶的植物的方法,所述方法包括:用至少一种权利要求5所述的编码三萜途径第一种酶的重组DNA构建体转化植物细胞;在促进转基因植物再生的条件下使来自步骤(a)的转化植物细胞生长;并评估当与相同物种的未用所述重组DNA构建体转化过的植物中的丝氨酸羧肽酶样酰基转移酶、甲基转移酶、或葡糖基转移酶的量比较时,步骤(b)的转基因植物的丝氨酸羧肽酶样酰基转移酶、甲基转移酶、或葡糖基转移酶的表达水平改变。
[0023]本发明也涉及用于生产具有改变的三萜皂苷水平的植物的方法,所述方法包括:用至少一个本发明编码三萜途径第一种酶的重组DNA构建体转化植物细胞;在促进转基因植物再生的条件下使来自步骤(a)的转化植物细胞生长;并评估步骤(b)的转基因植物当与相同物种的未用所述重组DNA构建体转化过的植物中的三萜皂苷量比较时的三萜皂苷水平变化。重组构建体还可包含至少一个第二多核苷酸的至少一部分,所述多核苷酸编码调节三萜途径中至少一个第二种酶表达的多肽,期望该多核苷酸包括但不限于本发明的多核苷酸(酰基转移酶、甲基转移酶和葡糖基转移酶)、Sadl和Sad2。
[0024]本发明也涉及用于生产具有提高的三萜皂苷水平的植物的方法,所述方法包括:用至少一种权利要求5的编码三萜途径第一种酶的重组DNA构建体转化植物细胞;在促进转基因植物再生的条件下使来自步骤(a)的转化植物细胞生长;并评估步骤(b)的转基因植物当与相同物种的未用所述重组DNA构建体转化过的植物中的三萜皂苷量比较时的三萜皂苷水平提高。重组构建体还可包含至少一个第二多核苷酸,所述多核苷酸编码调节三萜途径中至少一个第二种酶表达的多肽,期望该多核苷酸包括但不限于本发明的多核苷酸(酰基转移酶、甲基转移酶和葡糖基转移酶)、Sadl和Sad2。
[0025]本发明也涉及用于生产具有降低的三萜皂苷水平的植物的方法,所述方法包括:用至少一个本发明编码三萜途径第一种酶的重组DNA构建体转化植物细胞;在促进转基因植物再生的条件下使来自步骤(a)的转化植物细胞生长;并评估步骤(b)的转基因植物当与相同物种的未用所述重组DNA构建体转化过的植物中的三萜皂苷量比较时的三萜皂苷水平降低。重组构建体还可包含至少一个第二多核苷酸的至少一部分,所述多核苷酸编码调节三萜途径中至少一个第二种酶表达的多肽,期望该多核苷酸包括但不限于本发明的多核苷酸(酰基转移酶、甲基转移酶和葡糖基转移酶)、Sadl和Sad2。
[0026]本发明也包括来自本发明转基因植物的谷物。
【专利附图】

【附图说明】
[0027]根据以下的详细描述和附图以及序列清单,可以更全面地理解本发明,以下的详细描述和附图以及序列清单形成本申请的一部分。
[0028]图1图示了 P -香树素和燕麦根皂苷A-1的结构,说明必然发生了多个修饰以从前者衍生出后者。
[0029]图2图示了一个317kb的基因组DNA序列,该序列包含五个来自黑燕麦的预测的生物合成酶的基因((6-香树素合酶(Sadi)、细胞色素P450CYP51H10(Sad2)、t、丝氨酸羧肽酶样蛋白AsSCPL1、甲基转移酶AsMTl和葡糖基转移酶AsGT2。
[0030]图3对五个预测的生物合成酶的Northern印迹分析(P -香树素合酶(SADl)、细胞色素P450CYP51H10(SAD2)、丝氨酸羧肽酶样蛋白AsSCPLl、甲基转移酶AsMTl、葡糖基转移酶AsGT2和GAPDH对照),所述酶位于燕麦的根芽、叶和花组织中。
[0031]序列描述概要说明了后附的序列列表。此序列列表中以单个字母表示核苷酸,以单独的3字母表示氨基酸,如Nucleic Acids Researchl3:3021— 3030 (1985)和Biochemical Journal219 (2):345— 373 (1984)所描述的 IUPAC — IUB 标准中所规定的。
[0032]SEQ ID NO:1是编码来自黑燕麦(AsSCPLl)的丝氨酸羧肽酶样多肽的cDNA核苷酸序列。
[0033]SEQ ID NO:2是衍生自SEQ ID NO:1中显示的cDNA片段或SEQ ID NO:7中显示的基因组片段的AsSCPLI氨基酸序列。
[0034]SEQ ID NO:3是编码来自黑燕麦(AsMTl)的酰基甲基转移酶的cDNA核苷酸序列。
[0035]SEQ ID NO:4是衍生自SEQ ID NO:3中显示的cDNA片段或SEQ ID NO:8中显示的基因组片段的AsMTl氨基酸序列。
[0036]SEQ ID NO:5是编码来自黑燕麦(AsGT2)的葡糖基转移酶的cDNA核苷酸序列。
[0037]SEQ ID NO:6是衍生自SEQ ID NO:5中显示的cDNA片段或SEQ ID NO:9中显示的基因组片段的AsGT2氨基酸序列。
[0038]SEQ ID NO:7是编码AsSCPLI多肽的基因组片段的核苷酸序列。
[0039]SEQ ID NO:8是编码AsMTl的基因组片段的核苷酸序列。
[0040]SEQ ID NO:9是编码AsGT2的基因组片段的核苷酸序列。
【具体实施方式】
[0041]本文中所列出的每篇参考文献的公开内容均全文以引用方式并入本文。
[0042]如本文所用的并在所附的权利要求书中的单数形式“一个”和“所述”包括复数涵义,除非上下文中清楚地另有指明。因此,例如,“一株植物”的涵义包括多株此类植物,“一个细胞”的涵义包括一个或多个细胞及其本领域的技术人员已知的等同物,等等。
[0043]在此公开的上下文中使用了许多术语和缩写。给出了如下定义。
`[0044]“开放阅读框”缩写为0RF。
[0045]“聚合酶链反应”缩写为PCR。
[0046]代谢途径或生物合成途径在生物化学意义上可以认为是发生于细胞内由酶催化的一系列化学反应,用以实现待细胞使用的或待细胞贮存的代谢产物的形成,或启动另一代谢途径(因而称作流量产生步骤)。很多此类途径都很精细,并涉及对起始物质的逐步修饰以使之形成具有期望的精确化学结构的产物。
[0047]本文所用的“核酸”意指多核苷酸,并包括单链或双链的脱氧核糖核苷酸或核糖核苷酸碱基聚合物。核酸也可以包括片段和经修饰的核苷酸。因此,术语“多核苷酸”、“核酸序列”、“核苷酸序列”或“核酸片段”可互换使用,并且是作为单链或双链的RNA或DNA聚合物,任选含有合成的、非天然的或改变的核苷酸碱基。核苷酸(通常以它们的5'-单磷酸形式存在)可以用如下它们的单字母名称指代:“A”表示腺苷酸或脱氧腺苷酸(分别针对RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示鸟苷酸或脱氧鸟苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,“N”表示任何核苷酸。
[0048]术语“分离的”多核苷酸是一种已经被大体上分开或从其中天然产生多核苷酸的生物中通过常规的核酸纯化方法纯化的其它多核苷酸,即,其它染色体和染色体外的DNA及RNA。该术语也涵盖重组多核苷酸和化学合成的多核苷酸。本发明的分离多核苷酸可包括全部或部分分离多核苷酸,例如包含选自以下核苷酸序列的多核苷酸:SEQ ID NO=USEQID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:8 和 SEQ ID NO:9 或此类核苷酸序列的全长互补序列。
[0049]三萜系化合物皂苷经由类异戊二烯途径,通过环化2,3-环氧角鲨烯形成五环三萜系化合物,主要是齐墩果烷-香树素)或达玛烷骨架合成。三萜系化合物主链随后经受多种修饰,包括氧化、酰基化、甲基化、糖基化和其它取代,所述修饰由细胞色素P450依赖型单氧酶、糖基转移酶、酰基转移酶、甲基转移酶和其它酶介导。
[0050]三萜,也称为三萜系化合物,包括但不限于皂苷和甾醇。
[0051]“皂苷”指植物中天然积累的环化三萜的配醣缀合物。环化三萜包括但不限于羊毛留醇、环阿屯醇、P _香树素、a -香树素、羽扇豆醇、isomultifiorenol、和thalianol。“三萜皂苷”指环化三萜的配糖缀合物,除了那些来源于羊毛留醇或环阿屯醇之外的三萜。“甾族皂苷”指来源于羊毛留醇或环阿屯醇配醣缀合物。皂草精醇是经由体外酸水解获取的三萜皂苷,对它们的测量为从中提取皂苷的组织中存在的三萜皂苷的量提供了一个相对值。 [0052]三萜皂苷的水平可通过测量造成皂草精醇进行测定。皂草精醇的测量值直接关联于三萜皂苷的水平。皂草精醇是经由体外酸水解获取的三萜皂苷,对它们的测量为从中提取皂苷的组织中存在的三萜皂苷的量提供了一个相对值,该值直接关联于三萜皂苷的量。
[0053]三萜皂苷水平可使用本领域已知的技术进行测量。例如,可使用具有光散射检测器的 HPLC-MS 或 HPLC 进行测量(参见例如 Rupasinghe, H.P.等人,(2003),J.Agr1.FoodChem.51 =5888-5894)。作为另外一种选择,可使用具有UV检测器的HPLC进行测量(HubertJ 等人,(2005), J.Agric.Food Chem.53:3923-3930)。其它方法包括使用 GC-FAB。(参见例如Gee等人,(1993),J Sci Food Agric.63 =201-209)。其它方法涉及使用薄层色谱法(TLC)结合密度计量学分离皂苷(参见例如Oleszek WA.(2002) J.Chromatogr.A967:147-162.;Gurfinkel DMjPRao AV (2002) J.Agric.Food Chem.50:426-430。
[0054]使用其它方法测量三萜皂苷也是可能的。例如,使用多种免疫测定方法(例如放射性免疫测定或ELISA)也是合适的(Wang CC, Prasain JK,和Barnes S.(2002)J.Chromatogr.B Analyt.Technol.Biomed.Life Sc1.777:3-28, Ahamed A 等人,(2003),Biochem.Biophys.Res.Commun.302:587-592)。
[0055]“提高的三萜皂苷水平,”对于本发明而言指三萜皂苷水平高于那些存在于相同物种的非转化植物中的三萜皂苷水平,水平提高是由于转化了本发明的核酸片段。例如,“提高的三萜皂苷水平,”可以指三萜皂苷水平高于那些存在于相同物种植物中的三萜皂苷水平,该植物不具有本发明的包含编码环氧角鲨烯环化酶的多核苷酸的重组DNA分子。“提高的三職阜苷水平”可以是提高至少IOOppm, 250ppm, 500ppm, 750ppm, 1000ppm, 1250ppm,1500ppm, 3000ppm, 6000,或任何它们的整数。
[0056]“改变的水平”或“改变的表达”指转基因生物中产生的基因产物的量或比例不同于正常生物或非转化生物。
[0057]“改变的三萜皂苷水平,”对于本发明而言指三萜皂苷水平的量或比例不同于那些存在于相同物种的没有转化本发明的核酸片段的非转化植物中的三萜皂苷水平。
[0058]“降低的三萜皂苷水平,”对于本发明而言指三萜皂苷水平低于那些存在于相同物种的没有转化本发明的核酸片段的非转化植物中的三萜皂苷水平。
[0059]术语“具有相当功能的亚片段”和“功能上相当的亚片段”在本文中可互换使用。这些术语是指分离的核酸片段的一个部分或亚序列,其中无论所述片段或亚片段是否编码有活性的酶,其都保留着改变基因表达或导致某种表型的能力。例如,所述片段或亚片段可以被用于设计嵌合基因,以在转化后的植物中产生所期望的表型。可以通过将核酸片段或亚片段以相对于植物启动子序列有义或反义的方向与所属启动子序列连接,从而设计出用于抑制的嵌合基因,其中所述核酸片段或亚片段无论是否编码有活性的酶均可。
[0060]术语“保守结构域”或“基序”指进化上相关的蛋白质的比对序列中在特定位置保守的一组氨基酸。虽然同源蛋白质之间在其它位置的氨基酸可以发生变化,但在特定位置高度保守的氨基酸表示对蛋白质的结构、稳定性或活性来说是必需的氨基酸。因为它们可通过它们在蛋白质同源物家族的比对序列中的高度保守来鉴定,所以它们可用作识别标记或“签名”来确定具有新的测定序列的蛋白质是否属于以前鉴定的蛋白质家族。
[0061]术语“同源性”、“同源的”、“大体上类似的”和“大体上对应的”在本文中可互换使用。它们指其中一个或多个核苷酸碱基的变化不会影响核酸片段介导基因表达或产生某种表型的能力的核酸片段。这些术语也指本发明的核酸片段的修饰(例如缺失或插入一个或多个核苷酸),相对于初始的未经修饰的核酸片段,基本上不会改变所得核酸片段的功能特性。因此,正如本领域技术人员应该理解的,本发明不仅仅涵盖这些具体的示例性序列。[0062]此外,技术人员认识到,本发明所涵盖的大体上类似的核苷酸序列也由它们在中等严格条件(如0.5X SSC, 0.1% SDS, 600C )下,与本文所示例的序列杂交的能力,或杂交至本文所公开的核苷酸序列的任何部分以及杂交至与本文所公开的任何核苷酸序列功能相当的序列的能力所限定。可以调节严格性条件以筛选中度相似的片段例如来自远缘生物的同源序列,到筛选高度相似的片段例如从近缘生物复制功能性酶的基因。杂交后的洗涤确定严格性条件。
[0063]术语“选择性杂交”包括指在严格杂交条件下,核酸序列与特定核酸靶序列以比其与非靶核酸序列的杂交更高的可检测程度(例如至少2倍于背景)杂交,并指基本排除了非靶核酸。选择性杂交的序列通常彼此具有约至少80%的序列同一性,或90%的序列同一性,最多并包括100%的序列同一性(即完全互补)。
[0064]术语“严格条件”或“严格杂交条件”包括指探针将选择性杂交至其靶序列的条件。严格条件是序列依赖性的并将因不同的环境而异。通过控制杂交和/或洗涤条件的严格性,可鉴定与探针100%互补的靶序列(同源探测)。作为另一种选择,可调节严格条件以允许序列中的一些错配,以便检测到更低程度的相似性(异源探测)。通常,探针的长度少于约1000个核苷酸,任选长度少于500个核苷酸。
[0065]通常,严格条件将是如下那些条件:在pH7.0至8.3下盐浓度低于约1.5M钠离子,通常约0.01至1.0M钠离子浓度(或其它盐),并且对于短探针(例如10至50个核苷酸)温度为至少约30°C,而对于长的探针(例如多于50个核苷酸)温度为至少约60°C。严格条件也可以通过加入诸如甲酰胺之类的去稳定剂来实现。示例性的低严格条件包括在37°C于含有30至35%甲酰胺、IM NaCl、l% SDS(十二烷基硫酸钠)的缓冲液中杂交,以及在50至55°C用IX至2X SSC (20X SSC=3.0M NaCl/0.3M柠檬酸三钠)洗涤。示例性的中等严格条件包括在37°C于40至45%甲酰胺、IM NaClU % SDS中杂交,以及在55至60°C下用0.5X至IX SSC洗涤。示例性的高严格条件包括在37°C于50%甲酰胺、IM NaCl、I % SDS中杂交,以及在60至65°C用0.1X SSC洗涤。
[0066]特异性通常取决于杂交后洗涤,最后的洗涤溶液的离子强度和温度是关键因素。对于 DNA-DNA 杂交体,Tni 可以用 Meinkoth 等人,Anal.Biochem.138:267-284(1984) =T111 =81.5°C +16.6 (log M) +0.41(% GC) -0.61(% form) -500/L ;其中 M 是单价阳离子的体积摩尔浓度,% GC是DNA中鸟苷和胞嘧啶核苷酸的百分比,% form是杂交溶液中甲酰胺的百分比,而L是以碱基对表示的杂交体的长度。^是(在确定的离子强度和pH下)50%的互补靶序列与完全匹配的探针杂交时的温度。每出现1%的错配,Tffl降低约1°C ;因此,可调节Tm杂交和/或洗涤条件以与具有期望同一性的序列杂交。例如,如果要寻求具有>90%同一性的序列,则可将Tm降低10°C。通常,在确定的离子强度和pH下,严格条件选择为比特定序列及其互补序列的熔解温度CU低约5°C。然而,极严格条件可采用在比熔解温度(Tffl)低1、2、3或4°C的温度下杂交和/或洗涤;中等严格条件可采用在比熔解温度(Tm)低6、7、8、9或10°C的温度下杂交和/或洗涤;低严格条件可采用在比熔解温度(Tm)低11、12、13、14、15或20°C温度下杂交和/或洗涤。利用所述等式、杂交和洗涤组合物以及理想的Tm,本领域技术人员将会理解,杂交和/或洗涤溶液的严格性的变化已经在本质上得以描述。如果所需的错配程度导致Tm低于45°C (水溶液)或32°C (甲酰胺溶液),则优选增加SSC的浓度以便能使用更高的温度。对核酸杂交的详尽指导可在以下文献中找到=Tijssen,Laboratory Techniques in Biochemistry and Molecular Biology—Hybridization withNucleic Acid Probes,第 I 部分,第 2章“Overview of principles of hybridization andthe strategy of nucleic acid probe assays,,, Elsevier, New York (1993);以及CurrentProtocols in Molecular Biology,第 2 章,Ausubel 等人编辑,Greene Publishing andffiley-1nterscience, New York (1995)。杂交和 / 或洗漆条件可进行至少 10、30、60、90、120或240分钟。
[0067]在核酸或多肽序列上下文中的“序列同一性”或“同一性”是指两序列中的核酸碱基或氨基酸残基当在指定比较窗口中比对最大匹配时是相同的。
[0068]因此,“序列一致性百分比”是指通过在一个比对窗口上比较两段最大化匹配的序列所决定的值,其中在所述比对窗口中的多核苷酸或多肽序列的部分与(不包含附加或缺失)的参考序列相比可以包含附加或缺失(即间隙),以获得两段序列之间的最大匹配。所述百分比的计算方法是,统计相同的核酸碱基或氨基酸残基在两段序列中同时出现的位点的数量以得到匹配位点数,`将此匹配位点数除以比对窗口中的总位点数,再将结果乘以100,从而得到序列一致性百分比。序列一致性百分比的可用的例子包括但不限于50%、55%、60%、65%、70%、75%、80%、85%、90%和 95%,或者从 50%至 100% 的任意整数百分比。上述一致性可以利用本文所述的任意程序来确定。
[0069]序列对比和百分比同一性或类似性可以用设计用于检测同源序列的多种比较方法来确定,这些方法包括(但不限于)LASERGENE生物信息计算包(DNASTAR Inc.,Madison,WI)的MegAlig?程序。在本专利申请案的上下文中应当理解,使用序列分析软件进行分析时,除非另外指明,否则分析结果将基于所参考程序的“默认值”。在此所用的“默认值”是指在首次初始化软件时软件最初加载的任何值或参数集。
[0070]“Clustal V 比对方法”对应于称为 Clustal V(在 Higgins 和 Sharp, CAB10S,5:151-153(1989) ;Higgins, D.G.等人(1992)Comput.Appl.Biosc1.8:189-191),并存在于LASERGENE 生物信息学计算软件包(DNASTAR Inc.,Madison, WI)的 MegAlign? 程序中。对于多重比对,默认值对应于缺口罚分(GAP PENALTY) =10和缺口长度罚分(GAP LENGTHPENALTY) =IO0用Clustal方法进行成对比对和蛋白质序列的百分比同一性计算的默认参数为KTUPLE=U空位罚分=3、窗口(WINDOW) =5和DIAGONALS SAVED=5。而对于核酸,这些参数为KTUPLE=2,空位罚分=5,窗口 =4和DIAGONALS SAVED=4。用Clustal V程序比对序列后,可通过查看同一程序中的“序列距离”表来获得“百分比同一性”。
[0071]“BLASTN比对方法”是由国家生物技术信息中心(National Center forBiotechnology Information, NCBI)提供的用以采用默认参数比较核苷酸序列的算法。
[0072]本领域的技术人员非常清楚,多种程度的序列同一性可用于从其他物种中鉴定多肽,其中这类多肽具有相同或相似的功能或活性。同一性百分比的可用的实例包括但不限于 50 %、55 %、60 %、65 %、70 %、75 %、80 %、85 %、90 % 或 95 %、或 50 % 至 100 %之间的任何整数百分比。实际上,50%至100%之间的任何整数氨基酸同一性可用于描述本发明,诸如 51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%,67%, 68%,69%,70%,71%,72%,73%,74%,75%,76%,77%,78%,79%,80%,81 82%,83%,84%,85%,86%,87%,88%,89%,90%,91 92%,93%,94%,95%,96 %、97 %、98 %或99 %。此分离核苷酸片段的任何全长或部分互补的序列也是有用的。
[0073]“密码子简并性”指允许核苷酸序列在不影响所编码的多肽的氨基酸序列的情况下发生变化的遗传密码的趋异度。因此,本发明涉及任何包含编码所有或主要部分的氨基酸序列的核苷酸序列的核酸片段,所述氨基酸序列编码如SEQ ID NO:2, SEQ ID NO:4、和SEQ ID N0:6示出的AsSCPLUAsMH和AsGT2蛋白。技术人员熟知由特定宿主细胞使用指定给定氨基酸的核苷酸密码子表现出的“密码子偏倚”。因此,当合成多核苷酸用于改善宿主细胞中的特定基因表达时,希望设计该多核苷酸使得其密码子使用频率接近宿主细胞使用的优选密码子的频率。
[0074]如本文所用的,“合成核酸片段”可由使用本领域技术人员已知的方法化学合成的寡核苷酸构件装配而成。将这些构件相连接并进行退火以形成更大的核酸片段,然后可将其酶催化进行装配以构建完整的所需核酸片段。与核酸片段有关的“化学合成”指在体外对组分核苷酸进行装配。可以采用完善建立的方法来完成核酸片段的手工化学合成,或者可使用许多种可商业获得的机器中的一种来完成自动化学合成。因此,基于最优化核苷酸序列以反映宿主细胞的密码子偏倚性,可以定制核酸片段用以最优化基因表达。如果密码子使用偏向于宿主偏好的那些密码子,则技术人员会理解成功的基因表达的可能性。优选的密码子的确定可基于对来源于宿主细胞的基因(其中序列信息可获得)的检测。
[0075]“基因”是指能够表达特定蛋白质的核酸片段,其包括编码序列前的调控序列(5'非编码序列)和编码序列后的调控序列(3'非编码序列)。“天然基因”是指天然存在的具有其自己的调控序列的基因。“嵌合基因”是指不是天然基因的任何基因,包含在天然情况下不是一起存在的调节序列和编码序列。因此,嵌合基因可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。“外来基因”指正常情况下不存在于宿主生物中的基因,它通过基因转移导入宿主生物。外来基因可以包含插入到非天然生物体内的天然基因,或嵌合基因。“转基因”是通过转化方法导入基因组内的基因。
[0076]在应用于植物细胞时,术语“基因组”不仅包括在细胞核内发现的染色体DNA,并且还包括在细胞的亚细胞成分(例如线粒体、质体)内发现的细胞器DNA。
[0077]“经密码子最优化的基因”是其密码子使用频率经设计用以模仿宿主细胞优选的密码子使用频率的基因。
[0078]“等位基因”是染色体上占据给定位点的基因的几种供选择替代形式中的一种。当染色体上给定位点处存在的所有等位基因相同时,植物在该位点是纯合子。如果染色体上给定位点处存在的等位基因不同的话,植物在该位点是杂合子。
[0079]“编码序列”指编码特定氨基酸序列的DNA序列。“调控序列”指位于编码序列的上游(5'非编码序列)、中间或下游(3'非编码序列),并且影响相关编码序列的转录、RNA加工或稳定性或者翻译的核苷酸序列。调控序列可包括,但不限于:启动子、翻译前导序列、内含子、多腺苷酸化识别序列、RNA加工位点、效应子结合位点和茎环结构。
[0080]“启动子”指能够控制编码序列或功能性RNA表达的DNA序列。启动子序列由近侧和较远端上游元件组成,后者经常指增强子。因此,“增强子”是能刺激启动子活性的DNA序列,它可以是启动子的天然元件,或插入以增强启动子水平或组织特异性的异源元件。启动子可以整个源于天然基因,或者由源于不同的天然存在的启动子的不同元件组成,或者甚至包括合成的DNA片段。本领域内的技术人员应当理解,不同的启动子可以在不同的组织或细胞类型中,或者在不同的发育阶段,或者响应不同的环境条件而引导基因的表达。还应认识到,由于在大多数情况下还不能完全确定调控序列的确切范围,一些变型的DNA片段可能具有相同的启动子活性。在多数情况下引起基因在大多数细胞型中表达的启动子通常称为“组成型启动子”。目前不断在发现可用于植物细胞中的不同类型的新启动子;在以下文献中可以发现多个实例:0kamuro, J.K.and Goldberg, R.B.编辑的BiochemistryofPlantsl5:1-82(1989)。
[0081]“翻译前导序列”指位于基因启动子序列和编码序列之间的多核苷酸序列。翻译前导序列存在于翻译起始序列的经完全加工后的mRNA上游。翻译前导序列可影响mRNA的初级转录过程、mRNA稳定性或翻译效率。已经描述了翻译前导序列的实例(Turner, R.和Foster, G.D., Mol.Biotechnol.3:225-236(1995))。
[0082]“3’非编码序列”,“转录终止子”或“终止序列”是指位于编码序列下游并且包括能够影响mRNA加工或基因表达的`多腺苷酸化识别序列和其他序列编码调节信号的DNA序列。多腺苷酸化信号通常表征为影响多腺苷酸片添加到mRNA前体的3’末端。Ingelbrecht,1.L.等人例示了不同3’非编码序列的用途Plant Celll:671-680 (1989)。
[0083]“ RNA转录物”指由RNA聚合酶催化的DNA序列的转录所产生的产物。当RNA转录物与DNA序列拷贝完全互补时,它指初级转录物。当RNA转录物是来源于转录后加工的初级转录物的RNA序列时,它指成熟的RNA。“信使RNA”或“mRNA”指无内含子并且可以由细胞翻译成蛋白质的RNA。“cDNA”指与mRNA模板互补并用反转录酶从mRNA模板合成的DNA。cDNA可以是单链,或使用DNA聚合酶I的Klenow片段转化成双链。“有义”RNA指包含mRNA并且能在细胞内或体外翻译成蛋白质的RNA转录物。
[0084]“反义RNA”指与全部或部分靶初级转录物或mRNA互补,并阻止靶基因表达的RNA(美国专利5,107,065)。反义RNA可以与特定基因转录物的任何部分,即5’非编码序列、3’非编码序列、内含子、或编码序列互补。“功能性RNA”指反义RNA、核酶RNA或其它不能翻译但是对细胞过程有影响作用的RNA。术语“互补的”和“反向互补的”对mRNA转录来说可互换使用,并且用以定义信使反义RNA。
[0085]术语“可操作地连接”指单个核酸片段上的核酸序列的关联,使得其中一个核酸序列的功能受到另一个核酸序列的调控。例如,当启动子能够调节编码序列的表达(即,该编码序列受到该启动子的转录控制)时,则该启动子与该编码序列可操作地连接。编码序列可以以有义或反义的取向可操作地连接至调控序列。在另一个例子中,本发明的互补RNA区域,无论直接或间接连接、5 ’端与目标mRNA或3 ’端与目标mRNA连接、或者位于目标mRNA内、或者第一互补区域以5’端而其互补体以3’端与目标mRNA连接,均可构成可用的连接。
[0086]本文使用的标准重组DNA和分子克隆技术是本领域所熟知的并且在如下文献中有更全面的描述:Sambrook, J., Fritsch, E.F.and Maniatis, T., Molecular Cloning:ALaboratory Manual ;Cold Spring Harbor Laboratory: Co Id Spring Harbor,NY(1989)。转化方法为本领域的技术人员所熟知,并描述于下文。
[0087]“PCR”或“聚合酶链反应”是用于合成大量的特定DNA片段的技术,其包括一系列重复的循环(Perkin Elmer Cetus Instruments, Norwalk, CT)。典型地,双链 DNA 被热变性,两种与目标片段的3’端区域互补的引物在较低温度下与之退火,然后在中间温度下得到延伸。一组的上述三个连续的步骤被称为一个“循环”。
[0088]术语“重组”指例如通过化学合成或者通过用基因工程技术操纵分离的核酸片段来实现的两个原本分离的序列片段的人工组合。
[0089]术语“质粒”、“载体”和“盒”指通常携带有不属于细胞中心代谢的部分的基因的染色体外元件,并且常常是环状双链DNA片段的形式。这类元件可以是源自任何来源的自主复制序列、基因组整合序列、噬菌体或单链或双链DNA或RNA的核苷酸序列(线性或环状),其中多个核苷酸序列已连接或重组进入一种独特构建体中,该独特构建体能够将所选基因产物的启动子片段和DNA序列与相应的3’末端非翻译序列一起引入细胞中。“转化盒”指含有外来基因并且除了该外来基因外还含有有利于转化特定宿主细胞转化的元件的特定载体。“表达盒”是指包含外来基因,并具有能令所述基因在宿主中增强表达的所述基因以外的元件的特定载体(即指可将核酸序列或片段移入其中的不连续的核酸片段)。
[0090]术语“重组构建体”、“表达构建体”、“嵌合构建体”、“构建体”和“重组DNA构建体”本文可互换使用。重组构建体包括人造的核酸片段组合,例如天然条件下不一起存在的调控序列和编码序列。例如嵌合构造可包括源于不同来源的调控序列和编码序列,或者包括源于同一来源但以不同于天然存在的方式排列的调控序列和编码序列。此类构建体可独自使用或与载体组合使用。如果使用载体,则载体的选择取决于用以转化宿主细胞的方法,该宿主细胞是本领域的技术人员所熟知的。例如可以使用质粒载体。技术人员熟知为了成功地转化、筛选和繁殖包括本发明任何分离的核酸片段的宿主细胞,必须存在于载体上的遗传元件。技术人员还将认识到,不同的独立转化事件将导致不同水平和模式的表达(Jones 等人,EMBO J.,4:2411-2418 (1985) ;DeAlmeida 等人,Mol.Gen.Genetics218:78-86 (1989)),因此,必须筛选多次事件以获得显示期望表达水平和模式的品系。这样的筛选可以通过DNA的Southern印迹分析、mRNA表达的Northern印迹分析、蛋白表达的免疫印迹分析或表型分析等完成。
[0091]本文所用术语“表达”是指功能性终产物(例如,mRNA或蛋白质(既可以是前体也可以是成熟形式))的生产。
[0092]术语 “导入”是指将核酸(例如表达构建体)或蛋白提供至细胞中。导入包括指将核酸整合进真核或原核细胞中,在该细胞中核酸可以整合进细胞的基因组内,以及包括指将核酸或蛋白暂时提供给细胞。导入包括指稳定的或暂时性的转化方法以及有性杂交。因此,将核酸片段(例如重组DNA构建体/表达构建体)插入细胞内的情况下的“导入”意指“转染”或“转化”或“转导”,并且包括指将核酸片段整合进真核或原核细胞中,在该细胞中核酸片段可以整合进细胞的基因组(如染色体、质粒、质体或线粒体DNA)内、转变成自主的复制子或瞬时表达(例如转染的mRNA)。
[0093]“成熟”蛋白质指经翻译后加工的多肽(即已经去除了存在于初始翻译产物中的任何前肽或肽原的多肽)。“前体”蛋白质指mRNA的初级翻译产物,即前肽和肽原仍然存在。前肽和肽原可以是(但不限于)细胞内定位信号。 [0094]“信号肽”是一种与蛋白协同翻译并将蛋白导向分泌器官体系的氨基酸序列(Chrispeels, M.(1991) Ann.Rev.Plant Phys.Plant Mol.Biol.42:21-53)。如果将所述蛋白导向液泡,可另外加上液泡靶向信号(同上),或者如果将所述蛋白导向内质网,可加上内质网驻留信号(同上)。如果将蛋白导向细胞核,将移除任何存在的信号肽并用以核定位信号替代(Raikhel, N.(1992)Plant Phys.100:1627-1632)。“叶绿体转运肽”是与蛋白协同翻译并将蛋白导向叶绿体或在其中制备蛋白的细胞中存在的其它质体类型。“叶绿体转运序列”指编码叶绿体转运肽的核苷酸序列。
[0095]“稳定转化”指将核酸片段转入宿主生物的基因组以产生稳定的遗传特性,该基因组包括核基因组和细胞器基因组。相反“瞬时转化”指将核酸片段转入宿主生物的核中或包含DNA的细胞器中,在无整合或无稳定的遗传特性的情况下引起基因表达。含有转化核酸片段的宿主生物被称为“转基因”生物体。
[0096]如本文所用的“转基因”是指其基因组内含有异源多核苷酸的植物或细胞。优选的是,异源多核苷酸被稳定地整合进基因组中,使得该多核苷酸能传递至连续的世代。异源多核苷酸可以单独地或作为表达构建体的部分整合进基因组中。本文所用的转基因包括因异源核酸存在而已经改变了基因型的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,包括初始进行此类改变的转基因以及从初始的转基因通过有性杂交或无性繁殖产生的那些转基因。如本文所用的术语“转基因”不涵盖通过常规植物育种方法或通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色体外基因组)改变。
[0097]术语“抑制”指当与植物中天然酶的可检测的酶活性水平比较时,转基因植物中可检测的酶活性水平的降低。植物中天然酶的酶活性水平本文称为“野生型”活性。术语“抑制”包括降低、减少、下调、减弱、抑制、消除和阻止。该降低可能是由于降低了天然mRNA翻译成天然酶的水平。也可能是由于天然DNA转录成mRNA的量降低和/或天然mRNA的降解加快。术语“天然酶”指所需细胞中天然产生的酶。
[0098]植物中的酶抑制可通过本领域已知的多种方法完成,包括以下方法。“共抑制”是指产生能抑制相同的或充分相似的天然基因表达的有义RNA转录本(美国专利5,231,020)。此前,已通过着眼于以有义方向过表达与内源mRNA具有同源性的核酸序列(其导致与过表达的序列具有同源性的所有RNA减少)设计出了植物中的共抑制构建体(参见 Vaucheret 等人,1998, Plant J., 16:651-659 ;以及 Gura, 2000, Nature404:804-808)。“反义抑制”指产生能够抑制靶蛋白表达的反义RNA转录物。可将植物病毒序列用于引导对近端mRNA编码序列的抑制(于1998年8月20日公开的PCT专利公开W098/36083)。已经描述了 “发夹”结构以互补方向整合mRNA编码序列的全部或部分,导致已表达的RNA形成潜在的“茎-环”结构(于1999年10月21日公开的PCT专利公开W099/53050)。在这种情况下,茎由对应相对于启动子以有义或反义方向插入的相关基因的多核苷酸形成,并且环由一些相关基因的多核苷酸形成,在构建体中该多核苷酸不具有互补序列。这增加了获得的转基因植物中的共抑制或沉默频率。关于发夹抑制的综述,参见Wesley, S.V.等人,2003, Methods in Molecular Biology, Plant Functional Genomics:Methods and Protocols236:273_286。其中茎由至少30个来自待抑制基因的核苷酸形成而环由任意的核苷酸序列形成的构建体也已经有效地用于抑制(于1999年12月2日公开的W099/61632)。使用聚-T和聚-A序列产生茎-环结构中的茎已经有所描述(于2002年I月3日公开的W002/00894)。然而另一种变型涉及使用合成的重复序列来促进茎-环结构中的茎的形成。用这种重组DNA片段产生的转基因生物体显示由形成茎环结构的核苷酸片段编码的多核苷酸的水平降低,如于2002年I月3日公开的PCT专利公开W002/00904中所述。已经描述了产生dsRNA构建体的用途。在这些构建体中共启动子引导诱导基因抑制的基因特异性有义和反义RNA的转录(参见例如Shi,H.等人(2000) RNA6:1069-1076 ;Bastin,P.等人(2000) J.Cell Sc1.113:3321-3328 ;Giordano,E.等人(2002)Geneticsl60:637-648 ;LaCount,D.J.和 Donelson,J.E.美国专利申请 20020182223,公布于2002年12月5日;Tran,N.等人(2003)BMC Biotechnol.3:21 ;和 申请人:的美国临时申请60/578,404,提交于2004年6月9日)。
[0099]用于酶抑制的其它方法包括但不限于使用可形成催化RNA或可具有核酶活性的多核苷酸(美国专利公开4,987,071,公布于1991年I月22日),以及小RNA(也称为miRNA)干涉(Javier 等人(2003)Nature425:257-263)。
[0100]用于抑制的多核苷酸片段序列与需被抑制的基因中存在的多核苷酸片段序列并非100%相同。例如,使用来源于编码a亚基(美国专利公开6,362,399)的基因部分的多核苷酸已经成功抑制了所有大豆种子贮藏蛋白(6-大豆伴球蛋白的亚基。(6-大豆伴球蛋白是一种异质糖蛋白,由三个高负电亚基(鉴定为a、a’和(6)的多样化组合组成。编码a和a ’亚基的多核苷酸序列彼`此约85%相同,然而编码0亚基的多核苷酸序列与a和a ’亚基分别为约75%至约80%相同。因此,与需抑制的靶多核苷酸区域至少约75%相同的多核苷酸已经显示对抑制所需靶有效。所述多核苷酸可以与所需靶序列至少约80%相同,至少约90%相同,至少约95%相同,或约100%相同。
[0101]天然基因“能够抑制表达的部分”指分离的核酸片段的一个部分或亚片段,其中无论所述片段或亚片段是否可以被翻译成有活性的酶,其都保留着改变基因表达或导致某种表型的能力。例如,所述片段或亚片段可以被用于设计嵌合基因或重组DNA片段,以在转化后的植物中产生所期望的表型。可以通过将核酸片段或亚片段以相对于植物启动子序列有义或反义的方向与所属启动子序列连接,从而设计出用于抑制的嵌合基因,其中所述核酸片段或亚片段无论是否翻译成有活性的酶均可。可将重组DNA片段设计成包含能够促进茎-环结构形成的核酸片段。在茎-环结构中环或茎包含一部分需被抑制的基因。核酸片段应具有至少约20个邻接核苷酸的延伸部分,该延伸部分与需被抑制的基因相同。邻接核苷酸的延伸部分可以是任何数目,从至少约20,或约32,至需被抑制的整个基因的大小。
[0102]术语“植物”包括整个植株、植物器官、植物组织、种子和植物细胞,种子以及同一植株的子代。植物细胞包括但不限于得自下列物质的细胞:种子、悬浮培养物、胚、分生区域、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢子。[0103]“子代”包括植物的任何后续世代。
[0104]“对至少一种真菌有抗性的植物”指包含本发明的重组DNA构建体的植物,当用真菌感染该植物时,相对于无本发明的重组DNA构建体的植物,它能抗感染或在更大程度上忍受感染,导致损害减少、健康程度增加以及产量少损失或不损失。真菌通常是病原体。“病原体”或“真菌病原体”指在不包括本发明重组DNA构建体的条件下将引起植物疾病的真菌。包含本发明的重组DNA构建体的转基因植物通常是比无本发明重组DNA构建体的相同物种植物对至少一种真菌更具有抗性的植物。
[0105]植物表达系统、表达盒和载体、以及转化 [0106]启动子是引导植物细胞机制从启动子的邻接编码序列下游(3’)产生RNA的DNA序列。所述启动子区域影响着基因的RNA转录物合成的速率、合成时的发育阶段和细胞类型。所述RNA转录物被加工为mRNA,后者作为用于将RNA序列翻译为所编码多肽的氨基酸序列的模板。5’端非翻译前导序列是mRNA上位于蛋白质编码区域上游的区域,其可能对mRNA翻译的起始和进行发挥作用。3’转录终止/多聚腺苷酸化信号是位于蛋白质编码区域下游的非翻译区域,其在植物细胞中的作用是导致RNA转录的终止和多聚腺苷酸向RNA3’端的添加。
[0107]用于驱动编码序列表达的启动子的来源并不重要,只要它具有足够的转录活性以通过在适当的时间、在所期望的宿主组织内表达所期望的核酸片段的可翻译的mRNA,从而达到本发明的目的即可。异种的或非异种的(即内源的)启动子均可用于实施本发明。例如,适当的启动子包括但不限于4大豆伴球蛋白启动子的a引发亚单位、库尼兹(Kunitz)胰蛋白酶抑制剂3启动子、膜联蛋白启动子、大豆球蛋白Gyl启动子、0大豆伴球蛋白启动子的P亚单位、P34/Gly Bd m30K启动子、白蛋白启动子、Leg Al启动子和LegA2启动子。
[0108]上述膜联蛋白或P34启动子描述于PCT专利公布W004/071178 (公布于2004年8月26日)。上述膜联蛋白启动子的活性水平与任何已知的强启动子相当,所述强启动子如:(l)CaMV35S 启动子(Atanassova 等人,Plant Mol.Biol.37:275-285(1998);Battraw and Hall, Plant Mol.Biol.15:527-538(1990) ;Holtorf 等人,Plant Mol.Biol.29:637-646(1995) Jefferson 等人,EMBO J.6:3901-3907(1987) ;ffilmink等人,Plant Mol.Biol.28:949-955(1995)) ; (2)拟南芥油质蛋白(oleosin)启动子(Plant 等人,Plant Mol.Biol.25: 193-205(1994) ;Li, Texas A&M UniversityPh.D.dissertation, pp.107-128 (1997)) ; (3)拟南芥泛素延伸蛋白启动子(Callis 等人,J Biol.Chem.265(21):12486-93(1990)) ; (4)番茄泛素基因启动子(Rollfinke 等人,Gene.211(2):267-76(1998)) ; (5)大豆热激蛋白启动子(Schoffl 等人,Mol GenGenet.217(2-3):246-53(1989));以及(6)玉米 H3 组蛋白基因启动子(Atanassova 等人,Plant Mol Biol.37(2):275-85(1989))。
[0109]上述膜联蛋白启动子的另一有用特性是其在发育种子中的表达谱。上述膜联蛋白启动子在早期(授粉后10天以内)的发育中种子中最为活跃,而在随后的时期基本保持沉默。上述膜联蛋白启动子的表达谱与许多种子特异性启动子的都不同,后者如通常在发育后期表现出最高活性的种子贮藏蛋白启动子(Chen等人,Dev.Genet.10:112-122(1989);Ellerstrom 等人,Plant Mol.Biol.32:1019-1027 (1996) ;Keddie 等人,Plant Mol.Biol.24:327-340(1994) ;Plant等人,(同上);Li,(同上))。上述膜联蛋白启动子具有更加常规的表达谱,不过仍与其他已知的种子特异性启动子不同。因此,当希望在早期发育阶段过表达或抑制一个基因时,上述膜联蛋白启动子是一个很有吸引力的选择。例如,可能希望过表达一个调控早期胚胎发育的基因或一个在种子成熟之前参与代谢的基因。
[0110]在鉴定出适合表达编码序列的适当启动子之后,利用为本领域的技术人员所熟知的传统方法,将所述启动子以有义方向进行可操作地连接。
[0111]本文所用的标准的重组DNA和分子克隆技术为本领域所熟知,并且Sambrook,J.等人在 Molecular Cloning:A Laboratory Manual ;第二版;Cold Spring HarborLaboratory Press:Cold Spring Harbor, New York, 1989 (以下简称 “Sambrook 等人,1989”)或 Ausubel, F.M.,Brent, R.,Kingston, R.E.,Moore, D.D.,Seidman, J.G.,Smith,J.A.and Struhl, K.,编辑,;在 Current Protocols in Molecular Biology ;John Wileyand Sons:New York, 1990 (以下简称“Ausubel等人,1990”)中有更加详尽的描述。
[0112]在构建了重组构建体之后,可以通过为本领域的普通技术人员所熟知的方法(例如转染、转化和电穿孔),将其导入植物细胞。[0113]也可将本发明的重组构建体导入一种植物细胞;或者也可将每一重组构建体导入至不同的植物细胞。
[0114]如前所述,在植物细胞中的表达方式可以是暂时性的也可以是稳定的。
[0115]植物部分包括分化和未分化的组织,包括但不限于下列部分:根、茎、芽、叶、花粉、种子、肿瘤组织和多种形式的细胞和培养物(例如单个细胞、原生质体、胚和愈伤组织)。植物组织可存在于植株或植物器官、组织或细胞培养物中。
[0116]术语“植物器官”是指构成植株的形态和功能不同部分的植物组织或组织群。术语“基因组”是指:(1)存在于生物体的每一个细胞或者病毒或细胞器中的全套遗传物质(基因和非编码序列);和/或(2)作为(单倍体)单位从一个亲本遗传的全套染色体。
[0117]用于转化双子叶植物(主要利用根癌农杆菌)并获得转基因植物的方法,已与其他方法一起公布于下列文献:棉花(美国专利5,004, 863 ;美国专利5,159,135);大豆(美国专利5,569,834 ;美国专利5,416,011);用于芸苔属植物(Brassica)的那些(美国专利 5,463,174);花生(Cheng 等人,Plant Cell Rep.15:653-657(1996) ;McKently 等人 Plant Cell Rep.14:699-703 (1995));番木瓜果(Ling, K.等人 Bio / technology9:752-758(1991));以及豌豆(Grant 等人 Plant Cell R印? 15:254-258 (1995))。对植物转化的其他常用方法的综述参见Newell,C.A.(Mol.Biotechnol.16:53-65 (2000)) ?这些转化方法之一利用了发根土壤杆菌(Tepfler, M.and Casse-Delbart, F.Microbiol.Sc1.4:24-28 (1987))。已公布的利用直接输送DNA进行的大豆转化,有利用PEG融合(PCT专利公布 TO92 / 17598)、利用电穿孔(Chowrira, G.M.等人,Mol.Biotechnol.3:17-23 (1995);Christou, P.等人,Proc.Natl.Acad.Sc1.84:3962-3966 (1987))、利用显微注射和利用基因枪轰击(McCabe, D.E 等人,Bio / Technology6:923(1988) ;Christou 等人,PlantPhysiol.87:671-674(1988))进行的。
[0118]存在多种用于从植物组织再生植物的方法。再生的具体方法将取决于起始植物组织以及待再生的具体植物物种。从单植物原生质体转化体或从多种经转化的外植体再生、发育和培育植物是本领域所熟知的(Weissbach和Weissbach (编辑),载于:Methods forPlant Molecular Biology, (Eds.) ,Academic:San Diego, CA (1988))。该再生和生长方法通常包括如下步骤:选择转化的细胞和培养这些单独化的细胞通过胚发育的通常阶段以及通过生根小植株阶段。转基因胚以及种子以类似的方式再生。随后将所得的转基因的生根小苗种植在诸如土壤之类的合适植物生长培养基中。优选地,将再生的植物进行自花授粉以产生纯合的转基因植物。或者,将得自再生植物的花粉与农学上重要的品系的产生种子的植株进行杂交。相反,将来自这些重要品系的植物用于给再生植物授粉。利用本领域技术人员所熟知的方法培育含有所需多肽的本发明的转基因植物。
[0119]除以上所讨论的程序以外,专业人员亦熟悉描述了用于下列目的的特定条件和程序的标准源资料:大分子的构建、操作和分离(例如DNA分子、质粒等等);重组DNA片段和重组表达体的构建;以及克隆的筛选和分离。例如参见:Sambrook等人,MolecularCloning:A Laboratory Manual, Cold Spring Harbor:NY(1989) ;Maliga 等人,Methodsin Plant Molecular Biology, Cold Spring Harbor:NY(1995) ;Birren 等人,GenomeAnalysis !Detecting Genes,第 I 卷,Cold Spring Harbor:NY(1998) ;Birren等人,GenomeAnalysis !Analyzing DNA,第 2 卷,Cold Spring Harbor:NY(1998) ;Plant MolecularBiology:A Laboratory Manual,编辑,Clark, Springer:NY(1997)。
[0120]本发明涉及编码丝氨酸羧肽酶样酰基转移酶、甲基转移酶、或葡糖基转移酶的分离多核苷酸。如本文所用,“多核苷酸”指编码新丝氨酸羧肽酶样酰基转移酶、甲基转移酶、或葡糖基转移酶的多核苷酸,所述酶涉及植物中3 -香树素衍生的三萜或具有改变修改形式的三萜的生物合成。这些分离自黑燕麦的酶称为AsSCPLI (丝氨酸羧肽酶样酰基转移酶)、AsMTl (甲基转移酶)和AsGT2 (葡糖基转移酶)。
[0121]Sad7突变体不能产生燕麦根皂苷,也不能积累在正-氨茴酸甲酯(燕麦根皂苷A-1和B-1)或苯甲酸盐(燕麦根皂苷A-2和B-2)酰基位点具有羟基的三萜配醣(Qi X等人,2004,Proc.Natl.Acad.Sc1.U.S.A.101:8233)。因此,它们不发生三萜酰化。已经鉴定了四个具有Sad7表型的突变体`(表1)。它们中的每一个都具有对本发明的多核苷酸有损害,将导致多核苷酸不能表达编码功能蛋白的功能mRNA。这些数据与本文提供的生物化学数据一起表明本发明非突变的多核苷酸编码来自黑燕麦的(ASCPLl)丝氨酸羧肽酶样酰基转移酶,该酶负责三萜主链的酰化,而该酰化过程在Sad7突变体中不发生。公开了编码AsSCPLI 的 cDNA 基因组片段(SEQ ID NO:1 和 SEQ ID NO:7)。
[0122]表1:表征Sad7突变体。显示的发生改变的碱基位置(上标第2列)基于突变体DNA序列与SEQ ID NO:1的比较。
[0123]
【权利要求】
1.分离的多核苷酸,所述多核苷酸由以下序列组成: (a)编码甲基转移酶多肽的核苷酸序列,所述多肽由SEQID NO:4的氨基酸序列组成;或 (b)由(a)的全长互补序列组成的核苷酸序列。
2.权利要求1的多核苷酸,其中所述编码甲基转移酶的核苷酸序列由SEQID N0:3或8中的一种组成。
3.包含权利要求1的多核苷酸的载体。
4.重组DNA构建体,所述构建体包含权利要求1的编码三萜途径的第一种酶的多核苷酸,所述多核苷酸可操作地连接至少一种调控序列。
5.权利要求4的重组DNA构建体,所述构建体还包含至少第二多核苷酸,所述第二多核苷酸编码调控三萜途径中至少第二种酶的表达的多肽,其中所述第二种酶是P -香树素合酶或 CYP51H10。
6.用于转化细胞的方法,所述方法包括用权利要求4或权利要求5的重组DNA构建体转化细胞。
7.用于生产转基因植物的方法,所述方法包括用权利要求4或权利要求5的重组DNA构建体转化植物细胞并 从所述转化过的植物细胞再生转基因植物。
8.包含权利要求4的重组DNA构建体的分离宿主细胞,其中所述宿主细胞不是植物细胞。
9.权利要求8的宿主细胞,其中所述宿主细胞选自酵母细胞和细菌细胞。
10.改变植物细胞中多肽表达水平的方法,所述方法包括: a)用来自权利要求1的分离多核苷酸的核酸片段转化植物组织,其中所述多核苷酸能够改变天然甲基转移酶的表达; b)将所述植物组织再生成转基因植物;以及 c)评估当与具有对应的天然甲基转移酶的野生型表达水平的植物比较时,所述转基因植物的甲基转移酶的表达水平改变。
11.生产对至少一种真菌具有抗性的植物的方法,所述方法包括: a.用至少一种权利要求4的编码三萜途径的第一种酶的重组DNA构建体转化植物细胞; b.在促进转基因植物再生的条件下使来自步骤(a)的转化过的植物细胞生长;以及 c.评估步骤(b)的转基因植物当与相同物种的未受所述重组DNA构建体转化过的植物比较时,对至少一种真菌的抗性提高; 其中所述植物是单子叶植物。
12.权利要求11的方法,其中所述重组DNA构建体还包含至少第二多核苷酸,所述第二多核苷酸编码调控三萜途径中至少第二种酶的表达的多肽,其中所述第二种酶是P -香树素合酶或CYP51H10。
13.权利要求11的方法,其中所述重组DNA构建体还包含至少一种多核苷酸,所述多核苷酸编码选自P -香树素合酶和CYP51H10的酶。
14.生产具有改变水平的甲基转移酶的植物的方法,所述方法包括: a)用权利要求4的编码三萜途径的第一种酶的重组DNA构建体转化植物细胞;b)在促进转基因植物再生的条件下使来自步骤(a)的转化过的植物细胞生长;以及 c)评估当与相同物种的未用所述重组DNA构建体转化过的植物中的甲基转移酶的量比较时,步骤(b)的转基因植物的甲基转移酶的水平改变; 其中所述植物是单子叶植物。
15.权利要求14的方法,其中所述重组DNA构建体还包含至少第二多核苷酸,所述第二多核苷酸编码调控三萜途径中至少第二种酶的表达的多肽。
16.权利要求14的方法,其中所述重组DNA构建体还包含至少一种多核苷酸,所述多核苷酸编码选自P -香树素合酶和CYP51H10的酶。
17.用于生产具有改变的三萜皂苷水平的植物的方法,所述方法包括: 1.用至少一种权利要求4的编码三萜途径的第一种酶的重组DNA构建体转化植物细胞; 2.在促进转基因植物再生的条件下使来自步骤(a)的转化过的植物细胞生长;以及 3.评估步骤(b)的转基因植物当与相同物种的未用所述重组DNA构建体转化过的植物中的三萜皂苷量比较时的三萜皂苷水平改变, 其中所述植物是单子叶植物。
18.权利要求17的方法,其中所述重组DNA构建体还包含至少第二多核苷酸,所述第二多核苷酸编码调控三萜途径中至少第二种酶的表达的多肽,其中所述第二种酶是P -香树素合酶或CYP51H10。
19.权利要求17的方法,其中所述重组DNA构建体还包含至少一种多核苷酸,所述多核苷酸编码选自P -香树素合酶和CYP51H10的酶。
20.用于生产具有提高的三萜皂苷水平的植物的方法,所述方法包括: a)用至少一种权利要求4的编码三萜途径的第一种酶的重组DNA构建体转化植物细胞; b)在促进转基因植物再生的条件下使来自步骤(a)的转化过的植物细胞生长;以及 c)评估步骤(b)的转基因植物当与相同物种的未用所述重组DNA构建体转化过的植物中的三萜皂苷量比较时的三萜皂苷水平提高; 其中所述植物是单子叶植物。
21.权利要求20的方法,其中所述重组DNA构建体还包含至少第二多核苷酸,所述第二多核苷酸编码调控三萜途径中至少第二种酶的表达的多肽,其中所述第二种酶是P -香树素合酶或CYP51H10。
22.权利要求20的方法,其中所述重组DNA构建体还包含至少一种多核苷酸,所述多核苷酸编码选自P -香树素合酶和CYP51H10的酶。
23.用于生产具有降低的三萜皂苷水平的植物的方法,所述方法包括: a)用至少一种权利要求4的编码三萜途径的第一种酶的重组DNA构建体转化植物细胞; b)在促进转基因植物再生的条件下使来自步骤(a)的转化过的植物细胞生长;以及 c)评估步骤(b)的转基因植物当与相同物种的未用所述重组DNA构建体转化过的植物中的三萜皂苷量比较时的三萜皂苷水平降低; 其中所述植物是单子叶植物。
24.权利要求23的方法,其中所述重组DNA构建体还包含至少第二多核苷酸,所述第二多核苷酸编码调控三萜途径中至少第二种酶表达的多肽,其中所述第二种酶是P -香树素合酶或CYP51H10。
25.权利要求23的方法,其中所述重组DNA构建体还包含至少一种多核苷酸,所述多核苷酸编码选自P -香树 素合酶和CYP51H10的酶。
【文档编号】C12N5/10GK103602691SQ201310373364
【公开日】2014年2月26日 申请日期:2007年6月25日 优先权日:2007年6月25日
【发明者】A.奥斯伯恩, X.齐 申请人:植物生物科学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1