咖啡中半乳甘露聚糖含量的调节的制作方法

文档序号:406699阅读:437来源:国知局
专利名称:咖啡中半乳甘露聚糖含量的调节的制作方法
技术领域
本发明涉及农业生物技术的领域。更特别地,本发明涉及来自咖啡植物的、涉及半乳甘露聚糖前体合成的核酸和酶,以及它们在调节咖啡豆的半乳甘露聚糖含量中的用途。
背景技术
植物细胞壁是复杂且动态的混合物(composites),其特别包含多糖、蛋白和木质素。多糖是绿色咖啡粒的主要成分,其可占到成熟粒的多达50%的干重(Redgwell等,2003,Planta 217,316-326)。在咖啡粒中多糖主要有三种形式纤维素、II型阿拉伯半乳聚糖和半乳甘露聚糖(Fischer 等,2001, Carbohydrate Research 330,93-101),而半乳甘露聚糖是最为丰富的(总质量的50%,或者粒的干质量的大约25% )。半乳甘露聚糖结构相对简单,其由¢-1,4-连接的甘露糖分子的线性主链和以多种间隔沿着甘露聚糖主链的 单个单位的a-1,6-连接的半乳糖基侧链购成。在一些植物中(虽然对咖啡来说并不一定),还有葡萄糖随甘露聚糖散布,由此生成半乳葡甘露聚糖。Clifford(1986, Tea Coffee Trade J. 158,30-32)已报道,阿拉比卡(arabica)咖啡(小果咖啡(Coffea arabica))可含有比罗布斯塔(robusta)(中果咖啡(C. canephora)) (6-8 % )更多的阿拉伯半乳聚糖(9_13 % ),以及更多的半乳甘露聚糖(阿拉比卡中25-30%,而罗布斯塔中19-22% )。他还暗示,罗布斯塔中的半乳甘露聚糖更高度支化,并且由此较少结晶。该论点虽然尚未证实,但已用于解释为何在同样的烘焙程度下罗布斯塔通常比阿拉比卡产生更多可溶固体(Clifford,1985,In M. N. Clifford和 K.C. Wilson 编,Coffee Botany, Biochemistry, and Production of Beans andBeverage, Croom Helm, London,第 305-374 页;Clifford, 1986,参见上文;Trugo, 1985,In R. J. Clarke 和 R. Macrae 编,Coffee, Chemistry I, Elsevier, Amsterdam,第 83-114页)。注意到,在对分离自一种阿拉比卡品种和一种罗布斯塔品种的咖啡粒的多糖的研究中,Fischer等(2001)没有在那些样品中发现多糖的量的任何显著不同,虽然阿拉比卡品种的多糖要比罗布斯塔品种具有稍微更多的甘露糖含量。此外,在检验的阿拉比卡和罗布斯塔品种的半乳甘露聚糖中没有看到可检测到的不同。Redgwell等,2002, CarbohydrateResearch 337,421-431)和 Oosterveld 等,2003, Carbohydrate Polymers 52,285-296)已报道,多于40%的原本存在于绿色粒中的多糖在较长烘焙期后被降解。然而,Redgwell等(2002,见上文)显示,在烘焙期间阿拉伯半乳聚糖比甘露聚糖对降解更为敏感,并且纤维素聚合物不受影响。半乳甘露聚糖在烘焙期间的有限降解已导向下述观点半乳甘露聚糖是经烘焙的咖啡粒中最难提取的部分。因为半乳甘露聚糖组成咖啡粒的主要部分,已投入了显著量的研究努力,来理解半乳甘露聚糖在咖啡粒胚乳中是怎样合成和降解的。该研究的主要目的是发现和/或开发出具有改变的半乳甘露聚糖水平和/或结构的咖啡,并且由此其例如可在较低温度下具有改善的可提取性。半乳甘露聚糖合成通过两种酶来进行,甘露聚糖合酶(ManS)和半乳甘露聚糖半乳糖基转移酶(GMGT),它们被认为共定位于高尔基小囊的膜中,并且被相信作为复合体一起工作(Dhugga 等,2004, Science 303, 363-366 ;Edwards 等,2004, Plant Physiol 134,1153-1162)。已分离和表征了涉及咖啡粒半乳甘露聚糖合成的ManS和GMGT基因序列,以及用于在植物的其它部分中进行半乳甘露聚糖合成的序列(Pre等,2008,Ann. Bot.(Lond) 102,207-220 ;W0 2007/047675A2)。在半乳甘露聚糖合成期间,与纤维素合成酶相关的ManS酶使用GDP-甘露糖(GDP-Man)前体来使甘露聚糖主链聚合,而GMGT酶则负责将半乳糖残基从M)P-半乳糖前体转移到生长中的甘露聚糖主链(Edwards等,2004,见上文)。其暗示对由那些基因编码的酶的表达或活性的调节可用于增加或减少植物中,最特别地,豆中的半乳甘露聚糖的量(WO 2007/047675A2)。甘露聚糖酶涉及半乳甘露聚糖的降解,其还可影响到植物或植物组织中存在的半乳甘露聚糖的量。已经分离和表征了咖啡甘露聚糖酶(W000/28046 ;US 7,148,399B2)。已从发芽的咖啡粒分离了编码不同的内-P甘露聚糖酶(manA和manB)的两个cDNA (Marraccini 等.,2001, Planta213 :296-308)。尽管半乳甘露聚糖在咖啡粒中具有重要性,并且参与半乳甘露聚糖合成和 降解的酶无疑具有重要性,但在通过使用那些基因或酶来调节咖啡粒中半乳甘露聚糖的量或结构的方面进展极少。因此,存在鉴定和开发操纵咖啡中半乳甘露聚糖含量和/或结构的新途径的需要。
发明总结本发明的一个方面涉及从咖啡属物种分离的核酸分子,其包含编码选自UDP-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和UDP-葡糖4-差向异构酶(UGE)的半乳甘露聚糖前体合成酶的编码序列。在一种实施方式中,半乳甘露聚糖前体合成酶包含下述氨基酸序列,当通过BLAST比较进行测定时,所述氨基酸序列在其整体上与SEQ ID NO :6-10中任一的氨基酸序列超过大约80%相同。特别地,半乳甘露聚糖前体合成酶包含SEQ ID NO 6-10中的任一。核酸分子可包含SEQ ID NO :1_5中的任一。在某些实施方式中,编码序列是(I)基因的开放阅读框,或(2)通过基因转录产生的mRNA分子,或(3)通过对mRNA分子进行逆转录产生的cDNA分子。本发明的另一方面涉及包含前述编码序列的载体,所述编码序列编码选自M)P-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和UDP-葡糖4-差向异构酶(UGE)的半乳甘露聚糖前体合成酶。在一种实施方式中,载体是选自质粒、噬粒、粘粒、杆状病毒、杆粒、细菌、酵母和病毒载体构成的载体组的表达载体。核酸分子的编码序列可与组成型启动子有效连接,或者其可与可诱导启动子有效连接,或者其可与组织特异性启动子有效连接。一些启动子既是可诱导的又是组织特异性的,而另一些是组成型且组织特异性的。任选地,组织特异性启动子是种子特异性启动子。来自咖啡的种子特异性启动子是特别合适的。本发明的另一方面涉及用一种或多种上述载体转化的宿主细胞。宿主细胞可选自植物细胞、细菌细胞、真菌细胞、昆虫细胞和哺乳动物细胞。在某些实施方式中,宿主细胞是选自咖啡、烟草、拟南芥属、玉米、小麦、水稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、三叶草、油菜、红花、向日葵、花生、可可、酸浆果(tomatillo)、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆、紫毙(aster)、秋海棠(begonia)、菊、飞燕草(delphinium)、矮牵牛属植物、百日草属属植物和草皮草。在特别的实施方式中,宿主细胞来自咖啡。还提供了从上述任何植物细胞产生的可育植物。本发明的另一方面涉及在植物中调节半乳甘露聚糖含量的方法,所述方法包括调节植物内一种或多种半乳甘露聚糖前体合成酶的生产或活性,从而导致植物中半乳甘露聚糖含量改变。在特别的实施方式中,植物是咖啡植物。此类方法可用于通过改变咖啡种子内半乳甘露聚糖的量和/或结构来调节咖啡种子的可提取性。在某些实施方式中,半乳甘露聚糖前体合成酶是UDP-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)或M)P-葡糖4-差向异构酶(UGE)。所述方法的一种实施方式包括增加UGPP、GMPP、PMM或UGE中一种或多种的产量或活性,例如通过增加编码UGPP、GMPP, PMM或UGE中一种或多种的基因在植物内的表达来实现。这可通过向植物中引入编码UGPP、GMPP、PMM或UGE中一种或多种的一种或多种转基因来完成。所述方法的另一实施方式包含减少UGPP、GMPP、PMM或UGE中一种或多种的生产或 活性,例如通过减少编码UGPP、GMPP, PMM或UGE中一种或多种的基因在植物内的表达来实现。这可通过向植物中引入编码是UGPP、GMPP、PMM或UGE中一种或多种的翻译的抑制剂的一种或多种多核苷酸(例如反义寡核苷酸、siRNA、miRNA或shRNA)来完成。本发明的其它特征和优点将参照下文附图
、详细描述和实例来理解。附图简述图 I.对 CcUGPP(pcccs46w918)(SEQ ID NO :6)、StUGPP(CAA79357)(SEQ IDNO : 11)、OsUGPP (ABD57308) (SEQ ID NO : 12)、CmUGPP (ABD98820) (SEQ ID NO 13)和AtUGPP(AAK32773) (SEQ ID NO 14)的蛋白序列比对。使用 CLUSTAL W 来进行对 NCBI数据库中可获得的马铃薯(Solanum tuberosum)UGPP(StUGPP)、水稻(Oryza sativa)UGPP(OsUGPP)Jftm (Cucumis melo) UGPP (CmUGPP)拟南芥 UGPP (AtUGPP)蛋白序列与由中果咖啡UGPP基因编码的蛋白序列(CcUGPP)的比对。灰色标识的氨基酸与中果咖啡UGPP序列中发现的残基匹配。图 2.对 CcGMPP (pcccl22il9) (SEQ ID NO :7)、StGMPP (AAD01737) (SEQ IDNO :15)、SlGMPP (AAT37498) (SEQ ID NO : 16)、MsGMPP (AAT58365) (SEQ ID NO :17)和VvGMPP (CA069137) (SEQ ID NO :18)的蛋白序列比对。使用CLUSTAL W来进行对NCBI数据库中可获得的马铃薯GMPP(StGMPP)、番茄(Solanunm lycopersicum)GMPP(SlGMPP)、紫花苜猜(Medicago sativa) GMPP (MsGMPP)和葡萄(Vitis v in if era) GMPP (VvGMPP)蛋白序列与由中果咖啡GMPP基因编码的蛋白序列(CcGMPP)的比对。灰色标识的氨基酸与中果咖啡GMPP序列中发现的残基匹配。图 3.对CcPMM(pcccs46w3al4)(SEQ ID NO :8)、GmPMM(ABD97873)(SEQ ID NO :19)、VvPMM(CA039354)(SEQ ID NO :20)、PtPMM(ABK96056)(SEQ ID NO :21)和 AtPMM(ABD97870)(SEQ ID NO 22)的蛋白序列比对。使用CLUSTAL W来进行对NCBI数据库中可获得的大豆 PMM(GmPMM)、葡萄 PMM(VvPMM)、毛果杨(Populus trichocarpa) PMM(PtPMM)和拟南芥P丽(AtPMM)蛋白序列与由中果咖啡PMM基因编码的蛋白序列(CcPMM)的比对。灰色标识的氨基酸与中果咖啡PMM序列中发现的残基匹配。图 4.对 CcUGEl (SGN-U347952) (SEQ ID NO :9)、CcUGE5 (pcccl 17 j24)(SEQ ID NO :10)、AtUGEl(NP_172738) (SEQ ID NO :23)、AtUGE3 (NP_564811)(SEQ ID NO :24)、StUGE51 (AAP97493) (SEQ ID NO :25)、AtUGE5 (NP_192834) (SEQID NO :26)、AtUGE2(NP_194123) (SEQ ID NO :27)、AtUGE4 (NP_176625) (SEQ ID NO:28)、PtUGE(ABK95303) (SEQ ID NO :29)、StUGE45(AAP42567) (SEQ ID NO :30)和VvUGE (CAN63477) (SEQ ID NO :31)的蛋白序列比对。使用 CLUSTAL W 来进行对 NCBI数据库中可获得的拟南芥UGEl (AtUGEl)、UGE3 (AtUGE3)、马铃薯UGE51 (StUGE51)、毛果杨 UGE (PtUGE)、马铃薯 UGE45 (StUGE45)和拟南芥 UGE2 (AtUGE2)、UGE4 (AtUGE4)和UGE5 (AtUGE5)与由中果咖啡UGEl (CcUGEl)和UGE5 (CcUGE5)基因编码的蛋白序列的比对。灰色标识的氨基酸与中果咖啡UGEl序列中发现的残基匹配。图5.通过MegAlign软件获得的系统发生树,其源于图4所示的使用ClustalW进行的蛋白比对。图6.重组的His标签化的CcUGE5和CcUGPP的表达。使用考马斯蓝染色,在8-16%丙烯酸胺快速 PAGE 凝胶(Acrylamide Express PAGE Gel) (GenScript Corp.)上对来自重 组HIS-CcUGE5和HIS-CcUGPP融合蛋白(分别是pGT2和pGT3)表达的多个阶段的提取物进行分析。梯(ladder)上样于凝胶左侧(预染色的SDS-PAGE标准物低范围(PrestainedSDS-PAGE Standards Low Range, BIO-RAD)) 对于每种蛋白,上样四种级分(frations),它们是(从左到右)非诱导的含有未经诱导的pGT2(HIS-CcUGE5)或pGT3 (CcUGPP)的B121重组细胞的总裂解物;经诱导的含有用0. 2mM IPTG诱导的pGT2 (HIS_CcUGE5)或pGT3 (CcUGPP)的B121重组细胞的总裂解物;可溶的使用BugBuster进行裂解处理之后经诱导的裂解物的可溶级分;不可溶的使用BugBuster进行裂解处理之后经诱导的裂解物的不可溶级分。图7.针对罗布斯塔FRT32、FRT05和FRT64以及阿拉比卡T2308,在不同的粒发育阶段,对UGEl和UGE5的定量表达分析。使用定量RT-PCR,在多种粒样品中测量每种基因的表达。RQ是相对于组成型表达的基因RPL39的基因表达水平。SG,小、绿色阶段的粒;LG,大、绿色阶段的粒;YG,黄色阶段的粒;RG,红色阶段的粒。用于本实验中的cDNA的代码是cDNA3-RNA FRT32-1、cDNAl-RNA FRT05-3、cDNAl-RNAFRT64-3 和 cDNA3-RNA T2308-2。图8.针对罗布斯塔FRT32、FRT05和FRT64以及阿拉比卡T2308,在不同的粒发育阶段,对UGPP、GMPP和PMM的定量表达分析。使用定量RT-PCR,在多种粒样品中测量每种基因的表达。RQ是相对于组成型表达的基因RPL39的基因表达水平。SG,小、绿色阶段的粒;LG,大、绿色阶段的粒;YG,黄色阶段的粒;RG,红色阶段的粒。用于本实验中的cDNA的代码是cDNA3-RNA FRT32-1、cDNAl-RNA FRT05-3、cDNAl-RNA FRT64-3 和 cDNA3_RNA T2308-2。图9.对中果咖啡(罗布斯塔,FRT32)和小果咖啡(阿拉比卡,T2308)中UGEUUGE5、UGPP、GMPP和PMM的定量表达分析。如方法中所描述的,使用TaqMan特异性探针通过定量RT-PCR测定每个基因的表达。每种组织样品的RQ值是通过将测试基因的转录本水平对分析的每种样品中普遍表达的rpl39基因的转录水平归一化来测定的。数据代表从每种样品的三次扩增反应获得的平均值,误差条表示SD。G,粒;P,果皮;SG,小、绿色阶段的粒;LG,大、绿色阶段的粒;YG,黄色阶段的粒;RG,红色阶段的粒。用于本实验中的cDNA的代码是cDNA3-RNA FRT32-1、cDNAl-RNA FRT05-3、cDNAl-RNA FRT64-3 和 cDNA3_RNA T2308-2。
对阐述性实施方式的详细描述定义关于本发明的生物分子和其它方面的多种术语在说明书和权利要求中通篇使用。除非在本文中对其另有特定定义,术语被认定为具有它们在分子生物学和生物化学领域中的惯常含义。“经分离的”表示“通过人手”从天然状态改变的。如果组合物或物质是自然界存在的,如果其被改变或将其从原本的环境中移出或者两者兼有,那么其是已“经分离的”。例如,天然存在于活的植物或动物中的多核苷酸或多肽不是“经分离的”,但是与其天然状态共存的材料分开的相同的多核苷酸或多肽则是“经分离的”,如该术语在本文中使用的那样。 “多核苷酸”又被称为“核酸分子”,其通常指任何多聚核糖核苷酸或多聚脱氧核糖 核苷酸,其可以是未经修饰的RNA或DNA或经修饰的RNA或DNA。“多核苷酸”包括但不限于单链和双链DNA,为单链和双链区域的混合物的DNA,单链和双链RNA,以及为单链和双链区域的混合物的RNA,包含DNA和RNA的杂交分子,其可以是单链的,或者更一般地,是双链的,或是单链和双链区域的混合物。此外,“多核苷酸”指包含RNA或DNA或RNA和DNA两者的三链区域。术语多核苷酸还包括含有一个或多个经修饰的碱基的DNA或RNA或具有为了稳定性或为了其它原因经修饰的骨架的DNA或RNA。“经修饰的”碱基包括例如,三苯甲基化的碱基和不常见的碱基(例如肌苷)。可对DNA和RNA进行多种修饰;因此,“多核苷酸”包括如在自然界中一般地发现的多核苷酸的以化学、酶促或代谢地修饰的形式,以及病毒和细胞特征性的DNA和RNA的化学形式。“多核苷酸”还包括相对短的多核苷酸,其通常被称为寡核苷酸。“多肽”指包含通过肽键或经修饰的肽键互相连的两个或多个氨基酸(即,肽等构物)的任何肽或蛋白。“多肽”指通常被称为肽、寡肽或寡聚物的短链和通常被称为蛋白的较长的链两者。多肽可含有除了 20种基因编码的氨基酸之外的氨基酸。“多肽”包括由天然过程(例如翻译后加工)或由本领域公知的化学修饰技术修饰的氨基酸序列。此类修饰被很好地描述于基础教科书和更为详细的专著中,以及长篇研究文献中。修饰可在多肽中的任何地方发生,包括肽骨架、氨基酸侧链和氨基或羧基末端。应当知道,在给定多肽的若干位点可以以相同或不同的程度存在相同类型的修饰。此外,给定的多肽可含有很多类型的修饰。多肽可由于泛素化的结果而支化,并且它们可以是环形的,可以有或没有支化。环形的、支化的和支化环形的多肽可产生自天然翻译后过程或可通过合成方法来制造。修饰包括乙酰化、酰化、ADP-核糖基化、酰胺化、黄素的共价连结、血红素部分的共价连结、核苷酸或核苷酸衍生物的共价连结、脂类或脂类衍生物的共价连结、磷脂酰肌醇的共价连结、交联、环化、二硫键形成、脱甲基化、共价交联的形成、胱氨酸的形成、焦谷氨酸的形成、甲酰化、Y-羧化、糖基化、GPI锚形成、羟基化、碘化、甲基化、豆蘧酰化、氧化、蛋白水解加工、磷酸化、异戍烯化、外消旋化、硒化(selenoylation)、硫酸化、转运RNA介导向蛋白添加氨基酸(例如精氨酸化)和泛素化。见例如 Proteins-Structure and Molecular Properties,第 2 版,T. E. Creighton, ff. H. Freeman and Company, New York, 1993 和 Wold, F.,于Posttranslational Covalent Modification of Proteins, B.C. Johnson,编,AcademicPress, New York, 1983 中第 1-12 页;Seifter 等,1990, Meth Enzymol 182,626-646 和Rattan 等,1992,Ann NY Acad Sci 663,48_62。“变体”作为在本文中使用的术语是分别与参照多核苷酸或多肽不同但保留了基本性质的多核苷酸或多肽。多核苷酸的典型变体在核苷酸序列上与另外的参照多核苷酸有所不同。变体的核苷酸序列中的变化可改变或不改变由参照多核苷酸编码的多肽的氨基酸序列。如下文所讨论的,核苷酸变化可导致由参照序列编码的多肽的氨基酸替换、添加、缺失、融合和截短。多肽的典型变体在氨基酸序列上与另外的参照多肽有所不同。通常,不同是有限的,使得参照多肽和变体总体上密切相似,在很多区域是相同的。变体和参照多肽可由于任意组合的一处或多处替换、添加或缺失而在氨基酸序列上有所不同。替换或插入的氨基酸残基可以是或者可以不是遗传密码编码的氨基酸残基。多核苷酸或多肽的变体可以是天然存在的,例如等位基因变体,或者其可以是并非已知为天然存在的变体。可通过诱变技术或通过直接合成来制造非天然存在的多核苷酸和多肽变体。“抗体”在本文中使用时包括多克隆和单克隆抗体,嵌合、单链和人源化抗体,以及抗体片段(例如Fab、Fab’、F(ab’)2和Fv),包括Fab或其它免疫球蛋白表达文库的产物。关于抗体,术语“免疫学特异性的”或“特异性的”指与目标蛋白的一种或多种表位结合、但 并不实质上识别及结合含有抗原性生物分子的混合群体的样品中的其它分子的抗体。用于测定抗体的结合特异性的筛选测定是本领域中公知并被常规实践的。关于此类测定的综合讨论,见 Harlow 等(编),Antibodies A Laboratory Manual ; Co Id Spring HarborLaboratory ;Cold Spring Harbor, NY(1988),第 6 章。关于单链核酸分子,术语“特异性杂交”指充分互补序列的两条单链核酸分子之间的联结以允许在本领域通常使用的预定条件下进行此类杂交(一些时候被称为“实质上互补的”)。特别地,该术语表示寡核苷酸与单链DNA或RNA分子内含有的实质上互补的序列的杂交,其实质上排除寡核苷酸与非互补序列的单链核酸的杂交。“编码序列”或“编码区域”指具有当表达序列时产生基因产物(例如氨基酸或多肽)所必需的序列信息的核酸分子。编码序列可在被翻译的区域内包含非翻译序列(例如内含子或5’或3’非翻译区域),或者缺乏此类处于其间的非翻译序列(例如,像在cDNA中那样)。在某些公开的数据库(例如GenBank)中,有时候使用术语“CDS”。该上下文中的CDS是对应于被编码的蛋白中氨基酸序列的核苷酸序列。典型的CDS从ATG开始,并以终止密码子结束。术语CDS还可用于表示cDNA的完整编码序列。术语“编码序列”有时可与术语“开放阅读框”互换使用。“内含子”指核酸中不编码与蛋白合成相关的信息的多核苷酸序列。此类序列被转录为mRNA,但是在mRNA翻译成蛋白之前被移除。术语“有效连接”或“有效插入”表示,编码序列的表达所必需的调控序列被放在核酸分子中相对于编码序列适当的位置上,以使得编码序列能够表达。举例而言,当启动子能控制编码序列的转录或表达时,启动子与该编码序列有效连接。编码序列可以以正义或反义定向与启动子或调控序列有效连接。术语“有效连接的”有时候应用至表达载体中其它转录控制元件(例如增强子)的排列上。转录和翻译控制序列是DNA调控序列,例如启动子、增强子、聚腺苷化信号、终止子等等,它们提供编码序列在宿主细胞中的表达。术语“启动子”、“启动子区域”或“启动子序列”通常指基因的转录调控区域,其可被发现于编码区域的5’或3’侧,或在编码区域内,或在内含子内。一般地,启动子是在细胞中能结合RNA聚合酶并起始下游(3’方向)的编码序列转录的DNA调控区域。典型的5’启动子序列在其3’末端以转录起始位点为界限,并上游(5,方向)延伸,以包括在高于背景的可检测到的水平上起始转录所必需的最小数量的碱基或元件。在启动子序列内是转录起始位点(用核酸酶SI作图而方便地定义)以及负责RNA聚合酶的结合的蛋白结合结构域(共有序列)。“载体”是复制子,例如质粒、噬菌体、粘粒或病毒,另外的核酸片断可有效地插入其中,以引起所述片断的复制或表达。术语“核酸构建体”或“DNA构建体”有时用于表示与适当的调控序列有效连接并且插入载体中用于转化细胞的序列或编码序列。该术语可与术语“转化用DNA”或“转基因”互换。此类核酸构建体可含有针对感兴趣的基因产物的编码序列以及可选择标志物基因和
/或报告基因。
“标志物基因”或“可选择标志物基因”是下述基因,其编码的基因产物赋予使得能够从不合有该基因的细胞中选择出含有该基因的细胞的特征。用于遗传工程的载体一般地含有一种或多种可选择标志物基因。可选择标志物基因的类型包括(I)抗生素抗性基因,
(2)除草剂耐受性或抗性基因,和(3)代谢或营养缺陷型标志物基因,其使得经转化的细胞能合成否则细胞不能产生的必要组分,通常是氨基酸。“报告基因”也是标志物基因的类型。其一般地编码可通过标准实验室手段(例如酶活性、荧光)测定或检测的基因产物。术语“表达”、“表达的”或基因的“表达”指基因产物的生物合成。该过程涉及基因转录为mRNA以及然后mRNA翻译为一种或多种多肽,并且涵盖所有天然存在的翻译后修饰。“内源”指能够在指明的生物中天然发现的任何成分,例如基因或核酸,或多肽。核酸构建体的“异源”区域是在较大的分子内的核酸分子的可鉴定的片断(或多个片断),在自然界中未发现其与所述较大的分子相联结的。因此,当异源区域包含基因时,基因侧翼将通常有这样的DNA,所述DNA在源生物的基因组中不在基因组DNA的侧翼。在另一实例中,异源区域是下述构建体,其中,编码序列自身不是自然界中发现的(例如,其中基因组编码序列含有内含子的eDNA,或者具有与天然基因不同的密码子的合成序列)。等位基因变异或天然存在的突变事件并不产生如本文定义的DNA的异源区域。如上文定义,术语“DNA构建体”还用于表示异源区域,特别是构建来用于转化细胞的异源区域。当外源或异源DNA已被引入细胞中时,细胞已被此类外来或异源DNA“转化”或“转染”。转化用DNA可被或可不被整合(共价连接)进细胞的基因组。在原核生物、酵母和哺乳动物细胞中,例如,转化用DNA可被保持于游离元件(例如质粒)上。就真核细胞而言,经稳定转化的细胞是这样的细胞,其中,转化用细胞已被整合进染色体,使得其通过染色体复制被子代细胞遗传。该稳定性通过真核细胞建立由含有转化用DNA的细胞的子代细胞群体构成的细胞系或克隆的能力来展示。“克隆”是通过有丝分裂源于单个细胞或共同祖先的细胞群体。“细胞系”是能体外稳定生长很多世代的原代细胞的克隆。提到突变体植物时,术语“无效突变体”或“丢失功能的突变体”用于代指下述生物或基因组DNA序列,其具有导致基因产物无功能或很大程度上不存在的突变。此类突变可在基因的编码和/或调控区域中发生,并且可以是个体残基的变化,或者核酸区域的插入或缺失。这些突变还可在可调控或控制基因和/或被编码的蛋白的其它基因的编码和/或调控区域中发生,以使得蛋白无功能或很大程度上不存在。“粒(grain) ”、“种子”或“豆”指开花植物的繁殖单元,其能发育为另外的此类植物。在本文中使用时,尤其是关于咖啡植物使用 时,所述术语可同义且互换使用。“酶”是具有酶促活性的蛋白。“半乳甘露聚糖前体合成酶”和“半乳甘露聚糖前体合成基因”指涉及半乳甘露聚糖聚合物合成所需的前体分子的合成的蛋白或酶以及编码它们的基因。半乳甘露聚糖前体合成酶包括m)P-葡糖焦磷酸化酶(UGPP)、UDP-葡糖4-差向异构酶(UGE)、磷酸甘露糖变位酶(PMM)和GDP-甘露糖焦磷酸化酶(GMPP)。相似地,半乳甘露聚糖前体合成基因包括编码 UGPP、UGE、PMM 和 GMPP 的基因。在本文中使用时,术语“植物”包括提到整株植物、植物器官(例如叶、莖、枝、苗、根)、种子、花粉、植物细胞、植物细胞的细胞器、及其后代(包括可育后代)。在本发明的范围内,转基因植物的部分应当被理解为包含,例如,源自转基因植物或它们的后代的植物细胞、原生质体、组织、愈伤组织、胚胎以及花、茎、枝、种子、花粉、果实、叶或根。范围在本文中用于简述,以避免必须列出和描述范围内的每个和所有的值。如果适当的话,范围内的任何适当的值可被选择为范围的上端值(upper value)、下端值(lowervalue)或者终端(terminus)。在本文中使用时,词语的单数包括复数,反之亦然,除非上下文另有明确规定。因此,提到单数形式“a”,“an”以及“the”通常包括各术语的复数。例如,提到“酶”、“植物”或“方法”或“疾病”包括此类“酶”、“植物”或“方法”的复数。类似地,词语“包含”及其各种词性形式应当被解释为包括性的,而非排他性的。类似地,术语“包括”及其各种词性形式和“或”应当全部被解释为包括性的,除非此类解释明确被上下文所禁止。类似地,术语“实例”,特别地,当在术语列表后时,仅仅是示例性和阐述性的,并且不应当被认为是排他性的或穷举性的。术语“包含”旨在包括由术语“基本上由......构成”或“由......构成”所包括
的实施方式。类似地,术语“基本上由......构成”意欲包括由术语“由......构成”所
包括的实施方式。本文公开的方法和组合物和其它进展不限于特别的方法学、方案和试剂,因为如本领域技术人员将知道的,它们可有所变动。此外,本文使用的术语仅用于描述特别的实施方式的目的,它们不意欲也并不限制被公开的或被要求保护的范围。除非另有定义,本文使用的所有技术和科学术语、本领域的术语以及缩写具有发明领域或使用该术语的领域的普通技术人员通常理解的含义。虽然与本文所述的那些类似或等同的任何组合物、方法、制造产品或其它手段或材料也可用于实践本发明,但是本文描述了优选的组合物、方法、制造产品或其它手段或材料。本文引用或提到的所有专利、专利申请、公开文本、技术和/或学术文章以及其它参考文献都通过引用以其整体以法律允许的程度并入本文。关于这些参考文献的讨论仅旨在用于概括其中的主张。并不承认任何此类专利、专利申请、公开文本或参考文献或其任何部分相关、是素材或现有技术。特别保留挑战此类专利、专利申请、公开文本和其它参考文献作为相关、素材或现有技术的任何主张的精确性和针对性的权利。描沭:半乳甘露聚糖是在绿色咖啡粒中发现的重要的多糖的组。已知,该特别的咖啡聚合物难于溶解。因此,某些研究努力的目的是发现降低咖啡粒中半乳甘露聚糖的量,由此在较低的温度下获得经烘焙咖啡的较高的溶解度的途径。另一研究目的是改变咖啡粒中半乳甘露聚糖的溶解度,使得其更易在较低的温度下提取,甚至当其丰富存在时。在此之前,使用半乳糖基转移酶(GMGTase)、甘露聚糖合酶(ManS)和甘露聚糖酶,此类努力已关注于改变涉及半乳甘露聚糖合成和降解的酶的量或活性。此外,更多的全面努力被用于测定多种代谢途径之间的关系,其中使用小果咖啡作为案例研究,但是并没有特别关注半乳甘露聚糖途径(Joet 等,April 2009,New Phytol. 182 (I),146-162)。本发明部分源于发明人的下述见解还可通过改变底物或上游中间产物(即,甘露糖I-磷酸、⑶P-甘露糖、UDP-葡萄糖和UDP-半乳糖)对合成酶(GMGTase和ManS)的可获得性,来调节咖啡粒内半乳甘露聚糖的含量或结构。此外,发明人已知道,这可以通过 调节涉及形成这些前体的酶的量或活性,在生物水平上来完成,所述酶包括(I) UDP-葡糖焦磷酸化酶(UGPP),其催化葡萄糖-I-磷酸转化为UDP-葡萄糖;(2) UDP-葡糖4-差向异构酶(UGE),其催化UDP-葡萄糖转化为UDP-半乳糖;(3)磷酸甘露糖变位酶(PMM),其催化甘露糖-6-磷酸转化为甘露糖-I-磷酸;和(4) GDP-甘露糖焦磷酸化酶(GMPP),其催化甘露糖-I-磷酸转化为⑶P-甘露糖。如下文中详细描述的,发明人已分离了针对这些基因的中果咖啡cDNA,并且测定了它们在咖啡樱桃果(coffee cherries)发育期间和在若干其它咖啡组织中的表达。还提出了利用这些基因和它们编码的酶来调节半乳甘露聚糖前体合成的方法,其目标在于调节咖啡中的半乳甘露聚糖水平和或溶解度。多核苷酸和多肽本发明的一个方面以来自咖啡的、编码涉及半乳甘露聚糖前体合成的酶的核酸分子为特征。这些包括M)P-葡糖焦磷酸化酶(UGPP)、⑶P-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和m)P-葡糖4-差向异构酶(UGE),并且有时被合称为“半乳甘露聚糖前体合成酶”。编码来自中果咖啡的完整UGPP的cDNA在本文中示为SEQ ID NO :1,并被称为CcUGPP。编码来自中果咖啡的完整GMPP的cDNA在本文中示为SEQ ID NO :2,并被称为CcGMPP。编码来自中果咖啡的完整PMM的cDNA在本文中示为SEQ ID NO :3,并被称为CcPMM。编码来自中果咖啡的完整UGE的两种cDNA在本文中示为SEQ ID NO 4和SEQ IDNO :5,并分别被称为CcUGEl和CcUGE5。本发明的另一方面以通过这些核酸分子的表达生产的蛋白为特征。通过SEQ IDNO :1的翻译生产的CcUGPP蛋白的推定的氨基酸序列在本文中示为SEQ ID NO :6。通过SEQID NO :2的翻译生产的CcGMPP蛋白的推定的氨基酸序列在本文中示为SEQ ID NO :7。通过SEQ ID NO 3的翻译生产的CcPMM蛋白的推定的氨基酸序列在本文中示为SEQ ID NO
8。通过SEQ ID NO 4和SEQ ID NO 5的翻译生产的CcUGEl和CcUGE5蛋白的推定的氨基酸序列在本文中被分别示为SEQ ID NO 9和SEQ ID NO :10。虽然本文中示例了来自中果咖啡的半乳甘露聚糖前体合成多核苷酸和酶,就下文描述的目的而言,本发明旨在涵盖来自其它咖啡属物种的、足够相似以至于可与中果咖啡多核苷酸和蛋白互换使用的核酸和被编码的蛋白。因此,当在本文中提到半乳甘露聚糖前体合成酶“m)P-葡糖焦磷酸化酶”(“UGPP”)、“⑶P-甘露糖焦磷酸化酶”(“GMPP”)、“磷酸甘露糖变位酶”(“PMM”)和“m)P-葡糖4-差向异构酶”(“UGE”)时,这些术语旨在涵盖具有本文描述的一般性物理、生物化学和功能特征的所有咖啡属UGPP、GMPP、PMM和UGE,以及编码它们的多核苷酸,除非另有特别指明。考虑到其序列时,本发明的UGPP、GMPP、PMM和UGE多核苷酸包括可能在中果咖啡和小果咖啡的不同品种中发现的、SEQ ID NO :1-5的等位基因变体和天然突变体,以及可能在不同咖啡物种(包括但不限于小果咖啡)中发现的SEQ ID NO :1-5的变体、天然突变体和同源体。在特别的实施方式中,利用来自小果咖啡的变体、突变体和同源体。因为预期此类变体和同源体在核苷酸和氨基酸序列中具有某些差异,合适的半乳甘露聚糖前体合成多肽包括与SEQ ID NO :6-10的多肽分别具有至少大约80%、或81%、或82%、或83%、或84%、或 85%、或 86%、或 87%、或 88%、或 89%、或 90%、或 91 %、或 92%、或 93%、或 94%、或95 %、或96 %、或97 %、或98 %、或99 %的同一性的那些多肽。在不同咖啡品种和物种中,因为这些酶,以及编码它们的基因中,可能存在天然序列变异,本领域技术人员将预期发现该种水平的变异,而同时保持本发明的多肽和多核苷酸的独特性质。此类预期部分由于遗 传密码的简并性,以及由于保守氨基酸序列变异的已知进化成功,这不明显地改变被编码的蛋白的本质。中果咖啡半乳甘露聚糖前体酶可进一步通过具有非保守序列的蛋白区域而与来自其它物种的直向同源体区分开。针对CcUGPP、CcGMPP、CcPMM、CcUGEl和CcUGE5中每种的独特或非保守序列示于下文(单个残基如此示出;用两个残基之间的连字符标注两条或更多条序列的连续序列;例如,“ 1-8”表示包含性的、连续的残基I至8)。
权利要求
1.分离自咖啡属物种的核酸分子,其包含下述编码序列,所述编码序列编码选自m)P-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和M)P-葡糖4-差向异构酶(UGE)的半乳甘露聚糖前体合成酶。
2.权利要求I的核酸分子,其中所述半乳甘露聚糖前体合成酶包含下述氨基酸序列,当通过BLAST比较进行测定时,所述氨基酸序列与SEQ ID NO :6_10中任一的氨基酸序列在其整体上多于大约80%相同。
3.权利要求2的核酸分子,其中所述半乳甘露聚糖前体合成酶包含SEQID NO :6-10中的任一。
4.权利要求3的核酸分子,其包含SEQID NO :1_5中的任一。
5.权利要求I的核酸分子,其中所述编码序列包含基因的开放阅读框,或通过基因转录生产的mRNA分子,或通过对mRNA分子进行逆转录产生的cDNA分子。
6.包含权利要求I的核酸分子的编码序列的载体。
7.权利要求6的载体,其中所述核酸分子的编码序列与组成型启动子、或与可诱导启动子、或与组织特异性启动子有效连接,所述组织特异性启动子可以任选地是种子特异性启动子,其还可以任选地是咖啡种子特异性启动子。
8.从用权利要求7的载体转化的植物细胞生产的可育植物,其中所述植物任选地是咖啡植物。
9.调节从咖啡种子提取固体的可提取性的方法,所述方法包括调节咖啡种子内一种或多种半乳甘露聚糖前体合成酶的生产或活性,以导致咖啡种子中半乳甘露聚糖含量改变,其中所述半乳甘露聚糖前体合成酶是选自M)P-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和UDP-葡糖4-差向异构酶(UGE)的半乳甘露聚糖前体合成酶。
10.权利要求9的方法,包括增加所述咖啡种子内UGPP、GMPP,PMM或UGE中一种或多种的生产或活性。
11.权利要求10的方法,包括增加所述咖啡种子内编码UGPP、GMPP、PMM或UGE中一种或多种的基因的表达。
12.权利要求11的方法,包括向所述咖啡植物中引入编码UGPP、GMPP、PMM或UGE中一种或多种的一种或多种转基因,用于在所述种子内表达。
13.权利要求9的方法,包括降低所述咖啡种子内UGPP、GMPP,PMM或UGE中一种或多种的生产或活性。
14.权利要求13的方法,包括降低所述咖啡种子内编码UGPP、GMPP、PMM或UGE中一种或多种的基因的表达。
15.权利要求14的方法,包括向咖啡植物中引入用于在所述种子中表达的、编码UGPP、GMPP, PMM或UGE中一种或多种的翻译抑制剂的一种或多种多核苷酸。
全文摘要
本文公开了分离自咖啡(咖啡属物种)的核酸分子,所述核酸分子包含编码UDP-葡糖焦磷酸化酶(UGPP)、GDP-甘露糖焦磷酸化酶(GMPP)、磷酸甘露糖变位酶(PMM)和UDP-葡糖4-差向异构酶(UGE)的序列。本文还公开了使用这些多核苷酸对咖啡粒的含量和/或结构进行基因调控和操纵以影响提取特征和其它特性的方法。
文档编号C12N9/10GK102822334SQ201180013149
公开日2012年12月12日 申请日期2011年3月7日 优先权日2010年3月9日
发明者J·G·麦卡锡, M·N·C·勒佩莱 申请人:雀巢产品技术援助有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1