来自咖啡的脱水蛋白基因和启动子的制作方法

文档序号:432245阅读:427来源:国知局

专利名称::来自咖啡的脱水蛋白基因和启动子的制作方法来自咖啡的脱水蛋白基因和启动子发明领域本发明涉及农业生物
技术领域
。特别地,本发明表征了来自咖啡植物的编码脱水蛋白的多核苷酸、来自咖啡脱水蛋白基因的启动子序列,以及使用这些多核苷酸和启动子基因调节和操控咖啡豆的香味、香气(aroma)和其他特征的方法。发明背景在说明书全文中引用了多种出版物,包括专利、公开的申请和学术论文。这些出版物中的每一份在此以其全文引用作为参考。说明书中未完全阐明的引用可见于说明书的结尾处。咖啡的香气和香味是消费者对咖啡种类和品牌的偏爱的关键组成部分。咖啡的特征香气和香味来源于在豆的烘焙过程中发生的涉及香味前体的复杂的系列化学反应(美拉反应)。香味前体包括存在于绿咖啡豆中的化合物和生物分子。迄今为止,已鉴定了800多种促成咖啡的香味和香气的化学物质和生物分子。(Montavon等人,J.Agric.FoodChem.,51:2328-34(2003))。因为咖啡消费者变得越来越成熟,为了满足消费者的偏好希望产生具有改进的香气和香p未的咖啡。可以通过化学方法人工地将香气和香味都赋予咖啡产品。参见,例如,美国专利号4,072,761(香气)和美国专利号3,962,321(香味)。然而,迄今为止,关于天然的咖啡种粒(coffegrain)组分例如多糖、蛋白质和脂类对咖啡香气和香味的影响的数据资料非常少。一个方法是从现有种质中选择具有更优的香味特征的品种。该方法的不利方面通常是质量最高的品种也具有明显不利的农艺性状,例如低产量和对疾病和环境胁迫的低抵抗力。也可能从育种试验中选择新品种,在所述育种试验中,将具有不同工业和农业性状的品种杂交并就高质量和良好的农业表现两个方面篩选其后代。然而,该后一种方法非常费时,一个杂交实验和超过3个生长季节的选择花费最少7-8年时间。因此,提高咖啡质量味和香气的那些元件,以及添加在咖啡豆中非天然发生的香气和香味增强性元件。基因工程特别适合用于实现这些目的。例如,可交换来自不同咖啡物种的咖啡蛋白质。在可选择的方法中,可增加编码天然发生的对咖啡香味具有正贡献的咖啡蛋白质的基因表达。相反,可抑制编码天然发生的对咖啡香味具有负贡献的咖啡蛋白质的基因表达。现代技术的另一个应用是使用关于高质量与特定等位基因的相关性的分子信息,通过使用标记辅助育种就这类等位基因的存在或不存在筛选新品种。当以相同的方式烘焙和加工绿种粒样品时,来自不同品种和来源的咖啡展示了显著的香味和香气质量变化。质量差异是种粒样品内的化学和物理变化的表现,所述化学和物理学变化主要由生长和加工条件的差异,也由于母本植物和种粒的遗传背景的差异引起。在化学组成的水平上,至少部分香味质量与小代谢物(例如糖类、酸类、酚类化合物和咖啡因)的水平变化相关,所述小代谢物与来自不同品种的种粒相关。已接受的是存在其他未得到良好表征的香味分子和香味前体分子。此外,可能种粒内的结构变异也可能促成咖啡质量的差异。发现咖啡种粒中与咖啡质量相关联的新成分的一个方法是研究在种粒样品的成熟期间,在具有不同质量特征的不同品种中差异性表达的基因和蛋白质。已显示称为胚胎发育后期富集蛋白(LEA)的一类蛋白质在棉花种子发育后期以协作的方式累积(Dure,L,等人Biochemistry20:4162-4178(1981))。脱水蛋白(DHN)是也已被称为"LEAD-ll家族"或LEA2型蛋白质的LEA蛋白质的亚类(Close,T,Physiol.Plant97:795-803(1996);Ingram,J,Annu.Rev.PlantPhysiologyPlantMolBiol47:377-403(1996》。DHN蛋白质的表达与保护不同类型的植物细胞免受渗透胁迫相关,所述渗透胁迫例如为千燥、盐和低温导致的渗透胁迫(Skriver,K,等人.PlantCell2:503-512(19卯);Allagulova,CR,等人.Biochemistry-Moscow68:945-951(2003))。近年来,直接的实验证据已将脱水蛋白增加的表达与免受渗透胁迫的保护作用联系起来。例如,发现当经改造而过量表达脱水蛋白融合蛋白的拟南芥植物暴露于低温时,具有提高的存活率(Puhakainen,T,等人.PlantMolecularBiology54:743-753(2004))。类似地,已显示柑橘属脱水蛋白在转基因烟草中的表达产生了对低温增加的耐受性(Hara,M,等人.Planta217:290-298(2003))。脱水蛋白和对低温诱导的胁迫的耐受性相关的其他支持证据是在图镨上冷冻耐受性和抗寒性的QTL基因座与脱水蛋白非常接近的观察(CloseT,1996;Zhu,B,等人.MolecularandGeneralGenetics264:145-153(2000))。DHN基因也在接近成熟末期(该时期为当种子经历水含量随发育程序性减少的时期)的种子中强烈表达(Nylander,M,等人.PlantMolecularBiology45:263-279(2001);Choi,DW,等人.TheoreticalandAppliedGenetics100:1274-1278(2000))。据估计LEA/脱水蛋白包含高达4%的总种子蛋白质,并且被认为参与保护胚和/或其他种子组织免受与成熟种子的低水含量相关的渗透胁迫(RobertsJ,等人.PlantCell5:769-780(1993);Wise,M,等人TrendsPlantSci.9:13-17(2004))。广泛地认识到脱水蛋白与其他LEA蛋白质一起通过帮助种子组织适应成熟种子中发现的更低水含量来参与在种子成熟后期中发生的脱水过程(Close,Tm1996);NylanderM,2001)。此外,相信在种子休眠期间,在种子成熟期间合成的脱水蛋白也继续稳定相关的细胞结构。关于后一点,最近已提及脱水蛋白也可具有自由基清除能力(Hara,M,2003)和金属结合性质(Alsheikh,MK,等人.J.Biol,Chem.278:40882-40889(2003)),这都是在长期的种子贮藏期间可能有用的两个特征。已分离和研究了相当量的脱水蛋白,并且这些蛋白质籍以在体内发挥保护细胞免受渗透胁迫的作用的精确生理化学和/或结构机制正在研究中。脱水蛋白是极亲水的蛋白质并且展示显著低水平的可识别结构(CloseT,1996;Soulages,JL,等人.PlantPhysiology131:963-975(2003))。据认为脱水蛋白至关重要的元件为存在一个或多个称为"K基序"的富含赖氨酸的15个氨基酸的片段,经预测该片段形成A类两亲性a-螺旋(Close,T,1996;Close,TJPhysiol.Plant100:291-296(1997))。脱水蛋白也可包含两个其他基序,N末端"Y区段,,(共有序列V/TDE/QYGNP)和富含丝氨酸的"S区段",其中后者可被磷酸化并且被认为参与细胞核定位(CloseTJ,1997;GodoyJA,等人.PlantMol.Biol.1921-1934(1994》。已提出,脱水蛋白多肽的短两亲性K区段功能性地与经历部分变性的蛋白质的暴露于溶剂的疏水小块相互作用,从而阻断蛋白质聚集体形成(CloseT,1996)。两亲性K螺旋也可参与结合膜脂,从而可在保护脂蛋白、位于膜中的蛋白质和/或膜结构本身中起着更有效的作用(CloseT,1996;Koag,MC,等人PlantPhysiology131:309-316(2003))。关于脱水蛋白至少部分的保护效应的可选建议是这些非常稳定的但相对无结构的蛋白质紧密结合和组织水分子的能力(Soulages几,2003)。后一效应可减少水从细胞的丢失,并且也可提高某些大分子的稳定性,这是通过产生在这些分子周围更紧密结合的"有序的"水的基于脱水蛋白的区域。尽管脱水蛋白在植物中参与对渗透胁迫例如千旱和盐胁迫的抗性,以及脱水蛋白在种粒发育期间可能起着重要作用,但在咖啡中可获得的关于这些基因的信息极少。在咖啡中,关于脱水蛋白的数目、它们的蛋白质结构、它们在咖啡才直物的不同组织中和咖啡物种间以及在咖啡种粒和果皮成熟期间的表达水平和分布、以及它们的表达在分子水平上的调节都知之甚少。因此,存在对鉴定、分离和表征咖啡脱水蛋白、基因和基因调节元件的需要。这类信息将使得咖啡脱水蛋白能够被遗传操作,目的在于提高咖啡的香气和香味,以及赋予与改善的渗透胁迫抗性相关的其他表型优势。因为脱水蛋白在咖啡种粒中组织水分子,和在成熟脱水的种粒中稳定大分子和细胞器中所具有的潜在的重要作用,在种粒成熟末期相对高水平表达的脱水蛋白是非常引人注意的。据^人为至少部分该保护效应是由于脱水蛋白和其他LEA蛋白质稳定不同的水/蛋白质/脂类界面的能力。因为水的水平可影响美4立反应中形成的产物镨(Turner,J,等人J.Agric.FoodChem50:5400-5404(2002)),所以咖啡种粒中的水分子的可获得性和组织状态可影响在咖啡的烘焙过程中发生的产生香味的美拉反应。发明概述本文描述的本发明表征了来自咖啡植物的编码脱水蛋白的多核苷酸、它们编码的多肽、来自咖啡脱水蛋白基因的启动子序列,以及使用这些多核苷酸、多肽和启动子调节基因和操控咖啡豆的香味、香气和其他特性的方法。本发明的一个方面表征了从咖啡属物种(Coffeaspp.)分离的核酸分子,该核酸分子具有编码脱水蛋白或胚胎发育后期富集蛋白(LEA)的编码序列。在某些实施方案中,编码的脱水蛋白具有大约17kDa至26kDa的分子量。在某些实施方案中,编码的脱水蛋白或LEA蛋白质具有与SEQIDNO:7-12中的任一个有46%或更高同一性的氨基酸序列。在一些实施方案中,编码序列与SEQIDNO:1-6中所示的编码序列中的任一个具有45%或更高的同一性。在某些实施方案中,核酸分子是具有包含编码序列的可读框的基因。可选地,其可包含通过该基因转录产生的mRNA分子,或通过该mRNA分子的反转录产生的cDNA分子。本发明也表征了长度为8至100个^的寡核苷酸,该寡核苷酸与上述核酸分子的区段互补。本发明的另一个方面表征了包含上述编码脱水蛋白或LEA的核酸分子的栽体。在某些实施方案中,载体是选自质粒、噬菌粒、粘粒、杆状病毒、杆状病毒穿梭载体、细菌、酵母和病毒载体的表达载体。在某些实施方案中,载体包含有效连接至组成型启动子的核酸分子的编码序列。在其他实施方案中,编码序列有效连接至诱导型启动子。在其他实施方案中,核酸分子的编码序列有效地连接至组织特异性启动子,例如种子特异性启动子,优选咖啡种子特异性启动子。在特定的实施方案中,种子特异性启动子是咖啡脱水蛋白基因启动子,例如SEQIDNO:13中包含的启动子。本发明的另一个方面提供了使用上述载体转化的宿主细胞。宿主细胞可以是植物、细菌、真菌、昆虫或哺乳动物细胞。在某些实施方案中,宿主细胞是选自咖啡、烟草、拟南芥、玉米、小麦、稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、三叶草、油菜、红花、向日葵、花生、可可、蕃茄、粘果酸浆(tomatillc))、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆、紫菀、秋海棠、菊花、飞燕草、百日草和草畔草中的任一种的植物细胞。本发明也表征了通过再生转化的植物细胞产生的能育转基因植物。在特定的实施方案中,能育转基因植物是咖啡属物种。本发明的另一个方面表征了调节咖啡豆的香味或香气的方法。所述方法包括调节咖啡种子内的一种或多种脱水蛋白或LEA蛋白质的产量。在一些实施方案中,所述方法包括例如通过增加咖啡种子内的一种或多种编码内源性脱水蛋白或LEA蛋白质的基因的表达,或通过将编码脱水蛋白或LEA蛋白质的转基因引入植物来增加一种或多种脱水蛋白或LEA蛋白质的产量。在其他实施方案中,所述方法包括例如通过将抑制一种或多种编码脱水蛋白或LEA蛋白质的基因表达的核酸分子引入咖啡,来减少一种或多种脱水蛋白或LEA蛋白质的产量。本发明的另一个方面表征了在植物中增加对渗透胁迫的抗性的方法。该方法包括例如通过将编码脱水蛋白或LEA蛋白质的转基因引入植物,来增加植物中一种或多种脱水蛋白或LEA蛋白质的产量。本发明的另一个方面提供了从编码脱水蛋白的咖啡植物基因分离的启动子。在某些实施方案中,编码脱水蛋白的咖啡基因编码具有一种或多种上述特征的脱水蛋白。在某些实施方案中,所述启动子包含选自TATA盒、脱落酸应答元件、用于调节leguminin类型蛋白质表达的leguminin盒的RY重复(CATGCA(T/a)(A/g)、至少一种脱水应答元件/C重得顺式作用序列基序(G/ACCGAC)和至少一个E盒基序(CANNTG)的一个或多个调节序列。在特定的实施方案中,所述启动子包含SEQIDNO:13。本发明也表征了包含有效连接至一种或多种编码序列的编码咖啡脱水蛋白的基因的启动子的嵌合基因。本发明也提供了用于转化细胞、包含所述嵌合基因的载体和用该载体转化的细胞以及通过再生用该栽体转化的植物细胞产生的能育转基因植物。根据下列的附图、详细描述和实施例理解本发明的其他特征和有利方面。附图概述图1.中果咖啡(a,#Mc朋印^m)Y3SK2类型脱水蛋白与几种近缘植物同系物的最佳比对。使用MegAlign软件(DNASTAR)中的ClustalW程序产生该比对,然后通过手工进行进一步最优化。加框标示相同氨基酸。用实体条为Y区段划界,单一深色矩形为S区段划界,以及虚线矩形为K区段划界。黑色圆表示CcDH2a和CcDH2b之间不同的M酸。登录号番^S(Z^o/^wcwieyc"/^i似附)脱水蛋白TAS14(AAC49618)(SEQIDNO:14);5Wtf""附"w附er^",7脱水蛋白Dhnl(CAA75798)(SEQIDNO:15);拟南芥(爿r"^Vifo/7^s幼fl/,Vwm)脱水蛋白RAB18(NP—201441)(SEQIDNO:16)。图2.中果咖啡SK3型脱水蛋白与几种近缘植物同系物的最佳比对。如图l中所述产生该比对。加框标示相同氨基酸。单一深色矩形为S区段划界,以及虛线矩形为K区段划界。登录号烟草(7V,'cWflw"to6CM/w)脱水蛋白(BAD13499)(SEQIDNO:17);马铃薯(^/"""附似6mw"附)脱水蛋白同系物CI7(T07779)(SEQIDNO:18);拟南芥脱水蛋白(CAA62449)(SEQIDNO:19)。图3.中果咖啡胚胎发育后期富集蛋白CcLEAl与几种近缘植物同系物的最佳比对。如图l中所述产生比对。加框标示相同氨基酸。用星号标示保守的半胱氨酸,用圆标示两个较不保守的半胱氨酸的位置。登录号拟南芥胚胎发育后期富集相关蛋白(NP一200248)(SEQIDNO:20)、白云杉(尸z'"flg/""c")胚胎发育后期富集蛋白EMB7(T09288)(SEQIDNO:21)、玉米(Ze"zmi")根冠蛋白质2(BAA75477)(SEQIDNO:22)。图4.小果咖啡(Coj^fl和中果咖啡的不同器官中咖啡脱水蛋白和CcLEAl转录物的RT-PCR表达分析。lOObp表示lOObp的分子量标准参照梯;SG、LG、YG、RG分别表示表示种粒和果皮的小绿、大绿、黄绿色和红色;R、S、L、F表示根、茎、叶和花。图5.中果咖啡和小果咖啡的不同器官中CcDH2的定量RT-PCR表达分析。GSG、GLG、GYG、GRG分别表示小绿种粒、大绿种粒、黄色种粒和红色种粒;PSG、PLG、PYG、PRG分别表示小绿果皮、大绿果皮、黄色果皮和红色果皮;R、S、L、F表示根、茎、叶和花。在各反应的图表中报导标准偏差。图6.CcDH2脱水蛋白的Southern印迹分析。放射自显影图暴光3天。图7.来自中果咖啡的CcDH2a启动子和转录序列的DNA序列。显示了pVCl插入片段的核酸序列和对应的氨基^列。用圆标示cDNA中的第一个碱基(C)。用下划线标示假定的TATA盒。用双下划线标示RY重复序列,用框标示ABA应答元件,并用粗线给DRE/CRT序列加框。图8.所编码多肽的Kyte-Doolittle亲水性图。CcDHla(173个氨基酸,SEQIDNO:7);CcDHlb(176个氨基酸,SEQIDNO:8);CcDH2a(163个氨基酸,SEQIDNO:9);CcDH2b(163个氨基酸,SEQIDNO:10);CcDH3(228个氨基酸,SEQIDNO:ll);CcLEA1(358个氨基酸,SEQIDNO:12)。图9.对照和干旱胁迫植物叶中CcDHl表达的实时定量RT-PCR表达分析。植物1-3是定期浇水的对照植物;从实验开始("0")在整个6周期间不给植物4-6提供水。图10.对照和干旱胁迫植物叶中CcDH2表达的实时定量RT-PCR表达分析。植物1-3是定期浇水的对照植物;从实验开始("0")在整个6周中不给植物4-6提供水。例示性实施方案的详述定义与本发明的生物分子和其他方面相关的各种术语用于整篇说明书和权利要求。"分离的"是指通过人工方法从天然状态改变。如果组合物或物质在自然界中存在,如果已将其从其原始的环境中改变或移开或两者都发生,则其已被"分离"。如术语在本文所使用,例如,天然存在于活植物或动物中的多核苷酸或多肽不是"分离的",但从其天然状态的共存材料分离的相同多核苷酸或多肽是"分离的"。"多核苷酸",也称为"核酸分子",通常指可以是未被修饰的RNA或DNA或修饰的RNA或DNA的任何多核苷酸或多脱氧核糖核苷酸。"多核苷酸"包括但不限于单链和双链DNA,为单链和双链区混合的DNA、单链和双链RNA以及为单链和双链区的混合物的RNA、包含DNA和RNA的、可以是单链或更常见地为双链或单链和双链区混合的杂种分子。此外,"多核苷酸"是指包含RNA或DNA或RNA和DNA的三链区。术语多核苷酸也包括包含一个或多个经修饰的碱基的DNA或RNA,和具有为了稳定或其他原因而修饰的主链的DNA或RNA。"经修饰的"碱基包括,例如,三苯甲基化的碱基(tritylatedbase)和稀有碱基例如肌苷。可对DNA和RNA进行许多种修饰;因此,"多核苷酸"包括多核苷酸的化学、酶促或代谢修饰的形式(如通常在自然界中发现的形式),以及病毒和细胞的DNA和RNA特征的化学形式。"多核苷酸"也包括通常称为寡核苷酸的相对短的多核苷酸。"多肽"是指包含通过肽键或经修饰的肽键即肽电子等排体(peptideisostere)相互连接的两个或更多个氨基酸的任何肽或蛋白质。"多肽,,是指通常称作肽、寡肽或寡聚物的短链和通常称作蛋白质的更长的链。多肽可包含除了20个基因编码的氨基酸外的氨基酸。"多肽"包含通过天然方法例如翻译后加工或通过本领域内熟知的化学修饰技术修饰的氨基酸序列。这些修饰在基础教科书中和在更详细的专题著作以及大量的研究文献中进行了很好的描述。修饰可发生在多肽的任何位置,包括肽主链、氨基酸侧链,以及氨基或羧基末端。要认识到,相同类型的修饰可以以相同或不同的程度存在于给定多肽的几个位置。同样,给定的多肽可以包含许多类型的修饰。作为泛素化的结果,多肽可以是分支的,它们可以是环状的,具有或不具有分支。环状、分支和分支的环状多肽可以是由于天然的翻译后加工产生的或可以通过合成的方法产生。修饰包括乙酰化、酰化、ADP-核糖基化、酰胺化、黄素的共价附着、血红素部分的共价附着、核苷酸或核苷酸衍生物的共价附着、脂类或脂类衍生物的共价附着、磷脂酰肌醇的共价附着、交联、环化、二硫键形成、脱甲基作用、共价交联的形成、胱氨酸的形成、焦谷氨酸盐的形成、甲酰化、,g化、糖基化、糖基磷脂酰肌醇锚的形成(GPIanchorformation)、羟基化、碘化作用、甲基化、肉豆蔻酰化、氧化、蛋白酶解加工、磷酸化、异戊烯化、外消旋作用、硒酰基化、硫酸盐化作用、转运RNA介导的M酸对蛋白质的添加例如精氨酰基化和泛素化。参见,例如,Proteins-StructureandMolecularProperties,第2版,T.E.Creighton,W.H.FreemanandCompany,NewYork,1993和Wold,F"PosttranslationalProteinModifications:PerspectivesandProspects,第1-12页,在PosttranslationalCovalentModificationofProteins中,B.C.Johnson,编著,AcademicPress,NewYork,1983;Seifter等人,"AnalysisforProteinModificationsandNonproteinCofactors",MethEnzymol(1990)182:626-646和Rattan等人,"ProteinSynthesis:PosttranslationalModificationsandAging",AnnNYAcadSci(1992)663:48-62。作为在本文使用的术语"变体",是分别与参照多核苷酸或多肽不同但保持基本性质的多核苷酸或多肽。多核苷酸的典型变体在核苷酸序列中与另一种参照多核苷酸不同。变体的核苷酸序列中的变化可以或可以不改变由参照多核苷酸编码的多肽的氨基酸序列。核苷酸的改变可导致由参照序列编码的多肽中的氨基酸取代、添加、缺失、融合和截短,如下面所讨论的。多肽的典型变体在氨基酸序列上与另一种参照多肽不同。通常,差异是有限的从而参照多肽和变体的序列总体上非常相似,并且在许多区域是相同的。变体和参照多肽可以通过一个或多个取代、添加或缺失的任何组合在M酸序列上相异。取代或插入的氨基酸残基可以是或可以不是由遗传密码子编码的氨基酸。多核苷酸或多肽的变体可以是天然发生的,例如等位基因变体,或其可以是已知非天然发生的变体。可通过诱变技术或通过直接的合成产生多核苷酸和多肽的非天然发生的变体。关于突变植物,术语"无效突变体"或"功能丧失突变体"用于表示具有突变的生物或基因组DNA序列,所述突变佳」基因产物无功能或大大丧失功能。此类突变可发生在基因的编码区和/或调节区,并且可以是单个残基的改变或核酸区域的插入或缺失。这些突变也可以发生在可调节或调控基因和/或所编码蛋白质的其他基因编码区和/或调节区,从而使蛋白无功能或大大丧失其功能。术语"基本上相同的"是指核酸或M酸序列具有这样的序列变化,其实质上不影响蛋白质的性质(即蛋白质的结构、稳定性特征、底物特异性和/或生物活性)。特别地对于核酸序列,术语"基本上相同的"意指编码区和控制表达的保守序列,并且主要是指在所编码多肽中编码相同氨基酸的简并密码子或编码保守取代氨基酸的备选密码子。对于氨基酸序列,术语"基本上相同的"通常是指在结构或功能决定中不涉及的多肽区域中的保守取代和/或变异。本文中术语"同一性百分比"和"相似性百分比"也用在氨基酸和核酸序列间的比较中。当涉及氨基^列时,"同一性"或"同一性百分比,,是指通过序列分析程序,目的氨基酸序列中与被比较M酸序列中相同M酸相匹配的氨基酸的百分比。"相似性百分比"是指与相同或保守氨基酸匹配的目的氨基酸序列中的氨基酸的百分比。保守氨基酸是结构上不同但物理性质相似的氨基酸,这样彼此的交换将基本上不改变所得蛋白质的三级结构。在Taylor(1986,J.Theor.Biol.119:205)中定义了保守取代。当指核酸分子时,"同一性百分比"是指通过序列分析程序,目的核酸中与相同核苷酸匹配的核苷酸的百分比。"同一性"和"相似性"可容易地通过已知的方法计算。可使用计算机程序比较核酸序列和氨基酸序列,所述程序比对了核酸或氨基酸的类似序列并且因此确定了差异。在优选方法中,使用本文所用的BLAST程序(NCBI)和参数,并且使用DNAstar系统(Madison,WI)比对基因组DNA序列的序列片段。但是,可通过使用任何标准比对软件获得等同的比对和相似性/同一性评估。例如,也可4吏用从GeneticsComputerGroupinMadison,Wisconsin获得的GCGWisconsinPackage版本9.1和该程序使用的默认参数(空位产生罚分=12,空位延伸罚分=4)比较序列同一性和相似性。"抗体",如本文使用的,包括多克隆抗体和单克隆抗体、嵌合抗体、单链和人源化抗体以及抗体片段(例如,Fab、Fab'、F(ab,)2和Fv),包括Fab或其他免疫球蛋白表达文库的产物。关于抗体,术语"免疫学特异性"或"特异性"是指结合目的蛋白质的一个或多个表位但基本上不识别和结合样品中其他分子的抗体,所述样品包含混合的抗原性生物分子群。确定抗体的结合特异性的筛选测定法在本领域是熟知的并且得到常规使用。关于该测定法的全面讨论,参见Harlow等人(编著),ANTIBODIESALABORATORYMANUAL;ColdSpringHarborLaboratory;ColdSpringHarbor,NY(1988),第6章。术语"基本上纯的"是指包含按重量计算至少50-60%的目的化合物(例如,核酸、寡核苷酸、蛋白质等)的制品。更优选,制品包含按重量计算至少75%,和最优选按重量计算90-99%的目的化合物。通过适合用于目的化合物的方法(例如,色谱方法、琼脂糖或聚丙烯酰胺凝胶电泳法、HPLC分析法等)测量纯度。关于单链核酸分子,术语"特异性杂交"是指两个足够互补序列的单链核酸分子之间的締合,所述足够互补是允许在预先确定的、本领域中常用的条件下进行杂交(有时称为"基本上互补")。特别地,所述术语是指将寡核苷酸与单链DNA或RNA分子中包含的基本上互补的序列杂交,基本上排除寡核苷酸与非互补序列的单链核酸的杂交。"编码序列"或"编码区"是指核酸分子,所述核酸分子具有产生(当序列表达时)基因产物例如氨基酸或多肽所需的序列信息。编码序列可在翻译区内包含非翻译序列(例如,内含子或5'或3'非翻译区),或可缺少此类间插非翻译序列(例如,如在cDNA中)。"内含子"是指核酸中不编码与蛋白质合成相关的编码信息的多核苷酸序列。这些序列被转录成mRNA,但在mRNA翻译成蛋白质之前被除去。术语"有效连接的"或"有效插入的"是指在相对于编码序列的恰当位置将编码序列表达所必需的调节序列置于核酸分子中,以使编码序列能够表达。例如,当启动子能够调控编码序列的转录或表达时,启动子与该编码序列有效连接。可以以有义或反义方向将编码序列有效连接至启动子或调节序列。术语"有效连接"有时用于其他转录调节元件(例如,增强子)在表达载体中的排列。转录和翻译调控序列在宿主细胞中提供编码序列表达的DNA调节序列例如启动子、增强子、多腺苷酸化信号、终止子等。术语"启动子,,、"启动子区域"或"启动子序列"通常是指可在编码区的5'或3'侧,或编码区的内部或内含子的内部发现的基因转录调节区。通常,启动子是能够在细胞中结合RNA聚合酶并且起始下游(3'方向)编码序列转录的DNA调节区。典型的5'启动子序列在其3'末端连接转录起始位点和向上游(5'方向)延伸以包含最小数目的碱基或元件,所述碱基或元件对于以高于背景的可检测水平起始转录是必需的。转录起始位点(通过使用核酸酶Sl作图方便地确定)和负责RNA聚合酶结合的蛋白质结合结构域(共有序列)在启动子序列内。"载体"是复制子,例如可有效连接另一种核酸区段从而引起该区段复制或表达的质粒、噬菌体、粘粒或病毒。术语"核苷酸构建体"或"DNA构建体"有时用于指有效连接至适当调节序列并且被插入到用于转化细胞的载体中的编码序列。这一术语可与术语"转化DNA,,或"转基因"互换使用。这样的核酸构建体可包含目的基因产物的编码序列和选择标记基因和/或报道基因。"标记基因"或"选择标记基因,,是其编码的基因产物赋予了这样的特征的基因,所述特征能够使包含该基因的细胞从不包含该基因的细胞中选择出来。用于遗传工程的载体通常包含一种或多种选择标记基因。选择标记基因的类型包括(l)抗生素抗性基因,(2)除草剂耐受性或抗性基因,和(3)使转化细胞能够合成必需成分的带型或营养缺陷型标记基因,所述必需成分通常为氨基酸,且为细胞本来不能产生的。"报道基因"也是一类标记基因。其通常编码可通过标准实验室方法(例如,酶促活性、荧光)测定或检测的基因产物。基因的"表达"、"表达的"或"表达"术语是指基因产物的生物合成。该过程包括将基因转录成mRNA,然后将mRNA翻译成一种或多种多肽,并且包括所有天然发生的翻译后修饰。"内源性,,是指可在特定的生物中天然发现的任何要素例如基因或核酸或多肽。核酸构建体的"异源"区域是在更大的分子内核酸分子的可鉴定区段,所述区段在自然界中未发现与该更大的分子相关。因此,当异源区域包含基因时,所述基因通常位于DNA侧翼,所述DNA通常在来源生物基因组中不位于基因组DNA侧翼。在另一个实例中,异源区域是其中编码序列本身未在天然中^L^现(例如,其中基因组编码序列包含内含子或具有与天然基因不同的密码子的合成序列的cDNA)的构建体。等位基因变体或天然发生的突变事件不产生本文定义的DNA的异源区。术语"DNA构建体",如上面所定义的,也用于指异源区,特别是经构建用于细胞转化的异源区。当外源性或异源性DNA被引入细胞内时,则该细胞被该DNA"转化,,或"转染"。转化DNA可以被或可以不被整合(共价连接)入细胞的基因组。在例如原核细胞、酵母和哺乳动物细胞中,可将转化DNA保持在游离元件例如质粒上。关于真核细胞,稳定转化的细胞是其中转化DNA已整合入染色体内从而使其通过染色体复制由子细胞遗传的细胞。通过真核细胞建立细胞系或克隆的能力证明该稳定性,所述细胞系或克隆由包含转化DNA的子细胞群组成。"克隆,,是通过有丝分裂从单个细胞或共同祖先产生的细胞群。"细胞系"是能够在体外稳定地生长许多代的原代细胞的克隆。"种粒"、"种子"或"豆子"是指开花植物的生殖单位,其能够发育成另一此类植物。如本文所用的,特别是对于咖啡植物,所述术语可同义地使用和可互换使用。如本文所用的,术语"植物"包括全植物、植物器官(例如,叶、茎、枝条、根)、种子、花粉、植物细胞、植物细胞的细胞器和其后代。要理解本发明范围内的转基因植物的部分包括例如来源于转基因植物或其后代的植物细胞、原生质体、组织、愈伤组织、胚胎以及花、茎、种子、花粉、果实、叶子或#>。术语"渗透胁迫"是指对植物的任何胁迫,其破坏植物细胞或完整植物中的正常水分、糖或电解质浓度。渗透胁迫可以是与环境相关的,例如长期低水分或干燥、低温、霜冻、结水温度、土壤中的高盐含量等的条件。渗透胁迫也可天然发生,例如预计种子发育和成熟也会发生。描述本发明的一个方面表征了来自咖啡的核酸分子,所述核酸分子编码多种脱水蛋白和一种其他的LEA(胚胎发育后期富集)蛋白。从来自几个中果咖啡(罗巴斯;荅咖啡(robusta))cDNA文库的47,000多个表达序列标签(EST)的数据库鉴定编码脱水蛋白和LEA的核酸分子的代表性实例,所述cDNA文库是用RNA制备的,所述RNA是从嫩叶和从在发育不同阶段收获的浆果种粒和果皮组织分离的。鉴定重叠的EST并将其"串成"包含完全的编码序列的单基因(unigene,重叠群)。通过对NCBI(美国国家生物技术信息中心)无冗余蛋白质数据库进行各个序列的BLAST搜索来注释单基因序列。DNA序列分析显示代表3种不同脱水蛋白基因和一种LEA基因的5个独特的序列。这些cDNA本文称为CcDHla(SEQIDNO:l)、CcDHlb(SEQIDNO:2)、CcDH2a(SEQIDNO:3)、CcDH2b(SEQIDNO:4)和CcDH3(SEQIDNO:5)。发现CcDHla和CcDHlb彼此是等位基因变体,而发现两个不同的单基因编码CcDH2的可读框。此外,从分离自受精后30周的咖啡种粒的RNA构建的cDNA文库分析显示了编码咖啡LEA蛋白质的全长cDNA克隆。该cDNA在此称为CcLEAl(SEQIDNO:6)。推导的CcDHla-CcDH3的氨基酸序列在本文显示为SEQIDNO:7-11。所述蛋白质具有大约17.8kDa(CcDHla,SEQIDNO:7)、18.1kDa(CcDHlbSEQIDNO:8)、17.4kDa(CcDH2a和CcDH2b,SEQIDNO:9和IO)和21.5kDa(CcDH3,SEQIDNO:ll)的分子量。已发现这些蛋白质包含特征脱水蛋白氨基g序,并且根据这些基序对所述蛋白进行了分类。CcDHla、CcDHlb、和CcDH2(a和b)具有结构Y3SK2,并且CcDH3具有结构SK3。CcDHla和CcDHlb在所述三个基序的各基序中和两个K基序的各基序前的两个保守区中显示绝对的保守。相反地,CcDH2在所有Y、S和K基序(除了一个以外)中显示点差异(punctualdifference),并且在这些脱水蛋白特异性基序之外显示更显著的差异。亲水性图显示本文鉴定的所有咖啡脱水蛋白各部分都非常亲水(参见图8)。推导的由CcLEAl编码的氨基酸序列在本文显示为SEQIDNO:12。该蛋白质具有大约39.5kDa的分子量。该蛋白质的亲水性图显示该蛋白质亲水性比脱水蛋白分子低,并且存在2个小的疏水区,其中一个位于其第一个30个N末端残基内。也发现CcLEAl的N末端包含显著的富含脯氨酸的区段。本发明的另一个方面表征了调控脱水蛋白基因在咖啡中表达的启动子序列和相关元件。如在实施例中更详细描述的,通过PCR辅助引物步测法鉴定了来自CcDH2a的启动子序列(包含在SEQIDNO:13中)。显示CcDH2启动子包含一些调节元件,所述调节元件类似于之前在其他种类中表征的在种子发育期间参与调节基因表达的那些调节元件。这些CcDH2调节元件显示于图7中和描述于实施例中。通过使用连接至GUS报道基因的该启动子,已确定该启动子对于种子、长角果、子叶、下胚轴和发育幼苗的第一真叶是特异性的。此外,如实施例中所述,也已显示CcDHl和CcDH2基因的表达受到干旱胁迫和其他胁迫条件诱导。尽管本文描述和举例说明了来自中果咖啡的编码脱水蛋白和LEA蛋白质的多核苷酸,本发明旨在包括来自其他咖啡物种的核酸和所编码的蛋白质,所述核酸和编码的蛋白质与中果咖啡的多核苷酸和蛋白质充分相似从而可与其互换使用,以用于下文描述的目的。因此,当在本文使用术语"脱水蛋白"或"胚胎发育后期富集(LEA)蛋白"时,它们意在包括具有本文描述的一般物理、生物化学和功能特性的所有咖啡脱水蛋白或LEA蛋白质以及编码它们的多核苷酸。考虑到其序列方面,本发明的编码脱水蛋白和胚胎发育后期富集蛋白的多核苷酸包括可能在不同中果咖啡品种中发现的SEQIDNO:1-6的等位基因变体和天然突变体,和可能在不同的咖啡物种中发现的SEQIDNO:1-6的同系物。因为预期这类变体和同系物在核苷酸和氨基酸序列方面具有某些差异,本发明提供了分离的编码脱水蛋白或LEA蛋白质的核酸分子,所述核酸分子编码与SEQIDNO:7-12中的任一个具有至少大约40%、45%、50%或55%,优选至少大约60、65或70%,更优选至少大约71%、72%、73%、74%、75%、76%、77%.78%、79%或80%,甚至更优选81%、82%、83%、84%、85%、86%、87%、88%、89%和进一步更优选90%、91%、92%、93%、94%、95%,和最优选96%、97%、98%和99%或更高的同一性的各个多肽,并且包含具有与SEQIDNO:1-6中的任一个具有相同范围同一性的核苷酸序列。因为天然序列变异可能存在于不同咖啡品种和物种的脱水蛋白和LEA蛋白质以及编码它们的基因中,因此本领域技术人员预期发现该水平的变异,同时仍然保持本发明的多肽和多核苷酸的独特性质。这样的预期部分由于遗传密码子的简并性以及由于已知的保守氨基酸序列变异的成功进化而导致的,所述变异基本上不改变编码的蛋白质的性质。因此,认为这些变体和同系物基本上彼此相同并且包含在本发明的范围内。如所提到的,本发明人已证明某些脱水蛋白或LEA蛋白质基因的表达在咖啡中是种子、长角果和幼苗特异性的,并且可由干旱和其他形式的胁迫诱导。因此,与编码脱水蛋白和LEA蛋白质的基因相关的基因调节序列具有实际功用并且被认为在本发明的范围内。本文举例说明了中果咖啡DH2启动子。中果咖啡D好2基因组序列的上游区域在本文显示为SEQIDNO:13,并且包含部分或全部本发明的示例性启动子,尽管如在上文中所示的"启动子"的定义中所解释的,可在基因中的其他位置发现启动子的其他部分。然而,可通过下面描述的方法获得来自任何咖啡物种的脱水蛋白和LEA蛋白质基因的启动子和其他基因调节序列,并且根据本发明使用所述序列。除其他功用以外,可有利地使用控制脱水蛋白和LEA蛋白质基因表达的组织特异性和时间特异性的启动子和调节元件,来改变或修*饰多种咖啡物种的渗透胁迫耐受性。下列部分阐明了涉及实践本发明的一般方法。对于所提及的具体材料来说,只是为了举例说明,而不希望限定本发明。除非另外明确说明,使用一般的生物化学和分子生物学方法,例如Sambrook等人,MolecularCloning,ColdSpringHarborLaboratory(1989)或Ausubel等人(编著),CurrentProtocolsinMolecularBiology,JohnWiley&Sons(2005)中所示的方法。核酸分子、蛋白质和抗体可通过两种常用方法制备本发明的核酸分子,所述方法是(1)可从适当的核苷酸三磷酸合成它们,或(2)可从生物来源分离它们。两种方法都使用本领域内熟知的方案。核苷酸序列信息,例如具有SEQIDNO:1-6的cDNA或SEQIDNO:13的调节序列的信息,使得能够通过寡核苷酸合成制备本发明分离的核酸分子。可通过在AppliedBiosystems38ADNA合成仪或类似的设备中使用的亚磷酰胺法制备合成的寡核苷酸。按照本领域内已知的方法例如高效液相色谱(HPLC)纯化所得的构建体。由于目前的寡核苷酸合成方法中固有的大小限制的原因,长双链多核苷酸例如本发明的DNA分子必须分阶段合成。因此,可以以几个更小的具有合适的互补性的区段合成长双链分子。可将所产生的互补区段退火,这样各个区段具有用于附着相邻区段的适当的粘性末端。可通过在DNA连接酶存在的情况下将粘性末端退火来连接相邻的片段,从而构建完整的长双链分子。然后可将如此构建的合成DNA分子克隆入合适的载体并在该载体中扩增。根据本发明,可通过使用适当的严格性的杂交和洗涂条件来鉴定核酸,所述核酸与编码脱水蛋白或LEA蛋白质的多核苷酸的部分或所有编码和/或调节区有适当水平的序列同源性。本领域技术人员将认识到,当用于基因组序列时,上述方法除了使得能够分离编码脱水蛋白或LEA蛋白质的序列外,也使得能够分离与脱水蛋白或LEA蛋白质基因相关的启动子和其他基因调节序列,即使调节序列本身可以不共有足够的同源性来产生适当的杂交。此外,至少部分编码序列的注释使得本领域技术人员能够通过上游或下游基因组步测法确定其余编码序列,以及与目的脱7JC蛋白或LEA蛋白质相关的启动子或其他基因调节序列。本领域内建立了此类技术。(MishraRN等人,2002;RishiAS等人,2004)。作为典型的举例说明,可按照Sambrook等人的方法,使用杂交溶液进4亍杂交,所述杂交溶液包含5xSSC、5xDenhardt's试剂、1.0%SDS、100ng/ml变性的、片段化的鮭精DNA、0.05%焦磷酸钠和多至50%的甲酰胺。在37-42。C下进行杂交至少6小时。杂交后,如下洗涤滤器(1)在室温下在2xSSC和1%SDS中进行5分钟;(2)在室温下在2xSSC和0.1%SDS中进行15分钟;(3)在37。C下在2xSSC和0.1%SDS中进行30分钟到1小时;(4)在45-55。C下在2xSSC和0.1%SDS中进行2小时,每30分钟更换溶液。用于计算实现具有特定的序列同源性的核酸分子之间的杂交所需要的严格性条件的一个通式(Sambrook等人,1989):Tm=81.5+16.6Log[Na++0.41(%G+C)誦0.63(%曱酰胺)一600/双链体形式的弁bp作为上式的示例,使用[Na+=:针。然后使用"rediprimeTMIIrandomprimelabelingsystem,,试剂盒(Amersham)用[32P]dCTP标记该PCR产物。实施例5咖啡脱水蛋白cDNA的鉴定和表征从几个用RNA产生的咖啡文库产生47,000多个EST序列,所述RNA是从嫩叶和从不同的发育阶段收获的浆果的种粒和果皮组织分离的RNA。随后将重叠的EST"串成""单基因"(即,重叠群),然后通过对NCBI无冗余蛋白质数据库进行各个序列的BLAST搜索来注释单基因序列。使用多种方法就脱水蛋白序列篩选单基因,所述方法包括使用关键词"脱水蛋白,,搜索单基因注释,以及通过在咖啡单基因组的tBlastn搜索中使用多种拟南芥和蕃茄脱水蛋白序列搜索单基因注释。多种搜索方法产生几个候选脱水蛋白单基因,并且从文库分离这些单基因中每个的潜在最长cDNA克隆,然后对其进行完全测序(表2)。表2.编码脱水蛋白和LEA蛋白质的全长中果咖啡cDNA和针对各序列发现的EST的数目。在括号中给出了各质粒的单基因号和分子量cccl26i7(单基因121870;17.8kDa);cccs30w27m8(单基因121870;18.1kDa);cccs30w8a4(单基因123406;17.4kDa);cccs46w30pl(单基因123405;17.4kDa);cccwc22wlla5(单基因123385;25.1kDa);DavI-59(单基因119994;39.5kDa)。<table>tableseeoriginaldocumentpage41</column></row><table>所选择的全长cDNA克隆的DNA序列分析显示了4个代表3种不同的脱水蛋白基因的单一序列。对应的基因称为CcDHl、CcDH2和CcDH3。通过单基因#121870中的两个最长cDNA序列的测序来鉴定CcDHl基因的两个明显的等位基因序列。cDNA克隆CcDHla和CcDHlb的长度分别为836和896bp。两个ORP序列显示出5个单个碱基改变,并且CcDHlb具有9个碱基的插入。这些差异翻译成6个氨基酸差异。CcDHla和CcDHlb编码分别具有预测的大约17.8kDa和18.1kD的分子量的172个氨基酸和175个氨基酸的蛋白质。发现两个不同的单基因,#123406和#123405,其编码CcDH2的ORF。单基因#123405(CcDH2b)由2个EST组成并且与单基因序列#123406(CcDH2a)的不同在于内含子序列的存在。当对DH2b的cDNA(cccs46w30pl)的内含子/外显子边界进行更细致的检查时,观察到3'连接具有序列ttatgg/TCG,而通过基因组步测法(参见下面)获得的其他基因组序列具有序列ttatag/T(A)CGG。总之,cDNAcccs46w30pl的内含子序列和基因组DNA中的内含子序列几乎相同。因为在可获得的所有三个基因组内含子序列中没有出现单个碱基改变,所以CcDH2b的3'剪接位点序列的改变似乎可以是该cDNA的异常剪接的原因。756bpcDNApcccs30w8a4(CcDH2a)编码具有预测为17.4kDa分子量的长为162个氨基酸的蛋白质。发现了CcDH3(#123385)的一个单基因。由CcDH3编码的蛋白质序列表明该833bpcDNA编码具有预测的大约25.1kDa的分子量的227个氨基酸的蛋白质。将咖啡脱氷蛋白的蛋白质序列与无冗余蛋白质数据库中发现的最同源的蛋白质序列比对,也就脱水蛋白特异性氨基酸基序Y、S和K的存在对其进行分析。图l和2显示3个脱水蛋白分成两类,CcCDHla、CcDHlb和CcDH2a具有结构YsSK2而CcDH3具有结构SK3。在具有Y3SK2结构的那些蛋白质序列中,CcDHla和CcDHlb在三个基序的每一个基序中和两K基序的每一个基序之前的两个保守区域中显示绝对的保守性。该观察和存在的小序列差异发生在被比对序列的最少保守区中的事实与CcDHla和CcDHlb是等位基因的想法一致。相反地,CcDH2a明显与CcDHl不同。尽管CcDH2a具有结构Y3SK2,但其也在几乎所有Y、S和K基序中表现出点差异,并且在这些脱水蛋白特异性基序外表现出更明显的差异。CcDHl和CcDH2编码具有经计算接近中性的pl的蛋白质,并且它们的亲水性图表明这些蛋白质全部都是非常亲水的。由CcDH3编码的蛋白质的经计算pl为微酸性(5.47),并且如图8中的Kyte-Doolittle亲水性图所示该蛋白质也是非常亲水的。实施例6编码咖啡LEA蛋白质的cDNA的特征从来自受精后30周的咖啡种粒制备的RNA构建cDNA文库。从该文库分离编码LEA蛋白质的全长cDNA克隆(Davl-59)并对其进行测序。将该cDNA克隆重新命名为CcLEAl。此外,就注释为LEA蛋白质的"单基因,,搜寻EST数据库。该搜寻产生9个单基因序列,其中一个(单基因弁119994)对应于前面分离的CcLEAl的序列(表3)。EST分析表明CcLEAl只在种粒发育的一个时期(开花后30周)强烈而唯一地表达。表3.注释为LEA蛋白质的中果咖啡单基因序列<table>tableseeoriginaldocumentpage43</column></row><table>由CcLEAl编码的蛋白质是358个氨基酸,其具有预测的39.5kDa的分子量。CcLEAl的经计算的pl为微碱性(8.17),并且亲水性图显示尽管该蛋白质不具有显著的疏水区,但其不如三个咖啡脱水蛋白亲水。CcLEAl的前30个N末端残基在此蛋白质中形成了的2个小疏水区之一。图3显示CcLEAl与无冗余蛋白质数据库中发现的3个最同源序列的比对。这些比对的序列的总同一性值只在34.7%(对于拟南芥序列)至47.9%(对于云杉(白云杉)序列)的范围内变化。然而,在这些蛋白质中存在短的、高度保守的区域。所有相关蛋白质序列具有与CcLEAl相对相似的亲水性特征谱,并且一般地,可在N末端的1-25个氨基酸中发现蛋白质最显著的疏水斑。也发现CcLEAl在N端区包含富含脯氨酸的区段,该区段在图3中的其他蛋白质中不存在。实施例7在不同的咖啡组织中和咖啡种粒发育期间CcDHl、CcDH2、CcDH3和CcLEA-l基因的RT-PCR表达因为EST文库未进行归一化,并将其进行深度取样,因此各单基因中发现的EST数目给出了各取样组织中该基因表达水平的粗略估量。表2(上面)显示了CcDHl和CcDH2在受精后30和46周在种粒中强烈表达,但在果皮文库中未^皮检测到,且在受精后22周在整个浆果(发育的种粒+果皮)中也未被检测到。CcDHl和CcDH2均在叶中表达,尽管CcDHl可在嫩叶中以高于CcDH2的水平表达。在受精后46周的种粒中,以及在嫩叶中检测到CcDH3的表达,尽管在22周在整个浆果样品中也观察到2个EST。为了扩展表达数据,对3个咖啡脱水蛋白基因中的每一个基因进行RT-PCR分析。图4显示该分析的结果。CcDHl在小果咖啡种粒的所有检查阶段,以及罗巴斯塔咖啡的最后3个检查阶段中都显著表达,也可在其他受试组织中检测到CcDHl的表达,尽管对于小果咖啡在小绿色果皮和黄色果皮样品,或对于罗巴斯塔咖啡根或叶样品中没有检测到信号。在这些具有CcDHl表达的组织中,小果咖啡花样品似乎具有最高水平的转录物。在小果咖啡的所有种粒发育阶段和罗巴斯塔咖啡种粒的最后三个阶段检测到相对高水平的CcDH2转录物(图4)。与CcDHl相反,通过RT-PCR在其他研究的组织中未检测到CcDH2转录物。通过TaqMan定量RT-PCR确认在除了种粒的组织中不存在显著水平的CcDH2转录物以及该基因在罗巴斯塔咖啡中的晚期诱导(图5)。将CcDH2的表达与CcRPL39基因(RPL39编码核糖体大亚基蛋白质#39)的组成型表达转录物比较。所述比较显示CcDH2的表达在罗巴斯塔咖啡中逐渐增加,从大绿色阶段直至成熟的红色阶段。相反地,小果咖啡的定量RT-PCR数据显示在大绿色阶段检测到最高水平的CcDH2转录物并且转录物水平随着成熟进程发展有所降低。CcDH3基因表达的RT-PCR分析显示也在所有小果咖啡种粒样品中和罗巴斯塔咖啡种粒发育的最后3个阶段检测到这些转录物的显著水平(图4)。CcDH3转录物在一些其他组织例如红色果皮、茎和花中的水平和在种粒中的水平几乎一样高。原始数据的检查显示可在所有其他被检查的小果咖啡和罗巴斯塔咖啡的组织中检测到CcDH3转录物。然而,注意到罗巴斯塔咖啡和小果咖啡的前3个果皮阶段的转录物水平之间有显著差异。也通过RT-PCR估量CcLEAl的表达。获得的数据验证了该基因具有非常独特的表达模式,转录物只在小果咖啡的小绿色阶段和罗巴斯塔咖啡种粒的大绿色阶段检测到(图4)。在任何其他取样的小果咖啡或罗巴斯塔咖啡的组织中未检测到表达。该数据与表3中看到的该基因的EST的分布模式一致,这表明该基因在30WAF的罗巴斯塔咖啡种粒中表达,而不在任何其他种粒、浆果或叶的EST文库中表达。实施例8CcDH2启动子的序列分析CcDH2是适度表达的种粒特异性基因。进行Southern印迹法以确定表达水平是获自具有单/低拷贝数的基因还是获自多拷贝基因。如图6中所示,每次消化只产生一个条带,这表明CcDH2在中果咖啡基因组中可能由单基因编码。使用引物步测技术分离整合了CcDH2启动子的基因组片段。使用从cDNAcccs30w8a4的中心设计的CcDH2特异性基因组步测引物(DH2a引物l)和GenomeWalker试剂盒的API引物进行DNA的PCR扩增。产生和克隆位于cccs30w8a4cDNA序歹'J(中果咖啡)上游1.43kb处的2.1kb基因组片段。从包含基因组和cDNA序列的重叠质粒获得的复合序列的序列分析显示CcDH2基因包含位于ORF区内的单个内含子(231bp)(图7)。该基因启动子区域的进一步分析显示cDNA序列5'末端上游30bp处存在假定的TATA序列。也在CcDH2基因的5'上游区域中鉴定了几个前面显示的在种子发育期间参与基因表达调节的潜在调节元件。例如,发现与拟南芥ABS应答元件RYACGTGGYR(SEQIDNO:42)具有相似性的3个区域。发现与"豆球蛋白"盒中的核心区的RY重复(CATGCA(T/a)(A/g)共有显著相似性的两个元件,所述豆球蛋白盒参与调节豆球蛋白类型的贮存蛋白质的表达。也鉴定了两个脱水应答元件/C-重复(DRE/CRT)顺式作用序列基序(G/ACCGAC)的存在。以前已显示在拟南芥和稻中,DRE/CRT基序与DREB/CBF转录因子相互作用以控制所连接基因对脱水和其他胁迫的应答。(DubouzetJG,PlantJ.33:751-763(2003))。此外,在CcDH2的启动子区域鉴定了几个E盒基序(CANNTG),所述基序是贮存蛋白质例如2S蛋白质启动子中的良好确定的组件(ChatthaiM,PlantPhysiolBiochem42:417-423(2004))。实施例9拟南芥中咖啡脱水蛋白启动子CcDH2的功能分析检查在CcDH2启动子控制下的编码p-葡糖醛酸糖苷酶(GUS)的报道基因在拟南芥中的表达。#存和才法在提供商(Stratagene)描述的条件下使用聚合酶Pful和引物TG-ttgaagGttGTGGACATOACGGAAGAOGT(SEQIDNO,:43)和TG-TG743gcagatetaecatggAGGACTCCTGTTATTAGAAAA(SEQIDNO,:44)扩增来自pVCl的脱水蛋白DH2启动子序列。然后用HindIII和BglII切割这样获得的PCR片段,然后将该片段克隆入植物转化载体pCAMBIA1301的flindlll/Bglll位点。这将包含脱水蛋白启动子序列和完整的脱水蛋白cDNA5'非翻译区(大约80bp)的大约1.3kb的片段置于GUS的2bpATG(GUS的第一外显示子)内。通过测序验证启动子的正确定位。包含新脱水蛋白CcDH2启动子的载体称为pCAMBIA1301UCD2.4。植物转化。然后使用标准方法将转化载体pCAMBIA1301UCD2.4转化入根瘤农杆菌(Jgra6"cteW"w似附e/flrc/e")林系EHA105中。由2x35S启动子驱动的潮霉素抗性基因是pCAMBIA1301中的植物选择性标记。使用花器浸蘸法(floral-dipmethod)(Clough和Bent,1998)进行根瘤农杆菌介导的拟南芥转化(使用质粒pCAMBIAl301UCD2.4)。通过将种子种植在包含lmM硝酸钠和50ng/ml潮霉素的0.8%琼脂上来鉴定转化的植物。在种植后7天当植物具有延长的初生根时鉴定转化的幼苗。将幼苗转移至包含0.5xM&S盐的0.8%琼脂中。此后当第二对叶发育时,将植物转移至土壤中,让其生长成熟并结种子(T1)。在一些情况下,萌发T1种子,然后让其生长并结种子(T2)。GUS染色。GUS染色检测的幼苗和长角果来自T1或T2种子,并且处于不同的发育阶段。通过将5mgX-Gluc溶解在50jil二曱基曱酰胺中,然后将其加入50mMNaP04pH7.0(10ml)中来制备GUS染色溶液。使用精细镊,将幼苗从萌发板转移入装有1.0mlGUS染料的1.5ml微量离心管中。将该管转移至干燥器中并在真空下放置10分钟,然后在37。C(在黑暗中)下温育24或48小时。移去染料并用脱色液(70%乙醇)替代。通过将管置于37。C加速清洗。根据组织中色素的量,需要更换几次70。/。乙醇。在解剖显微镜下观察染色的幼苗和其他组织,并通过数字技术记录图像。在长角果的情况下,从植物中取出长角果,然后用解剖刀打开以允许染料渗入。改进方法中使用的GUS染料以包含0.5%TritonXIOO。在染色后,通过在乙醇:醋酸(2:1)中温育,然后在Hoyer,sLight培养基(60ml水中的100g水合氯醛)中温育来对长角果脱色。在乙醇醋酸溶液中预温育具有较幼嫩种子的长角果4小时,具有较老种子的长角果8小时。在Hoyer'sLight培养基中清洗长角果24小时至数天。结果观察用pCaml301UCD2-4转化的拟南芥中GUS的表达。发现GUS表达在子叶中和一周龄的幼苗下胚轴中是丰富的。在两周龄的幼苗中,GUS染色在前两片子叶中仍然丰富,在第一片真叶中水平较低。在根中或在第二对发育的叶中未明显地检测到GUS活性。在成熟的叶中没有检测到表达。在长角果荚(wall)中和发育的种子中也检测到GUS表达。Tl系种子的48小时GUS染色使得一些种子对于GUS活性为阳性而其他种子为阴性。总之,本实施例中提供的数据验证了咖啡脱水蛋白启动子CcDH2驱动所连接基因(在该情况下为GUS)强烈地在种子、长角果和正在萌发的种子的第一子叶和下胚轴中表达。该结果证明本文描述的CcDH2启动子序列包含在植物中驱动种子特异性基因表达所需的所有功能性元件。获得的数据也表明CcDH2启动子可用于驱动基因在未成熟組织例如来源于幼苗的头两片子叶的胚中表达。此外,该数据表明CcDH2启动子在其他组织中被激活,所述其他组织注定将经历干燥,例如长角果。最后,假定拟南芥和咖啡之间进化距离相对很大,本文提供的数据显示咖啡CcDH2启动子在拟南芥中起作用,这暗示着该启动子应当在相对广泛的植物中发挥作用。实施例10编码咖啡脱水蛋白CcDHl和CcDH2的基因的渗透胁迫诱导的表达已知脱水蛋白基因受到多种渗透胁迫形式的诱导。因此,进行评估以确定咖啡CcDHl和CcDH2基因是否由不同的渗透胁迫诱导。材料和方法使用小克隆繁殖的、生长在温室中的小果咖啡catimor树进行脱水实验。所述树为大约3年树龄并且在土壤中生长。在实验前几周,将树全部栽培在温室(大约25。C的温度、大约70%的相对湿度)中,使用自动灌溉每天给树浇水。在实验开始时,3株树用作对照,并每天用水浇灌。另外3林不浇水,从而经历渐进脱水。每一周对每一林树进行2片嫩叶(大小5-8cm,采自植物顶端刚冒出的生长物)取样,然后直接将样品冷冻在液氮中。RNA提取和cDNA合成。使用QiagenGmbH(Hilden,德国)的RNEASYPlantmini试剂盒对经历多种胁迫处理和对照的组织样品进行提取。开始时使用液氮冷冻将组织样品在研钵和研扦中研磨以获得粉末。然后按照RNEASYPlantmini试剂盒的方案提取该冷冻粉末中的RNA。简而言之,将最大100mg的冷冻粉末与细胞裂解緩冲液和p巯基乙醇混合。对于显示显著坏死的组织,也加入2fiMPMSF。为了消除低水平的污染性基因组DNA,使用(按照提供商所描述的)利用RNEASYPlantmini试剂盒中包含的不含RNA酶的DNA酶进行处理,即,室温下在柱子上进行15分钟处理。结束时,在50jiL不含RNA酶的水中从柱子中洗脱RNA。通过在260nm处的分光光度计测量确定RNA的量,并且通过计算260nm/280nm的吸光度比值估计RNA的质量。也通过在1%的琼脂糖凝胶上电泳检验RNA的质量。如下进行这些RNA样品的反转录反应将大约1jig总RNA和12.4nM寡聚-dT[2.3nl70jiM寡聚-dT(Proligo)和不含RNA酶的水一起加至13jiL的终体积。在65。C下温育该混合物5分钟。然后,加入7jiL5x緩冲液(TRANSCRIPTOR⑧RT反应緩冲液)、20URNA酶抑制剂、lmM的四种dNTP(各250nm)和10U的TRANSCRIPTOR反转录酶(Roche,Nutley,NJ)的混合物。在55。C下温育该混合物40分钟。最后,然后向20pL混合物中加入0.5nLRNA酶H(Invitrogen,Carlsbad,CA),然后将反应物在37。C下进一步温育30分钟。按照厂商提供的方案,使用Invitrogen(Carlsbad,CA)的SNAPTM凝胶纯化试剂盒纯化产生的cDNA。引物和MGB-探针的设计。使用PRIMEREXPRESS软件(AppliedBiosystems,FosterCity,CA)设计引物和MGB探针组。引物杂交的温度为大约60°C,而MGB探针的杂交温度接近70'C。扩增子的大小为大约80bp。通过PROLIGO合成引物,并且按照厂商说明书(AppliedBiosystems,FosterCity,CA)合成MGB探针。上面的表1中已表明了CcDH2和Ccrpl39的引物和探针的序歹(J。CcDHl的引物是5'CACTGGCACTACTGGAGCCTATG3'(SEQIDNO.:45)和5'GCTGGGTGGCGTATGCA3'。CcDHl的MGB探针是5,CTGGAGCACATGGGA3'(SEQIDNO.:46)。实时定量RT-PCR。如上所述制备用于这些实验的cDNA。按照厂商(AppliedBiosystems,Perkin-Elmer)所推荐的和上面所描述的进4亍TaqMan-PCR。简而言之,所有反应物为25jiL体积,并且包含5nlcDNA、1xTaqMan緩冲液(AppliedBiosystems)、5mMMgCl2、dATP、dCTP、dGTP和dUTP每种200fiM和0.625个单位的AmpliTaqGoldDNA聚合酶。AppliedBiosystems反应緩沖液包含AmpEraseUNG(尿嘧咬-N-糖苷酶)和Passive参照染料(ROXTM)以及最优化緩冲组分。使用800nM的基因特异性引物(正向和反向的)和200nMTaqMan探针以及5pL的100倍稀释cDNA(其对应于大约0.01jig的总RNA)进行PCR反应。将反应物在50。C下温育2分钟,然后在95。C下温育10分钟,接着进行40个扩增循环(95°C下进行15秒/6(TC下进行1分钟)。进行反应,并且使用GeneAmp7500序列检测系统(AppliedBiosystems)进行分析。对各样品进行3次反应,并且计算平均值。使用相对定量的方法进行定量,对于每个样品,使用核糖体蛋白质rpl39组成型表达的mRNA作为内参。为了使用相对定量的方法,需要表明使用特别定义的引物和探针组对不同受试基因序列的扩增效率基本上与参照序列(rp139cDNA序列)的扩增效率相当。为了确定这一相对等量,将包含适当cDNA序列的质粒DNA稀释至1/1000、1/10,000、1/100,000和1/1,000,000倍,并且使用上述的Q-PCR条件,计算各质粒/引物/TaqMan探针组的曲线Ct=f(LogDNA的量)的斜率。提供斜率接近3.32的曲线(代表100%的效率)的质粒/引物/TaqMan探针组被认为是可接受的。使用的质粒/引物/TaqMan探针组都给出了Ct=f(LogDNA的量)的可接受的值。通过测量GOS基因的基因组特异性引物/探针组的定量PCR扩增信号相对于GOS基因cDNA探针的信号的水平来确定cDNA制品中不存在任何显著水平的残留基因组DNA。絲图9显示当停止浇水(干旱条件)时,温室中生长的小树的叶中CcDHl基因表达的诱导。两周后,DH1的表达在一林水胁迫植物中(植物#4)中被显著诱导。三周后,CcDHl的表达在所有3林水胁迫植物(植物#4-6)中被诱导。诱导是非常显著的,对于植物糾达到超过50的RQ。考虑对照基因rpl39相对高的表达,50的RQ代表非常高水平的基因表达诱导,并且强烈地暗示CcDHl在咖啡叶的干旱应答中起着重要作用。图IO显示相同组的样品中CcDH2基因表达的诱导。CcDH2的诱导显示与CcDHl应答的一些差异。第一个差异是CcDH2的明显诱导晚于CcDHl,显然最受胁迫的植物(植物#4)在第3周显示诱导,比CcDHl晚一周。当在第4周时,CcDH2已在所有三株水胁迫植物中被诱导。CcDH2对CcDHl的诱导之间的第二个差异是CcDH2诱导的水平显著低于对于CcDHl所观察到的水平。总之,这些结果表明CcDHl和CcDH2不以完全相同的方式被诱导,尽管信号可能重叠,即CcDHl的诱导所需要的信号是CcDH2所需要的,但CcDH2可能需要只有当水胁迫增加时才出现的额外信号。植物#5和#6中的(CcDH2)表达随着水胁迫恶化(随着时间而不浇水)而持续增加,这支持了接近极端失水的条件诱导CcDH2的论点。可选地,CcDH2的表达可能比图10中显示的更显著,但该诱导局限在特定组织中。重要的是,要注意到定期浇水的3林对照植物没有显示出CcDHl或CcDH2的诱导(图9、10;植物#1-3)。上述结果表明与CcDHl和CcDH2关联的启动子可用于诱导和驱动基因在受到渗透胁迫的组织中表达。例如,这些启动子可用于驱动基因的表达,所述基因能够在精确的时期(当渗透胁迫发生时)提供一些保护以免受该渗透胁迫的伤害,但这在正常条件下并不在大多数组织中发生。根据上述工作也很明显的是,如果目标是在较低的水胁迫下诱导基因,那么可最佳地l吏用CcDHl的启动子,而对于在更高水胁迫下的基因诱导,当目的是只在相对高的水胁迫条件下诱导重组基因时,使用CcDH2更理想。为进一步检查不同渗透胁迫条件的影响,我们检查低温和提高的NaCl水平对CcDHl和CcDH2表达的影响。我们也已检测了与渗透胁迫信号转导相关的激素(脱落酸-ABA)的效应。对于这些实验,我们使用生长在固体培养基(培养皿平板中的固体培养基B0.3)上的体外咖啡微体扦插(microcutting)。对于使用低温和ABA的实验,我们在B0.3板上生成罗巴斯塔咖啡品种ThB4的微体扦插(16小时光周期)。当这些微体扦插足够大时,将它们转移至新的培养基/平板并在24。C下再温育7天(16小时光周期)。在T-O时,将一组平板转移至5。C下进行7天(16小时的光周期)。将另一组这些微体扦插置于具有ABA的培养基(培养基B0.3+100nMABA)上在24。C下进行7天(16小时的光周期)。将在T=0和T=7天(5。C和ABA)采集的样品在-8(TC下冷冻,然后提取RNA用于上述QRT-PCR分析。起始材料的T=0样品获得的表达结果表明CcDHl具有RQ=1.17。其他实验已显示在微体扦插中,CcDHl的基线水平可从RQ0.05至大约RQ1之间变化。该相对广泛的分布表明更高水平代表检测到用于本实验的起始材料中检测到的轻微渗透胁迫(可能与材料固定到固体培养基上的好坏和/或影响相对湿度的平板密封的好坏相关,以及与起始材料的准确年龄相关)。然而,保持在5。C下7天的样品显示没有CcDHl的诱导,事实上,CcDHl的水平通常降低至RQ=0.16,这一水平与在无胁迫的微体扦插中更经常看到的表达水平更接近。与上面所示的关于CcDHl的数据相反,在T=0未检测到CcDH2的表达。然而,在5。C下7天后,检测到CcDH2的RQ=0.022。后一观察显示冷冻条件可微量诱导CcDH2。要注意到,5°C对咖啡是非常低的温度,因此下述是可能的,即如果冷胁迫的温度稍微更高(8-15。C),那么CcDH2的诱导可更显著。最后,用100fimABA处理7天的孩吏体扦插显示CcDHl的表达显著增加(RQ,6.99)。后一结果表明ABA参与CcDHl诱导的信号转导。相反地,ABA不产生任何可检测的CcDH2表达,这表明单独的该激素不足以诱导CcDH2至任何可检测的程度。为了检测盐的影响,我们将250mMNaCl加入固体培养基B0.3。在T=0时,将一组来自罗巴斯塔咖啡FRT35的微体扦插置于B0.3培养基或具有250mMNaCl的B0.3培养基上,并且置于24°C(16小时的光周期)。在T=0和在第4和第7天时,采集样品并将其在-80。C下冷冻以待之后的上述QRT-PCR分析。获得的结果显示,在对照中,CcDHl的水平在开始时相当^f氐,并在整个实验中保持低水平(对照-1=0,RQ=0.2;T=4天,RQ=0.07;T=7天,RQ=0.38)。在受试处理中,CcDHl的水平在处理的第4天和第7天显著上升(250mMNaCl——T=4天,RQ=3.31;T=7天,RQ=4.46)。该实验显示提高盐浓度可诱导DHl表达至显著的水平,尽管不如在水胁迫下在植物的叶中看到的高。在250mMNaCl存在的情况下在,在T=4或T=7天的样品中都没有看到CcDH2表达的显著诱导。参考文献AgrawalN,DasaradhiPVN,MohmmedA,MalhotraP,BhatnagarRK,MukherjeeSK:RNAinterference:Biology,mechanism,andapplications.Microbiol.MolBiol.Rev.67:657-685(2003).Allagulova,CR,Gimalov,FR,Shakirova,FM,Vakhitov,VA:Theplantdehydrins:Structureandputativefunctions.Biochemistry-Moscow68:945-951(2003).Alsheikh,MK,Heyen,BJ,Randall,SK:IonbindingpropertiesofthedehydrinERD14aredependentuponphosphorylation.J.Biol.Chem.278:40882-40889(2003).BaumleinH,NIVRIDWU:Cis-analysisofaseedproteingenepromoter:theconservativeRYrepeatCATGCATGwithintheleguminboxisessentialfortissue-specificexpressionofalegumingene.PlantJ.2:233-239(1992).BrummelkampTR,BernardsR,AgamiR:AsystemforstableexpressionofshortinterferingRNAsinmammaliancells.Science296:550-553(2002).Cha他aiM,FBYDSIOLOMMS:2SstorageproteingeneofDouglas-fir:characterizationandactivityofpromoterintransgenictobaccoseeds.PlantPhysiolBiochem42:417-423(2004).Choi,DW,Close,TJ:Anewlyidentifiedbarleygene,Dhnl2encodingaYSK2DHN,islocatedonchromosome6Handhasembryo-specificexpression.TheoreticalandAppliedGenetics100:1274-1278(2000).Close,T:Dehydrins:emergenceofabiochemicalroleofafamilyofplantdehydrationproteins.Physiol.Plant97:795-803(1996).Close,TJ:Dehydrins:acommonalityintheresponseofplantstodehydrationandlowtemperature.Physiol.Plant100:291-296(1997).Clough,SJ和BentAF:Floraldip:asimplifiedmethodfor々/Y>6acteW/M-mediatedtransformationofJrflA/fito/w/s幼fl/Z做a.PlantJournal16;735-743(1998).Crouzillat,D,Lerceteau,E,Petiard,V,Morera,J,Rodriguez,H,Walker,D,Philips,WRR,Schnell,J,Osei,J,Fritz,P:2T^6尸o附aL:ageneticlinkagemapandquantitativetraitlocianalysis.Theor.Appl.Genet.93:205-214(1996).DubouzetJG,SYIYKMDEMSSMSKY-SK:OsDREBgenesinrice,OijzflsaftVflL.,encodetranscriptionactivatorsthatfunctionindrought-,high-salt-andcold-responsivegeneexpression.PlantJ.33:751-763(2003).Dure,L,Greenway,S,Galau,G:Biochemistry20:4162-4178(1981).Dure,L:StructuralmotifsinLEAproteinsofhigherplants.In:Close,T.J.,Bray,E,和A.(编著),ResponseofPlantstoCellularDehydrationDuringEnvironmentalStress,第91-103页.AmericanSocietyofPlantPhysiologists,Rockville,MD.(1993).ElbashirSM,HarborthJ,WeberK,TuschlT:AnalysisofgenefunctioninsomaticmammaliancellsusingsmallinterferingRNAs.Methods26:199-213(2002).Godoy,JA,Lunar,R,Torres-Schumann,S,Moreno,J,Rodrigo,M,Pintor-Toro,JA:Expression,tissuedistributionandsubcellularlocalizationofdehydrinTAS14insalt-stressedtomatoplants.PlantMol.Biol.1921-1934(1994).Hara,M,Terashima,S,Fukaya,T,Kuboi,T:Enhancementofcoldtoleranceandinhibitionoflipidperoxidationbycitrusdehydrinintransgenictobacco.Planta217:290-298(2003).Hara,M,Fujinaga,M,Kuboi,T:Radicalscavengingactivityandoxidativemodificationofcitrusdehydrin.PlantPhysiologyandBiochemistry42:657-662(2004).Iida,K,Seki,M,Sakurai,T,Satou,M,Akiyama,K,Toyoda,T,Konagaya,A,Sinozaki,K:Genome-wideanalysisofalternativepre-mRNAsplicinginArabidopsisthalianabasedonfull-lengthcDNAsequences.NucleicAcidsResearch32:5096-5103(2004).Ingram,J,Bartels,D:Themolecularbasisofdehydrationtoleranceinplants.Annu.Rev.PlantPhysiologyPlantMolBiol47:377-403(1996).Iwasaki,T,Yamaguchi誦Shinozaki,K,Shinozaki,K:Identificationofacis-regulatoryregionofageneinArabidopsisthalianawhoseintroductionbydehydrationismediatedbyabscisicacidandrequiresproteinsynthesis-MolecularandGeneralGenetics247:391-398(1995).KlahreU,CreteP,LeuenbergerAS,IglesiasVA,MeinsF:HighmolecularweightRNAsandsmallinterferingRNAsinducesystemicpost-transcriptionalgenesilencinginplants.Proc.Natl.Acad.Sci.USA99:11981-11986(2002).Koag,MC,Fenton,RD,Wilkens,S,Close,TJ:ThebindingofmaizeDHNltolipidvesicles.Gainofstructureandlipidspecificity.PlantPhysiology131:309-316(2003).MarracciniP"DeshayesA.,P6tiardV.andRogersW.J.1999.Molecularcloningofthecomplete11SseedstorageproteingeneofCoffeaarabicaandpromoteranalysisinthetransgenictobaccoplants.尸A戸'o/.肌oc/re附.37:273-282.MarracciniP,CourjaultC,CailletV,LausanneF,LePageB,RogersW,TessereauS和DeshayesA.2003.RubiscosmallsubunitofCoj5%<iara6/ca:cDNAsequence,genecloningandpromoteranalysisintransgenictobaccoplants.TV"",i^戸》/.5/oc/re附.41:17-25.Matsuyama,T,Yasumura,N,Funakoshi,M,Yamada,Y,Hashimoto,T:Maizegenesspecificallyexpressedintheoutermostcellsoftherootcap.PlantCellPhysiol.40:469-476(1999).MishraRN,Singla画PareekSL,NairS,SoporySK,ReddyMK:DirectionalgenomewalkingusingPCR.Biotechniques.33:830-834(2002).Moore,R,McClelen,C:UltrastructuralaspectsofcellulardifferentiationintherootcapofZeamays.Can.J.Bot.61:1566-1572(1983).Nylander,M,Svensson,J,Palva,ET,Welin,BV:Stress-inducedaccumulationandtissue-specificlocalizationofdehydrinsinArabidopsisthaliana.PlantMolecularBiology45:263-279(2001).Puhakainen,T,Hess,MW,Makela,P,Svensson,J,Heino,P,Palva,ET:OverexpressionofmultipledehydringenesenhancestolerancetofreezingstressinArabidopsis.PlantMolecularBiology54:743-753(2004).RishiAS,NelsonND,GoyalA:Genomewalkingoflargefragments:animprovedmethod.J.Biotechnol.111:9-15(2004).Roberts,J,DeSimone,N,Lingle,W,Dure,L:Cellularconcentrationsandunifomityofcell-typeaccumulationoftwoLEAproteinsincottonembryos-PlantCell5:769-780(1993).Rogers,WJ.,B6zard,G.,Deshayes,A"Meyer,I"P6tiard,V"Marraccini,P.(1999).BiochemicalandmolecularcharacterisationandexpressionofthellS画typestorageproteinfromCWj^aaraAZcaendosperm.尸/r戸W.J滅e附.37(4):261-272.ShirsatA,WNCRBD:Sequencesresponsibleforthetissuespecificpromoteractivityofapealegumingeneintobacco.MolecularandGeneralGenetics215:326-331(1989).Skriver,K,Mundy,J:Geneexpressioninresponsetoabscisicacidandosmoticstress.PlantCell2:503-512(1990).Soulages,JL,Kim,K,Arrese,EL,Walters,C,Cushman,JC:Conformationofagroup2lateembryogenesisabundantproteinfromsoybean.Evidenceofpoly(L-proline)-typeIIstructure.PlantPhysiology131:963-975(2003).Spanier,AM,Flores,M,Toldra,F,Aristoy,MC,Bett,KL,Bystricky,P,Bland,J:Meatflavor:contributionofproteinsandpeptidestotheflavorofbeef.Adv.Exp.Med.Biol.542:33-49(2004).Turner,J,Linforth,R,Taylor,A:Real-timemonitoringofthermalflavorgenerationinskimmilkpowderusingatmosphericpressurechemicalionizationmassspectrometry.J.Agric.FoodChem50:5400-5404(2002).TuschlT,BorkhardtA:SmallinterferingRNAs:Arevolutionarytoolfortheanalysisofgenefunctionandgenetherapy.Mol.Interventions.2:158-167(2002).Wise,M,Tunnacliffe,A:POPPthequestion:whatdoLEAproeinsdoTrendsPlantSci.9:13-17(2004).Zhu,B,Choi,DW,Fenton,R,Close,TJ:Expressionofthebarleydehydrinmultigenefamilyandthedevelopmentoffreezingtolerance.MolecularandGeneralGenetics264:145-153(2000).所述核酸和多肽的序列CcDHlacDNA(见SEQIDNO:l)和所编码的蛋白质(见SEQIDNO:7)<formula>formulaseeoriginaldocumentpage58</formula>CcDHlbcDNA(见SEQIDNO:2)和所编码的蛋白质(见SEQIDNO:8)非99fg腿3論gtcfctatcggtcte'fcgatccttcaecfcttcgfctastctgtgttctat耽t!60ctacttccgctagtagttgaaattt鹏caattaag逸tggegcaatac效gg汰li3MetAlaGinTyrGlyAla1Sgra改tatggcaaccaaaagageeagtaegatgagtaegga祖acccagtt151GluTyrGly紐nGinLysSerGinTyrAspOluTyrGlyAsftProVal101520cgtcagacagacgaatatggtaa<scctgeceg口catggaggtaec欲tg209ArgGinT&arAsjsGluTyrGlyAsaPfoAlaAr^gHiGlyGlyTte鹏t2S303Sggtgatt改tg.gaaceactggeaatactggagectatggtggcac.aactGlyAspTyxGlyThrThrGlyTteThrGlyAla.TysrGlyGlyThxTte4045SOgggacagetgga:gcacatgggacttatgcaactggaaecaeeggeact305GlyThrMaOlyMaHisGlyTteTyxAlaThrGlyTto:ThrGUyThr5560:6570aecggtaccggtgca.tatgeeacceageetggeactgatgtggggaagThrGlyThrGlyAlaTyrAlaThr8InProGlyIJhrAspValGlyLys7S80&S353gag&T3catHis90GlyGlyMet汰tLeu95catcg'cHisArgtctageSear雜fcGlyage401test绍cSexte9Set105teegag虹uAspg暨t卿110c改aGinGlyGlyIISLys443atgMetsag120S绍liegag.125333Pro卿GlyGly130caeHisgetAla7caa(31n13SccfcProgg改caaGin.t汰t1teg8ergetMa3Ct145getMa枕oGlyTyrggcISO545GluGagGin155Hisg叫GluISOlie&tggatAspa站sitelie165S93gagLati170gggGlyggt.c3cGlyHiscg.cteg絲c175S43703ttfcgtgtc匕tctgag欲tttgagtgtgtgggcgtcttgagttgattegtet:gtgg教ctctg823toggegtettg匕SLcr匕cgggtS83效鹏纖棚汰祖汰aa统giaaLaata汰aa教教教a^a343,SSCcDH2a(见SEQIDNO:3)和所编码的蛋白质(见SEQIDNO:9)Gtaaaattcigtdaadeceaagtctcaggct统cicttaatttGa,gtgecotttttc:t'tt玩tttttttetaataacsggagt。ctggaaaatggetgaettgc;gftgatgaatatgga的etAlaAspLettArgAspGluTyrGlySOa教tcet暨tgc改gttgacegaee.agtatggeaaeccggttcagetcaagA曰nProMet.GinteuThr&sg>GinTyr(SlyAsnPa:oValGinLeuLys10152025162gacgagtatggcs魏cecaatgeagcttageggtgtagetatesigcgeeAspGluTyarGlyAsnProMetGlaL暨uS欲GlyValAlalieThxAla303540210gggt逸eggotagtgetgtccattetactg讽stccsggaecaactgcstgeeGlyThrM_aSearAlaValHisSerTteGlyThrlyfco饰rAlaAla4550552S8setGlyaceThrSOe统gGinc汰aGillC3tHisGillg改gsscatgGillcttG统tHiseggtegtctSear70ageagetea細agetetggetegt.egtgasgatgatggac&逸ggaggaaga汰g汰教agaasSe;eS您rGlySetS您rGluAspAsjpGlyGinly3lyArgArgLysLye75808S354幼3SOGlys站■LysC3lu9Satliea的gagGlu驗s100acgdlygrggrGlyHis10S402站gAspArgAspgat110GingagGluHislieAspUSgatAspGinHisAlaC3CHis120甚gc450AlatctcctProccaiPro125Thar3Ct130gggtctSer■act13S3ca498GlyGin140GillestHisGlusagl在SageMetgtggagGlu1503tt工l6atgMetGlu54Setc;lieuProg界est.HisCMHisgacAspISOArg536tgatcatcgtgtaaaatctcteetgatgeetaggaaatctagattatgttaggca'ttttgSS6tttggtafegtatgtgtgsfctaagaeettgttgtgegcttgaatefetgasegtgcatggg统716tttgcttggtttg.atttgatttggtgaaataajgttgtaetaftasasetaaa.aaasaaaa774CcDH2bcDNA(见SEQIDNO:4)和所编码的蛋白质(见SEQIDNO:10)Gt欲aa改ttcgtcasccccaagtetc魏ggctacctta统tttcagtgccctttttctttatt€0£ttrttet;aataacagg孩gtcctgrgaaaatggetg孩ctfcgcgfcgafcgaatatgga:114MetAlaAspLeArg.AspGiwTyrGiy筏at10cc!.tatgMetGinace15鄉Gintat.20Prog.tt;01netcaag2S162gaegagt恩tggcsaeeeaatgea9c:tt:ageggtgt统get教tcac'cgeeAspCiluTyrGlyftsnProWstGinitsuSerGly"VaiAlalieTin:Ala303540210gggscggetagtgetgteeattctactggaaecggaccaactgefcgee<51ifT&rAlaSesrAlaVailHisSerTbrGly饰rGlyProTtoSlaAla45505S258actggs為cce狡gcastctttcsaggagcagcttcja.teggfcet逸gcageteaThar!3lyThxGinGinLeuGinGluGinleuHisAi:gSe.rSerSer8sr506570agetestggctoggtgag'atacttgceaagttaeaatgtgtgtgtctgfcgtgt:Se:r&er<31ys想r7Sg't教.taatgcgc:estcataatt^ttfcgettgaeagateetgtt筏staaigfaacegtaatttgacgfcaaagtgfcaeaogttlitgttfcttctgg辆cttaestaatat'egaateaggetcctg匕tgaat:ttgaatgttgttagetaaaag汰aaattttggtggGtgagttgttgasttfcggtttat的teggaggafcgafcggacaaggaggaagaagaaagaaaaaagggttgSerG'luAspAapGlyGinGiyGlyArgArgLysG!LyLeu80g汰eAspecuPro12SGinga效Asp110c為testHis呵lays95His3t9liegagGillsagliysga<3AspISOstagHisact貼gMSaccThrgag(5luatelieggc130ageLy曰gatAsp115的CSetCtSL雄gatAspgggGly8590atgMetValeaigGirtgagescHistctSexLysISOAla.3crtlieCSC!His120Ms105agegtcV改lMetg'aa絲ggeeg的G.yBagLysgacag'aSerFroggtcetgGlyGin譜etccctLeuPro1SStagttac比adeacaaeatactgt.gatGatcgtgtsa站t.etetectgatgcst3t贿讽絲tetaga比at沐ta的eattttgtttggfcatgtatgt;gtgattastgacicttfttgtgeg'cttgaatettg诚邻tgc;atgggatttgettgg'tttgaaiaaaaaaaastasaaaaaaaaaaaaaaaaaaaaaaeiaaa^aaaaiaasaaaasaa30S3S8418.S38S3S732780888細10081020CcDH3cDNA(见SEQIDNO:5)和所编码的蛋白质(见SEQIDNO:11)atfcttttgctgttfceetgttaeattotgetttaogtaeatc:.catGageaaaatggee57Me-1:Alagagtat;gate的agtaacatesaggttg效ggag'ggateagetgttc:gag105GluTyrAspGinSerAsnlieLysValGluOlyS暨KAlaValGlu510ISgeca:cggatogcggatetcttcaetcttg鹏cAlaThrAspArgGlyletiPheAsnLeuQly202Saagsasgagg絲gt:g貼gLyB.LysGluGluVal.LyB301S3eagtgtgatcaaggccaggccatetctgcg碎9fLy瞎CysA息pGirtGlyGinAlaIl经SerAlaOlu354045tttgatgagaaagtgPheA印GluLysval50cgfcgtt:tctgaacc汰gscaagg汰ggagggaaagaagcatggtggtcttArgValSearGluproAspLysGluGluGlyLysLysHisGlyGlyLeu5S6065etcgagaagfctecacc'gatctggtagesge]jetiGluLy曰LeuHisArgSerGlySerS珍r7075tecageagrciS培3TSertea的tgagSerSerGlti80243297gaagaagtagaagagggtggfcgagaagraagaagaaaaagaaggaaaagGluGluValGluGluGlyGlyGluLysLysLysLysLysLysGluLys8S3095345aagggtttgaaggacaagateaaggagaagatategggtgataagasgLysGly:LeuLysAspLyslieLysGluIyslieSerGly.AspLyslys100105110393gac:g'a3gaaaaggttgaaaaatgtgaggraagacacgtefcAspGluGluLysVa工GluLysCyssGluGluAspThrSrIIS1201.25ateccagtt工leProVal130441gagaaatatgccgaaecggeecatgcagatgetg'eteatGluiy曰TyrAlaGluProAlaHisMaA邻JUaAlaHis135140gaacca.gagGluProGlu145489gagaaaaagggrcfctc:ttagataagGluLydLysGlyPheLeuAspLys150ateaaggagsssetalieliys<31uIysLeu1SSccaggrtggtProGly<3lyISO537ggtcagaagaagactgagg汰agtcGlyGinLysLyeTlvrGluGluVal1S5170geagesgeagcjaecgec;t:ectcctAlsAlaMaMaProProProPro175ceggcagagtgrcacegcca'c:tgaaproAlaGluCysI"hrAlaThrGlu揚185ggtgaggeeaaggat幼gaagggaGlyGlu.AlaLysAspLys!LysGly190S33ttcttgsr统c改级gateaaiggagaagPlieAspL昨lieLy3GluLysUS200etcecrfcggctaceatcecaagacitteuProGlyTyrHisProLysThx205210gaagaagagaaggaaaaggagaagGluGluGluLysGluLysGluLys235gMaasg絲astggaggetggatgcGluLysGluLysGluMaGlyCys220225729eattaataaaagagc:aaagcstaa匕tSLatagGagett'tccagtgtgtdat逸attttgHi370Scatttgg教ttaatac.sttfctggagtggcaatgatctttttattttaaa833CcLEAlcDNA(见SEQIDNO:6)和所编码的蛋白质(见SEQIDNO:12)aagoagtggtaaca这egcagagt统cg.cggg祖cga统ceLte欲teggtace教gtttcetatfco60ataaateatcttactsgcaatgatgcastaa教為tgaetcctctg汪9逸仁3catcr112树珍tLy曰Me匕饰rProIi暨uArgGyslie1510这曰tPh珍3tttttctgl抑Alattt匕gggttProgetgt<3ct七cgcggtgL@uAl玩val25fttfiISOgeeAlas的Ly想Pro30Gt欲Ij柳gttValProt统cct这lieTCO逸幼CC"CProLy曰P2:0ProProccgProCG改ProtegLy每ProsogtaV改lCCC!Pro在tsIl逸cctgtcProVal55LyscccProate工leSOVal柳ArgtgctecseaThrttgtttproetclieu70tgcfctcsatAsnlie30475ttcgttValtgc:80gacAsptgtCysc;tfcLeuA慕打fcgtttagtggacXj冊ValAgptgtCys90352涯:rtgcaagLy曰getAla95tgcEL'grtSertgcs改crA隨100t匕tPheProggcgetGlyAlagtt105tgtCysGingat.Proc鹏11Dttc:gtt節ggatggcGlyGlyAgpGly115S改GASHThrttttac120ttcPileeatHisggeGly12Sg汰tAspcagGintopttctgactggttPheCysIi靴17a1teggatferAspacccttLeucatt■His痕gtaValaafc抓GlyEi錢跑e战ttliegg'osg这Glyljy曰ArgLY暨ecstaa.t:ttgogcProtontag肚3g筏eHspiss3L汰喻旭GingecAlalieggastg,ttfccg為egaecac;Pb暨為每pAspHis的atogattclie170etctenV後lgeeMagci这aa教统gg氣la^Ly曰fccg孩ctThrtd曰tggg為cgacaafcgtgTrpAspAsp助nv為l綱gatAsp寧Argetc:LeugotAlaUSgearattgatgg旌lie.H恩pGly躲fc,Pro135為fctlieGtCLeuCCC欲GtProThr2冊ga改ggatcoLy岛205顿c船GinlieucjogProAl盈2i0ccgFroS暨xa盈tll抑似Egt经tclieMet改gsArg73S3tc335Sear220a&cai逸t欲acAbAsnAsngec誠tgtgAlaAsnVal225gtggttgaagccgtgaaoai欲ttteSt節ValValOluMaVal.AsnAsaPh暨Arg230參Val240Proaitasc暨getII加rAlat.e改汰ga欲tc欲aasgtteatOliiGluS瞎rIiygV教lHis245250ggttatgac頃tt欲ctgatgaggattgctttacecatttggagcttgggGlyTyrAsplie■EhrAs'pGluAspCysPileTlWHi每L瞎UGlUL暨uGly2S5論窗ttcassttcttcaaeateaccigafcteaa.ctgstggsgttttgggacaaPh经LysPhePhA经nIl经ThrA瞎pSerTterAspGlyV"alLsuGlyIn27S280accfcataggragegattacgtgaacaaaatgaaggtg统atgcggt汰atgThxTyflxgSsrAspTysrValASftLy经Met;Ly曰\TalAanAlaValMet285綱295ecagteatgggcggtg&ccgts改gt汰Gttgacttegggsetfefcttag'tproValMetGlyGlyAsp&rgLysTyrLeu"SirSe:rG3LyLuPb暨Set30030S3107848805761024gc;c:gattgtg汰gtttetcgctttggtgggaaggttettgagaaageeAlaAspCysAlaValSerArgPheGlyGlyLysVa.lIeGl,uLy曰Ala31532032S330aattetgettctcctgtgcatgagtatec欲gec:fctgaaetgcaagagtAsnSerMaSei:ProValHi曰GluTyrProAlaLeuASCy曰LysSer33S.34034S10721120gggatggaag四aatggcttggtttgeGlyMetGluGlyAsitGlyLeuValCys350355Lyslays1166sc改gagcatgttgtatgctgaatgatgagctataaataattt的a貼tgasgtgstcstagotttaoatgeaaaaaaaaatgagtttcaga'站ag匕etta1226aaaaasasas汰暨aaaaaa祖gi12863CcDH2a全序列,其包括启动子(碱基1-1324,见SEQIDNO:13序列(见SEQIDNO:3)和所编码的蛋白质(见SEQIDNO:9),1287),编码内含子I(1642).(1866)g孩改s汰gt玖gt右Octetttggcg1201OT240300gaaasitgttc3S0420ttcttoagat480540閱。aC!tSLgttCtC!tttcattttgtaa仁ttcatg720780gatttgtgftt900taaottgtts960tgtctGtttstt匕cttc匕gtaaatgt改atg1020tg效ttatt為atc:tgrat祖fcat1140tgcc;ttga±g1200gtcfccctgcg1320gc;tacc'fct改统tttcagtgcca匕tttt匕tet^tggetgacttgcgtgatg改atatAlaA包plieuArgAspTyr15ggaaatcctatgcagtfcgac^g改ccagtatggeaacccggttcagetc1482GlyAenProMetGinL迳uThrAspGinTyrGlyA筠ni^oGinLeu101520aaggacgagtatggcaaeCJGaatgcagcttage的tgt逸gotateacc1530LysAspGinTyxGlyAsnProMetGinI^u.SerGlyVaiAlaJleThr25303Sgecgggscggotagt改otgtccattetactggsaceggaec:祖actgetAlaGlyThrAl欲SerTha:ValHisSerTlirGlyThrGlyP:roTteAla405055geeaotggaa.ccoag*c逸aestc:agfgagcagettc這teggtctago為geiS2SMaTbrGlyThrGinGinHisGtaGluGltiLeuHistegSerSerSex1606570teaagetct;ggeteggtgagataetegcca孩gttacaatgtgtgtgt;otgtgtgtSerSer超erGlySergtata这tge袋Gc:改fccstt改attgtfctgcttgaeagatcctgttSL孩t:改atgaaocsgt^ettti:1741gacgta统改gtgtac;孩ogt:tittgtttttctg,gactaax;staafcaLtegastcaggctcctgi8Q:L</column></row><row><column>本发明不限于以上描述和举例的实施方案,其变化和修改也包含在所附权利要求的范围内。权利要求1.从咖啡(咖啡属物种)分离的核酸分子,其具有编码脱水蛋白或胚胎发育后期富集(LEA)蛋白的编码序列。2.权利要求l的核酸分子,其中编码序列编码具有大约17kDa到大约26kDa之间的分子量的脱水蛋白。3.权利要求2的核酸分子,其中脱水蛋白或LEA蛋白质具有氨基酸序列,所述氨基酸序列与SEQIDNO:7-12中的任一个有46%或更高的同一性。4.权利要求3的核酸分子,其中脱水蛋白或LEA蛋白质具有SEQIDNO:7-12中任一个的氨基酸序列。5.权利要求1的核酸分子,其中编码序列与SEQIDNO:1-6中所示编码序列中的任一序列具有50%或更高的同一性。6.权利要求5的核酸分子,其中编码序列包含SEQIDNO:1-6中的任一个。7.权利要求l的核酸分子,其是具有包含编码序列的可读框的基因。8.由权利要求7的基因转录产生的mRNA分子。9.由权利要求8的mRNA分子反转录产生的cDNA分子。10.长度在8和100个碱基之间的寡核苷酸,其与权利要求1的核酸分子的区段互补。11.包含权利要求1的核酸分子的载体。12.权利要求ll的载体,其是选自质粒、噬菌粒、粘粒、杆状病毒、杆状病毒穿梭载体、细菌、酵母和病毒载体的表达载体。13.权利要求11的载体,其中核酸分子的编码序列有效连接至组成型启动子。14.权利要求ll的栽体,其中核酸分子的编码序列有效连接至诱导型启动子。15.权利要求ll的载体,其中核酸分子的编码序列有效连接至组织特异性启动子。16.权利要求15的载体,其中组织特异性启动子是种子特异性启动子。17.权利要求16的载体,其中种子特异性启动子是咖啡种子特异性启动子。18.权利要求17的载体,其中咖啡种子特异性启动子是脱水蛋白基因启动子。19.权利要求18的载体,其中脱水蛋白基因启动子包含SEQIDNO:13。20.用权利要求11的载体转化的宿主细胞。21.权利要求20的宿主细胞,其选自植物细胞、细菌细胞、真菌细胞、昆虫细月包和哺乳动物细月包。22.权利要求21的宿主细胞,其是选自咖啡、烟草、拟南芥、玉米、小麦、稻、大豆、大麦、黑麦、燕麦、高粱、苜蓿、三叶草、油菜、红花、向日葵、花生、可可、蕃茄、粘果酸浆、马铃薯、胡椒、茄子、甜菜、胡萝卜、黄瓜、莴苣、豌豆、紫菀、秋海裳、菊花、飞燕草、百日草和草坪草的植物细胞。23.再生权利要求22的宿主细胞产生的能育转基因植物。24.权利要求23的能育转基因植物,其是咖啡属物种。25.调节咖啡豆的香味或香气的方法,其包括调节咖啡种子内一种或多种脱水蛋白或LEA蛋白质的产量。26.权利要求25的方法,其包括增加一种或多种脱水蛋白或LEA蛋白质的产量。27.权利要求26的方法,其包括增加咖啡种子内一种或多种内源编码脱水蛋白或LEA蛋白质的基因的表达。28.权利要求27的方法,其包括将编码脱水蛋白或LEA蛋白质的转基因引入植物。29.权利要求25的方法,其包括减少一种或多种脱水蛋白或LEA蛋白质的产量。30.权利要求29的方法,其包括将核酸分子引入咖啡,所述核酸分子抑制一种或多种编码脱水蛋白或LEA蛋白质的基因的表达。31.在植物中增加对渗透胁迫的抗性的方法,其包括增加植物中一种或多种脱水蛋白或LEA蛋白质的产量。32.权利要求31的方法,其包括将编码脱水蛋白或LEA蛋白质的转基因引入植物。33.启动子,其分离自编码脱水蛋白的咖啡植物基因。34.权利要求33的启动子,其中基因编码具有大约17kDa和大约26kDa之间的分子量的脱水蛋白。35.权利要求34的启动子,其中基因编码具有氨基^列的脱水蛋白,所述氨基酸序列与SEQIDNO:7-11中的任一个有50%或更高的同一性。36.权利要求35的启动子,其中基因编码具有SEQIDNO:7-11中任一个氨基酸序列的脱水蛋白。37.权利要求33的启动子,其中基因包含可读框,所述可读框与SEQIDNO:1-5中所示序列中的任一序列具有50%或更高的同一性。38.权利要求37的启动子,其中基因包含具有SEQIDNO:1-5中任一个的可读才匡。39.权利要求33的启动子,其包含一个或多个选自TATA盒、脱落酸应答元件、用于调节leguminin型蛋白质表达的leguminin盒的RY重复(CATGCA(T/a)(A/g)、至少一个脱水蛋白应答元件/C重复顺式作用序列基序(G/ACCGAC)和至少一个E盒基序(CANNTG)的调节序列。40.权利要求39的启动子,其包含SEQIDNO:13。41.包含权利要求33的启动子的嵌合基因,其有效连接至一个或多个编码序列。42.用于转化细胞的载体,其包含权利要求41的嵌合基因。43.用4又利要求42的载体转化的细胞。44.权利要求43的转化的细胞,其是植物细胞。45.权利要求44的转化的植物细胞,其是咖啡属物种的细胞。46.再生权利要求44的转化的植物细胞产生的能育转基因植物。47.权利要求46的能育转基因植物,其是咖啡属物种。全文摘要本发明公开了来自咖啡植物的编码脱水蛋白和胚胎发育后期富集(LEA)蛋白的多核苷酸。本发明也公开了来自咖啡脱水蛋白基因的启动子序列,以及使用这些核酸和启动子序列调节基因和操控咖啡豆的香味、香气、胁迫耐性和其他性质的方法。文档编号C12N15/82GK101218346SQ200680024738公开日2008年7月9日申请日期2006年7月5日优先权日2005年7月6日发明者J·G·麦卡锡,M·本阿莫尔,S·D·坦克斯雷,V·帕蒂尔,林晨炜申请人:康乃尔研究基金会;雀巢技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1