调节碳和氮的基因与蛋白质及其调节的制作方法

文档序号:334939阅读:1036来源:国知局
专利名称:调节碳和氮的基因与蛋白质及其调节的制作方法
技术领域
本发明涉及通过调节植物细胞中的GATA转录因子的表达来调节植 物中的农学性状的方法。具体而言,这种GATA转录因子是从稻(Oryza sativa)中分离的,并且在叶绿素合成、糖积累、氮状况、胁迫耐受性以及 籽粒(grain)产量方面是重要的,并且最后可以调节氮摄取和总的碳代谢。
背景技术
对作物植物农学特征的改良从农业开始就一直在进行。大部分适合作
物生产的土地目前已被使用。因为人口持续增长,所以会需要改良的作物
品种以充分地提供我们的食物和饲料(Trewavas (2001) Plant Physiol. 125:
174-179)。为了避免灾难性的饥荒和营养不良,未来的作物栽培种将需要
使用等量的农业投入获得改进的产量。这些栽培种将需要更有效地抵抗不
利条件如干早、土壤盐碱化或疾病,当贫瘠的土地进行耕种时这会是特別
重要的。最后,我们将需要下述栽培种,其具有改变的营养組成以增强人 和动物营养并使得能够进行有效的食物和铜料加工。对所有这些性状而言,
鉴定控制目的性状表型表达的基因对于通过常规或转基因手段加速优良作 物种质的开发是决定性的。
可获得大量高效的方法来帮助鉴定在农学重要性状的表达中起关键作 用的基因。这些包括遗传学、基因组学、生物信息学和功能基因组学。遗 传学是遗传机制的科学研究。通过鉴定改变目的途径或应答的突变,经典 遗传学(或正向遗传学)能够帮助鉴定涉及这些途径或应答的基因。例如, 对疾病具有增加的易感性的突变体可鉴定从病原体识别通向疾病抗性的植 物信号转导途径的重要组件。遗传学也是通过育种改良种质的中心組件。 通过遗传杂交的分子和表型分析,控制目的性状的基因座可以被绘图并在随后的世代中被跟踪。获知作物增加物(accession)之间表型变异下潜在的 基因可使得能够开发下述标记物,所述标记物大幅提高种质改良方法的效 率,并且打开了发现其他优良等位基因的通道。
基因组学是对生物基因组的系统水平研究,所述生物基因组包括基因 和相应的基因产物——RNA和蛋白质。在初级水平上,基因组方法提供了 来自不同植物物种序列信息的巨大数据集,包括模式植物物种拟南芥的全 长和部分cDNA序列和全基因組序列。最近,也可以获得作物植物基因组 稻(Oiyza sativa)基因组的最初序列草案(draft sequence)。全基因组序列的 可用性使得可能开发在系统水平上研究其他分子互补物的工具,如阵列和 芯片,其用于测定生物在特定M下表达的基因的互补物。这些数据可被 用作某些基因在不同植物表型的表达中起关键作用的潜能的最初指示。
生物信息学方法与初级水平的基因组数据集直接结合,允许通过注解 (annotative)或其他手段处理以揭示目的序列。使用例如相似性搜索、比对 和种系发生分析,生物信息学通常可鉴定目的基因产物的同源物 (homolog)。非常类似的同源物(例如在蛋白质全长上具有> 卯%的氨基 酸同一性)非常可能是直向同源物,即在不同的生物中具有同样的功能。
功能基因組学可被定义为对基因及其产物的功能指定。功能基因组学 从遗传学、基因组学和生物信息学中得到鉴定下述基因的途径,所述基因 在具体的目的途径或应答中是重要的。表达分析例如使用高密度DNA微 阵列(长来自基因组规模的生物测序)在单次实验中监测数千基因的 mRNA表达。实验处理可包括引发目的应答的处理,所述目的应答例如用 病原体感染的植物中的疾病抗性应答。为了给出微阵列用途的额外实例, 可在一段发育时程内的不同組织中或在受目的应答影响的突变体中监测 mRNA表达水平。蛋白组学也可通过在单次实验中检验数百个蛋白质的表 达和翻译后修饰来帮助指定功能。
蛋白组学方法在许多情况下与在微阵列实验中采取的监测mRNA表 达的方法类似。蛋白质-蛋白质相互作用也可通过鉴定与途径或应答的已知 組件相互作用的蛋白质,帮助将蛋白质指定至给定的途径或应答。对于功能基因组学而言,通常使用大规模酵母双杂交实验研究蛋白质-蛋白质相互 作用。指定基因功能的另一方法是在异源宿主例如细菌大肠杆菌
(Escherichia coli)中表ii^目应的蛋白质,然后进行纯化和酶检验。
实验验证。转基因植物目的基因的产生和分析可用于植物功能基因組学, 这具有若千优点。基因通常可净嫂量表达和低表达(underexpressed)("敲 除"),从而增加观察到下g型的机会,所it^型将该基因与目的途径 或应答联系在一起。转基因功能基因组学的两个方面有助于给予通过该途 径的功能指定以高置信度水平。首先,在生活植物的背景下进行表型观察。 其次,可以检查观察到的表型范围并与观察到的引入的转基因表达水平相 关联。转基因功能基因组学在改良栽培种的开发中特别有价值。只有下述 基因作为作物改良成就的候选基因被促进,所述基因在目的途径或应答中 发挥作用并且能够另外赋予以期望的性状为基础的表型。在一些情况下, 针对功能基因组学研究开发的转基因林系可在产品开发的初期直接使用。
朝向植物功能基因组学的另一途径首先鉴定在特定目的基因中具有突 变的植物林系,然后在所研究的性状上对这类基因敲除的结果进行表型评 价。这样的途径揭示了特定性状表达必需的基因。
通过功能基因组学鉴定的基因可在如上所述通过转基因手段改良种质 的努力中直接使用,或被用于开发在作图和繁殖种群中鉴定目的等位基因 踪迹的标记物。获知这类基因也可使得能够通过大量分子方法中的任意方 法来构建自然中不存在的优良等位基因。
在过去80年中,行栽作物(row crop)中产量的快速增加在大致相等的 程度上归因于改进的遗传学和改进的农学实践。具体地,在作物如玉米中, 高产杂种和大量氮肥使用的组合在理想的条件下允许大于440蒲式耳/英亩 (bu/acre)的产量。然而,大量氮肥的^f吏用具有负面的副作用,主要在于增 加的该农民投入成本和增加的环境成本,因为硝酸盐污染是在许多农业地 区显著促成淡水和海洋环境退化的主要问题。通过理解基因型对氮使用的 作用来开发更有效利用氮的作物遗传学在降低生产者^成本以及环境负荷中会是高度有利的。这对使用高水平氮肥栽培的作物如玉米而言尤其重 要。
氮使用效率可以以若干种方式定义,尽管最简单的是产量/应用的N。 该方法中存在两个阶段首先,被吸收、储存和同化为氨基酸和其他重要 含氮化合物的可获得的氮量;其次,;故分配至种子而导致最终产量的氮比 例。已对多种农业上重要的作物进行了多种产量研究以研究该问题(Lawlor DW等,2001在Lea PJ, Morot-Gaudry JF,编著Plant Nitrogen. Berlin: Springer-Verlag 343-367; Lafitte HR和Edmeades GO 1994 Field Crops Res 39, 15-25; Lawlor DW 2002 J Exp Bot. 53, 773-87; Moll RH等,1982 Agron J 74, 562-564)。这些实验已证明存在氮使用效率的遗传组件,但就 确定何种基因对该过程是重要的而言,尚未证明这些实验是令人满意的。 另外,玉米种植者一般不把在有限的氮肥下维持产量作为目标。这些类型 的对氮使用的产量研究就多种使得实验难以解释的原因而言是困难的,所 述原因包括在测试田(test field)中或在任何处理制度下的田间位点(field sites)之间缺乏可得氮的均一性,和其他环境因素的互相影响。
因此,尽管存在这种性状的遗传变异的实^据,但从这些实验中 做出任何什么引起这一变异的结论仍是困难的。发展多种方法以便在田间 条件下在作物植物中研究这种性状,这应该是可行的并且无疑是重要的。 然而,通过使用模式系统(像拟南芥属(Arabidopsis))可进行针对鉴定、 理解、以及操作重要的性状的重大进步。至少,这些实验将给出关于在重 要的田间作物中有待评估的潜在靶基因的重要线索。此外,还存在相当多 的可供用来研究稻的遗传资源和基因组资源,并且这一物种还将作为与拟 南芥属相比更类似于玉米的一个物种用于所提出的实验中的一些实验。
硝酸盐是田间可供使用的氮的主要形式,并且存在大量的文献涉及 硝酸盐摄取和还原的基因(Forde BG 2000 Biochimica et Biophysica Acta 1465, 219-235; Howitt SM和Udvardi MK 2000 Biochimica et Biophysica Acta 1465, 152-170; StittM等人2002 J Exp Bot. 53, 959-70 )以及参与氮 代谢的其他方面的基因(Lea PJ, Morot-Gaudry JF,编著2001 Plant
10Nitrogen. Berlin: Springer-Verlag; Morot-Gaudry JF 2001 Nitrogen assimilation by plants Science Publishers Inc. NH, US )。 同样,清楚的是 碳代谢产物的利用率对田间硝酸盐的有效利用至关重要,并且针对碳和氮 代谢之间的联系存在良好的实^iit据(Coruzzi GM和Zhou L 2001 Curr Opin Plant Biol. 4, 247-53 )。此外, 一些实验提示GS以及GOGAT参与 了将N从开始衰老的器官中重新流通至库器官(sink organ )中(Brouquisse R等人2001 in Lea PJ, Morot-Gaudry JF,编著Plant Nitrogen. Berlin: Springer-Verlag 275-293; Yamaya T等人2002 J Exp Bot. 53, 917-925 )。 然而,这些基因的调节的大多数方面仍然是不清楚的,并且对这种调节如 何影响氮使用效率仍没有概念。
植物能够感知(sense)碳和氮代谢产物的水平并从而调整生长和发 育。这种感觉机制是控制基因表达以适应营养依赖性的细胞活性不断进行 变化的复杂的调节网络。拥有糖感知机制使植物能够在碳骨架充足时关闭 光合作用。氮感知机制使植物能够在还原氮或有机氮处于水平高时关闭硝 酸盐摄取和还原(Coruzzi, G.M. & Zhou, L. (2001) Curr Opin Plant Biol. 4, 247-53)。
在植物中存在着多种糖的信号转导途径。葡萄糖已显现为光合植物 中许多生命过程(如在光合作用中以及在碳和氮代谢中)的一种关键调节 物(Rolland, F" Moore, B. & Sheen, J. (2002) Plant Cell S185-S205 )。己 糖激酶(HXK)是葡萄糖代谢的一个重要的控制点。它们不仅催化葡萄糖 的磷酸化,而且作为一种葡萄糖感受器发挥功能,使养分、光以及激素信 号传导网络相互联系,用于响应变化的环境来控制生长和发育(Jang,丄, Leon, P, Zhou, L. & Sheen, J. (1997) Plant Cell 9, 5 19; Dai, N,, Schaffer, A., Petreikov, M., Shahak, Y., Giller, Y., Ratner, K., Levine, A. & Granot, D. (1999) Plant Ce11, 1253-1266; Moore, B., Zhou, L., Roland, F., Hall, Q., Cheng, W,, Liu, Y., Hwang, I" Jones, T. & Sheen, J. (2003) Science 300, 332-336)。在其他生物中已经表明己糖运输分子也充当糖感受器。
植物中也存在多种N信号和传感(sensing)途径。植物具有多种机制来感知作为无机N状况的信号的硝酸盐(氮肥的主要形式),并感知作为 还原性N或有机N状况的信号的来源于硝酸盐的代谢产物。硝酸还原酶 (NR )和亚硝酸还原酶(NiR )是硝酸盐还原过程中最初的两种酶,并且 它们的表达可受到硝酸盐的存在的刺激并被其他生理因素(包括一些含氮 化合物、蔗糖、光以及激素)调节(Forde, B.G. (2000) Biochimica et Biophysica Acta 1465, 219-235; Howitt, S,M. & Udvardi, M.K. (2000) Biochimica et Biophysica Acta 1465, 152-170; Stitt, M., Miiller, M., Matt, M,, Gibon, Y., Carillo, P., Morcuende, R., Scheible, W. & Krapp, A. (2002) J Exp Bot. 53, 959-970; Lea, P.J. & Morot画Gaudry,丄F.编著2001 Plant Nitrogen. Berlin: Springer-Verlag; Morot-Gaudry JF 2001 Nitrogen assimilation by plants Science Publishers Inc. NH, US )。
清楚的是碳和氮代谢密切相连并被紧密地调节(Coruzzi, G. & Bush, D.R. (2001) Plant Physiol 125, 61-64 )。碳代谢产物的利用率对于有效地使 用硝酸盐而言是至关重要的,并且氮状况对光合作用是非常敏感的。尽管 参与碳和氮代谢的结构性基因的知识得到了增加,但涉及到C/N基因表达 的转录调节的反式作用因子还没有得到表征。
GATA转录因子是在真核生物中广泛分布的一类转录调节物。通常, GATA的DNA结合结构域识别共有序列WGATAR (W-T或A; R = G 或A ) ( Lowry,丄& Atchley, W. (2000) J Mol Evol 50, 103-115 )。已经在 许多光应答基因的调节区域中鉴定出GATA基序(Arguello-Astorga, G. & Herrera-Estrella, L. (1998) Annu Rev Plant Physiol Plant Mol Biol 49, 525-555),这些光应答基因包括参与光合作用或与光合作用有关的许多基 因,如RBCS、 CAB (叶绿素A/B结合蛋白)以及GAP (甘油醛-3-磷酸 脱氬酶)(Terzaghi, W.B. & Cashmore, A.R. (1995) Annu Rev Plant Physiol Plant Mol Biol 46, 445-474; Koch, K.E. (1996) Carbohydrate-modulated gene expression in plants. Annu Rev Plant Physiol Plant Mol Biol 47, 509-540; Jeong, M.J. & Shih, M.C. (2003) Biochem Biophys Res Commun 300,555-562),以及参与硝酸盐同化作用的基因,如硝酸还原酶、亚硝酸还原酵以及GIn合成斷Jarai, G" Tmong, H., Danid-Vedele, F. & Marzluf, G. (1992) Curr Genet 21, 37-41; Rastogi, R,, Bate, N., Sivasankar, S & Rothstein, S. (1997) Plant Mol Biol. 34, 465-76; Oliveira, LC. & Coruzzi, G.M. (1999) Plant Physiol 121, 301-309)。在N代谢中总体调节基因的一 些已知的反式作用调节蛋白是GATA转录因子基因。在酵母中,四个总氮 调节因子GLN3、NIL1、NIL2以及DAL80是包含单个GATA锌指的DNA 结合蛋白,其识别共有基序GATA( Hofman-Bang, J. (1999) Mol Biotech 12, 35-73 )。在真菌中,粗糙链孢霉(Neurospora crassa)NIT2( Tao Y和Marzluf GA 1999 Curr Genet 36, 153-158 )和构巢曲霉(Aspergillus nidulans)AREA (Caddick MX Arst HN Jr Taylor LH Johnson RI Brownlee AG 1986 Cloning of the regulatory gene areA mediating nitrogen metabolite repression in Aspergillus nidulans. EMBO J 5, 1087-1090 )是GATA转录 因子基因。
在植物中,GATA因子的体内功能仍没有得到很好的定义,其中拟 南芥属基因组具有30个GATA成员(Riechmann, J丄,Heard,丄,Martin, G., Reuber, L., Jiang, C., Keddie, J., Adam, L., Pineda, O., Ratcliffe, O.J., Samaha, R.R., Creelman, R., Pilgrim, M., Broun, P., Zhang, J.Z., Ghandehari, D., Sherman, B.K. & Yu, G. (2000) Science 290, 2105-2110; Reyes,丄C., Muro画Pastor, M.L & Florencio, F.J. (2004) Plant Physiol. 134, 1718-1732)。以前申请人鉴定出拟南芥属的GATA转录因子基因GNC (A5g56SM),它在叶绿素合成和糖敏感性中是重要的(WO 2006/074547)。在稻(6^^"^mV")基因组中,存在28个GATA转录因 子基因,其中一个基因0sO47MJ6与拟南芥属GATA基因At5g56860共 有相似性(Reyes, J.C., Muro曙Pastor, M.I. & Florencio, F.J. (2004) Plant Physiol. 134, 1718-1732和WO 2006/074547 )。
发明概述
诸位发明人已经从稻中分离出一种新的GATA转录因子,命名为OsGATAll,它是来自拟南芥属的At4g26150基因的一种直向同源物。 爿"^26/50基因是在30个拟南芥属的GATA转录因子基因的系统树中的一 种6TVC旁系同源物(Reyes, J.C., Muro画Pastor, M丄& Florencio, F.J. (2004) Plant Physiol. 134, 1718-1732 ),并且已被发现具有与G2VC重叠的功能。 诸位发明人已经确定OsGATAll基因的表达调节了叶绿素合成、种子产量 以及针对低氮水平的胁迫应答。而且,OsGATAll基因的过量表达能够对 硝酸盐和氨基酸水平以及对糖的积累产生积极的作用。OsGATAll基因中 的失功能突变体植物导致叶绿素水平降低、氨基酸和蛋白质水平降低、连 同糖积累减少。
具体而言,产生了通过RNAi将OsGATAll基因沉默的转基因稻植物 以及过量表达该稻基因的转基因植物。用OsGATAll基因转化的植物具有 提高的叶绿素水平和提高的种子产量,并且具有针对低氮水平的改善的胁 迫应答。在高N下生长的植物在从生长室转移到温室后经历了胁迫,并且 这些过量表达OsGATAll的转基因植物对该胁迫的应答更好的多。
糖是光合作用的植物中许多生命过程(如光合作用以及碳和氮代谢) 的中心调节物。这种调节是通过调节基因表达来激活或抑制有关基因而实 现的。对糖控制基因表达的机理还不是很了解。这里公开的GATA转录因 子参与调解了糖水平(包括蔗糖、葡萄糖以及果糖水平),连同调节硝酸 盐、氨基酸以及蛋白质水平。这个基因的表达提高能够产生具有提高产量 的植物,特别是当糖信号传导途径的操纵能够导致提高的光合作用以及提 高的氛同化作用并改变种子、块茎(tube)、根、以及其他贮藏器官中的 源库关系时。
因此,本发明涉及调节植物或植物细胞中的特性的方法,包括调节该 植物或植物细胞中的GATA转录因子基因的表达。在一个优选的实施方案 中,本发明提供了调节植物或植物细胞中的特性的方法,包括调节该植物 或植物细胞中的GATA转录因子的表达,其中该GATA转录因子包括
(a) SEQ ID NO: 1的核苷酸序列;
(b) 编码SEQIDNO:2的多肽的核苷酸序列;或者(e)能够与(a)或(b)进行杂交的核苷酸序列,
并且其中该特性是选自叶绿素合成、种子产量、胁迫耐受性、硝酸 盐水平、氨基酸水平以及糖积累。
在本发明的一个实施方案中,这种GATA转录因子基因的表达是通过 给予该细胞有效量的活性物质(agent)来进行调节的,该活性物质可以调 节该植物细胞中GATA转录因子基因的表达水平。在本发明的一个具体的 实施方案中,该活性物质增强了该植物或植物细胞中GATA转录因子基因 的表达水平。在本发明的另一个具体的实施方案中,该活性物质减小了该 植物或植物细胞中GATA转录因子基因的表达水平。
在该植物中有待调节的特性可以是任何所感兴趣的农学性状。在本 发明的一个实施方案中,该特性是受以下各项影响的任何特性氮、碳和/ 或硫代谢,脂类的生物合成,养分的感知、营养的适应,电子传递和/或与 膜相关的能量守恒。在本发明的另外一个实施方案中,该特性是选自以下 各项中的一个或多个氮利用、产量、细胞生长、繁殖、光合作用、氮同 化作用、疾病抗性、分化、信号转导、基因调节、非生物胁迫耐受性、以 及营养组成。在一个优选的实施方案中,该特性是选自叶绿素合成、种 子产量、胁迫耐受性、硝酸盐水平、氨基酸水平以及糖积累。在本发明的 仍又另外一个实施方案中,这种受调节的特性是以下各项中的一项或多项 的提高或改善氮利用、产量、细胞生长、繁殖、光合作用、氮同化作用、 疾病抗性、分化、信号转导、基因调节、非生物胁逸耐受性、以及营养组 成。在一个优选的实施方案中,这种受调节的特性是以下各项的提高或改 善叶绿素合成、种子产量、胁迫耐受性、硝酸盐水平、氨基酸水平以及 糖积累。在另一个实施方案中,这种受调节的特性是以下各项的降低或减 少叶绿素合成、种子产量、胁迫耐受性、硝酸盐水平、氨基酸水平以及 糖积累。
在一个具体的实施方案中,本发明涉及改善植物或植物细胞中氮利用 的方法,该方法包括增强该植物或植物细胞中的GATA转录因子基因的表 达。改善植物中的氮利用将允许减少施用至植物的氮肥的量,并伴随着农
15民成本和环境成本的降低,因为硝酸盐污染是许多农业区中的一个主要问 题,显著地导致了淡水和海洋环境的退化。
植物或植物细胞可以来自人们希望在其中调节特性的任何植物。在 本发明的一个实施方案中,植物细胞为双子叶植物、棵子植物或单子叶植 物。在一个实施方案中,双子叶植物选自大豆、烟草或棉花。在本发明的
又一实施方案中,单子叶植物选自玉米、小麦、大麦、燕麦、棵麦(rye)、 粟、高粱(sorghum)、黑小麦(tritieale)、黑麦属(secale)、单粒小麦(dnkorn)、 斯佩耳特小麦(spelt)、双粒小麦(emmer)、画眉草(teff)、蜀黍(milo)、亚麻、 格兰马草(gramma grass )、磨擦草属物种(Tripsacum sp.)和玉米草 (teosite)。
在本发明的一个实施方案中,增强植物细胞中的GATA转录因子基因 的表达水平的活性物质包括编码了 GATA转录因子的核酸分子。
在本发明的一个实施方案中,对植物细胞中的GATA转录因子基因 的表达水平进行调节的活性物质包括
(a) SEQ ID NO: 1的核苷i^f列或其片段或结构域;
(b) 编码SEQIDNO:2的多肽的核普^列、其片段或结构域;
(c) 与(a)或(b)具有基本相似性的核苷酸序列;
(d) 能够与(a)、 (b)或(c)进行杂交的核苷酸序列;
(e) 与(a)、 (b)、 (c)或(d)互补的核苷酸序列;或
(f) 核苷酸序列,它是(a)、 (b)、 (c)或(d)的反向互补序列。 在一个具体的实施方案中,该活性物质增强了 GATA转录因子的表
达水平;并包括核酸分子,该核酸分子编码了 GATA转录因子。在本发明 的另外一个实施方案中,这种核酸分子包括SEQIDNO: 1的OsGATAll 基因的序列或其功能片段。在本发明的仍又另外一个实施方案中,这种核 酸分子包括序列,该序列在中度严格性条件下与SEQ ID NO: 1的 OsGATAll基因或其功能片段进行杂交。在本发明的另一个实施方案中, 这种核酸分子来源于SEQ ID NO: 1的GATA转录因子的核苷酸序列;并 且具有包括在植物中对表达特异的密码子的核苷酸序列。在另一个具体的实施方案中,该活性物质抑制或降低了 GATA转录因 子的表达水平;并包括核酸分子,该核酸分子抑制了该GATA转录因子的 表达。在一个实施方案中,这种核酸分子是用于RNA干扰(RNAi)的干 扰性RNA分子。在另一个实施方案中,这种核酸分子是反义分子。
在本发明的另外一个实施方案中,对植物细胞中的GATA转录因子 基因的表达水平进行调节的活性物质包括
(a) SEQ ID NO: 2中所列出的多肽序列,或其功能片段、结构域、 重复、或嵌合体;
(b) 与(a)具有基本相似性的多肽序列;
(c) 多肽序列,所述多肽序列由核苷酸序列进行编码,该核苷酸序列 与SEQ ID NO: 1中所列出的核苷,列、或其功能片段或结构域、或与 它互补的序列,相同或具有基本相似性;或
(d) 多肽序列,该多肽序列由核香酸序列进行编码,该核苷酸序列能 够在中度严格性条件下与SEQ ID NO: 1中所列出的核苷断列或与之互 补的序列进行杂交。
在本发明的一个实施方案中,当活性物质是核酸序列时,该核^ 列表达于植物的特定位置或组织中。该位置或組织是(例如,但不限于) 表皮、根、维管组织、分生组织、形成层、皮层、髓、叶和/或花。在一个 备选的实施方案中,位置或组织为种子
本发明的实施方案还涉及用于调节植物细胞中特性的改组的核酸分子 的用途,所述改组的核酸分子含有大量核苷*列片段,其中至少一条片 段编码GATA转录因子且其中大量序列片段中至少两条是从5'到3'的顺 序,这不是核酸中天然存在的大量片段的顺序。在一个具体的实施方案中, 含有大量核苷,列片段的改组的核酸分子中所有片段来自单个基因。在 一个更具体的实施方案中,大量片段源自至少两个不同的基因。在一个更 具体的实施方案中,改组的核酸与启动子序列有效连接。另一更具体的实 施方案是使用嵌合的多核苷酸用于调节植物细胞中的特征,所述嵌合的多 核普酸包含与改組的核酸有效连接的启动子序列。在一个更具体的实施方案中,改组的核酸包含在宿主细胞内。在本发明的另外一个具体的实施方
案中,对GATA转录因子进行编码的片段由以下各项构成或包括以下各 项
(a) SEQ ID NO: 1的核香^列或其片段或结构域;
(b) 编码SEQ ID NO:2的多肽的核苷,列、其片段或结构域;
(c) 与(a)或(b)具有基本相似性的核苷酸序列;
(d) 能够与(a)、 (b)或(c)进行杂交的核苷酸序列;
(e) 与(a)、 (b)、 (c)或(d)互补的核苷酸序列;或
(f) 核苷酸序列,它是(a)、 (b)、 (c)或(d)的反向互补序列。 本发明的实施方案还考虑了表达盒用于调节植物细胞中的特性的用
途,该表达盒包括启动子序列,该启动子序列与分离的核酸有效连接,该 分离的核酸编码了 GATA转录因子。在本发明的实施方案中,对GATA 转录因子进行编码的分离的核酸由以下各项构成或包括以下各项
(a) SEQ ID NO: 1的核苷*列或其片段或结构域;
(b) 编码SEQIDNO:2的多肽的核苷酸序列、其片段或结构域;
(c) 与(a)或(b)具有基本相似性的核苷酸序列;
(d) 能够与(a)、 (b)或(c)进行杂交的核苷酸序列;
(e) 与(a)、 (b)、 (c)或(d)互补的核苷酸序列;或
(f) 核苷酸序列,它是(a)、 (b)、 (c)或(d)的反向互补序列。 进一步涵盖于本发明之内的是重组载体用于调节植物细胞中的特性
的用途,该重组载体包含表达盒,该表达盒包括启动子序列,该启动子序 列与分离的核酸有效连接,该分离的核酸编码了 GATA转录因子。在本发 明的实施方案中,对GATA转录因子进行编码的分离的核酸由以下各项构 成或包括以下各项
(a) SEQ ID NO: 1的核苷*列或其片段或结构域;
(b) 编码SEQIDNO:2的多肽的核苷酸序列、其片段或结构域;
(c) 与(a)或(b)具有基本相似性的核苷酸序列;
(d) 能够与(a)、 (b)或(c)进行杂交的核苷酸序列;(e) 与(a)、 (b)、 (c)或(d)互补的核苷酸序列;或
(f) 核苷酸序列,它是(a)、 (b)、 (c)或(d)的反向互补序列。 还涵盖了根据本公开的包含表达盒的植物细胞的用途,以及包含这
些植物细胞的植物的用途。
在一个实施方案中,该表达盒表达于整个植物中。在另一个实施方案 中,该表达盒表达于植物的一个特定位置或組织中。在一个具体的实施方 案中,该位置或组织可以是(例如)表皮、根、维管组织、分生组织、形 成层、皮层、髓、叶和花。在一个备选的具体的实施方案中,该位置或组 织是种子。
本发明的实施方案还提供了种子以及从植物分离出的产物用于调节植 物细胞中的特性的用途,它们包含表达盒,该表达盒包括启动子序列,该 启动子序列与分离的核酸有效连接,该分离的核酸编码了根据本发明的 GATA转录因子基因。
在一个具体的实施方案中,表达载体包含一个或多个元件,例如但不
限于启动子增强子序列、选择标记物序列,复制起点、表位标签编码序列, 或亲和纯化标签编码序列。在一个更具体的实施方案中,启动子增强子序 列可以是例如CaMV 35S启动子、CaMV 19S启动子、烟草PR-la启动子、 遍在蛋白和菜豆蛋白启动子。在另一实施方案中,启动子可在植物中工作, 更特别地为組成型或诱导性启动子。在另一具体的实施方案中,选择标记 物序列编码抗生素抗性基因。在另一具体的实施方案中,表位标签序列编 码V5、肽Phe-His-His-Thr-Thr、血凝素或谷胱甘肽-S-转移酶。在另一具 体的实施方案中,亲和纯化标签序列编码多聚#^酸序列或多肽。在一个 更具体的实施方案中,多聚M酸序列为多聚组氨酸。在一个更具体的实 施方案中,多肽是壳多糖结合结构域或谷胱甘肽-S-转移酶。在一个更具体 的实施方案中,亲和纯化标签序列包含内含肽编码序列。
在一个具体的实施方案中,表达栽体是真核生物表达载体或原核生物 表达栽体。在一个更具体的实施方案中,真核生物表达载体包含组织特异 的启动子。更特別地,表达栽体可在植物中工作。本发明的实施方案还涉及通过下述方法修饰的植物,所述方法包括向 植物中引入核酸,其中核酸可以在植物中以有效影响修饰的量表达。该修 饰可以是以下一种或多种目的性状的提高或降低。该修饰可包括基因的过 量表达、低表达、反义调节、有义阻抑、诱导性表达、诱导性阻遏、或诱 导性调节。在本发明的一个实施方案中,修饰涉及目的性状例如氮利用的 提高或改进。
本发明的实施方案提供了从拟南芥中分离的核苷酸和#^酸序列。特
别地,本发明涉及糖感知所需要的调节氮的GATA转录因子基因。
本发明的实施方案涉及分离的核酸,该核酸包括核苷酸序列或由其构 成,该核苷酸序列包括
(a) SEQIDNO:l中所列出的核苷^列,或其片段或结构域;
(b) 与(a)具有基本相似性的核苷酸序列;
(c) 能够与(a)进行杂交的核苷酸序列;
(d) 与(a)、 (b)、或(c)互补的核苷酸序列;或
(e) 核苷酸序列,它是(a)、 (b)、或(c)的反向互补序列。 在一个具体的实施方案中,这种基本相似性是与如SEQ ID NO: 1所
列出的核苷酸序列、其片段或结构域相比至少约65%同一性,特别地约 80%同一性,特别地90%,以及更特别地至少约95%序列同一性。
在一个实施方案中,与SEQ ID NO: 1的核苦酸序列、其片段或结构 域具有基本相似性的序列来自植物。在一个具体的实施方案中,这种植物 是双子叶植物。在一个更具体的实施方案中,这种双子叶植物是选自大 豆、烟草或棉花。在另一个具体的实施方案中,这种植物是棵子植物。在 另一个具体的实施方案中,这种植物是单子叶植物。在一个更具体的实施 方案中,这种单子叶植物是谷物。在一个更具体的实施方案中,这种谷物 可以是(例如)玉米、小麦、大麦、燕麦、棵麦(rye)、栗、高粱(sorghum)、 黑小麦(triticale)、黑麦属(secale)、单粒小麦(einkorn)、斯佩耳特小麦(spelt)、 双粒小麦(emmer)、画眉草(teff)、蜀黍(milo)、亚麻、格兰马草(gramma grass)、磨擦草属物种(Tripsacum sp.)和玉米草(teosinte)。在一个实施方案中,该核酸表达于植物的特定位置或组织中。该位置 或组织是(例如,但不限于)表皮、根、维管组织、分生组织、形成层、 皮层、髓、叶和花。在一个备选的实施方案中,该位置或组织是种子。在 另一个实施方案中,该核酸编码了多肽,该多肽涉及功能,例如但不限于, 碳、氮和/或硫代谢,氮利用、氮同化作用、光合作用、信号转导、细胞生 长、繁殖、疾病抗性、非生物胁迫耐受性、营养组成、基因调节、和/或分 化。
在一个具体的实施方案中,这种分离的核酸包括核苷酸序列或由其构
成,该核苷酸序列能够与SEQ ID NO: 1中所列出的核苷酸序列或其片段 或结构域进行杂交。在一个具体的实施方案中,杂交使该序列在中度或高 度严格性的条件下形成一个双链体。本发明的实施方案还涵盖了核普^ 列,该核苷酸序列与SEQ ID NO: 1的核苷酸序列或其片段或结构域互补。 本发明的实施方案进一步涵盖了核苷酸序列,该核苷酸序列互补于与SEQ ID NO: 1的核香酸序列或其片段或结构域具有基本相似性或能够与其进行 杂交的核苷酸序列。
在一个具体的实施方案中,具有基^目似性的核苷酸序列是SEQ ID NO: l的核苷酸序列、其片段或结构域的等位基因的变体。在一个备选的 实施方案中,具有基本相似性的序列是天然存在的变体。在另一个备选的 实施方案中,具有基^f目似性的序列是SEQ ID NO: 1的核苦酸序列或其 片段或结构域的多态变体。
在一个具体的实施方案中,这种分离的核酸包含多个区域,这些区域 具有SEQ ID NO: 1的核普酸序列或其外显子或结构域。
在一个具体的实施方案中,这种分离的核酸包含多肽的编码序列。在
一个更具体的实施方案中,这种多肽的编码序列包含20个g对的核苷酸 部分,该部分在序列上与SEQ ID NO:l的核酸序列的一个连续的20个碱 基对核苷酸部分相同。在一个更具体的实施方案中,这种多肽包含SEQID NO: 2的多肽序列、或其片段。在一个更具体的实施方案中,这种多肽是 植物多肽。在一个更具体的实施方案中,这种植物是双子叶植物。在一个
21更具体的实施方案中,这种植物是棵子植物。在一个更具体的实施方案中, 这种植物是单子叶植物。在一个更具体的实施方案中,这种单子叶植物是 谷物。在一个更具体的实施方案中,这种谷物可以是(例如)玉米、小麦、
大麦、燕麦、棵麦(rye)、粟、高粱(sorghum)、黑小麦(triticale)、黑麦属 (secale)、单粒小麦(einkorn)、斯佩耳特小麦(spelt)、双粒小麦(emmer)、画 眉草(teff)、蜀黍(milo)、亚麻、格兰马草(gramma grass )、 磨擦草属物 种(Tripsacum sp.)和玉米草(teositne)。
在一个实施方案中,这种多肽表达于整个植物中。在一个更具体的实 施方案中,这种多肽表达于植物的特定位置或组织中。在一个更具体的实 施方案中,该位置或组织可以是(例如)表皮、根、维管组织、分生组织、 形成层、皮层、髓、叶和花。在一个最具体的实施方案中,该位置或组织 是种子。
在一个具体的方案中,该分离的核酸的序列编码了多肽,该多肽可用 于产生抗体,该抗体具有针对由SEQ ID NO: 2的核苷酸序列、或其片段 或结构域所编码的多肽的免M应性。
在一个具体的实施方案中,具有基^目似性的序列包含至少一个核苷
酸的缺失或插入。在一个更具体的实施方案中,这种缺失或插入小于约三 十个核苷酸。在一个最具体的实施方案中,这种缺失或插入小于约五个核 苷酸。
在一个具体的实施方案中,具有基;M目似性的分离的核酸的序列包含 至少一个密码子的取代或由其构成。在一个具体的实施方案中,这种取代 是保守性的。
本发明的实施方案还涉及分离的核酸分子,该分离的核酸分子包括以 下序列是由其构成核普酸序列、它的互补序列、或它的反向互补序列, 所述序列编码了多肽,该多肽包括
(a) SEQ ID NO: 2的多肽序列,或它的片段、结构域、重复、或嵌
合体;
(b) 与(a)具有基本相似性的多肽序列;(C)多肽序列,所述多肽序列由核苷酸序列进行编码,该核苷酸序列
与SEQ ID NO: 1中的核苷酸序列、或其片段或结构域、或与它互补的序 列,相同或具有基本相似性;
(d) 多肽序列,该多肽序列由核苷酸序列进行编码的,该核苷*列 能够在中度严格性条件下与SEQ ID NO: 1的核苷酸序列或与之互补的序 列进行杂交;或者
(e) (a)、 (b)、 (c)或(d)的功能片段。
在另 一个具体的实施方案中,具有基本相似性的多肽是SEQ ID NO: 2 的多肽序列、或其片段、结构域、重复或嵌合体的等位变体。在另一个具 体的实施方案中,这种分离的核酸包括多个区域,这些区域来自多肽序列, 该多肽序列由核苷酸序列进行编码,该核苷酸序列与SEQ ID NO: 1的核 苷酸序列、或它的片段或结构域、或与它互补的序列相同或具有基本相似 性。
在另一个具体的实施方案中,这种多肽是SEQIDNO: 2的多肽序列。 在另一个具体的实施方案中,这种多肽是功能片段或结构域。在又另一个 具体的实施方案中,这种多肽是嵌合体,其中该嵌合体可包括功能性蛋白 质结构域,包括结构域、重复、翻译后修饰位点、或其他特征。在一个更 具体的实施方案中,这种多肽是植物多肽。在一个更具体的实施方案中, 这种植物是双子叶植物。在一个更具体的实施方案中,这种植物是棵子植 物。在一个更具体的实施方案中,这种植物是单子叶植物。在一个更具体 的实施方案中,这种单子叶植物是谷物。在一个更具体的实施方案中,这 种谷物可以是(例如)玉米、小麦、大麦、燕麦、棵麦(rye)、粟、高粱(sorghum)、 黑小麦(triticale)、黑麦属(secale)、单粒小麦(dnkorn)、斯佩耳特小麦(spelt)、 双粒小麦(emmer)、画眉草(teff)、蜀黍(milo)、亚麻、格兰马草( gramma grass)、磨擦草属物种(Tripsacum sp.)和玉米草(teosinte)。
在一个具体的实施方案中,这种多肽表达于植物的特定位置或組织中。
在一个更具体的实施方案中,该位置或组织可以是(例如)表皮、根、维 管组织、分生组织、形成层、皮层、髓、叶和花。在另一个具体的实施方案中,该位置或组织是种子。
在一个具体的实施方案中,这种多肽序列由核苷酸序列进行编码,该
核苷酸序列与SEQ ID NO: 1的核苷酸序列或其片段或结构域或与它互补 的序列具有基本相似性;所述多肽序列包括至少一个核苷酸的缺失或插入。 在一个更具体的实施方案中,这种缺失或插入小于约三十个核苷酸。在一 个最具体的实施方案中,这种缺失或插入小于约五个核苷酸。
在一个具体的实施方案中,多肽序列由核苷酸序列进行编码,该核苷
酸序列与SEQ ID NO: 1的核苷酸序列、或其片段或结构域、或与它互补 的序列具有基本相似性;该多肽序列包括至少一个密码子的取代。在一个 更具体的实施方案中,这种取代是保守性的。
在一个具体的实施方案中,与SEQ ID NO: 2的多肽序列、或它的片 段、结构域、重复、或嵌合体具有基本相似性的多肽序列包括至少一个氨 基酸的缺失或插入。
在一个具体的实施方案中,与SEQ ID NO: 2的多肽序列、或它的片 段、结构域、重复、或嵌合体具有基本相似性的多肽序列包括至少一个氨 基酸的取代。
本发明的实施方案还涉及改组的核酸,该改组的核酸包含多个核苷酸 序列片段,其中这些片段中的至少一个对应于SEQ ID NO: 1的核苷, 列的区域,并且其中这些多个序列片段中的至少两个处于从5,到3,的顺序, 该顺序不是这些多个片段在核酸中天然存在的顺序。在一个更具体的实施 方案中,在包含多个核苷,列片段的改组的核酸中的所有片段均来自单 一基因。在一个更具体的实施方案中,这些多个片段源自至少两个不同的 基因。在一个更具体的实施方案中,这种改组的核酸被有效连接至启动子 序列上。另一个更具体的实施方案是嵌合的多核苷酸,该多核苷酸包括有 效连接至该改组的核酸的启动子序列。在一个更具体的实施方案中,这种 改组的核酸包含于宿主细胞之内。
本发明的实施方案还考虑了表达盒,该表达盒包括启动子序列,该启 动子序列有效连接至分离的核酸上,该分离的核酸包含核苷酸序列,该核苷酸序列包括
(a) SEQ ID NO: 1的核香^列或其片段或结构域;
(b) 编码SEQIDNO:2的多肽的核苷酸序列、其片段或结构域;
(c) 与(a)或(b)具有基本相似性的核苷酸序列;
(d) 能够与(a)、 (b)或(c)进行杂交的核苷酸序列;
(e) 与(a)、 (b)、 (c)或(d)互补的核苷酸序列;或
(f) 核苷酸序列,它是(a)、 (b)、 (c)或(d)的反向互补序列。 进一步涵盖于本发明之内的是重组载体,该重组栽体包括根据本发明
的实施方案的表达盒。还涵盖了根据本公开的包含表达盒的植物细胞,以 及包含这些植物细胞的植物。在一个具体的实施方案中,这种植物是双子 叶植物。在一个更具体的实施方案中,这种双子叶植物是选自大豆、烟 草或棉花。在另一个具体的实施方案中,这种植物是棵子植物。在另一个 具体的实施方案中,这种植物是单子叶植物。在一个更具体的实施方案中, 这种单子叶植物是谷物。在一个更具体的实施方案中,这种谷物可以是(例 如)玉米、小麦、大麦、燕麦、棵麦(rye)、栗、高粱(sorghum)、黑小麦(triticale)、 黑麦属(secale)、单粒小麦(einkorn)、斯佩耳特小麦(spelt)、双粒小麦 (emmer)、画眉草(teff)、蜀黍(milo)、亚麻、格兰马草(gramma grass)、 磨擦草属物种(Tripsacum sp.)和玉米草(teosinte)。
在一个实施方案中,这种表达盒表达于整个植物中。在另一个实施方 案中,这种表达盒表达于植物的特定位置或组织中。在一个具体的实施方 案中,该位置或組织可以是(例如)表皮、根、维管組织、分生组织、形 成层、皮层、髓、叶和花。在一个备选的具体的实施方案中,该位置或组 织是种子。
在一个实施方案中,这种表达盒涉及功能,例如但不限于,碳、氮和/ 或硫代谢,氮利用、氮同化作用、光合作用、信号转导、细胞生长、繁殖、 疾病抗性、非生物胁迫耐受性、营养组成、基因调节、和/或分化。在一个 更具体的实施方案中,这种嵌合的多肽涉及功能,例如氮利用、非生物胁 迫耐受性、增强的产量、疾病抗性和/或营养組成。在一个实施方案中,这种植物包含针对植物的表型或可测量的特性的 修饰,该修饰可归因于表达盒中所包含的至少一个基因的表达。在一个具 体的实施方案中,这种修饰可以是(例如)碳、氮和/或疏代谢,氮利用、 氮同化作用、光合作用、信号转导、细胞生长、繁殖、疾病抗性、非生物 胁迫耐受性、营养组成、基因调节、和/或分化。
本发明的实施方案还提供了种子以及从植物分离出的产物,它们包含 表达盒,该表达盒包括启动子序列,该启动子序列有效连接至分离的核酸
上,该分离的核酸包含核苷酸序列,该核苦酸序列包括
(a) SEQID NO: 1的核普^列或其片段或结构域;
(b) 编码SEQ ID NO:2的多肽的核普酸序列、其片段或结构域;
(c) 与(a)或(b)具有基本相似性的核苷酸序列;
(d) 能够与(a)、 (b)或(c)进行杂交的核苷酸序列;
(e) 与(a)、 (b)、 (c)或(d)互补的核苷酸序列;或
(f) 核苷酸序列,它是根据本公开的(a)、 (b)、 (c)或(d)的反向互 补序列。
在一个具体的实施方案中,分离的产物包括酶、营养蛋白质、结构蛋 白质、氨基酸、脂类、脂肪酸、多糖、糖、醇、生物碱、类胡萝卜素、丙 素(propanoic!)、类固醇、色素、维生素以及植物激素。
本发明的实施方案还涉及分离的产物,这些分离的产物通过分离的核 酸的表达而产生,该分离的核酸包含核苷酸序列,该核苦酸序列包括
(a) SEQIDNO: 1的核苷^列、或其片段或结构域;
(b) 编码SEQ ID NO:2的多肽的核苷酸序列、或其片段或结构域;
(c) 与(a)或(b)具有基本相似性的核苷酸序列;
(d) 能够与(a)或(b)进行杂交的核苷酸序列;
(e) 与(a)、 (b)、 (c)或(d)互补的核苷,列;或
(f) 核苷酸序列,它是根据本乂^开的(a)、 (b)、 (c)或(d)的反向互 ^卜序列。
在一个具体的实施方案中,这种产物在植物中产生。在另一个具体的实施方案中,这种产物在细胞培养物中产生。在另一个具体的实施方案中, 这种产物在无细胞的系统中产生。在另一个具体的实施方案中,这种产物 包括酶、营养蛋白质、结构蛋白质、氨基酸、脂类、脂肪酸、多糖、糖、 醇、生物碱、类胡萝卜素、丙素、类固醇、色素、维生素以及植物激素。
在一个具体的实施方案中,这种产物是包含SEQ ID NO: 2的氨基酸 序列的多肽。在一个更具体的实施方案中,这种蛋白是转录因子。
本发明的实施方案进一步涉及分离的多核苷酸,该分离的多核苷酸包 括具有至少10个碱基的核苷酸序列,该序列与SEQ ID NO: 1的任何序列 的区域相同、互补、或基本相似,并且其中该多核苷酸适于许多用途中的 任何。
在一个具体的实施方案中,这种多核苷酸作为染色体标记物而使用。 在另一个具体的实施方案中,这种多核苷酸作为RFLP分析的标记物而使 用。在另一个具体的实施方案中,这种多核苷酸作为数量性状关联育种的 标记物而使用。在另一个具体的实施方案中,这种多核苷酸作为标记物辅 助育种的标记物而使用。在另一个具体的实施方案中,这种多核苷酸作为 双杂交系统中的一个钓饼(bait)序列而使用,以鉴定多肽的编码序列,所述 多肽与由该钓斜序列所编码的多肽进行相互作用。在另 一个具体的实施方 案中,这种多核苷酸用作为基因分型或鉴定个体或个体的群体的诊断性指 示物。在另一个具体的实施方案中,这种多核苷酸用于遗传分析以鉴定基 因或外显子的边界。
本发明的实施方案还涉及表达载体,该表达载体包括核酸分子或由其 构成,该核酸分子包括
(a) 编码如SEQ ID NO:2中所列出的多肽的核酸;
(b) SEQ ID NO: 1的片段、 一个或多个结构域域、或特征性区域;

(c) 与异源序列相组合的在SEQ ID NO:l中所列出的完整的核^ 列、或它的片段。
在一个具体的实施方案中,表达载体包含一个或多个元件,例如但不
27限于启动子增强子序列、选择标记物序列、复制起点、表位标签编码序列, 或亲和纯化标签编码序列。在一个更具体的实施方案中,启动子增强子序
列可以是例如CaMV35S启动子、CaMV 19S启动子、烟草PR-la启动子、 遍在蛋白和菜豆蛋白启动子。在另一实施方案中,启动子可在植物中工作, 更特别地为組成型或诱导性启动子。在另一具体的实施方案中,选择标记 物序列编码抗生素抗性基因。在另一具体的实施方案中,表位标签序列编 码V5、肽Phe-His-His-Thr-Thr、血凝素或谷胱甘肽-S-转移酶。在另一具 体的实施方案中,亲和纯化标签序列编码多聚M酸序列或多肽。在一个 更具体的实施方案中,多聚M酸序列为多聚组氨酸。在一个更具体的实 施方案中,多肽是壳多糖结合结构域或谷胱甘肽-S-转移酶。在一个更具体 的实施方案中,亲和纯化标签序列包含内含肽编码序列。
在一个具体的实施方案中,表达载体是真核生物表达载体或原核生物
表达载体。在一个更具体的实施方案中,真核生物表达载体包含组织特异 的启动子。更特别地,表达载体可在植物中工作。
本发明的实施方案还涉及包含核酸构建体或由其组成的细胞,所述核 酸构建体包含表达载体和与异源序列組合的下述核酸,所述核酸包括编 码SEQ ID NO: 2所列多肽的核酸,或SEQ ID NO:l所列的核酸,或其区 段。
在一个具体的实施方案中,细胞是细菌细胞、真菌细胞、植物细胞或 动物细胞。在一个具体的实施方案中,细胞是植物细胞。在一个更具体的 实施方案中,多肽在植物的特异位置或组织中表达。在一个最具体的实施 方案中,该位置或组织可以是例如表皮、根、维管组织、分生组织、形成 层、皮层、髓、叶和花。在备选的最具体的实施方案中,该位置或组织是 种子 在一个具体的实施方案中,多肽涉及下述功能,例如碳、氮和/或硫 代谢、氮利用、氮同化作用、光合作用、信号转导、细胞生长、繁殖、疾 病抗性、非生物胁迫耐受性、营养组成、基因调控和/或分化。
本发明的实施方案还涉及由本公开的分离的核酸分子所编码的多肽, 这些多肽包括下述多肽,该多肽包含多肽序列,该多肽序列由分离的核酸进行编码,该分离的核酸包含核普酸序列,该核苦酸序列包括
(a) SEQ ID NO: 1中所列出的核苷酸序列、或其外显子或结构域;
(b) 与(a)具有基本相似性的核苷酸序列;
(c) 能够与(a)杂交的核苷酸序列;
(d) 与(a)、 (b)、或(c)互补的核苷酸序列;或
(e) 核苷酸序列,它是(a)、 (b)、或(c)的反向互补序列;
(f) 或其功能片段,
多肽,该多肽包含由分离的核酸编码的多肽序列,该分离的核酸包 含核苷酸序列、它的互补序列、或它的反向互补序列,它们编码包括多肽 序列的多肽,所述多肽序列包括
(a) SEQ ID NO: 2中所列出的多肽序列,或其结构域、重复、或嵌
合体;
(b) 与(a)具有基本相似性的多肽序列;
(c) 多肽序列,该多肽序列由核苷酸序列进行编码,该核苷酸序列与 SEQ ID NO: 1所列出的核苷酸序列、或其外显子或结构域、或与它互补的 序列相同或具有基本相似性;
(d) 多肽序列,该多肽序列由核苷酸序列进行编码,该核苷酸序列能 够在中度严格性条件下与在SEQ ID NO: 1所列出的核苷^列或与之互 补的序列进行杂交;或
(e) (a)、 (b)、 (c)或(d)的功能片段;
(f) 或其功能片段。
本发明的实施方案考虑了多肽,该多肽包含多肽序列,该多肽序列由 分离的核酸进行编码,该分离的核酸包括改组的核酸,该改组的核酸包含 多个核苷,列片段,其中这些片段中的至少一个对应于SEQ ID NO: 1 所列出的核普,列的区域,并且其中这些多个序列片段中的至少两个处 于从5,到3,的顺序,该顺序不是这些多个片段在核酸中、或核酸的功能片 段中天然存在的顺序。
本发明的实施方案考虑了多肽,该多肽包含多肽序列,该多肽序列由分离的多核苷酸进行编码,该分离的多核苦酸包含具有至少10个g的核 苷酸序列,该序列与SEQ ID NO: 1的序列或其功能片段中的任何区域、 相同、互补、或基本上相似,并且其中该多核苷酸适于下述用途,包括
(a)作为染色体标记物用于鉴定天然或人工染色体上相应或互补的多 核普酸位置的用途;
(b) 作为RFLP分析标记物的用途;
(c) 作为数量性状关联育种的标记物的用途;
(d) 作为标记物-辅助育种的标记物的用途;
(e) 作为钓辨序列在双杂交体系中用于鉴定编码多肽的序列的用途,所 迷多肽与钓辨序列编码的多肽相互作用;
(f) 作为对个体或个体群进行基因分型或鉴定的诊断指示物的用途;或
(g) 用于鉴定基因或外显子边界的遗传分析的用途。
本发明的实施方案还考虑了分离的多肽,该分离的多肽包含多肽序列, 该多肽序列包括
(a) SEQ ID NO: 2所列出的多肽序列、或它的外显子或结构域;
(b) 与(a)具有基本相似性的多肽序列;
(c) 多肽序列,该多肽序列由核苷酸序列进行编码,该核苷酸序列与 SEQ ID NO: 1的核苷酸序列、或其外显子或结构域、或与它互补的序列相 同或具有基本相似性;
(d) 多肽序列,该多肽序列由核苷酸序列进行编码,该核苷酸序列能 够在中度严格性M下与SEQ ID NO: 1中所列出的核苷,列、或与其 互补的序列进行杂交;或
(e) (a)、 (b)、 (c)或(d)的功能片段。 在一个具体的实施方案中,这种基^目似性是至少约65%的同一性。
在一个更具体的实施方案中,这种基本相似性是至少约80。/。的同一性。在 一个最具体的实施方案中,这种基^目似性是至少约95%的同一性。在一 个具体的实施方案中,这种基本相似性与序列表中的任何一个所列出的最 接近的同源序列的百分比同 一性相比至少大出三个百分点。
30在一个具体的实施方案中,具有基^目似性的序列来自植物。在一个 更具体的实施方案中,这种植物是双子叶植物。在一个更具体的实施方案 中,这种植物是棵子植物。在一个更具体的实施方案中,这种植物是单子 叶植物。在一个更具体的实施方案中,这种单子叶植物是谷物。在一个更 具体的实施方案中,这种谷物可以是(例如)玉米、小麦、大麦、燕麦、
棵麦(rye)、粟、高粱(sorghum)、黑小麦(triticaie)、黑麦属(secale)、单粒 小麦(einkorn)、斯佩耳特小麦(spelt)、双粒小麦(emmer)、画眉草(teff)、蜀 黍(milo)、亚麻、格兰马草 、gramma grass )、磨擦草属物种(Tripsacum sp.)和玉米草(teosinte)。
在一个具体的实施方案中,多肽表达于植物的特定位置或组织中。在
一个更具体的实施方案中,这种位置或组织可以是(例如)表皮、根、维 管组织、分生组织、形成层、皮层、髓、叶、和花。在另一个具体的实施 方案中,这种位置或组织是种子。在一个具体的实施方案中,这肽涉及功 能,例如碳、氮和/或硫代谢、氮利用、氮同化作用、光合作用、信号转导、 细胞生长、繁殖、疾病抗性、非生物胁迫耐受性、营养组成、基因调节、 和/或分4t。
在一个具体的实施方案中,以下多肽序列的杂交使该序列在中度或高 度严格条件下形成双链体,所述多肽序列由核普酸序列进行编码,该核苷 酸序列与SEQ ID NO: 1中所列出的核苷酸序列、或其外显子或结构域、 或与它互补的序列相同或具有基本相似性;或者所述多肽序列由核苷^ 列进行编码,该核苷酸序列在中度严*件下能够与SEQ ID NO: 1中所 列出的核苷酸序列、或与其互补的序列进行杂交。
在一个具体的实施方案中,与SEQ ID NO: 2中所列出的多肽序列、 或其外显子或结构域具有基本相似性的多肽是SEQ ID NO: 2中所列出的 多肽序列的等位变体。在另一个具体的实施方案中,与SEQ ID NO: 2中 所列出的多肽序列、或其外显子或结构域具有基本相似性的多肽是SEQ ID NO: 2中所列出的多肽序列的天然存在的变体。在另一个具体的实施方案 中,与SEQ ID NO: 2中所列出的多肽序列、或其外显子或结构域具有基本相似性的多肽是SEQ ID NO: 2中所列出的多肽序列的多态变体。
在一个备选的具体实施方案中,具有基^目似性的序列包含至少一个 氨基酸的缺失或插入。在一个更具体的实施方案中,这种缺失或插入小于 约十个氨基酸。在一个最具体的实施方案中,这种缺失或插入小于约三个 氨基酸。
在一个具体的实施方案中,具有基本相似性的序列编码了至少一个氨 基酸中的取代。
还包括生产包^^饰的植物的方法,其包括步骤(l)提供核酸,其为 含有核苷酸序列的分离的核酸,所述核苷酸序列包括
(a) 如SEQ ID NO:l所示的核苷酸序列,或其外显子或结构域,
(b) 与(a)具有基W目似性的核苷酸序列;
(c) 能够与(a)杂交的核苷酸序列;
(d) 与(a)、 (b)或(c)互补的核苷酸序列;或
(e) 是(a)、 (b)或(c)的反向互补序列的核苷酸序列; 和(2)将核酸引入植物,其中所述核酸在所述植物中以有效影响修饰的
量表达。在一个实施方案中,修饰包括植物中改变的特性,其中所述特性 对应于#_引入植物的核酸。在其他具体的实施方案中,该特征对应于碳、 氮和/或石克代谢、氮利用、氮同化作用、光合作用、信号转导、细胞生长、 繁殖、疾病抗性、非生物胁迫耐受、营养组成、基因调节和/或分化。
在另一实施方案中,修饰包括提高或降低的表达,或植物产物的累积。 特别地,该产物是植物的天然产物。同等特别地,该产物是植物的新产物 或改变的产物。特别地,该产物包括GATA转录因子。
本文公开的发明还包括制备重组蛋白质的方法,其包括步骤
(a) 在合适的培养条件下培养包含核酸构建体的重組细胞,所述构建体 包含表达载体和核酸,所述核酸包括编码如SEQ ID NO: 2所示蛋白质 的核酸,或SEQIDNO:l所示核酸序列,或其区段;和
(b) 从重组细胞中分离其表达的重組蛋白质。
本发明的实施方案提供了制备重组蛋白质的方法,其中表达载体包含一个或多个元件,包括启动子增强子序列、选择标记物序列、复制起点、 表位标签编码序列,和亲和纯化标签编码序列。在一个具体的实施方案中, 核酸构建体包含表位标签编码序列,且分离步骤包括使用对该表位标签特 异的抗体。在另一具体的实施方案中,核酸构建体含有多聚氨基酸编码序 列,且分离步骤包括使用包含多聚氨基酸结合物质的树脂,特别是其中多 聚氨基酸为多聚組氨酸且多聚氨基酸结合树脂为镍-带电琼脂糖树脂。在另 一具体的实施方案中,核酸构建体含有多肽编码序列,且分离步骤包括4吏 用含多肽结合物质的树脂,特别是当多肽为壳多糖结合结构域且树脂含有
壳多糖-琼脂糖凝胶(sepharose)时。
本发明的实施方案还涉及通过下述方法修饰的植物,所述方法包括向 植物中引入核酸,其中该核酸可在植物中以有效影响修饰的量表达。该修 饰可以是例如碳、氮和/或硫代谢、氮利用、氮同化作用、光合作用、信号 转导、细胞生长、繁殖、疾病抗性、非生物胁迫耐受、营养组成、基因基 因调节和/或分化。在一个实施方案中,经修饰的植物具有对除草剂、胁迫 或病原体的提高或降低的抗性。在另一实施方案中,经修饰的植物具有对 光、水、氮或痕量元素的增加或减轻的需求。在另一实施方案中,以植物 蛋白质级分的比例计,经修饰的植物富含必需氨基酸。该蛋白质级分可以 是例如总种子蛋白、可溶蛋白质、不溶蛋白质、可用7j^取的蛋白质和脂 质结合蛋白质。修饰可包括基因的过量表达、低表达、反义调节、有义阻 抑、诱导性表达、诱导性阻遏、或诱导性调节。
本发明还涉及来自经修饰的植物的种子,或经修饰的植物的分离产物, 其中该产物可以是酶、营养蛋白质、结构蛋白质、氨基酸、脂质、脂肪酸、 多糖、糖、醇、生物碱、类胡萝卜素、丙素(propanoic!)、类固醇、色素、 维生素和植物激素。
上述"发明概述,,列举了本发明的若干个实施方案,并且在许多情况 下列举了这些实施方案的变更和置换。该概述仅是大量和变化的实施方案 的示例。提到给定实施方案的一个或多个特别特征同样是示例性的。 一般 可存在具有或不具有所述一个或多个特征的这样的实施方案;同样,这些特征可应用于本发明的其他实施方案,无论所述实施方案在概述中是否列 出。为了避免过度重复,该概述不列举或提出这类特征的所有可能的组合。 为了概述本发明和达到的超出现有技术的优点,上文已描述了本发明 的某些目标和优点。当然,应当理解对本发明的任何具体的实施方案而言, 不必须达到所有这些目标和优点。因此,例如本领域技术人员会知道本发 明可以以下述方式进行,所迷方式达到或最优化本文教导的一个优点或一
组优点,而不必须达成本文可教导或提出的其他目标或优点。
下面具体实施方案的详细描述使得本发明的其他方面、特征和优点变
得显而易见。


图1和SEQ ID NO: 1示出了全长OsGATAll的核斷列。
图2和SEQ ID NO: 2示出了 OsGATAll的^J^紗列。
图3示出了 At4g26150的^^^f列(SEQ ID NO: 7)与它的稻直
向同源物OsGATAll (SEQ ID NO: 2)的比对。
图4A和4B示出了过量表达OsGATAll的植物的表型。 图5A和B示出了受^fG^7ML 基因的表达所影响的叶绿素水平。 图6A和B示出了过量表达OsGATAll的植物的种子产量。 图7是一些图片,这些图片示出了过量表达0sO47ML 的植物中对
胁迫更强的抗性。
图8是一些图,这些图示出了糖积累是如何通过调节OsGATAll的
表达而受到影响的8A:葡萄糖水平;8B:果糖水平;8C:蔗糖水平。
图9是一些图,这些图示出了在OsGATAll转基因植物中氮状况如
何受到调节9A:硝酸盐水平;9B:氨基酸水平;9C:蛋白质氷平。
定义
为了清楚起见,如下定义说明书中使用的某些术语 "关联/有效连接"是指两条核酸序列物理上或功能上相关联。例如,
34如果启动子或调节DNA序列与编码RNA或蛋白质的DNA序列有效连接, 或位置使得调节DNA序列会影响编码或结构DNA序列的表达水平,则该 启动子或调节DNA序列4皮称作与该DNA序列"关联"。
"嵌合构建体"是重组的核酸序列,其中启动子或调节核酸序列与核 酸序列(所述核酸序列编码mRNA或被表达为蛋白质)有效连接或关联, 使得调节核酸序列能够调节关联的核酸序列的转录或表达。嵌合构建体的 调节核酸序列通常不与天然发现的关联的核酸序列有效连接。
"辅因子"是酶催化的反应中所需的天然反应物,如有机分子或金属 离子。辅因子为例如NAD(P)、维生素B2 (包括FAD和FMN)、叶酸、 钼蝶呤、维生素B"thiamin)、生物素、硫辛酸、泛酸和辅酶A、 S-腺苦甲 硫氨酸、吡哆醛磷酸、泛醌、甲基萘醌类。任选地,辅因子可以再生和再 使用。
"编码序列"是被转录为RNA如mRNA、 rRNA、 tRNA、 snRNA、 有义RNA或反义RNA的核酸序列。特别地,该RNA随后在生物中被翻 译产生蛋白质。
互补的"互补的"是指包含反向平行核苷酸序列的两条核苷酸序列, 其能够通过在反向平行的核苷酸序列中互补的碱基残基之间形成氩键而彼 此配对。
酶活性在本文中表示酶催化底物转化为产物的能力。酶的底物包括 酶的天然底物,但是也包括天然底物的类似物,所迷类似物也可以被酶转 化为产物或转化为产物的类似物。例如通过测定某时间段后反应中的产物 量,或通过测定某时间《^反应混合物中剩余的底物量来测量酶活性。还
过测定某时间段后反应混合物中使用的辅因子的量来测量酶活性。还通过 测定某时间段后反应混合物中剩余的自由能供体或能量富集分子(例如 ATP、磷酸烯醇丙酮酸、乙酰磷酸或磷酸肌酸)的量,或通过测定某时间 段后反应混合物中使用的自由能供体或能量富集分子(例如ADP、丙酮酸、 乙酸或肌酸)的量来测量酶活性。表达盒本文使用的"表达盒"表示能够指导具体核苷酸序列在适当 宿主细胞组中表达的核酸分子,其包含与目的核苷酸序列有效连接的启动 子,所述目的核苷酸序列与终止信号有效连接。其一般还包含正确翻译核 普酸序列所需的序列。编码区通常编码目的蛋白质,但是也可编码有义或 反义方向上的目的功能性RNA,例如反义RNA或非翻译的RNA。包含目 的核苷酸序列的表达盒可以是嵌合的,这表示其至少一个组件对于其至少 另一个组件而言是异源的。表达盒也可以是下a达盒,所a达盒是天 然存在的,但是以适用于异源表达的重组形式获得。然而,表达盒相对于 宿主一般是异源的,即表达盒的具体DNA序列在宿主细胞中天然不存在, 并且必须已通过转化事件被引入宿主细胞或宿主细胞的祖先中。表达盒中 核苷酸序列的表达可以位于组成型启动子或诱导性启动子的控制下,所述 诱导性启动子仅在所述宿主细胞暴露于一些具体的外部刺激时起始转录。 在多细胞生物如植物的情况下,启动子也可以对具体的組织或器官或发育 阶段是特异的。
本文与核酸或蛋白质序列相关使用的术语"功能片段"表示保留全长 序列功能的序列片段或部分。
基因术语"基因"被广泛用于表示与生物学功能相关联的任何DNA 区段。因此,基因包括编码序列和/或其表达所需的调节序列。基因还包括 非表达的DNA区段,例如形成其他蛋白质的识别序列的DNA区段。基因 可得自多种来源,包括从目的来源克隆或从已知或预测的序列信息合成, 并可包括被设计为具有期望参数的序列。
异源的/外源的术语"异源的"和"外源的"在本文中涉及核酸序列 (例如DNA序列)或基因使用时表示来自具体宿主细胞的外部来源,或 如果来自相同来源时,表示对其原始形式进行了修饰。因此,宿主细胞中 的异源基因包括对具体宿主细胞是内源的,但是已通过例如DNA改组的 使用进行了修饰的基因。该术语还包括天然存在的DNA序列的非天然存 在的多个拷贝。因此,该术语是指对细胞是外源或异源的DNA区段,或 对细胞是同源的但是位于宿主细胞核酸中下迷位置的DNA区段,该元件通常不存在于所述位置。表达外源DNA区段得到外源多肽。
"同源,,核酸(例如DNA )序列是与引入该序列的宿主细胞天然关联 的核酸(例如DNA)序列。
杂交短语"与……特异杂交"是指在严格性条件下,当下述序列存 在于复杂混合物(例如总细胞)DNA或RNA中时, 一个分子只与该真体 核苷酸序列结合、形成双链体或杂交。"基本结合,,是指探针核酸和耙核 酸之间包含小量错配的互补杂交,可以通过降低杂交介质的严格性来调节 所述错配,以达到耙核酸序列的期望检测。
抑制剂使蛋白质如生物合成酶、受体、信号转导蛋白质、结构基因 产物或运输蛋白的酶活性失活的化学物质。在本文中使用术语"除草剂" (或"除草化合物")定义下述抑制剂,对任何发育阶段的植物应用该抑 制剂,藉此该除草剂抑制植物的生长或杀死植物。
相互作用相互作用的品质或状态使得一种蛋白质或化合物对另一种 蛋白质的有效性或毒性是抑制(拮抗剂)或增强(激动剂)的。
列时,该核酸序列与参考核酸序列是"同类编码"的。
等基因的在遗传上等同的植物,只是因为存在或不存在异源DNA 序列而不同。
分离的在本发明的上下文中,分离的DNA分子或分离的酶是通过 人的介入远离其天然环境并因此不是天然产物的DNA分子或酶。分离的 DNA分子或酶可以以纯化的形式存在,或可存在于非天然的环境中,例如 存在于转基因宿主细胞中。
成熟蛋白质其中转运肽、信号肽和/或前肽部分已被去除的蛋白质。
最小启动子可支持任何转录的最小的启动子部分,如TATA元件。 在缺失上游激活时,最小启动子一般具有被大幅降低的启动子活性。存在 合适的转录因子时,最小启动子发挥允许转录的作用。
修饰的酶活性与植物中天然存在的酶活性不同的酶活性(即在缺失 人对这类活性的直接或间接操作时天然存在的酶活性),其对抑制天然存在的酶活性的抑制剂耐受。
固有的(native):是指存在于未经转化的植物细胞基因組中的基因。
天然存在的术语"天然存在的,,用于描述可在自然中发现的物体, 其与由人人工生产的不同。例如,存在于生物体(包括病毒)中的蛋白质 或核苷酸序列是天然存在的,所述蛋白质或核苷酸序列可从天然来源分离, 并且未由人在实验室中有意地修饰。
核酸术语"核酸"是指脱氧核糖核苷酸或核糖核苷酸及其单链或双 链形式的多聚体。除非特别地限制,该术语包括含有天然核苷酸的已知类 似物的核酸,其与参考核酸具有类似的结合特性,并以类似于天然存在的 核苷酸的方式代谢。除非另有说明,具体的核酸序列还含蓄地包括其经保 守修饰(例如简并密码子取代)的变体和互补序列以及明确指出的序列。 特别地,可通过产生下述序列达成简并密码子取代,所述序列中一个或多 个选定的(或所有)密码子的第三个位置被混合性碱基和/或脱氧肌苷残基 取代(Batzer等,Nucleic Acid Res. 19: 5081 (1991); Ohtsuka等,J. Biol. Chem. 260: 2605-2608 (1985); Rossolini等,Mol. Cell. Probes 8: 91-98 (1994))。术语"核酸"或"核酸序列"也可与基因、cDNA和基因编码的 mRNA互换使用。
"ORF"表示可读框。
百分比同一性在两条核酸或蛋白质序列的上下文中,短语"百分比 同一性"或"百分比相同,,是指针对最大对应进行比较和比对时,具有例 如60%,特别是70%,更特别是80%,仍然更特别是卯%,进一步更特 别是95%和最特别是至少99%的核苷酸或氨基酸残基同一性的两条或多 条序列或亚序列(subsequence),其使用以下序列比较算法之一测量或通 过视觉检查测量。特别地,百分比同一性存在于长度为至少约50个残基的 序列区域中,更特别地存在于至少约100个残基的区域中,最特别地,百 分比同一性存在于至少约150个残基中。在一个特别特定的实施方案中, 百分比同 一性存在于编码区的全长中。
为了进行序列比较,通常一条序列发挥参考序列的作用,测试序列与该参考序列比较。使用序列比较算法时,将测试和参考序列输入计算机中,
如果需要的话指定亚序列坐标,并指定序列算法程序W:。序列比较算法 随后基于指定的程序参数计算测试序列相对于参考序列的序列同一性百分 比。
可例如通过Smith & Waterman, Adv. Appl. Math. 2: 482 (1981)的局 部同源性算法,通过Needleman & Wunsch, J. Mol. Biol. 48: 443 (1970)的 同源性比对算法,通过Pearson & Lipman, Proc. Nat'l. Acad. Sci. USA 85: 2444 (1988)的搜索相似性方法,通过这些算法的计算机化执行(Wisconsin Genetics软件包中的GAP、 BESTFIT、 FASTA和TFASTA, Genetics Computer Group, 575 Science Dr., Madison, WI)或通过视觉检查( 一般 参见Ausubel等,下文),对用于比较的序列进行最佳比对。
适用于测定序列同一性百分比和序列相似性百分比的算法的一个实例 是BLAST算法,其描述于Altschul等,J. Mol. Biol. 215: 403-410 (1990)中。 公众可通过 National Center for Biotechnology Information (http:〃www.ncbi.nlm.nih.gov/)获得运行BLAST分析的软件。该算法涉及 首先通过鉴定查询序列中长度为W的短字长(shortword)鉴定高分M 列对(HSP),所迷短字长与数据库序列中相同长度的字长比对时匹配或满 足一些正值的阈值分数T。 T是指邻域字长分数阈值(Altschul等,1990)。 这些初始的邻域字长匹配(hit)发挥起始下述搜索的种子的作用,所述搜索 寻找含有它们的更长的HSP。该字长匹配随后在两个方向上沿着各序列扩 展,直到累积的比对分数能够被提高为止。对核苷酸序列而言,使用参数 M(—对匹配残基的奖励分数;始终X))和N(错配残基的罚分;始终<0) 计算累积的分数。对氨基^f列而言,使用评分矩阵计算累积分数。当累 积的比对分数从其达到的最大值跌落数量X、累积的分数由于一个或多个 负分残基比对的累积而达到或低于零、或达到任一序列的末端时,停止字 长匹配在各方向上的扩展。BLAST算法参数W、 T和X确定比对的灵敏 度和速度。BLASTN程序(对核香酸序列而言)使用11的字长(W)、 10 的预期(E)、 100的截断、M=5、 N二4和两^:的比较作为默认值。对^i^
39酸序列而言,BLASTP程序使用3的字长(W)、 10的预期(E)和BLOSUM62 评分矩阵作为默认值(见Henikoff & Henikoff, Proc. Natl. Acad. Sci. USA 89: 10915 (1989))。
除了计算序列同一性百分比外,BLAST算法还在两个序列之间进行相 似性的统计学分析(见例如Karlin & Altschul, Proc. Nat,l. Acad. Sci. USA 卯5873-5787 (1993))。由BLAST提供的相似性的一种度量为最小概率 和(P(N)),其提供了两条核苷酸或氨基酸序列之间偶然发生匹配的概率的 指示。例如,如果在测试核酸序列与参考核酸序列的比较中,最小概率和 小于约O.l,更特别地小于约O.Ol,和最特别地小于约0.001,则认为测试 核酸序列与参考序列相似。
前蛋白质通常靶向细胞器(如叶绿体)并且仍包含其天然转运肽的 蛋白质。
纯化的应用于核酸或蛋白质时,术语"纯化的"表示核酸或蛋白质 基本上不含其他分子組件,所述分子组件在天然状态下与所迷核酸或蛋白 质相连。尽管其可以是干燥的或在水性溶液中,但是其特别地处于同质状 态(homogeneous state)。通常使用分析化学技术如聚丙烯酰胺凝胶电泳或 高效液相层析测定纯度和同质性。在制品中是优势种类的蛋白质是基本純 化的。术语"纯化的"表示核酸或蛋白质在电泳凝胶中基本上给出一个条 带。具体地,这表示核酸或蛋白质至少约50%纯净,更特别地至少约85。/。 纯净,和最特别地至少约99%纯净。
当来自两条核酸各自的序列在子代核酸中组合时,该两条核酸是"重 组的"。当核酸均为重组的底物时,这两条序列是"直接"重组的。当序 列使用中间体如交换(cross-over)寡核苷酸重组时,两条序列是"间接重组 的,,。对间接重组而言,不多于一条序列是重组的真实底物,并且在一些 情况下,序列均不是重组的底物。
"调节元件"是指涉及控制核苷酸序列表达的序列。调节元件包括与 目的核苷酸序列有效连接的启动子和终止信号。它们一般还包括核普^ 列适当翻译所需的序列。
40显著的提高大于测量技术中固有误差的限度的酶活性提高,特别是 在存在抑制剂时野生型酶活性提高约2倍或更大,更特别地提高约5倍或 更大,最特别地提高约10倍或更大。
显著更少表示酶反应的产物量^^减少得多于测量技术中固有误差的 限度,特别是在缺失抑制剂时野生型酶活性减少约2倍或更大,更特别地 减少约5倍或更大,最特别地减少约10倍或更大。
特异的结合/免疫交叉反应性两条核酸序列或蛋白质基本相同的指标 是第一核酸编码的蛋白质与由第二核酸编码的蛋白质免疫杂交反应或特异 结合。因此,例如当两个蛋白质仅由保守取代区别时,蛋白质一般与第二 蛋白质M^f目同的。涉及蛋白质或肽时,短语"与抗体特异(或选择性) 结合"或"与……特异(或选择性)免疫反应,,是指在存在蛋白质的异源 群体和其他生物制品时决定蛋白质存在的结合反应。因此,在指定的免疫 测定条件下,特定的抗体与具体的蛋白质结合,并且不以显著的量与样品 中存在的其他蛋白质结合。在这类条件下与抗体的特异结合可需要下述抗 体,所述抗体因其对具体蛋白质的特异性而被选择。例如,可选择针对下 述蛋白质产生的抗体获得与该蛋白质特异免疫反应而不与其他蛋白质(除 多态变体以外)特异免疫反应的抗体,所述蛋白质具有本发明的任何核酸 序列编码的氨基酸序列。可使用多种免疫测定方式选择与具体蛋白质特异 免疫反应的抗体。例如,常规地使用固相ELISA免疫测定、Western印迹、 或免疫组织化学选择与蛋白质特异免疫反应的单克隆抗体。可用于测定特 异免疫反应性的免疫测定方式和条件的描述见Harlow和Lane (1988) Antibodies, A Laboratory Manual, Cold Spring Harbor Publications, New York "Harlow and Lane")。特异或选择性的反应通常会是背景信号或噪音 的至少两倍,更通常是背景的多于10到IOO倍。
在核酸杂交实验如Southern和Northern杂交的语境中,"严格性杂 交条件"和"严格性杂交洗涤条件"是序列依赖性的,并在不同的环境参 数下不同。更长的序列在更高的温度下特异杂交。核酸杂交的广泛指南见 Tijssen (1993) Laboratory Techniques in Biochemistry and MolecularBiology-Hybridization with Nucleic Acid Probes, 第I部分第2章, "Overview of principles of hybridization and the strategy of nucleic acid probe assays" Elsevier, New York。 一般地,高严格性杂交和洗涤条件4皮选 择为比确定的离子强度和pH下特异序列的热解链温度(Tm)低约5X:。通 常在"严格性条件"下,探针会与其靶亚序列杂交,但不与其他序列杂交。
Tm是50%的耙序列与优选的匹配的探针杂交的温度(在确定的离子 强度和pH下)。非常严格的条件被选择为等于具体探针的Tm。在Southern 或Northern印迹的滤纸上用于互补核酸杂交的严格性杂交条件的实例是 42"C下含1 mg肝素的50%曱酰胺中过夜进行杂交,所述互补核酸具有多 于100个互补的残基。高度严格洗涤条件的实例是72。C下0.15M NaCl约 15分钟。严格洗涤条件的实例是65。C下0,2x SSC洗涤15分钟(SSC緩冲 液的描述见Sambrook,下文)。通常,在高严格性洗涤之前进行低严格 性洗涤,去除背景探针信号。用于例如多于100个核苷酸双链体的中严格 性洗涤的实例是45'C下lx SSC 15分钟。例如多于100个核苷酸双链体的 低严格性洗涤的实例是40"C下4-6x SSC 15分钟。对短探针(例如约10到 50个核苷酸)而言,严格M通常涉及在pH7.0到8.3下少于约l.OMNa 离子的盐浓度,通常约0.01到1.0MNa (或其他盐)离子浓度,而温度通 常至少约30'C。也可通过去稳定剂如甲酰胺的添加达到严格条件。 一般地, 是具体杂交实验中针对无关探针观察到的信噪比2倍(或更高)的信噪比 表示检测到特异杂交。如果其所编码的蛋白质U本相同的,则在严格条 件下彼此不杂交的核酸仍然U本相同的。这发生于例如使用遗传密码子 允许的最大密码子简并性产生核酸拷贝时。
以下是杂交/洗涤条件集合的实例,其可用于克隆与本发明的参考核苷 酸序列同源的核苷酸序列参考核苷酸序列与所迷参考核苷酸序列在7% 十二烷基疏酸钠(SDS)、 0.5 M NaP04、 1 mM EDTA中于50X:下特异杂交, 在2X SSC、0.1% SDS中于50。C洗涤;更期望在7V。十二烷基硫酸钠(SDS)、 0.5MNaPO4、 1 mMEDTA中于50'C下特异杂交,在1XSSC、 0.1% SDS 中于50。C下洗涤;进一步更期望在7%十二烷基硫酸钠(SDS)、 0.5 MNaP04、 1 mM EDTA中于50。C下特异杂交,在0.5X SSC、 0.1% SDS中 于50X:下洗涤;特别地在7%十二烷J^充酸钠(SDS)、 0.5 M NaP04、 1 mM EDTA中于50'C下特异杂交,在0.1XSSC、 0.1% SDS中于50"C下洗涤; 更特别地在7%十二烷基^克酸钠(SDS)、 0.5MNaPO4、 lmMEDTA中于 5(TC。C下特异杂交,在0.1XSSC、 0.1%SDS中于65'C下洗涤。
"亚序列"是指分别包含更长的核酸或氨基酸(例如蛋白质)序列的 一部分的核酸或M酸序列。
基本相似性在两条核酸或蛋白质序列的语境中,术语"基本相似性" 是指基本相似的两条或更多序列或亚序列,例如具有50%,特别是60%, 更特别是70°/。,进一步更特别是80。/。,仍然更特别是卯。/。,还更特别是 95%和最特别是99%序列同一性。
底物底物是酶天然识别并在酶天然发挥其功能的生物化学途径中转 化为产物的分子,或是该分子经修饰的版本,该版本也被酶识别并在于天 然发生的反应相似的酶反应中被酶转化为产物。
转化用于将异源DNA引入植物细胞、植物组织或植物中的方法。 转化的植物细胞、植物组织或植物理解为不仅包括转化过程的终产物,而 且包括其转基因后代。
"转化的"、"转基因的"和"重組的"是指其中已引入异源核酸分 子的宿主生物,如细菌或植物。核酸分子可被稳定整合进宿主的基因組中, 或核酸分子也可作为染色体外分子存在。这类染色体外分子可以自我复制。 转化的细胞、组织或植物理解为不仅包括转化过程的终产物,而且包括其 转基因后代。"非转化的"、"非转基因的"或"非重组的"宿主是指不 含有异源核酸分子的野生型生物,例如细菌或植物。
存活力本文使用"存活力"是指植物的适应度(fitness)参数。针对植 物发育的纯合表现对其进行测定,指出何种蛋白质对于植物生长是必要的。
发明详述
I.性状功能基因組学的一般描迷
43功能基因组学的目的是鉴定控制生物表型表达的基因,并使用多种方 法学,包括担不限于生物信息学、基因表达研究、基因和基因产物相互作 用、遗传学、生物化学和分子遗传学。例如,生物信息学能够通过在异源 生物中鉴定在M酸或核苷酸水平上具有高相似性(同源性)程度的基因,
为给定的基因指定功能。基因在mRNA或蛋白质水平上的表达能够通过将 基因的表达与环境应答、发育过程或遗传(突变)或分子遗传(基因过量 表达或低表达)干扰相关联来指定功能。基因在mRNA水平上的表达可单 独(Northern分析)或与其他基因一起(微阵列分析)检查,而基因在蛋 白质水平上的表达能够单独(天然或变性的蛋白质凝胶或免疫印迹分析) 或与其他基因一起(蛋白质組分析)检查。对蛋白质/蛋白质和蛋白质/DNA 相互作用的了解能够通过鉴定在相同生物学过程中 一起发挥作用的蛋白质 和核酸序列来指定功能。遗传学可通过证明基因中的DNA损伤(突变) 对生物具有可计量的影响来对基因指定功能,所述影响包括担不限于其 发育;激素生物合成和应答;生长和生长习性(植物结构);mRNA表达 概况;蛋白质表达概况;抗病能力;对非生物胁迫的耐受;获得营养物的 能力;光合作用效率;改变的初级和次级代谢;和多种植物器官的组成。 生物化学可通过证明由基因编码的蛋白质(特别是在异源生物中表达时) 单独或与其他蛋白质一起具有某种酶活性来指定功能。分子遗传学能够通 过在天然植物或在异源生物中过量表达或低表达基因,并观察上文遗传学 功能指定中所述的可定量影响来指定功能。在功能基因组学中,使用任何 或所有这些方法(通常一起使用),基于大量生物表型中的任意表型为基 因指定功能。
本领域技术人员明白,所有这些不同的方法学均可提供证明具体基因 功能的数据,并且这类证据随着递增数量的数据而更强大,所迷数据用于 功能指定特别是来自一种方法学,更特别地来自两种方法学,并且进一 步更特别地来自多于两种方法学。另外,本领域技术人员明白,不同的方 法学在证明基因功能指定的证明力度中可不同。通常生物化学、遗传学和
分子遗传学证据的资料被认为比生物信息学或基因表达证据的资料更有力,但不总是如此。最后,本领域技术人员明白,对不同的基因而言,来 自一种方法学的一种资料在证据的力度方面可以是不同的,所述证据由用 于这些不同基因功能指定的各种不同资料提供。
作物性状功能基因組学(crop trait functional genomics)的目的是鉴定 作物性状基因,即能够在作物植物中赋予有用的农业性状的基因。这类农 业性状包括但不仅限于增加的产量,无论是质量还是品质;增加的营养 物获取和增加的代谢效率;用于食品、饲料或加工的植物组织增强或改变 的营养物组成;增加的农业或工业加工实用性;增加的植物抗病性;增强 的不良环境条件(非生物胁迫)耐受,所述不良环境条件包括但不仅限于 干旱、过冷、过热、或过量的土壤盐度或极端,或M;和植物结构或 发育中的改变,包括发育时间的改变。通过转基因或非转基因手段鉴定的 这类性状基因的运用可以为了农业的利益显著地改良作物植物。
对人和动物消耗而言,谷物均是地球上最重要的作物植物。在稻、玉 米、小麦、大麦、棵麦、燕麦和其他农业重要的单子叶植物中观察到遗传 同线性(大染色体区段内基因顺序的保守),这有助于以单个谷物基因的 序列为1^出对来自不同谷物物种的直向同源基因进行绘图和分离。稻在谷 物(cereal grain )中具有最小( 420 Mb)的基因组,并且近期是公众和私 人的基因组测序与EST测序努力的主要焦点。
为了在稻[小麦l基因组中鉴定控制[性状l的作物性状基因,以一种或多 种功能基因组方法为基础对来自稻基因组草图[小麦EST数据库]的基因进 行优先顺序处理(prioritize)。例如,使用,皮稻瘋菌(Magnaporthe grisea)感 染的稻植物的全基因组表达研究对控制疾病抗性的候选基因进行优先顺序 处理。然后可以以稻全基因組序列的分析为基础,预测稻性状基因候选者 的全长和部分cDNA,并使用可商业获得的PCR引物挑选程序通过设计 和使用PCR扩增引物将其分离。引物被用于从稻cDNA文库或第一链 cDNA中PCR扩增全长或部分cDNA。使用植物分子遗传学方法将得自任 一方法的cDNA克隆用于构建载体,所述栽体被设计为改变这些基因在转 基因植物中的表达,所述分子遗传学方法在下文详述。通过在转基因植物中过量表达或低表达关键性状基因来改变植物表型是对植物基因指定功能的一种有力和确定的方法。鉴定具有改变的目的性状的转基因植物的实验被用于明确地指定这些基因用于通过转基因方法或经典育种方法改良稻(并扩展至其他谷物)的实用性。
II. cDNA的鉴定、克隆和测序
本发明cDNA的克隆和测序在实施例1中描迷。
本发明的分离的核酸和蛋白质可在一定范围的植物、单子叶植物和双子叶植物中使用,尤其是在单子叶植物如稻、小麦、大麦和玉米中使用。在一个更具体的实施方案中,单子叶植物是谷物。在一个更具体的实施方案中,谷物可以是例如玉米、小麦、大麦、燕麦、棵麦、粟、高粱、黑小麦、黑麦属(secale)、单粒小麦、斯佩耳特小麦、双粒小麦、画眉草、蜀黍、亚麻、格兰马草、磨擦草属物种或玉米草。在一个最具体的实施方案中,谷物是稻。其他植物的属包括,但不仅限于南瓜属(Cucurbita)、蔷薇属(Rosa)、葡萄属(Vitis)、胡桃属(Juglans)、 Gragaria、百乐沐属(Lotus)、苜蓿属(Medkago)、驴食草属(Onobrychis)、胡卢巴属(Trigonella)、虹豆属(Vigna)、柑橘属(Citrus)、亚麻属(Linum)、老鹳草属(Geranium)、木薯属(Manihot)、胡萝卜属(Daucus)、拟南芥属(Arabidopsis)、芸苜属(Brassica)、萝卜属(Raphanus)、白芥属(Sinapis)、颠茄属(Atropa)、辣椒属(Capsicum)、曼陀罗属(Datura)、天仙子属(Hyoscyaimis)、番莊属(Lycopersicon)、烟草属(Nicotiana)、茄属(Solanum)、碧冬茄属(Petuiiia)、毛地黄属(Digitalis)、花薄荷属(Majorana )、菊苣属(Cichorium)、向日葵属(Helianthus)、莴苣属(Lactuca)、雀麦属(Bromus)、天门冬属(Asparagus)、金鱼草属(Antirrhinum) 、 Heterocallis 、 Nemesis 、 天竺婆属(Pelargonium)、 黍属(Panieum)、 狼尾草属(Pennisetum)、 毛蒗属(Ranunculus)、 千里光属(Senecio)、喇9、舌属(Salpiglossis)、香瓜属(Cucumis)、 Browaalia、大豆属(Glycine)、豌豆属(Pisum)、菜豆属(PhaseoIus)、黑麦草属(Lolium)、稻属(Oryza)、燕麦属(Avena)、大麦属(Hordeum)、黑麦属(Secale)、葱属(AUium)和小麦属(Triticum)。
本发明还提供了对包含本发明核酸分子的植物或植物部分进行基因分型的方法。任选地,该植物是单子叶植物,例如但不仅限于稻或小麦。基因分型提供了区分染色体对(pari)同源物的手段,并可用于在植物种群中区分分离体。分子标记物方法可用于系统发生研究,表征作物变种间的亲缘关系,鉴定杂交种或体细胞杂种(somatic hybrid),定位影响单基因性状的染色体区段,图位克隆,和研究定量的遗传(参见Plant Molecular Biology:A Laboratory Manual,第7章,Clark编著,Springer隱Verlag, Berlin 1997;Paterson, A.H., "The DNA Revolution,,, Genome Mapping in Plants中的第2章,Paterson, A.H.编著,Academic 出/^/R,G. Lands Co., Austin, Texas1996)。
基因分型方法可使用任何数量的分子标记物分析技术,例如但不仅限于限制长度多态性(RFLP)。如本领域所公知的,RFLP由DNA限制片段长度中的差异产生,所述差异得自相同基因的等位基因之间的核苷酸差异。因此,本发明提供了以下通过使用RFLP分析分离本发明的基因或核酸或遗传上连锁的染色体序列的方法。连锁的染色体序列在本发明核酸的50厘摩(50 cM)内,40或30 cM内,特别地在20或10 cM内,更特别地在5、3、 2或1 cM内。
III.目的性状
本发明包括编码下述蛋白质的多核苷酸的鉴定和分离,所述蛋白质涉及糖感知,以及最终的氮摄取和碳代谢。改变与这些性状相关的基因的表达能够用于根据期望改良或修饰植物和/或谷类(grain)。实施例描述了分离的目的基因,和分析表达改变及其对植物特性的影响的方法。
本发明的一个方面提供了用于调节或改变(即提高或降低)本发明的核酸分子和多肽在植物中的水平的组合物和方法。具体地,本发明的核酸分子和多肽被组成型地、时间或空间(例如在发育阶段、某些组织中和/或以一定数量)地表达,这对于非重组改造的植物是不典型的。因此,本
47发明提供了在这类示范性应用中改变上文鉴定的特定特性的实用性。
VI.在转基因植物中控制基因表达
本发明还涉及包含核酸分子的转化的细胞、转化的植物、种子和植物部分,和通过改变本发明基因的表达来修饰目的表型性状的方法。
A.修饰编码序列和相邻序列
来自异源来源的基因在植物中的转基因表达可涉及对这些基因的修饰,以达到和最优化其在植物中的表达。具体地,在植物中在独立的转录物上表达下述细菌ORF是最佳的,所述细菌ORF编码独立的酶但是由天然微生物中同一转录物编码。为了达成该目的,将各微生物ORF各自分离并克隆在盒中,所迷盒在ORF的S,末端提供植物启动子序列并在ORF的3,末端提供植物转录终止子。分离的ORF序列特别包含起始ATG密码子和终止STOP密码子,但是可包含除起始ATG和终止STOP密码子之外的额外序列。另外,ORF可以是截短的,但仍然保留所需的活性;对尤其长的ORF而言,保留活性的截短的版本对于 转基因生物中表达可以是优选的。"植物启动子"和"植物转录终止子,,旨在表示在植物细胞中工作的启动子和转录终止子。这包括可来自非植物来源如病毒(一个实例是花椰菜花叶病毒)的启动子和转录终止子。
在一些情况下,对ORF编码序列和相邻序列的#"饰不是必需的。分离含目的ORF的片段并将其插入植物启动子下游就是足够的。例如,Gaffney等(Science 261: 754-756 (1993))在转基因植物中成功地表达了位于CaMV 35S启动子和CaMV tml终止子控制下的假单胞杆菌(Pseudomonas) nahG基因,而未修饰编码序列,且假单胞菌基因ATG上游的核苷酸和STOP密码子下游的核苷酸仍然与nahG ORF相连。特别地,应该留下尽可能少的相邻微生物序列连接在ATG上游和STOP密码子下游。事实上,这类构建可取决于限制性位点的可用性。
在其他情况下,来自微生物来源的基因的表达可在表达中产生问题。这些问题已在本领域中充分表征,并且对来自某些来源如芽孢杆菌
(Bacillus)的基因而言尤其常见。这些问题可适用于本发明的核苷酸序列,且这些基因的修饰可使用本领域目前公知的技术进行。可遇到以下的问题
1. 密码子选择。
植物中特定的密码子选择与某些孩支生物中特定的密码子选择不同。将克隆的微生物ORF中的密码子选择与植物基因(尤其是来自靶植物的基因)中的选择进行比较,会使得能够识别ORF中应当被特别改变的密码子。通常,植物进化趋向于在单子叶植物的第三个碱基位置中对核苷酸C和G的有力偏好,而双子叶植物常在该位置使用核苷酸A或T。通过修饰基因以掺入具体靶转基因物种的特定密码子选择,会解决下文所述关于GC/AT含量和不合理剪接的许多问题。
2. GC/AT含量。
植物基因通常具有多于35%的GC含量。富含A和T核苷酸的ORF序列能够在植物中引起若干问题。首先,ATTTA基序被认为引起信号的去稳定化并存在于在许多短寿命mRNA的3,末端。其次,多腺苷酸化信号如AATAAA在信息中不适当位置的发生被认为引起转录的过早截断。另外,单子叶植物可将富含AT的序列识别为剪接位点(见下文)。
3. 与起始的曱硫氨酸相邻的序列。
植物与微生物的区别在于其信息不具有确定的核糖体结合位点。更确切地说,认为核糖体与信息的5,末端结合并扫描第一个可获得的ATG,在这里开始翻译。然而,认为存在对与ATG相邻的某些核苷酸的偏好,并且可通过在ATG处包含真核生物共有的翻译起始子来增加微生物基因的该表达。Clontech (1993/1994目录,第210页,引入本文作为参考)提出一条序列作为大肠杆菌uidA基因在植物中表达的共有翻译起始子。另夕卜,Joshi (N.A.R. 15:6643-6653(1987),引入本文作为参考)比较了与ATG相邻的许多植物序列,并提出另一共有序列。在植物中表达孩吏生物ORF时遇到困难的情况下,在起始ATG处包含这些序列中的一条可促进翻译。在这些情况下,共有序列的最后三个核苷酸可由于其对笫二个AA残基的修饰而不适合包含在修饰的序列中。与起始甲硫氨酸相邻的特定序列可在
不同的植物物种间不同。对位于GenBank数据库中14个玉米基因的调查 提供了以下的结果
14个玉米基因中起始ATG前的位置
-10 -9 -8 -7 -6 -5 -4 -3 -2 -1 C38462560 10 7 T 3034321110 A 2314323723 G 63606546 15 可对核苷酸要掺入其中的期望的植物物种和为了掺入特定核苷酸而被 修饰的与ATG相邻的序列进行该分析。 4.去除不合理的剪接位点。
从非植物来源克隆并且未针对在植物中表达进行最优化的基因也可含 有在植物中被识别为5,或3,剪接位点并被切割的基序,因此产生截短的或 删除的信息。可使用本领域公知的技术去除这些位点。
修饰编码序列和相邻序列的技术是本领域公知的。在微生物ORF的 原始表达低并认为如上文所述改变序列是合适的的情况下,可根据本领域 公知的方法完成合成基因的构建。这些方法例如描述于公开的专利公开文 本EP 0 385 962 (属于Monsanto ) 、 EP 0 359 472 (属于Lubrizol)和WO 93/07278 (属于Ciba-Geigy)中,其均引入本文作为参考。在大部分情况 下,优选使用瞬时测定方案(这是本领域公知的)在基因构建体转移至转 基因植物之前测定其表达。
B.构建植物表达盒
旨在在转基因植物中表达的编码序列首先被装配在表达盒中的可在植 物中表达的合适启动子之后。该表达盒也可包含转基因表达所需或选择的 任何其他序列。这类序列包括但不限于转录终止子、增加表达的外来序列 如内含子、关^^列(vital sequence),和旨在将基因产物靶向特定细胞器和细胞区室的序列。然后可将这些表达盒容易地转移至下文所述的植物转 化载体。以下描述了典型的表达盒的多种组件。 l.启动子
用于表达盒中的启动子的选择会确定转基因在转基因植物中的空间和 时间表达模式。选择的启动子会在特异的细胞类型(如叶表皮细胞、叶肉 细胞、根皮层细胞)或在特异的組织或器官(例如根、叶或花)中表达转 基因,且该选择会反映期望的基因产物累积位置。或者,逸择的启动子可
驱动基因在不同的诱导"^H牛下表达。启动子的强度(即启动转录的能力) 不同。根据使用的宿主细胞体系,可使用大量合适启动子之任一,包括基 因固有的启动子。以下是可用于表达盒中的启动子的非限制性实例。
a. 組成型表达,遍在蛋白启动子
遍在蛋白是已知在许多细胞类型中累积的基因产物,且其启动子从若 干物种中被克隆用于在转基因植物中使用(例如向日葵-Binet等,Plant Science 79: 87-94 (1991);玉米-Christensen等,Plant Molec. Biol. 12: 619-632 (1989);和拟南芥誦Callis等,J. Biol. Chem. 265:12486-12493 (19卯) 和Norris等,Plant Mol. Biol. 21:895-906 (1993))。已在转基因单子叶植物 体系中个开发了玉未遍在蛋白启动子,并且其构建用于单子叶植物转化的 序列和载体在专利公开EP 0 342 926 (属于Lubrizol)中公开,该文献引 入本文作为参考。Taylor等(Plant Cell R印.12: 491-495 (1993))描述了包 含玉米遍在蛋白启动子和第一内含子的载体(pAHC25),以及通过孩M立轰击 被引入后其在大量单子叶生物细胞悬浮液中的高活性。对于用于本发明核 苷酸序列,拟南芥遍在蛋白启动子是理想的。遍在蛋白启动子适用于在转 基因植物(单子叶植物和双子叶植物二者)中的基因表达。合适的载体是 pAHC25的衍生物或该申请中描述的任何转化栽体,其通过引入适当的遍 在蛋白启动子和/或内含子序列被修饰。
b. 组成型表达,CaMV35S启动子
质粒pCGN1761的构建描述于公开的专利申请EP0 392 225 (实施例 23)中,该文献引入本文作为参考。pCGN1761含有"双,,CaMV35S启动子和tml转录终止子,在启动子和终止子之间具有特有的EcoRI位点, 并具有pUC-型主链。构建了具有修饰的多接头的pCGN1761的衍生物, 其除了已有的EcoRI位点外还包含Notl和Xhol位点。该个汴生物被命名为 pCGN1761ENX。 pCGN1761ENX适用于为了在转基因植物中在35S启动 子的控制下表达的目的,在其多接头内克隆cDNA序列或编码序列(包括 微生物ORF序列)。这类构建体的整个35S启动子-编码序列-tml终止 子盒可通过启动子5,的HindIII、 Sphl、 Sail和Xbal位点和终止子,3的 Xbal、 BamHI和Bgll位点切割用于转移至转化载体,如下文所述的转化 载体。另外,可通过HindIII、 Sphl、 SaII、 Xbal或Pstl的5'切割或任何 多接头限制性位点(EcoRI、 Notl或Xhol)的3'切割去除双35S启动子片 段,用于置换另一启动子。如果期望的话,可通过引入可增加翻译的序列 在克隆位点附近进行修饰。这尤其适用于期望过量表达时。例如,可通过 如美国专利No. 5,639,949的实施例37所述最优化翻译起点来修饰 pCGN1761ENX,所述文献引入本文作为参考。 c.组成型表达,肌动蛋白启动子
已知若干种肌动蛋白同种型在大部分细胞类型中表达,因此肌动蛋白 启动子是组成型启动子的良好选择。具体地,已克隆和表征了来自稻Actl 基因的启动子(MeElroy等,Plant Cell 2: 163-171 (1990))。发现启动子的 1.3kb片段含有在稻原生质体中表达所需的所有调节元件。另外,已构建 了基于Actl启动子的大量表达栽体,它们尤其用于单子叶植物(McElroy 等,Mol. Gen. Genet. 23h 150-160 (1991))。这些栽体整合了 ActI-内含子1、 Adhl 5'側翼序列和Adhl-内含子l(来自玉米醇脱氢酶基因)和来自CaMV 35S启动子的序列。显示最高表达的载体是35S与Actl内含子或Actl 5, 侧翼序列与Actl内含子的融合物。(GUS报告子基因)起始ATG附ii^ 列的最优化也增加了表达。McElroy等(Mol. Gen. Genet. 231: 150-160 (1991))所迷的启动子表达盒可被容易地修饰用于基因表达,并尤其适合在 单子叶植物宿主中使用。例如,从McElroy构建体中取出含启动子的片段 并用于置换pCGN1761ENX中的双35S启动子,然后所述pCGN1761ENX
52可用于插入特异的基因序列。然后可将由此构建的融合基因转移至适当的
转化载体。在独立的^Jf中,也发现稻Actl启动子与其第一个内舍子指导 在培养的大麦细胞中的高表达(Chibbar等,Plant Cell Rep. 12: 506-509 (1993))。
d.诱导性表达,PR-1启动子
pCGN1761ENX中的双35S启动子可用选择的任何另一启动子代替, 所述另一启动子会导致适当的高表达水平。举例而言,美国专利No. 5,614,395中所述的可化学调节的启动子之一 (如烟草PR-la启动子)可代 替双35S启动子。或者,可使用Lebel等,Plant J. 16:223-233 (1998)中所述 的拟南芥PR-1启动子。通过限制性酶将选择的启动子从其来源特异切割, 但是也可以使用带有适当末端限制性位点的引物进行PCR扩增从而从其 来源特异切割。要进行PCR-扩增时,应当在靶栽体中克隆扩增的启动子 之后对启动子再测序以检验扩增错误。将可化学/病原体调节的烟草PR-la 启动子AM^卑立pClB1004 (用于构建体,见EP 0 332 104的实施例21,该 文献引入本文作为参考)中切割并转移至质粒pCGN1761ENX (Uknes等, Plant Cell 4: 645-656 (1992))。用Ncol切割pCIB1004,并通过用T4 DNA 聚合酶处理使得到的线性片段的3,突出端成为平端。然后用HindIII切割 该片段,对得到的含PR-la启动子片段进行凝胶纯化并克隆进 pCGN1761ENX中,所述pCGN1761ENX已去除了双35S启动子。这如下 完成用Xhol切割并用T4聚合酶变平端,然后用HindIII切割,并分离 含较大栽体-终止子的片段,pCIB1004启动子片段被克隆进上述片段中。 这产生了 pCGN1761ENX衍生物,其具有PR-la启动子和tml终止子和具 有特有的EcoRI和Notl位点的插入多接头。可向该载体中插入选择的编 码序列,随后将融合产物(即启动子-基因-终止子)转移至任何选择的 转化载体,包括下文所述的转化栽体。可使用多种化学调节剂在根据本发 明转化的植物中诱导选择的编码序列表达,所述化学调节剂包括美国专利 第5,523,311号和第5,614,395号中公开的笨并噻二唑、异烟酸和水杨酸化 合物。e. 诱导性表达,乙醇诱导性启动子
也可'使用可由某醇或酮(如乙醇)诱导的启动子赋予本发明编码序列 的诱导性表达。这样的启动子例如为来自无冠构巢曲霉(Aspergillus nidulans)的alcA基因启动子(Caddick等,(1998) Nat. Biotechnol 16:177-180)。在构巢曲霉中,alcA基因编码醇脱氢酶I,其表达在存在化 学诱导剂时由AlcR转录因子调节。就本发明的目的而言,将质粒 palcA:CAT中的CAT编码序列替换为本发明的编码序列,以形成编码序 列处于alcA基因启动子控制下的表达盒,所述质粒palcA:CAT包含与最 小35S启动子融合的alcA基因启动子序列(Caddick等,(1998) Nat. Biotechnol 16:177-180)。这4吏用本领域7>知的方法完成。
f. 诱导性表达,糖皮质激素诱导性启动子
还涉及使用基于类固醇激素的系统诱导本发明核,列的表达。例如, 使用糖皮质激素介导的i秀导体系(Aoyama和Chua (1997) The Plant Journal 11: 605-612)并通过应用糖皮质激素诱导基因表达,所述糖皮质激 素例如是合成的糖皮质激素,特别是地塞米松,特别是以O.lmM到lmM, 更特别是从10mM到lOOmM范围内的浓度。就本发明的目的而言,用本 发明的核酸序列代替萤光素酶基因序列,形成本发明的核酸序列处于与 35S最小启动子融合的六拷贝GAL4上游激活序列的控制下的表达盒。这 使用本领域公知的方法完成。反式作用因子包括与疱疹病毒蛋白VP16 (Triezenberg等,(1988) Genes Devel. 2: 718画729)融合的GAL4 DNA-结合 结构域(Keegan等,(1986) Science 231: 699-704),所述疱療病毒蛋白VP16 与大鼠糖皮质激素受体的激素结合结构域融合(Picard等,(1988) Cell 54: 1073-1080)。融合蛋白的表达由本领域已知的或本文所述的启动子控制。 该表达盒还包含在下述植物中,所述植物包含与6xGAL4/最小启动子融合 的本发明的核酸序列。因此,融合蛋白的组织特异性或器官特异性的实现, 导致杀虫毒素的可诱导的組织或器官特异性。 g.根特异表达
另一种基因表达模式是根表达。合适的根启动子是由de Framond
54(FEBS 2卯103-106 (1991))和美国专利第5,466,785号所述的玉米金属硫蛋 白样(MTL)基因启动子,所述文献引入本文作为参考。将该"MTL"启动子 转移至用于插入选定基因的合适栽体如pCGN1761ENX,并随后将整个启 动子-基因-终止子盒转移至目的转化载体。
h. 创伤诱导性启动子
创伤诱导性启动子也适用于基因表达。已描述了大量这类启动子(例 如Xu等,Plant Molec. Biol. 22: 573-588 (1993), Logemann等,Plant Cell 1: 151-158 (1989), Rohrmeier & Lehle, Plant Molec. Biol. 22: 783-792 (1993), Firek等,Plant Molec. Biol. 22: 129-142 (1993), Warner等,Plant J. 3: 191-201 (1993))且其均适用于本发明。Logemann等描述了双子叶马铃薯 wunl基因的5,上游序列。Xu等显示来自双子叶植物马铃薯的创伤诱导性 启动子(pin2)在单子叶植物稻中有活性。另外,Rohrmeier & Lehle描述了 使用标准才支术克隆玉米Wipl cDNA,该cDNA是创伤i秀导的并可用于分离 同族(cognate)启动子。类似地,Firek等,和Warner等描述了来自单 子叶植物石刁柏(Asparagus officii!alis)的创伤诱导基因,该基因在局部创 伤和病原体侵入位点表达。使用本领域公知的克隆技术,可将这些启动子 转移至合适的栽体,与关于本发明的基因融合,并用于在植物创伤位点表 达这些基因。
i. 髓特异表达
专利申请WO 93/07278描迷了优先在髓细胞中表达的玉米trpA基因 的分离,该文献引入本文作为参考。提出了扩展至转录起点-1726bp的基 因序列和启动子。使用标准分子生物学技术,可将该启动子或其部分转移 至载体如pCGN1761,其中该启动子能够替换35S启动子,并用于驱动外 源基因以髓特异的方式表达。事实上,含有髓特异启动子或其部分的片段 可被转移至任何载体,并针对在转基因植物中的实用性进行修饰。
j.叶特异表达
Hudspeth & Grula (Plant Molec Biol 12: 579-589 (1989))已描述了编 码磷酸烯醇羧化酶(PEPC)的玉米基因。使用标准分子生物学技术,可使用该基因的启动子驱动任何基因以叶特异的方式在转基因植物中表达。
k.花粉特异表达
WO 93/07278描述了玉米钙依赖性蛋白激酶(CDPK)基因的分离,该基 因在花粉细胞中表达。基因序列和启动子扩展至从转录起点1400 bp。使 用标准分子生物学技术,可将该启动子或其部分转移至载体如pCGN1761, 其中该启动子能够替换35S启动子,并用于驱动本发明的核酸序列以花粉 特异的方式表达。
2. 转录终止子
可获得大量在表达盒中使用的转录终止子。它们负责终止超出转基因 的转录并校正mRNA多聚腺苷酸化。适当的转录终止子是已知在植物中发 挥作用的那些,并包括CaMV 35S终止子、tml终止子、胭脂碱合酶终止 子和豌豆rbcS E9终止子。其可用于单子叶植物和双子叶植物。另外,可 使用基因的固有转录终止子。
3. 用于增加或调节表达的序列
发现来自转录单位内的大量序列增加基因表达,并且这些序列可与本 发明的基因组合使用,提高本发明的基因在转基因植物中的表达。
多种内含子序列已显示增加表达,尤其是在单子叶植物细胞中。例如, 发现当引入玉米细胞中时,玉米Adhl基因的内含子显著增加位于其同族 启动子下的野生型基因的表达。发现内含子1是尤其有效的,并在与氯霉 素乙酰转移酶基因的融合构建体中增加表达(Callis等,Genes Develop. 1: 1183-1200(1987))。在相同的实验体系中,来自玉米bronzel基因的内含子 具有类似的增加表达的效果。内含子序列已^^常规地整合进植物转化载体 中,通常在非翻译的前导区内。
也已知来自病毒的大量非翻译前导序列增加表达,并且它们在双子叶 植物细胞中尤其有效。特别地,来自烟草花叶病毒(TMV, "W-序列")、 玉米萎黄病斑点病毒(MCMV)和苜蓿花叶病毒(AMV)的前导序列已显示有 效增加表达(例如Gallie等,Nucl. Acids Res. 15: 8693-8711 (1987); Skuzeski等,Plant Molec. Biol. 15: 65-79 (1990))。本领域已知的其他前导序列包括但不仅限于小核糖核酸病毒前导区,例如EMCV前导区(脑 心肌炎5'非编码区)(Elroy-Stein, O.、 Fuerst, T. R.和Moss, B. PNAS USA 86:6126-6130(1989));马铃薯Y病毒(potyvims)前导区,例如TEV前导区 (烟草蚀斑病毒)(Allison等,1986); MDMV前导区(玉米矮花叶病毒); Virology 154:9-20);人免疫球蛋白重链结合蛋白(BiP)前导区(Macejak, D. G. 和Sarnow, P., Nature 353: 90-94 (1991));来自苜蓿花叶病毒外壳蛋白 mRNA(AMV RNA 4)的非翻译前导区(Jobling, S. A.和Gehrke, L., Nature 325:622-625 (1987));烟草花叶病毒前导区(TMV), (Gallie, D. R.等, Molecular Biology of RNA,第237-256页(1989));和玉米萎黄病斑点病毒 (MCMV)前导区(Lommel, S. A.等,Virology 81:382-385 (1991))。还参见 Della-Cioppa等,Plant Physiology 84:965-968 (1987)。
除了将一个或多个上述元件整合进本发明的靶表达盒的5,调节区内以 外,也可整合耙表达盒特有的其他元件。这类元件包括但不仅限于最小启 动子。最小启动子旨在表示无上游激活时是无活性的或几乎无活性的基本 启动子元件。当不存在反式作用子或当不存在增强子或应答元件结合位点 时,这样的启动子在植物中具有低背景活性。尤其适用于植物中耙基因的 一种最小启动子是Bzl最小启动子,其得自玉米的bronzel基因。该Bzl 核心启动子通过在位于-53和-58的Nhel位点切割,得自"myc"突变体Bzl-萤光素酶构建体pBzlLucR98。 Roth等,Plant Cell 3: 317 (1991)。衍生的 Bzl核心启动子片段因此从-53扩展至+227,并在5'非翻译区包含Bzl内 含子-1。还适用于本发明的是通过使用合成的TATA元件创建的最小启动 子。该TATA元件允许RNA聚合酶因子识别启动子,并在不缺失激活时 赋予基底水平的基因表达( 一般参见Mukumoto (1993) Plant Mol Biol 23: 995-1003; Green (2000) Trends Biochem Sci 25: 59-63 )。
4.基因产物在细胞内的靶向
已知在植物中存在靼向基因产物的多种机制,并且已较详细地表征了 控制这些机制功能的序列。例如,基因产物到叶绿体的靶向由存在于多种 蛋白质氨基端的信号序列控制,该信号序列在叶绿体输入时被切割,产生成熟的蛋白质(例如Comai等,J. Biol, Chem. 263: 15104-15109 (1988))。
这些信号序列可与异源基因产物融合,影响异源产物进入叶绿体的输入 (van den Broeck等,Nature 313: 358-363 (1985))。编码适当信号序列的 DNA可从下述cDNA的5'端分离,所述cDNA编码RUBISCO蛋白质、 CAB蛋白质、EPSP合酶、GS2蛋白质和已知定位于叶绿体的许多其他蛋 白质。还参见美国专利第5,639,949号的实施例37中题为"Expression With Chloroplast Targeting"的部分。
其他基因产物定位于其他细胞器如线粒体和过氧化物酶体中(例如 linger等,Plant Molec. Biol. 13: 411-418 (1989))。也可利用编码这些产物 的cDNA影响异源基因产物到这些细胞器的靶向。这类序列的实例是核编 码的ATP酶和线粒体特异的天冬氨酸氨基转移酶同种型。靶向细胞蛋白质 体已由Rogers等(Proc. Natl. Acad. Sci. USA 82: 6512-6516 (1985)描述。
另外,已表征了引起基因产物靶向到其他细胞区室的序列。M端序 列负责到ER、质外体的靶向和从糊粉细胞的胞外分泌(Koehler & Ho, Plant Cell 2: 769-783 (1990))。另外,#^端序列与^_^端序列组合负责基 因产物的液泡耙向(Shinshi等,Plant Molec. Biol. 14: 357-368 (1990)。
通过将上述适当的靶向序列与目的转基因序列融合,可能指导转基因 产物去往任何细胞器或细胞区室。对叶绿体靶向而言,例如将来自 RUBISCO基因、CAB基因、EPSP合酶基因或GS2基因的叶绿体信号序 列与转基因的氩基端ATG融合。选择的信号序列应包括已知的切割位点, 构建的融合物应考虑切割所需的切割位点后的任何M酸。在一些情况下, 可通过在切割位点和转基因ATG之间添加少量氨基酸,或者通过替换转 基因序列中的一些氨基酸来满足该需要。可如下测试针对叶绿体输入构建 的融合物的叶绿体吸收效率将体外转录的构建体体外翻译,然后使用 Bartlett等,在Edelmann等(编著)Methods in Chloroplast Molecular Biology, Elsevier,第1081-1091页(1982)和Wasmann等,Mol. Gen. Genet. 205: 446-453 (1986)中所述的技术进行体外叶绿体吸收。这些构建技术是本 领域公知的,并同样适用于线粒体和过氧化物酶体。细胞靶向的上述机制不仅可与其同族启动子组合^f吏用,而且也可以与 异源启动子组合^f吏用,从而完成在启动子的转录调节下特异的细胞靶向目
标,所述启动子具有与靶向信号来源的启动子不同的表ii^式。 c.构建植物转化栽体
可用于植物转化的大量转化载体是植物转化领域的普通技术人员已知 的,并且与本发明有关的这些基因可与任何这类栽体组合使用。载体的选 择应取决于特异的转化技术和转化的耙物种。对某些乾物种而言,不同的 抗生素或除草剂选择标记物可以是特异的。转化中常规使用的选择标记物
包括赋予卡那霉素和相关抗生素抗性的nptll基因(Messing & Vierra. Gene 19: 259-268 (1982); Bevan等,Nature 304:184-187 (1983))、赋予除草 剂膦丝菌素抗性的bar基因(White等,Nucl. Acids Res 18: 1062 (1990), Spencer等,Theor. Appl. Genet 79: 625-631 (1990))、赋予抗生素潮霉素抗 性的hph基因(Blochinger & Diggdmann, Mol Cell Biol 4: 2929-2931)、和 赋予对甲氨蝶呤(methatrexate )抗性的dhfr基因(Bourouis等,EMBO J. 2(7): 1099-1104 (1983))、赋予草甘膦抗性的EPSPS基因(美国专利第 4,940,935号和第5,188,642号)和提供代谢甘露糖的能力的甘露糖-6-磷酸 异构酶基因(美国专利第5,767,378号和第5,994,629号)。 l.适用于农杆菌(Agrobacterium)转化的载体
许多载体可用于使用才艮瘤农杆菌(Agrobacterium tumefaciens)的转化。 这些载体通常带有至少一个T-DNA边界序列并包括栽体如pBIN19 (Bevan, Nud. Acids Res. (1984))。下文描述了适用于农杆菌转化的两种典 型栽体的构建。
a. pCIB200和pCIB2001:
二元载体pCIB200和pCIB2001用于构建与农杆菌一^^使用的重组载 体,并以如下方式构建。如下创建pTJS75kan: Narl消化pTJS75 (Schmidhauser & Helinski, J. Bacteriol. 164: 446-455 (1985)),该消化允i午 切除四环素抗性基因,然后插入来自pUC4K的带有NPTII的Accl片段(Messing & Vierra, Gene 19: 259-268 (1982): Bevan等,Nature 304: 184-187 (1983): McBride等,Plant Molecular Biology 14: 266-276 (1990))。 将Xhol接头与PCIB7的EcoRV片段连接,所述EcoRV片段含有左侧和 右侧T-DNA边界、植物可选择的nos/nptll嵌合基因和pUC多接头 (Rothstein等,Gene 53: 153-161 (1987)),并将Xhol-消化的片段克隆进Sall-消化的pTJS75kan中,创建pCIB200 (也见EP 0 332 104,实施例19 )。 pCIB200含有以下的特有多接头限制性位点EcoRI、 Sstl、 Kpnl、 BgIII、 Xbal和Sall。 pCIB2001是通过向多接头中插入额外的限制性位点创建的 pCIB200的衍生物。pCIB2001多接头中特有的限制性位点是EcoRI、 Sstl、 Kpnl、 BglII、 Xbal、 Sall、 Mlul、 Bcll、 AvrII、 Apal、 Hpal和Stul。除 了含有这些特有的限制性位点以外,pCIB2001还具有植物和细菌卡那霉素 选择、用于农杆菌介导的转化的左侧和右侧T-DNA边界、用于在大肠杆 菌和其他宿主间流通的来自RK2的trfA功能,且OriT和OriV功能也来 自RK2。 pCIB2001多接头适用于克隆含有其自身调节信号的植物表达盒。 b. pCIB10及其潮霉素选择衍生物
二元载体pCIB10含有用于在植物中选择的编码卡那霉素抗性的基因 和T-DNA右侧和左侧边界序列,并掺入来自广泛宿主范围质粒pRK252 的序列,这允许其在大肠杆菌和农杆菌二者中复制。其构建由Rothstein 等(Gene 53: 153-161 (1987))描述。构建了 pCIB10的多种衍生物,其掺入 由Gritz等(Gene 25: 179-188 (1983))所述的潮霉素B磷酸转移酶基因。这 些衍生物使得能够在只有潮霉素(pCIB743)时,或在潮霉素和卡那霉素 (pCIB715, pCIB717)上选择转基因植物。
2.适用于非农杆菌转化的载体
不使用根瘤农杆菌的转化绕过了选择的转化载体中对T-DNA序列的 需要,因此除了如上所述含有T-DNA序列的载体外可使用缺乏这些序列 的载体。不依赖于农杆菌的转化技术包括通过粒子轰击、原生质体吸收(例 如PEG和电穿孔)和显微注射的转化。载体的选择主要取决于对被转化的 物种的特异选择。下文描述了适用于非农杆菌转化的典型载体的构建。a. pCIB3064:
pCIB3064是适用于直接基因转移技术的来自pUC的载体,所述直接 基因转移技术与除草剂basta (或膦丝菌素)选择组合。质粒pCIB246包 含与大肠杆菌GUS基因和CaMV 35S转录终止子有效融合的CaMV 35S 启动子,并描述于PCT已^^开的申请WO 93/07278中。该载体的35S启 动子在起点5,含有两条ATG序列。以去除ATG并产生限制性位点SspI 和PvuII的方式使用标准PCR技术突变这些位点。新的限制性位点距离特 有的Sall位点96和37 bp,并距离真实的起点101和42 bp。得到的pCIB246 衍生物被称作pCIB3025。然后通过用SalI和SacI消化从pCIB3025中切 除GUS基因,使末端变平端并重新连接,产生质粒pCIB3060。质粒pJIT82 得自John Innes Centre, Norwich,切下含有来自绿色链霉菌(Streptomyces viridochromogenes)的bar基因的400 bp Smal片段并插入pCIB3060 (Thompson等,EMBO J 6: 2519-2523 (1987))的Hpal位点中。这产生了 pCIB3064,其包含处于CaMV35S启动子和终止子控制下的用于除草剂选 择的bar基因、氨千青霉素抗性基因(用于在大肠杆菌中选择)和具有特 有位点SphI、 Pstl、 HindIII和BamHI的多接头。该载体适用于克隆含有 其自身调节信号的植物表达盒。
b. pSOG19和pSOG35:
pSOG35是一种转化载体,其利用大肠杆菌基因二氢叶酸还原酶(DFR) 作为赋予甲氨蝶呤抗性的可选择标记物。使用PCR扩增35S启动子、来 自玉米Adhl基因的内含子6(-550 bp),和来自pSOG10的18 bp GUS非 翻译前导序列。还通过PCR扩增编码大肠杆菌II型二氢叶酸还原酶基因 的250-bp片段,并将这两条PCR片段用来自pB1221 (Clontech)的 Sacl-Pstl片段装配,所述Sacl-Pstl片段包含pUC19载体主链和胭脂碱合 酶终止子。这些片段的装配产生pSOG19,其含有与内含子6序列、GUS 前导区、DHFR基因和胭脂碱合酶融合的35S启动子。用来自玉米萎黄病 斑点病毒(MCMV)的前导序列替换pSOG19中的GUS前导区,产生载体 pSOG35。 pSOG19和pSOG35带有氨苄青霉素抗性的pUC基因,并具有可用于克隆外源物质的HindIII、 Sphl、 PstI和EcoRI位点。 3.适用于叶绿体转化的载体
为了在植物质体中表达本发明的核苷酸序列,使用质体转化载体 pPH143 (WO 97/32011,实施例36 )。将核苷酸序列插入pPH143中,从 而替换PROTOX编码序列。然后将该载体用于质体转化,并选择具有壮 观霉素抗性的转化体。或者,将核苷酸序列插入pPH143中,使其替换aadH 基因。在该情况下,针对PROTOX抑制剂抗性选择转化体。
D.转化
一旦本发明的核酸被克隆i^达体系内,将其转化进植物细胞中。可
以通过大量本领域认可的方式将本发明的受体和靶表达盒引入植物细胞
中。再生植物的方法也是本领域公知的。例如,Ti质粒载体已用于递送外
源DNA,以及直接DNA吸收、脂质体、电穿孔法、显微注射和微粒。另 外,来自农杆菌属的细菌可用于转化植物细胞。下文描述了转化双子叶植 物和单子叶植物的代表性技术,以及代表性的质体转化技术。
l.双子叶植物的转化
双子叶植物的转化技术是本领域公知的,并包括基于农杆菌的技术和 不需要农杆菌的技术。非农杆菌技术涉及原生质体或细胞对外源遗传材料 的直接吸收。这可通过PEG或电穿孔介导的吸收、粒子轰击介导的递送或 显微注射完成。这些技术的实例由Paszkowski等,EMBO J 3: 2717-2722 (1984)、 Potrykus等,Mol. Gen. Genet. 199: 169-177 (1985)、 Reich等, Biotechnology 4: 1001-1004 (1986)和Klein等,Nature 327: 70-73 (1987)描 述。在各情况下,使用本领域已知的标准技术将转化的细胞再生为整株植 物。
农杆菌介导的转化是转化双子叶植物的特异技术,因为其转化的高效 率和针对许多不同物种的广泛实用性。农杆菌转化通常涉及带有目的外来 DNA的二元载体(例如pCIB200或pCIB2001 )到适当农杆菌菌林的转移, 该转移可取决于宿主农杆菌菌林(例如对pCIB200和pCIB2001而言是菌 林CIB542(Uknes等,Plant Cell 5: 159-169 (1993))在共同存在的Ti质粒或染色体上带有的vir基因的互补序列。通过三亲本交配步骤,使用带有 重组二元载体的大肠杆菌、辅助大肠杆菌菌林完成重组二元栽体到农杆菌 的转移,所述助手大肠杆菌菌林包含质粒如pRK2013并能够将重組二元载 体移动至靶农杆菌菌林。或者,可通过DNA转化将重组二元载体转移至 农杆菌(Hfifgen & Willmitzer, Nucl. Acids Res. 16: 9877 (1988))。
通过重组农杆菌转化扭植物物种常涉及农杆菌与来自植物的外植体的 共同培养,并且遵循本领域公知的方案。在可选择培养基上再生带有抗生 素或除草剂抗性标记物的转化的组织,所述标记物存在于二元质粒T-DNA 边界之间。
用基因转化植物细胞的另一途径涉及在植物组织和细胞中推进惰性或 有生物学活性的颗粒。该4支术在均属于Sanford等的美国专利第4,945,050 号、笫5,036,006号和第5,100,792号中公开。 一般地,该步骤涉及在有效 穿透细胞外表面并在其内部提供整合的条件下在细胞中推进惰性或生物学 活性的颗粒。使用惰性颗粒时,可通过用含有期望基因的载体包裹颗粒而 将栽体引入细胞中。或者,可用载体包围靶细胞,使得载体通过颗粒的活 跃(wake)被带入细胞中。也可向植物细胞组织中推进生物学活性颗粒(例 如干燥的酵母细胞、干燥的细菌或噬菌体,分别含有想要引入的DNA)。
2.单子叶植物的转化
现在大部分单子叶植物物种的转化也已成为常规。特异的技术包括使 用PEG或电穿孔技术将基因直接转移进入原生质体,和粒子轰击进入愈伤 组织中。转化可用单个DNA物种或多种DNA物种(即共转化)进行,这 两种技术均适用于本发明。共转化可具有下述优点避免完整载体构建和 产生下述转基因植物,所述转基因植物中目的基因和可选择标记物是未连 锁的基因座,使得能够在随后的世代中去除可选择标记物,这被认为是期 望的。然而,使用共转化的缺点是独立的DNA物种被整合进基因组中的 频率低于100。/。(Schocher等,Biotechnology 4: 1093-1096 (1986))。
专利申请EP 0 292 435、 EP 0 392 225和WO 93/07278描述了从玉米 的良种自交系(elite inbred line )制备愈伤组织和原生质体、使用PEG或电穿孔转化原生质体,和从转化的原生质体再生玉米植物的技术。
Gordon-Kamm等,(Plant Cell 2: 603-618 (19卯))和Fromm等,(Biotechnology 8: 833-839 (19卯))已公开了使用粒子轰击转化来自A188-的玉米林系的技术。另外,WO 93/07278和Koziel等,(Biotechnology 11:194-200 (1993))描述了通过粒子轰击转化玉米良种自交系的技术。该技术利用在授粉后14-15天从玉米穗中切下的1.5-2.5 mm长的未成熟玉米胚和PDS-1000He生物射弹i殳备用于轰击。
稻的转化也可利用原生质体或粒子轰击通过直接基因转移技术进行。已针对Japonica-型和Indica-型描述了原生质体介导的转化(Zhang等,Plant Cell Rep 7: 379-384 (1988); Shimamoto等,Nature 338: 274-277(1989); Datta等,Biotechnology 8: 736-740 (1990))。这两种类型常规地也可使用粒子轰击转化(Christou等,Biotechnology 9: 957-962 (1991))。另夕卜,WO 93/21335描述了通过电穿孔转化稻的技术。
专利申请EP 0 332 581描述了用于生产、转化和再生早熟禾亚科(Pooideae)原生质体的技术。这些技术允许转化鸭茅属(Dactylis)和小麦。另外,Vasil等(Biotechnology 10: 667-674 (1992))已描述了使用粒子轰击进C型长期可再生愈伤组织中的小麦转化,Vasil等(Biotechnology 11:1553-1558 (1993))和Weeks等(Plant Physiol. 102: 1077-1084 (1993))还描述了使用粒子轰击未成熟胚和来自未成熟胚的愈伤组织的小麦转化。然而,用于小麦转化的特异技术涉及通过粒子轰击未成熟胚转化小麦,并且在基因递送之前包括高蔗糖或高麦芽糖步骤。在轰击之前,将任何数量的胚(长度为 0.75-1 mm )涂布于含3V。蔗糖(Murashiga & Skoog, PhysiologiaPlantarum 15: 473-497 (1962))和3 mg/1 2,4-D的MS培养基上用于诱导体细胞胚,这允许在暗中继续。在选择的轰击日,将胚从诱导培养基上取下并置于渗压剂(即以期望浓度添加蔗糖或麦芽糖的诱导培养基,所述期望浓度通常为15%)上。允许胚质壁分离2-3小时,然后进^f亍轰击。典型的是每个靶平板二十个胚,尽管不是必须的。使用标准步骤将带有适当基因的质粒(如pCIB3064或pSG35 )沉淀在微米大小的金颗粒上。使用~1000psi的爆发压,使用标准80篩目,用DuPont Biolistics⑧氦设备轰击各个胚 平板。在轰击后,将胚放置回暗中并恢复约24小时(仍然在渗压剂上)。 24小时后,将胚从渗压剂上取出并放回诱导培养基上,在那里保持一个月 后再生。约一个月后,将具有发育中胚胎发生愈伤组织的胚外植体转移至 再生培养基(MS + 1 mg/升NAA, 5 mg/升GA ),所述再生培养基还含有 适当的选择剂(在pCIB3064的情况下为10 mg/1 basta,在pSOG35的情 况下为2mg/1曱氨蝶呤)。约一个月后,将发育的茎转移至已知为"GA7s" 的更大无菌容器中,所述容器含有半浓度MS、 2%蔗糖和相同浓度的选择 剂。
还描述了使用农杆菌对单子叶植物的转化。见WO 94/00977和美国专 利第5,591,616号,均引入本文作为参考。还参见Negrotto等,Plant Cell Reports 19: 798-803(2000),其引入本文作为参考。对该实例而言,使用稻 (Oryza sativa)产生转基因植物。可使用多种稻栽培种(Hiei等,1994, Plant Journal 6:271-282; Dong等,1996, Molecular Breeding 2:267-276; Hiei等, 1997, Plant Molecular Biology, 35:205-218)。另外,下文所迷的多种培养基 组分可在数量上变化或被取代。通过在MS-CIM培养基(MSlJf出盐,4.3 g/升;B5维生素(200 x), 5 ml/升;蔗糖,30 g/升;脯氨酸,500 mg/升; 谷氨酰胺,500 mg/升;酪蛋白水解产物,300 mg/升;2,4-D (1 mg/ml), 2 m1/ 升;用1 N KOH调节pH至5.8; Phytagel, 3 g/升)上起始胚胎发生应答 和/或从成熟的胚建立培养物。接种培养物应答起始阶段的成熟胚或确立的 培养物林系,并与含有期望的载体构建体的根瘤农杆菌菌林LBA4404 (农 杆菌属)共同培养。在28。C将来自于甘油储存液的农杆菌在固体YPC培 养基(100 mg/L壮观霉素和任何其他适当的抗生素)上培f2天。将农杆 菌重悬于液体MS-CIM培养基中。将农杆菌培养物稀释至OD600为0.2-0.3 并添加乙酰丁香酮至200 nM的终浓度。在溶液与稻培养物混合之前添加 乙酰丁香酮,以诱导农杆菌将DNA转移至植物细胞。为了接种,将植物 培养物浸入细菌悬浮液中。去除液体细菌悬浮液,将接种的培养物置于共 同培养培养基上并在22。C孵育两天。然后将培养物转移至含替卡西林(400mg/升)的MS-CIM培养基上以抑制农杆菌的生长。对使用PMI可选择标 记物基因的构建体(Reed等,In Vitro Cell. Dev. Biol.-Plant 37:127画132)而 言,在7天后将培养物转移至含甘露糖作为糖类来源的选择培养基(含2% 甘露糖、300 mg/升替卡西林的MS),并在暗中培养3-4周。然后将抗性 菌落转移至再生诱导培养基(不含2,4-D,含0.5 mg/升IAA、 1 mg/升玉米 素、200 mg/升特美汀、2%甘露糖和3%山梨糖醇的MS),并在暗中培 养14天。然后将增殖的菌落转移至另一轮再生诱导培养基,并移至光照培 养室。将再生的茎转移至含GA7-1培养基(不含激素并含有2。/。山梨糖醇 的MS)的GA7容器中保持2周,然后当它们足够大并具有足够的根时移 至温室。将植物在温室中移植至土壤(T0世代),生长至成熟,并收获 Tl种子。
3.质体的转化
将珊西烟(Nicotiana tabacum c.v. 'Xanthi nc,)的种子在T琼脂培养基 上以l"的环形阵列每盘七粒播种在T琼脂培养基上,并在播种后12-14天 用1 pm鵠颗粒(M10, Biorad, Hercules, CA)轰击,所述颗粒如(Svab, Z.和 Maliga, P. (1993) PNAS 90, 913-917)所述主要用来自质粒pPH143和 pPH145的DNA包裹。将轰击的幼苗在T培养基上孵育两天,之后切下叶, 并远轴向上置于光明中(350-500 pmol光子/m2/s )含500 pg/ml盐酸壮观 霉素(Sigma, St. Louis, MO)的RMOP培养基平板上(Svab, Z., Hajdukiewicz, P.和Maliga, P, (1990) PNAS 87, 8526—8530)。将轰击后三 到八周在漂白的叶下出现的抗性茎亚克隆至相同的选择培养基上,允许形 成愈伤组织,并对次生茎进行分离和亚克隆。通过Southern印迹的标准技 术(Sambrook等,(1989) Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor)评价独立的亚克隆中转化 的质体基因组拷贝(同质性)的完全分离。在1% Tris-硼酸盐(TBE)琼脂 糖凝胶上分离BamHI/EcoRI画消化的总细胞DNA(Mettler, I. J. (1987) Plant Mol Biol Reporter 5, 346~349),转移至尼龙膜(Amersham)并用"P-标记的 随机引物DNA序列作为探针检测,该序列对应于0.7 kb BamHI/Hindlll
66DNA片段,所述片段来自含有部分rps7/12质体靶向序列的pC8。使同质 性茎在含壮观霉素的MS/IBA培养基(McBride, K. E.等,(1994) PNAS 91, 7301-7305)上无菌生才艮,并转移至温室。
V.育种和种子产生
A.育种
通过用本发明的核酸序列转化获得的植物可以是大量植物物种中任 一,包括单子叶植物和双子叶植物;然而,本发明方法中使用的植物特别 地选自上文^^开的具有农业重要性的靶作物。本发明基因的表达与具有生 产和品质重要性的其他特性組合,可通过育种整合进植物中。育种方法和 技术是本领域已知的。参见例如Welsh J. R., Fundamentals of Plant Genetics and Breeding, John Wiley & Sons, NY (1981》Crop Breeding, Wood D. R.(编著)American Society of Agronomy Madison, Wisconsin (1983); Mayo O., The Theory of Plant Breeding,第二版,Clarendon出版, Oxford (1987); Singh, D.P., Breeding for Resistance to Diseases and Insect Pests, Springer-Verlag, NY (1986); 和Wricke和Weber, Quantitative Genetics and Selection Plant Breeding, Walter de Gruyter和Co., Berlin (1986)。
操作进入上述转基因种子和植物中的遗传特性通过有性繁殖或营养生 长传递,并因此可在后代植物中保留和繁殖。 一般地,所述保留和繁殖利 用被开发为适应特定目的的已知农业方法,例如耕耘、播种或收获。也可
以使用专门化的方法如7K培法或温室技术。因为生长中的作物容易受到由
昆虫或感染引起的攻击和损伤以及与杂草植物的竟争,所以采取手段控制 杂草、植物疾病、昆虫、线虫和其他不利条件以提高产量。这些包括机械 手段如耕扭土壤或去除杂草和感染的植物,以及应用农药如除草剂、杀真 菌剂、杀配子剂、杀线虫剂、生长调节剂、熟化剂和杀昆虫剂。
在植物育种中可进一步利用转基因植物和根据本发明的种子的有利遗 传特性,其目的在于开发具有改良的特性的植物,所述改良特性例如对害 虫、除草剂或胁迫的耐受,改进的营养价值,提高的产量,或引起更少倒伏或落粒损失的改良的结构。多种育种步骤由明确确定的人为介4征, 例如选择待杂交的林系、指导亲a系的传粉、或选择适当的后代植物。 根据期望的特性,采取不同的育种手段。相关技术是本领域公知的,包括
但不仅限于杂交、近交、回交育种、多林系育种(multilinebreeding)、变种 掺合(variety blend)、种间杂交、非整倍体才支术等等。杂交^t支术还包括通过 机械、化学或生物化学手段对植物不育化,产生雄性或雌性不育植物。用 不同林系的花粉对雄性不育植物异花传粉确保雄性不育但雌性能育植物的 基因组会均一地获得两种亲^K系的特性。因此,根据本发明的转基因种 子和植物可用于改良的植物林系育种,例如提高常规方法如除草剂或杀虫 剂处理的有效性,或允许植物由于其修饰的遗传特性而进行所述方法。或 者,可获得具有改进的胁迫耐受的新作物,其由于最优化的遗传"装置,, 产生收获的产物,该产物比不能耐受同等不利发育条件的产物具有更好的品质。
B.种子生产
在种子生产中,萌发品质和种子的均一性是关键的产物特性。因为难 以使作物不含其他作物和杂草的种子,所以为了控制种子带有的疾病和生 产具有良好萌发的种子,在培育、调节(conditioning)和销售纯净种子领域 有经验的种子生产者开发了相当广泛和明确定义的种子生产实践。因此对 农民而言,购买满足特定品质标准的经过检验的种子而不是使用从其自己 作物收获的种子是常见的实践。作为种子使用的繁殖材料通常用防护涂层 处理,所述防护涂层包舍除草剂、杀昆虫剂、杀真菌剂、杀菌剂、杀线虫 剂、杀软体动物剂或其混合物。通常使用的保护性涂层包含化合物如环己 烯亚胺、萎锈灵(carboxin)、塞仑(TMTD6)、 methalaxyl (Apron6)和曱基 嘧咬磷(Actellic6)。如果期望的话,将这些化合物与制剂领域常用的其他 运载体、表面活性剂或促进应用的佐剂一起配制,提供针对细菌、真菌或 动物害虫引起的损伤的保护。可通过用液体制剂浸渍遗传材料,或通过用 组合的湿或干制剂涂布来应用保护性涂层。其他应用方法如在芽或果实处 定向处理也是可能的。VI.改变核酸分子的表达
以如下途径之一实现本发明核酸分子表达的改变
A. "有义"阻抑
通过"有义"阻抑获得本发明核苷酸序列表达的改变,特别是其表达 的降低(参考例如Jorg画en等,(1996) Plant Mol. Biol. 31, 957-973 )。在 该情况下,本发明核苷酸序列的整体或部分包含在DNA分子中。该DNA 分子与在包含靶基因的细胞(特别是植物细胞)中有功能的启动子特异地 有效连接,并被引入该细胞,其中该核苷*列可表达。核苷^列以"有 义方向,,插入DNA分子中,这意味着核苷酸序列的编码链可以被转录。 在一个具体的实施方案中,核苷酸序列是可完全翻译的,且核苷酸序列中 包含的所有遗传信息或其部分被翻译为多肽。在另 一具体的实施方案中,
核苷酸序列是可部分翻译的,并且翻译了一条短肽。在一个具体的实施方 案中,这通过在核苷酸序列中插入至少一个过早的终止密码子实现,所迷 终止密码子使翻译停止。在另一个更具体的实施方案中,核苷^列被转 录,但是未产生翻译产物。这通常通过去除核普酸序列编码的多肽的起始 密码子例如"ATG,,实现。在一个更具体的实施方案中,包含核苷酸序列 或其部分的DNA分子被稳定整合在植物细胞的基因组中。在另一具体的 实施方案中,包含核苷酸序列或其部分的DNA分子包含在染色体外复制 分子中。
在含有上段所述DNA分子之一的转基因植物中,对应于DNA分子中 包含的核苷酸序列的核苷酸序列的表达被特异降低。特別地,DNA分子中 的核苷酸序列与其表达被降低的核苷酸序列至少70%相同,更特别地至少 80%相同,还更特别地至少90%相同,还更特别地至少95%相同,还更特 别地至少99%相同。
B. "反义"阻抑
在另一具体的实施方案中,通过"反义,,阻抑获得发明核苷酸序列表 达的改变,特别是其表达的降低。本发明核苷酸序列的整体或部分包含在 DNA分子中。该DNA分子与在植物细胞中有功能的启动子特异地有效连
69接,并被引入该细胞,其中该核苷酸序列可表达。核苷酸序列以"反义方
向"插入DNA分子中,这意味着核普酸序列的反向互补序列(有时也称 作非编码链)可以被转录。在一个具体的实施方案中,包含核苷酸序列或 其部分的DNA分子被稳定整合在植物细胞的基因组中。在另一具体的实 施方案中,包含核苷酸序列或其部分的DNA分子包含在染色体外复制分 子中。引用了描迷该途径的若干出版物用于进一步阐述(Green, P. J.等, Ann. Rev. Biochem. 55:569-597 (1986); van der Krol, A. R.等,Antisense Nuc. Acids & Proteins,笫125-141页(1991); Abel, P. P.等,PNASroc. Natl. Acad. Sd, USA 86:6949-6952 (1989); Ecker, J. R.等,Proc. Natl. Acad. Sci. USANAS 83:5372-5376 (1986年8月))。
在含有上段所述DNA分子之一的转基因植物中,对应于DNA分子中 包含的核苷酸序列的核苷酸序列的表达被特异降低。特别地,DNA分子中 的核苷酸序列与其表达被降低的核苷酸序列至少70%相同,更特別地至少 80%相同,还更特別地至少90%相同,还更特别地至少95%相同,还更特 别地至少99%相同。
C.同源重纽L
在另 一具体的实施方案中,通过同源重组在基因组中修饰了对应于本 发明核苷酸序列的至少一个基因组拷贝,所述同源重组如Paszkowski等, EMBO Journal 7:4021-26 (1988)中所进一步阐述的。该技术利用同源序列 的下述特性识别彼此并通过本领域已知为同源重组的过程互相交换核苷 列。同源重组可在细胞中核苷^列的染色体拷贝和通过转化?I入细 胞的核苦*列的进入拷贝之间发生。特异的修饰因此被精确地引入核香 ^列的染色体拷贝中。在一个实施方案中,修饰了本发明核苷,列的 调节元件。这类调节元件可通过使用本发明核苷酸序列或其部分作为探针 筛选基因組文库容易地获得。现存的调节元件被不同的调节元件代替从而 改变核苷酸序列的表达,或其被突变或缺失从而消除核苷酸序列的表达。 在另一实施方案中,通过缺失部分核苷酸序列或整体核苷酸序列或通过突 变修饰核苷酸序列。本发明还涉及突变的多肽在植物细胞中的表达。已描述了对破坏内源植物基因的这些技术更近期的改进(Kempin等,Nature 389:802-803 (1997),以及Miao和Lam, Plant J., 7:359-365 (1995)。
在另一具体的实施方案中,通过用嵌合寡核苷酸转化细胞在核苦^ 列的染色体拷贝中引入突变,所述嵌合寡核苷酸由双链体构型的一段连续 的RNA和DNA残基组成,其末端上带有双重发夹帽。寡核苷酸的另一特 性是例如RNA残基处2,-0-曱基化的存在。RNA/DNA序列被设计为与本 发明核苷酸序列的染色体拷贝序列排列在一条链上(align),并含有期望 的核苷酸改变。例如,该技术在美国专利5,501,967和Zhu等,(1999) Proc. Natl. Acad. Sci. USA 96: 8768-8773中进一步阐述。
在另 一实施方案中,用对编码本发明多肽的RNA特异的催化性RNA 或核酶切割编码本发明多肽的RNA。核酶在转基因植物中表达并导致植物 细胞中编码本发明多肽的RNA数量减少,从而导致细胞中累积的多肽数 量减少。该方法在美国专利4,987,071中进一步阐述。
E.显性失活突变体
在另一具体的实施方案中,改变了本发明核普酸序列编码的多肽活性。
丧失来实现。
F. 适体
在又一实施方案中,通过在转基因植物中表达与蛋白质特异结合的核 酸配体(即所谓的适体)抑制本发明多肽的活性。优选地通过SELEX (通 过指数式富集法对配体的系统性进化)方法获得适体。在SELEX方法中, 具有随机化序列区域的单链核酸的候选混合物与蛋白质接触,并从候选混 合物的剩余部分分离对靶具有提高的亲和力的那些核酸。扩增分离的核酸 产生富含配体的混合物。若干次重复后获得对多肽具有最优亲和力的核酸, 并用于在转基因植物中表达。该方法在美国专利5,270,163中进一步阐述。
G. 锌指蛋白
也使用与本发明核苷酸序列或其调节区结合的锌指蛋白改变核苷^列的表达。特别地,核苷酸序列的转录被降低或提高。锌指蛋白例如描述
于Beerli等,(1998) PNAS 95:14628-14633.中或WO 95/19431、 WO 98/54311或WO 96/06166中,所述文献均通过参考整体并入本文。 H. dsRNA
还通过如例如WO 99/32619、 WO 99/53050或WO 99/61631中所述的 dsRNA干扰获得本发明核苷酸序列表达的改变,所述文献均通过参考整体 并入本文。在另一具体的实施方案中,通过双链RNA(dsRNA)干扰获得本 发明核苷酸序列表达的改变,特别是表达的降低。本发明核苷酸序列的整 体,特别是其部分包含在DNA分子中。该DNA分子的大小特别地为100 到1000个核苷酸或更多;最佳大小可才艮据经验确定。同一DNA分子的两 个拷贝是连接的,由间隔DNA分子隔开,使得第一拷贝和第二拷贝处于 相反的方向。在具体的实施方案中,DNA分子的第一拷贝是反向互补序列 (也已知为非编码链),第二拷贝是编码链;在最具体的实施方案中,第 一拷贝是编码链,第二拷贝M向互补序列。间隔DNA分子的大小特别 地为200到10,000个核普酸,更特别地为400到5000个核苷酸,最特别 地为600到1500个核苷酸长。间隔特别地是DNA的随机片段,更特别地 是与dsRNA干扰的耙生物无同源性的DNA随机片段,最特别地是被靶生 物有效剪接的功能性内含子。被间隔分开的DNA分子的两个拷贝与在植 物细胞中有功能的启动子有效连接,并被引入植物细胞中,核苷酸序列可 在该细胞中表达。在一个具体的实施方案中,包含核苷酸序列或其部分的 DNA分子,皮稳定整合进植物细胞的基因組中。在另 一具体的实施方案中, 包含核苷酸序列或其部分的DNA分子包含在染色体外复制的分子中。引 用了描述该方法的若干出版物用于进一步阐述(Waterhouse等,(1998) PNAS 95:13959-13964; Chuang和Meyerowitz (2000) PNAS 97:4985-4990; Smith等,(2000) Nature 407:319-320)。通过dsRNA干扰改变核苷酸序列 的表达还描述于例如WO 99/32619、 WO 99/53050或WO 99/61631中,其 均通过参考整体并入本文。
在含有上段所迷DNA分子之一的转基因植物中,对应于DNA分子中包含的核苷酸序列的核苷酸序列的表达被特异降低。特别地,DNA分子中 的核苷酸序列与其表达被降低的核苷酸序列至少70%相同,更特别地至少 80%相同,还更特别地至少90%相同,还更特别地至少95%相同,还更特 别地至少99%相同。
I.插入DNA分子(插入i秀变)
在另 一具体的实施方案中,DNA分子被插入本发明核苷酸序列的染色 体拷贝或其调节区中。特别地,这类DNA分子包含能够在植物细胞中转 录的转座元件,例如Ac/Ds、 Em/Spm、突变子(mutator)。或者,DNA分 子包含农杆菌T-DNA的T-DNA边界。T-DNA分子也可包含重组酶或整 合酶识别位点,该位点可用于从植物细胞的染色体去除DNA分子的部分。 也包括使用T-DNA、转座子、寡核苷酸的插入诱变方法或本领域技术人员 已知的其他方法。使用T-DNA和转座子用于插入诱变的方法描述于 Winkler等,(1989) Methods Mol. Biol. 82:129-136和Martienssen (1998) PNAS 95:2021-2026中,其通过参考整体并入本文。
丄缺失i秀变
在另一实施方案中,通过缺失核苷酸序列或调节序列的一部分,在细 胞或植物中序列的基因组拷贝中创建本发明核酸分子的突变。缺失诱变的 方法是本领域技术人员已知的。参见例如Miao等,(1995) Plant丄7:359。
在另一实施方案中,通过化学诱变或辐射在大的植物群体中随机产生 缺失,并通过正求或反求遗传学分离在本发明的基因中具有缺失的植物。 已知用快中子或y射线辐照引起植物中的缺失突变(Silverstone等,(1998) Plant Cell, 10:155-169; Bruggemann等,(1996) Plant J., 10:755-760; Redei 和Koncz, 在Methods in Arabidopsis Research, World Scientific出版 (1992),第16-82页)。如在秀丽新小杆线虫(C.elegans)中所示(Liu等,(1999), Genome Research, 9:859-867.),可使用PCR在反求遗传学策略中恢复本发 明基因中的缺失突变,所迷PCR使用合并的基因组DNA集合。正求遗传 学策略应涉;S^艮示PTGS的抹系的诱变,随后针对PTGS的缺失筛选M2 后代。可期望这些突变体中的一些破坏了本发明的基因。这可通过针对本
73发明基因的Southern印迹或PCR,用来自这些突变体的基因组DNA进行 评价。
K.在植物细胞中过量表达
在另 一具体的实施方案中,本发明的编码多肽的核苷酸序列被过量表 达。用于过量表达本发明核酸分子的核酸分子和表达盒的实例在上文描述。 本发明还包括本领域技术人员已知用于过量表达核酸分子的方法。
在一个具体的实施方案中,在植物的每个细胞中改变了本发明核苷酸 序列的表达。这例如通过同源重组或通过在染色体中插入获得。也可通过 例如在下述启动子的控制下表达有义或反义RNA、锌指蛋白或核酶获得, 所述启动子能够在植物的每个细胞中表达有义或反义RNA、锌指蛋白或核 酶。组成型表达,诱导性、组织特异性或发育调节性表达也在本发明的范 围内,并导致本发明的核苷酸序列在植物细胞中表达的组成型、诱导性、 组织特异性或发育调节性改变。根据本发明的教导(例如如下文所述)制 备下述构建体并转化进植物细胞中,所述构建体用于表达有义或反义 RNA、锌指蛋白或核酶,或用于过量表达本发明的核苷酸序列。
VII.多肽
本发明还涉及包含M酸序列SEQIDNO: 2的分离的多肽。具体地, 包含M酸序列SEQ ID NO: 2的分离的多肽和具有保守氨基酸修饰的变 体。本领域技术人员会明白,对核酸、肽、多肽或蛋白质序列的各个取代、 缺失或添加(其改变、添加或缺失编码的序列中单个氨基酸或小比例的氨 基酸)是"保守修饰,,,所述修饰导致用化学上类似的g酸取代氨基酸。 保守修饰的变体提供与未经修饰的多肽相似的生物学活性。列出功能类似 的氨基酸的保守取代的表格是本领域已知的。参见Crighton (1984) Proteins, W.H. Freeman and Company。
在一个具体的实施方案中,与多肽序列SEQ ID NO:2或其外显子或结 构域具有基^目似性的多肽是SEQ ID NO:2所示多肽序列的等位变体。在 另一具体的实施方案中,与SEQ ID NO:2所示多肽序列具有基;M目似性的 多肽或其外显子或结构域,是SEQ ID NO:2所示多肽序列的天然存在的变体。在另一具体的实施方案中,与SEQIDNO:2所示多肽序列具有基本相 似性的多肽或其外显子或结构域,是SEQ ID NO:2所示多肽序列的多态变 体。
在一个备选的具体的实施方案中,具有基;M目似性的序列含有至少一 个氨基酸的缺失或插入。在一个更具体的实施方案中缺失或插入为少于约 io个氨基酸。在一个最具体的实施方案中,缺失或插入为少于约三个M酸。
在一个具体的实施方案中,具有基本相似性的序列编码至少一个M 酸处的取代。
本发明的实施方案还考虑了分离的多肽,该多肽包含多肽序列,该多 肽序列包括
(a) SEQ ID NO: 2中所列出的多肽序列、或它的外显子或结构域;
(b) 与(a)具有基本相似性的多肽序列;
(c) 多肽序列,该多肽序列由核苷酸序列进行编码,该核苷酸序 列与SEQ ID NO: 1中所列出的核苷酸序列、或其外显子或结构域、或与 它互补的序列相同或具有基本相似性;
(d) 多肽序列,该多肽序列由核苷酸序列进行编码,该核苷酸序 列能够在中度严格性条件下与SEQ ID NO: 1中所列出的核苷^列或与 之互补的序列进行杂交;或
(e) (a)、 (b)、 (c)或(d)的功能片段。
在另 一具体的实施方案中,具有基本相似性的多肽是SEQ ID NO:2所 示多肽序列或其片段、结构域、重复或嵌合体的等位变体。在另一具体的 实施方案中,分离的核酸包含来自下述核苷酸序列编码的多肽序列的大量 区域,所述核苦酸序列与SEQ IDNO:l所示核苷酸序列或其片段或结构域 或与之互补的序列相同或具有基^M目似性。
在另一具体的实施方案中,多肽是SEQIDNO:2所示多肽。在另一具 体的实施方案中,多肽是功能性片段或结构域。在另一具体的实施方案中, 多肽是嵌合体,其中该嵌合体可包含功能性蛋白质结构域(包括结构域、重复、翻译后修饰位点)或其他特性。在一个更具体的实施方案中,多肽 是植物多肽。在一个更具体的实施方案中,植物是双子叶植物。在一个更 具体的实施方案中,植物是棵子植物。在一个更具体的实施方案中,植物 是单子叶植物。在一个更具体的实施方案中,该单子叶植物是谷物。在一 个更具体的实施方案中,谷物可以是例如玉米、小麦、大麦、燕麦、棵麦、 粟、高粱、黑小麦、黑麦属、单粒小麦、斯佩耳特小麦、双粒小麦、画眉 草、蜀黍、亚麻、格兰马草、磨擦草属物种和玉米草。在另一具体的实施 方案中,谷物是稻。
在一个具体的实施方案中,多肽在植物的特异位置或组织中表达。 在一个更具体的实施方案中,该位置或组织为例如但不限于表皮、维管组 织、分生组织、形成层、皮层或髓。在一个最具体的实施方案中,该位置 或组织为叶或鞘、根、花和发育中的胚珠或种子。在一个更具体的实施方 案中,该位置或组织可以是例如表皮、根、维管组织、分生組织、形成层、 皮层、髓、叶和花。在一个更具体的实施方案中,该位置或组织为种子。
在一个具体的实施方案中,由下迷核苦,列编码的多肽序列包含至
少一个核苷酸的缺失或插入,所迷核苷酸序列与SEQIDNO:l所示核苦酸 序列,或其片段或结构域或与之互补的序列具有基本相似性。在一个更具 体的实施方案中,缺失或插入少于约三十个核苷酸。在一个最具体的实施 方案中,缺失或插入少于约五个核苷酸。
在一个具体的实施方案中,由下迷核香酸序列编码的多肽序列包含至 少一个密码子的取代,所述核苷酸序列与SEQ ID NO:l所示核苷酸序列或 其片段或结构域或与之互补的序列具有基本的相似性。在一个更具体的实 施方案中,该取代是保守的。
在一个具体的实施方案中,与SEQIDNO:2所示多肽序列或其片段、 结构域、重复或嵌合体具有基本相似性的多肽序列包含至少一个氨基酸的 缺失或插入。
本发明的多肽、其片段或变体可包含来自本发明多肽的任何数量的连 续氨基酸残基,其中所述残基数量选自由10到本发明全长多肽的残基数组
76成的整数组。特别地,多肽的部分或片段是功能性蛋白质。本发明包括下
述活性多肽,其具有天然(非合成的)内源多肽比活性的至少20%、 30% 或40%,特别地至少50%、 60%或70%,最特别地至少80%、 90%或95%。 另夕卜,底物特异性(kcat/Km)任选地与天然(非合成的)的内源多肽基本相 似。通常,Km会是天然内源多肽的至少30%、 40%或50%;更特别地是 至少60%、 70%、 80%或卯%。测定和定量测定活性和底物特异性的方法 是本领域技术人员公知的。
作为免疫原存在时,本发明的分离的多肽会引发与本发明多肽特异反 应的抗体的生产。因此,为了例如但不仅限于免疫测定或蛋白质纯化技术 的目的,本发明的多肽可用作免疫原,用于构建与本发明的蛋白质免疫反 应的抗体。测定结合的免疫测定法是本领域技术人员公知的,例如但不仅 限于ELISA或竟争性免疫测定法。
本发明的实施方案还涉及由本公开内容的分离的核酸分子编码的嵌合 多肽,其包括含有由下述分离的核酸编码的多肽序列的嵌合多肽,所述分 离的核酸含有下迷核苷酸序列,其包括
(a) 如SEQ ID NO:l所示的核苦酸序列或其外显子或结构域,
(b) 与(a)具有基;M目似性的核苷酸序列;
(c) 能够与(a)杂交的核苷酸序列;
(d) 与(a)、 (b)或(c)互补的核苷酸序列;或
(e) 是(a)、 (b)或(c)的反向互补序列的核苷酸序列;或
(f) 其功能性片段。
含有由分离的核酸编码的多肽序列的多肽,所述核酸含有编码下述多 肽的核苷^列、其互补序列或其反向互补序列,所述多肽包含下述多肽 序列
(a) SEQIDNO:2所示的多肽序列,或其结构域、重复或嵌合体;
(b) 与(a)具有基本相似性的多肽序列;
(c) 由下述核苷酸序列编码的多肽序列,所述核苷酸序列与SEQ ID NO:l所示核苷酸序列或其外显子或结构域或与之互补的序列相同或具有基本的相似性;
(d) 由下述核苷酸序列编码的多肽,所述核苷酸序列在中度严格性条 件下能够与SEQIDNO:l所示核苷酸序列或与之互补的序列杂交;和(a)、 (b)、 (c)或(d)的功能性片段;或
(e) 其功能性片段。
本发明的分离的核酸分子适用于在重組改造的细胞如细菌、酵母、昆 虫、哺乳动物或植物细胞中表达本发明的多肽。该细胞在非天然条件(例 如数量、组成、定位和/或时间)下产生多肽,因为其坤皮il传改变为如此。 本领域才支术人员知道可用于表达編码本发明蛋白质的核酸的大量表达体 系,并且不在下文中详细描述这些体系。
简言之,通常例如通过将核酸或cDNA与启动子(组成型或可调节的) 有效连接,然后整合ii^达载体中实现编码本发明的多肽的分离的核酸的 表达。栽体适用于在原核生物或真核生物任一中复制和/或整合。常用的表 达栽体包含转录和翻译终止子、起始序列和用于调节编码多肽的核酸分子 表达的启动子。为了获得所克隆的核酸分子的高水平表达,期望使用指导 转录的包含强启动子、用于翻译起始的核糖体结合位点和转录/翻译终止子 的表达载体。本领域技术人员应当明白可对本发明的多肽进行修饰而不减 小其生物学活性。可进行一些修饰来利于本发明多肽的克隆、表达或it^ 融合蛋白的整合。此类修饰是本领域公知的,并包括但不仅限于在氨基端 添加以提供起始位点的甲硫氨酸,或置于任一末端以创建方便定位纯化序 列的额外氛基酸(例如多聚组氨酸(poly Histadine))。也可向载体中引入 限制性位点或终止密码子。
在一个具体的实施方案中,表达载体包含一个或多个元件,例如但不 限于启动子增强子序列、选择标记物序列、复制起点、表位标签编码序列, 或亲和纯化标签编码序列。在一个更具体的实施方案中,启动子增强子序 列可以是例如CaMV 35S启动子、CaMV 19S启动子、烟草PR-la启动子、 遍在蛋白启动子和菜豆蛋白启动子。在另一实施方案中,启动子可在植物 中工作,更特别地为组成型或诱导性启动子。在另一具体的实施方案中,选择标记物序列编码抗生素抗性基因。在另一具体的实施方案中,表位标
签序列编码V5、肽Phe-His-His-Thr-Thr、血凝素或谷胱甘肽-S-转移酶。 在另 一具体的实施方案中,亲和纯化标签序列编码多聚M酸序列或多肽。 在一个更具体的实施方案中,多聚M酸序列为多聚组氨酸。在一个更具 体的实施方案中,多肽是壳多糖结合结构域或谷胱甘肽-S-转移酶。在一个 更具体的实施方案中,亲和纯化标签序列包含内含肽编码序列。
可使用原核细胞作为宿主细胞,例如但不仅限于大肠杆菌和本领域已 知的其他微生物菌林 用于在原核生物中表达蛋白质的方法是本领域技术 人员7〉知的,并可见于许多实验室手册如Molecular Cloning: A Laboratory Manual, J. Sambrook 等,(1989, Cold Spring Harbor Laboratory出版)中。本领域技术人员可获得大量控制表达的启动子、核 糖体结合位点和操纵子,也可获得可选择标记物如抗生素抗性基因,选择 的载体类型是为了允许最佳生长和在选定的细胞类型中表达。
可获得大量真核生物表达体系,例如但不仅限于酵母、昆虫细胞系、 植物细胞和哺乳动物细胞。异源蛋白质在酵母中的表达和合成是公知的(见 Sherman等,Methods in Yeast Genetics, Cold Spring Harbor Laboratory 出版,1982)。广泛用于产生真核生物蛋白质的常用酵母菌林是酿酒酵母 (Saccharomyces cerevisiae)和巴斯德毕赤酵母(Pichia pastoris),并且可从商 业供应商(例如Invitrogen)获得用于表达的栽体、菌林和方案。
可用用于产生蛋白质的表达载体转染哺乳动物细胞体系。本领域技术 人员可获得许多合适的宿主细胞系,例如但不限于HEK293、 BHK21和 CHO细胞系。用于这些细胞的表达载体可包含表达控制序列如复制起点、 启动子(例如CMV启动子、HSV tk启动子或磷酸甘油酸酯激酶(pgk)启 动子)、增强子和蛋白质加工位点,如核糖体结合位点、RNA剪接位点、
多聚腺普酸化位点和转录终止序列。适用于产生蛋白质的其他动物细胞系 可商业获得或来自保藏机构如美国典型培养物保藏中心。
用于在昆虫细胞中表达蛋白质的表达栽体通常来自SF9杆状病毒或本 领域已知的其他病毒。可获得大量合适的昆虫细胞系,包括但不仅限于蚊幼虫、蚕、勦虫(armyworm)、蛾和果蝇(Drosophila)细胞系。
转染动物和低等真核细胞的方法是已知的。使用大量方法制备真核细 胞感受态以引入DNA,所述方法包括但不仅限于磷酸钓沉淀、受体细胞 与含有DNA的细菌原生质体的融合、用含有DNA的脂质体处理受体细胞、 DEAE糊精、电穿孔、生物射弹和将DNA直接显微注射进细胞中。转化 的细胞使用本领域公知的手段培养(参见Kuchler, R.J., Biochemical Methods in Cell Culture and Virology, Dowden, Hutchinson and Ross, Inc. 1997)。
一旦本发明的多肽^L^达,可使用本领域技术人员已知的方法将其从 细胞中分离和纯化。可使用Western印迹技术或放射免疫测定或其他标准 的免疫测定冲支术监测纯化过程。蛋白质纯化技术是本领域技术人员公知和 使用的(参见R. Scopes, Protein Purification: Principles and Practice, Springer-Verlag, New York 1982: Deutscher, Guide to Protein Purification, Academic出版(1990))。本发明的实施方案提供了产生重组蛋白质的方 法,其中表达载体包含一个或多个元件,包括启动子增强子序列、选择标 记物序列、复制起点、表位标签编码序列,和亲和纯化标签编码序列。在 一个具体的实施方案中,核酸构建体包含表位标签编码序列,且分离步骤 包括使用对该表位标签特异的抗体。在另一具体的实施方案中,核酸构建 体含有多聚氨基酸编码序列,且分离步骤包括使用包含多聚氨基酸结合物 质的树脂,特别是多聚氨基酸为多聚組氨酸且多聚氨基酸结合树脂为镍-带电琼脂糖树脂。在另一具体的实施方案中,核酸构建体含有多肽编码序 列,且分离步骤包括使用含多肽结合物质的树脂,特别是多肽为壳多糖结 合结构域且树脂含有壳多糖-琼脂糖凝胶。
本发明的多肽可以使用本领域技术人员已知的非细胞合成方法合成。 用于固相合成的才支术由Barany和Mayfield, Solid-Phase Peptide Synthesis, 在Peptides: Analysis, Synthesis, Biology,笫2巻第3-284页,Special Methods in Peptide Synthesis, Part A; Merrifield等,J. Am. Chem. Soc. 85:2149-56 (1963)和Stewart等,Solid Phase P印tide Synthesis,第二版,
80Pierce Chem. Co" Rockford, IL (1984)描述。
本发明还提供了修饰(即提高或降低)植物或其部分中本发明多肽的 浓度或组成的方法。修饰可通过提高或降低植物中的浓度和/或组成(即本 发明多肽的比例)实现。该方法包括向植物细胞中引入表达盒以获得转化 的植物细胞或組织,并培养转化的植物细胞或组织,所述表达盒含有本发 明的核酸分子,或编码如上所述OsGATAll序列的核酸。核酸分子可处于 组成型或诱导性启动子的调节下。该方法还可包括以足够修饰植物或植物 部分中浓度和/或组成的时间诱导或阻遏核酸分子序列在植物中的表达。
可使用本领域技术人员已知的方法对具有修饰的本发明核酸分子表达 的植物或植物部分进4于分才斤和选择,所述方法包括但不限于Southern印 迹、DNA测序或使用该核酸分子特异引物的PCR分析,并检测由其产生 的扩增子。
一般,相对于缺乏表达盒的对照植物、植物部分或细胞,浓度或组成 提高或降低至少5%、 10%、 20%、 30%、 40%、 50%、 60%、 70%、 80% 或卯%。
在光合作用植物中糖是许多生命过程的中心调节物,如光合作用、碳 和氮代谢,并且这种调节是通过调节基因表达(激活或阻遏有关基因)而 实现的。糖控制基因表达的机理还不是很了解。这里所公开的这种GATA 转录因子参与了调节糖感知,并且这种因子本身的表达受到N状况的变化
的影响。这个基因的表达提高能够产生具有提高产量的植物,特别是当糖 信号传导途径的操作能够导致光合作用提高以及氮利用提高并改变种子、
块茎(tube)、根、以及其他贮藏器官中的源库关系时。
本发明会参考以下的详细实施例进一步描述。除非另有说明,这些实 施例仅就说明的目的提供,而非旨在限制。
实施例
本文使用的标准重組DNA和分子克隆技术是本领域公知的,并由J. Sambrook等,Molecular Cloning: A Laboratory Manual,第三版,ColdSpring Harbor, NY: Cold Spring Harbor Laboratory出版(2001);由T丄 Silhavy、 M丄.Berman和L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1984)和由 Ausubel, F.M.等,Current Protocols in Molecular Biology, New York, John Wiley和Sons Inc., (1988), Reiter等,Methods in Arabidopsis Research, World Scientific出版(1992)和Schultz等,Plant Molecular Biology Manual, Kluwer Academic Publishers (1998)描述。
实验背景与操作
A. 在限制氮的条件下确定稻和玉米的生长条件 在过去的研究涉及到硝酸盐摄取和同化作用的基因的实验中,诸位发
明人以及其他人已经利用了多种生长条件,在这些生长条件下硝酸盐通常 过量存在或整体缺乏。在后情况中,硝酸盐被通常加至在其缺乏的条件下 生长的^f直物中以^^理解这些基因和其他基因的硝酸盐调节。尽管这种类型 的极端处理在定义基因调节的某些方面是有用的,但它不适宜于获得对氮 限制的效果的更好的理解。诸位发明人已经定义了 了拟南芥属中氮限制生 长的条件(Bi等人2007 BMC Genomics 8:281)。这涉及发展了使用 Rockwool的系统(Hirai等人"1995 Plant Cell Physiol 36, 1331-1339 )并 定义三种条件条件之一是其中生长达到最大;条件之一是其中氮将生长 限制到最大生长水平的70%到75%;条件之一是其中更严重的限制到最大 生长水平的30%到35%。氮限制作用为"胁造",通过改变硝酸盐的浓度容 易地使"胁迫,,的量发生变化。诸位发明人通过测量硝酸盐、叶绿素(它经 常作为在田间条件下氮状况的反映而进行使用-参见例如,Fox RH等人 2001 Agron J. 93, 590-597; Minotti PL等人 1994 Hort Science 29, 1497-1550)、氮基酸水平、以及硝酸还原酶以及谷氨酰胺合成酶的活性而 测定了生理学的"氮状况",从而给出评估突变品系的研究的基准线。
B. 在氮限制情况下针对拟南芥属植物的表达概况分析实验转录本的表ii^t况分析(expression profiling )可被用来同时测定大量基因的RNA水平。过去已经做了大量的这些类型的实验,并且如果该实验体系容易控制,则这些实验可用来准确定位出生物在不同条件下的"表
达状况",并使用这种信息对哪些基因和途径参与不同的过程做出假设。诸位发明人发现生长条件的差异越深,在这些生长条件下所生长的植物之间的转录本的概况(transcript profile)的差异就越大,并且破译哪些变化是最重要的就越困难。在这一领域中唯一公布的全基因组概况分析实验是在拟南芥属中的实验,其中研究了在硝酸盐水平上的极端变化(WangR等人2003 Plant Physiol. 132, 556-67 )。在氮限制的情况中,诸位发明人研究了生长中的植物在慢性氮胁迫下的效果以及在可供使用的氮的水平上的变化。诸位发明人已经在拟南芥属中确定了不同氮水平对生长的影响。
研究了不同的氮水平对转录;^阮况的影响其中氮没有限制生长。对于拟南芥属而言,诸位发明人收集了在不同的氮方案下生长的4周龄幼苗。为了得到在统计学上显著的结果,收集了三个不同的样本(生物 学的一式三份)。使用ArabidopsisGeneChip⑧全基因组阵列(Affymetrix)进行转录本概况分析,以便研究拟南芥属中的转录本的水平。进行了对于研究由这些实验所产生的大量数据而言所必需的生物信息学分析。通过研究氮限制对表i^漠式的作用,诸位发明人可以准确定位出哪些途径参与了它们对养分胁迫的应答。
实施例1
材料与方法
控射长餅
将泥炭藓和蛭石(vermiculate ) (1:4 ) ( SunGro Horticulture CanadaLtd. BC, Canada )用来培育稻的Kaybonnet植物, 一周一次添加含有不同量的硝酸盐的营养液直到收获。该营养液含有4mMMgS04、 5mMKCl、5 mM CaCl2、 1 mM KH2P04、 0.1 mM Fe-EDTA、 0.5 mM MES (pH6.0)、9 p M MnS04、 0.7 Zn S04、 0.3 CuS04、 46 jaM NaB407以及0.2 jaM(NH4)6Mo702。对于限制性N条件而言,使用3mM的N溶液, 一周一次直至收获。对于充足的N条件而言,最初六周使用10mM N溶液一周一次,更换成5mM的N溶液又持续6周,并且更换成3mM的N溶液直至收获。最初四周使植物在生长室生长(在28至30。C给予16小时光照(约400 pmolm-Y1)并且在22至24°C处于黑暗中8小时),并接着有一周短日照的处理(10小时光照/14小时黑暗)。之后,将植物移到温室中生长直到收获。
制备了过量表达OsG^7M〃或使0sO47^/7沉默的构建体。RNAi序列的序列显示在SEQ ID NO: 8中。包含RNAi序列作为由茎环结构分开的反向重复的构建体的序列显示在SEQ ID NO: 9中。对过量表达OsG^7M//或使OsG^7^//沉默(RNAi)的Tl转基因种子进行分析。
橫差西控浙的差药为、费
将叶样品在300 pi緩冲液(Strategic Diagnostics Inc. Part # 7000006 )中磨碎。将一个试紙条(dipstick)( Strategic Diagnostics Inc. Part # 7000052 )插至试管中并放置约15分钟,进行一段时间使得试纸条上的线条清晰。在条紋(strip)上出现一条红线(对照)指示阴性结果。在条紋上出现两条红线(对照和测试)指示阳性结果。
通过半定量RT-PCR进行表达分析
使用所提取的一微克总RNA来制备cDNA。 C^GJ7M//的引物是5,-CGTCGAGCACCAAGGGCAAATC-3, ( SEQ ID NO: 3 )以及5,-GGATAGGGTCATGAGCAGCATGG-3, ( SEQ ID NO: 4 ) 。 Os微管蛋白(0sr"6"//")的引物是5,-AGGAGGATGCCGCTAACAACTTTG-3,(SEQ ID NO: 5 )以及5,- AAACAGCATTGGTGATTTCAGGC-3, ( SEQID NO: 6)。
Y绿素的浙J1
使用Minolta SPAD 502DL叶绿素计(Tokyo, Japan)测量总叶绿素,或由乙醇进行提取并根据Kirk (1968)通过分光光度计对总叶绿素进
84行测量。
从处于限制氮的条件(3mM)下所生长的4周龄野生型和转基因植物中收获叶子,将叶子在液氮中冷冻并储存在-80。C用于以下的生物化学分析。将硝酸盐从冷冻的叶子中提取出来并根据Clothern等人(1975 )的方法进行测定。用在HEPES-KOH緩冲液(pH7.4)中的80%、 50%、 0%的乙醇成功提取了总氨基酸,并将集合的上清液用于总氨基酸测定,如Rosen (1957)所说明。为了提取可溶性蛋白质,将冷冻的叶的粉末重悬于100 mM HEPES-KOH (pH 7.5) + 0.1% Triton X-100緩冲液中,并以14,000 rpm离心10 min。使用商业的蛋白质测定试剂叙Bio-Rad, Hercules,CA)确定上清液中总的可溶性蛋白的含量。如由Geiger等人(1998)所说明提取可溶性糖,并使用可商购的试剂盒(Megazyme, Irelan )测定葡萄糖、果糖以及蔗糖的含量。结果
对《^转差賴控沩的衷略
用于最初的遗传和表型分析的策略涉及在主要为限制氮(N)的条件下生长来自每个构建体的5种转基因事件(transgenic event)(约18林植物)。还有一些植物生长在N充足的条件下(约10林植物)。将PMI条用于基因分型以检测可选择的标记物尸M7。通过半定量RT-PCR对转基因表达水平进行测试。记录了叶绿素水平、秆长度、分蘖数目、圆锥花序的数目、开花时间、种子产量以及;f支条生物量。
过量4这Os04rA /的控游的4费
OsGATAll基因在蛋白质水平上与/4f047^基因(爿"g2675。,图3)具有约34%的相似性。当转基因植物在限制N的条件下大约4周龄时测量了总的叶绿素水平。与野生型对照植物(6林植物)相比,从PMI阳性植物(3至6林植物)的平均值看,至少两个转基因事件(事件5和事件6)具有显著的更高的叶绿素含量(图4A)。那些转基因植物的Os047M/J基因的表达确实提高(图4B)。为了确定叶綠素水平能受到OsGATAll基因的表达水平的影响,对转基因的RNAi OsGATAll植物进行了分析。在转基因的RNAi OsGATAll植物中( s(^47M77基因的表达水平显著降低(图5A),并且实际上在那些植物中叶绿素水平显著更低(图5B)。在限制N的条件下与11林野生型对照植物的平均值相比,从10林PMI阳性植物的平均值看, 一个事件(事件6)具有高出约20%的种子产量(图6A)。在充足N的条件下与6林野生型对照植物的平均值相比,从4林PMI阳性植物的平均值看,这一相同的事件具有几乎两倍的种子产量(图6B)。同样,生长在高N下的植物在从生长室转移到温室之后经历了胁迫,并且这些转基因植物对该胁迫的应答更好(图7) 。 OsGATAll基因的表达的调节影响了葡萄糖(图8A)、果糖(图8B)、以及蔗糖(图8C)的水平,并且影响了硝酸盐(图9A)、氨基酸(9B)以及蛋白质(图9C)的水平。
现在已经通过以上的实例对本发明的具体的实施方案进行了说明,这些实例并非旨在进行限制,本发明将在以下权利要求书中进行进一步阐明。本领域的普通技术人员将会认识到,权利要求书也允许包含除了该权利要求书字面范围以外的等效物。
8权利要求
1.调节植物或植物细胞中的特性的方法,其包括调节植物或植物细胞中的GATA转录因子的表达,其中GATA转录因子包括(a)SEQ ID NO1的核苷酸序列;(b)编码SEQ ID NO2的多肽的核苷酸序列;或(c)能够与(a)或(b)进行杂交的核苷酸序列,并且其中所述特性选自叶绿素合成、种子产量、胁迫耐受性、硝酸盐水平、氨基酸水平以及糖积累。
2. 如权利要求1所述的方法,其中GATA转录因子基因的表达是通过给予植物或植物细胞有效量的活性物质来进行调节,所述活性物质能够调节在植物细胞中GATA转录因子基因的表达水平。
3. 如权利要求2所述的方法,其中活性物质增强了在植物或植物细胞中GATA转录因子的表达水平。
4. 如权利要求3所述的方法,其中受调节的特性是以下各项中的一项或多项的提高或改善叶绿素合成、种子产量、胁迫耐受性、硝酸盐水平、氨基酸水平以及糖积累。
5. 如权利要求3或4所述的方法,其中增强植物或植物细胞中的GATA转录因子基因的表达水平的活性物质包括编码GATA转录因子的核酸分子,其中所述核酸分子表达于植物或植物细胞中。
6. 如权利要求5所述的方法,其中核酸分子包括(a) SEQID NO: 1的核苷^列或其片段或结构域;(b) 编码SEQ ID NO:2的多肽的核苷酸序列、其片段或结构域;(c) 与(a)或(b)具有基本相似性的核苷酸序列;(d) 能够与(a)、 (b)或(c)进行杂交的核苷酸序列;(e) 与(a)、 (b)、 (c)或(d)互补的核苷酸序列;或(f) 核苷酸序列,它是(a)、 (b)、 (c)或(d)的反向互补序列。
7. 如权利要求5所述的方法,其中核酸分子包括SEQ ID NO: 1的OsGATAll基因的序列或其功能片段。
8. 如权利要求5所述的方法,其中核酸分子包括序列,所述序列在中度严格性条件下与SEQ ID NO: 1的OsGATAll基因或其功能片段进行杂交。
9. 如权利要求5所述的方法,其中核酸分子包括核酸序列,所述核酸序列衍生自SEQ ID NO: 1的OsGATAll基因的核普酸序列,并且具有包括对植物中的表达特异的密码子的核苷酸序列。
10. 如权利要求5至9中的任何一项所述的方法,其中所述核酸序列表达于植物的特定的位置或組织中。
11. 如权利要求10所述的方法,其中所述位置或组织选自下述中的一项或多项种子、表皮、根、维管組织、分生组织、形成层、皮层、髓、叶、以及花。
12. 如权利要求ll所述的方法,其中所述位置或组织是种子。
13. 如权利要求5至12中的任何一项所述的方法,其中增强植物细胞中的GATA转录因子基因的表达水平的活性物质包括表达盒,所M达盒包括启动子序列,所述启动子序列与编码GATA转录因子的核酸有效连接。
14. 如权利要求3所述的方法,其中能够调节植物或植物细胞中的GATA转录因子的表达水平的活性物质包括(a) 在SEQIDNO:2中所示出的多肽序列,或其功能片段、结构域、重复、或嵌合体;(b) 与(a)具有基本相似性的多肽序列;(c) 由核苷酸序列所编码的多肽序列,所述核苷酸序列与在SEQ IDNO: l中所列出的核苦^列、或其功能片段或结构域、或与它互补的序列相同或具有基本相似性;或(d) 由核苷酸序列所编码的多肽序列,所述核苷酸序列能够在中度严格性条件下与在SEQ ID NO: 1中所列出的核苷酸序列、或与之互补的序列进行杂交。
15. 如权利要求2所述的方法,其中所述活性物质减少了在植物或植物细胞中GATA转录因子的表达水平。
16. 如权利要求15所述的方法,其中受调节的特性是以下各项中的一项或多项的降低或减少叶绿素合成、种子产量、胁迫耐受性、硝酸盐水平、氨基酸水平以及糖积累。
17. 如权利要求15或16所述的方法,其中降低了植物或植物细胞中的GATA转录因子基因的表达水平的活性物质包括核酸分子,其阻抑或抑制GATA转录因子。
18. 如岸又利要求17所述的方法,其中核^A干扰RNA (RNAi)。
19. 如权利要求1至18中的任何一项所述的方法,其中植物细胞是双子叶植物、棵子植物、或单子叶植物。
20. 如权利要求19所述的方法,其中单子叶植物是选自玉米、小麦、大麦、燕麦、棵麦、粟、高粱、黑小麦、黑麦属、单粒小麦、斯佩耳特小麦、双粒小麦、画眉草、蜀黍、亚麻、格兰马草、磨擦草属物种和玉米草。
21. 如4又利要求20所述的方法,其中双子叶植物是选自大豆、烟草或棉花。
22. 产生转基因植物的方法,其包括(1) 提供具有下述序列的分离的核酸,所述序列包括(a) SEQ ID NO: 1的核苷酸序列或其片段或结构域;(b) 编码SEQ ID NO:2的多肽的核苦酸序列、其片段或结构域;(c) 与(a)或(b)具有基本相似性的核苷酸序列;(d) 能够与(a)、 (b)或(c)进行杂交的核苷酸序列;(e) 与(a)、 (b)、 (c)或(d)互补的核苷酸序列;或(f) 核苷酸序列,它是(a)、 (b)、 (c)或(d)的反向互补序列;以及(2) 将所迷核酸引入植物之中,其中所述核酸在植物中表达。
23. 如权利要求22所述的方法,其中植物表现出在以下的一项或多项中的提高或改善叶绿素合成、种子产量、胁迫耐受性、硝酸盐水平、氨基酸水平以及糖积累。
24. 如权利要求23所述的方法,其中植物在叶绿素合成、种子产量和/或胁迫耐受性上具有提高。
25. 如权利要求22至24中的任何一项所迷的方法,其中使用方法将核酸引入植物之中,所述方法选自微粒轰击、农杆菌介导的转化、以及颈须-介导的转化。
26. 由权利要求22至25中的任何一项产生的植物的植物细胞。
27. 核酸分子的用途,所述核酸分子包括具有至少10个碱基的核苷^列,该序列与SEQIDNO: 1、或其功能片段的任何区域相同、互补、或基本上相似,并且其中所迷用途选自核苷酸位置的用途;(ii) 作为RFLP分析标记物的用途;(iii) 作为数量性状关联育种的标记物的用途;(iv) 作为标记物-辅助育种的标记物的用途;(v) 作为钓饼序列在双杂交体系中用于鉴定编码多肽的序列的用途,所述多肽与钓斜序列编码的多肽相互作用;(vi) 作为对个体或个体群进行基因分型或鉴定的诊断指示物的用途;和(vii) 用于鉴定基因或外显子边界的遗传分析的用途。
28. 针对分离的多肽所产生的抗体,所述多肽包括(a) SEQ ID NO: 2的多肽序列,或它的片段、结构域、重复、或嵌合体;(b) 与(a)具有基本相似性的多肽序列;(c) 多肽序列,所述多肽序列由核苷酸序列编码,该核苷酸序列与SEQIDNO:2中所列出的核苷酸序列、或其片段或结构域、或与它互补的序列,相同或具有基^N)似性;(d) 多肽序列,该多肽序列由核苷酸序列编码,该核苷酸序列能够在中度严格性条件下与SEQ ID NO: 1中所列出的核苷*列或与之互补的序列进行杂交;或者(e)(a)、 (b)、 (c)或(d)的功能片段。
29. 如权利要求28所述的抗体,其中所述多肽包括SEQ ID NO: 2的序列或其变体,所述变体具有保守的M酸修饰。
30. 免疫测定试剂盒,所述试剂盒包括如权利要求28或29所述的抗体以及其使用说明书。
全文摘要
本发明涉及针对糖和氮的积累所需要的调节氮的GATA转录因子基因以及为调节植物中的特性而对这种基因的表达的调节。本发明的GATA转录因子与调解植物中糖和氮的积累有关。提高这个基因或基本相似的基因的表达能够产生具有改善的氮利用以及提高的产量和提高的胁迫耐受性的植物。
文档编号A01H3/00GK101688180SQ200880018512
公开日2010年3月31日 申请日期2008年4月16日 优先权日2007年4月17日
发明者S·罗斯坦, Y-m·毕 申请人:圭尔夫大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1