具有增强的产率相关性状的植物及其制备方法

文档序号:570571阅读:612来源:国知局
专利名称:具有增强的产率相关性状的植物及其制备方法
技术领域
本发明一般涉及分子生物学领域,并且涉及通过增加植物中产率增加性多肽的编 码核酸序列的表达来增强多种植物产率相关性状的方法,所述产率增加性多肽选自
核定位AT-hook 基序蛋白 19/20 (AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨 基转移酶(AAT)样多肽,和丙氨酸氨基转移酶(AAT)多肽。本发明还涉及具有增加的编码所述产率增加性多 肽的核酸序列的表达的植物,该植物相对于对照植物具有增强的产率相关性状。本发明还 提供了用于本发明方法的构建体。
背景技术
不断增长的世界人口和逐渐减少的农业可用耕地助长了提高农业效率研究之势。 传统的作物和园艺学改良方法利用选育技术来鉴定具有期望特性的植物。然而,此类选育 技术有若干缺陷,即这些技术一般为劳动密集型的,而且产生的植物通常含有异质的遗传 组分,这些异质的遗传组分不一定总是导致期望性状自亲本植物的传递。分子生物学的进 展已经使人类能够修饰动物和植物的种质。植物遗传工程需要分离和操作遗传物质(一般 为DNA或RNA的形式)以及随后将遗传物质引入植物。这类技术能够产生具多种改良的经 济、农艺或园艺性状的作物或植物。具有特别经济意义的一种性状是增加的产率。产率通常定义为作物可测量经济价 值的产出。这可以以数量和/或质量的方式进行定义。产率直接取决于若干因素,例如器 官的数量和大小、植物构造(例如,分枝的数量)、种子产量、叶子衰老等等。根的发育、营养 吸收、胁迫耐受性和早期活力也是决定产率的重要因素。因此优化一个或多个上述因素也 可以促进作物产率的增加。种子产率是特别重要的性状,这是因为许多植物的种子对于人类和动物营养而言 至关重要。通过对种子本身的直接消耗,或是通过消耗由加工的种子所饲养的肉类产品,作 物诸如玉米、稻、小麦、芸苔(canola)和大豆等占人类总卡路里摄取量的一半以上。它们也 是工业加工所用的糖类、油类和多类代谢物的来源。种子含有胚(新的枝条和根的来源) 和胚乳(萌发过程和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及许多基因,并 且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳,同化糖类、油类和蛋白质 的代谢前体,将其合成为贮存性高分子,以充盈籽粒。收获指数为种子产率与地上干重之间的比值,其在许多环境条件下相对稳定,因 此在植物大小和粮谷(grain)产率之间通常能够获得比较稳靠的相关性(如Rebetzke等 人(2002)Crop Science 42:739)。这些方法存在固有的联系,原因是大多数粮谷生物量取 决于植物叶和茎的当前的或贮存的光合产率(Gardener等人(1985)Physiology of Crop Plants. Iowa StateUniversity Press,68-73页)。因此,对植物大小的选择,甚至是在 发育早期阶段的选择,已经用作为未来潜在产率的指标(如Tittonell等人(2005)AgricEcosys&Environ 105 213)。当检查遗传差异对胁迫耐受性的影响时,温室或植物生长室环 境与田间相比具有固有的优势,即,能够使土壤性能、温度、水和养分可利用度以及光强度 标准化。不过,由于因缺乏风力或昆虫导致的不良授粉,或由于空间不足以让成熟根或冠层 生长等等,而对产率造成的人为局限性,会限制这些受控环境在测试产率差异中的应用。因 此,在生长室或温室中在标准化条件下测量早期发育阶段的植物大小,是提供潜在遗传产 率优势指标的标准作法。另一重要的性状为增加的非生物胁迫耐受性。非生物胁迫是导致全世界作 物损失的首要原因,使大多数主要作物植物的平均产率下降超过50% (Wang等人, Planta(2003) 218:1-14)。非生物胁迫可以因干旱、盐度、极端温度、化学毒性、养分(大量 元素和/或微量元素)过量或不足、辐射和氧化胁迫而引起。提高植物非生物胁迫耐受性 的能力将对全世界的农场主带来重大的经济利益,并将使得能够在不利条件下以及在原本 不可能栽培作物的地域中栽培作物。
对于许多作物而言,另一重要的性状是早期活力(early vigour) 0改良早期活力 是温带和热带稻类栽培种的现代稻类育种项目的重要目标。长根对于水栽稻的恰当土壤锚 固至关重要。在直接向涝地里播种稻米的情况下,以及在植物必须迅速穿过水出苗的情况 下,较长的枝条与活力有关。在进行条播的情况下,较长的中胚轴和胚芽鞘对于优良的出苗 至关重要。改造植物早期活力的能力在农业上将具有极其重要的意义。例如,一直以来早 期活力弱限制了在欧洲大西洋地区引入基于玉米带种质的玉米(玉蜀黍,Zea mays L.)杂 交种。另一重要的性状是在非生物胁迫条件下生长的植物的增强的产率相关性状。非 生物胁迫是导致全世界作物损失的首要原因,使大多数主要作物植物的平均产率下降超过 50% (Wang等人,Planta(2003) 218 1-14)。非生物胁迫可以因干旱、盐度、极端温度、化学 毒性、养分(大量元素和/或微量元素)过量或不足、辐射和氧化胁迫而引起。增强在非生 物胁迫条件下生长的植物的产率相关性状的能力将对全世界的农场主带来重大的经济利 益,并将使得能够在不利条件下以及在原本不可能栽培作物的地域中栽培作物。因此通过优化上述因素之一可以增加作物产率。视最终用途而定,可能更优选修饰某些产率性状。例如,对于诸如饲料或木材生产 或者生物燃料资源等应用,可能期望植物营养部分的增长,而对于诸如面粉、淀粉或油料生 产等应用,可能特别期望种子参数的增长。即便是在种子参数之中,视用途而定,一些参数 也可能比另一些更优。多种机制可促成增加的种子产率,无论形式是增加的种子大小、还是 增加的种子数量。增加植物产率相关性状(种子产率和/或生物量)的一种方法可以是修饰植物的 内在生长机制,如细胞周期或者参与植物生长或防御机制的各种信号传递路径。

发明内容
现已发现,通过在植物中增加编码核定位AT-hook基序蛋白Igz^O(AHLigAO)多 肽的核酸序列的表达,可以相对于对照植物增强植物的多种种子产率相关性状,而无延迟 的开花。增强的种子产率性状相关性状包括一个或多个下列性状增加的每圆锥花序的花 数、增加的每株植物的种子总产率、增加的饱满种子数和增加的收获指数。
此外,现已发现,增加编码GRP多肽(其中所述GRP多肽是金属硫蛋白2a(MT2a) 多肽)的核酸序列的表达,可以产生在非生物胁迫条件下生长时相对于在相当条件下生长 的对照植物具有增强的产率相关性状的植物。此外,现还发现,调节ATT样多肽编码核酸在地上植物部分中的表达,可以产生相 对于对照植物具有增强的产率相关性状,特别是增加的产率,的植物。此外,现已发现,在非限氮条件下生长的植物的产率相关性状可通过调节ATT多 肽编码核酸在这样的植物中的表达来增强。
背景技术
DNA结合蛋白是包含任何DNA结合结构域并因此对DNA具有特定的或一般的亲和力的蛋白质。DNA结合蛋白包括例如调节转录过程的转录因子、切割DNA分子的核酸酶以及 参与细胞核中DNA包装的组蛋白。AT-hook基序是首先在高迁移率组非组蛋白染色体蛋白质HMG-I/Y中描述的短 DNA 结合蛋白基序(Reeves 和 Nissen (1990) J Biol Chem 265:8573-8582)。已知 AT-hook 与富含AT的核酸序列的小沟相互作用(Huth等(1997)Nat Struc Biol 4:657-665)。已 在广泛的来自动物、植物和微生物的DNA结合蛋白中鉴定到AT-hook基序。与几种已良好 表征的DNA结合基序不同,AT-hook基序短,不超过13个氨基酸残基,并且在其中心具有典 型的三肽序列甘氨酸_精氨酸_脯氨酸(Gly-Arg-Pro或GRP)。在拟南芥(Arabidopsis thaliana)中,大约30种包含至少一个AT-hook基序的 多肽还包含植物及原核生物保守(nlant and nrokaryotes conserved, PPC)结构域,该结 构域在欧洲生物信息学研究所(EuropeanBioinformatics Institute) (EBI)的 InterPro 结构域数据库中被描述为DUF296(未知功能结构域296) (Fujimoto等(2004)Plant Molec Biol 56:225-239)。这些蛋白质之一被发现定位于核质中,从而被称为核定位AT_hook基 序蛋白丄(AHL1 ;Fujimoto等,同上)。类似地命名了旁系同源多肽,即AHL,并顺序编号。在美国专利7,193,129和美国专利申请2005/0097638中,将拟南芥AHL多肽 AHL19 (根据Fujimoto等,同上)(标识为G2153)转化入拟南芥,并且使用35S CaMV启动 子进行表达。转基因植物显示出改良的性状,例如增加的盐胁迫耐受性、增加的渗透胁迫耐 受性、增加的干旱耐受性、增加的对冷冻的耐受性和增加的对糖的植物应答。在美国专利申 请2005/0097638中,与对照植物相比较,AHL19多肽以及几种旁系同源AHL多肽的过量表 达(在35S CaMV启动子的控制下)显著延迟了转基因植物的开花,从而增加产率。发明_既述根据一个实施方案,提供了相对于对照植物增强植物的种子产率相关性状的方 法,该方法包括增加编码AHL19/20多肽的核酸序列在植物中的表达。增强的种子产率相关 性状包括一个或多个下列性状增加的每圆锥花序的花数、增加的每株植物的种子总产率、 增加的饱满种子数和增加的收获指数。根据一个实施方案,提供了相对于对照植物增强在非生物胁迫条件下生长的植物 的产率相关性状的方法,该方法包括增加GRP多肽编码核酸序列在植物中的表达,其中所 述GRP多肽是金属硫蛋白2a(MT2a)多肽,增强的产率相关性状是一个或多个下列性状±曾 加的地上生物量、增加的每株植物的种子总产率、增加的饱满种子数、增加的种子总数、增 加的一级圆锥花序(primary panicles)数、和增加的种子饱满率。
根据本发明的一个实施方案,提供了相对于对照植物增强植物的产率相关性状的 方法,该方法包括调节编码AAT-样多肽的核酸在地上植物部分中的表达。在优选实施方案 中,编码AAT-样多肽的核酸的表达通过将所述核酸有效连接至在地上植物部分中具有活 性的启动子来进行调节(优选增加)。根据一个实施方案,提供了增强在非限氮条件下生长的植物的产率相关性状的方 法,该方法包括调节ATT多肽编码核酸在植物中的表达。定义 多肽/蛋白质术语“多肽”和“蛋白质”在文中互换使用,是指通过肽键连接起来的、任意长度的 氨基酸多聚体。雜_ / _ /丰亥_歹丨丨/浦_歹丨丨术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”在文中互换使用,是指任何 长度的无支链形式的多聚核苷酸,所述核苷酸或者为核糖核苷酸或者为脱氧核糖核苷酸或 者为两者的组合。对照棺物选择合适的对照植物是实验设置的常规部分,并且可以包括相应的野生型植物或 不含目的基因的相应植物。对照植物通常与待评估植物为相同的植物物种,或者甚至为同 一品种。对照植物还可以是待评估植物的无效合子(nullizygote)。如本文所用的“对照 植物”不仅指完整植物,而且指植物部分,包括种子和种子部分。同源物蛋白质的“同源物”包括肽、寡肽、多肽、蛋白质和酶,其相对于所讨论的未修饰蛋 白质具有氨基酸取代、缺失和/或插入,并且具有与其源自的未修饰蛋白质相似的生物活 性和功能活性。缺失是指从蛋白质中除去一个或多个氨基酸。插入是指在蛋白质的预定位置引入一个或多个氨基酸残基。插入可以包括单个或 多个氨基酸的N-末端和/或C-末端融合以及序列内插入。一般氨基酸序列内部的插入将 小于N-或C-末端的融合,数量级约1到10个残基。N-或C-末端融合蛋白质或肽的实例 包括如在酵母双杂交系统中应用的转录激活因子的结合结构域或激活结构域、噬菌体外壳 蛋白、(组氨酸)-6_标签、谷胱甘肽S-转移酶标签、蛋白质A、麦芽糖结合蛋白、二氢叶酸还 原酶、Tag · 100表位、c-myc表位、FLAG 表位、lacz, CMP (钙调蛋白结合肽)、HA表位、 蛋白质C表位和VSV表位。取代是指蛋白质中的氨基酸用具有相似性质(如相似的疏水性、亲水性、抗原性、 形成或打破α螺旋结构或β片层结构的倾向性)的其他氨基酸替换。氨基酸取代通常是 单个残基的取代,但是视施加于多肽上的功能性限制而定也可以发生成簇取代;取代通常 在大约1到10个氨基酸残基数量级。氨基酸取代优选为保守氨基酸取代。保守取代表在本 领域众所周知(参见例如 Creighton (1984)Proteins. W. H. Freeman and Company (编辑) 和下表1)。表1 保守氨基酸取代的实例 可通过本领域众所周知的肽合成技术,如固相肽合成法等,或通过重组DNA操作, 容易地进行氨基酸取代、缺失和/或插入。用于产生蛋白质的取代、插入或缺失变体的DNA 序列操作方法是本领域众所周知的。例如,本领域的技术人员熟知在DNA预定位置进行取 代突变的技术,包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH) ,QuickChange定点诱 变(Stratagene,San Diego, CA)、PCR介导的定点诱变或其他定点诱变方案。衍牛物“衍生物”包括肽、寡肽、多肽,与蛋白质如目的蛋白质的天然形式的氨基酸序列相 比,其可以包括用非天然氨基酸残基进行的氨基酸取代、或者添加非天然氨基酸残基。蛋白 质的“衍生物”还包括肽、寡肽、多肽,与多肽天然形式的氨基酸序列相比,其可以包括天然 改变的(糖基化、酰基化、异戊二烯化、磷酸化、豆蔻酰化、硫酸化等)或非天然改变的氨基 酸残基。衍生物与其源自的氨基酸序列相比,还可以包括一个或多个非氨基酸替代或添加, 例如共价或非共价地结合于氨基酸序列的报告分子或其他配体,如与之结合有利于衍生物 检测的报告分子,以及相对于天然蛋白质的氨基酸序列而言的非天然氨基酸残基。此外,“衍生物”还包括天然形式的蛋白质与标签肽如FLAG、HIS6或硫氧还蛋白 的融合物(关于标签肽的综述请参见Terpe,Appl. Microbiol. Biotechnol. 60,523-533, 2003)。盲系同源物/旁系同源物直系同源物和旁系同源物涵盖用于描述基因祖先关系的进化概念。旁系同源物为 相同物种内的基因,其源自于祖先基因的复制;而直系同源物为来自不同生物体的基因,其起源于物种形成,并且也源自于共同的祖先基因。结构域术语“结构域”是指在进化相关蛋白质序列的比对中,在特定位置上保守的一组氨基酸。尽管其他位置上的氨基酸可能因同源物不同而改变,但是在特定位置上高度保守的 氨基酸则意味着对于蛋白质结构、稳定性或功能而言很可能是必不可少的氨基酸。“结构 域”因其在所比对的家族蛋白质同源物序列中高度保守而得以鉴定,故能够用作为标识符 以确定任何所讨论的多肽是否属于先前鉴定到的多肽家族。基序/共有序列/标签序列术语“基序”或“共有序列”或“标签序列”(signature)是指进化相关蛋白质序列 中短的保守区域。基序常常是高度保守的结构域部分,但也可能仅仅包括部分结构域,或者 位于保守结构域之外(若基序的所有氨基酸都落在所定义的结构域之外的话)。^^本文定义的术语“杂交”指其中基本同源互补的核苷酸序列彼此退火的过程。杂 交过程能够完全在溶液中发生,即互补的两核酸分子都处在溶液中。杂交过程也能够这样 进行,即互补核酸分子之一固定于基质上,如磁珠、琼脂糖珠或任何其它树脂上。此外,杂交 过程也能够这样进行,即其中互补核酸分子之一固定在固相支持物如硝酸纤维素或尼龙膜 上,或者通过例如照相平板印刷术固定在例如硅质玻璃支持物上(后者称为核酸序列阵列 或微阵列,或称为核酸序列芯片)。为了使杂交发生,通常使核酸分子热变性或化学变性,以 使双链解链成两条单链,和/或除去单链核酸分子中的发夹结构或其它二级结构。术语“严格性”是指发生杂交的条件。杂交的严格性受诸如温度、盐浓度、离子强度 和杂交缓冲液组成等条件的影响。通常,对于特定序列而言,在确定的离子强度和PH值下, 低严格条件选择为比热解链温度(Tm)低大约30°C。中等严格条件为温度比TJS 20°C,而 高严格条件为温度比1低10°C。高严格杂交条件通常用于分离与靶核酸序列具有高序列 相似性的杂交序列。不过,由于遗传密码的简并性,核酸序列可以在序列上有偏差而依然编 码基本上相同的多肽。因此有时可能需要中等严格杂交条件来鉴定这样的核酸序列分子。Tm是在确定的离子强度和pH值下,50%的靶序列与完全匹配的探针杂交的温度。 1取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度下特异性杂交。 在低于Tm值大约16°C到32°C获得最大杂交速率。在杂交溶液中存在一价阳离子会减少 两核酸序列链之间的静电排斥作用,从而促进杂交体形成;当钠浓度高达0. 4M时,这一作 用可见(对于更高的浓度,此效应可以忽略不计)。每个百分点的甲酰胺可使DNA-DNA和 DNA-RNA双链体的解链温度降低0. 6到0. 7V,加入50%甲酰胺能够使杂交在30到45°C完 成,尽管这将降低杂交速率。碱基对错配降低杂交速率和双链体的热稳定性。平均而言,对 于大的探针,每个百分点碱基错配使Tm值下降约1°C。依赖于杂交体类型,Tm值可以利用下 列公式计算1)DNA-DNA 杂交体(Meinkoth 和 Wahl,Anal. Biochem.,138 :267_284,1984)Tm = 81. 5°C +16. 6 X Iog10 [Na+] a+0. 41X % [G/Cb] -500 X [LT1-O. 61 X % 甲酰胺2) DNA-RNA 或 RNA-RNA 杂交体Tm = 79. 8+18. 5 (Iog10 [Na+]a) +0. 58(% G/Cb)+ll. 8(% G/Cb) 2_820/Lc
3)寡DNA或寡RNAd杂交体
< 20 个核苷酸Tm = 2 (In)20-35 个核苷酸Tm = 22+1. 46 (In)a或对于其它一价阳离子,但是仅在0. 01-0. 4M范围内精确。b仅对于在30%到75%范围内的% GC精确。cL =双链体的碱基对长度。d寡,寡核苷酸;ln,=引物的有效长度=2 X (G/C数)+ (A/T数)。非特异性结合可以通过许多已知技术中的任一来控制,例如用含蛋白质的溶液封 闭膜,在杂交缓冲液中添加异源RNA、DNA和SDS,以及用RNA酶处理。对于非同源探针,可以 通过改变如下条件之一来进行系列杂交⑴逐渐降低退火温度(例如从68°C降至42°C ), 或(ii)逐渐降低甲酰胺浓度(例如从50%降至0%)。熟练技术人员知晓可以在杂交过程 中改变的多种参数,从而保持或者改变严格条件。除杂交条件外,杂交特异性通常还是杂交后洗涤的函数。为了除去非特异杂交产 生的背景,用稀释的盐溶液洗涤样品。这类洗涤的关键因素包括最终洗涤溶液的离子强度 和温度盐浓度越低、洗涤温度越高,洗涤的严格性就越高。洗涤条件通常在等于或低于杂 交严格性的条件下进行。阳性杂交给出至少为背景两倍的信号。一般按如上来设置适用于 核酸序列杂交试验或基因扩增检测操作的适宜严格条件。也可以选择更高或更低的严格条 件。熟练技术人员知晓可以在洗涤过程中改变的多种参数,从而保持或者改变严格条件。例如,长于50个核苷酸的DNA杂交体的典型的高严格杂交条件包括在IXSSC中 于65 °C杂交或者在1 XSSC和50%甲酰胺中于42 °C杂交,接着在0. 3 X SSC中于65°C洗涤。 长于50个核苷酸的DNA杂交体的中等严格杂交条件的实例包括在4X SSC中于50°C杂交或 者在6 X SSC和50%甲酰胺中于40°C杂交,接着在2 X SSC中于50°C洗涤。杂交体的长度是 针对杂交的核酸预期的长度。当已知序列的核酸分子进行杂交时,杂交体的长度可以通过 比对序列并鉴定本文所述的保守区域进行确定。IX SSC是0. 15M NaCl和15mM柠檬酸钠; 杂交溶液和洗涤溶液可以另外地包括5XDenhardt,s试剂、0. 5-1. 0% SDSUOO μ g/ml片段 化的变性鲑精DNA、0. 5%焦磷酸钠。为了定义严格性水平,可以参考Sambrook等(2001)的《分子克隆实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约,或者CurrentProtocols in Molecular Biology, John ffiley&Sons, N. Y. (1989 及年度更新资料)。剪接变体本文所用的术语“剪接变体”包括这样的核酸序列变体,其中选择的内含子和/或 外显子已被切除、替换、置换或添加,或者其中内含子已被缩短或增长。这样的变体可以基 本上保持蛋白质的生物活性;这可以通过选择性地保留蛋白质的功能性区段来实现。这样 的剪接变体可以是天然的或人造的。预测和分离这类剪接变体的方法是本领域众所周知的 (参见例如 Foissac 和 Schiex (2005)BMC Bioinformatics 6 25)。等位基因变体等位基因或等位基因变体为处于相同的染色体位置上的给定基因的可选形式。等 位基因变体包括单核苷酸多态性(SNP),以及小的插入/缺失多态性(INDEL)。INDEL的大 小通常小于100bp。SNP和INDEL在大多数生物体的天然存在的多态性品系中形成最大的 一组序列变体。
基因改组/定向讲化基因改组或定向进化包括重复实施DNA改组,继之适当筛选和/或选择,以产 生编码具有修饰生物活性的蛋白质的核酸序列变体或其部分(Castle等(2004) Science 304(5674) 1151-4 ;美国专利 5,811,238 和 6,395,547)。调控元件/控制序列/启动子术语“调控元件”、“控制序列”和“启动子”在文中均可互换使用,按广义来理解,指能够实现与之相连的序列表达的调控核酸序列。术语“启动子”通常是指位于基因转录起 始位点上游的核酸控制序列,其参与RNA聚合酶和其他蛋白质的识别和结合,由此指导有 效连接的核酸进行转录。上述术语包括源自经典真核生物基因组基因的转录调控序列(包 括精确转录起始所必需的TATA盒,以及具有或没有CCAAT盒序列),以及另外的调控元件 (即上游激活序列、增强子和沉默子)——它们通过应答发育刺激和/或外部刺激或以组织 特异的方式改变基因表达。所述术语还包括经典原核生物基因的转录调控序列,在此情况 下其可以包括-35盒序列和/或-10盒转录调控序列。术语“调控元件”也包括合成的融 合分子或衍生物,其赋予、激活或增加细胞、组织或器官中核酸序列分子的表达。“植物启动子”包含能够介导编码序列区段在植物细胞中表达的调控元件。“植物 启动子”优选来源于植物细胞,例如,来源于待被欲在本发明方法中表达的以及本文所述的 核酸序列转化的植物。这对于其他“植物”调控信号同样适用,例如“植物”终止子的情况。 位于可用于本发明方法的核苷酸序列上游的启动子可以通过一个或多个核苷酸取代、插入 和/或缺失进行修饰,而不会干扰启动子、开放读框(ORF)或者3’调控区如终止子或远离 ORF的其他3’调控区的功能或活性。此外还有可能通过修饰启动子的序列而增强其活性, 或者将其完全替换为活性更强的启动子、甚至是来自异源生物体的启动子。为在植物中表 达,核酸序列分子必须如上文所述的那样,有效连接于或者包含适宜的启动子,其中所述启 动子将在正确的时间点以所需的空间表达模式表达所述基因。为鉴定功能上等同的启动子,可以例如通过将启动子与报告基因有效连接、测定 所述报告基因在植物多种组织中的表达水平和模式,来分析候选启动子的启动子强度和/ 或表达模式。众所周知的适宜报告基因包括例如葡糖醛酸糖苷酶或半乳糖苷酶。 通过测量葡糖醛酸糖苷酶或半乳糖苷酶的酶活性可以确定启动子活性。然后可以 将该启动子强度和/或表达模式与参照启动子(如本发明方法中所用的启动子)相比较。 可选地,可以利用本领域公知的方法,如Northern印迹(RNA分析)结合放射自显影图的光 密度测量分析、定量实时 PCR 或 RT-PCR(Heid 等,1996 Genome Methods 6 :986_994),通过 定量本发明方法所用核酸序列的mRNA水平或者将该mRNA水平与持家基因如18S rRNA的 mRNA水平进行比较,来测定启动子强度。通常,“弱启动子”旨在表示驱动编码序列低水平 表达的启动子。“低水平”旨在表示每个细胞大约1/10,000个转录物到大约1/100,000个 转录物、到大约1/500,0000个转录物的水平。相反,“强启动子”驱动编码序列高水平表达, 或者说以每个细胞大约1/10个转录物到大约1/100个转录物、到大约1/1000个转录物的 水平表达。通常,“中等强度启动子”旨在表示以在所有情况下都低于在35S CaMV启动子控 制下获得的水平的水平驱动编码序列表达的启动子。有效连接本文所用的术语“有效连接”是指启动子序列和目的基因之间的功能性连接,从而启动子序列能够起始目的基因的转录。组成型启动子“组成型启动子”是指在生长和发育的大多数但不必是所有阶段,并且在大多数环 境条件下在至少一种细胞、组织或器官中转录激活的启动子。下表2a给出了组成型启动子 的实例。表2a 植物组成型启动子的实例 遍在启动子遍在启动子在生物体的基本上所有组织或细胞中都有活性。
发育调控型启动子发育调控型启动子在某些发育阶段或在经历发育改变的植物部分中有活性。诱导型启动子诱导型启动子响应于化学(有关综述请参见Gatz 1997,Annu. Rev. Plant Physiol. Plant Mol. Biol. ,48 :89_108)、环境或物理刺激而具有诱导的或增加的转录起 始;或者可以是“胁迫诱导型”,即在植物接触各种胁迫条件时激活;或者是“病原体诱导 型”,即在植物接触各种病原体时激活。器官特异件/组织特异件启动子器官特异性或组织特异性的启动子是能够在某些器官或组织,如在叶、根、种子等 组织中优先起始转录的启动子。例如,“根特异性启动子”是主要在植物根中转录激活的启 动子,基本上排除了在任何其他植物部分的激活,但仍允许在这些其他植物部分中的任何 渗漏表达。能够仅在某些细胞中起始转录的启动子在文中称为“细胞特异性”启动子。根特异性启动子的实例列于下面的表2b中。表2b 根特异性启动子的实例 种子特异性启动子主要在种子组织中,但不必仅在种子组织中(渗漏表达的情 况)转录激活。种子特异性启动可以在种子发育和/或萌发期间激活。种子特异性启动子的 实例示于下面的表2c中。种子特异性启动子的其他实例可参见Qing Qu和Takaiwa(Plant Biotechnol. J. 2,113-125,2004),其中揭示的内容在此纳入本文作为参考就如同陈述了其 全部内容那样。表2c 种子特异性启动子的实例“在地上部分中具有活性的启动子”是指能够优先地在植物的地上部分中起始转 录的启动子,基本上排除了在任何其他植物部分(特别是地下部分)的激活,但仍允许在这 些其他植物部分中的任何渗漏表达。下面的表2d显示主要在绿色组织中具有转录活性的 此类启动子的实例。如文中所定义的绿色组织特异性启动子是主要在绿色组织中转录激活的启动子, 基本上排除了在任何其他植物部分的激活,但仍允许有在这些其他植物部分中的任何渗漏 表达。可用于本发明方法的绿色组织特异性启动子的实例示于下面的表2d中。表2d 绿色组织特异性启动子的实例 组织特异性启动子的另一实例是分生组织特异性启动子,其主要在分生组织中转 录激活,基本上排除了在任何其他植物部分的激活,但仍允许有在这些其他植物部分中的 任何渗漏表达。可用于进行本发明方法的分生组织特异性启动子的实例示于下面的表2e 表2f 胚乳组织特异性启动子的实例 表2g 胚特异性启动子的实例 表2h 糊粉特异性启动子的实例 终Ih子术语“终止子”包括如下控制序列,其为位于转录单位末端的DNA序列,发送对初 级转录物进行3’加工和多聚腺苷酸化以及终止转录的信号。终止子可以源自天然基因、多 种其他植物基因、或T-DNA。例如,待加入的终止子可以源自例如胭脂碱合酶或章鱼碱合酶 基因、或可选地源自其它植物基因、或次优选地源自任何其它真核基因。与表达或基因表达相关联时,术语“调节”是指与对照植物相比,所述基因表达 的表达水平被改变的过程,优选使所述表达水平增加。原始未调节的表达可以是结构 RNA(rRNA.tRNA)或随后进行翻译的mRNA的任何类型的表达。术语“调节活性”应理解为对 本发明核酸序列或编码蛋白质的表达的如下任何改变,所述改变导致植物产率增加和/或 生长增加。术语“表达”或“基因表达”是指一种或多种特定基因或特定遗传构建体的转录。术 语“表达”或“基因表达”特别指一种或多种基因或遗传构建体转录为结构RNA(rRNA、tRNA) 或mRNA,并随后翻译或不翻译为蛋白质。该过程包括DNA的转录、以及所产生mRNA产物的加工。增加的表汰/过表汰如本文所用的术语“增加的表达”或“过表达”表示超出原始野生型表达水平的任 何形式的表达。增加基因或基因产物表达的方法在本领域有充分的记载,这包括,例如通过适当 的启动子驱动的过表达、转录增增强子或翻译增强子的使用。可以将用作启动子或增强子 元件的分离的核酸序列引入非异源形式多核苷酸的适当位置(一般是上游),从而上调目 的多肽编码核酸序列的表达。例如,可以通过突变、缺失和/或取代,体内地改变内源启动 子(见Kmiec,US5, 565,350 ;Zarling等,W09322443),或者将分离的启动子引入植物细胞 中使其相对于本发明基因具有恰当的方向和距离,从而控制基因的表达。如果期望多肽表达,通常期望在多核苷酸编码区的3’末端纳入多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、多种其它植物基因或T-DNA。例如,待加入的3’ 末端序列可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其他植物基因、或次优选 地源自任何其它真核基因。也可以在5’非翻译区(UTR)或部分编码区的编码序列中加入内含子序列,来增加 在胞质中累积的成熟信使的量。已显示,在植物和动物表达构建体的转录单位中纳入可剪 接内含子可以在mRNA和蛋白质水平使基因表达增加高达1000倍(Buchman和Berg (1988) Mol. Cell biol. 8 :4395-4405 ;Callis 等(1987)Genes Dev. 1 :1183_1200)。通常这类内 含子被放置在转录单位5’末端附近时,其增加基因表达的作用最大。玉米内含子Adhl-S 内含子1、2和6以及Bronze-I内含子的使用是本领域公知的。一般信息请参见TheMaize Handbook,第 116 章,Freeling 和 Walbot 编辑,Springer,N. Y. (1994)。内源基因 本文述及的“内源”基因不仅指见于植物之中的天然形式的所讨论基因(即未经 人为干预),而且指随后(重新)引入到植物中的分离形式的相同基因(或基本上同源的核 酸/基因)(转基因)。例如,含有这样的转基因的转基因植物可以发生转基因表达的实质 性下降和/或内源基因表达的实质性下降。分离的基因可以从生物体中分离,或者可以是人造例如通过化学合成制备的。降低的表汰本文述及的“降低的表达”或者表达“下降或基本上消除”应理解为表示内源基因 表达和/或多肽水平和/或多肽活性相对于对照植物降低。所述下降或基本上消除按照 递增的优选顺序是与对照植物相比,下降至少10%、20%、30%、40%或50%、60%、70%、 80%、85%、90% 或 95%、96%、97%、98%、99% 或更多。为了降低或者基本上消除植物中内源基因的表达,需要一段足够长度的基本上连 续核苷酸的核酸序列。为了实施基因沉默,这可以少到20,19,18,17,16,15,14,13,12,11, 10或更少个核苷酸,备选地可以多到整个基因(包括5’和/或3’ UTR,部分地或全部地)。 该基本上连续的核苷酸链可以来自编码目的蛋白质(靶基因)的核酸序列,或者来自任何 能编码目的蛋白质的直系同源物、旁系同源物或同源物的核酸序列。优选地,该基本连续的 核苷酸链能与靶基因(有义或反义链)形成氢键,更优选地,该基本连续的核苷酸链按递增 的优选顺序与靶基因(有义或反义链)具有50%,60%,70%,80%,85%,90%,95%,96%, 97%,98%,99%,100%序列同一性。编码(功能性)多肽的核酸序列对于本文所讨论的多 种用于降低或基本上消除内源基因表达的方法不是必需的。降低或基本上消除表达可利用常规工具和技术实现。降低或基本消除内源基因 表达的一个方法是RNA-介导的沉默,其中使用核酸序列或其部分(在这种情况下,一段 基本上连续的核苷酸链,其来自目的基因,或者来自任何能编码目的蛋白质的直系同源 物、旁系同源物或同源物的核酸序列)的反向重复——优选能形成发夹结构。RNA沉默 方法的另一个实例涉及向植物中以有义方向导入核酸序列或者其部分(在这种情况下, 一段基本连续的核苷酸链,其来自目的基因,或者来自任何能编码目的蛋白质的直系同 源物,旁系同源物或同源物的核酸序列)。RNA沉默方法的另一个实例涉及反义核酸序 列的使用。基因沉默还可通过插入诱变(例如,T-DNA插入或转座子插入)或通过例如 Angell 和 Baulcombe((1999)Plant J 20(3) :357_62), (Amplicon VIGS WO 98/36083)或Baulcombe (WO 99/15682)描述的策略来实现。其他方法,例如使用抗内源多肽的抗体在 植物中抑制其功能或干扰其中牵涉多肽的信号传递路径,对于本领域技术人员来说是熟知 的。可使用人造和/或天然microRNAOiiiRNA)敲除基因表达和/或mRNA翻译。内源miRNA 是长度通常为19至24个核苷酸的单链小RNA。可以特异地对长度通常为21个核苷酸的人 造micr0RNA(amiRNA)进行遗传工程改造以使之负调节单个或多个目的基因的基因表达。 植物microRNA靶的选择的决定因素是本领域众所周知的。用于靶识别的经验参数已经确 定并且可以用来辅助设计特定的amiRNA (Schwab等,Dev. Cell 8 (4),517-527,2005)。用于 设计并产生amiRNA及其前体的便利工具也是公众可获得的(Schwab等,Plant Cell, 18, 1121-1133,2006)。
更详细的降低或基本上消除表达可利用常规工具和技术实现。降低或基本消除内源基因表 达的一个优选方法是在植物中引入和表达遗传构建体,在该遗传构建体中核酸(在这种情 况下,一段基本连续的核苷酸链,其来自目的基因,或者来自任何能编码任何目的蛋白质的 直系同源物、旁系同源物或同源物的核酸)被克隆为由间隔序列(非编码DNA)分隔开的反 向重复序列(部分地或者全部地)。在这种优选的方法中,内源基因的表达通过RNA-介导的沉默,被降低或基本消 除,在该RNA-介导的沉默中使用核酸或其部分(在这种情况下,一段基本上连续的核苷酸 链,其来自目的基因,或者来自任何能编码目的蛋白质的直系同源物、旁系同源物或同源物 的核酸)的反向重复——优选能形成发夹结构——来实现。该反向重复被克隆在含有控制 序列的表达载体上。非编码DNA核酸序列(间隔序列,例如基质附着区片段(MAR),内含子, 多接头等)被放置在形成该反向重复的两个反向核酸之间。该反向重复序列转录后,形成 具有(部分或者全部)自互补结构的嵌合RNA。该双链RNA结构称为发夹RNA(hpRNA)。发 夹RNA被植物加工为siRNAs,siRNAs整合进入RNA诱导的沉默复合物(RISC)中。RISC进一 步断裂mRNA转录物,由此实质性地降低待翻译成多肽的mRNA转录物的数量。有关其它一般 细节,敬请参见例如,Grierson 等(1998)W098/53083 ;Waterhouse 等(1999)W0 99/53050)。本发明方法的实施并不依赖于在植物中引入和表达其中以反向重复形式克隆核 酸的遗传构建体;而是可以使用几种众所周知的“基因沉默”方法中的任何一种或多种来获 得相同的效果。用于降低内源基因表达的一种此类方法是RNA介导的基因表达沉默(下调)。这种 情况下的沉默在植物中由与靶内源基因基本相似的双链RNA序列(dsRNA)触发。该dsRNA 进一步被植物加工成大约20到大约26个核苷酸,称为小干扰RNA(siRNAs)。siRNAs整合 进RNA诱导的沉默复合物(RISC)中,该沉默复合物断裂内源靶基因的mRNA转录物,由此实 质性地降低待翻译成多肽的mRNA转录物的数量。优选地,该双链RNA序列对应于靶基因。RNA沉默方法的另一个实例涉及向植物中以有义方向导入核酸序列或者其部分 (在这种情况下,一段基本连续的核苷酸链,其来自目的基因,或者来自任何能编码目的蛋 白质的直系同源物,旁系同源物或同源物的核酸)。“有义方向”指DNA序列与其mRNA转录 物是同源的。因此导入植物中的将是核酸序列的至少一个拷贝。该额外的核酸序列将降低 此内源基因的表达,造成被称为共抑制(co-suppression)的现象。如果在植物中导入核酸 序列的几个额外拷贝,基因表达的降低将会更加明显,原因是高转录水平和共抑制的触发之间存在正相关。RNA沉默方法的另一个实例涉及反义核酸序列的使用。反义核酸序列包括与编码 蛋白质的“有义”核酸序列互补,即,与双链cDNA分子的编码链互补,或者与mRNA转录序列 互补,的核苷酸序列。反义核酸序列优选与要沉默的内源基因互补。互补可位于基因的“编 码区”和/或“非编码区”。术语“编码区”指包含可翻译成氨基酸残基的密码子的核苷酸序 列区域。术语“非编码区”指位于编码区两侧的5'和3'序列,该区可转录但不翻译成氨 基酸(也称为5'和3'非翻译区)。 反义核酸序列可以根据Watson和Crick碱基配对规则设计。反义核酸序列可以 与整个核酸序列(在此情况下,一段基本上连续的核苷酸链,其来自目的基因、或来自任何 能够编码目的蛋白的直向同源物、旁系同源物或同源物的核酸)互补,不过也可以是仅与 核酸序列的一部分(包括mRNA 5’和3’ UTR)反义的寡核苷酸。例如,反义寡核苷酸序列 可以与围绕编码多肽的mRNA转录物的翻译起始位点的区域互补。合适的反义寡核苷酸序 列的长度是本领域已知的并且可以从长度约50、45、40、35、30、25、20、15或10个核苷酸或 更少的核苷酸开始。本发明的反义核酸序列可以利用本领域已知方法,使用化学合成和酶 连接反应而构建。例如,反义核酸序列(例如反义寡核苷酸序列)可以使用天然存在的核 苷酸或多种修饰的核苷酸化学地合成,其中所述修饰的核苷酸被设计旨在增加分子的生物 学稳定性或增加反义核酸序列与有义核酸序列之间所形成双链体的物理稳定性,例如,可 以使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可以用来产生反义核酸序列的修饰核苷酸 的实例是本领域众所周知的。已知的核苷酸修饰包括甲基化、环化和'加帽'及用类似物 (如肌苷)取代一个或多个天然存在的核苷酸。其它的核苷酸修饰是本领域众所周知的。这种反义核酸序列可以使用核酸序列已经以反义方向亚克隆入其中(即从插入 的核酸转录的RNA将与目的靶核酸呈反义方向)的表达载体,以生物学方式产生。优选地, 反义核酸序列在植物中的产生借助稳定整合的核酸构建体进行,其中所述的核酸构建体包 含启动子、有效连接的反义寡核苷酸和终止子。用于本发明方法中实现沉默的核酸分子(无论向植物中导入或在原位(in situ) 产生)将与编码多肽的mRNA转录物和/或基因组DNA杂交或结合,由此通过例如抑制转录 和/或翻译而抑制蛋白质表达。杂交可以是常规核苷酸互补以形成稳定双链体,或在结合 DNA双链体的反义核酸序列的情况下,为在双螺旋大沟内的特异相互作用。反义核酸序列可 以通过转化或在特定组织部位直接注射而导入植物。备选地,可以对反义核酸序列进行靶 向选定细胞的修饰,并且随后系统性施用。例如,对于系统性施用,反义核酸序列可以被修 饰以便它们能够特异结合表达在所选择的细胞表面上的受体或抗原,例如使反义核酸序列 与可以和细胞表面受体或抗原结合的肽或抗体连接。反义核酸序列也可以使用本文中所述 的载体送递至细胞内。根据又一个方面,反义核酸序列是α-异头核酸序列。α异头核酸序列与互补性 RNA形成特异的双链杂交分子,其中与惯常b-单元相反,所述链走向相互平行(Gaultier 等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列也可以包含2' _o_甲基核糖核苷 酸(Inoue 等(1987) Nucl Ac Res 15,6131-6148)或嵌合 RNA-DNA 类似物(Inoue 等(1987) FEBS Lett. 215,327-330)。内源基因表达的降低或基本消除也可以使用核酶而进行。核酶是具有核糖核酸酶活性的催化性RNA分子,能够切割与其具有互补区域的单链核酸序列,如mRNA。因此,核酶 (例如锤头核酶(在Haselhoff和Gerlach (1988) Nature 334,585-591中描述)可以用来 催化性地切割编码多肽的mRNA转录物,由此实质性地降低待翻译成多肽的mRNA转录物的 数目。可以设计对核酸序列具特异性的核酶(见例如&(^等美国专利号4,987,071 ;和 Cech等美国专利号5,116,742)。备选地,可以使用对应于核酸序列的mRNA转录物,从RNA 分子库中选出具有特异性核糖核酸酶活性的催化性RNA (Bartel和Szostak (1993) Science 261,1411-1418)。核酶用于植物中基因沉默的用途是本领域已知的(例如Atkins等(1994) W094/00012 ;Lenne 等(1995)W0 95/03404 ;Lutziger 等(2000)W0 00/00619 ;Prinsen 等 (1997)WO 97/13865和 Scott 等(1997)WO 97/38116)。基因沉默也可以通过插入诱变(例如T-DNA插入或转座子插入)或通过如 Angell 和 Baulcombe((1999)Plant J. 20(3) :357_62)、(AmpIicon VIGSffO 98/36083)或 Baulcombe (WO 99/15682)及其它人描述的策略而实现。当在内源基因上存在突变和/或在随后导入植物的分离的基因/核酸上存在突变 时 ,基因沉默也可发生。降低或基本消除可以由无功能的多肽引起。例如,多肽可以与多种 相互作用性蛋白质结合;由此通过一个或多个突变和/或截短可以提供仍能够结合相互作 用性蛋白质(如受体蛋白质)但不能表现其正常功能(如起信号作用的配体)的多肽。另一种基因沉默的方法是靶定与基因调节区(例如启动子和/或增强子)互补 的核酸序列以形成阻止基因在靶细胞中转录的三螺旋结构。见Helene,C.,Anticancer Drug Res. 6,569-84,1991 ;Helene 等,Ann. N. Y. Acad. Sci. 660,27-361992 和 Maher, L. J. Bioassays 14,807-15,1992。其它方法,如使用针对内源性多肽的抗体以抑制此多肽在植物中的功能,或干扰 所述多肽参与的信号途径,对于技术人员将是众所周知的。尤其可以构思的是,人造分子可 以用于抑制靶多肽的生物学功能,或用于干扰靶多肽参与的信号途径。备选地,可以建立筛选程序以在植物群体中鉴定基因的天然变体,所述变体编码 具有降低活性的多肽。此类天然变体也可以用于例如进行同源重组。人工和/或天然的microRNAOiiiRNA)可以用来敲除基因表达和/或mRNA翻译。内 源性miRNA是通常19-24个核苷酸长度的单链小RNA0它们的主要功能是调节基因表达和 /或mRNA翻译。大多数的植物microRNA (miRNA)与其靶序列具有完全的或接近完全的互补 性。然而,存在具有多达5个错配的天然靶标。它们由切酶家族的双链特异性RNA酶从具 有特征性折回结构的较长非编码性RNA中加工而来。加工后,它们通过与RNA诱导的沉默 复合物(RISC)的主要成分Argonaute蛋白质结合而掺入该复合体。MiRNA充当RISC的特 异性成分,因为它们可以与细胞质中的靶核酸(大多是mRNA)碱基配对。后续的调节事件 包括靶mRNA的切割和破坏和/或翻译抑制。因此,miRNA过表达的效应常常反映为靶基因 降低的mRNA水平。可以特异地遗传构建通常21个核苷酸长度的人工microRNAfemiRNAs),以负调 节单个或多个目的基因的基因表达。植物microRNA靶的选择的决定因素是本领域众所周 知的。用于靶识别的经验参数已经确定并且可以用来辅助设计特定的amiRNA(Schwab等, Dev. Cell 8,517-527,2005)。用于设计并产生amiRNA及其前体的便利工具也是公众可获 得的(Schwab 等,Plant Cell, 18,1121-1133,2006)。
为最佳性能,用于在植物中降低内源基因表达的基因沉默技术需要使用来自单子 叶植物的核酸序列以转化单子叶植物,和使用来自双子叶植物的核酸序列以转化双子叶植 物。优选地,将来自任何给定植物物种的核酸序列导入同一个物种内。例如,将来自稻的核 酸序列转化至稻植物。然而,并非绝对要求待导入的核酸序列起源于与该核酸序列将要导 入的植物相同的植物物种。只要内源性靶基因与待导入的核酸序列之间存在相当大的同源 性就足够了。上文描述了用于降低或基本消除内源基因在植物中表达的多种方法的实例。本领 域技术人员能够容易地适应性调整前述用于沉默的方法,以例如通过利用合适启动子而降 低内源基因在整株植物或在其部分中的表达。诜择标记(基因)/报告基因“选择标记”、“可选择标记基因”或“报告基因”包括赋予细胞表型的任何基因, 该基因在细胞中的表达有利于鉴定和/或选择被本发明的核酸序列构建体转染或转化了 的细胞。这些标记基因通过各种不同的原理使得能够鉴定核酸序列分子的 成功转移。适 宜的标记可以选自赋予抗生素或除草剂抗性的标记,其引入新的代谢性状或允许可视选 择。可选择标记基因的实例包括赋予抗生素抗性的基因(例如磷酸化新霉素和卡那霉素的 nptll,或磷酸化潮霉素的hpt,或赋予例如对博来霉素、链霉素、四环素、氯霉素、氨苄青霉 素、庆大霉素、遗传霉素(G418)、壮观霉素或杀稻瘟素抗性的基因)、赋予除草剂抗性的基 因(例如提供抗;BaSta 抗性的bar ;提供抗草甘膦抗性的aroA或gox,或赋予例如对咪唑 啉酮、膦丝菌素或磺酰脲抗性的基因)、或者提供代谢性状的基因(如允许植物使用甘露糖 作为唯一碳源的manA,或导致木糖利用的木糖异构酶,或抗营养标记如对2-脱氧葡萄糖的 抗性)。可视标记基因的表达导致形成颜色(例如葡糖醛酸糖苷酶⑶S,或β-半乳糖 苷酶及其有色底物,例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白 GFP及其衍生物)。这里仅仅是列出了一小部分可用的标记。技术人员对这类标记极为熟 悉。取决于生物体和选择方法,优选不同的标记。已知,取决于所用的表达载体和所用的转染技术,当核酸序列向植物细胞进行稳 定或瞬时整合时,仅少数细胞能摄入外来DNA,并将其整合入基因组(如果期望的话)。为鉴 定并选择这些整合体,通常将编码选择标记(如上文所述的那些)的基因与目的基因一起 引入宿主细胞中。这些标记能够例如在如下突变体中使用,在所述突变体中这些基因例如 通过常规方法缺失而没有功能。此外,编码选择标记的核酸序列分子与编码本发明多肽或 用于本发明方法的序列可以在同一个载体中引入宿主细胞,或者在分开的载体中引入。已 由所引入的核酸序列稳定转染的细胞可以例如通过选择(例如,整合有选择标记的细胞存 活而其他细胞死去)予以鉴定。由于一旦成功引入核酸序列后,将不再需要或不期望转基因宿主细胞中存在标记 基因,特别是抗生素和除草剂抗性基因,所以根据本发明引入核酸序列的方法有利地采用 能够除去或切除这些标记基因的技术。一种这样的方法是称为共转化的方法。共转化法采 用两个载体同时进行转化,一个载体携带根据本发明的核酸序列,而第二个携带标记基因。 很大比例的转化体将接收或者对于植物而言(高达40%或以上的转化体)含有两个载体。 对于农杆菌转化,转化体通常只接收载体的一部分,即被T-DNA侧翼包围的序列,其通常是 表达盒。随后可通过杂交(cross)从转化植物中除去标记基因。在另一种方法中,利用整合进转座子的标记基因与期望的核酸序列一起进行转化(称为Ac/Ds技术)。转化体可与转座酶来源杂交,或者用赋予转座酶表达的核酸序列构建体瞬时或稳定转化转化体。一旦 成功进行了转化,在有些情况下(约10% ),转座子将跳离宿主细胞基因组并丢失。在另一 些情况下,转座子跳至不同的位置。在这些情况下,必须通过杂交消除标记基因。微生物学 中,已经研发了可以或便于检测此类事件的技术。另一有利的方法有赖于称为重组系统的 方法,其优势在于可以免除杂交消除步骤。最著名的这类系统称为Cre/lox系统。Crel为 重组酶,且切除位于IoxP序列之间的序列。如果标记基因整合在IoxP序列之间,一旦成功 进行了转化,将因重组酶的表达而得以切除。其他重组系统有HIN/HIX、FLP/FRT及REP/STB 系统(Tribble 等,J. Biol. Chem.,275,2000 :22255_22267 ;VeImurugan 等,J. Cell Biol., 149,2000:553-566)。根据本发明的核酸序列可以位点特异性地整合进植物基因组。这些 方法自然也可以应用于微生物如酵母、真菌或细菌。转基因的/转基因/重组出于本发明的目的,“转基因的”、“转基因”或“重组”当与例如,核酸序列,含有所 述核酸序列的表达盒、基因构建体或载体,或用根据本发明的核酸序列、表达盒或载体转化 的生物体相关时,是指所有这些构建体通过重组方法产生,其中(a)编码可用于本发明方法的蛋白质的核酸序列,或(b)与本发明核酸序列有效连接的遗传控制序列,例如启动子,或(c) (a)和(b)不位于其天然遗传环境中,或者已通过重组方法修饰,该修饰可以为例如一个或 多个核苷酸残基的取代、添加、缺失、倒位或插入。天然遗传环境应理解为指在起始植物中 的天然基因组或染色体座位或存在于基因组文库之中。在基因组文库的情况下,优选至少 部分地保持核酸序列的天然遗传环境。该环境至少位于核酸序列一侧,且具有至少为50bp、 优选至少500bp、特别优选至少IOOObp、最优选至少5000bp序列长度。当天然存在的表达 盒——例如编码可用于本发明方法的多肽的相应核酸序列与该核酸序列的天然启动子之 间天然存在着的组合——经非天然的合成(“人造”)方法如诱变处理而被修饰时,此表达 盒成为转基因表达盒。例如,合适的方法描述在US 5,565,350或WO 00/15815中。因此,如上文所述,为了本发明目的,转基因植物应理解为表示在所述植物的基 因组中,本发明方法中所用的核酸序列不在其天然基因座上,该核酸可以为同源或异源表 达。不过,正如所提到的那样,转基因也表示当在植物基因组中,根据本发明的核酸序列或 本发明方法中所用的核酸序列位于其天然位置上时,所述序列已相对于天然序列被修饰, 和/或该天然序列的调控序列已被修饰。转基因优选指根据本发明的核酸序列在基因组 中于非天然的座位上表达,即同源表达,或者优选发生核酸的异源表达。优选的转基因植物 在文中述及。 MiL 本文述及的术语“引入”或“转化”包括将外源多核苷酸转移进宿主细胞,不考虑转 移所用的方法。可以使用本发明的遗传构建体转化能够通过器官发生或者胚胎发生随后进 行克隆繁殖的植物组织,并从其再生整个植物。具体选择的组织将因可得的和最适于待转 化的具体物种的克隆繁殖系统而变。示例性的组织靶标包括叶盘、花粉、胚、子叶、下胚轴、 雌配子、愈伤组织、既有的分生组织(例如顶端分生组织、腋芽和根分生组织),以及诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。可将多核苷酸瞬时或稳定地导入宿主 细胞,其可保持非整合状态例如作为质粒。可选择地,可将其整合入宿主基因组。然后以本 领域技术人员已知的方法将所得的转化的植物细胞用于再生转化的植物。外来基因转移进入植 物基因组中称为转化。植物物种的转化现在是相当常规的 技术。有利地,可使用几种转化方法中的任一方法将目的基因导入适宜的祖先细胞。可以 利用转化方法以及由植物组织或植物细胞再生植物的方法来进行瞬时或稳定转化。转化 方法包括脂质体的使用、电穿孔、增加游离DNA摄取的化学物质、DNA至植物的直接注射、 基因枪轰击(particle gun bombardment)、使用病毒或花粉的转化以及显微注射。方法 可选自用于原生质体的钙/聚乙二醇方法(Krens,F.A.等人,(1982) Nature296,72-74 ; Negrutiu I 等人(1987)Plant Mol Biol 8 :363_373)、原生质体的电穿孔(Shillito R.D.等人(1985)Bio/Techno 1 3,1099-1102)、至植物材料内的显微注射(Crossway A 等 人,(1986)Mol. Gen Genet 202 179-185) ;DNA 或 RNA 包被的微粒轰击(Klein TM 等人, (1987)Nature 327:70);使用(非整合型)病毒的感染等。优选通过农杆菌介导的转化 产生转基因植物,包括转基因作物植物。一种有利的转化法是植物原位(in planta)转 化。为此,可以例如使农杆菌作用于植物种子,或用农杆菌接种植物分生组织。已经证明, 根据本发明尤为有利的是,使转化了的农杆菌悬液作用于完整植株或至少花原基。随后培 养植物,直至获得所处理植物的种子(Clough和Bent,Plant J. (1998) 16,735-743)。农 杆菌介导的稻转化方法包括众所周知的稻转化方法,例如在任一如下文献中描述的方法 欧洲专利申请 EP 1198985A1, Aldemita 和 Hodges (Planta,199 :612_617,1996) ; Chan 等 (Plant Mol. Biol. 22(3)491-506,1993),Hiei 等(Plant J. 6 (2) :271_282,1994),其公开 的内容在此并入本文作为参考就如同陈述了其全部内容那样。至于玉米转化,优选的方法 如 Ishida 等(Nat. Biotechnol. 14(6) :745_50,1996)或Frame 等(Plant Physiol. 129(1) 13-22,2002)中所述,其公开的内容全部地并入本文作为参考。作为举例说明,所述方法还 由 B. Jenes 等,Techniques for GeneTransfer, Transgenic Plants,卷 1,Engineering and Utilization,编辑 S. D. Kung 禾口 R.Wu,Academic Press (1993) 128—143 以及 Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225)中进一步描述。优选将 待表达的核酸或构建体克隆到载体中,所述载体适用于转化根癌农杆菌(Agrobacterium tumefaciens),例如 pBinl9(Bevan 等,Nucl. Acids Res. 12 (1984) 8711)。然后以已知的 方式利用由这样的载体转化的农杆菌来转化植物,例如用作模式植物的植物,像拟南芥 (Arabidopsis thaliana,其在本发明范围内不视为作物植物);或者作物植物,例如作为举 例的烟草植物,例如通过在农杆菌溶液中浸没擦伤的叶子或切碎的叶子,然后在合适的培 养基中培养之。通过根癌农杆菌的植物转化例如已由HGfgen和Willmitzer在Nucl. Acid Res. (1988) 16,9877 描述,或者尤其是可从 F. F. White,Vectors for Gene Transfer in Higher Plants在Transgenic Plants,卷 1,Engineering and Utilization,编辑S. D. Kung 和 R. Wu,Academic Press,1993,第 15-38 页获知。除了体细胞(其随后必须再生为完整植株)转化以外,还可以转化植物分生组 织的细胞,特别是可以发育成配子的那些细胞。在这种情况下,转化的配子循着天然植 物的发育而产生转基因植物。因此,例如,可以用农杆菌处理拟南芥的种子,并从一定比 例经转化因而是转基因的发育植物收获种子[Feldman,KA和Marks MD(1987). Mol GenGenet 208 274-289 ;Feldmann K(1992).在 C Koncz,N_H Chua 和 J Shell 编辑 Methods inArabidopsis Research. Word Scientific,Singapore,第 274-289 页]。可选的方法基 于反复去除花序以及使莲座中心切割部位与转化的农杆菌一起孵育,由此在随后的时间 点同样能够获得转化的种子(Chang (1994). Plant J. 5 551-558 ;Katavic (1994). Mol Gen Genet, 245 :363_370)。然而,一种特别有效的方法是真空渗入法,及其改良方法如“花器 浸蘸法”(floral dip)。对于拟南芥的真空渗入,用农杆菌悬液在减压下处理完整植株 [Bechthold, N(1993). C R Acad Sci Paris Life Sci,316 :1194_1199],而对于“花器浸 蘸法”,将发育中的花组织与表面活性剂处理的农杆菌悬液短暂孵育[Clough,SJ和Bent, AF (1998). The Plant J. 16,735-743]。在两种情况下均收获一定比例的转基因种子,这些 种子可通过在上述选择性条件下培养而与非转基因种子区分开来。另外,质体的稳定转 化是有利的,因为质体在多数作物中为母系遗传,从而降低或消除了转基因通过花粉传播 的风险。叶绿体基因组的转化通常通过Klaus等,2004[Nature Biotechnology 22(2), 225-229]中系统性展示的方法实现。简言之,将待转化的序列与可选择标记基因一起克 隆到同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导转基因位点特异性 整合到质体基因组中。质体转化已在许多不同的植物物种中描述,且综述由Bock(2001) Transgenic plastids in basic research and plantbiotechnology. J Mol Biol·2001年 9 ^ 21 0 ;312(3) 425-38 ^Maliga, P(2003)Progress towards commercialization of plastid transformationtechnology. Trends Biotechnol· 21,20—28 给出。最近 艮道了形 式为无标记的质体转化体的其他生物技术方法,所述转化体可以利用瞬时共整合的标记基 因产生(Klaus 等,2004,Nature Biotechnology 22 (2),225-229)。T-DNA激活标签T-DNA激活标签(Hayashi等Science (1992) 1350-1353)包括将通常含有启动子 (也可以是翻译增强子或内含子)的T-DNA插入在目的基因的基因组区或基因编码区上游 或下游IOkb处,从而在构型上使启动子能够指导被靶向基因的表达。通常天然启动子对被 靶向基因表达的调控被破坏,基因落入新引入的启动子控制。启动子一般包含于T-DNA中。 可以例如,通过农杆菌感染将此T-DNA随机插入植物基因组中,并导致插入T-DNA附近的基 因的表达被修饰。得到的转基因植物将由于紧靠引入的启动子的基因的表达改变而表现出 显性表型。TILLING术语“TILLING”为“靶向诱导的基因组局部损伤”(Targeted InducedLocal Lesions In Genomes)的缩写,是一种用于产生和/或鉴定编码具有修饰的表达和/或活 性的蛋白质的核酸序列的诱变技术。TILLING还允许选择携带此类突变变体的植物。这些 突变变体可以在强度、位置或时间(例如,如果突变影响启动子的话)上呈现出修饰的表 达。这些突变变体可以比其天然形式基因呈现更高的活性。TILLING将高密度诱变和高 通量筛选方法结合在一起。TILLING—般遵循的步骤有(a)EMS诱变(Redei GP和Koncz C, (1992) In Methods in Arabidopsis Research, Koncz C, Chua NH, Schell J 编辑,新力口 坡,World Scientific Publishing Co,第 16-82 页;Feldmann 等,(1994) In Meyerowitz EM, Somerville CR编辑,Arabidopsis.冷泉港实验室出版社,冷泉港,纽约,第137-172 Μ ;Lightner J 禾口 CasparT,(1998) In J Martinez-Zapater, J SalinasMethods onMolecularBiology,82 卷 Humana Press,Totowa,NJ,第 91-104 页);(b)个体的 DNA 制备和 合并(pooling) ; (c)目的区域的PCR扩增;(d)变性和退火以使异源双链体能够形成;(e) DHPLC,其中合并物中异源双链体的存在在色谱图中检测为额外的峰;(f)突变个体的鉴 定;和(g)突变PCR产物的测序。用于TILLING的方法在本领域内是众所周知的(McCallum 等,(2000)NatBiotechnol 18 :455_457 ;由 Stemple(2004)Nat Rev Genet 5(2) 145-50 it 行综述)。同源重组同源重组允许向基因组中的指定选择位置引入所选的核酸序列。同源重组是生物 科学中常规用于低等生物体如酵母或苔藓剑叶藓属(physcomitrella)的标准技术。在植 物中进行同源重组的方法已经不仅在模式植物中描述(Offringa等(1990)EMB0 J. 9(10) 3077-84),而且也在作物植物,如稻中描述(Terada等(2002)Nat Biotech 20(10) 1030-4 ;Iida和 Terada(2004)Curr Opin Biotechnol 15(2) 132-8) 产率术语“产率”通常表示具有经济价值的可测量产出,其一般是与特定的作物、面积 和时期相关的。各植物部分基于其数量、大小和/或重量对产率直接做出贡献,或者实际产 率是每英亩作物的年产率,用总产量(包括收获的产量和估定的产量)除以种植的英亩数 来确定。术语植物的“产率”可以与该植物的营养性生物量、繁殖器官、和/或繁殖体(如 种子)相关。术语植物的“产率”可以与该植物的营养性生物量(根和/或枝条生物量)、繁殖 器官、和/或繁殖体(如种子)相关。早期活力“早期活力”是指活跃健康且很好均衡的生长,特别是在植物生长的早期阶段,其 可以由增强的植物适度(fitness)引起,例如,由植物更好地适应其环境(即优化能源资源 的利用以及在枝条和根之间的分配)引起。具有早期活力的植物也可以显示出增加的幼苗 存活和更佳的作物齐苗(establisment),这往往产生高度均一的田地(作物以齐整的方式 生长,即大多数植物基本上同时达到发育的各阶段),以及常常更优更高的产率。因此,早期 活力可以通过测量多种因素来确定,如千粒重、萌发率、出苗率、幼苗生长、幼苗高度、根长 度、根和枝条生物量,等等。增加/提高/增强术语“增加”、“提高”或“增强”可互换,且在本发明意义上表示与文中所定义的 对照植物相比,产率和/或生长多出至少5%、6%、7%、8%、9%或10%,优选至少15 %或 20%,更优选25%、30%、35%或40%。禾中子产率增加的种子产率可表现为如下一个或多个方面a)种子生物量(种子总重量)的 增加,这可以是以单粒种子和/或每植株和/或每公顷或英亩为基础的增加;b)每圆锥花 序和/或每植株的花数 的增加;c)增加的(饱满)种子数;d)增加的种子饱满率(其表达 为饱满种子数与种子总数的比率);e)增加的收获指数,其表达为可收获部分如种子的产 率除以总生物量的比率;f)增加的一级圆锥花序数;g)增加的千粒重(TKW),这通过计数饱 满种子数和它们的总重量外推得到。TKW增加可来自于种子大小和/或种子重量的增加,并且也可来自胚和/或胚乳大小的增加。种子产率的增加也可表现为种子大小和/或种子体积的增加。此外,种子产率的增加也可表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。增加的 产率也可以导致改变的构造,或可以因改变的构造而发生。MSII^(greenness index)如本文所用的“绿度指数”根据植物的数字图像计算。对于图像中属于植物目标 的每一个像素,计算绿色值相对于红色值(在用于编码颜色的RGB模型中)之比。绿度指 数表达为绿红比超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下、在 养分可利用度下降的生长条件下,在开花前末次成像中测量植物的绿度指数。相反,在干旱 胁迫生长条件下,在干旱后的首次成像中测量植物的绿度指数。脑本文所用术语“植物”涵盖整株植物、植物的祖先和后代以及植物部分,包括种子、 枝条、茎、叶、根(包括块茎)、花以及组织和器官,其中上述每一种都包含目的基因/核酸序 列。术语“植物”也包括植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、 花粉和小孢子,同样其中上述每一种都包含目的基因/核酸序列。尤其可用于本发明方法的植物包括属于植物界(Viridiplantae)超家族的所有 植物,尤其是单子叶植物和双子叶植物,包括饲料或豆科牧草、观赏植物、粮食作物、乔木 或灌木,选自槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种 (Abelmoschus spp.)、剑麻(Agavesisalana)、冰草属物种(Agropyron spp·)、匍茎剪股颖 (Agrostis stolonifera)、葱属物种(Allium spp.)、苋属物种(Amaranthus spp·)、滨草 (Ammophilaarenaria)、凤梨(Ananas comosus)、番荡枝属物禾中(Annona spp.)、序菜(Apium graveolens)、落花生属物种(Arachis spp·)、木波罗属物种(Artocarpusspp.)、石刁柏 (Asparagus officinalis)、燕麦属物种(Avena spp.)(如燕麦(Avena sativa)、里予燕麦 (Avena fatua)、比赞燕麦(Avena byzantina) > Avenafatua var. sativa、杂禾中燕麦(Avena hybrida))、阳桃(Averrhoa carambola)、簕竹属物种(Bambusa sp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletiaexcelsea)、甜菜(Beta vulgaris)、芸笞属物禾中(Brassica spp.)(如欧洲油菜(Brassica napus)、芜青(Brassica rapa ssp.)[芸苔、油菜籽油菜、 ^^ ]) > Cadaba farinosa>^vBf ^ (Camellia sinensis)(Canna indica) (Cannabis sativa) ^MIRM^IJft (Capsicum spp. ) > pfipt (Carex elata)(Carica papaya)、大果假虎朿Ij (Carissa macrocarpa)、山核桃属物禾中(Caryaspp.)、红花(Carthamus tinctorius)、胃属 禾中(Castanea spp· )、/fl卩圭帛(Ceiba pentandra) >1=^1=1 (Cichorium endivia)、才章禾中(Cinnamomumspp.) (Citrullus lanatus) IitM^ft (Citrus spp·)、椰子属物种(Cocosspp.)、咖啡属物种(Coffea spp.)、芋(Colocasia esculenta)、 可拉属(Colaspp.)、黄麻属物种(Corchorus sp·)、芫荽(Coriandrum sativum)、榛属物 禾中(Corylus spp. )、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物 种(Cucurbita spp·)、香瓜属物种(Cucumis spp·)、菜蓟属物种(Cynaraspp.)、胡萝卜 (Daucus carota)、山马蟥属物禾中(Desmodium spp·)、龙目艮(Dimocarpus longan)、薯裁属 物种(Dioscorea spp.)、棉树属物种(Diospyrosspp.)、稗属物种(Echinochloa spp.)、 油棕属(Elaeis)(如非洲油棕(Elaeisguineensis)、美洲油棕(Elaeis oleifera))、糝子(Eleusine coracana)、!^DS·禾中(Erianthus sp. )(Eriobotrya japonica)、㈱属
^^ (Eucalyptu sp)^!^^ (Eugenia uniflora)(Fagopyrum spp.)
棒属物禾中(Fagus spp·)、苹状羊茅(Festuca arundinacea)、无花果(Ficus carica)、金桔 属物种(Fortunella spp·)、草莓属物种(Fragaria spp·)、银杏(Ginkgo biloba)、大豆属 物禾中(Glycine spp.)(如大豆(Glycine max)、黄豆(Soja hispida)或大豆(Soja max))、 陆地棉(Gossypium hirsutum)、向日葵属物种(Helianthusspp.)(如向日葵(Helianthus annus))、萱草(Hemerocallis fulva)、木槿属物种(Hibiscus spp.)、大麦属物种(Hordeum spp.)(如大麦(Hordeum vulgare))、甘暮(Ipomoea batatas)、核桃属物种(Juglans spp·)、豸 H (Lactuca sativa) > ill Si MM ^lJft (Lathyrus spp. )(Lens culinaris) >
亚麻(Linumusitatissimum)、荡枝(Litchi chinensis)、百脉根属物禾中(Lotus spp·)、棱 (Luffa acutangula) ,ΜΜ Μ^Φ]^ (Lupinus spp. )(Luzulasylvatica) >
番爺属物禾中(Lycopersicon spp.)(如番爺(Lycopersiconesculentum、Lycopersicon lycopersicum、Lycopersicon pyriforme)、硬皮豆属物禾中(Macrotyloma spp.)、苹果属物 种(Malus spp.)、西印度樱桃(Malpighiaemarginata)、曼密苹果(Mammea americana)、芒 ^ (Mangifera indica)、LM_禾中(Manihot spp.)(Manilkara zapota) ,MtE
苜蓿(Medicagosativa)、草木樨属物种(Melilotus spp·)、薄荷属物种(Mentha spp·)、芒 (Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、色蕉属物 种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Oleaspp.)、仙人掌属物种 (Opuntia spp. )、Ornithopus spp.、稻属物禾中(Oryzaspp.)(如稻(Oryza sativa),阔叶 禾S (Oryza latifolia))、黍糜(Panicummiliaceum)、柳枝稷(Panicum virgatum)、鸡蛋果 (Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属(Pennisetum sp.)、鳄梨属 ^J禾中(Persea spp. )(Petroselinum crispum)、|H (Phalaris arundinacea)、
属物种(Phaseolus spp.)、梯牧草(PhIeum pratense)、刺葵属物种(Phoenix spp.)、南方 芦苇(Phragmites australis)、酸浆属物种(Physalis spp·)、松属物种(Pinusspp.)、阿 月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poaspp.)、杨属物种 (Populus spp.)、牧豆树属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种 (Psidium spp.)、石槽(Punica granatum)、西洋梨(Pyrus communis)、栎属物禾中(Quercus spp·)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶薦子属物种(Ribes spp·)、蓖麻(Ricinuscommunis)、悬钩子属物种(Rubus spp·)、甘蔴属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucus spp·)、黑麦(Secale cereale)、 胡麻属物种(Sesamum spp.)、白芥属物 种(Sinapis sp.)、茄属物种(Solanumspp.) (如马铃薯(Solanum tuberosum)、红爺(Solanum integrifolium)或番棉(Solanum lycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinaciaspp.)、蒲桃属物 禾中(Syzygium spp.)、万寿菊属物禾中(Tagetes spp.)、酸豆(Tamarindus indica)、可可树 (Theobroma cacao)、车轴草属物种(Trifoliumspp.)、黑小麦属(Triticale sp.)、小黑麦 (Triticosecale rimpaui)、小麦属物禾中(Triticum spp.)(如小麦(Triticum aestivum)、 硬粒小麦(Triticum durum)、圆维小麦(Triticum turgidum)、Triticum hybernum、马卡小 麦(Triticummacha)、面包/J、麦(Triticum sativum)或普通 zj、麦(Triticum vulgare))、/]、 金莲花(Tropaeolum minus)、旱金莲(Tropaeolum majus)、越桔属物禾中(Vaccinium spp.)、野豌豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇菜(Viola odorata)、葡萄属 物种(Vitis spp.)、玉蜀黍(Zea mays)、北美洲野生稻(Zizania palustris)、枣属物种 (Ziziphus spp.)等等。发明详述 现已令人惊讶地发现,增加植物中编码AHL19/20多肽的核酸序列的表达,可以产 生相对于对照植物具有增强的种子产率相关性状、无延迟开花的植物。根据第一种实施方 案,本发明提供了相对于对照植物增强植物的种子产率相关性状的方法,包括增加植物中 编码AHL19/20多肽的核酸序列的表达。增加编码AHL19/20多肽的核酸序列的表达的优选方法是在植物中引入和表达编 码AHL19/20多肽的核酸序列。在一个实施方案中,下文述及的任何“可用于本发明方法的蛋白质”应理解为表示 如本文所定义的AHL19/20多肽。下文述及的任何“可用于本发明方法的核酸序列”应理解 为表示能够编码这样的AHL19/20多肽的核酸序列。待引入植物(从而可用于实施本发明方 法)的核酸序列是编码现在将要描述的此类多肽的任何核酸序列,下文也称为“AHL19/20 核酸序列”或“AHL19/20基因”。如本文定义的"AHLigAO多肽”指包含与SEQ ID NO 36所示的保守结构域(⑶) (包括在 SEQ ID NO :2 中)具有至少 70%、75%、80%、85%、90%、95%、98%、99%或更高 氨基酸序列同一性的结构域的任何多肽。备选地或另外地,如本文定义的“AHL19/20多肽”指如下任何多肽,所述多肽包 含(i)与 SEQ ID N0:37所示的AT-hook基序具有至少75%、80%、85%、90%、95%、98%、 99%或更高氨基酸序列同一性的基序;和(ii)与SEQ ID NO :38所示的植物及原核生物保 守(PPC)结构域具有至少 55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%
或更高氨基酸序列同一性的结构域。备选地或另外地,如本文定义的“AHL19/20多肽”指如下任何多肽,所述多肽包含 (i)核定位信号;(ii)具有InterPro登录号IPR014476的AT-hook DNA结合基序;和(iii) 具有InterPro登录号IPR005175的植物及原核生物保守(PPC)结构域。备选地或另外地,如本文定义的“AHL19/20多肽”指如下任何多肽序列,所述多肽 序列,当用于构建AHL系统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ ID NO 2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。备选地或另外地,如本文定义的“AHL19/20多肽”指如下任何多肽,所述多肽按照 递增的优选顺序与SEQ ID NO 2所示的AHL19/20多肽或与本文表A中所示的任何全长多 肽序列具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或更 高的氨基酸序列同一性。现还发现,增加植物中编码GRP多肽(其中所述GRP多肽是金属硫蛋白2a(MT2a) 多肽)的核酸序列的表达,产生在非生物胁迫条件下生长时相对于对照植物相具有增强的 产率相关性状的植物。根据第一种实施方案,本发明提供了相对于对照植物增强在非生物 胁迫条件下生长的植物的产率相关性状的方法,包括增加植物中GRP多肽编码核酸序列的 表达,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽。用于增加GRP多肽编码核酸序列的表达的优选方法是在植物中引入和表达GRP多肽编码核酸序列。在一个实施方案中,下文述及的任何“可用于本发明方法的蛋白质”应理解为表示 如本文所定义的GRP多肽。下文述及的任何“可用于本发明方法的核酸序列”应理解为表 示能够编码这样的GRP多肽的核酸序列。待引入植物(从而可用于实施本发明金属硫蛋白 2a(MT2a)多肽方法)的核酸序列是编码现在将要描述的此类蛋白质的任何核酸序列,下文 也称为“GRP核酸序列”或“GRP基因”。本文中定义的“GRP多肽”是指SEQ ID NO :46所示的蛋白质以及其直系同源物、 旁系同源物和同源物。优选,SEQ ID NO 46的直系同源物、旁系同源物和同源物具有InterPro登录号 IPR000347,描述为植物金属硫蛋白,家族15。备选地或另外地,本文中所定义的“GRP多肽”是指按照递增的优选顺序与SEQ ID NO :46 所示的 GRP 多肽具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、 98%、99%或更高的氨基酸序列同一性的任何多肽。金属硫蛋白在本领域内是熟知的,关于最近的综述和分类,参见Cobbett和 GoldSbroUgh(2002)。金属硫蛋白是具有哑铃构型的小蛋白质,其源于彼此通过具有可 变长度和氨基酸组成的区域分隔开的保守N末端和C末端富半胱氨酸结构域。基于一 级结构,可区分4种类型的金属硫蛋白。SEQ ID NO :46的金属硫蛋白包含Cobbett和 Goldsbrough (2002)所定义的2型金属硫蛋白典型的保守N末端结构域,该结构域包含共有 序列“MSCCGG (N/S) CGCG (T/S/A) (G/A/S) C (K/Q/S) C”,因此,用于本发明方法的优选同源物 是包含该保守结构域的金属硫蛋白。此外,现已发现,优先调节ATT样多肽编码核酸在地上植物部分中的表达,可以产 生相对于对照植物具有增强的产率相关性状的植物。根据优选实施方案,优先在地上植物 部分中调节表达可以通过使用在地上植物部分中具有活性的启动子来进行。术语“在地上 部分中具有活性的启动子”在本文“定义”部分进行了定义。此外,现已发现,调节AAT多肽编码核酸的表达可以产生当在非限氮条件下生长 时相对于对照植物具有增强的产率相关性状的植物。根据第一实施方案,本发明提供了相 对于对照植物增强植物的产率相关性状的方法,包括调节AAT多肽编码核酸在非限氮条件 下生长的植物中的表达。在于地上植物部分中具有活性的启动子控制下调节(优选增加)AAT样多肽编码 核酸的表达的一个优选方法是,在植物中引入和表达在于地上植物部分中具有活性的启动 子控制下的AAT样多肽编码核酸。调节(优选增加)AAT多肽编码核酸的表达的一个优选方法是,在植物中引入和表 达AAT多肽编码核酸。在一个实施方案中,下文述及的任何“可用于本发明方法的蛋白质”应理解为表示 如本文所定义的AAT样多肽。下文述及的任何“可用于本发明方法的核酸”应理解为表示 能够编码这样的AAT样多肽的核酸。待引入植物(从而可用于实施本发明方法)的核酸是 编码现在将要描述的此类蛋白质的任何核酸,下文也称为“AAT样核酸”或“AAT样基因”。在一个实施方案中,下文 述及的任何“可用于本发明方法的蛋白质”应理解为表示 如本文所定义的AAT多肽。下文述及的任何“可用于本发明方法的核酸”应理解为表示能够编码这样的AAT多肽的核酸。待引入植物(从而可用于实施本发明方法)的核酸是编码 现在将要描述的此类蛋白质的任何核酸,下文也称为“AAT核酸”或“AAT基因”。本文定义的“AAT样多肽”或“AAT多肽”是指具有一个或多个下列特征的任何多 肽(a)催化下列反应的能力L-丙氨酸+2-酮戊二酸丙酮酸+L-谷氨酸 (b)属于酶分类编号=EC 2. 6. 1. 2.(c)具有氨基转移酶结构域(在InterPro中称为IPR004839 ;以及在PFAM中称为 PF00155)(d)具有1-氨基环丙烷-1-羧酸合酶结构域(在InterPro中称为IPROOl 176)(e)靶向线粒体(f)当用于构建包含AAT序列的系统发生树时,与包含SEQ ID NO :51或SEQ ID NO 56的AAT样多肽或AAT多肽群而非任何其他AAT或AAT样序列群聚类。术语“结构域”和“基序”在本文“定义”部分进行了定义。存在用于鉴定结构域 的专家数据库,例如 SMART (Schultz 等(1998)Proc. Natl. Acad. Sci. USA 95,5857-5864 ; Letunic 等(2002)Nucleic Acids Res 30,242-244)、 InterPro(Mulder 等,(2003)Nucl. Acids. Res. 31,315-318)> Prosite(Bucher 禾口 Bairoch(1994), A generalized profile syntax for biomolecular sequencesmotifs and its function in automatic sequence interpretation. (In) ISMB-94 ;第二届分子生物学智能系统国际会议记录(Proceedings 2nd InternationalConference on Intelligent Systems for Molecular Biology)Altman R. , Brutlag D. , Karp P. , Lathrop R. , Searls D.编辑,53-61 页,AAAI Press, Menlo Park ;Hulo 等,Nucl. Acids. Res. 32 :D134_D137,(2004))或者 Pfam(Bateman 等,Nucleic Acids Research 30(1) :276_280 (2002)。进行蛋白质序列芯片(in silico)分析的一组工 具可以从ExPASy蛋白质组学服务器获得(瑞士生物信息学研究所(Swiss Institute of Bioinformatics)(Gasteiger 等 ExPASy :the proteomics server for in-depth protein knowledge andanalysis. Nucleic Acids Res 31:3784-3788(2003))。SEQ ID NO :2 多肽 序列的分析在下面示于本文实施例2和4。例如,SEQ ID NO :2所示的AHL19/20肽包含 具有InterPro登录号IPR014476的AT_hook DNA结合基序和在InterPro数据库中具有 InterPro登录号IPR005175并被描述为DUF296 (未知功能结构域296)的植物及原核生物 保守(PPC)结构域。还可使用常规技术,例如利用序列比对来鉴定结构域。一个这样的结构 域是如SEQ ID NO 36所示的SEQ ID NO 2的保守结构域(⑶)。所述⑶包含预测的NLS、 AT-hook DNA结合基序和PCC结构域,如图3中示意性显示的和图4中所示的。为比较而进行序列比对的方法是本领域众所周知的,此类方法包括GAP、BESTFIT、 BLAST、FASTA 和 TFASTA。GAP 使用 Needleman 和 Wunsch 的算法((1970) J. Mol. Biol. 48 443-453)来寻找可以使匹配数最大化且空位数最小化的两序列间的全局(即跨越全序列) 比对。BLAST算法(Altschul等(1990) J Mol Biol 215 :403_10)计算序列同一性百分比, 并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技 术信息中心(NCBI)公开地获得。例如,同源物可以使用ClustalW多重序列比对算法(1. 83 版),采用默认的成对比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella 等,(2003)BMC Bioinformatics. 10 29. MatGAT :an application thatgenerates similarity/identity matrices using protein or DNA sequences)的 方法之一,也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守 基序之间的比对,这对于所属领域的技术人员而言将是显而易见的。此外,除了利用全长序 列进行同源物鉴定以外,还可以利用特定的结构域。可以利用上述程序采用默认参数,针对 完整核酸序列或多肽序列或者针对选择的结构域或保守基序,确定序列同一性值。本文中 实施例3在表B中描述了 SEQ ID N0:2所示的AHL19/20多肽与表A中所列的AHL19/20多 肽之间的同一性百分比,其范围在50%至99%氨基酸序列同一性之间。在表Bl中,显示了 SEQ ID NO 36 (包含于SEQ ID NO :2中)所示的CD与实施例1表A中所列的AHL19/20多 肽的⑶之间的同一性百分比,其范围在70%至99%氨基酸序列同一性之间。
蛋白质亚细胞定位预测任务是重要的且得到充分研究的。已知蛋白质的定位有助 于阐明其功能。用于蛋白质定位的实验方法从免疫定位至使用绿色荧光蛋白(GFP)来标 记蛋白质。这些方法是精确的,但是与计算机方法相比非常费劳力。最近在根据序列数据 计算机预测蛋白质定位方面取得了许多进展。其中本领域技术人员公知的算法可在Swiss Institute forBioinformatics 托管的 ExPASy Proteomics tools 上获得,例如,PSort、 TargetP, ChloroP、LocTree、Predotar、LipoP, MIT0PR0T, PATS、PTSl、SignalP 等。本发明 多肽的亚细胞定位的鉴定示于实施例6。在SEQID N0:2的AHL19/20多肽中发现了预测的 核定位信号(NLS)。NLS是具有带正电荷的赖氨酸或精氨酸的一个或多个短序列。特别地, 本发明的SEQ ID NO :2经预测定位在真核细胞的核区室。此外,用于本发明方法的AHL19/20多肽(至少以其天然形式)通常,但不是必需 地,具有转录调控活性并能够与其他蛋白质相互作用。因此,具有降低的转录调控活性、 无转录调控活性、具有降低的蛋白质_蛋白质相互作用能力或不具有蛋白质-蛋白质相 互作用能力的AHL19/20多肽都可同等地用于本发明的方法。可使用本领域中熟知的技 术(例如 CurrentProtocols in Molecular Biology,第 1 禾口 2 卷,Ausubel 等(1994), CurrentProtocols)容易地体外或体内确定DNA结合活性和蛋白质-蛋白质相互作用。为 了确定AHL19/20多肽的DNA结合活性,几种测定法是可用的,例如DNA结合凝胶-迁移测 定法(或凝胶阻滞试验;Korfhage等(1994) Plant C 6 695-708),体外DNA结合测定法 (Schindler等(1993) Plant J4(l) 137-150),或酵母、动物和植物细胞中AHL19/20多肽的 转录激活(Halbach 等(2000)Nucleic Acid Res 28(18) :3542_3550)。可使用随机寡核苷 酸选择技术(Viola&Gonzalez(May 26, 2007) Biochemistry)确定特定的 DNA 结合序列。在一个实施方案中,本发明以SEQ ID NO 1所示的核酸序列转化植物来进行举例 说明,其编码SEQ ID N0:2的ALH19/20多肽序列。然而,本发明的实施并不局限于这些序 列;本发明的方法可以有利地利用任何编码本文所定义的AHL19/20多肽的核酸序列来实 施。编码AHL19/20多肽的核酸序列的实例在本文实施例1表A中给出。这样的核 酸序列可用于实施本发明的方法。实施例1表A中给出的多肽序列为SEQ ID N0:2所示 AHL19/20多肽的直系同源物和旁系同源物的示例序列,其中术语“直系同源物”和“旁系同 源物”如本文所定义。可以通过进行所谓的交互BLAST搜索,容易地找到其它直系同源物和 旁系同源物。通常,这包括第一 BLAST,S卩,以查询序列(例如,利用实施例1表A中所列的任一序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序 列开始时,通常使用BLASTN或TBLASTX (利用标准默认值),而当从蛋白质序列开始时,则 使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤 的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(第 二 BLAST)(在查询序列为SEQ ID NO :1或SEQ ID NO 2的情况下,第二 BLAST将针对拟南 芥序列进行)。然后比较第一和第二 BLAST的结果。如果第一 BLAST中高排序的命中事件 (high-ranking hit)与查询序列源自相同的物种,然后反向BLAST理想地导致查询序列处 于最高命中事件之列,则找到了旁系同源物;如果第一 BLAST中高排序的命中事件与查询 序列不源自相同的物种,且优选地在反向BLAST时导致查询序列处于最高命中事件之列, 则找到了直系同源物。 此外,GRP多肽,就SEQ ID NO :46和其直系同源物、旁系同源物和同源物而言, 通常具有可在金属饱和试验(Scheuhammer 等,Toxicol. Appl Pharmacol. 82,417-425, 1986)中测量的金属结合活性和/或可用作氧化还原传感器(Fabisiak等,Methods Enzymo1. 353,268-281(2002))。在一个实施方案中,本发明以SEQ ID NO :45所示的核酸序列转化植物来进行举例 说明,其编码SEQ ID NO :46的多肽序列。然而,本发明的实施并不局限于这些序列;本发明 的方法可以有利地利用本文所定义的任何GRP编码核酸序列或GRP多肽来实施。GRP多肽编码核酸序列的实例可在本领域已知的数据库中找到。这样的核酸序列 可用于实施本发明的方法。直系同源物和旁系同源物(术语“直系同源物”和“直系同源 物”如本文所定义)可通过实施所谓的交互BLAST搜索而容易地找到。通常,这包括第一 BLAST,以查询序列(例如,利用SEQ ID NO 46)针对任何序列数据库如可公共获得的NCBI 数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认 值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果 可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源 生物的序列进行反向BLAST(第二 BLAST)(在查询序列为SEQ ID NO 45或SEQ ID NO 46 的情况下,第二 BLAST将会针对拟南芥序列进行)。然后比较第一和第二 BLAST的结果。如 果第一 BLAST中高排序的命中事件与查询序列源自相同的物种,然后反向BLAST理想地导 致查询序列处于最高命中事件之列,则找到了旁系同源物;如果第一 BLAST中高排序的命 中事件与查询序列源自不同物种,且优选地在反向BLAST时导致查询序列处于最高命中事 件之列,则找到了直系同源物。在一个实施方案中,本发明以SEQ ID NO :50所示的核酸序列转化植物来进行举例 说明,其编码SEQ ID NO :51的多肽序列。然而,本发明的实施并不局限于这些序列;本发明 的方法可以有利地利用本文所定义的任何AAT样核酸或AAT样多肽来实施。可用于实施本发明方法的核酸的实例包括SEQ ID NO 51所示的ATT样多肽的直 系同源物和旁系同源物,其中术语“直系同源物”和“旁系同源物”如本文所定义。可以通 过进行所谓的交互BLAST搜索,容易地找到直系同源物和旁系同源物。通常,这包括第一 BLAST,以查询序列(例如SEQ ID NO 50或SEQ ID NO 51)针对任何序列数据库如可公共 获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX (利 用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查 询序列来源生物的序列进行反向BLAST (第二 BLAST)(在查询序列为SEQ ID NO 50或SEQ ID N0:51的情况下,第二 BLAST将会针对衣藻(Chlamydomonas)序列进行)。然后比较第 一和第二 BLAST的结果。如果第一 BLAST中高排序的命中事件与查询序列源自相同的物 种,然后反向BLAST理想地导致查询序列处于最高命中事件之列,则找到了旁系同源物;如 果第一 BLAST中高排序的命中事件与查询序列源自不同物种,且优选地在反向BLAST时导 致查询序列处于最高命中事件之列,则找到了直系同源物。在一个实施方案中,本发明以SEQ ID NO :55所示的核酸序列转化植物来进行举例 说明,其编码SEQ ID NO :56的多肽序列。然而,本发明的实施并不局限于这些序列;本发明 的方法可以有利地利用本文所定义的任何AAT编码核酸或AAT多肽来实施。本文实施例1中给出了寻找AAT多肽或其直系同源物或旁系同源物的编码核酸的 方法实例。这样的核酸可用于本发明的方法。直系同源物和旁系同源物可以通过进行所谓 的交互BLAST搜索容易地找到。通常,这包括第一 BLAST,以查询序列(例如利用SEQ ID N0:55或SEQ ID NO 56)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当 从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列 开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着 使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向 BLAST (第二 BLAST)(在查询序列为 SEQ ID NO 55 或 SEQ ID NO 56 的情况下,第二 BLAST 将针对稻序列进行)。然后比较第一和第二 BLAST的结果。如果第一 BLAST中高排序的命 中事件与查询序列源自相同的物种,然后反向BLAST理想地导致查询序列处于最高命中事 件之列,则找到了旁系同源物;如果第一 BLAST中高排序的命中事件与查询序列源自不同 物种,且优选地在反向BLAST时导致查询序列处于最高命中事件之列,则找到了直系同源 物。高排序的命中事件是E值低的命中事件。E值越低,分值越具有显著性(或者换 句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了 E值之 夕卜,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间 在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下可以使用ClustalWj^i 以邻接树,来辅助对相关基因聚类的可视化和鉴定直系同源物和旁系同源物。在含有SEQ ID NO 2的群内聚类的任何序列(AHL19多肽;图1和2中用圆圈标示的)可被认为落在上 述AHL19/20多肽定义内,并且可被认为适合用于本发明的方法。核酸变体也可用于实施本发明的方法。这类核酸变体的实例包括编码实施例1表 A中所示任一多肽序列的同源物和衍生物的核酸序列,其中“同源物”和“衍生物”如本文所 定义。同样可用于本发明方法的有编码实施例1表A所示任一多肽序列的直系同源物或旁 系同源物的同源物和衍生物的核酸序列。可用于本发明方法的同源物和衍生物与其源自的 未修饰蛋白质具有基本上相同的生物活性和功能活性。可用于实施本发明方法的其他 核酸变体包括编码ALH19/20多肽的核酸序列的 部分、与编码ALH19/20多肽的核酸序列杂交的核酸序列、编码ALH19/20多肽的核酸序列 的剪接变体、编码ALH19/20多肽的核酸序列的等位基因变体,以及通过基因改组获得的 ALH19/20多肽编码核酸序列的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。编码ALH19/20多肽的核酸序列无需是全长核酸序列,因为本发明方法的实施不 依赖于全长核酸序列的使用。根据本发明,提供了增强植物的种子产率相关性状的方法,包 括在植物中引入和表达实施例1表A所示任一核酸序列的部分、或者编码实施例1表A所 示任一多肽序列的直系同源物、旁系同源物或同源物的核酸序列的部分。 编码SEQ ID NO 46的同源物和衍生物的核酸序列变体也可用于实施本发明的方 法,术语“同源物”和“衍生物”如本文所定义。同样可用于本发明方法是编码SEQ ID NO 46的直系同源物或旁系同源物的同源物和衍生物的核酸序列。可用于本发明方法的同源物 和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。可用于实施本发明方法的其他核酸序列变体包括GRP多肽编码核酸序列的部分、 与GRP多肽编码核酸序列杂交的核酸序列、GRP多肽编码核酸序列的剪接变体、GRP多肽编 码核酸序列的等位基因变体,以及通过基因改组获得的GRP多肽编码核酸序列的变体。术 语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。GRP多肽编码核酸序列无需是全长核酸序列,因为本发明方法的实施不依赖于全 长核酸序列的使用。根据本发明,提供了增强在非生物胁迫条件下生长的植物的产率相关 性状的方法,包括在植物中引入和表达SEQ IDNO :45的部分或编码SEQ ID N0:46的直系同 源物、旁系同源物或同源物的核酸序列的部分。核酸变体也可用于实施本发明的方法。这类核酸变体的实例包括编码SEQ ID NO 51的同源物和衍生物的核酸,术语“同源物”和“衍生物”如本文所定义。同样可用于本发 明方法的有编码SEQ ID NO :51所示AAT样多肽或SEQ ID NO :56所示AAT多肽的直系同源 物或旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物与其源自 的未修饰蛋白质具有基本上相同的生物活性和功能活性。可用于实施本发明方法的其他核酸变体包括AAT样多肽或AAT多肽编码核酸的部 分、与AAT样多肽或AAT多肽编码核酸杂交的核酸、AAT样多肽或AAT多肽编码核酸的剪接 变体、AAT样多肽或AAT多肽编码核酸的等位基因变体,以及通过基因改组获得的AAT样多 肽或AAT多肽编码核酸的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文 所述。AAT样多肽或AAT多肽编码核酸无需是全长核酸,因为本发明方法的实施不依赖 于全长核酸序列的使用。根据本发明,提供了增强植物的产率相关性状的方法,包括在植物 中引入和表达SEQ ID NO: 50或SEQ ID NO 55的部分或编码SEQ ID N0:51或SEQ ID NO: 56的直系同源物、旁系同源物或同源物的核酸的部分。核酸序列的“部分”可以例如,通过对核酸序列进行一个或多个缺失来制备。“部 分”可以以分离的形式使用,或者可将其与其他编码(或非编码)序列融合,以便例如,产生 组合了若干活性的蛋白质。当与其他编码序列融合时,经翻译后所产生的多肽可能比针对 该蛋白质部分所预测到的要大。可用于本发明方法的“部分”编码如本文所定义的AHL19/20多肽,并与实施例1表 A所示多肽序列具有基本上相同的生物活性。优选“部分”是实施例1表A所示任一核酸序 列的部分,或是编码实施例1表A所示任一多肽序列的直系同源物或旁系同源物的核酸序 列的部分。优选“部分”按照递增的优选顺序是至少400、450、500、550、600、650、700、750、800、850、900、940个连续核苷酸长,所述连续核苷酸来自实施例1表A所示任一核酸序列 或者编码实施例1表A所示任一多肽序列的直系同源物或旁系同源物的核酸序列。优选, 所述部分是编码多肽序列的核酸序列的部分,其中所述多肽序列当用于构建AHL系统发生 树,例如图1或图2中描述的系统发生树时,与包含SEQ ID NO:2所示多肽序列的AHL19/20 多肽群而非任何其他AHL群聚类。最优选“部分”是核酸序列SEQ ID NO :1的部分。可用于本发明方法的“部分”编码如本文所定义的GRP多肽,并与SEQID NO 46所示多肽序列具有基本上相同的生物活性。优选部分是SEQ IDNO :45所示核酸序列的部分, 或是编码SEQ ID NO :46所示多肽序列的直系同源物或旁系同源物的核酸序列的部分。优 选“部分”长度是至少50、75、100、125、150、175、200、210、220、230、240或更多个连续核苷 酸,所述连续核苷酸来自SEQ ID NO 45或者编码SEQ ID NO 46的直系同源物或旁系同源 物的核酸序列。最优选,所述部分是SEQ ID NO :45的核酸序列的部分。可用于本发明方法的“部分”编码如本文所定义的AAT样多肽,并与SEQ ID NO 51 的氨基酸序列具有基本上相同的生物活性。优选“部分”长度是至少500、550、600、650、700、 750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450、1500、 1550个连续核苷酸,所述连续核苷酸来自SEQ ID NO :50或者编码SEQ ID NO :51的直系同 源物或旁系同源物的核酸序列。优选“部分”编码这样的氨基酸序列的片段,当用于构建包含AAT序列的系统发生 树时,所述氨基酸序列与包含SEQ ID NO :51的AAT样多肽群而非任何其他AAT或AAT样序 列群聚类。可用于本发明方法的“部分”编码如本文所定义的AAT多肽,并与SEQID NO 56的 氨基酸序列具有基本上相同的生物活性。优选“部分”长度是至少500、550、600、650、700、 750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400、1450 个连续核 苷酸,所述连续核苷酸来自SEQ ID NO :55或者编码SEQ ID NO :56的直系同源物或旁系同 源物的核酸序列。优选,所述部分编码氨基酸序列的片段,所述氨基酸序列,当用于构建包含AAT序 列的系统发生树时,与包含SEQ ID NO: 56的AAT多肽群而非任何其他AAT序列群聚类。可用于本发明方法的另一核酸序列变体为在降低的严格条件下、优选在严格条件 下,能够与本文所定义的产率增加性多肽的编码核酸序列或者本文所定义的“部分”杂交 的核酸序列,其中所述产率增加性多肽选自核定位AT-hook基序蛋白19/20 (AHL19/20)、 GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶 (AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。根据本发明,在一个实施方案中提供了增加植物的种子产率相关性状的方法,包 括在植物中引入和表达能够与实施例1表A所示任一核酸序列杂交的核酸序列,或者包括 在植物中引入和表达能够与编码实施例1表A所示任一核酸序列的直系同源物、旁系同源 物或同源物的核酸序列杂交的核酸序列。可用于本发明方法的杂交序列编码如本文所定义的AHL19/20多肽,与实施例1表 A所示多肽序列具有基本上相同的生物活性。优选杂交序列能够与实施例1表A所示任一 核酸序列杂交、或与任一前述序列的部分杂交,其中部分如上文所定义;或者其中杂交序列 能够与编码实施例1表A所示任一多肽序列的直系同源物或旁系同源物的核酸序列杂交。优选,所述杂交序列能够与编码多肽序列的核酸序列杂交,所述多肽序列,当用于构建AHL 系统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ ID NO 2所示多肽序列的 AHL19/20多肽群而非任何其他AHL群聚类。最优选杂交序列能够与SEQ ID N0:1所示的 核酸序列或其部分杂交。根据本发明,在一个实施方案中提供了强在非生物胁迫条件下生长的的包括SEQ ID NO :45杂交的核酸序列,或包括在植物中引入和表达能够与编码SEQ ID NO :46的直系 同源物、旁系同源物或同源物的核酸杂交的核酸。可用于本发明方法的杂交序列编码如本文所定义的GRP多肽,与SEQID NO 46所 示多肽序列具有基本上相同的生物活性。优选杂交序列能够与SEQ ID N0:45杂交、或与该 序列的部分杂交,其中部分如上文所定义;或者杂交序列能够与编码SEQ ID N0:46的直系 同源物或旁系同源物的核酸序列或其部分杂交。根据本发明,在一个实施方案中提供了增强植物的产率相关性状的方法,包括在植物中引入和表达能够与SEQ ID NO :50杂交或者能够与编码SEQ ID NO :51的直系同源 物、旁系同源物或同源物的核酸杂交的核酸。可用于本发明方法的杂交序列编码如本文所定义的AAT样多肽,与SEQ ID NO 51 所示氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与编码SEQ ID N0:51的 直系同源物、旁系同源物或同源物的核酸杂交、或与这样的核酸的部分杂交,部分如上文所 定义。最优选,杂交序列能够与SEQ ID NO :50所示核酸杂交或与其部分杂交。根据本发明,提供了增强植物的产率相关性状的方法,包括在植物中引入和表达 能够与SEQ ID NO :55杂交或者能够与编码SEQ ID NO :56的直系同源物、旁系同源物或同 源物的核酸杂交的核酸。可用于本发明方法的杂交序列编码如本文所定义的AAT多肽,与SEQID NO 56的 氨基酸序列具有基本上相同的生物活性。优选杂交序列能够与编码SEQ ID N0:56的直系同 源物、旁系同源物或同源物的核酸杂交、或与这样的核酸的部分杂交,部分如上文所定义。 最优选,杂交序列能够与SEQ ID NO :55所示核酸杂交或与其部分杂交。优选杂交序列编码具有这样的氨基酸序列的多肽,该氨基酸序列当全长且用于构 建包含AAT序列的系统发生树时,与包含SEQ ID NO :51的AAT样多肽群或与包含SEQ ID NO 56的AAT多肽群而非任何其他AAT或AAT样序列群聚类。可用于本发明方法的另一类核酸序列变体为编码前文所定义的产率增加性多肽 的剪接变体,其中剪接变体如本文所定义,所述产率增加性多肽选自核定位AT-hook基序 蛋白19/20 (AHL19/20)、GRP (生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多 肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。根据本发明,提供了增强种子产率相关性状的方法,包括在植物中引入和表达实 施例1表A所示任一核酸序列的剪接变体、或编码实施例1表A所示任一多肽序列的直系 同源物、旁系同源物或同源物的核酸序列的剪接变体。在一个实施方案中,剪接变体是SEQ ID NO :1所示核酸序列的剪接变体,或编码 SEQ ID NO :2的直系同源物或旁系同源物的核酸序列的剪接变体。优选剪接变体是编码这 样的多肽序列的核酸序列的剪接变体,所述多肽序列,当用于构建AHL系统发生树,例如图 1或图2中描述的系统发生树时,与包含SEQ ID NO 2所示多肽序列的AHL19/20多肽群而非任何其他AHL群聚类。在一个根据本发明的实施方案中,提供了相对于对照植物增强在非生物胁迫条件 下生长的植物的产率相关性状的方法,包括在植物中引入和表达SEQ ID N0:45的剪接变 体、或编码SEQ ID NO :46的直系同源物、旁系同源物或同源物的核酸序列的剪接变体。在一个根据本发明的实施方案中,提供了增强植物的产率相关性状的方法,包括 在植物中引入和表达SEQ ID N0:50或SEQ ID NO :55的剪接变体、或编码SEQ ID N0:51或 SEQ ID NO :56的直系同源物、旁系同源物或同源物的核酸的剪接变体。优选由剪接变体编码的氨基酸序列,当用于构建包含AAT序列的系统发生树时, 与包含SEQ ID NO :51的AAT样多肽群或与包含SEQ ID NO :56的AAT多肽群而非任何其他 AAT或AAT样序列群聚类。
可用于实施本发明方法的另一类核酸序列变体为编码前文所定义的产率增加性 多肽的核酸序列的等位基因变体,其中等位基因变体如本文所定义,所述产率增加性多肽 选自核定位AT-hook基序蛋白19/20 (AHLigAOhGRP (生长调节蛋白,其中所述GRP多 肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶 (AAT)多肽。在一个根据本发明的实施方案中,提供了增强种子产率相关性状的方法,包括在 植物中引入和表达实施例1表A所示任一核酸序列的等位基因变体,或者包括在植物中引 入和表达编码实施例1表A所示任一多肽序列的直系同源物、旁系同源物或同源物的核酸 序列的等位基因变体。可用于本发明方法的等位基因变体与SEQ ID NO 2的AHL19/20多肽及实施例1 表A所示的任一多肽序列具有基本上相同的生物活性。等位基因变体天然存在,并且这些 天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ ID NO :1的等位基 因变体,或编码SEQ ID NO :2的直系同源物或旁系同源物的核酸序列的等位基因变体。优选 等位基因变体是这样的多肽序列的等位基因变体,所述多肽序列当用于构建AHL系统发生 树,例如图1或图2中描述的系统发生树时,与包含SEQ ID N0:2所示多肽序列的AHL19/20 多肽群而非任何其他AHL群聚类。在一个根据本发明的实施方案中,提供了增强在非生物胁迫条件下生长的植物的 产率相关性状的方法,包括在植物中引入和表达SEQ ID NO :45的等位基因变体、或包括在 植物中引入和表达编码SEQ ID NO :46所示多肽序列的直系同源物、旁系同源物或同源物的 核酸序列的等位基因变体。可用于本发明方法的等位基因变体与SEQ ID NO 46的GRP多肽具有基本上相同 的生物活性。等位基因变体天然存在,并且这些天然等位基因的应用包含于本发明的方法 中。在一个根据本发明的实施方案中,提供了增强植物的产率相关性状的方法,包括 在植物中引入和表达SEQ ID N0:50或SEQ ID NO :55的等位基因变体、或编码SEQ ID NO: 51或SEQ ID NO :56的氨基酸序列的直系同源物、旁系同源物或同源物的核酸的等位基因 变体。可用于本发明方法的等位基因变体与SEQ ID NO 51的AAT样多肽或SEQ ID NO 56的AAT多肽具有基本上相同的生物活性。等位基因变体天然存在,并且这些天然等位基因的应用包含于本发明的方法中。优选由等位基因变体编码的氨基酸序列,当用于构建包 含AAT序列的系统发生树时,与包含SEQ ID NO :51的AAT样多肽群或与包含SEQ ID NL: 56的AAT多肽群而非任何其他AAT或AAT样序列群聚类。基因改组或定向进化也可用于产生上文所定义的产率增加性多肽的编码核酸序 列的变体;其中术语“基因改组”如本文所定义,所述产率增加性多肽选自核定位AT-hook 基序蛋白19/20 (AHL19/20)、GRP (生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a (MT2a) 多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。 在一个根据本发明的实施方案中,提供了增强种子产率相关性状的方法,包括在 植物中引入和表达实施例1表A所示任一核酸序列的变体,或者包括在植物中引入和表达 编码实施例1表A所示任一多肽序列的直系同源物、旁系同源物或同源物的核酸序列的变 体,该变体核酸序列通过基因改组获得。优选,通过基因改组获得的核酸序列编码多肽序列,所述多肽序列,当用于构建 AHL系统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ ID NO 2所示多肽序 列的AHL19/20多肽群而非任何其他AHL群聚类。在一个根据本发明的实施方案中,提供了增强在非生物胁迫条件下生长的植物的 产率相关性状的方法,包括在植物中引入和表达SEQ ID NO :45的变体核酸序列,或者包括 在植物中引入和表达编码SEQ ID NO :46的直系同源物、旁系同源物或同源物的核酸序列的 变体,该变体核酸序列通过基因改组获得。在一个根据本发明的实施方案中,提供了增强植物的产率相关性状的方法,包括 在植物中引入和表达SEQ ID NO: 50或SEQ ID NO 55的变体,或编码SEQ ID N0:51或SEQ ID NO 56的直系同源物、旁系同源物或同源物的核酸的变体,该变体核酸通过基因改组获得。优选,通过基因改组获得的变体核酸编码这样的氨基酸序列,当用于构建包含AAT 序列的系统发生树时,其与包含SEQ ID NO 51的AAT样多肽群或与包含SEQ ID NO 56的 AAT多肽群而非任何其他AAT或AAT样序列群聚类。此外,还可利用定点诱变获得核酸序列变体。若干方法可用来实现定点诱变,最常 见的是基于 PCR 的方法(Current Protocols in MolecularBiology. Wiley 编辑)。AHL19/20多肽编码核酸序列可以来自任何天然或人造的来源。可以通过有意的人 为操作在组成和/或基因组环境上修饰核酸序列,使之不同于天然形式。优选AHL19/20多 肽编码核酸序列来自植物,还优选来自双子叶植物,更优选来自十字花科(Brassicaceae), 最优选所述核酸序列来自拟南芥。GRP多肽编码核酸序列可以来自任何天然或人造的来源。可以通过有意的人为操 作在组成和/或基因组环境上修饰核酸序列,使之不同于天然形式。优选GRP多肽编码核 酸序列来自植物。在SEQ ID NO 45的情况下,GRP多肽编码核酸序列优选来自双子叶植物, 更优选来自十字花科,最优选所述核酸序列来自拟南芥。实施本发明的方法产生相对于对照植物具有增强的种子产率相关性状的植物。术 语“产率”和“种子产率”在本文“定义”部分有更详细的说明。实施本发明的方法产生在非生物胁迫条件下生长时相对于对照植物具有增强的 产率相关性状的植物。特别地,实施本发明的方法产生当在非生物胁迫条件下生长时相对于对照植物具有增加的早期活力和增加的产率,特别地增加的生物量和增加的种子产率, 的植物。术语“产率”和“种子产率”在本文“定义”部分有更详细的说明。此处所述及的增强的产率相关性状应理解为表示植物的一个或多个部分的早期 活力和/或生物量(重量)的增加,所述部分可以包括地上(可收获)部分和/或地下(可 收获)部分。特别地,这样的可收获部分为生物量和/或种子,并且实施本发明的方法使得 在非生物胁迫条件下生长的植物,相对于在相当条件下生长的对照植物的早期活力、生物 量或种子产率,具有增加的早期活力、生物量和/或种子产率。AAT样多肽编码核酸可以来自任何天然或人造的来源。可以通过有意的人为 操作在组成和/或基因组环境上修饰核酸,使之不同于天然形式。优选AAT样核酸来自 藻类,还优选来自衣藻属(Chlamydomonas),更优选来自物种雷氏衣藻(Chlamydomonas reinhardtii)。实施本发明的方法产生具有增强的产率相关性状的植物。特别地,实施本发明的 方法产生相对于对照植物具有增加的产率,尤其是具有增加的种子产率,的植物。术语“产 率”和“种子产率”在本文“定义”部分有更详细的说明。此处所述及的增强的产率相关性状应理解为表示植物的一个或多个部分的生物 量(重量)的增加,所述部分可以包括地上(可收获)部分和/或地下(可收获)部分。特 别地,这样的可收获部分为种子。AAT多肽编码核酸可以来自任何天然或人造的来源。可以通过有意的人为操作在 组成和/或基因组环境上修饰核酸,使之不同于天然形式。优选POI多肽编码核酸来自植 物。还优选来自单子叶植物,更优选来自禾本科(Poaceae),最优选所述核酸来自稻(Oryza sativa)0此处所述及的增强的产率相关性状应理解为表示植物的一个或多个部分的生物 量(重量)的增加,所述部分可以包括地上(可收获)部分和/或地下(可收获)部分。特 别地,这样的可收获部分为种子。并且实施本发明的方法使得植物相对于对照植物的种子 产率具有增加的种子产率。以玉米为例,产率增加可以表现为如下一个或多个方面每公顷或英亩建植 (established))的植物数的增加;每株植物的穗数的增加;行数、行粒数、粒重、千粒重、穗 长度/直径的增加;种子饱满率(其为饱满种子数除以种子总数并乘以100)的增加,等等。 以稻为例,产率增加可以表现为如下一个或多个方面的增加每公顷或英亩的植物数、每株 植物的圆锥花序数、每个圆锥花序的小穗数、每个圆锥花序的花朵(小花)数(其表达为饱 满种子数占一级圆锥花序(primary panicles)数的比率)、种子饱满率(其为饱满种子数 除以种子总数并乘以100)的增加、千粒重的增加,等等。在一个实施方案中,本发明提供了相对于对照植物增强植物的种子产率相关性状 的方法,所述方法包括增加植物中编码本文所定义的AHL19/20多肽的核酸序列的表达。由于根据本发明的转基因植物具有增加的种产率相关性状,这些植物可呈现出, 相对于对照植物在其生命周期相应阶段的生长速率而言,增加的生长速率(至少在其部分 生命周期中)。在一个实施方案中,本发明提供了相对于 在相当的条件下生长的对照植物,增强 在非生物胁迫生长条件下的植物的产率相关性状,特别地植物的生物量和/或种子产率的方法,所述方法包括增加植物中编码本文所定义的GRP多肽的核酸序列的表达。由于在非生物胁迫条件下生长的本发明转基因植物具有增强的种子产率相关性 状,这些植物可呈现出,相对于在相当生长条件下的对照植物在其生命周期的相应阶段上 的生长速率而言,增加的生长速率(至少在其部分生命周期中)。在一个根据本发明的实施方案中,提供了相对于对照植物增加植物的产率、特别 是种子产率的方法,所述方法包括调节植物中编码本文所定义的AA样多肽或AAT多肽的核 酸的表达,优选增加表达。由于本发明的转基因植物具有增加的产率,这些植物可呈现出,相对于对照植物 在其生命周期相应阶段的生长速率而言,增加的生长速率(至少在其部分生命周期中)。增加的生长速率可以是对植物的一个或多个部分(包括种子)特异的,或者可以 基本上遍及整株植物。具有增加生长速率的植物可以具有更短的生命周期。植物的生命周 期可以理解为表示从成熟干种子生长至植物产生类似于起始材料的成熟干种子 的阶段所 需的时间。此生命周期可以受到诸如早期活力、生长速率、绿度指数、开花时间和种子成熟 速度等因素的影响。生长速率的增加可以出现在植物生命周期的一个或多个阶段,或者出 现在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段,生长速率的增加可 以反映出增加的(早期)活力。生长速率的增加可以改变植物的收获周期,使植物能够比 原来可能的情况更晚播种和/或更快收获(类似的效果可以通过较早的开花时间获得;在 作物中延迟的开花通常不是期望的性状)。如果生长速率充分增加,可以允许再播种同种植 物物种的种子(例如完全在一个常规的生长期内,播种和收获稻类植物、接着再播种和收 获稻类植物)。与此类似,如果生长速率充分地增加,可以允许再播种不同植物物种的种子 (例如播种和收获玉米植物,随后,例如,播种和任选地收获大豆、马铃薯或任何其他适合的 植物)。在一些作物植物的情况下,也可能可以从同一砧木得到额外次数的收获。改变植物 的收获周期可以导致每英亩年生物量产量的增加(这是由于(比方说在一年中)任何特定 植物可以生长和收获的次数的增加)。与野生型对应物相比,生长速率的增加还可能允许在 更广阔的地域栽培转基因植物,这是因为种植作物的地域限制通常由种植时(早季)或收 获时(晚季)不利的环境条件所决定。如果缩短收获周期,就可以避免这类不利条件。可 以通过从生长曲线获得多种参数来确定生长速率,这类参数可以是T-Mid(植物达到其最 大大小的50%所需的时间)和T-90(植物达到其最大大小90%所需的时间)等等。本文 所定义的生长速率不用于表示延迟的开花。根据本发明的一个实施方案,实施本发明的方法产生了相对于对照植物具有增加 的生长速率的植物。因此,根据本发明的该实施方案,提供了增加植物生长速率的方法,所 述方法包括增加植物中编码本文所定义的AHL19/20多肽的核酸序列的表达。根据本发明的一个实施方案,实施本发明的方法产生了在非生物胁迫条件下生长 时相对于对照植物具有增加的生长速率的植物。因此,根据本发明的该实施方案,提供了增 加在非生物胁迫条件下生长的植物生长速率的方法,所述方法包括增加植物中编码本文所 定义的GRP多肽的核酸序列的表达。根据本发明的一个实施方案,实施本发明的方法产生了相对于对照植物具有增加 的生长速率的植物。因此,根据本发明的该实施方案,提供了增加植物生长速率的方法,所 述方法包括调节,优选增加,地上植物部分中编码本文所定义的ATT样多肽或ATT多肽的核酸的表达。与在相当条件下生长的对照植物相比,增强的种子产率相关性状可以发生在植物 处于非胁迫条件下或暴露于多种胁迫时。与对照植物相比,产率相关性状的增强(种子产 率和/或生长速率的增加)可以发生在植物处于非胁迫条件下或暴露于多种胁迫时。 在特别优选实施方案中,在非胁迫条件下实施本发明的方法。然而,无论植物处于 非胁迫条件下还是暴露于不同的胁迫,都可以发生与对照植物相比,产率和/或生长速率 的增加。植物通常通过更缓慢地生长来对暴露于胁迫作出反应。在重度的胁迫条件下,植 物甚至可能完全停止生长。另一方面,轻度的胁迫在此处定义为植物暴露于该胁迫后、不导 致植物出现无重新生长能力的完全停止生长的任何胁迫。在本发明的意义上,轻度胁迫导 致受胁迫的植物与在非胁迫条件下的对照植物相比,生长减少不足40 %、35 %或30 %,优 选不足25%、20%或15%,更优选不足14%、13%、12%、11%或10%或更低。由于农业实 践(灌溉、施肥、农药处理)的进步,在栽培的作物植物中通常不会遇到重度胁迫。因此,由 轻度胁迫诱导的减弱的生长通常是农业上不期望的特征。轻度胁迫可以是植物接触到的 日常生物和/或非生物(环境)胁迫。非生物胁迫可以由干旱或过多的水、缺氧胁迫、盐胁 迫、化学毒性、氧化胁迫和热、冷或冰冻温度引起。非生物胁迫可以是由水胁迫(特别由于 干旱)、盐胁迫、氧化胁迫或离子胁迫引起的渗透胁迫。生物胁迫通常是由病原体例如细菌、 病毒、真菌、线虫和昆虫引起的胁迫。本文所用的术语“非胁迫”条件是允许植物最佳生长 的环境条件。本领域技术人员知晓给定区域的正常土壤条件和气候条件。如Wang等(Planta (2003) 218 :1_14)所报道的那样,非生物胁迫引起一系列的形 态学、生理学、生物化学和分子变化,对植物生长和生产力造成不利影响。已知干旱、盐度、 极端温度和氧化胁迫相互联系,并可以通过相似的机制诱发生长和细胞损害。Rabbani等 (Plant Physiol (2003) 133 :1755_1767)描述了干旱胁迫和高盐度胁迫之间特别高程度的 “对话(cross-talk)”。例如,干旱和/或盐度主要表现为渗透胁迫,导致破坏细胞中的稳 态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴,可以引起功能及结构蛋 白质的变性。所以,这些多种多样的环境胁迫通常激活相似的细胞信号传递路径和细胞应 答,如应激蛋白的产生、抗氧化剂的上调、相容溶质的累积以及生长阻抑。如本文所用的术 语“非胁迫”条件为那些允许植物最佳生长的环境条件。本领域技术人员知晓给定区域的 正常土壤条件和气候条件。在一个实施方案中,实施本发明的方法产生在非胁迫条件下或在轻度胁迫条件下 生长时相对于在相当条件下生长的对照植物具有增强的种子产率相关性状的植物。因此, 根据本发明的一个实施方案,提供了增强在非胁迫条件下或在轻度胁迫条件下生长的植物 的种子产率相关性状的方法,所述方法包括增加植物中AHL19/20多肽编码核酸序列的表 达。在一个实施方案中,实施本发明的方法产生在轻度胁迫条件下生长时相对于在相 当条件下生长的对照植物具有增强的产率相关性状的植物。因此,根据本发明的一个实施 方案,提供了增强在轻度胁迫条件下生长的植物的产率相关性状的方法,所述方法包括增 加植物中GRP多肽编码核酸序列的表达。实施本发明的方法产生在非生物胁迫条件下生长时相对于在相当条件下生长的对照植物具有增强的产率相关性状的植物。如Wang等(Planta (2003) 218 :1_14)所报道的 那样,非生物胁迫引起一系列的形态学、生理学、生物化学和分子变化,对植物生长和生产 力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系,并可以通过相似的机制 诱发生长和细胞损害。Rabbani等(Plant Physiol (2003) 133 1755-1767)描述了干旱胁 迫和高盐度胁迫之间存在着的一种特别高程度的“对话(cross-talk)”。例如,干旱和/或 盐度主要表现为渗透胁迫,导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低 温、盐度或干旱胁迫相伴,可以引起功能及结构蛋白质的变性。所以,这些多种多样的环境 胁迫通常激活相似的细胞信号传递路径和细胞应答,如应激蛋白的产生、抗氧化剂的上调、 相容溶质的累积以及生长阻抑。因为多种多样的环境胁迫激活相似的路径,因此本发明以 干旱胁迫进行的举例说明不应当被看作局限于干旱胁迫,而是应该看作为一个筛选,其显 示了如本文所定义的AHL19/20多肽可以参与在一般的非生物胁迫条件下增加产率相关性 状(相对于在相当的胁迫条件生长的对照植物而言)。因为多种多样的环境胁迫激活相似的路径,因此本发明以干旱胁迫和盐胁迫进行 的举例不应当被看作局限于干旱胁迫或盐胁迫,而是应该看作是一个筛选,其显示了如本 文所定义的GRP多肽可以参与在一般的非生物胁迫条件下增强产率相关性状(相对于在相 当的胁迫条件生长的对照植物而言)。如本文所定义的术语“非生物胁迫”应当理解为表示任何一个或多个下列胁迫水 胁迫(由干旱或过多的水引起的)、缺氧胁迫、盐胁迫、温度胁迫(由热、冷或冰冻温度引起 的)、化学毒性胁迫和氧化胁迫。根据本发明的一个方面,非生物胁迫 是渗透胁迫,其选自水 胁迫、盐胁迫、氧化胁迫和离子胁迫。优选,水胁迫是干旱胁迫。术语盐胁迫不限于食用盐 (NaCl),而可以是由NaCl、KC1、LiCl、MgCl2、CaCl2等中的一种或多种引起的任何胁迫。优选,非生物胁迫是干旱胁迫。备选地,非生物胁迫是盐胁迫。在一个实施方案中,实施本发明的方法产生了在非生物胁迫条件下生长时相对于 在相当的胁迫条件下生长的对照植物具有增强的种子产率相关性状的植物。因此,根据本 发明,提供了增强在非生物胁迫条件下生长的植物的种子产率相关性状的方法,所述方法 包括增加植物中AHL19/20多肽编码核酸序列的表达。根据本发明的一个方面,非生物胁迫 是渗透胁迫,其选自一个或多个下列胁迫水胁迫、盐胁迫、氧化胁迫和离子胁迫。在一个实施方案中,实施本发明的方法产生了在非生物胁迫条件下生长时相对于 在相当的胁迫条件下生长的对照植物具有增强的产率相关性状的植物。因此,根据本发明, 提供了增强在非生物胁迫条件下生长的植物的产率相关性状的方法,所述方法包括增加植 物中GRP多肽编码核酸序列的表达。根据本发明的一个方面,非生物胁迫是渗透胁迫,其选 自一个或多个下列胁迫水胁迫、盐胁迫、氧化胁迫和离子胁迫。优选,非生物胁迫是干旱胁 迫。备选地或另外地,非生物胁迫是盐胁迫。非生物环境胁迫的另一实例是植物为生长和发育需要同化吸收的一种或多种养 分的可利用度减小。由于养分利用效率对植物产率和产品质量的强烈影响,有大量化肥倾 倒在田间以优化植物生长和品质。植物生产力一般受限于三种主要养分磷、钾和氮,而这 三者中的氮通常是植物生长的限速元素。因此,植物生长所需的主要营养素是氮(N)。氮是 见于活细胞中的众多重要化合物(包括氨基酸、蛋白质(酶)、核酸和叶绿素)的组成成分。 1. 5% -2%的植物干物质是氮,约合植物总蛋白质的16%。因而,氮可利用度是作物植物生长和产量的主要限制因素(Frink等人(1999)Proc NatlAcad Sci USA 96(4) :1175_1180), 而且对蛋白质累积和氨基酸组成也具有重大影响。因此,在限氮条件下生长时具有增强的 种子产率相关性状的作物植物具有重大意义。
在一个实施方案中,实施本发明的方法产生了在养分可利用度下降的条件下,特 别是在氮可利用度下降的条件下生长时,相对于在相当条件下生长的对照植物,具有增强 的种子产率相关性状的植物。因此,根据本发明,提供了增强在养分可利用度下降,优选氮 可利用度下降的条件下生长的植物的种子产率相关性状的方法,所述方法包括增加植物中 AHL19/20多肽编码核酸序列的表达。养分可利用度下降可以因养分,诸如氮、磷及其他含磷 化合物、钾、钙、镉、镁、锰、铁和硼等,缺乏或过量所致。优选,养分可利用度下降是氮可利用 度的下降。在一个实施方案中,实施本发明的方法产生了在养分可利用度下降的条件下,特 别是在氮可利用度下降的条件下,生长时,相对于在相当条件下生长的对照植物,具有增强 的产率相关性状的植物。因此,根据本发明,提供了增强在养分可利用度下降的条件下生长 的植物的产率相关性状的方法,所述方法包括增加植物中GRP多肽编码核酸序列的表达。 养分可利用度下降可包括养分,诸如氮、磷及其他含磷化合物、钾、钙、镉、镁、锰、铁和硼等, 的可利用度下降。实施本发明的方法产生了在非胁迫条件下生长时相对于对照植物具有增加的产 率的植物。因此,根据本发明,提供了增加在非胁迫条件下生长的植物的产率的方法,所述 方法包括增加地上植物部分中AAT样多肽编码核酸的表达。本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)或其细胞。 所述植物或其部分或其细胞含有编码如上文所定义的产率增加性多肽的核酸转基因,所述 产率增加性多肽选自核定位AT-hook基序蛋白19/20 (AHL19/20)、GRP (生长调节蛋白,其 中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸 氨基转移酶(AAT)多肽。本发明还提供遗传构建体和载体,以利于在植物中引入和/或增加表达编 码产率增加性多肽的核酸序列,所述产率增加性多肽选自核定位AT-hook基序蛋白 19/20 (AHL19/20)、GRP (生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、 丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。可以将基因构建体插入 适于转化进入植物并适于在转化的细胞中表达目的基因的载体中,该载体可以是可商购的 载体。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。更具体地,本发明提供这样的构建体,其含有(a)编码如上文所定义的产率增加性多肽的核酸序列,所述产率增加性多肽选自 核定位AT-hook基序蛋白19/20 (AHL19/20)、GRP (生长调节蛋白,其中所述GRP多肽是金属 硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。(b) 一个或多个能够增加(a)中核酸序列表达的控制序列;和任选的(c)转录终止序列。在一个实施方案中,编码AHL19/20多肽的核酸序列如上文所定义。术语“控制序 列”和“终止序列”如本文所定义。优选,构建体的控制序列之一是从植物基因组分离的组成型启动子。植物组成型启动子的实例是G0S2启动子,优选稻G0S2启动子,更优选由SEQ ID NO :35所示的G0S2启动子。在一个实施方案中,编码GRP多肽的核酸序列如上文所定义。术语“控制序列”和 “终止序列”如本文所定义。优选,编码AAT样多肽或AAT多肽的核酸如上文所定义。术语“控制序列”和“终 止序列”如本文所定义。可以使用含有任何上述核酸序列的载体转化植物。技术人员充分知晓载体中必须 存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。可以将目的序列 有效连接于一个或多个控制序列(至少连接于启动子)。有利地,可以使用任何类型的天然或合成启动子增加核酸序列的表达。组成型启 动子,优选从植物基因组分离的组成型启动子,在所述方法中特别有用。植物组成型启动子 驱动编码序列以在所有情况下均低于在35SCaMV病毒启动子控制下获得的水平的水平表 达。其他器官特异性启动子,例如用于在叶、茎、块茎、分生组织、种子(胚和/或胚乳) 中优先表达的器官特异性启动子,在实施本发明的方法中是有用的。关于各种启动子类型 的定义,敬请参见本文“定义”部分。应当清楚本发明的可实施性并不受限于SEQ ID NO=I所示的AHL19/20多肽编码 核酸序列,而且本发明的可实施性也不受限于由组成型启动子所驱动的AHL19/20多肽编 码核酸序列的表达。应当清楚本发明的可实施性并不受限于SEQ ID NO 45所示的GRP多肽编码核酸 序列,而且本发明的可实施性也不受限于由组成型启动子所驱动的GRP多肽编码核酸序列 的表达。组成型启动子优选为G0S2启动子,优选来自稻的G0S2启动子。还优选G0S2启动 子为基本上类似于SEQ ID N0:47的核酸序列,最优选G0S2启动子如SEQ ID N0:47所示。 有关组成型启动子的更多实例,敬请参见本文“定义”部分表2。应当清楚本发明的可实施性并不局限于SEQ ID NO :50所示的AAT样核酸,而且本 发明的可实施性也不局限于由原叶绿素酸酯还原酶启动子所驱动的AAT样多肽编码核酸 的表达。有关各种启动子类型的定义,敬请参见“定义”部分。特别可用于本发明方法的是 根特异性启动子,特别是根表皮特异性启动子。根特异性启动子优选是硝酸转运蛋白启动 子,还优选来自稻(如由Lin,2000描述的OsNRTl启动子)。该启动子由SEQ ID NO :59显 示。还可将与SEQ ID NO :59基本上相似的核酸序列用于本发明的方法。还可用于实施本 发明方法的其他根特异性启动子的实例示于上述“定义”部分的表2b中。应当清楚本发明的可实施性并不局限于SEQ ID NO :55所示的AAT核酸,而且本发 明的可实施性也不局限于由稻硝酸转运蛋白启动子OsNRTl所驱动的AAT核酸的表达。任选的,还可以在引入植物的构建体中使用一个或多个终止子序列。另外的调控 元件可以包括转录和翻译增强子。本领域技术人员会知道适合用于进行本发明的终止子和 增强子的序列。如“定义”部分所 说明的那样,也可以向5’非翻译区(UTR)或在编码序列 中加入内含子序列,来增加在胞质中累积的成熟信使的量。其他控制序列(除启动子、增强子、沉默子、内含子序列、3’ UTR和/或5’ UTR区域之外)可以是蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。本发明的遗传构建体可以还包括对于在特定细胞类型中维持和/或复制所必需 的复制起点序列。一个实例是需要将遗传构建体作为附加型遗传元件(如质粒或粘粒分 子)在细菌细胞中维持的情况。优选的复制起点包括但不限于fl-ori和colEl。为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸序列的 转基因植物,有利的是使用标记基因(或报告基因)。因此,遗传构建体可以任选地含有选 择标记基因。选择标记在本文“定义”部分有更详细的说明。标记基因一旦不再需要,可以从转基因细胞中除去或切除之。进行标记去除的技 术在本领域公知,有用的技术在上文“定义”部分有说明。已知,取决于所用的表达载体和所用的转染技术,当核酸序列向植物细胞进行稳 定或瞬时整合时,仅少数细胞能摄入外来DNA,并将其整合入基因组(如果期望的话)。为 鉴定并选择这些整合体,通常将编码可选择标记(如上文所述的那些)的基因与目的基因 一起引入宿主细胞中。这些标记能够例如在如下突变体中使用,在所述突变体中这些基因 例如通过常规方法缺失而没有功能。此外,编码可选择标记的核酸序列分子可以与编码本 发明多肽或用于本发明方法的序列在同一个载体中引入宿主细胞,或者在分开的载体中引 入。已由所引入的核酸序列稳定转染的细胞可以例如通过选择(例如,整合有可选择标记 的细胞存活而其他细胞死去)予以鉴定。标记基因一旦不再需要,可以从转基因细胞中除 去或切除之。进行标记去除的技术在本领域公知,有用的技术在上文“定义”部分有说明。在一个实施方案中,本发明还提供了产生相对于对照植物具有增强的种子产率相 关性状的转基因植物的方法,包括在植物中引入和表达编码如前文所定义的AHL19/20多 肽的任何核酸序列。更具体地,本发明提供了产生相对于对照植物具有增加的种子产率相关性状的转 基因植物的方法,所述方法包括(i)在植物、植物部分或植物细胞中引入和表达在植物组成型启动子控制下的 AHL19/20多肽编码核酸序列;和(ii)在促进植物生长和发育的条件下培养植物细胞、植物部分或植物。(i)中的核酸序列可以是任何能够编码如本文所述的AHL19/20多肽的核酸序列。在一个实施方案中,本发明还提供了产生在非生物胁迫条件下生长时相对于对照 植物具有增强的产率相关性状的转基因植物的方法,包括在植物中引入和表达任何编码如 前文所定义的GRP多肽的核酸序列。更具体地,本发明提供了产生在非生物胁迫条件下生长时相对于对照植物具有增 强的产率相关性状的转基因植物的方法,所述方法包括1.在植物、植物部分或植物细胞中引入和表达GRP多肽编码核酸序列;和2.在促进植物生长和发育的条件下培养植物、植物部分或植物细胞。(1)中的核酸序列可以是任何能够编码如本文所述的GRP多肽的核酸序列。在一个实施方案中,本发明还提供了产生相对于对照植物具有增强的产率相关性 状的转基因植物的方法,包括在地上植物部分中引入和表达任何编码如前文所定义的AAT 样多肽的核酸。
更具体地,本发明提供了产生具有增强的产率相关性状的转基因植物的方法,所 述方法包括(i)在地上植物部分或在植物细胞中引入和表达在于地上植物部分中具有活性的 启动子的控制下的AAT样核酸;和(ii)在促进植物生长和发育的条件下培养植物细胞。(i)中的核酸可以是任何如本文所述的ATT样核酸。更具体地,本发明提供了产生具有增强的产率相关性状,特别是增加的(种子)产 率的转基因植物的方法,所述方法包括
(i)在植物或植物细胞中引入和表达AAT核酸;和(ii)在非限氮条件下培养植物细胞。(i)中的核酸可以是任何能够编码本文所定义的AAT多肽的核酸。可以将核酸序列直接引入植物细胞或植物本身(包括引入组织、器官或植物的任 何其它部分)。根据本发明优选的方面,优选通过转化将核酸序列引入植物。术语“转化” 在本文“定义”部分有更详细的说明。遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可见于 上述 S. D. Kung 和 R. Wu、Potrykus 或者HSfgei^P Willmitzer 的出版物。通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与 目的基因共转移的植物可表达基因编码,继之将转化的材料再生成整个植物。为选择转化 的植物,通常将在转化过程中获得的植物材料置于选择性条件下,从而可将转化的植物与 非转化植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通 过喷雾对其进行合适的选择。另一可能方案是将种子,酌情在消毒之后,种在使用合适的选 择剂的琼脂板上,从而仅转化的种子能够长成植物。可选地,针对转化的植物筛选选择标记 如上文所述标记的存在。DNA转移和再生之后,还可评价推定转化的植物,例如用Southern分析(DNA印 迹),评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和 /或Western分析(蛋白质印迹)监测新引入的DNA的表达水平,这两种技术都是本领域普 通技术人员所熟知的。产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例 如,第一代(或Tl)转化的植物可自交,选择纯合的第二代(或T2)转化体,然后T2植物可 进一步通过经典育种技术繁殖。产生的转化生物体可以有多种形式。例如,它们可以是转 化细胞和非转化细胞的嵌合体;克隆转化体(例如所有细胞经转化含有表达盒);转化和非 转化组织的嫁接体(例如在植物中,转化的砧木嫁接到非转化的接穗上)。本发明显然延及由本文所述方法产生的任何植物细胞或植物,以及所有的植物部 分及繁殖体。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整 个植物的后代,唯一的要求是所述后代呈现出与在本发明方法中产生的亲本相同的基因型 和/或表型特征。在一个实施方案中,本发明也包括含有与植物组成型启动子有效连接的、编码上 文所定义的AHL19/20多肽的分离核酸序列的宿主细胞。在一个实施方案中,本发明也包括含有编码上文所定义的GRP多肽的分离核酸序列的宿主细胞。在一个实施方案中,本发明也包括含有编码上文所定义的AAT样多肽或AAT多肽 的分离核酸的宿主细胞。根据本发明优选的宿主细胞是植物细胞。对于用于本发明方法的核酸或载体、表 达盒或构建体或载体,其宿主植物原则上有利地为能够合成在本发明方法中使用的多肽的 所有植物。本发明的方法有利地适用于任何植物。尤其可用于本发明方法的植物包括属于 植物界超家族的所有植物,尤其是单子叶植物和双子叶植物,包括饲料或豆科牧草、观赏植 物、粮食作物、乔木或灌木。根据本发明优选的实施方案,植物为作物植物。作物植物的实 例包括大豆、向日葵、芸苔(canola)、苜蓿、油菜籽、棉花、番茄、马铃薯和烟草。还优选植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选植物是谷类。谷类的实例包括稻、玉 米、小麦、大麦、粟、黑麦、黑小麦、高粱和燕麦。本发明也延及含有与植物组成型启动子有效连接的编码AHL19/20(如上文所定 义的)的分离核酸序列的植物的可收获部分,例如但不限于种子、叶、果实、花、茎、根茎、 块茎和球茎。本发明还涉及由这样的植物的可收获部分衍生的、优选直接衍生的产品,如干 丸(pellet)或干粉、油类、脂肪和脂肪酸、淀粉或蛋白质。增加核酸序列或基因或基因产物表达的方法在本领域有充分的记录,并且实例在 “定义”部分提供。如上文所述,增加AHL19/20多肽编码核酸序列表达的优选方法是在植物中引入 和表达AHL19/20多肽编码核酸序列;然而,实施所述方法的效果,即增强种子产率相关性 状,也可以利用其他众所周知的技术实现,包括但不限于T-DNA激活标签、TILLING、同源 重组。这些技术的说明在“定义”部分提供。如上文所述,增加GRP多肽编码核酸序列表达的优选方法是在植物中引入和表 达GRP多肽编码核酸序列;然而,实施所述方法的效果,即增强在非生物胁迫条件下生长的 植物的产率相关性状,也可以利用其他众所周知的技术实现,包括但不限于T-DNA激活标 签、TILLING、同源重组现。这些技术的说明在“定义”部分提供。如上文所述,调节(优选,增加)AAT样多肽或AAT多肽编码核酸的表达的优选方 法是在植物中引入和表达编码AAT样多肽或AAT多肽的核酸;然而,实施所述方法的效果, 即增强产率相关性状,也可以利用其他众所周知的技术实现,包括但不限于=T-DNA激活标 签、TILLING、同源重组现。这些技术的说明在“定义”部分提供。本发明还包括编码如本文所述的AHL19/20多肽的核酸序列的用途以及这些 AHL19/20多肽的用途,用于在正常生长条件下和养分可利用度下降的条件下,优选氮可利 用度下降的条件下,增强植物的任何上述种子产率相关性状。本发明还包括编码如本文所述的GRP多肽的核酸序列的用途以及这些GRP多肽的 用途,用于增强在非生物胁迫条件下生长的植物的任何上述产率相关性状。本发明还包括编码如本文所述的AAT样多肽或AAT多肽的核酸的用途以及这些 AAT样多肽或AAT多肽的用途,用于增强植物的任何上述产率相关性状。可以在育种程序中使用编码本文所述产率增加性多肽的核酸或所述产率增加性 多肽本身,其中鉴定可能与产率增加性多肽编码基因遗传连锁的DNA标记。可以使用所述核酸/基因或所述AAT样多肽本身定义分子标记。接着可以将此DNA或蛋白质标记在育种 程序中使用,以在本发明的方法中选择具有如上文所定义的增强的产率相关性状的植物。产率增加性多肽编码核酸/基因的等位基因变体也可以用于标记辅助的育种程序。这类育种程序有时需要使用例如EMS诱变,通过植物诱变处理引入等位基因变异;可选 的,此类程序可以以一组无意产生的所谓“天然”起源的等位基因变体开始。然后通过例如 PCR进行等位基因变体的鉴定。随后是选择步骤,用以选择所讨论序列的、提供增加的产率 的、优良等位基因变体。一般通过监测含有所讨论序列的不同等位基因变体的植物的生长 行为来进行选择。可以在温室或田地中监测生长行为。其它任选的步骤包括将经鉴定含有 优良等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的 组合。产率增加性多肽编码核酸还可以作为探针,用于对包含其的基因进行遗传和物 理作图以及用作与那些基因连锁的性状的标志物。这样的信息可以在植物育种中使用, 以培育具有所期望表型的株系。产率增加性多肽编码核酸的这类应用仅需要长度至少15 个核苷酸的核酸序列。产率增加性多肽编码核酸可以用作限制性片段长度多态性(RFLP) 标记。可用AAT样核酸探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J, Fritsch EF和Maniatis T(1989)《分子克隆实验室手册》)。随后使用计算机程序 如MapMaker (Lander等(1987)Genomics 1 :174_181)对产生的带型进行遗传分析,以构 建遗传图谱。另外,可以使用核酸探测含有一组个体的限制性内切酶处理的基因组DNA 的Southern印迹,所述一组个体为一个确定的遗传杂交的亲本和子代。记录DNA多态性 的分离,并用于计算产率增加性多肽编码核酸在先前用此群体获得的遗传图谱中的位置 (Botstein 等(1980)Am. J. Hum. Genet. 32 :314_331)。用于遗传作图的植物基因衍生探针的产生和应用描述于Bematzky和 Tanksley(1986)Plant Mol. Biol. Reporter 4:37-41中。众多出版物中描述过用上述方法 或其变通形式对特定cDNA克隆的遗传作图。例如,可以使用F2杂交群体、回交群体、随机 交配群体、近等基因系和其它个体组作图。这类方法是本领域技术人员众所周知的。核酸序列探针也可以用来进行物理作图(即在物理图谱上安置序列;参见 Hoheisel 等 In Noη-mamma1ian Genomic Analysis :A Practical Guide,Academic press 1996,第319-346页,及其中引用的参考文献)。在另一个实施方案中,核酸序列探针可用于进行直接荧光原位杂交(FISH)作图 (Trask(1991) Trends Genet. 7 :149_154)。尽管目前FISH作图的方法倾向使用大的克隆 (几个kb到几百个kb ;参见Laan等(1995) GenomeRes. 5 13-20),但是灵敏性的提高可以 允许在FISH作图中应用较短的探针。用于遗传和物理作图的多种基于核酸序列扩增的方法可以使用所述核酸序列进 行。实例包括等位基因特异性扩增(Kazazian (1989) J. Lab. Clin. Med 11 :95_96)、PCR扩 增片段的多态性(CAPS ;Sheffield等(1993) Genomics 16 :325_332)、等位基因特异性连接 (Landegren 等(1988) Science241 :1077_1080)、核苷酸延伸反应(Sokolov (1990)Nucleic Acid Res. 18 3671)、放射杂交作图(Walter 等(1997) Nat. Genet. 7 22~28)和 Happy 作图 (Dear 和 Cook (1989) Nucleic Acid Res. 17 :6795_6807)。为实施这些方法,使用核酸序列 设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员众所周知的。采用基于PCR的遗传作图的方法中,可能需要鉴定用于作图杂交的亲本之间在 相应于本发明核酸序列的区域中的DNA序列差异。但是,通常这对作图方法不是必要的。根据本发明的方法得到如前文所述具有增加的种子产率相关性状的植物。这些性 状还可以组合其它经济上有利的性状,如其它产率增加性状、对其他非生物和生物胁迫的 耐受性、改变多种构造特征和/或生物化学和/或生理学特征的性状。根据本发明的方法得到如前文所述在非生物胁迫条件下生长时具有增强的产率 相关性状的植物。这些性状还可以组合其它经济上有利的性状,如其它产率增强性状、对其 他非生物和生物胁迫的耐受性、改变多种构造特征和/或生物化学和/或生理学特征的性 状。在一个实施方案中,本发明涉及概述如下的主题 第1项相对于对照植物增强植物的种子产率相关性状的方法,包括增加植物中 编码核定位AT-hook基序蛋白19/20 (AHL19/20)多肽的核酸序列的表达,该AHL19/20多肽 包含与SEQ ID NO :36所示保守结构域(CD)具有至少70%、75%、80%、85%、90%、95%、 98%、99%或更大氨基酸序列同一性的结构域,以及任选地选择具有增强的种子产率相关 性状的植物。第2项根据第1项的方法,其中所述AHL19/20多肽包含i)与SEQ IDNO :37所示 AT-hook基序具有至少75%、80%、85%、90%、95%、98%、99%或更大的氨基酸序列同一 性的基序;和(ii)与SEQ ID NO :38所示植物及原核生物保守(PPC)结构域具有至少55%、 60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更大的氨基酸序列同一性的结 构域。第3项根据第1或2项的方法,其中所述AHL19/20多肽包含⑴核定位信号; (ii)具有 InterPro 登录号 IPR014476 的 AT-hook DNA 结合基序;和(iii)具有 InterPro 登录号IPR005175的植物及原核生物保守(PPC)结构域。第4项根据任何前述项的方法,其中所述AHL19/20多肽,当用于构建AHL系 统发生树,例如图1或图2中描述的系统发生树时,与包含SEQ IDNO 2所示多肽序列的 AHL19/20多肽群而非任何其他AHL群聚类。第5项根据任何前述项的方法,其中所述AHL19/20多肽按照递增的优选顺序 与SEQ ID NO 2所示的AHL19/20多肽、或本文表A中所示的任何多肽序列具有至少50%、 55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更高的氨基酸序列同一性。第6项根据任何前述项的方法,其中所述编码AHL19/20多肽的核酸序列为表A 中所示的任一 SEQ ID NO核酸序列或其部分、或能够与表A中所示的任一 SEQ ID NO核酸 序列杂交的序列。第7项根据任何前述项的方法,其中所述核酸序列编码表A中所示的任何SEQ ID NO多肽序列的直系同源物或旁系同源物。第8项根据任何前述项的方法,其中所述增加的表达通过任何一个或多个下列 技术实现=T-DNA激活标签、TILLING、或同源重组。第9项根据任何前述项的方法,其中所述增加的表达通过在植物中引入和表达 编码AHL19/20多肽的核酸序列来实现。
第10项根据任何前述项的方法,其中所述增强的种子产率相关性状是一个或多 个下列性状(i)增加的每圆锥花序的花数;(ii)增加的每植物的种子总重量;(iii)增加 的饱满种子数;或(iv)增加的收获指数。第11项根据任何前述项的方法,其中相对于对照植物,所述增强的种子产率相 关性状发生在于养分可利用度下降的条件下,优选在氮可利用度下降的条件下生长的植物 中。第12项根据第11项的方法,其中所述增强的种子产率相关性状是一个或多个下 列性状(i)增加的每植物的种子总产率;(ii)增加的饱满种子数;或(iii)增加的收获指数。第13项根据任何前述项的方法,其中所述核酸序列与组成型启动子,优选与植 物组成型启动子,更优选与G0S2启动子,最优选与SEQ ID NO :35所示的稻G0S2启动子有 效连接。第14项根据任何前述项的方法,其中所述编码AHL19/20多肽的核酸序列是植物 来源的,优选来自双子叶植物,还优选来自十字花科,最优选来自拟南芥。第15项可通过任何前述项的方法获得的植物、其部分(包括种子)或植物细胞, 其中所述植物、其部分或细胞包含与植物组成型启动子有效连接的编码AHL19/20多肽的 分离核酸转基因。第16项构建体,包含(a)编码第1至5项的任一项中所定义的AHLigAO多肽的核酸序列;(b) 一个或多个能够驱动(a)中的核酸序列表达的控制序列;和任选地(c)转录终止序列。第17项根据第16项的构建体,其中所述控制序列是植物组成型启动子,优选 G0S2启动子,更优选SEQ ID NO :35所示的G0S2启动子。第18项根据第16或17项的构建体在产生相对于对照植物具有增强的种子产率 相关性状的植物的方法中的用途,所述增强的种子产率相关性状是一个或多个下列性状 (i)增加的每圆锥花序的花数;(ii)增加的每植物的种子总重量;(iii)增加的饱满种子 数;或(iv)增加的收获指数。第19项用根据第16或17项的构建体转化的植物、植物部分或植物细胞。第20项产生相对于对照植物具有增强的种子产率相关性状的转基因植物的方 法,包括(i)在植物、植物部分或植物细胞中引入和表 达处于植物组成型启动子控制之下 的编码第1至6之任一项中定义的AHL19/20多肽的核酸序列;和(ii)在促进植物生长和发育的条件下培养所述植物细胞、植物部分或植物。第21项由于与植物组成型启动子有效连接的编码第1至5项之任一项中定义的 AHL19/20多肽的核酸序列的表达增加而相对于对照植物具有增强的种子产率相关性状的 转基因植物、或源自所述转基因植物的转基因植物细胞或转基因植物部分。第22项根据第15、19或21项的转基因植物或源自所述转基因植物的转基因 植物细胞,其中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、粟、黑 麦、黑小麦、高粱和燕麦。
第23项根据第22项的植物的包含AHL19/20多肽编码核酸序列的可收获部分,其中所述可收获部分优选是种子。第24项来源于根据第22项的植物和/或来源于根据第23项的植物的可收获部 分的产品。第25项编码第1至6之任一项中所定义的AHL19/20多肽的核酸序列在增强种 子产率相关性状中的用途,所述增强的种子产率相关性状包括一个或多个下列性状i)增 加的每圆锥花序的花数;(ii)增加的每植物的种子总重量;(iii)增加的饱满种子数;或 (iv)增加的收获指数。第26项根据第25项的用途,其中所述增强的种子产率相关性状在养分可利用度 下降的条件下,优选在氮可利用度下降的条件下发生。在一个实施方案中,本发明涉及概述如下的主题第27项相对于对照植物增强在非生物胁迫条件下生长的植物的产率相关性状 的方法,包括增加植物中编码GRP多肽的核酸序列的表达,其中所述GRP多肽是SEQ ID NO 46所示的金属硫蛋白2a(MT2a)多肽或其直系同源物、旁系同源物或同源物,以及任选地选 择在非生物胁迫条件下生长时具有增强的产率相关性状的植物。第28项根据第27项的方法,其中所述SEQ ID NO 46所示的GRP多肽和其直系 同源物、旁系同源物或同源物具有InterPro登录号IPR000347,被描述为植物金属硫蛋白 家族15。第29项根据第27或28项的方法,其中所述GRP多肽按照递增的优选顺序与SEQ ID NO 46 所示的 GRP 多肽具有至少 50%、55%、60%、65%、70%、75%、80%、85%、90%、 95%,98%,99%或更高的氨基酸序列同一性。第30项根据前述第27至29之任一项的方法,其中所述编码GRP多肽的核酸序 列为SEQ ID NO 45的核酸序列或其部分、或能够与SEQ ID NO 45的核酸序列或其部分杂 交的序列。第31项根据前述第27至30之任一项的方法,其中所述增加的表达通在植物中 引入和表达编码所述GRP多肽的核酸序列来实现。第32项根据前述第27至31之任一项的方法,其中所述非生物胁迫是选自一个 或多个下列胁迫的渗透胁迫水胁迫、盐胁迫、氧化胁迫和离子胁迫。第33项根据第32项的方法,其中所述水胁迫是干旱胁迫。第34项根据第32项的方法,其中所述离子胁迫是盐胁迫。第35项根据前述第27至34之任一项的方法,其中所述增强的产率相关性状是 一个或多个下列性状相对于对照植物,增加的地上生物量、增加的每植物的种子总产率、 增加的饱满种子数、增加的饱满种子总数、增加的一级圆锥花序数和增加的种子饱满率。第36项根据前述第27至35之任一项的方法,其中所述核酸序列与组成型启动 子,优选与G0S2启动子,最优选与稻G0S2启动子有效连接。第37项根据前述第27至36之任一项的方法,其中所述编码GRP多肽的核酸序 列是植物来源的,优选来自双子叶植物,还优选来自十字花科,最优选来自拟南芥。第38项GRP多肽编码核酸序列在增强在非生物胁迫条件下生长的植物的产率相 关性状中的用途。
第39项根据第38项的编码GRP多肽的核酸序列的用途,其中所述增强的产率相 关性状选自一个或多个下列性状与对照植物相比,增加的地上生物量、增加的每植物的种 子总产率、增加的饱满种子数、增加的饱满种子总数、增加的一级圆锥花序数和增加的种子 饱满率。第40项根据第39项的编码GRP多肽的核酸序列的用途,其中所述非生物胁迫是 选自一个或多个下列胁迫的渗透胁迫水胁迫、盐胁迫、氧化胁迫和离子胁迫。
第41项根据第40项的编码GRP多肽的核酸序列的用途,所述水胁迫是干旱胁 迫。 第42项根据第40项的编码GRP多肽的核酸序列的用途,所述离子胁迫是盐胁 迫。在一个实施方案中,本发明涉及概述如下的主题第43项相对于对照植物增强植物的产率相关性状的方法,包括调节地上植物部 分中编码丙氨酸氨基转移酶(AAT)样多肽的核酸的表达。第44项根据第43项的方法,其中所述AAT样多肽包括一个或多个下列特征(i)催化下列反应的能力 (ii)属于酶分类编号=EC 2. 6. 1. 2.(iii)具有氨基转移酶结构域(在InterPro中称为IPR004839 ;以及在PFAM中称 为 PF00155)(iv)具有1-氨基环丙烷-1-羧酸合酶结构域(在InterPro中称为IPROOl 176)(ν)靶向线粒体(vi)当用于构建包含AAT序列的系统发生树时,与包含SEQ ID NO :51的AAT样 多肽群而非任何其他AAT或AAT样序列群聚类。第45项根据第43或44项的方法,其中所述调节表达通过在植物中引入和表达 处于在地上植物部分中具有活性的启动子控制之下的AAT样多肽编码核酸来实现。第46项根据前述第43至45之任一项的方法,其中所述AAT样多肽编码核酸能 够与SEQ ID NO 50所示的核酸杂交。第47项根据前述第43至46之任一项的方法,其中所述核酸序列编码SEQ ID NO 51所示蛋白质的直系同源物或旁系同源物。第48项根据前述第43至47之任一项的方法,其中所述增强的产率相关性状包 括与对照植物相比,增加的产率,优选增加的种子产率。第49项根据前述第43至48之任一项的方法,其中在非胁迫条件下获得所述增 强的产率相关性状。第50项根据第45至49之任一项的方法,其中所述在地上部分中具有活性的启 动子是枝条特异性和/或叶特异性启动子。第51项根据第43至50之任一项的方法,其中所述AAT样多肽编码核酸是藻类 来源的,优选来自衣藻属,还优选来自物种雷氏衣藻。第52项可通过前述第43至51之任一项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码AAT样多肽的重组核酸。第53项构建体,包含(a)编码第44、46或47项之任一中定义的AAT样多肽的核酸;(b)能够驱动(a)中的核酸序列在地上部分中表达的启动子序列;和任选地(c)转录终止序列。第54项根据第53项的构建体在用于产生相对于对照植物具有增加的产率,特别地增加的种子产率的植物的方法中的用途。第55项用根据第53项的购建体转化的植物、植物部分或植物细胞。.第56项产生与对照植物相比具有增加的产率,特别地增加的种子产率的转基因 植物的方法,包括(i)在植物中引入和表达编码第44、46或47之任一项中所定义的AAT样多肽的核 酸,该核酸处于在地上部分中具有活性的启动子的控制之下;和(ii)在促进植物生长和发育的条件下培养所述植物细胞。第57项由于编码第44、46或47之任一项中定义的AAT样多肽的核酸的表达增 加而与对照植物相比具有增加的产率,特别是增加的种子产率的转基因植物、或源自所述 转基因植物的转基因植物细胞,其中所述核酸处于在地上部分中具有活性的启动子的控制 之下。第58项根据第52、55或57项的转基因植物或源自其的转基因植物细胞,其 中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦 (triticale)、高粱和燕麦。第59项根据第58项的植物的可收获部分,其中所述可收获部分是种子。第60项来源于根据第58项的植物和/或来源于根据第59项的植物的可收获部 分的产品。第61项AAT样多肽编码核酸用于相对于对照植物增加植物的产率,特别是增加 种子产率的用途,其中该核酸处于在地上部分中具有活性的启动子的控制之下。在一个实施方案中,本发明涉及概述如下的主题第62项相对于对照植物增强植物的产率相关性状的方法,包括调节植物中编码 丙氨酸氨基转移酶(AAT)的核酸的表达,该植物在氮可利用度未限制的条件下生长。第63项根据第62项的方法,其中所述AAT样多肽包含一个或多个下列特征(i)催化下列反应的能力 (ii)属于酶分类编号=EC 2. 6. 1. 2.(iii)具有氨基转移酶结构域(在InterPro中称为IPR004839 ;以及在PFAM中称 为 PF00155)(iv)具有1-氨基环丙烷-1-羧酸合酶结构域(在InterPro中称为IPR001176)(ν)当用于构建包含AAT序列的系统发生树时,与包含SEQ ID NO 56的AAT样多 肽群而非任何其他AAT或AAT样序列群聚类。第64项根据第62或63项的方法,其中所述调节表达通过在植物中引入和表达编码AAT样多肽的核酸来实现。第65项根据前述第62至64之任一项的方法,其中所述AAT样多肽编码核酸能 够与SEQ ID NO 55所示的核酸杂交。第66项根据前述第62至65之任一项的方法,其中所述核酸序列编码SEQ ID NO 56所示蛋白质的直系同源物或旁系同源物。第67项根据前述第62至66之任一项的方法,其中所述增强的产率相关性状包 括与对照植物相比,增加的产率,优选增加的生物量和/或增加的种子产率。第68项根据第64至67之任一项的方法,其中所述核酸与组织特异性启动子,优选根特异性启动子,最优选根_表皮-特异性启动子有效连接。第69项根据第68项的方法,其中所述根_表皮-特异性启动子是硝酸转运蛋白启动子,优选来自稻。第70项根据前述第62至69之任一项的方法,其中所述AAT编码核酸是植物来 源的,优选来自单子叶植物,优选来自禾本科,更优选来自稻属,最优选来自稻。第71项可通过根据前述第62至70之任一项的方法获得的植物或其部分,包括 种子,其中所述植物或其部分包含编码AAT的重组核酸。第72项构建体,包括(a)编码第63项中所定义的AAT的核酸;(b)硝酸转运蛋白启动子,优选来自稻;和任选地(c)转录终止序列。第73项根据第72项的构建体的用途,其用于产生相对于对照植物在非限氮条件 下具有增加的产率,特别是增加的生物量和/或增加的种子产率,的植物的方法。第74项用根据第71项的构建体转化的植物、植物部分或植物细胞。第75项产生与对照植物相比在非限氮条件下具有增加的产率,特别地增加的生 物量和/或增加的种子产率的转基因植物的方法,包括(i)在植物中引入和表达编码第63项中所定义的AAT的核酸;和(ii)在促进植物生长和发育的条件下培养所述植物细胞。第76项由于编码第63项中所定义的AAT的核酸的表达增加而与对照植物相比 在非限氮条件下具有增加的产率,特别地增加的生物量和/或增加的种子产率,的转基因 植物、或源自所述转基因植物的转基因植物细胞。第77项根据第71、74或76项的转基因植物或源自其的转基因植物细胞,其中所 述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱 和燕麦。第78项根据第77项的植物的可收获部分,其中所述可收获部分优选是枝条生物
量和/或种子。第79项来源于根据第77项的植物和/或来源于根据第78项的植物的可收获部 分的产品。第80项AAT编码核酸用于相对于对照植物增加在非限氮条件下植物的产率,特 别地增加种子产率和/或枝条生物量,的用途。


现参考以下附图描述本发明,其中图1显示在使用渐进式比对Clustal算法(1. 83),利用默认值对属于AHL家族的 所有多肽(描述于Fujimoto等,(2004)Plant Molec Biol, 56 225-239)进行比对后构建 的邻接树(neighbour-joining tree)。包含两个拟南芥旁系同源物,即AHL19 (SEQ ID NO: 2 或 AT3G04570)和 AHL20 (SEQ ID NO 4 或 AT4G14465),的目的群已被圈出。图2显示在使用渐进式比对Clustal算法(1. 83),利用默认值对属于AHL家族的 所有多肽(描述在Fujimoto等,(2004)Plant Molec Biol, 56 :225_239中)以及本文实施 例1表A的所有AHL19/20直系同源物和旁系同源物进行比对后构建的邻接树。图3以卡通形式显示SEQ ID NO 2所示的AHL19/20多肽,其包含下列特征预测 的NLS、AT-hook DNA结合基序(其核心是三肽GRP ;包含于InterPro登录号IPR014476(预 测的AT-hook DNA-结合)中)、PPC结构域(植物及原核生物保守结构域;包含于InterPro 登录号IPR005175(未知功能蛋白质DUF296)中)、和包含AT-hook DNA结合基序和PPC结 构域的保守结构域(CD)。图4显示表A的AHLWAO多肽的保守结构域(如对于SEQ ID NO 2由SEQ ID N0:38显示)的CLUSTAL W(1 ;83)多重序列比对,其中鉴定了多个特征。从多肽的N端至C 端,它们是⑴预测的核定位信号(NLS) ; (ii) AT-hook DNA结合基序,具有核心三肽GRP; 禾口(iii)PPC 结构域(DUF296)。图5显示双元载体(binary vector),其用于稻中于稻G0S2启动子(pG0S2)控制 之下的AHL19/20多肽编码核酸序列的增加表达。图6详述了可用于实施本发明方法的序列的实例。图7显示双元载体,其用于稻中处于稻G0S2启动子控制之下的GRP编码核酸序列 (其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)(pG0S2: :GRP)的增加表达。图8详述了可用于实施本发明方法的序列的实例。图9显示了双元载体,其用于稻中处于稻的原叶绿素酸酯启动子控制之下的AAT 样核酸的增加表达。图10详述了可用于实施本发明方法的序列的实例。图11显示双元载体,其用于稻中处于稻OsNRTl启动子控制之下的AAT核酸的增 加表达。图12详述了可用于实施本发明方法的序列的实例。 实施例现参考以下实施例描述本发明,所述实施例仅意在举例说明。如下实施例并非旨 在完全界定或以其他方式限制本发明的范围。DNA操作除非另外说明,重组DNA技术根据描述于(Sambrook(2001)《分子克隆 实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约)或者Ausubel等(1994),CUrrent Protocols in Molecular Biology, CurrentProtocols 第一卷禾口第二卷的标准方法进 行。植物分子操作的标准材料和方法由R.D.D. Croy描述于 Plant Molecular Biology Labfase(1993),由 BIOSScientific Publications Ltd(UK)和 Blackwell ScientificPublications(UK)出版。实施例1 与本发明方法所用核酸序列相关的序列的鉴定利用数据库序列搜索工具,如基本局部比对工具(BLAST) (Altschul等(1990)J. Mol. Biol. 215 :403-410 ;和 Altschul 等(1997) Nucleic Acids Res. 25 :3389_3402),在 美国国家生物技术信息中心(NCBI)Entrez核苷酸数据库维护的序列中,鉴定了与本发明 方法所用的核酸序列相关的序列(全长cDNA、EST或基因组序列)。BLAST程序通过将核酸 序列或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序 列之间具有局部相似性的区域。例如,对本发明核酸序列所编码的多肽运用了 TBLASTN算 法,使用默认设置,开启过滤器以滤过低复杂度序列。分析的输出视窗为两两比较,并根据 概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著 性越高)。除了 E值之外,还对比较进行了同一性百分比记分。同一性百分比是指两比较核 酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在有些情况下,可以 调整默认参数以更改搜索的严格度。例如,可以增加E值以显示严格度较低的匹配。以此 方式,可鉴定短的几乎精确的匹配。表A提供了与本发明方法所用的核酸序列相关的核酸序列的列表。表A :AHL19/20多肽的实例
Genome Institute,针对特定生物例如白杨和Ostreococcus tauri,建立了专门的核酸序 列数据库。实施例2 本发明多肽序列的比对使用基于流行的渐进式比对ClustalW算法(Thompson等(1997) Nucleic Acids Res 25 4876-4882 ;Chenna 等(2003) Nucleic Acids Res31 :3497_3500)的 Vector NTI 软 件包(Invitrogen)AlignX程序,实施多肽序列的比对。默认值为空位开放罚分10,空位延 伸罚分0.1,而选择的权重矩阵为Blosum 62(如果比对多肽的话)。可以进行微小的人造 编辑以进一步优化比对。利用Vector NTI (Invitrogen)的AlignX程序中提供的邻接聚类 算法,构建多肽的系统发生树。使用渐进式比对Clustal算法(1. 83),利用默认值(Thompson等,(1997)Nucleic Acids Res 25 4876-4882 ;Chenna等,(2003). Nucleic Acids Res31 3497-3500),对Fujimoto等(2004 ; 下面表Al)中鉴定的所有拟南芥A^多肽序列进行了比对。然后构建了邻接树,并且示于本 申请的图1中。包含两个拟南芥旁系同源物,Am.l9(SEQ ID NO :2或AT3G04570)和AM^iKSEQ ID N0:4或AT4G14465),的目的群已被圈出。(在上文所述的新多重序列比对步骤后)落在该 ΑΙΙΘΛΟ群中的任何多肽被认为可用于实施如本文所述的本发明方法。表Al 在拟南芥中鉴定的AHL多肽 进行了第二多重序列比对,包括表A中的所有AHL19/20直系同源物多肽和表Al 中的所有AHL序列。之后构建邻接树,并且示于本申请的图2中。包含两个拟南芥旁系同 源物,AHL19(SEQ ID NO :2 或 AT3G04570)和 AHL20 (SEQ ID NO :4 或 AT4G14465),的目的群 已被圈出。落在该AHL19/20群中的任何多肽被认为可用于实施如本文所述的本发明方法。在表A的AHL19/20多肽的多重序列比对后鉴定了 SEQ ID NO 36所示的SEQ ID NO :2的保守结构域(⑶)。在第二步骤中,使用渐进式比对Clustal算法(1.83),利用默认值,选择(从全长多肽序列中)和比对了表A的AHL19/20多肽的CD。许多特征可被鉴定,并且标示于图4中。从多肽的N端至C端,它们是⑴预测的核定位信号(NLS) ; (ii) AT-hookDNA结合基序,具有核心三肽GRP ;和(iii)PPC结构域(DUF 296)。利用Vector NTI (Invitrogen)的AlignX程序中提供的邻接聚类算法,构建AAT 样多肽和AAT多肽的系统发生树。实施例3 可用于实施本发明方法的多肽序列之间的全局同一性百分比计算可用于实施本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用 本领域可用方法之一,即MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics. 2003 4 29. MatGAT :an application that generatessimilarity/identity matrices using protein or DNA sequences. CampanelIaJJ, Bitincka L, Smalley J;由 Ledion Bitincka 托管的软件),进行了确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序 列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为 12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计 算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同 一性示于对角线上半部。比较所用的参数有记分矩阵Blosum62首个空位12延伸空位2还可以产生针对特定结构域的局部比对的MATGAT表或有关特定结构域之间的同 一性/相似性百分比的数据。对于多肽序列全长上的全局相似性和同一性(将部分多肽序列排除在外),软件 分析的结果示于表B。对角线上方给出同一性百分比,而对角线下方给出相似性百分比。与SEQ ID NO :2相比,可用于实施本发明方法的多肽序列之间的同一性百分比可低至52%氨基酸同一性。表B 多肽序列全长上的全局相似性和同一性的MatGAT结果 如果在SEQ ID NO 2的保守结构域(CD) (SEQ ID NO 36所示)与可用于实施本 发明的多肽的⑶之间进行同一性计算的话,则同一性百分比可显著增加。⑶包含AT-hook DNA结合基序(对于SEQ ID NO :2 JnSEQ IDNO :37所示)和PPC结构域(对于SEQ ID N0: 2,如SEQ ID N0:38所示)。可用于实施本发明方法的多肽序列在CD上的同一性百分比为 75%至99%氨基酸同一性,见表Bi。这显著高于在全长AHL19/20多肽序列之间计算的氨 基酸同一性百分比。表Bl 多肽序列间在⑶结构域上的全局相似性和同一性的MatGAT结果。 实施例4 可用于实施本发明方法的多肽序列中所含结构域的鉴定蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies, Domains and Sites (InterPro))数据库是用于基于文本以及序列的搜 索的常用标签数据库的整合界面。InterPro数据库将这些数据库结合起来,它们利用不同 的方法学和有关已充分表征的蛋白质的不同角度生物学信息来产生蛋白质标签。合作数据 库包括 SWISS-PR0T、PR0SITE、TrEMBL、PRINTS、ProDom和 Pfam、Smart 和 TIGRFAMs。Interpro 由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。SEQ ID NO 2所示多肽序列的InterPro扫描结果示于表C表C :SEQ ID NO 2所示多肽序列的InterPro扫描结果 将GRP多肽序列用作查询序列搜索InterPro数据库。可用于实施本发明方法的 GRP多肽匹配一个InterPro登录号,如在下面表中所示的 SEQ ID NO 51和SEQ ID NO 56所示的多肽序列的InterPro扫描结果示于下面InterPro
IPROOl 176 结构域1_氨基环丙烷羧酸合酶,区域[203-224] [256-280] [292-315]IPR004839 结构域氨基转移酶,I类和II类,区域[145-314]PFAM PF00155结构域氨基转移酶I类和II类,评分为8. 4e_19,区域[108-509]实施例5 用于实施本发明方法的多肽序列的亚细胞定位预测TargetP 1. 1预测真核蛋白质的亚细胞定位。基于如下任一 N-端前序列的预测性存在,进行定位确定叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。 最终预测所基于的分值并非真正的概率,且它们加起来不一定为1。不过,根据TargetP,得 分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的 指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学 (Technical University of Denmark)的月艮务器维护。对于经预测含有N-端前序列的序列,还可以预测潜在的切割位点。选择了多种参数,例如生物体类型(非植物或植物)、截断值设置(无、预先规定的 截断值设置或者用户指定的截断值设置)以及切割位点的预测计算(是或否)。SEQ ID NO 2所示多肽序列的TargetP 1. 1分析结果示于表D7。选择的是“植物” 生物体类型,并且未规定截断值。SEQ ID NO :2所示多肽序列的预测的亚细胞定位不是叶 绿体,不是线粒体,也不是分泌途径,而最可能是细胞核。在SEQ ID NO 2的AHL19/20多肽中发现(例如通过多重序列比对,然后目检)预 测的核定位信号(NLS)。NLS是一个或多个具有带正电荷的赖氨酸或精氨酸的短序列。本 发明的SEQ ID NO :2经预测定位在真核细胞的细胞核区室。表D :SEQ ID NO 2所示多肽序列的TargetP 1. 1分析 SEQ ID NO 51所示多肽序列的TargetP 1. 1分析结果如下。TargetP 预测线粒体(0. 837,质量 2)可以利用许多算法进行亚细胞定位预测分析,包括· ChloroP 1. 1,由丹麦技术大学服务器托管;
蛋白质寻觅亚细胞定位预测软件(Protein Prowler SubcellularLocalisation Predictor),1. 2版,由澳大利亚布里斯班昆士兰大学分子生物科学研究所(Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia)的月艮务器托 管;‘ PENCE Proteome Analyst PA-GOSUB 2. 5,由加拿大大阿尔贝塔埃德蒙顿阿尔贝 塔大学(University of Alberta, Edmonton, Alberta, Canada)的服务器托管;· TMHMM,由丹麦技术大学服务器托管。实施例6 与可用于本发明方法的多肽序列相关的分析AAT样多肽可具有催化下列反应的能力 本领域技术人员将能够容易地检查该活性。实施例7 本发明核酸序列的克隆除非另外指出,否则按照(Sambrook(2001)Molecular Cloning :alaboratory manual,第 3 版 Cold Spring Harbor Laboratory Press, CSH, New York)或 Ausubel 等, (1994), Current Protocols in Molecular Biology, Current Protocols 的第 1 禾口 2 卷 中所述标准方案进行重组DNA技术。用于植物分子工作的标准材料和方法描述于由BIOS Scientific PublicationsLtd (UK)禾口 Blackwell Scientific Publications (UK)出版的 R. D. D. Croy 编著的 Plant Molecular Biology Labfax (1993)中。使用从混合植物组织提取的mRNA合成的拟南芥cDNA文库作为模板,通过PCR,扩 增编码AHL19多肽的拟南芥cDNA。PCR扩增使用引物prm8135 (SEQ ID NO 41 ;有义5’-g gggacaagtttgtacaaaaaagcaggcttaaacaatggcgaatccatggtg-3')禾口弓 L prm08136(SEQ ID NO 42 sJ^J^_,H :5,-ggggaccactttgtacaagaaagctgggttaaaaaccattttaacgcacg-3' ),^il 含用于Gateway重组的AttB位点。在标准条件下使用Hifi Taq DNA聚合酶进行PCR。同样 利用标准方法扩增和纯化预期长度(包括attB位点)的PCR片段。接着进行Gateway操作 的第一步,即BP反应,在此期间PCR片段与pD0NR201质粒体内重组,产生Gateway术语所称 的“进入(entry)克隆”。作为Gateway 技术一部分的质粒PD0NR201购自Invitrogen。SEQ ID NO :45 的克隆使用定制的拟南芥混合组织cDNA文库(在pCMV Sport 6. O中;Invitrogen, Paisley,UK)作为模板,通过PCR,扩增本发明方法所用的核酸序列SEQ ID NO :45。在5(^1 PCR混合物中使用200ng的模板,在标准条件下利用Hifi Taq DNA聚合酶进行PCR。使用 t^^l^Jjk prm03240 (SEQ ID NO 48 ;5' ggggacaagtttgtacaaaaaagcaggcttcacaatgtc ttgctgtggaggaa 3,)禾口 prm03241 (SEQ ID NO :49 ;反义,] 补5,-ggggaccactttgtacaaga aagctgggtttcacttgcaggtgcaag 3’),其包括进行Gateway重组的AttB位点。同样利用标 准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR 片段与pD0NR20i质粒体内重组以产生Gateway术语所称的“进入克隆”。作为Gateway 技术一部分的质粒PD0NR201购自英骏公司(Invitrogen)。在50 μ 1 PCR混合物中使用200ng的模板,在标准条件下利用HifiTaq DNA聚合酶通过PCR扩增本发明方法所用的核酸序列SEQ ID N0:50。使用的引物是prm08408 (SEQ ID NO 53 ; ^n^jlJi) 5' -ggggacaagtttgtacaaaaaagcaggcttaaacaatgcgg aaggaagcgac_3,禾口 prm08409 (SEQ ID NO :54 ;反义, 补)5,_ggggaccactttgtacaagaaagc tgggtcgaattgctaagctgttacga-3,,其包括进行Gateway重组的AttB位点。同样利用标准 方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片 段与pD0NR201质粒体内重组以产生Gateway术语所称的“进入克隆”,即pAAT-like。作为 Gateway 技术一部分的质粒 PD0NR201 购自 Invitrogen。使用稻cDNA文库(在pCMV Sport 6. O 中;Invitrogen,Paisley,UK)作为模板,通 过PCR,扩增本发明方法所用的核酸序列SEQ ID而55。在5(^1 PCR混合物中使用200ng 的模板,在标准条件下利用Hifi Taq DNA聚合酶进行PCR。使用的引物是prmOO 1646 (SEQ ID NO 58 ;WJ^. ^nW54 ^JIl# ) 5' -ggggacaagtttgtacaaaaaagcaggcttcacaatggct g ctcccagc_3,禾口 prmOO 1647 (SEQ ID NO :59 ;反义, 补)5,—ggggaccactttgtacaagaaagc tgggtaattcagtcgcggtacg-3,,其包括进行Gateway重组的AttB位点。同样利用标准方法 纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与 PD0NR201质粒体内重组以产生Gateway术语所称的“进入克隆”,即pAAT。作为Gateway 技术一部分的质粒PD0NR201购自Invitrogen。实施例8 使用公开的核酸序列构建表达载体随后将包含SEQ ID NO 1的进入克隆与用于稻转化的目的载体(destination vector) 一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件植物选择标记;可 筛选标记表达盒;旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway 盒。用于组成型表达的稻G0S2启动子(SEQ ID NO 35)位于此Gateway盒的上游。在LR重组步骤之后,根据本领域众所周知的方法将所产生的表达载体 pG0S2 :AHL19/20(图5)转化进农杆菌菌株LBA4044。随后将包含SEQ ID NO :45的进入克隆与用于稻转化的目的载体一起用于LR反 应。此载体在T-DNA边界内包含如下功能性元件植物选择标记;可筛选标记表达盒;旨在 与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型表达 的稻HMGB启动子(SEQ IDNO 47)位于此Gateway盒的上游。在LR重组步骤之后,根据本领域众所周知的方法将所产生的表达载体 pG0S2 :GRP (图7)转化进农杆菌菌株LBA4044。随后将包含SEQ ID NO :50的进入克隆与用于稻转化的目的载体一起用于LR反 应。此载体在T-DNA边界内包含如下功能性元件植物选择标记;可筛选标记表达盒;旨在 与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于枝条和叶特 异性表达的稻推定原叶绿素酸酯还原酶启动子(SEQ ID NO 52)位于此Gateway盒的上游。在LR重组步骤之后,根据本领域众所周知的方法将所产生的表达载体(图9)转 化进农杆菌菌株LBA4044。随后将包含SEQ ID NO :55的进入克隆与用于稻转化的目的载体一起用于LR反 应。此载体在T-DNA边界内包含如下功能性元件植物选择标记;可筛选标记表达盒;旨在 与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于根表皮和根毛特异性表达的稻NRT1启动子(SEQ ID NO 57)位于此Gateway盒的上游。在LR重组步骤之后,根据本领域众所周知的方法将所产生的表达载体 pNRTl: :ATT(图11)转化进农杆菌菌株LBA4044。实施例9 植物转化稻转化独立地使用包含表达载体的这些农杆菌转化稻植物。使梗稻栽培种日本晴(rice japonica cultivar Nipponbare)的成熟干种子脱壳。通过在70%的乙醇中孵育1分钟, 然后在0. 2% HgCl2中孵育30分钟,之后用无菌蒸馏水洗涤6次,每次15分钟来进行消毒。 然后在包含2,4-D的培养基(愈伤组织诱导培养基)中萌发无菌种子。在黑暗中孵育4周 后,切取盾片来源的胚发生愈伤组织,然后在相同的培养基上进行繁殖。2周后,通过在相同 的培养基上传代培养再另外2周来繁殖或增殖愈伤组织。在共培养前3天在新鲜培养基上 传代培养胚发生愈伤组织块(以增强细胞分裂活性)。包含各表达载体的农杆菌株LBA4404独立地用于共培养。将农杆菌接种在具有适 宜的抗生素的AB培养基上,在28°C培养3天。然后收集细菌,将其悬浮在液体共培养培养 基中至大约为1的密度(0D_)。然后将悬浮液转移至培养皿(Petri dish),将愈伤组织浸 渍在悬浮液中15分钟。然后将愈伤组织在滤纸上吸干,之后转移至固化的共培养培养基, 在25°C黑暗中孵育3天。然后在选择剂存在的情况下在28°C黑暗中,在包含2,4-D的培养 基上生长共培养的愈伤组织4周。在此期间,产生了快速生长的抗性愈伤组织岛。在将该 物质转移至再生培养基和在光照下孵育后,胚发生潜力被释放,在接下来的4至5周中发育 出芽。将芽从愈伤组织切下,然后在包含生长素的培养基上孵育2至3周,然后将它们从所 述培养基转移至土壤中。在温室中在高湿度和短日照下生长出变硬的芽(shoot)。对于每个构建体产生了大约35个独立的T0稻转化体。将原代转化体从组织培养 室转移至温室。在进行确认T-DNA插入物的拷贝数的定量PCR分析后,只保留展示对选择剂 具抗性的单拷贝转基因植物用于T1种子的收获。然后在移植后3至5个月收获种子。该 方法以50%多的比率产生了单基因座转化体(Aldemita和Hodgesl996,Chan等1993,Hiei 等 1994)。实施例10 表型评估方法10. 1评估设置产生了大约35个独立的T0稻转化体。原代转化体由组织培养室转移到温室生长 并收获T1种子。保留了 6个事件,这些事件中T1后代发生转基因存在/缺乏的3 1分 离。通过监测可视标记的表达,对于这些事件之每一个,各选出大约10个含转基因的T1幼 苗(杂合子和纯合子),以及大约10个缺少转基因的T1幼苗(无效合子)。转基因植物和 相应的无效合子在随机位置上并排生长。温室条件为短日照(12小时光照),日间28°C,夜 间22 °C,相对湿度70%。从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至 少6个不同的角度获取数码图像(2048X 1536像素,1千6百万色素)。减少的养分(氮)可利用度筛选在除营养液以外正常的条件下在花盆土中培养来自6个事件(T2种子)的植物。 从植物移植到成熟,用特定的营养液对花盆进行浇灌,所述营养液的氮(N)含量降低,通常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相 同。如针对正常条件下的生长所详述的那样,记录生长和产率参数。10. 2统计分析F检验利用双因素AN0VA(方差分析)作为统计模型,对植物表型特征进行总体评估。 对用 本发明基因转化的所有事件的所有植株的测量到的所有参数进行F检验。进行F检 验以在所有转化事件上检查基因的效应,并检验基因的总体效应,亦称为“整体基因效 应”(global gene effect) 0真实的整体基因效应的显著性阈值设置为F检验的5%概率 水平。显著性F检验值指向基因效应,意味着不仅仅只是基因的存在或位置引起表型差异。按照用于T1代相同的评估方法但是每个事件评估更多个体,对4个T1事件的T2 代进行进一步的评估。当进行了具有重叠事件的两个实验时,进行组合分析。这可用于检查效应在两个 实验中的一致性,并且如果情况果真如此,其可用于将来自两个实验的证据集合起来以增 加结论的可信度。使用的方法是考虑到数据的多层结构(即实验-事件-分离子)的混合 模型方法。通过比较似然比检验与卡方分布,获得P值。从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至 少6个不同的角度获取数码图像(2048X 1536像素,1千6百万色素)。在GRP多肽的情况下的干旱筛选在正常条件下在花盆土中培养来自Tl、T2或更后代的稻植物,直到它们进入抽穗 期。然后将其转移到限制灌溉的“干燥”区域。向随机选择的花盆中插入湿度探测仪,以监 测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常 水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不 在非生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样,记录生长 和产率参数。在GRP多肽的情况下的盐胁迫筛选将来自T1、T2或更后代的稻植物生长在椰子纤维和argeX(3 1的比率)制造的 基质上。在将小植株移植入温室后前两周中使用正常的营养液。在前两周后,向营养液中 加入25mM盐(NaCl),直至收获植物。如针对正常条件下的生长所详述的那样,记录生长和
产率参数。在AAT样多肽和AAT多肽的情况下的干旱筛选在正常条件下在花盆土中培养来自T2种子的植物,直到它们进入抽穗期。然后将 其转移到限制灌溉的“干燥”区域。向随机选择的花盆中插入湿度探测仪,以监测土壤水含 量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后 将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁 迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样,记录生长和产率参数。在AAT样多肽和AAT多肽的情况下的氮利用效率筛选在除营养液以外正常的条件下在花盆土中培养来自T2种子的稻植物。从植物移 植到成熟,用特定的营养液对花盆进行浇灌,所述营养液的氮(N)含量降低,通常低7到8 倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针 对正常条件下的生长所详述的那样,记录生长和产率参数。
10. 3测量的参数生物量相关参数测量从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至 少6个不同的角度获取数码图像(2048X 1536像素,1千6百万色素)。植物地上面积(或者说叶生物量)通过计数数码图像上区别于背景的来自于地上 植物部分的像素的总数而确定。此值为同一时间点从不同的角度拍摄的照片的平均值,并 通过校准转换为以平方毫米表示的物理表面值(physical surface value)。实验表明通过 这种方法测量的地上植物面积与植物地上部分的生物量相关。所述地上面积为在植物达到 其最大叶生物量的时间点测量的面积。早期活力是萌发后3周植物(幼苗)的地上面积。 根生物量的增加表示为总根生物量的增加(测量为在植物生命期中观察到的根的最大生 物量);或表示为根/条指数的增加(测量为在根和枝条活跃生长期中根质量与枝条质量 之间的比率)。早期活力通过计数区别于背景的来自地上植物部分的像数的总数来确定。此值为 同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理 表面值。下面所述的关于早期活力的结果是萌发后3周的植物的结果。种子相关参数测量收获成熟的一级圆锥花序、计数、装袋、贴上条形码标记,然后在烤箱中于37°C干 燥三天。随后将圆锥花序脱粒,收集并计数所有的种子。使用鼓风装置将饱满谷壳和空壳 分开。弃去空壳,再次计数剩下的部分。在分析天平上称重饱满的谷壳。通过计数在分离 步骤之后剩下的饱满谷壳数确定饱满种子数。通过称量从一株植物收获的所有饱满谷壳来 测量每植物的种子总重量。通过计数从植物收获的谷壳数来测量每株植物的种子总数。根 据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明中定义为 每植物的种子总重量和地上面积(mm2)之间的比值再乘以因子106。每圆锥花序的花总数 在本发明中定义为种子总数与成熟的一级圆锥花序数之间的比值。种子饱满率在本发明中 定义为饱满种子数占种子(或小花)总数的比例(以%表示)。实施例11 在|H常生长条件下的转基因稻植物的表型评估结果对在用于组成型表达的G0S2启动子控制之下表达编码SEQ ID N0:2所示 AHL19/20多肽的核酸序列的转基因稻植物,在生长于正常生长条件下时进行了评估,评估 结果如下所示。与相应的无效合子(对照植物)相比,转基因植物的每圆锥花序的花数、每植物的 种子总产率、饱满种子总数和收获指数均有显著增加,如表E中所示。表E:在正常生长条件下,对在用于组成型表达的G0S2启动子控制之下表达编码 SEQ ID N0:2所示AHL19/20多肽的核酸序列的转基因稻植物的评估结果。
对在非胁迫条件下生长的并且在稻的原叶绿素酸酯还原酶启动子控制之下表达 AAT样核酸的转基因稻植物的评估,显示出与对照植物相比转基因植物的收获指数(HI)显 著增加。还观察到与对照植物相比,转基因植物的早期活力、种子总重量和饱满种子数增 加。对在非限氮条件下生长的并且在稻NRTl启动子控制之下表达AAT核酸的转基因 稻植物的评估,显示出与对照植物相比,地上面积、植物重量、早期活力增加。实施例12 在养分(氮,)可利用度降低的牛长备件下的转某因稻棺物的表型评估 结果对在养分(氮)可利用度降低的生长条件下生长的并且在用于组成型表达的G0S2 启动子控制之下表达编码SEQ ID N0:2所示AHL19/20多肽的核酸序列的转基因稻植物的 评估结果示于下面。与相应的无效合子(对照植物)相比,转基因植物的每植物的种子总产率、饱满种 子总数和收获指数均显著增加,如表F中所示。表F 对在养分(氮)可利用度降低的生长条件下,对在用于组成型表达的G0S2启 动子控制之下表达编码SEQ ID N0:2所示AHL19/20多肽的核酸序列的转基因稻植物的评 估结果。 实施例13 在JkMZ^iM迫生长条件下的转基因稻植物的表型评估结果在盐胁迫条件下牛长时于G0S2启动子控制之下表达SEQ ID NO 45所示的GRP核 酸序列的转基因稻植物,显示出与在相当条件下生长的对照植物相比,地上生物量、每植物的种子总产率、饱满种子数、种子总数和一级圆锥花序(first panicles)数的5%以上增 力口,如下表中所示。 在干旱胁迫条件下牛长的、于G0S2启动子控制之下表汰SEQ ID NO :45所示GRP 核酸序列的转基因稻植物,显示出与在相当条件下生长的对照植物相比,地上生物量、每植 物的种子总产率、饱满种子数、种子总数和种子饱满率的5%以上增加,如下表中所示。 实施例14 其他作物的转化实例玉米的转化使用由Ishida 等(1996)Nature Biotech 14(6) :745_50 描述的方法的改进方法 进行玉米(Zea mays)的转化。在玉米中转化是基因型依赖性的,只有特定的基因型易于进 行转化和再生。近交系A188 (University ofMinnesota)或以A188作为亲本的杂种是用于 转化的供体材料的良好来源,但也可成功地使用其他基因型。在授粉后大约11天(DAP)当 未成熟的胚的长度为大约1至1. 2mm时,从玉米植物收获穗子。将未成熟的胚与包含表达 载体的根癌农杆菌共培养,通过器官发生再生转基因植物。将切离的胚培养在包含选择剂 (例如咪唑啉酮,但可使用不同的选择标记)的愈伤组织诱导培养基,然后是玉米再生培养 基上。在光照的情况下在25°C孵育培养皿2至3周,或直至芽产生。将绿色的芽从各胚转移至玉米生根培养基,在25°C孵育2-3周,直至根产生。然后将生根的芽移植至温室土壤 中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生Tl种子。小麦转化
使用由Ishida 等(1996)Nature Biotech 14(6) :745_50 描述的方法进行小麦的 转化。通常将栽培品种Bobwhite (可从CIMMYT,Mexico获得)用于转化。将未成熟的胚与 包含表达载体的根癌农杆菌共培养,通过器官发生再生转基因植物。在与农杆菌孵育后,将 胚体外培养在包含选择剂(例如咪唑啉酮,但可使用不同的选择标记)的愈伤组织诱导培 养基,然后是再生培养基上。在光照的情况下在25°C孵育培养皿2至3周,或直至芽产生。 将绿色的芽从各胚转移至生根培养基,在25°C孵育2-3周,直至根产生。将生根的芽移植至 温室土壤中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生Tl种子。大豆转化按照Texas A&M专利US 5,164,310中描述的方法的改进方法转化大豆。几种 商品化大豆品种易于通过该方法进行转化。通常将栽培品种Jack(可从Illinois Seed foundation获得)用于转化。对大豆种子消毒以便体外播种。从7日龄幼苗切取下胚轴、 胚根和一片子叶。让上胚轴和剩下的子叶进一步生长产生腋节(axillary node) 0切取这 些腋节,将其与包含表达载体的根癌农杆菌一起孵育。在共培养处理后,洗涤外植体,然后 转移至选择培养基。切取再生的芽,将其置于芽伸长培养基上。将长度不超过Icm的芽置 于生根培养基上直至根产生。将生根的芽转移至温室的土壤中。从展示对选择剂具有抗性 的且包含单拷贝T-DNA插入物的植物产生Tl种子。油菜(rapeseed)/芸苔(Canola)的转化5-6日龄的幼苗的子叶柄和下胚轴用作组织培养的外植体,按照Babic等(1998, Plant Cell Rep 17 183-188)对其进行转化。商业栽培品种Westar (Agriculture Canada) 是用于转化的标准品种,但也可使用其他品种。对Canola种子进行表面消毒以进行体外播 种。从体外幼苗切取具有附着的子叶的子叶柄外植体,然后通过将子叶柄外植体的切口末 端浸入细菌悬浮液中接种农杆菌(包含表达载体)。然后将外植体在23°C、16小时光照下, 在包含3mg/l 8々 、3%蔗糖、0.7% 1^丨3831~的1^84 -3培养基上培养2天。在与农杆菌 共培养2天后,将子叶柄外植体转移至包含3mg/l BAP、头孢氨噻肟、羧苄青霉素或替卡西 林_克拉维酸(timentin) (300mg/l)的MSBAP-3培养基上培养7天,然后在具有头孢氨噻 肟(cefotaxime)、羧苄青霉素或替卡西林_克拉维酸和选择剂的MSBAP-3培养基上培养直 至芽再生。当芽的长度为5-10mm时,将其切离,然后转移至芽伸长培养基(MSBAP-0. 5,包含 0. 5mg/l BAP)。将长度大约2cm的芽转移至生根培养基(MSO)以进行根诱导。将生根的芽 移植至温室的土壤中。从展示对选择剂具有抗性的且包含单拷贝T-DNA插入物的植物产生 Tl种子。苜蓿的转化使用(McKersie等,1999 Plant Physiol 119 :839_847)的方法转化苜蓿 (Medicago sativa)的再生克隆。苜蓿的再生和转化是基因型依赖性的,因而需要再 生的植物。已描述了用于获得再生植物的方法。例如,这些再生植物可选自栽培品种 Rangelander(Agriculture Canada)或由 Brown DCW 禾口 A Atanassov(1985. Plant Cell Tissue Organ Culture 4:111-112)描述的任何其他商业苜蓿品种。可选择地,RA3品种(University of Wisconsin)已选择用于组织培养(Walker 等,1978 Am J Bot65: 654-659)。将子叶柄外植体与包含表达载体的根癌农杆菌C58C1 pMP90 (McKersie等,1999 PlantPhysiol 119:839-847)或LBA4404的过夜培养物共培养。将外植体在黑暗中在包含 288mg/L Pro、53mg/L硫代脯氨酸、4. 35g/L K2SO4^P 100 μ m乙酰丁香酮的SH诱导培养基上 共培养3天。在一半浓度的Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤 外植体,然后将其种在不含乙酰丁香酮但具有适宜的选择剂和适宜的抗生素(以抑制农杆 菌的生长)的相同SH诱导培养基上。在几周后,将体细胞胚转移至不含生长调节剂、无抗 生素但含有50g/L蔗糖的B0i2Y发育培养基中。随后在一半浓度的Murashige-Skoog培养 基上萌发体细胞胚。将生根的幼苗移植入花盆和生长在温室中。从展示对选择剂具有抗性 的且包含单拷贝T-DNA插入物的植物产生Tl种子。棉花转化使用根癌农杆菌在下胚轴外植体上转化棉花(Gossypium hirsutum L.)。商业品 种例如Coker 130或Coker 312 (SeedCo, Lubbock, TX)是用于转化的标准品种,但也可使用 其他品种。对种子进行表面消毒,然后在黑暗处萌发。从萌发的幼苗切取长度大约1-1. 5厘 米的下胚轴外植体。将下胚轴外植体浸没在含有表达载体的根癌农杆菌接种物中5分钟, 然后在黑暗处在24°C在MS+1. 8mg/l KN03+2%葡萄糖上共培养大约48小时。将外植体转 移至含有适当的细菌和植物选择标记(更换数次)的相同培养基中,直至看到胚发生愈伤 组织。分离愈伤组织,然后进行传代培养直至体细胞胚出现。将来源于体细胞胚的小植株 在生根培养基上成熟直至根发育。将生根的幼苗移植至温室中的花盆土中。从展示对选择 剂具有抗性的并且包含单拷贝T-DNA插入物的植物产生Tl种子。实施例13 非生物胁迫筛选的实例干旱筛选在正常条件下在花盆土中培养来自所选数目的事件的植物,直到它们进入抽穗 期。然后将其转移到限制灌溉的“干燥”区域。向随机选择的花盆中插入湿度探测仪,以监 测土壤水含量(SWC)。当SWC低于一定的阈值时,自动向植物持续补水,直到再次达到正常 水平。然后将植物重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非 生物胁迫条件下培养的植物相同。如针对正常条件下的生长所详述的那样,记录生长和产 率参数。盐胁迫筛选将植物生长在椰子纤维和argeX(3 1的比率)制造的基质上。在将小植株移植 入温室后前2两周中使用正常的营养液。在前两周后,向营养液中加入25mM盐(NaCl),直 至收获植物。如针对正常条件下的生长所详述的那样,记录生长和产率参数。实施例14 非生物胁迫筛选氮利用效率筛选在除营养液以外正常的条件下在花盆土中培养来自T1、T2或更后代的稻植物。从 植物移植到成熟一直用特定的营养液对花盆进行浇灌,所述营养液的氮(N)含量降低,通 常低7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物 相同。如针对正常条件下的生长所详述的那样,记录生长和产率参数。
权利要求
相对于对照植物增强植物的种子产率相关性状的方法,包括增加植物中编码产率增加性多肽的核酸序列的表达,所述产率增加性多肽选自核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽,和丙氨酸氨基转移酶(AAT)多肽,以及任选地选择具有增强的种子产率相关性状的植物。
2.权利要求1的方法,其中所述产率增加性多肽是核定位AT-hook基序蛋白 19/20 (AHL19/20)多肽,该AHL19/20多肽包含与SEQ ID NO :36所示保守结构域(CD)具有 至少70%、75%、80%、85%、90%、95%、98%、99%或更大的氨基酸序列同一性的结构域, 或所述AHL19/20多肽包含(i)与SEQ ID NO :37所示AT-hook基序具有至少75%、80%、 85%、90%、95%、98%、99%或更大的氨基酸序列同一性的基序;和(ii)与SEQID NO 38 所示植物及原核生物保守(PPC)结构域具有至少55%、60%、65%、70%、75%、80%、85%、 90%、95%、98%、99%或更大的氨基酸序列同一性的结构域。
3.权利要求1或2的方法,其中所述AHL19/20多肽包含(i)核定位信号;(ii)具 有InterPro登录号IPR014476的AT-hook DNA结合基序;和(iii)具有InterPro登录号 IPR005175的植物及原核生物保守(PPC)结构域。
4.任何前述权利要求的方法,其中所述AHL19/20多肽,当用于构建AHL系统发生树,例 如图1 或图2中描述的系统发生树时,与包含SEQ IDNO 2所示多肽序列的AHL19/20多肽 群而非任何其他AHL群聚类。
5.权利要求1的方法,其中所述产率增加性多肽按照递增的优选顺序分别与SEQID NO :2所示的AHL19/20多肽、或本文表A中所示的任何多肽序列、或SEQ ID N0:46所示GRP 多肽、或SEQ ID NO :51所示AAT样多肽、或SEQ ID NO :56所示AAT多肽具有至少50%、 55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99% 或更高的氨基酸序列同一 性。
6.任何前述权利要求的方法,其中所述编码AHL19/20多肽的核酸序列为表A中所示的 任一 SEQ ID NO核酸序列或其部分、或能够与表A中所示的任一 SEQ ID NO核酸序列杂交 的序列。
7.任何前述权利要求的方法,其中所述核酸序列编码表A中所示的任何SEQID NO多 肽序列的直系同源物或旁系同源物。
8.任何前述权利要求的方法,其中所述增加的表达通过任何一个或多个下列技术实 现T-DNA激活标签、TILLING、或同源重组。
9.任何前述权利要求的方法,其中所述增加的表达通过在植物中引入和表达编码 AHL19/20多肽的核酸序列来实现。
10.任何前述权利要求的方法,其中所述增强的种子产率相关性状是一个或多个下列 性状(i)增加的每圆锥花序的花数;(ii)增加的每植物的种子总重量;(iii)增加的饱满 种子数;或(iv)增加的收获指数。
11.权利要求2的方法,其中相对于对照植物,所述增强的种子产率相关性状发生在于 养分可利用度下降的条件下,优选氮可利用度下降的条件下生长的植物中。
12.权利要求11的方法,其中所述增强的种子产率相关性状是一个或多个下列性状 (i)增加的每植物的种子总产率;(ii)增加的饱满种子数;或(iii)增加的收获指数。
13.权利要求2的方法,其中所述核酸序列与组成型启动子,优选与植物组成型启动 子,更优选与G0S2启动子,最优选与SEQ ID NO :35所示的稻的G0S2启动子有效连接。
14.任何前述权利要求的方法,其中所述编码AHL19/20多肽的核酸序列是植物来源 的,优选来自双子叶植物,还优选来自十字花科,最优选来自拟南芥。
15.可通过任何前述权利要求的方法获得的植物、其部分(包括种子)、或植物细胞,其 中所述植物、其部分或细胞包含与植物组成型启动子有效连接的编码产率增加性多肽的分 离的核酸转基因,所述产率增加性多肽选自核定位AT-hook基序蛋白19/20 (AHL19/20)、 GRP(生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶 (AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽。
16.构建体,其包含(a)编码产率增加性多肽的核酸序列,所述产率增加性多肽选自权利要求2至7中任 一项所定义的核定位AT-hook基序蛋白19/20 (AHL19/20)、GRP(生长调节蛋白,其中所述 GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转 移酶(AAT)多肽;(b)一个或多个能够驱动(a)中的核酸序列表达的控制序列;和任选地(c)转录终止序列。
17.权利要求16的构建体,其中所述控制序列是植物组成型启动子,优选G0S2启动子, 更优选SEQ ID NO 35所示的G0S2启动子。
18.权利要求16或17的构建体在产生相对于对照植物具有增强的种子产率相关性 状的植物的方法中的用途,所述增强的种子产率相关性状是一个或多个下列性状(i)增 加的每圆锥花序的花数;(ii)增加的每植物的种子总重量;(iii)增加的饱满种子数;或 (iv)增加的收获指数。
19.用权利要求16或17的构建体转化的植物、植物部分或植物细胞。
20.产生相对于对照植物具有增强的种子产率相关性状的转基因植物的方法,包括(i)在植物、植物部分或植物细胞中引入和表达处于植物组成型启动子控制之下的编码产率增加性多肽的核酸序列,所述产率增加性多肽选自权利要求2至7中任一项所定义 的核定位AT-hook基序蛋白19/20 (AHL19/20)、GRP (生长调节蛋白,其中所述GRP多肽是 金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT) 多肽;和( )在促进植物生长和发育的条件下培养所述植物细胞、植物部分或植物。
21.由于编码产率增加性多肽的核酸序列的增加表达而相对于对照植物具有增强的种 子产率相关性状的转基因植物、或源自所述转基因植物的转基因植物细胞或转基因植物部 分,其中所述核酸序列与植物组成型启动子有效连接,所述产率增加性多肽选自权利要求2 至7中任一项所定义的核定位AT-hook基序蛋白19/20 (AHL19/20)、GRP (生长调节蛋白, 其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨 酸氨基转移酶(AAT)多肽。
22.权利要求15、19或21的转基因植物或源自所述转基因植物的转基因植物细胞,其 中所述植物是作物植物或单子叶植物或谷类,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、 高粱和燕麦。
23.权利要求22的植物的可收获部分,其包含编码产率增加性多肽的核酸序列,所述 产率增加性多肽选自核定位AT-hook基序蛋白19/20 (AHL19/20)、GRP (生长调节蛋白,其 中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽和丙氨酸 氨基转移酶(AAT)多肽,其中所述可收获部分优选是种子。
24.来源于权利要求22的植物和/或来源于权利要求23的植物的可收获部分的产品。
25.编码产率增加性多肽的核酸序列在增强种子产率相关性状中的用途,所述产 率增加性多肽选自如权利要求2至7中任一项所定义的核定位AT-hook基序蛋白 19/20 (AHL19/20)、GRP (生长调节蛋白,其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、 丙氨酸氨基转移酶(AAT)样多肽和丙氨酸氨基转移酶(AAT)多肽,所述增强的种子产率相 关性状包括一个或多个下列性状i)增加的每圆锥花序的花数;(ii)增加的每植物的种子 总重量;(iii)增加的饱满种子数;或(iv)增加的收获指数。
26.权利要求25的用途,其中所述增强的种子产率相关性状在养分可利用度下降的条 件下,优选在氮可利用度下降的条件下发生。
全文摘要
本发明总体上涉及分子生物学领域,并且涉及通过调节植物中编码产率增加性多肽的核酸序列的表达来增强多种植物产率相关性状的方法,所述产率增加性多肽选自核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白)(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽、和丙氨酸氨基转移酶(AAT)多肽。本发明还涉及具有调节的产率增加性多肽编码核酸序列表达的植物,所述产率增加性多肽选自核定位AT-hook基序蛋白19/20(AHL19/20)、GRP(生长调节蛋白)(其中所述GRP多肽是金属硫蛋白2a(MT2a)多肽)、丙氨酸氨基转移酶(AAT)样多肽、和丙氨酸氨基转移酶(AAT)多肽,该植物相对于对照植物具有增强的产率相关性状。本发明还提供了可以用于本发明方法的构建体。
文档编号C12N15/82GK101849009SQ200880025418
公开日2010年9月29日 申请日期2008年7月21日 优先权日2007年7月20日
发明者V·弗兰卡德, Y·海茨费尔德 申请人:巴斯夫植物科学有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1