与植物增加的产量相关的遗传区域和基因的制作方法

文档序号:15746431发布日期:2018-10-23 23:19阅读:235来源:国知局

本申请要求于2015年12月16日提交的美国临时申请号62/268158的权益,其内容通过引用特此结合。

关于序列表的电子提交的声明

提交以ASCII text格式的、命名为80955 SEQ LIST_ST25.txt并且大小是122千字节、于2016年12月5日生成的序列表,并且电子序列表与本申请一起提交。这个序列表由此通过引用以其披露内容结合到本说明书中。

技术领域

本发明涉及用于在植物中引入等位基因、基因和/或染色体区间的组合物和方法,这些等位基因、基因和/或染色体区间赋予所述植物在水分胁迫条件下提高的耐旱性和/或增加的产量和/或在不存在水分胁迫的下增加的产量的性状。



背景技术:

干旱是全球玉米生产的主要限制之一。由于干旱,全球每年约15%的玉米作物会损失。可以在生长季节的任何时间发生干旱胁迫的时期。玉米在开花前和开花期对干旱胁迫特别敏感。当在这个关键时期发生干旱胁迫时,会导致谷物产量显著下降。

鉴定提高作物耐旱性的基因可以通过允许鉴定、选择和生产具有增强的耐旱性的作物植物而导致更有效的作物生产实践。

按照这样,植物育种的目标是将不同的所希望的性状结合在单株植物中。对于大田作物如玉米、大豆等,这些性状可以包括更高的产量以及更好的农艺品质。然而,影响产量以及农艺品质的遗传基因座并不总是已知的,并且即便是已知的,遗传基因座对此类性状的作用常常是不清楚的。因此,需要鉴定能够积极影响这种理想性状的新基因座和/或需要发现能够积极影响这种理想性状的已知基因座的能力。

一经发现,这些所希望的基因座可以被选择为育种计划的一部分,以便产生携带所希望的性状的植物。产生此类植物的方法的示例性实施例包括将来自具有所希望的遗传信息的植物的核酸序列通过基因渗入转移到植物中,而不是通过使用传统的育种技术使这些植物杂交。此外,可以使用新发明的基因组编辑能力来编辑植物基因组以包含所希望的基因或遗传等位基因形式。

可以使用标记辅助选择(MAS)、标记辅助育种(MAB)、一种或多种基因的转基因表达和/或通过最近的基因编辑技术(例如CRISPR、TALEN等)将所希望的基因座引入可商购的植物品种。

则需要的是用于向植物中引入基因或基因组区域的新的方法和组合物,该基因或基因组区域可导致耐旱作物和/或在水分充足和水胁迫条件下产量增加的作物。

发明概述

本概述列出了本披露主题的若干实施例,并且在许多情况下列出了这些实施例的变化和排列。本概述对于众多的并且不同的实施例的只是示例性的。给出的实施例的一个或多个代表性特征的提及同样是示例性的。不论是否在本概述中列出,这样实施例典型地可以具有或者不具有这个或这些特征的存在;同样,可以将那些特征应用于本披露主题的其他实施例。为了避免过多的重复,本概述没有列出或提出这些特征的所有可能的组合。

提供了用于在干旱条件下鉴定、选择和/或生产具有增加的产量的植物的组合物和方法。如本文所述,基因组区域(可互换-“染色体区间”)可以包含与提高的耐旱性和/或增加产量相关的一个或多个遗传基因座上的一种或多种基因、单个等位基因或等位基因的组合,或者基本上由其组成或由其组成。

本文所有披露的玉米染色体位置与玉米“B73参考基因组版本2”相对应。“B73参考基因组,版本2”是玉米B73基因组的公开可用的物理和遗传框架。它是利用大约19,000个定位BAC克隆的最小覆瓦式(tiling path)进行测序的结果,并且专注于对玉米基因组中所有可识别的含有基因的区域产生高质量的序列覆盖。这些区域被排序、定位,并且与所有基因间序列一起锚定到玉米基因组的现存物理和遗传图谱上。它可以使用基因组浏览器访问,因特网上公开的玉米基因组浏览器可以方便用户与序列和图谱数据交互。

本发明已鉴定了玉米基因组内八个致病性基因座(causative loci),其与提高的耐旱性(例如,在干旱条件下每英亩玉米增加的蒲式耳)和增加的产量(例如,在非干旱条件、正常或水分充足的条件下每英亩玉米增加的蒲式耳)高度相关,这八个基因座在本文统称为(‘产量等位基因’)。具体而言,本发明披露了以下八个产量等位基因,其区分中心高度相关的产量基因座,这些等位基因包括:(1)位于对应于在位置272937870的G等位基因的玉米染色体1的SM2987(本文(‘产量等位基因1’)或(‘SM2987’));(2)位于对应于在位置12023706的G等位基因的玉米染色体2的SM2991(本文(‘产量等位基因2’)或(‘SM2991’));(3)位于对应于在位置225037602的A等位基因的玉米染色体3的SM2995(本文(‘产量等位基因3’)或(‘SM2995’));(4)位于对应于在位置225340931的A等位基因的玉米染色体3的SM2996(本文(‘产量等位基因4’)或(‘SM2996’));(5)位于对应于在位置159121201的G等位基因的玉米染色体5的SM2973(本文(‘产量等位基因5’)或(‘SM2973’));(6)位于对应于在位置12104936的C等位基因的玉米染色体9的SM2980(本文(‘产量等位基因6’)或(‘SM2980’));(7)位于对应于在位置133887717的A等位基因的玉米染色体9的SM2982(本文(‘产量等位基因7’)或(‘SM2982’));和(8)位于对应于在位置4987333的G等位基因的玉米染色体10的SM2984(本文(‘产量等位基因8’)或(‘SM2984’))(参见表1-7)。不受理论的限制,据信这些产量等位基因的每个落在引起给定表型(例如在干旱或非干旱条件下的产量)的一种或多种基因内或附近。本领域熟知的,致病性基因内的标记和所有紧密相关的标记可用于标记辅助育种中以选择、鉴定和辅助产生具有与给定标记相关的性状的植物(例如,在这种情况下,提高的耐旱性和/或产量,参见表1-7,表明产量等位基因和可用于鉴定或产生对于各个基因座或染色体区间具有提高的耐旱性的玉米品系的密切相关标记的实例)。因此,本发明的一个方面披露了选择或鉴定具有提高的耐旱性和/或增加的产量(即与对照植物相比增加蒲式耳/英亩)的玉米品系或种质的方法,其中该方法包括以下步骤:(a)从玉米植物部分分离核酸;(b)在(a)的核酸中检测与耐旱性和/或增加的产量相关的分子标记,其中分子标记与“产量等位基因1-8”中的任何一个密切相关,其中紧密相关意指标记在所述产量等位基因的50cM、40cM、30cM、20cM、15cM、10cM、9cM、8cM、7cM、6cM、5cM、4cM、3cM、2cM、1cM或0.5cM内;以及(c)基于(b)中所述标记的存在选择或鉴定玉米植物。在一些实施例中,(b)的标记选择是表1-7中所述的任何标记或紧密相关的标记。在其他实施例中,(b)的标记可用于通过根据以上步骤(a)-(c)中描述的方法选择玉米植物产生具有提高的耐旱性或增加的产量的玉米植物,并进一步包含以下步骤:(d)将(c)的植物与不包含(b)中鉴定的标记的第二玉米植物杂交;以及(d)生产在其基因组中包含(b)的标记的子代植物,其中所述子代植物与对照植物相比具有提高的耐旱性和/或产量。在另一个例子中,人们也可以希望使用(b)中鉴定的相同标记来选择(d)中产生的子代植物。

在本发明的一些实施例中,是鉴定和/或选择耐旱性玉米植物、玉米种质或其植物部分的方法,该方法包括:在所述玉米植物、玉米种质或其植物部分中检测与玉米中的耐旱性相关的标记基因座的至少一个等位基因,其中所述至少一个标记基因座于选自下组的染色体区间内,该组由以下组成:被碎片化并包括在染色体1物理位置248150852-296905665(本文“区间1”)上的标记IIM56014和IIM48939、在染色体3物理位置201538048-230992107(本文“区间2”)上的IIM39140和IIM40144、在染色体9物理位置121587239-145891243(本文“区间3”)上的IIM6931和IIM7657、在染色体2物理位置1317414-36929703(本文“区间4”)上的IIM40272和IIM41535、在染色体5物理位置139231600-183321037(本文“区间5”)上的IIM25303和IIM48513、在染色体9物理位置405220-34086738(本文“区间6”)上的IIM4047和IIM4978、在染色体10物理位置1285447-29536061(本文“区间7”)上的IIM19和IIM818、及其任何组合(参见表1-7,其显示了与提高的耐旱性相关的所述染色体区间内的SNP。用‘***’括起来的等位基因位置,并且粗体和下划线表示位于或紧邻用于耐旱性和/或增加的产量的致病性基因的“产量等位基因”)的染色体区间。

表1.连锁至SM2987的标记(“区间1”)

表2.连锁至SM2995和SM2996的标记(“区间2”)

表3.连锁至SM2982的标记(染色体区间3)

表4.连锁至SM2991的标记(“区间4”)

表5.连锁至SM2973的标记(“区间5”)

表6.连锁至SM2980的标记(“区间6”)

表7.连锁至SM2984的标记(“区间7”)

在一些实施例中,提供生产耐旱性玉米植物的方法。此类方法可以包括在玉米种质或玉米植物中检测与增加的干旱耐受性相关的标记(例如,在任何染色体区间或包含至少一个本文所定义的染色体区间1-15的其组合内的标记,任何标记或表1-7中列出的标记或任何产量等位基因1-8或与产量等位基因1-8紧密相关的标记)的存在,并从所述玉米种质或植物产生子代植物,其中所述子代植物包含与提高的耐旱性相关的所述标记,并且与不包含所述标记的对照植物相比,所述子代植物进一步表现出提高的耐旱性。本发明还提供了由所述子代植物产生的种子。

在一些实施例中,提供了由两种亲本玉米品系产生的玉米种子,其中至少一种亲本品系被鉴定或选择用于在干旱胁迫下提高产量或在非干旱条件下提高产量,并且另外与对照植物相比其中产量是每英亩玉米增加的蒲式耳,并且其中根据包括以下步骤的方法选择至少一个亲本品系:(a)从玉米亲本品系植物部分分离核酸;(b)在(a)的核酸中检测与耐旱性和/或增加的产量相关的分子标记,其中分子标记与“产量等位基因1-8”中的任何一个密切相关,其中紧密相关意指标记在所述产量等位基因的50cM、40cM、30cM、20cM、15cM、10cM、9cM、8cM、7cM、6cM、5cM、4cM、3cM、2cM、1cM或0.5cM内;以及(c)基于(b)中所述标记的存在选择或鉴定玉米植物。在实施例的一些方面,(b)的分子标记在选自如本文所定义的染色体区间1-15中的任一种的染色体区间内。

在一些实施例中,使用标记探针检测与提高的耐旱性相关的标记的存在。在一些此类实施例中,在来自分离自玉米植物或种质的核酸样品的扩增产物中检测到与提高的耐旱性相关的标记的存在。在一些实施例中,标记包含单倍型,并且多个探针用于检测构成单倍型的等位基因。在一些此类实施例中,构成单倍型的等位基因在来自分离自玉米植物或种质的核酸样品的多种扩增产物中检测。

在一些实施例中,提供了选择耐旱玉米植物或种质的方法。此类方法可包括使第一玉米植物或种质与第二玉米植物或种质杂交(其中第一玉米植物或种质包含与提高的耐旱性相关的标记),并选择具有该标记的子代植物或种质(例如,位于来自染色体区间1-15中的任一个的50cM、20cM、10cM、5cM、2cM或1cM的标记,位于染色体区间或包含至少一个本文所定义的区间1-15的其组合内的标记,或任何标记或表1-7中列出的标记或产量等位基因1-8的组合),已经证明它们与提高的耐旱性和/或产量相关联。

在一些实施例中,提供将与提高的耐旱性相关的等位基因基因渗入至玉米植物或玉米种质的方法。此类方法可以包括将包含与提高的耐旱性相关的等位基因(例如,表1-7中鉴定的任何等位基因)的第一玉米植物或种质与缺少所述等位基因的第二玉米植物或种质杂交,并且将包含所述等位基因的子代植物与第二玉米植物或种质重复回交以产生包含与提高的耐旱性相关的等位基因的耐旱玉米植物或种质。包含与增加的耐旱性相关的等位基因的子代可以通过在其基因组中检测与所述等位基因相关的标记的存在来鉴定;例如位于染色体区间(例如染色体区间1-15中的任一个或其部分或距产量等位基因1-8的50cM、20cM、10cM或更少)或包含至少一个如本文所定义的染色体区间1-15的其组合内的标记,或表1-7中所列的标记的任何标记或组合。

还提供了通过本发明的任何方法鉴定、生产或选择的植物和/或种质,以及来源于通过本文所述的这些方法鉴定、产生或选择的植物或种质的任何子代或种子。

还提供了使染色体区间1-15中任一个经基因渗入(例如通过植物育种、转基因表达或基因组编辑)进入其基因组的非天然存在的玉米植物和/或种质,该染色体区间1-15包含一个或多个与增加的耐旱性相关的标记。在一些实施例中,非天然存在的玉米植物和/或种质是在较好的施水条件下与提高的耐旱性和/或增加的产量相关的标记的存在下的基础上选择用于育种目的的玉米植物的子代植物,并且其中所述标记位于对应于染色体区间1、2、3、4、5、6、7或其部分的任何一个或多个的染色体区间内。在其他实施例中,通过在植物基因组内编辑对应于表1-7中任一个中鉴定的产量等位基因1-8或有利等位基因中的任何一个的等位基因变化来创建非天然存在的植物,其中等位基因变化导致与对照植物相比具有提高的耐旱性和/或增加的产量的植物。

还提供了使用与提高的耐旱性相关的标记的方法。此类标记可以包含与SEQ ID NO:1-8、17-66中的任一个具有至少85%、90%、95%、或99%序列同一性的核苷酸序列;其反向互补序列、或其信息或功能片段。

还提供了包含能够扩增从玉米植物或种质分离的核酸样品以产生与提高的耐旱性相关的标记的引物对的组合物。此类组合物可以包含表8中鉴定的扩增引物对之一基本上由其组成或由其组成。

表8

可用于分析水优化基因座、等位基因和单倍型的示例性寡核苷酸引物和探针的SEO ID NO.

与提高的耐旱性相关的标记可以包含单个等位基因或在一个或多个遗传基因座(例如,包含如本文所定义的SEQ ID NO:1-8、17-65和/或产量等位基因1-8的任一个的遗传基因座)上的等位基因的组合、基本上由其组成和/或由其组成。

本发明的另一个实施例是选择或鉴定与对照植物相比具有提高的耐旱性的玉米植物的方法,其中与对照植物相比,提高的耐旱性是增加的产量(以蒲式耳/英亩),该方法包括以下步骤:a)从玉米植物分离核酸;b)在a)的核酸中检测与耐旱性紧密连锁的分子标记(例如来自表1-7的任何标记);以及c)基于b)中检测到的分子标记,鉴定或选择与对照植物相比具有提高的耐旱性的玉米品系。在一些实施例中,b)中检测到的标记在选自如本文所定义的染色体区间1-15中的任一个的染色体区间内。在另一个实施例中,b)中检测到的标记包含SEQ ID NO:17-24中的任一个,其中该序列包含如表1-7中所述的任何有利的等位基因。另外的实施例包括染色体区间,其中表8中的任何一个引物对与所述区间退火,并且PCR扩增产生诊断将给定标记与提高的耐旱性相关联的扩增子。

在另一个实施例中,可以将本发明的基因、染色体区间、标记和遗传基因座与美国专利申请2011-0191892(本文中以其整体通过引用结合)中描述的标记组合。例如,可以将玉米中包含SEQ ID NO:1-8;17-77中任一项或者本文包含的与在水分充足条件下提高的耐旱性和/或增加的产量相关的等位基因的遗传基因座与单倍型A-M的任何一个或多个组合,其中单倍型A-M如以下定义:

i.单倍型A包含在对应于SEQ ID NO:65的位置115的位置处的G核苷酸、在对应于SEQ ID NO:65的位置270的位置处的A核苷酸、在对应于SEQ ID NO:65的位置301的位置处的T核苷酸、和在对应于SEQ ID NO:65的位置483的位置处的A核苷酸,该SEQ ID NO:65在第一植物基因组中的染色体8上;

ii.单倍型B包含在SEQ ID NO:66的位置4497-4498的缺失、在对应于SEQ ID NO:66的位置4505的位置处的G核苷酸、在对应于SEQ ID NO:66的位置4609的位置处的T核苷酸、在对应于SEQ ID NO:66的位置4641的位置处的A核苷酸、在对应于SEQ ID NO:66的位置4792的位置处的T核苷酸、在对应于SEQ ID NO:66的位置4836的位置处的T核苷酸、在对应于SEQ ID NO:66的位置4844的位置处的C核苷酸、在对应于SEQ ID NO:66的位置4969的位置处的G核苷酸、以及在对应于SEQ ID NO:66的位置4979-4981的位置处的TCC三核苷酸,该SEQ ID NO:66在第一植物基因组中的染色体8上;

iii.单倍型C包含在对应于SEQ ID NO:67的位置217的位置处的A核苷酸、在对应于SEQ ID NO:67的位置390的位置处的G核苷酸、以及在对应于SEQ ID NO:67的位置477的位置处的A核苷酸,该SEQ ID NO:67在第一植物基因组中的染色体2上;

iv.单倍型D包含在对应于SEQ ID NO:68的位置182的位置处的G核苷酸、在对应于SEQ ID NO:68的位置309的位置处的A核苷酸、在对应于SEQ ID NO:68的位置330的位置处的G核苷酸、以及在对应于SEQ ID NO:68的位置463的位置处的G核苷酸,该SEQ ID NO:68在第一植物基因组中的染色体8上;

v.单倍型E包含在对应于SEQ ID NO:69的位置61的位置处的C核苷酸、在对应于SEQ ID NO:69的位置200的位置处的C核苷酸、以及在对应于SEQ ID NO:69的位置316-324的位置处的九个核苷酸的缺失,该SEQ ID NO:69在第一植物基因组中的染色体5上;

vi.单倍型F包含在对应于SEQ ID NO:70的位置64的位置处的G核苷酸、以及在对应于SEQ ID NO:70的位置254的位置处的T核苷酸,该SEQ ID NO:70在第一植物基因组中的染色体8上;

vii.单倍型G包含在对应于SEQ ID NO:71的位置98的位置处的C核苷酸、在对应于SEQ ID NO:71的位置147的位置处的T核苷酸、在对应于SEQ ID NO:71的位置224的位置处的C核苷酸、在对应于SEQ ID NO:71的位置496的位置处的T核苷酸,该SEQ ID NO:71在第一植物基因组中的染色体9上;

viii.单倍型H包含在对应于SEQ ID NO:72的位置259的位置处的T核苷酸、在对应于SEQ ID NO:72的位置306的位置处的T核苷酸、在对应于SEQ ID NO:72的位置398的位置处的A核苷酸、以及在对应于SEQ ID NO:72的位置1057的位置处的C核苷酸,该SEQ ID NO:72在第一植物基因组中的染色体4上;

ix.单倍型I包含在对应于SEQ ID NO:73的位置500的位置处的C核苷酸、在对应于SEQ ID NO:73的位置568的位置处的G核苷酸、以及在对应于SEQ ID NO:73的位置698的位置处的T核苷酸,该SEQ ID NO:73在第一植物基因组中的染色体6上;

x.单倍型J包含在对应于SEQ ID NO:74的位置238的位置处的A核苷酸、对应于SEQ ID NO:74的位置266-268处的核苷酸的缺失、以及在对应于SEQ ID NO:74的位置808的位置处的C核苷酸,该SEQ ID NO:74在第一植物基因组中;

xi.单倍型K包含在对应于SEQ ID NO:75的位置166的位置处的C核苷酸、以及在对应于SEQ ID NO:75的位置224的位置处的A核苷酸、在对应于SEQ ID NO:75的位置650的位置处的G核苷酸、以及在对应于SEQ ID NO:75的位置892的位置处的G核苷酸,该SEQ ID NO:75在第一植物基因组中的染色体8上;

xii.单倍型L包含在对应于SEQ ID NO:76的位置83、428、491和548的位置处的C核苷酸,该SEQ ID NO:76在第一植物基因组中的染色体9上;以及

xiii.单倍型M包含在对应于SEQ ID NO:77的位置83的位置处的C核苷酸、在对应于SEQ ID NO:77的位置119的位置处的A核苷酸、以及在对应于SEQ ID NO:77的位置601的位置处的T核苷酸。

因此,在一些实施例中,本披露的主体提供堆叠单倍型的方法,该单倍型选自由具有选自下组的标记的单倍型A、B、C、D、E、F、G、H、I、J、K、L、和M的任一种组成的组,该标记的组由以下组成并且这些单倍型与以下紧密相关:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、和SM2984,如表1-7中的那些;或紧密连锁至SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、和SM2984的标记、或包含SEQ ID NO:17-24中的任一种的标记。进一步提供的是在其基因组中包含在自然界中不存在的单倍型和/或基因座的堆叠的玉米植物,其中这些堆叠包含如定义的与SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、和SM2984中的任一种组合的单倍型A-M中的任一种。在一些情况下,包含天然不存在的这些独特堆叠(例如包含单倍型A-M或基因座SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、和SM2984的组合)的玉米植物杂种玉米植物,并且在一些情况下,杂种玉米植物在其基因组中包含用于除草剂抗性和/或昆虫抗性的活性转基因。

因此,在一些实施例中,本披露的主题提供用于生产具有提高的耐旱性的杂种植物的方法。在一些实施例中,该方法包括(a)提供第一植物,该第一植物包含第一基因型,该第一基因型包含单倍型A-M中的任一种:(b)提供第二植物,该第二植物包含第二基因型,该第二基因型包含来自下组的任一种,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、和SM2984,其中该第二植物包含不在第一植物中存在的来自下组的至少一个标记,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、和SM2984;(c)将第一植物和第二玉米植物杂交以产生F1代;鉴定包含所希望的基因型的F1代的一个或多个成员,该基因型包含单倍型A-M和来自下组的任何标记的组合,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、和SM2984,其中该所希望的基因型与(a)的第一基因型和(b)的第二基因型均不同,由此产生具有提高的耐旱性的杂种植物。在实施例的一些方面,(b)的杂种植物在其基因组内进一步包含用于除草剂耐受性和/或抗虫性的转基因。在一些方面,(b)的杂种植物是优良玉米品系。

在另一个实施例中,本披露的主题披露了产生与对照植物相比具有提高的耐旱性的玉米植物的方法,其中产量是增加的蒲式耳/英亩(在一些实施例中为YGSMN),该方法包括以下步骤:a)从第一玉米植物分离核酸;b)在a)的核酸中检测与提高的耐旱性相关的分子标记(例如,表1-7中描述的任何标记或紧密相关的标记),其中该标记位于染色体区间1-15内;或其中该染色体区间定义为来自产量等位基因1-8的任一种的50cM、40cM、30cM、20cM、10cM、9cM、8cM、7cM、6cM、5cM、4cM、3cM、2cM、1cM或0.5cM或更少;或者该染色体区间包含SEQ ID NO 17-24中的任一种;或者该标记与表1-7中描述的相应标记紧密相关;c)基于b)中检测的标记选择第一玉米植物;d)将第一玉米植物与不包含b)的标记的第二玉米植物杂交;e)从d)的杂交生产子代植物,其中该子代植物向其基因组中基因渗入b)的标记,由此生产与对照植物相比具有提高的耐旱性的玉米植物。在一些方面,通过实施例产生种子,其中该种子在其基因组中包含b)的标记。

在另一个实施例中,本披露的主题披露了产生植物的方法,该植物与对照植物相比在干旱条件下具有提高的耐旱性、增加的产量或在非干旱条件下具有增加的产量,该方法包括以下步骤:a)在植物细胞中,编辑植物的基因组(即,通过CRISPR、TALEN或大范围核酸酶)以包含与在干旱条件下的提高的耐旱性、增加的产量或在非干旱条件下增加的产量相关的分子标记(例如SNP),其中该分子标记是如在表1-7中描述的任何标记(例如有利的等位基因),并且另外的其中该植物基因组先前不具有所述分子标记;b)从a)的植物细胞生产植物或植物愈伤组织。具体地,编辑包含产量等位基因1-8的任一种或其紧密相关的等位基因。在实施例的另一方面,编辑是针对与包含SEQ ID NO:1-8的基因具有70%、80%、85%、90%、92%、95%、98%、99%或100%序列同源性或序列同一性的基因。

在一些实施例中,具有提高的耐旱性的杂种植物包含单倍型A-M中的每个(这些单倍型A-M在第一植物中存在)以及选自下组的至少一个另外的基因座(在第二植物中存在的),该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、和SM2984(或在染色体区间1-15中任一种内的与在水分充足条件下的提高的耐旱性和/或增加的产量相关的标记,其中产量是增加的蒲式耳/英亩,或包含SEQ ID NO 17-24的标记)。在一些实施例中,第一植物是包含单倍型A-M的至少一个的轮回亲本,并且第二植物是包含不在第一植物中存在的来自下组的至少一个标记的供体,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、或SM2984。在一些实施例中,第一植物于单倍型A-M的至少两个、三个、四个、或五个是纯合的。在一些实施例中,杂种植物包含单倍型A-M的至少三个、四个、五个、六个、七个、八个、或九个,以及来自下组的标记,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、或SM2984,或产量等位基因1-8中的任一个。

在一些实施例中,关于单倍型A-M的每个以及在第一植物或第二植物中存在的来自下组的标记,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、和SM2984,人们可以通过基因分型由第一植物与第二植物杂交产生的F1代的一个或多个成员鉴定耐旱性玉米植物。在一些实施例中,第一植物和第二植物是玉蜀黍(Zea mays)植物,并且在其他情况下,第一和第二植物近交玉蜀黍植物。

在一些实施例中,与对照植物相比,“增加的水优化”在水分胁迫环境中赋予增加的或稳定的产量。可以使用表1-7中列出的任何标记或染色体区间1-15内的标记来选择、鉴定或产生具有增强水优化的玉米植物。在一些实施例中,可以在较高的作物密度种植具有增加的水优化的杂种。在一些实施例中,当在有利的水分水平下时,具有增加的水优化的杂种不赋予产量损失。在还另一个实施例中,与对照植物相比,包含表1-7中鉴定的任何标记或染色体区间的植物可以赋予提高的耐旱性或增加的产量中的任一种,或另外的在非干旱或水分充足条件下增加的产量,其中产量是每英亩玉米增加的蒲式耳(即YGSMN)。

本披露的主题在一些实施例中还提供通过本披露的方法产生的杂种玉蜀黍植物、或其细胞、组织培养物、种子、或植物部分。

本披露的主题在一些实施例中还提供通过回交和/或自交和/或生产来自本文披露的杂种玉蜀黍植物的双倍体产生近交玉蜀黍植物、或其细胞、组织培养、种子、或其部分。

在一些实施例中,关于表1-7中展示的染色体区间、标记的任一个和/或其组合或者包含在第一植物或第二植物中存在的SEQ ID NO:1-8;17-65中的任一种或其组合,通过基因分型由第一植物与第二植物杂交产生的F1代的一个或多个成员来鉴定具有提高的耐旱性的玉米植物。在一些实施例中,第一植物和第二植物是玉蜀黍植物。在其他实施例中,第一植物或第二植物是玉蜀黍近交系或玉蜀黍杂种或优良玉蜀黍品系。

本披露的主题还在一些实施例中提供了,已经被修饰以包括转基因的杂种或近交玉蜀黍植物。在一些实施例中,该转基因编码对选自以下的除草剂提供抗性的基因产物:草甘膦、磺酰脲、咪唑啉酮、麦草畏、草铵膦、苯氧基丙酸、cycloshexome、莠去津、苄腈和溴苯腈。例如,在其基因组内具有编码草甘膦、磺酰脲、咪唑啉酮、麦草畏、草甘膦、苯氧基丙酸、cycloshexome、莠去津、苄腈和溴苯腈抗性转基因中的任一种的转基因的任何杂种或近交玉蜀黍植物,并且另外的其中所述植物经由植物育种、转基因表达或基因组编辑已经向其基因组引入SEQ ID NO 1-8的任一个或产量等位基因1-8的任一个。

本披露的主题在一些实施例中还提供用于鉴定包含至少一个与如本文所披露的提高的耐旱性相关的等位基因(例如与表1-7中描述的等位基因紧密相关的任何标记)的玉蜀黍植物的方法。在一些实施例中,该方法包括(a)基因分型和鉴定至少一个玉蜀黍植物,该玉蜀黍植物具有包含SEQ ID NO:1-8;17-60中的任一个的至少一个核酸标记;以及(b)选择至少一个玉蜀黍植物,该玉蜀黍植物包含与b)中鉴定的耐旱性相关的等位基因。

本披露的主题在一些实施例中还提供通过将基因座(与提高的耐旱性相关的)的目的等位基因基因渗入至玉蜀黍种质中产生玉蜀黍植物。在一些实施例中,基因渗入包含(a)选择包含基因座(与提高的耐旱性相关的)的目的等位基因的玉蜀黍植物,其中与提高的耐旱性相关的基因座包含与SEQ ID NO:1-8;17-60中的任一个是至少80%、85%、90%、95%、98%或100%同一性的核苷酸序列,或其中该核苷酸序列包含产量等位基因1-7中的任一个或其组合;以及(b)将目的等位基因基因渗入至缺乏该等位基因的玉蜀黍种质中。

在另一个实施例中,本发明提供富含染色体区间1-15或产量等位基因1-7中的任一个的玉米种质,其中富集包含以下步骤:鉴定或选择具有所述染色体区间或产量等位基因的品系,以及将这些品系与不具有所述区间或其部分的品系杂交,并且回交以产生具有所述区间或产量等位基因的近交品系,然后将所述近交品系用于至植物育种系统以产生富含所述区间或其产量等位基因的商业的玉米群体(例如,与具有<30%富集所述区间或产量等位基因的所述杂种玉米群体的5年历史谱系相比,商业的杂种玉米群体具有大于30%、40%或超过50%的富含所述区间或产量等位基因的其杂种)。

在一些实施例中,考虑了鉴定和/或选择在非干旱条件下具有增加的产量,在干旱条件下具有增加的产量稳定性、和/或提高的耐旱性的玉米植物或植物部分的方法,该方法包括:在玉米植物或植物部分中检测至少一个标记基因座的等位基因,该标记基因座与植物中在非干旱条件下增加的产量、在干旱条件下增加的产量稳定性、和/或提高的耐旱性相关,其中所述至少一个标记基因座于选自下组的染色体区间,该组由以下组成:

(a)由碱基对(bp)位置272937470至碱基对(bp)位置272938270定义并包括其的玉米染色体1上的染色体区间(本文“区间8”);

(b)由碱基对(bp)位置12023306至碱基对(bp)位置12024104定义并包括其的玉米染色体2上的染色体区间(本文“区间9”);

(c)由碱基对(bp)位置225037202至碱基对(bp)位置225038002定义并包括其的玉米染色体3上的染色体区间(本文“区间10”);

(d)由碱基对(bp)位置225340531至碱基对(bp)位置225341331定义并包括其的玉米染色体3上的染色体区间(本文“区间11”);

(e)由碱基对(bp)位置159,120,801至碱基对(bp)位置159,121,601定义并包括其的玉米染色体5上的染色体区间(本文“区间12”);

(f)由碱基对(bp)位置12104536至碱基对(bp)位置12105336定义并包括其的玉米染色体9上的染色体区间(本文“区间13”);

(g)由碱基对(bp)位置225343590至碱基对(bp)位置225340433定义并包括其的玉米染色体9上的染色体区间(本文“区间14”);

(h)由碱基对(bp)位置14764415至碱基对(bp)位置14765098定义并包括其的玉米染色体10上的染色体区间(本文“区间15”)。在优选的实施例中,染色体区间8-14进一步包含如本文所定义的各自的产量等位基因1-7。

在另外的实施例中,鉴定和/或选择在非干旱条件下具有增加的产量,在干旱条件下具有增加的产量稳定性、和/或提高的耐旱性的玉米植物或植物部分的方法,该方法包括:在玉米植物或植物部分中检测至少一个标记基因座的等位基因,该标记基因座与植物中在非干旱条件下增加的产量、在干旱条件下增加的产量稳定性、和/或提高的耐旱性相关,其中所述至少一个标记基因座选自下组或标记位于以下致病性等位基因的50cM、40cM、30cM、20cM、15cM、10cM、9cM、8cM、7cM、6cM、5cM、4cM、3cM、2cM、1cM或0.5cM:

染色体1bp位置272937870包含G等位基因;

染色体2bp位置12023706包含G等位基因;

染色体3bp位置225037602包含A等位基因;

染色体3bp位置225340931包含A等位基因;

染色体5bp位置159121201包含G等位基因;

染色体9bp位置12104936包含C等位基因;

染色体9bp位置133887717包含A等位基因;以及

染色体10bp位置4987333包含G等位基因;或其任何组合。

在另一个实施例中,选择耐旱性玉米植物的方法,该方法包括以下步骤:a)从植物细胞分离核酸;b)在所述核酸中检测分子标记,该分子标记与提高的耐旱性相关,其中所述标记在染色体区间内,该染色体区间包含如本文所定义的染色体区间1-15的任一个;以及c)基于b)中的标记的检测选择或鉴定具有提高的耐旱性的玉米植物。一些另外的实施例,其中各自的染色体区间包含以下等位基因的任一个:

染色体1bp位置272937870包含G等位基因;

染色体2bp位置12023706包含G等位基因;

染色体3bp位置225037602包含A等位基因;

染色体3bp位置225340931包含A等位基因;

染色体5bp位置159121201包含G等位基因;

染色体9bp位置12104936包含C等位基因;

染色体9bp位置133887717包含A等位基因;以及

染色体10bp位置4987333包含G等位基因;

列于表1-7中的任何等位基因;或其任何组合。

在一些实施例中,本发明提供生产具有增加的产量的杂种玉米植物的方法,其中增加的产量是在干旱或非干旱条件,并且增加的产量是与对照相比每英亩玉米增加的蒲式耳,该方法包括以下步骤:(a)通过鉴定以下任一个来鉴定包含第一基因型的第一玉米植物:标记SM2987、SM2996、SM2982、SM2991、SM2995、SM2973、SM2980、或SM2984,产量等位基因1-8或其任何紧密相关的标记(例如,表1-7中的任何标记);(b)通过鉴定以下任一个来鉴定包含第二基因型的第二玉米植物:标记SM2987、SM2996、SM2982、SM2991、SM2995、SM2973、SM2980、或SM2984,或不包含在第一玉米植物中的产量等位基因1-8;c)使第一玉米植物与第二玉米植物杂交以产生F1代;以及(d)选择F1代的一个或多个成员,该F1代包含所希望的基因型,该所希望的基因型包含以下标记的任何组合:SM2987、SM2996、SM2982、SM2991、SM2995、SM2973、SM2980、或SM2984,其中该所希望的基因型与(a)的第一基因型和(b)的第二基因型均不同,由此产生具有增加的产量(以蒲式耳/英亩)的杂种玉米植物。

在一个实施例中,本发明提供包含选自下组的核酸分子的非天然杂种植物,该组由以下组成:SEQ ID NO:17-24或其片段、产量等位基因1-8或其互补体。

本发明还提供包含SM2987、SM2996、SM2982、SM2991、SM2995、SM2973、SM2980、或SM2984或其片段和互补体的等位基因的植物,以及包含选自下组的一个或多个耐旱性基因座的任何组合的任何植物,该组由以下组成:SEQ ID NO:17-24,其中所述耐旱性基因座与提高的耐旱性相关。此类等位基因可以是纯合的或杂合的。

在另一个实施例中,本发明提供向植物基因组中引入赋予所述植物提高的耐旱性或增加的产量的基因的方法。预期可以经由常规植物育种方法、转基因表达,经由突变(如甲磺酸乙酯(ESM))、或通过基因编辑方法(如TALEN、CRISPR、大范围核酸酶)等引入该基因。在一些实施例中,不受理论的限制,可以将包含以下表9中列出的任何一种或多种基因模型或SEQ ID NO 1-8的核苷酸序列引入植物的基因组中以产生与对照植物相比具有增加的产量和/或提高的耐旱性的植物。还考虑到可以同样地引入致病性等位基因以提高产量,其中致病性等位基因选自表1-7中列出的任一个的等位基因。

表9:对于在植物中提高的耐旱性和/或增加的产量的假定基因模型总结:

在一个实施例中,考虑了组合物和方法,该组合物和方法用于生产具有提高的耐旱性的植物,该植物可以使用如表1-7中所描述的任何分子标记来生产。例如,可以通过鉴定和/或选择与表1-7中显示的提高的耐旱性相关的等位基因来鉴定、选择或产生玉米植物。

在本发明的另一方面,通过将表9中的任何一个基因、或SEQ ID NO:1-8或其同源物/直系同源物可操作地连接至植物启动子(组成型或组织特异性),并在植物中表达所述基因可产生具有增加的对干旱的耐受性和/或增加的产量的转基因植物。例如,预期所述基因可以通过组成型表达或通过组织特异性/优选的表达来表达。不受实例限制,但预期可以将表达靶向例如玉米穗、茎、生殖组织、果实、种子或其他植物部分以产生具有增加的产量和/或耐旱性的转基因植物。

在下文本发明的描述中更详细地阐述本发明的这些方面和其他方面。

附图简要说明

图1是显示与对照(CK)植物相比,表达GRMZM2G027059(构建体23294)的转基因植物具有显著更多的总叶绿素的条形图。

图2是显示表达GRMZM2G156365 T的转基因植物显示增加的涉及果胶形成的糖(相对于对照增加的事件数据)的条形图。

图3是过表达GRMZM2G094428的转基因T1植物的代谢产物概况(右栏为野生型对照:该基因在拟南芥中的过表达减少了木质素形成的两个主要底物并增加了酯受体亚精胺)。

图4是过表达GRMZM2G416751的转基因T1植物的代谢产物概况(对照在右边;该基因在拟南芥中的过表达降低了葡萄糖醛酸酯、3-脱氧辛酮糖醛酸酯(3-deoxyoctulosonate)和芥子酸酯的表达)。

图5是显示与对照(CK)植物相比,表达GRMZM2G467169(构建体23403)的转基因植物具有显著更多的总叶绿素的条形图。

图6是显示表达GRMZM5G862107(构建体23292)的转基因植物与野生型对照相比在2个事件中HsfA2表达显著更高的条形图,表明在热胁迫耐受中可能的作用。

序列简述

本披露包括多个核苷酸和/或氨基酸序列。贯穿整个披露和随附的序列表中,采用WIPO标准ST.25(1998;以下称为“ST.25标准”)来鉴定核苷酸。该核苷酸鉴定标准总结如下:

WIPO标准ST.25中的核苷酸命名惯例

另外,无论是否特别指出,对于序列表中的“n”的每个叙述,应理解,任何个体“n”(包括连续n的序列中的一些或全部n)可以表示a、c、g、t/u、未知的或其他、或者可以不存在。因此,除非在序列表中有相反的具体定义,否则在一些实施例中“n”可以不代表核苷酸。

SEQ ID NO:1是位于染色体区间1和8内的Zm染色体1上的水优化基因GRMZM2G027059的cDNA的核苷酸序列;

SEQ ID NO:2是位于染色体区间4和9内的Zm染色体2上的水优化基因GRMZM2G156366的cDNA的核苷酸序列。

SEQ ID NO:3是位于染色体区间2和10内的Zm染色体3上的水优化基因GRMZM2G134234的cDNA的核苷酸序列。

SEQ ID NO:4是位于染色体区间2和11内的Zm染色体3上的水优化基因GRMZM2G094428的cDNA的核苷酸序列。

SEQ ID NO:5是位于染色体区间5和12内的Zm染色体5上的水优化基因GRMZM2G416751的cDNA的核苷酸序列。

SEQ ID NO:6是位于染色体区间6和13内的Zm染色体9上的水优化基因GRMZM2G467169的cDNA的核苷酸序列。

SEQ ID NO:7是位于染色体区间3和14内的Zm染色体9上的水优化基因GRMZM5G862107的cDNA的核苷酸序列。

SEQ ID NO:8是位于染色体区间7和15内的Zm染色体10上的水优化基因GRMZM2G050774的cDNA的核苷酸序列。

SEQ ID NO:9是水优化基因GRMZM2G027059的蛋白质序列。

SEQ ID NO:10是水优化基因GRMZM2G156365的蛋白质序列。

SEQ ID NO:11是水优化基因GRMZM2G134234的蛋白质序列。

SEQ ID NO:12是水优化基因GRMZM2G094428的蛋白质序列。

SEQ ID NO:13是水优化基因GRMZM2G416751的蛋白质序列。

SEQ ID NO:14是水优化基因GRMZM2G467169的蛋白质序列。

SEQ ID NO:15是水优化基因GRMZM5G862107的蛋白质序列。

SEQ ID NO:16是水优化基因GRMZM2G050774的蛋白质序列。

SEQ ID NO:17是水优化基因座SM2987相关的核苷酸序列,其子序列可以使用表8中列出的扩增引物使用聚合酶链式反应从玉蜀黍基因组的染色体1扩增。

SEQ ID NO:18是水优化基因座SM2991相关的核苷酸序列,其子序列可以使用表8中列出的扩增引物使用聚合酶链式反应从玉蜀黍基因组的染色体2扩增。

SEQ ID NO:19是水优化基因座SM2995相关的核苷酸序列,其子序列可以使用表8中列出的扩增引物使用聚合酶链式反应从玉蜀黍基因组的染色体3扩增。

SEQ ID NO:20是水优化基因座SM2996相关的核苷酸序列,其子序列可以使用表8中列出的扩增引物使用聚合酶链式反应从玉蜀黍基因组的染色体3扩增。

SEQ ID NO:21是水优化基因座SM2973相关的核苷酸序列,其子序列可以使用表8中列出的扩增引物使用聚合酶链式反应从玉蜀黍基因组的染色体5扩增。

SEQ ID NO:22是水优化基因座SM2980相关的核苷酸序列,其子序列可以使用表8中列出的扩增引物使用聚合酶链式反应从玉蜀黍基因组的染色体9扩增。

SEQ ID NO:23是水优化基因座SM2982相关的核苷酸序列,其子序列可以使用表8中列出的扩增引物使用聚合酶链式反应从玉蜀黍基因组的染色体9扩增。

SEQ ID NO:24是水优化基因座SM2984相关的核苷酸序列,其子序列可以使用表8中列出的扩增引物使用聚合酶链式反应从玉蜀黍基因组的染色体10扩增。

SEQ ID NO:25是用于扩增SM2987的引物

SEQ ID NO:26是用于扩增SM2987的引物

SEQ ID NO:27是用于SM2987的探针

SEQ ID NO:28是用于SM2987的探针

SEQ ID NO:29是用于扩增SM2991的引物

SEQ ID NO:30是用于扩增SM2991的引物

SEQ ID NO:31是用于SM2991的探针

SEQ ID NO:32是用于SM2991的探针

SEQ ID NO:33是用于扩增SM2995的引物

SEQ ID NO:34是用于扩增SM2995的引物

SEQ ID NO:35是用于SM2995的探针

SEQ ID NO:36是用于SM2995的探针

SEQ ID NO:37是用于扩增SM2996的引物

SEQ ID NO:38是用于扩增SM2996的引物

SEQ ID NO:39是用于SM2996的探针

SEQ ID NO:40是用于SM2996的探针

SEQ ID NO:41是用于扩增SM2973的引物

SEQ ID NO:42是用于扩增SM2973的引物

SEQ ID NO:43是用于SM2973的探针

SEQ ID NO:44是用于SM2973的探针

SEQ ID NO:45是用于扩增SM2980的引物

SEQ ID NO:46是用于扩增SM2980的引物

SEQ ID NO:47是用于SM2980的探针

SEQ ID NO:48是用于SM2980的探针

SEQ ID NO:49是用于扩增SM2982的引物

SEQ ID NO:50是用于扩增SM2982的引物

SEQ ID NO:51是用于SM2982的探针

SEQ ID NO:52是用于SM2982的探针

SEQ ID NO:53是用于扩增SM2984的引物

SEQ ID NO:54是用于扩增SM2984的引物

SEQ ID NO:55是用于SM2984的探针

SEQ ID NO:56是用于SM2984的探针

SEQ ID NO:57是与水优化基因座PZE01271951242玉米染色体1相关的核苷酸序列(272,937,470bp-272,938,270bp)(区间8)。

SEQ ID NO:58是与水优化基因座PZE0211924330玉米染色体2相关的核苷酸序列(12,023,306bp至12,024,104bp)(区间9)。

SEQ ID NO:59是与水优化基因座PZE03223368820玉米染色体3相关的核苷酸序列(225,037,202bp至225,038,002bp)(区间10)。

SEQ ID NO:60是与水优化基因座PZE03223703236玉米染色体3相关的核苷酸序列(225,340,531bp至225,341,331bp)(区间11)。

SEQ ID NO:61是与水优化基因座PZE05158466685玉米染色体5相关的核苷酸序列(159,120,801bp至159,121,601bp)(区间12)。

SEQ ID NO:62是与水优化基因座PZE0911973339玉米染色体9相关的核苷酸序列(12,104,536bp至12,105,336bp)(区间13)。

SEQ ID NO:63是与水优化基因座S_18791654玉米染色体9相关的核苷酸序列(从bp 225343590至225340433)(区间14)。

SEQ ID NO:64是与水优化基因座S_20808011玉米染色体9相关的核苷酸序列(从bp 14764415至14765098)(区间15)。

SEQ ID NO.65是与水优化基因座单倍型A相关的核苷酸序列。

SEQ ID NO.66是与水优化基因座单倍型B相关的核苷酸序列。

SEQ ID NO.67是与水优化基因座单倍型C相关的核苷酸序列。

SEQ ID NO.68是与水优化基因座单倍型D相关的核苷酸序列。

SEQ ID NO.69是与水优化基因座单倍型E相关的核苷酸序列。

SEQ ID NO.70是与水优化基因座单倍型F相关的核苷酸序列。

SEQ ID NO.71是与水优化基因座单倍型G相关的核苷酸序列。

SEQ ID NO.72是与水优化基因座单倍型H相关的核苷酸序列。

SEQ ID NO.73是与水优化基因座单倍型I相关的核苷酸序列。

SEQ ID NO.74是与水优化基因座单倍型J相关的核苷酸序列。

SEQ ID NO.75是与水优化基因座单倍型K相关的核苷酸序列。

SEQ ID NO.76是与水优化基因座单倍型L相关的核苷酸序列。

SEQ ID NO.77是与水优化基因座单倍型M相关的核苷酸序列。

具体实施方式

本披露的主题提供用于鉴定、选择、和/或生产具有提高的耐旱性(本文也称为水优化)的玉米植物的组合物和方法,以及通过本发明的方法鉴定、选择和/或生产的玉米植物。此外,本披露的主题提供了玉米植物和/或种质,该玉米植物和/或种质在其基因组内具有与提高的耐旱性相关的一种或多种标记。

为了评估干旱胁迫下染色体区间、基因座、基因或标记的值,在包含充分灌溉控制处理和有限灌溉处理的对照田间试验中筛选多种种质。充分灌溉处理的目标是确保水不会限制作物的生产率。相反,有限灌溉处理的目标是确保水成为粮食产量的主要限制性约束。当两种处理在田间相邻施用时,可以确定主效应(例如处理和基因型)和相互作用(例如基因型x处理)。此外,可以对小组中的每种基因型进行定量干旱相关的表型,从而允许进行标记性状关联。

在实践中,有限灌溉处理的方法可以取决于所筛选的种质、土壤类型和场所气候条件、季节前供水和应季供水(仅举几个变量)而大不相同。最初,确定应季降水量较低并适合种植的场所(以最小化意外施用水的机会)。此外,确定胁迫的时间可以很重要,因此定义目标以确保逐年或位置到位置的筛查一致性到位。也可以考虑对处理强度的理解,或者在某些情况下对有限灌溉处理所希望的产量损失的理解。选择太轻的处理强度可能无法揭示基因型变异。选择太重的处理强度会产生大的实验误差。一旦确定了胁迫的时机并描述了处理的强度,就可以按照与这些目标一致的方式来管理灌溉。对于本申请中生成的数据,使用了多年来已经进行了监测(包括天气趋势、土壤类型、营养水平等变量)的试验场地。这允许在检测表型和随后的基因型(增加的产量和/或耐旱性)中更大的效率。

本说明不旨在是一个本发明以其而实施的所有不同方式,或可以添加到本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以结合入其他实施例中,并且关于一个具体实施例所说明的特征可以从那个实施例删除。因此,本发明考虑了,在本发明的一些实施例中,可以排除或省略在此陈述的任何特征或特征的组合。此外,鉴于本披露内容,对在此建议的不同实施例的众多变体以及附加对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些具体实施例,并且并没有穷尽地叙述其所有排列、组合和变化。

除非另外定义,在此所使用的全部技术和科学术语具有与本发明所属领域的普通技术人员通常所理解的相同的意思。在此的本发明的说明中使用的术语仅仅是出于描述具体实施例的目的并且不旨在限制本发明。

在此引用的所有的公开、专利申请、专利以及其他参考文件对于引用中提及的有关句子和/或段落的传授内容通过引用以其全文结合在此。在此采用的技术的参考文献旨在参考本领域中通常理解的技术,包括对本领域的普通技术人员而言很清楚的那些技术的变化或等效技术的替换。

除非上下文另外表明,明确地预期的是在此所述的本发明的不同特征可以按任何组合使用。而且,本发明还考虑到在本发明的一些实施例中,在此所述的任何特征或特征的组合可以被排除或省略。举例说明,如果本说明书陈述组合物包含组分A、B和C,明确地预期A、B或C的任何一种或其组合可单一地或以任何组合被省略和放弃。

I.定义

虽然认为以下术语可以很好地为本领域的普通技术人员所理解,提出以下定义是为了便于解释本申请披露的主题。

除非另有定义,本文所使用的所有技术和科学术语旨在具有与本领域的普通技术人员通常所理解的相同的含义。在此采用的技术的参考文献旨在参考本领域中通常理解的技术,包括对本领域的普通技术人员而言很清楚的那些技术的变化或等效技术的替换。虽然认为以下术语可以很好地为本领域的普通技术人员所理解,提出以下定义是为了便于解释本申请披露的主题。

如在本发明的说明书和所附的权利要求中所使用的,单数形式“一个/一种(a/an)”和“该(the)”旨在也包括复数形式,除非上下文清楚地另外表明。

如本文所使用的,“和/或”是指并且涵盖一个或多个相关的列出项的任何及全部可能组合,连同当以可替代性(“或”)解释时组合的缺少。

除非另外指明,本说明书和权利要求书中使用的表示成分的量、反应条件等的所有数字应被理解为在所有情况下用术语“约”来修饰。如本文所使用的,术语“约”,当指代可测量的值例如质量、重量、时间、体积、浓度或百分比的量时,意味着涵盖在一些实施例中与规定量相比±20%的变化、在一些实施例中与规定量相比±10%的变化、在一些实施例中与规定量相比±5%的变化、在一些实施例中与规定量相比±1%的变化、在一些实施例中与规定量相比±0.5%的变化、以及在一些实施例中与规定量相比±0.1%的变化,因为此类变化适合于执行所披露的方法。因此,除非相反地指出,在本说明书和所附权利要求书中所列出的数值参数是可以取决于试图通过本申请披露的主题获得的期望特性而变化的近似值。

如本文所使用的,短语如“在X和Y之间”与“在约X和Y之间”应解释为包括X和Y。如本文所使用的,短语如“在约X和Y之间”是指“在约X和约Y”之间,并且短语如“从约X至Y”是指“从约X至约Y”。

如本文所使用的,术语“包括(comprise、comprises和comprising)”指示所说明的特征、整数、步骤、操作、要素、和/或组分的存在,但并不排除一个或多个其他特征、整数、步骤、操作、要素、组分、和/或其组的存在或添加。

如本文所使用的,过渡短语“基本上由......组成”是指一项权利要求的范围将被解释为包括该权利要求中所提到的指定材料或步骤以及不实质上影响要求保护的发明的一个或多个基本特征和新特征的那些材料或步骤。因此,当用于本发明的权利要求中时,术语“基本上由......组成”并不意在被解释为等同于“包括(comprising)”。

如本文所使用的,术语“等位基因”是指在特定染色体基因座处出现的两个或更多个不同核苷酸或核苷酸序列中的一个。

如本文所使用的,术语“开花吐丝间隔(anthesis silk interval)”(ASI)是指当植物开始脱落花粉(开花)和到当其开始生产丝(雌蕊)之间的差异。数据是以每块地为基础收集的。在一些实施例中,此区间以天表示。

“基因座”是基因或标记或等位基因所在的染色体上的位置。在一些实施例中,基因座可以涵盖一个或多个核苷酸。

如本文所使用的,术语“所希望的等位基因”、“靶等位基因”、“致病性等位基因”和/或“目的等位基因”互换地使用是指与所希望的性状相关的等位基因(例如,表1-7中列出的任何等位基因或与其紧密相关的等位基因)。

如本文所使用的,短语“与......相关”是指两个实体之间的可识别和/或可测定的关系。例如,短语“与水优化性状相关的”是指性状、基因座、基因、等位基因、标记、表型等,或其表达,其存在或不存在可影响范围、程度和/或比率(在该范围、程度和/或比率上,具有水优化性状的植物或其目的部分生长)。因此,当标记与性状连锁并且当标记的存在指示了期望的性状或性状形式是否会和/或会以什么程度发生在包含标记的植物/种质中时,则所述标记与所述性状“相关”。类似地,当标记与等位基因连锁并且当标记的存在指示了等位基因是否存在于包含标记的植物/种质中时,则所述标记与所述等位基因“相关”。例如,“与提高的耐旱性相关的标记”是指标记,该标记的存在或不存在可以用于预测植物是否会和/或将在何种程度上展现耐旱性表型(例如,表1-7中鉴定的标记均与干旱和非干旱条件下玉米产量增加密切相关)。

如本文所使用的,术语“回交(backcross)”和“使回交(backcrossing)”是指如下方法,凭借该方法将子代植物与其亲本之一回交一次或多次(例如1、2、3、4、5、6、7、8、9、10或更多次)。在回交方案中,“供体”亲本是指具有待基因渗入的所期望的等位基因或基因座的亲本植物。“受体”亲本(使用一次或多次)或“轮回”亲本(使用两次或更多次)是指基因或基因座被基因渗入其中的亲本植物。例如,参见Ragot,M.等人,Marker-assisted Backcrossing:A Practical Example,in Techniques et Utilisations des Marqueurs Moleculaires Les Colloques[标记辅助回交:实践范例,分子标记技术和应用专题讨论会]第72卷,第45-56页(1995);以及Openshaw等人,Marker-assisted Selection in Backcross Breeding,in Proceedings of the Symposium“Analysis of Molecular Marker Data,”[回交育种中的标记辅助选择,专题讨论会会议记录“分子标记数据分析”],第41-43页(1994)。初始杂交产生F1代。术语“BC1”是指第二次使用轮回亲本,“BC2”是指第三次使用轮回亲本,以此类推。在一些实施例中,回交的次数可以是约1至约10(例如1、2、3、4、5、6、7、8、9、和10)。在一些实施例中,回交的次数为约7。

如本文所使用的,术语“杂交(cross)”或“经杂交的(crossed)”是指通过授粉融合配子以产生子代(例如,细胞、种子或植物)。该术语包括有性杂交(一个植物由另一个授粉)和自交(自花授粉,例如当花粉和胚珠是来自相同的植物时)两者。术语“使杂交(crossing)”是指通过授粉使配子融合以产生子代的行为。

如本文所使用的,术语“栽培品种”和“品种”是指可以通过结构或遗传特点和/或表现与相同物种内的其他品种区别开的一组相似的植物。

如本文所用,术语“优良”和/或“优良品系”是指基本上纯合并且是针对所希望的农艺表现的育种和选择而产生的任何系。

如本文所使用的,术语“外来的”、“外来的品系”和“外来的种质”是指不是优良的任何植物、品系或种质。通常,外来的植物/种质不是来源于任何已知的优良植物或种质,而是选择的以将一个或多个所希望的遗传元件引入育种程序(例如,将新颖的等位基因引入育种程序中)。

“对照”或“对照植物”或“对照植物细胞”提供了用于测量主题植物或植物细胞的表型的变化的一个参考点。对照植物或植物细胞可以包含例如:(a)野生型植物或细胞,即与用于导致主题植物或细胞的遗传改变(例如,基因渗入)的起始材料具有相同的基因型;(b)植物或植物细胞,其与起始材料具有相同基因型但已经用无效构建体(即,用不表达如本文描述的转移细胞特异性蛋白质和糖转运蛋白的构建体)转化;(c)植物或植物细胞,其是主题植物或植物细胞的子代中的非转化的分离子;或(d)在大多数方面与主题植物或植物细胞基本相同的植物,然而在基因型(特别是具有插入/缺失的SNP单倍型)方面不同(例如在特定染色体位置处具有不利等位基因的玉米对照植物比在相同位置具有有利等位基因的主题(实验)玉米植物)。

如本文所使用的,术语“染色体”以在细胞核中自我复制遗传结构的其本领域公认的含义使用,该细胞核含有细胞DNA,并在其核苷酸序列中携带线性阵列的基因。本文披露的玉蜀黍染色体数量是指在Perin等人,2002中列出的那些,其涉及由L′institut National da Ia Recherché Agronomique(INRA;法国巴黎)采用的参考命名系统。

如本文所使用的,短语“共有序列”是指构建用于鉴定基因座上等位基因中的核苷酸差异(例如,SNP和Indel多态性)的DNA序列。共有序列可以是基因座处的任一条DNA链,并且表示基因座中一个或多个位置(例如,在一个或多个SNP处和/或在一个或多个Indel处)的一个或多个核苷酸。在一些实施例中,使用共有序列来设计用于检测基因座中的多态性的寡核苷酸和探针。

“遗传图谱”是对给定物种内的一个或多个染色体上的基因座之间的遗传连锁关系的描述,通常以图表或表格形式描绘。对于每个遗传图谱,基因座之间的距离是通过它们之间的重组频率来测量的。基因座之间的重组可以使用各种标记来检测。遗传图谱是作图群体、所用标记的类型以及不同群体之间每个标记的多态性潜力的产物。一个遗传图谱与另一个遗传图谱的基因座之间的顺序和遗传距离可以不同。

如本文所使用的,术语“基因型”是指与可观察到的和/或可检测的和/或所表现的性状(表型)形成对照,在一个或多个遗传基因座处的个体(或个体组)的遗传组成。基因型由个体遗传自其亲本的一个或多个已知基因座的一个或多个等位基因定义。术语基因型可以用来指单一基因座处、多个基因座处的个体的遗传组成,或者更普遍地,术语基因型可以用来指其基因组中所有基因的个体遗传构成。可以例如使用标记来间接表征基因型和/或通过例如核酸测序来直接表征基因型。

如本文所使用的,术语“种质”是指属于或来自个体(例如,植物)、个体群体(例如,植物品系、品种或家族)、或来源于品系、品种、物种或培养物的克隆的遗传物质。种质可以是生物体或细胞的部分,或可以从该生物或细胞中分离。一般而言,种质提供了具有特定的遗传构成的遗传物质,所述特定的遗传构成为生物体或细胞培养物的某些或全部遗传品质提供基础。如本文所使用的,种质包括可以从中生长新植物的细胞、种子或组织,以及可以培养成完整植物的植物部分(例如,叶、茎、芽、根、花粉、细胞等)。在一些实施例中,种质包括但不限于组织培养物。

“单倍型”是多个遗传基因座处个体的基因型,即等位基因的组合。典型地,定义单倍型的遗传基因座在物理和遗传上是连锁的,即在同一染色体区段上。术语“单倍型”可以指特定基因座(如单个标记物基因座)处的多态性,或沿着染色体片段在多个基因座处的多态性(例如单倍型可以由表1、2、3、4、5、6、或7中分别列出的至少两个等位基因的任何组合组成)。

如本文所使用的,术语“杂合的”是指如下遗传状态,其中不同的等位基因位于同源染色体上的相应基因座处。在一些实施例中,玉米亲本品系或子代植物对于任何一个产量等位基因1-7是杂合的。

如本文所使用的,术语“纯合的”是指如下遗传状态,其中相同的等位基因位于同源染色体上的相应基因座处。在一些实施例中,玉米亲本品系或子代植物对于任何一个产量等位基因1-7是纯合的。

如本文所使用的,在植物育种的上下文中使用的术语“杂种”是指通过杂交不同品系或品种或物种的植物而产生的遗传上不同的亲本的后代的植物,包括但不限于两个近交系之间的杂交。

如本文所使用的,术语“近交”是指基本上纯合的植物或种类。术语可以是指在整个基因组中基本上纯合的植物或植物种类,或者相对于特别感兴趣的基因组部分是基本上纯合的植物或植物品种。

如本文所使用的,术语“基因渗入(introgression)”、“使基因渗入(introgressing)”和“经基因渗入的(introgressed)”是指使一个或多个遗传基因座的所期望的等位基因或所期望的等位基因的组合从一个遗传背景到另一个遗传背景的自然和人工传送。例如,可以通过相同物种的两个亲本之间的有性杂交将指定基因座处的所期望的等位基因传送给至少一个子代,其中所述亲本中的至少一个在其基因组内具有该所期望的等位基因。可替代地,例如,等位基因的传送可以通过两个供体基因组之间的重组而发生,例如在融合的原生质体中,其中至少一个供体原生质体在其基因组中具有所期望的等位基因。所期望的等位基因可以是标记的经选择的等位基因、QTL、转基因等。包含所期望的等位基因的后代可以与具有所期望的遗传背景的品系回交一次或多次(例如1、2、3、4、5、6、7、8、9、10或更多次),选择所期望的等位基因,其结果是该所期望的等位基因在所期望的遗传背景中变得固定。例如,与干旱耐受性相关的标记(例如表1-7中显示的任何标记)可以从供体基因渗入到干旱易感的轮回亲本中。然后可以使得到的后代回交一次或多次并进行选择,直到子代包含与该轮回亲本背景中的耐旱性相关的一种或多种遗传标记。

如本文所使用的,术语“连锁”是指如果它们的传递是独立的,则相同染色体上的等位基因倾向于比偶然预期更频繁地传递的现象。因此,当他们在下一代中彼此分离时,在相同染色体上的两个等位基因被称为“连锁”,在一些实施例中小于50%的时间、在一些实施例中小于25%的时间、在一些实施例中小于20%的时间、在一些实施例中小于15%的时间、在一些实施例中小于10%的时间、在一些实施例中小于9%的时间、在一些实施例中小于8%的时间、在一些实施例中小于7%的时间、在一些实施例中小于6%的时间、在一些实施例中小于5%的时间、在一些实施例中小于4%的时间、在一些实施例中小于3%的时间、在一些实施例中小于2%的时间、以及在一些实施例中小于1%的时间。

因此,“连锁”典型地意味着并且也可以指染色体上的物理邻近性。因此,如果两个基因座彼此在一些实施方案中在20厘摩(cM),在一些实施方案中15cM,在一些实施方案中12cM,在一些实施方案中10cM,在一些实施方案中9cM,在一些实施方案中8cM,在一些实施方案中7cM,在一些实施方案中6cM,在一些实施方案中5cM,在一些实施方案中4cM,在一些实施方案中3cM,在一些实施方案中2cM并且在一些实施方案中1cM之内,则它们是连锁的。同样,在一些实施方案中,如果本披露主题的产量基因座(例如,产量等位基因1-8)与标记(例如,遗传标记)在20cM、15cM、12cM、10cM、9cM、8cM、7cM、6cM、5cM、4cM、3cM、2cM或1cM之内,那么该基因座与该标记是连锁的。因此,可以利用与产量等位基因1-8中的任一个连锁的标记来选择、鉴定或产生对干旱具有提高的耐受性和/或增加的产量的玉米植物。

在本披露的主题的一些实施例中,限定连锁的包括范围(例如,从约10cM和约20cM、从约10cM和约30cM、或从约10cM和约40cM)是有利的。标记与第二基因座(例如产量等位基因1-8)的连锁越紧密,标记对第二基因座的指示效果越好。因此,“紧密连锁的”或可互换地“紧密相关的”基因座或标记(如标记基因座和第二基因座)展示约10%、9%、8%、7%、6%、5%、4%、3%、或2%或更少的基因座间重组频率。在一些实施例中,相关的基因座展示约1%或更少(例如,约0.75%、0.5%、0.25%或更少)的重组频率。定位于相同染色体并且具有使得两个基因座之间的重组以小于约10%(例如,约9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、或0.25%或更少)的频率发生的距离的所述两个基因座也可被认为是彼此“邻近的”。因为一个cM是显示1%的重组频率的两个标记之间的距离,因此任何标记与紧密相邻(例如,以等于或小于约10cM的距离)的任何其他标记紧密连锁(遗传上和物理上)。在同一染色体上的两个紧密连锁的标记可以相互定位为约9cM、8cM、7cM、6cM、5cM、4cM、3cM、2cM、1cM、0.75cM、0.5cM或0.25cM或更少。厘摩(“cM”)或遗传图谱单位(m.u.)是重组频率的度量单位,并且定义为如下基因之间的距离,对所述基因而言,100个减数分裂产物中的一个是重组的。一个cM等于有1%的机会,一个遗传基因座处的标记会由于单代中的交换而与第二基因座处的标记分离。因此,1%的重组频率(RF)相当于1m.u.。

如本文所使用的,短语“连锁群”是指位于同一染色体上的所有基因或遗传性状。在连锁群中,足够接近的那些基因座可以在遗传杂交中显示出连锁。由于交换的概率随着染色体上的基因座之间的物理距离而增加,所以在连锁群中定位彼此远离的基因座在直接基因测试中可以不表现出任何可检测的连锁。术语“连锁群”主要用于指如下遗传基因座,其在尚未进行染色体定位的遗传系统中展示出连锁行为。因此,在本文中,术语“连锁群”与染色体的物理实体同义,尽管本领域普通技术人员将理解,连锁群还可以被定义为对应于给定的染色体的区域(即少于整体)或例如如本文所定义的区间1-15中的任一个。

如本文所使用的,术语“连锁不平衡”或“LD”是指遗传基因座或性状(或两者)的非随机分离。在任一情况下,连锁不平衡意味着相关的基因座沿着一段染色体在物理上足够接近,以便它们以高于随机(即非随机)的频率一起分离(在共分离的性状的情况下,控制这些性状的基因座彼此足够接近)。显示连锁不平衡的标记被认为是连锁的。连锁的基因座超过50%的时间(例如从约51%至约100%的时间)进行共分离。换句话说,共分离的两个标记具有小于50%(并且根据定义,在相同染色体上分离小于50cM)的重组频率。如本文所使用的,连锁可以存在于两个标记之间,或可替代地,标记和表型之间。标记基因座可以与性状(如耐旱性)“相关联”(连锁)。例如,遗传标记与表型性状的连锁程度被测量为例如该标记与该表型共分离的统计概率。

连锁不平衡最常见地用量度r2评估,该量度r2使用以下文献中的公式计算:Hill和Robertson,Theor.Appl.Genet.[理论和应用遗传学]38:226(1968)。当r2=1时,两个标记基因座间存在完全的连锁不平衡,意味着所述标记还未进行重组分离并且具有相同的等位基因频率。r2大于1/3的值表明足够强的连锁不平衡对于作图是有用的。Ardlie等人,Nature Reviews Genetics[遗传学自然评论]3:299(2002)。因此,当成对标记基因座间的r2值大于或等于约0.33、0.4、0.5、0.6、0.7、0.8、0.9、或1.0时,等位基因处于连锁不平衡。

如本文所使用的,术语“连锁平衡”描述其中两个标记独立地分离的情况,即,在后代中随机分配。显示连锁平衡的标记被认为是不连锁的(无论它们是否位于相同染色体上)。

如本文所使用的,术语“标记”、“遗传标记”、“核酸标记”和“分子标记”可互换使用,是指其遗传可以被监测的染色体上的可识别位置和/或在用于可视化核酸序列(存在于染色体上的这种可识别的位置上)的差异的方法中使用的试剂。因此,在一些实施方案中,一个标记包括一条已知的或可检测的核酸序列。标记的实例包括但不限于:遗传标记、蛋白组成、肽水平、蛋白水平、油组成、油水平、碳水化合物组成、碳水化合物水平、脂肪酸组成、脂肪酸水平、氨基酸组成、氨基酸水平、生物聚合物、淀粉组成、淀粉水平、可发酵淀粉、发酵产量、发酵效率(例如,在24小时、48小时和/或72小时作为消化率捕获)、能量产量、次要化合物、代谢产物、形态特征和农艺特征。如此,标记可以包含已经与等位基因或目的等位基因相关的核苷酸序列,并且该核苷酸序列指示在细胞或生物体中存在或不存在目的等位基因或目的等位基因,和/或用于在可识别的一个或多个位置处可视化核苷酸序列中的差异的试剂。标记可以是但不限于等位基因、基因、单倍型、限制性片段长度多态性(RFLP)、简单重复序列(SSR)、随机扩增多态性DNA(RAPD)、酶切扩增多态性序列(CAPS)(Rafalski和Tingey,Trends in Genetics[遗传学趋势]9:275(1993))、扩增片段长度多态性(AFLP)(Vos等人,Nucleic Acids Res.[核酸研究]23:4407(1995))、单核苷酸多态性(SNP)(Brookes,Gene[基因]234:177(1993))、序列特征性扩增区域(SCAR)(Paran和Michelmore,Theor.Appl.Genet.[理论与应用遗传学]85:985(1993))、序列标签位点(STS)(Onozaki等人,Euphytica[荷兰植物育种杂志]138:255(2004))、单链构象多态性(SSCP)(Orita等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2766(1989))、简单重复序列区间(ISSR)(Blair等人,Theor.Appl.Genet.[理论与应用遗传学]98:780(1999))、逆转座子间扩增多态性(IRAP)、逆转座子微卫星扩增多态性(REMAP)(Kalendar等人,Theor.Appl.Genet.[理论与应用遗传学]98:704(1999))、或RNA切割产物(例如Lynx标签)。标记可以存在于基因组核酸或表达的核酸(例如EST)中。术语标记还可以指用作根据本领域熟知的方法用于扩增、杂交和/或检测核酸分子的用作探针或引物(例如引物对)的核酸。大量的玉米分子标记是本领域已知的,并且可以从各种来源(例如玉米GDB互联网资源和由亚利桑那大学运行的亚利桑那基因组学研究所互联网资源)公布或可获得。

在一些实施例中,通过用一个或多个寡核苷酸扩增玉蜀黍核酸,例如,通过聚合酶链式反应(PCR)产生相应于扩增产物的标记。如本文中使用的,在标记的上下文中,短语“对应于扩增产物”是指这样的标记,该标记具有与通过用一组具体寡核苷酸扩增玉蜀黍基因组DNA产生的扩增产物(允许通过自身扩增反应引入突变和/或天然存在的和/或人工等位基因差异)相同的核苷酸序列。在一些实施例中,该扩增是通过PCR进行的,并且这些寡核苷酸是PCR引物,这些PCR引物被设计为与玉蜀黍基因组DNA的相反链杂交,以便扩增存在于序列(PCR引物在基因组DNA中杂交至这些序列)之间的玉蜀黍基因组DNA序列。使用这样的引物安排、从一轮或多轮扩增得到的扩增片段是双链核酸,其中的一条链具有包含以5′到3′顺序的、这些引物之一的序列的核苷酸序列,该玉蜀黍基因组DNA序列位于这些引物之间,并且是该第二引物的反向互补序列。典型地,“正向”引物被指定为具有与待扩增的双链核酸的(任意分配的)“顶部”链的子序列相同序列的引物,使得扩增片段的“顶部”链包含核苷酸序列,也就是说,在5′到3′方向上等同于如下序列:正向引物-位于基因组片段的顶部链的正向引物和反向引物之间的序列-反向引物的反向互补序列。因此,“对应于”扩增片段的标记是与扩增片段的一条链具有相同序列的标记。

可以通过本领域中公认的方法检测对应于群体成员之间的遗传多态性的标记。这些方法包括,例如核酸序列、杂交方法、扩增方法(例如基于PCR的序列特异性扩增方法、)限制性片段长度多态性检测(RFLP)、同功酶标记检测、通过等位基因特异性杂交(ASH)进行的多核苷酸多态性检测、植物基因组的扩增可变序列检测、自主序列复制检测、简单重复序列检测(SSR)、单核苷酸多态性检测(SNP)、和/或扩增片段长度多态性检测(AFLP)。已知公认的方法也用于检测表达的序列标签(EST)和衍生自EST序列的SSR标记,以及随机扩增多态性DNA(RAPD)。

如本文所使用的,短语“标记测定”是指使用特定方法检测特定基因座处的多态性的方法,该方法例如但不限于测量至少一种表型(例如种子颜色、油含量或视觉上可检测的性状);基于核酸的测定,包括但不限于限制性片段长度多态性(RFLP)、单个碱基延伸、电泳、序列比对、等位基因特异性寡核苷酸杂交(ASO)、随机扩增多态性DNA(RAPD)、基于微阵列的技术、测定、测定分析、核酸测序技术;肽和/或多肽分析;或可用于检测感兴趣基因座处生物体中多态性的任何其他技术。因此,在本发明的一些实施例中,通过例如扩增反应(如聚合酶链式反应(PCR))用两个寡核苷酸引物通过扩增玉蜀黍核酸来检测标记。

“标记等位基因”、“等位基因”也描述为“标记基因座的等位基因”,可以指在群体中对标记基因座而言是多态性的该标记基因座处发现的多个多态性核苷酸序列中的一个。

“标记辅助选择”(MAS)是基于标记基因型选择表型的方法。标记辅助选择包括使用标记基因型来鉴定包含在育种程序或种植中和/或从其中移除的植物。

“标记辅助反选择”是借以使用标记基因型鉴定将不被选择的植物的方法,使得所述植物从育种程序或种植中去除。因此,玉米植物育种计划可以使用表1-7中列出的任何信息进行标记辅助的反选,以消除不具有提高的耐旱性的玉米品系或种质。

如本文所使用的,术语“标记基因座(marker locus、marker loci)”、“基因座(locus、loci)”是指在其中可以找到一个或多个特异性标记的生物基因组中的一个或多个特定染色体定位。标记基因座可用于追踪第二连锁基因座(例如编码或有助于表型性状表达的连锁基因座)的存在。例如,标记基因座可以用来监测在基因座(如QTL或单一基因)处的等位基因的分离,这些等位基因遗传地或物理地连锁至该标记基因座上。

如本文所使用的,术语“探针”或“分子探针”是指将在靶核酸序列分析物或其cDNA衍生物中与互补序列形成氢键合双链体的单链寡核苷酸序列。因此,“标记探针”和“探针”是指可用于检测标记基因座内一个或多个特定等位基因的存在的核苷酸序列或核酸分子(例如,通过核酸杂交与该标记或标记基因座中的所有或部分互补的核酸探针)。包含约8、10、15、20、30、40、50、60、70、80、90、100或更多个连续核苷酸的标记探针可用于核酸杂交。可替代地,在某些方面,标记探针是指能够区别(即基因分型)存在于标记基因座处的特定等位基因的任何类型的探针。本发明的探针的非限制性实例包括SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:31、SEQ ID NO:32、SEQ ID NO:35、SEQ ID NO:36、SEQ ID NO:39、SEQ ID NO:40、SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:47、SEQ ID NO:48、SEQ ID NO:51、SEQ ID NO:52、SEQ ID NO:55、和/或SEQ ID NO:56、以及表1-7中发现的序列。

如本文所使用的,当鉴定连锁基因座时,术语“分子标记”可以用于指如上文所定义的遗传标记,或其用作参照点的编码产物(例如,蛋白质)。分子标记能够源自基因组核苷酸序列或表达的核苷酸序列(例如来自剪接的RNA、cDNA等)。该术语也指与标记序列互补或与其侧接的核苷酸序列,如用作能够扩增该标记序列的探针或引物的核苷酸序列。例如根据沃森-克里克碱基配对原则,当核苷酸序列在溶液中特异性杂交时,所述核苷酸序列是“互补的”。当位于indel区域上时,本文所述的标记中的一些也称为杂交标记。这是因为,根据定义,该插入区域是关于不具有该插入的植物的多态性。因此,该标记仅需要指示该indel区域是否存在。任何合适的标记检测技术(例如SNP检测技术)都可以用于鉴定这种杂交标记。

如本文所使用的,术语“引物”是指当置于诱导合成引物延伸产物的条件(例如在核苷酸和用于聚合的试剂(如DNA聚合酶)的存在下并且在合适的温度和pH)下时能够退火至核酸靶并用作DNA合成的启动点的寡核苷酸。为了在延伸和/或扩增中获得最大效率,在一些实施例中,引物(在一些实施例中是延伸引物,并且在一些实施例中是扩增引物)是单链的。在一些实施例中,引物是寡脱氧核苷酸。引物通常足够长以在用于聚合的试剂存在下引发延伸和/或扩增产物的合成。引物的最小长度可以取决于许多因素,包括但不限于该引物的温度和组成(A/T对比G/C含量)。在扩增引物的情况下,这些扩增引物通常作为由一个正向和一个反向引物组成的一对双向引物提供,或作为DNA扩增领域中(例如在PCR扩增中)常用的一对正向引物提供。如此,应该理解的是,如本文所使用的术语“引物”可以指超过一种引物,特别是在关于待扩增的靶区域的一个或多个末端序列的信息中存在一些歧义的情况下。因此,“引物”可以包括含有代表该序列中的可能变异的序列的引物寡核苷酸的集合,或包括允许典型的碱基配对的核苷酸。

可以通过任何合适的方法来制备引物。用于制备特异性序列的寡核苷酸的方法是本领域已知的,并且包括例如适当的序列的克隆和限制以及直接化学合成。化学合成方法可以包括例如美国专利号4,458,066中披露的磷酸二酯或三酯法、二乙基氨基磷酸酯法和固相支持体法。若需要,可以通过并入可检测部分,例如光谱部分、荧光部分、光化学部分、生物化学部分、免疫化学部分或化学部分来标记引物。

本发明的引物的非限制性实例包括SEQ ID NO:25、SEQ ID NO:26、SEQ ID NO:29、SEQ ID NO:30、SEQ ID NO:33、SEQ ID NO:34、SEQ ID NO:37、SEQ ID NO:38、SEQ ID NO:41、SEQ ID NO:42、SEQ ID NO:45、SEQ ID NO:46、SEQ ID NO:49、SEQ ID NO:50、SEQ ID NO:53、和/或SEQ ID NO:54。PCR方法在手册中已经很好地描述,并且是本领域技术人员已知的。通过PCR扩增后,可以通过与探针多核苷酸杂交来检测靶多核苷酸,所述探针多核苷酸在严格至中度严格的杂交和洗涤条件下与靶序列形成稳定的杂交体。如果预期探针与靶序列基本上完全互补(即,约99%或更多),则可以使用严格条件。如果预期有一些错配,例如如果预期变体品种会导致探针不完全互补,则可以降低杂交的严格性。在一些实施例中,选择条件以排除非特异性/偶然结合。影响杂交的条件和针对非特异性结合选择的条件是本领域已知的,并且描述于例如Sambrook和Russell(2001)中。Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册],第三版,冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),冷泉港实验室,纽约,美国。通常,较低的盐浓度和较高温度的杂交和/或洗涤增加了杂交条件的严格性。

具有同源性的不同核苷酸序列或多肽序列在本文中称作“同源物”或“同系物”。术语同源物包括来自相同物种和其他物种的同源序列以及来自相同物种和其他物种的直向同源序列。“同源性”指两个或更多个核苷酸序列和/或氨基酸序列之间就位置同一性百分数而言的相似性水平(即,序列相似性或同一性)。同源性还指不同核酸、氨基酸、和/或蛋白质之间相似功能特性的概念。

如本文所使用的,短语“核苷酸序列同源性”是指两个多核苷酸之间同源性的存在。当进行比对以获得最大对应时,如果在这两个序列中的核苷酸的序列是相同的,那么多核苷酸具有“同源的”序列。多核苷酸的“序列同源性的百分比”,如50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%序列同源性,可以在比较窗口(例如,约20至200个连续核苷酸)上通过比较两个最佳比对的序列来确定,其中为了两个序列的最佳比对,与参考序列相比,在比较窗口中的多核苷酸序列的部分可以包括添加或缺失(即,空位)。可以通过已知算法的计算机化实施方式或者通过目视检查进行用于比较的序列的最佳比对。易于获得的序列比较以及多重序列比对的算法分别是基本局部比对搜索工具(BLAST;Altschul等人,(1990)J Mol Biol[分子生物学杂志]215:403-10;Altschul等人,(1997)Nucleic Acids Res[核酸研究]25:3389-3402)和ClustalX(Chenna等人,(2003)Nucleic Acids Res[核酸研究]31:3497-3500)程序,两者都可在因特网上获得。其他合适的程序包括但不限于,GAP、BestFit、PlotSimilarity以及FASTA,它们是Accelrys GCG软件包的一部分,可以从美国加利福尼亚州圣地亚哥的Accelrys软件公司获得。

如本文所使用的,“序列同一性”指两个最佳比对的多核苷酸序列或多肽序列在组分(例如核苷酸或氨基酸)的整个比对窗口范围内不变的程度。可以通过已知方法轻易地计算“一致性”,所述方法包括但不限于在以下文献中描述的那些:Computational Molecular Biology[计算分子生物学](Lesk,A.M.编辑)牛津大学出版社,纽约(1988);Biocomputing:Informatics and Genome Projects[生物运算:信息学和基因组项目](Smith,D.W.编辑)学术出版社,纽约(1993);Computer Analysis of Sequence Data,Part I[序列数据的计算机分析,第I部分](Griffin,A.M.和Griffin,H.G.编辑)胡马纳出版社,新泽西州(1994);Sequence Analysis in Molecular Biology[分子生物学中的序列分析](von Heinje,G.编辑)学术出版社(1987);以及Sequence Analysis Primer[序列分析引物](Gribskov,M.和Devereux,J.编辑)斯托克顿出版社,纽约(1991)。

如本文所使用的,术语“基本上一致的”意指两个核苷酸序列具有至少约50%、60%、70%、75%、80%、85%、90%或95%的序列同一性。在一些实施例中,两个核苷酸序列可以具有至少约75%、80%、85%、90%、95%或100%的序列同一性,以及其中的任何范围或值。在代表性实施例中,两个核苷酸序列可以具有至少约95%、96%、97%、98%、99%或100%的序列同一性,以及其中的任何范围或值。

测试序列和参考序列的已比对区段的“一致性分数”是由两个已比对序列所共有的相同组分的数目除以参考序列区段(即,完整的参考序列或参考序列的更小限定部分)中组分的总数目。序列同一性百分比被表示为同一性分数乘以100。如本文所使用的,术语“序列同一性百分数”或“同一性百分数”指在最佳比对两个序列时(在比较窗口范围内存在总计少于参考序列的20%的适宜核苷酸插入、缺失或空位),与测试(“主题”)多核苷酸分子(或其互补链)相比,参考(“查询”)多核苷酸分子(或其互补链)的线状多核苷酸序列中的相同核苷酸的百分数。在一些实施例中,“同一性百分比”可以是指氨基酸序列中相同的氨基酸的百分比。

用于比对比较窗口的最佳序列比对是本领域技术人员所熟知的并且可以由以下工具实施:如Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法,并且任选地由这些算法的计算机化实现方式来实施,如作为Wisconsin(Accelrys公司,伯灵顿,马萨诸塞州)的部分可获得的GAP、BESTFIT、FASTA和TFASTA。一个或多个多核苷酸序列的比较可以是相对于全长多核苷酸序列或其一部分,或相对于较长的多核苷酸序列。出于本发明的目的,也可以使用针对翻译的核苷酸序列的2.0版BLASTX和针对多核苷酸序列的2.0版BLASTN测定“同一性百分比”。

可以使用Sequence Analysis Software PackageTM(版本10;遗传计算机集团公司(Genetics Computer Group,Inc),麦迪逊,威斯康辛州)的“Best Fit”或“Gap”程序确定序列同一性百分比。“Gap”使用Needleman和Wunsch的算法(Needleman和Wunschc,J Mol.Biol.[分子生物学杂志]48:443-453,1970)来找到使匹配数最大化并使空位数最小化的两个序列的比对。“BestFit”执行两个序列之间最佳相似性区段的最佳比对并且使用Smith和Waterman的局部同源性算法插入空位以使匹配数最大化(Smith和Waterman,Adv.Appl.Math.[应用数学进展],2:482-489,1981;Smith等人,Nucleic Acids Res.[核酸研究]11:2205-2220,1983)。

用于确定序列同一性的可用方法也在如下文献中披露:Guide toHuge Computers[巨型计算机指南](Martin J.Bishop编著,学术出版社,圣地亚哥(1994)),和Carillo等人(Applied Math[应用数学]48:1073(1988))。更具体地,优选的用于确定序列同一性的计算机程序包括但不限于:公共可获得的来自国家生物技术信息中心(National Center Biotechnology Information,NCBI)的基本局部比对搜索工具(BLAST)程序,NCBI是在美国国立卫生研究院(贝塞斯达,马里兰州,20894)的国家医学库中;参见BLAST手册,Altschul等人,NCBI,NLM,NIH;(Altschul等人,J.Mol.Biol.[分子生物学杂志]215:403-410(1990));2.0版本或更高版本的BLAST程序允许缺口(缺失和插入)引入比对中;对于肽序列可以使用BLASTX来确定序列同一性;并且对于多核苷酸序列,可以使用BLASTN来确定序列同一性。

“杂种优势群”包含当与来自不同杂种优势群的基因型杂交时表现良好的一组基因型。Hallauer等人,玉米育种(Corn breeding),在CORN AND CORN IMPROVEMENT[玉米和玉米改良]第463-564页(1998)。近交系分为杂交体优势组,并根据几个标准(如谱系、基于分子标记的关联和杂交体组合中的表现)进一步细分为杂交体优势组中的家族(Smith等人,Theor.Appl.Gen.[理论与应用遗传学]80:833(1990))。

如本文所使用的,术语“表型”或“表型性状”是指生物体的一种或多种性状。表型对于裸眼或通过本领域中已知的任何其他评估方法(例如显微术、生物化学分析法、和/或电子机械测定)是可观察的。在一些情况中,表型直接由单一基因或遗传基因座控制,即,“单基因性状”。在其他情况下,表型是多个基因的结果。

如本文所使用的,术语“耐旱性(drought tolerance)”和“耐旱的(drought tolerant)”是指植物在干旱胁迫或水分亏缺条件下忍受和/或繁殖的能力。当用于参考种质或植物时,这些术语是指由该种质或植物产生的植物在干旱条件下忍受和/或繁殖的能力。一般来说,如果植物或种质显示“提高的耐旱性”,则标记为“耐旱的”。

如本文所使用的,术语“提高的耐旱性”是指与一种或多种对照植物(例如亲本中的一种或两种,或缺乏与提高的耐旱性相关的标记的植物)相比,在一种或多种水优化表型中的改善、增强或增加。示例性耐旱性表型包括但不限于:增加的产量(以蒲式耳/英亩)、标准含水率时的谷物产量(YGSMN)、收获时谷物水分(GMSTP)、每块地谷物重量(GWTPN)、产量回收百分比(PYREC)、产量减少(YRED)、开花吐丝间隔(ASI)和贫瘠百分比(PB)(所有情况可以与相对于对照植物的增加相比较)。因此,当每种植物在干旱胁迫条件下生长时,表现出比亲本中的一个或两个更高的YGSMN的植物表现出提高的耐旱性并且可以被标记为“耐旱的”。

如本文所使用的,短语“非生物胁迫”是指任何由非生物因素(即水可用性、热、冷等)对植物的代谢、生长、繁殖和/或生存力所造成的不利影响。因此,非生物胁迫可通过次优环境生长条件而诱导,这些条件例如像盐度、水分剥夺、水分亏缺、干旱、洪涝、冰冻、低温或高温(例如寒冷或过热)、有毒化学品污染、重金属毒性、厌氧生活、养分缺乏、养分过量、大气污染或UV照射。

如本文所使用的,短语“非生物胁迫耐受性”是指植物比对照植物更好地忍受非生物胁迫的能力。

如本文所使用的,“水分亏缺”或“干旱”表示当植物可获得的水不能补充植物的消耗速率的时期。长期水分亏缺俗称干旱。如果有可获得的地下水贮备来支持植物生长速率,那么雨水或灌溉缺乏可以不立即产生水分胁迫。在具有充足地下水的土壤中生长的植物可在无雨水或灌溉的情况下存活数天,而不对产量产生不利影响。在干土中生长的植物有可能在最短水分亏缺时期内遭受不利影响。严重水分亏缺胁迫可导致枯萎以及植物死亡;中度干旱可减少产量、阻碍生长或延迟发育。植物可从某些时期的水分亏缺胁迫中恢复而不对产量产生显著影响。然而,授粉时的水分亏缺可降低或减少产量。因此,例如用于观察对于水分亏缺的反应或耐性的玉米生命周期中的有用时期是在抽穗或过渡至繁殖发育之前的营养生长阶段晚期。通过与对照植物比较来确定水分亏缺/干旱耐性。例如,当暴露于水分亏缺时,本发明的植物与对照植物相比可产生更高产量。可在实验室中以及在田间试验中模拟干旱,方法是通过与给予充分施水的对照植物相比,给予本发明的植物以及对照植物较少的水,并且测量性状差异。

水分利用效率(WUE)是常常用于评估水消耗量与CO2吸收/生长之间的权衡的参数(Kramer,1983,植物的水关系(Water Relations of Plants),学术出版社(Academic Press)第405页)。WUE已经用多种方法来定义并且测量。一种方法是计算整株植物的干重与植物在其整个寿命期间所消耗的水重量的比率(Chu等人,1992,生态学(Oecologia)89:580)。另一个变化是当测量生物质积累以及水分利用时使用较短时间间隔(Mian等人,1998,作物科学(Crop Sci.)38:390)。另一种方法是利用来自植物的限制部分的测量结果,例如,只测量地上部分生长以及水分利用(Nienhuis等人,1994美国植物学杂志(Amer J Bot)81:943)。WUE还被定义为CO2吸收与从叶子或叶子一部分中损失的水蒸气的比率,经常在很短时段(例如数秒/数分钟)内测量(Kramer,1983,第406页)。在植物组织中固定并且用同位素比值质谱仪测量的13C/12C比率也用于估计在植物中使用C-3光合作用的WUE(Martin等人,1999,作物科学1775)。如本文所使用的,术语“水分利用效率”是指由植物产生的有机物质的量除以植物产生它所使用的水的量,即,相对于植物的用水量的植物干重。如本文所使用的,术语“干重”是指植物中除了水以外的任何物质,并且包括例如碳水化合物、蛋白质、油以及矿质营养素。

如本文所使用的,术语“基因”是指包括DNA序列的遗传单位,所述遗传单位占据染色体上的特定位置并且含有生物体中的具体特征或性状的遗传指令。

术语“染色体区间”是指存在于植物单一染色体上的基因组DNA的连续线性跨度。该术语还表示由本发明中列出的任何标记定义的任何和全部基因组区间。位于单个染色体区间上的遗传元件物理连锁,并且染色体区间的大小没有特别限制。在一些方面,位于单个染色体区间内的遗传元件物理连锁,典型地具有例如,小于或等于20Mb,或可替代地,小于或等于10Mb的距离。通过定义间隔端点的末端标记描述的间隔将包括末端标记和位于该染色体结构域内的任何标记,无论这些标记目前是已知的还是未知的。尽管预计本领域技术人员可以在本文鉴定的标记中和周围描述标记基因座处的另外的多态性位点,但本文描述的与干旱耐受性相关的染色体区间内的任何标记落入本发明的范围内。染色体区间的边界包括将与提供感兴趣性状的一种或多种基因或基因座连锁的标记,即位于给定区间内的任何标记(包括定义区间边界的终端标记)可以用作耐旱性的标记。本文描述的间隔涵盖与耐旱性水优化共分离的标记簇。标记的聚类发生在染色体上相对较小的区域中,表明控制这些染色体区域中感兴趣性状的遗传基因座的存在。该区间涵盖在区间内映射的标记以及定义终端的标记。

“数量性状基因座(Quantitative trait loci或quantitative trait locus)”(QTL)是影响可定量描述的表型的遗传结构域,并且可被指定与表型性状的定量值相对应的“表型值”。QTL可以通过单个基因机制或通过多基因机制起作用。扩展染色体区间的边界以涵盖将与一个或多个QTL连锁的标记。换句话说,扩展染色体区间,这样使得位于区间内的任何标记(包括限定区间的边界的末端标记)可以用作耐旱性的标记。每个区间包含至少一个QTL,并且此外可以包含超过一个QTL。相同区间中多个QTL非常接近可以搅乱特定标记与特定QTL的关联,因为一个标记可显示与超过一个QTL连锁。相反地,例如如果非常接近的两个标记显示与所述所需表型性状共分离,则有时分不清楚是否那些标记中的每一个鉴定相同QTL或两个不同的QTL。无论如何,关于在特定区间内有多少个QTL的知识对于制定或实践在本发明是不必要的。

如本文所使用的,短语“测定”是指由美国加利福尼亚州圣地亚哥的亿明达公司(Illumina,Inc.)出售的可产生SNP特异性PCR产物的高通量基因分型测定。该测定在亿明达公司(Illumina,Inc.)的网站和Fan等人,2006中详细描述。

如本文所使用的,当用于描述与含有多态性的DNA杂交的核酸分子时,短语“直接相邻的”是指核酸与直接邻接多态性核苷酸碱基位置的DNA序列杂交。例如,可用于单碱基延伸测定的核酸分子与多态性“直接相邻的”。

如本文所使用的,术语“改进的”及其语法变体是指植物或其部分、子代或组织培养物,其由于具有(或缺乏)特定的水优化相关等位基因(如但不限于本文披露的那些水优化相关等位基因)的特征在于水优化相关性状的较高或较低含量,这取决于较高或较低含量是否为特定目的所希望的。

如本文所使用的,术语“INDEL”(也称为“indel”)是指在一对核苷酸序列中的插入或缺失,其中第一序列可被称为具有相对于第二序列的插入,或第二序列可被称为具有相对于第一序列的删除。

如本文所使用的,术语“信息片段”是指包括较大核苷酸序列的片段的核苷酸序列,其中该片段允许在较大核苷酸序列中鉴别一种或多种等位基因。例如,SEQ ID NO:17的核苷酸序列的信息片段包含SEQ ID NO:1的核苷酸序列的片段并允许鉴定一种或多种等位基因(例如,在SEQ ID NO:17的位置401的G核苷酸)、SEQ ID NO:18的核苷酸序列包含SEQ ID NO:2的核苷酸序列的片段并允许鉴定一种或多种等位基因(例如,在SEQ ID NO:18的位置401的G核苷酸)、SEQ ID NO:19的核苷酸序列包含SEQ ID NO:3的核苷酸序列的片段并允许鉴定一种或多种等位基因(例如,在SEQ ID NO:19的位置401的A核苷酸)、SEQ ID NO:20的核苷酸序列包含SEQ ID NO:4的核苷酸序列的片段并允许鉴定一种或多种等位基因(例如,在SEQ ID NO:20的位置401的A核苷酸)、SEQ ID NO:21的核苷酸序列包含SEQ ID NO:5的核苷酸序列的片段并允许鉴定一种或多种等位基因(例如,在SEQ ID NO:21的位置401的G核苷酸)、SEQ ID NO:22的核苷酸序列包含SEQ ID NO:6的核苷酸序列的片段并允许鉴定一种或多种等位基因(例如,在SEQ ID NO:22的位置401的C核苷酸)、SEQ ID NO:23的核苷酸序列包含SEQ ID NO:7的核苷酸序列的片段并允许鉴定一种或多种等位基因(例如,在SEQ ID NO:23的位置401的A核苷酸)、以及SEQ ID NO:24的核苷酸序列包含SEQ ID NO:8的核苷酸序列的片段并允许鉴定一种或多种等位基因(例如,在SEQ ID NO:24的位置401的G核苷酸)。

如本文所使用的,短语“询问位置”是指可以被查询以获得一种或多种预定基因组多态性的基因分型数据的固体支持物上的物理位置。

如本文所使用的,术语“多态性”是指基因座处的核苷酸序列中的变异,其中所述变异太常见,而不仅仅是由于自发突变。多态性在群体中必须具有至少约1%的频率。多态性可以是单核苷酸多态性(SNP)或插入/缺失多态性(本文中也称为“indel”)。另外,该变异可以在转录谱或甲基化模式中。可以通过在两个或更多个种质条目中的一个或多个基因座处进行核苷酸序列比较来确定核苷酸序列的一个或多个多态性位点。

如本文所使用的,短语“重组”是指在相似或相同核苷酸序列的区域中,在配对染色体的两个DNA分子或染色单体之间的DNA片段的交换(“互换”)。“重组事件”在本文中被理解为是指减数分裂互换。

如本文所使用的,术语“植物”可以是指全株植物、其任何部分、或从植物衍生的细胞或组织培养物。因此,术语“植物”可以是指整个植物、植物部分或植物器官(即,叶、茎、根等)、植物组织、种子和/或植物细胞。植物细胞是从植物取得的植物细胞,或者是通过培养从取自植物的细胞衍生的植物细胞。

如本文所使用的,术语“玉米(maize)”是指玉蜀黍(Zea mays L.ssp.mays)植物,并且也被称为“玉米(corn)”。

如本文所使用的,术语“玉米植物”包括整个玉米植物、玉米植物细胞、玉米植物原生质体、可从其中再生玉米植物的玉米植物细胞或玉米组织培养物、玉米植物愈伤组织、和玉米植物中的完整玉米植物细胞或玉米植物部分,如玉米种子、玉米芯、玉米花、玉米子叶、玉米叶、玉米茎、玉米芽、玉米根、玉米根尖等。

如本文所使用的,短语“天然性状”是指某些作物的种质中任何存在的单基因或控制生育性状(oligogenic trait)。当通过一种或多种分子标记鉴定时,获得的信息可用于通过本文披露的水优化相关性状的标记辅助育种来改良种质。

“非天然存在的玉米种类”是自然界中不存在的任何种类的玉米。可以通过本领域已知的任何方法产生“非天然存在的玉米种类”,该方法包括但不限于转化玉米植物或种质、转染玉米植物或种质并将天然存在的玉米种类与非天然存在的玉米种类杂交(通过基因组编辑(例如CRISPR或TALEN)、或者通过创建自然界中不存在的所希望的等位基因的育种堆叠)。在一些实施例中,“非天然存在的玉米种类”可以包含一种或多种异源核苷酸序列。在一些实施例中,“非天然存在的玉米种类”可以包含天然存在的核苷酸序列的一个或多个非天然存在的拷贝(即天然存在于玉米中的基因的外来拷贝)。

“非硬茎”杂种优势组代表北美和加拿大玉米种植区域的主要杂种优势组。它也可以被称为“兰卡斯特(Lancaster)”或“兰开斯特修尔作物(Lancaster Sure Crop)”杂种优势组。

“硬茎”杂种优势组代表北美和加拿大玉米种植区域的主要杂种优势组。它也可以被称为“爱荷华州硬茎合成物(Iowa Stiff Stalk Synthetic)”或“BSSS”杂种优势组。

如本文所使用的,术语“贫瘠百分比”(PB)是指在给定区域(例如地块)中没有谷粒的植物的百分比。它通常以每块地的植物百分比表示,并可以计算为:

如本文所使用的,术语“产量回收百分比”(PYREC)是指,与遗传学上一致(除了缺少等位基因和/或等位基因的组合)的植物相比,等位基因和/或等位基因的组合对干旱胁迫条件下生长的植物的产量的影响。PYREC计算为:

通过举例而非限制,如果在充分灌溉条件下对照植物产生200蒲式耳,但是在干旱胁迫条件下仅产生100蒲式耳,则其产量损失百分比将被计算为50%。如果在干旱胁迫条件下,包含一个或多个目的等位基因的另外的遗传学上一致的杂合体产生125蒲式耳,并且在充分灌溉条件下产生200蒲式耳,则产量损失百分比将被计算为37.5%,并且PYREC会被计算为25%[1.00-(200-125)/(200-100)x100)]。

如本文所使用的,短语“谷物产量-较好施水”是指来自获得足够灌溉的区域的产量,以防止植物在其生长周期期间受到水胁迫。在一些实施例中,此性状以蒲式耳/英亩表达。

如本文所使用的,短语“产量减少-杂种”是指从在胁迫和非胁迫条件下生长的杂种产量试验获得的计算的性状。对于给定杂种,它等于:

非胁迫产量-在胁迫下的产量X100。

非胁迫的产量

在一些实施例中,此性状表达为百分比蒲式耳/英亩。

如本文所使用的,短语“产量减少-近交”是指从在胁迫和非胁迫条件下生长的近交产量试验获得的计算的性状。对于给定近交,它等于:

非胁迫产量-在胁迫下的产量X100。

非胁迫的产量

在一些实施例中,此性状表达为百分比蒲式耳/英亩。

如本文所使用的,术语“核苷酸序列”、“多核苷酸”、“核酸序列”、“核酸分子”和“核酸片段”是指单链或双链的RNA或DNA的聚合物,任选地含有合成的、非天然的、和/或改变的核苷酸碱基。“核苷酸”是从其构建DNA或RNA聚合物并且由嘌呤或嘧啶碱基、戊糖、和磷酸基团组成的单体单元。核苷酸(通常以其5′-单磷酸酯形式发现)以其单字母名称表示如下:“A”表示腺苷酸或脱氧腺苷酸(分别用于RNA或DNA),“C”表示胞苷酸或脱氧胞苷酸,“G”表示鸟苷酸或脱氧鸟苷酸,“U”表示尿苷酸,“T”表示脱氧胸苷酸,“R”表示嘌呤(A或G),“Y”表示嘧啶(C或T),“K”表示G或T,“H”表示A或C或T,“I”表示肌苷,并且“N”表示任何核苷酸。

如本文所使用的,术语“植物部分”包括但不限于胚、花粉、种子、叶、花(包括但不限于花药、胚珠等)、果实、茎或枝、根、根尖、细胞(包括在植物和/或植物部分中完整的细胞)、原生质体、植物细胞组织培养物、植物愈伤组织、植物团块等。因此,植物部分包括可以再生成大豆植物的大豆组织培养物。另外,如本文所使用的,“植物细胞”是指植物的结构和生理学单位,包括细胞壁并且也可以指原生质体。本发明的植物细胞可以处于分离的单细胞形式,或者可以是培养的细胞,或者可以是作为较高级的组织单位(例如像,植物组织或植物器官)的一部分。

如本文所使用的,术语“群体”是指共享共同的遗传衍生(genetic derivation)的植物的遗传上异质的集合。

如本文所使用的,术语“子代”、“子代植物”和/或“后代”是指由一个或多个亲本植物营养或有性繁殖产生的植物。子代植物可以通过单一亲本植物的克隆或自交或者通过两个亲本植物的杂交而获得,并且包括自交体以及F1或F2或甚至更远的世代。F1是产生自两个亲本的第一代后代(两个亲本的至少一个是第一次用作性状的供体),而第二代(F2)或后续代(F3、F4等)的后代是产生于F1、F2等的自交或杂交的样本。因此F1可以(并且在一些实施例中)是由两个真正育种亲本之间杂交产生的杂交体(短语“真正育种”是指对于一种或多种性状而言是纯合的个体),而F2可以是由F1杂交体自花授粉产生的后代。

如本文所使用的,术语“参考序列”是指用作核苷酸序列比较基础的经定义的核苷酸序列(例如,玉蜀黍栽培品种B73的染色体1或染色体3)。例如可以通过对在一个或多个目的基因座处的多个品系进行基因分型、在序列比对程序中比对这些核苷酸序列并且然后获得比对的共有序列来获得标记的参考序列。因此,参考序列鉴定基因座处等位基因中的多态性。参考序列可以不是来自任何特定生物体的实际核酸序列的拷贝;然而,对于设计针对一个或多个基因座中的实际多态性的引物和探针是有用的。

如本文所使用的,术语“分离的”是指不含通常侧翼于植物基因组中核苷酸序列的一侧或两侧的序列的核苷酸序列(例如遗传标记)。因此,短语“与玉蜀黍中的水优化性状相关的分离和纯化的遗传标记”可以是例如重组DNA分子,该重组DNA分子提供通常发现侧翼(在天然存在的基因组中去除或不存在该重组DNA分子)的核酸序列之一。因此,分离的核酸包括,但不限于,作为单独的分子存在的重组DNA(包括,但不限于,通过PCR或限制性内切核酸酶处理产生的基因组DNA片段),该重组DNA没有侧翼序列存在,以及结合入一种载体、自主复制质粒,或者作为杂种或融合核酸分子的一部分结合入植物的基因组DNA的重组DNA。

如本文所使用的,短语“测定”是指使用基于由美国加利福尼亚州福斯特城应用生物系统公司(Applied Biosystems,Inc.)出售的测定的PCR的实时序列检测。对于鉴定的标记,测定可以开发应用于育种计划中。

如本文所使用的,术语“测试者”是指在测交中使用的具有一个或多个其他品系的品系,其中测试者和测试的品系在遗传上是不相似的。对于该杂交系,测交系可以是等基因系。

如本文所使用的,术语“性状”是指目的表型、促成目的表型的基因、以及与促成目的表型的基因相关的核酸序列。例如,“水优化性状”是指水优化表型以及有助于水优化表型和与水优化表型相关的核酸序列(例如,SNP或其他标记)的基因。

如本文所使用的,术语“转基因”是指通过一些形式的人工转移技术引入生物体或其祖先中的核酸分子。因此,人工转移技术产生“转基因生物体”或“转基因细胞”。应当理解的是,人工转移技术可以在祖先生物体(或其中的细胞和/或可以发育成祖先生物体的细胞)中发生,并且即使一种或多种自然和/或辅助育种导致了人工转移的核酸分子存在于后代个体中,具有人工转移的核酸分子或其片段的任何后代个体仍然被认为是转基因的。

标记的“不利等位基因”是与所述不利植物表型分离的标记等位基因,因此提供了鉴定能从育种程序或种植中移除的植物的益处。

如本文所使用的,术语“水优化”是指可以测量和/或定量的植物、其部分或其结构的任何测量,以评估与次优水分可利用条件(例如,干旱)下相比,在充足水分可利用条件下植物生长和发育的程度或速率。因此,“水优化性状”是可被证明为在与水可用性相关的若干组不同生长条件下影响植物的产量的任何性状。如本文所使用的,短语“水优化”是指植物、其部分或其结构的任何度量,它可被测量且/或量化以便评定在不同的水可用性条件下植物生长和发育的程度或速率。(例如,表1-7中鉴定的所有标记等位基因或其紧密连锁标记可用于鉴定、选择或产生具有增加水优化的玉米植物)。类似地,“水优化”可以被认为是“表型”,其在本文中使用时是指细胞或生物的可检测的、可观察的和/或可测量的特征。在一些实施例中,表型至少部分基于细胞或生物体的基因构成(在本文中称为细胞或生物体的“基因型”)。示例性水优化表型为标准水分百分比时的谷物产量(YGSMN)、收获时谷物水分(GMSTP)、每块地谷物重量(GWTPN)和产量回收百分比(PYREC)。注意,如本文所使用的,术语“表型”考虑环境(例如,环境条件)可以如何影响水优化,使得水优化效果是真实且可再现的。如本文所使用的,术语“产量减少”(YD)是指在胁迫条件下生长的植物中产量减少到的程度。YD计算为:

与特定表型(例如耐旱性)相关的遗传基因座可以被映射到生物体的基因组中。通过鉴定与目的性状共分离的标记或标记簇,育种人员能够通过选择合适的标记(称为标记辅助选择或MAS的方法)来迅速选择所期望的表型。育种人员也可以使用此类标记来在计算机上模拟设计基因型并实施全基因组选择。

本发明提供与植物(例如玉米)中提高的耐旱性和/或植物(例如玉米)提高的/增加的产量相关的染色体区间、QTL、基因座和基因。可以使用这些标记和/或其他连锁标记的检测来鉴定、选择和/或生产具有提高的耐旱性的玉米植物,和/或来从育种程序或从不具有提高的耐旱性的种植中消除玉米植物。

分子标记用于可视化核酸序列的差异。该可视化可归因于用限制性内切酶(例如RFLP)消化后的DNA-DNA杂交技术、和/或归因于使用聚合酶链式反应的技术(例如,SNP、STS、SSR/微卫星、AFLP等)。在一些实施例中,基于这些亲本基因型的杂交,两个亲本基因型之间的所有差异在作图群体中分离。可以比较不同标记的分离并可以计算重组频率。用于映射植物中的标记的方法描述在例如Glick和Thompson(1993)Methods in Plant Molecular Biology and Biotechnology[植物分子生物学和生物技术方法],CRC出版社,波卡拉顿,弗罗里达州,美国;Zietkiewicz等人,(1994)Genomics[基因组学]20:176-183中。

表1-8提供了玉米基因组区域(即,染色体区间、基因、QTL、等位基因或基因座)的名称,各个玉米染色体或连锁群上的每个标记的物理遗传位置,以及与在干旱或非干旱条件下提高的耐旱性、水优化和/或玉米产量相关的一个或多个靶等位基因。本文描述了本发明的标记关于映射到物理位置的标记基因座的位置,如它们在由亚利桑那基因组学研究所装配公开的B73 RefGen_v2序列上报告的。可以在互联网资源:maizeGDB(maizegdb.org/assembly)或在(gramene.org)中的Gramene中找到玉米基因组的物理序列。

因此,在本发明的一些实施例中,在干旱或非干旱条件下与提高的耐旱性或增加的产量相关的标记等位基因、染色体区间和/或QTL列于表1-7中。

在本发明的一些实施例中,如列于表1-7中的与提高的耐旱性相关的一种或多种标记等位基因及其紧密连锁标记染色体区间内,其包括但不限于(a)由碱基对(bp)位置272937470至碱基对(bp)位置272938270定义(并包括)的染色体1上的染色体区间(PZE01271951242);(b)由碱基对(bp)位置12023306至碱基对(bp)位置12024104定义(并包括)的在染色体2上的染色体区间(PZE0211924330);(c)由碱基对(bp)位置225037202至碱基对(bp)位置225038002定义(并包括)的在染色体3上的染色体区间(PZE03223368820);(d)由碱基对(bp)位置225340531至碱基对(bp)位置225341331定义(并包括)的在染色体3上的染色体区间(PZE03223703236);(e)由碱基对(bp)位置159,120,801至碱基对(bp)位置159,121,601定义(并包括)的在染色体5上的染色体区间(PZE05158466685);(f)由碱基对(bp)位置12104536至碱基对(bp)位置12105336定义(并包括)的在染色体9上的染色体区间(PZE0911973339);(g)由碱基对(bp)位置225343590至碱基对(bp)位置225340433定义(并包括)的在染色体9上的染色体区间(S_18791654);(h)由碱基对(bp)位置14764415至碱基对(bp)位置14765098定义(并包括)的在染色体10上的染色体区间(S_20808011);或其任何组合。如本领域技术人员将理解的,另外的染色体区间可以由本文表1中提供的SNP标记来定义。另外,除了表1中提供的那些之外的(a)-(h)的染色体区间内的SNP标记可以通过本领域公知的方法衍生。

本发明进一步提供了分子标记的检测可以包括使用核酸探针,该核酸探针具有与定义分子标记的核酸序列基本上互补的核苷酸碱基序列,并且该核酸探针在严格条件下与定义分子标记的核酸序列杂交。合适的核酸探针可以例如是对应于标记的扩增产物的单链。在一些实施例中,设计标记的检测以确定特定植物中SNP的特定等位基因是否存在或不存在。

另外,本发明的方法包括检测与SNP的特定等位基因的存在相关的扩增的DNA片段。在一些实施例中,与SNP的特定等位基因相关的扩增的片段具有预测的长度或核酸序列,并且进行检测具有预测长度或预测的核酸序列的扩增的DNA片段,使得扩增的DNA片段具有对应于(加或减几个碱基;例如更多或更少的一个、两个或三个碱基的长度)的预期的长度(基于与来自其中首次检测到标记的植物的DNA具有相同的引物的相似的反应)的长度或对应于(例如,至少约80%、90%、95%、96%、97%、98%、99%或更多的同源性)预期的序列(基于与其中首次检测到标记的植物中与SNP相关的标记的序列)的核酸序列。

具有预测长度或预测的核酸序列的扩增的DNA片段的检测可以通过任何一种或多种技术进行,这些技术包括但不限于标准凝胶电泳技术或通过使用自动化的DNA测序仪。此类检测扩增的DNA片段的方法在本文没有详细描述,因为它们是本领域普通技术人员所熟知的。

如表1-8所示,本发明的SNP标记在干旱或非干旱条件下与提高的耐旱性和/或增加的产量相关。在一些实施例中,如本文描述,可以使用一种标记或标记的组合来检测在非干旱条件下与对照植物相比,耐旱性玉米植物或具有增加的产量的玉米植物的存在。在一些实施例中,标记可以位于染色体区间(QTL)内或在植物基因组中作为如本文定义的单倍型存在(例如,如本文所定义的染色体区间1、2、3、4、5、6、或7中的任一个)。

II.用于测定核酸序列的分子标记、水优化相关的基因座、和组合物

分子标记用于可视化核酸序列的差异。该可视化可归因于用限制性内切酶(例如RFLP)消化后的DNA-DNA杂交技术、和/或归因于使用聚合酶链式反应的技术(例如,STS、SSR/微卫星、AFLP等)。在一些实施例中,基于这些亲本基因型的杂交,两个亲本基因型之间的所有差异在作图群体中分离。可以比较不同标记的分离并可以计算重组频率。用于映射植物中的标记的方法披露在例如,Glick和Thompson,1993;Zietkiewicz等人,1994中。在不同染色体上的分子标记的重组频率一般为50%。在位于相同染色体上的分子标记之间,重组频率通常取决于标记之间的距离。低重组频率通常对应于染色体上标记之间的小遗传距离。比较所有重组频率导致染色体上分子标记的最合理顺序。这个最合乎逻辑的顺序可以用一个连锁图来描述(Paterson,1996)。与增加的水优化相关联的连锁图上的一组邻接或相邻标记可以提供与增加的水优化相关的MTL的位置。与特定表型(例如耐旱性)相关的遗传基因座可以被映射到生物体的基因组中。通过鉴定与目的性状共分离的标记或标记簇,育种人员能够通过选择合适的标记(称为标记辅助选择或MAS的方法)来迅速选择所期望的表型。育种人员也可以使用此类标记来在计算机上模拟设计基因型并实施全基因组选择。

本披露的主题在一些实施例中提供与提高的耐旱性/水优化相关的标记(例如表1-7中所示的标记)。可以使用这些标记和/或其他连锁标记的检测来鉴定、选择和/或生产耐旱性植物和/或从育种程序或种植中消除不耐旱的植物。

在一些实施例中,本披露的主题的表1-7的标记的1cM、2cM、3cM、4cM、5cM、6cM、7cM、8cM、9cM、10cM、15cM、20cM、或25cM内的DNA序列展示与本披露的主题的标记相比小于约25%、20%、15%、10%、9%、8%、7%、6%、5%、4%、3%、2%、或1%的遗传重组频率。在一些实施例中,该种质是玉蜀黍品系或种类。

还提供了与存在水优化相关的性状、等位基因和/或单倍型相关的DNA片段,包括但不限于SEQ ID NO:17-24。在一些实施例中,与存在水优化相关的性状相关的DNA片段具有预测的长度和/或核酸序列,并且检测具有预测的长度和/或预测的核酸序列的DNA片段,使得扩增的DNA片段具有与预测长度相对应的长度(加或减几个碱基;例如更多或更少的一个、两个或三个碱基的长度)。在一些实施例中,DNA片段是扩增的片段,并且该扩增的片段具有预测的长度和/或核酸序列,如与来自其中首次检测到标记的植物的DNA具有相同的引物的相似的反应产生的扩增的片段,或对应于(即,超过80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%的核苷酸序列同一性)预期的序列(基于其中首次检测到标记的植物中水优化相关的性状相关的标记的序列)的核酸序列。在回顾本披露时,本领域普通技术人员将会理解,在植物中不存在而在至少一种亲本植物中存在的标记(所谓的反式标记)也可用于检测子代植物中所希望的性状的测定中,尽管测试不存在标记以检测特定性状的存在并不是最佳的。具有预测长度或预测的核酸序列的扩增的DNA片段的检测可以通过任何一种或多种技术进行,这些技术包括但不限于标准凝胶电泳技术和/或通过使用自动化的DNA测序仪。这些方法在这里没有详细描述,因为它们是本领域技术人员熟知的。

为了在延伸和/或扩增中获得最大效率,在一些实施例中,引物(在一些实施例中是延伸引物,并且在一些实施例中是扩增引物)是单链的。在一些实施例中,引物是寡脱氧核苷酸。引物通常足够长以在用于聚合的试剂存在下引发延伸和/或扩增产物的合成。引物的最小长度可以取决于许多因素,包括但不限于该引物的温度和组成(A/T对G/C含量)。

在扩增引物的上下文中,这些典型地作为一组或多组双向引物(包括一种或多种正向引物和一种或多种反向引物)提供,如DNA扩增(如PCR扩增)领域中常用的。如此,应该理解的是,如本文所使用的术语“引物”可以指超过一种引物,特别是在关于待扩增的靶区域的一个或多个末端序列的信息中存在一些歧义的情况下。因此,“引物”可以包括含有代表该序列中的可能变异的序列的引物寡核苷酸的集合,或包括允许典型的碱基配对的核苷酸。可以通过任何合适的方法来制备引物。用于制备特异性序列的寡核苷酸的方法是本领域已知的,并且包括例如适当的序列的克隆和限制以及直接化学合成。化学合成方法可以包括例如美国专利号4,458,068中披露的磷酸二酯或三酯法、二乙基氨基磷酸酯法和固相支持体法。

若需要,可以通过并入可检测部分,例如光谱部分、荧光部分、光化学部分、生物化学部分、免疫化学部分或化学部分来标记引物。

寡聚核苷酸引物的模板依赖性延伸由聚合试剂在适量的四种脱氧核糖核苷酸三磷酸(dATP、dGTP、dCTP和dTTP;即dNTP)或类似物的存在下、在反应介质(包含适当盐、金属阳离子和pH缓冲系统)中催化。合适的聚合剂是已知催化引物和模板依赖性DNA合成的酶。已知的DNA聚合酶包括例如大肠杆菌DNA聚合酶或其Klenow片段、T4 DNA聚合酶、和Taq DNA聚合酶,及其各种修饰的形式。用这些DNA聚合酶催化DNA合成的反应条件是本领域已知的。合成的产物是由模板链和引物延伸链组成的双链分子,其包括靶序列。这些产物反过来可以作为另一轮复制的模板。在第二轮复制中,第一轮循环的引物延伸链用其互补引物退火;合成产生“短”产物,其通过引物序列或其互补物在5′-末端和3′-末端两者上结合。变性、引物退火、和延伸的重复循环可以导致由引物定义的靶区域的指数累积。进行足够的循环以实现所希望的量的含有核酸靶区域的多核苷酸。所希望的量可以变化,并且由产物多核苷酸起作用的功能决定。

PCR方法在手册中已经很好地描述,并且是本领域技术人员已知的。通过PCR扩增后,可以通过与探针多核苷酸杂交来检测靶多核苷酸,该探针多核苷酸在严格至中度严格的杂交和洗涤条件下与靶序列形成稳定的杂交体。如果预期探针将与靶序列基本上完全互补(即,约99%或更多),则可以使用严格条件。如果预期有一些错配,例如如果预期变体品种会导致探针不完全互补,则可以降低杂交的严格性。在一些实施例中,选择条件以排除非特异性/偶然结合。影响杂交的条件和针对非特异性结合选择的条件是本领域已知的,并且描述于例如Sambrook和Russell,2001中。通常,较低的盐浓度和较高温度增加了杂交条件的严格性。

为了检测植物单染色体上两个水优化相关的等位基因的存在,也可以使用染色体涂染方法。在此类方法中,可以通过原位杂交或原位PCR技术在相同染色体中检测至少第一水优化相关的等位基因和至少第二水优化相关的等位基因。更方便的是,两个水优化相关的等位基因存在于单个染色体上的事实可以通过确定它们处于偶联阶段来确认:即当与位于分开的染色体上的基因相比时,性状显示分离减少。

本文鉴定的水优化相关的等位基因位于许多不同的染色体或连锁群上,并且它们的位置可以用许多其他任意标记物表征。尽管限制性片段长度多态性(RFLP)标记、扩增的片段长度多态性(AFLP)标记、微卫星标记(例如SSR)、插入突变标记、序列特征化扩增区(SCAR)标记、切割扩增多态序列(CAPS)标记、同工酶标记、基于微阵列的技术、测定、测定分析、核酸序列技术或这些标记的组合也可能已经被使用,并且确实可以使用,但是在本研究中使用单核苷酸多态性(SNP)。

通常,提供水优化相关的等位基因和/或单倍型的完整序列信息是不必要的,因为首先检测水优化相关的等位基因和/或单倍型的方式-通过观察到的在一个或多个单核苷酸多态性的存在和特定表型性状的存在之间的相互关联-允许人们在子代植物群体中追踪那些具有表现出特定表型性状遗传潜力的植物。通过提供非限制性标记列表,本披露的主题因此提供了在育种程序中有效使用目前披露的水优化相关的等位基因和/或单倍型。在一些实施例中,标记对于特定系谱是具体的。因此,特定的性状可以与特定的标记相关联。

如本文披露的标记不仅指示水优化相关的等位基因的位置,还与植物中特定表型性状的存在相关。注意到表明水优化相关的等位基因存在于基因组中的单核苷酸多态性是非限制性的。通常,水优化相关的等位基因的位置由与表型性状具有统计学相关性的一组单核苷酸多态性指示。一旦在单核苷酸多态性之外发现了标记(即,具有低于某个阈值的LOD得分的标记,表明该标记非常偏远以至于该标记与水优化相关的等位基因之间的区域中的重组发生得如此频繁,标记的存在不以统计学显著的方式与表型的存在相关),可以考虑设置水优化相关的等位基因的边界。因此,也可以通过位于该指定区域内的其他标记来指示水优化相关的等位基因的位置。进一步注意到,单核苷酸多态性也可用于指示个体植物中水优化相关的等位基因(并且因此表型)的存在,其在一些实施例中意指其可用于标记辅助选择(MAS)程序。

原则上,潜在有用的标记数量可以非常大。与水优化相关的等位基因连锁的任何标记(例如,落入标记所跨越的基因组区域的物理边界内,该标记具有高于某个阈值的建立的LOD分数,从而表明在标记与水优化相关的基因之间没有或非常少的重组,以及与水优化相关的等位基因连锁不平衡的任何标记,以及代表水优化相关的等位基因内实际因果突变的标记)可用于本发明披露的方法和组合物中,并且在本公开主题的范围内。这意味着本申请中鉴定为与水优化相关的等位基因相关联的标记(例如,存在于或包含SEQ ID NO:1-8、17-65以及表1-7中的任一个的标记)是适用于本披露的方法和组合物的标记的非限制性实例。此外,当水优化相关的等位基因或其特定赋予性状的部分基因渗入至另一遗传背景(即,至另一玉米或另一植物物种的基因组)时,则在子代中将不会再找到一些标记(尽管其中存在性状),表明这些标记在基因组区域之外,仅表示原始亲本品系中水优化相关的等位基因的特定性状赋予部分,并且新遗传背景具有不同的基因组组织。不存在的这些标记指示在子代中的成功引入的遗传元件被称为“反式标记”,并且相对于本披露的主题可以同样适合。

在鉴定水优化相关的等位基因和/或单倍型后,水优化相关的等位基因和/或单倍型效应(例如,性状)可以例如通过评估在研究的下的分离水优化相关的等位基因和/或单体型的子代中的性状。对性状的评估可适当地通过使用本领域已知的用于水优化性状的表型评估来进行。例如,可以进行在自然和/或灌溉条件下的(田间)试验以评估杂交和/或近交玉米的性状。

由本披露的主题提供的标记可以用于检测可疑水优化性状基因渗入玉米植物中本披露的主题的基因座处一个或多个水优化性状等位基因和/或单倍型的存在,并且因此可以用于涉及标记辅助育种和选择这种水优化性状的玉米植物的方法中。在一些实施例中,用如本文所定义的用于水优化相关的等位基因和/或单倍型的至少一个标记进行检测本披露的主题水优化相关的等位基因和/或单倍型的存在。因此,本披露的主题在另一方面涉及用于检测本披露的水优化性状中的至少一个的水优化相关的等位基因和/或单倍型的存在的方法,该方法包括检测携带性状的玉米植物中的水优化相关的等位基因和/或单倍型的核酸序列的存在,其存在可以通过使用披露的标记来检测。

在一些实施例中,该检测包含确定与水优化相关的性状、等位基因和/或单倍型相关的玉蜀黍核酸的核苷酸序列。本披露的主题的水优化相关的等位基因和/或单倍型的核苷酸序列可以例如通过确定与水优化相关的等位基因和/或单倍型相关的一个或多个标记的核苷酸序列来解析,并设计用于标记序列的内部引物,该内部引物然后可以用于进一步确定标记序列外部的水优化相关的等位基因和/或单倍型的序列。

例如,本文披露的SNP标记的核苷酸序列可以通过分离来自用于确定受试植物基因组中标记的存在的电泳凝胶标记来获得,并通过以下方法确定标记的核苷酸序列:例如,本领域熟知的双脱氧链终止测序方法。在用于检测携带性状的玉米植物中的水优化相关的等位基因和/或单倍型的存在的此类方法的一些实施例中,该方法还可以包括提供能够在严格杂交条件下与核酸序列(连锁至水优化相关的等位基因和/或单倍型的标记,在一些实施例中,选自本文披露的标记)杂交的寡核苷酸或多核苷酸,使寡核苷酸或多核苷酸与含携带形状的玉米植物的消化的基因组核酸接触,并确定寡核苷酸或多核苷酸与消化的基因组核酸的特定杂交的存在。在一些实施例中,该方法在从携带性状的玉米植物获得的核酸样品上进行,但也可以采用原位杂交方法。可替代地,本领域普通技术人员一旦确定了水优化相关的等位基因和/或单倍型的核苷酸序列,就可以设计出能够在严格杂交条件下与水优化相关的等位基因和/或单倍型的核酸序列杂交的特异性杂交探针或寡核苷酸,并且可以在用于检测携带性状的玉米植物中本文披露的水优化相关的等位基因和/或单倍型的存在的方法中使用此类杂交探针。

可以使用标准分子生物学技术确定存在于本文披露的标记和核酸中特定位置的特定核苷酸,该标准分子生物学技术包括但不限于从植物扩增基因组DNA并随后测序。另外,可以设计预期会与包括本文披露的多态性的特定序列特异性杂交的寡核苷酸引物。例如,可以设计寡核苷酸以使用包含SEQ ID NO:27和28的寡核苷酸(基本上由其组成或由其组成)在对应于SEQ ID NO:17的位置401的核苷酸位置处区分“A”等位基因与“G”等位基因。在SEQ ID NO:27与28之间的相关差异在于前者在位置15具有G核苷酸并且后者在位置16具有A核苷酸。因此,可设计SEQ ID NO:27杂交条件,其允许SEQ ID NO:27与“G”等位基因(如果存在的话)特异性杂交,但不与“A”等位基因(如果存在)杂交。因此,使用仅在一个核苷酸上不同的这两种引物的杂交可用于测定在对应于SEQ ID NO:17的位置401的核苷酸位置处一个或另一个等位基因的存在。

在一些实施例中,标记可以包含任何前述标记的反向互补序列,基本上由其组成或由其组成。在一些实施例中,构成标记单倍型的一个或多个等位基因如上文描述存在,而构成标记单倍型的一个或多个其他等位基因作为上文描述的一个或多个等位基因的反向互补序列存在。在一些实施例中,构成标记单倍型的每个等位基因作为上文描述的一个或多个等位基因的反向互补序列存在。

在一些实施例中,标记可以包含任何前述标记的信息性片段、任何前述标记的反向互补序列或任何前述标记的反向互补序列的信息性片段,基本上由其组成或由其组成。在一些实施例中,构成标记单倍型的一个或多个等位基因/序列如上文描述存在,而构成标记单倍型的一个或多个其他等位基因/序列作为上文描述的等位基因/序列的反向互补序列存在。在一些实施例中,构成标记单倍型的一个或多个等位基因/序列如上文描述存在,而构成标记单倍型的一个或多个其他等位基因/序列作为上文描述的等位基因/序列的信息片段存在。在一些实施例中,构成标记单倍型的一个或多个等位基因/序列如上文描述存在,而构成标记单倍型的一个或多个其他等位基因/序列作为上文描述的等位基因/序列的反向互补序列的信息片段存在。在一些实施例中,构成标记单倍型的每个等位基因/序列作为上文描述的等位基因/序列的信息片段、上文描述的等位基因/序列的反向互补序列、或上文描述的等位基因/序列的反向互补序列的信息片段存在。

在一些实施例中,标记可包含任何与前述标记连锁的标记、基本上由其组成或由其组成。也就是说,与任何前述标记处于连锁不平衡中的任何等位基因和/或单倍型也可用于鉴定、选择和/或产生具有提高的耐旱性的玉米植物。例如,可以通过使用MaizeGDB网站上的可用资源来确定连锁的标记。

还提供了与提高的耐旱性相关的分离和纯化的标记。此类标记可以包含如列于SEQ ID NO:1-8、和17-65、表1-7中描述的等位基因中的任何的核苷酸序列,及其反向互补序列、或其信息片段,基本上由其组成或由其组成。在一些实施例中,该标记包含可检测部分。在一些实施例中,标记允许检测本文鉴定的一种或多种标记等位基因。

还提供了包含能够扩增从玉米植物或种质分离的核酸样品以产生与提高的耐旱性相关的标记的引物对的组合物。在一些实施例中,标记包含如列于本文中的核苷酸序列、其反向互补序列、或其信息片段。在一些实施例中,标记包含核苷酸序列、其反向互补序列、或其信息片段,该核苷酸序列与列于本文中的核苷酸序列至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、99%或100%同一性。在一些实施例中,引物对是以上表8中鉴定的扩增引物对之一。本领域普通技术人员将会理解如何根据本领域熟知的方法选择可替代的引物对。

具有不同目的等位基因和/或单倍型的植物的鉴定可以提供用于在子代植物组合(经由设计以“堆叠”等位基因和/或单倍型的育种策略)等位基因和/或单倍型的起始材料。如本文所使用的,术语“堆叠”及其语法变体是指通过育种(包括但不限于两种植物杂交、单个植物自交、和/或从单个植物产生双倍体)有意地积累在植物中有利的水优化单倍型,使得植物的基因组比其一个或多个直系祖先的基因组具有至少一个另外的有利水优化单倍型。在一些实施例中,堆叠包括将一种或多种水优化性状、等位基因和/或单倍型输送到子代玉米植物中,使得子代玉米植物包含比任一亲本(从其衍生的)更高数量的水优化性状、等位基因和/或单倍型。作为实例而非限制,如果亲本1具有单倍型A、B和C,并且亲本2具有单倍型D、E和F,则“堆叠”是指产生具有A、B、和C的任何与D、E和F的任何组合。特别地,在一些实施例中,“堆叠”是指产生具有A、B和C以及一个或多个D、E和F中的植物,或者产生具有D、E和F以及一个或多个A、B和C中的植物。在一些实施例中,“堆叠”是指从双亲杂交产生植物,该植物含有所有亲本具有的与水优化相关的单倍型。

III.用于基因渗入目的等位基因以及用于鉴定包含该目的等位基因的植物的方

III.A.一般的标记辅助选择

标记可以用于各种植物育种应用。参见,例如Staub等人,Hortscience[园艺科学]31:729(1996);Tanksley,Plant Molecular Biology Reporter[植物分子生物学导报]1:3(1983)。主要的目的领域之一是使用标记辅助选择(MAS)增加回交和基因渗入的效率。通常,MAS利用已被鉴定为具有与所希望的性状共分离的显著可能性的遗传标记。推测此类标记位于产生所希望的表型的基因中/附近,并且它们的存在表明该植物将具有所希望的性状。预计具有该标记的植物将所希望的表型转移到它们的子代中。

展示出与影响所需表型性状的基因座连锁的标记为在植物群体中选择性状提供了有用工具。在表型难以测定或在植物发育的后期阶段发生的情况下,尤其如此。由于DNA标记测定比田间表型分析更省力并且占用的物理空间更小,可测定更大的群体,增加了发现具有从供体品系移动至受体品系的靶区段的重组体的概率。连锁越紧密,标记越有用,这是因为重组不太可能发生于该标记与造成或引起该性状的基因之间。使用侧翼标记降低发生误报选择的几率。理想情况是基因本身具有标记,使得标记和基因之间的重组不能发生。此类标记称为“完美标记”。

当基因通过MAS渗入时,不仅引入了基因而且引入了侧接区域。Gepts,Crop Sci[作物科学]42:1780(2002)。这称为“连锁累赘”。在供体植物与受体植物极不相关的情况下,这些侧接区域携带可以编码农艺学上不需要的性状的附加基因。即便与优良玉蜀黍品系回交多个周期后,该“连锁累赘”也可以导致产量下降或其他负面农艺学特征。这有时也称为“产量累赘”。侧接区域的大小可以通过附加的回交而减小,虽然这并不总是成功的,因为育种人员不能控制该区域或重组断点的大小。Young等人,Genetics[遗传学]120:579(1998)。在经典育种中,通常只是偶然地,选择了有助于减小供体区段大小的重组。Tanksley等人,Biotechnology[生物技术]7:257(1989)。即使在20次回交后,可以预期找到相当大的仍然与所述基因连锁的供体染色体碎片被选择。然而如果使用标记的话,就可以选取那些在目的基因附近经历了重组的稀有个体。在150株回交植物中,有95%的机会,至少一株植物将经历该基因的1cM(基于单次减数分裂图距)内的杂交。标记允许明确鉴定这些个体。使用300株植物的一次附加回交,在该基因另一侧的1cM单次减数分裂图距内有95%的杂交概率,从而产生在基于单次减数分裂图距的小于2cM的靶基因附近的区段。这用标记可以在两代中实现,而不用标记时则需要平均100代。参见Tanksley等人,同上。当基因的确切定位已知时,围绕该基因的侧接标记可用于在不同的群体大小中对重组进行选择。例如,在更小的群体中,预期重组可以进一步远离该基因,因此需要更远端的侧接标记来检测该重组。

包含密度增强的公开玉蜀黍标记的玉蜀黍基因组的整合连锁图谱的可用性促进了玉蜀黍遗传作图和MAS。参见,例如IBM2邻接(IBM2Neighbors)图谱,该图谱可在MaizeGDB网站上在线获得。

在所有分子标记类型中,SNP是最丰富的,并且具有提供最高遗传图谱分辨率的潜力。Bhattramakki等人,Plant Molecular Biology[植物分子生物学]48:539(2002)。能以所谓的“超高通量”方式测定SNP,因为它们不需要大量的核酸,并且该测定的自动化是直接的。SNP也有成为相对低成本的系统的益处。这三个因素一起使得将SNP用于MAS中具有高度的吸引力。可利用如下几种方法用于SNP基因分型,包括但不限于:杂交、引物延伸、寡核苷酸连接、核酸酶切割、微测序和编码球(coded sphere)。此类方法已经在各种公开中综述:Gut,Hum.Mutat.[人类突变]17:475(2001);Shi,Clin.Chem.[临床化学]47:164(2001);Kwok,Pharmacogenomics[药物基因组学]1:95(2000);Bhattramakki和Rafalski,Discovery and application of single nucleotide polymorphism markers in plants[单核苷酸多态性标记在植物中的发现和应用],在PLANT GENOTYPING:THE DNA FINGERPRINTING OF PLANTS[植物基因分型:植物DNA指纹图谱],CABI出版社,瓦林福德(Wallingford)(2001)。大范围的可商购的技术利用这些和其他方法询问SNP,包括MasscodeTM(德国凯杰公司(Qiagen),Germantown,MD)、(好乐杰公司(Hologic),麦迪逊,WI)、(应用生物系统公司(Applied Biosystems),福斯特市,CA)、(应用生物系统公司(Applied Biosystems),福斯特市,CA)和BeadarraysTM(亿明达公司(Illumina),圣地亚哥,CA)。

可以使用序列内或跨连锁序列的许多SNP来描述任何特定基因型的单倍型。Ching等人,BMC Genet.[BMC遗传学]3:19(2002);Gupta等人,(2001),Rafalski,Plant Science[植物科学]162:329(2002b)。单倍型可以比单个SNP更具信息性,并且可以更详细地描述任何特定的基因型。例如,对于特定的耐旱性品系或品种,单个SNP可以是等位基因“T”,但等位基因“T”也可以出现在用于轮回亲本的玉米育种群体中。在这种情况下,连锁SNP的等位基因的组合可以更具信息性。一旦将独特的单倍型分配给供体染色体区域,该单倍型可以用于该群体或其任何亚群中以确定个体是否具有特定的基因。使用本领域普通技术人员已知的自动化高通量标记检测平台使得该方法高效且有效。

本披露的主题的标记可以用于标记辅助选择方案中以鉴定和/或选择具有提高的耐旱性的子代。此类方法可以包括使第一玉米植物或种质与第二玉米植物或种质杂交,或基本上由其组成或由其组成,其中该第一玉米植物或种质包含与提高的耐旱性相关的标记,并选择拥有该标记的子代植物。第一和第二玉米植物之一或两者可以是非天然存在的玉米种类。

III.B.基因渗入目的等位基因和/或单倍型的方法

因此,在一些实施例中,本披露的主题提供将与提高的耐旱性相关的等位基因基因渗入缺乏所述等位基因的遗传背景中的方法。在一些实施例中,该方法包括将包含所述等位基因的供体与缺乏所述等位基因的轮回亲本杂交;并将包含所述等位基因的子代与轮回亲本重复回交,其中所述子代通过在其基因组中检测在染色体区间内存在标记来鉴定,该组有以下组成:

(a)由碱基对(bp)位置272937470至碱基对(bp)位置272938270定义(并包括)的在染色体1上的染色体区间(PZE01271951242);

(b)由碱基对(bp)位置12023306至碱基对(bp)位置12024104定义(并包括)的在染色体2上的染色体区间(PZE0211924330);

(c)由碱基对(bp)位置225037202至碱基对(bp)位置225038002定义(并包括)的在染色体3上的染色体区间(PZE03223368820);

(d)由碱基对(bp)位置225340531至碱基对(bp)位置225341331定义(并包括)的在染色体3上的染色体区间(PZE03223703236);

(e)由碱基对(bp)位置159,120,801至碱基对(bp)位置159,121,601定义(并包括)的在染色体5上的染色体区间(PZE05158466685);

(f)由碱基对(bp)位置12104536至碱基对(bp)位置12105336定义(并包括)的在染色体9上的染色体区间(PZE0911973339);

(g)由碱基对(bp)位置225343590至碱基对(bp)位置225340433定义(并包括)的在染色体9上的染色体区间(S_18791654);

(h)由碱基对(bp)位置14764415至碱基对(bp)位置14765098定义(并包括)的在染色体10上的染色体区间(S_20808011);并从而生产在包含与轮回亲本的遗传背景中提高的耐旱性相关的所述等位基因的耐旱性玉米植物或种质,由此将与提高的耐旱性相关的等位基因基因渗入至缺乏所述等位基因的遗传背景。在一些实施例中,包含与提高的耐旱性相关的所述等位基因的所述耐旱性玉米植物或种质的基因组与轮回亲本的基因组是至少约95%同一性。在一些实施例中,供体或轮回亲本之一或两者都是非天然存在的玉米品种。

因此,在一些实施例中,本披露的主题提供用于生产具有增加的产量的植物的方法,该方法包括以下步骤

a.使用选自下组的标记从多种植物群体选择,该组由以下组成:标记SM2973、SM2980、SM2982、SM2984、SM2987、SM2991、SM2995、SM2996;

b.繁殖/自交植物。

在方法的另外的实施例中,本披露的主题提供用于生产具有增加的产量的植物的方法,该方法包括以下步骤:

a.使用选自下组的标记从多种植物群体选择,该组由以下组成:标记SM2973、SM2980、SM2982、SM2984、SM2987、SM2991、SM2995、SM2996;其中

标记SM2973在核苷酸401具有“G”;

标记SM2980在核苷酸401具有“C”;

标记SM2982在核苷酸401具有“A”;

标记SM2984在核苷酸401具有“G”;

标记SM2987在核苷酸401具有“G”;

标记SM2991在核苷酸401具有“G”;

标记SM2995在核苷酸401具有“A”;以及

标记SM2996在核苷酸401具有“A”。

III.D.堆叠目的等位基因和/或单倍型的方法

在一些实施例中,本披露的主题涉及“堆叠”与水优化相关的单倍型,以为了产生具有多个有利的水优化基因座的植物(及其部分)。作为示例而非限制,在一些实施例中,本披露的主题涉及玉蜀黍基因座的鉴定和表征,每个基因座与一个或多个水优化性状相关。这些基因座对应于SEQ ID NO:1-8和17-65,并且具有本文定义的单倍型A-M。

对于这些基因座中的每一个,已经鉴定出与水优化性状相关的有利的等位基因。这些有利的等位基因概括在本文中,例如表1-7或与表9中列出的基因紧密连锁的任何标记。本披露的主题提供了与如本文所定义的各种水优化性状的增加和减少相关的示例性等位基因(例如,如表1-7或表11中所示)。

III.E.鉴定包含目的等位基因和/或单倍型的植物的方法

用于鉴定耐旱性玉米植物或种质的方法可以包含检测与提高的耐旱性相关的标记的存在。标记可以在从植物或种质取得的任何样品中检测到,该植物或种质包括但不限于整个植物或种质、所述植物或种质的一部分(例如来自所述植物或种质的细胞)或来自所述植物或种质的核苷酸序列。玉米植物可以是非天然存在的玉米种类。在一些实施例中,玉米植物或种质的基因组与优良的玉米种类的基因组是至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、99%或100%同一性。

用于将与提高的耐旱性相关的等位基因基因渗入玉米植物或种质的方法可以包括使包含所述等位基因的第一玉米植物或种质(供体)与缺乏所述等位基因的第二玉米植物或种质(轮回亲本)杂交,以及使包含所述等位基因的子代与轮回亲本重复地回交。包含所述等位基因的子代可以通过监测其基因组中与提高的耐旱性相关的标记的存在来鉴定。供体或轮回亲本之一或两者都是非天然存在的玉米品种。

IV.通过转基因方法产生携带改进的性状的玉米植物

在一些实施例中,本披露的主题涉及使用多态性(包括但不限于SNP)或赋予性状的部分用于产生携带性状的玉米植物(通过将包含该多态性的性状相关的等位基因和/或单倍型的核酸序列引入受体植物中)。

可以将具有包含水优化性状等位基因和/或单倍型的核酸序列的供体植物转移至缺乏该等位基因和/或单体型的受体植物。可以通过将携带水优化性状的供体植物与携带非性状的受体植物杂交,通过转化、通过原生质体转化或融合、通过双倍单倍体技术、通过胚胎拯救、或通过任何其他核酸转移系统来转移(例如通过基因渗入)核酸序列。然后,如果需要,可以选择包含一种或多种本披露的水优化性状等位基因和/或单倍型的子代植物。包含水优化性状等位基因和/或单倍型的核酸序列可以使用本领域已知的方法从供体植物中分离,并且分离的核酸序列可以通过转基因方法转化受体植物。这可以发生在载体、配子或其他合适的转移元件中,如涂覆有核酸序列的弹道粒子。

植物转化通常涉及构建将在植物细胞中发挥功能的表达载体,并且包括包含与水优化性状相关的等位基因和/或单倍型的核酸序列,该载体可以包含赋予水优化性状的基因。该基因通常被控制或可操作地连接至一个或多个调控元件,例如启动子。表达载体可含有一个或多个此类可操作地连接的基因/调控元件组合,条件是组合中包含的至少一个基因编码水优化性状。一种或多种载体可以是质粒的形式,并且可以单独使用或与其他质粒组合使用,以使用本领域已知的转化方法(如土壤杆菌属转化系统)提供更好的水优化植物的转基因植物。在本发明的一些实施例中,包含在本文的染色体区间中的基因可以在植物中转基因表达以产生具有提高的耐旱性的植物;此外,不受理论的限制,表9中显示的基因模型可以在植物中转基因表达以产生提高的耐旱性植物。

转化的细胞通常含有可选择标记以允许转化鉴定。该可选择标记通常适于通过负选择(通过抑制不含可选择标记基因的细胞的生长)或通过正选择(通过筛选由可选择标记基因编码的产物)来回收。用于植物转化的许多常用的可选择标记基因是本领域中是已知的,并且包括例如编码代谢解毒可以是抗生素或除草剂的选择性化学试剂的酶的基因,或编码改变的靶(其对抑制剂不敏感)的基因。本领域已知几种正选择方法,例如甘露糖选择。可替代地,可以使用无标记转化来获得没有前述标记基因的植物,这些技术也是本领域已知的。

水优化基因

在干旱下测定SM2987与增加的产量的多重正相关鉴定基因GRMZM2G027059作为水优化基因。GRMZM2G027059编码4-羟基-3-甲基丁-2-烯基二磷酸还原酶,其是异戊烯基二磷酸(IPP)和二甲基烯丙基二磷酸(DMAPP)生物合成中的最后一种酶(Arturo Guevara-Garcl′a,The Plant Cell[植物细胞],第17卷,628-643,2005年2月)。在高等植物中,两种途径用于合成碱性类异戊二烯单体。甲羟戊酸(MVA)途径发生在细胞质中,其中产生的倍半萜烯(C15)和三萜烯(C30)(如植物甾醇、多萜醇和法尼基残基)用于蛋白质异戊二烯化,甲基-D-赤藓糖醇-4-磷酸(MEP)途径发生在质粒体中,并产生用于合成类异戊二烯(如异戊二烯、类胡萝卜素、质体醌、叶绿醇缀合物(如叶绿素和生育酚)和激素(赤霉素和脱落酸))的IPP和DMAPP。有证据表明两条途径之间存在交叉对话(Hsieh和Goodman,Plant Physiology[植物生理学],2005年6月)。由于GRMZM2G027059编码4-羟基-3-甲基丁-2-烯基二磷酸还原酶,其是生物合成感光色素(如叶绿素和类胡萝卜素)以及激素(如赤霉素和脱落酸)的必需酶,因此表达此基因的植物可对非生物胁迫更耐受。

在干旱下测定SM2991与增加的产量的多重正相关鉴定基因GRMZM2G156365作为水优化基因。GRMZM2G156365属于果胶乙酰酯酶(PAE)家族。果胶乙酰酯酶催化果胶(基本细胞壁的主要化合物)的脱乙酰作用。特异表达阵列数据表明GRMZM2G156365在花粉和花药中具有非常高的表达量,并且GRMZM2G156365在耐旱性玉米杂种中比干旱敏感玉米杂种具有更高表达量。过表达杨树PAE的烟草植物(PtPAE)显示出严重的雄性不育,阻碍了花粉萌发和花粉管伸长,因此植物产生很少或不成熟的种子(Gou,J.Y.,L.M.Miller等人,(2012),“Acetylesterase-mediated deacetylation of pectin impairs cell elongation,pollen germination,and plant reproduction.[乙酰酯酶介导的果胶脱乙酰作用损害细胞伸长,花粉萌发和植物繁殖]”Plant Cell[植物细胞]24(1):50-65)。由花粉不育引起的产量损失是主要的干旱问题之一。花粉萌发和花粉管伸长要求细胞壁中果胶乙酰化的精确的状态。GRMZM2G156365可以作为结构调节剂,通过调节果胶乙酰化的精确的状态来影响细胞壁的重塑和物理化学性质,从而影响花粉细胞的延伸性。下调花粉中GRMZM2G156365基因表达的植物可能会增加非生物胁迫(如干旱)的花粉萌发。

在干旱下测定SM2995与增加的产量的多重正相关鉴定基因GRMZM2G134234作为水优化基因。GRMZM2G134234含有结构域IPR012866(功能未知的DUF1644蛋白)。此家族由许多功能未知的假定植物蛋白质中的序列组成。目的区域含有九个高度保守的半胱氨酸残基并且长度大约为160个氨基酸,这可以代表锌结合结构域。拟南芥DUF1644基因(AT3G25910)响应GA和ABA处理(Guo,C.等人,J Integr Plant Biol[综合植物生物学杂志](2015))。有来自稻DUF1644家族中9名成员可以涉及胁迫响应。SIDP364定位于细胞核,并由ABA、高盐、干旱、高温、低温和H2O2诱导。稻中的过表达增加了ABA敏感性和高耐盐性(由于脯氨酸积累和胁迫响应基因的上调)。通过调节ABA依赖或独立的信号通路SIDP361在盐胁迫中与SIDP364具有相似的功能。然而,他们对不同的胁迫(REF)有不同的响应。含有DUF1644基因的家族可调节稻对非生物胁迫的响应。在稻中过表达OsSIDP366提高了耐旱性和耐盐性并减少了水分损失,并且RNAi植物对盐度和干旱处理更敏感(Guo,C.、C.Luo等人,(2015),“OsSIDP366,a DUF1644 gene,positively regulates responses to drought and salt stresses in rice[OsSIDP366是DUF1644基因,可正向调控稻对干旱和盐胁迫的响应]”,J Integr Plant Biol[综合植物生物学杂志])。含有DUF1644的基因可以调节对非生物胁迫的响应。GRMZM2G134234可以正向调控胁迫响应基因以提高玉米胁迫耐受性。过表达GRMZM2G134234的植物对非生物胁迫(如干旱和盐胁迫)可以更耐受。

在干旱下测定SM2996与增加的产量的多重正相关鉴定基因GRMZM2G094428作为水优化基因。GRMZM2G094428含有IPR003480氯霉素转移酶结构域。酰化是植物次生代谢产物的常见和生物化学显著的修饰。命名为BAHD的大的酰基转移酶家族,其利用辅酶A硫酯并催化形成多种植物代谢产物。BAHD超家族包含一大组酶(具有较低氨基酸序列相似性)但两个共有基序(HXXXD和DFGWG)。GRMZM2G094428是与涉及细胞壁阿魏酰化/香豆酰化的BAD转移酶最相似的系统发生学(phylogenicals)。预测GRMZM2G094428涉及细胞壁阿魏酰化/香豆酰化。草类(如小麦、玉米、稻和甘蔗)的细胞壁含有两种最突出的化合物,其是对香豆酸(pCA)和阿魏酸(FA)。pCA几乎完全酯化成木质素,并且FA在细胞壁中被酯化成GAX(Lu和Ralph,1999)。已经鉴定BAHD酰基辅酶A转移酶超家族负责该过程(Hugo等人,2013)。BAHD酰基辅酶A转移酶的过表达或敲除可以改变细胞壁组成。敲除BAHD酰基辅酶A转移酶可降低FA或p-CA含量、改变木质素含量(Piston等人,2010)。OsAT10在稻中的OE可增加与基质多糖相关的酯连接的p-CA,而同时减少基质多糖相关的FA,但在营养体发育、木质素含量或木质素组成中没有明显的表型改变(Larua等人,2013)。pCAT的RNAi谱显示降低的pCA水平,但木质素水平没有变化(Jane等人,2014)。木质素和非生物胁迫(由Michael综述,2013)。作物组织的木质化影响植物的适应性并且可以赋予对非生物胁迫的耐受性。与野生型相比,具有增加的木质素水平的转基因烟草植物表现出改善的对干旱的耐受性。即使在水分充足条件下,木质素缺陷型玉米突变体也表现出干旱症状,并且其中叶片木质素水平与一组对比基因型中的耐旱性相关。当暴露于盐处理时,在根中沉积增加水平的木质素的转基因稻品系比其野生型(其没有显示出此类响应)更耐受。GRMZM2G094428可以负责最终涉及木质素生物合成的单木醇的对香豆酰化,并且还负责将FA酯化成细胞壁中的GAX。增加的木质素含量可以赋予非生物胁迫下(包括干旱和盐)的植物耐受性。

在干旱下测定SM2973与增加的产量的多重正相关鉴定基因GRMZM2G416751作为水优化基因。GRMZM2G416751与拟南芥基因AT5G58100.1的c-端450个氨基酸具有62%的同一性和83%的相似性。在spot1突变品系(SALK_061320、SALK_041228、和SALK_079847)中,At5g58100在不同区域被T-DNA插入破坏。在spot1突变中的外显子元件似乎在很大程度上分离的,表明可以具有顶盖形成问题(Dobritsa,A.A.,A.Geanconteri等人,(2011),“A large-scale genetic screen in Arabidopsis to identify genes involved in pollen exine production[在拟南芥中进行大规模的遗传筛选以鉴定参与花粉外壁生产的基因]”,Plant Physiol[植物生理学报]157(2):947-970)。由花粉不育引起的产量损失是主要的干旱问题之一。GRMZM2G416751可以参与花粉外壁形成以提高玉米胁迫耐受性。过表达这种基因的植物可以会在干旱胁迫下避免花粉不育。

在干旱下测定SM2980与增加的产量的多重正相关鉴定基因GRMZM2G467169作为水优化基因。GRMZM2G467169具有预测的人类型聚腺苷酸结合蛋白家族的保守结构域。GRMZM2G467169在叶和生殖组织中高度表达。拟南芥直系同源基因AT4G01290(RIMB3)在从叶绿体到细胞核的逆行氧化还原信号中正向调节2CPA(2-Cys-过氧化物氧还蛋白A)。rimb3突变体生长较慢具有较小叶片,较大的rimb3植物在长日照条件下有萎黄病。RIMB3在植物细胞中作为响应生物或非生物胁迫的传感器的起作用。AT4G01290蛋白结合拟南芥中的5′帽复合体。AT4G01290与UBQ3相互作用并可以被26S蛋白酶体降解。在各种生物和非生物胁迫下,发源于叶绿体的PS1中的信号(如氧化还原失衡)被传递至细胞核以影响基因表达模式(逆行信号)。GRMZM2G467169可以调节逆行信号以增加玉米胁迫耐受性。过表达这种基因的植物可以对非生物胁迫(如干旱)更耐受。

在干旱下测定SM2982与增加的产量的多重正相关鉴定基因GRMZM5G862107作为水优化基因。GRMZM5G862107含有RNA结合结构域(S1),IPR006196与拟南芥蛋白AT5G30510具有69%同一性。S1结构域与冷激蛋白非常相似(Bycroft等人,Cell[细胞],1997年1月)。冷激蛋白(CSP)含有被称为冷激结构域(CSD)的RNA结合序列,并且本领域充当RNA伴侣蛋白。CSP在细菌中的作用是适应冷胁迫。含有CSD的植物蛋白质与细菌CSP具有高水平的相似性,并显示出与细菌CSP共享体外和体内功能(Journal of Experimental Botany[实验植物学报],第62卷,第11期,第4003-4011页,2011)。据报道,含有CSD的植物蛋白质对非生物胁迫有响应。过表达这种基因的植物可以对非生物胁迫(如干旱)更耐受。

在干旱下测定SM2984与增加的产量的多重正相关鉴定基因GRMZM2G050774作为水优化基因。GRMZM2G050774编码环指(RING Finger)结构域蛋白亚型H2(C3HC4)暂定E3连接酶。据报道拟南芥中的E3连接酶(如ATL31/6)在碳和氮代谢调节中起作用(Plant Signal Behav.[植物信号与行为]2011年10月;6(10):1465-1468)。GRMZM2G050774可以涉及负责提高抗旱性的胁迫信号。

转化

氯霉素乙酰转移酶基因(Callis等人,1987,Genes Develop.[基因发展]1:1183-1200)。在同一个实验体系中,来自玉米青铜色1基因(maize bronze 1 gene)的内含子在增强表达方面具有类似效果。常规地已经将内含子序列结合到植物转化载体中,典型地在非翻译前导序列中。

“接头”是指包含两个其他多核苷酸之间的连接序列的多核苷酸。接头的长度可以是至少1个、3个、5个、8个、10个、15个、20个、30个、50个、100个、200个、500个、1000个、或2000个多核苷酸。接头可以是合成的(使得其序列不能在自然界中发现)、或者它可以天然发生(如内含子)。

“外显子”是指携带对蛋白或其一部分进行编码的序列的DNA的区段。外显子被间插的、非编码序列(内含子)分离。

“转运肽”通常是指当与目的蛋白质连接时将蛋白质导向特定组织、细胞、亚细胞位置或细胞器的肽分子。实例包括但不限于叶绿体转运肽、核靶向信号和液泡信号。为了确保定位到质体,可以使用但不限于二磷酸核酮糖羧化酶小亚基(Wolter等人,1988,PNAS 85:846-850;Nawrath等人,1994,PNAS 91:12760-12764)、NADP苹果酸脱氢酶(Galiardo等人,1995,Planta 197:324-332)、谷胱苷肽还原酶(Creissen等人,1995,Plant J[植物杂志]8:167-175)或R1蛋白质(Lorberth等人,1998,Nature Biotechnology[自然生物技术]16:473-477)的信号肽。

如本文所使用的术语“转化”是指将核酸片段转移到宿主细胞的基因组中,导致基因上稳定的遗传。在一些具体的实施例中,引入植物、植物部分和/或植物细胞中是经由细菌介导的转化、粒子轰击转化、磷酸钙介导的转化、环糊精介导的转化、电穿孔、脂质体介导的转化、纳米粒子介导的转化、聚合物介导的转化、病毒介导的核酸递送、晶须介导的核酸递送、微量注射、超声波处理法、浸润法、聚乙二醇介导的转化、原生质体转化或导致向植物、植物部分和/或其细胞引入核酸的任何其他电学、化学、物理和/或生物学机制,或其组合进行的。

用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括经由以下方式转化:细菌介导的核酸递送(例如,经由来自农杆菌属的细菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、PEG介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学、化学、物理(机械)和/或生物学机制,包括其任何组合。本领域中已知的各种植物转化方法的一般指南包括Miki等人,(“Procedures for Introducing Foreign DNA into Plants[将外源DNA引入植物中的程序]”在Plant Molecular Biology and Biotechnology[植物分子生物学和生物技术]的方法中,Glick,B.R.和Thompson,J.E.编辑(CRC Press,Inc.[CRC出版有限公司],波卡拉顿,1993),第67-88页)和Rakowoczy-Trojanowska(2002,Cell.Mol.Biol.Lett.[细胞分子生物学快报]7:849-858(2002))。

如此,在一些具体实施例中,向植物、植物部分和/或植物细胞中的引入是通过细菌介导的转化、粒子轰击转化、钙-磷酸盐介导的转化、环糊精介导的转化、电穿孔、脂质体介导的转化、纳米颗粒介导的转化、聚合物介导的转化、病毒介导的核酸递送、须介导的核酸递送、微注射、声处理、浸润、聚乙烯二醇介导的转化、以及其他的致使核酸引入该植物、植物部分和/或其细胞的电的、化学的、物理的和/或生物的机制,或其组合。

农杆菌介导的转化是用于转化植物的常用方法,因为它的高转化效率以及因为它与许多不同物种的广泛实用性。农杆菌介导的转化典型地涉及将携带外来目的DNA的二元载体转移至适当的农杆菌菌株,这可能取决于由宿主农杆菌菌株或者在共同存在的Ti质粒上或染色体地携带的vir基因的互补体(Uknes等人,1993,Plant Cell[植物细胞]5:159-169)。将该重组二元载体转移至农杆菌可以使用携带该重组二元载体的大肠杆菌,一种辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元载体移动到靶农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地,可以通过核酸转化将该重组二元载体转移至农杆菌中(和Willmitzer,1988,Nucleic Acids Res.[核酸研究]16:9877)。

通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方法。典型地在携带位于这些二元质粒T-DNA边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。

另一种用于转化植物、植物部分以及植物细胞的方法涉及在植物组织和细胞上推进惰性或生物学活性的粒子。参见,例如美国专利号4,945,050;5,036,006和5,100,792。通常,这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时,可以通过用包含目的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地,一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性粒子(例如,干燥的酵母细胞、干燥的细菌或噬菌体,各自包含一个或多个力图导入的核酸)推入植物组织中。

因此,在本发明的具体实施例中,植物细胞可以通过本领域内已知的任何方法或如在此描述地进行转化并且可以使用多种已知技术中的任一种来从这些经转化的细胞再生出完整的植物。在以下文献中描述了从植物细胞、植物组织培养物和/或培养的原生质体进行的植物再生:例如,Evans等人(Handbook of Plant Cell Cultures[植物细胞培养物手册],第1卷,麦克米兰出版公司(MacMilan Publishing Co.),纽约(1983));以及Vasil I.R.(编辑)(Cell Culture and Somatic Cell Genetics of Plants[植物的细胞培养和体细胞遗传学],学术出版社,奥兰多,第I卷(1984)和第II卷(1986))。选择转化的转基因植物、植物细胞和/或植物组织培养物的方法在本领域中是常规的,并且可以用于在此提供的本发明的方法中。

在被引入细胞中的多核苷酸的上下文中,“稳定引入”或“稳定引入的”是指所引入的多核苷酸被稳定地合并到该细胞的基因组中,并且因此该细胞用该多核苷酸进行了稳定转化。

如本文所使用的,“稳定转化”或“被稳定地转化的”意为将核酸引入到细胞中并且整合到该细胞的基因组中。按照这样,所整合的核酸能够被其子代遗传,更具体地,被多个连续世代的子代遗传。如本文所使用的,“基因组”还包括核基因组与质粒基因组,并且因此包括该核酸到例如叶绿体基因组的整合。如本文所使用的,稳定转化也可以是指以染色体外方式(例如,作为微型染色体)维持的转基因。

细胞的稳定转化可以通过例如细胞的基因组DNA与核酸序列(这些核酸序列与引入生物体(例如,植物)中的转基因的核苷酸序列特异性杂交)的DNA印迹杂交测定来检测。细胞的稳定转化可以通过例如细胞的RNA与核酸序列的RNA印迹杂交测定来检测,这些核酸序列与引入到植物或其他生物体中的转基因的核苷酸序列特异性杂交。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域熟知的其他扩增反应来进行检测,这些反应采用与转基因的一个或多个靶序列杂交的特异性引物序列,从而导致该转基因序列的扩增,这种扩增可以根据标准方法进行检测。转化还可以通过本领域熟知的直接测序和/或杂交方案进行检测。

“转化和再生过程”是指将转基因稳定地引入植物细胞并从转基因植物细胞再生植物的过程。如本文所使用的,转化和再生包括选择过程,通过该过程转基因包括选择性标记,并且转化的细胞已经并入并表达转基因,使得转化的细胞将在选择剂存在下存活并发育繁盛。“再生”是指从植物细胞、一组植物细胞、或植物片(如来自原生质体、愈伤组织、或组织部分的)长成整个植物。

“选择性标记”或“选择性标记基因”是指一种基因,该基因在一种植物细胞中的表达给予该细胞一种选择优势。“正向选择”是指转化的细胞,该转化的细胞获得其以前不能使用或不能有效使用的底物代谢能力,典型地通过转化并表达正向选择性标记基因。因此,这种转化的细胞从非转化组织的群中生长出来。正向选择可以是来自植物生长调节剂的无活性形式的许多类型,然后通过转移的酶转化为活性形式来转化碳水化合物来源,这些碳水化合物来源不被非转化细胞(例如甘露糖)有效利用,其然后在转化后可得到酶,例如磷酸甘露糖异构酶,使其能够被代谢。与转化的细胞相比,非转化的细胞生长缓慢或根本不生长。与非转化细胞生长能力相比,其他类型的选择可能是由于用选择性标记基因的细胞转化,该选择性标记基因获得在阴性选择试剂(例如抗生素或除草剂)存在下生长的能力。转化细胞所具有的选择优势还可以是由于在所谓“阴性选择”中失去以前具有的基因。在这种情况下,所添加的化合物只对未失去亲本细胞(通常是转基因)中存在的特异性基因(阴性选择标记基因)的细胞具有毒性。

选择性标记的实例包括但不限于,提供对以下抗生素抗性或耐受性的基因,如卡那霉素(Dekeyser等人,1989,Plant Phys[植物生理学]90:217-23)、壮观霉素(Svab和Maliga,1993,Plant Mol Biol[植物分子生物学]14:197-205)、链霉素(Maliga等人,1988,Mol Gen Genet[分子基因遗传]214:456-459)、潮霉素B(Waldron等人,1985,Plant Mol Biol[植物分子生物学]5:103-108)、博来霉素(Hille等人,1986,Plant Mol Biol[植物分子生物学]7:171-176)、磺胺剂(sulphonamides)(Guerineau等人,1990,Plant Mol Biol[植物分子生物学]15:127-136)、链丝菌素(Jelenska等人,2000,Plant Cell Rep[植物细胞报告]19:298-303)、或氯霉素(De Block等人,1984,EMBO J 3:1681-1689)。其他可选择标记包括提供对除草剂抗性或耐受性的基因,如赋予除草剂(包括磺胺尿素类、咪唑啉酮类、三唑嘧啶类、和嘧啶基硫代苯酸盐类(thiobenzoates))耐受性的乙酰乳酸合酶(ALS)的S4和/或Hra突变;5-烯醇-丙酮-莽草酸-3-磷酸-合酶(EPSPS)基因,包括但不限于描述在美国专利号4,940,935、5,188,642、5,633,435、6,566,587、7,674,598中的那些(连同全部相关的应用)和草甘膦N-乙酰转移酶(GAT),其赋予对草甘膦的耐受性(Castle等人,2004,Science[科学]304:1151-1154,和美国专利申请公开号20070004912、20050246798、和20050060767);BAR,其赋予对草铵膦的耐受性(参见例如美国专利号5,561,236);芳氧基链烷酸酯双加氧酶(aryloxy alkanoate dioxygenase)或AAD-1、AAD-12、或AAD-13,其赋予对2,4-D的耐受性;如假单胞菌HPPD的基因,其赋予对HPPD耐受性;卟啉酮氧化酶(PPO)突变体和变体,其赋予对过氧化除草剂的抗性,这些除草剂包括氟磺胺草醚、氟羧草醚钠、乙氧氟草醚、乳氟禾草灵、氟噻甲草酯、嘧啶肟草醚、丙炔氟草胺、氟烯草酸、唑酮草酯、甲磺草胺;以及赋予对麦草畏耐受性的基因,如麦草畏单加氧酶(Herman等人,2005,J Biol Chem[生物化学杂志]280:24759-24767和美国专利号7,812,224,以及相关的申请和专利)。选择性标记的其他实例可以在Sundar和Sakthivel(2008,J Plant Physiology[植物生理学杂志]165:1698-1716)中发现,通过引用结合在此。

其他选择系统包括使用药物、代谢物类似物、代谢中间体和酶用于转基因植物的正向选择或有条件的正向选择。实例包括但不限于编码其中甘露糖是选择剂的磷酸甘露糖异构酶(PMI)的基因,或编码其中D-木糖是选择试剂的木糖异构酶的基因(Haldrup等人,1998,Plant Mol Biol[植物分子生物学]37:287-96)。最后,其他选择系统可以使用无激素培养基作为选择剂。一个非限制性实例玉米同源盒基因kn1,其异位表达导致转化效率3倍增加(Luo等人,2006,Plant Cell Rep[植物细胞报告]25:403-409)。各种选择性标记和编码他们的基因的实例披露在Miki和McHugh(J Biotechnol[生物技术杂志],2004,107:193-232;通过引用结合)中。

在本发明的一些实施例,该选择性标记可以是植物衍生的。可以是植物衍生的选择性标记的实例包括但不限于5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS)。酶5-烯醇丙酮莽草酸-3-磷酸合酶(EPSPS)催化植物中芳香族氨基酸生物合成常见的莽草酸通路中的重要步骤。除草剂草甘膦抑制EPSPS,因此杀死植物。可以通过引入修饰的EPSPS转基因产生转基因草甘膦耐受植物,该植物不由草甘膦影响(例如美国专利6,040,497;通过引用结合)。在草甘膦的存在下可以被用作选择性标记的修饰的植物EPSPS的其他实例包括稻EPSPS的P106L突变(Zhou等人,2006,Plant Physiol[植物生理学]140:184-195)和在蟋蟀草EPSPS中的P106S突变(Baerson等人,2002,Plant Physiol[植物生理学]129:1265-1275)。不是植物来源的并可以被赋予草甘膦耐受性EPSPS的其他来源包括但不限于来自鼠伤寒沙门氏菌的EPSPS P101S突变(Comai等人,1985,Nature[自然]317:741-744)以及来自土壤杆菌属菌株CP4的CP4 EPSPS的突变版本(Funke等人,2006,PNAS 103:13010-13015)。尽管植物EPSPS基因是细胞核,但是成熟酶位于叶绿体(Mousdale和Coggins,1985,Planta[植物]163:241-249)。EPSPS合成为包含转运肽的前蛋白,随后该前体随后转运至叶绿体基质中并进行蛋白质水解以产生成熟酶(della-Cioppa等人,1986,PNAS 83:6873-6877)。因此,为了产生对草甘膦具有耐受性的转基因植物,可以引入正确地易位至叶绿体的EPSPS的适当的突变形式。然后此类转基因植物具有天然的、基因组的EPSPS基因,连同突变的EPSPS转基因。然后草甘膦可以被用作在转化和再生过程中的选择剂,由此仅用突变的EPSPS转基因成功地转化的那些植物或植物组织存活。

如本文所使用的,术语“启动子”和“启动子序列”是指调节转录起始中涉及的核酸序列。“植物启动子”是能够起始植物细胞中的转录的启动子。示例性植物启动子包括但不局限于从植物、从植物病毒以及从包含在植物细胞中表达的基因的细菌(如农杆菌或根瘤菌)获得的那些启动子。“组织特异性启动子”是在某些组织(或组织的组合)中优先起始转录的启动子。“胁迫诱导型启动子”是在某些环境条件(或环境条件的组合)下优先起始转录的启动子。“发育阶段特异性启动子”是在某些发育阶段(或发育阶段的组合)过程中优先起始转录的启动子。

如本文所使用的,术语“调节序列”是指位于编码序列上游(5′非编码序列)、内部或下游(3′非编码序列)并影响所关联的编码序列的转录、RNA加工或稳定性、或翻译的核苷酸序列。调节序列包括但不限于,启动子、增强子、外显子、内含子、翻译前导序列、终止信号、以及多腺苷酸化信号序列。调节序列包括自然序列以及合成序列、连同可以是合成序列与自然序列的组合的多个序列。“增强子”是一个核苷酸序列,它可以刺激启动子的活性,并且可以是该启动子或插入的异源元件的一个固有元件以增强启动子的水平或组织特异性。编码序列可以存在于双链DNA分子中的任一个链上,并且甚至当放置在启动子的上游或下游时能够发挥功能。

一些实施例包括过表达一个或多个SEQ ID NO:9-16,和/或降低SEQ ID NO:9-16的表达和/或浓度(例如水平)。在一些实施例中,本发明的方法和/或组合物可以用于以组织特异性方式过表达一个或多个SEQ ID NO:9-16,和/或降低SEQ ID NO:9-16的表达和/或浓度。例如,一个或多个SEQ ID NO:9-16可以可操作地连接至组织特异性启动子序列以提供一个或多个SEQ ID NO:9-16的组织特异性表达(例如,根-和/或绿色组织特异性表达)。在一些实施例中,提供一个或多个SEQ ID NO:9-16的过表达或组织特异性表达可在干旱胁迫条件下增加产量、增加产量稳定性,和/或增强植物和/或植物部分(其中所述蛋白质被表达)中的干旱胁迫耐受性。

在本发明的一些实施例中,提供了在其基因组中引入水优化基因的植物,其中所述水优化基因包含编码至少一种包含SEQ ID NO:9-16的多肽的核苷酸序列。

在一些实施例中,与对照植物相比,所述植物具有增加的产量。

在一些实施例中,增加的产量是在水分亏缺条件下的产量。

在一些实施例中,所述植物的亲本系由与SEQ ID NO:1-8中任一个退火的核苷酸探针或引物选择或鉴定,并且所述亲本品系赋予与不包含EQ ID NO:1-8的植物相比增加的产量。

在一些实施例中,通过异源表达引入所述基因。在一些实施例中,通过基因编辑引入所述基因。在一些实施例中,通过育种或性状基因渗入引入所述基因。

在一些实施例中,核酸序列包含SEQ ID NO:1-8中的任一个。

在一些实施例中,增加的产量是在水分亏缺条件下的产量。

在一些实施例中,所述植物是玉米。

在一些实施例中,所述植物是优良玉米品系或杂种。

在一些实施例中,所述基因是与SEQ ID NO:1-8中的任一个具有80%至100%序列同源性的核苷酸序列。

在一些实施例中,所述植物还包含至少一个单倍型A-M。

在一些实施例中,提供了来自前述实施例中任一个的植物的植物细胞、种质、花粉、种子或植物部分。

在一些实施例中,提供了基于SEQ ID NO:1-8中任一个的检测选择或鉴定的基因分型的植物、植物细胞、种质、花粉、种子或植物部分。

在本发明的一些实施例中,通过来自所述植物、植物细胞、种质、花粉、种子或植物部分的分离DNA来对植物、植物细胞、种质、花粉、种子或植物部分进行基因分型,并使用PCR或核苷酸探针基因分型DNA,其符合SEQ ID NO 1-8中的任一个。

在另一个实施例中,选择第一玉米植物或种质的方法,该植物或种质在干旱条件下增加的产量或在非干旱条件下增加的产量,该方法包括:a)从第一玉米植物或种质分离核酸;b)在第一玉米植物或种质中检测与干旱下有增加的产量相关的数量性状基因座的至少一种等位基因,其中所述数量性状基因座定位于染色体区间,该染色体区间侧接并包括以下标记:在染色体1上的IIM56014和IIM48939、在染色体3上的IIM39140和IIM40144、在染色体9上的IIM6931和IIM7657、在染色体2上的IIM40272和IIM41535、在染色体3上的IIM39102和IIM40144、在染色体5上的IIM25303和IIM48513、在染色体9上的IIM4047和IIM4978、在染色体10上的和IIMl9和IIM818;以及c)选择所述第一玉米植物或种质,或者选择所述第一玉米植物或种质的子代,该子代包含在干旱下增加的产量相关的至少一个等位基因。另外的方法,其中所述数量性状基因座定位于以下染色体区间:该染色体区间侧接并包括在染色体1上的IIM56705和IIM56748;该染色体区间侧接并包括在染色体3上的IIM39914和IIM39941;该染色体区间侧接并包括在染色体9上的IIM7249和IIM7272;该染色体区间侧接并包括在染色体2上的IIM40719和IIM40771;该染色体区间侧接并包括在染色体3上的IIM39900和IIM39935;该染色体区间侧接并包括在染色体5上的IIM25799和IIM25806;该染色体区间侧接并包括在染色体9上的IIM4345和IIM4458;该染色体区间侧接并包括在染色体10上的IIM46822和IIM62316。进一步包含使所述选择的第一玉米植物或种质与第二玉米植物或种质杂交的方法,并且其中基因渗入的玉米植物或种质在干旱下展示增加的产量。进一步其中使用包含可检测标记的组合物可检测至少一个等位基因的实施例。

在另一个实施例中,基因渗入水优化基因座的方法,该方法包括:a)提供玉米植物的第一群体;b)检测第一群体中的与水优化相关的、并且紧密连锁至以及在SM2987的24Mb内的遗传标记的存在;c)从玉米植物的第一群体中选择具有水优化基因座的一个或多个植物;以及d)从具有水优化基因座的一个或多个植物生产后代,其中与第一群体相比,该后代展示改进的水优化。其中检测的遗传标记在SM2987的10Mb;SM2987的5Mb;SM2987的1Mb;SM2987的0.5Mb内的实施例。其中检测的遗传标记在以下任一个内的实施例:由IIM56014和IIM48939组成并侧接的染色体区间;由IIM59859和IIM57051组成并侧接的染色体区间;或由IIM56705和IIM56748组成并侧接的染色体区间。在另外的方面,其中遗传标记选自以下任一个或与以下任一个紧密相关的实施例:IIM56014、IIM56027、IIM56145、IIM56112、IIM56097、IIM56166、IIM56167、IIM56176、IIM56246、IIM56250、IIM56256、IIM56261、IIM56399、IIM59999、IIM59859、IIM59860、IIM56462、IIM56470、IIM56472、IIM56483、IIM56526、IIM56539、IIM56578、IIM56602、IIM56610、IIM56611、IIM61006、IIM56626、IIM56658,IIM56671、IIM58395、IIM48879、IIM48880、IIM56700、IIM56705、SM2987、IIM56731、IIM56746、IIM56748、IIM56759、IIM56770、IIM56772、IIM69710、IIM56795、IIM56910、IIM69670、IIM59541、IIM56918、IIM48891、IIM48892、IIM58609、IIM56962、IIM56965、IIM57051、IIM57340、IIM57586、IIM57589、IIM57605、IIM57609、IIM57611、IIM57612、IIM57620、IIM57626、和IIM48939。另一方面是从此实施例产生的玉米植物(硬茎或非硬茎)。

在另一个实施例中,基因渗入水优化基因座的方法,该方法包括:a)提供玉米植物的第一群体;b)检测第一群体中的与水优化相关的、并且紧密连锁至以及在SM2996的10Mb内的遗传标记的存在;c)从玉米植物的第一群体中选择具有水优化基因座的一个或多个植物;以及d)从具有水优化基因座的一个或多个植物生产后代,其中与第一群体相比,该后代展示改进的水优化。进一步其中检测的遗传标记在SM2996的0.5Mb、1Mb、2Mb或5Mb内的实施例。在另外的方面,遗传标记在包含以下的任何的染色体区间内:由IIM39140和IIM40144组成并侧接的染色体区间;由IIM39732和IIM40055组成并侧接的染色体区间;由IIM39914和IIM39941组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组由以下组成:IIM39140、IIM39142、IIM39334、IIM39347、IIM39377、IIM39378、IIM39380、IIM39381、IIM39383、IIM39384、IIM39385、IIM39386、IIM39390、IIM39453、IIM39485、IIM39496、IIM39527、IIM39715、IIM39716、IIM39725、IIM39726、IIM39731、IIM39729、IIM39728、IIM39732、IIM39771、IIM39784、IIM39783、IIM39786、IIM39787、IIM39802、IIM39856、IIM39870、IIM39873、IIM39877、IIM39883、IIM39900、IIM39914、IIM39935、IIM39941、IIM39976、IIM39990、IIM39994、IIM40032、IIM40033、IIM40045、IIM40046、IIM40047、IIM48771、IIM40055、IIM40060、IIM40061、IIM40062、IIM40064、IIM40094、IIM40095、IIM40096、IIM40099、IIM40144,或是以上的任何紧密连锁的标记。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

另外的实施例包含基因渗入水优化基因座的方法,该方法包括:a)提供玉米植物的第一群体;b)检测第一群体中的与水优化相关的、并且紧密连锁至以及在SM2982的12Mb内的遗传标记的存在;c)从玉米植物的第一群体中选择具有水优化基因座的一个或多个植物;以及d)从具有水优化基因座的一个或多个植物生产后代,其中与第一群体相比,该后代展示改进的水优化。实施例的另外的方面,其中检测的遗传标记在SM2982的5Mb、2Mb、1Mb或0.5Mb内。另外的方面,其中检测的遗传标记在包含以下染色体区间的任一个内:由IIM6931和IIM7657定义并侧接的染色体区间;由IIM7117和IIM7427组成并侧接的染色体区间;由IIM7204和IIM7273组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM6931、IIM6934、IIM6946、IIM6961、IIM7041、IIM7054、IIM7055、IIM7086、IIM7101、IIM7104、IIM7105、IIM7109、IIM7110、IIM7114、IIM7117、IIM7141、IIM7151、IIM7151、IIM7163、IIM7168、IIM7166、IIM7178、IIM7184、IIM7183、IIM7204、IIM7231、IIM7235、IIM7249、IIM7272、IIM7273、IIM7275、IIM7284、IIM7283、IIM7285、IIM7318、IIM7319、IIM7345、IIM7351、IIM7354、IIM7384、IIM7386、IIM7388、IIM7397、IIM7417、IIM7427、IIM7463、IIM7480、IIM7481、IIM7548、IIM7613、IIM7616、IIM48034、IIM7636、IIM7653、IIM7657。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

另一个实施例包含将水优化基因座基因渗入玉米植物中的方法,该方法包括以下步骤:a)提供玉米植物的第一群体;b)检测第一群体中的与水优化相关的、并且紧密连锁至以及在SM2991的10Mb内的遗传标记的存在;c)从玉米植物的第一群体中选择具有水优化基因座的一个或多个植物;以及d)从具有水优化基因座的一个或多个植物生产后代,其中与第一群体相比,该后代展示改进的水优化。实施例的另外的方面,其中检测的遗传标记在SM2991的5Mb、2Mb、1Mb或0.5Mb内。另一方面,其中检测的遗传标记在选自下组的染色体区间内,该组由以下组成:由IIM40272和IIM41535定义并侧接的染色体区间;由IIM40486和IIM40771组成并侧接的染色体区间;由IIM40646和IIM40768组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM40272、IIM40279、IIM40301、IIM40310、IIM40311、IIM40440、IIM40442、IIM40463、IIM40486、IIM40522、IIM40627、IIM40646、IIM40709、IIM40719、IIM40768、IIM40771、IIM40775、IIM40788、IIM40789、IIM40790、IIM40795、IIM40802、IIM40804、IIM40837、IIM40839、IIM40848、IIM47120、IIM40862、IIM40863、IIM40888、IIM40893、IIM40909、IIM40928、IIM40931、IIM40932、IIM40940、IIM47155、IIM40936、IIM47156、IIM40991、IIM40998、IIM41001、IIM41008、IIM41013、IIM41033、IIM41064、IIM41153、IIM41229、IIM41230、IIM41247、IIM41259、IIM41261、IIM41263、IIM41283、IIM41287、IIM41310、IIM41321、IIM41359、IIM41357、IIM41366、IIM41377、IIM46720、IIM41412、IIM41430、IIM41448、IIM41456、IIM49103、IIM41479、IIM41509、IIM41535或其紧密相关的标记。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

在另一个实施例中,基因渗入水优化基因座的方法,该方法包括以下步骤:a)提供玉米植物的第一群体;b)检测第一群体中的与水优化相关的、并且紧密连锁至以及在SM2995的10Mb、5Mb、2Mb、1Mb或0.5Mb内的遗传标记的存在;c)从玉米植物的第一群体中选择具有水优化基因座的一个或多个植物;以及d)从具有水优化基因座的一个或多个植物生产后代,其中与第一群体相比,该后代展示改进的水优化。另一方面,其中检测的遗传标记在选自下组的染色体区间内,该组由以下组成:由IIM39102和IIM40144组成并侧接的染色体区间;由IIM39732和IIM40064组成并侧接的染色体区间;由IIM39900和IIM39935组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM39102、IIM39140、IIM39142、IIM39283、IIM39291、IIM39298、IIM39300、IIM39301、IIM39304、IIM39306、IIM39309、IIM39334、IIM39335、IIM39336、IIM39340、IIM39347、IIM39375、IIM39377、IIM39378、IM39380、IIM39381、IIM39383、IIM39384、IIM39385、IIM39386、IIM39390、IIM39401、IIM39409、IIM39447、IIM39497、IIM39715、IIM39716、IIM39731、IIM39732、IIM39830、IIM39856、IIM39870、IIM39873、IIM39877、IIM39883、IIM39900、IIM39935、IIM39989、IIM40045、IIM40062、IIM40064、IIM40144或其紧密相关的标记。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

在另一个实施例中,将水优化基因座基因渗入玉米植物中的方法,该方法包括以下步骤:a)提供玉米植物的第一群体;b)检测第一群体中的与水优化相关的、并且紧密连锁至以及在SM2973的20Mb、10Mb、5Mb、2Mb、1Mb或0.5Mb内的遗传标记的存在;c)从玉米植物的第一群体中选择具有水优化基因座的一个或多个植物;以及d)从具有水优化基因座的一个或多个植物生产后代,其中与第一群体相比,该后代展示改进的水优化。另一方面,其中检测的遗传标记在选自下组的染色体区间内,该组由以下组成:由IIM25303和IIM48513组成并侧接的染色体区间;由IIM25545和IIM25938组成并侧接的染色体区间;由IIM25800和IIM25805组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM25303、IIM25304、IIM25320、IIM25350、IIM25391、IIM25399、IIM25400、IIM25402、IIM25407、IIM25414、IIM25429、IIM25442、IIM25449、IIM25526、IIM25543、IIM25545、IIM25600、IIM25688、IIM25694、IIM25731、IIM25740、IIM25799、IIM25800、IIM25805、IIM25806、IIM25819、IIM25820、IIM25821、IIM25823、IIM25824、IIM25828、IIM25830、IIM25856、IIM25864、IIM25870、IIM25895、IIM25905、IIM25921、IIM25938、IIM25939、IIM25945、IIM25965、IIM25966、IIM25968、IIM25975、IIM25978、IIM25983、IIM25984、IIM25987、IIM25999、IIM25999、IIM26009、IIM26023、IIM26084、IIM26119、IIM26132、IIM26133、IIM26145、IIM26151、IIM48428、IIM26170、IIM26175、IIM26226、IIM26263、IIM26264、IIM26267、IIM26268、IIM26271、IIM26272、IIM26273、IIM26274、IIM26291、IIM26319、IIM26323、IIM26325、IIM26383、IIM26402、IIM26493、IIM26495、IIM48513或其紧密相关的标记。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

包含将水优化基因座基因渗入玉米植物中的方法的另一个实施例,该方法包括以下步骤:a)提供玉米植物的第一群体;b)检测第一群体中的与水优化相关的、并且紧密连锁至以及在SM2980的10Mb、5Mb、2Mb、1Mb或0.5Mb内的遗传标记的存在;c)从玉米植物的第一群体中选择具有水优化基因座的一个或多个植物;以及d)从具有水优化基因座的一个或多个植物生产后代,其中与第一群体相比,该后代展示改进的水优化。另一方面,其中检测的遗传标记在选自下组的染色体区间内,该组由以下组成:由IIM4047和IIM4978组成并侧接的染色体区间;由IIM4231和IIM4607组成并侧接的染色体区间;或由IIM4395和IIM4458组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM4047、IIM4046、IIM4044、IIM4038、IIM4109、IIM4121、IIM4143、IIM4177、IIM4203、IIM4212、IIM4214、IIM4214、IIM4215、IIM4219、IIM4226、IIM4227、IIM4229、IIM4231、IIM4232、IIM4233、IIM4235、IIM4236、IIM4237、IIM4239、IIM4239、IIM4240、IIM4241、IIM4242、IIM4244、IIM4255、IIM4263、IIM4264、IIM4265、IIM4308、IIM4295、IIM4289、IIM4280、IIM4345、IIM4387、IIM4387、IIM4388、IIM4388、IIM4389、IIM4390、IIM4390、IIM4392、IIM4395、IIM4458、IIM4469、IIM4482、IIM4607、IIM4608、IIM4609、IIM4613、IIM4614、IIM4674、IIM4681、IIM4682、IIM4738、IIM4755、IIM4756、IIM4768、IIM4777、IIM4816、IIM4818、IIM4822、IIM4831、IIM4851、IIM4856、IIM47276、IIM4857、IIM4858、IIM4859、IIM4860、IIM4875、IIM4878、IIM4967、IIM4974、IIM4978或其紧密相关的标记。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

包含将水优化基因座基因渗入玉米植物中的方法的另一个实施例,该方法包括以下步骤:a)提供玉米植物的第一群体;b)检测第一群体中的与水优化相关的、并且紧密连锁至以及在SM2984的5Mb、4Mb、2Mb、1Mb或0.5Mb内的遗传标记的存在;c)从玉米植物的第一群体中选择具有水优化基因座的一个或多个植物;以及d)从具有水优化基因座的一个或多个植物生产后代,其中与第一群体相比,该后代展示改进的水优化。另一方面,其中检测的遗传标记在选自下组的染色体区间内,该组由以下组成:由IIM19和IIM818组成并侧接的染色体区间;由IIM43和IIM291组成并侧接的染色体区间,或由IIM121和IIM211组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM19、IIM26、IIM32、IIM43、IIM66、IIM72、IIM78、IIM77、IIM84、IIM108、IIM121、IIM46822、IIM211、IIM236、IIM274、IIM275、IIM291、IIM347、IIM47190、IIM638、IIM738、IIM739、IIM818或其紧密相关的标记。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

在另一个实施例中,基因渗入水优化基因座的方法,该方法包括:a)提供玉米植物的第一群体;b)检测第一群体中的与水优化相关的、并且紧密连锁至以及在SM2987的24Mb内的遗传标记的存在;c)从玉米植物的第一群体中选择具有水优化基因座的一个或多个植物;以及d)从具有水优化基因座的一个或多个植物生产后代,其中与第一群体相比,该后代展示改进的水优化。实施例中,其中检测的遗传标记在SM2987的10Mb;SM2987的5Mb;SM2987的1Mb;SM2987的0.5Mb内。其中检测的遗传标记在以下任一个内的实施例:由IIM56014和IIM48939组成并侧接的染色体区间;由IIM59859和IIM57051组成并侧接的染色体区间;或由IIM56705和IIM56748组成并侧接的染色体区间。在另外的方面,其中遗传标记选自以下任一个或与以下任一个紧密相关的实施例:IIM56014、IIM56027、IIM56145、IIM56112、IIM56097、IIM56166、IIM56167、IIM56176、IIM56246、IIM56250、IIM56256、IIM56261、IIM56399、IIM59999、IIM59859、IIM59860、IIM56462、IIM56470、IIM56472、IIM56483、IIM56526、IIM56539、IIM56578、IIM56602、IIM56610、IIM56611、IIM61006、IIM56626、IIM56658,IIM56671、IIM58395、IIM48879、IIM48880、IIM56700、IIM56705、SM2987、IIM56731、IIM56746、IIM56748、IIM56759、IIM56770、IIM56772、IIM69710、IIM56795、IIM56910、IIM69670、IIM59541、IIM56918、IIM48891、IIM48892、IIM58609、IIM56962、IIM56965、IIM57051、IIM57340、IIM57586、IIM57589、IIM57605、IIM57609、IIM57611、IIM57612、IIM57620、IIM57626、和IIM48939。另一方面是从此实施例产生的玉米植物(硬茎或非硬茎)。

在另一个实施例中,基因渗入水优化基因座的方法,该方法包括:a)提供玉米植物的第一群体;b)检测第一群体中的与水优化相关的、并且紧密连锁至以及在SM2996的10Mb内的遗传标记的存在;c)从玉米植物的第一群体中选择具有水优化基因座的一个或多个植物;以及d)从具有水优化基因座的一个或多个植物生产后代,其中与第一群体相比,该后代展示改进的水优化。进一步其中检测的遗传标记在SM2996的0.5Mb、1Mb、2Mb或5Mb内的实施例。在另外的方面,遗传标记在包含以下的任何的染色体区间内:由IIM39140和IIM40144组成并侧接的染色体区间、由IIM39732和IIM40055组成并侧接的染色体区间、或由IIM39914和IIM39941组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组由以下组成:IIM39140、IIM39142、IIM39334、IIM39347、IIM39377、IIM39378、IIM39380、IIM39381、IIM39383、IIM39384、IIM39385、IIM39386、IIM39390、IIM39453、IIM39485、IIM39496、IIM39527、IIM39715、IIM39716、IIM39725、IIM39726、IIM39731、IIM39729、IIM39728、IIM39732、IIM39771、IIM39784、IIM39783、IIM39786、IIM39787、IIM39802、IIM39856、IIM39870、IIM39873、IIM39877、IIM39883、IIM39900、IIM39914、IIM39935、IIM39941、IIM39976、IIM39990、IIM39994、IIM40032、IIM40033、IIM40045、IIM40046、IIM40047、IIM48771、IIM40055、IIM40060、IIM40061、IIM40062、IIM40064、IIM40094、IIM40095、IIM40096、IIM40099、IIM40144,或是以上的任何紧密连锁的标记。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

另外的实施例包含基因渗入水优化基因座的方法,该方法包括:a)提供玉米植物的第一群体;b)检测第一群体中的与水优化相关的、并且紧密连锁至以及在SM2982的12Mb内的遗传标记的存在;c)从玉米植物的第一群体中选择具有水优化基因座的一个或多个植物;以及d)从具有水优化基因座的一个或多个植物生产后代,其中与第一群体相比,该后代展示改进的水优化。实施例的另外的方面,其中检测的遗传标记在SM2982的5Mb、2Mb、1Mb或0.5Mb内。另外的方面,其中检测的遗传标记在包含以下染色体区间的任一个内:由IIM6931和IIM7657定义并侧接的染色体区间;由IIM7117和IIM7427组成并侧接的染色体区间;由IIM7204和IIM7273组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM6931、IIM6934、IIM6946、IIM6961、IIM7041、IIM7054、IIM7055、IIM7086、IIM7101、IIM7104、IIM7105、IIM7109、IIM7110、IIM7114、IIM7117、IIM7141、IIM7151、IIM7151、IIM7163、IIM7168、IIM7166、IIM7178、IIM7184、IIM7183、IIM7204、IIM7231、IIM7235、IIM7249、IIM7272、IIM7273、IIM7275、IIM7284、IIM7283、IIM7285、IIM7318、IIM73I9、IIM7345、IIM735I、IIM7354、IIM7384、IIM7386、IIM7388、IIM7397、IIM7417、IIM7427、IIM7463、IIM7480、IIM7481、IIM7548、IIM7613、IIM7616、IIM48034、IIM7636、IIM7653、IIM7657。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

另一个实施例包含鉴定或选择与对照植物相比,具有在干旱条件下增加的产量或在非干旱条件下增加的产量的玉米植物的方法,其中产量是每英亩玉米增加的蒲式耳,该方法包括以下步骤:a)从植物细胞分离核酸;b)检测所述核酸中遗传标记的存在,该核酸与增加的产量(干旱或非干旱条件)紧密相关,其中所述遗传标记紧密连锁至并在SM2991的10Mb、5Mb、2Mb、1Mb或0.5Mb内;c)基于b)中的检测的遗传标记选择玉米植物。另一方面,其中检测的遗传标记在选自下组的染色体区间内,该组由以下组成:由IIM40272和IIM41535定义并侧接的染色体区间;由IIM40486和IIM40771组成并侧接的染色体区间;由IIM40646和IIM40768组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM40272、IIM40279、IIM40301、IIM40310、IIM40311、IIM40440、IIM40442、IIM40463、IIM40486、IIM40522、IIM40627、IIM40646、IIM40709、IIM40719、IIM40768、IIM40771、IIM40775、IIM40788、IIM40789、IIM40790、IIM40795、IIM40802、IIM40804、IIM40837、IIM40839、IIM40848、IIM47120、IIM40862、IIM40863、IIM40888、IIM40893、IIM40909、IIM40928、IIM40931、IIM40932、IIM40940、IIM47155、IIM40936、IIM47156、IIM40991、IIM40998、IIM41001、IIM41008、IIM41013、IIM41033、IIM41064、IIM41153、IIM41229、IIM41230、IIM41247、IIM41259、IIM41261、IIM41263、IIM41283、IIM41287、IIM41310、IIM41321、IIM41359、IIM41357、IIM41366、IIM41377、IIM46720、IIM41412、IIM41430、IIM41448、IIM41456、IIM49103、IIM41479、IIM41509、IIM41535或其紧密相关的标记。实施例的另外的方面是通过以上的方法选择的玉米植物细胞或玉米植物(硬茎或非硬茎)。

另一个实施例包含鉴定或选择与对照植物相比,具有在干旱条件下增加的产量或在非干旱条件下增加的产量的玉米植物的方法,其中产量是每英亩玉米增加的蒲式耳,该方法包括以下步骤:a)从植物细胞分离核酸;b)检测所述核酸中遗传标记的存在,该核酸与增加的产量(干旱或非干旱条件)紧密相关,其中所述遗传标记紧密连锁至并在SM2995的10Mb、5Mb、2Mb、1Mb或0.5Mb内;c)基于b)中的检测的遗传标记选择玉米植物。另一方面,其中检测的遗传标记在选自下组的染色体区间内,该组由以下组成:由IIM39102和IIM40144组成并侧接的染色体区间;由IIM39732和IIM40064组成并侧接的染色体区间;由IIM39900和IIM39935组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM39102、IIM39140、IIM39142、IIM39283、IIM39291、IIM39298、IIM39300、IIM39301、IIM39304、IIM39306、IIM39309、IIM39334、IIM39335、IIM39336、IIM39340、IIM39347、IIM39375、IIM39377、IIM39378、IM39380、IIM39381、IIM39383、IIM39384、IIM39385、IIM39386、IIM39390、IIM39401、IIM39409、IIM39447、IIM39497、IIM39715、IIM39716、IIM39731、IIM39732、IIM39830、IIM39856、IIM39870、IIM39873、IIM39877、IIM39883、IIM39900、IIM39935、IIM39989、IIM40045、IIM40062、IIM40064、IIM40144或其紧密相关的标记。实施例的另外的方面是通过以上的方法选择的玉米植物细胞或玉米植物(硬茎或非硬茎)。

另一个实施例包含鉴定或选择与对照植物相比,具有在干旱条件下增加的产量或在非干旱条件下增加的产量的玉米植物的方法,其中产量是每英亩玉米增加的蒲式耳,该方法包括以下步骤:a)从植物细胞分离核酸;b)检测所述核酸中遗传标记的存在,该核酸与增加的产量(干旱或非干旱条件)紧密相关,其中所述遗传标记紧密连锁至并在SM2973的20Mb、10Mb、5Mb、2Mb、1Mb或0.5Mb内;c)基于b)中的检测的遗传标记选择玉米植物。另一方面,其中检测的遗传标记在选自下组的染色体区间内,该组由以下组成:由IIM25303和IIM48513组成并侧接的染色体区间;由IIM25545和IIM25938组成并侧接的染色体区间;由IIM25800和IIM25805组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM25303、IIM25304、IIM25320、IIM25350、IIM25391、IIM25399、IIM25400、IIM25402、IIM25407、IIM25414、IIM25429、IIM25442、IIM25449、IIM25526、IIM25543、IIM25545、IIM25600、IIM25688、IIM25694、IIM25731、IIM25740、IIM25799、IIM25800、IIM25805、IIM25806、IIM25819、IIM25820、IIM25821、IIM25823、IIM25824、IIM25828、IIM25830、IIM25856、IIM25864、IIM25870、IIM25895、IIM25905、IIM25921、IIM25938、IIM25939、IIM25945、IIM25965、IIM25966、IIM25968、IIM25975、IIM25978、IIM25983、IIM25984、IIM25987、IIM25999、IIM25999、IIM26009、IIM26023、IIM26084、IIM26119、IIM26132、IIM26133、IIM26145、IIM26151、IIM48428、IIM26170、IIM26175、IIM26226、IIM26263、IIM26264、IIM26267、IIM26268、IIM26271、IIM26272、IIM26273、IIM26274、IIM26291、IIM26319、IIM26323、IIM26325、IIM26383、IIM26402、IIM26493、IIM26495、IIM48513或其紧密相关的标记。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

另一个实施例包含鉴定或选择与对照植物相比,具有在干旱条件下增加的产量或在非干旱条件下增加的产量的玉米植物的方法,其中产量是每英亩玉米增加的蒲式耳,该方法包括以下步骤:a)从植物细胞分离核酸;b)检测所述核酸中遗传标记的存在,该核酸与增加的产量(干旱或非干旱条件)紧密相关,其中所述遗传标记紧密连锁至并在SM2980的10Mb、5Mb、2Mb、1Mb或0.5Mb内;c)基于b)中的检测的遗传标记选择玉米植物。另一方面,其中检测的遗传标记在选自下组的染色体区间内,该组由以下组成:由IIM4047和IIM4978组成并侧接的染色体区间;由IIM4231和IIM4607组成并侧接的染色体区间;或由IIM4395和IIM4458组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM4047、IIM4046、IIM4044、IIM4038、IIM4109、IIM4121、IIM4143、IIM4177、IIM4203、IIM4212、IIM4214、IIM4214、IIM4215、IIM4219、IIM4226、IIM4227、IIM4229、IIM4231、IIM4232、IIM4233、IIM4235、IIM4236、IIM4237、IIM4239、IIM4239、IIM4240、IIM4241、IIM4242、IIM4244、IIM4255、IIM4263、IIM4264、IIM4265、IIM4308、IIM4295、IIM4289、IIM4280、IIM4345、IIM4387、IIM4387、IIM4388、IIM4388、IIM4389、IIM4390、IIM4390、IIM4392、IIM4395、IIM4458、IIM4469、IIM4482、IIM4607、IIM4608、IIM4609、IIM4613、IIM4614、IIM4674、IIM4681、IIM4682、IIM4738、IIM4755、IIM4756、IIM4768、IIM4777、IIM4816、IIM4818、IIM4822、IIM4831、IIM4851、IIM4856、IIM47276、IIM4857、IIM4858、IIM4859、IIM4860、IIM4875、IIM4878、IIM4967、IIM4974、IIM4978或其紧密相关的标记。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

另一个实施例包含鉴定或选择与对照植物相比,具有在干旱条件下增加的产量或在非干旱条件下增加的产量的玉米植物的方法,其中产量是每英亩玉米增加的蒲式耳,该方法包括以下步骤:a)从植物细胞分离核酸;b)检测所述核酸中遗传标记的存在,该核酸与增加的产量(干旱或非干旱条件)紧密相关,其中所述遗传标记紧密连锁至并在SM2984的5Mb、4Mb、2Mb、1Mb或0.5Mb内;c)基于b)中的检测的遗传标记选择玉米植物。另一方面,其中检测的遗传标记在选自下组的染色体区间内,该组由以下组成:由IIM19和IIM818组成并侧接的染色体区间;由IIM43和IIM291组成并侧接的染色体区间,或由IIM121和IIM211组成并侧接的染色体区间。在实施例的另一方面,检测的遗传标记选自下组,该组包含:IIM19、IIM26、IIM32、IIM43、IIM66、IIM72、IIM78、IIM77、IIM84、IIM108、IIM121、IIM46822、IIM211、IIM236、IIM274、IIM275、IIM291、IIM347、IIM47190、IIM638、IIM738、IIM739、IIM818或其紧密相关的标记。实施例的另外的方面是通过以上的方法产生的玉米植物细胞或玉米植物(硬茎或非硬茎)。

另一个实施例包含生产与对照相比,在干旱或非干旱条件下具有增加的产量的杂种植物的方法,该方法包括以下步骤:(a)提供第一植物,该第一植物包含第一基因型,该第一基因型包含单倍型A-M中的任一种:(b)提供第二植物,该第二植物包含第二基因型,该第二基因型包含来自下组的任一种,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、或SM2984,其中该第二植物包含不在第一植物中存在的来自下组的至少一个标记,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、或SM2984;(c)将第一植物和第二玉米植物杂交以产生F1代;鉴定包含所希望的基因型的F1代的一个或多个成员,该基因型包含单倍型A-M和来自下组的任何标记的组合,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、或SM2984,其中该所希望的基因型与(a)的第一基因型和(b)的第二基因型均不同,由此产生具有增强的水优化的杂种植物。进一步其中具有增加的产量的杂种植物包含单倍型A-M(这些单倍型A-M存在于第一植物)的每个,以及选自下组的至少一个另外的单倍型(该单倍型存在于第二植物),该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、或SM2984的实施例。实施例的另外的方面,其中第一植物是包含单倍型A-M的至少一个的轮回亲本,并且第二植物是包含不在第一植物中存在的来自下组的至少一个标记的供体,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、或SM2984。实施例的另一方面,其中第一植物对于单倍型A-M的至少两个、三个、四个、或五个是纯合的。在一些实施例中,杂种植物包含单倍型A-M的至少三个、四个、五个、六个、七个、八个、或九个,以及来自下组的标记,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、或SM2984。在另外的方面,关于单倍型A-M的每个以及在第一植物或第二植物中存在的来自下组的标记,该组由以下组成:SM2987、SM2991、SM2995、SM2996、SM2973、SM2980、SM2982、或SM2984,其中该鉴定包含基因分型由第一植物与第二植物杂交产生的F1代的一个或多个成员。实施例的另外的方面,其中该第一植物和该第二植物是玉蜀黍植物。其中增加的产量是在水胁迫条件下与对照植物相比T增加的或稳定的产量的实施例。另外的方面,其中具有增加的产量的杂种能以高作物密度种植和/或赋予当有利的水分水平下没有产量损失。另一方面是由该实施例产生的杂种玉蜀黍植物或细胞、组织培养物、种子或其部分。

本发明的另一个实施例是具有向其基因组引入水优化基因的植物,其中所述水优化基因包含编码包含SEQ ID NO:9-16的至少一个多肽的核苷酸序列,并且进一步其中引入所述水优化基因增加干旱或非干旱条件下的产量。实施例的另一方面,其中引入是同各国育种、基因组编辑(TALEN、CRISPR等)、或转基因表达植物基因渗入的任一个。实施例的另一方面,与对照植物相比,其中所述植物具有增加的产量。在另一方面,其中增加的产量是在水分亏缺条件下的产量。另外的方面,其中所述植物的亲本系由与SEQ ID NO:1-8中任一个退火的核苷酸探针或引物选择或鉴定,并且所述亲本品系赋予与不包含EQ ID NO:1-8的植物相比增加的产量。在另一方面,其中植物增加的产量是水分充足条件的产量。另外的方面,其中植物是玉米、杂种玉米植物或优良玉米品系。另外的方面,其中所述基因是与SEQ ID NO:1-8中的任一个具有90%至100%序列同源性的核苷酸序列。实施例的另外的方面,其中所述植物还包含至少一个单倍型A-M。

另一个实施例包含基于SEQ ID NO:1-8中的任一个或其紧密相关的标记(例如在表1-7中阐述的那些)的检测选择或鉴定基因分型的植物、植物细胞、种质、花粉、种子或植物部分。实施例的另外的方面,其中通过来自所述植物、植物细胞、种质、花粉、种子或植物部分的分离DNA来对植物、植物细胞、种质、花粉、种子或植物部分进行基因分型,并使用PCR或核苷酸探针基因分型DNA,其符合SEQ ID NO 1-8中的任一个。

另一个实施例是用于生产具有增加的产量的植物的方法,该方法包括以下步骤:a)使用选自下组的标记从多种植物群体选择,该组由以下组成:标记SM2973、SM2980、SM2982、SM2984、SM2987、SM2991、SM2995、SM2996;b)繁殖/自交植物。在另一方面,标记SM2973在核苷酸401具有“G”;标记SM2980在核苷酸401具有“C”;标记SM2982在核苷酸401具有“A”;标记SM2984在核苷酸401具有“G”;标记SM2987在核苷酸401具有“G”;标记SM2991在核苷酸401具有“G”;标记SM2995在核苷酸401具有“A”;并且标记SM2996在核苷酸401具有“A”。

另一个实施例包含鉴定或选择与对照植物相比,具有在干旱条件下增加的产量或在非干旱条件下增加的产量的玉米植物的方法,其中产量是每英亩玉米增加的蒲式耳,该方法包括以下步骤:a)从植物细胞分离核酸;b)检测所述核酸中遗传标记的存在,该核酸与增加的产量(干旱或非干旱条件)紧密相关,其中所述遗传标记紧密连锁至并在选自下组的玉米基因的10Mb、5Mb、2Mb、1Mb或0.5Mb内,该组由以下组成:GRMZM5G862107_01;GRMZM2G094428_01;GRMZM2G027059_01;GRMZM2G050774_01;GRMZM2G134234_03;GRMZM2G416751_02;GRMZM2G467169_02;GRMZM2G156365_06;或其任何组合;以及c)基于b)中的检测的遗传标记选择玉米植物。

在另一个实施例中,在其基因组中包含植物表达盒的作物植物,其中所述表达盒包含可操作地连接至基因的植物启动子(组成型或组织/细胞特异性或优选),该基因包含DNA序列,该DNA序列与SEQ ID NO:1-8中的任一个具有70%、80%、90%、95%、99%或100%序列同一性,其中本文的术语“作物植物”意指单子叶植物,如谷物(小麦、小米、高粱、黑麦、小黑麦、燕麦、大麦、埃塞俄比亚画眉草、斯卑尔脱小麦、荞麦、福尼奥米和藜麦)、稻、玉蜀黍(玉米)和/或甘蔗;或双子叶植物,如甜菜根(如甜菜或饲用甜菜);水果(如梨果、核果或软果,例如苹果、梨、李子、桃、扁桃、樱桃、草莓、树莓或黑莓);豆科植物(如菜豆、扁豆、豌豆或大豆);油料作物(如油菜、芥菜、罂粟、橄榄、向日葵、椰子、蓖麻油植物、可可豆或落花生);黄瓜类植物(如西葫芦、黄瓜或香瓜);纤维植物(如棉花、亚麻、大麻或黄麻);柑橘类水果(如橙子、柠檬、葡萄柚或柑橘);蔬莱(如菠菜、莴苣、卷心菜、胡萝卜、番茄、马铃薯、葫芦或辣椒);樟科(如鳄梨、肉桂或樟脑);烟草;坚果;咖啡;茶;藤本植物;蛇麻草;榴莲;香蕉;天然橡胶植物;以及观赏植物(如花、灌木、阔叶树或常青树(如松柏))。上述列举并不代表任何限制。

在另一个实施例中,在其基因组中包含植物表达盒的作物植物,其中所述表达盒包含可操作地连接至基因的植物启动子(组成型或组织/细胞特异性或优选),该基因编码蛋白质,该蛋白质与SEQ ID NO:9-16中的任一个具有70%、80%、90%、95%、99%或100%序列同一性。

另一个实施例提供生产在干旱条件下具有增加的产量或在非干旱条件下具有增加的产量的玉米植物的方法,其中增加的产量是与对照植物相比每英亩增加的蒲式耳,该方法包括以下步骤:(a)从植物细胞分离核酸;(b)编辑a)的植物细胞的基因组序列已包含与提高的耐旱性相关的分子标记,其中该分子标记是表1-7中描述的任何分子标记,并且进一步其中,该基因组序列不具有先前所述的分子标记;以及(c)从(b)的植物细胞生产植物或植物愈伤组织。在实施例的另一方面,可以产生核酸模板以促进所描述的一种或多种编辑,其中本领域技术人员可以使用已知的基因组编辑工具在靶植物的基因组内进行直接编辑(例如通过本领域教导的CRISPR,TALEN或大范围核酸酶基因组编辑方法进行基因组编辑)。在实施例的另一方面,其中该编辑包含以下任一个,对应于:

i.位于对应于位置272937870的G等位基因的玉米染色体1上的SM2987;

ii.位于对应于位置12023706的G等位基因的玉米染色体2上的SM2991;

iii.位于对应于位置225037602的A等位基因的玉米染色体3上的SM2995;

iv.位于对应于位置225340931的A等位基因的玉米染色体3上的SM2996;

v.位于对应于位置159121201的G等位基因的玉米染色体5上的SM2973;(6)

vi.位于对应于位置12104936的C等位基因的玉米染色体9上的SM2980;

vii.位于对应于位置133887717的A等位基因的玉米染色体9上的SM2982;或

viii.位于对应于位置4987333的G等位基因的玉米染色体10上的SM2984;以及

在另一个实施例中,不受理论限制,本发明的植物包含改良的农艺学性状,如幼苗活力、产量潜力和磷酸盐摄取、植物生长、幼苗生长、磷摄取、倒伏、繁殖生长或谷物品质。

另一个实施例涵盖使用染色体区间内的分子标记选择、鉴定和/或产生具有提高的耐旱性和/或产量的玉米植物,其中该染色体区间是以下任一个:位于产量等位基因的20cM、15cM、10cM、9cM、8cM、7cM、6cM、5cM、4cM、3cM、2cM、1cM内或与产量等位基因紧密连锁的区间,该产量等位基因对应于以下任一个:位于对应于位置272937870的G等位基因的玉米染色体1上的SM2987;位于对应于位置12023706的G等位基因的玉米染色体2上的SM2991;位于对应于位置225037602的A等位基因的玉米染色体3上的SM2995;位于对应于位置225340931的A等位基因的玉米染色体3上的SM2996;位于对应于位置159121201的G等位基因的玉米染色体5上的SM2973;位于对应于位置12104936的C等位基因的玉米染色体9上的SM2980;位于对应于位置133887717的A等位基因的玉米染色体9上的SM2982;或位于对应于位置4987333的G等位基因的玉米染色体10上的SM2984;或

侧接并包括以下任一个的染色体区间:位于物理碱基对位置248150852-296905665的玉米染色体1上的IIM56014和IIM48939、位于物理碱基对位置201538048-230992107的玉米染色体3上的IIM39140和IIM40144、位于物理碱基对位置121587239-145891243的玉米染色体9上的IIM6931和IIM7657、位于物理碱基对位置1317414-36929703的玉米染色体2上的IIM40272和IIM41535、位于物理碱基对位置139231600-183321037的玉米染色体5上的IIM25303和IIM48513、位于物理碱基对位置405220-34086738的玉米染色体9上的IIM4047和IIM4978、或位于物理碱基对位置1285447-29536061的玉米染色体10上的IIM19和IIM818。

在另一个实施例中,使用表1-7中列出的任何等位基因以产生基因组编辑或修饰,以在干旱和/或非干旱条件下产生具有增加的产量的植物。

因此,在一些实施例中,本披露的主题提供包含一种或多种等位基因的近交玉蜀黍植物,该等位基因与在干旱下增加的产量或所希望的水优化性状相关。

实例

以下实例提供了多个示意性实施例。根据本披露以及本领域中一般水平的技能,普通技术人员应当理解以下实例仅仅旨在是示例性的并且可以采用不离开本披露的主题的范围的许多改变、修改和变更。

引入实例

为了评估干旱胁迫下多种分子标记/等位基因的值,在包含充分灌溉控制处理和有限灌溉处理的对照田间试验中筛选多种种质。充分灌溉处理的目标是确保水不会限制作物的生产率。相反,有限灌溉处理的目标是确保水成为粮食产量的主要限制性约束。当两种处理在田间相邻施用时,可以确定主效应(例如处理和基因型)和相互作用(例如基因型x处理)。此外,可以对小组中的每种基因型进行定量干旱相关的表型,从而允许进行标记性状关联。

在实践中,有限灌溉处理的方法可以取决于所筛选的种质、土壤类型、场所气候条件、季节前供水和应季供水(仅举几个)而大不相同。最初,确定应季降水量较低并适合种植的场所(以最小化意外施用水的机会)。此外,确定胁迫的时间可以很重要,因此定义目标以确保逐年或位置到位置的筛查一致性到位。也可以考虑对处理强度的理解,或者在某些情况下对有限灌溉处理所希望的产量损失的理解。选择太轻的处理强度可能无法揭示基因型变异。选择太重的处理强度会产生大的实验误差。一旦确定了胁迫的时机并描述了处理的强度,就可以按照与这些目标一致的方式来管理灌溉。

用于评估和评估耐旱性的一般方法可以在以下中发现:Salekdeh等人,2009,以及美国专利号:6,635,803;7,314,757;7,332,651;和7,432,416。

实例1.鉴定在干旱条件和非干旱条件下与产量相关的玉米遗传基因座

通过测试玉米中水优化(WO)联合小组测量的与干旱相关性状相关的基因单核苷酸多态性(SNP)进行全基因组关联(GWA)分析。这项工作鉴定了干旱或水分充足条件下与产量性状相关的基因座、标记、等位基因和QTL。

标记基因分型和发现

使用新一代测序技术,在754个多种玉米品系中鉴定出大约109万个SNP标记。为了推断该数据集的全基因组标记覆盖率,将在玉米HapMap2中发表的2180万个标记(Chia等人,Nat.Gen.[自然基因]2012 44:803-809)组装地重新映射到B73RefGen_v2(www.genome.arizona.edu/modules/publisher/item.php?itemid=16)。使用26NAM亲本的重叠(Buckler等人,Science[科学]2009 325:714-718)用于在整个小组归纳Panzea HapMap2标记。为了减少基因分型错误,使用0.025的经验导出的预测误差(不正确估算基因型的估计百分比)阈值以过滤2180万个标记至970万个标记用于下游分析。通过仅在分析的第一阶段考虑基因型SNP标记进一步过滤标记,导致140万个SNP。适当的插补方法的实例是软件包NPUTE(Roberts等人,Bioinformatics[生物信息学]2007 23:i401-i407)。

表型数据

在分析SNP标记数据的754个玉米品系中,512个品系具有从先前干旱试验可得的产量数据。测量两种产量性状以测量干旱耐受性,特别是灌溉条件下的产量(YGSMN_i)或干旱胁迫条件下的产量(YGSMN_s)。对于每个品系的测量在多个环境中进行测量。环境变量计算的最佳品系预测(BLUP)与YGSMN_i和YGSMN_s相关(r=0.63,P<0.001)。所有关联分析都是针对每种性状的这些BLUP分别进行的。将玉米表型数据和基因型数据组合以鉴定在干旱或非干旱条件下与产量显著相关的染色体区间、QTL和SNP。

关联分析

在140万个基因SNP标记中,大约780,000个SNP最初被测试与产量数据相关。在具有产量数据的512个品系中的剩余的620,000个标记是单态的,因此在干旱或非干旱条件下没有能力进行关联分析。剩余的780,000个SNP被解析成10,000个相邻标记的组,并且使用统一的混合模型测试与产量数据的关联分析(Zhang等人,Nat.Gen.[自然基因]2010 42:355-362)。用以下格式的数据对三种不同的统一混合模型进行测试:

y=Pv+Sa+Iu+e

其中y是表型值的向量、v是关于群体结构的固定效应的向量、α是候选标记的固定效应,u是关于最近共同祖先的随机效应的向量、以及e是的残差的向量。P是定义群体结构的向量矩阵、S是候选标记处的基因型向量、I是单位矩阵。假设随机效应的方差为Var(u)=2KVg并且Var(e)=IVR,其中K是由共享等位基因值的比例组成的亲缘关系矩阵、并且I是单位矩阵。

对三种混合模型进行测试以评估三种不同的亲缘关系矩阵计算方法,并确定在模型中是否应该包括作为固定效应的育种组成员。对于第一个模型(称为QLocalK模型),P被定义为九个育种组中的七个的成员。九个育种组中只有八个出现在我们的小组中,这导致了包含七个载体(第八个不需要,因为每个个体的载体成分总和为一)。对于每组10,000个相邻标记,计算独特的亲缘关系矩阵并将其包含在模型中。相似地,在第二个测试模型中(称为QGlobalK模型),P被定义为九个育种组中的七个的成员。然而,不是从一组10,000个相邻标记计算出的局部亲缘关系矩阵,而是基于从基因组中随机选择的10,000个标记来计算总体亲缘关系矩阵。这个总体亲缘关系矩阵被用来测试所有的标记。最后,测试了第三个模型(称为ChrK模型),其不包括对群体结构(没有P项)的固定效应,而仅仅是染色体亲缘关系矩阵。将基于来自MaizeSNP50 BeadChip(亿明达公司(Illumina),圣地亚哥,加利福尼亚州)的55K芯片数据的特定于每个染色体的亲缘关系矩阵用于模型中。这些亲缘关系矩阵包括478个在灌溉表型数据下的产量的信息和479个在胁迫数据下产量的品系的信息。然后用相应的染色体K基质测试每个标记。使用先前测定的群体参数(P3D)和压缩的MLM(Zhang等人,Nat.Gen.[自然基因]2010 42:355-362),使用Tassel版本3.0(2012年8月)(Bradbury等人,Bioinformatics[生物信息学]2007 23:2633-2635)产生所有关联。

逐步回归

在发现与在胁迫下产量显著相关的SNP中,仅在具有表型数据的512个品系中至少20个观察到的那些SNP在创建逐步回归模型时才被考虑,以确保在多种玉米种群中应用发现的标记。使用SAS程序GLMSelect进行逐步回归。GLMSelect允许前向选择和后向消除基于调整后的模型R2竞争性实施。一旦指定的预测残差平方和已被模型计算,模型优化就停止。在杂种组中,通过将育种组成员并入固定效应来解释结构。

在灌溉和胁迫条件下与产量相关的SNP

如上所述,以不同方式控制群体结构的三种不同模型被用于测试全部780,000个SNP,用于与在所有地点测量的胁迫下产量(YGSMN_s)和灌溉下产量(YGSMN_i)的关联。

总共,精确地测定771,698个SNP与灌溉下产量(YGSMN_i)的关联,测量跨多个地点。随后,与仅在三个或更少个体中观察到次要等位基因的标记的关联被过滤出,导致测试了262,081个SNP。在那些测试中,427个SNP与灌溉下的产量显著相关(P<0.001)。

测试轻微更多的SNP(772,008)与胁迫下的产量(YGSMN_s)的关联,测量跨多个地点。再一次,仅在三个或更少个体中观察到次要等位基因的标记被过滤出,导致测试了262,224个SNP。然而,与灌溉条件下的产量相比,较少的(268)与这个性状显著相关(P<0.001)。同样,当使用P<10-5的阈值时,六个SNP与YGSMN_s保持显著相关。与对YGSMN_i观察到的类似,LD在与YGSMN_s显著相关的SNP中迅速衰减,从而鉴定若干种潜在的致病性SNP和/或一个或多个基因。

基于关联分析,鉴定出若干种基因与非干旱条件下增加的产量以及干旱胁迫下增加的产量密切相关,这些基因包括:GRMZM2G027059、GRMZM2G156365、GRMZM2G134234、GRMZM2G094428、GRMZM2G416751、GRMZM2G467169、GRMZM5G862107、和GRMZM2G050774。此外,与这些相应基因紧密相关的标记也被绘制出来并且同样与干旱和非干旱条件下增加的产量相关(参见表1-7的完整列表;还有表10a和10b;显示玉米自交联合作图的表11)。

表10a和10b:与不同玉米杂种优势群体的产量相关的玉米等位基因的实例。在YGSMN_i和YGSMN_s中测量的效应。与对照相比,所有情况显示在非硬茎(NSS)和硬茎(SS)玉米品系中的干旱和非干旱条件下每英亩蒲式耳增加。

逐步回归模型中特定于该SNP的统计数据。

§每个标记单独计算的杂种优势组效应大小。

表10a

表10b

表11:玉米近交小组联合作图(玉米近交关联,其中等位基因效应是相应等位基因的估计统计贡献)

实例2.杂种玉米关联研究

为了评估杂种背景中这些结果的可重复性,使用杂种基因型和表型(在干旱条件下的产量)数据使用所鉴定的SNP(参见表12至13)来寻找关联。

将两个杂种优势组(非硬茎(NSS)和硬茎(SS))分别地分析。对于每个杂种优势组,分析两个不同的表型数据集,1)在管理胁迫环境(MSE)试验中测量的以蒲式耳/英亩为单位的干旱胁迫下的产量;和2)在靶胁迫环境(TSE)试验中测量的以蒲式耳/英亩为单位的干旱胁迫下的产量。在MSE试验中,为了确保在开花期间发生干旱胁迫,对植物的水暴露进行严格管理,而不是在TSE试验中植物生长在降雨量低的地方使水暴露部分受到调节,导致整个生长季中度干旱胁迫。将来自24个亲本系的群体用于产生用于NSS分析的家族(子代品系)。这些亲本总共有167,854种变种在它们之间分离。使用简化的基因组下一代测序方法对来自24个亲本品系进行测序。合并来自NSS-MSE分析的基因型和表型数据导致24个亲本品系杂交以产生45个群体,其中总共有1040个家族。然后将这些家族与两种测试者杂交。从分析中排除少于10个家族的群体,因为他们提供的小的另外的值。相似地,在合并NSS-TSE分析的基因型和表型数据之后,有24个亲本品系、46个群体和1138个家族。同样,来自这些家族的重复样本随后与两种测试者杂交以产生表型的杂种。使用二十种亲本品系以产生用于SS数据集的群体和家族。在这二十种亲本中,112,466种变体是分离的。与NSS数据集相似,使用简化的基因组下一代测序方法对亲本品系进行测序。将该基因型数据与表型数据合并后,共有23个群体以及总共有553个家族具有可得的基因型和表型数据。来自这些家族的重复样本随后与两种测试者杂交以产生表型的杂种。当将基因型数据与表型数据合并时,我们有代表的23个群体以及总共631个家族(子代品系)。再次,将来自每个家族的个体与两种测试者杂交以产生表型的杂种。

测试的模型

所测试的两个初始模型是,使用SAS中的PROC GLM测试的具有相互作用项的固定效应模型(1),以及使用SAS中的PROC Mixed REML测试的具有相互作用项的随机效应模型(2)。

y=群体(固定的)+SNP(固定的)+群体×SNP(固定的)+ε (1)

y=群体(随机的)+SNP(固定的)+群体×SNP(随机的)+ε (2)

这些模型之间的区别在于群体和相应的相互作用项是否被视为固定或随机。如果群体项被指定为固定的,那么结果对于群体样品是特定的。如果群体项被指定为随机的,那么分析中包含的群体被假定为来自更大群体的随机抽样。

将MaizeSNP50 BeadChip(亿明达公司(Illumina),圣地亚哥,加利福尼亚州)也用于对基于关联小组的家族进行基因分型。鉴定与在干旱条件下增加的产量显著相关的水优化基因座SM2987、SM2996、SM2982、SM2991、SM2995、SM2973、SM2980、和SM2984连锁的标记(可以在表1-7中发现标记和关联的P值的负对数)。

表12.经两年田间试验与玉米杂种背景中的产量(YGSMN)相关的标记(相对于对照的对于相应年份每个标记效应平均的结果)。

表12:另外的杂种玉米关联数据:

实例3.玉米产量基因的转基因表达

创建组成型表达以下玉米基因的转基因拟南芥植物:GRMZM2G027059(SEQ ID NO:1);GRMZM2G156365(SEQ ID NO:2);GRMZM2G134234(SEQ ID NO:3);GRMZM2G094428(SEQ ID NO:4);GRMZM2G416751(SEQ ID NO:5);GRMZM2G467169(SEQ ID NO:6);GRMZM5G862107(SEQ ID NO:7);GRMZM2G050774(SEQ ID NO:8)。以下总结了实验和结果。

方法学

合成每种玉米基因的预测编码序列,并将其克隆到由35s启动子驱动的二元载体中,而无需密码子优化。

如Zhang等人(2006)描述使用农杆菌菌株GV3101进行拟南芥转化。然后将携带构建体的农杆菌转化到拟南芥生态型Col-0中。在含有0.6%PAT的MS培养基上筛选T0种子。通过测定证实PAT抗性T0事件,然后转移至温室以产生T1种子。

在第一个四周使用10小时日光光周期以及在开花期间使用16小时日光光周期维持温室条件。光密度维持在大约6000Lux,并且在白天温度在约24℃以及在夜间温度在20℃。湿度维持在约40%至60%。植物在营养土壤和蛭石混合物1∶1中生长。

蛋白质表达

对于蛋白质表达研究,所有目的基因都在其N-末端与GST融合并克隆到表达载体中。使用标准转化程序将表达载体转化到大肠杆菌中,并使细胞在LB培养基中生长至OD 600为0.8。通过添加IPTG(异丙基β-D-1-硫代半乳糖吡喃糖苷)至0.4mM终浓度来诱导表达。将细胞在16℃孵育16小时。经由离心使细胞沉淀并重悬于20mM Tris-HCL(pH 8.0)、500mM NaCl中,并补充完全蛋白酶抑制剂混合物(罗氏公司(Roche))。经由超声裂解细胞并将澄清的裂解物分批结合到GST琼脂糖(GE生命科学公司(GE Life Sciences))上。用20mM Tris-HCL(pH 8.0)、500mM NaCL充分洗涤树脂,并将结合的蛋白在含有10mM谷胱甘肽(西格玛公司(Sigma))的洗涤缓冲液中洗脱。将洗脱的蛋白质稀释成20%(vol/vol)甘油并储存在-20℃。

叶绿素含量测试

取0.01g拟南芥转基因事件和野生型对照的样品叶组织,每个重复3次。将叶样品研磨并添加800μl丙酮。然后将其置于黑暗中持续两个小时,然后经由离心沉淀。然后在663nm和645nm的分光光度计中分析液体部分。根据下式计算总叶绿素(μg/mL):

总叶绿素(μg/mL)=叶绿素a+叶绿素b=(20.2X A645)+(8.02X A663)

酯酶测定

如通过Brick等人,(1995)描述测定酯酶活性。将测定混合物在微量滴定孔中在室温孵育50分钟。对硝基苯基乙酸酯(pNP-Ac,西格玛公司(Sigma),目录号N8130)的水解和对硝基苯酚的形成通过400nm处的吸光度的增加分光光度法监测。无底物或酶的测定混合物作为对照。由于pNP-Ac的自发性脱乙酰作用,也使用底物对照(不含酶的底物孵育)。

代谢产物分析

在10小时日光光照下,使植物在土壤中生长4周。收集叶样品并测量总的鲜重(约1g)。接下来,将叶样品在液氮下用研钵和研杵研磨成粉末。然后用EPSILON 2-4 LSC冷冻干燥机按以下步骤将粉末材料冻干:主要干燥(-10℃,0.4mbar持续2天),接着最后干燥(40℃,0.1mbar持续6小时)。将粉末转移到聚丙烯管中运输。由美国的Metabolon公司进行代谢产物分析。

A.推定GRMZM2G027059(SEQ ID NO:1)基因参与控制叶绿素含量

据信GRMZM2G027059编码4-羟基-3-甲基丁-2-烯基二磷酸还原酶,其是感光色素(例如叶绿素和类胡萝卜素)和激素(赤霉素和ABA)的生物合成的基本酶。不受理论的限制,据信与对照基因相比,过表达或携带该基因的植物对非生物胁迫(例如干旱)可以更耐受。

GRMZM2G027059在拟南芥(构建体23294)中表达并且如前所述测量叶绿素含量。如图1所见,转基因植物的叶绿素含量显著高于对照(CK)植物的叶绿素含量(参见图1)。此研究证实GRMZM2G027059在增加叶绿素含量方面发挥作用,并且这反过来可能是在创造在干旱和非干旱条件下具有增加的产量的植物的可行模式。不受理论限制,另一种可能性是GRMZM2G027059的过表达也可以增加激素产生的敏感性,例如对胁迫的增加的ABA响应。

B.推定GRMZM2G156365(SEQ ID NO:2)基因参与细胞壁生长和结构

通过调节果胶乙酰化的精确的状态(即可能的果胶乙酰酯酶),GRMZM2G156365可能作为结构调节剂起作用。这种乙酰化会影响细胞壁重塑和物理化学性质,从而影响花粉细胞的延伸性。不受理论限制,下调该基因可能会增加在非生物胁迫条件下(例如干旱)的花粉萌发。

GRMZM2G156365过表达改变了转基因植物中的葡萄糖醛酸酯、木糖和3-脱氧辛酮糖醛酸酯含量(参见图2)。这些都是涉及果胶形成的糖残基。在转基因事件中检测到比野生型对照稍微多些的甘油,这可能是由于释放甘油的酯酶活性。

C.GRMZM2G134234(SEQ ID NO:3)参与非生物胁迫调控

基于氨基酸序列分析,玉米基因GRMZM2G134234编码推定的DUF1644家族转录因子。已知这些基因类型可以增强其他作物(如稻)的耐旱和耐盐性。据信GRMZM2G134234可能正向调节胁迫响应基因以在胁迫期间增加玉米胁迫耐受性。不受理论限制,过表达GRMZM2G134234的植物对非生物胁迫(如干旱和盐胁迫)可以更耐受。

D.推定GRMZM2G094428(SEQ ID NO:4)基因参与木质素生物合成和细胞壁结构

基于氨基酸序列分析,玉米基因GRMZM2G094428编码推定的BAHD酰基转移酶。因此该基因可能负责木质素生物合成中的单体的对-香豆酰化,以及细胞壁中的阿魏酸(FA)酯化为葡萄糖醛酸阿拉伯木聚糖(GAX)。基因的过表达可以增加木质素含量,这可以赋予在非生物胁迫(包括干旱和盐)下的植物耐受性。不受理论的限制,BAHD酰基辅酶A转移酶的下调可降低FA或pCA含量并改变木质素含量。

结果表明T1转基因植物中香豆酸(pCA)和芥子酸(SA)降低并且亚精胺增加(参见图3)。GRMZM2G094428蛋白似乎可能涉及细胞壁形成。转基因植物中基因的过表达改变了细胞壁相关组分。

E.推定GRMZM2G416751(SEQ ID NO:5)基因参与花粉外壁形成

由干旱引起的花粉不育造成的产量损失是商业的农业中的主要因素。GRMZM2G416751可以涉及花粉外壁的形成,并且过表达该基因的植物可以在干旱胁迫下避免花粉不育。

结果表明GRMZM2G416751的过表达显示细胞壁形成的代谢产物减少(参见图4)。代谢产物谱图表明,在转基因事件中,用于细胞壁形成的若干种代谢产物减少,如用于果胶的葡萄糖醛酸酯和3-脱氧辛酮糖醛酸酯、用于角质素和木质素的p-CA、以及用于木质素生物合成的芥子酸酯。需要进一步分析雄性生殖组织(如花粉或花药)来评估基因在花粉外壁形成中的作用。

F.推定GRMZM2G467169(SEQ ID NO:6)基因参与逆行信号传导调控

在各种生物和非生物胁迫下,发源于叶绿体的PS1中的信号(如氧化还原失衡)被传递至细胞核以控制基因表达模式(逆行信号)。GRMZM2G467169编码推定的聚腺苷酸结合蛋白,其可以调节逆行信号以增加玉米胁迫耐受性。过表达这种基因的植物可以对非生物胁迫(如干旱)更耐受。

数据表明与对照相比,GRMZM2G467169的过表达增加了叶绿素含量(参见图5)。

G.推定GRMZM5G862107(SEQ ID NO:7)基因参与调节热响应性基因和/或靶基因的基因表达。

基于氨基酸序列分析,玉米基因GRMZM5G862107编码推定的30S核糖体RNA结合蛋白S1。GRMZM5G862107可以通过调节热响应基因和/或其靶基因的基因表达来负责冷热胁迫。

数据表明GRMZM5G862107蛋白参与HsfA2表达调控。与野生型对照植物相比,HsfA2在23292中具有相对较高的表达(参见图6)。

H.推定GRMZM2G050774(SEQ ID NO:8)基因参与植物防御响应

基于氨基酸序列分析,玉米基因GRMZM2G050774编码推定的ATL6样环指E3连接酶。在拟南芥中,发现ATL6/ATL31在C/N状态响应和植物防御响应中也起关键作用。过表达ATL6/ATL31可以允许植物在低N供应条件下生长良好,并展示对Pst.DC3000增加的抗性。14-3-3χ(也称为GRF1)被鉴定为ATL31的靶。不受理论限制,GRMZM2G050774可能在植物氮利用/效率中起作用,并且所述基因的过表达允许植物更好地适应高胁迫条件(例如干旱或热胁迫)。

应当理解的是,可以改变本披露主题的不同细节而不偏离本披露主题的范围。此外,前面的描述仅为了说明的目的,而不是为了限制的目的。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1