玉米细胞质雄性不育(cms)c型恢复系rf4基因、分子标志物及其用途的制作方法

文档序号:407746阅读:665来源:国知局
专利名称:玉米细胞质雄性不育(cms)c型恢复系rf4基因、分子标志物及其用途的制作方法
技术领域
本公开内容涉及植物能育性基因。在一些实施方案中,公开内容涉及Rf4,即能育性基因的玉米恢复系。在具体的实施方案中,公开内容涉及用于对C型细胞质雄性不育(CMS-C)恢复能育性的组合物和方法,其例如通过使用与Rf4基因连锁的,或驻留(residing)于Rf4基因内的分子标志物来进行。具体实施方案涉及使用特定核酸序列来鉴定包含CMS-C的能育性恢复系 的植物,及用于杂种种子生成的方法。一些具体的实施方案涉及与CMS-C的能育性恢复有关的多肽。
背景技术
杂种植物育种的开发已经使得有可能在生产作物的质量和数量方面获得相当大的进展。产量增加和期望特征(诸如对疾病和昆虫的抗性、热和干旱耐受性、和植物组成的变化)的组合部分由于杂交规程而均是有可能的。杂交规程依赖于对雌性亲本植物贡献来自雄性亲本植物的花粉以生成所得的杂种。如果来自一朵花的花粉转移到同一植物的同一或另一朵花,那么植物可以自花传粉。如果花粉起源于来自不同植物的花,那么植物可以异花授粉。可以通过自花传粉和异花授粉技术两者育种玉米植物(玉蜀黍(Zea mays))。玉米植物具有雄花(其位于雄穗(tassel)上)和雌花(其位于同一植物的穗上)。在来自雄穗的花粉达到存在于接受穗顶部的丝时发生玉米中的天然传粉。玉米杂种的形成依赖于雄性不育系统。玉米杂种的形成需要纯合近交系的形成、这些品系的杂交、以及杂交的评估。谱系育种和轮回选择是用于从群体形成近交系的两种育种方法。育种程序将来自两种或更多种近交系或各种广泛来源的期望性状组合到育种集合中,通过自交和期望表型的选择从所述育种集合开发新的近交系。杂种玉米品种是两种此类近交系的杂交,每种所述近交系可以具有一种中缺乏或互补另一种的一种或多种期望的特征。将新的近交植物与其它近交系杂交,并评估来自这些杂交的杂种以测定哪些是期望的。来自第一代的杂种后代称作K。在杂种的开发中,仅寻求匕杂种。F1杂种通常比其近交亲本更有力。例如,此杂种活力(称作杂种优势)通常导致增加的营养生长和增加的产量。可以通过掺入手动去雄的雄性不育系统生成杂种玉米种子。为了生成杂种种子,将雄穗从生长中的雌性近交亲本除去,所述雌性近交亲本可以与雄性近交亲本以各种交替行样式种植。因此,倘若从外来玉米花粉有足够的分离,雌性近交物的穗仅会用来自雄性近交物的花粉受精。所得的种子是杂种F1种子。
手动去雄是劳动密集的且昂贵的。手动去雄还经常是无效的,例如因为植物发育中的环境变化可以导致完成雌性亲本植物的手动去雄后植物雄穗抽穗(tasseling),或者因为去雄者(detasseler)不可能完全除去雌性近交植物的雄穗。若去雄是无效的,则雌性植物会成功脱落花粉,并且一些雌性植物会自花传粉。这会导致雌性近交物的种子与正常生成的杂种种子一起收获。雌性近交物种子不如F1种子那样多产。另外,雌性近交物种子的存在可以对杂种种子生产者呈现种质安全性风险。也可以通过机器将雌性近交植物机械去雄。机械去雄大致与手动去雄一样可靠,但是更快且不太昂贵。然而,大多数去雄机器比手动去雄对植物产生更多损伤。如此,没有去雄形式目前是完全令人满意的。遗传雄性不育是一种可以在杂种种子生成中使用的备选方法。可以通过使用细胞质雄性不育(CMS)近交植物在一些基因型中避免费力的去雄过程。与核基因组形成对比,在缺乏能育性恢复系基因的情况下,CMS近交物植物由于源自细胞质的因素而雄性不育。因此,雄性不育的特征经由玉米植物中的雌性亲本而得到专门遗传,因为仅雌性对受精种子提供细胞质。用来自非雄性不育的另一近交物的花粉使CMS植物受精。来自第二近交物的花粉可以贡献或没有贡献使杂种植物雄性不育的基因。通常,必须混合来自去雄正常玉米的种子和相同杂种的CMS生成的种子以保证足够的花粉负荷在种植杂种植物时可用于受精,并且确保细胞质多样性。CMS作为生成杂种种子的系统的缺点包括CMS的特定变体与对某些作物疾病的易感性的关联。参见例如Beckett (1971) Crop Sciencell: 724-6。特别地,此问题已经阻碍CMS-T变体在杂种玉米种子的生产中使用,而且一般地,已经对CMS在玉米中的使用具有负面影响。细胞质雄性不育(CMS)是母系遗传的没有生成功能性花粉的能力。已经发现了超过40种CMS来源,并且根据玉米中差异的能育性恢复反应而分成三大组。这些组称为CMS-T (Texas)、CMS-S(USDA)和 CMS-C (Charrua)。Beckett (1971)。在 CMS-T 组中,两种显性基因Rfl和Rf2 (其分别位于 染色体3和9上)是花粉能育性的恢复需要的。Duvick (1965)Adv.Geneticsl3:1-56。S-细胞质通过单一基因Rf3 (其已经在染色体2中定位)恢复。Laughnan and Gabay(1978) “Nuclear and cytoplasmic mutations to fertility in Smale-sterile maize,,’in Maize Breeding and Genetics, PD.427—446。与CMS-T和CMS-S相比,已经发现了 CMS-C的能育性恢复在先前的分析中是非常复杂的。Duvick(1972),“Potential usefulness of new cytoplasmic 雄性 sterile andsterility system,,,于 Proceeding of the27th annual corn and sorghum researchconference, pp.197-201,发现了 CMS-C中能育性的完全恢复受到Rf4基因的显性等位基因控制。Khey-Pour等(1981)还发现了此基因对于CMS-C恢复是足够的。然而,Josephson 等(1978), “Genetics and inheritance of fertility restoration of 雄性 sterile cytoplasms in corn, ” 于 Proceedings of the33rd corn and sorghumresearch conference : 13,提出CMS-C中能育件的完全恢复以两种某闵Rf4和Rf5 (其后来已经分别在染色体8和5上定位)的显性等位基因的互补作用为条件。Sisco (1991) CropSc1.31:1263-6。同时,Chen 等(1979) Acta Agronom.Sin.5 (4): 21-28 认为 CMS-C 中的两种显性恢复系基因具有重复功能。使该系统进一步复杂,Vidakovic (1988),Maydica33:51-65证明CMS-C中能育性的完全恢复存在三种显性且互补的基因,添加基因Rf6。Vidakovic等,(1997a)Maize Genet.Coop.News Lett.71:10; (1997b)Maydica42:313-6后来报告了这些互补基因Rf4、Rf5、和Rf6实际上不是玉米CMS-C中能育性恢复的唯一遗传系统。如此,CMS-C的能育性恢复机制仍然没有解决。因此,难以为一些基因型不育系选择恢复系品系。分子标志物特别可用于加速经由回交将基因或数量性状基因座(QTL)导入良种栽培种或育种系中的方法。可以使用与基因连锁的标志物来选择拥有期望性状的植物,并且可以使用遍及基因组的标志物来选择在遗传上与回归亲本相似的植物(Young and Tanksley(1989)Theor.App1.Genet.77:95-101; Hospital 等(1992)Geneticsl32:1199-210)。已经经由基于图谱的克隆策略克隆出大多数植物能育性恢复系基因。至今,已经从几种植物物种分离出9种Rf基因,所述植物物种包括玉米(玉蜀黍)(Cui等(1996)Science272:1334-6;Liu 等(2001)Plant Celll3:1063-78)、矮牵牛(Petunia)(碧冬爺(Petunia hybrida))(Bentolila 等(2002)Proc.Natl.Acad.Sc1.USA99:10887-92)、萝卜(萝卜(Raphanus sativus L.)) (Brown 等(2003) Plant J.35:262-72; Desloire等(2003)EMBO R印.4:1-7;Koizuka 等(2003)Plant J.34:407-15)、高粱(高粱(Sorghum bicolor L.)) (Klein 等(2005)Theor.Appl.Genet.1ll:994-1012)> 稻(稻(Oryza sativa L.)) (Kazama and Toriyama(2003)FEBS Lett.544:99-102;Akagi 等(2004)Theor.Appl.Genet.108:1449-57;Komori 等(2004)Plant J.37:315-25;Wang等(2006)Plant Cell 18:676-87;及 Fujii and Toriyama(2009)Proc.Natl.Acad.Sc1.USA106 (23):9513-8)、和沟酸衆(Mimulus guttatus) (Barr and Fishman(2010)Geneticsl84:455-65)。除了玉米中的Rf2和稻中的Rf 17外,所有鉴定的恢复系基因编码不同三角状五肽重复(pentatricopeptide repeat, PPR)蛋白质。植物基因组编码几百种PPR蛋白,它们有许多牵涉调节细胞器基因表达。Lurin等(2004)Plant Celll6:2089-103;及Schmitz-Linneweber and Small (2008) Trends Plant Sc1.12:663-70。PPR蛋白含有 35 个氛基酸(称作 PPR 基序)的 2 至 27 个重复。Small and Peeters, (2000) Trends Biochem.Sc1.25(2): 46-7ο 预测 PPR 蛋白结合 RNA (Delannoy 等(2007) Biochemical SocietyTransactions35:1643-7),并且许多PPR蛋白靶向至线粒体,在那里定位CMS关联基因和产物。Lurin等(2004),见上文。证据提示了 PPR蛋白直接结合CMS转录物。Akagi等(2004),见上文;Gillman 等(2007)Plant J.49:217-27;及 Kazama 等(2008)Plant J.55:619-28。Rf蛋白通过改变其加工样式(Kazama&Toriyama(2003),见上文),降低RNA稳定性(Wang等(2006),见上文;及Ohta等(2010) Plant Cell R印.29:359-69),或者阻止它们被翻译(Kazama等(2008),supra)来降低CMS关联转录物的表达。关于来自玉米、稻、矮牵牛、和萝卜的能育性基因的恢复系的更多信息可以参见美国专利申请流水号 US2006/0253931,and in U.S.Patent Nos.5,981,833; 5,624,842;4, 569,152; 6,951,970; 6, 392,127; 7,612,251; 7,314,971; 7, 017,375; 7,164,058;和5,644,066。发明概述

本文中描述了将玉米Rf4基因座定位至位于染色体8顶部的小的12kb区。在此区内,Rf4的唯一可能的候选物是编码bHLH转录因子的基因。通过从CMS-C非恢复系和恢复系品系克隆Rf4_bHLH基因座,鉴定出许多序列变异。在蛋白质水平,CMS-C系和非恢复系品系都具有相同的序列,并且与恢复系等位基因(也彼此相同)相差4处氨基酸变化(4amino-acid changes),包括bHLH域内的保守的、亲水性酪氨酸残基(Y186),其改变为恢复系品系中疏水性本丙氣Ife残基(F187)。在本文中鉴定出玉米Rf4基因及其编码多肽,并且另外描述了包含Rf4基因序列的核酸分子。令人惊讶地,Rf4基因不是一种三角状五肽重复(PPR)蛋白质基因,几乎所有其它能育性恢复系基因亦然。此外,证明了本发明的CMS-C/Rf4系统种质中的能育性恢复受到作为单一显性恢复系基因的Rf4控制,这由于几个小组的新近工作而是意想不到的。参见,上文。玉米rf4-bHLH的bHLH域内的亲水性酪氨酸残基(Y186)(其在恢复系品系中改变为疏水性苯丙氨酸残基(F187))在单子叶植物间是保守的。如此,Rf4基因和Rf4基因标志物的鉴定可以极大地促进在植物种质中广泛开发和部署CMS-C能育性恢复性状。在实施方案中,rf4-bHLH第186位保守酪氨酸残基突变为疏水性氨基酸残基(例如,苯丙氨酸)造成Rf 4-bHLH多肽中的恢复系表型。如此,本文中描述了在所述位置(如通过序列比对鉴定的)处编码疏水性氨基酸残基的玉米Rf 4-bHLH或玉米Rf 4-bHLH基因的直向同系物,其中这些基因在导入植物中时促成CMS-C表型的恢复系。本文中描述了与玉米Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于玉米Rf4基因内的核酸分子标志物。在一些实施方案中,可以使用与玉米Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于玉米Rf4基因内的标志物,或玉米Rf4基因序列自身将玉米Rf4基因导入生物体,例如植物(例如,玉米和其它单子叶植物)中。 本文中还描述了使用与Rf4基因连锁或驻留于Rf4基因内的核酸分子标志物(例如但不限于)以鉴定具有C型CMS的功能性恢复系基因的植物;以将Rf4导入新的植物基因型(例如,经由标志物辅助育种或遗传转化进行);以及以从包含与Rf4基因连锁或驻留于Rf4基因内的核酸分子标志物的雄性植物和携带C型CMS的雌性植物杂交生成杂种种子的方法。进一步描述了用于对CMS-C玉米恢复能育性的手段,以及用于鉴定携带对CMS-C玉米恢复能育性的基因的植物的手段。在一些例子中,用于对CMS-C玉米恢复能育性的手段可以是与玉米Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于玉米Rf4基因内的标志物。在一些例子中,用于鉴定携带对CMS-C玉米恢复能育性的基因的植物的手段可以是探针,该探针与同玉米Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于玉米Rf4基因内的标志物特异性杂交。本文中还描述了可以从包含与玉米Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于玉米Rf4基因内的核酸分子标志物的雄性植物和携带C型CMS的雌性植物杂交生成杂种种子的方法。此类杂种种子的生成由于消除手动或机械去雄而可以导致成本节约,而且可以进一步提高种子产量。进一步描述了使用本文中公开的核酸分子来鉴定来自与玉米不同的植物物种的同源Rf4序列的方法(例如,通过序列比较来进行)。在一些实施方案中,在与玉米不同的植物物种中工程化改造杂种种子生成的CMS-C/Rf4系统。
附图简述

图1包括测定为在Rf4基因区内的197种SNP标志物及其物理图谱位置。图2包括34个随机选择的重组植物,及其表型数据和27种SNP标志物的相应遗传数据的表示。 图3包括染色体8上的Rf4基因和1.5Mb区内的基因的SNP标志物的相对位置的表不。图4包括染色体8上的Rf4基因和0.56Mb区和IOOkb区内的基因的SNP标志物的相对位置的表示。图5包括Rf4精细定位至12kb区的表示。字母指示基因型:A=BE4207 (CMS)纯合的;H=杂合的。箭头指示Rf4左侧和右侧边界标志物,以及两种最重要的重组植物。图6包括Rf4_bHLH等位基因的基因组结构的草图描绘,其显示了整个编码区(起始至终止,1.38kb)、1.lkb5,UTR/ 启动子、和 0.75kb3,UTR/ 终止子。图7包括来自下列玉米基因型的Rf 4-bHLH的序列比对:B73; BE4207; B104; XJH58; BE9515;和 MLW03。翻译起始、终止、和位于基因内的 DAS-CMS21到DAS-CMS34的标志物位置是标记的。SNP和InDel的位置是加阴影的。图8包括来自下列玉米基因型的Rf 4-bHLH cDNA的预测序列比对:B73;BE4207;B104;XJH58;BE9515;和 MLW03。翻译起始、终止、和位于 cDNA 内的DAS-CMS22-25、28-29、和31的标志物位置是标记的。图9包括预测的Rf 4-bHLH蛋白质序列比对。保守的bHLH域、核定位信号(NLS)的位置、和DAS-CMS22、·23、和28的相应标志物位置是标记的。bHLH域中的Tyr至Phe取代是通过与标志物DAS-CMS24 (参见图8和表3中的多态性ID54)紧密相邻的(B73预测cDNA序列)第747位的AC至TT 二核苷酸取代引起的。图10包括显示Rf4-HLH表达样式的数据。Ll=5周叶,L2=7周叶,L3=9周叶,T=具有形成中的花药和花粉的雄穗,P=脱落的花粉。A=BE4207纯合的,H=杂合的,B=XJH58纯合的。数据代表分离的F3的每种基因型的三个植物和亲本各I个植物的均值。误差棒代表标准差。图11包括玉米Rf 4-bHLH(来自恢复系XJH58和非恢复系BE4207)与来自其它单子叶物种的其直向同系物的比对。保守的bHLH域的位置是加下划线的。XJH58Rf4-bHLH和BE4207Rf4-bHLH之间的4处氨基酸变化是标记的。序列表所附序列表中列出的核酸序列使用核苷酸碱基的标准字母缩写显示,如37C.F.R.§ 1.822中限定的。仅显示每种核酸序列的一条链,但是应当理解通过对展示链的任何提及包括互补链。为了简单,在描述基因或基因座时,基因可以通过基因的突变体形式(例如Rf4,与rf4形成对比)描述,即使实质序列可以是相应基因组位置处的野生型基因形式。不过,应当理解两种等位基因都具有不同序列,而且意指哪种等位基因从上下文看正会是清楚的。在所附序列表中:SEQ ID NO: 1-197显示了与玉米Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于玉米Rf4基因内的标志物的例示性核苷酸序列。SEQ ID NO: 198-211显示了玉米染色体8顶部的约0.56Mb区内最初定位Rf4等位基因的核苷酸序列。SEQ ID NO:203是Rf 4-bHLH等位基因。SEQ ID NO:212-216代表CMS(BE4207)和恢复系(XJH58)玉米品系之间的例示性核苷酸序列差异。SEQ ID NO: 217显示了来自玉米品种B73的约12kb间隔中精细定位Rf4等位基因的核苷酸序列。SEQ ID N0:218显示了来自玉米品种B73和BE4207的rf4_bHLH等位基因的核苷酸序列。SEQ ID NO: 219显示了来自玉米品种B104的bHLH等位基因的核苷酸序列。SEQ ID NO: 220 显示了来自玉米品种 XJH58、BE9515、和 MLW03 的 Rf4_bHLH 等位基因的核苷酸序列。SEQ ID N0:221显示了来自玉米品种B73和B4207的预测rf4_bHLH cDNA的核苷酸序列。SEQ ID NO:222显示了来自玉米品种B104的预测bHLH cDNA的核苷酸序列。SEQ ID N0:223 显示了来自玉米品种 XJH58、BE9515、和 MLW03 的预测 Rf4-bHLHcDNA的核苷酸序列。SEQ ID N0:224显示了预测的玉米rf4_bHLH多肽的氨基酸序列。SEQ ID NO: 225显示了预测的玉米Rf4_bHLH多肽的氨基酸序列。SEQ ID NO:226 显不了预测的二穗短柄草(Brachypodium distachyon)rf4-bHLH多肽的氨基酸序列。 SEQ ID NO: 227显示了预测的高粱(Sorghum bicolor)rf4_bHLH多肽的氨基酸序列。SEQ ID NO:228显示了预测的稻(Oryza sativa)rf4_bHLH多肽的氨基酸序列。SEQ ID NO:229和230显示了 Rf4_bHLH中预测的核定位信号(NLS)。发明详述1.几个实施方案的概述本文中描述了影响植物中雄性能育性的基因,即玉米Rf4及其紧密连锁的遗传标志物(其在用于控制雄性能育性的多个系统中可以是有用的)的具体实施方案。此夕卜,公开的紧密连锁的遗传标志物中固有的多态性容许植物育种人员在分离群体中追踪基因的特定等位基因,即Rf4或rf4。Rf4基因最初在自四种玉米栽培种的杂交:BE4207xBE9515;BE4207x MLW03F;和BE4207x XJH58衍生的三个群体中定位至染色体8。举例而言,在群体BE4207x XJH58中证明精细定位和基于图谱的克隆,最终在约12kb内定位Rf4基因。多年以来,细胞质雄性不育(CMS)的恢复在杂种种子的生成中是一种常见的农业实践。与细胞质雄性不育一起使用能育性恢复系基因(Rf)简化种子生成程序,而且通过完全消除手动和机械去雄而降低总体成本。然而,尚未认识到对杂种种子生成应用玉米C型细胞质雄性不育的能育性恢复的遗传学的全部益处,因为关于玉米C型细胞质雄性不育的能育性恢复遗传学的先前研究产生矛盾的结果。鉴于细胞质雄性不育和花粉能育性恢复在玉米杂种种子生成中的实践意义,以及细胞质来源多样化的必要性,描述了通过使用分子标志物及KASPar 基因型分型技术将CMS-C的玉米Rf4恢复系基因精细定位到非常小的区域及经由基于图谱的克隆鉴定玉米Rf4基因。发现了 Rf4是三种玉米近交物:BE9515,MLW03和XJH58中CMS-C的单一显性恢
复系基因。首先使用SSR和SNP标志物将Rf4定位至约5.0Mb的区域,从SSR标志物umc_1075开始至染色体8短臂的顶部。在田间创建具有500个个体的BE4207xXJH58F2确认群体,并在能育性方面评分。用确认群体筛选总共197种SNP标志物,并在5.0Mb区内鉴定104个重组体。通过为提供信息的重组系比较表型得分和基因型数据,在约0.56Mb (14种基因)的区域内,及可能在100kM6种基因)内肯定鉴定玉米Rf4基因。如此,使用本文中公开的方法的实施方案证明Rf4基因选自下组:GRMZM2G122853(SEQ ID NO:198);AC187051.4_FG005(SEQ ID NO:199);GRMZM2G122851(SEQID NO: 200) ;GRMZM2G 1 22850 (SEQ ID NO: 20 I) ;GRMZM2G582028 ( SE QID NO:202) ;GRMZM2G02I 276 (SEQ ID NO: 203) ;GRMZM2G38 I 376 ( SE QID NO:204) ;GRMZM2G08I 127 (SEQ ID NO: 205) ;GRMZM2G085 I I I ( SE QID NO:206) ;GRMZM2G085038 (SEQ ID NO:207) ;GRMZM2G3I 7468 (SEQ IDNO:208) ;GRMZM2G328030 (SEQ ID NO:209) ;GRMZM2G029450 (SEQ ID N0:210);和GRMZM2G077212(SEQ ID NO:211)。使用约5,000个个体的大的精细定位群体,将玉米Rf4基因座定位至约12kb的小区域,其位于染色体8的顶部。由此,证明Rf4基因选自下组:植物转座元件[GRMZM2G582028 (SEQ ID NO:202)]和碱性-螺旋-环-螺旋(bHLH)转录因子(GRMZM2G021276 (SEQ ID NO: 203))。在这两种基因中,Rf4的唯一可能的候选物是碱性_螺旋-环-螺旋(bHLH)转录因子,GRMZM2G021276(SEQ ID NO:203)是Rf4基因。如此,在具体的实施方案中,Rf4基因是GRMZM2G021276(SEQ ID NO: 203),其有时称为Rf 4-bHLH。应当理解,Rf4基因也可以是与玉米Rf 4-bHLH基因,例如,SEQ ID NO: 203的编码序列编码相同多肽的DNA序列。 从玉米CMS系BE4207;玉米系B104;和三种玉米恢复系品系:XJH58,BE9515,和MLW03克隆bHLH基因座。鉴定出不同近交物间的许多序列变异。值得注意地,三种恢复系品系具有相同的Rf 4-bHLH DNA序列,而B73和BE4207 (其不含功能性Rf4恢复系)是相同的。B104序列与BE4207/B73等位基因比与恢复系等位基因更相似。在蛋白质水平,BE4207、B73、和B104都具有相同序列,并且与恢复系等位基因的基因产物相差4处氨基酸变化,包括用疏水性苯丙氨酸取代bHLH域中的保守的亲水性酪氨酸。与花粉能育性恢复中的Rf4功能一致,Rf 4-bHLH的恢复系等位基因在恢复CMS-C的植物的形成中的雄穗(具有花药和花粉)中特异性表达。玉米CMS系BE4207不施加花药,也不形成功能性花粉。因此,在来自BE4207植物的叶和雄性生殖组织中检出非常低的rf4-bHLH表达或没有检出rf4-bHLH表达。因为B73( —种既不含CMS-C细胞质也不恢复CMS-C的近交物)具有显著的rf4-bHLH表达,所以不太可能的是,能育性恢复是由于恢复系等位基因(Rf4-bHLH)和非恢复系等位基因(rf4-bHLH)之间的表达水平差异所致。认为雄性能育性恢复是由于恢复系等位基因和非恢复系等位基因的基因产物之间的氨基酸序列差异所致。具体地,玉米rf4-bHLH的Y186位于bHLHDNA结合域内的第一个螺旋中(Carretero-Paulet 等(2010) Plant Physiol.153:1398-412;及 Piresand Dolan (2010)Mol.Biol.Evo1.27:862-74),并且此残基在 B73(非 CMS、非恢复系)、BE4207(CMS、非恢复系)中,及在高粱、稻、和短柄草直向同系物中是绝对保守的。此亲水性残基在三种玉米恢复系品系中改变为疏水性苯丙氨酸(F187)。此类非保守取代可以显著改变bHLH域中的螺旋结构,并且影响DNA结合和下游基因转录。鉴于前述内容,我们预测来自B104的rf4等位基因没有恢复CMS-C能育性,因为B104bHLH与B73和BE4207rf4_bHLH具有相同的蛋白质序列,包括第186位的保守酪氨酸。在一些实施方案中,可以使用本文中所描述的基于Rf4_bHLH的或紧密连锁的高通量分子标志物来用Rf4恢复系鉴定基因型,将Rf4基因渗入玉米和其它植物中的新基因型中以进行雄性转化,并从CMS雌性植物除去Rf4。凭借手边的标志物和Rf4基因,现在有可能将Rf4可靠地转移到良种种质中,以及提高使用CMS-C/Rf4系统进行杂种种子生成的规模。此系统的完全实现可以对农业和其产品的消费者提供重大的财政益处。I1.术语回交:回交方法可以用于将核酸序列导入植物中。几十年以来已经广泛使用回交技术来将新性状导入植物中。Jensen, N.编Plant Breeding Methodology, Johnffiley&Sons, Inc.,1988。在一个典型的回交方案中,将感兴趣的初始品种(回归亲本)与携带要转移的感兴趣基因的第二品种(非回归亲本)杂交。然后,将来自此杂交的所得后代与回归亲本再次杂交,并重复该过程,直到获得如下的植物,其中在来自非回归亲本的转移基因外,在转化植物中恢复回归植物的基本上所有期望形态学和生理学特征。连锁的、紧密连锁的、和极端紧密连锁的:如本文中所使用的,基因或标志物间的连锁指染色体上的基因或标志物显示一起传递到下一代个体的可测量概率的现象。两种基因或标志物彼此越接近,此概率变得越接近(I)。如此,术语“连锁的”可以指以大于0.5的概率(其从独立分类预期,其中标志物/基因位于不同染色体上)与某个基因一起传递的一种或多种基因或标志物。因为染色体上的两种基因或标志物的接近性与基因或标志物会一起传递到下一代个体的概率正相关,所以术语“连锁的”在本文中也可以指同一玉米染色体上位于在彼此的约2.0Mb内的一种或多种基因或标志物。如此,两种“连锁的”基因或标志物可以相隔约 2.1Mb; 2.0OMb;约 1.95Mb;约 1.90Mb;约 1.85Mb;约 1.80Mb;约 1.75Mb;约 1.70Mb;约 1.65Mb;约 1.60Mb;约 1.55Mb;约 1.50Mb;约 1.45Mb;约 1.40Mb;约 1.35Mb;约 1.30Mb;约 1.25Mb;约 1.20Mb;约 1.15Mb;约 1.1OMb;约 1.05Mb;约 1.0OMb;约 0.95Mb;约 0.90Mb;约 0.85Mb;约 0.80Mb;约 0.75Mb;约 0.70Mb;约 0.65Mb;约 0.60Mb;约 0.55Mb;约 0.50Mb;约 0.45Mb;约 0.40Mb;约 0.35Mb;约 0.30Mb;约 0.25Mb;约 0.20Mb;约 0.15Mb;约0.1OMb;约0.05Mb;约0.025Mb;约0.012Mb;和约0.0lMb0与Rf4 “连锁的”标志物的具体例子包括玉米基因组的染色体8顶部的核苷酸序列,例如SEQ ID NO: 1-197 ;和本文中称为多态性ID N0.1-106(表3)的标志物。如本文中使用的,术语“紧密连锁的”可以指同一玉米染色体上位于在彼此的约0.5Mb内的一种或多种基因或标志物。如此,两种“紧密连锁的”基因或标志物可以相隔约0.6Mb;约 0.55Mb; 0.5Mb;约 0.45Mb;约 0.4Mb;约 0.35Mb;约 0.3Mb;约 0.25Mb;约 0.2Mb;约0.15Mb;约0.12Mb;约0.1Mb;和约0.05Mb。与Rf4 “紧密连锁的”标志物的具体例子包括 SEQ ID NO: 6-9; SEQ ID NO: 105; SEQ ID NO: 109; SEQ ID NO: 111; SEQ ID NO: 115; SEQID NOs:118-120; SEQ ID NO:123;SEQ ID NO:126;SEQ ID NO:134;SEQ ID NO:135;SEQID NO:137;SEQ ID NO:138;SEQ ID NO:144;SEQ ID NO:149;SEQ ID NO:151;SEQ IDNO:160;SEQ ID NO:163;SEQ ID NO:164;SEQ ID NO:167;SEQ ID NO:173;SEQ IDNO: 177; SEQ ID NO: 178; SEQ ID NO: 183; SEQ ID NO: 189-191;和 SEQ ID NO: 197;和本文中称为多态性ID N0.1-106(表3)的标志物。如本文中使用的,术语“极端紧密连锁的”可以指同一玉米染色体上位于在彼此的约IOOkb内的一种或多种基因或标志物。如此,两种“极端紧密连锁的”基因或标志物可以相隔约 125kb;约 120kb;约 115kb;约 IlOkb;约 105kb; IOOkb;约 95kb;约 90kb;约 85kb;约 80kb;约 75kb;约 70kb;约 65kb;约 60kb;约 55kb;约 50kb;约 45kb;约 40kb;约 35kb;约 30kb;约 25kb;约 20kb;约 15kb;约 12kb;约 IOkb;约 5kb;和约 lkb。与 Rf4 “极端紧密连锁的”标志物的具体例子包括SEQ ID NO: 105; SEQ ID NO: 109; SEQ ID NO: 111; SEQ IDNO: 115; SEQ ID NO: 118-120; SEQ ID NO: 123; SEQ ID N0:126;和SEQ ID N0:134;和本文中称为多态性ID N0.1-106(表3)的标志物。Rf4的连锁的、紧密连锁的、和极端紧密连锁的遗传标志物可用于标志物辅助育种程序以鉴定玉米C型细胞质雄性不育基因类型的恢复系,以及以将此性状育种到玉米品种中。基因座:如本文中使用的,术语“基因座”指基因组上与可测量的特征(例如,性状)对应的位置。SNP基因座通过与基因座内含有的DNA杂交的探针限定。标志物:如本文中使用的,标志物指可以用于鉴定具有特定等位基因,例如Rf4的植物的基因或核苷酸序列。标志物可以描述为给定基因组基因座处的变异。遗传标志物可以是短的DNA序列,诸如单碱基对变化(单核苷酸多态性,或“SNP”)周围的序列。或长的DNA序列,例如小卫星/简单序列重复(“SSR”)。“标志物等位基因”指特定植物中存在的标志物型式。如本文中使用的,术语标志物可以指玉米染色体DNA的克隆区段(例如,如以SEQID NO: 1-197或多态性ID N0.1-106(表3)之一限定的),并且也或备选地可以指与玉米染色体DNA的克隆区段互补的DNA分子(例如,与SEQ ID NO: 1-197或多态性ID N0.1-106(表3)之一互补的DNA)。·在一些实施方案中,可以经由使用核酸探针检测植物中的标志物存在。探针可以是DNA分子或RNA分子。可以通过本领域中已知的手段,例如使用DNA分子模板合成RNA探针。探针可以含有标志物的整个或部分的核苷酸序列和来自玉米基因组的额外的、连续的核苷酸序列。这在本文中称为“连续探针”。所述额外的、连续的核苷酸序列称为初始标志物的“上游”或“下游”,这取决于来自玉米染色体的连续核苷酸序列是在初始标志物的5’还是3’侧,如按照惯例理解的。所述额外的、连续的核苷酸序列可以位于初始标志物和玉米基因组的染色体8上IOOkb区之间,所述IOOkb区位于图谱位置564,922和601,460之间。如此,连续核苷酸序列可以位于初始标志物和玉米基因组的染色体8上12kb区之间,所述12kb区位于图谱位置86247和98188之间。如本领域普通技术人员公认的,可以几乎无限重复用于获得标志物中包含的额外的、连续的核苷酸序列的方法(仅受限于染色体的长度),由此沿着玉米染色体鉴定其它标志物。可以在本发明的一些实施方案中使用所有上文所描述的标志物。可以合成或通过克隆制备寡核苷酸探针序列。合适的克隆载体是本领域技术人员公知的。寡核苷酸探针可以是标记的或未标记的。存在用于标记核酸分子的极其多种技术,包括例如但不限于:通过缺口平移的放射性标记;随机引发;用末端脱氧转移酶(deoxytransferase)的加尾;等等,其中采用的核苷酸例如用放射性32P标记。可以使用的其它标记物包括例如但不限于:荧光团;酶;酶底物;酶辅因子;酶抑制剂;等等。或者,自身或与其它反应剂一起提供可检测信号的标记物的使用可以用受体结合的配体替换,其中受体是标记的(例如,通过上文指定的标记物进行),从而自身或与其它试剂一起提供可检测信号。参见例如 Learv 等(1983)Proc.Natl.Acad.Sc1.USA80:4045-9。探针可以含有与初始标志物的核苷酸序列不连续的核苷酸序列;此探针在本文中称为“非连续探针”。非连续探针的序列与玉米基因组上的初始标志物的序列足够接近地定位,从而非连续探针与相同基因(例如Rf4)遗传连锁。例如,在一些实施方案中,非连续探针可以位于玉米基因组上的初始标志物的500kb; 450kb; 400kb; 350kb; 300kb; 250kb; 200kb; 150kb; 125kb; 120kb; IOOkb; 0.9kb; 0.8kb; 0.7kb; 0.6kb; 0.5kb; 0.4kb; 0.3kb; 0.2kb;或
0.1kb 内。探针可以是要检测的标志物的精确拷贝。探针也可以是包含核苷酸序列或由核苷酸序列组成的核酸分子,所述核苷酸序列与玉米染色体DNA的克隆区段(例如,如以SEQ IDNO: 1-197和多态性ID N0.1-106(表3)限定的)是基本上相同的。如本文中使用的,术语“基本上相同的”可以指超过85%相同的核苷酸序列。例如,基本上相同的核苷酸序列与参照序列可以是 85.5%; 86%; 87 %; 88%; 89%; 90% ;91%; 92%; 93%; 94%; 95%; 96%; 97%; 98%; 99% 或99.5%相同的。探针也可以是与要检测的标志物的精确拷贝(1嫩靶物”)“特异性可杂交”或“特异性互补”的核酸分子。“特异性可杂交”和“特异性互补”是如下的术语,其指示足够的互补性程度,使得核酸分子和DNA靶物之间发生稳定的且特异性的结合。核酸分子与要特异性可杂交的其靶序列不需要是100%互补的。在存在有足够的互补性程度以避免核酸在期望特异性结合的条件下,例如在严格杂交条件下对非靶序列的非特异性结合时,核酸分子是特异性可杂交的。产生特定严格性程度的杂交条件会随选择的杂交方法的性质及杂交核酸序列的组成和长度而有所变化。一般地,杂交的温度和杂交缓冲液的离子强度(尤其是Na+和/或Mg++浓度)会决定杂交严格性,尽管清洗时间也影响严格性。关于获得特定严格性程度需要的杂交条件的计算是本领域普通技术人员已知的,并且例如在Sambrook等(编)MolecularCloning:A Laboratory Manual,第 2 版,第 1-3 卷,Cold Spring Harbor LaboratoryPress, Cold Spring Harbor, NY, 1989,第 9 章和第 11 章;及 Hames and Higgins (编)Nucleic Acid Hybridization, IRL Press, Oxford, 1985 中讨论。关于核酸杂交的更为详细的用法说明书和指导可以参见例如Tijssen,“0verview of principles of hybridizationand the strategy of nucleic acid probe assays, ” 于 Laboratory Techniques inBiochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes,部分 I,第 2 章,Elsevier, NY, 1993;及 Ausubel 等编,Current Protocols in MolecularBiology,第 2 章,Greene Publishing and ffiley-1nterscience, NY, 1995。如本文中所使用的,“严格条件”涵盖仅在杂交分子与DNA靶物之间存在有小于25%错配时发生杂交的条件。“严格条件”包括其它特定的严格性水平。如此,如本文中使用的,“中等严格性”条件是具有超过25%序列错配的分子不会杂交的那些条件;“中间严格性”条件是具有超过15%错配的分子不会杂交的那些条件;而“高严格性”条件是具有超过10%错配的分子不会杂交的那些条件。“非常高严格性”的条件是具有超过6%错配的分子不会杂交的那些条件。在具体的实施方案中,严格条件是于65° C在6x盐水柠檬酸钠(SSC)缓冲液、5x登哈特(Denhardt)氏溶液、0.5%SDS、和100 μ g剪切的鲑鱼精巢DNA中杂交,接着于65° C在2x SSC缓冲液和0.5%SDS中,接着是Ix SSC缓冲液和0.5%SDS中,最终0.2x SSC缓冲液和0.5%SDS中序贯清洗15-30分钟。就讨论的所有探针(见上文)而言,探针可以包含其它核酸序列,例如启动子;转录信号;和/或载体序列。可以使用讨论的任何探针(见上文)来限定与牵涉对C型细胞质不育玉米恢复能育性的基因(例如Rf4)紧密连锁的其它标志物。如此鉴定的标志物可以等同于本公开内容中命名的例示性标志物,并且如此在本发明的范围内。标志物辅助育种:如本文中使用的,术语“标志物辅助育种”可以指在一种或多种复杂性状(例如能育性的CMS-C恢复系)方面直接育种的方法。在当前的实践中,植物育种人员尝试鉴定与农艺学期望的性状连锁的容易地可检出的性状,诸如花颜色、种皮外观、或同工酶变体。植物育种人员然后通过追踪容易地可检出的性状的分离来追踪分离的育种群体中的工艺学性状。然而,存在着可用于植物育种中使用的非常少的这些连锁关系。标志物辅助育种提供了用于改善植物品种的时间和成本有效的方法。应用标志物辅助育种的几个例子牵涉使用同工酶标志物。参见例如Tanksley and Orton编(1983)Isozymes in Plant Breeding and Genetics, Amsterdam:Elsevier。一个例子是与对番茄中的线虫有害生物的抗性的基因关联的同工酶标志物。受到称作Mi的基因控制的抗性位于番茄的染色体6上,并且与Apsl (即一种酸性磷酸酶同工酶)非常紧密连锁。Apsl同工酶标志物间接选择Mi基因的用途提供如下的优点,即可以用标准的电泳技术明确测定群体中的分离;可以在幼苗组织中对同工酶标志物评分,消除对将植物维持至成熟的需要;以及同工酶标志物等位基因的共显性容许区别纯合子和杂合子。参见Rick(1983)于Tanksley and Orton,见上文 。可操作连接的:当第一核酸序列在与第二核酸序列的功能性关系中时,第一核酸序列与第二核酸序列可操作连接。例如,若启动子影响编码序列的转录或表达,则启动子与编码序列可操作连接。在重组生成时,可操作连接的核酸序列一般是连续的,且在必需连接两个蛋白质编码区时,在同一阅读框中(例如,在多顺反子ORF中)。然而,核酸为了可操作连接不需要是连续的。启动子:如本文中使用的,术语“启动子”指可以在转录起始上游,并且可以牵涉RNA聚合酶和其它蛋白质的识别和结合以启动转录的DNA区。启动子可以与细胞中表达的基因可操作连接,或者启动子可以与编码信号序列的核苷酸序列可操作连接,所述编码信号序列的核苷酸序列可以与细胞中表达的基因可操作连接。发育控制下的启动子的例子包括优先在某些组织,诸如叶、根、种子、纤维、木质部导管、管胞、或厚壁组织中启动转录的启动子。此类启动子称为“组织优选的”。仅在某些组织中启动转录的启动子称为“组织特异性的”。“细胞类型特异性”启动子主要在一种或多种器官中的某些细胞类型中,例如在根或叶中的维管细胞中驱动表达。“诱导型”启动子可以是可在环境控制下的启动子。可以启动诱导型启动子转录的环境条件的例子包括厌氧条件或光照的存在。组织特异性、组织优选性、细胞类型特异性、和诱导型启动子构成“非组成性”启动子的类别。“组成性”启动子是可以在大多数环境条件下有活性的启动子。可以在本发明的一些实施方案中使用任何诱导型启动子。参见Ward等(1993)Plant Mol.Biol.22:361-366。凭借诱导型启动子,转录速率响应诱导剂而增加。例示性诱导型启动子包括但不限于:响应铜的来自ACEI系统的启动子;响应苯磺酰氨除草剂安全剂的来自玉米的In2基因;来自TnlO的Tet阻抑物;和来自类固醇激素基因的诱导型启动子,该类固醇激素基因的转录活性可以通过激素糖皮质激素诱导(Schena等(1991)ProC.Natl.Acad.Sc1.USA88:0421)。例示性的组成性启动子包括但不限于:来自植物病毒的启动子,诸如来自CaMV的35S启动子;来自稻肌动蛋白基因的启动子;泛素启动子;pEMU;MAS ;玉米H3组蛋白启动子;和ALS启动子,即在欧洲油菜(Brassica napus)ALS3结构基因5’的Xbal/Ncol片段(或与所述Xbal/Ncol片段的核苷酸序列相似性)(国际PCT公开文本W096/30530)。也可以在本发明的一些实施方案中利用任何组织特异性或组织优选性启动子。用与组织特异性启动子可操作连接的基因转化的植物可以专门或优先在特定组织中生成转基因的蛋白质产物。例示性组织特异性或组织优选性启动子包括但不限于:根优选性启动子,诸如来自菜豆蛋白基因的;叶特异性和光诱导性启动子诸如来自cab或rubisco的;花药特异性启动子诸如来自LAT52的;花粉特异性启动子诸如来自Zml3的;和小孢子优选性启动子诸如来自apg的。序列同一性:如本文中在两种核酸或多肽序列的背景中所使用的,术语“序列同一性”或“同一性”可以指两种序列中在规定的比较窗里为了实现最大对应性而比对时相同的
残基。 在提及蛋白质使用序列同一性百分比时,认可的是,不相同的残基位置经常相差保守的氨基酸取代,其中氨基酸残基用具有类似化学特性(例如,电荷、疏水性或空间效应)的其它氨基酸残基取代,并且因此不改变分子的功能特性。因此,在序列相差保守取代时,百分比序列同一性可以向上调节以校正不相同残基位点处取代的保守性质。相差此类保守取代的序列被说成具有“序列相似性”或“相似性”。用于进行此调节的技术是本领域普通技术人员公知的。通常,此类技术牵涉将保守取代评分为部分的,而不是完全的错配,由此增加百分比序列同一性。例如,在对相同的氨基酸给予0-1的得分,而对非保守取代给予O得分的情况中,对保守取代给予0-1的得分。可以计算保守取代的得分,例如如程序PC/GENE (Intelligenetics, Mountain View, CA)中执行的。如本文中所使用的,术语“序列同一性百分比”可以指在比对窗里比较两个最佳比对序列时测定的数值,其中为了两个序列的最佳比对,比较窗中序列的部分与参照序列(其不包含添加或缺失)相比可以包含添加或缺失(即,缺口)。通过测定两个序列中存在相同核苷酸或氨基酸残基的位置的数目以产生匹配位置数目,将匹配位置的数目除以比较窗中位置的总数,并将结果乘以100以产生序列同一性百分比来计算百分比。单核苷酸多态性(SNP):如本文中使用的,术语“单核苷酸多态性”可以指在基因组(或其它共享序列)中的单核苷酸在物种成员或个体中的配对染色体间有所不同时发生的DNA序列变异。
在群体内,可以给SNP指派较小等位基因频率,即特定群体中观察到的某个基因座处的最低等位基因频率。这仅是在单核苷酸多态性方面两种等位基因频率中的较小者。人群体间有变异,因此一个地理学或民族中常见的SNP等位基因在另一个中可以罕见得多。单核苷酸多态性可以落入基因的编码序列、基因的非编码区内,或基因间的基因间区中。编码序列内的SNP由于遗传密码的简并性而不会必然改变生成的蛋白质的氨基酸序列。两种形成都生成相同多肽序列的SNP称作“同义的”(有时称作沉默突变)。若生成不同多肽序列,则它们称作“非同义的”。非同义变化可以是错义或无义,其中错义变化导致不同氨基酸,而无义变化导致过早的终止密码子。不在蛋白质编码区中的SNP可以仍然具有基因剪接、转录因子结合、或非编码RNA序列的后果。SNP通常是双等位基因的,并且如此容易在植物和动物中测定。Sachidanandam(2001)Nature409:928-33。InDel:如本文中使用的,术语“InDel”一般用于描述基因中的插入或缺失。如此,“InDel”仅指可以是插入、缺失、或其组合的特定突变。性状或表型:术语“性状”和“表型”在本文中可互换使用。出于本公开内容的目的,特别感兴趣的性状是C型CMS的能育性恢复。II1.玉米CMS-C恢复系Rf4基因及其分子标志物提供了与玉米CMS-C恢复系基因Rf4连锁的(例如,紧密连锁的)分子标志物。鉴定含有牵涉对CMS-C植物恢复能育性的序列的DNA区段。这些区段位于与Rf4基因连锁的(例如,紧密连锁的)标志物间。如此 ,还提供了包含Rf4基因的核酸分子。鉴定的区段及其标志物在本文中部分根据其在玉米染色体8顶部的特定区域中的位置描述。在以重组频率或图距单位表示时,鉴定的区段及其标志物的位置在本文中作为一般信息提供。在玉米群体BE4207x XJH58中实施本文中所描述的实施方案。然而,通过参照公众可获得的B73玉米近交物基因组序列(B73RefGen vl或v2)(其可以在环球网上在 www2.genome, arizona.edu/genomes/maize 或 ftp.maizesequence.0rg/current/assembly/找到)表示以图距单位计的特定区段和标志物的位置。玉米品种BE4207和XJH58的基因组序列尚不可获得。预期以图距单位对特定区段和标志物给予的数目可以在栽培种间有所变化,并且不是DNA区段和标志物的必需定义的一部分,该DNA区段和标志物以其它方式描述,例如通过核苷酸序列描述。Rf4基因的显性等位基因控制CMS_C/Rf4系统中的能育性恢复。在实施方案中,Rf4 基因测定为选自下组的基因:GRMZM2G122853(SEQ ID NO: 198) ;AC187051.4_FG005 (SEQ ID NO: 199) ;GRMZM2G122851 (SEQ ID NO:200) ;GRMZM2G122850 (SEQID NO:201) ;GRMZM2G582028 (SEQ ID NO:2 O 2) ;GRMZM2GO 2 I 276 (SEQID NO:203) ;GRMZM2G38 1376 (SEQ ID NO:204) ;GRMZM2G081 1 27 (SEQ IDNO: 205) ;GRMZM2G085 I I I (SEQ ID NO:206) ;GRMZM2 GO 85038 (SEQ IDNO: 207) ;GRMZM2G3I 7468 (SEQ ID NO:208) ;GRMZM2G328030 (SEQ IDNO:209) ;GRMZM2G029450 (SEQ ID NO:210);和 GRMZM2G077212 (SEQ ID N0:211)。在具体的实施方案中,Rf4基因是Rf4-bHLH (SEQ ID NO:203) 例如,Rf4_bHLH基因通过SEQ IDNO:220 提供。在一些实施方案中,本发明还包括与Rf4_bHLH基本上相同的那些核苷酸序列。例如,在一些实施方案中,核酸分子是与Rf 4-bHLH至少约85%相同的Rf4同系物。Rf4同系物可以与 Rf 4-bHLH 是 86%; 87%; 88%; 89%; 90% ;91%; 92%; 93%; 94%; 95%; 96%; 97%; 98%; 99% 或99.5%相同的。此类Rf4同系物可以容易地鉴定,并且对于多种生物体从本领域技术人员容易地可用的任何完全或部分基因组分离。一些实施方案还包括Rf4基因的功能性变体。Rf4的功能性变体包括例如包含一处或多处核苷酸取代、缺失、或插入的Rf4-bHLH序列,其中功能性变体对CMS-C玉米恢复雄性能育性,如可以通过本领域普通技术人员公知的常规技术测量的。例如,Rf4基因的特定变体对CMS-C玉米恢复雄性能育性的能力可以如下测定,即将突变或片段常规引入不育rf4等位基因纯合的植物中,接着对植物常规观察雄性不育。Rf4基因的功能性变体可以通过定点诱变、诱导突变来创建,或者它们可以作为等位变体(多态性,例如SNP)发生。在具体的例子中,Rf4的功能性变体是如下的Rf4-bHLH序列,其包含一处或多处核苷酸取代、缺失、或插入,使得该变体编码包含bHLH域内Y186的疏水性氨基酸取代(例如Phe)的Rf4-bHLH 多肽。因此,在一些实施方案中,Rf4基因的功能性变体可以是Rf4的突变,或者保留Rf4基因的雄性不育控制特性且比Rf4的整个序列小的片段。因此,认为此类突变和片段在本发明的范围内。鉴于本公开内容,本领域普通技术人员可以容易地确定本文中列出的Rf4序列的突变或片段是否保留Rf4基因的特性。在一些实施方案中,本发明还包括Rf4-bHLH多肽(例如,SEQ ID N0:225)和与Rf4-bHLH基本上相同的多肽。例如,在一些实施方案中,与Rf4-bHLH基本上相同的多肽可以与Rf 4-bHLH至少约25%相同,并且在与SEQ ID NO: 225的F187对应的位置处具有疏水性氨基酸残基(例如Phe),如通过序列比对测定的。在一些实施方案中,与Rf4-bHLH基本上相同的多肽可以与 Rf 4-bHLH 是 86%; 87%; 88%; 89%; 90% ;91%; 92%; 93%; 94%; 95%; 96%; 97%; 98%;99%或99.5%相同的。与Rf 4-bHLH基本上相同的此类多肽可以容易地鉴定,并且对于多种生物体从本领域技术人员容易可用的完整或部分基因组或cDNA文库推导。IV.使用Rf4基因·的方法可以以本领域技术人员已知的多种方式之一使用本文中所描述的Rf4基因来操作基因以引起期望的效应。例如但不限于,可以使用Rf4基因来:将突变体Rf4序列导入植物中以引起不育;将突变引入天然Rf4序列中;将靶向Rf4DNA或RNA的反义核酸分子导入植物中以影响能育性;使用发夹形成;或连接Rf4序列与其它核酸序列以控制Rf4基因产物的表达。例如,在一些实施方案中,可以使用测定为选自下组的Rf4基因来促进与影响玉米雄性能育性的其它基因或突变体一起利用CMS-C/Rf 4雄性能育性系统:GRMZM2G122853(SEQ ID NO:198);AC187051.4_FG005(SEQ ID NO:199);GRMZM2G122851 (SEQID NO:200) ;GRMZM2G 1 22850 (SEQ ID NO:20 I) ;GRMZM2G582028 (SEQID NO: 202) ;GRMZM2G02I 276 (SEQ ID NO:203) ;GRMZM2G38 I 376 ( SE QID N0:204) ;GRMZM2G081 127 (SEQ ID NO:20 5) ;GRMZM2G0851 1 1 (SEQ IDNO:206) ;GRMZM2G085038 (SEQ ID NO:207) ;GRMZM2G3 I 7468 (SEQ IDNO:208) ;GRMZM2G328030 (SEQ ID NO:209) ;GRMZM2G029450 (SEQ ID N0:210);和GRMZM2G077212(SEQ ID N0:211)。例如,在具体的实施方案中,可以使用Rf 4-bHLH基因来促进与影响玉米雄性能育性的其它基因或突变体一起利用CMS-C/Rf4雄性能育性系统。在一些实施方案中,可以将Rf4基因导入玉米植物中,所述玉米植物适合于用于与CMS-C/Rf4雄性能育性系统不同的雄性能育性系统。或者,可以将与Rf4不同的基因或突变体基因导入适合于在CMS-C/Rf4雄性能育性系统中使用的玉米植物,使得可以使用导入的基因或突变体基因来提供额外的或互补的能育性控制。玉米中其它雄性能育性基因和突变的具体例子包括:CMS-T/Rf I; CMS-T/Rf 2; CMS-S/Rf 3; ms I (Singletonand Jones(1930)J.Hered.21:266-8);ms2 和 ms3(Eyster(1931)J.Hered.22:99-102) ;ms5,ms7,ms8,ms9,msl0,msll,msl2,msl3,和 msl4 (Beadle (1932) Geneticsl7:413-31) ;ms 17(Emerson(1932)Science75:566);ms20(Eyster(1934)BibliographiaGeneticall:187-392);ms23 和 ms24(ffest and Albertsen(1985)MNL59:87);ms25 和ms26(Loukides 等(1995)Am.J.Bot.82:1017-23);ms27 和 ms38(Albertsen 等(1996)MNL70:30-1) ;ms28(Golubovskaya(1979)MNL53:66-70);ms29 和 ms31(Trimnell 等(1998)MNL72:37-38);ms30(Albertsen 等(1999)MNL73:48);ms32, ms36 和 ms37(Trimnell 等(1999)MNL73:48-50);ms33 和 ms34(Patterson(1995)MNL69:126-8);ms43(Golubovskaya(1979)Int.Rev.Cytol.58:247-90);ms45(Albertsen 等(1993)Proc.Annu.Corn SorghumInd.Res.Conf.48:224-33;及 ms48, ms49,和 ms50(Trimnell 等(2002)MNL76:38-9)。在将核酸序列(例如Rf4) “导入”生物体,诸如植物中时,用于导入包含特定序列的核酸分子的技术或方法对于本发明不是至关重要的,并且可以通过本领域技术人员已知的任何技术或方法来发生。例如,可以通过直接转化方法,诸如土壤杆菌(Agrobacterium)介导的对植物组织的转化;微粒轰击;电穿孔;等等导入核酸分子。或者,可以通过将具有特定核苷酸序列的植物与另一植物杂交,使得后代具有掺入其基因组中的核苷酸序列来导入核酸分子。此类育种技术是本领域技术人员公知的。如本文中公开的,标志物辅助育种技术可以极大地促进经由此类杂交掺入Rf4。在将Rf4基因导入生物体的实施方案中,可以期望以如下的方式导入Rf4基因,使得Rf4基因与一种或多种调节序列可操作连接,例如,经由使用包含与期望的调节序列可操作连接的Rf4基因的质粒导入。可用于表达异源核酸序列的调节序列是本领域中公知的,并且包括例如但不限于:启动子(例如,组成性启动子;组织特异性启动子;和发育阶段特异性启动子);终止序列;增强子序列;亚细胞靶向序列;稳定化或前导序列;和内含子。在一些实施方案中,可以与一种或多种其它期望的核酸序列(例如,基因)一起将Rf4基因导入生物体。其它期望的核酸序列可以包括例如:编码外来蛋白质的基因;农艺学基因;植物疾病抗性基因;赋予对植物有害生物的抗性的基因;赋予对除草剂的抗性的基因;和赋予或促成增值性状(例如,经修饰的脂肪酸代谢;降低的肌醇六磷酸含量;和经修饰的碳水化合物组成)的基因。所有前述核酸序列的例子是本领域技术人员已知的。也可以与一种或多种与调节元件(例如启动子)可操作连接的标志物基因一起将Rf4基因导入生物体,所述标志物基因容许含有标志物的经转化的细胞通过负选择(即,抑制不含选择标志物基因的细胞生长)或者通过正选择(即,筛选由遗传标志物编码的产物)回收。供转化用的许多选择标志物基因是转化领域中公知的,并且包括例如编码使可以为抗 生素或除草剂的选择性化学剂在代谢上解毒的酶的基因,或编码可以对抑制剂不敏感的经改变的靶物的基因。少数正选择方法也是本领域中已知的。适合于在植物细胞中使用的标志物基因的例子可以包括例如但不限于:新霉素磷酸转移酶IKnptII)基因(Fraley 等(1983)Proc.Natl.Acad.Sc1.USA80:4803);潮霉素磷酸转移酶基因(Vanden Elzen等(1985)Plant Mol.Biol.5:299);庆大霉素乙酰转移酶、链霉素磷酸转移酶、氨基糖苷-3’ -腺苷酰转移酶、和博来霉素抗性决定子(见例如Hayford等(1988)Plant Physiol.86:1216;Jones 等(1987)Mol.Gen.Genet.210:86);Svab 等(1990)Plant Mol.Biol.14:197;及 Hille 等(1986)Plant Mol.Biol.7:171);赋予对除草剂诸如草甘膦(glyphosate)、草铵膦(glufosinate)或溴苯腈(bromoxynil)的抗性的选择标志物基因(见例如 Comai 等(1985)Nature317:741-744;Gordon-Kamm 等(1990)Plant Cell2:603-618;及 Stalker 等(1988) Science242:419-423);小鼠二氢叶酸还原酶(Eichholtz 等(1987) Somatic Cell Mol.Genet.13:67);植物 5_ 烯醇丙酮酸莽草酸(enolpyruvylshikimate)-3-憐酸合酶(Shah 等(1986) Science233:478);植物乙酸乳酸合酶(Charest 等(1990)Plant Cell Rep.8:643)。另一类适合于植物转化的标志物基因采用筛选据推测经转化的植物细胞,而不对经转化的细胞直接遗传选择对毒性物质诸如抗生素的抗性。这些基因特别可用于量化或显现基因在特定组织中表达的空间样式,并且通常称为“报告基因”,因为它们可以与基因或基因调节序列融合以调查基因表达。通常用于筛选经转化的细胞的基因包括葡糖醛酸糖苷酶(GUS)、β-半乳糖苷酶、萤光素酶和氯霉素乙酰转移酶。见例如Jefferson(1987)Plant Mol.Biol.Rep.5:387;Teeri 等(1989)EMBO J.8:343;Koncz 等(1987)Proc.Natl.Acad.Sci U.S.A.84:131;及 DeBlock 等(1984)EMBO J.3:1681。最近,已经可用用于显现⑶S活性的体内方法,其不需要破坏植物组织。MolecularProbes publication2908, Imagene Green.TM.,第 1-4 页,1993;及 Naleway 等(1991)J.Cell Biol.115:151a。此外,已经利用编码荧光蛋白(例如,GFP,EGFP,EBFP,ECFP,和YFP)的基因作为原核和真核细胞中基因表达的标志物。见Chalfie等(1994)Science263:802o可以使用荧光蛋白和荧光蛋白的突变作为可筛选标志物。在一些实施方案中 ,可以使用本文中公开的玉米Rf4基因和玉米Rf4基因的片段或区段来鉴定来自与玉米不同的生物体的同源Rf4序列(例如,通过序列比较来进行)。来自与玉米不同的生物体且与玉米Rf4基因同源的序列可以依照公知的技术,例如基于其与Rf4-bHLH的序列同源性来鉴定并分离。例如,依照常规技术可以使用整个或部分的Rf4-bHLH编码序列作为探针,该探针与存在于来自生物体的克隆基因组DNA片段群体(SP,基因组文库)中的其它序列特异性杂交。如此,在一些实施方案中,本发明包括与Rf 4-bHLH序列(例如SEQ ID NO:220)特异性杂交的那些核苷酸序列。或者,可以通过序列比较鉴定并分离来自与玉米不同的生物体且与玉米Rf4基因同源的序列。例如,可以依照常规技术用玉米Rf 4-bHLH序列(例如SEQ ID N0:220)搜索生物体的完全或部分测序的基因组以鉴定生物体基因组内与玉米Rf4共享高度序列同一性,并且因此可能是Rf4同源物的基因。例如,可以使用整个或部分玉米Rf4序列(例如SEQ ID NO:220)作为“参照序列”。一般地,与参照序列比较的核酸序列(例如,基因组文库的克隆或基因组DNA片段)包含“比较窗”,其是核酸序列的特定连续区段。比较窗与参照序列(其不包含添加或缺失)相比可以包含添加或缺失(即,缺口)以实现两个序列的最佳比对。通常,比较窗的长度为至少20个连续核苷酸,但是长度可以是30,40,50,100,或200个核苷酸,或更长。为了避免由于多核苷酸序列比较窗中包含缺失而与参照序列的高度相似性,可以引入“缺口罚分”以从核苷酸匹配数目扣除。比对比较序列的方法是本领域中公知的。可以使用可用的数学算法来实现任何两种序列间百分比序列同一性的测定。此类数学算法的非限制性例子是Myers andMiller (1988), CAB10S4:11-7 的算法;Smith 等(1981) Adv.Appl.Math.2:482 的局部比对算法;Needleman 和 Wunsch (1970), J.Mol.Biol.48:443-53 的全局比对算法;Pearsonand Lipman (1988), Proc.Natl.Acad.Sc1.USA85:2444-8 的搜索局部比对法;Karlin 和Altschul(1990), Proc.Natl.Acad.Sc1.USA87:2264,及 Karlin 和 Altschul (1993)Proc.Natl.Acad.Sc1.USA90:5873-7 的算法。本领域普通技术人员可以在计算机上实现这些数学算法以比较序列,从而测定序列同一性,或依照与参照序列的共享序列同一性搜索包含多个序列的数据库(例如,生物体基因组数据库)。此类实现包括但不限于PC/Gene程序(Intelligenetics, MountainView, CA)中的 CLUSTAL ;和 GCG Wisconsin 遗传学软件包,ν.10 (Accelrys Inc., SanDiego, CA)中的 ALIGN 程序和 GAP、BESTFIT、BLAST、FASTA、和 TFASTA。使用这些程序的序列比对可以使用其缺省参数实施。或者,可以期望在一些搜索中修改缺省参数(例如,改变缺口罚分的数值)。选择数学算法的特定计算机实现以计算序列同一性,以及选择在选定的算法中使用的参数数值在本领域技术人员的判断内。在一些实施方案中,可以将用于杂种种子生成的CMS_C/Rf4系统工程化改造入缺乏功能性Rf4恢复系基因的玉米品种或与玉米不同的植物物种中,其例如通过将Rf4基因导入此类玉米品种或植物物种来进行。

如此,依照一些实施方案,可以在生成杂种种子的方法中使用本文中所描述的Rf4基因。用于生成杂种种子的方法可以包括获得包含玉米Rf 4-bHLH序列(例如SEQ IDNO: 220),或与玉米Rf 4-bHLH序列特异性杂交的核苷酸序列的核酸分子。然后,可以将所述核酸分子导入植物细胞或植物组织中,其中自其获得植物细胞或植物组织的植物可以是玉蜀黍,或不同植物物种。随后,可以从已经接受所述核酸分子导入的植物细胞或植物组织生成经转化的全植物。然后,通过经转化的全植物使细胞质雄性不育植物受精。然后,可以从已经通过经转化的全植物受精的细胞质雄性不育植物获得生成能育植物的种子。在具体的实施方案中,可以在生成杂种种子的方法中使用玉米Rf4_bHLH基因的玉米Rf4-bHLH功能性变体或同源物替换玉米Rf4-bHLH序列(例如SEQ ID NO: 220),或与玉米Rf 4-bHLH序列特异性杂交的核苷酸序列。例如通过上文所描述的方法生成的经转化的全植物可以能够生成种子。然而,此类种子可以能够或不能生成为能育植物。因而,用于生成杂种种子的方法的一些实施方案牵涉植物组织培养技术。此类技术是对于本领域普通技术是常规的且公知的。在用于杂种种子生成的CMS_C/Rf4系统工程化改造入与玉米不同的植物物种中的实施方案中,可能有必要还将包含一种或多种牵涉CMS-C雄性不育系统的核酸序列的核酸分子导入所述植物物种中。例如,可以导入隐性rf4-bHLH等位基因以替换所述植物物种中的Rf 4-bHLH直向同系物,从而生成雄性不育rf4/rf4植物,可以对该雄性不育rf4/rf4植物导入Rf 4-bHLH基因以将用于杂种种子生成的CMS-C/Rf4系统工程化改造入所述物种中。在一些实施方案中,可以在用于生成杂种种子的方法中使用本文中所描述的Rf4基因,所述方法包括用来自包含Rf4基因的雄性植物的花粉使具有CMS-C型雄性不育性状的雌性植物受精。在这些和其它实施方案中,可以使用玉米Rf4-bHLH序列(例如SEQ IDN0:220)、与玉米Rf4-bHLH序列特异性杂交的核苷酸序列、或玉米Rf4_bHLH序列的功能性变体或同系物。在一些实施方案中,用于生成杂种种子的方法包括通过例如回交;诱变;转化;或同源重组生成包含Rf4的第一植物。然后,可以通过例如回交;诱变;或同源重组获得或生成具有CMS-C型雄性不育性状的第二植物。然后,可以将第二植物与第一植物杂交以从第二植物获得能育杂种种子。在实施方案中,第一植物可以是雄性植物,而第二植物可以是雌性植物。在用于生成杂种种子的方法的具体例子中,植物可以是玉米植物。在其它例子中,可以使用与玉米不同的植物。依照本发明的用于生成杂种种子的方法的实施方案可适用于任何植物,诸如有性繁殖植物,包括农艺学价值的植物,例如但不限于:玉米;大豆;苜蓿;小麦;油菜籽;稻;高粱;甜菜;短柄草属;单子叶植物;双子叶植物;各种蔬菜,包括黄瓜、番茄、胡椒等;各种树,包括苹果树、梨树、桃树、樱桃树、红杉、松、橡树等等;和各种开花观赏植物。V.使用Rf4分子标志物的方法使用与Rf4基因连锁或驻留于Rf4基因内的核酸分子标志物来鉴定具有C型CMS的功能性恢复系基因的植物的方法可以导致植物发育者成本节约,因为此类方法可以消除对杂交包含功能性恢复系基因的植物与CMS植物系,然后对杂交后代测定表型的需要。

可以将其它标志物鉴定为与本文中命名的任何例示性标志物(例如SEQ IDNO: 1-197和多态性ID N0.1_106(表3))的等同物,其例如通过测定别的标志物和例示性命名标志物之间的重组频率进行。此类测定可以利用基于Mather (1931),The Measurementof Linkage in Heredity, Methuen&C0., London方法的改善的正交比较方法,接着是测定重组频率的最大概率的测试。AlIard (1956) Hilgardia24:235-78。若重组频率的数值在任何玉米栽培种中小于或等于0.10(即10%),则为了在目前公开的方法中使用。认为别的标志物等同于特定的参照标志物。用于对CMS-C玉米恢复能育性的手段可以包括来自植物的核酸序列,该核酸的检测至少提供如下的强烈指示,即包含该核酸序列的植物包含CMS-C基因的功能性恢复系。在一些例子中,用于对CMS-C玉米恢复能育性的手段是与Rf 4-bHLH基因连锁(例如,连锁;紧密连锁;极端紧密连锁)的或驻留于Rf 4-bHLH基因内的标志物。用于鉴定携带对CMS-C玉米恢复能育性的基因的玉米植物的手段可以是在对自携带对CMS-C玉米恢复能育性的基因的植物获得的样品添加时呈现可检出信号的分子。核酸的特异性杂交是可检出信号,因此,与CMS-C恢复系基因特异性杂交的核酸探针,或作为功能性CMS-C恢复系基因存在的指标的不同基因组核酸序列可以是用于鉴定携带对CMS-C玉米恢复能育性的基因的玉米植物的手段。在一些例子中,用于鉴定携带对CMS-C玉米恢复能育性的基因的植物的手段是与标志物特异性杂交的探针,所述标志物与玉米Rf4-bHLH基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于玉米Rf 4-bHLH基因内。
在一些实施方案中,可以使用在Rf4基因侧翼的标志物来转移明确含有Rf4基因的供体亲本DNA区段。在具体的实施方案中,标志物选自下组:包含SEQ ID N0:l_197和多态性ID N0.1-106(表3)的标志物,或与选自下组的标志物等同的标志物:包含SEQ IDNO: 1-197和多态性ID N0.1-106(表3)的标志物。在一些实施方案中,使用在Rf4基因侧翼的标志物来转移明确含有Rf4基因的供体亲本DNA区段的方法可以包括用与同Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)的标志物特异性可杂交的探针分析两个亲本植物的基因组DNA;有性杂交两个亲本植物基因型以获得后代群体,并对那些后代分析与Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)的标志物的存在;将含有与Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)的标志物的后代与受体基因型回交以生成第一回交群体,然后,继续进行回交程序,直到获得包含由亲本基因型和Rf4基因展现的任何期望性状的最终后代。在具体的实施方案中,通过在每个世代的Rf4标志物分析选择在每个杂交和回交步骤中获得的个体后代。在一些实施方案中,用与同Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)的标志物特异性可杂交的探针分析两个亲本植物的基因组DNA包括与探针特异性杂交的较少连锁标志物,或与探针特异性杂交的无一连锁标志物。在一些实施方案中,可以使用与玉米Rf4_bHLH基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于玉米Rf 4-bHLH基因内的标志物,或玉米Rf 4-bHLH基因序列自身通过遗传转化将玉米Rf4基因导入玉米植物中。在具体的实施方案中,标志物选自下组:包含SEQ ID NO: 1-197和多态性ID N0.1-106(表3)的标志物,或与选自下组的标志物等同的标志物:包含SEQ ID NO: 1-197和多态性ID N0.1-106(表3)的标志物。在一些实施方案中,通过遗传转化将玉米Rf4基因导入玉米植物中的方法可以包括用与同Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)的标志物或Rf4基因自身特异性可杂交的探针分析植物(例如玉米植物)的基因组DNA以鉴定植物中的Rf4基因 ;例如通过提取基因组DNA并用一种或多种酶限制性内切核酸酶消化基因组DNA来分离包含Rf4基因的植物基因组DNA区段;任选地,扩增分离的DNA区段;将分离的DNA区段导入宿主玉米植物的细胞或组织中;并用与同Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)的标志物或Rf4基因自身特异性可杂交的探针分析宿主玉米植物DNA以鉴定宿主玉米植物中的Rf4基因。在具体的实施方案中,可以将分离的DNA区段导入宿主玉米植物中,使得它稳定整合入宿主玉米植物的基因组中。在一些实施方案中,可以使用与玉米Rf4_bHLH基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于玉米Rf 4-bHLH基因内的标志物,或玉米Rf 4-bHLH基因序列自身来将玉米Rf4基因导入其它生物体(例如植物)中。在具体的实施方案中,标志物选自下组:包含SEQ ID NO: 1-197和多态性ID N0.1-106(表3)的标志物,或与选自下组的标志物等同的标志物:包含SEQ ID NO: 1-197和多态性ID N0.1-106(表3)的标志物。在一些实施方案中,用于将玉米Rf4基因导入与玉米不同的生物体中的方法可以包括用与同Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)的标志物或Rf4基因自身特异性可杂交的探针分析植物(例如玉米植物)基因组DNA以鉴定植物中的Rf4基因;例如通过提取基因组DNA并用一种或多种酶限制性内切核酸酶消化基因组DNA来分离包含Rf4基因的植物基因组DNA区段;任选地,扩增分离的DNA区段;将分离的DNA区段导入与玉米不同的生物体中;并用与同Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)的标志物或Rf4基因自身特异性可杂交的探针分析与玉米不同的生物体的DNA以鉴定生物体中的Rf4基因。在具体的实施方案中,可以将分离的DNA区段导入生物体中,使得它稳定整合入生物体的基因组中。在一些实施方案中,可以使用与Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于Rf4基因内的标志物,或Rf4基因序列自身来鉴定具有CMS-C雄性不育功能性恢复系基因的植物。在具体的实施方案中,植物是玉米植物。在一些实施方案中,可以从植物提取核酸分子(例如,基因组DNA或mRNA)。然后,可以使提取的核酸分子与一种或多种探针接触,所述探针与同Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)的标志物或Rf4基因自身特异性可杂交。一种或多种探针与提取的核酸分子的特异性杂交指示植物中存在CMS-C雄性不育功能性恢复系基因。在一些实施方案中,可以使用与Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于Rf4基因内的标志物,或Rf4基因序列自身来生成杂种种子。依照此类方法的杂种种子生成由于消除手动或机械去雄而可以导致成本节约,而且可以进一步提高种子产量。在具体的实施方案中,所述方法可以包括将包含与Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)或驻留于Rf4基因内的核酸分子标志物的雄性植物和具有C型CMS雄性不育表型的雌性植物杂交。V1.包含Rf4 基因的生物体本发明的一些实施方案还提供了包含含有Rf 4-bHLH序列(例如SEQ ID NO: 220),与Rf4-bHLH序列特异性可杂交的核酸序列、或Rf4-bHLH序列的功能性变体的核酸分子的生物体。合适的生物体可以是任何合适的植物、酵母、或细菌。作为非限制性例子,包含前述序列的植物可以是农艺学价值的植物,例如但不限于:玉米;大豆;苜蓿;小麦;油菜籽;稻;高粱;甜菜;短柄草属(Brachypodium);单子叶植物;双子叶植物;各种蔬菜,包括黄瓜、番茄、胡椒等;各种树,包括苹果树、梨树、桃树、樱桃树、红杉、松、橡树等等;和各种开花观赏植物。在具体的实施方案中,生物体可以是有性繁殖植物。包含特定核酸序列的携带种子的植物可以生成包含核酸序列的种子。可以将包含Rf 4-bHLH序列(例如SEQ ID NO: 220)、与Rf4_bHLH序列特异性可杂交的核酸序列、或Rf4-bHLH序列的功能性变体的植物细胞培养,并作为植物组织培养细胞保持,或者可以将本领域中已知的某些植物激素添加至培养基,由此引起植物组织培养细胞分化并形成新的植物品种,该新的植物品种可以是能育或不育的。可用于这些和其它实施方案的此类植物培养方法是本领域中常规且公知的。本发明的一些实施方案提供了包含Rf 4-bHLH序列(例如SEQ ID N0:220)、与Rf4-bHLH序列特异性可杂交的核酸序列、或Rf4-bHLH序列的功能性变体的病毒(例如,噬菌体或植物病毒)。提供以下实施例以例示某些具体的特征和/或实施方案。实施例不应解释为将公开内容限制于例示的具体特征或实施方案。
实施例实施例1:材料和方法
确认群体。使用CMS-C型的雄性不育系BE4207和响应CMS-C型的雄性不育恢复系品系XJH58作为亲本以生成匕后代。然后,将F1后代自交以生成&群体。使用F2群体(其由500个个体组成)来鉴定Rf4基因和与Rf4基因连锁(例如,连锁;紧密连锁;或极端紧密连锁)的标志物。精细定位BE4207/XJH58F3 群体在威斯康星州阿灵顿(Arlington, Wisconsin)在2010年夏季苗圃中种植总共5465个种子,所述种子选自染色体8顶部的4.2Mb区内的不同片段方面分离的确认F2群体的15个杂合F2家族。从5104个萌发的幼苗收集叶样品以基因型分型。能育性分类。根据从雄穗脱落的花粉将此&群体中的500个植物在表型上分类。将脱落花粉的植物分类为能育的。将不脱落花粉的植物分类为不育的。此群体中的Rf4恢复是完全的;没有观察到部分能育的植物。DNA提取和量化。从F2群体的每个植物收集叶组织的8个冲孔,并通过使用Biocel 1800 (AgilentInc.,Santa Clara, CA)提取DNA。使用的DNA提取方法是:(I)将I个约.32cm直径钨合金珠添加至每个管;(2)将300 μ L RLT裂解缓冲液(Qiagen Inc., Germantown, MD)添加至每个管;(3)加帽,并在 SPEX2000 Geno/GlinderK (OPS Diagnostics, LLC, Lebanon, NJ)
中以1500击/分钟研磨6分钟;(4)以6000rpm将样品向下旋转5分钟;(5)使管脱帽;在扮00611¥1800·上实施下列步骤:(6)将200yL上清液转移至1.1mL含有IOyL
MagAttract"悬浮液G珠(Qiagen Inc.)的正方形孔圆底测定板;(7)温育2分钟;(8)以
1200rpm摇动40秒;(9)温育2分钟;(10)将测定板放置到磁体架上,并容许珠分离40秒;(11)除去上清液;(12)第一次清洗:添加190 μ L与RNA酶和异丙醇预混合的RPW 清洗缓冲液,并以1200rpm摇动40秒;(13)将测定板放置到磁体架上,并容许珠分离20秒;(14)除去上清液;(15)第二次清洗:添加190μ L100%乙醇清洗缓冲液,并以1200rpm摇动40秒;(16)将测定板放置到磁体架上,并容许珠分离20秒;(17)第三次清洗:添加190 μ L100%乙醇清洗缓冲液;(18)以1200rpm摇动40秒;(19)将测定板放置到磁体架上,并容许珠分离20秒;(20)除去上清液;(21)于室温将板温育5分钟;(22)添加100 μ L ΑΕ 洗脱缓冲液(Qiagen Inc.) ; (23)摇动2分钟;(24)将测定板放置到磁体架上,并容许珠分离30秒;并(25)将上清液转移至清洁的、标记的板,并密封。将DNA于4° C贮存。通过使用PicoGreen (Invitrogen Inc., Carlsbad, CA)量化 DNA,并相对于 5_6ng/ μ L 标准化浓度以用于 KASPar 基因型分型系统(KBioscience Inc.,Hoddesdon, UK)。KASPar SNP基因型分型系统。竞争性等位基因特异性PCR基因型分型系统(KASPar )是一种SNP检测系统,其使用基于等位基因特异性寡聚物延伸和荧光共振能量转移(FRET)的技术来产生信号。KASPar 测定法中的每种SNP标志物仅需要两种组分:测定混合物(三种未标记的引物的混合物:两种等位基因特异性寡聚物,和一种共同反向基因座特异性寡聚物);和反应混合物(PCR需要的其它组分,包括通用荧光报告系统和Taq聚合酶)。
使用Kbioscience实验室信息管理系统(KLIMS ) (KBioscience Inc.)设计引物,并且寡核苷酸由Integrated DNA Technology (CoralviIle, IA)合成。依照制造商的推荐实施KASPar 反应。PCR以于94° C变性15分钟开始,接着是于94° C变性10秒,于57° C退火5秒,然后于72° C延伸10秒的20个循环,这20个循环继之以于94° C变性10秒,于57° C退火20秒,然后于72° C延伸40秒的22个循环。在荧光分光光度计(Tecan GENios , Mannedorf, Switzerland)中以 485nm 的激发波长,和 535nm 的发射波长(对于FAM突光团);以及525nm的激发波长,和560nm的发射波长(对于VIC突光团)阅读完成KASPar 反应后的突光信号。使用Klustercaller 软件(KBiosciences Inc.)分析数据以测定群体中每种SNP标志物的基因型。RNA 提取和实时 PCR(RT-PCR)在温室中培养亲本和Rf4区方面分离的F3植物。从5周、7周、和9周龄植物收集叶组织。还收集具有形成的花药/花粉和脱落的花粉(在能育植物中)的雄穗组织。使用RNeasy 植物迷你试剂盒(Qiagen Inc.)提取总RNA。使用QuantiTect 反转录试剂盒(Qiagen Inc.)合成cDNA。对于RT-PCR,Rf4基因特异性引物、玉米转化酶对照引物、和用FAM或VIC和小沟结合非荧光淬灭剂 I (MGBNFQ)染料双重标记的探针由Applied Biosystems (Foster City, CA)合成。使用 TaqMan 基因型分型主混合物(AppliedBiosystems)来建立 10 μ IPCR 反应,并在 LightCycler 480 (Roche)上实施 PCR。PCR 程序包括:于95 ° C活化10分钟,接着95 ° C持续10秒和58 ° C持续38秒的50个循环。在每个循环结束时记录荧光信号。使用转化酶作为对照使用Delta CT法计算相对表达水平。实施例2 =Rf4基因的定位能育性分离分析。F2群体中能育性分离的比率是3:1。表I。结果表明CMS-C/Rf4系统中的能育性恢复受到一种显性恢复系基因Rf4控制。表1:来自确认群体的表型数据。
权利要求
1.一种用于鉴定包含玉米C型细胞质雄性不育的功能性恢复系基因的植物的方法,该方法包括: 自植物分离核酸分子;和 对分尚的核酸分子筛选如下的核酸分子,该核酸分子包含选自由SEQ ID N0:l_197组成的组的核苷酸序列和表3中称为多态性ID N0.1-106的标志物,或其等同物,其中包含选自由SEQ ID NO: 1-197组成的组的核苷酸序列和表3中称为多态性ID N0.1-106的标志物,或其等同物的核苷酸序列的至少一种核酸分子的存在指示玉米C型细胞质雄性不育的功能性恢复系基因。
2.依照权利要求1的方法,其中所述分离的核酸分子包含如下的核酸分子,该核酸分子包含选自由SEQ ID NO: 1-197组成的组的核苷酸序列和染色体8上在表3中称为多态性ID N0.1-106的标志物。
3.依照权利要求1的方法,其中所述分离的核酸分子是基因组DNA。
4.依照权利要求1的方法,其中使用竞争性等位基因特异性聚合酶链式反应实施对所述分尚的核酸分子筛选如下的核酸分子,该核酸分子包含选自由SEQ ID ΝΟ:1_197组成的组的核苷酸序列和表3中称为多态性ID N0.1-106的标志物,或其等同物。
5.依照权利要求1的方法,其中所述核苷酸序列选自下组:SEQID NO:6-9; SEQID NO:105;SEQ ID NO:109;SEQ ID NO:111;SEQ ID NO:115;SEQ ID NOs:118-120;SEQID NO:123;SEQ ID NO:126;SEQ ID NO:134;SEQ ID NO:135;SEQ ID NO:137;SEQID NO:138;SEQ ID NO:144;SEQ ID NO:149;SEQ ID NO:151;SEQ ID NO:160;SEQ IDNO:163;SEQ ID NO:164;SEQ ID NO:167;SEQ ID NO:173;SEQ ID NO:177;SEQ IDNO: 178; SEQ ID NO: 183; SEQ ID NO: 189-191; SEQ ID NO: 197;及表 3 中称为多态性 IDN0.1-106的标志物。
6.依照权利要求5的方法,其中所述核苷酸序列选自由SEQID NO:8和DAS-CMS1-34组成的组。
7.依照权利要求5的方法,其中所述核苷酸序列选自下组:SEQID NO: 105, SEQID NO:109, SEQ ID NO:111,SEQ ID NO:115,SEQ ID NO:118,SEQ ID NO:119,SEQ IDNO: 120, SEQ ID NO: 123, SEQ ID NO: 126,和 SEQ ID NO: 134,以及表 3 中称为多态性 IDN0.1-106的标志物。
8.依照权利要求1的方法,进一步包括表3中称为多态性IDN0.1-106的每种标志物测定所述植物的基因型。
9.通过依照权利要求1的方法鉴定的植物。
10.依照权利要求9的植物,其中所述植物在与具有响应玉米C型细胞质雄性不育性状的植物杂交时没有生成大量半能育植物。
11.一种用于分离玉米中的Rf4基因的方法,该方法包括: 将具有C型细胞质雄性不育性状的雄性不育玉米植物与具有响应C型细胞质雄性不育性状的雄性不育恢复系玉米植物杂交以生成F1玉米植物; 将所述F1玉米植物自交以生成F2玉米植物; 将多个所述F2玉米植物的能育性表型分类; 测定与自所述多个F2 玉米植物之每个分离的基因组DNA的染色体8的位置86247到位置98188对应的区域的至少一部分的核苷酸序列; 鉴定与染色体8的位置86247到位置98188对应的区域内与恢复的能育性表型具有最高连锁频率的编码序列,其中鉴定的编码序列是玉米中的Rf4基因。
12.依照权利要求11的方法,其中所述具有C型细胞质雄性不育性状的雄性不育玉米植物是BE4207。
13.依照权利要求11的方法,其中所述具有响应C型细胞质雄性不育性状的雄性不育恢复系玉米植物是XJH58。
14.依照权利要求11的方法,其中所述具有C型细胞质雄性不育性状的雄性不育玉米植物是BE4207,且其中所述具有响应C型细胞质雄性不育性状的雄性不育恢复系玉米植物是 XJH58。
15.依照权利要求11的方法,其中所述Rf4基因是螺旋-环-螺旋转录因子GRMZM2G021276(Rf4-bHLH)。
16.依照权利要求11的方法,其中所述多个F2玉米植物包含至少500个玉米植物。
17.依照权利要求11的方法,其中所述多个F3玉米植物包含至少5000个玉米植物。
18.—种在玉米中恢复细胞质雄性不育的方法,所述方法包括: 将具有C型细胞质雄性不育性状的雌性不育玉米植物与具有响应C型细胞质雄性不育性状的雄性不育恢复系玉米植物杂交以生成F1玉米植物; 使用标志物辅助选择来鉴定包含核酸分子的F1玉米植物,所述核酸分子包含选自由SEQ ID NO: 1-197组成的组的核苷酸序列和表3中称为多态性ID N0.1-106的标志物;并 繁殖鉴定的F1玉米植物,由此在玉米中恢复雄性不育。
19.依照权利要求18的方法,其中所述核苷酸序列选自下组:SEQID NO:6-9; SEQID NO:105;SEQ ID NO:109;SEQ ID NO:lll;SEQ ID NO:115;SEQ ID NOs:118-120;SEQID NO:123;SEQ ID NO:126;SEQ ID NO:134;SEQ ID NO:135;SEQ ID NO:137;SEQID NO:138;SEQ ID NO:144;SEQ ID NO:149;SEQ ID NO:151;SEQ ID NO:160;SEQ IDNO:163;SEQ ID NO:164;SEQ ID NO:167;SEQ ID NO:173;SEQ ID NO:177;SEQ IDNO: 178; SEQ ID NO: 183; SEQ ID NOs: 189-191; SEQ ID NO: 197;及表 3 中称为多态性 IDN0.1-106的标志物。
20.依照权利要求18的方法,其中所述核苷酸序列选自下组:SEQID NO: 105, SEQID NO:109, SEQ ID NO:111, SEQ ID NO:115, SEQ ID NO:118, SEQ ID NO:119, SEQ IDNO: 120,SEQ ID NO: 123,SEQ ID NO: 126,SEQ ID NO: 134,及表3 中称为多态性 ID N0.1-106的标志物。
21.—种在玉米中恢复能育性的方法,该方法包括将权利要求15的分离的Rf4-bHLH基因导入具有C型细胞质雄性不育性状的雌性玉米植物中。
22.依照权利要求21的方法,其中通过与包含所述Rf4-bHLH基因的雄性不育恢复系玉米植物杂交将所述Rf4-bHLH基因导入所述具有C型细胞质雄性不育性状的雌性玉米植物中。
23.一种用于生成杂种玉米种子的方法,该方法包括: 用来自包含Rf4-bHLH基因的雄性玉米植物的花粉使具有CMS-C型雄性不育性状的雌性玉米植物受精 ;并自所述雌性玉米植物获得杂种玉米种子。
24.一种用于生成杂种玉米种子的方法,该方法包括: 提供具有C型细胞质雄性不育性状的雌性玉米植物; 用来自权利要求15的包含Rf4-bHLH基因的雄性玉米植物的花粉使所述雌性玉米植物受精;并 收获所述雌性玉米植物上形成的杂种玉米种子。
25.—种用于生成杂种种子的方法,该方法包括: 获得如下的核酸分子,其包含SEQ ID N0:220的玉米Rf4-bHLH序列,或与SEQ IDNO: 220的玉米Rf 4-bHLH序列特异性杂交的核苷酸分子; 将所述核酸分子导入期望物种的植物细胞或植物组织中以生成所述期望物种的经转化的植物细胞或植物组织; 从已经导入所述核酸分子的所述植物细胞或植物组织生成所述期望物种的经转化的全植物; 用来自所述期望物种的经转化的全植物的花粉使所述期望物种的细胞质雄性不育雌性植物受粉;并 自受粉的细胞质雄性不育雌性植物获得杂种种子。
26.权利要求25的方法,其中所述期望的物种选自下组:玉米;大豆;苜蓿;小麦;油菜籽;稻;高粱;甜菜;短柄·草属(Brachypodium);单子叶植物;双子叶植物;黄瓜;番爺;胡椒;苹果树;梨树;桃树;楼桃树;红杉(redwood);松;橡树;和开花观赏植物。
27.一种分离的玉米Rf 4-bHLH基因,其包含与以SEQ ID NO: 220列出的核苷酸序列基本上同源的核苷酸序列。
28.权利要求27的玉米Rf4-bHLH基因的功能性变体。
29.权利要求27的玉米Rf4-bHLH基因的同源物,其中所述同源物是来自与玉蜀黍不同的植物的天然基因。
30.一种分离的核酸分子,其编码包含与SEQ ID NO:225基本上同源的氨基酸序列的多肽。
31.一种包含权利要求30的核酸分子的植物,其中所述植物不是玉蜀黍。
32.—种生成遗传工程化生物体的方法,包括将权利要求30的核酸分子导入该生物体中。
33.一种从植物分离Rf4同源物的方法,该方法包括: 从植物获得基因组DNA ; 使所述基因组DNA与同权利要求30的核酸分子特异性杂交的核苷酸序列接触;并分离与所述核苷酸序列特异性杂交的DNA的一个或多个基因组序列,所述核苷酸序列与权利要求30的核酸分子特异性杂交,其中所述基因组DNA的一个或多个序列是Rf 4-bHLH同源物。
34.一种在玉米中恢复细胞质雄性不育的方法,该方法包括: 将具有C型细胞质雄性不育性状的雌性不育玉米植物与包含对CMS-C玉米恢复能育性的手段的雄性不育恢复系玉米植物杂交以生成F1玉米植物; 鉴定包含对CMS-C玉米恢复能育性的手段的F1玉米植物;并繁殖鉴定的F1玉米植物,由此在玉米中恢复雄性不育。
35.一种用于鉴定包含玉米C型细胞质雄性不育的功能性恢复系基因的植物的方法,该方法包括: 从植物分离核酸分子;并 使分离的核酸分子与用于鉴定携带对CMS-C玉米恢复能育性的基因的玉米植物的手段接触以产生可检测信号,该可检测信号指示所述植物中玉米C型细胞质雄性不育的功能性恢复系基因的存在。
36.一种用于转移玉米Rf4基因的方法,该方法包括: (a)用与至少一种与Rf4基因连锁的标志物特异性可杂交的探针分析具有供体基因型的第一植物的基因组DNA和具有受体基因型的第二植物的DNA ; (b)将两种亲本植物基因型有性杂交以获得后代群体; (c)对所述后代群体分析所述至少一种与Rf4基因连锁的标志物的存在; (d)将来自包含所述至少一种与Rf4基因连锁的标志物的所述后代群体的个体与所述受体基因型回交以生成下一代群体; (e)测定所述下一代群体的成员是否包含来自所述受体基因型的期望性状和所述Rf4基因;并 (f)若所述下一代群体的成员没有包含来自所述受体基因型的期望性状和所述Rf4基因,则重复步骤(d)和(e),直到鉴定出包含来自所述受体基因型的期望性状和所述Rf4基因的个体。
37.权利要求35的方法,其中在每个世代通过Rf4标志物分析选择在每个杂交和回交步骤中获得的个体后代。
38.一种通过遗传转化将玉米Rf 4-bHLH基因导入宿主生物体中的方法,该方法包括: 用与同Rf4基因连锁的标志物特异性可杂交的探针分析植物的基因组DNA以鉴定所述植物中的所述Rf4基因; 分离所述植物的所述基因组DNA中与探针特异性杂交的区段,所述探针与同所述Rf4基因连锁的标志物特异性可杂交; 将基因组DNA的分离的区段导入所述宿主生物体中;并 用与同所述Rf4基因连锁的标志物特异性可杂交的探针分析所述宿主生物体的所述DNA以鉴定所述宿主生物体中的所述Rf4基因。
39.依照权利要求38的方法,其中DNA的所述分离的区段稳定整合入所述宿主生物体的基因组中。
40.依照权利要求38的方法,其中所述宿主生物体是开花植物。
41.依照权利要求40的方法,其中所述宿主生物体是玉蜀黍。
42.权利要求30的分离的核酸分子,其中所述多肽包含以SEQID NO:225列出的氨基酸序列中的突变,其选自下组: 在与SEQ ID NO:225中第103位对应的位置处天冬酰胺至组氨酸; 在与SEQ ID NO:225中第130位对应的位置处丙氨酸的缺失; 在与SEQ ID NO:225中第187位对应的位置处苯丙氨酸至酪氨酸; 及在与SEQ ID NO:225中第267位对应的位置处亮氨酸至脯氨酸。
43.权利要求42的分离的核酸分子,其中所述多肽在与SEQ ID NO:225中第187位对应的位置处包含酪氨酸 。
全文摘要
本发明内容关注Rf4的高分辨率定位和候选基因克隆、对C型细胞质雄性不育恢复能育性的能育性基因玉米恢复系。公开内容还涉及与Rf4基因紧密连锁,或驻留于Rf4基因内的分子标志物。在一些实施方案中,提供了可以从包含与Rf4基因连锁或驻留于Rf4基因内的核酸分子标志物的雄性植物和携带C型CMS的雌性植物杂交生成杂种种子的方法。
文档编号C12N15/82GK103249845SQ201180058697
公开日2013年8月14日 申请日期2011年9月26日 优先权日2010年10月6日
发明者R.任, B.A.内格尔, S.P.昆帕特拉, P.郑, G.L.库特, T.W.格雷恩, S.A.汤姆森 申请人:陶氏益农公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1