专利名称:柳枝稷生物学防范的制作方法
技术领域:
本发明涉及用于转基因植物的生物防范的方法和材料。具体而言,本发明属于可用于使柳枝稷(SWitchgrass)中不必要的转基因传递最小化的方法和材料。
背景技术:
柳枝稷是黍科的一种耐寒的多年生暖季草。柳枝稷原产于美国和加拿大中部平原,并且能生长到高达1.8m至2. 2m。柳枝稷通过根茎和小穗上生成的种子繁殖。通常认为一片柳枝稷生长三年才能达到其完全的潜力。柳枝稷使用C4碳固定途径,所述C4碳固定途径允许其生长期期间水利用效率的改善,这在干旱和高温条件下提供了优势。一旦建立, 柳枝稷还耐受水淹,而且生长快速,捕获相当大量的太阳能,并将其转化成木质纤维素组分形式的储能。柳枝稷作为牧草、作为控制侵蚀的地被物及作为家畜饲料使用。柳枝稷在氮固定方面是高度有效的,而且可以在作物轮作中种植以补充被其它作物(诸如玉米)自土壤消耗的营养物。柳枝稷也可以作为能源作物使用。柳枝稷作为能源作物提供了重要的优点,这部分是因为它可以液化、气化或直接燃烧。一旦在田地中建立,它通常每年或每半年收获,在再种植前持续10年或更长。自柳枝稷的乙醇生产可提供的净能量输出比玉米多20倍,而且自空气除去相当多的C02。柳枝稷具有每公吨植物材料生产多达100加仑(380升)乙醇的潜力,与来自甘蔗蔗糖的665加仑乙醇和来自玉米淀粉的400加仑相比,这给予柳枝稷每英亩生产1000加仑乙醇的潜力。柳枝稷颗粒的燃烧可以导致仅剩余初始质量的3%至4%作为灰烬,这部分是由于与凉季草相比,柳枝稷的硅和氯含量较低。可以通过让柳枝稷在田地里过冬,由此进一步经由淋洗过程来降低硅和氯含量,从而进一步降低灰分含量。与粘土形成对比,从灰分含量观点来看,在砂类土中生产柳枝稷也有优点,这又基于硅和氯含量。现在,转基因植物在农业产业中是常见的。柳枝稷中期望的转基因性状包括昆虫抗性、应激耐受性和增加的生物质产率。随着转基因柳枝稷植物得到开发并引入环境中,控制转基因性状从转基因柳枝稷植物向其它传统的和转基因的柳枝稷品种或者甚至其它植物物种的不期望的扩散是重要的。虽然已经采用物理隔离和花粉捕捉边行来控制研究条件下的其它物种的转基因植物,但是这些方法都很麻烦,而且对于柳枝稷而言是不实际的。在没有机械干预的情况下,有效控制转基因性状的传递和表达的方式对于管理生物质制备中使用的转基因柳枝稷植物会是有用的。发明概述本发明的特征在于可用于控制转基因性状在柳枝稷植物中传递的方法和材料。本发明的方法和材料使转基因性状从一种转基因柳枝稷植物群体向其它柳枝稷群体的不必要的传递最小化或者甚至消除,因此便于栽培转基因柳枝稷。在一个方面,本发明的特征在于一种用于生成柳枝稷种子的方法和通过所述方法生成的F1种子和植物。该方法包括杂交在传粉方面接近多个第二柳枝稷植物处种植的多个第一柳枝稷植物。第一柳枝稷植物对于第一外源核酸是纯合的,所述第一外源核酸包含与植物不育序列可操作连接的转录因子激活序列。第二柳枝稷植物对于第二外源核酸是纯合的,所述第二外源核酸包含与结合激活序列的转录因子的编码序列可操作连接的调节区。所述方法还包括收集在第一柳枝稷植物和/或第二柳枝稷植物上形成的F1种子。 自F1种子种植的F1柳枝稷植物表达植物不育序列,而且是不育的。第一柳枝稷植物、第二柳枝稷植物或第一和第二柳枝稷植物两者是克隆繁殖性植物。例如,第一柳枝稷植物可以是克隆繁殖性植物,而第二柳枝稷植物是遗传异质植物群体。或者,第一柳枝稷植物和第二柳枝稷植物两者可以是克隆繁殖性植物。作为另一个备选,第一柳枝稷植物可以是异质植物群体,而第二柳枝稷植物可以是克隆繁殖性植物。在一些实施方案中,第一柳枝稷植物是克隆繁殖性四倍体植物,而且展现出小于 0. 3%的平均自交亲和性百分比。在一些实施方案中,第一柳枝稷植物是八倍体克隆繁殖性植物,而且展现出小于1. 3%的自交亲和性百分比。在一些实施方案中,第二柳枝稷植物是四倍体克隆繁殖性植物,而且展现出小于0. 3%的平均自交亲和性百分比。在一些实施方案中,第二柳枝稷植物是八倍体克隆繁殖性植物,而且展现出小于1. 3%的平均自交亲和性百分比。在一些实施方案中,自第一柳枝稷植物和第二柳枝稷植物两者收集F1种子。在一些实施方案中,F1植物生成平均每株植物小于0. 5个能育种子。在一些情况中,F1植物不能生成雄配子、雌配子或雄配子和雌配子两者。第一柳枝稷植物和第二柳枝稷植物间的平均杂交性百分比可以是约69%至约 95%。例如,第一柳枝稷植物和第二柳枝稷植物可以是四倍体,低地生态型的,而且具有约 80%至约95%的平均杂交性百分比,例如约86%至约91%。第一柳枝稷植物可以展现出紧密的花序,而第二柳枝稷植物展现出散开的花序。 第一柳枝稷植物可以展现出一致的开花时间,而第二柳枝稷植物展现出不一致的开花时间。第二柳枝稷植物可以展现出紧密的花序,而第一柳枝稷植物展现出散开的花序。第二柳枝稷植物可以展现出一致的开花时间,而第一柳枝稷植物展现出不一致的开花时间。相对于自第二柳枝稷植物收集的种子,自第一柳枝稷植物收集的种子可以具有统计上显著升高的平均种子重量。相对于自第一柳枝稷植物收集的种子,自第二柳枝稷植物收集的种子具有统计上显著升高的平均种子重量。在一些实施方案中,种植步骤包括以第一柳枝稷植物第二柳枝稷植物大于 4 1的比率种植柳枝稷植物。种植步骤可以包括以第二柳枝稷植物第一柳枝稷植物大于4 1的比率种植柳枝稷植物。第一柳枝稷植物和第二柳枝稷植物可以是四倍体植物。 第一柳枝稷植物和第二柳枝稷植物可以是低地型柳枝稷植物。
第一柳枝稷植物可以对于外源核酸展现出纯合性,所述外源核酸包含与第二植物不育序列可操作连接的第一转录因子激活序列。第一柳枝稷植物可以对于外源核酸展现出纯合性,所述外源核酸包含与第二植物不育序列可操作连接的第二转录因子激活序列,并且第二柳枝稷植物对于外源核酸展现出纯合性,所述外源核酸包含与结合第二激活序列的第二转录因子的编码序列可操作连接的调节区。第一柳枝稷植物和/或第二柳枝稷植物可以进一步包含转基因(例如赋予除草剂抗性的转基因)。第一柳枝稷植物和/或第二柳枝稷植物对于转基因展现出纯合性。植物不育序列可以编码多肽。例如,多肽可以具有大于约175的HMM比特得分(HMM bit score),其中HMM基于
图1中所描绘的氨基酸序列,且其中与不包含所述核酸的对照植物相比,植物具有降低的能育性。多肽可以包含与SEQ ID NO :5的残基134至185具有至少80%序列同一性的AP2结构域、CMX-I基序和CMX-2基序。在一些实施方案中,多肽包含与SEQ IDNO 5的残基134至185具有至少90%序列同一性的AP2结构域、CMX-I基序和CMX-2基序。在一些实施方案中,多肽包含与SEQ ID NO 5的残基134至185具有至少 95%序列同一性的AP2结构域、CMX-I基序和CMX-2基序。在一些实施方案中,多肽包含与选自下组的序列具有至少85%序列同一性的氨基酸序列=SEQ ID N0:5、6、8、10、ll、13、15、 17、19、21、22、24、25、26、27、28、29和31中所列的序列。在一些实施方案中,植物不育多肽包含DUF640结构域。在一些实施方案中,植物不育序列包含SEQ ID NO 1、2、3和32中所列的核苷酸序列之任一种的至少50个连续的核苷酸,而且被转录成转录产物。转录因子可以是嵌合转录因子,其包含选自下组的结合结构域Lex Α、乳糖操纵子(Lac Operon)、ArgR和合成的Si指蛋白。转录因子可以是嵌合转录因子,其包含选自下组的激活结构域C1、ATMYB2、HAFL-I、ANT、ALM2、AvrXalO, VPl、DOF 和 RISBZl。调节区是广泛表达型启动子,例如玉米泛素启动子。调节区可以是光合组织启动子。相对于缺乏第一外源核酸和第二外源核酸的对照柳枝稷植物,自F1种子种植的植物在第二生长季节或随后的生长季节中可以具有统计上显著升高的生物质。还有的特征在于多个F1杂种转基因柳枝稷种子,其通过以下方法生成,包括在传粉方面接近多个第二柳枝稷植物处种植多个第一柳枝稷植物,杂交第一柳枝稷植物与第二柳枝稷植物,并收集在第一柳枝稷植物和/或第二柳枝稷植物上形成的F1种子。第一柳枝稷植物对于第一外源核酸是纯合的,所述第一外源核酸包含与植物不育序列可操作连接的转录因子激活序列。第二柳枝稷植物对于第二外源核酸是纯合的,所述第二外源核酸包含与结合激活序列的转录因子的编码序列可操作连接的调节区。第一柳枝稷植物、第二柳枝稷植物或第一和第二柳枝稷植物两者是克隆繁殖性植物。自F1种子种植的F1柳枝稷植物表达植物不育序列,而且是不育的。第一柳枝稷植物和第二柳枝稷植物可以具有大于约65% 的杂交性百分比。还有的特征在于一种用于生成柳枝稷种子的方法。该方法包括杂交在传粉方面接近多个第二柳枝稷植物处种植的多个第一柳枝稷植物,并收集在第一柳枝稷植物和/或第二柳枝稷植物上形成的F1种子。第一植物对于第一外源核酸是纯合的,所述第一外源核酸包含与植物不育序列可操作连接的转录因子激活序列。植物不育序列含有SEQ ID NO=U 2、3和32中所列的核苷酸序列之任一种的至少50个连续的核苷酸。第二植物对于第二外源核酸是纯合的,所述第二外源核酸包含与结合激活序列的转录因子的编码序列可操作连接的调节区。自F1种子种植的F1柳枝稷植物表达植物不育序列,而且是不育的。还有的特征在于一种种植柳枝稷的方法。该方法包括在第一生长季节期间种植F1 杂种柳枝稷植物,并在第二生长季节或随后的生长季节中自柳枝稷植物收获生物质。F1植物对于第一外源核酸是半合子的,所述第一外源核酸包含与植物不育序列可操作连接的转录因子激活序列。植物不育序列可以编码多肽。例如,多肽可以具有大于约175的HMM比特得分,其中HMM基于图1中所描绘的氨基酸序列,且其中与不包含所述核酸的对照植物相比,所述植物具有降低的能育性。多肽可以包含与SEQ ID NO :5的残基134至185具有至少80%序列同一性的AP2结构域、CMX-I基序和CMX-2基序。在一些实施方案中,多肽包含与SEQ ID NO 5的残基134至185具有至少90%序列同一性的AP2结构域、CMX-I基序和 CMX-2基序。在一些实施方案中,所述多肽包含与SEQ ID NO 5的残基134至185具有至少95%序列同一性的AP2结构域、CMX-I基序和CMX-2基序。在一些实施方案中,多肽包含与选自下组的序列具有至少85%序列同一性的氨基酸序列=SEQ IDNO :5、6、8、10、11、13、 15、17、19、21、22、24、25、26、27、28、29和31中所列的序列。在一些实施方案中,植物不育多肽含有DUF640结构域。在一些实施方案中,植物不育序列含有SEQ ID N0:l、2、3和32中所列的核苷酸序列之任一种的至少50个连续的核苷酸。F1植物对于第二外源核酸也是半合子的,所述第二外源核酸包含与结合激活序列的转录因子的编码序列可操作连接的调节区。F1柳枝稷植物表达植物不育序列,而且是不育的。除非另有定义,本文中所使用的所有技术术语和科学术语都具有与本发明所属领域的普通技术人员通常所理解的意思一样。虽然可以使用与本文中所描述的方法和材料相似或等效的方法和材料来实施本发明,但是下文描述了合适的方法和材料。所有本文提到的出版物、专利申请、专利和其它参考文献据此以引用的方式并入本文。在发生冲突时,以本说明书(包括定义)为准。此外,材料、方法和例子仅是示例性的,而并不意图为限制性的。在一些实例中,本发明的特征可以基本上由所述特征组成,而非包含所述特征。仅为了方便而提供章节标题。根据专利法的标准惯例,权利要求书中的词“包含”可以用“基本上由...组成”或“由...组成”替换。通过以下详细描述,本发明的其它特征和优点将显而易见。附图简述图1 (A-E)是与Ceres Clone :123905 (SEQ ID NO 5)对应的氨基酸序列与同源和/ 或直向同源氨基酸序列的比对。在此比对中,比对序列中的虚线代表缺口,即在该位置缺乏氨基酸。比对序列间相同的氨基酸或保守的氨基酸取代用框鉴定。图1是使用程序MUSCLE 第3. 52版产生的。发明详述本发明提供了用于有效使重组DNA从转基因柳枝稷植物向其它柳枝稷群体的不必要的传播最小化的新方法和材料。本发明部分基于如下的发现,即尽管事实是柳枝稷具有不同的倍性水平,而且展现出显著的自交不亲和性,但是某些核酸构建体在发育上适当的表达可以成功控制转基因柳枝稷的能育性。新方法导致不育柳枝稷植物的生成,所述不育柳枝稷植物可以按商业规模种植,关于此类植物中存在的转基因的不必要的扩散的担忧较小。此外,柳枝稷不育使得可以容易地在田地中对其评分,这有助于评估转基因效果,并且允许在必要时采取补救措施。如本文中所描述的,不育多肽(诸如SEQ ID NO 5中所列的多肽或其同系物)在发育上适当的表达可以引起柳枝稷的开花缺陷。开花缺陷是容易显而易见的,因为此类植物不育多肽的表达可以阻止橙色花药自小花出现。橙色花药的存在或缺失可以在田地中容易地观察到,而不需要更尖端的或更费时的测定法。此外,在柳枝稷中少数开放的小花内, 可以降低结籽(seed set)。另外,由SEQ ID NO 5中所列的多肽或其同系物引起的不育不引起生物质产率拖曳,而且使得仍以不改变圆锥花序对生物质产率成分贡献的方式发生圆锥花序形成。与此相反,一些其它不育多肽通过损害圆锥花序生长或降低植物生长的机制来起作用。I.定义“细胞类型优先性启动子(Cell type-preferential promoter) ”或“组织优先性启动子(tissue-preferential promoter) ”指分别优先在靶细胞类型或组织中驱动表达, 但是也可以在其它细胞类型或组织中弓丨起一些转录的启动子。“对照植物”指不含感兴趣的转基因植物中存在的外源核酸,但是在其它方面与此类转基因植物具有相同或相似遗传背景的柳枝稷植物。合适的对照植物可以是非转基因野生型植物、来自转化实验的非转基因分离子或含有与感兴趣的外源核酸不同的外源核酸的转基因植物。“域/结构域(domain) ”指多肽中可以用于表征蛋白质家族和/或蛋白质部分的基本上连续的氨基酸组。此类结构域具有“指纹”或“标签(signature)”,其可以包含保守的一级序列、二级结构和/或三维构象。一般而言,结构域与特定的体外和/或体内活性相关。结构域可以具有10个氨基酸至400个氨基酸的长度,例如10至50个氨基酸,或25至 100个氨基酸,或35至65个氨基酸,或35至55个氨基酸,或45至60个氨基酸,或200至 300个氨基酸,或300至400个氨基酸。就核酸而言的“外源的”指明核酸是重组核酸构建体的部分,或者不在其天然环境中。例如,外源核酸可以是从一种物种引入另一种物种中的序列,即异源核酸。通常,经由重组核酸构建体将此类外源核酸引入另一物种中。外源核酸对于生物体而言也可以是天然的、并且已经再引入所述生物体的细胞中的序列。包含天然序列的外源核酸常常可以通过与外源核酸连接的非天然序列(例如重组核酸构建体中在天然序列侧翼的非天然调节序列)的存在来与天然存在的序列区分。另外,经稳定转化的外源核酸通常整合在与找到天然序列的位置不同的位置。应当领会,外源核酸可以已经被引入祖先中,而非引入所考虑的细胞中。例如,含有外源核酸的转基因植物可以是经稳定转化的植物与非转基因植物间杂交的后代。认为此类后代含有外源核酸。“表达”指经由由酶,即RNA聚合酶催化的转录将多核苷酸的遗传信息转化成RNA, 及经由核糖体上的mRNA翻译而转化成蛋白质的过程。如本文中所使用的,“异源多肽”指柳枝稷植物细胞(例如经来自玉米(Zeamays) 植物的氮转运蛋白多肽编码序列转化且表达该编码序列的转基因柳枝稷(Panicum virgatum)植物)中不作为天然存在多肽的多肽。“核酸”和“多核苷酸”在本文中可互换使用,指RNA和DNA两者,包括cDNA、基因组DNA、合成DNA和含有核酸类似物的DNA或RNA。多核苷酸可以具有任何三维结构。核酸可以是双链或单链(即有义链或反义链)。多核苷酸的非限制性例子包括基因、基因片段、 外显子、内含子、信使RNA (mRNA)、转运RNA、核糖体RNA、siRNA、微小RNA、核酶、cDNA、重组多核苷酸、分支多核苷酸、核酸探针和核酸引物。多核苷酸可以含有非常规的或经修饰的核苷酸。“可操作连接的”指在核酸中布置调节区和要转录的序列,使得调节区对于调节所述序列的转录或翻译是有效的。例如,为了可操作连接编码序列和调节区,编码序列的翻译读码框的翻译起始位点通常位于调节区下游1至约50个核苷酸。然而,调节区可以位于翻译起始位点上游多至约5,000个核苷酸,或者在转录起始位点上游约2,000个核苷酸。如本文中所使用的,“多肽”指具有两个或更多个亚基氨基酸、氨基酸类似物或其它模拟肽(p^tidomimetic),而不管翻译后修饰,例如磷酸化或糖基化的化合物。亚基可以通过肽键或其它键(诸如例如酯或醚键)来连接。此定义涵盖全长多肽、截短的多肽、点突变体、插入突变体、剪接突变体、嵌合蛋白及其片段。“后代”包括特定植物或植物品系的后代。本植物的后代包括在FpF2IyFpFpF6 和后续世代植物上形成的种子或在BCpBCyBQ和后续世代植物上形成的种子,或在F1BCp F1BC2, F1BC3和后续世代植物上形成的种子。名称F1指遗传上独特的两个亲本间杂交的后代。名称F2、F3、F4、F5和F6指F1植物的自花传粉或近缘授粉后代的后续世代。“调节区”指具有影响转录或翻译启动和速率以及转录或翻译产物的稳定性和/或流动性(mobility)的核苷酸序列的核酸。调节区包括但不限于启动子序列、增强子序列、 应答元件、蛋白质识别位点、可诱导元件、蛋白质结合序列、5’和3’非翻译区(UTR)、转录起始位点、终止序列、聚腺苷酸化序列、内含子及其组合。调节区通常包含至少一个核心(基础)启动子。调节区还可以包含至少一个控制元件,诸如增强子序列、上游元件或上游激活序列(UAS)。例如,合适的增强子是来自章鱼碱合酶(ocs)基因上游区的顺式调节元件 (-212 至-154)。Fromm 等,The Plant Cell,1 :977-984 (1989)。“上调”或“激活”指相对于基础或天然状态,提高表达产物(mRNA、多肽或两者) 生成的调节,而“下调”或“阻抑”指相对于基础或天然状态,降低表达产物(mRNA和/或多肽)生成的调节。II.用于生成不育柳枝稷的方法在一个方面,本发明的特征在于用于生成不育F1杂种柳枝稷种子和植物的方法。 该方法包括杂交多个第一柳枝稷植物与多个第二柳枝稷植物。两类亲本植物各含有一种或多种转基因,其在F1后代中组合时组合操纵,使得F1后代种子可以发芽,而自此类种子种植的F1植物是不育的。如下文更为详细地阐明,第一柳枝稷植物含有第一核酸构建体,其包含与植物不育序列可操作连接的转录因子UAS和启动子。第二柳枝稷植物含有编码转录因子的核酸, 所述转录因子对于结合UAS是有效的。在杂交两类柳枝稷植物后,接着发生种子发育。转录因子在F1种子或F1植物中的表达激活植物不育序列的转录,其继而产生不育的F1植物。 因为所有或基本上所有F1植物是不育的,所以使这些转基因或此类植物中存在的任何其它转基因向其它柳枝稷植物的转移最小化或者消除。因此,转基因向其它柳枝稷植物的不必要的扩散得到有效地阻止。亲本植物
有两种不同的通用柳枝稷生态型,即低地和高地。低地柳枝稷主要是四倍体(2η =4x = 36条染色体),而高地柳枝稷栽培种主要是八倍体On = 8x = 72条染色体)。要作为亲本使用的转基因柳枝稷植物可以与其它具有相同生态型的亲本转基因柳枝稷植物及具有相同倍性(Ploidy)水平的另一生态型的植物杂交。通常,第一柳枝稷亲本植物和/或第二柳枝稷亲本植物是克隆繁殖性植物。用于生成克隆繁殖性第一柳枝稷亲本和/或第二柳枝稷亲本的特别有用的技术记载于2009年 7月22日提交的申请NO.PCT/US2009/051355中。第一柳枝稷亲本植物、第二柳枝稷亲本植物或这两种亲本植物在此类方法中可以起雌性亲本作用。克隆繁殖性柳枝稷植物在许多基因座上展现杂合性,但是由于每株植物是通过从同一克隆繁殖而生成的,所有每株植物具有基本上相同的基因型。因此,可以认为作为亲本使用的克隆繁殖性植物是遗传上一致的。应当领会,克隆繁殖性亲本植物可以具有较少比例的非克隆繁殖性植物,其或是故意添加的或是由于疏忽而存在的。在一些实施方案中,第一植物是克隆繁殖性植物,而第二植物是尚未克隆繁殖并且因此是遗传上异质的柳枝稷品种或品系的植物。相反,第一植物可以是克隆繁殖性植物, 而第二植物可以是尚未克隆繁殖的柳枝稷品种或品系的植物。具有在遗传上异质的一类亲本植物可以维持不育F1后代中的遗传多样性,使得F1植物可以适应于多种多样的环境条件,所述环境条件可以在F1植物群落出于商业目的使用的年份期间发生。第一柳枝稷亲本植物或第二柳枝稷亲本植物在这些实施方案中可以起雌性亲本作用。可以通过植物育种方法来开发适合于在本文所描述的方法中作为亲本之一使用的柳枝稷品种或品系,所述植物育种方法通常记载于例如Allard,Principles of Plant Breeding,John Wiley & Sons,Inc. (1960) ;Simmonds,Principles of Crop Improvement, Longman Group Limited(1979);及 Jensen, Plant Breeding Methodology, John Wiley & Sons, Inc. (1988)。明确可适用于柳枝稷的详细育种方法考虑在要存在于亲本植物中的转基因方面达到纯合性的必要性。例如,柳枝稷品种可以通过混合选择程序来开发。在混合选择中,对期望的个体植物进行选择、收获、并在不进行后代测试的情况下复合种子以产生下一世代。因为选择仅仅基于母系亲本,而且在传粉上没有对照,所以混合选择相当于伴有选择的随机交配形式。混合选择通常增加期望的基因型在群体中的比例。或者,可以利用具有后代测试的选择程序。具有后代测试的选择程序一般比混合选择优选。具有柳枝稷后代测试育种程序的选择的例子包括用于品种改良的约束性轮回表型选择(Restricted Recurrent Phenotypic Selection, RRPS)和半同胞家族间及半同胞家族内选择(Between and Within Half-Sib Family Selection^ & WFS)。可以通过这些程序之任一种来开发适合作为亲本的柳枝稷品种。另一种备选是在基因型轮回选择程序中开发柳枝稷亲本品种。 Taliaferro, Breeding and Selection of New Switchgrass Varieties for Increased Biomass Production, Oak Ridge National Laboratory USA Q002)。基因型轮回选择依赖于建立年的次年对半同胞后代性能的分析。作为另一种备选,可以开发合成品种以作为亲本使用。合成品种通过杂交数种初始来源植物来生成。用于开发合成物的初始植物品种、 群体、野生添加物(wild accession)、生态型等的数目可以从仅仅10变化至多达500。通常,使用约100至300种品种、群体等来启动合成品种的开发。随后,来自初始种子生产样地的种子可以经历一个或多个世代的繁殖,这取决于在转基因方面达到纯合性所需要的世代数目和执行亲本杂交所期望的种子量。转基因柳枝稷植物可以进入育种程序中,以将不同外源核酸引入柳枝稷品系中或者用于进一步选择其它期望的性状,之后使用该植物作为亲本来生成F1杂种。转基因遗传不管亲本植物是否通过克隆繁殖获得,要在本文中所描述的方法中作为亲本使用的柳枝稷植物育种为对于赋予植物不育中牵涉的转基因展现出纯合性。柳枝稷是异源四倍体或异源八倍体,因此,一般在给定的遗传基因座(包括转基因基因座)方面展现出二体遗传。然而,并不是所有的基因座会遵循单一的遗传模式,因为同源染色体与双减数之间的优先配对偶尔可以在柳枝稷中发生,这导致在一些情况下的分离异常(segregation distortion)0因此,一般期望确认的是,特定的转基因事件表现为纯合子,之后进展为在所述方法中使用来自该事件的植物作为亲本。因此,例如,含有第一外源核酸(包含植物不育序列)的转基因柳枝稷植物选择为纯合的,而且在外源核酸方面展现出单一的孟德尔遗传 (Mendelian inheritance) 0作为另一个例子,含有第二外源核酸(包含转录因子编码序列)的转基因柳枝稷植物选择为纯合的,而且在外源核酸方面展现出单一的孟德尔遗传。 作为另一个例子,含有第三外源核酸(包含感兴趣的序列)的转基因柳枝稷植物选择为纯合的,而且在外源核酸方面展现出单一的孟德尔遗传。在这点上,经由分子分析的后代测试在回交过程中可以是特别有用的,以获得含有外源核酸的群体。所述群体进行多系杂交同胞交配,接着进行后代测试以鉴定纯合个体,然后便可以产生期望的转基因亲本系。杂交亲本植物通过种植在传粉方面接近的多个两类植物来杂交第一柳枝稷亲本植物和第二柳枝稷亲本植物。两类亲本植物可以在不同行中种植或者可以随机间作,并且在适合于柳枝稷且本领域中已知的农艺学实践下在田地中种植。在任意方案中,第一亲本植物与第二亲本植物的比率可以从1 10变化至10 1,例如第一亲本第二亲本比率可以是9 1、 4 1、1 1、1 4或1 9。技术人员可以基于诸如雄性亲本的花粉脱落和雌性亲本的花粉接收性等因素来做出合适比率的选择。杂交通常经由风媒传粉发生,尽管也可以经由手工传粉发生,例如可以用手将来自第二类植物的花粉传给第一类植物,和/或可以用手将来自第一类植物的花粉传给第二类植物。在一些实施方案中,传粉牵涉除去一组亲本植物的植物上的花粉形成结构以便阻止自花传粉,由此允许来自另一组植物的花粉的手工或天然传粉。柳枝稷展现出部分或完全自交不亲和性。因此,第一柳枝稷植物和第二柳枝稷植物在方法中都可以起雌性亲本的作用,每类植物通过来自另一亲本的花粉受精。有时期望具有仅在亲本之一上优先形成的种子。在此类情况下,优先形成种子的亲本称作假雌性,而起花粉供体作用的亲本称作假雄性。在存在完全自交不亲和性时,在本文中所描述的方法中作为亲本使用的柳枝稷植物不需要诸如雄性不育系统或除去花粉形成结构等措施来使异花传粉发生。对于四倍体柳枝稷植物而言,完全自交不亲和性指小于0.3%的平均自交亲和性百分比,如通过 Martinez-Reyna等Crop Sci. 42 =1800-1805(2002)的方法所测定的。对于八倍体柳枝稷植物,完全自交不亲和性指小于1. 3%的平均自交亲和性百分比,如通过Martinez-Reyna等Crop Sci. 42 =1800-1805(2002)的方法所测定的。使用完全自交不亲和性的亲本确保生产田地中所生产的种子主要是或者甚至专门是F1杂种种子。期望使用如下的亲本,其已经表明为生成(通过杂交性百分比测定的)高百分比后代种子。杂交性百分比指两种不同的柳枝稷品种或群体的植物间进行受控的杂交后去雄并受精的每个小花获得的种子的百分比,如记载于Martinez-Reyna等Crop Sci. (38 876-878(1998)及 Martinez-Reyna 等 Crop Sci. 42 1800-1805 (2002)中的。因此,期望使用杂交性百分比大于65%,例如66%至85%、66%至80%、69%至85%、70%至75%、73% 至 80%、75% 至 95%、80% 至 95%、85% 至 95%、85% 至 90%、80% 至 90%、90% 至 95% 或 66%和95%之间的任何范围之间的亲本。杂交性百分比受诸如亲本是否在相似时间开花等因素的影响。此外,并不是所有配对必然会导致不育后代,这是由于例如插入有转基因的基因组位置对自交不亲和性可具有的影响所致。因此,候选亲本对通常以成对组合杂交,以鉴定那些具有合适的杂交性百分比的亲本对。如果一个亲本或两个亲本具有部分自交不亲和性(对于四倍体为0.3%或更多和对于八倍体为1.3%或更多的平均自交亲和性百分比),那么可以用手将来自第二类植物的花粉传给第一类植物,和/或可以用手将来自第一类植物的花粉传给第二类植物。在一些实施方案中,除去第一类植物上的花粉形成结构以阻止自花传粉,由此允许来自第二植物的花粉的手工或风媒传粉。在一些实施方案中,一类亲本植物展现出紧密的花序。其它类型的亲本植物可以展现出散开的花序。在此类实施方案中具有紧密花序的亲本会具有较小的落粒性 (shattering),而且在此亲本是雌性时用来提高自杂交获得的F1杂种种子的收率。在一些实施方案中,一类亲本植物展现出一致的开花时间。其它类型的亲本植物可以展现出不一致的开花时间。在此类实施方案中具有一致开花时间的亲本会具有较一致的收获期,而且在此亲本是雌性时用来便于收集Fl杂种种子时的收获操作。收集种子柳枝稷的种子成熟通常在受精后约一个月期间里发生。一旦已经达到种子发育的合适阶段,便通过从亲本植物之一(意图起雌性亲本作用的类型)收获种子或者通过自这两类亲本植物收获种子来收集Fl种子。本文中所描述的方法涵盖任一种收获技术。如果仅从一种亲本类型收集Fl种子,那么雌性植物优选是具有紧密花序和/或一致开花时间的植物。雌性中一种性状或两种性状的存在可以使降低Fl种子收率的种子落粒效果最小化。 一致开花性状的存在还会用来使收获种子所需要的时间量最小化。通过本文中所描述的方法生成的Fl杂种种子是不育的,即此类种子具有高发芽率(germination percentage),但是所得的Fl杂种植物生成很少的F2种子或者无 F2种子。此类Fl种子的发芽率大于80%,如通过Aiken等,J. Range Management 48: 455-458 (1995)的方法根据未分大小的种子测定的,例如大于85%、86 %、87%、88 %、89 % 或90 %。认为在由此类Fl植物所生成的F2种子的平均数目小于每株植物0. 5个能育种子(例如小于每株Fl植物0. 4,0. 3,0. 2,0. 1,0. 05,0. 01或0. 005个能育种子)时,Fl植物是不育的。认为在F2种子的平均数目如此之低以至于检测不到时,Fl植物也是不育的。 每株植物的F2种子的平均数目如下计算,S卩如记载于Crop Sci. 47 =636-642(2007)中的那样从至少100株Fl植物分离种子,通过Aiken等1995(见上文)的方法来测定发芽种子的数目,并用发芽种子的数目除以Fl植物的数目。在一些实施方案中,自一类亲本柳枝稷植物收集的Fl种子相对于自另一类亲本植物收集的每100个Fl种子的平均重量具有统计上显著增加的每100粒种子的平均重量。 每100粒种子的平均重量通过标准方法来测定,而且对于低地生态型而言通常范围为约 50mg 至约 160mg/100 粒种子,例如每 100 粒种子 60、70、80、90、100、110、120、130、140、150 或160mg。因此,例如,一类低地亲本植物可以生成如下的种子,其具有每100粒种子约80 至约lOOmg,或约100至约120mg,或约120至约160mg的每100粒种子平均重量,而且显著高于另一类亲本植物的平均值。每100粒种子的平均重量对于高地生态型而言通常范围为约 IOOmg 至约 230mg/100 粒种子,例如每 100 粒种子 100、110、120、130、140、150、160、170、 180、190、200、210、220、230、对0、250或洸011^。例如,一类高地亲本植物可以生成如下的种子,其具有每100粒种子约100至约120mg,或约120至约160mg,或约160至约180mg,或约 180至约200mg,或约200至约220mg,或约220至约MOmg,或约240至约160mg的每100 粒种子平均重量,而且显著高于另一类亲本植物的平均值。通常,认为相对于对照的参数量的差异用合适的参数或非参数统计量(例如卡方检验、学生t检验、Mann-Whitney检验或F检验)在ρ < 0. 05时是统计上显著的。因此, 例如,认为来自一类亲本植物的Fl种子的每100粒种子平均重量相对于另一类亲本植物的每100粒种子平均重量更高在ρ < 0. 01、ρ < 0. 005或ρ < 0. 001时是统计上显著的。III.核酸棺物不育序列。本文中所描沭的F1转基因柳枝稷植物含有包含与转录因子UAS可操作连接的植物不育序列的外源核酸。植物不育序列(其受UAS控制)的过表达或适时表达导致具有高发芽率的F1种子和不育F1植物(例如不产生或产生异常花结构,或产生不能形成雄配子和/或雌配子的花结构的F1植物)的生成。植物不育序列可以编码多肽,例如种子发育中牵涉的多肽。在一些实施方案中,植物不育序列编码含有ΑΡ2结构域的植物不育多肽。ΑΡ2结构域在转录因子蛋白中找到,而且能结合DNA。转录因子的ΑΡ2家族还可以包括CMX-I基序(EXEX4VX2LX2VXSGX5P)和CMX-2 基序(CX2CX4CX2-4C)。CMX-2基序是推定的锌指基序,其可以参与DNA结合或蛋白质-蛋白质相互作用。参见Nakano等,Plant Physiol. ,140 =411-432 (2006) 在一些实施方案中,多肽可以包含CMX-I基序的变体。此类变体与CMX-I基序1处、2处或3处氨基酸取代不同。SEQ ID NO :5 列出了本文中鉴定为 Ceres Clone Id No. 123905 (SEQ ID NO 5)的拟南芥(Arabidopsis thaliana)克隆的氨基酸序列,其预测为编码含有AP2结构域、CMX-I 基序和CMX-2基序的多肽。植物不育序列可以编码包含AP2结构域的多肽,所述AP2结构域与SEQ ID NO :5的残基134至185具有70%或更大(例如75%、80%、85%、90%、95%、 97%,98^^99%或100% )序列同一性。在一些实施方案中,植物不育序列编码包含AP2 结构域的多肽,所述 AP2 结构域与 SEQ ID NO :6、8、10、11、13、15、17、19、21、22、24、25、26、 27、28、四和31中所列的一种或多种多肽的AP2结构域具有70%或更大(例如75%、80%、 85%、90%、95%、97%、98%、99%或100% )序列同一性。例如,植物不育序列可以编码与 SEQ ID NO 6 的残基 95 至 146、SEQ ID NO 8 的残基 116 至 167、SEQ ID NO :10 的残基 125 至 176、SEQ ID NO 11 的残基 130 至 181、SEQ ID NO 13 的残基 137 至 188、SEQ IDNO 15的残基 143 至 194、SEQ ID NO :17 的残基 127 至 178、SEQ ID NO :19 的残基 131 至 182、SEQ ID NO :21 的残基 1;35 至 186、SEQ ID NO 22 的残基 120 至 171、SEQ ID NO 24 的残基 1 至 179、SEQ ID NO 25 的残基 133 至 184、SEQ ID NO 26 的残基 1;35 至 186、SEQ ID NO 27 的残基 121 至 172、SEQ ID NO 28 的残基 153 至 204、SEQ ID NO 29 的残基 118 至 169 或 SEQ IDNO :31的残基130至181具有70%或更大序列同一性的多肽。SEQ ID N0:8、ll、13、 15、17、19、21、22、24、25和26中所列的多肽还含有如序列表中所列的CMX-I基序和CMX-2 基序。SEQ ID NO :6、10、27、28、四和31中所列的多肽还含有CMX-I基序的变体,而且含有如序列表中所列的CMX-2基序。“百分比序列同一性”指任何给定参照序列(例如SEQ ID NO 5)或其部分诸如 AP2结构域与候选植物不育序列之间的序列同一性程度。候选序列通常具有参照序列长度的 80%至 200%,例如参照序列长度的 82、85、87、89、90、93、95、97、99、100、105、110、115、 120、130、140、150、160、170、180、190或200%的长度。任何候选核酸或多肽相对于参照核酸或多肽的百分比同一性可以如下测定。使用计算机程序ClustalW(第1.83版,缺省参数) 比对参照序列(例如核酸序列或氨基酸序列)与一种或多种候选序列,所述计算机程序 ClustalW允许核酸或多肽序列在其全长范围内实施比对(全局比对)。Cherma等,Nucleic Acids Res. ,31(13) :3497-500(2003) ClustalW计算参照与一种或多种候选序列间的最佳匹配,并比对它们,使得可以测定同一性、相似性和差异。一个或多个残基的缺口可以插入参照序列、候选序列或两者中,以使序列比对最大化。为了快速成对比对核酸序列,使用下列缺省参数字大小 2 ;窗口大小4 ;评分方法百分比;顶对角线的数目4 ;及缺口罚分5.为了核酸序列的多重比对,使用下列参数缺口开放罚分10.0 ;缺口延伸罚分5.0 ;及加权转变(weight transition)是。为了快速成对比对蛋白质序列,使用下列参数字大小1 ;窗口大小 5 ;评分方法百分比;顶对角线的数目5 ;缺口罚分3。为了蛋白质序列的多重比对,使用下列参数权矩阵=Blosum ;缺口开放罚分10. 0 ;缺口延伸罚分0. 05 ;亲水性缺口 开启;亲水性残基KlyJro、kr、Asn、Asp、Gln、Glu、Arg和Lys ;残基特定缺口罚分开启。 ClustalW输出是反映序列间关系的序列比对。ClustalW可以在例如贝勒医学院(Baylor College of Medicine)搜索发射器站点 Gearch Launcher site)于环球网(World Wide Web) (searchlauncher. bcm. tmc. edu/multi-align/multi-align. html)及在欧生物信;窗、 学研究所(European Bioinformatics Institute)站点于环球网(ebi.ac.uk/clustalw) 运行。为了测定候选核酸或氨基酸序列与参照序列的百分比同一性,使用ClustalW来比对序列,用比对中相同匹配的数目除以参照序列的长度,并将结果乘以100。注意到,百分比同一性数值可以四舍五入至最接近的十分之一。例如,78. 11,78. 12,78. 13和78. 14向下四舍五入至 78. 1,而 78. 15,78. 16,78. 17,78. 18 和 78. 19 向上四舍五入至 78.2。在一些实施方案中,本文中所描述的方法中可以使用参照植物不育多肽的含有 AP2结构域、CMX-I基序和CMX-2基序的一种或多种功能同系物。功能同系物是与参照多肽具有序列相似性,而且实施参照多肽的一项或多项生物化学或生理学功能的多肽。功能同系物和参照多肽可以是天然存在的多肽,并且序列相似性可以是由于趋同或趋异进化事件。因此,功能同系物有时在文献中称为同系物或直向同系物(ortholog)或侧向同系物 (paralog)。天然存在的功能同系物的变体(诸如由野生型编码序列的突变体编码的多肽)自身可以是功能同系物。功能同系物也可以经由植物不育多肽的编码序列的定点诱变,或者通过组合来自不同天然存在植物不育多肽的编码序列的结构域(“结构域交换”)来创建。术语“功能同系物”有时适用于编码功能同源性多肽的核酸。可以通过分析核苷酸和多肽序列比对来鉴定功能同系物。例如,对核苷酸或多肽序列的数据库实施询问可以鉴定植物不育多肽的同系物。序列分析可以包括使用植物不育多肽氨基酸序列作为参照序列对非冗余数据库的BLAST分析、Reciprocal BLAST分析或 PSI-BLAST分析。在一些情况中,从核苷酸序列推断氨基酸序列。数据库中那些具有大于 40%序列同一性的多肽是用于进一步评估作为植物不育多肽的适合性的候选物。氨基酸序列相似性允许保守氨基酸取代,诸如用一个疏水性残基取代另一个或者用一个极性残基取代另一个。若需要,可以实施此类候选物的手工检查以使要进一步评估的候选物的数目缩小。手工检查可以通过选择那些表现为具有植物不育多肽中存在的结构域(例如保守功能结构域)的候选物来进行。可以通过定位植物不育多肽的一级氨基酸序列内作为重复序列、形成一些二级结构(例如螺旋和β片层)、建立带正电荷或负电荷的结构域或者代表蛋白质基序或结构域的区域来鉴定保守区。参见例如Pfam万维网站,其在环球网上于Sanger, ac. uk/Software/ Pfam/和pfam. jane 1 ia. org/上描述了多种蛋白质基序和结构域的共有序列。Pfam数据库上包括的信息描述记载于 Sonnhammer 等,Nucl. Acids Res. ,26 =320-322(1998); Sonnhammer 等,Proteins, 28 :405-420(1997) ; R Bateman 等,Nucl. Acids Res. ,27 260-262(1999)中。也可以通过比对来自紧密相关物种的相同或相关多肽的序列来确定保守区。优选地,紧密相关物种来自同一科。在一些实施方案中,来自两种不同物种的序列比对是足够的。通常,展现出至少约40%氨基酸序列同一性的多肽可用于鉴定保守区。相关多肽的保守区展现出至少45%氨基酸序列同一性(例如至少50%、至少60%、至少70%、至少 80%或至少90%氨基酸序列同一性)。在一些实施方案中,保守区展现出至少92^^94%, 96 %、98 %或99 %氨基酸序列同一性。图1和序列表中提供了 SEQ ID NO :5中所列的多肽的功能同系物的氨基酸序列的例子。此类功能同系物包括例如GI ID No. 47852612 (SEQ ID NO :6)、Ceres Clone ID No. 1494990 (SEQ ID NO :8)、Ceres Clone ID No. 634402 (SEQ ID NO :10)、GI ID No. 125603736 (SEQ ID NO :11)、Ceres Annot ID No. 6318302 (SEQ ID NO :13)、Ceres Annot ID No. 6014857 (SEQ ID NO :15)、Ceres Clone ID No. 1824070 (SEQ ID NO :17)、 Ceres Clone ID No. 1805402(SEQ ID NO :19)、Ceres Annot ID No. 6041905(SEQ ID NO: 21)、GI ID No. 115479555 (SEQ ID NO :22)、Ceres Annot ID No. 6325681 (SEQ ID NO: 24)、GI ID No. 154093739 ((SEQ ID NO :25)、GI ID No. 156950515 (SEQ ID NO :26)、 GI ID No. 129560507 (SEQ ID NO :27)、GI ID No. 129560505 (SEQ ID NO :28)、GI ID No. 157341002 (SEQ ID NO :29)和 Ceres Annot ID No. 1460991 (SEQ ID NO :31)。在一些情况中,SEQ ID NO :5的功能同系物具有如下的氨基酸序列,其与SEQ ID NO :5中所列的氨基酸序列具有至少30%序列同一性,例如35%,37%,40%,45%,50%,52%,56%,59%, 61%、65%、70%、75%、80%、85%、90%、95%、97%、98%或 99%序列同一性。在一些实施方案中,植物不育多肽可以编码具有DUF640结构域的多肽。参见例
17如,2009年10月19日提交的美国专利申请No. 61/252,827的SEQ ID NO :925、926、928、 930、932、934、936、938、940、942、944、946、948、950、952、954、955、957、958、959、960、961、 962、963、964、965、966和967中所列的多肽。例如,有用的植物不育多肽可以具有美国专利申请No. 61/252,827的SEQ ID NO :925中所列的氨基酸序列。植物不育多肽中保守区的鉴定促进植物不育多肽变体的生成。植物不育多肽的变体在一级氨基酸序列内通常具有10个或更少的保守氨基酸取代,例如7个或更少的保守氨基酸取代、5个或更少的保守氨基酸取代或1-5个保守取代。有用的变体多肽可以基于图1 中所列的比对和/或序列表中所鉴定的同系物来构建。此类多肽包含保守区,其从氨基端末端至羧基端末端以图中所描绘的次序安排。此类多肽在以虚线标记的位置中还可以包含 0、1或超过1个氨基酸。在以虚线标记的位置处不存在氨基酸时,此类多肽的长度是所有保守区中氨基酸残基的总数。在以虚线标记的位置处存在氨基酸时,此类多肽具有的长度是所有保守区和所有虚线中的氨基酸残基的总数。在一些实施方案中,有用的植物不育多肽包括拟合基于图1中所列多肽的隐蔽马尔科夫模型的多肽。隐蔽马尔科夫模型(HMM)是一组功能同系物的共有序列的统计模型。参见 Durbin 等,Biological Sequence Analysis Probabilistic Models of Proteins and Nucleic Acids, Cambridge University Press, Cambridge, UK(1998)。 使用一组功能同系物的序列作为输入,通过具有缺省程序参数的程序HMMER 2. 3. 2来产生 HMM。通过 ProbCons (Do 等,Genome Res.,15(2) :330-40(2005))第 1. 11 版来产生多重序列比对,其使用如下一套缺省参数进行-c,一一致性REPS为2 ;-ir,一迭代细分 (iterative-refinement) REPS 为 100 ;-pre,—予页训练(pre-training) REPS 为 0。ProbCons 是一种由斯坦福大学提供的公用域软件程序(public domain software program)。用于建造HMM的缺省参数(hmmbuild)如下MAP结构构建所使用的缺省“结构优先(architecture prior) ” (archpri)是0. 85,而用于测定有效序列数目的缺省截留阈值 (idlevel)是0. 62。HMMER 2. 3. 2于2003年10月3日以GNU通用公共许可发布,而且在环球网上可获自多禾中来源诸如 hmmer. janeIia. org ;hmmer. wustl. edu ;禾口 fr. com/hmmer232/0 Hmmbuild以文本文件输出模型。可以使用一组功能同系物的HMM来测定如下的概率,即候选植物不育多肽序列对所述特定的HMM的拟合比对使用一组在结构或功能上无关的序列产生的空值HMM的拟合更好。候选多肽序列对HMM的拟合比对空值HMM的拟合的更高概率以HMM比特得分指明,所述HMM比特得分是在候选序列拟合使用HMMER hmmsearch程序得到的HMM谱(profile)时产生的。在运行hmmsearch时使用下列缺省参数缺省E值截留(E)是10.0,缺省比特得分截留(T)是负无穷大,数据库中的序列缺省数目(Z)是数据库中序列的实数,按域分级命中表(per-domain ranked hit list)的缺省E值截留(domE)是无穷大,而按域分级命中表的缺省比特得分截留(domT)是负无穷大。高HMM比特得分指明候选序列实施用于产生 HMM的多肽的一项或多项生物化学或生理学功能的概率较大。高HMM比特得分是至少20, 并且常常更高。特定序列的HMM比特得分的略微变化可由于各种因素而发生,诸如序列为了通过多重序列比对算法(诸如ftObCons程序)进行比对而进行处理的次序。不过,此类 HMM比特得分变化是次要的。本文中所讨论的多肽以大于175(例如大于200、300、400或500)的HMM比特得分拟合指明的HMM。在一些实施方案中,多肽的HMM比特得分是本申请序列表中所提供的功能同系物的HMM比特得分的约50%、60%、70%、80%、90%或95%。在一些实施方案中,本文中所讨论的多肽以大于175的HMM比特得分拟合指明的HMM,而且具有AP2结构域、CMX-I 基序和CMX-2基序。在一些实施方案中,多肽以大于175的HMM比特得分拟合指明的HMM, 而且与 SEQ ID NO :5、6、8、10、11、13、15、17、19、21、22、24、25、26、27、28、29 或 31 的 AP2 结构域具有70%或更大的序列同一性(例如75%、80%、85%、90%、95%或100%序列同一性)。序列表中显示了多肽的例子,所述多肽在拟合自图1中所列的氨基酸序列产生的 HMM时具有大于175的HMM比特得分。此类多肽包括例如SEQ ID NO :5、6、8、10、11、13、15、 17、19、21、22、24、25、26、27、28、29 和 31 中所列的多肽。序列表中列出了编码植物不育多肽的核酸。此类核酸的例子包括SEQ ID NO :4、7、 9、12、14、16、18、20、23 和 30。核酸也可以是 SEQ ID NO :4、7、9、12、14、16、18、20、23 和 30 中所列的全长核酸的长度的至少40% (例如至少45、50、55、60、65、70、75、80、85、90、95或 99% )的片段。编码不育多肽的核酸可以包含SEQ ID NO :4、7、9、12、14、16、18、20、23和 30中所列的核苷酸序列。或者,植物不育核酸可以是具有SEQ ID N0:4、7、9、12、14、16、18、 20,23和30中所列的核苷酸序列的核酸变体。例如,植物不育核酸可以具有如下的核苷酸序列,其与SEQ ID NO :4、7、9、12、14、16、18、20、23和30中所列的核苷酸序列具有至少80% 序列同一性,例如81%、85%、90%、95%、97%、98%或99%序列同一性。另外,可以使用多种基于核酸的方法来抑制表达并赋予不育,所述基于核酸的方法包括反义RNA、核酶定向性RNA裂解、转录后基因沉默(PTGS),例如RNA干扰(RNAi)和转录基因沉默(TGS)。因此,在一些实施方案中,将植物不育序列转录成抑制多肽表达的转录产物,并且由此赋予不育。通常,抑制表达并赋予不育的植物不育序列是至少10个核苷酸, 例如至少 12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、30、35、40、50、80、100、 200,500个核苷酸或更多核苷酸。植物不育序列可以是种子发育中所牵涉的多肽的激动剂。此类激动剂可以是多肽 (例如显性失功能突变体),而且还可以是核酸(例如反义核酸、核酶或干扰RNA)。破坏种子发育中所牵涉的多肽的功能可以导致不能生成花结构和/或生成雄配子或雌配子。植物不育序列的其它例子包括包含SEQ ID NO :1、2、3和32中所列的核苷酸序列的核酸。SEQ ID NO :1-2分别是AP2结构域转录因子和泛素连接酶家族的柳枝稷同系物的核苷酸序列。SEQ ID NO :3和32是含有来自MADS框结构域转录因子的三种柳枝稷同系物的片段的嵌合体。可以使用植物不育序列来抑制表达并在柳枝稷中赋予不育,所述植物不育序列包含SEQ ID NO :1、2、3或32中所列的整个核苷酸序列或部分核苷酸序列,而且被转录成转录产物。参见实施例3。应当领会,可以使用MADS框结构域转录因子(例如克隆 S4、S5和S6)的其它部分来抑制表达并在柳枝稷中赋予不育。应当注意到,认为编码芽孢杆菌RNA酶(barnase)多肽、果胶酸裂合酶、白喉毒素A 链、玉米T-urfl3多肽、Mu噬菌体Gin重组酶、β 1,3葡聚糖酶、吲哚乙酸-赖氨酸合成酶、 芽胞杆菌CytA毒素、腺嘌呤转磷酸核糖基酶、水杨酸羟化酶、DNA酶、RNA酶或一般化的蛋白酶的核酸不是植物不育序列。在一些实施方案中,转基因柳枝稷植物含有两种不同植物不育序列。在一些实施方案中,单一转录因子激活这两种植物不育序列,其中每种与同一上游激活序列可操作连接。或者,可以表达两种不同转录因子,使得每种转录因子激活植物不育序列之一,而且每种不育序列具有不同表达模式,例如第一转录因子可以与组成型启动子可操作连接,而第二转录因子可以与营养性启动子(vegetative promoter)可操作连接。在其它实施方案中, 这两种转录因子与不同营养性启动子可操作连接。转录因子。本t中所描沭的F1转基因柳枝稷植物含有编码转录因子的外源核酸, 所述转录因子激活此类植物中存在的植物不育序列的转录。转录因子通常具有离散的DNA 结合结构域和转录激活结构域。转录因子的DNA结合结构域和转录激活结构域可以是合成的或者可以源自不同来源(即为嵌合转录因子)。已知来自不同天然存在的转录因子的结构域可以在单一多肽中组合,而且此类嵌合转录因子在植物中的表达可以激活转录。在一些实施方案中,嵌合转录因子具有源自酵母基因的DNA结合结构域和源自单纯疱疹病毒VP16基因的转录激活结构域。在其它实施方案中,嵌合转录因子具有源自酵母HAPl基因的DNA结合结构域和源自VP16的转录激活结构域。参见例如WO 97/31064。表1中显示了来自多种转录因子的DNA结合结构域及其各自的上游激活序列的列表。这些结构域适合于在柳枝稷的嵌合转录因子中使用。此列表中的DNA结合结构域已经在转基因植物中作为嵌合转录因子的组分表达。预期来自酿酒酵母(S.cerevisiae)LEU3 转录因子的DNA结合结构域及其相关UAS(CCG-M-CGG)和来自酿酒酵母PDR3转录因子的 DNA结合结构域及其相关UAS (CCGCGG)也会是合适的。参见Hellauer等Mol. Cell Biol. (1996)。表1 结合结构域
权利要求
1.一种用于生成柳枝稷种子的方法,所述方法包括a)杂交在传粉方面接近多个第二柳枝稷植物处种植的多个第一柳枝稷植物,所述第一植物包含第一外源核酸,所述第一核酸包含与植物不育序列可操作连接的转录因子激活序列,其中所述第一柳枝稷植物对于所述第一外源核酸是纯合的,所述第二植物包含第二外源核酸,其包含与结合所述激活序列的转录因子的编码序列可操作连接的调节区,其中所述第二柳枝稷植物对于所述第二外源核酸是纯合的,其中所述多个第一柳枝稷植物和/或所述多个第二柳枝稷植物是克隆繁殖性植物;以及b)收集在所述第一柳枝稷植物和/或所述第二柳枝稷植物上形成的F1种子,其中自所述F1种子种植的F1柳枝稷植物表达所述植物不育序列,而且是不育的。
2.权利要求1的方法,其中所述第一柳枝稷植物是克隆繁殖性植物,而所述第二柳枝稷植物是遗传异质性植物群体。
3.权利要求1的方法,其中所述第一柳枝稷植物是克隆繁殖性植物,并且所述第二柳枝稷植物是克隆繁殖性植物。
4.权利要求1的方法,其中所述第一柳枝稷植物是异质性植物群体,而所述第二柳枝稷植物是克隆繁殖性植物。
5.权利要求2或3的方法,其中所述第一克隆繁殖性柳枝稷植物是四倍体植物,而且展现出小于0. 3%的平均自交亲和性百分比。
6.权利要求2或3的方法,其中所述第一克隆繁殖性柳枝稷植物是八倍体植物,而且展现出小于1.3%的平均自交亲和性百分比。
7.权利要求3或4的方法,其中所述第二克隆繁殖性柳枝稷植物是四倍体植物,而且展现出小于0. 3%的平均自交亲和性百分比。
8.权利要求3或4的方法,其中所述第二克隆繁殖性柳枝稷植物是八倍体植物,而且展现出小于1.3%的自交亲和性百分比。
9.权利要求1的方法,其中所述种子收集自所述第一柳枝稷植物和所述第二柳枝稷植物两者。
10.权利要求1的方法,其中所述F1植物生成平均每株植物小于0.5个能育种子。
11.权利要求10的方法,其中所述F1植物不能生成雄配子和雌配子。
12.权利要求10的方法,其中所述F1植物不能生成雄配子。
13.权利要求10的方法,其中所述F1植物不能生成雌配子。
14.权利要求1的方法,其中所述第一柳枝稷植物和所述第二柳枝稷植物间的平均杂交性百分比是约69%至约95%。
15.权利要求14的方法,其中所述第一柳枝稷植物和所述第二柳枝稷植物是四倍体, 是低地生态型的,而且具有约80%至约95%的平均杂交性百分比。
16.权利要求15的方法,其中所述第一柳枝稷植物和所述第二柳枝稷植物具有约86% 至约91%的平均杂交性百分比。
17.权利要求2、3或4的方法,其中所述第一柳枝稷植物展现出紧密的花序,而所述第二柳枝稷植物展现出散开的花序。
18.权利要求2、3或4的方法,其中所述第一柳枝稷植物展现出一致的开花时间,而所述第二柳枝稷植物展现出不一致的开花时间。
19.权利要求2、3或4的方法,其中所述第二柳枝稷植物展现出紧密的花序,而所述第一柳枝稷植物展现出散开的花序。
20.权利要求2、3或4的方法,其中所述第二柳枝稷植物展现出一致的开花时间,而所述第一柳枝稷植物展现出不一致的开花时间。
21.权利要求1-4中任一项的方法,其中相对于收集自所述第二柳枝稷植物的种子,收集自所述第一柳枝稷植物的种子具有统计上显著升高的平均种子重量。
22.权利要求1-4中任一项的方法,其中相对于自所述第一柳枝稷植物收集的种子,自所述第二柳枝稷植物收集的种子具有统计上显著升高的平均种子重量。
23.权利要求1的方法,其中所述种植步骤包括以所述第一柳枝稷植物第二柳枝稷植物大于41的比率种植所述柳枝稷植物。
24.权利要求1的方法,其中所述种植步骤包括以所述第二柳枝稷植物第一柳枝稷植物大于41的比率种植所述柳枝稷植物。
25.权利要求1的方法,其中所述第一柳枝稷植物和第二柳枝稷植物是四倍体植物。
26.权利要求1的方法,其中所述第一柳枝稷植物和所述第二柳枝稷植物是低地型柳枝稷植物。
27.权利要求1的方法,其中所述第一柳枝稷植物进一步含有包含与第二植物不育序列可操作连接的所述第一转录因子激活序列的外源核酸,而所述第一柳枝稷植物对于包含所述第二植物不育序列的所述外源核酸展现出纯合性。
28.权利要求1的方法,其中所述第一柳枝稷植物进一步含有包含与第二植物不育序列可操作连接的第二转录因子激活序列的外源核酸,而所述第一柳枝稷植物对于包含所述第二植物不育序列的所述外源核酸展现出纯合性;且其中所述第二柳枝稷植物进一步包含与结合所述第二激活序列的第二转录因子的编码序列可操作连接的调节区的外源核酸,而且对于包含所述第二转录因子的所述编码序列的所述外源核酸展现出纯合性。
29.权利要求1的方法,其中所述第一柳枝稷植物和/或所述第二柳枝稷植物进一步包含转基因。
30.权利要求四的方法,其中所述第一柳枝稷植物和/或所述第二柳枝稷植物对于所述转基因展现出纯合性。
31.权利要求1的方法,其中所述植物不育序列编码多肽。
32.权利要求31的方法,其中所述多肽的氨基酸序列的HMM比特得分大于约175,所述 HMM基于图1中所描绘的氨基酸序列,且其中与不包含所述核酸的对照植物相比,所述植物具有降低的能育性。
33.权利要求31的方法,其中所述多肽包含与SEQID NO 5的残基134至185具有至少80%序列同一性的AP2结构域、CMX-I基序和CMX-2基序。
34.权利要求33的方法,其中所述多肽包含与SEQID NO 5的残基134至185具有至少90%序列同一性的AP2结构域、CMX-I基序和CMX-2基序。
35.权利要求33的方法,其中所述多肽包含与SEQID NO 5的残基134至185具有至少95%序列同一性的AP2结构域、CMX-I基序和CMX-2基序。
36.权利要求33的方法,其中所述多肽包含与选自下组的序列具有至少85%序列同一性的氨基酸序列:SEQ ID NO :5、6、8、10、11、13、15、17、19、21、22、24、25、26、27、28、29 和 31 中所列的序列。
37.权利要求1的方法,其中所述植物不育序列包含SEQID NO :1、2、3和32中所列的核苷酸序列之任一种的至少50个连续的核苷酸,而且被转录成转录产物。
38.权利要求31的方法,其中所述多肽包含DUF640结构域。
39.权利要求1的方法,其中所述转录因子是嵌合转录因子,其包含选自下组的结合结构域LexA、乳糖操纵子、ArgR和合成的Si指蛋白。
40.权利要求1的方法,其中所述转录因子是嵌合转录因子,其包含选自下组的激活结构域C1、ATMYB2、HAFL-1、ANT、ALM2、AvrXa 10、VP1、DOF 和 RISBZ1。
41.权利要求1的方法,其中所述调节区是广泛表达型启动子。
42.权利要求41的方法,其中所述启动子是玉米泛素启动子。
43.权利要求1的方法,其中所述调节区是光合组织启动子。
44.权利要求1的方法,其中相对于缺乏所述第一外源核酸和所述第二外源核酸的对照柳枝稷植物,自所述F1种子种植的所述植物在至少一个生长季节中具有统计上显著升高的生物质。
45.通过权利要求1-44中任一项中所列的方法生成的F1柳枝稷种子。
46.多个F1杂种转基因柳枝稷种子,所述种子通过下列方法生成,包括a)在传粉方面接近多个第二柳枝稷植物处种植多个第一柳枝稷植物,所述第一植物包含第一外源核酸,所述第一核酸包含与植物不育序列可操作连接的转录因子激活序列,所述第二植物包含第二外源核酸,其包含与结合所述激活序列的转录因子的编码序列可操作连接的调节区,其中所述多个第一柳枝稷植物和/或所述多个第二柳枝稷植物是克隆繁殖性植物;b)杂交所述第一柳枝稷植物与所述第二柳枝稷植物;以及c)收集在所述第一柳枝稷植物和/或所述第二柳枝稷植物上形成的Fl种子,其中自所述Fl种子种植的Fl柳枝稷植物表达所述植物不育序列,而且是不育的。
47.权利要求46的柳枝稷种子,其中所述第一柳枝稷植物和所述第二柳枝稷植物具有大于约65%的杂交性百分比。
48.一种用于生成柳枝稷种子的方法,所述方法包括a)杂交在传粉方面接近多个第二柳枝稷植物处种植的多个第一柳枝稷植物,所述第一植物包含第一外源核酸,所述第一核酸包含与植物不育序列可操作连接的转录因子激活序列,所述植物不育序列包含SEQ ID N0:l、2、3或32中所列的核苷酸序列之任一种的至少50个连续的核苷酸,其中所述第一柳枝稷植物对于所述第一外源核酸是纯合的,所述第二植物包含第二外源核酸,其包含与结合所述激活序列的转录因子的编码序列可操作连接的调节区,其中所述第二柳枝稷植物对于所述第二外源核酸是纯合的;以及b)收集在所述第一柳枝稷植物和/或所述第二柳枝稷植物上形成的Fl种子,其中自所述Fl种子种植的Fl柳枝稷植物表达所述植物不育序列,而且是不育的。
49.一种种植柳枝稷的方法,所述方法包括a)将Fl杂种柳枝稷植物种植至少一个生长季节,所述植物包含i)第一外源核酸,所述第一核酸包含与植物不育序列可操作连接的转录因子激活序列,和 )第二外源核酸,其包含与结合所述激活序列的转录因子的编码序列可操作连接的调节区,其中所述柳枝稷植物对于所述第一外源核酸和所述第二外源核酸是半合子的;以及b)在第二生长季节或随后的生长季节中自所述柳枝稷植物收获生物质。
50.权利要求49的方法,其中所述植物不育序列包含SEQID NO :1、2、3或32中所列的核苷酸序列之一的至少50个连续的核苷酸。
51.权利要求49的方法,其中所述植物不育序列编码多肽。
52.权利要求51的方法,其中所述多肽的氨基酸序列的HMM比特得分大于约175,所述 HMM基于图1中所描绘的氨基酸序列,且其中与不包含所述核酸的对照植物相比,所述植物具有降低的能育性。
53.权利要求51的方法,其中所述多肽包含与SEQID NO 5的残基134至185具有至少80%序列同一性的AP2结构域、CMX-I基序和CMX-2基序。
54.权利要求53的方法,其中所述多肽包含与SEQID NO 5的残基134至185具有至少90%序列同一性的AP2结构域、CMX-I基序和CMX-2基序。
55.权利要求53的方法,其中所述多肽包含与SEQID NO 5的残基134至185具有至少95%序列同一性的AP2结构域、CMX-I基序和CMX-2基序。
56.权利要求51的方法,其中所述多肽包含与选自下组的序列具有至少85%序列同一性的氨基酸序列:SEQ ID NO :5、6、8、10、11、13、15、17、19、21、22、24、25、26、27、28、29 和 31 中所列的序列。
全文摘要
本发明涉及可用于控制能源作物植物的不必要的扩散的材料和方法。该方法涉及含有引起种子不育的转基因的F1杂种转基因柳枝稷植物。该方法还涉及一种或多种激活转基因表达的转录因子。此类F1杂种植物不能形成能育种子。
文档编号C12N15/29GK102224243SQ200980147101
公开日2011年10月19日 申请日期2009年11月24日 优先权日2008年11月25日
发明者彼得.N.玛西亚, 戴维.V.唐, 迈克尔.F.波特雷科 申请人:希尔雷斯股份有限公司