包含突变indehiscent等位基因的芸苔属植物的制作方法

文档序号:248624阅读:261来源:国知局
包含突变indehiscent等位基因的芸苔属植物的制作方法
【专利摘要】本发明涉及其果实开裂性质经调节的作物植物。更具体地,本发明涉及改进的方法和手段,用于在植物中降低落籽或者延迟落籽直至收获之后,同时保持荚果的农艺相关可脱粒性。
【专利说明】包含突变INDEHI SCENT等位基因的芸苔属植物
[0001]本申请为2008年11月25日提交的、发明名称为“包含突变INDHlISCENT等位基因的芸苔属植物”的PCT申请PCT/EP2008/010147的分案申请,所述PCT申请进入中国国家阶段的日期为2010年7月27日,申请号为200880125655.4。
发明领域
[0002]本发明涉及农业产品,尤其是作物植物领域,特别是十字花科(Brassicaceae),特别是芸苔属的物种,其中,果实开裂性质被调节。更具体地,本发明涉及改进的方法和手段,用于在植物例如十字花科植物,特别是种植来用于种子生产的十字花科植物中,降低落籽(seed shattering)或延迟落籽到收获之后,同时保持荚果的农艺相关的可脱粒性(treshability)。本发明提供了编码芸苔属INDH1ISCENT蛋白质(IND)的野生型和突变核酸分子以及此类的蛋白质。本发明还提供了包含至少两种IND基因的芸苔属植物,特别是欧洲油菜(Brassica napus)植物,及其细胞、部分、种子和后代,其特征在于,它们在其基因组中包含三个完全敲除型突变ind等位基因,由此果实开裂性质被显著改变。此外,本发明提供了产生下述芸苔属植物的方法,其中落籽被降低,或者其中,落籽被延迟到收获之后,同时优选保持荚果的农艺相关的可脱粒性,还提供了可从此类植物获得的种荚果和种子。本发明还提供了检测工具(试剂盒)和方法,用于检测生物样品中一个或多个突变ind和/或野生型IND等位基因的存在,以及将一个或多个突变ind和/或野生型IND等位基因转移至其它植物的方法,和在植物中组合不同ind和/或IND等位基因的方法。特别地,组合合适数量的突变ind等位基因(编码无功能IND蛋白质或者不编码IND蛋白质和/或编码具有显著降低的体内活性的IND蛋白质)的方法,所述组合的方式使得显著降低落籽,或者延迟落籽到收获之后,同时保持荚果的农艺相关的可脱粒性。除此之外,本发明还提供了植物或其部分和/或其后代、种子和种子油以及方法和/或试剂盒的用途。本发明还提供了增加产量,特别是谷粒产量和种子产量的方法和手段。产量增加表型可与降低或延迟的落籽表型分离开。
[0003]发明背景
[0004]来自芸苔属植物的长角果或荚果在被称为果实开裂的过程中释放其种子。长角果由边缘相连的两片心皮构成。边缘之间的缝线形成厚的棱,被称为假隔膜(replum)。随着荚果接近成熟,两片裂月(valve)沿着荚果中脆弱的指定线,从假隔膜逐渐分离,最终导致与假隔膜相连结种子的落粒(shattering)。开裂区界定了裂月解离的精确位置。
[0005]在作物收获之前或期间,成熟荚果的种子脱落(shedding)(也被称为“落籽”或“荚果掉果”)是发育出 干的开裂果实的作物的普遍现象。未成熟的落籽导致降低的种子回收,这对于主要为了种子而种植的作物(例如产油的芸苔属植物,特别是油菜)而言是个问题。与未成熟落籽相关的另一问题是下一作物年中的自生生长(volunteer growth)的增加。在油菜中,荚果掉果相关的产量损失为平均20% (Child等人,1998,J Exp Bot49:829-838),但是能够达到 50%,这取决于气候条件(MacLeod, 1981, Harvesting in OilseedRape, pp.107_120Cambridge Agricultural Publishing, Cambridge)。[0006]目前的商业油菜品种对落粒极其易感。在欧洲油菜(B.napus)的现有育种程序中,对落粒的抵抗性鲜有变化,但是在欧洲油菜的二倍体亲本(甘蓝(B.0leraceae)和芜青(B.rapa)以及芸苔属的其它成员中(明显地芥菜(B.juncea)、埃塞俄比亚芥(B.carinata)和黑芥(B.nigra))已发现了抗性品系。Kadkol 等人(1986, Aust.J.Botany34(5):595-601)报道称,在芸苔(B.campestris)的某些登记种中,对落粒的抗性增加,这与长角果裂爿与假隔膜的连结区域中不存在分离层相关。Prakash和Chopra(1988, Plant breedinglOl:167-168)描述了欧洲油菜中通过非同源重组来自芥菜(Brassica juncea)的落粒抗性的渐渗现象。Spence等人(1996, J of Microscopyl81:195-203)描述了芥菜的一些品系显示出较之欧洲油菜品系降低的落粒倾向。Morgan等人,1998 (Fields Crop Research58,153-165)描述了从合成的欧洲油菜发展而来的油菜品系间荚果掉果抗性的遗传变化,并且推断,需要很大能量开启其荚果的品系看起来在开裂区具有增加的维管化,并且在开裂区内具有降低的细胞壁降解。他们还进一步发现了荚果喙(pod beak)长度和导致荚果掉果所需的力之间显著的负相关。Child 和 Huttly (1999, ProclOth Int.Rapeseed Congress)描述了在放射诱导的突变欧洲油菜及其亲本栽培种Jet Neuf的种群中荚果成熟的变化,其中,最具抗性的野生型和突变植物显示出遍布开裂区的细胞群体的高度木质化,并且其中,定位于接近突变体开裂区内边的维管导管(vascular traces)被描述为有助于保护裂爿。Child等人(2003,J Exp Botany54(389):1919-1930)还描述了在再合成的欧洲油菜品系的荚果中增加的荚果掉果抗性和维管结构改变之间的关联。但是,传统育种方法未能在不干扰其它想要性状(例如早开花、成熟和黑腿病(blackleg)抗性)的同时向欧洲油菜(rape)栽培种中成功引入落粒抗性(Prakash 和 Chopra, 1990,Genetical Research56:1_2)。
[0007]已通过突变体分析在拟南芥(Arabidopsis thaliana)中鉴定出了促进或抑制荚果开裂的若干基因:在SHATTERPROOF I (SHPI ;最初被称为AGL1)和SHATTERPR00F2 (SHP2 ;最初被称为AGL5) 二者中的组合突变体导致不开裂的长角果(即,在拟南芥中成熟时保持闭合的长角果)(Liljegren等人,2000,Nature404,766-770)。类似地,在拟南芥中的 INDEHISCENT 基因(被称为 INDl) (Liljegren 等人,2004, Cellll6:843-853 ;PCT 公开 W001/79517)中以及 ALCATRAZ(被称为 ALC ;Rajani 等人 2001,Current BiologylI,1914-1922)中的突变干扰了荚果开裂,导致荚果掉果抗性。SHP和IND的阻遏子FRUITFUL (FUL)在拟南芥中的组成型表达也导致不开裂的长角果(Ferrandiz等人,2000,Science, 289,436-438)。这些转录因子被认为会形成非线性转录网络,控制裂月边缘同一性和荚果掉果。Liljegren等人(2004,Cellll6:843-853)还描述称,在拟南芥中,非典型的碱性螺旋-环-螺旋(bHLH)基因IND指导裂月边缘分化成分离层和木质化层。与分离层相邻的木质化细胞沿着内果皮b层的层(每片裂月中的单木质化细胞层)在干燥果实内产生了弹簧样的张力,作用于其开口。裂爿内果皮b层的木质化需要IND、SHP、ALC和FUL (在裂爿中到处表达的MADS结构域转录因子)的活性(Liljegren等人,2004,见上;Mandel和Yanofsky,1995,Plant Cell7,1763-1771)。已发现,FUL 和 REPLUMLESS (RPL)(在假隔膜中表达的同源异型域转录因子)(Roeder等人,2003,Curr Bioll3,1630-1635)设置了赋予裂爿边缘同一性的基因的边界(Gu等人,1998,Developmentl25,1509-1517 ;Ferrandiz等人,2000,Science,289,436-438 ;上文的 Roeder 等人,2003)。最后,FILAMENTOUS FLOWER(FIL)和 YABBY3(YAB3)-两个 YABBY 家族的转录因子(Sawa 等人,1999,Genes Devl3,
1079-1088 ;Siegfried 等人,1999,Developmentl26,4117-4128)和 JAGGED (FAG)-
C2H2 锋指转录因子(Dinneny 等人,2004, Developmental, 1101-1110 ;0hno 等人,2004,Developmentl31,1111-1122)被鉴定为通过促进FUL和SHP以区域特异性方式的表达,冗余性地作用于正确的裂月和裂月边缘发育(Dinneny等人,2005, Developmentl32,4687-4696)。还已鉴定出了针对大量水解酶(例如内多聚半乳糖醛酸酶,其在来自芸苔属植物的荚果中开裂区的程序化损坏中,在荚果开裂期间,具有重要作用)的基因(见例如W097/13865 ;Petersen 等人,Plant.Mol.Biol.,1996,31:517-527)。
[0008]Liljegren等人(2004, Cellll6:843-853)描述了拟南芥属IND的五种突变等位基因。在包含这些突变等位基因的植物中存在或不存在开裂区中的木质化细胞,这取决于突变的严重程度(严重的ind突变体在对应于野生型植物中裂月边缘的内部部分的区域中不含木质化细胞),但是在所有情况下,长角果都是不开裂的。Wu等人(2006),Planta224,971-979)描述了第六种拟南芥属IND突变等位基因。包含该突变等位基因的植物显示出在裂爿边缘和假隔膜的连接处没有木质化细胞,在七层细胞的区域中含有较少细胞(其看起来包括野生型植物中公知的开裂区和假隔膜边缘),并且展示出该层中不完全的胞质分裂。
[0009]US2005/0120417和US2007/0006336描述了从欧洲油菜中鉴定和分离两种INDl直向同源物。
[0010]W099/00503.W001/79517和W00159122描述了使用基因沉默技术(例如反义遏制
或共遏制) 和诱变对拟南芥属ALC、IND, AGLl和AGL5基因及其直向同源物表达的下调。
[0011]Vancanneyt 等人,2002(XIII International Conference on ArabidopsisResearch, Sevilla, Spain June28_July2 ;2002)报道,在油菜中在 CaMV35S 启动子的控制下表达来自拟南芥的FUL,导致产生多种荚果掉果抗性转化体。此类荚果掉果抗性品系的荚果没有开裂区,荚果的开口仅能通过应用相当大的压力随机破裂裂月来实现。
[0012]Vancanneyt 等人,2002(XIII International Conference on ArabidopsisResearch, Sevilla, Spain June28_July2 ;2002)还报道,使用所谓的 dsRNA 沉默技术在拟南芥中沉默IND基因,导致几乎完全的荚果掉果抗性。98%的转基因拟南芥属品系发展出不沿着裂月缝线开口的长角果,其仅能通过向裂月应用相当大的压力而开口。
[0013]重要的是要认识到,尽管落籽在油菜培养中是重要问题,其可通过开发荚果掉果抗性品系来解决,最终仍需要将种子与荚果分离。在正常农业实践中,这是通过组合收割机对荚果脱粒来实现的。通过组合收割机对荚果脱粒必须进行完全,并且应当对由此释放的种子仅造成最小限度的损伤。但是,随着荚果强度的增加,对其脱粒所需的更强的动作导致对种子的损伤水平不可接受。荚果掉果抗性十字花科植物的荚果由此不应强到使其无法在组合收割机中被脱粒的程度(Bruce等人2001, J.Agric.Engng Res.80, 343-350)。
[0014]W02004/113542描述了对十字花科植物中涉及荚果开裂区和裂月边缘发育的基因的中等dsRNA基因沉默允许分离出具有增加的荚果掉果抗性和降低的落籽的转基因品系,但是通过施加有限的物理力,其荚果仍可沿着开裂区开口。
[0015]尽管本领域中可获得特定IND基因的序列及其突变序列,特别是拟南芥属和欧洲油菜IND基因序列和突变拟南芥属IND基因序列,但是人们仍需要更多IND基因序列,例如,在植物(例如欧洲油菜植物)中实现特别想要的对落籽的修饰。在经济重要的十字花科植物(例如油菜)中对对应于ind的突变等位基因的分离是费时费力的任务。此外,油菜中双二倍性以及相应基因随之的功能冗余使得此类分离复杂化。
[0016]如
【发明内容】
、附图、发明详述、实施例和权利要求中描述的多种实施方式所指出的,通过本发明实现了这些和其它目的。

【发明内容】

[0017]本发明的发明人发现,可通过控制在种子荚果中“功能性表达(即导致产生功能性(生物活性)IND蛋白质)”的IND基因/等位基因的数量,来控制芸苔属植物中的果实开裂性质。通过组合多种完全敲除型突变IND等位基因(“ind等位基因”),同时保持最小数量的野生型IND等位基因,产生最小水平的功能性IND蛋白质,可对种子荚果的开裂性质加以修饰,更具体地,可增加荚果掉果抗性,可降低落籽,或者可将落籽延迟到收获之后,同时保持荚果的农艺相关的可脱粒性,使得通过应用有限的物理力,荚果仍可沿着开裂区开口。我们认为,需要最小数量的野生型IND等位基因,以使得种子仍能与荚果分离,特别是通过组合收割机对荚果进行脱粒,使得对荚果的脱粒进行完全,并且对由此释放的种子的损伤最小。
[0018]因此,在一个方面,本发明提供了包含至少两个IND基因的芸苔属植物,特别是欧洲油菜植物(及其部分,例如种子荚果和种子),其特征在于,其在其基因组中包含3个完全敲除型突变IND等位基因,特别是IND-Al和/或IND-Cl基因的,并且,其中,植物的荚果掉果抗性较之不包含突变IND等位基因的植物的荚果掉果抗性而言显著增加,但是其中,植物优选保持荚果的农艺相关的可脱粒性。
[0019]在另一方面,本发明提供了编码野生型和/或突变IND蛋白质的(经分离的)核酸序列及其片段,以及使用这些核酸序列修饰植物的果实开裂性质的方法。本发明还提供了蛋白质本身及其用途。
[0020]本发明还涉及植物及其细胞、部分、种子和后代,其中包含至少一个完全敲除型突变IND等位基因,以及由此导致的较之包含编码相应功能性IND蛋白质的IND等位基因的植物及其细胞、部分、种子和后代而言降低的量的功能性IND蛋白质。此类植物及其细胞、部分、种子和后代可用于获得具有经修饰的果实开裂性质的植物,特别用于获得具有显著降低的落籽并且保持荚果的农艺相关的可脱粒性的芸苔属植物。在本文中使用时,“植物部分”包括源于本发明植物的任何物体,包括植物部分,例如,细胞、组织、器官、种子、种子荚果、种子粗粉(seed meal)、种子饼(seed cake)、种子脂肪或油。
[0021]在另一方面,本发明涉及具有经修饰的落粒抗性的种子荚果,其可从根据本发明的植物获得,本发明还涉及所述种子荚果的用途,例如用于栽种和种植来自植物的后代。
[0022]在本发明的又一方面,提供了产生和选择含有至少一个完全敲除型ind等位基因的植物及其细胞、部分、种子和后代的方法。特别地,提供了下述方法,用于产生和选择包含至少两个IND基因的芸苔属植物(特别是欧洲油菜植物)及其细胞、部分、种子和后代,其中含有存在于基因组中至少两个不同IND基因座中至少一个处的至少一个完全敲除型突变ind等位基因,例如位于芸苔属IND-Al和IND-Cl基因的两个不同基因座中至少一个处,以及用于区分突变ind等位基因和野生型IND等位基因在植物或植物部分中的存在。因此,提供了用于产生和/或鉴定ind等位基因或包含此类等位基因的植物或植物部分,以及用于将合适数量的ind等位基因和/或不同类型的ind等位基因组合于单株植物中由此显著修饰该植物的果实开裂性质的方法(例如诱变和/或标记辅助选择)。
[0023]在本发明的另一实施方式中,用本发明的突变IND等位基因增加从芸苔属植物收获的种子或谷粒的产量。增加的产量可以是降低或延迟落籽的结果,但其也可独立于降低或延迟的落籽。特别地,提供了包含至少两个IND基因的芸苔属植物或其细胞、部分、种子或后代,其特征在于这些植物在其基因组中包含如本文所述的两个突变纯合IND等位基因。
[0024]图例
[0025]图1:编码来自欧洲油菜的野生型IND-Al蛋白质的IND-Al基因的图示(SEQ IDNO:5)
[0026]图2:编码来自欧洲油菜的野生型IND-Cl蛋白质的IND-Cl基因的图示(SEQ IDNO:7)
[0027]图1和图2中,实施例中描述的突变的位置(根据实施例中描述的其各自的“ind-xl-EMSxx”名称为“EMSxx”)以垂直线示出;IND特异性探针的长度和位置(根据其各自的SEQ ID Ν0:χχ称为“ID xx”)通过IND基因图示下的水平线示出;IND特异性引物的位置(根据其各自的SEQ ID N0:XX称为“ID xx,,)以箭头示出。
[0028]一般性定义
[0029]“增加荚果掉果(pod shatter)抗性”和“降低荚果掉果”在本文中使用时指芸苔属植物的减少的落籽趋势和/或落籽时机的延迟,特别是延迟到收获之后,所述植物的果实正常情况下不同步成熟,而是顺序成熟,因此一些荚果爆裂开,在收获之前或期间脱离其种子。对荚果掉果的抗性水平与“张力分离测试”中破坏荚果所需的力(Davies和Bruce,1997,J Mat Sci32:5895-5899 ;Morgan 等人,1998,Fields Crop Research58,153-165),“随机冲击测试(random impact test)”中例如20秒(“IP20” ;上文所述Morgan等人,1998)、9.7 或 17 秒(Bruce 等人,2002,Biosystems Eng81(2):179-184)之后剩下的完整荚果的数量,随机冲击测试中荚果样品的半寿期(“LD50”,即,在测试的荚果样品中使得50%的荚果开口所需的处理时间)和“落粒的田间计分”(上文所述Morgan等人,1998)正相关,并可通过例如测定它们来测量所述水平。随机冲击测试(RITs)和在此类RITs中界定荚果样品半寿期的算法已被描述于Bruce等人,2002 (上文)、Morgan等人,1998 (上文)和下文实施例中。两份公开文件都通过引用并入本文。简言之,将完整成熟荚果的样品放在有钢球的封闭鼓室中,然后剧烈振荡鼓室,振荡时间逐渐增加(例如10秒、20秒、40秒、80秒)。每段时间后,开启鼓室,对被破坏和损伤的荚果的数量加以计数。通过将线性X线性曲线拟合至所有可获得的数据,估计样品中一半的荚果被破坏所需的时间(“荚果半寿期”或“LD50”),来计算每种品系的落粒抗性水平的最为精确的估计。但是重要的是,荚果主要沿着开裂区开口,并不如不开裂的荚果可能发生的那样简单地粉碎。
[0030]“荚果掉果抗性的农艺相关的增加”在本文中使用时指植物中荚果掉果抗性的增加,导致田间(收获前)荚果掉果相关产量损失低于针对该植物在田间通常观察到的那样。对于油菜而言,田间荚果掉果相关的产量损失被报道为:对于具有平均良好生长条件的季节而言,大约11% ;以及对于具有平均不良生长条件的季节而言,大约25%。如Bruce等人,2002 (Biosystems Eng81(2):179-184)所描述的,在随机冲击测试中,在这些种子损失水平和分别9.7秒及17秒的处理时间时的种子损失水平之间存在正相关。或者,为确定植物中荚果掉果抗性水平是否是农艺相关的,可将植物的荚果样品半寿期(“LD50”,见上文)与已知具有平均荚果掉果抗性水平的植物(例如对油菜而言,所有目前可商业获得的油菜品种)的荚果样品半寿期加以比较。
[0031]在本文中使用时,“荚果掉果(pod shattering)或落籽(seed shattering) ”或“果实或荚果开裂”指在种子成熟之后发生于果实中的过程,其中,裂月从中隔膜(septum)分开,释出种子。破坏的区域(即“开裂区”)沿着裂月和假隔膜(外隔膜)之间的果实全长延伸。成熟时,“开裂区”实质上(essentially)是裂月和假隔膜中的木质化细胞区域之间的非木质化的层。由于开裂区的细胞壁松弛和长角果中干燥细胞的差异性机械性质建立的张力的组合,导致开裂发生。
[0032]在本文中使用时,芸苔属“果实”指芸苔属植物的从融合的心皮构成的雌蕊群发育来的器官,其在受精后生长成为含有发育中的种子的“(种子)荚果”或“长角果”。芸苔属“(种子)荚果”或“长角果”由果实的壁(心皮)构成,其包括由隔膜分开的两个子囊腔(1cule)0 “开裂区”在与隔膜相邻的心皮边缘发育,并沿着长角果的长度延伸。开裂区的细胞最终开始降解,这削弱了心皮壁或裂月与隔膜之间的联系。细胞黏着的损失限于开裂区的细胞,其是中层损坏导致的(Meakin和Roberts, 1990, J Exp Bot41,995-1011)。
[0033]“开裂区”在本文中使用时指植物(特别是芸苔属植物)的双裂月荚果两侧上的缝线中含有的简单的薄壁组织细胞层。开裂区位于荚果的裂月边和中心假隔膜之间(含有通向柄(stalk)或花梗的主维管束)。开裂区中细胞的脱离在荚果衰老期间发生,其在荚果达到完全成熟的时候完成(上文的Meakin和Roberts, 1990)。然后可发生裂分离。开裂区含有维管导管,其从荚果壁延伸到花梗(柄)和假隔膜。荚果掉果的过程仅在外力破碎易损的维管细导管(vascular thread)之后发生,令裂月分离,种子落到地面。这在株冠(canopy)干扰期间发生,例如通过将收获期间的接触和联合收割。维管组织含有增厚的木质化细胞,其形成厚角细胞群,它们被发现与传导细胞相邻(上文的Meakin和Roberts,1990)。这向组织提供了刚性,并且假定地,对破碎的一定抗性。
[0034]在本文中使用时,“农艺相关的可脱粒性”指荚果,特别是油菜的荚果在允许荚果完全开口的物理力施加时对沿着荚果的开裂区开口同时伴随种子释放的抗性,同时防止对种子的损伤,例如当它们用于联合收割机中时。已经在随机冲击测试中的荚果样品半寿期(“LD50”)与其可脱粒性之间发现了正相关。油菜荚果样品半寿期(按照实施例所述进行的RIT中测定的)(其对应于农艺相关可脱粒性)应当不超过80秒。对于商业可获得的油菜品种的控制品系而言,典型的样品半寿期值为大约10秒。因此,具有显著增加的荚果掉果抗性的具有农艺相关可脱粒性的品系在RIT中具有大约10至大约80秒之间,大约10至大约60秒之间,大约10至大约50秒之间,大约20至大约60秒之间,大约20至大约50秒之间,大约40至大约60秒之间,大约57秒的荚果样品半寿期。
[0035]“作物植物”指作为作物栽培的植物物种,例如欧洲油菜(AACC,2n = 38)、芥菜(AABB, 2n = 36)、埃塞俄比亚芥(Brassica carinata) (BBCC, 2n = 34)、芜青(Brassicarapa)(同义词,芸苔)(AA,2n = 20)、甘蓝(Brassica oleracea) (CC,2n = 18)或黑芥(Brassica nigra) (B B, 2n = 16)。该定义并不包括杂草,例如拟南芥。
[0036]术语“核酸序列(或核酸分子)”指单链或双链形式的DNA或RNA分子,特别是编码根据本发明的蛋白质或蛋白质片段的DNA。“内源核酸序列”指植物细胞内的核酸序列,例如存在于芸苔属细胞的核基因组中的IND基因的内源等位基因。“经分离的核酸序列”用于表示不再处于其天然环境中的核酸序列,例如,体外或在重组细菌或植物宿主细胞中。
[0037]术语“基因”指细胞中的下述DNA序列,其中包含有被转录为RNA分子(例如前mRNA,包含内含子序列,其再被剪接为成熟的mRNA,或者直接转录为没有内含子序列的mRNA)的区域(被转录的区域),其与调控区域(例如启动子)有效相连。因此,基因可以包含一些有效的连接的序列,例如启动子、包含例如翻译起始涉及的序列的5’前导序列,(蛋白质)编码区(cDNA或基因组DNA)和包含例如转录终止位点的3’非翻译序列。“内源基因”用于与“外来基因”、“转基因”或“嵌合基因”区分,指来自某植物属、物种或品种的植物的基因,不是通过转化引入植物的(即,不是“转基因”),而是通常存在于所述植物属、物种或品种的植物中的,或者是从其通常存在的另一种植物属、物种或品种的植物中,通过普通的育种技术或通过体细胞杂交(例如,通过原生质体融合),引入到植物中的。相似的,基因的“内源等位基因”不是通过植物转化引入到植物或植物组织中的,而是例如通过植物诱变和/或选择产生的,或通过筛选天然的植物群体获得的。
[0038]“表达基因”或“基因表达”指这样的过程,其中与合适的调控区(特别是启动子)有效连接的DNA区域,转录成RNA分子。然后,RNA分子在细胞内被进一步加工(通过转录后过程),例如,通过RNA剪接和翻译起始,翻译成氨基酸链(多肽),并且通过翻译终止密码子结束翻译。术语“功能性表达”在本文中用于表示生产了功能性蛋白质,术语“非功能性表达”表示生产的蛋白质具有显著降低的或没有功能(生物学活性),或者未生产蛋白质(也参见下文)。
[0039]术语“蛋白质”或“多肽”可互换使用,其表示由氨基酸的链构成的分子,无关特定作用模式、大小、3维结构或来源。IND蛋白质的“片段”或“部分”因此仍可被称作“蛋白质”。“经分离的蛋白质”用于表示不再处于其天然环境中的蛋白质,例如体外或在重组细菌或植物宿主细胞中。术语“转录因子”用于表示由至少两个不同结构域一DNA结合结构域和活化或阻遏结构域构成的蛋白质,它们一共运作,以调节从靶基因启动子转录起始的速率(Ptashne,1988, Nature335,683-689)。术语“碱性螺旋-环-螺旋(bHLH)结构域转录因子”用于表示这样的转录因子,其除了包含bHLH DNA结合结构域(Heim等人,2003,MolBiol Evol20,735-747 ;Toledo-0rtiz 等人,2003,Plant Celll5,1749-1770)之外,还包含已知对于调控基因表达来说重要的结构域,其在氨基酸水平上在来自不同物种的相关蛋白质中可能是保守的(Quong等人,1993,Mo I Cell Bioll3,792-800)。包含bHLH结构域的转录调控子通过碱性区域中的残基结合DNA,同时螺旋-环-螺旋结构域促进二聚化,允许家族成员形成异源或同源二聚体(Murre等人,1989,Cell56,777-783)。
[0040]术语“ IND基因”在本文中表示编码INDH1ISCENT (IND)蛋白质(其是种子散布所需的bHLH结构域转录因子)的核酸序列(Liljegren等人,2004,Cellll6:843-853)。
[0041]在本文中使用时,术语“等位基因”表示在特定基因座上的基因的一种或多种备选形式。在生物的二 倍体(或双二倍体)细胞中,给定基因的等位基因位于染色体上的特定位置或基因座上。同源染色体对的每条染色体上存在一个等位基因。
[0042]如本文中使用的,术语“同源染色体”意指这样的染色体,所述染色体含有相同生物学特征的信息,在相同基因座上含有相同的基因,但可能是这些基因的不同等位基因。同源染色体是在减数分裂过程中成对的染色体。“非同源染色体”代表了生物体的所有生物学特征,形成一组,而细胞内的组数被称为倍性。二倍体生物含有两组非同源染色体,其中每组同源染色体继承自不同的亲本。在双二倍体物种中,实质上存在两组二倍体基因组,从而将两组基因组的染色体称为部分同源染色体(相似的,两组基因组的基因座或基因被称为部分同源基因座或基因)。二倍体或双二倍体的植物品种在特定的基因座可以包含大量的不同等位基因。
[0043]在本文中使用时,“杂合”表示这样的遗传条件,此时在特定基因座上存在两种不同的等位基因,它们各自位于细胞中同源染色体的相应的对上。相反,在本文中使用时,术语“纯合”表示这样的遗传条件,此时在特定基因座上存在两个相同的等位基因,它们各自位于细胞中同源染色体的相应的对上。
[0044]在本文中使用时术语“基因座”表示染色体上发现了例如基因或遗传标记的特定位置或位点。例如,“IND-A1基因座”表示A基因组的染色体上可发现IND-Al基因(两种IND-Al等位基因)的位置,“ IND-Cl基因座”表示C基因组的染色体上可发现IND-Cl基因(两种IND-Cl等位基因)的位置。[0045]根据本发明中无论何时提到“植物”,均应当理解,除非另有指明,此时还包括植物部分(细胞,组织或器官,种子荚果,种子,已分离的部分例如根、叶、花、花粉等等),保留有亲本的区别性特征(尤其是果实开裂性质)的植物后代,例如,通过自交或杂交获得的种子,例如杂交体种子(通过将两种近交亲本品系杂交获得的),从其获得的杂交体植物和植物部分。
[0046]“分子测定(或测试)”在本文中表示这样的测定,其指示(直接或间接)一种或多种特定IND等位基因是否存在于一个或两个IND基因座(例如,一个或两个IND-Al或IND-Cl基因座)上。在一种实施方式中,其允许人们确定任何个体植物中的基因座上特定(野生型或突变)等位基因是纯合还是杂合的。
[0047]“野生型”在本文中使用时表示植物或基因在自然界最常出现的典型形式。“野生型植物”指具有此类植物在天然种群中最常见表型的植物。“野生型等位基因”指产生野生型表型所需的基因等位基因。相反,“突变植物”指具有此类植物在天然种群中的不同的稀少表型的植物,或通过人类的干涉,例如通过诱变产生的植物,并且“突变等位基因”表示产生突变表型所需的基因等位基因。
[0048]在本文中使用时,术语“野生型IND” (例如野生型IND-Al或IND-C1)表示在植物(特别是十字花科植物,尤其是芸苔属植物)中发现的天然存在的IND等位基因,其编码功能性IND蛋白质(例如,分别地,功能性IND-Al或IND-C1)。相反,术语“突变IND” (例如突变IND-Al或IND-C1)在本文中使用时表示不编码功能性IND蛋白质的IND等位基因,即,编码非功能性IND蛋白质(即,分别是非功能性的IND-Al或IND-C1),或者根本不编码IND蛋白质的IND等位基因,非功能性IND蛋白质在本文中使用时指不具有生物活性或较之相应野生型功能性IND蛋白质而言具有显著降低的生物活性的IND蛋白质。此类“突变IND等位基因”(也被称为“完全敲除型”或“无效”等位基因)是野生型IND等位基因,其在其核酸序列中包含一处或多处突变,其中所述突变优选在细胞中体内产生显著降低(绝对或相对)的功能性IND蛋白质的量。在本文中使用时,“完全敲除型IND等位基因”是突变IND等位基因,其在植物(例如具有两个完全敲除型IND-Al等位基因和两个完全敲除型IND-Cl等位基因的欧洲油菜植物)中每个IND基因座上以纯合状态的存在导致该植物中的荚果掉果抗性的增加,其高到不能仍然保持农艺相关。编码IND蛋白质的核酸序列的突变等位基因在本文中被命名为“ind” (例如分别为ind-al或ind_cl)。突变等位基因可以是“天然突变”等位基因,这是在自然界发现的突变等位基因(例如没有人应用诱变剂的情况下自发产生的),或者“诱导的突变”等位基因,这是通过人干涉诱导的,例如通过诱变。
[0049]“显著降低的功能性IND蛋白质的量”(例如功能性IND-Al或IND-Cl蛋白质)指包含突变IND等位基因的细胞生产的功能性IND蛋白质的量较之不包含突变IND等位基因的细胞生产的功能性IND蛋白质的量而言降低至少30%、40%、50%、60%、70%、80%、90%、95%或100% (即,细胞不生产功能性IND蛋白质)。该定义包括:产生不具有体内生物活性的“非功能性” IND蛋白质(例如截短的IND蛋白质),功能性IND蛋白质绝对量的降低(例如,由于IND基因的突变导致没有功能性IND蛋白质被制造出来)和/或生产较之功能性野生型IND蛋白质的活性而言具有显著降低的生物活性的IND蛋白质(例如下述IND蛋白质,其中对于被编码的IND蛋白质的生物活性而言关键的一个或多个氨基酸残基(如下文所例示)被另外的氨基酸残基取代)。术语“突变IND蛋白质”在本文中使用时指突变IND核酸序列(“ind等位基因”)编码的下述IND蛋白质,其中所述突变导致较之非突变野生型IND序列(“IND等位基因”)编码的IND蛋白质的活性而言显著降低和/或没有的体内IND活性。
[0050]“诱变”在本文中使用时指这样的过程,其中对植物细胞(例如多个芸苔属种子或其它部分例如花粉等等)应用在细胞DNA中诱导突变的技术,例如将其与诱变剂接触,例如与化学物质(例如甲基磺酸乙酯(EMS)、乙基亚硝基脲(ENU)等等)或电离辐射(中子(例如在快中子诱变等等)、α射线、gamma射线(例如通过钴60源提供的)、X-射线、UV辐射等等)或上述中两种或多种的组合接触。因此,对一个或多个IND等位基因的想要的诱变可通过使用化学手段(例如通过将一种或多种植物组织与甲基磺酸乙酯(EMS)、乙基亚硝基脲等接触)或通过使用物理手段(例如X射线等等或通过Y辐射,例如钴60源提供的)来进行。通过照射制造的突变通常是大的缺失或者其它明显的损伤,例如易位或复杂重排,而通过化学诱变剂制造的突变通常是更离散的损伤,例如点突变。例如,EMS烷基化鸟嘌呤碱基,其导致碱基错配:烷基化的鸟嘌呤将与胸腺嘧啶碱基配对,主要导致G/C向Α/Τ的转变。诱变之后,使用已知技术从经处理的细胞再生芸苔属植物。例如,可根据传统种植流程,栽种得到的芸苔属种子,自花授粉后,在植物上形成种子。或者,可选出双单倍体小植株,立即形成纯合植物,例如如 Coventry 等人(1988,Manual for Microspore Culture Techniquefor Brassica napus.Dep.Crop Sc1.Techn.Bull.0AC Publication0489.Univ.0f Guelph,Guelph, Ontario, Canada)所述。通过此类自花授粉在这代或后续代中形成的其它种子可被收获,并针对突变IND等位基因的存在对其加以筛选。已知若干技术可用于筛选特定的突变等位基因,例如 Deleteagene?(Delete-a-gene ;Li 等人,2001, Plant J27: 235-242)使用聚合酶链式反应(PCR)测定,来筛选通过快中子诱变产生的缺失突变,TILLING (基因组中革巴向诱导局部损伤;McCallum等人,2000,Nat Biotechnoll8:455-457)鉴定EMS诱导的点突变,等等。针对特定突变IND等位基因的存在加以筛选的其它技术被描述于下文实施例中。
[0051]在本文中使用时,提到植物使用时,术语“非天然存在”表示具有经过人工修饰的基因组的植物。转基因植物,例如是含有外源核酸分子(例如包含转录区域的嵌合基因,当其转录时,产生能降低内源基因(例如根据本发明的IND基因)表达的生物活性RNA分子)并且因此已经经人工遗传修饰的非天然存在的植物。此外,在内源基因中含有突变(例如内源IND基因中的突变(例如在调控元件或在编码序列中),由于暴露给诱变试剂导致的)的植物也被认为是非天然植物,因为其已经经人工遗传修饰过。此外,下述特定物种(例如欧洲油菜)的植物也被认为是非天然存在的植物,所述植物在内源基因(例如内源IND基因)中含有天然不存在于该特定植物物种中的突变,这是用该植物相同或不同物种(例如芥菜或芜青)的植物进行的例如定向育种过程,例如标记辅助育种和选择,或者基因渗入的结果。相反,仅含自发或者天然存在的突变的植物,即,没有经过人工遗传修饰的植物,不是本文定义的“非天然存在的植物”并且因此不包括在本发明内。本领域技术人员理解,非天然存在的植物通常具有较之天然存在的植物而言经改变的核苷酸序列,但非天然存在的植物也可以是经过人工遗传修饰但是不改变其核苷酸序列,例如通过修饰其甲基化模式来进行。
[0052]术语基因或蛋白质的“直向同源物”在本文中指在另一个物种中发现的同源基因或蛋白质,其具有与基因或蛋白质相同的功能,但(通常)从物种具有偏离的基因(即,通过物种形成从共同的祖先进化的基因)的时间点开始,其序列偏离。因此,可以基于序列比较(例如,基于整个序列或特定结构域的百分比序列同一性)和/或功能分析,在其它的植物物种(例如,芥菜等)中鉴定欧洲油菜IND基因的直向同源物。
[0053]本文中使用的“品种”与UPOV规范一致,指在单个已知最低级别的植物分类单位中的植物分组,所述分组可以通过由给定基因型或基因型的组合所导致的特征的表达来定义,可以通过至少一种所述特征的表达来与任何其它植物分组进行区分,并且在关于它进行无变化(稳定)繁殖的适合性方面可认为是一个单位。
[0054]术语“包含”理解为具体说明了所陈述部分、步骤或组分的存在,但不排除存在一种或多种其它的部分、步骤或组分。因此,包含一些性状的植物可以包含其它的性状。
[0055]可以理解,当以单数形式(例如,植物或根)指代词时,复数形式(例如,复数的植物,复数的根)也包括在内。因此,通过不定冠词但属性是(“a”或“an”)指代元件时,不排除存在一个以上的元件的可能性,除非上下文明确的要求有且仅有一个元件。因此,不定冠词单数形式(“a”或“an”)通常意指“至少一个”。
[0056]出于本发明的目的,两个相关核苷酸或氨基酸序列的“序列同一性”表示为百分t匕,指两条最优比对的序列中具有相同残基的位置数(XlOO)除以比较的位置数。将空位视为具有不相同残基的位置,所述空位是比对中这样的位置,所述位置上的残基存在于一条序列中,而不存在于另一条序列中。根据European Molecular Biology Open SoftwareSuite (EMB0SS,Rice 等人,2000,Trends in Geneticsl6 (6):276-277 ;参见例如 http://www.eb1.ac.uk/emboss/align/index, html)中的 Needleman 和 Wunsch 总体对比算法(Needleman 和 Wunsch,1970,J Mol Biol48(3):443-53),使用缺省设置(空位开放罚分=
10(对于核苷酸)/10 (对于蛋白质)和空位延伸罚分=0.5 (对于核苷酸)/0.5 (对于蛋白质)),通过在全长比对两条序列来发现两条序列的“最优比对”。对于核苷酸,使用的缺省评分矩阵是EDNAFULL,而对于蛋白质,缺省的评分矩阵是EBL0SUM62。
[0057]如本文中使用的,“基本相同(subtantially identical) ”或“实质相似(essentially similar) ”指,当如上述进行最优比对时,至少具有某一最小百分比的序列同一性(如下文进一步定义)的序列。
[0058]可以使用“严格杂交条件”来鉴定与给定的核苷酸序列基本相同的核苷酸序列。严格条件是序列依赖性的,在不同环境中可以不同。通常,选择的严格条件是比特定的序列在定义的离子强度和PH下的热解链点(Tm)低约5°C。Tm是(在定义的离子强度和pH下)50%的靶序列与完全匹配的探针杂交的温度。通常,所选择的严格条件是在pH7和至少60°C的温度下,盐浓度为约0.02摩尔。降低盐浓度和/或增加温度,可增加严格性。用于RNA-DNA杂交的严格条件(Northern印迹,使用探针例如IOOnt)是,例如包括至少一次在63°C下,在0.2X SSC中洗涤20min的条件,或等价的条件。
[0059]“高严格条件”可以例如通过如下提供:在65°C的水溶液中杂交,所述溶液含有6xSSC(20x SSC含有3.0M NaCl,0.3M Na-柠檬酸,ρΗ7.0),5x Denhardt; s(100X Denhardt’s含有2% Ficoll,2%聚乙烯吡咯烷酮,2%牛血清白蛋白),0.5%十二烷基硫酸钠(SDS),和作为非特异性竞争物的20 μ g/ml变性的载体DNA(单链鱼精子DNA,具有平均长度为120-3000核苷酸)。在杂交后,可以在若干步骤中进行高严格洗涤,最终洗涤(约30分钟)是在杂交温度下,0.2-0.1X SSC,0.1% SDS中进行。
[0060]“中严格条件”指与上述溶液杂交等价的条件,但是在约60_62°C。中等严格洗涤可以在杂交温度下,IX SSC,0.1% SDS中进行。
[0061]“低严格性”指与上述溶液杂交等价的条件,但是在约50_52°C。低严格洗涤可以在杂交温度下,2X SSC, 0.1% SDS中进行。还参见Sambrook等人,(1989)以及Sambrook和Russell (2001)。 [0062]“增加的收获产量”或“增加的种子或谷粒产量”指:较之从相似量的无突变IND等位基因的等基因(isogenic)植物收获的种子或谷粒的量而言,从多株植物(每株包含根据本发明的突变IND等位基因)收获的更大量的种子或谷粒。产量典型地以每表面单位收获的种子的体积单位表示,例如蒲式耳/英亩或Kg/ha。产量增加典型地以百分比表示,其中参照或对照植物的产量计为100%,根据本发明的植物的产量以相对对照植物的产量的%表示。在根据本发明的芸苔属植物中观察到的产量增加范围为至少101%至至少124%,预计可取得更高的产量增加。产量增加还可在104%至108%或105%至110%的范围内。
[0063]发明详述
[0064]欧洲油菜(基因组AACC,2n = 4x = 38)是异源四倍体(双二倍体)物种,由于其来源于双倍体祖先,因此其含有实质上两个双倍体基因组(A和C基因组),其在基因组中包含两个IND基因。发明人发现,一个IND基因位于A基因组上(本文中称为“IND-A1”),一个位于C基因组中(本文中称为“IND-C1”)。IND-Al基因被认为与IND-Cl基因“部分同源”,即“A基因”被发现于A基因组中,其来自双倍体祖先芜青(AA),“C基因”被发现于欧洲油菜的C基因组上,其来自双倍体祖先甘蓝(CC)。
[0065]如任何双倍体基因组中一样,针对每个IND基因,基因组的每个IND基因座上可体内存在两个“等位基因”(一个等位基因是在一条染色体上发现的基因序列,另一个则在同源染色体上)。在任何给定的植物中,这两个等位基因的核苷酸序列可相同(纯合植物)或不同(杂合植物),虽然在整个物种种群中,对于每个IND基因而言,存在的不同的可能的等位基因的数量可远大于2。[0066]还发现,在两个IND基因中的仅一个中(即,IND-Al或IND-Cl中),对完全敲除型ind等位基因而言是纯合的欧洲油菜植物较之不包含突变IND等位基因的欧洲油菜植物而言不显示出显著增加的荚果掉果抗性,而在两个IND基因中针对完全敲除型ind等位基因均为纯合的欧洲油菜植物中,荚果掉果抗性显著增加,但是荚果掉果抗性的水平太高以至于无法保持农艺相关的可脱粒性。相反,在包含两个欧洲油菜IND基因的三个完全敲除型ind等位基因的欧洲油菜植物中,荚果掉果抗性显著增加至这样的水平:其中,植物保持荚果的农艺相关可脱粒性。我们认为,为了获得显示出增加的荚果掉果抗性同时保持荚果的农艺相关可脱粒性的植物,可需要在包含至少两个IND基因的芸苔属植物(特别是包含IND-Al和IND-Cl基因的欧洲油菜植物)中存在三个完全敲除型ind等位基因。
[0067] 因此在本发明的一种实施方式中,在本文中提供了包含至少两个IND基因的芸苔属植物,特别是包含IND-Al和IND-Cl基因的欧洲油菜植物,其包含3个ind等位基因,其中ind等位基因导致这些突变等位基因的野生型等同体编码的功能性IND蛋白质类型的量显著降低,以及由此使得植物细胞中(具体而言,在发育中的种子荚果中)体内生产的功能性IND蛋白质的量总体上显著降低。
[0068]还认为,通过在一株植物(特别是芸苔属植物)中将足够拷贝的特定(突变)ind等位基因与足够拷贝的特定(野生型)IND等位基因组合,有可能精细调节制造的功能性IND蛋白质的量和/或类型,其进而影响植物的果实开裂性质。因此可以以此类方式调节IND蛋白质的绝对和相对量,以提供产生足够的IND蛋白质从而能实现种子荚果的农艺相关可脱粒性同时降低收获前或收获期间的落籽的植物。
[0069]因此,在本发明的一种实施方式中,提供了下述植物(特别是芸苔属植物),其包含至少一个功能表达的IND等位基因,该等位基因编码完全功能性的IND蛋白质,同时其余等位基因可以是(突变)ind等位基因。
[0070]在本发明的一个方面,提供了包含至少两个IND基因的芸苔属植物,特别是欧洲油菜植物,其包含该芸苔属植物中的至少2个不同IND基因(特别是IND-Al和IND-Cl基因)的η-重数(n-tuple) ind等位基因,其中,n ( 3(例如η = 1、2或3),从而至少一个等位基因产生功能性的IND蛋白质。
[0071]在本发明的另一方面,提供了芸苔属的物种的纯合IND单突变(η = 2,即,对于一个IND基因的突变等位基因来说是纯合的)和/或纯合IND双突变(η = 4,即,对于两个IND基因的突变等位基因来说是纯合的)植物(特别是欧洲油菜),其包含至少两个IND基因,其中,在该芸苔属植物中,所述突变等位基因是2个不同IND基因(特别是IND-Al和/或IND-Cl基因)的突变等位基因。根据本发明,此类突变植物可用于育种目的。因此,在本发明的一种实施方式中,在本文中提供了纯合IND单突变欧洲油菜植物,其中,植物的基因型可被描述为 ind-al/ind-al,IND-Cl/IND-Cl 或 IND-Al/IND-Al,ind-cl/ind-cl。在本发明的另一实施方式中,在本文中提供了纯合IND双突变欧洲油菜植物,其中,植物的基因型可被描述为 ind-al/ind-al, ind-cl/ind-cl。
[0072]在本发明的另一方面,包含至少两个IND基因的芸苔属的物种(特别是欧洲油菜)的纯合IND单(η = 2)突变植物包含其它突变IND等位基因,其中,所述突变植物对于另外的突变IND等位基因来说是杂合的(即η = 3),并且其中,突变等位基因是在该芸苔属植物中剩下的野生型IND基因(特别是IND-Al或IND-Cl基因)的突变等位基因。因此,在本发明的另一实施方式中,此处提供了包含一个其它突变IND等位基因的纯合IND单突变欧洲油菜植物,其中,植物的基因型可被描述为ind-al/ind-al,IND-Cl/ind-cl或IND-A1/ind-al, ind-cl/ind-cl。
[0073]本发明还提供了来自芸苔属的物种的野生型和突变IND基因/等位基因的核酸序列以及野生型和突变IND蛋白质。本发明还提供了在芸苔属植物中产生和组合突变和野生型IND等位基因的方法,以及在其基因组中包含野生型和突变IND等位基因的特定组合的芸苔属植物和植物部分,其中这些植物中落籽被降低。这些植物用于将突变IND等位基因转移到其它植物中的用途也是本发明的一种实施方式,描述的任何植物的植物产品也是。此外,还提供了用于标记辅助选择(MAS)以组合或检测IND基因和/或等位基因的试剂盒和方法。下文中将详细描述本发明的每种实施方式。
[0074]本文所述的展示出降低或延迟的落籽的芸苔属植物具有增加的收获的种子产量。但是,出人意料地观察到,来自仅包含两个纯合状态的突变IND等位基因的芸苔属植物(即,其中,植物的基因型可被描述为ind-al/ind-al,IND-C1/IND-C1或IND-A1/IND-A1,ind-cl/ind-cl)的收获的种子产量较之不包含突变IND等位基因的等基因芸苔属植物也显著增加,尽管在包含突变IND等位基因的芸苔属植物中没有可观察到的降低或延迟的落籽表型。本发明由此还提供了包含至少两个IND基因的下述芸苔属植物,其中,至少两个等位基因产生功能性IND蛋白质,所述植物具有更高的种子产量。清楚地,在IND-A基因座或IND-C基因座上的两个突变等位基因可以是相同的突变等位基因或不同的突变等位基因。
[0075]根据本发明的核酸序列
[0076]本发明提供了来自十字花科(特别是来自芸苔属的物种,尤其是来自欧洲油菜,也可来自芸苔属作物物 种)的IND基因的野生型IND核酸序列(编码功能性IND蛋白质)和突变ind核酸序列(包含一处或多处突变,优选地,导致编码的IND蛋白质的生物活性显著降低或没有的突变,或者导致不产生IND蛋白质的突变)。例如,包含A和/或C基因组的芸苔属的物种可包含IND-A或IND-C基因的不同等位基因,在根据本发明的单株植物中可鉴定和组合它们。此外,可使用诱变方法来在野生型IND等位基因中产生突变,由此产生根据本发明使用的突变ind等位基因。因为优选通过杂交和选择在植物中组合特定的IND等位基因,因此在一种实施方式中,在植物(例如芸苔属植物,优选是可与欧洲油菜杂交或可用于制造“合成”欧洲油菜植物的芸苔属植物)中提供IND和/或ind核酸序列(即,内源地)。不同芸苔属物种之间的杂交被描述于本领域中,例如参见Snowdon (2007, Chromosomeresearchl5:85-95)。物种间杂交可例如用于将基因从例如欧洲油菜(AACC)中的C基因组转移到埃塞俄比亚芥(BBCC)中的C基因组,或者甚至从例如欧洲油菜(AACC)中的C基因组转移到芥菜(AABB)中的B基因组(通过其C和B基因组之间的非常规重组的散发事件进行)。可通过将原始祖先甘蓝(CC)和芜青(AA)杂交来生产“再合成”或“合成”的欧洲油菜品系。在芸苔属作物物种及其亲属物种之间的杂交中,物种间以及属间不相容障碍可被成功克服,例如通过胚胎拯救技术或原声质体融合(见例如上文的Snowdon)。
[0077]但是,本发明中还提供了经分离的IND和ind核酸序列(例如通过克隆从植物分离或通过DNA合成来合成制造)及其变体以及它们任何的片段,它们可用于确定植物或植物部分中内源存在哪些序列,所述序列是否编码功能性、非功能性的蛋白质或不编码蛋白质(例如通过按照下文所述在重组宿主细胞中表达)以及用于选择特定等位基因和将其从一种植物转移到另一种,以产生具有想要的功能性和突变等位基因组合的植物。
[0078]已经从欧洲油菜分离出了 IND-Al和IND-Cl的核酸序列,如序列表中所示。描述了野生型IND序列,同时下文和实施例中还参照野生型IND序列描述了这些序列以及与其实质上相似的序列的突变ind序列。来自欧洲油菜的编码IND蛋白质的基因组DNA不包含任何内含子。
[0079]根据本发明的“ IND-Al核酸序列”或“ IND-Al变体核酸序列”是编码与SEQ IDNO:2具有至少75%,至少80%,至少85%,至少90%,至少95%,98%,99%或100%序列同一性的氨基酸序列的核酸序列,或是与SEQ ID NO:1或SEQ ID NO:5具有至少80%,至少85%,至少90%,至少95%,96%,97%,98%,99%或100%序列同一性的核酸序列。这些核酸序列还可被称为与序列表中提供的IND序列“实质相似”或“实质相同”。
[0080]根据本发明的“IND-Cl核酸序列”或“IND-Cl变体核酸序列”是编码与SEQ ID NO:4(IND-C1-长)或SEQ ID NO:4的第16位氨基酸至第210位氨基酸(IND-C1-短)具有至少75 %,至少80 %,至少85 %,至少90 %,至少95 %,98 %,99 %或100 %序列同一性的氨基酸序列的核酸序列,或是与SEQ ID NO:3(IND-C1-长)或SEQ ID NO:3的第46位核苷酸至第633位核苷酸(IND-C1-短)或与SEQ ID NO:7具有至少80%,至少85%,至少90%,至少95%,96%,97%,98%,99%或100%序列同一性的核酸序列。这些核酸序列还可被称为与序列表中提供的IND序列“实质相似”或“实质相同”。
[0081]因此编码野生型功能性IND-Al和IND-Cl蛋白质的核酸序列都被提供于本发明中,这包括其变体和片段(如下文所定义的)以及上述任何的突变核酸序列,其中,核酸序列中的突变优选导致较之野生型IND蛋白质而言一个或多个氨基酸被插入、缺失或取代。优选地,核酸序列中的一个或多个突变导致一处或多处氨基酸改变(即,相对于野生型氨基酸序列而言,一个或多个氨基酸被插入、缺失和/或取代),由此IND蛋白质的生物活性显著降低或完全消失。IND蛋白质的生物活性显著降低或完全消失在本文中表示IND蛋白质的DNA结合活性、二聚化能力和/或转录调控活性降低或消失,使得表达突变IND蛋白质的植物的荚果掉果抗性较之表达相应野生型IND蛋白质的植物而言有所增加。
[0082]为测定植物(特别是芸苔属植物)中特定IND等位基因/蛋白质的功能性,可通过对包含特定IND等位基因/蛋白质的植物和相应野生型植物的果实和花进行宏观、显微和组织学测定(与Liljegren等人(2004,见上文)所述对拟南芥属的果实和花进行的测定类似,或按照下文实施例中所述),来测定植物中荚果掉果抗性的水平。简言之,可例如通过宏观测试,例如肉眼检查种子荚果评估例如裂月边缘是否存在、荚果喙长度等等;人工冲击测试(MIT)以比较不同突变IND品系和相应野生型品系之间的荚果掉果抗性水平(通过评估轻柔扭动荚果时荚果开口的容易程度);随机冲击测试(RIT)以比较分别来自不同突变IND品系和相应野生型品系 的植物的种子荚果的可脱粒性(通过测量这些品系的荚果样品的半寿期);和/或通过显微测试以检查例如种子荚果的开裂区和裂月边缘的细胞是否以及如何受到IND中突变的影响,来评估和/或测量荚果掉果抗性的变化。或者,一旦IND蛋白质的二聚化伴侣(例如,当其功能依赖同源二聚体的形成时,是IND蛋白质自身,或者,当其功能依赖异源二聚体的形成时是另外的蛋白质)和/或其转录受到IND蛋白质调控的基因被鉴定和分析出来,可通过本领域已知的重组DNA技术,来评估特定IND等位基因/蛋白质的功能性,例如通过在宿主细胞(例如细菌,例如大肠杆菌)中共表达二聚体的两个伴侣并评估是否仍可形成二聚体、二聚体是否仍可与被调控基因的bHLH结合位点结合和/或这些基因的转录是否仍被这种结合调控来进行。
[0083]本文提供了内源和经分离的核酸序列。还提供了 IND序列的片段和IND变体核酸序列(如上文定义的),它们用作为引物或探针以及用作为根据本发明的另一方面(见下文)的试剂盒的组分。IND或ind核酸序列或其变体(如所定义的)的“片段”长度可以变化,例如,IND或ind序列(或变体序列)的至少10、12、15、18、20、50、100、200、500、600个
连续核苷酸。
[0084]编码功能性IND蛋白质的核酸序列
[0085]序列表中示出的核酸序列编码来自欧洲油菜的野生型功能性IND蛋白质。因此,这些序列是从其中分离出它们的欧洲油菜植物内源的。可对其它芸苔属作物物种、品种、育种品系或野生登记种加以筛选,来筛选其它IND等位基因,其编码相同的IND蛋白质或其变体。例如,可使用核酸杂交技术(例如Southern印迹分析,其中使用例如严格杂交条件)或基于PCR的技术,来鉴定其它芸苔属植物(例如多种欧洲油菜品种、品系或登记种)内源的IND等位基因,以及,可针对其它野生型IND等位基因,来筛选芥菜(尤其是A-基因组上的IND等位基因)、埃塞俄比亚芥(尤其是C-基因组上的IND等位基因)和芜青(A-基因组)和甘蓝(C-基因组)植物、器官和组织。为针对IND等位基因的存在筛选此类植物、植物器官或组织,可使用序列表中提供的IND核酸序列或任何这些的变体或片段。例如,完全序列或片段可用作为探针或引物。例如,可使用特异性的或简并引物,从植物、植物器官或组织的基因组DNA中扩增编码IND蛋白质的核酸序列。可使用标准分子生物学技术,对这些IND核酸序列加以分离和测序。然后可使用生物信息学分析来分析等位基因,例如,以确定哪些IND等位基因对应该序列以及哪些IND蛋白质或蛋白质变体是该序列编码的。
[0086]可通过本领域已知的重组DNA技术来分析核酸序列是否编码功能性IND蛋白质,例如通过遗传学互补测试,其中使用例如对于完全敲除型ind突变等位基因来说是纯合的拟南芥属植物,或者对于IND-Al和IND-Cl基因二者的完全敲除型ind突变等位基因来说是纯合的欧洲油菜植物。
[0087]此外,应当理解,可通过计算机方式,通过针对实质上相似的序列筛选核酸数据库,来鉴定IND核酸序列及其变体(或它们中任何的片段)。类似地,可化学合成核酸序列。还提供了根据本发明的核酸分子的片段,下文中将对其进行进一步描述。片段包括仅编码bHLH结构域或者包含bHLH结构域的部分的更小的片段(例如碱性结构域或者HLH结构域等等)的核酸序列。
[0088] 编码突变IND蛋白质的核酸序列
[0089]相对于野生型核酸序列,包含一个或多个核苷酸缺失、插入或取代的核酸序列是发明的另一个实施方案,同样地此类突变核酸分子的片段也是。如下文进一步描述的,可以利用多种已知的方法产生和/或鉴别此类突变核酸序列(称为ind序列)。此外,以内源性形式和以分离的形式提供了此类核酸分子。在一个实施方案中,突变导致所编码的IND蛋白质的氨基酸序列中的一个或多个改变(缺失、插入和/或取代)(即,不是“沉默突变”)。在另一个实施方案中,核酸序列中的突变导致相对于野生型蛋白质,所编码的IND蛋白质的生物学活性显著降低或完全消失。
[0090]因此,核酸分子可以包含一个或多个突变,例如:[0091](a) “错义突变”,所述突变是核酸序列中的改变,其导致氨基酸取代另一个氨基酸;
[0092](b) “无义突变”或“STOP密码子突变”,所述突变是核酸序列中的改变,其导致引入过早的STOP密码子,从而终止翻译(导致截短的蛋白质);植物基因包含翻译终止密码子“TGA” (RNA中的UGA)、“TAA” (RNA中的UAA)和“TAG” (RNA中的UAG);因此,在待翻译的成熟mRNA中(在阅读框中)导致上述密码子之一的任何核苷酸取代、插入、缺失将终止翻译。
[0093](C) 一个或多个氨基酸的“插入突变”,原因是在核酸的编码序列中添加一个或多个密码子;
[0094](d) 一个或多个氨基酸的“缺失突变”,原因是在核酸的编码序列中缺失一个或多个密码子;
[0095](e) “移码突变”,导致在突变下游以不同的框翻译核酸序列。移码突变可以具有各种原因,例如一个或多个核苷酸的插入、缺失或重复。
[0096]如已经提到的,核酸序列中的突变优选导致下述突变蛋白质是想要的,所述蛋白质包含显著降低的或者没有体内生物活性,或者想要导致不生产蛋白质。基本上,导致产生相对于野生型蛋白质而言包含至少一处氨基酸插入、缺失和/或取代的蛋白质的任何突变可导致显著降低的生物活性或没有生物活性。但是,应当理解,蛋白质某些部分中的突变更易于导致突变的IND蛋白质功能降低,例如导致截短的蛋白质的突变,由此缺乏功能性结构域(例如DNA结合结构域(“b”)、二聚化结构域(“HLH”)和/或转录调控结构域)的显著部分。
[0097]根据The Arabidopsis Information Resource (TAIR)数据库(http://www.arabidopsis.0rg/),拟南芥属 INDH1ISCENT 蛋白质(基因座 At4g00120.1 ;SEQ ID NO:10)长度为198个氨基酸,其包含位于SEQ ID NO:10的第121至168位氨基酸之间(pfam结构域PF00010)、第124至173位氨基酸之间(smart结构域SM00353)或第112和168位氨基酸之间(prosite结构域PS50888)的“碱性螺旋-环-螺旋(bHLH) 二聚化”结构域和第114至196或198位的氨基酸之间的“螺旋-环-螺旋(HLH)DNA结合”结构域(分别是superfam 结构域 G3D.4.10.280.10 或 SSF47459)。
[0098]本文描述的芸苔属的IND-Al蛋白质长度为大约185个氨基酸(SEQ ID NO:2),IND-Cl蛋白质大约195个氨基酸(SEQ ID NO:4的第16至210位)或210个氨基酸(SEQID NO:4),它们包含位于SEQ ID NO:2的第120至167位和SEQ ID NO:4的第133至180位氨基酸之间(Pfam结构域PF00010)、位于SEQ ID NO:2的第123至172位和SEQ ID NO:4的第136至185位氨基酸之间(smart结构域SM00353)或位于SEQ ID NO:2的第111至167位和SEQ ID NO:4的第124至180位氨基酸之间(prosite结构域PS50888)的“碱性bHLH 二聚化”结构域和SEQ ID NO:4的第127至208或210位的氨基酸之间(分别为superfam结构域G3D.4.10.280.10或SSF47459)的“HLH DNA结合”结构域,这是通过对芸苔属和拟南芥属的IND蛋白质进行最优比对测定的并且基于TAIR数据库中的注释信息。
[0099]如Heim 等人(2003,Mol Biol Evol20,735-747)所述,133 种拟南芥属 bHLH 转录因子基因的共有bHLH结构域序列由大约56个氨基酸构成(Heim等人,图1 ;对应于SEQ IDNO: 10的119-174位)。 该二分结构域包含(I)碱性区域,位于结构域的N-末端,其参与DNA结合,由具有高数量碱性残基的大约13个氨基酸构成(“b” ;对应于SEQ ID NO:10的119-131位);和(2)螺旋-环-螺旋区域,位于C-末端,其作为二聚化结构域发挥功能,其由大约43个主要疏水的氨基酸残基构成(对应于SEQ ID NO:10的第132-174位),它们形成分别为大约15个氨基酸(“H1”;对应于SEQ ID NO:10的第132-146位)和大约22个氨基酸(“H2”;对应于SEQ ID NO:10的第153-174位)的两个两性α-螺旋,它们之间由大约6个至可多达大约14个氨基酸的环区域(“L”;对应于SEQ ID NO:10的第147-152位)分开,该环区域是bHLH结构域中大小和氨基酸组成上最具分歧性的区域。两个α-螺旋促进二聚化,允许在不同家族成员之间形成同源二聚体和/或异源二聚体(Toledo-Ortiz等人,2003,Plant Celll5:1749-1770)。虽然 bHLH 结构域进化上保守(Atchley 和 Fitch,1997,PNAS94:5172-5176),但是不同bHLH家族成员间在该结构域外仅有很少的序列相似性(Morgenstern 和 Atchley, 1999, Mol Biol Evoll6:1654-1663)。[0100]在证明具有结合DNA的能力的这些bHLH蛋白质中,Heim等人(见上文)鉴定的共有bHLH结构域序列的第5、9和13位处的氨基酸是最关键的。对于非植物bHLH蛋白质而言,显示,第5位的His (H)残基、第9位的Glu(E)残基和第13位的Arg (R)残基(全部都在碱性区域内)对于DNA结合来说是关键的(Brownlie等人,1997, Structure5, 509-520 ;Atchley 等人,1999, J Mol Evol48, 501-516 ;Ledent 和 Vervoort, 2001, Genome Resll,754-770)。但是,一些植物蛋白质具有H-E-R构型变化。例如,根据Heim等人(见上文),拟南芥属基因At4g00120 (对应于SEQ ID NO:9代表的拟南芥属IND基因)编码的bHLH结构域的5-9-13基序分别由氨基酸残基Gln (Q)、Ala (A)和Arg (R)(分别对应于SEQ ID NO:10的第123、127和131位)构成(Heim等人(见上文)的图4)。具有H-E-R构型的变异的此类植物蛋白质可还在碱性区域含有破坏螺旋的脯氨酸,例如,VIII和X组的成员,特征在于可干扰对DNA的亲和性。这些变异使得这些蛋白质可作为负面调控子(保留了与其他bHLH蛋白质二聚化的能力但是缺乏结合DNA的能力)发挥作用。虽然5_9_13基序对DNA结合来说是重要的,但是DNA主链与第10和12位上的碱性残基(在共有bHLH结构域序列中都是Arg(R))接触,它们在大多数植物蛋白质中也是保守的(对应于SEQ ID N0:10的第128 和 130 位)。
[0101]此外,Heim等人(见上文)描述了螺旋I的第16、20、23、27位(对应于SEQ IDN0:10 的第 134、138、141、145 位)和螺旋 2 的第 36、39、43、49、53 和 56 位(对应于 SEQ IDNO:10的第154、157、161、167、171、174位)的高度保守的疏水残基,例如,螺旋I结构域中第23位的亮氨酸残基(对应于SEQ ID NO:10的第141位)和螺旋2中位于螺旋一侧的保守疏水残基,对于二聚体形成的二聚化或稳定来说是必要的。
[0102]最后,Heim等人(见上文;图4)显示了 DNA结合结构域之外的保守氨基酸序列,其中一些被认为作为活化结构域发挥作用,或者对于与转录复合体的其它组件的相互作用来说是重要的,或者是信号转导链的靶。
[0103]表1IND蛋白质-氨基酸(AA)区域和位置
[0104]
【权利要求】
1.在两个基因座包含至少两个IND基因的芸苔属植物细胞,或其细胞、部分、种子或后代,其特征在于其在其基因组中包含三个突变IND等位基因,其中所述突变IND等位基因选自: a.由SEQID NO:1或SEQ ID NO:5的序列组成的核酸分子,或核酸,其编码由SEQ IDNO:2的序列组成的氨基酸序列,编码下述蛋白质,其在H2结构域的保守Leu残基之前的位置上的氨基酸被取代为终止密码子; b.由SEQID NO:1或SEQ ID NO:5的序列组成的核酸分子,或核酸,其编码由SEQ IDNO:2的序列组成的氨基酸序列,编码下述蛋白质,其在对应于SEQ ID NO:2的第114,115,122,126,127,129,130,133,134,137,140,141,144,149,152,153,155,156,159,160,162,163,166,170,或173位的位置上的保守氨基酸被取代,以及 c.由SEQID NO:3或SEQ ID NO:7的序列组成的核酸分子,或核酸,其编码由SEQ IDNO:4的序列组成的氨基酸序列,编码下述蛋白质,其在H2结构域的保守Leu残基之前的位置上的氨基酸被取代为终止密码子。
2.根据权利要求1的突变等位基因,其中所述三个突变等位基因选自: a.由SEQID NO:1或SEQ ID NO:5的序列组成的核酸分子,或核酸,其编码由SEQ IDNO:2的序列组成的氨基酸序列,编码下述蛋白质,其在对应于SEQ ID NO:2的第112位的氨基酸密码子被取代为终止密码子; b.由SEQID NO:1或SEQ ID NO:5的序列组成的核酸分子,或核酸,其编码由SEQ IDNO:2的序列组成的氨基酸序列,编码下述蛋白质,其在对应于SEQ ID NO:2的第103和127位的位置上的ASP和ARG密码子被取代为ASN和HIS密码子; c.由SEQID NO:3或SEQ ID NO:7的序列组成的核酸分子,或核酸,其编码由SEQ IDNO:4的序列组成的氨基酸序列,编码下述蛋白质,其对应于SEQ ID NO:2的第50位的氨基酸密码子被取代为终止密码子,以及 d.由SEQID NO:3的序列或SEQ ID NO:7的序列组成的核酸分子,或核酸,其编码由SEQ ID NO:4的序列组成的氨基酸序列,编码下述蛋白质,其对应于SEQ ID NO:4的第135位的氨基酸密码子被取代为终止密码子。
3.权利要求2的芸苔属植物细胞,其是从保藏在ATCC的登录号为PTA-8796的种子或从保藏在ATCC的登录号为PTA-8795的种子可获得的。
4.降低包含至少两个IND基因的芸苔属植物的种子落粒的方法,包括在所述芸苔属植物的基因组中组合三个完全敲除的突变纯合IND等位基因,其中所述完全敲除的突变等位基因选自权利要求1或2所描述的突变等位基因。
5.增加包含至少两个IND基因的芸苔属植物的种子产量的方法,所述方法包括在所述芸苔属植物的基因组中组合三个完全敲除的突变纯合IND等位基因,其中所述完全敲除的突变等位基因选自权利要求1或2所述的突变等位基因。
6.在其基因组中在两个基因座包含至少两个IND基因的芸苔属植物用于育种具有增加的种子产量的植物的用途,其特征在于所述两个IND基因的三个IND等位基因是如权利要求I或2所述的突变等位基因。
7.在其基因组中在两个基因座包含至少两个IND基因的芸苔属植物用于获得具有改善的果实开裂性质的植物的用途,其特征在于所述两个IND基因的三个IND等位基因是如权利要求1或2所述的突变等位基因。
8.在其基因组中在两个基因座包含至少两个IND基因的芸苔属植物用于获得具有改善的落粒抗性的种子荚果的用途,其特征在于所述两个IND基因的三个IND等位基因是如权利要求1或2所述的突变等位基因。
9.从保藏在ATCC的登录号为PTA-8796的种子或从保藏在ATCC的保藏号为PTA-8795的种子可获得的植物用于获得 具有改善的果实开裂性质的植物或用于获得具有改善的落粒抗性的种子荚果的用途,所述植物在其基因组在两个基因座包含三个IND基因,其特征在于所述两个IND基因的三个IND等位基因是如权利要求2所述的突变等位基因。
10.从在其基因组中在两个基因座包含至少两个IND基因的芸苔属植物可获得的种子荚果用于栽种和生长来自所述植物的后代的用途,其特征在于所述两个IND基因的三个IND等位基因是如权利要求1或2所述的突变等位基因。
11.根据权利要求1或2所述的突变等位基因用于在芸苔属植物中增加荚果的落粒抗性的用途。
【文档编号】A01H5/00GK103898042SQ201410093702
【公开日】2014年7月2日 申请日期:2008年11月25日 优先权日:2007年11月28日
【发明者】B·拉加, B·登博尔, B·朗伯特 申请人:拜尔作物科学公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1