鉴定、选择和产生抗白叶枯病水稻的方法与流程

文档序号:23065911发布日期:2020-11-25 17:51阅读:172来源:国知局
鉴定、选择和产生抗白叶枯病水稻的方法与流程
本领域涉及植物育种以及鉴定和选择对白叶枯病具有抗性的植物的方法。提供了编码蛋白质的新基因,其提供了植物对白叶枯病的抗性。这些蛋白质可用于转基因或遗传修饰的抗白叶枯病植物的产生。相关申请的交叉引用本申请要求于2018年4月18日提交的美国临时申请号62/659,164的权益,该临时申请通过引用以其全文并入本文。以电子方式递交的序列表的引用该序列表的官方副本经由efs-web作为ascii格式的序列表以电子方式提交,文件名为“7454_seqlist.txt”,创建于2018年1月24日,具有26.2千字节大小,并与本说明书同时提交。包含在所述ascii格式的文件中的序列表是本说明书的一部分并且通过引用以其整体并入本文。
背景技术
:水稻白叶枯病(blb)由水稻白叶枯病菌(xanthomonasoryzae)引起的影响水稻作物并导致产量损失的一种显著疾病。然而,在严重的侵染下,它可能引起作物完全歉收。化学控制措施无效,植物自然防御系统是控制这种疾病的一种选择。blb是水稻中被探索最多的疾病之一,并且已知抗性基因超过40个,其中若干个已被克隆和表征。针对这些基因中的大多数在水稻中鉴定了不同的宿主植物抗性机制。在已知的抗blb基因中,xa21、xa5和xa13基因被认为是整个菌株谱中的有效基因。然而,最近的研究表明,新的blb菌株的存在/进化可以破坏或与blb抗性基因相容地作用,从而引起易感性。很少有化学物质(如铜化合物和抗生素)可用于抵抗blb疾病,但它们的较不有效,并且对于大规模农田也不可行。宿主植物抗性被证明是控制该疾病的最佳选择。如果可以将负责抗性的基因并入优良、高产种质中而不降低产量,则使用携带抗性的基因来源或转基因来源的水稻品系更具实用性。通过使用与白叶枯病抗性性状相关联的分子标记进行选择,允许仅基于后代的基因组成的选择。结果是,植物育种可以更迅速地发生,从而产生商业上可接受的稻植物。因此,令人希望的是提供用于鉴定和选择具有新赋予的或增强的白叶枯病抗性的水稻植物的组合物和方法。可在育种程序中使用这些植物,以便产生高产杂交种。技术实现要素:本文提供了在鉴定和选择具有白叶枯病(blb)抗性的水稻植物中有用的组合物和方法。这些方法使用标记来鉴定和/或选择抗性植物或者来鉴定和/或反向选择易感植物。本文还提供了相对于对照植物具有新赋予的或增强的blb抗性的水稻植物。在一个实施例中,提出了用于鉴定和/或选择对blb具有抗性的水稻植物的方法。在这些方法中,分析水稻植物的dna中7号染色体上是否存在与blb抗性相关联的抗性基因等位基因,其中所述抗性基因等位基因包含:在r1091-7-06处的“g”(参考序列seqidno:10)、在r1091-7-021处的“g”(参考序列seqidno:11)、在r1091-7-022处的“c”(参考序列seqidno:12)、在r1091-7-027处的“g”(参考序列seqidno:13)、在r1091-7-028处的“g”(参考序列seqidno:14)、在r1091-7-026处的“g”(参考序列seqidno:15)、在r1091-7-042处的“t”(参考序列seqidno:16)、在r1091-7-037处的“a”(参考序列seqidno:17)、在r1091-7-030处的“c”(参考序列seqidno:18)、在r1091-7-018处的“g”(参考序列seqidno:19)、在r1091-7-053处的“g”(参考序列seqidno:20)、在r1091-7-052处的“c”(参考序列seqidno:21)、在r1091-7-040处的“g”(参考序列seqidno:22)、在r1091-7-044处的“t”(参考序列seqidno:23)、在r1091-7-039处的“a”(参考序列seqidno:24)、在r1091-7-024处的“c”(参考序列seqidno:25)、和在r1091-7-007处的“g”(参考序列seqidno:26);并且如果检测到所述抗性基因等位基因,则将水稻植物鉴定和/或选择为具有blb抗性。在另一个实施例中,鉴定和/或选择对blb具有抗性的水稻植物包含检测侧接标记r1091-7-06和r1091-7-007之间是否存在染色体区间。在另一个实施例中,鉴定和/或选择对blb具有抗性的水稻植株包含检测在blb4抗性基因的编码序列中的r1091-7-042处(参考序列seqidno:16)是否存在“t”。可以将选择的水稻植物与第二水稻植物杂交,以获得具有所述抗性基因等位基因的子代植物。在一些实施方案中,用于鉴定和/或选择对blb具有抗性的水稻植物的方法包括检测或选择包含seqidno:1的基因组区域。相对于不具有所述有利的等位基因的对照植物,所述blb抗性可以是新赋予的或增强的。可以将抗性基因等位基因进一步精制至由r1091-7-06和r1091-7-007的标记定义并包括r1091-7-06和r1091-7-007的标记的染色体区间。所述分析步骤可以通过如下方式进行:分离核酸并检测与所述抗性基因等位基因连锁且相关联的一个或多个标记等位基因。在另一个实施例中,blb抗性区域包含编码blb4多肽的基因,该多肽赋予或增强对水稻白叶枯病菌或blb的抗性。在一些实施例中,blb4多肽包含如seqidno:3中所示的氨基酸序列。在另一个实施例中,提供了鉴定和/或选择具有blb抗性的植物的方法,其中一个或多个标记等位基因与以下任一种连锁并相关联:在植物中检测在r1091-7-06处的“g”、在r1091-7-021处的“g”、在r1091-7-022处的“c”、在r1091-7-027处的“g”、在r1091-7-028处的“g”、在r1091-7-026处的“g”、在r1091-7-42处的“t”、在r1091-7-037处的“a”、在r1091-7-030处的“c”、在r1091-7-018处的“g”、在r1091-7-053处的“g”、在r1091-7-052处的“c”、在r1091-7-040处的“g”、在r1091-7-044处的“t”、在r1091-7-039处的“a”、在r1091-7-024处的“c”和在r1091-7-007处的“g”,并选择具有一个或多个标记等位基因的植物。所述一个或多个标记等位基因可以在基于单次减数分裂的遗传图谱上以10cm、9cm、8cm、7cm、6cm、5cm、4cm、3cm、2cm、1cm、0.9cm、0.8cm、0.7cm、0.6cm、0.5cm、0.4cm、0.3cm、0.2cm或0.1cm或更少连锁。可以将选择的植物与第二植物杂交,以获得如下后代植物,所述后代植物具有与以下中任一项连锁且相关联的一个或多个标记等位基因:在r1091-7-06处的“g”、在r1091-7-021处的“g”、在r1091-7-022处的“c”、在r1091-7-027处的“g”、在r1091-7-028处的“g”、在r1091-7-026处的“g”、在r1091-7-42处的“t”、在r1091-7-037处的“a”、在r1091-7-030处的“c”、在r1091-7-018处的“g”、在r1091-7-053处的“g”、在r1091-7-052处的“c”、在r1091-7-040处的“g”、在r1091-7-044处的“t”、在r1091-7-039处的“a”、在r1091-7-024处的“c”和在r1091-7-007处的“g”。在另一个实施例中,本文中提出了渗入与blb抗性相关联的基因等位基因的方法。在这些方法中,用一个或多个标记筛选水稻植物群体以确定是否这些水稻植物中的任一株均具有与blb抗性相关联的基因等位基因,并且从所述群体中选择至少一株具有与blb抗性相关联的基因等位基因的水稻植物。所述基因等位基因包含在r1091-7-06处的“g”、在r1091-7-021处的“g”、在r1091-7-022处的“c”、在r1091-7-027处的“g”、在r1091-7-028处的“g”、在r1091-7-026处的“g”、在r1091-7-42处的“t”、在r1091-7-037处的“a”、在r1091-7-030处的“c”、在r1091-7-018处的“g”、在r1091-7-053处的“g”、在r1091-7-052处的“c”、在r1091-7-040处的“g”、在r1091-7-044处的“t”、在r1091-7-039处的“a”、在r1091-7-024处的“c”和在r1091-7-007处的“g”。在一些实施例中,blb抗性基因从抗性品系渗入易感品系可以通过标记辅助性状基因渗入、转基因或基因组编辑方法来实现。实施例包括分离的多核苷酸,所述多核苷酸包含编码能够赋予对blb抗性的blb4多肽的核苷酸序列,其中所述blb4多肽具有与seqidno:3相比时至少50%、至少75%、至少80%、至少85%、至少90%、和至少95%同一性的氨基酸序列。在另一个实施例中,分离的多核苷酸包含启动子区和编码能够赋予对blb抗性的blb4多肽的核苷酸序列,其中所述blb4多肽具有与seqidno:3相比时至少50%、至少75%、至少80%、至少85%、至少90%、至少95%同一性的氨基酸序列,并且其中所述启动子区具有与seqidno:4相比时至少50%、至少75%、至少80%、至少85%、至少90%和至少95%同一性的氨基酸序列。本公开的另外的实施例包括包含本公开的多核苷酸,例如seqidno:2的载体,或包含与至少一个调节序列可操作地连接的本文公开的多核苷酸的重组dna构建体。还呈现了各自包含本文公开的实施例的重组dna构建体的植物细胞以及植物,和包含重组dna构建体的种子。本公开呈现的方法涉及1)用于转化包括植物细胞在内的宿主细胞的方法,所述方法包括用本公开的实施例的多核苷酸转化宿主细胞,2)用于产生植物的方法,所述方法包括用本公开的实施例的重组dna构建体转化植物细胞并从经转化的植物细胞再生植物,以及3)赋予或增强对blb抗性的方法,所述方法包括用本文所公开的重组dna构建体转化植物,从而赋予和/或增强对水稻白叶枯病菌或blb的抗性。还呈现了改变能够赋予植物或植物细胞对水稻白叶枯病菌或blb抗性的蛋白质表达水平的方法,所述方法包括(a)用本文公开的重组dna构建体转化植物细胞,以及(b)在合适表达所述重组dna构建体的条件下培养经转化的植物细胞,其中所述重组dna构建体的表达导致能够在经转化的宿主中赋予对水稻白叶枯病菌或blb抗性的蛋白质的改变的水平的产生。还提供了使用上述方法中的任一种所鉴定和/或选择的水稻植物。附图说明图1显示了(a)4.7kb的构建体,其含有blb4(1.19kb)和来自pra1091(含有用于过度表达的推定的启动子和500bp的推定的终止子区)的3.0kb基因组区域,以及(b)选择的靶位点,以在具有cca作为pam位点的tata盒中创建靶向突变,并且预测的切割位点已加下划线。具体实施方式如本文使用的,单数形式“一个/种(a/an)”以及“所述(the)”包括复数个指示物,除非上下文中另有明确指明。因此,例如,提及“细胞”包括多个此类细胞,并且提及“蛋白质”包括提及一种或多种蛋白及其等同物,等等。本文所用的所有技术和科学术语具有与本公开所属领域的普通技术人员通常所理解相同的含义,除非另有明确说明。当等位基因是影响性状表达的dna序列或等位基因的一部分或与其连锁时,该等位基因与该性状“相关”。所述等位基因的存在是所述性状将如何表达的指标。如本文所使用的,术语“染色体区间”是指存在于植物单一染色体上的基因组dna的连续线性跨度。位于单条染色体区间上的遗传元件或基因是物理连锁的。染色体区间的大小没有特别的限制。在一些方面,位于单条染色体区间内的遗传元件是遗传连锁的,通常具有例如小于或等于20cm,或者可替代地,小于或等于10cm的遗传重组距离。也就是说,单条染色体区间内的两个遗传元件以小于或等于20%或10%的频率进行重组。在本申请中,短语“紧密连锁”是指两个连锁的基因座之间的重组以等于或小于约10%(即,在遗传图谱上分隔不超过10cm)的频率发生。换言之,该紧密连锁的基因座有至少90%的机会发生共分离。当标记基因座显示与所需的性状(例如,对白叶枯病的抗性)发生共分离(连锁)的显著概率时,所述标记基因座对于本公开内容的主题是特别有用的。紧密连锁的基因座(例如标记基因座和第二基因座)可以显示10%或更低、优选约9%或更低、还更优选约8%或更低、又更优选约7%或更低、还更优选约6%或更低、又更优选约5%或更低、还更优选约4%或更低、又更优选约3%或更低、以及还更优选约2%或更低的基因座间重组频率。在非常优选的实施例中,相关基因座显示约1%或更低,例如约0.75%或更低、更优选约0.5%或更低、或又更优选约0.25%或更低的重组频率。定位于相同染色体并且具有使得两个基因座之间的重组以小于10%(例如,约9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%或更少)的频率发生的距离的所述两个基因座也被认为是彼此“邻近的”。在某些情况下,两个不同的标记可以具有相同的遗传图谱坐标。在这种情况下,所述两个标记彼此非常邻近,以至于二者之间的重组以不可检测的这种低频发生。当提及两个遗传元件(例如有助于blb抗性的遗传元件和近端标记)之间的关系时,“偶联”相连锁(“coupling”phaselinkage)指示下述状态:其中blb抗性基因座处的“有利”等位基因在与相应的连锁标记基因座的“有利”等位基因相同的染色体链上是物理上相关联的。在偶联阶段,两个有利的等位基因由继承该染色体链的后代一起继承。术语“杂交的”或“杂交”是指有性杂交,并且涉及通过授粉将两种单倍体配子融合以产生二倍体后代(例如细胞、种子或植物)。该术语涵盖一株植物被另一株植物授粉和自交(或自体授粉,例如当花粉和胚珠来自同一植物时)二者。通过使单倍体染色体组(即,染色体的正常数量的一半)加倍来开发本文中称为“双单倍体”的植物。双单倍体植物具有两组相同的染色体,并且所有基因座都被认为是纯合的。“良种系”是针对优良农艺性状表现的育种而产生的任何品系。“外来水稻品种”或“外来水稻种质”是衍生自不属于可利用的优良水稻品系或种质品种的水稻植物的品种。在两个水稻植物或种质品种之间杂交的情况下,外来种质的后代与它杂交的优良种质不是密切相关的。最普遍的是,所述外来种质不是衍生自任何已知的优良水稻品系,而是被选择用来将新的遗传元件(通常是新的等位基因)引入育种程序中。“有利的等位基因”是特定基因座的等位基因(标记、qtl、基因等),所述等位基因赋予或有助于农学上所需的表型(例如blb抗性),并且允许鉴定具有该农学上所需表型的植物。标记的有利等位基因是与所述有利表型分离的标记等位基因。“遗传标记”是在群体中多态的核酸,并且所述遗传标记的等位基因可以通过一种或多种分析方法(例如rflp、aflp、同工酶、snp、ssr等)来检测和区分。该术语还指与用作探针的基因组序列(例如核酸)互补的核酸序列。可以通过本领域中公认的方法检测对应于群体成员之间的遗传多态性的标记。这些方法包括,例如基于pcr的序列特异性扩增方法、限制性片段长度多态性检测(rflp)、同功酶标记检测、通过等位基因特异性杂交(ash)进行的多核苷酸多态性检测、植物基因组的扩增可变序列检测、自主序列复制检测、简单重复序列检测(ssr)、单核苷酸多态性检测(snp)、或扩增片段长度多态性检测(aflp)。已知公认的方法也用于检测表达的序列标签(est)和衍生自est序列的ssr标记,以及随机扩增多态性dna(rapd)。“种质”是指遗传物质,其属于或来自于个体(例如,植株)、个体的组(例如,植物品系、品种或家族)或者来自品系、品种、物种或培养物的克隆,或者更概括地,某一物种或多个物种的全部个体(例如,水稻种质集合(ricegermplasmcollection)或andean种质集合(andeangermplasmcollection))。所述种质可以是生物体或细胞的一部分,或者可以分离自所述生物体或细胞。一般而言,种质提供了具有特定的分子构成的遗传物质,所述特定的分子构成为生物体或细胞培养物的某些或全部遗传品质提供物理基础。如本文所使用的,种质包括由此可以生长出新植物的细胞、种子或组织,或者可以培养成完整植物的植物部分,例如叶、茎、花粉或细胞。“单倍型”是个体在多个遗传基因座处的基因型,即等位基因的组合。典型地,由单倍型描述的遗传基因座在物理和遗传上是连锁的,即在同一染色体区段上。术语“异质性”用于指示所述群组内的个体在一个或多个特定基因座处的基因型不同。材料的杂种优势应答或“杂种优势”可以通过当与其他不相似或不相关的群组杂交时超过亲本(或高亲本(highparent))的平均值的表现来定义。“杂种优势组”包括一组当与来自不同的杂种优势组的基因型杂交时表现良好的基因型(hallauer等人,(1998)cornbreeding[玉米育种],第463-564页,g.f.sprague和j.w.dudley编辑,cornandcornimprovement[玉米和玉米的改良])。近交系分为杂交体优势组,并根据几个标准(如谱系、基于分子标记的关联和杂交体组合中的表现)进一步细分为杂交体优势组中的家族(smith等人,(1990)theor.appl.gen.[理论与应用遗传学]80:833-840)。在美国,两个应用最广泛的杂种优势群组称为“爱荷华刚性茎秆合成群(iowastiffstalksynthetic)”(本文中也称为“刚性茎杆”)和“兰卡斯特(lancaster)”或“兰卡斯特修尔作物(lancastersurecrop)”(有时称为nss或非刚性茎杆)。有些杂种优势群组具备成为母本所需的性状,并且另一些具备成为父本所需的性状。例如,在玉蜀黍中,来自称为bsss(爱荷华刚性茎秆合成群体)的群体释放的公开近交系的产量结果导致这些近交系及其衍生物成为中部玉米带中的雌性库。bsss近交系已经与其他近交系(例如,sd105和玉蜀黍阿曼巴(maizamargo))杂交,而这个材料的一般组已经以刚性茎秆合成(stiffstalksynthetics,sss)闻名,即使并非所有的近交系都来源于原始的bsss群体(mikel和dudley,(2006)cropsci[作物科学]:46:1193-1205)。默认情况下,所有与所述sss近交系良好结合的其他近交系被分配到雄性库,因缺乏更好的名称而被命名为nss,即非刚性茎秆。这个群组包括几个主要的杂种优势群组,例如兰卡斯特修尔作物(lancastersurecrop)、艾顿(iodent)和利明玉米(leamingcorn)。术语“同质性”表示群组的成员在一个或多个特定基因座处具有相同的基因型。术语“杂交体”是指在至少两个遗传上不同的亲本的杂交之间获得的后代。术语“近交系”是指已经进行育种以获得遗传同质性的品系。术语“插入缺失(indel)”是指插入或缺失,其中一个品系可以称为相对于第二品系具有插入的核苷酸或dna碎片,或所述第二品系可以称为相对于所述第一品系具有缺失的核苷酸或dna碎片。术语“渗入”是指遗传基因座的期望等位基因从一种遗传背景传递到另一种遗传背景的现象。例如,可以经由相同物种的两个亲本之间的有性杂交将指定基因座处的所需等位基因的渗入传递给至少一个子代,其中所述亲本中的至少一个在其基因组内具有所述所需的等位基因。可替代地,例如等位基因的传递可以通过两个供体基因组之间的重组而发生,例如在融合原生质体中,其中至少其中一个供体原生质体在其基因组中具有所希望的等位基因。所需的等位基因可以,例如通过与表型相关联的标记,在qtl、转基因等处进行检测。在任何情况下,包含所述所需等位基因的后代可以反复与具有所需遗传背景的品系回交并选择所需等位基因,以产生固定在选择的遗传背景中的等位基因。当“渗入”重复两次或更多次时,该方法通常被称为“回交”。“品系”或“品种”是一组具有相同亲本的个体,其通常在一定程度上是近交的,并且在大多数基因座处通常是纯合和同质的(同基因的或接近同基因的)。“亚系”是指遗传上不同于起源于相同祖先的其他类似近交系亚群的近交系亚群。如本文所使用的,术语“连锁”用于描述一种标记基因座与另一种标记基因座或一些其他基因座的相关联程度。分子标记与影响表型的基因座之间的连锁关系以“概率”或“调整的概率”表示。连锁可以表示为所需的限制或范围。例如,在一些实施例中,当任何标记与任何其他标记在单次减数分裂图谱(基于已经进行一轮减数分裂的群体(例如,f2)的遗传图谱;ibm2图谱由多次减数分裂组成)上分隔小于50、40、30、25、20或15个图距单位(或cm)时,所述标记是连锁的(遗传上或物理上)。在一些方面,限定加括号的连锁范围是有利的,例如,在10cm和20cm之间、在10cm和30cm之间、或在10cm和40cm之间。标记与第二基因座的连锁越紧密,标记对第二基因座的指示效果越好。因此,“紧密连锁的基因座”,例如标记基因座和第二基因座显示10%或更低、优选约9%或更低、还更优选约8%或更低、又更优选约7%或更低、还更优选约6%或更低、又更优选约5%或更低、还更优选约4%或更低、又更优选约3%或更低、以及还更优选约2%或更低的基因座间重组频率。在非常优选的实施例中,相关基因座显示约1%或更低,例如约0.75%或更低、更优选约0.5%或更低、或又更优选约0.25%或更低的重组频率。定位于相同染色体并且具有使得两个基因座之间的重组以小于10%(例如,约9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%或更少)的频率发生的距离的所述两个基因座也被认为是彼此“邻近”。因为一个cm是显示1%的重组频率的两个标记之间的距离,因此任何标记与紧密相邻(例如,以等于或小于10cm的距离)的任何其他标记紧密连锁(遗传上和物理上)。在相同染色体上的两个紧密连锁的标记可相互定位为9、8、7、6、5、4、3、2、1、0.75、0.5或0.25cm或更近。术语“连锁不平衡”是指遗传基因座或性状(或两者)的非随机分离。在任一情况下,连锁不平衡意味着相关的基因座沿着一段染色体在物理上足够接近,以便它们以高于随机(即非随机)的频率一起分离。显示连锁不平衡的标记被认为是连锁的。连锁的基因座有超过50%的机会(例如约51%至约100%的机会)发生共分离。换句话说,共分离的两个标记具有小于50%(并且根据定义,在相同连锁群上分隔小于50cm)的重组频率。如本文所使用的,连锁可以存在于两个标记之间,或可替代地,标记和影响表型的基因座之间。标记基因座可以与性状“相关联”(连锁)。标记基因座和影响表型性状的基因座的连锁程度例如通过该分子标记与所述表型共分离的统计学概率(例如,f统计或lod评分)进行测量。连锁不平衡最常见地用量度r2评估,所述量度r2使用以下文献中的公式计算:hill,w.g.和robertson,a,theor.appl.genet.[理论和应用遗传学]38:226-231(1968)。当r2=1时,两个标记基因座间存在完全的ld,意味着所述标记还未进行重组分离并且具有相同的等位基因频率。所述r2值依赖于所使用的群体。r2值大于1/3显示了用于定位的足够强的ld(ardlie等人,naturereviewsgenetics[遗传学自然评论]3:299-309(2002))。因此,当成对标记基因座间的r2值大于或等于0.33、0.4、0.5、0.6、0.7、0.8、0.9、或1.0时,等位基因处于连锁不平衡。如本文所使用的,“连锁平衡”描述其中两个标记独立地分离的情况,即,在后代中随机分配。显示连锁平衡的标记被认为是不连锁的(无论它们是否位于相同染色体上)。“基因座”是在染色体上的位置,例如,核苷酸、基因、序列或标记所处的位置。“优势对数(lod)值”或“lod评分”(risch,science[科学]255:803-804(1992))用于遗传区间定位以描述两个标记基因座之间的连锁程度。两个标记间lod评分为三指示连锁概率比无连锁的概率高1000倍,而lod评分为二指示连锁概率比无连锁的概率高100倍。大于或等于二的lod评分可以用于检测连锁。lod评分还可以用于在“数量性状基因座”作图中显示标记基因座和数量性状之间的关联强度。在这一情况下,lod评分大小取决于所述标记基因座与影响所述数量性状的基因座之间的紧密度,以及所述数量性状效应的大小。“水稻”是指稻(oryzasattva)的植物。术语“水稻植物”包括整个水稻植株、水稻植物细胞、水稻植物原生质体、可从其中再生水稻植株的水稻植物细胞或水稻组织培养物、水稻植物愈伤组织、水稻植物丛生物和水稻植物中的完整水稻植物细胞或水稻植物部分,如水稻种子、水稻花、水稻子叶、水稻叶、水稻茎、水稻芽、水稻根、水稻根尖等。“标记”是发现遗传或物理图谱上的位置或发现标记与性状基因座(影响性状的基因座)之间的连锁的方式。标记所检测的位置可通过检测多态性等位基因及其遗传定位而获知,或通过对已经进行物理标测的序列进行杂交、序列匹配或扩增而获知。标记可以是dna标记(检测dna多态性)、蛋白质(检测编码的多肽的变异)或简单遗传的表型(诸如“腊质”表型)。可从基因组核苷酸序列或从表达的核苷酸序列(例如,从剪接的rna或cdna)开发dna标记。根据dna标记技术,所述标记由侧接于所述基因座的互补性引物和/或与所述基因座处的多态性等位基因杂交的互补性探针组成。dna标记或遗传标记还可用于描述该染色体自身上的基因、dna序列或核苷酸(而非用于检测该基因或dna序列的组分),并且其通常在该dna标记与人遗传学中的特定性状相关联时使用(例如乳腺癌标记)。术语标记基因座是该标记所检测的基因座(基因、序列或核苷酸)。检测群体成员之间的遗传多态性的标记在本领域中是公认的。标记可由其所检测的多态性的类型以及用于检测所述多态性的标记技术所定义。标记类型包括但不限于:限制性片段长度多态性检测(rflp)、同功酶标记检测、随机扩增的多态性dna(rapd)、扩增片段长度多态性检测(aflp)、简单重复序列检测(ssr)、植物基因组的扩增可变序列检测、自主序列复制检测、或单核苷酸多态性检测(snp)。snp可通过,例如,通过dna测序、基于pcr的序列特异性扩增方法、通过等位基因特异性杂交(ash)进行的多核苷酸多态性检测、动态等位基因特异性杂交(dash)、分子信标、微阵列杂交、寡核苷酸连接酶分析、flap核酸内切酶、5’核酸内切酶、引物延伸、单链构象多态性(sscp)或温度梯度凝胶电泳(tgge)进行检测。dna测序(诸如焦磷酸测序技术)具有能够检测组成单倍型的一系列连锁snp等位基因的优点。单倍型倾向于比snp更具信息性(检测更高水平的多态性)。“标记等位基因”,可替代地“标记基因座的等位基因”可以指群体中标记基因座处发现的多个多态性核苷酸序列中之一。“标记辅助选择”(mas)是基于标记基因型选择个体植物的方法。“标记辅助反选择”是借以使用标记基因型鉴定将不被选择的植物的方法,使得所述植物从育种程序或种植中去除。“标记单倍型”是指标记基因座处的等位基因的组合。“标记基因座”是物种基因组中的特定染色体定位,在该定位处可发现特异标记。标记基因座可用于追踪第二连锁基因座(例如影响表型性状表达的连锁基因座)的存在。例如,标记基因座能够用于监控在遗传上或物理上连锁的基因座处的等位基因的分离。如上所述,当鉴定连锁基因座时,术语“分子标记”可以用于指遗传标记,或其用作参照点的编码产物(例如,蛋白质)。标记能够来源于基因组核苷酸序列或来源于表达的核苷酸序列(例如来源于剪接的rna、cdna等),或来源于编码的多肽。该术语也指与标记序列互补或与其侧接的核酸序列,如用作探针或能够扩增所述标记序列的引物对的核酸。“分子标记探针”是可以用于鉴定标记基因座存在与否的核酸序列或分子,例如与标记基因座序列互补的核酸探针。可替代地,在某些方面,标记探针是指能够区别存在于标记基因座处的特定等位基因的任何类型(即基因型)的探针。当核酸在溶液中特异性杂交时,它们是“互补的”。当位于插入缺失区域,例如本文所述的非共线区域时,本文所述标记中的一些也称为杂交标记。这是因为,根据定义,所述插入区域是关于无所述插入的植物的多态性。因此,该标记仅需要指示所述插入缺失区域是否存在。任何合适的标记检测技术都可以用于鉴定此类杂交标记,例如在本文提供的实例中使用snp技术。当等位基因与性状连锁时,以及当等位基因的存在是所需性状或性状形式将不出现在包含所述等位基因的植物中的指示时,所述等位基因与所述性状“负”相关。术语“表型”、“表型性状”或“性状”可以指基因或基因系列的可观测表达。表型对于肉眼、或通过本领域已知的任何其他评估方式(例如称重、计数、测量(长度、宽度、角度等)、显微法、生化分析或机电测定)可以是可观测的。在某些情况下,表型直接受控于单个基因或遗传基因座,即,“单基因性状”或“简单遗传性状”。在缺少大水平环境变化的情况下,单基因性状可以在群体中分离,以给出“质量”或“离散”分布,即,所述表型归于离散的类别。在其他情况下,表型是多种基因的结果并且可以被认为是“多基因性状”或“复杂性状”。多基因性状在群体中分离以给出“数量”或“连续”分布,即,所述表型不能分离成离散的类别。单基因性状和多基因性状均可受到其表达所处的环境的影响,但是多基因性状倾向于具有更大的环境组分。基因组的“物理图谱”是显示染色体dna上可鉴定的标志(包括基因、标记等)的线性顺序的图谱。然而,与遗传图谱相比,标志间的距离是绝对的(例如以碱基对或者分离的和重叠的连续基因片段测量)并且不基于基因重组(所述基因重组可在不同的群体中有所变化)。“多态性”是群体内2个或更多个个体之间的dna中的变异。多态性在群体中优选地具有至少1%的频率。有用的多态性可以包括单核苷酸多态性(snp)、简单重复序列(ssr)、或插入/缺失多态性(本文中也称为“插入缺失”)。“生产标记”或“生产snp标记”是已经为高通量目的而开发的标记。生产snp标记被开发用于检测特异性多态性,并且被设计与多种化学反应和平台一起使用。本文所使用的标记名称,以前缀phm开始以表示“先锋良种标记(pioneerhi-bredmarker)”,然后是针对标记由此被设计的序列的数字,之后是“.”或“-”,并且然后是针对dna多态性的后缀。标记的版本也能够按照(a、b、c等)表示针对该特异性多态性的标记的版本的方式。术语“数量性状基因座”或“qtl”是指在至少一种遗传背景下(例如在至少一个育种群体中),与数量表型性状的差异表达关联的dna区域。qtl的区域涵盖或紧密地连锁于影响所考虑的性状的一个或多个基因。“参考序列”或“共有序列”是用作序列比对基础的定义的序列。通过对在该基因座处的多个品系进行测序,在序列比对程序(例如sequencher)中比对这些核苷酸序列并且然后获得所述比对的最通用核苷酸序列来获得phm标记的参考序列。见于这些个体序列中的多态性标注于所述共有序列中。参考序列通常并非任何个体dna序列的精确复制,而是代表可用序列的混合并且用于设计针对该序列内的多态性的引物和探针。在“相斥”相连锁(“repulsion”phaselinkage)中,目的基因座处的“有利”等位基因与邻近的标记基因座处的“不利”等位基因物理上连锁,并且两个“有利”等位基因不被一起继承(即这两个基因座彼此“异相”)。“顶交测试”是通过将各个体(例如,选择物、近交系、克隆或后代个体)与相同的花粉亲本或“测试物(tester)”(通常是纯合品系)杂交而进行的测试。标记的“不利等位基因”是与所述不利植物表型分离的标记等位基因,因此提供了鉴定能从育种程序或种植中移除的植物的益处。术语“产量”指具有商业价值的特定植物产品每单位面积的生产力。产量受遗传和环境因素二者的影响。“农学”、“农艺性状”、和“农艺性状表现”是指给定植物品种的性状(以及潜在遗传元件),所述性状在生长期过程中有助于产量。个体农艺性状包括出苗活力、营养势、胁迫耐受性、疾病抗性或耐受性、除草剂抗性、发生分枝、开花、种子形成、种子大小、种子密度、抗倒伏性、脱粒性等。因此产量是所有农艺性状的最终顶点。本文提供了显示与抗性性状的统计学上显著的共分离的水稻标记基因座和抗性基因blb4,所述水稻标记基因座赋予对白叶枯病(blb)的广泛的抗性。这些基因座或另外的连锁基因座以及抗性基因的检测可以作为水稻育种程序的一部分用于标记辅助选择中,以产生对blb具有抗性的水稻植物。遗传定位已经认识到,在相当一些情况下可在生物体的基因组中定位与特定表型(例如对blb的抗性)相关联的特定遗传基因座。植物育种人员可以有利地使用分子标记通过检测标记等位基因来鉴定所需的个体,所述标记等位基因显示与所需表型共分离的统计学上显著的概率,表现为连锁不平衡。通过鉴定与目的性状共分离的分子标记或分子标记簇,所述植物育种人员能够通过选择合适的分子标记等位基因(称为标记辅助选择或mas的方法)来迅速选择所需表型。本领域中已知的多种方法可用于检测与目的性状(例如blb抗性性状)共分离的分子标记或分子标记簇。这些方法的基本理念是检测具有显著不同平均表型的可替代的基因型(或等位基因)的标记。因此,比较标记基因座之间的可替代的基因型(或等位基因)之间的差异大小或所述差异的显著性水平。推断性状基因位于最靠近具有最大相关性的基因型差异的一个或多个标记的位置。这样两种用于检测目的性状基因座的方法是:1)基于群体的关联分析(即关联定位)和2)传统的连锁分析。关联定位了解基因组中连锁不平衡(ld)的程度和模式是开发有效的、用以鉴定和绘制数量性状基因座(qtl)的关联方法的先决条件。连锁不平衡(ld)是指个体集合中等位基因的非随机关联。当在连锁的基因座处的等位基因中观察到ld时,ld被测量为跨越染色体的特定区域的ld衰减。ld的范围反映了该区域的重组历史。基因组中ld衰减的平均速率可以帮助预测进行全基因组关联研究所需的标记的数量和密度,并提供可预期的分辨率的估计值。关联或ld定位旨在鉴定显著的基因型-表型关联。它已作为在异交如下物种中用于精细定位的强大工具而被开发利用:人类(corder等人,(1994)“protectiveeffectofapolipoprotein-etype-2alleleforlate-onsetalzheimer-disease[载脂蛋白e2型等位基因对迟发型阿尔茨海默病的保护作用]”,natgenet[自然遗传学]7:180-184;hastbacka等人,(1992)“linkagedisequilibriummappinginisolatedfounderpopulations:diastrophicdysplasiainfinland[在孤立的建立者群体中的连锁不平衡绘图:芬兰的畸型发育不良]”,natgenet[自然遗传学]2:204-211;kerem等人,(1989)“identificationofthecysticfibrosisgene:geneticanalysis[鉴定囊性纤维化基因:遗传分析]”,science[科学]245:1073-1080)和玉蜀黍(remington等人,(2001)“structureoflinkagedisequilibriumandphenotypeassociationsinthemaizegenome[玉蜀黍基因组中连锁不平衡和表型关联的结构]”,procnatlacadsciusa[美国科学院院报]98:11479-11484;thornsberry等人,(2001)“dwarf8polymorphismsassociatewithvariationinfloweringtime[矮秆8多态性与开花时间的变化相关联]”,natgenet[自然遗传学]28:286-289;由flint-garcia等人综述,(2003)“structureoflinkagedisequilibriuminplants[植物中连锁不平衡的结构]”,annurevplantbiol.[植物生物学年评]54:357-374),其中杂合子之间的重组频繁并导致ld的快速衰减。在近交物种中,纯合基因型之间的重组不是遗传学上可检测的,ld的程度更大(即,较大的连锁标记块一起遗传)并且这大大提高了关联定位的检测能力(wall和pritchard,(2003)“haplotypeblocksandlinkagedisequilibriuminthehumangenome[人类基因组中的单倍型阻断和连锁不平衡]”,natrevgenet[自然遗传学综述]4:587-597)。群体的重组和突变历史是交配习惯以及群体的有效大小和年龄的函数。较大的群体大小为检测重组提供了增强的可能性,而较老的群体通常与较高水平的多态性相关,这两者都促进可观察到的ld衰退速率的显著增加。另一方面,较小的有效群体大小,例如那些已经经历了最近遗传瓶颈的群体,倾向于表现出较慢的ld衰退速率,导致更广泛的单倍型保守性(flint-garcia等人,(2003)“structureoflinkagedisequilibriuminplants[植物连锁不平衡的结构]”,annurevplantbiol.[植物生物学年评]54:357-374)。优良育种品系为关联分析提供了宝贵的起点。关联分析在该分析中使用定量表型评分(例如,对于每个品系,疾病耐受性等级从一至九)(而不是在分析的组间等位基因分布类型中只考虑耐受性与抗性等位基因频率分布)。多年来通过育种程序收集的详细表型性能数据的可用性和大量优良品系的环境为遗传标记关联定位分析提供了有价值的数据集。这为研究和应用之间的无缝整合铺平了道路,并利用了历史积累的数据集。然而,了解多态性与重组之间的关系对于开发用于从这些资源中有效提取最大信息的适当策略是有用的。这种类型的关联分析既不产生也不需要任何图谱数据,而是独立于图谱位置。这种分析将植物的表型评分与不同基因座处的基因型进行比较。随后,使用先前确定的这些标记的图谱定位,可以任选地使用任何合适的图谱(例如,复合图谱)来帮助观察经鉴定的qtl标记和/或qtl标记簇的分布。传统连锁分析传统的连锁分析基于相同的原理;然而,ld通过从少量建立者创建群体而生成。选择创建者以最大化结构化群体内的多态性水平,并且评估多态性位点与给定表型的共分离水平。已经使用大量统计学方法来鉴定显著的标记-性状关联。一种此类方法是区间定位方法(lander和botstein,genetics[遗传学]121:185-199(1989),其中针对控制目的性状的基因位于该位置的概率来测试沿遗传图谱(比如说以1cm的区间)的许多位置中的每一个位置。基因型/表型数据用于计算每个测试位置的lod评分(概率比率的对数)。当lod评分大于阈值时,存在控制目的性状的基因位于遗传图谱上的该定位处的显著证据(将位于两个特定标记基因座之间)。本文提供了如通过传统的连锁分析和全基因组关联分析确定的、显示与blb抗性性状的统计学上显著的共分离的水稻标记基因座。这些基因座或附加连锁的基因座的检测可以用于标记辅助水稻育种程序,以产生具有白叶枯病抗性的植物。标记辅助水稻育种程序中的活动可能包括,但不限于:根据历史基因型和农艺性状关联在新的育种群体中选择以鉴定哪个群体具有最高的有利核酸序列频率、在育种群体中的子代中选择有利的核酸序列、基于子代性能的预测在亲本品系中进行选择、以及根据有利的核酸序列的存在在种质改良活动中推进品系。染色体区间提供了与blb抗性性状相关联的染色体区间。本领域熟知的多种方法可用于鉴定染色体区间。此类染色体区间的边界扩展到涵盖将与控制目的性状的一个或多个基因连锁的标记。换句话说,扩展染色体区间,这样使得位于区间内的任何标记(包括限定区间的边界的末端标记)可以用作blb疾病抗性性状的标记。表2鉴定了所述7号染色体基因组区域内的标记,本文显示所述标记与blb抗性性状相关联,并与控制blb抗性的一个或多个基因连锁。这些标记中的每个的参考序列由seqidno:10-26表示。相反地,例如如果非常接近的两个标记显示与期望表型性状共分离,则有时分不清楚是否那些标记中的每一个鉴定相同基因或两个不同的基因或多个基因。无论如何,关于在特定物理/基因组区间内有多少个基因的知识对于制定或实践哪个在本公开中呈现是不必要的。7号染色体区间可以涵盖本文所鉴定的与blb抗性性状相关联的标记中的任一个,包括:在r1091-7-06处的“g”、在r1091-7-021处的“g”、在r1091-7-022处的“c”、在r1091-7-027处的“g”、在r1091-7-028处的“g”、在r1091-7-026处的“g”、在r1091-7-42处的“t”、在r1091-7-037处的“a”、在r1091-7-030处的“c”、在r1091-7-018处的“g”、在r1091-7-053处的“g”、在r1091-7-052处的“c”、在r1091-7-040处的“g”、在r1091-7-044处的“t”、在r1091-7-039处的“a”、在r1091-7-024处的“c”和在r1091-7-007处的“g”。例如,7号染色体区间可以由在r1091-7-06和r1091-7-007处的标记所限定,其另外的子区间可以由cds标记r1091-7-42所限定。位于这些区间内的任何标记可以用作blb抗性的标记,并且可以用于本文呈现的方法的上下文中以鉴定和/或选择对blb具有抗性的水稻植物,不管所述抗性与对照植物相比是否是新赋予的或增强的。在某些实施方案中,位于blb4基因位置的上游和下游的标记在遗传上和物理上非常紧密地连锁,因此可以用于选择blb4基因用于性状基因渗入和产品开发。染色体区间也可以由与blb抗性基因连锁的标记(与其表现出连锁不平衡)所限定,并且r2是关联性研究的上下文中连锁不平衡(ld)的常见量度。如果目的区间中的7号染色体标记基因座与另一个紧密相邻的7号染色体标记基因座之间的ld的r2值大于1/3(ardlie等人,naturereviewsgenetics[遗传学自然评论]3:299-309(2002)),则这两个基因座彼此连锁不平衡。标记和连锁关系连锁的常见量度是性状共分离的频率。这可以以共分离百分比(重组频率)表示,或以厘摩(cm)表示。cm是遗传重组频率的量度单位。一个cm等于有1%的机会,一个遗传基因座处的性状会由于单代中的杂交而与另一个基因座处的性状分离(意味着这些性状总共有99%的机会发生分离)。由于染色体距离与性状之间的杂交事件的频率大致成正比,因此存在与重组频率相关联的近似物理距离。标记基因座本身是性状,并且在分离期间能够通过跟踪该标记基因座、根据标准连锁分析对其进行评估。因此,一个cm等于有1%的机会,一个标记基因座会由于单代中的杂交而与另一个基因座分离。标记距离控制目的性状的基因越近,则该标记作为所述所需性状的指示越有效和有利。紧密连锁的基因座显示约10%或更低、优选约9%或更低、还更优选约8%或更低、又更优选约7%或更低、还更优选约6%或更低、又更优选约5%或更低、还更优选约4%或更低、又更优选约3%或更低、以及还更优选约2%或更低的基因座间杂交频率。在高度优选的实施例中,相关基因座(例如标记基因座和靶基因座)显示约1%或更低、例如约0.75%或更低、更优选地约0.5%或更低、或又更优选地约0.25%或更低的重组频率。因此,所述基因座分开距离为约10cm、9cm、8cm、7cm、6cm、5cm、4cm、3cm、2cm、1cm、0.75cm、0.5cm或0.25cm或更低。换言之,定位于相同染色体并且具有使得两个基因座之间的重组以小于10%(例如,约9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%或更少)的频率发生的距离的所述两个基因座被认为是彼此“邻近的”。尽管特定的标记等位基因可以与blb抗性性状共分离,重要的是注意所述标记基因座不一定引起所述blb表型的表达。例如,该标记多核苷酸序列是产生blb抗性表型的基因的一部分(例如,是基因可读框的一部分)不是必需条件。特异标记等位基因与blb抗性性状之间的关联性,是由于在所述等位基因所起源的祖先水稻品系中,所述标记等位基因和所述等位基因之间的初始“偶联”相连锁。最后通过反复重组,所述标记和遗传基因座之间的杂交事件能够改变这种取向。由于这个原因,所述有利的标记等位基因可以根据存在于具有blb疾病抗性的亲本中的用于创建分离群体的连锁相发生改变。这不改变可以使用所述标记来监测表型分离的事实。它仅仅改变在给定分离群体中哪个标记等位基因被认为是有利的。本文提出的方法包括检测植物中与blb抗性相关联的一个或多个标记等位基因的存在,并且然后鉴定和/或选择在那些标记基因座处具有有利等位基因的植物。标记已经在本文中被鉴定为与blb抗性性状相关联,并且因此可以用于预测植物中的blb。表2中任何标记的50cm、40cm、30cm、20cm、15cm、10cm、9cm、8cm、7cm、6cm、5cm、4cm、3cm、2cm、1cm、0.75cm、0.5cm或0.25cm内的任何标记(基于单个减数分裂的遗传图谱)也可以用于预测水稻植物的blb抗性。标记辅助选择分子标记可以用于多种植物育种应用(如参见staub等人,(1996)hortscience[园艺科学]31:729-741;tanksley(1983)plantmolecularbiologyreporter.[植物分子生物学导报]1:3-8)。受关注的主要领域之一是使用标记辅助选择(mas)增加回交和基因渗入的效率。展示出与影响所需表型性状的基因座连锁的分子标记为在植物群体中选择性状提供了有用工具。在表型难以测定的情况下尤其如此。由于dna标记测定比田间表型分析更省力并且占用的物理空间更小,可测定更大的群体,增加了发现具有从供体品系移动至受体品系的靶区段的重组体的概率。连锁越紧密,标记越有用,这是因为重组不太可能发生于所述标记和引起该性状的基因之间,所述重组可导致假阳性。由于需要双重组事件,侧接标记减少了假阳性选择发生的概率。理想情况是基因本身具有标记,使得标记和基因之间的重组不能发生。此类标记称为“完美标记”。当基因通过mas渗入时,不仅引入了基因而且引入了侧接区域(gepts.(2002).cropsci[作物科学];42:1780-1790)。这称为“连锁累赘”。在供体植物与受体植物极不相关的情况下,这些侧接区域携带可以编码农艺学上不需要的性状的另外的基因。即便与优良水稻品系回交多个周期后,该“连锁累赘”也可能导致产量下降或其他负面农艺学特征。这有时也称为“产量累赘”。侧接区域的大小可以通过另外的回交而减小,虽然这并不总是成功的,因为育种人员不能控制该区域或重组断点的大小(young等人,(1998)genetics[遗传学]120:579-585)。在经典育种中,通常只是偶然地,选择了有助于减小供体区段大小的重组(tanksley等人,(1989).biotechnology[生物技术]7:257-264)。即使在20次此类型的回交后,可以预期找到相当大的仍然与所述基因连锁的供体染色体碎片被选择。然而如果使用标记的话,就可能选取那些在受关注的基因附近经历了重组的稀有个体。在150株回交植物中,有95%的机会,至少一株植物将经历该基因的1cm(基于单次减数分裂图距)内的杂交。标记使得能够明确鉴定这些个体。使用300株植物的一次另外的回交,在该基因另一例的1cm单次减数分裂图距内有95%的杂交概率,从而产生在基于单次减数分裂图距的小于2cm的靶基因附近的区段。这用标记可以在两代中实现,而不用标记时则需要平均100代(参见tanksley等人,同上)。当基因的确切定位已知时,围绕该基因的侧接标记可用于在不同的群体大小中对重组进行选择。例如,在更小的群体中,预期重组可以进一步远离该基因,因此需要更远端的侧接标记来检测该重组。实施mas的主要组成是:(i)限定在其中标记-性状关联性将被测定的群体,其可以是分离群体、或随机的或结构化的群体;(ii)监测多态性标记相对于该性状的分离或关联性,并使用统计学方法确定连锁或关联性;(iii)基于统计学分析的结果限定一组所需标记,以及(iv)使用和/或外推该信息至当前的育种种质组中,以使得能够作出基于标记的选择决定。本公开中描述的标记,以及其他标记类型,例如ssr和flp,可以用于标记辅助选择方案中。ssr可以定义为长度为6bp或更短的串联重复dna的相对较短的运行(tautz(1989)nucleicacidresearch[核酸研究]17:6463-6471;wang等人,(1994)theoreticalandappliedgenetics[理论与应用遗传学],88:1-6)。多态性由于重复单元数量的变化而出现,所述重复单元数量的变化可能是由dna复制过程中的滑动所引起的(levinson和gutman(1987)molbiolevol[分子生物学与进化]4:203-221)。重复长度的变化可以通过设计pcr引物至保守的非重复侧翼区域来检测(weber和may(1989)amjhumgenet.[美国人类遗传学]44:388-396)。因为ssr是多等位基因的、共显性的、可再生的、并适合于高通量自动化,所以非常适合作图和mas(rafalski等人,(1996)generatingandusingdnamarkersinplants[在植物中生成和使用dna标记].在:non-mammaliangenomicanalysis:apracticalguide[非哺乳动物基因组分析:实用指南].学术出版社(academicpress),第75-135页中)。可以产生各种类型的ssr标记,并且可以通过扩增产物的凝胶电泳获得ssr谱。标记基因型的评分基于扩增片段的大小。也可以生成各种类型的flp标记。最常见地,使用扩增引物来生成片段长度多态性。除了通过引物扩增的区域通常不是高度重复的区域之外,这样的flp标记在许多方面与ssr标记相似。通常由于插入或缺失,扩增区域或扩增子在种质间仍具有足够的可变性,使得由扩增引物产生的片段能够在多态性个体中被区分,并且已知此类插入缺失常常发生于玉蜀黍中(bhattramakki等人,(2002).plantmolbiol[植物分子生物学]48,539-547;rafalski(2002b),同上)。snp标记检测单碱基对核苷酸取代。在所有分子标记类型中,snp是最丰富的,因此具有提供最高遗传图谱分辨率的潜力(bhattramakki等人,2002plantmolecularbiology[植物分子生物学]48:539-547)。由于snp不需要大量的dna并且测定的自动化可以是直接的,所以可以以所谓的“超高通量”方式,以甚至比ssr更高的通量水平测定snp。snp也有可能成为相对低成本的系统。这三个因素一起使得将snp用于mas中具有高度的吸引力。可利用如下几种方法用于snp基因分型,包括但不限于:杂交、引物延伸、寡核苷酸连接、核酸酶切割、微测序和编码球(codedsphere)。如下文献中已经对这些方法进行了综述:gut(2001)hummutat[人类基因突变]17,第475-492页;shi(2001)clinchem[临床化学]47,第164-172页;kwok(2000)pharmacogenomics1[药物基因组学1],第95-100页;以及bhattramakki和rafalski(2001),discoveryandapplicationofsinglenucleotidepolymorphismmarkersinplants[单核苷酸多态性标记在植物中的发现与应用],在:r.j.henry编辑,plantgenotyping:thednafingerprintingofplants,cabipublishing,wallingford[植物基因分型:植物的dna指纹识别,cabi出版社,瓦林福德]中。广泛的可商购的技术利用这些和其他方法来检测snp,所述可商购的技术包括:masscode.tm.(凯杰公司(qiagen))、(第三波技术公司(thirdwavetechnologies))和invader(美国应用生物系统公司(appliedbiosystems))、(美国应用生物系统公司)以及(依诺米那公司(illumina))。可以使用序列内或跨连锁序列的许多snp来描述任何特定基因型的单倍型(ching等人,(2002),bmcgenet.[bmc遗传学]3:19,gupta等人,2001,rafalski(2002b),plantscience[植物科学]162:329-333)。单倍型可以比单个snp更具信息性,并且可以更详细地描述任何特定的基因型。例如,单一的snp可能是具有blb抗性的特定品系或品种的等位基因“t”,但在用于轮回亲本的育种群体中也可能出现等位基因“t”。在这种情况下,单倍型(例如连锁的snp标记处的等位基因的组合)可能更具信息性。一旦将唯一单倍型分配给供体染色体区域,该单倍型可以用于该群体或其任何亚群中以确定个体是否具有特定的基因。参见,例如,wo2003054229。使用本领域普通技术人员已知的自动化高通量标记检测平台使得该方法高效且有效。本文提出的许多phm标记可以容易地用作单核苷酸多态性(snp)标记以选择7号染色体上的基因座位。利用pcr,将引物用于扩增代表目的群体多样性的个体(优选近交系)的dna区段。将pcr产物直接在一个或两个方向上测序。将得到的序列进行比对并鉴定多态性。所述多态性不限于单核苷酸多态性(snp),而且包括插入缺失、caps、ssr和vntr(可变数量的串联重复序列)。具体地讲,针对本文所述的精细图谱信息,人们可易于使用本文提供的信息来获得在通过本文公开的引物扩增的区域内的另外的多态性snp(和其他标记)。所描述的图谱区域内的标记可以与bac或其他基因组文库杂交,或者与基因组序列进行电子比对,以在与所述标记相同的大致定位中找到新的序列。除上述的ssr、flp和snp外,其他类型的分子标记也被广泛使用,包括但不限于:表达的序列标签(est)、源自est序列的ssr标记、随机扩增的多态性dna(rapd)和其他基于核酸的标记。同工酶谱和连锁形态特征在某些情况下也可以间接用作标记。尽管它们不直接检测dna差异,但它们往往受到特定遗传差异的影响。然而,检测dna变异的标记比同工酶或形态学标记多得多且更多态(tanksley(1983)plantmolecularbiologyreporter:[植物分子生物学导报]1:3-8)。序列比对或重叠群还可以用于发现本文所列特异标记的上游或下游的序列。然后使用接近于本文所述的标记的这些新序列来发现和开发功能上等效的标记。例如,对不同的物理和/或遗传图谱进行比对以定位未在本公开中描述但位于相似区域内的等效标记。这些图谱可能在物种内,或者甚至跨越进行遗传上或物理上比对的其他物种。一般来说,mas使用多态性标记,这些标记已被鉴定为具有与blb抗性性状等性状共分离的显著可能性。推测这样的标记在图谱上位于给予植物blb抗性表型的一个或多个基因附近,并被认为是所需性状或标记的指示。测试植物中标记中所需的等位基因的存在,并且预期在一个或多个基因座处含有所需基因型的植物将所需基因型连同所需表型一起转移至其子代。因此,可以通过检测一个或多个标记等位基因来选择具有blb抗性的植物,并且此外,还可以选择来自这些植物的子代植物。因此,获得在给定染色体区域中含有所需基因型(即与白叶枯病抗性相关联的基因型)的植物,并且然后与另一植物杂交。然后使用一种或多种标记对这种杂交的子代进行基因型评估,并且然后将在给定染色体区域中具有相同基因型的子代植物选择为具有blb抗性。从连锁作图中鉴定出与白叶枯病抗性性状相关的标记。这些标记的参考序列由seqidno:5和10-26表示。在这些标记序列内鉴定snp位置。可以单独或组合使用snp(即snp单倍型)来选择与blb抗性相关的有利的抗性基因等位基因。例如,本文所公开的10号染色体qtl处的snp单倍型可能包含:在r1091-7-06处的“g”、在r1091-7-021处的“g”、在r1091-7-022处的“c”、在r1091-7-027处的“g”、在r1091-7-028处的“g”、在r1091-7-026处的“g”、在r1091-7-42处的“t”、在r1091-7-037处的“a”、在r1091-7-030处的“c”、在r1091-7-018处的“g”、在r1091-7-053处的“g”、在r1091-7-052处的“c”、在r1091-7-040处的“g”、在r1091-7-044处的“t”、在r1091-7-039处的“a”、在r1091-7-024处的“c”和在r1091-7-007处的“g”,或其任何组合。本领域技术人员会预期在本文所鉴定的10号染色体标记中及其附近的标记基因座处可能存在附加的多态性位点,其中一个或多个多态性位点与该单倍型中的多态性位点中的一个或多个处的等位基因处于连锁不平衡(ld),并且因此可以用于标记辅助选择程序中以渗入基因等位基因或目的基因组片段。如果这些位点中的一个处的等位基因的存在倾向于预测同一染色体上其他位点处的等位基因存在,则认为不同多态性位点处的两个特定等位基因处于ld(stevens,mol.diag.[分子诊断]4:309-17(1999))。该标记基因座可以位于blb抗性性状qtl的5cm、2cm、或1cm内(在基于单次减数分裂的遗传图谱上)。技术人员将理解等位基因频率(进而单倍型频率)可因种质库不同而不同。由于成熟度差异、杂种优势分组、地理分布等原因,种质库存在差异。因此,某些种质库中的snp和其他多态性可能不具有信息性。植物组合物通过上述方法中的任何一种鉴定和/或选择的水稻植物也是令人感兴趣的。蛋白质及其变体和片段本公开涵盖了blb4多肽。如本文所用,“blb4多肽”和“blb4蛋白”可互换地使用,是指具有blb抗性活性的一种或多种多肽,并且与seqidno:3的blb4多肽充分同源。考虑了多种blb4多肽。如本文所用的“充分相同”是指具有至少约70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大序列同一性的氨基酸序列。在一个实施例中,blb4多肽与seqidno:3相比具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的序列同一性。在一些实施例中,序列同一性针对blb4多肽的全长序列。在本文中与序列同一性百分比一起使用时,术语“约”意指+/-1.0%。本文所用的“重组蛋白”是指不再处于其天然环境中(例如处于体外或重组细菌或植物宿主细胞中)的蛋白质;从多核苷酸表达的蛋白质,所述多核苷酸已从其天然版本进行编辑;或由相对于天然序列在不同基因组位置的多核苷酸表达的蛋白质。如本文所用的“基本上不含细胞材料”是指包括具有小于约30%、20%、10%或5%(以干重计)的非靶蛋白(在本文中也称为“污染蛋白”)的蛋白制剂的多肽。“片段”或“生物活性部分”包括多肽片段或多核苷酸片段,其包含分别与blb4多肽或多核苷酸充分相同的序列,并且当在植物中表达时表现出blb抗性。如本文所用的“变体”是指具有与亲本氨基酸序列具有至少约50%、55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性的氨基酸序列的蛋白质或多肽。在一些实施例中,blb4多肽包含与seqidno:3的氨基酸序列的全长或片段具有至少约40%、45%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更高的同一性的氨基酸序列,其中当在植物中表达时blb4多肽具有blb抗性。在一些实施例中,blb4多肽包含seqidno:3的氨基酸序列,其与相应的seqidno:3的相应位置的氨基酸相比具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95或更多个氨基酸取代。用于此类操作的方法是本领域通常已知的。例如,可以通过dna中的突变来制备blb4多肽的氨基酸序列变体。这也可以通过若干种诱变形式中的一种来完成,像例如位点特异性双链断裂技术,和/或定向进化。在一些方面,在所述氨基酸序列中所编码的改变将基本上不影响所述蛋白质的功能。此类变体将具有所需活性。然而,应当理解,可以通过对本公开的组合物使用这些技术改进blb4多肽赋予blb抗性的能力。可以在一个或多个预测的非必需氨基酸残基处做出保守氨基酸取代。“非必需”氨基酸残基是可以从blb4多肽的野生型序列改变而来的并且不改变生物活性的残基。“保守氨基酸取代”是其中用具有相似侧链的氨基酸残基替换所述氨基酸残基的取代。在本领域中已经限定了具有相似侧链的氨基酸残基的家族。这些家族包括:具有碱性侧链的氨基酸(例如,赖氨酸、精氨酸、组氨酸);具有酸性侧链的氨基酸(例如,天冬氨酸、谷氨酸);具有极性的、带负电荷的残基及其酰胺的氨基酸(例如,天冬氨酸、天冬酰胺、谷氨酸、谷氨酰胺);具有不带电极性侧链的氨基酸(例如,甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸);具有小脂肪族、非极性或微小极性的残基的氨基酸(例如,丙氨酸、丝氨酸、苏氨酸、脯氨酸、甘氨酸);具有非极性侧链的氨基酸(例如,丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸);具有大脂肪族、非极性残基的氨基酸(例如,甲硫氨酸、亮氨酸、异亮氨酸、缬氨酸、胱氨酸);具有β-支链侧链的氨基酸(例如,苏氨酸、缬氨酸、异亮氨酸);具有芳香族侧链的氨基酸(例如,酪氨酸、苯丙氨酸、色氨酸、组氨酸);具有大芳香族侧链的氨基酸(例如,酪氨酸、苯丙氨酸、色氨酸)。氨基酸取代可以在保留功能的非保守区域中进行。通常,此类取代并非针对保守氨基酸残基、或针对在保守基序内的氨基酸残基而进行,其中此类残基是蛋白质活性所必要的。保守的并且对于蛋白质活性可能是必需的残基的实例包括例如,在与实施例的序列相似或相关的毒素(或蛋白质类)的比对中所包含的全部蛋白之间是相同的残基(例如,在同源蛋白比对中是相同的残基)。保守的但可以允许保守氨基酸取代、并且仍保留活性的残基的实例包括例如,在与实施例的序列相似或相关的毒素(或蛋白质类)的比对中所包含的全部蛋白质之间仅具有保守取代的残基(例如,在同源蛋白比对中所包含的全部蛋白质之间仅具有保守取代的残基)。然而,本领域的技术人员应当理解,功能性变体在保守的残基中可以具有少量保守或非保守的改变。可替代地,可以对氨基或羧基末端处的多种蛋白质的蛋白序列进行改变,而基本上不影响活性。这可以包括由现代分子方法所引入的插入、缺失或改变,所述方法如pcr,包括pcr扩增,所述pcr扩增借助于将氨基酸编码序列包括到在pcr扩增中所使用的寡核苷酸之中而改变或延长了这种蛋白质编码序列。可替代地,所添加的蛋白序列可以包括完整的蛋白质编码序列,如在本领域内通常用于产生蛋白质融合物的那些序列。此类融合蛋白常常用于(1)增加目的蛋白质的表达;(2)引入结合结构域、酶活性或表位以促进蛋白质纯化、蛋白质检测或本领域已知的其他实验用途;(3)将蛋白质的分泌或翻译靶向亚细胞器,如革兰氏阴性菌的周质空间、植物的线粒体或叶绿体或真核细胞的内质网,其中后者常常导致蛋白质的糖基化。本公开的变体核苷酸和氨基酸序列还涵盖了源自诱变和引起重组的程序(如dna改组)的序列。在这样的程序下,可以使用编码区域的一种或多种不同的blb4多肽来产生具有所需特性的新的blb4多肽。以此方式,由相关序列多核苷酸的群体产生重组多核苷酸文库,所述相关序列多核苷酸包含具有基本序列同一性并且能够在体外或体内同源重组的序列区域。在另一个实施例中,提供了融合蛋白,在所述融合蛋白的氨基酸序列中包含含有本公开的blb4多肽的氨基酸序列。用于设计和构建融合蛋白(以及编码它们的多核苷酸)的方法是本领域技术人员已知的。编码blb4多肽的多核苷酸可以融合到信号序列,所述信号序列将指导blb4多肽定位于原核或真核细胞的特定区室和/或指导实施例的blb4多肽从原核或真核细胞的分泌。核酸分子及其变体和片段提供了包含编码blb4多肽或其生物活性部分的核酸序列的分离或重组的核酸分子,以及足以用作杂交探针以鉴定编码具有序列同源性区域的蛋白质的核酸分子的核酸分子。如本文所用的,术语“核酸分子”是指dna分子(例如,重组dna、cdna、基因组dna、质粒dna、线粒体dna)和rna分子(例如,mrna)以及使用核苷酸类似物而产生的dna或rna的类似物。核酸分子可以是单链的或双链的,但优选地是双链的dna。本文所用的“分离的”核酸分子(或dna)是指不再处于其天然环境中(例如处于体外)的核酸序列(或dna)。本文所用的“重组的”核酸分子(或dna)是指在重组细菌或植物宿主细胞中的核酸序列(或dna);其已从其天然序列进行编辑;或其位于与天然序列不同的位置。在一些实施例中,“分离的”或“重组的”核酸不含有在衍生所述核酸的生物体基因组dna中天然地位于所述核酸侧接的序列(即,位于所述核酸的5’和3’端的序列)(优选编码蛋白质的序列)。出于本公开的目的,“分离的”或“重组的”当用于指核酸分子时排除分离的染色体。例如,在不同实施例中,编码blb4多肽的重组核酸分子可以包含小于约5kb、4kb、3kb、2kb、1kb、0.5kb或0.1kb的核酸序列,所述核酸序列在源自所述核酸的细胞的基因组dna中天然地位于所述核酸分子的侧翼。在一些实施例中,与天然或基因组核酸序列相比,编码blb4多肽的分离的核酸分子在核酸序列中具有一个或多个改变。在一些实施例中,天然或基因组核酸序列的改变包括但不限于:由于遗传密码的简并性造成的核酸序列改变;与天然或基因组序列相比,由于氨基酸取代、插入、缺失和/或添加造成的核酸序列的改变;一个或多个内含子的去除;一个或多个上游或下游调节区的缺失;和与基因组核酸序列相关的5’和/或3’非翻译区域的缺失。在一些实施例中,编码blb4多肽的核酸分子是非基因组序列。考虑了编码blb4多肽或相关蛋白质的多种多核苷酸。当可操作地连接到合适的启动子、转录终止和/或聚腺苷酸化序列上时,此类多核苷酸可用于在宿主细胞中产生blb4多肽。这类多核苷酸还可用作用于分离编码blb4多肽或相关蛋白的同源或基本上同源的多核苷酸的探针。在一些实施例中,编码blb4多肽的核酸分子是具有在seqidno:2中所示序列的多核苷酸、及其变体、片段和互补序列。本文所用的“互补序列”是指与给定核酸序列充分互补的核酸序列,使得其可以与所述给定核酸序列杂交从而形成稳定的双链体。本文所用的“多核苷酸序列变体”是指除遗传密码的简并性之外编码相同多肽的核酸序列。在一些实施例中,编码blb4多肽的核酸分子是非基因组核酸序列。如本文所用的,“非基因组核酸序列”或“非基因组核酸分子”或“非基因组多核苷酸”是指与天然或基因组核酸序列相比,在所述核酸序列上具有一个或多个改变的核酸分子。在一些实施例中,天然或基因组核酸分子的改变包括但不限于:由于遗传密码的简并性造成的核酸序列改变;用于在植物中表达的核酸序列的优化;与天然或基因组序列相比,引入至少一个氨基酸取代、插入、缺失和/或添加的核酸序列的改变;去除与所述基因组核酸序列相关的一个或多个内含子;插入一个或多个异源内含子;缺失与所述基因组核酸序列相关的一个或多个上游或下游调节区;插入一个或多个异源上游或下游调节区;缺失与所述基因组核酸序列相关的5’和/或3’非翻译区;插入异源5’和/或3’非翻译区;和聚腺苷酸化位点的修饰。在一些实施例中,非基因组核酸分子是合成的核酸序列。在一些实施例中,编码本文所公开的blb4多肽的核酸分子是具有如下核苷酸序列的非基因组多核苷酸,所述核苷酸序列与seqidno:2的核酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性,其中当在植物中表达时blb4多肽具有blb抗性活性。在一些实施例中,核酸分子编码blb4多肽变体,所述变体包含对seqidno:3的氨基酸序列的一个或多个氨基酸取代。作为编码blb4多肽的这些核酸序列的片段的核酸分子也涵盖在实施例中。如本文所用的“片段”是指编码blb4多肽的核酸序列的一部分。核酸序列的片段可以编码blb4多肽的生物活性部分,或者它可以是可以使用下文公开的方法用作杂交探针或pcr引物的片段。作为编码blb4多肽的核酸序列的片段的核酸分子包含至少约150、180、210、240、270、300、330、360、400、450或500个连续核苷酸或高至存在于编码本文公开的blb4多肽的全长核酸序列中的核苷酸数目,这取决于预期用途。本文所用的“连续核苷酸”是指彼此紧邻的核苷酸残基。实施例的核酸序列的片段将编码保留blb4多肽的生物活性并因此保留blb抗性的蛋白质片段。本文所用的“保留blb抗性”是指具有seqidno:3中所示全长blb4多肽的至少约10%、至少约30%、至少约50%、至少约70%、80%、90%、95%或更高的blb抗性的多肽。相对于参考序列(主题序列),“序列同一性百分比(%)”被确定为在比对序列并引入空位(如果需要)以实现最大百分比序列同一性后,并且不考虑作为序列同一性的一部分的任何氨基酸保守取代,候选序列(查询序列)中与参考序列中的相应氨基酸残基或核苷酸同一的氨基酸残基或核苷酸的百分比。用于确定序列同一性百分比目的而进行的比对能以本领域技术范围内的各种方式实现,例如,使用公共可用的计算机软件,例如blast、blast-2。本领域的技术人员可以确定用于比对序列的适当参数,包括在进行比较的序列的全长度上实现最大比对所需的任何算法。两个序列之间的同一性百分比是序列共有的同一位置的数目的函数(例如,查询序列的同一性百分比=查询序列和主题序列之间的同一位置的数目/查询序列的位置总数×100)。在一些实施例中,blb4多核苷酸编码包含与贯穿seqidno:3的氨基酸序列的整个长度具有至少约80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更大同一性的氨基酸序列的blb4多肽。实施例还涵盖编码blb4多肽变体的核酸分子。编码blb4多肽的核酸序列的“变体”包括编码本文公开的blb4多肽但是由于遗传密码的简并性而存在保守差异的那些序列以及如上所述的充分同一的那些序列。可以通过使用熟知的分子生物学技术鉴定天然存在的等位基因变体,如聚合酶链式反应(pcr)和如下文概述的杂交技术。变体核酸序列还包括经合成衍生的核酸序列,所述核酸序列已经例如通过使用定点诱变而产生,但是仍然编码本文公开的blb4基因多肽。技术人员将进一步了解,可以通过核酸序列的突变引入变化,从而导致编码的blb4多肽的氨基酸序列的变化,而不改变蛋白质的生物活性。因此,变体核酸分子可以通过以下方式产生:将一个或多个核苷酸取代、添加和/或缺失引入本文公开的相应的核酸序列中,这样使得将一个或多个氨基酸取代、添加或缺失引入所编码的蛋白质中。通过标准技术可以引入突变,如定向诱变和pcr介导的诱变。此类变体核酸序列也被本公开所涵盖。可替代地,可以通过沿编码序列的全部或部分随机引入突变(如通过饱和诱变)来制备变体核酸序列,并且可以筛选所得突变体赋予活性以鉴定保留活性的突变体的能力。在诱变之后,所编码的蛋白质可以进行重组表达,并且所述蛋白质的活性可以使用标准的测定技术来确定。本公开的多核苷酸及其片段任选用作各种重组和递归(recursive)重组反应的底物,除了例如ausubel、berger和sambrook所述的标准克隆方法之外,即,以产生具有所需特性的另外的多肽同源物及其片段。各种此类反应是已知的。用于生产本文列出的任何核酸的变体的方法(这些方法包括将此类多核苷酸与第二(或更多)多核苷酸递归重组,从而形成变体多核苷酸文库)也是本公开的实施例,所产生的文库、包含所述文库的细胞和通过此类方法产生的任何重组多核苷酸也是如此。另外,此类方法任选地包括基于活性从此类文库中选择变体多核苷酸,正如其中此类递归重组在体外或体内进行。各种多样性产生方案(包括核酸递归重组方案)是可获得的并且在本领域中被充分描述。所述程序可以单独和/或组合使用以产生核酸或核酸集合的一种或多种变体,以及所编码蛋白质的变体。单独地或整体地,这些程序提供了产生多样化核酸和核酸集合(包括例如核酸文库)的稳健且广泛适用的方式,所述方式可用于,例如,具有新的和/或改善的特征的核酸、蛋白质、途径、细胞和/或生物体的工程化或快速进化。虽然为清除起见,在随后的讨论过程中作出了区分和分类,但是应当理解,所述技术通常不是相互排斥的。实际上,各种方法可以单独使用或组合、平行或串联使用,以便取得不同的序列变体。本文所述的任何多样性产生程序的结果可以是一种或多种核酸的产生,其可以选择或筛选具有或赋予所需特性的核酸或编码具有或者赋予所需特性的蛋白质的核酸。通过本文的或技术人员以其他方式可用的一种或多种方法进行多样化之后,可以针对所需的活性或特性,或在所需的ph下的这种活性等选择所产生的任何核酸。这可以包括通过本领域任何测定来鉴定可以例如以自动化或可自动化形式检测的任何活性。各种相关(或甚至不相关)的特性可以由执业者酌情串联或平行评估。实施例的核苷酸序列也可用于从不同来源中分离相应的序列。以这种方式,可以使用如pcr、杂交等方法来鉴定此类序列(基于其与本文所示序列的序列同源性)。实施例涵盖基于与本文所示全部序列或其片段的序列同一性选择的序列。此类序列包括作为公开序列的直向同源物的序列。术语“直向同源物”是指源自共同祖先基因并且由于物种形成而在不同物种中发现的基因。当其核苷酸序列和/或其编码的蛋白序列共有如本文其他地方所定义的基本同一性时,在不同物种中发现的基因被认为是直向同源物。直向同源物的功能通常在物种间是高度保守的。在pcr方法中,可以设计寡核苷酸引物用于pcr反应,以从由任何目的生物体提取的cdna或基因组dna扩增相应的dna序列。用于设计pcr引物以及pcr克隆的方法是本领域通常已知的并且公开于sambrook等人,(1989)molecularcloning:alaboratorymanual[分子克隆:实验室手册](第2版,coldspringharborlaboratorypress[冷泉港实验室出版社],plainview[普莱恩维尤],纽约),以下为“sambrook”中。还参见,innis等人编辑,(1990)pcrprotocols:aguidetomethodsandapplications[pcr方案:方法和应用指南](academicpress[学术出版社],纽约);innis和gelfand编辑,(1995)pcrstrategies[pcr策略](academicpress[学术出版社],纽约);和innis和gelfand编辑,(1999)pcrmethodsmanual[pcr方法手册](academicpress[学术出版社],纽约)。已知的pcr方法包括但不限于:使用成对引物、巢式引物、单特异性引物、简并引物、基因特异性引物、载体特异性引物、部分错配引物等的方法。在杂交方法中,全部或部分核酸序列可用于筛选cdna或基因组文库。用于构建此类cdna和基因组文库的方法是本领域通常已知的,并且公开于sambrook和russell,(2001),同上。所谓的杂交探针可以是基因组dna片段、cdna片段、rna片段或其他寡核苷酸,并且可以用一个可检测基团(如32p或任何其他可检测的标记,如其他放射性同位素、荧光化合物、酶或酶辅因子)进行标记。用于杂交的探针可以通过标记基于本文公开的编码已知的blb4多肽的核酸序列的合成的寡核苷酸来制备。可以另外使用简并引物,所述简并引物是基于在所述核酸序列或所编码的氨基酸序列中的保守核苷酸或氨基酸残基而设计的。这种探针典型地包含以下核酸序列的区域,所述核酸序列区域在严格条件下与编码本公开的blb4多肽的核酸序列或其片段或变体的至少约12个、至少约25个、至少约50、75、100、125、150、175或200个连续核酸进行杂交。用于制备用于杂交的探针的方法和严格条件是本领域通常已知的,并且公开于sambrook和russell,(2001),同上。核苷酸构建体、表达盒和载体本文使用术语“核苷酸构建体”并不旨在将实施例限制为包含dna的核苷酸构建体。本领域普通技术人员将认识到,核苷酸构建体,特别是由核糖核苷酸构成的多核苷酸和寡核苷酸以及核糖核苷酸和脱氧核糖核苷酸的组合也可用于本文公开的方法中。实施例的核苷酸构建体、核酸和核苷酸序列另外涵盖这种构建体、分子和序列的所有互补形式。此外,实施例的核苷酸构建体、核苷酸分子和核苷酸序列涵盖能用于实施例的转化植物方法的所有核苷酸构建体、分子和序列,包括但不限于由脱氧核糖核苷酸、核糖核苷酸及其组合所构成的那些。这种脱氧核糖核苷酸和核糖核苷酸既包括天然存在的分子也包括合成的类似物。实施例的核苷酸构建体、核酸和核苷酸序列还涵盖核苷酸构建体的所有形式,所述形式包括但不限于单链形式、双链形式、发夹、茎环结构等。另外的实施例涉及经转化的生物体,如选自以下的生物体:植物细胞、细菌、酵母、杆状病毒、原生动物、线虫和藻的生物体。经转化的生物体包含:实施例的dna分子、包含dna分子的表达盒或包含表达盒的载体,它可以稳定地并入经转化的生物体的基因组。在dna构建体中提供实施例的序列,用于在目的生物体中表达。所述构建体将包括可操作地连接到实施例的序列的5’和3’的调节序列。如本文使用的,术语“可操作地连接”是指启动子和第二序列之间的功能性连接,其中启动子序列启动并介导相应于第二序列的dna序列的转录。通常,可操作地连接意味着所连接的核酸序列是连续的,并且在必要时在相同阅读框中连接两个蛋白质编码区域。所述构建体可以另外含有待共转化进生物体的至少一个另外的基因。可替代地,可以在多个dna构建体上提供一个或多个另外的基因。提供的这种dna构建体具有用于插入本公开的blb4多肽基因序列的多个限制性位点,该多肽基因序列将位于调节性区域的转录调节之下。dna构建体可以另外包含选择性标记基因。按5’到3’的转录方向,dna构建体将通常包括:转录和翻译起始区域(即,启动子)、实施例的dna序列以及在用作宿主的生物体内具有功能的转录和翻译终止区域(即,终止区)。针对实施例的宿主生物体和/或序列,转录起始区(即,启动子)可以是天然的、类似的、外源的或异源的。此外,所述启动子可以是天然序列,或可替代地,是合成序列。如本文使用的,术语“外源”表示在引入启动子的天然生物体中没有发现启动子。在启动子对于实施例的序列而言是“外源的”或“异源的”情况下,它是指所述启动子对于实施例的可操作地连接的序列而言不是天然的或天然存在的启动子。如本文使用的,嵌合基因包含与转录起始区可操作地连接的编码序列,所述转录起始区对于所述编码序列是异源的。当所述启动子是天然(native或natural)序列时,可操作地连接的序列的表达从野生型表达变化,这导致表型的改变。在一些实施例中,所述dna构建体包含编码实施例的blb4多肽的多核苷酸。在一些实施例中,所述dna构建体包含多核苷酸,所述多核苷酸编码包含实施例的blb4多肽的融合蛋白。在一些实施例中,dna构建体还可以包括转录增强子序列。如本文所用的,术语“增强子”是指可以刺激启动子活性的dna序列,并且可以是插入以增强启动子的水平或组织特异性的启动子的先天元件或异源元件。各种增强子是本领域已知的,包括例如,在植物中具有基因表达增强特性的内含子(美国专利申请公开号2009/0144863)、泛素内含子(即,玉蜀黍泛素内含子1(参见,例如,ncbi序列s94464))、ω增强子或ω主要增强子(gallie等人,(1989)molecularbiologyofrna[rna的分子生物学],cech编辑(利斯公司(liss),纽约)237-256和gallie等人,(1987)gene[基因]60:217-25)、camv35s增强子(参见,例如,benfey等人,(1990)emboj.[欧洲分子生物学杂志]9:1685-96),并且也可以使用美国专利号7,803,992的增强子。以上转录增强子的列表并不意指是限制性的。任何适当转录增强子都可用于实施例中。终止区对于转录起始区可以是天然的,对于可操作地连接的目的dna序列可以是天然的,对于植物宿主可以是天然的,或者可以源自另一种来源(即,对于启动子、目的序列、植物宿主、或其任何组合而言是外源的或异源的)。方便的终止区可获自根癌农杆菌(a.tumefaciens)的ti质粒,如章鱼碱合酶和胭脂碱合酶终止区。还参见guerineau等人,(1991)mol.gen.genet.[分子遗传学和普通遗传学]262:141-144;proudfoot,(1991)cell[细胞]64:671-674;sanfacon等人,(1991)genesdev.[基因与发育]5:141-149;mogen等人,(1990)plantcell[植物细胞]2:1261-1272;munroe等人,(1990)gene[基因]91:151-158;ballas等人,(1989)nucleicacidsres.[核酸研究]17:7891-7903以及joshi等人,(1987)nucleicacidres.[核酸研究]15:9627-9639。适当时可以优化核酸以增加在宿主生物体中的表达。因此,在宿主生物体是植物的情况下,合成核酸可以使用植物偏好性密码子来合成以改善表达。有关宿主偏好性使用的讨论,参见,例如campbell和gowri,(1990)plantphysiol.[植物生理学]92:1-11。例如,虽然实施例的核酸序列在单子叶和双子叶植物物种中均可以表达,但是可以修饰序列,以考虑单子叶或双子叶植物的特定偏好和gc含量偏好,因为这些偏好已经表现出了差异(murray等人(1989)nucleicacidsres.[核酸研究]17:477-498)。因而,特定氨基酸的水稻偏好性可以源自水稻的已知基因序列。已知有另外的序列修饰能增强细胞宿主中的基因表达。这些包括消除以下序列:编码假聚腺苷酸化信号的序列、编码外显子-内含子剪接位点信号的序列、编码转座子样重复序列的序列和得到充分表征的、可能不利于基因表达的其他序列。可以将序列的gc含量调整至给定细胞宿主的平均水平,如通过参考在所述宿主细胞中表达的已知基因而计算的。如本文使用的,术语“宿主细胞”是指包含载体并支持表达载体的复制和/或表达的细胞。宿主细胞可以是原核细胞如大肠杆菌,或真核细胞如酵母、昆虫、两栖类或哺乳动物细胞、或单子叶或双子叶植物细胞。单子叶宿主细胞的实例是水稻宿主细胞。当可能时,修饰序列以避免出现可预见的发夹二级mrna结构。在制备表达盒时,可以操作各种dna片段,以提供处于适当方向以及合适时,处于适当阅读框中的dna序列。为此,可采用衔接子(adapter)或接头以连接dna片段,或可以涉及其他操作以提供方便的限制性位点、去除多余的dna、去除限制性位点等。为此目的,可以涉及体外诱变、引物修复、限制性酶切(restriction)、退火、再取代(例如转换和颠换)。许多启动子可用于实施所述实施例。可基于所需结果,选择启动子。核酸可与组成型、组织偏好性、诱导型或其他启动子组合用于在宿主生物体中的表达。植物转化所述实施例的方法涉及将多肽或多核苷酸引入植物。如本文所用的,“引入”意指将所述多核苷酸或多肽呈送给所述植物,以此类方式使得所述序列进入所述植物细胞的内部。所述实施例的方法不取决于用于将一个或多个多核苷酸或一个或多个多肽引入植物中的具体方法,只要所述多核苷酸或多肽进入所述植物的至少一个细胞的内部即可。将一个或多个多核苷酸或一个或多个多肽引入植物的方法是本领域已知的,所述方法包括但不限于稳定转化法、瞬时转化法和病毒介导法。如本文所用的,“稳定转化”意指引入植物中的核苷酸构建体整合到所述植物的基因组中,并且能够被其子代遗传。如本文所用的,“瞬时转化”意指将多核苷酸引入所述植物中并且不整合到所述植物的基因组中,或者将多肽引入植物中。如本文所用的,“植物”是指整株植物、植物器官(例如叶、茎、根等)、种子、植物细胞、繁殖体、及其胚胎和子代。植物细胞可以是分化的或未分化的(例如愈伤组织、悬浮培养细胞、原生质体、叶子细胞、根细胞、韧皮部细胞和花粉)。转化方案以及将核苷酸序列引入植物中的方案可以根据要靶向转化的植物或植物细胞的类型(即,单子叶植物或双子叶植物)而异。将核苷酸序列引入到植物细胞中并随后插入到植物基因组中的合适方法包括显微注射(crossway等人,(1986)biotechniques[生物技术]4:320-334)、电穿孔(riggs等人,(1986)proc.natl.acad.sci.usa[美国科学院院报]83:5602-5606)、农杆菌介导的转化(美国专利号5,563,055和5,981,840)、直接基因转移(paszkowski等人,(1984)emboj[欧洲分子生物学学会杂志]3:2717-2722)以及弹道粒子加速(参见例如,美国专利号4,945,050;5,879,918;5,886,244和5,932,782;tomes等人,(1995)plantcell,tissue,andorganculture:fundamentalmethods[植物细胞、组织和器官培养:基本方法],gamborg和phillips编辑(springer-verlag,berlin[德国柏林施普林格出版公司]);和mccabe等人,(1988)biotechnology[生物技术]6:923-926);以及lecl转化法(wo00/28058)。对于马铃薯转化法,参见tu等人,(1998)plantmolecularbiology[植物分子生物学]37:829-838和chong等人,(2000)transgenicresearch[转基因研究]9:71-78。可以在以下文献中找到另外的转化方法:weissinger等人,(1988)ann.rev.genet.[遗传学年鉴]22:421-477;sanford等人,(1987)particulatescienceandtechnology[微粒科学与技术]5:27-37(洋葱);christou等人,(1988)plantphysiol.[植物生理学]87:671-674(大豆);mccabe等人,(1988)bio/technology[生物/技术]6:923-926(大豆);finer和mcmullen,(1991)invitrocelldev.biol.[体外细胞生物学和发育生物学]27p:175-182(大豆);singh等人,(1998)theor.appl.genet.[理论与应用遗传学]96:319-324(大豆);datta等人,(1990)biotechnology[生物技术]8:736-740(水稻);klein等人,(1988)proc.natl.acad.sci.usa[美国科学院院报]85:4305-4309(玉蜀黍);klein等人,(1988)biotechnology[生物技术]6:559-563(玉蜀黍);美国专利号5,240,855;5,322,783和5,324,646;klein等人,(1988)plantphysiol.[植物生理学]91:440-444(玉蜀黍);fromm等人,(1990)biotechnology[生物技术]8:833-839(玉蜀黍);hooykaas-vanslogteren等人,(1984)nature[自然](伦敦)311:763-764;美国专利号5,736,369(谷类);bytebier等人,(1987)proc.natl.acad.sci.usa[美国科学院院报]84:5345-5349(百合科(liliaceae));dewet等人,(1985)theexperimentalmanipulattonofovuletissues[胚珠组织的实验操作],chapman等人编辑(longman[朗文出版社],纽约),第197-209页(花粉);kaeppler等人,(1990)plantcellreports[植物细胞报告]9:415-418和kaeppler等人,(1992)theor.appl.genet.[理论与应用遗传学]84:560-566(晶须介导的转化);d’halluin等人,(1992)plantcell[植物细胞]4:1495-1505(电穿孔);li等人,(1993)plantcellreports[植物细胞报告],12:250-255以及christou和ford,(1995)annalsofbotany[植物学年报]75:407-413(水稻);osjoda等人,(1996)naturebiotechnology[自然生物技术]14:745-750(经由根癌农杆菌的玉蜀黍)。将基因组编辑技术引入植物的方法在一些实施例中,可以使用基因组编辑技术将所公开的blb4多核苷酸组合物引入植物的基因组中,或者可以使用基因组编辑技术编辑植物基因组中先前引入的blb4多核苷酸。例如,可以通过使用双链断裂技术(如talen、大范围核酸酶、锌指核酸酶、crispr-cas等)将所公开的多核苷酸引入植物基因组中需要的位置上。例如,为了位点特异性插入的目的,可以使用crispr-cas系统将所公开的多核苷酸引入基因组中需要的位置上。植物基因组中需要的位置可以是任何对于插入来说需要的靶位点,如适于育种的基因组区域,或者可以是位于具有现有的目的性状的基因组窗口中的靶位点。现有的目的性状可能是内源性状或先前引入的性状。在一些实施例中,在将所公开的blb4多核苷酸先前已经引入到基因组中的情况下,可以使用基因组编辑技术来改变或修饰引入的多核苷酸序列。可以将位点特异性修饰引入所公开的blb4多核苷酸组合物中,所述位点特异性修饰包括使用用于引入位点特异性修饰的任何方法产生的修饰,所述方法包括但不限于通过使用基因修复寡核苷酸(例如美国公开2013/0019349),或通过使用双链断裂技术,如talen、大范围核酸酶、锌指核酸酶、crispr-cas等。此类技术可用于通过在引入的多核苷酸内的核苷酸的插入、缺失或取代来修饰先前引入的多核苷酸。可替代地,可以使用双链断裂技术向引入的多核苷酸中添加另外的核苷酸序列。可以添加的另外的序列包括另外的表达元件(如增强子序列和启动子序列)。在另一个实施例中,可以使用基因组编辑技术在植物基因组内定位紧邻本文公开的blb4多核苷酸组合物的另外的blb抗性蛋白,以产生blb抗性蛋白的分子堆叠物。“改变的靶位点”、“改变的靶序列”、“修饰的靶位点”和“修饰的靶序列”在本文中可互换地使用,并且意指如本文公开的靶序列,当与未改变的靶序列相比时,所述靶序列包含至少一个改变。此类“改变”包括,例如:(i)至少一个核苷酸的替代、(ii)至少一个核苷酸的缺失、(iii)至少一个核苷酸的插入、或(iv)(i)-(iii)的任何组合。实例提供下列实例以说明但不限制所要求保护的主题。应当理解,本文所述实例和实施例仅用于说明目的,并且本领域的技术人员将认识到在不脱离本公开精神或所附权利要求范围的情况下可改变多种试剂或参数。实例1blb表型及pra1091供体品系的遗传分析通过筛选大量水稻种质,我们鉴定出植物品系pra1091,该植物品系可跨地点赋予广谱抗blb的抗性。使用标准的剪叶方法,在最大分蘗期(播种后45-50天)的受控条件下进行blb接种。在接种后14天评估对病原体/疾病强度的反应。通过测量每株植物四片叶子的平均病斑长度(抗性<3cm且易感性>12cm)来评估病原体对叶片的损害程度。pra1091(<3cm)的blb表型反应与易感品系(<3=抗性且>12易感性)有所区别。从kcp79g7xpra1091杂交开发的f1和f2群体中鉴定出pra1091blb抗性的遗传。f1显示了显性blb反应,并被3(抗性)进一步证实:1(易感性)f2分离比率(单基因遗传)。开发了三个f2定位群体以鉴定pra1091供体植物中的抗性基因(/s)(kcp79g7xpra1091、vhr27m5xpra1091和v9526m7xpra1091)。所有三个受体亲本对blb高度易感(病变长度>12cm)。表1.定位群体亲本的blb表型基因型平均病斑长度(cm)blb表型pra10911抗性kcp79g723易感性v9526m718易感性vhr27m516易感性实例2粗作图和精细作图以及性状连锁标记使用150个源自kcp79g7xpra1091杂交的f2品系,用全基因组snp标记进行粗作图。跨染色体的snp变异用于构造标记单倍型。将跨越所有染色体上的标记单倍型与表型数据相关联,以找到有助于blb抗性的标记-性状关联和基因组区域。joinmap4.1和map-qtl6用于进行潜在基因/qtl的全基因组标记-性状关联。在pra1091中鉴定出两个不同的基因(一个在7号染色体上,另一个在11号染色体上)。由于其广谱抗性,位于7号染色体(2.14-4.8mb之间)的抗性基因被进一步优先用于精细作图和基于图谱的克隆。为了进一步在7号染色体上对该基因进行精细作图,从内部序列数据中鉴定出pra1091和三个易感亲本之间的45个新snp变体。通过使用信息重组体,基因分型和下一代后代的表型,缩小了通过粗作图鉴定的物理区间。通过使用多批次的三个独立的定位群体(f2/f3/f4/f5信息重组体),将该区域精细作图到26kb的区间(msu7osa1发布7:4082457-4108842)。通过标记基因型在每一代中鉴定出的信息重组体进一步用于下一代,并通过表型分离进行确认(在杂合类情况下为3∶1;在亲本型等位基因情况下为近交型反应)。由于pra1091中的新抗性基因为显性,因此它在杂合类中显示3∶1分离,而在亲本纯合类中没有分离。从f3开始,考虑在每个f2/f3/f4/f5家族中约20个分离植物进行基因分型和表型分型。基于精细作图数据,开发并验证了新的snp标记(参见表2)。表2.blb1091候选区域的标记实例3高分辨率作图和基于图谱的克隆pra1091的7号染色体(chr7:4082457-4108842)上的26kb精细作图区域显示了5个注释的基因loc_os07g08050、loc_os07g08060、loc_os07g08070、loc_os07g08080和loc_os07g08090(公共水稻基因组项目,msuv7)。这五个基因在pra1091和易感亲本中进行了测序,以鉴定潜在的序列变异并开发新的snp标记。从f2/f3/4/5/6中开发了另外的分离群体,以鉴定26kb区域内的信息重组体。从多个群体批次中鉴定出的信息重组体的表型和基因型进一步将候选区域缩小到6.7kb区间(chr7:4094124-4100865),根据水稻msuv7基因组版本,该区域是基因间区域,并且没有注释基因。总而言之,为了对pra1091中的推定的候选基因进行精细作图和基于图谱的克隆,使用了大约6,000个分离品系。此6.7kb的基因组片段在高世代群体中显示出与blb表型完全共分离,并且未鉴定出进一步的重组体。5’基因间区域的一部分由msuv7基因注释loc_os07g08080基因(“blb4”基因)的推定启动子组成。在pra1091和易感品系中,通过sanger测序和深度测序(下一代测序)对6.7kb的基因间区域进行了测序,以了解潜在的序列变异和任何未知基因的可能性,这些未知基因没有被公共水稻基因组注释项目msuv7注释。当与易感品系相比时,在pra1091的6.7kb区域内发现了多个snp变异和插入缺失。在抗性和易感品系之间的blb4外显子中仅发现一个snp变异,但所述变异在高世代作图群体中未显示与表型相关。预测blb4的tata信号和转录起始位点(tss)位于pra1091和kcp79g7的6.7kb基因间区域中。分析了pra1091翻译起始(atg)上游的4kb序列,以鉴定tata信号和转录起始位点(tss)。在atg的上游1595bp处鉴定到预测的突出的7bptata信号,并在前者的下游32bp处检测到低强度的tata信号。对来自kcp79g7的blb4推定启动子区域的分析鉴定出atg上游1559bp处的强tata信号。从kcp79g7鉴定出的tata信号是从pra1091鉴定出的低强度tata信号。该预测表明,从pra1091鉴定出的强tata信号对于该品系是唯一的,并且针对kcp79g7预测的强tata信号是两个品系两者共有的。克隆blb4编码区(seqidno:2)以及含有其启动子的3.0kb基因间区域(seqidno:4),用于进一步的转基因验证。在不同的时间间隔分析了来自pra1091(抗性),kcp79g7(易感性),v9526m7(易感性)和vhr27m5(易感性)的感染植物和对照植物中叶片样品中blb4的表达谱。rt-pcr结果显示blb4在接种和模拟后48小时和72小时上调。数据显示,病原体接种和创伤两者均仅在抗性品系pra1091中诱导了blb4表达。在所有三个易感品系中接种和模拟后0、24、48和72小时未观察到blb4的上调。实时定量pcr(qpcr)也证实了rt-pcr结果。实例4水稻转化基因枪介导的粒子轰击用于产生水稻稳定的转基因事件或基因组编辑的变体。种子来自两个水稻近交系;将pra1091和kcp79g7在75%的乙醇中灭菌2-3分钟,并用水彻底洗涤,并在4%的次氯酸钠中孵育10分钟。然后将种子用水洗涤5次,并在室温下完全干燥。将干燥的种子接种在愈伤组织诱导培养基上,并将平板在28℃下于光照下孵育5-7天。之后,将从水稻种子中获得的增殖的愈伤组织置于渗透培养基中4小时,然后用dna轰击:金颗粒。称取足量的金颗粒(金颗粒的数量取决于轰击的数量),并置于2.0ml的eppendorf管中。将1ml100%的乙醇添加到管中,并超声30秒,然后离心1min。将含有金颗粒的沉淀重悬于1ml100%乙醇中,涡旋30秒,并再次离心。将该步骤重复两次,然后将沉淀重悬于1ml无菌水中。将50μl金颗粒悬浮液等分到eppendorf管中,并储存于4℃下。将5μg的dna,50μl的2.5mmcacl2和20μl的0.1m亚精胺添加到50μl金颗粒悬浮液中;涡旋1-2分钟,并使其沉降5分钟。将管离心2分钟,然后弃去上清液。将沉淀重悬于40μl100%乙醇中,并通过涡旋轻轻混合,并将5μl样品快速分配到巨载体盘上并完全干燥。携带dna的巨载体盘:将金颗粒制备物装载到巨载体盘支架上,并在该盘的顶部放置一个停止屏。遵循制造商的说明来递送dna:使用bio-rad基因枪(pds1000)将组织样品上的金颗粒置于渗透培养基上。轰击后,在32℃下在黑暗中将组织样品保持在相同的渗透培养基中24小时。轰击后24小时后,将样品传代培养到静息培养基上,并在28℃下在黑暗中保持5天。然后将培养物转移到含有潮霉素作为选择试剂的选择培养基中。在3-4轮选择后,将增殖的,潮霉素抗性的和zs-yellow阳性愈伤组织事件或变体传代培养到再生培养基上,然后传代培养到生根培养基和硬化培养基上以获得稳定的转基因事件或基因组编辑的变体。将每个独立的品系转移到温室中的单独盆中,并收集样品以进行分子和表型分析。实例5使用crispr-cas9系统通过转基因过表达/互补并通过破坏唯一tata盒来验证blb4基因为了验证推定的候选区域,用含有blb4基因组区域(seqidno:1,1.19kb)的4.7kb构建体(seqidno:6)和来自含有推定的启动子(seqidno:4)和500bp推定的终止子区的pra1091的3.0kb基因组区域转化kcp79g7(易感品系)用于过度表达(参见图1(a))。使用实例1中所述的测定,对15个t0转基因kcp79g7事件进行表型分型显示出与pra1091供体植物相似的抗性水平,从而证实了遗传互补(表3)。单拷贝t0事件显示了t1代中预期的表型和遗传分离。表3.由kcp79g7中的天然启动子驱动的pra1091blb4的转基因验证(易感品系):为了在blb4的cds和启动子区域中产生靶向突变,制备了crispr/cas9构建体以在pra1091背景中靶向blb4的启动子区域中cds和tata盒中的唯一snp。将grna(seqidno:7)设计在cds中唯一snp位置的接合处,并将grna(seqidno:8)设计为靶向blb4启动子的tata盒。靶序列和切割位点已在图2中注释。制备进入质粒载体用于验证grna和序列。最后,通过lr反应(按照制造商的说明,英杰公司(invitrogen))为每个grna构建二元载体。该二元载体构成grna盒,cas9盒和植物选择标记。通过使用基因枪介导的内部水稻转化方案,将靶向cds的二元载体(php85342)和靶向启动子中的tata盒区域的二元载体(php85017)转化至水稻。通过crispr-cas9系统编辑pra1091中的唯一tata盒,以检查唯一tata盒元件的意义。被选择在tata盒中创建靶向突变的靶位点示于图1(b)中(seqidno:9,并在图1(a)中注释为os-blb4-cr12)。分析了t0稳定变体,以检查靶向的tata盒区域中的任何突变。具有tata盒缺失的变体显示出对水稻白叶枯病菌的易感反应,并且具有完整tata盒的那些变体显示出抗性反应(表4)。第一代crispr变体被进一步用于第二代(通过自交),以确认表型和基因型。对第二代植物的详细分析证实了5bp(tataaaa)唯一tata盒元件在赋予blb抗性中的作用。结果表明变体中的可变缺失长度和疾病表型之间的相关性。表4.通过使用crispr-cas9系统破坏pra1091品系中唯一tata盒来验证blb4在pra1091背景中,blb4的cds还通过crispr-cas9进行了编辑。grna(seqidno:7)在cds中唯一snp位置的接合处进行了设计。在cds中具有破坏的t0变体显示出易感反应,并且具有野生型cds的变体显示出对blb的抗性。测序和表型结果的相关性表明,在表现出易感性的两个等位基因(双等位基因)中具有缺失的t0变体,和仅在一个等位基因(单等位基因)中具有缺失的那些变体显示出对blb的抗性。该结果表明,即使在pra1091的杂合条件下,blb4也具有抗性,并且该数据与实例2在显示抗性并表现显性的f1作图群体(kcp79g7xpra1091)上是一致的。设计为靶向cds的指导序列已在图1中注释为os-blb4-cr13。表5.通过靶向pra1091基因中blb4的cds产生的t0变体的突变和表型数据当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1