用于甘蔗属复合组的基于微卫星的指纹分析系统的制作方法

文档序号:570004阅读:365来源:国知局

专利名称::用于甘蔗属复合组的基于微卫星的指纹分析系统的制作方法
技术领域
:本发明涉及甘蔗属复合组成员(accession)的分子分析。本发明涉及甘蔗(^cc/^n^1spp.)的微卫星及其侧翼序列、微卫星分离的方法、适于使用这些序列进行指紋分析的方法以及可以用于如下应用的方法甘蔗属复合组成员的鉴定、种质收集物的管理、祖先的选择、品种之间的鉴别、杂交体的鉴定、需要的基因组序列的基因渗入、亲子关系的确定、基因和数量性状基因座(QTL)的作图和MAS(标记辅助的选择)程序的开发。
背景技术
:对可再生能源的寻找将甘蔗置于世界农作物中的突出的位置。从这种多年生禾本科植物的多汁茎中提取的汁液分别占全球糖和乙西f生产的75%和30%以上(Ming等人,2006,P/""fi^v.27:15-118;Orellana禾口BonalumeNeto,2006,iVfl^5zo^c/mo/.24:232)。随着全球对于乙醇的需求的增长,甘蔗种植正在向新的地区扩展,而且对于更高的田间产量具有持续的需求(Thomas和Kwong,2001,尸o/—29:1133-1143;Geller等人,2004,五脏g少尸o/一32:1437-1450;Gantz,2005,i^wewaZ^Fwe/A^ws17(27):1-6)。与改良的品种一样,需要适应新环境的新品种和改进的栽培技术,以提高糖和生物质的产量。在全世界范围内已经利用几个育种程序进行了甘蔗的遗传改良和用于粗放耕作的品种的开发(Tew,1987,7Vewr"r/^'esIn:HeinzDJ(编著)5Y^arcawe/m/rove附e"ZArowg/j^Breec^wg)ElsevierPress,Amsterdam:559-592;Machado,2001,6V/g"m3tweFia"'e(y/w^7za"'owa/Z)zVe"or少〃第7版)。总之,目前通过超过一个世纪的主要基于种质交换和育种技术发展的常规育种获得的结果,已经允许农作物在热带和亚热带地区广泛地种植,而且在甘蔗和糖产量方面已经产生了连年的持续增长(Hogarth等人,1977,Swg^cawe/mprovemewt/os^ac/n'eve厳她朋t//"Zwre/7my/ec^yIn:ManjitSK(编著)7m/rove附ewf/or2/"Ce她r乂LouisianaStateUniversity,Louisiana:29-55;Miocque和Machado,1977,/■40:9-13;Heinz和Tew,1987,场6"Wza"'owjoracedwms1In:HeinzDJ(编著)iSwgarcawe//w/rovemewf//zrowg/Sreecf/wg,ElsevierPress,Amsterdam:313-342;Matsuoka等人,1999,她Mc(ra膨w^<ieca打a-tie-ac^carIn:Bor6mA(编著)Me/Zzoramew^ocfees/^c^cw/"vac/叫ImprensaUniversitaria,V—sa:205-251;Berding等人,2000,Jdv"wcejz'w/ec/wo/ogy/orwgam2weIn:KeatingBA和WilsonJ(编著)/"&w57've^Mg^cawe^VWwWow.'MeedwgC7^/ewgesZ)e戸d2,,CABIPublishing,UK:141-156;Edm6等人,2005,C,.Sd.45:92-97;Jackson,2005,O,M92:277-290)。甘蔗属于禾本科(Poaceae)、蜀黍族(tribeAndropogoneae)、甘蔗属,公认具有6个种热带种(q侨d"an/m)、大茎野生种(<S.r06wW謂)、印度种(&Z^erO、中国种(51.wVzewse)、纟田茎野生种^ow^meww)和野生肉质花穗种edw/e)。印度种和中国种被认为是热带种和细茎野生种之间的天然的杂交体,而热带种起源于其发源地新几内亚巴布亚岛(Papua,NewGuinea)中心的大茎野生种的野生群体。如蔗茅属(五h"w^w)、硬蔗草属(^/ems/ac/z")、河八王属(iV^ewgG)和芒属(McawAi^)的其它属在种系发生学上与甘蔗相关,它们一起形成"甘蔗属复合組"(Daniels和Roach,1987,r"jcowo,aweevo/w"owz'wswgarcaweIn:HeinzDJ(编著)Swg^rcawe7m/rov,ewf万reed/wg,ElsevierPress,Amsterdam:7-84)。目前的品种是由主要涉及热带种、细茎野生种、印度种和中国种这4个种的初始种间杂交产生的杂交体(Irvine,1999,T7^or々少/.98:186-194)。甘蔗杂交体的基因组的主要部分来自富含糖的著名的热带种甘蔗(80%),10-15%来自适应环境应激且耐受病虫害的乡间细茎野生种甘蔗,很少一部分是杂交染色体(D'Hont等人,1996,Mo/.G饥G匿t250:405-413;Price,1957,嵐118:146-159;Roach,1969,尸亂MSoc.5"w,C羅rec/mo/.13:901-920)。大部分品种在一定程度上彼此相关,因为它们来自20世纪早期在爪哇(印度尼西亚)和印度进行的同样的初始杂交。从已知的谱系量化的杂交体的遗传基础局限于一小群热带种克隆,且^艮少来自其它种(Arcenaux,1967,尸rac./wtSoc./SwgarcaweT^c/mo/.12:844-854;Tew,1987,脸wIn:HeinzDJ(编著)S,厂c騰/,n9ve膨WAroMg7j5re^.wg,ElsevierPress,Amsterdam:559-592)。但是,由于甘蔗属的多倍性本质加上出现于种间杂交体中的非整倍性,通过分子方法评估的遗传多样性仍然较高(Jannoo等人,1999,77leor.々p/.99:171-184)。热带种的真正克隆具有2n=80(x二10)的基本染色体数,而细茎野生种具有2n=40-128(x4)的染色体数。由于在甘蔗的早期遗传改良中发生的转移过程(nobilisationprocess)(与热带种的反复的回交)中出现的非整倍性,杂交体的总染色体数可能在100-130之间变化(Bremer,1961,五w;/^"ca10:59-78)。商业品种的培育可能要花费12-15年才能完成一个周期,新性状的渗入(introgression)可能需要几十年时间(Skinner等人,1987,5Wec"oww"/io叔cr"m'a朋dzWz.cmIn:HeinzDJ(编著)5^garc朋e/mprovemeW/Arawg^&ee<i/"g,ElsevierPress,Amsterdam:409-452)。由种间杂交产生的祖先中的等位基因的高度杂合性(heterosigozity)、多倍性和非整倍性以及如田间表现、糖累积、纤维含量和病虫害耐受性等最重要的性状的定量遗传本质,使得后代的表现非常不可预测(Hogarth,1987,Cewe"cso/5^gorca"eIn:HeinzDJ(纟扁著)Swgarctme/附provemewfArowg7jElsevierPress,Amsterdam:255-271;Grivet和Arruda,2001,C群.O—.肠/.5:122-127;Hoarau等人,2002,7T^orj/7/7/.105:1027-1037;Ming等人,2006,尸/福3,《細.27:15-118;Wei等人,2006,77亂柳/.114:155-164)。需要涉及亲代测试的大量的杂交来筌定良好的对,而且筛选计划包括大的原始群体。为了克服这些瓶颈问题,育种人员已经在开发在品种选择的几个阶段使用的DNA标记,增加发现良好的亲本的机会,并减少开发的时间和费用(Butterfield等人,2004,&单《/组70:167-172;Manners等人,2004,尸,o匿力,o/Ae,/她na"'o朋/CVo/5WewceCowgmsivCasu等人,2005,F/e/dCVo/92:137-147;Mclntyre等人,2005,Mo/5厂ee乂16:151-161;Moore,2005,/"f.Swgar/107:27-31;Aitken等人,2006,Z7eor.j/p/.GewC112:1306-1317)。微卫星,也称为简单序列、简单序列重复(SSR)、简单重复DNA序列、短串联重复(STR)或简单序列基序(SSM),是在每种活生物体的基因组的编码区和非编码区发现的DNA段(stretches)。它们由许多串联重复的短核苷酸基序或重复单位组成。微卫星由1-6个串联重复的核苷酸单元形成,在基因组染色体拷贝之间其长度变化,且可以通过PCR(聚合酶链反应)检测,并通过不同的色谱方法显现为由大小不同的扩增DNA片组成的条码系统。微卫星的特征是它们是高度多态性的。即,每个微卫星"基因座,,可能具有许多根据多倍性的值(染色体拷贝数)而变化较大的"等位"形式。多态性STR基因座是每种生物体中对于鉴定、亲子关系检测和遗传学作图非常有用的标记。多态性是微卫星的一个特征,极大地有助于其在指紋分析中的实用性。最初描述了人类中的樣i卫星(Litt和Luty,1989,爿肌G潔t44:397-401),后来描述了如小鼠(Love等人,1990,M/c/.爿"'^i仏18(14):4123-4130)、猪(Johansson等人,1992,丄i/w^Z.83(3):196-198)和牛(Kemp等人,1993,爿mwfl/24:363-365)等其8它哺乳动物种中的微卫星。在人类中,微卫星的多态性已被广泛地用于个体鉴定,例如,在亲子关系和法医案例中,以及用于与遗传疾病相关的基因的作图中。例如,Caskey等人的美国专利第5,364,759号公开了用于法医和医学目的的人类个体指紋分析的定型分析,以及从DNA数据库鉴定微卫星序列的技术。也公开了具有适于包含于DNA序型分析中的特征的存在于人类基因组中的特定三聚和四聚短串联重复(STR)。Weber的美国专利第5,582,979号提供了从人类基因组DNA分离的多种具体的序列,其侧面为CA和GT二核苷酸重复,用于利用重复区域的多态性的法医和亲子关系检测。Perlin的美国专利第5,580,728号公开了使用含有显示DNA样品之间多态性的重复序列的扩增DNA序列的基因型分型方法和自动化系统。该专利描述了使用短串联重复(STR)的自动数据获取和解释技术和基于这样的聚合酶链反应(PCR)扩增的标记建立遗传图谱所需的步骤。Buard等人的美国专利第5,573,912号描述了以下方案使用大小分离的限制性内切酶消化物从DNA获得新的短串联重复区域,接着与相同种的基因组DNA杂交,并将杂交谱与使用含有可变串联重复区域的已知探针获得的杂交谱进行比较。没有公开直接用于基因型分型的具体序列。Polymeropoulos等人的美国专利第5,369,004号和第5,378,602号公开了适合作为用于医学目的和遗传学作图的人类DNA重复多态性检测的PCR(聚合酶链反应)引物的具体序列。Navot等人的美国专利第5,650,277号公开了一种确定微卫星中寡核苷酸重复的确切数目的方法,其中,每个重复长2个或3个核苷酸。该专利没有记载任何具体引物,而需要以前对于微卫星中的重复序列或微卫星侧翼序列的确定。微卫星已被用于包括水稻、玉米、大豆、大麦和番茄的各种植物的基因组作图,因而成为制作基因组图谱的重要工具。Zhao等人,1996,in4PP"ca"o/wo/re/e"'"》ese《wewces//awfgewoweawa/戸、In:PatersonAH(编著)Ma/7/7Z"g尸/aw&,R.G.LandesCo.,NewYork:111-125公开了DNA重复基序在植物基因组作图中的应用的综述。除了遗传学作图,微卫星还可以用于物理作图。例如,某些类型的重复可以显示在染色体上的特异性分布(Schmidt和Heslop-Harrison,1996,尸麼.淑/.」c"d,93(16):8761-8765),因而不同的微卫星可以用于基因组的不同区域的物理作图。微卫星也已经用于许多农作物的指紋分析,以及评估植物栽培品种、亚种之间的遗传多样性等。微卫星的主要优势在于它们甚至在种内和栽培品种之内也经常是高度多态性的。另外,微卫星的侧翼序列通常是基因座特异性的,因而提供了用于可靠地分离该基因组区域的特异性引物。微卫星在植物鉴定中的应用的例子包括葡萄藤栽培品种鉴定和栽培品种的遗传关联性的评估(Thomas等人,1994P/a^Mo/.25(6):939-949);为了天然种群中的共同亲本鉴定野生薯蓣的个体(Terauchi和Konuma,1994,G譜,37(5):794-801);芥菜种质的品种鉴定(Bhatia等人,1995,脸"—固^16(9):1750-1754);鹰嘴豆品种的鉴定(Sharma等人,1995,o固's16(9):1755-1761);玉米栽培品种种质遗传分析(Tammino和Tingey,1996,GWzome39(2):277-287);和水稻遗传多样性的栽培品种内变异的评估(Olufowote等人,1997,G譜膨40(3):370-380)。正在越来越多地使用微卫星标记,以通过连锁分析在植物基因组中定位特异的、经济上有用的基因。例如,通过聚合酶链反应(PCR)扩增和微卫星多态性的连锁分析,利用STR对靠近水稻Rfl基因(一种对于杂交水稻生产不可缺少的育性恢复基因)的微卫星标记作图(Akagi等人,1996,Gewome39(6):1205-1209)。该标记不仅可用于培育育性恢复系和保持系,而且可用于控制杂交水稻种子的纯度。微卫星是一类如上所述的基于DNA的分子标记,通常在植物改良中用于基因和性状作图和随后的MAS(标记辅助的选择)程序的开发(Rakoczy-Trojanowska和Bolibok,2004,CW/Mo/.杨/.丄说9:221-238;Varshney等人,2005,71823:48-55)。由于标记和区分种群共有的特异性基因组区域的能力,微卫星用作区分个体的指紋分析系统。在植物育种计划中,微卫星和其它DNA标记已被成功地用于种质收集物的鉴定、分类和管理、亲本选择、品种区别、需要的性状的'渗入和亲子关系的确定(Lee,1995,55:265-344;Eagles等人,2001,Xgnc.版52:1349-1356;Kirst等人,2005,T^mc/.96:161-166),而且经UPOV(植物新品种保护协会)的审查成为用于涉及所有权问题的品种鉴定的支持性鉴别工具(UPOV2005)。UPOV通过被称为区别性、均匀性和稳定性(DUS)测试的标准化程序评估调整的描述信息(descriptor)。满足DUS测试的要求的分子标记在UPOV考虑下,可用于与植物育种人的权利的实施相关的品种鉴定、技术检验和必要的推导的考虑因素。甘蔗改良中由种间或属间杂交产生的杂交后代在可以用于渗入研究之前,其-验证是必需的(Lee等人,1998,爿w"A"49:915-921)。甘蔗杂交体鉴定的传统的形态学方法是不可靠的,因为难以区分真正的杂交体与自花授粉后代或由花粉混杂产生的后代。分子标记提供了鉴定真正的杂交体的可靠的方法。甘蔗亲本的选择一般包括潜在候选物的初始测试,其中,通过特定的育种程序的常规选择方案评估双亲本杂交或多向杂交产生的少量的后代或家族(Heinz和Tew,1987,场ZnVfc""ow/^ocedwmsIn:HeinzDJ(编著)6Yfgarca"e/m户厂ovemewf,Anwg/z5reed/"g,ElsevierPress,Amsterdam:313-342)。那些产生优良个体的雄性和雌性的成对组合成为证实的亲本。然后重复同样的杂交以产生大量的后代用于品种选择。在多向杂交中,在第一阶段只可证明母本,但可以在发现正确的父本之前测试几个雄性。因此,多向杂交在理i仑上具有更高的揭示证实的亲本的可能性,而双亲杂交可以常少见且大量地进行,具有显示优良个体的优势。在多向杂交系统中育种人员可以尽快地鉴定所选择的克隆的父本,这可以减少开发新品种的时间和花费,而且对于实现改良的程度应当具有明显的影响(Buteler等人,1997,96:353-361)。确定亲子关系的方法非常重要,因为在甘蔗中育种效率非常低;例如,从1970年直到1989年,在巴西的IAA/PlanalSucar育种计划中,从评估的7.000.000林幼苗中只有不到0.0003%的后代被开发为商业品种。甚至在大多数用于育种计划的优良亲本之间进行全部的杂交组合实际上也是不可能的。传统上,使用只有一个母本和只有一个父本的双亲杂交。经常使用的其它策略是开放授粉中只涉及一个母本和8-40个父本的多亲本杂交(或多向杂交)。多向杂交方法已被用于甘蔗育种,以使处于幼苗测试阶段的后代中代表的杂交组合数最大化。反对使用多向杂交方法的主要理由是幼苗产生过程中发生谱系信息的快速丟失。提出了基于微卫星的亲子关系分析作为鉴定由多向杂交产生的后代的父本的有效方法。在某些例子中,确认母本也是必需的。在杂交之前根据活花粉的百分比将甘蔗祖先分为父本或母本。通常雄性比雌性具有生存能力更强的花粉,但自花授粉不能被自然的自交不亲和性机制完全避免,预期其会发生,尽管其水平未知。可预知自花授粉产生的后代具有较低的活力,因而高水平的自殖可能影响高水平的家族的性能,掩盖祖先的育种价值。量化杂交中的自殖水平的标记方法是基于鉴定或不鉴定后代样品中的父本特异性等位基因(Mclntyre和Jackson,2001,五w;/^"ca117:245-249)。用一组基因座对一定数量的幼苗进行基因型分型,那些没有父本特异性等位基因的幼苗被认为是自花授粉的产物。开发微卫星标记的常规技术是昂贵、耗时的,且一般需要几个步骤(Cordeiro等人,1999,PtoMo/.肠/.17:225-229)。在专业文献中,只有有限数量的微卫星标记可用于甘蔗,另外,这些标记的质量不完全适合指紋分析的目的(Aitken等人,2005,T7^or.j/p/.110:789—801;Arro,2005,In:MSThesisGewe"cZ)/vera"j;^4mo/zg"SMgoTcaweC7owest/Wwgrarge/ieg7'ow爿m/7/z,""owPo(ymor//j&m(7Vop,Markersawt/Ped/greeie/a"ows^/ps,LouisianaStateUniversity,Louisiana;Casu等人,2005,i^'e/c/Oo戸92:137-147;Cordeiro,2001,Mo/ecw/ar画rA:er"stems/orswgan^megerm//oswawa/戸'51In:HenryRJ(编著)尸/awf(7ewo妙/wg-77^Z)濕P/a魄.CABIPublishing,Wallingford:129-146;Cordeiro等人,1999,尸/耐Mo/.肠/.鄉.17:225-229;Cordeiro等人,2000,/7朋/155:161-168;Cordeiro等人,2003,P/a"/165:181-189;Garcia等人,2006,7T^or.」p//.112:298-314;Jannoo等人,2001,尸簡.Soc.C匿rec/mo/.24:637-639;Pan等人,2003,48:319-329;Pan等人,2003,尸to^m.ma/G譜meJZ^&acfJZ^^ac/丑ooA:^7《久'43;Pinto等人,2004,47:795-804)。由EST(表达序列标签)代表的表达的甘蔗基因组已被测序,且成为《效卫星标记的丰富的来源(Silva,2001,Mo/.Ao/.24:155-159;Vettore等人,2001,G饥Mo/.5/o/.24:1-7)。开发稳定性足以在标准条件下重现并且区别个体的分子标记系统已成为甘蔗培育者的一个主要的关注点(Cordeiro,2001,Afo/ecw/armarA:er"We附s/o厂wgarcaweger附/7/wmawa/,'51In:HenryRJ(编著)尸/a"fGe"o妙Z"g-T7zeD編Fzwger戸w"wgo/户/a魄CABIPublishing,Wallingford:129-146)。发明概述本发明公开了用于鉴定、评估和确认来自甘蔗属复合组、尤其是来自甘蔗属的种的基因组中存在的、作为表达序列标签-序列获得的微卫星标记的方法和手段,和这些标记在甘蔗属复合组成员的指紋分析中的应用。本发明的一个目的是,提供选择一套能够区分大量甘蔗属复合组成员的表达序列标签衍生的微卫星标记的方法和手段,所述甘蔗属复合组成员共有不同水平的家系以(a)建立在用于检测DNA标记多态性的两种常用和普及的技术聚丙烯酰胺凝胶电泳(PAGE)和DNA序列分析仪分析之后用于结果重现的技术条件;(b)使用标记有权问题的候选支持系统。本发明也提供了可从甘蔗获得的分离的微卫星序列,以及对于本发明的微卫星序列特异性的侧翼序列。也提供了使用由这些微卫星和侧翼序列设计的探针和引物的方法,以及包含这些探针和引物的试剂盒。第一方面,本发明提供了分离的多核苷酸,其包含至少一种微卫星重复和至少两种相关的侧翼序列。在一种实施方式中,本发明的分离的多核苷酸包含选自以下的序列(i)SEQIDNO:1-10所示的序列;(ii)与SEQIDNO:1-10所示的序列互补的序列;和(iii)微卫星中的重复数有变化的(i)或(ii)的序列的变体。第二方面,本发明提供了用于扩增位于甘蔗或相关属(甘蔗属复合组)的DNA中的微卫星的、包括正向引物和反向引物的引物对。适于聚合酶链反应(PCR)扩增微卫星的引物对可以选自SEQIDNO:11-30。第三方面,本发明提供了用于确定甘蔗属复合组的样品中的基因型的方法。该方法包括确定甘蔗属复合组的基因型,并将所述打分结果与预定的已知样品的DNA的分析结果进行比较。使用该方法可以鉴定未知样品。鉴定方法可以用于种质收集物的管理;用于鉴定属于或不属于两种不同的种的不同基因型之间的杂交体;用于鉴定贴错标签的通过组织培养程序产生的小植抹样品;用于鉴定甘蔗地中的植物的品种混合物;用插入基因的特异性引物通过多重标记组鉴定和才企测转基因。第四方面,本发明提供了希望的基因组序列从甘蔗属复合组样品的一个成员向另一个成员渗入的方法。第五方面,本发明提供了通过利用本发明的微卫星评估祖先之间的遗传相似性的能力,从甘蔗属复合组中选择祖先的方法。第六方面,本发明提供了在父本和/或母本未知的情况下确定祖先的方法。第七方面,本发明提供了用于量化在涉及一个或多个甘蔗属复合组祖先的特定杂交产生的幼苗样品中的自花授粉的方法。本发明的第八方面,本文提供了使用可商购的聚合酶链反应(PCR)装置来检测甘蔗属复合组的样品的成员的试剂盒。第九方面,本发明提供了用于开发MAS(标记辅助的选择)程序的与数量性状基因座(QTL)的等位基因相关联的基因的定位(作图)方法。附图简述图1显示简单序列重复(SSR)指紋识别系统区分甘蔗属复合组成员和共有不同水平的亲缘关系的相关种的能力,如实施例5所述。图2显示简单序列重复(SSR)指紋识别系统区分品种RB855002的48个自花授粉的Fl后代的能力,如实施例5所述。图3显示多向杂交中亲子关系的确定。如实施例7所述,RB966928是母本,有30种可能的父本,29种父本加上也可以作为父本的母本(自花授粉)。发明详述本发明公开了通过在甘蔗属复合组的基因组中的微卫星分析基因型分型和鉴定,检测和鉴定甘蔗属复合组成员的方法和手段。本发明提供了新型的分离的微卫星DNA序列和这些微卫星侧翼的DNA序列,这些序列可从甘蔗成员获得。特别地,本发明提供了(i)SEQIDNO:1-10的分离的多核苷酸序列;和(ii)SEQIDNO:1-10序列的互补序列;和(iii)其变体。第一方面,本发明提供了分离的多核苷酸,其包含至少一种微卫星重复和至少两种相关的侧翼序列。在一种实施方式中,本发明的分离的多核苷酸包含选自以下的序列(i)SEQIDNO:1-10所示的序列;(ii)与SEQIDNO:l-10所示的序列互补的序列;和(iii)微卫星中的重复数有变化的(i)或(ii)的序列的变体。15本发明的分离的多核苷酸序列在以下方面具有实用性(a)甘蔗属复合组成员的鉴定,(b)DNA多态性的检测,(c)基因组作图,和(d)植物组织、群体、栽培品种、种和种组别之内和之间的遗传变异性的评估。具有单拷贝侧翼序列的分离的微卫星重复提供了基因座特异性的标记。侧翼序列可以用来设计基因座特异性的引物,以扩增并检测植物基因组中微卫星序列的存在。甘蔗属复合组植物DNA可以是基因组DNA或cDNA。一般地,微卫星更频繁地出现于基因组的非编码区域,但这不排除分离可能存在于转录区域的微卫星,如存在于由其衍生的mRNA和cDNA中的微卫星,本领域的技术人员熟知该过程。在本发明中,DNA优选地是cDNA。筛查352,122个甘蔗表达序列标签EST的数据库,搜索具有简单序列重复(SSR)基序的序列。通过将来自SUCEST计划(Vettore等人,2001,Mo/.所o/.24:1-7)和已经存储于GenBank的其它来源(Be謂n等人,2006,iVwc/e/cv4"AL34:16-20)的公共可以获得的序列与个人创建的数据库(www.alellyx.com.br)相结合,获得352,122个甘蔗EST序列(读数)的丰余数据库。使用微卫星鉴定软件,在这种具体的例子中使用MISA软件,筛查丰余表达序列标签EST数据库,搜索单一的和复合的简单序列重复(SSR)基序(Thiel等人,2003,77亂柳/.106:411-422)。将计划设置为鉴定大小为1(一)、2(二)、3(三)、4(四)、5(五)和6(六)个核苷酸的重复基序。设置基序中的重复单元数的下限为对于一个核苷酸的基序为至少IO个重复、对于二个核苷酸的基序为6个重复,对于四、五、六个核苷酸的基序为至少5个重复。复合基序被定义为具有被100个或更少的碱基分隔的两个或多个重复基序的基序。装配确认的含有简单序列重复(SSR)的表达序列标签EST序列的亚凄t才居库,以形成如Telles和Silva,2001,Afo/.5"/.24:17-23记载的丰余序列的群。根据简单序列重复(SSR)基序的类型将群分类。对于基序的每种类型,按照两种标准分别进行候选标记的选择具有最大数目的重复单位数不同的读数的群(计算机模拟的多态性),和具有含有最大数目重复单位的读数的群(潜在的多态性)。本发明的第二方面,提出了用于扩增位于甘蔗属复合组成员的DNA中的微卫星的、包含正向引物和反向引物的引物对。适于聚合酶链反应(PCR)扩增微卫星的引物对选自SEQIDNO:11-30。借助用于设计聚合酶链反应(PCR)引物的程序,如软件Primer3(Rozen禾口Skaletsky,1998,尸n'mer3owf/ie『『『/orgewe厂a/wse^s1/or6《o/ogz\stprogram附ersIn:KrawetzS.禾口MisenerS.(纟扁著)HumanPress,Totowa:365-382),为每种计算机选择的群设计引物对。将程序设定为在装配的共有序列中鉴定解链温度(Tm)为大约64。C、长度分别为19-22个碱基、包含简单序列重复(SSR)基序侧翼序列(距基序的5'和3'端至少5个碱基)的引物对,并扩增100-250bp的片段。本发明的第三方面,提出了用于确定甘蔗属复合组的样品中的基因型的方法。该方法包括以下步骤(i)从样品获得DNA;(ii)扩增选自以下的简单序列重复(SSR)基因座(i)SEQIDNO:1-10所示的序列;和(ii)与SEQIDNO:l-10所示的序列互补的序列;该扩增4吏用选自以下的DNA中的一套引物(i)SEQIDNO:11-30所示的序列;(ii)与SEQIDNO:11-30所示的序列互补的序列;和(iii)包含SEQIDNO.11-30引物对的SEQIDNO:11-30所示序列的至少6个连续核苷酸的序列,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)对所述分离的结果打分;和(v)比较所述打分结果与预先已经分析并确定的已知种的DNA的分析结果。该方法允许鉴定用于将甘蔗属复合组的样品与植物来源相关联的成员,包括以下步骤(i)用本方法确定所述样品中的DNA的身份,(ii)用本方法确定已知植物基因型的样品中的DNA的身份;和(iii)比较两种样品的基因型以确定样品(i)的身份。用于确定甘蔗属复合组样品的基因型的鉴定方法可以用于不同的应用,例4口(a)种质收集物的管理、分类类似的克隆、排除复本和鉴定贴错标签的成员。国际甘蔗技术人员协会已经确认种质的指紋分析是一项重要的事项;(b)鉴定属于或不属于两个不同种、属的不同基因型之间的杂交体;(c)通过鉴定贴错标签的由组织培养程序产生的小植抹样品证实"质量控制";(d)鉴定来自甘蔗地证明苗圃的植物的品种混合物;和(e)使用插入基因的特异性引物通过多重标记组鉴定和检测转基因。第四方面,本发明提供了希望的基因组序列从甘蔗属复合组样品中的一个成员向其它成员渗入的方法,使用标记组在后代中鉴定那些具有来自在杂交中使用的母本和父本的等位基因的杂交体。该方法包括利用以下步骤鉴定母本和父本的等位基因(i)从样品(例如母本和父本和后代)获得DNA,(ii)利用选自SEQIDNO.11-30的引物对的DNA中的一套引物扩增简单序列重复(SSR)基因座,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)鉴定父本和母本的专有等位基因(exclusivesalleles);(v)鉴定兼有父本和母本的专有等位基因的后代个体(杂交体个体)。结果可以用来选择具有可在即将进行的杂交中使用的、具有希望的渗入基因组序列的杂交体个体。第五方面,本发明提供了通过利用微卫星评估成员之间的遗传相似性的能力来选择祖先的方法。该方法包括确定将要用作杂交亲本的选择的一组甘蔗属复合组样品的基因型,和借助于特定的遗传相似性评估软件(例如,NTSys)进行所述打分结果的比较。该分析的结果将会提供成员之间的遗传相似性的指数,该指数可以用来推进具有更高的产生改良后代(杂种优势)的可能性的双亲杂交(一个父本和一个母本)。该方法包括利用以下步骤确定选择的一组甘蔗属复合组样品的基因组(i)从样品(如一组甘蔗成员)获得DNA,(ii)用选自SEQIDNO.11-30的引物对的DNA中的一套引物扩增简单序列重复(SSR)基因座,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)产生具有打分结果的微卫星二进制数据;和(v)借助特定的遗传相似性评估软件,对含有打分结果的二进制数据进行数学处理,以产生亲本选择指数。产生的指数可以用来选择将要在杂交中使用的亲本。利用甘蔗属复合组育种群体中的遗传多样性的评估产生遗传距离指数,育种人员使用该指数可以预测亲本的杂种优势和后代的性能(Lima等人,2002,T7^o厂.104:30-38)。4吏用在指紋分析育种群体后产生的微卫星二进制数据可以容易地计算这些指数,且这些指数已经用来指导亲本的选择。杂种优势的预测使得杂交和待筛选的后代的数量减少,并且对于开发新品种的费用和耗时具有直接的影响。预期在重要基因和性状的作图以及随后标记辅助选择方案的开发中使用这种微卫星组和其它DNA标记将会产生同样的效应(Mclntyre等人,2005,Mo/.5"W.16:151-161)。第六方面,本发明提供了在父本和/或母本未知的情况下确定甘蔗属复合组成员的亲子关系的方法。该方法包括确定甘蔗属复合组(后代)的基因型,并比较所述得分结果与来自母本和可能的父本成员的DNA的分析结果。结果首先比较后代的等位基因和母本的专有等位基因。一旦确认了母本等位基因,后代中的其余等位基因就是父本特异性的。进行搜索以鉴定可能的父本,其具有全部父本特异性的等位基因,且应该是后代的真正的父本。甘蔗属复合组的基因型的亲本鉴定包括以下步骤(i)从成员(例如后代、已知的母本和可能的父本)获得DNA,(ii)用选自SEQIDNO.11-30的引物对的所述DNA中的一套引物扩增简单序列重复(SSR)基因座,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)鉴定母本和父本特异性的等位基因;和(v)鉴定真正的父本。第七方面,本发明提供了用于量化由涉及一种或多种祖先的特定杂交产生的甘蔗属复合组幼苗样品中的自花授粉的方法。该方法包括确定甘蔗属复合组的基因型,并比较所述打分结果与来自亲本成员的DNA的分析结果。该结果比较后代的等位基因与母本和父本的专有等位基因。确认为不含有父本专有等位基因的后代是自花授粉的产物。通过在几个后代中进行这样的分析,可以计算特异性杂交产生的幼苗样品中的自花授粉百分比。幼苗样品中的自花授粉的确定包括以下步骤(i)从样品(例如后代和亲本)获得DNA,(ii)用选自SEQIDNO.11-30的引物对的DNA中的一套引物扩增简单序列重复(SSR)基因座,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)鉴定父本和母本特异性的等位基因;和(v)鉴定只含有母本的专有等位基因的后代。本发明的第八方面,提供了使用聚合酶链反应(PCR)装置检测甘蔗属复合组成员的试剂盒。该试剂盒包括一种或多种适于通过聚合酶链反应扩增复合组样品中的核苷酸序列的引物对,其中,该核苷酸序列包括SEQIDNol-10的序列。优选地,该试剂盒包括具有SEQIDNO:11-30的引物对。试剂盒可以利用多重方法。试剂盒可以进一步包括引物、酶、r"《聚合酶,例如,适于通过聚合酶链反应进行扩增的盐和緩冲液。试剂盒也优选地包括阳性对照。在试剂盒的某些优选的实施方式中,引物包含标记,借此可以检测到扩增的微卫星。在试剂盒的其它优选的实施方式中,提供了标记的核酸。可观察的标记优选荧光分子或放射性核苷酸。试剂盒也可包括用于容纳这些试剂和/或方便使用的合适的容器和瓶。第九方面,本发明提供了用于开发MAS(标记辅助的选择)程序的基因和数量性状基因座(QTL)的定位(作图)方法。标记辅助的选择(MAS)基于以下概念可以从紧密连接基因的标记的存在推断该基因的存在。如果标记和基因相距较远,那么由于双重交20叉重组事件,它们一起传递给后代个体的可能性会减少。因此,在这样的选择中使用标记的先决条件是它们应该紧密地连接感兴趣的基因。为了这个目标,遗传连锁图镨上的区域(包括感兴趣的基因座)的饱和是必需的。饱和是相对项,且饱和度取决于需要图谱的目的。饱和度是被标记以一定密度覆盖的基因组的比例,该密度使得标记之间的最大分离不大于几个厘摩(centimorgan)。定义如本文所用,"微卫星"也称为简单序列、简单序列重复(SSR)、简单重复DNA序列、短串联重复(STR)或简单序列基序(SSM),们由许多串联的重复短核苷酸基序或重复单位组成。微卫星由1-6个串联重复的核苷酸单位形成,在基因组染色体拷贝之间其长度变化。微卫星是高度多态性的。如本文所用,术语"侧翼序列"指与微卫星相邻的非重复的核香酸序列。"独特侧翼序列"是那些只在基因组内的一个位置发现的侧翼序列。如本文所用,"成员"指组成甘蔗属复合组的任何种、属、种间杂交体、属间杂交体的个体。甘蔗属复合组是甘蔗属的所有种,以及与甘蔗在系统发生学上相关的属蔗茅属和芒属、硬蔗草属和河八王属的种。如本文所用,术语"多核苷酸"包括正义链和反义链的DNA和RNA分子,并包括cDNA、基因组DNA、重组DNA和完全或部分合成的多核苷酸。本发明提供的所有多核苷酸都是分离的和纯化的,这些术语在本领域中普遍使用。如本文所用,术语"引物,,是单链寡核苷酸,当置于诱导合成互补的引物延伸产物的条件下时,其能够作为从特定的序列合成DNA或RNA的起点。"引物对"是两条引物,包括在待扩增的DNA序列的一个末端与单链杂交的引物1和与待扩增的DNA序列的互补链的另一个末端杂交的引物2。选择"引物对"以检测特定的微卫星。选择每个引物对的每个引物与待扩增的每个特定微卫星序列的侧翼序列或侧翼序列的变体的不同链互补。尽管引物序列不需要反映天然存在的侧翼序列的准确序列,但是3'末端越接近地反映准确的序列,在退火阶段的结合越好。可以如Caskey等人的美国专利第5,364,759号所述,采用不同的标记,以区分延伸产物。"聚合酶链反应"或"PCR"是一项技术,其利用变性、与引物退火和用DNA聚合酶延伸的循环将靶DNA序列的拷贝数扩大大约106倍或以上。Mullis等人的美国专利第4,683,195号和Mullis的美国专利第4,683,202号涵盖了用于扩增核酸的聚合酶链反应方法,本文引入这两篇文献作为描述该方法的参考。如本文所用,术语"序列的变体,,包括进入微卫星的重复数量具有改变的序列。引物变体异意味着具有碱基缺失、添加或取代,其不改变引物用于扩增微卫星的能力。如本文所用,"等位基因"是与DNA的片段有关的遗传变异,即,占据同样的基因座的DNA序列的两种或多种替代形式之一。"DNA多态性"是DNA序列中的两种或多种不同的核苷酸序列共存于同一种间杂交群体中的状态。"多态性信息含量"或"PIC"是存在于基因座中的多态性的量的量度值(Botstein等人,1980,爿附.丄i/wm.32:314-331)。PIC值的范围是0-1.0,该值越高表示多态性程度越大。该量度值一般显示比其它常用的量度值(例如杂合性)更小的值。对于信息高度丰富(超过大约70%的杂合性)的标记,杂合性和PIC之间的区别微小。本文使用的所有技术术语是生物化学、分子生物学和农学中常用的术语,且可以被本发明所属的
技术领域
的技术人员所理解。这些才支术术语可以在以下文献中找到Mo/eci//『C/om'"g:丄a6orafoo;Mm認/,第3版,巻1-3,Sambrook和Russel编著,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,2001;Cw/Tewf/Vc^oco/sMo/ecw/a厂Ausubel等人编著,GreenePublishingAssociatesandWiley國Interscience,NewYork,1988(定期更一斤);Short尸ra&co/siVo/oco/sMo/ecw/arAo/ogy,第5版,l画2巻,Ausubel等人编著,JohnWiley&Sons,Inc:,2002;Gewome」wa/戸、.'^Z/"60rafoA7Mawwa/,1-2巻,Green等人编著,GoldSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,1997。涉及植物生物学技术的方法在本文中描述,且在i口MeAocfe尸/awfMo/ecw/arSz'o/ogy.,j丄a60ra^or7CowraeMawwa/,Maliga等人编著,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,1995的方法学^仑述中详纟田4笛述。伊J^口,在Imiis等人,PC7iVo化co/s:jGw法ZoMeZ/otis^p/z'ca"o叫AcademicPress,SanDiego,1990禾口Dieffenbach牙口Dveksler,Pnwer:^4丄a60ra紐少Mawwa/,第2版,ColdSpringHarborLaboratoryPress,ColdSpringHarbor,N.Y.,2003中描述了使用PCR的各种技术。通过下面的具体的实施例进一步说明本发明。提供实施例只是为了说明,而非以任何方式限制本发明的范围或内容。实施例实施例1..:甘蔗微卫星重复序列的鉴定甘蔗EST序列的数据库通过将来自SUCEST计划(Vettore等人,2001,Gew.Mo/.24:l画7)和已经存储于GenBank的其它来源(Benson等人,2006,A^c/^c/^s.34:16-20)的公共可以获得的序列与个人创建的数据库(www.alellyx.com.br)相结合,获得352,122个甘蔗EST序列(读数)的丰余数据库。简单序列重复(SSR)标记的计算机选择使用用于微卫星鉴定软件,在这种具体的例子中使用MISA软件(Thid等人,2003,7T^orJ///.G^"W.106:411-422),筛查丰余EST数据库,搜索单一的和复合的简单序列重复(SSR)基序,该搜索的结果总结于表1中。软件鉴定了36,950个简单序列重复(SSR)基序,并检索了33,324个丰余序列(9.46%)。将数据库汇编为79,526个群,其中14,291个包含简单重复SSR基序(18%)。在这些群中,10,580个(75%)具有单一基序,3,705个具有两种或多种基序。表2显示根据基序的类型分类的36,950个含有SSR的丰余序列的分布。最丰富的单位大小基序是三基序(48%),接着是一基序(32%)和二基序(16%)。在1,414个序列中确认了四、五和六基序,占含有SSR的数据库序列的不到5%。为了选择用于开发简单序列重复(SSR)标记的序列,将36,950个含有SSR的丰余序列与涉及读数和群名称和重复单位大小、数量和序列的信息一起组织在亚数据库中。首先,根据重复单位大小对候选简单序列重复SSR标记的这种亚数据库进行分类,并分为7个读数子集(复合、一、二、三、四、五和六基序)。由于我们自己关于这些单位重复在聚丙烯酰胺凝胶电泳(PAGE)和DNA序列分析仪中的低分辨率的经验,具有一和二基序的序列没有进一步在标记选择中使用。如下分别处理其余5个读数子集。按照群的名称对每个子集进行分组。对属于同一群的读数的检查显示了共有具有相同单位大小和序列的基序,但重复单位数不同的序列。选用计算机观察到的这种多态性作为选择标准。然后对于具有最大数目的在重复单位数方面不同的读数的群,将每个子集分类。单独对于排序最高的群检查足以设计引物的5'和3'序列,并且选择63个共有序列进一步表征。第二轮的计算机选择包括根据含有具有最大数目的重复单位的读数(因而具有含大量等位基因的可能性)的群对子集进行分类。此时,不能被读数较好地代表而且可能在第一轮选择中遗漏的群被良好地排序。检查排序最高的群的足够的5'和3'序列,并且24选择49个共有序列进一步表征。,选择总共112个群用于设计引物和进一步由确认程序评估。表3概括了在两种选择标准下进行的含有SSR的群的计算机选择结果。引物设计借助用于设计聚合酶链反应的程序,在该情况下使用软件Primer3(Rozen禾口Skaletsky,1998,Pn'mer3owZ/je『『『/o厂gewera/z^yers/or6Zo/og&ZprogrammersIn:KrawetzS.和MisenerS.(纟扁著)HumanPress,Totowa:365-382),设计用于每种计算机选择的群的一对引物。程序设定为鉴定装配的共有序列中解链温度为大约64。C、长度分别为19-22个碱基、包含SSR基序的侧翼序列(距基序的5'和3'端至少5个碱基)的引物对,并扩增100-250bp的片段。根据表4,在序列表中描述了这些序列。表l.在甘蔗EST数据库中搜索SSR基序的结果的总结单一序列总数频率(%)数据库单一序列352,122100%具有SSR的单一序列33,3249.46%鉴定的SSR基序36,95010.49%具有>1基序的单一序列2,9360.83%复合的SSR基序2,3940.68%装配序列总数频率(%)*装配序列(群)79,526100%具有SSR的装配序列14,29117.97%(100%)具有1个SSR的装配序列10,58613.31%(75%)具有2个SSR的装配序列2,1852.74%(15%)2具有3个SSR的装配序列7370.93%(5%)具有〉3个SSR的装配序列7830.98%(5%)*括号中的值指根据每个序列中基序的数量,含有SSR的装配序列的分布。表2.甘蔗EST单一序列数据库中SSR基序根据单位大小的分布根据单位大小的基序的类型序列频率(%)所有类型36,950100%l(一)11,97832.42%2(二)5,84615.82%3(三)17,71247.93%4(四)6441.74%5(五)5271.42%6(六)2430.66%表3.根据"计算机模拟的多态性"和"可能的多态性"标准进行的112个群的选择基序类型选择的群选择标准等位基因数重复数复合的125(42%)7(58%)二4533(73%)12(27%)四2914(48%)15(52%)五134(31%)9(69%)137(54%)6(46%)总数11263(56%)49(44%)表4.微卫星和具有序列表中所示的序列的引物之间的关系基因座序列引物F引物RCV22SEQIDNO1SEQIDNO11SEQIDNO12CV29SEQIDNO2SEQIDNO13SEQIDNO14CV37SEQIDNO3SEQIDNO15SEQIDNO16CV38SEQIDNO4SEQIDNO17SEQIDNO18CV60SEQIDNO5SEQIDNO19SEQIDNO20CV78SEQIDNO6SEQIDNO21SEQIDNO22CV79SEQIDNO7SEQIDNO23SEQIDNO24CV94SEQIDNO8SEQIDNO25SEQIDNO26CV104SEQIDNO9SEQIDNO27SEQIDNO28CV106SEQIDNO10SEQIDNO29SEQIDNO30实施例2在计算机验证之后,用于聚丙烯酰胺凝胶电泳(PAGE)和DNA序列分析仪系统中的甘蔗属复合组指紋分析的一套含有SSR的基因座的选择建立具有两个阶段的验证过程,目标为选择适于在聚丙烯酰胺凝胶电泳(PAGE)和DNA片段检测系统中进行甘蔗属复合组指紋分析的10对引物(基因座)。第一阶段(排除)包括使用选择的所有引物对从4个甘蔗属复合组成员(Caiana、Q136、RB835054和RB855036,表5)扩增DNA,和在聚丙烯酰胺凝胶电泳(PAGE)中分析片段。观察序型并根据关于扩增序型的视觉质量(visualquality)(片段在预期大小范围之内并且强度和分辨率足够打分)、片段的多态性(至少4个不同大小的片段)和如残迹(stutters)的PCR(聚合酶链反应)伪迹的低发生率的标准对其打分。在排除候选标记(引物对)之前,进行聚合酶链反应和聚丙烯酰胺凝胶电泳(PAGE)3次。数据如表6所示。总之,序型的质量不足(聚合酶链反应质量和伪迹标准)导致57%的候选基因座(64个)被排除,而低多态性导致25%(28个)被排除。在该验证阶段结束时选择代表5种类型的简单序列重复(SSR)基序的总共20个基因座(18%)。验证程序的第二阶段(分类)包括使用在第一阶段预先选择的20对引物(基因座)从27个甘蔗属复合组成员(表5)扩增DNA,接着分析。在聚丙烯酰胺凝胶电泳(PAGE)和DNA序列分析仪(使用以荧光染料标记的正向引物)上分析扩增反应产物,根据3个标准评估并排序PCR(聚合酶链反应)反应的质量(片段在预期大小范围之内并且强度和分辨率足够打分);序型的多态性(具有高PIC值的至少6个不同大小的片段);和如残迹的PCR伪迹的低发生率。由27个用于验证的甘蔗属复合组成员中的等位基因的总数和频率计算每个基因座的PIC值(表7)。所有基因座的多态性信息含量(PIC)值足够高(0.774-0.918),因而,序型的视觉质量是分类的强制性标准。在已经对序型评估和排序之后,选择前10个基因座,以组成基于简单序列重复的指紋分析系统。数据打分和分析每种成员的等位基因显现为条带(聚丙烯酰胺凝胶电泳-PAGE)或峰(DNA序列分析仪),并由至少两名分析员人工打分为存在(1)或不存在(0)。通过以下公式计算标记的多态性信息含量(PIG)的值(Weber,1990,G譜肌cs7:524-530;Anderson等人,1993,36:181-186),其中,Pij是基因型(i)中的第j个等位基因的频率。将打分的等位基因作为离散变量输入二进制数据矩阵(matrix)。使用用于确定遗传相似性的软件,尤其是NTSYSpc版本2.20(Rohlf,2002,7VrSy5/c:AA画enca/r"xo"om;;S"&附,ver.2.2,ExeterPublishingLtd.,Setauket,NY),进行群分析。用Jaccard系凄t评估成员之间的相似性(Sneath和Sokal,1973,7Vwwen'ca///^戸Vz一/esprac"'ceo/w"me"'ca/c/a肌yca"ow,Freeman,SanFrancisco,573p),并且才艮据用未加4又对组法(unweightedpairgroupmethod)以算术平均数(UPGMA)计算的评估的相似性描述这些群。使用简单匹配(SM)系数(Sokal和Michener,1958,C/m'v.《a"愿歸.38:1409-1438)来计算区别两种成员的等位基因数[(l-SM)x等位基因的总数=区别性等位基因的数目]。使用公式Pid=ZX2计算代表两个随机选择的个体共有相同基因型的可能性的遗传一致性的概率(Pid),在公式中,x是基因型频率(Paetkau等人,1995,Mo/.五co/.4:347-358)。通过乘以所涉及的每种基因座的相应Pid值计算基因座组合的Pid。表5.在SSR标记验证程序的第二阶段中进行指紋分析的27个甘蔗成员和相应的直接谱系的列表成员*母本父本Caiana(热带种)未知未知Co740P3247P4775IAC86-2210CP52-48Co798Olhuda(热带种)未知未知PretaKavangire(热带种)未知未知Q136NCo31054N7096RB72454CP53-76未知RB835054RB72454NA56-79RB835486L60-14未知RB855036RB72454SP70-1143RB855453TUC71-7未知RB855536RB72454SP70-1143RB867515RB72454未知RB925345H59-1966未知RB928064SP70-1143未知SIRB835054RB855036S2RB835054RB855036S3RB835054RB855036S4RB835054RB855036S5RB835054RB855036S6RB835054RB855036S7RB835054RB855036S8RB835054RB855036SP80-1842SP71-1088H57-5028SP81-3250CP70-1547SP71-1279SP83-2847HJ5741SP70-1143SP89-1115CP73-1547未知*成员Sl到S8是半近亲品种RB835054和RB855036之间杂交产生的Fl后代。表6.显示在112个候选物中选择20个基因座的SSR标记验证程序第一阶段的结果的概括。基序类型(基因座数)湘,除标准*选择的基因座PCR质量等位基因数PCR伪迹总数复合的(12)5(41%)2(17%)3(25%)2(17%)三(45)23(51%)11(24%)5(11%)6(14%)四(29)13(45%)9(31%)2(7%)5(17%)五(13)3(23%)4(31%)3(23%)3(23%)30六(13)7(53%)2(16%)0(0%)4(31%)总数(112)51(46%)28(25%)13(11%)20(18%)*根据PCR质量的排除包括未扩增、低扩增和预期大小范围之外的片段的扩增。PCR伪迹主要指残迹(stutter)的频率和强度。等位基因数指单一形态的序型或具有少于4个的不同片段的组合序型。表7.显示为形成甘蔗属复合组指紋分析系统而选择的前10个基因座的SSR标记验证程序第二阶段的结果的概括基因座基序类型分类标准*状态分辨率伪迹PIC值CV29四++++++0.91选择CV38五++++++0.90选择CV37四++++++0.87选择CV106二++++++0.83选择CV104五++++++0.82选择CV60++++++0.76选择CV79++++++0.75选择CV94复合的++++++0.74选择CV78五+++++0.89选择CV22四+++++0.80选择CV133二+++++0.82未选择CV98二+++++0.80未选择CV128二+++++0.79未选择CV80四+++++0.81未选择CV86四+++++0.80未选择CV58++++0.89未选择CV140++++0.84未选择CV135二++++0.83未选择CV51二++++0.75未选择CV23复合的+++0.91未选择*下面的符号用来评估聚丙烯酰胺凝胶电泳(PAGE)和DNA序列分析仪系统中的伪迹的片段分辨率和强度+(满意/高)、++(好/中等)和+++(优秀/低)。分类标准的重要性次序是分辨率>伪迹>多态性信息含量PIC值。用在27个用来验证的成员中观察到的等位基因数和频率计算多态性信息含量PIC值。实施例3使用选择的微卫星甘蔗标记进行基因型分型才直物材并牛和组织才羊品选择1,205个甘蔗属复合组成员和来自于几个国家和国际育种计划和种质库的相关种,用于本研究(表8)。自殖(自花授粉)和种间杂交的后代和巴西商业品种的体外小植物分别由公司的育种站和组织培养设施生产。AlellyxAppliedGenomics(Campinas,SaoPauloBrazil)提供了由愈伤组织再生的转基因植物。位于巴西主产区(东北和中南部州)的工厂提供了由普通种子甘蔗繁殖的田间生长的植物。为了确保最均质的材料,收集组织样品,并送交由标准化协议指定的分析。为了避免贴错标签并具有跟踪能力,在用条码标签标识的塑料袋或试管中储存样品。员和相关的种。DNA提取程序从甘蔗属复合组和相关种的叶、根和芽中提取总DNA。如下进行大规模制备。将大约100mg组织粉末(用液态N2研磨)悬浮于700|uL提取緩冲液中(100mMTris-HClpH8.0、20mMEDTA、2%CTAB、1%PVP40、1.4MNaCl、0.3%2-巯基乙醇、50pg核糖核酸酶A)。充分混合悬浮物,并在65。C温育30分钟。用800inL氯仿/异戊醇(24:1)提取总DNA,离心(室温下,12,000g,10分钟)后回收上清液(大约600^L),补充60iaL提取溶液(10%CTAB、1.4MNaCl),并充分混合。如上所述提取总DNA,并用450pL异丙醇沉淀。通过离心(室温下,12,000g,5分钟)回收DNA之后,用1mL70。/。的乙醇洗涤沉淀物,室温下干燥,并溶解于100]LiLTE緩冲液(10mMTris-HClpH8.0、lmMEDTA)中。用分光光度计测定DNA浓度,并调整为标准10ng/pL溶液。为了进行大量样品的高通量处理,开发了96样品平台,如上所述,略加改进,进行微量制备提取。向96深孔微板(SSI)的孔中引入植物材料(通常为100-200mg嫩叶)。每孔接受200|aL提取緩冲液。向孔中引入具有96个销钉的金属装置,用来碾压植物材料30次。向孔中加入另外的300iuL提取緩沖液,再碾压植物材料10次。用橡胶盖密封板,并置于65。C30分钟,接着加入500pL氯仿/异戊醇(24:1)。将才反振荡30秒,并在4。C以3,200g离心30分钟。将上清液(~200inL)转移到另一个深孔4鼓板中,加入20|aL提取溶液,并如上所述用氯仿/异戊醇提取样品。将上清液(80pL)转移到常规96孔微板中,加入80jiL异丙醇。密封微板,置于室温下20分钟,并通过离心(在4。C下,3,200g,15分钟)回收总DNA。用150|uL70%的乙醇洗涤沉淀物,室温下干燥,并溶解于25fiLTE缓冲液中。分光光度计测量显示典型的30ng/|dL的DNA浓度。聚合酶t连反应PCR扩增在含有2|iLDNA(20ng用于大量制备,60ng用于微量制备)、4反应混合物(50单位/mLTaqDNA聚合酶、400jaMdATP、400juMdCTP、400fiMdGTP、400|iMdTTP、100mMTris-HClpH9.0、100mMNaCl、5mMMgCl2、0.2%IGepal)、0.5jaL的每种引物(10pM)和3pL水的10pL反应液中,进行筒单序列重复(SSR)标记的扩增。用以荧光染料(ABI)标记的正向引物扩增将要在DNA序列分析仪中分析的反应物。如下在设计好程序的循环变温器中进行扩增。初次变性在94。C进行5分钟,94。C30秒、64。C30秒和72。C30秒的35个循环,并在72。C进行60分钟的最终延伸。片段检测在聚丙烯酰胺凝胶电泳(PAGE)和自动DNA序列分析仪系统中分析片段。在0.5xTBE缓冲液中用6%聚丙烯酰胺(19:1)和7M尿素制备变性聚丙烯酰胺凝胶(Sambrook等人,1989,Mo/ecw/wC7om'wa丄a6orato^M"wwa/,第2版,ColdSpringHarbourLaboratoryPress,NewYork)。用6pLPCR反应物、3曱酰胺和1fiL加样緩冲液(曱酰胺、1mMEDTA、0.01%溴酚蓝和0.01%二曱苯腈蓝)制备样品,在95°C变性5分钟,保持在冰上,并加入预热凝月交的孔中(以120W进行60分钟)。以90W电泳样品3小时,并通过银染色使片段显现。将凝胶浸没于固定溶液(10%乙醇、5%乙酸)中10分钟,用去离子水漂洗,浸没于预处理溶液(1.5%硝酸)中3分钟,用去离子水漂洗,浸没于0.3%硝酸4艮溶液中30分钟,用去离子水漂洗两次,浸没于显色溶液(283mMNa2C03)中15-30分钟,或直至片段显现。通过目视检查打分,并通过与大小标准25bpLadder(Promega)比较估计片段大小。用具有50cm毛细管阵列、负载有POP7聚合物的ABI3730XLDNA序列分析仪分析用标记的引物扩增的样品,设定为8.5kV下10秒注射时间,在8.5kV下电泳,烘箱温度为60°C,运行时间为2小时。用软件STRand(Hughes,1998,o/f/iet/w/ve^s77_yo/Ca/z/onH'a,Davis,http:〃www.vgl.ucdavis.edu/STRand)显现由序列分析仪产生的片段数据。通过目视^险查进行打分,并通过与大小标准GeneScan500Liz(ABI)比较和与用6-FAM或NED标记的专有大小标准比较来估计片段大小。表8.通过呼号(signcall)(育种计划)分类的1,205个甘蔗属复合组品种成员、经选择(CanaVialis程序)的CV克隆和相关种的集合和来源国。符号/种成员的数目国家B1巴巴多斯(Barbados)CB3巴西cc2哥伦比亚Co5印度CP10美国CV320巴西IAC/IACSP19巴西LCP1美国MZC1古巴NA1阿根廷PAV1巴西PO4巴西PR1波多黎各Q4澳大利亚RB514巴西SP298巴西TUC1阿根廷VAT3巴西甘蔗热带种11-甘蔗细茎野生种1一甘蔗印度种1-甘蔗中国种1-甘蔗野生肉质花穗种1—-总数1,2059个国家实施例4在对1,205个甘蔗属复合组成员和相关种的集合进行基因型分型之后,在指紋分析系统中对等位基因的表征使用DNA序列分析仪检测系统,在10个选择的基因座处对1,205个甘蔗属复合组品种成员、经选择(CV程序)的克隆和具有世界范围的起源且共有不同水平的亲缘关系的相关种的集合(表8)进行指紋分析(表9)。鉴定总共150个等位基因(平均每个基因座有15个),借助于两个不同的大小标准评估其大小。基因座CV38显示有最大数目的等位基因(27个),接下来是CV78(25个)。CV29、CV37、CV22、CV79和CV94显示范围为14-17个的等位基因,而CV104、CV106和CV60显示范围为7-8个的等位基因。指紋分析的群体中等位基因的频率表明基因座内和基因座间的大的变异性。观察到的多态性信息含量PIC值(0.77-0.92)与等位基因数正相关。通过任何具体基因座中的等位基因大小的差异来判断,选择的基因座均没有显示由其各自的重复单元预测的理想的片段梯酸重复基序,但显示有2个、3个和5个核苷酸不同的片段。仔细检查用于引物设计的每种共有序列,显示几个位于引物位点和软件MISA鉴定的简单序列重复(SSR)基序之间的短单一和二重重复。这样的短基序在软件的阈值之内,但也可以是多态性的,因而,它们是造成在等位基因阶梯中观察到的缺陷的原因。需要对对应于等位基因的片段进行测序来回答这个问题。然而,尽管自动化片段打分存在困难,但是这些缺陷产生更大的变异性(多态性),因而增加了每个基因座的区别能力。不只一次地在指紋分析同样的成员之后观察到与某些等位基因有关的一定的不一致性。这些不稳定位置在色谱图中的定位显示分布于基因座CV37(2)、CV38(4)和CV78(2)中的8个等位基因。关于在同样的基因座中的其它等位基因,这些等位基因中的大部分具有一贯较低的PCR扩增,且经常与通常出现残迹的位置有关。这种类型的等位基因可以存在于某些基因型中,但会由于PCR反应产量的小的波动而在打分的过程中遗漏。另一方面,在低扩增等位基因位置出现的残迹经常错误地被认为是真正的等位基因。由于这些等位基因的易于出错的性质,用142个等位基因进一步分析在指紋分析的集合中由基因座组产生的数据(没有考虑8个低扩增等位基因)。表9.在1,205个甘蔗属复合组品种成员和相关的种的集合中属于SSR指紋分析系统的等位基因的表征和不稳定位置的作图a37<table>tableseeoriginaldocumentpage38</column></row><table><table>tableseeoriginaldocumentpage39</column></row><table>指紋分析系统区分甘蔗属复合组成员的能力利用对具有IO个基因座的1,205个成员集合进行基因型分型之后获得的二进制数据矩阵来评估指紋分析系统的区分能力。表10显示每个基因座、所有组合的基因座和区分具有至少两处不同的所有成员的基因座最小组合(区别性等位基因)各自的能力。区分能力表示为遗传一致性的概率(Pid,对于基因座或基因座的组合发现相同基因型的概率),以及对于基因座或基因座的组合,具有独特基因型的成员的百分比。没有基因座能够单独地区分所有的成员。所有10个基因座组合起来可以区分具有至少3个差异的所有的成员。从中搜索能够区分具有至少2个差异的集合的最小数量的基因座的组合。尽管基因座CV78能够区分最高比例(60%)的成员,但由于其PCR(聚合酶链反应)伪迹(表7),不选择它与其它基因座构成最佳组合。因此,基因座CV38(440/0)、CV29(33%)和CV37(8%)用于此目的,其与良好的打分特性有关的Pid值(IOO亿种可能性中有1个一致的基因型)反映了信息最丰富的组合。图1证明该组合的区别能力。树状图显示了属于指紋分析的集合的54种基因型,其中,21种是全近亲(full-sib)的商业品种和品种RB72454和SP70-1143之间杂交产生的祖先品种,其余的是来自一些其它的外国育种计划和相关种的某些成员的基因型。在这种具体的成员的子集中,发现在这两个个体之间的区别性等位基因的最小数量是5个。预期育种计划中的两种甘蔗属复合组基因型之间的遗传相似性的最极端的例子来自自花授粉杂交的后代。因此,评估指紋分析系统区分品种RB855002的48个自花授粉杂交的Fl后代群体的能力。测试基因座的所有可能的组合,在这种特别的情况下,7个基因座(CV29、CV37、CV38、CV60、CV79、CV94和CV106)的组合对于区分所有具有至少2个差异的个体是必需的(图2)。值得注意的是,当测试3个基因座的最佳组合时(结果未显示),独特基因型的百分比达到87.5%(Pid=0.001),没有区分3对基因型。基因座CV106的加入使独特基因型增至100%(Pid=0.0005),但具有至少1个差异。只在上述的7个基因座的组合中观察到2个差异(Pid=0.00002)。表IO.在共有不同水平的亲缘关系的1,205个甘蔗属复合组成员和相关种的集合中评估的SSR指紋分析系统的区分能力*基因座/组合等位基因的平均数区别性等位基因的独特基因型Pid每个基因型区别性的最小数量(%)CV787.76.0060.90麓CV386.95,1044.20.003CV297.44.9032.70.003CV375.33,507.90.013CV224.92.807.80.034CV793.52.903.20.062CV603.61.702.10.115CV1064.52.901.80.027CV943.41.501.50.213CV104431.901.00駕所有基因座的组合51.538.931003.4Xio-17最优组合1.2X10-7(CV29+CV3719.613.52100+CV38)从该分析中排除低扩增的等位基因实施例6指紋分析系统的再现性41为了评估指紋分析系统的再现性,进行了一些实验,以比较10个选择的基因座的DNA序列分析仪序型(结果未显示)。这些实验包括从以下样品来源提取的DNA的扩增i)同一甘蔗基因型的不同组织(叶、芽和根);ii)来自同一基因型但来源于几个彼此远离的工厂的叶;iii)来自同一基因型但来自不同发育阶段(植物的龄期)和生命周期(植物甘蔗、第一宿根等)的叶;和iv)由分生组织和愈伤组织产生的体外小植物。在所有情况下,在指紋分析的任何基因座处同一基因型产生的两种高质量序型之间没有观察到任何不一致性。在进行的最大再现性实验中,在基因座CV29、CV37和CV38处指紋分析从30个商业品种的分生组织培养的小植抹收集的783个叶样品,而在可比较的序型中没有观察到任何不一致性。实施例7多向杂交中的亲子关系的确定亲本的选择一般包括潜在的候选者的初始测试,其中,通过特定育种计划的常规选择方案评估双亲或多向杂交产生的少量后代或本。然后进行同样的杂交以产生大量的后代用于品种选择。在多向杂交中,在第一阶段只可证明母本,但在发现正确的父本之前,必须测试几种成对组合。因此,多向杂交在理论上具有更大的显示证实的亲本的机会,而双亲杂交可以常规且大量地进行,具有更高的显示优良个体的可能性。在多向杂交系统中育种员可以尽快地鉴定所选择的克隆的父本,这可以减少开发新品种的时间和费用,对于实现改良的程度(糖、纤维、适应性等)应该具有明显的影响。本文描述的指紋分析系统已经用来为我们的育种计划所选择的、来自涉及超过30种雄性祖先的多向杂交的有希望的甘蔗克隆鉴定父本。为人类种群研究和法医应用开发了用来获得用于建立亲子关系的分类答案的方法。该方法包括(i)从具有未知父本、母本和所有假设的杂交涉及的父本的幼苗获得DNA;(ii)用一套引物扩增样品中的SSR基因座;(iii)根据大小分离扩增产物;(iv)对所述分离的结果打分;(v)比较后代的基因型与母本基因型,减去母本的贡献,并比较其余的父本配子的贡献与所有假定的父本基因型。排除不能产生父本配子的贡献("父本等位基因")的个体,并给剩余的组指定亲子关系(Ellstrand,1984,Xm.A^wr.123:819-828)。一旦确认每个克隆的父本,则进行涉及它们和以前已知的母本的双亲杂交,播种产生的种子,将产生的幼苗纳入正常的选择程序。每年重复该方案用指紋分析系统确定第一选择阶段中评估的有希望的克隆的亲子关系,在接下来的杂交季节进行双亲杂交,将这些杂交产生的种子纳入下一年的选择方案。图3中,RB966928是母本,且有30个可能的父本、29个父本加上母本(自花授粉)。在本文所述的指紋分析系统中分析所有样品、幼苗、母本和所有的父本,比较后代基因型与母本基因型,减去母本的贡献,并比较剩余的父本配子的贡献与所有假定的父本基因型。排除不能产生父本配子的贡献("父本等位基因")的个体,并给剩余的组指定亲子关系。父本RB936071是唯一的具有所有MPA父本等位基因(专有等位基因)的父本。权利要求1.一种分离的多核苷酸,其包含选自以下的序列(i)SEQIDNO1-10所示的序列;和(ii)与SEQIDNO1-10所示的序列互补的序列;(iii)微卫星中重复数有变化的(i)或(ii)序列的变体。2.—种特异性地结合选自SEQIDNO:l-10的分离的多核苷酸的引物,其中,所述引物包含与SEQIDNO:1-10所示的序列互补的序列中的至少6个连续核苷酸。3.—种分离的引物,其包含选自以下的序列(i)SEQIDNO:U-30所示的序列;(ii)与SEQIDNO:11-30所示的序列互补的序列;和(iii)包含SEQIDNO:11-30所示的序列的至少6个连续核苷酸的序列。4.一种用于确定甘蔗属复合组的样品中的基因型的方法,包括以下步骤(i)从样品获得DNA;(ii)扩增选自以下的简单序列重复基因座(i)SEQIDNO:1-10所示的序列;和(ii)与SEQIDNO:1-10所示的序列互补的序列;该扩增4吏用选自以下的DNA中的一套引物(i)SEQIDNO:11-30所示的序列;(ii)与SEQIDNO:11-30所示的序列互补的序列;和(iii)包含SEQIDNO:11-30所示序列的至少6个连续核苷酸的序列,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)对分离的结果打分;和(v)将打分结果与来自已知种的DNA的分析结果进行比较。5.—种用于鉴定将甘蔗属复合组样品与植物来源相关联的成员的方法,包括(i)通过使用权利要求4所述的方法确定样品中的DNA的身份;和(ii)通过使用权利要求4所述的方法确定已知植物基因型的样品中的DNA的身份;和(iii)比较两种样品的基因型以确定样品(i)的身份。6.—种用于确定来自甘蔗属复合组样品的需要的基因组序列的基因渗入的方法,包括以下步骤(i)从样品获得DNA;(ii)用选自SEQIDNO.11-30引物对的DNA中的一套引物扩增简单序列重复基因座;(iii)根据大小分离扩增产物;(iv)鉴定父本和母本的专有等位基因;和(v)鉴定兼有父本和母本的专有等位基因的后代个体。7.—种用于选择甘蔗属复合组的祖先的方法,包括以下步骤(i)从祖先获得DNA;(ii)用选自SEQIDNO.11-30引物对的DNA中的一套引物扩增简单序列重复基因座,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)产生具有打分结果的微卫星二进制数据;和(v)借助于特定遗传相似性评估软件,对含有打分结果的二进制数据进行数学处理,以产生亲本选择指数。8.—种用于确定甘蔗属复合组成员的亲子关系的方法,包括以下步骤(i)从该成员获得DNA;(ii)用选自SEQIDNO.11-30引物对的DNA中的一套引物扩增简单序列重复基因座,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)鉴定母本和父本特异性的等位基因;和(v)鉴定真正的父本。9.一种用于量化甘蔗属复合组的幼苗样品中的自花授粉的方法,包括以下步骤(i)从成员获得DNA;(ii)用选自SEQIDNO.11-30引物对的DNA中的一套引物扩增简单序列重复基因座,以形成具有各种大小和标记的扩增产物;(iii)根据大小分离扩增产物;(iv)鉴定父本和母本特异性的等位基因;和(v)鉴定只含有母本的专有等位基因的后代。10.—种用于检测甘蔗属复合组成员的试剂盒,包括一种或多种适于扩增甘蔗属复合组的样品中的核苷酸序列的引物对。11.一种用于检测多态性遗传标记的试剂盒,包括一种或多种适于扩增甘蔗属复合组的样品中的核苷酸序列的引物对。12.如权利要求11所述的试剂盒,其中,所述多核苷酸序列包括选自以下的序列(i)SEQIDNO:l-10所示的序列;(ii)与SEQIDNO:1-10所示的序列互补的序列;(iii)SEQIDNO:11-30所示的序列;(iv)与SEQIDNO:11-30所示的序列互补的序列;和(v)包含SEQIDNO:11-30所示的序列的至少6个连续核苷酸的序列。13.—种用于开发MAS(标记辅助的选择)程序的与数量性状基因座(QTL)的等位基因相关联的基因的定位(作图)方法。全文摘要本发明涉及甘蔗的微卫星及其侧翼序列、微卫星分离的方法、适于使用这些序列进行指纹分析的方法以及可以用于如下应用的方法甘蔗属复合组成员的鉴定、种质收集物的管理、祖先的选择、品种之间的鉴别、杂交体的鉴定、需要的基因组序列的基因渗入、亲子关系的确定、基因和数量性状基因座(QTL)的作图和MAS(标记辅助的选择)程序的开发。文档编号C12N15/29GK101617047SQ200880004444公开日2009年12月30日申请日期2008年1月10日优先权日2007年1月12日发明者S·玛特斯沃卡,W·小麦克切罗尼申请人:卡纳维亚利斯有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1