陆地棉6号染色体与纤维强度相关的SNP分子标记的制作方法

文档序号:12697723阅读:222来源:国知局
本发明属于棉花分子育种
技术领域
:,具体涉及一种与陆地棉纤维强度相关的SNP分子标记及其检测和应用。
背景技术
::棉花作为一种主要的纤维作物,在世界经济中占有重要的地位。在全世界广泛栽培的四个棉种中,陆地棉占据着最重要的地位,其产量占世界棉花总产量的90%以上。随着人们对中高档纺织品需求的增长,对纤维品质的要求日益提高,但传统的育种手段主要是通过表型进行选择,育种效率低,难以满足品质育种的需要。分子标记技术的发展使直接选择数量性状的基因型成为了可能。通过构建棉花遗传图谱进行QTL定位可以使育种者直接选择纤维品质等数量性状的基因型,通过利用F2和RIL等作图群体进行了纤维品质QTL定位研究也取得了丰硕的成果。尤其是第三代标记技术SNP标记的开发和应用,更可为以后的标记辅助育种打下基础。SNP标记是目前最具发展潜力的分子标记,因在基因组中数量多,分布广且在基因分析过程中不需要根据片段大小将DNA分带,适合于大规模的自动化和数量庞大的检测分析,目前已得到广泛的应用在医学和生物等领域。但在棉花中的研究还较少。SNP是生物体最普遍,分布最广泛的多态差异。人类HapMap计划和最近对亚洲人的重测序数据显示在人类基因组中,至少存在三百多万个SNP多态位点,平均约每1kb就会有1个SNP(FrazerK.A.,BallingerD.G.etal.Asecondgenerationhumanhaplotypemapofover3.1millionSNPs.Nature,2007,449(7164):851-861;WangJ,WangWetal.ThediploidgenomesequenceofanAsianindividual.Nature,2008,456(7218):60-65);KristenL将SNP标记作为判断染色体重组事件的最小单位(recombinationbin),判断子代每个bin来源于父母本的情况,得到每个子代的全基因组物理图谱,从而构建出Bin图谱,用于后续高精度遗传连锁图谱构建和QTL定位(KristenLKump,PeterJBradburyetal.Genome-wideassociationstudyofquantitativeresistancetosouthernleafblightinthemaizenestedassociationmappingpopulation[J].NatureGenetic,2011,43(2):163-168);Yu应用全基因组重测序对241株水稻RILs群体进行低深度测序,以SNP为基础构建Bin图谱,Bin图谱具有超高密度,能够检测到更多的QTL,同时检测到的QTL也更加精细(YuH,XieW,WangJ,etal.GainsinQTLdetectionusinganultra-highdensitySNPmapbasedonpopulationsequencingrelativetotraditionalRFLP/SSRmarkers[J].PLoSONE,2011,6(3):e17595);Xu通过对水稻亲本9311的高深度测序和128个CSSLs低深度的重测序,构建了一张高密度的Bin图谱,检测到了768万个SNP位点,这128个CSSL携带了259个染色体代换片段(XuJ,ZhaoQ,DuP,etal.Developinghighthroughputgenotypedchromosomesegmentsubstistutionlinesbasedonpopulationwhole-genomere-sequencinginrice(OryzasativaL.)[J].BMCGenomics,2010(11):625);范术丽利用由355个陆地棉构成的种质群体,采用SLAFSEQ测序通过全基因组关联研究(GWAS)进行线性模型(GLM)和混合线性模型(MLM)分析,在群体中共获得81675个SNP位点,最终确定11个与早熟性状相关的SNP有11个,并在3号染色体上定位1个与早熟性状相关的候选基因并进行了验证(Sunetal.IdentificationoffavorableSNPallelesandcandidategenesfortraitsrelatedtoearlymaturityviaGWASinuplandcotton.BMCGenomics,2016(17):687);王晓歌以耐盐陆地棉品种中9409为材料,通过转录组数据进行SNP,并进行GO和Pathway注释,从对照和盐胁迫处理中分别检测到SNP为12659个和16871个,其中对照特有的SNP为2102个,盐胁迫后样品特有SNP为4547个,GO注释分析发现检测到的SNP在分子功能、细胞组分、生物进程富集的比例基本一致,而盐胁迫后样品特有SNP在每个分类中的基因比例都明显大于前三个(Wangetal.MiningandAnalyzingofSNPRelatedtoSalinityStressinTranscriptomeofUploadCotton(GossypiumhirsutumL.).MolecularPlantBreeding,2016,14:1524-1532);Zhu通过陆地棉重组自交系群体构建了全基因组SNP连锁图谱,找到2618个多态性SNP标记,其中有16个稳定的QTLs存在两个环境中,12个QTL涉及多性状,这些QTLs主要分布在5,9,10,14,19,和20号染色体上(LiC,ZhuSJetal.Genome-WideSNPLinkageMappingandQTLAnalysisforFiberQualityandYieldTraitsintheUplandCottonRecombinantInbredLinesPopulation.FrontiersinPlantScience,2016,7(218))。袁有禄利用一个异常棉高强纤维渐渗系7235和陆地棉遗传标准系TM-1为亲本构建了F2、F2:3分离群体,鉴定了一个可以在中国的不同棉区及美国等多个环境中均能检测到主效QTL,可解释30%以上的表型变异(袁有禄等,棉花高品质纤维性状QTLs的分子标记筛选及其定位,遗传学报,2001,28(12):1151-1161);石玉真以黄河流域广泛种植的转基因抗虫棉品种sGK321和sGK9708(中41)为轮回亲本,分别与优质丰产品种太121和高纤维品质渐渗种质系7235杂交的F1代材料杂交并回交,配置了杂交回交组合两套,运用与一个已定位的高强纤维QTL紧密连锁的2个SSR标记,这2个标记在不同的遗传背景,经过多代杂交、回交和自交后,能够稳定遗传而且QTL的效应稳定,并运用此项技术结合其它手段进行优质、抗虫等基因的聚合育种研究,快速有效地改良现有的陆地棉推广品种,创造高产、优质、抗虫棉花新材料或新品系(石玉真等,与棉花纤维强度连锁的主效QTL应用于棉花分子标记辅助育种,分子植物育种,2007,5(4):521-527));孙福鼎以0-153和黄河流域推广的抗虫棉品种中棉所41选系sGK9708为亲本杂交,通过F2:6的单株选择,构建了一套含有196个系的陆地棉F6:8重组自交系群体,并进行了两年三点四个环境(07年安阳、08年安阳、曲周、临清)的重复试验,筛选多环境稳定表达的主效QTLs,采用复合区间作图法检测到与纤维强度相关的QTL共7个,采用基于混合线性模型的复合区间作图法检测与纤维强度相关的互作QTL2对(孙福鼎等,陆地棉重组自交系群体纤维品质及产量性状遗传变异分析,棉花学报,2010,22(4):319-325);Jamshed利用重组自交系(RIL)群体构建遗传图谱,定位到47个QTL在多个环境下稳定,这些QTL多以聚合群的形式存在,控制两个或两个以上的性状,这些QTL主要集中在4、7、14、25号染色体(Jamshedetal.Identificationofstablequantitativetraitloc(QTLs)forfiberqualitytraitsacrossmultipleenvironmentsinGossypiumhirsutumrecombinantinbredlinepopulation[J].BMCGenomics,2016,17:197);Zhang等通过两个陆地棉品种0–153和SGK9708构建的重组自交系群体利用SLAF序列构建了有5521个单核苷酸多态性标记,覆盖总距离为3259.37cM的高密度遗传图谱(Zhangetal.Constructionofahigh-densitygeneticmapbyspecificlocusamplifiedfragmentsequencing(SLAF-seq)anditsapplicationtoQuantitativeTraitLoci(QTL)analysisforbollweightinuplandcotton(Gossypiumhirsutum.).BMCPlantBiology,2016,16:79)。总之,SNP标记是目前最具发展潜力的分子标记,目前已得到广泛的应用,但在棉花中的应用还较少,前人的研究中多数是利用分离群体如F2、BC1,遗传背景复杂,或只在单个环境下检测得到的结果,因此缺乏可靠性和稳定性,多环境稳定的QTL少,且有些研究最初的目的只是为了进行目标基因的定位。技术实现要素:本发明所要解决的技术问题是:通过筛选出一种与陆地棉纤维强度基因紧密连锁且在多个环境下表现稳定的SNP分子标记,将这些SNP分子标记应用于棉花纤维品质的辅助选择,可以尽快提高我国棉花品种的纤维品质水平。本发明提供的技术方案是:一种与陆地棉纤维高强度基因连锁的SNP标记,定位在与纤维强度相关的8个QTL中,其中有4个在多环境下检测稳定,这些QTL都位于6号染色体,有3个能够筛选得到分型较好的SNP标记;其中与qFS-chr06-2连锁的SNP标记为CRI-SNP-198773;与qFS-chr06-4连锁的SNP标记为CRI-SNP-198774;与qFS-chr06-7连锁的SNP标记为CRI-SNP-198775、CRI-SNP-198776、CRI-SNP-198777、CRI-SNP-198778、CRI-SNP-198779、CRI-SNP-198780、CRI-SNP-198781、CRI-SNP-198782、CRI-SNP-198783,(其中CRI:CottonResearchInstitute代表中国农业科学院棉花研究所;SNP代表标记类型;数字代表标记开发顺序),所述的SNP分子标记在染色体上的位置和突变碱基如下表所示:标记名称SNP位点突变碱基CRI-SNP-19877311830437C/GCRI-SNP-19877415961930G/ACRI-SNP-19877598819023T/CCRI-SNP-19877698819766A/TCRI-SNP-19877798819351G/TCRI-SNP-19877898945368C/TCRI-SNP-19877998946829A/CCRI-SNP-19878098956931T/CCRI-SNP-19878199015203A/TCRI-SNP-19878299050013A/CCRI-SNP-19878399015209T/C本发明中,QTL命名参考McCouch等(1997)在水稻中的命名规则,以q+性状+连锁群+QTL个数的形式表示。(McCouchSR,ChoYG,YanoM,etal.ReportonQTLnomenclature,RiceGenetNewslett.,1997,14:11-13),例如qFS-chr06-2表示定位到6号染色体与纤维强度相关的第二个QTL。本发明所述的SNP标记可通过SNP基因分型实验有效地区分不同SNP位点与不同基因型,从而可对不同棉花样品进行筛选,可筛选出纤维强度高的株系,大大缩短育种周期,提高棉花纤维强度的育种效率。同时,本发明还提供一种与陆地棉纤维强度的三个QTLqFS-chr06-2、qFS-chr06-4、qFS-chr06-7连锁的SNP标记的筛选方法,包括如下步骤:(1)利用大田推广的陆地棉栽培品种中棉所41选系SGK9708和具有亚洲棉高强纤维基因的陆地棉优异品系0-153为亲本构建F2和F2:3群体;(2)F2:3群体家系内每世代自交,在F2:6世代进行一次单株选择,再种植两代到F6:8,把F6:8及以后的世代作为重组自交系群体进行多年多点实验;(3)提取重组自交系群体和亲本的DNA;具体方法参考以下文献,(宋国立,改良CTAB法快速提取棉花DNA,棉花学报,1998,10(5):273-275);(4)构建连锁图谱:对检测的各样品基因组DNA进行酶切实验,对得到的酶切片段(SLAF标签)进行3’端加A处理,连接Dual-index测序接头,PCR扩增、纯化、混样、切胶选取目的片段,测序,对测序结果用软件进行遗传图谱的构建(ZhangJ,GuoWZ,ZhangTZ.Molecularlinkagemapofal-lotetraploidcotton(GossypiumhirsutumL.×Gossypiumbar-badenseL.)withahaploidpopulation.TheorApplGenet,2002,105:1166–1174);(5)纤维强度QTL定位:进行多环境稳定的纤维强度主效QTLs筛选,可得到上述的3个多环境稳定的纤维强度主效QTLs及其连锁标记。本发明的有益效果如下:本发明涉及的与多环境稳定的高强纤维主效基因有关的位点共有3个(qFS-chr06-2、qFS-chr06-4、qFS-chr06-7),通过筛选与棉花高强纤维主效基因紧密连锁且在多个环境下表现稳定的SNP标记,将这些SNP标记应用于棉花纤维品质的辅助选择,QTL定位结果可靠,可以尽快提高我国棉花品种的纤维品质水平。qFS-chr06-2能在5个环境下(2007年安阳、2008年临清、2008年曲周、2009年安阳、2010年高邑)检测到,可解释的表型变异为5.45~12.16%,加性效应值为0.57~0.97cN/tex;qFS-chr06-4能在9个环境下(2007年安阳、2008年曲周、2009年安阳、2009年曲周、2009年阿克苏、2010年安阳、2010年高邑、2010年郑州、2013年安阳)检测到,可解释的表型变异为5.38~16.34%,加性效应值为0.56~1.04cN/tex;qFS-chr06-7能在4个环境下(2008年安阳、2008年曲周、2009年阿克苏、2010年郑州)检测到,解释的表型变异为6.50~11.60%,加性效应值为-1.02~-0.81cN/tex。本发明利用重组自交系F6:8(RIL)筛选出稳定的纤维强度QTLs及其紧密连锁的分子标记,所述SNP分子标记是以棉花稳定的RIL群体为材料,通过基因组重测序的方法得到,利用与这些QTL紧密连锁的分子标记筛选出纤维强度得到提高的株系,进行分子标记辅助育种选择,可大大缩短育种周期,提高棉花纤维强度的育种效率。附图说明图1是通过基因组重测序得到的总图距为5197.17cM的遗传图谱。图2是在6号染色体上与强度连锁的QTLs的位置图,其中多环境稳定且能筛选到SNP标记的有3个,分别为qFS-chr06-2、qFS-chr06-4、qFS-chr06-7。具体实施方式下面通过具体实施方式的详细描述来进一步阐明本发明,但并不是对本发明的限制,仅仅作示例说明。(1)重组自交系F6:8的获得2007年-2008年的田间种植和DNA的提取请见专利申请公开号:CN101613761A,发明名称:与棉花纤维强度主效基因连锁的SSR标记的专利申请文件。2009年分别于河南安阳中国农业科学院棉花研究所试验站,中国农业大学曲周试验站和新疆阿克苏德佳科技种业有限公司试验站种植亲本和F6:10群体。安阳和曲周采用单行区,5米行长,行距分别为0.8m和(0.8+0.5)m,每行20株;新疆采用6行区,2米行长,每行15株。2010年分别于河北高邑原种场,河南安阳中国农业科学院试验站和河南郑州种植亲本和F6:11群体,安阳和郑州采用单行区,行长5m,行距0.8m;高邑采用单行区,行长4m,宽窄行(0.8+0.6)m。上述各个试点都采用不完全随机区组设计,种植两个重复。9月中下旬进行田间取样,按家系收花,取12g左右的纤维样品进行纤维品质的测定。(2)提取重组自交系群体和亲本的DNA。(3)选择以中国农业科学院棉花研究所提供的棉花四倍体基因组序列为参考基因组进行电子酶切预测(LiFG,FanGY,LuCR,XiaoGH,ZouCS,KohelRJ,MaZY,ShangHH,MaXF,WuJH,etal.GenomesequenceofcultivatedUplandcotton(GossypiumhirsutumTM-1)providesinsightsintogenomeevolution.NatureBiotechnology,2015,33(5)),最终选择HaeIII+SspI酶,酶切标率为98.61%,共得到495.48Mreads,酶切片段长度在364-414bp的序列定义为SLAF标签。(4)根据选定的最适酶切方案,对检测的各样品基因组DNA进行酶切实验,对得到的酶切片段(SLAF标签)进行3’端加A处理,连接Dual-index测序街头,PCR扩增、纯化、混样、切胶选取目的片段,文库质检合格后用IlluminaHiseqTM2500进行测序。(5)利用Dual-index对测序得到的原始数据进行识别,得到各个样品的reads。通过reads间聚类的方法,在亲本和子代中开发SLAF标签。(6)通过生物信息学分析,共得到321797个SLAF标签,其中多态性的SLAF标签共有35300个。(7)对多态性的SLAF标签进行基因型编码,基因型编码规则为遗传学通用的2等位编码规则,如某标记的亲本基因型为aa(父本)和bb(母本),子代基因型ab则表示该样品在这个标记的编码类型为杂合,其中有一个基因型来自于父本,有一个基因型来自于母本。(8)为保证遗传图谱质量,SLAF标签按照父母本测序深度10x以下、完整度低于30%、严重偏分离(p-value<0.05)、亲本杂合、同时比对到两套基因组的条件进行过滤,共筛选出的7958个SLAF标签。(9)通过与参考基因组的定位将SLAF标签分为26个连锁群,计算高质量分子标签间的LOD值,通过LOD值进行连锁分群,对每个连锁群采用HighMap软件进行遗传图谱的构建,通过校正,得到总图距为5197.17cM的遗传图谱(如图1所示)。其中HighMap软件由北京百迈克生物科技公司自主研发。(10)基于SLAF的测序数据,通过BWA与两个2倍体棉花的参考基因组比对,得到与亲本之间有多态性的SNP有44583个,通过质量过滤后,在图谱上定位得到10440个SNP标记。(11)采用软件QTLIciMappingV4.0(http://www.isbreeding.net/software/)和软件WinQTLCart2.5,通过11个环境(2007年安阳、2008年安阳、2008年临清、2008年曲周、2009年安阳、2009年曲周、2009年阿克苏、2010年安阳、2010年高邑、2010年郑州、2013年安阳)纤维强度性状的表型数据和基因型数据,进行纤维强度性状的多环境QTL定位分析,共得到与强度相关的QTL共8个,其中多环境稳定且筛选到SNP标记的有3个(QTL在染色体上的位置如图2所示),将这些得到的QTL与SNP标记进行关联分析,最终筛选得出与纤维强度分型明显的SNP标记,其中与qFS-chr06-2连锁的SNP标记为CRI-SNP-198773;与qFS-chr06-4连锁的SNP标记为CRI-SNP-198774;与qFS-chr06-7连锁的SNP标记为CRI-SNP-198775、CRI-SNP-198776、CRI-SNP-198777、CRI-SNP-198778、CRI-SNP-198779、CRI-SNP-198780、CRI-SNP-198781、CRI-SNP-198782、CRI-SNP-198783。当前第1页1 2 3 当前第1页1 2 3 
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1