陆地棉25号染色体与纤维强度相关的SNP分子标记的制作方法

文档序号:11540300阅读:172来源:国知局
本发明属于棉花分子育种
技术领域
:,具体涉及一种与陆地棉纤维强度相关的snp分子标记及其检测和应用。
背景技术
::棉花作为一种主要的纤维作物,在世界经济中占有重要的地位。在全世界广泛栽培的四个棉种中,陆地棉占据着最重要的地位,其产量占世界棉花总产量的90%以上。随着人们对中高档纺织品需求的增长,对纤维品质的要求日益提高,但传统的育种手段主要是通过表型进行选择,育种效率低,难以满足品质育种的需要。分子标记技术的发展使直接选择数量性状的基因型成为了可能。通过构建棉花遗传图谱进行qtl定位可以使育种者直接选择纤维品质等数量性状的基因型,通过利用f2和ril等作图群体进行了纤维品质qtl定位研究也取得了丰硕的成果。尤其以第三代标记技术snp标记的开发和应用,更可为以后的标记辅助育种打下基础。snp标记是目前最具发展潜力的分子标记,因在基因组中数量多,分布广且在基因分析过程中不需要根据片段大小将dna分带,适合于大规模的自动化和数量庞大的检测分析,目前已得到广泛的应用在医学和生物等领域。但在棉花中的研究还较少。snp是生物体最普遍,分布最广泛的多态差异。对拟南芥的3个自然品系的基因组测序及重测序,也发现了超过八十二万的snp位点,平均约每1.4kb就会有1个snp。snp极大程度的代表了个体之间的遗传差异,非常有助于进行特异数量遗传性状与个体分子标记的关联性分析(ossowskis.,schneebergerk.,clarkr.m.,lanzc.,warthmannn.,andweigeld.,sequencingofnaturalstrainsofarabidopsisthalianawithshortreads,genomeres.,2008,18(12):2024-2033);楚鹰等通过纤维发育相关基因的snp研究利用pcr技术分离了七个不同纤维品质的四倍体棉种材料和两个二倍体祖先棉种的纤维发育相关基因片段,共获得了五个棉纤维发育相关基因在九个棉种材料中的序列信息,对陆地棉高强纤维品系间的snps位点进行了统计,发现有四个csnps位点中存在非同义突变,可能具有表型效应(楚鹰,纤维发育相关基因的snp研究与棉花蔗糖合酶基因片段的克隆及表达分析,硕士毕业论文,南京:南京农业大学,2004);郑炜佳等通过对新海21和新陆中36进行ssr和snp分子标记引物筛选,使用筛选出的引物对两个f2群体进行pcr扩增,构建遗传连锁图谱,在群体中筛选得到的69对ssr引物和11组snp引物对f2群体扩增出来的多态性标记进行遗传连锁分析,构建了包括90个标记位点的遗传连锁图和30个连锁群,标记间的平均距离为55.9cm,全长为3135.84cm,覆盖棉花基因组的62.71%(郑炜佳,snp标记的开发及海陆遗传连锁图谱的构建,硕士论文,乌鲁木齐:新疆农业大学,2013);何林池等为探讨亲缘关系较近的耐盐棉花品种中棉所35与盐敏感棉花品种中棉所12耐盐差异性,用不同浓度nacl处理棉花幼苗,调查这2个棉花品种在盐胁迫下过氧化氢酶、过氧化物酶、超氧化物歧化酶等抗氧化酶活性的变化,以及对中棉所35和中棉所12的snp/in-del进行初步鉴定,发现亲缘关系很近而耐盐水平差异显著的中棉所35和中棉所12存在点突变和插入/缺失,说明这些snp/indel可能对耐盐性状有重要的调控功能(何林池,王康,魏小云,等,耐盐差异性不同棉花品种的抗氧化酶活性及snp/indel分析,江苏农业学报,2014,30(5):980-985);zhu通过重组自交系群体构建了全基因组snp连锁图谱,找到2618个多态性snp标记,其中有16个稳定的qtls存在两个环境中,12个qtl涉及多性状,这些qtls主要分布在5,9,10,14,19,和20号染色体上(lic,zhusjetal.genome-widesnplinkagemappingandqtlanalysisforfiberqualityandyieldtraitsintheuplandcottonrecombinantinbredlinespopulation.frontiersinplantscience,2016,7:218);匡猛等利用有代表性的材料进行snp位点的全基因组扫描分析与综合评估,基于kasp技术开发1套适用于我国棉花杂交种纯度高通量检测的核心snp组合,从63k的棉花全基因组芯片中筛选获得具有单拷贝特性的snp标记分别为5474个(中棉所tm-1基因组版本)和1850个(南京农大tm-1基因组版本),最终从每条染色体上优选1个杂交种杂合率高且分型效果理想的核心snp位点,合计26个,采用krakentm软件将snp位点转化成kasp标记,利用snpline平台进行snp分型检测,实现了对大量样品的高通量基因分型,尤其适用于品种纯度快速检测,为snp标记技术在棉花品种鉴定及指纹数据库构建等方面的应用奠定基础(匡猛,马峙英等,基于单拷贝snp标记的棉花杂交种纯度高通量检测技术,棉花学报cottonscience2016,28(3):227―233)。袁有禄等利用一个异常棉高强纤维渐渗系7235和陆地棉遗传标准系tm-1为亲本构建了f2、f2:3分离群体,鉴定了一个可以在中国的不同棉区及美国等多个环境中均能检测到主效qtl,可解释30%以上的表型变异(袁有禄等,棉花高品质纤维性状qtls的分子标记筛选及其定位,遗传学报,2001,28(12):1151-1161);沈新莲等利用3个陆地棉高强纤维种质系构建了3个f2种内连锁图,利用复合区间作图法检测到38个与纤维品质有关的qtls,其中15个稳定的qtls能同时在f2和f2:3检测到,至少3个qtls能在两个群体中表达(沈新莲,陆地棉纤维品质qtl的筛选、定位及其应用,博士毕业论文,南京农业大学,2004);石玉真等以黄河流域广泛种植的转基因抗虫棉品种sgk321和sgk9708(中41)为轮回亲本,分别与优质丰产品种太121和高纤维品质渐渗种质系7235杂交的f1代材料杂交并回交,配置了杂交回交组合两套,运用与一个已定位的高强纤维qtl紧密连锁的2个ssr标记,这2个标记在不同的遗传背景,经过多代杂交、回交和自交后,能够稳定遗传而且qtl的效应稳定,并运用此项技术结合其它手段进行优质、抗虫等基因的聚合育种研究,快速有效地改良现有的陆地棉推广品种,创造高产、优质、抗虫棉花新材料或新品系(石玉真等.与棉花纤维强度连锁的主效qtl应用于棉花分子标记辅助育种.分子植物育种,2007,5(4):521-527);王义青等利用陆地棉鲁棉研21作为母本、nm03102为父本构建了f2和f2∶3分离群体,对195个f2群体单株分析得到242个标记位点,共检测到20个纤维品质性状qtl,其中1个纤维强度的qtl和1个麦克隆值的qtl在两世代中稳定存在,这为标记辅助选择奠定了基础(王义青,李俊文,袁有禄等,陆地棉高品质品系纤维品质性状qtl的分子标记及定位,棉花学报,2010,22(6):533-538);贾菲等利用以sgk9708为母本,0-153为父本构建的196个陆地棉重组自交系(f6:8)构建了包含186个标记,总长827.84cm,标记间平均距离4.45cm,覆盖棉花基因组18.6%的遗传连锁图谱,并对7个环境下的铃重和衣分性状进行qtl定位和上位性互作分析。定位了多个环境下稳定表达的5个主效qtls(qbw-1-1,qbw-1-2,qlp-2-1,qlp-2-2和qlp-4-2),检测到4对铃重上位性互作qtls和7对衣分上位性互作qtls贾菲等.多环境下陆地棉(gossypiumhirsutuml.)重组自交系铃重与衣分性状的qtl分析.分子植物育种,2011,9(8):318-326);王天抗等利用以2个纤维品质优异材料0-153和新陆早24与2个大面积推广品种鲁棉研28和冀棉516为亲本,配制的双交f1群体,对3个纤维强度主效qtls连锁的4个ssr标记进行辅助选择,并对不同qtls的聚合效应进行了研究。结果4个标记的选择都表现出显著的遗传效应(王天抗等,棉花纤维强度主效qtls分子标记辅助选择及聚合效应研究,棉花学报,2014,26(5):396-403);jamshed利用重组自交系(ril)群体构建遗传图谱,定位到47个qtl在多个环境下稳定,这些qtl多以聚合群的形式存在,控制两个或两个以上的性状,这些qtl主要集中在4、7、14、25号染色体(jamshedetal.identificationofstablequantitativetraitloc(qtls)forfiberqualitytraitsacrossmultipleenvironmentsingossypiumhirsutumrecombinantinbredlinepopulation.bmcgenomics,2016,17:197);zhang等通过两个陆地棉品种0–153和sgk9708构建的重组自交系群体利用slaf序列构建了有5521个单核苷酸多态性标记,覆盖总距离为3259.37cm的高密度遗传图谱(zhangetal.constructionofahigh-densitygeneticmapbyspecificlocusamplifiedfragmentsequencing(slaf-seq)anditsapplicationtoquantitativetraitloci(qtl)analysisforbollweightinuplandcotton(gossypiumhirsutum.).bmcplantbiology,2016,16:79)。总之,snp标记是目前最具发展潜力的分子标记,目前已得到广泛的应用,但在棉花中的应用还较少,前人的研究中多数是利用分离群体如f2、bc1,遗传背景复杂,或只在单个环境下检测得到的结果,因此缺乏可靠性和稳定性,多环境稳定的qtl少,且有些研究最初的目的只是为了进行目标基因的定位。技术实现要素:本发明所要解决的技术问题是:通过筛选出一种与陆地棉纤维强度基因紧密连锁且在多个环境下表现稳定的snp分子标记,将这些snp分子标记应用于棉花纤维品质的辅助选择,可以尽快提高我国棉花品种的纤维品质水平。本发明提供的技术方案是:一种与陆地棉纤维高强度基因连锁的snp标记,定位在与强度相关的8个qtl中,其中有4个在多环境下检测稳定,这些qtl都位于25号染色体,有3个能够筛选得到分型较好的snp标记;其中与qfs-chr25-2连锁的snp标记为cri-snp198784、cri-snp198785、cri-snp198786、cri-snp198787、cri-snp198788、cri-snp198789、cri-snp198790、cri-snp198791;与qfs-chr25-3连锁的snp标记为cri-snp198792、cri-snp198793、cri-snp198794、cri-snp198795;与qfs-chr25-5连锁的snp标记为cri-snp198796、cri-snp198797、cri-snp198798、cri-snp198799、cri-snp198800、cri-snp198801、cri-snp198802、cri-snp198803、cri-snp198804、cri-snp198805、cri-snp198806、cri-snp198807,(其中cri:cottonresearchinstitute代表中国农业科学院棉花研究所;snp代表标记类型;数字代表标记开发顺序),所述的snp分子标记在染色体上的位置和突变碱基如下表所示:标记名称snp位点突变碱基cri-snp19878411634304g/tcri-snp19878511727497g/tcri-snp19878611727737g/tcri-snp19878711800162g/acri-snp19878811800115g/tcri-snp19878912039916g/acri-snp19879012039883c/tcri-snp19879112364008t/ccri-snp19879213627793c/tcri-snp19879313795574g/tcri-snp19879413627853t/ccri-snp19879513795623c/tcri-snp19879615620852g/acri-snp19879716378403t/ccri-snp19879817002845c/tcri-snp19879916735882g/acri-snp19880016727879c/acri-snp19880116548321g/tcri-snp19880217481142g/ccri-snp19880317882165t/ccri-snp19880418212914g/acri-snp19880518213630a/ccri-snp19880618213276g/acri-snp19880719698812c/g本发明中,qtl命名参考mccouch等(1997)在水稻中的命名规则,以q+性状+连锁群+qtl个数的形式表示。(mccouchsr,choyg,yanom,etal.reportonqtlnomenclature,ricegenetnewslett.,1997,14:11-13),例如qfs-chr25-2表示定位到25号染色体与纤维强度相关的第二个qtl。本发明所述的snp标记可通过snp基因分型实验有效地区分不同snp位点与不同基因型,从而可对不同棉花样品进行筛选,可筛选出纤维强度高的株系,大大缩短育种周期,提高棉花纤维强度的育种效率。同时,本发明还提供一种与陆地棉纤维强度的三个qtlqfs-chr25-2、qfs-chr25-3、qfs-chr25-5连锁的snp标记的筛选方法,包括如下步骤:(1)利用大田推广的陆地棉栽培品种中棉所41选系sgk9708和具有亚洲棉高强纤维基因的陆地棉优异品系0-153为亲本构建f2和f2:3群体;(2)f2:3群体家系内每世代自交,在f2:6世代进行一次单株选择,再种植两代到f6:8,把f6:8及以后的世代作为重组自交系群体进行多年多点实验;(3)提取重组自交系群体和亲本的dna;具体方法参考以下文献,宋国立,改良ctab法快速提取棉花dna,棉花学报,1998,10(5):273-275);(4)构建连锁图谱:对检测的各样品基因组dna进行酶切实验,对得到的酶切片段(slaf标签)进行3’端加a处理,连接dual-index测序接头,pcr扩增、纯化、混样、切胶选取目的片段,测序,对测序结果用软件进行遗传图谱的构建(zhangj,guowz,zhangtz.molecularlinkagemapofal-lotetraploidcotton(gossypiumhirsutuml.×gossypiumbar-badensel.)withahaploidpopulation.theorapplgenet,2002,105:1166–1174);(5)纤维强度qtl定位:进行多环境稳定的纤维强度主效qtls筛选,可得到上述的3个多环境稳定的纤维强度主效qtls及其连锁标记。本发明的有益效果如下:本发明涉及的与多环境稳定的高强纤维主效基因有关的位点共有3个(qfs-chr25-2、qfs-chr25-3、qfs-chr25-5),通过筛选与棉花高强纤维主效基因紧密连锁且在多个环境下表现稳定的snp标记,将这些snp标记应用于棉花纤维品质的辅助选择,qtl定位结果可靠,可以尽快提高我国棉花品种的纤维品质水平。qfs-chr25-2能在3个环境下((2007年安阳、2008年临清、2010年安阳)检测到,可解释的表型变异为4.75-5.57%,加性效应值为0.58-0.71cn/tex;qfs-chr25-3能在5个环境下(2007年安阳、2008年临清、2009年曲周、2010年安阳、2010年高邑)检测到,可解释的表型变异为6.43-11.82%,加性效应值为0.65-1.01cn/tex;qfs-chr25-5能在6个环境下(2008年安阳、2009年安阳、2009年阿克苏、2010年高邑、2010年郑州、2013年安阳)检测到,解释的表型变异为4.88-14.60%,加性效应值为0.56-1.34cn/tex。本发明利用重组自交系f6:8(ril)筛选出稳定的纤维强度qtls及其紧密连锁的分子标记,所述snp分子标记是以棉花稳定的ril群体为材料,通过基因组重测序的方法得到,利用与这些qtl紧密连锁的分子标记筛选出纤维强度得到提高的株系,进行分子标记辅助育种选择,可大大缩短育种周期,提高棉花纤维强度的育种效率。附图说明图1是通过基因组重测序得到的总图距为5197.17cm的遗传图谱。图2是在25号染色体上与强度连锁的qtls的位置图,其中多环境稳定且能筛选到snp标记的有3个,分别为qfs-chr25-2、qfs-chr25-3、qfs-chr25-5。具体实施方式下面通过具体实施方式的详细描述来进一步阐明本发明,但并不是对本发明的限制,仅仅作示例说明。(1)重组自交系f6:8的获得2007年-2008年的田间种植和dna的提取请见专利申请公开号:cn101613761a,发明名称:与棉花纤维强度主效基因连锁的ssr标记的专利申请文件。2009年分别于河南安阳中国农业科学院棉花研究所试验站,中国农业大学曲周试验站和新疆阿克苏德佳科技种业有限公司试验站种植亲本和f6:10群体。安阳和曲周采用单行区,5米行长,行距分别为0.8m和(0.8+0.5)m,每行20株;新疆采用6行区,2米行长,每行15株。2010年分别于河北高邑原种场,河南安阳中国农业科学院试验站和河南郑州种植亲本和f6:11群体,安阳和郑州采用单行区,行长5m,行距0.8m;高邑采用单行区,行长4m,宽窄行(0.8+0.6)m。上述各个试点都采用不完全随机区组设计,种植两个重复。9月中下旬进行田间取样,按家系收花,取12g左右的纤维样品进行纤维品质的测定。(2)提取重组自交系群体和亲本的dna。(3)选择以中国农业科学院棉花研究所提供的棉花四倍体基因组序列为参考基因组进行电子酶切预测(lifg,fangy,lucr,xiaogh,zoucs,kohelrj,mazy,shanghh,maxf,wujh,etal.genomesequenceofcultivateduplandcotton(gossypiumhirsutumtm-1)providesinsightsintogenomeevolution.naturebiotechnology,2015,33(5)),最终选择haeiii+sspi酶,酶切标率为98.61%,共得到495.48mreads,酶切片段长度在364-414bp的序列定义为slaf标签。(4)根据选定的最适酶切方案,对检测的各样品基因组dna进行酶切实验,对得到的酶切片段(slaf标签)进行3’端加a处理,连接dual-index测序街头,pcr扩增、纯化、混样、切胶选取目的片段,文库质检合格后用illuminahiseqtm2500进行测序。(5)利用dual-index对测序得到的原始数据进行识别,得到各个样品的reads。通过reads间聚类的方法,在亲本和子代中开发slaf标签。(6)通过生物信息学分析,共得到321797个slaf标签,其中多态性的slaf标签共有35300个。(7)对多态性的slaf标签进行基因型编码,基因型编码规则为遗传学通用的2等位编码规则,如某标记的亲本基因型为aa(父本)和bb(母本),子代基因型ab则表示该样品在这个标记的编码类型为杂合,其中有一个基因型来自于父本,有一个基因型来自于母本。(8)为保证遗传图谱质量,slaf标签按照父母本测序深度10x以下、完整度低于30%、严重偏分离(p-value<0.05)、亲本杂合、同时比对到两套基因组的条件进行过滤,共筛选出的7958个slaf标签。(9)通过与参考基因组的定位将slaf标签分为26个连锁群,计算高质量分子标签间的lod值,通过lod值进行连锁分群,对每个连锁群采用highmap软件进行遗传图谱的构建,通过校正,得到总图距为5197.17cm的遗传图谱(如图1所示)。其中highmap软件由北京百迈克生物科技公司自主研发。(10)基于slaf的测序数据,通过bwa与两个2倍体棉花的参考基因组比对,得到与亲本之间有多态性的snp有44583个,通过质量过滤后,在图谱上定位得到10440个snp标记。(11)采用软件qtlicimappingv4.0(http://www.isbreeding.net/software/)和软件winqtlcart2.5,通过11个环境(2007年安阳、2008年安阳、2008年临清、2008年曲周、2009年安阳、2009年曲周、2009年阿克苏、2010年安阳、2010年高邑、2010年郑州、2013年安阳)纤维强度性状的表型数据和基因型数据,进行纤维强度性状的多环境qtl定位分析,共得到与强度相关的qtl共5个,其中多环境稳定且能筛选到snp标记的有3个(如图2所示),其中与qfs-chr25-2连锁的snp标记为cri-snp198784、cri-snp198785、cri-snp198786、cri-snp198787、cri-snp198788、cri-snp198789、cri-snp198790、cri-snp198791;与qfs-chr25-3连锁的snp标记为cri-snp198792、cri-snp198793、cri-snp198794、cri-snp198795;与qfs-chr25-5连锁的snp标记为cri-snp198796、cri-snp198797、cri-snp198798、cri-snp198799、cri-snp198800、cri-snp198801、cri-snp198802、cri-snp198803、cri-snp198804、cri-snp198805、cri-snp198806、cri-snp198807。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1