陆地棉4号染色体与纤维强度相关的SNP分子标记的制作方法

文档序号:12816964阅读:214来源:国知局
本发明属于棉花分子育种
技术领域
:,具体涉及一种与陆地棉纤维强度相关的snp分子标记及其检测和应用。
背景技术
::棉花作为一种主要的纤维作物,在世界经济中占有重要的地位。在全世界广泛栽培的四个棉种中,陆地棉占据着最重要的地位,其产量占世界棉花总产量的90%以上。随着人们对中高档纺织品需求的增长,对纤维品质的要求日益提高,但传统的育种手段主要是通过表型进行选择,育种效率低,难以满足品质育种的需要。分子标记技术的发展使直接选择数量性状的基因型成为了可能。通过构建棉花遗传图谱进行qtl定位可以使育种者直接选择纤维品质等数量性状的基因型,通过利用f2和ril等作图群体进行了纤维品质qtl定位研究也取得了丰硕的成果。尤其是第三代标记技术snp标记的开发和应用,更可为以后的标记辅助育种打下基础。snp标记是目前最具发展潜力的分子标记,因在基因组中数量多,分布广且在基因分析过程中不需要根据片段大小将dna分带,适合于大规模的自动化和数量庞大的检测分析,目前已得到广泛的应用在医学和生物等领域。但在棉花中的研究还较少。kristenl等将snp标记作为判断染色体重组事件的最小单位(recombinationbin),判断子代每个bin来源于父母本的情况,得到每个子代的全基因组物理图谱,从而构建出bin图谱,用于后续高精度遗传连锁图谱构建和qtl定位(kristenlkump,peterjbradburyetal.genome-wideassociationstudyofquantitativeresistancetosouthernleafblightinthemaizenestedassociationmappingpopulation[j].naturegenetic,2011,43(2):163-168);yu等应用全基因组重测序对241株水稻rils群体进行低深度重测序,以snp为基础构建bin图谱,bin图谱具有超高密度,能够检测到更多的qtl,同时检测到的qtl也更加精细(yuh,xiew,wangj,etal.gainsinqtldetectionusinganultra-highdensitysnpmapbasedonpopulationsequencingrelativetotraditionalrflp/ssrmarkers[j].plosone,2011,6(3):e17595);xu等通过对水稻亲本9311的高深度重测序和128个cssls的低深度的重测序,构建了一张高密度的bin图谱,检测到了768万个snp位点,这128个cssl携带了259个染色体代换片段(xuj,zhaoq,dup,etal.developinghighthroughputgenotypedchromosomesegmentsubstistutionlinesbasedonpopulationwhole-genomere-sequencinginrice(oryzasatival.)[j].bmcgenomics,2010(11):625);吴玲等基于玉米基因定位中ssr标记密度不够,一般的snp标记只基于2种基因型序列差异而在检测其他基因型材料时多态性不够的局限性,结合生物信息学软件开发基于est序列的高多态性snp标记,最终在全基因组中发掘出了80363个snp位点,开发出了12388个snp标记,这些snp标记具有高度多态性(吴玲等,利用生物信息学方法进行基于表达序列标签的玉米单核苷酸多态性标记的开发[j].核农学报,2010,24(5):968-972);朱磊等利用ssr标记在初步定位水稻苯达松敏感致死基因的基础上进一步开发新一代snp标记对其进行精细定位,结果将该基因定位在第3染色体上0.4cm范围内,且4个snp标记与其共分离,最后发现该染色体上一个编码细胞色素p450的基因序列中的一个单碱基的缺失导致移码突变,因而预测这可能是水稻苯达松敏感致死的原因(朱磊,水稻苯达松敏感致死基因bel的精细定位,硕士毕业论文,南昌:南昌大学,2005);楚鹰通过对纤维发育相关基因的snp研究,利用pcr技术分离了七个不同纤维品质的四倍体棉种材料和两个二倍体祖先棉种的纤维发育相关基因片段,共获得了五个棉纤维发育相关基因在九个棉种材料中的序列信息,对陆地棉高强纤维品系间的snps位点进行了统计,发现有四个csnps位点中存在非同义突变,可能具有表型效应(楚鹰,纤维发育相关基因的snp研究与棉花蔗糖合酶基因片段的克隆及表达分析,硕士毕业论文,南京:南京农业大学,2004);郑炜佳通过对新海21和新陆中36进行ssr和snp分子标记引物筛选,使用筛选出的引物对两个f2群体进行pcr扩增,构建遗传连锁图谱,共选择了864对ssr引物对两个亲本进行筛选,共筛选出79对多态性引物,占总数的9.1%。在群体中筛选得到的69对ssr引物和11组snp引物对f2群体扩增出来的多态性标记进行遗传连锁分析,构建了包括90个标记位点的遗传连锁图和30个连锁群,标记间的平均距离为55.9cm,全长为3135.84cm,覆盖棉花基因组的62.71%(郑炜佳,snp标记的开发及海陆遗传连锁图谱的构建,硕士论文,乌鲁木齐:新疆农业大学,2013);zhu通过重组自交系群体构建了全基因组snp连锁图谱,找到2618个多态性snp标记,其中有16个稳定的qtls存在两个环境中,12个qtl涉及多性状,这些qtls主要分布在5、9、10、14、19和20号染色体上(lic,zhusjetal.genome-widesnplinkagemappingandqtlanalysisforfiberqualityandyieldtraitsintheuplandcottonrecombinantinbredlinespopulation.frontiersinplantscience,2016,7:218)。袁有禄等利用一个异常棉高强纤维渐渗系7235和陆地棉遗传标准系tm-1为亲本构建了f2、f2:3分离群体,鉴定了一个可以在中国的不同棉区及美国等多个环境中均能检测到主效qtl,可解释30%以上的表型变异(袁有禄等,棉花高品质纤维性状qtls的分子标记筛选及其定位,遗传学报,2001,28(12):1151-1161);沈新莲利用3个陆地棉高强纤维种质系构建了3个f2种内连锁图,利用复合区间作图法检测到38个与纤维品质有关的qtls,其中15个稳定的qtls能同时在f2和f2:3检测到,至少3个qtls能在两个群体中表达(沈新莲,陆地棉纤维品质qtl的筛选、定位及其应用,博士论文,南京农业大学,2004);石玉真以黄河流域广泛种植的转基因抗虫棉品种sgk321和sgk9708(中41)为轮回亲本,分别与优质丰产品种太121和高纤维品质渐渗种质系7235杂交的f1代材料杂交并回交,配置了杂交回交组合两套,运用与一个已定位的高强纤维qtl紧密连锁的2个ssr标记,这2个标记在不同的遗传背景,经过多代杂交、回交和自交后,能够稳定遗传而且qtl的效应稳定,并运用此项技术结合其它手段进行优质、抗虫等基因的聚合育种研究,快速有效地改良现有的陆地棉推广品种,创造高产、优质、抗虫棉花新材料或新品系(石玉真,李俊文,袁有禄等,与棉花纤维强度连锁的主效qtl应用于棉花分子标记辅助育种[j].分子植物育种,2007,5(4):521-527);贾菲利用以sgk9708为母本,0-153为父本构建的196个陆地棉重组自交系(f6:8)构建了包含186个标记,总长827.84cm,标记间平均距离4.45cm,覆盖棉花基因组18.6%的遗传连锁图谱,并对7个环境下的铃重和衣分性状进行qtl定位和上位性互作分析。定位了多个环境下稳定表达的5个主效qtls(qbw-1-1,qbw-1-2,qlp-2-1,qlp-2-2和qlp-4-2),检测到4对铃重上位性互作qtls和7对衣分上位性互作qtls(贾菲,袁有禄等,多环境下陆地棉(gossypiumhirsutuml.)重组自交系铃重与衣分性状的qtl分析[j].分子植物育种,2011,9(8):318-326);王天抗等利用以2个纤维品质优异材料0-153和新陆早24与2个大面积推广品种鲁棉研28和冀棉516为亲本,配制的双交f1群体,对3个纤维强度主效qtls连锁的4个ssr标记进行辅助选择,并对不同qtls的聚合效应进行了研究。结果4个标记的选择都表现出显著的遗传效应(王天抗,石玉真,袁有禄等,棉花纤维强度主效qtls分子标记辅助选择及聚合效应研究[j].棉花学报,2014,26(5):396-403);jamshed利用重组自交系(ril)群体构建遗传图谱,地图覆盖的距离为4110cm,相邻标记之间的平均距离为5.2cm,定位到47个qtl在多环境下稳定,这些qtl多以聚合群的形式存在,控制两个或两个以上的性状,这些qtl主要集中在4、7、14、25号染色体(jamshedetal.identificationofstablequantitativetraitloc(qtls)forfiberqualitytraitsacrossmultipleenvironmentsingossypiumhirsutumrecombinantinbredlinepopulation[j].bmcgenomics,2016,17:197);zhang通过两个陆地棉品种0–153和sgk9708构建的重组自交系群体利用slaf序列构建了有5521个单核苷酸多态性标记,覆盖总距离为3259.37cm的高密度遗传图谱(zhangetal.constructionofahigh-densitygeneticmapbyspecificlocusamplifiedfragmentsequencing(slaf-seq)anditsapplicationtoquantitativetraitloci(qtl)analysisforbollweightinuplandcotton(gossypiumhirsutum.)[j].bmcplantbiology,2016,16:79)。总之,snp标记是目前最具发展潜力的分子标记,目前已得到广泛的应用,但在棉花中的应用还较少,前人的研究中多数是利用分离群体如f2、bc1,遗传背景复杂,或只在单个环境下检测得到的结果,因此缺乏可靠性和稳定性,多环境稳定的qtl少,且有些研究最初的目的只是为了进行目标基因的定位。技术实现要素:本发明所要解决的技术问题是:通过筛选出一种与陆地棉纤维强度基因紧密连锁且在多个环境下表现稳定的snp分子标记,将这些snp分子标记应用于棉花纤维品质的辅助选择,可以尽快提高我国棉花品种的纤维品质水平。本发明提供的技术方案是:一种与陆地棉纤维高强度基因连锁的snp标记,定位在与纤维强度相关的6个qtl中,其中有4个在多环境下检测稳定,这些qtl都位于陆地棉4号染色体上,有3个能够筛选得到分型较好的snp标记;其中与qfs-chr04-2连锁的snp标记为cri-snp-198739、cri-snp-198740、cri-snp-198741、cri-snp-198742;与qfs-chr04-3连锁的snp标记为cri-snp-198743、cri-snp-198744、cri-snp-198745、cri-snp-198746、cri-snp-198747、cri-snp-198748、cri-snp-198749、cri-snp-198750、cri-snp-198751、cri-snp-198752、cri-snp-198753、cri-snp-198754、cri-snp-198755、cri-snp-198756、cri-snp-198757、cri-snp-198758、cri-snp-198759、cri-snp-198760、cri-snp-198761、cri-snp-198762、cri-snp-198763、cri-snp-198764、cri-snp-198765、cri-snp-198766、cri-snp-198767、cri-snp-198768、cri-snp-198769、cri-snp-198770;与qfs-chr04-5连锁的snp标记为cri-snp-198771、cri-snp-198772,(其中cri:cottonresearchinstitute代表中国农业科学院棉花研究所;snp代表标记类型;数字代表标记开发顺序),所述的snp分子标记在染色体上的位置,和突变碱基如下表所示:标记名称snp位点突变碱基cri-snp-1987397700054t/ccri-snp-1987407720338t/ccri-snp-1987417721630g/tcri-snp-1987428177782a/gcri-snp-1987438254082t/gcri-snp-1987448254072t/ccri-snp-1987458260415c/tcri-snp-1987468297320c/tcri-snp-1987478356357g/acri-snp-1987488442751a/tcri-snp-1987498817947c/tcri-snp-19875010632971g/tcri-snp-19875110678536t/ccri-snp-19875210678492t/gcri-snp-19875310707374g/acri-snp-19875410697252c/tcri-snp-19875510730252a/tcri-snp-19875610794756t/acri-snp-19875710733643t/ccri-snp-19875810745098g/acri-snp-19875910745115a/gcri-snp-19876010761125a/gcri-snp-19876110750539t/ccri-snp-19876210750815c/tcri-snp-19876310758631a/gcri-snp-19876410842788g/acri-snp-19876510890616g/acri-snp-19876610890596c/tcri-snp-19876710890290a/gcri-snp-19876810863195g/tcri-snp-19876910843048g/acri-snp-19877010874601g/acri-snp-19877144993167t/ccri-snp-19877245071666t/c本发明中,qtl命名参考mccouch等(1997)在水稻中的命名规则,以q+性状+连锁群+qtl个数的形式表示(参考文献:mccouchsr,choyg,yanom,etal.reportonqtlnomenclature,ricegenetnewslett.,1997,14:11-13),例如qfs-chr04-2表示定位到4号染色体与纤维强度相关的第二个qtl。本发明所述的snp标记可通过snp基因分型实验有效地区分不同snp位点与不同基因型,从而可对不同棉花样品进行筛选,可筛选出纤维强度高的株系,大大缩短育种周期,提高棉花纤维强度的育种效率。同时,本发明还提供一种与陆地棉纤维强度的三个qtlqfs-chr04-2、qfs-chr04-3、qfs-chr04-5连锁的snp标记的筛选方法,包括如下步骤:(1)利用大田推广的陆地棉栽培品种中棉所41选系sgk9708和具有亚洲棉高强纤维基因的陆地棉优异品系0-153为亲本构建f2和f2:3群体;(2)f2:3群体家系内每世代自交,在f2:6世代进行一次单株选择,再种植两代到f6:8,把f6:8及以后的世代作为重组自交系群体进行多年多点实验;(3)提取重组自交系群体和亲本的dna;(4)构建连锁图谱:对检测的各样品基因组dna进行酶切实验,对得到的酶切片段(slaf标签)进行3’端加a处理,连接dual-index测序接头,pcr扩增、纯化、混样、切胶选取目的片段,测序,对测序结果用软件进行遗传图谱的构建(zhangj,guowz,zhangtz.molecularlinkagemapofal-lotetraploidcotton(gossypiumhirsutuml.×gossypiumbar-badensel.)withahaploidpopulation.theorapplgenet,2002,105:1166–1174);(5)纤维强度qtl定位:进行多个环境下稳定的纤维强度主效qtls筛选,可得到上述的3个多环境稳定的纤维强度主效qtls及其连锁标记。本发明的有益效果如下:本发明涉及的与多环境稳定的高强纤维主效基因有关的位点共有3个(qfs-chr04-2、qfs-chr04-3、qfs-chr04-5),通过筛选与棉花高强纤维主效基因紧密连锁且在多个环境下表现稳定的snp标记,将这些snp标记应用于棉花纤维品质的辅助选择,qtl定位结果可靠,可以尽快提高我国棉花品种的纤维品质水平。qfs-chr04-2能在5个环境下(具体指2007年安阳、2008年安阳、2008年临清、2008年曲周、2010年安阳)检测到,可解释的表型变异为4.88~8.83%,加性效应值为-0.91~-0.63cn/tex;qfs-chr04-3能在8个环境下(具体指2007年安阳、2008年安阳、2008年临清、2008年曲周、2009年曲周、2010年高邑、2010年郑州、2013年安阳)检测到,可解释的表型变异为5.73~10.38%,加性效应值为-1.14~-0.81cn/tex;qfs-chr04-5能在9个环境下(具体指2007年安阳、2008年安阳、2008年临清、2008年曲周、2009年安阳、2010年安阳、2010年高邑、2010年郑州、2013年安阳)检测到,解释的表型变异为4.69~12.6%,加性效应值为0.78~-1.33cn/tex。本发明利用重组自交系f6:8(ril)筛选出稳定的纤维强度qtls及其紧密连锁的分子标记,所述snp分子标记是以棉花稳定的ril群体为材料,通过基因组重测序的方法得到,利用与这些qtl紧密连锁的分子标记筛选出纤维强度得到提高的株系,进行分子标记辅助育种选择,可大大缩短育种周期,提高棉花纤维强度的育种效率。附图说明图1是通过基因组重测序得到的总图距为5197.17cm的遗传图谱。图2是在4号染色体上与强度连锁的qtls的位置图,其中多环境稳定且能筛选到snp标记的有3个,分别为qfs-chr04-2、qfs-chr04-3、qfs-chr04-5。具体实施方式下面通过具体实施方式的详细描述来进一步阐明本发明,但并不是对本发明的限制,仅仅作示例说明。(1)重组自交系f6:8的获得2007年-2008年的田间种植和dna的提取请见专利申请公开号:cn101613761a,发明名称:与棉花纤维强度主效基因连锁的ssr标记的专利申请文件。2009年分别于河南安阳中国农业科学院棉花研究所试验站,中国农业大学曲周试验站和新疆阿克苏德佳科技种业有限公司试验站种植亲本和f6:10群体。安阳和曲周采用单行区,5米行长,行距分别为0.8m和(0.8+0.5)m,每行20株;新疆采用6行区,2米行长,每行15株。2010年分别于河北高邑原种场,河南安阳中国农业科学院试验站和河南郑州种植亲本和f6:11群体,安阳和郑州采用单行区,行长5m,行距0.8m;高邑采用单行区,行长4m,宽窄行(0.8+0.6)m。上述各个试点都采用不完全随机区组设计,种植两个重复。9月中下旬进行田间取样,按家系收花,取12g左右的纤维样品进行纤维品质的测定。(2)提取重组自交系群体和亲本的dna,具体方法参考文献(宋国立,改良ctab法快速提取棉花dna,棉花学报:1998,10(5)273-275)。(3)选择以中国农业科学院棉花研究所提供的棉花四倍体基因组序列为参考基因组进行电子酶切预测(lifg,fangy,lucr,xiaogh,zoucs,kohelrj,mazy,shanghh,maxf,wujh,etal.genomesequenceofcultivateduplandcotton(gossypiumhirsutumtm-1)providesinsightsintogenomeevolution.naturebiotechnology,2015,33(5)),最终选择haeiii+sspi酶,酶切标率为98.61%,共得到495.48mreads,酶切片段长度在364-414bp的序列定义为slaf标签。(4)根据选定的最适酶切方案,对检测的各样品基因组dna进行酶切实验,对得到的酶切片段(slaf标签)进行3’端加a处理,连接dual-index测序街头,pcr扩增、纯化、混样、切胶选取目的片段,文库质检合格后用illuminahiseqtm2500进行测序。(5)利用dual-index对测序得到的原始数据进行识别,得到各个样品的reads。通过reads间聚类的方法,在亲本和子代中开发slaf标签。(6)通过生物信息学分析,共得到321797个slaf标签,其中多态性的slaf标签共有35300个。(7)对多态性的slaf标签进行基因型编码,基因型编码规则为遗传学通用的2等位编码规则,如某标记的亲本基因型为aa(父本)和bb(母本),子代基因型ab则表示该样品在这个标记的编码类型为杂合,其中有一个基因型来自于父本,有一个基因型来自于母本。(8)为保证遗传图谱质量,slaf标签按照父母本测序深度10x以下、完整度低于30%、严重偏分离(p-value<0.05)、亲本杂合、同时比对到两套基因组的条件进行过滤,共筛选出的7958个slaf标签。(9)通过与参考基因组的定位将slaf标签分为26个连锁群,计算高质量分子标签间的lod值,通过lod值进行连锁分群,对每个连锁群采用highmap软件进行遗传图谱的构建,通过校正,得到总图距为5197.17cm的遗传图谱(如图1所示)。其中highmap软件由北京百迈克生物科技公司自主研发。(10)基于slaf的测序数据,通过bwa与两个二倍体棉花的参考基因组比对,得到与亲本之间有多态性的snp有44583个,通过质量过滤后,在图谱上定位得到10440个snp标记。(11)采用软件qtlicimappingv4.0(http://www.isbreeding.net/software/)和软件winqtlcart2.5,通过11个环境(2007年安阳、2008年安阳、2008年临清、2008年曲周、2009年安阳、2009年曲周、2009年阿克苏、2010年安阳、2010年高邑、2010年郑州、2013年安阳)纤维强度性状的表型数据和基因型数据,进行纤维强度性状的多环境qtl定位分析,共得到与纤维强度相关的qtl共6个,其中多环境稳定的有4个,将这些得到的qtl与snp标记进行关联分析,最终筛选得出与纤维强度分型明显的snp标记(qtl在染色体上的位置如图2所示),其中与qfs-chr04-2连锁的snp标记为cri-snp-198739、cri-snp-198740、cri-snp-198741、cri-snp-198742;与qfs-chr04-3连锁的snp标记为cri-snp-198743、cri-snp-198744、cri-snp-198745、cri-snp-198746、cri-snp-198747、cri-snp-198748、cri-snp-198749、cri-snp-198750、cri-snp-198751、cri-snp-198752、cri-snp-198753、cri-snp-198754、cri-snp-198755、cri-snp-198756、cri-snp-198757、cri-snp-198758、cri-snp-198759、cri-snp-198760、cri-snp-198761、cri-snp-198762、cri-snp-198763、cri-snp-198764、cri-snp-198765、cri-snp-198766、cri-snp-198767、cri-snp-198768、cri-snp-198769、cri-snp-198770;与qfs-chr04-5连锁的snp标记为cri-snp-198771、cri-snp-198772。当前第1页12当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1