基于GBS技术的燕麦抗旱性相关SNP分子标记及其应用的制作方法

文档序号:15686460发布日期:2018-10-16 21:06阅读:853来源:国知局

本发明属于燕麦分子辅助育种技术领域,公开了一种基于gbs技术的燕麦抗旱性相关snp分子标记及其应用。所述的分子标记是以燕麦抗旱性稳定的低抗和高抗群体为材料,通过简化基因组-基因分型(gbs-snp)技术和fishertest差异显著性分析和种群中基因型频率得到。利用本发明所公开的snp标记,对燕麦种质的早期抗旱筛查提供依据,可大大缩短育种周期,提高燕麦抗旱育种效率。



背景技术:

燕麦(avenasatival.)是世界第七大栽培农作物,广泛种植于包括我国北方的世界各地,因富含具有降血糖和血脂功效的β-葡聚糖而被大众所需,而干旱一直是制约作物产量的重要因素,抗旱品种选育也是燕麦遗传育种研究的重要内容。山西省农业科学院经过多年常规育种和表型鉴定研究,选育了多种适应不同旱情的燕麦品种用于大田生产。燕麦常规育种周期长、效率低,而分子标记辅助(mas)育种是加速燕麦精准育种的重要手段。因此,开展燕麦抗旱(mas)育种将有效缩短燕麦育种周期,为燕麦种质的早期抗旱筛查提供依据。

目前关于燕麦分子标记的报道主要集中在ssr和aflp标记,相对于上述技术,单核苷酸多态性(snp)是目前最具优势的分子标记,基于测序的gbs-snp技术通过酶切处理去除基因组重复序列显著降低测序量和测序成本,且能够覆盖整个基因组,不受参考基因组限制,因而被广泛应用到开发高密度,高精度的农作物分子标记研究中。



技术实现要素:

本发明为了解决目前燕麦依赖于生物学性状进行燕麦抗旱性鉴定的经验性问题,提供了一种基于gbs技术的燕麦抗旱性相关snp分子标记及其应用。

本发明由如下技术方案实现的:一种基于gbs技术的燕麦抗旱性相关snp分子标记,所述snp分子标记为seqidno.1所示核苷酸序列自5’端起第126位、seqidno.2所示核苷酸序列自5’端起第84位、seqidno.3所示核苷酸序列自5’端起第31和61位,共4个snp位点,位点多态性分别为a/g,g/t,g/t,c/g。

该snp分子标记的获取方法为:采用磁珠法植物基因组dna抽提试剂盒,提取不同抗旱程度燕麦自然群体的基因组dna,采用gbs技术获得燕麦基因组snp信息,采用stacks软件构建燕麦简化基因组参考序列并检测群体snp,fishertest进行差异显著性分析,确定差异显著即fdr<0.001的snp,根据基因型在种群间分布频率阈值为1,获得与燕麦抗旱性相关的snp分子标记。

gbs技术获取燕麦基因组snp信息具体方法为:提取的不同抗旱程度燕麦自然群体的基因组dna,用限制性内切酶psti/mspi双酶切基因组dna,回收220-450bp大小的酶切片段构建gbs文库,采用illuminahiseq测序平台进行双末端高通量测序,测序模式为2×150bp,下机数据以双端fastq格式保存,软件fastqc进行数据质控,高质量数据获取方法为:去除双末端非酶切位点序列,采用adapterremoval去除3'端的接头污染。

所述adapterremoval操作方法为:采用滑动窗口法进行质量过滤,窗口大小设置为5bp,步长设置为1bp;每一次往前移动一个碱基,取5个碱基计算窗口的平均q值,若最后一个碱基的q值≤2,则仅保留该位置之前的碱基;若窗口的平均q值≤20,则仅保留该窗口倒数第二个碱基及之前的碱基;长度过滤,若双末端中任意一条reads的长度≤50bp,则去除该双末端reads。

群体snp检测方法为:高质量数据利用stacks软件组装成燕麦简化基因组参考序列后比对,populations过滤获得燕麦群体snp位点信息,聚类参数设置为:-m4;populations参数设置为:一个位点最少要在1个群体中出现;一个群体中检测到同一位点的个体最低百分数0.50;一个位点的最小等位基因频率0.05。

燕麦抗旱性相关的snp分子标记确定的具体方法为:获得的群体snp采用gcta软件对所有材料进行主成分聚类分析,检测表型即抗旱性与基因型即群体snp分组是否一致,,pca显示高抗和低抗群体聚为两簇;对高抗和低抗表型进行fishertestsnp基因型差异显著性分析,该位点的某一基因型频率在低抗中为1,高抗中为0,获得与抗旱性相关的snp位点。

燕麦抗旱种质的具体筛选方法为:所述snp分子标记的4个snp位点对应的基因型均为a/g,g/t,gg,cc时,则待鉴定的燕麦为低抗旱的燕麦;若显示4个snp位点均缺失(./.),则待鉴定的燕麦为高抗旱的燕麦。

采用本发明所述方法组装了753,325条燕麦简化基因组参考序列,共注释74,657个snp位点。最终获得了燕麦抗旱性相关snp分子标记。

本发明以燕麦自然群体(不同抗旱性的种质或育成品种)为研究对象,采用gbs-snp基因分型技术,通过fishertest差异显著性分析(fdr<0.001)和种群间基因型频率(阈值设为1),开发用于燕麦抗旱种质早期辅助筛选的分子标记。所述的snp位点在低抗中的基因型分别为ag、gt、gg、cc,在高抗中该位点为缺失(./.)。这些与燕麦抗旱性相关snp位点的发明,解决了目前依赖于生物学性状进行燕麦抗旱性鉴定的经验性问题,基于第二代测序的gbs-snp技术,提供了一个用于燕麦抗旱性鉴定的snp分子标记,对现有的燕麦种质早期抗旱性筛查提供依据。

附图说明

图1为燕麦gbs-snp技术流程图;图2为燕麦gbs-snp注释序列,横坐标代表样本,纵坐标表示reads数目;图3为snp位点杂合性,横坐标代表样本,纵坐标表示不同snp位点的纯合、杂合、缺失比率。由此可知:所有测序样本中纯合状态的snp位点(0/0或1/1)占少数,大部分呈现不同程度的杂合(0/1)或缺失状态(./.);图4为主成分分析(pca),显示样本大致聚为两簇,全部11份高抗、4份低抗、8份中抗种质和6个未鉴定品种聚为一簇;而另外一簇则包含14份低抗和5份中抗种质;其余6个未鉴定的燕麦品种则分布在两簇之外。

具体实施方式

以下实施用于说明本发明,所用燕麦样本均由山西省农业科学院农作物品种资源研究所杂粮研究组收集、评价,并保存于燕麦种质资源圃,磁珠法植物基因组dna抽提试剂盒提取燕麦基因组dna,进行gbs文库构建和测序,stacks软件用于构建燕麦简化基因组参考序列并检测群体snp,r脚本(fishertest进行差异显著性分析,种群间基因型频率阈值为1)挖掘与燕麦抗旱性相关的snp分子标记。

一种基于gbs技术的燕麦抗旱性相关snp分子标记,所述snp分子标记为seqidno.1所示核苷酸序列自5’端起第126位、seqidno.2所示核苷酸序列自5’端起第84位、seqidno.3所示核苷酸序列自5’端起第31和61位,共4个snp位点,位点多态性分别为a/g,g/t,g/t,c/g。

1.基因组dna提取:本试验采用购自上海生工生物科技有限公司的磁珠法植物基因组dna抽提试剂盒,用于燕麦幼嫩叶片组织中提取基因组dna。具有经多年抗旱性状鉴定的11份高抗、13份中抗、11份低抗燕麦种质和12个未鉴定的燕麦育成品种为试验材料,燕麦种子发芽两周后,取幼嫩叶片用于提取基因组dna;

采用buffermpcb裂解植物样品,释放出植物基因组dna,蛋白质、多糖和细胞碎片等杂质通过离心沉淀下来。将上清液转移到新的离心管中,在结合液的作用下magicmagbeeds选择性的吸附上清液中的基因组dna。通过洗涤液的清洗完全除去magicmagbeeds吸附的少量杂质,在洗脱液的作用下magicmagbeeds释放吸附的基因组dna,即获得高质量的基因组dna。采用本产品提取植物基因组无需苯酚、氯仿抽提,从50mg植物组织中可以获得15μgdna,od260/od280比值一般为1.7-1.9,抽提的dna可直接用于下游试验。

2.gbs文库构建和测序:该步骤由上海派森诺生物科技有限公司完成。用限制性内切酶psti(ctgcag)和mspi(ccgg)对提取的dna进行酶切后,回收220-450bp之间的酶切片段,之后按照dd-gbs方法进行建库。采用lluminahiseq测序平台进行双末端(paired-end,pe)测序,获得下机数据以双端fastq格式保存。分别对每个样品的下机数据采用fastqc进行质量控制,主要包括碱基质量分布(perbasesequencequality)、质量值(persequencequalityscores)、gc分布(persequencegccontent),对这些反映下机数据质量的多项指标进行统计。

进一步过滤数据包含一些带接头,双末端reads15’端6bp非酶切位点序列ctgcag或reads25’端4bp非酶切位点序列ccgg。采用adapterremoval去除3’端的接头污染。采用滑动窗口进行质量过滤,窗口大小设置为5bp,步长设置为1bp,每一次往前移动一个碱基,取5个碱基计算窗口的平均q值,若最后一个碱基的q值≤2,则仅保留该位置之前的碱基,若窗口的平均q值≤20,则仅保留该窗口倒数第二个碱基及之前的碱基。滤除小于50bp的reads。

3.群体snp检测:应用stacks软件包中的ustacks对每个样品的reads进行聚类,同一个stack代表一个酶切位点(loci),聚类参数设置为-m4,对每一个样品的loci及loci的测序深度进行统计。下一步用cstacks将所有样品的loci合并,不同样品loci之间最多允许2个错配,获得每个loci的catalogconsensus序列。采用sstacks将每个样品的loci序列与catalogconsensus序列比对后populations过滤获得群体snp。主要参数包括:一个位点最少要在1个群体中出现;一个群体中检测到同一位点的个体最低百分数0.50(当群体中该位点的缺失率超过50%,则去除该位点);一个位点的最小等位基因频率0.05。

4.抗旱性相关snp标记的确定:针对获得的群体snp采用gcta软件对所有材料进行主成分聚类分析,pca显示高抗和低抗群体聚为两簇;采用fishertest(自制r脚本,fdr<0.001)比较高、低抗材料,确定差异显著的snp;根据基因型在种群间分布的频率,分别统计高抗和低抗种群内四种基因型(0/0纯合的ref类型的基因型,0/1杂合的ref/alt的基因型,1/1纯合的alt的基因型,./.该位点为缺失)个体出现的频率,因群体数量少,设定种群基因型频率的阈值为1,即低抗中某基因型个体出现的频率为1,高抗中该基因型个体出现的频率为0,进一步鉴定与燕麦抗旱性相关的snp位点。燕麦抗旱性相关snp位点应用见表1。

表1

注:*表示抗旱性程度,*越多表示抗旱性越强。

序列表

<110>山西省农业科学院生物技术研究中心;山西省农业科学院农作物品种资源研究所

<120>基于gbs技术的燕麦抗旱性相关snp分子标记及其应用

<160>3

<170>siposequencelisting1.0

<210>1

<211>139

<212>dna

<213>人工序列(artificialsequence)

<400>1

gtcgggttcggtgtccgctaggggtcttttttggtccgaaaccgaaaacaagcggttatt60

ttatagttttggtgtttttaaaatatttgctagagatgctcttaggagttaccaattaag120

gataactctaataaaaaga139

<210>2

<211>139

<212>dna

<213>人工序列(artificialsequence)

<400>2

catctgaaatctggagcaatagcactacacaaaaggaaagctccagtgacaatgcatggg60

gtaaaccagctggaggaggtagtggattggatgctggtggcagctcttggggtggagcag120

cagtcaacaaggacagtga139

<210>3

<211>148

<212>dna

<213>人工序列(artificialsequence)

<400>3

gtgttgacatatatttggtcactgaaaccaggaaacataacaaagctgtacagaactatt60

ctagcaactgaactcagcgggcagtgacctcactaagttacaattttcatgattatggaa120

cttctaaaagatagatgaaataaagtag148

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1