与葡萄酯类香气物质含量相关的SNP分子标记及其应用的制作方法

文档序号:23817750发布日期:2021-02-03 13:58阅读:48来源:国知局
与葡萄酯类香气物质含量相关的SNP分子标记及其应用的制作方法
与葡萄酯类香气物质含量相关的snp分子标记及其应用
技术领域
[0001]
本发明涉及分子标记辅助育种技术领域,具体涉及与葡萄酯类香气物质含量相关的snp分子标记及其应用。


背景技术:

[0002]
葡萄作为重要的经济作物,被广泛种植和培育。香气是葡萄果实品质的重要内容,是影响果品质量和消费者选购倾向的重要因素之一,因此,培育香气浓郁的葡萄品种是近年来葡萄育种的重要方向。酯类是葡萄重要的香气物质类型之一,如乙酸乙酯、乙酸丁酯、甲酸己酯等,它们具有香甜的果香味,并且易于挥发,是葡萄草莓香型的重要物质基础。具有高含量酯类香气物质的葡萄香气浓郁,代表品种为

巨峰’,深受消费者的喜爱。
[0003]
目前,具有高含量酯类香气物质的葡萄新品种的选育是通过人工授粉在杂交后代中选择成熟果实酯类香气浓郁的优株,但葡萄具有多年生、童期长的特点,从种子萌发到开花坐果最短需要三年,并且大量的杂交苗需要较大的土地和管理成本。分子标记是与目标性状紧密关联的dna片段。利用分子标记可实现在种子萌芽后的当年进行性状的早期预测和筛选,保留具有目标性状的杂交苗,淘汰不具有目标性状的杂交苗。分子标记辅助育种可减少育种成本,还可加快育种进程。
[0004]
葡萄香气物质对应的代谢物种类众多,已经发现的酯类香气物质至少24种,并且是受内因和外因共同作用的结果。内因主要是基因型差异;外因较为复杂,包括土壤、光照、温度、水分、营养状况、生长势和负载量等等,内因和外因相互作用,导致香气性状年际间存在较大差异,这为数量性状关联分析(qtl)和全基因组关联分析(gwas)等正向遗传学方法开发分子标记造成了极大的障碍,表现为不同群体定位结果不同,同一群体不同年际间定位结果不同,例如:对邻苯二甲酸二甲酯和邻苯二甲酸二丁酯进行qtl定位,年际间的结果完全不同(朱骏驰,2019,草莓香型葡萄香气物质qtl精细定位及相关基因的筛选,沈阳农业大学博士学位论文),这样的分子标记准确度堪忧,难以应用于生产。因此,开发准确、高效、适用性广的葡萄酯类香气物质含量性状的分子标记,对葡萄品种选育具有重要意义。


技术实现要素:

[0005]
本发明的目的是提供一种与葡萄酯类香气物质含量相关的snp分子标记,本发明的另一目的是提供一种高通量、高准确性和品种适用性广的检测该分子标记的引物和方法。
[0006]
具体地,本发明提供如下技术方案:
[0007]
本发明首先提供一种与葡萄酯类香气物质含量相关的snp分子标记,所述snp分子标记位于葡萄醇酰基转移酶编码基因编码区,以seq id no.1所示序列为参考序列,所述snp分子标记含有葡萄醇酰基转移酶编码基因第1848位、1879位、1959位、1989位和2005位的多态性分别为t或a/c/g、a/g或t/c、t或a/c/g、g或a/c/t以及g或a/c/t的核苷酸序列。
[0008]
本发明通过实验验证,采用含有上述5个snp位点的分子标记能够实现葡萄酯类香
no.5-6所示的引物)进行pcr扩增;
[0029]
(3)分析pcr扩增产物中所述snp分子标记的基因型,根据基因型判断待测葡萄的酯类香气物质含量性状。
[0030]
以上所述的方法中,步骤(1)可采用本领域常规方法提取葡萄的基因组dna。
[0031]
步骤(2)中,以待测葡萄的dna为模板,利用seq id no.5-6所示的引物进行pcr扩增。pcr扩增的反应程序如下:第一步98℃、30s,第二步98℃、10s,第三步60℃、20s,第四步72℃、1min,第二步~第四步共进行35个循环,第六步72℃、10min。50μl反应体系如下:5
×
缓冲液10μl,10mm dntps 1μl,上游引物(seq id no.5)2.5μl,下游引物(seq id no.6)2.5μl,高保真dna聚合酶0.5μl,mgcl
2 0.5μl,dna模板0.5μl,水补足50μl。
[0032]
步骤(3)中,若所述snp分子标记的基因型为aa或aa,则待测葡萄具有高酯类香气物质含量;若所述snp分子标记的基因型为aa,则待测葡萄具有低酯类香气物质含量;其中,a基因型对应于seq id no.1所示序列第1848位、1879位、1935位、1959位、1989位和2005位的核苷酸序列分别为t、a/g、g、t、g和g;a基因型对应于seq id no.1所示序列第1848位、1879位、1935位、1959位、1989位和2005位的核苷酸序列分别为a/c/g、t/c、a/t/c、a/c/g、a/c/t、a/c/t。
[0033]
在进行葡萄育种时,杂交后代的数量往往较大,为更好地满足高通量、高精度、高效性的分子辅助育种要求,优选地,步骤(3)中所述snp分子标记的基因型的分析优选采用miniseq高通量测序方法。具体地,对步骤(2)的pcr产物进行纯化回收后进行文库构建,使用miniseq测序仪进行高通量测序,以seq id no.1所示序列为参考序列,下机数据质控后使用gatk软件进行snp鉴定,分析snp分子标记的基因型。miniseq高通量测序仪一次最多可同时对384个样品进行测序分析,更适用于葡萄育种过程中大样本量酯类香气物质含量性状的鉴定。
[0034]
本发明的有益效果在于:本发明提供的snp分子标记与葡萄酯类香气物质含量性状紧密关联,可用于葡萄酯类香气物质含量高低的鉴定,具有重复性好、准确性高、适用葡萄品种范围广的优势,实现了对于酯类香气这一复杂性状的单分子标记的准确鉴定。
[0035]
本发明提供的snp分子标记可以实现具有高含量酯类香气物质的葡萄的苗期早期鉴定和选择,显著缩短了葡萄育种的周期,提高了育种效率,降低了育种成本。
[0036]
本发明提供的snp分子标记可配合miniseq高通量测序仪进行酯类香气物质含量高低的鉴定,具有通量高、检测成本低、重复性好、准确度高、不受环境条件的影响等优势。
附图说明
[0037]
图1为本发明实施例1中葡萄vvaat等位基因的基因结构示意图。
[0038]
图2为本发明实施例1中24个葡萄品种一代测序结果序列比对。
[0039]
图3为本发明实施例1中葡萄vvaat基因的氨基酸序列比对。
[0040]
图4为本发明实施例2中文库构建过程中index1和index2在96孔板上的排列方式示意图。
具体实施方式
[0041]
以下实施例用于说明本发明,但不用来限制本发明的范围。
[0042]
以下实施例中所使用的实验方法如无特殊说明,均为常规方法。
[0043]
以下实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
[0044]
以下实施例中高酯类香气物质含量也称为酯香型,低酯类香气物质含量也称为非酯香型。
[0045]
实施例1与葡萄酯类香气物质含量相关的snp分子标记的开发
[0046]
1、本发明首先以

巨峰’葡萄转色期果实为试材,提取果皮rna,采用race-pcr技术克隆醇酰基转移酶编码基因的mrna序列全长,得到了1644bp的全长序列,其中5
’-
utr79bp、orf 1350bp、3
’-
utr 215bp,编码449个氨基酸,命名为vvaat,ncbi注册号为kx963771。
[0047]
通过荧光定量pcr分析了vvaat基因的时空表达模式,发现该基因主要在果实中表达,并且属于成熟诱导型,即幼果期基本不表达,转色后和成熟期高表达,这与酯类香气物质含量的动态变化相吻合。高酯类物质含量葡萄

巨峰’和低酯类物质含量葡萄

玫瑰香’果实的vvaat基因表达分析表明,该基因在低酯类物质含量葡萄

玫瑰香’果实中几乎不表达,而在高酯类物质含量葡萄

巨峰’中高表达。
[0048]
进一步克隆了

巨峰’和

玫瑰香’葡萄基因组中的序列,发现

巨峰’中存在两种等位基因类型,分别命名为vvaat-a1和vvaat-a2,

玫瑰香’中存在另一种类型,vvaat-b;其基因结构存在如图1所示,vvaat-a1和vvaat-a2均有2个外显子和1个内含子,而vvaat-b在第二个外显子存在504bp的片段插入。vvaat-a1为巨峰中的表达类型,表达丰度很高,而vvaat-a2几乎检测不到表达,vvaat-b既不能正确翻译,也几乎检测不到表达。
[0049]
2、对24个葡萄品种的vvaat基因序列进行克隆和比较分析,其中14个非酯香型葡萄品种(晚17、葡萄园皇后、香妃、京早晶、郑州早红、索罗门、紫珍珠、京秀、香槟、里扎马特、228、阿登纳玫瑰、乌兹别克玫瑰和累克基特)和10个酯香型葡萄品种(早巨选、奥利文、紫早、安尼斯基、红富士、吉香、藤稔、尼加拉、井川1014和秦龙大穗),分别提取dna,设计特异引物(aat-f(seq id no.5):5
’-
caaactccttgcccggaagga-3’和aat-r(seq id no.6):5
’-
gagcatggatgtaattaacagctc-3’)进行pcr扩增,经1%的琼脂糖凝胶电泳和紫外成像,发现扩增条带大小存在多态性,分别有2057bp(seq id no.1)、2089bp(seq id no.2)、2552bp(seq id no.3)或3239bp(seq id no.4)四种类型,分别切胶回收,构建到克隆载体plb-simple vector,转化dh5α感受态细胞,并涂布在含有100ppm氨苄青霉素的lb平板上,37℃过夜培养后得到分散生长的菌落,经菌液pcr鉴定,每个品种分别挑16个单克隆进行一代测序。序列比对和作图采用dnaman软件。测序结果表明,2057bp(seq id no.2)为vvaat-a2类型,2089bp(seq id no.1)为vvaat-a1类型,2552bp(seq id no.3)为vvaat-b类型,而3239bp(seq id no.4)为新发现的第四种等位基因类型,其基因结构类似于vvaat-b类型,在第二个外显子的相同位置有片段插入,并且该插入片段为两个500bp的串联重复序列(如图1所示),命名为vvaat-c。
[0050]
根据核苷酸序列比对结果(图2),本发明发现酯香型品种早巨选(编号9)、奥利文(编号10)、紫早(编号12)、安尼斯基(编号15)、红富士(编号17)、吉香(编号18)、藤稔(编号19)、尼加拉(编号20)、井川1014(编号22)和秦龙大穗(编号23)均检测到等同于vvaat-a1功能型等位基因第1848位t、1879位a、1935位g、1959位t、1989位g和2005位g的6个单核苷酸碱基类型,而非酯香型品种晚17(编号为1)、8611(编号为2)、香妃(编号为3)、京早晶(编号为4)、郑州早红(编号为5)、索罗门(编号为6)、京秀(编号为8)、香槟(编号为11)、里扎马特(编
号为13)、228(编号为14)、阿登纳玫瑰(编号为16)和乌兹别克玫瑰(编号为21)在该6个位点均检测到了与之不同的碱基类型,分别为a、t/c、t/c、g、a和c。进一步地,对氨基酸序列分析表明(图3),等同于vvaat-a1功能型等位基因第1848位、1879位、1935位、1959位、1989位和2005位的6个snp位点均导致了相应的氨基酸的突变,并且该6个氨基酸位点位于保守功能域dfgwg附近,可能对酶的活性造成了影响,进而导致了性状差异。
[0051]
以上结果表明,等同于vvaat-a1(seq id no.1)功能型等位基因第1848位、1879位、1935位、1959位、1989位和2005位的6个snp位点可以用于区分葡萄果实酯类香气物质含量高低的性状。基于上述分子生物学分析结果以及功能型与非功能型vvaat的氨基酸序列和上述snp突变的同义突变(比如a/g虽然核苷酸序列不同,但对应相同的氨基酸),将等同于vvaat-a1功能型等位基因第1848位、1879位、1935位、1959位、1989位和2005位碱基分别为t、a/g、g、t、g和g的类型命名为a基因型,而碱基分别为a/c/g、t/c、a/t/c、a/c/g、a/c/t和a/c/t的类型命名为a基因型,如果品种基因型为aa或aa,则该品种为具有高酯类香气物质含量,如果品种基因型为aa,则该品种具有低酯类香气物质含量,即具有高酯类香气物质含量的品种至少要有1个a基因型位点,而低酯类香气物质含量品种不能含有a基因型位点。
[0052]
在以上分析结果中,发现了两个例外,紫珍珠(编号为7)为高酯类香气物质含量品种,但基因型为aa,累克基特(编号为24)为低酯类香气物质含量品种,但基因型为aa。基于此,本发明的snp分子标记总体准确率为91.7%,完全可以满足分子辅助育种的需求。
[0053]
实施例2利用snp分子标记鉴定葡萄酯类香气物质含量性状的方法
[0054]
本实施例提供一种利用snp分子标记鉴定葡萄酯类香气物质含量性状的方法,该方法基于本发明发现的snp分子标记,利用miniseq测序仪对扩增子进行高通量测序,使用gatk软件对测序结果进行snp分子标记的基因型分析,根据基因型判断葡萄酯类香气物质含量性状。
[0055]
miniseq测序仪是illumina公司开发的一款小型测序仪,其数据通量最大为7.5g,具有价格便宜、使用方便、测序速度快等优点,适用于扩增子测序分析,比如靶向性扩增基因组中1kb~10kb的区段,构建扩增子测序文库,对性状进行精准鉴定。目前,该方法已经在医学上用于癌症等疾病的早期筛查,但在农业上的应用还是空白,主要原因是缺乏基础研究以提供检测的技术方案。
[0056]
本发明发现的snp分子标记的信息如下:
[0057]
snp位点位于葡萄醇酰基转移酶编码基因vvaat的编码区,共6个位点。将等同于vvaat-a1功能型等位基因(seq id no.1)第1848位、1879位、1935位、1959位、1989位和2005位碱基分别为t、a/g、g、t、g和g的类型命名为a基因型,而碱基分别为a/c/g、t/c、a/t/c、a/c/g、a/c/t和a/c/t的类型命名为a基因型,如果品种基因型为aa或aa,则该品种具有高酯类香气物质含量,如果品种基因型为aa,则该品种具有低酯类香气物质含量。
[0058]
基于miniseq测序仪鉴定葡萄酯类香气物质含量性状的方法具体如下:
[0059]
1、葡萄dna提取
[0060]
采集葡萄梢尖生长点附近2~4片幼叶,立即用于dna的提取。dna提取方法采用ctab法,具体方法如下:
[0061]
(1)配制ctab提取液,于65℃预热;
[0062]
ctab提取液的配方如表1所示。
[0063]
表1 ctab提取液配方
[0064]
母液1ml提取液10ml提取液15ml提取液30ml提取液1m tris0.1ml1ml1.5ml3ml5m nacl0.28ml2.8ml4.2ml8.4ml0.5m edta0.04ml0.4ml0.6ml1.2ml10%ctab0.2 ml2ml3ml6ml10%pvp0.2 ml2ml3ml6mlβ-巯基乙醇0.02ml0.2ml0.3ml0.6mldepc-h2o0.16ml1.6ml2.4ml4.8ml
[0065]
(2)将1.5ml离心管置于液氮中预冷后,加入研磨好的幼叶样品粉末0.1g,每个样品同时做两管;
[0066]
(3)加入0.7ml预热的ctab提取液和1μl rnaase(10mg/ml),吸打混匀,65℃水浴5min;
[0067]
(4)涡旋振荡,之后加入0.7ml氯仿,颠倒混匀,涡旋振荡,12000rpm常温离心5min;
[0068]
(5)小心吸取0.56ml上清转移至新的1.5ml离心管中,加入0.56ml氯仿,颠倒混匀,涡旋振荡,12000rpm常温离心5min;
[0069]
(6)小心吸取0.4ml上清转移至新的1.5ml离心管中,加入0.8ml无水乙醇,颠倒混匀,12000rpm常温离心2min;
[0070]
(7)弃上清,加入0.2ml70%的无水乙醇,上下颠倒几次,12000rpm常温离心2min,用枪吸掉上清,再加入0.2ml 70%的无水乙醇,上下颠倒几次,12000rpm常温离心2min,用枪吸掉上清;
[0071]
(8)12000rpm离心1min,用10μl的枪吸掉残存的水分,并开盖室温放置5min,加入100μl depc-h2o溶解,取5μl电泳检测,-75℃保存备用。
[0072]
2、pcr扩增
[0073]
以步骤1提取的dna为模板,以seq id no.5-6所示的引物进行pcr扩增。
[0074]
反应体系:5
×
phusion hf buffer 10μl,10mm dntps 1μl,上游引物(seq id no.5)2.5μl,下游引物(seq id no.6)2.5μl,phusion dna聚合酶0.5μl,mgcl
2 0.5μl,dna0.5μl,灭菌水补齐至50μl。
[0075]
反应程序:第一步98℃30s,第二步98℃10s,第三步60℃20s,第四步72℃1min,第二步~第四步共进行35个循环,之后第六步72℃10min,第七步4℃10min,至此程序结束。
[0076]
3、pcr产物纯化
[0077]
50μl pcr产物加10μl 6
×
loading buffer并全部用于1%的琼脂糖凝胶(含0.1%dured核酸染料)电泳检测,同时用1kb dnamarker进行分子量标定;电泳仪电压设置120v,电泳时间设置20min,电泳结束后用紫外凝胶成像仪进行成像,应该在目的片段条带大小位置有亮带,对目的条带进行切胶,之后使用天根
tm
琼脂糖凝胶回收试剂盒(dp209-02)进行胶回收。
[0078]
4、文库构建
[0079]
使用nextera
tm xt library prep kit和nextera
tm xt index kit试剂盒进行文库构建,具体操作如下:
[0080]
(1)使用qubit dsdna浓度检测试剂盒对步骤3纯化的dna进行浓度测定,用超纯水调整至浓度为0.2ng/μl;
[0081]
(2)准备无菌的0.2ml pcr管,按照以下体系进行混样:td 10μl,稀释后的dna5μl;
[0082]
(3)每管加5μl atm,用枪头吸打混匀;
[0083]
(4)室温2000rpm离心1min;
[0084]
(5)将pcr管放在pcr仪上,按照下面的程序进行反应:第一步55℃,5min;第二步10℃,5min(关闭pcr仪的热盖功能)。
[0085]
(6)pcr反应结束后立即向每管中加入5μl nt,并吸打混匀;
[0086]
(7)室温2000rpm离心1min;
[0087]
(8)室温放置5min;
[0088]
(9)取出试剂盒中的index1和index2组分,对于24个样品,需要6种index1和4种index2,对于96个样品,需要12种index1和8种index2;将index1按照编号大小顺序横向排列,将index2按照编号大小顺序纵向排列(图4)。
[0089]
(10)每管样品中分别加5μl的index1和5μl的index2,记录index1和index2的编号;
[0090]
(11)每管样品中分别加入15μl的npm,吸打混匀;
[0091]
(12)室温2000rpm离心1min;
[0092]
(13)将pcr管放在pcr仪上,按照表2所示的程序进行反应:
[0093]
表2 pcr反应程序
[0094][0095]
(14)将得到的50μl pcr产物转移至新的伯乐
tm
96孔板;
[0096]
(15)每个样品中分别加入30μl ampure xp beads;
[0097]
(16)使用北京大龙mx-m96孔板混匀仪1800rpm振荡混匀2min,之后室温放置5min;
[0098]
(17)将96孔板放置在磁力架上,直到液体澄清(大约需要3min);
[0099]
(18)用移液器弃掉上清,不同样品要换枪头;
[0100]
(19)每个样品加200μl新配制的80%无水乙醇,在磁力架上放置1min,用移液器弃掉上清,不同样品要换枪头;
[0101]
(20)重复洗涤一次,并尽量吸干上清;
[0102]
(21)在磁力架上放置15min晾干;
[0103]
(22)从磁力架上取下96孔板,每个样品加52.5μl rsb,并在96孔板混匀仪1800rpm振荡混匀2min;
[0104]
(23)室温放置2min,将96孔板放置在磁力架上,直到液体澄清(大约需要3min);
[0105]
(24)转移50μl上清至新的96孔板,如果需要暂停,可以使用伯乐
tm
microseal b密封膜密封,-20℃可以保存7天;
[0106]
(25)取1μl上清,使用high sensitivity dna chip试剂盒在aglient technology 2100全自动电泳仪上进行文库质量检测,如果条带分布集中在250~1000bp范围内是比较理想的;
[0107]
(26)转移20μl上清至新的96孔板;
[0108]
(27)准备一个新的15ml离心管,用于lna1和lnb1混样,每个样品lna1和lnb1的用量分别是44μl和8μl,并且多出5个样品的量(使用移液器分配过程中有损耗);
[0109]
(28)将lna1和lnb1的混合液混匀,并且每个样品中加45μl,使用北京大龙mx-m96孔板混匀仪1800rpm振荡混匀30min;
[0110]
(29)将96孔板放置在磁力架上,直到液体澄清(大约需要3min);
[0111]
(30)用移液器弃掉上清,不同样品要换枪头;
[0112]
(31)每个样品加入45μl lnw1,1800rpm振荡混匀5min,将96孔板放置在磁力架上,直到液体澄清(大约需要3min),用移液器弃掉上清,不同样品要换枪头;
[0113]
(32)重复洗涤一次;
[0114]
(33)每个样品加入30μl 0.1n naoh,用移液器吸打混匀,1800rpm振荡混匀5min,之后放置在磁力架上,直到液体澄清(大约需要3min);
[0115]
(34)准备一个新的96孔板,命名为sgp,并且根据样品数每孔加入30μl lns1,将上一步得到的上清分别转移至sgp板,文库构建完成,如果需要暂停,可以使用伯乐
tm microseal b密封膜密封,-20℃可以保存7天;
[0116]
(35)每个样品文库取5μl加入到新的1.5ml离心管,颠倒混匀,完成文库pooling,如果需要暂停,-20℃可以保存7天。
[0117]
5、上机测试
[0118]
为了碱基平衡,需混入变性和稀释的噬菌体phix对照文库,phix对照文库变性和稀释的具体操作如下:
[0119]
(1)取出10nm的phix对照品贮存液,室温解冻;
[0120]
(2)准备一个新的1.5ml离心管,分别加入10μl 10nm的phix和15μl rsb,用移液器吸打混匀,获得4nm的phix稀释文库;
[0121]
(3)准备一个新的1.5ml离心管,分别加入5μl 4nm的phix和5μl 0.1n naoh,用移液器吸打混匀,室温放置5min;
[0122]
(4)加入5μl 200mm tris-hcl(ph 7.0),用移液器吸打混匀;
[0123]
(5)加入985μl 4℃预冷的hybridization buffer,将phix变性文库稀释至20pm;
[0124]
(6)准备一个新的1.5ml离心管,分别加入45μl 20pm的phix变性文库和455μl 4℃预冷的hybridization buffer,用移液器吸打混匀,获得1.8pm的phix变性和稀释文库。
[0125]
取出低温保存的流动槽和运行试剂盒,室温放置使其恢复常温,安装流动槽,并使用干净的移液器吸头穿破运行试剂盒16号孔的封箔纸,分别加入250μl样品pooling文库和250μl 1.8pm的phix变性和稀释文库,用移液器吸打混匀,动作要轻微,避免产生气泡,之后将运行试剂盒上机,设置为双端150bp模式,运行参数即可开始测序。
[0126]
6、数据分析
[0127]
第一步,使用fastp软件,对下机数据进行质控,以1号样品为例,具体代码为:
[0128]
$fastp-q 15-u 40-m 0-n 5-l 80-w 4-i 1_1.fq.gz-i 1_2.fq.gz-o 1.clean_1.fq.gz\
[0129]-o 1.clean_2.fq.gz-h 1_report.html;
[0130]
第二步,以vvaat-a1(seq id no.2)序列为参考序列,创建比对索引,代码如下:
[0131]
$bwa index./reference/vvaat.fa
[0132]
$samtools faidx./reference/vvaat.fa
[0133]
第三步,将测序结果与参考序列进行比对,以1号样品为例,代码如下:
[0134]
$bwa mem-t 4-r'@rg\tid:foo\tpl:illumina\tsm:1'\
[0135]
./reference/vvaat.fa./cleandata/1_r1-clean.fq./cleandata/1_r2-clean.fq|samtools view-sb->../output/1.bam
[0136]
第四步,将比对结果进行排序,以1号样品为例,代码如下:
[0137]
$samtools sort-@4-m 4g-o bam-o../output/1.sorted.bam../output/1.bam
[0138]
第五步,标记pcr重复,以1号样品为例,代码如下:
[0139]
$gatk markduplicates-i../output/1.sorted.bam-o../output/1.sorted.markdup.bam-m../output/1.sorted.markdup_metrics.txt
[0140]
第六步,创建比对索引文件,以1号样品为例,代码如下:
[0141]
$samtools index../output/1.sorted.markdup.bam
[0142]
第七步,使用gatk软件进行变异检测,根据最终得到.vcf文件即可判断基因型。以1号样品为例,代码如下:
[0143]
$gatk createsequencedictionary-r./reference/vvaat.fa\
[0144]-o./reference/vvaat.dict
[0145]
$gatk haplotypecaller-r./reference/vvaat.fa
--
emit-ref-confidence gvcf\
[0146]-i../output/1.sorted.markdup.bam-o../output/1.g.vcf
[0147]
$gatk genotypegvcfs-r./reference/vvaat.fa-v../output/1.g.vcf\
[0148]-o../output/1.vcf。
[0149]
实施例3用于鉴定葡萄酯类香气物质含量高低的snp分子标记的鉴定准确性检验
[0150]
本发明分别采用两种方法验证snp分子标记用于鉴定葡萄酯类香气物质含量高低的性状的准确性,具体如下:
[0151]
1、基于ncbi公共数据库基因组重测序数据的生物信息学分析
[0152]
下载ncbi数据库中登录号为prjna393611的476个葡萄品种全基因组重测序数据,以vvaat-a1(seq id no.1)序列为参考序列,使用gatk 4.0软件进行snp分析,以srr5891597为例,具体代码如下:
[0153]
$fastp-i srr5891597_1.fastq-i srr5891597_2.fastq-o srr5891597_1-clean.fq-o srr5891597_2-clean.fq-h srr5891597_report.html
[0154]
$bwa index./vvaat.fa
[0155]
$samtools faidx./vvaat.fa
[0156]
$bwa mem-t 4-r'@rg\tid:foo\tpl:illumina\tsm:srr5891597'./vvaat.fa\
[0157]
./cleandata/srr5891597_1-clean.fq./srr5891597_2-clean.fq|samtools view-sb->./srr5891597.bam
[0158]
$samtools sort-@4-m 4g-o bam-o./srr5891597.sorted.bam./srr5891597.bam
[0159]
$gatk markduplicates-i./srr5891597.sorted.bam\
[0160]-o./srr5891597.sorted.markdup.bam-m./srr5891597.sorted.markdup_metrics.txt
[0161]
$samtools index./srr5891597.sorted.markdup.bam
[0162]
$gatk createsequencedictionary-r./vvaat.fa-o./vvaat.dict
[0163]
$gatk haplotypecaller-r./vvaat.fa
--
emit-ref-confidence gvcf\
[0164]-i./srr5891597.sorted.markdup.bam-o./out/srr5891597.g.vcf
[0165]
$gatk genotypegvcfs-r./vvaat.fa-v./out/srr5891597.g.vcf\
[0166]-o./out/srr5891597.vcf
[0167]
由于1935位可能在重测序基因组数据中存在其他位点干扰,因此将该位点排除,将等同于vvaat-a1功能型等位基因第1848位、1879位、1959位、1989位和2005位碱基分别为t、a/g、t、g和g的类型命名为a基因型,而碱基分别为a/c/g、t/c、a/c/g、a/c/t和a/c/t的类型命名为a基因型。将重测序数据分析结果与现有公开资料中的葡萄品种香气表型进行对比,由表3可以看出,非酯香型(即低酯类香气物质含量)品种158个,其中156个基因型为aa,仅两个不正确,为aa,准确度98.7%。酯香型(即高酯类香气物质含量)品种20个,其中17个基因型为aa,3个不准确,为aa,准确度85%。总体准确度为91.85%。由此可见,采用vvaat-a1功能型等位基因第1848位、1879位、1959位、1989位和2005位这5个snp位点也能够实现葡萄的酯类香气物质含量鉴定。476个栽培品种共涉及v.vinifera、v.berlandieri、v.riparia、v.romaneti、cayratia japonica、ampelopsis glandulosa、v.labrusca、v.monticola、v.x novae-angliae、v.palmata、v.rupestris、v.x slavinii、v.vulpina、v.treleasei、v.tiliifolia、v.amurensis、parthenocissus tricuspidata、v.adenoclada、v.coignetiae、v.davidii、v.thunbergii、v.erythrophylla、v.lincecumii、v.monticola、v.californica、v.lincecoumii、v.cinerea、v.xdoaniana、v.cinerea、v.x champinii、v.chungii、v.chunganensis、v.aestivalis、v.acerifolia、v.arizonica、v.girdiana、v.tsoii、v.shenxiensis、v.quinquangularis、v.retordii roman、v.flexuosa、v.heyneana、v.yunnanensis、v.balanseana、v.wuhanensis、v.pseudoreticulata、v.piasezkii、v.lanceolatifoliosa、v.hancockii、v.bashanica、v.betulifolia、v.bellula、v.ficifolia和muscadinia rotundifolia等葡萄属的54个种,仅31个品种不能按照本发明的snp分子标记分型判断为a或a基因型,445个品种可以按照本发明的snp分子标记分型判断基因型,总体适用率为93.5%。
[0168]
表3基于重测序数据的476个葡萄品种的vvaat基因型鉴定
[0169]
[0170]
[0171]
[0172]
[0173]
[0174]
[0175]
[0176]
[0177][0178]
注:假定品种均为二倍体。
[0179]
2、基于miniseq高通量测序仪的葡萄酯类香气物质含量性状的分子检测
[0180]
利用实施例2的miniseq测序方法进行24个葡萄品种样品的snp位点基因型检测,结果如表4所示。
[0181]
表4葡萄品种样品的snp位点基因型分析结果
[0182][0183]
注:假定品种均为二倍体。
[0184]
使用气相质谱联用仪对上述24个测序的葡萄品种样品的香气组分和含量进行测定,检测方法如下:
[0185]
取成熟果实样品,清洗干净后切开去籽,200g样品用榨汁机破碎后匀浆,称取10g匀浆于20ml顶空瓶中,加入1g氯化钠和5微升0.4g/l 3-壬酮,压盖器密封。样品瓶40℃水浴恒温平衡10min,将50/30μm pdms/car/dvb固相微萃取头插入样品瓶顶空部分,40
℃水浴30min进行萃取。用于香气分析的仪器为agilent 7890a/5975c气相色谱-质谱联用仪;色谱柱为hp-5ms(30m
×
0.25mm
×
0.25μm);载气为高纯度氦气,流速为1.3ml/min。手动进样,不分流模式。进样口温度250℃。柱温升温程序:初始40℃,保持3min,以3℃/min的速度升温至140℃;以10℃/min的速度升温至240℃,保持3min。质谱接口温度250℃,离子源温度230℃,全扫描模式,扫描范围:40~550amu。采用内标法对香气成分进行定量分析,物质的含量以3-壬酮的量进行表示。
[0186]
结果如表5所示,其中14个品种酯类香气总含量在300ng/g fw以上,为高酯类香气物质含量品种,10个品种酯类香气总含量在200ng/g fw以下,为低酯类香气物质含量品种。与测序结果相对应,奥利文、早巨选、火星无核、红香蕉、琥珀、红富士、秋蜜、巨峰、井川1014、黑虎香、黑蜜、秦龙大穗、红丹和高砂共14个酯香型样品的snp基因型均含有功能型a类型,而红巴拉多蒂、巧保2号、泽玉、玫瑰花、红意大利、牧丹红、齐查卡普列、8612、克瑞森无核和蓓蕾玫瑰共7个非酯香型样品的snp基因型中6个不含有功能型a类型,均为aa隐性纯合型,仅牧丹红含有功能型a类型,是不准确的。以上实验结果表明,利用本发明的snp分子标记进行葡萄酯类香气物质含量性状的鉴定具有较高的准确性,准确率达95.8%。
[0187]
表5测序样品葡萄酯类香气特征和snp分析
[0188]
[0189]
虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1