一种斑鰶SNP标记及其筛选方法和应用与流程

文档序号:16271023发布日期:2018-12-14 22:15阅读:498来源:国知局
本发明涉及分子生物学
技术领域
,尤其是涉及一种斑鰶snp标记及其筛选方法和应用。技术背景斑鰶(konosiruspunctatus)隶属鲱形目(clupeiformes)、鲱科(clupeidae)、鰶亚科(dorosomatinae)、斑鰶属(konosirus),为沿海暖水性中上层鱼类,广泛分布于中国、朝鲜、韩国以及日本沿海,在我国渤海、黄海、东海、南海均有产出,是中国、日本和朝鲜半岛近海渔业的重要捕捞对象。斑鰶对沿海生态系统的沉积物再悬浮以及水-底界面的物质交换有着重要意义;同时又是多种高营养级鱼类的捕食对象,在海洋食物网结构中扮演着承上启下的关键角色。同时,因其含肉率高、肉质细嫩、味道鲜美,是备受青睐的优质水产品之一,近年来人们对斑鰶的需求量也在稳步增长。由于近年来全球气候变化、环境污染和栖息地破坏等影响,使得斑鰶野生群体数量大大减少。加上持续高强度的捕捞压力,我国斑鰶种群已经出现小型化、低龄化、性早熟等趋势,长此以往势必会对斑鰶的遗传多样性和种质资源造成巨大破坏,产生难以估量的损失。由于其不仅是重要的渔业捕捞对象,还是海洋生态系统变动的关键指示种,在物质循环和能量流动中发挥不可替代的作用,斑鰶资源的衰退不仅会造成其自身渔业产量的大幅减少,而且还会破坏整个沿海生态系统的物质能量循环网结构。因此,加强对斑鰶资源的管理和保护刻不容缓。研究斑鰶的谱系地理结构和种群动态历史,可为斑鰶资源的合理开发利用和管理保护提供重要的科学指导,对衰退种质资源的补充和生态系统的健康发展都具有重要的科学意义。单核苷酸多态性(singlenucleotidepolymorphism,snp)指的是某种生物不同个体dna序列中单个核苷酸点突变产生的多态性,包括置换、颠换、插入或缺失引起的多态现象。snp是由美国学者lander于1996年提出的继rflp、ssr的第三代新型分子标记技术,1998~2002年每年都召开“snps与复杂基因组”国际会议以探讨snps在复杂基因组中应用,随着pcr、分型检测、dna芯片等技术的不断发展,snp趋于高通量、自动化。近年来,分子标记技术逐渐成为研究水产动物遗传学的重要手段,snp作为第三代遗传标记,位点数量多、密度广、遗传多样性高以及自动化程度强,能够显示其他分子标记技术难以检测到的遗传信息多态性,故而,snp标记技术对于水产动物遗传学研究具有重要意义。基于先进的简化基因组测序技术获得高密度的snp位点,可从全基因组层面查明中国沿海黄鲫种群的遗传多样性水平、种群遗传结构等重要群体遗传学参数,能够克服传统方法中依赖于单个或少数基因位点来评估海洋生物群体遗传和进化机制带来的不确定性和分辨率不高的问题,将为黄鲫的有效管理及合理保护提供背景知识,并有助于推动中国海洋鱼类群体基因组学研究向更深发展。目前获取基因信息数据的方法主要有两种:基因分型和基因测序。基因分型主要是利用已知的单核苷酸多态性(snp)位点侧翼的碱基序列设计探针,并将探针固定在基因芯片上。当待测样本的dna与基因芯片上的探针序列互补杂交并通过扫描荧光信号来探知杂交,便可鉴定样本dna上这些探针位点(snp位点)的基因型。而基因测序是对目标dna进行碱基序列测定,并进行相关分析。现有技术如授权公告号为cn105238859b的中国发明专利,公开了一种获取鸡全基因组高密度snp标记位点的方法,包括以下步骤:(1)预测用ecori与msei的双酶切鸡基因组所获得的酶切片段分布情况;(2)根据ecori与msei的酶切片段分布特点设计通用接头、条形码接头及pcr扩增引物;(3)构建简化基因组测序文库;(4)利用步骤(3)构建的文库进行上机测序;(5)根据测序结果获得snp标记位点;该发明获取每个snp标记位点的成本比传统芯片技术降低一个数量级,且方法技术稳定,重复性高。然而该发明测序程序较复杂,目标dna获取纯度低。技术实现要素:本发明的目的在于提供一种斑鰶snp标记筛选方法,采用聚合酶链式反应和串联rad标签测序技术筛选斑鰶snp标记,具有高通量、低成本,snp标记筛选准确度高、获取效率高等优点。本发明的目的还在于利用斑鰶snp标记筛选方法获得高密度的snp位点,可从全基因组层面查明中国沿海斑鰶种群的遗传多样性水平、种群遗传结构等重要群体遗传学参数,能够克服传统方法中依赖于单个或少数基因位点来评估海洋生物群体遗传和进化机制带来的不确定性和分辨率不高的问题,将为斑鰶的有效管理及合理保护提供背景知识,并有助于推动中国海洋鱼类群体基因组学研究向更深发展。本发明针对上述技术中提到的问题,采取的技术方案为:一种斑鰶snp标记筛选方法,包括以下步骤:提取基因组dna:提取用溶液包括提取液i和提取液ii;其中提取液i包括缓冲盐、非离子表面活性剂、以及中性盐的水溶液,其ph值为7.5-8.5;提取液ii包括缓冲盐和阳离子表面活性剂,其ph值为7.8-8.2;具体步骤为:将斑鰶肌肉或鳍条组织样品剪碎,置于提取液i,加入环状dna和甲壳质,冻融2-3次,离心,收集上清液后加入提取液ii,颠倒混匀后,离心产生白色沉淀,洗涤沉淀得dna样品,待用;rad文库构建与高通量测序:包括如下步骤:a1.酶切:利用选定内切酶对n个基因组dna分别进行酶切反应,获得n份酶切片段,n为大于2的整数;a2.接头连接:对n份酶切片段分别连接接头,即设计n对接头组合,得到n份连接产物,每份酶切片段两端连接的接头均设计有sapi酶的酶切位点和用于实现标签串联的特征序列以及扩增引物结合的通用序列,根据所添加的接头决定了n组酶切片段的串联顺序;a3.连接产物扩增:将步骤a2所得到的n份连接产物分别利用不同的生物素引物和普通引物组合进行pcr扩增,富集连接有接头的酶切片段,切胶回收pcr产物,采用同样的方法扩增4-8个循环,扩增后得到n份富集的pcr产物;将n份富集的pcr产物等量混合,并进行纯化;a4.串联标签文库:利用sapi酶对混合并纯化后的n份pcr产物进行酶切,切除了酶切片段两端通用的接头和引物序列,使接头上带有的特征序列保留并形成末端粘性突出,n份pcr产物形成了可直接串联的标签,根据接头上的特征序列互补配对,使n份标签文库按照顺序依次串联,得串联长标签;a5.串联长标签富集:将串联长标签经凝胶纯化后利用引物进行pcr扩增,引入barcode构建串联标签文库;a6.文库测序:将串联标签文库利用illunima测序平台进行测序;原始序列数据过滤:过滤掉原始测序数据中包含带adaptor信息、低质量碱基和未测出的碱基的readspair;原始测序数据中所包含的这些信息会对后续的信息分析造成很大的干扰,分析前将这些干扰信息去除掉,所得到的有效数据为后续数据的精确分析提供了保证;snp信息位点检测与筛选:将过滤所得的readspair通过bwa软件与已发表的斑鰶基因组草图进行比对,接着采用samtools0.1.19中的贝叶斯算法模型以最大reads深度为1000的参数设置进行snp的检测,过滤得斑鰶snp标记位点。作为优选,环状dna为高纯度的细菌质粒dna;可根据需要选用不同大小的环状dna,只要所加环状dna与所构建的目标dna文库能够有效分离即可;环状dna和甲壳质的特殊存在,一方面能够促进斑鰶组织细胞中水分子与非离子表面活性剂结合,发生水合作用,从而对斑鰶组织细胞蛋白质表层的水化膜构成破坏,致使蛋白质易于聚集形成沉淀,同时由于其存在能够降低提取液i的介电常数,增加被提取斑鰶组织细胞中相反电荷基团之间的吸引力,促进了蛋白质分子的聚集和沉淀,有效提高了斑鰶组织细胞蛋白质的脱除率,提高了被提取组织dna的纯度;另一方面,当样品中混有大量微生物(或其他异种生物)基因组污染,环状dna和甲壳质具有识别污染并破坏其结构的功效,使得提取目标dna可不受干扰地进行后续的建库和测序,因而snp标记筛选准确度高、获取效率高。作为优选,缓冲盐选自tris-hcl、磷酸钠、磷酸氢二钠和磷酸二氢钠中的至少一种,浓度为100-200mm。作为优选,非离子表面活性剂为c12~c18的脂肪醇醚硫酸铵或脂肪醇醚硫酸钠。作为优选,阳离子表面活性剂为阳离子聚丙烯酰胺,其浓度为0.1-5ppm。作为优选,中性盐为氯化钠或氯化钾,浓度为100-200mm。作为优选,提取基因组dna过程中,冷冻的温度为-196至-20℃,融化的温度为40-70℃。作为优选,a1步骤中内切酶是iib型限制性内切酶、甲基修饰依赖型内切酶中的一种或几种。作为优选,a2步骤中接头的设计,以3对接头为例,三对接头组合分别为s1a和s1b,s2a和s2b,s3a和s3b,每个接头由两个核苷酸片段组成,接头s1a和s3b的序列中sapi的酶切位点设计了一个碱基的突变,不能被酶切,利用sapi酶对三种混合标签的pcr产物酶切时,酶切标签的两端接头s2a和s2b以及s1b和s3a侧的接头及引物通用序列能被sapi酶切除,使三种标签片段两侧带有的三碱基特征序列形成末端粘性突出,根据特征序列的互补配对,实现三种标签首尾依次串联形成串联标签,而串联标签上s1a和s3b接头端的通用序列仍然保留,为下一步串联标签的扩增富集提供引物的结合点。进一步优选,构成s1a的两个核苷酸片段,其序列分别为seqidno:1和seqidno:2;构成s1b的两个核苷酸片段,其序列分别为seqidno:3和seqidno:4;构成s2a的两个核苷酸片段,其序列分别为seqidno:5和seqidno:6;构成s2b的两个核苷酸片段,其序列分别为seqidno:7和seqidno:8;构成s3a的两个核苷酸片段,其序列分别为seqidno:9和seqidno:10;构成s3b的两个核苷酸片段,其序列分别为seqidno:11和seqidno:12。一种斑鰶snp标记的应用,可利用获得的斑鰶snp标记位点为斑鰶种群遗传多样性水平、种群遗传结构等分析的相关研究提供重要的基础。与现有技术相比,本发明的优点在于:1)本发明可实现对多个标签构建串联测序文库,使得标签测序成本大大降低,实现对全基因组范围遗传标记高通量、低成本地筛查和检测;2)本发明在提取目标基因组dna时加入环状dna和甲壳质,能够提高获取dna的纯度,以及识别目标dna中污染物并破坏其结构,从而有利于提取目标dna可不受干扰地进行后续的建库和测序;3)通过简化基因组测序技术,对斑鰶进行全基因组扫描,获得高密度的snp位点,并利用筛选到的位点对斑鰶种群进行遗传多样性水平、种群遗传结构等分析。具体实施方式下面通过实施例对本发明方案作进一步说明:实施例1:一种斑鰶snp标记筛选方法,包括以下步骤:提取基因组dna:将斑鰶肌肉或鳍条组织样品剪碎,置于提取液i:70ml浓度为150mm的tris-hcl和磷酸氢二钠,0.5g脂肪醇醚硫酸铵,30ml浓度为130mm的氯化钠溶液;加入0.5μg质粒dna和0.1μg甲壳质,冻融2-3次,冷冻的温度为-166℃,融化的温度为50℃,离心,收集上清液后加入提取液ii:10ml浓度为100mm的tris-hcl和磷酸氢二钠和30ml浓度为1.6ppm的阳离子聚丙烯酰胺,颠倒混匀后,离心产生白色沉淀,洗涤沉淀得dna样品,待用;环状dna和甲壳质的特殊存在,一方面能够促进斑鰶组织细胞中水分子与非离子表面活性剂结合,发生水合作用,从而对斑鰶组织细胞蛋白质表层的水化膜构成破坏,致使蛋白质易于聚集形成沉淀,同时由于其存在能够降低提取液i的介电常数,增加被提取斑鰶组织细胞中相反电荷基团之间的吸引力,促进了蛋白质分子的聚集和沉淀,有效提高了斑鰶组织细胞蛋白质的脱除率,提高了被提取组织dna的纯度;另一方面,当样品中混有大量微生物(或其他异种生物)基因组污染,环状dna和甲壳质具有识别污染并破坏其结构的功效,使得提取目标dna可不受干扰地进行后续的建库和测序,因而snp标记筛选准确度高、获取效率高;rad文库构建与高通量测序:1)选择两种iib型限制性内切酶(bsaxi、bcgi)酶切基因组dna,获得三种不同类型的酶切产物;酶切体系为15μl,包含200ng基因组dna,1u的内切酶(neb),1×cutsmart,酶切反应温度为37℃,保温45min;2)对三份酶切产物分别连接不同的接头组合,如表1所示,获得三份连接产物;连接反应体系为20μl,包含10μl酶切产物,200ut4dna连接酶(neb),1×t4ligasebuffer,4μmol/lslx-sa,4μmol/lslx-sb,10mmol/l三磷酸腺苷atp,连接反应温度为16℃,连接1h;表1实施例1中三份酶切产物所连接的接头组合标签位置slx-saslx-sb标签1(bsaxi)s1as1b标签2(bcgi)s2as2b标签3(bsaxi)s3as3b其中构成s1a的两个核苷酸序列为:5’-acactcttacccgacgctgttccgatctnnn-3’(seqidno:1)和5’-agatcggaacagc-3’(seqidno:2);s1b的核苷酸序列为:5’-gtgactgcaggcgtgtgctcttcacgannn-3’(seqidno:3)和5’-tcgtgaagagcac-3’(seqidno:4);s2a的核苷酸序列为:5’-acactctaacacgacgctcttcagtcnnn-3’(seqidno:5)和5’-gactgaagagcgt-3’(seqidno:6);s2b的核苷酸序列为:5’-gtgactggagttccgacgtcttcacagnnn-3’(seqidno:7)和5’-ctgtgaagagcac-3’(seqidno:8);s3a的核苷酸序列为:5’-acactctttgcctacacgcttcactgnnn-3’(seqidno:9)和5’-cagtgaagagcgt-3’(seqidno:10);s3b的核苷酸序列为:5’-gtgactggagtccagtgctgtccgatctnnn-3’(seqidno:11)和5’-agatcggaacagc-3’(seqidno:12);nnn为兼并碱基,n代表四种碱基a、g、c、t任意一种,bsaxi酶切基因组后产生的标签带有三个碱基随机组合的粘性末端,因此此处的接头设计有3个兼并碱基为了使接头能够与基因组中的标签通过粘性末端连接;3)对步骤2)中获得的三份连接产物进行pcr扩增,富集酶切片段,获得三份pcr产物;三份pcr产物用8%非变性聚丙烯酰胺琼凝胶电泳检测,扩增产物大小约为100bp,切胶回收三份pcr产物;将回收的三份pcr产物分别再次进行扩增富集,扩增7个循环得最终的pcr产物;将三份最终的pcr产物等体积混合,使用qiagen公司的minelutepcrkit进行纯化,获得一份pcr纯化产物;4)使用sapi酶对混合pcr产物进行酶切,使酶切片段形成可串联的标签文库;利用8%非变性聚丙烯酰胺琼凝胶电泳检测串联标签产物,连接产物大小约为244bp,切胶回收连接产物;5)串联标签产物利用引物进一步扩增,引入barcode和illunima平台测序所需要的通用序列;pcr产物用8%非变性聚丙烯酰胺凝胶电泳检测,扩增产物大小约为299bp,利用qiagen公司的minelutepcr产物纯化试剂盒回收纯化pcr产物。利用illunimahiseq测序平台测序;原始序列数据过滤:dna文库通过illuminahiseq4000平台进行测序,测序得到的原始测序序列为原始数据,原始测序数据中会包含带接头(adaptor)信息、低质量碱基和未测出的碱基(以n表示)的readspair,然而这些信息会对后续的信息分析造成很大的干扰,分析前需将这些干扰信息去除掉,最终得到的数据即为有效数据,此外,在获得有效数据后,需要进一步去除由于pcr复制导致的重复reads(duplication)并对数据的质量得分(q20,q30)及gc含量分布进行评估,以保证后续数据分析的要求,过滤的标准为:过滤掉含有接头序列的readspair;当单端测序read中n碱基(n表示测序无法确定的碱基信息)的含量超过10%时,去除此对双末端reads;当单端测序read中含有的低质量(phredscore≤5)碱基数超过该条read长度的50%时,去除此对双末端readspair;过滤掉由于pcr扩增产生的重复序列;snp信息位点检测与筛选:将过滤所得的readspair通过bwa软件与已发表的斑鰶基因组草图进行比对,接着采用samtools0.1.19中的贝叶斯算法模型以最大reads深度为1000的参数设置进行snp的检测,最后对检测到的snp位点按照以下的标准进行过滤:snp的质量值不低于30(q30);snp的reads支持数不低于10;snp的个体覆盖度不低于80%;最小等位基因频率(maf)不低于5%;仅保留双等位基因位点;每个群体杂合度ho≤0.5;近交系数-0.3≤fis≤0.3;通过深度、覆盖度等参数过滤后,共得到49,694个斑鰶snp标记位点。这些获得的斑鰶snp标记位点能够为斑鰶种群遗传多样性水平、种群遗传结构等分析的相关研究提供重要的基础。实施例2:提取基因组dna过程中不加入环状dna和甲壳质,其余部分和实施例1完全一致;最终过滤筛选得28730个斑鰶snps,这说明加入环状dna和甲壳质能有效提高提取dna的完整度,有利于获得斑鰶全基因组信息,提高snp标记筛选准确度和获取率。实施例3:rad文库构建与高通量测序过程中,在pcr扩增体系过程中加入甲壳质流体,甲壳质的质量百分比为0.16%,溶剂为l-氨基酸乙酯;其余部分和实施例1完全一致;甲壳质流体的特殊存在,对dna具有极强的吸附力,能够提高pcr成功率,同时甲壳质流体是由许多微小球体组成,可以包裹反应体系,使pcr扩增反应在一个个微小的独立空间完成,从而提高pcr扩增的反应敏感度,使反应更加充分,提高微量dna的pcr扩增效果;此外,甲壳质流体能提高反应体系的沸点使体系缓冲液不易蒸发,降低了pcr扩增过程中试剂的用量,从而降低了实验成本。本发明操作步骤中的常规操作为本领域技术人员所熟知,在此不进行赘述。以上所述的实施例对本发明的技术方案进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充或类似方式替代等,均应包含在本发明的保护范围之内。序列表<110>浙江海洋大学<120>一种斑鰶snp标记及其筛选方法和应用<160>12<170>siposequencelisting1.0<210>1<211>31<212>dna<213>人工合成(s1a)<400>1acactcttacccgacgctgttccgatctnnn31<210>2<211>13<212>dna<213>人工合成(s1a)<400>2agatcggaacagc13<210>3<211>30<212>dna<213>人工合成(s1b)<400>3gtgactgcaggcgtgtgctcttcacgannn30<210>4<211>13<212>dna<213>人工合成(s1b)<400>4tcgtgaagagcac13<210>5<211>29<212>dna<213>人工合成(s2a)<400>5acactctaacacgacgctcttcagtcnnn29<210>6<211>13<212>dna<213>人工合成(s2a)<400>6gactgaagagcgt13<210>7<211>30<212>dna<213>人工合成(s2b)<400>7gtgactggagttccgacgtcttcacagnnn30<210>8<211>13<212>dna<213>人工合成(s2b)<400>8ctgtgaagagcac13<210>9<211>29<212>dna<213>人工合成(s3a)<400>9acactctttgcctacacgcttcactgnnn29<210>10<211>13<212>dna<213>人工合成(s3a)<400>10cagtgaagagcgt13<210>11<211>31<212>dna<213>人工合成(s3b)<400>11gtgactggagtccagtgctgtccgatctnnn31<210>12<211>13<212>dna<213>人工合成(s3b)<400>12agatcggaacagc13当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1