曼氏无针乌贼生长速度相关的SNP标记及应用的制作方法

文档序号:16645760发布日期:2019-01-16 08:15阅读:172来源:国知局
本发明涉及分子生物学
技术领域
,尤其是涉及曼氏无针乌贼生长速度相关的snp标记及应用。技术背景曼氏无针乌贼(sepiellamaindroniderochebrune)俗称墨鱼,隶属软体动物门,头足纲、乌贼目、乌贼科,无针乌贼属,是我国沿海广温广布品种。作为一种重要的经济头足类,长期以来深受人们喜爱。曼氏无针乌贼曾是我国“四大海产”之一,进入20世纪70年代末以来,春汛在产卵场外围捕捞怀卵亲体、夏汛在产卵场捕捞产卵亲体并破坏产卵场、冬汛捕捞带鱼时兼捕越冬曼氏无针乌贼,致使资源受到严重损害,酿成曼氏无针乌贼资源枯竭,处于灭绝的边缘。到上世纪80年代中期,已没有曼氏无针乌贼渔汛,甚至连曼氏无针乌贼踪影也逐渐消失,因此,恢复和养护曼氏无针乌贼资源已经成为一项重要而紧迫的任务。单核苷酸多态性(singlenucleotidepolymorphism,snp)指的是某种生物不同个体dna序列中单个核苷酸点突变产生的多态性,包括置换、颠换、插入或缺失引起的多态现象。snp是由美国学者lander于1996年提出的继rflp、ssr的第三代新型分子标记技术,1998~2002年每年都召开“snps与复杂基因组”国际会议以探讨snps在复杂基因组中应用,随着pcr、分型检测、dna芯片等技术的不断发展,snp趋于高通量、自动化。近年来,分子标记技术逐渐成为研究水产动物遗传学的重要手段,snp作为第三代遗传标记,位点数量多、密度广、遗传多样性高以及自动化程度强,能够显示其他分子标记技术难以检测到的遗传信息多态性,故而,snp标记技术对于水产动物遗传学研究具有重要意义。基于先进的简化基因组测序技术获得高密度的snp位点,可从全基因组层面查明中国沿海黄鲫种群的遗传多样性水平、种群遗传结构等重要群体遗传学参数,能够克服传统方法中依赖于单个或少数基因位点来评估海洋生物群体遗传和进化机制带来的不确定性和分辨率不高的问题,将为黄鲫的有效管理及合理保护提供背景知识,并有助于推动中国海洋鱼类群体基因组学研究向更深发展。目前获取基因信息数据的方法主要有两种:基因分型和基因测序。基因分型主要是利用已知的单核苷酸多态性(snp)位点侧翼的碱基序列设计探针,并将探针固定在基因芯片上。当待测样本的dna与基因芯片上的探针序列互补杂交并通过扫描荧光信号来探知杂交,便可鉴定样本dna上这些探针位点(snp位点)的基因型。而基因测序是对目标dna进行碱基序列测定,并进行相关分析。现有技术如授权公告号为cn105238859b的中国发明专利,公开了一种获取鸡全基因组高密度snp标记位点的方法,包括以下步骤:(1)预测用ecori与msei的双酶切鸡基因组所获得的酶切片段分布情况;(2)根据ecori与msei的酶切片段分布特点设计通用接头、条形码接头及pcr扩增引物;(3)构建简化基因组测序文库;(4)利用步骤(3)构建的文库进行上机测序;(5)根据测序结果获得snp标记位点;该发明获取每个snp标记位点的成本比传统芯片技术降低一个数量级,且方法技术稳定,重复性高。然而该发明测序程序较复杂,目标dna获取纯度低。技术实现要素:本发明的目的在于提供一种曼氏无针乌贼生长速度相关的snp标记,采用聚合酶链式反应和串联rad标签测序技术筛选曼氏无针乌贼生长速度相关snp标记,具有高通量、低成本,snp标记筛选准确度高、获取效率高等优点。本发明的目的还在于利用曼氏无针乌贼生长速度相关的snp标记进行生长速度快的曼氏无针乌贼品种的选育,从而加快曼氏无针乌贼的育种进程。本发明针对上述技术中提到的问题,采取的技术方案为:曼氏无针乌贼生长速度相关的snp标记,包括以下步骤:提取基因组dna:提取用溶液包括提取液i和提取液ii;其中提取液i包括缓冲盐、非离子表面活性剂、以及中性盐的水溶液,其ph值为7.5-8.5;提取液ii包括缓冲盐和阳离子表面活性剂,其ph值为7.8-8.2;具体步骤为:将曼氏无针乌贼组织样品剪碎,置于提取液i,加入环状dna和甲壳质,冻融2-3次,离心,收集上清液后加入提取液ii,颠倒混匀后,离心产生白色沉淀,洗涤沉淀得dna样品,待用;rad文库构建与高通量测序:包括如下步骤:a1.酶切:利用选定内切酶对n个基因组dna分别进行酶切反应,获得n份酶切片段,n为大于2的整数;a2.接头连接:对n份酶切片段分别连接接头,即设计n对接头组合,得到n份连接产物,每份酶切片段两端连接的接头均设计有sapi酶的酶切位点和用于实现标签串联的特征序列以及扩增引物结合的通用序列,根据所添加的接头决定了n组酶切片段的串联顺序;a3.连接产物扩增:将步骤a2所得到的n份连接产物分别利用不同的生物素引物和普通引物组合进行pcr扩增,富集连接有接头的酶切片段,切胶回收pcr产物,采用同样的方法扩增4-8个循环,扩增后得到n份富集的pcr产物;将n份富集的pcr产物等量混合,并进行纯化;a4.串联标签文库:利用sapi酶对混合并纯化后的n份pcr产物进行酶切,切除了酶切片段两端通用的接头和引物序列,使接头上带有的特征序列保留并形成末端粘性突出,n份pcr产物形成了可直接串联的标签,根据接头上的特征序列互补配对,使n份标签文库按照顺序依次串联,得串联长标签;a5.串联长标签富集:将串联长标签经凝胶纯化后利用引物进行pcr扩增,引入barcode构建串联标签文库;a6.文库测序:将串联标签文库利用illunima测序平台进行测序;原始序列数据过滤:过滤掉原始测序数据中包含带adaptor信息、低质量碱基和未测出的碱基的readspair;原始测序数据中所包含的这些信息会对后续的信息分析造成很大的干扰,分析前将这些干扰信息去除掉,所得到的有效数据为后续数据的精确分析提供了保证;snp信息位点检测与筛选:将过滤所得的readspair通过bwa软件与已发表的曼氏无针乌贼基因组草图进行比对,接着采用samtools0.1.19中的贝叶斯算法模型以最大reads深度为1000的参数设置进行snp的检测,过滤得曼氏无针乌贼生长速度相关snp标记位点。作为优选,环状dna为高纯度的细菌质粒dna;可根据需要选用不同大小的环状dna,只要所加环状dna与所构建的目标dna文库能够有效分离即可;环状dna和甲壳质的特殊存在,一方面能够促进曼氏无针乌贼组织细胞中水分子与非离子表面活性剂结合,发生水合作用,从而对曼氏无针乌贼组织细胞蛋白质表层的水化膜构成破坏,致使蛋白质易于聚集形成沉淀,同时由于其存在能够降低提取液i的介电常数,增加被提取曼氏无针乌贼组织细胞中相反电荷基团之间的吸引力,促进了蛋白质分子的聚集和沉淀,有效提高了曼氏无针乌贼组织细胞蛋白质的脱除率,提高了被提取组织dna的纯度;另一方面,当样品中混有大量微生物(或其他异种生物)基因组污染,环状dna和甲壳质具有识别污染并破坏其结构的功效,使得提取目标dna可不受干扰地进行后续的建库和测序,因而snp标记筛选准确度高、获取效率高。作为优选,缓冲盐选自tris-hcl、磷酸钠、磷酸氢二钠和磷酸二氢钠中的至少一种,浓度为100-200mm。作为优选,非离子表面活性剂为c12~c18的脂肪醇醚硫酸铵或脂肪醇醚硫酸钠。作为优选,阳离子表面活性剂为阳离子聚丙烯酰胺,其浓度为0.1-5ppm。作为优选,中性盐为氯化钠或氯化钾,浓度为100-200mm。作为优选,提取基因组dna过程中,冷冻的温度为-196至-20℃,融化的温度为40-70℃。作为优选,a1步骤中内切酶是iib型限制性内切酶、甲基修饰依赖型内切酶中的一种或几种。作为优选,a2步骤中接头的设计,以3对接头为例,三对接头组合分别为s1a和s1b,s2a和s2b,s3a和s3b,每个接头由两个核苷酸片段组成,接头s1a和s3b的序列中sapi的酶切位点设计了一个碱基的突变,不能被酶切,利用sapi酶对三种混合标签的pcr产物酶切时,酶切标签的两端接头s2a和s2b以及s1b和s3a侧的接头及引物通用序列能被sapi酶切除,使三种标签片段两侧带有的三碱基特征序列形成末端粘性突出,根据特征序列的互补配对,实现三种标签首尾依次串联形成串联标签,而串联标签上s1a和s3b接头端的通用序列仍然保留,为下一步串联标签的扩增富集提供引物的结合点。进一步优选,构成s1a的两个核苷酸片段,其序列分别为seqidno:1和seqidno:2;构成s1b的两个核苷酸片段,其序列分别为seqidno:3和seqidno:4;构成s2a的两个核苷酸片段,其序列分别为seqidno:5和seqidno:6;构成s2b的两个核苷酸片段,其序列分别为seqidno:7和seqidno:8;构成s3a的两个核苷酸片段,其序列分别为seqidno:9和seqidno:10;构成s3b的两个核苷酸片段,其序列分别为seqidno:11和seqidno:12。曼氏无针乌贼生长速度相关的snp标记的应用,可用于进行生长速度快的曼氏无针乌贼品种的选育,从而加快曼氏无针乌贼的育种进程。与现有技术相比,本发明的优点在于:1)本发明可实现对多个标签构建串联测序文库,使得标签测序成本大大降低,实现对全基因组范围遗传标记高通量、低成本地筛查和检测;2)本发明对曼氏无针乌贼生长速度相关的snp标记筛选准确度高、获取效率高,有利于进行生长速度快的优势曼氏无针乌贼品种的选育,从而加快曼氏无针乌贼的育种进程。具体实施方式下面通过实施例对本发明方案作进一步说明:实施例1:曼氏无针乌贼生长速度相关的snp标记,包括以下步骤:提取基因组dna:将曼氏无针乌贼组织样品剪碎,置于提取液i:70ml浓度为150mm的tris-hcl和磷酸氢二钠,0.5g脂肪醇醚硫酸铵,30ml浓度为130mm的氯化钠溶液;加入0.5μg质粒dna和0.1μg甲壳质,冻融2-3次,冷冻的温度为-166℃,融化的温度为50℃,离心,收集上清液后加入提取液ii:10ml浓度为100mm的tris-hcl和磷酸氢二钠和30ml浓度为1.6ppm的阳离子聚丙烯酰胺,颠倒混匀后,离心产生白色沉淀,洗涤沉淀得dna样品,待用;环状dna和甲壳质的特殊存在,一方面能够促进曼氏无针乌贼组织细胞中水分子与非离子表面活性剂结合,发生水合作用,从而对曼氏无针乌贼组织细胞蛋白质表层的水化膜构成破坏,致使蛋白质易于聚集形成沉淀,同时由于其存在能够降低提取液i的介电常数,增加被提取曼氏无针乌贼组织细胞中相反电荷基团之间的吸引力,促进了蛋白质分子的聚集和沉淀,有效提高了曼氏无针乌贼组织细胞蛋白质的脱除率,提高了被提取组织dna的纯度;另一方面,当样品中混有大量微生物(或其他异种生物)基因组污染,环状dna和甲壳质具有识别污染并破坏其结构的功效,使得提取目标dna可不受干扰地进行后续的建库和测序,因而snp标记筛选准确度高、获取效率高;rad文库构建与高通量测序:1)选择两种iib型限制性内切酶(bsaxi、bcgi)酶切基因组dna,获得三种不同类型的酶切产物;酶切体系为15μl,包含200ng基因组dna,1u的内切酶(neb),1×cutsmart,酶切反应温度为37℃,保温45min;2)对三份酶切产物分别连接不同的接头组合,如表1所示,获得三份连接产物;连接反应体系为20μl,包含10μl酶切产物,200ut4dna连接酶(neb),1×t4ligasebuffer,4μmol/lslx-sa,4μmol/lslx-sb,10mmol/l三磷酸腺苷atp,连接反应温度为16℃,连接1h;表1实施例1中三份酶切产物所连接的接头组合标签位置slx-saslx-sb标签1(bsaxi)s1as1b标签2(bcgi)s2as2b标签3(bsaxi)s3as3b其中构成s1a的两个核苷酸序列为:5’-acactctttcccgacgctgttccgatctnnn-3’(seqidno:1)和5’-agatcggaacagc-3’(seqidno:2);s1b的核苷酸序列为:5’-gtgactgcagacgtgtgctcttcacgannn-3’(seqidno:3)和5’-tcgtgaagagcac-3’(seqidno:4);s2a的核苷酸序列为:5’-acactcttacacgacgctcttcagtcnnn-3’(seqidno:5)和5’-gactgaagagcgt-3’(seqidno:6);s2b的核苷酸序列为:5’-gtgactggagttcagacgtcttcacagnnn-3’(seqidno:7)和5’-ctgtgaagagcac-3’(seqidno:8);s3a的核苷酸序列为:5’-acactctttccctacacgcttcactgnnn-3’(seqidno:9)和5’-cagtgaagagcgt-3’(seqidno:10);s3b的核苷酸序列为:5’-gtgactggagttcagtgctgtccgatctnnn-3’(seqidno:11)和5’-agatcggaacagc-3’(seqidno:12);nnn为兼并碱基,n代表四种碱基a、g、c、t任意一种,bsaxi酶切基因组后产生的标签带有三个碱基随机组合的粘性末端,因此此处的接头设计有3个兼并碱基为了使接头能够与基因组中的标签通过粘性末端连接;3)对步骤2)中获得的三份连接产物进行pcr扩增,富集酶切片段,获得三份pcr产物;三份pcr产物用8%非变性聚丙烯酰胺琼凝胶电泳检测,扩增产物大小约为100bp,切胶回收三份pcr产物;将回收的三份pcr产物分别再次进行扩增富集,扩增7个循环得最终的pcr产物;将三份最终的pcr产物等体积混合,使用qiagen公司的minelutepcrkit进行纯化,获得一份pcr纯化产物;4)使用sapi酶对混合pcr产物进行酶切,使酶切片段形成可串联的标签文库;利用8%非变性聚丙烯酰胺琼凝胶电泳检测串联标签产物,连接产物大小约为244bp,切胶回收连接产物;5)串联标签产物利用引物进一步扩增,引入barcode和illunima平台测序所需要的通用序列;pcr产物用8%非变性聚丙烯酰胺凝胶电泳检测,扩增产物大小约为299bp,利用qiagen公司的minelutepcr产物纯化试剂盒回收纯化pcr产物。利用illunimahiseq测序平台测序;原始序列数据过滤:dna文库通过illuminahiseq4000平台进行测序,测序得到的原始测序序列为原始数据,原始测序数据中会包含带接头(adaptor)信息、低质量碱基和未测出的碱基(以n表示)的readspair,然而这些信息会对后续的信息分析造成很大的干扰,分析前需将这些干扰信息去除掉,最终得到的数据即为有效数据,此外,在获得有效数据后,需要进一步去除由于pcr复制导致的重复reads(duplication)并对数据的质量得分(q20,q30)及gc含量分布进行评估,以保证后续数据分析的要求,过滤的标准为:过滤掉含有接头序列的readspair;当单端测序read中n碱基(n表示测序无法确定的碱基信息)的含量超过10%时,去除此对双末端reads;当单端测序read中含有的低质量(phredscore≤5)碱基数超过该条read长度的50%时,去除此对双末端readspair;过滤掉由于pcr扩增产生的重复序列;snp信息位点检测与筛选:将过滤所得的readspair通过bwa软件与已发表的曼氏无针乌贼基因组草图进行比对,接着采用samtools0.1.19中的贝叶斯算法模型以最大reads深度为1000的参数设置进行snp的检测,最后对检测到的snp位点按照以下的标准进行过滤:snp的质量值不低于30(q30);snp的reads支持数不低于10;snp的个体覆盖度不低于80%;最小等位基因频率(maf)不低于5%;仅保留双等位基因位点;每个群体杂合度ho≤0.5;近交系数-0.3≤fis≤0.3;通过深度、覆盖度等参数过滤后,共得到37,634个曼氏无针乌贼生长速度相关的snp标记位点。这些获得的曼氏无针乌贼生长速度相关的snp标记位点可用于进行生长速度快的优势曼氏无针乌贼品种的选育,从而加快曼氏无针乌贼的育种进程。实施例2:提取基因组dna过程中不加入环状dna和甲壳质,其余部分和实施例1完全一致;最终过滤筛选得12730个曼氏无针乌贼生长速度相关snps,这说明加入环状dna和甲壳质能有效提高提取dna的完整度,有利于获得曼氏无针乌贼全基因组信息,提高snp标记筛选准确度和获取率。本发明操作步骤中的常规操作为本领域技术人员所熟知,在此不进行赘述。以上所述的实施例对本发明的技术方案进行了详细说明,应理解的是以上所述仅为本发明的具体实施例,并不用于限制本发明,凡在本发明的原则范围内所做的任何修改、补充或类似方式替代等,均应包含在本发明的保护范围之内。锘搴忓垪琛<110>娴欐睙娴锋磱澶у<120>鏇兼皬鏃犻拡涔岃醇鐢熼暱閫熷害鐩稿叧鐨凷np鏍囪鍙婂簲鐢<160>12<170>siposequencelisting1.0<210>1<211>31<212>dna<213>浜哄伐鍚堟垚(s1a)<400>1acactctttcccgacgctgttccgatctnnn31<210>2<211>13<212>dna<213>浜哄伐鍚堟垚(s1a)<400>2agatcggaacagc13<210>3<211>30<212>dna<213>浜哄伐鍚堟垚(s1b)<400>3gtgactgcagacgtgtgctcttcacgannn30<210>4<211>13<212>dna<213>浜哄伐鍚堟垚(s1b)<400>4tcgtgaagagcac13<210>5<211>29<212>dna<213>浜哄伐鍚堟垚(s2a)<400>5acactcttacacgacgctcttcagtcnnn29<210>6<211>13<212>dna<213>浜哄伐鍚堟垚(s2a)<400>6gactgaagagcgt13<210>7<211>30<212>dna<213>浜哄伐鍚堟垚(s2b)<400>7gtgactggagttcagacgtcttcacagnnn30<210>8<211>13<212>dna<213>浜哄伐鍚堟垚(s2b)<400>8ctgtgaagagcac13<210>9<211>29<212>dna<213>浜哄伐鍚堟垚(s3a)<400>9acactctttccctacacgcttcactgnnn29<210>10<211>13<212>dna<213>浜哄伐鍚堟垚(s3a)<400>10cagtgaagagcgt13<210>11<211>31<212>dna<213>浜哄伐鍚堟垚(s3b)<400>11gtgactggagttcagtgctgtccgatctnnn31<210>12<211>13<212>dna<213>浜哄伐鍚堟垚(s3b)<400>12agatcggaacagc13当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1