本发明属于基因工程技术领域,具体涉及一种从马氏珠母贝基因组中高通量开发SNP位点和InDel的方法。
背景技术:
单核苷酸多态性标记(Single Nucleotide Polymorphism,SNP)是继扩增片段长度多态性(AFLP)、微卫星(SSR)等之后的新一代分子标记(Lander,1996)。由于具有数量多、密度大、遗传稳定性高、便于高通量自动化检测分析等优点,SNP标记被广泛应用于高密度遗传连锁图谱构建、基因定位、品种鉴定、群体遗传学研究和分子辅助育种等领域(Liu et al.,2004;Mir et al.,2013;张晓萌等,2013)。同时,SNP标记的准确性和重现性也优于其它分子标记,因此,SNP标记在遗传研究中具有广阔的应用前景。
随着具有高通量、低成本、测序错误率低、测序读长较长等特点的新一代测序技术和生物信息学的发展,使得高通量分子标记开发成为可能。目前,尚未有高通量开发马氏珠母贝基因组SNP标记的方法的相关报道。
技术实现要素:
本发明利用高通量测序技术可以一次性大量获得马氏珠母贝基因中的SNP位点和InDel。
本发明的目的是为了克服现有技术的不足,提供一种从马氏珠母贝基因组中高通量开发SNP位点和InDel的方法。
为了实现上述目的,本发明是通过以下技术方案予以实现的:
一种大规模开发马氏珠母贝基因组SNP标记的方法,其特征在于,包括如下步骤:
S1. 提取待测马氏珠母贝品系的基因组DNA;
S2. 片段化基因组DNA;
S3. DNA片段末端修复、磷酸化并加腺嘌呤尾巴;
S4.将步骤S3的产物连接接头并筛选300~400 bp片段;
S5.PCR文库富集及纯化;
S6.上机测序;
S7.测序数据分析。
优选地,步骤S1中,使用CTAB法提取基因组DNA。
优选地,步骤S2中,使用双链片段化酶片段化基因组DNA。
优选地,步骤S2中,所述片段化的反应体系为:基因组DNA 5ng~3μg、Reaction Buffer 2μL、双链片段化酶 0.12μL,加双蒸水至18μL体系;反应条件为:37 ℃,15h。
优选地,所述DNA片段末端修复、磷酸化并加腺嘌呤尾巴的反应体系为:End Prep Enzyme Mix 3μL、End Repair Reaction Buffer6.5μL、上一步反应产物 55.5μL;反应条件为:20 ℃,30 s; 65 ℃,30 s。
优选地,步骤S4中,所述连接接头反应体系和条件为:上一步反应产物60μL、Blunt/TA Ligase Master Mix 15μL、NEBNext Adaptor for Illumina 2.5μL、Ligation Enhancer 1μL,总体积83.5μL,20℃反应15min;再加入3μL USER enzyme,37℃反应15min。
优选地,步骤S4中,使用磁珠法筛选300~400 bp片段。
更优选地,使用AMPure XP beads筛选300~400 bp片段。。
优选地,步骤S5中,文库富集反应体系为:步骤S5中,文库富集及纯化反应体系为:上一步反应产物 23μL、NEBNext High Fidelity 2X PCR Master Mix μL 25,Index Primer 1μL,Universal PCR Primer 1μL。
优选地,步骤S5中,文库富集及纯化反应条件为:98℃ 30s;98℃ 10s,65℃ 75s,72℃ 30s,6~15 循环;72℃,5min。
优选地,步骤S6中,上机测序使用High Sensitivity DNA Assay Kit进行库检。
优选地,步骤S6中,上机测序使用Hiseq X10 PE150。
优选地,步骤S7中,所述测序数据分析为数据过滤,与参考基因组进行比对,SNP和InDel分析。
优选地,步骤S7中,测序数据过滤为去除含接头的reads、含N比例大于 10% 的reads及低质量reads,获得高质量clean reads。
优选地,步骤S7中,与参考基因组进行比对为利用bwa软件(0.7.12)采用mem算法将过滤后的 reads 比对到参考基因组上,比对参数为 -k 32 –M。
优选地,步骤S7中,参考基因组为http://gigadb.org/dataset/100240下载得到。
优选地,步骤S7中,SNP和InDel分析使用软件 GATK (3.4-46)的UnifiedGenotyper模块进行,过滤参数为 -Window 4,-filter "QD < 2.0 || FS > 60.0 || MQ < 40.0 ",-G_filter "GQ < 20"。
与现有技术相比,本发明具有如下有益效果:
本发明利用高通量测序技术,通过一次测序可以从一个样本中获得大量
采用以上高通量测序技术开发马氏珠母贝基因组SNP和InDel,速度快、成本低、效率高,通过一次测序可以获得大量SNP和InDel,对于马氏珠母贝基因组的深入研究意义深远。
具体实施方式
下面结合说明书和具体实施例对本发明作出进一步地详细阐述,所述实施例只用于解释本发明,并非用于限定本发明的范围。下述实施例中所使用的试验方法如无特殊说明,均为常规方法;所使用的材料、试剂等,如无特殊说明,为可从商业途径得到的试剂和材料。
实施例1
一种从马氏珠母贝基因组中高通量开发SNP位点和InDel的方法,具体包括如下步骤:
1、DNA提取。
使用CTAB法提取待测样品基因组DNA。
2、片段化基因组DNA。
利用NEBNext DNA双链片段化酶,将双链DNA切割成50~1000bp片段。酶切体系为基因组DNA(5ng~3μg)、Reaction Buffer 2μL、双链片段化酶 0.12μL,加双蒸水至18μL体系,混匀,37 ℃,15h。
3、DNA片段末端修复、磷酸化并加腺嘌呤尾巴。
将酶切产生的不同类型的末端进行修复,同时对5′末端进行磷酸化修饰和3′末端加A。
反应体系为:End Prep Enzyme Mix 3μL、End Repair Reaction Buffer (10X) 6.5μL、上一步反应产物55.5μL。
PCR反应条件为:20℃,30 s;65℃,30 s。4 ℃,保存。
4、连接接头
将上一步的反应产物连接接头便于统一模板进行PCR扩增。
反应体系和条件为:上一步反应产物60μL、Blunt/TA Ligase Master Mix 15μL、NEBNext Adaptor for Illumina 2.5μL、Ligation Enhancer 1μL,总体积83.5μL,PCR仪20℃反应15min;在上一步混合液中加入3μL USER enzyme,37℃反应15min。
5、DNA片段筛选。
用AMPure XP beads磁珠筛选300~400bp的目的DNA片段。
6、PCR文库富集。
通过PCR反应增大起始模板量,达到上机量的要求。
反应体系为:上一步反应产物23μL、NEBNext High Fidelity 2X PCR Master Mix μL 25,Index Primer 1μL,Universal PCR Primer 1μL。
PCR循环条件:98℃ 30s;98℃ 10s,65℃ 75s,72℃ 30s,6~15 循环;72℃,5min。4 ℃,保存。
7、上机测序。
上机测序使用High Sensitivity DNA Assay Kit进行库检。之后,使用Hiseq X10 PE150平台进行测序。
8、测序数据分析。
(1)数据过滤:为保证数据质量,减少数据噪音,去除含接头的reads、含 N 比例大于 10% 的reads及低质量reads,获得高质量clean reads;
(2)与参考基因组进行比对:利用bwa软件(0.7.12)采用mem算法将过滤后的 reads 比对到参考基因组上,比对参数为 -k 32 -M;马氏珠母贝参考基因组下载地址:http://gigadb.org/dataset/100240。
(3)SNP和InDel分析:使用软件 GATK (3.4-46)的UnifiedGenotyper模块将处理好的比对文件进行多个样本的SNP/InDel检测,检测到的变异使用VariantFiltration进行过滤,过滤参数为 -Window 4,-filter "QD < 2.0 || FS > 60.0 || MQ < 40.0 ",-G_filter "GQ < 20"。
实施例2 检测“海选1号”品系和普通品系马氏珠母SNP位点和InDel
按照实施例1的方法进行SNP位点和InDel分析,首先,获得高质量clean reads(表1 Reads过滤信息统计表)。进一步获得SNP位点和InDel分析数据(表2所有SNP/InDel统计表;表3各样本SNP/InDel统计表)。
表1 Reads过滤信息统计表:
表2 所有SNP/InDel统计表:
表3样本SNP/InDel统计表:
本发明获得马氏珠母贝两个品系共9503861个SNP位点,共964395个InDel位点,本方法可以同时检测样品大量的SNP位点和InDel。