基于基因组简化与二代测序dna文库构建方法及试剂盒的制作方法

文档序号:3340764阅读:1188来源:国知局
专利名称:基于基因组简化与二代测序dna文库构建方法及试剂盒的制作方法
技术领域
本发明涉及的是一种生物技术领域的方法及试剂盒,具体是一种基于基因组简化与二代测序DNA文库构建方法及试剂盒。
背景技术
随着分子生物学、遗传学、统计基因组学等学科的不断发展,在基因组(Genome)层面利用全基因组关联分析(Genome-wide association study, GffAS)等方法研究与人类疾病及家畜重要农业经济性状相关的遗传变异成为可能,单核苷酸多态性(Singlenucleotide polymorphism, SNP)是GWAS及许多研究工作例如基因组选择(Genomicselection)、高精度遗传作图(Highly-resolution mapping)的基础。对于位点较少的SNP检测,比如少数几个候选基因(Candidate genes)或几个感兴趣的区域以及已知的少 数革巴 SNP 位点,许多方法如 RT-PCR, IlluminaGoldenGate, SequenomMassARRAY, AppliedBiosysetemsSNaPshot以及Roche LightTyper等均能实现小群体样品检测。基于微阵列SNP检测芯片(Affymetrix, Illumina及Agilent等)的出现促进群体遗传学研究,大大提高了 SNP检测通量,使在相对较大的群体研究成为了可能,在人上发现了大量与复杂疾病等表型关联的SNP,同时在重要经济动物诸如猪,牛等经济性状研究中发挥了重要作用。但是,相对高的检测费用严重制约了基于芯片研究的广泛应用,同时基于特定群体设计的微阵列芯片并不能满足研究的需要,例如基于长白、大白、皮特兰和杜洛克猪设计的IlluminaporcineSNP60芯片(大约6万个SNP位点),由于中国地方猪种与西方猪种的遗传距离较远,因此在利用该芯片研究地方猪种时存在明显缺陷,SNP位点也嫌不足。跟据研究目的自定制芯片虽能满足研究,但仍然存在大量的时间、劳动力和成本消耗。二代测序技术(Next-generation sequencing, NGS)的出现革命化了群体遗传学研究,随着其技术不断更新,其研究成本正不断降低,利用二代测序技术在全基因组层面通过并行测序模式(Parallel sequencing)以低检测费用发现数十万甚至百万SNPs成为可能,并以此发现了大量与复杂疾病相关以及与动物表型相关的主效基因(Major effectgene)及SNP位点。基于二代测序个体间数据的不均一性及数据高缺失率的特点,测序方法的改进即测序文库的构建(Libraries preparation)及数据填补方法即基因型推演(Genotyping imputation)是当前研究的难点和热点。当前,用于二代测序的文库构建方法主要有 RAD-seq (Restriction-site-association DNA sequencing) (Baird N.J., et al,2008)、WGR(Whole genome resequencing)(Huang X. H. ,et al,2009)> GBS (Genotyping bysequencing) (Elshire R. J. , et al, 2011)以及 MSG(MyL tiplexedshotgun genotyping)(Andolfatto P., et al, 2011)等,这些方法已分别成功运用到棘鱼(Stickleback)、水稻(Rice)、大麦(Barley)和玉米(Maize)以及果蚬(Fruit fly)等物种的SNP发现(SNPdiscovery)及基因分型(Genotyping)研究。由于这些物种均为“小”基因组(Smallgenome)和重组近交系(Recombinant inbred lines)群体,且有较高质量的参考序列(Reference panel),因此,在较低测序深度(Sequencing depth)和覆盖度Coverage)时能够通过直接分型(Directly genotyping)和间接分型(Imputating genotyping)发现大量的标记。然而,对于来源于远交群体(Outbreeding pop μ Lation)的二倍体杂合物种,特别是系谱不清晰、低质量参考序列以及无单体型图的物种,比如猪,这些方法并不完全适合用。

发明内容
本发明针对现有技术存在的上述不足,提出一种基于基因组简化与二代测序DNA文库构建方法及试剂盒,与RAD-seq方法相比,大大简化了测序流程,GGRS不需要DNA片段的随机打断(RandomLy shear)、更少的胶回收步骤(Gel-purification)以及减少了接头连接(ligating-adapter)步骤;与低覆盖度(Low coverage) MSG及GBS方法,尤其是GBS方法相比,GGRS方法减少了移除接头(Removing-adapter)步骤,针对远交群体设计出一套barcode-adapter体系,而不用GBS方法中所使用的两套adapters体系(Barcode-adapter和Common-adapter)。由于整个文库构建流程中间步骤不需要产物清洗(Clean up)和胶回收(Gel-purification),即酶切反应、连接反应、PCR均不涉及片段随机丢失,保证了个体间测序片段(Fragments)较好的均一'丨生,同时GGRS流程不涉及片段随机打断(RandomLyshear)和末端修饰(End repair),高度简化的文库准备步骤允许仅使用ng级DNA即可完成文库构建。本发明是通过以下技术方案实现的,本发明包括以下步骤第一步、基因组DNA的提取利用组织DNA提取试剂盒提取基因组DNA,利用限制性内切酶(Restriction enzyme)对基因组DNA进行消化处理(Digestion),得到限制性片段;所述的组织是指猪耳组织,具体取自猪耳尖边缘处。所述的基因组DNA经过琼脂糖凝胶电泳检测及260nm/280nm纯度检测,且稀释成50 IOOng/ μ L 备用;所述的限制性内切酶优选为甲基化敏感限制性内切酶,进一步优选为Avail ;第二步、使用T4DNA连接酶对限制性片段连接上DNA条形码-接头(DNA BarcodeAdapter),得到DNA条形码-接头的序列对;所述的接头(DNA Barcode Adapter)包括正链和负链,具体为正链5,ACACTCTTTCCCTACACGACGCTCTTCCGATCT3,,负链5’AGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG3’。所述的DNA条形码包括72个序列,具体为
权利要求
1.一种基于基因组简化与二代测序DNA文库构建方法,其特征在于,包括以下步骤 第一步、基因组DNA的提取利用组织DNA提取试剂盒提取基因组DNA,利用限制性内切酶对基因组DNA进行消化处理,得到限制性片段; 第二步、使用T4DNA连接酶对限制性片段连接上DNA条形码-接头(DNA BarcodeAdapter),得到DNA条形码-接头的序列对; 第三步、将DNA条形码-接头的序列对进行混合,然后以混合物作为模板进行PCR扩增,扩增后的产物经琼脂糖凝胶电泳后回收DNA片段作为测序文库,采用芯片分析系统进行最终的质量检测和测序。
2.根据权利要求I所述的方法,其特征是,所述的组织是指猪耳组织。
3.根据权利要求I所述的方法,其特征是,所述的基因组DNA经过琼脂糖凝胶电泳检测及260nm/280nm纯度检测,且稀释成50 IOOng/ μ L。
4.根据权利要求I所述的方法,其特征是,所述的限制性内切酶为甲基化敏感限制性内切酶。
5.根据权利要求I或4所述的方法,其特征是,所述的限制性内切酶为Avail。
6.根据权利要求I所述的方法,其特征是,所述的接头包括正链和负链,具体为正链5’ ACACTCTTTCCCTACACGACGCTCTTCCGATCT3’,负链5’ AGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG3’。
7.根据权利要求I所述的方法,其特征是,所述的DNA条形码包括72个序列,具体为
8.根据权利要求I所述的方法,其特征是,所述的DNA条形码-接头的序列对包括正链和负链,具体为正链5’ ACACTCTTTCCCTACACGACGCTCTTCCGATCTXXXXX3’,负链5,GWCYYYYYAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG3’, 其中正链中的XXXXX代表barcode序列,负链中YYYYY代表barcode互补序列,W代表碱基A或T。
9.根据权利要求I所述的方法,其特征是,所述的PCR扩增中所采用的引物对包括 引物序列1.1 5' AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT ; 引物序列2. I 5' CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT。
10.根据权利要求I所述的方法,其特征是,所述的测序文库为经琼脂糖凝胶电泳回收得到的300 400bp的DNA片段。
11.一种根据权利要求ι- ο中任一所述方法的用于远交群体基因分型的测序文库构建试剂盒,其特征在于,包括 1)引物序列I.I和引物序列2. I 引物序列I. I 5' AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT ; 引物序列2. I 5' CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCT ; 2)PCR聚合酶混合物,其组分为0.lU/μ L、0. 5禮(1见?混合物、1\缓冲液,其中缓冲液成分为IOmMTrisHCl、50mMKCl、ImM MgCl2 ; 3)10, 000U/mL的限制性核酸内切酶Avail及其相应的缓冲液,其中缓冲液成分为50mMKAc、20mMTris-AcUOmMMg (Ac) 2、ImM DDT,该缓冲液的 ρΗ7· 9i25°C ;4)400, 000U/mL 的 T4DNA 连接酶; 5)包含72个序列的DNA条形码-接头序列对,每对序列结构为正链5’ ACACTCTTTCCCTACACGACGCTCTTCCGATCTXXXXX3’,负链5,GWCYYYYYAGATCGGAAGAGCGGTTCAGCAGGAATGCCGAG3’, 其中正链中XXXXX代表barcode序列,负链中YYYYY代表barcode互补序列,W代表碱基A或T。
全文摘要
一种生物技术领域的基于基因组简化与二代测序DNA文库构建方法及试剂盒,该方法和试剂盒针对现有文库构建方法不足,可用于参考基因组不完善、研究群体系谱不清晰、无单体型图物种的全基因组SNP检测及基因分型。本发明涉及的DNA文库构建方法及试剂盒操作流程简单,产生的文库测序质量较高,个体间片段分布变异性小,研究成本低,在实现高通量全基因组SNP检测及基因分型研究中具有非常广阔的应用前景。
文档编号C40B50/06GK102877136SQ201210358999
公开日2013年1月16日 申请日期2012年9月24日 优先权日2012年9月24日
发明者潘玉春, 陈强, 杨玉梅, 王起山, 张向喆, 马育芳, 陈振亮, 廖荣荣, 涂盈盈, 颉孝贤, 王振, 贺鹏飞, 张哲 申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1