本发明涉及全基因组dna甲基化的检测方法,尤其涉及一种通过改进基于高通量测序的medip-seq(methylateddnaimmunoprecipitationsequencing)技术来检测少量样品(300pgdna或50个细胞)全基因组dna甲基化的方法。
背景技术
目前通过medip-seq方法检测细胞全基因组dna甲基化所需的最低dna量为50ng,若以细胞为出发样品,则至少需要~75000个细胞(taiwooetal.,natprotoc,2012),该方法的具体实验流程为:抽提细胞基因组dna→超声断裂基因组dna并通过agilentbioanalyzer2100检测超声片段大小→对超声片段进行末端修复、3’端加da、接头连接并将连接产物进行纯化和定量→在纯化产物中加入少量片段大小在100bp-500bp之间的λdna(其中被甲基化的λdna片段和未被甲基化的λdna片段的摩尔比为4:1)→利用diagenodeauto-medip和ipure试剂盒以及sx-8gip-star全自动样品处理系统进行medip实验→根据加入的λdna的量,通过qpcr检测medip实验的回收率和特异性→pcr扩增medip产物并对产物进行纯化,通过
agilentbioanalyzer2100检测pcr产物的片段分布和浓度→将pcr进行割胶回收和agilentbioanalyzer2100检测→根据加入的λdna,通过qpcr验证胶回收产物中甲基化dna的富集倍数→将建库产物进行高通量测序和数据分析。
现有技术的主要缺点有两个:①所需的最低样品起始量为50ngdna或75000个细胞,仍不适用于少量来源样品的medip-seq分析;②需要利用商品化试剂盒和全自动样品处理系统进行medip-seq实验,成本较高,不具有普遍适用性。
因此,本领域的技术人员致力于开发一种新的基于medip-seq的检测方法,该方法能降低所需样品起始量,使medip-seq更加适用于少量(300pgdna或50个细胞)来源样品的dna甲基化分析;不需要特定的商品化试剂盒和实验设备即可完成medip实验,进一步简化操作流程,节约成本。
技术实现要素:
有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是降低所需样品起始量,使medip-seq更加适用于少量(300pgdna或50个细胞)来源样品的dna甲基化分析;不需要特定的商品化试剂盒和实验设备即可完成medip实验。
为实现上述目的,本发明提供了一种少量样品全基因组dna甲基化的检测方法,其特征在于,包括以下步骤:
第一步:制备u取代t的未甲基化λdna,并对λdna进行甲基化,得到甲基化λdna;
第二步:将未甲基化的λdna加入待抽提dna的样品中并提取基因组dna,或者直接加入待测甲基化的基因组dna样品中;
第三步:断裂dna片段,使片段长度为100-500bp,
第四步:将超声断裂后的dna片段进行末端修复、3’端加da和接头连接,得到连接产物,纯化连接产物;
第五步:将纯化后的连接产物分为input-dna和待分析dna,在所述待分析dna中加入甲基化λdna,混匀变性成单链dna后通过抗体富集含甲基化dna片段;
第六步:将input-dna和富集后dna片段分别进行user酶消化,随后分别进行pcr扩增、纯化并回收片段大小为100-500bp的样品,得到高通量测序文库;
第七步:对高通量测序文库进行定量后进行高通量测序和分析。
进一步地,所述第一步中未甲基化λdna是通过pcr制备的,所述甲基化λdna是通过cpg甲基转移酶(cpgmethyltransferase)制备的,通过在pcr反应体系中使用dutp取代dttp,获得含dutp的λdna。
进一步地,λdna扩增的引物为:
λdna-f:tgtggggtgaatatggcagt
λdna-r:cgtcgatttggtgccgtaat
进一步地,所述第二步中待抽提dna的样品最低为50个细胞,所述待测甲基化的基因组dna样品最低为300pg。在本发明一个优选的实施方案中,样品量为300pgdna或50个细胞,加入的未甲基化λdna量为1ug。
进一步地,所述第三步中断裂dna片段的方法为超声断裂,优选长度为200-500bp。
进一步地,所述第四步是按照kapahyperprepkit提供的实验方案进行的
进一步地,所述连接产物通过用agencourtampurexpbeads进行纯化。
在本发明一个优选的实施方案中,所述第六步中inputdna与待分析dna的比为1:9。
进一步地,所述第五步中甲基化dna片段是通过medip(methylateddnaimmunoprecipitation)、methylcap(methylateddnaaffinitycapture)或mbd(methylateddnabindingdomain)等方法进行富集的。在本发明的一个优选实施方案中,所述甲基化的dna片段是通过medip方法进行的。
在本发明的一个较佳的实施方案中,所述第六步和第七步中间还包括使用qpcr验证甲基化dna的富集效率和特异性,通过qpcr检测结果,为高通量测序提供依据。
本发明还提供了一种少量样品全基因组dna甲基化的检测试剂盒,其特征在于,所述检测试剂盒包括u取代t的未甲基化λdna、u取代t的未甲基化λdna和user酶,并利用上述少量样品全基因组dna甲基化的检测方法进行检测。
本发明还提供了一种少量样品chip-seq的分析方法,其特征在于,在所述少量样品中加入u取代t的未甲基化λdna,将混合的dna样品进行末端修复、3’端加da、接头连接和纯化,减少chip-dna在各步操作中的损失并提高chip-dna的接头连接效率,在pcr扩增前,通过user酶消化除去甲基化λdna,避免了甲基化λdna对chip样品的污染。
本发明的技术原理:因为medip-seq分析的实验流程包括多个操作步骤,如dna的抽提、纯化、超声、建库、免疫沉淀等,每一步都会有少量的样品损失,并且对于建库和免疫沉淀这两个步骤需要一定的样品浓度才能保证较高的反应效率和产物获得率。本发明通过在少量起始样品中加入含dutp的λdna,既可以减少样品在每步操作中的损失,又可以提高建库和免疫沉淀的效率,因此少量起始样品也可以在建库和medip过程中采用常规的手动操作,实用性强。最为关键的是,user酶可以特异性地降解含有dutp的dna,因此通过user酶消化可以彻底去除medip产物中的λdna,避免了λdna对样品测序文库的污染。
本发明通过在来源较少的起始样品中补加含dutp的λdna,可以减少在建库和medip过程中样品的损失,且能保证样品在建库过程中的接头连接效率和medip过程中甲基化dna的富集效率,将得到的medip-dna先用user酶进行彻底消化以除去其中的λdna,再进行pcr扩增、纯化,从而避免了λdna出现在最终的测序文库中。因此,通过该方法最终可以实现对少量样品的medip-seq分析。整个medip过程采用常规的手动操作,不需要使用试剂盒和全自动样品处理系统。
本技术除了可以应用于少量样品的dna甲基化分析,还可以应用于少量样品的chip-seq(chromatinimmunoprecipitation-sequencing)分析,即将含dutp的λdna(不需要甲基化处理)加入到少量样品的chip-dna中,将混合的dna样品进行末端修复、3’端加da、接头连接和纯化,从而减少chip-dna在各步操作中的损失并提高chip-dna的接头连接效率。同样地,在pcr扩增前,通过user酶消化除去甲基化λdna,避免了甲基化λdna对chip样品的污染。因此,本技术是一种应用较为广泛的方法。
本发明的优点:①所需样品量为300pgdna或50个细胞,更加适用于少量来源样品的medip-seq分析;②所发明的medip实验技术及其配套试剂盒的操作方法简便高效,不需要特定的商品化试剂盒和实验设备,成本较低,具有较广泛的适用性。
本技术不仅可以完成少量dna样品的文库构建,还可以应用于少量细胞基因组或者转绿组的构建,使得少量样品的基因组学、转录组学、表观遗传学分析成为可能。因此,本技术是一种应用较为广泛的通用型方法。
以下将结合附图对本发明的构思、具体步骤及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。
附图说明
图1是本发明的一个较佳实施例的一种少量样品全基因组dna甲基化的检测方法示意图。
图2是本发明的一个实施例构建的高通量测序文库的agilentbioanalyzer2100质检结果图。
图3是本发明的一个实施例高通量测序原始数据的质检结果。
具体实施方式
以下参考说明书附图介绍本发明的优选实施例,使其技术内容更加清楚和便于理解。本发明可以通过许多不同形式的实施例来得以体现,本发明的保护范围并非仅限于文中提到的实施例。
如图1所示,是本发明的一个优选实施例的示意图,概括的介绍了少量样品dna甲基化的检测方法,下面将通过一个优选实施例详细介绍少量样品dna甲基化检测方法。
一、制备λdna
(1)、通过pcr扩增制备含dutp、片段长度为2kb的λdna,pcr反应体系如下:
pcr反应条件:
(2)、用genejetpcrpurificationkit对pcr产物进行纯化并用nanodrop定量;
(3)、取500ngpcr产物,用cpg甲基转移酶(m.sssi,thermo)进行体外甲基化处理,反应体系如下:
(4)、混匀后,37℃孵育15min,65℃孵育20min以终止反应;
(5)、用genejetpcrpurificationkit对pcr产物进行纯化并用nanodrop定量。
第二步:少量样品基因组dna的提取
(6)、将1ug未甲基化λdna加入到50个细胞或300pg基因组dna中(若是以dna为起始样品则可省略步骤7-8);
(7)、将混合了λdna的k562细胞悬浮在含有0.5%sds的细胞裂解液中,65℃孵育过夜;
(8)、通过酚氯仿抽提和乙醇沉淀纯化dna;
第三步:超声断裂dna片段
(9)、将dna样品进行超声断裂至100-500bp;
(10)、样品乙醇沉淀浓缩后,通过凝胶电泳检测超声片段的大小。
第四步:超声断裂产物的修复、3’端加da和接头连接
(11)、将超声断裂产物进行末端修复、3’端加da和接头连接,并将连接产物用agencourtampurexpbeads进行纯化,后续所有操作按照kapahyperprepkit提供的实验方案进行。
第五步:免疫沉淀甲基化的dna片段(medip)
(12)、取20ul蛋白a/g磁珠(millipore,16-663)用ip缓冲液洗两次后,用500ulip缓冲液重悬磁珠;
(13)、在500ulip缓冲液中加入2ug5mc抗体(epigentek,a-1014-010),4℃,40rpm,孵育2h;
(14)、用1000ulip缓冲液洗磁珠2次,加入500ulip缓冲液重悬磁珠;
(15)、取1/10体积的连接产物作为input,并在剩余的样品中补加50ng甲基化的λdna,在95℃条件下孵育10min,之后将样品立即放冰上10min;;
(16)、将变性的dna样品加到重悬的磁珠中,4℃,40rpm,孵育过夜;
(17)、用磁架富集磁珠,弃上清,用ip缓冲液洗磁珠6次;
(18)、用400ul含有0.25%sds的te缓冲液(含0.3mg/ml蛋白k)重悬磁珠,55℃,800rpm,孵育2h;
(19)、用磁架富集磁珠,将上清转移到新的离心管中,用酚氯仿进行抽提纯化后,将input-dna取出后,分别乙醇沉淀medip-dna和input-dna,最终溶于10mmtris(ph8.0)中;
第六步:λdna的消化、pcr扩增和建库
(20)、将input-dna和medip-dna分别进行user酶消化和pcr扩增,反应体系如下:
(21)、37℃,6h后,将pcr管取出,各加入0.5ulq5高保真酶,pcr条件如下:
(22)、将pcr产物用ampurexpbeads进行纯化,方法可参考kapahyperprepkit提供的实验方案;
(23)、通过凝胶电泳法切胶回收或ampurexpbeads(方法可参考kapahyperprepkit提供的实验方案)筛选片段大小为200-500bp的dna片段,即获得文库dna;
(24)、通过qpcr验证甲基化dna的富集效率和特异性;
第七步:文库质量的检测和分析
(25)文库dna克隆质检:将文库dna克隆到质粒中,以检测序列的正确性,随机选取15个单克隆进行sanger测序。经统计,15个单克隆中,有13个可以找到标签,比对完全正确(比对率100%),表明构建的测序文库质量较好。
(26)、用agilentbioanalyzer2100进行片段大小和浓度检测,质检合格后即可上机进行高通量测序。
用50个细胞为初始量,应用如上所述的方法进行甲基化富集、高通测序文库构建后进行的agilentbioanalyzer2100质检结果。结果如图2所示,表明片断大小符合测序要求,分布均匀,质量合格,可用于上机测序。
第八步:高通量测序及数据分析
(27)质检合格后,将建库产物用qubit进行定量,然后稀释、混样、上机测序,测序数据下机后进行质量分析。
表1是用50个细胞medip实验的最终文库高通量测序质量分析结果。应用上述方法构建的medip高通量文库经hiseq2500平台测序后得到的测序数据,首先经过fastqc快速质检,鉴定测序原始数据(rawdata)是否合格,程序检测结果如下图3所示:两个样品单条reads的50bp碱基质量都位于q30区域(图中最上方的区域),表明数据质量好。
表1高通量测序基本数据统计结果
实验中用到的pcr引物序列:
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
序列表
<110>上海交通大学
<120>一种少量样品全基因组dna甲基化的检测方法及试剂盒
<160>4
<170>siposequencelisting1.0
<210>1
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>1
tgtggggtgaatatggcagt20
<210>2
<211>20
<212>dna
<213>人工序列(artificialsequence)
<400>2
cgtcgatttggtgccgtaat20
<210>3
<211>21
<212>dna
<213>人工序列(artificialsequence)
<400>3
aatgatacggcgaccaccgag21
<210>4
<211>22
<212>dna
<213>人工序列(artificialsequence)
<400>4
caagcagaagacggcatacgag22