用于甲基化dna的富集和测序的半甲基化接头及其用途的制作方法

文档序号:587892阅读:618来源:国知局
专利名称:用于甲基化dna的富集和测序的半甲基化接头及其用途的制作方法
技术领域
本发明属于分子生物学领域。特別地,本发明提供了用于分析样品DNA的甲基化状况的半甲基化接头,包含此类半甲基化接头的试剂盒,此类半甲基化接头和试剂盒的用途,以及使用此类半甲基化接头分析样品DNA的甲基化状况的方法。
背景技术
DNA甲基化是研究最为深入的表观遗传学机制,其在維持正常細胞功能、抑制寄生 DNA成分对基因组完整性的损害、染色质结构修饰、X染色体失活、基因组印迹、胚胎发育以及人类肿瘤发生中起着重要作用,因此,DNA甲基化已成为目前新的研究热点之一 [1_3]。目前研究DNA甲基化的方法主要包括以下几种。ー种方法通过用重亚硫酸盐(Bisulfite)处理DNA并进行测序来进行DNA甲基化的研究。该方法是研究甲基化最常用也是最准确的方法,其在完成大规模测序分析后可对一些特异位点进行甲基化特异性PCR(MSP&BSP)验证。该方法的缺陷是,对于ー些大基因组而言(例如,对于人类基因组3G,测序需要至少100G以上的数据),测序规模庞大,成本过高,不适宜大样本量的比较性研究M。另ー种方法利用全基因组芯片杂交技术来研究全基因组甲基化状況。该方法包括对DNA进行重亚硫酸盐处理;将处理后的DNA与设计好的全基因组甲基化芯片杂交,从而通过杂交的结果来体现甲基化和非甲基化信息;并且杂交得到的DNA序列可通过测序或 PCR来验证。该方法的主要问题在干,由于杂交技木本身的缺陷而导致的实验的灵敏度和重复性不好,不能用于进行精确的甲基化研究和大样本量样本的比较性研究[1_3]。另外ー种方法将甲基化敏感(非敏感)类限制性内切酶与重亚硫酸盐分析法结合起来,通过比较酶切位点信息来研究DNA的甲基化(RRBS、MMSDK)。此类方法规模小且易操作,但其只能对全基因组范围内能够被所用的限制性内切酶识别的位点进行甲基化研究, 因此该方法同样不能用于进行全基因组范围的精确甲基化研究。另ー种方法利用甲基化DNA特异性结合抗体或甲基化特异性结合蛋白对全基因组范围的甲基化DNA进行富集,然后通过高通量测序(MeDIP-SEQ、MBD-SEQ)来研究甲基化信息。此类方法能够对全基因组范围的甲基化DNA进行选择性研究,但是由于蛋白和DNA 的相互作用受到很多未知因素的影响,因此,该方法的重复性不好。另外,由于免疫反应得到的DNA没有进行重亚硫酸盐处理,因此,该方法不能实现对单个碱基进行精确甲基化研
gV [4] 九 。因此,迫切需要开发新的DNA甲基化分析方法,以帮助快速、全面和精确地分析全基因组的DNA甲基化状态。

发明内容
除非另有定义,否则本文中所使用的科学和技术术语具有本领域技术人员通常理解的含义。为了更好的理解本发明,特別提供了下列术语的定义。如本文中所使用的,“接头”通常是双链核酸分子,其长度可以为至少20个碱基,至少30个碱基,至少40个碱基,至少50个碱基,至少60个碱基,至少70个碱基,至少80个
碱基或更多个碱基。如本文中所使用的,术语“半甲基化的接头”是指这样的接头,所述接头的正链的胞嘧啶(C)全部被甲基化修饰,而负链的胞嘧啶全部未被甲基化修饰。如本文中所使用的,术语“接头的正链”是指接头中在连接反应后连接至目的DNA 片段的核苷酸链的5'端的那条链,术语“接头的负链”是指接头中在连接反应后连接至目的DNA片段的核苷酸链的3'端的那条链。在ー个方面,本发明提供了半甲基化的接头,其中,接头的正链的胞嘧啶(C)全部被甲基化修饰,而负链的胞嘧啶全部未被甲基化修饰。在一个优选实施方案中,半甲基化的接头的正链的5'端序列与其负链的3'端序列不互补,并且正链的3'端序列与负链的5'端序列互补(即,半甲基化的接头是“分叉的”),优选,互补部分的长度可以为例如至少10个碱基,至少20个碱基,至少30个碱基,至少40个碱基或至少50个碱基。在另ー个实施方案中,半甲基化的接头的正链和负链完全互补。不受任何理论束缚,现认为,“分叉的”半甲基化接头有利于控制接头与DNA片段连接的方向,避免不必要的错连。在另ー个实施方案中,本发明的半甲基化的接头的正链的3'端或负链的5'端具有悬突,所述悬突的长度可以为1个,2个,3个,4个,5个,6个或更多个碱基。在ー个优选实施方案中,本发明的半甲基化接头的正链的3'端具有单个碱基(例如,碱基T)的悬突。在一个实施方案中,本发明的半甲基化接头的正链和负链分别以单链形式单独存在,并且在使用前,所述正链和负链通过退火而形成双链的接头。在另ー个实施方案中,本发明的半甲基化接头以双链(即,退火在一起的正链和负链)形式存在。在一个优选实施方案中,甲基化修饰的胞嘧啶包括但不限干,5-甲基胞嘧啶和 5-羟甲基胞嘧啶。在另ー个方面,本发明提供了分析样品DNA的甲基化状况的方法,其包括以下步骤1)将本发明的半甲基化的接头连接至待分析的样品DNA的两端,从而得到连接产物;2)用重亚硫酸盐处理步骤1)中的连接产物,以将非甲基化的胞嘧啶转换为尿嘧啶;3)以重亚硫酸盐处理后的产物为模板,用能够与经重亚硫酸盐处理的半甲基化接头的负链退火的引物进行第一次互补链合成,从而得到第一次互补链合成产物;4)用尿嘧啶糖基化酶处理步骤3)中的第一次互补链合成产物,以除去含有尿嘧啶的DNA链;5)以尿嘧啶糖基化酶处理后的产物为模板,加入dTTP、dATP、dGTP以及经第一分子实体修饰的dCTP,并使用能够与半甲基化接头的正链的互补链退火的引物,进行第二次互补链合成,从而得到第二次互补链合成产物;6)使用能够与第一分子实体特异性结合的第二分子实体,富集井分离掺入了经第一分子实体修饰的dCTP的第二次互补链合成产物,从而得到分离产物;
5
7)对步骤6)中的分离产物进行测序分析,其中,除了所使用的接头序列外,分离产物中的胞嘧啶即为所述样品DNA中被甲基化的胞嘧啶。在一个优选实施方案中,待分析的样品DNA包括但不限干,文库DNA和基因组DNA, 例如細菌,病毒,植物或动物的基因组DNA,优选哺乳动物的基因组DNA,特别是人的基因组 DNA。一般而言,待分析的样品DNA通常是双链核酸分子。在一个优选实施方案中,任选地在步骤1)之前,对待分析的样品DNA进行片段化。 用于片段化DNA的方法包括但不限干,雾化法、超声片段化法、HydroShear法或酶切处理法,并且优选是超声片段化法。在一个优选实施方案中,使用超声片段化法将样品DNA打断为200-400bp的片段。在一个优选实施方案中,使用本领域已知的连接方法将本发明的半甲基化的接头连接到样品DNA的两端,并且连接到样品DNA的两端的半甲基化的接头可以是相同的或不同的。可使用的连接方法包括但不限干,平端连接法,TA连接法,粘性末端连接法等,并且优选是TA连接法。例如,在一个实施方案中,将样品DNA片段化,然后利用聚合酶如klenow DNA酶、 T4DNA聚合酶和T4多聚核苷酸激酶补平片段化的DNA的末端,然后使用聚合酶在补平了末端的DNA片段的3'末端加上碱基‘A,,然后使用T4DNA连接酶将3'末端添加了碱基‘ A, 的DNA片段连接至半甲基化的接头。在一个优选实施方案中,第一分子实体和特异性结合第一分子实体的第二分子实体可以是本领域熟知的彼此特异性结合的成对的分子实体,例如,抗原和抗体或抗原结合片段,配体和受体,生物素和亲和素等等。在一个实施方案中,第一分子实体是抗原(或抗体),第二分子实体是特异性结合所述抗原(或抗体)的抗体(或抗原)。在一个实施方案中,第一分子实体是配体(或受体),第二分子实体是特异性结合所述配体(或受体)的受体(或配体)。在一个实施方案中,第一分子实体是生物素(或亲和素),第二分子实体是特异性结合生物素(或亲和素)的亲和素(或生物素)。在一个特别优选的实施方案中,第一分子实体是生物素,第二分子实体是链霉亲和素。在一个实施方案中,经第一分子实体修饰的dCTP是生物素修饰的dCTP,例如生物素-11-dCTP,并且第二分子实体是链霉亲和素磁珠。在一个实施方案中,任选地在对步骤6)中的分离产物进行测序分析之前,使用针对重亚硫酸盐处理后的半甲基化接头而特别设计的引物对分离产物进行PCR扩增。在一个实施方案中,对步骤6)中的分离产物进行高通量测序分析,例如使用SOLEXA、SOLID和 Roche妨4测序平台进行高通量测序。在一个实施方案中,任选地,在任意两个相邻步骤之间,进行产物的回收和纯化。 优选,在所有步骤之间进行产物的回收与纯化。在另ー个方面,提供了包含本发明的半甲基化接头的试剂盒。在一个优选实施方案中,所述试剂盒用于分析样品DNA的甲基化状況。在一个实施方案中,本发明的试剂盒中的半甲基化接头的正链和负链分别以单链形式単独存在,并且在使用前,所述正链和负链通过退火而形成双链的接头。在另ー个实施方案中,本发明的试剂盒中的半甲基化接头以双链(即,退火在一起的正链和负链)形式存在。在又一个实施方案中,所述试剂盒还包括其他试剂,例如用于分析样品DNA的甲基化状况的其他试剂,例如,能够与经重亚硫酸盐处理的半甲基化接头的负链退火的引物, 能够与半甲基化接头的正链的互补链退火的引物,针对重亚硫酸盐处理后的半甲基化接头而特别设计的引物,经第一分子实体修饰的dCTP,以及与第一分子实体特异性结合的第二分子实体。在一个实施方案中,经第一分子实体修饰的dCTP是生物素修饰的dCTP,例如生物素-11-dCTP,并且第二分子实体是链霉亲和素磁珠。在另ー个方面,提供了本发明的半甲基化接头和/或本发明的试剂盒用于分析样品DNA的甲基化状况的用途。在另ー个方面,提供了本发明的半甲基化接头用于制备试剂盒的用途,所述试剂盒用于分析样品DNA的甲基化状況。发明的有益效果与现有技术相比,本发明的技术方案在重亚硫酸盐处理法的基础上,采用了本发明人设计的半甲基化的接头,并结合了亲和层析技术和高通量测序技木,从而实现对甲基化的DNA的富集和测序,其具有以下显著优点 1)与目前常规使用的全基因组重亚硫酸盐测序法相比,本发明的技术方案富集了全基因组范围的甲基化DNA,从而大大减少了测序规摸,节约了时间和成本;2)与利用甲基化DNA特异性结合抗体或甲基化DNA特异性结合蛋白对全基因组范围的甲基化DNA进行富集,然后通过高通量测序(MeDIP-SEQ、MBD-SEQ)来研究甲基化信息的方法(该方法由于蛋白(或抗体)和DNA的相互作用受到很多未知因素例如DNA的纯度、浓度、作用时间、温度、效率等的影响而重复性不好,并且由于没有结合重亚硫酸盐处理法而无法对单个碱基进行精确的甲基化研究)相比,本发明的技术方案能够对全基因组范围的甲基化DNA进行全面的、无偏向性的富集,克服了抗体或蛋白反应的不足,并且能够精确地进行单碱基甲基化图谱分析;3)本发明不仅能够对CpG位点的甲基化进行捕获研究,而且也能够很好的对非 CpG位点的甲基化进行捕获分析,克服了以往方法不能对非CpG位点的甲基化进行检测的缺点。下面将结合附图和实施例对本发明的实施方案进行详细描述,但是本领域技术人员将理解,下列附图和实施例仅用于说明本发明,而不是对本发明的范围的限定。根据附图和优选实施方案的下列详细描述,本发明的各种目的和有利方面对于本领域技术人员来说将变得显然。附图概述

图1示意性展示了基于生物素和链霉亲和素相互作用的全基因组甲基化DNA高通量测序文库的构建流程图。其中,Cm表示甲基化的胞嘧啶,Cb表示生物素化的胞嘧啶,A、U、 Τ、C和G分別表示腺嘌呤,尿嘧啶,胸腺嘧啶,胞嘧啶和鸟嘌呤。图2是展示炎黄(YH)全基因组甲基化测序数据(40G)中甲基化率与测序深度的关系的图。以之前的YH全基因组甲基化测序数据G0G)(參见Li Y, Zhu J,Tian G,Li N, Li Q,et al. (2010)The DNA Methylomeof Human Periphera丄 Blood Mononuclear Cells. PLoS Biol 8(11) :el000533. doi :10. 1371/journal. pbio. 1000533,其以其全文通过引用并入本文)为基础,利用覆盖12号染色体的测序数据,以51Λρ为区间,统计每个区间内的所有C的平均测序深度以及位点甲基化率(根据全基因组甲基化测序数据判断该位点的甲基化率,其中,甲基化率为支持该位点甲基化的测序条数与该位点所有测序条数的比例), 并针对甲基化率与测序深度的关系作图。图3是展示炎黄(YH)全基因组甲基化测序数据(1. 4G)中甲基化率与测序深度的关系的图。以之前的YH全基因组甲基化测序数据(1.4G)(參见Li Y, Zhu J,Tian G,Li N, Li Q,et al. (2010)The DNAMethylome of Human Peripheral Blood Mononuclear Cells. PLoSBiol 8(11) :el000533. doi :10. 1371/journal. pbio. 1000533)为基础,利用覆盖 12 号染色体的测序数据,以51Λρ为区间,统计每个区间内的所有C的平均测序深度以及位点甲基化率,并针对甲基化率与测序深度的关系作图。图4是展示在使用本发明的方法获得的测序数据(1. 4G)中甲基化率与测序深度的关系的图。以使用本发明的方法获得的测序数据(1.4G)为基础,利用覆盖12号染色体的测序数据,以51Λρ为区间,统计每个区间内的所有C的平均测序深度,并针对甲基化率(以上文所述的根据之前YH全基因组甲基化测序数据获得的甲基化率为标准)与测序深度的关系作图。
具体实施例方式在本发明的实施例中,以ー个中国男性的外周血DNA(10 μ g)(已完成其全基因组甲基化测序,參见,Li Y, Zhu J, Tian G, Li N, LiQ, et al. (2010) The DNA Me thyIome of Human Peripheral BloodMononuclear Cells. PLoS Biol 8(11) :el000533. doi : 10.1371/ journal, pbio. 1000533)为样品,构建了基于生物素和链霉亲和素相互作用的全基因组甲基化DNA高通量测序文库,并利用Illumina Hiseq2000 (參见例如,Product preview Illuminas equencing. Pub. no. 7702009-732,其以其全文通过引用合并入本文)对该文库进行了高通量测序。特別地,图1示意性概述了使用本发明的半甲基化接头来构建甲基化 DNA高通量测序文库的流程(參见图1)。1、使用的仪器和试剂表1 主要实验仪器
权利要求
1.一种半甲基化的接头,所述接头的正链的胞嘧啶(C)全部被甲基化修饰,而负链的胞嘧啶全部未被甲基化修饰,其中,优选,所述接头的正链的5'端序列与其负链的3'端序列不互补,并且正链的3'端序列与负链的5'端序列互补,或者所述接头的正链和负链完全互补;优选,所述接头的正链的3'端或负链的5'端具有悬突,更优选,所述接头的正链的 3'端具有单个碱基(例如,碱基T)的悬突。
2.包含权利要求1的半甲基化的接头的试剂盒,其中,优选,所述接头的正链和负链分别以单链形式単独存在,或,所述接头以双链形式存在;优选,所述试剂盒还包括其他试剂,例如用于分析样品DNA的甲基化状况的其他试剂, 例如,能够与经重亚硫酸盐处理的所述半甲基化接头的负链退火的引物,能够与所述接头的正链的互补链退火的引物,针对重亚硫酸盐处理后的所述接头而特别设计的引物,经第一分子实体修饰的dCTP,以及与第一分子实体特异性结合的第二分子实体;优选,所述第一分子实体和第二分子实体是抗原和抗体或抗原结合片段,或者配体和受体,或者生物素和亲和素;优选,经第一分子实体修饰的dCTP是生物素修饰的dCTP,例如生物素-11-dCTP,并且第二分子实体是链霉亲和素磁珠;优选所述试剂盒用于分析样品DNA的甲基化状況。
3.权利要求1的半甲基化的接头和/或权利要求2的试剂盒用于分析样品DNA的甲基化状况的用途,优选,所述样品DNA是文库DNA或基因组DNA,例如細菌,病毒,植物或动物的基因组DNA,优选哺乳动物的基因组DNA,特别是人的基因组DNA。
4.权利要求1的半甲基化的接头用于制备试剂盒的用途,所述试剂盒用于分析样品 DNA的甲基化状況。
5.用于分析样品DNA的甲基化状况的方法,其包括以下步骤1)将权利要求1的半甲基化的接头连接至待分析的样品DNA的两端,从而得到连接产物;2)用重亚硫酸盐处理步骤1)中的连接产物,以将非甲基化的胞嘧啶转换为尿嘧啶;3)以重亚硫酸盐处理后的产物为模板,用能够与经重亚硫酸盐处理的半甲基化接头的负链退火的引物进行第一次互补链合成,从而得到第一次互补链合成产物;4)用尿嘧啶糖基化酶处理步骤3)中的第一次互补链合成产物,以除去含有尿嘧啶的 DNA 链;5)以尿嘧啶糖基化酶处理后的产物为模板,加入dTTP、dATP、dGTP以及经第一分子实体修饰的dCTP,并使用能够与半甲基化接头的正链的互补链退火的引物,进行第二次互补链合成,从而得到第二次互补链合成产物;6)使用能够与第一分子实体特异性结合的第二分子实体,富集井分离掺入了经第一分子实体修饰的dCTP的第二次互补链合成产物,从而得到分离产物;7)对步骤6)中的分离产物进行测序分析,其中,除了所使用的接头序列外,分离产物中的胞嘧啶即为所述样品DNA中被甲基化的胞嘧啶;其中,优选,所述样品DNA是文库DNA或基因组DNA,例如細菌,病毒,植物或动物的基因组 DNA,优选哺乳动物的基因组DNA,特别是人的基因组DNA ;任选地,在步骤1)之前,对所述样品DNA进行片段化,优选通过雾化法、超声片段化法、 HydroShear法或酶切处理法,更优选通过超声片段化法将所述样品DNA片段化;优选,通过平端连接法,TA连接法,粘性末端连接法将所述接头连接到所述样品DNA的两端,并且特别优选的连接方法是TA连接法;优选,所述第一分子实体和第二分子实体是抗原和抗体或抗原结合片段,或者配体和受体,或者生物素和亲和素,更优选第一分子实体是生物素,并且第二分子实体是链霉亲和素;优选,经第一分子实体修饰的dCTP是生物素修饰的dCTP,例如生物素-11-dCTP,并且第二分子实体是链霉亲和素磁珠;任选地,在对步骤6)中的分离产物进行测序分析之前,使用针对重亚硫酸盐处理后的半甲基化接头而特别设计的引物对分离产物进行PCR扩增;优选,对步骤6)中的分离产物进行高通量测序分析,例如使用S0LEXA、S0LID和Roche 454测序平台进行高通量测序分析;任选地,在任意两个相邻步骤之间,进行产物的回收和纯化,优选,在所有步骤之间进行产物的回收与纯化。
全文摘要
本发明提供了用于分析样品DNA的甲基化状况的半甲基化接头,包含此类半甲基化接头的试剂盒,此类半甲基化接头和试剂盒的用途,以及使用此类半甲基化接头分析样品DNA的甲基化状况的方法。
文档编号C12Q1/68GK102533944SQ20101058286
公开日2012年7月4日 申请日期2010年12月10日 优先权日2010年12月10日
发明者孙继华, 张秀清, 杨焕明, 燕慧, 王君文, 罗慧娟, 闫淑静 申请人:深圳华大基因研究院, 深圳华大基因科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1