全基因组甲基化高通量测序文库的构建方法及其应用的制作方法

文档序号:399650阅读:917来源:国知局
专利名称:全基因组甲基化高通量测序文库的构建方法及其应用的制作方法
技术领域
本发明涉及生物技术领域。具体地,涉及全基因组甲基化检测技术,特别是微量DNA全基因组甲基化检测技术领域。更具体地,本发明提供了一种构建全基因组甲基化高通量测序文库的方法、一种确定基因组DNA样品的甲基化位点的方法、一种用于确定基因组DNA样品的甲基化位点的装置、一组分离的限制性内切酶以及一种用于构建全基因组甲基化高通量测序文库的试剂盒。
背景技术
DNA甲基化是研究最为深入的表观遗传学机制,DNA甲基化在维持正常细胞功能、抑制寄生DNA成分对基因组完整性的损害、染色质结构修饰、X染色体失活、基因组印迹、胚胎发育以及人类肿瘤发生中起着重要作用,是目前新的研究热点之一。然而,目前对全基因组DNA甲基化的研究仍有待改进。

发明内容
本发明是基于发明人的下列发现完成的:减少的代表性重亚硫酸盐测序(RRBS)(参见Smith ZD等人,2009.在哺乳动物基因组中高通量重亚硫酸盐测序(High-throughput bisulfite sequencing in mammaliangenomes)Methods.48:226-232.,通过参照将其全文并入本文),是目前常用的全基因组甲基化检测方法,其可以检测人类和 鼠基因组中大部分的CpG岛和启动子区域。然而,越来越多的研究显示差异甲基化区域(DMRs)如组织特异性差异甲基化区域(T-DMR)和癌症中的差异甲基化区域(C-DMR)并非仅仅位于CpG岛内,更多的甲基化差异区域位于CpG岛外,如CpG岛外(CGIshores)来调控基因的表达,而这些区域是现有RRBS技术不足以检测到的。另一方面,现有RRBS技术对岛内CG数量的覆盖度低。本发明旨在解决现有技术问题的至少之一。由此,为了检测基因组中更多具有代表性区域的甲基化状态并更真实的反应这些区域的甲基化水平,本发明提供了全基因组甲基化高通量测序文库的构建方法及其应用。根据本发明的一个方面,本发明提供了一种构建全基因组甲基化高通量测序文库的方法。根据本发明的实施例,该方法包括以下步骤:用Msp I和第二限制性内切酶对基因组DNA进行酶切,以便获得DNA片段,其中,所述第二限制性内切酶为选自BstN 1、HpyCH4V、Alu I,Hae II1、HpyCH4 II,Apek I,Ban I1、Taqa1、Sph I,Bgl II,BssS I,BamH I 和 KpnI的至少一种;将所述DNA片段进行末端修复,以便获得经过末端修复的DNA片段;在所述经过末端修复的DNA片段的3’末端添加碱基A,以便获得具有粘性末端A的DNA片段;将所述具有粘性末端A的DNA片段与甲基化接头相连,以便获得具有甲基化接头的连接产物;将所述具有甲基化接头的连接产物进行片段选择,以便获得目的片段;将所述目的片段进行重亚硫酸盐处理,以便将所述目的片段中非甲基化的胞嘧啶转换为尿嘧啶,获得经过转换的目的片段;将所述经过转换的目的片段进行PCR扩增,以便获得扩增产物;以及分离纯化所述扩增产物,所述扩增产物构成全基因组甲基化高通量测序文库。利用根据本发明实施例的构建全基因组甲基化高通量测序文库的方法,能够有效地构建基因组DNA样品的全基因组甲基化高通量测序文库,特别是能够有效地构建微量样本的全基因组甲基化高通量测序文库,从而能够有效、充分地应用于高通量测序技术,通过对文库的测序,然后基于对测序结果的数据分析,就能够有效地获得全基因组甲基化位点信息,实现对基因组DNA样品的全基因组甲基化检测。根据本发明的另一方面,本发明提供了一种确定基因组DNA样品的甲基化位点的方法。根据本发明的实施例,该方法包括下列步骤:根据前面所述构建全基因组甲基化高通量测序文库的方法,构建基因组DNA样品的全基因组甲基化高通量测序文库;对该全基因组甲基化高通量测序文库进行测序,以便得到测序结果;以及对测序结果进行数据分析,以便确定基因组DNA样品的甲基化位点。利用根据本发明实施例的确定基因组DNA样品的甲基化位点的方法,能够准确地确定基因组DNA样品的甲基化位点,从而实现对基因组DNA样品的全基因组甲基化检测,相对于目前的RRBS技术,本发明的确定基因组DNA样品的甲基化位点的方法,对全基因组的调控区域的覆盖广度得到显著提高,对调控区域内CpG位点的覆盖量显著增加。根据本发明的再一方面,本发明提供了一种用于确定基因组DNA样品的甲基化位点的装置。根据本发明的实施例,该装置包括:文库制备单元,所述文库制备单元用于制备基因组DNA样品的全基因组甲基化高通量测序文库,所述文库制备单元内设置有Msp I酶以及第二限制性内切酶,其中,所述第二限制性内切酶为选自BstN 1、HpyCH4 V、Alu I,Hae
II1、HpyCH4 I1、Apek 1、Ban I1、Taqa 1、Sph 1、Bgl I1、BssS 1、BamH I 和 Kpn I 的至少一种;测序单元,所述测序单元与所述文库制备单元相连,并且从所述文库制备单元接收所述基因组DNA样品的全基因组甲基化高通量测序文库,以便用于对所述基因组DNA样品的全基因组甲基化高通量测 序文库进行测序,获得测序结果;以及数据分析单元,所述数据分析单元与所述测序单元相连,并且从所述测序单元接收所述测序结果,以便对所述测序结果进行数据分析,确定所述基因组DNA样品的甲基化位点。利用根据本发明实施例的用于确定基因组DNA样品的甲基化位点的装置,能够方便准确地确定基因组DNA样品的甲基化位点,可以应用于多种针对全基因组甲基化的研究,例如可以用于对人的肿瘤基因抑制基因的甲基化异常的检测,以便为人类疾病的早期诊断提供有效的途径。根据本发明的又一方面,本发明提供了一组分离的限制性内切酶。根据本发明的实施例,其由Msp I酶以及第二限制性内切酶构成,其中,所述第二限制性内切酶为选自BstN 1、HpyCH4 V、Alu 1、Hae II1、HpyCH4 I1、Apek 1、Ban I1、Taqa 1、Sph 1、Bgl I1、BssS 1、BamHI和Kpn I的至少一种。根据本发明实施例的Msp I酶和第二限制性内切酶构成的组合,能够有效地对基因组DNA进行酶切,且酶切获得的DNA片段非常适用于本发明的构建全基因组甲基化高通量测序文库的方法。根据本发明的另一方面,本发明提供了一种用于构建全基因组甲基化高通量测序文库的试剂盒。根据本发明的实施例,该试剂盒包括:Msp I酶,以及第二限制性内切酶,其中,所述第二限制性内切酶为选自 BstN 1、HpyCH4 V,Alu I,Hae II1、HpyCH4 II,Apek 1、BanI1、Taq a 1、Sph 1、Bgl I1、BssS I>BamH I和Kpn I的至少一种。利用根据本发明实施例的用于构建全基因组甲基化高通量测序文库的试剂盒,能够方便有效地构建基因组DNA样品的全基因组甲基化高通量测序文库。本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。


本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:图1:显示了根据本发明一个实施例的构建全基因组甲基化高通量测序文库的方法的流程示意图;图2:显示了根据本发明一个实施例的针对不同长度目的片段所构建全基因组甲基化高通量测序文库的安捷伦2100检测结果。A:显示了根据本发明一个实施例的目的片段长度为160bp以上,且小于240bp的全基因组甲基化高通量测序文库的安捷伦2100检测结果。B:显示了根据本发明一个实施例的目的片段长度为240bp以上,且小于340bp的全基因组甲基化高通量测序文库的安捷伦2100检测结果。C:显示了根据本发明一个实施例的目的片段长度为340bp以上,且420bp以下的全基因组甲基化高通量测序文库的安捷伦2100检测结果。D:显示了根据本发明一个实施例的目的片段长度为160bp_420bp的全基因组甲基化高通量测序文库的安捷伦2100检测结果。图3:显示了根据 本发明一个实施例的用于确定基因组DNA样品的甲基化位点的装置的示意图。
具体实施例方式下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。构建全基因组甲基化高通量测序文库的方法根据本发明的一个方面,本发明提供了一种构建全基因组甲基化高通量测序文库的方法。参考图1,根据本发明的实施例,该方法包括以下步骤:用Msp I和第二限制性内切酶对基因组DNA进行酶切,以便获得DNA片段;将DNA片段进行末端修复,以便获得经过末端修复的DNA片段;在经过末端修复的DNA片段的3’末端添加碱基A,以便获得具有粘性末端A的DNA片段;将具有粘性末端A的DNA片段与甲基化接头相连,以便获得具有甲基化接头的连接产物;将具有甲基化接头的连接产物进行片段选择,以便获得目的片段;将目的片段进行重亚硫酸盐处理,以便将目的片段中非甲基化的胞嘧啶转换为尿嘧啶,获得经过转换的目的片段;将经过转换的目的片段进行PCR扩增,以便获得扩增产物;以及分离纯化扩增产物,所得到的扩增产物构成全基因组甲基化高通量测序文库。在本发明中所使用的术语“DNA”可以是任何包含脱氧核糖核苷酸的聚合物,包括但不限于经过修饰的或者未经修饰的DNA。本领域的技术人员可以理解,基因组DNA的来源不受特别限制,可以从任何可能的途径获得,可以是通过市售直接获得,也可以是从其他实验室直接获取,还可以是直接从样本中提取。根据本发明的实施例,可以从样本中提取获得基因组DNA。根据本发明的一个实施例,构建全基因组甲基化高通量测序文库的方法可以进一步包括从样本中提取基因组DNA的步骤。根据本发明的一些具体示例,样本可以来源于哺乳动物、植物、和微生物的至少一种。根据本发明的一些实施例,哺乳动物可以为人和小鼠的至少一种。根据本发明的一个实施例,基因组DNA可以为人类全血基因组DNA。发明人发现,当采用人类全血基因组DNA构建全基因组甲基化高通量测序文库时,从样本中提取基因组DNA的操作方便易行,且获得的DNA质量好、甲基化信息完整,由其构建的文库能够方便地应用于高通量测序技术,从而基于对测序结果的数据分析就能方便有效地获得样本的全基因组甲基化信息。根据本发明的实施例,基因组DNA的量不受特别限制,根据本发明的具体示例,优选基因组DNA的量为150-200ng,更优选为lOOng。发明人惊奇地发现,当基因组DNA的量为IOOng时,根据本发明实施例的构建全基因组甲基化高通量测序文库的方法构建的文库,能够非常方便地应用于高通量测序技术,如Solexa测序技术,且文库测序结果准确,可重复性好,包含甲基化信息完整、CpG位点覆盖多。另外,需要说明的是,根据本发明实施例的构建全基因组甲基化高通量测序文库的方法中用Msp I和第二限制性内切酶对基因组DNA进行酶切的步骤,是本申请的发明人经过艰苦的研究和创造性劳动而意外获得的。在本文中所使用的术语“第二限制性内切酶”的含义是指与Msp I不同的限制性内切酶。根据本发明的实施例,可以采用的第二限制性内切酶的含义为选自 BstN 1、HpyCH4 V,Alu I, Hae II1、HpyCH4 11, Apek I, Ban II,Taqa I,Sph 1、Bgl I1、BssS 1、BamH I和Kpn I的至少一种。根据本发明的具体示例,优选采用ApeK I作为第二限制性内 切酶。这些限制性内切酶均为已知的,并且其最佳酶切条件以及识别位点也都是已知的。例如,限制性内切酶Msp I和ApeK I的识别位点分别为CCGG和GCWGC(其中W表示碱基A或T)。发明人发现,当采用Msp I和上述第二限制性内切酶组合对基因组DNA进行酶切时,酶切所得的DNA片段对基因组调控区域的覆盖情况非常好,具体地,Msp I和ApeK I结合酶切与RRBS技术中的Msp I单酶切相比,理论上可检测到CpG岛内的CpG位点数由不足50%提高到近70%。发明人发现,通过Msp I和上述第二限制性内切酶对基因组DNA进行酶切,然后进行全基因甲基化高通量测序文库构建以及后续的全基因组甲基化位点的确定,能够实现对甲基化区域的有效检测,尤其是现有RRBS技术无法检测到的区域例如大于70%的组织特异性差异的甲基化区域(T-DMR)和癌症中的差异甲基化区域(C-DMR),由此检测范围得到显著扩大并且可覆盖更多的CpG位点,具有广阔的应用前景。根据本发明的实施例,使用Msp I和第二限制性内切酶对基因组DNA进行酶切时,限制性内切酶对基因组DNA进行处理的先后顺序不受特别限制,可以依次进行,也可以同时进行。以Msp I和ApeK I的组合为例,根据本发明的具体示例,可以首先使用Msp I进行酶切处理,然后再使用ApeK I进行酶切处理。发明人惊奇地发现,当采用这种酶切顺序进行酶切处理时,能够有效地对基因组DNA进行酶切处理,并且在完成Msp I对基因组DNA的酶切处理后,不需要纯化酶切产物,只需要对限制性内切酶进行失活处理,即可以添加ApeKI,进行酶切。根据本发明的一个实施例,在使用Msp I和第二限制性内切酶对基因组DNA进行酶切时,可以添加对照样品,以验证方法的有效性。根据本发明的实施例,对照样品可以为序列已知且与样品基因组DNA来源不同的任何DNA。具体地,优选采用λ-DNA,因为λ-DNA的序列信息已知,且其核苷酸序列中不存在甲基化位点。由此,能够更加精确地评估文库构建过程重亚硫酸盐的转换效率,以便提高检测样本的应用范围和检测可信度。具体地,根据以Msp I和Apek I的组合为例,本发明的一个实施例,发明人利用Msp I和Apek I酶切lambda基因组DNA( λ-DNA),选取同样大小范围的片段(40_300bp)与人类基因组hgl9比对,结果显示所有选取范围内的λ-DNA片段均不会比回到人类基因组上。进一步,发明人使用IOOng的成熟树突状细胞(mDC)基因组,同时混入50pg完整的λ -DNA共同酶切建库,计算证明建库过程重亚硫酸盐转换率约为99%,确定了其作为参照评估重亚硫酸盐转换效率的精确性。目前已知干细胞等相关细胞中存在大量非CpG位点上的甲基化修饰,因此,不能按照基因组本身单个C碱基(非CG 二核苷酸处的C碱基)的甲基化状态来计算重亚硫酸盐处理的转换率。根据本发明的实施例,发明人通过将未甲基化的λ-DNA引入建库和测序过程,可更加精确的评估不同实验样本的检测准确性,为实验数据可信性的判定提供了重要依据。此外,根据本发明的实施例,与基因组DNA混合的λ-DNA的量不受特别限制。根据本发明的一些具体示例,可以添加极微量的λ-DNA与基因组DNA混合,本领域的技术人员可以理解,这里所使用的术语“极微量”是相对而言,是指与基因组DNA的量相比,混合的λ-DNA的量非常少,不会干扰基因组DNA的酶切及其后续的建库过程。基因组DNA和λ -DNA的添加量可以不是一个数量级,例如IOOng基因组DNA中,可以混合30_100pg的λ-DNA。发明人发现,皮克级的未甲基化λ-DNA的混合,就能够实现其参照作用,即能够精确地评估文库构建过程中重亚硫酸盐的转换效率。根据本发明的具体示例,优选地,IOOng基因组DNA中混合50pg的λ -DNA,由此既能精确评估重亚硫酸盐的转换效率,还能有效地构建基因组DNA样品的全基因组甲基化高通量测序文库,且该文库能有效地用于后续的全基因族甲基化检测中,检测到的甲基化区域广、CpG为点多。根据本发明的一个实施例,在将DNA片段进行末端修复前,可以进一步包括纯化DNA片段的步骤,由此,使得后续的末端修复易于进行。根据本发明的实施例,将DNA片段进行末端修复可以利用Klenow片 段、T4DNA聚合酶和T4多核苷酸激酶进行,其中,所述Klenow片段具有5’ 一 3’聚合酶活性和3’ 一 5’聚合酶活性,但缺少5’ 一 3’外切酶活性。由此,能够方便准确地对DNA片段进行末端修复。根据本发明的一个实施例,可以利用Klenow(3’ _5’ exo_),即具有3’ 一 5’外切酶活性的Klenow,在经过末端修复的DNA片段的3’末端添加碱基A。由此,能够方便准确地将碱基A添加到经过末端修复的DNA片段的3’末端。本发明中所使用的术语“甲基化接头”是指这样的一种接头,在其核苷酸序列中,所有C位点均被甲基化修饰。根据本发明的一个实施例,在将具有粘性末端A的DNA片段与甲基化接头相连前,可以进一步包括对常规测序所使用的接头进行甲基化的步骤。由此,能够避免测序接头对后续重亚硫酸盐处理等操作的干扰。本领域的技术人员可以理解,对接头进行甲基化的方法不受特别限制,可以利用本领域已知的任何方法对测序接头进行甲基化。根据本发明的一些实施例,甲基化接头中还可以进一步包含标签,由此可以方便地同时构建多种基因组DNA样品的全基因组甲基化高通量测序文库,并能够有效地应用于高通量测序平台,从而在对测序结果进行数据分析后,基于标签的序列信息,就能够准确地区分多种基因组DNA样品的文库的序列信息以及全基因组甲基化位点的信息,由此,能够充分地利用高通量测序平台,且能够节省时间、降低成本。根据本发明的一个实施例,将具有粘性末端A的DNA片段与甲基化接头相连是利用T4 DNA连接酶进行的,由此可以方便地获得具有甲基化接头的连接产物。根据本发明的实施例,将具有甲基化接头的连接产物进行片段选择,是通过2%的琼脂糖凝胶电泳进行的。根据本发明的实施例,通过2 %的琼脂糖凝胶电泳对具有甲基化接头的连接产物进行片段选择后,还可以对获得的目的片段进行纯化回收,以便使后续的实验易于进行。根据本发明的一些具体示例,将具有甲基化接头的连接产物进行片段选择,获得的目的片段的长度为160-420bp。根据本发明的一个实施例,目的片段的长度可以为160以上,且小于240bp。根据本发明的另一个实施例,目的片段的长度可以为240以上,且小于340bp。根据本发明的又一个实施例,目的片段的长度可以为340以上,且420bp以下。发明人发现,当目的片段的长度为160-420bp时,构建的样品的全基因组甲基化高通量测序文库,能够方便有效地应用于高通量测序平台如Solexa测序平台,且可重复性好,测序结果真实可靠,包含基因组甲基化信息完整、CpG位点覆盖多。根据本发明的一些具体示例,在将目的片段进行重亚硫酸盐处理之前,可以将目的片段与片段化的λ-DNA混合。发明人发现,通过添加外源DNAU-DNA),即将目的片段与外源DNA混合,然后进行重亚硫酸盐高效共处理,对目标DNA片段能够起到保护作用,最大限度地降低重亚硫酸盐对微量DNA的破坏,可以进一步提高检测精度,使得纳克级,例如50-150ng基因组整体水平高精度的甲基化检测成为现实。根据本发明的实施例,片段化的λ -DNA的添加量不受特别限制,根据具体的示例,优选片段化的λ -DNA的量为100-500ng,更优选为200ng。本领域技术人员能够理解,可以通过本领域已知的任意方法制备这些片段化的λ -DNA,例如可以随同前面的DNA片段化处理一起进行制备。此外,将目的片段进 行重亚硫酸盐处理,可以通过本领域已知的任何方法进行,根据本发明的具体示例,可以采用商品化的试剂盒进行,优选地采用EZ DNAMethylation-Gold KitTM(ZYMO)进行。发明人惊奇地发现,米用 EZ DNA Methylation-GoldKitTM(ZYMO)对目的片段进行重亚硫酸盐处理时,方便快捷,且处理效果好,目的片段中非甲基化的胞嘧啶能够高效准确地转换为尿嘧啶,并且利于后续处理。根据本发明的实施例,可以使用热启动taq DNA聚合酶对经过转换的目的片段进行PCR扩增。根据本发明的实施例,热启动taq DNA聚合酶的种类不受特别限制,根据本发明的具体示例,热启动taq DNA聚合酶可以为r-taq聚合酶,由此PCR扩增效率高、用时少。根据本发明的实施例,可以基于目的片段的长度,确定PCR扩增的循环数。具体地,当目的片段的长度为160bp以上,且小于240bp时,PCR扩增的循环数可以为11 ;当目的片段的长度为240bp以上,且小于340bp时,PCR扩增的循环数可以为13 ;以及当目的片段的长度为340bp以上,且420bp以下时,PCR扩增的循环数可以为15。发明人惊奇地发现,当采用上述方法确定PCR扩增的循环数时,PCR扩增效率高、用时少,扩增效果都非常好。在为对目的片段长度进行细分的情况下,如果目的片段的长度在160-420bp的范围内,PCR扩增的循环数可以为13,发明人发现仍然可以实现较好的扩增效果。根据本发明的实施例,分离纯化扩增产物的方法不受特别限制,根据本发明的具体示例,可以通过选自磁珠纯化、纯化柱纯化和2%的琼脂糖凝胶电泳的至少一种进行,优选通过2%的琼脂糖凝胶电泳进行。利用根据本发明实施例的构建全基因组甲基化高通量测序文库的方法,能够有效地构建基因组DNA样品的全基因组甲基化高通量测序文库,特别是能够有效地构建微量样本的全基因组甲基化高通量测序文库,从而能够有效、充分地应用于高通量测序技术,通过对文库的测序,然后基于对测序结果的数据分析,就能够有效地获得全基因组甲基化位点信息,实现对基因组DNA样品的全基因组甲基化检测。确定基因组DNA样品的甲基化位点的方法和装置根据本发明的另一方面,本发明提供了一种确定基因组DNA样品的甲基化位点的方法。根据本发明的实施例,该方法包括下列步骤:根据本发明实施例的构建全基因组甲基化高通量测序文库的方法构建基因组DNA样品的全基因组甲基化高通量测序文库;对该全基因组甲基化高通量测序文库进行测序,以便得到测序结果;以及对测序结果进行数据分析,以便确定基因组DNA样品的甲基化位点。根据本发明的一些实施例,测序是利用高通量测序技术进行的。本领域的技术人员可以理解,可以通过本领域已知的任何高通量测序技术进行测序,根据本发明的具体示例,优选地采用Solexa测序平台进行测序。发明人发现,采用Solexa测序平台对基因组DNA样品的全基因组甲基化高通量测序文库进行测序,能够有效地获得测序结果,且测序用时少、效率高、测序结果准确,可重复性好。利用根据本发明实施例的确定基因组DNA样品的甲基化位点的方法,能够有效地构建基因组DNA样品的全基因组甲基化高通量测序文库,并且能够通过高通量测序技术如Solexa测序技术实现对文库的准确测序,基于对测序结果的数据分析,就能够准确地确定基因组DNA样品的甲基化位点,从而实现对基因组DNA样品的全基因组甲基化检测,相对于目前的RRBS技术,根据本发明实施例的确定基因组DNA样品的甲基化位点的方法,全基因组的调控区域的覆盖广度得到显著提高,使得调控区域内CpG位点的覆盖量显著增加。

根据本发明的再一方面,本发明提供了一种用于确定基因组DNA样品的甲基化位点的装置1000。参考图3,根据本发明的一个实施例,该装置包括:文库制备单元100、测序单元200以及数据分析单元300。根据本发明的实施例,文库制备单元100用于制备基因组DNA样品的全基因组甲基化高通量测序文库,其中,文库制备单元100内设置有限制性内切酶Msp I和第二限制性内切酶。根据本发明的实施例第二限制性内切酶为选自BstN 1、HpyCH4 V、Alu I,Hae II1、HpyCH4II> Apek I> Ban I1、Taqa1、Sph 1、Bgl I1、BssS I > BamH I 和 Kpn I 的至少一种,优选所述第二限制性内切酶为Apek I。关于第二限制性内切酶,在前面已经进行了详细描述,不再赘述。由此,文库制备单元100可以适于实施前面所述的全基因组甲基化高通量测序文库构建方法。测序单元200与文库制备单元100相连,可以从文库制备单元100接收所制备的全基因组甲基化高通量测序文库,并对所接收的全基因组甲基化高通量测序文库进行测序,从而可以获得测序结果。数据分析单元300与测序单元200相连,可以从测序单元200接收所获得的测序结果,并且能够进一步对测序结果进行数据分析,从而基于分析结果确定基因组DNA样品的甲基化位点,最终实现对基因组DNA样品的全基因组甲基化检测。本领域技术人员能够理解的是,可以采用本领域中已知的任何适于进行上述操作的装置作为上述各个单元的组成部件。在本文中所使用的术语“相连”应作广义理解,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。利用根据本发明实施例的用于确定基因组DNA样品的甲基化位点的装置,能够方便准确地确定基因组DNA样品的甲基化位点,从而可以应用于多种针对全基因组甲基化的研究,例如可以用于对人的肿瘤基因抑制基因的甲基化异常的检测,以便为人类疾病的早期诊断提供有效的途径。试剂盒根据本发明的又一方面,本发明提供了一组分离的限制性内切酶。根据本发明的实施例,其由Msp I酶以及第二限制性内切酶构成。根据本发明的实施例,第二限制性内切酶为选自 BstN 1、HpyCH4 V、Alu 1、Hae II1、HpyCH4 I1、Apek 1、Ban I1、Taqa 1、Sph 1、Bgl I1、BssS1、BamH I和Kpn I的至少一种,优选所述第二限制性内切酶为Apek I。关于第二限制性内切酶,在前面已经进行了详细描述,不再赘述。根据本发明实施例的Msp I酶和第二限制性内切酶酶构成的酶切组合,能够有效地对基因组DNA进行酶切,且酶切获得的DNA片段非常适用于本发明的构建全基因组甲基化高通量测序文库的方法。该组分离的限制性内切酶的用途及效果,前面已经详细描述,在此不再赘述。根据本发明的另一方面,本发明提供了一种用于构建全基因组甲基化高通量测序文库的试剂盒。根据本发明的实施例,该试剂盒包括:Msp I酶,以及第二限制性内切酶。根据本发明的实施例,第二限制性内切酶为选自BstN 1、HpyCH4 V、Alu I, Hae II1、HpyCH4
I1、Apek 1、Ban I1、T aqa 1、Sph 1、Bgl I1、BssS 1、BamH I 和 Kpn I 的至少一种,优选所述第二限制性内切酶为Apek I。关于第二限制性内切酶,在前面已经进行了详细描述,不再赘述。本领域的技术人员可以理解,试剂盒中还可以进一步包括构建全基因组甲基化高通量测序文库所需的任何其他组分,在此不再赘述。利用根据本发明实施例的用于构建全基因组甲基化高通量测序文库的试剂盒,能够方便有效地构建基因组DNA样品的全基因组甲基化高通量测序文库。需要说明的是,根据本发明实施例的构建全基因组甲基化高通量测序文库的方法及其应用,是本申请的发明人经过艰苦的创造性劳动和优化工作完成的。下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件的,按照本领域内的文献所描述的技术或条件(例如参考J.萨姆布鲁克等著,黄培堂等译的《分子克隆实验指南》,第三版,科学出版社)或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。实施例1:一、实验流程1.使用Msp I和ApeK I酶切基因组DNA:1.1Msp I酶切:采用Msp I对IOOng人源mDC细胞系全基因组DNA样品(mDC,成熟树突状细胞)进行酶切:I)在1.5ml的离心管中配制Msp I酶切反应体系:
权利要求
1.一种构建全基因组甲基化高通量测序文库的方法,其特征在于,包括以下步骤: 用Msp I和第二限制性内切酶对基因组DNA进行酶切,以便获得DNA片段,其中所述第二限制性内切酶为选自 BstN 1、HpyCH4 V,Alu I, Hae II1、HpyCH4 11 ,Apek I, Ban I1、Taq a Sph 1、Bgl I1、BssS I> BamH I和Kpn I的至少一种,优选所述第二限制性内切酶为 ApekI ; 将所述DNA片段进行末端修复,以便获得经过末端修复的DNA片段; 在所述经过末端修复的DNA片段的3’末端添加碱基A,以便获得具有粘性末端A的DNA片段; 将所述具有粘性末端A的DNA片段与甲基化接头相连,以便获得具有甲基化接头的连接产物; 将所述具有甲基化接头的连接产物进行片段选择,以便获得目的片段; 将所述目的片段进行重亚硫酸盐处理,以便将所述目的片段中非甲基化的胞嘧啶转换为尿嘧啶,获得经过转换的目的片段; 将所述经过转换的目的片段进行PCR扩增,以便获得扩增产物;以及 分离纯化所述扩增产物,所述扩增产物构成全基因组甲基化高通量测序文库; 其中, 任选地,进一步包括从样本中提取基因组DNA的步骤,优选所述样本来源于哺乳动物、植物、和微生物的至少一种,更优选所述哺乳动物为人和小鼠的至少一种; 任选地,所述基因组DNA为人类全血基因组DNA ; 任选地,所述基因组DNA的量为150-200ng,优选IOOng ; 任选地,在将所述DNA片段进行末端修复前,进一步包括纯化DNA片段的步骤; 任选地,将所述DNA片段进行末端修复是利用Klenow片段、T4DNA聚合酶和T4多核苷酸激酶进行的,其中,所述Klenow片段具有5’ 一 3’聚合酶活性和3’ 一 5’聚合酶活性,但缺少5’ 一 3’外切酶活性; 任选地,将所述经过末端修复的DNA片段的3’末端添加碱基A是利用Klenow (3,-5’ exo_)进行的; 任选地,所述甲基化接头中包含标签; 任选地,将所述具有粘性末端A的DNA片段与甲基化接头相连前,进一步包括对接头进行甲基化的步骤; 任选地,将所述具有粘性末端A的DNA片段与甲基化接头相连是利用T4 DNA连接酶进行的; 任选地,将所述具有甲基化接头的连接产物进行片段选择,是通过2%的琼脂糖凝胶电泳进行的; 任选地,所述目的片段的长度为160-420bp ; 任选地,在将所述目的片段进行重亚硫酸盐处理之前,将所述目的片段与片段化的λ -DNA混合,优选所述片段化的λ -DNA的量为200ng ; 任选地,将所述目的片段进行重亚硫酸盐处理是采用EZ DNA Methylation-GoldKit (ZYMO)进行的; 任选地,所述PCR扩增使用热启动taq DNA聚合酶;任选地,所述热启动taq DNA聚合酶为r_taq聚合酶; 任选地,基于所述目的片段的长度,确定所述PCR扩增的循环数, 其中, 当所述目的片段的长度为160bp以上,且小于240bp时,所述PCR扩增的循环数为11 ; 当所述目的片段的长度为240bp以上,且小于340bp时,所述PCR扩增的循环数为13 ;以及 当所述目的片段的长度为340bp以上,且420bp以下时,所述PCR扩增的循环数为15 ;任选地,分离纯化所述扩增产物是通过选自磁珠纯化、纯化柱纯化和2%的琼脂糖凝胶电泳的至少一种进行的,优选通过2%的琼脂糖凝胶电泳进行。
2.一种确定基因组DNA样品的甲基化位点的方法,其特征在于,包括下列步骤: 根据权利要求1所述的方法构建所述基因组DNA样品的全基因组甲基化高通量测序文库; 对所述全基因组甲基化高通量测序文库进行测序,以便得到测序结果;以及 对所述测序结果进行数据分析,以便确定所述基因组DNA样品的甲基化位点。
3.根据权利要求2所述的方法,其特征在于,所述测序是利用高通量测序技术进行的。
4.根据权利要求3所述的方法,其特征在于,所述测序是通过Solexa测序平台进行的。
5.一种用于确定基因组DNA样品的甲基化位点的装置,其特征在于,包括: 文库制备单元,所述文库制备单元用于制备基因组DNA样品的全基因组甲基化高通量测序文库,所述文库制备单元内设置有Msp I酶以及第二限制性内切酶,其中,所述第二限制性内切酶为选自 BstN 1、HpyCH4 V,Alu I, Hae II1、HpyCH4 11, Apek I, Ban II,Taqa I,Sph 1、Bgl I1、BssS 1、BamH I和Kpn I的至少一种,优选所述第二限制性内切酶为ApekI ; 测序单元,所述测序单元与所述文库制备单元相连,并且从所述文库制备单元接收所述基因组DNA样品的全基因组甲基化高通量测序文库,以便用于对所述基因组DNA样品的全基因组甲基化高通量测序文库进行测序,获得测序结果;以及 数据分析单元,所述数据分析单元与所述测序单元相连,并且从所述测序单元接收所述测序结果,以便对所述测序结果进行数据分析,确定所述基因组DNA样品的甲基化位点。
6.组分离的限制性内切酶,其特征在于,由Msp I酶以及ApeK I酶构成。
7.一种用于构建全基因组甲基化高通量测序文库的试剂盒, 其特征在于,包括: Msp I酶,以及 第二限制性内切酶, 其中, 所述第二限制性内切酶为选自 BstN 1、HpyCH4 V,Alu I, Hae II1、HpyCH4 11, Apek 1、Ban I1、Taqa 1、Sph 1、Bgl I1、BssS 1、BamH I 和 Kpn I 的至少一种,优选所述第二限制性内切酶为Apek I。
全文摘要
提供了全基因组甲基化高通量测序文库的构建方法及其应用。构建全基因组甲基化高通量测序文库的方法包括用Msp I和第二限制性内切酶对基因组DNA进行酶切;将DNA片段进行末端修复;在经过末端修复的DNA片段的3’末端添加碱基A;将具有粘性末端A的DNA片段与甲基化接头相连;将具有甲基化接头的连接产物进行片段选择,以便获得目的片段;将目的片段进行重亚硫酸盐处理,以便将目的片段中非甲基化的胞嘧啶转换为尿嘧啶;将经过转换的目的片段进行PCR扩增;分离纯化扩增产物,该扩增产物构成全基因组甲基化高通量测序文库。采用本发明的构建全基因组甲基化高通量测序文库的方法及其应用,能够方便有效地构建基因组DNA样品的全基因组甲基化高通量测序文库。
文档编号C12Q1/68GK103088433SQ20111034235
公开日2013年5月8日 申请日期2011年11月2日 优先权日2011年11月2日
发明者高飞, 王君文, 夏渝东, 王俊 申请人:深圳华大基因科技有限公司, 深圳华大基因研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1