羟甲基化暨甲基化长序列标签测序技术的制作方法

文档序号:499565阅读:553来源:国知局
羟甲基化暨甲基化长序列标签测序技术的制作方法
【专利摘要】羟甲基化暨甲基化长序列标签测序技术。本发明提供了一种检测核酸甲基化修饰和羟甲基化修饰的方法,包括如下步骤:对基因组 DNA中的5-hmC进行糖基化修饰以及对照组反应;限制性内切酶MspI酶切消化;接头A的连接;Bst DNA polymerase fragment 处理;EcoP15I或MmeI酶切;片段选择;P7接头连接;PCR扩增;PCR产物的回收;文库质控。本发明检测核酸甲基化修饰和羟甲基化修饰的方法具有如下优势:可以同时检测全基因组内几乎全部CCGG位点的不同修饰即甲基化和羟甲基化的丰度;具有高通量、高准确性并可降低实验和测序误差;不依赖于重亚硫酸盐的转换,弥补了传统甲基化检测技术中无法分辨甲基化和羟甲基化修饰的缺点。
【专利说明】羟甲基化暨甲基化长序列标签测序技术

【技术领域】
[0001] 本发明属于基因工程【技术领域】,特别涉及一种羟甲基化暨甲基化长序列标签测序 技术。

【背景技术】
[0002] 5-羟甲基胞嘧啶(5hmC)是早在1952年发现的存在于噬菌体中胞嘧啶的一种修饰 形式,也是最近同时在小鼠的神经元和胚胎干细胞中检测到的存在于哺乳动物基因组中的 又一种修饰方式。随后,大量的研宄集中于揭示5hmC和TET蛋白家族氧化酶在基因组组织 以及鼠干细胞分化中可能承担的角色,并且证明TET蛋白酶家族可以通过氧化作用将5mC 转换为5hmC。而Tet家族酶与疾病的发展与调控有关。已报道TET蛋白和5hmC存在于许 多不同的组织中,并且它们的表达/活性在胚胎干细胞分化过程中受到严格调控。TETl和 TET2均与癌症有关:TET1在急性骨髓样白血病(AML)和急性淋巴样白血病(ALL)中是MLL 的的一个配体,而TET2功能的缺失也与急性骨髓样白血病(AML)以及各种骨髓细胞生成障 碍综合征和骨髓增生性疾病密切相关。TET蛋白和hmC引起DNA甲基化失调,在胚胎干细胞 多潜能性,致癌性转化以及神经元的功能中可能具有重要作用。
[0003] 然而,尽管5hmC修饰碱基早在50年前就在噬菌体中发现,然而目前几乎没有一种 有效的酶或化学的方法可以特异性识别5hmC残基并分辨其在基因组中的具体分布。例如 甲基化依赖性内切酶MspJI家族或McrBC均不能分辨5mC和5hmC,而甲基化敏感类内切酶 如MspI或HpaII等,在大多情况下,5mC和5hmC对其有相同的影响。之前认为是检测甲基 化金标准的重亚硫酸盐处理分析同样不能有效地分辨是5mC修饰还是5hmC修饰。最近随 着5hmC特异性抗体的出现,依赖于免疫学检测5hmC的技术如斑点印迹分析技术、细胞免疫 荧光或免疫组化分析技术等已被广泛应用于羟甲基化相关的科学研宄之中,但这些技术 基本上都只限于检测5hmC在组织或细胞内的存在与否或表达量的高低,而不能定位其在 基因组上的分布。目前,在全基因组范围内检测5hmC分布的技术主要集中在富集捕获结合 测序分析的策略,如:hMeDIP、anti-CMS、JBP-pull down等,但所有这些富集捕获的实验方 法均不足以达到单碱基精确分辨5hmC在DNA序列内精确分布的程度,而且依赖于抗体或 蛋白捕获的该类技术大多受到非特异性捕获以及捕获偏好性的限制。最近基于生物氧化反 应建立起来的TAB-Seq和基于化学氧化建立起来的oxBS-seq可以检测全基因组的羟甲基 化修饰,而且可以进行单碱基分辨,但是这两种检测方法所需要的数据量巨大且实验技术 不宜在普通实验室建立,其广泛应用受到限制。
[0004] 另一方面,用于检测5hmC在全基因组或不同细胞或组织中含量的检测方法却不 断发展,5hmC在不同细胞或组织中含量的检测也不仅限于胚胎干细胞和脑组织中了。令 人兴奋的是最新两个研宄分别运用免疫组化和免疫测定的方法检测到5hmC在胚胎和成体 组织均广泛存在。免疫测定发现5hmC在脑、肝、肾和结肠直肠组织中的百分含量比较高为 0. 40-0. 65 %,而在肺组织中含量相对较低为0. 18 %,在心脏,乳房和胎盘中的含量极低,仅 为0. 05-0. 06%。相对正常结肠直肠组织0. 46-0. 57%的百分含量,该研宄同样检测发现在 癌变的结肠直肠组织中其含量仅为0. 02-0. 06%。这表明更亟待需要建立一种能够精确检 测5hmC在基因组范围内精确分布的大规模检测技术,为进一步研宄5-羟甲基胞嘧啶在基 因组内的分布及其相关的表观调控机制提供一种有力的工具,也为进一步探索其对相关疾 病的发生发展或在个体发育过程中所承担角色的实现提供前提条件。
[0005] 最近,NEB公司根据T4噬菌体β -葡糖基转移酶(T4-BGT)可以高效的将尿嘧啶 二磷酸葡萄糖(UDP-Glucose)的葡萄糖单元转移至双链DNA的5-轻甲基胞喃啶残基上,形 成的β-葡糖基-5-羟甲基胞嘧啶(5gmC)不能被MspI切开的原理建立了一种检测基因组 CCGG位点甲基化和羟甲基化修饰的技术,具体如下:首先,全基因组经过MspI酶切,在酶切 效率为100%的基础上,基因组所有的CCGG位点均可被切开(包括甲基化修饰和羟甲基化 修饰位点);第二步,酶切后的片段以dCTP为底物,经过Klenow fragment的作用形成5' 突出一个碱基C的粘性末端;第三步,4%的丙稀酰胺凝胶回收40-300bp范围的经Klenow fragment修复的DNA片段;第四步,回收片段连接5'突出碱基G的双链接头(接头可以介 导后续的PCR扩增和测序);第五步,连接接头的回收片段经BGT糖基化修饰,则基因组原 序列的CCGG位点如果含有羟甲基化修饰,则形成5gmC ;第六步,连接接头后的糖基化修饰 产物再进行MspI酶切,如果原CCGG位点是羟甲基化修饰,则连接的接头不会被切下来;第 七步,取1/3的上述产物进行PCR扩增,测序,只有两端都有接头的序列即两端都是羟甲基 化修饰的序列可以检测到。剩余2/3的产物分两份,每份各取1/3不直接进行PCR扩增,而 分别在dCTP底物的作用下,经过Klenow fragment再次进行末端修复,形成一端或两端突 出一个碱基C的粘性末端产物,然后在连接酶的作用下连接另外一种接头,连接产物中的 一份直接进行PCR扩增,测序。另一份经HpaII酶切后再次经过末端修复和接头连接,PCR 扩增测序。这样第一组检测到的序列两端的CCGG位点均羟甲基化修饰,第二组检测到的序 列的一端为羟甲基化修饰,而另一端为甲基化修饰或不修饰,第三组检测到的序列的一端 为羟甲基化修饰,而另一端为非修饰的CCGG位点。该技术需要经过多次的连接和酶切反 应,DNA的CCGG粘性末端连接和酶切效率相对较低,特别是经过糖基化修饰后的连接和酶 切效率可直接影响检测的准确性。此外,该技术主要是应用于基于PCR扩增的单基因或位 点的检测,目前应用于高通量检测的具体方法和数据还没有报道。
[0006] 此外,研宄者运用T4噬菌体β-葡糖基转移酶(T4-BGT)修饰建立了一种 HMST-seq的技术,该技术可以检测基因组大部分CCGG位点甲基化和羟甲基化修饰状态。借 助5hmC经过糖基化修饰后不能被MspI限制性内切酶切割,而5mC和5C均可被MspI切开的 原理,设计了一套含有生物素修饰的接头和含MmeI酶切位点的接头,全基因组依次经过糖 基化修饰、MspI酶切、生物素修饰的接头连接、NlaIII酶切、链霉素磁珠捕获、以及含MmeI 酶切位点的接头连接和MmeI酶切等操作构建文库,借助高通量测序仪精确检测5hmC在全 基因组范围内的精确定位,建立一种单碱基分辨,精确检测5hmC的技术。该技术需要构建3 个不同的文库,由于人为的浓度计算会引入相应的误差,影响检测准确性。此外,该技术检 测的并不是直接的CCGG位点,而是在基因组上与其相邻的CATG位点,因此不论是基因组结 构的变异还是信息关联的算法都会导致检测位点关联的错误。此外,由于非直接检测CCGG 位点,需要保证所有的DNA片段内都具有CATG位点,这大大降低了基因组检测的范围。


【发明内容】

[0007] 本发明要解决的技术问题是降低实验成本、高通量、提高基因组检测范围以及增 加数据分析的准确性的检测核酸甲基化修饰和羟甲基化修饰的方法。
[0008] 本发明提供了一种检测核酸甲基化修饰和羟甲基化修饰的方法,其特征在于,包 括以下步骤:
[0009] 步骤一:设置三组反应,其中一组对核酸进行糖基化处理,其余两组的核酸未经糖 基化处理;
[0010] 步骤二:将步骤一中经糖基化处理后的核酸的一组和未经糖基化处理的核酸的一 组分别平行进行MspI酶切反应;将步骤一中剩余的未经糖基化处理的核酸的一组同时进 行HpaII酶切反应;
[0011] 步骤三:将步骤二中三组中的每组的酶切片段分别连接含有不同Index且同时包 含Ecopl5I或MmeI酶切位点的接头A,将连接有不同的接头A的各组的核酸混合到一起,得 到一个包含无修饰、甲基化修饰和羟甲基化修饰的核酸文库;
[0012] 步骤四:运用Bst DNA聚合酶将核酸文库中的双链DNA接头中有缺口的一条链进 行修复;
[0013] 步骤五:对上一步得到的核酸进行Ecopl5I或MmeI酶切,产生短片段DNA序列。
[0014] 步骤六:回收连接接头A的短DNA片段;
[0015] 步骤七:将一段有两个碱基粘性末端的P7接头与步骤六的连接接头A的短DNA片 段进行连接;
[0016] 步骤八:以接头A和P7接头的DNA序列设计通用引物对步骤七得到的连有P7接 头及接头A的短DNA片段进行PCR扩增,回收纯化PCR产物,建立测序文库。
[0017] 步骤九:对步骤八得到的测序文库进行测序,分析比较序列信息,获得核酸甲基化 修饰和羟甲基化修饰的信息。
[0018] 所述步骤一中所述的核酸为基因组DNA。
[0019] 所述步骤一中所述的糖基化处理为:核酸在T4-BGT酶的作用下,以尿嘧啶二磷酸 葡萄糖为底物,将葡萄糖单元转移至核酸的5-羟甲基胞嘧啶上,形成β -葡糖基-5-羟甲 基胞嘧啶。
[0020] 所述接头 A 序列为三对:SEQ ID NO :1 和 SEQ ID NO :2 ;SEQ ID NO :3 和 SEQ ID NO :4 ;SEQ ID NO :5 和 SEQ ID NO :6。
[0021] 所述 P7 接头序列为 SEQ ID NO :7 和 SEQ ID NO :8。
[0022] 所述步骤八中的进行PCR扩增所用的通用引物为SEQ ID NO :9和SEQ ID NO : 10。
[0023] 本发明还提供了一种用于检测核酸甲基化修饰和羟甲基化修饰的试剂盒,包括如 下组分:
[0024] (1)用于进行糖基化修饰的试剂;
[0025] (2)限制性内切酶,
[0026] (3)含有不同Index的接头A,
[0027] (4) Bst DNA 聚合酶;
[0028] (5) -段有两个碱基粘性末端的P7接头;
[0029] (6)根据接头A的DNA序列设计的通用引物;
[0030] (7)根据P7接头的DNA序列设计通用引物;
[0031] 所述用于进行糖基化修饰的试剂为T4 β -葡萄糖基转移酶。
[0032] 所述限制性内切酶为包括MspI、HpaII以及EcoP15I,或者包括MspI、HpaII以及 MmeI0
[0033] 所述接头A序列同时包含Ecopl5I或MmeI酶切位点,为三对:SEQ ID NO :1和SEQ ID NO :2 ;SEQ ID NO :3 和 SEQ ID NO :4 ;SEQ ID NO :5 和 SEQ ID NO :6 ;所述P7 接头为 SEQ ID NO :7和SEQ ID NO :8 ;所述根据接头A的DNA序列设计的通用引物为SEQ ID NO :9,所 述根据P7接头的DNA序列设计通用引物为SEQ ID NO: 10。
[0034] 本发明检测核酸甲基化修饰和羟甲基化修饰的方法运用糖基化转移酶修饰和甲 基化敏感性不同的限制性内切酶酶切,可以同时检测全基因组内几乎全部CCGG位点的不 同修饰即甲基化和羟甲基化的丰度;通过在接头A内引入index和酶切位点,可以将酶切后 产生的未修饰、甲基化修饰和羟甲基化修饰的短DNA序列混合到一起,3个不同的文库整合 到一个文库中,三个文库可以平行建库和实验,相互作为参照,直接分析基因组CCGG位点 的修饰情况,具有高通量、高准确性并可降低实验和测序误差;此外,该技术不依赖于重亚 硫酸盐的转换,弥补了传统甲基化检测技术中无法分辨甲基化和羟甲基化修饰的缺点。

【专利附图】

【附图说明】
[0035] 图1为本发明检测核酸甲基化修饰和羟甲基化修饰的方法检测文库片段的结果, 其中横坐标为插入片段大小,纵坐标为信号强度。
[0036] 图2为本发明检测核酸甲基化修饰和羟甲基化修饰的方法的流程图。
[0037] 图3为本发明检测核酸甲基化修饰和羟甲基化修饰的方法的测序和数据比对结 果。
[0038] 图4为本发明检测核酸甲基化修饰和羟甲基化修饰的方法检测的各CCGG位点的 甲基化、羟甲基化水平。

【具体实施方式】
[0039] 本发明提供了一种检测核酸甲基化修饰和羟甲基化修饰的方法,如图2所示,包 括如下步骤:
[0040] 步骤一:对基因组DNA中的5-hmC进行糖基化修饰以及对照组反应
[0041] 图2的上端从左至右依次为A组、C组和B组
[0042] A组:取没有蛋白、RNA污染的完整基因组DNA用T4 β-葡萄糖基转移酶(简称 T4-BGT)进行处理;
[0043] B组和C组:同时,各取两份与A组等量的基因组DNA不进行糖基化处理,作为参 照组,设为B组和C组。
[0044] A组中经T4-BGT处理后的基因组DNA,羟甲基胞嘧啶(5-hmC)转化为糖基羟甲基 化胞嘧啶(5-ghmC)。该反应不依赖于DNA的序列结构,所有的5-hmC都将被糖基化修饰,而 胞嘧啶(5-C)和甲基胞嘧啶(5-mC)则不会糖基化。
[0045] B组和C组由于没有糖基化处理,所有的碱基都不会发生碱基修饰的改变。
[0046] 所述基因组DNA可以来源于动物组织提取的基因组DNA、细胞基因组DNA等,只要 基因组序列中的CCGG位点存在C hCGG羟甲基化修饰,均可运用该技术进行检测。
[0047] 步骤二:限制性内切酶MspI酶切消化
[0048] 将步骤一中A组经T4-BGT处理后的DNA和B组DNA分别平行进行MspI酶切反 应,MspI能识别和切割CCGG位点,该酶切反应不受甲基化(5-mC)和羟甲基化(5hmC)修饰 的影响,但是当5-hmC转变为5-ghmC后,抑制了 MspI的酶切,因此,A组中该位点经糖基羟 甲基修饰后不能被切开,而B组该位点未经糖基羟甲基修饰则可以被切开。
[0049] 将步骤一中C组DNA同时进行HpaII酶切反应。该HpaII酶同样识别CCGG位点, 但是受甲基化(5-mC)和羟甲基化(5hmC)修饰的抑制,只能切割未经任何修饰的识别位点。
[0050] 步骤三:接头A的连接
[0051] 将上述A组、B组和C组中的每组的酶切片段分别连接含有不同Index的接头A, 其接头序列同时包含Ecopl5I或MmeI酶切位点。
[0052] 将连接有不同的接头A的各组的DNA混合到一起,得到一个包含无修饰、甲基化修 饰和羟甲基化修饰的DNA文库。
[0053] 步骤四:Bst DNA polymerase fragment 处理
[0054] 运用Bst DNA聚合酶将双链DNA接头中有缺口的一条链进行修复,弥补DNA与接 头之间可能存在的缺口。
[0055] 步骤五:EcoP15I或MmeI酶切
[0056] 对上一步得到的DNA进行Ecopl5I或MmeI酶切(根据接头A的接头序列确定,当 接头序列同时包含Ecopl5I时,这里使用Ecopl5I酶切,当接头序列同时包含MmeI时,这 里使用MmeI酶切),产生短片段DNA序列。这些短片段DNA序列连接接头A的一端包含有 CCGG位点的修饰信息,另一端产生一个两碱基的粘性末端。通过分析连接不同index的短 片段的数量,即可得出该位置甲基化修饰、羟甲基化修饰的相对丰度。
[0057] 步骤六:片段选择
[0058] 通过丙烯酰胺凝胶电泳,回收连接接头A的短DNA片段。
[0059] 步骤七:P7接头连接
[0060] 在DNA连接酶的作用下,将一段有两个碱基粘性末端的P7接头与步骤六的连接接 头A的短DNA片段进行连接。
[0061] 步骤八:PCR扩增
[0062] 以接头A和P7接头的DNA序列设计通用引物对步骤七得到的连有P7接头及接头 A的短DNA片段进行PCR扩增,建立可以高通量测序的文库。
[0063] 步骤九:PCR产物的回收
[0064] 用丙烯酰胺凝胶电泳回收纯化PCR产物,得到上机文库。
[0065] 步骤十文库质控
[0066] 回收产物运用QPCR和Agilent Bio-analyzer进行文库插入片段和上机浓度的质 控。
[0067] 本发明还提供了一种用于检测核酸甲基化修饰和羟甲基化修饰的试剂盒,所述试 剂盒包括:
[0068] (1)用于进行糖基化修饰的试剂;优选为T4 β -葡萄糖基转移酶;
[0069] (2)限制性内切酶,优选为包括MspI、HpaII以及EcoP15I,或者优选为包括MspI、 HpaII 以及 MmeI ;
[0070] (3)含有不同Index的接头A,其接头序列同时包含Ecopl5I或MmeI酶切位点;优 选为三对:SEQ ID NO :1 和 SEQ ID NO :2 ;SEQ ID NO :3 和 SEQ ID NO :4 ;SEQ ID NO :5 和 SEQ ID NO:6。
[0071] (4) Bst DNA 聚合酶;
[0072] (5) -段有两个碱基粘性末端的P7接头;优选为SEQ ID NO :7和SEQ ID NO :8。
[0073] (6)根据接头A的DNA序列设计的通用引物;优选为SEQ ID NO :9。
[0074] (7)根据P7接头的DNA序列设计通用引物;优选为SEQ ID NO : 10。
[0075] 下面结合具体实施例,进一步阐述本发明。
[0076] 步骤一:对基因组DNA中的5-hmC进行糖基化修饰以及对照组反应
[0077] A组:取500ng人源基因组DNA (全血DNA)为起始量进行糖基化处理:
[0078] B组和C组:同时,各取两份500ng人源基因组DNA (全血DNA)不进行糖基化处理, 作为参照组,设为B组和C组。
[0079] 各组的处理方法如下:
[0080] 1)在I. 5ml的离心管中配制如表1所示的反应体系:
[0081] 表 1
[0082]

【权利要求】
1. 一种检测核酸甲基化修饰和羟甲基化修饰的方法,其特征在于,包括以下步骤: 步骤一:设置三组反应,其中一组对核酸进行糖基化处理,其余两组的核酸未经糖基化 处理; 步骤二:将步骤一中经糖基化处理后的核酸的一组和未经糖基化处理的核酸的一组 分别平行进行MspI酶切反应;将步骤一中剩余的未经糖基化处理的核酸的一组同时进行 Hpall酶切反应; 步骤三:将步骤二中三组中的每组的酶切片段分别连接含有不同Index且同时包含 Ecopl5I或Mmel酶切位点的接头A,将连接有不同的接头A的各组的核酸混合到一起,得到 一个包含无修饰、甲基化修饰和羟甲基化修饰的核酸文库; 步骤四:运用Bst DNA聚合酶将核酸文库中的双链DNA接头中有缺口的一条链进行 修复; 步骤五:对上一步得到的核酸进行Ecopl5I或Mmel酶切,产生短片段DNA序列; 步骤六:回收连接接头A的短DNA片段; 步骤七:将一段有两个碱基粘性末端的P7接头与步骤六的连接接头A的短DNA片段进 行连接; 步骤八:以接头A和P7接头的DNA序列设计通用引物对步骤七得到的连有P7接头及 接头A的短DNA片段进行PCR扩增,回收纯化PCR产物,建立测序文库; 步骤九:对步骤八得到的测序文库进行测序,分析比较序列信息,获得核酸甲基化修饰 和羟甲基化修饰的信息。
2. 根据权利要求1所述的检测核酸甲基化修饰和羟甲基化修饰的方法,其特征在于, 步骤一中所述的核酸为基因组DNA。
3. 根据权利要求1所述的检测核酸甲基化修饰和羟甲基化修饰的方法,其特征在于, 步骤一中所述的糖基化处理为:核酸在T4- BGT酶的作用下,以尿嘧啶二磷酸葡萄糖为底 物,将葡萄糖单元转移至核酸的5-羟甲基胞嘧啶上,形成0 -葡糖基-5-羟甲基胞嘧啶。
4. 根据权利要求1所述的检测核酸甲基化修饰和羟甲基化修饰的方法,其特征在于, 所述接头 A 序列为三对:SEQ ID NO :1 和 SEQ ID NO :2 ;SEQ ID NO :3 和 SEQ ID NO :4 ;SEQ ID NO :5 和 SEQ ID NO :6。
5. 根据权利要求1所述的检测核酸甲基化修饰和羟甲基化修饰的方法,其特征在于, 所述P7接头序列为SEQ ID NO :7和SEQ ID NO :8。
6. 根据权利要求1所述的检测核酸甲基化修饰和羟甲基化修饰的方法,其特征在于, 所述步骤八中的进行PCR扩增所用的通用引物为SEQ ID N0:9和SEQ ID N0:10。
7. -种用于检测核酸甲基化修饰和羟甲基化修饰的试剂盒,其特征在于,包括如下组 分: (1) 用于进行糖基化修饰的试剂; (2) 限制性内切酶, (3) 含有不同Index的接头A, (4) Bst DNA 聚合酶; (5) -段有两个碱基粘性末端的P7接头; (6) 根据接头A的DNA序列设计的通用引物; (7)根据P7接头的DNA序列设计通用引物。
8. 根据权利要求7所述的用于检测核酸甲基化修饰和羟甲基化修饰的试剂盒,其特征 在于,所述用于进行糖基化修饰的试剂为T4 0 -葡萄糖基转移酶。
9. 根据权利要求8所述的用于检测核酸甲基化修饰和羟甲基化修饰的试剂盒,其特 征在于,所述限制性内切酶为包括MspI、HpaII以及EcoP15I,或者包括MspI、HpaII以及 MmeI〇
10. 根据权利要求9所述的用于检测核酸甲基化修饰和羟甲基化修饰的试剂盒,其特 征在于,所述接头A序列同时包含Ecopl5I或Mmel酶切位点,为三对:SEQ ID NO :1和SEQ ID NO :2 ;SEQ ID NO :3 和 SEQ ID NO :4 ;SEQ ID NO :5 和 SEQ ID NO :6 ;所述P7 接头为 SEQ ID NO :7和SEQ ID NO :8 ;所述根据接头A的DNA序列设计的通用引物为SEQ ID NO :9,所 述根据P7接头的DNA序列设计通用引物为SEQ ID NO: 10。
【文档编号】C12Q1/68GK104480214SQ201410841922
【公开日】2015年4月1日 申请日期:2014年12月30日 优先权日:2014年12月30日
【发明者】高飞, 王君文, 夏渝东, 吉冠玉 申请人:深圳市易基因科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1