甲基化高通量检测方法

文档序号:3414563阅读:581来源:国知局
专利名称:甲基化高通量检测方法
技术领域
本发明涉及高通量基因组甲基化DNA检测领域,特别是提供了一种结合序列捕获和重亚硫酸盐(bisulfite)测序的方法。另外,本发明还涉及外显子组测序和基于重亚硫酸盐转换的甲基化分析测序技术领域。本发明还涉及甲基化标签(Index)接头技术,可以实现在一个芯片上同时进行几个样品的捕获。本发明的方法特别适用于第二代测序技术,尤其是solexa测序技术。
背景技术
DNA甲基化是表观遗传学研究领域最为热点的方向之一,也正逐渐成为哺乳动物发育和癌症等多种疾病的表观遗传学标记。DNA甲基化不仅对染色质结构修饰,基因组稳定性具有重要作用,而且在真核生物中,DNA甲基化参与多种生物学过程,如胚胎发育,基因组印记,X染色体失活,基因表达的调节与沉默,逆转录转座子的沉默以及哺乳动物肿瘤等多 种疾病的发生(Brena RM et al. 2006 ;Egger G et al. 2004 ;Gu H et al. 2010)。DNA 甲基化生物标记为多种疾病的早期评估包括对高危险个体的检测评估,提供大量参考信息。目前,外显子组测序和基于重亚硫酸盐转换的甲基化分析测序均已成熟。以Illumina Solexa、AB SOLiD和Roche 454为代表的第二代测序技术在近几年得到快速发展,成为基因组学研究的重要工具。第二代测序技术最大的特点是高通量,其可对数以亿计的DNA片段同时进行测序,目前一台高通量测序仪一次可产生高达300Gb的数据,相当于将一个人的全基因组测序100次,高通量测序是通过超声波或其他方法将基因组打断成一系列的小片段,并在小片段的两侧加上接头(adaptor),然后通过接头引物进行桥式PCR或乳液PCR(emulsion PCR)扩增形成测序的基本单位,再根据接头上的部分序列设计公共测序引物,对基因组DNA进行测序。当前研究DNA甲基化的方法主要有基于PCR的甲基化分析方法、基于限制性内切酶的甲基化分析方法、基于重亚硫酸盐的甲基化分析方法和柱层析法等。重亚硫酸盐处理结合高通量测序是研究甲基化最常用也是最准确的方法,重亚硫酸盐测序法(bisulfite genomics sequencing)是利用重亚硫酸盐将基因组DNA中的未甲基化的胞嘧啶(C)修饰为尿嘧啶(U),甲基化的胞嘧啶(C)保持不变,在PCR扩增中,尿嘧啶(U)将变成胸腺嘧啶(T),因此甲基化位点就成为一个普通的C/T单碱基多态性位点,其中等位基因胞嘧啶(C)的频率即为基因甲基化的程度,该方法具有数据量大,成本高的缺点。结合高通量测序的还有甲基化DNA免疫共沉淀(Methylated DNA Immunoprecipitation,MeDIP)和甲基化CpG结合域(methyl-CpG binding domain,MBD)柱层析法,它们虽然能很好的对富含甲基化区域进行富集,但是覆盖度相对均一,缺乏针对性。序列捕获技术是一种对基因组特定区域进行选择性富集的技术,其通过合适的方法将感兴趣的区域从基因组中分离出来,然后再对该目标区域进行测序,这对于低成本地有针对性的基因组学研究有非常重要的意义。最近研究发现(BrenetF et al. 2011 ;Harder A et al. 2010 ;Suzuki MM etal. 2008):外显子甲基化密度比之前认识到和期望的更为普遍,而第一个外显子和第一个内含子甲基化分布跟下游的外显子和内含子甲基化分布差异较大,大多下游区域甲基化的程度跟基因表达并非密切相关。总之,转录起始位点周围甲基化,第一个外显子区域甲基化与基因沉默的关系比上游启动子区域甲基化与之得关系更为密切。分析外显子甲基化对基因表达的研究有重大意义。现有研究大多是将基因组重亚硫酸盐处理后,根据c —T转换,设计特定的目标区域的探针,捕获靶区域甲基化的片段。这种方法在序列捕获之前将基因组进行重亚硫酸盐处理,增加了探针设计的难度及降低序列捕获的效率、目的区域的覆盖度,从而限制了应用的广泛性。

发明内容
针对上述基于重亚硫酸盐的甲基化研究方法中存在的问题,本发明提出了一种结合序列捕获和重亚硫酸盐测序的方法,该方法能够通过一次序列捕获试验对几个样品中的目标区域进行捕获,能准确有效地分析目标区域甲基化状态,降低探针设计的难度,增加操作及应用的可行性,使得对全基因组内感兴趣的目标序列和区域进行高通量高精度的甲基化检测成为现实,并且该方法还具有针对性强以及节约成本和时间的特点。本发明涉及的目的区域是外显子区域,将外显子组捕获与重亚硫酸盐测序相结 合,以此来检测人类全基因组外显子组的甲基化分布情况,这对研究发现外显子对基因表达调控的作用具有广泛的应用价值。该技术主要流程先将基因组DNA随机打断,加上特定接头后用液相杂交方法进行序列捕获,捕获下来的DNA内加入外源DNA然后再进行重亚硫酸盐处理,对处理好的DNA进行PCR扩增,TA克隆检测重亚硫酸盐处理效果,然后对文库进行定量检测及用新一代测序仪进行高通量测序,最后进行特异性区域范围内高精度的甲基化状况分析。该技术方案主要由以下五部分组成序列捕获探针的选择、文库制备、序列捕获、重亚硫酸盐处理、上机测序及数据分析。+序列捕获探针的选择本技术方案中探针设计简单,可以基于目前液相或者固相芯片杂交技术设计探针,探针长度可以从60mer-120mer不等。如选择探针SureSelect Human All Exon 38Mkit (Agilent),该探针覆盖了人全外显子区域及部分miRNA区域,与基因组目的区域内其中一条链互补,平均长度为120mer。+文库制备步骤一样品基因组DNA以及外源基因组DNA的片段化起始目的研究材料和作为外源基因组DNA的材料可以为任意物种(例如人,植物,昆虫)的基因组DNA,利用物理或化学方法如超声波片段化方法将基因组DNA打断为200-300bp的片段。外源基因组DNA优选地选择没有甲基化修饰的XDNA,其作用是在重亚硫酸盐处理时与样品一起高效共处理,对微量的DNA片段起到保护作用,最大限度的降低重亚硫酸盐对微量DNA的破坏。取没有蛋白、RNA等污染的完整基因组DNA约5 Ug以及作为外源基因组的X DNA,通过超声片段化方法将基因组DNA打断为大小200-300bp的片段。步骤二基因组DNA的末端修饰随机打断后的DNA回收纯化后,通过T4DNA聚合酶(T4DNAPolymerase) ,Klenow片段(Klenow Fragment)和T4聚核苷酸激酶(T4Polynucleotide Kinase)等酶的作用进行末端修复,形成平末端的DNA片段。然后利用Klenow片段(Klenow Frgment) (3,-5’exo_)聚合酶及dATP在补平的序列的3’末端加上“A”碱基。步骤三PEI (Paired-end Index)甲基化接头(Adapter),也称为双末端标签甲基化接头的连接3’末端加上“A”碱基的序列在T4DNA连接酶(T4DNA Ligase)的作用下与特殊设计且甲基化修饰的接头(C位点甲基化修饰)进行连接,纯化回收,如用MiniElutePCR Purification Kit(Qiagen)回收纯化反应体系中的DNA后,对其进行定量,如采用Qubit (Invitrogen)方法等。+序列捕获取500_1000ng连接产物文库进行液相或固相杂交,如采用Agilent液相杂交平台或Nimblegen固相或液相杂交平台进行,在杂交体系中同时加入接头封闭序列待杂交完毕后,通过变性等方法收集捕获的序列并纯化,得到与杂交探针区域互补的DNA分子。 +重亚硫酸盐处理将捕获下来的DNA加入200ng片段化了的入DNA,然后一起用重亚硫酸盐处理,如利用EZ DNA Methylation-Gold Kit (ZYMO)使非甲基化胞嘧啶转换为尿嘧啶。步骤四PCR扩增及文库切胶纯化以重亚硫酸盐转换后的DNA为模板,加入PCR引物序列,用针对重亚硫酸盐转换后的DNA的热启动taq酶进行PCR扩增(可用常规的r_taq或其它聚合酶扩增),扩增产物可用例如如下三种方法进行纯化,分别为磁珠纯化、纯化柱纯化、2%的琼脂糖胶电泳纯化。纯化回收的产物进行QPCR定量,然后待上机测序。+上机测序及数据分析将捕获的序列经过重亚硫酸盐处理后在第二代测序平台,例如在Solexa测序平台上采用边合成边测序的方法进行序列测定。为了将来源于不同样本制备的DNA文库在测序后区分开来,6bp或Sbp的标签序列通过接头或者PCR引物引入到片段的一侧,这样可以方便将不同文库直接混合后上机测序。分析数据时参考的序列为hgl8(已知的全基因组序列)测序所得的原始数据的分析流程参考LI Y et al. , Nature (2008) (Jffang, et al.,(2008). The DNA Methylome of Human Peripheral Blood Mononuclear Cells. Nature,456:60.),在实际应用中,参考数据的选择会随着所研究的基因组来源不同而不同,基本分析过程包括以下主要步骤将测序得到的数据正链的C全部转化成T,互补链的G全部转化成 A,使用 SOAP 程序(Li R, Li Y.,Kristiansen K. & Wang, J. (2008). SOAP shortoligonucleotide alignment program. Bioinformatics, 24 :713-714.)分别 I匕对至 IjC 全部转化为T,G全部转化为A的hgl8参考基因组上,其中允许有两个碱基的错配。然后统计比对在目标区域唯一位置的读段(reads),并用这些比对上参考序列的读段,以D^th > 4作为过滤参数进行过滤,将通过过滤后的位点的甲基化信息作为实际测到的甲基化信息,并以之为基础进行后续的比对信息分析。与常规研究报道的重亚硫酸盐处理基因组后再进行序列捕获的测序方法不同,在本发明中,首先进行特定区域的序列捕获,之后再用亚硫酸盐处理。因此,在序列捕获的过程中样品的甲基化的状态并没发生变化,设计捕获探针时就不需要考虑目的区域甲基化水平对序列捕获效率的影响。可以捕获所有目标区域验证其甲基化情况,而不必事先考虑甲基化分布再来设计芯片,获得的数据更真实和充分。本发明可使序列捕获中的探针设计方法较为简单,且捕获效率高,进而能够就全面而准确地分析基因组甲基化水平。本技术方案中探针设计简单,可以基于目前液相或者固相芯片杂交技术设计探针,探针长度可以从6 0-120mer不等。本技术在文库构建时,在序列捕获前进行甲基化标签(Index)接头的连接,这样可将几个样品混合后同时进行序列捕获,大大节省了成本,从而实现大样本量的高通量甲基化水平检测。
具体实施例方式下面将结合实施例对本发明的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。本发明一方面提供了一种甲基化高通量检测方法,其包括以下步骤序列捕获探针的选择、文库制备、序列捕获、重亚硫酸盐处理、上机测序及数据分析,其中序列捕获和重亚硫酸盐处理在文库制备的接头连接步骤和PCR扩增及文库切胶纯化步骤之间进行。在本发明的一个具体实施方式
中,甲基化高通量检测方法中的所述探针可以是用于液相或者固相芯片杂交的探针,优选地所述探针的长度是60mer-120mer,更优选地所述探针的平均长度为120mer。在本发明的一个具体实施方式
中,甲基化高通量检测方法中的所述文库制备步骤包括甲基化标签接头的连接。在本发明的一个具体实施方式
中,甲基化高通量检测方法中在序列捕获前进行如下文库制备步骤步骤一样品基因组DNA以及外源基因组DNA的片段化样品基因组DNA和作为外源基因组DNA可以是任意物种,包括但不限于人、植物、昆虫的基因组DNA ;利用物理或化学方法,优选的超声波片段化方法将优选的5 y g基因组DNA进行随机打断,优选地打断为200-300bp的片段;优选地外源基因组DNA是没有甲基化修饰的ADNA ;步骤二基因组DNA的末端修饰随机打断后的DNA回收纯化后,通过优选的T4DNA聚合酶、Klenow片段和T4聚核苷酸激酶酶的作用进行末端修复,形成平末端的DNA片段;然后优选地利用Klenow片段(3’ -5’ exo-)聚合酶及dATP在补平的序列的3’末端加上“A”碱基;步骤三PEI甲基化接头的连接3’末端加上“A”碱基的序列在连接酶,优选的T4DNA连接酶的作用下与甲基化修饰,优选的C位点甲基化修饰的接头进行连接,纯化回收,对其进行定量。在本发明的一个具体实施方式
中,甲基化高通量检测方法中所述PEI甲基化接头包括PE Index_ 甲基化 adapter I Phos/TCAAGTAGATCGGAAGAGCACACGTCTGMCTCCAGTCAC (SEQ ID NO : I,所有 C位点甲基化修饰),和
PE Index_ 甲基化 adapter 2 TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT (SEQ ID NO :2)。在本发明中可以改变上述接头序列中下划线部分的碱基,从而产生更多的、不同的标签引物,用于多种不同的样品。在本发明的一个具体实施方式
中,甲基化高通量检测方法中的序列捕获步骤包括将文库制备步骤中的连接产物文库在固相或液相杂交平台,优选是液相杂交平台进行杂交,其中优选地使用500-1000ng连接产物文库杂交,在杂交体系中同时加入接头封闭序列;待杂交完毕后,通过变性等方法收集捕获的序列并纯化,得到与杂交探针区域互补的DNA分子,其中优选地是对外显子组进行捕获。在本发明的一个具体实施方式
中,甲基化高通量检测方法中的序列捕获步骤中使用的接头封闭序列是PEI甲基化接头的连接步骤中所使用PEI甲基化接头的互补序列,并 且选自PE Index_ 甲基化 adapter I Phos/TCAAGTAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC(SEQ ID NO :1),或PE Index_ 甲基化 adapter 2:TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT(SEQ ID NO :2)的互补序列,其中所述接头的所有C位点均经甲基化修饰。在本发明的一个具体实施方式
中,甲基化高通量检测方法中的重亚硫酸盐处理步骤包括将序列捕获步骤中得到的DNA片段化外源基因组DNA,一起用重亚硫酸盐进行处理,并且外源基因组DNA优选地是200ng经片段化的\ DNA。本发明进一步提供了一种甲基化高通量检测方法,其中在重亚硫酸盐处理后进行如下文库制备中的PCR扩增及文库切胶纯化的步骤以重亚硫酸盐转换后的DNA为模板,加入PCR引物序列进行PCR扩增,其中所使用的聚合酶包括针对重亚硫酸盐转换后的DNA的热启动taq酶、常规的r_taq或其它聚合酶扩增,优选的是针对重亚硫酸盐转换后的DNA的热启动taq酶;对扩增产物进行纯化,纯化方法包括但不限于磁珠纯化、纯化柱纯化、2%的琼脂糖胶电泳纯化;纯化回收的产物进行QPCR定量,然后待上机测序。在本发明的一个具体实施方式
中,PCR扩增步骤进一步包括将优选的6bp或8bp的标签序列通过接头或者PCR引物引入到DNA片段的一侧。在本发明的一个具体实施方式
中,在甲基化高通量检测方法中根PCR扩增中使用的PCR引物序列包括Pl公用引物AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT(SEQ ID NO 3),Indexl 引物CAAGCAGAAGACGGCATACGAGATCTTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT(SEQID NO :4),和Index 2 引物CMGCAGAAGAC GGCATAC GAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT (SEQID NO 5)。其中可以改变上述PCR引物中下划线部分的碱基,从而产生更多的、不同的标签引物,用于多种不同的样品。在本发明的一个具体实施方式
中,甲基化高通量检测方法中的上机测序及数据分析包括将重亚硫酸盐处理步骤得到的序列在测序平台,优选第二代测序平台,更优选的Solexa测序平台上进行测序,并进行数据分析比较。本发明另一方面提供了根据本发明的甲基化高通量检测方法构建的测序文库。本发明另一方面提供了根据本发明的甲基化高通量检测方法构建的测序文库用于甲基化高通量测序的用途。进一步的,根据本发明的甲基化高通量检测方法适用于外显子组测序,进一步优 选地用于检测人类全基因组外显子组的甲基化分布情况。


图I :MDC PCR 2100 检测结果。图2 YH PCR 2100 检测结果。图3 :YH和MDC在每条染色体上的覆盖度分布。其中红色柱YH表示YH全血基因组DNA,绿色柱mDC(Mature dendritic cells)表示成熟的树突状细胞DNA,横坐标(chromosome)表不染色体号,纵坐标(coverage of ech chromosome)表不测序覆盖度。图4 :YH和MDC在每条染色体上深度分布。其中绿色柱YH表示YH全血基因组DNA,红色柱mDC表示成熟的树突状细胞DNA,横坐标(chromosome)表示染色体号,纵坐标(depthof ech chromosome)表不测序深度。图5 YH MDC捕获片段在基因上的分布。图6 :MDC捕获下来目标区域与全基因组重亚硫酸盐数据比较。横坐标和纵坐标分别表示目标捕获得出来的甲基化率(methylation rate in target region)和全基因组测序的甲基化率。Pearson Correlation表示皮尔逊相关系数。图7 :YH捕获下来目标区域与全基因组重亚硫酸盐数据比较。横坐标和纵坐标分别表示目标捕获得出来的甲基化率(methylation rate in target region)和全基因组测序的甲基化率。Pearson Correlation表示皮尔逊相关系数。实施例主要实验仪器列表
权利要求
1.一种甲基化高通量检测方法,其包括以下步骤序列捕获探针的选择、文库制备、序列捕获、重亚硫酸盐处理、上机测序及数据分析,其特征在于序列捕获和重亚硫酸盐处理在文库制备的接头连接步骤和PCR扩增及文库切胶纯化步骤之间进行。
2.根据权利要求I的方法,其中所述探针可以是用于液相或者固相芯片杂交的探针,优选地所述探针的长度是60mer-120mer,更优选地所述探针的平均长度为120mer。
3.根据权利要求I的方法,其中所述文库制备步骤包括甲基化标签接头的连接,特别是PEI甲基化接头的连接。
4.根据权利要求I的方法,其中在序列捕获前进行如下文库制备步骤 步骤一样品基因组DNA以及外源基因组DNA的片段化 样品基因组DNA和作为外源基因组DNA可以是任意物种,包括但不限于人、植物、昆虫的基因组DNA ;利用物理或化学方法,优选的超声波片段化方法将优选的5μ g基因组DNA进行随机打断,优选地打断为200-300bp的片段;优选地外源基因组DNA是没有甲基化修饰的 λ DNA ; 步骤二基因组DNA的末端修饰 随机打断后的DNA回收纯化后,通过优选的T4DNA聚合酶、Klenow片段和Τ4聚核苷酸激酶酶的作用进行末端修复,形成平末端的DNA片段;然后优选地利用Klenow片段(3’ -5’ exo-)聚合酶及dATP在补平的序列的3’末端加上“A”碱基; 步骤三PEI甲基化接头的连接 3’末端加上“A”碱基的序列在连接酶,优选的T4DNA连接酶的作用下与甲基化修饰,优选的C位点甲基化修饰的接头进行连接,纯化回收,对其进行定量。
5.根据权利要求4的方法,其中所述PEI甲基化接头包括PE Index_ 甲基化 adapter I Phos/TCAAGTAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC,和PE Index_ 甲基化 adapter 2 TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT,其中所沭接头的所有 C 位点均经甲基化修饰。
6.根据权利要求I的方法,其中序列捕获步骤包括将文库制备步骤中的连接产物文库在固相或液相杂交平台,优选是液相杂交平台进行杂交,其中优选地使用500-1000ng连接产物文库杂交,在杂交体系中同时加入接头封闭序列;待杂交完毕后,通过变性等方法收集捕获的序列并纯化,得到与杂交探针区域互补的DNA分子,其中优选地是对外显子组进行捕获。
7.根据权利要求6的方法,其中接头封闭序列是PEI甲基化接头的连接步骤中所使用PEI甲基化接头的互补序列,并且选自PE Index_ 甲基化 adapter I Phos/TCAAGTAGATCGGAAGAGCACACGTCTGAACTCCAGTCAC,或PE Index_ 甲基化 adapter 2 TACACTCTTTCCCTACACGACGCTCTTCCGATCTACTTGAT 的互补序列,其中所述接头的所有 C位点均经甲基化修饰。
8.根据权利要求I的方法,其中重亚硫酸盐处理步骤包括将序列捕获步骤中得到的DNA与片段化外源基因组DNA,一起用重亚硫酸盐进行处理,并且外源基因组DNA优选地是200ng经片段化的ADNA。
9.根据权利要求I的方法,其中在重亚硫酸盐处理后进行如下文库制备中的PCR扩增及文库切胶纯化步骤 以重亚硫酸盐转换后的DNA为模板,加入PCR引物序列进行PCR扩增,其中所使用的聚合酶包括针对重亚硫酸盐转换后的DNA的热启动taq酶、常规的r_taq或其它聚合酶扩增,优选的是针对重亚硫酸盐转换后的DNA的热启动taq酶; 对扩增产物进行纯化,纯化方法包括但不限于磁珠纯化、纯化柱纯化、2%的琼脂糖胶电泳纯化;纯化回收的产物进行QPCR定量,然后待上机测序。
10.根据权利要求9的方法,其中进一步包括将优选的6bp或8bp的标签序列通过接头或者PCR引物引入到DNA片段的一侧。
11.根据权利要求9的方法,其中PCR引物序列包括 Pl公用引物AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT, Indexl 引物CAAGCAGAAGACGGCATACGAGATCTTGATGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCT,和 Index 2 引物CAAGCAGAAGACGGCATACGAGATTCAAGTGTGACTGGAGTTCAGACGTGTGCTCTTCCGATCTo
12.根据权利要求I的方法,其中上机测序及数据分析包括将重亚硫酸盐处理步骤得到的序列在测序平台,优选第二代测序平台,更优选的Solexa测序平台上进行测序,并进行数据分析比较。
13.根据权利要求1-12中任一项的方法构建的测序文库。
14.根据权利要求12的测序文库用于甲基化高通量测序的用途。
15.根据权利要求1-12中任一项的方法,适用于外显子组测序,进一步优选地用于检测人类全基因组外显子组的甲基化分布情况。
全文摘要
本发明提供一种甲基化高通量检测方法,特别提供了一种结合序列捕获和重亚硫酸盐测序的方法,该方法能够同时准确有效地分析几个样品中的目标区域甲基化状态,降低探针设计的难度,增加操作及应用的可行性,使得对全基因组内感兴趣的目标序列和区域进行高通量高精度的甲基化检测成为现实,并且该方法还具有针对性强以及节约成本和时间的特点。
文档编号C40B50/06GK102796808SQ201110133858
公开日2012年11月28日 申请日期2011年5月23日 优先权日2011年5月23日
发明者罗慧娟, 吉冠玉, 蒋慧, 吴明枝, 孙继华, 吴仁花, 王君文, 高飞 申请人:深圳华大基因科技有限公司, 深圳华大基因研究院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1