利用转座酶对染色质开放区和线粒体甲基化研究的方法与流程

文档序号:14983822发布日期:2018-07-20 20:42阅读:416来源:国知局
本发明属于基因工程
技术领域
,具体涉及一种利用转座酶对染色质开放区和线粒体基因组进行甲基化研究的方法。
背景技术
:新一代测序技术以高通量、低成本的优势,自出现之日起就倍受欢迎。随着技术的发展,新一代测序技术在许多科学研究和临床检测方面都有应用。目前很多科学研究与临床应用需要在单个细胞水平进行,或者在微量水平进行。在单细胞水平分析dna遗传变异信息,判断细胞、胚胎或个体是否患病或携带疾病基因,亦是常见的研究方法。测序文库的构建是高通量测序的必经步骤,传统的测序文库构建方法主要是通过打断仪(如covaris)等对基因组dna等靶dna进行机械打断,然后通过末端修复、加接头等步骤实现。基于机械打断的片段随机性良好,但是通量上也要依赖大量的covaris打断仪,同时需要后续单独进行末端处理、加接头和pcr以及各种纯化操作。tn5转座酶是一种细菌来源的转座酶,由926个氨基酸编码,分子量约53kd。有研究发现,可采用tn5转座酶同时实现dna片段化和接头的添加,完成测序文库构建。其作用机制为保守的“切割并粘贴”,tn5能够对dna双链进行切割后,将结合在tn5上的接头序列(adaptor)连接到dna序列的两端。2013年,斯坦福大学首次用结合了adaptor的转座酶tn5对人淋巴母细胞样细胞系gm12878进行染色质酶切,从而在单碱基水平对染色质开放区在基因组上的定位、dna结合蛋白、单个核小体及染色体组装之间的相互作用进行了研究。我们对其数据进行分析,发现约10-70%的数据被比对到线粒体。细胞中的染色体本身存在着开放区和紧密缠绕的区域,开放区域一般占染色体dna的1-2%,线粒体存在于细胞质中,是具有独立遗传特性的dna,而染色体dna存在于细胞核中。斯坦福大学公开的atac-seq技术在得到染色体开放区域、在分析测序数据时,只保留核基因组的数据,线粒体数据会丢弃。另有研究者将tn5片段化dna技术应用于全基因组甲基化研究领域,称之为tagmentation-basedwgbs(t-wgbs),即基于片段化的全基因组重亚硫酸盐测序。其主要通过对极低的基因组dna样本进行tn5片段化并进行重亚硫酸盐转化,经pcr建库后对全基因组进行单核苷酸水平的甲基化位点分析。其关键技术如下:⑴对上述transposonsequences中的所有的c(胞嘧啶)进行甲基化修饰,防止该序列中的c被重亚硫酸盐转化为u(尿嘧啶);⑵在tn5将transposon序列连接到dna片段上后,采用替换策略,用一段胞嘧啶甲基化的序列将19bp的识别序列替换成甲基化修饰的带adaptor的序列(replacementoligo),如此保证dna片段两端的adaptor序列不被重亚硫酸盐改变;⑶replacementoligo3’端inverted修饰,防止oligodna序列被t4dna聚合酶3’-5’外切酶活性降解。该方法虽然能测到线粒体基因组,但线粒体基因组在其测序数据中的比例极低,测序数据量大,测序成本高,因此线粒体基因组的甲基化分析受限。如果要使用该方法对线粒体基因组进行全基因组甲基化测序,则需要单独对线粒体进行分离提纯,才能得到较纯的线粒体基因组,操作过程繁杂冗长,需要的样本量非常大。现有的线粒体基因组研究方法一般是两种方案:1、分离线粒体,再提取核酸,缺点包括需要的样本量非常大、通常还是会有少量核基因组的污染;2、提取总核酸,其中包含核基因组和线粒体基因组,再通过pcr或者探针法捕获线粒体基因组dna,缺点是步骤复杂,成本高。技术实现要素:针对上述线粒体基因组研究方法必须要对dna进行分离提纯才能进行甲基化研究等问题,本发明提供一种利用转座酶对染色质开放区和线粒体dna进行甲基化研究的方法。本发明解决技术问题的技术方案为:提供一种利用转座酶对染色质开放区和线粒体甲基化研究的方法,具体包括以下步骤:a、细胞裂解后,采用transposon复合物对染色质进行酶切,得到染色质开放区的dna片段和/或线粒体dna片段;b、对步骤a得到的dna片段进行缺口补平,再进行重亚硫酸盐转化,然后用含illuminaadaptor序列的引物对重亚硫酸盐转化后得到的染色质开放区的dna和/或线粒体dna进行pcr扩增,得到用于illumina测序的文库,经illumina测序后与参考基因组比对,得到甲基化修饰的胞嘧啶位点,即5mc位点。其中,上述利用转座酶对染色质开放区和线粒体甲基化研究的方法中,步骤a中所述的transposon复合物为接头1、2与tn5转座酶孵育而成。其中,上述利用转座酶对染色质开放区和线粒体甲基化研究的方法中,步骤a中所述的transposon复合物的制备方法为,将核苷酸序列为seqidno:1所示的接头1与seqidno:2所示的接头2溶解后,在pcr仪中进行孵育,得到退火成双链的接头,再加入tn5转座酶,室温孵育,得到transposon复合物。进一步的,上述利用转座酶对染色质开放区和线粒体甲基化研究的方法中,所述的接头1的核苷酸序列为seqidno:1所示的序列,c全部为甲基化修饰c(tcgtcggcagcgtcagatgtgtataagagacag,其中,c:5-甲基胞嘧啶)。seqidno:1:5’-tcgtcggcagcgtcagatgtgtataagagacag其中,上述利用转座酶对染色质开放区和线粒体甲基化研究的方法中,步骤a中所述的接头2的核苷酸序列为在seqidno:2的基础上5’磷酸化修饰,3’双脱氧胞苷酸修饰后得到的序列(pctgtctcttatacaddc,p:磷酸化,ddc:双脱氧胞苷酸)。seqidno:2ctgtctcttatacac其中,上述利用转座酶对染色质开放区和线粒体甲基化研究的方法中,步骤b中所述的缺口补平的具体操作方法为:用replacementoligo替换seqidno:2,然后利用ampligase和t4dna聚合酶两种酶同时作用补平9bp的缺口。进一步的,上述seqidno:2和seqidno:3的5’端进行磷酸化修饰,seqidno:1和seqidno:3的所有c都进行甲基化修饰。所述的replacementoligo核苷酸序列为在seqidno:3基础上经5’磷酸化修饰,3’倒置脱氧胸苷酸修饰及所有c碱基甲基化修饰而得到的序列(pctgtctcttatacacatctccgagcccacgagacinvtp:磷酸化修饰,c:5-甲基胞嘧啶,invt:反向合成的脱氧胸苷酸)。所述倒置脱氧胸苷酸的含义是:标准反应是3’-5’反应,倒置即是反向合成,反向合成是将核苷酸以5’-3’方向加到dna链上。seqidno:3ctgtctcttatacacatctccgagcccacgagact本发明的有益效果为:本发明提供了一种利用tn5转座酶对染色体开放区和线粒体dna进行甲基化研究的方法,该方法不需要提取核酸,裂解细胞后直接采用tn5转座酶进行酶切,得到染色体开放区和线粒体dna片段;相比现有获得线粒体dna需要进行线粒体dna提取,提取效率低的问题,本发明方法能够降低染色质dna的干扰,提高线粒体dna在测序数据中的比例,(在此基础上,使用重亚硫酸盐(bisulfite)进行处理,可以对染色体部分区域和线粒体基因组的甲基化情况都进行研究。本发明方法可处理微量样本(500-20,0000cells,或1-200ngdna),简化了dna提取操作,减少了测序量,提高了工作效率,降低了研究成本。附图说明图1所示为样品1芯片分析仪的检测结果;图2所示为样品2芯片分析仪的检测结果;图3所示为染色体开放区。具体实施方式本发明提供了一种利用转座酶对染色质开放区和线粒体甲基化研究的方法,具体包括以下步骤:a、细胞裂解后,采用tn5转座酶对染色质进行酶切,得到染色质开放区的dna片段和/或线粒体dna片段;b、对步骤a得到的dna片段进行缺口补平,再进行重亚硫酸盐转化,然后用含illuminaadaptor序列的引物进行扩增,得到可用于illumina测序的文库。具体的,本发明的方法包括以下步骤:a、细胞裂解后,采用transposon复合物对染色质进行酶切,得到染色质开放区的dna片段和/或线粒体dna片段;所述的transposon复合物为接头1、2与tn5转座酶孵育而成,孵育时,将核苷酸序列为seqidno:1所示的接头1与seqidno:2所示的接头2溶解后,在pcr仪中进行孵育,得到退火成双链的接头,再加入tn5转座酶,室温孵育,得到transposon复合物;接头1的核苷酸序列为5’-tcgtcggcagcgtcagatgtgtataagagacag;接头2的核苷酸序列为pctgtctcttatacaddc;b、对步骤a得到的dna片段进行缺口补平,再进行重亚硫酸盐转化,然后用含illuminaadaptor序列的引物进行扩增,得到用于illumina测序的文库,经illumina测序后与参考基因组比对,得到甲基化修饰的胞嘧啶位点,即5mc位点;缺口补平的具体操作方法为:用replacementoligo替换seqidno:2,然后利用ampligase和dna连接酶两种酶同时作用补平9bp的缺口,所述的replacementoligo核苷酸序列为pctgtctcttatacacatctccgagcccacgagacinvt。本发明先利用转座酶进行染色质酶切,得到染色质开放区dna和线粒体dna,再利用重亚硫酸盐测序,可直接进行染色质开放区和线粒体的甲基化研究,简化了工序,提高了线粒体甲基化研究效率。下面通过实施例对本发明的具体实施方式做进一步的解释说明,但不表示将本发明的保护范围限制在实施例所述范围内。实施例中的5×lmbuffer等试剂购至天津强微特公司,实施例所用的其他试剂,未经特别说明的,都可以在市场购买得到。实施例中所用的接头seqidno:1和seqidno:2由生工生物工程(上海)股份有限公司合成,replacementoligo由美国idt公司合成。实施例用本发明方法进行染色质开放区和线粒体dna甲基化研究一、制备transposon复合物具体操作步骤如下:1、用tebuffer分别溶解接头1和2,序列分别为seqidno:1和seqidno:2,向200μlpcr管中分别加入10μl接头1(seqidno:1)和10μl接头2(seqidno:2)(浓度均为100μm)。2、在pcr仪中进行孵育,在缓冲液中利用适当的温度使互补的单链结合成双链,得到退火成双链的接头,反应程序和条件如下表1所示:表1退火孵育条件循环数变性退火梯度降温至26℃维持195℃,3min70℃,3min2-4670℃,30s-1℃/循环,30s4725℃,维持3、取步骤2得到的退火的接头4μl,加无核酸酶的h2o稀释至10μm,加入等体积的甘油,取出10μl接头和甘油复合物,然后加10μltn5转座酶,反复吹打20次混匀。4、室温孵育(20-30℃,放在实验台上即可)30min,得到transposon复合物,-20℃保存备用。二、细胞收集1、制备单细胞悬液或收集培养细胞,用计数板或自动细胞计数仪进行细胞计数,按照细胞数/ml计算所需要的培养液体积或单细胞悬液体积。2、收取完整细胞5,00-200,000个,500×g,4℃离心5min。弃去上清,用预冷的pbs50μl清洗细胞,500×g离心5min。弃去上清,用50μl预冷的裂解液将细胞重悬,立即500×g,4℃离心10min。弃上清,离心后的细胞沉淀备用。三、用transposon复合物进行酶切及dna纯化1、确保离心后的细胞沉淀始终置于冰上。2、转座反应体系配置:10μl反应缓冲液(5×lmbuffer,天津强微特)2.5μltransposon复合物37.5μlnuclease-freeh2o.3、用第2步配置的转座反应体系重悬离心后的细胞沉淀。4、将离心后的细胞沉淀中加入transposon复合物,在37℃金属浴中孵育30-40min,每10min轻轻混匀一次,transposon复合物中的tn5转座酶对染色质进行酶切,得到染色质开放区的dna片段和/或线粒体dna片段。5、上述酶切反应结束后,马上用qiagenminelutepcrpurificationkit纯化染色质开放区的dna片段和/或线粒体dna片段。纯化过程的具体操作按试剂盒说明书进行。6、将纯化后的染色质开放区的dna和/或线粒体dna用10μleb缓冲液(minelutekit中提供,包含10mmtris·cl,ph8)洗脱。7、将上述洗脱的染色质开放区的dna和/或线粒体dna冻存至-20℃备用。四、缺口补平反应上述步骤中采用transposon复合物酶切时,会留下一个9bp的缺口,用replacementoligo(序列如seqidno:3所示替换adaptor中的15bp互补链seqidno:2,然后补平9bp的缺口)。具体操作过程如下:1、配置酶反应体系(20μl体系)用枪头反复吹打混匀。2、将步骤1配置的酶反应体系置于pcr仪中,进行置换反应使seqidno:2从模板dna链上解离,replacementoligo与模板dna链结合,即接头替换:反应条件如下表2所示:表2置换反应条件3、反应完成后,向反应混合物中加入缺口补平需要的酶:t4dna聚合酶0.5μlampligase1.25μl反复吹打混匀。4、将反应体系再次置于pcr仪中进行缺口补平反应,反应条件如下表3所示:表3缺口补平反应条件循环数缺口补平维持137℃,30分钟4℃,维持5、缺口补平后纯化用qiagenminelutepcrpurificationkit纯化,按试剂盒说明书操作,用10μleb缓冲液或无核酸酶h2o洗脱染色质开放区的dna片段和/或线粒体dna片段。五、重亚硫酸盐转化(用zymoezdnamethylation-directtmkit)1、使用上述洗脱得到的染色质开放区的dna片段和/或线粒体dna片段,取20μl染色质开放区的dna片段和/或线粒体dna片段,加入130μlct转化试剂(试剂盒中成分之一)。如果dna体积不足20μl,用水补至20μl。2、将pcr管置于pcr仪中,进行以下反应:(1)98℃,8分钟(2)64℃,3.5小时(3)4℃保持.3、向zymo-spinic柱中加入600μlm-binding缓冲液(试剂盒成分),并将柱子放入试剂盒提供的收集管中。4、将第二步反应得到的样品吸入含m-binding缓冲液的zymo-spinic柱中,盖上管盖,将柱子上下颠倒混匀几次。5、用最大离心速度离心30秒(>10000xg),弃去流穿液。6、向柱子中加入100μlm-wash缓冲液,最大离心速度离心30秒。7、向柱子中加入200μlm-desulphonation缓冲液,室温下(20-30℃)放置15-20min。孵育完成后,最大离心速度离心30秒。8、向柱子中加入200μlm-wash缓冲液,最大离心速度离心30秒。弃流穿液后再重复此操作一次。9、将柱子放入新的1.5ml离心管,将10μlm-elution缓冲液加至柱基质上,最大离心速度离心30秒以洗脱dna。重亚硫酸盐转化后得到的染色质开放区的dna和/或线粒体dna可以马上用于pcr扩增进行分析检测,也可以冻存于-20℃或-70℃或更低温度。扩增时一次pcr反应的量推荐使用1-4μl洗脱的dna,也可以用10μldna或者更大体积的dna作为模板,但小体积洗脱可以得到更高浓度的dna,因此,尽量选择1-4μl的洗脱的dna作为模板。六、pcr扩增用含illuminaadaptor序列的引物对染色质开放区dna和/或线粒体dna进行pcr扩增,引物序列如seqidno:4和seqidno:5所示。pcr引物1:tn5mcp1aatgatacggcgaccaccgagatctacactcgtcggcagcgtc(seqidno:4)带标签的pcr引物2:tn5mcbarcaagcagaagacggcatacgagatggatgttctgtctcgtgggctcgg(seqidno:5)1、向0.2mlpcr管中加入以下反应体系(25μl体系):10μlconverteddna0.75μl10μmtn5mcp10.75μl10μmtn5mcbar12.5μlkapa2grobusthotstartreadymix(2×)1μlnuclease-freeh2opcr反应程序:3分钟95℃12-15循环数:30秒95℃30秒62℃1分钟72℃.1分钟72℃七、pelabchip检测文库片段大小按照pelabchip标准操作流程进行操作。染色质开放区dna和/或线粒体dna片段在200-2000bp,主峰为190bp左右和380bp左右认为文库质量较好。质检合格的文库按照illumina二代测序常规方法进行qpcr定量,以合适的比例混合后上机测序,对测得的数据进行生物信息学分析,从而获得染色质开放区dna和/或线粒体dna序列,并进行甲基化分析,结果如图1、2所示。图1所示为样品1芯片分析仪的检测结果。由图1可知:样品经过tn5酶切及重亚硫酸盐转化后,pcr建库得到的文库片段主要集中在180bp和360bp,符合文库测序要求,说明实验成功。图2所示为样品2芯片分析仪的检测结果。由图2可知:样品2得到与样品1类似的结果,文库符合测序要求,说明实验重复性很好。八、qpcr对文库进行定量(采用kapakk4923进行,操作见说明书)根据qubit定量的结果,对样品进行适当的稀释,通常稀释1000倍,2000倍和10000倍、20000倍,然后通过标准曲线计算每个文库的浓度。对稀释后的样品进行qpcr定量。根据定量结果吸取适量的样品进行上机测序。参考kapa说明书进行操作。九、用illuminanextseq500对文库进行测序将带不同条形码的多个文库进行混合(通常8-10个),根据每个样本需要的数据量和每个样本对应的文库浓度取适量样本混合,具体操作参考illuminanextseq500文库制备及上机测序操作手册。图3表示测到的染色体开放区,最上方表示1号染色体部分区域,中间部分表示染色体开放区,最下方表示的是基因名称。由图3可知:本发明可以成功检测染色体开放区,可以在进行线粒体甲基化研究的同时,从基因组表观遗传学水平进行研究。本发明还以线粒体基因组1209位点为例,采用本发明方法进行了分析,结果表明,经过重亚硫酸盐测序后,该位点约3%的c仍然为c,97%的c转化为t,认为该位点约3%的c存在甲基化修饰,即甲基化率为3%。该图说明我们的实验方法可以成功用于线粒体5mc甲基化位点的检测及其甲基化水平的计算。我们检测到的线粒体甲基化水平与之前文献报道一致,大部分位点甲基化率低于3%。序列表<110>四川大学<120>利用转座酶对染色质开放区和线粒体甲基化研究的方法<130>a180018k<160>5<170>siposequencelisting1.0<210>1<211>33<212>dna<213>人工序列(artificialsequence)<400>1tcgtcggcagcgtcagatgtgtataagagacag33<210>2<211>15<212>dna<213>人工序列(artificialsequence)<400>2ctgtctcttatacac15<210>3<211>35<212>dna<213>人工序列(artificialsequence)<400>3ctgtctcttatacacatctccgagcccacgagact35<210>4<211>43<212>dna<213>人工序列(artificialsequence)<400>4aatgatacggcgaccaccgagatctacactcgtcggcagcgtc43<210>5<211>48<212>dna<213>人工序列(artificialsequence)<400>5caagcagaagacggcatacgagatggatgttctgtctcgtgggctcgg48当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1