5‑醛基胞嘧啶的标记方法及其在单碱基分辨率测序中的应用与流程

文档序号:11702346阅读:481来源:国知局
5‑醛基胞嘧啶的标记方法及其在单碱基分辨率测序中的应用与流程
本发明涉及5-醛基胞嘧啶的标记
技术领域
,特别是涉及5-醛基胞嘧啶的标记方法及其在单碱基分辨率测序中的应用。
背景技术
:dna甲基化与去甲基化研究是表观遗传学领域最为重要的研究内容之一。基因调控区的甲基化与去甲基化调控关系到下游基因的表达激活与抑制,从而参与相应的生物学过程。在哺乳动物中,dna的甲基化主要发生在胞嘧啶的5号位上形成5-甲基胞嘧啶(5-methylcytosine,5mc)。5mc的去甲基化过程是通过tet(ten-eleventranslocation)家族蛋白的氧化完成的:5mc被氧化逐步产生5-羟甲基胞嘧啶(5-hydroxymethylcytosine,5hmc)、5-醛基胞嘧啶(5-formylcytosine,5fc)和5-羧基胞嘧啶(5-carboxylcytosine,5cac),并通过碱基切除修复通路切除5fc及5cac实现dna的去甲基化过程(mamtatahiliani,etal.,science,2009,324:931-935;skirmantaskriaucionisandnathanielheintz,science,2009,324:929-930;tonipfaffeneder,etal.,angewandtechemieinternationaledition,2011,123:7146–7150;shinsukeito,etal.,science,2011,333:1300-1303;yufeihe,etal.,science,2011,333:1303-1307)。为了研究这一类表观遗传修饰碱基的生物学功能,了解其在基因组中的分布区域和具体序列信息是重要前提。成熟的dna甲基化分析方法有亚硫酸氢钠测序方法(bisulfitesequencing),可以鉴定出单碱基分辨率的5mc序列信息。通过亚硫酸氢钠的处理,基因组中的普通的胞嘧啶c转变为尿嘧啶u,通过聚合酶链式反应(polymerasechainreaction,pcr)扩增并测序读取为胸腺嘧啶t;而5mc由于5号位供电子效应的甲基存在,使得亚硫酸氢钠处理过程难以发生脱氨基化转变,因而在pcr扩增和测序过程中仍旧读取c(michaelj.booth,etal.,science,2012,336:934-937.)。在dna的甲基化之外,5hmc、5fc及5cac作为能稳定存在于基因组中的修饰碱基,也可能存在特有的生物学功能,因此确定这三种胞嘧啶衍生物在基因组中的分布信息对于探索其功能至关重要。但5hmc、5fc及5cac的发现使得亚硫酸氢钠测序变得更为复杂。如在正常亚硫酸氢钠测序过程中,5hmc会对亚硫酸氢盐处理有抵抗力,因此会被读取为c,而5fc和5cac均读取为t(michaelj.booth,etal.,science,2012,336:934-937)。为了区分这些胞嘧啶衍生物,需要发展新的单碱基分辨率测序技术来鉴定这些新修饰碱基在基因组中的位置。目前已有一些针对5-醛基胞嘧啶相关化学反应的研究,这些研究主要着眼于5fc胞嘧啶环上5号位醛基。基于醛基能够与羟胺化合物的氨基反应生成肟,研究人员设计了针对5fc醛基的反应(shinsukeito,etal.,science,2011,333:1300-1303;eun-angraiber,etal.,genomebiology,2012,13:r69;chunxiaosong,etal.,cell,2013,153:678–691),并将其应用于检测基因组中5fc的位置;利用醛基与氨基的反应发展了荧光基团标记5fc的方法(jianlinhu,etal.,chemistry-aeuropeanjournal,2013,19:5836-5840);利用nabh4将醛基还原为羟甲基从而使5fc还原为5hmc,并在亚硫酸氢钠测序过程中5fc位点转变读取为c,也可在特定区域鉴定出5fc碱基的位置(chunxiaosong,etal.,cell,2013,153:678–691;michaelj.booth,etal.,naturechemistry,2014,6:435-440)。遗憾的是,这些方法都不适用于单细胞基因组中5fc的检测。因此,需要发展一种新的高生物兼容性、高灵敏度的单细胞水平的5fc标记和检测方法,这对进一步推进dna主动去甲基化的研究具有关键作用,同时对于表观遗传在临床检测和疾病诊疗方面的研究(例如胚胎、癌细胞等)也具有重要意义。目前在单细胞水平上进行对dna表观遗传学修饰的测序技术主要集中于5mc及5hmc。单细胞5mc测序技术基于亚硫酸氢钠处理(hongshanguo,etal.,genomeresearch,2013;sebastienasmallwood,etal.,naturemethods,2014;matthiasfarlik,etal.,cellreports,2015)。通过对亚硫酸氢钠处理与建库流程进行优化,可以稳定检测到约18%的cpg位点(sebastienasmallwood,etal.,naturemethods,2014)。因为单细胞基因组中5fc的含量相比5mc非常低,且亚硫酸氢钠处理会对dna造成较大的损伤,导致大量dna降解,所以基于亚硫酸氢钠处理的测序技术并不适合单细胞基因组中5fc的测定;因此,寻找一种适用于单细胞基因组中5fc的测序方法是本领域亟待解决的问题。技术实现要素:本发明实施例的目的在于提供一种5-醛基胞嘧啶的标记方法及其在单碱基分辨率测序中的应用,以实现单细胞水平、单碱基分辨率地对dna或rna中的5-醛基胞嘧啶的检测;具体技术方案如下:本发明提供了一种5-醛基胞嘧啶的标记方法,其包括以下步骤:(1)准备dna或rna样品;(2)将dna或rna样品与缓冲溶液、化合物r1-ch2-cn混合,得到标记反应体系;并使其中的化合物r1-ch2-cn与dna或rna分子中的5-醛基胞嘧啶反应,从而实现5-醛基胞嘧啶的标记;反应过程如下:其中,r1为紧邻着ch2基团的吸电子基团,优选为-cn、更优选为-cn;r为与5-醛基胞嘧啶连接的dna或rna分子:所述标记反应体系的ph值为7.5-9。一种优选实施方式中,其中所述标记反应体系的ph值为8-9,优选为8。一种优选实施方式中,其中化合物r1-ch2-cn在所述标记反应体系中的浓度为75-1500mm,优选为75-1000mm,更优选为75-500mm,最优选为150mm。一种优选实施方式中,其中在步骤(2)中,反应条件为:20℃-60℃,优选为30℃-40℃,更优选为37℃下反应12-48小时,优选18-30小时,更优选为20小时。本发明还提供了一种5-醛基胞嘧啶的单碱基分辨率的测序方法,其中,该方法包括以下步骤:(ⅰ)按前述的方法标记dna或rna样品;(ⅱ)将反应完成后的标记反应体系扩增及测序,得到标记后测序结果;(ⅲ)将标记后的测序结果与dna或rna参照序列图谱进行对比,若序列中同一位置的碱基在参照序列图谱中读取为胞嘧啶,在标记后读取为胸腺嘧啶,则确定该位置的碱基为5-醛基胞嘧啶。一种优选实施方式中,其中所述dna或rna样品是痕量样品或从单细胞获得的样品,所述单细胞来源于胚胎干细胞、配子、早期胚胎、癌细胞、神经细胞或血细胞等。一种优选实施方式中,其中步骤(ii)中反应完成后的标记反应体系不经过纯化直接进行扩增。一种优选实施方式中,其中扩增的方法采用malbac或scrrbs扩增方法。本发明还提供了一种dna或rna的扩增体系,其包含前述步骤(ii)中反应完成后的标记反应体系。本发明还提供了一种5-醛基胞嘧啶的单碱基分辨率测序用试剂盒,其包括ph值为7.5-9的缓冲溶液、丙二腈和扩增相关试剂。本发明还提供了一种5-醛基胞嘧啶的定量检测方法,其包括以下步骤:(a)将n个已知的5-醛基胞嘧啶含量不同的模式序列按照前述的测序方法测序并确定c-t转换比例,其中n≥2;所述c-t转换比例为序列中同一位置的碱基标记前读取为胞嘧啶c,标记后读取为胸腺嘧啶t的比例;(b)以5-醛基胞嘧啶含量为横/纵坐标,以c-t转换比例为纵/横坐标绘制标准曲线;(c)按照前述的测序方法对5-醛基胞嘧啶含量未知的dna或rna测序,并确定c-t转换比例;(d)根据步骤(c)中确定的c-t转换比例及步骤(b)中的标准曲线确定5-醛基胞嘧啶含量未知的dna或rna中的5-醛基胞嘧啶含量。本发明利用化合物r1-ch2-cn与5-醛基胞嘧啶的特异性化学反应,实现单细胞、单碱基分辨率的5-醛基胞嘧啶标记。进一步地,利用本发明提供的标记方法,可以对dna或rna样品中的5-醛基胞嘧啶进行测序分析,确定5-醛基胞嘧啶的序列分布信息。由于标记过程中不进行亚硫酸氢钠处理,不会造成dna或rna的损伤;而且丙二腈的处理也不会使得dna或rna降解;进一步地,发明人意外地发现,在对dna或rna中的5-醛基胞嘧啶进行测序分析过程中,反应完成后的标记反应体系可以不经过纯化直接进行扩增,减少了dna的损失;因此本发明提供的5-醛基胞嘧啶测序分析方法可以在单细胞水平上进行,并实现单碱基分辨率水平的测序;使其更适用于多种痕量样品及珍贵生物学样品,例如胚胎干细胞、配子或早期胚胎、癌细胞、神经细胞等。附图说明为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为实施例1中用丙二腈与6种含不同胞嘧啶的9碱基dna序列反应前后的质谱结果图,其中,经丙二腈(malononitrile,m)标记的5fc简称为5fc-m。图2a为实施例2中利用丙二腈标记5-醛基胞嘧啶的结果;图2b为实施例3-12中利用丙二腈标记5-醛基胞嘧啶的结果;图2c为对比例1-4中利用丙二腈标记5-醛基胞嘧啶的结果,图2d为实施例13中利用3-氧代丁腈标记5-醛基胞嘧啶的结果。图3为实施例16中未经纯化与经纯化的丙二腈标记后的反应体系的扩增产物比较结果。图4a及图4b为实施例17中丙二腈标记反应不会降解dna的验证结果。图5为实施例18、19的部分测序对比结果。图6为实施例20绘制的标准曲线。具体实施方式本发明首先提供了一种5-醛基胞嘧啶的标记方法,其包括以下步骤:(1)准备dna或rna样品;(2)将dna或rna样品与缓冲溶液、化合物r1-ch2-cn混合,得到标记反应体系;并使其中的化合物r1-ch2-cn与dna或rna分子中的5-醛基胞嘧啶反应,从而实现5-醛基胞嘧啶的标记;从而实现反应过程如下:其中,r1为紧邻着ch2基团的吸电子基团,优选为-cn、等,更优选为-cn;r为与5-醛基胞嘧啶连接的dna或rna分子:所述标记反应体系的ph值为7.5-9。对于步骤(1)准备dna或rna样品,其可以采用本领域的常规技术来实现,例如可以将一个细胞采用常规方法裂解,得到的dna或rna样品;本发明在此对步骤(1)不进行限定。发明人通过研究意外地发现,当标记反应体系的ph值为7.5-9,优选为ph值为8-9,优选为8时,步骤(2)反应的产率很高,可以达到98%以上。本文中所说的产率指的是在标记反应体系中,5-醛基胞嘧啶与化合物r1-ch2-cn成环反应后的产物的量与反应前5-醛基胞嘧啶的量的比值,再乘以100%。发明人进一步发现,当化合物r1-ch2-cn具体为丙二腈时,标记反应体系中存在同样浓度的丙二腈的情况下,步骤(2)的产率明显高于ph值为7以下的标记反应体系。例如,当丙二腈在标记反应体系中的浓度为150mm,标记反应体系的ph值为7.5-9,优选为ph值为8-9,优选为8时,产率可以达到99%以上,一些具体实施方案中,可以达到99.1%,一些具体实施方案中,可以达到99.2%;一些具体实施方案中,可以达到99.3%;一些具体实施方案中,可以达到99.4%。而当标记反应体系在弱酸性条件下时,产率最多略高于98%。本领域技术人员知道,将产率从98%提升至99%以上是极难实现的。而且在现有技术中,没有报道过将标记反应体系调至弱碱性,可以提高产率,可见本申请取得了意料不到的技术效果。一种具体实施方案中,可以通过将dna样品或rna样品在与化合物r1-ch2-cn反应后进行扩增并测序;并根据测序结果峰图中对应位点的c(胞嘧啶)信号峰高度(hc)及t(胸腺嘧啶)信号峰高度(ht),通过公式:hc/[hc+ht]×100%计算产率。在本发明的一个具体实施方案中,得到标记反应体系的过程可以是将缓冲溶液、含有化合物r1-ch2-cn的水溶液及dna或rna样品混合在一起,从而使标记反应体系的ph值为7.5-9的过程。发明人通过实验发现,当标记反应体系中所加入的化合物r1-ch2-cn及dna或rna样品相对缓冲溶液的体积较小时,所得到的标记反应体系的ph值与所加的缓冲溶液的ph值是基本一致的。也就是说,可以将缓冲溶液的ph值作为标记反应体系的ph值,显然这是合理的。例如,分别配制如表1所示的2ml的50mmnh4ac及10mmtris-hcl缓冲溶液,用醋酸或稀盐酸调整ph至表1(0mm丙二腈一栏)所示。分别加入20μl15m丙二腈水溶液到各缓冲溶液中使丙二腈终浓度达到150mm,涡旋混匀并使用ph计再次测量含有丙二腈的缓冲溶液ph值,如表1(150mm丙二腈一栏)所示。从表1中可以看出,即使向缓冲溶液中加入少量其它物质,也基本不会改变缓冲溶液的ph值。表1.缓冲溶液50mmnh4ac50mmnh4ac50mmnh4ac10mmtris-hcl10mmtris-hcl0mm丙二腈5.06.07.08.09.0150mm丙二腈5.06.06.98.08.9本发明下述各实施例中其它物质的加入量相比缓冲溶液的量较小,发明人经过验证确认,均满足将缓冲溶液的ph值作为标记反应体系的ph值的条件;因此在下述各实施例中将缓冲溶液的ph值作为标记反应体系的ph值。一个具体实施方案中,得到标记反应体系的缓冲溶液可以为tris-hcl缓冲溶液(ph值为7.5-9)。在本发明技术方案的具体实施过程中,发明人意外地发现,标记反应体系中化合物r1-ch2-cn,例如丙二腈的浓度也对产率有影响;并不限于任何理论地得到以下结论:当化合物r1-ch2-cn,例如丙二腈在所述标记反应体系中的浓度为75-1500mm,优选为75-1000mm,更优选为75-500mm,最优选为150mm时,其标记效果,即产率要好于75mm以下或1500mm以上的浓度。需要说明的是,当采用浓度为75-1500mm化合物r1-ch2-cn时,其相对标记反应体系中的5-醛基胞嘧啶是过量的。在得到标记反应体系后,可以使标记反应体系在适宜的温度下进行反应,以使化合物r1-ch2-cn与dna或rna分子中的5-醛基胞嘧啶反应。一个具体实施方案中,使标记反应体系在20℃-60℃,反应12-48小时,优选18-30小时,更优选为20小时。一个具体实施方案中,使标记反应体系在30℃-40℃,反应12-48小时,优选18-30小时,更优选为20小时。一个具体实施方案中,使标记反应体系在37℃下反应12-48小时,优选18-30小时,更优选为20小时。在反应过程中,可以采用一定的混匀方式将化合物r1-ch2-cn及dna或rna样品混匀。例如当dna或rna样品是将一个细胞采用常规方法裂解后所得到的dna或rna样品时,可以采用恒温混匀仪进行混匀孵育。本发明利用化合物r1-ch2-cn与5-醛基胞嘧啶的特异性化学反应,实现了对5-醛基胞嘧啶的标记。不仅如此,由于化合物r1-ch2-cn不会与c,5mc,5hmc,5cac及5fu(5-醛基尿嘧啶)发生反应,因此,本发明提供的标记方法能够特异性的标记5-醛基胞嘧啶。在实现利用化合物r1-ch2-cn特异性地标记5-醛基胞嘧啶的基础上,本发明还提供了一种5-醛基胞嘧啶的单碱基分辨率的测序方法,其包括以下步骤:(ⅰ)按本发明前述的方法标记dna或rna样品;(ⅱ)将反应完成后的标记反应体系进行扩增及测序,得到标记后测序结果;(ⅲ)将标记后的测序结果与dna或rna参照序列图谱进行对比,若序列中同一位置的碱基在参照序列图谱中读取为胞嘧啶,在标记后读取为胸腺嘧啶,则确定该位置的碱基为5-醛基胞嘧啶。所述“dna或rna参照序列图谱”是已经公开的基于现有技术中的测序方法获得的dna或rna样品或基因组的序列信息,本领域技术人员可以通过例如从加州大学圣克鲁兹分校基因组浏览器(ucsc基因组浏览器,ucscgenomebrowser)或genbank获得这些dna或rna参照序列图谱。在所述参照序列图谱中,5-醛基胞嘧啶仍然读取为胞嘧啶。本发明则利用5-醛基胞嘧啶与化合物r1-ch2-cn的反应产物在扩增过程中突变为胸腺嘧啶t,因而测序结果也显示为t。通过与参照序列图谱对比,寻找c-t的突变位点,可鉴定出5-醛基胞嘧啶的单碱基分辨率序列信息。需要说明的是,在本发明中,所采用的扩增及测序方法,均为本领域的现有技术,例如扩增可以常用的pcr方法,也可以采用适于单细胞的malbac(multipleannealingandloopingbasedamplificationcycles,多次退火环状循环扩增技术)或scrrbs(single-cellreducedrepresentativebisulfitesequencing,单细胞简化代表亚硫酸氢盐测序)扩增技术来实现。而测序则可以采用本领域的常规技术来进行。例如可以采用:1)第一代双脱氧碱基法测序,可利用商业化测序平台包括abi公司一代测序平台系列仪器;2)第二代高通量测序技术,可利用的商业化测序平台包括:illumina公司系列测序平台,包括但不限于miseq,hiseq2000,hiseq2500,nextseq500,hiseqx等;roche公司焦磷酸测序法测序平台,如但不限于gsflx;abi公司的solid测序平台,如但不限于solid5500;3)第三代单分子测序技术,可利用商业化测序平台包括:pacificbioscience公司的smrt测序平台,如但不限于smrtrsii;oxfordnanoporetechnologies公司的纳米孔单分子测序平台,如mniion平台;helicosbiosciences公司的heliscope平台。需要说明的是,从细胞中获得dna或rna样品的方法为本领域的常规技术,本发明在此不进行详述。一种具体实施方案中,所述dna或rna样品是痕量样品或从单细胞获得的样品,所述单细胞来源可以是但不限于胚胎干细胞、配子、早期胚胎、癌细胞、神经细胞或血细胞等。基于本发明提供的5-醛基胞嘧啶的单碱基分辨率的测序方法,本发明还提供了一种5-醛基胞嘧啶的单碱基分辨率测序用试剂盒,其包括ph值为7.5-9、优选8-9、更优选为8的缓冲溶液、丙二腈和扩增相关试剂,所述扩增相关试剂可以理解为:实现扩增所需要的各种物质的和,例如可以包括聚合酶、引物、dntp、缓冲液、水等与dna或rna扩增相关的物质,但是不包括扩增对象,例如dna或rna分子;具体物质的选择可以由本领域技术人员根据需要确定,本发明在此不进行详述。发明人在实验过程中意外地发现,在按本发明提供的方法标记5-醛基胞嘧啶后,其标记反应体系可以直接进行扩增,标记反应体系中所剩余的化合物r1-ch2-cn及其它成分不会影响扩增,甚至有利于扩增;因此,一个具体实施方案中,上述步骤(ii)中标记反应体系不经过纯化可直接进行扩增。由于省去了纯化步骤,因此可以有效避免纯化步骤中造成的dna或rna损失。因此本发明的方法适用于dna或rna量很少的样品,例如来源于单细胞的dna或rna样品的检测。基于此,本发明还提供了一种dna或rna的扩增体系,其包含前述5-醛基胞嘧啶的单碱基分辨率的测序方法中步骤(ii)中反应完成后的标记反应体系。基于本发明提供的单碱基分辨率的测序方法,本发明还提供了一种5-醛基胞嘧啶的定量检测方法,其包括以下步骤:(a)将n个已知的5-醛基胞嘧啶含量不同的模式序列按照前述的测序方法测序并确定c-t转换比例,其中n≥2,优选n≥3,更优选n≥5;所述c-t转换比例为序列中同一位置的碱基标记前读取为胞嘧啶c,标记后读取为胸腺嘧啶t的比例;(b)以5-醛基胞嘧啶含量为横/纵坐标,以c-t转换比例为纵/横坐标绘制标准曲线;(c)按照前述的测序方法对5-醛基胞嘧啶含量未知的dna或rna测序,并确定c-t转换比例;(d)根据步骤(c)中确定的c-t转换比例及步骤(b)中的标准曲线确定5-醛基胞嘧啶含量未知的dna或rna中的5-醛基胞嘧啶含量。本文中,所述模式序列是一段天然的或人工合成的dna或rna序列,序列中各位点的碱基及其修饰碱基是已知的或预先设计的。一个具体实施方案中,5-醛基胞嘧啶含量可以为5-醛基胞嘧啶占所有胞嘧啶的比例,具体可以是百分含量,可以用5fc/c表示;下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。以下实施例所涉及的模式dna序列如表2所示。表2实施例1以丙二腈为例,测定化合物r1-ch2-cn标记5-醛基胞嘧啶的特异性使用从glenresearch公司购买的亚磷酸酰胺单体以及expetidedna/rna固相合成仪化学合成含有单个位点修饰为5fc,5mc,5hmc,5cac,c以及5-醛基尿嘧啶(5fu)的9碱基模式dna序列(oligoidno.1-6),按照说明进行脱保护并纯化,纯化后的模式序列使用乙醇沉淀进行进一步纯化。向1.5mleppendorf管中加入4μg纯化后的模式序列,再加入100mmtris-hcl(ph8.0)10μl,1.5m丙二腈水溶液10μl,加水补齐使标记反应体系体积为100μl,标记反应体系中的丙二腈含量为150mm。反应在eppendorfthermomixer中以37℃,850rpm混匀孵育20小时。反应完成后用乙醇沉淀纯化经标记的模式dna序列,并使用bio-radspin-6柱进行进一步脱盐纯化。使用maldi-tof(abi,7500)对纯化后的dna进行质谱检测。质谱结果如图1所示:化合物丙二腈与含有5fc的模式dna序列反应后,模式dna的相对分子质量增加了49.0,与计算值吻合,说明丙二腈能够与模式dna序列上的5fc发生反应。同时,化合物丙二腈与含有c,5mc,5hmc,5cac及5fu的模式序列反应后,模式dna的相对分子质量没有发生变化,说明丙二腈不能与c,5mc,5hmc,5cac及5fu反应。以上结果说明化合物丙二腈能够特异性的标记5fc。对于其它的化合物r1-ch2-cn,也可以得到同样的结论,本发明在此不进行赘述。实施例2-12丙二腈标记含5-醛基胞嘧啶的模式序列并测序实施例2使用从glenresearch公司购买的亚磷酸酰胺单体以及expetidedna/rna固相合成仪化学合成含有单个位点修饰为5fc的76碱基模式dna序列(oligoidno.7),按照说明进行脱保护并纯化,纯化后的模式序列使用乙醇沉淀进行进一步纯化。向1.5mleppendorf管中加入1μg纯化后的模式序列,再加入100mmtris-hcl(ph8.0)2μl,1.5m丙二腈水溶液2μl,加水补齐使标记反应体系体积为20μl,标记反应体系中的丙二腈含量为150mm。反应体系在避光的条件下,在eppendorfthermomixer(恒温混匀仪)中以37℃,850rpm混匀孵育20小时。标记完成后,向20μl反应混合液中直接加入25μl2xmightyampbuffer(takara)并混匀,加入2μl正向及反向引物(引物序列如表3所示),1μlmightyampdnapolymerase(takara)使体系终体积为50μl并进行pcr扩增。使用测序引物(引物序列如表3所示)用sanger测序检测扩增出的单一条带产物。使用snapgene软件测量测序结果峰图中对应位点的c(胞嘧啶)信号峰高度(hc)及t(胸腺嘧啶)信号峰高度(ht),根据公式hc/[hc+ht]×100%计算产率;如图2a所示,从图2a中可知,hc=0.16,ht=25.28,产率=hc/[hc+ht]×100%=99.4%。表3实施例3-12改变tris-hcl缓冲溶液的ph值及标记反应体系中丙二腈的浓度后,按照实施例2的方法利用丙二腈标记5-醛基胞嘧啶,所改变的具体值及所得到的产率见表4及图2b。对比例1-4将缓冲溶液的ph值调至弱酸性后,按照实施例2的方法利用丙二腈标记5-醛基胞嘧啶,所改变的具体值及所得到的产率见表4及图2c。表4注:对比例3中的缓冲溶液为nh4ac缓冲溶液;对比例4中的缓冲溶液为tris-hcl缓冲溶液。实施例133-氧代丁腈标记含5-醛基胞嘧啶的模式序列并测序使用从glenresearch公司购买的亚磷酸酰胺单体以及expetidedna/rna固相合成仪化学合成含有单个位点修饰为5fc的76碱基模式dna序列(oligoidno.7),按照说明进行脱保护并纯化,纯化后的模式序列使用乙醇沉淀进行进一步纯化。向1.5mleppendorf管中加入1μg纯化后的模式序列,再加入100mmtris-hcl(ph7.5)2μl,1.0m3-氧代丁腈水溶液2μl,加水补齐使标记反应体系体积为20μl,标记反应体系中的3-氧代丁腈含量为100mm。反应体系在避光的条件下,在eppendorfthermomixer(恒温混匀仪)中以60℃,850rpm混匀孵育48小时。标记完成后,向20μl反应混合液中直接加入25μl2xmightyampbuffer(takara)并混匀,加入2μl正向及反向引物(引物序列如表3所示),1μlmightyampdnapolymerase(takara)使体系终体积为50μl并进行pcr扩增。使用测序引物(引物序列如表3所示)用sanger测序检测扩增出的单一条带产物。使用snapgene软件测量测序结果峰图中对应位点的c(胞嘧啶)信号峰高度(hc)及t(胸腺嘧啶)信号峰高度(ht),根据公式hc/[hc+ht]×100%计算产率;如图2d所示,从图2d中可知,hc=0.41,ht=25.12,产率=hc/[hc+ht]=98.4%。实施例14将实施例2中的反应温度调整为20℃,反应时间调整为48小时后,按照实施例2的方法利用丙二腈标记5-醛基胞嘧啶,所得到的产率为:98.7%实施例15将实施例2中的反应温度调整为60℃,反应时间调整为12小时后,按照实施例2的方法利用丙二腈标记5-醛基胞嘧啶,所得到的产率为:99.0%。实施例16以丙二腈为例,测定化合物r1-ch2-cn标记后的反应体系不纯化有利于dna扩增使用从glenresearch公司购买的亚磷酸酰胺单体以及expetidedna/rna固相合成仪化学合成含有单个位点修饰为5fc的76mer模式dna序列(oligoidno.7),按照说明进行脱保护并纯化,纯化后的模式序列使用乙醇沉淀进行进一步纯化。向1.5mleppendorf管中加入20ng纯化后的模式序列,再加入100mmtris-hcl(ph8.0)4μl,1.5m丙二腈水溶液4μl,加水补齐使标记反应体系体积为40μl,标记反应体系中的丙二腈含量为150mm。反应体系在避光的条件下,在eppendorfthermomixer中以37℃,850rpm混匀孵育20小时。标记完成后,取出一半反应液(20μl)使用vistechdna纯化回收试剂盒进行纯化,作为纯化后样品组。剩余的另一半反应液作为纯化前组。向纯化前及纯化后组里加入25μl2xmightyampbuffer(takara)并混匀,加入2μl正向及反向引物(引物序列如表3所示),1μlmightyampdnapolymerase(takara)使体系终体积为50μl并进行扩增。每当完成1、3、5、7、9、11及13各扩增循环后暂停扩增,混匀后取出2.5μl扩增样品保留,并继续扩增直至15个扩增循环。凝胶电泳分析经过不同循环数扩增后的样品的相对含量;结果如图3所示。从图3中可以看出,随着扩增循环数的增加,纯化前及纯化后组的扩增产物相对含量均增高。纯化前组进行5循环扩增后已经可以明显看到扩增产物条带,而纯化后组进行5循环扩增后无可见扩增产物条带;在进行到15循环扩增后,纯化前组的扩增产物量明显高于纯化后组。以上结果说明丙二腈标记体系无需进行纯化即可进行扩增,相比较纯化后的对照组可以使用更少的循环数扩增出所需产物,也可以使用相同扩增循环数扩增出更多的所需产物。因此不需要纯化的丙二腈标记反应更有利于dna的扩增。对于其它的化合物r1-ch2-cn,也可以得到同样的结论,本发明在此不进行赘述。实施例17以丙二腈为例,测定化合物r1-ch2-cn标记反应不会降解dna向1.5mleppendorf管中加入1μg经乙醇沉淀纯化后的模式序列(oligoidno.7),再加入100mmtris-hcl(ph8.0)5μl,1.5m丙二腈水溶液5μl,用水补齐使标记反应体系体积为50μl,标记反应体系中的丙二腈含量为150mm;作为丙二腈处理组。向1.5mleppendorf管中加入1μg乙醇沉淀纯化后的模式序列(oligoidno.7),10mmtris-hcl(ph8.0),终体积50μl,作为未处理组。反应体系在避光的条件下在eppendorfthermomixer中以37℃,850rpm混匀孵育0、12,20及36小时。取出5μl反应后的样品通过凝胶电泳进行相对含量的测定,结果如图4a所示。未进行孵育的dna作为对照组,从图4a中可以看出,处理组与未处理组在0、12、20及36小时后均具有与对照组同样的条带大小及浓度,同时没有观察到小片段的产生(图4a)。向1.5mleppendorf管中加入1μg小鼠胚胎干细胞基因组dna,10mmtris-hcl(ph8.0)以及150mm丙二腈,反应体系终体积为50μl,作为丙二腈处理组。向1.5mleppendorf管中加入1μg小鼠胚胎干细胞基因组dna,10mmtris-hcl(ph8.0),终体积50μl,作为对照组。反应体系在避光的条件下在eppendorfthermomixer中以37℃,850rpm混匀孵育0、12,20及36小时。孵育完成后,加入1μg糖原(invitrogen),5μl醋酸钠(ph5.4)及168μl冰上预冷的无水乙醇进行乙醇沉淀纯化。纯化后使用nanodrop测量并计算基因组dna的回收率,结果如图4b所示。从图4b中可以看出,处理组与对照组在进行0、12、20及36小时孵育后均具有基本一致的基因组dna回收率,说明丙二腈处理不会造成基因组dna的损失。对于其它的化合物r1-ch2-cn,也可以得到同样的结论,本发明在此不进行赘述。实施例18丙二腈标记5-醛基胞嘧啶对接malbac单细胞扩增技术实现单细胞单碱基分辨率全基因组5fc的检测在显微镜下,挑起一个小鼠胚胎干细胞并移至4μl裂解液(20mmtris,ph8.0,2mmedta,20mmkcl,0.3%triton-x100)中,向裂解液中加入20单位蛋白酶,并在50℃孵育3小时以裂解细胞。向5μl的单细胞裂解液中加入0.5μl1.5m化合物丙二腈,再加入15μl矿物油液封。反应体系在避光的条件下37℃,850rpm摇晃(eppendorf,thermomixer)孵育20小时以标记单细胞基因组中的5-醛基胞嘧啶。标记后的dna可以使用malbac单细胞基因组扩增技术进行扩增(引物序列如表5所示):对于标记后的单细胞裂解液,需要进行11轮预扩增以及15轮指数扩增,可以获得500ng到1μg的扩增产物。在扩增过程中,被标记的5-醛基胞嘧啶会被读取为胸腺嘧啶t,因此可以用于单碱基分辨率的5-醛基胞嘧啶检测。扩增产物使用nebnextultradnalibraryprepkit试剂盒进行建库并使用illuminahiseq平台进行测序。将测序结果与参考基因组(从ucsc基因组浏览器(ucscgenomebrowser)或genbank获得)进行比较,部分比较结果如图5所示,从图5中可以看出,不含5fc的位点与参考基因组完全匹配;含有5fc的位点相比参考基因组发生转换,即在参考基因组中显示为c,在测序所得数据中显示为t。该结果表明这一位点为5fc。此外,由于参考基因组中也标明了基因的位置,因此5fc在基因组上的具体位置也同时获得。图5中,5fc信号图中每一条黑色竖线代表一个检测到的5fc位点;对于magi2基因(起始位点以倒三角标注),在其左侧的启动子区域(图中magi2基因的左侧方框)内,含有一个5fc位点。表5实施例19丙二腈标记5-醛基胞嘧啶与scrrbs技术结合实现单细胞单碱基分辨率的简化表达5fc检测在显微镜下,挑起一个小鼠胚胎干细胞并移至4μl裂解液中(20mmtris,ph8.0,2mmedta,20mmkcl,0.3%triton-x100),向裂解液中加入20单位蛋白酶,并在50℃孵育3小时以裂解细胞。向单细胞裂解液中加入9udpnii(neb),并37℃孵育3小时。加入5uklenowpolymerase(3’-5’exo-,fermentas),37℃孵育30分钟,65℃孵育20分钟失活。加入接头序列及接头序列互补链(序列如表6所示)及30u高浓度t4dna连接酶(fermentas),10℃连接过夜(至少8小时)并60℃孵育30分钟失活。此时单细胞裂解液体系为9μl,加入1μl1.5m化合物丙二腈,再加入15μl矿物油液封。反应体系在避光的条件下37℃,850rpm摇晃(eppendorf,thermomixer)孵育20小时以标记单细胞基因组中的5-醛基胞嘧啶。标记后的单细胞裂解液使用mightyampdna聚合酶(takara)进行扩增(扩增引物如表6所示):经过35轮指数扩增后约可获得500ng到1μg扩增产物。凝胶电泳分离纯化合适的片段(~200-700bp),纯化除掉多余的接头后使用illuminahiseq4000进行测序。将测序结果与参考基因组(从ucsc基因组浏览器(ucscgenomebrowser)或genbank获得)进行比较,结果与实施例18相同(如图5所示)。表6实施例20在50μl反应体系中加入100ng模式序列(模式序列由序列相同含有或不含5fc的序列组成,6组平行的反应体系中分别含有0%、20%、40%、60%、80%、100%的含有5-醛基胞嘧啶的序列,序列如表7所示)、1.5m化合物丙二腈水溶液5μl、100mmtris-hcl(ph8.0)5μl,用水补齐至50μl。反应体系在避光的条件下,37℃,850rpm摇晃(eppendorf,thermomixer)孵育20小时以标记5-醛基胞嘧啶。标记后的单细胞裂解液使用mightyampdna聚合酶(takara)进行扩增。扩增产物使用nebnextultradnalibraryprepkit试剂盒进行建库并使用illuminahiseq4000平台进行测序。通过统计含有不同修饰比例的模式序列中观察到的c-t转变比例确定标准曲线,如图6所示。在50μl反应体系中加入100ng5fc含量为50%的测试序列(序列为含5fc模式序列与不含5fc模式序列1:1混合,序列如表7所示)、1.5m化合物丙二腈5μl、100mmtris-hcl(ph8.0)5μl,用水补齐至50μl。反应体系在避光的条件下37℃,850rpm摇晃(eppendorf,thermomixer)孵育20小时以标记5-醛基胞嘧啶。标记后的单细胞裂解液使用mightyampdna聚合酶(takara)进行扩增。扩增产物使用nebnextultradnalibraryprepkit试剂盒进行建库并使用illuminahiseq4000平台进行测序。将测序结果与模式序列进行比较,统计结果显示5fc对应位点t读数(nt)与c、t两种碱基总读数(nc+nt)的为:nt/(nc+nt)*100%=38%,代入图6中标准曲线中拟合方程:y=69.5*x+2.468中,其中x为5fc的含量,y为所测到nt/(nc+nt)值。计算5fc含量:5fc%=[nt/(nc+nt)–2.468]/69.5*100%=(38-2.468)/69.5*100%=51.1%。表7以上对本发明所提供的5-醛基胞嘧啶的标记方法及其在单碱基分辨率测序中的应用进行了详细介绍。本文中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其中心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。序列表<110>北京大学<120>5-醛基胞嘧啶的标记方法及其在单碱基分辨率测序中的应用<130>pp179876<160>11<170>patentinversion3.5<210>1<211>76<212>dna<213>人工序列<220><221>5-醛基胞嘧啶<222>(38)..(38)<400>1cctcaccatctcaaccaatattatattacgcgtatatcgcgtatttcgcgttataatatt60gagggagaagtggtga76<210>2<211>27<212>dna<213>人工序列<400>2cctcaccatctcaaccaatattatatt27<210>3<211>80<212>dna<213>人工序列<400>3ctccgacattatcactaccatcaaccacccatcctacctggactacattcttattcagta60ttcaccacttctccctcaat80<210>4<211>20<212>dna<213>人工序列<400>4ctccgacattatcactacca20<210>5<211>35<212>dna<213>人工序列<220><221>misc_feature<222>(28)..(35)<223>nisa,c,g,ort<400>5gtgagtgatggttgaggtagtgtggagnnnnnnnn35<210>6<211>58<212>dna<213>人工序列<400>6aatgatacggcgaccaccgagatctacactctttccctacacgacgctcttccgatct58<210>7<211>63<212>dna<213>人工序列<400>7gatcggaagagcacacgtctgaactccagtcacatcacgatctcgtatgccgtcttctgc60ttg63<210>8<211>20<212>dna<213>人工序列<400>8aatgatacggcgaccaccga20<210>9<211>21<212>dna<213>人工序列<400>9caagcagaagacggcatacga21<210>10<211>137<212>dna<213>人工序列<220><221>5-醛基胞嘧啶<222>(38)..(38)<400>10cctcaccatctcaaccaatattatattacgcgtatatcgcgtatttcgcgttataatatt60gagggagaagtggtgaatactgaataagaatgtagtccaggtaggatgggtggttgatgg120tagtgataatgtcggag137<210>11<211>137<212>dna<213>人工序列<400>11cctcaccatctcaaccaatattatattacgcgtatatcgcgtatttcgcgttataatatt60gagggagaagtggtgaatactgaataagaatgtagtccaggtaggatgggtggttgatgg120tagtgataatgtcggag137当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1