应用于组织样本中染色体开放结合区域定位的ATAC-seq方法与流程

文档序号:14411662阅读:340来源:国知局

本发明属于免疫检测技术领域,尤其涉及应用于组织样本中染色体开放结合区域定位的atac-seq方法。



背景技术:

近些年来,“大数据”这个词汇已经成为当下最常见的词汇之一,而自从上世纪90年代开始,生物信息学经过多年的发展,已经从最初的dna序列分析和蛋白质序列分析,扩展到生物学的各个领域,使得生物学数据的增长惊人,生物学现在也已经进入了“大数据”时代。

atac-seq技术由atac实验和高通量测序两部分组成,它是分子生物学研究染色质可接近性的技术。该技术在2013年首次被提出,作为mnase-seq、faire-seq和dnase-seq的替代或补充方法。atac-seq实验的关键部分是转座酶tn5对样品基因组dna的作用。atac-seq采用突变的多活性转座酶,允许高效切割暴露的dna和同时连接特定序列的接头。分离接头连接的dna片段,通过pcr扩增后用于高通量测序。



技术实现要素:

有鉴于此,本发明提供一种解决或部分解决上述问题的应用于组织样本中染色体开放结合区域定位的atac-seq方法。

为达到上述技术方案的效果,本发明的技术方案为:应用于组织样本中染色体开放结合区域定位的atac-seq方法,包括以下步骤:

步骤一:细胞悬液制备:

制备含有2×106~5×106个细胞的细胞沉淀,将细胞沉淀进行以下处理3次:4℃、500g离心10min,去除上层清液,用预冷的pbs缓冲液洗涤;pbs缓冲液包括:200mmnacl,3mmkcl,1mmmgcl2,1mmcacl2,10mmna2hpo4,2mmkh2po4,0.1wt%吐温-20;pbs缓冲液的ph值为7.4;

步骤二:转座反应与纯化:

加入25ulte缓冲液、2.5ultn5转座酶和22.5uldepc处理水,37℃水浴反应30min;te缓冲液包括:10mmtris-hcl,ph=8.0,1mmedtaph=8.0;depc处理水可选用am9920;

加入2.5ul溴化乙锭溶液,轻轻摇匀15min,4℃、500g离心15min;溴化乙锭溶液10mg/ml溶于水;

加入等体积的氯仿醇溶液,温和混匀后静置10min,取上层清液;氯仿醇溶液的成分包括:tris饱和酚、氯仿、异戊醇,体积比为25:24:1;

加入两倍体积的无水乙醇沉淀得到纯化dna;

步骤三:去除杂质:

在纯化dna中加入washingbuffer,轻度漂洗1~5min;

倒出washingbuffer,加入blockingsolution,静置0.5h;

再加入blockingsolution,静置0.5h;

倒出blockingsolution,加入antibodysolution,静置0.5~1h;

倒出antibodysolution,加入washingbuffer,漂洗15min后倒出washingbuffer,得到纯净dna;

步骤四:pcr扩增:

以纯净dna为模板进行预扩增,预扩增的反应体系共25ul,包括2ul纯净dna,2ul引物a,0.2ultaqdna聚合酶(5u/ul),1uldntps(2.5um),2.5ul10×pcrbuffer,17.3ulh2o;混匀预扩增的反应体系,按照下列步骤进行预扩增:首先,94℃变性2min;然后,按照以下参数扩增30个循环:94℃30sec,56℃30sec,72℃80sec;最后,72℃延伸5min;

以预扩增的产物为模板进行选择性扩增,选择性扩增的反应体系共15ul,包括2ul预扩增的产物,1.2ul引物b,0.12ultaqdna聚合酶(5u/ul),0.6uldntps(2.5um),1.5ul10×pcr,9.58ulh2o;混匀选择性扩增的反应体系,按照下列步骤进行选择性扩增:首先,按照下列参数进行第一轮扩增:94℃2min,94℃30sec,56℃30sec,72℃80sec;然后,每轮的循环温度递减1℃,扩增10轮;最后,再以94℃2min,55℃30sec,72℃80sec扩增30轮;

步骤五:高通量测序:

首先将步骤四的产物用hiseqpe150进行高通量测序得到atac-seq数据;然后将atac-seq数据进行接头过滤后进行读段定位,将得到的读段回填到参考基因组上得到读段回填结果;

步骤六:概率检测:

首先,读取样本的atac-seq数据,并将其比对到参考基因组上,寻找出开放染色质位点富集的特征峰和峰顶点的位置信息;然后,以峰顶点为中心分别向左右两侧延展100bp,延伸后的数据中,每一个dna序列的中心均为峰顶点;最后,将dna序列提取出来并去掉其中重复的序列得到dna短序列,并按照提取的次序对dna短序列编号,dna短序列的编号为由1开始的连续的正整数序列;

然后,统计每个dna短序列内的读段数量和每个dna短序列内的碱基数量;

其次,计算dna短序列的开放概率,用公式一计算:

公式一:

其中,n是dna短序列的个数,为正整数;i是dna短序列的编号,为正整数;δ是dna短序列的开放概率,δi是编号为i的dna短序列的开放概率,δ和δi为0~1之间的实数,没有单位;x是dna短序列内的读段数量,xi是编号为i的dna短序列内的读段数量,x和xi为正整数;y是dna短序列内的碱基数量,yi是编号为i的dna短序列内的碱基数量,y和yi为正整数;

最后,δi的处理方法为:如果δi大于0.5,则编号为i的dna短序列是开放染色质位点;否则,则编号为i的dna短序列不是开放染色质位点

本发明的有益成果为:本发明提供了应用于组织样本中染色体开放结合区域定位的atac-seq方法,包括细胞悬液制备、转座反应与纯化、去除杂质、pcr扩增、高通量测序、概率检测。该方法采用转座酶法进行dna片段化,将繁琐的dna片段化、末端修复和接头连接反应等步骤变为一步简单的酶促反应,缩短实验时间。可以快速的得到调控的多维信息,比其他方法要节省大约3到5个数量级的细胞。实验流程中没有片段选择的步骤,所以这种方法可以同时获得“开放”染色质的位置、转录因子的结合位点、核小体的调控区域和染色质状态等信息。

具体实施方式

为了使本发明所要解决的技术问题、技术方案及有益效果更加清楚明白,以下结合实施例,对本发明进行详细的说明。应当说明的是,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明,能实现同样功能的产品属于等同替换和改进,均包含在本发明的保护范围之内。具体方法如下:

实施例1:本实施例对比了几种开放染色质区域鉴定技术,如下:

目前,可以用来进行开放染色质区域鉴定的技术有:chip-seq,dnase-seq,mnase-seq,faire-seq,atac-seq,这几种技术的片段化和富集方式各有不同。

(1)chip-seq:

可直接检测与转录因子结合的dna序列,但一次测序只能提供一个转录因子的信息。

(2)dnase-seq:

利用dnasei优先切割核小体被取代的dna序列,对生成的片段进行测序,被用于检测特定转录因子的结合位点,但该技术对细胞起始量的要求较高,一般细胞数量要达到106~107,并且实验准备时间较长,需要2-3天。

(3)mnase-seq:

该技术刚好和dnase-seq技术互补,主要利用限制性外切酶进行片段化处理,直到获得被核小体包裹或者被转录因子绑定的区域为止。

(4)faire-seq:

借助有机溶剂甲醛对染色体中裸露的dna进行固定,之后通过酚氯仿抽提获取裸露的dna,实验准备时间长达3-4天。

(5)atac-seq:

可通过tn5转座酶,在切割dna时加入接头序列,经过pcr扩增即可获得测序文库,相比dnase-seq步骤更为简单,需要的细胞也更少(102-105),数小时内即可完成。经过一次atac-seq,您可以获得染色体在某个特定的时空条件下所有开放染色质区域,并不仅仅局限于某个转录因子的结合位点,或者某个特定的组蛋白乙酰化区域。

实施例2:本实施例具体说明了应用于组织样本中染色体开放结合区域定位的atac-seq方法的步骤,包括以下步骤:

步骤一:细胞悬液制备:

制备含有2×106~5×106个细胞的细胞沉淀,将细胞沉淀进行以下处理3次:4℃、500g离心10min,去除上层清液,用预冷的pbs缓冲液洗涤;pbs缓冲液包括:200mmnacl,3mmkcl,1mmmgcl2,1mmcacl2,10mmna2hpo4,2mmkh2po4,0.1wt%吐温-20;pbs缓冲液的ph值为7.4,可用浓盐酸调节ph值;

步骤二:转座反应与纯化:

加入25ulte缓冲液、2.5ultn5转座酶和22.5uldepc处理水,37℃水浴反应30min;te缓冲液包括:10mmtris-hcl,ph=8.0,1mmedtaph=8.0;depc处理水可选用am9920;

加入2.5ul溴化乙锭溶液,轻轻摇匀15min,4℃、500g离心15min;选用的溴化乙锭溶液10mg/ml溶于水;

加入等体积的氯仿醇溶液,温和混匀后静置10min,取上层清液;氯仿醇溶液的成分包括:tris饱和酚、氯仿、异戊醇,体积比为25:24:1;

加入两倍体积的无水乙醇沉淀得到纯化dna;

步骤三:去除杂质:

在纯化dna中加入washingbuffer,轻度漂洗1~5min;

倒出washingbuffer,加入blockingsolution,静置0.5h;

再加入blockingsolution,静置0.5h;

倒出blockingsolution,加入antibodysolution,静置0.5~1h;

倒出antibodysolution,加入washingbuffer,漂洗15min后倒出washingbuffer,得到纯净dna;

步骤四:pcr扩增:

以纯净dna为模板进行预扩增,预扩增的反应体系共25ul,包括2ul纯净dna,2ul引物a,0.2ultaqdna聚合酶(5u/ul),1uldntps(2.5um),2.5ul10×pcrbuffer,17.3ulh2o;混匀预扩增的反应体系,按照下列步骤进行扩增:首先,94℃变性2min;然后,按照以下参数扩增30个循环:94℃30sec,56℃30sec,72℃80sec;最后,72℃延伸5min;引物a是人工合成的两段寡核苷酸序列,需要根据模板dna序列即纯净dna设计出互补的寡核苷酸链做为引物a,不同的细胞对应的不同的引物a;

以预扩增的产物为模板进行选择性扩增,选择性扩增的反应体系共15ul,包括2ul预扩增的产物,1.2ul引物b,0.12ultaqdna聚合酶(5u/ul),0.6uldntps(2.5um),1.5ul10×pcr,9.58ulh2o;混匀选择性扩增的反应体系,按照下列步骤进行选择性扩增:首先,按照下列参数进行第一轮扩增:94℃2min,94℃30sec,56℃30sec,72℃80sec;然后,按照每轮的循环温度递减1℃,扩增10轮;最后,再以94℃2min,55℃30sec,72℃80sec扩增30轮;引物b是人工合成的两段寡核苷酸序列,需要根据模板dna序列即预扩增的产物,设计出互补的寡核苷酸链做为引物b,不同的细胞对应的不同的引物b;

步骤五:高通量测序:

首先将步骤四的产物用hiseqpe150进行高通量测序得到atac-seq数据;然后将atac-seq数据进行接头过滤后进行读段定位,将得到的读段回填到参考基因组上得到读段回填结果;

步骤六:概率检测:

首先,读取样本的atac-seq数据,并将其比对到参考基因组上,寻找出开放染色质位点富集的特征峰和峰顶点的位置信息;然后,以峰顶点为中心分别向左右两侧延展100bp,延伸后的数据中,每一个dna序列的中心均为峰顶点;最后,将dna序列提取出来并去掉其中重复的序列得到dna短序列,并按照提取的次序对dna短序列编号,dna短序列的编号为由1开始的连续的正整数序列;

然后,统计每个dna短序列内的读段数量和每个dna短序列内的碱基数量;

其次,计算dna短序列的开放概率,用公式一计算:

公式一:

其中,n是dna短序列的个数,为正整数;i是dna短序列的编号,为正整数;δ是dna短序列的开放概率,δi是编号为i的dna短序列的开放概率,δ和δi为0~1之间的实数,没有单位;x是dna短序列内的读段数量,xi是编号为i的dna短序列内的读段数量,x和xi为正整数;y是dna短序列内的碱基数量,yi是编号为i的dna短序列内的碱基数量,y和yi为正整数;

最后,δi的处理方法为:如果δi大于0.5,则编号为i的dna短序列是开放染色质位点;否则,则编号为i的dna短序列不是开放染色质位点。

本发明的有益成果为:本发明提供了应用于组织样本中染色体开放结合区域定位的atac-seq方法,包括细胞悬液制备、转座反应与纯化、去除杂质、pcr扩增、高通量测序、概率检测。该方法采用转座酶法进行dna片段化,将繁琐的dna片段化、末端修复和接头连接反应等步骤变为一步简单的酶促反应,缩短实验时间。可以快速的得到调控的多维信息,比其他方法要节省大约3到5个数量级的细胞。实验流程中没有片段选择的步骤,所以这种方法可以同时获得“开放”染色质的位置、转录因子的结合位点、核小体的调控区域和染色质状态等信息。

以上所述仅为本发明之较佳实施例,并非用以限定本发明的权利要求保护范围。同时以上说明,对于相关技术领域的技术人员应可以理解及实施,因此其他基于本发明所揭示内容所完成的等同改变,均应包含在本权利要求书的涵盖范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1