基于3T-seq全基因组范围分析APA的方法

文档序号:473732阅读:856来源:国知局
基于3T-seq全基因组范围分析APA的方法
【专利摘要】本发明涉及一种检测RNA?PAS(Poly?A?Site)的方法,提供了一种基于3T-seq全基因组范围分析APA的方法,包括含有oligo?dT的磁珠制备,即将5'端生物素修饰的oligo?dT引物与带链霉亲和素的磁珠混合结合;用所述磁珠与总RNA混合,筛选含有Poly?A的RNA;逆转录,双链cDNA第二链合成,双链cDNA断裂;移除Poly?A结构;末端修饰后连接测序接头;文库回收。该方法减少了RNA水平操作,在DNA水平移除Poly?A序列,消除Poly结构对测序的影响;选择双链DNA断裂酶处理,在不影响文库质量的基础上在DNA水平断裂;简化实验流程,降低实验难度和造价,使其应用范围更广。
【专利说明】基于3T-seq全基因组范围分析APA的方法
【技术领域】
[0001]本发明涉及一种检测RNA PAS (Poly A Site)的方法,尤其涉及一种基于3T_seq (TT-mRNA Terminal Sequencing)技术在全基因组范围内分析 APA(AlternativePolyadenylation)的方法。
【背景技术】
[0002]在人类基因组中,有一半以上的基因存在多个聚腺苷酸化位点(PAS,Poly ASite)。在前体mRNA成熟过程中,通过改变前体mRNA的切割位点和聚腺苷酸化位点(PAS)而从一个编码区产生带有不同长度的3’非编码区(3’UTR)的成熟mRNA,这种情况称为选择性聚腺苷酸化(APA, Alternative Polyadenylation)。APA在调控细胞增殖、分化、转运和发育以及疾病发生如肿瘤发生发展等生理和病理过程都发挥了至关重要的作用。
[0003]在全基因组范围内研究APA变化的现有技术有多种,但原理都相近。其中两种最具有代表性方法为 SAPAS (Sequencing APA Sites)和 3P_Seq (Poly(A)PositionProfiling by sequencing)。文献记载的 SAPAS 方法(Fu Y, Sun Y, Li Y, Li J, RaoX,Chen C, Xu A.Differential genome-wide profiling of tandem3’UTRs amonghuman breast cancer and normal cells by high-throughput sequencing.GenomeRes.2011,21(5):741-747.),其实验原理如下:将RNA直接加热断裂后,用含有oligodT的引物逆转录出第一链cDNA,链置换的方法合成双链cDNA。然后用突变的ο I i godT (TTTTCTTTTTTCTTTTTT )与测序接头连接作为PCR引物扩增,扩增出的产物中则不含有poly A结构,以此避免poly A结构对测序质量的影响。文献中记载的3P_Seq方法(Jan CH, Friedman RC, Ruby JG, Bartel DP.Formation, regulation and evolution ofCaenorhabditis elegans3' UTRs.Nature, 2011, 469 (7328):97-101.),其实验原理图如下:用oligo dT将含有poly A序列的RNA筛选出后,3’端加上一个带Biotin修饰的RNA接头,然后经过RNase Tl断裂RNA后用含有链霉亲和素的磁珠筛选含有poly A的片段,再用只含有dTTP的逆转录体系将poly A结构逆转录成杂合双链,利用RNase H的特性水解polyA结构,将含有APA位点的片段从磁珠上释放下来,两端加上RNA接头后合成双链cDNA,进行PCR扩增后即为可用于测序的文库。
[0004]现有技术中SAPAS法不能彻底消除polyA未切除对测序的影响,3P_Seq法中RNA水平操作繁杂,经过多步的RNA连接和酶切,对RNA的损伤和损失也较大,不适用于少量样品文库的构建。且此方法难度较大、成本较高。另外,操作过程中断裂方式存在局限性,即3P-Seq法中RNase Tl酶切断裂和SAPAS法中RNA直接加热断裂的方法不能做到既能不损伤RNA同时又能随机断裂。

【发明内容】

[0005]有鉴于现有技术不能彻底消除Poly结构对测序的影响、因操作繁杂引起的RNA损伤和损失、断裂方式的局限的缺陷,本发明旨在提供一种基于3T-seq (TT-mRNA TerminalSequencing)全基因组范围分析APA的方法,以尽可能减少RNA水平操作,在DNA水平移除Poly A序列,消除Poly结构对测序的影响;尽可能简化实验流程,降低步骤繁琐引起的损失,同时降低实验难度和造价,使其应用范围更广;选择合适的断裂方法,尽量做到在不影响文库质量的基础上在DNA水平断裂。
[0006]本发明采用以下技术方案解决上述问题:
[0007]提供一种基于3T-seq全基因组范围分析APA的方法,包括:(I)含有oligo dT的磁珠制备;(2)用所述磁珠与总RNA混合,筛选含有Poly A的RNA ; (3)逆转录,双链cDNA第二链合成,双链cDNA断裂;(4)在DNA水平移除Poly A结构;(5)末端修饰后连接测序接头;(6)文库回收及扩增。
[0008]进一步地,oligo dT引物5’端含有Gsu I酶切位点,用以后续移除Poly A结构。Gsu I酶可以移除识别位点下游14-16个碱基,使文库分子留下AA的粘性末端。
[0009]进一步地,oligo dT引物的5’端含有Gsu I的酶切位点的保护序列。优选地,保护序列的碱基数为9个。[0010]进一步地,oligo dT引物的5’端用生物素修饰,用以与带链霉亲和素的磁珠连接。
[0011]进一步地,oligodT 引物序列为 5’ -GAGCTAGTTCTGGAGTTTTTTTTTTTTTTTTTTVN-3’。其中,V代表A、C或G,N代表A、T、C或T。oligo dT引物的3’端一共含有18个Tj^lGsuI酶切和末端修饰后,文库分子余下2个T作为标记用于测序结果的筛选。采用3T_Seq技术构建胃癌细胞系的APA文库,经过Illumina测序,共得到30million reads的数据,采用2个T筛选数据发现92.8%的reads被筛出并成功比对到RNA3’端。因此认为2个T在后期数据筛选有效测序结果完全足够。增加T的个数来可以提高筛选效率,根据目前Illumina测序的水平估算,若不超过5个T则不会对测序质量产生很大的影响。因此本方法适用于2-5个T作为筛选标签的应用。
[0012]进一步地,所述逆转录使用未甲基化的dATP、dGTP、dTTP和甲基化的dCTP,以封闭基因序列中的Gsu I酶切位点。
[0013]进一步地,在所述双链cDNA第二链的合成中,使用未甲基化的dCTP、dATP、dGTP和dUTP,通过RNase H、E.coli DNA聚合酶、E.coli DNA连接酶的作用进行合成。dUTP代替dTTP合成第二链cDNA,目的是在后续进行文库PCR时加入USER酶裂解掉第二条链,使测序文库具有链特异性。
[0014]进一步地,双链cDNA的断裂使用双链DNA断裂酶处理、DNase I处理或超声断裂。优选地,采用双链DNA断裂酶处理。优选地,双链cDNA的断裂后,片段大小在200-400bp,经洗涤后留在所述磁珠上的片段为目的片段。
[0015]进一步地,所述移除Poly A结构为:利用Gsu I酶进行酶切,释放连接在所述磁珠上的目的片段。
[0016]进一步地,本发明的方法适用于起始总RNA量为10ug-100ug。
[0017]3T_Seq (TT-mRNA Terminal Sequencing)技术是用于在全基因组范围内研究APA变化的技术。该技术的原理图1所示,首先需要构建一种特殊的含有oligo dT的磁珠,用这种磁珠筛选含有poly A的RNA,然后在磁珠上逆转录合成第一链cDNA,逆转录体系中用甲基化的dCTP替代正常的dCTP,随后使用dCTP、dATP、dGTP、dUTP合成双链cDNA。经过断裂后磁珠上留下的即为含有APA位点的片段,再经过Gsu I酶切除去poly A结构,将目的片段从磁珠上释放下来,两端经过修饰后添加Illumina测序接头,经过片段大小筛选后PCR扩增,即得到可用于Illumina 二代测序的文库。
[0018]本发明的有益效果为:
[0019]1.构建了特殊的含有oligo dT的磁珠,该磁珠既能筛选含有poly A结构的RNA,同时含有酶切位点可以移除文库中的poly A结构。而普通的商业oligo dT磁珠只能用于筛选含有poly A的RNA。本发明的磁珠具有以下特点:(l)oligo dT引物的5’端添加生物素修饰,用于连接带有链霉亲和素的磁珠。(2)oligo dT序列的5’端加上一个Gsu I的酶切识别位点以及9个碱基的保护序列,用于poly A结构的移除。(3)磁珠上结合的oligodT经Gsu I酶酶切后,其3’端保留2-5个T,能用于后期数据处理时数据的筛选。
[0020]2.断裂方式的选择:为了减少对RNA的损伤,本发明选择在DNA阶段断裂,DNA水平断裂与现有断裂方式相比减少了对RNA的损伤,提高了产率。双链cDNA合成后,使用NEB公司的双链cDNA断裂酶将双链cDNA断裂成200_400bp的片段,经过磁珠筛选后,挂在磁珠上的片段即为靠近RNA3’端且含有Poly A位点的片段。
[0021]3.移除Poly A结构的策略:为了方便操作和降低实验难度,本发明选择在DNA水平移除Poly A结构,提高测序质量,使APA的鉴定更加准确。在逆转录时,我们在oligo dT的5’端引入了 Gsu I的酶切识别位点,Gsu I是一种第三型限制性内切酶,在识别位点的下游16个碱基的位置切割形成两个碱基的粘性末端,而且具有甲基化封闭敏感特性。当识别位点(CTGGAG)中的碱基C被甲基化时,该识别位点被封闭,无法被Gsu I识别。由于PolyA结构移除的同时也将文库片段从磁珠上释放下来,为了防止移除Poly结构时文库片段上也含有这个酶切位点而造成APA位点的假阳性,我们在逆转录的时候使用甲基化的dCTP替代正常的dCTP,而在第二链cDNA合成的时候换回正常的dCTP,这样就可以在保证ο I i go dT中的Gsu I酶切位点完好而其他识别位点被甲基化封闭,避免了假阳性结果的产生。
[0022]4.TT标签用于筛选数据精确定位APA位点。我们设计用于反转的引物中含有18个T。Gsu I移除Poly A时切去14个A,2个A的粘性末端在末端修饰时被切除,所以真正留在文库片段上的2个T用以标记文库片段的APA位点。
【专利附图】

【附图说明】
[0023]图1本发明的3T_Seq技术的实验原理图。
【具体实施方式】
[0024]【具体实施方式】中使用的缓冲液成分如下:
[0025] 配制缓冲液所需的试剂贮存母液(可从商业公司购置,也可购买相关试剂自行配制):
[0026]
【权利要求】
1.一种基于3T-seq全基因组范围分析APA的方法,其特征在于,包括:(1)含有01180dT引物的磁珠的制备;(2)用所述磁珠与总RNA混合,筛选含有Poly A的RNA ; (3)逆转录,双链cDNA第二链合成,双链cDNA断裂;(4)在DNA水平移除Poly A结构;(5)末端修饰后连接测序接头;(6)文库回收及扩增。
2.根据权利要求1所述的一种基于3T-Seq全基因组范围分析APA的方法,其特征在于,所述oligo dT引物5’端含有Gsu I酶切位点,用以后续移除Poly A结构。
3.根据权利要求2所述的一种基于3T-Seq全基因组范围分析APA的方法,其特征在于,所述oligo dT引物的5’端含有Gsu I的酶切位点的保护序列。
4.根据权利要求1所述的一种基于3T-Seq全基因组范围分析APA的方法,其特征在于,所述oligo dT引物的5’端用生物素修饰,用以与带链霉亲和素的磁珠连接。
5.根据权利要求1所述的一种基于3T-Seq全基因组范围分析APA的方法,其特征在于,所述 oligo dT 引物序列为 5’ -GAGCTAGTTCTGGAGTTTTTTTTTTTTTTTTTTVN-3’。
6.根据权利要求2所述的一种基于3T-Seq全基因组范围分析APA的方法,其特征在于,所述逆转录使用未甲基化的dATP、dGTP、dTTP和甲基化的dCTP,以封闭基因序列中的Gsu I酶切位点。
7.根据权利要求2所述的一种基于3T-Seq全基因组范围分析APA的方法,其特征在于,在所述双链cDNA第二链合成中,使用未甲基化的dCTP、dATP、dGTP和dUTP,通过RNaseH、E.coli DNA聚合酶、E.coli DNA连接酶的作用进行合成。
8.根据权利要求1所述的一种基于3T-Seq全基因组范围分析APA的方法,其特征在于,所述双链cDNA的断裂,使用双链DNA断裂酶处理、DNase I处理或超声断裂。
9.根据权利要求2所述的一种基于3T-Seq全基因组范围分析APA的方法,其特征在于,所述移除Poly A结构为:利用Gsu I酶进行酶切,释放连接在所述磁珠上的目的片段。
10.根据权利要求1所述的一种基于3T-seq全基因组范围分析APA的方法,其特征在于,适用于起始总RNA量为10ug-100ug。
【文档编号】C12Q1/68GK103911449SQ201410138517
【公开日】2014年7月9日 申请日期:2014年4月8日 优先权日:2014年4月8日
【发明者】赵小东, 邵志峰, 康亚妮, 赖登攀, 吴俊
申请人:上海交通大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1