RNA5mC重亚硫酸盐测序的文库构建方法及其应用

文档序号:9411507阅读:2428来源:国知局
RNA 5mC重亚硫酸盐测序的文库构建方法及其应用
【技术领域】
[0001] 本发明属于基因组测序技术领域,具体的,涉及一种通过利用只含ACT三碱基的 随机六聚引物对重亚硫酸盐处理的RNA片段进行逆转录后的文库构建方法及其在5mC高通 量测序中的应用。
【背景技术】
[0002] RNA同时具有调控和信息分子的双重功能,在众多细胞机制中发挥着核心作用。 RNA转录后的修饰为RNA功能的多样化奠定了化学基础。自然界中的RNA修饰广泛存在 于A、U、C、G四类核苷酸上。截止目前,RNA修饰数据库RNAMDB共收录了 109种RNA的修 饰形式,其中甲基化修饰约占RNA修饰总量的80%,这类甲基化修饰主要发生在碱基基团 的氮原子N上,以及嘌呤和嘧啶的C原子上,或2' -0H氧原子等特殊位置上。RNA核苷上 的甲基化反应主要依赖于生物体内的甲基转移酶及甲基基团供体完成。6-甲基腺嘌呤 (N6-methyladenosine,m6A),是发生在碱基A第六位N原子上的甲基化修饰,作为真核生物 中最常见的一种RNA转录后修饰,因其丰富的含量和高度的保守型,近年来得到了广泛的 关注和研究。
[0003] 除m6A外,5-甲基胞啼啶(5_methylcytosine,5mC)是另一种在RNA中广泛存在的 甲基化修饰形式。虽然5mC修饰在DNA研究中已被广泛报道,而在RNA中的研究尚处于起 步阶段。早在20世纪70年代5mC就已被发现存在于仓鼠细胞的mRNA中,其修饰位点的分 布特征以及生物学功能等仍不清楚,直到近期对于RNA 5mC的基因组水平上的单位点检测 及生物学功能的研究才有了初步探索。
[0004] 和m6A -样,RNA 5mC修饰也应该是动态可逆的,甲基转移酶以S-腺苷甲硫氨酸 (SAM)作为甲基供体,将甲基转移到胞嘧啶C形成5-甲基胞嘧啶(5mC)。RsmB是第一个 被发现的RNA 5mC甲基转移酶,主要催化细菌rRNA上的甲基化形成。随后30多种RNA上 的5mC甲基转移酶陆续被发现,这些甲基转移酶主要可分为N0P2/N0L1,YebU/Trm4, RsmB/ Ynl022c和PH1991/NSUN四类,而且这些酶在真核生物中有很高的保守性,近年来NSUN蛋白 家族被广泛深入研究。人的NSUN蛋白家族共有9个蛋白,该家族的多个成员都具有潜在的 5mC甲基转移酶功能结构域,其中NSUN2的催化活性已被证实。除NSUN2外,DNMT2也被认 为可能是哺乳动物的RNA5mC甲基转移酶,它和NSUN2的催化位点有一定的交集。其它的酶 如NSUN1和NSUN3-7被预测可以催化一些保守的甲基化位点的甲基化过程。NSUN1、NSUN2、 NSUN5已被证实能结合RNA,但这些酶的特异性结合底物并不是很清楚。
[0005] 利用5mC抗体免疫沉淀结合亚硫酸氢盐处理测序的结果发现了古生菌mRNA中 的多个5mC修饰,其保守序列为AU(m5C)GANGU,和古生菌的rRNA上的保守序列一致,说明 mRNA和rRNA上的5mC修饰可能通过同一种甲基转移酶催化形成。
[0006] DNA中5mC的去甲基化反应由TET家族蛋白催化介导,而近期一项研究表明TET蛋 白也能介导RNA 5mC去甲基化形成5hmC,而且相较于TET1对DNA的高度活性,TET3对RNA 的选择性似乎更强。针对RNA 5mC去甲基化酶的研究还有待更深入的探索。
[0007] 相比m6A,5mC在mRNA中的功能研究还并不深入。基于现有研究推测,5mC的修饰 可能会调控mRNA的选择性剪接,5mC修饰水平可能会影响外显子的保留水平以及转录本的 组装形式。除此之外,5mC还可能与蛋白质翻译以及mRNA的稳定性有较为密切的关系。总 之,5mC修饰在RNA中广泛存在而且其功能可能涉及到包括细胞内信号转导,组织发育分化 和癌症等许多方面,而对mRNA中5mC位点的检测和分布规律的探索,5mC修饰酶及结合蛋 白的发现将有助于阐述5mC修饰对mRNA加工代谢的调控机制。
[0008] RNA整体水平上的5mC修饰可用质谱技术检测,而对于5mC的单位点鉴定迄今为 止已有四种方法被报道,分别为5mC重亚硫酸盐测序(Bisulfite sequencing, BS-seq)、 5mC-RIP、Aza-IP、miCLIP。其中RNA重亚硫酸盐测序是目前为止最为理想的方法,重亚硫酸 盐处理能够将核苷酸序列中未发生甲基化的胞嘧啶C(占绝大部分)脱氨基转换成尿嘧啶 U,而甲基化的胞嘧啶则保持不变,进行PCR扩增后尿嘧啶U全部转换成胸腺嘧啶T,因此可 与原本具有甲基化修饰的C碱基区分开来,该方法可以检测到RNA经重亚硫酸盐处理后转 换为尿嘧啶的非甲基化胞嘧啶,最后,对PCR产物进行测序,并且与未经处理的序列进行比 较,可判断胞嘧啶位点是否发生了甲基化。已有研究证实了tRNA和rRNA中均存在5mC修 饰,早期研究由于受到检测技术的限制,在mRNA中仅发现少数的5mC修饰,而近期通过重亚 硫酸盐测序方法发现在HeLa细胞的mRNA和非编码RNA中5mC均存在着广泛的修饰,并且 指出mRNA中的5mC修饰主要富集在非编码区(UTR)。

【发明内容】

[0009] 本发明人发现已报道的RNA 5mC重亚硫酸盐测序在文库构建的逆转录阶段采用 含有ATCG四个碱基的随机六聚引物,其存在一定的局限性。RNA中甲基化C在C碱基中所 占比例很低,利用超高效液相色谱串联质谱检测到人细胞mRNA中的5mC水平在所有C碱 基中的占比不足千分之一(如图1所示,在HeLa细胞中mRNA的5mC的水平是0. 03918%, 293T细胞中为0.072401% )。因此,RNA经重亚硫酸盐处理后,绝大部分(例如99. 7%以 上,甚至99. 9%以上)的非甲基化C都将转换成为U,导致RNA序列中A、U、G的富集以及 C的显著减少,按照四个碱基ATCG的随机排列,有(4~6) 4096种组合,其中包含G的组合有 (4~6-3~6)3367种,即超过80%的序列不能被ATCG四碱基随机六聚引物有效识别,造成 了扩增过程中包含G的ATCG四碱基随机六聚引物无法有效配对原来的非甲基化C区域,导 致随机六聚引物逆转录效率降低和扩增的偏好性。其次,现有的RNA 5mC重亚硫酸盐测序 采用了基于"双碱基编码原理"的SOLID测序平台,与Illumina平台直观的碱基序列不同, SOLID测序将reads利用颜色空间进行编码,将每一个碱基与它邻近的碱基用一种颜色表 示,但在荧光解码阶段,鉴于其是双碱基确定一个荧光信号,因而一旦发生错误就容易产 生连锁的解码错误,并不适用于5mC单碱基转化水平的重亚硫酸盐测序。因此,现有的测序 结果无法反映出RNA 5mC修饰的真实的分布规律。
[0010] 本发明人发现,利用只含有ACT的三碱基随机六聚引物对经重亚硫酸盐处理的 RNA进行逆转录PCR,三碱基随机六聚引物中的A能够高效匹配原来的非甲基化C区域(重 亚硫酸盐处理之后为U),克服了原来含有G的四个碱基ATCG的随机六聚引物无法有效配对 由非甲基化C转变而来的U区域的缺陷,可以提高经重亚硫酸盐转化的RNA与逆转录引物 的结合效率,其逆转录效率显著高于传统的ACTG四碱基随机六聚引物,从而有利于5mC位 点的检测以及对5mC的分布规律和功能机制的进一步分析。其原理如图2所示,从总RNA中 分离纯化mRNA或者前体mRNA (pre-mRNA),经片段化处理及重亚硫酸盐转化后,绝大部分C 转变为U,ACTG四碱基随机六聚引物由于其中存在G,仅能与少量重亚硫酸盐转化后的片段 匹配,因此逆转录效率较低,仅能逆转录扩增部分片段,无法全面覆盖RNA (或相应的cDNA) 的全部序列,而利用ACT三碱基随机六聚引物对已转化的C(即非甲基化的C)的匹配效率 要远远高于普通的ACTG四碱基随机六聚引物,经II链合成和PCR扩增后,能有效扩增绝大 多数含非甲基化C的RNA片段,由此构建的cDNA文库基本能完全覆盖测序样品的所有序 列,能得到更优的更真实的数据。
[0011] 在此基础上,本发明涉及5mC甲基化RNA的重亚硫酸盐测序文库构建、高通量测序 及甲基化检测方法,包括以下步骤:
[0012] (1)将RNA样品片段化;
[0013] 通过物理或化学方法将RNA样品打断成为适合于测序的长度的片段。优选将RNA 样品打断为约l〇〇nt大小的片段。可以使用商购的试剂盒,例如Ambion RNA片段化试剂盒 实现RNA样品的片段化。
[0014] "RNA样品"是分离纯化的待测RNA,可以来自于人体、动物体、植物体或其器官、组 织或细胞。所述1^可以是1111^、〖1^、冰嫩、总1^或其它包含或可能包含5111(:甲基化位 点的RNA。例如可以使用Trizol法从组织或细胞中提取总RNA。还可以使用商购的试剂盒 提取(分离纯化)RNA,例如使用Ambion的mRNA提取试剂盒提取mRNA。
[0015] 为了鉴定重亚硫酸盐处理RNA方法的可靠性,RNA样品中可以包含一定比例的非 甲基化RNA标准品作为鉴定重亚硫酸盐转化效率的标准品,例如RNA样品可以是非甲基化 RNA标准品与待测RNA以1:100(重量比)的比例混合的混合物。非甲基化RNA标准品序列 不含5mC甲基化位点,因此在用重亚硫酸盐处理时全部胞嘧啶理论上都将转换为尿嘧啶, 在重亚硫酸盐处理后对RNA样品中非甲基化RNA标准品序列中胞嘧啶转化为尿嘧啶的情况 (例如百分比)进行分析,可以反映重亚硫酸盐转化效率。本发明中可以使用小鼠DHFR基 因的RNA序列作为非甲基化RNA标准品。DHFR的RNA序列可以用T7高效RNA合成试剂盒 (NEB、E20405)从携带小鼠DHFR基因全长的质粒pcDNA3-HA-mDHFR上转录出。
[0016] (2)对片段化的RNA样品进行重亚硫酸盐处理;
[0017] 将片段化的RNA样品用重亚硫酸盐例如重亚硫酸钠进行处理,以使非甲基化胞嘧 啶转换为尿嘧啶。用重亚硫酸盐处理RNA的方法是本领域公知的。重亚硫酸盐处理可以包 括重亚硫酸盐温育、脱盐和脱磺酸化步骤。重亚硫酸盐处理的示例性方
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1