基于高通量测序的研究与目标蛋白结合的rna的方法

文档序号:8937989阅读:579来源:国知局
基于高通量测序的研究与目标蛋白结合的rna的方法
【技术领域】
[0001] 本发明设及设及一种基于高通量测序的全基因组范围内研究与目标蛋白结合的 RNA的方法。
【背景技术】
[0002] 在全基因组范围内研究与目标蛋白结合的RNA的高通量测序方法目前只有一种, 即RIP-seq(RNAimmunoprecipitationSequencing,RNA免疫沉淀测序)(ZhaoJ,Ohsumi TK,KungJT,etal.Genome-wideidentificationofpolycomb-associatedRNAsby RIP-seq.MolCell. 2010, 40:939-953)。运种方法主要通过RNA免疫沉淀,获得与目标蛋白 结合的RNA,将获得的RNA进行反转录获得第一链cDNA,然后可W应用于PCR扩增、文库构 建、RACE及其他的分子生物学实验。
[0003] RIP-seq中的文库构建,可W识别链特异性、可W适用于少量RNA高通量测序文库 的构建,从而在全基因组范围内研究与目标蛋白结合的RNA。
[0004] 上述现有的RIP-seq(ZhaoJ,OhsumiTK,KungJT,etal.Genome-wide identificationofpolycomb-associatedRNAsbyRIP-seq.Mol Cell. 2010, 40:939-953)的过程如下:首先,通过常规方法进行RNA免疫沉淀。主要步骤 为:分离细胞核,制备细胞核溶解产物,用面ase进行处理,并与结合目标蛋白的抗体进行 解育,用proteinA琼脂糖珠子对RNA-蛋白质复合物进行免疫沉淀。其次,进行RNA的抽 提,一般使用Trizol法抽提RNA。第S,进行第一链CDNA的合成,其实验原理图如图1所 示,利用某些反转录酶具有末端转移酶活性,会自动在新合成的第一链CDNA末端添加几个 核巧酸,通常是脱氧胞喀晚(dC),而链置换引物在3'端含有脱氧鸟嚷岭(dG),可W与富含 dC尾的第一链CDNA结合,反转录酶可W转换模板继续合成至链置换引物结束。运样合成的 第一链CDNA的两端都具有已知序列。第四,Illumina测序引物的引入,W上述两端都具有 已知序列的第一链CDNA为模板,合成第二链,然后在DNA链一端加上Illumina测序引物, 从而形成适用于测序的文库。
[0005] 但是,利用现有的RIP-seq方法,检测到的RNA分子是有偏好性的。有数据表明, 利用上述RIP-seq方法构建的文库,对5'端是G的RNA更容易检测到,因为对于5'端是 G的RNA,在第一链CDNA合成时,其模版置换效率明显高(GuptaRA,Sh址N,WangKC,et al.Longnon-codingRNAHOTAIRreprogramschromatinstatetopromotecancer metastasis.化1:脚6. 2010, 464:1071-1076.)。所W,该方法对RNA的检测有偏好性。而且, 该方法是单端测序的方式,只在DNA链的一端引入了测序引物,不适用于双端测序。
[0006] 此外,现有技术的RNA测序方法中(如图2所示),RNA反转录后和CDNA链形成双 链,然后直接加接头(P5和P7),测序时为双端测序,因此,测序时不知道测的是CDNA链还是 原来RNA链,所W不能判断RNA链信息。而通过上述RIP-seq方法,通过链置换方法,利用 加入的链置换引物中GGG来判断RNA链的信息,测到GGG序列是来自RNA链的,而测到CCC 序列就是来自CDNA链。但是,如上所述,由于该方法对RNA的检测有偏好性,5'端是G的 RNA更容易检测到,运也就使该方法在判断RNA链信息方面存在不稳定性。
[0007] 另外,在RNA测序方法中,在双链DNA两端加上Illumina的P5和P7测序接头的 过程中,由于在加入P5和P7测序引物后需要纯化,在PCR之后还需要纯化,运两步纯化步 骤就导致了样品的损失。
[000引因此,本领域的技术人员致力于开发一种能够避免检测RNA的偏好性、提高判断RNA链信息准确性并减少样品损失的RIP-seq方法。

【发明内容】

[0009] 有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种能够避免检 测RNA的偏好性、提高判断RNA链信息准确性并减少样品损失的RIP-seq方法。
[0010] 为实现上述目的,本发明提供了一种基于高通量测序的研究与目标蛋白结合的 RNA的方法,其中,提供了一种反转录随机引物,包括形成发卡结构的碱基序列W及随机碱 基序列,形成发卡结构的碱基序列包括用于识别RNA链信息的条码碱基序列和与测序引物 部分相同的碱基序列。条码碱基序列用于判断RNA链信息,并减少偏好性。条码碱基序列 的设计原则是不与要进行测序的生物体的基因组上的任意一段序列重叠。由于发卡结构不 会与RNA退火,因此可W进一步降低可能产生的偏好性。
[0011] 进一步地,上述反转录随机引物中条码碱基至少为7个。
[0012] 进一步地,上述反转录随机引物的序列为:
[0013] 5' -GTGCTCTTCCGATCTAGAGCANNNNNNNNN-3',其中第 15-21 位为条码碱基序列。
[0014] 可选地,上述反转录随机引物中与测序引物部分相同的碱基序列可W加长或缩短 1至2个碱基。随机碱基的数量也可变,可W是6-15个,优选为9个。
[0015] 进一步地,本方法还提供了一种双链接头,该双链接头的一条链包括与测序引物 碱基序列中的一部分相同的碱基序列,并且,相对于配对的另一条链,在3'端还具有突出的 随机碱基序列。该双链接头的3'端突出的随机碱基可W通过退火直接杂交到反转录得到 的第一链CDNA上。
[0016] 进一步地,上述双链接头两条链的序列分别为:
[0017] 5,-ACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNN-3,;5,-AGATCGGAAG AGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGT-3 '。
[0018] 可选地,上述双链接头中与测序引物碱基序列中的一部分相同的碱基序列可W增 加或减少。
[0019] 另一方面,本发明还提供的一种基于高通量测序的研究与目标蛋白结合的RNA的 方法,包括W下步骤:
[0020] 1)通过RNA免疫沉淀将获得与目标蛋白结合的RNA,并利用反转录随机引物进行 反转录合成第一链CDNA;其中,该反转录随机引物包括形成发卡结构的碱基序列W及随机 碱基序列,形成发卡结构的碱基序列包括用于识别RNA链信息的条码碱基序列和与测序引 物部分相同的碱基序列;
[0021] 2)通过链置换方法引入已知序列,随后引入测序引物;其中,链置换方法即为常 规使用的方法,通过链置换引物在3'端含有dG,与富含dC尾的第一链CDNA结合,反转录酶 可W转换模板继续合成至链置换引物结束。W上述两端都具有已知序列的第一链CDNA为 模板,合成第二链,然后在DM上加上测序接头,从而形成适用于测序的文库,可用于高通 量测序。
[0022] 进一步地,在所述步骤1)之后,不通过连置换方法引入已知序列,而是可W利用 酶消化过量的反转录随机引物,并碱解与第一链CDNA杂合的RNA ;再利用双链接头与第一 链CDNA退火杂交,引入已知序列,随后引入测序引物,其中,双链接头的一条链包括与测序 引物碱基序列中的一部分相同的碱基序列,并且,相对于另一条链,在3'端具有突出的碱基 序列,该突出的碱基序列为随机碱基序列。由于是通过退火杂交双链接头引入已知序列,并 通过PCR的方法引入测序引物,因此,相比于常规的引入测序引物的方法,避免了割胶回收 的步骤,因此,减少了样品的损失。众所周知,利用RIP方法沉淀下来的RNA量较少,一般只 有几十纳克,而割胶回收步骤损失样品较多,运会导致后续步骤中所需PCR循环数增多而 引入偏好性,甚至更严重的会导致PCR失败。
[0023] 进一步地,该反转录随机引物的序列为:
[0024] 5' -GTGCTCTTCCGATCTAGAGCANNNNNNNNN-3,;
[0025] 其中,所述双链接头两条链的序列分别为:
[0026] 5,-ACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTNNNNNN-3,;5,-AGATCGGAAG AGCGTCGTGTAGGGAAAGAGTGTAGATCTCGGT-3'。
[0027] 上述方法通过反转录随机引物中的条码碱基和发卡结构来降低偏好性,并通过条 码碱基来提高链信息判断的准确性,并且,该方法步骤较少,尤其是纯化步骤减少,所W也 降低了过程中的损耗,进一步降低了偏好性。
[0028] W下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,W 充分地了解本发明
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1