从rna样本富集转录本的方法及其用途

文档序号:3285641阅读:630来源:国知局
从rna样本富集转录本的方法及其用途
【专利摘要】本发明提出了从RNA样本富集转录本的方法及其用途。从RNA样本富集转录本的方法,包括:利用富集试剂对RNA样本进行处理,以便富集转录本,其中,所述富集试剂具有5’-单磷酸外切酶活性,所述转录本为在其5’末端具有帽子结构或三磷酸基团的RNA分子。利用该方法能够有效地富集转录本。
【专利说明】从RNA样本富集转录本的方法及其用途
【技术领域】
[0001]本发明涉及生物【技术领域】,具体的,本发明涉及从RNA样本富集转录本的方法及其用途,更具体的,本发明涉及从RNA样本富集转录本的方法、构建测序文库的方法、测序文库、核酸样本测序方法、确定转录起点(transcription start site, TSS)的方法、用于从RNA样本富集转录本的富集试剂、构建测序文库的装置、核酸样本测序设备以及确定TSS的系统。
【背景技术】
[0002]基因的转录过程是从RNA聚合酶与DNA模板的启动子位置结合开始,然后从转录起点(transcription start site,在本文中简称为:TSS)进行转录延伸,最终形成完整的RNA。生物体内存在的RNA分子都是从TSS开始的,因此通过高通量测序研究TSS有助于我们从全基因组推测启动子的位置及结构,从而全局了解基因转录调控网络。TSS的研究也有助于修正原有的基因注释或发现新的基因。
[0003]然而,目前对于TSS的研究,仍有待改进。

【发明内容】

[0004]本发明旨在至少在一定程度上解决上述技术问题之一或至少提供一种有用的商业选择。为此,本发明的一 个目的在于提出一种能够有效富集转录本,进而可以有效确定TSS的手段。
[0005]本发明是基于发明人的下列发现而完成的:
[0006]目前,关于高通量测序研究TSS的方法通常是针对具有帽子结构的RNA,采用CAGE或RACE的方法捕获RNA分子的5’末端。常见的有de印CAGE,PEAT,deep-RACE, nanoCAGE和CAGEscan。其中de印CAGE,PEAT,deep-RACE和CAGEscan需要酶切等繁琐操作,对RNA的要求量很高,而且产生的测序序列(reads)较短(大约20nt),只适用于具有帽子结构的RNA,不能用于没有帽子结构的原核RNA的TSS的研究。尽管nanoCAGE操作比较简单,对RNA的使用量要求也低,但是也只适用于具有帽子结构的RNA,而且产生的数据中假阳性比较多。发明人发现通过采用5’单磷酸外切酶,能够特异性地降解5’单磷酸的RNA,保留具有5’帽子和5’三磷酸的完整的RNA分子,可以有效地应用于富集转录本,因而能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。
[0007]在本发明的第一方面,本发明提出了一种从RNA样本富集转录本的方法。根据本发明的实施例,该从RNA样本富集转录本的方法包括:利用富集试剂对RNA样本进行处理,以便富集转录本,其中,所述富集试剂具有5’-单磷酸外切酶活性,所述转录本为在其5’末端具有帽子结构或5’三磷酸的RNA分子。由于5’单磷酸外切酶,能够特异性地降解5’单磷酸的RNA,而不会降解具有5’帽子和5’三磷酸的完整的RNA分子,从而利用具有该5’单磷酸外切酶活性的富集试剂,可以有效地富集转录本,因而能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。[0008]在本发明的第二方面,本发明提出了一种构建测序文库的方法。根据本发明的实施例,该构建测序文库的方法包括:根据前面所述的方法,从RNA样本富集转录本;去除所述转录本的5’帽子结构或5’三磷酸,以便获得去除5’帽子结构或5’三磷酸的转录本;在去除5’帽子结构或5’三磷酸的转录本的5’末端连接RNA接头,以便获得连接有RNA接头的转录本;对连接有RNA接头的转录本进行反转录,以便获得与所述转录本对应的cDNA ;对所述cDNA进行扩增,以便获得扩增产物;以及基于所述扩增产物,构建测序文库。由此,利用该方法,能够有效地针对核酸样本中所富集的转录本构建测序文库,因而能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。
[0009]在本发明的第三方面,本发明提出了一种测序文库,其特征在于,是由前面所述的方法构建的。利用该测序文库,能够有效的对RNA转录本进行测序,能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。
[0010]在本发明的第四方面,本发明提出了一种核酸样本测序方法。根据本发明的实施例,该核酸样本测序方法包括:根据前面所述的方法,构建测序文库;以及对所述测序文库进行测序,以便获得测序结果。利用该方法,能够有效的对RNA转录本进行测序,能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。
[0011]在本发明的第五方面,本发明提出了一种用于确定TSS的方法。根据本发明的实施例,该确定TSS的方法包括:从宿主提取RNA样本;利用前面所述的方法,获得由多个测序序列构成的测序结果;以及基于所述测序结果,确定TSS。利用该方法,可以有效地确定转录起始位点,能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。
[0012]在本发明的第六方面,本发明提出了一种用于从RNA样本富集转录本的富集试剂。根据本发明的实施例,富集试剂具有5’-单磷酸外切酶活性。利用该富集试剂,可以有效地富集转录本,因而能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。
[0013]在本发明的第七方面,本发明提出了一种构建测序文库的装置。根据本发明的实施例,该构建测序文库的装置包括:转录本富集单元,所述转录本富集装置中设置有前面所述的富集试剂,以便从RNA样本富集转录本;末端修整单元,所述末端修整单元与所述转录本富集单元相连,并且适于去除所述转录本的5’帽子结构或5’三磷酸,以便获得去除5’帽子结构或5’三磷酸的转录本;RNA接头连接单元,所述RNA接头连接单元与末端修整单元相连,并且适于在去除5’帽子结构或5’三磷酸的转录本的5’末端连接RNA接头,以便获得连接有RNA接头的转录本;反转录单元,所述反转录单元与所述RNA接头连接单元相连,并且适于对连接有RNA接头的转录本进行反转录,以便获得与所述转录本对应的cDNA ;扩增单元,所述扩增单元与所述反转录单元相连,并且适于对所述cDNA进行扩增,以便获得扩增产物;以及文库构建单元,所述文库构建单元与所述扩增单元相连,并且适于基于所述扩增产物,构建测序文库。利用该装置,能够有效地针对核酸样本中所富集的转录本构建测序文库,因而能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。
[0014]在本发明的第八方面,本发明提出了一种核酸样本测序设备,其特征在于,包括:文库构建装置,所述文库构建装置为前面所述的装置,以便针对核酸样本构建测序文库;以及测序装置,所述测序装置与所述文库构建装置相连,并且适于对所述测序文库进行测序,以便获得测序结果。利用该装置,能够有效的对RNA转录本进行测序,能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。[0015]在本发明的第九方面,本发明提出了一种确定TSS的系统。根据本发明的实施例,该系统包括:样品提取设备,所述样品提取设备用于从宿主提取RNA样本;核酸样本测序设备,所述核酸样本测序设备与所述样品提取设备相连,并且所述测序设备为前面所述的核酸样本测序设备,以便针对所述RNA样本进行测序,从而获得由多个测序序列构成的测序结果;以及TSS确定设备,所述TSS确定装置与所述测序设备相连,并且适于基于所述测序结果,确定TSS。根据本发明的实施例,利用该系统能够有效的确定核酸样本中的TSS。
[0016]本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
【专利附图】

【附图说明】
[0017]本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0018]图1显示了根据本发明一个实施例的构建测序文库的方法的流程示意图;
[0019]图2显示了根据本发明一个实施例的确定TSS序列的信息学分析流程示意图;
[0020]图3显示了根据本发明有一个实施例的确定TSS的系统的示意图;
[0021]图4显示了根据本发明一个实施例的核酸样本测序设备的示意图;
[0022]图5显示了根据本发明一个实施例的构建测序文库的装置的示意图;
[0023]图6显示了根据本发明有一个实施例的确定TSS的设备的示意图;
[0024]图7显示了根据本发明一个实施例,筛选后的TSS在基因组上的分布,上图和下图分别是人RNA和大肠杆菌RNA样品的TSS分布图,其中O是基因编码区的起始位点,其上游就是转录起始的位点,从图中可以看出,大部分的序列都落在基因编码区的上游;
[0025]图8显示了根据本发明一个实施例,展示了 8个人RNA样品的TSS图谱,从图中可以看到不同样品中TSS的分布情况;图9显示了根据本发明一个实施例,TSS上游的碱基分布图形,其中横坐标I对应的就是TSS的位置,以嘌呤为主(A/G)。上图是人RNA样品的TSS上游碱基分布图,有明显的GC富集区,这也是真核生物主要的启动子类型;下图是大肠杆菌RNA样品的TSS上游碱基分布图,在其上游-10区处也能找到典型的TATA盒;
[0026]图10显示了根据本发明一个实施例,5’UTR的长度分布,也就是TSS到编码区的距离。上图是人RNA样品5’ UTR的长度分布,下图是大肠杆菌RNA样品5’ UTR的长度分布;
[0027]图11显示了相关性分析可获得对实验结果可靠性和操作稳定性的评估,如图11所示,上图是人RNA样品的两次重复,下图是大肠杆菌RNA样品的两次重复;以及
[0028]图12,显示了根据本发明的实施例预测基因的结果示意图。上图是人的两个基因ΝΜ_018997和NM_031901的TSS分布,他们是发生了可变剪切的基因,图中红色竖线表示筛选的TSS,黑色的竖线是过滤前得到的序列,蓝色横线代表基因的外显子,黄色横线是基因的内含子;下图是大肠杆菌一个操纵子的TSS分布,原核的不存在内含子,所以只有代表基因的蓝色横线,这个操纵子的4个基因共有一个TSS。【具体实施方式】
[0029]下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0030]在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。另外,在本文中所使用的术语“上游” “下游”是按照5’端至3’端的方向所确定的。
[0031]本发明是基于发明人的下列发现而完成的:
[0032]目前,关于高通量测序研究TSS的方法通常是针对具有帽子结构的RNA,采用CAGE或RACE的方法捕获RNA分子的5’末端。常见的有de印CAGE,PEAT,deep-RACE, nanoCAGE和CAGEscan。其中de印CAGE,PEAT,deep-RACE和CAGEscan需要酶切等繁琐操作,对RNA的要求量很高,而且产生的测序序列(reads)较短(大约20nt),只适用于具有帽子结构的RNA,不能用于没有帽子结构的原核RNA的TSS的研究。尽管nanoCAGE操作比较简单,对RNA的使用量要求也低,但是也只适用于具有帽子结构的RNA,而且产生的数据中假阳性比较多。发明人发现通过采用5’单磷酸外切酶,能够特异性地降解5’单磷酸的RNA,保留具有5’帽子和5’三磷酸的完整的RNA分子,可以有效地应用于富集转录本,因而能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。
[0033]在本发明的第一方面,本发明提出了一种从RNA样本富集转录本的方法。根据本发明的实施例,该从RNA样本富集转录本的方法包括:利用富集试剂对RNA样本进行处理,以便富集转录本,其中,所述富集试剂具有5’ -单磷酸外切酶活性,所述转录本为在其5’末端具有帽子结构或三磷酸的RNA分子。根据本发明实施例,具有5’单磷酸外切酶活性的酶的例子可以包括:核糖核酸`外切酶XRN-1, Terminator?依赖于5’磷酸的核酸外切酶(Terminator? 5' -Phosphate-Dependent Exonuclease)或者 TAKARA? 喊性憐酸酶(TAKARA? Alkaline Phosphatase)。由于5’单磷酸外切酶,能够特异性地降解5’单磷酸的RNA,而不会降解具有5’帽子和5’三磷酸的完整的RNA分子,从而利用具有该5’单磷酸外切酶活性的富集试剂,可以有效地富集转录本,因而能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。
[0034]根据本发明的实施例,该从RNA样本富集转录本的方法可以采用任何具有5’单磷酸外切酶活性的富集试剂。根据本发明实施例,具有5’单磷酸外切酶活性的酶的例子可以包括:核糖核酸外切酶XRN-1,Terminator?依赖于5’磷酸的核酸外切酶或者TAKARA?碱性磷酸酶。根据本发明的一个实施例,所述富集试剂含有DNase I。由此,可以进一步提高降解5’单磷酸的RNA的特异性和效率,从而进一步提高富集转录本方法的效率。根据本发明的一个实施例,所述富集试剂还可以进一步含有缓冲液和可溶性盐,以便进一步提高DNaseI的酶活性。根据本发明的一个实施例,所述富集试剂的PH为8.0。根据本发明的一个实施例,所述缓冲液为Tris-HCl,所述可溶性盐为选自氯化钠和氯化镁的至少一种。根据本发明的一个实施例,在30摄氏度下,利用所述富集试剂对所述RNA样本进行处理。从而,可以进一步提高利用根据本发明实施例的富集试剂进行富集转录本的效率。根据本发明实施例,具有5’单磷酸外切酶活性的酶的例子可以包括:核糖核酸外切酶XRN-1,Terminator?依赖于5’磷酸的核酸外切酶或者TAKARA?碱性磷酸酶。
[0035]在本发明的第二方面,本发明提出了一种构建测序文库的方法。参考图1,根据本发明的实施例,该构建测序文库的方法包括:
[0036]SlOO (富集转录本):根据前面所述的方法,从RNA样本富集转录本。关于该步骤,前面已经进行了详细描述,在此不再赘述。
[0037]S200 (末端修整):去除所述转录本的5’帽子结构或5’三磷酸,以便获得去除5’帽子结构或5’三磷酸的转录本。根据本发明的一个实施例,利用末端修整试剂去除所述转录本的5’帽子结构或5’三磷酸,其中,所述末端修整试剂具有烟草酸焦磷酸酶活性。根据本发明的一个实施例,所述修整试剂包含:烟草酸焦磷酸酶、可溶性盐、EDTA、β-巯基乙醇和Triton-X 100。根据本发明的一个实施例,所述可溶性盐为醋酸钠。根据本发明的一个实施例,所述修整试剂的PH为7.5。由此,可以进一步提高对RNA进行末端修整的效果,即能够有效的去除转录本的5’帽子结构或5’三磷酸,从而提高构建测序文库的效率。
[0038]S300 (连接接头):在去除5’帽子结构或5’三磷酸的转录本的5’末端连接RNA接头,以便获得连接有RNA接头的转录本。根据本发明的一个实施例,利用连接试剂,在去除5’帽子结构或5’三磷酸的转录本的5’末端连接RNA接头,其中,所述连接试剂具有T4RNA连接酶活性。根据本发明的一个实施例,所述连接试剂包含:T4RNA连接酶,缓冲液、可溶性盐、二硫苏糖醇。根据本发明的一个实施例,所述连接试剂的PH为7.5。根据本发明的一个实施例,所述缓冲液为Tris-HCl。根据本发明的一个实施例,所述可溶性盐为氯化镁。根据本发明的一个实施例,在30摄氏度下,利用连接试剂,在去除5’帽子结构或5’三磷酸的转录本的5’末端连接RNA接头。由此,可以提闻连接接头的效率,从而提闻构建测序文库的效率。
[0039]S400 (反转录):对连接有RNA接头的转录本进行反转录,以便获得与所述转录本对应的cDNA。根据本发明的实施例,进行反转录所采用的反转录引物在其末端具有与所述RNA接头相对应的序列,由此,所得到的cDNA在其末端也将具有接头,从而便于后续文库构建和测序。在本文中所使用的术语“与RNA接头相对应”的含义是指,反转录引物中包含的序列能够与RNA接头匹配,并且能够进行扩增反应,从而得到在两个末端具有接头的cDNA。例如,在进行反转录的两条反转录引物之一中包含与RNA接头之一相同的序列,而在另一个反转录引物中,则包含于另一个RNA接头互补的序列。根据本发明的一个实施例,所述反转录采用具有SEQ ID NO:1所示序列的寡核苷酸作为反转录引物。根据本发明的一个实施例,所述反转录引物(SEQ ID NO:1)中至少一个N被硫代修饰,从而可以防止该引物被核酸酶降解。根据本发明的一个实施例,所述反转录引物(SEQ ID NO:1)中倒数第二个N被硫代修饰。
[0040]S500 (扩增):对所述cDNA进行扩增,以便获得扩增产物。本领域技术人员可以通过任何已知的方法进行扩增,例如可以通过常规的PCR方法,只需要采用根据接头的序列进行设计相应的引物即可。
[0041]S600 (文库构建):基于所述扩增产物,构建测序文库。本领域技术人员可以根据所期望使用的测序方法来针对扩增产物,本领域技术人员可以参考制造商所提供的操作说明,在此不在赘述。需要说明的是,利用根据本发明的方法进行处理所得到的扩增产物,可以应用于 Illumina Hiseq2000、Genome Analyzer> SOLiD 测序系统、1n Torrent、1nProton、454、PacBio RS测序系统、Helicos tSMS技术以及纳米孔测序技术,从而可以实现
高通量测序。
[0042]由此,利用该方法,能够有效地针对核酸样本中所富集的转录本构建测序文库,因而能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。另外,需要说明的是,在上述各处理步骤之间,可以任选地包括纯化产物的步骤,根据本发明的实施例,纯化RNA可以采用苯酚/氯仿/异戊醇(体积比为25:24:1)抽提,乙醇沉淀,是为了去除反应混合物中的酶,以免影响下一步骤的反应,而且用乙醇沉淀,还能保留一些小分子的转录本,如microRNA,使这一部分非编码RNA的TSS信息得以获得,从而帮助了解转录调控状态。
[0043]在本发明的第三方面,本发明提出了一种测序文库,其特征在于,是由前面所述的方法构建的。利用该测序文库,能够有效的对RNA转录本进行测序,能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。
[0044]在本发明的第四方面,本发明提出了一种核酸样本测序方法。根据本发明的实施例,该核酸样本测序方法包括:根据前面所述的方法,构建测序文库;以及对所述测序文库进行测序,以便获得测序结果。利用该方法,能够有效的对RNA转录本进行测序,能够同时应用于真核和原核的RNA的TSS的高通量测序,具有操作简单,准确率高和成本低的众多优点。根据本发明的实施例,所述测序利用Illumina Hiseq2000> Genome Analyzer、SOLiD测序系统、1n Torrent、1n Proton、454、PacBio RS 测序系统、Helicos tSMS 技术以及纳米孔测序技术的至少一种 进行的。由此,能够利用这些测序装置的高通量、深度测序的特点,进一步提高了测序的效率。在本发明的一个实施例中,所述测序是利用IlluminaHiseq2000 进行的。
[0045]根据本发明的第五方面,本发明提出了一种确定TSS的方法。根据本发明的实施例,该确定TSS的方法包括:从宿主提取RNA样本;利用前面所述的方法,获得由多个测序序列构成的测序结果;以及基于所述测序结果,确定TSS。利用该方法,能够有效的确定核酸样本中的TSS。
[0046]根据本发明的一个实施例,所述RNA样本为宿主的总RNA的至少一部分。根据本发明的实施例,宿主可以为真核生物,例如人,也可以为原核生物,例如大肠杆菌。
[0047]根据本发明的一个实施例,基于所述测序结果,确定TSS,进一步包括:将所述测序数据与参考序列进行比对;
[0048]基于比对结果,确定所述转录起点,
[0049]其中,所述参考序列中包含预定基因的5’ -UTR序列的至少一部分,选择能够和所述参考序列对上、且在所述参考序列最上游的测序序列作为阳性序列,并且确定所述阳性序列的第一位碱基作为所述转录起始位点。这里所使用的术语“预定基因”指的是,在参考基因组上,预先设定了一系列基因的可能包括的范围,这些基因可能是已知的,也可以是未知而通过生物信息学推测出来的。根据本发明的实施例,参考序列的长度并不受特别限制,根据本发明的实施例,参考序列至少包含预定基因的翻译起始位点及其上游预定长度的序列。由于转录起始位点在翻译位点的上游,因而,通过选择参考序列的长度,可以将转录起始位点包括在其中。例如,根据本发明的实施例,针对原核宿主,所述参考序列包含所述预定基因的翻译起始位点与该翻译起始位点上游700bp位点之间的核酸序列,针对真核宿主,所述参考序列包含所述预定基因的翻译起始位点与该翻译起始位点上游5000bp位点之间的核酸序列。
[0050]根据本发明的一个实施例,可以采用SOAP Alignment进行所述比对。在本发明中,通过一种短序列映射程序soapalignment v2.2,将高通量测序技术得到的干净的序列片段分别比对到参考基因组和参考基因序列上,不允许喊基的错配。参考基因组序列和参考基因序列可取于公共数据库。
[0051]根据本发明的一个实施例,进一步包括对所述阳性序列进行筛选,其中所述筛选的原则是:所述阳性序列的数目是比对到所述预定基因内部的测序序列数目平均值的N倍以上,其中所述N为大于I的实数,优选地,所述N为至少10的实数。根据本发明的实施例,比对后,可以首先对比对结果进行筛选,以获得可靠地TSS信息。筛选方法为:假设干净序列比对到基因(与预定基因对应的序段)的第一个位置即为原始的TSS,但是这些序列有可能是比对到基因的内部成为假阳性的TSS,所以需要再进一步进行过滤。该方法可以使获得的序列在基因的5’端富集,因此真实的TSS的序列数会比落在基因内部的序列的平均数要高,于是在他们之间引进一个倍数N过滤TSS,即筛选的TSS的序列数要是落在对应的基因内部序列数平均值的N倍才将 其认定为真实的TSS。根据本发明的实施例,N可以是至少为10的实数。
[0052]根据本发明的一个实施例,进一步包括对筛选结果进行卡方检验。根据本发明的
一个实施例,所述卡方检验的检验值为3.84以上时,即置信度大于95%。根据本发明的实施
例,过滤后,对于过滤结果本方法使用卡方检验来验证其可靠性,具体地,在上一实施例的
基础上,计算所有的TSS对应的倍数的平均值,以及他们的标准差,标准化之后,用下述公
式计算卡万值
【权利要求】
1.一种从RNA样本富集转录本的方法,其特征在于,包括: 利用富集试剂对RNA样本进行处理,以便富集转录本, 其中, 所述富集试剂具有5’ -单磷酸外切酶活性, 所述转录本为在其5’末端具有帽子结构或三磷酸基团的RNA分子。
2.—种构建测序文库的方法,其特征在于,包括: 根据权利要求1所述的方法,从RNA样本富集转录本; 去除所述转录本的帽子结构或三磷酸基团,以便获得去除帽子结构或三磷酸基团的转录本; 在去除帽子结构或三磷酸基团的转录本的5’末端连接RNA接头,以便获得连接有RNA接头的转录本; 对连接有RNA接头的转录本进行反转录,以便获得与所述转录本对应的cDNA ; 对所述cDNA进行扩增,以便获得扩增产物;以及 基于所述扩增产物,构建测序文库, 任选地,利用末端修整试剂去除所述转录本的帽子结构或三磷酸基团,其中,所述末端修整试剂具有烟草酸焦磷酸酶活性, 任选地,所述反转录的反转录引物在其末端具有与所述RNA接头相对应的序列, 任选地,所述反转录采用具有SEQ `ID NO:1所示序列的寡核苷酸作为反转录引物, 任选地,所述反转录引物中至少一个N被硫代修饰, 任选地,所述反转录引物中倒数第二个N被硫代修饰。
3.一种测序文库,其特征在于,是由权利要求2~4任一项所述的方法构建的。
4.一种核酸样本测序方法,其特征在于,包括: 根据权利要求2所述的方法,构建测序文库;以及 对所述测序文库进行测序,以便获得测序结果, 任选地,所述测序利用 Illumina Hiseq2000> Genome Analyzer、SOLiD 测序系统、1nTorrent、1n Proton、454、PacBio RS测序系统、HelicostSMS技术以及纳米孔测序技术的至少一种进行的。
5.一种确定转录起点的方法,其特征在于,包括: 从宿主提取RNA样本; 利用权利要求4所述的方法,获得由多个测序序列构成的测序结果;以及 基于所述测序结果,确定转录起点, 任选地,所述RNA样本为宿主的总RNA的至少一部分, 任选地,基于所述测序结果,确定转录起点,进一步包括: 将所述测序数据与参考序列进行比对; 基于比对结果,确定所述转录起点, 其中,所述参考序列中包含预定基因的5’ -UTR序列的至少一部分,选择能够和所述参考序列对上、且在所述参考序列最上游的测序序列作为阳性序列,并且确定所述阳性序列的第一位碱基作为所述转录起始位点, 任选地,针对原核宿主,所述参考序列包含所述预定基因的翻译起始位点与该翻译起始位点上游700bp位点之间的核酸序列,针对真核宿主,所述参考序列包含所述预定基因的翻译起始位点与该翻译起始位点上游5000bp位点之间的核酸序列, 任选地,采用SOAP Alignment进行所述比对, 任选地,进一步包括对所述阳性序列进行筛选,其中所述筛选的原则是: 所述阳性序列的数目是比对到所述预定基因内部的测序序列数目平均值的N倍以上,其中所述N为大于I的实数,优选地,所述N为至少10的实数。
6.根据权利要求5所述的方法,其特征在于,进一步包括对筛选结果进行卡方检验, 任选地,所述卡方检验的检验值为3.84以上。
7.一种用于从RNA样本富集转录本的富集试剂,其特征在于,富集试剂具有5’ -单磷酸外切酶活性。
8.—种构建测序文库的装置,其特征在于,包括: 转录本富集单元,所述转录本富集装置中设置有根据权利要求7所述的富集试剂,以便从RNA样本富集转录本; 末端修整单元,所述末端修整单元与所述转录本富集单元相连,并且适于去除所述转录本的5’帽子结构或5’三磷酸, 以便获得去除5’帽子结构或5’三磷酸的转录本; RNA接头连接单元,所述RNA接头连接单元与末端修整单元相连,并且适于在去除5’帽子结构或5’三磷酸的转录本的5’末端连接RNA接头,以便获得连接有RNA接头的转录本;反转录单元,所述反转录单元与所述RNA接头连接单元相连,并且适于对连接有RNA接头的转录本进行反转录,以便获得与所述转录本对应的cDNA ; 扩增单元,所述扩增单元与所述反转录单元相连,并且适于对所述cDNA进行扩增,以便获得扩增产物;以及 文库构建单元,所述文库构建单元与所述扩增单元相连,并且适于基于所述扩增产物,构建测序文库, 任选地,所述末端修整单元中设置有末端修整试剂,其中,所述末端修整试剂具有烟草酸焦磷酸酶活性, 任选地,所述反转录单元中设置有反转录引物,所述反转录引物在其末端具有与所述RNA接头引物相对应的序列, 任选地,所述反转录引物具有如SEQ ID NO:1所示序列, 任选地,所述反转录引物中至少一个N被硫代修饰, 任选地,所述反转录引物中倒数第二个N被硫代修饰, 任选地,所述RNA接头连接单元中设置有连接试剂,其中,所述连接试剂具有T4RNA连接酶活性。
9.一种核酸样本测序设备,其特征在于,包括: 文库构建装置,所述文库构建装置为根据权利要求8所述的装置,以便针对核酸样本构建测序文库;以及 测序装置,所述测序装置与所述文库构建装置相连,并且适于对所述测序文库进行测序,以便获得测序结果, 任选地,所述测序装置为 Illumina Hiseq2000>Genome Analyzer、SOLiD测序系统、1nTorrent、1n Proton、454、PacBio RS测序系统、Helicos tSMS系统以及纳米孔测序系统的至少一种。
10.一种确定转录起点的系统,其特征在于,包括: 样品提取设备,所述样品提取装置用于从宿主提取RNA样本; 核酸样本测序设备,所述核酸样本测序设备与所述样品提取装置相连,并且所述测序装置为权利要求9所述的核酸样本测序设备,以便针对所述RNA样本进行测序,从而获得由多个测序序列构成的测序结果;以及 转录起点确定设备,所述转录起点确定装置与所述测序装置相连,并且适于基于所述测序结果,确定转录起点, 任选地,所述转录起点确定设备进一步包括: 比对装置,所述比对装置用于将所述测序数据与参考序列进行比对; 确定装置,所述确定装置适于基于比对结果,确定所述转录起点, 其中,所述参考序列中包含预定基因的5’ -UTR序列的至少一部分,并且,所述确定装置适于:选择能够和所述参考序列对上、且在所述参考序列最上游的测序序列作为阳性序列,并且确定所述阳性序列的第一位碱基作为所述转录起始位点, 任选地,所述比对装置适于采用SOAP Alignment进行所述比对,任选地,所述确定装置进一步包括筛选单元,所述筛选单元适于对所述阳性序列进行筛选,其中所述筛选的原则是:所述阳性序列的数目是比对到所述预定基因内部的测序序列数目平均值的N倍以上,其中·所述N为大于I的实数,优选地,所述N为至少10的实数,任选地,所述确定装置进一步包括检验单元,所述检验单元适于对筛选结果进行卡方检验, 任选地,所述卡方检验的检验值为3.84以上。
【文档编号】C40B50/06GK103710336SQ201210379402
【公开日】2014年4月9日 申请日期:2012年9月29日 优先权日:2012年9月29日
【发明者】祝珍珍, 黄文潘, 章文蔚, 陈茂山, 张艳艳 申请人:深圳华大基因科技服务有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1