本发明涉及非编码基因建库测序,具体提供反转录接头引物、lncrna的建库测序方法及应用。
背景技术:
1、长链非编码rna(long non-coding rna,lncrna)是一类长度在200nt以上,不编码蛋白的rna分子。近几年的研究表明,lncrna具有保守的二级结构,可以与蛋白、dna和rna相互作用,参与多种生物学过程的调控,在众多生命活动过程中发挥重要作用,具有及其重要的生理功能,这些功能主要包括:遗传印记(genetic imprinting)、基因组重排(genomerearrangement)、染色质修饰(chromatin modification)、细胞周期调控、转录、剪切、mrna降解及蛋白的翻译。
2、随着测序技术的发展,人们对lncrna在不同物种以及细胞类型的类别、丰度、生物发生和功能的了解取得了重大进展。目前已知的lncrna数量比mrna的数量多出很多,除了少数lncrna的功能比较明确外,大部分lncrna的功能都还未知。对于人类基因组来说,大约93%的dna可以转录为rna,而这些rna中,其中只有2%是编码蛋白质的mrna,而其余98%是非编码rna。在这些非编码rna中,长度超过200个碱基的rna被归类为lncrna。lncrna参与到了生命活动的各个过程,非常值得去深入研究。
3、目前研究lncrna主要通过高通量测序的方式获得转录本序列,分析lncrna的表达情况;测序一般采用短读长测序平台(如:illumina测序平台或者mgi测序平台)进行,建库方式一般先去除核糖体rna,再对剩余rna进行片段化,然后利用随机引物进行反转录,再合成双链cdna,然后加上测序接头,利用短读长测序平台进行测序。目前存在的缺点是短读长测序平台产生的reads较短,后续还需要利用生物信息学软件进行转录本拼接,拼接会产生拼接错误或拼接不完整的情况;当存在共享外显子的时候,无法确定这些reads是来源哪一条转录本,因此短读长对转录本的定量不准确的;另外当转录本中同时存在多种可变剪切类型时,短读长的reads长度不足,因此无法鉴定同时存在多种可变剪切类型的转录本。
4、随着测序技术的发展,长读长测序在基因组以及转录水平的应用越来越广泛,但目前尚缺乏基于长读长测序平台针对lncrna的研究方法,也有一些报道利用腺苷酸聚合酶对lncrna末端添加多聚腺苷酸polya尾,然后利用mrna建库的方式进行测序,但该方法丢失了polya长度信息,而polya长度信息对于mrna稳定以及表达至关重要。
技术实现思路
1、本发明的目的在于提出反转录接头引物、lncrna的建库测序方法及应用,用于解决目前基于短读长测序平台reads长度受限制的问题,同时能够解决基本长读长测序平台丢失polya长度信息的问题。
2、鉴于此,本发明的方案为:
3、本发明的第一个方面,提出反转录接头引物,包括如seq id no:1-7所示的核苷酸序列。
4、本发明的第二个方面,提出lncrna测序文库的构建方法,步骤包括:
5、s1.提取样本rna;
6、s2.去除rrna,产物连接权利要求1所述的反转录接头引物;
7、s3.对连接产物进行反转录合成cdna;
8、s4.以cdna为模板进行pcr扩增;
9、s5.扩增产物进行末端修复及加da尾;
10、s6.连接测序接头,对文库进行纯化。
11、进一步地,所述反转录接头引物中,5'端分别使用磷酸化修饰,seq id no:1所示序列的3'端进行c6氨基修饰。
12、进一步地,步骤s1中对提取rna的纯度、总量、完整性进行检测。
13、进一步地,步骤s1中所述rrna包括真核rrna和/或原核rrna;和/或,所述去除rrna的试剂盒为ribo-offrrnadepletionkit。
14、进一步地,所述样本中rna包括细胞或组织来源的总rna、rna结合蛋白免疫沉淀的rna、不同细胞器来源的rna中的至少一种。
15、本发明的第三个方面,提出lncrna测序文库,由第二个方面提出所述的构建方法得到。
16、本发明的第四个方面,提出lncrna测序的方法,包括对第三个方面所述测序文库基于长读长测序平台进行测序的步骤。
17、进一步地,所述测序步骤将测序文库加载到ont测序芯片,获得测序数据。
18、本发明的第五个方面,提出第二个方面所述的构建方法、或第三个方面所述的lncrna的测序文库,在制备疾病筛查、预后评估、科学基础研究和/或临床疗效监测的产品中的应用。
19、相对于现有技术,本发明的有益效果为:
20、1.本发明提供的反转录接头引物,用于长读长测序平台lncrna建库测序时能够同时捕获腺苷酸化的mrna以及无polya结构的lncrna,解决polya长度信息丢失的问题。
21、2.本发明提供基于长读长测序平台针对lncrna测序的建库测序方法,通过检测转录本表达量及丰度,获得可变剪接信息,且同时能够获得序列polya尾长度信息,对于目前的lncrna研究,有着非常重要的意义。
1.反转录接头引物,其特征在于,包括如seq id no:1-7所示的核苷酸序列。
2.lncrna测序文库的构建方法,其特征在于,步骤包括:
3.根据权利要求2所述的构建方法,其特征在于,所述反转录接头引物中,5'端分别使用磷酸化修饰,seq id no:1所示序列的3'端进行c6氨基修饰。
4.根据权利要求2所述的构建方法,其特征在于,步骤s1中对提取rna的纯度、总量、完整性进行检测。
5.根据权利要求2所述的构建方法,其特征在于,步骤s1中所述rrna包括真核rrna和/或原核rrna;和/或,所述去除rrna的试剂盒为ribo-offrrna depletion kit。
6.根据权利要求2所述的构建方法,其特征在于,所述样本中rna包括细胞或组织来源的总rna、rna结合蛋白免疫沉淀的rna、不同细胞器来源的rna中的至少一种。
7.lncrna测序文库,由权利要求2~6任一项所述的构建方法得到。
8.lncrna测序的方法,包括对权利要求7所述测序文库基于长读长测序平台进行测序的步骤。
9.根据权利要求8所述的方法,其特征在于,所述测序步骤将测序文库加载到ont测序芯片,获得测序数据。
10.权利要求2至6中任一项所述的构建方法、或权利要求7所述的lncrna的测序文库,在制备疾病筛查、预后评估、科学基础研究和/或临床疗效监测的产品中的应用。