一种基于长链非编码RNA的分子标记物鉴定方法与流程

文档序号:11582667阅读:763来源:国知局

本发明涉及一种基于长链非编码rna的分子标记物鉴定方法,属于高通量组学技术在生物医学无创检测应用领域。



背景技术:

长链非编码rna(lncrna)是在真核生物中新发现的一类长度大于200个核苷酸且没有长阅读框架,但这类rna往往具有mrna结构特征(帽式结构和polya尾巴)的rna。

在人类重大疾病,如癌症的发生机制和控制方面,该类lncrna的功能日趋明显和重要。目前临床已发现很多复杂疾病都与ncrna有关:如致死性新生儿线粒体肌病、亚急性坏死性脑脊髓综合征等与trna有关,自体免疫性疾病如红斑狼疮、斯耶格伦综合征等与snrna有关,一些自体免疫性疾病如硬皮病与snorna有关等,近年来相关研究文献中还发现,一些ncrna与肿瘤抑制和生成的细胞凋亡直接相关,其变异将导致细胞发育异常或产生癌变。

目前新一代高通量芯片和测序技术快速发展,产生了大量的rna高通量数据。该技术的应用体现在不同层面上:(1)全基因组范围内的重测序或者更有针对性的检测点突变和核苷酸多态性;(2)染色体结构重组的映射分析,其中包括拷贝数变异、染色体平衡易位断点和倒置;(3)rna-seq,类似于表达序列标签(est)或连续分析的基因表达(sage),对mrna或小rna进行深度测序,测到的读段数可以用来量化每个物种在广泛的动态范围内的基因表达,测到的序列本身也可以用来对基因组进行注释;(4)染色质免疫沉淀测序chip-seq,或全基因组dna-蛋白质相互作用分析,方法是对染色质免疫共沉淀实验得到的dna片段进行深度测序。目前在已经推出的几种新一代测序平台中,illumina/solexa测序平台上rna-seq应用范围最广。

产生关于长链非编码rna高通量组学原始信息主要有高通量rna-seq测序技术。伴随着新类型表达数据的产生,预测长非编码rna的方法也得到了发展,比如lincrna的方法,它可以综合序列、结构和表达数据,其中表达数据来源于高通量芯片或测序技术。除此之外,该模型还包括其他特性,它可以把ncrna从其他基因元件中分离出来。这个方法与之前的方法相比,在确定ncrna中具有更高的准确性,多种类型数据经整合后,相互补充产生了综合方法特有的优势,这是只利用单一类型数据所不能实现的。



技术实现要素:

目的:为解决现有lncrna分子标记物检测与分析技术的不足,本发明开展对lncrna分子标记物在全基因组范围进行检测和分析技术的研究,提供一类基于多源基因组信息互验型的检测与分析途径。本发明提出的方法涉及多染色体链和多片段的拼接和重组定位等系列先前步骤;其次根据全局染色体片段定位信息并结合高通量组学的信息在全部细胞系中进行全染色体组型筛查,对照多态参考组,综合多路分析方法与结果,最终实现在染色体双链中的高危及致癌关联片段上对lncrna的类型及其功能进行有效的检测与诊断。

技术方案:为解决上述lncrna分子标记物的鉴定及分析技术问题,本发明采用的具体方案为:

步骤(1):基于重亚硫酸盐加克隆测序rrbs和基因微阵列sage的全基因组dna甲基化水平检测与分析。该步骤具体包含下述几个环节:

1)利用重亚硫酸氢钠在碱性条件和氢醌的催化下处理dna,可使非甲基化的胞嘧啶发生脱氧基反应,从而转变成尿嘧啶,而甲基化胞嘧啶不发生反应;

2)通过dna直接测序、限制性内切酶分析以及设计不同引物的pctr扩增等方法测出相应序列的甲基化水平;

3)结合rt-pcr扩增实验,进一步验证上述步骤所得结论的可重复性和可信度。

4)利用基因微阵列sage技术构建样本文库,并进行测序和定位分析,从而获得相关蛋白在全基因组内的分布特征及状态水平信息;基于细胞系或组织样本进行基因微阵列sage技术的全基因组dna甲基化水平图谱的构建;

5)基于多样本数据进行批次效益等预处理后,进行相关位点的全基因组定位和差异化位点鉴定。

步骤(2):基于染色质免疫共沉淀chip的全基因组转录绑定位点检测与分析。该步骤具体包含下述内容:

1)利用染色质免疫共沉淀chip技术,结合基因芯片技术,完善相关细胞系或组织样本中目标蛋白与基因组中dna等关键研究对象的全基因组定位等步骤;

2)利用基因组位点以及前期测序丰度等关键信息,确定目标蛋白与基因组中dna相互作用位点;并在rt-pcr扩增实验的基础上进一步验证结论的可重复性和可信度;

3)结合二代测序技术,确定转录因子绑定位点等信息,并以此考查和验证上述结论的可靠性。

步骤(3):基于rna-seq技术,在全基因范围对lncrna水平检测与分析进行测序和统计分析;

1)样品提取总rna后,对于真核生物,用带有oligo(dt)的磁珠富集mrna,对于原核生物,先去除rrna,向得到的mrna中加入fragmentationbuffer使其片断成为短片段,再以片断后的mrna为模板,用六碱基随机引物(randomhexamers)合成cdna第一链;

2)加入缓冲液、dntps、rnaseh和dnapolymerasei合成cdna第二链,经过qiaquickpcr试剂盒纯化并加eb缓冲液洗脱经末端修复、加碱基a,加测序接头,再经琼脂糖凝胶电泳回收目的大小片段,并进行pcr扩增,从而完成整个文库制备工作,构建好的文库用illuminahiseq2000进行测序;

3)全基因组范围开展基于rna-seq数据的rna转录本差异表达分析,获取lncrna等候选组信息。

步骤(4):基于上述实验步骤和相关结论,结合多源信息融合的途径,对lncrna表达水平进行定性和定量化的评价与鉴定,并结合后续验证实验,对lncrna作为生物标记物的可靠性进行验证。

上述步骤的计算分析可以结合适当实验验证环节来开展,从而使得实验与计算部分的结论具有较高的可信度和可重复性,同时能够在试验和计算可控范围内,大大提高lncrna分子生物标记物的检测和分析精度,缩小检测和鉴定的时间。

本发明基于现有rna-seq分子表达水平检测与实验设备,提出了多源组学信息融合互验的检测和分析途径。相关的检测和分析对象可以采用实验室常用的细胞系和组织样本,因此具有较大的适用范围和市场前景。

有益效果:本发明综合利用rna-seq技术、染色质免疫共沉淀chip技术、重亚硫酸盐加克隆测序rrbs技术和基因微阵列sage技术,开创性提出了多源基因组学资源融合的lncrna分子生物标记物的检测与分析技术,填补了国内外在此项研究上的空白;能够实现多源实验平台组学信息的快速整合、lncrna分子生物标记物的高精度检测与分析等用途,并且具有软硬件实现成本较低,适用范围较广的优点。

另外该技术方法具有工艺相对简单,能综合现有技术条件和资源信息,不需要特殊运行条件,对环境无污染等特点。

附图说明

图1为基于多源组学互验知识的lncrna分子标记物检测与分析技术流程图。

具体实施方式

下面结合附图对本发明作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。

如图1所示,一种基于长链非编码rna的分子标记物鉴定方法,具体步骤如下:

步骤(1):基于重亚硫酸盐加克隆测序rrbs和基因微阵列sage的全基因组dna甲基化水平检测与分析。该步骤具体包含下述几个环节:

1)利用重亚硫酸氢钠在碱性条件和氢醌的催化下处理dna,可使非甲基化的胞嘧啶发生脱氧基反应,从而转变成尿嘧啶,而甲基化胞嘧啶不发生反应;

2)通过dna直接测序、限制性内切酶分析以及设计不同引物的pctr扩增等方法测出相应序列的甲基化水平;

3)结合rt-pcr扩增实验,进一步验证上述步骤所得结论的可重复性和可信度。

4)利用基因微阵列sage技术构建样本文库,并进行测序和定位分析,从而获得相关蛋白在全基因组内的分布特征及状态水平信息;基于细胞系或组织样本进行基因微阵列sage技术的全基因组dna甲基化水平图谱的构建;

5)基于多样本数据进行批次效益等预处理后,进行相关位点的全基因组定位和差异化位点鉴定。

步骤(2):基于染色质免疫共沉淀chip的全基因组转录绑定位点检测与分析。该步骤具体包含下述内容:

1)利用染色质免疫共沉淀chip技术,结合基因芯片技术,完善相关细胞系或组织样本中目标蛋白与基因组中dna等关键研究对象的全基因组定位等步骤;

2)利用基因组位点以及前期测序丰度等关键信息,确定目标蛋白与基因组中dna相互作用位点;并在rt-pcr扩增实验的基础上进一步验证结论的可重复性和可信度;

3)结合二代测序技术,确定转录因子绑定位点等信息,并以此考查和验证上述结论的可靠性。

步骤(3):基于rna-seq技术,在全基因范围对lncrna水平检测与分析进行测序和统计分析;

1)样品提取总rna后,对于真核生物,用带有oligo(dt)的磁珠富集mrna,对于原核生物,先去除rrna,向得到的mrna中加入fragmentationbuffer使其片断成为短片段,再以片断后的mrna为模板,用六碱基随机引物(randomhexamers)合成cdna第一链;

2)加入缓冲液、dntps、rnaseh和dnapolymerasei合成cdna第二链,经过qiaquickpcr试剂盒纯化并加eb缓冲液洗脱经末端修复、加碱基a,加测序接头,再经琼脂糖凝胶电泳回收目的大小片段,并进行pcr扩增,从而完成整个文库制备工作,构建好的文库用illuminahiseq2000进行测序;

3)全基因组范围开展基于rna-seq数据的rna转录本差异表达分析,获取lncrna等候选组信息。

步骤(4):基于上述实验步骤和相关结论,结合多源信息融合的途径,对lncrna表达水平进行定性和定量化的评价与鉴定,并结合后续验证实验,对lncrna作为生物标记物的可靠性进行验证。

上述步骤的计算分析可以结合适当实验验证环节来开展,从而使得实验与计算部分的结论具有较高的可信度和可重复性,同时能够在试验和计算可控范围内,大大提高lncrna分子生物标记物的检测和分析精度,缩小检测和鉴定的时间。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明技术原理的前提下,还可以做出若干改进和变形,这些改进和变形也应视为本发明的保护范围。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1