一种非编码基因的高通量鉴定方法

文档序号:410839阅读:741来源:国知局
专利名称:一种非编码基因的高通量鉴定方法
技术领域
本发明涉及生物技术领域中的基因鉴定方法,特别是HIiCT0RNA基因的鉴定方法。
背景技术
microRNA或称为miRNA,即微RNA,是一类内源性非编码的单链RNA小分子;1993年在秀丽线虫{Caenorhabditis eIegans)中首次被Lee等人发现(/ed),其转录后调控作用得到了学界的广泛认可。在动物、植物和微生物(病毒)中广泛存在,并具有一定保守性。microRNA通常由6(Tl20 nt的前体分子在酶的加工下形成,成熟体长度一般为19^25 nt。microRNA通过与靶基因碱基互补配对来实现其生物学功能,在细胞命运决定中具有重要的调控作用。microRNA是基因表达、修饰和翻译的调节者。近年来的研究发现,microRNA在干细胞的自我复制、定向分化和组织再生中,都起着非常重要的作用,并且参与了细胞周期、细胞重编程,信号转导、代谢调控等重要的生命过程。而细胞是组成生命体的一个基础,细胞代谢上的障碍将会导致癌症、心脑血管疾病、发育异常、农作物疾病……因此,microRNA涉及了发育、疾病以及粮食等一系列重大问题。同时,microRNA也正在成为 新型的biomarker,是疾病诊断分型与新型药物研发中的新星。microRNA的研究多次入选Science年度十大科技进展,已经成为生物科技领域的研发热点。基因鉴定是microRNA研究中的基础。microRNA的鉴定方法主要有2大类基于实验的方法与结合计算机分析的高通量鉴定,前者能较为准确的鉴定出研究对象中的microRNA基因,但一次鉴定的数目有限,并且需要依托基因组信息来验证;后者弥补了前者的不足,可以完成对研究对象批量的系统鉴定,并具有准确性。随着生物技术领域高通量方法的发展,后者成为了新兴的研究方法,并日益成为主流。目前,结合计算机分析的高通量鉴定可分为以下3种(1)基于比较基因组学的序列保守性预测,这种方法在物种间保守的microRNA基因具有一定预测效果,而对物种特有的microRNA基因的鉴定效果不佳。由于不同物种间基因组的差异,导致研究对象中不一定存在该microRNA前体,使得方法I具有一定假阳性。(2)对已完成基因组测序的模式生物,可以结合小RNA测序进行microRNA 预测将小RNA测序的Reads匹配到基因组上进行延伸,获得microRNA的候选前体序列;从而通过模拟microRNA生物学合成的方法来系统鉴定microRNA。但对于大量的没有完成基因组测序的生物,这一方法并不适用;而完成基因组全测序是一个耗时并且价格昂贵的工作,限制了方法2在未完成基因组测序的生物中的应用。(3)用EST替代基因组序列是方法2的一种退而求其次的选择,由于EST序列在基因组中的覆盖度低、数据量不足和零散分布等原因,使得方法3鉴定的microRNA不全面。基于以上原因,目前已经鉴定出的microRNA数目仍然十分有限,许多新的microRNA有待于被鉴定,其具有独特功能有待于被发掘。因此,要在基因组的水平大量鉴定microRNA,研发出一种经济而系统的microRNA高通量鉴定方法显得十分必要
发明内容
本发明的目的是建立一种非编码基因的高通量鉴定方法,特别适用于microRNA基因的检测,尤其是对未完成基因组测序的生物的microRNA基因的高通量鉴定。本发明通过以下方案达到上述目的。一种非编码基因的高通量鉴定方法,其包括以下步骤
(1)提取样品总DNA,进行DNA测序,并将测序结果拼接成contig序列;
(2)提取样品总RNA,从中分离长度为18 30nt的小RNA,对小RNA进行测序;
(3)将小RNA测序的Reads匹配到DNA的c ontig序列上进行两端延伸,获得候选前体序列;
(4 )利用计算机软件对候选前体序列进行高通量鉴定。优选地,步骤(I)中对DNA 测序的方法为 454、Solexa、SOLiD、illumina、HiSeq 或Helicos方法中的一种或多种;contig序列的长度大于所测基因的前体要求的长度;采用2倍以上的覆盖度(coverage)对研究对象进行DNA测序。优选地,步骤(4)中使用二级结构折叠、自由能计算、综合罚分中的一种或多种对候选前体序列进行分析。上述方案可以对基因进行高通量鉴定,并且尤其适合于microRNA基因的鉴定。当所述基因为microRNA时,步骤(I)中contig序列的长度大于或等于60nt。更优选地,所述microRNA为没有基因组图谱物种的microRNA。但是本发明的方法并不局限于未完成基因组测序的生物,对已有基因组的生物同样适用,可用于对生物体microRNA系统梳理与校对。所述基因还可以是具有前体结构的小RNA。由于本方法采用了 DNA高通量测序结合小RNA测序的方法,将小RNA片段延长获得候选前体,这一特点不局限于microRNA,因此本发明同样适用于具有前体结构的小RNA的检测。本发明具有以下有益效果由于本发明采用的是DNA高通量测序的方法,其结果能够覆盖研究对象的基因组,其拼接结果平均长度达到了 500 nt以上,满足microRNA前体长度(60 nt以上)需要。因此,这一研究设计与通常的基因组测序的研究目的不同,并且不涉及进行基因组精细图的绘制,成本较低,是一种经济而有效的microRNA高通量鉴定方法。


图I本发明实施例的步骤模块示意 图2本发明实施例的DNA测序结果的质量检测 图3本发明实施例的小RNA测序结果的质量检测 图4本发明实施例的DNA拼接结果 图5本发明实施例的microRNA鉴定结果 图6本发明实施例的microRNA高通量鉴定效果与已有基因组物种的对比 图7本发明实施例的microRNA高通量鉴定效果与EST方法的对比图。
具体实施方式
实施例食用型香蕉(ifesa sp.)叶片microRNA的高通量鉴定 参考图I所示步骤进行高通量基因鉴定。I.样品总DNA提取与质量检测
香蕉 DNA 采用 E. Z. N. A. HP Plant DNA Kit (Omega ,D2485-00)方法提取。DNA 样品经NanoDrop检测,浓度为75 ng/u L ;0D260/280值为2. 00,产量为6 u go2.对DNA样品进行高通量测序
香蕉基因组C值为0. 58 0. 78 pg (1C),均值为0.66 pg。预测基因组大小为6 X IO8bpo DNA样品采用500bp插入文库,经cluster制备后,采用全基因组鸟枪法(WGS)测序,总测序量不低于6X IO9 bpo3.样品总RNA提取与质量检测
香蕉 RNA 米用 Plant/Fungi Total RNA Purification Kit (Norgen Cat# 25800,31300, 31900)方法提取。RNA 样品经 NanoDrop 检测,浓度为 660 ng/y L ;0D260/280 值为
2.07,产量为 20 u g04.对RNA样品进行小RNA测序
从总RNA中分离小RNA (—般为18 30nt),加接头并纯化。经RT-PCR、建立小RNA文库后,上机进行测序(实施例中采用Illumina Genome Analyzer平台)。5.对DNA、RNA结果进行质量控制与序列预处理
去掉实验中加入的接头等杂质序列后,采用对测序结果进行质量控制,去除低质量序列(实施例中采用FastQC等软件)。并完成后续分析所需的序列格式转换。质量检测结果请参见图2和图3。6.对DNA预处理结果进行拼接
对预处理后的DNA测序结果进行拼接,获得contig的N50为I. 2kp,其长度大于microRNA前体(一般为70-120 bp),满足microRNA候选前体的要求。(实施例中综合采用ABySS> CAP、iAssembler、SOAPdenobo> Velvet等序列拼接软件)。拼接结果参见图4。7.以DNA测序拼接结果作为microRNA候选前体,结合小RNA测序预处理结果,利用软件进行microRNA高通量鉴定。将contig序列集结合预处理后的小RNA测序数据集,用程序进行分析。得到microRNA前体为159条,成熟体为126条,星号序列为150条,其中新microRNA为77条,而84条星号序列为测序实验中获得,说明结果可靠。数据量与已测序物种葡萄(双子叶植物)、二穗短柄草(单子叶植物)、高粱(单子叶植物)等相当。结果参见图5、图6和图7。权利要求
1.一种非编码基因的高通量鉴定方法,其特征在于包括以下步骤 (1)提取样品总DNA,进行DNA测序,并将测序结果拼接成contig序列; (2)提取样品总RNA,从中分离长度为18 30nt的小RNA,对小RNA进行测序; (3)将小RNA测序的Reads匹配到DNA的contig序列上进行两端延伸,获得候选前体序列; (4 )利用计算机软件对候选前体序列进行高通量鉴定。
2.如权利要求I所述的鉴定方法,其特征在于步骤(I)中对DNA测序的方法为454、Solexa、illumina、SOLiD、HiSeq 或 Helicos 方法中的一种或多种。
3.如权利要求I所述的鉴定方法,其特征在于步骤(I)中contig序列的长度大于所测基因的前体要求的长度。
4.如权利要求I所述的鉴定方法,其特征在于步骤(I)中采用2倍以上的覆盖度对研究对象进行DNA测序。
5.如权利要求I所述的鉴定方法,其特征在于步骤(4)中使用二级结构折叠、自由能计算、综合罚分中的一种或多种对候选前体序列进行分析。
6.如权利要求1-5中任一项所述的鉴定方法,其特征在于所述基因是microRNA。
7.如权利要求6所述的鉴定方法,其特征在于步骤(I)中contig序列的长度大于或等于60nt。
8.如权利要求6所述的鉴定方法,其特征在于所述microRNA是没有基因组图谱物种的 microRNA。
9.如权利要求6所述的鉴定方法,其特征在于获得的microRNA包含microRNA前体、成熟体与星号序列。
10.如权利要求1-5中任一项所述的鉴定方法,其特征在于所述基因是具有前体结构的小RNA。
全文摘要
本发明公开了一种非编码基因的高通量鉴定方法,包括以下步骤(1)提取样品总DNA,进行DNA测序,并将测序结果拼接成contig序列;(2)提取样品总RNA,从中分离长度为18~30nt的小RNA,对小RNA进行测序;(3)将小RNA测序的Reads匹配到DNA的contig序列上进行两端延伸,获得候选前体序列;(4)利用计算机软件对候选前体序列进行高通量鉴定。该发明主要针对于没有基因组图谱物种的microRNA及其基因的系统鉴定,发现新的非编码RNA基因;对已有完成基因组测序的生物同样适用;且不局限于microRNA,同样适用于具有前体结构的小RNA的检测。
文档编号C12Q1/68GK102747147SQ201210170788
公开日2012年10月24日 申请日期2012年5月29日 优先权日2012年5月29日
发明者周惠, 屈良鹄, 廖建友, 杨建华, 温俊志, 郑凌伶 申请人:中山大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1