长的非编码rna靶基因预测的方法

文档序号:525752阅读:2871来源:国知局
专利名称:长的非编码rna靶基因预测的方法
技术领域
本专利涉及ー种利用生物信息学算法进行长的非编码RNA(IncRNA)靶基因预测的方法,属于生物医药领域。
背景技术
长链非编码RNA(IncRNA)是ー类转录本长度超过200nt的RNA分子,它们并不编码蛋白,而是以RNA的形式在多种层面上(表观遗传调控、转录调控以及转录后调控等)调控基因的表达水平。IncRNA起初被认为是基因组转录的“噪音”,是RNA聚合酶II转录的副产物,不具有生物学功能。然而,近年来的研究表明,IncRNA參与了 X染色体沉默,基因组印记以及 染色质修饰,转录激活,转录干扰,核内运输等多种重要的调控过程,IncRNA的这些调控作用也开始引起人们广泛的关注。哺乳动物基因组序列中4% 9%的序列产生的转录本是IncRNA(相应的蛋白编码RNA的比例是1% ),虽然近年来关于IncRNA的研究进展迅猛,但是绝大部分的IncRNA的功能仍然是不清楚的。许多IncRNA都具有保守的ニ级结构,剪切形式以及亚细胞定位,这种保守性和特异性表明它们是具有功能的。但IncRNA的功能相对于microRNA和蛋白质的功能来说更加难以确定,因为目前并不能仅根据序列或者结构来推测它们的功能。根据它们在基因组上相对于蛋白编码基因的位置,可以将其分为(I) sense, (2)antisense, (3)bidirectional,
(4)intronic, (5) intergenic这5种类型。这种位置关系对于推测IncRNA的功能有很大帮助。根据今年来所发现的IncRNA的作用机制,IncRNA主要可能具有以下几个方面的功能I)通过在蛋白编码基因上游启动子区(桔)发生转录,干扰下游基因(蓝)的表达(如酵母中的SER3基因)。2)通过抑制RNA聚合酶II或者介导染色质重构以及组蛋白修饰,影响下游基因(蓝)表达(如小鼠中的P15AS)。3)通过与蛋白编码基因的转录本形成互补双链(紫),进而干扰mRNA的剪切,从而产生不同的剪切形式。4)通过与蛋白编码基因的转录本形成互补双链(紫),进ー步在Dicer酶作用下产生内源性的siRNA,调控基因的表达水平。5)通过结合到特定蛋白质上,IncRNA转录本(緑)能够调节相应蛋白的活性。6)作为结构组分与蛋白质形成核酸蛋白质复合体。7)通过结合到特定蛋白上,改变该蛋白的胞质定位。8)作为小分子RNAjB miRNA,piRNA的前体分子转录。大量的研究表明,在肿瘤细胞中,某些特定的IncRNA的表达水平会发生改变。这种表达水平的变化能够作为癌症诊断的标志物(有时是非常灵敏的诊断标志物,如前列腺癌中的DD3和潜在的药物靶点。相对于蛋白编码序列以及小分子RNA,IncRNA的研究还仅仅只是处于起步阶段,其功能与调控机制仍有待进ー步阐明。目前研究成果所展现出的IncRNA繁多的分子生物学功能,如调节转录模式,调控蛋白活性,改变RNA的剪切模式等等,为人们提出了一个从未涉足的调控领域。当下IncRNA的主要研究方向仍然是通过原位杂交技木,过表达技木,siRNA介导的基因沉默技术来发现更多新的IncRNA,为目前的调控模式提供更多的支持和完善。这种传统的手段固然精确,然而却缺乏效率,随着更多高通量筛查技术的发展,如MiciOarray芯片杂交技木,新一代高通量测序技木,结合生物信息学的预测工具,人们将能够更快更有效率的发现那些具有重要调控功能的IncRNA。

发明内容
本发明的目的是发明了ー种利用生物信息学相关算法来对IncRNA调控的靶基因进行功能预测的方法,以便更高效的对IncRNA的功能进行研究。本发明采用的技术方案是I. IncRNA的基因组定位ncRNA的基因组定位分为3类ー类是内含子反义转录本,内含子反义转录本一般抑制靶基因的表达。另ー类是编码区反义转录本,编码区反义转录本一般也是抑制靶基因的表达,第三类是基因间非编码转录本,基因间非编码转录本则比较复杂,一般认为对临近的上下游基因具有调节作用2.靶基因预测靶基因分为Cis作用和trans作用。Cis作用是IncRNA的ー种靶 基因作用方式,在启动子区域同向转录的靶基因一般是促进表达作用,反向则一般为抑制作用。而在3’ -UTR区域时,部分情况下反向也为促进表达。trans作用是IncRNA的另ー种靶基因作用方式,IncRNA与靶基因不考虑位置关系,通过碱基配对互相识别。我们利用RNAplex(http://www. tbi. univie. ac. at/ htafer/)确定 IncRNA 的可能的革巴基因。我们预先将 IncRNA 与蛋白编码基因进行 blast (http://www. ncbi. nlm. nih. gov/BLAST/)比对(參数为e < 1E-5)然后利用RNAplex进行进ー步的筛选(參数为RNAplex_e_20)。本发明与现有技术相比的优点是I.系统的阐述了 IncRNA不同的基因组定位,其靶基因的作用方式有很大差别。2.针对不同的基因组定位方式,设了相应的靶基因预测程序。3.可以高通量的对IncRNA的靶基因进行大規模的预测。实施方式以前列腺癌相关的lncRNA_DD3为例,举例说明其靶基因预测流程I.基因组定位DD3位于人的9q21_22,长度为3735bp,位于基因PRUNE2内含子的反义链上。2. Cis作用靶基因预测Cis方式作用于邻近基因或宿主基因,因此我们推測DD3的Cis作用的靶基因为PRUNE2 ;3. trans作用祀基因的预测trans作用是IncRNA的另ー种祀基因作用方式,IncRNA与靶基因不考虑位置关系,通过碱基配对互相识别。我们利用RNAplex软件确定IncRNA的可能的靶基因。我们预先将IncRNA与蛋白编码基因进行blast比对(e < 1E-5)然后利用RNAplex进行进一歩的筛选(參数选择RNAplex-e-20),结果发现DD3(基因组位置 3571bp 3735bp)与基因 NM_002262 (KLRD I, killer cell lectin-like receptorsubfamily D, member I (KLRDl), transcript variant I, chrl2 10361117-10351683[+])存在164bp的配对,因此KLRDl可能是DD3的ー个trans作用靶基因。以上是对本发明的描述而非限定,基于本发明思想的其它实施方式,均在本发明的保护范围之中。
权利要求
1.一种适用于长的非编码RNA靶基因预测的方法,其特征在于 本发明采用的技术方案是 步骤一 =IncRNA的基因组定位ncRNA的基因组定位分为3类一类是内含子反义转录本,内含子反义转录本一般抑制靶基因的表达。另一类是编码区反义转录本,编码区反义转录本一般也是抑制靶基因的表达,第三类是基因间非编码转录本,基因间非编码转录本则比较复杂,一般认为对临近的上下游基因具有调节作用 步骤二 靶基因预测靶基因分为Cis作用和trans作用。Cis作用是IncRNA的一种靶基因作用方式,在启动子区域同向转录的靶基因一般是促进表达作用,反向则一般为抑制作用。而在3’-UTR区域时,部分情况下反向也为促进表达。trans作用是IncRNA的另一种靶基因作用方式,IncRNA与靶基因不考虑位置关系,通过碱基配对互相识别。我们利用RNAplex (http: //www. tbi. univie. ac. at/ htafer/)确定 IncRNA 的可能的祀基因。我们预先将 IncRNA 与蛋白编码基因进行 blast (http://www. ncbi. nlm. nih. gov/BLAST/)比对(参数为e < 1E-5)然后利用RNAplex进行进一步的筛选(参数为RNAplex_e_20)。
2.权利要求一中所述的两位靶基因调控方式为cis作用和trans作用,两种作用可以同时存在。
全文摘要
一种适用于长的非编码RNA(lncRNA)靶基因预测的方法。可以快速准确的对lncRNA调控的基因进行准确预测。本发明主要包括的内容是1、LncRNA的基因组定位方法。2、LncRNA两种作用方式Cis作用方式和trans作用方式的靶基因预测。
文档编号C12Q1/68GK102827923SQ20111016289
公开日2012年12月19日 申请日期2011年6月16日 优先权日2011年6月16日
发明者曾华宗 申请人:上海聚类生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1