一种进行microRNA与蛋白相互作用研究的方法

文档序号:5873994阅读:168来源:国知局
专利名称:一种进行microRNA与蛋白相互作用研究的方法
技术领域
本发明属于生物技术领域,涉及一种基于文献挖掘技术进行microRNA与蛋白相互作用研究的方法。
背景技术
MicroRNA (微小核糖核酸)是一种长度为18 25核苷酸单链的内源性非编码性微小RNA。它主要通过与靶标基因3'非翻译区的完全或不完全配对,抑制其翻译,从而参与调控个体发育、细胞凋亡、增殖及分化等生命活动。在病理条件下,microRNA可通过调控其靶标基因及其参与的信号通路,影响肿瘤的发生和发展,发挥着类似于癌基因或抑癌基因的功能。实验表明在很多肿瘤中,一些类型的microRNA是高表达的,这些高表达的 microRNA与肿瘤的侵入性、转移性等有一定的相关性。这些microRNA为肿瘤诊断和治疗提供了新的策略。蛋白质是一类复杂的有机化合物,其基本组成单位是氨基酸。氨基酸通过脱水缩合反应结合成肽链,再由一条或多条肽链以不同空间结构形成的生物大分子便是蛋白质。 蛋白质是一切生命的物质基础,是具细胞结构生物机体的重要组成部分,对于高等生物尤其是我们人类的生长发育非常重要。人体中的蛋白质含量占了 20%左右,在大多数的人体生命活动过程中,蛋白质都频繁的参与进来并发挥着相当重要的作用。蛋白质在人类的医学研究中有着不可忽视的作用,生物学家及医学家们往往从研究生物体中蛋白质的表达与调控开始,来研究某种疾病的发病机理和治疗途径。MicroRNA多见于人体细胞中,已有许多医学研究表明,microRNA很有可能参与了人类多种疾病的形成过程,以直接调控或间接影响的方式,引起人体细胞中蛋白质的表达异常,从而导致疾病。然而,在实际的生物实验研究中,由于生物物质种类、形式和功能的多种多样,使得研究microRNA与蛋白质的相互作用以及对人类疾病的调控机制变得复杂。为了更好的研究microRNA与蛋白质之间的相互作用关系,本发明引入了一项基于NLP(自然语言处理)的文献挖掘技术。NLP(Natural Language Processing)是人工智能的一项新型技术,也是很困难的一项。它依赖于高效率的计算机,通过不断的机器学习, 实现对海量自然语言文档的高效处理,从中提取我们需要的信息。本发明中所述的文献挖掘基于这种技术,通过检索海量已经报道的文献的关键词、摘要等信息,提取出我们需要的文献信息,以节省大量重复实验所耗费的经费与时间。

发明内容
通过研究大量实验数据及相关文献我们发现,microRNA与蛋白质很可能存在其他的调控方式,为此,本发明提出一种“间接”靶基因的模型,即microRNA直接作用靶基因,靶基因表达作用于目的基因,从而使microRNA实现对目的基因的间接调控。为了研究 microRNA与蛋白质之间的相互作用,本发明设计了一套方法,其基本流程为步骤1、选择microRNA高表达的细胞,进行差异蛋白的筛选。
步骤2、microRNA靶基因的预测。步骤3、对差异蛋白和microRNA的靶基因引入文献挖掘技术,构建相互作用网络。步骤4、整合分析结果,建立microRNA与蛋白质的调控通路。步骤5、引入文献挖掘,搜索已有实验验证的文献报道,对上述调节通路进行验证。以上的分析流程基于权威性的分析软件以及已报道的有实验验证的文献资料,因此结果可信度高。


图1、本发明所述方法的实施流程2、本发明所用实例mir-144与蛋白的互作关系网络图实施方式本发明将以mir-144与蛋白的互作研究为例,介绍本发明所述方法-一种进行 microRNA与蛋白互作研究的方法,具体的实施步骤。步骤1、本实例中,我们选取mir-144高表达的肝癌细胞系Huh7细胞作为实验样本,对该细胞应用mir-144抑制剂和对照,转染Huh7细胞,并进行DIGE (荧光差异双向电泳)染色后,筛选差异蛋白,获得样本中差异蛋白的质谱数据,共19个差异表达的蛋白。步骤2、对mir-144进行靶基因的预测。这里为扩大结果范围,我们选取4种最为常用的分析软件KmicroT 3. 0 (http://diana. cslab. ece. ntua. gr/microT/)2> miRanda v5(http://microrna. Sanger, ac. uk/targets/)3> TargetScan 5. 1(http://www. targetscan. org/)4>PicTar vertebrate 2007(http://pictar. mdc-berlin. de/)取得上述4种预测软件对mir-144靶基因预测结果的合集,共935个基因,作为 mir-144的潜在靶基因。步骤3、对上述差异表达蛋白和靶基因引入文献挖掘技术,构建基因-基因的相互作用网络。方法为1、文档搜索及格式化,利用关键词mir-144进行文档搜索,并将文档整理成XML格式。2、利用Lingpipe工具包中的kntence tokenlization工具将摘要文本分离成单个句子,作为后续分析的基本单位。3、利用ABNER软件进行人类转录因子基因的描述的定位,提取出文献中出现的人类转录因子基因。4、对于提取的基因的描述中,如“ STAT3/5gene,,将被解析成STAT3gene和 STAT5gene5、将文章中的基因描述统一为官方基因符号,以方便分析和比较。基因符号以 NCBI 的 Entrez gene (http://www. ncbi. nlm. nih. gov/sites/entrez ? db = gene)数据库为准。6、先建立一个基因互作动词的词典,包含如impress,regulate, inhibit等动词及其变型,然后利用Lingpipe (http://alias-i.com/lingpipe/)工具包分离含有基因互作动词的句子。7、统计分析包含mir-144及基因或蛋白互作的句子,统计句子中基因及蛋白出现的频率。8、依据上述统计信息构建mir-144为中心的相互作用关系网络。步骤4、上述的mir-144相互作用关系网络反应了 mir_144参与的调控网络全局状况,经过分析互作关系我们发现,mir-144存在多条潜在的间接调控关系。以CALR基因为例,我们发现,CALR为mir-144的差异表达蛋白,CALR又受到IL3基因的调控,而IL3为 mir-144预测出的靶基因,于是我们得出了如下的调节通路mir-144上调IL3基因的表达, IL3调控CALR蛋白,从而实现了 mir-144与CALR蛋白之间的间接调控。5、再次引入文献挖掘技术,搜索已报道的具有实验验证的文献,对上述mir-144 间接调控蛋白和mir-144的相互作用关系进行验证。以上是对本发明的描述而非限定,基于本发明思想的其它实施方式,均在本发明的保护范围之中。
权利要求
1.本发明专利所述的一种进行microRNA与蛋白相互作用研究的方法,它具有如下几步主要特征步骤1、选择microRNA高表达的细胞,进行差异蛋白的筛选。 步骤2、microRNA靶基因的预测。步骤3、对差异蛋白和microRNA的靶基因引入文献挖掘技术,构建相互作用网络。步骤4、整合分析结果,建立microRNA与蛋白质的调控通路。步骤5、引入文献挖掘,搜索已有实验验证的文献报道,对上述调节通路进行验证。
全文摘要
本发明设计了一种进行microRNA与蛋白相互作用研究的方法,提取一个“间接”靶基因模型的概念,并依据已有的文献报道进行相互作用的研究,其基本流程为步骤1、选择microRNA高表达的细胞,进行差异蛋白的筛选;步骤2、microRNA靶基因的预测;步骤3、对差异蛋白和microRNA的靶基因引入文献挖掘技术,构建相互作用网络;步骤4、整合分析结果,建立microRNA与蛋白质的调控通路;步骤5、引入文献挖掘,搜索已有实验验证的文献报道,对上述调节通路进行验证。
文档编号G01N33/68GK102268475SQ201010214030
公开日2011年12月7日 申请日期2010年6月29日 优先权日2010年6月29日
发明者曾华宗 申请人:上海聚类生物科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1