全细胞蛋白和基因相互作用网络分析系统的制作方法

文档序号:6441725阅读:245来源:国知局
专利名称:全细胞蛋白和基因相互作用网络分析系统的制作方法
技术领域
本发明是一种全细胞蛋白和基因相互作用网络,属于生物学和计算机数据库技术相结合的领域。
背景技术
基因间相互作用蛋白是基于全细胞范围内的作用网络,目前有大量的数据库存储了通过实验验证的蛋白间相互作用关系、蛋白和基因的相互作用关系。数据库的分别存储割裂了细胞内整体网络传递关系。目前常用的蛋白间相互作用数据来自于KEGG(京都基因与基因组百科全书),然而,该数据库将细胞内不同功能的信号通路分别构建网络,人为地割裂了全细胞范围的相互作用网络。为此,本发明将解析KEGG数据库,将KEGG数据库的多种功能间相互做关系连通,并连接了所有常用蛋白相互作用数据库,共同构筑了全细胞网络分析系统。

发明内容
Signal-Net解构了 KEGG数据库,突破了 KEGG-Pathway数据库中基因间相互作用关系局限于某一 Pathway的限制。因此,Signal-Net在全KEGG-Pathway数据库的范围内筛选某个蛋白的上游或下游蛋白。在此,本发明将满足数据筛选条件的基因分别构建实验组和对照组基因网络。
具体实施例方式一、对于KEGG的整合(一 )数据解析1、数据来源使用的原始下载来自于ftp. genome, jp/pub/kegg/xml/kgml并且根据不同的物种进行解析;2、解析工具利用xpath技术对xml文件进行解析3、解析步骤A、选择要解析的文件夹B、输入数据物种(例如has、rno、mmu)C、文件处理过程利用Xpath通过预先设定好的路径表达式选取xml文件中的结点或者结点集,偶尔根据条件筛选出符合构建网络的数据并进行组装,以待导入数据库4、解析结果保存和导入数据库将组装好的数据写入指定的文件中,并灵活选择是否将结果自动导入数据库中。导入数据库的过程为通过预定义的Sql模板创立数据库连接,创建数据表(若数据表不存在,存在则清空数据),导入数据,提交并关闭数据库连接。二)构建方法为1、在数据库中搜索满足筛选条件的基因的上游和下游基因,而该上游和下游基因须同时满足筛选条件;2、根据基因与其上下游相互作用关系画出基因间连接线,基因用圆圈来表示,相互作用用线段表示,其标识为[1]2. 1结合binding/association——线段标识为b 两个调控蛋白结合为复合物, 作用无方向性,线段无箭头;2. 2.磷酸化phosphorylation——线段标识为pho 某蛋白A将ATP或GTP的磷酸基团转移给另一蛋白B,从而激活另一蛋白的功能,作用具有方向性,即由蛋白A磷酸化蛋白B,两蛋白 间相互作用有方向性,作用线段有箭头;2. 3.去磷酸化ubiquination——线段标识为u 与磷酸化相反,某蛋白A将另一蛋白B的磷酸基团转移给ATP或GTP,从而抑制另一蛋白的功能,作用具有方向性,即由蛋白A 去磷酸化蛋白B,两蛋白间相互作用有方向性,作用线段有箭头;2. 4.激活表达expression——线段标识为exp —个蛋白A可以激活另一个基因 DNA的转录,从而增加另一个基因的表达量,作用具有方向性,即由蛋白A激活另一个基因的转录调控表达,两蛋白间相互作用有方向性,作用线段有箭头;2.5.激活activation——线段标识为a 通过蛋白间相互作用,一个蛋白激活另一个蛋白的功能,作用具有方向性,即由蛋白A激活另一个蛋白,两蛋白间相互作用有方向性,作用线段有箭头;2. 6.抑制inhibiti250n——线段标识为inh 通过蛋白间相互作用,一个蛋白抑制另一个蛋白的功能,即由蛋白A抑制另一个蛋白,两蛋白间相互作用有方向性,作用线段为平头标识;2. 7.间接作用indirect——线段标识为indi 蛋白A可以作用与蛋白B,但相互作用的实现需经其他蛋白质或信号通路作为中介才可实现,作用具有方向性,即由蛋白A 间接作用另一个蛋白,两蛋白间相互作用有方向性,作用线段有箭头;2. 8.代谢作用compound——线段标识为c 蛋白A和蛋白B作为两个相互临近的代谢酶,蛋白A和蛋白B共同代谢相同的化合物,两蛋白间相互作用无方向性,作用线段无
故々I
目IJ大。二、对其他蛋白质相互作用数据库的整合蛋白质与蛋白质的相互作用关系的数据库除了运用了 kegg数据库,目前又新添
加了数据库,具体如下
权利要求
1.一种全细胞蛋白和基因相互作用网络,解析KEGG数据库,其特征在于将KEGG数据库的多种功能间相互做关系连通,并连接了所有常用蛋白相互作用数据库,共同构筑了全细胞网络分析系统。
2.根据权利要求1所述的对于KEGG的整合,其特征在于利用xpath技术对xml文件进行解析,解析结果保存和导入数据库。导入数据库的过程为通过预定义的Sql模板创立数据库连接,创建数据表(若数据表不存在,存在则清空数据),导入数据,提交并关闭数据库连接。
3.根据权利要求1所述的构建方法为(1)在数据库中搜索满足筛选条件的基因的上游和下游基因,而该上游和下游基因须同时满足筛选条件;(2)根据基因与其上下游相互作用关系画出基因间连接线,基因用圆圈来表示,相互作用用线段表示,其标识为[1]。
4.根据权利要求1所述的对其他蛋白质相互作用数据库的整合,除了运用了kegg数据库,又新添加了数据库。
5.根据权利要求1所述的网络结构分析,为了发现网络中的核心调控基因,使用网络拓扑技术分析网络核心调控基因。
全文摘要
本发明是一种全细胞蛋白和基因相互作用网络,属于生物学和计算机数据库技术相结合的领域。目前常用的蛋白间相互作用数据来自于KEGG(京都基因与基因组百科全书),然而,该数据库将细胞内不同功能的信号通路分别构建网络,人为地割裂了全细胞范围的相互作用网络。本发明将解析KEGG数据库,将KEGG数据库的多种功能间相互做关系连通,并连接了所有常用蛋白相互作用数据库,共同构筑了全细胞网络分析系统。Signal-Net解构了KEGG数据库,突破了KEGG-Pathway数据库中基因间相互作用关系局限于某一Pathway的限制。因此,Signal-Net在全KEGG-Pathway数据库的范围内筛选某个蛋白的上游或下游蛋白。在此,本发明将满足数据筛选条件的基因分别构建实验组和对照组基因网络。
文档编号G06F17/30GK102289432SQ20101020247
公开日2011年12月21日 申请日期2010年6月17日 优先权日2010年6月17日
发明者李奇, 李睿, 苏峰 申请人:上海其明信息技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1