分子功能网络的生成方法

文档序号:6018361阅读:229来源:国知局
专利名称:分子功能网络的生成方法
技术领域
本发明涉及含有生物事件信息的生物分子数据库的制作方法和使用方法。
背景技术
生物体内除了DNA、RNA、蛋白质、多糖等生物大分子之外,还含有氨基酸、核酸、脂类、糖类、一般的低分子化合物等多种分子,这些分子分别执行着各自的功能。生物体系的特征不单在于由多种生物分子组成,还包括通过生物分子间的特异性结合引起的包括功能发挥在内的生物体内的所有现象。这种特异性结合不是形成共价结合,而是仅通过分子间作用力形成稳定的复合体。因此,虽然以单独状态存在的生物分子和以复合状态存在的生物分子之间存在平衡状态,由于特定的生物分子以复合体状态存在时稳定性高,因此平衡向着形成复合体的方向显著偏移。结果,在多种其他分子存在的情况下,即使浓度相当低,本质上相互特异的对象也可以识别并结合。在酶反应中,底物在和酶形成的复合体状态时发生特定的化学改变后,以反应生成物的形式释放;信号传导过程中,伴随着介质分子和靶向生物分子结合,通过靶向生物分子的构型发生变化,细胞外的信号传递到细胞内部。
近年来,基因组的研究发展迅猛。包括人在内的多种生物物种的基因序列得到阐明,基因和基因产物的蛋白质序列、不同脏器的蛋白质表达、蛋白-蛋白相互作用等基因组体系等的研究不断深入。这些研究成果中的大部分是以数据库的形式公开的,可以供全世界使用。基因和蛋白质的功能、疾病的原因以及背景基因的推测、基因多态间的关系已经逐步得到阐明,人们对以基因信息为依据的医疗和新药开发的期待日益增高。
一方面,基因信息的承载者是核酸,而能量代谢、物质交换、信号传导等大多数生命功能是由核酸以外的分子负责的。蛋白质是以基因蓝图为基础直接产生的,这一点和其他类型分子不同,其种类很多。酶、低分子性的生物体内生理活性化合物的靶向分子、蛋白性的生物体内生理活性化合物的靶向生物分子(多数经糖修饰)都是蛋白质。姑且不淡作为疾病的根本原因,多种疾病和症状都是蛋白质和低分子化合物的量和平衡、不同情况下实质(功能)异常的结果。在现存的医药中,大部分都是以蛋白质为靶向,控制其功能的化合物。和蛋白质不同,因为核酸的立体结构作为低分子医药的靶向时使之难以发挥特异性,因此,从抗生素物质和抗菌药物到农药的杀虫剂和抗霉菌制剂都是以蛋白质为靶向。
因此,为了进行以基因信息为依据的医疗和新药开发,需要阐明生物体内各个蛋白质和低分子化合物的功能以及这些分子间的特异性关系。此外,不同的酶次第合成相关的既定分子、不同的分子次第结合进行信号传导、这些分子相互在功能上和生物合成上具有直接或者间接的关联,这种关联(分子功能网络)的信息很重要。此外,迄今为止的研究已经阐明了多种如介质和激素等和多种临床症状、生理现象、生物反应的发生具有直接关系的分子。与分子功能网络的关联赋予对恰当的治疗不可缺少。此外,在创新药物战略中,需要在考虑到副作用风险的情况下对适当的新药开发靶向分子进行设定,因此需要考虑到含有靶向分子的分子功能网络。
蛋白质相关数据库有SwissPort(the Swiss Institute ofBioinformatics(SIB),Europaen Bioinformatics Institute (EBI)、PIR(National Biomedical Research foundation(NBRF))。其中除了含有序列信息之外,还包括生物物种、功能、功能机制、发现人、文献等其他的注释信息。
着眼于分子关联的分子网络型数据库中,与代谢途径相关的有KEGG(金久等,京都大学)、Biochemical Pathways(BoehringerMannheim),WIT(Russian Academy of Sciences),Biofrontier(吴羽化学)、Protein Pathway(AxCell)、bioSCOUT(LION)、EcoCyc(DoubleTwist)、UM-BBD(Minnesota Univ.)。
KEGG的PATHWAY数据库中有代谢通路和信号传导通路,前者是处理与能量代谢相关的一般低分子化合物的代谢通路,后者是处理信号传导体系中的蛋白质。任何预定义的分子网络都是以静态的Gif文件的格式提供的。前者从其他文本形式的分子数据库LIGAND(金久等,京都大学)以及ENZYME(INPAC-IUBMB)中收录了酶和配体的信息。不包括与生理活性肽生成相关的酶和靶向生物分子。
EcoCyc是大肠菌的物质代谢数据化产物,它根据各个酶促反应的相关数据、已知途径相关的数据(用集合的形式表示属于该通路的酶促反应),用图示的形式表示通路。EcoCyc的检索功能采用和分子名以及通路名相对应的文字和缩略号的检索方法,不过不能通过指定任意分子对新的通路进行检索。
和信号传导有关的数据库有CSNDB(国立医药食品卫生所,日本)、SPAD(久原等,九州大学)、Gene Net(Institute of Cytology &Genetics Novosibirs k,Russia)、GeNet(Maria G.Samsonova)。蛋白质-蛋白质相互作用数据库有DIP(UCLA)、PathCalling(CuraGen)、ProNet(Myriad)。基因-蛋白表达数据库有BodyMap(东京大学、大阪大学)、SWISS-2DPAGE(Swiss Instutute of Bioinformatics)、人和小鼠2DPAGE数据库(Danish Cenre for Human Genome Research)、HEART-2DPAGE(GermanHeart)、PDD蛋白疾病数据库(NIMH-NCI)、华盛顿大学内Ear数据库(Washington Univ.)、PMMA-2DPAGE(PurkyneMilitary Medical Academy)、Mito-Pick(CEA,France)、分子解剖学实验室(Indiana University)、人结肠癌蛋白数据库(Ludwing Institute forCancer Research)。生物反应模拟类型的分子网络有E-Cell(L.Leow,Conneticut Univ.)、E.coli(B.Palsson),Cell CD.Lauffenburger,MIT.),Virtual Cell(L.Leow,conneticut Univ.)Virtual Patient(Entelos,Inc.)。
有关生物分子和功能的关系的数据库除了广泛收集蛋白质信息的SwissProt之外,COPE(University of Munich)以文本的形式公布了细胞因子的功能信息。ARIS((股份)日本电子计算)收录了以医学-药学领域为中心的大约400份国内杂志、20份海外杂志中的药物副作用、相互作用、农药、化学物质等与中毒相关的文献信息,不过,其中不包括关于生物分子的生理作用和细胞水平以上的应答的数据库。有关基因和疾病的数据库有收集了基因病和蛋白质氨基酸变异信息的OMIM(NIH)。上述都是以文本形式对数据进行了记录,可以采用关键词检索。
着眼于分子间关联的现有的数据库存在以下问题。分子网络型数据库包括的是分子与分子间关联已经明确的体系,事先考虑到分子间的关系进行配置,以静态的GIF等表现出来。这种方式造成难以追加新的分子和分子间的关联。将来即将阐明的分子大约有10万以上(KEGG所收集的分子中含有的医药分子大约有1万个),此外,随着日后对这些分子研究阐明,可以预想分子网络的复杂程度会以加速度的形式增加。因此需要能够相应追加新分子的、既可以保持庞大的分子和分子间关系信息又可以生成含有必要的信息的部分的新的分子网络的生成方法。
2001年9月7日至今KEGG对分子间的关联以2分子对的形式进行信息保存,利用这些信息,可以探索代谢途径中任意2个分子间的关联途径。可是,在这种途径探索问题中,如果使2个分子间相关联的路径过长会出现导致计算时间指数级增加的问题。
一方面,文本形式的数据库不存在分子数据追加的界限。可是,需要对每个分子数据对与其在功能上或者生物合成相关的分子依次反复探索,造成难以生成表示多个分子关联的网络。有必要开发能在检索时动态并且自动得到必要的分子相关关联数据的保存和检索方法。此外,为了能够对疾病和病态进行分子水平的理解,有必要对将生物分子及其网络与生物体的应答以及生理作用关系进行记述做些新的尝试。

发明内容
本发明的课题是提供了用于在生物分子的功能以及这些分子间的关联水平上理解多样的生物应答和现象的手段和方法,具体指提供能将生物分子信息和生物体应答联系起来的数据库和数据库的检索方法。并且下述内容也是本发明的课题之一,即从庞大的信息中,迅速有效地取出任意生物体应答以及生物分子相关的信号传递通路以及生物合成通路,提供推测有希望的推测药物靶点以及副作用风险的方法。
本发明者等,为了彻底解决上述课题进行了努力研究,结果按照以下方法最终解决了上述课题,即收集直接结合的生物分子对作为信息组分,网罗生物分子间的关联关系,向针对生物分子中对生物应答的发生直接相关的关键分子,和靶生物分子对的信息中添加并保存生理作用、生物应答、临床症状等生物学事件的信息,对含有指定的一个以上的任意生物分子或者生物事件的联系进行自动依次的探索,制成分子功能网络,发现由此可以解决本发明的课题,这些发明已经申请专利(PCT/JP01/07830号说明书)。
即,在PCT/JP01/07830号说明书中记载了使用积累有直接结合的生物分子对的相关信息的生物分子连锁数据库生成分子功能网络的方法。该发明的优选状态是用含有生物学事件信息的生物分子连锁数据库,生成和生物学事件信息相联系的分子功能网络的上述方法;应用含有生物分子自身相关的信息的生物分子信息数据库的上述方法;以及生成含有与生物事件信息相联系的医药分子的分子功能网络的上述方法。此外,提供了用储有和直接结合的生物分子对相关的生物学事件信息的生物分子连锁数据库对任意的生物分子以及医药分子有直接关系或者间接关系的生物学事件进行推测的方法。此外,提供了当生物分子是外部数据库或者文献中的基因所编码的蛋白质时,制成该生物分子的分子略号和该基因的名称、ID或简称相对应的数据库,以便于利用分子功能网络解析基因的多态和表达信息的方法。
上述发明的其他优选状态还提供了以根据网络中的关联将组块化的生物分子对数据作为子网络,根据归属子网以及子网之间的包含关系对分子功能网络进行级系化为特征的上述方法;以将生物分子对相关信息根据该分子对的归属路径名、归属子网络名等级系化后加以保存为特征的上述方法;以将与生物分子本身相关的信息根据其从基因群中表达的模式以及出现到细胞表面的模式等进行级系化后保存为特征的上述方法;以将生物学事件相关的信息根据与该事件的上位概念进行分类和病态事件的关联进行级系化保存为特征的方法。此外上述发明还提供以将关于生物分子对的上一阶层、生物分子自身相关的上一阶层、生物学事件相关的上一阶层各个保存项目,项目间的关联性以及依赖关系信息加以保存为特征的上述方法;以应用保存于级系化的生物分子信息数据库或者生物分子连锁数据库的信息,使生成分子功能网络简易化为特征的上述方法;以利用保存于生物分子信息数据库或者生物分子连锁数据的级系化的信息,控制分子功能网络的表现详细度为特征的上述方法。
本发明者等人经过努力研究之后,成功的提供了下述方法及数据库。
1.一种分子功能网络或分子功能网络的生成方法,所述的分子功能网络是根据关联编码、关联功能编码、信赖性编码、作用脏器、生物分子对的方向性和其他1项或2项以上的数据项目的组合,利用生物分子连锁数据库,通过筛选生物分子对进行组合检索进而生成的。
2.根据关联编码、关联功能编码、可信性编码、作用脏器、生物分子对的方向性以及其它1项或者2项以上数据项目的组合,对利用生物分子连锁数据库,根据组合检索生成的分子功能网络,进行分值赋予,进而掺入该分子功能网络的方法。
3.当在终端阅览信息中,存在生物分子信息数据库、生物分子连锁数据库、医药分子信息数据库、医药分子连锁数据库以及病情连锁数据库中的任何一个中的数据项目中的相应项目时,强调该项目的表示方法。
4.当在终端的阅览信息中,存在由组合检索生成的分子功能网络中的任何一个数据项目所对应的项目时,强调该项目的表示方法。
5.当在终端阅览的信息中,存在生物分子信息数据库、生物分子连锁数据库、医药分子信息数据库、医药分子连锁数据库及病情连锁数据库中的任何一个中的数据项目相对应的项目时,表示出含有该项目的数据库的方法。
6.当在终端阅览的信息中,存在通过组合检索生成的分子功能网络中的任何一个数据项目中相对应的项目时,在该分子功能网络上强调表示该项目的方法。
7.生成分子功能网络的方法,其特征在于,通过路径数量限制生成的分子功能网络的范围。
8.重复2个分子间的组合检索,合并该检索结果,生成联系3个以上分子的分子功能网络的方法。
9.生成分子功能网络的方法,其特征在于,根据生物分子的生成脏器和/或存在脏器的信息,对生物分子进行筛选,以进行组合检索。
10.分子功能网络的生成方法,其特征在于,根据生物分子的表达量和/或基因的转录量的信息,对生物分子进行筛选,以进行组合检索。
11.分子功能网络的生成方法,其特征在于,并用2个以上的生物物种信息。
12.采用上述11的方法,解析基因敲除动物或者转基因动物试验数据的方法。
13.采用上述11的方法,预测敲除基因动物中基因敲除的影响或者转基因动物中导入基因的影响的方法。
附图的简单说明

图1表述本发明方法基本概念的2含有不同长度路径的组合检索的示例3指定一个端点的组合检索结果示例4指定三个以上端点的组合检索结果示例5表示采用本发明方法使用医药分子连锁数据库时概念的6表示采用本发明方法使用基因信息数据库时概念的7表示进入例1中的复合体信息数据库的登录方法和使用方法的8表示附以例1中生物分子的复合体状态和单独状态关联的方法的9表示表现例2生物分子数据级系化后修饰状态的示意10表示将例3的生物分子的不同修饰状态汇总成一体的方法的示意11以糖尿病为例,表示病情连锁数据库数据项目相关性概念的示意12表示例5的检索方法得到的分子功能网络中的子网络与病情连锁数据库中的关键分子间的相关性的示意13表示利用由例6的疾病名称和病态事件构成的,分子功能网络研究疾病机理的方法的示意14表示例7中借助疾病名称的来自关键分子检索子网络的方法的示意15表示调查例8的生物分子在生物体中的功能和作用的方法的示意16表示用例9的病情连锁数据库检索结果的17表示根据例10的医药分子信息数据库中的目的生物分子信息研究医药分子作用机制的方法的示意18表示例11的借助生物分子、生物学事件、子网络等研究医药分子作用机制的详细情况的方法的示意图。
实施发明的最佳状态为了理解本发明,可参照PCT/JP01/07830号发明说明书的内容,上述PCT/JP01/07830号说明书的全部内容作为参考内容包含在本发明的说明书内容之内。
本发明中术语的意思以及定义如下所述。
“生物体”指的是包括细胞器、细胞、组织、脏器、生物个体或者集合体等的生命体的全部或者部分的概念,也包括寄生在生物中的生命的概念。
“生物学事件”指包括生物体内所有内因性或者外因性所表现出的现象、应答、反应、症状的概念。具体的例子如转录、细胞游走、细胞黏附、细胞分裂、神经回路兴奋、血管收缩、血压上升、血糖低下、发热、痉挛、异种生物以及病毒等寄生体感染等。此外,“生物学事件”的概念也包括与光和热等生物体外部物理性刺激相对应的生物体应答等。
“病态事件”是包括子“生物学事件”中的概念,指“生物学事件”超过量或者质的某个阈值,能够断定疾病或者病情的状态。例如血压上升的“生物学事件”异常亢奋的结果的“病态事件”有高血压或者高血压症,血糖不能控制在正常范围内的“病态事件”有高血糖或者糖尿病等。此外,不仅有如上述例子所示的与单一生物学事件相关的病态事件还有与多种生物学事件相关的病态事件。此外,还包括疾病中可见的生物反应、症状、症候、临床检查结果异常、并发症等病态事件的概念。“生物分子”不仅指的是生物体中存在的核酸、蛋白质、脂类、糖类、一般低分子化合物,还有其他所有结构的有机分子以及集合体,还含有金属离子、水、质子。
“关键分子”指的是生物分子中,主要的介质、激素、神经递质、内泌素等分子群。多数情况下,已知其体内存在特定的靶生物分子,当与这些分子直接结合时,引发上述的“生物学事件”。这些分子在生物体内产生并发挥作用,通常在从生物体外给予时也产生相应量的生物学事件。具体如肾上腺素、血管紧张素II、胰岛素、雌激素等。
此外,当靶向生物分子不明确,或者生物分子是否与靶向生物分子直接结合不明确时,但是知道该生物分子的量或者质的变动能够引起生物学事件的亢进、上升或者低下、减少、导致分子功能网络和子网络变动时,该分子可以作为“关键分子”。
“靶向生物分子”指的是介质、激素、神经递质、内泌素等生物分子(其中多数是关键分子)或者医药分子的接受器类的特定生物分子。多数情况下,这些生物分子或者医药分子和靶向生物分子直接结合产生特定的生物学事件。此外,即使不能断定是否是直接结合时,当某些生物分子或者医药分子施用于生物体时观测到相应的量或者质的变化时,此类生物分子也可以作为靶向生物分子。
“生物学事件的上调或者下调信息”指的是与关键分子或者靶向生物分子的量或者质的变化相对应的生物学事件的亢进、上升或者低下、减少等信息。包括关键分子的量超过一定阈值之后所引起的生物学事件。
“分子略号”是指为能够识别或者指定分子的目的的分子名称替代,并必须特定于各个分子。可以是缩短的分子名作为略号,也可以是与分子名无关的英文数字、最好是短的文字类。此外,当某些分子存在世界通用的分子略号时,最好是采用此代号。可以对应于一个分子根据不同的方式赋予多个分子略号,根据结构基团和功能等进行级系化,根据需要分别使用。
“直接结合”指的是含有下述情况的概念,即不是通过共价键,而是通过分子间力形成或者有可能形成稳定的复合体的结合,极少情况下形成共价键也包括在内。即使遇到酶促反应中酶和产物不形成稳定的复合体的情况,在推断2个以上分子在生物体内具有特异关系时,都可以认为该分子间的关系是直接结合。当转录因子和通过该转录因子表达诱导或者抑制的蛋白质两者进行结合时,可以归为直接结合。“直接结合”的概念很多时候也称为“相互作用”,不过“相互作用”的含义更广。
“生物分子对”指的是生物分子中能够直接结合或者假定直接结合的一对生物分子。具体例如雌二醇和雌激素受体、血管紧张素转换酶和血管紧张素I等。在酶促反应中,酶和产物形成的分子对的情况,虽然该复合体不是很稳定,也可将其视为包含在生物分子对范畴中。转录因子和该转录因子所诱导或者抑制的蛋白质之间的关系也包含在生物分子对中。此外,例如双杂交试验中相互作用的2个蛋白质,虽然二者之间的相互作用不明确,也可以包括在其中。针对光、音、温度变化、磁、重力、压力、振动等由生物外部的物理或者化学性刺激,将这些刺激定义为假想的生物分子,和相对应的靶向生物分子可以定义为生物分子对。
“关联赋予”指的是直接或者间接对生物分子、子网络、生物学事件、病态事件、医药分子、基因、疾病相关的数据项目中的任何2项项目间的关联性进行的表示或者记录。“关联赋信息”指的是进行“关联赋予”时所记录的信息。
“结构编码”指的是表示生物分子中DNA、RNA、蛋白质、肽、一般小分子等的结构特征的分类编码。如关于蛋白质可进一步以例如7次跨膜型、1次跨膜型、β-桶结构等结构上的特征分层次表示。
“功能编码”指的是表示生物分子的分子水平功能的分类编码,例如“结构编码”是“蛋白质”生物分子的时候,表现为膜受体、核内受体、转运蛋白、介质、水解酶、磷酸化酶、脱磷酸化酶等分类。“结构编码”是低分子生物分子时,表现为底物、产物、前体、活性肽、代谢产物等分类。此外,在蛋白质中,如磷酸化酶可以按照丝苏氨酸激酶、酪氨酸激酶、MAP激酶酶等的次级功能上的分类进行级系化表示。
“关联编码”是表示生物分子对中2个分子间关系的分类编码。例如进行将拮抗剂和受体定为10,酶和底物定为21,底物和产物定为22的类型化。例如双杂交试验中相互作用的2个蛋白分子那样的2分子间相互作用不明确的时候,可以采用辨别其本质的编码。转录因子和该转录因子诱导或者抑制的蛋白质间的关系也可以采用辨别其本质的编码。
“关系功能编码”表示伴随生物分子对中的2分子直接结合后的现象和变化的分类编码,如水解、磷酸化、脱磷酸化、活化、失活等分类。
“可信性编码”是表示生物分子对每个直接结合的可信性水平和作为直接结合根据的试验方法的编码。
“组合检索”指的是指定一个以上的任意生物分子或者生物学事件,对含其功能上或者生物合成上相关分子的关联自动搜索。
在组合检索中,可以将关联编码或者关系功能编码或者可信性编码或者作用脏器或者生物分子对的方向性等信息中的1个或者2个以上进行组合,同时利用筛选生物分子对程序进行。此外,关联编码或者关系功能编码或者可信性编码或者作用脏器或者生物分子对的方向性等信息单独或者多个组合后搜索到的分子关联索赋予分值,进而搜索期望的分子功能网络。
组合检索可以对子网络、病态事件、医药分子、基因、疾病相关信息等任意项目进行指定,同样可以对生物分子或者生物学事件进行指定。
“分子功能网络”是用生物分子连锁数据库,通过指定任何生物分子或者生物学事件或者子网络或者病态事件或者医药分子或者基因中的1项以上的项目进行组合检索得到的功能上或者生物合成上相关分子的关联。
“医药分子”指的是作为医药制造的用于治疗的化合物分子,包括医学、药学研究中使用的化合物和专利说明书和文献中记载的化合物等生理活性已知的化合物。
“与生物学事件信息建立联系”是指表示或发现某些生物学事件的发生和某些生物分子或者医药分子或者基因信息或者分子功能网络相关。
“分子添加”指的是向数据库中的生物分子、医药分子等分子数据中添加的信息。
“模式化”向数据库中记录生物分子、生物分子对、生物学事件等时,不仅将相应的信息按照原样记录,还按照事先的类别对该信息进行分类,用表示该类别的记号表示该信息。上述的例举的“结构编码”、“功能编码”、“关联编码”、“关系功能编码”的例子也是模式化的例子。
“生成脏器”指的是生成生物分子的脏器、组织、脏器或者组织内的部位、脏器或者组织内的特定细胞、细胞内的部位等。
“存在脏器”指的是生物分子生成后蓄积的脏器、组织、脏器或者组织内的部位、脏器或者组织内特定的细胞、细胞内的部位等。
“作用脏器”指的是生物分子或者关键分子引发生物学事件的脏器、组织、脏器或者组织内的部位、脏器或者组织内的特定细胞、细胞内的部位等。
图示1所示的方法提供了实施本发明的一种状态。首先,做成积累了直接结合的2个生物分子对相关信息的“生物分子连锁数据库”。这里可以包括赋予生物分子分子略号等,和生物分子自身相关的信息,最好是以其他数据库的形式建立“生物分子信息数据库”。然后,指定一个以上的任意分子对上述的“生物分子连锁数据库”进行组合检索,进而得到表示1个以上生物分子功能上或者合成上关联的“分子功能网络”。
在生物分子对中,至少要对关键分子和靶向生物分子所组成的生物分子对的生物学事件建立联系,与“分子功能网络”一起对与分子功能网络中的分子有直接或者间接关系的生物学事件进行推测。此外,通过追加关键分子的量或者质的变动和生物学事件的上调或者下调的关系信息,对分子功能网络中的任意分子的量或者质的变动引起生物学事件的亢进、上升或者抑制、低下等活动进行推测。
“生物分子信息数据库”的主要作用是对各个生物分子的正式名称进行分子略号或者ID的定义,同时还汇集并保留生物分子自身的必要的信息。例如最好,保存分子名称、分子略号、结构编码、功能编码、生物物种、生成脏器、存在脏器等相关的信息。此外,即使是未试验性分离并确认存在的生物分子例如利用其他生物物种通过试验推测存在的分子可以根据其他信息进行假定分子略号定义。
“生物分子信息数据库”中可以包括各个生物分子的氨基酸序列和结构相关的信息,也可以将该信息另存到序列数据库和结构数据库中,根据分子略号按需调取。生物分子中的低分子量物质根据需要表示分子功能网络时可以添加化学结构,不仅正式的分子名称、表述化学结构所必需的数据可以保存在生物分子信息数据库中也可以另存到其他数据库中。
表示2个以上的生物分子的多聚物或者集合体的活性或者功能等时,当多个生物分子作为整体应用比较方便时,将其定义成1个假想的生物分子,赋予分子略号在“生物分子信息数据库”中进行登录。当其条件、其组成成分已知的时候,也可以分别赋予分子略号进行登录,在假想生物分子的记录中设定记述了构成分子分子略号的区域。当生物分子的组成不明确的情况下,可以根据基团具有的特定功能定义假想的生物分子,这种情况同样适用于生物分子对的定义。
此外,当生物分子由2个以上结构域组成时,因为各结构域具有互不相同的功能等原因将各个结构域独立收集有利于的情况,可以将各个结构域作为独立的分子进行收集。例如和原始的生物分子一起,对每个结构域分别赋予分子略号在生物分子信息数据库中进行登录。在原始的生物分子的记录中设置记述分开的结构域的分子略号的区域。还可以对1个生物分子具有2个以上不同功能的情况进行记述。基因组序列中非基因的特定序列具有某些功能或者为特定的生物分子所识别的时候,可以将该序列部分作为独立的生物分子进行收集,并赋予分子略号进行生物分子对的定义。
生物分子对的信息保存在“生物分子连锁数据库”中。其中收录了每个生物分子对的成对的2个生物分子的分子略号、关联编码、关系功能编码、可信性编码、生物学事件、作用脏器、共轭分子等其他附加的信息等。对于关键分子及其靶向生物分子的分子对,该库最好尽可能的输入生物学事件、2分子的量或者质的变动所对应的生物学事件的上调或者下调信息、病态事件等的信息。对于关键分子以外的生物分子对,在某些情况下,该生物分子对引发的直接相关的生物学事件或者病态事件,可以向该库中输入其生物学事件和病态事件。关键分子的量或者质的变动相应产生的生物学事件的上调或者下调信息,如可以表示关键分子的增加所对应的生物学事件与正常范围相比的亢进或者低下等单纯的信息。一个酶能催化2种以上底物发生反应,并且生成的反应生成物各不相同时,可以添加特别规定酶、底物、反应生成物之间关系的表示。
“生物分子信息数据库”和“生物分子连锁数据库”因为其内容和组成上的不同,本说明书中作为概念独立的数据库进行收集,本发明的本意认为将2者合并成一个含有2种类型数据的数据库也可以。此外,“生物分子信息数据库”和“生物分子连锁数据库”分别存在2个以上也可以,这种情况下,可以对每个数据库进行适当的选择并加以组合。例如用特定的区域加以区别,也可以将不同生物物种的数据保存在相同的“生物分子信息数据库”和“生物分子连锁数据库”中,也可以将人和小鼠的分别制成不同的数据库加以保存。
“关联编码”可以输入组成该生物分子对的2分子如拮抗剂和受体、酶和底物这样的单词,也可以根据需要将表示拮抗剂和受体关系的10、酶和底物关系的21、酶和产物关系的22这样的类型化输入。此外,作为“关系功能编码”,为了便于分别保存水解、磷酸化、脱磷酸化、活化和失活等功能,也可以将其进行类型化输入。进行组合检索时,可以将关联编码和关系功能编码信息作为例如仅仅考虑酶促反应、忽视失活关系、忽视基因表达的诱导、抑制关系等筛选程序加以利用。
不仅存在在酶和底物相互关系明确的情况,还有下的双杂交试验方法中蛋白-蛋白相互作用的2个蛋白质分子那样在两者之间的相互作用不明确的情况。为了进行含有这样的生物分子对的组合检索,将组成生物分子对的2个分子的关系进行是否具有方向性区别收集是非常方便的。针对于各个生物分子对,可以使用能够区别属于何种情况的关联编码。前者的情况下,对作用方向明确的分子对进行检索时仅对2分子的输入顺序加以考虑,与此相对,当是后者的情况下,检索时也要考虑到作用方向不明时的反向关系。这样令生物分子对具有方向性,进行组合检索时,可以对例如分子功能网络的单独上游方向或者单独下游方向进行检索定向。
直接结合的生物分子对的信息中既包括试验确切证明的信息,也包括暂且假定为生物分子对的情况。此外,因为试验验证也存在假阳性,有时也含有错误的生物分子对。所以,希望能够追加表示各个生物分子对信息可信性水平和试验方法的“可信性编码”。可信性编码不仅为了单独信息的阅览,而且可以在进行组合检索时,例如有目的的只以某些具有一定可信性编码的生物分子对为对象的实施筛选程序。此外,分子功能网络以可信性编码为依据进行分值赋予,结果表示、表示范围掺入等目的加以利用。
生成分子功能网络时,保持生成生物分子的脏器和蓄积脏器以及作用脏器的信息如某些脏器生成的到达细胞外的分子和其他细胞膜上的靶向生物分子从细胞外发生作用,这样的现象很容易表现出来。生物分子的生成脏器和存在脏器的信息可以输入“生物分子信息数据库”,作用脏器的信息可以输入“生物分子连锁数据库”。这里的生成脏器、存在脏器、作用脏器的记述不需要对脏器加以限定,可以含有组织、脏器或者组织内的部位、脏器或者组织内的特定细胞、细胞内的部位等信息。生成脏器、存在脏器、作用脏器的信息,进行组合检索时,可以仅以同一脏器内生成的生物分子对为检索对象等的筛选程序加以利用。
证实直接结合的试验和推定方法、生物学事件的种类、关键分子的量的变动所对应的生物学事件的上调或者下调、细胞内部位和组织、脏器、脏器内部位的表达只要可以简单化均可以,但最好变换成类型化的短的英文数字记号等。如果根据同义词词典进行定义,同时可以进行同义词处理,尽可能输入错误最小化。
以下,表示从“生物分子连锁数据库”生成“分子功能网络”的“组合检索”的概念。本发明的“组合检索”指的是能够实现该概念的任何方法。例如应用Sedgewick的“算法C(近代科学出版社,1996)”第29章中记述的“深度优先探索”的算法等。
以(n,m)的形式表示用分子略号a~z代表的生物分子组成的生物分子对,生物分子连锁数据库用下述的生物分子对集合的形式加以表示。
(a,c)(a,g)(b,f)(b,k)(c,j)(c,r)(d,v)(d,y)(e,k)(e,s)(g,u)(j,p)(k,t)(k,y)(p,q)(p,y)(x,z)用组合检索的方法,如为了生成含有c和e的分子功能网络而进行指定,将对共同含有对中的一个分子的生物分子对(c,j)(j,p)(p,y)(y,k)(k,e)进行逐级检索,作为分子功能网络,得到了将分子c,j,p,y,k,e相关联的“c-j-p-y-k-e”。
组合检索得到的分子功能网络,不仅含有上述的直线状的路径。例如当向上述生成的生物分子连锁数据库中再添加生物分子对(q,y)时,进行以c和e为端点的检索,得到了图2所示的分子功能网络。这里的c和e中间存在的生物分子对数最短的路径是5(连接p-y的路径),最长路径是6(连接p-q-y的路径)。分子功能网络中2分子间存在的生物分子对的数下述成为“路径数”。
组合检索时,分子功能网络所含有的生物分子对可以由途径数限制。例如可以由组成最小途径数的通路(图2中的例示c-j-p-y-k-e)的情况限制生物分子,将路径数限制再一定范围(如5~6)。通过这样的路径数限制,借助组合检索,可以对生成的分子功能网络的范围进行必要的调整。
以所得到的“分子功能网络”为基础,可以对生物学事件进行如下推断。掌握有生物分子e作为关键分子的生物学事件E的信息时,可以对生物分子c,j,p,y,k和生物学事件E的发生间的直接或者间接关系进行推断。另外,例如掌握有当分子e减少时E表现为亢进的生物学事件的上调或者下调信息的时候,分别对(c,j)(j,p)(p,y)(y,k)(k,e)的关系加以考虑,对c,j,p,y,k中的任意分子的量或者质的变动相对应的生物学事件E的发生的影响进行推断。
组合检索,可以以一个分子为起点进行指定。这种情况下,作为检索的终止条件,可以对起点生物分子和作为终点的1个以上的生物分子间的路径数的上限进行指定。例如使用上述生物分子连锁数据库,将起点的生物分子定为a,路径数的上限定为3,分别指定后进行检索时,得到了图3所示的分子功能网络。
组合检索,可以对3个以上的多个生物分子进行指定。例如指定a,b,c3个生物分时,针对a和b,a和c,b和c 3组分别进行组合检索,得到a-d-e-f-b,a-d-e-g-c,b-f-e-g-c 3组分子功能网络。求它们共同部分(AND演算)和合集(OR演算),同时寻求2组以上共通部分,可以得到含有a,b,c 3个生物分子的分子功能网络。
a,b,c 3个生物分子全部含有生物学事件E的信息的情况下,可以推定如图4所示的OR算法,合集算法得到的分子功能网络中出现的生物分子群a,b,c,d,e,f,g,可以对其与生物学事件E的发生的直接或者间接关系。此外,可以推断AND算法所得到的共同部分的分子功能网络中出现的生物分子e,对于生物学事件E的发生具有重要意义的可能性高。
组合检索可以利用子网络、病态事件、医药分子、基因、疾病相关的信息等数据项目间建立联系的信息,以与使用上述所示的生物分子对信息的情况同样地应用。这种情况下,在建立联系的信息中被赋予关联的2个数据项目按照合生物分子对中2个生物分子同样的情况进行处理,如上述顺序即可。据此,不仅生物分子和生物学事件,对子网络、病态事件、医药分子、基因、疾病相关的信息进行指定,由此有可能生成分子功能网络。
此外,从某些生物分子到关键分子的分子功能网络中存在N个生物分子,这些分子对生物事件发生数量QE的影响可以按照下例的方式加以预测。这里的Si是第i号生物分子状态的质的评价值,Ri是第i号生物分子的量值,Vi是第i号生物分子存在环境的评价值,f是具有3xN个输入值的多价参数。
QE=f(S1,R1,V1,...SN,RN,VN)与一个分子功能网络有关系的生物学事件不只1种,预计与一种生物学事件有关系的的分子功能网络也有数个,所以有可能掺入来自生物学事件方面所关联的某些分子功能网络。例如在指定1个以上生物分子生成“分子功能网络”的情况下,生成明显含有多个生物分子的“分子功能网络”的情况下,添加生物学事件信息均有可能掺入“分子功能网络”范围。理所当然,以含有任何一个介质分子或者该分子与靶向分子的关系为条件,都有可能生成“分子功能网络”。
此外,对“生物分子连锁数据库”的数据进行适当的分割,或者通过筛选程序、或者抽取部分集合,或者进行级系化处理,能够生成必要范围的分子功能网络。分割、筛选程序、抽取部分集合可以针对本发明数据库特有的数据项目采用关键词性质的常规文字检索、氨基酸序列或者核酸序列的同源性检索、化学结构式的部分结构检索、指定分子对方向检索以及利用根据本发明的数据库特异的数据项目按照一定标准赋予分值的检索等方法进行检索。可以对预先的“生物分子连锁数据库”和“生物分子信息数据库”进行这些检索,进而生成进行了限定的分子功能网络和赋予特征的分子功能网络。
例如利用生成脏器和作用脏器的信息,对生成的着眼于在肝脏生成的生物分子以及在皮肤引发生物学事件的掺入的部分数据库进行组合检索,生成限定范围的“分子功能网络”。此外,用组合检索,针对生成的分子功能网络,对其中含有的生物分子或者生物分子对进行上述检索,通过分割、筛选、抽取部分集合等生成具有预期特征的分子功能网络和具有预期范围的分子功能网络。此外,进行组合检索时,例如指定生物分子对的方向性,对网络的取向进行集中检索,对组合检索得到的分子功能网络根据可信性编码进行分值赋予进行掺入。不仅能轻易的进行这样的限定和赋予特征的检索,还可以在分子功能网络上强调表示特定的生物分子群和生物分子对,有助于分子功能网络的理解。
根据网络上的关联可以对“生物分子连锁数据库”进行适当的分割、筛选和抽取部分集合,利用保存有表示其包含关系的信息,可以实现“分子功能网络”的级系化。即使有未阐明的分子和分子间的关联的一部分,收集后作为一个假想的生物分子定义为其他生物分子配对,生成虚拟的分子功能网络。当所含有的分子数过多生成过度复杂的网络时,可以将网络上有连带关系的2个以上的生物分子群定义成1个假想的生物分子,便于简洁的展示网络。
利用这样的级系化处理,可以实现组合检索的高速化,可以调节网络展示的详细程度,适当的避免过度复杂。在本发明说明书中,在网络中连带2个以上生物分子对组成的部分的网络叫做“子网络”。
子网络可以是指定的网络的任何一个部分,方便的方法是优选以代谢系统中TCA循环和戊糖磷酸循环等为研究人员所熟知的级联、通路、循环等作为子网络。此外,某些子网络也可以包括在其他子网络中,例如代谢系统本身可以是含有多个子网络的上一级子网络的子网络。
有一种方法将各个子网络作为1个假想生物分子进行处理。将组成子网络的生物分子对和子网络的层次相关的信息保存到“生物分子连锁数据库”中十分方便。此外,设定“生物分子连锁数据库”中表示子网络的上一层次的数据层次,可以由此对有关于该子网络的信息进行保存。生物分子对的子网络的层次不限定为2层,可以作为多个子网络的集合进行上层子网络的保存。生成分子功能网络时,为了便于在每个分子对数据和上层子网络间进行相互参照,最好将揭示每个分子对数据、子网络数据各自关联的信息归类保存。一个生物分子对即使和多个子网络具有关联也没有关系。
级系化的“生物分子连锁数据库”的子网络数据中,最好不仅含有和下层生物分子对的关联信息,还含有子网络间的关联信息。例如代谢系统中,糖降解和TCA循环是连续运行的子网络,可以将这样的子网络间的关系在上层关系中作为对的关系进行保存。这种情况下,最好添加子网络对的信息,添加成为子网络间的接点的生物分子信息。
此外,不仅可以进行网络的级系化,生物分子本身也可以进行级系化,本发明的特征在于能够利用“生物分子信息数据库”中保存的这些信息。为了网络快速检索和便于以多种形式进行展示,可以将生物分子信息和生物分子对信息双方都进行级系化。可以作为生物分子对级系化对象的,可以举出如下的例子。生物分子中,既有多个不同分子特异性结合进行功能展示的情况,通过不同的分子聚集状态调控功能的发挥状态和种类的情况也很多。此外,免疫细胞等如我们所见,通过和与细胞表面表达的多个分子进行组合,规定生物学事件以及相关细胞的功能。这种情况下,可以采用将上述分子的聚集状态作为一个假想生物分子进行处理。其他方法可以设定表示“生物分子信息数据库”中分子的聚集状态的上层数据层,在此对该聚集状态信息进行收录。为了便于在生成分子功能网络时,在生物分子数据和上层数据间相互参考,可将生物分子数据和上层数据各自的表示相互关联的信息收录保存。即使1个生物分子与多个层次的数据有关联也可以。
处理生物分子聚集状态级系化的其他方法还有在生物分子信息数据库的分子的下一个层次中设立添加到聚集体中的各个分子的登录栏。这种情况下,聚集状态中某个生物分子作为一个假想的生物分子进行登录,优选在上述的设定的下层栏目中,登录各个分子的分子略号。
某些生物分子通过酶促反应等接受修饰后其功能发生变化。这样的修饰例如磷酸化、甲基化、乙酰化、泛素化以及其逆反应等。修饰状态不同的生物分子,可以通过各自的分子略号进行区别,也可以通过在生物分子信息数据库中设立表示修饰信点的数据层使之更加方便。例如在生物分子信息数据库中加设“修饰状态”表示栏,在这里通过“磷酸化”等,即使是不同修饰状态的生物分子用统一的分子略号进行处理也可以区别的修饰状态。在进行根据修饰状态进行级系化的情况下,可以将该分子的分子略号和“修饰状态”栏数据组合,更便于区别。
上述的级系化,可以扩展到生物分子的修饰状态以外。例如由生物分子的结构变化和多个修饰的组合等,使该分子与其他生物分子的结合性和反应性变化的情况下,以其状态变化为例可以区分为活性状态、失活状态,将此保存在分子数据的下层中。
通过生物分子,依赖于修饰状态或活性状态、失活状态等的状态变化,和其他生物分子结合或不结合。这种情况下,根据上述的级系化的分子数据,对生物分子加以区别,将上述的每种状态的生物分子对记录到生物分子连锁数据库中。此外,其他方法还有仅以先分子略号为依据,将生物分子对记录到生物分子连锁数据库中,作为该生物分子对的附加信息,记录此2分子结合、反应条件下各个分子的状态。
在生物学事件、病态事件中,很多时候难以对特定生物分子对进行关联赋予。例如有时虽然已经明确生物学事件、病态事件和某些子网络形成之间的关系,可是该生物学事件直接结合的生物分子对尚未知道。这种情况下,利用对上述的生物分子对数据的级系化,将生物学事件、病态事件与生物分子对的上层子网络数据进行关联赋予,进而记述该生物分子和生物分子子网络的关系。
此外,当特定的分子聚集状态和细胞表面上特定分子的表达状态与某些生物学事件、病态事件的发生相关时,利用上述的分子聚集状态和分子表达状态的级系化,将生物学事件、病态事件和分子聚集状态、分子表达状态层次的数据进行关联赋予,由此可以记述该事件和生物分子网络的关系。
此外,有时生物学事件、病态事件和特定的生物分子对和子网络没有任何关联。例如炎症性细胞因子游离、白细胞向组织浸润、毛细血管的通透性增加等多种生物学事件组合引起的“炎症”这种生物学事件。为了处理这样的事件,将生物学事件、病态事件进行级系化,在下层层次中对生物分子对和子网络关联赋予事件进行记述,同时在上层阶层中记述下层阶层事件相关引起的事件。这种级系化自然也可以设定2层以上的层次结构。为了便于进行各个层次的事件的相互参照,可以在各个层次的事件数据中,收录表示上下层次数据关联的信息。通过这样的生物学事件、病态事件数据的级系化,可以将没有直接赋予关联的、特定的生物分子对和子网络按照分子功能网络的关系进行记述。
生物学事件、病态事件的级系化之外的状态还有将生物学事件、病态事件划分为关键分子的上调或者下调、生物学反应、症状、症候、临床检测值信息、疾病、综合症等多个群和/或者层次。例如已知某些疾病与划分成上述群或者层次的生物学事件、病态事件之间的关联的情况下,可以在该事件间进行关联赋予。根据此方法,可以通过关键分子的上调或者下调信息,更容易的记述疾病和分子功能网络的关系。
如上例所示,可以通过“生物分子信息数据库”和“生物分子连锁数据库”的数据级系化保存,有效地生成可以用于多种用途的分子功能网络。
即使是同一个生物学事件、病态事件,例如正常时和患病时、疾病状态不同等情况下,也存在应当赋予关联的生物分子对和子网络发生变化的情况。这种情况下,可以对该事件出发的各个生物分子对和子网络进行关联赋予。可以对与同一个生物学事件、病态事件相关的2个以上的分子功能网络进行搜索。
当研究糖降解体系中存在的某些生物分子(分子A)和某些激酶级联反应中存在的某些蛋白(分子B)之间的关系时,如果采用没有级系化的数据库,需要进行庞大的分子对对象组合检索,如果分子A和分子B间的路径很长,事实上无法进行检索。但是,当采用级系化的数据后,可以在子上层的网络的组合检索“糖降解系统”子网络和“某些激酶级联反应”子网络间的关联,在上层层次中发现路径时,根据需要,可以在路径上各子网络的下层层次进行组合检索。这样通过将路径探索问题分割成不同层次的问题,使在用没有级系化的情况下不可能得到的分子功能网络生成成为可能。利用这种级系化数据进行组合检索时,可以和利用未级系化的数据进行组合检索一样,子网络间的关系的方向性或者本发明数据库特有的数据项目按照原有状态或者按照一定的标准进行数值化后,可以掺入检索对象数据。
此外,利用上述的级系化数据进行组合检索时,如果需要频繁的参照特定的子网络,可以预先对将该子网络内部进行组合检索,将该子网络内的分子功能网络信息进行保存。经过如此处理后,可以更有效地生成全体分子功能网络。
此外,例如生成“炎症”这类病态事件相关的分子功能网络时,可以检索“炎症”上层层次的事件相关的下层层次事件,从该下层层次事件相关的生物分子对或者子网络出发,进行组合检索,可以生成更广范围的分子功能网络。
如上所述,根据本发明从生物分子间的直接结合关系信息出发,可以生成和任意分子相关的分子功能网络,并容易对直接或者间接相关的生物学事件以及病态事件进行推测。此外,本发明反其道而为之,从对在疾病中特征性表现的生物学事件和病态事件、生物分子的量的变化等的了解出发,选择和疾病关联可能性高的分子功能网络,利用其对疾病的分子机制进行推测。此外,根据本发明,阻断网络中的哪个过程对特定的疾病或病症的治疗有效、网络中的哪个分子作为创新药物的靶点(医药开发中作为靶标分子的蛋白质之外的生物分子)有希望,从该创新药物靶点出发可以预期的副作用有哪些,为了回避所述副作用利用什么样的实验系统选择医药开发候选物等等构建创新药物战略。
医药分子通常在体内和包括蛋白质在内的生物大分子结合,通过调控其功能发挥药理作用。对该分子的作用进行比生物分子作用更详细的研究有益于了解疾病的分子机制。所以。得到制造认可用于医疗的医药分子和用于药理学研究等的药物分子和其靶向生物分子对关系添加到上述的生物分子和生物分子间的信息中,本发明的方法的有用性可得到非常显著地提高。靶向生物分子几乎都是经蛋白质或者糖等修饰的蛋白质。从含有靶向生物分子的功能网络出发,可以对副作用和相应的生物学事件进行推测。从并用的药物相关的分子功能网络之间的交叉出发,可以推断药物相互作用。其结果,可以考虑副作用风险和药物相互作用风险而对药物的选择和用量进行设定。
下面对本发明中添加医药分子和靶向分子对的关联的方法进行举例说明。与医药分子的正式名称相对应,定义分子略号,收录与该分子有关的所有信息,制成“医药分子信息数据库”。这里对医药分子的名称、分子略号、使用疾病、用量、靶向分子以及其他信息加以保存。和生物分子信息数据库的情况一样,可以将医药分子的化学结构、氨基酸序列(肽或者蛋白质的情况)、立体结构等信息可以包括在“医药分子信息数据库”中,也可以保存在其他的数据库中。为了区别医药分子和生物分子、蛋白质和低分子等,可以用结构编码进行区别,也可以用赋予第1个文字能区别的分子略号的方法。此外,从医药用品的附加文件和其他文献出发,输入显著的副作用、与其他药物的相互作用、代谢酶等的信息,根据分子功能网络,有利于用和基因多型的关联对药物进行适当的选择。
此外,做成含有医药分子和靶向蛋白质对的关联信息的数据库-“医药分子连锁数据库”。保存医药分子的分子略号、靶向生物分子的分子略号、关联编码、药理作用、适用疾病等信息。对于靶向生物分子的分子略号,可以在生物分子信息数据库中进行必要的定义。关联编码等和生物分子连锁数据库共同的数据项目可以采用生物分子连锁数据库中标准的标记方法。
做成“医药分子信息数据库”和“医药分子连锁数据库”将医药分子以及医药分子对的信息收录其中,可以按照图5所示对本发明的方法进行扩充。这里通过组合检索对分子功能网络的生成和生物学事件进行推测等可以按照和上述的生物分子连锁数据库和生物分子信息数据库相同的方法进行。可以同时得到以该网络上的分子为靶向目标的现有的医药分子信息。此外,从仅用生物分子连锁数据库和生物分子信息数据库做成的分子功能网络出发,也可以用于抽出指定的医药分子相关分子功能网络的目的。
一方面,包括人基因组在内从多个角度出发对基因信息的了解迅速增加。基因组范围内分离的cDNA ORF(开放阅读框)和基因序列的了解不断推进,各个基因在基因组上的定位也进展迅速。所以,本发明的另外一种形式,是做成进行生物分子中的蛋白质的分子略号和编码该蛋白质基因的名称、略称、ID以及其他信息的赋予关联的“生物分子-基因数据库”,如下所述对本发明的方法进行扩展。即通过对应基因和生物分子,赋予疾病标记物基因和蛋白质含义、疾病和基因多型相关性等了解以此理解分子功能网络上的分子和生物学事件间的关联。“生物分子-基因数据库”中可以含有生物物种、基因组中的位置、基因序列、功能、基因多型的氨基酸突变和略称、功能和相关等信息,也可以根据需要制成2个以上的数据库。
同时从在基因组中定位的基因名称和基因的排列出发,明确特定的关键分子是通过作用于核内受体等的基因转录机构转录的蛋白,生物分子间的相互作用关系可以反映到分子功能网络中。此外,已知不同脏器表达的基因和蛋白不同,根据本发明的方法,将该表达信息收录到“生物分子信息数据库”中,每个脏器建立不同的“分子功能网络”。例如不同脏器中以核内受体为靶向分子的医药分子的作用会不同,反其道而行之,对此现象加以说明。此外,已知给予医药分子时,蛋白表达发生变化的事实,根据本发明的方法,可以在每个蛋白表达量的增减在有关靶向生物分子的分子功能网络上进行解释,可以用于在考虑基因多型的基础上进行药物选择。
保存上述的基因转录和蛋白表达信息,利用级系化的概念,可以生成更有效的更广范围的分子功能网络。例如对于由特定的核内受体转录,表达的多个基因、蛋白,在表现基因群的转录、蛋白群的表达的“生物分子信息数据库”中设立上层层次,将该基因群、该蛋白群的数据保存其中。当存在与该基因群的转录和该蛋白群的表达相关的生物学事件、病态事件时,向“生物分子连锁数据库”中记载该基因群、该蛋白群的上层层次数据和该事件的关联,可以使不能用各个基因、分子和该事件间的关联赋予表示的分子功能网络的生成成为可能。
上述的基因转录和蛋白表达的信息进行级系化保存,当已知该基因群的各个基因或者该蛋白群的各个蛋白的转录或者表达的量的信息时,该信息作为数值参数保存到“生物分子信息数据库”中。利用这样的数值参数,对应于每个基因转录量或者每个蛋白表达量的差别,记述相关生物事件、病态事件变化的情况。
基因转录和蛋白表达的数值参数,保存到上述的“生物分子信息数据库”中的方法之外,还可以采用从外部文件或数据库中引入的利用本发明的方法。此时,通过准备外部数据中的基因或蛋白质的ID与“生物分子信息数据库”中生物分子的ID或“生物分子-基因数据库”中基因的ID的对应表,可将外部数据容易地引入本发明的方法中。
此外,基因组和基因个体多样性正逐步明确,该种信息和本发明方法相连接,促进个体差异的理解,可以用于基于个体差异的治疗。对于造成特定的生物分子(蛋白质)的功能受损的基因多型、在分子功能网络上进行解释可以推测对生物学事件的影响。1个基因的缺损和异常引发的基因病的症状和生物学事件异常的信息根据本发明的方法进行连接,有助于对其的理解。
据报道,在几个代表性疾病中,各个疾病中患者都有较高频率出现的多个基因、疾病背景基因。假定实际存在易患特定疾病的遗传体质,例如和血压调节相关的分子功能网络有2个以上,其中哪个网络的哪个分子发生异常,和作为高血压背景的基因具有相当数量也不是不可思议的。解释这样polygenic基因问题,本方法是不可或缺的。
此外,今年来,鼠、兔等动物基因组和基因的解析迅速发展,它们和人的基因组和基因具有相应的对应。猜测这些动物和人的与生理功能调节相关的蛋白很相似。不过存在的极大的不同也将成为医药开发的障碍。已知这些动物和人之间存在蛋白和蛋白功能具有很大差异的情况。和本发明的方法相结合,可以阐明和人的分子功能网络的不同,有益于医药开发。此外,可以用于指导如何适当的将开发于人用的医药转成多种动物药物来应用。
医药开发时,当存在和人的疾病和病情类似的发病动物时,多数会在该动物中进行药理活性指标开发研究。这类发病动物的基因的研究也很迅速。根据本发明的方法使之对应于人的基因信息,有助于了解人的该疾病的机制。
此外,为了解基因功能,破坏特定的基因的基因敲除动物和发生功能减弱变化的基因、发生基因表达过剩的转基因动物越来越多。这些中,很多因为致死性原因导致未出生,同时还有很多未对生物功能和行动造成任何影响。即使所生出的动物观测到了异常,对于这些动物试验的结果进行解析是非常困难的。在这个试验中,采用本发明的方法,从预测该基因操作影响,便于功能解析。
上述的2个以上生物物种的研究采用本发明的方法时,最好事先准备生物物种间的基因对应关系或者蛋白的对应关系。此外,其他方法还可以在本发明方法的数据库中登录每个生物物种的数据。这种情况下,用于区别生物物种的信息最好记录到“生物分子信息数据库”和“生物分子连锁数据库”中。例如在关于生物分子的“生成脏器”、“存在脏器”、“作用脏器”项目中添加的上层概念的生物物种区别。本发明的方法可以记录生物物种的区别。
基因相关的信息和解析进展的同时,在序列ID的统一方面进展迅速,此外,基因组序列上的基因定位也迅速进展。认为按照上述目的,考虑和上述“生物分子连锁数据库”的联合构建单独的基因信息数据库,要考虑到这些信息的膨大和公开的方向性,通过将来这样公开信息随机按照本发明的方法收录,实施上述方法的可能性增高(图6)。
本发明的方法所用的生物分子连锁数据库不必要收集到同一个场所加以管理和保存,通过统一分子略号,通过适当选择在不同的场所管理、保存的1个以上的生物分子连锁数据库,以通信等手段进行连续使用。除了生物分子连锁数据库之外,本发明的方法使用的生物分子信息数据库、医药分子连锁数据库、医药分子信息数据库、基因信息数据库、病态连锁数据库等,也可以用同样的处置方法。
作为本发明的其他实施方式提供了以下方法,做成含有和生物事件发生直接相关的生物分子和该生物学事件信息的数据库(生物学事件-生物分子数据库),同时并用未必含有生物学事件信息的分子网络数据库。此外,作为本发明的其他实施方式,提供了以下方法,从未必含有生物学事件信息的分子网络数据库中,抽出和任意分子相关的部分分子网络,将组成该网络的分子作为基础,检索上述的生物学事件-生物分子数据库的方法。
作为本发明的其他实施方式,提供了以下方法,针对“生物分子信息数据库”、“生物连锁数据库”、“医药分子信息数据库”、“医药分子连锁数据库”、“生物分子-基因数据库”、“病态连锁数据库”等各数据项目,根据关键词、数值参数、分子结构、氨基酸序列、碱基序列等进行检索,根据该检索结果,生成分子功能网络的方法。下面,例举如何通过检索生成分子功能网络,不过这些例子不限定本发明的范围。
各个数据库中,将分子名称、分子略号、生物物种、生成脏器、存在脏器等种种信息以文本的形式加以保存。针对这些文本,根据文字全部一致、部分一致等进行检索,掺入生物分子、生物分子对、生物学事件、病态事件、医药分子、医药分子-生物分子对、基因-蛋白相对应的数据等。根据这些掺入的信息,确定检索的起点、终点,将组合检索对象的分子对的范围窄化,进而根据利用目的生成分子功能网络。
“医药分子信息数据库”中保存有医药分子的化学结构、立体结构时,针对这些根据全部结构一致、部分结构一致、结构相似性等进行检索,掺入医药分子。以掺入的医药分子为基础,生成和该医药分子相关的分子功能网络,可以检索和该医药分子相关的生物学事件、病态事件。
“生物分子信息数据库”保存有基因转录、蛋白表达等数值参数时,根据这些数值参数进行检索,可以生成基因转录量、蛋白表达量相应的分子功能网络。根据数值参数检索,从外部的文件和数据库等中引入数值参数也是可以的。
“生物分子信息数据库”或关联数据库中保存有蛋白质氨基酸序列时,通过进行与所述氨基酸序列具有序列同源性或部分序列模式一致为基础的检索,可以掺入生物分子,根据该生物分子生成分子功能网络。该方法对功能未知的蛋白质,根据其部分序列信息推定与该蛋白关联可能性高的分子功能网络、并进一步推定该蛋白质的功能有效。
“生物分子信息数据库”、“生物分子-基因数据库”或者相关数据库中保存有与蛋白相应的基因的碱基序列时,针对这些碱基序列相对应的序列同源性和部分序列模式的一致等进行检索时,可以掺入生物分子,可以根据该生物分子生成分子功能网络。该方法,功能未知的基因根据其部分序列信息,从该基因出发,推测和其翻译的蛋白关联可能性高的分子功能网络,进一步对该蛋白的功能推测有效。
作为本发明的其他实施方式,提供了下述方法,将某些疾病(以下,称为“被关注的疾病”)相关的病态事件、生物分子、其他信息组化并且/或者级系化并加以保存的“病态连锁数据库”,并利用此数据库进行分子功能网络的生成、检索的方法。下面用例示说明制作和利用病态连锁数据库的方法,下面特定的组化、级系化方法并未限定本发明的范围。
在病态数据库中,将受关注的疾病相关的病态事件、生物分子等其他信息如下例所示进行组化并/或者级系化保存。对于某些受关注的疾病,能够确认任何一个属于组的2个以上数据项目间的关联的情况下,将该项目间的关联信息加以保存。
1. 关键分子2. 生物反应3. 症状、症候4. 临床检测值5. 疾病、综合症在病态连锁数据库的“关键分子”组中,保存和疾病相关的量的和/或质的变动可见的生物分子的信息。利用该关键分子的信息,从病态事件出发检索分子功能网络,实现检索分子功能网络中的分子和病态事件间的关联。
关键分子的量或者质的变动,可以如下例所示表现出来。在某疾病中分子A,在量上向增加的方向变化时,表现为A(+)。本例中,以酶活性和受体活性亢进为例。与此相反,当分子A在量上向减少的方向变化时,表现为A(-)。这种情况也包括量性变化几乎为0的情况,同时也含有相伴随的分子功能损失。例如DNA的启动子区域的CpG岛的甲基化发生异常时基因不表达,因此,本来转录、被翻译,具有全功能的蛋白质处于不活化的现象也可由所述的表示表现出来,此外,使用该表现方法容易对敲除特定的基因,该基因编码的蛋白质欠缺时分子功能网络的变化进行推测。某疾病中,某分子表现出质的变化时表示为A(m),编码该蛋白质的基因发生变异较多。
病态连锁数据库中“生物反应”组中,考虑到直接或者间接和疾病的归属,保存生物体异常或者过剩(或者过少)等状况下生物学反应、生物体内现象的信息。生物学反应组中记述的数据项目最好赋予分子功能网络上的生物学事件、生物分子对、子网络等的关联。这里的生物学反应主要指的是分子水平(包括蛋白质、酶活性、基因)、细胞水平、脏器水平的现象,最好将信息进行级系化记述、此外,可以根据事件引发位置的信息和条件等将生物学反应进行级系化。
在病态连锁数据库中的“症状、症候”组中,赋予受关注疾病特征,或者保存形成受关注疾病诊断依据的病态事件。优选在此组中记述医药分子导致的副作用所相对应的病态事件。此外,在该组存在的病态事件中,最好将针对某医药分子的作用机制和适应症所关联的信息作为该医药分子的数据在“医药分子信息数据库”中加以记述。由此对于作用靶标生物分子不明的医药分子,可以检索分子功能网络。
病态连锁数据库中的“临床检查值”组中,保存在实际临床中正在应用还是有可以应用的可能性的检查项目。将临床检查所测定的生物分子对象保存在生物分子信息数据库中时,也可以将临床检查测定的对象作为该生物分子的分子附加信息添加进去。关于临床检查值的组中的生物分子,可以进行相关分子功能网络检索,分子功能网络中存在的生物分子时临床检查的测定对象时,可以根据此信息用于对此生物分子进行强调表示等目的。
病态连锁数据库中的“疾病、综合症”组中记述了以受关注疾病的成因、阶段、病患部位等为基础的名称和分类名、以及受关注疾病相关综合症等信息。“疾病、综合症”项目中可以保存例如根据受关注疾病、阶段、患病部分等进行级系化保存。
病态连锁数据库中的用语,优选按照例如MedDRA/J(MedicalDictionary forRegulatory Activities Terminology;日本公定书协会)等标准词典进行记述。此外,除了字典中含有的用语之外,还可以添加定义词和同义词。
通过病情连锁数据库和本发明的其它数据库并用可以实现下述分子功能网络的检索。
如上所述,对针对某医药分子的靶标生物分子进行记述时,从该医药分子出发通过经由该靶向性生物分子进行组合检索,进行该医药分子相关的分子功能网络检索。用病情连锁数据库,即使靶向生物分子是不明医药分子时,可以按照下述方法也可以检索该医药分子相关的分子功能网络。
对于靶向生物分子不清楚的医药分子,可以根据该医药分子的适应疾病、适应症、作用机制等信息,对病情连锁数据库中与之相一致的项目进行检索。然后,用病情连锁数据库中赋予关联的信息,进行病情连锁数据库的数据项目间的组合检索,得到根据生物分子连锁数据库的联系取得的关键分子的信息。从该关键分子出发,用生物分子连锁数据库,进行组合检索,可以检索与该医药分子相关的分子功能网络。此外,根据某医药分子的副作用信息检索病情连锁数据库,如果在症状、症候和疾病、综合症组中存在与之一致的项目,可以通过从该项目出发进行与上述同样的组合检索,继而可以检索和该医药分子副作用相关的分子功能网络。
本发明所提供的数据库和计算机系统,可以使用便于用户添加、编辑、消除数据的输入输出装置。用户编辑的数据可以保存,也可以根据需要整合到先前提供的数据库中。并且整合的数据可以用于检索、阅览等。例如用户就试验验证的或者预测的生物分子、生物分子对、生物学事件、病态事件、医药分子信息、基因等信息进行数据追加、编辑、删除等,通过组合检索可生成新型的分子功能网络,伴随着分子功能网络可以获取新型的事件信息。据此,可以对疾病新的分子机制进行推测。用户编辑的数据既可以向先前提供的数据库的数据项目中以追加、置换数据项目的形式加以记录,也可以作为编辑用的文档或数据库单独管理,根据需要,可以和先前提供的数据库内的数据并用。
本发明的数据库以外的外部数据库中收集的全部或者部分生物分子、生物分子对、生物事件、病态事件、医药分子信息等信息都可以收入到本发明的数据库中。
作为本发明的其他实施形式,提供了如下方法在终端阅览的信息中,本发明数据库中的任何数据项目和生成的分子功能网络中的任何一个项目对应存在时,对该项目进行强调表示的方法。根据此方法,使非特异地对数据库进行检索的用户知道该项目已经在现有数据库中登录了。此外,此时,不仅强调表示该项目,还可以将相关的数据库的数据项目和分子功能网络的一部分或者全部数据在终端表示出来。并且,根据该项目进行组合检索,表示生成的与该项目相关的分子功能网络。
作为本发明的其他实施形式,本发明提供了为了实施本发明方法的由程序和数据库组成的计算机系统、实施本发明方法的记录程序和数据库的计算机可读取介质、为了使用本发明方法用于可以读取记录有数据库的计算机的介质、记录有根据本发明方法生成的分子功能数据库相关信息的计算机可读介质。
总结本发明方法的特征,如下所示.建立含有生物事件的信息,根据积累直接结合的生物分子对信息,制成生物体内分子间关联的数据库。
.从对作为部分的集合的上述数据库组合检索,建立和任意生物分子或者生物学事件相关的分子功能网络。
.根据分子功能网络,推断任意分子直接、间接相关的生物学事件。
.从生物学事件信息相关的分子功能网络出发,推断疾病机理、可能的药物靶点、副作用风险等。
.从生物分子的量或者质的变动出发,推断生物学事件的上调或者下调。
.具有生物分子生成脏器、存在脏器以及作用脏器信息的分子功能网络。
.用医药分子信息和分子功能网络推测副作用、药物相互作用。
.在分子功能网络上解释使用医药分子导致的蛋白表达变化。
.根据基因信息及其链接对分子功能网络的基因多型影响、疾病背景基因等进行解析。
实施例下面通过实施例对本发明进行具体说明,不过不限定本发明的范围,参照PCT/JP01/07830号说明书中记载的实施例,可以更容易对下述实施例进行理解。
例1用转录因子NFκB体系和TNF因子复合体为例解释了当2个以上生物分子组成的复合体(集合体)具有功能时,如何向生物分子信息数据库和生物分子连锁数据库中登录该复合体的方法和利用方法(图7)。
转录因子NFκB是RelA和p50的异二聚体时具有功能。关于这样的分子,可以如下所述处理成一个分子。在生物分子信息数据库中,分子的附加信息的项目中设立“复合体信息”栏,输入NFκB的组成分子RelA和p50。配体依赖性形成的复合体,例如TNF受体复合体(图7中的TNFR1[4])也可以同样处理成一个分子,使分子功能网络表现得更为简洁。
根据生物分子的不同,两种情况都需要考虑,有时将其按照复合体的组成分子进行处理,有时作为单独的一个生物分子进行处理。如图8所示,将生物分子TRAF2作为复合体TNFR1[4]的组成分子进行处理,同时又将其作为NFκB下游诱导表达的单独生物分子进行处理。这种情况下,可以对单独的生物分子TRAF2和复合体TNFR1[4]的组成分子TRAF2间进行关联赋予,使分子功能网络表现得更致密。这种关联赋予可以对照分子信息数据库中的分子略号和复合体信息栏中的分子略号自动进行。
例2以NFκB/IκBα复合体系统为例说明如何通过生物分子数据的级系化区别生物分子修饰状态(图9)。
NFκB/IκBα首先通过IKKcomplex进行磷酸化,然后(确认磷酸化部位并结合)通过SCF complex进行泛素化,最后由26Sproteasome将IκBα分解。该例子中,可以对未修饰状态的NFκB/IκBα、磷酸化的NFκB/IκBα以及泛素化的NFκB/IκBα根据生物分子信息数据库的“修饰状态”层次数据进行区别。通过这样使用级系化数据,可以针对NFκB/IκBα的各种修饰状态,分配不同的分子略号,简洁的表现IKK complex等各个生物分子和NFκB/IκBα的关系。
例3很多时候,不知道部分生物分子的修饰状态信息,也无法明确区分生物分子对形成和生物学事件间的关联。例如如例10所示的无法明确不同部位磷酸化的生物分子p53和与之形成生物分子对的对方生物分子的对应关系。这种情况下,可以将多个修饰状态的某些生物分子作为一个进行处理。
例4糖尿病是一种受到关注的疾病,例子展示了病情连锁数据库中的各个数据项目和各自间的关联数据。
糖尿病,在1997年由ADA(American Diabetics Association)分成1型、2型、其他特殊型、妊娠型糖尿病,通常是因为基因和环境错综整合的多因子疾病。
以病情数据库中所含有的数据项目为例,表1中展示了将糖尿病作为受关注疾病根据本发明的方法记述的病情连锁数据库内容。图11中,展示了各个数据项目的关联性。将图中用线连接的数据项目对分别作为相关信息记录到病情连锁数据库中。
表1


对于糖尿病这样的与多个因素相关的疾病,用图示化的形式明确表示其机制是非常困难的,不过采用本发明的方法,可以很容易理解病情连锁数据库中的每个组分类中的每个数据项目是怎样联系的,以及多个数据项目间的关联网络。对复杂疾病的整体印象、具体印象进行捕捉时,可以从与疾病相关的病态事件、生物分子、生物学反应等间的关联性出发,理解疾病。
例5以检索与病情连锁数据库中与糖尿病相关的关键分子出发的分子功能网络中的子网络为例。
现在,还没有详细阐明糖尿病的发病机制。这里,首先,在病情连锁数据库中对糖尿病中发生量和/或质的变动的分子进行检索,得到记述有INFα(+)、FFA(+)、胰岛素(-)、HNF-4a(m)、葡萄糖(+)、瘦素(leptin)(+)、HbA1C(+)的某些关键分子群。然后,用生物分子信息数据库和生物分子连锁数据库,对该关键分子所属的各个子网络进行检索。
按照上述的方法,可以从每个和关键分子在糖尿病方面有关的某些子网络群中抽取得到TNFα(+)的“TNF受体介入的信号传导”和“NF-κB诱导表达”、FFA(+)的“脂蛋白代谢”、胰岛素(-)的“胰岛素信号传导”和“葡萄糖导致的胰岛素分泌”、HNF-4a(m)的“胰脏的表达和代谢相关的转录因子子网络”、葡萄糖(+)的“葡萄糖导致的胰岛素分泌”、“葡萄糖代谢”和“糖降解”等(图12)。
根据此方法,可以研究与糖尿病相关的或者该疾病中发生变动的分子以及其与生命现象中的哪些通路相关。
例6糖尿病目前根据成因的不同进行分类。分类随着糖尿病最新成因的研究不断进展,可以用此实现更确切诊断和治疗的目的。这里,用例子说明解释根据成因分类的糖尿病机制。
在“其他特殊类型”的糖尿病类型中有一种为MODY1(muturityonset diabetes of the youth1)。为了对MODY1和其他分类的糖尿病相比较有什么不同进行研究,从病态连锁数据库中的疾病、综合症组出发,对MODY1的项目进行检索,从该项目出发,对病情连锁数据库进行组合检索,能够抽出相关项目。
上述的检索结果分别有在关键分子组中和MODY1原因基因相对应的HNF-4α(m),在生物学反应组中的“HNF-4α基因突变”。此外,用生物分子连锁数据库,检索和转录因子HNF-4α相关子网络时,得到了子网络“胰脏中的表达和代谢相关的转录因子网络”。通过生成属于该子网络的分子功能网络,可以知道实际上HNF-4α周围具体的生物分子对(图13)。
这样一来,用本发明的方法,即使从更详细分类的疾病名称出发,也可以得到与其成因相关的分子和机制以及和其他疾病的差异相关的信息。
例7糖尿病也可以认为是代谢异常疾病,生物体代谢系统中和糖尿病因果关系直接明确的疾病有MODY2。这里用例子说明对糖类代谢和糖尿病以及其成因的检索。
首先,以MODY2提问搜索病情连锁数据库,得到和MODY2相关的关键分子数据项目GlcK(m)和GlcK(-)。然后,以GlcK(m)和GlcK(-)提问,用生物分子连锁数据库进行检索,抽出具有与此提问相对应的数据的子网络“糖降解”(图14)。
例8举例说明研究糖尿病中最重要的分子之一的胰岛素在生物体中的作用时,以胰岛素提问,尝试用本发明数据库进行组合检索。
糖尿病和多种形式的胰岛素相关。首先,以胰岛素提问检索病态连锁数据库,分别抽取到下述项目从关键分子组中的胰岛素(+)、胰岛素(-)以及胰岛素(m)、生物学反应组的“胰岛素作用低下”、“胰岛素分泌功能低下”、“胰岛素受体减少”等;症状、症候组中的“胰岛素抵抗性”;临床检查值组中的“胰岛素抗体(IAA)(+)、胰岛素注射经历(-)”、疾病、综合症组中的“胰岛素受体异常症A型”等项目。
此外,以胰岛素提问,检索生物分子连锁数据库,抽取得到“胰岛素信号传导”、“胰β细胞中的胰岛素分泌”等。其中,尤其是“”胰岛素信号传导”中有胰岛素-胰岛素受体生物分子对下游的“细胞增值”、“蛋白质合成”、“糖原合成”、“脂类分解”、“糖降解”、“糖运输”、“细胞程序死亡”等生物学事件(图15)存在。因此,可以知道该信号传导是因为什么原因发生了障碍,其影响涉及多个方面以及胰岛素对生物体的重要性和功能的多样性。
例9生活习惯疾病很多时候和几种疾病同时或伴随性发生,它们具有很多共同的原因。糖尿病引发自身的多种并发症,在称为“死亡四重奏”和“综合症-X”的症候群中,单独将糖尿病割裂为一种疾病来考虑是非常困难的。
因此,以这些症候群共同的病情“胰岛素耐受性”提问检索病情连锁数据库,通过用有方向性图表示检索结果可以得到易于理解的以图形表示的和“胰岛素耐受性”相关的疾病及其关联性(图16)。
例10用例子说明如何根据医药分子信息数据库的数据,知道某些医药分子的作用机制。
以医药分子信息数据库中含有的信息为例,按照糖吸收延迟的作用顺序,在表2中表示出糖尿病治疗药物阿卡波糖的医药分子信息数据库中的数据。
表2医药分子信息数据库

用阿卡波糖以及其商品名提问以求得其作用机制的情况下,对医药分子信息数据库数据进行检索,可以得到靶向生物分子(靶分子)α-糖苷酶的信息。此外,用α-糖苷酶提问检索生物分子连锁数据库,可以知道该分子存在于“多糖、寡糖代谢”子网络中。并且,为了表示该子网络中的分子子网络,可以知道α-糖苷酶是从蔗糖到葡萄糖、从麦芽糖到葡萄糖等分解反应酶,阿卡波糖能够阻断这些反应(图17)。
例112型糖尿病的典型特征是胰岛素耐受性。此处用例子说明如何详细地在分子功能网络上研究可以改善胰岛素耐受性医药分子的作用机制(图18)。
以“胰岛素耐受性”提问对病情连锁数据库进行检索,首先,在受关注疾病“糖尿病”的症状、疾病组中发现了“胰岛素耐受性”。然后,再同样以“胰岛素耐受性”提问以文字部分一致为条件进行医药分子信息数据库检索,抽取得到具有改善胰岛素耐受性药理作用的医药分子噻唑烷二酮类的“吡格列酮”和“曲格列酮”(目前已经在日本停止出售)。从医药分子信息数据库中得知这些胰岛素改善耐受性药物的作用原理是“增加糖摄取”、作用机制是“活化核内受体型转录因子PPARγ(peoxisome proliferator activated receptor γ)”。
这里就作用原理“增加糖摄取”以“糖摄取”提问,再次进行分子功能网络检索,得到子网络“胰岛素信号传导”中分子GLUT4下游生物学事件中存在的“糖摄取”。
生产中应用的可能性作为含有生物学事件的生物分子对信息集合的本发明的生物分子连锁数据库,通过检索生成具有必要范围的功能上或者生物合成上与该分子间有关联性的分子功能网络。可以用于对与任意生物分子的表达有直接或间接关系生物学事件的推测。而且,可以和医药分子的信息或者基因信息衔接,得到新药开发和个体差异治疗的必要知识。
权利要求
1.一种分子功能网络的生成方法,该方法包括利用根据含有选自修饰状态、活性/失活状态、聚集状态以及结构变化的1或2项以上项目将生物分子信息级系化并保存所获得的数据库进行组合检索的步骤。
2.一种分子功能网络的生成方法,该方法包括利用生物分子对信息包含该生物分子对形成条件的生物分子连锁数据库,进行组合检索的步骤。
3.一种分子功能网络的生成方法,该方法包括将与疾病相关的信息作为组化和/或级系化的数据项目保存,并利用保存所述数据项目间的关联赋予信息的病态连锁数据库进行组合检索的步骤。
4.一种分子功能网络的生成方法,该方法包括通过对选自关联编码、关联功能编码、可信性编码、作用脏器以及生物分子对的方向性的数据项目中的1项或2项以上的数据项目设定条件,利用生物分子连锁数据库,筛选生物分子并进行组合检索的步骤。
5.如权利要求1至4中任意一项中所述的方法,该方法进一步包括下述步骤,即根据含有选自关联编码、关联功能编码、可信性编码、作用脏器以及生物分子对的方向性的数据项目中的1项或2项以上的数据项目,对利用生物分子连锁数据库通过组合检索生成的分子功能网络进行分值赋予的步骤。
6.利用权利要求1至5中任意一项所述的方法分析疾病背景基因的方法。
7.利用权利要求1至5中任意一项所述的方法分析2项以上疾病之间关联性的方法。
8.利用权利要求1至5中任意一项所述的方法制成医药分子信息数据库和/或医药分子-生物分子连锁数据库,预测医药分子作用机制和/或副作用的方法。
全文摘要
一种分子功能网络的生成方法,该方法包括利用根据选自修饰状态、活性/失活状态、聚集状态以及结构变化的1或2项以上项目将生物分子信息级系化并保存所获得的数据库进行组合检索的步骤。利用作为包含生物学事件的生物分子对信息集合的本发明生物分子连锁数据库,通过检索生成作为在必要范围内功能上、生物合成上的该分子间关联的分子功能网络,由此可以推定与任意生物分子的表达直接或间接相关的生物学事件。
文档编号G01N33/15GK1653454SQ0381070
公开日2005年8月10日 申请日期2003年3月11日 优先权日2002年3月11日
发明者富冈伸夫, 板井昭子 申请人:株式会社医药分子设计研究所
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1