在系统毒理学中使用机理网络模型的系统和方法

文档序号:9553252阅读:205来源:国知局
在系统毒理学中使用机理网络模型的系统和方法
【专利说明】在系统毒理学中使用机理网络模型的系统和方法
[0001] 相关申请的引用
[0002] 本申请根据35U. S. C. § 119要求在2013年4月23日提交的题为"Systems and Methods for Using Mechanistic Network Models in Systems Toxicology" 的美国临时 专利申请第61/815, 188号的优先权,该临时申请通过引用而被整体结合于此。
【背景技术】
[0003] 人体由于暴露于可能有害的媒介(agent)而不断地被扰动,就长期而言,这些媒 介会造成严重的健康风险。暴露于这些媒介可危及人体内部的生物机制的正常机能。为了 理解并量化这些扰动对人体的影响,研究人员研究了生物系统对暴露于媒介作出响应的机 制。某些组大量利用体内动物测试方法。但是,因为关于其可靠性和相关性还存在疑问,所 以动物测试方法不总是充分的。不同动物的生理系统中存在许多差异。因此,不同的物种 会对暴露于一种媒介有不同的响应。因此,关于从动物测试获得的响应是否可以外推到人 类生物学还存在疑问。其它方法包括通过对人类志愿者的临床研究来评估风险。但是这些 风险评估是后验执行的,而且,因为疾病可能要花几十年才表现出来,所以这些评估可能不 足以说明把有害物质关联到疾病的机制。还有其它方法包括体外实验。虽然,作为其基于 动物的对等体的完全或部分代替方法,基于体外细胞与组织的方法已经获得普遍认同,但 是这些方法具有有限的价值。因为体外方法集中在细胞和组织机制的特定方面;所以它们 不总是考虑到发生在整个生物系统中的复杂相互作用。
[0004] 在过去的十年中,核酸、蛋白质与代谢物级别的高吞吐量测量结合传统的依赖剂 量的疗效与毒性检测已经作为一种用于说明许多生物过程作用机制的手段出现。研究人员 已经尝试结合来自这些全异测量的信息与来自科学文献的关于生物途径(pathway)的知 识来组成有意义的生物模型。为此,研究人员已经开始使用可以挖掘大量数据的数学与计 算技术,诸如聚类与统计方法,来识别可能的生物作用机制。
[0005] 之前的工作还探究了揭开基因表达变化的特征签名的重要性,这种基因表达变化 是由于对生物过程的一个或多个扰动导致的,以及还探究了对那种签名在附加数据集中的 存在进行后续打分,作为那个过程的具体活动幅度的量度。这方面的大部分工作涉及识别 与疾病表型(phenotype)关联的签名并给其打分。这些得自表型的签名提供了显著的分类 能力,但是缺乏单个具体扰动与该签名之间的机理或因果关系。因此,这些签名可能代表多 个截然不同的未知扰动,这些扰动通过常常未知的一个或多个机制导致相同的疾病表型或 者得自于相同的疾病表型。
[0006] -个挑战在于理解生物系统中各个单独生物实体的活动如何使得能够激活或抑 制不同的生物机制。因为单独实体,诸如基因,会在多个生物过程(例如,发炎和细胞增殖) 中涉及到,所以基因的活动测量不足以识别触发该活动的底层生物过程。
[0007] 近来,关于强调以整个基因组级别的增大机理粒度来理解化学制品暴露的生 物影响的方法,在系统毒理学中已经有增多的关注。美国国家研究委员会关于环境媒 介的毒性测试和评估的报告主张从顶点端点级别的毒理评估转向理解受生物活动物 质扰动的信号传导途径并且识别可能对人类造成负面健康影响的那些[KreWSki,D.et al. (2011)New directions in toxicity testing. Annu Rev Public Health. 32, 161-78 ; Bhattacharyaj S. et al. (2011)Toxicity testing in the 21 century:defining new risk assessment approaches based on perturbation of intracellular toxicity pathways. PLoS One.6,e20887 ;Keller,D.A. et al. (2012)Identification and characterization of adverse effects in 21st century toxicology. Toxicological Sciences. 126,291-297 ;National Research Council. Committee on Toxicity Testing Assessment of Environmental Agents (2007), Toxicity testing in the 21st century: A vision and a strategy. N. A. Press] 〇
[0008] 该范式转移也在药理学中见到,其中为了最佳的临床前和临床安全测试需要对 疾病机制的更详细理解[Atterwill,C.K. and Wing,M.G. (2002) In vitro preclinical lead optimisation technologies (PLOTs) in pharmaceutical development. Toxicology letters. 127, 143-151h新技术允许大规模的数据生成,并且对这些数据的评价可以提供 机理乃至对期望效果以及副作用两者的定量洞察。分子的差异表达列表的解释在取得有 意义信息方面已经证明是低效的,并且焦点已经转移到使用从利用感兴趣的化合物进行 治疗的实验系统获得的数据的途径分析和网络模型开发[Lee,E.et al. (2008) Inferring pathway activity toward precise disease classification. PLoS computational biology. 4, el 000217]。然而,许多广泛使用的途径数据库相对于其网络中的实际交互看 起来不一致。该不一致性可以部分地归因于标准化词汇的频繁缺席以及对依组织或细胞类 型而定的信号传导机制的管护(curation)/知识的缺乏。
[0009] 在过去的十年中,系统生物学社区已经经历了数据驱动的网络推理的计算方法 的增加,其不需要先前的文献知识,而是基于系统响应谱(SRP)来构建网络[HoengJ.et al. (2012)A network-based approach to quantifying the impact of biologically active substances.Drug Discov Today. 17,413_8]D -个突出;例是连通性地图基因 表达纲要,其是从利用大批化合物进行治疗的细胞系获得的以比较药物和基因效果以及 识别与具有类似表达谱的药物相关的网络社区[Lamb,J.et al. (2006)The Connectivity Map:using gene-expression signatures to connect small molecules, genes, and disease. Science Signalling. 313, 1929!U推理在几乎没有先前信息的情况下是可能的, 并且不同的算法[Lamb,J. et al. (2006)The Connectivity Map:using gene-expression signatures to connect small molecules, genes,and di sease. Science Signalling. 313,1929 ;Xiang,Y.et al. (2011)Divergence Weighted Independence Graphs for the Exploratory Analysis of Biological Expression Data. Journal of Health&Medical Informatics ;Iorio,F. et al. (2010)Discovery of drug mode of action and drug repositioning from transcriptional responses. Proceedings of the National Academy of Sciences. 107, 14621-14626]可以被容易地应用于从药物发现流水 线的不同阶段中的新化合物获得的转录或蛋白质组响应。然而,这些方法仍然被假设、简化 以及经常有限的实验数据集所危及[Lecca,P. and Priami,C. (2012) Biological network inference for drug discovery. Drug discovery today] dDREAM(关于逆向工程评估和方 法的对话)提案通过群众分包已经评估了 29个基因网络推理方法的性能并且得出结论"根 据基因表达数据的可靠网络推理仍是未解决的问题" [Marbach,D.et al. (2010)Revealing strengths and weaknesses of methods for gene network inference. Proceedings of the National Academy of Sciences.107,6286-6291]〇

【发明内容】

[0010] 在此描述了使用高吞吐量分子级别测量和因果生物网络模型作为计算分析的基 底的系统和方法。该综合方法提供了生物系统级别的对疾病的致病机制的洞察以及对由暴 露于媒介或刺激物而造成的各种生物系统的扰动的定量评估。
[0011] 根据本公开的一种实现方式,处理器或者处理电路接收来自其中生物系统被扰动 的实验的数据以及对照数据(control data)。该处理器或处理电路生成系统响应谱(SRP), SRP是响应于向生物系统呈现媒介的、生物系统内的一个或多个实体改变的程度的表示。然 后,网络模型被选择为与感兴趣的媒介或特征有关。使用SRP和网络来提取系统内的实体 之间的因果关系,从而生成、细化或者扩展网络模型。
[0012] 具体而言,网络扰动幅度(NPA)被计算。NPA是影响的量化测量,或者在网络所表 示的生物实体之间的底层关系的背景下是由SRP表示的对扰动或治疗的生物响应的量化。 然后,来自不同网络模型的NPA可以被组合以得出生物影响因子(BIF)。BIF可以与其他可 测量端点相关联,或者用来生成可以提供对疾病发生或进展的机制的新洞察的可检验的假 设。BIF然后被分解为单独的网络模型,从而允许识别对影响贡献最大的生物过程。
[0013] 在这里描述的系统和方法的某些实施例中,一种计算机化方法量化生物系统响应 于媒介的扰动。该计算机化方法包括:在处理电路处接收与生物系统对媒介的响应相对应 的治疗数据集,以及接收与未暴露于媒介的生物系统的响应相对应的对照数据集。各自表 示生物系统中的生物过程的第一计算因果网络模型和第二计算因果网络模型被识别。处理 电路基于治疗数据集和对照数据集来计算第一计算因果网络模型的第一分数和第二计算 因果网络模型的第二分数。基于第一分数、第二分数以及第一计算因果网络模型与第二计 算因果网络模型之间的交集来生成因子,其中该因子表示生物系统响应于媒介的扰动。
[0014] 在某些实施例中,生物系统包括多个生物实体,每一个生物实体与生物实体中的 至少另一个相互作用,并且第一计算因果网络模型与第二计算因果网络模型之间的交集包 括代表多个生物实体的子集的重叠节点集。
[0015] 在某些实施例中,该方法还包括确定第一分数的统计显著性以评估第一分数相对 于第一计算因果网络模型的特异性。确定第一分数的统计显著性可包括修改第一计算因 果网络模型的一个或多个方面以获得一组测试模型,基于该组测试模型来计算一组测试分 数,以及将第一分数与该组测试分数相比较。一个或多个方面可包括指派给第一计算因果 网络模型中的一组节点的标签。一个或多个方面可包括第一计算因果网络模型中的节点之 间的边连接。在某些实施例中,修改被随机执行N次,并且每当修改被执行时测试分数中的 一个被计算。在某些实施例中,当第一分数超过该组测试分数的阈值百分比时第一分数是 统计显著的。
[0016] 在某些实施例中,第一计算因果网络模型和第二计算因果网络模型中的每一个代 表生物系统中的生物机制。在某些实施例中,计算第一分数包括评估第一计算因果网络模 型底层的有符号的有向图的范数。评估范数可包括评估邻接矩阵。
[0017] 在某些实施例中,生成因子包括计算考虑了第一计算因果网络模型与第二计算因 果网络模型之间的交集的点积(scalar product),以及基于点积来调节第一分数和第二分 数中的至少一个。在某些实施例中,点积抵消交集并且表示第一计算因果网络模型和第二 计算因果网络模型的正交部分的贡献。在某些实施例中,点积定义正交直和。
[0018] 在此描述的计算机化方法可以在具有一个或多个计算设备的计算机化系统中实 现,每个计算设备都包括一个或多个处理器或处理电路。一般而言,在此描述的计算机化系 统可以包括一个或多个引擎,引擎包括一个或多个处理设备,诸如计算机、微处理器、逻辑 器件或者配置有用来执行在此描述计算机化方法中一个或多个的硬件、固件和软件的其它 设备或处理器。在某些实现方式中,计算机化系统包括系统响应谱引擎、网络建模引擎和网 络评分引擎。引擎可以不时地互连,并且进一步不时地连接到一个或多个数据库,包括扰动 数据库、可测幅度数据库、实验数据数据库和文献数据库。在此描述的计算机化系统可以包 括具有通过网络接口进行通信的一个或多个处理器和引擎的分布式计算机化系统。这种实 现方式对于通过多个通信系统的分布式计算可能是合适的。
【附图说明】
[0019] 在考虑到结合附图理解的以下详细描述之后,本公开的更多特征、其本质及各种 优点将变得清楚,其中相似的标号自始至终指代相似的部分,并且其中:
[0020] 图IA示出了以生物实体之间的因果关系的形式描述依组织和细胞而定的生物过 程的网络模型。
[0021] 图IB示出了用于指示原因和效果关系的具有骨干节点和支持节点的因果生物网 络模型。
[0022] 图IC示出了捕捉节点中的生物学特性以及节点之间的因果关系的网络模型。
[0023] 图ID示出了代表从分子、细胞和器官级别到整个生物体的知识的网络模型。
[0024] 图2A示出了通过使用网络模型对差异表达基因的数学变换来评估的网络扰动幅 度分数。
[0025] 图2B示出了对照异生物质代谢网络模型来打分的体内支气管刷检数据集。
[0026] 图2C示出了异生物质代谢网络模型的背景下的人类支气管刷检数据集的比较。
[0027] 图3A是体内支气管刷检和暴露于烟雾的支气管上皮细胞的体外培养的示图。
[0028] 图3B示出了异生物质代谢网络的背景下的三个体内数据集和体外数据集的评 估。
[0029] 图3C示出了异生物质代谢网络模型的背景下的体内数据集与体外数据集的单独 比较。
[0030] 图4A示出了例示出各种网络和相对应的单独扰动幅度的生物影响因子圆锥,从 而示出了各种机制对整体生物影响因子的贡献。
[0031] 图4B使用肺部炎症过程网络(IPN)、细胞增殖网络、细胞应激网络以及构成DNA损 伤、自噬、细胞死亡(凋亡和坏死)和衰老网络(DACS)的子网络示出了暴露于烟雾的老鼠 肺部的相对生物影响因子数据。
[0032] 图4C例示出示出了针对各种治疗组将整体相对BIF分解为其主要机理成分(从 细胞增殖到炎症)的星状图。
[0033] 图4D是来自暴露于烟雾的老鼠的支气管肺泡灌洗液(BALF)细胞计数的图形表 不。
[0034] 图4E是针对肺部炎症过程网络(IPN)内的依细胞类型
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1