用于生物路径中的调控互动的学习和识别的系统和方法_2

文档序号:8516050阅读:来源:国知局
生组织、药物治疗组织或组织的克隆变异体。
[0016] 在需要时,设想的方法还可包括利用生物体外、硅中和整体实验中的至少一个来 验证导出的亚型互动关联的步骤。
[0017] 在本发明主题的另一方面中,发明人设想了一种将表示组织的组学数据集合归类 为属于亚型特定组织的方法。该方法典型地包括a经由组学输入接口获取表示组织的组学 数据集合的步骤,以及针对组学数据集合导出路径模型中的调控节点的多个调控参数中的 一组互动关联的另一步骤。在另一步骤中,导出的一组互动关联与和已知亚型特定组织相 关的先验已知的一组互动关联进行匹配,而且该匹配被随后用来归类出表示组织的组学数 据集合属于已知亚型特定组织。
[0018] 更优选地,获取步骤包括从具有已知调控特征的组织的组织样本(例如,肿瘤样 本)产生表示组织的组学数据集合,而且已知亚型特定组织是抗药性组织、分生组织、药物 治疗组织或组织的克隆变异体。
[0019] 在本发明主题的另一方面中,发明人设想了一种识别具有多个路径元素的路径模 型中的药物靶点的方法,其中至少两个元素经由具有调控节点的通路彼此耦接,所述调控 节点根据多个调控参数控制沿通路的活动。该方法包括下述步骤:(a)经由组学输入接口 获取表示组织的组学数据集合,(b)针对组学数据集合导出路径模型中的调控节点的多个 调控参数中的一组互动关联,以及(c)在预测药物干扰了互动关联处将药物识别为影响了 通路的活动。更典型地,调控节点影响了蛋白质的转录、转译和后转译改型中的至少一个, 而且药物是商用药物而且具有已知模式的作用。
[0020] 在本发明主题的另一方面中,发明人设想了一种识别具有多个路径元素的路径模 型中的目标路径的方法,其中至少两个元素经由具有调控节点的通路彼此耦接,所述调控 节点根据多个调控参数控制沿通路的活动。该方法优选地包括经由组学输入接口获取表示 组织的组学数据集合的步骤,针对组学数据集合导出路径模型中的调控节点的多个调控参 数中的一组互动关联的另一步骤,以及根据药物对互动关联的已知效果将路径识别为目标 路径的又一步骤。
[0021] 更优选地,已知效果是对致活酶的抑制效果、对受体的抑制效果、以及对转录的抑 制效果中的至少一个。在其它适当目标路径中,尤其设想的目标路径包括钙/钙调蛋白调 控路径、细胞激素路径、趋化因子路径、增长因子调控路径、荷尔蒙调控路径、MP致活酶调 控路径、磷酸酶调控路径和Ras调控路径。该还可包括根据识别出的路径提供治疗建议的 步骤。
[0022] 因此,设想的方法还包括一种经由电脑模拟仿真药物的治疗效果的方法,包括:获 取具有多个路径元素的路径模型的步骤,其中至少两个元素经由具有调控节点的通路彼此 耦接,所述调控节点根据多个调控参数控制沿通路的活动。设想的方法还包括识别出对 至少一个调控参数的影响已知的药物的步骤;通过组学处理模块并基于药物的已知效果, 经由电脑模拟而改变路径模型中的调控节点、活动和至少调控参数中的至少一个的另一步 骤;以及确定路径模型中的改变的次生效应的又一步骤。更典型地,次生效应在路径模型中 的另一调控节点、另一活动和另一调控参数中。
[0023] 本发明主题的各种目标、特征、方面和优势将由优选实施例的下述详细说明以及 附图而变得更明显,附图中类似标号表示类似元素。
【附图说明】
[0024] 图1是根据本发明主题的学习引擎的示例性示意表示。
[0025] 图2A是根据本发明主题的因子图结构的示例性示意表示,而且图2B示意性地描 绘了针对转录、转译和激活节点的替换调控模型。
[0026] 图3A是针对整个TCGA群中学习的每个互动的WPMI矢量的主成分分析(PCA)的 示例性示图。图3B图示了路径中的标记为激活和抑制的明显链接的群集成员,而且图3C 示出了群集的几何中心的WPMI值的热点图,示出了从最强抑制至最强激活的范围。
[0027] 图4A和4B是信息化(4A)和单调(4B)初始化下的明显链接的WPMI值的群集成 员条形图。
[0028] 图5A是描绘了未通过学习完整的条件概率的循环的每个EM步骤下的后续测试的 唯一子节点的百分比的示例性示图,而且图5B是连贯对照不连贯三联体的示例的示意图 不O
[0029] 图6A-6C是描绘了针对采用不同解析方法的路径分析的Kaplan - Meier存活曲线 的示例性示图。
[0030] 图7是G-分排名的示例性热点图表示G-分排名。
[0031] 图8A-8B是描绘了用于激活来自PPARA-RXRA和TAp73a的链接的组织所组合的 WPMI信号的示例性盒型图。
【具体实施方式】
[0032] 发明人现在已经发现,可以实现概率图形路径模型,其中调控参数的相互关系被 统计确定。由此,设想的系统和方法的分析和仿真将提供明显改进的精确度,而且实现了不 同路径和/或亚组织内的调控元素的差别使用的识别。
[0033] 因此,应该注意的是,通过利用群中的关注表型内的显著不同的使用分布识别调 控链接,就可能检查网络中的不同调节器是如何产生类似的细胞表型,哪怕使用完全不同 的路径来实现它们。此外,这样学习的参数可被用作统计测试的基础以针对每个调控节点 建立同生群的各个样本或子集在多大程度上遵循之前学习的参数模式的分布。
[0034] 在上述讨论通篇,大量参考考虑了服务器、服务、接口、门户、平台或由计算装置形 成的其它系统。应该理解的是,这种术语的使用被认为代表了具有至少一个处理器的一个 或多个计算装置,该至少一个处理器被配置用于执行存储在计算机可读的有形的非易失性 介质上的软件指令。例如,服务器可包括一个或多个计算机,其以满足上述较色、责任或功 能的方式操作作为网络服务器、数据库服务器、或其它类型的计算机服务器。
[0035] 例如,图1示例性地描绘了生态系统100,其包括学习引擎110。学习引擎110被配 置成针对一个或多个路径模型150处理一个或多个组学数据集合135。学习引擎110包括 两个主要部件:组学接口 120(学习引擎110经由组学接口 120获取关注的数据集合)以及 组学处理模块170 (其被配置成分析数据集合)。在所示示例中,学习引擎110被图示为可 通过网络 115 (例如,因特网、WAN、LAN、VPN、NationalLambaRail(SMURLwww.nlr.net), 等)访问的计算装置,很可能是HTTP服务器工厂。在一些实施例中,学习引擎110通过网络 115提供收费服务。例如,学习引擎110可经由基于云的平台即服务(PaaS)、基础设施即服 务(IaaS)、软件即服务(SaaS)、或其它类型的服务暴露一个或多个组学输入接口 120给分 析员170或其它用户。在其它实施例中,学习引擎110可以是相对于分析员170的本地计 算装置并且被配置成运行承担上述学习引擎110的角色和责任的一个或多个软件指令包。
[0036] 组学输入接口 120代表配置用于接收一个或多个组学数据集合135的计算接口。 接口 120的一个示例可包括能够经由网络115接收数据集合135的HTTP服务器。例如,数 据集合135可包括序列化格式(例如,XML)、BAMBAM格式、或可通过HTTP服务器传输的适 当数字格式的文件。在其它实施例中,接口 120可具有应用程序接口(API)的形式,数据结 构或它们的参考可通过其而经由网络115传递至学习引擎110,作为远程程序调用或甚至 经由本地库功能调用。应该理解的是,组学输入接口 120可被配置成耦接至一个或多个组 学数据集合源130,很可能操作作为数据库。在一些实施例中,学习引擎110包括与组学输 入接口 120耦接的染色体组数据库或排序装置。
[0037] 组学数据集合135可包括较宽范围的组学数据。在更优选的实施例中,组学数据 集合135表示染色体组数据,很可能是整个基因组数据、部分基因组数据、差分序列对象或 其它染色体组数据。而且,组学数据集合135还可表示其它类型的数据,包括蛋白质、代谢 组学、脂类组学、动力学、或其它组学数据形态。
[0038] 处理模块170表示与组学输入接口 120耦接的计算装置的至少一部分而且被配置 成针对路径模型150分析数据集合135。处理模块170的一个方面包括访问一个或多个路 径模型150的能力,可能地来自路径模型数据库140或其它模型源。在一些实施例中,组学 处理模块170还可利用组学输入接口 120来访问路径模型数据库140。
[0039] 路径模型150表示将被建模的目标组学
当前第2页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1