用于鉴别药物诱导毒性标志物的基于细胞的探询式分析的制作方法

文档序号:6167786阅读:436来源:国知局
用于鉴别药物诱导毒性标志物的基于细胞的探询式分析的制作方法
【专利摘要】本文描述的是一种用于通过建模来分析药物诱导毒性状态(例如,心脏毒性)的发现平台技术。
【专利说明】用于鉴别药物诱导毒性标志物的基于细胞的探询式分析
[0001] 相关申请的交叉参考
[0002] 本申请要求2012年5月22日提交的美国临时申请系列No. 61/650462的优先权, 将其全部内容通过引用在此引入。
[0003] 发明背景
[0004] 制药工业当前表明进入临床研发的潜在化合物有90%的耗损,其中30%是由 于差的临床安全性(Kola等,(2004)NatRevDrugDiscovery:3711-715)。在美国,致 命的不良药物反应(ADR)是死亡的第4至第6大主要原因。可直接归因于ADR的费用 每年可导致美国另外15. 6亿至40亿美元的直接医院成本(LazarouJ等,(1998)JAM; 279 (15) : 1200-1225)。药物发现和研发的成本已经提高至约10亿美元,部分是由于临床研 发后期增加的化合物和NME损耗(AdamsCP,BrantnerVV(2010)"SpendingonNewDrug Development"(新药研发的花费)HealthEcon. 19:130 - 141)。缺乏可以在研发早期帮助 预测药物的毒性的可靠工具是成本增加和投资收益较低的部分原因。此外,药物安全性问 题是制药工业中诉讼和和解增加的主要原因。在2009年1月至2011年5月之间,该行业 在涉及药物安全性问题的诉讼案件上花费了超过80亿美元。
[0005] 为了增强在早期临床试验和药物研发中化合物的"早期停止政策(killearly policy)",FDA目前鼓励药物工业和团体采用非常创新的策略。FDA白皮书Innovation orStagnation:ChallengesandOpportunityontheCriticalPathtoNewMedical Projects(创新或停滞:新医疗产品的关键道路上的挑战与机遇)提到,"含有强大的新的 科学和技术方法(如,基于动物或计算机的预测模型、用于安全性和有效性的生物标志物 和新的临床评价技术)的新产品研发工具包是迫切需要的以用于提高沿着从实验室概念 到商业产品的关键道路的预测性和效率"(FDA,2005)。FDA声明清楚地强调了缺乏可以帮 助在药物研发中作出有效决定的创新技术。
[0006] 心脏毒性是指由治疗性分子引起的对心脏功能的大范围不利影响。心脏毒性可 能在临床前研究中早期出现或随后在临床环境中变得明显。这是药物撤出的主要原因,从 1994年开始占据了全部药物撤出的超过45%,这导致了对药物研发的显著财政负担。心血 管毒性包括提高的QT期、心律不齐、心肌缺血、高血压和血栓栓塞并发症,以及心肌功能障 碍。
[0007]FDA目前使用的心脏安全性生物标志物是QTc延长-电生理 (Iectrophysiological)心律不齐、循环肌I丐蛋白c、心率、血压、脂质、肌I丐蛋白、C-反应性 蛋白(CRP)、脑钠肽或B-型利钠肽(BNP)、离休血小板凝集以及成像生物标志物(心脏磁共 振成像)。QTc延长是非常有力但复杂的标志物。然而,基于单独的QTc难以在药物早期研 发中作出是否停止或继续的决定。此外,QTc是主观性的,并且依赖于可能导致快速性心律 不齐(tachyarrythmia)的基础病理学。
[0008] 鉴于以上所述的,显然本领域需要新的心脏安全性生物标志物,如分子心脏安全 性生物标志物。
[0009] 发明概述
[0010] 本文中所述的平台技术对于鉴别与药物诱导毒性相关的标志物是有用的。这一平 台技术整合了从基于原代人细胞的模型开始到人临床样品的模型层级内的以及跨越这些 层级的分子相互作用。这个方法导致鉴别了反映由作为潜在药物(如,准备进入I期临床试 验的药物候选物)的化合物或NME引起的基础毒性的生物标志物。药物诱导毒性可以包括 心脏、肾、肝和其他组织毒性。本申请提供了几种新的与药物诱导毒性相关的生物标志物, 并且其在用于预测分子或药物候选物的潜在毒性的方法中是有用的,并且作为用于治疗、 预防或抵消药物诱导毒性的潜在治疗靶标。
[0011] 本文所描述的发明至少部分地基于网络生物学、基因组学、蛋白质组学、代谢组 学、转录组学和生物信息学的工具和方法的新型的协同应用,它们在结合时可利用系统生 物学方法而用于研究任何目标生物系统,如获得与药物诱导毒性相关的或作为药物诱导毒 性的原因的分子机理的深入了解。平台技术在国际PCT申请PCT/US2012/027615中有进 一步的描述,将其完整内容在此特意按引用并入本文中。平台技术的其他实施方式,包括 怎样进行涉及酶(例如,激酶)活性数据的整合的平台技术方法的描述,描述于2012年9 月7日提交的美国申请系列No. 13/607,587中,将其完整内容特意按引用并入本文中。在 第一步骤中,研发了细胞建模系统来探测药物诱导毒性,如心脏毒性、肝脏毒性、肾脏毒性 (nephrotoxicity)、神经毒性、肾毒性(renaltoxicity)或肌肉毒性(myotoxicity)。模拟 药物诱导毒性的细胞系统可以包括经受各种相关环境刺激(例如,高血糖、缺氧、免疫应激 和脂质过氧化,或暴露于测试分子或药物候选物)的毒性相关细胞。在一些实施方式中,细 胞建模系统涉及与特定药物诱导毒性相关的各种相互作用细胞类型(如心肌细胞、糖尿病 心肌细胞、肝细胞、肾脏细胞(kidneycell)、神经细胞、肾细胞(renalcell)或成肌细胞) 之间的细胞交互机制。通过使用几个技术的组合,包括例如,切割边界质谱(cuttingedge massspectrometry) (LC/MSMS)、流式细胞术、基于细胞的分析和功能分析,获得来自细胞 模型系统的高通量生物学读数。然后通过体外、体内和计算机建模对高通量生物学读数进 行生物信息学分析来研究叠合数据趋势(congruentdatatrend)。由此产生的矩阵允许 其中开发线性和非线性回归分析以达到确证压力点(conclusivepressurepoint)(或"枢 纽(hub)")的交叉相关数据挖掘。本文所提出的这些"枢纽"都是药物开发的候选者。特 别是,这些枢纽代表潜在的用于降低或缓解药物诱导毒性的药物靶标和/或药物诱导毒性 标志物。
[0012] 差别的分子印记使得能够深入了解规定了导致药物诱导毒性的组织微环境中的 改变的机制。总的来说,上述技术平台与战略性细胞建模的结合赋予了可被用于进一步建 立对引起药物诱导毒性(例如,心脏毒性、肝脏毒性、肾脏毒性、神经毒性、肾毒性或肌肉毒 性)的基础机理和分子驱动者的理解,同时形成允许早期鉴别具有引起药物诱导毒性作用 风险的药物候选物的生物标志物文库,以及可以降低或缓解药物诱导毒性的药物靶标。
[0013] 本发明的平台的显著特征是,基于AI的系统是基于从药物诱导毒性细胞模型系 统获得的数据集而不诉诸或考虑本领域中的任何现有知识,如涉及药物诱导毒性的已知的 生物学关系(即没有数据点是人为的)。因此,从该平台生成的所得统计模型是无偏的。 本发明的平台及其成分(例如,由其获得的细胞模型系统和数据集)的另一个显著的特点 是它允许随着时间在药物诱导毒性细胞模型上继续构建(例如,通过引入新的细胞和/或 条件),以使得从用于药物诱导毒性的细胞模型生成的初始的"第一代"一致因果关系网络 (consensuscausalnetwork)可以与细胞模型自身的演变一起进化至多代因果关系网络 (及由此获得的增量或增量-增量网络)。以这个方式,药物诱导毒性细胞模型、来自药物 诱导毒性细胞模型的数据集及通过使用该平台技术方法从药物诱导毒性细胞模型生成的 因果关系网络可以在从平台技术获得的以前的知识上不断演化和构建。
[0014] 本发明是至少部分基于鉴别新的与药物诱导心脏毒性相关的生物标志物。本发明 进一步至少部分基于辅酶QlO能够降低或防止药物诱导心脏毒性的发现。
[0015] 因此,本发明提供了用于鉴别引起心脏毒性或具有引起心脏毒性风险的试剂的方 法。在一个实施方式中,所述试剂是药物或药物候选物。在一个实施方式中,毒性是药物 诱导毒性,例如,心脏毒性。在一个实施方式中,所述试剂是用于治疗糖尿病、肥胖症、心血 管疾病、癌症、神经失调或炎性疾病的药物或药物候选物。在这些方法中,评价了一对样品 (第一样品不经受药物处理,而第二样品经受药物处理)中的一个或多个生物标志物/蛋白 质的量。与第一样品中的一个或多个生物标志物的表达水平相比的第二样品中的一个或多 个生物标志物的水平、表达水平或活性的调节是药物引起药物诱导毒性或具有引起药物诱 导毒性风险的指示。在一个实施方式中,所述一个或多个生物标志物选自表2中所列的标 志物。可以结合本领域技术人员用于鉴别具有引起药物诱导心脏毒性风险的药物的任何其 他方法来实施本发明的方法。
[0016] 在一个实施方式中,可以用于本发明的方法中的药物包括,但不限于,蒽环类、 5-氟尿嘧啶、顺钼、曲妥珠单抗、吉西他滨、罗西格列酮、吡格列酮、曲格列酮、卡麦角林、培 高利特、舒马曲坦、二膦酸盐和TNF拮抗剂。
[0017] 因此,在一个方面中,本发明提供了用于鉴别引起药物诱导心脏毒性或具有引起 药物诱导心脏毒性风险的药物的方法,所述方法包括:比较(i)用药物处理前获得的第一 细胞样品中存在的一种或多种生物标志物的表达水平与(ii)用药物处理后获得的第二细 胞样品中存在的该一种或多种生物标志物的表达水平;其中所述一种或多种生物标志物选 自表2中所列的标志物;其中与第一样品相比,第二样品中该一种或多种生物标志物的表 达水平的调节是药物引起药物诱导心脏毒性或具有引起药物诱导心脏毒性风险的指示。在 一个实施方式中,细胞是心血管系统的细胞,例如,心肌细胞。在一个实施方式中,细胞是糖 尿病心肌细胞。在一个实施方式中,药物是用于治疗糖尿病、肥胖症、心血管疾病、癌症、神 经失调或炎性疾病的药物或候选药物。在一个实施方式中,药物是蒽环类、5-氟尿嘧啶、顺 钼、曲妥珠单抗、吉西他滨、罗西格列酮、吡格列酮、曲格列酮、卡麦角林、培高利特、舒马曲 坦、二膦酸盐和TNF拮抗剂中的任何一个。
[0018] 在一个实施方式中,与第一样品相比,第二样品中选自表2所列标志物的一个、两 个、三个、四个、五个、六个、七个、八个、九个、十个、11、12、13、14、15、16、17、18、19、20、25、 30、35、40、50、60、70、80、90、100、110、120、130、140、150、160 或更多个生物标志物的表达水 平的调节(例如,提高或降低)是药物引起药物诱导心脏毒性或具有引起药物诱导心脏毒 性风险的指示。
[0019] 在一个实施方式中,与第一样品相比,第二样品中选自HMP1、PTX3、HSP76、FINC、 CYB5、PAIl、IBP7(IGFBP7)、1C17、EDIL3、HMOXl、NUCBl、CS010、HSPA4 的两个、三个、四个、 五个、六个、七个、八个、九个、十个、i^一个、十二个或十三个标志物的组的表达水平的调节 (例如,提高或降低)是药物引起药物诱导心脏毒性或具有引起药物诱导心脏毒性风险的 指示。
[0020] 本发明还提供了用于鉴别可以降低或防止药物诱导心脏毒性的救援剂(rescue agent)的方法。在这些方法中,评价了三个样品(第一样品没有经受药物处理、第二样品经 受药物处理和第三样品经受药物处理和救援剂两者)中的一种或多种生物标志物的量。与 第一样品相比的第三样品中一种或多种生物标志物的标准化表达水平,以及用药物处理的 第二样品中表达的变化,是救援剂可以降低或防止药物诱导心脏毒性的指示。在一个实施 方式中,一种或多种生物标志物选自表2中所列的标志物。
[0021] 使用本文中所述的方法,可以筛选各种分子,特别包括足够小以能够穿过细胞膜 的分子,以鉴别调节(例如,提高或降低)本发明的标志物的表达和/或活性的分子。可以 将由此鉴定的化合物提供给受试者,以用于减轻、缓解或防止受试者的药物诱导毒性。
[0022] 因此,在另一个方面中,本发明提供了用于鉴别可以降低或防止药物诱导心脏毒 性的救援剂的方法,所述方法包括:(i)测定在用心脏毒性诱导药物处理之前获得的第一 细胞样品中存在的一种或多种生物标志物的正常表达水平;(ii)测定用心脏毒性诱导药 物处理后获得的第二细胞样品中存在的该一种或多种生物标志物的处理的表达水平,以鉴 别处理的细胞样品中具有表达变化的一种或多种生物标志物;(iii)测定用心脏毒性诱导 药物和救援剂处理后获得的第三细胞样品中存在的在心脏毒性诱导药物处理的样品中具 有表达水平变化的一种或多种生物标志物的表达水平;和(iv)比较第三样品中测定的一 种或多种生物标志物的表达水平与第一样品中存在的一种或多种生物标志物的表达水平; 其中所述一种或多种生物标志物选自表2中所列的标志物;并且其中与第一样品相比,第 三样品中的一种或多种生物标志物的标准化表达水平是救援剂可以降低或防止药物诱导 心脏毒性的指示。
[0023] 在一个实施方式中,细胞是心血管系统的细胞,例如,心肌细胞。在一个实施方式 中,细胞是糖尿病心肌细胞。在一个实施方式中,药物是用于治疗糖尿病、肥胖症、心血管疾 病、癌症、神经失调或炎性疾病的药物或候选药物。在一个实施方式中,药物是蒽环类、5-氟 尿嘧啶、顺钼、曲妥珠单抗、吉西他滨、罗西格列酮、吡格列酮、曲格列酮、卡麦角林、培高利 特、舒马曲坦、二膦酸盐和TNF拮抗剂中的任何一个。在一个实施方式中,与第一样品相比, 第三样品中一个、两个、三个、四个、五个、六个、七个、八个、九个、10、11、12、13、14、15、16、 17、18、19、20、25、30、35、40、50、60、70、80、90、100、110、120、130、140、150、160 或更多个选 自表2中所列标志物的生物标志物的大致相同的表达水平是救援剂可以降低或防止药物 诱导心脏毒性的指示。
[0024] 在一个实施方式中,与第一样品相比的第三样品中选自HMP1、PTX3、HSP76、FINC、 CYB5、PAI1、IBP7(IGFBP7)、1C17、EDIL3、HM0X1、NUCB1、CS010、HSPA4 的两个、三个、四个、五 个、六个、七个、八个、九个、十个、十一个、十二个或十三个标志物的组的标准化表达水平是 救援剂可以降低或药物诱导心脏毒性的指示。
[0025] 本发明进一步提供了用于缓解、降低或防止需要的受试者中的药物诱导心脏毒性 的方法,包括将通过本文中提供的筛选方法鉴别的试剂施用于受试者(例如,哺乳动物、人 或非人动物),由此降低或防止受试者的药物诱导心脏毒性。在一个实施方式中,将试剂施 用于已经用心脏毒性诱导药物治疗的受试者。在一个实施方式中,在用心脏毒性诱导药物 治疗受试者的同时,将试剂施用于受试者。在一个实施方式中,在用心脏毒性诱导药物治疗 受试者之前,将试剂施用于受试者。
[0026] 本发明进一步提供了用于缓解、降低或防止需要的受试者中药物诱导心脏毒性的 方法,包括将辅酶QlO施用于受试者(例如,哺乳动物、人或非人动物),由此降低或防止 受试者的药物诱导心脏毒性。在一个实施方式中,将辅酶QlO施用于已经用心脏毒性诱导 药物治疗的受试者。在一个实施方式中,在用心脏毒性诱导药物治疗受试者的同时,将辅 酶QlO施用于受试者。在一个实施方式中,在用心脏毒性诱导药物治疗受试者之前,将辅 酶QlO施用于受试者。在一个实施方式中,药物诱导毒性与一个、两个、三个、四个、五个、 六个、七个、八个、九个、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、50、60、70、80、 90、100、110、120、130、140、150、160或更多个选自表2中所列标志物的生物标志物的表达 的调节相关。之前列表中呈现的所有数值也可以是打算作为本发明一部分的范围的上限或 下限,例如,1至5,1至10,2至5,2至10,或5至10个前述的基因(或蛋白质)。
[0027] 在一个实施方式中,药物诱导心脏毒性是心肌病、心力衰竭、心房纤颤、心肌病和 心力衰竭、心力衰竭和LV功能障碍、心房扑动和纤颤,或心脏瓣膜损伤和心力衰竭。
[0028] 本发明进一步提供了可用作药物诱导心脏毒性的预测标志物的生物标志物(例 如,基因和/或蛋白质)。这些生物标志物包括表2中所列的标志物。
[0029] 在一个实施方式中,药物诱导心脏毒性与选自--ΜΡ1、PTX3、HSP76、FINC、CYB5、 PAI1、IBP7(IGFBP7)、1C17、EDIL3、HM0X1、NUCB1、CS010、HSPA4 的两个、三个、四个、五个、六 个、七个、八个、九个、十个、十一个、十二个或十三个标志物的组的调节有关。
[0030] 在一个实施方式中,用于药物诱导心脏毒性的预测标志物是选自TIMP1、PTX3、 HSP76、FINC、CYB5、PAIl、IBP7 (IGFBP7)、1C17、EDIL3、HMOXl、NUCBl、CSO10、HSPA4 的两个、 三个、四个、五个、六个、七个、八个、九个、十个、i^一个、十二个或十三个标志物的组。
[0031] 然而,本领域普通技术人员通过使用本文中所述的方法,例如,通过进行实施例3 中所述的方法但通过使用已知诱导心脏毒性的不同药物,能够鉴别预测药物诱导心脏毒性 的另外的生物标志物。以下进一步描述本发明的示例性药物诱导心脏毒性生物标志物。
[0032] 在一个方面中,本发明涉及用于鉴别药物诱导毒性的调节子的方法,所述方法包 括:(1)使用与药物诱导毒性相关的细胞建立药物诱导毒性模型以代表药物诱导毒性的特 征性方面;(2)从药物诱导毒性模型获得第一数据集,其中第一数据集代表表征与药物诱 导毒性相关的细胞的基因组学、脂质组学、蛋白质组学、代谢组学、转录组学和单核苷酸多 态性(SNP)数据中的一个或多个;(3)从药物诱导毒性模型获得第二数据集,其中第二数据 集代表与药物诱导毒性相关的细胞的功能活性或细胞反应;(4)使用编程的计算设备仅基 于所述第一数据集和第二数据集生成基因组学、脂质组学、蛋白质组学、代谢组学、转录组 学和单核苷酸多态性(SNP)数据中的一个或多个的表达水平与功能活性或细胞反应之间 的一致因果关系网络,其中所述一致因果关系网络的生成不是基于第一数据集和第二数据 集以外的任何已知的生物学关系;(5)从该一致因果关系网络鉴别在药物诱导毒性中独特 的因果关系,其中与该独特的因果关系相关的基因、脂质、蛋白质、代谢物、转录物或SNP被 鉴别为药物诱导毒性的调节子。
[0033] 在某些实施方式中,调节子刺激或促进药物诱导毒性。
[0034] 在某些实施方式中,调节子抑制药物诱导毒性。
[0035] 在某些实施方式中,药物诱导毒性的模型包括与药物诱导毒性相关的细胞的体外 培养物,任选地还包含匹配的对照细胞的体外培养物。
[0036] 在某些实施方式中,细胞的体外培养物经受环境扰动,且匹配的对照细胞的体外 培养物是没有经受环境扰动的相同的细胞。
[0037] 在某些实施方式中,环境扰动包括接触试剂、培养条件的改变、引入的遗传改变/ 突变和引起遗传改变/突变的媒介(例如,载体)中的一个或多个。
[0038] 在某些实施方式中,第一数据集包括多个基因的蛋白质和/或mRNA表达水平。
[0039] 在某些实施方式中,第一数据集进一步包括基因组学、脂质组学、蛋白质组学、代 谢组学、转录组学和单核苷酸多态性(SNP)数据中的两个或多个。在某些实施方式中,第一 数据集进一步包括基因组学、脂质组学、蛋白质组学、代谢组学、转录组学和单核苷酸多态 性(SNP)数据中的三个或多个。
[0040] 在某些实施方式中,代表细胞的功能活性或细胞反应的第二数据集包括生物能量 学、细胞增殖、凋亡、细胞器功能、通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型 实现的基因型-表型相关性、总体酶活性和总体酶活性对于与药物诱导毒性相关的细胞 的酶代谢底物的作用中的一个或多个。在一个实施方式中,总体酶活性是总体激酶活性。 在一个实施方式中,总体酶活性对酶代谢底物的作用是细胞的磷酸化蛋白质组(phospho proteome)〇
[0041] 在某些实施方式中,通过基于人工智能(Al)的信息学平台来进行步骤(4)。
[0042] 在某些实施方式中,基于人工智能(Al)的信息学平台包括REFS(TM)。
[0043] 在某些实施方式中,基于人工智能(Al)的信息学平台接收来自第一数据集和第 二数据集的所有数据输入而没有应用统计截止点。
[0044] 在某些实施方式中,在步骤(5)之前,在步骤(4)中建立的一致因果关系网络基于 输入的数据通过计算机模拟进一步优化为模拟因果关系网络,以对一致因果关系网络中的 一个或多个因果关系提供预测的置信水平。
[0045] 在某些实施方式中,所述独特因果关系被确定为独特地存在于细胞中且不存在于 匹配的对照细胞中的差异因果关系网络的一部分。
[0046] 在一个实施方式中,所确定的独特因果关系是选自下组的至少一对之间的关系: 基因的表达和脂质的水平;基因的表达和转录物的水平;基因的表达和代谢物的水平;第 一基因和第二基因的表达;基因的表达和SNP的存在;基因的表达和功能活性;脂质的水平 和转录物的水平;脂质的水平和代谢物的水平;第一脂质和第二脂质的水平;脂质的水平 和SNP的存在;脂质的水平和功能活性;第一转录物的水平和第二转录物的水平;转录物的 水平和代谢物的水平;转录物的水平和SNP的存在;第一转录物的水平和功能活性;第一代 谢物的水平和第二代谢物的水平;代谢物的水平和SNP的存在;代谢物的水平和功能活性; 第一SNP的存在和第二SNP的存在;及SNP的存在和功能活性。
[0047] 在一个实施方式中,所述功能活性选自生物能量学、细胞增殖、凋亡、细胞器功能、 激酶活性、蛋白酶活性及通过选自ATP、R0S、0XPH0S和Seahorse分析的功能模型实现的基 因型-表型相关性。在某些实施方式中,该方法进一步包括在药物诱导毒性模型中确认确 定的独特因果关系。
[0048] 在一个实施方式中,所述药物诱导毒性是药物诱导心脏毒性、肝脏毒性、肾脏毒 性、神经毒性、肾毒性和肌肉毒性。
[0049] 在一个实施方式中,所述药物诱导毒性是心肌病、心力衰竭、心房纤颤、心肌病和 心力衰竭、心力衰竭和LV功能障碍、心房扑动和纤颤,或心脏瓣膜损伤和心力衰竭。
[0050] 在一个实施方式中,药物诱导毒性模型包括心肌细胞、糖尿病心肌细胞、肝细胞、 肾脏细胞、神经细胞、肾细胞或成肌细胞。
[0051] 在一个实施方式中,药物诱导毒性模型包括毒性诱导药物、癌症药物、糖尿病药 物、神经药物或抗炎药。在一个实施方式中,所述药物是蒽环类、5-氟尿嘧啶、顺钼、曲妥珠 单抗、吉西他滨、罗西格列酮、吡格列酮、曲格列酮、卡麦角林、培高利特、舒马曲坦、二膦酸 盐或TNF拮抗剂。
[0052] 在一个方面中,本发明提供了用于鉴别引起药物诱导毒性或具有引起药物诱导毒 性风险的药物的方法,所述方法包括:比较(i)用药物处理前获得的第一细胞样品中存在 的一种或多种生物标志物的水平与(ii)用药物处理后获得的第二细胞样品中存在的该一 种或多种生物标志物的水平;其中一种或多种生物标志物选自通过以上所述的方法鉴别的 调节子;其中与第一样品相比,第二样品中的一种或多种生物标志物的水平的调节是药物 引起药物诱导毒性或具有引起药物诱导毒性风险的指示。
[0053] 在一个方面中,本发明提供了用于鉴别可以降低或防止药物诱导毒性的救援剂的 方法,所述方法包括:(i)测定用毒性诱导药物处理之前获得的第一细胞样品中存在的一 种或多种生物标志物的正常水平;(ii)测定用毒性诱导药物处理后获得的第二细胞样品 中存在的该一种或多种生物标志物的处理的水平,以鉴别在处理的细胞样品中具有水平变 化的一种或多种生物标志物;(iii)测定用毒性诱导药物和救援剂处理后获得的第三细胞 样品中存在的毒性诱导药物处理样品中具有水平变化的一种或多种生物标志物的水平;和 (iv)比较第三样品中测定的一种或多种生物标志物的水平与第一样品中存在的一种或多 种生物标志物的水平;其中一种或多种生物标志物选自通过以上所述的方法鉴别的调节 子,并且其中与第一样品相比,第三样品中一种或多种生物标志物的标准化水平是救援剂 可以降低或防止药物诱导毒性的指示。
[0054] 在另一个方面中,本发明涉及用于缓解、降低或防止药物诱导毒性的方法,所述方 法包括将通过以上所述的方法鉴别的救援剂施用于受试者,由此降低或防止受试者中的药 物诱导毒性。
[0055] 在另一个方面中,本发明涉及提供用于平台方法中的药物诱导毒性模型的方法, 所述方法包括:使用与药物诱导毒性相关的细胞建立药物诱导毒性模型以代表药物诱导毒 性的特征性方面,其中药物诱导毒性模型对于生成用于平台方法中的数据集是有用的;由 此提供用于平台方法中的药物诱导毒性模型。
[0056] 在一个实施方式中,药物诱导毒性模型包括心肌细胞、糖尿病心肌细胞、肝细胞、 肾脏细胞、神经细胞、肾细胞或成肌细胞。
[0057] 在另一个方面中,本发明涉及从用于平台方法中的药物诱导毒性模型获得第一数 据集和第二数据集的方法,所述方法包括:(1)从用于平台方法中的药物诱导毒性模型获 得第一数据集,其中药物诱导毒性模型包括与药物诱导毒性相关的细胞,并且其中第一数 据集代表与药物诱导毒性相关的细胞中多个基因的表达水平;(2)从用于平台方法中的药 物诱导毒性模型获得第二数据集,其中第二数据集代表与药物诱导毒性相关的细胞的功能 活性或细胞反应;由此从用于平台方法中的药物诱导毒性模型获得第一数据集和第二数据 集。
[0058] 在另一个方面中,本发明涉及用于鉴别药物诱导毒性的调节子的方法,所述方法 包括:(1)使用编程的计算设备在获自药物诱导毒性模型的第一数据集和第二数据集中生 成一致因果关系网络,其中所述模型包括与药物诱导毒性相关的细胞,并且其中第一数据 集代表细胞中多个基因的表达水平和第二数据集代表细胞的功能活性和细胞反应,其中所 述一致因果关系网络的生成不是基于第一数据集和第二数据集以外的任何已知的生物学 关系;(2)从该一致因果关系网络鉴别在药物诱导毒性中独特的因果关系,其中与该独特 的因果关系相关的基因被确定为药物诱导毒性的调节子;由此鉴别药物诱导毒性的调节 子。
[0059] 在另一个方面中,本发明涉及用于鉴别药物诱导毒性的调节子的方法,所述方法 包括:1)提供从药物诱导毒性模型生成的一致因果关系网络;2)从所述一致因果关系网络 鉴别药物诱导毒性中独特的因果关系,其中与独特的因果关系相关的基因被确定为药物诱 导毒性的调节子;由此鉴别药物诱导毒性的调节子。
[0060] 在各个方法的某些实施方式中,一致因果关系网络使用编程的计算设备在获自药 物诱导毒性模型的第一数据集和第二数据集中生成,其中所述模型包括与药物诱导毒性相 关的细胞,并且其中第一数据集代表细胞中多个基因的表达水平和第二数据集代表细胞的 功能活性或细胞反应,其中所述一致因果关系网络的生成不是基于第一数据集和第二数据 集以外的任何已知的生物学关系。
[0061] 在某些实施方式中,"环境扰动",本文也称为"外部刺激成分",是治疗剂。在某些 实施方式中,外部刺激成分是小分子(例如,不超过5kDa、4kDa、3kDa、2kDa、lkDa、500道尔 顿或250道尔顿的小分子)。在某些实施方式中,外部刺激成分是生物剂。在某些实施方式 中,外部刺激成分是化学剂。在某些实施方式中,外部刺激成分对于细胞是内源性的或外源 性的。在某些实施方式中,外部刺激成分是MM或表观代谢转变剂(印ishifter)。在某些 实施方式中,外部刺激成分是细胞系统的应激因素,如缺氧、高血糖症、高脂血症、高胰岛素 血症和/或富乳酸状态。
[0062] 在某些实施方式中,外部刺激成分可包括用于治疗药物诱导毒性的治疗剂或候选 治疗剂,包括化疗剂、蛋白质基的生物药物、抗体、融合蛋白质、小分子药物、脂质、多糖、核 酸等等。
[0063] 在某些实施方式中,外部刺激成分可以是一个或多个应激因素,如那些通常在各 种药物诱导毒性下在体内遇到的,包括缺氧、高血糖状态、酸性环境(可通过乳酸处理模 拟)等。
[0064] 在其它实施方式中,外部刺激成分可以包括一个或多个MM和/或表观代谢转变 齐U,如本文下面所定义的。示例性的MIM包括辅酶QlO(本文也称为CoQlO)和维生素B族 中的化合物,或者包含维生素B族中的化合物的核苷、单核苷酸或二核苷酸。
[0065] 在进行细胞输出测量(如蛋白质表达)中,可以使用绝对量(例如,表达量)或相 对水平(例如,相对表达水平)。在一个实施方式中,使用绝对量(例如,表达量)。在一个 实施方式中,使用相对水平或量(例如,相对表达水平)。例如,为了确定细胞系统的蛋白质 的相对表达水平,可以将细胞系统中(对细胞系统有或没有外部刺激)任何给定的蛋白质 的量与合适的对照细胞系或细胞系的混合物(如在同一实验中使用的所有细胞)相比较, 并给出倍数增加或倍数减少值。本领域技术人员将会理解,可以在任何细胞输出测量(如 基因和/或RNA的转录水平、脂质水平、代谢物的水平或者任何功能输出,例如,如本文所述 的细胞凋亡水平、毒性水平、酶(例如,激酶)活性水平或ECAR或OCR)中使用绝对量或相对 量。预先确定的倍数增加(例如,至少I. 2、1. 3、1. 4、1. 5、1. 6、1. 7、1. 8、1. 9、2、2. 5、3、3. 5、 4、4· 5、5、6、7、8、9、10、15、20、25、30、35、40、45、50、75 或 100 或者更多倍的增加)或倍数减 少(例如,至少减少至 〇· 9、0· 8、0· 75、0· 7、0· 6、0· 5、0· 45、0· 4、0· 35、0· 3、0· 25、0· 2、0· 15、 0· 1 或 0.05 倍、或者减少到 90%、80%、75%、70%、65%、60%、55%、50%、45%、40%、 35%、30%、25%、20%、15%、10%或5%或更少)的阈值水平可以被用于选择显著差异,和 然后该显著差异的细胞输出数据可包括在用于本发明的平台技术方法中的数据集(例如, 第一和第二数据集)中。存在于前述列表中的所有的值也可以是范围的上限或下限,例如, 在1. 5至5倍、5至10倍、2至5倍之间、或0. 9至0. 7、0. 9至0. 5、0. 7至0. 3倍之间的范 围意图为本发明的部分。
[0066] 在整个本申请中,显示在列表中的所有值,例如,如上述的那些,也可以是确定为 本发明中的一部分的范围的上限或下限。
[0067]在本发明的方法的一个实施方式中,不是因果关系网络中观察到的每一个因果关 系都有生物学意义。对于所述探询生物评价被应用的任何给定的药物诱导毒性,一些(或 者也许全部)的因果关系(以及与其相关的基因)相对于特定的所讨论的生物问题是"确 定性的",例如导致引起药物诱导毒性(治疗性干预的潜在靶标)或药物诱导毒性的生物标 志物(潜在的诊断或预后的因素)。在一个实施方式中,观察的在药物诱导毒性中独特的因 果关系对于所讨论的特定生物问题是确定性的。在一个实施方式中,并非每一个在药物诱 导毒性中观察到的独特的因果关系对于所讨论的特定生物问题是确定性的。
[0068] 可以由所述方法的最终用户来选择这样的确定性的因果关系,或者可以由生物信 息学软件程序来选择,如REFS、DAVID实现的比较途径分析程序或者KEGG途径分析程序。 在某些实施方式中,使用一个以上的生物信息学软件程序,和来自两个或更多生物信息学 软件程序的一致结果是优选的。
[0069] 如本文所用的细胞输出的"差异"包括任何一个或多个细胞输出参数中的差异 (例如,增加或减少的水平)。在某些实施方式中,差异各自独立地选自mRNA转录、蛋白质 表达、脂质表达、蛋白质活性、激酶活性、代谢物/中间体水平和/或配体-靶相互作用中的 差别。例如,就蛋白质表达水平而言,可以通过使用本领域公认的技术,如以质谱分析为基 础的检测(例如,iTRAQ、2D-LC-MSMS等)测量和定量两个细胞输出之间的差异,例如在外 部刺激成分处理之前和之后与细胞系统相关的输出。
[0070]在一个方面,药物诱导毒性的细胞模型包含细胞交互系统,其中具有含外部刺激 成分的第一细胞环境的第一细胞系统产生第一改变的细胞环境,以使得通过将具有第二细 胞环境的第二细胞系统暴露于第一改变的细胞环境而建立交互细胞系统。
[0071]在一个实施方式中,产生至少一个与交互细胞系统的显著细胞交互差异,和鉴别 至少一个确定性的细胞交互差异以使得进行探询式生物学评估。在某些实施方式中,所述 至少一个显著的细胞交互差异是多个差异。
[0072]在某些实施方式中,所述至少一个确定性的细胞交互差异是由最终用户选择的。 或者,在另一个实施方式中,所述至少一个确定性的细胞交互差异是基于定量蛋白质组学 数据通过生物信息学软件程序(如,例如,REFS、KEGG途径分析或DAVID实现的比较途径分 析)而选择的。
[0073] 在某些实施方式中,所述方法进一步包括产生用于第一细胞系统的显著细胞输出 差异。
[0074] 在某些实施方式中,差异各自独立地选自mRNA转录、蛋白质表达、脂质表达、蛋白 质活性、代谢物/中间体水平和/或配体-靶相互作用的差异。
[0075] 在某些实施方式中,所述第一细胞系统和第二细胞系统独立地选自原代细胞的同 质群体、药物诱导毒性相关的细胞系或正常细胞系。
[0076] 在某些实施方式中,第一改变的细胞环境包含由第一细胞系统分泌到第一细胞环 境中的因子,其作为第一细胞系统与外部刺激成分接触的结果。该因子可以包含分泌的蛋 白质或其他的信号分子。在某些实施方式中,该第一改变的细胞环境基本上没有原来的外 部刺激成分。
[0077] 在某些实施方式中,交互细胞系统包含具有插入隔室和由膜分隔的杯状隔室的侵 袭实验装置(transwell)。例如,第一细胞系统可在插入隔室(或杯状隔室)中生长,和所 述第二细胞系统可在杯状隔室(或插入隔室)中生长。
[0078] 在某些实施方式中,交互细胞系统包含用于第一细胞系统生长的第一培养物和用 于第二细胞系统生长的第二培养物。在这个情况下,第一改变的细胞环境可以是来自第一 细胞系统的条件培养基。
[0079] 在某些实施方式中,所述第一细胞环境和第二细胞环境可以相同。在某些实施方 式中,所述第一细胞环境和第二细胞环境可以不同。
[0080] 在某些实施方式中,交互细胞系统包含所述第一细胞系统和第二细胞系统的共培 养。
[0081] 本发明的方法可用于或应用于多个"探询式生物学评估"。本发明的方法应用于探 询式生物学评估以使其能够鉴别药物诱导毒性的一个或多个调节子或者药物诱导毒性的 确定性的细胞过程"驱动子"。
[0082] 在一个实施方式中,探询式生物学评估是试剂(例如药物)对于细胞、组织、器官 或有机体的毒理学特性的评估,其中所鉴别的药物诱导毒性调节子,例如,确定性的细胞过 程驱动子(例如,细胞交互差异或者药物诱导毒性中独特的因果关系)可以是毒性(例如, 细胞毒性、心脏毒性、肝脏毒性、肾脏毒性、神经毒性、肾毒性或肌肉毒性)的指示剂,且因 而可以用来预测或确定试剂的毒理学特性。在一个实施方式中,鉴别的药物诱导毒性调节 子,例如,确定性的细胞过程驱动子(例如,细胞交互差异或者药物诱导毒性中独特的因果 关系)是药物或药物候选物的心脏毒性的指示剂,并可随之用来预测或确定药物或药物候 选物的心脏毒性特性。
[0083] 在另一个方面,本发明提供了一个试剂盒,其用于使用发现平台技术进行探询式 生物学评估,其包含用于检测作为由本发明的方法生成的因果关系网络的主题的分析物是 否存在和/或用于定量其量的一个或多个试剂。在一个实施方式中,所述分析物是药物诱 导毒性中独特的因果关系的对象,例如,与药物诱导毒性中独特的因果关系相关的基因。在 某些实施方式中,分析物是蛋白质,且该试剂包含针对该蛋白质的抗体、该蛋白质的标记物 和/或一个或多个制备用于高通量分析(例如,基于质谱的测序)的该蛋白质的试剂。
[0084] 应当理解的是,本文所描述的所有实施方式,包括仅在实施例中描述的那些,是本 发明的一般描述的部分,并可以结合本发明的任何其它实施方式,除非明确排除或不适用。[0085] 附图简要说明
[0086] 本公开的各个实施方式将在本文下面根据附图进行描述,其中:
[0087]图1 :用于鉴别治疗剂的方法的图解。
[0088] 图2:癌症系统生物学和整合的多生理相互作用输出调节的结果的图解。
[0089] 图3:使用MMS的生物相关性系统探询的图解。
[0090]图4:建模癌症网络以使得能够进行探询式生物学查询的图解。
[0091] 图5:探询式生物学平台技术的图解。
[0092] 图6 :平台技术中使用的技术的图解。
[0093] 图7 :平台的成分(包括数据采集、数据整合和数据挖掘)的示意图。
[0094] 图8:使用MMS的系统性探询和从"组学"级联收集响应数据的示意图。
[0095] 图9 :建立表示正常和糖尿病状态的体外模型使用的成分的略图。
[0096]图10 :用来生成蛋白质的因果网络(因为它们涉及疾病病理生理学)的信息学平 台REFS?的示意图。
[0097] 图11:导致生成糖尿病状态对于正常状态以及通过用MMS治疗恢复到正常状态 的糖尿病节点的差异网络的途径的示意图。
[0098] 图12 :糖尿病状态与正常状态的代表性差异网络。
[0099] 图13:节点和感兴趣的相关边界(中心的Nodel)的示意图。表示出与每个边界 有关的细胞功能性。
[0100] 图14:根据一些实施方式,示例性方法的高水平流程图。
[0101] 图15A-15D:可以用于示例性实施方式的基于AI的信息学系统的成分和过程的高 水平不意图。
[0102] 图16 :可以用于示例性实施方式的基于AI的信息学系统中的方法的流程图。
[0103]图17 :示意性地描绘了适合于实施本文所教导的示例性实施方式的示例性计算 环境。
[0104] 图18:实施例1中描述的案例研究设计的图示。
[0105] 图19 :表示用于研究糖尿病心肌细胞中药物诱导毒性的实验设计和建模参数的 示意图。
[0106] 图20:药物治疗(T)导致的糖尿病心肌细胞中人线粒体能量代谢基因的转录网络 和表达的失调:救援分子(R)使基因表达正常化。
[0107] 图21 :A.药物治疗(T)诱导来自高血糖症中条件化的心肌细胞的线粒体中GPATl 和TAZ的表达。与救援分子结合(T+R),GPATl和TAZ水平正常化。B.从G3P合成TAG。
[0108] 图22 :A.药物治疗(T)降低高血糖症条件化的心肌细胞中的线粒体OCR(耗氧 率)。救援分子(T+R)使OCR正常化。B.药物治疗(T)抑制高血糖症中条件化的心肌细胞 中线粒体ATP的合成。
[0109] 图23:通过药物治疗下调蛋白质的GO注释。用药物治疗下调参与线粒体能量代 谢的蛋白质。
[0110]图24:导致生成Λ网络的数学方法的图解。比较来自T与UT的独特边界,这两 个模型均处于糖尿病环境中。
[0111] 图25:代表驱动药物诱导毒性的病理生理学的潜在蛋白质中枢和网络的示意图。
[0112] 图26 :探询式生物学平台的示意图。
[0113] 图27:细胞功能模型、数据整合和数学模型构建的说明。
[0114] 图28:驱动药物诱导毒性的病理生理学的因果分子相互作用网络。
[0115] 图29:作为驱动药物诱导毒性的病理生理学的中心枢纽的PTX3的因果分子相互 作用子网络。
[0116] 图30:正常葡萄糖和高葡萄糖条件中心肌细胞的线粒体ATP合成能力。
[0117] 图31 :ATP驱动子的因果分子相互作用网络。
[0118] 图32:以P4HB作为中心枢纽的ATP驱动子的因果分子相互作用网络。
[0119] 图33:以P4HB作为中心枢纽的ATP驱动子的因果分子相互作用子网络的独特边 缘。
[0120] 图34 :功能性毒理组学(toxicomics)的说明:多-组学(omics)整合。
[0121] 如附录A中,在此所附的是本文中涉及的所有生物标志物的序列。与附录A中和 整个本申请中列出的GeneBank登录号相关的所有信息以本申请提交日可获得的形式按引 用并入本文中。
[0122] 发明详述
[0123] I、概沭
[0124] 本发明的示例性实施方式中结合了可以使用探询式生物学平台("该平台")实施 的方法,该平台是用于理解各种各样的药物诱导毒性(如心脏毒性、肝脏毒性、肾脏毒性、 神经毒性、肾毒性或肌肉毒性)和作为这类药物诱导毒性基础的关键分子驱动子(包括使 药物诱导毒性得以发生的因子)的工具。一些示例性实施方式包括可以结合该平台的至少 一部分或全部的系统。一些示例性方法可以采用该平台的至少一部分或全部。涉及该平台 的一些示例性实施方式的目标和目的出于说明性的目的一般地概述如下:
[0125]i)建立作为药物诱导毒性的关键成分的驱动子的特定分子印记,因为它们与相关 细胞、组织和/或器官的总体病理学生理学相关;
[0126]ii)生成与药物诱导毒性相关的分子印记或差异图谱,这可有助于鉴别区分一个 生物学状态(例如,药物诱导毒性状态)与不同生物学阶段(例如,正常状态)的差异分子 印记,和发展对于印记或分子实体的理解,因为它们裁断两个生物学状态之间的变化(例 如,从正常到药物诱导毒性状态)的机制;和
[0127] iii)研究分子活性的"枢纽"作为用于药物诱导毒性的外部控制的潜在干预靶标 (例如,使用该中枢作为潜在的治疗靶标)或作为所讨论的药物诱导毒性的潜在生物标志 物(例如,药物诱导毒性特异性标志物,用于预后和/或治疗诊断用途中)的作用。
[0128] 涉及药物诱导毒性平台的一些示例性的方法可以包括一个或多个以下特征:
[0129] 1)在一个或多个模型中,优选在体外模型中,使用与药物诱导毒性相关的细胞对 药物诱导毒性(例如,心脏毒性、肝脏毒性、肾脏毒性、神经毒性、肾毒性或肌肉毒性)和/ 或药物诱导毒性的成分(例如,与毒性相关的生理学&病理生理学)建模。例如,细胞可以 是人类来源的细胞,其正常地参与所讨论的药物诱导毒性。该模型可包括对于药物诱导毒 性特异性的各个细胞提示/状态/扰动。在理想的情况下,该模型代表各个药物诱导毒性 状态和通量成分而不是药物诱导毒性状况的静态评估。
[0130] 2)使用领域公认的任何手段确定mRNA和/或蛋白质印记的特征。例如,定量聚合 酶链反应(qPCR)&蛋白质组学分析工具如质谱(MS)。这个mRNA和蛋白质数据集代表对环 境/扰动的生物学反应。在适用和可能的情况下,脂质组学、代谢组学和转录组学数据也可 被整合作为用于所讨论的药物诱导毒性的补充或替代测量值。SNP分析是在该过程中有时 可以使用的另一成分。它可以有助于研究,例如,SNP或特定突变是否对药物诱导毒性有任 何影响。这些变量可以用于描述药物诱导毒性,无论是作为静态的"瞬象"或作为动态过程 的表现。
[0131] 3)测定对提示和扰动的一个或多个功能活性或细胞反应,包括但不限于生物能量 学、细胞增殖、细胞凋亡和细胞器功能。真正的基因型-表型相关性是通过采用功能模型 (如ATP、R0S、0XPH0S、Seahorse分析等等)实现的。这样的功能活性可以涉及细胞中的总 体酶活性,如激酶活性,和/或总体酶活性或酶代谢物或底物(例如,细胞的磷酸化蛋白质 组(phosphorproteome))的作用。这样的细胞反应代表药物诱导毒性过程(或其模型) 中对相应的mRNA/蛋白质表达的药物诱导毒性状态以及上面2)中的任何其他相关状态做 出响应的细胞反应。
[0132] 4)通过采用基于人工智能(基于Al)的信息学系统或平台,整合在3)中获得的功 能分析数据和在2)中获得的蛋白质组学和其它数据,并确定由因果关系驱动的蛋白质、基 因、脂质、酶活性和其他功能活性相关性。这样的基于AI的系统是基于,优选仅基于,2)和 /或3)中得到的数据集,而不采用关于药物诱导毒性过程的现有知识。优选地,没有数据点 被统计地或人为地切除。相反,所有得到的数据被送入AI系统中用于确定蛋白质、基因、月旨 质、酶活性和其他功能活性相关性。整合过程的一个目标或输出是不同生物学状态(例如, 药物诱导毒性对正常状态)之间的一个或多个差异网络(另外在本文中可称为" △网络", 或者在某些情况下视情况而称为"Λ-Λ网络")。
[0133] 5)确定基于AI的信息学平台的输出的特征以考察各活性中枢作为潜在治疗靶标 和/或生物标志物。这样的谱分析可以基于所获得的数据集完全在计算机中进行而无需采 用任何实际的湿式实验室试验(wet-labexperiment)。
[0134] 6)通过采用分子和细胞技术验证活性中枢。这个用基于细胞的湿式实验室实验对 输出进行的信息后验证(post-informaticvalidation)可以是任选的,但它们有助于建立 全循环的探询。
[0135] 以上概述的任何或所有途径可以用在涉及任何药物诱导毒性的任何特定应用中, 其取决于(至少部分地取决于)具体应用的性质。也就是说,上文所述的一个或多个途径 可以被省略或修改,并且可以采用一个或多个另外的途径,其取决于具体的应用。
[0136] 提供了说明该平台的各个图表。特别是,在图1中描述了使用该平台鉴别治疗剂 的示例性途径的图解。图2中描述了癌症的系统生物学和综合的多生理交互式输出调节的 结果的图解。图3中描述了使用MMS的生物相关性系统探询的图解。图4中描述了建模 癌症网络以实现探询式生物查询的图解。
[0137] 图5和6中描述了探询式生物学平台和平台中所使用的技术的图解。图7中描述 了包括数据采集、数据整合和数据挖掘的平台成分的示意图。图8中描述了使用MMS的系 统探询和来自"组学"级联的响应数据收集的示意图。
[0138] 图14是示例性方法10的高水平流程图,其中显示了可以被用来执行该示例性方 法的示例性系统的成分。首先,使用通常与生物学过程相关联的细胞建立生物学过程(例 如,药物诱导毒性过程)和/或生物学过程的成分(例如,药物诱导毒性生理学和病理生理 学)的模型(例如,体外模型)(步骤12)。例如,细胞可以是通常参与生物学过程(例如, 药物诱导毒性)的人来源的细胞。细胞模型可包括该生物学过程(例如,药物诱导毒性) 特定的各个细胞提示、状态和/或扰动。在理想的情况下,细胞模型表示各个(药物诱导毒 性)状态和生物学过程(例如,药物诱导毒性)的通量成分而不是生物学过程的静态评估。 对比细胞模型可包括对照细胞或正常细胞(例如,没有暴露于诱导毒性的药物的细胞)。细 胞模型的附加说明出现在下面的III.A和IV部分中。
[0139] 第一数据集是使用任何已知的方法或系统(例如,定量的聚合酶链反应(qPCR)& 蛋白质组学分析工具,如质谱(MS))从生物学过程(例如,细胞诱导毒性)的细胞模型获 得,其包括表示例如多个基因(例如,mRNA和/或蛋白质印记)的表达水平的信息(步骤 16)。
[0140] 第三数据集从生物学过程(例如,药物诱导毒性)的对比细胞模型获得(步骤 18)。第三数据集包括代表例如来自对比细胞模型的对比细胞中多个基因的表达水平的信 肩、。
[0141] 在本发明方法的某些实施方式中,这些第一和第三数据集在本文中统称为"第一 数据集",其表示例如与生物系统(例如,药物诱导毒性模型)相关的细胞(包括对比细胞 的所有细胞)中多个基因的表达水平。
[0142] 可以从一个或多个mRNA和/或蛋白质印记分析系统得到第一数据集和第三数据 集。第一和第三数据集中的mRNA和蛋白质数据可以代表对环境和/或扰动的生物反应。在 适用和可能的情况下,脂质组学、代谢组学和转录组学数据也可以被整合至第一数据集中 作为生物学过程(例如,药物诱导毒性)的补充或替代测量。SNP分析是可以有时使用在 该方法中的另一成分。它可以有助于调查,例如,单核苷酸多态性(SNP)或特定的突变对生 物学过程(例如,药物诱导毒性)是否有任何影响。数据变量可以被用于描述生物学过程 (例如,药物诱导毒性),无论是作为静态的"瞬象",还是作为动态过程的表示。有关获取表 示细胞中多个基因的表达水平的其他描述见以下的III.B部分。
[0143] 第二数据集从生物学过程(例如,药物诱导毒性)的细胞模型获得,其包括表示细 胞的功能活性或反应的信息(步骤20)。类似地,第四数据集从生物学过程(例如,药物诱 导毒性)的对比细胞模型获得,其包括表示对比细胞的功能活性或反应的信息(步骤22)。
[0144] 在本发明方法的某些实施方式中,这些第二和第四数据集在本文中统称为"第二 数据集",其表示与生物系统(例如,药物诱导毒性)相关的细胞(包括对比细胞的所有细 胞)的功能活性或细胞反应。
[0145] 可以使用一个或多个功能分析系统以获得有关细胞或对比细胞的功能活性或反 应的信息。关于对提示和扰动的功能性细胞反应的信息可包括,但不限于,生物能量学谱、 细胞增殖、细胞凋亡和细胞器功能。过程和途径的功能模型(例如,三磷酸腺苷(ATP)、活性 氧物质(ROS)、氧化磷酸化(OXPHOS)、Seah〇rse分析等)可以被用来获得真正的基因型-表 型相关性。这样的功能活性可以涉及细胞中的总体酶活性,如激酶活性,和/或总体酶活性 或酶代谢物或底物(例如,细胞的磷酸化蛋白质组(phosphorproteome))的作用。功能活 性或细胞反应表示在生物学过程(或其模型)中的细胞响应于mRNA/蛋白质表达的相应状 态以及任何其他相关应用的状态或扰动的反应。在下面III.B部分中提供有关获得表示细 胞的功能活性或反应的信息的附加信息。
[0146] 该方法还包括在细胞和对照细胞中生成生物学过程(例如,细胞诱导毒性)的计 算机执行的模型。例如,可对于细胞模型从第一数据集和第二数据集生成在所述多个基因 的表达水平与所述功能活性或细胞反应之间的一个或多个(例如,一整套)因果关系的贝 叶斯网络("生成的细胞模型网络(步骤24)。生成的细胞模型网络(单独或共同地)包 括关于关系的定量概率定向信息。所生成的细胞模型网络不是基于来自第一数据集和第二 数据集的信息以外的基因表达和/或功能活性或细胞反应之间的已知生物学关系。一个或 多个生成的细胞模型网络可统称为一致细胞模型网络。
[0147] 可对于对比细胞模型从第一数据集和第二数据集生成在多个基因的表达水平与 功能活性或细胞反应之间的一个或多个(例如,一整套)因果关系的贝叶斯网络("生成的 对比细胞模型网络(步骤26)。生成的对比细胞模型网络(单独地或共同地)包括关于 关系的定量概率定向信息。所生成的细胞网络不是基于第一数据集和第二数据集中的信息 以外的基因表达和/或功能活性或细胞反应之间的已知生物学关系。一个或多个生成的对 比模型网络可统称为一致细胞模型网络。
[0148] 可以使用基于人工智能(基于Al)的信息学平台建立所述生成的细胞模型网络和 生成的对比细胞模型网络。关于建立生成的细胞模型网络、建立生成的对比细胞模型网络 和基于AI的信息学系统的进一步细节出现在下面III.C部分和图2A-3的描述中。
[0149] 应当指出的是,可以采用许多不同的基于AI的平台或系统来生成包括定量概率 定向信息的因果关系的贝叶斯网络。虽然本文所描述的某些实施例采用一个特定的可商 业获得的系统,即,来自GNS(剑桥,MA)的REFS?(逆向工程/正向模拟),但对于实施方式 并没有限制。适合实施一些实施方式的基于AI的系统或平台采用数学算法以在输入变量 (例如,第一和第二数据集)之间建立因果关系,其仅仅基于输入的数据而没有考虑到之前 存在的关于任何潜在的、已建立的和/或验证的生物学关系的知识。
[0150] 例如,基于AI的REFS?信息学平台利用实验得到的粗的(原始的)或最少加工的 输入生物学数据(如遗传、基因组学、外遗传、蛋白质组学、代谢组学和临床数据),并迅速 执行万亿次计算以确定在完整系统中分子如何相互作用。基于AI的REFS?信息学平台执 行逆向工程过程,其旨在基于定量表示基础生物系统(例如,药物诱导毒性)的输入数据建 立计算机实施的细胞模型(例如,生成的细胞模型网络)。另外,为获得预测,可以在计算机 执行的细胞模型的基础上开发和快速模拟关于基础生物系统的假设,伴有关于假设的相关 的置信水平。
[0151] 通过这个方式,由定量的计算机实施的细胞模型表示生物系统,其中模拟"干扰" 来了解生物系统(例如,药物诱导毒性)的详细机制、有效的干预策略和/或确定哪些受试 者会对给定的治疗方案做出反应的临床生物标志物。传统的生物信息学和统计学方法,以 及基于已知生物学的建模的方法,通常不能提供这些类型的见解。
[0152] 建立了生成的细胞模型网络和生成的对比细胞模型网络后,对它们进行比较。鉴 别至少存在于一些所生成的细胞模型网络中且在生成的对比细胞模型网络中不存在或具 有至少一个显著不同的参数的一个或多个因果关系(步骤28)。这样的对比可以导致建立 差异网络。可以使用差异网络建立模块进行对比、鉴别和/或差异(Λ)网络建立,其在下 面的III.D部分和针对图18的说明进一步详细描述。
[0153] 在一些实施方式中,输入数据集是来自一个细胞类型和一个对比细胞类型,其基 于该一个细胞类型建立一套细胞模型网络和基于该一个对比对照细胞类型建立另一套对 比细胞模型网络。可以在该一个细胞类型的该整套网络和对比细胞类型的该整套网络之间 进行差分。
[0154] 在其它实施方式中,输入数据集是来自多个细胞类型(例如,两个或更多个通常 与特定类型的药物诱导毒性相关的细胞类型)和多个对比细胞类型(例如,两个或更多个 正常的细胞类型,例如,没有暴露于药物的相同细胞)。可以分别对于每个细胞类型和每个 对比细胞类型单独地生成一整套细胞模型网络,和/或来自多个细胞类型和多个对比细胞 类型的数据可以组合成各自的复合数据集。复合数据集生成与多个细胞类型(复合数据) 对应的一整套网络,和生成与多个对比细胞类型(对比复合数据)对应的另一整套网络。可 以对用于复合数据的该整套网络对比于用于对比复合数据的该整套网络执行差分。
[0155] 在一些实施方式中,可以在两个不同的差异网络之间执行差分。该输出可被称为 Λ-Λ网络,并且在下面针对图18进行描述。
[0156] 可以为生成的细胞模型网络中的每个关系确定定量关系信息(步骤30)。类似地, 可以确定生成的对比细胞模型网络中每个关系的定量关系信息(步骤32)。有关该关系的 定量信息可以包括表示因果关系的指令、有关该关系的统计不确定性的量度(例如,曲线 下面积(AUC)的统计测量)和/或该关系的强度的定量幅度(例如,一倍)的表示。可以 使用定量关系信息确定生成的细胞模型网络中的各个关系的特性,来探索网络中作为潜在 治疗靶标和/或生物标志物的每个活性中枢。这样的分析可以完全在计算机中基于来自生 成的细胞模型网络的结果进行而没有采用任何实际的湿式实验室实验。
[0157] 在一些实施方式中,可以通过采用分子和细胞技术对网络中活性的中枢进行验 证。这个用湿式实验室的基于细胞的实验对输出的信息后验证不需要执行,但它可以帮助 建立探询的完整循环。图15示意性地描绘了示例性的基于AI的信息学系统(例如,基于 AI的REFS?信息学系统)的功能性和基于AI的系统与探询式生物学平台("平台")的其 他成分或部分之间相互作用的简化高水平图示。在图15Α中,从生物学过程的模型(例如, 药物诱导毒性模型)获得的各个数据集,如药物的剂量、治疗剂量、蛋白质表达、mRNA表达、 脂质水平、代谢物水平、激酶活性和许多其他相关功能测量(如〇CR、ECAR)的任何一个被送 入基于AI的系统中。如图15B所示,AI系统在被称为贝叶斯片段计数(BayesianFragment Enumeration)的过程中从输入的数据集创建"网络片段"文库,其包括驱动生物学过程(例 如,药物诱导毒性)中的分子机制的变量(例如,蛋白质、脂质、激酶和代谢物)(图15B)。
[0158] 在图15C中,基于AI的系统选择文库中的网络片段的子集,并从该片段构建初始 试验网络。基于AI的系统也选择文库中网络片段的不同子集来构建另一初始试验网络。最 终从文库中网络片段的不同子集建立一整套初始试验网络(例如,1000个网络)。该过程 可以被称为平行总体采样。整体中的各个试验网络通过从文库中增加、减去和/或替代额 外的网络片段进行进化或优化。如果得到附加数据,该附加数据可被结合到网络文库的网 络片段中,并且可以通过各个试验网络的进化被结合到整套试验网络中。优化/进化过程 完成后,整套试验网络可以被描述为生成的细胞模型网络。
[0159] 如图1?中所示,整套生成的细胞模型网络可以用来模拟生物系统(例如,药物诱 导毒性)的行为。模拟可用于预测生物系统(例如,药物诱导毒性)对于条件变化的行为, 这可以使用基于细胞的或基于动物的湿式实验室实验来验证。另外,可以使用模拟功能,通 过向每个节点单独地施加模拟的扰动而同时观察对所生成的细胞模型网络中其他节点的 影响,来得到在所生成的细胞模型网络中关系的定量参数。在下面的ΠΙ.C部分中提供进 一步的细节。
[0160] 在图2A-2D中描绘的基于AI的信息学系统的自动化逆向工程过程建立了 一整套 生成的细胞模型网络,它是该细胞的无偏的和系统的基于计算机的模型。
[0161] 该逆向工程决定了数据中的分子测量之间概率定向网络连接,和感兴趣的表型结 果。分子测量中的变异使得能够学习这些实体和终点变化之间的概率的原因和效应关系。 平台的机器学习特性也使得交叉训练和不断进化的基于数据集的预测成为可能。
[0162] 数据中分子测量之间的网络连接是"概率性的",部分地因为连接可以基于由计算 机算法"学习"的观察数据集之间的相关性。例如,如果基于数据集的统计分析,蛋白质X和 蛋白质Y的表达水平是正相关或负相关的,则可以分配因果关系以建立蛋白质X和Y之间 的网络连接。这个推定的因果关系的可靠性可以由该连接的似然性进一步定义,其可以通 过P值测定(例如,Ρ〈〇· 1、〇· 05、0· 01等)。
[0163] 数据中分子测量之间的网络连接是"定向的",部分地是因为分子测量之间的网络 连接,如由反向工程过程所确定的,反映连接的基因/蛋白质之间关系的原因和效应,以使 得提高一个蛋白质的表达水平可能导致其他蛋白质的表达水平上升或下降,这取决于该连 接是刺激性的还是抑制性的。
[0164] 数据中分子测量之间的网络连接是"定量的",部分地因为分子测量之间的网络连 接,如通过该方法所确定的,可以在计算机中基于现有的数据集和与其相关的概率测量来 模拟。例如,在分子测量之间所建立的网络连接中,理论上可能会增加或减少(例如,增加 或减少1、2、3、5、10、20、30、50、100倍或更高)给定蛋白质的表达水平(或在网络中的"节 点"),和定量模拟其对网络中其它连接的蛋白质的影响。
[0165] 数据中分子测量之间的网络连接是"无偏的",至少部分地因为没有数据点被统计 地或人为地切除,和部分地因为该网络连接是仅基于输入的数据,而不涉及关于所讨论的 生物学过程的现有知识。
[0166] 数据中分子测量之间的网络连接是"系统的"和(无偏的),部分地因为所有输入 变量之间的所有潜在连接已被系统地考察,例如,以成对的方式。执行这个系统性探测的计 算能力的可靠性随着输入变量数的增加而呈指数地提高。
[0167] 在一般情况下,一整套约1000个网络通常足以预测所有被测实体之间的概率因 果定量关系。该整套网络捕获数据中的不确定性,且使得对于每个模型预测计算置信度量 成为可能。使用该整套网络一起产生预测,其中整套中单个网络的预测中的差异代表预测 的不确定性程度。此特征使得能够对于从模型生成的临床反应的预测分配置信量度。
[0168] 一旦模型进行逆向工程,可以对整套模型进行进一步模拟质询以确定所讨论的生 物学过程如药物诱导毒性状态的关键分子驱动子。
[0169] 图9中描述了用于建立代表正常和糖尿病状态的示例性体外模型的成分的略图。 图10描述了用来生成蛋白质(因为它们涉及到疾病的病理生理学)的因果网络的示例性 信息学平台REFS?的示意图。图11中描述了导致生成糖尿病与正常状态的差异网络的示 例性方法和通过用MMS治疗恢复到正常状态的糖尿病节点的示意图。图12描述了糖尿病 与正常状态的代表性差异网络。图13中描述了感兴趣的节点和相关边界(中心的Nodel) 以及与各个边界相关的细胞功能性的示意图。
[0170] 已在上面概述了本发明,下面的章节中提供了结合可以使用本发明的方法分析的 一个或多个特定的生物系统(例如,药物诱导毒性)对于总体发明的各个方面或元素的更 详细描述。然而,应当指出,对以下仅供说明之用的特定的药物诱导毒性没有限制。与此相 反,其意图是可以同样使用所述的平台技术分析包括任何的替代、修改及其等同物的其他 不同的药物诱导毒性。
[0171]II.定义
[0172] 如本文所用的,旨在特别地定义但在本说明书的其他部分中尚未定义有某些术语 在此进行定义。
[0173] 在本文中使用的冠词"一"和"一个"指一个或一个以上的(S卩,至少一个)该冠 词的语法对象。通过举例的方式,"一元素"是指一个元素或一个以上的元素。
[0174] 本文所用的术语"包括"的意思是短语"包括但不限于"并可与之互换使用。
[0175] 本文所使用的术语"或"的意思是术语"和/或",并可与之互换使用,除非上下文 另有明确说明。
[0176] 本文所用的术语"例如"是指短语"例如但不限于",并可与之互换使用。
[0177] "代谢途径"指的是将一个化合物转化为另一个化合物并为细胞功能提供中间体 和能量的酶介导的反应序列。代谢途径可以是直链的或环状的或支链的。
[0178] "代谢状态"是指在给定时间点,通过各个化学和生物指标(因为它们涉及健康或 疾病的状态)测量的特定细胞、多细胞或组织环境的分子含量。
[0179] 术语"微阵列"指的是在基材,如纸、尼龙或其他类型的膜、过滤器、芯片、玻璃载片 或任何其它合适的固体支持物上合成的不同多核苷酸、寡核苷酸、多肽(例如,抗体)或肽 的阵列。
[0180] 术语"紊乱"和"疾病"包含地使用且指与身体的任何部分、器官或系统(或它们 的任意组合)的正常结构或功能的任何偏离。特定的疾病是通过特征性症状和体征表现 的,包括生物的、化学的和物理的变化,并往往与多个其他因素相关,包括但不限于,人口统 计学、环境、职业、遗传和医疗史因素。可以通过多个方法量化一定的特征性体征、症状及相 关因素以得到重要的诊断信息。
[0181] 术语"药物诱导毒性"包括但不限于心脏毒性、肝脏毒性、肾脏毒性、神经毒性、肾 毒性或肌肉毒性。
[0182] 术语"心脏毒性"是指由治疗分子诱导的对心脏功能的宽范围的不利影响。其可 能在临床前研究的早期出现或在临床情况的后期变得明显。本文所述的心血管毒性包括, 但不限于,提高的QT持续期、心律不齐、心肌缺血、高血压和血栓栓塞并发症、心肌功能障 碍、心肌病、心力衰竭、心房纤颤、心肌病和心力衰竭、心力衰竭和LV功能障碍、心房扑动和 纤颤以及心脏瓣膜损伤和心力衰竭中的任何一个或多个。
[0183] 术语"表达"包括通过其从多核苷酸,如DNA产生多肽的过程。该过程可以包括基 因转录成mRNA,和该mRNA翻译成多肽。根据其使用的上下文,"表达"可以指RNA、蛋白质或 两者的产生。
[0184] 术语"基因的表达水平"或"基因表达水平"是指在细胞中由该基因编码的mRNA以 及前mRNA新生转录本、转录加工中间体、成熟mRNA和降解产物的水平,或蛋白质的水平。
[0185] 术语"调节"指反应的上调(即,激活或刺激)、下调(即,阻遏或抑制),或其组合 或分开的两者。"调节子"是调节的化合物或分子,并且可以是,例如,激动剂、拮抗剂、活化 齐U、刺激剂、阻遏物或抑制剂。
[0186] 蛋白质、脂质、转录物、代谢物或基因表达的"正常水平"是指将细胞与为潜在毒性 药物的药物接触之前的蛋白质、脂质、转录物、代谢物或基因表达的水平。如果药物的毒性 在相同条件下测试,可以在各种条件(例如,高血糖症、缺氧)下生长的细胞中测定"正常水 平"。
[0187] "调节的水平"是指相对于基于历史正常对照样品或优选相同实验中测试的正常 对照样品的正常水平改变的值。特定的"正常"值将取决于例如分析的类型(例如,ELISA、 酶活性、免疫组织化学、PCR)、待测试的样品(例如,细胞类型和培养条件)和本领域技术人 员已知的其他考虑因素。对照样品可以用于限定正常和异常之间的截止值。
[0188] 如果用药物处理细胞导致至少一个标志物的水平相对于"正常"或合适的对照水 平统计学显著地变化,则认为药物是毒性的。将理解不是所有的药物浓度必须导致至少一 个标志物的水平统计学显著的变化。在优选的实施方式中,如果治疗相关的药物浓度导致 至少一个标志物的水平统计学显著的变化,则认为药物潜在地具有毒性。
[0189] 当救援剂以治疗相关浓度存在时,如果标志物的水平以统计学显著的方式朝向 "正常细胞"中的标志物水平调节,则认为"救援剂"在降低毒性中是有效的。在优选的实施 方式中,救援剂将标志物恢复至与对照细胞中的标志物水平没有统计学差异的水平。
[0190] 术语"对照水平"是指公认的或预先确定的标志物水平,或优选与测试样品平行测 试的对照样品中测定的标志物水平,其用于与源自未用潜在毒性的药物或救援剂处理的细 胞的样品中的标志物水平相比较。"对照水平"获自在相同条件(例如,缺氧、高血糖症、乳 酸等)下培养的细胞。
[0191] 如本文所用的术语"三乙醇胺(Trolamine) "是指TrolamineNF、 Triethanolamine、TEALAN?^TEAlan99 % >Triethanolamine99 %> TriethanolamineNF或Triethanolamine99%NF。这些术语在本文中可互换使用。
[0192] 术语"基因组"是指生物实体(细胞、组织、器官、系统、生物体)的遗传信息的全 部。它是以DNA或RNA(例如,在某些病毒中)编码的。基因组包括基因和DNA的非编码序 列。
[0193] 术语"蛋白质组"是指由基因组、细胞、组织或生物体在给定时间表达的蛋白质的 整个集合。更具体地说,它可以指在限定的状态下在给定时间给定类型的细胞或生物体中 表达的蛋白质的整个集合。蛋白质组可以包括由于例如,基因的选择性剪接和/或翻译后 修饰(如糖基化或磷酸化)导致的蛋白质变体。
[0194] 术语"转录组"是指在给定的时间一个或一群细胞中产生的转录RNA分子的整个 集合,包括mRNA、rRNA、tRNA、微RNA和其他非编码RNA。该术语可被应用于给定的生物体 中转录本的总集,或应用于在特定细胞类型中存在的转录本的特定子集。与对于给定的细 胞系大致固定(不包括突变)的基因组不同,转录组可以随外部环境条件而变化。因为细 胞中包括了所有的mRNA转录物,转录组反映了在任何给定的时间活跃地表达的基因,除了mRNA降解现象,如转录弱化。
[0195] 转录组学的研究(也被称为表达谱)考察给定的细胞群中mRNA的表达水平,通常 采用基于DNA微阵列技术的高通量技术。
[0196] 术语"代谢组"是指在给定状态下在给定时间在生物样品内,如单一有机体中,发 现的小分子代谢物(如代谢中间体、激素和其他信号分子和次级代谢产物)的完整集合。代 谢组是动态的,且可以随时地(fromsecondtosecond)改变。
[0197] 术语"脂质组"是指在给定状态下在给定时间在生物样品(如单一生物体中)发 现的脂质的完整集合。脂质组是动态的,且可以随时改变。
[0198] 术语"相互作用组(interactome)"是指在研究中的生物系统(例如,细胞)中分 子相互作用的整个集合。它可以被显示为定向的图形。分子相互作用可以发生在属于不同 的生物化学家族(蛋白质、核酸、脂质、碳水化合物等)且也在给定家族内的分子之间发生。 当在蛋白质组学方面来说,相互作用组是指蛋白质-蛋白质相互作用网络(PPI),或蛋白质 相互作用网络(PIN)。另一个广泛研究的相互作用组类型是蛋白质-DNA相互作用组(转录 因子形成的网络(和DNA或染色质调节蛋白质)和其靶基因)。
[0199] 术语"细胞输出"包括涉及细胞状态的参数的集合,优选可测量的参数,所述细胞 的状态包括(不限于):一个或多个基因的转录水平(例如,通过RT_PCR、qPCR、微阵列等可 测量的)、一个或多个蛋白质的表达水平(例如,通过质谱法或蛋白质印迹等可测量的)、一 个或多个酶或蛋白质的绝对活性(例如,作为底物转化率可测量的)或相对活性(例如,作 为与最大活性相比的%值可测量的)、一个或多个代谢物或中间体的水平、氧化磷酸化水平 (例如,通过耗氧率或OCR可测量的)、糖酵解水平(例如,通过细胞外酸化率或ECAR可测 量的)、配体-靶结合或相互作用的程度、细胞外分泌分子的活性等。细胞输出可以包括预 先确定数的靶基因或蛋白质等的数据,或者可以包括对所有可检测的基因或蛋白质的整体 评估。例如,可使用质谱法来确定和/或定量在给定的样品或细胞群体中表达的所有可检 测的蛋白质,而没有在样品或细胞群体是否可以表达任何特定蛋白质的先前知识。
[0200] 如本文所用的"细胞系统"包括同质的或异质的细胞群体。在系统内的细胞可 以在自然的或生理的环境下在体内生长,或者可以在体外生长,例如,在受控的组织培养 环境中。在系统内的细胞可以是相对同质的(例如,不低于70%、80%、90%、95%、99%、 99. 5%、99. 9%同质的),或者可以包含两个或更多个细胞类型,如通常发现在体内密切接 近生长的细胞类型,或可以通过例如旁分泌或其他长距离细胞间通讯在体内彼此相互作用 的细胞类型。细胞系统内的细胞可以源自建立的细胞系,包括癌细胞系、永生细胞系或正常 细胞系,或可以是原代细胞或新从活组织或器官分离的细胞。
[0201] 细胞系统中的细胞通常与可以提供营养物、气体(氧气或二氧化碳等)、化学品或 蛋白质性的/非蛋白质性的刺激物(其可以限定影响细胞行为的条件)的"细胞环境"接 触。细胞环境可以是具有限定的化学成分和/或不太明确限定的组织提取物或血清成分的 化学介质,并且可以包括细胞在其中生长的特定pH、C02含量、压力和温度。或者,细胞环境 可以是在体内发现的对于特定细胞系统的天然的或生理的环境。
[0202] 在某些实施方式中,细胞环境包括模拟生物系统或过程的方面的条件,例如,模拟 疾病状态、过程或环境。这样的培养条件包括,例如,高血糖、缺氧或富乳酸条件。本文描述 了许多其他此类条件。
[0203] 在某些实施方式中,特定细胞系统的细胞环境还包括细胞系统的某些细胞表面特 征,如细胞表面上的受体或配体的类型和它们各自的活性、碳水化合物或脂质分子的结构、 膜极性或流动性、某些膜蛋白质的成簇状态等。这些细胞表面特征可以影响附近细胞的功 能,如属于不同细胞系统的细胞。然而,在某些其它实施方式中,细胞系统的细胞环境不包 括细胞系统的细胞表面特征。
[0204] 细胞环境可以被改变成为"改变的细胞环境"。变化可以包括在细胞环境中发现的 任何一个或多个成分的改变(例如,增加或减少),包括向细胞环境添加一个或多个"外部 刺激成分"。环境扰动或外部刺激成分可以是细胞环境内源的(例如,细胞环境包含了某些 水平的刺激物,和添加更多相同的刺激物以提高其水平),或者可以是细胞环境外源的(例 如刺激物大多不存在于改变前的细胞环境中)。细胞环境还可以通过添加外部刺激成分导 致的继发性变化而改变,由于外部刺激成分可以改变细胞系统的细胞输出,包括通过细胞 系统分泌到细胞环境中的分子。
[0205] 如本文所用的"外部刺激成分",在这里也称为"环境扰动",包括可能影响细胞功 能的任何外部的物理和/或化学刺激。这可以包括任何大或小的有机或无机分子、天然或 人工合成的化学物质、温度转变、PH变化、辐射、光(UVA,UVB等)、微波、声波、电流、调制的 或未调制的磁场等。
[0206] 术语"多维细胞内分子(MM) "是身体自然产生的和/或存在于人的至少一个细胞 中的内源性分子的分离形式或合成产生的形式。MM能够进入细胞,且进入细胞包括完全或 部分进入细胞,只要分子的生物活性部分整体进入细胞。MIM能够诱导细胞内的信号转导 和/或基因表达机制。MIM是多维的,因为分子具有治疗剂和载体(例如,药物递送)效果 两者。MIM是多维的,还因为分子在疾病状态中以一个方式起作用和在正常状态中以不同 方式起作用。例如,在辅酶QlO的情况下,在VEGF存在下向黑色素瘤细胞施用辅酶QlO导 致Bcl2水平下降,这随之导致黑色素瘤细胞的致癌潜力降低。与此相反,在正常的成纤维 细胞中,共同施用辅酶Q-IO和VEFG对Bcl2水平没有影响。
[0207] 在一个实施方式中,MM也是表观代谢转变剂。在另一个实施方式中,MM不是表 观代谢转变剂。在另一个实施方式中,MIM特征在于一个或多个上述功能。在另一个实施 方式中,MM特征在于两个或更多个上述功能。在进一步的实施方式中,MM特征在于三个 或更多个上述功能。而在另一实施方式中,MIM特征在于上述的所有功能。本领域技术人 员将会理解,本发明的MM还意图包括两个或更多个内源性分子的混合物,其中所述混合 物特征在于一个或多个上述功能。在该混合物中的内源性分子以一定比率存在以使得该混 合物作为MIM发挥功能。
[0208]MIM可以是基于脂质或非基于脂质的分子。MIM的例子包括,但不限于,辅酶Q10、 乙酰Co-A、棕榈酰Co-A、左旋肉碱、氨基酸如,例如,酪氨酸、苯丙氨酸和半胱氨酸。在一 个实施方式中,MIM是小分子。在本发明的一个实施方式中,MIM不是辅酶Q10。本领域技 术人员可以使用本文中详细描述的任何分析方法常规在鉴别MIM。在US12/777, 902(US 2011-0110914)中进一步详细描述了MM,其全部内容明确地并入本文作为参考。
[0209] 如本文所用的"表观代谢转变剂"(表观转换剂)是调节从健康(或正常)的状态 转变为疾病状态(反之亦然)的代谢转换的分子,从而在人体内保持或重建细胞、组织、器 官、系统和/或宿主健康。表观代谢转变剂能够完成组织微环境的正常化。例如,表观代谢 转变剂包括当被添加到细胞中或从细胞耗尽时能够影响细胞的微环境(例如,代谢状态) 的任何分子。本领域技术人员将会理解,本发明的表观代谢转变剂还意图包括两个或更多 个分子的混合物,其中所述混合物特征在于一个或多个上述功能。该混合物中的分子以一 定比例存在以使得该混合物作为表观代谢转变剂发挥功能。表观代谢转变剂的实例包括, 但不限于,辅酶QlO;维生素D3;ECM成分如纤连蛋白;免疫调节剂,如TNFa或任何白细胞 介素,如IL-5、IL-12、IL-23 ;血管生成因子和细胞凋亡因子。
[0210] 在一个实施方式中,表观代谢转变剂也是MIM。在一个实施方式中,表观代谢转变 剂不是辅酶Q10。本领域技术人员可以使用本文中详细描述的任何分析常规地鉴别表观代 谢转变剂。US12/777, 902(US2011-0110914)中进一步详细描述了表观代谢转变剂,其全 部内容明确地并入本文作为参考。
[0211] 其他在本申请中未明确定义的术语具有与本领域普通技术人员所理解的相同的 含义。
[0212] III、平台抟术的示例件步骤和成分
[0213] 仅用于说明目的,所述平台技术的以下步骤可以在下文作为用于整合从定制的药 物诱导毒性模型获得的数据和用于鉴别驱动药物诱导毒性发病的新蛋白质/途径的示例 性用途被描述。从这一分析所得的关系图谱提供药物诱导毒性治疗靶标以及与药物诱导毒 性相关的诊断/预后标志物。然而,所述平台技术具有对于任何药物诱导毒性或过程的普 遍适用性,并不限于任何特定的药物诱导毒性或其他特定的药物诱导毒性模型。
[0214] 此外,虽然下面的描述在某些部分中作为离散的步骤呈现,但它是用于说明的目 的和简单的原因,因此,在现实中,这并不意味着这样的严格的步骤顺序和/或分界。此外, 本发明的步骤可以独立地进行,且此处提供的本发明意图单独地包含各单个步骤,以及所 述平台技术的一个或多个步骤(例如,任何一个、两个、三个、四个、五个、六个或所有七个 步骤)的组合,其可以独立于其余的步骤而进行。
[0215] 本发明还意图包括作为本发明的独立成分和实施方式的药物诱导毒性平台技术 的所有方面。例如,所生成的数据集意图是本发明的实施方式。作为进一步的例子,生成的 因果关系网络、生成的一致因果关系网络和/或生成的模拟因果关系网络也意图是本发明 的实施方式。确定为药物诱导毒性系统中独特的因果关系意图是本发明的实施方式。另外, 对于特定药物诱导毒性系统定制的模型也意图是本发明的实施方式。例如,用于药物诱导 毒性状态或过程定制的模型,如,例如,药物的毒性(如心脏毒性)的定制模型也意图是本 发明的实施方式。
[0216]A.定制模型构建
[0217] 平台技术的第一步是建立用于药物诱导毒性系统或过程的模型。药物诱导毒性系 统或过程的实例是心脏毒性。与任何其他复杂的生物学过程或系统一样,心脏毒性是通过 多个独特的方面来表征的复杂病理状况。例如,非脂肪组织(心脏和肝脏)中的摄取、利 用、细胞器生物发生和分泌中的慢性不平衡被认为是处于线粒体损伤和功能障碍的中心并 且是药物诱导心脏毒性中的关键参与者。为此,例如,通过形成非常近似于正在经受心脏毒 性的心脏细胞(cadiaccell)的状况的细胞培养条件,可以建立包含糖尿病和正常心肌细 胞的定制心脏毒性模型来模拟心脏毒性的环境。一个或多个相关类型的细胞可以用于模型 中,如,例如,心肌细胞、糖尿病心肌细胞、肝细胞、肾脏细胞、神经细胞、肾细胞或成肌细胞。
[0218] 一个这样的"环境"或生长应激条件是缺氧状态,这是由于缺氧和差的循环而 通常在多个疾病状态中和在晚期糖尿病中或心血管疾病中发现的状态。缺氧可以使用 该领域公认的方法在细胞中诱导。例如,缺氧可以通过将细胞系统放置在模块化培养箱 (MIC-101,Billups-RothenbergInc.DelMar,CA)中诱发,其可以用含 5%C02、2% 02 和 93%氮的工业气体混合物冲洗。可以在预先确定的时期后,如在缺氧处理后24小时,在具 有或没有额外的外部刺激成分(例如,0、50或100μM的辅酶Q10)的情况下测量效果。
[0219] 同样,细胞的乳酸处理模仿其中糖酵解活性高的细胞环境。可以在预先确定的时 间,例如,在24小时时,在具有或没有额外的外部刺激成分(例如,0、50或100μM的辅酶 Q10)的情况下在约12. 5mM的最终乳酸浓度下调查乳酸诱导的应激。
[0220] 高血糖是通常见于糖尿病中的状态。因为已知高葡萄糖改变细胞代谢,可以在高 血糖条件下培养的细胞中测试用于糖尿病治疗的试剂。将所述细胞暴露于典型的高血糖条 件可包括向合适的培养基加入10%的培养级的葡萄糖,以使得培养基中的葡萄糖的终浓度 为约22mM。然而,因为患有2型糖尿病的受试者常常是超重或肥胖的,因此他们常常用其他 试剂来治疗其他疾病或病症,例如,用抗炎剂治疗关节炎,用降胆固醇剂、降血压剂或血液 稀释剂治疗心血管疾病。因此,定制的模型可以与使用第一试剂治疗第一病症的还具有其 他疾病或病症的受试者相比用于评价正常受试者中的药物毒性。例如,可以一起测试没有 暴露于或暴露于高血糖条件的细胞来检测患有或未患糖尿病的受试者中的差异试剂毒性。
[0221] 高脂血症是例如在肥胖症和心血管疾病中发现的状态。高脂血症也是模拟心血管 毒性的一个方面的状态。通过在含有0. 15mM棕榈酸钠的培养基中培养细胞来提供高脂血 条件。
[0222] 可以在定制的毒性模型中独立地研究反映毒性不同方面的单独情况,和/或可以 结合在一起研究。在一个实施方式中,在定制的毒性模型中研究了至少2、3、4、5、6、7、8、9、 10、15、20、25、30、40、50或更多的反映或模拟毒性状态的组合。在一个实施方式中,在定制 的毒性模型中研究反映或模拟毒性状态的单个状态和另外地至少2、3、4、5、6、7、8、9、10、 15、20、25、30、40、50或更多状态的组合。在前述列表中给出的所有值也可以是范围的上限 或下限,其意图是本发明的部分,例如,1至5、1至10、1至20、1至30、2至5、2至10、5至 10、1至20、5至20、10至20、10至25、10至30或10至50个不同的状态。
[0223] 本文下面列出的是一些示例性的状态组合,其可用于处理用于构建药物诱导毒性 模型的细胞。其它组合可以很容易地根据进行的特定探询式生物学评估而制订。
[0224] 1、仅培养基
[0225] 2、50μMCTL辅酶QlO(CoQlO)
[0226] 3、100μMCTL辅酶QlO
[0227] 4、12.5mM乳酸
[0228] 5、12. 5mM乳酸 +50μMCTL辅酶QlO
[0229] 6、12. 5mM乳酸 +100μMCTL辅酶QlO
[0230] 7、缺氧
[0231] 8、缺氧 +50μMCTL辅酶QlO
[0232] 9、缺氧 +100μMCTL辅酶QlO
[0233] 10、缺氧 +12. 5mM乳酸
[0234]11、缺氧 +12. 5mM乳酸 +50μMCTL辅酶QlO
[0235] 12、缺氧 +12. 5mM乳酸 +100μMCTL辅酶QlO
[0236] 13、培养基+22mM葡萄糖
[0237] 14、50μMCTL辅酶Q10+22mM葡萄糖
[0238] 15、100μMCTL辅酶Q10+22mM葡萄糖
[0239] 16、12. 5mM乳酸+22mM葡萄糖
[0240] 17、12. 5mM乳酸 +22mM葡萄糖 +50μMCTL辅酶QlO
[0241] 18、12. 5mM乳酸+22mM葡萄糖+100μMCTL辅酶QlO
[0242] 19、缺氧+22mM葡萄糖
[0243] 20、缺氧 +22mM葡萄糖 +50μMCTL辅酶QlO
[0244] 21、缺氧 +22mM葡萄糖 +100μMCTL辅酶QlO
[0245] 22、缺氧+12. 5mM乳酸+22mM葡萄糖
[0246] 23、缺氧 +12. 5mM乳酸 +22mM葡萄糖 +50μMCTL辅酶QlO
[0247] 24、缺氧 +12. 5mM乳酸 +22mM葡萄糖 +100μMCTL辅酶QlO
[0248] 作为对照,在对照条件下培养一个或多个细胞系(例如,心肌细胞、糖尿病心肌细 胞、肝细胞、肾脏细胞、神经细胞、肾细胞或成肌细胞)以便确定毒性独特的蛋白质或途径 (见下文)。对照可以是上述的对比细胞模型。
[0249] 相同或不同起源的多个细胞(例如,心肌细胞、糖尿病心肌细胞、肝细胞、肾脏细 胞、神经细胞、肾细胞或成肌细胞),而不是单一细胞类型,可以被包括在毒性模型中。在某 些情况下,不同的细胞(例如,心肌细胞、糖尿病心肌细胞、肝细胞、肾脏细胞、神经细胞、肾 细胞或成肌细胞)之间的交互或ECS实验可以针对几个相互关联的目的而进行。
[0250] 在一些涉及交互的实施方式中,在定义的处理条件下(例如,高血糖,缺氧(缺 血)),在细胞模型上进行的实验设计为通过另一个细胞系统或群体(如糖尿病心肌细胞) 确定一个细胞系统或群体(如心肌细胞)的细胞状态或功能的调制。根据典型的设置,第 一细胞系统/群体接触外部刺激成分,如候选分子(例如,小的药物分子、蛋白质)或候选 条件(例如,缺氧、高糖环境)。作出响应,第一细胞系统/群体改变其转录组、蛋白质组、 代谢组和/或相互作用组,从而导致可以很容易地在细胞内和细胞外检测的变化。例如,转 录的变化可以通过多个目标mRNA的转录水平测量;蛋白质组的变化可以通过多个目标蛋 白质的表达水平测量;以及代谢组的变化可以通过对给定代谢物特别设计的分析通过多个 目标代谢物的水平测量。可选择地,上述所指的代谢组和/或蛋白质组(至少关于某些分 泌的代谢物或蛋白质)的变化也可以通过他们对第二细胞系统/群体的效应进行测量,包 括第二细胞系统/群体的转录组、蛋白质组、代谢组、相互作用组的调节。因此,该实验可用 于确定第一细胞系统/群体分泌的目标分子在不同处理条件下对第二细胞系统/群体的影 响。该实验也可以用于通过,例如,蛋白质组学差分筛选用来鉴别作为第一细胞系统(响应 于外部刺激成分处理)对另一细胞系统的信号传导的结果而调节的任何蛋白质。相同实验 设置也可以适应于反向设置,以至于也可以评估两个细胞系统间的相互影响。通常,对于这 个类型的实验,细胞系对的选择主要是基于例如来源、毒性状态和细胞功能的因素。
[0251] 虽然双细胞系统通常包括在这个类型的实验设置中,但类似的实验也可以被设计 用于两个以上的细胞系统,例如,通过在单独的固相支持物上固定各个不同的细胞系统。
[0252] 定制的模型一旦建立,可以将一个或多个"扰动"应用到该系统,如从病人与病人 之间的遗传变异,或具有/没用某些药物或前药的处理。见图15D。可以使用本领域公认的 或专有的各个方法测量这个扰动对系统的影响,包括对药物诱发毒性相关的细胞和正常对 照细胞的影响,如下文III.B节中所描述的。
[0253] 在示例性的实验中,心肌细胞在高血糖和高脂血条件中,并且另外在具有或没有 环境扰动(特别是通过已知用于诱导心脏毒性的糖尿病药物和/或潜在救援剂辅酶QlO的 处理)的情况下适应。
[0254] 通过实施本文中所描述的步骤,可以在本发明的平台技术的整个步骤中建立和使 用定制的细胞模型以最终确定在该药物诱导毒性系统中独特的因果关系。但是,本领域技 术人员可以理解,用来生成药物诱导毒性的初始的"第一代"一致因果关系网络的定制建立 的细胞模型可以随着时间不断地进化或扩展,例如,通过引入另外的药物诱导毒性相关的 细胞系和/或另外的药物诱导毒性相关的条件。可以收集来自进化的细胞模型的另外的数 据,即来自细胞模型的新增加部分的数据。然后可以将从扩展或进化的细胞模型(即,从细 胞模型的新增加部分)收集的新数据引入先前用来生成"第一代"一致因果关系网络的数 据集,以便生成更强大的"第二代" 一致因果关系网络。然后可以从"第二代"一致因果关 系网络确定该药物诱导毒性独特的新因果关系。以这个方式,细胞模型的进化提供了一致 因果关系网络的演变,从而提供对于该药物诱导毒性的调节子的新的和/或更可靠的深入 了解。
[0255] 定制模型还可以设计成用来评价组合使用的药物的毒性。例如,用于治疗包括癌 症、自身免疫疾病或HIV的多种病症的治疗剂通常作为试剂组合的混合物来给予。此外,许 多受试者具有同时治疗的多种不相关的病症(例如,糖尿病、关节炎、心血管疾病)。可以在 正常细胞中或在经受各种不同培养条件的细胞中构建模型,用于鉴别同时给药时可能导致 毒性的试剂的组合。因此,所提供的方法包括一起测试试剂(例如,2、3、4、5、6、7、8或更多 种)的组合,以确定是否该组合导致药物相关毒性,包括单独使用没有导致毒性的试剂。
[0256] 还可以构建用于"个性化医疗"应用的模型,其中可以使用本文提供的方法来测试 正在给药或考虑给药的特定药物组合,以确定该药物组合是否可能具有不可接受的毒性。 可以在各种条件下生长以模拟目标受试者(例如,针对患有糖尿病的受试者,在高葡萄糖 中生长,或针对缺氧的受试者,在缺氧条件下生长)的各个细胞类型(例如,心脏细胞、肾脏 细胞、神经细胞、肌肉细胞、肝细胞;从受试者培养的细胞系或原代细胞)中测试这样的组 合。
[0257] 本文中详细描述了定制的细胞模型的其他实例。
[0258] B、数据收集
[0259] 在一般情况下,可从任何定制的模型系统收集两个类型的数据。一个类型的数据 (例如,第一数据集,第三数据集)通常涉及某些大分子的水平,如DNA、RNA、蛋白质、脂质 等,此类别的示例性数据集是蛋白质组学数据(例如,涉及来自样品的所有或基本上所有 可测量蛋白质的表达的定性和定量数据)。其他类型的数据一般是功能数据(例如,第二数 据集,第四数据集),其反映了第一类型数据中的变化导致的表型改变。细胞的功能活性或 细胞反应可以包括生物能量学、细胞增殖、凋亡、细胞器功能、通过选自ATP、R0S、OXPHOS和 Seahorse分析的功能模型实现的基因型-表型相关性、总体酶活性(例如,总体激酶活性) 和总体酶活性对于与药物诱导毒性相关的细胞的酶代谢底物的作用(例如,磷酸化蛋白质 组学数据)中的任何一个或多个。
[0260] 对于第一类型的数据,在一些示例性实施方式中,进行定量聚合酶链反应(qPCR) 和蛋白质组学分析来通过定量聚合酶链反应(qPCR)和蛋白质组学确定细胞mRNA和蛋白质 表达的变化的特征。可以使用市售的RNA分离试剂盒分离总RNA。cDNA合成后,可以使用 用于疾病区域或细胞过程(如血管生成、细胞凋亡和糖尿病)的特定市售qPCR阵列(例 如,那些购自SABiosciences的),按照制造商的说明来确定一组预定基因的特征。例如, BioradCFX-384扩增系统可用于所有的转录谱分析实验。数据收集(Ct)后,可以使用如制 造商的说明中列出的SCt方法确定相对于对照的最终倍数变化。可以按后续章节中所描 述的进行蛋白质组学样品分析。
[0261] 所述方法可以采用数百个具有类似性质的样品的大规模高通量的定量蛋白质组 学分析,并提供用于确认细胞输出差异所必需的数据。
[0262] 有许多适合这一目的本领域公认的技术。下面简要地描述示例性的技术,与质谱 结合的iTRAQ分析。
[0263] 定量蛋白质组学方法是基于采用8-重iTRAQ试剂的稳定同位素标记和用于肽鉴 别和定量的2D-LCMALDIMS/MS。使用这个技术的定量是相对的:肽和蛋白质被赋予相对 于参比样品的丰度比。多重iTRAQ实验中常用的参比样品有利于整个多重iTRAQ实验中样 品的对比。
[0264] 例如,要实施这个分析方案,可以按照制造商的建议将6个初始样品和两个对照 池样品组合成一个8-重iTRAQ混合物。然后可以由二维液相色谱法将这一 8样品的混合 物分离,第一维度中的强阳离子交换(SCX)和第二维度中的反相HPLC,然后可以进行质谱 分析。
[0265] 本文提供了可以使用的示例性实验室程序的简要概述。
[0266] 蛋白质的提取:可以用8M尿素裂解缓冲液与蛋白酶抑制剂(不含EDTA的Thermo ScientificHalt蛋白酶抑制剂)裂解细胞,并在冰上孵育30分钟,每10分钟涡旋 (Vertex)5秒。可以以5秒的脉冲通过超声波完成裂解。可以将细胞裂解物在HOOOXg下 离心15分钟(4°C)以除去细胞碎片。可以进行Bradford分析以确定蛋白质的浓度。取自 各个样品的IOOug蛋白质可以还原(IOmM的二硫苏糖醇(DTT),55°C,1小时)、烷基化(25mM 的碘乙酰胺,室温,30分钟)和用胰蛋白酶消化(l:25W/w,200mM三乙基碳酸氢铵(TEAB), 37°C,16小时)。
[0267] 分泌组样品的制备:1)在一个实施方式中,可以将细胞培养在无血清培养基中: 可以通过冷冻干燥器浓缩条件化的培养基、还原(IOmM的二硫苏糖醇(DTT),55°C,1小时)、 烷基化(25mM的碘乙酰胺,在室温下,孵育30分钟)和然后用丙酮沉淀脱盐。可以用胰蛋 白酶(I:25w/w,200mM三乙基碳酸氢铵(TEAB),37°C,16小时)消化来自浓缩的条件化培养 基的等量蛋白质。
[0268] 在一个实施方式中,细胞可以培养在含血清培养基中:可以使用3kMWC0Vivaspin 柱(GEHealthcareLifeSciences)减小培养基的体积,然后可以用IxPBS(Invitrogen) 重构。可以按照制造商的说明使用带有缓冲交换的改进以优化条件培养基应用的AlbuVoid 柱(BiotechSupportGroup,LLC)从所有样品中耗尽血清白蛋白质。
[0269]iTRAQ8重标记:可以将来自各实验组中各个胰蛋白酶消化的试样汇集在一起以 建立汇集的对照样品。可以根据制造商的方案(ABSciex)将来自各个样品和汇集的对照 样品的相等试样用iTRAQ8重试剂标记。反应物可以组合,真空至干,通过添加0.1%甲酸 再悬浮,并通过LC-MS/MS进行分析。
[0270] 2D-NanoLC-MS/MS:所有的标记肽混合物可以通过在线2D-nanoLC分离并 通过电喷雾串联质谱进行分析。实验可以在与配备有纳米电喷射离子源(Thermo Electron,Bremen,Germany)的LTQOrbitrapVelos质谱仪连接的Eksigent2DnanoLC Ultra系统上进行。
[0271] 可以将肽混合物以4μ!7分钟的流量注入5厘米SCX柱(300μπιID,5ym, 聚SULF0ETHYLAspartamide柱,来自PolyLC列,哥伦比亚,MD),和在10个离子交换洗 脱片段中洗脱到C18捕获柱(2.5厘米,ΙΟΟμπιID,5ym,300埃ProteoP印II,来自New Objective,Woburn,MA)中并用H20/0.1 %FA洗涤5分钟。然后可以进一步用2-45 % B(H20/0. 1 %FA(溶剂A)和ACN/0. 1 %FA(溶剂B))梯度在15厘米熔融石英柱(75μmID, 5μm,300 埃ProteoPepII,来自New0bjective,Woburn,MA)上以 300nL/ 分钟进行分离 120 分钟。
[0272] 可以在Orbitrap中以30, 000分辨率获得全扫描MS谱(m/z300-2000)。可以对 于使用高能C-阱解离(HCD)的片段化顺序地分离最强的离子(最多10个)和动态排除 (dynamicallyexclude)30秒。可以用I. 2Da的分离宽度进行HO)。可以在分辨率为7500 的Orbitrap中扫描所产生的碎片离子。可以通过Xcalibur2. 1用foundationL0· 1控 制LTQOrbitrapVelos。
[0273] 多肽/蛋白质鉴定和定量:可以通过使用ProteomeDiscoverer软件(Thermo Electron)用Mascot搜索引擎对SwissProt数据库的自动数据库检索鉴别多肽和蛋白质。 检索参数可以包括对于MS公差(MStolerance)的lOppm、对于MS2公差的(λ02Da和完全 胰蛋白酶消化,从而允许最多2个缺失的裂隙。脲基甲基化(C)可以设置为固定的修饰。氧 化(M)、TMT6和脱酰胺化(NQ)可以设置为动态的修饰。肽和蛋白质的鉴定可以用Mascot 显著性阈值(P〈〇. 05)过滤。过滤器可以容许蛋白质鉴别的99%置信水平(1%FDA)。
[0274] ProteomeDiscoverer软件可以对报告离子应用校正因子,且如果不是所有定量 通道都存在,可以拒绝所有的定量值。可以通过平均强度的标准化获得相对蛋白质定量。
[0275] 关于第二类型的数据,在一些示例性实施方式中,癌和正常模型的生物能量学谱 分析可以采用Seah〇rSeTMXF24分析仪来实现对糖酵解和氧化磷酸化成分的理解。
[0276] 具体而言,可以将细胞以最佳密度接个在Seahorse培养板上。这些细胞可以被接 个在100μ1的培养基或处理溶液中并置于含5%C02的37°C培养箱中。两小时后,当细胞 附着到24孔板上,可以添加另外的150μ1的培养基或处理溶液且板可留在培养温育箱内 过夜。这一两步接个程序允许细胞在培养板中均勻分布。包含氧和pH传感器的Seahorse 盒可以在37°C的无二氧化碳培养箱中在校准流体中水化过夜。通常将三个线粒体药物加 载到该盒的三个端口上。可以将寡霉素(复合体III抑制剂)、FCCP(解偶联剂)和鱼藤酮 (复合体I抑制剂)分别加载到该盒的端口A、B和C中。可以在非缓冲的DMEM培养基中 以10倍浓度制备所有药物原液。在测定前,可以先将盒与线粒体化合物在无C02培养箱 中孵育约15分钟。可以在含有在正常的生长培养基中发现的浓度的葡萄糖的DMEM基非缓 冲培养基中洗涤Seahorse培养板。细胞可以用630μ1非缓冲培养基成层,并可以在将其 置于具有预校准盒的Seahorse仪中之前在无C02培养箱中平衡。可以在通过端口启动药 物注射前,将该仪器运行具有混合、等待和测量周期的三四个循环以获得基线。在引入下一 药物之前可以有两个循环。
[0277] OCR(耗氧率)和ECAR(细胞外酸化率)可以通过电极在7μ1室中记录且可以用 推靠seahorse培养板的盒来建立。
[0278] C、数据整合与计算机樽型牛成
[0279] -旦已获得相关的数据集,可以使用基于AI的信息学系统或平台(例如, REFS?平台)进行数据集的整合和计算机执行的统计模型的生成。例如,示例性的基 于AI的系统可以产生蛋白质相关性的基于模拟的网络作为代谢终点(ECAR/0CR)的 关键驱动子。见图15。关于REFS?系统的一些背景细节可见于Xing等,"Causal ModelingUsingNetworkEnsembleSimulationsofGeneticandGeneExpression DataPredictsGenesInvolvedinRheumatoidArthritis",PLoSComputational Biology,vol. 7,issue. 3, 1-19(2011 年 3 月)(el00105)和Periwal的 7, 512, 497 号美国 专利,其各自的全部内容以其整体明确地通过引用并入本文。在本质上,如前面所述,REFS? 系统是基于Al的系统,它采用数学算法来建立输入变量(例如,蛋白质表达水平、mRNA表 达水平以及相应的功能数据,如在Seahorse培养板上测量的0CR/ECAR值)之间的因果关 系。这个过程只基于单独的输入数据,而没有考虑之前存在的关于任何潜在的、已建立的和 /或验证的生物学关系的知识。
[0280] 特别是,本发明的平台的显著优势是,基于AI的系统是基于从细胞模型获得的数 据集,而不诉诸于或考虑涉及该生物学过程的本领域中的任何现有的知识。此外,优选地, 没有统计地或人为地切除数据点,而是所有获得的数据被送入用于确定蛋白质相关性的AI 系统中。因此,从平台产生的所得统计模型是无偏的,因为他们不考虑任何已知的生物学关 系。
[0281] 具体来说,可以将来自蛋白质组学和ECAR/0CR的数据输入到基于AI的信息系统 中,其如上所述地基于数据关联构建统计模型。然后使用以下方法对各个疾病与正常情况 (包括处理和条件)得到蛋白质相关性的基于模拟的网络。
[0282] 在下面相对于图16呈现用于构建生成的(例如,优化或进化的)网络的示例性过 程的详细描述。如上所述,将来自蛋白质组学的数据和功能细胞数据输入到基于AI的系统 中(步骤210)。预处理输入数据(其可能是原始数据或最低处理的数据),其可以包括标 准化(例如,使用分位函数或内部标准)(步骤212)。预处理还可以包括输入缺失的数据值 (例如,通过使用K最近邻(K-NN)算法)(步骤212)。
[0283] 预处理的数据用来构建网络片段文库(步骤214)。网络片段定义测量的变量(输 入数据)的所有可能的小集合(如2-3个成员集合或2-4个成员集合)之间的定量的、连 续的关系。在片段中变量之间的关系可以是线性的、逻辑的、多项的、显性或隐性纯合的等。 各个片段中的关系被赋以反映候选关系可能如何给予输入数据的贝叶斯概率得分,且还对 于其数学复杂性而惩罚该关系。通过为从输入数据推断的所有可能的成对和三元关系(且 在一些实施方式中,还有四元关系)评分,可以识别文库中最有可能的片段(很可能片段)。 也基于输入的数据计算关系的定量参数并对于各个片段进行储存。可以在片段列举中使用 各个模型类型,包括但不限于线性回归、逻辑回归、(方差分析)ANOVA模型、(协方差分析) ANCOVA模型、非线性/多项式回归模型和甚至非参数回归。对模型参数的先验假定可以假 设与模型中使用的参数的数目相关的Gull分布或贝叶斯信息标准(BIC)罚分。在网络推 论过程中,从片段文库中的片段子集构建在一套初始试验网络中的各个网络。该套初始试 验网络中的各个初始试验网络用片段文库中不同片段子集构建(步骤216)。
[0284] 构成贝叶斯网络和网络片段的基础的数学表达式的概述介绍如下,其基于 Xing等,"CausalModelingUsingNetworkEnsembleSimulationsofGeneticand GeneExpressionDataPredictsGenesInvolvedinRheumatoidArthritis,,'PLoS ComputationalBiology,vol. 7,issue. 3, 1-19(2011 年 3 月)(el00105)。
[0285] 具有随机变量X=X1,…,乂"的多元系统可以以多元概率分布函数P(X1,…,Xn; 〇) 为特征,其包括了大量的参数Θ。该多元概率分布函数可以因数分解并由局部条件概率分 布的积表不:
[0286]
【权利要求】
1. 一种用于鉴别引起药物诱导心脏毒性或具有引起药物诱导心脏毒性风险的药物的 方法,所述方法包括:比较(i)用所述药物处理前获得的第一细胞样品中存在的一种或多 种生物标志物的表达水平与(ii)用所述药物处理后获得的第二细胞样品中存在的该一种 或多种生物标志物的表达水平;其中所述一种或多种生物标志物选自表2中所列的标志 物;其中与第一样品相比,第二样品中所述一种或多种生物标志物的表达水平的调节是所 述药物引起药物诱导心脏毒性或具有引起药物诱导心脏毒性风险的指示。
2. -种用于鉴别可以降低或防止药物诱导心脏毒性的救援剂的方法,所述方法包括: (i)测定用心脏毒性诱导药物处理之前获得的第一细胞样品中存在的一种或多种生物标志 物的正常表达水平;(ii)测定用所述心脏毒性诱导药物处理后获得的第二细胞样品中存 在的该一种或多种生物标志物的处理的表达水平,以鉴别处理的细胞样品中具有表达变化 的一种或多种生物标志物;(iii)测定用所述心脏毒性诱导药物和所述救援剂处理后获得 的第三细胞样品中存在的在心脏毒性诱导药物处理样品中具有变化的表达水平的所述一 种或多种生物标志物的表达水平;和(iv)比较所述第三样品中测定的所述一种或多种生 物标志物的表达水平与所述第一样品中存在的所述一种或多种生物标志物的表达水平;其 中所述一种或多种生物标志物选自表2中所列的标志物;并且其中与所述第一样品相比, 所述第三样品中的所述一种或多种生物标志物的标准化表达水平是所述救援剂可以降低 或防止药物诱导心脏毒性的指示。
3. -种用于缓解、降低或防止药物诱导心脏毒性的方法,所述方法包括将通过权利要 求2的方法鉴别的救援剂施用于受试者,由此降低或防止受试者的药物诱导心脏毒性。
4. 权利要求1-3任一项的方法,其中所述一种或多种生物标志物选自TMP1、PTX3、 HSP76、FINC、CYB5、PAI1、IBP7(IGFBP7)、1C17、EDIL3、HM0X1、NUCB1、CS010 和 HSPA4。
5. 权利要求4的方法,其中所述药物诱导心脏毒性是心肌病、心力衰竭、心房纤颤、心 肌病和心力衰竭、心力衰竭和LV功能障碍、心房扑动和纤颤、或者心脏瓣膜损伤和心力衰 竭。
6. 权利要求1-5任一项的方法,其中所述细胞样品是心肌细胞或糖尿病心肌细胞。
7. 权利要求1-3任一项的方法,其中所述药物是癌症药物、糖尿病药物、神经药物或抗 炎药。
8. 权利要求1-7任一项的方法,其中所述药物是蒽环类、5-氟尿嘧陡、顺钼、曲妥珠单 抗、吉西他滨、罗西格列酮、吡格列酮、曲格列酮、卡麦角林、培高利特、舒马曲坦、二膦酸盐 或TNF拮抗剂。
9. 权利要求3的方法,其中所述受试者是哺乳动物、人或非人动物。
10. 权利要求3的方法,其中将所述救援剂施用于已经用心脏毒性诱导药物治疗的受 试者。
11. 权利要求3的方法,其中在用心脏毒性诱导药物治疗受试者的同时,将所述救援剂 施用于受试者。
12. 权利要求3的方法,其中在用心脏诱导毒性药物治疗受试者之前,将所述救援剂施 用于受试者。
13. 权利要求3的方法,其中所述救援剂是辅酶Q10。
14. 权利要求3的方法,其中所述救援剂不是辅酶Q10。
15. 权利要求3的方法,进一步包括监测受试者的药物诱导心脏毒性。
16. -种用于鉴别药物诱导毒性的调节子的方法,所述方法包括: (1) 使用与药物诱导毒性相关的细胞建立药物诱导毒性模型以代表药物诱导毒性的特 征性方面; (2) 从所述药物诱导毒性模型获得第一数据集,其中所述第一数据集代表表征所述与 药物诱导毒性相关的细胞的基因组学、脂质组学、蛋白质组学、代谢组学、转录组学和单核 苷酸多态性(SNP)数据中的一个或多个; (3) 从所述药物诱导毒性模型获得第二数据集,其中所述第二数据集代表所述与药物 诱导毒性相关的细胞的功能活性或细胞反应; (4) 使用编程的计算设备仅基于所述第一数据集和第二数据集生成所述基因组学、月旨 质组学、蛋白质组学、代谢组学、转录组学和单核苷酸多态性(SNP)数据中的一个或多个的 表达水平与所述功能活性或细胞反应之间的一致因果关系网络,其中所述一致因果关系网 络的生成不是基于所述第一数据集和第二数据集以外的任何已知的生物学关系; (5) 从该一致因果关系网络确定在药物诱导毒性中独特的因果关系,其中与该独特的 因果关系相关的基因、脂类、蛋白质、代谢物、转录物或SNP被鉴别为药物诱导毒性的调节 子。
17. 权利要求16的方法,其中代表所述细胞的功能活性或细胞反应的第二数据集包括 生物能量学、细胞增殖、凋亡、细胞器功能、通过选自ATP、ROS、OXPHOS和Seahorse分析的功 能模型实现的基因型-表型相关性、总体酶活性及总体酶活性对于与药物诱导毒性相关的 细胞的酶代谢底物的作用中的一个或多个。
18. 权利要求17的方法,其中所述总体酶活性是总体激酶活性,并且其中所述总体酶 活性对酶代谢底物的作用是磷酸化蛋白质组。
19. 权利要求1至3和16中任一项的方法,其中所述第一数据集包括基因组学、脂质组 学、蛋白质组学、代谢组学、转录组学和单核苷酸多态性(SNP)数据中的两个或多个。
20. 权利要求16的方法,其中通过基于人工智能(AI)的信息学平台来进行步骤(4)。
21. 权利要求20的方法,其中所述基于AI的信息学平台包括REFS (TM)。
22. 权利要求21的方法,其中所述基于AI的信息学平台接受来自所述第一数据集和第 二数据集的所有数据输入而不应用统计学截止点。
23. 权利要求16的方法,其中在步骤(5)之前,在步骤(4)中建立的所述一致因果关系 网络通过基于输入数据的计算机模拟进一步优化为模拟因果关系网络,以对于所述一致因 果关系网络内的一个或多个因果关系提供预测的置信水平。
24. 权利要求16的方法,其中所述独特因果关系被确定为独特地存在于所述细胞中且 不存在于匹配的对照细胞中的差异因果关系网络的部分。
25. 权利要求16的方法,其中所确定的独特因果关系是选自下组的至少一对之间的关 系:基因的表达和脂质的水平;基因的表达和转录物的水平;基因的表达和代谢物的水平; 第一基因和第二基因的表达;基因的表达和SNP的存在;基因的表达和功能活性;脂质的水 平和转录物的水平;脂质的水平和代谢物的水平;第一脂质和第二脂质的水平;脂质的水 平和SNP的存在;脂质的水平和功能活性;第一转录物的水平和第二转录物的水平;转录物 的水平和代谢物的水平;转录物的水平和SNP的存在;第一转录物的水平和功能活性的水 平;第一代谢物的水平和第二代谢物的水平;代谢物的水平和SNP的存在;代谢物的水平和 功能活性;第一 SNP的水平和第二SNP的存在;及SNP的存在和功能活性。
26. 权利要求25的方法,其中所述功能活性选自生物能量学、细胞增殖、凋亡、细胞器 功能、激酶活性、蛋白酶活性及通过选自ATP、ROS、OXPHOS和Seahorse分析的功能模型实现 的基因型-表型相关性。
27. 权利要求16的方法,进一步包括验证所确定的药物诱导毒性中的独特因果关系。
28. 权利要求16的方法,其中所述药物诱导毒性是药物诱导心脏毒性、肝脏毒性、肾脏 毒性、神经毒性、肾毒性或肌肉毒性。
29. 权利要求28的方法,其中所述药物诱导心脏毒性是心肌病、心力衰竭、心房纤颤、 心肌病和心力衰竭、心力衰竭和LV功能障碍、心房扑动和纤颤、或者心脏瓣膜损伤和心力 衰竭。
30. 权利要求16的方法,其中所述药物诱导毒性模型包括细胞心肌细胞、糖尿病心肌 细胞、肝细胞、肾脏细胞、神经细胞、肾细胞或成肌细胞。
31. 权利要求16的方法,其中所述药物诱导毒性模型包括毒性诱导药物、癌症药物、糖 尿病药物、神经药物或抗炎药。
32. 权利要求16的方法,其中所述药物是蒽环类、5-氟尿嘧啶、顺钼、曲妥珠单抗、吉西 他滨、罗西格列酮、卩比格列酮、曲格列酮、卡麦角林、培高利特、舒马曲坦、二膦酸盐或TNF拮 抗剂。
33. -种用于鉴别引起药物诱导毒性或具有引起药物诱导毒性风险的药物的方法,所 述方法包括:比较(i)用所述药物处理前获得的第一细胞样品中存在的一种或多种生物标 志物的水平与(ii)用所述药物处理后获得的第二细胞样品中存在的该一种或多种生物标 志物的水平;其中所述一种或多种生物标志物选自通过权利要求16-32任一项的方法鉴别 的调节子;其中与所述第一样品相比,所述第二样品中所述一种或多种生物标志物的水平 的调节是所述药物引起药物诱导毒性或具有引起药物诱导毒性风险的指示。
34. -种用于鉴别可以降低或防止药物诱导毒性的救援剂的方法,所述方法包括(i) 测定用毒性诱导药物处理之前获得的第一细胞样品中存在的一种或多种生物标志物的正 常水平;(ii)测定用所述毒性诱导药物处理后获得的第二细胞样品中存在的该一种或多 种生物标志物的处理的水平,以鉴别处理的细胞样品中具有水平变化的一种或多种生物标 志物;(iii)测定用所述毒性诱导药物和所述救援剂处理后获得的第三细胞样品中存在的 在毒性诱导药物处理样品中具有水平变化的一种或多种生物标志物的水平;和(iv)比较 所述第三样品中测定的所述一种或多种生物标志物的水平与所述第一样品中存在的所述 一种或多种生物标志物的水平;其中所述一种或多种生物标志物选自通过权利要求16-32 任一项的方法鉴别的调节子,并且其中与所述第一样品相比,所述第三样品中所述一种或 多种生物标志物的标准化水平是所述救援剂可以降低或防止药物诱导毒性的指示。
35. -种用于缓解、减轻或防止药物诱导毒性的方法,包括将权利要求34的救援剂施 用于受试者,由此减轻或防止受试者中的药物诱导毒性。
【文档编号】G01N33/53GK104487842SQ201280074839
【公开日】2015年4月1日 申请日期:2012年9月7日 优先权日:2012年5月22日
【发明者】N·R·纳莱恩, R·萨兰加拉詹, V·K·维施努达斯 申请人:博格有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1