用于诊断和治疗广泛性发育障碍的组合物和方法

文档序号:467249阅读:333来源:国知局
用于诊断和治疗广泛性发育障碍的组合物和方法
【专利摘要】描述了治疗和诊断人类广泛性发育障碍的方法。
【专利说明】用于诊断和治疗广泛性发育障碍的组合物和方法
[0001] 相关申请的相互参引
[0002] 本申请要求2012年3月5日提交的序列号为No. 61/606935、名称为"用于诊断和 治疗广泛性发育障碍的组合物和方法"的美国临时申请的优先权,其全部内容通过引证纳 入本文。
[0003] 序列表
[0004] 本申请包含已通过EFC-Web以ASCII形式提交的序列表,该序列表全文引证在本 文中。所述ASCII复制件产生于2013年2月28日,名称为119992-05920_SL.txt,大小为 1,144,066 字节。

【背景技术】
[0005] 广泛性发育障碍是一种重要的公众健康问题。尤其是自闭症谱系障碍,例如自闭 症和艾斯伯格症候群,它们是始于童年早期的令人虚弱的流行病,需要有效的治疗。该障碍 具有未被理解的复杂病因。
[0006] 自闭症谱系障碍是高度遗传的,但环境因素也起到了重要的作用。同卵双胞胎的 同病率约为90%,异卵双胞胎约10%。与自闭症谱系障碍相关的具体基因已被确定;然 而,自闭症谱系障碍仅有约10-15 %与已知的遗传易感性有关(Levy,S.E.等人,Lancet 374 (9701) : 1627-1638 (2010),在下文中称作Levy等人)。此外,这些遗传易感性中没有一 个在广泛性发育障碍的发展中是特异的。
[0007] 在自闭症谱系障碍中已观察到各种神经生物学异常。这些疾病的特点是大头畸 形;皮质白质增生和额叶、颞叶和边缘结构(如杏仁核)的异常生长形式;以及皮质微柱 (Cortical minicolumn)和小脑的细胞结构异常。最近的研究结果表明,自闭症患者的大脑 表现出参与细胞凋亡和正常层叠及维护大脑突触可塑性的该蛋白的失调。
[0008] 现有技术中存在对治疗、预防、减少、诊断和预测广泛性发育障碍的方法的需要。


【发明内容】

[0009] 本发明是基于,至少部分地基于以下发现:与正常的对比细胞,例如来自未患有自 闭症或阿尔茨海默病的受试者的细胞(例如来自受试者的未患自闭症或阿尔茨海默病的 兄弟姐妹或双亲的细胞)相比,在表2-6中列出的蛋白质在获自患有自闭症或阿尔茨海默 病受试者的细胞中被调节,例如,上调或下调。因此,本发明提供了用于治疗、缓解症状、抑 制进展、预防、诊断、或预测具有在表2-6中列出的一个或多个蛋白质的受试者的广泛性发 育障碍的方法。
[0010] 具体而言,本发明的一个方面提供评估个体是否患有广泛性发育障碍的方法,该 方法包括:(1)确定表2-6中所列的一种或多种标志物在从受试者获得的生物学样品中的 表达水平,其中使用试剂转化该标志物以使该标志物可检测;(2)将从受试者获得的生物 学样品中所述一种或多种标志物的表达水平与对照样品中所述一种或多种标志物的表达 水平进行比较;和(3)评估受试者是否患有广泛性发育障碍,其中,在从受试者获得的生物 学样品中所述一种或多种标志物的表达水平相对于对照样品中所述一种或多种标志物的 表达水平的调节是所述受试者患有广泛性发育障碍的指示。
[0011] 在另一个方面,发明提供了预测受试者是否倾向于发展出广泛性发育障碍的方 法,该方法包括:(1)确定表2-6中所列的一种或多种标志物在从受试者获得的生物学样品 中的表达水平,其中使用试剂转化该标志物以使该标志物可检测;(2)将从受试者获得的 生物学样品中所述一种或多种标志物的表达水平与对照样品中所述一种或多种标志物的 表达水平进行比较;和(3)预测受试者是否倾向于发展出广泛性发育障碍,其中,在从受试 者获得的生物学样品中所述一种或多种标志物的表达水平相对于对照样品中所述一种或 多种标志物的表达水平的调节是所述受试者倾向于发展出广泛性发育障碍的指示。
[0012] 在另一个方面,本发明提供了预测受试者广泛性发育障碍的严重程度的方法,该 方法包括:(1)确定表2-6中所列的一种或多种标志物在从受试者获得的生物学样品中的 表达水平,其中使用试剂转化该标志物以使该标志物可检测;(2)将从受试者获得的生物 学样品中所述一种或多种标志物的表达水平与对照样品中所述一种或多种标志物的表达 水平进行比较;和(3)评估受试者的广泛性发育障碍的严重程度,其中,在从受试者获得的 生物学样品中所述一种或多种标志物的表达水平相对于对照样品中所述一种或多种标志 物的表达水平的调节是所述受试者的广泛性发育障碍严重程度的指示。
[0013] 在一些实施方式中,所述一种或多种标志物在受试者中的表达水平远离对照样品 中表达水平的调节,例如至少2倍、3倍、4倍、5倍、10倍、15倍、10倍、30倍、40倍、50倍、 100倍或更高,为受试者中广泛性发育障碍严重的指示。在一些实施方案中,受试者样品中 一种或多种标志物的表达水平比患有不严重的广泛性发育障碍的受试者中的表达水平相 对于对照样品中表达水平的调节更远是受试者广泛性发育障碍严重的指示。
[0014] 在一些实施方式中,所述一种或多种标志物在受试者中的表达水平朝向在对照样 品中表达水平的调节,例如至少2倍、3倍、4倍、5倍、10倍、15倍、10倍、30倍、40倍、50倍、 100倍或更高,为受试者中广泛性发育障碍不严重的指示。在一些实施方案中,受试者样品 中一种或多种标志物的表达水平比患有严重的广泛性发育障碍的受试者中的表达水平与 对照样品中表达水平的调节更接近是受试者广泛性发育障碍不严重的指示。
[0015] 在另一个方面,本发明提供了监测受试者中广泛性发育障碍或广泛性发育障碍症 状的进展的方法,该方法包括:(1)确定第一次从受试者获得的第一生物学样品中存在的 表2-6中所列的一种或多种标志物的表达水平,其中使用试剂转化该标志物以使该标志物 可检测;(2)确定晚些时候第二次从受试者获得的第二生物学样品中存在的表2-6中所列 的一种或多种标志物的表达水平,其中使用试剂转化该标志物以使该标志物可检测;(3) 将表2 - 6中列出的一种或多种标志物在第一次获自受试者的第一生物学样品中的表达水 平与所述一种或多种标志物在晚些时候第二次获自受试者的第二生物学样品中的表达水 平进行比较;以及(4)监测广泛性发育障碍的进展,其中所述一种或多种标志物在第二样 品中相比于在第一样品中的表达水平的调节是受试者广泛性发育障碍或广泛性发育障碍 症状的进展的指不。
[0016] 在一个实施方案中,第二样品中的表达水平远离对照样品中的表达水平的调节, 例如比第一次的第一样品更加远离正常的或对照表达水平,是受试者广泛性发育障碍或广 泛性发育障碍症状的进展的指示。
[0017] 在一个实施方案中,第二样品相比于第一样品没有表达水平的调节(例如在第一 和第二样品中的表达水平近似相同)是受试者广泛性发育障碍或广泛性发育障碍症状的 没有进展的指示。在一个实施方案中,第二样品中的表达水平比第一次的第一样品中的表 达水平朝向对照样品中表达水平的调节,例如,更接近于正常的或对照的表达水平,是受试 者广泛性发育障碍或广泛性发育障碍症状没有进展的指示。
[0018] 在一个实施方案中,所述方法还包括为被确认患有广泛性发育障碍或倾向于发展 出广泛性发育障碍的受试者选择治疗方案。
[0019] 在一个实施方案中,该方法还包括向被确认患有广泛性发育障碍或倾向于发展出 广泛性发育障碍的受试者给药治疗方案。
[0020] 在一个实施方案中,该方法还包括向其广泛性发育障碍的进展已被确认为减少、 延迟或减轻的受试者继续给药持续的治疗方案。
[0021] 在另一方面,本发明提供一种评估用于治疗受试者的广泛性发育障碍或广泛性发 育障碍的症状的治疗方案的效果的方法,该方法包括:
[0022] (1)在向受试者给药至少一部分治疗方案之前,确定表2-6中所列的一种或多种 标志物在从受试者获得的第一生物学样品中存在的表达水平,其中使用转化标志物的试剂 以使所述标志物可被检测;
[0023] (2)在向受试者给药至少一部分治疗方案之后,确定表2-6中所列的一种或多种 标志物存在于获自所述受试者的第二生物学样品的表达水平,其中使用试剂转化标志物以 使该标志物可被检测;
[0024] (3)比较向受试者给药至少一部分治疗方案之前,表2-6中所列的一种或多种标 志物存在于获自该受试者的第一样品中的表达水平与向受试者给药至少一部分治疗方案 之后,表2-6中所列的一种或多种标志物存在于获自所述受试者的第二生物学样品的表达 水平;以及
[0025] (4)评估治疗方案对于治疗广泛性发育障碍或广泛性发育障碍的症状是否有效, 其中一种或多种标志物在第二样品中的表达水平较之于在第一样品中的表达水平的调节 是治疗方案对于治疗广泛性发育障碍或广泛性发育障碍的症状是否有效的指示。
[0026] 在一个实施方案中,该方法还包括向下述受试者连续给药治疗方案,对于该受试 者所述给药方案被确定为对于治疗广泛性发育障碍或广泛性发育障碍的症状是有效的,或 者中止对下述受试者的给药方案,对于该受试者所述给药方案被确定为对于治疗广泛性发 育障碍或广泛性发育障碍的症状是无效的。
[0027] 在另一个方面,本发明提供了一种鉴定用于治疗受试者的广泛性发育障碍或广泛 性发育障碍的症状的化合物的方法,该方法包括:
[0028] (1)将生物学样品与测试化合物接触;
[0029] (2)确定表2-6中所列的一种或多种生物标志物存在于该生物学样品中的表达水 平;
[0030] (3)将所述一种或多种标志物在该生物学样品中的表达水平与未接触测试化合物 的对照样品中的表达水平比较;以及
[0031] (4)选择调节该一种或多种生物标志物在生物学样品中的表达水平的测试化合 物,
[0032] 由此鉴定用于治疗受试者广泛性发育障碍或广泛性发育障碍的症状的化合物。
[0033] 在一个实施方案中,该广泛性发育障碍是自闭症谱系障碍。
[0034] 在一个实施方案中,该广泛性发育障碍是孤独症(austic disorder)。
[0035] 在一个实施方案中,该广泛性发育障碍是阿尔茨海默病。
[0036] 在一个实施方案中,该广泛性发育障碍是自闭症和阿尔茨海默病。在一个实施方 案中,该广泛性发育障碍是自闭症和阿尔茨海默病,且所述标志物是一种或多种如表3中 列出的标志物。
[0037] 在一个实施方案中,该广泛性发育障碍是艾斯伯格症候群。
[0038] 在一个实施方案中,该广泛性发育障碍是广泛发育障碍非其他特定型。
[0039] 在一个实施方案中,受试者患有广泛性发育障碍。
[0040] 在一个实施方案中,受试者显示出广泛性发育障碍的亚综合表现(subsyndromal manifestation)〇
[0041] 在一个实施方案中,受试者疑似患有或倾向于发展出广泛性发育障碍。
[0042] 在一个实施方案中,处理获自受试者的样品,以使得该样品转化,从而能够确定表 2-6中所列的一种或多种标志物的表达水平。
[0043] 在一个实施方案中,一种或多种标志物的表达水平在核酸水平上测定。
[0044] 在一个实施方案中,一种或多种标志物的表达水平通过检测RNA确定。在一个实 施方案中,一种或多种标志物的表达水平通过检测mRNA、miRNA或hnRNA确定。在一个实施 方案中,一种或多种标志物的表达水平通过检测DNA确定。在一个实施方案中,一种或多种 标志物的表达水平通过检测cDNA确定。
[0045] 在一个实施方案中,一种或多种标志物的表达水平通过使用选自聚合酶链式反应 (PCR)扩增反应、反转录PCR分析、定量反转录PCR分析、免疫印迹分析、RNA酶保护实验、数 字RNA检测/定量,以及其组合或亚组合的技术确定。
[0046] 在一个实施方案中,确定一种或多种标志物的表达水平包括采用抗体实施免疫测 定。
[0047] 在一个实施方案中,该一种或多种标志物包括蛋白质。
[0048] 在一个实施方案中,该蛋白质使用结合所述一种或多种标志物中的至少一种的结 合蛋白来测定。
[0049] 在一个实施方案中,所述结合蛋白包括特异性结合至该蛋白的抗体或其抗原结合 片段。
[0050] 在一个实施方案中,所述抗体或其抗原结合片段选自鼠抗体、人抗体、人源化抗 体、双特异性抗体、嵌合抗体、Fab、Fab'、F(ab') 2、8〇?¥、310?、亲和小体(3€1113〇(15〇、3¥;[11161·、 versabody、纳体(nanobody)、域抗体、以及上述任一种的抗原结合片段。
[0051] 在一个实施方案中,所述结合蛋白包括多特异性结合蛋白。
[0052] 在一个实施方案中,所述多特异性结合蛋白包括双重可变结构域免疫球 蛋白(DVD-IgTM)分子,半体DVD-Ig (HDVD-Ig)分子,三重可变结构域免疫球蛋白 (TVD-IgtDVD-Ig)分子,以及受体可变域免疫球蛋白(rDVD-Ig)分子。在一个实例中,多特 异性结合蛋白(例如,多价的DVD-Ig(HWD-Ig)分子),单体的DVD-Ig(MDVD-Ig)分子,交叉 (coDVD-Ig)的分子,血脑屏障(bbbDVD-Ig)分子,可裂解的连接体DVD-Ig (clDVD-Ig)分子 或重定向的细胞毒性DVD-Ig (rcDVD-Ig)分子。
[0053] 在一个实施方案中,所述抗体或其抗原结合片段包含标记物。
[0054] 在一个实施方案中,所述标记物选自放射标记物、生物素标记物、发色团、突光团 和酶。
[0055] 在一个实施方案中,至少一种或多种标志物的表达水平通过使用选自如下的技术 来确定:免疫测定、蛋白质印迹分析、放射免疫测定、免疫荧光测定、免疫沉淀、平衡透析、免 疫扩散、电化学发光免疫测定法(ECLIA)、ELISA测定法、聚合酶链式反应、免疫聚合酶链式 反应,以及它们的组合或它们的子组合。
[0056] 在一个实施方案中,所述免疫测定包括基于溶液的免疫测定法,其选自电化学发 光、化学发光、荧光化学发光、荧光偏振、以及时间分辨荧光。
[0057] 在一个实施方案中,该免疫测定包括夹心免疫测定法,其选自电化学发光,化学发 光和突光化学发光。
[0058] 在一个实施方案中,所述样品包括从受试者获得的体液或其组分。在一个实施方 案中,体液选自血液、血清、滑液、淋巴、血浆、尿液、羊水、房水、玻璃体液、胆汁、乳汁、脑脊 髓液、耳垢、乳糜、囊液、淋巴液、粪便、胃酸、胃液、粘液、乳头吸出物、心包液、淋巴液、腹水、 胸膜液、脓、唾液、皮脂、精液、汗水、血清、痰、泪液、阴道分泌物和从活检收集的体液。
[0059] 在一个实施方案中,所述样品包括从受试者获得的组织或细胞,或其组分。
[0060] 在另一方面,本发明提供一种治疗、减轻症状、抑制进展、或预防受试者的广泛性 发育障碍的方法,该方法包括向有需要的受试者给药治疗有效量的包含表2-6中所列的一 种或多种标志物的药物组合物。
[0061] 在另一方面,本发明提供一种治疗、减轻症状、抑制进展或预防受试者的广泛性发 育障碍的方法,该方法包括向有需要的受试者给药治疗有效量的包含调节表2-6所列一种 或多种标志物的表达或活性的药剂的药物组合物。
[0062] 在一个实施方案中,所述药剂抑制表2-6中所列的一种或多种标志物的表达或活 性。
[0063] 在一个实施方案中,所述药剂增强表2-6中所列的一种或多种标志物的表达或活 性。
[0064] 在另一方面,本发明提供一种鉴定调节表2-6中所列的一种或多种标志物的表达 或活性的药剂的方法,包括将一种或多种标志物与测试药剂接触,将所述一种或多种与测 试药剂接触的标志物的表达或活性与对照(例如一种或多种未与测试药剂接触的标志物 的表达或活性)的活性相比较,以及鉴定出调节所述一种或多种标志物的表达或活性的药 剂。
[0065] 在一个实施方案中,所述药剂下调表2-6所列的一种或多种标志物中的至少一 种。
[0066] 在一个实施方案中,所述药剂上调表2_6所列的一种或多种标志物中的至少一 种。
[0067] 在另一个方面,本发明提供一种治疗、减轻症状、抑制进展或预防受试者的广泛性 发育障碍的方法,该方法包括向有需要的受试者给药治疗有效量的包含根据前述方法鉴定 出的药剂的药物组合物。
[0068] 在前述所有方面的一个实施方案中,所述受试者是人类受试者。
[0069] 本文所描述的发明是基于、至少部分地基于一种新的对网络生物学、基因组学、蛋 白质组学、代谢组学、转录组学和生物信息学工具和方法的协同利用,它们组合后可以用来 采用系统生物学方法研究选定的疾病状况,包括广泛性发育障碍、如自闭症和阿尔茨海默 病。在平台技术的第一个步骤中,开发细胞模型系统以探究包含疾病相关细胞的疾病进程, 例如广泛性发育障碍(包括自闭症),任选地使所述细胞经受多种疾病相关的环境刺激(如 高血糖,缺氧,免疫应激和脂质过氧化作用)。在一些实施方案中,细胞模型系统包括多个相 互作用的细胞类型之间的细胞串扰机制。在第二步骤中,从该细胞模型系统通过使用多种 技术的组合获得高通量生物学读数,包括,例如质谱(LC/MSMS),流式细胞术,基于细胞的测 定和功能测定法。在第三步骤中,对该高通量生物学读数之后进行生物信息学分析,以通过 体外、体内和计算机建模研究相一致的数据的趋势。所得到的矩阵可进行交叉相关的数据 挖掘,其中进行线性和非线性回归分析以识别结论性压力点(或"中枢")。如本文中所介 绍,这些"中枢"是药物发现的候选。特别是,这些中枢代表广泛性发育障碍的潜在的药物 靶标和/或生物标志物。
[0070] 疾病(例如广泛性发育障碍)和正常的表型之间的差异的分子印记可以用于洞察 导致疾病发生和进展的机制。综合来看,上述平台技术结合战略细胞模型能够获得可靠的 信息,其用来促进我们对疾病的认识,同时创造可能在临床上提高治疗标准的生物标志物 文库和候选药物。
[0071] 本发明的平台的一个重要特点在于基于AI的系统是基于获自细胞模型系统的数 据集,而不需要借助或考虑任何已知的现有知识,例如关于生物学过程的已知的生物学关 系(即没有数据点是人工的)。因此,由该平台产生的统计学模型是没有偏见的。本发明的 平台及其组成部分(例如细胞模型系统和由其获得的数据集)的另一个重要特征在于其允 许细胞模型随时间连续积累(例如通过引入新的细胞和/或条件),以使得最初由广泛性发 育障碍(例如自闭症)的细胞模型产生的"第一代"一致的因果关系网络可以随着细胞模 型自身的进化而进化成多代的因果关系网络(由此获得S或δ-δ网络)。这样,通过使 用平台技术方法产生的细胞模型和细胞模型的数据集,以及由该细胞模型因果关系网络可 以在该平台技术此前获得的知识上持续地进化和积累。
[0072] 因此,本发明的一个方面提供了一种鉴定疾病进程(例如广泛性发育障碍)的调 节子的方法,所述方法包括:(1)使用疾病相关细胞,例如与广泛性发育障碍相关的细胞来 代表该疾病进程(例如广泛性发育障碍)的特征方面,从而建立疾病进程(例如广泛性发 育障碍)的疾病模型;(2)由该疾病模型获得第一数据集,其中所述第一数据集代表多种基 因在疾病相关细胞中的表达水平;(3)任选地,由该疾病模型获得第二数据集,其中所述第 二数据集代表所述疾病相关细胞的功能活性或细胞应答;(4)仅仅基于第一数据集和任选 地基于第二数据集,使用编程的计算装置在多种基因的表达水平和/或功能活性或细胞应 答之间产生一致因果关系网络,其中所述一致因果关系网络的产生不是基于除第一数据集 和第二数据集之外的任何已知的生物学关系;(5)从所述一致的因果关系网络中鉴定出所 述疾病进程(例如广泛性发育障碍)中独特的因果关系,其中与所述独特的因果关系相关 的基因被鉴定为该疾病进程(例如广泛性发育障碍)的调节子。
[0073] 在一些实施方案中,所述疾病进程是广泛性发育障碍。
[0074] 在一些实施方案中,所述疾病进程是自闭症或自闭症谱系障碍。
[0075] 在一些实施方案中,所述调节子刺激或促进疾病进程。
[0076] 在一些实施方案中,所述调节子抑制疾病进程。
[0077] 在一些实施方案中,所述调节子转移能量代谢途径,特别是在疾病细胞中从糖酵 解途径向氧化磷酸化途径转移。
[0078] 在一些实施方案中,所述疾病模型包括疾病细胞的体外培养物,任选地进一步包 括匹配的对照或正常细胞的体外培养物。
[0079] 在一些实施方案中,所述疾病细胞的体外培养物经受环境扰动,而匹配的对照细 胞的体外培养物是未经受环境扰动的相同的疾病细胞。
[0080] 在一些实施方案中,所述环境扰动包括以下中的一种或多种:与试剂接触、培养条 件改变、引入基因修饰/突变,以及引起基因修饰/突变的载体(例如质粒)。
[0081] 在一些实施方案中,所述第一数据集包括多种基因的蛋白质和/或mRNA表达水 平。
[0082] 在一些实施方案中,所述第一数据集还包括脂质组学数据、代谢组学数据、转录组 学数据、以及单核苷酸多态性(SNP)数据中的一种或多种。
[0083] 在一些实施方案中,所述第二数据集包括下列中的一种或多种:生物能量学谱、细 胞增殖、细胞凋亡、细胞器功能、以及通过选自ATP、R0S、OXPHOS和海马(Seahorse)分析的 功能模型实现的基因型-表型相关性。
[0084] 在一些实施方案中,步骤(4)通过基于人工智能(Al)的信息化平台实施。
[0085] 在一些实施方案中,所述基于人工智能(Al)的信息化平台包括REFS(TM)。
[0086] 在一些实施方案中,所述基于人工智能(Al)的信息化平台从所述第一数据集和 所述第二数据集接收所有数据输入,而不使用统计截留点。
[0087] 在一些实施方案中,在步骤(5)之前,在步骤(4)中确立的一致因果关系网络进一 步基于输入数据通过计算机模拟被优化成模拟因果关系网络,以对所述一致因果关系网络 中的一种或多种因果关系提供预测的置信水平。
[0088] 在一些实施方案中,所述独立的因果关系被鉴定为差异性因果关系网络中独特地 存在于疾病细胞中,并且不存在于匹配的对照细胞中的部分。
[0089] 在一些实施方案中,该方法还包括在生物学系统验证所鉴定的独特因果关系。
[0090] 在另一方面,本发明涉及提供使用在平台方法中的广泛性发育障碍的疾病模型的 方法,包括:使用疾病相关的细胞(例如与广泛性发育障碍相关的细胞)代表广泛性发育障 碍的特征方面,从而确立广泛性发育障碍的疾病模型,其中广泛性发育障碍的疾病模型可 用于产生使用在所述平台方法中的疾病模型数据集;由此提供使用在平台方法中的广泛性 发育障碍的疾病模型。
[0091] 在另一个方面,本发明涉及从用在平台方法中的广泛性发育障碍的疾病模型获得 第一数据集和第二数据集的方法,包括:(1)从使用在平台方法中的广泛性发育障碍的疾 病模型中获得第一数据集,其中所述疾病模型包括疾病相关细胞,例如与广泛性发育障碍 相关的细胞,并且其中所述第一数据集代表所述疾病相关细胞中的多种基因的表达水平; (2)任选地从用于平台方法中的疾病模型中获得第二数据集,其中所述第二数据集代表所 述疾病相关细胞的功能活性或细胞应答;由此从所述广泛性发育障碍的疾病模型中获得第 一数据集和第二数据集;由此从使用在平台方法中的广泛性发育障碍的疾病模型中获得第 一数据集和第二数据集。
[0092] 在另一个方面,本发明涉及一种鉴定广泛性发育障碍的调节子的方法,所述方法 包括:(1)使用编程的计算机装置,在所述从广泛性发育障碍的疾病模型中获得的第一数 据集和任选的第二数据集之间产生一致的因果关系网络,其中所述广泛性发育障碍的疾病 模型包括疾病细胞,例如与广泛性发育障碍相关的细胞,并且其中所述第一数据集代表所 述疾病相关细胞中的多种基因的表达水平,所述第二数据集代表所述疾病相关细胞的功能 活性或细胞应答,其中所述一致因果关系网络的产生不是基于所述第一数据集和第二数据 集之外的任何已知的生物学关系;(2)由所述一致因果关系网络鉴定出广泛性发育障碍中 独特的因果关系,其中与独特的因果关系相关的基因被鉴定为广泛性发育障碍的调节子; 由此鉴定出广泛性发育障碍的调节子。
[0093] 在另一个方面,本发明涉及一种鉴定广泛性发育障碍的调节子的方法,所述方法 包括:(1)提供由广泛性发育障碍的疾病模型产生的一致因果关系网络;(2)由所述一致因 果关系网络鉴定出广泛性发育障碍中独特的因果关系,其中与独特的因果关系相关的基因 被确认为广泛性发育障碍的调节子;由此鉴定出广泛性发育障碍的调节子。
[0094] 在一些实施方案中,所述一致因果关系网络使用编程的计算机装置由获自广泛性 发育障碍的疾病模型的第一数据集和第二数据集产生,其中所述疾病模型包括疾病细胞, 例如与广泛性发育障碍相关的细胞,并且其中所述第一数据集代表所述疾病相关细胞中的 多种基因的表达水平,所述第二数据集代表所述疾病相关细胞的功能活性或细胞应答,其 中所述一致因果关系网络的产生不是基于所述第一数据集和第二数据集之外的任何已知 的生物学关系。
[0095] 在一些实施方案中,所述疾病进程是广泛性发育障碍。
[0096] 在一些实施方案中,所述疾病进程是自闭症或自闭症谱系障碍。
[0097] 在一些实施方案中,所述调节子刺激或促进疾病进程。
[0098] 在一些实施方案中,所述调节子抑制疾病进程。
[0099] 在一些实施方案中,所述调节子转移能量代谢途径,特别是在疾病细胞中从糖酵 解途径向氧化磷酸化途径转移。
[0100] 在一些实施方案中,所述疾病模型包括疾病细胞的体外培养物,任选地进一步包 括匹配的对照或正常细胞的体外培养物。
[0101] 在一些实施方案中,所述疾病细胞的体外培养物经受环境扰动,而匹配的对照细 胞的体外培养物是未经受环境扰动的相同的疾病细胞。
[0102] 在一些实施方案中,所述环境扰动包括以下中的一种或多种:与试剂接触、培养条 件改变、引入基因修饰/突变,以及引起基因修饰/突变的载体(例如质粒)。
[0103] 在一些实施方案中,所述第一数据集包括多种基因的蛋白质和/或mRNA表达水 平。
[0104] 在一些实施方案中,所述第一数据集还包括脂质组学谱、代谢组学数据、转录组学 数据、以及单核苷酸多态性(SNP)数据中的一种或多种。
[0105] 在一些实施方案中,所述第二数据集包括下列中的一种或多种:生物能量学分析、 细胞增殖、细胞凋亡、细胞器功能、以及通过选自ATP、ROS、OXPHOS和海马测定的功能模型 实现的基因型-表型相关性。
[0106] 在一些实施方案中,步骤(4)通过基于人工智能(Al)的信息化平台实施。
[0107] 在一些实施方案中,所述基于人工智能(Al)的信息化平台包括REFS(TM)。
[0108] 在一些实施方案中,所述基于人工智能(Al)的信息化平台从所述第一数据集和 所述第二数据集接收所有数据输入,而不使用统计截留点。
[0109] 在一些实施方案中,在步骤(5)之前,在步骤(4)中确立的一致因果关系网络进一 步基于输入数据通过计算机模拟被优化成模拟因果关系网络,以提供对所述一致因果关系 网络中的一种或多种因果关系提供预测的置信水平。
[0110] 在一些实施方案中,所述独立的因果关系被鉴定为差异性因果关系网络中独特地 存在于疾病细胞中,并且不存在于匹配的对照细胞中的部分。
[0111] 在一些实施方案中,该方法还包括在生物学系统中验证所鉴定的独特因果关系。
[0112] 在某些实施方式中,"环境扰动",本文也称为"外部刺激成分",是治疗剂。在某些 实施方式中,外部刺激成分是小分子(例如,不超过5kDa、4kDa、3kDa、2kDa、lkDa、500道尔 顿或250道尔顿的小分子)。在某些实施方式中,外部刺激成分是生物剂。在某些实施方式 中,外部刺激成分是一种化学剂。在某些实施方式中,外部刺激成分是对于细胞内源性的或 外源性的。在某些实施方式中,外部刺激成分是MM或表观代谢转变剂(印ishifter)。在 某些实施方式中,外部刺激成分是细胞系统的应激因素,如缺氧、高血糖症、高脂血症、高胰 岛素血症和/或富乳酸状态。
[0113] 在某些实施方式中,外部刺激成分可包括用于治疗疾病状态的治疗剂或候选治疗 齐IJ,包括化疗剂、蛋白质基的生物药、抗体、融合蛋白质、小分子药物、脂质、多糖、核酸等等。
[0114] 在某些实施方式中,外部刺激成分可以是一个或多个应激因素,如那些通常在各 种疾病状态下在体内遇到的,包括缺氧、高血糖状态、酸性环境(可通过乳酸处理模拟)等。
[0115] 在其他实施方案中,夕卜部刺激成分可以包括一种或多种MIM和/或表观代谢 转变剂(epishifter),如下文所述。MIM和表观代谢转变剂进一步在美国专利申请 No. 12/777902、12/778029、12/778054和12/778010中有描述,其整体内容以引证的方 式明确纳入本文。示例性的MIM包括辅酶QlO (本文中也称作CoQlO)、维生素 B族化合 物或者形成维生素 B族中的化合物的核苷、单核苷酸或二核苷酸、维生素 D2、维生素 D3、 1,25-(OH)2-维生素 D2 和 1,25-(OH)2-维生素 D3。
[0116] 在进行细胞输出测量(如蛋白质表达)中,可使用绝对量(例如,表达量)或相对 水平(例如,相对表达水平)。在一个实施方式中,使用绝对量(例如,表达量)。在一个 实施方式中,使用相对水平或量(例如,相对表达水平)。例如,为了确定细胞系统的蛋白 质的相对表达水平,可以将细胞系统中任何给定的蛋白质的量(对细胞系统有或没有外部 刺激)与合适的对照细胞系或细胞系的混合物(如在同一实验中使用的所有细胞)相比 较,并给出倍数增加或倍数减少值。本领域技术人员将会理解,可以在任何细胞输出测量 (如基因和/或RNA的转录水平、脂质水平或者任何功能输出,例如,如本文所述的细胞凋 亡水平、毒性水平或ECAR或OCR)中使用绝对量或相对量。预先确定的倍数增加(例如,至 少 1. 2、1· 3、1· 4、1· 5、1· 6、1· 7、1· 8、1· 9、2、2· 5、3、3· 5、4、4· 5、5、6、7、8、9、10、15、20、25、30、 35、40、45、50、75或100或者更多倍的增加)或倍数减少(例如,至少减少至0· 9、0· 8、0· 75、 0· 7、0· 6、0· 5、0· 45、0· 4、0· 35、0· 3、0· 25、0· 2、0· 15、0· 1 或 0· 05 倍、或者减少到 90%、85%、 80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或 5%或更少)的阈值水平可以被用于选择显著差异,和然后该显著差异的细胞输出数据可 包括在用于本发明的平台技术方法中的数据集(例如,第一和第二数据集)中。本领域技术 会认识到存在于前述列表中的所有的值也可以是范围的上限或下限,例如,在1.5至5倍、5 至10倍、2至5倍、或0. 9至0. 7、0. 9至0. 5、0. 7至0. 3倍,它们也是本发明的部分。
[0117] 在整个本申请中,显示在列表中的所有值,例如,如上述的那些,也可以是确定为 本发明中的一部分的范围的上限或下限。
[0118] 在本发明的方法的一个实施方式中,因果关系网中观察到的因果关系可以不都有 生物学显著意义。对于所述探询生物评价被应用的任何给定的生物系统,一些(或者也许 全部)的因果关系(以及与其相关的基因)相对于特定的所讨论的生物问题是"决定性 的",例如导致引起疾病状态(治疗性干预的潜在目标)或疾病状态的生物标志物(潜在的 诊断或预后的因素)。在一个实施方式中,观察的在生物系统中独特的因果关系对于所讨论 的特定生物问题是决定性的。在一个实施方式中,并非每一个在生物系统中观察到的独特 的因果关系对于所讨论的特定生物问题是决定性的。
[0119] 这种决定性的因果关系可以由所述方法的最终用户来选择,或者可以由生物信息 学软件程序来选择,如REFS、DAVID-实现的比较途径分析程序或者KEGG途径分析程序。在 某些实施方式中,使用一个以上的生物信息学软件程序,和来自两个或更多生物信息学软 件程序的一致结果是优选的。
[0120] 如本文所用的细胞输出的"差异"包括任何一个或多个细胞输出参数中的差异 (例如,增加或减少的水平)。在某些实施方式中,差异各自独立地选自于mRNA转录、蛋白 质表达、蛋白质活性、代谢物/中间体水平和/或配体-靶相互作用中的差异。例如,就蛋 白质表达水平而言,可以通过使用本领域公认的技术,如以质谱分析为基础的检测(例如, iTRAQ、2D-LC-MSMS,等)测量和定量两个细胞输出之间的差异,例如在外部刺激成分治疗 之前和之后与细胞系统相关的输出。

【专利附图】

【附图说明】
[0121] 图1 :"组学"级联的图示。
[0122] 图2 :探寻式生物(Interrogative Biology) ?平台的图示。
[0123] 图3 :探寻式生物?平台的图示。
[0124] 图4A-4D :可用于不例性实施方案的基于AI信息系统的成分和方法的高水平图 /Jn 〇
[0125] 图5 :可用于一些示例性实施方案中的基于AI信息系统的方法流程图。
[0126] 图6 :图示绘出适用于实施本文中教导的示例性实施方案的示例性计算环境。
[0127] 图7 :根据一些实施方案的示例方法的高水平流程图。
[0128] 图8 :用于鉴定自闭症的新的生物标志物的实验方法的图示。
[0129] 图9 :用于鉴定自闭症的新的生物标志物的实验样品来源的图示。
[0130] 图10 :具有相对于正常样品而言在自闭症中独特的中枢/节点的整体差异性网 络。
[0131] 图11 :由自闭症和阿尔茨海默病中共同的"疾病状态"驱动的分子实体网络。
[0132] 图12 :自闭症中的示例性因果分子相互作用网络。
[0133] 图13 :具有在自闭症相互作用网络中作为关键中枢的SPTANl的示例性子网络。
[0134] 图14 :具有在自闭症相互作用网络中作为关键中枢的GLUDl的示例性子网络。
[0135] 图15 :具有在自闭症相互作用网络中作为关键中枢的C0R01A的示例性子网络。
[0136] 发明的具体描述
[0137] 自闭症谱系障碍(ASD)是一种广泛性发育障碍,包括一组严重的,难以理解的神 经行为障碍。自闭症是一种复杂的神经发育障碍。该病的主要特征是社交技巧损害、难以 沟通,以及受限的/重复行为。目前,这是排名第三的最常见的发育障碍。被诊断具有自闭 症的儿童数量急剧增加,其被认为是流行病,目前的发病率是110名儿童中有1名,且男女 比例为4:1。虽然自闭症不会影响患者的寿命,也可能是一个终身疾病。ASD具有很多疑似 原因,包括基因突变和/或缺失,线粒体功能障碍,免疫学,饮食,汞中毒和病毒感染。有趣 的是,线粒体功能障碍已被显示出在该疾病的病理生理中具有至关重要的作用。作为一种 多因素疾病,自闭症在一个谱下具有非常不同的患者群。由于对该病的分子机制的缺乏了 解,目前诊断是基于观察的行为变化,没有药物被批准用于专门治疗自闭症。目前,在临床 诊断环境中还没有已确立的分子印记或终点。尚没有生物标志物被证实在个体病人中能够 可靠地诊断自闭症。因此,缺少ASD的生物标志物是仲裁诊断中的一个主要瓶颈,以及用于 开发药物来治疗和/或预防病症。
[0138] 过去,显著精力一直放在自闭症的基因组学/遗传学研究。但是,迄今为止没有可 用的有效生物标志物,没有客观的临床试验可以帮助临床医生,并且没有有希望的治疗方 法来帮助自闭症儿童和他们的家庭。这种缺乏进展可能是由于在只进行基因/基因组学研 究时,缺少对这种疾病背后的分子机制的整体理解。可能需要研究在所有组学水平(例如, 基因组学,蛋白质组学等),包括相互作用组上的差异性分子改变,从而获得对孤独症表型 背后生物学系统的全面理解。
[0139] 因此, 申请人:在本文中描述并采用了在探寻式发现平台技术(Interrogative Discovery Platform Technology)上的结合细胞生物学和多组学平台的新方法。探寻式 平台技术使用基于数据驱动推导的人工智能(Al)来整合体外和/或体内/临床研究的数 据,以挖掘数据并建立生物模型。图1提供了描绘在平台技术中采用不同"组学"级联的示 意图。图2-3提供了探寻式发现平台技术的示意图。这个探寻式平台技术进一步被描述在 申请PCT/US2012/027615中,其全部内容明确地以引用方式并入本文。将平台技术应用到 广泛性发育障碍的细胞模型系统使得可以深入了解广泛性发育障碍的病理生理学机制,并 已产生候选生物标志物,以及潜在的治疗靶点和/或疗法/药物。使用该平台技术确定的 候选药物/药物靶点天然存在于人体内,因此,避免外源治疗剂的毒性作用。
[0140] I.定义
[0141] 如本文中所使用的,下列术语的每一个具有在该部分中与其相关的意义。
[0142] 冠词"一种(a)"和"一个(an)"在本文中是指一个或超过一个(即至至少一个) 所述冠词的语法宾语。例如,"一个元素"意指一个元素或多于一个元素。
[0143] 术语"包括"在本文中用于意指术语"包括但不限于",并且可与所述短语互换使 用。
[0144] 除非本文中明确地另外指出,否则术语"或"在本文中意指术语"和/或",并且可 与所述术语互换使用。
[0145] 术语"例如"在本文中用于意指术语"例如但不限于",并且可与所述术语互换使 用。
[0146] 如本文中所使用的,术语"受试者"或"病人"是指人类或非人动物,例如患病的兽 类,优选哺乳类。术语"非人动物"包括脊椎动物,例如哺乳动物,例如非人灵长类、鼠、啮齿 类动物、兔、羊、狗、猫、马、牛、绵羊、犬科动物、猫科动物、马或牛的品种。在一个实施方案 中,受试者是人类(例如具有广泛性发育障碍的人)。应注意,本文中描述的临床观察均是 针对人类受试者,并且在至少一些实施方案中,受试者是人。
[0147] "治疗有效量"意指当给患者施用以治疗疾病时足以对所述疾病实现这种治疗的 化合物的量,例如以适用于任何治疗的合理效益风险比产生一定的期望的局部或全身性效 应的此种物质的量。当为了预防疾病施用时,所述量足以避免或延迟疾病的发作。"治疗有 效量"将视所述化合物、治疗指数、溶解度、疾病和其严重性以及待治疗的患者的年龄、体重 等而变化。例如,可以以足以产生适用于此类治疗的合理效益风险比的量施用通过本发明 的方法发现的某些化合物。
[0148] "预防"或"防止"是指获得疾病或障碍(即,引起尚未在可遭受或易患疾病但仍未 经历或展示疾病的症状的患者中发生的疾病的至少一个临床症状)的风险降低。
[0149] 术语"预防性"或"治疗性"治疗是指给受试者施用一种或多种受试组合物。如果 其在不期望的病状(例如,宿主动物的疾病或其他不期望的状态)的临床表现之前施用,则 治疗是预防性的,即,其保护宿主免于发生不期望的病状,然而如果在不期望的病状表现之 后施用,则治疗是治疗性的(即,其由此旨在减轻、改善或维持既有的不期望的病状或副作 用)。
[0150] 术语"治疗效应"是指由药理活性物质引起的动物,特别是哺乳动物的,更特别是 人中的局部或全身性效应。所述术语因此意指意欲用于诊断、治疗、缓和、治疗或预防疾病 或用于促进动物或人的期望的身体或心理发展和状态的任何物质。
[0151] "患者"意指任何动物(例如,人类或非人哺乳动物),包括马、狗、猫、猪、山羊、兔、 仓鼠、猴、豚鼠、大鼠、小鼠、蜥蜴、蛇、绵羊、牛、鱼和鸟。
[0152] 术语"标志物"或"生物标志物"在本文中互换使用,是指用作生物状态的指示物 的物质,例如基因、信使RNA(mRNA)、微小RNA(miRNA)、异质核RNA(hnRNA),以及蛋白质或其 部分。
[0153] "表达水平"或"表达形式"是指个体中一种或多种标志物或生物标志物的表达的 定量或定性总结,例如相比于标准或对照。
[0154] "更高的表达水平"、"更高的活性水平"、"升高的表达水平"或"增加的活性水平" 是指测试样品中的表达水平和/或活性,其高于用于估计表达和/或活性的测定的标准差, 并且优选为标志在对照样品(例如,来自未患有广泛性发育障碍的健康受试者的样品)中 的表达水平、优选所述标志在几个对照样品中的平均表达水平的至少2倍,更优选3、4、5、 或10或更多倍。
[0155] "更低的表达水平"、"更低的活性水平"、"降低的表达水平"或"减少的活性水平"是 指测试样品中的表达水平和/或活性,其高于用于评估表达和/或活性的测定的标准误差, 但优选低于所述标志在对照样品(例如,利用用作所述标志物的预后能力的验证标准的随 访信息针对一小组广泛性发育障碍直接或间接校准的样品)中的表达水平、优选所述标志 在几个对照样品中的平均表达水平的至少1/2,更优选1/3、1/4、1/5或1/10或更低。
[0156] 如本文中所使用的,"抗体"包括,作为例子,天然存在的抗体形式(例如IgG、IgA、 IgM、IgE)和重组抗体例如单链抗体、嵌合抗体和人源化抗体以及多特异性抗体,以及所有 上述抗体的片段和衍生物,所述片段和衍生物具有至少一个抗原结合位点。抗体衍生物可 包括缀合至抗体的蛋白质或化学部分。
[0157] 提及的基因包括天然存在的基因或基因的内源性版本,包括可以在受试者中发现 的野生型,基因的多态或等位变体或突变体(例如,种系突变体、细胞突变)。在一个实施 方案中,所述生物标志物基因的序列与表2-6中列出的标志物的序列至少约80%、至少约 85 %、至少约90 %、至少约91 %、至少约92 %、至少约93 %、至少约94 %、至少约95 %、至少 约96%、至少约97%、至少约98%、或至少约99%相同。序列同一性可以被确定,例如,通 过使用NCBI BLAST (例如,用默认参数进行MEGABLAST)进行比较的序列。
[0158] 在一个实施例中,一种或多种标志物的表达水平相对于对照样品确定,如标志物 的在正常组织中的表达水平(例如,从正常组织样品中观察到的标志物的表达水平确定的 范围)。在一个实施方案中,标志物的表达水平相对于对照样品确定,如在来自患病受试者 的健康父母或兄弟姐妹的样品中的标志物的表达水平,或来自其他健康受试者的样品中的 标志物的表达水平。在另一个实施方案中,一种或多种标志物的表达水平相对于对照样品 确定,如患有广泛性发育障碍的其他受试者的样品中的一种或多种标志物的表达水平。例 如,可以确定在其他受试者的样品中的表2-6中的一种或多种标志物的表达水平,以定义 关联于一种特定治疗方法的敏感性的表达水平,并将感兴趣的受试者的样品中一种或多种 标志物的表达水平与这些表达水平相比较。
[0159] 术语"已知的标准水平"或"对照水平"是指被接受的或预先确定的一种或多种标 志物的表达水平,例如在表2-6中所列的一种或多种标志物,其用于将受试者样品中的所 述一种或多种标志物的表达水平进行比较。在一个实施方案中,标志物的对照表达水平是 标志物在一群受试者的样品中的表达水平,例如在一群具有广泛性发育障碍的受试者中标 志物的平均表达水平。在另一个实施方案中,所述群体包括一组不响应于特定治疗方法的 受试者,或者一组以高或正常水平表达各标志物的受试者。在另一个实施方案中,对照水平 形成一系列在正常组织中的标志物表达。在另一个实施方案中,对照水平形成了一系列在 具有广泛性发育障碍的多种受试者的细胞或血浆中的标志物的表达。在另一个实施方案 中,"对照水平"是指受试者中的预处理水平。
[0160] 随着由常规实施本文描述的方法而获得进一步的信息,可以使用本发明所述标志 物的"对照"表达水平的人群平均值。在其他实施方案中,所述标志物的"对照"表达水平 可以通过确定从疑似广泛性发育障碍发病之前的受试者中、从储存的受试者样品中、从患 病受试者的健康父母或兄弟姐妹获得的各标志物在受试者样品中的表达水平而确定。
[0161] 本发明标志物的对照表达水平可获自公众可得的数据库。此外,Universal Reference Total RNA(Clontech Laboratories)和 Universal Human Reference RNA(Stratagene)等可以用来作为对照。例如,定量PCR(qPCR)可以用来确定标志物的表达 水平,并且用于检测受试者样品中标志物表达的循环数相比于采用这种对照来检测所需的 循环数的增加表明标志物的表达水平低。
[0162] 术语"样品"是指从受试者获得或分离出的细胞、组织或体液,以及受试者体内存 在的细胞、组织或体液。术语"样品"包括来自受试者的任何体液、组织或细胞,或者细胞 群,以及其任何组成部分,例如一部分或提取物。在一个实施方案中,组织或细胞从受试者 中移出。在另一个实施方案中,组织或细胞存在于受试者体内。在一个实施方案中,体液包 括羊水、房水、玻璃体液、胆汁、血液、乳汁、脑脊髓液、耳垢、乳糜、囊液、淋巴液、粪便、胃酸、 胃液、淋巴液、粘液、乳头吸出物、心包液、淋巴液、腹水、血浆、胸膜液、脓、唾液、皮脂、精液、 汗液、血清、痰液、滑液、泪液、尿液、阴道分泌物、或者从活检收集的体液。在一个实施方案 中,所述样品包含来自受试者的蛋白质(例如蛋白质或多肽)。在另一个实施方案中,所述 样品包含来自受试者的RNA(例如mRNA)或来自受试者的DNA(例如基因组DNA分子)。
[0163] 本文中使用的"初步治疗"是指对患有广泛性发育障碍的受试者的初期治疗。
[0164] 如果广泛性发育障碍的至少一种症状预期被或被缓解、终止、减慢或预防,则广泛 性发育障碍被"治疗"。如本文中使用的,如果所述广泛性发育障碍的复发或严重程度降低、 减慢、延迟或预防,则该广泛性发育障碍也得到"治疗"。
[0165] 试剂盒是用于具体地检测本发明的标志物的包括至少一种试剂,例如探针的制造 品(例如包装或容器),所述制剂品作为一个单位被宣传、分配或售卖,以实施本发明的方 法。
[0166] "代谢途径"是指将一种化合物转化成另一种化合物并且提供中间体和能量用于 细胞功能的顺序酶介导反应。代谢途径可以是线型的或循环的。
[0167] "代谢状态"是指一个特定的细胞、多细胞或组织环境在给定时间点的分子含量, 其由各种化学和生物指标来衡量,因为它们与健康或疾病状态。
[0168] 术语"微阵列"指的是合成在基材上的不同多核苷酸、寡核苷酸、多肽(如抗体)或 肽的阵列,所述基材如纸,尼龙或其它类型的膜、过滤器、芯片、载玻片或任何其它合适的固 体支持物。
[0169] 用于免疫检测,以确定本发明的一种或多种标志物的表达水平的抗体,可以用可 检测的标记物来标记。与探针或抗体有关的术语"标记"旨在包括探针或抗体的直接标记 (通过掺入标记物(例如,放射性原子)、偶联(即物理连接)可检测物质至探针或抗体) 以及对探针或抗体的间接标记(通过与另一种直接标记的试剂反应)。间接标记的实例包 括使用荧光标记的二抗来检测一抗,以及用生物素来末端标记DNA,使得它可以被荧光标记 的链霉亲和素来检测。
[0170] 在一个实施方案中,抗体是被标记的抗体,例如放射性标记的、生色团标记的、荧 光团标记的或酶标记的抗体。在另一个实施方案中,使用抗体衍生物,例如与基质缀合的抗 体,或与蛋白质-配体对(例如生物素-链霉亲和素)的蛋白质或配体缀合的抗体,或与生 物标志物特异性结合的抗体片段(例如单链抗体,或分离的抗体高变区)。
[0171] 术语"障碍"和"疾病"被包含地使用并且是指与身体的任何部分、器官或系统(或 其任何组合)的正常结构或功能的任何偏差。具体的疾病表现在特征性症状和体征(包括 生物、化学和物理变化),并且通常与多个其他因素(包括但不限于人口统计、环境、职业、 遗传和医疗史因素)相关。可通过多种方法定量某些特征性体征、症状和相关因素以产生 重要诊断信息。
[0172] 本文使用的术语"表达"是指从DNA产生多肽的过程。该过程包括基因转录成 mRNA,和该mRNA翻译成多肽。根据其使用的上下文,"表达"可以指RNA、蛋白质或两者的产 生。
[0173] 术语"基因的表达水平"或"基因表达水平"是指在细胞中mRNA以及前mRNA新生 转录本、转录加工的中间体、成熟mRNA和降解产物的水平,或由该基因编码的蛋白质的水 平。
[0174] 术语"调节"指反应的上调(即,激活或刺激)、下调(即,阻遏或抑制),或组合或 分开的两者。"调节子"是起调节作用的化合物或分子,可以是例如激动剂、拮抗剂、活化剂、 刺激剂、阻遏物或抑制剂。
[0175] 术语"基因组"是指生物实体(细胞、组织、器官、系统、生物体)的遗传信息的全 部。它是以DNA或RNA(例如,在某些病毒中)编码的。基因组包括基因和DNA的非编码序 列。
[0176] 术语"蛋白质组"是指由基因组、细胞、组织或生物体在给定时间表达的蛋白质的 整个集合。更具体地说,它可以指在限定的状态下在给定时间给定类型的细胞或生物体中 表达的蛋白质的整个集合。蛋白质组可以包括由于例如,基因的选择性剪接和/或翻译后 修饰(如糖基化或磷酸化)导致的蛋白质变体。
[0177] 术语"转录组"是指在给定的时间一个或一群细胞中产生的转录RNA分子的整个 集合,包括mRNA、rRNA、tRNA和其他非编码RNA。该术语可被应用于给定的生物体中转录本 的总集,或应用于在特定细胞类型中存在的转录本的特定子集。与对于给定的细胞系大致 固定(不包括突变)的基因组不同,转录组可以随外部环境条件而变化。因为细胞中包括 了所有的mRNA转录物,转录组反映了在任何给定的时间活跃地表达的基因,除了 mRNA降解 现象,如转录弱化。
[0178] 对转录组学的研究,也被称为表达谱,考察给定的细胞群中mRNA的表达水平,通 常采用基于DNA微阵列技术的高通量技术。
[0179] 术语"代谢组"是指在给定状态下在给定时间在生物样品内,如单一有机体中,发 现的小分子代谢物(如代谢中间体、激素和其他信号分子和次级代谢产物)的完整集合。代 谢组是动态的,且可以每秒发生变化。
[0180] 术语"相互作用组(interactome) "是指在研究中的生物系统(例如,细胞)中分 子相互作用的整个集合。它可以被显示为定向的图形。分子相互作用可以发生在属于不同 的生物化学家族(蛋白质、核酸、脂质、碳水化合物等)的分子,且也在给定家族内的分子之 间发生。当在蛋白质组学方面来说,相互作用组是指蛋白质-蛋白质相互作用网络(PPI), 或蛋白质相互作用网络(PIN)。另一个广泛研究的相互作用组类型是蛋白质-DNA相互作用 组(转录因子形成的网络(和DNA或染色质调节蛋白质)和其靶基因)。
[0181] 术语"细胞输出"包括涉及细胞状态的参数的集合,优选可测量的参数,所述细胞 的状态包括(但不限于):一个或多个基因的转录水平(例如,可通过RT_PCR、qPCR、微阵列 等测量)、一种或多种蛋白质的表达水平(例如,可通过质谱法或Western印迹等测量)、一 种或多种酶或蛋白质的绝对活性(例如,可作为底物转化率测量)或相对活性(例如,可作 为与最大活性相比的%值测量)、一种或多种代谢物或中间体的水平、氧化磷酸化水平(例 如,可通过耗氧率或OCR测量)、糖酵解水平(例如,可通过细胞外酸化率或ECAR测量)、配 体-靶结合或相互作用的程度、细胞外分泌分子的活性等。细胞输出可以包括预先确定数 的靶基因或蛋白质等的数据,或者可以包括对所有可检测的基因或蛋白质的整体评估。例 如,可使用质谱法来确定和/或定量在给定的样品或细胞群体中表达的所有可检测的蛋白 质,而没有在样品或细胞群体是否可以表达任何特定蛋白质的先前知识。
[0182] 如本文所用的"细胞系统"包括同质的或异质的细胞群体。在系统内的细胞可 以在自然的或生理的环境下在体内生长,或者可以在体外生长,例如,在受控的组织培养 环境中。在系统内的细胞可以是相对同质的(例如,不低于70%、80%、90%、95%、99%、 99. 5%、99. 9%同质的),或者可以包含两种或更多种细胞类型,如通常发现在体内密切接 近生长的细胞类型,或可以通过例如旁分泌或其他长距离细胞间通讯在体内彼此相互作用 的细胞类型。细胞系统内的细胞可以源自建立的细胞系,包括广泛性发育障碍细胞系、永生 细胞系或正常细胞系,或可以是原代细胞或从活组织或器官新分离的细胞。
[0183] 细胞系统中的细胞通常与可以提供营养物、气体(氧气或二氧化碳等)、化学品或 蛋白质性的/非蛋白质性的刺激物(其可以定义影响细胞行为的条件)的"细胞环境"接 触。细胞环境可以是有限定的化学成分和/或不太明确限定的组织提取物或血清成分的化 学介质,并且可以包括细胞在其中生长的特定PHXO 2含量、压力和温度。或者,细胞环境可 以是在体内发现的对于特定细胞系统的天然的或生理的环境。
[0184] 在某些实施方式中,特定细胞系统的细胞环境还包括细胞系统的某些细胞表面特 征,如细胞表面上的受体或配体的类型和它们各自的活性、碳水化合物或脂质分子的结构、 膜极性或流动性、某些膜蛋白质的成簇状态等。这些细胞表面特征可以影响附近细胞(如 属于不同细胞系统的细胞)的功能。然而,在某些其它实施方式中,细胞系统的细胞环境不 包括细胞系统的细胞表面特征。
[0185] 细胞环境可以被改变成为"改变的细胞环境"。变化可以包括在细胞环境中发现的 任何一个或多个成分的改变(例如,增加或减少),包括向细胞环境添加一种或多种"外部 刺激成分"。外部刺激成分可以是细胞环境内源的(例如,细胞环境包含了一些水平的刺激 物,和添加更多相同的刺激物以提高其水平),或者可以是细胞环境外源的(例如刺激物主 要在不存在于改变前的细胞环境中)。细胞环境还可以通过添加外部刺激成分导致的继发 性变化而改变,由于外部刺激成分可以改变细胞系统的细胞输出,包括通过细胞系统分泌 到细胞环境中的分子。
[0186] 本文中使用的"外部刺激成分"包括任何可能影响细胞功能的外部的物理和/或 化学刺激。这可以包括任何大或小的有机或无机分子、天然或人工合成的化学物质、温度转 变、pH变化、辐射、光(UVA,UVB等)、微波、声波、电流、调制的或未调制的磁场等。
[0187] 仅为示例的目的,上述外部刺激成分可以包括用于治疗疾病状态的治疗剂或候选 治疗剂,包括化疗剂、基于蛋白质的生物药物、抗体、融合蛋白、小分子药物、脂质、多糖、核 酸等。
[0188] 在其他实施方案中,外部刺激成分可以是一种或多种应激因素,如那些在多种疾 病条件下体内通常遇到的因素,包括缺氧,高血糖条件下,酸性环境(可以通过乳酸处理来 丰旲拟)等。
[0189] 在其中需要研究两个或更多个细胞系统之间的相互作用的某些情况下,可以通 过,例如,使第一细胞系统的改变的细胞环境与第二细胞系统接触以影响第二细胞系统的 细胞输出而形成"交互细胞系统"。
[0190] 如本文所用的"交互细胞系统"包含两个或更多个细胞系统,其中至少一个细胞系 统的细胞环境接触到第二细胞系统,使得第二细胞系统中至少一个细胞输出被改变或受影 响。在某些实施方式中,交互细胞系统内的细胞系统可以彼此直接接触。在其它实施方式 中,没有细胞系统彼此直接接触。
[0191] 例如,在某些实施方式中,交互细胞系统可以是侵袭实验装置的形式,其中第一细 胞系统生长在插入物中和第二细胞系统生长在相应的小室隔间中。该两个细胞系统可以接 触相同的或不同的培养基,并可以交换部分或全部的培养基成分。添加到一个细胞系统的 外部刺激成分可以基本上被一个细胞系统吸收和/或在它有机会扩散到其他细胞系统之 前降解。或者,外部刺激成分最终可以在两个细胞系统内接近或达到平衡。
[0192] 在某些实施方式中,交互细胞系统可采取单独培养的细胞系统的形式,其中各个 细胞系统可以有其自身的培养基和/或培养条件(温度、CO 2含量、pH值等)或者类似或 相同的培养条件。可以通过例如,从一个细胞系统获取条件化的培养基并使其与另一个细 胞系统接触来使两个细胞系统形成接触。如果需要的话,也可以在两个细胞系统之间实现 直接的细胞-细胞接触。例如,如果需要的话,可在任何点上共培养两个细胞系统的细胞, 且当至少一个细胞系统中的细胞具有可分选标志物或标记(如稳定表达的荧光标记蛋白 GFP)时,可以随后通过,例如,FACS分选分离共培养的细胞系统。
[0193] 类似地,在某些实施方式中,交互细胞系统可以仅仅是共培养。对一个细胞系统中 的细胞的选择性处理可以通过在培养与另一个细胞系统的细胞共培养的处理细胞之前,首 先处理该细胞系统中的细胞来实现。当需要研究,例如,由第一细胞系统受外部刺激成分的 刺激后在第一细胞系统中的细胞表面变化引起的对第二细胞系统的效应时,共培养的交互 细胞系统设置可能是有用的。
[0194] 本发明的交互细胞系统特别适合于探索某些预先确定的外部刺激成分对一个或 两个细胞系统的细胞输出的影响。这样的刺激物对第一细胞系统(其与刺激物直接接触) 的初级影响可以通过比较在第一细胞系统与外部刺激接触之前和之后的细胞的输出(例 如,蛋白质表达水平)而确定,其如本文所用的可以称为"(显著的)细胞输出差异"。通过 第一细胞系统的改变的细胞环境(如其分泌组)介导的这样的刺激物对第二细胞系统的次 生效应也可以类似地测定。为此,可以比较例如第二细胞系统的蛋白质组,在具有对第一细 胞系统的外部刺激处理的第二细胞系统的蛋白质组和没有对第一细胞系统的外部刺激处 理的第二细胞系统的蛋白质组之间进行。观察到的任何显著的变化(在蛋白质组或任何其 它感兴趣的细胞输出中)可被称为"显著的细胞交互差异"。
[0195] 在进行细胞输出测量(如蛋白质表达)中,可使用绝对表达量或相对表达水平。 例如,为测定第二细胞系统的相对蛋白质表达水平,第二细胞系统中任何给定的蛋白质的 量(有或没有对第一细胞系统的外部刺激)可以与合适的对照细胞系和细胞系的混合物对 t匕,并给出倍数增加或倍数减少值。可以使用对于这种倍数增加(例如,至少1.5倍增加) 或倍数减少(例如,至少减少至0.75倍或75%)的预先确定的阈值水平来选择显著的细胞 交互差异。
[0196] 为了进行说明,在建立用来模仿心血管疾病模型的方面的一个示例性的两细胞系 统中,可以用缺氧条件(外部刺激成分)处理心平滑肌细胞系(第一细胞系统),且可以使 用常规的定量质谱法测定将肾细胞与心平滑肌的条件化培养基接触导致的肾细胞系(第 二细胞系统)中蛋白质组变化。在与适当的对照(例如,与来自没有经过缺氧条件处理的 类似培养的心平滑肌细胞的条件化培养基接触的类似培养的肾细胞)相比较的基础上,可 以确定这些肾细胞中显著的细胞交互差异。
[0197] 并不是每一个观察到的显著的细胞交互差异都可以具有生物学意义。对于应用所 述探询生物评估的任何给定的生物系统,一些(或者可能全部)显著的细胞交互差异对于 讨论的特定生物学问题,例如,引起疾病状态的原因(治疗性干预的潜在靶标),或者作为 疾病状态的生物标志物(潜在的诊断或预后因子),可能是"决定性的"。
[0198] 这样的决定性交互差异可以由所述方法的最终用户进行选择,或者它可以通过生 物信息学软件程序,如DAVID可执行的比较途径分析程序或KEGG通路分析程序选择。在某 些实施方式中,使用一个以上的生物信息学软件程序,且来自两个或更多个生物信息学软 件程序的一致结果是优选的。
[0199] 如本文所用的,细胞输出"差异"包括细胞输出中的任何一种或多种参数的差异 (例如,提高或降低的水平)。例如,就蛋白质表达水平而言,两个细胞输出之间的差异可以 通过使用本领域公认的技术,如基于质谱的分析(例如,iTRAQ、2D-LC-MS-MS等)测量和定 量,例如,与外部刺激成分处理之前和之后的细胞系统相关的输出。
[0200] 如本文所用的"探询式生物评估"可包括鉴别与外部刺激成分相关联的一个或多 个决定性细胞交互差异(例如,生物途径,或途径的关键成员,或途径成员的主要调节子的 活性的增加或减少)。它可以进一步包括涉及额外的步骤来测试或验证所确定的决定性细 胞交互差异是否需要和/或足够用于与初始外部刺激成分相关联的下游事件,包括体内动 物模型和/或体外组织培养实验。
[0201] 现在将详细地参考本发明的示例方案。虽然本发明将参照示例性实施例来描述, 但应理解,它并不意在将本发明限制到这些实施方案。与此相反,它旨在涵盖替换方案,改 进方案和如可能由所附权利要求所限定的本发明的精神和范围内的等同方案。
[0202] II.探询式牛物平台抟术的概沭
[0203] 本发明的示例性实施方式中结合了可以使用探询生物学平台("平台")实施的方 法,该平台是用于理解各种各样的生物学过程(如疾病病理生理学)和作为这种生物过程 基础的关键分子驱动子(包括使疾病过程得以发生的因子)的工具。一些示例性实施方式 包括可以结合该平台的至少一部分或全部的系统。一些示例性方法可以采用该平台的至少 一部分或全部。涉及该平台的一些示例性实施方式的目标和目的出于说明性的目的一般地 概述如下:
[0204] i)建立作为疾病过程(例如,广泛性发育障碍)的关键组成的驱动子的特定分子 印记,因为它们与疾病过程的整体病理生理学相关;
[0205] ii)生成与疾病(例如广泛性发育障碍)过程相关的分子印记或差异图谱,这可有 助于鉴别区分疾病状态与不同状态(例如,正常状态)的差异分子印记,和发展对于印记或 分子实体的理解,因为它们裁断两种状态之间的变化(例如,从正常到疾病状态)的机制; 和
[0206] iii)研究分子活性的"中枢"作为用于疾病(例如广泛性发育障碍)的外部控制 的潜在干预靶标(例如,使用该中枢作为潜在的治疗靶标)或作为所讨论的疾病(例如广 泛性发育障碍)的潜在生物标志物(例如,疾病特异性生物标志物,用于预后和/或治疗诊 断用途中)的作用。
[0207] 涉及该平台的一些示例性的方法可以包括一个或多个以下特征:
[0208] 1)在一个或多个模型中,优选在体外模型中,使用与生物过程相关的细胞对生物 过程(例如,疾病过程)和/或生物过程的成分(例如,疾病生理及病理生理学)建模。例 如,细胞可以是人类来源的细胞,其通常参与所讨论的生物过程。该模型可包括对于该生物 过程(例如,疾病)特异性的各种细胞提示/状态/扰动。在理想的情况下,该模型代表各 种(疾病)状态和通量成分而不是生物(疾病)状态的静态评估。
[0209] 2)使用领域公认的任何手段确定mRNA和/或蛋白质印记的特征。例如,定量聚合 酶链反应(qPCR)和蛋白质组学分析工具如质谱(MS)。这种mRNA和蛋白质数据集代表对环 境/扰动的生物反应。在适用和可能的情况下,脂质组学、代谢组学和转录组学数据也可被 整合作为用于所讨论的生物学过程的补充或替代测量值。SNP分析是在过程中有时可以使 用的另一成分。它可以有助于研究,例如,SNP或特定突变是否对生物过程有任何影响。这 些变量可以用于描述生物过程,无论是作为静态的"瞬象"或作为动态过程的表现。
[0210] 3)测定对提示和扰动的一个或多个细胞反应,包括但不限于生物能量学谱、细胞 增殖、细胞凋亡和细胞器功能。真正的基因型-表型相关性是通过采用功能模型(如ATP、 R0S、0XPH0S、Seahorse分析等等)实现的。这样的细胞反应代表生物过程(或其模型)中 对相应的mRNA/蛋白质表达的状态以及上面2)项中的任何其他相关状态做出响应的细胞 反应。
[0211] 4)通过采用基于人工智能(基于Al)的信息学系统或平台,整合在3)中获得的功 能分析数据与在2)中获得的蛋白质组学和其它数据,并确定由因果关系驱动的蛋白质相 关性。这样的基于AI的系统是基于,优选仅基于,2)和/或3)中得到的数据集,而不采用 关于该生物过程的现有知识。优选地,没有数据点被统计地或人为地截流。相反,所有得到 的数据被送入AI系统中用于确定蛋白质相关性。整合过程的一个目标或输出是不同生物 学状态(例如,疾病相对于正常状态)之间的一个或多个差异网络(另外在本文中可称为 " Λ网络",或者在某些情况下视情况而定称为" Λ - Λ网络")。
[0212] 5)确定基于AI的信息学平台的输出的特征以考察作为潜在治疗靶标和/或生物 标志物的各活性中枢。这样的分析可以基于所获得的数据集完全在计算机中进行而无需采 用任何实际的湿实验室试验(wet-lab experiment)。
[0213] 6)通过采用分子和细胞技术验证活性中枢。这种用湿实验室的细胞基实验对输出 进行的信息后验证(post-informatic validation)可以是任选的,但它们有助于建立全循 环的探询。
[0214] 以上概述的任何或所有途径可以用在涉及任何生物过程的任何特定应用中,其取 决于(至少部分地取决于)具体应用的性质。也就是说,上文所述的一个或多个途径可以 被省略或修改,并且可以采用一个或多个附加的途径,其取决于具体的应用。
[0215] 图2中描述了包括数据采集、数据整合和数据挖掘的平台成分的示意图。图1中 描述了系统探询和来自"组学"级联的响应数据收集的示意图。
[0216] 图7是示例性方法的高水平流程图,其中显示了可以被用来执行该示例性方法的 示例性系统的成分。首先,使用通常与生物过程相关联的细胞建立生物过程(例如,疾病过 程)和/或生物过程的成分(例如,疾病生理学和病理生理学)的模型(例如,体外模型) (步骤12)。例如,细胞可以是通常参与生物过程(例如,疾病)的来源于人的细胞。细胞 模型可包括该生物过程(例如,疾病)特定的各种细胞提示、状态和/或扰动。在理想的情 况下,细胞模型表示各种(疾病)状态和生物过程(例如,疾病)的通量成分而不是生物过 程的静态评估。对比细胞模型可包括对照细胞或正常(如非病变的)细胞。细胞模型的附 加说明出现在下面的IV. A节。
[0217] 第一数据集是使用任何已知的方法或系统(例如,定量的聚合酶链反应(qPCR) 和蛋白质组学分析工具,如质谱(MS)),从生物过程的细胞模型获得,其包括表示多个基因 (例如,mRNA和/或蛋白质印记)的表达水平的信息(步骤16)。
[0218] 第三数据集从生物过程的对比细胞模型获得(步骤18)。第三数据集包括代表来 自对比细胞模型的对比细胞中多个基因的表达水平的信息。
[0219] 在本发明方法的某些实施方式中,这些第一和第三数据集在本文中统称为"第一 数据集",其表示与生物系统相关的细胞(包括对比细胞的所有细胞)中多个基因的表达水 平。
[0220] 可以从一个或多个mRNA和/或蛋白质印记分析系统得到第一数据集和第三数据 集。第一和第三数据集中的mRNA和蛋白质数据可以代表对环境和/或扰动的生物反应。在 适用和可能的情况下,脂质组学、代谢组学和转录组学数据也可以被整合作为生物过程的 补充或替代测量。SNP分析是可以有时使用在该方法中的另一成分。它可以有助于调查,例 如,单核苷酸多态性(SNP)或特定的突变对生物过程是否有任何影响。数据变量可以被用 于描述生物过程,无论是作为静态的"瞬象",还是作为动态过程的表示。有关获取表示细胞 中多个基因的表达水平的其他描述见以下的IV. B部分。
[0221] 在一些实施方案中,第二数据集从生物过程的细胞模型获得,其包括表示细胞的 功能活性或反应的信息(步骤20)。类似地,在一些实施方案中,第四数据集从生物过程的 对比细胞模型获得,其包括表示对比细胞的功能活性或反应的信息(步骤22)。
[0222] 在本发明方法的某些实施方式中,这些第二和第四数据集在本文中统称为"第二 数据集",其表示与生物系统相关的细胞(包括对比细胞的所有细胞)的功能活性或细胞反 应。
[0223] 可以使用一个或多个功能分析系统以获得有关细胞或对比细胞的功能活性或反 应的信息。关于对提示和扰动的功能性细胞反应的信息可包括,但不限于,生物能量学谱、 细胞增殖、细胞凋亡和细胞器功能。过程和途径的功能模型(例如,三磷酸腺苷(ATP)、活性 氧物质(ROS)、氧化磷酸化(OXPHOS)、Seah 〇rse分析等)可以被用来获得真正的基因型-表 型相关性。功能活性或细胞反应表示在生物过程(或其模型)中的细胞响应于mRNA/蛋白 质表达的相应状态以及任何其他相关应用的状态或扰动的反应。在下面IV. B部分中提供 有关获得表示细胞的功能活性或反应的信息的附加信息。
[0224] 该方法还包括在细胞和对照细胞中生成生物过程的计算机执行模型。例如,可对 于细胞模型从第一数据集和第二数据集生成在所述多个基因的表达水平与所述功能活性 或细胞反应之间的一个或多个(例如,一套)因果关系的贝叶斯网络("生成的细胞模型网 络(步骤24)。生成的细胞模型网络,单独或共同地,包括关于关系的定量概率定向信息。 所生成的细胞模型网络不是基于来自第一数据集和第二数据集的信息以外的基因表达和/ 或功能活性或细胞反应之间的已知生物关系。一个或多个生成的细胞模型网络可统称为一 致细胞模型网络。
[0225] 可对于对比细胞模型从第一数据集和第二数据集生成在多个基因的表达水平与 功能活性或细胞反应之间的一个或多个(例如,一套)因果关系的贝叶斯网络("生成的对 比细胞模型网络(步骤26)。生成的对比细胞模型网络,单独地或共同地,包括关于关系 的定量概率定向信息。所生成的细胞网络不是基于第一数据集和第二数据集中的信息以外 的基因表达和/或功能活性或细胞反应之间的已知生物关系。一个或多个生成的对比模型 网络可统称为一致细胞模型网络。
[0226] 可以使用基于人工智能(基于Al)的信息学平台建立所述生成的细胞模型网络和 生成的对比细胞模型网络。关于建立生成的细胞模型网络、建立生成的对比细胞模型网络 和基于AI的信息学系统的进一步细节出现在下面IV. C部分。
[0227] 应当指出的是,可以采用许多不同的基于AI的平台或系统来生成包括定量概率 定向信息的因果关系的贝叶斯网络。虽然本文所描述的某些实施例采用一个特定的可商 业获得的系统,即,来自GNS(剑桥,MA)的REFS?(逆向工程/正向模拟),但对于实施方式 并没有限制。适合实施一些实施方式的基于AI的系统或平台采用数学算法以在输入变量 (例如,第一和第二数据集)之间建立因果关系,其仅仅基于输入的数据而没有考虑到之前 存在关于任何潜在的、已建立的和/或验证的生物关系的知识。
[0228] 例如,REFS?基于AI的信息学平台利用实验得到的粗的(原始的)或最少加工的 输入生物学数据(如遗传、基因组学、外遗传、蛋白质组学、代谢组学和临床数据),并迅速 执行万亿次计算以确定在完整系统中分子如何相互作用。REFS?基于AI的信息学平台执 行逆向工程过程,其旨在基于定量表示基础生物系统的输入数据建立计算机实施的细胞模 型(例如,生成的细胞模型网络)。另外,可以在计算机执行的细胞模型的基础上开发和快 速模拟关于基础生物系统的假设,以获得关于所述假设的伴有相关置信水平的预测。
[0229] 通过这种方式,由定量的计算机实施的细胞模型表示生物系统,其中模拟"干扰" 来学习生物系统(例如,疾病)的详细机制、有效的干预策略和/或确定哪些患者会对给定 的治疗方案做出反应的临床生物标志物。传统的生物信息学和统计学方法,以及基于已知 生物学的建模的方法,通常不能提供这些类型的深入见解。
[0230] 建立了生成的细胞模型网络和生成的对比细胞模型网络后,对它们进行比较。鉴 别至少存在于一些所生成的细胞模型网络中且在生成的对比细胞模型网络中不存在或具 有至少一个显著不同的参数的一个或多个因果关系(步骤28)。这样的对比可以导致建立 差异网络。可以使用差异网络建立模块进行对比、识别和/或差异(Λ)网络的建立,其在 下面的IV. D部分进一步详细描述。
[0231] 在一些实施方式中,输入数据集来自一种细胞类型和一种对比细胞类型,其基于 该一种细胞类型建立一套细胞模型网络和基于该一种对比对照细胞类型建立另一套对比 细胞模型网络。可以在该一种细胞类型的该套网络和对比细胞类型的该套网络之间进行差 分。
[0232] 在其它实施方式中,输入数据集来自多种细胞类型和多种对比细胞类型。可以分 别对于每个细胞类型和每个对比细胞类型单独地生成一套细胞模型网络,和/或来自多种 细胞类型和多种对比细胞类型的数据可以组合成各自的复合数据集。复合数据集生成与多 种细胞类型(复合数据)对应的一套网络,和生成与多种对比细胞类型(对比复合数据) 对应的另一套网络。可以对用于复合数据的该套网络对比于用于对比复合数据的该套网络 执行差分。
[0233] 在一些实施方式中,可以在两个不同的差异网络之间执行差分。该输出可被称为 Δ-Δ网络。
[0234] 可以为生成的细胞模型网络中的每个关系确定定量关系信息(步骤30)。类似地, 可以确定生成的对比细胞模型网络中每个关系的定量关系信息(步骤32)。有关该关系的 定量信息可以包括表示因果关系的指令、有关该关系的统计不确定性的量度(例如,曲线 下面积(AUC)的统计测量)和/或该关系的强度的定量幅度(例如,一倍)的表达。可以 使用定量关系信息确定生成的细胞模型网络中的各种关系的特性,来探索网络中作为潜在 治疗靶标和/或生物标志物的每个活性中枢。这样的分析可以完全在计算机中基于来自生 成的细胞模型网络的结果进行而没有采用任何实际的湿实验室实验。
[0235] 在一些实施方式中,可以通过采用分子和细胞技术对网络中的活性中枢进行验 证。这种用湿实验室的基于细胞的实验对输出进行信息后验证不需要执行,但它可以帮助 建立探询的完整循环。图4示意性地描绘了示例性的基于AI的信息学系统(例如,REFS? 基于AI的信息学系统)的功能性和基于AI的系统与探询式生物学平台("平台")的其他 成分或部分之间相互作用的简化高水平图示。在图4A中,从生物过程的模型(例如,疾病 模型)获得的各种数据集,如药物的剂量、治疗剂量、蛋白质表达、mRNA表达和许多相关功 能测量(如〇CR、ECAR)的任何一种被送入基于AI的系统中。如图4B所示,AI系统在被称 为贝叶斯片段计数(Bayesian Fragment Enumeration)的过程中从输入的数据集创建"网 络片段"文库,其包括驱动生物过程(例如,疾病)中的分子机制的变量(蛋白质、脂质和代 谢物)(图4B)。
[0236] 在图4C中,基于AI的系统选择文库中的网络片段的子集,并从该片段构建初始试 验网络。基于AI的系统也选择文库中网络片段的不同子集来构建另一初始试验网络。最 终从文库中网络片段的不同子集建立一套初始试验网络(例如,1000个网络)。该过程可 以被称为平行总体采样。整体中的各个试验网络通过从文库中增加、减去和/或替代额外 的网络片段进行进化或优化。如果得到附加数据,该附加数据可被结合到网络文库的网络 片段中,并且可以通过各个试验网络的进化被结合到整套试验网络中。优化/进化过程完 成后,整套试验网络可以被描述为生成的细胞模型网络。
[0237] 如图4D中所示,整套生成的细胞模型网络可以用来模拟生物系统的行为。模拟可 用于预测生物系统对于条件变化的行为,这可以使用基于细胞的或基于动物的湿实验室实 验来验证。另外,可以使用模拟功能,通过向每个节点单独地施加模拟的扰动而同时观察对 所生成的细胞模型网络中其他节点的影响,来得到在所生成的细胞模型网络中关系的定量 参数。在下面的IV. C部分中提供进一步的细节。
[0238] 基于AI的信息学系统的自动化逆向工程过程建立了一套生成的细胞模型网络, 它是该细胞的无偏的和系统的基于计算机的模型。
[0239] 该逆向工程决定了数据中的分子测量之间概率定向网络连接,和感兴趣的表型结 果。分子测量中的变异使得能够学习这些实体和终点变化之间的概率的原因和效果关系。 平台的机器学习特性也使得交叉训练和不断进化的基于数据集的预测成为可能。
[0240] 数据中分子测量之间的网络连接是"概率性的",部分地因为连接可以基于由计算 机算法"学习"的观察数据集之间的相关性。例如,如果基于数据集的统计分析,蛋白质X和 蛋白质Y的表达水平是正相关或负相关的,则可以分配因果关系以建立蛋白质X和Y之间 的网络连接。这种推定的因果关系的可靠性可以由该连接的似然性进一步定义,其可以通 过P值测定(例如,Ρ〈〇· 1、〇· 05、0· Ol等)。
[0241] 数据中分子测量之间的网络连接是"定向的",部分地是因为分子测量之间的网络 连接(如由反向工程过程所确定的)反映连接的基因/蛋白质之间关系的原因和效果,以 使得提高一种蛋白质的表达水平可能导致其他蛋白质的表达水平上升或下降,这取决于该 连接是刺激的还是抑制的。
[0242] 数据中分子测量之间的网络连接是"定量的",部分地因为分子测量之间的网络连 接,如通过该方法所确定的,可以在计算机中基于现有的数据集和与其相关的概率测量来 模拟。例如,在分子测量之间所建立的网络连接中,理论上可能会增加或减少(例如,增加 或减少1、2、3、5、10、20、30、50、100倍或更高)给定蛋白质的表达水平(或在网络中的"节 点"),和定量模拟其对网络中其它连接的蛋白质的影响。
[0243] 数据中分子测量之间的网络连接是"无偏的",至少部分地因为没有数据点被统计 地或人为地截流,和部分地因为该网络连接是仅基于输入的数据,而不涉及关于所讨论的 生物过程的现有知识。
[0244] 数据中分子测量之间的网络连接是"系统的"和(无偏的),部分地因为所有输入 变量之间的所有潜在连接已被系统地考察,例如,以成对的方式。执行这种系统性探测的计 算能力的可靠性随着输入变量数的增加而呈指数地提高。
[0245] 在一般情况下,一套约1000个网络通常足以预测所有被测实体之间的概率因果 定量关系。该套网络捕获数据中的不确定性,且使得对于每个模型预测计算置信度量成为 可能。使用该套网络一起产生预测,其中整套中的单个网络预测的差异代表预测中的不确 定性程度。此特征使得能够对于从模型生成的临床反应的预测分配置信量度。
[0246] -旦模型进行逆向工程,可以对整套模型进行进一步模拟质询以确定所讨论的生 物过程如疾病状态的关键分子驱动子。
[0247] III.平台抟术的示例件步骤和成分
[0248] 仅用于说明目的,所述平台技术的以下步骤可以在下文被描述,用于整合从定制 的广泛性发育障碍模型获得的数据和用于鉴别驱动广泛性发育障碍发病的新蛋白质/途 径。由这一分析所得的关系图谱提供广泛性发育障碍的治疗靶标以及与广泛性发育障碍相 关的诊断/预后标志物。本文描述的方法在US13, 411460中有进一步描述,其整体内容通 过引用明确地纳入本文。
[0249] 此外,虽然下面的描述在某些部分中作为离散的步骤呈现,但它是用于说明的目 的和简单的原因,因此,在现实中,这并不意味着这样的严格的步骤顺序和/或分界。此外, 本发明的步骤可以独立地进行,且此处提供的本发明意图单独地包含各单个步骤,以及所 述平台技术的一个或多个步骤(例如,任何一个、两个、三个、四个、五个、六个或所有七个 步骤)的组合,其可以独立于其余的步骤而进行。
[0250] 本发明还意图包括作为本发明的独立成分和实施方式的平台技术的所有方面。例 如,所生成的数据集意图是本发明的实施方式。作为进一步的例子,生成的因果关系网络、 生成的一致因果关系网络和/或生成的模拟因果关系网络也意图是本发明的实施方式。确 定为广泛性发育障碍中独特的因果关系意图是本发明的实施方式。另外,对于广泛性发育 障碍定制的模型也意图是本发明的实施方式。
[0251] A、定制模型构建
[0252] 平台技术的第一步是建立用于生物系统或过程(例如广泛性发育障碍)的模型。 广泛性发育障碍的实例是自闭症。如任何其他复杂的生物过程或系统一样,自闭症是复杂 的病理状态,其特征在于多个独特的方面。例如,线粒体功能障碍可能在自闭症病理学上起 到重要的作用。其结果是,自闭症细胞可以对与线粒体功能相关联的环境的扰动(例如潜 在药物的治疗)做出不同于正常细胞响应于相同处理的反应。因此,解密与正常细胞的反 应相比自闭症对药物治疗的独特反应是有利的。为此,可以建立定制的自闭症模型以模拟 与自闭症疾病相关的细胞环境,例如,自闭症患者的淋巴母细胞或其它体液(如血清或尿 液)。与线粒体功能有关的环境扰动,例如辅酶Q10,可应用来处理自闭症的细胞。线粒体 功能测定,例如ATP和/或ROS可用来提供深入的生物学读数。
[0253] 可以在定制的广泛性发育障碍模型中独立地研究反映广泛性发育障碍特征的不 同方面的单独条件,和/或可以结合在一起。在一个实施方式中,在定制的广泛性发育障碍 模型中研究了至少2、3、4、5、6、7、8、9、10、15、20、25、30、40、50或更多的反映或模拟广泛性 发育障碍的不同方面的状态的组合。在一个实施方式中,在定制的广泛性发育障碍模型中 研究反映或模拟广泛性发育障碍的不同方面的状态的单个状态和另外地至少2、3、4、5、6、 7、8、9、10、15、20、25、30、40、50或更多状态的组合。在前述列表中给出的所有值也可以是范 围的上限或下限,其意图是本发明的部分,例如,1至5、1至10、1至20、1至30、2至5、2至 10、5至10、1至20、5至20、10至20、10至25、10至30或10至50个不同的状态。
[0254] 作为对照,在类似的状态下培养一个或多个正常细胞系(例如,获自正常的、未患 病的受试者,例如患有广泛性发育障碍的受试者的正常的、未患病的家庭成员,并由其获得 与广泛性发育障碍相关的细胞),以便确定广泛性发育障碍中独特的蛋白质或途径(见下 文)。
[0255] 广泛性发育障碍模型中可以包括来自同一患有广泛性发育障碍的受试者的多种 细胞类型,例如淋巴母细胞和来自中枢神经系统的细胞,或者患有广泛性发育障碍的不同 受试者的细胞。在某些情况下,不同的与广泛性发育障碍模型相关联的细胞之间的交互式 或ECS实验可以针对几种相互关联的目的而进行。
[0256] 在一些涉及交互的实施方式中,任选地在定义的处理条件下,在细胞模型上进行 的实验被设计用于通过另一个细胞系统或群(如获自中枢神经系统的细胞)确定一个细 胞系统或群(如淋巴母细胞)的细胞状态或功能的调制。根据典型的设置,第一细胞系统 /群接触外部刺激成分,如候选分子(例如,小的药物分子、蛋白质)或候选条件(例如,缺 氧、高糖环境)。作为响应,第一细胞系统/群改变其转录组、蛋白质组、代谢组和/或相互 作用组,从而导致可以很容易地在细胞内和细胞外检测的变化。例如,转录组的变化可以通 过多个目标mRNA的转录水平测量;蛋白质组的变化可以通过多个目标蛋白质的表达水平 测量;以及代谢组的变化可以通过对给定代谢物特别设计的分析通过多个目标代谢物的水 平测量。可选择地,上述所指的代谢组和/或蛋白质组(至少关于某些分泌的代谢物或蛋 白质)的变化也可以通过他们对第二细胞系统/群的效应进行测量,包括对第二细胞系统 /群的转录组、蛋白质组、代谢组、相互作用组的调节。因此,该实验可用于确定第一细胞系 统/群分泌的目标分子在不同处理条件下对第二细胞系统/群的影响。该实验也可以用于 通过例如蛋白质组学差分筛选用来鉴别作为第一细胞系统(响应于外部刺激成分处理)对 另一细胞系统的信号传导的结果而调节的任何蛋白质。相同实验设置也可以适应于反向设 置,以至于也可以评估两个细胞系统间的相互影响。通常,对于这种类型的实验,细胞系对 的选择主要是基于例如来源、疾病状态和细胞功能的因素。
[0257] 虽然双细胞系统通常包括在这种类型的实验设置中,但类似的实验也可以被设计 用于两个以上的细胞系统,例如,通过在单独的固相支持物上固定各个不同的细胞系统。
[0258] 定制的模型一旦建立,可以将一个或多个"扰动"应用到该系统,如病人与病人之 间的遗传变异,或具有/没用某些药物或前药进行处理。可以使用本领域公认的或专有的 各种方法测量这种扰动对系统的影响,包括对广泛性发育障碍相关的细胞和正常对照细胞 的影响,如下文IV. B节中所描述的。
[0259] 在一个示例性实施方案中,使用来自患有广泛性发育障碍(如自闭症)的一个或 多个受试者的细胞系和来自对照(例如,正常细胞,例如来自未患病的受试者的细胞,如所 述患有广泛性发育障碍的受试者的一个或多个未受影响的家庭成员)的细胞系。在一个实 施方案中,将细胞用或不用环境扰动处理,例如,用辅酶QlO处理。
[0260] 通过实施本文中所描述的步骤,可以在本发明的平台技术的整个步骤中建立和使 用定制的广泛性发育障碍模型,以最终确定在该广泛性发育障碍中独特的因果关系。但是, 本领域技术人员可以理解,用来生成广泛性发育障碍的初始的"第一代"一致因果关系网络 的定制建立的广泛性发育障碍模型可以随着时间不断地进化或扩展,例如,通过引入另外 的细胞系和/或另外的合适条件。可以收集来自进化的广泛性发育障碍细胞模型的另外 的数据,即来自所述细胞模型的新增加部分的数据。然后可以将从扩展或进化的细胞模型 (即,从细胞模型的新增加部分)收集的新数据引入先前用来生成"第一代"一致因果关系 网络的数据集,以便生成更强大的"第二代"一致因果关系网络。然后可以从"第二代"一 致因果关系网络确定该广泛性发育障碍独特的新因果关系。以这种方式,细胞模型的进化 提供了一致因果关系网络的演变,从而提供对于该广泛性发育障碍的调节子的新的和/或 更可靠的深入了解。
[0261] 本发明提供了包括使用环境影响剂治疗细胞的方法。"环境影响 剂"(Env-influence)为以允许人疾病环境改变、重建回或维持正常或健康环境(从而导致 正常状态)的有益方式影响或调节人的疾病环境的分子。环境影响剂包括如下定义的多维 细胞内分子(MIM)和表观代谢转变剂(Epi-shifter)。MIM和表面代谢转变剂进一步详细 地描述于US 12/777, 902(US 2011-0110914)中,其整体内容通过引用明确纳入本文。
[0262] 术语"多维细胞内分子(MM) "是由身体天然产生的和/或存在于人的至少一个细 胞中的内源分子的分离形式或合成产生的形式。MIM的特征在于具有下列功能中的1个或 多个、2个或更多个、3个或更多个或全部。MIM能够进入细胞,进入细胞包括完全或部分进 入细胞,只要所述分子的生物活性部分完全进入细胞即可。MIM能够在细胞内诱导信号转 导和/或基因表达机制。MIM是多维的,因为所述分子具有治疗和载体例如药物递送作用。 MIM也是多维的,因为所述分子在疾病状态中以一种方式作用并且在正常状态中以不同方 式作用。优选地,MIM选择性作用于疾病状态的细胞,并且在正常状态的(匹配)细胞中基 本上没有作用。优选地,MM选择性地使疾病状态的细胞在表型、代谢状态、基因型、mRNA/ 蛋白质表达水平等上与正常状态的(匹配)细胞更接近。
[0263] 在一个实施方案中,MM也是表观代谢转变剂。在另一个实施方案中,MM不是表 观代谢转变剂。本领域技术人员应理解,本发明的MM也意欲包括两种或更多种内源分子 的混合物,其中所述混合物的特征在于具有一种或多种上述功能。混合物中的内源分子以 使混合物用作MM的比率存在。
[0264] MM可以是基于脂质或基于非脂质的分子。MM的实例包括但不限于CoQKK乙酰 Co-A、棕榈酰Co-A、L-肉毒碱、氨基酸例如酪氨酸、苯丙氨酸和半胱氨酸。在一个实施方案 中,MM为小分子。在本发明的一个实施方案中,MM不是CoQlO。MM可由本领域技术人员 使用本文中详细描述的任何测定方法常规地鉴定。
[0265] 如本文中所使用的,"表观代谢转变剂"是调节从健康(或正常)状态至疾病状态 以及相反过程的的代谢转变的分子(内源或外源的),从而维持或重建人的组织、器官、系 统和/或宿主健康。表观代谢转变剂能够实现组织微环境的标准化。例如,表观代谢转变 剂包括当加入细胞或从细胞去除时能够影响细胞的微环境(例如,代谢状态)的任何分子。 本领域技术人员应理解本发明的表观代谢转变剂也意在包括两种或更多种分子的混合物, 其中所述混合物的特征在于具有上述功能的一个或多个。混合物中的分子以使混合物用作 表观代谢转变剂的比率存在。
[0266] 在一些实施方案中,所述表观代谢转变剂为酶,例如直接参与催化朽1檬酸循环中 的一个或多个反应或产生梓檬酸循环中间产物的酶,该酶的过量驱动梓檬酸循环。在一种 实施方案中,所述酶为促进克雷布斯循环的组分酶或酶复合物例如合酶或连接酶。示例性 酶包括琥珀酰CoA合酶(克雷布斯循环酶)或丙酮酸羧化酶(催化丙酮酸的可逆羧化以形 成草酰乙酸盐(OAA)(克雷布斯循环的中间产物)的连接酶)。
[0267] 在一些实施方案中,本发明的酶,例如,本文中描述的MIM或表观代谢转变剂,与 在表2-6中列出的蛋白质具有共同的活性。如本文中所使用的,短语"与表2-6中列出的蛋 白质具有共同的活性"是指一种蛋白质能够表现出与所述蛋白质至少部分相同或相似的活 性。在一些实施方案中,本发明的蛋白质表现出25%或更高的所述蛋白质的活性。在一些 实施方案中,本发明的化合物表现出高达且包含约130%的所述蛋白质的活性。在一些实 施方案中,本发明的化合物表现出约30%、31%、32%、33%、34%、35%、36%、37%、38%、 39 %,40 %,41 %,42 %,43 %,44 %,45 %,46 %,47 %,48 %,49 %,50 %,51 %,52 %,53 %, 54 %,55 %,56 %,57 %,58 %,59 %,60 %,61 %,62 %,63 %,64 %,65 %,66 %,67 %,68 %, 69 %,70 %,71 %,72 %,73 %,74 %,75 %,76 %,77 %,78 %,79 %,80 %,81 %,82 %,83 %, 84 %,85 %,86 %,87 %,88 %,89 %,90 %,91 %,92 %,93 %,94 %,95 %,96 %,97 %,98 %, 99%U00%>101%>102%U03%U04%U05%U06%U07%U08%U09%U10%>111%> 112 %、113 %、114 %、115 %、116 %、117 %、118 %、119 %、120 %、121 %、122 %、123 %、 124%、125%、126%、127%、128%、129%或130%的所述蛋白质的活性。应理解本段列出的 各个值可以被术语"约"修饰。另外,应理解本发明也要包括由本段中列出的任意两个值所 限定的任何范围。例如,在一些实施方案中,本发明的蛋白质表现也约50%至约100%的所 述蛋白质的活性。
[0268] B.数据收集
[0269] 在一般情况下,可从任何定制的广泛性发育障碍的模型系统收集两种类型的数 据。一种类型的数据(例如,第一数据集,第三数据集)通常涉及某些大分子的水平,如DNA、 RNA、蛋白质、脂质等。此类别的示例性数据集是蛋白质组学数据(例如,涉及来自样本的所 有或基本上所有可测量蛋白质的表达的定性和定量数据)。另一类型的可任选被收集的数 据是功能数据(例如,任选的第二数据集,第四数据集),其反映了第一类型数据中的变化 导致的表型改变。
[0270] 对于所述第一数据集,在一些示例性的实施方式中,进行定量聚合酶链反应 (qPCR)和蛋白质组学分析来通过定量聚合酶链反应(qPCR)和蛋白质组学确定细胞mRNA和 蛋白质表达的变化的特征。可以使用市售的RNA分离试剂盒分离总RNA。cDNA合成后,可 以使用用于疾病区域或细胞过程,如血管生成、细胞凋亡和糖尿病,的特定市售qPCR阵列 (例如,那些购自SA Biosciences的),按照制造商的说明来确定一组预定的基因的特征。 例如,Biorad CFX-384扩增系统可用于所有的转录谱分析实验。数据收集(Ct)后,可以使 用如制造商的说明中列出的S Ct方法确定相对于对照的最终倍数变化。可以按后续章节 中所描述的进行蛋白质组学样品分析。
[0271] 所述方法可以采用数百个具有类似性质的样品的大规模高通量的定量蛋白质组 学分析,并提供用于确认细胞输出差异所必需的数据。
[0272] 有许多适合这一目的本领域公认的技术。下面简要地描述示例性的技术,与质谱 结合的iTRAQ分析。
[0273] 定量蛋白质组学方法是基于米用8-plex iTRAQ试剂的稳定同位素标记和用于肽 鉴别和定量的2D-LC MALDI MS/MS。使用这种技术的定量是相对的:肽和蛋白质被赋予相 对于参比样本的丰度比。多重iTRAQ实验中常用的参比样本有利于整个多重iTRAQ实验中 样本的对比。
[0274] 例如,为实施这种分析方案,可以按照制造商的建议将6个初始样品和两个对照 池样品组合成一个8-plex iTRAQ混合物。然后可以由二维液相色谱法将这一 8样品的混 合物分离,第一维度中的强阳离子交换(SCX),和第二维度中的反相HPLC,然后可以进行质 谱分析。
[0275] 本文提供了可以使用的示例性实验室程序的简要概述。
[0276] 蛋白质的提取:可以用8M尿素裂解缓冲液与蛋白酶抑制剂(Thermo Scientific Halt蛋白酶抑制剂,不含EDTA)裂解细胞,并在冰上孵育30分钟,每10分钟涡旋 ( Vertex)5秒。可以以5秒的脉冲通过超声波完成裂解。可以将细胞裂解物在HOOOXg下 离心15分钟(4°C)以除去细胞碎片。可以进行Bradford分析以确定蛋白质的浓度。取自 各个样品的IOOug蛋白质可以还原(IOmM的二硫苏糖醇(DTT),55°C,1小时)、烷基化(25mM 的碘乙酰胺,室温,30分钟)和用胰蛋白酶消化(l:25W/w,200mM三乙基碳酸氢铵(TEAB), 37°C,16 小时)。
[0277] 分泌组样品的制备:1)在一个实施方式中,可以将细胞培养在无血清培养基中: 可以通过冷冻干燥器浓缩条件化的培养基、还原(IOmM的二硫苏糖醇(DTT),55°C,1小时)、 烷基化(25mM的碘乙酰胺,在室温下,孵育30分钟)和然后用丙酮沉淀脱盐。可以用胰蛋 白酶(I: 25w/w,200mM三乙基碳酸氢铵(TEAB),37°C,16小时)消化来自浓缩的条件化培养 基的等量蛋白质。
[0278] 在一个实施方式中,细胞可以培养在含血清培养基中:可以使用3k MWCO Vivaspin柱(GE Healthcare Life Sciences)减小培养基的体积,然后可以用 IxPBS (Invitrogen)重构。可以按照制造商的说明使用带有缓冲交换的改进以优化条件培 养基应用的AlbuVoid柱(Biotech Support Group,LLC)从所有样品中耗尽血清白蛋白质。
[0279] iTRAQ 8Plex标记:可以将来自各实验组中各个胰蛋白酶消化的试样汇集在一起 以建立汇集的对照样品。可以根据制造商的方案(AB Sciex)将来自各个样品和汇集的对 照样品的相等试样用iTRAQ SPlex试剂标记。反应物可以组合,真空至干,通过添加0.1% 甲酸再悬浮,和通过LC-MS/MS进行分析。
[0280] 2D-NanoLC-MS/MS :所有的标记肽混合物可以通过在线2D-nanoLC分离并 通过电喷雾串联质谱进行分析。实验可以在与配备有纳米电喷射离子源(Thermo Electron, Bremen, Germany)的 LTQ Orbitrap Velos 质谱仪连接的 Eksigent 2D nanoLC Ultra系统上进行。
[0281] 可以将肽混合物以4μ!7分钟的流量注入5厘米SCX柱(300μπι ID,5ym, 聚SULF0ETHYL Aspartamide柱,来自PolyLC列,哥伦比亚,MD),和在10个离子交换洗 脱片段中洗脱到C18捕获柱(2.5厘米,ΙΟΟμπι ID,5ym,300埃ProteoP印II,来自New Objective, Woburn, MA)中和用H2OAXl % FA洗涤5分钟。然后可以进一步用2-45 % B (Η20/0· 1 % FA (溶剂A)和ACN/0. 1 % FA (溶剂B))梯度在15厘米熔融石英柱(75 μ m ID, 5 μ m,300 埃ProteoPepII,来自 New Objective, Woburn, MA)上以 300nL/ 分钟进行分离 120 分钟。
[0282] 可以在Orbitrap中以30, 000分辨率获得全扫描MS谱(m/z 300-2000)。可以对 于使用高能C-阱解离(HCD)的片段化顺序地分离最强的离子(最多10个)和动态排除 (dynamically exclude)30秒。可以用I. 2Da的分离宽度进行HO)。可以在分辨率为7500 的Orbitrap中扫描所产生的碎片离子。可以通过Xcalibur 2. 1用foundation L 0· 1控 制 LTQ Orbitrap Velos。
[0283] 多肽/蛋白质鉴定和定量:可以通过使用Proteome Discoverer软件(Thermo Electron)用Mascot搜索引擎对SwissProt数据库的自动数据库检索鉴别多肽和蛋白质。 检索参数可以包括对于MS公差(MS tolerance)的lOppm、对于MS2公差的(λ 02Da和完全 胰蛋白酶消化以允许最多2个缺失的裂隙。脲基甲基化(C)可以设置为固定的修饰。氧化 (M),TMT6,和脱酰胺化(NQ)可以设置为动态的修饰。肽和蛋白质的鉴定可以用Mascot显 著性阈值(P〈〇. 05)过滤。过滤器可以容许蛋白质鉴别的99%置信水平(1%FDA)。
[0284] Proteome Discoverer软件可以对报告离子应用校正因子,且如果不是所有定量 通道都存在,可以拒绝所有的定量值。可以通过平均强度的标准化获得相对蛋白质定量。
[0285] 关于第二类型的数据,在一些示例性实施方式中,广泛性发育障碍和正常模型的 生物能量学图谱可以采用Seah 〇rSeTMXF24分析仪来实现对糖酵解和氧化磷酸化成分的理 解。
[0286] 具体而言,可以将细胞以最佳密度接种在Seahorse培养板上。这些细胞可以被接 种在100 μ 1的培养基或处理溶液中并置于含5% CO2的37°C培养箱中。两小时后,当细胞 附着到24孔板上,可以添加另外的150 μ 1的培养基或处理溶液且板可留在培养温育箱内 过夜。这一两步接种程序允许细胞在培养板中均勻分布。包含氧和pH传感器的Seahorse 盒可以在37°C的无二氧化碳培养箱中在校准流体中水化过夜。通常将三个线粒体药物加 载到该盒的三个端口上。可以将寡霉素(复合体III抑制剂)、FCCP(解偶联剂)和鱼藤酮 (复合体I抑制剂)分别加载到该盒的端口 A、B和C中。可以在非缓冲的DMEM培养基中 以10倍浓度制备所有药物原液。在测定前,可以先将盒与线粒体化合物在无 CO2培养箱 中孵育约15分钟。可以在含有在正常的生长培养基中发现的浓度的葡萄糖的DMEM基非缓 冲培养基中洗涤Seahorse培养板。细胞可以用630 μ 1非缓冲培养基成层,并可以在将其 置于具有预校准盒的Seahorse仪中之前在无 CO2培养箱中平衡。可以在通过端口启动药 物注射前,将该仪器运行具有混合、等待和测量周期的三四个循环以获得基线。在引入下一 药物之前可以有两个循环。
[0287] OCR(耗氧率)和ECAR(细胞外酸化率)可以通过电极在7μ1室中记录且可以用 推靠 seahorse培养板的盒来建立。
[0288] C、数据整合与计算机樽型牛成
[0289] 一旦已获得相关的数据集,可以使用基于AI的信息学系统或平台(例如, REFS?平台)进行数据集的整合和计算机执行的统计模型的生成。例如,示例性的基 于AI的系统可以产生蛋白质相关性的基于模拟的网络作为代谢终点(ECAR/0CR)的 关键驱动子。见图4。关于REFS?系统的一些背景细节可见于Xing等,"Causal Modeling Using Network Ensemble Simulations of Genetic and Gene Expression Data Predicts Genes Involved in Rheumatoid Arthritis",PLoS Computational Biology, vol. 7, issue. 3, 1-19 (2011 年 3 月)(el00105)和 Periwal 的 7, 512, 497 号美国专 利,其中各自的全部内容以其整体明确地通过引用并入本文。在本质上,如前面所述,REFS? 系统是基于Al的系统,它采用数学算法来建立输入变量(例如,蛋白质表达水平、mRNA表 达水平以及相应的功能数据,如在Seahorse培养板上测量的0CR/ECAR值)之间的因果关 系。这个过程只基于单独的输入数据,而没有考虑之前存在的关于任何潜在的、已建立的和 /或验证的生物学关系的知识。
[0290] 特别是,本发明的平台的显著优势是,基于AI的系统是基于从细胞模型获得的数 据集,而不诉诸于或考虑涉及该生物过程的本领域中的任何现有的知识。此外,优选地,没 有统计地或人为地切除数据点,而是所有获得的数据被送入用于确定蛋白质相关性的AI 系统中。因此,从平台产生的所得统计模型是无偏的,因为他们不考虑任何已知的生物学关 系。
[0291] 具体来说,可以将来自蛋白质组学和ECAR/0CR的数据输入到基于AI的信息系统 中,其如上所述地基于数据关联构建统计模型。然后使用以下方法对各种疾病与正常情况 (包括处理和条件)得到蛋白质相关性的基于模拟的网络。
[0292] 在下面相对于图5呈现用于构建生成的(例如,优化或进化的)网络的示例性过 程的详细描述。如上所述,将来自蛋白质组学的数据和任选的功能细胞数据输入到基于AI 的系统中(步骤210)。预处理输入数据(其可能是原始数据或最低处理的数据),其可以 包括标准化(例如,使用分位函数或内部标准)(步骤212)。预处理还可以包括输入缺失的 数据值(例如,通过使用K最近邻(K-NN)算法)(步骤212)。
[0293] 预处理的数据用来构建网络片段文库(步骤214)。网络片段定义测量的变量(输 入数据)的所有可能的小集合(如2-3个成员集合或2-4个成员集合)之间的定量的、连续 的关系。在片段中变量之间的关系的关系可以是线性的、逻辑的、多项的、显性或隐性纯合 的等。各个片段中的关系被分配反映候选关系可能如何给予输入数据的贝叶斯概率得分, 且还对于其数学复杂性而惩罚该关系。通过为从输入数据推断的所有可能的成对和三元关 系(且在一些实施方式中,还有四元关系)评分,可以识别文库中最有可能的片段(很可能 片段)。也基于输入的数据计算关系的定量参数并对于各个片段进行储存。可以在片段列 举中使用各种模型类型,包括但不限于线性回归、逻辑回归分析、(方差分析)ANOVA模型、 (协方差分析MNCOVA模型、非线性/多项式回归模型和甚至非参数回归。对模型参数的先 验假定可以假设与模型中使用的参数的数目相关的Gull分布或贝叶斯信息标准(BIC)罚 分。在网络推论过程中,从片段文库中的片段子集构建在一套初始试验网络中的各个网络。 该套初始试验网络中的各个初始试验网络用片段文库中不同片段子集构建(步骤216)。
[0294] 构成贝叶斯网络和网络片段的基础的数学表达式的概述介绍如下,其基于 Xing 等,"Causal Modeling Using Network Ensemble Simulations of Genetic and Gene Expression Data Predicts Genes Involved in Rheumatoid Arthritis,,'PLoS Computational Biology, vol. 7, issue. 3, 1-19(2011年 3 月)(el00105)。
[0295] 具有随机变量X = X1, K,XJ^多元系统可以以多元概率分布函数P(X1; Κ,Χη;θ) 为特征,其包括了大量的参数Θ。该多元概率分布函数可以分解为因数并由局部条件概率 分布的积表不:

【权利要求】
1. 一种评估受试者是否患有广泛性发育障碍的方法,该方法包括: (1) 确定表2-6中所列的一种或多种标志物在从所述受试者获得的生物学样品中的表 达水平,其中使用试剂转化该标志物以使该标志物可检测; (2) 将从受试者获得的生物学样品中所述一种或多种标志物的表达水平与对照样品中 所述一种或多种标志物的表达水平进行比较;和 (3) 评估受试者是否患有广泛性发育障碍,其中,在从受试者获得的生物学样品中所述 一种或多种标志物的表达水平相对于对照样品中所述一种或多种标志物的表达水平的调 节是所述受试者患有广泛性发育障碍的指示。
2. -种预测受试者是否倾向于发展出广泛性发育障碍的方法,该方法包括: (1) 确定表2-6中所列的一种或多种标志物在从受试者获得的生物学样品中的表达水 平,其中使用试剂转化该标志物以使该标志物可检测; (2) 将从受试者获得的生物学样品中所述一种或多种标志物的表达水平与对照样品中 所述一种或多种标志物的表达水平进行比较;和 (3) 预测受试者是否倾向于发展出广泛性发育障碍,其中,在从受试者获得的生物学样 品中所述一种或多种标志物的表达水平相对于对照样品中所述一种或多种标志物的表达 水平的调节是所述受试者倾向于发展出广泛性发育障碍的指示。
3. -种预测受试者广泛性发育障碍的严重程度的方法,该方法包括: (1) 确定表2-6中所列的一种或多种标志物在从受试者获得的生物学样品中的表达水 平,其中使用试剂转化该标志物以使该标志物可检测; (2) 将从受试者获得的生物学样品中所述一种或多种标志物的表达水平与对照样品中 所述一种或多种标志物的表达水平进行比较;和 (3) 评估受试者的广泛性发育障碍的严重程度,其中,在从受试者获得的生物学样品中 所述一种或多种标志物的表达水平相对于对照样品中所述一种或多种标志物的表达水平 的调节是所述受试者的广泛性发育障碍严重程度的指示。
4. 一种监测受试者中广泛性发育障碍或广泛性发育障碍症状的进展的方法,该方法包 括: (1) 确定第一次从受试者获得的第一生物学样品中存在的表2-6中所列的一种或多种 标志物的表达水平,其中使用试剂转化该标志物以使该标志物可检测; (2) 确定晚些时候第二次从受试者获得的第二生物学样品中存在的表2-6中所列的一 种或多种标志物的表达水平,其中使用试剂转化该标志物以使该标志物可检测; (3) 将表2 - 6中列出的一种或多种标志物在第一次获自受试者的第一样品中的表达 水平与所述一种或多种标志物在晚些时候第二次获自受试者的第二样品中的表达水平进 行比较;以及 (4) 监测广泛性发育障碍的进展,其中所述一种或多种标志物在第二样品中相比于在 第一样品中的表达水平的调节是受试者广泛性发育障碍或广泛性发育障碍症状的进展的 指示。
5. 权利要求1-4中任一项所述的方法,还包括为被鉴定患有广泛性发育障碍的或易于 发展出广泛性发育障碍的受试者选择治疗方案。
6. 权利要求1-5任一项的方法,还包括向被鉴定患有广泛性发育障碍的或易于发展出 广泛性发育障碍的受试者给药治疗方案。
7. 权利要求4的方法,还包括向广泛性发育障碍的进展被确认为减少、延迟或减轻的 受试者继续给药的持续治疗方案。
8. -种评估用于治疗受试者的广泛性发育障碍或广泛性发育障碍的症状的治疗方案 的效果的方法,该方法包括: (1) 在向受试者给药至少一部分治疗方案之前,确定表2-6中所列的一种或多种标志 物在从受试者获得的第一生物学样品中存在的表达水平,其中使用转化标志物的试剂以使 所述标志物可被检测; (2) 在向受试者给药至少一部分治疗方案之后,确定表2-6中所列的一种或多种标志 物存在于获自所述受试者的第二生物学样品的表达水平,其中使用试剂转化标志物以使该 标志物可被检测; (3) 比较向受试者给药至少一部分治疗方案之前,表2-6中所列的一种或多种标志物 存在于获自该受试者的第一样品中的表达水平与向受试者给药至少一部分治疗方案之后, 表2-6中所列的一种或多种标志物存在于获自所述受试者的第二生物学样品的表达水平; 以及 (4) 评估治疗方案对于治疗广泛性发育障碍或广泛性发育障碍的症状是否有效,其中 一种或多种标志物在第二样品中的表达水平较之于在第一样品中的表达水平的调节是治 疗方案对于治疗广泛性发育障碍或广泛性发育障碍的症状有效的指示。
9. 权利要求8所述的方法,还包括向所述给药方案被确定为对于治疗广泛性发育障碍 或广泛性发育障碍的症状有效的受试者连续给药该治疗方案,或者中止对所述给药方案被 确定为对于治疗其广泛性发育障碍或广泛性发育障碍的症状无效的受试者给药该治疗方 案。
10. -种鉴定用于治疗受试者的广泛性发育障碍或广泛性发育障碍的症状的化合物的 方法,该方法包括: (1) 将生物学样品与测试化合物接触; (2) 确定一种或多种表2-6中所列的生物标志物存在于该生物学样品中的表达水平; (3) 将所述一种或多种标志物在该生物学样品中的表达水平与未接触测试化合物的对 照样品中的表达水平比较;以及 (4) 选择调节该一种或多种生物标志物在生物学样品中的表达水平的测试化合物, 由此鉴定用于治疗受试者广泛性发育障碍或广泛性发育障碍的症状的化合物。
11. 权利要求1-10任一项的方法,其中所述广泛性发育障碍是自闭症谱系障碍。
12. 权利要求1-10任一项的方法,其中所述广泛性发育障碍是孤独症。
13. 权利要求1-10任一项的方法,其中所述广泛性发育障碍是阿尔茨海默病。
14. 权利要求1-10任一项的方法,其中所述广泛性发育障碍是自闭症和阿尔茨海默 病。
15. 权利要求1-10任一项的方法,其中所述广泛性发育障碍是艾斯伯格症候群。
16. 权利要求1-10任一项的方法,其中所述广泛性发育障碍是广泛发育障碍非其他特 定型。
17. 权利要求1-10任一项的方法,其中所述受试者患有广泛性发育障碍。
18. 权利要求1-10任一项的方法,其中所述受试者显示出广泛性发育障碍的亚综合表 现。
19. 权利要求1-10任一项的方法,其中所述受试者疑似患有或倾向于发展出广泛性发 育障碍。
20. 权利要求1-19任一项的方法,其中所述一种或多种标志物的表达水平在核酸水平 上测定。
21. 权利要求20的方法,其中所述一种或多种标志物的表达水平通过检测RNA确定。
22. 权利要求20的方法,其中所述一种或多种标志物的表达水平通过检测mRNA、miRNA 或hnRNA确定。
23. 权利要求20的方法,其中所述一种或多种标志物的表达水平通过检测DNA确定。
24. 权利要求20的方法,其中所述一种或多种标志物的表达水平通过检测cDNA确定。
25. 权利要求20的方法,其中所述一种或多种标志物的表达水平通过使用选自聚合酶 链式反应(PCR)扩增反应、反转录PCR分析、定量反转录PCR分析、免疫印迹分析、RNAase保 护测定、数字RNA检测/定量,以及其组合或亚组合的技术确定。
26. 权利要求20的方法,其中确定所述一种或多种标志物的表达水平包括采用抗体实 施免疫测定。
27. 权利要求1-19中任一项的方法,其中所述一种或多种标志物包括蛋白质。
28. 权利要求27的方法,其中所述蛋白质使用结合所述一种或多种标志物中的至少一 种的结合蛋白来测定。
29. 权利要求27的方法,其中所述结合蛋白包括特异性结合至该蛋白的抗体或其抗原 结合片段。
30. 权利要求29的方法,其中所述抗体或其抗原结合片段选自鼠抗体、人抗体、人源 化抗体、双特异性抗体、嵌合抗体、Fab、Fab'、F(ab')2、scFv、SMIP、亲和小体、avimer、 versabody、纳体、域抗体、以及上述任一种的抗原结合片段。
31. 权利要求29的方法,其中所述抗体或其抗原结合片段包括标记物。
32. 权利要求31的方法,其中所述标记物选自放射标记物、生物素标记物、发色团、荧 光团和酶。
33. 权利要求1-32中任一项所述的方法,其中所述一种或多种标志物的表达水平通过 使用选自如下的技术来确定:免疫测定、蛋白质印迹分析、放射免疫测定、免疫荧光测定、免 疫沉淀、平衡透析、免疫扩散、电化学发光免疫测定法(ECLIA)、ELISA测定法、聚合酶链式 反应、免疫聚合酶链式反应,以及它们的组合或它们的子组合。
34. 权利要求33的方法,其中所述免疫测定包括基于溶液的免疫测定法,选自电化学 发光、化学发光、荧光化学发光、荧光偏振、以及时间分辨荧光。
35. 权利要求33的方法,其中所述免疫测定包括夹心免疫测定法,选自电化学发光,化 学发光和荧光化学发光。
36. 前述权利要求中任一项的方法,其中所述样品包括从受试者获得的体液或其组成 部分。
37. 权利要求36的方法,其中所述体液选自血液、血清、滑液、淋巴、血浆、尿液、羊水、 房水、玻璃体液、胆汁、乳汁、脑脊髓液、耳垢、乳糜、囊液、淋巴液、粪便、胃酸、胃液、粘液、乳 头吸出物、心包液、淋巴液、腹水、胸膜液、脓、唾液、皮脂、精液、汗水、血清、痰、泪液、阴道分 泌物和从活检收集的体液。
38. 前述权利要求中任一项的方法,其中所述样品包括从受试者获得的组织或细胞,或 其组成部分。
39. -种治疗、减轻症状、抑制进展、或预防受试者的广泛性发育障碍的方法,该方法包 括向有需要的受试者给药治疗有效量的包含表2-6中所列的一种或多种标志物的药物组 合物。
40. -种治疗、减轻症状、抑制进展或预防受试者的广泛性发育障碍的方法,该方法包 括向有需要的受试者给药治疗有效量的包含调节表2-6所列一种或多种标志物的表达或 活性的药剂的药物组合物。
41. 权利要求40的方法,其中所述药剂抑制表2-6中所列的一种或多种标志物的表达 或活性。
42. 权利要求40的方法,其中所述药剂增强表2-6中所列的一种或多种标志物的表达 或活性。
43. -种鉴定调节表2-6中所列的一种或多种标志物的表达或活性的药剂的方法,包 括: (1) 将一种或多种标志物与测试药剂接触, (2) 检测与测试药剂接触的所述一种或多种标志物的表达或活性, (3) 将所述一种或多种与测试药剂接触的标志物的表达或活性与未接触测试试剂对照 的表达或活性相比较,以及 (4) 鉴定出调节所述一种或多种标志物的表达或活性的试剂。
44. 权利要求43的方法,其中所述药剂下调表2-6所列的一种或多种标志物中的至少 一种。
45. 权利要求44的方法,其中所述药剂上调表2-6所列的一种或多种标志物中的至少 一种。
46. -种治疗、减轻症状、抑制进展或预防受试者的广泛性发育障碍的方法,该方法包 括向有需要的受试者给药治疗有效量的包含根据权利要求43的方法鉴定出的药剂的药物 组合物。
47. 前述权利要求中任一项的方法,其中所述受试者是人类受试者。
【文档编号】C12Q1/68GK104364393SQ201380022420
【公开日】2015年2月18日 申请日期:2013年3月5日 优先权日:2012年3月5日
【发明者】N·R·纳莱恩, P·P·纳莱恩 申请人:博格有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1