用于确定药物有效性的方法和系统与流程

文档序号:36319658发布日期:2023-12-08 15:34阅读:190来源:国知局
用于确定药物有效性的方法和系统与流程


背景技术:

1、评价药物的在靶和脱靶的能力可能给治疗应用带来希望。然而,这可能是一项具有挑战性的任务,并且可能需要用于每个感兴趣的靶基因的广泛、时间密集的实验测定和动物模型。此外,可以评价使用药物(诸如,治疗抑制剂)的治疗靶向在患有疾病或病症的对象中的有效性。


技术实现思路

1、本文认识到需要用于评价药物的在靶和脱靶的改进方法,药物的在靶和脱靶可能影响药物的有效性。此类药物可能与某些适合于治疗靶向的基因组区域相关联。本文提供的方法和系统可以显著增加确定药物的在靶和脱靶的效率、准确性和/或通量。此类方法和系统可以利用某些基因组区域的鉴定以用于治疗靶向。

2、本公开内容提供了用于评价药物的在靶和脱靶的方法和系统。此类药物可能与靶基因组区域相关联。例如,本发明技术涉及药物候选物的高通量筛选,其可以利用高含量、高效率且高通量的crispr(成簇的规律间隔的短回文重复序列)筛选技术,用于鉴定可能被选择为有效治疗靶标的相关靶基因。这些筛选可以利用合适的算法来比较用于通过crispr靶向的每个基因的药物的单细胞转录组指纹。本公开内容的方法和系统可以至少部分地基于选择性修饰细胞的靶基因组区域的能力的量化作为选择与感兴趣的疾病适应症有关的生物标志物和治疗靶标的基础,来快速且准确地评价药物的在靶和脱靶。此类方法和系统可以包括通过将药物指纹与通过靶向必需基因(例如,rpa1)的crispr所生成的毒性指纹进行比较来选择具有高治疗指数的药物。

3、选择性修饰细胞的靶基因组区域以改变它们的细胞状态(例如,通过将细胞从一个分化状态转化为另一个分化状态)的能力可能给治疗应用带来希望。然而,尽管有选择性修饰细胞状态(例如,通过细胞重编程)的希望,但对于许多治疗相关的应用来说,鉴定可能介导一种细胞状态向另一种细胞状态转变的遗传驱动因子仍具有挑战性。例如,重编程的表型可能是复杂的,并且可能涉及许多基因以分级的、非线性的方式相互作用。区分这些基因在给定过程中是因果还是相关可能是一项具有挑战性的任务,并且可能需要用于每个感兴趣基因的广泛、时间密集的实验测定和动物模型。此外,可以评价使用药物(诸如,治疗抑制剂)的治疗靶向在患有疾病或病症的对象中的有效性。

4、本文还认识到需要用于确定药物的有效性的改良方法。此类药物可以与适合于治疗靶向的某些基因组区域(例如,可以促进细胞从一种表型状态向另一种表型状态的重编程的基因组区域)相关联。本文提供的方法和系统可以显著增加确定药物的有效性的效率、准确性和/或通量。此类方法和系统可以利用某些基因组区域的鉴定以实现治疗靶向。

5、本公开内容还提供了用于确定药物的有效性的方法和系统。此类药物可以与细胞的靶基因组区域相关联,所述细胞可以经选择性修饰以改变它们的细胞状态(例如,通过细胞从一个分化状态向另一个分化状态的转录重编程)。例如,本发明技术涉及药物候选物的高通量筛选,其可以利用高含量、高效率且高通量的crispr(成簇的规律间隔的短回文重复序列)筛选技术,用于鉴定可能介导表型不同细胞状态之间的重编程和/或被选为有效治疗靶标的相关靶基因。这些筛选可以利用异常检测模型将重编程量化为经由crispr靶向的每个基因的可测量表型。本公开内容的方法和系统可以至少部分地基于选择性修饰细胞的靶基因组区域(例如,通过细胞重编程)的能力的量化作为选择与感兴趣的疾病适应症有关的生物标志物和治疗靶标的基础,有效地确定药物的有效性。

6、在一个方面中,本公开内容提供了一种用于确定药物的有效性的方法,其包括:(a)生成一种细胞类型的多个患病细胞和多个正常细胞的核酸序列数据的潜在空间表示,其中所述潜在空间代表所述细胞类型的多个表型状态;(b)至少部分地基于所述潜在空间的拓扑,鉴定促进所述细胞类型从所述多个表型状态中的第一表型状态重编程到第二表型状态的基因组区域;(c)将所述细胞类型的第一细胞的序列数据映射到所述潜在空间以产生第一潜在空间表示,其中所述第一细胞已经从所述第一表型状态重编程到所述第二表型状态;(d)将所述细胞类型的第二细胞的序列数据映射到所述潜在空间以产生第二潜在空间表示,其中所述第二细胞已经暴露于所述药物,并且其中在所述第二细胞暴露于所述药物之前,所述第二细胞表现出所述第一表型状态;以及(e)至少部分地基于所述第一潜在空间表示和所述第二潜在空间表示,确定所述药物的所述有效性。

7、在一些实施方案中,(a)包括使用监督降维算法以生成所述潜在空间表示。在一些实施方案中,所述监督降维算法是统一流形逼近与投影(umap)算法。在一些实施方案中,所述监督降维算法是t分布随机近邻嵌入(t-sne)算法。在一些实施方案中,所述监督降维算法是可变自编码器。在一些实施方案中,(b)包括对所述潜在空间进行非线性细胞轨迹重建,以构建所述第一表型状态与所述第二表型状态之间的推断最大似然进展轨迹。在一些实施方案中,进行所述非线性细胞轨迹重建包括将反向图嵌入算法应用于所述潜在空间。

8、在一些实施方案中,所述第一表型状态是癌症,并且所述第二表型状态是野生型状态。在一些实施方案中,所述第二表型状态是中间状态。在一些实施方案中,所述中间状态是成纤维细胞状态或祖细胞状态。在一些实施方案中,所述第一细胞已经使用基因编辑从所述第一表型状态重编程到所述第二表型状态。在一些实施方案中,所述基因编辑使用选自以下的基因编辑单元进行:crispr(例如,活性cas9)系统、crispri(例如,crispr干扰,与转录阻遏肽(包括krab)融合的催化失活的cas9)系统、crispra(例如,crispr激活,与转录激活肽(包括vpr(hiv病毒蛋白r))融合的催化失活的cas9)系统、rnai系统和shrna系统。

9、在一些实施方案中,(e)包括测量(i)所述第一细胞的所述潜在空间表示从所述编辑的移动,和(ii)所述第二细胞的所述潜在空间表示从所述暴露于所述药物的移动;以及在数学上将(i)与(ii)相联系。在一些实施方案中,所述测量包括使用监督学习算法。在一些实施方案中,所述监督学习算法是支持向量机、随机森林、逻辑回归、贝叶斯分类器或卷积神经网络。

10、在一些实施方案中,所述方法还包括:将所述细胞类型的多个额外细胞的核酸序列数据映射到所述潜在空间,其中所述多个额外细胞中的每个细胞都已经暴露于多种药物中的相应药物;至少部分地基于所述第一细胞的所述潜在空间表示和所述多个额外细胞的潜在空间表示,确定每种药物的有效性;以及至少部分地基于每种药物的所述有效性,电子输出所述多种药物的排序。在一些实施方案中,所述药物选自:化合物(例如,小分子)、抑制剂(例如,小分子抑制剂)和抗体。

11、在一些实施方案中,所述细胞类型的所述第一细胞的所述序列数据和所述细胞类型的所述第二细胞的所述序列数据中的至少一个是通过单细胞测序生成的。在一些实施方案中,所述细胞类型的所述第一细胞的所述序列数据和所述细胞类型的所述第二细胞的所述序列数据中的至少一个是通过顺序单细胞测序生成的。

12、在另一方面中,本公开内容提供了一种用于确定药物的有效性的方法,其包括:(a)生成一种细胞类型的多个患病细胞和多个正常细胞的核酸序列数据的潜在空间表示,其中所述潜在空间代表所述细胞类型的多个表型状态;(b)至少部分地基于所述潜在空间的拓扑,鉴定所述细胞类型的靶基因组区域;(c)将所述细胞类型的第一细胞的序列数据映射到所述潜在空间以产生第一潜在空间表示,其中所述第一细胞的所述靶基因组区域已经被修饰,并且其中所述第一细胞在所述修饰之前表现出第一表型状态;(d)将所述细胞类型的第二细胞的序列数据映射到所述潜在空间以产生第二潜在空间表示,其中所述第二细胞已经暴露于所述药物,并且其中在所述第二细胞暴露于所述药物之前,所述第二细胞表现出所述第一表型状态;以及(e)至少部分地基于所述第一潜在空间表示和所述第二潜在空间表示,确定所述药物的所述有效性。

13、在一些实施方案中,(a)包括使用监督降维算法以生成所述潜在空间表示。在一些实施方案中,所述监督降维算法是统一流形逼近与投影(umap)算法。在一些实施方案中,所述监督降维算法是t分布随机近邻嵌入(t-sne)算法。在一些实施方案中,所述监督降维算法是可变自编码器。

14、在一些实施方案中,所述第一表型状态是癌症。在一些实施方案中,所述第一表型状态是中间状态。在一些实施方案中,所述中间状态是成纤维细胞状态或祖细胞状态。

15、在一些实施方案中,(e)包括测量(i)所述第一细胞的所述潜在空间表示从所述修饰的移动,和(ii)所述第二细胞的所述潜在空间表示从所述暴露于所述药物的移动;以及在数学上将(i)与(ii)相联系。在一些实施方案中,所述测量包括使用监督学习算法。在一些实施方案中,所述监督学习算法是支持向量机、随机森林、逻辑回归、贝叶斯分类器或卷积神经网络。

16、在一些实施方案中,所述方法还包括:将所述细胞类型的多个额外细胞的核酸序列数据映射到所述潜在空间,其中所述多个额外细胞中的每个细胞都已经暴露于多种药物中的相应药物;至少部分地基于所述第一细胞的所述潜在空间表示和所述多个额外细胞的潜在空间表示,确定每种药物的有效性;以及至少部分地基于每种药物的所述有效性,电子输出所述多种药物的排序。在一些实施方案中,所述药物选自:化合物(例如,小分子)、抑制剂(例如,小分子抑制剂)和抗体。

17、在一些实施方案中,所述细胞类型的所述第一细胞的所述序列数据和所述细胞类型的所述第二细胞的所述序列数据中的至少一个是通过单细胞测序生成的。在一些实施方案中,所述细胞类型的所述第一细胞的所述序列数据和所述细胞类型的所述第二细胞的所述序列数据中的至少一个是通过顺序单细胞测序生成的。

18、在一些实施方案中,(c)中的修饰包括使用基因编辑单元。在一些实施方案中,基因编辑是用选自crispr系统、crispri系统、crispra系统、rnai系统和shrna系统的基因编辑单元进行的。在一些实施方案中,(c)中的修饰包括使用靶向靶基因组区域的至少一部分的单向导rna(sgrna)。在一些实施方案中,(e)包括将所述第一潜在空间表示与所述第二潜在空间表示进行比较。在一些实施方案中,(e)包括至少部分地基于确定所述第一潜在空间表示与在靶潜在空间表示的最大相似性或所述第一潜在空间表示与脱靶潜在空间表示的最小相似性,确定所述药物的所述有效性。

19、在另一方面中,本公开内容提供了一种用于确定药物的有效性的系统,其包括:数据库,其包括一种细胞类型的多个患病细胞和多个正常细胞的核酸序列数据;和一个或多个计算机处理器,其被单独或共同编程以:(i)生成所述核酸序列数据的潜在空间表示,其中所述潜在空间代表所述细胞类型的多个表型状态;(ii)至少部分地基于所述潜在空间的拓扑,鉴定促进所述细胞类型从所述多个表型状态中的第一表型状态重编程到第二表型状态的基因组区域;(iii)将所述细胞类型的第一细胞的序列数据映射到所述潜在空间以产生第一潜在空间表示,其中所述第一细胞已经从所述第一表型状态重编程到所述第二表型状态;(iv)将所述细胞类型的第二细胞的序列数据映射到所述潜在空间以产生第二潜在空间表示,其中所述第二细胞已经暴露于所述药物,并且其中在所述第二细胞暴露于所述药物之前,所述第二细胞表现出所述第一表型状态;以及(v)至少部分地基于所述第一潜在空间表示和所述第二潜在空间表示,确定所述药物的所述有效性。

20、在另一方面中,本公开内容提供了一种非暂时性计算机可读介质,其包括机器可执行代码,所述机器可执行代码在被一个或多个计算机处理器执行时,实现一种用于确定药物的有效性的方法,所述方法包括:(a)生成一种细胞类型的多个患病细胞和多个正常细胞的核酸序列数据的潜在空间表示,其中所述潜在空间代表所述细胞类型的多个表型状态;(b)至少部分地基于所述潜在空间的拓扑,鉴定促进所述细胞类型从所述多个表型状态中的第一表型状态重编程到第二表型状态的基因组区域;(c)将所述细胞类型的第一细胞的序列数据映射到所述潜在空间以产生第一潜在空间表示,其中所述第一细胞已经从所述第一表型状态重编程到所述第二表型状态;(d)将所述细胞类型的第二细胞的序列数据映射到所述潜在空间以产生第二潜在空间表示,其中所述第二细胞已经暴露于所述药物,并且其中在所述第二细胞暴露于所述药物之前,所述第二细胞表现出所述第一表型状态;以及(e)至少部分地基于所述第一潜在空间表示和所述第二潜在空间表示,确定所述药物的所述有效性。

21、在另一方面中,本公开内容提供了一种用于确定药物的有效性的系统,其包括:数据库,其包括一种细胞类型的多个患病细胞和多个正常细胞的核酸序列数据;和一个或多个计算机处理器,其被单独或共同编程以:(i)生成所述核酸序列数据的潜在空间表示,其中所述潜在空间代表所述细胞类型的多个表型状态;(ii)至少部分地基于所述潜在空间的拓扑,鉴定所述细胞类型的靶基因组区域;(iii)将所述细胞类型的第一细胞的序列数据映射到所述潜在空间以产生第一潜在空间表示,其中所述第一细胞的所述靶基因组区域已经被修饰,并且其中所述第一细胞在所述修饰之前表现出第一表型状态;(iv)将所述细胞类型的第二细胞的序列数据映射到所述潜在空间以产生第二潜在空间表示,其中所述第二细胞已经暴露于所述药物,并且其中在所述第二细胞暴露于所述药物之前,所述第二细胞表现出所述第一表型状态;以及(v)至少部分地基于所述第一潜在空间表示和所述第二潜在空间表示,确定所述药物的所述有效性。

22、在另一方面中,本公开内容提供了一种非暂时性计算机可读介质,其包括机器可执行代码,所述机器可执行代码在被一个或多个计算机处理器执行时,实现一种用于确定药物的有效性的方法,所述方法包括:(a)生成一种细胞类型的多个患病细胞和多个正常细胞的核酸序列数据的潜在空间表示,其中所述潜在空间代表所述细胞类型的多个表型状态;(b)至少部分地基于所述潜在空间的拓扑,鉴定所述细胞类型的靶基因组区域;(c)将所述细胞类型的第一细胞的序列数据映射到所述潜在空间以产生第一潜在空间表示,其中所述第一细胞的所述靶基因组区域已经被修饰,并且其中所述第一细胞在所述修饰之前表现出第一表型状态;(d)将所述细胞类型的第二细胞的序列数据映射到所述潜在空间以产生第二潜在空间表示,其中所述第二细胞已经暴露于所述药物,并且其中在所述第二细胞暴露于所述药物之前,所述第二细胞表现出所述第一表型状态;以及(e)至少部分地基于所述第一潜在空间表示和所述第二潜在空间表示,确定所述药物的所述有效性。

23、本公开内容的另一方面提供了一种包括机器可执行代码的非暂时性计算机可读介质,所述机器可执行代码在被一个或多个计算机处理器执行时,实现上述或本文其他地方的任何方法。

24、本公开内容的另一方面提供了一种系统,其包括一个或多个计算机处理器和耦合到其上的计算机存储器。计算机存储器包括机器可执行代码,所述机器可执行代码在被一个或多个计算机处理器执行时,实现上述或本文其他地方的任何方法。

25、根据以下具体实施方式,本公开内容的另外的方面和优点对于本领域技术人员将容易地变得清楚,在以下具体实施方式中仅示出和描述了本公开内容的说明性实施方案。如将会理解的,本公开内容文本能够有其他的和不同的实施方案,并且其若干细节能够在各个明显的方面进行修改,这些都不背离本公开内容文本。相应地,附图和说明书应当被看作是说明性质的,而不是限制性的。

26、援引并入

27、本说明书中所提到的所有出版物、专利和专利申请都通过引用并入本文,并入程度如同指示每个单独出版物、专利或专利申请明确且单独地通过引用并入一般。就通过引用并入的出版物和专利或专利申请与本说明书中包含的公开文本相矛盾而言,本说明书旨在取代和/或优先于任何这种矛盾的材料。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1