本公开总体上涉及分子条形码编码的领域,并更具体地涉及鉴定和校正噪声细胞标记。
背景技术:
1、如随机条形码化的方法和技术对于细胞分析有用,特别是使用例如逆转录、聚合酶链反应(pcr)扩增、和下一代测序(ngs)以解密基因表达谱来确定细胞的状态。然而,这些方法和技术可能引入误差,如果不校正的话,可能导致估计过高的细胞计数。
技术实现思路
1、本文中公开了用于鉴定信号细胞标记的方法。在一些实施例中,该方法包括:(a)使用多个条形码(例如随机条形码)使细胞样品中的多个靶条形码化(例如随机条形码化)以创造多个经条形码化的靶(例如经随机条形码化的靶),其中该多个条形码的每个包含细胞标记和分子标记;(b)获得该多个经条形码化的靶的测序数据;(c)确定与该多个条形码的细胞标记中的每个相关联的具有不同序列的分子标记的数目;(d)基于与细胞标记中的每个相关联的具有不同序列的分子标记的数目,确定该多个条形码的细胞标记中的每个的等级;(e)基于(c)中确定的与细胞标记中的每个相关联的具有不同序列的分子标记的数目和(d)中确定的细胞标记中的每个的等级,生成累积和图;(f)生成该累积和图的二阶导数图;(g)确定该累积和图的二阶导数图的最小值,其中该二阶导数图的最小值对应于细胞标记阈值;和(h)基于(c)中确定的与细胞标记中的每个相关联的具有不同序列的分子标记的数目和(g)中确定的细胞标记阈值,将细胞标记中的每个鉴定为信号细胞标记或噪声细胞标记。
2、在一些实施例中,该方法包括,如果在(h)中将多个条形码的细胞标记鉴定为噪声细胞标记,则从(b)中获得的测序数据中去除与该鉴定的细胞标记相关的测序信息。该方法可以包括,如果与多个靶中的靶相关联的具有不同序列的分子标记的数目高于分子标记出现阈值的话,则从(b)中获得的测序数据中去除与多个靶中的该靶相关联的具有不同序列的分子标记相关的测序信息。
3、在一些实施例中,其中(c)中确定与细胞标记中的每个相关联的具有不同序列的分子标记的数目包括,从测序数据中除去与细胞标记中的每个相关联的非独特分子标记相关的测序信息。累积和图可以是对数-对数图。对数-对数图可以是log10-log10图。
4、在一些实施例中,基于(c)中确定的与细胞标记中的每个相关联的具有不同序列的分子标记的数目和(d)中确定的细胞标记中的每个的等级来生成累积和图包括:确定细胞标记中的每个等级的累积和,其中该等级的累积和包括与更低等级的细胞标记中的每个相关联的具有不同序列的分子标记的数目的总和。生成该累积和图的二阶导数图可以包括相对于细胞标记的第一等级和细胞标记的第二等级之间的差异确定该第一等级的累积和与该第二等级的累积和之间的差异。该第一等级和该第二等级之间的差异可以是1。
5、在一些实施例中,最小值是全局最小值。确定二阶导数图的最小值包括确定高于与细胞标记中的每个相关联的分子标记的最小数目的阈值的二阶导数图的最小值。
6、在一些实施例中,与细胞标记中的每个相关联的分子标记的最小数目的阈值是百分位阈值。与细胞标记中的每个相关联的分子标记的最小数目的阈值是基于细胞样品中的细胞数目确定的。
7、在一些实施例中,确定二阶导数图的最小值包括确定低于与细胞标记中的每个相关联的分子标记的最大数目的阈值的二阶导数图的最小值。与细胞标记中的每个相关联的分子标记的最大数目的阈值可以是百分位阈值。与细胞标记中的每个相关联的分子标记的最大数目的阈值可以是基于细胞样品中的细胞数目确定的。
8、在一些实施例中,如果(c)中确定的与细胞标记中的每个相关联的具有不同序列的分子标记的数目大于细胞标记阈值,则将细胞标记中的每个鉴定为信号细胞标记。如果(c)中确定的与细胞标记中的每个相关联的具有不同序列的分子标记的数目不大于细胞标记阈值,则可以将细胞标记中的每个鉴定为噪声细胞标记。
9、在一些实施例中,该方法包括:(i)对于该多个靶中的一个或多个:(1)对该测序数据中与该靶相关联的具有不同序列的分子标记的数目进行计数;和(2)基于(1)中计数的测序数据中与该靶相关联的具有不同序列的分子标记的数目,估算该靶的数目。
10、本文中公开了用于确定信号细胞标记的方法。在一些实施例中,该方法包括:(a)获得多个经条形码化的靶(例如经随机条形码化的靶)的测序数据,其中使用多个条形码(例如随机条形码)使细胞样品中的多个靶条形码化(例如随机条形码化)来创建该多个经条形码化的靶,且其中该多个条形码的每个包括细胞标记和分子标记;(b)基于与该多个经条形码化的靶(或条形码)的细胞标记中的每个相关联的具有不同序列的分子标记的数目,确定该多个经条形码化的靶(或条形码)的细胞标记中的每个的等级;(c)基于与细胞标记中的每个相关联的具有不同序列的分子标记的数目和(b)中确定的该多个经条形码化的靶(或条形码)中细胞标记中的每个的等级,确定细胞标记阈值;以及基于与细胞标记中的每个相关联的具有不同序列的分子标记的数目和(c)中确定的细胞标记阈值,将细胞标记中的每个鉴定为信号细胞标记或噪声细胞标记。
11、在一些实施例中,该方法包括确定与细胞标记中的每个相关联的具有不同序列的分子标记的数目。确定与细胞标记中的每个相关联的具有不同序列的分子标记的数目可包括从测序数据中除去与细胞标记中的每个相关联的非独特分子标记相关的测序信息。
12、在一些实施例中,基于与多个经条形码化的靶中细胞标记中的每个相关联的具有不同序列的分子标记的数目确定细胞标记阈值包括:确定等级n的细胞标记的累积和以及下一等级n+1的细胞标记的累积和中具有最大变化的细胞标记,其中与该细胞标记相关联的具有不同序列的分子标记的数目对应于细胞标记阈值。
13、在一些实施例中,基于与多个经条形码化的靶中细胞标记中的每个相关联的具有不同序列的分子标记的数目和(b)中确定的多个经条形码化的靶的细胞标记中的每个的等级确定细胞标记阈值包括:确定细胞标记中的每个等级的累积和,其中该等级的累积和包括与更低等级的细胞标记中的每个相关联的具有不同序列的分子标记的数目的总和;以及确定在等级n的累积和和下一等级n+1的累积和中具有最大变化的细胞标记的等级n,其中在累积和以及下一等级n+1的累积和中具有最大变化的细胞标记的等级n对应于细胞标记阈值。
14、在一些实施例中,基于与多个经条形码化的靶中细胞标记中的每个相关联的具有不同序列的分子标记的数目和(b)中确定的多个经条形码化的靶的细胞标记中的每个的等级确定细胞标记阈值包括:基于与细胞标记中的每个相关联的具有不同序列的分子标记的数目和(b)中确定的细胞标记中的每个的等级,生成累积和图;生成该累积和图的二阶导数图;以及确定该累积和图的二阶导数图的最小值,其中该二阶导数图的最小值对应于细胞标记阈值。基于与细胞标记中的每个相关联的具有不同序列的分子标记的数目和(b)中确定的细胞标记中的每个的等级生成累积和图可包括:确定细胞标记中的每个等级的累积和,其中该等级的累积和包括与更低等级的细胞标记中的每个相关联的具有不同序列的分子标记的数目的总和。生成该累积和图的二阶导数图可以包括相对于细胞标记的第一等级和细胞标记的第二等级之间的差异确定该第一等级的累积和与该第二等级的累积和之间的差异。
15、在一些实施例中,第一等级和第二等级之间的差异是1。在一些实施例中,该方法包括,如果在(d)中将多个经条形码化的靶的细胞标记鉴定为噪声细胞标记,则从(a)中获得的测序数据中去除与该鉴定的细胞标记相关的测序信息。该方法可以包括,如果与多个靶中的靶相关联的具有不同序列的分子标记的数目高于分子标记出现阈值的话,则从(a)中获得的测序数据中去除与多个靶中的该靶相关联的具有不同序列的分子标记相关的测序信息。累积和图可以是对数-对数图。对数-对数图可以是log10-log10图。
16、在一些实施例中,最小值是全局最小值。确定二阶导数图的最小值可包括确定二阶导数图的最小值高于与细胞标记中的每个相关联的分子标记的最小数目的阈值。与细胞标记中的每个相关联的分子标记的最小数目的阈值可以是百分位阈值。与细胞标记中的每个相关联的分子标记的最小数目的阈值可以是基于细胞样品中的细胞数目确定的。
17、在一些实施例中,确定二阶导数图的最小值包括确定低于与细胞标记中的每个相关联的分子标记的最大数目的阈值的二阶导数图的最小值。与细胞标记中的每个相关联的分子标记的最大数目的阈值可以是百分位阈值。与细胞标记中的每个相关联的分子标记的最大数目的阈值可以是基于细胞样品中的细胞数目确定的。
18、在一些实施例中,如果(c)中确定的与细胞标记中的每个相关联的具有不同序列的分子标记的数目大于细胞标记阈值,则将细胞标记中的每个鉴定为信号细胞标记。如果(c)中确定的与细胞标记中的每个相关联的具有不同序列的分子标记的数目不大于细胞标记阈值,则可以将细胞标记中的每个鉴定为噪声细胞标记。
19、在一些实施例中,该方法包括:(e)对于该多个靶中的一个或多个:(1)对该测序数据中与该靶相关联的具有不同序列的分子标记的数目进行计数;和(2)基于(1)中计数的测序数据中与该靶相关联的具有不同序列的分子标记的数目,估算该靶的数目。
20、本文中公开了用于鉴定信号细胞标记的实施例。在一些实施例中,该方法包括:(a)获得细胞的多个靶的测序数据,其中每个靶跟与多个细胞标记中的每个细胞标记相关联的具有不同序列的分子标记的数目相关;(b)基于与细胞标记中的每个相关联的具有不同序列的分子标记的数目,确定细胞标记阈值;以及(c)基于与细胞标记中的每个相关联的具有不同序列的分子标记的数目和细胞标记阈值,将细胞标记中的每个鉴定为信号细胞标记或噪声细胞标记。
21、在一些实施例中,获得测序数据包括:使用多个条形码使细胞的多个靶条形码化,以创建多个经条形码化的靶,其中该多个条形码中的每个包括多个细胞标记中的细胞标记、和分子标记;和确定与该多个条形码的细胞标记中的每个相关联的具有不同序列的分子标记的数目。在一些实施例中,该方法包括:对于该多个靶中的一个或多个:(1)对该测序数据中与该靶相关联的具有不同序列的分子标记的数目进行计数;和(2)基于(1)中计数的测序数据中与该靶相关联的具有不同序列的分子标记的数目,估算该靶的数目。该方法可包括,如果该多个条形码的细胞标记被鉴定为噪声细胞标记:则从测序数据去除与该鉴定的细胞标记相关的测序信息。该方法可以包括:如果与多个靶中的靶相关联的具有不同序列的分子标记的数目高于分子标记出现阈值的话,则从测序数据中去除与多个靶中的该靶相关联的具有不同序列的分子标记相关的测序信息。在一些实施例中,(c)中确定与细胞标记中的每个相关联的具有不同序列的分子标记的数目包括,从测序数据中除去与细胞标记中的每个相关联的非独特分子标记相关的测序信息。
22、在一些实施例中,确定细胞标记阈值包括:确定累积和图的拐点,其中该累积和图基于与多个细胞标记中的每个相关联的具有不同序列的分子标记的数目和细胞标记中的每个的等级,并且其中该拐点对应于细胞标记阈值。确定累积和图的拐点可包括:基于与多个细胞标记中的每个相关联的具有不同序列的分子标记的数目和细胞标记中的每个的等级,生成累积和图;生成该累积和图的二阶导数图;以及确定该累积和图的二阶导数图的最小值,其中该二阶导数图的最小值对应于细胞标记阈值。确定细胞标记阈值可包括:基于与细胞标记中的每个相关联的具有不同序列的分子标记的数目,确定多个细胞标记中的每个的等级。累积和图可以是对数-对数图,例如log10-log10图。
23、在一些实施例中,基于与细胞标记中的每个相关联的具有不同序列的分子标记的数目和细胞标记中的每个的等级来生成累积和图包括:确定细胞标记中的每个等级的累积和,其中该等级的累积和包括与更低等级的细胞标记中的每个相关联的具有不同序列的分子标记的数目的总和。生成该累积和图的二阶导数图可以包括相对于细胞标记的第一等级和细胞标记的第二等级之间的差异确定该第一等级的累积和与该第二等级的累积和之间的差异。该第一等级和该第二等级之间的差异可以是1。最小值可以是全局最小值。确定二阶导数图的最小值可包括:确定二阶导数图的最小值高于与细胞标记中的每个相关联的分子标记的最小数目的阈值。与细胞标记中的每个相关联的分子标记的最小数目的阈值可以是百分位阈值。与细胞标记中的每个相关联的分子标记的最小数目的阈值可以是基于多个细胞的数目确定的。
24、在一些实施例中,确定二阶导数图的最小值包括确定低于与细胞标记中的每个相关联的分子标记的最大数目的阈值的二阶导数图的最小值。与细胞标记中的每个相关联的分子标记的最大数目的阈值可以是百分位阈值。与细胞标记中的每个相关联的分子标记的最大数目的阈值可以是基于多个细胞的数目确定的。
25、在一些实施例中,如果与细胞标记中的每个相关联的具有不同序列的分子标记的数目大于细胞标记阈值,则可以将细胞标记中的每个鉴定为信号细胞标记。如果与细胞标记中的每个相关联的具有不同序列的分子标记的数目不大于细胞标记阈值,则可以将细胞标记中的每个鉴定为噪声细胞标记。
26、本文中公开了用于鉴定信号细胞标记的方法。在一些实施例中,该方法包括:(a)使用多个条形码(例如随机条形码)使细胞样品中的多个靶条形码化(例如随机条形码化)以创建多个经条形码化的靶(例如经随机条形码化的靶),其中该多个条形码中的每个包含细胞标记和分子标记,其中从该多个细胞中不同细胞的靶创建的经条形码化的靶具有不同的细胞标记,并且其中从该多个细胞中相同细胞的靶创建的经条形码化的靶具有不同的分子标记;(b)获得该多个经条形码化的靶的测序数据;(c)确定该多个条形码(或经条形码化的靶)的每个细胞标记的特征向量,其中该特征向量包含与每个细胞标记相关联的具有不同序列的分子标记的数目;(d)基于该特征向量确定该多个条形码(或经条形码化的靶)的每个细胞标记的聚类;和(e)基于该聚类中细胞标记的数目和聚类大小阈值将该多个随机条形码(或经条形码化的靶)的每个细胞标记鉴定为信号细胞标记或噪声细胞标记。
27、在一些实施例中,基于特征向量确定多个经条形码化的靶的每个细胞标记的聚类包括基于特征向量与聚类在特征向量空间中的距离将多个经条形码化的靶的每个细胞标记聚类成聚类。基于特征向量确定多个经条形码化的靶的每个细胞标记的聚类可包括:将特征向量从特征向量空间投影到更低维空间;并且基于特征向量与聚类在更低维空间中的距离将每个细胞标记聚类成聚类。
28、在一些实施例中,更低维空间是二维空间。将特征向量从特征向量空间投影到更低维空间可包括使用t分布随机邻域嵌入(tsne)方法将特征向量从特征向量空间投影到更低维空间。基于特征向量与聚类在更低维空间中的距离将每个细胞标记聚类成聚类可以包括使用基于密度的方法基于特征向量与聚类在更低维空间中的距离将每个细胞标记聚类成聚类。基于密度的方法可包括具有噪声的应用的基于密度的空间聚类(dbscan)方法。
29、在一些实施例中,如果聚类中的细胞标记的数目低于聚类大小阈值,则将细胞标记鉴定为信号细胞标记。如果聚类中的细胞标记的数目不低于聚类大小阈值,则可将细胞标记鉴定为噪声细胞标记。该方法可以包括:(f)对于该多个靶中的一个或多个:(1)对该测序数据中与该靶相关联的具有不同序列的分子标记的数目进行计数;和(2)基于(1)中计数的测序数据中与该靶相关联的具有不同序列的分子标记的数目,估算该靶的数目。
30、在一些实施例中,该方法包括基于多个经条形码化的靶的细胞标记的数目确定聚类大小阈值。聚类大小阈值可以是多个经条形码化的靶的细胞标记数目的百分数。在一些实施例中,该方法包括基于多个条形码的细胞标记的数目确定聚类大小阈值。聚类大小阈值是多个条形码的细胞标记数目的百分数。在一些实施例中,方法包括基于与多个条形码的每个细胞标记相关联的具有不同序列的分子标记的数目确定聚类大小阈值。
31、本文中公开了用于鉴定信号细胞标记的方法。在一些实施例中,该方法包括:(a)获得多个经条形码化的靶(例如经随机条形码化的靶)的测序数据,其中该多个经条形码化的靶从细胞样品中的多个靶创建,该多个靶使用多个条形码(例如随机条形码)被条形码化(例如随机条形码化),其中该多个条形码中的每个包含细胞标记和分子标记,其中从该多个细胞中不同细胞的靶创建的经条形码化的靶具有不同的细胞标记,并且其中从该多个细胞中相同细胞的靶创建的经条形码化的靶具有不同的分子标记;(b)确定该多个经条形码化的靶的每个细胞标记的特征向量,其中该特征向量包含与每个细胞标记相关联的具有不同序列的分子标记的数目;(c)基于该特征向量确定该多个经条形码化的靶的每个细胞标记的聚类;和(d)基于该聚类中细胞标记的数目和聚类大小阈值将该多个经条形码化的靶的每个细胞标记鉴定为信号细胞标记或噪声细胞标记。
32、在一些实施例中,基于特征向量确定多个经条形码化的靶的每个细胞标记的聚类包括基于特征向量与聚类在特征向量空间中的距离将多个经条形码化的靶的每个细胞标记聚类成聚类。基于特征向量确定多个经条形码化的靶的每个细胞标记的聚类包括:将特征向量从特征向量空间投影到更低维空间;并且基于特征向量与聚类在更低维空间中的距离将每个细胞标记聚类成聚类。更低维空间可以是二维空间。
33、在一些实施例中,将特征向量从特征向量空间投影到更低维空间包括使用t分布随机邻域嵌入(tsne)方法将特征向量从特征向量空间投影到更低维空间。基于特征向量与聚类在更低维空间中的距离将每个细胞标记聚类成聚类可以包括使用基于密度的方法基于特征向量与聚类在更低维空间中的距离将每个细胞标记聚类成聚类。基于密度的方法可包括具有噪声的应用的基于密度的空间聚类(dbscan)方法。
34、在一些实施例中,如果聚类中的细胞标记的数目低于聚类大小阈值,则可将细胞标记鉴定为信号细胞标记。如果聚类中的细胞标记的数目不低于聚类大小阈值,则可将细胞标记鉴定为噪声细胞标记。
35、在一些实施例中,该方法包括基于多个经条形码化的靶的细胞标记的数目确定聚类大小阈值。聚类大小阈值可以是多个经条形码化的靶的细胞标记数目的百分数。在一些实施例中,基于多个条形码的细胞标记的数目确定聚类大小阈值。聚类大小阈值可以是多个条形码的细胞标记数目的百分数。在一些实施例中,方法包括基于与多个条形码的每个细胞标记相关联的具有不同序列的分子标记的数目确定聚类大小阈值。
36、在一些实施例中,该方法包括:(e)对于该多个靶中的一个或多个:(1)对该测序数据中与该靶相关联的具有不同序列的分子标记的数目进行计数;和(2)基于(1)中计数的测序数据中与该靶相关联的具有不同序列的分子标记的数目,估算该靶的数目。
37、本文中公开了用于鉴定信号细胞标记的实施例。在一些实施例中,该方法包括:(a)获得细胞的多个第一靶的测序数据,其中每个第一靶跟与多个细胞标记中的每个细胞标记相关联的具有不同序列的分子标记的数目相关;(b)基于与细胞标记中的每个相关联的具有不同序列的分子标记的数目和鉴定阈值,将细胞标记中的每个鉴定为信号细胞标记或噪声细胞标记;和(c)将多个细胞标记中的在(b)中鉴定为噪声细胞标记的至少一个重新鉴定为信号细胞标记,或将(b)中鉴定为信号细胞标记的至少一个细胞标记重新鉴定为噪声细胞标记。鉴定细胞标记中的每个,将多个细胞标记中的至少一个重新鉴定为信号细胞标记,或将多个细胞标记中的至少一个重新鉴定为噪声细胞标记可以基于与本公开中相同的细胞标记鉴定方法或不同的细胞标记鉴定方法。鉴定阈值可包括细胞标记阈值、聚类大小阈值、或其任意组合。该方法可以包括:去除多个细胞标记中的各自与低于分子标记数目阈值的具有不同序列的分子标记的数目相关联一个或多个细胞标记。
38、在一些实施例中,将多个细胞标记中的在(b)中鉴定为噪声细胞标记的至少一个重新鉴定为信号细胞标记包括:在多个第一靶中确定多个第一靶中的各自具有高于变化性阈值的一个或多个变化性指标的多个第二靶;和对于多个细胞标记中的每个,基于与多个第二靶相关联的具有不同序列的分子标记的数目和鉴定阈值将多个细胞标记中的在(b)中鉴定为噪声细胞标记的至少一个重新鉴定为信号细胞标记。第二靶的一个或多个变化性指标可包括测序数据中与第二靶和多个细胞标记中的细胞标记相关联的具有不同序列的分子标记的数目的平均值、最大值、中值、最小值、离差(dispersion)、或其任何组合。第二靶的一个或多个变化性指标可包括标准偏差、归一化离差、或其任何组合、多个第二靶的子集的变化性指标。变化性阈值可以小于或等于多个第二靶的子集的大小。
39、在一些实施例中,将多个细胞标记中的在(b)中鉴定为信号细胞标记的至少一个重新鉴定为噪声细胞标记包括:确定多个第一靶中的各自具有高于关联阈值的与在(c)中鉴定为噪声细胞标记的细胞标记的关联的多个第三靶;和对于多个细胞标记中的每个,基于与多个第三靶相关联的具有不同序列的分子标记的数目和鉴定阈值将(b)中鉴定为信号细胞标记的至少一个细胞标记重新鉴定为噪声细胞标记。确定多个第一靶中的各自具有高于关联阈值的与在(c)中鉴定为噪声细胞标记的细胞标记的关联的多个第三靶可包括:在将(b)中鉴定为噪声细胞标记的至少一个细胞标记重新鉴定为信号细胞标记之后,确定鉴定为信号细胞标记的多个剩余细胞标记;对于多个细胞标记中的每个基于与多个靶相关联的具有不同序列的分子标记的数目,和对于多个剩余细胞标记的中的每个基于与多个靶相关联的具有不同序列的分子标记的数目,确定多个第三靶。
40、本文中公开了用于鉴定信号细胞标记的系统。在一些实施例中,该系统包含:硬件处理器;和具有存储在其上的指令的非暂时性存储器,这些指令当通过该硬件处理器执行时使得该处理器执行本文公开的任何方法。本文中公开了用于鉴定信号细胞标记的计算机可读介质。在一些实施例中,该计算机可读介质包含用于实施本文中公开的任何方法的代码。
41、本文中还公开了以下项目:
42、1.一种用于鉴定信号细胞标记的方法,该方法包括:
43、(a)使用多个条形码使多个细胞中的多个靶条形码化以创建多个经条形码化的靶,其中该多个条形码中的每个包含细胞标记和分子标记;
44、(b)获得该多个经条形码化的靶的测序数据;
45、(c)确定与该多个条形码的细胞标记中的每个相关联的具有不同序列的分子标记的数目;
46、(d)基于与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目,确定该多个条形码的细胞标记中的每个的等级;
47、(e)基于(c)中确定的与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目和(d)中确定的这些细胞标记中的每个的等级,生成累积和图;
48、(f)生成该累积和图的二阶导数图;
49、(g)确定该累积和图的二阶导数图的最小值,其中该二阶导数图的最小值对应于细胞标记阈值;和
50、(h)基于(c)中确定的与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目和(g)中确定的细胞标记阈值,将这些细胞标记中的每个鉴定为信号细胞标记或噪声细胞标记。
51、2.如项目1所述的方法,该方法包括:如果在(h)中将该多个条形码的细胞标记鉴定为噪声细胞标记,则从(b)中获得的测序数据中去除与该鉴定的细胞标记相关的测序信息。
52、3.如项目1-2中任一项所述的方法,该方法包括:如果与该多个靶中的靶相关联的具有不同序列的分子标记的数目高于分子标记出现阈值的话,则从(b)中获得的测序数据中去除与该多个靶中的该靶相关联的具有不同序列的分子标记相关的测序信息。
53、4.如项目1-3中任一项所述的方法,其中在(c)中确定与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目包括从测序数据中除去与这些细胞标记中的每个相关联的非独特分子标记相关的测序信息。
54、5.如项目1-4中任一项所述的方法,其中该累积和图是对数-对数图。
55、6.如项目5所述的方法,其中该对数-对数图是log10-log10图。
56、7.如项目1-6中任一项所述的方法,其中基于(c)中确定的与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目和(d)中确定的这些细胞标记中的每个的等级生成该累积和图包括:
57、确定这些细胞标记中的每个等级的累积和,其中该等级的累积和包括与更低等级的细胞标记中的每个相关联的具有不同序列的分子标记的数目的总和。
58、8.如项目7所述的方法,其中生成该累积和图的二阶导数图包括相对于这些细胞标记的第一等级和这些细胞标记的第二等级之间的差异确定该第一等级的累积和与该第二等级的累积和之间的差异。
59、9.如项目8所述的方法,其中该第一等级和该第二等级之间的差异是1。
60、10.如项目1-9中任一项所述的方法,其中该最小值是全局最小值。
61、11.如项目1-10中任一项所述的方法,其中确定该二阶导数图的最小值包括确定高于与这些细胞标记中的每个相关联的分子标记的最小数目的阈值的该二阶导数图的最小值。
62、12.如项目11所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最小数目的阈值是百分位阈值。
63、13.如项目11-12中任一项所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最小数目的阈值是基于该多个细胞中的细胞数目确定。
64、14.如项目1-13中任一项所述的方法,其中确定该二阶导数图的最小值包括确定低于与这些细胞标记中的每个相关联的分子标记的最大数目的阈值的该二阶导数图的最小值。
65、15.如项目14所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最大数目的阈值是百分位阈值。
66、16.如项目14-15中任一项所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最大数目的阈值是基于该多个细胞中的细胞数目确定。
67、17.如项目1-16中任一项所述的方法,其中如果(c)中确定的与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目大于该细胞标记阈值,则将这些细胞标记中的每个鉴定为信号细胞标记。
68、18.如项目1-17中任一项所述的方法,其中如果(c)中确定的与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目不大于该细胞标记阈值,则将这些细胞标记中的每个鉴定为噪声细胞标记。
69、19.如项目1-18中任一项所述的方法,该方法包括:
70、(i)对于该多个靶中的一个或多个:
71、(1)对该测序数据中与该靶相关联的具有不同序列的分子标记的数目进行计数;和
72、(2)基于(1)中计数的测序数据中与该靶相关联的具有不同序列的分子标记的数目,估算该靶的数目。
73、20.一种用于确定信号细胞标记的方法,该方法包括:
74、(a)获得多个经条形码化的靶的测序数据,其中使用多个条形码使多个细胞中的多个靶条形码化来创建该多个经条形码化的靶,且其中该多个条形码中的每个包括细胞标记和分子标记;
75、(b)基于与该多个条形码的细胞标记中的每个相关联的具有不同序列的分子标记的数目,确定该多个条形码的细胞标记中的每个的等级;
76、(c)基于与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目和(b)中确定的该多个条形码的细胞标记中的每个的等级,确定细胞标记阈值;和
77、(d)基于与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目和(c)中确定的细胞标记阈值,将这些细胞标记中的每个鉴定为信号细胞标记或噪声细胞标记。
78、21.如项目20所述的方法,该方法包括:确定与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目。
79、22.如项目21所述的方法,其中确定与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目包括从测序数据中除去与这些细胞标记中的每个相关联的非独特分子标记相关的测序信息。
80、23.如项目20-22中任一项所述的方法,其中基于与该多个条形码的细胞标记中的每个相关联的具有不同序列的分子标记的数目和(b)中确定的该多个条形码的细胞标记中的每个的等级确定该细胞标记阈值包括:
81、确定这些细胞标记中的每个等级的累积和,其中该等级的累积和包括与更低等级的细胞标记中的每个相关联的具有不同序列的分子标记的数目的总和;和
82、确定在等级n的累积和以及下一等级n+1的累积和中具有最大变化的细胞标记的等级n,其中在累积和以及下一等级n+1的累积和中具有最大变化的细胞标记的等级n对应于该细胞标记阈值。
83、24.如项目20-22中任一项所述的方法,其中基于与该多个条形码的细胞标记中的每个相关联的具有不同序列的分子标记的数目确定该细胞标记阈值包括:
84、确定在等级n的细胞标记的累积和以及下一等级n+1的细胞标记的累积和中具有最大变化的细胞标记,其中与该细胞标记相关联的具有不同序列的分子标记的数目对应于该细胞标记阈值。
85、25.如项目20-22中任一项所述的方法,其中基于与该多个条形码的细胞标记中的每个相关联的具有不同序列的分子标记的数目和(b)中确定的该多个条形码的细胞标记中的每个的等级确定该细胞标记阈值包括:
86、基于与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目和(b)中确定的细胞标记中的每个的等级,生成累积和图;
87、生成该累积和图的二阶导数图;和
88、确定该累积和图的二阶导数图的最小值,其中该二阶导数图的最小值对应于该细胞标记阈值。
89、26.如项目25所述的方法,其中基于与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目和(b)中确定的细胞标记中的每个的等级生成累积和图包括:
90、确定这些细胞标记中的每个等级的累积和,其中该等级的累积和包括与更低等级的细胞标记中的每个相关联的具有不同序列的分子标记的数目的总和。
91、27.如项目25-26中任一项所述的方法,其中生成该累积和图的二阶导数图包括相对于这些细胞标记的第一等级和这些细胞标记的第二等级之间的差异确定该第一等级的累积和与该第二等级的累积和之间的差异。
92、28.如项目27所述的方法,其中该第一等级和该第二等级之间的差异是1。
93、29.如项目20-28中任一项所述的方法,该方法包括:如果在(d)中将该多个条形码的细胞标记鉴定为噪声细胞标记,则从(a)中获得的测序数据中去除与该鉴定的细胞标记相关的测序信息。
94、30.如项目20-29中任一项所述的方法,该方法包括:如果与该多个靶中的靶相关联的具有不同序列的分子标记的数目高于分子标记出现阈值的话,则从(a)中获得的测序数据中去除与该多个靶中的该靶相关联的具有不同序列的分子标记相关的测序信息。
95、31.如项目20-30中任一项所述的方法,其中该累积和图是对数-对数图。
96、32.如项目31所述的方法,其中该对数-对数图是log10-log10图。
97、33.如项目25-32中任一项所述的方法,其中该最小值是全局最小值。
98、34.如项目25-33中任一项所述的方法,其中确定该二阶导数图的最小值包括确定高于与这些细胞标记中的每个相关联的分子标记的最小数目的阈值的该二阶导数图的最小值。
99、35.如项目34所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最小数目的阈值是百分位阈值。
100、36.如项目34-35中任一项所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最小数目的阈值是基于该多个细胞中的细胞数目确定。
101、37.如项目25-36中任一项所述的方法,其中确定该二阶导数图的最小值包括确定低于与这些细胞标记中的每个相关联的分子标记的最大数目的阈值的该二阶导数图的最小值。
102、38.如项目37所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最大数目的阈值是百分位阈值。
103、39.如项目37-38中任一项所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最大数目的阈值是基于该多个细胞中的细胞数目确定。
104、40.如项目20-39中任一项所述的方法,其中如果确定的与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目大于该细胞标记阈值,则将这些细胞标记中的每个鉴定为信号细胞标记。
105、41.如项目20-40中任一项所述的方法,其中如果确定的与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目不大于该细胞标记阈值,则将这些细胞标记中的每个鉴定为噪声细胞标记。
106、42.如项目20-41中任一项所述的方法,该方法包括:
107、(e)对于该多个靶中的一个或多个:
108、(1)对该测序数据中与该靶相关联的具有不同序列的分子标记的数目进行计数;和
109、(2)基于(1)中计数的测序数据中与该靶相关联的具有不同序列的分子标记的数目,估算该靶的数目。
110、43.一种用于鉴定信号细胞标记的方法,该方法包括:
111、(a)获得细胞的多个靶的测序数据,其中每个靶跟与多个细胞标记中的每个细胞标记相关联的具有不同序列的分子标记的数目相关;
112、(b)基于与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目,确定细胞标记阈值;和
113、(c)基于与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目和该细胞标记阈值,将这些细胞标记中的每个鉴定为信号细胞标记或噪声细胞标记。
114、44.如项目43所述的方法,其中获得测序数据包括:
115、使用多个条形码使这些细胞的多个靶条形码化,以创建多个经条形码化的靶,其中该多个条形码中的每个包括该多个细胞标记中的细胞标记、和分子标记;和
116、确定与该多个条形码的细胞标记中的每个相关联的具有不同序列的分子标记的数目。
117、45.如项目43-44中任一项所述的方法,该方法包括:
118、对于该多个靶中的一个或多个:
119、(1)对该测序数据中与该靶相关联的具有不同序列的分子标记的数目进行计数;和
120、(2)基于(1)中计数的测序数据中与该靶相关联的具有不同序列的分子标记的数目,估算该靶的数目。
121、46.如项目43-45中任一项所述的方法,该方法包括:如果将该多个条形码的细胞标记鉴定为噪声细胞标记,则从测序数据中去除与该鉴定的细胞标记相关的测序信息。
122、47.如项目43-46中任一项所述的方法,该方法包括:如果与该多个靶中的靶相关联的具有不同序列的分子标记的数目高于分子标记出现阈值的话,则从测序数据中去除与该多个靶中的该靶相关联的具有不同序列的分子标记相关的测序信息。
123、48.如项目43-47中任一项所述的方法,其中在(c)中确定与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目包括从测序数据中除去与这些细胞标记中的每个相关联的非独特分子标记相关的测序信息。
124、49.如项目43-48中任一项所述的方法,其中确定该细胞标记阈值包括:
125、确定累积和图的拐点,
126、其中该累积和图基于与该多个细胞标记中的每个相关联的具有不同序列的分子标记的数目和这些细胞标记中的每个的等级,并且
127、其中该拐点对应于该细胞标记阈值。
128、50.如项目49所述的方法,其中确定该累积和图的拐点包括:
129、基于与该多个细胞标记中的每个相关联的具有不同序列的分子标记的数目和这些细胞标记中的每个的等级,生成累积和图;
130、生成该累积和图的二阶导数图;和
131、确定该累积和图的二阶导数图的最小值,其中该二阶导数图的最小值对应于细胞标记阈值。
132、51.如项目49-50中任一项所述的方法,其中确定该细胞标记阈值包括:基于与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目,确定该多个细胞标记中的每个的等级。
133、52.如项目43-51中任一项所述的方法,其中该累积和图是对数-对数图。
134、53.如项目52所述的方法,其中该对数-对数图是log10-log10图。
135、54.如项目50-53中任一项所述的方法,其中基于与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目和细胞标记中的每个的等级生成累积和图包括:
136、确定这些细胞标记中的每个等级的累积和,其中该等级的累积和包括与更低等级的细胞标记中的每个相关联的具有不同序列的分子标记的数目的总和。
137、55.如项目54所述的方法,其中生成该累积和图的二阶导数图包括相对于这些细胞标记的第一等级和这些细胞标记的第二等级之间的差异确定该第一等级的累积和与该第二等级的累积和之间的差异。
138、56.如项目55所述的方法,其中该第一等级和该第二等级之间的差异是1。
139、57.如项目43-56中任一项所述的方法,其中该最小值是全局最小值。
140、58.如项目43-57中任一项所述的方法,其中确定该二阶导数图的最小值包括确定高于与这些细胞标记中的每个相关联的分子标记的最小数目的阈值的该二阶导数图的最小值。
141、59.如项目58所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最小数目的阈值是百分位阈值。
142、60.如项目58-59中任一项所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最小数目的阈值是基于该多个细胞的数目确定。
143、61.如项目43-60中任一项所述的方法,其中确定该二阶导数图的最小值包括确定低于与这些细胞标记中的每个相关联的分子标记的最大数目的阈值的该二阶导数图的最小值。
144、62.如项目61所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最大数目的阈值是百分位阈值。
145、63.如项目61-62中任一项所述的方法,其中与这些细胞标记中的每个相关联的分子标记的最大数目的阈值是基于该多个细胞的数目确定。
146、64.如项目43-63中任一项所述的方法,其中如果与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目大于该细胞标记阈值,则将这些细胞标记中的每个鉴定为信号细胞标记。
147、65.如项目43-64中任一项所述的方法,其中如果与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目不大于该细胞标记阈值,则将这些细胞标记中的每个鉴定为噪声细胞标记。
148、66.一种用于鉴定信号细胞标记的方法,该方法包括:
149、(a)使用多个条形码使多个细胞中的多个靶条形码化以创建多个经条形码化的靶,其中该多个条形码中的每个包括细胞标记和分子标记,其中从该多个细胞中的不同细胞的靶创建的经条形码化的靶具有不同的细胞标记,并且其中从该多个细胞中的相同种细胞的靶创建的经条形码化的靶具有不同的分子标记;
150、(b)获得该多个经条形码化的靶的测序数据;
151、(c)确定该多个经条形码化的靶的每个细胞标记的特征向量,其中该特征向量包含与每个细胞标记相关联的具有不同序列的分子标记的数目;
152、(d)基于该特征向量确定该多个经条形码化的靶的每个细胞标记的聚类;和
153、(e)基于该聚类中细胞标记的数目和聚类大小阈值将该多个经条形码化的靶的每个细胞标记鉴定为信号细胞标记或噪声细胞标记。
154、67.如项目66所述的方法,其中基于该特征向量确定该多个经条形码化的靶的每个细胞标记的聚类包括基于该特征向量与该聚类在特征向量空间中的距离将该多个经条形码化的靶的每个细胞标记聚类成聚类。
155、68.如项目66所述的方法,其中基于该特征向量确定该多个经条形码化的靶的每个细胞标记的聚类包括:
156、将该特征向量从特征向量空间投影到更低维空间;和
157、基于该特征向量与该聚类在更低维空间中的距离将每个细胞标记聚类成聚类。
158、69.如项目68所述的方法,其中该更低维空间是二维空间。
159、70.如项目68-69中任一项所述的方法,其中将该特征向量从该特征向量空间投影到该更低维空间包括使用t分布随机邻域嵌入(tsne)方法将该特征向量从该特征向量空间投影到该更低维空间。
160、71.如项目68-70中任一项所述的方法,其中基于该特征向量与该聚类在该更低维空间中的距离将每个细胞标记聚类成聚类包括使用基于密度的方法基于该特征向量与该聚类在该更低维空间中的距离将每个细胞标记聚类成聚类。
161、72.如项目71所述的方法,其中该基于密度的方法包括具有噪声的应用的基于密度的空间聚类(dbscan)方法。
162、73.如项目66-72中任一项所述的方法,其中如果该聚类中的细胞标记的数目低于该聚类大小阈值,则将该细胞标记鉴定为信号细胞标记。
163、74.如项目66-73中任一项所述的方法,其中如果该聚类中的细胞标记的数目不低于该聚类大小阈值,则将该细胞标记鉴定为噪声细胞标记。
164、75.如项目66-74中任一项所述的方法,该方法包括:基于该多个经条形码化的靶的细胞标记的数目确定该聚类大小阈值。
165、76.如项目75所述的方法,其中该聚类大小阈值是该多个经条形码化的靶的细胞标记的数目的百分数。
166、77.如项目66-74中任一项所述的方法,该方法包括:基于该多个经条形码化的靶的细胞标记的数目确定该聚类大小阈值。
167、78.如项目77所述的方法,其中该聚类大小阈值是该多个经条形码化的靶的细胞标记的数目的百分数。
168、79.如项目66-78中任一项所述的方法,该方法包括:基于与该多个条形码的每个细胞标记相关联的具有不同序列的分子标记的数目确定该聚类大小阈值。
169、80.如项目66-79中任一项所述的方法,该方法包括:
170、(f)对于该多个靶中的一个或多个:
171、(1)对该测序数据中与该靶相关联的具有不同序列的分子标记的数目进行计数;和
172、(2)基于(1)中计数的测序数据中与该靶相关联的具有不同序列的分子标记的数目,估算该靶的数目。
173、81.一种用于鉴定信号细胞标记的方法,该方法包括:
174、(a)获得多个经条形码化的靶的测序数据,其中使用多个条形码使多个细胞中的多个靶条形码化来创建该多个经条形码化的靶,其中该多个条形码中的每个包含细胞标记和分子标记,其中从该多个细胞中不同细胞的靶创建的经条形码化的靶具有不同的细胞标记,并且其中从该多个细胞中相同细胞的靶创建的经条形码化的靶具有不同的分子标记;
175、(b)确定该多个经条形码化的靶的每个细胞标记的特征向量,其中该特征向量包含与每个细胞标记相关联的具有不同序列的分子标记的数目;
176、(c)基于该特征向量确定该多个经条形码化的靶的每个细胞标记的聚类;和
177、(d)基于该聚类中细胞标记的数目和聚类大小阈值将该多个经条形码化的靶的每个细胞标记鉴定为信号细胞标记或噪声细胞标记。
178、82.如项目80所述的方法,其中基于该特征向量确定该多个经条形码化的靶的每个细胞标记的聚类包括基于该特征向量与该聚类在特征向量空间中的距离将该多个经条形码化的靶的每个细胞标记聚类成聚类。
179、83.如项目80所述的方法,其中基于该特征向量确定该多个经条形码化的靶的每个细胞标记的聚类包括:
180、将该特征向量从特征向量空间投影到更低维空间;和
181、基于该特征向量与该聚类在更低维空间中的距离将每个细胞标记聚类成聚类。
182、84.如项目83所述的方法,其中该更低维空间是二维空间。
183、85.如项目83-84中任一项所述的方法,其中将该特征向量从该特征向量空间投影到该更低维空间包括使用t分布随机邻域嵌入(tsne)方法将该特征向量从该特征向量空间投影到该更低维空间。
184、86.如项目83-85中任一项所述的方法,其中基于该特征向量与该聚类在该更低维空间中的距离将每个细胞标记聚类成聚类包括使用基于密度的方法基于该特征向量与该聚类在该更低维空间中的距离将每个细胞标记聚类成聚类。
185、87.如项目86所述的方法,其中该基于密度的方法包括具有噪声的应用的基于密度的空间聚类(dbscan)方法。
186、88.如项目83-87中任一项所述的方法,其中如果该聚类中的细胞标记的数目低于该聚类大小阈值,则将该细胞标记鉴定为信号细胞标记。
187、89.如项目83-88中任一项所述的方法,其中如果该聚类中的细胞标记的数目不低于该聚类大小阈值,则将该细胞标记鉴定为噪声细胞标记。
188、90.如项目83-89中任一项所述的方法,该方法包括:基于该多个经条形码化的靶的细胞标记的数目确定该聚类大小阈值。
189、91.如项目90所述的方法,其中该聚类大小阈值是该多个经条形码化的靶的细胞标记的数目的百分数。
190、92.如项目83-91中任一项所述的方法,该方法包括:基于该多个经条形码化的靶的细胞标记的数目确定该聚类大小阈值。
191、93.如项目92所述的方法,其中该聚类大小阈值是该多个经条形码化的靶的细胞标记的数目的百分数。
192、94.如项目83-93中任一项所述的方法,该方法包括:基于与该多个经条形码化的靶的每个细胞标记相关联的具有不同序列的分子标记的数目确定该聚类大小阈值。
193、95.如项目83-94中任一项所述的方法,该方法包括:
194、(e)对于该多个靶中的一个或多个:
195、(1)对该测序数据中与该靶相关联的具有不同序列的分子标记的数目进行计数;和
196、(2)基于(1)中计数的测序数据中与该靶相关联的具有不同序列的分子标记的数目,估算该靶的数目。
197、96.一种用于鉴定信号细胞标记的方法,该方法包括:
198、(a)获得细胞的多个第一靶的测序数据,其中每个第一靶跟与多个细胞标记中的每个细胞标记相关联的具有不同序列的分子标记的数目相关;
199、(b)基于与这些细胞标记中的每个相关联的具有不同序列的分子标记的数目和鉴定阈值,将这些细胞标记中的每个鉴定为信号细胞标记或噪声细胞标记;和
200、(c)将该多个细胞标记中的在(b)中鉴定为噪声细胞标记的至少一个重新鉴定为信号细胞标记,或将(b)中鉴定为信号细胞标记的至少一个细胞标记重新鉴定为噪声细胞标记。
201、97.如项目96所述的方法,其中该鉴定阈值包括细胞标记阈值、聚类大小阈值、或其任意组合。
202、98.如项目96-97中任一项所述的方法,该方法包括:去除该多个细胞标记中的各自与低于分子标记数目阈值的具有不同序列的分子标记的数目相关联一个或多个细胞标记。
203、99.如项目96-98中任一项所述的方法,其中将该多个细胞标记中的在(b)中鉴定为噪声细胞标记的至少一个重新鉴定为信号细胞标记包括:
204、在该多个第一靶中确定该多个第一靶中的各自具有高于变化性阈值的一个或多个变化性指标的多个第二靶;和
205、对于该多个细胞标记中的每个,基于与该多个第二靶相关联的具有不同序列的分子标记的数目和该鉴定阈值将该多个细胞标记中的在(b)中鉴定为噪声细胞标记的至少一个重新鉴定为信号细胞标记。
206、100.如项目99所述的方法,其中该第二靶的一个或多个变化性指标包括测序数据中与该第二靶和该多个细胞标记中的细胞标记相关联的具有不同序列的分子标记的数目的平均值、最大值、中值、最小值、离差、或其任何组合。
207、101.如项目99-100中任一项所述的方法,其中该第二靶的一个或多个变化性指标包括标准偏差、归一化离差、或其任何组合、该多个第二靶的子集的变化性指标。
208、102.如项目101所述的方法,其中该可变性阈值小于或等于该多个第二靶的子集的大小。
209、103.如项目96-102中任一项所述的方法,其中将该多个细胞标记中的在(b)中鉴定为信号细胞标记的至少一个重新鉴定为噪声细胞标记包括:
210、确定该多个第一靶中的各自具有高于关联阈值的与在(c)中鉴定为噪声细胞标记的细胞标记的关联的多个第三靶;和
211、对于该多个细胞标记中的每个,基于与该多个第三靶相关联的具有不同序列的分子标记的数目和该鉴定阈值将(b)中鉴定为信号细胞标记的至少一个细胞标记重新鉴定为噪声细胞标记。
212、104.如项目103所述的方法,其中确定该多个第一靶中的各自具有高于关联阈值的与在(c)中鉴定为噪声细胞标记的细胞标记的关联的多个第三靶包括:
213、在将(b)中鉴定为噪声细胞标记的至少一个细胞标记重新鉴定为信号细胞标记之后,确定鉴定为信号细胞标记的多个剩余细胞标记;
214、基于以下确定该多个第三靶
215、对于该多个细胞标记的每个,与该多个靶相关联的具有不同序列的分子标记的数目,和
216、对于该多个剩余细胞标记的每个,与该多个靶相关联的具有不同序列的分子标记的数目。
217、105.一种用于确定靶的数目的计算机系统,该计算机系统包含:
218、硬件处理器;和
219、具有存储在其上的指令的非暂时性存储器,这些指令当通过该硬件处理器执行时使得该处理器执行如项目1-104中任一项所述的方法。
220、106.一种计算机可读介质,其包含用于执行如项目1-104中任一项所述的方法的代码。