空间上可寻址的分子条形编码的制作方法

文档序号:11285539阅读:289来源:国知局
空间上可寻址的分子条形编码的制造方法与工艺

相关申请

本申请根据35u.s.c.§119(e)要求于2015年2月27日提交的美国临时申请号62/126230和于2015年5月15日提交的美国临时申请号62/162471的优先权。这些相关申请的内容明确地通过引用以其整体结合在此。

背景

领域

本披露总体涉及分子生物学的领域,并且更具体地涉及分子条形编码。

相关技术的说明

诸如原位杂交和免疫组织化学的方法和技术实现可视化样品内靶分子的位置。用于标记用于扩增和测序的靶分子的方法和技术例如随机条形编码可用于确定靶分子的身份(identity)。确定样品中靶分子的身份和位置对于临床应用、诊断学以及生物医学研究是重要的。因此,存在对能够使靶分子的身份与靶分子在样品内的位置相关联的方法和技术的需要。

概述

在此披露了用于确定样品中多种靶标的数目和空间位置的方法。在一些实施例中,这些方法包括:使用多种随机条形码随机条形编码样品中的多种靶标,其中多种随机条形码中的每一种包含空间标记和分子标记;使用分子标记估计多种靶标中的每一种的数目;并且使用空间标记鉴定多种靶标中的每一种的空间位置。该方法可以是多重复路的。

在一些实施例中,随机条形编码样品中的多种靶标可以包括使多种随机条形码与多种靶标杂交以生成随机条形编码的靶标,并且多种靶标中的至少一种与多种随机条形码中的一种杂交。随机条形编码样品中的多种靶标可以包括生成随机条形编码的靶标的索引文库。不同的随机条形码的分子标记可以彼此是不同的。在随机条形编码样品中的多种靶标的过程中,样品可以是物理上分割开的或是完整的。样品中多种靶标的空间位置可以是在样品的表面上、在样品的内部、在样品的亚细胞区域、或其任何组合。随机条形编码样品中多种靶标可以在样品的表面上、在样品的亚细胞区域、在样品的内部或以其任何组合执行。

在一些实施例中,空间标记可以包含5-20个核苷酸。分子标记可以包含5-20个核苷酸。使用分子标记估计多种靶标的数目可以包括确定多种随机标记的空间标记和分子标记的序列并且计数具有不同序列的分子标记的数目。确定多种随机条形码的空间标记和分子标记的序列可以包括对多种随机条形码中的一些或全部进行测序。对多种随机条形码中的一些或全部进行测序可以包括生成各自具有100个或更多个碱基的读取长度的序列。鉴定多种靶标的空间位置可以包括使多种随机条形码的空间标记与样品中的多种靶标的空间位置相关联。

在一些实施例中,这些方法可以包括可视化样品中的多种靶标。可视化样品中的多种靶标可以包括将多种靶标映射到样品的谱图(map)上。将多种靶标映射到样品的谱图上可以包括生成样品的二维谱图或三维谱图。二维谱图和三维谱图可以在随机条形编码样品中的多种靶标之前或之后生成。在一些实施例中,二维谱图和三维谱图可以在裂解样品之前生成。在生成二维谱图或三维谱图之前或之后裂解样品可以包括加热样品、使样品与洗涤剂接触、改变样品的ph、或其任何组合。

在一些实施例中,样品可以包括多个细胞,并且多种靶标可以与多个细胞相关联。多个细胞可以包括一种或多种细胞类型。一种或多种细胞类型中的至少一种可以是脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移性细胞、良性细胞、原代细胞、循环细胞、或其任何组合。多种靶标可以包括核糖核酸(rna)、信使rna(mrna)、微小rna、小干扰rna(sirna)、rna降解产物、各自包含多聚(a)尾的rna以及其任何组合。随机条形编码样品中的多种靶标可以通过包含多种随机条形码的固体支持物执行。在一些实施例中,这些方法可以包括解码固体支持物。固体支持物可以包括与多种随机条形码相缔合的多个合成颗粒。不同固体支持物上的多种随机条形码的空间标记的区别在于至少一个核苷酸。

在一些实施例中,多种随机条形码中的每一种可以包含通用标记和细胞标记中的一种或多种,其中通用标记对于固体支持物上的多种随机条形码可以是相同的并且细胞标记对于固体支持物上的多种随机条形码可以是相同的。通用标记可以包含5-20个核苷酸。细胞标记可以包含5-20个核苷酸。固体支持物可以包含呈二维或三维的多种随机条形码。合成颗粒可以是珠。珠可以是硅胶珠、可控孔度玻璃珠、磁性珠、dynabeads、交联葡聚糖(sephadex)/琼脂糖凝胶(sepharose)珠、纤维素珠、聚苯乙烯珠、或其任何组合。固体支持物可以包括聚合物、基质、水凝胶、针阵列装置、抗体、或其任何组合。

在此披露了用于确定样品中多种靶标的空间位置的方法。在一些实施例中,这些方法包括:使用多种随机条形码在一个或多个时间点处随机条形编码样品中的多种靶标,其中多种随机条形码中的每一种包含空间标记;并且使用空间标记鉴定多种靶标中的每一种的空间位置。

在一些实施例中,使用多种随机条形码随机条形编码样品中的多种靶标可以包括使用多种随机条形码在不同时间点处随机条形编码样品中的多种靶标。多种随机条形码中的每一种可以包含维标记,并且用于在不同时间点处随机条形编码多种靶标的多种随机条形码的维标记可以是不同的。维标记可以与不同的时间点相关联。

在一些实施例中,随机条形编码样品中的多种靶标可以包括使样品与一个装置接触。该装置可以是针、针阵列、管、抽吸装置、注射装置、电穿孔装置、荧光激活细胞分选装置、微流体装置、或其任何组合。装置可以特定速率接触样品的切片。特定速率可以使多种靶标的空间位置与一个或多个时间点相关联。随机条形编码样品中的多种靶标可以通过包括与多种随机条形码相缔合的多个合成颗粒的固体支持物执行。

在此披露了合成颗粒。在一些实施例中,每个合成颗粒包含:多种随机条形码,其中多种随机条形码中的每一种包含细胞标记和分子标记;第一组光学标记;第二组光学标记,其中第一组光学标记中的每种光学标记包含第一光学部分并且第二组光学标记中的每种光学标记包含第二光学部分,并且其中多个合成颗粒中的每一个与包含第一光学部分和第二光学部分的光学条形码相缔合。

在一些实施例中,多种随机条形码的分子标记彼此是不同的,并且分子标记选自包括具有独特序列的至少100种分子标记的组。多种随机条形码的细胞标记可以是相同的。第一光学部分和第二光学部分选自包括两种或更多种光谱上不同的光学部分的组。多种随机条形码中的每一种可以包含空间标记,其中多种随机条形码的空间标记彼此的区别在于至少一个核苷酸。

在一些实施例中,多种随机条形码中的每一种进一步包含通用标记,其中颗粒上的所有随机条形码的通用标记是相同的。合成颗粒可以是珠或磁性珠。珠可以是硅胶珠、可控孔度玻璃珠、磁性珠、dynabead、交联葡聚糖/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠、或其任何组合。

在此披露了用于确定样品中多种靶标的空间位置的方法。在一些实施例中,这些方法包括:使用多种随机条形码随机条形编码样品中的多种靶标,其中多种随机条形码中的每一种包含预空间标记;将一个或多个空间标记块串联到预空间标记上以生成空间标记;并且使用空间标记鉴定多种靶标中的每一种的空间位置。

在一些实施例中,随机条形编码样品中的多种靶标可以包括使多种随机条形码与多种靶标杂交以生成随机条形编码的靶标,并且多种靶标中的至少一种与多种随机条形码中的一种杂交。随机条形编码样品中的多种靶标可以包括生成随机条形编码的靶标的索引文库。空间标记可以包含5-20个核苷酸。样品可以包括多个细胞和可以与多个细胞相关联的多种靶标。多种靶标可以包括核糖核酸(rna)、信使rna(mrna)、微小rna、小干扰rna(sirna)、rna降解产物、各自包含多聚(a)尾的rna以及其任何组合。随机条形编码样品中的多种靶标可以通过包含多种随机条形码的固体支持物执行。在一些实施例中,这些方法可以包括解码固体支持物。固体支持物可以包括与多种随机条形码相缔合的多个合成颗粒。合成颗粒可以是珠。

在此披露的可以是用于确定样品中多种靶标的空间位置的方法。在一些实施例中,这些方法包括:对样品进行成像以生成样品图像;使用多种随机条形码随机条形编码样品中的多种靶标以生成随机条形编码的靶标,其中多种随机条形码中的每一种可以包含空间标记;并且使用空间标记鉴定多种靶标中的每一种的空间位置。

在一些实施例中,使用空间标记鉴定多种靶标中的每一种的空间位置可以包括使样品图像与样品中的多种靶标的空间标记相关联。对样品进行成像可以包括用染色剂染色样品,其中染色剂可以是荧光染色剂、阴性染色剂、抗体染色剂、或其任何组合。对样品进行成像可以包括使用光学显微镜、电子显微镜、共聚焦显微镜、荧光显微镜、或其任何组合对样品进行成像。

在一些实施例中,样品可以包括组织、细胞单层、固定细胞、组织切片、或其任何组合。使样品图像与样品中的多种靶标的空间标记相关联可以包括使样品图像与样品中的多种靶标的空间标记重叠。样品可以包括来自受试者的生物样品、临床样品、环境样品、生物流体、组织或细胞。受试者可以是人、小鼠、狗、大鼠或脊椎动物。

在一些实施例中,这些方法可以包括基于样品中的多种靶标的空间标记确定受试者的基因型、表型或一个或多个基因突变。在一些实施例中,这些方法可以包括预测受试者对一种或多种疾病的易感性。一种或多种疾病中的至少一种可以是癌症或遗传性疾病。样品可以包括多个细胞,并且多种靶标可以与多个细胞相关联。多个细胞可以包括一种或多种细胞类型。在一些实施例中,这些方法可以包括确定样品中的多个细胞的细胞类型。可以基于样品中的多个细胞的细胞类型的预测响应性选择药物。

在此披露了用于确定多个单细胞的空间位置的方法。在一些实施例中,这些方法可以包括:使用多个合成颗粒随机条形编码多个单细胞,其中多个合成颗粒中的每一个可以包含:多种随机条形码、第一组光学标记以及第二组光学标记,其中多种随机条形码中的每一种可以包含细胞标记和分子标记,其中第一组光学标记中的每种光学标记可以包含第一光学部分并且第二组光学标记中的每种光学标记可以包含第二光学部分,并且其中多个合成颗粒中的每一个可以与包含第一光学部分和第二光学部分的光学条形码相缔合;检测多个合成颗粒中的每一个的光学条形码以确定多个合成颗粒中的每一个的位置;并且基于多个合成颗粒的位置确定多个单细胞的空间位置。

在一些实施例中,使用多个合成颗粒随机条形编码多个单细胞可以包括使多个单细胞与多个合成颗粒接触,并且多个合成颗粒中的每一个可以亲密接近单细胞或少量的细胞。多个单细胞中的每一个可以包括多种靶标,并且随机条形编码多个单细胞可以包括使多种随机条形码与多种靶标杂交以生成随机条形编码的靶标,并且多种靶标中的至少一种可以与多种随机条形码中的一种杂交。

在一些实施例中,一个合成颗粒上的多种随机条形码的细胞标记可以具有相同序列并且不同合成颗粒上的多种随机条形码的细胞标记可以具有不同序列。一种合成条形码上的多种随机条形码的分子标记可以彼此是不同的,并且分子标记可以选自包括具有独特序列的至少100种分子标记的组。第一光学部分和第二光学部分可以选自包括两种或更多种光谱上不同的光学部分的组。确定多个合成颗粒的光学条形码和确定多个合成颗粒的光学条形码可以包括生成示出了多个合成颗粒的光学条形码和位置的光学图像。

在一些实施例中,多个单细胞可以包括分布在包括孔的孔阵列上的细胞,并且孔阵列中的大多数孔中的每一个含有至多一个单细胞。在一些实施例中,这些方法可以包括裂解多个单细胞;并且生成随机条形编码的靶标的索引文库,其中随机条形编码的靶标中的每一种可以包含细胞标记序列、分子标记序列以及多种靶标中的一种的互补序列的至少一部分。这些方法可以包括扩增索引文库的随机条形编码的靶标以生成扩增的随机条形编码的靶标;并且对扩增的随机条形编码的靶标进行测序以确定具有独特分子标记序列和相同互补序列的扩增的随机条形编码的靶标的数目,其中具有独特分子标记序列和相同互补序列的扩增的随机条形编码的靶标的数目可以与单细胞中或少量细胞中的具有相同互补序列的互补序列的靶标的出现次数基本上相同。多个细胞可以包括组织、细胞单层、固定细胞、组织切片、或其任何组合。扩增标记的靶分子可以包括桥式扩增、使用基因特异性引物、通用引物、寡聚(dt)引物的扩增、或其任何组合。

在此披露了用于鉴定两个或更多个样品中的不同细胞的方法。在一些实施例中,这些方法可以包括:使用多种随机条形码随机条形编码两个或更多个样品中的多种靶标,其中多种随机条形码中的每一种可以包含空间标记和分子标记;使用分子标记估计两个或更多个样品中的多种靶标的数目;并且使用空间标记将两个或更多个样品彼此区分开,其中与具有不同空间标记的随机条形码相缔合的多种靶标可以来自不同的样品。

在一些实施例中,随机条形编码两个或更多个样品中的多种靶标可以包括使多种随机条形码与多种靶标杂交以生成随机条形编码的靶标,并且多种靶标中的至少一种可以与多种随机条形码中的一种杂交。随机条形编码两个或更多个样品中的多种靶标可以包括生成随机条形编码的靶标的索引文库。空间标记可以包含5-20个核苷酸。分子标记可以包含5-20个核苷酸。两个或更多个样品中每一个可以包括多个细胞,并且多种靶标可以与多个细胞相关联。多种靶标可以包括核糖核酸(rna)、信使rna(mrna)、微小rna、小干扰rna(sirna)、rna降解产物、各自包含多聚(a)尾的rna以及其任何组合。随机条形编码两个或更多个样品中的多种靶标可以通过包括与多种随机条形码相缔合的多个合成颗粒的固体支持物执行。合成颗粒可以是珠。珠可以是硅胶珠、可控孔度玻璃珠、磁性珠、dynabeads、交联葡聚糖/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠、或其任何组合。

在此披露了用于确定样品中多种靶标的数目和空间位置的试剂盒。在一些实施例中,试剂盒可以包括:多种随机条形码,其中多种随机条形码中的每一种可以包含空间标记,其中多种随机条形码的空间标记彼此的区别在于至少一个核苷酸;以及多种随机条形码的使用说明书。多种随机条形码可以与固体支持物相缔合。固体支持物可以包括与多个合成颗粒相缔合的多个合成颗粒。

在一些实施例中,多个合成颗粒中的每一个可以包含第一组光学标记和第二组光学标记,并且第一组光学标记中的每种光学标记可以包含第一光学部分,第二组光学标记中的每种光学标记可以包含第二光学部分,并且第一光学部分和第二光学部分可以选自包括两种或更多种光谱上不同的光学部分的组。多种随机条形码中的每一种可以包含分子标记、通用标记和细胞标记中的一种或多种,其中固体支持物上的所有随机条形码的通用标记和细胞标记可以是相同的。

在一些实施例中,固体支持物可以包含呈二维或三维的多种随机条形码。多个合成颗粒可以是珠。珠可以是硅胶珠、可控孔度玻璃珠、磁性珠、dynabeads、交联葡聚糖/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠、或其任何组合。合成颗粒可以是磁性珠。固体支持物可以包括聚合物、基质、水凝胶、针阵列装置、抗体、或其任何组合。在一些实施例中,试剂盒可以包括缓冲剂。试剂盒可以包括柱体。固体支持物可以被预加载在基底上。试剂盒可以包括用于逆转录反应的一种或多种试剂。试剂盒可以包括用于扩增反应的一种或多种试剂。

附图简要说明

图1示出了用于确定样品中不同靶标的空间位置的非限制性示例性实施例。

图2示出了非限制性示例性随机条形码。

图3示出了随机条形编码和数字计数的非限制性示例性工作流程。

图4是示出了用于由多种靶标生成随机条形编码的靶标的索引文库的非限制性示例性过程的示意图。

图5示出了用于通过保持样品切片的生理学取向确定样品中靶标的空间位置的非限制性示例性实施例。

图6示出了用于根据时间点确定样品中靶标的空间位置的非限制性示例性实施例。

图7示出了用于通过随机化样品切片的取向确定样品中靶标的空间位置的非限制性示例性实施例。

图8示出了标记平板印刷术的非限制性示例性示意图。

图9示出了用于使用标记平板印刷术确定样品中靶标的空间位置的非限制性示例性实施例。

图10示出了用于针对多个样品区分样品的靶标的非限制性示例性实施例。

图11示出了用于区分细胞中靶标的亚细胞定位的非限制性示例性实施例。

图12示出了用于同聚物加尾的非限制性示例性实施例。

图13示出了在本披露的方法中使用的非限制性示例性仪器。

图14示出了可结合本披露的实施例使用的计算机系统的非限制性示例性体系结构。

图15示出了示出具有在本披露的方法中使用的多个计算机系统的网络的非限制性示例性体系结构。

图16示出了根据本披露的方法使用共享的虚拟地址存储空间的多处理器计算机系统的非限制性示例性体系结构。

图17a-c示出了在本披露的方法中使用的非限制性示例性柱体。

图18a-b示出了合成颗粒的表面上的光学标记的不同布置。

图19示出了实例4的第一编码步骤中的寡核苷酸的杂交。

图20是示出了第一板中96个孔中的每一个中的寡核苷酸含量的查找表。

图21示出了在第一编码步骤中在双螺旋dna聚合、连接和变性之后合成颗粒上的不同区域中的单链寡核苷酸。

图22示出了实例4的第二编码步骤中的寡核苷酸的杂交。

图23是示出了第二板中的96个孔中的每一个中的寡核苷酸含量的查找表。

图24示出了在第二编码步骤中在双螺旋dna聚合、连接和变性之后合成颗粒上的不同区域中的单链寡核苷酸。

图25示出了实例4的第三编码步骤中的寡核苷酸的杂交。

图26是示出了第三板中的96个孔中的每一个中的寡核苷酸含量的查找表。

图27示出了在第三编码步骤中在双螺旋dna聚合、连接和变性之后合成颗粒上的不同区域中的单链寡核苷酸。

图28是涂布有dna条形码和光谱可分辨的条形码的非限制性示例性合成颗粒的示意图。

图29示出了合成颗粒的光谱可分辨的条形码ps1-9的示例性组合。

发明详述

在以下详细描述中参考附图,附图形成在此的一部分。在图中,类似的符号典型地鉴别类似的部件,除非上下文另外规定。在详细描述、图示以及权利要求书中所描述的说明性实施例并不意图进行限制。在不脱离在此呈现的主题精神或范围的情况下,可以采用其他实施例,并且可做出其他改动。易于理解的是,如在此总体所述的和在附图中示出的本披露的方面可以各种的不同构造方式进行布置、取代、组合、分隔和设计,所有这些明显是涵盖于此的并且组成在此的披露内容的一部分。

在一个方面中,本披露提供了一种用于确定样品中的一种或多种靶标的数目和空间位置的方法,该方法包括:使样品中的空间位置与一种或多种随机条形码接触,其中每种随机条形码包含空间标记和分子标记;使用分子标记估计空间位置中的一种或多种靶标的数目;并且使用空间标记鉴定一种或多种靶标的空间位置。在一些实施例中,接触包括使随机条形码与一种或多种靶标杂交。在一些实施例中,杂交包括使一种或多种靶标杂交以使得一种或多种靶标中的每一种与独特的随机条形码杂交。在一些实施例中,随机条形码的分子标记是不同的。在一些实施例中,在接触过程中样品是物理上分割开的。在一些实施例中,在接触过程中样品是完整的。在一些实施例中,接触是在样品的表面上执行。在一些实施例中,接触是在样品的内部执行。在一些实施例中,接触是在样品的亚细胞区域执行。在一些实施例中,空间位置是在亚细胞的。在一些实施例中,接触是在基底上执行。在一些实施例中,基底包括呈已知次序的一种或多种随机条形码。在一些实施例中,基底包括呈未知次序的一种或多种随机条形码。在一些实施例中,该方法进一步包括解码基底。在一些实施例中,空间标记包含从5-20个核苷酸。在一些实施例中,估计包括生成靶标-条形码分子。在一些实施例中,靶标-条形码包含与靶标相缔合的随机条形码的序列。在一些实施例中,估计进一步包括确定空间标记和分子标记的序列。在一些实施例中,该方法进一步包括计数分子标记的不同序列的出现次数。在一些实施例中,计数用于估计一种或多种靶标的数目。在一些实施例中,确定包括对随机条形码进行测序。在一些实施例中,测序包括在至少100个碱基的读取长度的条件下进行测序。在一些实施例中,测序包括在至少500个碱基的读取长度的条件下进行测序。在一些实施例中,鉴定包括使空间标记与样品中的空间位置相关联。在一些实施例中,该方法进一步包括可视化空间位置处的一种或多种靶标的数目。在一些实施例中,可视化包括将一种或多种靶标的数目映射到样品的谱图上。在一些实施例中,可视化包括在选自下组的时间点处对样品进行成像,该组由以下各项组成:在接触之前对样品进行成像、在接触之后对样品进行成像、在裂解样品之前对样品进行成像、在裂解样品之后对样品进行成像。在一些实施例中,成像产生了用于构建样品的物理表示的谱图的图像。在一些实施例中,谱图是二维的。在一些实施例中,谱图是三维的。在一些实施例中,样品包括单细胞。在一些实施例中,样品包括多个细胞。在一些实施例中,多个细胞包括一种或多种不同的细胞类型。在一些实施例中,一种或多种细胞类型选自下组,该组由以下各项组成:脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移性细胞、良性细胞、原代细胞和循环细胞、或其任何组合。在一些实施例中,样品包括实体组织。在一些实施例中,样品是获自受试者。在一些实施例中,受试者是选自下组的受试者,该组由以下各项组成:人、哺乳动物、狗、大鼠、小鼠、鱼、蝇、蠕虫、植物、真菌、细菌、病毒、脊椎动物以及无脊椎动物。在一些实施例中,一种或多种靶标是核糖核酸分子。在一些实施例中,核糖核酸分子选自下组,该组由以下各项组成:mrna、微小rna、mrna降解产物和包含多聚(a)尾的核糖核酸、或其任何组合。在一些实施例中,靶标是脱氧核糖核酸分子。在一些实施例中,接触是通过固体支持物执行。在一些实施例中,固体支持物可以包含多种随机条形码。在一些实施例中,多种随机条形码中的每一种包含空间标记。在一些实施例中,不同固体支持物上的空间标记的区别在于至少一个核苷酸。在一些实施例中,随机条形码进一步包含通用标记和细胞标记。在一些实施例中,通用标记和细胞标记对于固体支持物上的所有随机条形码是相同的。在一些实施例中,固体支持物包含呈二维的随机条形码。在一些实施例中,固体支持物包含呈三维的随机条形码。在一些实施例中,固体支持物包括珠。在一些实施例中,珠选自下组,该组由以下各项组成:硅胶珠、可控孔度玻璃珠、磁性珠、dynabeads、交联葡聚糖/琼脂糖凝胶珠、纤维素珠以及聚苯乙烯珠、或其任何组合。在一些实施例中,珠包括磁性珠。在一些实施例中,固体支持物是半固体的。在一些实施例中,固体支持物包括聚合物、基质或水凝胶。在一些实施例中,固体支持物包括针阵列装置。在一些实施例中,固体支持物包括抗体。在一些实施例中,固体支持物包括聚苯乙烯。

在一个方面中,本披露提供了一种用于通过计时确定样品中的一种或多种靶标的空间位置的方法,该方法包括:在一个或多个时间点处使样品中的空间位置与一种或多种随机条形码接触,其中每种随机条形码包含空间标记;并且鉴定样品中的一种或多种靶标的空间位置,其中一个或多个时间点与空间位置相关联。在一些实施例中,不同时间点处的随机条形码包含不同的维标记。在一些实施例中,维标记与一个或多个时间点相关联。在一些实施例中,接触通过一个装置执行。在一些实施例中,装置是选自下组的装置,该组由以下各项组成:针、针阵列、管、抽吸装置、注射装置、电穿孔装置、荧光激活细胞分选装置以及微流体装置、或其任何组合。在一些实施例中,装置以特定速率接触切片。在一些实施例中,特定速率用于使时间点与空间位置相关联。在一些实施例中,接触包括使一种或多种随机条形码与一种或多种靶标杂交。在一些实施例中,杂交包括使一种或多种靶标杂交以使得一种或多种靶标中的每一种与独特的随机条形码杂交。在一些实施例中,一种或多种随机条形码包含分子标记。在一些实施例中,分子标记对于一种或多种随机条形码中的每一种是不同的。在一些实施例中,在接触过程中样品是物理上分割开的。在一些实施例中,在接触过程中样品是完整的。在一些实施例中,接触是在样品的表面上执行。在一些实施例中,接触是在样品的内部执行。在一些实施例中,接触是在样品的亚细胞区域执行。在一些实施例中,空间位置是在亚细胞的。在一些实施例中,接触是在基底上执行。在一些实施例中,基底包括呈已知次序的一种或多种随机条形码。在一些实施例中,基底包括呈未知次序的一种或多种随机条形码。在一些实施例中,该方法进一步包括解码基底。在一些实施例中,空间标记包含从5-20个核苷酸。在一些实施例中,该方法进一步包括使用随机条形码估计一种或多种靶标的数目。在一些实施例中,估计包括生成靶标-条形码分子。在一些实施例中,靶标-条形码包含与靶标相缔合的随机条形码的序列。在一些实施例中,估计进一步包括确定空间标记和分子标记的序列。在一些实施例中,该方法进一步包括计数分子标记的不同序列的出现次数。在一些实施例中,计数用于估计一种或多种靶标的数目。在一些实施例中,确定包括对随机条形码进行测序。在一些实施例中,测序包括在至少100个碱基的读取长度的条件下进行测序。在一些实施例中,测序包括在至少500个碱基的读取长度的条件下进行测序。在一些实施例中,鉴定包括使空间标记与样品中的空间位置相关联。在一些实施例中,该方法进一步包括可视化空间位置处的一种或多种靶标的数目。在一些实施例中,可视化包括将一种或多种靶标的数目映射到样品的谱图上。在一些实施例中,可视化包括在选自下组的时间点处对样品进行成像,该组由以下各项组成:在接触之前对样品进行成像、在接触之后对样品进行成像、在裂解样品之前对样品进行成像、在裂解样品之后对样品进行成像。在一些实施例中,成像产生了用于构建样品的物理表示的谱图的图像。在一些实施例中,谱图是二维的。在一些实施例中,谱图是三维的。在一些实施例中,样品包括单细胞。在一些实施例中,样品包括多个细胞。在一些实施例中,多个细胞包括一种或多种不同的细胞类型。在一些实施例中,一种或多种细胞类型选自下组,该组由以下各项组成:脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移性细胞、良性细胞、原代细胞和循环细胞、或其任何组合。在一些实施例中,样品包括实体组织。在一些实施例中,样品是获自受试者。在一些实施例中,受试者是选自下组的受试者,该组由以下各项组成:人、哺乳动物、狗、大鼠、小鼠、鱼、蝇、蠕虫、植物、真菌、细菌、病毒、脊椎动物以及无脊椎动物。在一些实施例中,一种或多种靶标是核糖核酸分子。在一些实施例中,核糖核酸分子选自下组,该组由以下各项组成:mrna、微小rna、mrna降解产物和包含多聚(a)尾的核糖核酸、或其任何组合。在一些实施例中,靶标是脱氧核糖核酸分子。在一些实施例中,接触是通过固体支持物执行。在一些实施例中,固体支持物包含多种随机条形码。在一些实施例中,多种随机条形码中的每一种包含空间标记。在一些实施例中,不同固体支持物上的空间标记的区别在于至少一个核苷酸。在一些实施例中,随机条形码进一步包含通用标记、细胞标记和分子标记。在一些实施例中,通用标记和细胞标记对于固体支持物上的所有随机条形码是相同的。在一些实施例中,固体支持物包含呈二维的随机条形码。在一些实施例中,固体支持物包含呈三维的随机条形码。在一些实施例中,固体支持物包括珠。在一些实施例中,珠选自下组,该组由以下各项组成:硅胶珠、可控孔度玻璃珠、磁性珠、dynabeads、交联葡聚糖/琼脂糖凝胶珠、纤维素珠以及聚苯乙烯珠、或其任何组合。在一些实施例中,珠包括磁性珠。在一些实施例中,固体支持物是半固体的。在一些实施例中,固体支持物包括聚合物、基质或水凝胶。在一些实施例中,固体支持物包括针阵列装置。在一些实施例中,固体支持物包括抗体。

在一个方面中,本披露提供了一种用于确定样品上的一种或多种靶标的空间位置的方法,该方法包括:使样品中的一个或多个空间位置与一种或多种随机条形码接触,其中每种随机条形码包含预空间标记;将一个或多个空间标记块串联到预空间标记上,从而生成空间标记;并且通过使空间标记的长度与样品中的空间位置相关联鉴定样品中一种或多种靶标的一个或多个空间位置。在一些实施例中,不同空间位置处的空间标记具有不同的长度。在一些实施例中,接触包括使随机条形码与一种或多种靶标杂交。在一些实施例中,杂交包括使一种或多种靶标杂交以使得一种或多种靶标中的每一种与独特的随机条形码杂交。在一些实施例中,预空间标记包含分子标记。在一些实施例中,分子标记对于一种或多种随机条形码中的每一种是不同的。在一些实施例中,在接触过程中样品是物理上分割开的。在一些实施例中,在接触过程中样品是完整的。在一些实施例中,接触是在样品的表面上执行。在一些实施例中,接触是在样品的内部执行。在一些实施例中,接触是在样品的亚细胞区域执行。在一些实施例中,空间位置是在亚细胞的。在一些实施例中,接触是在基底上执行。在一些实施例中,基底包括呈已知次序的一种或多种随机条形码。在一些实施例中,基底包括呈未知次序的一种或多种随机条形码。在一些实施例中,该方法进一步包括解码基底。在一些实施例中,空间标记包含从5-20个核苷酸。在一些实施例中,该方法进一步包括使用随机条形码估计不同靶标的数目。在一些实施例中,估计包括生成靶标-条形码分子。在一些实施例中,靶标-条形码包含与靶标相缔合的随机条形码的序列。在一些实施例中,估计进一步包括确定空间标记和分子标记的序列。在一些实施例中,该方法进一步包括计数分子标记的不同序列的出现次数。在一些实施例中,计数用于估计一种或多种靶标的数目。在一些实施例中,确定包括对随机条形码进行测序。在一些实施例中,测序包括在至少100个碱基的读取长度的条件下进行测序。在一些实施例中,测序包括在至少500个碱基的读取长度的条件下进行测序。在一些实施例中,鉴定包括使空间标记与样品中的空间位置相关联。在一些实施例中,该方法进一步包括可视化空间位置处的一种或多种靶标的数目。在一些实施例中,可视化包括将一种或多种靶标的数目映射到样品的谱图上。在一些实施例中,可视化包括在选自下组的时间点处对样品进行成像,该组由以下各项组成:在接触之前对样品进行成像、在接触之后对样品进行成像、在裂解样品之前对样品进行成像、在裂解样品之后对样品进行成像。在一些实施例中,成像产生了用于构建样品的物理表示的谱图的图像。在一些实施例中,谱图是二维的。在一些实施例中,谱图是三维的。在一些实施例中,样品包括单细胞。在一些实施例中,样品包括多个细胞。在一些实施例中,多个细胞包括一种或多种不同的细胞类型。在一些实施例中,一种或多种细胞类型选自下组,该组由以下各项组成:脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移性细胞、良性细胞、原代细胞和循环细胞、或其任何组合。在一些实施例中,样品包括实体组织。在一些实施例中,样品是获自受试者。在一些实施例中,受试者是选自下组的受试者,该组由以下各项组成:人、哺乳动物、狗、大鼠、小鼠、鱼、蝇、蠕虫、植物、真菌、细菌、病毒、脊椎动物以及无脊椎动物。在一些实施例中,一种或多种靶标是核糖核酸分子。在一些实施例中,核糖核酸分子选自下组,该组由以下各项组成:mrna、微小rna、mrna降解产物和包含多聚(a)尾的核糖核酸、或其任何组合。在一些实施例中,靶标是脱氧核糖核酸分子。在一些实施例中,接触是通过固体支持物执行。在一些实施例中,固体支持物可以包含多种随机条形码。在一些实施例中,多种随机条形码中的每一种包含空间标记。在一些实施例中,不同固体支持物上的空间标记的区别在于至少一个核苷酸。在一些实施例中,随机条形码进一步包含通用标记和细胞标记。在一些实施例中,通用标记和细胞标记对于固体支持物上的所有随机条形码是相同的。在一些实施例中,固体支持物包含呈二维的随机条形码。在一些实施例中,固体支持物包含呈三维的随机条形码。在一些实施例中,固体支持物包括珠。在一些实施例中,珠选自下组,该组由以下各项组成:硅胶珠、可控孔度玻璃珠、磁性珠、dynabeads、交联葡聚糖/琼脂糖凝胶珠、纤维素珠以及聚苯乙烯珠、或其任何组合。在一些实施例中,珠包括磁性珠。在一些实施例中,固体支持物是半固体的。在一些实施例中,固体支持物包括聚合物、基质或水凝胶。在一些实施例中,固体支持物包括针阵列装置。在一些实施例中,固体支持物包括抗体。

在一个方面中,本披露提供了一种用于鉴定细胞群体中的不同细胞的方法,该方法包括:使两个或更多个样品接触基底,其中基底包含一种或多种类型的随机条形码,其中随机条形码的类型中的每种类型包含不同的空间标记,并且其中每种随机条形码包含分子标记;使用分子标记估计多个样品中的一种或多种靶标的数目;并且通过空间标记从两个或更多个样品中区分出一个样品,其中与不同空间标记相缔合的靶标源自于不同的样品。在一些实施例中,接触包括使随机条形码与一种或多种靶标杂交。在一些实施例中,杂交包括使一种或多种靶标杂交以使得一种或多种靶标中的每一种与独特的随机条形码杂交。在一些实施例中,随机条形码的分子标记是不同的。在一些实施例中,在接触过程中两个或更多个样品是物理上彼此分割开的。在一些实施例中,在接触过程中两个或更多个样品是完整的。在一些实施例中,接触是在两个或更多个样品的表面上执行。在一些实施例中,接触是在两个或更多个样品的内部执行。在一些实施例中,接触是在两个或更多个样品的亚细胞区域执行。在一些实施例中,空间位置是在亚细胞的。在一些实施例中,基底包括呈已知次序的一种或多种随机条形码。在一些实施例中,基底包括呈未知次序的一种或多种随机条形码。在一些实施例中,该方法进一步包括解码基底。在一些实施例中,空间标记包含从5-20个核苷酸。在一些实施例中,估计包括生成靶标-条形码分子。在一些实施例中,靶标-条形码包含与靶标相缔合的随机条形码的序列。在一些实施例中,估计进一步包括确定空间标记和分子标记的序列。在一些实施例中,该方法进一步包括计数分子标记的不同序列的出现次数。在一些实施例中,计数用于估计一种或多种靶标的数目。在一些实施例中,确定包括对随机条形码进行测序。在一些实施例中,测序包括在至少100个碱基的读取长度的条件下进行测序。在一些实施例中,测序包括在至少500个碱基的读取长度的条件下进行测序。在一些实施例中,该方法进一步包括可视化空间位置处的一种或多种靶标的数目。在一些实施例中,可视化包括将一种或多种靶标的数目映射到样品的谱图上。在一些实施例中,可视化包括在选自下组的时间点处对样品进行成像,该组由以下各项组成:在接触之前对样品进行成像、在接触之后对样品进行成像、在裂解样品之前对样品进行成像、在裂解样品之后对样品进行成像。在一些实施例中,成像产生了用于构建样品的物理表示的谱图的图像。在一些实施例中,谱图是二维的。在一些实施例中,谱图是三维的。在一些实施例中,样品包括单细胞。在一些实施例中,样品包括多个细胞。在一些实施例中,多个细胞包括一种或多种不同的细胞类型。在一些实施例中,一种或多种细胞类型选自下组,该组由以下各项组成:脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移性细胞、良性细胞、原代细胞和循环细胞、或其任何组合。在一些实施例中,样品包括实体组织。在一些实施例中,样品是获自受试者。在一些实施例中,受试者是选自下组的受试者,该组由以下各项组成:人、哺乳动物、狗、大鼠、小鼠、鱼、蝇、蠕虫、植物、真菌、细菌、病毒、脊椎动物以及无脊椎动物。在一些实施例中,一种或多种靶标是核糖核酸分子。在一些实施例中,核糖核酸分子选自下组,该组由以下各项组成:mrna、微小rna、mrna降解产物和包含多聚(a)尾的核糖核酸、或其任何组合。在一些实施例中,靶标是脱氧核糖核酸分子。在一些实施例中,接触是通过固体支持物执行。在一些实施例中,固体支持物包含多种随机条形码。在一些实施例中,多种随机条形码中的每一种包含空间标记。在一些实施例中,不同固体支持物上的空间标记的区别在于至少一个核苷酸。在一些实施例中,随机条形码进一步包含通用标记和细胞标记。在一些实施例中,通用标记和细胞标记对于固体支持物上的所有随机条形码是相同的。在一些实施例中,固体支持物包含呈二维的随机条形码。在一些实施例中,固体支持物包含呈三维的随机条形码。在一些实施例中,固体支持物包括珠。在一些实施例中,珠选自下组,该组由以下各项组成:硅胶珠、可控孔度玻璃珠、磁性珠、dynabeads、交联葡聚糖/琼脂糖凝胶珠、纤维素珠以及聚苯乙烯珠、或其任何组合。在一些实施例中,珠包括磁性珠。在一些实施例中,固体支持物是半固体的。在一些实施例中,固体支持物包括聚合物、基质或水凝胶。在一些实施例中,固体支持物包括针阵列装置。在一些实施例中,固体支持物包括抗体。

在一个方面中,本披露提供了一种试剂盒,该试剂盒包括:一种或多种类型的随机条形码,其中一种或多种类型的随机条形码中的每种随机条形码包含空间标记,其中一种或多种类型的随机条形码的空间标记的区别在于至少一个核苷酸;以及使用说明书。在一些实施例中,一种或多种类型的随机条形码被连接到固体支持物。在一些实施例中,一种或多种类型的随机条形码被连接到基底。在一些实施例中,试剂盒进一步包括缓冲剂。在一些实施例中,试剂盒进一步包括柱体。在一些实施例中,一个或多个支持物预加载在基底上。在一些实施例中,试剂盒进一步包括用于逆转录反应的试剂。在一些实施例中,试剂盒进一步包括用于扩增反应的试剂。

在一个方面中,本披露提供了一种方法,该方法包括:对接触包括多个探针的基底的样品进行成像,从而产生图像;裂解样品,从而从样品中释放核酸;分析来自基底上的位置处的样品的核酸;将图像上的位置与来自分析的数据相关联以鉴定样品中的核酸的空间位置。在一些实施例中,成像包括染色样品。在一些实施例中,染色包括用选自下组的染色剂染色,该组由以下各项组成:荧光染色剂、阴性染色剂和抗体染色剂、或其任何组合。在一些实施例中,成像使用选自下组的技术,该组由以下各项组成:光学显微镜、电子显微镜、共聚焦显微镜以及荧光显微镜。在一些实施例中,执行免疫组织学分析产生图像。在一些实施例中,样品包括细胞单层。在一些实施例中,样品包括固定细胞。在一些实施例中,样品包括组织切片。在一些实施例中,裂解是通过加热样品、使样品与洗涤剂接触或改变样品的ph、或其任何组合执行的。在一些实施例中,分析包括使核酸与寡聚(dt)杂交。在一些实施例中,核酸包括聚腺苷酸化核酸。在一些实施例中,该方法进一步包括对核酸进行同聚物加尾。在一些实施例中,该方法进一步包括扩增核酸。在一些实施例中,扩增包括桥式扩增。在一些实施例中,扩增包括使用基因特异性引物的扩增。在一些实施例中,扩增包括使用通用引物的扩增。在一些实施例中,扩增包括使用寡聚(dt)引物的扩增。在一些实施例中,该方法进一步包括检测核酸。在一些实施例中,检测包括使一个或多个探针与核酸杂交。在一些实施例中,一个或多个探针包含荧光标记。在一些实施例中,一个或多个探针可以是4个探针。在一些实施例中,分析包括使核酸与微阵列杂交。在一些实施例中,相关联包括使图像与数据重叠。在一些实施例中,相关联包括将基底上的特征的x-y位置映射到图像上。在一些实施方案中,探针包括寡聚(dt)。在一些实施例中,探针包括基因特异性探针。在一些实施例中,探针包括寡聚(dt)探针与基因特异性探针的组合。在一些实施例中,基因特异性探对至少2个基因是基因特异性的。

在一个方面中,本披露提供了一种用于诊断受试者的方法,该方法包括:对来自受试者的接触包括多个探针的基底的样品进行成像,从而产生图像;裂解样品,从而从样品中释放核酸;分析来自基底上的位置处的样品的核酸;基于图像和来自分析的数据诊断受试者。在一些实施例中,该受试者为人。在一些实施例中,受试者是小鼠、狗、大鼠或脊椎动物。在一些实施例中,诊断包括鉴定样品的不同细胞类型。在一些实施例中,诊断包括确定不同的细胞类型是否响应于治疗。在一些实施例中,诊断包括确定样品中一个或多个细胞的基因型。在一些实施例中,该方法进一步包括治疗受试者。在一些实施例中,治疗包括向受试者给予药物。在一些实施例中,基于样品中所鉴定的细胞类型的预测响应性选择药物。在一些实施例中,成像包括染色样品。在一些实施例中,染色包括用选自下组的染色剂染色,该组由以下各项组成:荧光染色剂、阴性染色剂和抗体染色剂、或其任何组合。在一些实施例中,成像使用选自下组的技术,该组由以下各项组成:光学显微镜、电子显微镜、共聚焦显微镜以及荧光显微镜。在一些实施例中,执行免疫组织学分析产生图像。在一些实施例中,样品包括细胞单层。在一些实施例中,样品包括固定细胞。在一些实施例中,样品包括组织切片。在一些实施例中,裂解是通过加热样品、使样品与洗涤剂接触或改变样品的ph、或其任何组合执行的。在一些实施例中,分析包括使核酸与寡聚(dt)杂交。在一些实施例中,核酸包括聚腺苷酸化核酸。在一些实施例中,该方法进一步包括对核酸进行同聚物加尾。在一些实施例中,该方法进一步包括扩增核酸。在一些实施例中,扩增包括桥式扩增。在一些实施例中,扩增包括使用基因特异性引物的扩增。在一些实施例中,扩增包括使用通用引物的扩增。在一些实施例中,扩增包括使用寡聚(dt)引物的扩增。在一些实施例中,该方法进一步包括检测核酸。在一些实施例中,检测包括使一个或多个探针与核酸杂交。在一些实施例中,一个或多个探针包含荧光标记。在一些实施例中,一个或多个探针可以是4个探针。在一些实施例中,分析包括使核酸与微阵列杂交。在一些实施方案中,探针包括寡聚(dt)。在一些实施例中,探针包括基因特异性探针。在一些实施例中,探针包括寡聚(dt)探针与基因特异性探针的组合。在一些实施例中,基因特异性探对至少2个基因是基因特异性的。

在一个方面中,本披露提供了一种方法,该方法包括:对接触包括多个探针的第一基底的样品进行成像,从而产生图像;裂解样品,从而从样品中释放核酸以与多个探针杂交;分析来自基底上的位置处的样品的核酸;并且复制第一基底,从而制备复制基底。在一些实施例中,第一基底的探针包括寡聚(dt)。在一些实施例中,第一基底的探针包括基因特异性引物。在一些实施例中,复制基底的探针包括针对与第一基底上的基因特异性引物相同的基因上的另一个位置的基因特异性引物。在一些实施例中,复制包括使第一基底与复制基底接触。在一些实施例中,复制包括使来自第一基底的核酸与复制基底杂交。在一些实施例中,成像包括染色样品。在一些实施例中,染色包括用选自下组的染色剂染色,该组由以下各项组成:荧光染色剂、阴性染色剂和抗体染色剂、或其任何组合。在一些实施例中,成像使用选自下组的技术,该组由以下各项组成:光学显微镜、电子显微镜、共聚焦显微镜以及荧光显微镜。在一些实施例中,执行免疫组织学分析产生图像。在一些实施例中,样品包括细胞单层。在一些实施例中,样品包括固定细胞。在一些实施例中,样品包括组织切片。在一些实施例中,裂解是通过加热样品、使样品与洗涤剂接触或改变样品的ph、或其任何组合执行的。在一些实施例中,分析包括使核酸与寡聚(dt)杂交。在一些实施例中,该方法进一步包括对核酸进行同聚物加尾。在一些实施例中,该方法进一步包括扩增核酸以生成扩增子。在一些实施例中,扩增包括桥式扩增。在一些实施例中,扩增包括使用基因特异性引物的扩增。在一些实施例中,扩增包括使用通用引物的扩增。在一些实施例中,扩增包括使用寡聚(dt)引物的扩增。在一些实施例中,复制包括使扩增子杂交到复制基底上。

定义

除非另外定义,否则在此所使用的所有技术术语均具有与本披露所属领域的普通技术人员通常所理解的相同的含义。除非上下文另外明确指示,否则如本说明书和所附权利要求书所使用的单数形式“一个(a)”、“一种(an)”以及“该(the)”包括复数指示物。除非另外说明,否则在此对“或”的任何引用旨在涵盖“和/或”。

如在此所用,术语“衔接子”可以意指有利于相缔合的核酸的扩增或测序的序列。相缔合的核酸可以包括靶核酸。相缔合的核酸可以包括空间标记、靶标记、样品标记、索引标记、条形码、随机条形码或分子标记中的一种或多种。衔接子可以是线性的。衔接子可以是预腺苷酸化的衔接子。衔接子可以是双链或单链的。一个或多个衔接子可以位于核酸的5’或3’端上。当衔接子包含在5’和3’端上的已知序列时,已知序列可以是相同或不同的序列。位于多核苷酸的5’和/或3’端上的衔接子可以能够与固定在表面上的一种或多种寡核苷酸杂交。在一些实施例中,衔接子可以包含通用序列。通用序列可以是两个或更多个核酸分子共有的核苷酸序列区域。两个或更多个核酸分子还可以具有不同序列区域。因此,例如,5’衔接子可以包含相同和/或通用核酸序列并且3’衔接子可以包含相同和/或通用序列。可以存在于多个核酸分子的不同成员中的通用序列可以允许使用与通用序列互补的单一通用引物复制或扩增多种不同的序列。类似地,可以存在于核酸分子集合体的不同成员中的两种(例如一对)或更多种通用序列可以允许使用与通用序列互补的至少一种、两种(例如一对)或更多种通用引物复制或扩增多种不同的序列。因此,通用引物包含可与这种通用序列杂交的序列。具有靶核酸序列的分子可以被修饰成将通用衔接子(例如,非靶核酸序列)连接到不同的靶核酸序列的一端或两端。连接到靶核酸的一种或多种通用引物可以为通用引物的杂交提供位点。连接到靶核酸的一种或多种通用引物可以是彼此相同或不同的。

如在此所用,术语“相缔合的”或“与...相缔合的”可以意指两种或更多种物质在某一时间点可鉴定为共定位。缔合可以意指两种或更多种物质在或曾经在类似容器内。缔合可以是信息学关联,其中例如关于两种或更多种物质的数字信息被存储并且可以用于确定一种或多种物质在某一时间点共定位。缔合还可以是物理缔合。在一些实施例中,两种或更多种相缔合的物质彼此“系接”、“连接”或“固定”,或“系接”、“连接”或“固定”至共同的固体或半固体表面。缔合可以是指用于将标记连接到固体或半固体支持物诸如珠的共价或非共价方式。缔合可以是靶标与标记之间的共价键。

如在此所用,术语“互补的”可以是指两个核苷酸之间精确配对的能力。例如,如果核酸的指定位置处的核苷酸能够与另一个核酸的核苷酸氢键结合,则认为两个核酸在那一位置是彼此互补的。两个单链核酸分子之间的互补性可以是“部分的”,其中仅一些核苷酸结合,或者当单链分子之间存在总体互补性时该结合可以是完全的。如果第一核苷酸序列与第二核苷酸序列互补,则可以称为第一核苷酸序列是第二序列的“补体”。如果第一核苷酸序列与反向(即核苷酸的次序是相反的)于第二序列的序列互补,则可以称为第一核苷酸序列是第二序列的“反向补体”。如在此所用,术语“补体”、“互补性”和“反向补体”可以互换使用。从本披露中理解的是,如果分子可以与另一分子杂交,则该分子可以是杂交分子的补体。

如在此所用,术语“数字计数”可以是指用于估计样品中靶分子的数目的方法。数字计数可以包括确定已与样品中的靶标相缔合的独特标记数目的步骤。这种随机方法将计数分子的问题从定位并鉴定相同分子的一个问题转变成关于检测一组预定义的标记的一系列是/否数字问题。

如在此所用,术语“一种标记”或“多种标记”可以是指与样品内的靶标缔合的核酸编码。标记可以是例如核酸标记。标记可以是整体或部分可扩增的标记。标记可以是整体或部分可测序的标记。标记可以是天然核酸中可鉴定为不同的一部分。标记可以是已知序列。标记可包括核酸序列的接点,例如天然序列和非天然序列的接点。如在此所用,术语“标记”可以与术语“索引”、“标签”或“标记-标签”互换使用。标记可以传达信息。例如,在不同的实施例中,标记可用于确定样品身份、样品来源、细胞身份和/或靶标。

如在此所用,术语“非消耗贮存池(non-depletingreservoirs)”可以是指由许多不同的标记组成的随机条形码库。非消耗贮存池可以包含大量的不同随机条形码,使得当非消耗贮存池与靶标库相缔合时,每种靶标很可能与独特的随机条形码相缔合。每个标记的靶分子的独特性可以通过随机选择的统计学确定,并且取决于与标记的多样性相比集合体中相同靶分子的拷贝数。所得到的标记的靶分子组的大小可以通过条形编码过程的随机性质和检测到的随机条形码的数目分析确定,然后允许计算原始集合体或样品中存在的靶分子的数目。当存在的靶分子的拷贝数与独特的随机条形码的数目之比较低时,标记的靶分子是高度独特的(即用指定标记标记了一个以上的靶分子的可能性非常低)。

如在此所用,“核酸”可以通常是指多核苷酸序列或其片段。核酸可以包括核苷酸。核酸对细胞可以是外源性或内源性的。核酸可以存在于无细胞环境中。核酸可以是基因或其片段。核酸可以是dna。核酸可以是rna。核酸可以包括一种或多种类似物(例如改变的骨架、糖或核碱基)。类似物的一些非限制性实例包括:5-溴尿嘧啶、肽核酸、xeno核酸、吗啉化合物、锁核酸、二醇核酸、苏糖核酸、双脱氧核苷酸、蛹虫草菌素、7-脱氮-gtp、荧光团(例如,连接至糖的罗丹明或荧光素)、含硫醇的核苷酸、生物素连接的核苷酸、荧光碱基类似物、cpg岛、甲基-7-鸟苷、甲基化的核苷酸、肌苷、硫尿苷、假尿苷、二氢尿苷、辫苷以及怀俄苷。“核酸”、“多核苷酸”、“靶多核苷酸”和“靶核酸”可以互换使用。

核酸可以包含一个或多个修饰(例如,碱基修饰、骨架修饰)以提供具有新的或增强的特征(例如,改善的稳定性)的核酸。核酸可以包含核酸亲和标签。核苷可以是碱基-糖组合。核苷的碱基部分可以是杂环碱基。此类杂环碱基的两种最常见的种类是嘌呤和嘧啶。核苷酸可以是进一步包含共价连接至核苷的糖部分的磷酸酯基团的核苷。对于包含戊呋喃糖的那些核苷,磷酸酯基团可以连接至糖的2’、3’或5’羟基部分。在形成核酸时,磷酸酯基团可以共价连接彼此相邻的核苷以形成线性聚合化合物。进而,该线性聚合化合物的对应末端可以进一步连接以形成环状化合物;然而,线性化合物通常是适合的。此外,线性化合物可以具有内部的核苷酸碱基互补性并且因此可以便于产生完全或部分双链化合物的方式折叠。在核酸内,磷酸酯基团可以通常涉及形成核酸的核苷间骨架。键联或骨架可以是3’至5’磷酸二酯键。

核酸可以包含修饰的骨架和/或修饰的核苷间键联。修饰的骨架可以包括在骨架中保留磷原子的那些和在骨架中不具有磷原子的那些。其中含有磷原子的适合的修饰的核酸骨架可以包括例如硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、甲基以及其他烷基膦酸酯(诸如3'-亚烷基膦酸酯、5'-亚烷基膦酸酯、手性膦酸酯)、亚膦酸酯、氨基磷酸酯(包括3'-氨基氨基磷酸酯和氨基烷基氨基磷酸酯、二氨基磷酸酯)、硫代氨基磷酸酯、硫代烷基膦酸酯、硫代烷基膦酸三酯、硒代磷酸酯以及具有正常3'-5'键联、2'-5’键联类似物的硼烷磷酸酯,以及具有其中一个或多个核苷酸间键联是3’至3'、5’至5'或2'至2’键联的反向极性的那些。

核酸可以包含这样的多核苷酸骨架,这些多核苷酸骨架通过短链烷基或环烷基核苷间键联、混合杂原子以及烷基或环烷基核苷间键联、或一个或多个短链杂原子或杂环核苷间键联形成。这些骨架可以包括具有以下各项的那些:吗啉代键联(部分地从核苷的糖部分中形成);硅氧烷骨架;硫化物、亚砜和砜骨架;甲酰乙酰基和硫代甲酰乙酰基骨架;亚甲基甲酰乙酰基和硫代甲酰乙酰基骨架;核乙酰基(riboacetyl)骨架;含烯烃的骨架;氨基磺酸酯骨架;亚甲基亚氨基和亚甲基肼基骨架;磺酸酯和磺酰胺骨架;酰胺骨架;以及具有混合的n、o、s和ch2组分的其他骨架。

核酸可以包括核酸模拟物。术语“模拟物”可以旨在包括这样的多核苷酸,其中仅呋喃糖环或呋喃糖环和核苷酸间键联两者被非呋喃糖基团置换,仅呋喃糖环的置换也可以称之为糖替代物。杂环碱基部分或修饰的杂环碱基部分可以被保持以用于与适当的靶核酸的杂交。一种这样的核酸可以是肽核酸(pna)。在pna中,多核苷酸的糖骨架可以被含酰胺骨架,具体地氨基乙基甘氨酸骨架置换。核苷酸可以被保留并且直接或间接地结合至骨架的酰胺部分的氮杂氮原子。pna化合物中的骨架可以包含给予pna含酰胺骨架的两个或更多个连接的氨基乙基甘氨酸单元。杂环碱基部分可以直接或间接地结合至该骨架的酰胺部分的氮杂氮原子。

核酸可以包含吗啉代骨架结构。例如,核酸可以包含6元吗啉代环以取代核糖环。在这些实施例中的一些中,二氨基磷酸酯或其他非磷酸二酯核苷间键联可以置换磷酸二酯键。

核酸可以包含连接的吗啉代单元(即吗啉代核酸),这些吗啉代单元具有连接到吗啉代环的杂环碱基。连接基团可以连接吗啉代核酸中的吗啉代单体单元。基于非离子吗啉代的寡聚化合物可以与细胞蛋白质具有不太希望的相互作用。基于吗啉代的多核苷酸可以是核酸的非离子模拟物。吗啉代种类内的多种化合物可以使用不同的连接基团连接。另一种类的多核苷酸模拟物可以称之为环己烯基核酸(cena)。核酸分子中正常地存在的呋喃糖环可以被环己烯基环置换。可以制备cenadmt保护的亚磷酰胺单体并且将其用于使用亚磷酰胺化学的寡聚化合物合成。将cena单体掺入到核酸链可以增加dna/rna杂合体的稳定性。cena寡腺苷酸可以与核酸补体形成复合体,这些复合体具有与天然复合体类似的稳定性。另一修饰可以包括锁核酸(lna),其中2’-羟基基团连接至糖环的4’碳原子,从而形成2’-c、4’-c-氧基亚甲基键,从而形成二环糖部分。键可以是桥接2’氧原子和4’碳原子的亚甲基(-ch2-)基团,其中n是1或2。lna和lna类似物可以显示出与互补核酸相当高的双链体热稳定性(tm=+3至+10℃)、3’核酸外切降解稳定性和良好的溶解特性。

核酸还可以包含核碱基(经常简称为“碱基”)修饰或取代。如在此所用,“非修饰”或“天然”核碱基可以包括嘌呤碱基(例如腺嘌呤(a)和鸟嘌呤(g)),以及嘧啶碱基(例如胸腺嘧啶(t)、胞嘧啶(c)以及尿嘧啶(u))。修饰的核碱基可以包括其他合成以及天然的核碱基,诸如5-甲基胞嘧啶(5-me-c)、5-羟甲基胞嘧啶、黄嘌呤、次黄嘌呤、2-氨基腺嘌呤、腺嘌呤和鸟嘌呤的6-甲基以及其他烷基衍生物、腺嘌呤和鸟嘌呤的2-丙基以及其他烷基衍生物、2-硫尿嘧啶、2-硫胸腺嘧啶以及2-硫胞嘧啶、5-卤代尿嘧啶以及胞嘧啶、5-丙炔基(-c=c-ch3)尿嘧啶和胞嘧啶以及嘧啶碱基的其他炔基衍生物、6-偶氮基尿嘧啶、胞嘧啶以及胸腺嘧啶,5-尿嘧啶(假尿嘧啶)、4-硫尿嘧啶,8-卤基、8-氨基、8-氢硫基、8-硫烷基、8-羟基以及其他8-取代腺嘌呤和鸟嘌呤,5-卤基具体地5-溴、5-三氟甲基以及其他5-取代的尿嘧啶和胞嘧啶、7-甲基鸟嘌呤和7-甲基腺嘌呤、2-f-腺嘌呤、2-氨基腺嘌呤、8-氮鸟嘌呤和8-氮腺嘌呤、7-脱氮鸟嘌呤和7-脱氮腺嘌呤、以及3-脱氮鸟嘌呤和3-脱氮腺嘌呤。修饰的核碱基可以包括三环嘧啶诸如吩噁嗪胞苷(1h-嘧啶并(5,4-b)(1,4)苯并噁嗪-2(3h)-酮)、酚噻嗪胞苷(1h-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3h)-酮)、g夹环(g-clamp)诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-h-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3h)-酮)、酚噻嗪胞苷(1h-嘧啶并(5,4-b)(1,4)苯并噻嗪-2(3h)-酮)、g夹环诸如取代的吩噁嗪胞苷(例如9-(2-氨基乙氧基)-h-嘧啶并(5,4-(b)(1,4)苯并噁嗪-2(3h)-酮)、咔唑胞苷(2h-嘧啶并(4,5-b)吲哚-2-酮)、吡啶并吲哚胞苷(h-吡啶并(3’,’:4,5)吡咯并[2,3-d]嘧啶-2-酮)。

如在此所用,术语“样品”可以是指包含靶标的组合物。适合用于由本披露方法、装置和系统进行的分析的样品包括细胞、组织、器官或生物体。

如在此所用,术语“取样装置”或“装置”可以是指可获取样品切片和/或将切片放置于基底上的装置。样品装置可以是指例如荧光激活细胞分选(facs)器、细胞分选器、活检针、活检装置、组织切片装置、微流体装置、刀片网格和/或切片机。

如在此使用,术语“固体支持物”可以是指多种随机条形码可以连接到其上的离散固体或半固体表面。固体支持物可以涵盖核酸可固定(例如共价或非共价地)在其上的、由塑料、陶瓷、金属或聚合物材料(例如水凝胶)组成的任何类型的固体、多孔或中空球体、球、轴承、圆柱或其他类似的构型中。固体支持物可以包括离散颗粒,该离散颗粒可以是球形(例如微球)或具有非球形或不规则形状诸如立方体、长方体、锥形、圆柱形、圆锥形、椭圆形或圆盘形等等。固体支持物可以与术语“珠”互换使用。固体支持物可以是指“基底”。基底可以是一种固体支持物类型。基底可以是指可在其上执行本披露的方法的连续固体或半固体表面。基底可以是指例如阵列、柱体、芯片、装置和载玻片。如在此所用,“固体支持物”和“基底”有时互换使用。

如在此所用,术语“空间标记”可以是指可以与空间中的位置相关联的标记。

如在此所用,术语“随机条形码”可以是指包含标记的多核苷酸序列。随机条形码可以是可用于随机标记的多核苷酸序列。随机条形码可以用于定量样品内的靶标。随机条形码可以用于控制在标记与靶标相缔合后可能发生的错误。例如,随机条形码可以用于评价扩增或测序错误。与靶标相缔合的随机条形码可以称为随机条形码-靶标或随机条形码-标签-靶标。

如在此所用,术语“随机条形编码”可以是指核酸的随机标记(例如条形编码)。随机条形编码可以利用递归泊松策略来相关联和定量与靶标缔合的标记。

如在此所用,术语“靶标”可以是指可以与随机条形码相缔合的成分。适合用于由本披露方法、装置和系统进行的分析的示例性靶标包括寡核苷酸、dna、rna、mrna、微小rna、trna等等。靶标可以是单链或双链的。在一些实施例中,靶标可以是蛋白质。在一些实施例中,靶标是脂质。

如在此所用,术语“逆转录酶”可以是指具有逆转录酶活性(即催化由rna模板对dna的合成)的一组酶。一般来讲,此类酶包括但不限于逆转录病毒逆转录酶、逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶、细菌逆转录酶、ii组内含子衍生的逆转录酶以及其突变体、变体或衍生物。非逆转录病毒逆转录酶包括非ltr逆转录转座子逆转录酶、逆转录质粒逆转录酶、逆转录子逆转录酶以及ii组内含子逆转录酶。ii组内含子逆转录酶的实例包括乳酸乳球菌(lactococcuslactis)li.ltrb内含子逆转录酶、嗜热细长聚球藻(thermosynechococcuselongates)tei4c内含子逆转录酶或嗜热脂肪土芽孢杆菌(geobacillusstearothermophilus)gsi-iic内含子逆转录酶。其他种类的逆转录酶可以包括许多种类的非逆转录病毒逆转录酶(即转录子、ii组内含子以及多样性生成的逆转录因子等等)。

如在此所用,术语“模板切换”可以是指逆转录酶从初始核酸序列模板切换至与由初始模板合成的核酸的3’端几乎没有互补性的新核酸序列模板的3’端的能力。靶多核苷酸的核酸拷贝可以使用模板切换形成。模板切换允许使用从初始核酸序列模板切换至与由初始模板合成的dna的3’端几乎没有互补性的新核酸序列模板的3’端的逆转录酶制备例如dna拷贝,从而允许合成直接将衔接序列连接至靶寡核苷酸序列而无需连接的连续产物dna。模板切换可以包括衔接子、同聚物加尾(例如聚腺苷酸化)、随机引物或可以与聚合酶相缔合的寡核苷酸的连接。

具有空间标记和维标记的随机条形码

在此披露了用于空间随机条形编码的方法、组合物、装置、系统以及试剂盒。在此披露的一些实施例提供了确定样品中多种靶标的数目和空间位置的方法。在一些实施例中,这些方法包括使用多种随机条形码随机条形编码样品中的多种靶标,其中多种随机条形码中的每一种包含空间标记和分子标记;使用分子标记估计多种靶标中的每一种的数目;并且使用空间标记鉴定多种靶标中的每一种的空间位置。在一些实施例中,该方法可以是多重复路的。样品可以包括多个细胞,并且多种靶标可以与多个细胞相关联。

在此披露了用于确定样品中多种靶标的空间位置的方法。在一些实施例中,这些方法包括:使用多种随机条形码在一个或多个时间点处随机条形编码样品中的多种靶标,其中多种随机条形码中的每一种包含空间标记;并且使用空间标记鉴定多种靶标中的每一种的空间位置。使用多种随机条形码随机条形编码样品中的多种靶标可以包括使用多种随机条形码在不同时间点处随机条形编码样品中的多种靶标。多种随机条形码中的每一种可以包含维标记,并且用于在不同时间点处随机条形编码多种靶标的多种随机条形码的维标记可以是不同的。维标记可以与不同的时间点相关联。

空间随机条形编码可以是指随机条形编码单细胞中的多个靶分子以确定靶分子的空间取向。如图1所示,本披露提供了用于使真实物理空间的信息与化学空间的信息相关联的方法。包括二维或三维样品(例如细胞)的样品105可以被分割为多个切片,例如110/111/112/113。在一些实施例中,切片110/111/112/113可以是物理上分割开的,然后基于物理分割是化学上分割开的。在一些实施例中,切片110/111/112/113可以是在没有进行物理分割的情况下而在化学上分割开的。在一些实施例中,可以从样品105中物理分离出115切片110/111/112/113。每个切片110/111/112/113可以被放置于基底125上的单独容器120中。可以对基底125中的切片110/111/112/113进行随机条形编码。随机条形编码可以包括用不同的条形码标记每个切片110/111/112/113中的不同靶标。在一些实施例中,不同的条形码包含空间标记。切片可以被随机标记、扩增和/或数字计数,其中不同靶标的数目可以根据对不同条形码的数字计数进行估计。不同条形码的空间标记的信息可以对应于样品105的位置。以此方式,该方法可以用于确定样品105中不同物理位置处的不同靶标的数目。

在此披露的方法、装置和系统可以用于基础研究、生物医学研究、环境测试以及临床诊断学中的多种应用。披露的方法、装置和系统的应用实例包括但不限于基因分型、基因表达谱绘制、检测和鉴定稀有细胞、诊断疾病或病状、确定疾病或病状的预后、确定疾病或病状的治疗进程和监测疾病或病状的治疗应答以及理解生物发展过程。例如,本披露的方法可以用于整个的转录组分析、稀有细胞(例如循环肿瘤细胞)分析、嵌合抗原受体t细胞(car-t)治疗分析(例如,确定相对于非响应者响应于car-t治疗的特异性细胞)以及神经科学(例如,用于例如自闭症、精神分裂症、双相性精神障碍、帕金森病以及阿尔茨海默病的疗法和诊断学)。在一些实施例中,这些方法可以包括治疗受试者。治疗受试者可以包括向受试者给予药物。

随机条形码可以是指可以用于随机标记(例如条形编码、加标签)靶标的多核苷酸序列。随机条形码可以包含一种或多种标记。示例性标记可以包括通用标记、细胞标记、分子标记、样品标记、板标记、空间标记和/或预空间标记。图2示出了具有本披露的空间标记的示例性随机条形码。随机条形码204可以包含可以将随机条形码连接至固体支持物205的5’胺。随机条形码可以包含通用标记、维标记、空间标记、细胞标记和/或分子标记。通用标记可以是5’-最末端标记。分子标记可以是3’-最末端标记。空间标记、维标记和细胞标记可以呈任何次序。在一些实施例中,通用标记、空间标记、维标记、细胞标记以及分子标记呈任何次序。随机条形码可以包含靶结合区。靶结合区可以与样品中的靶标相互作用。靶标可以是或包括核糖核酸(rna)、信使rna(mrna)、微小rna、小干扰rna(sirna)、rna降解产物、各自包含多聚(a)尾的rna以及其任何组合。在一些实施例中,多种靶标可以包括脱氧核糖核酸(dna)。

例如,靶结合区可以包含可以与mrna的聚(a)尾相互作用的寡聚(dt)序列。在一些实施例中,随机条形码的标记(例如,通用标记、维标记、空间标记、细胞标记以及分子标记)可以通过1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个核苷酸分开。

在一些实施例中,随机条形编码样品中的多种靶标包括使多种随机条形码与多种靶标杂交以生成随机条形编码的靶标,并且多种靶标中的至少一种与多种随机条形码中的一种杂交。多种靶标的一部分或全部可以与多种随机条形码杂交。例如,在一些实施例中,多种靶标中的每一种与多种随机条形码中的一种杂交。在一些实施例中,至少两种、三种、四种、五种、十种、二十种、五十种、一百种或一千种的多种靶标中的每一种与多种随机条形码中的一种杂交。随机条形码可以包含一种或多种通用标记。一种或多种通用标记对于连接到指定固体支持物的随机条形码组中的所有随机条形码可以是相同的。在一些实施例中,一种或多种通用标记对于连接到多个珠的所有随机条形码可以是相同的。在一些实施例中,通用标记可以包含能够与测序引物杂交的核酸序列。测序引物可以用于对包含通用标记的随机条形码进行测序。测序引物(例如,通用的测序引物)可以包括与高通量测序平台相关联的测序引物。在一些实施例中,通用标记可以包含能够与pcr引物杂交的核酸序列。在一些实施例中,通用标记可以包含能够与测序引物和pcr引物杂交的核酸序列。通用标记的能够与测序引物或pcr引物杂交的核酸序列可以称之为引物结合位点。通用标记可以包含可以用于启动随机条形码的转录的序列。通用标记可以包含可以用于延伸随机条形码或随机条形码内的区域的序列。通用标记的长度可以是至少约1、2、3、4、5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。通用标记可以包含至少约10个核苷酸。通用标记的长度可以是至多约1、2、3、4、5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。在一些实施例中,可裂解接头或修饰的核苷酸可以是通用标记序列的一部分以能够使随机条形码从支持物上裂解下来。

随机条形码可以包含维标记。维标记可以包含提供关于出现随机标记的维度的信息的核酸序列。例如,维标记可以提供关于靶标被随机条形编码的时间的信息。维标记可以与样品的随机条形编码时间相关联。维标记可以在随机标记的时间处被激活。不同的维标记可以在不同的时间处被激活。维标记提供了关于靶标、靶标组和/或样品被随机条形编码的次序的信息。例如,可以在细胞周期的g0期时随机条形编码细胞群体。可以在细胞周期的gl期时用随机条形码再次脉冲处理细胞。可以在细胞周期的s期时用随机条形码再次脉冲处理细胞,如此类推。每次脉冲(例如细胞周期的每个阶段)下的随机条形码可以包含不同的维标记。以此方式,维标记提供了关于在细胞周期的哪个阶段标记了哪种靶标的信息。维标记可以询问许多不同的生物时期。示例性的生物时期可以包括但不限于细胞周期、转录(例如转录起始)以及转录物降解。在另一实例中,样品(例如一个细胞、细胞群体)可以在用药物和/或疗法治疗之前和/或之后被随机标记。不同靶标的拷贝数目的变化可以指示样品对药物和/或疗法的应答。

维标记可以是可激活的。可激活的维标记可以在特定时间点处被激活。可激活的标记可以例如是组成型激活的(例如不被关闭的)。可激活的维标记可以例如是可逆型激活的(例如,可激活的维标记可以被打开和关闭)。维标记可以例如可逆地激活至少1、2、3、4、5、6、7、8、9或10次或更多次。维标记可以可逆地激活例如至少1、2、3、4、5、6、7、8、9或10次或更多次。在一些实施例中,维标记可以用以下各项激活:荧光、日光、化学事件(例如裂解、另一分子的连接、修饰的添加(例如聚乙二醇化、苏素化、乙酰化、甲基化、脱乙酰化、脱甲基化)、光化学事件(例如光笼蔽)以及非天然核苷酸的引入。

在一些实施例中,维标记对于连接到指定固体支持物(例如珠)的所有随机条形码可以是相同的,但对于不同的固体支持物(例如珠)可以是不同的。在一些实施例中,相同固体支持物上的至少60%、70%、80%、85%、90%、95%、97%、99%或100%的随机条形码可以包含相同的维标记。在一些实施例中,相同固体支持物上的至少60%的随机条形码可以包含相同的维标记。在一些实施例中,相同固体支持物上的至少95%的随机条形码可以包含相同的维标记。

在多个固体支持物(例如珠)中可以呈现多至106种或更多种独特的维标记序列。维标记的长度可以是至少约1、2、3、4、5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。维标记的长度可以是至多约300、200、100、90、80、70、60、50、40、30、20、15、12、10、9、8、7、6、5、4个或更少个核苷酸。维标记可以包含约5个至约200个之间的核苷酸。维标记可以包含约10个至约150个之间的核苷酸。维标记的长度可以包含约20个至约125个之间的核苷酸。

随机条形码可以包含空间标记。空间标记可以包含提供关于与随机条形码相缔合的靶分子的空间取向的信息的核酸序列。空间标记可以与样品的坐标相关联。坐标可以是固定坐标。例如坐标可以相对于基底是固定的。空间标记可以是参考二维或三维网格。坐标可以相对于界标是固定的。界标在空间中可以是可鉴定的。界标可以是可被成像的结构。界标可以是生物结构,例如解剖学界标。界标可以是细胞界标,例如细胞器。界标可以是非天然界标诸如具有可鉴定的鉴定物诸如颜色编码、条形编码、磁性特性、荧光剂、放射性或独特的大小或形状的结构。空间标记可以与物理分割(例如,孔、容器或微滴)相关联。在一些实施例中,多种空间标记一起使用以编码空间中的一个或多个位置。

空间标记对于连接到指定固体支持物(例如珠)的所有随机条形码可以是相同的,但对于不同的固体支持物(例如珠)可以是不同的。在一些实施例中,相同固体支持物上的至少60%、70%、80%、85%、90%、95%、97%、99%或100%的随机条形码可以包含相同的空间标记。在一些实施例中,相同固体支持物上的至少60%的随机条形码可以包含相同的空间标记。在一些实施例中,相同固体支持物上的至少95%的随机条形码可以包含相同的空间标记。

在多个固体支持物(例如珠)中可以呈现多至106种或更多种独特的空间标记序列。空间标记的长度可以是至少约1、2、3、4、5、10、15、20、25、30、35、40、45、50或更多个核苷酸。空间标记的长度可以是至多约300、200、100、90、80、70、60、50、40、30、20、15、12、10、9、8、7、6、5、4或更少个核苷酸。空间标记可以包含约5个至约200个之间的核苷酸。空间标记可以包含约10个至约150个之间的核苷酸。空间标记的长度可以包含约20个至约125个之间的核苷酸。

随机条形码可以包含细胞标记。细胞标记可以包含提供用于确定哪种靶核酸源自于哪个细胞的信息的核酸序列。在一些实施例中,细胞标记对于连接至指定固体支持物(例如珠)的所有随机条形码是相同的,但对于不同的固体支持物(例如珠)是不同的。在一些实施例中,相同固体支持物上的至少60%、70%、80%、85%、90%、95%、97%、99%或100%的随机条形码可以包含相同的细胞标记。在一些实施例中,相同固体支持物上的至少60%的随机条形码可以包含相同的细胞标记。在一些实施例中,相同固体支持物上的至少95%的随机条形码可以包含相同的细胞标记。

在多个固体支持物(例如珠)中可以呈现多至106种或更多种独特的细胞标记序列。细胞标记的长度可以是至少约1、2、3、4、5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。细胞标记的长度可以是至多约300、200、100、90、80、70、60、50、40、30、20、15、12、10、9、8、7、6、5、4个或更少个核苷酸。细胞标记可以包含约5个至约200个之间的核苷酸。细胞标记可以包含约10个至约150个之间的核苷酸。细胞标记的长度可以包含约20个至约125个之间的核苷酸。

细胞标记可以进一步包含限定长度例如各自7个核苷酸(等于在一些汉明纠错码中使用的位数)的独特的核酸子序列组,该核酸子序列组可以被设计成提供纠错能力。包括7个核苷酸序列的纠错子序列组可以被设计成使得组中的任何成对序列组合表现出限定的“遗传距离”(或错配碱基数),例如纠错子序列组可以被设计成表现出3个核苷酸的遗传距离。在这种情况下,检查针对标记的靶核酸分子(下文更全面描述的)的序列数据组中的纠错序列可以允许检测或校正扩增或测序错误。在一些实施例中,用于创建纠错码的核酸子序列的长度可以变化,例如它们的长度可以是3个核苷酸、7个核苷酸、15个核苷酸、或31个核苷酸。在一些实施例中,其他长度的核酸子序列可以用于创建纠错码。

在一些实施例中,随机条形码可以包含分子标记。分子标记可以包含提供对与随机条形码杂交的靶核酸物质的具体类型的鉴定信息的核酸序列。分子标记可以包含为与随机条形码(例如靶结合区)杂交的靶核酸物质的具体出现次数提供计数器的核酸序列。在一些实施例中,一组不同的分子标记被连接到指定固体支持物(例如珠)。在一些实施例中,连接到指定固体支持物(例如珠)的独特的分子标记序列可以多至105种或更多种。在一些实施例中,连接到指定固体支持物(例如珠)的独特的分子标记序列可以多至104种或更多种。在一些实施例中,连接到指定固体支持物(例如珠)的独特的分子标记序列可以多至103种或更多种。在一些实施例中,连接到指定固体支持物(例如珠)的独特的分子标记序列可以多至102种或更多种。分子标记的长度可以是至少约1、2、3、4、5、10、15、20、25、30、35、40、45、50或更多个核苷酸。分子标记的长度可以是至多约300、200、100、90、80、70、60、50、40、30、20、15、12、10、9、8、7、6、5、4或更少个核苷酸。

随机条形码可以包含靶结合区。在一些实施例中,靶结合区可以包含与靶标(例如靶核酸、靶分子,例如待分析的细胞核酸)例如特定基因序列特异性杂交的核酸序列。在一些实施例中,靶结合区可以包含可以连接(杂交)至特定靶核酸的特异性位置的核酸序列。在一些实施例中,靶结合区可以包含能够与限制性内切酶位点突出端(例如ecori粘性突出端)特异性杂交的核酸序列。随机条形码然后可以连接至包含与限制性内切位点突出端互补的序列的任何核酸分子。

在一些实施例中,靶结合区可以包含非特异性靶核酸序列。非特异性靶核酸序列可以是指可以不依赖于靶核酸的特异性序列结合多个靶核酸的序列。例如,靶结合区可以包含随机多聚体序列,或与mrna分子上的聚(a)尾杂交的寡聚dt序列。随机多聚体序列可以是例如随机二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体、九聚体、十聚体或具有任何长度的较高的多聚体序列。在一些实施例中,靶结合区对于连接到指定珠的所有随机条形码是相同的。在一些实施例中,对于连接到指定珠的多种随机条形码的靶结合区可以包含两种或更多种不同的靶结合序列。靶结合区的长度可以是至少约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。靶结合区的长度可以是至多约5、10、15、20、25、30、35、40、45、50个或更多个核苷酸。

随机条形码可以包含可以用于定向(例如比对)随机条形码的取向特性。随机条形码可以包含用于等电聚焦的部分。不同的随机条形码可以包含不同的等电聚焦点。当这些随机条形码被引入到样品时,可以使样品经受等电聚焦以便使随机条形码取向为已知方式。以此方式,取向特性可以用于发展样品中随机条形码的已知谱图。示例性取向特性可以包括电泳迁移率(例如基于随机条形码的大小)、等电点、自旋、导电性和/或自组装。例如,具有自组装取向特性的随机条形码可以在激活后自组装为特定取向(例如核酸纳米结构)。

随机条形码可以包含亲和特性。空间标记可以包含亲和特性。亲和特性可以包括可以有利于随机条形码与另一实体(例如细胞受体)的结合的化学和/或生物部分。例如,亲和特性可以包括抗体。抗体可以是对样品上的特异性部分(例如受体)是特异性的。抗体可以将随机条形码引导至特定细胞类型或分子。在特定细胞类型或分子处和/或附近的靶标可以是随机标记的。亲和特性还可以提供除空间标记的核苷酸序列之外的空间信息,因为抗体可以将随机条形码引导至特定位置。抗体可以是治疗性抗体。抗体可以是单克隆抗体。抗体可以是多克隆抗体。抗体可以是人源化的。抗体可以是嵌合的。抗体可以是裸抗体。抗体可以是融合抗体。

抗体可以是指全长(即,天然存在的或通过正常免疫球蛋白基因片段重组过程形成的)免疫球蛋白分子(例如igg抗体)或免疫球蛋白分子的免疫活性(即特异性结合)部分,如抗体片段。

抗体可以是抗体片段。抗体片段可以抗体的一部分,诸如f(ab’)2、fab’、fab、fv、sfv等等。抗体片段可以结合通过全长抗体鉴定的相同抗原。抗体片段可以包括由抗体的可变区组成的分离片段,诸如由重链和轻链的可变区组成的“fv”片段以及其中轻链可变区和重链可变区通过肽接头(“scfv蛋白”)连接的重组单链多肽分子。示例性抗体可以包括但不限于用于癌细胞的抗体、用于病毒的抗体、结合细胞表面受体(cd8、cd34、cd45)的抗体以及治疗性抗体。

固体支持物

在此披露的随机条形码可以与固体支持物(例如珠)相缔合(例如连接)。在一些实施例中,随机条形编码样品中的多种靶标可以通过包括与多种随机条形码相缔合的多个合成颗粒的固体支持物执行。在一些实施例中,固体支持物可以包括与多种随机条形码相缔合的多个合成颗粒。不同固体支持物上的多种随机条形码的空间标记的区别在于至少一个核苷酸。固体支持物可以例如包含呈二维或三维的多种随机条形码。合成颗粒可以是珠。珠可以是硅胶珠、可控孔度玻璃珠、磁性珠、dynabeads、交联葡聚糖/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠、或其任何组合。固体支持物可以包括聚合物、基质、水凝胶、针阵列装置、抗体、或其任何组合。在一些实施例中,固体支持物可以是自由浮动的。在一些实施例中,固体支持物可以被包埋在半固体或固体阵列中。随机条形码可以不与固体支持物相缔合。随机条形码可以是单独的核苷酸。随机条形码可以与基底相缔合。

如在此所用,术语“系接”、“连接”和“固定”可互换使用,并且可以是指用于将随机条形码连接到固体支持物的共价或非共价方式。多种不同的固体支持物中的任一种可以用作用于连接预先合成的随机条形码或用于随机条形码的原位固相合成的固体支持物。

在一些实施例中,固体支持物是珠。珠可以涵盖核酸可固定(例如共价地或非共价地)在其上的固体、多孔或中空球体、球、轴承、圆柱或其他类似构型中的一种或多种类型。珠可以是例如由塑料、陶瓷、金属、聚合物材料或其任何组合组成的。珠可以是或包括离散颗粒,该离散颗粒是球形(例如微球)或具有非球形或不规则形状诸如立方体、长方体、锥形、圆柱形、圆锥形、椭圆形或圆盘形等等。在一些实施例中,珠可以是非球形形状。

珠可以包含多种材料,包括但不限于顺磁性材料(例如镁、钼、锂和钽)、超顺磁性材料(例如铁氧体(fe3o4;磁铁矿)纳米粒子)、铁磁材料(例如铁、镍、钴、其一些合金以及一些稀有土金属化合物)、陶瓷、塑料、玻璃、聚苯乙烯、二氧化硅、甲基苯乙烯、丙烯酸聚合物、钛、乳胶、琼脂糖凝胶、琼脂糖、水凝胶、聚合物、纤维素、尼龙以及其任何组合。

珠的直径可以变化,例如是至少约100nm、500nm、1μm、5μm、10μm、20μm、25μm、30μm、35μm、40μm、45μm或50μm。在一些实施例中,珠的直径可以是至多约100nm、500nm、1μm、5μm、10μm、20μm、25μm、30μm、35μm、40μm、45μm或50μm。在一些实施例中,珠的直径可以与基底的孔直径相关。例如,珠的直径可以比孔的直径长或短至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。在一些实施例中,例如,珠的直径可以比孔的直径长或短至多10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。珠的直径可以与细胞(例如由基底的孔截留的单细胞)直径相关。珠的直径可以比细胞的直径长或短至少10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%或300%或更多。珠的直径可以比细胞的直径长或短至多10%、20%、30%、40%、50%、60%、70%、80%、90%、100%、150%、200%、250%或300%或更多。

珠可以连接到和/或包埋在基底中。珠可以连接到和/或包埋在凝胶、水凝胶、聚合物和/或基质中。珠在基底(例如凝胶、基质、支架或聚合物)中的空间位置可以使用珠上随机条形码上存在的可以充当位置地址的空间标记鉴定。

珠的实例可以包括但不限于链霉亲和素珠、琼脂糖珠、磁性珠、微珠、抗体缀合的珠(例如抗免疫球蛋白微珠)、蛋白质a缀合的珠、蛋白g缀合的珠、蛋白a/g缀合的珠、蛋白l缀合的珠、寡聚(dt)缀合的珠、二氧化硅珠、二氧化硅样珠、抗生物素微珠、抗荧光染料微珠以及bcmagtm羧基末端的磁性珠。

珠可以缔合有(例如浸渗有)量子点或荧光染料以使得其在一个荧光光学通道或多个光学通道中发荧光。珠可以与氧化铁或氧化铬相缔合以使得其具有顺磁性或铁磁性。珠可以是可鉴定的。例如,可以使用照相机对珠进行成像。珠可以具有与珠相缔合的可检测编码。例如,珠可以包含随机条形码。珠可以例如由于在有机或无机溶液中的溶胀而改变大小。珠可以是疏水性的。珠可以是亲水性的。珠可以是生物相容的。

固体支持物(例如珠)可以是可视化的。固体支持物可以包含可视化标签(例如荧光染料)。固体支持物(例如珠)可以被蚀刻有鉴定物(例如数字)。鉴定物可以通过对珠进行成像来可视化。

固体支持物可以是指不溶性、半溶性或不溶性材料。当固体支持物包含接头、支架、构建块(buildingblock)或连接到其上的其他反应性部分时可以称之为“官能化的”,然而,当固体支持物没有连接到其上的这种反应性部分时可以称之为“非官能化的”。固体支持物可以下述形式采用:游离于溶液中,诸如以微量滴定孔形式;以流通形式,诸如在柱中;或在测试条(dipstick)中。

固体支持物可以包括膜、纸、塑料、涂覆表面、平表面、玻璃、载玻片、芯片或其任何组合。固体支持物可以呈树脂、凝胶、微球或其他几何构型的形式。固体支持物可以包括二氧化硅芯片、合成颗粒、纳米粒子、板以及阵列。固体支持物可以包括珠(例如二氧化硅凝胶、可控孔度玻璃、磁性珠、dynabeads、王氏树脂;梅里菲尔德(merrifield)树脂、交联葡聚糖/琼脂糖凝胶珠、纤维素珠、聚苯乙烯珠等)、毛细管、平支持物诸如玻璃纤维过滤器、玻璃表面、金属表面(钢铁、金、银、铝、硅以及铜)、玻璃支持物、塑料支持物、硅支持物、芯片、过滤器、膜、微孔板、载玻片等等、塑料材料包括多孔板或膜(例如由聚乙烯、聚丙烯、聚酰胺、聚偏氟乙烯形成的)、晶片、梳状物、插针或针(例如适合于组合性合成或分析的插针阵列)或平表面诸如晶片(硅晶片)、带有具有或不具有滤底的凹陷的晶片的凹陷或纳升孔的阵列中的珠。

在一些实施例中,本披露的随机条形码可以连接到聚合物基质(例如,凝胶、水凝胶)。聚合物基质可以能够渗透细胞内空间(例如在细胞器周围)。聚合物基质可以能够被泵送成贯穿整个循环系统。

固体支持物可以是生物分子。例如,固体支持物可以是核酸、蛋白质、抗体、组蛋白、细胞区室、脂质、碳水化物等等。为生物分子的固体支持物可以被扩增、翻译、转录、降解和/或修饰(例如聚乙二醇化、苏素化)。除连接到生物分子的空间标记之外,为生物分子的固体支持物可以提供空间和时间信息。例如,生物分子在未修饰时可以包含第一构象,但是当经修饰时可以变化成第二构象。不同的构象可以使本披露的随机条形码暴露于靶标。例如,生物分子可以包含由于生物分子的折叠而难以接近的随机条形码。在生物分子经修饰(例如乙酰化)后,生物分子可以改变构象以暴露随机条形码。修饰的计时可以为本披露的随机条形编码方法提供另一时间维度。

在另一个实例中,包含本披露的随机条形码的生物分子可以位于细胞的细胞质中。在激活后,生物分子可以移动至细胞核,此时可以发生随机条形编码。以此方式,生物分子的修饰可以编码关于由随机条形码鉴定的靶标的附加空间-时间信息。

维标记可以提供关于生物事件(例如细胞分裂)的空间-时间的信息。例如,维标记可以添加到第一细胞,第一细胞可以分裂生成第二子细胞,第二子细胞可以包含全部、一些维标记或不包含维标记。维标记可以在初始细胞和子细胞中被激活。以此方式,维标记可以提供关于不同空间中随机条形编码的时间的信息。

微阵列

在一些实施例中,固体支持物/基底可以是指微阵列。微阵列可以包含原位合成或预先合成且以阵列图案沉积在基底上的多种聚合物,例如寡聚体。通过固相dna合成制造的寡聚物的微阵列可以具有接近106个/微米2的寡聚体密度。如在此所用,支持物结合的寡聚物可以称之为“探针”,这些探针用于与测试下的dna或rna材料的样品结合或杂交。然而,术语可以互换使用,其中表面结合的寡核苷酸作为靶标并且核酸的溶液样品作为探针。此外,一些研究者使测试下的靶标样品结合微阵列基底并且将寡聚体探针放置于溶液中以进行杂交。“靶标”或“探针”中的任一者可以是待通过另一者进行评估的(因此,任一者可以是待通过与另一者结合而进行评估的多核苷酸的未知混合物)。所有这些重复都处于在此论述的披露的范围之内。仅出于简明性的目的,在此探针是已知序列的表面结合的寡核苷酸并且靶标是待通过表面结合探针检测的在移动相(典型地流体)中的部分。在阵列中每个位置的多个探针和/或靶标可以称之为“核酸特征”或“特征”。特征定义为所有具有相同核苷酸序列的大量的探针和/或靶标固定在其上的基因座。

根据靶样品的组成,探针特征的杂交可以或可以不发生于所有探针特征位置处并且可以不同程度发生于不同的探针特征位置处。

“阵列”可以是指意图创建的分子集合体,该分子集合体可以合成或生物合成方式制备。阵列中的分子可以是彼此相同的或不同的。阵列可以呈现多种形式,例如可溶性分子的文库;系接到树脂珠、二氧化硅芯片或其他固体支持物的化合物的文库。阵列板或板,一种具有多个阵列并且形成区域或空间(称之为孔)的主体,其中每个阵列可以通过抵挡液体通过的物理屏障与其他阵列分开。

微阵列的密度可以高于500、5000、50000或500,000个不同的探针/cm2。探针的特征大小可以小于500、150、25、9或1μm2。探针的位置是可以确定的或可解码的。例如,在一些阵列中,探针的具体位置在结合测定之前是已知的。在一些其他阵列中,探针的具体位置是未知的,直到测定之后。探针可以任选地经由接头、珠等固定在基底上。

阵列可以包括由寡聚(dt)探针组成的特征。阵列可以包括由基因特异性探针组成的特征。在一些实施例中,阵列是微阵列。在一些实施例中,阵列是固体支持物(例如珠)的阵列。在一些实施例中,阵列是平面的。在一些实施例中,阵列具有拓扑特征。

基底

基底可以是指一种固体支持物类型。基底可以是指可以包含本披露的随机条形码的固体支持物。基底可以包括多个微孔。微孔可以包括限定体积的小反应室。微孔可以截留一个或多个细胞。微孔可以仅截留一个细胞。微孔可以截留一个或多个固体支持物。微孔可以仅截留一个固体支持物。在一些实施例中,微孔截留单细胞和单个固体支持物(例如珠)。

阵列的微孔可以多种形状和大小制造。适当的孔几何形状可以包括但不限于圆柱形、锥形、半球形、长方形或多面体(例如由若干个面组成的三维几何体,例如六角柱、八角柱、倒置三棱锥、倒置正方棱锥、倒置五棱锥、倒置六棱锥或倒置截棱锥)。微孔可以包括组合了这些几何结构中的两种或更多种的形状。例如,微孔可以部分是圆柱形,其中剩余部分具有倒置圆锥体的形状。微孔可以包括两个并排圆柱体,一个的直径(例如大致对应于珠的直径)大于另一个(例如大致对应于细胞的直径),这两个并排圆柱体通过延长了圆柱体的全长(深度)的垂直通道(即平行于圆柱体轴线)连接。微孔的开口可以处于基底的上表面处。微孔的开口可以处于基底的下表面处。微孔的闭合端(或底部)可以是平的。微孔的闭合端(或底部)可以具有弯曲表面(例如凸形的或凹形的)。微孔的形状和/或大小可以基于微孔内捕获的细胞或固体支持物的类型确定。

微孔尺寸可以根据孔的直径和深度来表征。如在此所用,微孔的直径是指可以刻划在微孔几何体的横截面内的最大圆。微孔的直径可以在为待捕获在微孔内的细胞或固体支持物的直径的从约1倍至约10倍的范围内。微孔直径可以是待捕获在微孔内的细胞或固体支持物的直径的至少1倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍或至少10倍。微孔直径可以是待捕获在微孔内的细胞或固体支持物的直径的至多10倍、至多5倍、至多4倍、至多3倍、至多2倍、至多1.5倍或至多1倍。微孔直径可以是待捕获在微孔内的细胞或固体支持物的直径的约2.5倍。

微孔的直径可以根据绝对尺寸规定。微孔的直径可以在从约5至约50微米的范围内。微孔直径可以是至少5微米、至少10微米、至少15微米、至少20微米、至少25微米、至少30微米、至少35微米、至少40微米、至少45微米或至少50微米。微孔直径可以是至多50微米、至多45微米、至多40微米、至多35微米、至多30微米、至多25微米、至多20微米、至多15微米、至多10微米或至多5微米。微孔直径可以是约30微米。

在一些实施例中,每个微孔的直径可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000纳米或在这些值的任何两个值之间的数值。在一些实施例中,每个微孔的直径可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000微米或在这些值的任何两个值之间的数值。在一些实施例中,每个微孔的直径可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000毫米或在这些值的任何两个值之间的数值。

微孔深度可以被选择成提供对细胞和固体支持物的有效捕获。微孔深度可以被选择成提供测定缓冲液与孔内含有的其他试剂的有效交换。直径与高度之比(即纵横比)可以被选择成使得一旦细胞和固体支持物沉降在微孔内部,它们将不因微孔上的流体运动而移位。在一些实施例中,微孔的高度可以小于珠的直径。例如,微孔的高度可以是珠的直径的至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90、95%或100%。珠可以突出在微孔的外侧。

微孔的尺寸可以被选择使得微孔具有足够的空间来接纳不同大小的固体支持物和细胞,而不会因微孔之上的流体运动而移去。微孔的深度可以在为待捕获在微孔内的细胞或固体支持物的直径的从约1倍至约10倍的范围内。微孔深度可以是待捕获在微孔内的细胞或固体支持物的直径的至少1倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍或至少10倍。微孔深度可以是待捕获在微孔内的细胞或固体支持物的直径的至多10倍、至多5倍、至多4倍、至多3倍、至多2倍、至多1.5倍或至多1倍。微孔深度可以是待捕获在微孔内的细胞或固体支持物的直径的约2.5倍。

微孔的深度可以根据绝对尺寸规定。微孔的深度可以在从约10至约60微米的范围内。微孔深度可以是至少10微米、至少20微米、至少25微米、至少30微米、至少35微米、至少40微米、至少50微米或至少60微米。微孔深度可以是至多60微米、至多50微米、至多40微米、至多35微米、至多30微米、至多25微米、至多20微米、或至多10微米。微孔深度可以是约30微米。

在一些实施例中,每个微孔的深度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000纳米或在这些值的任何两个值之间的数值。在一些实施例中,每个微孔的深度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000微米或在这些值的任何两个值之间的数值。在一些实施例中,每个微孔的深度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000毫米或在这些值的任何两个值之间的数值。

本披露的方法、装置和系统中使用的微孔的体积可以例如在从约200微米3至约120,000微米3的范围内变化。微孔体积可以是至少200微米3、至少500微米3、至少1,000微米3、至少10,000微米3、至少25,000微米3、至少50,000微米3、至少100,000微米3或至少120,000微米3。微孔体积可以是至多120,000微米3、至多100,000微米3、至多50,000微米3、至多25,000微米3、至多10,000微米3、至多1,000微米3、至多500微米3、或至多200微米3。微孔体积可以是约25,000微米3。微孔体积可以落入通过这些值中的任一个(例如从约18,000微米3至约30,000微米3)界定的任何范围之内。

在一些实施例中,每个微孔可以具有10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000纳升或在这些值的任何两个值之间的数值的体积。在一些实施例中,每个微孔可以具有1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000微升或在这些值的任何两个值之间的数值的体积。在一些实施例中,每个微孔可以具有1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000毫升或在这些值的任何两个值之间的数值的体积。

本披露的方法、装置和系统中使用的微孔的体积可以根据从一个微孔至另一个微孔的体积变化进一步表征。对于微孔体积的变化系数(表达为百分比)可以在从约1%至约10%的范围内。微孔体积的变化系数可以是至少1%、至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%或至少10%。微孔体积的变化系数可以是至多10%、至多9%、至多8%、至多7%、至多6%、至多5%、至多4%、至多3%、至多2%或至多1%。微孔体积的变化系数可以具有在由这些值涵盖的范围之内例如在约1.5%与约6.5%之间的任何值。在一些实施例中,微孔体积的变化系数可以是约2.5%。

本披露的方法、装置和系统中使用的微孔的体积与珠的表面积(或与随机条形码寡核苷酸可以连接到的固体支持物的表面积)之比可以例如在从约2.5至约1,520范围内变化。该比可以是至少2.5、至少5、至少10、至少100、至少500、至少750、至少1,000或至少1,520。该比可以是至多1,520、至多1,000、至多750、至多500、至多100、至多10、至多5或至多2.5。在一些实施例中,该比可以是或可以是约67.5。微孔体积与珠(或用于固定的固体支持物)的表面积之比可以落入由这些值(例如从约30至约120)中的任一个界定的任何范围之内。

微孔阵列的孔可以被布置成一维阵列、二维阵列或三维阵列。三维阵列可以例如通过将一系列两个或更多个二维阵列堆叠起来(即通过将包括微孔阵列的两个或更多个基底堆叠起来)来实现。

微孔之间的图案和间隔可以被选择成使将单细胞和单个固体支持物(例如珠)捕获在每个孔中的效率最佳化,以及使孔数目/阵列的单位面积最大化。微孔可以根据多种随机或非随机图案分布。例如,它们可以完全随机地分布在阵列基底的表面上,或者它们可以被布置成方格网、矩形格网、六角形格网等等。孔之间的中心至中心距离(或间隔)可以从约15微米至约75微米变化。在其他实施例中,孔之间的间隔是至少15微米、至少20微米、至少25微米、至少30微米、至少35微米、至少40微米、至少45微米、至少50微米、至少55微米、至少60微米、至少65微米、至少70微米或至少75微米。微孔间隔可以是至多75微米、至多70微米、至多65微米、至多60微米、至多55微米、至多50微米、至多45微米、至多40微米、至多35微米、至多30微米、至多25微米、至多20微米或至多15微米。微孔间隔可以是约55微米。微孔间隔可以落入通过这些值中的任一个(例如从约18微米至约72微米)界定的任何范围之内。

在一些实施例中,微孔可以彼此分开不超过0.01、0.1、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000微米或在这些值的任何两个值之间的数值。在一些实施例中,微孔可以彼此分开不超过1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000毫米或在这些值的任何两个值之间的数值。

在一些实施例中,微孔阵列可以每英寸2包括100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或在这些值的任何两个值之间的数值的孔。在一些实施例中,微孔阵列可以每cm2包括10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或在这些值的任何两个值之间的数值的孔。

微孔阵列可以包括微孔之间的表面特征,这些表面特征被设计用于帮助将细胞和固体支持物引导至孔中并且/或者防止它们存留在孔之间的表面上。适合的表面特征的实例可以包括但不限于环绕孔或跨在孔之间的表面上的圆顶形、脊形的或峰形表面特征。

微孔阵列中的孔的总数目可以通过孔的图案和间隔以及阵列的总体尺寸确定。阵列中微孔的数目可以例如在从约96个至约5,000,000个或更多个的范围内变化。阵列中微孔的数目可以是至少96个、至少384个、至少1,536个、至少5,000个、至少10,000个、至少25,000个、至少50,000个、至少75,000个、至少100,000个、至少500,000个、至少1,000,000个或至少5,000,000个。阵列中微孔的数目可以是至多5,000,000个、至多1,000,000个、至多75,000个、至多50,000个、至多25,000个、至多10,000个、至多5,000个、至多1,536个、至多384个或至多96个孔。阵列中微孔的数目可以是约96个。微孔的数目可以是约150,000个。阵列中微孔的数目可以落入通过这些值中的任一个(例如从约100个至325,000个)界定的任何范围之内。

可以使用许多种制造技术中的任何一种制造微孔阵列。可以使用的制造方法的实例包括但不限于体微机械加工(bulkmicromachining)技术,诸如光刻术和湿法化学蚀刻、等离子蚀刻或深度反应离子蚀刻;微模制和维压印;激光微机械加工;3d印刷或使用可固化材料的其他直接写入制造工艺;以及类似的技术。

可以使用许多种基底材料中的任何一种制造微孔阵列。材料的选择可以取决于制造技术的选择,并且反之亦然。适合材料的实例可以包括但不限于硅、熔凝硅石、玻璃、聚合物(例如,琼脂糖、明胶、水凝胶、聚二甲基硅氧烷(pdms;弹性体)、聚甲基丙烯酸甲酯(pmma)、聚碳酸酯(pc)、聚丙烯(pp)、聚乙烯(pe)、高密度聚乙烯(hdpe)、聚酰亚胺、环烯烃聚合物(cop)、环烯烃共聚物(col)、聚对苯二甲酸乙酯(pet)、环氧树脂、基于硫醇-烯的树脂、金属或金属膜(例如铝、不锈钢、铜、镍、铬以及钛)等等。亲水性材料可以是为制造微孔阵列所希望的(例如以增强润湿性并且最小化细胞与其他生物材料的非特异性结合)。可被处理或涂覆(例如通过氧等离子体处理或聚氧化乙烯表面层的接枝)的疏水性材料也可以使用。使用多孔亲水性材料制造微孔阵列可以是所希望的以便促进装置中截留的气泡的毛细管芯吸/排出。微孔阵列可以由单种材料制造。微孔阵列可以包含已经结合在一起或机械接合的两种或更多种不同的材料。

可以使用多种大小和形状中的任何一种的基底制造微孔阵列。例如,微孔被制造在其内的基底的形状(或足迹)可以是正方形、长方形、圆形的、或不规则形状。微孔阵列基底的足迹可以与微量滴定板的足迹类似。微孔阵列基底的足迹可以与标准显微镜载玻片的足迹类似,例如约75mm长×25mm宽(约3”长×1”宽)或约75mm长×50mm宽(约3”长×2”宽)。微孔被制造在其内的基底的厚度可以在从约0.1mm厚至约10mm厚或更大的范围内。微孔阵列基底的厚度可以是至少0.1mm厚、至少0.5mm厚、至少1mm厚、至少2mm厚、至少3mm厚、至少4mm厚、至少5mm厚、至少6mm厚、至少7mm厚、至少8mm厚、至少9mm厚或至少10mm厚。微孔阵列基底的厚度可以是至多10mm厚、至多9mm厚、至多8mm厚、至多7mm厚、至多6mm厚、至多5mm厚、至多4mm厚、至多3mm厚、至多2mm厚、至多1mm厚、至多0.5mm厚或至多0.1mm厚。微孔阵列基底的厚度可以是约1mm厚。微孔阵列基底的厚度可以是这些范围内的任何值,例如微孔阵列基底的厚度可以在约0.2mm与约9.5mm之间。

可以使用多种表面处理和表面修饰技术来改变微孔阵列表面的特性。实例可以包括但不限于用于使疏水性材料表面更亲水的氧等离子体处理;使用湿法或干法蚀刻技术用于平滑(或粗糙化)玻璃和硅表面;将聚氧化乙烯或其他聚合物层(诸如普朗尼克(pluronic))或牛血清白蛋白吸附至或接枝到基底表面以使得这些基底表面更亲水并且不太易于非特异性吸附生物分子和细胞;使用硅烷反应接枝化学反应性官能团以在其他方面使硅和玻璃表面具有惰性等。光去保护技术可以用于选择性地激活阵列结构中的特定位置处的化学反应性官能团,例如在微孔的内壁上选择性添加或活化化学反应性官能团诸如一级胺或羧基可以用于将寡核苷酸探针、肽、蛋白质或其他生物分子共价偶联到微孔的壁上。利用表面处理或表面修饰的选择可以取决于所需表面特性的类型和制备微孔阵列的材料类型中的两者或任一者。

微孔阵列的开口例如在细胞裂解步骤过程中可以是密封的以防止相邻微孔之间的靶核酸的交叉杂交。微孔(或微孔的阵列)可以例如使用夹靠在微孔阵列基底的表面的柔性膜或固体材料的片材(即板或台板)或适合的珠(其中珠的直径大于微孔的直径)密封或加盖。

使用柔性膜或固体材料的片材形成的密封件可以包括例如无机纳米孔膜(例如氧化铝)、透析膜、载玻片、盖玻片、弹性体膜(例如pdms)或亲水性聚合物膜(例如涂覆有已与裂解缓冲液水合的琼脂糖的薄膜的聚合物膜)。

用于加盖微孔的固体支持物(例如珠)可以包括本披露的固体支持物(例如珠)中的任一种。在一些实施例中,固体支持物是交联葡聚糖珠(例如交联葡聚糖)。交联葡聚糖可以在从约10微米至约80微米的范围内。用于加盖的交联葡聚糖珠可以是从20微米至约50微米。在一些实施例中,珠可以比微孔的直径大至少约10%、20%、30%、40%、50%、60%、70%、80%或90%。用于加盖的珠可以比微孔的直径大至多约10%、20%、30%、40%、50%、60%、70%、80%或90%。

密封件或盖可以允许缓冲液流入和流出微孔,同时防止大分子(例如核酸)从孔中迁移出。可以通过密封件或盖阻挡至少约1、2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19或20或更多个核苷酸的大分子迁移入或迁移出微孔中。可以通过密封件或盖阻挡至多约1、2、3、4、5、6、7、8、9、10、12、13、14、15、16、17、18、19或20或更多个核苷酸的大分子迁移入或迁移出微孔中。

固体支持物(例如珠)可以分布在基底中。固体支持物(例如珠)可以通过离心或其他非磁性方式分布在基底的孔中、从基底的孔中移除或者以其他方式输送通过包括一个或多个微孔阵列的装置。基底的微孔可以预加载有固体支持物。基底的微孔可以容纳至少1、2、3、4或5个或更多个固体支持物。基底的微孔可以容纳至多1、2、3、4或5个或更多个固体支持物。在一些实施例中,基底的微孔可以容纳一个固体支持物。

可以使用微孔的替代物区室化单独的细胞和珠,例如单个固体支持物和单细胞可以限制在乳液(例如在微滴数字微流体系统中)中的单个微滴之内。

细胞可以有可能限制在多孔珠之内,这些多孔珠自身包含多种系接的随机条形码。单独的细胞和固体支持物可以区室化在任何类型的容器、微容器、反应室、反应器等等中。

单个细胞随机条形编码可以在不使用微孔的情况下执行。单个细胞随机条形编码测定可以在不使用任何物理容器的情况下执行。例如,在不存在物理容器情况下的随机条形编码可以通过将细胞和珠彼此紧密接近地包埋在聚合物层或凝胶层内以创建不同细胞/珠对之间的扩散障碍。在另一个实例中,在不存在物理容器情况下的随机条形编码可以原位、在体内、在完整的实体组织上、在完整的细胞上和/或在亚细胞区域执行。

微孔阵列可以是测定系统的可消耗部件。微孔阵列可以是可重复使用的。微孔阵列可以被配置成用作用于手动地执行测定的独立装置,或者它们可以被配置成包括仪器系统的提供全部或部分自动的测定程序的固定或可移除部件。在本披露的方法的一些实施例中,作为测定程序的一部分,随机条形码的基于珠的文库可以沉积在微孔阵列的孔中。在一些实施例中,作为例如用于执行核酸靶标的随机条形编码和数字计数的试剂盒的一部分,珠可以预加载到微孔阵列的孔中并且提供给用户。

在一些实施例中,可以提供两个成对的微孔阵列,一个预加载有通过第一磁体保持在适当位置的珠,并且另一个由用户用于加载单独的细胞。在将细胞分布到第二微孔阵列中之后,将两个阵列面对面地放置并且移去第一磁体,同时使用第二磁体将珠从第一阵列吸引到第二阵列的相应微孔中,从而确保珠位于第二微孔阵列中的细胞上,并且由此最小化细胞裂解后的靶分子的扩散损失,同时最大化靶分子到珠上的随机条形码的有效连接。

在一些实施例中,基底不包括微孔。例如,珠可以是组装的(例如自组装的)。珠可以自组装成单层。单层可以在基底的平表面上。单层可以在基底的弯曲表面上。珠单层可以通过任何方法诸如醇蒸发形成。

三维基底

三维阵列可以是任何形状。三维基底可以由本披露的基底中使用的任何材料制备。在一些实施例中,三维基底包括dna折纸(origami)。dna折纸结构掺入dna作为构建材料来产生纳米级形状。dna折纸法可以涉及使用多个合理设计的“订书钉(staple)dna链”将一个或多个长“支架(scaffold)”dna链折叠为特定的形状。订书钉链的序列可以被设计使得它们与支架链的特定部分杂交并且在这种情况下迫使支架链成为特定结构。dna折纸可以包括支架链和多个合理设计的订书钉链。支架链可以具有任何足够的非重复序列。

订书钉链的序列可以被选择使得dna折纸具有随机标记可以连接到其的至少一种形状。在一些实施例中,dna折纸可以是具有至少一个内表面和至少一个外表面的任何形状。内表面可以是dna折纸的被在空间上防止与样品的表面相互作用的任何表面区域,而外表面是dna折纸的未被在空间上防止与样品的表面相互作用的任何表面区域。在一些实施例中,dna折纸具有一个或多个开口(例如两个开口),使得dna折纸的内表面可以被颗粒(例如固体支持物)接近。例如,在某些实施例中,dna折纸具有允许下述颗粒接触dna折纸的内表面的一个或多个开口,所述颗粒小于10微米、5微米、1微米、500nm、400nm、300nm、250nm、200nm、150nm、100nm、75nm、50nm、45nm或40nm。

dna折纸可以响应于一种或多种环境刺激而改变形状(构象)。因此,dna折纸的区域当dna折纸呈现一些构象时可以是内表面,但当装置呈现其他构象时可以是外表面。在一些实施例中,dna折纸可以通过呈现一种新构象而响应于某些环境刺激。

在一些实施例中,dna折纸的订书钉链可以被选择使得dna折纸基本上是桶形或管形的。dna折纸的订书钉可以被选择使得桶形状在两端处是闭合的或在一端处或两端处是开放的,从而允许颗粒进入桶的内部并且接近其内表面。在某些实施例中,dna折纸的桶形状可以是六边形管。

在一些实施例中,dna折纸的订书钉链可以被选择使得dna折纸具有第一结构域和第二结构域,其中第一结构域的第一端通过一个或多个单链dna铰链连接到第二结构域的第一端,并且第一结构域的第二端通过一个或多个分子锁闩(latch)连接到第二结构域的第二端。多个订书钉可以被选择使得如果所有分子锁闩由其对应外部刺激接触则第一结构域的第二端变得不连接到第二结构域的第二端。锁闩可以由两个或更多个订书钉链形成,该两个或更多个订书钉链包括具有能够结合外部刺激(诸如核酸、脂质或蛋白质)的至少一个刺激结合结构域的至少一个订书钉链,以及具有结合刺激结合结构域的至少一个锁闩结构域的至少另一个订书钉链。刺激结合结构域与锁闩结构域的结合支持了dna折纸的第一构象的稳定性。

空间标记可以三维递送至样品。例如,样品可以与阵列缔合,其中阵列具有分布成或可分布成三维的空间标记。三维阵列可以是支架、多孔基底、凝胶、一系列通道等等。

可以通过例如使用机器人将空间标记样品注射到样品的已知位置中使空间标记的三维图案与样品相关联。可以使用单个针来将空间标记在不同的深度处连续注射到样品中。针阵列可以在不同的深度处注射空间标记以生成三维分布的标记。

在一些实施例中,三维固体支持物可以是装置。例如,针阵列装置(例如活检针阵列装置)可以是基底。本披露的随机条形码可以连接到装置。将装置放置于样品中和/或上可以使本披露的随机条形码接近样品中和/或上的靶标。装置的不同部分可以具有带有不同的空间标记的随机条形码。例如,在针阵列装置上,装置的每个针可以涂覆有随机条形码,其中每个针上具有不同的空间标记。以此方式,空间标记可以提供关于靶标的位置(例如,在取向上相对于针阵列的位置)的信息。

探针

本披露的固体支持物/基底可以包含多个探针。探针的长度可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个核苷酸。探针的长度可以是至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个核苷酸。

探针可以是寡聚(dt)探针。探针可以是任何同聚物序列(例如聚(a)、聚(c)、聚(g)、聚(u))。

探针可以是基因特异性的。探针可以靶向基因的任何位置(例如3’utr、5’utr、编码区、启动子)。基底上的探针可以对多个基因是基因特异性的。例如,基底可以包含对至少10、20、30、40、50、60、70、80、90或100个或更多个基因是基因特异性的探针。基底可以包含对至少10、20、30、40、50、60、70、80、90或100个或更多个基因是基因特异性的探针。多个基因特异性探针可以均匀地分布在整个基底上。多个基因特异性探针可以在整个基底上分布在离散的位置。对每个基因存在相等数目的基因特异性探针。对每个基因存在不等数目的基因特异性探针。例如,基底上可以呈现与一个或多个其他基因特异性探针相比至少10%、20%、30%、40%、50%、60%、70%或80%或更多的一个或多个基因特异性探针。基底上可以呈现与一个或多个其他基因特异性探针相比至多10%、20%、30%、40%、50%、60%、70%或80%或更多的一个或多个基因特异性探针。

基底可以包含针对多个基因的多个基因特异性探针和多个寡聚(dt)探针。基因特异性探针和寡聚(dt)探针的组合可以用于本披露的桥式扩增方法。基因特异性探针与寡聚(dt)探针之比可以是至少1:1、1:2、1:3、1:4或1:5或更大。基因特异性探针与寡聚(dt)探针之比可以是至多1:1、1:2、1:3、1:4或1:5或更大。寡聚(dt)探针与基因特异性探针之比可以是至少1:1、1:2、1:3、1:4或1:5或更大。寡聚(dt)探针与基因特异性探针之比可以是至多1:1、1:2、1:3、1:4或1:5或更大。

复制基底上的探针可以包括本披露的任何探针或探针组合。复制基底上的探针可以与初始基底相同。复制基底上的探针可以与初始基底不同。例如,初始基底上的探针可以对基因的第一位置是基因特异性的。复制基底上的探针可以对相同基因的第二位置是基因特异性的。以此方式,探针可以用于鉴定(例如生成和/或检测)来自相同基因的多个扩增子。多个扩增子可以包含不同的遗传特征诸如snp。鉴定相同基因上的多个扩增子可以用于鉴定snp和/或遗传流动性事件(例如截短、易位、转座)。

在一些实施例中,初始基底上的探针可以是寡聚(dt)并且复制基底上的探针可以是基因特异性探针或基因特异性探针和寡聚(dt)的组合。

随机条形码在固体支持物和基底上的合成

随机条形码可以合成在固体支持物(例如珠)上。预先合成的随机条形码(例如,包含可连接至固体支持物的5’胺)可以通过涉及固体支持物和随机条形码上的官能团对的多种固定技术中的任何一种连接到固体支持物(例如珠)。随机条形码可以包含官能团。固体支持物(例如珠)可以包含官能团。随机条形码官能团和固体支持物官能团可以包括例如生物素、链霉亲和素、一种或多种一级胺、一种或多种羧基、一种或多种羟基、一种或多种醛、一种或多种酮、以及其任何组合。可以例如通过将随机条形码上的5’氨基基团偶联(例如使用1-乙基-3-(3-二甲基氨基丙基)碳二亚胺)在官能化的固体支持物的羧基基团上将随机条形码系接到固体支持物。残留的未偶联的随机条形码可以通过进行多个冲洗步骤从反应混合物中去除。在一些实施例中,随机条形码和固体支持物使用类似的连接化学经由接头分子(例如短的官能化烃分子或聚氧化乙烯分子)间接地连接。接头可以是可裂解接头,例如酸不稳定性接头或光可裂解接头。

可以使用许多种固相寡核苷酸合成技术中的任何一种将随机条形码合成在固体支持物(例如珠)上,这些技术诸如磷酸二酯合成、磷酸三酯合成、亚磷酸三酯合成以及亚磷酰胺合成。单核苷酸可以分步方式偶联至正在形成、系接的随机条形码。若干种寡核苷酸的短、预先合成的序列(或块)可以偶联至正在形成、系接的随机条形码。

随机条形码可以通过用一轮或多轮分离-聚库合成(split-poolsynthesis)散布分步式或分块式偶联反应来合成,其中合成珠的总库分为许多个单独的较小库,然后使这些较小库各自经受不同的偶联反应,然后进行单独库的重组和混合以随机化在珠的总库上正在形成的随机条形码序列。分离-聚库合成是组合式合成方法的一个实例,其中最大数目的化学化合物使用最小数目的化学偶联步骤合成。由此创建的化合物文库的潜在多样性通过用于每个偶联步骤的独特的构建块(例如核苷酸)的数目以及用于创建文库的偶联步骤数确定。例如,在每个步骤中使用4种不同的核苷酸、包括10轮偶联的分离-聚库合成将产生410=1,048,576种独特的核苷酸序列。在一些实施例中,分离-聚库合成可以使用酶法诸如聚合酶延伸或连接反应而不是化学偶联执行。例如,在每轮分离-聚库聚合酶延伸反应中,系接到指定库中的珠的随机条形码的3’端可以与半随机引物组的5’端杂交,这些半随机引物例如具有5’-(m)k-(x)i-(n)j-3’的结构的引物,其中(x)i是i个核苷酸长的核苷酸的随机序列(包括所有可能的(x)i组合的引物组),(n)j是特异性核苷酸(或j个核苷酸系列),并且(m)k是特异性核苷酸(或k个核苷酸系列),其中不同的脱氧核糖核苷三磷酸(dntp)被添加到每个库并且通过聚合酶掺入到系接的寡核苷酸。

缀合至或合成在固体支持物上的随机条形码的数目可以包括至少100、1000、10000或1000000种或更多种随机条形码。缀合至或合成在固体支持物上的随机条形码的数目可以包括至多100、1000、10000或1000000种或更多种随机条形码。缀合至或合成在固体支持物诸如珠上的寡核苷酸的数目可以比细胞中靶核酸的数目多至少1、2、3、4、5、6、7、8、9或10倍。缀合至或合成在固体支持物诸如珠上的寡核苷酸的数目可以比细胞中靶核酸的数目多至多1、2、3、4、5、6、7、8、9或10倍。至少10、20、30、40、50、60、70、80、90或100%的随机条形码可以被靶核酸结合。至多10、20、30、40、50、60、70、80、90或100%的随机条形码可以被靶核酸结合。至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100种或更多种不同的靶核酸可以被固体支持物上的随机条形码捕获。至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100种或更多种不同的靶核酸可以被固体支持物上的随机条形码捕获。

在一些实施方案中,随机条形码可以通过将单链dna混合物随机分布在预先涂覆有引物的基底上来合成。单链dna可以与引物杂交。可以进行桥式扩增以将单链dna转化为聚簇。可以进行测序以确定基底上的每个聚簇处的dna序列。可以将样品施加至基底,然后进行本披露的随机条形编码方法。

在一些实施例中,条形码可以利用大小和/或电泳迁移率合成。例如,可以制备随机条形码的混合物并且使用凝胶电泳法将其分离为二维。凝胶可以是基底。

随机条形编码的方法

本披露提供了用于估计身体样品(例如,组织、器官、肿瘤、细胞)中的不同位置处的不同靶标的数目的方法。这些方法可以包括将随机条形码放置成紧密接近样品、裂解样品、使不同的靶标与随机条形码相缔合、扩增靶标并且/或者数字计数靶标。该方法可以进一步包括分析和/或可视化从随机条形码上的空间标记获得的信息。在一些实施例中,这些方法包括可视化样品中的多种靶标。将多种靶标映射到样品的谱图上可以包括生成样品的二维谱图或三维谱图。二维谱图和三维谱图可在随机条形编码样品中的多种靶标之前或之后生成。可视化样品中的多种靶标可以包括将多种靶标映射到样品的谱图上。将多种靶标映射到样品的谱图上可以包括生成样品的二维谱图或三维谱图。二维谱图和三维谱图可在随机条形编码样品中的多种靶标之前或之后生成。在一些实施例中,二维谱图和三维谱图可在裂解样品之前生成。在生成二维谱图或三维谱图之前或之后裂解样品可以包括加热样品、使样品与洗涤剂接触、改变样品的ph、或其任何组合。

图3示出了本披露的随机条形编码方法的示例性实施例。可以使样品(例如,样品的切片、薄片和细胞)与包含随机条形码的固体支持物接触。样品中的靶标可以与随机条形码缔合。固体支持物可以被收集。cdna合成可以在固体支持物上进行。cdna合成可以脱离固体支持物进行。cdna合成可以将来自随机条形码中的标记的标记信息结合到被合成的新的cdna靶分子中,从而产生靶标-条形码分子。靶标-条形码分子可以使用pct扩增。靶标-条形码分子上的靶标和随机条形码的标记的序列可以通过测序方法确定。

使样品与随机条形码接触

本披露提供了用于使样品(例如细胞)与本披露的基底接触的方法。可以使包括例如细胞、器官或组织薄切片的样品与随机条形码接触。可以例如通过重力流动接触细胞,其中细胞可以沉降并且创建一个单层。样品可以是组织薄切片。薄切片可以置于基底上。样品可以是一维的(例如形成平表面)。样品(例如细胞)可以例如通过使细胞生长/培养在基底上而铺开在基底上。

当随机条形码紧密接近靶标时,靶标可以与随机条形码杂交。可以非可消耗比接触随机条形码,使得每个不同的靶标可以与本披露的不同的随机条形码相缔合。为了确保靶标与随机条形码之间的有效缔合,靶标可以交联至随机条形码。

细胞裂解

在分布细胞和随机条形码之后,可以裂解细胞以释放靶分子。细胞裂解可以通过多种方式中的任何一种完成,例如通过化学或生化方式、通过渗透压休克或通过热裂解、机械裂解或光线裂解。细胞可以通过添加以下各项来裂解:包含洗涤剂(例如sds、十二烷基硫酸锂、tritonx-100、吐温-20或np-40)的细胞裂解缓冲液、有机溶剂(例如甲醇或丙酮)或消化酶(例如蛋白酶k、胃蛋白酶或胰蛋白酶)或其任何组合。为了增加靶标和随机条形码的缔合性,可以通过例如降低温度和/或增加裂解物的粘度改变靶分子的扩散速率。

在一些实施例中,样品可以使用滤纸裂解。滤纸可以用在滤纸之上的裂解缓冲液浸湿。可以在可以有助于样品的裂解和样品的靶标与基底的杂交的压力存在下,将滤纸施加至样品。

在一些实施例中,裂解可以通过机械裂解、热裂解、光学裂解和/或化学裂解执行。化学裂解可以包括使用消化酶诸如蛋白酶k、胃蛋白酶和胰蛋白酶。裂解可以通过向基底添加裂解缓冲液来执行。裂解缓冲液可以包含trishcl。裂解缓冲液可以包含至少约0.01、0.05、0.1、0.5或1m或更多trishcl。裂解缓冲液可以包含至多约0.01、0.05、0.1、0.5或1m或更多trishcl。裂解缓冲液可以包含约0.1mtrishcl。裂解缓冲液的ph可以是至少约1、2、3、4、5、6、7、8、9或10或更高。裂解缓冲液的ph可以是至多约1、2、3、4、5、6、7、8、9或10或更高。在一些实施例中,裂解缓冲液的ph是约7.5。裂解缓冲液可以包含盐(例如licl)。裂解缓冲液中盐的浓度可以是至少约0.1、0.5或1m或更高。裂解缓冲液中盐的浓度可以是至多约0.1、0.5或1m或更高。在一些实施例中,裂解缓冲液中盐的浓度是约0.5m。裂解缓冲液中可以包含洗涤剂(例如sds、十二烷基硫酸锂、tritonx、吐温、np-40)。裂解缓冲液中洗涤剂的浓度可以是至少约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。裂解缓冲液中洗涤剂的浓度可以是至多约0.0001%、0.0005%、0.001%、0.005%、0.01%、0.05%、0.1%、0.5%、1%、2%、3%、4%、5%、6%或7%或更高。在一些实施例中,裂解缓冲液中洗涤剂的浓度是约1%十二烷基硫酸锂。裂解方法中使用的时间可以取决于使用的洗涤剂的量。在一些实施例中,使用的洗涤剂越多,裂解需要的时间越少。裂解缓冲液可以包含螯合剂(例如edta、egta)。裂解缓冲液中螯合剂的浓度可以是至少约1、5、10、15、20、25或30mm或更高。裂解缓冲液中螯合剂的浓度可以是至多约1、5、10、15、20、25或30mm或更高。在一些实施例中,裂解缓冲液中螯合剂的浓度是约10mm。裂解缓冲液可以包含还原剂(例如β-巯基乙醇、dtt)。裂解缓冲液中还原剂的浓度可以是至少约1、5、10、15、或20mm或更高。裂解缓冲液中还原剂的浓度可以是至多约1、5、10、15、或20mm或更高。在一些实施例中,裂解缓冲液中还原剂的浓度是约5mm。在一些实施例中,裂解缓冲液可以包含约0.1mtrishcl、约ph7.5、约0.5mlicl、约1%十二烷基硫酸锂、约10mmedta以及约5mmdtt。裂解可以在约4℃、10℃、15℃、20℃、25℃或30℃的温度下执行。裂解可以执行约1、5、10、15或20或更多分钟。裂解细胞可以包含至少约100000、200000、300000、400000、500000、600000或700000个或更多个靶核酸分子。裂解细胞可以包含至多约100000、200000、300000、400000、500000、600000或700000个或更多个靶核酸分子。

将随机条形码连接到靶核酸分子

在裂解细胞并使核酸分子从其释放之后,核酸分子可以与共定位的固体支持物的随机条形码随机地相缔合。缔合可以包括随机条形码的靶识别区与靶核酸分子的互补部分的杂交(例如随机条形码的寡聚(dt)可以与靶标的聚(a)尾相关作用)。用于杂交的测定条件(例如缓冲液ph、离子强度、温度等)可以被选择以促进特定的稳定性杂交体的形成。在一些实施例中,从裂解的细胞中释放的核酸分子可以与基底上的多个探针相缔合(例如与基底上的探针杂交)。当探针包含寡聚(dt)时,mrna分子可以与探针杂交并且进行逆转录。寡核苷酸的寡聚(dt)部分可以充当用于cdna分子的第一链合成的引物。

连接可以进一步包括将随机条形码的靶识别区与靶核酸分子的一部分连接。例如,靶结合区可以包含可以能够与限制性内切位点突出端(例如ecori粘性突出端)特异性杂交的核酸序列。测定程序可以进一步包括用限制性内切酶(例如ecori)处理靶核酸以创建限制性内切位点突出端。随机条形码然后可以连接至包含与限制性内切位点突出端互补的序列的任何核酸分子。连接酶(例如t4dna连接酶)可以用于接合两个片段。

来自多个细胞(或多个样品)的标记的靶标(例如靶标-条形码分子)可以随后例如通过收回随机条形码和/或靶标-条形码分子所连接到的珠进行合并。连接的靶标-条形码分子的基于固体支持物的集合体的收回可以通过使用磁性珠和外部施加的磁场来实现。一旦靶标-条形码分子已被合并,所有进一步的加工可以在单一反应器中进行。另外的加工可以包括例如逆转录反应、扩增反应、裂解反应、解离反应和/或核酸延伸反应。另外的加工反应可以在微孔内进行,也就是说,无需首先合并来自多个细胞的标记的靶核酸分子。

逆转录

本披露提供了一种用于使用逆转录创建随机靶标-条形码缀合物的方法。随机靶标-条形码缀合物可以包含随机条形码和靶核酸(即,随机条形编码的cdna分子)的全部或一部分的互补序列。相缔合的rna分子的逆转录可以通过添加逆转录引物以及逆转录酶发生。逆转录引物可以是寡聚dt引物、随机的六核苷酸引物或靶标特异性寡核苷酸引物。寡聚dt引物可以是或可以是约12-18个核苷酸的长度并且结合哺乳动物mrna的3’端处的内源性聚(a)尾。随机的六核苷酸引物可以在多种互补位点处结合mrna。靶标特异性寡核苷酸引物典型选择性地引发感兴趣的mrna。

在一些实施例中,标记的rna分子的逆转录可以通过添加逆转录引物发生。在一些实施例中,逆转录引物是寡聚(dt)引物、随机的六核苷酸引物或靶标特异性寡核苷酸引物。一般来讲,寡聚(dt)引物是约12-18个核苷酸的长度并且结合哺乳动物mrna的3’端处的内源性聚(a)+尾。随机的六核苷酸引物可以在多种互补位点处结合mrna。靶标特异性寡核苷酸引物典型选择性地引发感兴趣的mrna。

逆转录可以重复地发生以产生多个标记的cdna分子。在此披露的方法可以包括进行至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次逆转录反应。该方法可以包括进行至少约25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100次逆转录反应。

扩增

可以执行一次或多次核酸扩增反应以创建标记的靶核酸分子的多个拷贝。扩增可以多重复路方式执行,其中多种靶核酸序列同时进行扩增。扩增反应可以用于向核酸分子添加测序衔接子。扩增反应可以包括扩增样品标记(若存在的话)的至少一部分。扩增反应可以包括扩增细胞和/或分子标记(若存在的话)的至少一部分。扩增反应可以包括扩增样品标签、细胞标记、空间标记、分子标记、靶核酸或其组合的至少一部分。扩增反应可以包括扩增多个核酸的0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、100%或在这些值的任何两个值之间的范围或数值。该方法可以进一步包括进行一次或多次cdna合成反应以产生包含样品标记、细胞标记、空间标记和/或分子标记的靶标-条形码分子的一个或多个cdna拷贝。

在一些实施例中,扩增可以使用聚合酶链式反应(pcr)执行。如在此所用,pcr可以是指用于通过同时引物延伸dna的互补链进行特定dna序列的体外扩增的反应。如在此所用,pcr可以涵盖反应的衍生形式,包括但不限于rt-pcr、实时pcr、嵌套式pcr、定量pcr、多重pcr、数字pcr以及组装pcr。

标记的核酸的扩增可以包括基于非pcr的方法。基于非pcr的方法的实例包括但不限于多重置换扩增(mda)、转录介导的扩增(tma)、基于核酸序列的扩增(nasba)、链置换扩增(sda)、实时sda、滚环扩增或环-对-环(circle-to-circle)扩增。其他基于非pcr的方法包括用于扩增dna或rna靶标的dna依赖性rna聚合酶驱动的rna转录扩增或rna指导的dna合成和转录的多个循环、连接酶链式反应(lcr)和qβ复制酶(qβ)方法、使用回文探针、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、其中引物与核酸序列杂交并且所得双链体在延伸反应和扩增之前被裂解的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增以及分枝式延伸扩增(ram)。在一些实施例中,扩增不产生环化的转录物。

在一些实施例中,在此披露的方法进一步包括在标记的核酸(例如,标记的rna、标记的dna、标记的cdna)上进行聚合酶链式反应以产生随机标记的扩增子。标记的扩增子可以是双链分子。双链分子可以包括双链rna分子、双链dna分子或与dna分子杂交的rna分子。双链分子的一条或两条链可以包含样品标记、空间标记、细胞标记和/或分子标记。随机标记的扩增子可以是单链分子。单链分子可以包括dna、rna或其组合。本披露的核酸可以包括合成的或改变的核酸。

扩增可以包括使用一个或多个非天然核苷酸。非天然核苷酸可以包括光不稳定性或可触发的核苷酸。非天然核苷酸的实例可以包括但不限于肽核酸(pna)、吗啉代和锁核酸(lna)以及二醇核酸(gna)和苏糖核酸(tna)。非天然核苷酸可以添加到扩增反应的一个或多个循环。非天然核苷酸的添加可以用于鉴定扩增反应中特定循环或时间点的产物。

进行一次或多次扩增反应可以包括使用一种或多种引物。一种或多种引物可以包含例如1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个或更多个核苷酸。一种或多种引物可以包含至少1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个或更多个核苷酸。一种或多种引物可以包含小于12-15个核苷酸。一种或多种引物可以退火至多个随机标记的靶标的至少一部分。一种或多种引物可以退火至多个随机标记的靶标的3’端或5’端。一种或多种引物可以退火至多个随机标记的靶标的内部区域。内部区域可以是自多个随机标记的靶标的3’端的至少约50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900或1000个核苷酸。一种或多种引物可以包括一组固定引物。一种或多种引物可以包括至少一种或多种定制引物。一种或多种引物可以包括至少一种或多种对照引物。一种或多种引物可以包括至少一种或多种基因特异性引物。

一种或多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或多种定制引物可以退火至第一样品标记、第二样品标记、空间标记、细胞标记、分子标记、靶标或其任何组合。一种或多种引物可以包括通用引物和定制引物。定制引物可以被设计用于扩增一种或多种靶标。靶标可以包括一个或多个样品中总核酸的亚组。靶标可以包括一个或多个样品中总的随机标记的靶标的亚组。一种或多种引物可以包括至少96种或更多种定制引物。一种或多种引物可以包括至少960种或更多种定制引物。一种或多种引物可以包括至少9600种或更多种定制引物。一种或多种定制引物可以退火至两种或更多种不同的标记的核酸。两种或更多种不同的标记的核酸可以对应于一个或多个基因。

任何扩增方案可以用于本披露的方法中。例如,在一种方案中,第一轮pcr可以使用基因特异性引物和针对通用illumina测序引物1序列的引物扩增连接到珠的分子。第二轮pcr可以使用侧接illumina测序引物2序列的嵌套基因特异性引物和针对通用illumina测序引物1序列的引物扩增第一pcr产物。第三轮pcr添加p5和p7以及样品索引以将pcr产物转入到illumina测序文库中。使用150bp×2测序的测序可以揭示读取1上的细胞标记和分子索引、读取2上的基因和索引1读取上的样品索引。

在一些实施例中,可以使用化学裂解将核酸从基底去除。例如,可以使用核酸中存在的化学基团或修饰碱基来有助于其从固体支持物的去除。例如,可以使用酶将核酸从基底去除。例如,可以通过限制性内切核酸酶消化将核酸从基底去除。例如,用尿嘧啶-d-糖基化酶(udg)处理含有dutp或ddutp的核酸可以用于将核酸从基底去除。例如,可以使用执行核苷酸切除的酶诸如碱基切除修复酶诸如脱嘌呤/脱嘧啶(ap)将核酸从基底去除。在一些实施例中,可以使用光可裂解的基团和光将核酸从基底去除。在一些实施例中,可以使用可裂解接头将核酸从基底去除。例如,可裂解接头可以包括生物素/抗生物素蛋白、生物素/链霉亲和素、生物素/中性链亲和素、ig蛋白a、光不稳定性接头、酸或碱不稳定性接头或适配子中的至少一种。

当探针是基因特异性的时,分子可以与探针杂交并且进行逆转录和/或扩增。在一些实施例中,在核酸已合成(例如逆转录)之后,可以对其进行合成。扩增可以多重复路方式执行,其中多种靶核酸序列同时进行扩增。扩增可以向核酸添加测序衔接子。

在一些实施例中,扩增可以在基底上例如以桥式扩增执行。可以对cdna进行同聚物加尾以生成用于使用基底上的寡聚(dt)探针进行的桥式扩增的相容性端。在桥式扩增中,与模板核酸的3’端互补的引物可以是每对中共价地连接到固体颗粒的第一引物。当含有模板核酸的样品与颗粒接触并且执行单个热循环时,模板分子可以退火至第一引物并且通过添加核苷酸使第一引物在正向方向上延长以形成由模板分子和与模板互补的新形成的dna组成的双链体分子。在下一循环的加热步骤中,可以使双链体分子变性,从而模板分子从颗粒中释放并且留下通过第一引物连接到颗粒的互补dna链。在随后进行的退火和延长步骤的退火阶段中,互补链可以与第二引物杂交,该第二引物与从第一引物去除的位置处的互补链的区段互补。这种杂交可以使得互补链在第一引物与第二引物之间形成桥,该桥通过共价键固定到第一引物并且通过杂交固定到第二引物。在延长阶段中,可以通过在相同反应混合物中添加核苷酸使第二引物在反向方向上延长,从而将桥转化为双链桥。然后开始下一循环,并且可以使双链桥变性以产生两个单链的核酸分子,每个核酸分子具有经由第一引物和第二引物连接到颗粒的一端,并且每个核酸分子的另一端是未连接的。在这个第二循环的退火和延长步骤中,每个链可以与相同颗粒上的先前未使用的另外的互补引物杂交以形成新的单链桥。现在杂交的两种先前未使用的引物进行延长以将两个新桥转化为双链桥。

扩增反应可以包括扩增多个核酸的至少1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%或100%。

标记的核酸的扩增可以包括基于pcr的方法或基于非pcr的方法。标记的核酸的扩增可以包括标记的核酸的指数式扩增。标记的核酸的扩增可以包括标记的核酸的线性扩增。扩增可以通过聚合酶链式反应(pcr)执行。pcr可以是指用于通过同时引物延伸dna的互补链进行特定dna序列的体外扩增的反应。pcr可以涵盖反应的衍生形式,包括但不限于rt-pcr、实时pcr、嵌套式pcr、定量pcr、多重pcr、数字pcr、抑制pcr、半抑制pcr以及组装pcr。

在一些实施例中,标记的核酸的扩增包括基于非pcr的方法。基于非pcr的方法的实例包括但不限于多重置换扩增(mda)、转录介导的扩增(tma)、基于核酸序列的扩增(nasba)、链置换扩增(sda)、实时sda、滚环扩增或环-对-环扩增。其他基于非pcr的方法包括用于扩增dna或rna靶标的dna依赖性rna聚合酶驱动的rna转录扩增或rna指导的dna合成和转录的多个循环、连接酶链式反应(lcr)、qβ复制酶(qβ)、使用回文探针、链置换扩增、使用限制性内切核酸酶的寡核苷酸驱动的扩增、其中引物与核酸序列杂交并且所得双链体在延伸反应和扩增之前被裂解的扩增方法、使用缺乏5’外切核酸酶活性的核酸聚合酶的链置换扩增、滚环扩增以及分枝式延伸扩增(ram)。

在一些实施例中,在此披露的方法进一步包括在扩增的扩增子(例如靶标)上进行嵌套式聚合酶链式反应。扩增子可以是双链分子。双链分子可以包括双链rna分子、双链dna分子或与dna分子杂交的rna分子。双链分子的一条或两条链可以包含样品标签或分子鉴定物标记。可替代地,扩增子可以是单链分子。单链分子可以包括dna、rna或其组合。本发明的核酸可以包括合成的或改变的核酸。

在一些实施例中,该方法包括重复地扩增标记的核酸以产生多个扩增子。在此披露的方法可以包括进行至少约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20次扩增反应。可替代地,该方法包括进行至少约25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100次扩增反应。

扩增可以进一步包括将一个或多个对照核酸添加到包含多个核酸的一个或多个样品。扩增可以进一步包括将一个或多个对照核酸添加到多个核酸。对照核酸可以包含对照标记。

扩增可以包括使用一个或多个非天然核苷酸。非天然核苷酸可以包括光不稳定性和/或可触发的核苷酸。非天然核苷酸的实例包括但不限于肽核酸(pna)、吗啉代和锁核酸(lna)以及二醇核酸(gna)和苏糖核酸(tna)。非天然核苷酸可以添加到扩增反应的一个或多个循环。非天然核苷酸的添加可以用于鉴定扩增反应中特定循环或时间点的产物。

进行一次或多次扩增反应可以包括使用一种或多种引物。一种或多种引物可以包括一种或多种寡核苷酸。一种或多种寡核苷酸可以包含至少约7-9个核苷酸。一种或多种寡核苷酸可以包含小于12-15个核苷酸。一种或多种引物可以退火至多个标记的核酸的至少一部分。一种或多种引物可以退火至多个标记的核酸的3’端或5’端。一种或多种引物可以退火至多个标记的核酸的内部区域。内部区域可以是自多个标记的核酸的3’端的至少约50、100、150、200、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、650、700、750、800、850、900或1000个核苷酸。一种或多种引物可以包括一组固定引物。一种或多种引物可以包括至少一种或多种定制引物。一种或多种引物可以包括至少一种或多种对照引物。一种或多种引物可以包括至少一种或多种管家基因引物。一种或多种寡核苷酸可以包含选自由表23中的序列组成的组的序列。一种或多种引物可以包括通用引物。通用引物可以退火至通用引物结合位点。一种或多种定制引物可以退火至第一样品标签、第二样品标签、分子鉴定物标记、核酸或其产物。一种或多种引物可以包括通用引物和定制引物。定制引物可以被设计用于扩增一个或多个靶核酸。靶核酸可以包括一个或多个样品中总核酸的亚组。在一些实施例中,引物是连接到本披露的阵列的探针。

在一些实施例中,随机条形编码样品中的多种靶标进一步包括生成随机条形编码的靶标的索引文库。不同的随机条形码的分子标记可以彼此不同。生成随机条形编码的靶标的索引文库包括由样品中的多种靶标生成多种索引的多核苷酸。例如,对于包含第一索引的靶标和第二索引的靶标的随机条形编码的靶标的索引文库,第一索引的多核苷酸的标记区与第二索引的多核苷酸的标记区的区别可以在于至少一个、两个、三个、四个或五个核苷酸。在一些实施例中,生成随机条形编码的靶标的索引文库包括使多种靶标例如mrna分子与多种寡核苷酸(包含聚(t)区和标记区)接触;并且使用逆转录酶进行第一链合成以产生单链标记的cdna分子,每个cdna分子包含cdna区和标记区,其中多种靶标包括具有不同序列的至少两个mrna分子并且多种寡核苷酸包括具有不同序列的至少两种寡核苷酸。生成随机条形编码的靶标的索引文库可以进一步包括扩增单链标记的cdna分子,以产生双链标记的cdna分子;并且对双链标记的cdna分子进行嵌套式pcr,以产生标记的扩增子。在一些实施例中,该方法可以包括生成衔接子标记的扩增子。

随机条形编码可以使用核酸条形码或标签标记单独的核酸(例如dna或rna)分子。在一些实施例中,当cdna分子由mrna生成时,随机条形编码涉及将dna条形码或标签添加到cdna分子中。嵌套式pcr可以被进行来使pcr扩增偏移最小化。衔接子可以被添加来使用例如下一代测序(ngs)进行测序。

图4是示出了用于生成随机条形编码的靶标例如mrna的索引文库的非限制性示例性过程的示意图。如步骤1所示,逆转录过程可以编码具有独特分子标记、空间标记和通用pcr位点的每个mrna分子。具体地,通过将一组分子鉴定物标记410与rna分子402的聚(a)尾区408随机杂交,rna分子402可以被逆转录来产生标记的cdna分子404(包括cdna区406)。分子鉴定物标记410中的每一种可以包含靶结合区,例如聚(dt)区412、标记区414和通用pcr区416。

在一些实施例中,空间标记可以包含3至20个核苷酸。在一些实施例中,分子标记可以包含3至20个核苷酸。在一些实施例中,多种随机条形码中的每一种进一步包含通用标记和细胞标记中的一种或多种,其中通用标记对于固体支持物上的多种随机条形码是相同的并且细胞标记对于固体支持物上的多种随机条形码是相同的。在一些实施例中,通用标记可以包含3至20个核苷酸。在一些实施例中,细胞标记可以包含3至20个核苷酸。

在一些实施例中,标记区414可以包含分子标记418和空间标记420。在一些实施例中,标记区414可以包含通用标记、维标记以及细胞标记中的一种或多种。分子标记418的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。空间标记420的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。通用标记的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。通用标记对于固体支持物上的多种随机条形码可以是相同的并且细胞标记对于固体支持物上的多种随机条形码可以是相同的。维标记的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。

在一些实施例中,标记区414可以包含1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000个或者在这些值中的任何值之间的数值或范围的不同标记,诸如分子标记418和空间标记420。每种标记的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或者在这些值中的任何值之间的数值或范围的核苷酸。一组分子鉴定物标记410可以含有10、20、40、50、70、80、90、102、103、104、105、106、107、108、109、1010、1011、1012、1013、1014、1015、1020个或者在这些值中的任何值之间的数值或范围的分子鉴定物标记410。并且该组分子鉴定物标记410可以例如各自含有独特标记区414。标记的cdna分子404可以被纯化来去除过量的分子鉴定物标记410。纯化可以包括ampure珠纯化。

如步骤2所示,来自步骤1的逆转录过程的产物可以合并到1个管中并且使用第1pcr引物库和第1通用pcr引物进行pcr扩增。由于独特的标记区414,合并是可能的。具体地,标记的cdna分子404可以被扩增来产生嵌套式pcr标记的扩增子422。扩增可以包括多重pcr扩增。扩增可以包括在单一反应体积中使用96种多重引物进行的多重pcr扩增。在一些实施例中,多重pcr扩增可以在单一反应体积中利用10、20、40、50、70、80、90、102、103、104、105、106、107、108、109、1010、1011、1012、1013、1014、1015、1020种或者在这些值中的任何值之间的数值或范围的多重引物。扩增可以包括靶向特定基因的定制引物426a-c的第1pcr引物库424和通用引物428。定制引物426可以与标记的cdna分子404的cdna部分406’内的区域杂交。通用引物428可以与标记的cdna分子404的通用pcr区416杂交。

如图4的步骤3所示,来自步骤2的pcr扩增的产物可以用嵌套式pcr引物库和第2通用pcr引物扩增。嵌套式pcr可以使pcr扩增偏移最小化。具体地,嵌套式pcr标记的扩增子422可以通过嵌套式pcr进一步扩增。嵌套式pcr可以包括在单一反应体积中使用嵌套式pcr引物432a-c的嵌套式pcr引物库430和第2通用pcr引物428’进行多重pcr。嵌套式pcr引物库428可以含有或含有约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000种或者在这些值中的任何值之间的数值或范围的不同嵌套式pcr引物430。嵌套式pcr引物432可以含有衔接子434并且与标记的扩增子422的cdna部分406”内的区域杂交。通用引物428’可以含有衔接子436并且与标记的扩增子422的通用pcr区416杂交。因此,步骤3产生衔接子标记的扩增子438。在一些实施例中,嵌套式pcr引物432和第2通用pcr引物428’可以不含有衔接子434和436。衔接子434和436反而可以连接至嵌套式pcr的产物,以产生衔接子标记的扩增子438。

如步骤4所示,来自步骤3的pcr产物可以使用文库扩增引物进行pcr扩增以用于测序。具体地,衔接子434和436可以用于对衔接子标记的扩增子438进行一种或多种另外的测定。衔接子434和436可以与引物440和442杂交。一种或多种引物440和442可以是pcr扩增引物。一种或多种引物440和442可以是测序引物。一个或多个衔接子434和436可以用于进一步扩增衔接子标记的扩增子438。一个或多个衔接子434和436可以用于对衔接子标记的扩增子438进行测序。引物442可以含有板索引444,这样使得使用同一组分子鉴定物标记408生成的扩增子可以在一个测序反应中使用ngs进行测序。

测序

在一些实施例中,使用分子标记估计多种靶标的数目包括确定多种随机标记的空间标记和分子标记的序列并且计数具有不同序列的分子标记的数目。确定多种随机条形码的空间标记和分子标记的序列可以包括对多种随机条形码中的一些或全部进行测序。对多种随机条形码中的一些或全部进行测序可以包括生成各自具有100个或更多个碱基的读取长度的序列。

确定不同随机标记的核酸的数目可以包括确定标记的靶标、空间标记、分子标记、样品标记和细胞标记或其任何产物(例如标记的扩增子、标记的cdna分子)的序列。可以对扩增的靶标进行测序。确定随机标记的核酸或其任何产物的序列可以包括进行测序反应以确定样品标记、空间标记、细胞标记、分子标记的至少一部分、随机标记的靶标、其补体、其反向补体或它们的任何组合的至少一部分的序列。

可以使用多种测序方法执行确定核酸的序列(例如,扩增的核酸、标记的核酸、标记的核酸的cdna拷贝等),这些方法包括但不限于通过杂交测序(sbh)、通过连接测序(sbl)、量化增量荧光核苷酸附加测序(qifnas)、分步连接与裂解、荧光共振能量转移(fret)、分子信标、taqman报告探针消化、焦磷酸测序、荧光原位测序(fisseq)、fisseq珠、摆动测序(wobblesequencing)、多重测序、聚合集群(polony)测序;纳米格滚环测序(rolony)、等位基因特异性寡核苷酸连接测定(例如,寡核苷酸连接测定(ola)、使用连接的线性探针和滚环扩增(rca)读取、连接的持锁探针的单模板分子ola、或使用连接的环形持锁探针和滚环扩增(rca)读取的单模板分子ola)等等。

在一些实施例中,确定标记的核酸或其任何产物的序列包括配对末端测序、纳米孔测序、高通量测序、鸟枪法测序、染料终止剂测序、多重引物dna测序、引物步移、桑格双脱氧测序法、maxim-gilbert测序、焦磷酸测序、真正的单分子测序或其任何组合。可替代地,可以通过电子显微镜分析法或化学敏感场效应晶体管(chemfet)阵列来确定标记的核酸或其任何产物的序列。

也可以使用高通量测序方法,诸如使用平台(诸如roche454、illuminasolexa、abi-solid、离子半导体(iontorrent)、全基因组学公司(completegenomics)、太平洋生物科学(pacificbioscience)、螺旋(helicos)、polonator平台)的循环阵列测序。在一些实施例中,测序可以包括miseq测序。在一些实施例中,测序可以包括hiseq测序。

随机标记的靶标可以包括代表从生物体基因组基因的约0.01%至生物体基因组基因的约100%的核酸。例如,可以使用包括多个多聚体的靶标互补区通过从样品捕获的含有互补序列的基因对约0.01%的生物体基因组基因至约100%的生物体基因组基因进行测序。在一些实施例中,标记的核酸包括代表从生物体转录组转录物的约0.01%至生物体转录组转录物的约100%的核酸。例如,可以使用包含聚t尾的靶标互补区通过从样品捕获mrna对约0.501%的生物体转录组转录物至约100%的生物体转录组转录物进行测序。

确定多种随机条形码的空间标记和分子标记的序列可以包括对多种随机条形码的0.00001%、0.0001%、0.001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、99%、100%或者在这些值的两个值之间的任何数值或范围进行测序。确定多种随机条形码的空间标记和分子标记的序列可以包括对1、10、20、30、40、50、60、70、80、90、100、103、104、105、106、107、108、109、1010、1011、1012、1013、1014、1015、1016、1017、1018、1019、1020种或者在这些值的两个值之间的任何数值或范围的多种随机条形码进行测序。对多种随机条形码中的一些或全部进行测序可以包括生成序列,每个序列具有10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或在这些值的两个值之间的任何数值或范围的核苷酸或碱基的读取长度。

测序可以包括对标记的核酸的至少约10、20、30、40、50、60、70、80、90、100个或更多个核苷酸或碱基对进行测序。测序可以包括对标记的核酸的至少约200、300、400、500、600、700、800、900、1,000个或更多个核苷酸或碱基对进行测序。测序可以包括对标记的核酸的至少约1,500;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;或10,000个或更多个核苷酸或碱基对进行测序。

测序可以包括至少约200、300、400、500、600、700、800、900、1000个或更多个测序读取/运行。在一些实施例中,测序包括测序至少约1,500;2,000;3,000;4,000;5,000;6,000;7,000;8,000;9,000;或10,000个或更多个测序读取/运行。测序可以包括小于或等于约1,600,000,000个测序读取/运行。测序可以包括小于或等于约200,000,000个读取/运行。

样品

用于本披露的方法中的样品可以包括一个或多个细胞。样品可以是指一个或多个细胞。在一些实施例中,多个细胞可以包括一种或多种细胞类型。一种或多种细胞类型中的至少一种可以是脑细胞、心脏细胞、癌细胞、循环肿瘤细胞、器官细胞、上皮细胞、转移性细胞、良性细胞、原代细胞、循环细胞、或其任何组合。在一些实施例中,细胞是从癌组织切除的癌细胞,例如乳腺癌、肺癌、结肠癌、前列腺癌、卵巢癌、胰腺癌、脑癌、黑色素瘤以及非黑色素瘤皮肤癌等等。在一些实施例中,细胞来源于癌症但是从体液收集的(例如循环肿瘤细胞)。癌症的非限制性实例可以包括腺瘤、腺癌、鳞状细胞癌、基底细胞癌、小细胞癌、大细胞未分化癌、软骨肉瘤、以及纤维肉瘤。样品可以包括组织、单层细胞、固定细胞、组织切片、或其任何组合。样品可以包括来自受试者的生物样品、临床样品、环境样品、生物流体、组织或细胞。样品可以获自人、哺乳动物、狗、大鼠、小鼠、鱼、蝇、蠕虫、植物、真菌、细菌、病毒、脊椎动物或无脊椎动物。

在一些实施例中,细胞可以是已被病毒感染并且含有病毒寡核苷酸的细胞。在一些实施例中,病毒感染可以由选自下组的病毒导致,该组由以下各项组成:双链dna病毒(例如腺病毒、疱疹病毒或痘病毒)、单链(+链或“有义”)dna病毒(例如细小病毒)、双链rna病毒(例如呼肠孤病毒)、单链(+链或有义)rna病毒(例如小核糖核酸病毒和披膜病毒)、单链(-链或反义)rna病毒(例如第iv类病毒、弹状病毒)、单链(在其生命周期中具有dna中间体的(+链或有义)rna病毒)rna-rt病毒(例如逆转录病毒)、以及双链dna-rt病毒(例如嗜肝dna病毒)。示例性病毒可以包括但不限于sars、hiv、冠状病毒、伊波拉病毒、疟疾、登革热、丙型肝炎、乙型肝炎以及流感。

在一些实施例中,细胞是细菌。这些可以包括革兰氏阳性或革兰氏阴性细菌。可以使用本披露的方法、装置和系统分析的细菌的实例包括但不限于放线菌科(actinomedurae)、衣氏放线菌、炭疽杆菌、蜡样芽胞杆菌、肉毒梭菌、艰难梭菌、产气荚膜梭菌、破伤风梭菌、棒状杆菌、粪肠球菌、单核细胞增生李斯特菌、诺卡氏菌属、痤疮丙酸杆菌、金黄色葡萄球菌、表皮葡萄球菌(staphylococcusepiderm)、变异链球菌、肺炎链球菌等等。革兰氏阴性细菌包括但不局限于猫阿菲波菌(afipiafelis)、类杆菌(bacteriodes)、杆状巴尔通体、百日咳杆菌、伯氏疏螺旋体、回归热疏螺旋体、布鲁氏菌(brucella)、肉芽肿鞘杆菌、弯曲杆菌、大肠杆菌、土拉热弗朗西丝菌、阴道加德纳菌、埃及嗜血杆菌(haemophiliusaegyptius)、杜克雷嗜血杆菌(haemophiliusducreyi)、流感嗜血杆菌、幽门螺杆菌、嗜肺军团菌、问号钩端螺旋体、脑膜炎奈瑟菌、牙龈卟啉单胞菌、斯氏普罗维登斯菌(providenciasturti)、铜绿假单胞菌、肠炎沙门菌(salmonellaenteridis)、伤寒沙门菌、粘质沙雷菌、波伊德志贺氏菌、念珠状链杆菌、化脓链球菌、梅毒螺旋体、霍乱弧菌、小肠结肠炎耶尔森菌、鼠疫耶尔森菌等等。其他细菌可以包括鸟分枝杆菌、麻风分枝杆菌(myobacteriumleprae)、结核分枝杆菌(myobacteriumtuberculosis)、汉赛巴尔通体(bartonellahenseiae)、鹦鹉热衣原体、沙眼衣原体、伯氏考克斯体、肺炎支原体、螨立克次体、普氏立克次氏体、立氏立克次体、姜虫病立克次氏体、斑疹伤寒立克次氏体、尿素分解脲原体、肺炎双球菌、查菲埃立克体(ehrlichiachafensis)、屎肠球菌、脑膜炎球菌等等。

在一些实施例中,细胞是真菌。可以使用本披露的方法、装置和系统分析的真菌的非限制性实例包括但不限于曲霉属、假丝酵母属、白色念珠菌、粗球孢子菌、隐球菌(cryptococci)及其组合。

在一些实施例中,细胞是原生动物或其他寄生物。使用本披露的方法、装置和系统分析的寄生物的实例包括但不限于:结肠小袋纤毛虫、小球隐孢子虫、卡晏环孢子虫(cyclosporacayatanensis)、脑胞内原虫属(encephalitozoa)、溶组织内阿米巴、比氏肠孢虫(enterocytozoonbieneusi)、兰伯贾第虫、利什曼原虫、疟原虫(plasmodii)、鼠弓形体、锥体虫(trypanosomae)、梯形阿米巴(trapezoidalamoeba)、蠕虫类(例如,蠕虫(helminthes))、尤其是寄生蠕虫(包括但不限于线虫纲(蛔虫(例如,鞭虫、钩虫、蛲虫、禽蛔虫、丝状虫等)、绦虫纲(例如,绦虫)。

如在此所用,术语“细胞”可以是指一个或多个细胞。在一些实施例中,细胞是正常细胞,例如不同发育阶段的人类细胞或来自不同器官或组织类型的人类细胞(例如白细胞、红细胞、血小板、上皮细胞、内皮细胞、神经元、胶质细胞、成纤维细胞、骨骼肌细胞、平滑肌细胞、配子或来自心脏、肺、大脑、肝、肾、脾、胰脏、胸腺、膀胱、胃、结肠、小肠的细胞)。在一些实施例中,细胞可以是未分化的人类干细胞或已被诱导分化的人类干细胞。在一些实施例中,细胞可以是胎儿人类细胞。胎儿人类细胞可以获自怀有胎儿的母亲。在一些实施方案中,细胞是稀有细胞。稀有细胞可以是例如循环肿瘤细胞(ctc)、循环上皮细胞、循环内皮细胞、循环子宫内膜细胞、循环干细胞、干细胞、未分化干细胞、癌干细胞、骨髓细胞、祖细胞、泡沫细胞、间充质细胞、滋养细胞、免疫系统细胞(宿主或移植物)、细胞片段、细胞器(例如,线粒体或核)、病原体感染的细胞等等。

在一些实施例中,细胞是非人类细胞,例如是其他类型的哺乳动物细胞(例如小鼠、大鼠、猪、狗、牛或马)。在一些实施例中,细胞是其他类型的动物或植物细胞。在其他实施例中,细胞可以是任何原核或真核细胞。

在一些实施例中,第一细胞样品获自不患有疾病或的个体,并且第二细胞样品获自患有疾病或病状的个体。在一些实施例中,个体是不同的。在一些实施例中,个体是相同的,但细胞样品是在不同时间点处获取的。在一些实施例中,个体是患者,并且细胞样品是患者样品。疾病或病状可以癌症、细菌感染、病毒感染、炎性疾病、神经退行性疾病、真菌疾病、寄生虫病、遗传病症或其任何组合。

在一些实施例中,适用于当前披露的方法中的细胞的直径大小可以是在从约2微米至约100微米的范围内。在一些实施例中,细胞可以具有至少2微米、至少5微米、至少10微米、至少15微米、至少20微米、至少30微米、至少40微米、至少50微米、至少60微米、至少70微米、至少80微米、至少90微米或至少100微米的直径。在一些实施例中,细胞可以具有至多100微米、至多90微米、至多80微米、至多70微米、至多60微米、至多50微米、至多40微米、至多30微米、至多20微米、至多15微米、至多10微米、至多5微米或至多2微米的直径。细胞可以具有在一个范围,例如从约5微米至约85微米内的任何值的直径。在一些实施例中,细胞具有约10微米的直径。

在一些实施例中,细胞在细胞与珠相缔合之前被分选出。例如,细胞可以通过荧光活化细胞分选法或磁活化细胞分选法,或更通常地通过流式细胞术分选出。细胞可以根据大小过滤。在一些实施例中,滞留物含有待与珠相缔合的细胞。在一些实施例中,流过物(flowthrough)含有待与珠相缔合的细胞。

样品可以是指多个细胞。样品可以是指单层细胞。样品可以是指薄切片(例如,组织薄切片)。样品可以是指可以沿一个维度放置在阵列上的细胞的固体或半固体集合体。

空间标记的分辨率

本披露的方法涉及空间标记的分辨率与随机条形码(例如细胞)的大小和/或间隔之间的关系。当样品大于空间标记的间隔时,样品中靶标的分辨率可能较高。当样品小于空间标记的间隔时,样品中靶标位置的分辨率可能较低。

随机条形码可以为样品的最长尺寸的至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的距离间隔开。随机条形码可以为样品的最长尺寸的至多5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的距离间隔开。随机条形码可以为样品的最短尺寸的至少5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的距离间隔开。随机条形码可以为样品的最短尺寸的至多5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的距离间隔开。

样品可以与一种或多种类型的随机条形码相缔合,其中每种类型的随机条形码包含不同的空间标记。样品可以与至少1、2、3、4、5、6、7、8、9或10种或更多种类型的随机条形码(例如不同的空间标记)相缔合。样品可以与至多1、2、3、4、5、6、7、8、9或10种或更多种类型的随机条形码(例如不同的空间标记)相缔合。可以与样品相缔合的随机条形码的类型数目可以与条形码相对于样品的大小的间隔相关。

在一些实施例中,本披露的方法涉及空间标记的分辨率与样品的间隔之间的关系。当样品间隔过远(例如在基底上)时,样品中的靶标的空间分辨率可能较高,因为样品之间的扩散可以不污染样品。当样品间隔成靠在一起(例如在基底上)时,样品中的靶标的空间分辨率可能较低,因为样品之间靶标的扩散可以污染邻近样品。

样品可以间隔开至少1、100、200、300、400、500、600、700、800、900微米或更多。样品可以间隔开至多1、100、200、300、400、500、600、700、800、900微米或更多。样品可以间隔开至少1、100、200、300、400、500、600、700、800、900毫米或更多。样品可以间隔开至多1、100、200、300、400、500、600、700、800、900毫米或更多。样品可以间隔开至少1、100、200、300、400、500、600、700、800、900米或更多。样品可以间隔开至多1、100、200、300、400、500、600、700、800、900米或更多。

来自样品的靶标可以扩散至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100纳米或更多。来自样品的靶标可以扩散至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95或100纳米或更多。来自样品的靶标可以扩散至少0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1毫米或更多。来自样品的靶标可以扩散至多0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9或1毫米或更多。

用于空间鉴定样品中的核酸的方法

在此披露了用于确定样品中多种靶标的空间位置的方法。在一些实施例中,这些方法包括:对样品进行成像以生成样品图像;使用多种随机条形码随机条形编码样品中的多种靶标以生成随机条形编码的靶标,其中多种随机条形码中的每一种可以包含空间标记;并且使用空间标记鉴定多种靶标中的每一种的空间位置。使用空间标记鉴定多种靶标中的每一种的空间位置可以包括使样品图像与样品中的多种靶标的空间标记相关联。对样品进行成像可以包括用染色剂染色样品,其中染色剂是荧光染色剂、阴性染色剂、抗体染色剂、或其任何组合。对样品进行成像可以包括使用光学显微镜、电子显微镜、共聚焦显微镜、荧光显微镜、或其任何组合对样品进行成像。使样品图像与样品中的多种靶标的空间标记相关联可以包括使样品图像与样品中的多种靶标的空间标记重叠。样品可以包括来自受试者的生物样品、临床样品、环境样品、生物流体、组织或细胞。在一些实施例中,这些方法可以包括基于样品中的多种靶标的空间标记确定受试者的基因型、表型或一个或多个基因突变。在一些实施例中,这些方法可以包括预测受试者对一种或多种疾病的易感性。一种或多种疾病中的至少一种可以是癌症或遗传性疾病。样品可以包括多个细胞,并且多种靶标可以与多个细胞相关联。多个细胞可以包括一种或多种细胞类型。在一些实施例中,这些方法可以包括确定样品中的多个细胞的细胞类型。可以基于样品中的多个细胞的细胞类型的预测响应性选择药物。

成像

可以对接触到基底的样品进行分析(例如使用免疫组织化学、染色和/或成像)。免疫组织化学的示例性方法可以包括使通过将标记引入到能够识别待检测的生物物质的物质中获得的标记的探针生物物质与组织切片反应的步骤,以经由生物物质之间的特异性结合反应可视化组织切片上存在的待检测的生物物质。

对于组织学样本,将组织片段固定在适合的固定剂,典型地福尔马林中,并且包埋在熔融的石蜡中。可以在切片机上切割蜡块以产生含有组织的石蜡薄片。可以将样本切片施加至基底、进行气流干燥并且加热以使得样品粘附至玻璃片上。残留的石蜡可以可以用适合的溶剂,典型地二甲苯、甲苯或其他溶剂溶解。这些所谓的去石蜡化溶剂可以在染色之前用洗涤-脱水型试剂去除。切片可以由冷冻样本制备、短暂固定在10%福尔马林中,然后用脱水试剂注入。脱水试剂可以在用水性染色剂染色之前去除。

在一些实施例中,可以使用巴氏(papanicolaou)染色技术(例如渐进性染色和/或苏木素-伊红(hematoxylineosin)[h&e],即退行性染色)。he(苏木素-伊红)染色使用苏木素和伊红作为染料。苏木素是蓝-紫色染料,并且具有染色嗜碱性组织诸如细胞核、骨组织、软骨组织部分以及血清组分的特性。伊红是红至桃红色染料,并且具有染色嗜酸性组织诸如细胞质、软组织的结缔组织、红细胞、纤蛋白以及内分泌颗粒的特性。

免疫组织化学(ihc)可以称之为“免疫学染色”,这是由于可视化了原本不可见的抗原-抗体反应的颜色发展的过程(在下文中,术语“免疫组织化学染色”可以用于免疫组织化学)。凝集素染色是可以非免疫学和特异性方式利用凝集素的结合特异性糖链的特性以使用凝集素检测组织样本中的糖链的技术。

he染色、免疫组织化学和凝集素染色可以用于检测细胞样本中的例如癌细胞的位置。例如,当希望确认细胞样本中癌细胞的位置时,病理学家为了确定细胞样本中癌细胞的存在或不存在可以制备组织切片并且将它们放置在本披露的基底上。可以对阵列上的切片进行he染色、成像或任何免疫组织化学分析,以获得其形态信息和/或任何其他鉴定特征(诸如稀有细胞的存在或不存在)。样品可以是裂解的并且核酸分子的存在或不存在可以使用本披露的方法确定。核酸信息可以与图像进行比较(例如在空间上进行比较),从而指示样品中核酸的空间位置。

在一些实施例中,组织用染色增强剂(例如化学渗透增强剂)染色。有助于染色剂渗透到组织中的组织化学渗透增强剂的实例包括但不限于聚乙二醇(peg);表面活性剂诸如聚氧乙烯脱水山梨醇、聚氧乙烯醚(聚氧乙烯脱水山梨醇单月桂酸酯(吐温20)和其他吐温衍生物、聚氧乙烯23月桂基醚(brij35)、tritonx-100、brij35、nonidetp-40;洗涤剂样物质诸如溶血卵磷脂、皂苷类、非离子洗涤剂诸如x-100等;非质子溶剂诸如二甲亚砜(dmso);醚类诸如四氢呋喃、二氧六环等;酯类诸如乙酸乙酯、乙酸丁酯、乙酸异丙酯;烃类诸如甲苯、氯化溶剂诸如二氯甲烷、二氯乙烷、氯苯等;酮类诸如丙酮;腈类诸如乙腈和/或增加细胞膜通透性的其他试剂。

在一些实施例中,提供了有助于哺乳动物组织样品的染色的组合物。组合物可以包含染色剂,诸如苏木素或苏木素和伊红-y、至少一种组织化学渗透增强剂(诸如表面活性剂、非质子溶剂和/或peg或其任何组合)。

在一些实施例中,对样品进行成像(例如在ihc之前或之后或在没有ihc情况下)。成像可以包括显微术诸如亮视场成像、侧面照明、暗视场成像、分散染色、相位差法、差示干涉查法、干涉反射显微术、荧光、共聚焦、电子显微术、透射电子显微术、扫描电子显微术以及单板照明或其任何组合。成像可以包括使用阴性染色剂(例如,尼格罗黑、钼酸铵、乙酸双氧铀、甲酸双氧铀、磷钨酸、四氧化锇)。成像可以包括使用可以散射电子的重金属(例如金、锇)。

成像可以包括对样品(例如载玻片/阵列)的一部分进行成像。成像可以包括对样品的至少10%、20%、30%、40%、50%、60%、70%、80%、90或100%进行成像。成像可以包括对样品的至多10%、20%、30%、40%、50%、60%、70%、80%、90或100%进行成像。成像可以离散的步骤进行(例如成像可以不需要是连续的)。成像可以包括获取至少1、2、3、4、5、6、7、8、9或10张或更多张不同的图像。成像可以包括获取至多1、2、3、4、5、6、7、8、9或10张或更多张不同的图像。

检测

基底表面可以在促进靶标与一个或多个探针的特异性、高亲和力结合(即杂交)的条件下与一种或多种靶标接触。靶核酸可以与具有已知寡核苷酸光学标记的互补核酸杂交,并且因此可以获得关于靶标样品的信息。靶标可以用光学可检测的标记诸如荧光标签或荧光团进行标记,使得靶标在杂交测定之后用扫描设备可检测。根据选择的标记系统,靶标可以在杂交方案之前、过程中或甚至之后被标记,使得荧光团仅与探针结合的杂交靶标相缔合。

可以例如使用检测探针(例如荧光探针)检测靶标(例如分子、扩增的分子)。阵列可以与至少1、2、3、4、5、6、7、8、9或10个或更多个检测探针杂交。阵列可以与至多1、2、3、4、5、6、7、8、9或10个或更多个检测探针杂交。在一些实施例中,阵列与4个检测探针杂交。

检测探针可以包含与感兴趣的基因的序列互补的序列。检测探针的长度可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个或更多个核苷酸。检测探针的长度可以是至多1、2、3、4、5、6、7、8、9、10、11、12、13、14或15个或更多个核苷酸。检测探针可以包含与感兴趣的基因(例如靶标)的序列完全互补的序列。检测探针可以包含与感兴趣的基因(例如靶标)的序列不完全互补的序列。检测探针可以包含与感兴趣的基因的序列具有至少1、2、3、4、5、6、7、8、9或10个或更多个错配的序列。检测探针可以包含与感兴趣的基因的序列具有至多1、2、3、4、5、6、7、8、9或10个或更多个错配的序列。

检测探针可以包含可检测标记。示例性可检测标记可以包括荧光团、发色团、小分子、纳米粒子、半抗原、酶、抗体以及磁性或其任何组合。

可以对杂交的探针进行成像。可以使用成像来基于可检测信号(例如荧光信号)的强度确定感兴趣的基因的相对表达水平。可以使用扫描激光荧光显微镜或读取器来采集从基底(例如微阵列)发射的光的数字图像。可以将聚焦的光源(通常是激光器)在杂交的基底上扫描,使得杂交区域发射光学信号诸如荧光。荧光团特异性荧光数据可以在扫描操作过程中收集和测量,并且然后基底的图像可以经由适当的算法、软件和计算机硬件重建。然后可以将探针核酸特征的预期或希望的位置与在那些位置处测量的荧光强度相组合,以产生然后可以用于确定靶标样品的基因表达水平或核酸序列的数据。从预期探针位置收集数据的过程可以称之为“特征提取”。数字图像可以由数千至数百百万个像素组成,这些像素的大小典型地在从5至50微米的范围内。数字图像中的每个像素可以通过16位整数表示,从而实现65,535个不同的灰度值。读取器可以依序从扫描基底采集像素并且将这些像素写入图像文件中,该图像文件可以储存在计算机硬件驱动器中。基底在每个点位置处可以含有若干个不同的加荧光标签的探针dna样品。扫描器使用适当波长的激光重复扫描整个基底,以激发每个探针dna样品并且将它们储存在其单独的图像文件中。将图像文件进行分析并且随后借助于程序化计算机进行观察。

可以用共焦激光扫描器对基底进行成像。扫描器可以扫描基底载玻片,以通过用对于特定染料具有适当波长的激光依序扫描来针对使用的每种染料产生一种图像。每种染料可以具有已知的激发光谱和已知的发射光谱。扫描器可以包括朝向物镜透镜反射激光束的分束器,这些物镜透镜进而将光束聚焦在载玻片的表面处以产生荧光球形发射。发射的一部分可以向回行进通过透镜和分束器。在通过分束器行进后,荧光束可以被镜子反射、行进通过发射滤光片、聚焦检测透镜以及中央针孔。

探针与成像数据的相关性

来自基底扫描的数据可以与基底上未裂解样品的图像相关联。数据可以被叠加,从而生成谱图。可以使用利用在此所述方法生成的信息构建样品的靶标的位置的谱图。可以使用该谱图来定位靶标的物理位置。可以使用该谱图来鉴定靶标的物理位置。多个靶标可以是相同种类的靶标,或多个靶标可以是多种不同的靶标。例如,可以构建脑的谱图以显示多种靶标的量和位置。

谱图可以由来自单个样品的数据生成。谱图可以使用来自多个样品的数据构建,从而生成组合谱图。谱图可以用来自数十个、数百个和/或数千个样品的数据构建。由多个样品构建的谱图可以显示与多个样品所共有的区域相关联的靶标的分布。例如,重复测定可以显示在相同的谱图上。至少1、2、3、4、5、6、7、8、9或10个或更多个复制品可以显示(例如叠加)在相同谱图上。至多1、2、3、4、5、6、7、8、9或10个或更多个复制品可以显示(例如叠加)在相同谱图上。靶标的空间分布和数目可以通过多种统计学表示。

来自多个样品的组合数据可以增加组合谱图的位置分辨率。多个样品的取向可以通过常见的界标和/或阵列上的x-y位置进行配准,其中样品上的单独的位置测量是至少部分不连续的。多路复用以上方法将实现样品中靶核酸的高分辨率谱图。

数据分析和相关性可以用于确定特定细胞类型(例如,稀有细胞、癌细胞)的存在和/或不存在。数据相关性可以用于确定细胞内或样品内的不同位置中的靶核酸的相对比。

在此披露的方法和组合物可以是医学专业人士(例如病理学家)的伴随式诊断,其中可以通过在视觉上查看病理图像并将该图像与基因表达(例如鉴定癌基因的表达)相关联来诊断受试者。这些方法和组合物可以用于从细胞群体鉴定出一个细胞,并且确定样品内细胞的遗传异质性。这些方法和组合物可以用于确定样品的基因型。

本披露提供了用于制备基底的复制品的方法。基底可以用不同探针的重新检测以用于不同的感兴趣的基因或用于选择性选择出特定基因。例如,样品可以放置在包含多个寡聚(dt)探针的基底上。mrna可以与探针杂交。可以使包含寡聚(dt)探针的复制基底与初始载玻片接触并且制备mrna的复制品。可以使包含rna基因特异性探针的复制基底与初始载玻片接触来制备复制品。

mrna可以被逆转录为cdna。可以对cdna进行同聚物加尾和/或扩增(例如,经由桥式扩增)。可以使阵列与复制阵列接触。复制阵列可以包含可以结合感兴趣的cdna的基因特异性探针。复制阵列可以包含可以结合具有聚腺苷酸化序列的cdna的聚a探针。

可以制备的复制品的数目可以是至少1、2、3、4、5、6、7、8、9或10个或更多。可以制备的复制品的数目可以是至多1、2、3、4、5、6、7、8、9或10个或更多。

在一些实施例中,初始基底包含多个基因特异性探针并且复制基底包含相同的基因特异性探针,或对应于与基因特异性探针相同的基因的不同探针。

在样品物理分离的情况下进行随机条形编码

在一些实施例中,在随机条形编码样品中的多种靶标的过程中,样品可以是物理上分割开的或可以是完整的。样品中多种靶标的空间位置可以是在样品的表面上、在样品的内部、在样品的亚细胞区域、或其任何组合。在一些实施例中,随机条形编码样品中多种靶标可以在样品的表面上、在样品的亚细胞区域(subcellularlly)、在样品的内部或以其任何组合执行。

样品可以在物理上分离到不同的容器中。物理分离可以通过解剖,例如通过物理切割样品完成。物理分离可以通过切片,例如用切片机进行的切片完成。物理分离可以通过使用刀片网格(例如一种基底,其中基底中容器的边缘是尖锐的,使得它们可以切割样品并且其中切割的样品的片段可以落入在基底上的容器中)完成。刀片网格可以同时分离且物理隔离样品的部分。

物理分离的过程可以保留关于物理分离的样品的信息。信息保留可以通过将样品的已知部分与特定空间标记和/或容器相关联来发生。容器可以包含可以用于表示样品分离之前存在的初始物理关系的空间标记。然后空间标记可以与物理分离的样品的部分内的靶标相缔合。以此方式,可以对来自样品内的可鉴定位置的靶标进行随机标记和数字计数。

在基本的实例中,样品例如固体组织可以沿正中矢状平面对切。器官的右半部可以放置在一个容器中。器官的左半部可以放置在第二容器中。非可消耗标记的库可以与每个容器中的靶标相缔合。标记可以用于随机标记样品内的靶标。标记可以包括可以用于鉴定每个容器中是哪种靶标的空间标记。来自每个容器的标记的靶标可以被组合用于分析。分析可以包括扩增步骤。扩增的标记靶标可以被测序或与阵列杂交以供分析。由分析生成数据可以包括随机计数起始靶标的数目以及对于每种靶标,关于靶标是正中矢状对切的左侧或右侧的空间信息。

样品可以在物理上分离为两个以上的切片。样品可以被分割为至少2、3、4、5、6、7、8、9、10个或更多个切片。样品可以被分割为至多2、3、4、5、6、7、8、9、10个或更多个切片。样品可以被分割为数百个切片。样品可以被分割为至少100、200、300、400、500、600、700、800或900个或更多个切片。样品可以被分割为至多100、200、300、400、500、600、700、800或900个或更多个切片。样品可以被分割为数千个切片。样品可以被分割为至少1000、10000、20000、30000、40000、50000、60000、70000、80000或90000个或更多个切片。样品可以被分割为至多1000、10000、20000、30000、40000、50000、60000、70000、80000或90000个或更多个切片。样品可以被分割为16、32、48、96或384个切片。样品被分割的切片数目越大,空间标记赋予的空间分辨率越大。

切片(例如实体组织和/或包括靶标的)可以被布置成使得切片的物理关系类似于基底(例如网格)上容器之间的物理关系。例如,在样品的“右上方”切片中的靶标可以被定位在“右上方”容器中。这可允许样品直接施加到基底以保留样品(例如实体组织)的切片之间的物理关系。图5示出了实体组织505可以被分割为切片510(例如切片1-10)的方式。切片可以放置在基底515(例如网格)上。实体组织505的切片510可以放置到基底515内的特定位置上,其中特定位置是实体组织505的复制映象。将实体组织的切片放置到基底上可以在二维或三维中执行。图5示出了二维基底的示例性实施例。在一些实施例中,基底可以是三维的。通过基底上容器的物理位置可以反映出来自样品的数十、数百、数千或数百万个切片。

如果样品中第一切片的位置是已知的,则该信息可以与含有切片的容器内的靶标相关联。例如,如图5所示,在实体组织505的切片510已被放置在基底515上的容器中时,可以对切片的靶标进行随机标记、扩增和/或计数。产生自网格515上的容器aa的信息(例如分子类型的数目)可以对应于520实体组织505的物理切片(例如位置)1。类似地,产生自基底515的容器ab的信息可以对应于520实体组织505的物理切片4。

在一些实施例中,本披露的方法可以用于鉴定样品的表面。例如,空间标记可以添加到样品(例如实体组织)的表面。可以将样品裂解、用空间标记进行随机标记、扩增和/或数字计数。基于空间标记,可以将在样品表面上的靶标与在样品内部上的靶标区分开。鉴定样品表面和/或区分样品的内部和外部可以用于确定实体组织(例如肿瘤)的边界、确定实体组织的切除术是否完全地执行、和/或鉴定不同生理结构或细胞类型的边界。

空间标记可以与空间上完整的样品相缔合。例如,针或针阵列可以将空间标记插入到完整样品中。空间标记可以多种方式插入到完整样品中,这些方式包括但不限于针插入、插针插入、通过毛细血管进行的插入、注射、电穿孔、传导以及转化。然后将完整的样品裂解以用于随机条形编码、扩增和数字计数。

在样品物理分离与时间间隔组合的情况下进行随机条形编码

在一些实施例中,随机条形编码样品中的多种靶标可以包括使样品与一个装置接触。装置可以是针、针阵列、管、抽吸装置、注射装置、电穿孔装置、荧光激活细胞分选装置、微流体装置、或其任何组合。装置可以特定速率接触样品的切片。特定速率可以使多种靶标的空间位置与一个或多个时间点相关联。

基底上的容器可以被填充以便反映出物理位置。作为样品收集的一部分,将空间标记与切片相组合。例如可以使用包括抽吸装置的取样装置来以预定义模式取出样品。在样品的切片行进穿过抽吸装置时,空间标记可以与切片相缔合。连续添加空间标记可以鉴定在切片时抽吸装置在空间中的位置。

例如,如图6所示,可以用取样装置将实体组织605分割为切片610。切片610可以基于它们从样品获取的次序被运输至基底615。例如,可以将切片1放置在基底615中对应于时间1(t1)的容器中。对应于t1的容器可以包含时间标记(参见下文)。可以对切片中的靶标进行随机标记、扩增和/或计数。产生自基底615上的容器t1的信息(例如分子类型的数目)可以对应于620实体组织605的物理切片(例如位置)1。类似地,产生自基底615的容器t4的信息可以对应于620实体组织605的物理切片4。通过比较取样装置将每个切片从样品处理至基底所处的速率,时间标记可以指示样品中切片的物理位置。取样装置对切片的获得可以连续地执行。时间标记可以在添加切片之前、在将切片添加至容器的同时或在将切片添加至容器之后添加至切片和/或容器。

例如,针阵列装置可以将包含随机条形码的固体支持物注射到实体组织中。在缩回针时,将固体支持物留在组织中。进一步地,在一列实体组织上缩回针时,一系列固体支持物可以置于组织中(例如沿着列)。装置的移动速率可以与装置在特定位置的时间相关联。以此方式,空间标记与靶标相缔合的时间可以指示其在样品中的位置。

在另一个实例中,取样装置可以包括微流体芯片。取样装置可以能够获取样品的切片,并且将该切片放置在微流体芯片中。在微流体芯片的内部,切片可以被包封在乳剂(例如微滴)中。乳剂可以包含具有空间标记的随机条形码。可以将乳剂放置在基底的容器中。由于时间标记所载的信息,基底中乳剂所放置的位置可以指示样品中切片的物理位置。

容器的非物理表示

本披露提供了一种用于估计样品的特定位置中的分子数目的方法。该方法可以包括将样品分割为切片并且用条形码随机标记切片,使得该条形码含有关于切片的物理位置的信息。随机条形编码不是必须发生在具有与样品类似的物理关系的容器中,如图5和图6中所述的。容器不具有与样品类似的物理关系。该方法不需要利用容器。例如,如图7所示,样品605可以分割为切片710。可以将切片710放置到基底715上的一个或多个随机定位的容器中,其中切片的位置与样品705的物理结构、形状和/或形态没有物理关系。将实体组织的切片放置到基底上可以在二维或三维中执行。图7示出了二维基底的示例性实施例。在一些实施例中,基底可以是三维的。通过基底上容器的物理位置可以反映出来自样品的数十、数百、数千或数百万个切片。

如果样品中第一切片的位置是已知的,则该信息可以与含有切片的容器内的靶标相关联。例如,如图7所示,在实体组织705的切片710已被放置在基底715上的容器中时,可以对切片的靶标进行随机标记、扩增和/或计数。产生自网格715上的容器aa的信息(例如分子类型的数目)可以对应于720实体组织605的物理切片(例如位置)(容器aa对应于切片5,但是其位于样品的切片1所处于的地方)。

将随机条形码添加到样品

样品和/或样品切片可以并行地添加到基底上的容器。取样装置可以并行地获得空间上已知的样品,并且然后用于使样品与空间标记相缔合。例如,可以获得一批活检物。活检物可以与获得活检物的装置上的标记相缔合。活检物可以在将活检物放入容器中之后与标记相缔合。在一些实施例中,使用针阵列来获得样品。

作为样品收集的一部分,将空间标记与样品相组合。例如可以使用抽吸装置来以预定义模式取出样品。在样品行进穿过抽吸装置时,空间标记可以与样品相缔合。连续添加标记可以鉴定在收集时抽吸装置在空间中的位置。

例如,可以切除实体肿瘤。切除的肿瘤具有使用空间标记所标记的外部,例如通过喷涂样品、浸没样品或使样品与包含空间标记的组合物接触。

对特定细胞的随机条形编码

在一些实施例中,空间标记被递送至特定的靶位置。靶位置可以是指身体中的位置、细胞的种型和/或亚细胞区室。空间标记可以与已知靶向身体中的特定器官的分子相缔合。例如,空间标记可以与肝中加工的分子相缔合,空间标记可以与可以跨过血脑屏障的分子相缔合,空间标记可以与可以由毛细血管摄取的分子相缔合。与空间标记相缔合的分子可以使空间标记紧密接近感兴趣的身体中的位置。可以将感兴趣的身体中的位置隔离出、用空间标记进行随机标记、扩增和/或数字计数,以获得关于感兴趣的位置中的靶标数目的信息。

空间标记可以与已知靶向特定细胞的分子相缔合。例如,空间标记可以与靶向免疫细胞的分子(例如靶向分子)相缔合。空间标记可以与靶向病毒的分子相缔合。空间标记可以与靶向血脑屏障的分子相缔合。分子可以是可以将空间标记带至样品(例如,受试者)中的位置的靶向分子。

空间标记可以与已知靶向特定亚细胞区室的分子相缔合。例如,空间标记可以与可以包含诸如内质网的位置标签的囊泡相缔合。囊泡可以将空间标记递送在紧密接近内质网的范围之内。可以将内质网隔离出、用空间标记进行随机标记、扩增和/或数字计数。

示例性亚细胞区室可以包括但不限于线粒体、高尔基复合体、细胞壁、内质网、细胞核、核仁、溶酶体、蛋白质复合物(例如apc、lincrna)等等。示例性靶向分子可以包括但不限于核定位序列、核输出序列、叶绿体定位信号、线粒体定位信号等等。在一些实施例中,靶向分子可以包括囊泡。示例性囊泡可以包括脂质体、微粒体、纳米点、量子点、纳米粒子以及病毒衣壳或其任何组合。

标记平板印刷术的方法

本披露的方法可以在标记已被限制在样品之内和/或与样品接触之后提供构建空间标记。在一些实施例中,这些方法包括:使用多种随机条形码随机条形编码样品中的多种靶标,其中多种随机条形码中的每一种包含预空间标记;将一个或多个空间标记块串联到预空间标记上以生成空间标记;并且使用空间标记鉴定多种靶标中的每一种的空间位置。

图8示出了本披露的标记平板印刷术的示例性实施例。靶标804可以与预空间标记805相缔合。预空间标记805可以包含可以与感兴趣的靶标(例如基因特异性核苷酸序列或寡聚(dt))810杂交的核苷酸序列。预空间标记805可以包含可激活的共有序列815。可激活的共有序列815可以是可以连接至另一核苷酸序列或碱基的核苷酸序列。例如,可激活的序列815可以是限制性内切位点、用于ta连接的位点和/或光可激活的核苷酸。可激活的共有序列815可以连接至空间标记块820/821。空间标记块820/821可以包含指示空间位置825的核苷酸序列。空间标记块可以包含连接序列830。连接序列830可以与可激活的共有序列815和/或空间标记块820中的其他连接序列相互作用。例如,空间标记块820/821的第一组(组i)可以包含第一连接序列(a’)和第二连接序列(b)。第一连接序列(a’)可以与预空间标记705中的可激活的共有序列815相互作用。空间标记块821的第二组(组ii)可以包含第一连接序列(b’)和第二连接序列(a)。第一连接序列(b’)可以与第一组空间标记块821的第二连接序列(b)相互作用。以此方式,空间标记块820/821可以被连接在一起。

预空间标记、空间标记块以及空间标记

预空间标记可以包含可以与感兴趣的靶标相缔合的序列。预空间标记可以与核酸相缔合,该核酸包括但不限于dna、mrna、rna片段、基因特异性区以及调控元件(例如启动子、增强子)。可以结合感兴趣的靶标的序列可以包含基因特异性区(例如,适于结合基因的特定区的核苷酸序列)或非特异性结合区(例如寡聚(dt)、随机六聚体、随机寡聚体)。可以与感兴趣的靶标相缔合的序列的长度可以是至少1、2、3、4、5、6、7、8、9或10或更多个核苷酸。可以与感兴趣的靶标相缔合的序列的长度可以是至少1、2、3、4、5、6、7、8、9或10或更多个核苷酸。

预空间标记可以包含分子标记、细胞标记和/或样品标记。预空间标记可以包含可以与靶标相缔合(例如杂交)的序列。预空间标记可以与固体支持物相缔合。预空间标记可以与基底相缔合。

预空间标记可以包含可激活的共有序列。可激活的共有序列可以包含可以被激活来结合空间标记块的序列。可激活的共有序列可以是可裂解序列(例如限制性内切核酸酶裂解位点)、可以被加标签的序列和/或可被连接的序列。可激活的共有序列可以包含可以被激活的化学部分。例如,化学部分可以包括可以被激发的荧光团、光可裂解部分、响应于磁体的部分以及结合部分(例如生物素/链霉亲和素)。

可激活的共有序列可以包含至少1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。可激活的共有序列可以包含至多1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。

预空间标记可以包含可以与感兴趣的靶标、分子标记、样品标记和/或可激活的共有序列相缔合的序列。在一些实施例中,预空间标记包含可以与感兴趣的靶标、分子标记、样品标记和/或可激活的共有序列相缔合的序列。

预空间标记的长度可以是至少1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、222、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个或更多个核苷酸。预空间标记的长度可以是至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、222、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个或更多个核苷酸。

空间标记块可以包含核苷酸序列。序列可以包含至少1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。序列可以包含至多1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。空间标记块可以连接至另一(例如先前的)空间标记块。空间标记块可以例如通过化学(例如点击化学)、连接、分离-聚库合成、组合化学和/或光可激活的化学连接在一起。

例如,第一组空间标记块可以包含两个粘性末端序列,其中有义链具有第一粘性末端序列并且反义链在每条链的5’端具有第二粘性末端序列。第二组空间标记块可以包含两个粘性末端序列,其中有义链具有第二互补粘性末端序列并且反义链具有第一互补粘性末端序列。第一组可以连接至第二组。仅可以发生一种连接。随后,第一组可以与正在形成的空间标记接触。第一组可以连接至第二组的粘性末端。仅可以发生一种连接。以此方式,可以能够在样品上以平板印刷术方式产生空间标记。

可以在使预空间标记与感兴趣的靶标接触之前、过程中和/或之后执行空间标记块的连接。预空间标记可以在与空间标记块连接之前、过程中和/或之后与靶标相缔合,利用化学方式诸如交联、杂交以有助于预空间标记与靶标之间的缔合。这可以减少预空间标记远离靶标的解离和/或扩散。

可以几何方式执行空间标记块的连接,该几何方式使得空间标记的所得长度对应于连接空间标记块的几何方式。图9示出了连接空间标记块的几何方式的示例性实施例。例如,在空间标记块在样品上从左向右移动时,空间标记块可以逐渐地添加至预空间标记,从而生成具有不同长度的空间标记。空间标记的长度可以对应于样品中的物理位置。样品905可以被分割为切片910。可以使切片与预空间标记接触。可以使预空间标记与整数数目的空间标记块接触。例如,使在行a内的切片与一个空间标记块接触。使在行b内的切片与两个空间标记块接触。使在行c内的切片与三个空间标记块接触。使在行d内的切片与四个空间标记块接触。在从右向左移动的情况下,可以使a列中的切片与一个空间标记块接触,可以使b列中的切片与两个空间标记块接触。可以使c列中的切片与三个空间标记块接触。每个切片中空间标记块的数目可以表示其在样品内的第一维度(y,垂直的)空间和第二维度(x,水平的)空间中的位置。

可以使切片以任何次序与空间标记接触。可以使切片仅按行进行接触。可以使切片仅按列进行接触。可以使切片首先按行并且然后按列进行接触。可以使切片首先按列并且然后按行进行接触。

可以对切片进行随机标记、扩增和/或数字计数。空间标记的长度可以提供关于样品中切片的x和y位置的信息。在图7所示的实施例中,最短的空间标记对应于最左上角并且最长的空间标记对应于最右上角。

用于确定靶标的空间位置的方法

在此披露了用于鉴定两个或更多个样品中的不同细胞的方法。在一些实施例中,这些方法包括:使用多种随机条形码随机条形编码两个或更多个样品中的多种靶标,其中多种随机条形码中的每一种包含空间标记和分子标记;使用分子标记估计两个或更多个样品中的多种靶标的数目;并且使用空间标记将两个或更多个样品彼此区分开,其中与具有不同空间标记的随机条形码相缔合的多种靶标来自不同的样品。

随机条形编码两个或更多个样品中的多种靶标可以包括使多种随机条形码与多种靶标杂交以生成随机条形编码的靶标,并且多种靶标中的至少一种可以与多种随机条形码中的一种杂交。随机条形编码两个或更多个样品中的多种靶标可以包括生成随机条形编码的靶标的索引文库。

两个或更多个样品中每一个可以包括多个细胞,并且多种靶标与多个细胞相关联。随机条形编码两个或更多个样品中的多种靶标可以通过包括与多种随机条形码相缔合的多个合成颗粒的固体支持物执行。

鉴定细胞群体中的特定细胞

空间标记可以用于鉴定并且标记样品(例如细胞)混合群体中的不同样品(例如细胞)。样品可以是例如细胞的混合群体中的细胞。

图10示出了使用空间标记鉴定不同的细胞的方法的示例性实施例。可以使例如包含细胞1015/1020的混合群体的样品接触基底10905,其中基底1005包括不同组的空间标记1010/1011/1012的分布。来自单独细胞1015的靶标可以是在物理上靠近第一组相同的空间标记1010。来自不同的单独细胞1020的靶标可以是在物理上更远离第一组空间标记1010,但是可以在物理空间中靠近其他空间标记1012(例如,第二组空间标记)。可以将细胞裂解、进行随机标记、扩增和/或数字计数。然后可以将空间标记用作编码来区分来自不同的单独细胞的靶标。

靶标可以与最靠近的空间标记相缔合。空间标记可以是本披露的任何空间标记(例如,预空间标记、空间标记)。靶标可以与距样品(例如细胞)的外边缘至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50微米或更多的空间标记相缔合。靶标可以与距样品(例如细胞)的外边缘至多1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45或50微米或更多的空间标记相缔合。

鉴定样品中靶标的空间位置

本披露提供了用于确定细胞中靶标的亚细胞定位的方法。图11示出了如何使用空间标记获得亚细胞信息。可以使样品(例如细胞)1105与包含一组或多组空间标记1110/1111/1112/1113的基底1009接触。可以将空间标记组1110/1111/1112/1113分布在基底的表面上。可以将空间标记组1110/1111/1112/1113分布在基底的容器(例如微孔)上。可以将空间标记组1110/1111/1112/1113分布到样品1105中。可以将空间标记组1110/1111/1112/1113布置成使得样品(例如细胞)1105接触多个不同的空间标记组1110/1111/1112/1113。可以对样品1005进行交联、物理分离、裂解、用不同的空间标记组1110/1111/1112/1113进行随机标记、扩增和/或数字计数。因为不同的空间标记组1110/1111/1112/1113可以是已知的,细胞中靶标的位置可以与空间标记1110/1111/1112/1113的鉴定相关联。以此方式,可以使用空间标记鉴定样品中靶标的空间位置。

用于光学条形编码的方法和光学条形编码

在此披露了用于确定多个单细胞的空间位置的方法。在一些实施例中,这些方法包括:使用多个合成颗粒随机条形编码多个单细胞,其中多个合成颗粒中的每一个包含:多种随机条形码、第一组光学标记以及第二组光学标记,其中多种随机条形码中的每一种包含细胞标记和分子标记,其中第一组光学标记中的每种光学标记包含第一光学部分并且第二组光学标记中的每种光学标记包含第二光学部分,并且其中多个合成颗粒中的每一个与包含第一光学部分和第二光学部分的光学条形码相缔合;检测多个合成颗粒中的每一个的光学条形码以确定多个合成颗粒中的每一个的位置;并且基于多个合成颗粒的位置确定多个单细胞的空间位置。

具有随机条形码和光学条形码的合成颗粒

在此披露了与随机条形码和光学标记相缔合(例如连接)的合成颗粒(例如珠和磁性珠)。例如,合成颗粒可以具有一个或多个光学标记区,其中光学标记与合成颗粒相缔合。在一些实施例中,每个合成颗粒可以具有或具有约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的光学标记区。光学标记区的大小可以变化,例如光学标记区的宽度、长度或直径可以是或是约数微米至数十微米。在一些实施例中,光学标记区的宽度、长度或直径可以是或是约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000微米或者在这些值中的任何两个值之间的数值或范围。在一些实施例中,光学标记区的长度可以是或是约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000微米或者在这些值中的任何两个值之间的数值或范围。对于具有一个以上的光学标记区的合成颗粒,每个光学标记区可以具有相同的大小或不同的大小。例如,至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的光学标记区可以具有不同的大小。例如,至少1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的光学标记区可以具有相同的大小。

光学标记区的布置可以变化。光学标记区的布置的非限制性实例包括纵向形式、垂直形式、网格方式、圆形形式或其任何组合。光学标记区的形状也可以变化。例如,光学标记区可以是椭圆形、长方形、三角形、菱形的或其任何组合。光学标记区可以是集合在一起的或彼此分开的。例如,两个光学标记区可以彼此分开或分开约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000微米或者在这些值中的任何两个值之间的数值或范围。

光学标记区可以占有基本上整个合成颗粒表面或合成颗粒表面的一部分。在一些实施例中,光学标记区可以占有或占有合成颗粒表面的约0.00001%、0.0001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、99.9%或者在这些值中的任何两个值之间的数值或范围。光学标记区可以包含光学标记。在一些实施例中,光学标记区可以具有连接到合成颗粒的表面的光学标记(ol)。每一个光学标记区中的光学标记的数目可以变化,例如是或是约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000个。在一些实施例中,光学标记包含探针序列。

在一些实施例中,每个合成颗粒可以包含连接到合成颗粒的表面的9种类型的光学标记ol1-9。在一些实施例中,每个合成颗粒可以包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000种类型或者在这些数值中的任何两个数值之间的数值或范围的光学标记。对于每个合成颗粒,ol1-9可以是相同的或不同的。在一些实施例中,每种类型的光学标记连接到一个光学标记区中的合成颗粒。在一些实施例中,合成颗粒上的光学标记区中的至少一个包含一种以上类型的光学标记。在一些实施例中,两种、三种、四种、五种或更多种类型的光学标记存在于一个光学标记区中。

光学标记可以包含寡核苷酸序列。光学标记可以包含寡核苷酸。在一些实施例中,光学标记可以包含具有相同序列的两个或更多个寡核苷酸。光学标记的长度可以是或是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。光学标记的寡核苷酸长度可以是或是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

在一些实施例中,ol1-3可以用于编码对应于第一编码步骤中的第一96种独特的细胞标记的细胞标记部分1;os4-6可以用于编码对应于第二分裂步骤中的第二96种独特细胞标记的细胞标记部分2;并且ol7-9可以用于编码对应于第三分裂步骤中的第三96种独特细胞标记的细胞标记部分3。在一些实施例中,ol编码1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100个或在这些值的任何两个值之间的数值的细胞标记部分。在一些实施例中,可以使用1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000种或在这些值的任何两个值之间的数值的光学标记来编码细胞标记的一部分。在一些实施例中,每一个细胞标记部分可以代表1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10000、100000、1000000、10000000、10000000、100000000、1000000000种或者在这些值中的任何两个值之间的数值或范围的独特细胞标记。合成颗粒的光学条形码可以包含在合成颗粒上的光学标记。合成颗粒的光学条形码可以包含1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000种或在这些值中的任何两个值之间的数值的光学标记。

在一些实施例中,光学标记可以包含光学部分,例如荧光团或发色团。在一些实施例中,光学标记的每个核苷酸可以与3’端上的光学部分例如荧光团或发色团相缔合。光学部分可以选自光谱上不同的光学部分的组。光谱上不同的光学部分包括具有可识别的发射光谱的光学部分,即使它们的发射光谱可能重叠。

光学部分的非限制性实例包括氧杂蒽衍生物:荧光素、罗丹明、俄勒冈绿、伊红以及德克萨斯红;花菁衍生物:花菁、吲哚碳菁、氧杂碳青(oxacarbocyanine)、噻碳菁(thiacarbocyanine)以及部花青;方酸衍生物和环取代的方酸菁,包括seta、setau和square染料;萘衍生物(丹酰和氟硅酸钠(prodan)衍生物);香豆素衍生物、噁二唑衍生物:吡啶基噁唑、硝基苯噁二唑和苯噁二唑;蒽衍生物:蒽醌类包括draq5、draq7和cytrak橙;芘衍生物:瀑布蓝(cascadeblue);噁嗪衍生物:尼罗红、尼罗蓝、甲酚紫、噁嗪170;吖啶衍生物:二氨基吖啶、叮啶橙、叮啶黄;芳基次甲基衍生物:金胺、结晶紫、孔雀石绿;以及四吡咯衍生物:卟吩、酞菁、胆红素。光学部分的其他非限制性实例包括羟基香豆素、氨基香豆素、甲氧基香豆素、瀑布蓝、太平洋蓝、太平洋橙、荧光黄、nbd、r-藻红蛋白(pe)、pe-cy5缀合物、pe-cy7缀合物、红613、percp、trured、fluorx、荧光素、bodipy-fl、cy2、cy3、cy3b、cy3.5、cy5、cy5.5、cy7、tritc、x-罗丹明、丽丝胺罗丹明b、德克萨斯红、别藻蓝素(apc)、apc-cy7缀合物、赫斯特(hoechst)33342、dapi、赫斯特33258、sytox蓝、色霉素a3、光神霉素、yoyo-1、溴化乙锭、吖啶橙、sytox绿、toto-1、to-pro-1、to-pro:花菁单体、噻唑单体、cytrak橙、碘化丙啶(pi)、lds751、7-aad、sytox橙、toto-3、to-pro-3、draq5、draq7、indo-1、fluo-3、fluo-4、dcfh、dhr以及snarf。

光学部分的激发波长可以变化,例如是或是约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000纳米或这些值中的任何两个值之间的数值或范围。光学部分的发射波长也可以变化,例如是或是约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000纳米或这些值中的任何两个值之间的数值或范围。

光学部分的分子量可以变化,例如是或是约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000道尔顿(da)或这些值中的任何两个值之间的数值或范围。光学部分的分子量也可以变化,例如是或是约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000千道尔顿(kda)或这些值中的任何两个值之间的数值或范围。

光谱上不同的光学部分组可以例如包括五种不同的荧光团、五种不同的发色团、五种荧光团和发色团的组合、四种不同的荧光团和非荧光团的组合、四种发色团和非发色团的组合或四种荧光团和发色团和非荧光团非发色团的组合。在一些实施例中,光学部分可以是1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围中的任一者的光谱上不同的部分。

在一些实施例中,多个合成颗粒中的每一个具有独特的光学条形码。例如,多个合成颗粒可以包括、包括约或包括超过1、2、3、4、1、2、3、4、5、6、7、8、9、10、100、200、300、400、500、600、700、800、900、103、104、105、106、107、108、109、1010、1011、1012个或者在这些值中的任何两个值之间的数值或范围的合成颗粒,各自具有独特的光学条形码。多个合成颗粒中的一些可以具有相同的光学条形码。多个合成颗粒可以包括、包括约或包括超过1、2、3、4、1、2、3、4、5、6、7、8、9、10、100、200、300、400、500、600、700、800、900、103、104、105、106、107、108、109、1010、1011、1012个或者在这些值中的任何两个值之间的数值或范围的合成颗粒,一些合成颗粒具有相同的光学条形码。

除了“光学标记”,基本上整个合成颗粒表面或合成颗粒表面的一些部分可以与随机条形码连接。例如,随机条形码可以占有合成颗粒表面的0.00001%、0.0001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、99.9%或者在这些值中的任何两个值之间的数值或范围。随机条形码的长度可以是或是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

用于将空间标记加载在基底上的方法

空间标记可以被预加载在基底上。基底的表面可以预压印有随机条形码。换句话讲,基底的表面上的每种随机条形码的坐标可以是已知的。随机条形码可以任何几何形式进行预压印。在一些实施例中,可以将包含随机条形码的固体支持物预定位在基底上。在一些实施例中,基底上的随机条形码的坐标可以是未知的。随机条形码的位置可以是用户生成的。当基底上的随机条形码的位置是未知的时,可以对随机条形码的位置进行解码。

用于编码固体支持物的方法

在此披露了用于创建编码的固体支持物诸如编码的合成颗粒来确定多个单细胞的空间位置的方法。每个合成颗粒可以含有9个“锚定区”。在一些实施例中,每个合成颗粒可以含有或含有约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的锚定区。每个锚定区可以具有约数微米至数十微米宽的大小。在一些实施例中,每个锚定区可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000微米或者在这些值中的任何两个值之间的数值或范围的大小。

锚定区的布置可以变化。锚定区的布置的非限制性实例包括纵向形式、垂直形式、网格方式、圆形形式或其任何组合。锚定区的形状也可以变化。例如,锚定区的形状可以是椭圆形、长方形、三角形、菱形的或其任何组合。锚定区可以是集合在一起的或彼此分开的。例如,两个锚定区可以彼此分开或分开约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000微米或者在这些值中的任何两个值之间的数值或范围。

锚定区可以占有基本上整个合成颗粒表面或合成颗粒表面的一部分在一些实施例中,锚定区可以占有或占有合成颗粒表面的约0.00001%、0.0001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、99.9%或者在这些值中的任何两个值之间的数值或范围。锚定区可以包含光学标记。在一些实施例中,锚定区可以具有连接到合成颗粒的表面的光学标记(ol)。每一个锚定区中的光学标记的数目可以变化,例如是或是约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000个。在一些实施例中,光学标记包含探针序列。具有连接的光学标记的锚定区可以称之为光学标记区。

每个锚定区可以具有连接到合成颗粒的表面的独特光学标记(ol)。在一些实施例中,每个合成颗粒可以包含连接到合成颗粒的表面的9种类型的光学标记ol1-9。在一些实施例中,每个合成颗粒可以包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000种类型或者在这些数值中的任何两个数值之间的数值或范围的光学标记。对于每个合成颗粒,ol1-9可以是相同的或不同的。在一些实施例中,每种类型的光学标记连接到一个锚定区中的合成颗粒。在一些实施例中,合成颗粒上的锚定区中的至少一个包含一种以上类型的光学标记。在一些实施例中,两种、三种、四种、五种或更多种类型的光学标记存在于一个锚定区中。

光学标记可以包含寡核苷酸序列。光学标记可以包含寡核苷酸。在一些实施例中,光学标记可以包含具有相同序列的两个或更多个寡核苷酸。光学标记的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。光学标记的寡核苷酸长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

在一些实施例中,ol1-3可以用于编码对应于第一编码步骤中的第一96种独特的细胞标记的细胞标记部分1;os4-6可以用于编码对应于第二分裂步骤中的第二96种独特细胞标记的细胞标记部分2;并且ol7-9可以用于编码对应于第三分裂步骤中的第三96种独特细胞标记的细胞标记部分3。在一些实施例中,可以使用1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100种或在这些值的任何两个值之间的数值的光学标记来编码细胞标记的一部分。在一些实施例中,每一个细胞标记部分对应于1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10000、100000、1000000、10000000、10000000、100000000、1000000000种或者在这些值中的任何两个值之间的数值或范围的独特细胞标记。合成颗粒的光学条形码可以包含在合成颗粒上的光学标记。合成颗粒的光学条形码可以包含1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000种或在这些值中的任何两个值之间的数值的光学标记。

除了构成光学条形码的“光学标记”,整个合成颗粒表面或合成颗粒表面的一部分可以通过3’向上方式与通用序列(us)连接,即寡核苷酸的3’端未连接到合成颗粒。在一些实施例中,ol寡核苷酸可以是5’向上的而不是3’端向上的。如果ol寡核苷酸是5’向上的,则可以通过连接方法添加光学部分。通用序列可以占有合成颗粒表面的0.00001%、0.0001%、0.01%、0.1%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、99.9%或者在这些值中的任何两个值之间的数值或范围。通用序列的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

对于各自包括三个部分的细胞标记,编码合成颗粒可以包括三个编码步骤。细胞标记可以包括细胞标记部分1、细胞标记部分2以及细胞标记部分3。在一些实施例中,细胞标记可以包括1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000个或者在这些值中的任何两个值之间的数值或范围的部分。编码合成颗粒可以包括1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000个或者在这些值中的任何两个值之间的数值或范围的编码步骤。

在第一编码步骤/第一分裂步骤中,合成颗粒可以被分布在第一板的96个孔上并且与每个孔中的寡核苷酸杂交。在一些实施例中,第一板可以包括96、394、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或在这些值中的任何两个值之间的数值的孔。每个孔可以含有4种类型的寡核苷酸,可能地包括通用序列(us)和三种另外类型的寡核苷酸。每种另外类型的寡核苷酸可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。三种另外类型的寡核苷酸编码细胞标记部分。在一些实施例中,每个微孔可以含有或含有约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000种或者在这些值的任何两个值之间的数值或范围的另外类型的寡核苷酸。每种类型的寡核苷酸的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。每个细胞部分的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

第一类型的寡核苷酸各自可以含有与通用序列(us)互补的区、接着是细胞标记部分1(每1部分具有96种)、接着是接头序列(接头1)。与通用序列互补的区的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。接头1的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

第二类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol1互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。在一些实施例中,光学标记是在5’端上,或既不在5’端上又不在3’端上。光学标记的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。光学部分可以选自光谱上不同的光学部分的组。光谱上不同的光学部分包括具有可识别的发射光谱的光学部分,即使它们的发射光谱可能重叠。

第三类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol2互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。在一些实施例中,光学标记是在5’端上,或既不在5’端上又不在3’端上。光学部分可以选自光谱上不同的光学部分的组。

第四类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol3互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。在一些实施例中,光学标记是在5’端上,或既不在5’端上又不在3’端上。光学部分可以选自光谱上不同的光学部分的组。

在将合成颗粒分布在第一板的96个孔上并且与每个孔中的寡核苷酸杂交之后,可以将聚合酶诸如dna聚合酶和连接酶诸如dna连接酶引入到每个孔中。dna聚合酶可以延伸具有细胞标记部分1和接头1序列的通用序列。dna连接酶可以将光学部分共价地连接到ol寡核苷酸上。

在包括聚库和第二分离的第二编码步骤处,可以将来自第一板的所有孔中的合成颗粒合并,并且分离到第二板的96个孔中的每一个中。在一些实施例中,第二板可以包括96、394、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或在这些值中的任何两个值之间的数值的孔。每个孔可以含有4种类型的寡核苷酸,可能包括通用序列(us)和三种另外类型的寡核苷酸。每种另外类型的寡核苷酸可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。三种另外类型的寡核苷酸编码细胞标记部分。在一些实施例中,每个微孔可以含有或含有约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000种或者在这些值的任何两个值之间的数值或范围的另外类型的寡核苷酸。每种类型的寡核苷酸的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。每个细胞部分的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

第一类型的寡核苷酸各自可以包含接头1、接着是细胞标记部分2(例如,每1部分具有96种)、接着是另一种接头序列(接头2)。接头2的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

第二类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol4互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。在一些实施例中,光学标记是在5’端上,或既不在5’端上又不在3’端上。光学标记的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。光学部分可以选自光谱上不同的光学部分的组。光谱上不同的光学部分包括具有可识别的发射光谱的光学部分,即使发射光谱可能重叠。

第三类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol5互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。在一些实施例中,光学标记是在5’端上,或既不在5’端上又不在3’端上。光学部分可以选自光谱上不同的光学部分的组。

第四类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol6互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。在一些实施例中,光学标记是在5’端上,或既不在5’端上又不在3’端上。光学部分可以选自光谱上不同的光学部分的组。

在将合成颗粒分布在第二板的96个孔上并且与每个孔中的寡核苷酸杂交之后,可以将聚合酶诸如dna聚合酶和连接酶诸如dna连接酶引入到每个孔中。dna聚合酶可以延伸具有细胞标记部分2和接头2序列的通用序列。dna连接酶可以将光学部分共价地连接到ol寡核苷酸上。

在包括聚库和第三分离的第三编码步骤处,可以将来自第二板的所有孔中的合成颗粒合并,并且分离到第三板的96个孔中的每一个中。在一些实施例中,第三板可以包括96、394、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或在这些值中的任何两个值之间的数值的孔。每个孔可以含有4种类型的寡核苷酸,可能包括通用序列(us)和三种另外类型的寡核苷酸。每种另外类型的寡核苷酸可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。三种另外类型的寡核苷酸编码细胞标记部分。在一些实施例中,每个微孔可以含有或含有约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000种或者在这些值的任何两个值之间的数值或范围的另外类型的寡核苷酸。每种类型的寡核苷酸的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。每个细胞部分的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

第一类型的寡核苷酸各自可以包含接头2、接着是细胞标记部分3(每1部分具有96种)、接着是分子索引(随机寡核苷酸(randomer))和寡聚(da)。分子索引的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。寡聚(da)的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

第二类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol7互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。在一些实施例中,光学标记是在5’端上,或既不在5’端上又不在3’端上。光学标记的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。光学部分可以选自光谱上不同的光学部分的组。光谱上不同的光学部分包括具有可识别的发射光谱的光学部分,即使发射光谱可能重叠。

第三类型的寡核苷酸各自可以包括含有与具有小7’延伸的ol8互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。在一些实施例中,光学标记是在5’端上,或既不在5’端上又不在3’端上。光学部分可以选自光谱上不同的光学部分的组。

第四类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol9互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。在一些实施例中,光学标记是在5’端上,或既不在5’端上又不在3’端上。光学部分可以选自光谱上不同的光学部分的组。

在将合成颗粒分布在第三板的96个孔上并且与每个孔中的寡核苷酸杂交之后,可以将聚合酶诸如dna聚合酶和连接酶诸如dna连接酶引入到每个孔中。dna聚合酶可以延伸具有细胞标记部分3序列的通用序列。dna连接酶可以将光学部分共价地连接到ol寡核苷酸上。

在包括聚库和第二分离的第i编码步骤处,可以将来自第(i-1)板的所有孔中的合成颗粒合并,并且分离到第i板的96个孔中的每一个中。在一些实施例中,第i板可以包括96、394、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或在这些值中的任何两个值之间的数值的孔。每个孔可以含有m种类型的寡核苷酸,可能包括通用序列(us)和j种另外类型的寡核苷酸。每种另外类型的寡核苷酸可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。光学标记可以是寡核苷酸的一部分。j种另外类型的寡核苷酸编码细胞标记部分。在一些实施例中,每个微孔可以含有或含有约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60、70、80、90、100、1000种或者在这些值的任何两个值之间的数值或范围的另外类型的寡核苷酸。每种类型的寡核苷酸的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。每个细胞部分的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

第一类型的寡核苷酸各自可以包含接头(i-1)、接着是细胞标记部分i(例如,每1部分具有96种)、接着是另一种接头序列(接头i)。接头(i-1)的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。

j种另外类型的寡核苷酸中的每一种可以包括含有具有小5’延伸的与olm互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团或发色团的光学标记。在一些实施例中,光学标记是在5’端上,或既不在5’端上又不在3’端上。光学标记的长度可以是或可以是约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000个或者在这些值中的任何两个值之间的数值或范围的核苷酸。光学部分可以选自k种光谱上不同的光学部分的组。光谱上不同的光学部分包括具有可识别的发射光谱的光学部分,即使发射光谱可能重叠。

在将合成颗粒分布在第i板的96个孔上并且与每个孔中的寡核苷酸杂交之后,可以将聚合酶诸如dna聚合酶和连接酶诸如dna连接酶引入到每个孔中。dna聚合酶可以延伸具有细胞标记部分i和接头i序列的通用序列。dna连接酶可以将光学部分共价地连接到ol寡核苷酸上。在一些实施例中,可以使用光学部分标记的核苷酸通过聚合酶延伸将光学部分添加到每一种ol寡核苷酸。对于可能是通过各个使用j种另外类型的寡核苷酸的i个编码步骤编码的包含n种光学标记的光学条形码,光学条形码可以表示kn=ki*j种独特的细胞标记。

在一些实施例中,使os1-3与1个96种细胞标记部分1的偶联的第一编码反应通过酶法实现。在一些实施例中,可以将第一编码反应并入在平板印刷术工艺中。代替使用平板印刷术生成1种类型的核心合成颗粒,可以通过平板印刷术生成96种类型的合成颗粒。通用序列可以被96种‘细胞标记部分1’核苷酸置换。在平板印刷术工艺过程中可以将os1、os2和os3光学部分的相应组合连接到合成颗粒。

合成颗粒的合成

在一些实施例中,使用光刻术生成合成颗粒。在一些实施例中,使用停止流动式(stopflow)平版印刷术生成合成颗粒。为了生成具有n种ol寡核苷酸例如9种ol寡核苷酸的合成颗粒,将微流体装置(例如pdms或noa)制造成具有n个输入口,该n个输入口汇聚至单一通道,产生1个输出口。在每个输入口中,送进例如聚(乙二醇)二丙烯酸酯(pegda)、光引发剂、5’acrydite修饰的通用序列(us)寡核苷酸以及5’acrydite修饰的ol寡核苷酸(ol1寡核苷酸针对输入口1、ol2寡核苷酸针对输入口2…oln寡核苷酸针对输入口n)的混合物。随后,在输入口中的每一个处施加压力。在层流方式下,n个输入将形成n条平行流。通过具有合成颗粒形状的轮廓的光掩模将会聚通道的区域暴露于例如uv。在uv暴露时,pegda和acrydite寡核苷酸可以交联形成固体水凝胶合成颗粒,其中n个区域各自具有并排布置的不同ol寡核苷酸。可以在输出口处收集合成颗粒并且将这些合成颗粒用于编码固体支持物。

用于解码基底的方法

在一些实施例中,这些方法可以包括解码固体支持物。在一些实施例中,该方法可以包括解码多个合成颗粒。解码多个合成颗粒可以包括检测多个合成颗粒的光学条形码。这些方法可以包括确定多个合成颗粒的位置。检测多个合成颗粒中的每一个的光学条形码以确定多个合成颗粒中的每一个的位置可以包括生成示出了多个合成颗粒的光学条形码和位置的光学图像。

本披露提供了用解码包含随机条形码的基底(例如阵列)的方法。在一些实施例中,这些方法包括解码固体支持物。在一些实施例中,解码不仅依赖于光学特征标志,例如光学条形码的使用(尽管如在此所述,但是使用具有光学特征标记的珠可以允许“重新利用”解码探针),而且还依赖于在解码步骤过程中添加的组合性解码核酸的使用。解码可以通过连续杂交执行。解码核酸可以与置于珠上的不同的鉴定物编码核酸(鉴定物探针)杂交或与生物活性剂本身杂交,例如当生物活性剂是一种核酸,该核酸的至少一些部分是单链的以允许与解码探针杂交的时候。解码核酸可以被直接或间接标记。解码通过检测标记的存在而发生。

编码核酸(也称为鉴定物探针(ip)或鉴定物核酸)可以包含引物序列和相邻解码序列。每个解码器(或解码)探针可以包含可以与引物序列杂交的引发序列(在此有时称之为“不变序列”),和通常包含在可变序列内的至少一种解码核苷酸。解码器探针可以被制成组,其中每组包含至少四个亚组,每个亚组在相同位置即检测位置(即腺嘌呤、胸苷(或尿嘧啶,根据需要)、胞嘧啶和鸟嘌呤)具有不同的解码核苷酸,其中检测位置(检测核苷酸)处的每个核苷酸包含独特的标记,优选荧光团。可以在允许区分完全互补性和不完全互补性的条件下添加解码器探针。因此,包含与询问的编码核苷酸碱基配对的正确碱基的解码探针可以最佳地杂交。其他解码探针可以被冲洗掉。检测与检测核苷酸相缔合的独特荧光团可以实现对该位置处的编码核苷酸的鉴定。通过使用新的一组解码探针重复这些步骤,从而将检测核苷酸的位置延伸一个碱基,可以解释下一个编码核苷酸的身份。解码可以使用大量的探针。可以使用分离和混合组合的合成来制备解码探针。

在解码过程中可以使用奇偶性分析(parityanalysis)以增加系统的稳健性和精确性。奇偶性分析可以是指解码步骤,其中具体元素的信号可以跨多个解码阶段进行分析。也就是说,在至少一个解码步骤之后,可以跨解码阶段对阵列元素的信号进行分析。可以跨多个阶段评估来自特定珠的信号。虽然分析可以包括可以获自信号的任何参数,诸如评估跨阶段获得的总信号,但是可以对跨阶段的信号的奇偶性进行分析。

奇偶性可以是指当使用二进制信号时信号的数字或模数读取,即奇数或偶数。跨多个阶段的信号的数字和可以被翻译为奇偶性确定。奇偶性确定可以用于评估解码过程。例如,编码可以被设计成当跨所有阶段或解码步骤或预先确定的多个阶段或解码步骤观察时具有奇数的特定信号,例如红信号。对红阶段检测到偶数可以提供在解码中的某一点处出现了错误的指示。当获得这种结果时,可以丢弃有错误的编码,或者对分析进行重复。

本披露提供了将“冗余阶段”引入到解码系统中。冗余阶段可以是指用作奇偶检验的阶段。也就是说,在解码阶段之后,可以包括另外的阶段来分析奇偶性。这个分析可以提供解码的胜任性或可靠性的指示。当编码被设计具有预先确定的奇偶性时,冗余阶段可以用于检测从解码步骤获得的信号的奇偶性。冗余步骤可以检测奇偶性错误,因为如果在解码中存在错误,则在冗余阶段之后检测的奇偶性将不同于设计到编码中的奇偶性。

在一些实施例中,解码可以通过使用串在一起的8聚体寡核苷酸发生以创建其上具有数个8聚体的解码寡核苷酸。解码寡核苷酸在其上可以包含至少1、2、3、4、5、6、7、8、9或10个或更多个8聚体。解码寡核苷酸在其上可以包含至多1、2、3、4、5、6、7、8、9或10个或更多个8聚体。解码寡核苷酸可以与数种不同的随机条形码杂交(例如通过使解码寡核苷酸的不同8聚体区与随机条形码上的不同8聚体区杂交)。可以对解码寡核苷酸进行荧光标记、熔融掉并且进行测序。可以不同颜色对解码寡核苷酸进行荧光标记。可以用相同颜色但是以不同水平的荧光强度对解码寡核苷酸进行荧光标记,从而生成探针的“灰度级”谱图。重复此举可以提供可解释的谱图,其中随机条形码的每个8聚体彼此相关联。该方法可以重复至少1、2、3、4、5、6、7、8、9或10次或更多次。该方法可以重复至多1、2、3、4、5、6、7、8、9或10次或更多次。

在一些实施例中,解码可以通过边合成边测序来执行(例如使用454测序和/或离子半导体测序)。解码可以通过对光学编码的珠进行成像来执行。例如,可以用可以包埋在珠中的量子点或荧光团编码珠。量子点或荧光团可以用于解码过程中。在一些实施例中,光学编码的珠可以包含染料。染料可以用于区分具有不同条形码的珠。解码可以通过使用物理上编码的固体支持物(例如珠)发生。例如,可以用鉴定物对珠进行图案化或雕刻。可以使用激光或使用平板印刷术法将鉴定物蚀刻到珠中。在一些实施例中,珠可以是基于大小和/或形状进行物理编码的。解码可以使用电子编码的珠发生。解码可以利用电子读取来读取珠中的电子鉴定物。电子鉴定物可以包括例如rfid标签、电阻和/或电容。

在基底上的扩散

当样品(例如细胞)根据本披露的方法进行随机条形编码时,可以将细胞裂解。在一些实施例中,细胞的裂解可以导致裂解内容物(例如细胞内容物)远离裂解的初始位置的扩散。换句话讲,裂解内容物可以移动到大于细胞所占据的表面积的表面积中。

样品裂解混合物(例如包含靶标)的扩散可以通过不同参数调整,这些参数包括但不限于裂解混合物的粘度、裂解混合物的温度、靶标的大小、基底中物理屏障的大小、裂解混合物的浓度等等。例如,裂解反应的温度可以是在至少1℃、2℃、3℃、4℃、5℃、10℃、15℃、20℃、25℃、30℃、35℃或40℃或更高的温度下执行。裂解反应的温度可以是在至多1℃、2℃、3℃、4℃、5℃、10℃、15℃、20℃、25℃、30℃、35℃或40℃或更高的温度下执行。裂解混合物的粘度可以通过例如添加增稠试剂(例如甘油、珠)以减缓扩散速率来改变。裂解混合物的粘度可以通过例如添加减薄试剂(例如水)以增加扩散速率来改变。基底可以包括可以改变靶标自样品的扩散速率的物理屏障(例如孔、微孔、微峰)。裂解混合物的浓度可以被改变以增加或减小靶标自样品的扩散速率。裂解混合物的浓度可以增加或减小至少1、2、3、4、5、6、7、8或9倍或更多倍。裂解混合物的浓度可以增加或减小至多1、2、3、4、5、6、7、8或9倍或更多倍。

可以增加扩散速率。可以减小扩散速率。与未改变的裂解混合物相比,裂解混合物的扩散速率可以增加或减小至少1、2、3、4、5、6、7、8、9或10倍或更多倍。与未改变的裂解混合物相比,裂解混合物的扩散速率可以增加或减小至多1、2、3、4、5、6、7、8、9或10倍或更多倍。与未改变的裂解混合物相比,裂解混合物的扩散速率可以增加或减小至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。与未改变的裂解混合物相比,裂解混合物的扩散速率可以增加或减小至少10%、20%、30%、40%、50%、60%、70%、80%、90%或100%。

样品成像

本披露提供了用于鉴定来自样品的靶标中的核酸的空间位置的组合物、方法、试剂盒和系统。图12示出了本披露的同聚物加尾的示例性实施例本披露提供了基底1210,该基底包含连接到基底的表面的多个探针1205。基底1210可以是微阵列。多个探针1205可以包括寡聚(dt)。多个探针1205可以包括基因特异性序列。多个探针105可以包含随机条形码。样品(例如细胞)1215可以放置和/或生长在基底1210上。可以例如通过成像和/或免疫组织化学对包含样品的基底进行分析1220。可以在基底1210上裂解1225样品1215。来自样品1215的核酸1230可以与基底1210上的多个探针1205相缔合(例如杂交)。在一些实施方案中,可以对核酸1230进行逆转录、同聚物加尾和/或扩增(例如使用桥式扩增)。可以用检测探针1240(例如荧光探针)询问1235扩增的核酸。检测探针1240可以是基因特异性的。检测探针1240在基底1210上的结合位置可以与基底的图像相关联,从而产生指示样品中核酸的空间位置的谱图。

在一些实施例中,本披露的方法可以包括制备1245原始基底1210的复制品1246。复制基底1246可以包含多个探针1231。多个探针1231可以与原始基底1210上的多个探针1205相同。多个探针1231可以与原始基底1210上的多个探针1205不同。例如,多个探针1205可以是寡聚探针并且复制基底1246上的多个探针1231可以是基因特异性探针。复制基底可以像原始基底那样处理,诸如通过检测(例如荧光)探针进行询问。

数据分析和显示软件

对靶标空间分辨率的数据分析和可视化

本披露提供了用于通过使用空间标记的随机条形编码和数字计数估计靶标的数目和位置的方法。获自本披露的方法的数据可以在谱图上进行可视化。可以使用利用在此所述方法生成的信息构建样品的靶标的数目和位置的谱图。可以使用该谱图来定位靶标的物理位置。可以使用该谱图来鉴定靶标的物理位置。多种靶标可以是相同种类的靶标,或多种靶标可以是多个不同的靶标。例如,可以构建脑的谱图以显示多种靶标的数字计数和位置。

谱图可以由来自单个样品的数据生成。谱图可以使用来自多个样品的数据构建,从而生成组合谱图。谱图可以用来自数十个、数百个和/或数千个样品的数据构建。由多个样品构建的谱图可以显示与多个样品所共有的区域相关联的靶标的数字计数的分布。例如,重复测定可以显示在相同的谱图上。至少1、2、3、4、5、6、7、8、9或10个或更多个复制品可以显示(例如叠加)在相同谱图上。至多1、2、3、4、5、6、7、8、9或10个或更多个复制品可以显示(例如叠加)在相同谱图上。靶标的空间分布和数目可以通过多种统计学表示。

来自多个样品的组合数据可以增加组合谱图的位置分辨率。多个样品的取向可以通过常见的界标进行配准,其中样品上的单独的位置测量是至少部分不连续的。具体的实例是使用切片机在一个轴线上切片样品,并且然后沿不同的入口切片第二样品。组合的数据集将产生与靶标的数字计数相关联的三维空间位置。多路复用以上方法将实现数字计数统计学的高分辨率三维谱图。

在仪器系统的一些实施例中,系统将包括计算机可读介质,该计算机可读介质包括用于提供对通过执行单细胞随机条形编码测定生成的序列数据集的数据分析的代码。可以由数据分析软件提供的数据分析功能性的实例包括但不限于(i)算法,用于解码/多路解编样品标记、细胞标记、空间标记和分子标记、以及通过对在运行测定中创建的随机条形码文库进行测序提供的靶序列数据;(ii)算法,用于基于该数据确定读取数目/基因/细胞和独特转录物分子数目/基因/细胞,以及创建汇总表;(iii)测序数据的统计分析,例如用于根据基因表达数据群集细胞或用于预测转录物分子数目/基因/细胞的测定的置信区间等;(iv)算法,用于鉴定稀有细胞的亚群体,例如使用主成分分析、分层式群集(hierarchicalclustering)、k-均值群集、自组织映射、神经网络等;(v)序列比对能力,用于将基因序列数据与已知参考序列进行比对并且检测突变、多态性标记和剪接变体;以及(vi)分子标记的自动化群集,以补偿扩增或测序错误。在一些实施例中,可商购获得软件可以用于执行数据分析的全部或一部分,例如七桥问题(https://www.sbgenomics.com)软件可以用于编译针对整个细胞集合体的每个细胞中出现的一个或多个基因的拷贝数目的表。在一些实施例中,数据分析软件可以包括用于以有用图形格式(例如指示细胞集合体中的每个细胞中出现的一个或多个基因的拷贝数目的热图)输出测序结果。在一些实施例中,数据分析软件可以进一步包括用于从测序结果中提取生物意义的算法,例如通过使细胞集合体的每个细胞中出现的一个或多个基因的拷贝数目与细胞类型、稀有细胞类型或来源于患有特定疾病或病状的受试者的细胞相关联。在一些实施例中,数据分析软件可以进一步包括用于在不同生物样品上比较细胞群体的算法。

在一些实施例中,所有数据分析功能性可以打包在单个软件包内。在一些实施例中,整套的数据分析能力可以包括一系列软件包。在一些实施例中,数据分析软件可以是可独立于测定仪器系统为用户利用的独立包。在一些实施例中,软件可以是基于网络的并且可以允许用户共享数据。

在一些实施例中,所有数据分析功能性可以打包在单个软件包内。在一些实施例中,整套的数据分析能力可以包括一系列软件包。在一些实施例中,数据分析软件可以是可独立于测定仪器系统为用户利用的独立包。在一些实施例中,软件可以是基于网络的并且可以允许用户共享数据。

系统处理器和网络

一般来讲,如图13所说明的,包括在当前披露的仪器系统中的计算机或处理器可以进一步理解为可读取来自介质1311或网络端口1305的指令的逻辑设备,该网络端口可以任选地与具有固定介质1312的服务器1309连接。如图13所示,系统1300可以包括cpu1301、磁盘驱动器1303、任选的输入装置,诸如键盘1315或鼠标1316以及任选的监测器1307。可以通过指定的通信介质传至在本地或远程位置处的服务器来实现数据通信。通信介质可以包括发送或接收数据的任何装置。例如,通信介质可以是网络连接、无线连接或因特网连接。这样的连接可以提供经由万维网的通信。可以设想的是,与本披露有关的数据可以通过这样的网络或连接进行传输,以由接收方1322接收或审阅,如图13所说明的。

图14示出了可结合本披露的示例性实施例使用的计算机系统1400的第一示例性体系结构的示例性实施例。如图14所描绘的,示例性计算机系统可以包括用于处理指令的处理器1402。处理器的非限制性实例包括:英特尔xeontm处理器、amdopterontm处理器、三星32-位riscarm1176jz(f)-sv1.0tm处理器、armcortex-a8三星s5pc100tm处理器、armcortex-a8苹果a4tm处理器、迈威尔(marvell)pxa930tm处理器或功能等效的处理器。多个执行线程可以用于并行处理。在一些实施例中,也可以使用多个处理器或具有多个核心的处理器,无论是以单个计算机系统、成群地还是通过网络跨系统分布的,该网络包括多个计算机、手机和/或个人数据助理装置。

如图14所说明的,可以将高速缓存1404连接至或并入处理器1402中,以便为最近已经被或频繁地被处理器1402使用的指令或数据提供高速存储器。通过处理器总线1408将处理器1402与北桥1406连接。北桥1406通过存储器总线1412与随机存取内存(ram)1410连接并且管理处理器1402对ram1410的访问。北桥1406还通过芯片集总线1416与南桥1414连接。南桥1414进而与外设总线1418连接。外设总线可以是例如pci、pci-x、pciexpress或其他外设总线。北桥和南桥通常被称为处理器芯片集并且管理处理器、ram与外设总线118上的外设部件之间的数据传输。在一些可替代性体系结构中,可以将北桥的功能性并入处理器中而取代使用单独的北桥芯片。

在一些实施例中,系统1400可以包括附接至外设总线1418的加速器卡1422。加速器可以包括现场可编程门阵列(fpga)或其他用于加速某些处理的硬件。例如,加速器可以用于自适应性数据重构或用于评估扩展集处理中所用的代数表达式。

软件和数据被存储在外部存储器1424中并且可以被加载到ram1410或缓存1404中,以为处理器所用。系统1400包括用于管理系统资源的操作系统;操作系统的非限制性实例包括:linux、windowstm、macostm、blackberryostm、iostm和其他功能等效的操作系统,以及在操作系统之上运行的用于根据本发明的示例性实施例管理数据存储和优化的应用软件。

在这个实例中,系统1400还包括与外设总线连接的网络接口卡(nic)1420和1421,用于为外部存储器诸如附网存储(nas)和其他可以用于分布式并行处理的计算机系统提供网络接口。

图15示出了一个示例性图表,示出了网络1500,该网络具有多个计算机系统1502a和1502b、多个手机和个人数据助理1502c以及附网存储(nas)1504a和1504b。在示例性实施例中,系统1512a、1512b和1512c可以管理数据存储并针对存储在附网存储(nas)1514a和1514b中的数据优化数据访问。数学模型可以用于数据并且使用跨计算机系统1512a和1512b、和手机以及个人数据助理系统1512c的分布式并行处理进行评估。计算机系统1512a和1512b和手机以及个人数据助理系统1512c还可以为存储在附网存储(nas)1514a和1514b中的数据的自适应性数据重构提供并行处理。图15仅说明了一个实例,并且多种多样的其他计算机体系结构和系统也可以与本发明的不同实施例结合使用。例如,刀片式服务器可以用来提供并行处理。处理器刀片可以通过底板进行连接,以提供并行处理。存储器也可以通过单独的网络接口与底板连接或作为附网存储(nas)。

在一些示例性实施例中,处理器可以保持分开的存储空间并且通过网络接口、底板或其他连接器传输数据,用于通过其他处理器进行并行处理。在其他实施例中,一些或所有处理器可以使用共享的虚拟地址存储空间。

图16示出了根据示例性实施例使用共享的虚拟地址存储空间的多处理器计算机系统1600的示例性框图。该系统包括可以访问共享的存储器子系统1604的多个处理器1602a-f。该系统在存储器子系统1604中并入了多个可程编硬件存储算法处理器(map)1606a-f。map1606a-f各自可以包括存储器1608a-f以及一个或多个现场可编程门阵列(fpga)1610a-f。map提供了可配置性功能单元并且具体算法或算法部分可以被提供给fpga1610a-f,用于与对应的处理器密切配合进行处理。例如,map可以用于相对于数据模型来评估代数表达式以及用于在示例性实施例中进行自适应型数据重构。在这个实例中,每个map都可被所有处理器全球访问用于这些目的。在一种配置中,每个map都可以使用直接内存访问(dma)来访问相关的存储器308a-f,从而允许它独立于对应的微处理器302a-f并且与这些微处理器不同步地执行任务。在这种配置中,map可以将结果直接馈至另一map以用于流水操作和并行执行算法。

以上计算机体系结构和系统仅仅是实例,并且多种多样的其他计算机、手机和个人数据助理体系结构和系统可以与示例性实施例结合使用,包括使用一般处理器、协同处理器、fpga和其他可编程逻辑装置、片上系统(sol)、特种集成电路应用(asic)以及其他处理和逻辑元件的任何组合的系统。在一些实施例中,全部或部分的计算机系统可以在软件或硬件中实施。任何种类的数据存储介质都可以与示例性实施例结合使用,包括随机存取内存、硬盘驱动器、闪速存储器、磁带驱动器、磁盘阵列、附网存储(nas)以及其他局部或分布式数据存储装置和系统。

在示例性实施例中,可以使用在任何以上或其他计算机体系结构和系统上执行的软件模块来实施本披露的计算机子系统。在其他实施例中,可以部分地或完全地在以下项中实现该系统的功能:固件、可编程逻辑装置诸如现场可编程门阵列(fpga)、片上系统(sol)、特种集成电路应用(asic)或其他处理和逻辑元件。例如,可以通过使用硬件加速器卡诸如加速器卡通过硬件加速来实施集处理器和优化器。

试剂盒

在此披露了用于执行单细胞随机条形编码测定的试剂盒。试剂盒可以包括一个或多个基底(例如微孔阵列),作为包括一个或多个微孔阵列的独立式基底(或芯片)或包装在一个或多个流动池或柱体之内,以及一种或多种固体支持物悬浮液,其中悬浮液内单独的固体支持物包含多种连接的本披露随机条形码。在一些实施例中,试剂盒可以进一步包括用于固定独立式基底的机械固定装置,以便产生有助于将样品和试剂移液到基底中的反应孔。试剂盒可以进一步包括用于执行随机条形编码测定的试剂,例如裂解缓冲液、冲洗缓冲液或杂交缓冲液。试剂盒可以进一步包括用于执行核酸延伸反应例如逆转录反应的试剂(例如酶、引物或缓冲液)。试剂盒可以进一步包括用于执行扩增反应以制备测序文库的试剂(例如酶、通用引物、测序引物、靶特异性引物或缓冲液)。试剂盒可以包括用于执行本披露的标记平板印刷术法的试剂(例如预空间标记和用于激活可激活的共有序列的试剂)。

试剂盒可以包括用于浇铸基底(例如微孔阵列)的一个和多个模具,例如包括微柱阵列的模具,以及一个或多个固体支持物(例如珠),其中悬浮液内单独的珠包含多种连接的本披露随机条形码。试剂盒可以进一步包括用于浇铸基底的材料(例如琼脂糖、水凝胶、pdms等)。

试剂盒可以包括预加载有包含多种连接的本披露随机条形码的固体支持物的一个或多个基底。在一些实施例中,可以存在于基底的每个微孔的固体支持物上。在一些实施例中,多种随机条形码可以直接连接到基底的表面,而不是固体支持物。在这些实施例中的任一项中,一个或多个微孔阵列可以独立式基底(或芯片)的形式提供,或者它们可以包装在流动池或柱体中。

在本披露试剂盒的一些实施例中,试剂盒可以包含并入一个或多个基底的一个或多个柱体。在一些实施例中,一个或多个柱体可以进一步包括一个或多个预加载的固体支持物,其中悬浮液内单独的固体支持物包含多种连接的本披露随机条形码。在一些实施例中,可以将珠预分布到柱体的一个或多个微孔阵列中。在一些实施例中,呈悬浮液形式的珠可以预加载且储存在柱体的试剂孔之内。在一些实施例中,一个或多个柱体可以进一步包含被预加载且储存在柱体的试剂贮存池之内的其他测定试剂。

在此披露了用于执行样品中核酸的空间分析的试剂盒。试剂盒可以包括一个或多个本披露的基底(例如阵列),作为包括一个或多个阵列的独立式基底(或芯片)。阵列可以包含本披露的探针。试剂盒可以包括一个或多个本披露的复制阵列。复制阵列可以包含基因特异性或寡聚(dt)/聚(a)探针。

试剂盒可以进一步包括用于执行测定的试剂,例如裂解缓冲液、冲洗缓冲液或杂交缓冲液。试剂盒可以进一步包括用于执行核酸延伸反应例如逆转录反应和引物延伸反应的试剂(例如酶、引物、dntp、ntp、rna酶抑制剂或缓冲液)。试剂盒可以进一步包括用于执行扩增反应以制备测序文库的试剂(例如酶、通用引物、测序引物、靶特异性引物或缓冲液)。试剂盒可以包括用于分子的同聚物加尾的试剂(例如末端转移酶和dntp)。试剂盒可以包括用于例如本披露的任何酶促裂解的试剂(例如exoi核酸酶、限制性内切酶)。

试剂盒通常可以包括用于进行在此所述的方法中的一种或多种的说明书。包括在试剂盒中的说明书可以附着到包装材料上或可以作为包装说明书被包括。虽然说明书典型地是书写或印刷材料,但是它们不限于这些。能够储存此类说明书并且将它们传达至最终用户的任何介质为本披露所考虑。这种介质可以包括但不限于电子储存介质(例如磁盘、磁带、盒式磁带、芯片)、光学媒介(例如cdrom)、rf标签等等。如在此所用,术语“说明书”可以包括提供说明书的互联网网站地址。

装置

流动池

微孔阵列基底可以被包装在流动池内,该流动池提供与流体处理系统的其余部分的方便界面结合并且有助于被递送至微孔阵列和/或乳滴的流体例如,细胞和固体支持物悬浮液、裂解缓冲液、冲洗缓冲液等的交换。设计特征可以包括:(i)用于引入细胞样品、固体支持物悬浮液或其他测定试剂的一个或多个入口、(ii)被设计成提供均匀填充和有效流体交换同时最小化回漩涡或死区的一个或多个微孔阵列室,以及(iii)用于将流体递送到样品收集点或废物贮存池的一个或多个出口。流动池的设计可以包括与多个微孔阵列界面结合的多个微孔阵列室,这样使得可以并行处理一个或多个不同的细胞样品。流动池的设计可以进一步包括用于跨阵列室的宽度产生匀流速度剖面图(即“活塞流”)的特征,以提供细胞和珠到微孔的更均匀递送,例如,通过使用作为“流动扩散器(flowdiffuser)”的位于室入口附近和微孔阵列上游的多孔隔板,或通过将每个阵列室分成若干分段,这些分段共同覆盖相同的总阵列区,但是通过它们分开的入口液流平行地流动。在一些实施例中,流动池可以围绕或并入一个以上的微孔阵列基底。在一些实施例中,整合的微孔阵列/流动池组件可以构成系统的固定部件。在一些实施例中,微孔阵列/流动池组件可以是从仪器可移除的。

一般来讲,将优化流体通道和一个或多个阵列室在流动池设计中的尺寸,以便(i)提供细胞和珠到微孔阵列的均匀递送,和(ii)最小化样品和试剂消耗。在一些实施例中,流体通道的宽度将在50um与20mm之间。在其他实施例中,流体通道的宽度可以是至少50um、至少100um、至少200um、至少300um、至少400um、至少500um、至少750um、至少1mm、至少2.5mm、至少5mm、至少10mm、至少20mm、至少50mm、至少100mm或至少150mm。在又其他实施例中,流体通道的宽度可以是至多150mm、至多100mm、至多50mm、至多20mm、至多10mm、至多5mm、至多2.5mm、至多1mm、至多750um、至多500um、至多400um、至多300um、至多200um、至多100um或至多50um。在一个实施例中,流体通道的宽度是约2mm。流体通道的宽度可以落入通过这些值中的任一个(例如从约250um至约3mm)界定的任何范围之内。

在一些实施例中,流体通道的深度将在50um与2mm之间。在其他实施例中,流体通道的深度可以是至少50um、至少100um、至少200um、至少300um、至少400um、至少500um、至少750um、至少1mm、至少1.25mm、至少1.5mm、至少1.75mm或至少2mm。在又其他实施例中,流体通道的深度可以是至多2mm、至多1.75mm、至多1.5mm、至多1.25mm、至多1mm、至多750um、至多500um、至多400um、至多300um、至多200um、至多100um或至多50um。在一个实施例中,流体通道的深度是约1mm。流体通道的深度可以落入通过这些值中的任一个(例如从约800um至约1mm)界定的任何范围之内。

流动池可以使用本领域的普通技术人员已知的多种技术和材料制造。一般来讲,流动池被制造为单独零件并且随后被机械地夹固或永久地结合到微孔阵列基底上。适合的制造技术的实例包括常规机械加工、cnc机械加工、注塑、3d打印、对齐并层压一层或多层激光切割或冲切聚合物薄膜或多种微制造技术中的任一种,诸如光刻法和湿法化学蚀刻、干法蚀刻、深度反应离子蚀刻或激光微机械加工。一旦流动池零件已经被制造出,则它可以机械地附接至微孔阵列基底,例如通过将它抵着微孔阵列基底夹紧(使用或未使用垫圈),或者可以使用本领域的普通技术人员已知的多种技术中的任一种(取决于使用的材料的选择)使它直接结合到微孔阵列基底上,例如通过使用阳极键合、热键合或多种粘合剂或粘附膜中的任一种,包括基于环氧树脂的、基于丙烯酸的、基于硅酮的、可uv固化的、基于聚氨酯的或基于氰基丙烯酸酯的粘合剂。

流动池可以使用本领域的普通技术人员已知的多种材料制造。一般来讲,使用的材料的选择将取决于使用的制造技术的选择,并且反之亦然。适合材料的实例包括但不限于硅、熔融二氧化硅、玻璃、多种聚合物中的任一种例如,聚二甲基硅氧烷(pdms;弹性体)、聚甲基丙烯酸甲酯(pmma)、聚碳酸酯(pc)、聚丙烯(pp)、聚乙烯(pe)、高密度聚乙烯(hdpe)、聚酰亚胺、环烯烃聚合物(cop)、环烯烃共聚物(coc)、聚对苯二甲酸乙二醇酯(pet)、环氧树脂、金属(例如,铝、不锈钢、铜、镍、铬和钛)、非粘性材料诸如铁氟龙(teflon)(ptfe)或这些材料的组合。

柱体

在系统的一些实施例中,具有或不具有附接流动池的微孔阵列将被包装在消耗性柱体内,该柱体与仪器系统界面结合。柱体的设计特征可以包括(i)一个或多个入口,用于与仪器形成流体连接或将细胞样品、珠悬浮液或其他测定试剂手动引入柱体中;(ii)一个或多个旁路通道,即用于自计量细胞样品和珠悬浮液,以避免满溢或回流;(iii)一个或多个整合的微孔阵列/流动池组件、或一个或多个微阵列基底定位在其内的一个或多个室;(iv)整合的微型泵或其他流体致动机构,用于控制流体流动通过装置;(v)整合的微型阀(或其他约束机构),用于将预加载试剂(例如,珠悬浮液)隔区化或控制流体流动通过装置;(vi)用于为滞留的空气提供逃逸路径的一个或多个通气孔;(vii)一个或多个样品和试剂废物贮存池;(viii)一个或多个出口,用于与仪器形成流体连接或提供经处理的样品收集点;(ix)机械接口特征,用于相对于仪器系统重复性定位可移除的消耗性柱体,并且用于提供进入,这样使得外磁体可以与微孔阵列紧密接近;(x)整合的温度控制部件或热接口,用于提供与仪器系统的良好热接触;以及(xi)光学接口特征,例如透明窗,用于对微孔阵列进行光学询问。

柱体可以被设计成平行地处理一个以上的样品。柱体可以进一步包括适于与独立式pcr热循环仪和/或测序仪界面结合的一个或多个可移除样品收集室。柱体可以自身适于与独立式pcr热循环仪或测序仪界面结合。在本披露中使用的术语“柱体”可以意指包括在性能测定过程中含有样品和珠的零件的任何组装。

柱体可以进一步包括部件,这些部件被设计成产生防止大分子扩散(或增加其路径长度和扩散时间)的物理或化学屏障,以便最小化微孔之间的交叉污染。此类屏障的实例可以包括但不限于用于将细胞和固体支持物(例如珠)递送到微孔阵列的一套蛇形通道、在裂解或孵育步骤过程中经过按压与微孔阵列基底表面接触的可伸缩压板或可变形膜、使用较大的珠,例如如先前所述的交联葡萄糖珠来堵塞微孔的开口、或在裂解或孵育步骤过程中使不互混的疏水流体从柱体内的贮存池中释放出来以有效地分离并隔区化阵列中的每个微孔。

可以优化流体通道和一个或多个阵列室在柱体设计中的尺寸,以便(i)提供细胞和珠到微孔阵列的均匀递送,和(ii)最小化样品和试剂消耗。流体通道的宽度可以在50微米与20mm之间。在其他实施例中,流体通道的宽度可以是至少50微米、至少100微米、至少200微米、至少300微米、至少400微米、至少500微米、至少750微米、至少1mm、至少2.5mm、至少5mm、至少10mm或至少20mm。在又其他实施例中,流体通道的宽度可以是至多20mm、至多10mm、至多5mm、至多2.5mm、至多1mm、至多750微米、至多500微米、至多400微米、至多300微米、至多200微米、至多100微米或至多50微米。流体通道的宽度可以是约2mm。流体通道的宽度可以落入通过这些值中的任一个(例如从约250um至约3mm)界定的任何范围之内。

柱体中流体通道可以具有一深度。柱体设计中流体通道的深度可以在50微米与2mm之间。流体通道的深度可以是至少50微米、至少100微米、至少200微米、至少300微米、至少400微米、至少500微米、至少750微米、至少1mm、至少1.25mm、至少1.5mm、至少1.75mm或至少2mm。流体通道的深度可以是至多2mm、至多1.75mm、至多1.5mm、至多1.25mm、至多1mm、至多750微米、至多500微米、至多400微米、至多300微米、至多200微米、至多100微米或至多50微米。流体通道的深度可以是约1mm。流体通道的深度可以落入通过这些值中的任一个(例如从约800微米至约1mm)界定的任何范围之内。

柱体可以使用本领域的普通技术人员已知的多种技术和材料制造。一般来讲,使用多种机械组装或结合技术中的任一种将柱体制造为一系列单独的零部件(图17a-c)并且随后组装。适合的制造技术的实例包括但不限于常规机械加工、cnc机械加工、注塑、热成形以及3d打印。一旦柱体部件已经被制造出,可以使用螺钉、夹子等将它们进行机械组装,或使用多种技术中的任一种(取决于使用的材料的选择)使它们永久结合,例如通过使用热键合/焊接或多种粘合剂或粘附膜中的任一种,包括基于环氧树脂的、基于丙烯酸的、基于硅酮的、可uv固化的、基于聚氨酯的或基于氰基丙烯酸酯的粘合剂。

柱体部件可以使用多种适合的材料中的任一种制造,包括但不限于硅、熔融二氧化硅、玻璃、多种聚合物中的任一种,例如,聚二甲基硅氧烷(pdms;弹性体)、聚甲基丙烯酸甲酯(pmma)、聚碳酸酯(pc)、聚丙烯(pp)、聚乙烯(pe)、高密度聚乙烯(hdpe)、聚酰亚胺、环烯烃聚合物(cop)、环烯烃共聚物(coc)、聚对苯二甲酸乙二醇酯(pet)、环氧树脂、非粘性材料诸如铁氟龙(ptfe)、金属(例如,铝、不锈钢、铜、镍、铬和钛)或其任何组合。

柱体的入口和出口特征可以被设计成提供与仪器的方便且防漏的流体连接,或可以用作开放贮存池以便将样品和试剂手动地移进或移出柱体。入口和出口连接器的方便机械设计的实例可以包括但不限于螺纹连接器、鲁尔锁紧连接器、鲁尔滑锁(luerslip)或“滑动型尖端(sliptip)”连接器、压入配合连接器以及类似物。柱体的入口和出口可以进一步包括帽、弹簧加载盖或塞、或聚合物膜,它们在柱体被定位在该仪器中时可以被打开或刺破,并且用于防止在储存过程中柱体内表面的污染和/或在柱体被从仪器上移除时防止流体溢出。柱体的一个或多个出口可以进一步包括适于与独立式pcr热循环仪和/或测序仪界面结合的可移除的样品收集室。

柱体可以包括整合的微型泵或用于控制流体流动通过装置的其他流体致动机构。适合的微型泵或流体致动机构的实例可以包括但不限于机电或气动致动的微型注射器或柱塞机构、气动地或通过外部活塞致动的膜隔膜泵、气动致动的试剂小袋或气囊、或电渗泵。

柱体可以包括用于将预加载试剂隔区化或控制流体流动通过装置的微型阀。适合的微型阀的实例可以包括但不限于使用可以被熔化或溶解的蜡或聚合物塞或可以被刺破的聚合物膜制造的一次性“阀”;使用可变形膜构造的夹管阀和使用可变形膜片构造的气动、磁、电磁或机电(螺线管)致动的止回阀以及微型门阀。

柱体可以包括用于为截留的空气提供逃逸路径的通气孔。可以根据多种技术构造通气孔,例如使用聚二甲基硅氧烷(pdms)或允许毛细管芯吸空气但阻止被水渗透的其他疏水材料的多孔塞。

柱体的机械接口特征可以提供柱体相对于仪器系统的易于移除但高度精确且可重复的定位。适合的机械接口特征可以包括但不限于定位销、定位导件、机械止动件以及类似物。机械设计特征可以包括凸凹特征,用于使外部设备(例如,磁体或光学部件)与微孔阵列室紧密接近(图17b)。

柱体还可以包括温度控制部件或热接口特征,用于与外部温度控制模块配合。适合的温度控制元件的实例可以包括但不限于电阻加热元件、微型红外发射光源、珀耳帖(peltier)加热或冷却装置、散热器、热敏电阻、热电偶以及类似物。热接口特征可以由作为良好热导体的材料(例如,铜、金、银等)制造并且可以包括能够与外部加热块或冷却块产生良好热接触的一个或多个平表面。

柱体可以包括光学接口特征,用于对微孔阵列进行光学成像或光谱学询问。柱体可以包括光学透明窗,例如,微孔基底本身或与微孔阵列相对的流动池的或微阵列室的侧面,该透明窗由满足用于探测微孔阵列的成像或光谱技术的频谱要求的材料制造。适合的光学窗材料的实例可以包括但不限于玻璃、熔融二氧化硅、聚甲基丙烯酸甲酯(pmma)、聚碳酸酯(pc)、环烯烃聚合物(cop)或环烯烃共聚物(coc)。

尽管在此已经显示并说明了本发明的优选实施例,但是本领域的普通技术人员将清楚的是仅作为举例而提供了此类实施例。本领域的普通技术人员现在将会想到众多变体、变化、以及替代,而不背离本发明。应该理解的是,在此说明的本发明的实施例的不同替代方案可以用于实施本发明。预期的是以下权利要求书限定了本发明的范围以及由此覆盖在这些权利要求和它们的等效物的范围内的方法和结构。

实例

上文所讨论的实施例的一些方面在以下实例中进一步详细地披露,这些实例不以任何方式旨在限制本披露的范围。

实例1

用于使用空间标记确定样品中的空间位置处的不同靶标的数目的方法

本披露提供了用于使用本披露的随机条形码上的空间标记确定样品中的不同靶标的数目以及它们的不同空间位置的方法。将组织薄片分离为切片。将切片以已知方式放置在基底上。将切片放置在基底上使得它们保留组织切片的物理次序。将切片放置在基底上使得它们不保留组织切片的物理次序。使组织切片与多个固体支持物接触。使组织切片以已知方式与多个固体支持物接触,使得用户知晓具有哪种空间标记的哪个固体支持物接触了哪个切片。可以使单个固体支持物接触组织薄片的每个切片。固体支持物包含多种随机条形码。随机条形码包含通用标记、空间标记、细胞标记、分子标记以及靶缔合区。可以对组织薄切片和固体支持物一起进行成像。图像捕获了组织薄片的物理结构并且鉴定了与组织薄切片相缔合的固体支持物的取向。例如,可以用可以在图像中可见的鉴定物刻蚀固体支持物。刻蚀的固体支持物中的每一个上的空间标记的序列是预先已知的。

组织薄片的切片中的靶标与靶缔合区(例如通过它们的聚(a)尾)相缔合。靶标交联至靶缔合区。将固体支持物从组织薄切片去除。使用逆转录酶对与靶缔合区相缔合的靶标进行逆转录,从而生成为将随机条形码的标记掺入到其多核苷酸序列中的转录物的靶标-条形码分子。使用聚合酶链式反应扩增靶标-条形码分子。例如通过测序确定靶标-条形码分子的序列。序列反应确定了空间标记、细胞标记、分子标记以及靶标序列的一些或全部。计数不同靶标的数目,其中特异性分子标记的独特出现指示不同的靶标。空间标记的序列用于使不同靶标的数目与组织薄片的物理空间中的位置相关联。生成了谱图,该谱图显示出组织薄切片中不同靶标的位置和数量。不同靶标的数量以比色强度显示。

实例2

用于使用计时相关性确定样品中的空间位置处的不同靶标的数目的方法

本披露提供了用于使用本披露的随机条形码上的空间标记和计时相关性确定样品中的不同靶标的数目以及它们的不同空间位置的方法。使用装置将组织薄片分离为切片。装置将切片以已知方式放置在基底上。将切片放置在基底上使得它们保留组织切片的物理次序。将切片放置在基底上使得它们不保留组织切片的物理次序。

在一些实施例中,装置以指定速率获取实体组织的活检物。装置将活检样品放置在基底上的指定位置处。活检物样品的位置与装置获取活检样品的速率相关。该速率与装置在特定位置获取生物样品的时间相关。

在任一情况下,使样品/切片与多个固体支持物接触。使样品/切片以已知方式与多个固体支持物接触,使得用户知晓具有哪种空间标记的哪个固体支持物接触了哪种切片。可以使单个固体支持物接触样品/切片的每个切片。固体支持物包含多种随机条形码。随机条形码包含通用标记、空间标记、细胞标记、分子标记以及靶缔合区。可以对样品/切片和固体支持物一起进行成像。图像捕获了组织薄片的物理结构并且鉴定了与组织薄切片相缔合的固体支持物的取向。例如,可以用可以在图像中可见的鉴定物刻蚀固体支持物。刻蚀的固体支持物中的每一个上的空间标记的序列是预先已知的。

样品/切片的切片中的靶标与靶缔合区(例如通过它们的聚(a)尾)相缔合。靶标交联至靶缔合区。将固体支持物从样品/切片去除。使用逆转录酶对与靶缔合区相缔合的靶标进行逆转录,从而生成为将随机条形码的标记掺入到其多核苷酸序列中的转录物的靶标-条形码分子。使用聚合酶链式反应扩增靶标-条形码分子。例如通过测序确定靶标-条形码分子的序列。序列反应确定了空间标记、细胞标记、分子标记以及靶标序列的一些或全部。计数不同靶标的数目,其中特异性分子标记的独特出现指示不同的靶标。空间标记的序列用于使不同靶标的数目与特定固体支持物相关联,与固体支持物与样品/切片接触的具体时间相关联。以此方式,可以分析样品/切片的物理空间中的不同靶标的位置。生成了谱图,该谱图显示出样品/切片中不同靶标的位置和数量。不同靶标的数量以比色强度显示。

实例3

用于使用标记平板印刷术确定样品中的空间位置处的不同靶标的数目的方法

本披露提供了用于使用本披露的随机条形码上的空间标记的长度确定样品中的不同靶标的数目以及它们的不同空间位置的方法。将组织薄片分离为切片。将切片以已知方式放置在基底上。将切片放置在基底上使得它们保留组织切片的物理次序。将切片放置在基底上使得它们不保留组织切片的物理次序。在一些实施例中,组织薄片未被分离为切片。在一些实施例中,组织薄片保持完整。

在任一情况下,使组织与多个固体支持物接触。可以使单个固体支持物接触组织薄片的每个切片。固体支持物可以包含预空间标记。将预空间标记连接到固体支持物。预空间标记包含细胞标记、分子标记和靶缔合区。预空间标记包含可激活的共有序列。可激活的共有序列被激活以连接至包含相应的可激活序列的空间标记块。例如,预空间标记包含生物素并且空间标记块包含在一端的抗生物素蛋白和在另一端的生物素。空间标记块是当串联在一起时形成空间标记的核苷酸的序列。

空间标记串联以使得离散空间标记块在特定的物理位置处添加到特异性预空间标记的几何方式发生。空间标记块在从上向下移动穿过组织薄片时以逐渐的方式添加。然后空间标记块在从左向右移动穿过组织薄片时以逐渐的方式添加。以此方式,空间标记(即,包含串联的空间标记块)的长度指示组织样品中的物理位置。

在固体支持物与空间标记块连接之前对组织薄切片和固体支持物一起进行成像。图像捕获了组织薄片的物理结构并且鉴定了与组织薄片相缔合的固体支持物的取向。例如,可以用可以在图像中可见的鉴定物刻蚀固体支持物。刻蚀的固体支持物中的每一个上的空间标记的序列是预先已知的。

组织薄片的切片中的靶标与靶缔合区(例如通过它们的聚(a)尾)相缔合。靶标交联至靶缔合区。将固体支持物从组织薄切片去除。使用逆转录酶对与靶缔合区相缔合的靶标进行逆转录,从而生成为将随机条形码的标记掺入到其多核苷酸序列中的转录物的靶标-条形码分子。使用聚合酶链式反应扩增靶标-条形码分子。例如通过测序确定靶标-条形码分子的序列。序列反应确定了空间标记、细胞标记、分子标记以及靶标序列的一些或全部。计数不同靶标的数目,其中特异性分子标记的独特出现指示不同的靶标。空间标记的长度用于使不同靶标的数目与组织薄片的物理空间中的位置相关联。生成了谱图,该谱图显示出组织薄切片中不同靶标的位置和数量。不同靶标的数量以比色强度显示。

实例4

用于生成具有dna条形码和光谱上可分辨的条形码的独特合成颗粒的大文库的组合方

这个实例展示了用于生成具有dna条形码诸如随机条形码和光谱上可分辨的条形码诸如光学条形码的至少963种独特合成颗粒的大文库的组合方法。

该方法用于编码合成颗粒。如图18a所示,每个合成颗粒可以含有9个“锚定区”。每个锚定区可以具有约数微米至数十微米宽的大小1802。锚定区可以图18a所示的纵向方式或以图18b所示的网格方式布置。锚定区可以占有整个合成颗粒表面(如图18a所示)或合成颗粒表面的一部分(如图18b所示)。每个锚定区可以具有连接到合成颗粒的表面的独特光学标记(ol)。图18a-b示出了连接到合成颗粒的表面的9种光学标记ol1-9。独特的光学标记可以包含寡核苷酸序列。独特的光学标记可以包含独特的光学部分。独特的光学部分可以是荧光团。ol1-3可以用于编码对应于第一编码步骤中的第一96种独特的细胞标记的细胞标记部分1。os4-6可以用于编码对应于第二分裂步骤中的第二96种独特细胞标记的细胞标记部分2。ol7-9可以用于编码对应于第三分裂步骤中的第三96种独特细胞标记的细胞标记部分3。除了“光学标记”,整个合成颗粒表面或合成颗粒表面的一部分可以通过3’向上方式与通用序列(us)连接,即寡核苷酸的3’端未连接到合成颗粒。

在第一编码步骤/第一分裂步骤中,合成颗粒被分布在第一板的96个孔上并且与每个孔中的寡核苷酸杂交。图19示出了第一编码步骤中的寡核苷酸的杂交。每个孔可以含有例如4种类型的寡核苷酸。第一类型的寡核苷酸各自可以含有与通用序列(us)互补的区、接着是细胞标记部分1(每1部分具有96种)、接着是接头序列(接头1)。第二类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol1互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团的光学标记。荧光端可以是五种可能性之一,诸如5种不同的荧光团或4种不同的荧光团和无荧光团的可能性。第三类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol2互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团的光学标记。荧光端可以是五种可能性之一,诸如5种不同的荧光团或4种不同的荧光团和无荧光团的可能性。第四类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol3互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团的光学标记。荧光端可以是五种可能性之一,诸如5种不同的荧光团或4种不同的荧光团和具有荧光团的可能性)。

图20是示出了第一板中96个孔中的每一个中的寡核苷酸含量的查找表。第一板中96个孔中的每一个中的寡核苷酸含量示出了细胞标记部分1与通过ol1-3进行的编码的对应。光谱上不同的光学部分组中光学部分的数目,即荧光团的可能性数目必须足以允许对至少数目的独特合成颗粒的编码。为了编码96种独特的合成颗粒,kn必须大于或等于96,其中k是光谱上不同的光学部分组中光学部分的数目,n是区数。在这个实例中,ol1-3的n是3,ol4-6的n是3并且ol7-9的n是3。因此,k必须是至少5,其中kn=5^3=125>96。

在将合成颗粒分布在第一板的96个孔上并且与每个孔中的寡核苷酸杂交之后,可以将dna聚合酶和dna连接酶引入到每个孔中。dna聚合酶可以延伸具有细胞标记部分2和接头2序列的us序列。dna连接酶可以将荧光探针共价地连接到ol寡核苷酸上。图21示出了在第一编码步骤中在双螺旋dna聚合、连接和变性之后合成颗粒上的不同区域中的单链寡核苷酸。

在包括聚库和第二分离的第二编码步骤处,可以将来自第一板的所有孔中的合成颗粒合并,并且分离到第二板的96个孔中的每一个中。图22示出了第二编码步骤中的寡核苷酸的杂交。第二板的每个孔可以含有4种类型的寡核苷酸。每个孔含有4种类型的寡核苷酸。第一类型的寡核苷酸各自可以包含接头1、接着是细胞标记部分2(每1部分具有96种)、接着是另一种接头序列(接头2)。第二类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol4互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团的光学标记。荧光端可以是五种可能性之一,诸如5种不同的荧光团或4种不同的荧光团和无荧光团的可能性。第三类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol5互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团的光学标记。荧光端可以是五种可能性之一,诸如5种不同的荧光团或4种不同的荧光团和无荧光团的可能性。第四类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol6互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团的光学标记。荧光端可以是五种可能性之一,诸如5种不同的荧光团或4种不同的荧光团和无荧光团的可能性。

图23是示出了第二板中的96个孔中的每一个中的寡核苷酸含量的查找表。第二板中96个孔中的每一个中的寡核苷酸含量示出了细胞标记部分2与通过ol4-6进行的编码的对应。

在将合成颗粒分布在第二板的96个孔上并且与每个孔中的寡核苷酸杂交之后,可以将dna聚合酶和dna连接酶引入到每个孔中。dna聚合酶可以延伸具有细胞标记部分1和接头1序列的us。dna连接酶可以将荧光探针共价地连接到ol寡核苷酸上。图24示出了在第二编码步骤中在双螺旋dna聚合、连接和变性之后合成颗粒上的不同区域中的单链寡核苷酸。

在包括聚库和第三分离的第三编码步骤处,可以将来自第二板的所有孔中的合成颗粒合并,并且分离到第三板的96个孔中的每一个中。图25示出了第三编码步骤中的寡核苷酸的杂交。第三板的每个孔可以含有4种类型的寡核苷酸。每个孔含有4种类型的寡核苷酸。第一类型的寡核苷酸各自可以包含接头2、接着是细胞标记部分3(每1部分具有96种)、接着是分子索引(随机寡核苷酸)和寡聚(da)。第二类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol7互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团的光学标记。荧光端可以是五种可能性之一,诸如5种不同的荧光团或4种荧光团和无荧光团的可能性。第三类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol8互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团的光学标记。荧光端可以是五种可能性之一,诸如5种不同的荧光团或4种荧光团和无荧光团的可能性。第四类型的寡核苷酸各自可以包括含有具有小5’延伸的与ol9互补的链以及与较长链上的延伸互补的较短链的双链体结构。较短的链可以在3’端上包含具有光学部分例如荧光团的光学标记。荧光端可以是五种可能性之一,诸如5种不同的荧光团或4种荧光团和无荧光团的可能性。

图26是示出了第三板中的96个孔中的每一个中的寡核苷酸含量的查找表。第三板中96个孔中的每一个中的寡核苷酸含量示出了细胞标记部分2与通过ol4-6进行的编码的对应。

在将合成颗粒分布在第三板的96个孔上并且与每个孔中的寡核苷酸杂交之后,可以将dna聚合酶和dna连接酶引入到每个孔中。dna聚合酶可以延伸具有细胞标记部分1和接头1序列的us。dna连接酶可以将荧光探针共价地连接到ol寡核苷酸上。图27示出了在第三编码步骤中在双螺旋dna聚合、连接和变性之后合成颗粒上的不同区域中的单链寡核苷酸。

图28示出了涂覆有dna条形码和光谱上可辨的条形码的整个合成颗粒。每种dna条形码诸如随机条形码可以包含通用序列、细胞标记、分子标记和寡聚(dt)区。细胞标记可以包括通过接头1和接头2隔开的细胞标记部分1、细胞标记部分2和细胞标记部分3。每种可辨的条形码诸如光学条形码可以包含ol1-9和伴随的光学部分。

图29示出了合成颗粒的光谱可分辨的条形码ol1-9的示例性组合。合成颗粒可以与9个光学部分诸如9个荧光区的独特组合连接。光学部分的独特组合对应于独特的细胞标记序列。合成颗粒内的每个荧光区的荧光可以使用荧光成像和图像分析检测。然后可以基于图20、图23和图26中的三个表确定与合成颗粒连接的细胞标记。9个荧光区的组合对应于细胞标记12、70、22。

总之,这些数据展示出了使用用dna标记和光谱条形码编码合成颗粒的分离-聚库方法用于生成合成颗粒的大文库。

实例5

生成组织薄片的空间基因表达谱图

这个实例展示了使用来自实例4的编码的合成颗粒生成组织薄片的空间基因表达谱图。

首先,将编码的合成颗粒随机地撒布在载玻片上。第二,悬浮编码的合成颗粒。在干燥之后,将合成颗粒固定并且形成不重叠的单层。第三,在不同的荧光通道下扫描载玻片。第四,分析图像以推断每个编码的合成颗粒的光谱特征,并且使用查找表推断细胞标记身份。第五,将薄组织切片放置在具有编码的合成颗粒的载玻片之上。第六,将用裂解缓冲液浸渍的滤纸片放置在组织切片之上并且施加压力并进行保持以允许细胞裂解和mrna杂交。第七,将cdna合成试剂成层堆放在载玻片之上以进行cdna合成反应。第八,将pcr试剂成层堆放在载玻片之上以生成cdna的拷贝。可替代地,可以在mrna杂交之后的任何步骤处将编码的合成颗粒收回,并且可以在管中用编码的合成颗粒进行后续反应。第九,测序pcr产物以确定细胞标记、分子标记和基因身份。第十,将与每个细胞相关联的分子映射到载玻片上的位置。对于每个基因,获得在特定位置处发现的靶分子数目的2d图像。

总之,这些数据展示了使用编码的合成颗粒生成组织薄片的空间基因表达谱图。

实例6

合成颗粒的合成

这个实例展示了通过停止流动式平板印刷术进行的合成颗粒的合成。

首先,将微流体装置(例如pdms或noa)制造成具有9个输入口,该9个输入口汇聚至单一通道,产生1个输出口。第二,在每个输入口中,送进聚(乙二醇)二丙烯酸酯(pegda)、光引发剂、5’acrydite修饰的通用序列(us)寡核苷酸以及5’acrydite修饰的ol寡核苷酸(ol1寡核苷酸针对输入口1、ol2寡核苷酸针对输入口2…ol9寡核苷酸针对输入口9)的混合物。第三,在输入口中的每一个处施加压力。在层流方式下,9个输入将形成9条平行流。第四,通过具有合成颗粒形状的轮廓的光掩模将会聚通道的区域暴露于uv。在uv暴露时,pegda和acrydite寡核苷酸可以交联形成水凝胶合成颗粒,其中9个区域各自具有并排布置的不同ol寡核苷酸。可以在输出口处收集合成颗粒并且将这些合成颗粒用于实施例4中概述的分离-聚库编码方法。

总之,这些数据展示了通过停止流动式平板印刷术进行的合成颗粒的合成的使用。

在至少一些先前描述的实施例中,在一个实施例中使用的一个或多个元件可以在另一个实施例中互换地使用,除非这种置换是技术上不可行的。本领域技术人员将了解的是,可以在不背离所要求保护的主题的范围的情况下对以上所述的方法和结构做出各种其他省略、添加和修改。所有这样的修改和改变预期属于如所附权利要求书所限定的主题的范围之内。

关于在此使用基本上任何复数和/或单数术语,那些本领域技术人员可以根据上下文和/或应用的需要将复数翻译成单数和/或将单数翻译成复数。为了清晰起见,可以在此清晰地列出各种单数/复数的转换。

本领域技术人员将理解的是,一般而言,在此所使用的术语,尤其是在所附权利要求书中的术语(例如,所附权利要求书的主体)通常意指“开放性的”术语(例如,术语“包含(including)”应当被解释为“包含但不局限于”,术语“具有”应当被解释为“具有至少”,术语“包括(includes)”应当被解释为“包括但不限于”等等)。本领域的普通技术人员另外将认识到的是,如果意指特定数目的一种所介绍的权利要求陈述,那么将在该权利要求中明确陈述这种意思,并且在无这类陈述的存在下,不呈现这种意思。例如,为了有助于理解,以下所附权利要求书可以包含介绍性短语“至少一个”和“一个或多个”的使用,以用来介绍权利要求陈述。然而,此类短语的使用不应当解释为意指经由不定冠词“一个”或“一种”介绍权利要求陈述将任何含有此类介绍的权利要求陈述的具体权利要求限制于仅含有一个这种陈述的实施例,即使在相同的权利要求包括介绍性短语“一个或多个”或“至少一个”以及不定冠词例如“一个”或“一种”(例如,“一个”和/或“一种”,也应当解释为表示“至少一个”或“一个或多个”)的时候也是如此;这对于使用定冠词来介绍权利要求陈述同样适用。另外,即使明确地陈述一个介绍的权利要求陈述的特定数目,本领域技术人员将会意识到此陈述物也应当解释为意味着至少该陈述的数目(例如,仅陈述“两个陈述”而无其他修饰语意指至少两个陈述,或两个或者多个陈述)。此外,在使用类似于“a、b以及c等中的至少一个”的惯例的情况下,通常这样的句法结构意指在一定意义上本领域技术人员将理解该惯例(例如,“具有a、b以及c中的至少一个的系统”将包括但不局限于仅具有a、仅具有b、仅具有c、同时具有a和b、同时具有a和c、同时具有b和c、和/或同时具有a、b以及c等的系统)。在使用类似于“a、b以及c等中的至少一个”的惯例的情况下,通常这样的句法结构意指在一定意义上本领域技术人员将理解该惯例(例如,“具有a、b或c中的至少一个的系统”将包括但不局限于仅具有a、仅具有b、仅具有c、同时具有a和b、同时具有a和c、同时具有b和c、和/或同时具有a、b以及c等的系统)。本领域的普通技术人员将进一步理解的是无论是在说明书、权利要求书还是附图中,呈现两个或更多个替代性术语的几乎任何分离性词语和/或短语都应当理解为考虑到了包括这些术语中的一者、这些术语中的任一者或这两个术语的可能性。例如,短语“a或b”应理解为包括“a”或“b”或“a和b”的可能性。

此外,当以马库什(markush)组的方式描述本披露的多个特征或方面时,在本领域内的技术人员将会认识到还以该马库什组中任一个单独的成员或多个成员的子组的方式来对本披露进行描述。

如本领域技术人员将理解,出于诸如就提供书面说明而言的任何和所有目的,在此披露的所有范围也包括任何和所有可能的子范围及其子范围的组合。任何列出的范围都可以容易被认为已经充分描述并使得同一范围分成至少相等的二等分、三等分、四等分、五等分、十等分等。作为一个非限制性实例,在此讨论的每个范围可以容易分为下三分之一、中三分之一和上三分之一等。如本领域技术人员还将理解的是,所有诸如“至多”、“至少”、“大于”、“小于”等语言包括所提数值,并且是指可以接着分成如上所讨论的子范围的范围。最后,如本领域技术人员将理解,一个范围包括每个独立成员。因此例如,具有1-3个物品的组是指具有1个、2个或3个物品的组。类似地,具有1-5个物品的组是指具有1个、2个、3个、4个或5个物品的组,等等。

虽然在此已披露了各个方面和实施例,其他方法和实施例对于本领域技术人员而言将是清楚的。在此所披露的各个方面和实施例是出于数目的目的并且不预期是限制性的,其中真实的范围和精神是由以下权利要求书所指示的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1