基质印迹和清除的制作方法

文档序号:18456871发布日期:2019-08-17 01:41阅读:343来源:国知局
基质印迹和清除的制作方法

本申请要求zhuang等人于2016年11月8日提交的题为“matriximprintingandclearing”的美国临时专利申请序列号62/419,033的权益,该申请通过引用整体并入本文。

政府资助

本发明是在nih授予的批准号r01mh113094和r01mh111502的政府支持下完成的。美国政府拥有本发明的某些权利。

领域

本发明一般性涉及用于成像或测定例如细胞内的核酸或其他所需靶标的系统和方法。

背景

高度多重化的单分子荧光原位杂交(smfish)已成为空间分辨的单细胞转录组学的有前途的方法,因为它能够在其天然细胞环境中直接成像和分析许多rna种类(species)。然而,背景(来自诸如fish探针的脱靶结合或细胞自发荧光的因素)可能在许多重要应用中(例如成像较短的rna、增加多重化程度和组织样品中的成像)变得有限制作用。因此,需要改进这些技术。

概述

本发明一般性涉及用于成像或测定例如细胞内的核酸的系统和方法。在一些情况下,本发明的主题涉及相关的产品、特定问题的替代解决方案和/或一个或多个系统和/或物品的多种不同用途。

在一组实施方案中,该方法包括将样品暴露于多个核酸探针,聚合样品中的凝胶,将靶标锚定至凝胶,清除样品中的非靶标,和通过成像测定核酸探针的结合来测定凝胶内的靶标。

在另一组实施方案中,该方法包括将样品暴露于多个核酸探针,聚合样品中的凝胶,将靶标锚定至凝胶,减少样品中的背景荧光,和使核酸探针成像。

在又一组实施方案中,该方法包括将样品暴露于多个merfish核酸探针,将样品暴露于多个锚定核酸探针,将样品的至少一部分包埋在聚丙烯酰胺凝胶中,将锚定核酸探针中的至少一些探针固定至聚丙烯酰胺凝胶,清除样品中的蛋白质和/或脂质和/或dna和/或细胞外基质和/或rna分子,和通过使聚丙烯酰胺凝胶成像测定merfish核酸探针的结合。在一些实施方案中,该方法包括将样品暴露于多个核酸探针,将样品暴露于多个锚定核酸探针,将样品的至少一部分包埋在聚丙烯酰胺凝胶中,将锚定核酸探针中的至少一些探针固定至聚丙烯酰胺凝胶,清除样品中的蛋白质和/或脂质和/或dna和/或细胞外基质和/或rna分子,和通过使聚丙烯酰胺凝胶成像测定核酸探针的结合。

根据又一组实施方案,该方法包括将样品的至少一部分包埋在基质中,将靶标固定至基质,清除基质中的非靶标,和使基质中的靶标成像。

在另一方面,本发明包括制备本文所述的一个或多个实施方案的方法。在又一方面,本发明涵盖使用本文所述的一个或多个实施方案的方法。

当结合附图考虑本发明的各种非限制性实施方案的以下详细描述时,本发明的其他优点和新颖特征将变得显而易见。

附图简要说明

将参考附图通过示例的方式描述本发明的非限制性实施方案,附图是示意性的并且不旨在按比例绘制。在附图中,所说明的每个相同或几乎相同的组分通常由单个数字表示。为了清楚起见,并非每个组分都标记在每个图中,也没有示出本发明的每个实施方案的每个组分,其中说明对于本领域普通技术人员来说理解本发明不是必需的。在附图中:

图1a-1c示出了根据本发明的一个实施方案的背景的减少;

图2a-2d示出了在本发明的另一个实施方案中减少背景而不损失rna;

图3a-3e示出了在本发明的又一个实施方案中多色成像中背景的减少;

图4a-4g示出了本发明的又一个实施方案中组织中背景的减少;

图5a-5c示出了根据本发明的一个实施方案的merfish;

图6示出了根据本发明的一个实施方案的脱靶结合;

图7a-7d示出了在又一个实施方案中使用蛋白酶消化和洗涤剂的清除;

图8a-8b显示了在本发明的又一个实施方案中清除没有减少探针结合;

图9a-9b示出了在本发明的又一个实施方案中在低丰度rna的检测中偏倚的减少;和

图10示出了在本发明的某些实施方案中的可重复性。

详述

本发明一般性涉及用于成像或测定例如细胞或组织内的核酸或其他所需靶标的系统和方法。在一个方面,将样品暴露于在样品中测定的多个核酸探针。但是,在一些情况下,背景荧光或脱靶结合可能使测定适当结合的核酸探针更加困难。因此,可以从样品中“清除”可能造成背景的样品的其他组分例如蛋白质、脂质和/或其他非靶标,以改善测定。然而,在某些实施方案中,可以例如使用样品中的聚合物或凝胶防止核酸或其他所需靶标也被清除。其他方面一般性涉及包括此类系统的组合物或试剂盒,使用此类系统的方法等。

因此,在一个方面,本发明一般性涉及用于防止样品中的核酸或其他所需靶标被经清除的系统和方法,例如通过固定核酸或其他所需靶标。在一些情况下,核酸或其他靶标因此可以在样品内进行成像或以其他方式测定。例如,能够将多个核酸探针应用于样品,并且例如使用荧光确定它们在样品中的结合,以测定样品中核酸探针的位置。此外,在一些情况下,可以将多个核酸探针依次应用于样品。在其他实施方案中,能够测定样品中例如除了核酸以外和/或代替核酸的其他靶标。因此,应当理解,为了清楚起见,在本文中呈现的是核酸,但是在其他实施方案中,可以测定其他靶标。

不希望受任何理论的束缚,据信某些组分如蛋白质和脂质、未结合或不相关的核酸、荧光组分(漂白的或未漂白的)等可能在成像或分析中产生问题,例如,由于自发荧光、淬灭荧光分子的组分、脱靶结合或其他现象。例如,据信核酸探针可以不与样品内的适当靶标结合,而是可以“脱靶”结合至其他细胞组分,包括但不限于蛋白质、脂质、rna、dna等。类似地,靶向一个dna或rna分子的探针可以“脱靶”结合到错误的dna或rna分子上。例如,可以通过不完美的碱基配对、电荷-电荷相互作用或其他分子相互作用来驱动这些相互作用。

因此,在某些实施方案中,可以将聚合物或凝胶应用于样品以固定所需的核酸分子(或其他所需的靶标),而核酸探针脱靶结合的组分能够从样品中清除,例如,通过去除和/或降解技术。这可减少脱靶结合的探针的量,有助于样品的成像或其他分析。可以通过例如去除和/或降解技术清除样品中的其他组分如蛋白质和脂质。这可减少背景的量,有助于样品的成像或其他分析。

例如,在一组实施方案中,将样品暴露于多个寡核苷酸探针。样品可以是生物样品,例如细胞或组织。探针可以是例如smfish或merfish探针,并且可与mrna或其他rna基本上互补,例如,用于转录组分析。探针还可包括信号传导实体例如荧光信号传导实体用于样品的成像和/或分析。另外,如下文所讨论的,在一些情况下,还可以包括锚定探针,其可以用于将探针固定到聚合物或凝胶上。在一些情况下,例如,锚定探针可含有包含胸腺嘧啶残基的部分(例如,用于结合mrna的多聚腺苷酸尾)。另外,在一些实施方案中,锚定探针可含有与所需核酸种类互补的序列,例如通过碱基配对与它们结合。在一些实施方案中,锚定探针可含有能够与凝胶或蛋白质聚合的部分。在暴露于样品后,核酸探针可以与样品内的rna、dna或其他组分缔合。

在一些实施方案中,例如在施加核酸探针之前,将样品包埋在固定核酸的基质内。例如,基质可包含凝胶或聚合物,例如聚丙烯酰胺。因此,例如,能够将丙烯酰胺和合适的交联剂(例如,n,n’-亚甲基双丙烯酰胺)加入到样品中并聚合形成凝胶。锚定探针(如果存在的话)可以包括在聚合过程中能够与凝胶聚合的部分(例如,亚磷酰胺(acrydite)部分),并且核酸(例如,含有多聚腺苷酸尾的mrna)然后能够与锚部分缔合。以这种方式,mrna可以固定在聚丙烯酰胺凝胶上。作为另一个例子,可以使用具有与dna或rna基本上互补的部分的锚定探针将dna和/或rna分子固定到聚丙烯酰胺凝胶上。作为又一个例子,dna和/或rna分子可以在聚丙烯酰胺凝胶内物理缠结(例如,由于它们的长度)以将它们固定在聚丙烯酰胺凝胶上。

固定之后,可从样品中“清除”其他组分。这种清除可以包括从样品中去除(例如,物理去除)和/或降解,使得它们在背景中不再那么突出。降解可包括例如化学降解、酶促降解等。例如,通过将凝胶暴露于合适的流体、例如缓冲溶液,可以从凝胶中“冲洗”样品中的蛋白质。可以将诸如酶(例如蛋白酶、消化酶等)、变性剂(例如,盐酸胍)等的组分应用于蛋白质以将蛋白质消化成较小的片段、单个氨基酸等,其可以更容易地从样品中去除,或者可能足够小或足够暗,以至于能够忽略它们的存在。类似地,可以使用表面活性剂如tritonx-100或sds清除脂质,并且可以使用edta清除离子,等等。在一些情况下,这些可以组合在一起。如上所述,据信例如当使用荧光或其他显微术技术时,这些组分可以增加背景,因此,去除这些组分应该会降低背景。然而,应该注意的是,固定在聚合物或凝胶内的核酸可能不会被清除或去除,因此仍然可用于分析。

以上讨论是本发明的一个实施方案的非限制性示例。然而,其他实施方案也是可能的。因此,更一般地,本发明的各个方面涉及用于成像或测定例如在细胞、组织或其他样品中的核酸或其他所需靶标的各种系统和方法。例如,在某些实施方案中,将所需靶标固定在惰性基质(例如聚合物或凝胶)中,而其他组分被“清除”,例如通过降解和/或物理去除。

样品可以是任何合适的样品,并且可以是生物样品。在一些情况下,样品含有dna和/或rna,例如可以在样品中测定的dna和/或rna。(在其他实施方案中,可以测定样品中的其他靶标。)在一些情况下,样品可包括细胞,例如哺乳动物细胞或其他类型的细胞。在一些情况下,样品可含有病毒。此外,在一些情况下,样品可以是例如来自活检组织、人工生长或培养等的组织样品。

如果需要测定核酸,则核酸可以是例如细胞(或其他样品)中存在的dna、rna或其他核酸。核酸可以是细胞内源的,或添加到细胞中。例如,核酸可以是病毒的核酸,或人工产生的核酸。在一些情况下,待测定的核酸可以由细胞表达。在一些实施方案中,核酸是rna。rna可以是编码和/或非编码rna。可在细胞内研究的rna的非限制性实例包括mrna、sirna、rrna、mirna、trna、lncrna、snorna、snrna、exrna、pirna等。

在一些情况下,可以研究细胞内的大部分核酸。例如,在一些情况下,可以测定细胞中存在的足够的rna以产生细胞的部分或完整转录组。在一些情况下,测定细胞内的至少4种mrna,并且在一些情况下,可测定细胞内的至少3、至少4、至少7、至少8、至少12、至少14、至少15、至少16、至少22、至少30、至少31、至少32、至少50、至少63、至少64、至少72、至少75、至少100、至少127、至少128、至少140、至少255、至少256、至少500、至少1,000、至少1,500、至少2,000、至少2,500、至少3,000、至少4,000、至少5,000、至少7,500、至少10,000、至少12,000、至少15,000、至少20,000、至少25,000、至少30,000、至少40,000、至少50,000、至少75,000或至少100,000种类型的mrna。

在一些情况下,可以测定细胞的转录组。应当理解,转录组通常包括细胞中产生的所有rna分子,而不仅仅是mrna。因此,例如,转录组还可以包括rrna、trna、sirna等。在一些实施方案中,可以测定细胞的至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或100%的转录组。

细胞或其他样品中的一种或多种核酸的测定可以是定性的和/或定量的。另外,该测定也可以是空间的,例如,可以在二维或三维中确定细胞或其他样品中核酸的位置。在一些实施方案中,可以测定细胞(或其他样品)内核酸的位置、数量和/或浓度。

在一些情况下,可以测定细胞的大部分基因组。测定的基因组区段可以是连续的或散布在基因组上。例如,在一些情况下,在细胞中测定至少4个基因组区段,并且在一些情况下,可在细胞中测定至少3、至少4、至少7、至少8、至少12、至少14、至少15、至少16、至少22、至少30、至少31、至少32、至少50、至少63、至少64、至少72、至少75、至少100、至少127、至少128、至少140、至少255、至少256、至少500、至少1,000、至少1,500、至少2,000、至少2,500、至少3,000、至少4,000、至少5,000、至少7,500、至少10,000、至少12,000、至少15,000、至少20,000、至少25,000、至少30,000、至少40,000、至少50,000、至少75,000或至少100,000个基因组区段。

在一些情况下,可以测定细胞的整个基因组。应当理解,基因组一般涵盖细胞中产生的所有dna分子,而不仅仅是染色体dna。因此,例如,在某些情况下,基因组还可以包括线粒体dna、叶绿体dna、质粒dna等。在一些实施方案中,可以测定细胞的至少约5%、至少约10%、至少约15%、至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约60%、至少约70%、至少约80%、至少约90%或100%的基因组。

然而,如所讨论的,应当理解,在本发明的其他实施方案中,可以测定或固定例如除了核酸以外和/或代替核酸的其他靶标。例如,在本发明的一些实施方案中,待测定或固定的靶标可包括蛋白质(例如,抗体、酶、结构蛋白)、脂质、碳水化合物、病毒等。在一个实施方案中,细胞组分例如蛋白质能够通过与蛋白质结合(例如抗体)来进行检测,所述抗体与锚定在聚合物或凝胶基质上的寡核苷酸探针缀合。然后可以去除这些组分,留下寡核苷酸探针通过其他核酸探针的杂交来检测,其与细胞核酸检测相似或相同。在另一个实施方案中,即使从凝胶或聚合物中去除原始组分,也可以在同一样品中同时检测多种不同的细胞种类。例如,如上所述,可以通过核酸探针的杂交检测rna分子,同时通过抗体-寡核苷酸缀合物检测蛋白质。

如上所述,样品可以部分或完全固定或包埋在聚合物或凝胶中。在一些情况下,样品可以包埋在相对大的聚合物或凝胶中,然后在一些情况下能够例如使用本领域普通技术人员通常可获得的各种切片技术切成切片(section或slice)以产生用于分析的较小部分。例如,组织或器官可以固定在合适的聚合物或凝胶中。

在一些实施方案中可以使用各种聚合物。在一些情况下,可以选择相对光学透明的聚合物。聚合物也可以是在聚合过程中不会显著变形的聚合物,尽管在一些情况下,聚合物可表现出一些变形。在一些情况下,变形的量可以被确定为小于5、小于4、小于3、小于2、小于1.5、小于1.3或小于1.2的尺寸相对变化(即尺寸变化为2意味着样品在线性尺寸上加倍)或者这些的反向量(即尺寸的反向变化为2意味着样品在线性尺寸上减半)。

合适的聚合物的实例包括聚丙烯酰胺和琼脂糖。在一些情况下,聚合物是凝胶或水凝胶。各种聚合物可用于涉及凝胶亚单元之间的化学交联的各种实施方案,包括但不限于丙烯酸、丙烯酰胺、乙二醇二丙烯酸酯、乙二醇二甲基丙烯酸酯、聚(乙二醇二甲基丙烯酸酯);和/或疏水或氢键相互作用,如聚(n-异丙基丙烯酰胺)、甲基纤维素、(环氧乙烷)-(环氧丙烷)-(环氧乙烷三元共聚物、海藻酸钠、聚(乙烯醇)、海藻酸、壳聚糖、阿拉伯胶、明胶和琼脂糖。

在一组实施方案中,可以在聚合过程中使用锚定探针。锚定探针可包括在聚合过程中能够与聚合物聚合并且能够例如化学和/或物理地固定靶标的部分。例如,在聚丙烯酰胺的情况下,锚定探针可以包括能够聚合并掺入聚合物中的亚磷酰胺部分。

锚定探针还可以含有能够与核酸分子或其他需要固定的分子(例如蛋白质或脂质、其他所需靶标等)相互作用并结合的部分。固定可以是共价或非共价的。例如,为了固定靶核酸,锚定探针可以包含含有亚磷酰胺部分的核酸(例如,在5'末端、3'末端、内部碱基等)和与靶核酸的至少一部分基本上互补的核酸序列。例如,核酸可以与该核酸的至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个核苷酸互补。在一些情况下,互补性可能是精确的(watson-crick互补性),或者可能存在1、2个或更多个错配。在一些情况下,例如在转录组分析的情况下,锚定探针能够配置成固定mrna。例如,在一组实施方案中,锚定探针可例如顺序地含有用于结合mrna的多聚腺苷酸尾的多个胸腺嘧啶核苷酸。因此,例如,锚定探针能够具有锚定探针内的至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个或更多个连续的胸腺嘧啶核苷酸(例如,多聚dt部分)。在一些情况下,至少一些胸腺嘧啶核苷酸可以是“锁”胸腺嘧啶核苷酸。这些可包含这些胸腺嘧啶核苷酸的至少20%、至少30%、至少40%、至少50%、至少60%、至少70%或至少80%。在某些实施方案中,锁核苷酸和非锁核苷酸可以交替。这种锁胸腺嘧啶核苷酸可用于例如稳定mrna的多聚腺苷酸尾部与锚定探针的杂交。

其他方法可用于锚定核酸或其中需要固定的其他分子。在一组实施方案中,可以通过共价键合来固定核酸,例如dna或rna。例如,在一组实施方案中,可以使用烷基化试剂,其与rna或dna共价结合并含有能够在聚合时掺入聚丙烯酰胺中的第二化学部分。在另一组实施方案中,rna分子中的末端核糖可以使用高碘酸钠(或另一种氧化剂)氧化以产生醛,其可以与丙烯酰胺或其他聚合物或凝胶交联。在其他实施方案中,可以使用能够修饰碱基的化学试剂,例如醛,例如多聚甲醛或戊二醛,烷化剂或含琥珀酰亚胺基的基团;修饰末端磷酸盐的化学试剂,如碳酰亚胺,如edc(1-乙基-3-(3-二甲基氨基丙基)碳二亚胺);修饰内部糖类的化学试剂,例如对-马来酰亚胺基-苯基异氰酸酯;或修饰末端糖的化学试剂,如高碘酸钠。在一些情况下,这些化学试剂可带有第二化学部分,其随后能够直接交联至凝胶或聚合物,和/或可用能够直接交联至凝胶或聚合物的化合物进一步修饰。

在其他实施方案中,可以使用具有与dna或rna基本上互补的部分的锚定探针来固定核酸。在锚定探针和核酸之间可以存在5、6、7、8、9、10、12、13、14、15、20、25、30、35、40、45、50或更多个互补核苷酸。在另一组实施方案中,核酸可以在聚合物或凝胶内物理缠结,例如由于它们的长度,并因此不能从它们在凝胶内的原始位置扩散。

在其他实施方案中,类似的锚定探针可用于将其他组分固定到聚合物或凝胶上。例如,在一组实施方案中,可以修饰能够特异性结合合适靶标(例如,另一种蛋白质、脂质、碳水化合物、病毒等)的抗体,以包括能够变成掺入聚合物或凝胶中的亚磷酰胺部分。

另外,应当理解,在各种实施方案中,可以以任何合适的顺序进行样品在基质内的包埋和核酸(或其他所需靶标)的固定。例如,可以在包埋样品之前、期间或之后进行固定。在一些情况下,在凝胶或聚合物形成之前或期间,可以对靶标进行化学修饰或反应以与凝胶或聚合物交联。

在将核酸或其他合适的分子固定到聚合物或凝胶上之后,可以“清除”样品中的其他组分。这种清除可以包括非所需的靶标的组分的去除和/或非所需的靶标的组分的降解(例如,到较小的组分、非荧光的组分等)。在一些情况下,可以清除样品中至少50%,至少60%,至少70%,至少80%或至少90%的非所需的组分。在某些实施方案中也可进行多个清除步骤,例如,以去除各种非所需的组分。如所讨论的,据信去除这些组分可降低分析期间的背景(例如,通过降低背景和/或脱靶结合),而所需组分(例如核酸)能被固定并因此不被清除。

例如,可以使用酶、变性剂、螯合剂、化学试剂等从样品中清除蛋白质,其可以将蛋白质分解成更小的组分和/或氨基酸。这些较小的组分可以更容易地被物理去除,和/或可以足够小或惰性,使得它们不会显著影响背景。类似地,可以使用表面活性剂等从样品中清除脂质。在某些情况下,使用这些中的一种或多种,例如同时或顺序使用。合适的酶的非限制性实例包括蛋白酶,例如蛋白酶k、朊酶或肽酶,或消化酶,例如胰蛋白酶、胃蛋白酶或胰凝乳蛋白酶。合适的变性剂的非限制性实例包括盐酸胍、丙酮、乙酸、尿素或高氯酸锂。能够使蛋白质变性的化学试剂的非限制性实例包括溶剂例如苯酚、氯仿、异氰酸胍、尿素、甲酰胺等。表面活性剂的非限制性实例包括tritonx-100(聚乙二醇对-(1,1,3,3-四甲基丁基)-苯基醚)、sds(十二烷基硫酸钠)、igepalca-630或泊洛沙姆。螯合剂的非限制性实例包括乙二胺四乙酸(edta)、柠檬酸盐或聚天冬氨酸。在一些实施方案中,可将诸如这些的化合物施加于样品以清除蛋白质、脂质和/或其他组分。例如,可以将缓冲溶液(例如,含有tris或三(羟甲基)氨基甲烷)施加于样品,然后去除。

可用于去除dna的dna酶的非限制性实例包括dna酶i、dsdna酶、多种限制酶等。清除rna的技术的非限制性实例包括rna酶,例如rna酶a、rna酶t或rna酶h或化学试剂,例如通过碱水解(例如,通过将ph增加至大于10)。去除糖或细胞外基质的系统的非限制性实例包括酶,例如几丁质酶、肝素酶或其他糖基化酶。去除脂质的系统的非限制性实例包括酶如脂肪酶,化学试剂如醇(如甲醇或乙醇),或洗涤剂如tritonx-100或十二烷基硫酸钠。其中许多是商业上容易获得的。以这种方式,可以去除样品的背景,这可以促进核酸探针或其他所需靶标的分析,例如使用荧光显微术或本文所讨论的其他技术。如上所述,在各种实施方案中,可以固定各种靶标(例如,核酸、某些蛋白质、脂质、病毒等),同时可以使用合适的试剂或酶清除其他非靶标。作为非限制性实例,如果固定蛋白质(例如抗体),则可以使用rna酶、dna酶、去除脂质、糖等的系统。

在一些情况下,所需的靶标是核酸。在一组实施方案中,作为说明性的非限制性实例,可以通过同时和/或顺序地将样品暴露于一种或多种类型的核酸探针来研究样品。例如,在一组实施方案中,核酸探针可以包括smfish或merfish探针,例如国际专利申请公开号wo2016/018960或wo2016/018963中讨论的那些,这些文献各自通过引用整体并入本文。然而,应当理解,以下内容仅作为示例,并且在其他实施方案中,所需的靶标可以是例如蛋白质、脂质、病毒等。

核酸探针可包含核酸(或能与核酸杂交的实体,例如,特异性地杂交),例如dna、rna、lna(锁核酸)、pna(肽核酸)或其组合。在一些情况下,核酸探针内还可以存在另外的组分,例如,如下文所讨论。可以使用任何合适的方法将核酸探针引入细胞或其他样品中。

例如,在一些实施方案中,在引入核酸探针之前固定细胞或其他样品,例如,以保留核酸在样品内的位置。用于固定细胞和组织的技术是本领域普通技术人员已知的。作为非限制性实例,可以使用化学品如甲醛、多聚甲醛、戊二醛、乙醇、甲醇、丙酮、乙酸等固定细胞。在一个实施方案中,可以使用hepes-谷氨酸缓冲液介导的有机溶剂(hope)固定细胞。

可以使用任何合适的方法将核酸探针引入细胞(或其他样品)中。在一些情况下,细胞可以被充分透化,使得核酸探针可以通过使含有核酸探针的流体在细胞周围流动而引入细胞中。在一些情况下,细胞可以充分透化作为固定过程的一部分;在其他实施方案中,细胞可以通过暴露于某些化学物质如乙醇、甲醇、tritonx-100等而透化。另外,在一些实施方案中,诸如电穿孔或显微注射的技术可用于将核酸探针引入细胞或其他样品中。

本发明的某些方面通常涉及被引入细胞(或其他样品)的核酸探针。取决于应用,探针可以包含可以与核酸杂交(通常通过watson-crick碱基配对)的多种实体中的任何一种,例如dna、rna、lna、pna等。核酸探针通常含有能够与靶核酸的至少一部分结合的靶序列,在某些情况下是特异性地结合。当引入细胞或其他样品时,核酸探针可能能够结合特定的靶核酸(例如,mrna或本文所述的其他核酸)。在一些情况下,核酸探针可以使用信号传导实体(例如,如下文所讨论)和/或通过使用能够结合核酸探针(即,一级核酸探针)的二级核酸探针来测定。下面详细讨论这种核酸探针的测定。

在一些情况下,可以例如同时将多于一种类型的(一级)核酸探针施加于样品。例如,可以存在至少2、至少5、至少10、至少25、至少50、至少75、至少100、至少300、至少1,000、至少3,000、至少10,000、至少30,000、至少50,000、至少100,000、至少250,000、至少500,000或至少1,000,000个可区分的核酸探针,其例如同时或顺序施加于样品。

靶序列可以位于核酸探针(或一级核酸探针或编码核酸探针)内的任何位置。靶序列可含有与靶核酸的一部分基本上互补的区域。在一些情况下,所述部分可以为至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%互补。在一些情况下,靶序列的长度可以是至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少50、至少60、至少65、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、至少350、至少400或至少450个核苷酸。在某些情况下,靶序列的长度可以不超过500、不超过450、不超过400、不超过350、不超过300、不超过250、不超过200、不超过175、不超过150、不超过125、不超过100、不超过75、不超过60、不超过65、不超过60、不超过55、不超过50、不超过45、不超过40、不超过35、不超过30、不超过20或不超过10个核苷酸。任何这些的组合也是可能的,例如,靶序列可具有10至30个核苷酸、20至40个核苷酸、5至50个核苷酸、10至200个核苷酸或25至35个核苷酸、10至300个核苷酸等的长度。通常,基于watson-crick核苷酸碱基配对确定互补性。

(一级)核酸探针的靶序列可以参考怀疑存在于细胞或其他样品中的靶核酸来确定。例如,可以使用蛋白质序列通过测定表达形成蛋白质的核酸来确定蛋白质的靶核酸。在一些情况下,仅使用编码蛋白质的核酸的一部分,例如具有如上所述的长度。另外,在一些情况下,可以使用可以用于识别特定靶标的多于一个靶序列。例如,可以顺序和/或同时使用多个探针,其可以与同一靶标的不同区域结合或杂交。杂交通常是指退火过程,通过该过程,互补的单链核酸通过watson-crick核苷酸碱基配对(例如,氢键合、鸟嘌呤-胞嘧啶和腺嘌呤-胸腺嘧啶)缔合以形成双链核酸。

在一些实施方案中,核酸探针,例如一级核酸探针,还可以包含一个或多个“读出”序列。但是,应该理解,读出序列不是在所有情况下都是必需的。在一些实施方案中,核酸探针可包含1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或更多个,20或更多个,32或更多个,40或更多个,50或更多个,64或更多个,75或更多个,100或更多个,128或更多个读出序列。读出序列可位于核酸探针内的任何位置。如果存在多于一个读出序列,则读出序列可以彼此相邻定位,和/或与其他序列是散布的。

如果存在,读出序列可以具有任何长度。如果使用多于一个读出序列,则读出序列可以独立地具有相同或不同的长度。例如,读出序列的长度可以是至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40、至少50、至少60、至少65、至少75、至少100、至少125、至少150、至少175、至少200、至少250、至少300、至少350、至少400或至少450个核苷酸。在某些情况下,读出顺序的长度可以不超过500、不超过450、不超过400、不超过350、不超过300、不超过250、不超过200、不超过175、不超过150、不超过125、不超过100、不超过75、不超过60、不超过65、不超过60、不超过55、不超过50、不超过45、不超过40、不超过35、不超过30、不超过20或不超过10个核苷酸。任何这些的组合也是可能的,例如,读出序列可具有10至30个核苷酸、20至40个核苷酸、5至50个核苷酸、10至200个核苷酸、或25至35个核苷酸、10至300个核苷酸等的长度。

在一些实施方案中,读出序列可以是任意的或随机的。在某些情况下,选择读出序列以减少或最小化与细胞或其他样品的其他组分的同源性,例如,使得读出序列本身不与怀疑在细胞或其他样品内的其他核酸结合或杂交。在一些情况下,同源性可小于10%、小于8%、小于7%、小于6%、小于5%、小于4%、小于3%、小于2%或小于1%。在某些情况下,可能存在少于20个碱基对、少于18个碱基对、少于15个碱基对、少于14个碱基对、少于13个碱基对、少于12个碱基对、少于11个碱基对或少于10个碱基对的同源性。在某些情况下,碱基对是连续的(sequential)。

在一组实施方案中,核酸探针群可含有一定数量的读出序列,在某些情况下,其可少于核酸探针的靶标数。本领域普通技术人员将意识到,如果存在一个信号传导实体和n个读出序列,则通常可以独特地鉴定2n-1个不同的核酸靶标。但是,并非所有可能的组合都需要使用。例如,核酸探针群可靶向12种不同的核酸序列,但含有不超过8种读出序列。作为另一个例子,核酸群可以靶向140种不同的核酸种类,但含有不超过16种读出序列。可以通过使用每个探针内的读出序列的不同组合来分别鉴定不同的核酸序列靶标。例如,每个探针可含有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个等或更多个读出序列。在一些情况下,核酸探针群可各自含有相同数量的读出序列,但在其他情况下,在各种探针上可存在不同数量的读出序列。

作为非限制性实例,第一核酸探针可含有第一靶序列、第一读出序列和第二读出序列,而不同的第二核酸探针可含有第二靶序列、相同的第一读出序列和代替第二读出序列的第三读出序列。由此可以通过确定存在的或与给定探针或位置相关的各种读出序列来区分这样的探针,如本文所讨论的。

另外,在某些实施方案中,核酸探针(及其在编码探针上的相应的互补位点)可以仅使用4种碱基中的仅2种或仅3种碱基制备,例如在探针中省略所有“g”或省略所有“c”。缺乏“g”或“c”的序列在某些实施方案中可形成非常少的二级结构,并且能够有助于更均匀、更快速的杂交。

在一些实施方案中,核酸探针可含有信号传导实体。但是,应该理解,信号传导实体不是在所有情况下都是必需的;例如,在一些实施方案中,可以使用二级核酸探针测定核酸探针,如下面另外详细讨论的。可以使用的信号传导实体的示例也在下面更详细地讨论。

其他组分也可以存在于核酸探针内。例如,在一组实施方案中,可以存在一个或多个引物序列,例如,以允许探针的酶促扩增。本领域普通技术人员将知道适合于诸如扩增(例如,使用pcr或其他合适技术)的应用的引物序列。许多这样的引物序列可商购获得。可存在于一级核酸探针内的序列的其他实例包括但不限于启动子序列、操纵子、鉴定序列、无义序列等。

通常,引物是单链或部分双链的核酸(例如dna),其用作核酸合成的起始点,允许聚合酶如核酸聚合酶延伸引物并复制互补链。引物(例如,被设计为)与靶核酸互补并与靶核酸杂交。在一些实施方案中,引物是合成引物。在一些实施方案中,引物是非天然存在的引物。引物通常具有10至50个核苷酸的长度。例如,引物可具有10至40、10至30、10至20、25至50、15至40、15至30、20至50、20至40或20至30个核苷酸的长度。在一些实施方案中,引物具有18至24个核苷酸的长度。

另外,核酸探针的组分可以以任何合适的顺序排列。例如,在一个实施方案中,组分可以在核酸探针中排列为:引物-读出序列-靶向序列-读出序列-反向引物。该结构中的“读出序列”可以各自包含任何数量(包括0)的读出序列,只要探针中存在至少一个读出序列即可。非限制性实例结构包括引物靶向序列-读出序列-反向引物,引物-读出序列-靶向序列-反向引物,靶向序列-引物-靶向序列-读出序列-反向引物,靶向序列-引物-读出序列-靶向序列-反向引物,引物-靶序列-读出序列-靶向序列-反向引物,靶向序列-引物-读出序列-反向引物,靶向序列-读出序列-引物,读出序列-靶向序列-引物,读出序列-引物靶向序列-反向引物等。此外,反向引物在一些实施方案中是任选的,包括在所有上述实例中。

在将核酸探针引入细胞或其他样品后,可以通过测定信号传导实体(如果存在)直接测定核酸探针,和/或可以通过使用一种或多种二级核酸探针测定核酸探针。根据本发明的某些方面。如上所述,在某些情况下,测定可以是空间的,例如,在二维或三维中。另外,在一些情况下,测定可以是定量的,例如,可以测定一级核酸探针(和靶核酸)的量或浓度。另外,取决于应用,二级探针可包含能够与核酸杂交的多种实体中的任何一种,例如dna、rna、lna和/或pna等。下面更详细地讨论信号传导实体。

二级核酸探针可含有能够与一级核酸探针的读出序列结合或杂交的识别序列。在一些情况下,结合是特异性的,或者结合可以使得识别序列优选地仅与存在的读出序列中一个结合或杂交。二级核酸探针还可含有一个或多个信号传导实体。如果使用多于一种二级核酸探针,则信号传导实体可以相同或不同。

识别序列可以具有任何长度,并且多个识别序列可以具有相同或不同的长度。如果使用多于一个识别序列,则识别序列可以独立地具有相同或不同的长度。例如,识别序列的长度可以是至少5、至少10、至少15、至少20、至少25、至少30、至少35、至少40或至少50个核苷酸。在一些情况下,识别序列的长度可以不超过75、不超过60、不超过65、不超过60、不超过55、不超过50、不超过45、不超过40、不超过35、不超过30、不超过20或不超过10个核苷酸。任何这些的组合也是可能的,例如,识别序列可以具有10至30、20至40、或25至35个核苷酸等的长度。在一个实施方案中,识别序列具有与读出序列相同的长度。此外,在一些情况下,识别序列可以与一级核酸探针的读出序列至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少92%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或至少100%互补。

如上所述,在一些情况下,二级核酸探针可包含一个或多个信号传导实体。下面更详细地讨论信号传导实体的实例。

如所讨论的,在本发明的某些方面,使用含有各种“读出序列”的核酸探针。例如,一级核酸探针群可含有某些“读出序列”,其能结合某些二级核酸探针,并且使用二级核酸探针(例如,其包含信号传导实体)在样品内测定一级核酸探针的位置。如上所述,在一些情况下,可以以各种组合将读出序列群组合以产生不同的核酸探针,例如,使得相对少量的读出序列可用于产生相对大量的不同核酸探针。

因此,在一些情况下,一级核酸探针(或其他核酸探针)群可各自含有一定数量的读出序列,其中一些在不同的一级核酸探针之间共有,使得一级核酸探针的总群体可包含一定数量的读出序列。核酸探针群可具有任何合适数量的读出序列。例如,一级核酸探针可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个等的读出序列。在一些实施方案中,也可以有多于20个。另外,在一些情况下,核酸探针群总共可具有1个或更多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、11个或更多个、12个或更多个、13个或更多个、14个或更多个、15个或更多个、16个或更多个、20个或更多个、24个或更多个、32个或更多个、40个或更多个、50个或更多个、60个或更多个、64个或更多个、100个或更多个、128个或更多个等的可能存在的读出序列,尽管一些或所有探针可各自包含多于一个读出序列,如本文所讨论的。另外,在一些实施方案中,核酸探针群可以具有不超过100、不超过80、不超过64、不超过60、不超过50、不超过40、不超过32、不超过24、不超过20、不超过16、不超过15、不超过14、不超过13、不超过12、不超过11、不超过10、不超过9、不超过8、不超过7、不超过6、不超过5、不超过4、不超过3或不超过两个存在的读出序列。任何这些的组合也是可能的,例如,核酸探针群可以总共包含10至15个读出序列。

作为从相对少量的读出序列组合产生相对大量核酸探针的方法的非限制性实例,在6种不同类型的核酸探针的群体中,每种核酸探针包含一个或多个读出序列,群体内的读出序列的总数可以不大于4。应当理解,尽管在该实例中使用了4个读出序列以便于解释,但是在其他实施方案中,可以实现更大数量的核酸探针,例如根据应用,使用5、8、10、16、32个等或更多个读出序列,或本文所述的任何其他合适数量的读出序列。如果每个一级核酸探针含有两个不同的读出序列,则通过使用4个这样的读出序列(a、b、c和d),可以单独鉴定多达6个探针。应当注意,在该实例中,核酸探针上的读出序列的排序不是必需的,即“ab”和“ba”可以被视为同义的(尽管在其他实施方案中,读出序列的排序可以是必不可少,“ab”和“ba”可能不一定是同义的)。类似地,如果在一级核酸探针群体中使用5个读出序列(a、b、c、d和e),则可以单独鉴定多达10个探针,如图4b所示。例如,本领域普通技术人员将理解,对于在每个探针上具有n个读出序列的群体中的k个读出序列,可以产生多达个不同的探针,假设读出序列的排序不是必需的;因为并非所有探针都需要具有相同数量的读出序列,并且不需要在每个实施方案中使用所有读出序列组合,所以在某些实施方案中也可以使用多于或少于这个数量的不同探针。另外,还应该理解,在一些实施方案中,每个探针上的读出序列的数量不必相同。例如,一些探针可以含有2个读出序列,而其他探针可以含有3个读出序列。

在一些方面,样品中核酸探针的读出序列和/或结合模式可用于定义错误检测和/或错误校正代码,例如,以减少或防止核酸的错误鉴定或误差。因此,例如,如果指示了结合(例如,如使用信号传导实体确定的),则可以用“1”标识该位置;相反,如果没有指示结合,则可以用“0”标识位置(或者在某些情况下,反之亦然)。然后能够使用例如使用不同核酸探针的多轮结合测定来产生例如用于该空间位置的“代码字”。在一些实施方案中,可以对代码字进行错误检测和/或校正。例如,可以组织代码字,使得如果对于给定的一组读出序列或核酸探针的结合模式没有找到匹配,则可以将匹配识别为错误,并且可选地,可以对序列应用错误校正以确定核酸探针的正确靶标。在一些情况下,代码字可以具有较少的“字母”或位置,即由代码字编码的核酸的总数,例如,其中每个代码字编码不同的核酸。

这种错误检测和/或错误校正代码可以采用各种形式。先前已在诸如电信行业的其他环境中开发了各种这样的代码,例如golay代码或汉明代码。在一组实施方案中,分配核酸探针的读出序列或结合模式,使得并非每种可能的组合都被分配。

例如,如果4个读出序列是可能的并且一级核酸探针含有2个读出序列,那么可以鉴定多达6个一级核酸探针;但是,使用的一级核酸探针的数量可能少于6。类似地,对于在每个一级核酸探针上具有n个读出序列的群体中的k个读出序列,可以产生个不同的探针,但是使用的一级核酸探针的数量可以是多于或少于的任何数量。另外,这些可以被随机分配,或以特定方式分配以增加检测和/或纠正错误的能力。

作为另一个例子,如果使用多轮核酸探针,则可以任意选择轮数。如果在每一轮中,每个靶标可以给出两种可能的结果,例如被检测到或未被检测到,则n轮探针可能有多达2n个不同的靶标,但实际使用的核酸靶标的数量可以是小于2n的任何数量。例如,如果在每一轮中,每个靶标可以给出多于两种可能的结果,例如在不同的颜色通道中检测到,则n轮探针可能有超过2n(例如3n、4n......)个不同的靶标。在一些情况下,实际使用的核酸靶标的数量可以是小于该数量的任何数量。另外,这些可以被随机分配,或以特定方式分配以增加检测和/或纠正错误的能力。

例如,在一组实施方案中,可以在代码空间内分配代码字或核酸探针,使得该分配由汉明距离分开,汉明距离测量给定模式中导致核酸探针被误解为不同的有效核酸探针的不正确“读出”的数量。在某些情况下,汉明距离可以是至少2,至少3,至少4,至少5,至少6等。另外,在一组实施方案中,分配可以形成为汉明代码,例如汉明(7,4)代码,汉明(15,11)代码,汉明(31,26)代码,汉明(63,57)代码,汉明(127,120)代码等。在另一组实施方案中,分配可以形成secded代码,例如secded(8,4)代码,secded(16,4)代码,sceded(16,11)代码,sceded(22,16)代码,sceded(39,32)代码,sceded(72,64)代码等。在另一组实施方案中,分配可以形成扩展的二进制golay代码、完美的二进制golay代码或三进制golay代码。在另一组实施方案中,分配可以表示从上述任何代码中获取的可能值的子集。

例如,可以通过仅使用包含固定数量的“1”位(例如4)的二进制字来形成具有相同的secded代码的错误校正特性的代码,以对靶标进行编码。在另一组实施方案中,为了解决不对称读出错误,分配可以表示从上述代码中获取的可能值的子集。例如,在某些情况下,其中“1”位的数量对于所有使用的二进制字可以是固定的代码可以在“0”位被测量为“1”或“1”位被测量为“0”处的速率不同时消除具有不同数量的“1”的字的偏倚测量。

因此,在一些实施方案中,一旦确定了代码字(例如,如本文所讨论的),就可以将代码字与已知的核酸代码字进行比较。如果发现匹配,则可以鉴定或确定核酸靶标。如果没有找到匹配,则可以鉴定代码字的读出中的错误。在一些情况下,还可以应用错误校正来确定正确的代码字,从而导致核酸靶标的正确身份。在一些情况下,可以选择代码字,使得在假设仅存在一个错误的情况下仅可能有一个可能的正确代码字,因此,核酸靶标的仅一个正确身份是可能的。在某些情况下,这也可以推广到更大的代码字间距或汉明距离;例如,可以选择代码字,使得如果存在两个、三个或四个错误(或者在一些情况下更多),则只有一个可能的正确代码字可用,并且因此只有核酸靶标的一个正确身份是可能的。

错误校正代码可以是二进制错误校正代码,或者它可以基于其他编号系统,例如三进制或四进制错误校正代码。例如,在一组实施方案中,可以使用多于一种类型的信号传导实体并将其分配至错误校正代码内的不同数字。因此,作为非限制性示例,第一信号传导实体(或在一些情况下,多于一个信号传导实体)可以被分配为“1”,并且第二信号传导实体(或者在一些情况下,可以是多于一个信号传导实体)可以被分配为“2”(“0”表示不存在信号传导实体),并且分配的代码字用于定义三进制错误校正代码。类似地,第三信号传导实体可以另外被分配为“3”以产生四进制错误校正代码等。

如上所讨论的,在某些方面,确定信号传导实体,例如,以确定核酸探针和/或产生代码字。在一些情况下,可以使用各种技术,例如在空间上确定样品内的信号传导实体。在一些实施方案中,信号传导实体可以是荧光的,并且用于确定样品内荧光的技术,例如荧光显微术或共聚焦显微术,可以用于在空间上识别细胞内信号传导实体的位置。在一些情况下,样品内的实体的位置可以在两个或甚至三个维度中确定。另外,在一些实施方案中,多于一个信号传导实体可以一次(例如,具有不同颜色或发射的信号传导实体)和/或顺序地确定。

另外,在一些实施方案中,可以测定鉴定的核酸靶标的置信水平。例如,可以使用精确匹配的数量与具有一个或多个一位(one-bit)错误的匹配的数量的比率来测定置信水平。在一些情况下,可以仅使用具有大于特定值的置信度比率的匹配。例如,在某些实施方案中,仅当匹配的置信度比率为大于约0.01、大于约0.03、大于约0.05、大于约0.1、大于约0.3、大于约0.5、大于约1、大于约3、大于约5、大于约10、大于约30、大于约50、大于约100、大于约300、大于约500、大于约1000或任何其他合适的值时,才可接受匹配。另外,在一些实施方案中,仅当所鉴定的核酸靶标的置信度比率比内标或假阳性对照大约0.01、约0.03、约0.05、约0.1、约0.3、约0.5、约1、约3、约5、约10、约30、约50、约100、约300、约500、约1000或任何其它合适的值时,才可接受匹配。

在一些实施方案中,可以以相对高的分辨率确定实体的空间位置(并因此,实体可以与之关联的核酸探针)。例如,可以以优于约100微米,优于约30微米,优于约10微米,优于约3微米,优于约1微米,优于约800nm,优于约800微米,优于约600nm,优于约500nm,优于约400nm,优于约300nm,优于约200nm,优于约100nm,优于约90nm,优于约80nm,优于约70nm,优于约70nm,优于约60nm,优于约50nm,优于约40nm,优于约30nm,优于约20nm,或优于约10nm等的空间分辨率确定位置。

有多种技术能够光学地确定或成像实体或靶标的空间位置,例如,使用荧光显微术,使用放射性,通过与合适的发色团缀合等。例如,可以在本发明的各种实施方案中使用的各种常规显微术技术包括但不限于落射荧光显微术、全内反射显微术、高倾斜薄照(hilo)显微术、光片显微术、扫描共聚焦显微术、扫描线共聚焦显微术、旋转盘共聚焦显微术或其他可比较的传统显微技术。

在一些实施方案中,可以使用用于标记核酸例如dna或rna的原位杂交(ish)技术,例如,其中核酸探针可以与样品中的核酸杂交。这些可以例如以细胞级或单分子级分辨率进行。在一些情况下,ish探针可以包括rna、dna、pna、lna、其他合成核苷酸等,和/或这些中任何一种的组合。杂交探针的存在可以例如如下测量:使用放射性标记的核酸探针的放射性,使用例如生物素标记的核酸探针进行的免疫组织化学,使用例如可以结合酶例如辣根过氧化物酶的探针和方法例如酪胺信号放大的酶促发色团或荧光团产生,使用直接用荧光团标记的核酸探针的荧光成像,或二级核酸探针与这些一级探针的杂交,其中通过任何上述方法检测二级探针。

在一些情况下,空间位置可以以超分辨率确定,或者以比光的波长或衍射极限更好的分辨率确定(尽管在其他实施方案中,不需要超分辨率)。非限制性实例包括storm(随机光学重建显微术),sted(受激发射耗尽显微术),nsom(近场扫描光学显微术),4pi显微术,sim(结构照明显微术),smi(空间调制照明)显微术,resolft(可逆饱和光学线性荧光过渡显微术),gsd(基态消光显微术),ssim(饱和结构照明显微术),spdm(光谱精密距离显微术),光活化定位显微术(palm),荧光光活化定位显微术(fpalm),limon(3d光学显微术纳米尺寸显微术),超分辨率光学波动成像(sofi)等。参见,例如,2010年11月23日授权的zhuang等人的题为“sub-diffractionlimitimageresolutionandotherimagingtechniques”的美国专利号7,838,302;2013年10月22日授权的zhuang等人的题为“sub-diffractionlimitimageresolutioninthreedimensions”的美国专利号8,564,792;或者2013年6月20日公开的zhuang等人的题为“highresolutiondual-objectivemicroscopy”的国际专利申请公开号wo2013/090360,其各自通过引用整体并入本文。

在一个实施方案中,可以通过单高斯模式激光线照射样品。在一些实施方案中,通过使这些激光线穿过通过压电或其他机械装置振动的多模光纤,可以使照明轮廓变平。在一些实施方案中,可以通过使单模高斯光束通过各种折射光束整形器(例如,pishaper或一系列堆叠的powell透镜)来平坦化照明轮廓。在又一组实施方案中,高斯光束可以通过各种不同的漫射元件,例如磨砂玻璃或工程化漫射器,其在某些情况下可以高速旋转以去除残留的激光散斑。在又一个实施方案中,激光照射可以通过一系列小透镜阵列以产生近似于平坦照明场的照明重叠图像。

在一些实施方案中,可以确定实体的空间位置的质心。例如,可以使用本领域普通技术人员已知的图像分析算法在图像或一系列图像内确定信号传导实体的质心。在一些情况下,可以选择算法以确定样品中的非重叠单个发射器和/或部分重叠的单个发射器。合适技术的非限制性示例包括最大似然算法、最小二乘算法、贝叶斯算法、压缩感测算法等。在某些情况下也可以使用这些技术的组合。

另外,在某些情况下可以使信号传导实体失活。例如,在一些实施方案中,可以将含有信号传导实体的第一二级核酸探针应用于可以识别第一读出序列的样品,然后可以在将第二二级核酸探针应用于样品之前使第一二级核酸探针失活。如果使用多个信号传导实体,则可以使用相同或不同的技术来使信号传导实体失活,并且可以例如顺序地或同时地使多个信号传导实体中的一些或全部失活。

失活可以通过去除信号传导实体(例如,来自样品,或来自核酸探针等)和/或通过以某种方式化学改变信号传导实体(例如通过光漂白信号传导实体,漂白或化学改变信号传导实体的结构,例如通过还原等)来引起。例如,在一组实施方案中,荧光信号传导实体可以通过化学或光学技术失活,例如氧化、光漂白、化学漂白、严格洗涤或酶消化或通过暴露于酶的反应、使信号传导实体与其他组分(例如,探针)解离、信号传导实体的化学反应(例如,与能够改变信号传导实体的结构的反应物)等。例如,漂白可以通过暴露于氧气、还原剂而发生,或者信号传导实体可以从核酸探针化学裂解并通过流体流动洗掉。

在一些实施方案中,各种核酸探针(包括一级和/或二级核酸探针)可包括一种或多种信号传导实体。如果使用多于一种核酸探针,则信号传导实体可各自相同或不同。在某些实施方案中,信号传导实体是能够发光的任何实体。例如,在一个实施方案中,信号传导实体是荧光的。在其他实施方案中,信号传导实体可以是磷光的、放射性的、吸收性的等。在一些情况下,信号传导实体是可以以相对高的分辨率(例如,在比可见光的波长或衍射极限更好的分辨率下)在样品内测定的任何实体。信号传导实体可以是例如染料、小分子、肽或蛋白质等。在某些情况下,信号传导实体可以是单个分子。如果使用多个第二核酸探针,则核酸探针可包含相同或不同的信号传导实体。

信号传导实体的非限制性实例包括荧光实体(荧光团)或磷光实体,例如,花青染料(例如,cy2,cy3,cy3b,cy5,cy5.5,cy7等),alexafluor染料,atto染料,光切换染料,光活化染料,荧光染料,金属纳米粒子,半导体纳米粒子或“量子点”,荧光蛋白如gfp(绿色荧光蛋白),或光活化荧光蛋白,如pagfp,pscfp,pscfp2,dendra,dendra2,eosfp,tdeos,meos2,meos3,pamcherry,patagrfp,mmaple,mmaple2和mmaple3。其他合适的信号传导实体是本领域普通技术人员已知的。参见,例如,美国专利号7,838,302或美国专利申请序列号61/979,436,其各自通过引用整体并入本文。在某些情况下,可以使用光谱上不同的荧光染料。

在一组实施方案中,信号传导实体可以通过可以被裂解以释放信号传导实体的键与寡核苷酸序列连接。在一组实施方案中,荧光团可以通过可裂解键(例如光可裂解键)与寡核苷酸缀合。光可裂解键的非限制性实例包括但不限于1-(2-硝基苯基)乙基,2-硝基苄基,生物素亚磷酰胺,丙烯酰亚磷酰胺,二乙基氨基香豆素,1-(4,5-二甲氧基-2-硝基苯基)乙基,环十二烷基(二甲氧基-2-硝基苯基)乙基,4-氨基甲基-3-硝基苄基,(4-硝基-3-(1-氯羰基氧基乙基)苯基)甲基-s-乙酰硫代酸酯,(4-硝基-3-(1-叔羰基氧基乙基)苯基)甲基-3-(2-吡啶基二硫代丙酸)酯,3-(4,4'-二甲氧基三苯甲基)-1-(2-硝基苯基)-丙烷-1,3-二醇-[2-氰基乙基]-(n,n-二异丙基)]-亚磷酰胺,1-[2-硝基-5-(6-三氟乙酰基己酰氨基甲基)苯基]-乙基-[2-氰基-乙基-(n,n-二异丙基)]-亚磷酰胺,1-[2-硝基-5-(6-(4,4'-二甲氧基三苯甲基氧基)丁酰氨基甲基)苯基]-乙基-[2-氰基乙基-(n,n-二异丙基)]-亚磷酰胺,1-[2-硝基-5-(6-(n-(4,4'-二甲氧基三苯甲基))-生物素酰胺基己酰胺基-甲基)苯基]-乙基-[2-氰基乙基-(n,n-二异丙基)]-亚磷酰胺,或类似的连接基。在另一组实施方案中,荧光团可以通过二硫键与寡核苷酸缀合。二硫键可以被各种还原剂裂解,例如但不限于二硫苏糖醇,二硫赤藓糖醇,β-巯基乙醇,硼氢化钠,硫氧还蛋白,谷氧还蛋白,胰蛋白酶原,肼,二异丁基氢化铝,草酸,甲酸,抗坏血酸,亚磷酸,氯化锡,谷胱甘肽,硫代乙醇酸,2,3-二巯基丙醇,2-巯基乙胺,2-氨基乙醇,三(2-羧乙基)膦,双(2-巯基乙基)砜,n,n'-二甲基-n,n'-双(巯基乙酰基)肼,3-巯基丙酸盐,二甲基甲酰胺,硫代丙基-琼脂糖,三正丁基膦,半胱氨酸,硫酸铁,亚硫酸钠,亚磷酸盐,次磷酸盐,硫代磷酸盐等,和/或其任意的组合。在另一个实施方案中,荧光团可以通过一种或多种硫代磷酸酯修饰的核苷酸(其中硫修饰取代桥接和/或非桥接氧)与寡核苷酸缀合。在某些实施方案中,通过添加化合物(例如但不限于碘乙醇,在乙醇中混合的碘,硝酸银或氯化汞),荧光团可以从寡核苷酸上裂解下来。在又一组实施方案中,信号传导实体可以通过还原或氧化进行化学失活。例如,在一个实施方案中,可以使用硼氢化钠将发色团如cy5或cy7还原至稳定的非荧光状态。在另一组实施方案中,荧光团可以通过偶氮键与寡核苷酸缀合,偶氮键可以用2-[(2-n-芳基氨基)苯基偶氮]吡啶裂解。在另一组实施方案中,荧光团可以通过合适的核酸区段与寡核苷酸缀合,所述核酸区段可以在适当暴露于dna酶(例如外切脱氧核糖核酸酶或内切脱氧核糖核酸酶)时裂解。实例包括但不限于脱氧核糖核酸酶i或脱氧核糖核酸酶ii。在一组实施方案中,裂解可以通过限制性内切核酸酶发生。可能合适的限制性内切核酸酶的非限制性实例包括bamhi,bsri,noti,xmai,pspai,dpni,mboi,mnli,eco57i,ksp632i,draiii,ahaii,smai,mlui,hpai,apai,bcli,bsteii,taqi,ecori,saci,hindii,haeii,draii,tsp509i,sau3ai,paci等。已经详细研究了超过3000种限制酶,其中超过600种可商购获得。在另一组实施方案中,荧光团可以与生物素缀合,并且寡核苷酸与抗生物素蛋白或链霉抗生物素蛋白缀合。生物素与抗生物素蛋白或链霉抗生物素蛋白之间的相互作用允许荧光团与寡核苷酸缀合,同时充分暴露于过量添加的游离生物素可以“竞争胜过”键联,从而导致裂解发生。另外,在另一组实施方案中,可以使用相应的“立足点探针”去除探针,“立足点探针”包含与探针相同的序列,以及与编码探针同源的额外数量的碱基(例如,1-20个额外的碱基,例如,5个额外的碱基)。这些探针可以通过链置换相互作用去除标记的读出探针。

如本文所用,术语“光”通常是指具有任何合适波长(或等效地,频率)的电磁辐射。例如,在一些实施方案中,光可以包括光学或视觉范围内的波长(例如,具有约400nm至约700nm的波长,即“可见光”),红外波长(例如,具有约300微米至700纳米的波长),紫外波长(例如,具有约400纳米至约10纳米的波长)等。在某些情况下,如下面详细讨论的,可以使用多于一个实体,即化学上不同或独特(例如在结构上)的实体。然而,在其他情况下,实体可以在化学上相同或至少基本上在化学上相同。

本发明的另一方面涉及一种计算机实现的方法。例如,可以提供能够自动和/或重复执行本文描述的任何方法的计算机和/或自动系统。如本文所使用的,“自动”设备是指能够在没有人的指导的情况下操作的设备,即,自动设备可以在任何人已完成采取任何动作以促进功能(例如通过输入指令到计算机中以启动过程)之后的一段时间内执行功能。通常,自动设备可以在此时间点之后执行重复功能。在某些情况下,处理步骤也可以记录在机器可读介质上。

例如,在一些情况下,计算机可用于控制样品的成像,例如,使用荧光显微术、storm或其他超分辨率技术,例如本文所述的那些。在一些情况下,计算机还可以控制操作诸如图像分析中的漂移校正、物理对准、杂交和簇对齐,簇解码(例如,荧光簇解码),错误检测或校正(例如,如本文所讨论的),降噪,从背景特征(例如图像中的噪声或碎片)识别前景特征等。作为示例,计算机可用于控制样品内的信号传导实体的激活和/或激发,和/或信号传导实体的图像的获取。在一组实施方案中,可以使用具有各种波长和/或强度的光来激发样品,并且可以使用计算机将用于激发样品的光的波长序列与获取的包含信号传导实体的样品的图像相关联。例如,计算机可以将具有各种波长和/或强度的光应用于样品,以在每个感兴趣区域中产生不同平均数量的信号传导实体(例如,每个位置一个激活的实体,每个位置两个激活的实体等)。在一些情况下,如上所述,该信息可用于构建图像和/或确定信号传导实体的位置,在一些情况下以高分辨率确定。

以下文献通过引用并入本文:由zhuang等人于2015年7月29日提交的题为“systemsandmethodsfordeterminingnucleicacids”的国际专利申请号pct/us2015/042556,2016年2月4日公布为wo2016/018960;由zhuang等人于2015年7月29日提交的题为“probelibraryconstruction”的国际专利申请号pct/us2015/042559,2016年2月4日公布为wo2016/018963;和由zhuang等人于2016年11月8日提交的题为“matriximprintingandclearing”的美国临时专利申请序列号62/419,033。

以下实施例旨在举例说明本发明的某些实施方案,但不是示例本发明的全部范围。

实施例1

此实施例示出了用于fish测量的样品清除方法。这些实施例鉴定了fish探针与除rna之外的细胞组分(例如蛋白质)的脱靶结合作为背景的主要来源。为了去除这种背景来源,将样品包埋在聚丙烯酰胺(pa)中,将锚定的rna包埋该pa基质中,并清除细胞蛋白质和脂质(它们也是自发荧光的来源)。实施例5中提供了其他细节。为了证明该方法的功效,此实施例使用多重错误稳健荧光原位杂交(merfish)测量经清除的样品中130个rna的拷贝数。由于脱靶探针结合在背景中和在没有可检测的rna损失的情况下在细胞自发荧光中均观察到减少。这导致改善的merfish检测效率和检测限,以及通过将merfish扩展到四个颜色通道而提高的测量通量。这些实施例进一步证明了使用该基质印迹和清除方法对来自小鼠脑的复杂组织样品的merfish测量。预计这将改善细胞培养物和组织中广泛的基于原位杂交的技术的性能。

单分子荧光原位杂交(smfish)是一种强大的技术,可以在单个细胞内直接成像个体rna。在该方法中,通过荧光标记的寡核苷酸探针的杂交标记特定rna种类的个体拷贝,产生单个rna分子的明亮荧光点,其揭示这些rna在细胞内的丰度和空间分布。在细胞培养物和组织中在单细胞水平上成像基因表达的能力已经导致在理解基因表达中的天然噪声及其在细胞应答中的作用、rna的细胞内空间组织及其在转录调控后的作用、以及复杂组织中基因表达的天然空间变异及其在细胞类型和组织功能的分子定义中的作用方面的令人兴奋的进展。

为了将该技术的益处扩展到系统级问题和高通量基因表达分析,已经开发出增加smfish的多重化(即能够在同一细胞内同时定量的不同rna种类的数量)的方法。这些方法中的大多数利用了颜色多重化,其允许同时成像数十种rna种类。多重错误稳健荧光原位杂交(merfish)是一种大规模多重形式的smfish,其可以在转录组规模上进行rna成像和分析。例如,参见国际专利申请公开号wo2016/018960和wo2016/018963,各自通过引用并入本文。merfish通过将错误稳健的条形码分配给个体rna种类,使用含有这些条形码的寡核苷酸探针组合标记rna,然后通过连续多轮的单色或多色smfish读出这些条形码来实现这种多重化水平(图5)。这种方法已经证明能够在个体细胞中成像约1000种rna种类,并在一天长(single-day-long)的测量中分析数万个细胞中的基因表达。

smfish测量通常受益于高的信号与背景比,从而以高的准确性和检测效率检测个体rna分子。在许多情况下,由与rna的每个拷贝结合的数十个荧光标记探针产生的明亮荧光信号远远超过从探针脱靶结合或从细胞自发荧光产生的背景。然而,随着多重化程度的增加,背景水平也趋于增加。由此导致的信号与背景比的降低挑战了多重smfish的许多应用和扩展。例如,许多rna的长度不足以容纳数十个寡核苷酸探针,限制了测量相对短的rna和区分许多不同rna同种型的能力。此外,为了进一步增加多重化程度至数千或可能数万的rna的努力可能会受到背景增加的限制。最后,背景通常在复杂组织中更明显,从而挑战多重smfish应用于组织中的基因表达分析。

此实施例示出了样品清除方法,其旨在通过显著降低背景荧光信号来改善基于smfish的测量中的信号与背景比。许多现代组织清除方法通过提取脂质和匹配折射率同时保留样品的蛋白质含量来减少散射和自发荧光背景。例如,将组织包埋和交联到水凝胶提供了这种组织经清除的有效方法,其保留细胞蛋白质并且能够与rnafish相容。然而,fish背景的主要来源是fish探针与细胞中除rna之外的组分的非特异性结合。因此,以下实施例示出了在保留rna的同时去除蛋白质和脂质的技术。rna分子锚定在惰性非荧光聚丙烯酰胺(pa)基质上,从而有效地在该pa基质上印迹所需的rna信号,同时清除不需要的非rna组分样品,如蛋白质和脂质,从而去除它们对背景的贡献。这些实施例证明,该基质印迹和清除方法显著降低了由于fish探针的脱靶结合和自发荧光产生的背景。通过比较未经清除和经清除的人细胞培养物中通过merfish测量的130个rna的拷贝数,证明这种基于基质印迹的清除方法提高了merfish的检测效率和检测限,而没有可检测的rna损失。此外,自发荧光的减少使merfish成像扩展到四个不同的颜色通道而性能没有降低。这种改进大大减少了merfish测量所需的杂交轮数,这将增加merfish测量速度和通量。这些实施例还证明,这种清除方法显著降低了组织中的背景,作为一个例子,促进了成年小鼠脑组织冷冻切片中130个基因表达的空间分析。在溶剂可膨胀的pa基质上印迹所需的信号(蛋白质或最近的rna)也已用于在扩展显微术中物理放大样品;因此,预计扩展显微术和rnafish的组合也可受益于此处证明的背景减少。鉴于这种基于基质印迹的清除方法的简单性和有效性,预计该方法能够用于显著改善细胞培养物和组织(包括复杂组织例如大脑)中rna和dna的各种原位杂交方法的性能。

开发用于smfish的样品清除方法的第一步是确定寡核苷酸探针的脱靶结合的物理起源:这些探针是否与不正确的rna或其他细胞成分如蛋白质或脂质结合?为了解决该问题,使用靶向细丝蛋白a(flna)mrna的fish探针对人肺成纤维细胞(imr-90)细胞进行染色。正如预期的那样,观察到标记flnamrna的个体分子的明亮荧光斑点(图1a,左)和由于脱靶探针结合导致的弥散背景(图1a,中间),其在未用fish探针染色的样品中不存在(图6)。测量了前景rna斑点和弥散背景的rna酶敏感性。有理由认为,如果背景源于与rna的脱靶结合,那么前景斑点和背景都应该是rna酶敏感的。

发现短暂的rna酶a处理完全去除了明亮的前景斑点,但是在背景中几乎没有产生任何减少(图1a,右)。因此,可以得出结论,smfish探针的绝大多数脱靶标结合起因于与rna以外的细胞组分例如蛋白质和脂质结合。

由于该背景源于fish探针与除rna之外的细胞组分的结合,因此认为减少它的一种方法是从样品中去除不需要的组分,例如蛋白质和脂质。此外,由于这些成分也是自发荧光的主要来源,因此通过这种方法也可以减少自发荧光背景。为此,如在标准smfish或merfish测量中那样,将样品固定并与寡核苷酸探针杂交,然后将样品包埋在惰性非荧光基质(rna锚定至其)中,从而有效地将所需的rna信号印迹到该基质上。一旦锚定rna,就去除细胞蛋白质和脂质,原则上不影响样品中rna的数量和定位。随后与这些组分脱靶结合的smfish探针自由地从基质中扩散出来。聚丙烯酰胺(pa)用作惰性基质,并且使用15-nt长的多聚dt寡核苷酸将多腺苷酸化(多聚腺苷酸)rna结合并锚定至pa基质。该锚定探针包含50%锁核酸碱基以稳定与rna的多聚腺苷酸尾部的杂交,并另外含有末端亚磷酰胺部分,其可在聚合时共价掺入到pa基质中。

为了测试这种清除方法是否导致脱靶结合的减少,首先测量蛋白质和脂质去除的功效。图7说明该方案有效地从包埋培养的人骨肉瘤细胞(u-2os)中去除细胞蛋白质和脂质。接下来,如merfish实验中那样进行标记,并且测试是否通过清除确实减少了脱靶探针结合。使用用于130个rna的merfish测量的“编码”寡核苷酸探针的复合文库染色u-2os培养物。这些编码探针本身不是荧光标记的。相反,每个编码探针含有靶向序列,其指导其与细胞rna和多个读出序列的结合,并且针对每个rna种类的编码探针的集合包含形成该rna种类所独特的特定条形码的一组读出序列。然后在一系列杂交中测量这些条形码,各自使用与特定读出序列互补的荧光标记的寡核苷酸“读出”探针(参见图5b和5c)。为了证明清除效力,用总浓度(300微摩尔)的编码探针染色样品,其比merfish实验中通常使用的高3倍,以产生高背景。如上所述将样品包埋并在pa基质中并进行清除,然后用标记有cy5染料的读出探针染色rna印迹的基质(见下文)。图5c显示经清除的样品含有可见的smfish斑点但是具有比未经清除的样品显著更低的背景,这证明该方法确实降低了由于脱靶探针结合而产生的背景。

一些merfish测量需要用一系列读出探针重复样品染色,交换各种缓冲液,并且在其中通过荧光团的化学裂解在连续成像轮之间去除fish信号的情况下,需要有效去除裂解的荧光团。为了促进缓冲液和读出探针的快速渗透以及快速去除裂解的染料,将样品包埋在50-100微米厚的pa膜中(见下文)。这些膜足够厚以至于覆盖培养的细胞或中等大小的组织切片,但又足够薄以至于读出探针杂交和染料裂解/去除的速率与未经清除的样品中观察到的那些相比没有显著变化(图8)。

图1示出了基质印迹和清除减少了smfish测量中的背景。图1a显示了在用rna酶a处理之前(左侧和中间)和之后(右侧)用靶向flnamrna的smfish探针染色的人成纤维细胞(imr-90)。中间和右侧图的对比度已从左侧图增加5倍以更好地可视化来自脱靶结合探针的背景。比例尺:10微米。图1b显示了用于减少smfish测量中的背景的基质印迹和清除方法的示意图。使用用于merfish测量的smfish探针或编码探针染色细胞,并用靶向mrna的多聚腺苷酸尾的多聚dt锚定探针染色。然后将细胞包埋在聚丙烯酰胺(pa)基质中,锚定探针通过末端亚磷酰胺部分共价连接到该基质上。然后将蛋白质和脂质消化并提取,从而释放脱靶结合的smfish探针以扩散出pa基质并去除有助于自发荧光的细胞组分。图1c示出了在用结合编码探针的缀合至cy5的读出探针染色之前,未经清除(左)或清除(右)的用靶向130个rna的merfish编码探针标记的u-2os细胞。比例尺:20微米。

图5显示了多重错误稳健荧光原位杂交(merfish)的示意图。图5a是通过merfish用于鉴定rna的条形码化过程的图示。在merfish的这种实施例中,为每个个体rna种类分配了独特的二进制条形码。然后通过一系列smfish染色和成像轮读出该条形码。每个smfish图像与二进制条形码中的特定位相关联,并且仅标记靶rna的子集,使得它们将在每个图像中发荧光。如果rna在给定图像中发荧光,则在相应位中为其分配“1”。如果没有,则将其分配为“0”。以这种方式,使用nsmfish图像上荧光的特定开/关模式来为样品中的每个测量的rna构建二进制条形码,然后将其用于解码该rna的身份,例如a、b、c。图5b是这里使用的merfish探针设计的示意图。用多个“编码”寡核苷酸探针标记单个rna。这些编码探针含有中心靶区域,其具有与其靶向的rna的一部分互补的序列。该序列的侧翼是多个读出序列。这些读出序列是定制设计的20-nt序列,并且有一个独特的读出序列与条形码中的每个位相关联。如果在给定位中为rna种类分配具有的“1”条形码,那么与该位相关的读出序列将包含在靶向该rna的编码探针内;因此,与每个rna相关的一组读出序列定义其条形码。在本工作中用于编码rna的mhd4代码中,每个有效的16位条形码仅包含四个“1”位,因此靶向每个rna的编码探针组合一起包含四个不同的读出序列。为了限制编码探针的长度,四个读出序列中的三个随机地与每个编码探针相关联。在用编码探针染色rna后,然后通过一系列与荧光标记的“读出”探针(每个探针与读出序列互补)的杂交测量与rna相关的条形码。图5c是这里使用的merfish读出过程的示意图。在每轮读出杂交期间,一个或多个读出探针与样品结合。如果每个读数探针与光谱上不同的染料(不同的阴影圆圈)缀合,则能够同时将多个读出探针与样品杂交。样品在所有适当的颜色通道中成像,并且荧光点的存在或不存在确定是否存在相应的读出序列,和因此与每个rna拷贝相关的条形码在相应的位中是否具有“1”或“0”。为了在下一轮smfish杂交和成像之前去除荧光信号,将连接荧光团与读出探针的二硫键还原裂解并洗去游离的荧光团。然后用一组不同的读出探针重新染色样品,并重复该过程以读出条形码中剩余的位。

图6示出了fish探针的脱靶结合对rna酶处理很不敏感。imr-90细胞中不同背景来源的图像:细胞用编码探针染色但没有用荧光标记的读出探针染色(左图),细胞用荧光标记的读出探针染色,但没有用编码探针染色(中图),以及细胞用编码探针、能够与这些探针上的读出序列结合的荧光标记的读出探针染色,然后用rna酶a处理,以去除所有特定的rna信号(右图)。所有三个图像以相同的对比度显示,以示出来自细胞的自发荧光背景(左图)的信号的相对强度,读出探针的非特异性结合的非常低水平(如果有的话),以及来自编码探针和读出探针的脱靶(rna酶不敏感)结合的信号。这里使用的编码探针仅靶向flnamrna,并且这里使用的读出探针是与cy5缀合的位1读出探针(表1)。比例尺:5微米。

图7示出了蛋白酶消化和洗涤剂处理有效地从聚丙烯酰胺包埋的细胞中去除蛋白质和脂质。图7a示出在未经清除或经清除的样品中用非特异性蛋白质染料krypton染色的u-2os细胞的图像。显示右图的对比度相对于中图增加了10倍,以更好地示出荧光信号的减少。图7b显示了从图7a中的样品观察到的平均荧光信号。将平均荧光标准化至未经清除的样品中观察到的荧光。误差条表示三个生物学重复的sem。图7c类似于图7a,但是针对did,其是非特异性脂质染色剂。图7d类似于图7b,但是针对用did染色的样品。比例尺:20微米。

图8示出了pa膜中的基质印迹和清除不会降低读出探针结合或荧光染料的还原裂解的速率。图8a示出了在未经清除的样品或经清除的样品中随着暴露于与cy5缀合的读出探针的时间变化的各个rna斑点的平均亮度。将平均亮度标准化至在最后两个时间点观察到的亮度的平均值。图8b显示了作为暴露于裂解缓冲液的时间的函数的各个rna斑点的平均亮度。平均亮度已经标准化至暴露于裂解缓冲液之前观察到的平均亮度。两种测量均在用靶向flnamrna的编码探针和第一读出探针染色的imr-90细胞上进行(位1;表1)。图8a中使用的读出杂交缓冲液与先前描述的读出杂交缓冲液略有不同,因为它含有3nm的读出探针而没有硫酸葡聚糖。所有误差条代表三次生物学重复的sem。

表1显示了读出探针序列。这些从上到下的序列对应于seqidno:1-16。通过所列探针序列的3'末端的二硫键将染料连接到每个读出探针。

表1

实施例2

此实施例示出在清除期间可以保留rna。为了确定在基质印迹和样品清除期间是否有任何rna丢失,使用merfish来确定经清除的u-2os细胞样品中130个rna的拷贝数,并将这些数量与之前从未经清除的样品中得到的数量进行比较。将先前公布的16位的修改的汉明距离-4(mhd4)代码用于编码rna。在这种编码方案中,用于编码rna的所有有效二进制条形码之间的汉明距离至少为4,这意味着必须错误读出至少4位才能将一个有效条形码更改为另一个有效条形码,从而大大降低错误鉴定rna的概率。此外,该方案还允许校正单-位错误(single-biterror),因为每个单-位错误产生与单个有效条形码唯一相近的条形码。该特定mhd4代码包含140个有效条形码,但其中仅其中的130个用于编码rna,剩余的10个条形码用作“空白”对照以确定假rna检测率并估计错误鉴定率。

如前所述进行merfish测量(参见例如国际专利申请公开号wo2016/018960和wo2016/018963),使用双色成像在8轮杂交和成像中读出16位,以及使用二硫键的还原性裂解以在连续几轮smfish成像之间去除与读出探针连接的荧光团(图5c)。在实施例5中提供了进一步的讨论。图2a显示在8轮杂交和成像中的每一个中可以清楚地检测到个体rna分子。此外,图2b显示在这个经清除的样品中测量的这些130个rna所观察到的拷贝数与未经清除的样品中测量的拷贝数强烈相关,log10拷贝数之间的pearson相关系数为0.94(ρ10(rho-10)=0.94)。在此,并且对于所有后续分析,仅保守地使用拷贝数大于对最大“空白”条形码观察到的拷贝数的rna。平均而言,经清除的样品中测量的拷贝数与未经清除的样品中测量的拷贝数之间的比率为1.12+/-0.04(拷贝数大于“空白”条形码观察到的最大值的116个rna的sem)。另外,该比率不依赖于rna的长度(图2c)。

这些测量结果表明,merfish性能的几个方面通过基质印迹和清除得到了改善。先前在未经清除的样品中观察到merfish检测效率为约90%;因此,经清除和未经清除的样品之间约1.1的拷贝数比表明清除将该检测效率提高到接近100%。还观察到,在经清除的样品中观察到“空白”条形码的平均频率相对于未经清除的样品中观察到的平均频率显著下降(图2d)。在未经清除的样品中观察到的“空白”条形码计数的平均水平(图2d)与所测量的最低丰度rna的观察到的拷贝数相当,导致这些低丰度rna所观察到的拷贝数可能被假的rna计数的背景率所偏倚的可能性。实际上,在未经清除的样品中,观察到相对于从大量rna-seq所预期的那些过量的这些低丰度rna(图9a),而在经清除的样品中这种偏倚显著降低(图9a和9b),与经清除的样品中“空白”条形码检测率下降(图2d)相一致。因此,可以得出结论,经清除的样品中明显增加的信号与背景比导致merfish测量中检测效率和检测限的改善。

图2示出基质印迹和清除改善了merfish性能而没有rna损失。图2a,左图显示了使用用cy5或alexa750标记的读出探针在基质印迹和经清除的u-2os细胞中的130-rnamerfish测量中的8轮杂交和成像中的每一轮的双色smfish图像。仅显示merfish视野的一小部分。比例尺:2微米。右图:在单个视野中检测到的所有鉴定的rna具有由标记阴影表示的rna的身份。白框表示左图中显示的此视野的部分。比例尺:25微米。图2b显示了与未经清除的样品中先前公布的测量结果相比得到清除的u-2os细胞中每种rna观察到的每个细胞的平均拷贝数。通过减去对“空白”条形码观察到的平均拷贝数来校正拷贝数。图2d示出了图9b中显示的未校正的拷贝数。log10计数与0.94的pearson相关系数相关(p值:10-54)。虚线表示相等。图2c显示了针对特定rna长度范围内的rna在经清除的样品的每个细胞的拷贝数与在未经清除的样品中观察到的拷贝数的平均比率。误差棒表示sem(对于每个箱(bin)n=26)。图2d显示了未经清除的样品和经清除的样品中“空白”条形码(即未分配给rna的条形码)的每个细胞的平均拷贝数。误差条代表所有10个“空白”条形码的sem。

图9显示基质印迹和清除减少了低丰度rna检测中的偏倚。图9a显示了在未经清除的样品和经清除的样品中如在fpkm中测量的通过merfish测定的每个细胞的拷贝数与通过rna-seq测定的丰度的比率。误差条表示每个rna-seq丰度范围内的rna的sem(n=26)。图9b显示了与未经清除的样品所测定的相比,通过merfish在经清除的样品中测定的每个细胞的拷贝数。这些拷贝数尚未如图2b所示针对“空白”条形码检测的平均率进行校正。虚线表示相等。从图2b中的相等的偏倚和相对于在低丰度范围从大量测序所估计的那些过量的merfish计数与未处理样品中观察到的“空白”条形码检测的增加率一致(图2d)。

实施例3

此实施例示出了merfish扩展到四色成像。除了由于fish探针的脱靶结合而提供背景的显著降低之外,从样品中去除蛋白质和脂质也可降低自发荧光的水平。为了量化这种降低,在未经清除和经清除的样品中未标记的u-2os细胞的荧光在四个激发波长下测量:750nm、647nm、561nm和488nm。与细胞自发荧光在蓝绿色光谱范围中明显高于红色范围的预期一致,清除方案对750nm和647nm通道中已经很低的自发荧光背景几乎没有影响,但产生了在561nm和488nm通道中观察到的自发荧光的数倍的减少(图3a和b)。其他细节可以在实施例5中找到。

随着在561nm和488nm激发通道中观察到的自发荧光的显著减少,研究了在merfish测量期间在每轮成像中使用所有四个激发通道同时读出四个不同位的可能性。u-2os细胞用如上所述的相同merfish编码探针组染色,并进行merfish测量,其中每轮杂交使用四种不同的读出探针,其通过二硫键分别与alexa750、cy5、atto565或alexa488缀合(表1)。通过使用四种颜色的读出探针,完整的16位merfish测量仅需要四轮杂交和成像。将经清除的样品中从该四色测量得到的测量拷贝数与用双色测定的那些进行比较。图3d显示这些拷贝数强烈相关,ρ10(rho-10)为0.99,并且平均比率为1.01+/-0.02(拷贝数高于“空白”条形码观察到的最大值的109个基因的sem)。为了确认新颜色通道中的成像没有引入额外的错误,测定每位的“1”到“0”或“0”到“1”错误率。发现这些错误率没有随着颜色通道显著变化(图3e)。

最后,为了确认经清除的样品的改善性能是可重复的,在经清除的样品中进行了额外的双色和四色merfish测量。图10显示从所有这些测量得到的拷贝数强烈相关(所有ρ10(rho-10)均为0.94或更高)。通过将这些数据集中的每一个与未经清除的测量值进行比较,估计平均merfish检测效率为96+/-7%(四次重复测量的sem),并且“空白”条形码检测的平均率降低约4倍(对于清除和未经清除的样品,为每个细胞0.08+/-0.03(四次重复测量的sem)相对于每个细胞0.30+/-0.07(七个先前公布的重复测量的sem),这证实清除提高了merfish的检测效率和检测限。

图3显示自发荧光减少有利于四色merfish。图3a显示了当用750nm、647nm、561nm或488nm光激发时,在基质印迹和清除之前和之后未染色的u-2os细胞观察到的平均自发荧光。误差棒表示三次生物学重复的sem。图3b显示用561nm或488nm光激发的未经清除或经清除的未染色u-2os细胞的图像。图3c显示用130-rna、16位merfish编码探针组和前四个读出探针染色的经清除的u-2os细胞的图像,每个读出探针与下列染料之一缀合:alexa750、cy5、atto565或alexa488。用图3a中列出的激发光对样品成像。比例尺:10微米。图3d显示通过四色merfish测定的每个细胞的平均拷贝数,相对于用双色merfish测定的平均拷贝数,两者均在经清除的样品中测定。通过减去如图2b所示的“空白”条形码检测的平均率来校正拷贝数。虚线表示相等。log10丰度之间的pearson相关系数是0.99(p值:10-98。图3e显示了对于用如用激发波长表示的四种不同荧光团中的每一种读出的位观察到每位“1”到“0”错误或者“0”到“1”错误的平均率。对于每个单独位使用在该位处错误被校正的频率计算每个错误率(“1”到“0”或“0”到“1”),然后对使用相同荧光团进行测量的位平均这些每位错误率(表1)。误差条代表用每种染料读出的四位的sem。

图10显示基质印迹和清除样品中的双色和四色merfish测量是可再现的。比较在经清除的u-2os细胞中在不同的双色或四色merfish测量中测量的每个细胞的平均拷贝数。ρ10(rho-10)表示所有rna的log10拷贝数之间的pearson相关系数。与所有ρ10(rho-10)相关的p值小于10-44

实施例4

此实施例示出了对脑组织的merfish测量。为了探索清除是否能够克服在组织中观察到的增加的背景,对来自成年小鼠下丘脑的约2mm×2mm、10微米厚的冷冻切片进行了130个rna种类的merfish测量(图4a和b)。这些rna用16位mhd4代码编码,并且每轮使用双色成像以8轮杂交读出。参见,例如,国际专利申请公开号wo2016/018960或wo2016/018963,各自通过引用整体并入本文。如上所述清除这些样品,但在pa包埋之前加入4%w/v十二烷基硫酸钠(sds)的短暂处理,这进一步改善了组织中的清除(见下文)。图4c和d示出这种清除方法显著降低了在这些组织切片中观察到的背景,并且在每轮成像中经清除的样品中可清楚地观察到代表个体rna分子的smfish斑点,从而允许个体rna被解码(图4e和f)。对于其他细节还参见实施例5。

为了确定这些测量的准确性,将四个这样的组织切片的通过merfish测定的平均rna密度与来自下丘脑的相同区域的通过大量rna-seq数据测定的丰度进行比较(图4g)。发现这些值强烈相关(ρ10(rho-10)=0.84)。在非常低的丰度(对应于在下丘脑中表达非常差的rna(<0.5-1fpkm))下观察到merfish拷贝数没有与从大量测序估计的拷贝数强烈相关,表明这些rna的丰度低于检测限,这是由这些拷贝数与空白条形码观察到的平均拷贝数之间的相似性支持的结论(6×106+/-2×106/mm3)。

大量多重smfish允许在单个细胞内进行空间分辨的基因表达分析。然而,这些方法的许多应用和进步受到这些实验中遇到的荧光背景的挑战。这些实施例描述了一种清除方法,其通过有效地将所需的rna信号印迹到惰性非荧光pa基质上,然后去除由于脱靶探针结合而产生自发荧光和背景的不需要的细胞成分,从而显著减少了fish测量中的几种背景来源。背景的减少导致merfish测量中的检测效率和检测限的改善。此外,蓝色和绿色通道中自发荧光的减少使得merfish测量可以扩展到四种颜色而不会损失性能。这种进步进而允许merfish测量具有显著更少轮的杂交和成像,这可以增加merfish测量速度和通量。最后,基质印迹和清除使组织样品中merfish测量的背景显著降低,这允许表征小鼠下丘脑冷冻切片中130个rna的基因表达。

这种清除方法提供的背景的显著减少将有助于未来扩展merfish。多重化程度的增加(同时测量数千或数万个rna)可能需要比目前使用的编码探针浓度高得多的编码探针浓度,因此,将受益于在经清除的样品中实现的低得多的脱靶探针结合。在较低的背景下,应该能够用较少数量的结合探针检测rna,这进而允许检测较短的rna分子。这可以有助于检测相对短的信使和长的非编码rna,和甚至可能是小rna,其目前在未经清除的样品中难以检测。用相对较少的fish探针检测rna分子的能力也将显著提高区分rna同种型的能力。通过常见的基质印迹方法促进的扩展显微术与merfish的组合还可以允许用merfish分辨更高密度的rna分子(这种能力可用于测量高度表达的rna的密集区域并用于进一步增加多重化程度)。因此,这种基于基质印迹的方法将显著增强用大量多重fish进行空间分辨的基因表达分析的能力。

图4显示了成年小鼠脑组织的merfish测量。图4a显示取自allen脑图谱(atlas)的成年小鼠脑的冠状和矢状切片的nissi染色图像。黑框和虚线表示研究的小鼠下丘脑区域。比例尺:2mm。图4b显示用dapi(4’,6-二脒基-2-苯基吲哚,二盐酸盐)染色的单个10微米厚的小鼠下丘脑冷冻切片的图像。整个切片通过merfish成像。比例尺:1mm。图4c和4d显示样品中的使用用于130-rnamerfish测量的编码探针组和与cy5缀合的读出探针染色的小部分小鼠下丘脑切片的图像。图4c是未经清除的样品的图像;图4d是经清除的样品的图像。比例尺:50微米。图4e显示了用白色虚线框标记的图4d的区域的放大图。图4f显示了图4e中所示区域的解码rna(不同阴影代表不同的条形码)。图4g显示了通过merfish测定的130个不同rna的密度相对于通过图4a中所示的小鼠下丘脑区域的大量rna-seq测定的丰度。log10丰度之间的pearson相关系数是0.84(p值:10-35)。

实施例5

以下描述了上述实施例中使用的各种材料和方法。

将人骨肉瘤细胞(u-sos,美国典型培养物保藏中心)和人成纤维细胞(imr-90,美国典型培养物保藏中心)培养、固定、透化,并用如前所述的smfish探针或merfish编码探针染色。参见例如chen,k.h.等人,“spatiallyresolved,highlymultiplexedrnaprofilinginsinglecells,”science,348(6233):aaa6090或moffitt,j.r.等人,“high-throughputsingle-cellgene-expressionprofilingwithmultiplexederror-robustfluorescenceinsitehybridization,”proc.natl.acad.sci.usa,113(39):11046-11051。将小鼠下丘脑组织新鲜冷冻,冷冻切成10微米厚的切片,后固定在盖玻片上,用4%w/vsds清除,用70%乙醇透化,然后用编码探针染色。将细胞或组织样品包埋在含有50mmtrishcl(ph8)、300mmnacl、0.03%w/v过硫酸铵和0.15%v/vtemed的丙烯酰胺与双丙烯酰胺的19:1比例的4%溶液中。用蛋白酶k在0.8m盐酸胍、0.5%v/vtritonx-100、50mmtrisph8和1mmedta中于37℃消化约16小时来去除蛋白质和脂质。

用公开的编码探针组进行对u-2os细胞的merfish测量。如前所述设计用于在小鼠脑组织中测量的编码探针组。读出探针购自biosynthesis,inc.并描述于表1中。如前所述构建编码探针。参见,例如,moffitt,j.r.等人,“rnaimagingwithmultiplexederror-robustfluorescenceinsituhybridization(merfish),”methodsenzymol.,572:1-49,2016。

样品在围绕olympusix-71机身、1.45na、100×油浸物镜和emccd相机构建的定制平台上或围绕olympusix-71显微镜主体、planapo、1.3na、60×硅油浸物镜和科学cmos相机构建的定制高通量平台上成像。使用与前述相同的缓冲液和相同的自动流体系统进行读出杂交、缓冲液交换和还原性裂解,显著的例外是从读出杂交缓冲液中去除硫酸葡聚糖并且读出探针以各自3nm的浓度染色。

用如前所述的相同merfish编码探针组进行人骨肉瘤细胞(美国典型培养物保藏中心,u-2os)中的merfish测量。简而言之,该编码方案利用16位的的修改汉明距离4码(mhd4)来编码rna。在该编码方案中,140个可能的条形码中的每一个都需要累积至少四个错误以转换成另一个条形码。该属性允许检测最多任意两位的错误,并将错误纠正到任何单个位。此外,该编码方案利用恒定的汉明权重,即每个条形码中的“1”位的数量为4,以便最小化由于“1”到“0”和“0”到“1”错误的差异率而导致的不同条形码的测量中的潜在偏倚。140个可能的条形码中的130个用于编码细胞rna,剩余的10个条形码未被分配以用作“空白”对照。使用的编码探针组含有92个编码探针/rna,每个编码探针含有分配给每个rna的四个读出序列中的三个(图5b)。

使用与上述相同的16位mhd4代码设计用于小鼠下丘脑中的测量的merfish编码探针。同样,将140个可能的条形码中的130个分配给rna,所述rna被选择为覆盖下丘脑中大约三个数量级的平均表达,其中从先前公布的rna-seq估计表达水平。其余10个条形码未分配,作为空白对照。使用与前述相同的严格条件和设计标准设计编码探针。转录物序列源自从ensembl下载的小鼠基因组(mm9)。

如前所述,从复杂的寡核苷酸库进行编码探针组的构建。参见,例如,国际专利申请公开号wo2016/018963,其通过引用并入本文。简言之,通过限制性循环pcr扩增寡核苷酸(customarray)以制备体外转录模板。通过体外转录将这些模板转化为rna,通过逆转录将rna转化回dna,然后通过碱水解(以去除rna模板)、苯酚-氯仿提取(以去除蛋白质)和乙醇沉淀(以去除核苷酸和浓缩探针)纯化dna。为了提高探针纯度和反应产率,先前的方案以下列方式进行了修改。在体外转录和酚-氯仿提取后,通过脱盐柱(40kmwcozebatm;thermofisher,89894)去除过量的ntp或dntp。发现去除杂散的ntp改善了逆转录的性能,并且去除过量的dntp有助于定量方案的最终产率。另外,为了进一步提高产率,将乙醇纯化中的盐从2.5m乙酸铵(其允许去除核苷酸但降低dna回收率)转换为300mm乙酸钠。

为了稳定聚丙烯酰胺(pa)薄膜,用含有烯丙基部分的硅烷层包被盖玻片,所述烯丙基部分可在聚合期间主动掺入聚丙烯酰胺凝胶中,从而将pa膜共价交联至盖玻片。简而言之,通过在室温(rt)下浸入37%hcl和甲醇的1:1混合物中洗涤40mm直径的#1.5盖玻片(bioptech,0420-0323-2)30分钟。然后将盖玻片在去离子水中漂洗三次并在70%乙醇中漂洗一次。盖玻片在70℃烘箱中干燥,然后在室温(rt)下浸入0.1%v/v三乙胺(millipore,tx1200)和0.2%v/v烯丙基三氯硅烷(sigma,107778)的氯仿溶液中30分钟。盖玻片各用氯仿和乙醇洗涤一次,然后在70℃的烘箱中烘烤1小时以使硅烷层脱水。然后将硅烷化的盖玻片在室温下在干燥室中储存数周,而硅烷层的质量没有明显降低。

为了促进细胞粘附,将硅烷化的盖玻片在室温下用在不含核酸酶的水中稀释的0.1mg/ml聚-d-赖氨酸(pdl)(分子量30,000-70,000da;sigma,p7886)包被1小时。盖玻片用不含核酸酶的水洗涤三次,在室温下在水中孵育过夜,然后干燥并在铺板细胞之前进行uv灭菌。在用编码探针染色之前,使用已建立的方案培养、固定和透化u-2os细胞。简言之,将用含有10%v/v胎牛血清(thermofisher,10437)的eagle最小必需培养基培养的细胞(美国典型培养物保藏中心,30-2003)以每盖玻片300,000个细胞的密度铺板在pdl包被的硅烷化盖玻片上。在37℃、5%co2下孵育48至72小时,然后用1×磷酸盐缓冲溶液(pbs;thermofisher,am9625)中的4%多聚甲醛(pfa;electronmicroscopysciences,15714)固定20分钟。将细胞用1×pbs洗涤三次,并使用1×pbs中的0.5%v/vtritonx-100(sigma,t8787)在室温下透化10分钟。然后用1×pbs洗涤细胞三次。

简而言之,将细胞在含有2×柠檬酸钠盐水(ssc;thermofisher,am9763)和30%v/v甲酰胺(thermofisher,am9342)的30%甲酰胺洗涤缓冲液中孵育5分钟,然后在含有2×ssc、30%v/v甲酰胺、0.1%w/v酵母trna(lifetechnologies,15401-011)、1%v/v鼠rna酶抑制剂(neb,m0314l)和10%w/v硫酸葡聚糖(sigma,d8906)的编码杂交缓冲液中用编码探针在湿度受控的37℃培养箱中染色36至48小时。除非另有说明,否则编码探针以100微摩尔的浓度染色。适当时,编码探针补充有1微摩尔锚定探针(具有5'-丙烯酸酯修饰的交替dt和胸苷锁定核酸(dt+)的15-nt序列(integrateddnatechnologies)。染色后,将细胞用30%甲酰胺洗涤缓冲液在47℃洗涤两次,每次30分钟。

使用1微摩尔靶向细丝蛋白a(flna,biosearch)的smfish探针组,按照与上述u-2os细胞相同的方案培养、固定和染色人肺成纤维细胞(美国典型培养物保藏中心,imr-90)。

为了将rna锚定在适当位置,将编码探针染色的样品包埋在薄的4%pa凝胶中。简言之,首先用脱气的pa溶液洗涤染色的样品2分钟,该溶液具有4%v/v的19:1的丙烯酰胺/双丙烯酰胺溶液(biorad,1610144)、60mmtris-hclph8(thermofisher,am9856)、0.3mnacl(thermofisher,am9759),以及当样品用于四色merfish测量时具有1:500稀释的0.1微米直径的浅黄色珠子(spherotech,fp-0245-2)或当样品用于双色merfish测量时具有1:200,000稀释的0.1微米直径的羧酸盐修饰的橙色荧光珠(lifetechnologies,f-8800)。珠子用作基准标记,用于在多轮smfish成像中拍摄的图像的对齐。然后用相同的pa凝胶溶液再次洗涤细胞2分钟,所述pa凝胶溶液补充有聚合剂过硫酸铵(sigma,a3678)和n,n,n',n'-四甲基乙二胺(temed;sigma,t9281),其终浓度分别为0.3%w/v和0.15%v/v。

为了浇铸薄pa膜,将50微升该凝胶溶液添加至已经预处理以便不粘至pa(gelslick,lonza,50640)的玻璃板(tedpella,26005)的表面。抽吸样品以去除过量的pa凝胶溶液,然后轻轻倒置在该50微升液滴上,以在盖玻片和玻璃板之间形成薄的pa层。该凝胶液滴的体积可用于控制该pa膜的厚度。然后使凝胶室温浇铸1.5小时。然后轻轻地分开盖玻片和玻璃板,并用具有在不含核酸酶的水中的0.8m盐酸胍(sigma,g3272)、50mmtris-hclph8、1mmedta和0.5%v/vtritonx-100的消化缓冲液洗涤pa膜两次。最后一次洗涤后,用补充有1%v/v蛋白酶k(neb,p8107s)的消化缓冲液覆盖凝胶。将样品在该缓冲液中在潮湿的37℃培养箱中消化16至20小时,然后用2×ssc洗涤三次。merfish测量立即进行或将样品在4℃下在补充有0.1%v/v鼠rna酶抑制剂的2×ssc中储存不超过24小时。

培养的细胞样品在自制的成像平台上成像。简而言之,该显微镜使用olympusix-71主体和1.45na、100×油浸物镜构建。使用固态激光器(mpbcommunications,vfl-p500-751;mpbcommunications,vfl-p500-642;coherent,561-200cwcdrh;和coherent,1069413/at)提供750nm、641nm、561nm和488nm的照射用于分别用alexa750、cy5、atto565和alexa488标记的读出探针的激发。对于双色merfish测量,使用561nm激光激发橙色基准珠。使用405nm固态激光器(coherent,cube)照射核染料4',6-二脒基-2-苯基吲哚、二盐酸盐(dapi)(适当时)以及四色merfish测量期间的浅黄色基准珠。将所有激光线与定制二向色(chroma,zy405/488/561/647/752rp-uf1)组合,并用定制二向色(chroma,zet405/488/561/647-656/752m)过滤发射。用定制的五孔滤光器分离荧光,并用emccd相机(andor,ixon-897)成像。确定emccd相机的像素尺寸对应于样品平面中的167nm。

组织切片在第二个自制的成像平台上成像,该平台针对通量进行了优化。简而言之,该显微镜围绕olympusix-71显微镜主体和planapo、1.3na、60×硅油浸渍物镜(olympus,uplsapo60×s2)构建。使用固态激光器(toptica,dl100/boosta;mbpcommunications,f-04306-113;crystalasergcl-150-561;coherent,cube405)提供754nm、647nm、561nm和405nm的照射。这些激光线分别用于激发用alexa750和cy5标记的读出探针、橙色基准珠和dapi。用方形多模光纤(andor,borealis)将照明轮廓展平。使用五波段二向色(chroma,zy405/488/561/647/752rp-uf1)将样品的荧光发射与激光照射分离,并在通过两个重复的定制五角陷波滤波器(chroma,zet405/488/561/647-656/752m)以消除杂散激发光后使用科学cmos相机(scmos;andor,zyla4.2)成像。确定scmos相机的像素尺寸对应于样品平面中的109.2nm。在组织成像期间,在每个视野(fov)的每个颜色通道中收集由七个1.5微米切片组成的z-堆叠,以便对组织的整个体积成像。通过物镜纳米定位仪(madcitylabs,nanof200)控制z步骤。

在两种设置中,样品位置通过电动显微镜载物台(marzhauser,scanim112×74)进行控制,并且通过定制聚焦锁定系统维持聚焦,通过物镜纳米定位仪(madcitylabs,nanof200)之间的反馈系统和将ir激光器(thorlabs,lp980-sf15)反射到便宜的cmos相机(thorlabs,uc480)上来实现。将样品盖玻片保持在流动室(bioptechs,fcs2)内,并使用定制的自动流体系统(控制三个八通阀(hamilton,mvp和hvxm8-5)和蠕动泵(gilison,minipuls3))引导该室内的缓冲液交换。整个系统通过定制软件进行计算机控制。

将样品与读出探针杂交,并按照与前述相似的方案成像,其中进行了略微调整以读出杂交缓冲液组成和流动时间。参见国际专利申请公开号wo2016/018963和wo2016/018960,各自通过引用整体并入本文。读出杂交缓冲液由在不含核酸酶的水中的2×ssc、10%v/v碳酸亚乙酯(ec;sigma-aldrich,e26258)、0.1%v/v鼠rna酶抑制剂以及3nm适当的读出探针组成。以前,在该缓冲液中使用硫酸葡聚糖以提高读出探针杂交的速率;然而,发现通过将读出探针浓度从1nm增加到3nm,能够在没有硫酸葡聚糖的情况下实现相同的杂交动力学。从读出缓冲液中去除硫酸葡聚糖显著降低了该缓冲液的粘度,这进而有效地消除了使高粘度缓冲液通过流体系统所需的高压引起的偶然流动故障。

使用两种不同配置的读出探针:对于双色merfish测量,在每轮杂交中使用两种读出探针,一种与cy5缀合,另一种通过二硫键与alexa750结合;对于4色merfish,在每轮杂交中使用四种不同的读出探针,每种探针通过二硫键与alexa750、cy5、atto565或alexa488之一缀合。表1包含用于双色和四色测量的读出探针序列和染料组合。所有读出探针均购自biosynthesis,inc。

通过首先用2ml读出杂交缓冲液在5分钟内冲洗样品室以完全交换缓冲液来用读出探针对样品染色。然后将另外2ml缓冲液流过样品6分钟。然后通过使2ml含有2×ssc和10%v/vec的读出洗涤缓冲液流过9分钟来洗涤样品。最后,将含2×ssc、50mmtris-hclph8、10%w/v葡萄糖、2mmtrolox(sigma-aldrich,238813)、0.5mg/ml葡萄糖氧化酶(sigma-aldrich,g2133)、40微克/ml过氧化氢酶(sigma-aldrich,c30)和0.1%v/v鼠rna酶抑制剂的2ml成像缓冲液流过样品6分钟,之后停止流动并成像约400个fov。在整个测量过程中将成像缓冲液储存在一层矿物油(sigma-aldrich,330779)下作为对氧的屏障。因为确定葡萄糖氧化酶含有痕量的rna酶,所以成像缓冲液还含有0.1%v/v鼠rna酶抑制剂。先前使用的核糖核苷氧钒基复合物(vrc;neb,s1402s)被鼠rna酶抑制剂取代。

在每轮成像后,通过缀合这些染料与探针的二硫键的还原裂解从读出探针中去除荧光染料。将包含2×ssc和50mm还原剂tris(2-羧乙基)膦(tcep;sigma,646547)的3ml裂解缓冲液在15分钟内流过样品。裂解后,将腔室用2ml2×ssc冲洗4分钟以冲洗样品中任何残留的裂解缓冲液,然后引入随后的杂交缓冲液。在每次实验之前,使用不含核酸酶的水新鲜制备所有缓冲液。

在最后一轮杂交和成像后,将样品用在2×ssc中的浓度为1微克/ml的dapi染色10分钟以标记细胞核,然后在405nm处成像。

使用分析管道进行跨成像轮的相同fov的图像的对准以及rna条形码的解码。简言之,通过高斯拟合程序找到每轮成像中基准珠的位置,并且这些位置用于产生仿射变换,其校正每个成像轮中的图像之间的偏移。由于用alexa750、cy5、atto565和alexa488同时标记的rna的质心中的偏移不显著,因此未应用附加校正以考虑较小色差。然后对图像进行高通滤波以去除背景,去卷积以收紧rna斑点,然后进行低通滤波以连接在图像之间位置略有不同的rna质心。然后通过将跨越所有杂交轮收集的16个图像中的每个像素的强度与每个不同条形码进行比较,将各个像素分配给条形码。具体地,使用从16个成像轮中的每一个得到的每个像素的16个强度的集合来定义被标准化至单位幅度的矢量,即通过除以l2范数。对于140个条形码中的每一个,类似地定义单位矢量。然后计算每个像素矢量和每个条形码矢量之间的欧几里德距离。如果将像素与条形码分开的欧几里德距离小于给定阈值,则将像素分配给条形码。该距离阈值是由每个标准化条形码与由该条形码的所有单-位错误形成的标准化条形码集合之间的最大欧几里德距离确定的。从概念上讲,这个距离定义了一个球体,其包含对条形码的所有可能修改,这些修改对应于该条形码的单-位错误,并且这种解码方法可以被认为是根据对于给定条形码像素是否落入该球体内而将像素分配给给定条形码。具有不落入这140个球体之一内的矢量的像素未被分配。分配给相同条形码的连续像素被组合以形成单个rna。然后通过将分配给该rna的所有像素的平均像素矢量与由分配的条形码的所有单-位错误定义的一组单一矢量进行比较,将每个rna识别为需要错误校正(或不校正)。如果平均像素矢量更接近于对应于单-位错误的矢量而不是正确的条形码,则将rna标记为需要错误校正。

该解码方法假设每个rna斑点的亮度在成像轮之间是相同的。为了校正颜色通道之间的亮度差异,首先通过均衡它们的强度直方图来对图像进行标准化。然后通过迭代过程精修该标准化。使用rna亮度的阈值(即像素矢量的l2范数)以及组合形成该rna的像素数(即其面积)去除假rna的背景。对于组织成像,修改该管道以适应z-堆叠。因为每个z-堆叠分开的距离大于点扩展函数的轴向范围,所以每个堆叠独立于其他堆叠进行解码。通过dapi图像的强度阈值鉴定并计数细胞核。所有软件都是用matlab编写的。

计算拆分到由哈佛大学的fasdivisionofscience,researchcomputinggroup支持的odyssey机群和包含两个10核intelxeone5-26802.8ghzcpu和256gbram的桌面服务器之间。

如上所述,用smfish探针或merfish编码探针对u-2os或imr-90样品染色。然后如上文关于merfish成像所述用读出探针1(表1)对样品进行染色。对样品成像,然后用2×ssc中的1%v/vrna酶a(qiagen,19101)处理30分钟,然后再成像。

如上所述培养,培养、固定并用smfish探针或merfish编码探针标记u-2os细胞。然后如上所述将样品进行基质印迹并清除,或者在4℃下在2×ssc中储存。细胞用在2×ssc中1:10稀释的氪荧光蛋白染剂(thermofisher,46629)在室温下染色15分钟,并在室温下在2×ssc中洗涤一次15分钟。用561nm激光对100个fov进行成像。以相同方式制备用于脂质染色的样品,但是在室温下用在2×ssc中1:200稀释的did细胞标记溶液(thermofisher,v22887)染色15分钟并用2×ssc短暂洗涤一次。使用641nm激光对100个fov进行成像。通过对所有fov中观察到的荧光取平均值来定量成像样品,然后将该值在三个生物学重复中平均。

组织中的merfish成像在10微米冷冻切片的小鼠下丘脑上进行。从使用co2安乐死的小鼠(c57b16/j)中去除全脑组织,并立即在最佳裂解温度化合物(tissue-teko.c.t.;vwr,25608-930)中冷冻。将冷冻块粗略切片至下丘脑区域,修剪至约3mm×3mm的区域,并在-18℃下在低温恒温器(microm,hm550)上以10微米的厚度切片。在按照上述方案制备的包被有pdl的硅烷化盖玻片上收集切片。然后将这些切片立即在1×pbs中的4%pfa中在室温下固定12分钟,并用1×pbs洗涤5分钟,进行三次。然后通过在室温下用1%pbs中的4%w/vsds处理它们2分钟来对样品进行部分清除。在该处理之后,将样品用1×pbs洗涤5分钟,进行三次,然后浸入70%乙醇中并在4℃下储存至少18小时。

然后按照上述方案对组织样品进行染色和清除。如上所述使用双色merfish测量组织样品。在上述高通量成像平台上在单个merfish实验中对四个冷冻切片进行成像。

虽然已在本文中描述和说明了本发明的几个实施方案,但本领域普通技术人员将容易地设想用于进行所述功能和/或获得本文所述的结果和/或一个或多个有利方面的各种其它方法和/或结构,并且这样的变化和/或修改的每一种被认为在本发明的范围内。更通常地,本领域技术人员将容易地理解,本文所述的所有参数、尺度、材料和构型意欲为示例性的并且实际参数、尺度、材料和/或构型将取决于对其使用本发明的教导的具体应用。本领域技术人员将认可或能够确定本文所述的特定的本发明的实施方案的许多等同物(通过使用不超过常规实验)。因此,应理解,前述实施方案仅通过举例的方式提出,并且在所附权利要求和其等同物的范围内,本发明可按与明确描述和要求保护的方式不同的方式来实施。本发明涉及本文所述的各种个体特性、系统、物品、材料、试剂盒和/或方法。另外,如果这样的特性、系统、物品、材料、试剂盒和/或方法不是相互矛盾的,则两个或更多个这样的特性、系统、物品、材料、试剂盒和/或方法的任意组合包括在本发明的范围内。

在本说明书和通过引用并入的文献包括冲突和/或不一致的公开内容的情况下,以本说明书为准。如果通过引用并入的两个或更多个文献包括相互冲突和/或不一致的公开内容,则以具有较晚生效日期的文献为准。

如本文中所定义和使用的,所有定义应当被理解为优先于词典定义、通过引用并入的文献中的定义和/或所定义的术语的一般含义。

除非明确地指示与之相反,否则不定冠词“一种/一个(a)”和“一种/一个(an)”,如本文中在说明书和权利要求中所用,应当被理解为意指“至少一种/一个”。

短语“和/或”,如在本文中在说明书和权利要求中所用,应当被理解为意指所连接的元素的“任一个或两者”,即元素在一些情况下结合地存在以及在其它情况下分离地存在。利用“和/或”列出的多个元素应当以相同的方式来解释,即所连接的元素的“一个或多个”。除通过“和/或”从句明确确定的元素外,还可任选地存在其它元素,无论与明确确定的那些元素相关还是无关。因此,作为非限定性实例,对“a和/或b”的提及,当与开放性措辞诸如“包含/包括”结合使用时,在一个实施方案中可仅指a(任选地包括除b外的元素);在另一个实施方案中可仅指b(任选地包括除a外的元素);在另一个实施方案中,可指a和b(任选地包括其它元素);依此类推。

如本文中在说明书和权利要求中所用,“或”应当被理解为具有与如上定义的“和/或”相同的含义。例如,当在列表中分开各项时,“或”或“和/或”应当被理解为是包含性的,即包含至少一个,但也包括许多个元素或一列元素中的多于一个,以及任选地,包括另外未列出的项。只有明确地指明相反的术语,例如“……中的仅一个”或“……中的恰好一个”或当用于权利要求中时的“由……组成”将指包含多个元素或一列元素中的正好一个元素。一般地,如本文中所用的术语“或”应当仅在冠有排他性的术语诸如“任一”、“……之一”、“……中的仅一个”或“……中的恰好一个”时被解释为表示排他性选择(即“一个或另一个但非两个”)。

如本文中在说明书和权利要求中所用,关于一列一个或多个元素的短语“至少一个”应当被理解为意指选自一列元素中的任何一个或多个元素的至少一个元素,但不一定包括元素列表内明确列出的每一个元素的至少一个并且不排除元素列表中的元素的任何组合。该定义还允许可任选地存在除短语“至少一个”所指的元素列表内明确确定的元素外的元素,无论与那些明确确定的元素相关还是不相关。因此,作为非限定性实例,“a和b的至少一个”(或,等同地,“a或b的至少一个”或,等同地“a和/或b的至少一个”)可在一个实施方案中指至少一个(任选地包括不止一个)a而无b存在(且任选地包括除b外的元素);在另一个实施方案中指至少一个(任选地包括不止一个)b而无a存在(且任选地包括除a外的元素);在另一个实施方案中指至少一个(任选地包括不止一个)a和至少一个(任选地包括不止一个)b(且任选地包括其它元素);依此类推。

当在本文中使用词语“约”来表示数字时,应该理解,本发明的又一个实施方案包括未通过词语“约”的存在而修饰的该数字。

还应当理解,除非明确地指明与之相反,否则在包括不止一个步骤或行为的本文请求保护的任何方法中,所述方法的步骤或行为的顺序不必须地限定于其中叙述所述方法的步骤或行为的顺序。

在权利要求中,以及在上述说明书中,所有过渡短语诸如“包含”、“包括”、“携带”、“具有”、“含有”、“拥有”、“牵涉”、“持有”、“由……组成”等被理解为开放性的,即意指包括但不限于。只有过渡短语“由……组成”和“基本上由……组成”应当分别是封闭性的或半封闭性的过渡短语,如美国专利局专利审查程序手册第2111.03节中所示的。

序列表

<110>哈佛学院院长及董事

<120>基质印迹和清除

<130>h0498.70630wo00

<140>未指定

<141>随附

<150>us62/419,033

<151>2016-11-08

<160>16

<170>patentinversion3.5

<210>1

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>1

atcctccttcaatacatccc20

<210>2

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>2

acactaccaccatttcctat20

<210>3

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>3

actccactactactcactct20

<210>4

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>4

accctctaacttccatcaca20

<210>5

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>5

accacaacccattcctttca20

<210>6

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>6

tttctaccactaatcaaccc20

<210>7

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>7

accctttacaaacacaccct20

<210>8

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>8

tcctattctcaacctaacct20

<210>9

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>9

tatccttcaatccctccaca20

<210>10

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>10

acattacacctcattctccc20

<210>11

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>11

tttactccctacacctccaa20

<210>12

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>12

ttctccctctatcaactcta20

<210>13

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>13

acccttactactacatcatc20

<210>14

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>14

tcctaacaaccaactactcc20

<210>15

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>15

tctatcattaccctcctcct20

<210>16

<211>20

<212>dna

<213>人工序列

<220>

<223>合成多核苷酸

<400>16

tattcaccttacaaaccctc20

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1