用于组织样本中核酸的局部或空间检测的方法和产品与流程

文档序号:15937103发布日期:2018-11-14 02:33阅读:593来源:国知局

本发明主要涉及组织样本中核酸的局部或空间检测。所述核酸可以是rna或dna。因此,本发明提供的方法可用于检测和/或分析rna(例如rna转录体)或基因组dna,以获取组织样本(例如个体细胞)中有关基因定位、分布或表达的空间信息,或确切地说,任何基因组变异(不一定非得是基因中的变异)的定位或分布的空间信息。因此,本发明使空间基因组学和空间转录组学研究成为可能。

一种定量和/或定性的方法,能够分析组织样本中的基因组序列分布、位置或表达,其中所述组织样本中保有空间表达、分布或定位格局。因此,所述新方法提供了一种实施“空间转录组学”或“空间基因组学”研究的流程,令使用者能同时测定组织样本中所含的已表达表达基因、基因或基因组位点的表达格局或定位/分布格局。

具体来说,本发明是基于阵列技术与高通量dna测序技术的联用,捕获并以定位标记来标记组织样本中的核酸分子(例如,rna或dna分子),尤其是mrna或dna。然后,合成dna分子,并对其进行测序和分析,以确定该组织样本的任何部分中哪些基因获得了表达。优选地,可以同时获取该组织样本中每个细胞单独、分开、特定的转录组。因此,本发明的方法可说是提供了组织样本中个体细胞高度并行的综合转录组签名,且不会丢失所述受测组织样本中的空间信息。本发明还提供了一种实施本发明方法的阵列及制作本发明阵列的方法。

背景技术

人体含有超过100万亿个细胞,这些细胞组成了超过250个不同的器官和组织。我们还远未理解大脑等复杂器官的发育和组织,因此,还有必要利用量化的方法剖析这些组织中所表达基因的表达形式,确定控制这些组织发育和功能的基因。这些器官自身便是分化细胞的混合体,所述细胞使得如营养运输、防御等各种身体机能得到协同和维持。因此,细胞功能取决于该细胞在特定组织结构中的位置和它与该组织中其它细胞间直接和间接的相互作用。因此,有必要理清这些相互作用如何在转录水平上影响组织中的每个细胞。

rna深度测序的最新发现表明,人体细胞系中的大多数转录体都能被检测,且大部分(75%)的人类蛋白质编码基因都在大多数组织中有所表达。类似地,一项针对1%的人类基因组的详细研究表明,染色体进行的是泛转录,全部碱基中有大部分被包含在初级转录体中。因此,可以说该转录机制在全局水平上是混杂的。

众所周知,转录体仅是蛋白质丰度的近似指标,因为从任何一个转录体生成的蛋白质数量都受到rna翻译、降解速度等的影响。对此,最近有一项人体器官和组织的免疫分析暗示,组织特异性是通过对蛋白质水平的精确时间、空间控制来获得的,且身体不同组织获取其独有特质的途径,并非通过控制蛋白质表达的种类,而是通过控制每种蛋白质的表达数量。

然而,接下来有全局研究比较了转录组和蛋白质组的相关性,证明全体基因中的大部分都得到了表达。有趣的是,研究发现个体基因产物的rna变化和蛋白质水平间存在高相关性,这就表明,对个体细胞转录组的研究对了解蛋白质的功能角色上具有生物学意义。

的确,对生物组织的细胞组织和表达格局的分析,是生物医学研究和诊断学上的里程碑。细胞组织学运用各种染色技术,在一个多世纪前便首先确定了健康器官的基本结构机制和常见病理学变化。该领域的发展,带来了以免疫组织化学和原位杂交的基因表达来研究蛋白质分布的可能性。

但是,愈发先进的组织学和基因表达技术并行发展,却导致了成像技术与转录组分析的分离,因而在本发明提供的方法之前,还没有任何将空间分辨率用于全转录组分析的可行办法。

作为原位技术的替代方式或补充方式,蛋白质和核酸的体外分析方法也得到了发展,即:从完整组织样本、单一细胞类型或甚至单个细胞中提取分子,并在所述提取物中通过elisa、qprc等方法对特定分子进行定量。

基因表达分析的最新发展,为利用微阵列或rna测序评估组织的完整转录组提供了可能,这些发展有助于我们对生物过程的理解和诊断学研究。然而,典型的转录组分析以从整块组织(或者甚至完整生物体)提取的mrna为实施对象,但是要收集较小的组织区域或个体细胞用于转录组分析,却一般非常费力、费钱且精确度低。

因此,大多数基于微阵列或下一代rna测序的基因表达研究,都采用包含许多细胞的代表性样本,由此一来,研究结果代表的是受测基因的平均表达水平。在某些情况下,除全局基因表达平台外,还对具有显著差异的细胞进行了分离(tangfetal,natprotoc.2010;5:516-35;wangd&bodovitzs,trendsbiotechnol.2010;28:281-90),获得了关于细胞间差异的非常精确的信息。然而,至今为止,还没有以高分辨率来研究完整组织中的转录活性的高通量方法。



技术实现要素:

因此,基因表达格局分析的现有技术一次仅能提供一个或几个基因的转录信息,或在提供同一样本中的所有基因信息的同时损失其位置信息。因此,显然需要能够同时、分别、特异测定样本中每个细胞的转录组的方法,即是说,需要能够提供含空间分辨率的转录信息的组织样本全局基因表达分析方法,而本发明就满足了这一需要。

本发明中所述方法和产物的创新途径,采用了目前业已完善的阵列和测序技术来获得一个样本中全部基因的转录信息,且同时保留每个转录体的位置信息。对本领域技术人员来说,这显然是生命科学中的一个里程碑。该新技术开创了所谓“空间转录组学”的新领域,并可能将对我们对所有多细胞生物的组织发育和组织、细胞功能方面的认识带来深远的影响。显然,这样的技术在促进对疾病状态的成因和发展的理解和开发针对这些疾病的有效治疗措施方面将尤其有用,例如癌症。本发明的方法还可应用在许多疾病的诊断中。

虽然如下具体所述,本发明最初的目的在于转录组研究,本发明的原理和方法还可以应用于dna分析,由此也能用于基因组分析(“空间基因组学”)。由此一来,在最广泛意义上,本发明主要可用于核酸的检测和/或分析。

阵列技术,特别是微阵列,发源于斯坦福大学的研究,该研究将少量dna寡核苷酸成功地贴附在玻璃表面,呈有序排列,即所谓的“阵列”,并用其监控了45个基因的转录(schenametal,science.1995;270:368-9,371)。

自此以后,全世界的科学家们运用微阵列技术已经发表了超过3万篇论文。多种微阵列被开发出来,以适应各种应用,例如,检测单核苷酸多态性(snps)或基因型或重新测序突变基因组,且微阵列技术的一项重要应用是基因表达分析。的确,基因表达微阵列的发明目的是用作一种分析特定样本中已表达基因材料水平的方法,但其真正的成功却在于为同时比较许多基因的表达水平带来了可能。针对此类实验,市场上有若干现成的微阵列平台商品,但也可以制作定制的基因表达阵列。

虽然微阵列在基因表达研究中的应用现已普及,但显然,更加先进并全面的所谓“下一代dna测序”(ngs)技术正开始替代dna微阵列在许多应用中的位置,例如,深度转录组分析。

用于超快速基因组测序的ngs技术的开发,是生命科学中的一座里程碑(pettersoneetal,genomics.2009;93:105-11)。这些新技术已经急剧地降低了dna测序的成本,并能在前所未有的速度下测定高等生物的基因组,包括特定个体的基因组(wadecmetalscience.2009;326:865-7;rubinjetal,nature2010;464:587-91)。高通量基因组学的新进展已给生物学研究格局带来了天翻地覆的变化,除基因组完整鉴定外,还能用数字化定量的方式来研究全转录组。近年来,用于此类全方位数据组的可视化和整合的生物信息学工具也得到了显著的进步。

然而,人们惊奇地发现,对于以二维空间分辨率为其信息特征的组织样本来说,利用细胞组织学技术、微阵列技术和ngs技术的独特结合,可从该样本的多个细胞获得全面的转录或基因组信息。因此,从一个极端角度来说,本发明的方法可用于分析样本中单一细胞的单一基因的表达,同时保留该细胞在其组织样本中的空间信息;而从另一个极端及本发明的优选方面来说,所述方法可用于同时确定一个样本中每个细胞,或基本上所有细胞的每个基因的表达,即:一个组织样本中的全局空间表达格局。显然,本发明的方法也可用于中间分析。

以下简要说明本发明的最简化形式。本发明需要反转录(rt)引物,该引物还包括独有的定位标记(结构域),并将该引物在如玻璃载片等目标基板上排列产生“阵列”。这些独有的定位标记对应于该rt引物在阵列上的位置(阵列特征)。将组织薄片放置于阵列上,并在目标载片上进行反转录反应。该rt引物与组织样本中的rna结合(或杂交),以结合的rna作为模版并延长获得cdna,所得cnda也因此贴附在所述阵列表面。由于rt引物的独一无二定位标记的存在,每个cdna序列都载有模版rna在组织切片中的位置信息。在cdna合成步骤之前或之后,可通过染色或拍照等方法令该组织薄片可视化或成像,令cdna分子中的定位标记得以与组织样本中的某个位置相关联。对该cdna进行测序,获得含有准确位置信息的转录组结果。该过程的示意图如图1所示。然后,可将测序数据与组织样本中的某个位置配对,令测序数据与组织切片共同可视化,如借由电脑,例如,展示整个组织上任何感兴趣的基因的表达格局(图2)。类似地,还可以在电脑屏幕上标记组织切片的不同区域,选取任意感兴趣的区域并获得所选区域间不同的表达基因的信息。显然,本发明的方法可获得的数据与运用研究mrna群的现有方法获得的数据具有鲜明对比。举例来说,基于原位杂交的方法仅能提供单一mrna转录体的相对信息。因此,本发明的方法比现有的原位技术具有明显的优势。本发明的方法可获得的全局基因表达信息还可包括共表达信息和转录丰度的定量估计。显然,本方法是一种广泛适用的方法策略,可应用于任何物种,例如,动物、植物和真菌的任何组织的分析。

如上所述,并将在下文中详细论述,该基本方法显然还可以容易地扩展应用于基因组dna分析,例如,用于包含一个或多个特异突变的组织样本的细胞鉴定。举例来说,可以将基因组dna断裂成片段,并与引物(相当于如上所述的rt引物)杂交,该引物能捕获dna片段(例如,可在所述dna片段上连接一个具有所述引物的互补序列的接合物,或可用酶促等方法延长dna片段,向其序列末端加入额外的核苷酸,如poly-a尾,来生成能与该引物互补的序列)并引导对捕获分子的互补链的合成。该分析的余下步骤可如上所述。因此,下文中基于转录体分析的背景来描述的本发明具体实施例,也可在适宜情形下用于基因组dna的分析方法中。

从以上说明中可以看出,与位置信息结合的转录组或基因组信息具有巨大的价值。举例来说,它能够以高分辨率进行全局基因表达绘图,而这一技术可应用于许多方面,例如包括癌症研究和诊断学研究。

进一步来说,显然本发明所述方法与前述用于组织样本全转录组分析的方法间具有显著差异,且这些差异具有众多优点。本发明基于一项令人惊奇的发现,即:使用组织薄片并不会干扰由贴附于阵列表面的引物(例如反转录引物)所引导的dna(例如,cdna)的合成。

因此,在其首要且最广泛的意义上,本发明提供一种组织样本中的核酸局部检测方法,包括:

(a)提供包括基板的阵列,所述基板上直接或间接地固定了多种捕获探针,每一种类所述探针在所述阵列中各占不同位置,且定向为具有3’自由端以使所述探针能作为引导延长反应或连接反应的引物,其中所述捕获探针的每一种类都包括一个核酸分子,所述核酸分子在5’至3’方向上包括:

(i)定位域,与阵列上的捕获探针的位置相对应,和

(ii)捕获域;

(b)令所述阵列与组织样本接触,以使得阵列上的捕获探针的位置能和所述组织样本上的位置相关联,并允许组织样本上的核酸与所述捕获探针的捕获域杂交;

(c)以所述捕获探针作为延长引物或连接引物,从已捕获的核酸分子上产生dna分子,其中所述被延长或连接的dna分子以定位域标记;

(d)可选地,生成所述被标记dna的互补链和/或可选地,扩增所述被标记dna;

(e)从阵列表面释放至少部分被标记dna分子和/或它们的互补链或扩增子,其中所述部分包括定位域或其互补链;

(f)直接或间接分析被释放dna分子的序列。

本发明的方法与本领域其他空间转录组学方法相比具有显著优势。例如,本发明描述的方法可获得组织样本中所有转录体的全局和空间分布;此外,还可以量化阵列上的每个位置或特征上的每个基因的表达,因此能在一个简单阵列的数据基础上实施多种分析。因此,本发明的方法使检测和/或量化单一组织样本的所有基因的空间表达成为可能。此外,由于转录体的丰度非直接可视,例如,通过荧光反应,与标准微阵列相似,即使同一样本中的所述转录体以迥然相异的浓度存在,也可以测量单一样本中的基因表达。

相应地,在另一个更具体的方面,本发明可看作提供了一种用于测定和/或分析组织样本转录组的方法,包括:

(a)提供包括基板的阵列,所述基板上直接或间接地固定了多种捕获探针,每一种类所述探针在所述阵列中各占不同位置,且定向为具有3’自由端以使所述探针能作为反转录(rt)引物,其中所述捕获探针的每一种类都包括一个核酸分子,所述核酸分子在5’至3’方向上包括:

(i)定位域,与阵列上的捕获探针的位置相对应,和

(ii)捕获域;

(b)令所述组织样本与阵列接触,以使阵列上的捕获探针的位置与组织样本上的位置相关联,且允许该组织样本上的rna与所述捕获探针上的捕获域杂交;

(c)利用所述捕获探针作为rt引物,从已捕获的rna分子生成cdna分子,且可选地,扩增所述cdna分子;

(d)从阵列表面释放至少部分所述cdna分子和/或可选地,其扩增子,其中所述被释放的分子可以是cdna的第一和/或第二链分子或其扩增子,且其中所述部分包括定位域或其互补链;

(e)直接或间接地分析被释放分子的序列。

如下文所述,所述分析步骤中可以采用任何核酸分析方法。典型地,该步骤可以包括测序,但进行序列测定实际上并非必要步骤。举例来说,可以采用序列特异性分析方法。例如,可以实施序列特异性扩增反应,比如通过使用引物,且该引物对所述定位域和/或一种特定的目标序列,例如,一种待测的特定目标dna(即:与一种特定的cdna/rna或基因相对应等),具有特异性。一种典范性的分析方法是序列特异性的pcr反应。

按照步骤(e)所得到的的序列分析信息可被用于获得样本中rna的空间信息。换句话说,该序列分析信息可以提供有关样本中rna的位置信息。该空间信息可从测得的序列分析信息的性质来推定,例如,其可以揭示一种特定rna的存在,而该rna可能在所用组织样本的环境中本身就具有空间信息意义,以及/或者可以结合阵列上组织样本的位置和测序信息来推定空间信息(例如,空间定位)。因此,本方法可以仅包括将序列分析信息与组织样本的某个位置相关联的步骤,例如,利用定位标记和其与组织样本上某位置间的关联性。但是,如上所述,作为本发明的一种优选实施方式,可以通过关联序列分析数据和组织样本图像来便利地获得空间信息。相应地,在一个优选实施例中,所述方法还可以包括一个步骤,即:

(f)将所述序列分析信息与所述组织样本的图像相关联,其中该组织样本在步骤(c)之前或之后成像。

从其最广义上来说,本发明的方法可以用于组织样本中某一核酸的局部检测。因此,在一个实施例中,本发明的方法可用于测定和/或分析组织样本中的全部转录组或基因组,例如,组织样本的全转录组。但是,本方法并不局限于此,而是包括测定和/或分析全部或部分转录组或基因组。因此,本方法可以包括测定和/或分析转录组或基因组的部分或子集,例如与一个基因子集相对应的转录组,又如,一个特定基因子集,如与一种特定的疾病或症状、组织类型等相关的基因子集。

从另一方面来看,如上所述的本方法步骤可以看作是提供了一种用于获取具有空间限定的转录组或基因组的方法,特别是含空间限定的组织样本全局转录组或基因组。

从另一方面来看,本发明的方法可被看做是一种用于组织样本中的核酸(即dna或rna)的局部或空间检测方法,或用于组织样本核酸(dna或rna)的局部或空间测定和/或分析的方法。特别地,本方法可用于组织样本中基因表达或基因组变异的局部或空间检测、确定和/或分析。该局部/空间检测/确定/分析意味着可对rna或dna在组织样本的细胞或组织中的天然位置或位点进行定位。因此,举例来说,可将rna或dna定位于样本上的一个细胞、细胞群或细胞类型,或组织样本中的特定区域。所述rna或dna的天然位点或位置(或者换句话说,所述rna或dna在组织样本中的位点或位置),例如,一个已表达的基因或基因组位点,可得到确定。

本发明还可被看作是提供了一种用于本发明的方法中的阵列,包括基板,所述基板上直接或间接地固定了多种捕获探针,每一种类所述探针在所述阵列中各占不同位置,且定向为具有3’自由端以使所述探针能作为反转录(rt)引物,其中所述捕获探针的每一种类都包括一个核酸分子,所述核酸分子在5’至3’方向上含有:

(i)定位域,与阵列上的捕获探针的位置相对应,和

(ii)捕获域,用于捕获与所述阵列相接触的组织样本的rna。

在一个相关方面上,本发明还提供了一种阵列的用途,该阵列包括基板,所述基板上直接或间接地固定了多种捕获探针,每一种类所述探针在所述阵列中各占不同位置,且定向为具有3’自由端以使所述探针具有反转录(rt)引物的功能,其中所述捕获探针的每一种类包括一个核酸分子,该核酸分子从5’端至3’端的方向上含有:

(i)定位域,与阵列上的捕获探针的位置相对应,和

(ii)捕获域;

用于捕获与所述阵列相接触的组织样本的rna。

优选地,所述用途是用于测定和/或分析组织样本的转录组,特别是全转录组,且进一步包括以下步骤:

(a)以所述捕获探针作为rt引物,从已捕获的核酸分子生成cdna分子,且可选地,扩增所述cdna分子;

(b)从所述阵列表面释放至少部分所述cdna分子和/或可选地,其扩增子,其中所述被释放的分子可以是cdna分子的第一和/或第二链或其扩增子,且其中所述部分包括定位域或其互补链;

(c)直接或间接地分析被释放分子的序列;且可选地

(d)将所述序列分析信息与所述组织样本的图像相关联,其中所述组织样本在步骤(a)之前或之后成像。

因此可知晓,本发明的阵列可用于捕获rna,例如与所述阵列接触的组织样本的mrna。所述阵列还可以用于测定和/或分析组织样本的全转录组或部分转录组,或用于获取组织样本中含空间限定的部分或全局转录组。本发明的方法因此可看作组织样本中一个和多个基因的空间表达的量化方法。换句话说,本发明的方法可用于检测组织样本中一个或多个基因的空间表达。再换句话说,本发明的方法可用于同时测定组织样本中一个或多个位点的一个或多个基因的表达。更进一步,本发明的方法可看作是用二维空间分辨率对组织样本进行部分或全局转录组分析的方法。

所述rna可以是细胞中存在的任何rna分子。因此,它可以是mrna、trna、rrna、病毒rna、核内小rna(snrna)、核仁小rna(snorna)、微小rna(mirna)、小干涉rna(sirna)、与piwi蛋白相互作用的rna(pirna)、核糖体rna、反义rna或非编码rna。但是,优选为mrna。

上述方法中(与上述优选使用形式中的步骤(a)相对应的)步骤(c),从已捕获的rna为模板生成cdna,可看作涉及cdna的合成。其包括已捕获的rna的反转录步骤,以已捕获的rna为模板,延长具有rt引物功能的捕获探针。该步骤产生所谓的cdna第一链。下面将详细叙述,在从阵列上释放cdna第一链之后,可以可选地在阵列上进行cdna第二链的合成,或在一个分开的步骤中进行。下面还将详细叙述,在某些实施例中,第二链的合成可以发生在被释放的cdna分子第一链扩增的第一个步骤中。

下文将讨论及描述阵列在核酸分析中的一般应用和在dna分析中的具体应用。在此描述的运用于rna环境下的阵列和捕获探针的具体细节和实施方式,(在适当情况下)同样适用于所有此类阵列,包括用于dna的阵列。

本发明中的措辞“多种”意为两种或以上,或至少两种,例如,3、5、10、15、20、30、40、50、60、70、80、90、100、150、200、400、500、1000、2000、5000、10000,或更多,等等。因此,举例来说,捕获探针的数目可以是上述任意两个数字之间的任一整数。但是,可知晓,根据设想,也可以使用含有成百、上千、上万、十万或甚至百万个捕获探针的传统型阵列。

因此,在此概述的方法采用了高密度核酸阵列,所述阵列含有“捕获探针”,用以捕获和标记组织样本中所有单个细胞的转录体,,所述组织样本例如组织样品薄片,即“切片”。用于分析的组织样本或切片以高度平行的方式制备,以保存所述切片中的空间信息。每个细胞中已捕获的rna(优选为mrna)分子,或“转录组”,被转录为cdna并进行cdna分析,例如,进行高通量测序。可通过整合在排布于阵列中的核酸探针上的所谓识别码序列(或id标记,在此定义为定位域),将所得数据与切片等原始组织样本的图像相关联。

高密度核酸阵列或微阵列,是在此所述的空间转录组标记方法的核心部分。微阵列是一种用于分子生物学的多重技术。一个典型的微阵列包括一系列阵列排布的寡核苷酸微点(一个阵列上可整合成千上万个微点,通常为上万个)。每个核酸(寡核苷酸)微点的不同位置(每一种类的寡核苷酸/核酸分子)称为“特征”(因此上述方法中捕获探针的每一种类皆可看作是阵列的一个特定特征;每一特征在阵列上占有不同的位置),且典型地,每个单独的特征含有皮摩尔(10-12摩尔)量级的特定dna序列(一种“种类”),即所称的“探针”(或“报告子”)。典型情况下,所述探针可以是一小段基因或其他核酸成分,能够在高严格度的杂交条件下与cdna或crna样本(即“目标”)进行杂交。但是,如下所述,本发明中的探针不同于标准微阵列中的探针。

在基因表达微阵列中,以探针为目标的杂交反应常通过对视觉信号的检测来进行检测和量化,例如连接在所有目标上的荧光团、银离子或化学荧光标记。该视觉信号的强度与样本中每个目标核酸的相对丰度有关。由于一个阵列可以含有上万个探针,一个微阵列实验可以完成许多基因的并行测试。

在标准微阵列中,探针与环氧硅烷、氨基硅烷、赖氨酸或聚丙烯酰胺等化学基质通过共价键结合附着在固体表面或基板上。典型的基板是玻璃、塑料、硅质芯片或载片,但也有其他的已知微阵列平台,例如微珠。

探针可通过任何适当的方法附着在本发明的阵列上。在一个优选实施例中,探针通过化学固定法固定在基板上,所述化学固定法可以是基板(支撑材料)和探针间基于化学反应的相互作用。这样的化学反应一般不依赖于热或光的能量输入,但可以通过施加热量(例如给予化学反应的某个理想温度)或某波长的光来促进反应。举例来说,基板上的功能基团和探针上的对应功能要素之间可以发生化学固定反应。探针的此类对应功能要素可以是探针所固有的化学基团,例如羟基,或另外引入的基团。此类功能基团的一个例子是胺基。典型情况下,待固定的探针含有功能性胺基,或通过化学修饰引入了功能性胺基。此类化学修饰的方法和途径已被熟知。

待固定的探针中的所述功能基团的定位,可用于控制和塑造探针的结合行为和/或方向,例如,该功能基团可以放置于探针的5’端、3’端或探针序列之中。待固定的探针的典型基板含有能与该探针相结合的基团,例如,能与胺基功能化的核酸相结合的基团。此类基板的示例包括羧基、醛类或环氧基板。此类材料已为本领域技术人员所知。能在由于引入胺基而具有化学活性的探针间引发连接反应的功能基团,以及阵列基板,都为本领域技术人员所知晓。

可用于探针固定的可选基板可能需要经过化学活化,例如,对阵列基板上的功能基团的活化。术语“活化的基板”涉及一种材料,该材料含有能够相互作用或具有反应活性的化学基团,且所述基团已通过本领域技术人员所知的化学修饰步骤建立或启动。例如,一种含有羧基的基板必须经过活化才能使用。进一步来说,有现成的含有能与核酸探针已有特定基团相反应的功能基团的基板。

可选地,所述探针可以直接在基板上合成。此类方法的适当步骤为本领域技术人员所知。例如,agilentinc.、affymetrixinc.、rochenimblegeninc.或flexgenbv所开发的制造技术。典型情况下,采用激光和镜组对待添加核苷酸的微点进行特定活化。此类方法可以提供如30μm或以上的光斑大小(即特征)

因此,所述基板可以是本领域技术人员所知的任何适当基板。该基板可以采取任何恰当的形式或格式,例如,可以是扁平的,或弯曲的,如相对于组织样本和基板发生相互作用的区域凸起或凹进。特别优选地,基板是一种平面,即二维的芯片或载片。

典型地,基板是固相载体,因此基板上的探针能获得准确并可追溯的定位。基板的一个示例是含有功能性化学基团的固相材料或基板,所述化学基团为例如胺基或胺基功能化基团。本发明所设想的基板为无孔基板。优选的无孔基板为玻璃、硅、聚赖氨酸涂层材料、硝化纤维、聚苯乙烯、环状烯烃共聚物(cocs)、环状烯烃高分子(cops)、聚丙烯、聚乙烯和聚碳酸酯。

可采用任何本领域技术人员所知的适当材料。典型情况下采用的是玻璃或聚苯乙烯。聚苯乙烯是疏水性材料,适合用于结合负电荷大分子,因为其通常几乎不含亲水性基团。对于固定于玻璃载片上的核酸来说,进一步已知,通过增加玻璃表面的疏水性,可增进核酸固定。这一增进可允许相对来说更为密集的阵型。除聚赖氨酸涂层或表面处理外,该基板,尤其是玻璃基板,还可以进行硅烷化处理,例如,进行环氧硅烷或氨基硅烷处理,烷化处理,或聚丙烯酰胺处理。

市场上有若干现成的标准阵列商品,其特征的数量和大小都可以变化。本发明中,特征的排列可随着不同组织或器官所具有的细胞尺寸和/或密度而改变。例如,典型的动物细胞横断面在1-100μm左右,而典型的植物细胞的横断面可能在1-10000μm范围内变化。因此,对动物或真菌的组织样本,优选采用具有多达210万特征或420万特征,且特征大小为13微米的阵列,而对植物组织样本来说,其他格式,例如8x130k特征的格式就足够了。对于序列分析,尤其是ngs技术,也有现成的商品阵列,或已知可用于此领域的商品阵列。此类阵列亦可用作本发明范围中的阵列表面,例如,illumina微珠阵列。除本身可以定制化的现成商品阵列外,还可以制作定制或非标准的“自制”阵列,且制作阵列的方法已经完善确立。无论标准和非标准阵列,只要含有下文定义的探针,便可在本发明的方法中使用。

优选地,取决于阵列的化学基质,微阵列上的探针通过5’或3’端固定在阵列上,即:附着或结合于阵列上。典型情况下,对于可购得的商品阵列来说,探针通过3’端的连接实现附着,因此留下5’端为自由端。但是,也有通过5’端的连接实现附着,留下3’端为探针自由端的阵列,且如本发明其他部分所述,此类阵列可以通过本领域公知的标准技术加以合成。

将核酸探针连接在阵列基板上的共价键,既可看作直接连接,也可看作间接连接,因为虽然探针的附着是通过“直接”的共价键实现的,但可能存在某些化学部分或连接物,将核酸探针的“第一个”核苷酸从玻璃或硅质等材料的基板上分隔开,即:间接连接。就本发明的目的而言,利用共价键和/或化学连接物固定到基板上的探针,一般看作是直接固定或附着于基板上。

本发明的捕获探针可以直接或间接固定于阵列或与阵列相互作用,对此,下文中将会更详细地加以描述。因此,捕获探针无需直接结合在阵列上,而是可以间接地相互作用,例如,与一个直接或间接地结合在阵列上的分子相结合(例如,捕获探针可以和捕获探针结合伴侣相互作用(例如,结合或与之杂交),所述结合伴侣即直接或间接结合在阵列上的表面探针)。但是,一般来说,捕获探针将直接或间接(通过一种或多种中间媒介)地结合或固定在阵列上。

本发明的用途、方法和阵列可以包括通过5’或3’端固定的探针。但是,当捕获探针直接固定到阵列基板上时,其采用的固定方式必须保证捕获探针的3’端可供自由延长,例如,通过5’端固定该探针。可以间接固定该捕获探针,以使其具有自由的3'端,即可供延长的3’端。

已延长或可延长的3’端,意味着可以将更多的核苷酸添加于核酸分子(例如捕获探针)的3’端末端核苷酸上,以延长核酸分子的长度,即:利用标准聚合反应来延长核酸分子,例如,利用聚合酶催化的模版化聚合反应。

因此,在一个实施例中,阵列含有以其3’端直接固定的探针,即下文中定义的所谓表面探针。每一种类的表面探针都含有与一种种类的捕获探针互补的区域,以能令捕获探针与表面探针杂交,形成具有自由可延长的3’端的捕获探针。本发明的一种优选方面中,若阵列含有表面探针,则在阵列上原位合成捕获探针。

阵列探针可以由核糖核苷酸和/或脱氧核糖核苷酸,以及能够参与watson-crick或类似类型的碱基互配反应的合成核苷酸残基所组成。因此,所述核酸可以是dna或rna或其任何修饰产物,例如,pna或其他含有非核苷酸骨架的衍生物。但是,在转录组分析环境中,捕获探针的捕获域必须能够引导反转录反应,生成与已捕获的rna分子互补的cdna。下文中会进一步详细叙述,在基因组分析环境中,捕获探针的捕获域必须能够与dna片段结合,结合对象可以是dna片段上添加的结合域。在一些实施例中,所述捕获探针的捕获域可以引导dna延长(聚合酶)反应,生成与已捕获的dna分子互补的dna。在其他一些实施例中,捕获域可以作为模版参与已捕获的dna分子和直接或间接固定于基板上的表面探针间的连接反应。在其他一些实施例中,捕获域可以连接至已捕获的dna分子的其中一条链上。

本发明的一个优选实施例中,捕获探针至少在其捕获域中含有或只含有脱氧核糖核苷酸(dntps)。在一个特定的优选实施例中,整个捕获探针都含有或只含有脱氧核糖核苷酸。

本发明的一个优选实施例中,捕获探针直接固定在阵列基板上,即:通过其5’端固定,其3’端自由可延长。

本发明的捕获探针含有至少两种结构域,即捕获域和定位域(或特征标识标签或特征标识域;可选地,所述定位域可定义为标识(id)域或标签,或定位标签)。捕获探针可以进一步含有如下文中定义的通用域。当捕获探针通过与表面探针杂交而间接附着于阵列表面时,捕获探针需有与表面探针互补的序列(例如,一个部分或结构域)。此类互补序列可以与表面探针的定位/标识域和/或通用域互补。换句话说,定位域和/或通用域可以构成探针上与表面探针互补的区域或部分。但是,捕获探针还可以含有与表面探针互补的附加域(或区域、部分或序列)。如下文所述,为便于合成,此类与表面探针互补的区域可以是捕获域中的部分或捕获域的延长部分(此类部分或延长部分自身不用于或不能够与rna等目标核酸结合)。

典型的捕获域位于捕获探针的3’端,且含有可供延长的自由3’端,例如,通过模版化的聚合反应。捕获域含有能够跟与阵列接触的组织样本中的细胞的核酸杂交的核苷酸序列,所述核酸例如rna(优选为mrna)。

优选地,可以对捕获域进行选择或设计,使其可以选择性或特异性地结合(或更宽泛地说,可以有能力结合)特定核酸,例如所需检测或分析的rna。举例来说,捕获域可以经过选择或设计来选择性地捕获mrna,如本领域中熟知,基于与mrna的poly-a尾的杂交反应实现。因此,在一个优选实施例中,捕获域含有poly-tdna寡核苷酸,即:一系列以磷酸二酯键连接的连续脱氧胸腺嘧啶核苷残基,能够与mrna的poly-a尾杂交。可选地,捕获域可以含有与poly-t功能类似或结构类似的核苷酸,即有能力选择性地与poly-a选择性结合的核苷酸,例如poly-u寡核苷酸,或由脱氧胸腺嘧啶核苷类似物组成的寡核苷酸,其中所述寡核苷酸保留了与poly-a结合的功能特性。在一个特定的优选实施例中,捕获域,或更具体地说,捕获域的poly-t元件,含有至少10个核苷酸,优选为至少11、12、13、14、15、16、17、18、19或20个核苷酸。在一个进一步的实施例中,捕获域,或更具体地说,捕获域的poly-t元件,含有至少25、30或35个核苷酸。

如本领域所知,捕获核酸还可以用随机序列,例如,随机六聚体或类似序列,因此,此类随机序列可用于组成全部或部分捕获域。举例来说,随机序列可与poly-t(或poly-t类似物等)序列共同使用。因此,含有poly-t(或“poly-t类似物”)寡核苷酸的捕获域,还可以含有随机寡核苷酸序列。例如,所述随机寡核苷酸序列可以位于poly-t序列的5’或3’端方向,例如位于捕获探针的3’端,但此类随机序列的位置并无关键意义。这样的结构有利于捕获mrna的poly-a尾的起始端。可选地,捕获域可以整个是随机序列。再者,如本领域所知原理,还可以使用简并捕获域。

捕获域能够选择性地与所需的核酸亚型或子类结合,举例来说,rna,例如某个特定种类的rna,如前述列举的mrna或rrna等;或者,能够与指定rna类型的特定子集结合,例如,一种特定的mrna,如与某一特定基因或基因群对应的mrna。此类捕获探针可以基于想要捕获的rna的序列来选择或设计,因此可以是针对特定rna目标或群体目标(目标群等)的序列特异性捕获探针。因此,按照本领域熟知的原理,所述捕获探针可以是基于特定基因序列或特定序列基元或共有/保守序列等。

一些实施例中,捕获探针通过例如与表面探针的杂交而间接固定于阵列基板上,其捕获域可以进一步含有能够与表面探针的5’端杂交的一个上游序列(位于与rna等组织样本核酸杂交的序列的5’端方向)。单独来看,捕获探针的捕获域可以看作是捕获域寡核苷酸,在捕获探针间接固定在阵列上的实施例中,所述捕获域寡核苷酸可用于捕获探针的合成。

捕获探针的定位域(特征标识域或特征标识标签)位于捕获域的直接上游或间接上游,即靠近捕获探针核酸分子的5’端。优选地,定位域与捕获域直接相邻,即捕获域和定位域之间没有间隔序列。在一些实施例中,定位域构成捕获探针的5’端,能直接或间接固定在序列基板上。

如上文论述,阵列的每一特征(即不同位置)都含有一种核酸探针的微点,其中每个特征中存在的定位域都是独一无二的。因此,探针“种类”根据其具有的定位域来限定;同一种类的捕获探针具有同样的定位域。但是,并不要求一个种类下的每个捕获探针都具有完全相同的序列。特别是,由于捕获域可以是或可以含有随机或简并序列,因此一个种类中的个体探针的捕获域可能多种多样。相应地,一些实施例中,捕获探针的捕获域相同,每个特征中存在单一的探针序列,但是在另一些实施例中,捕获探针则各不相同,一个探针种类下的成员不会含有一模一样的序列,虽然该种类中每个成员的定位域序列是相同的。需要满足的要求是:阵列的每个特征或位置各自具有单一种类的捕获探针(具体来说,每一特征或位置载有的捕获探针具有等同的定位标签,即每个特征或位置上具有单一定位域)。每个种类的探针具有不同的定位域,以区分种类。但是,一个种类下的每个成员,在一些情况下,如在此进一步详细叙述所说,可以具有不同的捕获域,因为捕获域可以是随机或简并的,或含有随机或简并的组件。这意味着,在一个指定的特征或位置上,探针的捕获域可以不同。

因此,在其中一些实施例,但不一定是全部实施例中,固定在特定特征上的任一探针分子与固定于同一特征的其他探针分子具有相同的核苷酸序列,但每个特征上的探针与固定在其他各特征的探针的核苷酸序列彼此之间各不相同、差别迥异或可以区别。优选地,每个特征含有一种不同种类的探针。但是,在一些实施例中,优选地,可以制作一个含有相同种类探针的特征群,即制造一个有效覆盖阵列某一区域的特征,该特征大于单一特征,例如,可降低阵列的解析度。在该阵列的其他实施例中,一个特定特征上固定的任一探针分子可以和固定在同一特征的其他探针分子具有相同的定位域核苷酸序列,但其捕获域可以不同。但是,捕获域通常可以设计成捕获相同种类的分子,例如mrna。

捕获探针的定位域(或标签)含有专属于每个特征的序列,充当定位或空间标记(标识标签)。这样一来,通过将某一细胞中的核酸如rna(例如转录体)等连接到阵列中捕获探针的独有定位域序列上,就能利用所述阵列的全阵列空间解析度辨识组织样本的每个区域或结构域,例如组织中的每个细胞。通过定位域,阵列中的捕获探针可以与组织样本的某一位置相关联,例如,可以与样本中的某一细胞相关联。因此,捕获探针的定位域可被看作是核酸标签(标识标签)。

任何合适的序列都可以用作本发明的捕获探针的定位域。合适的序列的意思是,其作为定位域,不会干涉(即抑制或扭曲)组织样本的rna和捕获探针的捕获域之间的反应。例如,定位域应当设计为不具有与组织样本中的核酸分子相杂交的特异性。优选地,捕获探针定位域的核酸序列与组织样本核酸序列之间的序列一致性低于80%。优选地,捕获探针的定位域与组织样本中大部分的核酸分子的序列一致性低于70%、60%、50%或40%。序列一致性可以通过本领域已知的适当方法测定,例如,使用blast比对算法。

在一个优选实施例中,每种捕获探针的定位域都含有独一无二的识别码序列。识别码序列可以通过随机序列生成。接下来,所述随机生成的序列可通过映射于所有种类的常见参考基因组和预设的tm间隔、gc含量和与其他识别码序列间的限定距差来进行严格筛选,以保证识别码序列不会对核酸捕获过程形成干涉,例如不会对来自组织样本的rna的捕获形成干涉,并且识别码序列之间能够毫无困难地相互区分。

如上所述,在一个优选实施例中,捕获探针还包括一个通用域(或连接域或连接标签)。捕获探针的通用域位于定位域的直接上游或间接上游,即靠近捕获探针核酸分子的5’端。优选地,通用域与定位域直接相邻,即定位域和通用域之间没有间隔序列。在一些实施例中,捕获探针含有通用域,所述通用域形成捕获探针的5’端,用以直接或间接固定在阵列基板上。

本发明的方法和用途中,通用域可以有多种用途。举例来说,本发明的方法包括从阵列表面释放(例如移除)至少一部分已合成的(即已延长或连接的)核酸(例如cdna)分子的步骤。如本发明其它部分所述,这一步骤可以用多种方法实现,其中一种方法包括将核酸(例如cdna)分子从阵列表面上剪切下来。因此,通用域自身可以含有一个剪切域,即:可以通过化学方法,或优选地,通过酶促方法,进行特异剪切的序列。

因此,剪切域可以含有可被一个或多个具有核酸分子剪切功能(即有能力断开两个或以上核苷酸之间的磷酸二酯键)的酶所识别的序列。例如,剪切域可以含有限制性核酸内切酶(限制酶)识别序列。限制性酶在称为“限制性位点”的特异识别核酸序列处切断双链或单链dna,适用的酶为本领域所熟知。例如,特别优选地,可以使用稀有剪切限制酶,即具有长限制性位点(长度至少为8个碱基对)的酶,以降低误剪cdna等核酸分子上其他位置的可能性。在此方面,可知晓,移除或释放至少部分cdna等核酸分子,需释放的部分为cdna等核酸分子中含有定位域的部分及其下游的整个序列,即:定位域后3’端方向的整个序列。因此,cdna等核酸分子的剪切应当在定位域的5’端方向实施。

举例来说,剪切域可以含有poly-u序列,对所述poly-u序列的剪切可以用尿嘧啶dna糖基化酶(udg)和市场上称为usertm酶的dna糖基化酶-裂解酶核酸内切酶viii。

剪切域的进一步运用示例可见于捕获探针间接(即通过表面探针)固定在阵列基板上的实施例。其中,剪切域可以含有一个或多个错配的核苷酸,即:表面探针的互补部分和捕获探针并非100%互补。此类错配通过例如muty和t7核酸内切酶i来识别,结果为对错配位点的核酸分子的剪切。

本发明的一些实施例中,捕获探针的定位域含有剪切域,其中所述剪切域位于定位域的5’端。

通用域还可以含有扩增域,作为剪切域的附加或替代部分。本发明的一些实施例中,如本发明其他部分所述,优选地,可以在核酸分子(如cdna)从阵列基板释放(例如移除或切除)后对其进行扩增。但是可知晓,扩增的初始循环,或者以及其后的任一或全部的后续扩增循环还可以在阵列上原位实施。扩增域含有能与扩增引物杂交的独特序列。优选地,每个种类的捕获探针的通用域的扩增域相同。因此,一次扩增反应将足以扩增所有核酸分子(如cdna等)(无论所述核酸分子是否在扩增反应前从阵列基板上释放)。

任何合适的序列都可用作本发明的捕获探针的扩增域。“合适的序列”的意思是,其作为扩增域不会干涉(即抑制或扭曲)组织样本核酸(如rna等)和捕获探针的捕获域之间的相互作用。进一步来说,所述扩增域应当含有与组织样本核酸(如rna)的任何序列不同或大体不同的序列,以保证扩增反应的引物在反应的扩增条件下仅能同扩增域杂交。

举例来说,所述扩增域应当设计为,该扩增域或其互补序列不会与组织样本中的核酸分子特异杂交。优选地,捕获探针扩增域的核酸序列及其互补链与组织样本核酸序列的序列一致性低于80%。优选地,捕获探针的扩增域与组织样本中大部分核酸分子的序列一致性低于70%、60%或40%。序列一致性可以通过本领域已知的适当方法测定,例如,使用blast比对算法。

因此,单独来看,捕获探针的通用域可以看做是一个通用域寡核苷酸,在捕获探针间接固定于阵列上的实施例中,所述通用域寡核苷酸可用于捕获探针的合成。

本发明的一个代表性实施例中,只有每种捕获探针的定位域是独一无二的。因此,同一实施例中的任何特定阵列上,每种捕获探针的捕获域和通用域(若适用)分别相同,以保证对组织样本核酸(例如rna)的捕获具有全阵列一致性。但是,如上文论述,在一些实施例中,一些捕获域可能因为包含了随机或简并序列而产生区别。

在一些实施例中,捕获探针间接固定(例如通过与表面探针杂交)在阵列基板上,此类捕获探针可按下文所述在阵列上合成。

表面探针直接用其3’端或于其3’端固定在阵列基板上。表面探针的每个种类与阵列上的每个特征(不同位置)为唯一对应关系,并与上文中定义的捕获探针部分互补。

因此,表面探针的5’端含有一个结构域(互补捕获域),所述互补捕获域能与捕获域中不与组织样本核酸(如rna)结合的部分相互互补。换句话说,所述互补捕获域能与捕获域寡核苷酸至少部分杂交。表面探针进一步含有一个与捕获探针的定位域互补的结构域(互补定位域或互补特征标识域),该互补定位域位于互补捕获域的直接下游或间接下游(即其3’端方向),即:互补定位域和互补捕获域之间可以用一个间隔序列或连接序列相分隔。在一些实施例中,捕获探针在阵列表面合成,所述阵列的表面探针总在其3’端方向,即定位域的直接或间接下游方向,含有一个与捕获探针的通用域互补的域(互补通用域),换句话说,含有一个能与通用域寡核苷酸至少部分杂交的域。

本发明的一些实施例中,表面探针的序列与定位域和通用域之间,以及与捕获域中不与组织样本核酸(如rna)结合的部分之间,具有100%的互补性或序列一致性。在其他实施例中,表面探针序列与捕获探针的这些结构域之间的序列一致性则可能低于100%,例如,低于99%、98%、97%、96%、95%、94%、93%、92%、91%或90%。本发明的一个特定优选实施例中,互补通用域与捕获探针的通用域之间的序列一致性低于100%。

本发明的一个实施例中,捕获探针在阵列基板上合成或生成。在一个代表性实施例中(见图3),阵列含有如上文定义的表面探针。与捕获探针的捕获域和通用域相对应的寡核苷酸与阵列相接触,并能够与表面探针的互补域相杂交。过量的寡核苷酸可以通过在标准杂交条件下进行洗涤来移除。所得的阵列含有部分单链探针,其中表面探针的5’和3’端均为双链,而互补定位域为单链。可以用聚合酶来处理阵列,依靠模版来延长通用域寡核苷酸的3’端,以合成捕获探针的定位域。可利用连接酶等连接已合成的定位域的3’端与捕获域寡核苷酸的5’端,来生成捕获探针。可知晓,为达成此目的,可以使捕获域寡核苷酸的5’端磷酸化来实现连接反应。由于每一种类的表面探针都含有独一无二的互补定位域,因此每一种类的捕获探针将含有独一无二的定位域。

在此使用的术语“杂交反应”或“杂交”,指的是具有足够的互补性,可通过watson-crick碱基配对结合成双链的核苷酸序列之间的双链形成反应。两个核苷酸序列相互“互补”,指的是其分子的碱基配对具有组织结构同源性。“互补”的核苷酸序列在适当的杂交条件下特异结合,形成稳定的双链。举例来说,如果第一条序列上的一部分与第二条序列上的一部分能够以逆向平行的方式相结合,其中一个序列的3’端与对方序列的5’端相结合,且序列之一的每个a、t(u)、g和c都能与对方序列的t(u)、a、c和g分别结合,则这两条序列互补。rna序列还可以含有互补的g=u或u=g碱基序列。因此,本发明中的两个“互补”序列无需具有完美的同源性。一般来说,如果两条序列在其分子的一段指定长度上,至少有90%(优选为至少约95%)的核苷酸的碱基配对组织结构相同,则这两条序列具有足够的互补性。因此,捕获探针和表面探针的结构域中含有一个互补区域。进一步地,捕获探针的捕获域中含有一个互补区域,能与组织样本核酸,例如rna(优选为mrna)互补。

还可以利用聚合酶延长反应(与上文所述类似)和末端转移酶加“尾”反应,在阵列基板上合成捕获探针,所加的“尾”可以构成捕获域,下文的实施例7中对此做了进一步描述。使用末端转移酶向寡核苷酸末端添加核苷酸序列的技术为本领域所知,例如,引入一条同聚物尾巴,如poly-t尾。相应地,在此类合成反应中,与捕获探针的通用域对应的寡核苷酸可以与阵列相接触,并与表面探针的互补域杂交。过量的寡核苷酸可以通过在标准杂交条件下进行洗涤来移除。所得的阵列含有部分单链探针,其中表面探针的5’和3’端均为双链,互补定位域为单链。可以用聚合酶来处理阵列,依靠模版来延长通用域寡核苷酸的3’端,以合成捕获探针的定位域。然后,要引入捕获域,例如含有poly-t序列的捕获域,可通过末端转移酶来添加poly-t尾,以生成捕获探针。

本发明的典型阵列以及用于本发明的方法中的阵列,可以含有多个微点,或“特征”。特征可定义为阵列基板上的区域或不同位置,该位置上固定有单一种类的捕获探针。因此,每一特征将含有同一种类的多个探针分子。可知晓,在此设定下,虽然相同种类的每个捕获探针可以具有相同的序列,但这并非必要的条件。捕获探针的每个种类将具有相同的定位域(即:同一种类的每个成员,乃至于同一特征中的每个探针,都具有相同的“标记”),但同一特征(种类)的每个个体探针的序列可以不同,这是因为捕获域的序列可以有区别。如上所述,可以采用随机或简并的捕获域。因此,同一特征中的捕获探针可以含有不同的随机或简并序列。阵列上的特征数量和密度将决定阵列的解析度,即:组织样本的转录组或基因组用于分析的细节层次。因此,一般来说,特征的密度提高,阵列的解析度也会随之增加。

如上所述,本发明的阵列特征的大小和数量取决于组织样本的性质和所需的解析度。因此,如果只想要确定组织样本内的成片细胞(或样本含有大细胞)的转录组或基因组,便可减少阵列特征的数量和/或密度(即:减少特征的最大可能数量)和/或增加特征的大小(即:每个特征的面积可以大于最小的可能特征),例如,含有少量大特征的阵列。可选地,如果想要确定样本中个体细胞的转录组或基因组,便可能需要使用最大可能数量且最小可能尺寸的特征,例如,含有许多小特征的阵列。

虽然单一细胞解析度可以是本发明的一个优选特征,但其并非必要目的;细胞群水平的解析度也是本发明的目的之一,例如,检测或分辨特定的细胞类型或组织区域,如正常细胞vs肿瘤细胞。

本发明的代表性实施例中,阵列可以含有至少2、5、10、50、100、500、750、1000、1500、3000、5000、10000、20000、40000、50000、75000、100000、150000、200000、300000、400000、500000、750000、800000、1000000、1200000、1500000、1750000、2000000、2100000.3000000、3500000、4000000或4200000个特征。虽然4200000代表了目前可购得的商品阵列的最大可能特征数量,但根据本发明的构思,本发明中可以制备特征超过此数量的阵列,且此类阵列为发明目的之一。如上所述,可以降低特征大小并在相同或相似面积中提高特征的数量。举例来说,这些特征可以被容纳在约20cm2、10cm2、5cm2、1cm2、1mm2、or100μm2以下的面积中。

因此,本发明的一些实施例中,每个特征的面积可以是约1μm2、2μm2、3μm2、4μm2、5μm2、10μm2、12μm2、15μm2、20μm2、50μm2、75μm2、100μm2、150μm2、200μm2、250μm2、300μm2、400μm2或500μm2.

可知晓,本发明的方法可以用在任何生物体的组织样本上,例如,植物、动物或真菌。本发明的阵列可用于捕获细胞中任何能够进行转录和/或翻译的核酸,例如mrna分子。本发明的阵列和方法特别适用于分离和分析样本中的细胞的转录体或基因组,且需要获取转录组或基因组的空间解析度的时候,例如,在细胞相互连通或与相邻细胞直接接触的情况下。然而,对本领域技术人员来说,本发明的方法显然还可以用于样本中不同细胞或不同细胞类型的转录组或基因组分析,哪怕所述细胞并无直接相互作用,例如,血液样本。换句话说,阵列可适用的细胞无需是组织细胞,也可以单个细胞(例如,从未固定组织中分离的细胞)。所述单个细胞无需是固定在组织的某个位置上的细胞,但仍可以放置在阵列的某个位置上,并可单独进行辨认。因此,在对无直接相互作用的细胞或非组织细胞进行分析的时候,所述方法的空间性质可以用于获取或检索个体细胞的独有或独立的转录组或基因组信息。

因此,样本可以是死体或活体组织样本,或可以是培育样本。代表性的示例包括临床样本,例如全血或血制品、血细胞、组织、活体组织或培育组织、细胞等等,包括其细胞悬液。例如,可以用细胞悬液(例如含有血细胞)制备人工样本。可以将细胞固定在一种基质(例如,凝胶基质,如琼脂、琼脂糖等等)中,然后以常规方法切片。此类操作在本领域的免疫组织化学中为人所知(例如,见anderssonetal2006,j.histochem.cytochem.54(12):1413-23.epub2006sep6)。

组织制备形式和制得样本的处理方式,可能对本发明的转录组或基因组分析造成影响。另外,各种不同的组织样本可能具有不同的物理特征,本领域技术人员可以实施必要的操作来获得本发明的方法中使用的组织样本。但是,从本公开中,显而易见,本发明中可以使用任何适当的样本制备方法来获得组织样本。例如,任何厚度在约1个细胞或更薄的细胞层都可以用在本发明的方法中。在一个实施例中,组织样本的厚度可以薄于细胞横截面的0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2或0.1倍。然而,如上所述,本发明并不限于单一细胞解析度,因此,并不要求组织样本的厚度薄于单个细胞直径或更小;如果需要,可以采用较厚的组织样本。例如,可以采用冷冻切片,其厚度可能是例如10-20μm。

可以用任何基于方便或需要的方式制备组织样本,本发明不限于任何特定的组织制备类型。新鲜的、冷冻的、固定的、未固定的组织都可以使用。可以基于需要和便利,用本领域中知晓、记载的任何方法对组织样本进行固定或包埋。因此,可以使用任何已知的固定剂或包埋材料。

作为本发明中使用的组织样本的第一个代表性示例,可以在适合保持或保藏组织结构完整性(即物理特征)的温度下对组织进行深度冷冻的制备,例如,低于-20℃,优选地,低于-25、-30、-40、-50、-60、-70或-80℃。可以对冷冻组织样本进行切片,即以任何方法切成薄片且置于阵列表面。举例来说,制备组织样本可以利用冷冻超薄切片机,温度设置适合保持组织样本结构完整性和样本核酸化学性质的低温箱,例如低于-15℃,优选为低于-20或-25℃。因此,对样本的处理应当令组织中的核酸(例如rna)的退化或降解最小化。此类操作条件为本领域所熟知,任何程度的降解都可以通过核酸提取来监控,例如,在组织样本制备的各阶段进行总rna提取和质量分析。

在第二个代表性示例中,可以用福尔马林固定和石蜡包埋(ffpe)的标准办法制备组织,所述方法在本领域中已非常完善。在组织样本固定及以石蜡或树脂封闭物包埋之后,可以对组织样本进行切片,即:切成薄片置于阵列上。如上所述,也可以采用其他固定剂和/或包埋材料。

显然,实施本发明的方法之前,需要处理组织样本切片,来去除样本上的包埋材料,例如,通过脱蜡,即去除石蜡或树脂。该步骤可以通过任何适当的方法来完成,且本领域中去除样本上的石蜡或树脂或其他材料的方法已经建立完善,例如,通过以适当的溶剂,例如二甲苯,(在阵列表面)培养样本,例如培养两次,各10分钟,接着以乙醇淋洗,例如用99.5%的乙醇淋洗2分钟,96%的乙醇淋洗2分钟以及70%的乙醇淋洗2分钟。

对本领域技术人员来说,以ffpe或其他固定和包埋方法制备的组织切片中的rna,显然比冷冻组织中的rna更可能产生部分降解。然而,本发明无意受到任何特殊理论的限定,因此,采用前者组织对本发明方法来说可以是一种优选形式。举例来说,如果样本中的rna部分降解,则相对于未降解的样本来说,其rna聚核苷酸的平均长度更短,且或多或少得到了随机化。因此可以推定,在本发明其他部分中所述的各种处理步骤中,例如,接合体(扩增域)的连接反应、cdna分子的扩增及测序中,部分降解的rna所带来的误差更少。

因此,在本发明的一个实施例中,采用ffpe或其他固定和包埋方法制备组织样本,即与阵列相接触的组织样本的切片。换句话说,样本可以是已固定的,例如,经过固定和包埋的。本发明的一个可选实施例中,通过深度冷冻来制备组织样本。在又一个实施例中,可以采用组织的印片,其操作流程为本领域所知。在另外一些实施例中,可以采用未固定的样本。

本发明的方法中使用的组织样本的厚度,可以依照样本制备方法和组织物理特性来决定。因此,本发明的方法可以使用任何适当厚度的切片。本发明的代表性实施例中,组织样本切片的厚度为至少0.1μm,进一步优选为至少0.2、0.3、0.4、0.5、0.7、1.0、1.5、2、3、4、5、6、7、8、9或10μm。在另外一些实施例中,组织样本切片的厚度为至少10、12、13、14、15、20、30、40或50μm。但是,厚度并不是关键性因素,以上列举的仅为代表性的数值。基于需要和方便,可以采用较厚的样本,例如,70或100μm或以上。典型地,组织样本切片的厚度在1-100μm、1-50μm、1-30μm、1-25μm、1-20μm、1-15μm、1-10μm、2-8μm、3-7μm或4-6μm之间,但如上所述,还可以使用更厚的样本。

当组织样本切片与阵列接触时,例如移除包埋材料的步骤如脱蜡以后,组织样本中的核酸分子(如rna)将与固定在阵列上的捕获探针结合。在一些实施例中,优选地,可以对核酸分子(如rna)与捕获探针的结合予以促进。典型地,促进杂交包括改善杂交发生的条件。能够改善的主要条件包括反转录步骤前,在阵列上培养组织切片的时间和温度,在本发明其他部分中有所描述。

举例来说,当组织样本切片与阵列相接触时,可以将阵列培养至少1小时,以便允许核酸(如rna)与捕获探针相杂交。优选地,阵列可以培养2、3、5、10、12、15、20、22或24小时,或直到组织样本切片干燥为止。阵列培养时间并非关键条件,任何方便或需要的时间都可以被采用。典型的阵列培养时间可以高达72小时。因此,可以用任何适当的温度进行培养,例如室温,但在一个优选实施例中,阵列上组织样本切片的培养温度至少为25、26、27、28、29、30、31、32、33、34、35、36或37℃。本领域中,一般采用至多55℃的培养温度。在一个特定优选实施例中,组织样本切片在阵列上37℃干燥24小时。一旦组织样本切片干燥,便可以将阵列在室温下保存,直至实施反转录步骤。可知晓,如果允许组织样本切片在阵列表面干燥,那么在对已捕获的核酸进行进一步操作前,例如在已捕获的rna进行反转录步骤前,须得对切片进行补水。

因此,本发明的方法可以含有一个进一步的步骤,即在样本与阵列接触后,对组织样本进行补水。

在一些实施例中,优选地,在捕获探针与阵列上的组织样本相接触前,对捕获探针进行封闭(例如,遮盖或修饰),尤其是在组织样本中的核酸在已捕获于阵列上之前经过修饰的情况下。具体来说,优选地,对捕获探针的自由3’端进行封闭或修饰。在一个特定实施例中,组织样本中的核酸,例如,可以对基因组dna片段进行修饰,以便其已捕获探针捕获。举例来说,下文中将会进一步详述,接合体序列(含有能与捕获探针的捕获域相结合的结合域,)可以被添加到核酸(例如基因组dna片段)的末端。该步骤可以通过例如接合体的连接反应或核酸的延长反应来完成,例如,用酶在序列末端追加核苷酸,例如poly-a尾。在组织样本与阵列接触前,有必要对捕获探针进行封闭或修饰,尤其是捕获探针的自由3’端,以避免捕获探针受到修饰,例如,避免poly-a尾误加至捕获探针的自由3’端。优选地,可以在捕获探针的合成时向其添加封闭域。但是,也可以在捕获探针合成后再添加封闭域。

在一些实施例中,可以用任何适当且可逆的方法来封闭捕获探针,以避免在组织样本与阵列相接触后,捕获域在组织样本核酸修饰过程中发生修饰。换句话说,可以可逆地掩盖或修饰捕获探针,以使得捕获探针的捕获域不含自由3’端,即使得所述3’端被移除、修饰,或不可接触,以令捕获探针不会在组织样本核酸的修饰过程中受到影响,例如通过连接反应或延长反应,或移除附加的核苷酸来露出和/或恢复捕获探针的捕获域的3’端。

举例来说,可以用封闭探针与捕获探针相杂交,以掩盖捕获域的自由3’端,所述封闭探针例如是发夹探针或含部分双链的探针,所述探针的适当示例为本领域所知。捕获域的自由3’端可以用化学修饰加以封闭,例如,将叠氮甲基作为可逆的化学顶帽加入,使得捕获探针不含自由3’端。可选的适当化学顶帽也被本领域熟知,例如捕获域的末端核苷酸可以是可逆的终止子核苷酸,在捕获探针合成期间或之后加入到探针中。

可选地或附加地,可以对捕获探针的捕获域加以修饰,以便移除捕获探针在组织样本核酸分子的修饰过程中获得的任何修饰,例如,附加核苷酸。举例来说,捕获探针可以在捕获域的下游,即捕获域的3’端方向,含有一条附加序列,称为封闭域。其形式可以是,例如,限制性内切酶识别序列或可由特定酶活性切除的核苷酸序列,如尿嘧啶。组织样本的核酸修饰步骤后,可以对捕获探针进行酶促剪切,来移除封闭域或任何在修饰过程中添加到捕获探针3’端的附加核苷酸。封闭域的移除可以露出和/或恢复捕获探针的捕获域的自由3’端。封闭域可以作为捕获探针的一部分来加以合成,或通过原位反应(即:作为现有阵列的修饰)添加给捕获探针,例如,通过与捕获域之间的连接反应。

可以用上述封闭机制的任意组合对捕获探针进行封闭。

组织样本的核酸,例如基因组dna片段,一旦修饰完成,能够与捕获探针的捕获域相杂交,就必须对捕获探针进行解封,例如,通过解离封闭寡核苷酸,移除化学顶帽和/或封闭域。

为将从阵列的每个特征获得的序列分析或转录组信息或基因组信息与组织样本的分区(即:区域或细胞)相关联,参照阵列特征对组织样本进行定向。换句话说,将组织样本放置于阵列上,使得阵列上的捕获探针的位置与组织样本的位置相关联。由此,便可以辨认每个种类捕获探针的位置(或阵列的每个特征)在组织样本中对应的位置。换句话说,即:可以辨认每个种类捕获探针的位置所对应的组织样本位置。该步骤可以通过阵列上的定位探针来完成,如下文所述。为了方便起见,但非必需步骤,可以在组织样本与阵列接触后对其进行成像。该步骤可以在组织样本核酸的处理步骤之前或之后进行,例如,在本方法的cdna生成步骤,尤其是通过反转录生成cdna第一链的步骤之前或之后。在一个优选实施例中,组织样本的成像步骤在释放阵列上的已捕获及已合成(即:已延长或已连接)的dna(如cdna)的步骤之前。在一个特定优选实施例中,对组织的成像步骤发生在组织样本核酸的处理步骤之后,例如,在反转录步骤之后;并且,在从阵列上释放分子(如cdna)之前,移除(例如,洗涤)了阵列上所有残余组织。在一些实施例中,可在处理捕获核酸的步骤(例如反转录步骤)中,去除阵列表面的残余组织,例如,当所使用的组织为以深度冷冻制备的组织时。在此情况下,组织样本的成像可以在处理步骤前发生,例如cdna合成步骤前。一般来说,成像步骤可以在组织样本与表面接触后的任何时候进行,但应在所有降解或移除组织样本的步骤之前完成。如上所述,这取决于组织样本。

优选地,所述阵列可以含有有助于组织样本或其图像相对于阵列特征进行定向的标记。任何标记阵列的适当方法都可以使用,只要其能在组织样本成像时能够被检测。举例来说,可以将能够生成信号,优选为视觉信号的分子,例如,荧光分子,直接固定在阵列表面。优选地,阵列表面的不同位置上含有至少2种标记,进一步优选地,至少3、4、5、6、7、8、9、10、12、15、20、30、40、50、60、70、80、90或100种标记。可以方便地使用几百或甚至几千种标记。标记可以具有格局,例如,形成阵列外围边框,如阵列特征的整个外框;可以是含信息的其他格局,例如阵列的截线,以便于组织样本图像与阵列的对齐,或者一般来说,阵列特征与组织样本的关联。因此,标记可以是被固定的分子,其能与发送信号的分子相互作用,产生信号。在一个代表性示例中,阵列可以含有标记特征,例如,固定在阵列基板上且与被标记核酸相杂交的核酸探针。举例来说,被标记的核酸分子,即标记核酸,可与能在特定波长(或波长范围)的光线下产生荧光(即被激活)的化学部分相连接或结合。此类标记核酸分子与阵列接触的时机,可以在组织样本为可视化或成像而进行染色之前、之中或之后。但是,标记必须在组织样本成像后能够被检测。因此,在一个优选实施例中,可以采用与可视化组织样本相同的成像条件来对标记进行检测。

本发明的一个特定的优选实施例中,阵列含有标记特征,且所述标记特征与已标记,优选为已荧光标记的标记核酸分子(例如,寡核苷酸)相杂交。

可以使用本领域中任何方便的组织学方法来进行组织成像步骤,例如,光、明视场、暗视场、相位差、荧光、镜像、干涉、共聚显微镜或其组合。典型情况下,组织样本在可视化之前先进行染色,以在组织样本不同区域(例如细胞间)形成对比。采用的染色剂类型取决于组织类型和需染色的细胞区域。此类染色操作流程为本领域所知。在一些实施例中,采用了多种染色剂来可视化(成像)组织样本的不同方面,例如,组织样本的不同区域、特定细胞结构(例如,细胞器)或不同细胞类型。在其他一些实施例中,可以通过组织染色以外的方法进行组织样本可视化或成像,例如,在组织样本已经含有色素,能够提供足够的对比,或者采用了特殊形式的显微镜的情况下。

在一个优选实施例中,采用荧光显微镜对组织样本进行可视化或成像。

如果想要实施成像且未在反转录之前实施成像,则优选地,在从阵列释放cdna分子的步骤之前移除组织样本,即在反转录步骤和可选的成像步骤后仍与阵列基板相接触的残余组织。因此,本发明的方法可以含有一个洗涤阵列的步骤。残余组织样本的移除可以采用任何适当的方法,取决于组织样本。在最简单的实施例中,可以用水洗涤阵列,水中可含有多种添加剂,例如表面活性剂(例如洗涤剂)、酶等,来帮助清除组织。在一些实施例中,采用含有蛋白酶(及适当的缓冲液)的溶液来洗涤阵列,例如蛋白酶k。在其他的一些实施例中,所述溶液还可以含有,或可选地含有,纤维素酶、半纤维素酶或几丁质酶,例如,当组织样本源自植物或真菌的时候。在进一步的实施例中,洗涤阵列的溶液温度可以是例如至少30℃,优选为至少35、40、45、50或55℃。显然,洗涤溶液对已固定的核酸分子的破坏应当最小化。举例来说,在一些实施例中,核酸分子可以间接地固定在阵列基板上,例如,通过捕获探针和rna之间以及/或者捕获探针和表面探针之间的杂交,因此,洗涤步骤应当不干扰阵列上已固定的分子间的相互作用,即:应当不引起核酸分子的变性。

阵列和组织样本接触的步骤之后,在组织样本的核酸分子,例如rna(优选为mrna)与捕获探针相互杂交的适宜条件下,进行对已杂交的核酸分子的固定(获取)。对已杂交的核酸的固定或获取,包括已杂交核酸的互补链与捕获探针间的共价附着(即:通过核苷酸键,即两个紧邻的核苷酸之间的并置3’-羟基与5’-磷酸盐末端之间形成的磷酸二酯键),由此标识或标定已捕获的核酸,所述已捕获的核酸带有一个定位域,能与对其进行捕获的特征进行特异结合。

在一些实施例中,对已杂交的核酸(例如单链核酸)进行固定,可以包括延长捕获探针来生成已捕获核酸的副本,例如,从已捕获(已杂交)的rna生成cdna。可知晓,此步骤指的是已杂交核酸的互补链的合成,例如,基于已捕获的rna模版(即杂交于捕获探针捕获域的rna)生成cdna。因此,在捕获探针的延长反应(如cdna生成)的初始步骤中,已捕获(已杂交)的核酸(例如rna)成为延长步骤(例如反转录)的模版。在其他一些实施例中,如下文所述,对已杂交的核酸(例如含部分双链的dna)进行固定,可以包括在已杂交的核酸(例如dna片段)与捕获探针之间进行共价结合,例如,通过连接反应,将捕获探针连接至同捕获探针相杂交的核酸的互补链上。

反转录反应涉及利用反转录酶从rna,优选为mrna(信使rna)合成cdna(dna互补链或dna副本)的步骤。因此,cdna可看作是在组织样本被采集时存在于细胞中的rna的副本,即:所述cdna呈现的是所述细胞在隔离时刻所表达的全部或部分基因。

捕获探针,尤其是捕获探针的捕获域,在为杂交于捕获探针的核酸生成互补链时充当引物,如反转录引物。因此,由延长反应(例如反转录反应)所生成的核酸分子(如cdna)包含了捕获探针序列,即是说,延长反应(如反转录反应)可以看作是一种对组织样本上与阵列的每个特征相接触的核酸(例如转录体)进行间接标记的方法。因此,所有在特定特征上合成的核酸分子,例如cdna,将含有相同的核酸“标签”。

在阵列的每个特征上合成的核酸分子(如cdna),可以代表与该特征相接触的组织样本的区域或面积上的基因组或表达的基因,例如一种组织、细胞类型、细胞群或其细胞亚群,还可以进一步代表特定条件下所表达的基因,例如在特定时刻、特定环境、特定发育阶段或响应特定刺激等。因此,任一单个特征上的cdna可能代表着单个细胞中表达的基因,或,在该特征与样本的细胞连接处相接触的情况下,其cdna可能代表多个细胞中的基因。类似地,如果单个细胞与多个特征相接触,那么每个特征可能代表所述细胞中所表达基因中的一部分。类似地,在一些实施例中,所述已捕获的核酸是dna,任一单个特征可能代表单个或多个细胞的基因组。可选地,单个细胞的基因组可以由多个特征所代表。

捕获探针的延长步骤,例如反转录,可以利用本领域的许多适当的酶和操作流程中的任一种来实施,如下文所述。但是,显然,无需为核酸(如cdna)第一链的合成提供引物,因为捕获探针的捕获域即充当了该引物,例如反转录引物。

优选地,本发明的范围中,被绑定的核酸(即:与捕获探针共价结合的核酸)(例如cdna)经处理含有双链dna。但是,在一些实施例中,已捕获的dna可能已经含有双链dna,例如,在含有部分双链的dna片段与捕获探针相连接的情况下。从已捕获核酸生成双链dna的处理步骤可以在仅生成dna(如cdna)第二链的单一反应中完成,即:只生成双链的dna分子而不增加双链dna分子的数量,或在扩增反应中生成第二链的多个副本,所述副本可以是单链dna(例如,线性扩增)或双链dna(例如cdna)(例如,指数扩增)。

第二链dna(例如cdna)的合成步骤可以在阵列上原位进行,既可以是单独的第二链合成步骤,例如如下文中详述的采用随机引物,也可以作为扩增反应的初始步骤。可选地,可以从阵列上释放dna(例如cdna)的第一链(所述第一链含有或说结合了捕获探针),然后再进行第二链合成,例如,在溶液中进行反应,可以作为一个单独步骤或作为扩增反应中的一个步骤。

当第二链合成在阵列上(即原位)进行时,本方法可以包括一个可选的步骤,即在第二链合成前移除已捕获的核酸,如rna,例如采用rna硝化酶(rnase),如rnaseh。此步骤的操作流程为本领域所熟知并有记载。但是,此步骤一般并无必要,且在大多数情况下,rna会自然降解。从阵列上除去组织样本的步骤,一般也会移除阵列上的rna。若想要增加rna移除的强度,可采用rnaseh。

举例来说,在含有大量rna的组织样本中,生成双链cdna的步骤可以产生足量的cdna,(从阵列释放后)可直接用于测序。在这种情况下,cdna第二链合成可以如下文所述,通过本领域所知的任何方法来完成。第二链合成反应可以在将cdna固定在阵列上的同时,或优选地,在cdna从阵列基本上释放之后,直接在阵列上进行,如下文所述。

在其他的实施例中,有必要增加(即扩增)已绑定的核酸(例如合成的cdna),以产生足够进行dna测序的数量。在该实施例中,已绑定核酸(例如cdna分子)的第一链,还含有阵列特征的捕获探针,充当了扩增反应中的模版,例如,聚合酶链式反应。该扩增反应的第一反应产物是dna(如cdna)的第二链,其自身便可充当扩增反应进一步循环的模版。

如上所述的任一实施例中,dna(如cdna)的第二链含有捕获探针的互补链。如果捕获探针含有通用域,尤其在该通用域中含有扩增域,则其可以用在dna(例如cdna)的后续扩增反应中,例如该扩增反应可以包括含有与扩增域相同序列的引物,即与扩增域的互补链互补(即杂交)的引物。在捕获探针上,扩增域处于定位域的上游(在已绑定的核酸如cdna第一链中),从此角度来看,定位域的互补链将并入dna(例如cdna分子)的第二链中。

在一些实施例中,dna(例如cdna)的第二链在单一反应中生成,第二链合成可以通过任何适当的方法达成。举例来说,从阵列基板上释放的cdna的第一链,优选地但非必需地,可以用随机引物(例如六聚体引物)和dna聚合酶,优选为链置换聚合酶(例如klenow(exo)),在适宜进行模版化dna合成的条件下加以培养。该过程将产生各种长度的双链cdna分子,并不大可能生成完整长度的cdna分子,即与作为合成模板的整个mrna相对应的cdna分子。随机引物会与cdna分子第一链的随机位点(即在序列中而不是序列末端)杂交。

倘若想要生成完整长度的dna(例如cdna)分子,即与整个已捕获的核酸(例如,rna分子)相对应的分子(若该核酸如rna在组织样本中部分降解,则已捕获的核酸分子,例如rna,将不会是“完整长度”的转录体,也不会与基因组dna的初始片段长度相同),那么,可以对已0绑定的核酸分子(如cdna第一链)进行修饰。举例来说,可以为cdna分子的3’端连接一个连接子或接合体。该步骤可以采用单链合成酶来完成,例如t4rna连接酶或circligasetm(epicentrebiotechnologies)。

可选地,可以利用双链连接酶,例如t4dna连接酶,将一个助手探针(能够与cdna分子第一链的3’端相杂交的部分双链dna分子)与已绑定的核酸(如cdna第一链)分子的3’端相连接。本领域中还有其他适合用于该链接步骤的已知酶,包括例如tthdnaligase、taqdnaligase、thermococcussp.(strain9°n)dnaligase(9°ntmdnaligase、newenglandbiolabs)和ampligasetm(epicentrebiotechnologies)。所述助手探针还含有一个特定序列;利用助手探针与已绑定的核酸(如cdna第一链)相连接的部分的互补链作为引物,可从所述特定序列引导dna(例如cdna)分子的第二链合成。进一步,一种可选方法包括使用末端转移酶活性酶来将聚核苷酸尾(例如poly-a尾)并入被结合的核酸(例如cdna第一链)分子的3’端。第二链合成可以用poly-t引物来引导,所述引物也可以含有特定扩增域,用于进一步扩增。生成“全长”双链dna(例如cdna)分子(或最大长度第二链合成)的其他方法为本领域所熟知。

在一些实施例中,第二链合成可以采用模板转换的方法,例如,采用的smarttm技术。smart(rna模版5’端转换装置,即switchingmechanismat5’endofrnatemplate)技术已在本领域中发展完善,该技术基于ii(invitrogen)等反转录酶能够在延长的cdna分子的3’端添加若干核苷酸的发现,即生成在3’端悬有单链dna的dna/rna杂交产物。该外悬dna可以提供一条目标序列,作为寡核苷酸探针的杂交目标,为cdna分子的进一步延长提供附加的模版。优选地,与外悬的cdna杂交的寡核苷酸探针含有一个扩增域序列,所述扩增域序列的互补链并入cdna第一链合成产物。含有扩增域序列的引物,将与并入cdna第一链的互补扩增域序列杂交;可以将所述引物加入反应混合物引导第二链合成,并使用适当的聚合酶和cdna第一链作为模版。该方法避免了将接合体连接到cdna第一链3’端的要求。虽然模版转换法最初是为具有5’帽结构的全长mrnas而开发,该方法已被证明可以同样良好运用于无帽结构的截短mrnas。因此,模板转换可以用于本发明的方法中,以生成全长和/或部分或截短的cdna分子。因此,在本发明的一个优选实施例中,第二链的合成可以利用模版转换,或通过模版转换完成。在一个特定优选实施例中,原位实施(即在捕获探针仍旧直接或间接固定于阵列的同时)模版转换反应,即进一步延长cdna第一链以并入互补扩增域的反应。优选地,第二链合成反应也原位实施。

在一些实施例中,可能有必要,或优选地,增加、丰富或扩增dna(例如cdna)分子,则可以将扩增域并入dna(例如cdna)分子。如上所述,当捕获探针具有含扩增域的通用域时,第一扩增域可以并入被绑定的核酸分子,例如cdna分子的第一链。在这些实施例中,第二链合成可以合并第二个扩增域。举例来说,用于生成cdna第二链的引物,例如,随机六聚体引物,poly-t引物、与助手探针互补的引物,可能在5’端含有扩增域,即可以与扩增引物杂交的核苷酸序列。因此,所得的双链dna可以在双链dna(例如cdna)分子的两个5’端,或靠近两个5’端的方向上,含有一个扩增域。这些扩增域可以用做扩增反应(如pcr)中引物的目标。可选地,与被绑定的核酸分子(例如cdna第一链分子)的3’端连接的连接子或接合体,可以含有第二个通用域,所述通用域含有第二个扩增域。类似地,第二个扩增域可以通过模版转换并入cdna第一链分子。

在一些实施例中其捕获探针不含有通用域,尤其是含有扩增域的通用域,则可以按照前文描述合成cdna分子的第二链。所得双链dna分子产物可以通过修饰,在dna(例如cdna)分子的第一链的5’端合并一个扩增域,以及并入dna(如cdna)第二链的5’端(第二个扩增域),如果后者未在dna(如cdna)第二链合成步骤中完成的话。此类扩增域可以通过例如将双链接合体连接至dna(如cdna)分子的末端来并入。该链接步骤适用的酶为本领域所知,包括例如tthdna连接酶、taqdnaligase、thermococcussp.(9°n菌株)dnaligase(9°ntmdna连接酶,newenglandbiolabs)、ampligasetm(epicentrebiotechnologies)和t4dna连接酶。在一个优选实施例中,第一和第二扩增域含有不同的序列。

由上可知,显然,通用域可以含有扩增域,能通过本领域中的各种方法、技术及技术组合添加到已绑定(即已延长或连接)的dna(例如cdna)分子或其互补链(例如第二链)上,例如,通过使用含有此域的引物、接合体的连接反应、末端转移酶的使用和/或模版转换方法。如上述可知,此类结构域可以在dna分子从阵列上释放之前或之后添加。

从上文叙述中可见,显然,从按照本发明的方法合成的单一阵列中的所有dna(例如cdna)分子可以全部含有相同的第一和第二扩增域。由此一来,单一的扩增反应,例如pcr,便足以扩增所有的dna(例如cdna)分子。因此,在一个优选实施例中,本发明的方法可以含有一个dna(例如cdna)分子的扩增步骤。在一个实施例中,扩增步骤在dna(例如cdna)分子从阵列基板上释放之后实施。在其他的实施例中,扩增反应可以在阵列(即:在阵列上原位)上实施。本领域已知,扩增反应可以在阵列上实施,且已有可实施此类反应的片上热循环仪。因此,在一个实施例中,本领域已知作为测序平台或用于任何形式的序列分析(例如,在下一代测序技术中)的阵列,均可以用作本发明的阵列的基础(例如,illumina微珠阵列等)。

对于dna(例如cdna)第二链的合成,如果从阵列基板上释放的cdna含有部分双链核酸分子,则优选采用链置换聚合酶(例如,φ29dna聚合酶、bst(exo-)dna聚合酶、klenow(exo-)dna聚合酶)。举例来说,在一些实施例中,捕获探针通过表面探针间接固定在阵列基板上,且释放dna(例如cdna)分子的步骤含有一个剪切步骤,则被释放的核酸至少为部分双链(例如,dna:dna、dna:rna或dna:dna/rna杂合物)。为保证cdna第二链合成反应将定位域(特征标识域)的互补链并入dna(例如cdna)第二链,链置换聚合酶是必要的。

显然,从阵列表面或基板上释放至少部分dna(例如cdna)分子或其扩增子的步骤,可以通过许多方法来完成。该释放步骤的主要目的在于产生能合并(或包含)捕获探针的定位域(或其互补链)的分子,以便所述dna(例如cdna)分子或其扩增子能根据其在阵列上的特征(或位置)被“标记”。因此,该释放步骤从阵列上除去了dna(例如cdna)分子或其扩增子,且所述dna(例如cdna)分子或其扩增子合并了定位域或其互补链(通过借由例如捕获探针的延长将其并入已绑定的核酸(例如cdna第一链),并可选地,如果在阵列上进行第二链合成,也拷入dna第二链,或者如果在阵列上进行扩增,便拷入扩增子)。因此,为了生成能够与组织样本的各种区域相关联的序列分析数据,被释放的分子中含有捕获探针的定位域(或其互补链)是必要条件。

由于被释放的分子可以是dna(例如cdna)分子或扩增子的第一链或第二链,且由于捕获探针可以间接固定在阵列上,可知晓,虽释放步骤中可能含有将dna(例如cdna)分子从阵列上剪切的步骤,所述释放步骤并非必需核酸剪切步骤;dna(例如cdna)分子或其扩增子可以仅通过令双链分子变性来释放,例如从cdna第一链释放cdna第二链,或从模版上释放扩增子,或从表面探针释放cdna分子第一链(即:已延长的捕获探针)。相应地,dna(例如cdna)分子可以通过核酸剪切和/或变性(例如,通过加热来令双链分子变性)来从阵列上释放。若在阵列上原位实施扩增反应,则显然需要将变性释放扩增子包含在循环反应中。

在一些实施例中,dna(例如cdna)分子在剪切域处由酶促剪切释放,所述剪切域可以位于捕获探针的通用域或定位域中。如上所述,该剪切域必须位于定位域的上游(5’端方向),以便令被释放的dna(例如cdna)分子中含有定位(标识)域。适宜用于核酸剪切的酶包括限制性内切酶,例如rsal。其他的酶,例如尿嘧啶dna糖基化酶(udg)和dna糖基化-裂解内切酶viii(usertm酶)的混合物,或muty和t7核酸内切酶i的组合,是本发明方法的优选实施方式。

在一个可选实施例中,dna(例如cdna)分子可以通过物理方法从阵列的表面或基板上释放。举例来说,在一些实施例中,捕获探针间接地(例如,通过与表面探针杂交)固定在阵列基板上,那么,破坏核酸分子之间的相互作用就足够了。破坏核酸分子间相互作用的方法,例如令双链核酸分子变性,为本领域所熟知。释放dna(例如cdna)分子的一种直接办法(即将合成的dna(例如cdna)分子从阵列上剥落的方法)是使用能够干扰双链分子的氢键的溶液。在本发明的一个优选实施例中,可以通过热水处理来释放dna(例如cdna)分子,例如,使用温度至少在85℃的水或缓冲液,优选为至少90、91、92、93、94、95、96、97、98、99℃。除足以破坏氢键的温度外,作为一种替代或补充方式,该溶液还可以含有盐、表面活性剂等,进一步动摇核酸分子间的相互作用,达成dna(例如cdna)分子的释放。

可知晓,使用高温溶液,例如90-99℃的水,可能足以破坏用以将捕获探针或表面探针固定在阵列基板上的共价键。因此,在一个优选实施例中,可以通过向阵列施加热水,破坏共价固定的捕获探针或表面探针的方法来释放dna(例如cdna)分子。

不言而喻,被释放的dna(例如cdna)分子(含有被释放的dna(例如cdna)分子的溶液)将被收集起来,用于进一步操作,例如,第二链合成和/或扩增。尽管如此,本发明的方法可以含有收集或回收被释放的dna(例如cdna)分子的步骤。如上所述,在原位扩增的情况下,被释放的分子可以包含已绑定的核酸(例如cdna)的扩增子。

本发明的一些实施例中,可能需要去除所有未延长或未连接的捕获探针。例如,该步骤可能处于从阵列释放dna分子的步骤之后。可以用任何想用或方便的方法来进行此类移除,包括,例如,使用酶来降解未延长或未连接的探针,例如核酸外切酶。

dna(例如cdna)分子或其扩增子从阵列上释放之后,可能已获得如上所述的修饰,接着对其进行分析研究(例如,测定序列,虽然如上所述,并不要求实际的序列测定,但可以使用任何序列分析方法)。因此,可以采用任何核酸分析方法。序列分析步骤可以识别定位域,由此将接受分析的分子定位在组织样本的某个位点上。类似地,可以测定分析对象分子的性质或身份。以此方式,可以测定阵列上乃至组织样本上指定位置的核酸,例如rna。由此一来,该分析步骤可以包括或使用任何方法来辨认分析对象分子(乃至“目标”分子)及其定位域。一般来说,此类方法是序列特异性方法。举例来说,该方法可以使用序列特异性引物或探针,尤其是定位域和/或待检测或待分析的特定核酸分子的特异引物或探针,例如,与待测的核酸分子(如rna或cdna)相对应的dna分子。典型地,在此类方法中,可以使用序列特异性扩增引物,例如pcr引物。

在一些实施例中,可能需要分析目标相关分子的子集或同族,例如,共享序列相似度和/或保守结构域的一种特定蛋白组(例如一种受体蛋白族)的所有编码序列。因此,此述扩增和/或分析方法可以采用简并的或基因家族特异性的引物或探针,来实现与已捕获的核酸或其衍生核酸(例如扩增子)相杂交。在一个特定的优选实施例中,扩增和/或分析方法可以同时采用通用引物(即:所有已捕获序列通用的引物)和简并或对目标分子的子集具有特异性的基因家族特异性的引物。

因此,在一个实施例中,采用了基于扩增反应,特别是基于pcr反应的序列分析方法。

但是,修饰和/或扩增被释放的dna(例如cdna)分子的步骤可能在样本中引入其他的成分,例如,酶、引物、核苷酸等。因此,本发明的方法,可以在序列分析之前,进一步包括一个对含有被释放的dna(例如cdna)分子或扩增子的样本的纯化步骤,例如,移除可能干扰测序反应的寡核苷酸引物、核苷酸、盐等。可以采用任何适当的dna(例如cdna)分子纯化方法。

如上所述,可以对被释放的dna进行直接或间接的序列分析。因此,序列分析基质(可看作是面临序列分析步骤或流程的分子)可以是直接从阵列上释放的分子,或可以是其衍生物。因此,举例来说,在包含测序反应的序列分析步骤中,测序模版可以是从阵列释放的分子或其衍生分子。举例来说,从阵列释放的dna(例如cdna)分子的第一链和/或第二链可以直接进行序列分析(例如测序),即可以直接参与序列分析反应或过程(例如测序反应或测序过程,或作为测序分子或以其它方式辨认的分子)。在原位扩增的情况下,被释放的分子可以是扩增子。可选地,被释放的分子可以在序列分析(例如,测序或其他辨认方式)前,进行第二链合成步骤或扩增步骤。因此,序列分析基质(例如模版)可以是扩增子,或从阵列直接释放的分子的第二链。

双链分子的两条链都可以进行序列分析(例如,测序),但本发明并不限于此,还可以分析(例如,测序)单链分子(例如,cdna)。举例来说,可以采用各种测序技术来进行单分子测序,例如,helicos或pacbio技术,或正在开发中的纳米孔测序技术。因此,在一个实施例中,可以对dna(例如cdna)的第一链进行测序。dna(例如cdna)分子的第一链可能需要经过3’端修饰才能进行单分子测序。该步骤可以通过与处理dna(例如cdna)分子第二链类似的方法完成。此类操作为本领域所知。

本发明的一个优选方面中,序列分析会辨认或揭示部分已捕获的核酸(如rna)序列和定位域的序列。定位域(或标签)的序列会标识捕获mrna等核酸分子的特征。已捕获的核酸分子(例如rna)的序列可以与样本来源生物的序列数据库进行对比,以确定其对应的基因。通过确定组织样本的哪一区域(例如,细胞)与特征接触,便可能确定组织样本的哪一区域正在表达所述基因(或含有该基因,例如,在空间基因组学研究中)。此分析可以用于本发明的方法中制得的所有dna(例如cdna)分子,获得组织样本的空间转录组或基因组。

在一个代表性示例中,可以分析测序数据来将捕获探针按照特定种类分类,例如,按照定位域的序列。例如,该步骤可以通过使用fastx软件工具盒的fastq识别码分解器工具,将序列按照捕获探针定位域(标签)序列分别归入单独文档。可以对每一种类(即来自每一特征)的序列加以分析,以确定转录体的身份。举例来说,可以使用如bastn软件来辨认序列,将序列与一种或多种基因组数据库相比较,优选为组织样本来源生物的数据库。若某数据库序列与本发明的方法制得的序列相似度最高,则将所述数据库序列的身份分配给本发明制得的序列。一般来说,只有确定性为至少1e-6,优选为1e-7、1e-8或1e-9的匹配会被看作是成功辨认。

显然,任何核酸测序方法都可以用于本发明的方法中。但是,所谓的“下一代测序”技术在本发明尤为适用。高通量测序在本发明的方法中尤为有用,因为它对大量核酸在非常短的时间内进行部分测序。从近期爆发式增长的全部或部分得到测序的基因组数量来看,要确定每个分子所对应的基因,并不是非得对制得的dna(例如cdna)分子进行全长测序不可。举例来说,dna(例如cdna)分子各端的前100个核苷酸应该足够用来辨认捕获原核酸(例如mrna)的特征和所表达的基因。从dna(例如cdna)分子的“捕获探针端”的序列反应可以获得定位域的序列以及转录体特异序列数据中至少约20个碱基,优选为30或40个碱基。“非捕获探针端”的序列反应可以获得转录体特异序列数据中至少约70个碱基,优选为80、90或100个碱基。

在一个代表性示例中,测序反应可以基于可逆染色终止剂,例如用于illuminatm技术中。举例来说,dna分子可以先在例如玻璃片或硅片上与引物连接并扩增,形成局部克隆群落(桥式扩增)。加入4种ddntps,并洗除未结合的核苷酸。与焦磷酸测序不同的是,dna一次可以只延长1个核苷酸。用照相机对荧光标记核苷酸拍照,然后用化学方法移除染色剂和dna上的3’端末端封闭物,以便进行下一次循环。可重复该步骤直至获得要求的序列数据。使用这一技术,可以在仅仅一块载片上对上千核酸进行同时测序。

其他高通量测序技术也可以同样适用于本发明的方法,例如,焦磷酸测序。该方法中,dna扩增反应在油溶液(微乳液pcr)中的水滴中进行,每一水滴含有附着于涂有单一引物的微珠之上的单一dna模版,然后形成克隆群落。测序仪器含有许多皮升容量孔,每孔含有一个微珠及测序酶。焦磷酸测序采用荧光素酶发光来检测添加至新生dna的个体核苷酸,并用合并数据生成序列读数。

正在开发中的技术的一个示例,是对dna聚合反应中释放的氢离子的检测。用单一种类的核苷酸关注含有待测序的模版dna链的微孔。若引入的核苷酸与模版的前导核苷酸互补,则将其加入增长中的互补链;随之释放的一个氢离子,触动高灵敏度的离子感应器,从而指示反应的发生。如果模版序列中存在同聚物重复,则单个循环中便会有多个核苷酸得到结合,从而引起对应数量的氢离子的释放,以及成比例的较高电信号。

因此,显然未来的测序形式正在缓慢地成为可用形式;这些平台的主要特点之一在于运行时间更短,显然,其他的测序技术将来也会用于本发明的方法中。

本发明的一个必要特点,如上所述,是将已捕获的核酸分子的互补链结合在捕获探针上的步骤,例如,对已捕获的rna分子进行反转录。反转录反应为本领域所熟知,且代表性的反转录反应中,反应混合物包括反转录酶、dntp和适当的缓冲液。反应混合物可以含有其他成分,例如rnase抑制物。引物和模版分别是捕获探针的捕获域和已捕获的rna分子,如上所述。在所述方法主题中,典型地,每种dntp的用量在10-5000μm之间,通常是从约20-1000μm。显然,可以使用dna聚合酶活性的酶,通过等同的反应来生成捕获的dna分子的互补链。此类反应为本领域所熟知,且下文中将会进一步详细叙述。

所需的反转录酶活性可以由一种或多种不同的酶来提供,其中适合的例子有:m-mlv、mulv、amv、hiv、arrayscripttm、multiscribetm、thermoscripttm以及i、iiiii酶。

反转录酶反应可以在任何适当温度下进行,取决于酶的性质。典型地,反转录酶反应在37-55℃间实施,但此范围之外的温度也可能适合。反应时间可以短至1、2、3、4或5分钟,或者长达48小时。典型地,反应时间在5-120分钟之间,根据选择,优选为5-60、5-45或5-30分钟,或者1-10或1-5分钟。反应时间并非关键因素,根据意愿可以采用任何的反应时间长度。

如上所述,本方法的某些实施例包括扩增步骤,用以增加所制得的dna(例如cdna)分子的拷贝数,例如为了充实样本,以更好地表现从组织样本中捕获的核酸(转录体)。根据需要,扩增反应可以是线性的或者指数的,适用的代表性扩增反应操作流程包括,但不限于,聚合酶链式反应(pcr);等温扩增反应,等等。

聚合酶链式反应(pcr)为本领域所熟知,如申请号为4,683,202;4,683,195;4,800,159;4,965,188和5,512,462的美国专利中所述,所述专利以援引的方式并入本公开。在代表性的pcr扩增反应中,反应混合物含有上述从阵列释放的dna(例如cdna)分子,所述dna(例如cdna)分子与一种或多种用于引物延长反应中的引物合并,例如,与第一和/第二扩增域相杂交的pcr引物(例如用于几何(或指数)扩增反应的正向引物和反向引物,或用于线性扩增反应的单个引物)。与被释放的dna(例如cdna)分子(方便起见,下文中称为模版dna)相接触的寡核苷酸引物将具有足够的长度,来支持退火处理条件下与互补模板dna的杂交反应(下文中将更详细叙述)。引物的长度取决于扩增域的长度,但总地来说至少有10bp,通常至少15bp,更常见的是至少16bp长,且可以长达30bp或以上;引物的长度范围一般可在18-50bp之间,通常是约20-35bp。模版dna可以与单个引物或一对引物(正向引物和反向引物)接触,取决于是否需要进行模版dna的引物延长、线性或指数扩增。

除上述成分以外,本方法主题中制得的典型反应混合物还包括聚合酶和脱氧核糖核酸三磷酸盐(dntps)。可以通过一种或多种不同的聚合酶来提供所需的聚合酶活性。在许多实施例中,反应混合物至少包括a族(familya)聚合酶,且适用的典型a族聚合酶包括,但不限于:栖热水生菌(thermusaquaticus)聚合酶,包括天然聚合酶(taq)及其衍生物和同系物,例如klentaq(如barnesetal,proc.natl.acad.sciusa(1994)91:2216-2220所述);嗜热细菌(thermusthermophilus)聚合酶,包括天然聚合酶(tth)及其衍生物和同系物,以及类似物。在某些实施例中,所实施的扩增反应是高保真度反应,反应混合物可以进一步包括具有3’-5’端核酸外切酶活性的聚合酶,例如,可以有b族(familyb)聚合酶提供该酶活性,且适用的b族聚合酶包括,但不限于:海滨嗜热球菌(thermococcuslitoralis)dna聚合酶(vent),如perleretal.,proc.natl.acad.sci.usa(1992)89:5577-5581所述;热球菌属物种gb-d(pyrococcusspeciesgb-d)(deepvent);如lundbergetal.,gene(1991)108:1-6所述的激烈热球菌(pyrococcusfuriosus)dna聚合酶(pfu),乌兹炽热球菌(pyrococcuswoesei)(pwo)以及类似物。若反应混合物中同时含有a族和b族聚合酶,则反应混合物中的a族聚合酶的含量可以高于b族聚合酶,其活性差通常至少为10倍,更常见的是至少约100倍。一般来说,反应混合物包括4中不同类型的dntps,与4种天然碱基相对应,即datp、dttp、dctp和dgtp。在本方法主题中,典型地,每种dntp的含量范围约在10-5000μm,通常在约20-1000μm之间。

本方法主题的反转录酶和/或扩增反应步骤中制得的反应混合物可以进一步包括一种水性缓冲介质,所述介质中含有一价离子源、二价阳离子源和缓冲剂。可以采用任何便于使用的一价离子源,例如kcl、醋酸钾、醋酸铵、谷氨酸钾、nh4cl、硫酸铵及类似物。二价阳离子可以是镁、锰、锌及类似物,且阳离子一般是镁。任何便利的镁离子源都可以采用,包括mgcl2、醋酸镁及类似物。缓冲液中mg2+的含量范围可以在0.5-10mm之间,但优选范围在3-6mm之间,理想值为5mm。缓冲液中可能存在的代表性缓冲介质或盐类包括三羟甲基氨基甲烷(tris)、三甲基甘氨酸(tricine)、羟乙基哌嗪乙磺酸(hepes)、丙磺酸(mops)及类似物,其中缓冲剂的典型含量范围在约5-150mm之间,通常为约10-100mm之间,更常见的是约20-50mm,且在某些优选实施例中,缓冲介质的含量足以提供约为6.0-9.5的ph范围,其中最为优选的是72℃时ph为7.3。缓冲介质中可以含有的其他介质包括螯合剂,例如edta、egta及类似物。

在本方法主题的各步骤所需的反转录酶、dna延长或扩增反应混合物的制备中,可以按照任何方便的顺序合并各种成分。举例来说,在扩增反应中,可以先向缓冲液中加入引物、聚合酶,然后是模版dna,或者同时混合所有的各种成分来制备反应混合物。

如上所述,本发明的一个优选实施例中,可以通过向核酸分子的末端添加扩增域来修饰dna(例如cdna)分子,该过程可以包括连接反应。当捕获探针间接固定在阵列表面的时候,阵列上捕获探针的原位合成也需要通过连接反应来完成。

如本领域中所知,连接酶催化两个紧邻的核酸间并置的3’-羟基和5’-磷酸末端之间的磷酸二酯键的形成。可以采用任何方便的连接酶,其中适用的代表性连接酶包括,但不限于:热敏性和热稳定性连接酶。热敏性连接酶包括,但不限于,噬菌体t4dna连接酶、噬菌体t7连接酶和大肠杆菌连接酶。热稳定性连接酶包括,但不限于,taq连接酶、tth连接酶和pfu连接酶。热稳定性连接酶可以从嗜热或者极端嗜热的生物中获得,包括但不限于,原核生物、真核生物或古细菌。本发明的方法中可以采用某些rna连接酶。

该链接步骤中,将适当的连接酶和根据必要性和/或医院选用的任何试剂与反应混合物合并,并在适合相关寡核苷酸进行连接反应的条件下维持。连接反应条件为本领域技术人员所熟知。连接反应中,某些实施例中的反应混合物可以保持在约4℃至约50℃,例如在约20℃至约37℃的温度下保持一段时间,所述时间为约5秒钟至约16小时,例如从约1分钟至约1小时。但在其他一些实施例中,反应混合物可以在约35℃至约45℃的范围内,例如从约37℃至约42℃,如在(约)38℃、39℃、40℃或41℃维持一段时间,所述时间范围在约5秒钟至约16小时之间,例如从约1分钟至约1小时,包括从约2分钟至约8小时。在一个代表性实施例中,连接反应混合物包括50mmtris(ph7.5)、10mmmgcl2、10mmdtt、1mmatp、25mg/mlbsa、0.25units/mlrnase抑制物和0.125units/mlt4dna连接酶。在又一个代表性实施例中,采用了2.125mm镁离子、0.2units/mlrnase抑制物和0.125units/mlrnasedna连接酶。反应中所用的接合体含量取决于样本中的dna(例如cdna)分子的浓度,通常在dna(例如cdna)的摩尔含量的10-100倍之间。

在一个代表性示例中,本发明的方法可以含有以下步骤:

(a)将阵列与组织样本相接触,其中所述阵列包括基板,所述基板上直接或间接地固定了多种捕获探针,且每一种类在所述阵列中各占不同位置,且所述探针定向为具有3’自由端,以使所述探针能作为反转录酶(rt)引物,其中所述捕获探针的每一种类都包括一个核酸分子,所述核酸分子在5’至3’方向上包括:

(i)与阵列上的捕获探针位置相对应的定位域,和

(ii)捕获域;

以令组织样本的rna与所述捕获探针相杂交。

(b)对阵列上的组织样本成像;

(c)对捕获的mrna分子进行反转录以生成cdna分子;

(d)洗涤阵列以去除残余组织;

(e)从阵列表面释放至少部分cdna分子;

(f)对释放的cdna分子实施cdna第二链合成;

以及

(g)分析(例如测序)cdna分子的序列。

在一个可选的代表性示例中,本发明的方法可以含有以下步骤:

(a)将阵列与组织样本相接触,其中所述阵列包括基板,所述基板上直接或间接地固定了至少两种捕获探针,且每一种类在所述阵列中各占不同位置,且所述探针定向为具有3’自由端,以使所述探针能作为反转录酶(rt)引物,其中所述捕获探针的每一种类都包括一个核酸分子,所述核酸分子在5’至3’方向上包括:

(i)与阵列上的捕获探针位置相对应的定位域,和

(ii)捕获域;

以令组织样本的rna与所述捕获探针相杂交;

(b)可选地,对组织样本进行补水;

(c)对已捕获的mrna分子进行反转录,以生成cdna分子的第一链,且可选地,合成cdna分子的第二链;

(d)对阵列上的组织样本成像;

(e)洗涤阵列以去除残余组织;

(f)从阵列表面释放至少部分cdna分子;

(g)对释放的cdna分子实施cdna第二链合成;

以及

(h)分析(例如测序)cdna分子的序列。

在一个代表性示例中,本发明的方法可以含有以下步骤:

(a)将阵列与组织样本相接触,其中所述阵列包括基板,所述基板上直接或间接地固定了多种捕获探针,且每一种类在所述阵列中各占不同位置,且所述探针定向为具有3’自由端,以使所述探针能充当反转录酶(rt)引物,其中所述捕获探针的每一种类都包括一个核酸分子,所述核酸分子在5’至3’方向上包括:

(i)与阵列上的捕获探针位置相对应的定位域,和

(ii)捕获域;

以令组织样本的rna与所述捕获探针相杂交。

(b)可选地,对阵列上的组织样本成像;

(c)对捕获的mrna分子进行反转录以生成cdna分子;

(d)可选地,若未进行步骤(b)的成像步骤,则对阵列上的组织样本成像;

(e)洗涤阵列以去除残余组织;

(f)从阵列表面释放至少部分cdna分子;

(g)对已释放的cdna分子实施cdna第二链合成;

(h)扩增双链cdna分子;

(i)可选地,纯化cdna分子,以除去可能干扰测序反应的成分;

以及

(j)分析(例如测序)cdna分子的序列。

本发明包括上述方法中各步骤的任何适当组合。可知晓,本发明还包括这些方法的变形,例如,在阵列上进行原位扩增,以及包括了省略成像步骤的方法。

本发明还可以被看做是包括一种制作或生产阵列的方法,所述阵列(i)用于从与其相接触的组织样本上捕获mrna;或(ii)用于确定和/或分析组织样本的(例如,部分或全局)转录组,所述方法包括在阵列基板上直接或间接地固定多种捕获探针,其中所述捕获探针的每一种类都包括一个核酸分子,所述核酸分子在5’至3’方向上包括:

(i)与阵列上的捕获探针位置相对应的定位域,和

(ii)捕获域;

本发明用于生产阵列的方法可以进一步限定为,固定在阵列上的每种捕获探针都作为一个特征。

将捕获探针固定于阵列的方法,可以采用如上所述的任何适当方法来完成。当捕获探针间接固定在阵列上时,捕获探针可以在阵列上合成。所述方法可以含有一个或多个以下任意步骤:

(a)将多种表面探针直接或间接固定在阵列基板上,其中表面探针含有:

(i)能够与部分捕获域寡核苷酸(不用于捕获rna等核酸的部分)相杂交的结构域;

(ii)互补定位域;以及

(iii)互补通用域;

(b)将捕获域寡核苷酸和通用域寡核苷酸与固定在阵列上的表面探针相杂交;

(c)通过模版化的聚合反应,延长通用域寡核苷酸,以生成捕获探针的定位域;以及

(d)将定位域连接至捕获域寡核苷酸,以生成捕获寡核苷酸。

步骤(d)中的连接反应可以与步骤(c)中的延长反应同时进行,因此,该反应并非必须在单独的一步中进行,当然,根据意愿也可以这样做。

按照本发明的上述阵列生产方法制造出来的阵列,其特征可以如上所述进行进一步限定。

虽然如上所述,本发明涉及rna的检测或分析以及转录组的分析或检测,但可知晓,所述原理可以同理应用于细胞dna的检测或分析以及用于基因组研究。因此,从更广阔的视角来看,本发明一般说来可以看做是用于检测核酸,从更具体的方面来说,可以看作是提供了dna的分析或检测方法。空间信息可能会对基因组学相关研究具有价值,即带空间解析度的dna分子检测和/或分析。根据本发明,这可以通过基因组标签来达成。此类局部或空间检测方法可以会在例如组织的不同细胞或区域中的基因组变异研究中有用,例如比较正常和病态细胞或组织(如正常vs.肿瘤细胞或组织),或研究疾病进程中的基因组变化等。举例来说,肿瘤细胞可以包含具有不同的基因组变异体的细胞异源种群(例如,变异和/或其他基因异常,如染色体重排、染色体扩增/删除/插入等)。不同细胞中基因组变异或不同基因组位点的局部检测,在这样的情况下会有用,例如,研究基因组变异的空间分布。此方法的一个主要用途在于肿瘤分析。例如,在本发明的范围中,可以制备出为捕获一个特征的整个细胞的基因组所设计的阵列。因此,可以比较组织样本的不同细胞。显然,本发明并不局限于这一设计,而可能存在其他可能的变化方式,其中对dna进行局部检测,且阵列上dna的捕获位置与组织样本的某个位置或位点相关联。

相应地,在一个更广泛的方面,本发明可以看作是提供了组织样本中核酸的局部检测方法,包括:

(a)提供一种阵列,所述阵列包括基板,所述基板上直接或间接地固定了多种捕获探针,令每一种类探针在所述阵列中各占不同位置且定向为具有3’自由端,以使所述探针能充当延长反应或引物连接反应的引物,其中所述捕获探针的每一种类都包括一个核酸分子,所述核酸分子在5’至3’方向上包括:

(i)与所述阵列上的所述探针的位置对应的定位域,和

(ii)捕获域;

(b)令所述阵列与组织样本接触,以使得阵列上捕获探针的位置能与所述组织样本上的某个位置相关联,并允许组织样本上的核酸与所述捕获探针的捕获域杂交;

(c)以所述捕获探针作为延长引物或连接引物,从已捕获的核酸分子上生成dna分子,其中所述被延长或连接的dna分子通过定位域来标记;

(d)可选地,产生一条所述被标记dna的互补链,和/或可选地,扩增所述被标记dna;

(e)从所述阵列表面释放至少部分被标记dna分子和/或他们的互补链或扩增子,其中所述部分包括定位域或其互补链;

(f)直接或间接分析被释放dna分子的序列(例如,测序)。

如上文中更为详细的描述,任何核酸分析方法都可以用来进行分析步骤;典型地,可以包括测序,但实施序列确定并不是必要的。例如,可以采用序列特异性的分析方法。例如可以实施序列特异性的扩增方式,如使用定位域特异性的引物和/或针对特定目标序列的引物,例如,待测的特定目标dna(即:与特定的cdna/rna、基因、基因变异体、基因组位点或基因组变异体等相对应的dna).一种范例分析方法是序列特异性pcr反应。

步骤(f)中获得的序列分析(例如测序)信息可以用于获得样本的核酸相关的空间信息。换句话说,序列分析信息可以提供样本的核酸的位置相关信息。该空间信息可以来自已确定或辨认的序列等的分析信息,例如可以揭示特定核酸分子的存在,该特定核酸分子的存在可能本身在所用组织样本中就含有有用空间信息,和/或可以结合组织样本在阵列上的位置与序列分析信息来推定空间信息(例如,空间定位)。但是,如上所述,可以通过将序列分析数据与组织样本的图像相关联来方便地获取空间信息,这体现在本发明的一个优选实施例中。

相应地,在一个优选的实施例中,本方法还可以包括如下步骤:

(g)将所述阵列分析信息与所述组织样本图像相关联,其中组织样本在步骤(c)之前或之后成像。

步骤(a)中涉及的引物延长反应可以限定为聚合酶催化的延长反应,其作用在于,获取与捕获探针共价连接的已捕获核酸分子的互补链,也就是,以捕获探针作为引物和以已捕获的核酸作为模版,合成互补链。换句话说,所述延长反应可以是通过任何聚合酶来实施的任何引物延长反应。所述核酸可以是rna或dna。相应地,所述聚合酶可以是任何聚合酶;可以是反转录酶或dna聚合酶。连接反应可以通过任何连接酶实施,其作用在于将已捕获的核酸分子的互补链绑定在捕获探针上,即:其中已捕获的核酸分子(杂交于捕获探针上)含部分双链,且其互补链与捕获探针相连接。

这一方法的一个优选实施例,即为如上所述用于转录组的确定和/或分析或者用于rna测定的方法。在一个替代方式的优选实施例中,所述待测核酸分子为dna。在此种实施例中,本发明提供了一种组织样本中dna的局部检测方法,包括:

(a)提供包括基板的阵列,所述基板上直接或间接地固定了多种捕获探针,且每一种类在所述阵列中各占不同位置,且其方向上具有3’自由端,以使所述探针能作为引物引导引物延长反应或引物连接反应,其中所述捕获探针的每一种类都包括一个核酸分子,所述核酸分子在5’至3’方向上包括:

(i)与所述阵列上的所述探针的位置对应的定位域,和

(ii)捕获域;

(b)将所述阵列与组织样本接触,以使得阵列上的捕获探针的位置能和所述组织样本上的位置相关联,并允许所述组织样本上的dna与所述捕获探针的捕获域杂交;

(c)将所述组织样本中的dna片段化,其中所述片段化在阵列与组织样本相接触的步骤(b)之前、之中或者之后实施;

(d)以已捕获的dna片段作为模版,通过引物延长反应来延长所述捕获探针,或通过连接反应将已捕获的dna片段连接在捕获探针上,以产生dna分子,其中所述被延长或连接的dna分子通过定位域来标记;

(e)可选地,产生一条所述被标记dna的互补链和/或可选地,扩增所述被标记dna;

(f)从所述阵列表面释放至少部分被标记dna分子和/或他们的互补链或扩增子,其中所述部分包括所述定位域或其互补链;

(g)直接或间接分析被释放dna分子的序列。

该方法还可以进一步包括以下步骤:

(h)将所述阵列分析信息与所述组织样本的图像相关联,其中组织样本在步骤(d)之前或之后成像。

在空间基因组学研究中,且目标核酸是dna时,某些情况下优选包括成像步骤以及图像关联步骤。

在一些捕获dna的实施例中,所述dna可以是细胞中出现的任何dna分子。因此,它可以是基因组(即细胞核的)dna、线粒体dna或质粒dna,如叶绿体dna。在一个优选实施例中,所述dna为基因组dna。

可知晓,当在步骤(b)所述接触(即在组织样本放置于阵列上)之后才实施片段化时,dna的片段化发生于同捕获域相杂交之前。换句话说,dna片段与所述捕获探针的捕获域相杂交(或更具体地说,允许杂交)。

本发明在此方面的一个特定实施例中,优选地,但并非必须地,可以为组织样本的dna片段引入一个结合域,来允许或促进阵列上的捕获探针对所述片段的捕获。相应地,所述结合域能够与捕获探针的捕获域杂交。因此,所述结合域可以被看做是捕获域的互补链(即:可以被看做是互补捕获域),但并不要求捕获域和结合域之间的绝对互补,仅要求结合域的互补程度足以允许有效杂交的发生,即:令组织样本中的dna片段能够与捕获探针的捕获域相杂交。引入这样一个结合域,可以保证样本dna直到片段化步骤之后才与捕获探针结合。可以通过本领域熟知的操作流程向dna片段提供结合域,例如,通过令可含有结合域的接合体或连接子序列相连接。举例来说,可以使用含有一个伸出端的连接子序列。结合域可以存在于此连接子的单链部分,以便于接下来该连接子与dna片段的连接;含有结合域的单链部分能用于与捕获探针的捕获域的杂交。可选地,在一个优选实施例中,可以通过末端转移酶引入聚核苷酸尾(例如,同聚体尾,如poly-a结构域)来引入结合域。该步骤可以通过使用与上述rna方法中引入通用域的类似操作来实施。因此,在优选的实施例中,可以引入一个共同结合域。换句话说,就是所有dna片段共同的结合域,可以用于达成阵列上的片段捕获。

实施加尾反应来引入(共同)结合域时,可以保护阵列上的捕获探针不受加尾影响,即:可如前文封闭或遮蔽捕获探针。该步骤可以通过,例如用封闭寡核苷酸与捕获探针杂交来达成,例如与捕获探针的伸出端(如单链部分)杂交。举例来说,当捕获域含有poly-t序列时,该封闭寡核苷酸可以是poly-a寡核苷酸。该封闭寡核苷酸可以含有已封闭的3’端(即:无法延长或加尾的一端)。如上所述,对捕获探针,还可以通过化学和/或酶促修饰的方法来加以保护,即加以封闭。

当按照前文通过连接子的连接反应来引入结合域时,可知晓,与其延长捕获探针来生成一个含有捕获探针引物的定位标签的已捕获dna片段互补副本,还可以将dna片段连接至捕获探针3’端。如上所述,连接反应要求待连接的5’端磷酸化。相应地,在一个实施例中,新增的连接子的5’端,即将要连接至捕获探针的一端(即新增至dna片段的连接子的非伸出端),会经过磷酸化。在该连接反应的实施例中,相应地,可知晓,可以将一个连接子连接到双链dna片段上,所述连接子具有含有结合域的单链伸出3’端。与阵列接触之时,所述伸出端便与捕获探针的捕获域相杂交。该杂交反应将捕获探针的3’端与新增的连接子的5’端(非伸出端)并置及连接。因此,捕获探针,乃至定位域,都通过该连接反应并入已捕获的dna片段。该实施例的原理如图21所示。

因此,在一种更具体的实施方式中,本发明在该方面的方法可以包括:

(a)提供包括基板的阵列,所述基板上直接或间接地固定了多种捕获探针,每一种类在所述阵列中各占不同位置,且定向为具有3’自由端,以使所述探针能充当延长反应或引物连接反应的引物,其中所述捕获探针的每一种类都包括一个核酸分子,所述核酸分子在5’至3’方向上包括:

(i)与阵列上的探针位置对应的定位域,和

(ii)捕获域;

(b)将所述阵列与组织样本接触,以使得阵列上的捕获探针的位置能和所述组织样本上的位置相关联;

(c)将所述组织样本中的dna片段化,其中所述片段化在阵列与组织样本相接触的步骤(b)之前、之中或之后实施;

(d)为所述dna片段引入一个结合域,所述结合域可以与所述捕获域杂交;

(e)允许所述dna片段与所述捕获探针的捕获域杂交;

(f)以已捕获的dna片段作为模版,通过引物延长反应延长所述捕获探针,或通过连接反应将已捕获的dna片段连接在捕获探针上,以生成dna分子,其中所述被延长或连接的dna分子通过定位域来标记;

(g)可选地,产生一条所述被标记dna的互补链和/或可选地,扩增所述被标记dna;

(h)从所述阵列表面释放至少部分被标记dna分子和/或他们的互补链或扩增子,其中所述部分包括所述定位域或其互补链;

(i)直接或间接分析被释放dna分子的序列。

可选地,该方法还可以进一步包括以下步骤:

(j)将所述阵列分析信息与所述组织样本的图像相关联,其中组织样本在步骤(f)之前或之后成像。

如上所述的核酸或dna检测方法中,生成被标记核酸/dna的互补副本亦或扩增被标记dna的可选步骤,可以包括按照前文rna/转录组分析/检测方法中所述的原理,使用链置换聚合酶。适当的链置换聚合酶如上所述。该步骤的目的在于,保证定位域被复制引入所述互补副本或扩增子,尤其是在捕获探针通过与表面探针杂交固定在阵列上的情况下。

但是,本步骤中,链置换聚合酶的使用并不是必要的。举例来说,可以同时利用非链置换聚合酶和与定位域杂交的寡核苷酸的连接反应。该流程类同于上述捕获探针在阵列上的合成。

在一个实施例中,本发明的方法可以用于确定和/或分析组织样本的全部基因组,例如,组织样本的全基因组。但是,本方法并不限于此,还包括确定和/或分析全部或部分基因组。因此,本方法可以包括确定和/或分析基因组的部分或子集,例如,对应于染色体的一个基因子集或基因群的部分基因组,如特定基因群或染色体群、或基因组的特定区域或部分,例如涉及某一特定疾病、状况、组织类型等。因此,本方法可以用于检测或分析肿瘤组织与正常组织相比之下的基因组序列或基因组位点,或者甚至一个组织样本中的不同细胞类型。还可以检测不同细胞、细胞群、组织、局部组织、组织类型的不同基因组变异或位点的存在、缺失、分布或定位。

从另一方面来看,本方法的上述步骤可以看作是提供了一种获取关于核酸的空间信息的方法,例如组织样本的基因组序列、变异体或位点。换句话说,本发明的方法可以用于标记(或标识)基因组,尤其是个体或空间分布的基因组。

从另一角度来看,本发明的方法可以看作是一种组织样本的dna的空间检测方法,或一种以空间解析度检测dna的方法,或一种对组织样本的dna进行局部或空间确定和/或分析的方法。尤其是,本方法可以用于组织样本中基因或基因组序列或基因组变异体或位点(例如,基因组变异体或位点的分布)的局部或空间检测、确定和/或分析。局部/空间检测/确定/分析的意思是,可以对组织样本dna在细胞或组织中的原生位置或位点进行定位。因此,举例来说,可以将dna在样本中的一个细胞、细胞群或细胞类型,或组织样本的特定区域进行定位。可以确定dna(或换句话说,组织样本中dna的位点或位置)的原生位点或位置,例如基因组变异体或位点。

因此,可知晓,本发明的阵列可以用于捕获核酸,例如,与所述阵列相接触的组织样本dna。该阵列还可以用于确定和/或分析组织样本的部分或全局基因组,或用于获取组织样本中含空间限定信息的部分或全局基因组。因此,本发明的方法可以被看做是组织样本中一种或多种基因组序列(或变异体,或基因位点)的空间分布的量化方法。换句话说,本发明的方法可以用于检测组织样本中一种或多种基因组序列、基因组变异体或基因组基因位点。再换句话说,本发明的方法可用于同时确定组织样本中一种或多种基因组序列、基因组变异体或基因组基因位点的位置或分布。更进一步地,该方法可以看做是以空间解析度,例如二维空间解析度,对组织样本的核酸(如dna))进行部分或全局分析的方法。

本发明还可以看作是为本发明的方法提供一种阵列,所述阵列包括基板,所述基板上含有多种直接或间接固定的捕获探针,且每种探针在阵列上占据不同位置并定向为具有自由3’端,以能令所述探针具有延长引物或连接引物的作用,其中所述捕获探针的每个种类都含有一个核酸分子,所述核酸分子在其5’至3’端的方向上含有:

(i)定位域,与阵列上的捕获探针的位置相对应,以及

(ii)捕获域,用于捕获与所述阵列相接触的组织样本的核酸。

在其中一个方面中,已捕获的核酸分子为dna。捕获域可以针对待检测的一种特定dna或dna的特定种类、群组具有特异性,例如,按照前文所述rna检测的类同方法,令捕获域与目标dna特定基元序列,如保守序列,进行特异性杂交。可选地,可以为待捕获的dna引入一个结合域,例如,如上所述的共同结合域,所述结合域可以被捕获探针的捕获域识别。因此,如上所述,结合域可以是例如同聚物序列,如poly-a。同样地,可以按照类似前文所述设计rna/转录组分析或检测的原理和方法来获得该结合域。在此情形下,捕获域可以与被引入组织样本dna分子的结合域互补。

如前文rna相关内容所述,捕获域可以是一个随机或简并序列。因此,可以通过令dna与一个随机或简并捕获域结合,或与含有至少部分随机或简并序列的捕获域结合,来捕获dna。

在一个相关的方面,本发明还提供一种阵列的应用,包括基板,所述基板上直接或间接固定了多种捕获探针,每种探针在阵列上居于不同位置且定向为具有3’端自由端,以便使所述探针能够充当延长反应或连接反应的引物,其中所述探针的每个种类都含有一个核酸分子,所述核酸分子在5’至3’端的方向上含有:

(i)定位域,与阵列上的捕获探针的位置相对应,以及

(ii)捕获域;

所述捕获域用于捕获与所述阵列相接触的组织样本的核酸,如dna或rna。

优选地,所述应用用于组织样本核酸的局部检测,且进一步包含以下步骤:

(a)利用所述捕获探针作为延长引物或连接引物,从已捕获的核酸分子生成dna分子,其中所述被延长或连接的分子通过定位域加以标记;

(b)可选地,生成所述被标记核酸的互补链和/或扩增所述被标记的核酸;

(c)从阵列表面释放至少部分被标记的dna分子和/或其互补链或扩增子,其中所述部分包括定位域或其互补链;

(d)直接或间接分析被释放的dna分子的序列;且可选地

(e)将所述的序列分析信息与所述组织样本的图像相关联,其中所述组织样本的成像完成于步骤(a)。

组织样本dna片段化的步骤可以根据意愿,通过任何本领域所知方法实施。因此,可以采用物理方法实施片段化,例如声波降解法或超声处理。相关化学方法亦已知晓。还可以采用酶促方法实现片段化,例如,利用核酸内切酶,如限制性酶。同样地,该步骤的方法和酶为本领域所熟知。片段化可以在制备待用于阵列的组织样本的步骤(例如制备组织切片的步骤)之前、之中或者之后。方便的是,固定组织的步骤就可能造成片段化。因此,举例来说,福尔马林固定可以造成dna的片段化。其他的固定剂可以带来类似结果。

关于本发明的这些方面中制备和使用阵列的细节,可知晓,前文中所述rna方法中给出的描述和细节也可同理应用于此述的更为广泛的核酸检测和dna检测方法。因此,上述的所有方面和细节同理可用。举例来说,关于反转录酶引物和反应等的论述可同理适用于上述延长引物、聚合酶反应等的任何方面。同样地,cdna第一链和第二链合成的参考方法也可以同理适用于被标记的dna分子及其互补链。序列分析可以采用如上所述的方法。

举例来说,捕获域可以如上述用于捕获探针。含有或仅含有poly-t的捕获域可用于,例如,向dna片段引入含有poly-a序列的结合域的情况。

可为捕获探针/标记dna分子(即:带标记并经延长或连接的分子)引入上述的通用域,例如,用于扩增和/或剪切。

附图说明

下面将结合非限制性的实施例并引用如下附图,对本发明作进一步描述。

图1所示为利用“识别码”寡脱氧胸苷酸探针的阵列来从组织切片捕获mrna并用于转录组分析的整体概念。

图2所示为相应组织切片的转录体丰度可视化的原理示意图。

图3所示为3’至5’表面探针的构成以及间接固定于阵列表面的5’至3’方向的捕获探针的合成。

图4所示为自制阵列的酶促(user或rsal)剪切效率和agilent生产的阵列在99℃热水中的剪切效率,以探针释放后,荧光标记的探针与阵列表面的杂交反应来测定。

图5所示为agilent生产的商品阵列在99℃热水介导下进行dna表面探针释放后所捕捉的荧光图像。热水处理后,进行了荧光检测探针的杂交。最上方的阵列为未处理的对照组。

图6所示为固定于转录组捕获阵列之上的小鼠脑组织切片,已经过cdna合成并分别以胞质染色剂(上,标记为neun)和核酸染色剂(中,标记为nuclei)处理,两种染色剂都展示于合并图像中(下,标记为merge)。

图7所示为表格,列出了示意图所示的低密度自制dna捕获阵列中按来源位点分类的read。

图8所示为一个识别码微阵列中,以核酸和map2特异染色剂染色的ffpe小鼠脑组织。

图9所示为以核酸染色剂(白色)染色的ffpe小鼠脑嗅球及可见形态。

图10所示为以核酸染色剂(白色)染色的ffpe小鼠脑嗅球(约2x2mm),与低分辨率阵列的理论点样格局相重叠。

图11所示为以核酸染色剂(白色)染色的ffpe小鼠脑嗅球(约2x2mm),与中等分辨率阵列的理论点样格局相重叠。

图12所示为ffpe小鼠脑嗅球的小球区域的放大显示(即图9右上部)。

图13所示为在扩增反应中,用由b_handle连接的随机六聚体引物(r6)(b_r6)进行user释放的所得产物;产物以生物分析仪绘制。

图14所示为在扩增反应中,用由b_handle连接的随机八聚体引物(r8)(b_r8)进行user释放的所得产物;产物以生物分析仪绘制。

图15所示为一项在覆盖整个阵列的ffpe脑组织上进行的实验的结果。在表面合成及释放cdna后,以id特异性及基因特异性引物(b2m外显子4)扩增的id5(左)和id20(右);扩增后的id5和id20。

图16所示为实施例4中所述方法的原理的示意图,即固定有载有空间标记序列(定位域)的dna寡核苷酸(捕获探针)的微阵列的使用。所述微阵列的寡核苷酸的每一特征都载有1)特有的标记(定位域)和2)捕获序列(捕获域)。

图17所示为实施例5中以预先片段化为平均大小为200bp的基因组dna来实施所述的空间基因组实验流程所得的实验结果。在阵列上扩增内部产物,标记并合成了dna。测得的峰值大小符合预期。

图18所示为实施例5中以预先片段化为平均大小为700bp的基因组dna来实施所述的空间基因组实验流程所得的实验结果。在阵列上扩增内部产物,标记并合成了dna。测得的峰值大小符合预期。

图19所示为以预先片段化为平均大小为200bp的基因组dna来实施实施例5中所述的空间基因组实验流程所得的实验结果。以表面寡核苷酸所含的一个内引物和一个通用序列对产物进行扩增。在阵列上进行扩增,标记并合成了dna。由于随机片段化和基因组dna的末端转移酶标记会产生极为多样化的样本池,预期产物具有拖尾。

图20所示为以预先片段化为700bp的基因组dna来实施实施例5中所述的空间基因组实验流程所得的实验结果。以表面寡核苷酸所含的一个内引物和一个通用序列对产物进行扩增。在阵列上进行扩增,标记并合成了dna。由于随机片段化和基因组dna的末端转移酶标记会产生极为多样化的样本池,预期产物具有拖尾。

图21所示为连接子连接到dna片段的连接反应示意图,该反应在poly-t捕获域中引入用于杂交的结合域,以达成与捕获探针的后续连接。

图22所示为高密度捕获阵列中所采用的5’至3’方向的捕获探针的构成。

图23所示为高密度阵列的框架,用于组织样本的定向,通过荧光标记探针的杂交可视化。

图24所示为高密度阵列上已剪切和未剪切的捕获探针,其中框架探针由于不含尿嘧啶碱基而未被剪切。捕获探针以与poly-a寡核苷酸链接的荧光素加以标记。

图25所示为以从小鼠嗅球捕获的转录体所制备的文库的生物分析仪制图。

图26所示为从小鼠嗅球所提取的总rna中所捕获的转录体的matlab可视化。

图27所示为采用matlab可视化程序对从小鼠嗅球组织捕获的olfr(嗅觉受体)转录体的全捕获阵列可视化。

图28所示为自制41-id-标记微阵列的喷点格局。

图29所示为捕获具有poly-a尾的基因组片段再进行a431特异性易位后制得的空间基因组文库。

图30所示为在捕获阵列上,在10%和50%上具有峰值的含poly-a尾的基因组片段被捕获后,经过a431特异性易位成为含poly-a尾的u2os基因组片段的检测结果。

图31所示为将在41-id标记的自制阵列上从小鼠嗅球组织所捕获的含id标记的转录体,经matlab可视化后,与组织图像的重叠。为清晰起见,对辨识出特定基因的特定特征加以了圈定。

具体实施方式

实施例1

阵列的制备

以下实验展示了如何将寡核苷酸探针通过其5'或3'端附着于阵列基板上,来得到含有能与mrna杂交的捕获探针的阵列。

制备含5'至3'端方向的探针的自制喷点微阵列

在玻璃载片上点样20个各有标记序列的rna捕获寡核苷酸(标记1-20,表1)作为捕获探针。所述探针以一个5’-端氨基连接子和一个c6间隔子合成。所有的探针均由sigma-aldrich(st.louis,mo,usa)合成。rna捕获探针以150mm的磷酸钠制成浓度为20μm、ph为8.5的悬液,并以nanoplotternp2.1/e喷点系统(gesim,grosserkmannsdorf,germany)在codelinktmactivated微阵列载片(7.5cmx2.5cm;surmodics,edenprairie,mn,usa)上点样。喷点完成后,按照厂家说明书进行表面封闭。所述探针在载片上喷为16个等同阵列,且每个阵列含有一种预设的喷点格局。杂交反应中,所述16个子阵以16格遮光框(chipcliptmschleicher&schuellbioscience,keene,nh,usa)进行分隔。

制备含3'至5'端方向的探针的自制喷点微阵列及合成5'至3'端方向的探针

表面探针寡核苷酸的喷点方法与上文的5'至3'端方向探针的情形相同,且其3’端有一个氨基-c7连接子,如表1所示。

为杂交制取用于捕获探针合成的引物,将含有0.1%sds的4xssc、2μm延长引物(通用域寡核苷酸)和2μm连接引物(捕获域寡核苷酸)的杂交溶液在50℃下培养4分钟。同时,将自制阵列附着于chipclip片基夹(whatman)上。然后,向阵列每孔加入50μl杂交溶液,在50℃和300rpm下培养30分钟。

培养完成后,将阵列从chipclip片基夹上拿下来,按照以下3个步骤洗涤:1)50℃下,以含0.1%sds的2xssc溶液在300rpm摇速下洗涤6分钟;2)以0.2xssc溶液在300rpm摇速下洗涤1分钟;以及3)以0.1xssc溶液在300rpm摇速下洗涤1分钟。然后,将所述阵列甩干,并放回chipclip片基夹。

为进行延长和连接反应(以生成所述捕获探针的定位域),向每孔加入50μl含有10xampligase缓冲液、2.5u扩增型耐热dna聚合酶stoffel片段(amplitaqdnapolymerasestoffelfragment)(appliedbiosystems)、10uampligase(epicentrebiotechnologies)、dntps(fermentas)各2mm和水的酶混合物。然后,将该阵列在55℃下培养30分钟。培养完成后,按照前述阵列洗涤方法对阵列进行洗涤,但步骤1)的持续时间从6分钟改变为10分钟。

所述方法如图3所示。

组织的制备

以下实验展示了如何制备用于本发明方法的组织样本切片。

制备新鲜冷冻组织并切片置于捕获探针阵列上

取新鲜未固定的小鼠脑组织,根据需要切边,以-40℃异戊烷降温冷冻,然后在低温箱中切成10μm薄片。在每个待用捕获指针阵列上放置一片组织切片。

制备福尔马林固定石蜡包埋(ffpe)的组织

取小鼠脑组织,以4%福尔马林在4℃下固定24小时,然后按照如下步骤进行培养:70%乙醇中培养1小时3次;80%乙醇中培养1小时1次;96%乙醇中培养1小时1次;100%乙醇中培养1小时3次;以及二甲苯中室温培养1小时2次。

然后,将脱水样本在低熔点液态石蜡中以52-54℃培养至多3小时,其间更换一次石蜡以洗除残余二甲苯。将完成的组织块在室温下保藏。然后,用超薄切片机在石蜡中将组织切成4μm薄片,置于每个待用的捕获探针阵列上。

所述切片在阵列载片上以37℃干燥24小时,并在室温下保藏。

ffpe组织的脱蜡

附着于codelink载片上的福尔马林固定石蜡包埋的小鼠脑组织10μm切片在二甲苯中脱蜡2次,各10分钟;99.5%乙醇中2分钟;96%乙醇中2分钟;70%乙醇中2分钟;然后风干。

cdna合成

以下实验展示了将捕获在阵列上的组织样本切片mrna用作cdna合成模版。

芯片上的cdna合成

将购自whatman的16孔遮光框和chipclip片基夹与codelink载片连接。cdna的合成采用了购自invitrogen的带含耐热性dna聚合酶的superscripttmii一步rt-pcr体系(superscripttmiiione-steprt-pcrsystemwithtaqdnapolymerase)。每次反应中,将25μl2x反应混合物(即含耐热性dna聚合酶的superscripttmii一步rt-pcr体系)、22.5μl水和0.5μl100xbsa混合并加热至50℃。每次反应向反应混合物中加入2μlsuperscriptiii/platinumtaq酶混合物,且向芯片上每孔加入50μl反应混合物。在50℃下培养芯片30分钟(thermomixercomfort,eppendorf)。

移除孔中的反应混合物,以如下试剂洗涤载片:2xssc,0.1%sds:50℃下10分钟;0.2xssc:室温下1分钟;以及0.1xssc:室温下1分钟。然后将芯片甩干。

对于ffpe组织切片,可在移除组织前对切片进行染色及可视化,见下文关于可视化的部分。

可视化

染色前的荧光标记探针杂交

在放置组织切片前,将荧光标记探针与含有喷至捕获探针阵列上的标记寡核苷酸的特征相杂交。组织可视化后,所述荧光标记探针有助于所得图像的定向,允许所得图像与测序所得的各个捕获探针“标记”(定位域)序列表达谱的合并。为完成荧光探针的杂交,取含0.1%sds的4xssc和2μm检测探针(p)的杂交溶液,在50℃下培养4分钟。同时,将自制序列附着于chipclip片基夹(whatman)。然后,向序列每孔加入50μl杂交溶液,在50℃和300rpm摇速下培养30分钟。

培养完成后,从chipclip片基夹上取下序列,按照下列步骤洗涤:1)2xssc,0.1%sds:50℃和300rpm摇速下6分钟;2)0.2xssc:300rpm摇速下1分钟;以及3)0.1xssc:300rpm摇速下1分钟。然后,将序列甩干。

cdna合成前或合成后对ffpe组织切片的整体组织学染色

对固定在捕获探针序列上的ffpe组织切片,在脱蜡之后、cdna合成之前,如前述步骤进行洗涤和补水,或在cdna合成之后,如前述步骤进行洗涤。然后,按如下步骤处理组织切片:在苏木精中培养3分钟;以去离子水淋洗;在自来水中培养5分钟;快速地浸入酸化乙醇中8-12次;以自来水洗涤2次各1分钟;以去离子水洗涤2分钟;在曙红中培养30秒;在95%乙醇中洗涤3次各5分钟;以100%乙醇洗涤3次各5分钟;以二甲苯冲洗3次各10分钟(可过夜);将盖片覆盖于载片上,以dpx封片;令载片在通风橱中干燥过夜。

cdna合成前或合成后对ffpe组织切片的目标蛋白的整体免疫组织化学染色

对固定在捕获探针序列上的ffpe组织切片,在脱蜡之后、cdna合成之前,如前述步骤进行洗涤和补水,或在cdna合成之后,如前述步骤进行洗涤。然后,按如下步骤处理组织切片,且在整个染色过程中保持切片湿润:以一级抗体(以含1x三羟甲基氨基甲烷缓冲盐水(trisbufferedsaline)(50mmtris,150mmnacl,ph7.6)、4%驴血清和0.1%triton-x的封闭液稀释一级抗体)在湿室中对切片进行室温过夜培养;以1xtbs淋洗3次;以接合荧光素(fitc、cy3或cy5)的配对二级抗体在湿室中对切片进行室温培养1小时。以1xtbs淋洗3次,尽可能地除去tbs后,以prolonggold+dapi(苯基吲哚)试剂(invitrogen)封藏切片,然后以荧光显微镜和匹配滤光片组加以分析。

去除残余组织

冷冻组织

对于新鲜冷冻的小鼠脑组织,cdna合成后的洗涤步骤足以完全去除组织。

ffpe组织

取附有福尔马林固定石蜡包埋的小鼠脑组织切片的载片,装上chipclip片基夹及16孔遮光框(whatman)。取rneasyffpe试剂盒(qiagen)的蛋白酶k消化缓冲液(proteinasekdigestbuffer),每150μl加入10μl蛋白酶k溶液(proteinaseksolution)(qiagen)。向每孔加入50μl最终混合物,并在56℃下培养载片30分钟。

捕获探针(cdna)的释放

以能切除尿嘧啶的user酶混合物的pcr缓冲液释放捕获探针(共价附着的探针)

将16孔遮光框和codelink载片装上chipclip片基夹(whatman)。取50μl含有含1.8mmmgcl2的1x快速启动高保真反应缓冲液(faststarthighfidelityreactionbufferwith1.8mmmgcl2)(roche)、200μmdntps(newenglandbiolabs)和0.1u/1μluserenzyme(newenglandbiolabs)的混合物,加热至37℃后,加入每孔中,并在37℃下进行30分钟培养并混合(300rpm摇速3秒,静止6秒)(thermomixercomfort;eppendorf)。然后,用移液枪从孔中回收含有已释放的cdna和探针的反应混合物。

以能切除尿嘧啶的user酶混合物的tdt(末端转移酶)缓冲液释放捕获探针(共价附着的探针)

取50μl含有1xtdt缓冲液(20mm三羟甲基氨基甲烷乙酸盐(tris-acetate)(ph7.9)、50mm乙酸钾和10mm乙酸镁)(newenglandbiolabs,www.neb.com)、0.1μg/μlbsa(newenglandbiolabs)和0.1u/μluser酶(newenglandbiolabs)的混合物,加热至37℃,加入每孔中,并在37℃下进行30分钟培养并混合(300rpm摇速3秒,静止6秒)(thermomixercomfort;eppendorf)。然后,用移液枪从孔中回收含有已释放的cdna和探针的反应混合物。

以烫水释放捕获探针(共价附着的探针)

将16孔遮光框和codelink载片装上chipclip片基夹(whatman)。用移液枪向每孔注入50μl99℃热水,并反应30分钟。然后,用移液枪从孔中回收含有释放的cdna和探针的反应混合物。

以加热的pcr缓冲液释放捕获探针(原位杂交的合成捕获探针,即与表面探针杂交的捕获探针)

取50μl含有1xtdt缓冲液(20mm三羟甲基氨基甲烷乙酸盐(tris-acetate)(ph7.9)、50mm乙酸钾和10mm乙酸镁)(newenglandbiolabs,www.neb.com)、0.1μg/μlbsa(newenglandbiolabs)和0.1u/μluser酶(newenglandbiolabs)的混合物,预热至95℃后加入每孔中,并在95℃下进行5分钟培养并混合(300rpm摇速3秒,静止6秒)(thermomixercomfort;eppendorf)。然后,从孔中回收含有释放的探针的反应混合物。

以加热的tdt(末端转移酶)缓冲液释放捕获探针(原位杂交的合成捕获探针,即与表面探针杂交的捕获探针)

取50μl含有1xtdt缓冲液(20mm三羟甲基氨基甲烷乙酸盐(tris-acetate)(ph7.9)、50mm乙酸钾和10mm乙酸镁)(newenglandbiolabs,www.neb.com)、0.1μg/μlbsa(newenglandbiolabs)和0.1u/μluser酶(newenglandbiolabs)的混合物,预热至95℃后加入每孔中,并在95℃下进行5分钟培养并混合(300rpm摇速3秒,静止6秒)(thermomixercomfort;eppendorf)。然后,从孔中回收含有释放的探针的反应混合物。

用user酶和加热到99℃的热水处理序列的效率如图4所示。用user酶和rsal酶在前述自制序列上实施酶切(图4)。用热水在agilent制造的商品序列上实施dna表面探针的释放(见图5)。

探针的收集和连接子的引入

下列实验显示,可以对从阵列表面释放的cdna第一链进行修饰,来生产双链dna并进行扩增。

以picoplex全基因组扩增试剂盒来进行全转录组扩增(含定位域(标记)序列的捕获探针序列未保留在所得dsdna末端)

以含能切除尿嘧啶的user酶混合物的pcr缓冲液(对共价附着的探针)或加热的pcr缓冲液(对原位杂交的合成捕获探针,即与表面探针杂交的捕获探针)来释放捕获探针.

按照厂家说明,以picoplex(rubicongenomics)随机引物全基因组扩增方法对释放的cdna进行扩增。

以末端转移酶(tdt)da加尾来进行全转录组扩增(含定位域(标记)序列的捕获探针序列保留在所得dsdna末端)

以含能切除尿嘧啶的user酶混合物的tdt(末端转移酶)缓冲液(对共价附着的探针)或加热的pcr缓冲液(对原位杂交的合成捕获探针,即与表面探针杂交的捕获探针)来释放捕获探针。

取38μl剪切混合物,放入干净的0.2mlpcr管中。所述混合物含有:1xtdt缓冲液(20mm三羟甲基氨基甲烷乙酸盐(tris-acetate)(ph7.9)、50mm乙酸钾和10mm乙酸镁)(newenglandbiolabs,www.neb.com)、0.1μg/μlbsa(newenglandbiolabs)、0.1u/μluser酶(newenglandbiolabs)(不可用于加热释放);已释放的cdna(从表面探针伸出)和已释放的表面探针。向pcr管中加入0.5μlrnaseh(5u/μl,终浓度为0.06u/μl)、1μltdt(20u/μl,终浓度为0.5u/μl)和0.5μldatps(100mm,终浓度为1.25mm)。为进行da加尾,在热循环仪(appliedbiosystems)中以37℃培养pcr管15分钟,再以70℃培养10分钟以令tdt失活。da加尾完成后,制备pcr预混液。所述预混液含有:含1.8mmmgcl2的1x快速启动高保真pcr缓冲液(faststarthifipcrbuffer)(roche)、每种dntp各0.2mm(fermentas)、a(与捕获探针的扩增域互补)和b_(dt)24(eurofinsmwgoperon)(与待连接至cdna第一链3’端的poly-a尾互补)每种引物各0.2μm和0.1u/μl快速启动高保真dna聚合酶(faststarthifidnapolymerase)(roche)。取23μlpcr预混液,放入9只干净的0.2mlpcr管中,向其中8只管中加入2μlda加尾混合物,而向最后1只管中加入2μl水(不含rnase/dnase)(阴性对照)。按照以下程序实施pcr扩增:95℃热启动2分钟,50℃2分钟和72℃3分钟的第二链合成,30个pcr扩增循环,每个循环中依序为95℃30秒,65℃1分钟,72℃3分钟,以及最后延长72℃10分钟。

反应后的清理和分析

将4种扩增子合并,并流经qiaquickpcr净化柱(qiagen)处理,以30μleb(10mmtris-cl,ph8.5)洗脱。以生物分析仪(agilent)对产物进行分析,按照厂家说明书使用dna1000试剂盒。

测序

illumina测序

按照厂家说明书,用样品索引建立用于illumina测序的dsdna文库。用hiseq2000平台(illumina)进行测序。

生物信息学研究

从以da加尾末端转移酶方法扩增的全转录组文库的测序数据中获取数码转录组信息

以fastx工具盒中的fastq识别码分离工具,将测序数据按各自的捕获探针定位域(标记)序列分类整理为各个文件。然后,以tophat映射工具将各个被标记的测序数据映射到小鼠基因组上加以分析。以htseq-count软件处理获取所得sam文件中转录体计数。

从以picoplex全基因组扩增试剂盒方法扩增的全转录组文库的测序数据中获取数码转录组信息用fastx工具盒中的fastq-to-fasta转换工具,将测序数据从fastq格式转换为fasta格式。用blastn工具将测序read与捕获探针的定位域(标记)序列对齐,并将每个标记序列中匹配率优于1e-6的read挑选出来,分别归入各序列标记的单独文件中。然后,用blastn工具将标记序列read文件与小鼠转录组对齐,获取匹配记录。

合并可视化数据和表达谱

利用染色,将各个捕获探针定位域(标记)序列的表达谱与从组织切片获得的空间信息组合起来。如此一来,即可用直接对比的方式来分析从组织切片的细胞区室中获得的转录组信息,还能在预定的结构环境中分辨不同细胞亚型的区别表达特征。

实施例2

图8至图12展示了置于以识别码标示的转录组捕获阵列上的染色ffpe小鼠脑组织(嗅球)切片的成功可视化,操作参照实施例中所述的通用流程。与实施例1中的新鲜冷冻组织的实验相比,图8所示的ffpe组织形态更佳。图9和图10展示了如何将组织定位于不同探针密度类型的阵列上。

实施例3

以随机引物第二链合成和通用端扩增反应进行全转录组扩增(含标记序列的捕获探针序列保留在所得dsdna的末端)

在以含能切除尿嘧啶的user酶混合物的pcr缓冲液释放捕获探针之后(共价附着的探针)

在以加热的pcr缓冲液释放捕获探针之后(原位杂交的合成捕获探针)

向2只管中各加入40μl1x含1.8mmmgcl2的快速启动高保真pcr缓冲液(faststarthifipcrbufferwith1.8mmmgcl2)(ph8.3)(roche,www.roche-applied-science.com)、dntp各0.2mm(fermentas,www.fermentas.com)、0.1μg/μlbsa(newenglandbiolabs,www.neb.com)、0.1u/μluser酶(newenglandbiolabs)、已释放的cdna(从表面探针延长)和已释放的表面探针,再加入1μlrnaseh(5u/μl)。然后,将2只管在热循环仪(appliedbiosystems,www.appliedbiosystems.com)中以37℃培养30分钟,再以70℃处理20分钟。向2只管中加入1μl克列诺片段(klenowfragment)(3’to5’exominus)(illumina,www.illumina.com)和1μl连接通用端的随机引物(10μm)(eurofinsmwgoperon,www.eurofinsdna.com)(其中一只加入b_r8(八聚体),另一只加入b_r6(六聚体)),终浓度为0.23μm。将2只管在热循环仪(appliedbiosystems)中依次以15℃培养15分钟,25℃培养15分钟,37℃培养15分钟,最后以75℃培养20分钟。培养完成后,向两管中各加入引物a_p和b(10μm)各1μl(eurofinsmwgoperon),终浓度各为0.22μm;再向管中各加入1μl快速启动高保真dna聚合酶(faststarthifidnapolymerase)(5u/μl)(roche),终浓度为0.11u/μl。按照下列程序在热循环仪(appliedbiosystems)中进行pcr扩增:94℃热启动2min后,进行50个如下循环:94℃15秒,55℃30秒,68℃1分钟,以及最终延长68℃5分钟。扩增完成后,从每管中各取40μl,以qiaquickpcr净化柱(qiagen,www.qiagen.com)纯化,并以30μleb(10mmtris-cl,ph8.5)洗脱。用生物分析仪(agilent,www.home.agilent.com)和dna7500试剂盒分析纯化产物。所得结果如图13和图14所示。

本实施例展示了以随机六聚体和随机八聚体的第二链合成及其后的扩增反应来生成大群已释放的cdna分子的方法。

实施例4

cdna合成和探针的收集后对id-特异性及基因特异性产物的扩增

在以含能切除尿嘧啶的user酶混合物的pcr缓冲液对捕捉探针(共价附着的探针)进行释放后:

对剪切后的cdna进行扩增,反应混合液最终容量为10μl。7μl切除后的模版、1μlid-特异性正向引物(2μm)、1μl基因特异性反向引物(2μm)和1μl含有快速启动高保真混合酶(faststarthighfidelityenzymeblend)的1.4x含1.8mmmgcl2的快速启动高保真反应缓冲液(faststarthighfidelityreactionbufferwith1.8mmmgcl2)的混合液,共计10μl,并与1x含1.8mmmgcl2的快速启动高保真反应缓冲液(faststarthighfidelityreactionbufferwith1.8mmmgcl2)和1u快速启动高保真混合酶(faststarthighfidelityenzymeblend)进行终反应.pcr扩增反应在热循环仪(appliedbiosystems)中按照如下程序进行:94℃热启动2分钟,然后进行50个如下循环:94℃下15秒,55℃下30秒,68℃下1分钟,以及最终延长68℃下5分钟。

引物序列,所得产物约为250bp

beta-2w微球蛋白(b2m)引物

5’-tgggggtgagaattgctaag-3’(seqidno:43)

id-1引物

5'-ccttctccttctccttcacc-3'(seqidno:44)

id-5引物

5'-gtcctctattccgtcaccat-3'(seqidno:45)

id-20引物

5'-ctgcttcttcctggaactca-3'(seqidno:46)

所得结果如图15所示,显示了用两种不同id引物(即:对定位于微阵列上不同位置的id标记具有特异性)和源于脑组织且通用于所有探针的同一基因特异性引物,对id特异性和基因特异性产物的成功扩增。相应地,本实验证明,可以用id标记特异性或目标核酸特异性的扩增反应对产物加以鉴定,且进一步证明,不同id标记可以被区分开来。第二次实验中,仅以组织覆盖阵列中一半的id探针(即捕获探针),则从得到组织覆盖的微点上得到了阳性结果。

实施例5

空间基因组学研究

背景:本方法的目的在于从保有空间信息的组织样本中捕获dna分子,以便能够确定特定的dna片段起源于组织的哪个部分。

方法:本方法的原理在于利用固定了带空间标记标签序列(定位域)的dna寡核苷酸(捕获探针)的微阵列。所述微阵列的寡核苷酸的每一特征都载有1)独一无二的标记标签(定位域)以及2)捕获序列(捕获域)。追踪某一标记标签在阵列表面上的地域位置,便可能从每个标记标签上提取二维定位信息。可以通过例如添加ffpe处理组织的薄切片,来向微阵列添加基因组dna片段。该组织切片中的基因组dna已通过固定处理而预先片段化。

组织薄片放上阵列后,利用末端转移酶进行通用加尾反应。该加尾反应为组织中的基因组dna片段的伸出3’端加上polyda尾。利用末端转移酶进行加尾反应,形成杂交且3’端封闭的polyda探针,从而对表面寡核苷酸实施了封闭。

末端转移酶加尾反应后,基因组dna片段便能通过polyda尾与表面寡核苷酸的polydt捕获序列的接触,从而与附近带有空间标记的寡核苷酸杂交。杂交反应完成后,klenowexo-等链置换聚合酶能利用表面寡核苷酸作为引物,制造一条与所述杂交基因组dna片段互补的dna新链。此时,该dna新链亦带有表面寡核苷酸标记标签所含的定位信息。

作为最后一步,以酶促、变性或物理方法将新合成且带标记的dna链从表面切下,收集起来,并通过引入通用端、特定扩增子的扩增反应、和/或测序,来对整个链集进行下游扩增。

图16是该过程的原理示意图。

材料和方法

以5’到3’方向的探针制备自制喷点微阵列

将20个各带标签序列的dna捕获寡核苷酸(表1)点样到载玻片上,充当捕获探针。所述探针是以5’-端氨基连接子和c6间隔子合成所得。所有的探针均由sigma-aldrich(st.louis,mo,usa)合成。将浓度为20μm的dna捕获探针以150mm磷酸钠制成ph8.5的悬浮液,并用nanoplotternp2.1/e喷点系统(gesim,grosserkmannsdorf,germany)点样在codelinktm活化微阵列载片(7.5cmx2.5cm;surmodics,edenprairie,mn,usa)上。喷点完成后,按照厂商说明实施表面封闭。探针在载片上喷点为16个相同的阵列,每个阵列都含有预设的喷点格局。所述16个子阵列在杂交反应时,以16版遮光框(chipcliptmschleicher&schuellbioscience,keene,nh,usa)分隔。

以3’到5’方向的探针制备自制喷点微阵列并合成5’到3’方向的捕获探针

寡核苷酸的喷点操作与上文所述5’到3’方向的探针的操作方法相同。

为杂交制取用于捕获探针合成的引物,将含有带0.1%sds的4xssc、2μm延长引物(a_primer)和2μm连接引物(p_poly_dt)的杂交溶液在50℃下培养4分钟。与此同时,将自制阵列附着于chipclip片基夹(whatman)上。然后,在所述阵列每孔加入50μl杂交溶液,在50℃及300rpm摇速下培养30分钟。

培养完成后,将阵列从chipclip片基夹上取下,并按照下列3个步骤洗涤:1)带0.1%sds的2xssc溶液,50℃、300rpm摇速下洗涤6分钟;2)0.2xssc溶液,300rpm摇速下洗涤1分钟;以及3)0.1xssc溶液,300rpm摇速下洗涤1分钟。然后,将阵列甩干,放回chipclip片基夹。

为进行延长和连接反应,向每孔加入50μl含有10xampligase缓冲液、2.5u扩增型耐热dna聚合酶stoffel片段(amplitaqdnapolymerasestoffelfragment)(appliedbiosystems)、10uampligase(epicentrebiotechnologies)、dntps各2mm(fermentas)和水的酶混合物。然后,将阵列在55℃下培养30分钟,随后按前述阵列洗涤方法进行洗涤,但第一步中的持续时间由6分钟改为10分钟。

对polyda探针进行杂交以保护表面寡核苷酸不受da尾影响

为保护表面寡核苷酸捕获序列,需要杂交形成3’-生物素封闭的polyda探针,将含有含0.1%sds的4xssc和2μm3’bio-polyda的杂交溶液在50℃下培养4分钟。与此同时,将自制阵列附着于chipclip片基夹(whatman)上。然后,在所述阵列每孔加入50μl杂交溶液,在50℃及300rpm摇速下培养30分钟。

培养完成后,将阵列从chipclip片基夹上取下,并按照下列3个步骤洗涤:1)带0.1%sds的2xssc溶液,50℃、300rpm摇速下洗涤6分钟;2)0.2xssc溶液,300rpm摇速下洗涤1分钟;以及3)0.1xssc溶液,300rpm摇速下洗涤1分钟。然后,将阵列甩干,放回chipclip片基夹。

制备福尔马林固定石蜡包埋(ffpe)的组织

以4%福尔马林在4℃下对小鼠脑组织进行24小时固定。然后,按照如下步骤对其进行培养:70%乙醇培养1小时3次,80%乙醇培养1小时1次,96%乙醇培养1小时1次,100%乙醇1培养1小时1次,二甲苯室温下培养1小时2次。

然后,将脱水样本在液态低熔点石蜡中以52-54℃培养至多3小时,期间置换石蜡一次,以洗除残余二甲苯。完成后的组织块在室温下保藏,使用时,以超薄切片机切成4μm切片,置于每个待用的捕获探针序列上。

切片在阵列载片上37℃干燥24小时,室温保藏。

ffpe组织的脱蜡

附着于codelink载片上的福尔马林固定石蜡包埋的小鼠脑组织10μm切片在二甲苯中脱蜡2次,各10分钟;99.5%乙醇中2分钟;96%乙醇中2分钟;70%乙醇中2分钟;然后空气中干燥。

基因组dna的通用加尾反应

为实施da加尾,制备50μl含有1xtdt缓冲液(20mm三羟甲基氨基甲烷乙酸盐(tris-acetate)(ph7.9),50mm乙酸钾和10mm乙酸镁)(newenglandbiolabs,www.neb.com)、0.1μg/μlbsa(newenglandbiolabs)、1μltdt(20u/μl)和0.5μldatps(100mm)的反应混合物。将所述混合物加至阵列表面,并在热循环仪(aplliedbiosystems)中以37℃培养15分钟,再以70℃培养10分钟以令tdt失活。然后,将温度再次降至50℃,以允许带da尾的基因组片段与表面寡核苷酸捕获序列相杂交。

培养完成后,将阵列从chipclip片基夹上取下,并按照下列3个步骤洗涤:1)带0.1%sds的2xssc溶液,50℃、300rpm摇速下洗涤6分钟;2)0.2xssc溶液,300rpm摇速下洗涤1分钟;以及3)0.1xssc溶液,300rpm摇速下洗涤1分钟。然后,将阵列甩干。

标记dna的延长

取50μl含有1x克列诺缓冲液(klenowbuffer)、200μmdntps(newenglandbiolabs)和1μl克列诺片段(klenowfragment)(3’to5’exominus)的混合物的反应混合物,加热至37℃,加入每孔中,并在37℃下进行30分钟培养并混合(300rpm摇速3秒,静止6秒)(thermomixercomfort;eppendorf)。

培养完成后,将阵列从chipclip片基夹上取下,并按照下列3个步骤洗涤:1)带0.1%sds的2xssc溶液,50℃、300rpm摇速下洗涤6分钟;2)0.2xssc溶液,300rpm摇速下洗涤1分钟;以及3)0.1xssc溶液,300rpm摇速下洗涤1分钟。然后,将阵列甩干。

去除残余组织

取附有福尔马林固定石蜡包埋的小鼠脑组织切片的载片,装上chipclip片基夹及16孔遮光框(whatman)。对每150μlrneasyffpe试剂盒(qiagen)的蛋白酶k消化缓冲液(proteinasekdigestbuffer),加入10μl蛋白酶k溶液(proteinaseksolution)(qiagen)。向每孔加入50μl最终混合物,并在56℃下培养载片30分钟。

以能切除尿嘧啶的user酶混合物的pcr缓冲液释放捕获探针(共价附着的探针)

将16孔遮光框和codelink载片装上chipclip片基夹(whatman)。取50μl含有:含1.8mmmgcl2的1x快速启动高保真反应缓冲液(faststarthighfidelityreactionbufferwith1.8mmmgcl2)(roche)、200μmdntps(newenglandbiolabs)和0.1u/1μluser酶(newenglandbiolabs)的混合物,加热至37℃后,加入每孔中,并在37℃下进行30分钟培养并混合(300rpm摇速3秒,静止6秒)(thermomixercomfort;eppendorf)。然后,用移液枪从孔中回收含有释放的cdna和探针的反应混合物。

已标记dna的合成及探针收集后对id-特异性及基因特异性产物的扩增

在以含能切除尿嘧啶的user酶混合物的pcr缓冲液释放捕捉探针(共价附着的探针)后:

对已剪切的cdna进行扩增,最终反应容量为10μl。7μl已剪切的模版,1μlid特异性正向引物(2μm),1μl基因特异性反向引物(2μm)和1μl快速启动高保真混合酶(faststarthighfidelityenzymeblend)和1.4x含1.8mmmgcl2的快速启动高保真反应缓冲液(faststarthighfidelityreactionbufferwith1.8mmmgcl2)的混合液,共计10μl,并与1x含1.8mmmgcl2的快速启动高保真反应缓冲液(faststarthighfidelityreactionbufferwith1.8mmmgcl2)和1u快速启动高保真混合酶(faststarthighfidelityenzymeblend)进行终反应.

pcr扩增反应在热循环仪(appliedbiosystems)中按照如下程序进行:94℃热启动2分钟,然后进行50次如下循环:94℃下15秒,55℃下30秒,68℃下1分钟,以及最终延长68℃下5分钟。

以随机引物第二链合成和通用端扩增反应进行全基因组扩增(含标记序列的捕获探针序列保留在所得dsdna的末端)

在以含能剪切尿嘧啶的user酶混合物的pcr缓冲液释放捕获探针之后(共价附着的探针)

含有40μl1x含1.8mmmgcl2的快速启动高保真pcr缓冲液(faststarthifipcrbuffer)(ph8.3)(roche,www.roche-applied-science.com)、dntp各0.2mm(fermentas,www.fermentas.com)、0.1μg/μlbsa(newenglandbiolabs,www.neb.com)、0.1u/μluser酶(newenglandbiolabs)、已释放的dna(从表面探针上延伸)和已释放的表面探针的反应混合物。然后,将pcr管在热循环仪(appliedbiosystems,www.appliedbiosystems.com)中以37℃培养30分钟,再以70℃处理20分钟。向管中加入1μl克列诺片段(klenowfragment)(3’to5’exominus)(illumina,www.illumina.com)和1μl连接通用端的随机引物(10μm)(eurofinsmwgoperon,www.eurofinsdna.com)。然后,将pcr管在热循环仪(appliedbiosystems,www.appliedbiosystems.com)中以15℃培养15分钟,以25℃培养15分钟,,37℃培养15分钟,最后以75℃培养20分钟。培养完成后,向管中加入a_pandb(10μm)引物各1μl(eurofinsmwgoperon)及1μl快速启动高保真dna聚合酶(faststarthifidnapolymerase)(5u/μl)(roche)。按照下列程序在热循环仪(appliedbiosystems)中进行pcr扩增:94℃热启动2min后,进行50个循环,所述循环为:94℃15秒,55℃30秒,68℃1分钟,以及最终延长68℃5分钟。扩增完成后,从每管中各取40μl,以qiaquickpcr净化柱(qiagen,www.qiagen.com)纯化,并以30μleb(10mmtris-cl,ph8.5)洗脱。用生物分析仪(agilent,www.home.agilent.com)和dna7500试剂盒分析纯化产物。

可视化

染色前的荧光标记探针杂交

在放置组织切片前,将荧光标记探针与含有喷至捕获探针阵列上的指定标记序列相杂交。组织可视化后,所述荧光标记探针有助于为所得图像定向,允许所得图像与测序后所得的各个捕获探针标记序列的序列表达谱合并。为完成荧光探针的杂交,取含0.1%sds的4xssc和2μm检测探针(p)的杂交溶液,在50℃下培养4分钟。同时,将自制序列附着于chipclip片基夹(whatman)。然后,向序列每孔加入50μl杂交溶液,在50℃和300rpm摇速下培养30分钟。

培养完成后,从chipclip片基夹上取下序列,按照下列步骤洗涤:1)2xssc,0.1%sds:50℃和300rpm摇速下6分钟;2)0.2xssc:300rpm摇速下1分钟;以及3)0.1xssc:300rpm摇速下1分钟。然后,将序列甩干。

标记dna合成前或合成后对ffpe组织切片的整体组织学染色

对固定在捕获探针序列上的ffpe组织切片,在脱蜡之后、标记dna合成之前,如前述步骤进行洗涤和补水,或在标记dna合成之后,如前述步骤进行洗涤。然后,按如下步骤处理组织切片:在苏木精中培养3分钟;以去离子水淋洗;在自来水中培养5分钟;快速地浸入酸化乙醇中8-12次;以自来水洗涤2次各1分钟;以去离子水洗涤2分钟;在曙红中培养30秒;在95%乙醇中洗涤3次各5分钟;以100%乙醇洗涤3次各5分钟;以二甲苯冲洗3次各10分钟(可过夜);将盖片覆盖于载片上,以dpx封片;令载片在通风橱中干燥过夜。

标记dna合成前或合成后对ffpe组织切片的目标蛋白的整体免疫组织化学染色

对固定在捕获探针序列上的ffpe组织切片,在脱蜡之后、标记dna合成之前,如前述步骤进行洗涤和补水,或在dna合成之后,如前述步骤进行洗涤。然后,按如下步骤处理组织切片,且在整个染色过程中保持切片湿润:以封闭液(含1x三羟甲基氨基甲烷缓冲盐水(trisbufferedsaline)(50mmtris,150mmnacl,ph7.6)、4%驴血清和0.1%triton-x)稀释一级抗体,并以一级抗体在湿室中对切片进行室温过夜培养;以1xtbs淋洗3次;以接合荧光素(fitc、cy3或cy5)的配对二级抗体在湿室中对切片进行室温培养1小时。以1xtbs淋洗3次,尽可能地除去tbs后,以prolonggold+dapi(苯基吲哚)试剂(invitrogen)封藏切片,然后以荧光显微镜和匹配滤光片组加以分析。

实施例6

本实验按照实施例5的原理进行,但在阵列上使用了基因组dna片段而非组织。所述基因组dna分别预先片段化至200bp和700bp的平均大小。本实验表明,所述原理能够实现。片段化的基因组dna与ffpe组织非常相似。

标记dna合成及探针收集后对内部基因特异性产物的扩增

以含能切除尿嘧啶的user酶混合物的pcr缓冲液释放捕捉探针(共价附着的探针),所述缓冲液含有1x含1.8mmmgcl2的快速启动高保真反应缓冲液(faststarthighfidelityreactionbufferwith1.8mmmgcl2)(roche)、200μmdntps(newenglandbiolabs)和0.1u/1μluserenzyme(newenglandbiolabs)。

对经过剪切的dna进行扩增,最终反应容量为50μl。向47μl经剪切的模版中加入1μlid-特异性正向引物(10μm),1μl基因特异性反向引物(10μm)和1μl快速启动高保真酶混合物(faststarthighfidelityenzymeblend)。pcr扩增反应在热循环仪(appliedbiosystems)中按照如下程序进行:94℃热启动2分钟,然后进行50个循环,所述循环包括:94℃下15秒,55℃下30秒,68℃下1分钟,以及最终延长68℃下5分钟。

标记dna合成及探针收集后对标记特异性及基因特异性产物的扩增

以含能切除尿嘧啶的user酶混合物的pcr缓冲液释放捕捉探针(共价附着的探针),所述缓冲液含有1x含1.8mmmgcl2的快速启动高保真反应缓冲液(faststarthighfidelityreactionbufferwith1.8mmmgcl2)(roche)、200μmdntps(newenglandbiolabs)和0.1u/1μluserenzyme(newenglandbiolabs),然后:

对经过剪切的dna进行扩增,最终反应容量为50μl。向47μl经剪切的模版中加入1μl标记特异性正向引物(10μm),1μl基因特异性反向引物(10μm)和1μl快速启动高保真酶混合物(faststarthighfidelityenzymeblend)。pcr扩增反应在热循环仪(appliedbiosystems)中按照如下程序进行:94℃热启动2分钟,然后进行50个循环,所述循环包括:94℃下15秒,55℃下30秒,68℃下1分钟,以及最终延长68℃下5分钟。

正向-人类基因组dna引物

5’-gactgctcttttcacccatc-3’(seqidno:47)

反向-人类基因组dna引物

5’-ggagctgctggtgcaggg-3’(seqidno:48)

p–标记特异引物

5’-atctcgactgccactctgaa-3’(seqidno:49)

实验结果如图17和图20所示。图中显示了阵列上扩增的内部产物——图17和图18中测得的峰值大小符合期望值。因此,这表明基因组dna可以被捕获和扩增。在图19和图20中,鉴于基因组dna的随机片段化和末端转移酶会产生多样性极高的样本池,因此,标记期望产物具有拖尾。

实施例7

利用聚合酶延长反应和末端转移酶加尾反应对5’至3’方向的捕获探针进行别种合成

为杂交制备用于捕获探针合成中的引物,将含有4xssc和0.1%sds和2μm延长引物(a_primer)的杂交溶液在50℃下培养4分钟。同时,将自制阵列(见实施例1)附着于chipclip片基夹(whatman)上。然后,向阵列每孔加入50μl杂交溶液,在50℃和300rpm下培养30分钟。

培养完成后,将阵列从chipclip片基夹上取下,按照以下3个步骤洗涤:1)50℃下,以含0.1%sds的2xssc溶液在300rpm摇速下洗涤6分钟;2)以0.2xssc溶液在300rpm摇速下洗涤1分钟;以及3)以0.1xssc溶液在300rpm摇速下洗涤1分钟。然后,将所述阵列甩干,并放回chipclip片基夹。

取1μl克列诺片段(klenowfragment)(3’to5’exominus)(illumina,www.illumina.com)和10x克列诺缓冲液(klenowbuffer)、dntps各2mm(fermentas)和水,混合成50μl反应物,用移液枪注入各孔。

在eppendorfthermomixer热循环仪中培养阵列:15℃15分钟,25℃15分钟,37℃15分钟,最后是75℃20分钟。

培养完成后,将阵列从chipclip片基夹上拿下来,按照以下3个步骤洗涤:1)50℃下,以含0.1%sds的2xssc溶液在300rpm摇速下洗涤6分钟;2)以0.2xssc溶液在300rpm摇速下洗涤1分钟;以及3)以0.1xssc溶液在300rpm摇速下洗涤1分钟。然后,将所述阵列甩干,并放回chipclip片基夹。

为进行dt加尾,制备50μl反应混合物,含1xtdtbuffer(20mm三羟甲基氨基甲烷乙酸盐(tris-acetate)(ph7.9)、50mm乙酸钙和10mm醋酸镁)(newenglandbiolabs,www.neb.com)、0.1μg/μlbsa(newenglandbiolabs)、0.5μlrnaseh(5u/μl)、1μltdt(20u/μl)和0.5μldttps(100mm)。将混合物添加至阵列表面,并将阵列在热循环仪(appliedbiosystems)中以37℃培养15分钟,再以70℃培养10分钟以令tdt失活。

实施例8

利用5’至3’高探针密度阵列和福尔马林固定冷冻(ff-frozen)的组织、user体系剪切和末端转移酶催化的扩增反应进行空间转录组学研究

制备阵列

从roche-nimblegen(madison,wi,usa)订购预制高密度微阵列芯片。每个捕获探针阵列含有135,000个特征,其中132,460个特征载有含独有id-标签序列(定位域)和捕获区域(捕获域)的捕获探针。每个特征大小为13x13μm。每个捕获探针在5’至3’方向上的构成包括含有5个dutp碱基(剪切域)和常规扩增域的通用域、id标签(定位域)和捕获区域(捕获域)(图22和表2)。每个阵列还配备了标记探针的框架(图23),该框架载有30bp通用序列(表2),以启动荧光探针的杂交,有助于阵列可视化中的定向。

组织制备——福尔马林固定冷冻组织的制备

向动物(小鼠)灌注50mlpbs和100ml4%福尔马林溶液。切除嗅球后,将其放入4%福尔马林浴,进行24小时后固定。然后,以溶于pbs的30%蔗糖对组织进行24小时的蔗糖处理,以稳定形态及移除多余的福尔马林。以控制速度降温,将组织冷冻至-40℃,并在实验间以-20℃保存。平行标本的制备方法亦同,但后固定时间为3小时,或省略后固定步骤。用2%福尔马林灌注并省略后固定步骤也可以进行成功制作。类似地,还可以省略蔗糖处理步骤。将组织封藏在低温箱中,切成10μm切片。向待用的每个捕获探针序列上放置一片组织切片。可选地,为达到更好的组织粘附,可以将阵列芯片50℃处理15分钟。

可选对照-切片组织的总rna制备

按照厂商说明用rneasyffpe试剂盒(qiagen)提取单个组织切片(10μm)的总rna。将从组织切片获得的总rna用于对照试验,同将组织切片上的rna直接捕获在阵列上的实验相比较。相应地,在向阵列实施总rna操作的情况下,染色、可视化和组织降解步骤皆省略。

片上反应

标记探针与框架探针的杂交、反转录、核染色、组织消化和探针剪切反应都在16孔硅胶衬垫(arrayit,sunnyvale,ca,usa)上进行,反应容量为每孔50μl。为避免蒸发,以封板(invitroab,stockholm,sweden)覆盖杂交盒。

可选-cdna合成前的组织透化

用proteinasek(qiagen,hilden,germany)实施透化,用pbs将proteinasek稀释为1μg/ml。将溶液加入孔中,将载片在室温下培养5分钟,随后在10分钟内将温度逐渐提高到80℃。反转录反应前,以pbs对载片进行简短洗涤。

可选地,组织附着后,可以用微波实施透化,将载片放入装有50ml0.2xssc(sigma-aldrich)的玻璃罐底,在微波炉中以800w功率加热1分钟。微波处理之后,紧接着将载片放在纸巾上,在隔绝不必要空气接触的容器中干燥30分钟。干燥后,将载片简短浸入水(不含rnase/dnase)中,最后在开始cdna合成前,以离心机甩干。

cdna合成

采用superscriptiiione-steprt-pcrsystemwithplatinumtaq(lifetechnologies/invitrogen,carlsbad,ca,usa)实施反转录反应。反转录反应终容量为50μl,含有1x反应混合物、1xbsa(newenglandbiolabs,ipswich,ma,usa)和2μlsuperscriptiiirt/platinumtaqmix。该溶液先加热至50℃,再施于组织切片上,以50℃反应30分钟。随后,将反转录溶液从孔中移除,令载片在空气中干燥2小时。

组织可视化

cdna合成完成后,同时实施核染色及标记探针与框架探针(附着于阵列基板上,用于对阵列上的组织样本进行定向的探针)的杂交。制备含300nmdapi和170nm标记探针的pbs溶液。将该溶液加入孔中,并将载片在室温下培养5分钟,然后以pbs简短洗涤,并甩干。

可选地,在将组织放在阵列上之前,可令标记探针与框架探针杂交。然后,用杂交缓冲液(4xssc,0.1%sds)将标记探针稀释到170nm。将该溶液加热到50℃,置于芯片上,以50℃和300rpm进行30分钟杂交反应。杂交完成后,洗涤载片:先以2xssc,0.1%sds在50℃和300rpm下对载片洗涤10分钟,然后以0.2xssc在300rpm下洗涤1分钟,最后以0.1xssc在300rpm下洗涤1分钟。在此情况下,cdna合成后的染色溶液仅含有以pbs稀释到300nm的dapi核染色剂。将溶液加入孔中,将载片在室温下培养5分钟,然后以pbs简短洗涤并甩干。

以zeissaxioimagerz2显微镜对切片进行检查,并以metasystems进行处理。

移除组织

为消化组织切片,用rneasyffpe试剂盒中的pkd缓冲液将proteinasek(均来自qiagen)稀释到1.25μg/μl,然后以该溶液在56℃下培养组织切片30分钟,期间按先300rpm3秒再静止6秒进行间歇混合。然后,洗涤载片:先以2xssc,0.1%sds在50℃和300rpm下洗涤10分钟,然后以0.2xssc在300rpm下洗涤1分钟,最后以0.1xssc在300rpm下洗涤1分钟。

释放探针

将带硅胶衬垫的16孔杂交盒(arrayit)预热至37℃,并附着于nimblegen载片上。将50μl含有未知浓度裂解缓冲液(takara)、0.1u/μluser酶(neb)和0.1μg/μlbsa的剪切混合物预热到37℃,并注入含有固定于表面的cdna的各孔中。除去气泡,将载片封闭,并在thermomixer舒适型恒温混匀仪中以37℃培养30分钟,期间按先300rpm3秒再静止6秒进行间歇混合。培养完成后,从每个经反应的孔中收集45μl剪切混合物,置入0.2mlpcr管中(图24)。

准备文库

核酸外切酶处理

令各溶液在冰上冷却2分钟后,加入核酸外切酶i(neb),以去除未延长的cdna探针,反应终容量为46.2μl,终浓度为0.52u/μl。以热循环仪(appliedbiosystems)在37℃下培养pcr管30分钟,接着在80℃处理25分钟,令核酸外切酶失活。

以末端转移酶进行da-加尾

核酸外切酶处理步骤后,按照厂商说明配制含tdt缓冲液(takara)、3mmdatp(takara)和厂商tdt酶混合物(tdt及rnaseh)(takara)的polya加尾反应混合物,向各样本加入45μl。将所得混合物在热循环仪中以37℃培养15分钟,接着在70℃处理10分钟,令核酸外切酶失活。

第二链的合成及pcr扩增

da加尾反应后,每个样本取4个新的0.2mlpcr管,加入23μlpcr预混液,并向每管中加入2μl样本作为模版。最终pcr反应液中含有1xextaq缓冲液(takara)、dntp各200μm(takara)、600nma_primer(mwg)、600nmb_dt20vn_primer(mwg)以及0.025u/μlextaq聚合酶(takara)(表2)。在热循环仪中进行一次如下循环来制造cdna第二链:95℃3分钟,50℃2分钟,72℃3分钟。然后,按如下程序进行20(准备文库)或30(确认cdna的存在)次循环,来扩增样本:95℃30秒,67℃1分钟,72℃3分钟,然后是72℃10分钟的最后延长。

文库清理

扩增完成后,向所述4管pcr反应液(100μl)中混入500μl结合缓冲液(qiagen),放入qiaquickpcr净化柱(qiagen)中,17,900xg甩1分钟以将扩增的cdna结合在膜上。然后,以含有乙醇的洗涤液(qiagen)洗涤该膜,最后以50μl10mm、ph8.5的tris-cl洗脱。

以mbs机器人(magneticbiosolutions)通过ca-纯化(即以与羧酸结合的超顺磁微珠进行纯化)对样本进行进一步纯化和浓缩。最后,以10%的peg溶液来移除150-200bp以下的片段。令扩增的cdna与ca-微珠(invitrogen)进行10分钟的结合反应,然后以15μl10mm、ph8.5的tris-cl洗脱。

文库质量分析

以agilent生物分析仪(agilent)对经过30个循环扩增的样本加以分析,依照样本材料的多少选用dna高灵敏度(dnahighsensitivity)试剂盒或dna1000试剂盒,以确认扩增后的cdna文库的存在。

准备测序文库

建立文库索引

使用经20个循环扩增的样本来准备测序文库。为每个样本制备一种索引pcr预混液,取23μl所述预混液加入6个0.2mlpcr管中,并向每管中加入2μl已扩增并纯化的cdna作为模版,使得pcr反应液含1xphusion预混液(fermentas)、500nminpe1.0(illumina)、500nmindex1-12(illumina)和0.4nminpe2.0(illumina)。将所述样本在热循环仪中按照下列程序经18个循环扩增:98℃30秒,65℃30秒,72℃1分钟,接着是最后延长72℃5分钟。

测序文库清理

扩增完成后,向所述6管pcr反应液(150μl)中混入750μl结合缓冲液(qiagen),放入qiaquickpcr净化柱(qiagen)中,17,900xg甩1分钟以将扩增的cdna结合在膜上(由于样本体积大(900μl),因此将样本分作两份(每份450μl),在两个步骤中分别结合)。然后,以含有乙醇的洗涤液(qiagen)洗涤该膜,最后以50μl10mm、ph8.5的tris-cl洗脱。

以mbs机器人(magneticbiosolutions)通过ca-纯化对样本进行进一步的纯化和浓缩。最后,以7.8%的peg溶液来移除300-350bp以下的片段。令已扩增的cdna与ca-微珠(invitrogen)进行10分钟的结合反应,然后以15μl10mm、ph8.5的tris-cl洗脱。以agilent生物分析仪(agilent)对样本加以分析,按照厂商说明,依照样本材料的多少选用dna高灵敏度(dnahighsensitivity)试剂盒或dna1000试剂盒,以确认扩增后的完成后的文库的存在和大小。

测序

按照所需数据通量和厂商说明,选用illuminahiseq2000或miseq对文库进行测序。对read2,可选地,采用引物b_r2进行定制测序,以免测序经过20t均聚物延展。

数据分析

修剪read1在5’端的42个碱基和read2在5’端的25个碱基(可选地,如果采用了定制引物,则无需修剪read2的碱基)。然后,用bowtie软件将read数据映射到屏蔽重复序列的musmusculus9基因组集合,并将输出数据整理为sam文件格式。提取映射后的read数据并以ucscrefgene基因注释加以注释。用“indexfinder”(一种用于索引检索的自制软件)检索数据。至此,便建立了包含所有已捕获的转录体及其各自的芯片索引位置信息的mongodb数据库。

将matlab实现软件与数据库相连接,既能允许对数据的空间可视化与分析(图26)。

可选地,利用荧光标记的框架探针令可视化数据与显微图像相重叠,得到准确对齐,并得以实现空间转录组数据的提取。

实施例9

利用3’至5’高探针密度阵列和ffpe组织以muty体系剪切反应和tdt催化的扩增反应进行空间转录组学研究

制备阵列

从roche-nimblegen(madison,wi,usa)订购预制型高密度微阵列芯片。每个捕获探针阵列含有72,000个特征,其中66,022个特征载有含独有id-标签互补序列。每个特征大小为16x16μm。每个捕获探针在3’至5’方向上的构成与自制喷点3’至5’阵列中所用探针相同,但在探针的上游通用端(p’)上增加了3个额外的碱基,将其变为p’的加长版本,即lp’(表2)。每个阵列还配备了标记探针的框架,该框架载有30bp通用序列,以启动荧光探针的杂交,帮助阵列可视化中的定向。

5’至3’方向的捕获探针的合成

高密度阵列上5’至3’方向的捕获探针的合成步骤与自制喷点阵列相同,但区别在于其延长和连接步骤是先55℃下进行15分钟,再在72℃下进行15分钟。a-handle探针(表2)中包含了一个a/g错配,以允许通过muty酶促系统进行的后续探针释放,如下所述。p-探针被较长的lp版本所取代,来与表面的较长探针相匹配。

福尔马林固定石蜡包埋组织的制备和脱蜡

该步骤实施方法与上述自制序列的操作流程相同。

cdna的合成和染色

cdna的合成和染色按照5’至3’方向的高密度nimblegen阵列的操作流程进行,但cdna合成中加入了生物素标记的dctps和datp以及4种常规dntps(每种比生物素标记的核苷三磷酸多25倍)。

组织的移除

组织的移除按照如实施例8所述的5’至3’方向的高密度nimblegen阵列的操作流程进行。

以muty进行探针剪切

将带硅胶衬垫的16孔杂交盒(arrayit)预热至37℃,并附着于codelink载片上。将50μl含有1x核酸内切酶viii缓冲液(endonucleaseviiibuffer)(neb)、10u/μlmuty(trevigen)、10u/μl核酸内切酶viii(endonucleaseviii)(neb)和0.1μg/μlbsa的剪切混合物预热到37℃,并注入含有固定于表面的cdna的各孔中。除去气泡,将载片封闭并在thermomixer舒适型恒温混匀仪(thermomixercomfort)中,以37℃下培养30分钟,期间按先300rpm3秒再静止6秒进行间歇混合。培养完成后,移除封闭液,从每个经反应的孔中收集40μl剪切混合物,置入pcr管中。

准备文库

生物素-链亲和素介导的文库清理

为移除未延长的cdna探针并改换缓冲液,对样本进行纯化,具体是通过将生物素标记的cdna与涂有链亲和素的c1微珠(invitrogen)结合,并以0.1mnaoh(现配现用)洗涤微珠。纯化以mbs机器人(magneticbiosolutions)实施,令生物素标记的cdna与c1微珠(invitrogen)进行10分钟的结合反应,然后以20μl水洗脱,具体洗脱方法是将微珠-水溶液加热到80℃,以破坏生物素-链亲和素的链接。

以末端转移酶进行da-加尾

纯化步骤后,按照厂商说明配制含裂解缓冲液(takara,cellampwholetranscriptomeamplificationkit)\tdt缓冲液(takara)、1.5mmdatp(takara)和tdt酶混合物(tdt及rnaseh)(takara)的polya加尾反应混合物;每种样本各取18μl,加入新的0.2mlpcr管中,并加入22μlpolya加尾预混液予以混合,形成40μl的反应混合物。将所得混合物在热循环仪中以37℃培养15分钟,接着以70℃处理10分钟,令tdt失活。

第二链的合成及pcr扩增

da加尾反应后,每个样本取4个新的0.2mlpcr管,加入23μlpcr预混液,并向每管中加入2μl样本作为模版。最终pcr反应液中含有1xextaq缓冲液(takara)、dntp各200μm(takara)、600nma_primer(mwg)、600nmb_dt20vn_primer(mwg)以及0.025u/μlextaq聚合酶(takara)。在热循环仪中进行如下循环1次,来制造cdna第二链:95℃3分钟,50℃2分钟,72℃3分钟。然后,按如下程序进行20(准备文库)或30(确认cdna的存在)次循环,来扩增样本:95℃30秒,67℃1分钟,72℃3分钟,然后是72℃10分钟的最后延长。

文库清理

扩增完成后,向所述4管pcr反应液(100μl)中混入500μl结合缓冲液(qiagen),放入qiaquickpcr净化柱(qiagen)中,17,900xg甩1分钟以将扩增的cdna结合在膜上。然后,以含有乙醇的洗涤液(qiagen)洗涤该膜,最后以50μl10mm、ph8.5的tris-cl洗脱。

以mbs机器人(magneticbiosolutions)通过ca-纯化(即以与羧酸结合的超顺磁微珠进行纯化)对样本进行进一步的纯化和浓缩。最后,以10%的peg溶液来移除150-200bp以下的片段。令扩增的cdna与ca-微珠(invitrogen)进行10分钟的结合反应,然后以15μl10mm、ph8.5的tris-cl洗脱。

第二次pcr扩增

最终pcr反应液含有1xextaq缓冲液(takara)、dntp各200μm(takara)、600nma_primer(mwg)、600nmb_primer(mwg)和0.025u/μlextaq聚合酶(takara);将该样本加热到95℃维持3分钟,然后按照如下程序进行30次循环:95℃30秒,65℃1分钟,72℃3分钟,接着是最后延长:72℃10分钟。

第二次文库清理

扩增完成后,向所述4管pcr反应液(100μl)中混入500μl结合缓冲液(qiagen),放入qiaquickpcr净化柱(qiagen)中,17,900xg甩1分钟以将扩增的cdna结合在膜上。然后,以含有乙醇的洗涤液(qiagen)洗涤该膜,最后以50μl10mm、ph8.5的tris-cl洗脱。

以mbs机器人(magneticbiosolutions)通过ca-纯化(即以与羧酸结合的超顺磁微珠进行纯化)对样本进行进一步纯化和浓缩。最后,以10%的peg溶液来移除150-200bp的片段。令扩增的cdna与ca-微珠(invitrogen)进行10分钟的结合反应,然后以15μl10mm、ph8.5的tris-cl洗脱。

准备测序文库

建立文库索引

使用经20个循环扩增的样本来准备测序文库。为每个样本制备一种索引pcr预混液,取23μl加入6个0.2mlpcr管中,并向每管中加入2μl经扩增和纯化的cdna作为模版,使得pcr反应液含1xphusion预混液(fermentas)、500nminpe1.0(illumina)、500nmindex1-12(illumina)和0.4nminpe2.0(illumina)。将所述样本在热循环仪中按照下列程序经18个循环扩增:98℃30秒,65℃30秒,72℃1分钟,接着是最后延长72℃5分钟。

测序文库清理

扩增反应后,以连接mbsrobot(magneticbiosolutions)的ca-纯化反应对样本进行纯化和浓缩。最后,以7.8%的peg溶液来移除300-350bp以下的片段。令扩增的cdna与ca-微珠(invitrogen)进行10分钟的结合反应,然后以15μl10mm、ph8.5的tris-cl洗脱。

取10μl扩增和纯化后的样本,置于caliperxt芯片上,并以caliperxt(caliper)切除长度在480bp和720bp间的片段。使用dna高灵敏度(dnahighsensitivity)试剂盒,以agilent生物分析仪(agilent)对样本加以分析,以确认扩增后的完成后的文库的存在和大小。

测序及数据分析

测序及生物信息学分析按照实施例8中所述的5’至3’方向的高密度nimblegen阵列的操作流程实施。但是,在数据分析中,未用read1进行对转录体的映射。可用matlab可视化工具选出特定的olfr转录体(图27)。

实施例10

利用5’至3’方向探针的自制喷点41-标签微阵列、以proteinasek或以user体系剪切反应微波处理进行透化的福尔马林固定冷冻(ff-frozen)组织和以tdt进行的扩增反应进行空间转录组学研究

阵列的制备

自制阵列的喷点方法如前所述,但采用的格局含有41个带独有id标签的探针,所述探针的构成与实施例8中的5’至3’方向的高密度阵列相同。

所有其他步骤的实施方式均与实施例8中所述相同。

实施例11

实施cdna合成步骤的替代方法

前述的片上cdna合成还可以结合模版转换,通过向cdna合成反应中加入模板转换引物来制造第二链(表2)。通过反转录酶向cdna第一链的3’端添加末端碱基,所述碱基可以结合并引入第二扩增域,所述第二扩增域引导第二链的合成。双链合成产物一旦从阵列表面释放,便可方便地直接扩增成文库。

实施例12

利用5’至3’方向探针的自制喷点41-标签微阵列、以user体系剪切的poly-a尾gdna片段和以tdt加尾引物或易位特定引物引导的扩增反应来进行空间基因组学研究

阵列的制备

如前述方法,用codelink载片(surmodics)自制喷点阵列,但所用格局含有41个各带独有id标签的探针,所述探针的构成与实施例8中的5’至3’方向的高密度阵列相同。

细胞的总dna制备

dna的碎裂

以dneasykit(qiagen)按照厂商说明提取a431和u2os细胞系的基因组dna(gdna)。用covaris超声波样本震碎机(covaris)按照厂商说明将dna碎裂成500bp的片段。

以mbs机器人(magneticbiosolutions)通过ca-纯化(即以与羧酸结合的超顺磁微珠进行纯化)对样本进行纯化和浓缩。最后,以10%的peg溶液来移除150-200bp以下的片段。令扩增的cdna与ca-微珠(invitrogen)进行10分钟的结合反应,然后以15μl10mm、ph8.5的tris-cl洗脱。

可选对照-不同细胞系的峰值

通过a431dna转化u2osdna的峰值,测定不同的捕获灵敏度水平,例如峰值为a431dna的1%、10%或50%。

以末端转移酶进行da-加尾

按照厂商说明配制含tdtbuffer(takara)、3mmdatp(takara)和tdt酶混合物(tdt及rnaseh)(takara)的polya加尾反应混合物,取45μl所述混合物与0.5μgdna片段混合。将所得混合物在热循环仪中以37℃培养30分钟,接着在80℃处理20分钟令tdt失活。然后,以qiaquick(qiagen)柱按照厂商说明对含da尾的片段进行清洗,并以qubit体系(invitrogen)按照厂商说明测定浓度。

片上实验

杂交、第二链合成和剪切反应都在16孔硅胶衬垫(arrayit,sunnyvale,ca,usa)上进行。为避免蒸发,以封板覆盖杂交盒。

杂交

将117ngdna沉淀于预热阵列(50℃)的孔中,加入1xnebbuffer(newenglandbiolabs)和1xbsa至总体积45μl。在配有mtp微孔板的舒适型恒温混匀器(thermomixercomfort)(eppendorf)中以37℃、300rpm摇速培养该混合物30分钟。

第二链合成

无需移除杂交混合物,向孔中加入15μl含有1xnebbuffer、1.5μlklenow聚合酶和3.75μldntps(各2mm)的klenow延长反应混合物。在舒适型恒温混匀器(thermomixercomfort)(eppendorf)中以37℃培养该混合物30分钟,不加摇动。

然后,洗涤载片:0.1%sds的2xssc溶液,50℃、300rpm摇速下洗涤10分钟;0.2xssc溶液,300rpm摇速下洗涤1分钟;以及0.1xssc溶液,300rpm摇速下洗涤1分钟。

释放探针

取50μl含有1x含1.8mmmgcl2的快速启动高保真反应缓冲液(faststarthighfidelityreactionbufferwith1.8mmmgcl2)(roche)、200μmdntps(newenglandbiolabs)和0.1u/1μluserenzyme(newenglandbiolabs)的混合物,加热至37℃后,加入每孔中,并在37℃下进行30分钟培养并混合(300rpm摇速3秒,静止6秒)(thermomixercomfort;eppendorf)。然后,用移液枪从孔中回收含有已释放的dna的反应混合物。

准备文库

扩增反应

以含有7.5μl释放的样本、每种引物各1μl和0.5μlenzyme(roche,faststarthifipcr体系)的10μl反应液进行扩增反应。按照如下程序进行反应:94℃2分钟;以下循环1次:94℃15秒,55℃2分钟,72℃2分钟;以下循环30次:94℃15秒,65℃30秒,72℃90秒,最后延长:72℃5分钟。

在测序文库的准备中,两种引物包括表面探针a-handle和与b-handle相连的特定易位引物(a431)或特定snp引物之一(表2)。

以连接mbs机器人(magneticbiosolutions)的ca-纯化反应(即以与羧酸结合的超顺磁微珠进行纯化)对样本进行进一步的纯化和浓缩。最后,以10%的peg溶液来移除150-200bp以下的片段。令扩增的cdna与ca-微珠(invitrogen)进行10分钟的结合反应,然后以15μl的10mm、ph8.5的tris-cl洗脱。

文库质量分析

以agilent生物分析仪(agilent)对样本加以分析,依照样本材料的多少选用dna高灵敏度(dnahighsensitivity)试剂盒或dna1000试剂盒,以确认扩增后的cdna文库的存在。

建立文库索引

使用经20个循环扩增的样本来准备测序文库。为每个样本制备一种索引pcr预混液,取其中23μl加入6个0.2mlpcr管中,并向每管中加入2μl扩增并纯化的cdna作为模版,制得的pcr反应液中含有1xphusion预混液(fermentas)、500nminpe1.0(illumina)、500nmindex1-12(illumina)和0.4nminpe2.0(illumina)。将所述样本在热循环仪中按照下列程序经18个循环扩增:98℃30秒、65℃30秒、72℃1分钟;接着是最后延长:72℃5分钟。

测序文库清理

以连接mbsrobot(magneticbiosolutions)的ca-纯化反应对样本进行进一步的纯化和浓缩。最后,以7.8%的peg溶液来移除300-350bp以下的片段。令扩增的dna与ca-微珠(invitrogen)进行10分钟的结合反应,然后以15μl10mm、ph8.5的tris-cl洗脱。以agilent生物分析仪(agilent)对样本加以分析,按照厂商说明,依照样本材料的多少选用dna高灵敏度(dnahighsensitivity)试剂盒或dna1000试剂盒,以确认扩增后的完成后的文库的存在和大小(图29)。

测序

按照实施例8中所述的5’至3’方向的高密度nimblegen阵列的操作流程进行测序。

数据分析

通过数据分析,确定阵列中的id-捕获探针的捕获灵敏度。以read2所含的易位引物或snp引物对其进行整理分类,然后按照read1中所含的此类read的id对这些read进行整理。

可选对照-细胞系特定易位的直接扩增

本步骤用于直接以pcr测定具有峰值的细胞系的捕获灵敏度。利用a431易位的正向和反向引物(表2),尝试并检测复制并释放的第二链产物中是否存在易位(图30)。

表2.用于空间转录组学和空间基因组学研究的寡核苷酸

序列表

<110>空间转录公司

乔纳斯·弗瑞森

帕特里克·斯塔尔

乔亚基姆·伦德贝格

<120>用于组织样本中核酸的局部或空间检测的方法和产品

<130>27.20.107863/01

<150>gb1106254.4

<151>2011-04-13

<160>121

<170>siposequencelisting1.0

<210>1

<211>72

<212>dna

<213>artificialsequence

<220>

<223>tap-id1

<220>

<221>misc_feature

<222>(1)..(1)

<223>5'-terminusaminolinkerwithac6spacer

<220>

<221>misc_feature

<222>(72)..(72)

<223>nisa,c,g,toru

<400>1

uuaagtacaaatctcgactgccactctgaaccttctccttctccttcacctttttttttt60

ttttttttttvn72

<210>2

<211>10

<212>dna

<213>artificialsequence

<220>

<223>enzymaticrecognitionsequence

<400>2

uuaagtacaa10

<210>3

<211>20

<212>dna

<213>artificialsequence

<220>

<223>universalamplificationhandlep

<400>3

atctcgactgccactctgaa20

<210>4

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id1

<400>4

ccttctccttctccttcacc20

<210>5

<211>22

<212>dna

<213>artificialsequence

<220>

<223>capturesequence

<220>

<221>misc_feature

<222>(22)..(22)

<223>nisa,c,g,ort

<400>5

ttttttttttttttttttttvn22

<210>6

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id1

<400>6

ccttctccttctccttcacc20

<210>7

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id2

<400>7

ccttgctgcttctcctcctc20

<210>8

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id3

<400>8

acctcctccgcctcctcctc20

<210>9

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id4

<400>9

gagacataccaccaagagac20

<210>10

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id5

<400>10

gtcctctattccgtcaccat20

<210>11

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id6

<400>11

gactgagctcgaacatatgg20

<210>12

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id7

<400>12

tggaggattgacacagaacg20

<210>13

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id8

<400>13

ccagcctctccattacatcg20

<210>14

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id9

<400>14

aagatctaccagccagccag20

<210>15

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id10

<400>15

cgaacttccactgtctcctc20

<210>16

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id11

<400>16

ttgcgccttctccaatacac20

<210>17

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id12

<400>17

ctcttcttagcatgccacct20

<210>18

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id13

<400>18

accacttctgcattacctcc20

<210>19

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id14

<400>19

acagcctcctcttcttcctt20

<210>20

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id15

<400>20

aatcctctccttgccagttc20

<210>21

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id16

<400>21

gatgcctccacctgtagaac20

<210>22

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id17

<400>22

gaaggaatggaggatatcgc20

<210>23

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id18

<400>23

gatccaaggaccatcgactg20

<210>24

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id19

<400>24

ccactggaacctgacaaccg20

<210>25

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id20

<400>25

ctgcttcttcctggaactca20

<210>26

<211>66

<212>dna

<213>artificialsequence

<220>

<223>free5'surfaceprobe-a

<220>

<221>misc_feature

<222>(66)..(66)

<223>3'-terminusaminolinkerwithac7spacer

<400>26

gcgttcagagtggcagtcgagatcacgcggcaatcatatcggacagatcggaagagcgta60

gtgtag66

<210>27

<211>66

<212>dna

<213>artificialsequence

<220>

<223>free5'surfaceprobe-u

<220>

<221>misc_feature

<222>(66)..(66)

<223>3'-terminusaminolinkerwithac7spacer

<400>27

gcgttcagagtggcagtcgagatcacgcggcaatcatatcggacggctgctggtaaatag60

agatca66

<210>28

<211>23

<212>dna

<213>artificialsequence

<220>

<223>lp'

<400>28

ttcagagtggcagtcgagatcac23

<210>29

<211>18

<212>dna

<213>artificialsequence

<220>

<223>id'

<400>29

gcggcaatcatatcggac18

<210>30

<211>22

<212>dna

<213>artificialsequence

<220>

<223>a'22bpmutymismatch

<400>30

agatcggaagagcgtagtgtag22

<210>31

<211>22

<212>dna

<213>artificialsequence

<220>

<223>u'22bpmutymismatch

<400>31

ggctgctggtaaatagagatca22

<210>32

<211>33

<212>dna

<213>artificialsequence

<220>

<223>illuminaamplificationhandlea

<400>32

acactctttccctacacgacgctcttccgatct33

<210>33

<211>35

<212>dna

<213>artificialsequence

<220>

<223>universalamplificationhandleu

<400>33

aagtgtggaaagttgatcgctatttaccagcagcc35

<210>34

<211>45

<212>dna

<213>artificialsequence

<220>

<223>capturelppoly-dtvn

<220>

<221>misc_feature

<222>(1)..(1)

<223>phosphorylated

<220>

<221>misc_feature

<222>(45)..(45)

<223>nisa,c,g,ort

<400>34

gtgatctcgactgccactctgaattttttttttttttttttttvn45

<210>35

<211>47

<212>dna

<213>artificialsequence

<220>

<223>capturelppoly-d24t

<220>

<221>misc_feature

<222>(1)..(1)

<223>phosphorylated

<400>35

gtgatctcgactgccactctgaatttttttttttttttttttttttt47

<210>36

<211>21

<212>dna

<213>artificialsequence

<220>

<223>illuminaamplificationhandleb

<400>36

agacgtgtgctcttccgatct21

<210>37

<211>20

<212>dna

<213>artificialsequence

<220>

<223>universalamplificationhandlex

<400>37

acgtctgtgaatagccgcat20

<210>38

<211>29

<212>dna

<213>artificialsequence

<220>

<223>br6handle(orx)

<220>

<221>misc_feature

<222>(22)..(29)

<223>nisa,c,g,ort

<400>38

agacgtgtgctcttccgatctnnnnnnnn29

<210>39

<211>31

<212>dna

<213>artificialsequence

<220>

<223>br8handle(orx)

<220>

<221>misc_feature

<222>(22)..(31)

<223>nisa,c,g,ort

<400>39

agacgtgtgctcttccgatctnnnnnnnnnn31

<210>40

<211>43

<212>dna

<213>artificialsequence

<220>

<223>bpolytvn(orx)

<220>

<221>misc_feature

<222>(43)..(43)

<223>nisa,c,g,ort

<400>40

agacgtgtgctcttccgatctttttttttttttttttttttvn43

<210>41

<211>45

<212>dna

<213>artificialsequence

<220>

<223>bpoly24t(orx)

<400>41

agacgtgtgctcttccgatcttttttttttttttttttttttttt45

<210>42

<211>53

<212>dna

<213>artificialsequence

<220>

<223>aphandle

<400>42

acactctttccctacacgacgctcttccgatctatctcgactgccactctgaa53

<210>43

<211>20

<212>dna

<213>artificialsequence

<220>

<223>beta-2microglobulin(b2m)primer

<400>43

tgggggtgagaattgctaag20

<210>44

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id-1primer

<400>44

ccttctccttctccttcacc20

<210>45

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id-5primer

<400>45

gtcctctattccgtcaccat20

<210>46

<211>20

<212>dna

<213>artificialsequence

<220>

<223>id-20primer

<400>46

ctgcttcttcctggaactca20

<210>47

<211>20

<212>dna

<213>artificialsequence

<220>

<223>forward-genomicdnahumanprimer

<400>47

gactgctcttttcacccatc20

<210>48

<211>18

<212>dna

<213>artificialsequence

<220>

<223>reverse-genomicdnahumanprimer

<400>48

ggagctgctggtgcaggg18

<210>49

<211>20

<212>dna

<213>artificialsequence

<220>

<223>p-labelspecificprimer

<400>49

atctcgactgccactctgaa20

<210>50

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe1

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>50

uuuuuacactctttccctacacgacgctcttccgatctgtccgatatgattgccgctttt60

ttttttttttttttttvn78

<210>51

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe2

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>51

uuuuuacactctttccctacacgacgctcttccgatctatgagccgggttcatctttttt60

ttttttttttttttttvn78

<210>52

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe3

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>52

uuuuuacactctttccctacacgacgctcttccgatcttgaggcactctgttgggatttt60

ttttttttttttttttvn78

<210>53

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe4

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>53

uuuuuacactctttccctacacgacgctcttccgatctatgattagtcgccattcgtttt60

ttttttttttttttttvn78

<210>54

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe5

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>54

uuuuuacactctttccctacacgacgctcttccgatctacttgagggtagatgttttttt60

ttttttttttttttttvn78

<210>55

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe6

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>55

uuuuuacactctttccctacacgacgctcttccgatctatggccaatactgttatctttt60

ttttttttttttttttvn78

<210>56

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe7

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>56

uuuuuacactctttccctacacgacgctcttccgatctcgctaccctgattcgacctttt60

ttttttttttttttttvn78

<210>57

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe8

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>57

uuuuuacactctttccctacacgacgctcttccgatctgcccactttcgccgtagttttt60

ttttttttttttttttvn78

<210>58

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe9

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>58

uuuuuacactctttccctacacgacgctcttccgatctagcaactttgagcaagattttt60

ttttttttttttttttvn78

<210>59

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe10

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>59

uuuuuacactctttccctacacgacgctcttccgatctgccaattcggaattccggtttt60

ttttttttttttttttvn78

<210>60

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe11

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>60

uuuuuacactctttccctacacgacgctcttccgatcttcgcccaaggtaatacattttt60

ttttttttttttttttvn78

<210>61

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe12

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>61

uuuuuacactctttccctacacgacgctcttccgatcttcgcatttcctattcgagtttt60

ttttttttttttttttvn78

<210>62

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe13

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>62

uuuuuacactctttccctacacgacgctcttccgatctttgctaaatctaaccgcctttt60

ttttttttttttttttvn78

<210>63

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe14

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>63

uuuuuacactctttccctacacgacgctcttccgatctggaattaaattctgatggtttt60

ttttttttttttttttvn78

<210>64

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe15

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>64

uuuuuacactctttccctacacgacgctcttccgatctcattacataggtgctaagtttt60

ttttttttttttttttvn78

<210>65

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe16

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>65

uuuuuacactctttccctacacgacgctcttccgatctattgacttgcgctcgcactttt60

ttttttttttttttttvn78

<210>66

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe17

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>66

uuuuuacactctttccctacacgacgctcttccgatctatagtatctcccaagttctttt60

ttttttttttttttttvn78

<210>67

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe18

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>67

uuuuuacactctttccctacacgacgctcttccgatctgtgcgcctgtaatccgcatttt60

ttttttttttttttttvn78

<210>68

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe19

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>68

uuuuuacactctttccctacacgacgctcttccgatctgcgccactctttaggtagtttt60

ttttttttttttttttvn78

<210>69

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe20

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>69

uuuuuacactctttccctacacgacgctcttccgatcttatgcaagtgattggctttttt60

ttttttttttttttttvn78

<210>70

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe21

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>70

uuuuuacactctttccctacacgacgctcttccgatctccaagccacgtttatacgtttt60

ttttttttttttttttvn78

<210>71

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe22

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>71

uuuuuacactctttccctacacgacgctcttccgatctacctgattgctgtataactttt60

ttttttttttttttttvn78

<210>72

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe23

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>72

uuuuuacactctttccctacacgacgctcttccgatctcagcgcatctatcctctatttt60

ttttttttttttttttvn78

<210>73

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe24

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>73

uuuuuacactctttccctacacgacgctcttccgatcttccacgcgtaggactagttttt60

ttttttttttttttttvn78

<210>74

<211>78

<212>dna

<213>artificialsequence

<220>

<223>probe25

<220>

<221>misc_feature

<222>(78)..(78)

<223>nisa,c,g,toru

<400>74

uuuuuacactctttccctacacgacgctcttccgatctcgactaagtatgtagcgctttt60

ttttttttttttttttvn78

<210>75

<211>30

<212>dna

<213>artificialsequence

<220>

<223>frameprobe-layout1

<400>75

aaatttcgtctgctatcgcgcttctgtacc30

<210>76

<211>21

<212>dna

<213>artificialsequence

<220>

<223>fluorescentmarkerprobeps1

<220>

<221>misc_feature

<222>(21)..(21)

<223>coupledtocyanine3fluorescentdye

<400>76

ggtacagaagcgcgatagcag21

<210>77

<211>33

<212>dna

<213>artificialsequence

<220>

<223>secondstrandsynthesisandfirstpcramplificationhandle-aprimer

<400>77

acactctttccctacacgacgctcttccgatct33

<210>78

<211>43

<212>dna

<213>artificialsequence

<220>

<223>secondstrandsynthesisandfirstpcramplificationhandle-bdt20vnprimer

<220>

<221>misc_feature

<222>(43)..(43)

<223>nisa,c,g,ort

<400>78

agacgtgtgctcttccgatctttttttttttttttttttttvn43

<210>79

<211>43

<212>dna

<213>artificialsequence

<220>

<223>customsequencingprimerbr2

<400>79

tcagacgtgtgctcttccgatcttttttttttttttttttttt43

<210>80

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe1

<400>80

gcgttcagagtggcagtcgagatcacgcggcaatcatatcggacagatcggaagagcgta60

gtgtag66

<210>81

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe2

<400>81

gcgttcagagtggcagtcgagatcacaagatgaacccggctcatagatcggaagagcgta60

gtgtag66

<210>82

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe3

<400>82

gcgttcagagtggcagtcgagatcactcccaacagagtgcctcaagatcggaagagcgta60

gtgtag66

<210>83

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe4

<400>83

gcgttcagagtggcagtcgagatcaccgaatggcgactaatcatagatcggaagagcgta60

gtgtag66

<210>84

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe5

<400>84

gcgttcagagtggcagtcgagatcacaaacatctaccctcaagtagatcggaagagcgta60

gtgtag66

<210>85

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe6

<400>85

gcgttcagagtggcagtcgagatcacgataacagtattggccatagatcggaagagcgta60

gtgtag66

<210>86

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe7

<400>86

gcgttcagagtggcagtcgagatcacggtcgaatcagggtagcgagatcggaagagcgta60

gtgtag66

<210>87

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe8

<400>87

gcgttcagagtggcagtcgagatcacactacggcgaaagtgggcagatcggaagagcgta60

gtgtag66

<210>88

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe9

<400>88

gcgttcagagtggcagtcgagatcacatcttgctcaaagttgctagatcggaagagcgta60

gtgtag66

<210>89

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe10

<400>89

gcgttcagagtggcagtcgagatcacccggaattccgaattggcagatcggaagagcgta60

gtgtag66

<210>90

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe11

<400>90

gcgttcagagtggcagtcgagatcacatgtattaccttgggcgaagatcggaagagcgta60

gtgtag66

<210>91

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe12

<400>91

gcgttcagagtggcagtcgagatcacctcgaataggaaatgcgaagatcggaagagcgta60

gtgtag66

<210>92

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe13

<400>92

gcgttcagagtggcagtcgagatcacggcggttagatttagcaaagatcggaagagcgta60

gtgtag66

<210>93

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe14

<400>93

gcgttcagagtggcagtcgagatcacccatcagaatttaattccagatcggaagagcgta60

gtgtag66

<210>94

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe15

<400>94

gcgttcagagtggcagtcgagatcaccttagcacctatgtaatgagatcggaagagcgta60

gtgtag66

<210>95

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe16

<400>95

gcgttcagagtggcagtcgagatcacgtgcgagcgcaagtcaatagatcggaagagcgta60

gtgtag66

<210>96

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe17

<400>96

gcgttcagagtggcagtcgagatcacgaacttgggagatactatagatcggaagagcgta60

gtgtag66

<210>97

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe18

<400>97

gcgttcagagtggcagtcgagatcactgcggattacaggcgcacagatcggaagagcgta60

gtgtag66

<210>98

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe19

<400>98

gcgttcagagtggcagtcgagatcacctacctaaagagtggcgcagatcggaagagcgta60

gtgtag66

<210>99

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe20

<400>99

gcgttcagagtggcagtcgagatcacaagccaatcacttgcataagatcggaagagcgta60

gtgtag66

<210>100

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe21

<400>100

gcgttcagagtggcagtcgagatcaccgtataaacgtggcttggagatcggaagagcgta60

gtgtag66

<210>101

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe22

<400>101

gcgttcagagtggcagtcgagatcacgttatacagcaatcaggtagatcggaagagcgta60

gtgtag66

<210>102

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe23

<400>102

gcgttcagagtggcagtcgagatcactagaggatagatgcgctgagatcggaagagcgta60

gtgtag66

<210>103

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe24

<400>103

gcgttcagagtggcagtcgagatcacactagtcctacgcgtggaagatcggaagagcgta60

gtgtag66

<210>104

<211>66

<212>dna

<213>artificialsequence

<220>

<223>probe25

<400>104

gcgttcagagtggcagtcgagatcacgcgctacatacttagtcgagatcggaagagcgta60

gtgtag66

<210>105

<211>30

<212>dna

<213>artificialsequence

<220>

<223>frameprobe-layout1

<400>105

aaatttcgtctgctatcgcgcttctgtacc30

<210>106

<211>45

<212>dna

<213>artificialsequence

<220>

<223>captureprobe-lppoly-dtvn

<220>

<221>misc_feature

<222>(45)..(45)

<223>nisa,c,g,ort

<400>106

gtgatctcgactgccactctgaattttttttttttttttttttvn45

<210>107

<211>33

<212>dna

<213>artificialsequence

<220>

<223>amplificationhandleprobea-handle

<400>107

acactctttccctacacgacgctcttccgatct33

<210>108

<211>33

<212>dna

<213>artificialsequence

<220>

<223>secondstrandsynthesisandfirstpcramplificationhandle-aprimer

<400>108

acactctttccctacacgacgctcttccgatct33

<210>109

<211>43

<212>dna

<213>artificialsequence

<220>

<223>secondstrandsynthesisandfirstpcramplificationhandle-bdt20vnprimer

<220>

<221>misc_feature

<222>(43)..(43)

<223>nisa,c,g,ort

<400>109

agacgtgtgctcttccgatctttttttttttttttttttttvn43

<210>110

<211>33

<212>dna

<213>artificialsequence

<220>

<223>secondpcr-aprimer

<400>110

acactctttccctacacgacgctcttccgatct33

<210>111

<211>34

<212>dna

<213>artificialsequence

<220>

<223>secondpcr-bprimer

<400>111

gtgactggagttcagacgtgtgctcttccgatct34

<210>112

<211>39

<212>dna

<213>artificialsequence

<220>

<223>templateswitchingprimer-longb

<220>

<221>misc_feature

<222>(37)..(39)

<223>ribonucleotides

<400>112

gtgactggagttcagacgtgtgctcttccgatctatggg39

<210>113

<211>33

<212>dna

<213>artificialsequence

<220>

<223>spatialgenomics-aprimer

<400>113

acactctttccctacacgacgctcttccgatct33

<210>114

<211>39

<212>dna

<213>artificialsequence

<220>

<223>spatialgenomics-ba431chr2+2fwa

<400>114

agacgtgtgctcttccgatcttggctgcctgaggcaatg39

<210>115

<211>43

<212>dna

<213>artificialsequence

<220>

<223>spatialgenomics-ba431chr2+2rea

<400>115

agacgtgtgctcttccgatctctcgctaacaagcagagagaac43

<210>116

<211>40

<212>dna

<213>artificialsequence

<220>

<223>spatialgenomics-ba431chr3+7fwb

<400>116

agacgtgtgctcttccgatcttgagaacaagggggaagag40

<210>117

<211>41

<212>dna

<213>artificialsequence

<220>

<223>spatialgenomics-ba431chr3+7reb

<400>117

agacgtgtgctcttccgatctcggtgaaacaagcaggtaac41

<210>118

<211>41

<212>dna

<213>artificialsequence

<220>

<223>spatialgenomics-bnt1fw

<400>118

agacgtgtgctcttccgatctcattcccacactcatcacac41

<210>119

<211>40

<212>dna

<213>artificialsequence

<220>

<223>spatialgenomics-bnt1re

<400>119

agacgtgtgctcttccgatcttcacactggagaaagaccc40

<210>120

<211>43

<212>dna

<213>artificialsequence

<220>

<223>spatialgenomics-bnt2fw

<400>120

agacgtgtgctcttccgatctggggttcagagtgatttttcag43

<210>121

<211>40

<212>dna

<213>artificialsequence

<220>

<223>spatialgenomics-bnt2re

<400>121

agacgtgtgctcttccgatcttccgttttctttcagtgcc40

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1