检测样品中生物靶标的空间分布的方法和系统与流程

文档序号:21789758发布日期:2020-08-07 20:43阅读:345来源:国知局
检测样品中生物靶标的空间分布的方法和系统与流程

本申请是申请号为201480047128.1(pct/us2014/044196),申请日为2014年06月25日,发明名称为“检测样品中生物靶标的空间分布的方法和系统”的发明专利申请的分案申请。

相关申请

本申请要求享有以下优先权:2013年6月25日提交,申请号为61/839,320,名称为“采用微流体装置空间的编译的生物分析”的美国临时申请,以及2013年6月25日提交,申请号为61/839,313,名称为“检测样品中生物靶标物的空间布局的方法和系统”的美国临时申请,它们公开的内容通过引用的方式并入本申请。在一些实施例中,本申请与申请号为pct/us2014/___,提交日期为2014年6月25日,代理案卷号为699932000340,名称为“采用微流控装置的空间编码生物分析”相关,其公开的内容通过引用的方式整体并入本申请。

本发明是在美国国立综合医学研究所,美国卫生和公众服务部的授权项目r43gm096706,以及美国国立人类基因组研究所授权项目r43hg006223的支持下进行。美国政府可以拥有本发明的部分权利。

本申请主要涉及生物分子的分析,并具体涉及检测样品中一种或多种生物靶标的丰度、表达和/或活性的空间分布的方法、成分和分析系统。



背景技术:

在接下来的讨论中,出于背景介绍的目的描述了一些具体的文章和方法。本文包含的任何内容都不应被解释为对现有技术的“承认”。申请人特别保留了在适当的情况下做出如下证明的权利:根据适用的法律规定,本文引用的文章和方法不构成现有技术。

综合的基因表达分析和蛋白分析已经成为了解生物机制的有用工具。使用这些工具可以鉴定发育过程中和各类疾病(例如癌症和自身免疫疾病)中涉及的基因和蛋白。传统的方法,例如不同转录物的原位杂交和其它多重检测,已经揭示了基因表达的空间分布,并帮助阐明了发育和疾病的分子基础。可以对每份样品中的多个rna序列进行定量分析的其它技术包括微阵列(详见shietal.,naturebiotechnology,24(9):1151-61(2006);和slonimandyanai,ploscomputationalbiology,5(10):e1000543(2009));基因表达连续分析(sage)(详见velculescuetal.,science,270(5235):484-87(1995));qpcr的高通量操作(详见spurgeonetal.,plosone,3(2):e1662(2008));原位pcr(详见nuovo,genomeres.,4:151-67(1995));以及转录组测序技术(rna-seq)(详见mortazavietal.,naturemethods,5(7):621-8(2008))。虽然这些方法很有用,但是它们不能同时测量样品中多个空间位置的多个基因的表达或多种蛋白的存在和/或活性。

激光捕获显微解剖技术可以在少量位点分析多个基因,但该技术非常昂贵,费力,并且不好测量。某些2d形式的pcr分析保存了空间信息(详见armanietal.,labonachip,9(24):3526-34(2009)),但这些方法空间分辨率低,因为它们依赖于将组织物理转移至反应孔,这也会阻止随机接触(待定)组织样品和高水平倍增。

目前,有必要在高分辨率下同时分析大量基因、蛋白、或其它生物活性分子的空间表达模式。也是有必要分析组织中生物分子的可重复的、高分辨率的空间地图。本申请的公开满足了这些需求。



技术实现要素:

一方面,本申请公开了一种检测生物样品中多个位点上的一种或多种生物靶标的丰度、表达和/或活性的空间分布的方法,包括:

将用于一个或多个生物靶标的每个生物靶标的探针传递给样品中的多个位点,其中每个探针包括:(1)靶标结合部,能够结合到所述探针的对应生物靶标;(2)地址标签,其识别所述探针被送达的所述多个位点的每个位点;和(3)识别标签,其识别所述探针的对应生物靶标或靶标结合部;

让每个探针结合到样品中它相应的生物靶标上;

分析结合到所述一个或多个生物靶标的所述探针,所述分析包括:(1)通过评估结合到所述生物靶标上的所述探针的量来确定所述一个或多个生物靶标中的每一个的丰度、表达、和/或活性;和(2)确定所述探针的所述识别标签和所述地址标签的身份;和

基于所述分析确定所述样品中多个位点上的一个或多个所述生物靶标的丰度、表达、和/或活性的空间分布。在一些实施例中,所述方法不依赖于图像技术来确定所述样品中一个或多个所述生物靶标的空间信息。在一个实施例中,对结合到一个或多个所述生物靶标的探针的分析可以采用测序来完成,其中测序产物的数量指示所述一个或多个所述生物靶标中每一个的丰度、表达、和/或活性,并且所述测序产物可包括所述地址标签的序列的全部或部分以及识别标签序列的全部或部分。

另一方面,本申请公开了一种确定样品中多个位点上的一个或多个生物靶标的丰度、表达、和/或活性的空间分布的方法,包括:

将用于一个或多个生物靶标的每个生物靶标的探针传递给样品中的多个位点,其中每个探针包括:(1)靶标结合部,能够结合到所述探针的对应生物靶标;和(2)识别标签,其用于识别所述探针的对应生物靶标或靶标结合部;

让每个探针结合到样品中它相应的生物靶标上;

向所述样品中的所述多个位点中的每个位点传送地址标签,其中所述地址标签用于与结合到所述生物靶标的所述探针配对并识别所述地址标签被送达的位点;

分析结合到所述一个或多个生物靶标的所述探针/地址标签结合物,所述分析包括:(1)通过评估结合到所述生物靶标上的所述探针/地址标签结合物的量来确定所述一个或多个生物靶标中的每一个靶标的丰度、表达、和/或活性;和(2)确定识别标签以及所述探针/地址标签结合物中所述地址标签的身份;以及

基于所述分析确定所述样品中多个位点上的一个或多个所述生物靶标的丰度、表达、和/或活性的空间分布。在一些实施例中,所述方法不依赖于图像技术来确定所述样品中一个或多个所述生物靶标的空间信息。在一个实施例中,可以采用测序来对结合到一个或多个所述生物靶标的探针/地址标签进行分析,其中测序产物的数量指示所述一个或多个所述生物靶标中每一个的丰度、表达、和/或活性,并且所述测序产物可包括所述地址标签序列的全部或部分以及识别标签序列的全部或部分。.

在任一前述实施例或它们的任意结合中,所述一个或多个生物靶标可以是非核苷酸分子。在任一前述实施例中,所述一个或多个生物靶标可以包括蛋白、脂质、碳水化合物,或它们的任意组合。在前述任一实施例中,识别样品中所述几多个位点中每一个位点的地址标签至少有两个。

在前述任一实施例中,多个生物靶标的丰度、表达、和/或活性的空间分布可以并行检测,并且在所述样品的多个位点中的指定位点上,所述多个生物靶标中每个靶标上所述地址标签或地址标签的组合可以是相同的。在前述任一实施例中,所述分析步骤可以在同一个反应进程中并行操作。

在前述任一实施例或其任意组合中,所述一个或多个生物靶标可以包括所述样品的至少一个已知标记,例如,组织特异性标记、细胞类型标记、细胞系标记、细胞形态学标记、细胞周期标记、细胞坏死标记、发育阶段标记、干细胞或祖细胞标记、分化状态标记、表型标记、生理学标记或病理生理学标志、转化状态标记、癌症标记或它们的组合。

在另一些实施例中,本申请提供了一种确定样品中多个位点上的靶标蛋白的丰度、表达,和/或活性的空间分布的方法,包括:

将用于靶标蛋白的探针传送给样品中的多个位点;其中所述探针包括:(1)靶标结合部,能结合所述靶标蛋白;(2)第一地址标签,其识别所述探针被传送到的所述多个位点中的每个位点,以及(3)识别标签,其识别所述靶标蛋白或所述靶标结合部;

让所述探针结合到所述样品中的所述靶标蛋白上;

分析结合到所述靶标蛋白的探针,所述分析包括:(1)通过评估结合到所述靶标蛋白的所述探针的量来确定所述靶标蛋白的丰度、表达、和/或活性;和(2)确定用于所述靶标蛋白的所述识别标签和所述第一地址标签的身份;以及

基于所述分析确定样品中所述多个位点上的靶标蛋白的丰度、表达,和/或活性的空间分布。

在前述任一实施例中,所述方法还可以包括:

将用于靶标多聚核苷酸的探针传送给所述样品中所述多个位点中的每个位点,其中所述用于靶标多聚核苷酸的探针包括:(1)用于杂交并识别所述靶标多聚核苷酸的序列;(2)第二地址标签,其识别用于靶标多聚核苷酸的探针被传送到的所述多个位点中的每个位点;

让用于靶标多聚核苷酸的探针结合到所述样品中的靶标多聚核苷酸;

分析结合到靶标多聚核苷酸的探针,所述分析包括:(1)通过评估结合到所述靶标多聚核苷酸的探针的量确定所述靶标多聚核苷酸的丰度、表达、和/或活性;和(2)确定用于杂交并识别所述靶标多聚核苷酸的序列以及用于所述靶标多聚核苷酸的探针的第二地址标签的身份;并且

基于对结合到样品中所述多个位点的每个位点上的靶标多聚核苷酸的探针的分析确定样品中所述多个位点上的所述靶标多聚核苷酸的丰度、表达、和/或活性的空间分布。

在另一方面,本发申请公开了一种确定样品中多个位点上的靶标蛋白的丰度、表达,和/或活性的空间分布的方法,包括:

将用于靶标蛋白的探针传送给样品的多个位点,其中所述探针包括:(1)靶标结合部,能结合所述靶标蛋白;以及(2)识别标签,其识别所述靶标蛋白或所述蛋白结合部;

让所述探针结合到所述样品中的所述靶标蛋白上;

将第一地址标签传送给所述样品的所述多个位点中每个位点,其中所述第一地址标签用于与结合在所述靶标蛋白上的所述探针结合并识别所述探针被送达的所述位点,

分析结合到所述靶标蛋白的所述探针/第一地址标签结合物,所述分析包括:(1)通过评估结合到所述靶标蛋白的所述探针/第一地址标签结合的量来确定所述靶标蛋白的丰度、表达、和/或活性;和(2)确定所述识别标签以及所述探针/第一地址标签结合物中第一地址标签的身份;以及

基于所述分析确定样品中所述多个位点上的所述靶标蛋白的丰度、表达,和/或活性的空间分布。

在前述任一实施例中,所述方法还包括:

将用于靶标多聚核苷酸的探针传送给所述样品中所述多个位点中的每个位点,其中所述用于靶标多聚核苷酸的探针包括用于杂交并识别所述靶标多聚核苷酸的序列。

让用于所述靶标多聚核苷酸的探针结合到所述样品中的所述靶标多聚核苷酸;

将所述样品中的所述多个位点中的每个位点传送第二地址标签,其中所述第二地址标签用于与结合到所述靶标多聚核苷酸的所述探针结合并识别它被送达的位点;

分析结合到靶标多聚核苷酸的探针/第二地址标签结合物,所述分析包括:(1)通过评估结合到所述靶标多聚核苷酸的探针/第二地址标签结合物的量确定所述靶标多聚核苷酸的丰度、表达、和/或活性;和(2)确定用于杂交并识别所述靶标多聚核苷酸的序列的身份以及用于所述靶标多聚核苷酸的所述探针/第二地址标签结合物中第二地址标签结合的身份;并且

基于对结合到样品中所述多个位点中每个位点上的靶标多聚核苷酸的探针/第二地址标签结合物的分析确定样品中所述多个位点上的所述靶标多聚核苷酸的丰度、表达、和/或活性的空间分布。

一个实施例中,所述靶标多聚核苷酸或其互补物可以编码完整的所述靶标蛋白或其一部分。在一些实施例中,分析结合到所述靶标蛋白的所述探针或探针/第一地址标签结合物的步骤以及分析结合到所述靶标蛋白的所述探针或探针/第二地址标签结合物的步骤可以在一个反应过程中并行操作。在其它方面,对于样品中所述多个位点中的指定位点,所述第一地址标签和第二地址标签可以是相同的。在另外一些方面,对于样品中所述多个位点中的指定位点,所述第一地址标签和第二地址标签可以是不同的。在任一前述实施例中,所述方法还包括关联样品中所述多个位点中每个位点的所述靶标蛋白的丰度、表达,和/或活性和所述靶标多聚核苷酸的丰度、表达,和/或活性。

前述任一实施例或其任意组合中,所述生物靶标或靶标蛋白可以包括酶活性。在一些方面,前述任一实施例中所述探针的所述靶标结合部可以包括抗体或抗体的抗原结合片段、适配体、小分子、酶底物、公认的酶底物,亲和捕捉剂或它们的组合物。

在前述任一实施例或其任意组合中,所述靶标结合部结合到包含有所述识别标签的多聚核苷酸上。在前述任一实施例中,所述靶标结合部可结合到能够与包含有所述识别标签的多聚核苷酸特异性杂交的多聚核苷酸上。在一些方面,所述探针可包括多个靶标结合部,其能够结合到所述靶标的相同结构域或不同结构域上,或能够结合到不同靶标上。

在前述任一实施例或其任意组合中,所述样品可以选自新鲜分离样品、固定样品、冷冻样品、嵌入式样品、加工样品或它们的组合组成的组中的生物样品。

在前述任一实施例或其任意组合中,识别样品中所述多个位点中每一个位点的所述地址标签可以有两个。在一些方面,可以将两个用于每个靶标的探针传送给所述样品。

在前述任一实施例或它们的任意组合中,所述地址标签可包括寡核苷酸。在另一方面,前述任一实施例中的所述识别标签可以包括寡核苷酸。

在前述任一实施例或它们的任意组合中,所述分析步骤可采用核酸测序技术。在一方面,所述分析步骤可采用高通量数字核酸测序技术。

在前述任一实施例或它们的任意组合中,样品中被分析的靶标的数量以及被分析的多个位点的数量的结果可以大于20,大于50,大于75,大于100,大于1,000,大于10,000,大于100,000,或大于1,000,000。

在前述任一实施例或其任意组合中,可平行分析至少100,000,至少500,000,或至少1,000,000个结合到所述靶标的探针或探针/地址标签结合物。

在前述任一实施例或其任意组合中,采用软件编程的硬件进行所述传送步骤、分析步骤和测定步骤中的至少两个步骤。在前述任一实施例或其任意组合中,采用一个或多个微流控装置进行所述传送步骤。

在前述任一实施例或其任意组合中,用于所述生物靶标的探针、靶标蛋白的探针,或靶标多聚核苷酸的探针中的已知百分比的探针可以是衰减探针。一方面,所述衰减探针可限制扩增产物的产量。例如,衰减探针可以与用于结合到靶标物的活性探针相竞争。当活性探针导致所述靶标的扩增产物产生时,衰减探针不降低或已经降低产生扩增产物的能力。在一个采用核酸探针的实施例中,所述衰减探针可以缺少5’磷酸。

在前述任一实施例或其任意组合中,所述地址标签可以通过连接、延伸、延伸后连接或它们的任意组合来结合到所述探针上。

在前述任一实施例或其任意组合中,所述方法可进一步包括根据多个样品的每个靶标的丰度、表达,和/或活性的空间分布构建每个靶标的丰度、表达,和/或活性的三维图形。在一方面,所述多个样品可以是三维组织样品的连续组织切片。

在另一方面,本申请提供了一种测定样品中多个位点的一个或多个生物靶标的丰度、表达、和/或活性的空间分布的系统,包括:

第一模块,用于将一个或多个生物靶标的探针传送到样品中的多个位点,其中每个探针包括:(1)靶标结合部,能够结合到所述探针的对应生物靶标;和(2)识别标签,其用于识别所述探针的对应生物靶标或靶标结合部;

第二模块,用于将地址标签传送到样品中所述多个位点中的每个位点,其中所述地址标签用于与结合到生物标签的探针相结合并识别所述地址标签被送达的所述位点;

第三模块,用于分析结合到一个或多个生物靶标的探针/地址标签结合物,所述分析包括:(1)通过评估结合到所述生物靶标上的所述探针/地址标签结合物的量来确定所述一个或多个生物靶标中的每一个靶标的丰度、表达、和/或活性;和(2)确定识别标签以及所述探针/地址标签结合物中的所述地址标签的身份;以及

第四模块,用于基于所述分析确定所述样品中多个位点上的一个或多个所述生物靶标的丰度、表达、和/或活性的空间分布。在一方面,所述系统不依赖于图像技术来确定所述样品中一个或多个所述生物靶标的空间信息。

在一个实施例中,所述第二模块可包括一个或多个微流控装置用于传送所述地址标签。在一方面,所述一个或多个微流控装置可包括第一组复合寻址通道,每个通道向所述样品传送不同的第一地址标签。在一个实施例中,所述一个或多个微流控装置还可包括第二组复合寻址通道,没个通道向所述样品传送不同的第二地址标签。在一方面,所述样品中的多个位点分别被所述第一组复合寻址通道和第二组复合寻址通道合作传送第一地址标签和第二地址标签到所述多个位点中的每个位点进行选择,每个位点被第一和第二地址标签的不同组合识别。

在另一个实施例中,公开了一种方法,包括:传送用于一个或多个生物靶标的每个生物靶标的探针给样品中的多个位点,其中每个探针包括靶标结合部,其能够结合到所述探针的对应生物靶标;让每个所述探针结合到所述样品中相应的生物靶标上;传送至少一个接头到所述样品的所述多个位点,其中所述至少一个接头特异性结合到所述探针上并且包括一个能识别所述至少一个接头被送达的所述多个位点中的每个位点的地址标签,其中所述探针和/或所述接头包括一个识别标签,其识别所述探针和/或所述接头的相应的生物靶标或靶标结合部;分析结合到所述一个或多个所述生物靶标的所述自少一个接头和所述探针,所述分析包括:(1)通过评估结合到所述生物靶标的所述自少一个接头的量来确定所述生物靶标的丰度、表达、和/或活性;和(2)确定所述识别标签以及所述自少一个接头的地址标签的身份;基于所述分析确定所述样品中多个位点上的一个或多个所述生物靶标的丰度、表达、和/或活性的空间分布。在一方面,所述系统不依赖于图像技术来确定所述样品中一个或多个所述生物靶标的空间信息。

再另一个实施例中,公开了一种方法,包括:传送用于一个或多个生物靶标的每个生物靶标的探针给样品中的多个位点,其中每个探针包括靶标结合部,其能够结合到所述探针的对应生物靶标;让每个所述探针结合到所述样品中相应的生物靶标上;传送至少一个接头到所述样品的所述多个位点,其中所述至少一个接头特异性结合到所述探针上并且包括一个能识别所述至少一个接头被送达的所述多个位点中的每个位点的地址标签,其中所述探针和/或所述接头包括一个识别标签,其识别所述探针和/或所述接头的相应生物靶标或靶标结合部;采用测序技术分析结合到所述一个或多个所述生物靶标的所述自少一个接头和所述探针,其中测序产物的量指示所述生物靶标的丰度、表达、和/或活性;所述测序产物包括所述地址标签序列的部分或全部,以及所述识别标签序列的部分或全部;基于所述分析确定所述样品中多个位点上的一个或多个所述生物靶标的丰度、表达、和/或活性的空间分布。在一方面,所述系统不依赖于图像技术来确定所述样品中一个或多个所述生物靶标的空间信息。

在另一个实施例中,提供了一种方法,包括:传送用于一个或多个生物靶标的每个生物靶标的探针给样品中的多个位点,其中每个探针包括靶标结合部,其能够结合到所述探针的对应生物靶标;让每个所述探针结合到所述样品中相应的生物靶标上;传送至少一个接头到所述样品的所述多个位点,其中所述至少一个接头特异性结合到所述探针上并且包括一个能识别所述至少一个接头被送达的所述多个位点中的每个位点的地址标签,其中所述探针和/或所述接头包括一个识别标签,其识别所述探针和/或所述接头的相应生物靶标或靶标结合部;将地址标签传送给所述样品中的所述多个位点中的每个位点,其中所述地址标签用于与结合到所述生物靶标的所述至少一个接头结合并识别它被送达的位点;分析所述接头/地址标签结合物,所述分析包括:(1)通过评估结合到所述生物靶标的所述接头/地址标签结合物的量确定所述一个或多个生物靶标中每个的丰度、表达、和/或活性;和(2)确定识别标签以及所述接头/地址标签结合物中地址标签的身份;并且

基于所述分析确定样品中所述多个位点上的所述靶标多聚核苷酸的丰度、表达、和/或活性的空间分布。在一方面,所述方法不依赖于图像技术来确定所述样品中一个或多个所述生物靶标的空间信息。.

在又一实施例中,提供了一种方法,包括:传送用于一个或多个生物靶标的每个生物靶标的探针给样品中的多个位点,其中每个探针包括靶标结合部,其能够结合到所述探针的对应生物靶标;让每个所述探针结合到所述样品中相应的生物靶标上;传送至少一个接头到所述样品的所述多个位点,其中所述至少一个接头特异性结合到所述探针上并且包括一个能识别所述至少一个接头被送达的所述多个位点中的每个位点的地址标签,其中所述探针和/或所述接头包括一个识别标签,其识别所述探针和/或所述接头的相应生物靶标或靶标结合部;将地址标签传送给所述样品中的所述多个位点中的每个位点,其中所述地址标签用于与结合到所述生物靶标的所述至少一个接头结合并识别它被送达的位点;采用测序技术分析所述接头/地址标签结合物,其中测序产物的量指示所述生物靶标的丰度、表达、和/或活性;所述测序产物包括所述地址标签序列的部分或全部,以及所述识别标签序列的部分或全部;基于所述分析确定所述样品中多个位点上的一个或多个所述生物靶标的丰度、表达、和/或活性的空间分布。在一方面,所述系统不依赖于图像技术来确定所述样品中一个或多个所述生物靶标的空间信息。

在任一前述实施例中,至少两个接头被传送给所述样品中所述多个位点中的每个位点,其中所述至少两个接头每个特异性结合到一个特异性结合到生物靶标的探针上。一方面,所述至少两个接头是相连的,例如采用所述探针序列的一部分作为夹板进行连接。

在前述任一实施例中,用于一个和多个生物靶标中每个靶标的探针可以包括一个用于所述生物靶标的亲和部以及寡核苷酸,并且所述接头可以包括寡核苷酸。

图1是一个流程图,表示根据本发明的一个实施例记载的检测样品中多个位点上的一个或多个生物靶标的丰度、表达和/或活性的空间分布的方法的典型步骤。

图2是一个流程图,表示根据本发明的一个实施例记载的检测样品中多个位点上的一个或多个生物靶标的丰度、表达和/或活性的空间分布方法的典型步骤。

图3为根据本发明公开的一个实施例的组合寻址方案。

图4是根据本发明公开的实施例的应用于样品的组合寻址方案

图5是根据本发明公开的一个实施例的应用于样品的组合寻址方案。

图6表示根据本发明的多个实施例记载的应用于样品的采用组合寻址方案的多功能蛋白检测分析

图7表示根据本发明某些实施例记载的典型的抗体-dna结合结构。

图8是根据本发明公开的实施例的连续地址标签方案。

图9是根据本发明公开的一个实施例的微流控寻址装置。

图10提供本发明公开的一些实施例所产生的免疫荧光图像(图10a)以及代表性的表达图谱(图10b-c)。

图11表示根据本发明的一些实施例,在测序步骤中(图11a)减少随机错误的方法,及采用具有整合的x和y地址标签和可变标签区域z(figure11b)的探针的典型配置。

详细说明

以下提供了本发明请求保护的一个或多个实施例的详细说明,结合附图说明了要求保护的主题的构思。在此描述的请求保护的主题是与这些实施例有关的,但不限于任何实施例。需要理解的是,要求保护的主题可以以多种形式体现,包括大量可选方案,修改方案和等同方案。因此,本发明公开的具体内容不应该解释为限定,而应该作为权利要求的基础及用于指导本领域的技术人员以任何具体的系统,结构和方式使用本发明的代表性基础。为了能透彻的理解本发明的内容,大量详细的说明在下文中列出。提供详细的说明是为了这样一个目的:示例以及要求的主题可以在没有部分或全部的详细说明的情况下根据权利要求书来实施。需要理解的是,可以使用本发明的其它实施例并且可以在不脱离本发明要求保护的主题范围内做出结构上的改变。为澄清的目的,与本发明要求保护的主题有关的本技术领域已知的技术材料没有作详细描述,因此不是故意模糊化本发明要求保护的主题。

除非另有规定,本文中使用的所有技术名词、符号和其他技术与科技术语或用辞意为具有与本发明所属领域技术人员普遍理解的相同的含义。在一些实例中,出于清楚和/或参考的目的,本文中定义了具有普遍理解含义的术语,并且本文中这种定义的内容不应当被解释为表示与本领域普遍理解的含义有实质的不同。那些使用传统方法论的本领域技术人员能很好地理解和普遍使用本文中描述或引用的很多技术和方法。

所有公开,本申请参考的包括专利文件、科技文献和数据库,以及参考书目和附加文件,基于相同的目的通过引用的方式全部并入本发明中,就如每份公开的内容都被单独参考引用一样。如果本文提出的某个定义与本文通过引用并入的专利、申请、公开的申请和其他公开的内容中列出的定义矛盾或不一致,则以本文提出的定义为准。

除非另有说明,本申请的实施例的实施将运用到常规技术,在此描述的有机化学,聚合物技术,分子生物学(包括重组技术),细胞生物学,生物化学和测序技术,都在本领域一般技术人员具备的常规技能范围内。这些常规技术包括聚合物阵列合成、多聚核苷酸杂交和连接技术及使用标签的杂交检测技术。合适的技术的具体说明会通过引用示例在此描述。然而,其它等同的常规技术方法当然也是可以采用的。这些常规方法和说明都可以在标准实验手册中找到,例如:green,etal.,eds.,genomeanalysis:alaboratorymanualseries(vols.i-iv)(1999);weiner,gabriel,stephens,eds.,geneticvariation:alaboratorymanual(2007);dieffenbach,dveksler,eds.,pcrprimer:alaboratorymanual(2003);bowtellandsambrook,dnamicroarrays:amolecularcloningmanual(2003);mount,bioinformatics:sequenceandgenomeanazvsis(2004);sambrookandrussell,condensedprotocolsfrommolecularcloning:alaboratorymanual(2006);andsambrookandrussell,molecularcloning:alaboratorymanual(2002)(allfromcoldspringharborlaboratorypress);ausubeletal.eds.,currentprotocolsinmolecularbiology(1987);t.browned.,essentialmolecularbiology(1991),irlpress;goeddeled.,geneexpressiontechnology(1991),academicpress;a.bothwelletal.eds.,methodsforcloningandanalysisofeukaryoticgenes(1990),bartlettpubl.;m.kriegler,genetransferandexpression(1990),stocktonpress;r.wuetal.eds.,recombinantdnamethodology(1989),academicpress;m.mcphersonetal.,pcr:apracticalapproach(1991),irlpressatoxforduniversitypress;stryer,biochemistry(4thed.)(1995),w.h.freeman,newyorkn.y.;gait,oligonucleotidesynthesis:apracticalapproach(2002),irlpress,london;nelsonandcox,lehninger,principlesofbiochemistry(2000)3rded.,w.h.freemanpub.,newyork,n.y.;berg,etal.,biochemistry(2002)5thed.,w.h.freemanpub.,newyork,n.y.;d.weir&c.blackwell,eds.,handbookofexperimentalimmunology(1996),wiley-blackwell;a.abbasetal.,cellularandmolecularimmunology(1991,1994),w.b.saundersco.;andj.coliganetal.eds.,currentprotocolsinimmunology(1991),所有这些文献都通过引用被完整并入本发明。

如本文和附录权利要求中所使用的,除非上下文中有明确的规定,单数形式“a”,“an”和“the”均包括复数指称对象。例如,“一”或“一个”表示“至少一个”或“一个或多个”。因此,文中的“一个生物靶标”指的是一个或多个生物靶标,文中的“方法”包括引用的等同步骤和本发明公开的方法和/或本领域技术人员已知的等同步骤和方法,等等。

贯穿本发明的公开内容,本发明要求保护主题的各个方面以范围的形式呈现出来。应当理解的是,范围的形式的描述内容仅仅是出于方便和简洁的目的,不应当解释为对本发明要求保护主题范围的不容变更的限制。因此,应当认为范围的描述是为了明确公开所有可能的亚范围以及该范围的个体数值。例如,提供了一个范围的值,需要理解的是,该范围的上限和下限之间的每个中间值和该范围内任何其他规定的值或中间值都包含在要求保护的主题中。这些更小范围的上限和下限可能独立被包括在较小的范围内,也包含在要求保护的主题内,在规定的范围内受任何具体排除限定的限制。规定的范围包括一个或两个限制,其中之一或者两个限制之外的范围也包括在要求保护的主题内。不管范围怎样,这都适用。

如本文所使用的,“个体”表示任何活的有机体,包括人类和其他哺乳动物。本文所使用的“受试者”表示一种有机体,可对其注射或使用提供的组合物、方法、试剂盒、装置,和体系。在一个实施例中,所述受试者是哺乳动物或细胞、组织、器官或哺乳动物的一部分。哺乳动物包括,但不限于,人类、和非人类动物,包括家畜、运动动物、啮齿动物和宠物。

如本文所使用的,“生物样品”可指从生物或者病毒或者其他大分子或生物分子获得的样品,包括受试者的任何类型的细胞或组织,从所述受试者中可以获得核酸或蛋白质或其他大分子。所述生物样品可以是直接从生物源获取或者是经过处理后获得的生物样品。例如,扩增了的分离的核酸构成生物样品。生物样品包括,但不限于,体液,如血液、血浆、血清、脑脊液、滑液、尿液和汗液,组织及来自动植物的器官样品和来自上述样品的加工样品。

如本文所使用的,“成分”指两种或多种产物或化合物的任意混合物。它可以是溶液、悬浮液、液体、粉末、糊状物、水性的、非水性的或其任意组合。

术语“多核苷酸”,“寡核苷酸”,“核酸”及“核酸分子”在本文中交替使用指任意长度的核苷酸的聚合形式,可以包括由核糖核酸、脱氧核糖核苷酸,它们的类似物或混合物。该术语仅指分子的初级结构。因此上述术语包括三链,双链和单链脱氧核糖核酸(dna),以及三链,双链和单链核糖核酸(rna)。它还包括已做修饰的形式,例如通过烷基化,和/或加帽修饰,及多聚核酸的非修饰形式。尤其是,术语“多聚核苷酸”,“寡核苷酸”,“核酸”及“核酸分子”包括多聚脱氧核苷酸(包含2个脱氧核糖),多聚核糖核酸(包含核糖),例如trna,rrna,hrna和mrna,是否结合或不交叉,其他类型的多核苷酸其具n-或者c-糖苷为嘌呤或嘧啶,以及其它聚合物其具有正常核苷酸骨架,例如,聚酰胺(例如,多肽核酸(“pnas”))和聚吗啉基(可以从theanti-virals,inc.,corvallis,or.,asneugene商购获得)聚合物和其他合成序列特异性核酸聚合物其结构中含有允许碱基配对和碱基堆积的核酸碱基,即在dna和rna中可以看到的碱基配对和碱基堆积。因此,这些术语包括,如,3’-脱氧-2’,5’-dna,寡脱氧核苷酸n3’到p5’氨基磷酸酯,2’-o-烷基-替代rna,dna与rna或pnas与dna或rna的杂交物,也包括已知类型的修饰,例如,标签,烷基化,“加帽”,“3-(环己胺)-1-丙磺酸”,用模拟物、核苷酸的修饰物诸如,例如具有无电荷连接物(例如氨基甲酸盐、磷酸三酯,氨基磷酸酯等),具有负电荷连接物的(例如硫代磷酸酯,二硫代磷酸酯等),和具有带正电连接物的(如氨烷基氨基磷酸酯,氨烷基磷酸三酯)的核苷酸修饰,具有下垂物基团的,例如,蛋白质(包括酶(例如核酸酶),毒素,抗体,信号肽,多聚赖氨酸等),具有嵌入剂的(例如,吖啶,补骨脂素等),含有螯合物的(例如,金属、放射性金属、硼、氧化金属等),包含烷化剂的,具有修饰连接物的(例如,α异头核酸等),以及具有未修饰的多聚核苷酸或寡核苷酸的核苷酸修饰来对一个或多个核酸进行取代。核酸通常包含磷酸二酯键,虽然在某些情况下,包含的核酸类似物可以具有如亚磷酰胺,二硫代磷酸酯或甲基亚磷酰胺连接物等替代骨架,或肽核酸骨架和连接物。其它模拟核苷酸包括那些具有锁核酸、阳性骨架,非离子的骨架和非核糖骨架的双环结构的核苷酸。核糖磷酸盐骨架的修饰可以用来增加分子的稳定性;例如,pna:dna杂交可以在某些环境中表现出更高的稳定性。术语“多聚核苷酸”,“寡核苷酸”,“核酸”和“核酸分子”可以包含任何合适的长度,如长度至少为5、6、7、8、9、10、20、30、40、50、100、200、300、400、500、500或更多的核苷酸。

应意识到,如本文所使用的术语“核苷”和“核苷酸”包括那些不仅含有嘌呤和嘧啶碱基还包含已做修饰的杂环碱基的基团。这样的修饰包括甲基嘌呤或嘧啶、酰化嘌呤或嘧啶或其他杂环化合物。修饰的核苷或核苷酸糖也包括糖配基的修饰,例如,其中一个或多个羟基被卤素,脂肪族基团取代,或被功能化为醚类,胺类或诸如此类的基团。术语“核苷酸单元”旨在包含核苷和核苷酸。

“核酸探针”是指包含多核苷酸的结构,如上定义,包含一个可以结合到相应靶标的核酸序列。所述探针的多核苷酸区域可能由dna,和/或rna,和/或合成的核苷酸类似物组成。

本文使用的术语“多肽”、“寡肽”、“肽”、和“蛋白”可以交替使用,这些术语表示任意长度的氨基酸的聚合体,例如,长度至少为5,6,7,8,9,10,20,30,40,50,100,200,300,400,500,1000或更多的氨基酸。聚合物可以是线性的或分支状的,包括修饰的氨基酸,并会被非氨基酸阻断。这些术语也包含一种被自然地修饰或介入的氨基酸聚合物;例如,二硫键的形成,糖基化,酯化,乙酰化,磷酸化或任何其他操作或修饰,如标签成分的结合物。例如,还包括在多肽包含一个或多个一种氨基酸的类似物的定义中(例如,包括非自然氨基酸等),以及其他本领域已知的修饰。

本文使用的术语“结合剂”和“靶标结合基团”这里指任何能特异性结合到感兴趣的生物分子的试剂或其基团。

要检测的生物靶标或生物分子可以是任何生物分子包括但不限于蛋白质、核酸、脂质、碳水化合物,离子或包含任何上述分子的多元成分复合物。亚细胞靶标的示例包括细胞器,例如,线粒体,高尔基体,内质网,叶绿体,内吞作用的囊泡,外吞作用的囊泡,液泡,溶酶体等。典型的核酸靶标包括各种构象的染色体dna(例如a-dna,b-dna,z-dna),线粒体dna(mtdna),mrna,trna,rrna,hrna,mirna和pirna。

如本文所使用的,“生物活性”包括化合物的体内活性或在体内施用化合物、组合物或其他混合物产生的生理反应。因此生物活性包含这种化合物、组合物和混合物的治疗效果和药学活性。生物活性可以在体外系统中观察以用于检测或使用这种活性。

术语“结合”这个词可以指两个分子之间的相互作用导致一个分子相互靠近的稳定的结合。分子结合可以分为以下类型:非共价,可逆共价、不可逆的共价。参与分子结合的分子包括蛋白质、核酸、碳水化合物,脂肪和如制药化合物的有机小分子。与其他分子形成稳定复合物的蛋白质通常称为受体,而它们的结合分子称作配体。核酸也可以与自身或者其他物形成稳定的复合物,例如,dna-蛋白质复合物,dna-dna复合物,dna-rna复合物。

如本文所使用的术语“特异性结合”指的是结合物例如,抗体的特异性,其使它优先地结合到一个靶标物,如多肽抗原。当说到结合分子(例如,蛋白质、核酸、抗体或其他关联捕获剂等),“特异性结合”可以包括两个或两个以上具有高亲和性和/或互补的结合配体的结合反应以确保在指定的试验条件下的选择性杂交。典型地,特异性结合会具有至少三倍的背景信号的标准偏差。因此,在指定的条件下结合分子结合到它特定的靶标分子,而不与样品中存在的大量其他分子结合。在存在其他潜在干扰物质的情况下通过特定靶标物的结合子或抗体的识别是这种结合的一个特征。优选地,结合子、抗体或特异性结合靶标的抗体片段与具有高亲和性的靶标结合而不是与非靶标物质结合。优选地,结合子,抗体或特异性识别或结合靶标的抗体片段避开结合大量的非靶标物质,例如,非靶标物质存在于测试样品中。在一些实施例中,结合子,抗体或本发明的抗体片段避免结合约90%以上的非靶标物质结合,而且明显地达到更高比例。例如,结合子,抗体或本发明的抗体片段避免结合约91%,约92%,约93%,约94%,约95%,约96%,约97%,约98%,约99%和约99%或更多的非靶标物质。在其他的实施例中,结合子,抗体或本发明的抗体片段避免结合大于约10%,20%,30%,40%,50%,60%或70%,或大于约75%,或大于约80%或大于约85%的非靶标物质。

本文所使用的术语“抗体”包括整个免疫球蛋白或抗体或能够通过至少一个位于免疫球蛋白的可变区域的抗原识别点特异性结合抗原如碳水化合物、多核苷酸,脂质,多肽,或小分子等的免疫球蛋白的任何功能片段,可以包括任何类型的免疫球蛋白,包括如,igg,igm,iga,igd和ige,igy,其是鸟类如鸡的主要抗体类型。抗体包括整个抗体以及能结合抗原或感兴趣的抗原片段的任何抗体片段。示例中包括完整的抗体分子,抗体片段,如fab,f(ab')2,cdrs,vl,vh和任何其他能与抗原特异性结合的抗体蛋白质。本文所使用的抗体是具有免疫反应性的或免疫特异性的,因此能特异性结合和有选择性地结合蛋白质,如本发明试验中的检测的蛋白质(即生物靶标)或用于检测的蛋白质(即探针)。本文所使用的抗体可以对本发明所述的生物靶标和任何化合物是特异性的。在某些实施例中,本发明的生物靶标本身可以是抗体或者是抗体片段。

如本文所使用的,“其片段”“其区域”和“其部分”指基本保留了全长多肽的至少一种功能的片段、区域和部分。

本文所使用的术语“抗原”指的是通过抗原识别位点与抗体特异性结合的靶标分子。抗原可以是单价体或多价体,即,它可以有一个或多个被一个或者多个抗体识别的抗原表位。这种可以被抗体识别的抗原包括多肽、低聚糖、糖蛋白、多核苷酸、脂质或小分子等。

如本文所使用的术语“抗原表位”指具有至少约3到5个,优选的是5到10或15,不超过1000个(或其间任何整数)氨基酸的肽序列,其通过自身或者作为一个更大序列的一部分来定义一个序列,其结合到该肽序列产生的抗体上。片段的长度没有严格的上限,例如,可以包含几乎抗原序列的整个长度,甚至是包含来自靶标抗原的两个或者多个抗原表位的融合蛋白。本发明使用的抗原表位不限于具有它所来源的母蛋白的部分的精确序列,但也包含与母序列完全相同的序列,以及母序列的修饰物,如删除,添加和置换(保守性)。

术语“互补”和“基本互补”可以包括杂交或碱基配或核苷酸和核酸之间双链的形成,例如,在双链dna分子的两条链之间和寡核苷酸引物与单链核苷酸上的引物结合位点之间。一般来说互补的核酸是a和t(或a和u),或c和g。当一条链的核苷酸优先匹配合适的核苷酸,插入该核苷酸或者删除,与至少约80%的其他链配对,通常匹配至少约90%至约90%,甚至是98%至100%左右时,两个单链rna或dna分子是上述所说的基本互补。一方面,两个互补的核苷酸序列能够杂交,优选低于25%,更优选低于15%,更为优选低于5%的错配出现在相对的核苷酸之间,最优选不出现错配。优选地,所述两个核酸分子在高严格度的条件下杂交。

本文所使用的“杂交”指两条单链多核苷酸非共价结合形成稳定的双链多核苷酸的过程。一方面,由此产生的双链多核苷酸可以是“杂交的”或者“加倍的”。杂交条件”通常包括盐的浓度大约不到1m,通常少于500mm,也可以少于200mm。“杂交缓冲液”包括一个诸如5%sspe缓冲盐溶液,或如其他本领域的缓冲液。杂交温度可以低至5℃,但典型地高于22℃,更典型地高于30℃及典型地超过37℃。杂交过程通常在严格的条件下发生,即是在序列与目标序列杂交而不是与其他非互补序列杂交的条件下。严格的条件是序列依赖性的,并且在不同的情况下是不同的。例如,相比于短的片段而言,更长的片段的特异性杂交可能需要在更高的杂交温度下进行。因为其他因素可能影响杂交的严格度,包括碱基组成和互补链的长度,有机溶剂的存在及碱基错配的程度,所以参数的组合比任何一个单独参数单独的绝对数值更加重要。通常的严格度条件选为,在确定的离子强度和ph下的对特定的序列的tm低约5℃的温度。融化温度tm可以是大量的双链核酸分子一般分解成单链核苷酸分子的温度。在本领域内有几个计算核酸的tm的方程式是众所周知的。如标准参考文献中所指的,tm值的一个简单估算方法可以由方程式tm=81.5+0.41(%g+c)来计算,当核酸在1m氯化钠水溶液中时(详见andersonandyoung,quantitativefilterhybridization,innucleicacidhybridization(1985))。其他参考文献(如allawiandsantalucia,jr.,biochemistry,36:10581-94(1997))包括估算的替代方法,其计算tm时考虑结构的,环境的及序列的特征。

一般来说,杂交物的稳定性是离子浓度和温度作用的结果。典型地,在低严格度的条件下进行的杂交反应,但随后采用各种的更高严格度的洗涤。典型的严格条件包括ph值为7.0到8.3温度至少25℃时至少0.01m到不超过1m钠离子浓度(或其他盐)的盐浓度。例如,5×sspe(750mmnacl,50mm磷酸钠,5mmedta,ph值7.4)的条件和及大约30℃的温度适合等位基因特异性杂交,尽管合适的温度取决于杂交区域的长度和/或gc含量。一方面,决定错配百分比的“杂交严格度”如下:1)高严格度:0.1×sspe,0.1%sds,65℃;2)中严格度:0.2×sspe,0.1%sds,50℃(也称为适当严格度);和3)低严格度:1.0×sspe,0.1%sds,50℃。可以理解的是使用替代的缓冲液、盐和温度可以实现等同的严格度。例如,适当严格度指的是允许核苷酸分子如探针结合互补的核苷酸分子。杂交的核苷酸分子通常具有至少60%的相似性,例如包括至少70%,75%,80%,85%,90%或95%的相似性。适当严格条件可以是相当于在42℃,50%甲酰胺,5×邓波特溶液(denhardt'ssolution),5xsspe,0.2%sds的条件下杂交,接着用42℃,0.2×sspe,0.2%sds的溶液冲洗。例如,高严格度的条件是在42℃的50%甲酰胺,5×邓波特溶液,5xsspe,0.2%sds的条件下杂交,接着用65℃,0.1×sspe,0.1%sds的溶液冲洗。低严格条件可以是在相当于22℃,10%甲酰胺,6×邓波特溶液,5xsspe,0.2%sds的条件下杂交,接着用37℃,1×sspe,0.2%sds的溶液冲洗。邓波特溶液包含1%聚蔗糖,1%聚乙烯吡喀烷酮和1%牛血清白蛋白(bsa)。20×sspe(氯化钠、磷酸钠、乙二酰胺四乙酸(edta))包含3m氯化钠,0.2m磷酸钠和0.025medta。其他适当严格度和高严格度杂交缓冲液和条件是本领域技术人员熟知的,也被记载在参考文献如sambrooketal.,molecularcloning:alaboratorymanual,2nded.,coldspringharborpress,plainview,n.y.(1989);andausubeletal.,shortprotocolsinmolecularbiology,4thed.,johnwiley&sons(1999)中。

或者,当rna或者dna链在选择性杂交条件下与其互补链杂交过程中存在基本互补。典型地,当一条有至少14至25核苷酸分子的链上至少有65%的互补时,会发送选择性杂交,优先指至少75%,更优选指至少90%的互补。详见m.kanehisa,nucleicacidsres.12:203(1984)。

文中使用的“引物”可以是一个天然的或合成的寡核苷酸,该寡核苷酸能与多核苷酸模板形成双链,能够作为核酸合成的起始点,且能够从其3’端点沿着模板延伸,这样形成一个延伸的双链。在延伸的过程中添加的多聚核苷酸序列是由多核苷酸模板序列决定的。引物通常被dna聚合酶延伸。

“连接”指的是模板驱动反应中共价键的形成或两个或两个以上核酸分子末端的连接的形成,如寡核苷酸和/或多核苷酸。所述共价键或连接的性质可能相差很大且连接可以在酶或化学方法的作用下进行。如本文所使用的,连接通常在酶的作用下在一个寡核苷酸的5’碳末端核苷酸和另一个核苷酸的3’碳末端核苷酸之间形成磷酸二酯键连接。

“测序”,“序列测定”等表示有关核酸的核苷酸碱基序列的信息测定。这些信息可能包括识别或测定部分以及完整的核酸序列信息。序列信息由不同程度的统计可靠性或可信度决定。一方面,该术语包括识别性的测定和核酸分子中相邻核苷酸的排序。“高通量数字测序”或“下一代测序”表示采用内在的平行方式检测许多(典型地成千上万到数十亿)核酸序列的序列检测,即dna模板的测序不是一次一个地进行,而是批量进行的过程,并且优选地许多序列平行读出,或者采用与其本身平行的一个超高通量的连续程序。这些方法包括但不限于焦磷酸测序(例如,商业化的454lifesciences,inc.,branford,conn.);连接测序(例如,商业化的solidtmtechnology,lifetechnologies,inc.,carlsbad,calif.);使用修饰的核苷酸合成的测序(例如商业化的truseqtmandhiseqtmtechnologybyillumina,inc.,sandiego,calif.;heliscopetmbyhelicosbiosciencescorporation,cambridge,ma.和pacbiorsbypacificbiosciencesofcalifornia,inc.,menlopark,calif.),离子检测技术测序(如iontorrenttmtechnology,lifetechnologies,carlsbad,calif.);dna纳米球测序(completegenomics,inc.,mountainview,calif.);纳米孔测序技术(例如,由oxfordnanoporetechnologies,ltd,oxford,uk研发的),诸如高度平行的测序方法之类的方法。

“snp”或“单核苷酸多态性”包括个体间的遗传变异;例如,可变生物体dna的单一的含氮碱基位置。单核苷酸多态性存在于整个基因组;多个个体之间的遗传变异是由于snp位点变异引起的,通常这种遗传变异导致了多个个体间的表型变异。本发明使用的snp和各自的等位基因可能是来自任意数量的数据源,如公共数据库(加州大学圣克鲁斯分校人类基因组浏览器网站(genome.ucsc.edu/cgi-bin/hggateway)或ncbidbsnp网站(www.ncbi.nlm.nihgov/snp/),或者可能是实验测定如美国公布号6969589和2006/0188875名称为“人类基因组多态性”的文献里记载的。“尽管snp的使用记载在本文的实施例中,要理解的是其他双等位基因或多等位基因的遗传标记也可以使用。双等位基因标记有两个多态形式或等位基因。正如上面提到的,对于与一个性状相关联的双等位遗传标记,与在对照组相比在案例组中遗传组成丰度更高的等位基因称为“无关联等位基因”。因此,对于与给定的性状相关的每个双等位基因的多态性(如,疾病或药物反应),都有一个对应的相关的等位基因。使用到本文提供的方法的其他双等位基因的多态性包括,但不限于多核苷酸的改变,插入,删除和易位。进一步说明的是,此处引用的dna可以包括基因组dna,线粒体dna,游离dna,和/或dna衍生物如扩增子,rna转录子,cdna,dna类似物等。在关联性研究中筛选到的多态位点可以是二倍染色体或单倍染色体状态,理想情况下是来自基因组上的位点。

如本文所使用的术语,“微流控装置”通常是指一个装置,通过它材料,特别是如液体的流体材料,可以被运输,在一些实施例中是在微尺度级别上,在一些实施例中是在纳米尺度上。因此,本发明描述的微流控装置可以包含微尺度特征,纳米尺度特征及其它们的组合。

因此,一个典型的微流控装置通常包括以毫米级或更少尺度级别来度量的结构或功能特征,该装置能以μl/分钟或更少的流速来操纵流体。典型地,这些特性包括,但不限于通道,流体储液器,反应室,混合室和分离区域。一些例子中,所述通道包括至少一个范围约0.1μm到约500μm截面尺寸。这个级别的所述截面尺寸的使用允许更多数量的通道整合在一个较小的区域,并使用更小容量的液体。

因此,一个典型的微流控装置通常包括以毫米级或更少尺度级别来度量的结构或功能特征,该装置能以μl/分钟或更少的流速来操纵流体。典型地,这些特性包括,但不限于通道,流体储液器,反应室,混合室和分离区域。一些例子中,所述通道包括至少一个范围约0.1μm到约500μm截面尺寸。这个级别的所述截面尺寸的使用允许更多数量的通道整合在一个较小的区域,并使用更小容量的液体。

如本文所使用的术语“通道”,“微通道”,“液体通道”和“微流控通道”交替使用且表示在材料上形成的一个凹缝或空腔,是通过将图形衬底的图形导入到材料上或任何合适的材料的脱胎技术形成,或可以表示与安装在所述凹缝或空腔中液体引导结构相结合的凹缝或空腔,例如管、毛细管或类似物。本发明中,通道尺寸表示微流体通道的横截面积。

本文所使用的术语“液体通道”和“控制通道”交替使用,可以指微流控装置中的通道,材料如液体,如气体或液体可以从中流过。尤其是,术语“液体通道”指的是一个通道,感兴趣的材料,如溶剂或化学试剂可以从中流过。此外,术语“控制通道”指流动通道,材料如液体,如气体或液体可以从中流过并因这中方式打开阀或泵。

如本文所使用的“芯片”可以指具有多个一维,二维或三维微观结构或微尺度结构的固体基片,在其上可以实施某些过程,如物理,化学,生物,生物物理或生物化学过程等等。微观结构或微尺度结构,如通道和孔井,电极元件,电磁元件被并入,构造或被附着在所述基片上以利于芯片上发生的物理的,生物物理的,生物的,生物化学的及化学的反应或过程。所述芯片可以在个一维度上是薄的并且可以在其他维度有各种形状,例如,矩形,圆,椭圆或其他不规则形状。本发明的芯片的主要表面的尺寸可以相差很大,例如从约1mm2到约0.25m2。优选地,芯片的大小是从大约4mm2到约为25cm2具有从1mm到5cm的规格尺寸。芯片表面可以是平的,或不平的。表面不平的芯片可以包括构造在表面的通道或孔。

微流控芯片可用于本发明公开的方法和分析系统中。微流控芯片可以由任何合适的材料,比如pdms(聚二甲硅氧烷),玻璃,pmma(有机玻璃),pet(聚对苯二甲酸乙二醇酯),pc(聚碳酸酯)等或其组合物而制成。

微流控芯片可用于本发明公开的方法和分析系统中。微流控芯片可以由任何合适的材料,比如pdms(聚二甲硅氧烷),玻璃,pmma(有机玻璃),pet(聚对苯二甲酸乙二醇酯),pc(聚碳酸酯)等或其组合物而制成。

检测生物靶标空间分布的分析

本发明所公开的是空间编码,采用有效空间编码方案进行高水平多元分析的多重分析方法和分析系统。在一个实施例中,提供是能够传送试剂给样品,从而空间编码试剂被传送的多个位点的测试设备。一方面,可以根据已知的空间分布将试剂传送给样品,例如,空间分布是由样品的组织特性决定的。另一方面,具备寻址通道的微流控装置和诸如此类的装置等用来提供试剂给样品,并在样品中进行空间编码试剂被传送的多个位点。一些实施例中,空间编码的(“标记”或“标记标签”),多重分析方法和分析系统包含一个由数字化的读出器决定的解码特征。一方面,本发明公开的方法和分析系统检测生物靶标的存在或缺失或生物靶标的生物活性指标。另一方面,本发明提供了可以检测样品中多个位点的生物靶标数量或丰度或生物靶标活性指标,以及样品多个位点中每个位点的位置的方法和分析系统。基于数量或丰度的分析以及一个或多个生物靶标的位置信息的分析和活性,可以生成样品中多个位点的空间分布布局。在任一前述实施例中,所述方法或分析系统可以不依赖于检测样品中一个或多个生物靶标的空间或位置信息的成像技术,尽管所述方法和系统可以选择性地包括使用成像技术用于其他目的。成像技术可以包括但不限于常规的免疫组织化学(ihc)成像和免疫荧光(if)成像技术。在u.s.applicationserialno.13/080,616,名称为“spatiallyencodedbiologicalassays”(pub.no.:us2011/0245111),着中详细公开了检测样品中生物标靶的丰度和/或活性的空间分布的方法和分析系统,由于引用的目的将其公开的内容全部并入本文中。

本发明进一步提供了能够传递试剂到样品中多个位点的设备,其中每个位点能够被传递的试剂识别。在一个实施例中,试剂以空间分布的方式被传递。所述设备同软件,试剂及该实验的协议提供了本发明方法和分析系统的关键组成,允许检测大量生物靶标或活性,包括dna,rna和/或蛋白表达及样品中生物靶标及活性的空间定位。在一个实施例中,在多重分析的产物从生物样品中移除和合并用于分析后,生物样品的生物靶标的丰度,表达和/或活性和定位被检测。生物靶标的丰度,表达,和/或活性和定位的检测可以通过例如下一代测序来实现,这可以很容易以低成本提供数百万和数万亿的数据。分析结果如生物靶标的数量或活性可以映射回到生物样品的指定位置。这种方法和分析系统提供了分析生物样品中复杂的细胞功能和规律的空间分布的工具。

一方面,检测样品中多个位点上一个或多个生物靶标的丰度、表达和/或活性的空间分布的方法如图1所示。在步骤110,一个或多个生物靶标的每个靶标的探针传递给样品中的多个位点,每个探针都包含靶标结合基团,识别所述探针被传递到每个位点的地址标签,和识别标签。

本发明的任一前述实施例中,样品可以是任何生物样品或可以被附着在支撑物或以二维的方式提供的样品,以便于分析的生物靶标或活性可以与生物样品中的位置相结合。某些实施例中,所述样品可以是新鲜分离的样品,固定的样品,冻结的样品,嵌入的样品,处理过的样品或其组合物。本发明典型的样品包括组织切片(如包括完整的动物切片和组织活体检查),细胞群,或在其它支撑物上处理的生物结构,如幻灯片(如,显微镜幻灯片)或培养皿,等等。在优选的实施例中,本发明的方法和分析系统兼容众多生物样品类型,包括新鲜的样品,如初期组织切片和保藏的样品包括但不限于冻结样品和经甲醛固定的样品,石蜡固定的(ffpe)样品。某些实施例中,样品可以由合适浓度的甲醛或多聚甲醛固定,例如,4%的磷酸盐缓冲生理盐水(pbs)的甲醛或多聚甲醛。某些实施例中,生物样品被固定在具有分离的独立测量区域的基质表面。

在一个实施例中,生物样品可以包含一个或多个感兴趣的生物靶标。本发明的任一前述实施例中,一个或多个生物靶标可以是任何生物分子包括但不限于蛋白质,核酸,脂质,碳水化合物,离子或包含任何上述分子的多成分的复合物。亚细胞靶标的例子包括细胞器,如,线粒体,高尔基体,内质网,叶绿体,内吞作用囊泡,外吞作用囊泡,液泡,溶酶体等等。在一些实施例中,一个或多个生物靶标可以是核酸,包括rna转录,基因组dna序列,互补dna,扩增子或其它核酸序列。在其它的实施例中,一个或多个生物靶标可以是蛋白质,酶(蛋白酶或核酶)等。

在步骤110,多个生物靶标的每个靶标的探针包括:(1)靶标结合基团,能够结合到探针对应应的生物靶标;(2)地址标签,识别探针被传递到的每个位点;以及(3)识别标签,识别探针的相应生物靶标或靶标结合基团。根据生物靶标的性质,所述靶标结合基团可以是靶标特异性的核苷酸序列(例如,核酸靶标序列的互补序列),小分子,核酸适配体,抗体,脂质,碳水化合物,离子,亲和性捕获剂,或包含任何上述分子的多元复合物。所述位置签标识别样品中探针被传递到的位置,所述识别标签识别探针对应的被分析的生物靶标或靶标结合基团。因此,所述地址标签和所述识别标签的识别可以用来将分析结果与样品中生物靶标和位置关联起来。在优选的实施例中,样品中的多个位点的每一个位点的生物靶标的地址标签至少有两个,每个地址标签识别多个位点中每个位点的参数。例如,在一个x-y坐标平面上有x横坐标地址标签和y纵坐标地址标签表示样品中每个位点。因此,每个位点可以通过其相应的(x,y)平面坐标进行唯一的识别。本发明优选的实施例中,所述地址标签和/或所述识别标签可以是寡核苷酸。在其他实施例中,地址标签和/或标识标签可以是大规模标签,荧光标签,或其他基团。

一些实施例中,所述靶标结合基团,地址标签,和/或探针识别标签在传递给生物样品之前预配对。在探针是寡核苷酸的情况下,靶标结合序列,地址标签序列,和/或识别标签序列可以作为单个寡核苷酸合成。或者,靶标结合基团,地址标签,和/或探针的识别标签可以在传递给样品之前独立合成或获取,并且在提供给生物样品前结合。例如,两个独立的寡核苷酸可以在传递给样品之前分开制备和结合,例如通过连接。或者抗体和寡核苷酸可以分开准备并在传给生物样品前结合。在其他实施例中,所述探针和地址标签可以分别合成,并在试验的不同步骤中传递给生物样品(例如,探针优先,地址标签紧随其后;或者反过来)。

在步骤120中,探针可以结合到样品中相应的生物靶标上,从而与生物靶标发生反应或相互作用。例如,提供条件允许寡核苷酸与核酸靶标杂交,酶与蛋白质靶标催化反应,抗体结合靶标中抗原表位等。在生物靶标是核酸的情况下,探针是典型的寡核苷酸且与靶标核酸杂交。在生物靶标是蛋白质的情况下,探针是寡核苷酸适配子,小分子或与靶标蛋白质结合或反应的寡核苷酸偶联蛋白质(即其中的一个蛋白质是另一个蛋白质的底物)。寡核苷酸可以经过合适的基团及类似物的联接,化学的或光交联反应结合到探针或蛋白上。

在一些实施例中,允许探针与样品中一个或多个生物靶标结合或相互作用后,结合到生物靶标的探针可以从传给给样品的探针上分离而不结合所述几生物靶标。一方面,在生物靶标是核酸以及探针是寡核苷酸的情况下,通过例如从样品中洗脱未杂交的探针实现所述分离,类似地,对于基于亲和结合的包括使用核酸适配体,小分子和蛋白质探针的其他试验,洗涤步骤可以用来去除低亲和结合物。在探针通过与靶标相互作用进行转换的情况下,例如,在标靶为肽的情况下,如通过被蛋白酶分裂或被激酶磷酸化,方便收集所有探针,包括与生物靶标已经互作的探针和因此被转换的探针和未被转换的探针。集合或合并后,抗体或其他亲和性捕获剂可用于捕获通过增加基团转换后的探针(如,通过激酶磷酸化的磷酸基团)。在探针通过分裂被转换的情况下,转换的探针可以被分开,例如在转换的过程中(例如通过分裂),经转换探针上移走的标签捕获非转换探针,或通过在分裂的位点添加新的标签。

在其它一些实施例中,结合生物靶标的探针不需要与不结合生物靶标的探针分离来检测所述生物靶标的丰度,表达,和/或活性的空间分布。步骤130中,对结合一个或多个生物靶标的探针进行了分析。在某些实施例中,分析包含检测每个生物靶标的丰度,表达,和/或活性和分析每个位点的每个靶标的识别标签和地址标签的身份。很多方法可用来识别本发明公开的方法和分析系统的探针的地址标签,标识标签和/或探针的靶标结合基团。可以采用技术,如质谱分析(如,基质辅助激光解/飞行质谱的电离时间(maldi-tof),lc-ms/ms和tof/toftmlc/ms/ms),核磁共振成像技术,或,优选地,核酸测序技术来检测地址标签。例如,本发明中探针解码技术的例子可以在公布号为uspub.no.20080220434的美国公布文本中找到,在此通过引用的方式将其内容全部并入本文。例如,地址标签可以是寡核苷酸的大量标签(omts或大量标签)。例如,这种标签记载在公布号为uspub.no.20090305237的美国公布文本中,该文献在此以引用的方式全文并入本发明。另一方面,探针可以被扩增并杂交到基因芯片上。这需要进行单独的扩增反应,该反应中每一个扩增对于特定的地址标签或标签子集是特异性的,通过使用标签特异性引物来完成扩增。每个扩增也会合并一个不同的可溶解的标签(如荧光体)。杂交后,绘制到样品中不同空间位置的特定靶标的相对数量可通过可溶解标签的相对丰度来测定。在步骤140中,基于结合到一个或多个生物靶标的探针的分析,检测样品中多个位点上的一个或多个生物靶标的丰度,表达和/活性的空间分布。

在一个优选方面,根据本发明的探针是高通量和下一代测序的底物,高度平行的下一代测序方法被用来确定所述探针的序列(例如包括靶标结合基团的序列,地址标签,和/或识别标签)。适宜的测序技术包括但不限于solidtm技术(生命技术公司)或基因组分析仪(illumina公司)。这种下一代测序方法可以使用,例如,通过使用单通测序方法或末端配对测序方法。下一代测序方法包括,但不限于,基于杂交的方法,例如公开在drmanac,u.s.pat.nos.6,864,052;6,309,824和6,401,267;和drmanacetal.,美国专利公开2005/0191656;合成测序法,例如,uspub.nos.6,210,891;6,828,100;6,969,488;6,897,023;6,833,246;6,911,345;6,787,308;7,297,518;7,462,449和7,501,245;美国申请号20110059436;20040106110;20030064398和20030022207;ronaghi,etal.,science,281:363-365(1998);和li,etal.,proc.natl.acad.sci.,100:414-419(2003);基于连接的方法,例如公开在美国专利号5,912,148和6,130,073;和美国申请号20100105052,20070207482和20090018024;新型纳米孔测序法,例如,美国专利申请号20070036511;20080032301;20080128627;20090082212;以及soni和meller,clinchem53:1996-2001(2007),以及其他方法,例如美国专利申请号:20110033854;20090264299;20090155781;和20090005252;也可以看mckernan,etal.,genomeres.19:1527-41(2009)和bentley,etal.,nature456:53-59(2008),所有这些文献全文通过引用的方式被并入本发明。

在优选的实施例中,通过测序分析结合到一个或多个生物靶标的探针。这种通过测序的分析包括测序产物数量的测定,这可以指示每个生物靶标的丰度,表达,和/或活性,测序产物包含识别每个位点上每个生物靶标的所有或者部分的地址标签序列和所有或部分的识别标签序列。在一个实施例中,测序产物的地址标签序列允许将试验结果绘制回到样品中的所述多个位点。

在某些实施例中,结合同一靶标分子的两个探针(例如,在核酸靶标的相邻位点杂交的两个多核苷酸探针)可以通过延伸后连接分析(所述延伸-连接分析)。所述延伸-连接分析允许特定靶标序列重新被检测。例如,如果引物和下游寡核苷酸被20个碱基分离且用反转录酶来填充20个碱基的空缺,所述rna靶标序列的20个碱基就能被获取。在某些实施例中,通过使用本发明方法或分析系统的延伸-连接分析,特定感兴趣的序列区域可能被特征化。例如,这些区域可能包含突变或变异,例如,影响癌症的,mhc差异和rna编辑。

本发明的任何实施例中,可能用到延伸分析且允许某些靶标序列被重新检测。在一个实施例中,本发明的延伸分析如下进行:首先,第一引物被用于从靶标序列合成cdna。在某些实施例中,引物可以是随机引物(如,随机六聚物)或是序列特异性引物。随机引物可以用于从整个转录组制作cdna,而序列特异性引物用于制作来自特异性靶标序列的cdna。某些方面,所述第一引物可能包含用于分析产物扩增的通用引物位点,可通过测序技术进行序列识别的接头,和/或用于连接地址标签的接头。第一引物连接在用于连接地址标签的接头上。然后下文中描述的x和y地址标签通过所述接头与第一引物结合。注意这种情况下,x和y地址标签被结合合到靶标序列的同一侧或不同侧,这种配置可用于本发明的任何实施例中。这种情况下的y地址标签进一步连接到通用引物位点或用于测序的与生物素耦合的接头上。具有结合的x和y地址标签的cdna然后在链霉亲和素磁珠上被洗脱和捕获,然后第二引物被安装在cdna上第一引物的相对位点上。在一些实施例中,多核苷酸序列的捕获可以基于其他的半抗原粘合剂,或者基于序列,而不是生物素-链亲和素。在某些实施例中,第二引物可以是随机引物(如,随机六聚物)或是序列特异性引物。某些方面,引物可能包含用于分析产物扩增的通用引物位点,用于通过测序技术识别序列的接头,和/或用于连接地址标签的接头。在其它实施例中,第二引物可以与通用引物位点结合或与用于测序的接头结合。与通用引物位点或接头耦合到生物素,序列可以从第二引物被延伸,扩增及测序。

本发明的方法分析系统可以包含扩增步骤,尤其是,核酸扩增步骤。某些方面,该扩增步骤由pcr完成。在某些实施例中,线性扩增(通过t7rna聚合酶)可能是用来代替pcr或部分替代pcr。某些方面,多核苷酸的线性扩增可能引起较少的不同序列的相对丰度的变形。这可以通过在序列的一个通用部分包含t7rna启动子来完成。这种情况下,启动子本身和启动子的上游部分不被复制。还在其他实施例中,可以在本发明的方法和分析系统中用到其他扩增方法。对于一些测序方法(如,纳米孔测序),扩增是可选的。

基于t7rna聚合酶的扩增对于mrna扩增是常规程序,原始记载于vangelder等人的proc.natl.acad.sci.usa87,1663-1667(1990)文献中。该程序包括与mrna(“第一链合成”)互补的cdna的合成,其由反转录产生,紧接着第二链合成产生双链cdna,以及体外转录其采用双链cdna作为模板由t7rna聚合酶引起。最后一步提供了单链反义rna(arna),其可以被标记当标记的核苷酸被提供时。所述核苷酸可以被放射性标记或非放射性标记方法标记。eberwine等人的(proc.natl.acad.sci.usa89,3010-3014(1992))通过添加以在第一轮获得的rna作为模板的第二轮扩增扩充了vangelder的方法。王等人(naturebiotechnol.18,457-459(2000))提供了原始t7方法的变型体,特点是调整了的第二链合成方法。王等人的第二链合成方法smarttm技术(clontech)是本领域已知的用于cdna合成的方法。baugh等人的(nucleicacidsres.29,e29(2001))根据vangelder等人的方法记载了优化的变化方法并分析了affymetrix基因芯片的性能。affymetrix基因芯片被设计来探测所述反义链。当进行t7rna扩增时,探测反义链的任何其他dna芯片或微阵列可以被想到,其中,标记发生在体外转录步骤中。

在其他实施例中,扩增技术如滚环扩增(rca)和环到环扩增(c2ca)可以用于本发明的探针,靶标,标签,和/或信号扩增。在有某种dna聚合酶存在时rca是一个线型等温线过程,使用ssdna微型环作为模板(fireandxu,proc.natl.acad.sci.,92:4641-4645(1995);daubendieketal.,j.am.chem.soc.117:77818-7819(1995))。某些方面,取决于扩增时间,多核苷酸序列可被扩增500到1000倍。例如,如上讨论的靶标蛋白的双重靶标分析中,线型连接产物被形成(如,当两个抗体结合靶标蛋白的邻近区域时,抗体的寡核苷酸标签可以被连接),并可被限制性内切酶切断然后通过dna连接酶和模板重新连接形成dna环。某些实施例中,phi29dna聚合酶可用于延伸引物,其也是模板的,形成长ssdna,该ssdna包含大量与初始dna环互补的序列。c2ca基于rca,可以包括三个步骤:复制,单体化(monomerization)和连接(dahletal.,proc.natl.acad.sci.,101:4548-4553(2004))。原始的环形dna被认为是正极性。经过一个复制步骤后(rca反应后),产物就转换成了相反的极性。带有正极性(ro+)的限制性寡核苷酸可以与rca产物形成的二倍体区域,该二倍体区域可以被限制性内切酶分裂生成单体。然后单体被引导到连接步骤中并环化。这些环作为下一轮rca的模板,由ro+引导。比起传统的pcr,该方法可以进一步重复产生大约100倍以上浓度的靶标序列。

另一方面,如图2所示,提供了检测样品中多个位点上的一个或多个生物靶标的丰度,表达,和/或活性的空间分布的方法,描述了多个位点的一个或多个生物靶标的地址标签方案的有效实施。在一个实施例中,地址标签方案是对样品中多个位点中每个位点的多个生物靶标的使用至少两个地址标签的组合方案。在步骤210中,用于样品中多个位点的每个生物靶标中的每个标靶的探针被传递,每个探针包含(1)靶标结合基团,其能结合探针相应的生物靶标;(2)识别标签,识别探针相应的生物靶标或靶标结合基团。根据生物靶标的性质,所述靶标结合基团可以是靶标特异性核苷酸序列(例如,是与核酸靶标序列互补的序列),小分子,核酸适配体,抗体,脂质,碳水化合物,离子,亲和性捕获剂,或包含上述任何分子的多成分复合体。步骤220中,在适宜的条件下,每个探针允许与样品中相应的生物靶标相互作用或结合。

在某些实施例中,没有结合到生物靶标的探针可以被移除从而与那些结合生物靶标的探针分离。这种分离基本如上述讨论那样进行,例如,通过洗涤样品移除未杂交的寡核苷酸探针。在某些实施例中,为检测生物靶标的丰度和/或活性的空间分布,结合到生物靶标的探针可以不必与未结合到生物靶标的探针进行分离。

接下来,在步骤230中,所述地址标签被传递给样品中多个位点中的每个位点,且所述地址标签与每个生物靶标的所述探针配对并识别地址标签被传递到的每个位点。此方面请注意,所述探针和所述地址标签是在不同的步骤中被传递的。在某些实施例中,当探针是寡核苷酸时,所述地址标签可以通过本领域技术人员已知的多种方式与所述寡核苷酸探针结合,例如,通过延伸,连接,延伸后连接,或其任意组合的方式。例如,所述地址标签的信息通过用dna聚合酶扩增延伸作为引物的探针寡核苷酸的方式转移,从而复制和合并所述地址标签的序列。

在步骤240中,分析结合到一个或多个生物靶标的探针/地址标签偶联物。在某些实施例中,该分析包括检测每个生物靶标的丰度和/活性和识别每个位点的每个生物靶标的识别标签和地址标签。如上述讨论的,大量的方法被用来识别地址标签,识别标签和/或探针的靶标结合基团。在优选的实施例中,结合到一个或多个生物靶标的探针/地址标签偶联物通过测序来分析。如上述讨论的任何适宜的测序技术和方法都可以使用,包括高通量,下一代测序及高度平行下一代测序方法。优选地,在本发明的任一前述实施例中,从相同的序列产物中测定所有的或部分的地址标签序列及所有的和部分的识别标签序列。优选地,同时测定序列产物的丰度和/或活性,其指示每个生物靶标的丰度和/或活性。在一些实施例中,序列产物的丰度揭示该位点生物靶标的相对数量。

基于步骤240中对结合到一个或多个生物靶标的探针/地址标签偶联物的分析,在步骤250,对样品中多个位点上的一个或多个生物靶标的丰度和/活性的空间分布进行检测,例如,通过将测验的每个生物靶标的丰度和/活性绘制到所述样品中的每个位点。

尽管在某些实施例中各个步骤以特定顺序被讨论以更好的解释本发明的主题,但这些步骤的准确顺序可以是不同的。例如,步骤210年和230可以合并,这样可以传递探针和地址标签的混合物。所述地址标签与探针的结合可以在步骤210和230合并后立即进行或同时进行。因此可以理解的是,所述探针分子的地址标签与基于探针和它相应的靶标相互作用的能力的探针的分离可以灵活地实现。类似地,地址标签方案也有相当大的灵活性。正如下文所述的,本发明公开的方法和分析系统特别适合组合方法。

空间编码基因组分析

在特定的实施例中,方法和分析系统可用于核酸分析,例如,用于基因型分型,检测单核苷酸多态性(snps),dna复制数量的定量或rna转录,样品中特定转录定位等等。图3表示了一个典型试验和地址标签方案。出于说明的目的,所述靶标是核酸序列,提供了两个寡核苷酸探针,应当理解的是,本发明公开的方法和分析系统可以用于任何合适的利用一个或多个合适的探针的靶标。每个寡核苷酸探针包括靶标特异性区域,分别见305和307。在某些实施例中,例如检测snps,两个靶标特异性区域被定位在要分析的snp的任何一侧。每一个寡核苷酸探针还包括连接区域,分别见301和303。允许寡核苷酸探针杂交到生物样品中的靶标核酸(没有显示)上。在步骤302,寡核苷酸探针中的一个或两个都可以被延伸和连接到其他探针形成一个包含309靶标核酸区域和连接区域301和303的延伸探针。在一些实施例中,两个探针彼此紧邻,且仅需要连接形成一个延伸探针。在一些实施例中,步骤302用于将一个snp序列或其他要分析的靶标序列进行合并。

步骤304中,两个地址标签,其都包含地址标签区域(详见315和317),连接区域(详见311和313),和引物区域(详见319和321)与延长的探针连接形成靶标特异性寡核苷酸。与图1相比,探针和地址标签被分开传递。在一些实施例中,一对地址标签分别特异性连接到靶标序列的一侧或另外一侧(例如靶标序列的5’和3’端)。在某些实施例中,地址标签的连接区域和引物区域和探针是通用的,也就是说,用来构建探针和地址标签的连接区域和引物区域的设置是一致的,仅探针的靶标特异性区域和地址标签的地址标签区域不同。在另外的实施例中,连接区域和引物区域通用的,并且每个探针和/或地址标签可包含不同的位置区域和/引物区域。

连接后,探针/地址标签偶联物被洗脱,合并,并且可选地,通过pcr将测序的接头添加到所述探针/地址标签偶联物。在另外的实施例中,测序引物可以连接到所述地址标签,或者测序引物序列可以包括在地址标签中作为地址标签的一部分。如图3所示,每个测序接头包含引物区域319或321,并且与地址标签的引物区域319和321兼容。包含第一所述接头327,第一引物区域319,第一编码标签315,连接区域311和301,靶标区域309,连接区域313和303,第二编码标签317,第二引物区域325和第二接头329的最终结构接受测序,例如,通过输入一个数字高通量测序程序来测序。

延伸和连接反应的组合如图3所示例,仅包括连接(如,与靶标核酸序列连续部分杂交的寡核苷酸),但应该理解的是,可以用多种反应来使地址标签结合到靶标特异性探针上。或者,可以采用利用额外的寡核苷酸的试验,如分析,(illumina,inc.,sandiego,calif.)(详见fan,etal.,coldspringsymp.quant.biol.,68:69-78(2003))。

为了最大化地址标签的效率,可以采取使用一对地址标签的联合方法。通过结合标签特异性信息和地址标签中的空间信息,用于检测样品中多个位点的一个或多个生物标靶的空间分布的寡核苷酸数量可以显著减少,伴随费用的减少。

图4表示组合地址标签方案的一个实施例,该实施例中具有代表性的组织切片中的核酸被分析(如416所示)。图4a表示两个探针/地址标签偶联物420和422特异性地结合到感兴趣的生物靶标402。第一探针/地址标签偶联物420包含地址标签408,与标签404相联。标签404可以是通用引物位点,用于分析产物的扩增的或者是一个接头其能够识别地址标签408和/或探针/地址标签偶联物420的其他区域,例如,利用测序技术。第二探针/地址标签偶联物422包含地址标签406,与标签410相联。标签410可以是通用引物位点用于分析产物扩增或者是一个接头其能够识别地址标签406和/或探针/地址标签偶联物422的其他区域,例如,利用测序技术。

在其他实施例中,如图4d所示,根据组合地址标签方案分析生物靶标424。两个探针426和428特异性地结合到感兴趣的生物靶标424。在一些实施例中,例如,探针426和428每个探针的一部分特异性地结合靶标,而每个探针也有一部分特异性结合所述接头438,例如,通过特异性核酸杂交。在一个实施例中,所述探针或者探针特异性杂交到所述接头。在生物靶标是核酸且探针是寡核苷酸的情况下,所述接头可以特异性地结合下列组合物:1)探针426的5’部分和探针428的3’部分;2)探针426的3’部分和探针428的5’部分;3)探针426的5’部分和探针428的5’部分;或4))探针426的3’部分和探针428的3’部分。在某些实施例中,探针426和428是线性分子,分支分子,环形分子或者是它们的组合物。在两个探针与生物靶标结合,所述接头与两个探针结合之后,地址标签可被传递给样品并结合所述接头。例如,所述接头可标上地址标签430,与标签434相关联,和/或与地址标签432相关联,与标签436相关联。例如,利用测序技术,标签434和436可以是用于分析产物扩增的通用引物位点或者是能够识别地址标签和/或所述接头/地址标签偶联物的其他区域的序列。在某些实施例中,地址标签被标记在在所述接头的同一端或者不同端。在其他的实施例中,地址标签和/或标签434或436可以提前结合到所述接头上,接着所述接头/地址标签或接头/标签偶联物或复合物被传递给样品,以与结合到生物靶标的探针相结合。某些方面,所述接头是线性分子,分支分子,环形分子或者是它们的组合物。在一些实施例中,在地址标签附到所述接头的每个末端后,所述末端可以连接起来。例如,图4d中,地址标签434和/或436包含结构和/或序列1以允许所述标记的接头438的两个端点连接形成一个环形构造,这样促进所述构造的扩增和/或测序。

在某些实施例中,所述接头/地址标签偶联物序列的全部或部分被测定,例如,通过核酸测序技术。在其它的实施例中,探针序列的全部或部分,所述接头/地址标签偶联物序列的全部或部分被检测。例如,第一地址标签可以与探针426接合,第二地址标签可以与所述接头438结合。探针426和所述接头438之间形成的双倍复合体可用于延伸和测序,产生结合物,其包含第一地址标签序列,探针426的全部或部分序列,所述接头438的全部或部分及第二地址标签序列。

标签方案不限于针对同一个生物靶标的两个或两个以上探针的用途。例如,当采用一个探针的情况下,标签(例如,地址标签,连接接头,或通用测序引物或扩增引物序列)可以结合到特异性结合所述探针的所述接头上,而不与探针本身结合。

在一些实施例中,至少两个所述接头被使用。一方面,不止一个探针被传递给样品,至少一个接头被提供给特异性结合到所述探针的每个探针。一方面,一个或多个接头被提供用于特异性结合每个探针。例如,一对接头用来分别特异性地结合所述探针426和428。在某些实施例中,一对所述接头是dan分子,其:1)杂交或者相反与探针426和428结合;2)具有有自由的3’和/或5’端,能够使编码序列(如,地址标签430和432)在后续步骤中被附着,例如,通过连接;3)是可被连接的形式,如果它们是被共同定位的或者彼此接近的情况下。在一些实施例中,探针426或428的部分作为所述接头对中的接头的夹板以便于能连接或延伸且连接。附加的标签(如,地址标签,连接接头,或通用测序引物或扩增引物序列)可以结合到连接所述接头对产生的所述接头上。

图4b表示了可用于样品中100个单独的位点的地址标签方案。例如,使用了二十个探针/地址标签偶联物a1到a10和b1到b10,以及探针/地址标签偶联物420(包含地址标签408)对应的a1到a10中的每一个和探针/地址标签偶联物422(包含地址标签406)对应的的b1到b10中的每一个。包含在a1到a10和b1到b10中的每一个地址标签被唯一地识别。探针/地址标签偶联物a1,例如如412中的第一水平通道所示,通过寻址通道被传递给生物样品。探针/地址标签偶联物a2通过412中的第二水平通道被传递给生物样品。探针/地址标签偶联物a3通过412中的第三水平通道被传递给生物样品,等等。如414所示,“a”探针/地址标签偶联物在10条水平通道中传递,然而“b”探针/地址标签偶联物在10条垂直通道中传递。例如,探针/地址标签偶联物b1通过414中的第一水平通道被传递给生物样品,探针/地址标签偶联物b2通过414中的第二水平通道被传递给生物样品,等等。在其他实施例中,“a”标签可以指“x”标签,“b”标签指的是“y”标签。每个交叉点或者结点可以独立地通过被传递到对应交叉点或结点的样品区域中的“a”探针/地址标签偶联物和“b”探针/地址标签偶联物的结合物唯一地识别。

图4c表示了与网格418一致的典型的组织切片416。箭头表示“a”探针/地址标签偶联物和“b”探针/地址标签偶联物在与组织切片416一致的网格418中是如何传递的。例如,如果,例如与靶标有关联的探针/地址标签偶联物a1和b4一旦被分析到,就说明靶标在位置(a1,b4)存在于所述组织切片中。

本文公开的方法和分析系统是能够多重分析的。例如,图5提供了一个可以用于多重检测的地址标签(或“位置编码”)方案。为了清新地说明,两个探针ts01和ts02分别对靶标1和靶标2特异性,如520所示。图5表示地址标签510,包含a1,a2,a3,a4和b1,b2,b3和b4。传递或分配方案如530所示。如图4所示的网格,a1-a4通过水平通道传递给样品,b1-b4通过垂直通道传递给样品。水平通道和垂直通道直接的交叉点如立方体实心方块所示。每个交叉点或者结点可以被传递到对应交叉点的样品区域中的“a”探针/地址标签偶联物和“b”探针/地址标签偶联物的结合物唯一地识别。

探针ts01和ts02被传递给样品并且可以与整个样品相互作用。如果所述靶标存在于样品中,探针ts01和ts02特异性地结合到它们相应的靶标上。不结合的探针被移除,例如,通过洗涤。地址标签510根据如530所示的空间分布传递给生物样品。例如,通过连接(或通过连接后延伸)地址标签与样品中特异性结合生物靶标1或生物靶标2的探针结合。耦合的结构被(或“探针/地址标签偶联物)从生物样品中洗脱出来并合并。在某些实施例中,如果测序接头不包含在所述地址标签或探针/地址标签偶合物中,可以添加测序接头,例如通过pcr或连接。所述探针/地址标签偶联物被进行测序,例如,通过高通量或下一代测序方法。

用于产生试验产物的集合如540所示。例如,集合中产物“a1t2b1”的存在表明在位置(a1,b1)获取了ts02的读数,因此在位置(a1,b1)检测了的靶标2。这样,仅在位置(a4,b1),(a4,b2),(a1,b3),(a2,b3),(a3,b3),(a4,b3)和(a4,b4)(空间分布550的水平线所示的位置)获得ts01的序列读数,及仅在位置(a1,b1)(空间分布550的垂直线所示的位置)获得ts02的序列读数。在位置(a2,b1),(a3,b1),(a1,b2),(a2,b2)和(a3,b2)(空间分布550的交叉线所示的位置)获得了ts01和ts02的序列读数。在位置(a1,b4),(a2,b4)或(a3,b4)(空间分布550的没有阴影的位置)没有获得ts01或ts02的序列读数。因此,在生物样品中,靶标1在样品的左边的大部分和底部检测到,然而靶标2仅在样品左上部分被检测到,在生物样品的右上部分没有靶标被检测到。两个生物靶标的差异表达可以绘制回到生物样品中和生物样品中这些位置的细胞类型或生物结构中。

除了可以获取位置信息外,也可以获取样品多个位点上的生物靶标的丰度。例如,如果数据组中出现的a4t1b1序列的数量是a4t1b2序列的数量的10倍,那么这表明靶标1在位置(a4,b1)的丰度是在位置(a4,b2)的靶标丰度的10倍。

如图3所示的核苷酸分析的情况下,通过直接连接地址标签与探针,对于n个靶标仅需要2n个探针。例如,分析样品中10,000个位点上100个不同的靶标需要2×100探针和2×100与所述几探针结合的地址标签。分析的寡核苷酸的总数仅有400个(200个探针和200个地址标签),通用引物不计算在内。相反,如果地址标签不与探针解耦合,分析寡核苷酸的数量将是(n×x位置数)+(n×y位置数)或者上述例子中的,20,000个寡核苷酸,通用引物不计算在内。在其他的实施例中,对于样品的每个位点,三个,四个或者更多的地址标签可能要用到,并且通过不同的方式和不同的步骤组合附加到在探针上或者一个接一个。

本发明公开的方法和分析系统尤其适合用于以有限数量的分析产生大量的信息。例如,对于样品中5个或者更多位置上的5个或更多生物靶标的分析产生25个或更多组合物。使用数字化测序读数,每个组合读取的最优序列数量取决于所需的灵敏度和动态范围,并且可以调整。例如,对于平均100读数的每个组合进行采样,25组合的总数是2500读数。如果用1,000的平均取样深度对1,000个位点的1,000个靶标进行分析,那么需要109个读数。这些数目,尽管很大,但是在固有的平行数字化测序方法能力范围之内,这可以在合理的时间内以很低的成本产生数十亿甚至数万亿的读数。因此,通过改变位点的数量或被分析的生物靶标的数量,或者,都改变,并且运用数字测序技术,可以获取大量的信息。在特定的方面,对两个或者多个生物分子进行多个位点分析。

因此,本发明提供的是一种同时观察样品中很多位点的很多不同生物靶标的能力,例如,在相同反应中。在一些实施例中,被分析的多个生物靶标的产物和生物样品中的多个位点大于约20。在其他的实施例中,被分析的多个生物靶标的产物和样品中多个位点大于约50。在其他的实施例中,被分析的多个生物靶标的产物和样品中多个位点大于约100,大于约500,大于约1,000,大于约10,000,大于约25,000,大于约100,000,大于约500,000,或大于约1,000,000。可以理解的是,甚至更大的数目都是可以预期到的。例如,分析样品中每10,000个位点的10,000个靶标将产生108不同的分析。在一些实施例中,样品中足够数量的位点可以被分析从而达到单个细胞被分析的分辨率的级别。而且,用到高通量数字测序的实施例中,至少1,000个探针或探针/地址标签偶联物的序列被典型地平行检测到。更典型地,运用数字读数,获取每个分析的多个序列读数(由靶标和位点限定的,如,通过靶标识别标签和地址标签)是可取的。每个分析获取至少3重复的平均值,更典型地,每个分析至少10和重复或至少30份重复,取决于实验的设计和分析的要求。对于合适范围内的定量的读数,每个分析至少获取1,000个读数是可取的。因此,如果进行1,000,000个分析,序列数量的读数可能是10亿或者更多。使用高通量测序技术,允许冗余,至少10,000探针或探针/地址标签偶联物的序列可以被平行检到,或者至少100,000,500,000,1,000,000,10,000,000,100,000,000,1,000,000,000或者更多的探针或探针/地址标签偶联物的序列被平行检测。

某些方面,本发明公开的是用于估测样品和/或样品间不同位点之间的生物靶标的数量和/或活性的差异的方法和分析系统。在一个实施例中,该方法包含了估测生物样品中每个位点的生物靶标的数量的差别。在另一个实施例中,该方法包含比较多个样品的一个或者多个生物靶标的丰度和/或活性的空间分布。

空间编码的原位分析

在某些实施例中,需要关联靶标多核苷酸表达的空间分布,例如,具有样品的组织学特征的2d样品中的mrna表达模式。在一些方面,组织学特征可以包括样品的已知标记的表达模式,例如,组织特异性标记,细胞类型标记,细胞系标记,细胞形态学标记,细胞周期标记,细胞死亡标记,发展阶段标记,干细胞或组织细胞标记,分化状态标记,表观遗传标记,生理或病理生理标记,状态改变标记,癌症标记或上述任何组合物标记。某些方面,组织学特征包含组织形态,例如,如蛋白标记的表达模式所指示的。某些实施例中,为了获取样品的分布信息,例如,样品的组织学特性,蛋白标记的表达分布,和/或组织形态,可以使用成像技术。例如,可能需要用到免疫组织化学成像(ihc)和/或免疫荧光成像(if)。

某些方面,本发明提供的方法称为用于蛋白质的多重原位分析的空间编码蛋白原位分析法(sepia)。在一些实施例中,sepia和相关的分析系统可以获取组织切片上的很多蛋白质相关丰度的空间信息。在某些实施例中,本发明公开的方法和分析系统是基于抗体的使用(或者其他能够特异性结合靶标的亲和捕获剂,而不是通过核苷酸序列的互补性),这些抗体用识别靶标蛋白或抗体的识别标签标记,并且这些抗体可以识别样品中多个位点中的每个位点上的一个或多个地址标签。在一个实施例中,每个位点至少提供两个地址标签,这两个标签中的其中一个识别一个维度(例如,x坐标)组织切片上的位置,另一个地址标签识别另一个维度(例如,y坐标)的组织切片上的位置。

本发明公开的任何实施例中,生物靶标可以是肽或者蛋白质,该发明的方法或分析系统可以用来分析样品中抗体的存在,酶和其他蛋白质的活性,转录后修饰,肽的活性和非活性形式以及肽的异构体。因此,探针可以包含酶的活性区域,免疫球蛋白的结合域,蛋白质的限定域,完整蛋白,合成多肽,引如突变的肽,配子等类似物。

本发明公开的任何实施例,探针可以包含酶或酶素的底物,例如,激酶、磷酸酶、发酵菌、蛋白酶或它们的片段。某些方面,探针可以包含磷酸化底物,其用于检测参与一个或多个信号转导路径中的蛋白。另一方面,探针可以包含特定蛋白酶底物,其与个体蛋白酶或特定类型的蛋白酶有关联。在其他方面,探针可以包含不同的加工形式,异构体和/或酶的区域。在某些实施例中,以蛋白质为基础的探针可以与寡核苷酸地址标签结合或连接到寡核苷酸地址标签上。在优选的实施例中,寡核苷酸地址标签可以包含核苷酸序列成分,该部分允许识别蛋白质探针。

在优选的实施例中,与寡核苷酸结合的抗体与本发明公开的地址标签方案是兼容的。某些方面,本发明的方法和分析系统是高度多重的,可扩展并且高通量的,该方法用于检测样品中多个位点的靶标蛋白的丰度,和/或活性的空间分布,采用靶标蛋白的核酸读数和独立成像。在优选的实施例中,本发明提供的方法和分析系统将核酸表达模式(如,dan或rna表达图谱)与细胞特定类型蛋白标记丰度结合起来,不需要蛋白标记成像,例如,免疫组织化学成像或免疫荧光成像。在优选的实施例中,本发明的方法和分析系统的空间分辨率接近细胞个体的大小。某些方面,使用本发明的方法和分析系统生成rna与蛋白度丰度关联的2d和3d图谱。

如图6所示,一方面,在样品616上进行(如图6c所示)高度多重的蛋白检测分析。在优选的实施例中,样品616可以是固定到载玻片的石蜡包埋或冰鲜的组织切片。图6a表示两个探针620和622分别特异性地结合感兴趣的蛋白靶标602。第一探针620可能包含与寡核苷酸标签604相关的靶标结合部分608。靶标结合部分608和寡核苷酸标签604可以耦合或共价连接。靶标结合部分608可以包含任何亲和性捕获剂,如,特异性结合蛋白靶标602的抗体。探针620可能进一步包含地址标签624和626。例如,使用测序技术,标签626可以是用于分析产物扩增的通用引物位点和/或能识别地址标签624和/或寡核苷酸标签604和/或探针620的其他区域的所述接头。在某些实施例中,标签626与地址标签624耦合或连接或者关联,例如,通过连接、延伸、延伸后连接、或其任意组合的方式。一方面,耦合或者连接或者关联了的相关的标签626和地址标签624整体与寡核苷酸标签604耦合或连接或者关联。在另外的实施例中,例如,在靶标结合部分608和/或寡核苷酸标签604上,标签626和地址标签624可能分别地与探针620耦合或者连接或者关联。

如图6所示,一方面,在样品616上进行(如图6c所示)高度多重的蛋白检测分析。在优选的实施例中,样品616可以是固定到载玻片的石蜡包埋或冰鲜的组织切片。图6a表示两个探针620和622分别特异性地结合感兴趣的蛋白靶标602。第一探针620可能包含与寡核苷酸标签604相关的靶标结合部分608。靶标结合部分608和寡核苷酸标签604可以耦合或共价连接。靶标结合部分608可以包含任何亲和性捕获剂,如,特异性结合蛋白靶标602的抗体。探针620可能进一步包含地址标签624和626。例如,使用测序技术,标签626可以是用于分析产物扩增的通用引物位点和/或能识别地址标签624和/或寡核苷酸标签604和/或探针620的其他区域的所述接头。在某些实施例中,标签626与地址标签624耦合或连接或者关联,例如,通过连接、延伸、延伸后连接、或其任意组合的方式。一方面,耦合或者连接或者关联了的相关的标签626和地址标签624整体与寡核苷酸标签604耦合或连接或者关联。在另外的实施例中,例如,在靶标结合部分608和/或寡核苷酸标签604上,标签626和地址标签624可能分别地与探针620耦合或者连接或者关联。

如图6所示,一方面,在样品616上进行(如图6c所示)高度多重的蛋白检测分析。在优选的实施例中,样品616可以是固定到载玻片的石蜡包埋或冰鲜的组织切片。图6a表示两个探针620和622分别特异性地结合感兴趣的蛋白靶标602。第一探针620可能包含与寡核苷酸标签604相关的靶标结合部分608。靶标结合部分608和寡核苷酸标签604可以耦合或共价连接。靶标结合部分608可以包含任何亲和性捕获剂,如,特异性结合蛋白靶标602的抗体。探针620可能进一步包含地址标签624和626。例如,使用测序技术,标签626可以是用于分析产物扩增的通用引物位点和/或能识别地址标签624和/或寡核苷酸标签604和/或探针620的其他区域的所述接头。在某些实施例中,标签626与地址标签624耦合或连接或者关联,例如,通过连接、延伸、延伸后连接、或其任意组合的方式。一方面,耦合或者连接或者关联了的相关的标签626和地址标签624整体与寡核苷酸标签604耦合或连接或者关联。在另外的实施例中,例如,在靶标结合部分608和/或寡核苷酸标签604上,标签626和地址标签624可能分别地与探针620耦合或者连接或者关联

在某些实施例中,可以采用主要抗体和次要抗体。例如,靶标结合部分606和/或靶标结合部分608,不直接与靶标602特异性结合,而是可能特异性地结合到能特异性地识别靶标602的主要抗体上。这种情况下,靶标结合部分606和/或靶标结合部分608可以包含在次要抗体中。某些方面,采用涉及主要抗体和次要抗体的方法是合适的,当样品中的靶标表达很低时,因为靶标602的一个分子可能与主要抗体的多重分子结合,从而增强了信号。

在其他的实施例中,如图6d所示,根据组合地址标签方案分析生物靶标632。两个探针650和652特异性地结合到感兴趣的生物靶标632。在一个实施例中,第一探针650包含与寡核苷酸标签634有关联的靶标结合部分638,第二探针652包含与寡核苷酸标签640有关的靶标结合部分636。靶标结合部分638和寡核苷酸标签634(或靶标结合部分636和寡核苷酸标签640)可以结合或共价连接。在个别实施例中,靶标结合部分638或636包含亲和性捕获剂,如,特异性结合靶标632的抗体。在某些实施例中,靶标632包含蛋白质部分,寡糖部分或多糖部分,脂肪酸部分,和/或核酸部分。在一些实施例中,每个探针都有特异性结合所述接头662的部分,例如,通过特定的核酸杂交。在一个实施例中,寡核苷酸标签634或640(或者是寡核苷酸634或640的一部分)与所述接头特异性地杂交。所述接头能特异性地结合下列组合物:

1)寡核苷酸标签634的5’部分和寡核苷酸标签640的3’部分;

2)寡核苷酸标签634的3’部分和寡核苷酸标签640的5’部分;

3)寡核苷酸标签634的5’部分和寡核苷酸标签640的5’部分;或

4)寡核苷酸标签634的3’部分和寡核苷酸标签640的3’部分。在某些实施例中,寡核苷酸标签634或640是线性分子,分支分子,环形分子或者它们的组合物。两个探针与生物靶标结合及所述接头与两个探针结合之后,可以将地址标签传递给样品并与所述接头耦合。例如,所述接头可以用与标签656关联的地址标签654标记,和/或用与标签660关联的地址标签658所标记。标签656和660可以是用来扩增分析产物的通用引物位点或能够识别地址标签和/或所述接头/地址标签偶联物的其他区域的序列,例如,通过采用测序技术。在某些实施例中,地址标签标记在所述接头的相同或者不同末端。在其他的实施例中,地址标签和/或标签656或660可以与所述接头先结合,然后所述接头/地址标签或所述接头/标签偶联物或复合物再被传递给样品,以与结合到生物靶标的探针相结合。

在某些实施例中,例如,所述接头/地址标签偶联物序列的全部或者部分通过核酸测序来检测。在其他的实施例中,寡核苷酸标签序列的全部或部分,和/或所述接头/地址标签偶联物序列的全部或部分被检测。例如,第一地址标签可以与寡核苷酸标签634耦合,第二地址标签可以与所述接头662耦合。寡核苷酸标签634和所述接头662之间形成的二倍体可以用于延伸和测序,来产生一个偶联物,该偶联物包含第一地址标签的,寡核苷酸标签634的全部或部分的,所述接头662的全部或部分的及第二地址标签的序列。

对于同一生物靶标,标记方案不限于使用两个或者多个探针。例如,在探针被标记的情况下,标签(如,地址标签,用于连接的所述接头,或通用测序引物或扩增引物序列)可以与特异性结合探针的所述接头耦合,而不是与探针本身耦合。

本发明的多核苷酸-蛋白的偶联物的更多详细说明也公开在申请号为61/902,105,提交日期为2013年11月8日,发明名称为“用于分析物检测的多核苷酸偶联物及其方法”的美国临时专利申请中,在此通过引用的方式将其内容全部并入本文。

在一些实施例中,不止一个所述接头被用到。例如,一对所述接头被用来分别特异性地结合寡核苷酸标签634和640。在某些实施例中,这对所述接头是dna分子:1)杂交到或者结合到蛋白-dna偶联物的,例如,探针650或652;2)有自由的3’和/或5’末端,使得编码序列(如,地址标签654和658)在随后的步骤中被添加上,例如,通过连接;3)是可连接的形式,如果在它们共同被定位或者彼此接近的情况下。在一些实施例中,探针650或652的寡核苷酸部分的一部分作为夹板使得这对所述接头能连接或延伸且连接。附加的标签(如,地址标签,用于连接的所述接头,或通用测序引物或扩增引物序列)结合到通过结合所述接头对产生的所述接头上。

在其他的实施例中,本发明公开的方法使基于蛋白的操作比以基于核酸的分析的操作简单。例如,设计所述接头,以便于使其与用来基于核酸的分析的同一编码寡核苷酸相兼容,如,基于rna的分析。因此,两种类型的结合分析(用蛋白-多核苷酸偶联物检测蛋白靶标和用核酸探针检测核酸)可以在相同的反应中或相同的实验操作中进行,并且空间地址可以同时在两种探针上进行。

还在另一个实施例中,本发明提供了用于分析检测蛋白靶标或包含蛋白部分的生物靶标的对照。例如,蛋白-核酸偶联物的核酸部分用于与样品中的核酸杂交。这锚定了样品中的“人工”蛋白(基于杂交序列丰度的已知的成分和丰度)。该“人工”蛋白可以用若干方法检测到,这些方法包括本发明公开的蛋白结合特异性标记的分析方法。该方法不限于蛋白质。例如,小分子,如半抗原也可以用到。一方面,图6e说明了用样品中已知的成分和丰度检测rna的方法的一般概念,从而提供了用于检测样品中其他靶标(如,蛋白)的对照。图6e,偶联物662和664每个都包含了一个核酸部分和抗体结合部分(圆形表示偶联物662的抗体结合部分,三角形表示偶联物664的抗体结合部分)。某些方面,样品中具有已知成分和丰度的rna666被662和664的偶联物的核酸部分特异性结合。在一些实施例中,运用本发明的方法,rna666的成分和/或丰度被检测到,在特定的实施例中,蛋白靶标的检测是同时进行的。在其他的实施例中,rna666的成分和/或丰度来源于现有知识或本领域的知识。在具体的实施例中,抗体结合部分可以是ha或flag,探针650和652的抗体部分可以是抗-ha或抗-flag抗体,例如,多克隆抗体或单克隆抗体。其他的蛋白-抗体结合对在本领域中是已知的并可以运用于本发明中。

图6b表示可能用于样品中100个单独位点的地址标签方案。例如,20个探针/地址标签偶联物x1-x10,y1-y10被用到,x1-x10中的每一个包含地址标签624,y1-y10中的每一个包含地址标签628。x1-x10中的每个和y1-y10中的每一个中包含的地址标签可以被唯一地识别。例如,探针/地址标签偶联物x9在612中的第九垂直通道中被传递给生物样品。然而,“x”探针/地址标签偶联物在第十垂直通道被传递给生物样品,“y”探针/地址标签偶联物第十水平通道被传递给生物样品,在如614所示。例如,探针/地址标签偶联物y1在614的第一水平通道被传递给生物样品。在其他的实施例中,“x”标签可以指的是“a”标签,“y”标签可以指的是“b”标签。

图6c表示与网格618一致的代表性组织切片616。箭头表示在与组织切片616一致的网格618上的“x”探针/地址标签偶联物和“y”探针/地址标签偶联物是怎样被传递的。例如,如果与靶标有关联的探针/地址标签偶联物x9和y1一旦被分析到,那么所述靶标就在位置(x9,y1)存在于所述组织切片中。

任何合适的寡核苷酸/抗体(或其他靶标特异性结合物)的偶联物的结构可以用来将特定蛋白检测转换成核酸分析。在某些实施例中,例如,如图7a所示,探针708特异性地结合蛋白靶标702。探针708可以包含与寡核苷酸有关联的靶标结合部分704。靶标结合部分704和寡核苷酸标签706可以结合或共价连接。靶标结合部分704可以包含任何亲和性捕获剂,如,特异性结合蛋白靶标702的抗体。探针708可能进一步包含“x”地址标签710和“y”地址标签712。地址标签710和712可能结合到通用引物位点用来扩增分析产物和/或接头(未在图7中显示)上以识别地址标签710和712和/或寡核苷酸标签706和/或探针708的其他区域,例如,通过测序技术。不同标签的结合可能通过连接,延伸,延伸后连接,或者以上任何组合形式来完成。在一些实施例中,地址标签710和712分别与寡核苷酸标签706的一侧或者另外一侧(如,序列的5’或3’端点)结合。在另外的实施例中,地址标签710和712可能与寡核苷酸标签706的5’或3’结合。例如,地址标签710和712可以直接或者间接地结合,地址标签710和712可能直接或者间接地与寡核苷酸标签706的5’或3’结合。

在其他的实施例中,例如,如图7b所示,探针720特异性地结合蛋白靶标714。探针720可能包含靶标结合部分716,结合,连接或者关联寡核苷酸标签718。靶标结合部分716可以包含任何亲和性捕获剂,如,特异性结合蛋白靶标714的抗体。探针720可能进一步包含特异性杂交寡核苷酸标签718的寡核苷酸序列722。在一个实施例中,序列722与寡核苷酸标签718是互补的。序列722可能结合“x”地址标签724和“y”地址标签726。例如,通过测序技术,地址标签724和726可能结合用来扩增分析产物的通用引物位点和/或所述接头(为在图7中示出)以识别地址标签724和726和/或序列722和/或探针720的其他区域。不同标签的结合可能通过连接,延伸,延伸后连接,或者以上任何组合形式来完成。类似图7a,地址标签724和726分别与寡核苷酸序列722的其中任何一侧(如,序列的5’或3’端点)直接或间接地结合。

在进一步的实施例中,例如,如图7c所示,可能用到“2-抗体”的形式。例如,在图6中,所述“2-抗体”形式与上面提到的双重靶标方法类似。在这个实施例中,与蛋白靶标特异性结合的两个抗体结合到一个寡核苷酸上,可以是直接或间接地结合“x”地址标签和“y”地址标签及用于扩增分析产物通用引物位点和/或用于测序的所述接头上。在一些实施例中,两个抗体可能结合不同的在蛋白靶标上的抗原表位或位点。在优选的实施例中,两个抗体与蛋白靶标的结合都要求产生信号,比仅采用一个抗体可提供更高的特异性。也可以考虑用两个以上的抗体与寡核苷酸结合及运用本发明的方法和分析系统。

正如本发明公开的,本发明的方法和分析系统允许更高水平的多重分析。在一个实施例中,探针可以在批量过程中传递到2d样品的整个表面上,然后以一种空间定义的模式通过传递地址标签来标记地址。例如,两组地址标签(“x”地址标签和“y”地址标签)以上述讨论的组合的方式被运用。该分析一旦完成,就对分析产物进行洗脱和测序。地址标签测序信息识别进行分析的位置,探针序列信息(识别标蛋白标签)识别作为靶标的蛋白。一方面,特定分析产物的频率(例如,测序产物)的数字化读数可以用来推断样品中靶标的相对丰度。这些信息可以与其他的信息关联的,包括常规的组织学信息,和/或通过相关空间编码基因分析(sega)获取的转录物丰度。在优选的实施例中,本发明的方法和分析系统不依赖于用于获取靶标蛋白空间信息的成像技术。相反,在优选的实施例中,靶标蛋白的丰度和/或活性的空间分布可以由测序来测定。

在一个实施例中,为了整合蛋白基因表达分析,地址标签方案与两种分析类型是兼容的并且可以运用于两种类型的分析中。例如,样品中多个位点的每一个位点,“x”地址标签和“y”地址标签的相同组合物可以标记到靶标蛋白的抗体-dna偶联物上,并且可以标记到靶标多核苷酸序列的探针上。在一个实施例中,靶标多核苷酸或其互补核苷酸编码所述靶标蛋白的全部或部分。因此,样品中的每个位点,靶标蛋白的丰度和/或活性和它对应的多核苷酸可以通过采用相同的地址标签对测序产物的分析检测到。在优选的实施例中,分析探针或探针/地址标签偶联物结合靶标蛋白的步骤和分析探针或探针/地址标签偶联物结合靶标多核苷酸的步骤可以在相同的反应中同时进行。在其他的实施例中,不同的地址标签可以与靶标蛋白的抗体dna偶联物耦合,且与靶标多核苷酸的探针耦合来检测给定位点的靶标蛋白和靶标多核苷酸的丰度和/或活性。然后对样品中每个位点的靶标蛋白和靶标多核苷酸的分析结果进行整合。

多种方法可以用于形成扩增结构,例如,通过邻近探针的连接,紧接着通过一对空间编码接头(地址标签)的连续连接。在一个实施例中,两个dna探针在一个rna靶标(或模板)上彼此邻近杂交。探针随后彼此连接且连接对的数量作为样品中存在的靶标数量的量度。某些情况下,然而,相比于在dna模板,当连接反应发生在rna模板时,t4dna连接酶的效率会降低。其他情况下,连接反应的效率取决于被连接的dna探针序列,尤其取决于接点两侧中任一侧的前几个碱基。在一些实施例中,本发明的方法缓解了这两个问题。这种情况下,探针通过其邻近端具有非杂交悬垂序列而被隔开一段距离,而不是使用rna靶标上直接临近杂交的探针。这些悬垂序列被设计与一个短dna夹板互补。该夹板对于多重分析的所有探针对都是通用的,或者对于给定的探针组或探针组子集是特异性的。一组中的两个探针的距离可以被调整以优化连接效率。相对于采用邻近探针,这个距离的灵活度给探针的设计提供了额外的自由度。一旦探针与rna靶标杂交,多余的探针就会被清洗掉。所述夹板与邻近的所述探针的的悬垂区域杂交,且所述探针通过连接酶加上。连接后完成剩下的实验步骤,例如,将空间编码接头连接到连接的探针对的每端。某些方面,由于dna夹板的连接比rna夹板的连接更高效,本发明的方法提高了两个所述探针连接的效率。此外,使用通用夹板消除了在多重的原位分析中的多个探针之间依赖于序列的连接效率上的变化。另一方面,由于提高了探针之间距离变化的自由度,探针可以更容易设计,可以设计更适合的探针组。

试剂传输系统

本发明所公开的试剂输送系统包括仪器,其允许试剂输送到生物样品的不连续部分,保持所述寻址方案中所述空间布局的完整性。本发明分析系统的试剂输送系统包括可选的成像装置,试剂输送硬件和控制软件。试剂输送可以以多种方式完成。应当注意,试剂可同时传送给多个不同的生物样品。虽然此处以单个组织切片为例举例说明,然而多生物样品可被同时操作和分析。例如,组织样本的一系列切片可被平行分析,并且数据结合起来可构建3d图谱。

构成本发明公开的分析系统的整体所必须的是一个仪器,其允许试剂在生物样品上进行空间分布。配制和输送生物分子(如寡核苷酸或抗体)和化学试剂(如小分子或dntp)的技术为本领域所熟知,这些仪器系统的使用是本领域技术人员所熟知的并且很容易应用到本发明所公开的检测系统中。其中一个例子是适合的试剂输送系统是labcytetmecho声学液体处理器,该声学液体处理器可以用于输送具有高精确度和可再生性生物分子的纳升级别的微滴。一个本领域技术人员可以将这种试剂输送装置并入到一个总体的系统中,其中使用软件去指定试剂被输送到的位置。

其它能用于输送试剂/或编码生物样本上标识符的其他仪器包括但不限于,喷墨点样,使用针、笔、或毛细管的的机械式点样,微接触印刷,光化学法或光刻方法,以及类似方法。在某些应用中,可能优选将生物样品的某些区域分割或者隔绝成一个或者多个用于不同试剂分布和/或生物靶标检测的分析区域。该分析区域可能采用障碍或者通道物理地隔离。

一个典型的方面,试剂传送系统可能是一个基于流动的系统。本发明中,用于试剂传送的基于流动的系统可以包括仪器,如一个或者多个泵,阀门,储液器,通道,和/或试剂存储单元。试剂传送系统被设置以移动流体去接触生物样品的不连续部分。试剂的移动可以由泵驱动,例如,所述流体试剂的下游。所述泵可以驱动每个流体试剂流到(和流经)反应区。或者,试剂可以被流体的重力驱动。uspub.nos.20070166725和20050239192公布了某种通用目的的应用流体学工具,该工具可以用于本发明的分析系统中,其允许精确操控气体,液体和固体从而以相对简单的硬件来完成非常负责的分析操作。

在一个更具体的例子中,一个或者多个流体单元可以被附着在上述有基偏固定的生物样品中。所述流体单元包括连接的进口管和出口管以及可选的外部泵用来将试剂传递到所述流体单元并穿过所述生物样品。流体单元设置来将试剂仅传送到生物样品的某些部分,限制传递给所述生物样品的任何特定部分的试剂的数量和类型。

在其他方面,微流控装置可以整合到基片上,在其上生物样品被处理或附着在基片的顶部。通过贴近所述基片的流体层,用于储存和传送流体的微流控通道可能在平面基板上形成和/或在平面基板之上形成。根据试剂容器之间的阀门的选择性打开和关闭,流体试剂可以被选择和传递。

泵通常包括移动液体和/或液体中试剂的结构。在一些例子中,所述泵可以设置用于移动液体和/或试剂通过小容积的通道(如,微流控结构)。该泵可以通过在液体和/或运载液体的结构上施加正压或负压来机械地操作,通过运用电场电动操作,或者机械电动同时操作。典型的机械泵可以包括注射器泵、蠕动泵、旋转泵,压缩气体,移液器等。例如,外部注射器和气动泵可用于注入液体并在微流控设备中产生液体的流动。机械泵可以是微型的机械,模型等。典型的电动泵可以包括电极并且可以通过电泳,电内渗,电毛细管,介电泳(包括它产生的行进波形式),和/或类似手段来操作。

阀门一般包括用于调节流体通过的通道的结构。阀门可以包括,例如,可变形的构建其可以选择性地变形以部分或完全地关闭一个通道,可移动的凸起其可选择性地延伸到通道内以部分或完全地阻塞一个通道,电毛细管结构,和/或类似物。

一个开放的垫圈可以连接到生物样本的顶部,并且样本和试剂可被注入到所述垫圈中。合适的垫圈材料包括,但不限于,氯丁橡胶,腈,以及硅橡胶。或者,不透水的反应室可由垫片夹在基片上的生物样本和化学惰性的防水材料间形成,化学惰性的防水材料如,但不限于,黑阳极化铝,热塑性塑料(如聚苯乙烯,聚碳酸酯,等),玻璃,等。

可被用在本发明所公开的方法和系统中的微流控装置被详细的公开在申请序列号为61/839,320,提交日为2013年6月25日标题为“使用微流控装置的空间编码生物分析”,在国际申请号pct/us2014/___,2014年6月25日提交的,代理案卷号为699932000340,标题为“使用微流控装置的空间编码生物分析”的美国专利中,此处为所有目的以引入的方式整体并入本文。

在一个可选的实施例中,该分析系统包含检测感兴趣的生物样品的特性和组织的成像方式。获取的图像,例如,可以用于设计所述试剂的传递模式。成像方式是可选择的,作为个体成像方式可以用来代替如用显微镜来观察生物样品,分析生物样品组织,及指定用于传送分析试剂的空间分布。如果列入,该传送系统可以包含一个包括成像仪的微电路装置,例如,ccd或基于igfet(如基于cmos)的成像仪和记载在uspub.no.20090197326中用于试剂传送的超声波喷雾器,其作为参考并入本文。应该注意,尽管这里举例说明了x-y网格配置,也可以用其他配置,例如,根据组织样本的布局,依据组织中的细胞特定基团,细胞层和/或细胞类型,以及类似等等。

还在另一个选择中,半导体技术如掩饰和喷雾技术可以同本发明公开的试剂传送的方法和系统联合使用,以便控制试剂传送到生物样品表面的特定的位置。生物样品特定的区域可以通过使用掩饰技术避免被暴露给试剂。通过常规技术如喷雾或液体流动将试剂引入生物样品。掩饰的传送的使用在基质表面产生有图案的传送方案。

在一个方面,所述试剂输送仪器是基于喷墨打印技术。有各种不同的喷墨机制(如,热的,压电的)并显示出与水性和有机油墨配方的相容性。独立驱动喷嘴组可被用于同时输送多种试剂,并且实现了很高的分辨率。

为了定位感兴趣的特异定点,被分析到的生物样品的信息图像可以用于协助试剂传送方法和相关的编码方案。生物样品的样品区域可以由与分析系统的其他特征整合的图像处理过程来识别(如,由免疫组织化学或其他染色化学进行区别的细胞类型的图像)。在一些方面,软件自动地将图像信息转换为试剂传送图案。在某些实施例中,非常精确地记录和排列生物样品用于试剂传送的机制是该分析系统的一个重要组成部分。如幻灯片基准标记的应用和/或其他非常准确的物理定位系统的针对该目的而被采用。

本发明的方法和分析系统可能包含一套完整的为该方法和分析系统定制的软件。可选择地,寡核苷酸设计软件用于为将进行的特定分析设计编码核苷酸(在核酸被分析的实施例中,是靶标特异性寡核苷酸),且可以被整合为系统的一部分。可选地,用于试剂传送的算法和软件及分析数据(如,序列分析)可以被整合用于检测分析结果。整合的数据分析特别有用,根据规模,生成的数据集的类型可能是大量的。为分析系统产生的相关空间数据的分析特别设计的演算法和软件工具,包括图案分析软件和可视化工具,提升了分析系统产生的数据的价值。

某些方面,分析系统包含制定和实施试剂质量控制的方法,如寡核苷酸池中的序列完整性和保真度。尤其,根据如波动性,关键温度下的稳定性以及与兼容的试剂传送仪器的化学兼容性等因素配制试剂,并且该试剂被分析系统中整合的仪器所分析。

检测系统的应用

读到本发明之后,对于本领域的技术人员是很明显的,即有大量的生物研究,诊断和受益于高通量多重分析系统的药物研发的重要领域,可以同时测量生物样品中生物靶标的数量和分布位置。例如,估测组织中很多位置上,其可以是单个细胞甚至更小,不同rna转录的相对丰度的能力及重构的丰度空间分布图像的能力的结合,可以使基础研究的不同领域成为可能。以下是示例性应用,不意味着对保护范围的限定。。

在一个实施例中,本发明公开的分析系统和装置可以辨别不同的组织类型,基于基因表达的组织特异性差异。一方面,本发明公开的分析系统和装置可以用于分析和辨别mrna和hnrna,并因此可以用于原位的rna加工的平行分析。一方面,探针被设计来靶定内含子和/或外显子。一方面,内部探针从hnrna发出信号,而不是从mrna发出信号。gdna背景信号可以被测出,通过采用dnase和/或rnase的选择性预处理方式。在一些方面,为拼接的rnas选择的拼接位点特异性探针被设计和使用。在某些实施例中,内部探针,外部探针,和/或拼接位点特异性探针的结合物可能用于识别加工中间产物的相对水平及组织切片中不同细胞之间的差异。通常,rna可以结合到不同类型的蛋白质上,并且尤其地,hnrna是与蛋白质复合形成hnrnp(不均一性核糖核蛋白)。在一个实施例中,本发明的装置和分析系统可以用于高度平行的原位实验足迹法实验。某些方面,相比靶定1000个不同的rnas,探针可以通过较少量的rna紧密排列以产生一个沿着分子的信号侧写。在该侧写中细胞类型之间的相对变化可以指示出在分析的特定位点上所述rna的可用性方面的差异。

在一个例子中,通过分析一系列的组织切片来检测基因表达的3维模式,在某种程度上类似于ct扫描的图像重构。这种方法可以用于测量疾病病理学中的基因表达的变化,如,癌变组织和/或损伤组织,炎症,或感染中的。采用本发明的分析系统,获取复杂组织中的基因表达和蛋白定位的更具体的信息,可以对正常和病变状态下的功能和规则产生新的理解,并提供了可以被测试的新的假设。例如,本发明的分析系统可以对获取自许多个体研究中和更大项目如encode(birney,etal.,nature,447:799-816(2007))及modencode的研究中的新的理解在组织水平上进行整合。该分析系统也有助于在系统生物学领域中基因表达的模型交互网络中的计算工作

该分析系统也提供了分析体细胞变异的新方法,如,应对传染性生物体的癌症中的体细胞突变或变化。例如,肿瘤是高度典型的异构体,包括癌细胞及局部异常环境中的遗传正常的细胞。癌细胞经历突变和选择,并且这个过程中局部克隆到发展并不罕见。识别肿瘤环境中相对罕见的体细胞突变有助于在克隆变异选择中的关键突变的角色研究。与血管生成,炎症或其他癌症相关过程相关联的转录模式在癌症和基因正常细胞都可以被分析以获得对癌症生物学的理解和协助治疗癌症的新药物的开发。在另一个例子中,个体对于感染的生物体有不同的敏感性,并且本发明的分析系统可以用于研究微生物和组织之间或组织中的多种细胞类型之间的相互作用。

重要地,除了提供空间相关的信息外,本发明还大大增加了检测罕见突变的敏感性,发出的信号可以更加显著地增加,因为在给定的反应中,仅很小的位置用于分析。在针对混合样品中罕见突变的典型分析中,样品被批量处理,如,核酸从许多细胞中提取出来放入一个单独的实验池中。因此,如果突变存在于10,000细胞中的一个细胞中,那么它一定会在来自于10,000细胞的正常dna的背景中被检测到。相比之下,许多细胞可以采用本发明的分析系统分析,但是个体细胞或小群体细胞将通过空间编码系统识别。因此,本发明的分析系统中,背景被数量级地减少,这大大地增加了灵敏度。此外,可以观察到突变细胞的空间组织,这对检测癌症中组织切片中关键突变部位尤其重要。分子组织学分析对于肿瘤生物学已经对产生新的见解,有潜力应用于诊断学。本发明的技术可以大大提高这类方法的效果。

接下来示例性实施例和实例用于进一步描述和说明本发明的各个方面,但不以任何方式,形状,或形式,明确地或者含蓄地限定说明本发明的范围。

实例1寻址方案的概念和可扩展性的验证

开发了一个采用使用基因芯片验证工作中多聚核苷酸靶标物的多重空间编码丰度的分析模型系统。基本设计验证了所述分析的理念和所述寻址方案,并在解决与更复杂的生物样品的分析相关的问题之前建立可用的分析。

基因芯片被用来作为组织切片的取代物。基因芯片的靶标序列被完全地指定,以便于靶标的组成被获知以及系统地变化。根据本发明的公开本领域技术人员可以得出,可以在不同的样本,包括组织切片上操作类似的分析,并且用于不同的靶标物包括多核苷酸或蛋白靶标以及其他的生物靶标物。

采用8层基因芯片作为人工样本的16重×8位点分析

所述16重×8位点分析采用定制的dna基因芯片(agilent)作为人工样本来进行。由于8-层基因芯片可以上商购获得8个位点被使用。十六个不同的靶序列以128倍量的dna量分别被分析。dna量的差异通过表面区域的变化获得,每个序列在所述几表面区域被合成。使用下一代测序读取,所有十六个靶标的dna量的差异被全部检测到。这个实验采用基因芯片作为人工样本示范了的一个可行的多重分析以及模型系统的空间编码精确性。

实例2使用斑点基因芯片的空间编码的实证

通过实施采用芯片模型系统的24重×24-位点的分析来示范空间处理和分析系统的可扩展性。

生物靶标物的量,此处的dna靶序列,在基因芯片上基板上的每个分析位点系统性变化。例如,在一个具有50微米的斑点尺寸(中心到中心)的基因芯片中,一个1mm2的区域包含~400个斑点。每个位点的周围区域被缺乏这类斑点的区域可选地占据,使所述靶标序列能单独分解。或者,2个或更多的相邻的斑点或围绕一个缺乏靶标序列的区域的斑点可以聚集。

为了证实空间寻址或编码是准确的,包括不同靶标组成的所述位点显示每个位点的检测读数与预期组成是相匹配的。采用24个靶标序列,做成具有12个存在的靶标物以及12个不存在的靶标物的不同组合的位点做成的简单数字化图案,做成二进制码(0=不存在,1=存在)。检测的读数然后被测定并显示,检测到的区域与空间解码后的预期信号相匹配。在这个特定的实施例中,编码(地址标记)空间足够大(2^24),以至于少量的错误并不会导致不同的代码被混淆。此外,这种设计允许识别错误,并且允许估计空间编码的精度,而且也允许估计靶标序列存在或不存在的精确度。

检测数量差异的能力通过为24-位点分析中每个位点上进行的所述24个分析中的每个分析产生的剂量-反应曲线被评估。这允许估计检测限度,动态范围和检测范围内的给定的倍数变化的能力。

在一个方面,一个拉丁方设计在通过每个靶标物的变化的数量特征的不同比例上来代表单个靶标。换句话说,一个位点上具有多个点,分配给所述24个靶标序列中的每个靶标序列的斑点的数量是可变化的,并且24个位点中的每一个都可以具有不同的组成。一个1×3英寸的基因芯片足够大可以允许多重复制。这24个序列的较大的集合将需要卷积,并且这可以通过使用高通量技术来完成的,如下一代测序技术(例.,solidtm技术(lifetechnologies,inc.,carlsbad,calif.),或基因组分析(illumina,inc.,sandiego,calif.).)。所述24-重分析的使用证实了空间编码和解码的准确性以及检测系统的定量反应答。

实例3保存样品和生物样品的分析方法

基因组dna被检测为了表征编码序列和调控序列的变化,如单核苷酸多态性(snps)或突变,小的插入和缺失(indels),拷贝数变异如基因的缺失或扩增,和基因重排如转座,所有这些都可能在癌症和其他疾病中具有显著的功能性意义。基因组序列变异作为样本中位置的功能可指示样本中的体细胞嵌合体。癌症样本中,突变可以提供预后或诊断标志物,其对于确定最佳的治疗方案是有用的。基因突变可识别包括癌症细胞的样本的区域,可以有助于将其它们与正常细胞或肿瘤微环境中的细胞区别开,所述肿瘤微环境的细胞是指由于受癌细胞的影响在遗传学的序列水平是正常的但在其他方式被扰乱的细胞。但为了区别来源于dna靶标物产生的信号与来源于rna靶标物产生的信号,探针可以被设计来与未被转录的非编码序列杂交。另外,为了保证dna靶标物的特异性,rna可以通过rna酶处理而降解。基因组dna也被分析用于获得其组织的信息以及提供特定基因的激活状态的信息。例如,探针与dna的结合能力可以用来指示是否dna是浓缩的或不可结合的,或是否dna是用于转录的开放形态。这种类型的确定可以受益于样本的比较分析,其样本中基因是具有活性差异的。类似地,将有关rna和/或蛋白蛋白质丰度的信息与基因的激活状态信息关联起来可能是有用的。其他类型的信息是从与基因组dna相关的表观遗传标记分析被获得,如甲基化状态和组蛋白和其他蛋白质的存在和修改。

对由非常小的或折衷的样本产生的产物分子的绝对数的处理被增强以对付低回收效率的问题;那就是,洗提是有效的,避免了吸附到表面的分子产生的损耗。解决后者问题的方法是去包括载体材料,如糖原或载体核酸。

为了对生物样品的采用所述分析,并使组织切片rna分析尽可能信息化,在分析设计中关于特定组织中表达水平到一定丰度范围内的靶标转录的预存信息。高丰度的转录,以及一些中等和低等丰度的转录,都被靶定以促使分析的定量性能特性的初始评估。在这个分析中,一个对照rna模板被固定在固体支撑上以创建一个人工系统。所述分析利用t4dna连接酶来进行,其可以修复dna/rna杂交中的缺刻。该分析在匹配的盖玻片或相同盖玻片的不同部分上进行分析,在一个实例中基因组dna被分析,在另一个实例中rna被分析。当分析基因组dna时,盖玻片可以用rna酶进行预处理,当分析rna时,盖玻片可以用dna酶进行预处理。分析的结果可以通过提取基因组dna或rna以及通过实时荧光定量pcr或反转录实时荧光定量pcr测定的相对含量来确定。

实例4多重空间编码的多核苷酸丰度分析

这个实施例描述了多聚核苷酸靶标物的具有代表性的多重空间编码丰度分析。根据本发明的公开本领域技术人员可以得出,可以对蛋白靶标物以及其他的生物靶标物进行相似的分析。

使用福尔马林固定,石蜡包埋(ffpe)的样本的57重分析

采用邻近标签连接并接着使用一对空间编码接头(地址标签)的顺序连接的方案用来形成一个可扩增的结构。例如,两靶标特异性探针寡核苷酸在原位杂交中被连接在一起。编码x位置的唯一接头或地址标签通过微流体通道被引进,并被连接到所述探针的5’末端。编码y位置的第二地址标签类似地被安装到所述探针的3’末端。地址标签包含通用的引物位点,其允许通过pcr安装额外的测序接头。最终的结构作为是下一代测序的底物。

在市售的福尔马林固定-石蜡包埋的正常人肝脏和胰腺组织(pantomics)上使用57个靶标物的探针池进行57重分析。所述探针池包括探针,用于18个肝特异性靶标,19个胰腺特异性靶标,4个持家基因靶标,6个自定义生成的阴性对照序列,和10个多能性标记。所有肝脏特异性探针在肝脏中均有丰富的富集,所有的探针中除了胰腺特异性探针的3在胰腺中都有强烈的富集。这些3个探针都有很少的总数,所以很可能他们是杂交或连接效率低下的序列,因而没有准确报告。这个试验的结果与已发布的有关在正常肝脏和胰腺表达的数据是一致的(biogps,availableatbiogps.org/#goto=welcome).

许多不同的试剂输送技术,包括随机存取方法,如喷墨和针点技术(pin-spotting),可被用于多重分析。使用微流体流体通道设备的系统被选择有几个原因。首先,软光刻技术典型地允许微流控装置快速开发,并且花费少及需要开发和购买合适的用于印刷或点试剂的仪器的时间少。第二,使用微流体装置可严格定义样品区域的大小,试剂的印刷液滴会在ffpe样品的表面上试剂不均匀地分散,产生不同大小和形状的样品区域。第三,使用微流体装置的试剂输送系统不需要精确的样品校准。这种特性允许两个编码位置接头(如,两个地址标签)的连续连接。相比于两个地址标签的同时连接,连续连接可以减少不需要的产物的形成。某些方面,对于使用喷墨和别针定位的试剂传送技术,每个液滴的位置或第一地址标签的位点必须与第二地址标签的液滴或位点一致,以便在连续连接中形成完整的结构。这要求样品的精确记录始终保存在两个印刷步骤中。相比之下,某些实施例中,基于本发明的方法和分析系统使用了一对微流控装置,其中每个都有平行通道,在其中,如图9a所示,第一和第二装置的通道彼此定向垂直。

如图9a中所示,微流控寻址装置采用突出的布局显示一对寻址装置,如图9b中所示,一个多聚(二甲基硅氧烷)(pdms)弹性材料装置具有16×16通道以及100μm通道宽度,如图9c中是一个具有夹子结构和蠕动泵结构的组装装置。

在某些方面,该装置的几何形状定义了连接点(或交叉点)的矩形阵列,每个连接点都有一个由两个通道的宽度定义的区域。当每个第一通道和每个第二通道接收和传递一个不同的地址标签时,结果是为所述阵列中每个接点或交叉点产生唯一的识别标签对。在微流控装置中的流体流动通常是由外部注射泵或真空驱动的并且往往需要一个复杂的探测装置,包括所述系统的微观通道和宏观组件之间的连接。在这个例子中所使用的试剂输送系统是一个将试剂加载进入所述通道的自足系统。所述装置可以从pdms弹性体中被驱出并包括试剂储液器,和微型寻址通道,每一个都连接到一个更大的蠕动泵通道。所述装置被用于ffpe样本的表面并被固定在合适的位置。一个拇指轮被应用在所述的泵通道上,滚动功能可以从每个储液器中抽出流体穿过所述寻址通道,在其中接触到组织样品并且所述地址标签被连接到杂交探针上。第一次连接之后,该设备被移除和样品被洗涤。第二,采用垂直的设备来安装第二组地址标签。只有出于两个通道的交叉区域的探针才能接收到两个地址标签。该设备可以被清洗和重复使用。

一套有5位点×5位点布局的微流控装置被组装为了与包含相应的5×5棋盘图案的定制设计的组织基因芯片(tmas)相匹配,该包含相应的5×5棋盘图案的定制设计的组织基因芯片被生产。所述定制设计的组织基因芯片包含如实例中上面使用的布置在一个棋盘形图案中的使用的市售的福尔马林固定-石蜡包埋正常人肝脏和胰腺(pantomics)组织。这种阵列上组织点的已知的模式的被用来验证的空间编码系统的精度。图10显示一个tma以及利用微流控试剂输送系统的检测系统生成的表达地图的免疫荧光图像。图10a显示一个被两个肝特异性抗体染色的定制的tma免疫荧光(if)图像:pygl,肝细胞和膜联蛋白a2的特异性,胆管细胞的特异性。参考文献是蛋白质图谱,可供参考www.proteinatlas.org。明亮的斑点是肝脏组织,暗淡的斑点是胰腺。图10b显示的22个最丰富的肝脏特异基因丰度的总和,被归为管家基因。每个正方形对应的信号映射到一个交汇处,一个500μm×500μm区域以tma组织核心中的一个为中心。图10c显示22个最丰富的胰腺特异基因丰度的总和,被归为管家基因。使用的微流控装置的寻址通道用于在一个深度为50的μm,2mm间距,500μ寻址通道的微流体装置用于在一个深度为50的μm2mm间距是500米宽的μ寻址通道的微流体装置用于在一个深度为50的μm2mm间距是500μm宽,对应于一个12.5nl的“虚拟体积”,包括垂直通道的交叉点。

这些结果证实了使用多重系统的绘制的测序数据重复出了所述组织样本的预期表达图案,并且多重分析与免疫荧光成像相兼容,允许基于蛋白质标记的细胞类型的测定及其与基因表达数据相关联。

使用福尔马林固定,石蜡包埋(ffpe)的样本的134-重检测

一个探针池和2个装置布局被开发。所述探针池包括134个靶标物,其代表如表1所示的69个独特的基因。通过测序读出表达,少数高表达的基因占据了所述读数的大部分,限制分析的动态范围。通过减弱池中一些最高度表达的基因来减缓这个问题。这是通过在活性探针中添加已知比例的衰减探针来实现的。衰减探针缺乏连接反应所需的5’磷酸,抑制扩增产物的产量,从而降低靶标物的信号。表2显示前5个基因的衰减结果。衰减之前,他们占读数的73%,而之后占不到18%。这个策略可与目前测序技术实现非常高水平的多重分析,同时还实现高度动态范围。

表1:在134-重探针池中的每个基因的独特标靶的数量和基因清单

表2:前5个分析靶标物的衰减

实例5用于下一代测序的空间编码探针的洗脱与制备

使用前述方法,134-重探针对池与ffpe样本杂交,采用x-位置的和y-位置的接头空间编码和连接。在洗脱剂的制备中,杂交槽(agilent)应用于盖玻片,并被固定在合适的位置以形成一个包含ffpe组织样本的防泄漏腔室。使用注射器,防泄漏腔室被注满去离子水,并被加热到80℃维持30分钟之后,洗脱液被使用注射器移除并被转移到一个管中。

空间编码结构被采用磁珠的两轮阳性选择所纯化以使其从任何非编码探针上分离开。在第一轮纯化中,洗脱液与生物素化的捕获探针杂交,捕获探针其包括一个序列,该序列与横跨x位置接头(地址标签)和连接的探针对的5'端的交叉点的序列互补。该捕获探针然后被链霉亲和素修饰的磁珠捕获,链霉亲和素修饰的磁珠然后被大规模地清洗以除去未结合的材料。与捕获探针杂交的结构随后在含有与捕获探针互补的阻断寡核苷酸的洗脱缓冲液中加热洗脱。通过磁铁洗脱液从磁性珠中分离出来,并被转移到一个新的容器中,并与用生物素标记的捕获探针杂交,捕获探针其包括一个序列,该序列与横跨y位置接头(地址标签)和连接的探针对的3'端的交叉点的序列互补。捕获探针,连同杂交结构,相继捕获到链霉亲和素修饰的磁珠上并被清洗。

这些珠子被直接转移到pcr混合物中,其包含有在illuminamiseq仪器上实现pcr产物测序的序列的引物。所述引物也包括truseq条形码以允许在单一的测序过程中多个样品的多重化。通过凝胶电泳分析聚合酶链反应产物的一份部分,以检验扩增的空间编码结构的存在。剩余产物使用qiagenpcr纯化试剂盒被纯化。最后,采用常规的凝胶电泳装置或pippenprepsystem(sagescience)对空间编码结构按尺寸选择进行纯化。

纯化的编码结构使用illuminamiseq测序仪测序,数据被用来产生表达图谱。

实例6原位分析中的空间编码蛋白

这个例子描述了原位分析中的空间编码蛋白。一个高度多重的蛋白质分析在如上所述的含有肝脏和胰腺组织核的棋盘形图案的组织基因芯片进行。在这种情况下,使用5-位点×5-位点地址图案编码两重分析。首先应用一个典型的使用两个初级抗体的免疫染色组化过程来执行分析,一个抗体是外分泌胰腺细胞特异性的,一个是肝脏肝细胞特异性的。两个抗体-dna结合物被用作二级抗体,并应用于整个组织基因芯片中。所述结合物包括寡核苷酸,其含有识别标签和允许x和y地址标签连接的上游和下游夹板区域。将初级抗体和二级抗体结合到整个样品并充分洗涤后,一对微流体通道装置被用来连续地传递x和y地址标签,其被连接到所述结合物上的寡核苷酸上。所述结合物从样品中被洗脱,结合的x和y标签以及其间的识别标签形成可扩增的结构,所述扩增结构被扩增,纯化,并接受下一代测序以识别每一个空间编码位置的抗体靶标物的丰度。

实例7原位分析中的空间编码蛋白

这个例子描述了原位分析中的空间编码的蛋白质。如图6a所示,一种高度多重的蛋白质分析可在保存了组织中细胞空间布局的样品上进行,如石蜡包埋或固定于载玻片上的新鲜冰冻组织切片。分析试剂是蛋白质结合物(如抗体),其是可通过连接dna标签来识别,连接的dna标签可被编码位置或地址信息(在这个实例中,表示为x纬度和y纬度)的标签序列进一步编码。所述地址标签x和y位于通用序列(up1andup2)的两侧,所述通用序列可以被用作pcr引物位点,下一代测序的接头,或都可以。

如图6b所示,例如,结合子,如在这个例子中的dna标记的抗体探针,在一个批量过程中被输送到整个样品表面。然后x和y地址标签被输送到样品,并被耦合到探针上,使得探针被x和y地址标签根据空间定义图案进行编码。在这个实例中,两套标签(如,一套10x地址标签,命名为x1,x2,x3,……x10,以及一套10y地址标签,命名为y1,y2,y3,……y10,)被用在一个组合式样中,样本中的100个位点可被x和y地址标签的组合独一无二地识别。例如,显示在图xb中的样本中的一个位点被独一无二的识别为(x9,y1)。

一旦完成了原位分析,分析产物被洗脱和测序。所述地址标签序列信息分析被执行的位点,并且探针序列信息识别所靶定的蛋白质。在数字读出的特定分析产物的频率可以被用来推断样品中它的靶序列的相对丰度。此信息可以与其他信息相关联,包括常规的组织学信息,和/或通过相关的空间编码基因组分析获得的转录丰度。

实例8减弱背景以及增强信噪比的方法

该实施例描述了在混合核酸中检测罕见变异序列的方法。该方法可以被整合到本发明的分析系统和方法中,例如,以减少随机误差引起的背景从而提高信噪比(s/n)。

结合数字化测序的平行克隆扩增方法已经允许以1%的分辨率进行大规模的变异分析(druleyetal.,2009,nat.methods6:263-65),但不低于1%。尽管下一代测序技术能重新发现并允许整个基因组更深层的变异分析,测序过程中不同步骤的因素的结合使得很难于获得很低的读数误差。这些因素包括检测通道之间的干扰,不完全反应导致信号丢失,核酸加入同步性丢失导致的增加的背景,以及图像处理和信号提取过程的噪音和误差,其在更高的测序密度时会更严重。因此测读数误差率远远高于测序反应中使用高保真聚合酶存在的固有的误差率。例如,pfusiontm聚合酶的误差率被估测为4.4×10-7(newenglandbiolabs,ipswich,ma)。该实施例描述的方法解决了上述的技术问题,通过使用识别“来源相同的”靶标序列的标签。如图11a所示,序列读数可以在此基础上划分为相关组。

图11a表示罕见变异分析的概念,图11b提供了探针的典型配置,该探针可以用于将罕见突变的分析整合到本发明的空间编码分析中。图11a的上面板展示了感兴趣的所述接头连接在侧面的靶标序列,该接头包含用于表面pcr的illumina接头序列(标记了a和b)。该靶标可以获取自各种来源,例如,pcr扩增元。所述接头包括了可变标签区域(标记了z)。两条链被显示出来以图示illumina接头是不对称的。附有标签的接头用于构建测序的文库。在流动细胞表面单个分子被扩增形成“簇”。每个靶标区域和它相关的标签区域的序列被检测。所示的最后一步中,读数根据它们的标签区域被分组,假设有相同的标签序列的读数是来源相同的,假设z是足够长的。然后这些组被分析以识别罕见突变序列(上次编号为4的靶标用深色以与1-3组表示的靶标相对比表示其靶标序列与1-3组的是不同的)。用于检测罕见突变序列的类似的方法已经被记载在fu等人.,2011,proc.natl.acad.sci.,108:9026-9031,和schmitt等人.,2012,proc.natl.acad.sci.,109:14508-14513,在此通过引用的方式将其内容全部并入本文。

通过这种策略,随机测序误差几乎可以消除。因此,除污染物以外,检测罕见变异的能力在理论上将受样品大小的限制。注意尽管如图11a所示的设计引用illumina接头和表面扩增的方法,但是该方法是常规的,一般可以用于其他测序平台诸如solid平台(lifetechnologies),454平台(roche)和pacificbiosciences和iontorrent的文库构建方法。

模型系统被建立来量化使用illuminagaiix仪器的标准测序的检测限制上的改进。该模型系统是由野生型的100-聚寡核苷酸和包含独特的、野生型序列中单个位点突变的突变序列组成。合成的寡核苷酸被克隆到大肠杆菌质粒载体中且单克隆被选出和为了获得包含想要的序列的结构而验证了序列,提供纯粹的、定义好的无寡核苷酸化学合成误差(通常在0.3-1%)的序列结构。感兴趣的所述100-聚寡核苷酸随后被限制性酶从质粒克隆上切除。突变体和野生型寡核苷酸被量化并以1:0,1:20,1:1000,1:10,000,1:100,0001:1,000,000,0:1的比率混合,用以模拟野生型dna背景下罕见变异的存在。

接下来,包括随机10聚标签的定制接头被设计和合成。从定义的寡核苷酸混合物中准备文库,并用illuminagaiix仪器进行测序。首先分析数据并且不利用标签信息。这导致了仅能在1:20的样品中进行突变点检测。第二轮利用标签的分析用高质量的读数完成,该读数中,如果标签彼此在>99%的时间被分在一组且具有≥2的复制次数,则标签1/标签2组被保留。为了使一个标签组记分为突变,该组中至少90%的结果须符合。

如表3所示突变的等位基因也在1:10,000,1:100,000,1:1,000,000样本中被成功地检测到。突变等位基因频率在期望值为2的因素内被观察到,这个差异归因于算液和移液误差里。用~7.5m标签组观察野生型(阴性对照)样品突变的能力大于0.999。因此,加标样品与阴性对照之间1:1,000,000的差异是高度显著的。

表3:表3检测~6数量级以上的突变的等位基因的能力验证

观察具有频率为f的突变的能力是1-(1-f)^#标签,所以额外的测序深度可以提高检测能力。该模型系统的检测限制仅由样品大小及可能出现的任何背景污染物决定。

该方法用于区分体外扩增误差与存在于原始样品中的罕见突变。例如,一个标签组中突变频率必须>0.9的一个简单的阈值可用于排除分析中的pcr扩增误差。这是基于这样的观察:在特定位置上预期的拷贝部分包含的误差等于0.5,条件是所述误差正好发生在第一个循环并忽略及在同一位置发生连续的pcr错误的机会。在阴性对照中,没有标签通过这个标准。

为了降低随机误差造成的背景从而增加信噪比(s/n),这种方法可以被集成到方法以及确定靶标物丰度、表达或活性的空间布局的检测系统中。集成x和y地址标签以及可变标签区域的探针的非限制性的示范性的配置如图11b所示。

实例9脑组织的分析

这个实施例描述了一个至少24重蛋白分析平板的生产和通过与荧光标记的相关性以及组织基因芯片的分析确认组织/细胞类型特异性的确认。

选择一组26个抗原组成的组。这些抗原被表达于神经元,星形胶质细胞,少突胶质细胞、小胶质细胞或增殖细胞,并且被选来抗这些抗原的抗体是可以商购获得的(表4)。结合建立好的染色技术,这些抗体已成功地用于标记不同的细胞类型和脑切片内的区域(lyck,etal.,2008,jhistochemcytochem56,201-21)。为分析的目的,有必要避免损害rna的抗体结合过程。

抗原的可访问性通过开发一系列的“抗原修复”的方法以及测试它们与rna的相容性得以解决。参阅,macintyre,2001,brjbiomedsci.58,190-6;kapetal.,2011,plosone6,e27704;inoueandwittbrodt,2011,plosone6,e19713.。一组抗体分析而不是任何单独的分析被开发来识别在多重分析面板中使用的合适的子集。

分析系统通过利用空间编码和常规ihc的荧光数据和空间编码rna数据得到验证,并被应用到脑组织。来源于人脑组织切片中的32×32个位点上的高维蛋白和mrna数据被产生并与已公布的数据和脑图谱数据相比较。

使用本发明公开的方法和检测系统,allenbrainatla(www.brain-map.org)可用于为具有高信息含量的基因表达分析面板的生产筛选靶标基因。“differentialsearch”工具用来从丰富的空间表达数据集(通过原位杂交产生的)中获取数据,得出,在大脑的至少一个结构/区室在一个丰度范围内存在~200个基因,和/或在不同结构/区室间存在强烈的差异表达。所述选择被评审以合并任何新的信息或标准。识别该~200mrna集的探针被设计和在多重分析中的测试它们的性能,以在线基因表达数据为参考。

蛋白质板和rna分析板同时被应用于正常人脑切片分析。例如,在50μm像素的32×32格上分析来源于健康人脑切片的至少24个蛋白质和192个mrna的丰度。结果被用来产生大脑空间组织的分子地形的详细图谱,并适合不同方式的分析,包括这些揭示了:

1.脑组织分为不同的亚结构:在解剖学的范畴和在较低水平的多细胞水平;

2.空间的差异表示组织中的不同细胞类型(例如:采用已知的对特定细胞类型特异的一套蛋白/mrnas)

3.同一基因在不同组织部位的mrna和蛋白质表达之间的关系。

表4:区分脑组织的候选蛋白,已被用于免疫组织化学,有可商业化获得的抗体。

所有标题都是为了方便读者,而不应该用来限制标题下的文本的意思,除非特殊指明。

上述出版物或文件的引用并不是为了承认任何一个是相关的现有技术,也不构成对这些出版物或文件的内容或日期的任何承认。

虽然本发明的各种实施例已如上所述,应该理解的是,他们只是以举例而不是限制的方式呈现。同样的,为了信息公开的目的,各种图表可以描述示例性结构或其他配置,这是为了帮助理解包含在本公开中的特征和功能。本公开并不局限于所示的示例结构或配置,但可以通过使用各种替代结构和配置而实现。此外,虽然以各种示范性的实施例和实施中描述了本发明,应该理解的是,在一个或多个实施例中描述的各种特征和功能并不局限于在特定的实施方式中的所描述的适用性。他们反而可以单独或以某些组合的方式被应用到本公开的一个或多个其他实施例中,无论这样的实施例是否被描述,或是这样的功能作为被记载的实施例的一部分是否被提出。因此本发明公开的广度和范围不受上述示例性实施例的任何限制。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1