具有响应于多个激发频率的基准的系统和方法与流程

文档序号:16990877发布日期:2019-03-02 00:57阅读:191来源:国知局
具有响应于多个激发频率的基准的系统和方法与流程

本申请要求于2017年2月1日提交的英国(gb)专利申请号1701684.1、和于2017年2月1日提交的英国(gb)专利申请号1701690.8、以及于2017年2月1日提交的英国(gb)专利申请号1701685.8的优先权,这些专利申请的每一个的内容通过引用以其整体并入本文。

背景

对图案化阵列开发了越来越多的应用。这种图案化阵列可以例如支持脱氧核糖核酸(dna)和核糖核酸(rna)探针。这些对在人类和其他有机体中的基因中存在的核苷酸序列是特定的。例如,在一些应用中,单独的dna和rna探针可以在图案化阵列载体上以几何栅格(或随机地)附着在小位置处。例如来自已知或未知的人或有机体的测试样品可以暴露于栅格,使得片段的互补基因与在阵列中的单独位点处的探针杂交。然后可以例如通过将特定频率的光在位点上扫描以常常通过基因或片段所位于的位点的荧光识别出样品中的哪些基因或片段存在来检查阵列。来自样品的片段被结合到的阵列的特征的检测可用于识别在样品中存在的分子序列。核酸阵列也可用于基本基因测序。通常,基因测序由确定在一段遗传物质中的核酸或核苷酸顺序组成。该技术正在继续发展和改进,且越来越大的核酸样品(例如更复杂的基因组(以及其他分析物))正在阵列上被测序。

对于核酸阵列的这些和其他应用,也在检测硬件和编程中做出改进。例如,在成像系统中的改进例如通过使用成像光学器件的线扫描和共焦控制来允许更快、更准确和更高分辨率扫描和成像。然而,在一个示例中,当阵列中的特征的密度增加且特征的尺寸减小并且阵列的总体尺寸扩大时,准确的检测变得有问题。在阵列上的位点的数量和密度增加的情况下,挑战包括准确地定位位点、在测序和成像的连续循环中使位点对准或给位点编索引的能力,以及避免可能混淆连续图像或图像数据(其是确定在阵列的位点处存在的序列所需的)的比较的问题。在检测和图像处理中涉及的经济成本和时间也可能变得成问题。

概述

阵列的第一方面和两种方法在本文中在权利要求1-20中进行限定,并且对应于2017年2月1日提交的英国(gb)专利申请号1701684.1(案卷编号ip-1402-gb)的权利要求。

本公开提供了阵列的第一方面,该阵列包括载体,其具有在操作中接收生物样品的位置,所述生物样品彼此不同以在荧光成像的连续循环中不同地做出响应;以及在载体上的基准特征,该基准特征具有在荧光成像的连续循环中通过产生可检测信号做出响应的荧光材料。

在阵列的第一方面的示例中,在执行荧光成像的连续循环时,生物样品中只有一些出现在连续图像中,而排除掉生物样品中的其它,但是其中基准特征出现在所有图像中。

在阵列的第一方面的示例中,利用在至少两个不同波长处的光来执行荧光成像的连续循环,并且其中基准特征的荧光材料对至少两个不同波长做出响应。

在阵列的第一方面的示例中,基准特征包括至少一个凹坑和设置在至少一个凹坑中的对象,该对象包括荧光材料。在该示例中,设置在至少一个凹坑中的对象太大以至于无法在载体的接收生物样品的位置中被接收。

在阵列的第一方面的示例中,位置以规则的重复图案设置在载体上。

在阵列的第一方面的示例中,载体包括位置的多个区域,并且其中基准特征设置在多个区域中的每个中。

在阵列的第一方面的示例中,生物样品包括核酸序列。

在阵列的第一方面的示例中,基准特征包括相邻但不同心的形状。

在阵列的第一方面的示例中,基准特征包括非闭合形状。

阵列的第一方面的示例还包括多个基准特征,并且其中基准特征在非直线布局中被设置在载体上。

在阵列的第一方面的示例中,基准特征被构造成产生编码信息的图像数据。

阵列的第一方面的示例还包括至少一个附加的基准特征,其在载体中或载体上形成并且在成像期间光学地反射以返回入射辐射的至少一部分,用于定位载体、调整载体的位置或配准载体或位置。

阵列的第一方面的示例还包括基准特征,其包括设置在阱或沟槽中的多个自发荧光元件。

在阵列的第一方面的示例中,基准特征包括具有在约5μm和约10μm之间的直径的多个元素。

在阵列的第一方面的示例中,基准特征包括多个元素,该多个元素包括聚苯乙烯、二氧化硅或其组合。

应当理解,阵列的第一方面的任何特征可以以任何期望的方式和/或配置组合在一起。

本公开还提供了一种方法,其包括:将生物样品设置在载体上的位置处,该生物样品彼此不同以在荧光成像的连续循环中不同地做出响应;以及将基准特征设置在载体上,基准特征包括在荧光成像的连续循环中通过产生可检测信号做出响应的荧光材料。

该方法的示例还包括以不同波长的光在荧光成像的连续循环中对生物样品和基准特征成像,以产生对由生物样品和基准特征产生的荧光信号编码的图像数据。

在该方法的示例中,其中在荧光成像的每个连续循环之间,在每个位置处从生物样品中移除标签,并且在每个位置处将附加的生物成分添加到每个生物样品,附加的生物成分具有对荧光成像的连续循环做出响应的标签。

应当理解,该方法的任何特征可以以任何期望的方式组合在一起。此外,应当理解,该方法的和/或阵列的第一方面的特征的任何组合可以一起被使用和/或与本文公开的任何示例组合。

本公开还提供了一种方法,其包括:访问对设置在载体上的位置处的生物样品的连续图像编码的图像数据,生物样品彼此不同以在荧光成像的连续循环中不同地做出响应,图像数据进一步对在载体上的基准特征的图像编码,基准特征具有在荧光成像的连续循环中通过产生可检测信号做出响应的荧光材料,基准特征包括非闭合形状;通过参考基准特征针对连续图像配准载体上的位置;以及处理所配准的连续图像以将从连续图像导出的数据转换成序列数据。

应当理解,该方法的任何特征可以以任何期望的方式组合在一起。此外,应当理解,该方法的和/或其他方法的和/或阵列的第一方面的特征的任何组合可以一起被使用和/或与本文公开的任何示例组合。

阵列的第二方面和两种额外方法在本文中在权利要求21-40中进行限定,并且对应于2017年2月1日提交的英国(gb)专利申请号1701690.8(案卷编号ip-1539-gb)的权利要求。

本公开提供了阵列的第二方面,包括载体,其具有在操作中接收生物样品的位置,该生物样品彼此不同以在荧光成像的连续循环中不同地做出响应;以及在载体上的基准特征,该基准特征具有在荧光成像的连续循环中做出响应的荧光材料,其中基准特征包括相邻但不同心的形状。

在阵列的第二方面的示例中,相邻但不同心的形状包括圆形。

在阵列的第二方面的示例中,基准特征包括在载体的接收生物样品的位置之中定位的配准基准。

在阵列的第二方面的示例中,基准特征包括在载体上的区域外部定位的自动定心基准,在该区域中设置有载体的接收生物样品的位置。

在阵列的第二方面的示例中,利用不同波长处的光执行荧光成像的连续循环。在示例中,利用在至少两个不同波长处的光来执行荧光成像的连续循环,并且其中基准特征的荧光材料对至少两个不同波长做出响应。

在阵列的第二方面的示例中,生物样品包括核酸序列。在该示例中,基准特征包括在载体上的生物样品的位置之中定位的配准基准。可选地,在该示例中,基准特征包括在载体上的区域外部定位的自动定心基准,在该区域中设置有生物样品的位置。

在阵列的第二方面的示例中,基准特征包括非闭合形状。

阵列的第二方面的示例还包括多个基准特征,并且其中基准特征在非直线布局中被设置载体上。

在阵列的第二方面的示例中,基准特征被构造成产生编码信息的图像数据。

阵列的第二方面的示例还包括至少一个附加基准特征,其在载体中或载体上形成,并且光学地反射以在成像期间返回入射辐射的至少一部分,用于定位载体、调整载体的位置或者配准载体或位置。

应当理解,阵列的该第二方面的任何特征可以以任何期望的方式组合在一起。此外,应当理解,阵列的该第二方面的和/或阵列的第一方面的和/或多个方法的特征的任何组合可以一起被使用和/或与本文公开的任何示例组合。

本公开还提供了一种方法,其包括:将生物样品设置在载体上的位置处,该生物样品彼此不同以在荧光成像的连续循环中不同地做出响应;以及将基准特征设置在载体上,基准特征包括在荧光成像的连续循环中做出响应的荧光材料,其中基准特征包括相邻但不同心的形状。

该方法的示例还包括在不同波长的光下在荧光成像的连续循环中对样品和基准特征成像,以产生对由生物样品和基准特征产生的荧光信号编码的图像数据。

在该方法的示例中,在荧光成像的连续循环之间,在每个位置处从生物样品中移除标签,并且在每个位置处将附加的生物成分添加到每个生物样品,附加的生物成分具有对荧光成像的连续循环做出响应的标签。

应当理解,该方法的任何特征可以以任何期望的方式组合在一起。此外,应当理解,该方法的和/或阵列的第二方面的和/或阵列的第一方面的和/或多个方法的特征的任何组合可以一起被使用和/或与本文公开的任何示例组合。

本公开还提供了一种用于处理生物样品的方法,包括:访问对设置在载体上的位置处的生物样品的连续图像编码的图像数据,生物样品彼此不同以在荧光成像的连续循环中不同地做出响应,图像数据进一步对在载体上的基准特征的图像编码,基准特征具有在荧光成像的连续循环中做出响应的荧光材料,其中基准特征包括相邻但不同心的形状;通过参考基准特征针对连续图像配准载体上的位置;以及处理所配准的连续图像以将从连续图像导出的数据转换成序列数据。

该方法的示例还包括表征在连续图像的每一个中的位置处具有标签的分子。该示例还包括表征在连续图像的每一个中的位置处具有标签的分子,其中分子包括核酸。

该方法的示例还包括以不同波长的光在荧光成像的连续循环中对样品和基准特征成像,以产生对由生物样品和基准特征产生的荧光信号编码的图像数据。

应当理解,该方法的任何特征可以以任何期望的方式组合在一起。此外,应当理解,该方法的和/或阵列的第二方面的和/或阵列的第一方面的和/或多个方法的特征的任何组合可以一起被使用,和/或与本文公开的任何示例组合。

阵列的第三方面和两种额外方法在本文中在权利要求41-60中进行限定,并且对应于2017年2月1日提交的英国(gb)专利申请号1701685.8(案卷编号ip-1543-gb)的权利要求。

本公开提供了阵列的第三方面,包括载体,其具有在操作中接收生物样品的位置,该生物样品彼此不同以在荧光成像的连续循环中不同地做出响应;以及在载体上的基准特征,该基准特征具有在荧光成像的连续循环中做出响应的荧光材料,其中基准特征被构造成产生编码信息的图像数据。

在阵列权利要求的第三方面的示例中,信息通过在图像数据中可检测到的交替的信号发生区域和非信号发生区域来编码。在该示例中,交替的信号发生区域和非信号发生区域可检测为在荧光成像的连续循环的全程中不改变。同样在该示例中,交替的信号发生区域和非信号发生区域包括虚线状区域、点状区域或其组合。

在阵列权利要求的第三方面的示例中,信息通过基准特征的至少一部分的形状来编码。

在阵列权利要求的第三方面的示例中,信息通过基准特征的至少一部分的定向来编码。

在阵列权利要求的第三方面的示例中,基准特征包括多个元素,并且其中信息通过元素的相对定向或定位来编码。

在阵列权利要求的第三方面的示例中,基准特征包括由在图像数据中可检测的区域限定的机器可读标记。在该示例中,机器可读标记包括被布置为限定具有可解释意义的二进制数据的离散区。在一些示例中,离散区形成处于彼此固定关系的区阵列,该区被填充以在图像数据中产生或不产生信号。在一些示例中,该区域形成二进制数。在其他示例中,区的多个相同阵列设置在基准特征中。在这些其他示例中,区的阵列的至少一个被设置在至少部分闭合的形状中。在又一个示例中,机器可读标记包括条形码标记。

在阵列权利要求的第三方面的示例中,编码的信息指示其他基准特征在载体上的定向或方向。

在阵列权利要求的第三方面的示例中,编码的信息指示基准特征的位置。

在阵列权利要求的第三方面的示例中,编码的信息指示载体的标识。

在阵列权利要求的第三方面的示例中,编码的信息指示生物样品的受试者供体。

应当理解,阵列的该第三方面的任何特征可以以任何期望的方式组合在一起。此外,应当理解,阵列的该第三方面的和/或阵列的第一方面的和/或阵列的第二方面的和/或多个方法的特征的任何组合可以一起被使用和/或与本文公开的任何示例组合。

本公开还提供了一种方法,其包括:将生物样品设置在载体上的多个位置处,该生物样品彼此不同以在荧光成像的连续循环中不同地做出响应;以及将基准特征设置在载体上,基准特征包括在荧光成像的连续循环中做出响应的荧光材料,其中基准特征被构造成产生编码信息的图像数据。

应当理解,该方法的任何特征可以以任何期望的方式组合在一起。此外,应当理解,该方法的和/或阵列的第三方面的和/或阵列的第二方面的和/或阵列的第一方面的和/或多个方法的特征的任何组合可以一起被使用和/或与本文公开的任何示例组合。

本公开还提供了另一种方法,其包括:访问对设置在载体上的位置处的生物样品的连续图像编码的图像数据,生物样品彼此不同以在荧光成像的连续循环中不同地做出响应,图像数据进一步对在载体上的基准特征的图像编码,基准特征具有在荧光成像的连续循环中做出响应的荧光材料,其中基准特征被构造成产生编码信息的图像数据;通过参考基准特征针对连续图像配准载体上的位置;以及处理所配准的连续图像以将从连续图像导出的数据转换成序列数据。

应当理解,该方法的任何特征可以以任何期望的方式组合在一起。此外,应当理解,该方法的和/或阵列的第三方面的和/或阵列的第二方面的和/或阵列的第一方面的和/或其他方法的特征的任何组合可以一起被使用和/或与本文公开的任何示例组合。

仍然进一步地,应当理解,任何阵列和/或任何方法的任何特征可以以任何期望的方式组合在一起和/或可以与本文公开的任何示例组合。

附图简述

当参考附图阅读下面的详细描述时,当前技术的这些和其他特征和方面将变得更好理解,在所有附图中,相似的符号表示相似的部件,其中:

图1是采用当前技术的各方面的例如用于生物样品的图案化阵列成像和图像处理系统的概略图;

图2是可被包括在用于在图1所示的类型的系统中使用的数据分析系统中的功能部件的概略图;

图3是可结合当前技术来使用的类型的示例生物图案化阵列的平面图;

图4是图3的图案化阵列的一部分的放大剖视图;

图5是示出在示例阵列上的位点的另一剖视图;

图6是两个示例位点的放大图,其示出在处理期间在对于位点的图像数据中的像素化;

图7是图案化阵列的示例部分以及在位点区域中和位点区域外部形成的示例基准的剖视图解表示;

图8a-8c是图7的阵列的一部分的剖视部分截面图,其示出沉积在阵列中以形成基准特征的珠或其它结构;

图9是图案化阵列的简化概略图,其示出多个位点区域和以限定图案在位点区域中形成的基准;

图10是具有以规则图案布局的基准的示例图案化阵列的图解视图;

图11是具有以非规则布局设置的基准的示例图案化阵列的另一图解表示;

图12a-12g是允许改进的定位和处理的基准的示例布局的图解表示;

图13是具有非闭合形状或配置的示例基准的详细视图;

图14是具有非闭合形状以改进图案化阵列的制造和处理的示例基准的另一详细视图;

图15是具有一系列非闭合形状的示例基准的另一详细视图;

图16是具有由点状结构形成的非闭合形状的示例基准的详细视图;

图17是具有非闭合形状并形成可以传送数据的段(例如类似条形码的编码)的示例基准的另一详细视图;

图18是具有非同心的两个非闭合形状的示例基准的详细视图;

图19a-19d是包括例如通过方向偏移而不同心的两个形状和编码信息的示例基准的详细视图;

图20a是具有数据编码特征的示例基准的详细视图;

图20b是以提供特征的鲁棒解码的方式成像的基准的视图;

图20c是用于对在图20a和20b的示例中的数据进行编码的示例特征的图解表示;

图21a是具有至少部分地反射在成像或其它处理期间接收的辐射的基准的示例图案化阵列的一部分的剖视透视图;

图21b是图21a所示的类型的示例基准的剖视部分横截面图;

图22a是可以包括对数据编码或协助成像或处理的特征(例如布拉格光栅)的反射基准的示例的剖视部分横截面图;

图22b是可以包括对数据编码或协助成像或处理的特征(例如布拉格光栅)的反射基准的示例的剖视图;以及

图23是示出用于使用在本公开中阐述的基准的示例逻辑的流程图。

详细描述

本公开提供了用于处理、成像和图像数据分析的方法和系统,其对于定位图案化阵列的特征是有用的。系统和方法可用于配准这种图案化阵列的多个图像。与当前技术相关的是图案化阵列,其处理产生分析阵列的图像数据(或在阵列上的位点的任何其他形式的检测输出),例如用于生物样品的分析的图像数据。这种阵列可以包含要在本公开的方法和系统非常适合于的亚微米分辨率范围处解析的特征的重复图案。尽管本文阐述的系统和方法在分析特征的规则图案时提供了优势,但是将理解,它们也可以用于特征的随机分布。如下所讨论的,在许多应用中,待成像和分析的材料将位于一个或更多个载体(例如玻璃材料)的一个或更多个表面上。珠或其它定位设备可用于在位点处结合或锚固(或以其它方式定位)待处理的材料的片段(例如,杂交、与额外的分子组合、成像和分析)。在一些情况下,待处理的分子可以随机或伪随机地位于载体上。基准标记或简单地“基准”位于相对于位点的已知位置处,例如在一个或更多个载体上或中,以协助定位系统中的载体(例如,用于成像),并用于在随后的图像数据中定位位点。

可以注意到,如在本公开中使用的,“图案化阵列”可以包括微阵列、纳米阵列、被形成为图案化流动池的测序阵列等。这种设备包括分析物可能位于其处的用于处理和分析的位点。实际上,这些位点可以以重复图案、非重复图案或在随机布置中设置在载体的一个或更多个表面上,载体本身可以包括如下所讨论的流动池。为了简单起见,所有这样的设备都被称为并且应该被理解为被包括在术语“图案化阵列”或有时简单地为“阵列”中。

本公开的系统和方法对于在位点的图案或布局中的特征的特性的变化是鲁棒的。这些变化可以表现为针对在不同图像中的一个或更多个特征检测到的不同信号属性。例如,在核酸测序技术中,核酸的阵列遭受生化处理和成像的几个循环。在一些示例中,每个循环可以导致四个不同标记中的一个根据在该循环中生化地被处理的核苷酸碱基在每个特征处被检测到。在这样的示例中,在给定的循环处获得多个(例如四个)不同的图像,并且每个特征将在图像中被检测到。在一个示例中,由于在一个图像中检测到的特征可能在其他图像中看起来很暗,因此对于给定循环的图像的对准呈现出独特的挑战。此外,测序包括多个循环,以及在来自连续循环的图像数据中表示的特征的对准用于基于在相应位点处检测到的标记的序列来确定在每个位点处的核苷酸的序列。在一个循环内的图像的不合适的配准或跨越不同循环的图像的不合适的配准可能不利地影响序列分析。例如,采用规则图案的方法可能在图像分析期间易受走离误差(walk-offerror)的影响。在一个示例中,当两个覆盖图像由图案的一个或更多个重复单元偏移时,走离误差出现,使得图案看起来重叠,但是在不同图案中相邻的特征在覆盖时不合适地相关联。

如本文所使用的,术语“基准”意欲意指在对象(例如具有待分析的分子材料的位点的载体或基底)中或上以及在对象的图像数据中的可区分的参考点。参考点可以是例如标记、对象、形状、边缘、区域、不规则性、通道、坑、柱或者如在许多情况下的在已知位置处的可以用作参考的特征的集合。可以在对象的图像中或者在从检测对象(例如使对象成像)导出的另一个数据集中检测到参考点。参考点可以由在对象的平面中的x和/或y坐标(例如图案化阵列的一个或更多个表面)指定。可选地或此外,参考点可以由与x-y平面正交的z坐标指定,例如由对象和检测器的相对位置限定。可以相对于对象的或图像的一个或更多个其他特征或从对象导出的其他数据集的一个或多个其他特征来指定参考点的一个或多个坐标。

下面将关于基准、它们的形式、它们的配置以及它们在分析的系统和方法中的使用来描述几个示例。应当理解,还提供了用于以自动或半自动方式执行所述方法的系统,并且这样的系统将包括处理器;数据存储设备;和用于图像分析的程序,该程序包括用于执行下面讨论的一种或更多种方法的指令。因此,本文阐述的方法可以在例如具有为了那个目的所需的部件和算法的计算机上被执行。

本文阐述的方法和系统对分析可以在多种对象上或对象中的多种材料(例如生物样品和分子)中的任何一种是有用的。有用的对象是带有附着的分析物的固体载体或固相表面。当与具有在x-y平面中的重复图案的特征的对象(例如具有附着的分子集合的图案化阵列)一起使用时,所述方法和系统可以提供优势,所述分子是例如dna、rna、来自病毒的生物材料、蛋白质、抗体、碳水化合物、小分子(例如候选药物)、生物活性分子或任何其他感兴趣分析物。

对带有具有生物分子(例如核酸和多肽)的特征的阵列开发了越来越多的应用。这种图案化阵列可以包括dna或rna探针。这些对在植物、动物(例如人类)和其他有机体中存在的核苷酸序列是特定的。例如,在一些应用中,单独的dna或rna探针可以附着在阵列的单独特征或位点处。例如来自已知或未知的人或有机体的测试样品可以暴露于阵列,使得靶核酸(例如基因片段、mrna或其扩增子)与在阵列中的相应特征或位点处的互补探针杂交。探针可以在靶特定过程中被标记(例如,由于在靶核酸上存在的标记或者由于在特征处以杂交形式存在的探针或靶的酶标记)。然后可以例如通过在特征上扫描特定频率的光以识别在样品中存在哪些靶核酸来检查阵列。

生物图案化阵列可用于基因测序和类似应用。一般来说,基因测序包括确定在一段靶核酸(例如dna或rna的片段)中的核苷酸的顺序。相对较短的序列可在每个特征处被测序,并且所得到的序列信息可在各种生物信息学方法中用于将序列片段逻辑地拟合在一起,以便可靠地确定广泛得多的长度的遗传物质的序列,片段从该遗传物质可得到。用于表征片段的自动、基于计算机的算法已经被发展,并且最近在基因组作图、基因及其功能的识别等中被更多地使用。图案化阵列对表征基因组内容是有用的,因为大量变体存在,且这取代对单独探针和靶执行许多实验的备选方案。图案化阵列可以是用于以实际方式执行这种调查研究的合乎需要的形式。

如上面所提到的,在本领域中已知的各种分析物阵列(在本公开中也被称为“图案化阵列”或简单地为“阵列”)中的任何一种都可以在本文阐述的方法或系统中使用。这种阵列包含特征,每个特征具有单独的探针或探针的群体。在后一种情况下,在每个特征处的探针的群体可以是同质的,其具有单一种类的探针。例如,在核酸阵列的情况下,每个特征可以具有多个核酸分子,每个核酸分子具有共同的序列。然而,在其他一些示例中,在阵列的每个特征处的群体可能是异质的。类似地,蛋白质阵列可以有具有单一蛋白质或蛋白质群体的特征,蛋白质可以具有或可以没有相同的氨基酸序列。探针可以例如经由探针到表面的共价键合或者经由探针与表面的非共价相互作用来附着到阵列的表面。在一些示例中,例如核酸分子的探针可以经由凝胶层附着到表面上,如例如在美国专利号9,012,022和美国专利申请公布号2011/0059865a1中所述的,每个专利通过引用被全部并入本文。

示例阵列没有限制地包括从illumina公司可得到的beadchiptm阵列或者其他阵列,其包括探针附着到存在于表面上的珠(例如在表面上的阱中的珠)上的阵列,例如在美国专利号6,266,459、6,355,431、6,770,441、6,859,570或7,622,294或pct公布号wo00/63437中描述的阵列,每个专利通过引用被全部并入本文。可使用的在市场上可买到的图案化阵列的另外的示例包括例如从affymetrix(thermofisherscientific的一部分)可获得的图案化阵列或者根据有时被称为vlsiptm(超大规模固定聚合物合成)技术的技术合成的其他图案化阵列从vlsip技术可获得。点阵式图案化阵列也可用在根据本公开的一些示例的方法或系统中。示例点阵式图案化阵列是从amershambiosciences可得到的codelinktm阵列。可能有用的另一个图案化阵列是使用喷墨打印方法例如从agilenttechnologies可得到的sureprinttm技术制造的阵列。

其他有用的阵列包括在核酸测序应用中使用的那些。例如,具有基因组片段的扩增子(常常被称为簇)的阵列是有用的,例如在bentley等人的nature456:53-59(2008)、wo04/018497、wo91/06678、wo07/123744、美国专利号7,329,492、7,211,414、7,315,019、7,405,281或7,057,026或美国专利申请公布号2008/0108082a1中描述的那些,每一个专利通过引用被全部并入本文。对核酸测序有用的另一类型的阵列是从乳剂pcr技术产生的颗粒的阵列。在dressman等人的proc.natl.acad.sci.usa100:8817-8822(2003)、wo05/010145、美国专利申请公布号2005/0130173或美国专利申请公布号2005/0064460中描述了示例,每个专利通过引用被全部并入本文。

用于核酸测序的阵列常常具有核酸特征的随机空间图案。例如,从illumina公司可得到的hiseqtm或miseqtm测序平台利用包括载体或阵列的流动池,核酸通过随机繁殖(randomseeding)、后面是桥扩增而设置在载体或阵列上。然而,图案化阵列也可用于核酸测序或其他分析应用。在美国专利号9,512,422、8,895,249和9,012,022中以及在美国专利申请公布号2013/0116153a1中阐述了示例图案化阵列、用于它们的制造的方法及用于它们的使用的方法,每个专利通过引用被全部并入本文。这种图案化阵列的特征可用于捕获单个核酸模板分子,以例如经由桥扩增来使同质集落的后续形成繁殖。这种图案化阵列对核酸测序应用是有用的。

可以选择例如在阵列上的位点(或者在本文的方法或系统中使用的另一个对象)的特征的尺寸,以适合期望的应用。在一些示例中,阵列的特征可以具有仅容纳单个核酸分子的尺寸。具有在该尺寸范围内的多个特征的表面对构建分子的阵列以用于在单分子分辨率下的检测是有用的。在该尺寸范围中的特征在具有特征(每个特征包含核酸分子的集落)的阵列中也是有用的。因此,阵列的特征可以每个具有不大于约1mm2、不大于约500μm2、不大于约100μm2、不大于约10μm2、不大于约1μm2、不大于约500nm2或不大于约100nm2、不大于约10nm2、不大于约5nm2或不大于约1nm2的面积。可选地或此外,阵列的特征将不小于约1mm2、不小于约500μm2、不小于约100μm2、不小于约10μm2、不小于约1μm2、不小于约500nm2、不小于约100nm2、不小于约10nm2、不小于约5nm2或不小于约1nm2。事实上,特征可具有在选自上面例示的那些尺寸的上限和下限之间的范围中的尺寸。虽然对于表面的特征的几个尺寸范围已经关于核酸和在核酸的规模上被例示,但是将理解,在这些尺寸范围内的特征可以用于不包括核酸的应用。还将理解,特征的尺寸不需要必须被限制到用于核酸应用的规模。

对于包括具有多个特征或位点的对象(例如阵列或载体)的示例,这些特征可以是分立的、在彼此之间以间隔分离。在当前技术中有用的阵列可以具有由至多约100μm、约50μm、约10μm、约5μm、约1μm、约0.5μm或更小的边缘到边缘距离分开的特征。可选地或此外,阵列可以具有由至少约0.5μm、约1μm、约5μm、约10μm、约50μm、约100μm或更大的边缘到边缘距离分开的特征。这些范围可以适用于特征的平均边缘到边缘间隔以及最小或最大间隔。

在一些示例中,阵列的特征不需要是分立的,且相反,相邻特征可以彼此邻接。无论特征是否是分立的,特征的尺寸和/或特征的间距可以变化,使得阵列可以具有期望的密度。例如,规则图案中的平均特征间距可以是至多约100μm、约50μm、约10μm、约5μm、约1μm或约0.5μm或更小。可选地或此外,规则图案中的平均特征间距可以是至少约0.5μm、约1μm、约5μm、约10μm、约50μm或约100μm或更大。这些范围也可适用于规则图案的最大或最小间距。例如,规则图案的最大特征间距可以是至多约100μm、约50μm、约10μm、约5μm、约1μm或约0.5μm或更小;和/或规则图案中的最小特征间距可以是至少约0.5μm、约1μm、约5μm、约10μm、约50μm或约100μm或更大。

阵列中的特征的密度也可以从每单位面积存在的特征的数量方面来被理解。例如,阵列的特征的平均密度可以是至少约1x103个特征/mm2、约1x104个特征/mm2、约1x105个特征/mm2、约1x106个特征/mm2、约1x107个特征/mm2、约1x108个特征/mm2或约1x109个特征/mm2或更高。可选地或此外,阵列的特征的平均密度可以是至多约1x109个特征/mm2、约1x108个特征/mm2、约1x107个特征/mm2、约1x106个特征/mm2、约1x105个特征/mm2、约1x104个特征/mm2或约1x103个特征/mm2或更小。

在图案化示例中的特征可以具有多种图案形状和布局中的任何一种。例如,当在二维平面中(例如在阵列的表面上)观察时,特征可以显现为圆形的、环形的、椭圆形的、矩形的、正方形的、对称的、不对称的、三角形的、多边形的等。特征可以以规则的重复图案(包括例如六边形或直线图案)被布置。可以选择图案以实现期望的包装水平。例如,圆形特征最佳地被包装在六边形布置中。当然,其他包装布置也可以用于圆形特征,反之亦然。

一般来说,图案可以在存在于形成图案的最小几何单元的子集中的特征的数量方面被表征。该子集可以包括例如至少2、3、4、5、6、10或更多个特征。根据特征的尺寸和密度,几何单元可以占据小于约1mm2、约500μm2、约100μm2、约50μm2、约10μm2、约1μm2、约500nm2、约100nm2、约50nm2或约10nm2或更小的面积。可选地或此外,几何单元可以占据大于约10nm2、约50nm2、约100nm2、约500nm2、约1μm2、约10μm2、约50μm2、约100μm2、约500μm2或约1mm2或更大的面积。几何单元中的特征的特性(例如形状、尺寸、间距等)可以选自在本文中关于阵列或图案中的特征更一般地阐述的特征。

具有特征的规则图案的阵列可以关于特征的相对位置被排序,但是关于每个特征的一个或更多个其他特性是随机的。例如,在核酸阵列的情况下,核酸特征可以关于它们的相对位置被排序,但是关于在任何特征处存在的核酸种类的序列的知识是随机的。作为更具体的示例,通过用模板核酸使特征的重复图案繁殖并在每个特征处扩增模板以在特征处形成模板的复制品(例如,经由簇扩增或桥扩增)而形成的核酸阵列将具有核酸特征的规则图案,但是关于核酸序列跨越阵列的分布将是随机的。因此,在阵列上的核酸材料的存在的检测可以产生特征的重复图案,而序列特定检测可以产生跨越阵列的信号的非重复分布。

将理解,本文中对图案、顺序、随机性等的描述不仅涉及在对象上的特征,例如在阵列上的特征,而且涉及在图像数据中的特征或者在被产生时在实际图像中的特征。因此,图案、顺序、随机性等可以以多种格式中的任何一种存在,这些格式用于存储、操纵或传递图像数据,包括但不限于计算机可读介质或计算机部件,例如图形用户接口或其他输出设备。

基准被包括在本公开所设想的阵列上或中,例如在图案化阵列载体或基底的一个或更多个表面上(无论是在阵列中还是在任何随机或其他布局中)以及在位点和分子的图像数据中,以便于识别和定位在阵列上的单独特征,包括分子所位于其处的位点。基准对于配准位点或特征的空间位置是有用的,因为基准为这样的位点或特征的相对位置提供参考点。基准对于其中载体和位点被重复地检测以跟随随时间的过去和在连续处理循环中在单独位点处出现的变化的应用是特别有益的。例如,基准可以允许通过在多个测序循环内获得的连续图像来跟随单独的核酸簇,使得可以准确地确定存在于单独簇处的核酸种类的序列。

现在转到附图并首先参考图1,示出了示例分析系统10,其用于处理图案化阵列(例如用于生物应用)、对图案化阵列进行成像以及从成像导出的数据的分析。在所示的示例中,系统10被设计成将分子(例如核苷酸、寡核苷酸和其他生物活性试剂引入到可以预先制备的样品12中。系统10可以被设计用于合成生物聚合物,例如dna链,或者用于对生物聚合物进行测序。应当注意,当前技术不以任何方式被限制到测序操作、基因表达操作、诊断应用或这些的任何一个,而是可以在它们中的任何一个中用于分析对于在样品的区域中检测到的多个扫描带或区域的所收集的图像数据,如下所述。包含分子或其它可检测特征的阵列的其它基底可以类似地用在所公开的技术和系统中。

然而,在所示的示例中,示例生物聚合物可包括核酸,例如dna、rna或dna或rna的类似物。其他示例生物聚合物可以包括蛋白质(也被称为多肽)、多糖或其类似物。尽管可以使用各种生物聚合物中的任何一种,但是为了清楚起见,将关于核酸的处理来描述在图1所示的示例上下文中用于处理和成像的系统和方法。通常,图1所示的系统将作用于样品12,样品12可以包括反应位点的阵列。在这里再次地,如本文所使用的,术语“阵列”或“图案化阵列”指具有在一个或更多个基底上的不同反应位点的群体的载体,使得不同的反应位点可以根据它们的相对位置而彼此区分开。单个种类的生物聚合物可以附着到每个单独的反应位点。然而,一个种类的生物聚合物的多个复制品可以附着到反应位点。作为整体而采用的阵列可以包括附着在多个不同位点处的多个不同生物聚合物。反应位点可以位于在同一基底上的不同的可寻址位置处。可选地,阵列可以包括单独的基底,例如珠,每个基底形成不同的反应位点。这些位点可以包括附着在阵列中的特定位置处的dna的片段,或者可以是阱,其中靶产物将被合成。在一些应用中,该系统可以被设计用于连续地合成分子(例如基于普通核苷酸的聚合物分子)或对分子测序。

在图1的图解表示中,分析系统10可以包括处理系统14,该处理系统14被设计成处理样品12(例如生物图案化阵列),并生成表示在图案化阵列上的单独位点以及在位点之间的空间的图像数据和在图案化阵列载体中或上提供的基准的表示。根据本公开,数据分析系统16接收图像数据并处理图像数据,以从成像数据中提取有意义的值,如下所述。然后,下游处理/存储系统18可以接收该信息,并在需要时将该信息与成像数据一起存储。下游处理/存储系统16可以进一步分析图像数据或从图像数据导出的数据,例如以诊断生理状况、编译测序列表、分析基因表达等。

处理系统14可以采用用于在处理进行时将各种试剂输送到样品12的生物分子试剂输送系统20(在图1中被显示为核苷酸输送系统)。系统14可以包括多个操作,样品12和样品容器通过这些操作前进。这种前进可以以多种方式(包括例如样品12到不同台的物理移动、或者阵列在其中阵列被移动或光学系统被移动的系统中的装载、或者这两者、或者流体的输送经由阀动来被执行)来实现。可以为循环操作设计一种系统,其中用单个核苷酸或用寡核苷酸促进反应,后面是冲洗、成像和去阻塞,为随后的循环做准备。在实际系统中,样品12被设置在系统中,并且在从测试样品中提取所有有用信息之前的多个连续的循环中对反应、冲洗、成像、去阻塞等执行操作的自动或半自动序列。再次,应该注意,图1所示的过程决不是限制性的,并且当前技术可以对从用于任何应用的任何合适的系统获取的图像数据进行操作。应当注意,虽然在本公开中提到“成像”或“图像数据”,但是在许多实际系统中,这将需要实际的光学成像和数据从电子检测电路(例如,照相机或成像电子电路或芯片)的提取,尽管也可以采用其他检测技术,并且表征感兴趣分子的所得到的检测数据也应当被认为是“图像”或“图像数据”。

在图1所示的示例中,核苷酸输送系统20向样品12提供过程流22。来自阵列或流动池的流出物流24可以例如在核苷酸输送系统20中被重新捕获和再循环。然后,在所示的示例中,阵列或流动池可以在冲洗台26处被冲洗(或者在许多情况下,通过启动适当的阀来冲洗),以去除额外的试剂并净化样品12用于成像。然后将样品12暴露于成像系统28(其可以在同一设备内),在该成像系统中可以生成可以被分析的图像数据,例如,用于确定例如基于模板而逐步构建核苷酸链的序列。在当前设想的示例中,成像系统28可以采用共焦线扫描来产生可以被分析以定位在阵列中的单独位点的逐步像素化的图像数据,并确定最近附着或结合到每个位点的核苷酸的类型。也可以适当地采用其他成像技术,例如其中一个或更多个辐射点沿着样品被扫描的技术或者采用“分步拍摄”成像方法的技术。

如所提到的,系统28的成像部件可以更一般地被认为是“检测装置”,并且能够对表面进行高分辨率成像的任何检测装置可能是有用的。在一些示例中,检测装置将具有足够的分辨率来区分在本文中阐述的密度、间距和/或特征尺寸处的特征。检测装置的示例是被配置成在获得区域图像的同时将对象和检测器保持在静态关系中的检测装置。如所提到的,可以使用扫描装置以及获得连续区域图像的系统(例如,“分步拍摄”检测器)。上面提到的点扫描检测器可以被配置成经由在表面的x-y平面中的光栅运动来扫描在对象的表面上的点(即,小检测区域)。线扫描检测器可以被配置成沿着对象的表面的y维扫描线,其中线的最长尺寸沿着x维出现。将理解,检测设备、对象或两者可以移动以实现扫描检测。在美国专利申请公布号2012/0270305a1、2013/0023422a1和2013/0260372a1以及美国专利号5,528,050、5,719,391、8,158,926和8,241,573中描述了例如在核酸测序应用中有用的检测装置,所有专利通过引用被全部并入本文。

(例如,在成像系统28处)成像之后,然后,样品12可以前进到用于去阻塞的去阻塞台30,在此期间,阻塞分子或保护基团连同标记染料一起与最后添加的核苷酸裂解。作为示例,如果系统14用于测序,则来自成像系统28的图像数据将被存储并转发到数据分析系统,如在参考数字16处所指示的。

分析系统16可以包括通用或专用编程计算机,其提供用户接口和图像数据的自动或半自动分析,以确定四个常见dna核苷酸中的哪一个可能最后被添加在每个样品的阵列中的每个位点处,如下所述。如本领域中的技术人员将认识到的,可以基于对四种常见dna核苷酸中的每一种的独特标记染料的颜色来执行这种分析。该图像数据可以由下游处理/存储系统18进一步分析,该下游处理/存储系统18可以在合适的场合存储从如下所述的图像数据导出的数据以及图像数据本身。再次,测序应用被规定为是一个示例,且其他操作(例如诊断应用、临床应用、基因表达实验等)可以被执行,这些操作将生成由当前技术操作的类似成像数据。

如上面所提到的,在一些实现中,图案化阵列可以保持在固定位置上,并且所指的“台”可以包括如所述作用于图案化阵列的集成子系统(例如,用于引入和与期望的化学物质反应、冲洗、成像、图像数据收集等)。数据分析可以在这里再次与其他处理操作同时被执行,或者可以通过从适当的存储器(在同一系统中或其他地方)访问图像数据或从图像数据导出的数据来进行后处理。在许多应用中,图案化阵列“容器”将包括盒,图案化阵列放置在该盒中,且期望的化学物质通过该盒被循环。在这样的应用中,成像可以通过且经由流动池来完成。流动池可以适当地被定位(例如,在x-y平面中),并如对成像所需的移动(例如,在x、y和z方向上)。当流动池安装在装置中时,期望的化学物质直接到流动池的连接可以被建立。此外,根据设备设计和所使用的成像技术,装入流动池中的图案化阵列可以最初位于x-y平面中,并且在成像期间在该平面中移动,或者成像部件可以在成像期间平行于该平面而移动。一般来说,在这里再次地,“x-y平面”是支撑位点的图案化阵列表面的平面或者平行于此的平面。因此,流动池可以被认为在x-y平面内延伸,其中x方向是流动池的较长方向,以及y方向是较短方向(流动池为矩形)。然而应理解,该定向可以反转。流动池和图案化阵列也可以在z方向上移动,z方向是与x和y方向都正交的方向。这种移动可能对流动池固定到位是有用的,用于建立与流动池的流体连接以及用于成像(例如,将用于使位点成像的光学器件聚焦于精确z深度处)。在一些应用中,为了精确成像,光学器件可以在x方向上移动。

图2示出了示例数据分析系统16及其一些功能部件,因为它们与当前技术相关。如上所提到的,系统16可以包括一个或更多个编程计算机,其中编程被存储在一个或更多个机器可读介质上,其中代码被执行以执行所述过程。在示出的示例中,系统16包括接口32,该接口32被设计成允许系统16与获取图案化阵列的图像数据的一个或更多个成像系统28联网。在适当的情况下,接口可以接收和调节数据。然而,一般来说,成像系统28将输出表示一起形成图案化阵列(或其一部分)的图像的单独图片元素或像素的数字图像数据。在图2中由参考数字34表示的处理器根据由处理代码定义的多个例程来处理接收到的图像数据。处理代码可以存储在各种类型的存储器电路中,如由图2中的参考数字36表示的。如在本公开中使用的,术语“机器可读”意指由机器(例如计算机、处理器或计算机或处理器与检测和信号解释设备或电路(例如计算机存储器和存储器访问部件和电路、与图像或信号解释和处理部件和电路协作的成像或其他检测装置)协作)来可检测和可解释的。

对当前技术有用的计算机和处理器可以包括专用电路和/或通用计算设备,例如作为检测设备的一部分、与用于获得由计算机处理的数据的检测设备联网或者与检测设备分离的处理器。在一些示例中,可以在本文公开的系统16的部件之间直接或经由计算机网络来传输信息(例如图像数据)。局域网(lan)或广域网(wan)可以是公司计算网络,包括对互联网的访问,包括系统16的计算机和计算设备连接到互联网。在一个示例中,lan符合传输控制协议/互联网协议(tcp/ip)行业标准。在一些实例中,信息(例如图像数据)经由输入设备(例如磁盘驱动器、光盘播放器、usb端口等)输入到本文公开的系统16。在一些实例中,通过例如从存储设备(例如磁盘或闪存驱动器)加载信息来接收信息。

如上所提到的,在一些示例中,处理电路可以在获得载体、位点、分子等的一组或更多组图像数据的同时实时或接近实时地处理图像数据。这种实时分析对核酸测序应用是有用的,其中核酸的阵列经受流体和检测操作的重复循环。测序数据的分析可能常常是在计算上密集的,使得当其他数据采集或分析算法正在进行的同时实时或接近实时地或在后台中执行这些方法可能是有益的。可与当前方法一起使用的示例实时分析方法是在用于从illumina公司市场上可购得的miseqtm和hiseqtm测序设备和/或在美国专利申请公布号2012/0020537a1中描述的方法,该专利申请通过引用被全部并入本文。术语“实时”和“接近实时”当与样品的处理及其成像结合来使用时意欲暗示处理至少部分地发生在样品被处理和成像的时间期间。在其他示例中,图像数据可以通过类似的算法获得并存储用于后续分析。这可以允许其他设备(例如强大的处理系统)在与成像被执行的物理位点相同或不同的物理位点处操纵处理任务。这也可以允许重新处理、质量验证等。

根据技术的目前设想的示例,对图像数据执行的处理代码包括被设计成分析图像数据的图像数据分析例程40。图像数据分析可用于确定在图像数据中可见或被编码的单独位点的位置以及其中没有位点是可见的位置(即,其中没有位点,或者其中没有有意义的辐射从现有位点被检测到)。图像数据分析也可用于确定有助于定位这些位点的基准的位置。仍然进一步地,图像数据分析可用于定位在系统中的图案化阵列,用于为了处理或参考目的而提供有用的信息,等等。

如本领域中的技术人员将认识到的,在生物图案化阵列成像设置中,以栅格图案或随机地布局的在图案化阵列中的位置将由于附着到所成像的分子上的荧光染料的存在而看起来比非位点位置更亮。将理解,例如当在被检测的样品中不存在该位点处的探针的靶时,位点不需要看起来比它们的周围区域更亮。单独位点出现的颜色可以是所采用的染料的以及由成像系统28为了成像目的而使用的光的波长的函数。可以根据其他特性(例如它们在图案化阵列中的预期位置)来识别靶未结合到的或否则没有标签的位点。根据标记的设计和功能,任何基准标记可以出现在一个或更多个图像上。

一旦图像数据分析例程40已经定位了图像数据中的单独位点,值分配就可以常常根据或参考所提供的任何基准标记如在参考数字42处所指示的被执行。通常,在42处执行的值分配将基于由在相应位置处的像素表示的图像数据的特性来向每个位点分配数字值。也就是说,例如,值分配例程42可以被设计成识别出在特定位置处检测到特定颜色或波长的光,如在该位置处的一组或一簇像素所指示的。例如,在dna成像应用中,四种常见的核苷酸可以由单独且可区分的颜色(或者更一般地,光的波长或波长范围)表示。然后,每种颜色可以被分配对应于该核苷酸的值。然后,由例程42执行的值分配将把相应的值分配给整个位点,减轻了进一步处理图像数据本身的需要,该图像数据本身将是更大量的(例如,许多像素可能对应于每个位点)并且具有显著更大的数值(即,对每个像素编码的位的大得多的数量)。

然后,编索引分配例程44将使所分配的值的每一个与在图像索引或图中的位置相关联,这再次可以通过参考基准标记的已知或检测到的位置或者参考由这种标记编码的任何数据来进行。如下面更充分描述的,该图将对应于在样品12内的单独位点的已知或所确定的位置。可以在相同或不同的物理设备中提供的数据分析算法46(在图2中被显示为数据拼接46)在需要的场合允许样品12的分子的识别或表征以及允许分子数据的逻辑分析。例如,对于测序,该算法可以允许通过参考发射光谱来表征在每个位点处的分子(即,该位点在图像中是否是可检测的,指示标签或其他机制在由一波长的光激发时产生可检测的信号)。在这些位点处的分子以及在相同位点处检测到的随后的分子然后可以被逻辑地聚集成序列。然后,这些短序列可以由算法46进一步分析,以确定它们在样品供体受试者中可能出现于的可能更长的序列。

可以注意到,如在图2的图示中,可以由设备特定接口组成的操作员(op)接口38可以被提供或者在一些应用中被提供给传统的计算机监视器、键盘、鼠标等,以与由处理器34执行的例程交互作用。当成像数据被处理、分析并且因而得到的值被编索引和处理时,操作员接口38可以用于控制、可视化例程或以其他方式与例程交互作用。

图3示出了示例样品或图案化阵列12。如图3所示,可以提供多个栅格或扫描带48,使得每个栅格或扫描带将包括待成像的多个单独位点。如上所提到的,对于这种图案化阵列的各种各样的布局是可能的,并且当前技术并不意欲限于任何期望的或特定的布局。在逐布扫描的示例中,当成像进行时,样品或图案化阵列12将在被编索引的方向d上移动,使得每个栅格48都可以被成像。有时被称为“粗对准”或“自动定心”基准的初始基准标记(未示出)可以在载体中或上形成,例如以允许正确地定位栅格或扫描带48或者在处理系统16或成像系统28中定位图案化阵列。应当注意,在图3的视图中,没有示出图案化阵列可以位于的周围流动池。

图4是图3的图案化阵列的扫描带48之一的放大图示。如图4所示,根据所采用的成像技术,扫描带48可以在沿着扫描带48逐渐移动的平行扫描线52中由成像系统28扫描。实际上,可以在扫描带48的对应于线52的每一条的区域上扫描点。此外,在许多系统中,图案化阵列将在一个方向上缓慢移动,如由箭头54所指示的,而成像光学器件将保持静止。平行扫描线52然后将由样品的渐近运动产生。尽管在图4中未示出,但是每个扫描带48可以包括被指定为基准标记的区域,这些区域可以类似地被成像并在所得到的图像数据中被识别。

在示出的示例中,图案化阵列的栅格或扫描带48具有宽度56,该宽度56可以比扫描线52的长度58更宽,成像系统28能够在每次通过时生成扫描线52或对扫描线52成像。也就是说,整个宽度56可能不在一次通过中被扫描或成像。这可能归因于由于成像光学器件导致的线长度58的固有限制、与部件(例如用于生成扫描线的反射镜或其它光学部件)的聚焦或移动相关的限制、在数字检测器中的限制等。扫描带48可以在多次通过中被扫描,并且对于每个位点的值可以从如上面提到的图像数据中被提取。

例如,在图4中,扫描带48的总宽度56可以容纳在两个重叠区域60和62中。分别如由参考数字64和66指示的每个区域60和62的宽度将略小于扫描线52的长度58。这将允许例如通过参考边缘或其他特征来检测用于对从图像数据中导出的值进行积分的特征。可以注意到,存在可以在两次通过中成像的公共区域或重叠部分68。

图5稍微更详细地示出了在图4所示的扫描带48中的多个位点70上的扫描线52。如上所提到的,在一些实现中,位点70可以以任何合适的栅格图案或者甚至随机地布局。在所示示例中,位点70以六边形图案布局,尽管可以采用矩形图案和其他图案。参考一个或更多个基准特征(例如栅格的边缘72或图案化阵列的一部分),每个位点70的位置将是已知的。在随机位点位置的情况下,这些位置可以通过被设计成检测所有感兴趣位点的位置的初始成像序列来被定位和映射。

图6表示将基于通过在图案化阵列中的感兴趣区域的渐进扫描而收集的图像数据来生成的类型的示例图像的一部分。实际图像74由大量像素76组成,每个像素76对应于来自成像系统28的数字值。代表图像74的像素数据将对相应于亮像素78和较暗像素80的值编码。实际上,可以采用各种灰度级或者甚至颜色编码,使得可以通过检测在像素之间的对比度来识别单独位点70,如由它们的单独数字值所指示的。

在讨论基准的一些目前设想的形式、类型和用途之前,在这里提供基于所公开的基准技术的用于位点和图像数据的使用、数据编码和解码以及配准的示例算法或处理的简要讨论。可以通过排列(例如定位和覆盖)基准、例如基于来自图像数据的亮像素78的数量确定二维互相关(或拟合的相似性的其他度量)以及确定在基准之间的偏移来执行在连续成像操作的图像数据中可检测到的基准的配准以及因而位点70的配准。偏移可以例如经由迭代过程来确定,由此,下面的操作被重复:其中一个基准相对于另一个基准移动,拟合的相关性的水平的变化(例如,相关性的增加由重叠的基准的亮像素78的数量的增加指示)被确定,并且基准的一个或更多个的所确定的位置在增加拟合的相关性的方向上移动。迭代可以继续进行,直到产生最佳的或否则期望的相关性的偏移被确定为止。可以基于偏移来确定变换,并且可以将变换应用于目标图像中的其余特征。因此,可以通过使用基于在重叠时图像数据中的基准之间确定的偏移的变换而移动在图像数据之间的相对比例和/或定向来确定目标图像中的特征的位置。

可使用多种变换模型的任一种。全局变换是有用的,包括例如线性变换或仿射变换。变换可以包括例如旋转、平移、缩放、剪切等中的一个或更多个。弹性或非刚性变换也可以是有用的,例如以调整在目标检测数据或参考数据中的失真。当使用沿着对象尺寸扫描一条线的检测装置时,失真可产生,其中该线的最长尺寸沿着x维出现。例如,拉伸变形可能沿x维(且有时仅沿x)出现。失真可能对其他检测器出现,包括例如由区域检测器引起的在x和y中的扩展失真。弹性或非刚性变换可用于校正失真,例如在从线扫描仪器获得的图像数据中存在的线性失真或者在从区域检测器获得的图像数据中存在的扩展失真。可选地或此外,校正因子可以应用于参考数据、目标数据和/或变换,以校正由检测装置引入(或预期引入)的失真。对于图案化特征被成像的示例,非线性校正可以根据x位置应用于特征位置。例如,所应用的非线性校正可以是三阶多项式,以应对由用于特征的检测的光学系统引起的失真。

因此,通过分析图像数据以识别和定位基准,参考数据可以包含关于在x-y平面中的基准的位置的信息。可选地或此外,参考数据可以包括关于在z维中的位置或其他基准的位置的信息。在成像数据的情况下,焦点可以通过沿z维的平移来改变。因此,算法可用于基于在参考数据集中的基准与来自目标图像的数据中的基准的比较来确定对象的特征的焦点。

在一些示例中,可以从对象的经验检测中获得参考数据。例如,可以在已知条件下检测对象,并且所得到的数据集用于从同一对象获取的后续数据的配准(尽管在不同的条件下)。可选地,可以凭经验检测模型、标准或模板对象以创建参考数据。该参考数据可用于类似对象的配准。在其他示例中,可以从理论对象(例如随后将被检测的对象的设计、蓝图或制造规范)获得参考数据。

在一些示例中,配准信息可以经由图形用户接口(gui)传递给用户。然而,可以以不一定需要人为干预的自动方式来执行本文所阐述的方法的示例。因此,在一些示例中,配准信息(例如,基准的重叠图像)不被传递给用户,无论是经由gui还是其他格式。

所描述的方法和系统可用于已经服从于多种核酸测序技术中的任一种的核酸的阵列。可适用的技术可以包括那些技术,其中核酸附着在阵列的特征处使得它们的相对位置不变,并且其中阵列通过多个测序循环被重复地检测(例如,使用光学成像)。图像在例如与用于区分开一个核苷酸碱基类型与另一核苷酸碱基类型的不同标记物重合的不同颜色通道中被获得的示例是可适用的。在一些示例中,确定靶核酸的核苷酸序列的过程可以是自动过程。示例可包括从illumina公司可获得的合成测序(“sbs”)技术。

核酸可以通过向特征的阵列提供不同的核苷酸(或寡核苷酸)来被测序,以便在每个特征处产生不同的信号,每个信号对应于已经添加到特征的特定种类的核苷酸(或寡核苷酸)。例如,在上面提到的其中使用了对应于四种不同种类的核苷酸(或寡核苷酸)的四种不同的标记物的情况下,可以获取单独的图像,其中每个图像捕获在四种可能的颜色(或信号类型)当中的单一颜色(或其他信号类型)。在这个示例中,对于四个不同图像中的每一个,信号颜色是不同的,从而产生对应于在核酸中的位置处存在的四个可能的核苷酸的四个彩色图像的循环。这种方法还可以包括向分子的阵列提供额外的标记核苷酸(或寡核苷酸),从而产生彩色图像的多个循环。下面将更详细地阐述产生来自多个循环的图像和常常每循环多个图像的一些示例测序技术。

应当注意,在采用所公开的基准标记技术时,可以使用多种不同的成像技术、光波长和处理技术。例如,一些系统可以使用四种不同的波长或波长范围。这些将取决于用于在载体上的感兴趣分子的标签或标记的激发和发射光谱。例如,这样的波长可以包括大约532nm、大约630nm、大约660nm和大约700nm。如本领域中的技术人员将认识到的,染料测序可包括“标签化(tagmentation)”或扩增(例如,经由减少的循环扩增、桥扩增、克隆扩增或所谓的合成测序(sbs)),且用于位点(和感兴趣分子)的成像的波长将适合于所使用的处理。例如,在一些技术中,双色测序化学过程可以允许在核苷酸之间的区别(例如,两种颜色中的一种、没有颜色或者两种颜色)。在后一种技术中,用于成像的光源可以采用具有两种波长(例如大约532nm和大约660nm)的激光器。可以选择感测电路以允许在用于成像的这种波长下的检测,并且它的分辨率或像素密度将允许足够数量的像素在图像数据中具有可检测的值,用于在该分辨率或密度下的位点70或在载体上的位点70的检测。

关于检测方案,一些示例可以利用比以检测作为目标的分析物的数量更少的检测部分。例如,为了检测四种分析物的掺入(例如,在测序反应期间),分析物中的每一个可以由四个激发/发射滤波器中的一个区别地标记和检测(例如,荧光测序)。可选地,也可以利用方法和系统,其中当检测和区分多种不同的分析物时,使用具有相似检测特性的一种或多种染料。因此,所利用的检测部分的数量少于被检测的分析物的数量,分析物也可以用于减少确定不同分析物的存在所需的成像事件的数量。更少类型的检测部分的使用可以提供简化区分不同类型的分析物所需的检测设备的优点。替代地,可以基于分析物的差别性处理来实现区别,导致分析物在不同时间点的可以单独地被检测到的活化、抑制、添加、去除、破坏、猝灭或增强。在美国专利申请公布号2013/0079232a1中描述了利用比以检测为目标的分析物数量少的检测部分的示例系统和方法,该专利申请通过引用被全部并入本文。

测序示例可以利用焦磷酸测序技术。焦磷酸测序检测到无机焦磷酸盐(ppi)的释放,因为核苷酸被掺入新生链中(ronaghi等人的(1996)analyticalbiochemistry242(1),84-9;ronaghi,m.的(2001)genomeres.11(1),3-11;ronaghi等人的(1998)science281(5375),363;美国专利号6,210,891;美国专利号6,258,568和美国专利号6,274,320,这些专利的公开通过引用被全部并入本文)。在焦磷酸测序中,可以通过由atp硫酸化酶转换成三磷酸腺苷(atp)来检测所释放的ppi,并且可以经由荧光素酶产生的质子来检测所生成的atp的水平。待测序的核酸可以附着到阵列中的特征的重复图案,并且阵列可以被成像以捕获由于在阵列的特征处掺入核苷酸而产生的化学发光信号。在用核苷酸类型(例如a、t、c或g)处理阵列之后,可以获得图像。关于在阵列中的哪些特征被检测到,在每一种核苷酸类型的添加之后获得的图像将不同。图像中的这些差异反映在阵列上的特征的不同序列内容。然而,每一个特征的相对位置可以在图像中保持不变。可使用在本文阐述的系统和方法来分析图像。例如,可以用如在本文中对基于可逆终止子的测序方法获得的图像例示的相同的方式来操纵在用每一种不同的核苷酸类型处理阵列之后获得的图像。

如上面所提到的,一些示例涉及通过结扎技术进行测序。此类技术利用dna连接酶来掺入寡核苷酸,并且所掺入的寡核苷酸可以接着被识别。寡核苷酸可以具有与寡核苷酸杂交到的在序列中的核苷酸的标识关联的不同的标记物。可以使用具有靶核酸所附着到的特征的重复图案的阵列,并且可以在用所标记的测序试剂处理阵列之后获得图像。每一个图像将示出已掺入期望类型的标记物的核酸特征。由于每一个特征的不同序列内容,不同的特征将在不同的图像中存在或缺乏,但特征的相对位置在图像中将保持不变。从基于结扎的测序方法获得的图像可被储存、处理和分析,如在本文阐述的。在美国专利号6,969,488、6,172,218和6,306,597中描述了通过可与本文所述的方法和系统一起被利用的结扎系统和方法进行测序的示例,这些专利通过引用被全部并入本文。

在下面讨论示例基准形式、放置等之后,将更多地陈述关于用于形成和利用基准的示例逻辑。然而,如由上面讨论的测序示例所例示的,本公开的方法可以包括:(a)提供具有在x-y平面中的特征的重复图案和基准的对象;(b)使用检测装置来获得对象的目标图像,其中目标图像包括特征的重复图案和基准;(c)将来自目标图像的数据提供给计算机,其中计算机具有参考数据,其中参考数据包括对于所成像的基准的x-y坐标;(d)在计算机上执行算法,以基于与所成像的基准的比较来确定对于在目标图像中的特征的位置;以及(e)重复操作(b)、(c)和(d),其中算法基于检测到的基准来确定对于特征(例如位点)的位置。

在测序示例中,(在上述方法中)特征的不同序列内容由从不同标记物发射的不同波长识别,并在检测装置的不同通道中被检测到。

也如测序示例所例示的,所处理的图像数据将包括由图像像素限定的暗区域和亮区域。例如,这可以是例如当在一个波长中检测到特征且其他区域在该波长处不响应或不产生信号时的情况。在测序示例中,在不同波长中获得的图像将显示对随后被使用的辐射的波长做出响应的特征的不同子集或组。

如下文进一步讨论的,图案化阵列的多个图像在处理期间在不同的波长处被制作,并且在不同波长处做出响应的特征可以例如通过使用基准作为参考点相对于彼此而被检测、配准、编索引并且被表征。例如,在来自多个通道的图像中,一旦对于在测序方法中检测到的四个不同标记物获得的四个图像相对于彼此被配置,则该四个图像可以组合以形成合成图像。实际上,实际图像可能不被产生,但是图像数据或者图像数据的一部分或者从图像数据导出的信息(例如位点表征)可以随后与在测序方法的其他循环处获取的图像进行比较。在这些其它循环处获取的图像数据能够并且可能包括来自单独通道和位点的数据,使得将合成图像数据与单个通道进行比较。可选地,可以将来自一个循环的合成图像数据与来自另一个循环的合成图像数据进行比较。在一些示例中,这些比较包括可以参考一个或更多个基准的配准方法。因此,合成图像数据可以被配准到单通道图像或其他合成图像数据。

此外,用于利用基准、用于编索引和用于表征在图案化阵列的位点处的分子的算法将允许确定位点的位置,包括例如使用检测装置(例如光学成像系统)来对位点和基准成像、将来自所得到的图像的数据提供给确定包括对于基准的x-y坐标的参考数据的计算机,以及在计算机上执行算法以参考基准位置从图像数据确定对于位点的位置。如上所讨论的,一般来说,将制作多个图像,导致多组图像数据(例如,对于测序的每个循环并且在多个波长处),每组图像数据通过参考基准位置而被单独地配准。

在这里再次地,在测序示例中,在每个位点处检测到的光的颜色或波长(或其他信号特性)的序列可以用于确定在该位点处存在的核酸种类的核苷酸序列。在许多情况下,图像数据或核酸种类将用于表征跨越多个图像数据文件的相应特征,以确定在位点处的相应特征的性质,例如从图像数据的序列推断出的核酸序列(或者更一般地,针对位点检测的信号)。

如下所讨论的,基准可包括至少部分地位于图案化阵列的布置有位点的区域中的参考标记或特征,尽管它们也可包括一个或更多个粗对准标记或特征。这种标记可用于将检测设备与图案化阵列粗略地对准。例如,在检测器是光学扫描设备的示例中,图案化阵列可以包含用于将成像光学器件与图案化阵列的位置粗略地对准的一个或更多个粗对准标记。在这种情况下,粗对准标记可以定位在图案化阵列的近侧边缘附近,该近侧边缘在用于阵列的扫描的初始点处或附近。当阵列在多个扫描带中被扫描时,粗对准标记是有用的。在这种情况下,基准可以沿着垂直于扫描方向的轴而不同(例如,当扫描沿着y轴出现时,标记可以沿着x轴而不同)。

在一些示例中,核酸阵列可以存在于基底上,该基底具有在基底的近侧边缘上的条带的图案。光学扫描仪可用于在多个扫描带中对阵列进行成像。条带用作粗对准标记,由此,扫描仪基于条带的图案的识别和成像光学器件(和/或阵列基底)的移动而相对于每个扫描带被定向,直到成像光学器件对准期望的扫描带为止。阵列的每个扫描带将包括一个或更多个基准,其然后在配准图像用于分析时在本文所阐述的方法中被用作为微调。以这种方式,检测系统可以使用在扫描带内、当中或之间的粗对准标记和基准来定位阵列上的特征(例如位点)。

如上所例示的,在本文阐述的方法或系统中使用的检测装置可以包括沿着阵列的y维扫描的扫描检测器,其中扫描检测器扫描阵列的平行扫描带。该阵列还可以包括区分扫描带沿x维的相对位置的粗对准标记。当被使用时,粗对准标记可以与检测装置协作,例如以确定扫描带中至少一个的位置。可选地,可以基于为扫描带确定的位置来调整检测装置和/或阵列的相对位置。在一些示例中,扫描带的位置的确定可以由处理器或计算机(例如将执行配准或特征识别的计算机)通过算法来执行。因此,该系统可以起作用来在计算机上执行算法,以确定在图像数据中的特征的位置以及基于基准来表征在每个位点处的分子。

关于图案化阵列和它们被布置于其中的流动池的示例实现,可以如在美国专利号9,512,422中所阐述的制备具有填充凝胶的阱的图案的流动池,每个阱由dna集落占据,该专利通过引入被全部并入本文。简要地,可以使用纳米压印光刻术来制造纳米阱基底,以产生具有约400nm的直径和约300nm的深度的阱的六边形阵列。阵列的间距可以在大约700nm的数量级。聚合物(例如,聚(n-(5-叠氮基乙酰胺基戊烷基)丙烯酰胺-共-丙烯酰胺)或“pazam”)可以涂覆在基底上,并如在美国专利号9,512,422中所述的通过抛光被去除,留下填充凝胶的阱的阵列。然后,可以用如在美国专利号9,012,022中描述的引物来移植图案化聚合物基底,该专利通过引用被全部并入本文。然后可以用phixdna来使阱繁殖,且簇如在美国专利号8,895,249中描述的生长,该专利通过引用被全部并入本文。流动池可以上从illumina公司在市场上可买到的测序系统上被测序。

此外,关于对这种系统的分析,可以使用对illumina测序器在市场上可买到的rta协议来分析图像数据。可以如下文所讨论的例如在位点的扫描带中或部分地在位点的扫描带内形成和设置基准。暗(非信号产生区域或像素)和亮(信号产生区域或像素)可以分别被分配0和255的强度等级或者在这些之间的任何期望的其他等级。指示基准的存在的数据可以在可能的x-y偏移处是互相关的,并移位以最大化相关性。例如,可以将一个区域拟合到二维高斯,以确定使互相关最大化的子像素x-y移位。这个过程可以在图像的基准所位于的不同区域中重复。在每个区域中确定的子像素x-y偏移可用于确定描述在所设计的阵列中的特征如何出现在图像数据上的仿射变换。

图7至22示出了可结合前述技术使用的示例基准形式、配置和布局。图7示出了图案化阵列(在这种情况下是角落82)的一部分。在该示例中,粗对准或自动定心基准50在角落82附近形成,并且可以作为示例帮助正确地定位扫描带48。另一基准84被示为位于其中多个位点70所位于的扫描带48内。在这里再次地,位点70可以形成为附着和定位在测序过程或其它过程中被成像和表征的感兴趣分子。基准84的内部区域86被示为包括在插入的图像中的位点70,而外部区域88包括其他位点70。基准84本身可以是“总是开启(alwayson)”的类型,意味着通过在不同波长处成像的所有阶段,信号由基准84返回。在示出的示例中,基准84可以包括珠90或其他特征,其设置在图案化阵列的载体上或中以形成期望的形状,例如圆形、闭合形状、开放形状等,如下所讨论的。

在示例中,“总是开启”类型的基准可以由如图8a-8c所示特别位于载体中的珠构成。如图8a所示,阱或凹坑92在图案化阵列12的载体或基底中形成。珠94或其它分子载体可以设置在这些阱92中。在使用期间,如由参考数字96所指示的感兴趣分子锚固到珠94上,例如用于分析、测序、表征等。额外的阱98在较大的结构(例如将形成基准的珠90)的基底或载体中形成。可以注意到,为了配置这种图案化阵列12,形成较大和较小的阱98、92并处理用于附着珠90、94的载体可能合乎需要,其中较大的珠90在较小的珠94被设置到它们的阱92中之前被引入到阱98中。珠90将太大而不能变得嵌在较小的阱92中,且因此位于如由较大的阱98限定的期望基准配置中。在实践中,阱98可以组合以形成沟槽,珠90嵌在该沟槽中。在任一情况下,阱或沟槽可以通过任何合适的工艺(例如离子蚀刻或纳米压印光刻术)形成。作为示例,在将分析物引入到阵列内之前,约0.5μm至约10μm直径的微球体可以在沟槽中自组装。在一些情况下,使用阱的一维阵列而不是沟槽来增强由球体对基准形状的完全填充并避免通过流体力移除球体可能是合乎需要的。此外,任何合适的材料可用于珠或球体,例如聚苯乙烯或二氧化硅或其组合,其可通过填充沟槽或阱而组装成各种图案,如所述。例如胶质球体的材料可能对刚性基底(例如硅或玻璃)是有用的。在自动组装期间,可以通过后退接触线(例如,通过使空气流过表面)或通过流冲洗来移除不进入阱或沟槽的球体。

在图8b和8c所示的其他示例中,珠90可以位于载体上,如在图8a的示例中,但是感兴趣材料96(例如生物分子)可以位于不使用珠或类似载体的位置上。在图8b的示例中,在这里再次形成阱92,并且材料96设置在这些阱中。在其他示例中,材料96可以设置在没有这种阱92的载体的顶表面上。在图8c的示例中,珠90可以在期望的位置上或者随机地位于载体的表面上。在使用中,这样的基准将再次出现在图像数据中,并且一旦位于数据中就可以通过成像或检测的连续循环用作定位辅助(也就是说,尽管最初不在已知位置上,但是它们的位置将被检测到且其后用于参考)。

此外,虽然在前面的讨论中已经提到了球体或珠,但是形成“总是开启”基准的元件不一定是球形的。可以使用其它形状,例如立方体、块和非球形。此外,基准形状不需要是环状的,而是可以是任何期望的形状,例如矩形或十字形。至于尺寸,在这里再次可以使用例如从大约5μm到大约100μm的任何期望尺寸。在这样的元件之间的间距可以是均匀的或非均匀的。

这种基准在使用中允许信号在成像的所有阶段处被返回。例如,珠90或设置在珠上的涂层可以展示吸收光谱和发射光谱,其允许它们由用于位点珠的成像的不同波长激发,使得不管激发辐射波长如何,信号都从较大的珠90返回。例如,在图8a-8c的图像中,激发辐射由箭头100示出,而返回信号102、102’从感兴趣分子96和基准(例如珠90)发出。由于不同波长的辐射100在成像的连续操作期间被使用,则分子96中的一些将根据成像操作期间使用的标签而返回信号102,而基准珠90将在所有成像操作处返回信号102’,实现用于编索引和分子表征的位点的定位而不考虑激发波长。

一般来说,这种“总是开启”基准可以由自发荧光微球体构成。在这种情况下,在没有来自阵列或图案的信号的情况下,基准将是可观察到的,对于该阵列或图案的基准被配准。

这种基准且实际上在本讨论中公开的任何基准可以布局在本身可以提供有用的信息并便于数据的处理的许多期望的图案和关系中的任何一个中。例如,图9示出了设置在图案化阵列载体上的位点的扫描带内的交替位置上的基准。在这个示例中,位点104或者如所示的位点的扫描带104设置在图案化阵列12的载体上。基准设置在位点或扫描带104的每行106中的交替位置处。如该示例中所示,基准108设置在扫描带104的对中,与设置在扫描带104的相邻对内的其他位置处的基准110交替。这种布置可以便于基准的定位,例如其中基准被配置,如在上面讨论的“总是开启”基准的情况中。虽然在图9中示出了两个交替的位置,但是应该认识到,可以利用其他数量的位置,包括可以借助于它们在扫描带内的位置、它们相对于其他基准的位置等而被定位和与载体上的其他位置区分开的基准。

在图10中示出了根据当前技术的基准的另一示例有用布局。在此示例中,基准以规则的重复图案设置。一般来说,这种图案可以被认为是镶嵌图案,其可以重复或可以不重复,或者可以在期望的尺寸、位置、定向等上重复,或者以重复的方式重复,但是其中一些重复具有不同的尺寸、位置、定向等。在图10所示的示例中,图案化阵列12具有在表面中形成的一系列基准112,位点或扫描带可设置在该表面中(为了清楚起见,在图像中未示出)。在图10所示的示例中,基准112以可以形成规则六边形或如所示的扁平六边形114的六边形图案布局。也可以采用任何其它有用的重复图案。在所示的示例中,在左侧的基准112开始于距左边缘的期望距离116,而接下来的基准112开始于距同一边缘的不同距离118处。类似地,基准112距顶边缘的第一次出现在距边缘的距离120处,而最底部基准112位于距底边缘的距离122处。基准112可以被定位在离最右侧边缘一段距离124处。一般来说,基准间距离可以如由参考数字126和128所指示的来被选择,以提供期望的图案以及图案相对于已知边缘位置的位置和定向。图案也可以特别参照不同类型的基准(例如上面对粗略定位讨论的角基准)来被定位。这种布局以及例如相对于已知位置(例如边缘)的在布局上的变化可以便于确定基准的位置,并防止或减少在定位基准和图像数据时的误差的可能性。应当注意,术语“六边形”可以更一般地被理解为除了规则形状以外,包括简单地“交错的”或以其他方式从规则直线图案移置的布局。

应当注意,可以选择在阵列中使用的基准的数量,以增强在成像和分析阵列的位点时的可靠性和鲁棒性。例如,这里讨论的布局可以与少至三个基准一起被使用,尽管由于在至少一个基准经历在成像或识别中的某种异常(例如,由于气泡、离焦区域等)的情况下至少三个基准将被可靠地检测到的可能性,更大的数量允许鲁棒性。可以例如通过使用这里讨论的非直线布置(例如六边形)来提高基准计数和测序准确度。将基准布局成离中心点是等距的可能也是有用的,因为非线性失真是径向的并且这种布置在所有基准上赋予相同的失真。关于所使用的基准的数量,如果最小值为3是期望的,例如,4的使用可以允许避免对1的异常,而6的使用可以例如允许避免对3的异常。

这里讨论的布局也可以解决对在图案化流动池和基准中的偏斜的挑战。例如,用于确定用于位置数据的校正的仿射变换的软件和例程预期基准在已知位置上。在流动池内在扫描的长度上的偏斜可导致基准从预期区域朝向场的边缘移动,这可能由于大的外推和非线性失真而引起不准确。通过在整个图案化区域上放置基准并基于在视场中最居中的基准切换所使用的基准,可以获得对大偏斜的鲁棒性。

此外,对每个基准的形式(例如,多个相邻或嵌套形状)及其布局描述的示例有可能通过更准确地定位基准来提高测序准度,导致在簇或位点位置上的较低定位误差、改进的强度提取以及在测序应用中的更准确的碱基识别。

仍然进一步地,在“瞄准拍摄”成像系统中,成像区域趋向于是更正方形的,且光学失真趋向于是径向的。由于这样的原因,传统的基准布局可能不太理想,因为在距图像中心不同距离处的基准可能具有不同量的光学失真。更适合于瞄准拍摄系统的设计可以是例如如参照图10所述的六边形布局。

如上所提到的,根据流动池和测序仪器的偏斜,基准可能不出现在预期位置处。这在寻找基准时对处理例程提出了挑战。如也提到的,如果它们被发现,那么若显著的外推被完成或者基准形状受到非线性光学失真的干扰,则仿射变换可能是不准确的。在这种情况下,六边形布局可以与其中“中心”基准位于在基准的六边形内的中心或内部位置上的区域一起使用。如果处理系统能够确定流动池的偏斜(例如,从自动定心基准),则它可以在基于该六边形或修改的六边形布局而使用的特定基准(例如,在中心区域中的附加基准)之间切换。

对于基准的另一种可能的布局在图11中示出。如在该示例布局中所示,可以提供基准130的非重复布置(在这里再次地,为了清楚起见,在图中没有示出位点或扫描带)。在该示例中,阵列12具有多个基准130,这些基准130位于载体上或中并且相对于彼此位于不同的距离处,以提供离彼此以及离已知特征(例如载体边缘)的位置。作为示例,右上的基准位于距在右上角中会合的边缘的距离134和136处。右下的基准位于距在右下角中会合的边缘的距离138和140处。这些基准彼此间隔开一段距离142。在不同基准130之间可以使用其他基准间距离144。然后,每个基准130可以位于距已知特征(包括其他基准130)一段距离处。在该示例中,区域132表示周期性底层阵列,通过使用大基准130,每个特征的位置可以被配准到该底层阵列。基准130相对于这些已知特征以及相对于彼此的距离和方向可以被编目并用于基准在图像数据中的定位、基准相对于位点的定位、位点相对于基准的编索引等。布局还可以允许相对于位于图像数据中的其他基准来定位基准中的一个或更多个。还应该注意,在一些实现中,基准可以位于规则图案中,其中一些基准相对于图案位于不重复的位置上。也就是说,并非所有基准都可以位于规则图案中,或者并非所有基准都可以位于非重复布局中。

图12a-12g示出了可以允许改进的检测和定位的基准的示例布局。在一些系统中,可以通过使用这种布局来实现测序仪器的一些误差模式的准确度和减轻。例如,在线扫描系统中,可以做出从矩形布局到具有在图像区域上交错的基准的布局的改变。在采用用于支撑流动池的载物台的系统中,例如,如果载物台在成像时不正确扫描,则在规则矩形布局中的基准可能被丢失。例如,如图12a所示,对于阵列12的图像区域,在矩形图案p中的两个基准112可能被载物台的问题不利地影响,使得用于位点位置校正的仿射变换的发展变得困难、不准确或不可能。然而,在利用交错布局p’的示例中,如图12b所示,单个基准112可能不准确或不正确地被定位,但是在图像区域中的其他三个基准112更有可能保持准确地被检测和定位,以在仿射变换计算中使用。

在另一示例中,如图12c所示,在图像区域中的基准计数可以增加,以在基准112是不可用的情况下(例如由于气泡的存在,或者在图像和因而产生的数据的焦点外区域)提供增强的鲁棒性。这对于例如线扫描系统可能是有用的。在图12c的示例中,布局p”包括在图像区域中的矩形布局中的6个基准112。在这种情况下,在保持计算仿射变换的能力的同时,由于任何原因,多达3个基准可能是不可用的。类似地,结合图12b和12c的方法,图12d示出了另一布局p”’,其中6个基准112存在于图像区域中,但是交错的以提供进一步的改进。

在分步拍摄系统(有时被称为“瞄准拍摄”)上,成像区域往往是更正方形的(具有相等的边或不是很细长的矩形),且光学失真往往是径向的。对于这样的系统,采用提供在距图像中心均匀距离处的基准112的布局可能是有用的,如图12e所示。在该示例中,在阵列12的图像区域中(例如在规则六边形图案114’中)使用多于4个(例如6个)基准112。这种布置提供在图像区域中的增加数量的基准的鲁棒性(在多达3个基准由于任何原因而是不可用的情况下)以及距区域中心的均匀距离。

此外,根据流动池和测序仪器的偏斜,基准可能不出现在预期位置上。这对分析过程提出了挑战(例如,在定位基准时)。如果它们被发现,那么若显著的外推被完成或者若基准形状受到非线性光学失真的干扰,则基于基准位置的仿射变换可能是不准确的。图12f和12g示出了可以在这种情况下改善定位和处理的基准布局114”的示例。这里的布局114”基于具有在六边形的中心处的基准112的六边形图案(尽管部分六边形可以被提供,或者布局可以被认为相对于每隔一行是矩形的,存在其中基准112位于在矩形行中的相邻基准112之间的中点处的插入行)。在流动池在仪器中居中的情况下,布局114”可以如图12f所示的使用,即,通过在图像区域s中选择5个基准112,基准112之一通常在该区域的中心中。在仪器中的流动池的偏斜(特别大的偏斜)的情况下,该偏斜可以通过例如在流动池的入口侧和出口侧附近的自动定心基准来确定,系统可以使计算基于基准(例如在图像区域s’中的4个基准112)的减小的集合,如图12g所示。在任一情况下,通过图12f和图12g的布局114”来实现在不同偏斜情况下使用哪些基准112之间切换的能力。

可以注意到,图12b、12d、12e、12f和12g的布局的相似性在于,基准特征112设置在相对于彼此偏移的行中。在这些偏移行中,第一行的基准112不沿着垂直于第一行和第二行的线与在相邻行中的基准对准。所得到的图案可以是三角形的、六边形的或甚至不规则的。

关于上面讨论的布局,可以注意到,在一些测序系统中,载体和阵列(例如流动池)的制造、位点的成像以及图像数据的处理可以基于与在图像数据中执行的倾斜和拼接(例如,对于相邻图像区域)相匹配的周期性。可以投入相当大的努力来确保某些特征(例如具有载体的插入层的位点的通路(lane)的对准。通过使用上面讨论的布局之一,可以考虑更紧密的图案,其中足够的基准密度允许总是具有足够的基准用于位置误差的正确定位和校正而没有周期性顾虑,或者至少比当前的布局鲁棒得多,即使一些基准由于任何原因而是不可靠的。此外,在现有技术中,对于所成像的图块,如果不知道在哪里预期基准,仅通过图像分析来定位它们可能是非常耗时的。在基准从一个图块到另一图块在大致相同的位置上的布局中(假设流动池被很好地设计、组装和对准),这不太会成为问题。然而,对于布局的某些方法,例如可能包括不同的周期性或者基准被连续地分布以允许在流动池的表面之间的对准上的减小的公差的这里描述的那些方法,相对于测序开始之前完成的全局配准,可以为流动池上的所有基准预先计算位置(例如,通过定位自动定心基准十字)。然后,尽管所成像的图块可能从一个图块到另一图块产生基准的不同位置(例如,由于流动池的不良对准的层),但是基准的预期位置可以是事先已知的,并且每个图块的图像处理可以基于对于每个图块的基准的预期坐标的列表。这起粗对准过程的作用,在粗对准过程中,实际基准配准算法提供每个图块的更精细对准。对于基准真正处于随机分布中的情况,它们的位置的先验知识可能是不可能的,并且配准类似于随机图案化的流动池的配准(例如,执行测序和成像的几个循环,使图像互相关以提取在每个图块中的基准的位置,并且对于随后的循环将所确定的坐标提供给每个图块)。

除了前述信号响应特性和布局之外,基准还可以以允许优于传统配置的明显优点的方式形成。此外,应该注意,通过目前的讨论,这些技术的这些方面并不是相互排斥的。也就是说,下面讨论的形式和配置可以与彼此一起、与“总是开启”技术一起、在期望的有用布局中等被使用。

对于潜在地有用的基准的第一配置在图13中示出。在该示例中,阵列12具有开放或非闭合形状的基准146。基准146可以具有期望的特性或特征,例如厚度或宽度148、部分非闭合段150和至少一个开口152。用于基准146的形状可以是圆形,如在该示例中所示,或者可以是任何其他期望的形状(例如椭圆形、箱形等)。一般来说,“非闭合”配置意味着该形状具有在180°上延伸以至少开始包围可被认为是“内部”区域的区域的至少一部分。许多这样的形状可以被设想为与不开始包围内部区域的开放形状或者不包括开口152的完全闭合的形状区分开。

对于潜在地有用的基准的另一示例配置在图14中示出。在这种情况下,基准154具有形成部分屏障并部分地包围内部区域的段。在这个意义上,图14的基准154可以被认为是上面讨论的非闭合形状的特殊情况。然而,应该注意,这正是部分地包围内部区域的段的组合。在图14的情况下,提供了四个这样的段,包括段156、158、160和162。这些段156、158、160和162彼此由开口164、166、168和170分开。在这种情况下,段156、158、160和162虽然分离但形成圆形基准,尽管可以使用任何期望的形状。除了非闭合形状的益处之外,在图14的基准154中的开口164、166、168和170还可以允许在图案化阵列的制造中的改进。在一些制造技术(例如压印光刻术)中,气泡可能在压印的材料中(例如在基准中或附近)形成。对于基准的非闭合布置的使用可以允许这种气泡的逸出(由图中的虚线圆圈172指示)或者全部这种气泡的形成的避免。

图15示出了包括一系列非闭合形状的基准174的另一示例。这些形状与前面一样是圆形的,尽管可以使用任何期望的形状。每个形状包括由开口180分开的段178。在图15的示例中,这些形状是同心圆,尽管这些形状不需要是严格地同心的,而是可以如下所讨论的从彼此偏移。此外,设置在每个形状中的开口180可以足以允许携带气泡和流体的成分通过,如上所讨论的。应当认识到,段178的厚度或宽度、在每种形状的段178之间的间隔以及在相邻形状之间的间隔可以被选择,以允许基准174更容易地被识别、定位,或者通过如下面更充分讨论的配置来传达信息。

图16示出了对于包括一系列的点182的基准181的另一示例。在这里再次地,这也可以被认为是非闭合形状的特殊情况,并且可以便于制造,利用阵列12的较小表面积或提供其他益处,同时允许携带气泡或流体的成分通过。

如所提到的,可以设想,基准的一些示例可以对在许多不同方面中有用的信息编码或提供信息。这种数据的编码通过在图像数据中明显的基准的参数或特征的选择来提供(例如,通过在图像数据中的亮区和暗区之间的区别)。在这里再次地,这种基准可以具有“总是开启”类型,使得在所产生的所有图像中传达这种信息。已经针对上述基准讨论了可用于数据编码的一些参数(例如,宽度或厚度、尺寸和形状、在多个形状之间的距离等)。其它参数可从下面的附图的基准中是明显的。图17示出了在形状上非闭合的基准183,其包括由开口186分开的段184。在这里再次地,可以调整每个段184的厚度或宽度以增强检测或提供信息。可以使用多于一个这样的形状,并且这些形状可以是同心的或非同心的。在图17的示例中,段184相邻于彼此而设置,并且围绕基准的至少一部分在长度或广度上不同,如由参考数字188所指示的。段184的广度和在段之间的间隔可以被选择来根据标准的和很好地理解的编码技术来提供信息。由基准183提供的信息可以包括任何有用的数据,例如基准的识别、基准位置的识别、在哪里定位其他基准的指示、阵列的识别、为阵列提供生物样品的人或受试者的识别、制造商、制造批次或任何其他有用的信息。

图18示出了对于基准185的另一示例,基准185在此包括彼此不同心的两个形状。应当记住,这种配置或这种配置的变型可以与例如用于“总是开启”基准、非闭合或闭合形状、提供数据的段、允许流体流的段和开口等的所公开的任何其他技术一起使用。此外,可以使用任何期望的形状,其中所示的圆形仅是一种可能性。在图18的示例中,这些形状是不同心的。外部形状190是至少部分地围绕内部形状或环192的环。外部形状190包括彼此通过开口分开的段194,而内部形状192也包括通过开口分开的段196。外部形状190具有从内部形状192的中心200偏移的中心198。目前设想,再次地,非闭合形状可以允许流体通过,同时借助于表征形状的物理参数、它们与彼此的关系以及在这种情况下在它们的中心198、200之间的偏移来呈现对信息编码的潜力。例如,偏移可以便于基准185的识别、它在阵列12上的位置的确定、其他基准或特征的位置的确定等。

图19a-19d示出了对于基准226的另一示例,该基准226可以便于这种类型的信息传送,例如特征的定位。在该示例中,基准226包括较大特征228和较小特征230。在这种情况下,较小特征230位于较大特征228内,并且在这个示例中,两者都是环状结构。在本示例中,这些特征或形状是相邻的并且是嵌套的。如前面一样,这种结构可以是闭合形状、非闭合形状、“总是开启”结构,或者可以利用本文公开的任何其它配置。在图19a的示例中,内部空间232至少部分地被较大特征228包围,并且具有中心234。较小特征230的中心236从中心234偏移一段距离238。此外,穿过两个中心234、236的投影限定相对于已知定向的角度240,该已知定向在所示示例中是垂直虚线。这种基准226可对传送信息(例如它们在阵列12中的位置、它们相对于(阵列或一个或更多个扫描带的)边缘的位置、其它特征(包括其它基准)的位置、这种特征的方向(例如,借助于投影的角度)、借助于偏移的距离的到特征(包括基准)的距离等是有用的。

图19b的示例是与图19a所示的类似的相邻和嵌套的布置,但是在这种情况下,较大特征228和较小特征230重叠。这种重叠可以便于基准226’的定位、偏移的定向或方向的确定等。在这种情况下,重叠区域242与偏移角对准,偏移量244由特征228、230的相对尺寸限定。

在图19c所示的基准226”的示例中,类似的相邻和嵌套的布置包括较大特征228和较小特征230。在这种情况下,较大特征228的内部空间232仅包括较小特征230的一部分,其延伸到较大特征228之外以形成重叠区域246。在这里再次提供偏移248,其可以帮助识别特征228、230,识别位置,或者提供关于阵列12中的其他特征的位置和到其的距离的信息。应当注意,图19c所示的类型的布置可以包括不同地设计尺寸的特征,或者这些特征可以具有相同的尺寸,但是具有偏移中心234、236并且在期望的角定向处。

在图19d的示例中,基准226”’包括第一较大特征228和较小特征230,其在这种情况下都是圆形的(尽管也可以再次使用其他形状)。两个特征228、230彼此相邻并从彼此偏移,但是在这个示例中不重叠。如在前面的例子中,每个特征228、230可以具有中心234和236,其可以用作对于方向的参考。也就是说,如在前面的示例中,穿过两个中心23、236的投影限定相对于已知定向的角度240,已知定向在所示的示例中是垂直虚线。这种基准226”’可能对传送信息(例如它们在阵列12中的位置、它们相对于(阵列或一个或更多个扫描带的)边缘的位置、其它特征(包括基准)的位置、这种特征的方向、到特征(包括基准)的距离等是有用的。可以注意到,除了在“嵌套”布置中,尽管参考“较大”和“较小”特征,但在这些特征不是“嵌套”的情况下,它们可以是相同的尺寸。

前述基准布置可具有许多优点。例如,偏移或移位的环或特征可以定义矢量,该矢量的方向连接环或特征的中心并对基底的期望定向(或任何其他有用的方向)编码。以这种方式对基底的定向编码可以简化流动池的制造,因为图像配准可以被制造为耐偏斜的,即使仅使1-2个基准成像。因此,在组装期间在流动池的不同层的对准上以及在流动池与测序器的对准上的制造公差可以大大放宽。在这些示例中,两个环都保持旋转不变(即,核心将与图像重叠,而不管基底的定向如何)。于是基准的“中心”可以指外环的中心。如所提到的,通过找出在外环和内环的中心之间的矢量角来计算方向。

此外,直接对信息编码的基准的示例可以具有多种形式和配置,例如对图20a-20c的示例所示的那些。所示的基准250、250’可包括较大特征252和较小特征254。在所示的示例中,在这些特征252、254中的每一个内,信息可以以新的方式被编码。例如,在所示的方法中提供了点的三个冗余集合,包括由较小特征254中的点258的阵列构成的第一集合256,其中在较小特征254之外的较大特征252中有点260和262的相似的冗余集合。在实践中,可以采用少至一个(单个)编码阵列,并且用于编码的技术可以采取任何期望的形式,包括图像中的点、区域、相对亮和暗区域等。在所有情况下,这种编码可以是机器可读的。

这种直接编码可以采用数字二进制技术,其中区域基于它们是否返回信号(例如,在图像数据中看起来是亮的)或不返回信号(例如,在图像数据中看起来是暗的)来对数据编码。其中信号可以被预期的暗区域可以代表“0”,而产生信号的区域可以代表“1”。当然,可以基于在阵列内的位置、定向、尺寸等来确定值或编码。本领域中的技术人员将容易认识到,这种阵列可以被定义为对数字、字母数字值、十六进制值等编码。所编码的基本数据可以代表任何期望的信息,例如基准的识别、阵列的识别、在阵列中的扫描带或位置的识别、其他特征的位置或方向的识别、受试者或个人(例如,谁提供了用于测试的样品)的识别、制造商的标识或制造细节、日期、机构等。

目前设想这种类型的冗余特征的使用可以增强识别的鲁棒性。例如,如图20b所示,在成像期间,图20b的点256、260、262的三个集合可能未能确切地对应于彼此。也就是说,尽管相同地被形成或预期,但是由于各种原因,一些点可能在不需要时出现,或者可能不在需要的地方出现。用于读取、解释和比较所解码的数据的算法可以在这种情况下基于冗余来提供识别和数据输出。

图20c示出了用于在这种类型的基准中直接对信息编码的点258的阵列的示例。阵列(或集合)256包括以已知图案264布置的点258。点258可以填充有珠或对在成像中利用的辐射的波长做出响应或没有做出响应的其它材料。在一些情况下,利用具有与在成像中使用的不同波长的辐射重叠的吸收和发射光谱的材料可能是合乎需要的,使得阵列/集合256“总是开启”。在所示的示例中,点266被填充以返回信号,而可以被填充的在其他位置处的点268没有被填充或者被填充有选择性地不返回信号的材料。然后,所得到的阵列将返回直接对期望数据编码的集合信号。在这里再次地,所编码的数据也可以是机器可读的。

实际上,这样的示例可以通过期望的方案来呈现编码。例如,每个“1”由产生信号的大微阱表示,或者在图像数据中看起来是“白色的”。每个“0”由微阱的缺乏表示。在图20c所示的示例中,数字四百八十七(487)可以被表示为10位二进制数,且然后被编码到10个可能的微阱中(点264)。白色微阱(例如,点258)可以被物理地图案化(并聚集),而黑色阱(例如,以虚线轮廓示出的点268)可以不被物理地图案化(它们可以保持与间隙区域齐平)。以这种方式,只有1可以被聚集,且因此在测序器上被看到。在所示的示例中,二进制数的布局是从左到右、从上到下。二进制编码可能是有用的。例如,对于每个值没有歧义。它要么是完全暗的,要么有某个荧光区域。在所示的示例中,六边形布局用于将这些位紧密地包装在一起,因此它们占用较少的空间,因为它们对可按顺序排列的表面积没有贡献,所以它们的总面积应该最小化。此外,二进制编码不一定需要复杂的图像识别。一旦基准被定位并且它的定向被确定,二进制代码的每个阱就可以通过覆盖在代码中的10个可能的微阱中的每个微阱的位置值的预先计算的表来被定位(在这个示例中)。通过前面描述的方向信息,没有图像识别的这个简单位置成为可能。

最终,位的任何类型的布置、形状或数量都是可能的。在示出的示例中,位被选择为实质上大于单独的阱,使得它们不被误认为位点,并且具有足够的多克隆性,使得每个位的某个部分将在每个颜色通道中点亮(例如,“总是开启”)。在这里可以注意到,多克隆性的使用可能有一个或更多个缺点。例如,微阱中的每一个将仅被部分地填充(约25%的占用率),且因此,误差可能被引入到所解码的值内,因为微阱中的一个或更多个在任何一个通道中可能有太小的占用率而不能正确地记录为“1”。或者,应该为零的区域可能被污染(或者具有可能截留荧光团的表面粗糙度),并且在成像期间仍然返回信号,尽管没有微阱。这些通常被称为位翻转误差。

可以为这样的挑战提供许多解决方案。例如,可以将所有颜色通道的强度相加以创建合成图像。在这种情况下,由于多克隆性导致的位翻转的概率可能大大降低(但并没有完全消除:仍然存在这样的机会,由于聚集误差或制造缺陷,微阱可能不足够聚集以在任何颜色通道中看起来足够亮)。

在另一个解决方案中,可以例如通过冗余引入误差校正。例如,在所示的示例中,物理二进制代码在基准中相同地重复三次(它们可以以相对于彼此和基准的任何已知的定向放置在任何地方)。在所示的示例中,为了模拟误差,阱以10%的概率被随机地遮蔽(该误差率的实际值将指示重复代码多少次以捕获误差可能是合乎需要的)。这可能被预期是一种常见的误差。在此示例中,阱也随机地被填充在背景中(25%的阱随机地被选择为亮的,这模拟在4-通道测序系统中的单一颜色通道)。然后,对每个环使用两个核心来找到基准的两个中心和定向。这模拟在成像后人们可如何找到基准的中心和定向。接下来,知道所有物理位相对于基准的位置,可以对图像数据像素采样以确定位的值。一般来说,可以对聚集在每个物理位的中心周围的预定数量的像素进行采样(由所采样的像素覆盖的区域应该与位的区域相匹配,以从每个位获得尽可能多的信号)。如果对于每个物理位的像素的总强度超过预定阈值,则它可能被记录为“1”,否则被记录为“0”。一旦所有三个物理位都被识别为1或0,则这三个代码中的每一个都被聚集成它的相应二进制数。

在所示的示例中,误差导致对每个代码解码三个不同的值:391、487和230。最后,在所有三个数字之间执行的二进制或(or)操作可以实现最初编码的数字的恢复。这种三重冗余误差校正方案可以纠正多达两个位翻转误差,其中应该是1的位被记录为0(即,应该是亮的阱不够亮,且被误认为是暗的)。为了校正多于二,四倍或更高的冗余可以被添加。

通过基准的特征进行的数据编码可以用于例如将多个图像拼接在一起或者标记流动池的不同区域,这些区域用不同的条件(例如不同的化学物质、阱的不同布局等)被图案化。为了对位置信息编码,例如物理地图案化的10位二进制代码可以用于每个基准,如上所讨论的。在流动池上,每个微阱可以在测序器的所有通道中被聚集并发荧光。该二进制代码可以在基准中或附近重复多次(在所示情况下,3次),以便于误差校正。

用于为位点和其他特征的粗对准和配准创建基准的另外的技术可能依赖于反射辐射而不是从激发产生的发射。这些基准中的一些也可以对信息编码。图21a和21b示出了这种基准的第一示例。在图21a的示例中,基准270设置在阵列12的表面上。基准270可以例如通过印刷、雕刻、气相沉积或通过任何其他合适的技术沉积在载体上。在这种情况下,基准270可以由材料(例如金属、半导体或以例如在成像期间的处理期间利用的波长发射光的其它至少部分地反射的材料)制成。入射光272可以源自成像系统18(图1)的光学器件,并且反射光274可以被检测和利用,例如用于使成像系统28中的阵列12对准,用于提供如上所讨论的编码数据,或者用于任何其他有用的目的。此外,在该示例中且如图21b所示,基准270被固定或设置在阵列12的表面280上而不是在载体的主体276内。

在例如图22a和22b所示的其它示例中,包括反射或折射特征的基准270可以在表面280上或者在阵列载体的主体276内或部分地在主体276内形成。例如,在图22a和22b所示的示例中,基准270包括本身可以定义可以被解释的数据或信息的槽或脊282或284,例如布拉格光栅。这种光栅可以对入射光272的特定波长(或等效地对频率)做出响应,并返回由系统的光学器件检测并解释的反射或折射光274。

如在前面的公开中所讨论的,基准的新的配准、形成、布局和使用可以使图案化阵列的处理变得更加有效、高效或有意义。在图23中示出了用于利用基准的示例逻辑。由参考数字300指示的逻辑可以以参考粗对准或自动定心基准开始,如由参考302所指示。如上所讨论,可以通过获得待表征的样品或分子库、将它们放置或附着在图案化阵列中的位点处、增强分子的可检测性(例如,通过扩增)、制备用于处理的流动池以及将流动池安装在成像系统中例如用于测序来预先制备图案化阵列。然后,块302可能需要一个或更多个基准的检测,这些基准有助于相对于成像系统以及用于逐渐获得图像数据的光学器件和平移台正确定位和定向流动池和阵列。自动定心基准可包括上面讨论的任何形式和布局,但常常包括位于位点的区域或位点的扫描带之外的基准。

如在图23中的304处所指示的,在图案化阵列的安装、对准和定位期间参考自动定心基准。此后,如由块306所指示的,可以执行测序和成像。对于许多应用,这个程序可以包括可以循环地重复的多个操作,其例如用于从包括dna(或其他分子)的多个碱基的模板或分析物获得序列信息。例如,在图23的示例性逻辑中,该过程通过引入用于在所填充的位点处结合并标记分子的化学物质来继续进行,如在308处所指示的,导致这些分子如在310处所指示的被结合和标记,以便便于检测将在该过程的当前循环处返回信号的单独分子。在312处,可以冲洗流动池以去除剩余的化学物质。然后在314处,如上所讨论的,可以在期望的波长下对这些位点成像。成像可以产生立即(或随后)被处理和存储的图像数据,如在316处所指示的。这种处理可以包括检测借助于标签分子从位点返回的信号、对位点编索引、维护或丢弃有用或无用的任何数据等。在318处,确定另一波长的辐射是否应该用于成像的另一循环,并且如在320处所指示的,如果需要图像的一个或更多个其他波长,则该过程返回到314用于这种成像。一旦成像的这个循环完成,就可以在322处确定是否所有期望的成像和测序都已经完成。如果没有,则可以实现去阻塞和冲洗过程324,并引入新的化学物质以通过返回到308来完成测序和成像的另一循环。一旦所有期望的循环完成,系统就可以继续进行到数据处理。

存储在一个或更多个存储器电路上的图像数据的处理可以在本地或远程地被执行。此外,通过访问所存储的图像数据或从图像数据导出的数据(例如,在连续成像期间返回信号的位点的带索引列表),数据的处理可以由同一系统或者由另一系统完成。该处理可以通过识别和定位可以从图像数据中检测到的任何基准来继续进行,如在326处所指示的。为此目的,如在步骤328处所指示的,可以访问图像数据或从图像数据导出的数据,这可以再次在本地或远程地被执行。这些基准可以通过上面讨论的任何技术例如根据它们的配置、形式、布局以及它们可以编码的任何信息来被识别、定位和解释。此时,可以由基准编码的一些信息可以被解码,如由参考数字330处指示的。这样的信息可以包括例如基准的位置、基准的识别、其他特征(包括其他基准)的位置的确定、阵列的识别或任何阵列相关信息等。

然后在332处,图像数据(包括指示返回信号的位点、返回(例如,在什么波长或频率处)的特定信号及它们的位置的数据)可以被编索引和处理。在这里再次地,这可能需要访问图像数据或从图像数据导出的数据,如由334处指示的。该访问在图中被表示为重复的,因为332可以与326同时或者在某个稍后的时间或位置处被执行。在332处执行的过程可以包括图像或从图像数据检测到的位点或基准的配准以及基准信息的进一步解码等。

然后在338处,可以表征在循环成像的特定阶段处返回或不返回信号的位点处的分子(例如通过参考所返回的信号)。这还可以包括访问图像数据或从图像数据导出的数据,如在340处所指示的。此外,该过程可以包括在单独位点处逻辑地聚集分子的序列,以及聚集来自不同位点的分子的段以获得更长的序列。在这里再次地,该过程可以包括在342处对来自基准的另外的信息(例如受试者(例如,样品的捐赠者)的识别、该过程被执行的日期或机构的识别等)解码。

应该认识到,前述概念的所有组合和下面更详细讨论的额外概念(假设这样概念不相互不一致)被设想为本文公开的创造性主题的部分。特别是,出现在本公开的结尾处的所要求保护的主题的所有组合被设想为本文公开的创造性主题的一部分。还应当认识到,也可以出现在通过引用并入的任何公开中的本文中明确使用的术语应当符合与在本文中公开的特定概念最一致的含义。

本说明书中所引用的全部公布物、专利以及专利申请特此通过引用被全部并入。

在整个本公开(包括权利要求)中使用的术语“实质上”和“大约”用于描述并考虑到例如由于在处理中的变化而引起的小波动。例如,它们可以指小于或等于±5%、例如小于或等于±2%、例如小于或等于±1%、例如小于或等于±0.5%、例如小于或等于±0.2%、例如小于或等于±0.1%、例如小于或等于±0.05%。此外,应当理解,本文提供的范围包括规定范围和在规定范围内的任何值或子范围。例如,由从约5μm至约100μm表示的范围应被解释为不仅包括约5μm至约100μm的明确列举的限制,而且还包括单独的值,例如约6μm、75μm、90.5μm等和例如从大约15μm到大约85μm的子范围等。

在本公开(包括权利要求)中,所有的过渡短语例如“包括”、“包含”、“携带”、“具有”、“含有”、“涉及”、“保持”、“包括(composedof)”和类似的短语将被理解为是开放的,即,意指包括但不限于。只有过渡短语“由...组成(consistingof)”和“基本上由...组成”应当分别是封闭的或半封闭的过渡短语,如在美国专利局专利审查程序手册的§2111.03中阐述的。

虽然已经详细描述了几个示例,但是应该理解,可以修改所公开的示例。因此,前述描述应被考虑为非限制性的。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1