用于核酸扩增的样品制备的制作方法

文档序号:14186353阅读:291来源:国知局

发明背景

全基因组测序(wgs)是一种在个性化医疗中应用的方法,该个性化医疗用于鉴定特定患者的疾病风险,以及他们对某些疗法(例如药物疗法)的潜在响应性。在临床背景下,诸如复杂的样品制备工作流程或样品制备和/或测序外包等各种因素使样品混淆变得可能且使得难以检测。临床应用(例如诊断学、预后学和/或治疗学)中基于wgs的方法的一个基本条件是使用的序列信息明确地源自特定患者,即确保样品的身份是必不可少的,以允许准确地将临床细节分配至序列数据。需要在临床应用中使用的wgs数据中确认样品身份的方法。还需要在扩增前不需要纯化dna的样品制备方法。本文阐述的本发明的实施方案满足这些需求并且也提供其他优点。

发明概述

本文提供的是用于靶向扩增dna和样品鉴定的方法和组合物。例如,本文阐述的方法特别可用于样品的验证和质量控制以及确认在将序列数据输送至内科医师或至患者之前wgs序列数据与患者样品适当匹配。然而,应当理解,本文阐述的方法可以用于期望快速靶向扩增的其它合适的应用。

根据上文,在一个实施方案中,本文呈现的是从生物样品获得核酸序列信息的方法,其包括:(a)提供包含不同靶核酸的生物样品;(b)将所述生物样品与多个不同的探针组接触以与所述不同靶核酸形成杂交复合物;(c)自所述生物样品扩增所述核酸以产生扩增子;其中在接触步骤(b)之前,没有从所述生物样品纯化所述核酸;和(d)获得扩增样品的多个部分的核酸序列信息。

在某些方面,在步骤(c)中的所述扩增之前,没有从所述生物样品纯化所述核酸。在某些方面,步骤(c)中的所述扩增包括使用至少两种对样品基因组的一部分具有特异性的扩增引物的聚合酶链式反应。在某些方面,步骤(c)中的所述扩增包括延伸和连接两种探针以形成扩增模板。

在某些方面,当与延伸酶和核苷酸接触时,进一步将包含溶液相杂交复合物的上清液与固体支持物接触以形成固定化的杂交复合物。在某些方面,固体支持物包含珠。在某些方面,固体支持物包含过滤板。

在某些方面,所述不同靶核酸各自从3’至5’包含:连续的第一、第二和第三靶域,并且每个探针组包含:(i)第一探针,其从5’至3’包含:第一引发序列和基本上与第一靶域互补的序列;和(ii)第二探针,其从5’至3’包含:基本上与第三靶域互补的序列和第二引发序列。

在某些方面,所述方法包括,在步骤(c)之前,从所述生物样品收集包含溶液相杂交复合物的上清液的步骤。在某些方面,获得核酸序列信息包括大规模平行测序。在某些方面,获得核酸序列信息包括在核酸阵列表面上检测所述扩增子。

在某些方面,所述多个探针组包含至少10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,60,70,80,90,或至少100个不同的探针组。在某些方面,所述多个探针组包含配置为与多态性区域选择性杂交的多个探针,所述多态性区域提供所述样品来源的身份的信息。在某些方面,所述多个探针组包含配置为与包含癌症相关多态性的区域选择性杂交的多个探针。在某些方面,样品是人类样品。在某些方面,样品包含肿瘤组织。在某些方面,样品包含正常组织。在某些方面,样品是血液样品。在某些方面,样品包含多孔固体表面上干燥的血液。在某些方面,多孔固体表面包含滤纸。

本文还呈现的是从ffpe样品获得核酸序列信息的方法,其包括:(a)提供包埋在保存的组织内的包含不同靶核酸的ffpe样品;(b)将所述ffpe样品与多个不同的探针组接触以与所述不同靶核酸形成杂交复合物;(c)自所述ffpe样品扩增所述核酸以产生扩增子;其中在接触步骤(b)之前,没有从所述ffpe样品纯化所述核酸;和(d)获得多个所述扩增子的核酸序列信息。在特定实施方案中,在步骤(c)中的所述扩增之前,没有从所述ffpe样品纯化所述核酸。

在某些方面,步骤(c)中的所述扩增包括使用至少两种对样品基因组的一部分具有特异性的扩增引物的聚合酶链式反应。在某些方面,步骤(c)中的所述扩增包括延伸和连接两种探针以形成扩增模板。在某些方面,当与延伸酶和核苷酸接触时,进一步将包含溶液相杂交复合物的上清液与固体支持物接触以形成固定化的杂交复合物。

在某些方面,固体支持物包含珠。在某些方面,固体支持物包含过滤板。在某些方面,所述不同靶核酸各自从3’至5’包含:连续的第一、第二和第三靶域,并且每个探针组包含:(i)第一探针,其从5’至3’包含:第一引发序列和基本上与第一靶域互补的序列;和(ii)第二探针,其从5’至3’包含:基本上与第三靶域互补的序列和第二引发序列。在某些方面,在步骤(c)之前,从所述ffpe样品收集包含溶液相杂交复合物的上清液的步骤。

在某些方面,获得核酸序列信息包括大规模平行测序。在某些方面,获得核酸序列信息包括检测核酸阵列表面上的扩增子。

在某些方面,所述多个探针组包含至少10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,60,70,80,90,或至少100个不同的探针组。在某些方面,所述多个探针组包含配置为与多态性区域选择性杂交的多个探针,所述多态性区域提供所述样品来源的身份的信息。在某些方面,所述多个探针组包含配置为与包含癌症相关多态性的区域选择性杂交的多个探针。在某些方面,样品是人类样品。在某些方面,样品包含肿瘤组织。

本文还呈现的是从ffpe样品扩增核酸的方法,其包括:(a)提供包埋在保存的组织内的包含核酸的ffpe样品,所述核酸从3’至5’具有:连续的第一、第二和第三靶域;(b)将所述ffpe样品与多个不同的探针组接触以与不同靶核酸形成杂交复合物,其中每个探针组包含:(i)第一探针,其从5’至3’包含:第一引发序列和基本上与所述第一靶域互补的序列;和(ii)第二探针,其从5’至3’包含:基本上与所述第三靶域互补的序列和第二引发序列;(c)将所述杂交复合物与延伸酶和核苷酸接触,其中所述第一探针沿着在(b)中形成的杂交复合物的所述第二靶域延伸;(d)连接延伸的第一探针与所述第二探针,以形成扩增模板;和(e)用与所述第一引发序列和所述第二引发序列互补的第一和第二引物扩增所述扩增模板以产生扩增子,以及获得多个所述扩增子的核酸序列信息。

在某些方面,所述方法包括,在步骤(c)之前,从所述ffpe样品收集包含溶液相杂交复合物的上清液的步骤。在某些方面,当与延伸酶和核苷酸接触时,进一步将包含溶液相杂交复合物的所述上清液与固体支持物接触以形成固定化的杂交复合物。在某些方面,所述固体支持物包含珠。在某些方面,所述固体支持物包含过滤板。在某些方面,获得核酸序列信息包括大规模平行测序。在某些方面,获得核酸序列信息包括在核酸阵列表面上检测所述扩增子。

在某些方面,所述多个探针组包含至少10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,60,70,80,90,或至少100个不同的探针组。在某些方面,所述多个探针组包含配置为与多态性区域选择性杂交的多个探针,所述多态性区域提供所述样品来源的身份的信息。在某些方面,所述多个探针组包含配置为与包含癌症相关多态性的区域选择性杂交的多个探针。在某些方面,样品是人类样品。在某些方面,样品包含肿瘤组织。在某些方面,样品包含正常组织。

本文还呈现的是用于核酸样品鉴定的方法,其包括:(a)提供含核酸的细胞样品;(b)用裂解试剂裂解所述样品的细胞以从所述细胞样品的细胞内释放核酸,从而形成裂解物;(c)从裂解的样品扩增所述核酸;其中在开始扩增步骤(c)之前,没有从所述裂解物中纯化所述核酸;和(d)获得扩增样品的多个部分的核酸序列信息,并将所述序列信息与第二组序列信息相比较。

在某些方面,核酸是dna。在某些方面,样品是血液样品。在某些方面,样品包含干燥的血液。在某些方面,样品包含ffpe组织样品。在某些方面,第二组序列信息包含全基因组序列。在某些方面,第二组序列信息包含外显子组(exome)序列信息。

在某些方面,扩增包括靶向扩增反应。在某些方面,靶向扩增反应包含延伸和连接两种探针。在某些方面,靶向扩增反应包括使用对样品基因组的一部分特异性的至少两种扩增引物的聚合酶链式反应。

本文还呈现的是在样品处理的不同阶段期间跟踪生物样品的身份的方法,其包括:(a)提供含核酸的细胞样品;(b)将样品的一部分分为第一部分和第二部分,并根据本文中呈现的任何实施方案从所述生物样品的所述第一部分获得第一组核酸序列信息,其中所述第一组核酸序列信息包含身份信息性序列信息;(c)从所述第二部分纯化核酸并获得第二组序列信息;和(d)使用计算机辅助逻辑,将来自所述第一组核酸序列信息序列信息的身份信息性序列信息与第二组序列信息相比较以确认所述第一组和第二组序列信息获自相同来源。

在某些方面,所述身份信息性序列信息包含至少10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,60,70,80,90,或至少100个独特snp的snp基因型信息。在某些方面,所述第二组序列信息包含至少10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,60,70,80,90,或至少100个独特snp的snp基因型信息。

在某些方面,核酸是dna。在某些方面,样品是血液样品。在某些方面,样品包含干燥的血液。在某些方面,样品包含多孔固体表面上干燥的血液。在某些方面,样品包含ffpe组织样品。在某些方面,第二组序列信息包含全基因组序列。在某些方面,第二组序列信息包含外显子组序列信息。

本文还呈现的是确认两种不同生物样品的来源的方法,其包括:(a)提供第一含核酸的细胞样品;(b)根据本文呈现的任一实施方案,从所述生物样品的第一部分获得第一组核酸序列信息,其中所述第一组核酸序列信息包含身份信息性序列信息;(c)提供包含纯化核酸的第二核酸样品并获得第二组序列信息;和(d)使用计算机辅助逻辑,将来自所述第一组核酸序列信息序列信息的身份信息性序列信息与所述第二组序列信息相比较以确认所述第一组和第二组序列信息获自相同个体。

在某些方面,所述身份信息性序列信息包含至少10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,60,70,80,90,或至少100个独特snp的snp基因型信息。在某些方面,所述第二组序列信息包含至少10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,60,70,80,90,或至少100个独特snp的snp基因型信息。

在某些方面,核酸是dna。在某些方面,样品是血液样品。在某些方面,样品包含干燥的血液。在某些方面,样品包含多孔固体表面上干燥的血液。在某些方面,样品包含ffpe组织样品。在某些方面,所述第二组序列信息包含全基因组序列。在某些方面,所述第二组序列信息包含外显子组序列信息。

在附图和下面的描述中阐述了一个或多个实施方案的细节。从说明书和附图以及权利要求书中,其他特征、目的和优点将是显而易见的。

另外的实施方案可以在2015年7月6日提交的美国临时专利申请no.61/189,063中找到,其内容通过引用以其整体并入本文。

附图简述

图1显示了使用定制扩增子(customamplicon)来制备靶向扩增子文库和用于样品鉴定的随后测序的方法的实例的流程图。

图2显示了使用图1的方法,从每个dbs穿孔(punch)和基因组dna样品产生的pcr扩增产物的凝胶的agilenttapestation图像。

图3显示了使用图2的合并dbs文库样品的序列运行的具有质量度量的miseq状态窗格(pane)的实例的屏幕截图。

图4显示了百分比读段(通过滤器)的图,所述百分比读段鉴定为图3的测序运行的索引号的函数。

图5显示了对于基因组dna(gdna)和dbs样品(“点样”)两者,针对表2的7个供体样品(即cs219、cs220、cs221、cs222、cs223,、cs224、和cs225)的snp调用(calls)的表。

图6a和6b分别显示了对于图5的表中所示的供体样品,色阶和直方图以及状态同一性(identitybystate,ibs)计算的图。

图7a和7b分别显示了色阶和直方图以及状态同一性(ibs)计算的图,并显示了基于snp数据鉴别表2的dbs样品的实例。

图8显示了来自合并物a中ffpe和基因组dna样品的pcr扩增产物的凝胶的agilenttapestation图像,以及来自合并物b中ffpe和基因组dna样品的pcr扩增产物的bioanalyzer图像。

图9显示了使用多重靶向pcr扩增来制备靶向扩增子文库和随后测序以用于样品鉴定的方法的实例的流程图。

图10a和10b分别显示了使用图9的方法,由gdna产生的pcr扩增产物的凝胶的bioanalyzer图像,以及从每个dbs穿孔产生的pcr扩增产物的bioanalyzer图像。

图11显示了illumina序列分析查看器(sav)软件的屏幕截图,其汇总了使用图10a和10b的dbs和基因组扩增子文库的miseq序列运行的质量度量。

图12显示了百分比读段(通过滤器)的图,所述百分比读段鉴定为图11的测序运行的索引号的函数。

图13a和13b分别显示了对于用于评价图9的方法900的表2的供体样品,色阶和直方图以及状态同一性(ibs)计算的图。

图14a和14b分别显示了色阶和直方图以及状态同一性(ibs)计算的图,并且显示了基于snp数据区分表2的dbs样品的实例。

图15显示了platinumgenomes家族的家族树图。

图16a和16b分别显示了色阶和直方图以及状态同一性(ibs)计算的图,并且显示了基于snp数据的高分辨率基因组dna样品鉴别的实例。

发明详述

本公开提供了用于靶向扩增dna和样品鉴定的方法。例如,本文阐述的方法特别可用于样品的验证和质量控制以及确认在将序列数据输送至内科医师或至患者之前wgs序列数据与患者样品适当匹配。然而,应当理解,本文阐述的方法可以用于期望快速靶向扩增的其他合适的应用。

在一些实施方案中,本公开涉及制备样品用于随后的核酸(如dna)扩增的方法,所述方法比现有的方法更容易执行。具体地,本发明涉及方法,其中在扩增之前不需要纯化来自样品的核酸(如dna)。

例如,本文阐述的方法特别可用于样品的验证和质量控制以及确认在将序列数据输送至内科医师或至患者之前wgs序列数据与患者样品适当匹配。然而,应当理解,本文阐述的方法可以用于期望快速靶向扩增的其他合适的应用。

因此,在一些实施方案中,本文呈现的是从生物样品获得核酸序列信息的方法,包括:(a)提供包含不同靶核酸的生物样品;(b)将所述生物样品与多个不同的探针组接触以与所述不同靶核酸形成杂交复合物;(c)自所述生物样品扩增所述核酸以产生扩增子;其中在接触步骤(b)之前,没有从所述生物样品纯化所述核酸;和(d)获得扩增样品的多个部分的核酸序列信息。

在上述实施方案的一些中,在步骤(c)中的所述扩增之前,没有从所述生物样品纯化所述核酸。相反,在样品组分(包括细胞碎片和用于储存生物样品的材料)存在下进行扩增。例如,在一些实施方案中,除了细胞碎片之外,在存在福尔马林和石蜡组分下进行扩增反应。在某些方面,步骤(c)中的所述扩增包括使用至少两种对样品基因组的一部分具有特异性的扩增引物的聚合酶链式反应。在某些方面,步骤(c)中的所述扩增包括延伸和连接两种探针以形成扩增模板。

在某些方面,当与延伸酶和核苷酸接触时,进一步将包含溶液相杂交复合物的上清液与固体支持物接触以形成固定化的杂交复合物。例如,固体支持物可以是珠、颗粒、过滤板等。

在某些方面,所述不同靶核酸各自从3’至5’包含:连续的第一、第二和第三靶域,并且每个探针组包含:(i)第一探针,其从5’至3’包含:第一引发序列和基本上与第一靶域互补的序列;和(ii)第二探针,其从5’至3’包含:基本上与第三靶域互补的序列和第二引发序列。

在某些方面,所述方法包括,在扩增步骤之前,从所述生物样品收集包含溶液相杂交复合物的上清液的步骤。在某些方面,获得核酸序列信息包括大规模平行测序。在某些方面,获得核酸序列信息包括在核酸阵列表面上检测所述扩增子。

在本文呈现的一些实施方案中,所述方法是从ffpe样品获得核酸序列信息的方法,其包括:(a)提供包埋在保存的组织内的包含不同靶核酸的ffpe样品;(b)将所述ffpe样品与多个不同的探针组接触以与所述不同靶核酸形成杂交复合物;(c)自所述ffpe样品扩增所述核酸以产生扩增子;其中在接触步骤(b)之前,没有从所述ffpe样品纯化所述核酸;和(d)获得多个所述扩增子的核酸序列信息。在特定实施方案中,在步骤(c)中的所述扩增之前,没有从所述ffpe样品纯化所述核酸。

在一些实施方案中,方法是从ffpe样品扩增核酸的方法,其包括:(a)提供包埋在保存的组织内的包含核酸的ffpe样品,所述核酸从3’至5’具有:连续的第一、第二和第三靶域;(b)将所述ffpe样品与多个不同的探针组接触以与不同靶核酸形成杂交复合物,其中每个探针组包含:(i)第一探针,其从5’至3’包含:第一引发序列和基本上与所述第一靶域互补的序列;和(ii)第二探针,其从5’至3’包含:基本上与所述第三靶域互补的序列和第二引发序列;(c)将所述杂交复合物与延伸酶和核苷酸接触,其中所述第一探针沿着在(b)中形成的杂交复合物的所述第二靶域延伸;(d)连接延伸的第一探针与所述第二探针,以形成扩增模板;和(e)用与所述第一引发序列和所述第二引发序列互补的第一和第二引物扩增所述扩增模板以产生扩增子,以及获得多个所述扩增子的核酸序列信息。

在某些方面,方法包括在步骤(c)之前,从所述ffpe样品收集包含溶液相杂交复合物的上清液的步骤。在某些方面,当与延伸酶和核苷酸接触时,进一步将包含溶液相杂交复合物的所述上清液与固体支持物接触以形成固定化的杂交复合物。在某些方面,固体支持物包含珠。在某些方面,固体支持物包含过滤板。在某些方面,获得核酸序列信息包括大规模平行测序。在某些方面,获得核酸序列信息包括在核酸阵列表面上检测所述扩增子。

在本文呈现的一些实施方案中,方法是用于核酸样品鉴定的方法,其包括:(a)提供含核酸的细胞样品;(b)用裂解试剂裂解所述样品的细胞以从所述细胞样品的细胞内释放核酸,从而形成裂解物;(c)从裂解的样品扩增所述核酸;其中在开始扩增步骤(c)之前,没有从所述裂解物中纯化所述核酸;和(d)获得扩增样品的多个部分的核酸序列信息,并将所述序列信息与第二组序列信息相比较。

如本文所用,“靶向扩增”可以指用于扩增感兴趣的靶核酸序列的任何扩增方法。在一些实施方案中,靶向扩增可以包括扩增子制备和在固体支持物上测序,其如以下任一公开所阐述:2014年12月18日提交的标题为“ampliconpreparationandsequencingonsolidsupports”的pct/us2014/071263,以及2014年12月23日提交的标题为“polynucleotidemodificationonsolidsupports”的pct/ep2014/079145,其通过引用以其整体并入本文。

在一些实施方案中,靶向扩增可以包括将两个或多个探针与感兴趣的靶核酸序列的相同的链杂交,随后延伸探针之一的3’末端并将延伸探针连接至另一个探针,其在以下材料中总体阐述:美国专利号7,803,537、美国专利号8,003,354和美国专利号8,906,626,所述公开通过引用以其整体并入本文。

在一些实施方案中,在扩增前无需核酸纯化的情况下进行核酸制备和扩增。可用于本文所述方法的一些核酸制备和扩增方法可以在以下公开中找到:2015年6月9日提交的标题为“samplepreparationfornucleicacidamplification”的pct/gb2015/051674,以及2015年5月28日提交的标题为“surface-basedtagmentation”的美国申请序列号62/167,463,其通过引用以其整体并入本文。

如本文所用,核酸样品可以是包含核酸的任何样品。例如,核酸可以是dna或rna。在一些实施方案中,样品包含全细胞、裂解的细胞、细胞组分或其任何混合物。在一些实施方案中,样品是血液样品。在一些实施方案中,样品是全血样品。合适的样品可获得自组织、体液、和/或包含核酸的任何其它样本。在一些实施方案中,本发明提供了制备用于dna扩增的非血液样品,如组织样品,例如福尔马林固定的石蜡包埋的(ffpe)样品的方法。此类组织样品可以是肿瘤样品。其它样品可以是生检或抽出物等。

本公开提供了在遗传测试测定中验证dna样品身份的方法。在一个实例中,遗传测试测定是多路复用的全基因组测序(wgs)诊断测定。在各种实施方案中,本发明的方法使用靶向扩增子文库测序以确认遗传测试测定中样品的身份。

在一些实施方案中,使用可用于选择性扩增多个基因组区域的一组探针或引物来制备靶向扩增子文库,所述多个基因组区域单独或以组合的方式提供关于样品身份的信息。例如,在一些实施方案中,使用探针或引物组来与其它样品区分一个样品的身份。在一些实施方案中,使用探针或引物组来鉴定从其中获得样品的人。在一些实施方案中,可以将人与多个其他人区分开来。在一些实施方案中,可以独特地鉴定出人。例如,在一些实施方案中,使用一组探针或引物来选择性扩增多个基因组区域,其单独或以组合的方式独特地鉴定生物来源(诸如人供体)与超过10、100、1000、104、105、106、107、108、109、1010、或超过1011个其他人类供体。在一些实施方案中,使用一组探针或引物来选择性扩增多个基因组区域,其单独或以组合的方式独特地鉴定生物来源(诸如人供体)与108、109、1010、或超过1011个其他人类供体。如本文所用,术语独特地鉴定指一个或多个标志物的能力,所述标志物单独或以组合的方式鉴别一个特定样品与任何其他样品。

在一些实施方案中,使用选择性扩增多态性区域的一组探针或引物来制备靶向扩增子文库。任何多态性区域可用于本文呈现的组中。例如,在一些实施方案中,所述多态性区域是单核苷酸多态性(snp)。在一些实施方案中,所述多态性区域是重复区域,如短串联重复(str)。在一些实施方案中,所述组选择性地扩增包含不同类型多态性区域组合(如,例如一种或多种snp与一种或多种str的组合)的组。

可以使用多态性区域的任何适合的组合以及提供期望的个体区别水平的任何合适数量的多态性区域。在一些实施方案中,使用用于检测身份信息性单核苷酸多态性(iisnp)(本文中也称为身份snp)的一组探针或引物来制备靶向扩增子文库。如本领域已知的任何合适的身份snp组可以用于本文呈现的方法中,如例如描述于以下公开的那些:kiddkk,etal.forensicsciint.2006;164(1):20-32,以及sanchezjj,etal.electrophoresis2006;27(9):1713-1724,所述公开各自通过引用以其整体并入本文。在一些实施方案中,诸如在下文给出的实例中描述的那些,组诸如来自forenseq集合(illumina,inc.)的45重idsnp子集可用于本文呈现的方法中。

在一些实施方案中,身份snp用于区分多重遗传测试测定中的样品。可以为特定应用选择身份snp组的内容和/或组中的snp的数量。可以选择用于生成snp扩增子文库的引物设计(例如,引物位置)用于快速文库测序。在一些实施方案中,snp组包含用于从一个或多个样品中阳性鉴定样品的至少10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46,47,48,49,50,51,52,53,54,55,60,70,80,90,或至少100个独特snp。在一些实施方案中,snp组包含至少19个不同的snp。在一些实施方案中,snp组包含至少52个不同的snp。在一个实例中,身份snp组包含24个不同的snp。在另一个实例中,身份snp组包含45个不同的snp。

根据以上所述,在一些实施方案中,方法包括将核酸样品与多个配置为选择性扩增期望的多态性区域组的不同引物或探针相接触,所述期望的多态性区域组如例如一种或多种snp和/或一种或多种str的组合。

作为非限制性的实例,所述组可以包含以任何组合方式的下表1中所列的一种或多种身份信息性snp。

表1身份信息性snp

遗传测试测定中的样品可以是包括核酸的任何样品(如生物样品)。生物样品的非限制性实例可以包括完整生物体以及从患者获得的样品。生物样品可以获得自任何生物流体或组织,并且可以有多种形式,包括液体流体和组织,固体组织和保存的形式如干燥、冷冻和固定形式。样品可以是任何生物组织,细胞或液体。此类样品包括但不限于:痰液、血液、血清、血浆、血细胞(如白细胞)、腹水、尿液、唾液、眼泪、痰、阴道液(排出物(discharge))、在医疗程序中获得的洗涤物(如盆腔洗涤物或在活检,内窥镜检查或手术过程中获得的其它洗涤物)、组织、乳头抽出物、芯或细针生检样品、含细胞的体液、自由漂浮的核酸、腹膜液,和胸腔积液或来自其的细胞。生物样品还可以包括组织的切片,如为了组织学目的采用的冷冻或固定切片或显微切割的细胞或其细胞外部分。在一些实施方案中,样品可以是血液样品,如例如白细胞样品。在另一个实例中,样品是未处理的干血液点样(dbs)样品。在又一实例中,样品是福尔马林固定的石蜡包埋的(ffpe)样品。在又一实例中,样品是唾液样品。在又一实例中,样品是干唾液点样(dss)样品。

在一些实施方案中,一组同一性标志物包含于设计用于筛选疾病(如例如体细胞癌症突变)的组中。作为结果,对组合的组测序的结果不仅提供关于疾病状态的信息,而且还提供关于从中获得样品的个体身份的信息。疾病信息性序列信息和身份信息性序列信息的组合允许有关疾病的序列信息与个体身份绑定。这在存储和管理来自个体的序列数据方面提供了显著的优势,因为身份信息性序列信息是在筛选疾病状态时获得的序列信息的组成部分。另外,当将疾病筛选的结果与其他序列信息相比较时,身份信息性序列信息可以是有利的,所述其他序列信息诸如全基因组序列信息、外显子组序列信息或指向另一个疾病筛选的一组序列信息。

在一些实施方案中,本文呈现的方法和组合物允许在样品处理的不同阶段期间跟踪生物样品的身份。例如,跟踪方法可以包括:(a)提供含核酸的细胞样品;(b)将样品的一部分分为第一部分和第二部分,并根据本文呈现的任一实施方案从所述生物样品的所述第一部分获得第一组核酸序列信息,其中所述第一组核酸序列信息包含身份信息性序列信息;(c)从所述第二部分纯化核酸并获得第二组序列信息;和(d)使用计算机辅助逻辑,将来自所述第一组核酸序列信息序列信息的身份信息性序列信息与第二组序列信息相比较以确认所述第一组和第二组序列信息获自相同来源。

在一些实施方案中,可以期望确认两种不同样品来源的身份。例如,一种方法可以包括:(a)提供第一含核酸的细胞样品;(b)根据本文呈现的任一实施方案从所述生物样品的第一部分获得第一组核酸序列信息,其中所述第一组核酸序列信息包含身份信息性序列信息;(c)提供包含纯化的核酸的第二核酸样品并获得第二组序列信息;和(d)使用计算机辅助逻辑,将来自所述第一组核酸序列信息序列信息的身份信息性序列信息与所述第二组序列信息相比较以确认所述第一组和第二组序列信息获自相同个体。

选择性扩增

在本文呈现的实施方案中,从样品中选择性扩增靶核酸的组。在一些实施方案中,选择性扩增可以包括一个或多个非选择性扩增步骤。例如,可以在使用随机或简并引物的扩增步骤可以继之以使用靶物特异性引物的一个或多个循环的扩增。

在一个实施方案中,本发明的方法使用定制扩增子(tsca)(illumina,inc.)以制备用于随后测序和样品验证的靶向扩增子文库。tsca文库制备方案使用靶物特异性寡核苷酸探针和连接/延伸反应来产生靶向扩增子。例如,在一些实施方案中,方法可以包括(a)提供样品,其具有包含dna的不同靶核酸,其中核酸各自从3’至5’包含:连续的第一、第二和第三靶域;(b)将样品与多种至少100种不同的探针组接触与所述不同靶核酸形成杂交复合物,其中每个探针组包含:(i)第一探针,其从5’至3’包含:第一引发序列和基本上与所述第一靶域互补的序列;和(ii)第二探针,其从5’至3’包含:基本上与所述第三靶域互补的序列和第二引发序列,其中每个不同的探针组中至少一个探针含有对于靶核酸非天然的独特的衔接子序列;(c)将杂交复合物与延伸酶和核苷酸接触,其中所述第一探针沿着在(b)中形成的杂交复合物的所述第二靶域延伸,其中当与延伸酶和核苷酸接触时,所述杂交复合物固定在固体支持物上;(d)连接延伸的第一探针与所述第二探针,以形成扩增模板;(e)用与所述第一引发序列和所述第二引发序列互补的第一和第二引物扩增所述扩增模板以产生扩增子;以及(f)检测在核酸阵列表面上的扩增子,所述核酸阵列不同于固定化到杂交复合物的固体支持物。

在另一实施方案中,本发明的方法使用靶向多重pcr扩增来制备用于随后测序和样品验证的扩增子文库。尽管本文描述了作为示例性实施方案的tsca和靶向多重pcr,但是本领域技术人员将理解,用于选择性捕获和/或选择性扩增的许多已知方法中的任一种可以用于本文呈现的制备用于后续测序和样品验证的扩增子文库的方法中。

如本文所用,术语“扩增”等指产生单链或双链核酸或其部分的一个或多个拷贝。在一些实施方案中,本文提供的方法可以包括在等温或热变量条件下产生扩增的核酸的步骤。

如本文所用,当用于提及“扩增”(或语法等同物)时,术语“选择性地”和“靶向”等是指与样品中一种或多种其它核酸相比,优先扩增样品中的第一核酸。该术语可以指产生第一核酸的一个或多个拷贝并且基本上不产生其它核酸的拷贝。该术语还可以指产生在使用的特定检测条件下可检测量的第一核酸拷贝和检测不到(或不显著)量的其他核酸拷贝。

根据本文呈现的方法和系统,可以利用任何合适的扩增方法来选择性地或非选择性地扩增来自个体的一种或多种核酸分子。应当理解,本文所述的或本领域通常已知的任何扩增方法可与靶物特异性引物一起使用以选择性扩增感兴趣的核酸分子。用于选择性扩增的合适方法包括但不限于,聚合酶链式反应(pcr)、链置换扩增(sda)、转录介导的扩增(tma)和基于核酸序列的扩增(nasba),如描述于美国专利号8,003,354中,通过引用以其整体并入本文。可以使用上述扩增方法来扩增一种或多种感兴趣的核酸。例如,包括多重pcr、sda、tma、nasba等的pcr可用于选择性扩增一种或多种感兴趣的核酸。在此类实施方案中,特异性针对感兴趣的核酸的引物包括在扩增反应中。

用于扩增核酸的其它合适的方法可以包括寡核苷酸延伸和连接、滚环扩增(rca)(lizardietal.,nat.genet.19:225-232(1998),其通过引用并入本文)以及寡核苷酸连接测定(ola)(一般参见美国专利号7,582,420,5,185,243,5,679,524和5,573,907;ep0320308b1;ep0336731b1;ep0439182b1;wo90/01069;wo89/12696;和wo89/09835,所有通过引用并入本文)技术。应当理解,可以设计这些扩增方法以选择性地扩增感兴趣的靶核酸。例如,在一些实施方案中,选择性扩增方法可以包括连接探针扩增或寡核苷酸连接测定(ola)反应,其含有专门针对感兴趣的核酸的引物。在一些实施方案中,选择性扩增方法可以包括引物延伸-连接反应,其含有专门针对感兴趣的核酸的引物。作为可以专门设计以扩增感兴趣的核酸的引物延伸和连接引物的非限制性实例,扩增可以包括用于goldengate测定的引物(illumina,inc.,sandiego,ca)。

可用于本公开的方法的示例性等温扩增方法包括但不限于,多重置换扩增(mda),如例如deanetal.,proc.natl.acad.sci.usa99:5261-66(2002)所示,或等温链置换核酸扩增,如例如美国专利号6,214,587例示,其各自通过引用以其整体并入本文。可用于本公开的其它非基于pcr的方法例如包括例如例如描述于walkeretal.,molecularmethodsforvirusdetection,academicpress,inc.,1995;美国专利号5,455,166,和5,130,238,以及walkeretal.,nucl.acidsres.20:1691-96(1992)中的链置换扩增(sda),或者例如描述于lageetal.,genomeresearch13:294-307(2003)中的超分支链置换扩增,前述各自通过引用以其整体并入本文。等温扩增方法可以与链置换phi29聚合酶或bstdna聚合酶大片段,5’->3’exo-一起用于基因组dna的随机引物扩增。这些聚合酶的使用利用其高的持续性和链置换活性。高持续性允许聚合酶产生长度为10-20kb的片段。如上所述,可以在等温条件下使用具有低持续性和链置换活性的聚合酶(如klenow聚合酶)来产生较小的片段。美国专利号7,670,810的公开中详细描述了扩增反应、条件和组分的其他描述,该专利通过引用以其整体并入本文。

在本公开中有用的另一种核酸扩增方法是使用具有恒定5’区域,接着是随机3’区域的双域引物群体的标签化pcr(taggedpcr),其例如描述于grothuesetal.nucleicacidsres.21(5):1321-2(1993),通过引用以其整体并入本文。进行第一轮扩增以允许基于来自随机合成的3’区域的单独杂交,对热变性的dna的大量起始。由于3’区域的性质,考虑起始位点在整个基因组中是随机的。因此,可以除去未结合的引物并且可以使用与恒定5’区域互补的引物发生进一步的复制。

结合本公开方法的可用于扩增gdna的另一种方法是在如但不限于cheungetal.,proc.natl.acad.sci.usa,93:14676-79(1996)或美国专利号5,043,272中描述的那些条件下的简并寡核苷酸引发的聚合酶链式反应(dop-pcr),上述通过引用以其整体并入本文。可以将低量的dna(例如15μg的人dna)扩增至在本公开的方法中方便检测的水平。可以选择cheung等人的方法中使用的反应条件来产生具有人类基因组的几乎完全覆盖的基因组片段的扩增代表性群体。另外,根据本公开内容,dop-pcr的修饰版本可用于扩增gdna,所述版本例如描述于kittler等人的在称为ll-dop-pcr(来自低dna量-dop-pcr的长产物)的方案中的那些(kittleretal.,anal.biochem.300:237-44(2002),所述公开的内容通过引用以其整体并入本文。

引物-延伸预扩增聚合酶链式反应(pep-pcr)也可用于本公开的方法中以扩增gdna。使用pep-pcr扩增gdna的有用条件例如包括描述于casasetal.,biotechniques20:219-25(1996)中的那些,其通过引用以其整体并入本文。

在一些实施方案中,选择性扩增可以包括从不同核酸的混合物中将感兴趣的核酸拉下(pull-down)的方法。可以在扩增发生之前或之后发生下拉。下拉方法在本领域中是已知的,并且例如可以包括使用生物素化探针或探针阵列的核酸下拉。

本方法不限于任何特定的扩增技术,并且本文所述的扩增技术就本公开方法和实施方案而言仅仅是示例的。

本发明的方法提供了使用“原始”样品输入(如未处理的干血点样)和/或处理的样品输入(如纯化的基因组dna)的快速测试,其可以用于快速和明确地确认wgs数据的样品身份。

测序方法

本文描述的方法可以与各种核酸测序技术结合使用。特别适用的技术是其中将核酸附接在阵列中的固定位置,使得它们的相对位置不改变,并且其中阵列被重复成像的那些。在不同颜色通道中获得图像(例如,与用于区分一种核苷酸碱基类型与另一种核苷酸碱基类型的不同标记物相符)的实施方案是特别适用的。在一些实施方案中,测定靶核酸核苷酸序列的过程可以是自动化过程。优选的实施方案包括合成测序(“sbs”)技术。

“合成测序(“sbs”)技术”通常涉及通过针对模板链重复添加核苷酸来酶促延伸新生核酸链。在sbs的传统方法中,可以在每个递送中,在聚合酶存在下,向靶核苷酸提供单个核苷酸单体。然而,在本文所述的方法中,在递送中,在聚合酶存在下,可以将多于一种类型的核苷酸单体提供给靶核酸。

sbs可以利用具有终止剂部分的核苷酸单体或那些缺少任何终止剂部分的核苷酸单体。使用缺乏终止剂的核苷酸单体的方法例如包括焦磷酸测序和使用γ-磷酸/磷酸盐标记的核苷酸的测序,如下面进一步详细阐述的。在使用缺乏终止剂的核苷酸单体的方法中,每个循环中加入的核苷酸数目通常是可变的,并取决于模板序列和核苷酸递送模式。对于利用具有终止剂部分的核苷酸单体的sbs技术,终止剂可以在使用的测序条件下是有效不可逆转的,利用双脱氧核苷酸的传统sanger测序就是如此,或者终止剂可以是可逆的,由solexa(现在是illumina,inc.)开发的测序方法就是如此。

sbs技术可以利用具有标记物部分的核苷酸单体或缺乏标记物部分的核苷酸单体。因此,可以基于标记物的特征来检测掺入事件,如标记物的荧光;核苷酸单体的特征如分子量或电荷;核苷酸掺入的副产物,如焦磷酸释放等。在测序试剂中存在两个或更多个不同的核苷酸的实施方案中,可以彼此区分不同的核苷酸,或者备选地,在使用的检测技术下,两个或更多个不同的标记物可以是不可区分的。例如,测序试剂中存在的不同核苷酸可以具有不同的标记物并且可以使用适当的光学器件来区分它们,如由solexa(现在是illumina,inc.)开发的测序方法示例。

优选的实施方案包括焦磷酸测序技术。焦磷酸测序检测在将特定的核苷酸掺入到新生链中时的无机焦磷酸盐(ppi)的释放(ronaghi,m.,karamohamed,s.,pettersson,b.,uhlen,m.andnyren,p.(1996)“real-timednasequencingusingdetectionofpyrophosphaterelease.”analyticalbiochemistry242(1),84-9;ronaghi,m.(2001)“pyrosequencingshedslightondnasequencing.”genomeres.11(1),3-11;ronaghi,m.,uhlen,m.andnyren,p.(1998)“asequencingmethodbasedonreal-timepyrophosphate.”science281(5375),363;美国专利号6,210,891;美国专利号6,258,568和美国专利号6,274,320,前述公开通过引用以它们的整体并入本文)。在焦磷酸测序中,释放的ppi可以通过atp硫酸化酶立即转化为三磷酸腺苷(atp)来检测,并且通过萤光素酶产生的光子检测产生的atp水平。可以将要测序的核酸附接到阵列中的特征,并且可以对阵列成像以捕捉由于在阵列的特征处掺入核苷酸而产生的化学发光信号。在用特定核苷酸类型(例如a、t、c或g)处理阵列后可以获得图像。在添加每种核苷酸类型后获得的图像就就检测阵列中的哪些特征而言有所不同。图像中的这些差异反映了阵列上特征的不同序列内容。然而,每个特征的相对位置在图像中将保持不变。可以使用本文所述的方法来存储,处理和分析图像。例如,可以以下述方式处理在用每种不同核苷酸类型处理阵列后获得的图像,所述方式与本文对用于基于可逆终止剂的测序方法的不同检测通道获得的图像例示的方式相同。

在sbs的另一个示例性类型中,循环测序通过逐步添加可逆终止剂核苷酸来完成,所述可逆终止剂核苷酸例如包括以下所述的可切割或者光可漂白的染料标记物:国际专利公开号wo04/018497和美国专利7,057,026,其公开以其整体通过引用并入本文。这种方法正在被solexa(现在是illumina,inc.)商业化,并且还描述于国际专利公开号wo91/06678和国际专利公开号wo07/123,744中,每个以其整体通过引用并入本文。荧光标记的终止剂的可用性(其中既可以反转终止又可以切割荧光标记物)促进有效的循环可逆终止(crt)测序。也可以共同工程化改造聚合酶以有效地掺入这些修饰的核苷酸并从这些修饰的核苷酸延伸。

优选地,在基于可逆终止剂的测序实施方案中,在sbs反应条件下,标记物基本上不能抑制延伸。然而,检测标记物可以是可移除的,例如通过切割或降解。在将标记物并入阵列的核酸特征之后,可以捕获图像。在具体实施方案中,每个循环涉及将四种不同核苷酸类型同时递送至阵列,并且每种核苷酸类型具有光谱上不同的标记物。然后可以获得四个图像,每个图像使用对四个不同标签之一选择的检测通道。或者,可以顺序添加不同的核苷酸类型,并且可以在每个添加步骤之间获得阵列的图像。在此类实施方案中,每个图像将显示已经掺入特定类型的核苷酸的核酸特征。由于每个特征的不同序列内容,不同的图像将存在或不存在不同的图像中。然而,图像中的特征的相对位置将保持不变。可以如本文所述对从此类可逆终止剂-sbs方法获得的图像进行储存,处理和分析。在图像捕获步骤之后,可以除去标记物,并且可以除去可逆终止剂部分以用于随后的核苷酸添加和检测循环。标记物在它们已经在特定循环内以及在后续循环之前检出后的除去可以提供降低背景信号和循环之间串扰的优点。有用的标记物和除去方法的实例如下所述。

在具体实施方案中,一些或全部核苷酸单体可以包括可逆终止剂。在此类实施方案中,可逆终止剂/可裂解荧光剂(fluor)可以包括经由3'酯连接与核糖部分连接的荧光剂(metzker,genomeres.15:1767-1776(2005),其通过引用以其整体并入本文)。其他方法将终止剂化学与荧光标记物的切割分离(rupareletal.,procnatlacadsciusa102:5932-7(2005),其通过引用以其整体并入本文)。ruparel等人描述了可逆终止剂的开发,所述可逆终止剂使用小的3’烯丙基来封闭延伸,但是可以通过用钯催化剂的短暂处理容易地解封。荧光团经由光可裂解接头附接到碱基,所述光可裂解接头可以通过暴露于长波长uv光30秒而容易地被切割。因此,可以使用二硫化物还原或光切割作为可切割接头。可逆终止的另一种方法是使用在dntp上放置大体积染料之后发生的自然终止。dntp上带电荷的大体积染料的存在可以通过空间和/或静电阻碍作为有效的终止剂起作用。除非除去染料,一个掺入事件的存在防止进一步掺入。染料的切割除去荧光,并有效地反转终止。修饰的核苷酸的实例也描述在美国专利7,427,673和美国专利7,057,026中,其公开通过引用整体并入本文。

可以与本文描述的方法和系统一起使用的另外的示例性sbs系统和方法描述于以下中:美国专利公开号2007/0166705,美国专利公开号2006/0188901,美国专利7,057,026,美国专利公开号2006/0240439,美国专利公开号2006/0281109,国际专利公开号wo05/065814,美国专利公开号2005/0100900,国际专利公开号wo06/064199,国际专利公开号wo07/010,251,美国专利公开号2012/0270305以及美国专利公开号2013/0260372,每个公开的内容通过引用以其整体并入本文。

一些实施方案可以利用使用少于四种不同的标记物来检测四种不同的核苷酸。例如,可以使用描述于美国专利公开号2013/0079232的并入材料中的方法和系统来执行sbs。作为第一个实例,可以以相同的波长检测一对核苷酸类型,但是基于该对的一种成员与另一成员相比的强度差异,或基于与该对的另一成员相比引起表观信号出现或消失的该对的一种成员的改变(例如,经由化学修饰,光化学改性或物理改性)区分。作为第二个实例,在特定条件下可以检测四种不同核苷酸类型中的三种,而第四核苷酸类型缺少在那些条件下可检测的标记物,或在那些条件下在最小程度上检测(例如,由背景荧光引起的最小程度检测等)。前三种核苷酸类型掺入至核酸可以基于它们各自的信号的存在来测定,并且可以基于任何信号的不存在或最小程度检测来确定第四种核苷酸类型掺入到核酸中。作为第三个实例,一种核苷酸类型可以包括在两个不同通道中检测到的标记物,而在不超过一个通道中检测到其他核苷酸类型。认为上述三个示例性配置不是相互排斥的,并且可以以各种组合使用。组合所有三个实例的示例性实施方案为基于荧光的sbs法,其使用在第一通道中检测的第一种核苷酸类型(例如,具有标记物的datp,其当被第一激发波长激发时在第一通道中检测到),在第二通道中检测的第二种核苷酸类型(例如,具有标记物的dctp,其当被第二激发波长激发时在第二通道中检测到),在第一和第二通道两者中检测的第三种核苷酸类型(例如,具有至少一种标记物的dttp,其当被第一和/或第二激发波长激发时在两个通道中都检测到)以及在任一通道中未被检出或被最小程度检出的缺少标记物的第四种核苷酸类型(例如,没有标记物的dgtp)。

此外,如美国专利公开号2013/0079232的并入材料中所描述的,可以使用单个通道获得测序数据。在所谓的单染料测序方法中,第一种核苷酸类型是标记的,但在产生第一种图像后除去该标记物,并且仅在产生第一图像之后标记第二种核苷酸类型。第三种核苷酸类型在第一和第二图像两者中保留其标记物,并且第四种核苷酸类型在这两个图像中保持未标记。

一些实施方案可以利用连接测序技术。此类技术利用dna连接酶掺入寡核苷酸并鉴定此类寡核苷酸的掺入。寡核苷酸通常具有与寡核苷酸杂交的序列中特定核苷酸的同一性相关的不同标记。与其他sbs方法一样,在用标记的测序试剂处理核酸特征阵列之后可以获得图像。每个图像将显示已经掺入特定类型的标记物的核酸特征。由于每个特征的不同序列内容,不同的图像中将存在或不存在不同的特征,但是图像中的特征的相对位置将保持不变。从基于连接的测序方法获得的图像可以如本文所述进行存储,处理和分析。可以与本文描述的方法和系统一起使用的示例性sbs系统和方法描述于美国专利6,969,488,美国专利6,172,218和美国专利6,306,597中,所述专利通过引用以其整体并入本文。

一些实施方案可以通过利用纳米孔测序(deamer,d.w.&akeson,m.“nanoporesandnucleicacids:prospectsforultrarapidsequencing.”trendsbiotechnol.18,147-151(2000);deamer,d.andd.branton,“characterizationofnucleicacidsbynanoporeanalysis”.acc.chem.res.35:817-825(2002);li,j.,m.gershow,d.stein,e.brandin,andj.a.golovchenko,“dnamoleculesandconfigurationsinasolid-statenanoporemicroscope”nat.mater.2:611-615(2003),上述公开通过引用以其整体并入本文)。在此类实施方案中,靶核酸通过纳米孔。纳米孔可以是合成的孔或生物膜蛋白,如α-溶血素。当靶核酸通过纳米孔时,可以通过测量孔的电导的波动来鉴定每个碱基对(美国专利7,001,792;soni,g.v.&meller,“a.progresstowardultrafastdnasequencingusingsolid-statenanopores.”clin.chem.53,1996-2001(2007);healy,k.“nanopore-basedsingle-moleculednaanalysis.”nanomed.2,459-481(2007);cockroft,s.l.,chu,j.,amorin,m.&ghadiri,m.r.“asingle-moleculenanoporedevicedetectsdnapolymeraseactivitywithsingle-nucleotideresolution.”j.am.chem.soc.130,818-820(2008),上述公开通过引用以其整体并入本文)。从纳米孔测序获得的数据可以如本文所述进行存储,处理和分析。特别地,可以根据本文所列的光学图像和其他图像的示例性处理将数据作为图像进行处理。

一些实施方案可以利用涉及实时监测dna聚合酶活性的方法。可以通过含荧光团的聚合酶和γ-磷酸标记的核苷酸之间的荧光共振能量转移(fret)相互作用来检测核酸掺入,其例如描述于美国专利7,329,492和美国专利7,211,414中(每篇通过引用并入本文),或者可以用零模式波导和使用荧光核苷酸类似物和工程化聚合酶来检测核苷酸掺入,所述零模式波导例如描述于美国专利7,315,019(其通过引用并入本文),所述荧光核苷酸类似物和工程化聚合酶例如描述于美国专利7,405,281和美国专利申请公开号2008/0108082中(每篇通过引用并入本文)。可以将照明(illumination)限制在围绕表面系留聚合酶的阿升(zeptoliter)-尺度体积,使得可以低背景观察荧光标记核苷酸的掺入(levene,m.j.etal.“zero-modewaveguidesforsingle-moleculeanalysisathighconcentrations.”science299,682-686(2003);lundquist,p.m.etal.“parallelconfocaldetectionofsinglemoleculesinrealtime.”opt.lett.33,1026-1028(2008);korlach,j.etal.“selectivealuminumpassivationfortargetedimmobilizationofsinglednapolymerasemoleculesinzero-modewaveguidenanostructures.”proc.natl.acad.sci.usa105,1176-1181(2008),上述公开通过引用以其整体并入本文)。从这些方法获得的图像可以如本文所述进行存储,处理和分析。

一些sbs实施方案包括在将核苷酸掺入延伸产物中时释放的质子的检测。例如,基于释放质子的检测的测序可以使用可从iontorrent(guilford,ct,lifetechnologies子公司)购得的电检测器以及相关的技术或者描述于以下专利中的测序方法和系统:美国专利公开号2009/0026082;美国专利公开号2009/0127589;美国专利公开号2010/0137143;或美国专利公开号2010/0282617a1,每个通过引用并入本文。本文阐述的使用动态排除(kineticexclusion)扩增靶核酸的方法可容易地应用于用于检测质子的基底。更具体地,本文阐述的方法可用于产生用于检测质子的扩增子的克隆群。

上述sbs方法可以有利地以多重形式进行,使得多个不同的靶核酸被同时操作。在具体实施方案中,不同的靶核酸可以在共同的反应容器中或在特定的基底的表面上进行处理。这允许以多重方式来方便地递送测序试剂,除去未反应的试剂和检测掺入事件。在使用表面结合靶核酸的实施方案中,靶核酸可以是阵列形式。在阵列形式中,靶核酸通常可以以空间上可区分的方式结合到表面。靶核酸可以通过直接共价附接,附接到珠或其他颗粒或结合至聚合酶或附接于表面的其它分子结合。该阵列可以包括在每个位点(也称为特征)的靶核酸的单拷贝,或者具有相同序列的多个拷贝可以存在于每个位点或特征。可以通过诸如桥式扩增或乳液pcr的扩增方法产生多个拷贝,如下文进一步详述的。

本文阐述的方法可以使用具有多种密度之任一的特征的阵列,包括例如至少约10个特征/cm2、100个特征/cm2、500个特征/cm2、1,000个特征/cm2、5,000个特征/cm2、10,000个特征/cm2、50,000个特征/cm2、100,000个特征/cm2、1,000,000个特征/cm2、5,000,000个特征/cm2,或更高。

本文阐述的方法的优点在于它们以并行的方式为多个靶核酸提供的快速和有效的检测。因此,本公开提供了能够使用本领域已知的技术,例如上面列举的那些技术制备和检测核酸的集成系统。因此,本公开的集成系统可以包括能够递送扩增试剂的流体组分和/或针对一个或多个固定化的dna片段的测序试剂,所述系统包含如泵,阀,储器,流体管线等部件。流动池可以在用于检测靶核酸的集成系统中配置和/或使用。示例性的流动池例如描述于美国专利公开号2010/0111768a1和美国专利申请号13/273,666中,每篇专利通过引用并入本文。如流动池所示例,集成系统的一个或多个流体组分可用于扩增方法和检测方法。以核酸测序实施方案为例,集成系统的一个或多个流体组分可以用于本文所述的扩增方法和用于在诸如上述例举的测序方法中递送测序试剂。或者,集成系统可以包括单独的流体系统以执行扩增方法和执行检测方法。能够创建扩增核酸并还能够测定核酸序列的集成测序系统的实例包括但不限于miseqtm平台(illumina,inc.,sandiego,ca)和描述于美国专利申请号13/273,666中的设备,其以其整体通过引用并入本文。

用于样品验证的tsca文库制备和测序

在一个实施方案中,本发明的方法使用定制扩增子(本文称为“tsca”)来制备用于随后测序和样品鉴定的靶向扩增子文库。

图1显示了使用定制扩增子来制备靶向扩增子文库和随后用于样品鉴定的测序的方法100的实例的流程图。在该实例中,使用了定制扩增子v1。方法100包括但不限于以下步骤。

在步骤110,制备了输入样品。在一个实例中,该输入样品是来自dbs样品的3mm穿孔。在一个实施方案中,将该dbs穿孔直接放置在96孔板的孔中或其他合适的反应容器(如微量离心管等)中。在一些实施方案中,所述穿孔进一步经历操作(如漂洗,浸泡,温育或摇动)以处理样品材料并将其制备用于下游文库制备步骤。例如,可以将样品放置在缓冲液中适当的时间量以允许样品材料的进一步透化和释放核酸,从而更好地接近杂交和扩增试剂。在一些实施方案中,样品是来自血液点样的穿孔。在一些实施方案中,样品包含ffpe。

在步骤115,将对靶向snp特异的上游和下游寡核苷酸的合并物与dbs样品穿孔上的基因组dna杂交。在一个实例中,寡核苷酸的组包含靶向24个身份信息性snp的上游和下游寡核苷酸。例如,将寡核苷酸合并物的等分试样和杂交缓冲液的等分试样直接添加至含有dbs样品穿孔的每个孔中。将96孔板放置在加热至约96℃的加热块上,温育约1分钟,并且然后将温度缓慢冷却至约40℃(如在约2小时内缓慢冷却)。在杂交温育结束时,从每个孔除去上清液(留下孔中的dbs穿孔)并转移至新的96孔板。

在步骤120,进行了用于文库制备的tsca方案中的标准步骤(如除去未结合的寡核苷酸、延伸/连接结合的寡核苷酸、pcr扩增延伸-连接产物等)。在一个实例中,使用过滤板(即tscav1)来进行未结合的寡核苷酸的除去。

在步骤125,合并扩增的dbs文库样品的等分试样并测序。如上所述的许多已知的测序方法中的任何一种可以用来对文库进行测序。在一些实施方案中,使用大规模平行测序(例如在miseq版本3仪器(illumina,inc.)上)对合并的文库样品测序。

在步骤130,分析了测序数据。例如,使用smith-waterman比对器(aligner)和在24个snp位置处的gatk变体调用,使用miseq报告器工具(miseqreportertool)来分析测序数据。

在另一实例中(未示出),使用包括用于除去未结合的寡核苷酸的基于珠的过程(即,tscav2)的定制扩增子方案来制备用于测序和样品鉴定的靶向扩增子文库。

为了评估图1的方法100,使用了来自10名健康供体的血液样品。所述血液样品购自clinicaltrialslaboratoryservice。收到每个样品后,通过以下来制备干燥的血液点样样品:将每个血液样品的等分试样(如约50μl至约70l)应用到单独的滤纸卡片(即,guthrie卡片)上并在卡片上干燥样品。下表2显示了用于评估图1的方法100的供体样品的列表。每个样品由cs编号指定,如cs212,cs219,cs220等。斜体的cs编号(即cs219、cs224、和cs308)是在不同时间点提供并且用作参照个体的来自相同个体(即患者idkd241283)的血液样品。所有的血液点样都小于6个月长(“血液到达日期”)。尽管样品之间的wbc计数存在不同,所有血液样品在用于白细胞计数(“wbc”计数)的“正常”范围内(如健康个体中3,000-10,000/μl)。对于一些供体血液样品,使用qiaamp试剂盒和提取方案(可获得自qiagen),也从血液样品中分离了基因组dna(在“贮存的dna”栏中用“x”表示)。将基因组dna用作文库制备和snp调用的比较对照。

*内部(inhouse)wbc计数

从每个dbs样品的3mm穿孔制备靶向扩增子文库。3mm穿孔含有约200ng的dna。作为比较,也从100ng的每个基因组dna样品(即样品cs219、cs220、cs221、cs222、cs223、cs224、和cs225)制备了靶向扩增子文库。

图2显示了使用图1的方法100从每个dbs穿孔和基因组dna样品产生的pcr扩增产物的凝胶的agilenttapestation图像200穿孔。dbs样品和基因组dna(gdna,100ng)对照样品如参考表2所述。括号指示表示pcr扩增产物的条带的位置。标记为“promega”的泳道是使用来自promega的对照dna的阳性对照。标记为“空白”的泳道是使用不含dna的滤器穿孔的阴性对照。数据显示扩增产物直接获自dbs样品。扩增产物也获自基因组dna。

图3显示了illumina序列分析查看器(sav)软件的屏幕截图300,其汇总了使用图2的合并的dbs文库样品的miseq测序运行的质量量度。在该测序运行中,3500万的读段通过滤器(每样品约150万个读段)。这在寡核苷酸组中产生每个身份snp的至少约5,000x的覆盖。

图4显示了作为图3的测序运行的索引号的函数鉴定的百分比读段(通过滤器)的图400。数据显示了合并测序文库中每个样品的均匀表现。图400上带圆圈的点是阴性对照。

使用smith-waterman比对器和gatk变体调用器(caller),在miseq报告器上分析测序数据。将在24个snp处的变体调用相对于hg19参考物评分。所述调用是纯合的参考等位基因(“ref”)、杂合的(“het”)或纯合的备选等位基因(alternativeallele)(“alt”)。比较了来自dbs样品、基因组dna(提取自血液样品)和全基因组序列(wgs)数据(若可用的话)的调用。图5显示了针对基因组dna(gdna)和dbs样品(“点样”)的7个供体样品(即cs219,cs220,cs221,cs222,cs223,cs224,和cs225)的snp调用的表500。数据显示,从血液样品提取的基因组dna制备的文库和在从干燥的血液点样样品上的相应dna制备的文库产生相同的基因型调用。

对于图5的表500所示的每个供体样品(即基因组dna和dbs样品),所有24个身份snp位置的数据倒坍(collapse)至单一度量并用于测定身份。例如,对于任何给定的供体样品对,可以在给定的snp下观察状态同一性(ibs)并确定样品的相关性。若两个或更多个个体(供体)在dna区段(例如,snp等位基因)中具有相同的核苷酸序列,则该区段根据他们中的状态是相同的。

图6a和6b分别显示了对于图5的表500中显示的供体样品,色阶和直方图600以及状态同一性(ibs)计算的图605。参照图6a,红色表示100%同一性(值=1),这意指任何给定的供体样品对的全部24个snp是相同的。色阶转换为绿色,这指示任何给定的供体样品对的50%(值=0.5)的snp是相同的。参照图6b,图605基于状态同一性比较了基因组dna(“提取的gdna”)和dbs(“血液点样”)样品中的snp。在对角线上(红框),相应的基因组dna和dbs样品中的所有24个snp是相同的,例如cs219_gdna与cs219_点样相比和cs220_gdna与cs220_点样相比等。相反,无关样品中的24个snp(例如cs219_gdna与cs220_点样相比)不相同,如以绿框指示,这意味着样品不是相同的。

图7a和7b分别显示了色阶和直方图700以及状态同一性(ibs)计算的图705,并且显示了根据snp数据鉴别表2的dbs样品的实例。色阶和直方图700如参考图6a所述。现在参考图7b,基于状态同一性,图705比较了dbs(“点样”)样品之间的snp。在对角线上(红框),匹配的dbs样品中的所有24个snp是相同的,如cs212_点样与cs212_点样比较,cs219_点样与cs219_点样比较等。在cs219_点样、cs244-点样、和cs308_点样处的虚线箭头指示不同时间采集的来自相同供体的样品。样品cs219_点样、cs244-点样和cs308_点样中的所有snp是相同的(红框),例如cs219_点样与cs308_点样相比,cs219_点样与cs244_点样相比等,并且指示了样品来自相同的个体。cs244_wgs处的实线箭头指示全基因组测序数据;该样品用于检查全基因组与tsca扩增子数据的一致性。

数据显示,图1的方法100可用于区分不同个体的样品,和用于正确识别不同时间点采集的来自相同个体的样品。

在另一实例中,可以使用tsca文库制备方案直接从ffpe样品制备靶向dna扩增子。为了演示制备靶向dna扩增子直接用于ffpe样品,使用来自乳腺肿瘤ffpe样品和胃肿瘤ffpe样品的切片(如10μm切片)。在该实例中,靶向dna组是结肠直肠癌组(illumina)。将每个乳腺肿瘤和胃肿瘤样品的切片直接放置在96孔板的孔中,并且将杂交缓冲液的等分试样和对靶向基因特异的上游和下游寡核苷酸合并物的等分试样(如,总反应体积50μl)添加到每个孔中。在杂交期和连接/延伸反应后,使用30个循环的pcr来扩增靶向dna。还从乳腺和胃ffpe样品制备了基因组dna并用作tsca扩增方案中的对照物(即,输入基因组dna=100ng)。

图8显示了合并物a中来自ffpe和基因组dna样品的pcr扩增产物的凝胶的agilenttapestation图像800,以及合并物b中来自ffpe和基因组dna样品的pcr扩增产物的agilenttapestation图像805,其中合并物a和b是靶向各自dna靶物的相反链的分开的寡聚物合并物,所述dna靶物提供两组等同数据,可用于排除通过pcr、测序或ffpe诱导的碱基修饰诱导的误差。图8中的括号指示表示pcr扩增产物的条带的位置。标记为“无dna”的泳道是阴性对照。数据显示扩增产物直接获自ffpe样品。扩增产物也获自基因组dna。

用于样品验证的多重靶向pcr扩增文库和测序

在另一实施方案中,本发明的方法使用多重靶向pcr扩增来制备用于随后测序和样品验证的基因组扩增子文库。

图9显示了使用多重靶向pcr扩增来制备靶向扩增子文库以及用于样品验证的随后测序的方法900的实例的流程图。方法900包括但不限于以下步骤。

在步骤910,制备了输入样品。在一个实例中,输入样品是来自dbs样品的3mm穿孔。将dbs穿孔直接放置在96孔板的孔中。

在步骤915,在dbs样品上进行多重靶向pcr扩增。例如,将靶向引物混合物、pcr试剂和phusion热启动ii高保真dna聚合酶(lifetechnologies)添加至其中具有dbs穿孔的每个孔中。靶向引物混合物包括针对含有索引衔接子的45个身份snp的引物对(即,来自forenseq组的45重idsnp子集(illumina,inc))。

在步骤920,合并扩增的dna并上样到用捕获探针制备的流动池上。捕获探针对于扩增的靶序列是特异性的。通过与流动池表面上的捕获探针杂交来在流动池上捕获靶向dna序列。

在步骤925,在流动池表面上克隆性扩增捕获的靶序列。

在步骤930,对扩增的dna测序。例如,在miseqv3仪器上使用2x76循环的测序来对扩增的dna测序。

在步骤935,分析了测序数据。例如,使用miseq报告器中的pcr扩增子工作流程中的burrow-wheeler比对器(bwa)来分析测序数据。

使用上面参考表2所述的血液样品来评估方法900。从每个dbs样品的3mm穿孔来制备靶向扩增子文库。3mmdbs穿孔含有约200ng的dna。也从自样品cs219、cs220、cs221、cs222、cs223、cs224、和cs225的1ng基因组dna来制备靶向扩增子文库。

图10a和10b分别显示了使用图9的方法900,从gdna产生的pcr扩增产物的凝胶的bioanalyzer图像1000和从每个dbs穿孔产生的pcr扩增产物的bioanalyzer图像1005。dbs样品和基因组dna(gdna,1ng)对照样品如上参考表2所述。括号指示表示pcr扩增产物的条带的位置。参照图10a,标记为“-ve”的泳道是不包含模板dna的阴性对照。泳道12878、12877、12884、和12885是来自platinumgenomes家族(即,父亲、母亲和2名儿童)的对照样品。在阴性对照样品中观察到一些扩增产物。数据显示,扩增产物直接获得自dbs样品。也从基因组dna获得了扩增产物。

图11显示了illumina序列分析查看器(sav)软件的屏幕截图1100,其汇总了使用图10a和10b的dbs和基因组扩增子文库的miseq序列运行的质量度量。在该测序运行中,扫描了流动池的一个表面,对于在寡核苷酸组中的每个身份snp,对于约10s–1000sx覆盖(低覆盖运行),371万个读段通过滤器。

图12显示了读段百分比(通过滤器)的图1200,所述读段百分比鉴定为图11的测序运行的索引号的函数。来自dbs样品(“点样”)的读段高于线,并且来自基因组dna样品(“gdna”)的读段低于线。dbs和基因组dna样品的读段表示的差异可能是由于样品合并和/或标准化效率较低所致。

使用miseq报告器中的pcr扩增子工作流程中的burrow-wheeler比对器(bwa)在miseq报告器上分析测序数据。

对于每个供体样品(即基因组dna和dbs样品),将所有45个身份snp位置的数据倒坍为单一度量并用于确定身份。

图13a和13b分别显示了对于用于评估图9的方法900的表2的供体样品,色阶和直方图1300和状态同一性(ibs)计算的图1305。参照图13a,红色表示100%同一性(值=1),这意指任何给定的供体样品对的全部45个snp是相同的。色阶转换为绿色,这指示任何给定的供体样品对的50%(值=0.5)的snp是相同的。参照图13b,基于状态同一性,图1305比较了基因组dna(“提取的gdna”)和dbs(“血液点样”)样品中的snp。在对角线上(红框),相应的基因组dna和dbs样品中的所有45个snp是相同的,如cs219_dna与cs219_点样相比和cs220_dna与cs220_点样相比等,这指示样品身份得以正确调用。相反,无关样品中的45个snp(如cs219_dna与cs220_点样相比)并不相同,如绿框指示,这指示样品是不同的。注意,对于cs224_dna与cs224_点样相比,该框不像其它匹配的基因组dna/dbs样品那样红,这可能是因为一些扩增子的较低测序覆盖所致。

图14a和14b分别显示了色阶和直方图1400和状态同一性(ibs)计算的图1405,并且基于snp数据显示了区分表2的dbs样品的实例。色阶和直方图1400参考图13a所述。现在参考图14b,图1405基于状态同一性比较了dbs(“点样”)和基因组dna(“dna”)样品之间的snp。在对角线上(红框),匹配的dbs样品中的所有45个snp是相同的,如cs212点样与cs212点样相比,cs219dna与cs219dna相比等。在cs219dna、cs219点样、cs244点样,和cs308点样处的虚线箭头指示不同的时间采集的来自相同供体的样品(参考样品)。参考样品cs219,cs244和cs308中的所有45个snp鉴定为相同(红框),如cs219点样与cs308点样相比,cs219dna与cs244点样相比,并且指示了样品来自相同个体。cs244dna处的实线箭头指示全基因组测序数据;该样品用于检查全基因组与pcr扩增子数据的一致性。

数据显示,图9的方法900可用于区分不同个体的样品并用于正确鉴定在不同时间点采集的来自相同个体的样品。

高分辨率样品区分

在另一实施方案中,本发明的方法用于区分来自密切相关个体的样品。在一个实例中,密切相关个体是兄弟姐妹。在另一实例中,密切相关个体是三口之家,其中例如父母和至少一名儿童患有疾病或病症。

为了评估本发明方法在高分辨率样品区分中的功效,使用了来自platinumgenomes家族的一组样品。platinumgenomes是高置信(confidence)、“白金”质量参考变体调用组,其通过使用无pcr样品制备物对大家族进行高深度测序而产生,以最大化变体调用灵感性,这如eberleetal.(2016)biorxivdoi:10.1101/055541所述,其通过引用以其整体并入本文。使用图1的方法100和24个身份snp组来进行样品区分。

图15显示了platinumgenomes家族的家族树图1500。箭头指示了基因组dna用于评估的家族个体(即,父亲、母亲、4名女童,和5名男童)。

图16a和16b分别显示了色阶和直方图1600以及状态同一性(ibs)计算的图1605,并且显示了基于snp数据的高分辨率基因组dna样品区分的实例。基因组dna样品如参照图15所述。参照图16a,红色指示100%同一性(值=1),这意指任何给定的供体样品对的全部24个snp是相同的。色阶转换为绿色,这指示任何给定的供体样品对的50%(值=0.5)的snp是相同的。现在参照图16b,图1605基于状态同一性比较了基因组样品间的snp。在对角线上(红框),匹配的基因组样品中的所有24个snp是相同的,如na12877与na12877相比,na12878与na12878相比等。数据显示,图1的方法100可用于区分来自密切相关个体的样品。

在整个申请中已经引用了各种出版物,专利和/或专利申请。这些出版物的公开内容在此通过引用并入本申请中。

术语“包含”在本文中意图是开放式的,不仅包括所列举的要素,还包括任何附加要素。本说明书和于2015年7月6日提交的美国临时专利申请号61/189,063的并入的材料中阐述了许多实施方案。然而,应当理解,可以进行各种修改。因此,其他实施方案在所附权利要求书的范围内。

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1