用于多重pcr的方法和组合物的制作方法

文档序号:511793阅读:1186来源:国知局
用于多重pcr 的方法和组合物的制作方法
【专利摘要】本发明提供了用于确定存在于样品中的一个或多个核酸的拷贝数变异的方法、组合物、试剂盒、系统和装置。在一些实施方式中,本方法包括允许选择性扩增样品中的一个或多个靶核酸的多种靶标特异性引物。在另一个方面,本发明涉及就样品中的核酸的基因或染色体的代表情况确定拷贝数变异。在一些实施方式中,使用公开的方法、试剂盒、系统和装置确定样品中的不同靶核酸的拷贝数变异的方法可用于多种下游过程,包括针对、预测性治疗方案或其它治疗目的。
【专利说明】用于多重PCR的方法和组合物
[0001] 相关申请的交叉参考
[0002] 本申请是2012年9月14日提交的美国非临时申请号13/618,805的部分继续申 请,也是2012年9月14日提交的美国非临时申请号13/619, 815的部分继续申请,也是2012 年9月14日提交的美国非临时申请号13/619, 178的部分继续申请,其为2012年4月27 日提交的国际申请号PCT/US2012/035612的继续申请,也是2012年4月27日提交的美国 非临时申请号13/458, 739的继续申请,其在35U. S. C. § 119(e)下要求2011年4月28日 提交的美国临时申请号61/479, 952、2011年9月6日提交的美国临时申请号61/531,583、 2011年9月6日提交的美国临时申请号61/531,574、2011年9月22日提交的美国临时申请 号61/538, 079、2011年11月29日提交的美国临时申请号61/564, 763、2011年12月20日 提交的美国临时申请号61/578, 192、2012年2月2日提交的美国临时申请号61/594, 160、 2012年2月14日提交的美国临时申请号61/598, 88U2012年2月14日提交的美国临时 申请号61/598, 892、2012年4月17日提交的美国临时申请号61/625, 596和2012年4月 26日提交的标题为"用于多重PCR的方法和组合物"的美国临时申请号61/639, 017的优先 权,将所述美国临时申请的公开内容通过引用整体并入本文。
[0003] 序列表
[0004] 本申请在此通过引用并入随同提交的电子序列表的材料。将电子序列表的材料作 为2012年4月25日创建的标题为"2012_04_25LT00503US_ST25. txt"的文本(.txt)文件 提交,其具有18943KB的文件大小,并且在本文中通过引用整体并入本文。

【技术领域】
[0005] 在一些实施方案中,本公开内容总地来说涉及用于确定包含多个靶序列的样品内 的拷贝数变异(copy number variation)的方法、组合物、系统、装置和试剂盒。任选地,在 单个扩增反应中扩增多个靶序列,例如至少10、50、100、500、1000、2500、5000、7500、10000、 25000、50000或100000个靶序列。在一些实施方案中,本公开内容总地来说涉及用于从一 个或多个来源例如基因组DNA和/或福尔马林固定的石蜡包埋的(FFPE) DNA确定拷贝数变 异的方法、组合物、系统、装置和试剂盒。具体地,公开了用于使用靶标特异性引物来评价染 色体丢失、染色体重复、和/或基因重复的方法、试剂盒、系统、装置和组合物。在一些实施 方案中,本公开内容总地来说涉及用于从新(de novo)评价样品内的拷贝数变异的方法、组 合物、系统、装置和试剂盒。
[0006] 背景
[0007] 几个生物学应用牵涉选择性扩增群体内的核酸分子。例如,下一代测序法可涉及 分析一大群核酸分子内的选择的靶。对于这样的应用,增加可在单个扩增反应内从群体选 择性扩增的靶的总数将是有用的。这样的选择性扩增通常通过使用一个或多个能选择性与 特定靶核酸分子杂交或选择性促进其扩增的引物来实现。这样的选择性扩增可因扩增假象 例如引物二聚体等的形成而复杂化。这样的扩增假象(在本文中也称为非特异性扩增产 物)的形成可消耗关键扩增试剂例如核苷酸、聚合酶、引物等。此外,此类假象相对于期望 的产物通常可具有更短的长度,在该情况下可比期望的产物更高效地扩增并且占据反应输 出的主体。选择性扩增还可因"超级扩增子"的形成即延长的扩增子的形成而复杂化,当第 一引物的延伸延伸通过相邻靶核酸序列时,这会发生,从而产生长的非特异性扩增产物,其 可用作利用第二引物进行延伸的模板。此类假象在扩增反应中的形成,即使当仅使用单对 引物时,亦可使下游应用例如qPCR、克隆、基因表达分析和下一代测序的样品制备复杂化。 在一些下游应用(包括几个下一代测序方法)中,该问题可被实施第二扩增步骤的需要复 杂化,因为在第二扩增过程中假象可被进一步放大。例如,下游测序应用可涉及使用乳液 PCR( "emPCR")产生克隆地扩增的核酸群体(所述核酸群体被单个地连接至单独的支持载 体例如珠粒)和通过阳性选择进行的克隆的扩增子的富集。在这样的应用中,假象可在从 文库产生过程至emPCR阶段一直存在,产生包含非特异性扩增产物的DNA捕获珠粒。这些 含假象珠粒可在使用含模板的珠粒富集过程中被选择但在遗传上是无信息的。
[0008] 可将多重PCR反应中扩增的核酸分子用于许多需要或不需要进一步纯化或操作 的下游分析或测定。例如,当以充足的产率获得时,多重PCR反应的产物(扩增子)可用于 单核苷酸多态性(SNP)分析、基因分型、拷贝数变异分析、表观遗传学分析、基因表达分析、 杂交测定、基因突变(包括但不限于缺失)的分析、疾病状态的预后和/或诊断、罕见或低 频率等位基因突变的检测和分析、核酸测序(包括但不限于从头测序或靶向再测序)等。
[0009] 不例性下一代测序系统包括Ion Torrent PGM?测序仪(Life Technologies)和 Ion Torrent Proton?测序仪(Life Technologies),所述测序系统是基于离子的测序系统, 其通过检测作为核苷酸掺入的副产品产生的离子来测定核酸模板的序列。通常地,氢离子 作为在利用聚合酶的模板依赖性核酸合成过程中发生的核苷酸掺入的副产品释放。Ion Torrent PGM?测序仪和Ion Proton?测序仪通过检测核苷酸掺入的氢离子副产品来检测核 苷酸惨入。Ion Torrent PGM?测序仪和Ion Torrent Proton?测序仪包括多个待测序的核 酸模板,每一个模板被置于阵列的各个测序反应孔内。阵列的孔各自被偶联至至少一个可 检测作为核苷酸掺入的副产品产生的离子的释放或溶液pH的变化的离子传感器。离子 传感器包括偶联至可感知H+离子的存在或溶液pH的变化的离子敏感性检测层的场效应晶 体管(FET)。离子传感器提供表征核苷酸掺入的输出信号,所述信号可表示为电压变化值, 其辐度与各孔或反应室中的H+离子浓度相关。不同的核苷酸类型连续流入反应室,并且被 聚合酶按照由模板序列决定的顺序掺入正在延伸的引物(或聚合位点)。每一个核苷酸掺 入伴随着H+离子在反应孔中的释放,连同局部pH的伴随变化。H+离子的释放被传感器的 FET记录,这产生了表征核苷酸掺入发生的信号。在特定核苷酸流动过程中未被掺入的核 苷酸将不产生信号。来自FET的信号的大小还可与掺入正在延伸的核酸分子的特定类型 的核苷酸的数目相关,从而允许分辨同聚物区域。因此,在测序仪运行过程中,至反应室中 的多个核苷酸流动连同跨多个孔或反应室的掺入监控允许仪器同时分辨许多核酸模板的 序列。关于Ion Torrent PGM?测序仪的组成、设计和操作的更详细内容可见于例如美国专 利申请系列号12/002781,现公布为美国专利申请号2009/0026082 ;美国专利申请系列号 12/474897,现公布为美国专利公布号2010/0137143 ;和美国专利申请系列号12/492844, 现公布为美国专利公布号2010/0282617,将所述申请全部通过引用整体并入本文。在一些 实施方案中,扩增子可经操作或通过桥式扩增或emPCR被扩增来产生多个适合用于多种下 游过程(包括核酸测序)的克隆模板。在一个实施方案中,可使用本文中概述的靶特异性扩 增技术的一个或多个技术从核酸分子的群体制备待使用Ion Torrent PGM?或Ion Torrent Proton?系统测序的核酸模板。任选地,在靶特异性扩增后,可进行第二和/或第三扩增过 程,包括但不限于文库扩增步骤和/或克隆扩增步骤例如emPCR。
[0010] 随着样品核酸群体内期望被扩增的核酸靶数目增加,选择性扩增这些靶同时避免 不期望的扩增假象形成的挑战会相应地增加。例如,假象(包括引物二聚体和超级扩增子) 的形成在多重PCR反应(其中将用于多个靶的PCR引物对组合在单个反应管中并且共扩 增)中可能是个更大的问题。在多重PCR中,额外的引物对以相对于模板DNA升高的浓度 存在更可能产生引物间相互作用,以及引物二聚体和其它假象的形成。
[0011] 用于在核酸扩增过程中避免或减少假象例如引物二聚体的形成的当前方法 专注于引物设计过程,并且通常使用专门的软件包(例如,DNAsoftwares的Visual 0ΜΡ, MultiPLX, ABI的Primer Express等)来设计引物对,所述引物对经预测在扩增过程中 显示最小的与池中其它引物的相互作用。通过使用这样的软件,可将引物尽可能设计为靶 特异性的或扩增子特异性的,并且引物通常被分组为子集以使引物间相互作用、引物二聚 体形成和超级扩增子减少至最低程度。然而,严格的设计参数限制了可被同时共扩增的扩 增子的数目,并且在一些情况下可阻止一些扩增子一起扩增。其它目前的方法需要使用多 个PCR引物池来将引物分离至非重叠池中以在扩增步骤中使引物假象减少至最少或阻止 引物假象形成。其它方法包括使用多个引物池或单重反应来增加每反应扩增产物的总体产 率。在多重PCR反应中,每一个引物对在扩增反应中与另外的引物对竞争有限量的dNTP、 聚合酶和其它试剂。因此存在对改进的方法、组合物、系统、装置和试剂盒的需要,以允许选 择性扩增一群核酸分子内的多个靶核酸分子,同时避免假象(也称为非特异性扩增产物) (包括引物二聚体)的形成或使其减少至最低程度。还存在对改进的方法、组合物、系统、 装置和试剂盒的需要,其允许选择性扩增来自单个核酸样品例如基因组DNA和/或福尔马 林固定的石蜡包埋的(FFPE)DNA的多个靶核酸分子,同时避免假象的形成或使其减少至最 低程度。本领域还存在对改进的方法、组合物、系统和试剂盒的需要,以允许在单个反应中 同时扩增数千个靶特异性核酸分子,可用于任何适用的下游测定或分析。还需要能够评价 核酸样品中的拷贝数变异的改进的方法、组合物、系统、装置和试剂盒,特别是用于从新评 价拷贝数变异的改进的方法。还需要在基因水平或染色体水平上确定来自样品例如基因组 DNA和/或福尔马林固定的石蜡包埋的(FFPE)DNA的拷贝数变异的改进的方法、组合物、系 统、装置和试剂盒,同时避免假象的形成或使其减少至最低程度。本领域还需要能够同时确 定来自多个样品(包括正常或疾病样品)的拷贝数变异的改进的方法、组合物、系统和试剂 盒。
[0012] 除非另有所指,否则本发明主题的实践可使用有机化学、分子生物学(包括重组 技术)、细胞生物学和生物化学的常规技术和说明,这在本领域技术人员的能力之内。这 样的常规技术包括但不限于合成多核苷酸的制备、聚合技术、聚合物颗粒的化学和物理分 析、核酸文库的制备、核酸测序和分析等。可参考本文中提供的实施例使用适当技术的具 体举例说明。还可使用其它等同的常规方法。这样的常规技术和说明可见于标准实验 室手册例如 Genome Analysis:A Laboratory Manual Series (第 I-IV 卷),PCR Primer:A Laboratory Manual, and Molecular Cloning:A Laboratory Manual (全部来自 Cold Spring Harbor Laboratory Press), Hermanson, Bioconjugate Techniques,第二版(Academic Press,2008) ;Merkus, Particle Size Measurements(Springer, 2009) ;Rubinstein 和 Colby, Polymer Physics (Oxford University Press, 2003)等。
[0013] 除非另有所指,否则本文中使用的全部技术和科学术语具有与这些发明所属的领 域内的技术人员通常理解的含义相同的含义。本文(上文和下文)中提及的所有专利、专 利申请、公布的申请、论文和其它出版物通过引用整体并入本文。如果本文中所示的定义和 /或说明与本文中通过引用并入的专利、专利申请、公布的申请和其它出版物中所示的任何 定义矛盾或不一致,则以本文中所示的定义和/或说明而非通过引用并入的定义为准。
[0014] 如本文中所述,术语"包含"、"包括"、"具有"或其任何其它变型意欲包括非排除性 包含。例如,包括一系列特性的过程、方法、物品或装置不一定仅受那些特性限制,而是还可 包括未明确列出的或这类过程、方法、物品或装置所固有的其它性质。此外,除非明确地指 出是相反的,否则"或"是指包含在内的或而非排除性的或。例如,下列方面的任一方面都 满足条件"A或B":A是真的(或存在)并且B是假的(或不存在),A是假的(或不存在) 并且B是真的(或不存在),以及A和B都是真的(或存在)。
[0015] 附图概述
[0016] 被包括并且形成本说明书的一部分的附图举例说明了一个或多个示例性实施方 案并且用于解释不同示例性实施方案的原理。附图仅仅是示例性和解释性的并且不被稀释 为以任何方式限定和限制。
[0017] 图1A-图1E2是概述利用根据本公开内容的可降解扩增引物的方法的示例性实施 方案的图示。
[0018] 图2是概述获得根据本公开内容的靶特异性扩增子文库的方法的示例性实施方 案的图示。
[0019] 图3A-图3B显示示例性未修饰和修饰引物池的洗脱图谱的实例。图3A显示当使 用示例组的标准多重引物时引物二聚体的显著性和优势产生。图3B显示当使用示例组的 修饰的多重引物(如由本申请例举的)时引物二聚体的减少和预期的扩增子产物(104bp) 的总体增加。
[0020] 图4A-图4H显示示例性94重和示例性380重反应中增加扩增子GC含量的作用。
[0021] 图5显示使用引物组HSMvl2对基因组DNA进行的示例性多重反应的丰度和重现 性的定量。将数据对在Ion Torrent PGM?测序仪(Life Technologies)上进行的3个个别 运行进行平均。每扩增子覆盖度的水平提供为计数的对数。
[0022] 图 6A-6B 显不当使用 Ion Torrent PGM? 测序仪(Life Technologies)分析时,对 基因组DNA进行的示例性多重反应的丰度和重现性的定量。数据显示对于引物池中的正向 (图6A)和反向引物(图6B)每扩增子读取数目。
[0023] 图7显不在Ion Torrent PGM?测序仪(Life Technologies)上进行的7个个别运 行的对基因组DNA进行的示例性384重反应的丰度和重现性的定量。每扩增子读取的平均 数目为400。
[0024] 图8显不在Ion Torrent PGM?测序仪(Life Technologies)上进行的7个个别运 行的对基因组DNA的示例性411重PCR的丰度和重现性的定量。每扩增子的读取的平均数 目为400。
[0025] 图9显示在根据示例性实施方案对FFPE样品进行多重PCR和文库扩增后,显现示 例性扩增产物(泳道2和4)的琼脂糖凝胶电泳的图像。
[0026] 图10显不在使用Ion Torrent PGM?测序仪(Life Technologies)获得的不例性 384重PCR中从FFPEDNA样品(10ng)获得的数据的丰度和重现性的定量。每扩增子的读 取的平均数目为400。
[0027] 图11A-11B显示在示例性94重反应后从FFPE DNA样品(10ng)获得的数据的丰度 和重现性的定量。数据显示对于引物池中正向引物(图11A)和反向引物(图11B)每扩增 读取的数目。
[0028] 图I2显不:通过在Ion Torrent PGM?测序仪(Life Technologies)上进行对照 DNA的多重PCR和文库扩增以及测序获得的KRAS基因的密码子12和密码子13的突变的检 测。
[0029] 图13(第1部分)_图13(第3部分)显示当使用根据本公开内容的示例性修饰 多重引物和示例性文库扩增法时,鉴定样品中的囊性纤维化(CFTR)基因的6个突变的测序 比对数据。
[0030] 图14显示对于几个包含已知拷贝数变异的DNA样品中的CLTCL1基因的区域获得 的12个不同扩增子的频率。按照本公开内容的示例性实施方案获得扩增子。
[0031] 图15显示对于几个包含已知拷贝数变异的DNA样品中的IKZF1基因的区域获得 的4个不同扩增子的频率。按照本公开内容的多重PCR法的示例性实施方案获得扩增子。
[0032] 图17举例说明用于根据示例性实施方案设计引物或测定的系统。
[0033] 图18举例说明用于根据示例性实施方案设计引物或测定的系统。
[0034] 图19举例说明包括被根据示例性实施方案设计的一对引物包围的插入序列的扩 增子序列。
[0035] 图20举例说明包括被根据示例性实施方案的设计的一对引物包围的插入物的扩 增子序列(其在本文中可称为"tile")的PCR扩增。
[0036] 图21 (第1部分)_图21 (第3部分)举例说明用于给定的靶区域的一组候选扩 增子,每一个包括被一对引物包围的插入物,用于根据示例性实施方案的拼接(tiling)和 汇合。
[0037] 图22举例说明根据示例性实施方案的方法。
[0038] 图23举例说明用于根据示例性实施方案拼接一个或多个给定的靶的多个扩增子 的方法。
[0039] 图24举例说明用于根据示例性实施方案确定一个或多个给定的靶和候选扩增子 的拼接的方法。
[0040] 图25A举例说明一组用于覆盖给定的靶区域的候选扩增子,每一个扩增子包括被 一对引物包围的插入物,用于根据示例性实施方案的拼接和混合。
[0041] 图25B举例说明根据示例性实施方案用于产生图的一组顶点(vertices)。
[0042] 图26A举例说明图25A的15个候选扩增子,除3个在它们的插入物与靶区域的起 始点之间具有至少一些重叠的"初始"扩增子被突出显示外。
[0043] 图26B举例说明源顶点通过边缘与对应于图25A的初始扩增子的3个顶点的连 接。
[0044] 图27A举例说明图25A的15个候选扩增子,除在它们的插入物与靶区域的末端之 间具有至少一些重叠的3个"末端"扩增子被突出显示外。
[0045] 图27B举例说明汇点(sink)顶点通过边缘至对应于图26A的末端扩增子的3个 顶点的连接。
[0046] 图28A举例说明图25A的15个候选扩增子,除各种用于建立内边缘的扩增子被突 出显示外。
[0047] 图28B举例说明根据示例性实施方案的一些扩增子插入物顶点至随后的适当的 重叠的连接。
[0048] 图29A举例说明根据示例性实施方案的另外的扩增子插入物顶点至随后的适当 的重叠的连接。
[0049] 图29B举例说明图25A的15个候选扩增子,以及根据示例性实施方案的图29A显 不的缺口的基础。
[0050] 图30A举例说明可从源至汇点用于在根据示例性实施方案的实例中拼接靶的3个 可能的另外的边缘。
[0051] 图30B举例说明根据示例性实施方案将成本分配至图的连接扩增子顶点的边缘 的每一个的边缘成本函数的示例性定义。
[0052] 图30C举例说明根据示例性实施方案的图30B的实例中从源至汇点的最低成本通 路。
[0053] 图31举例说明图25A的15个候选扩增子,除突出显示对应于形成图30C中显示 的最低成本通路的顶点的5个扩增子外。
[0054] 图32举例说明按照示例性实施方案分配至第一池的3个扩增子和分配至第二池 的2个扩增子。
[0055] 图33A举例说明根据示例性实施方案的扩增子之间的最短距离。
[0056] 图33B-D举例说明几个问题,包括引物"竞态条件"、子扩增子的优先扩增和可通 过使用图33A中举例说明的最短距离来减少的超级扩增子。
[0057] 图34举例说明用于根据示例性实施方案将多个池的扩增子汇合的方法。
[0058] 图35举例说明根据示例性实施方案的方法。
[0059] 图 36A 显不了使用 Comprehensive Cancer Panel?(Life Technologies, CA)在跨 基因组的染色体位置上作图的一式两份正常DNA样品的log2比率的代表性数据。
[0060] 图 36B 显不了使用 Comprehensive Cancer Panel?(Life Technologies, CA)在跨 基因组的染色体位置上作图的一式两份肿瘤DNA样品的log2比率的代表性数据。
[0061] 图 36C 显不了使用 Comprehensive Cancer Panel?(Life Technologies, CA)在跨 基因组的染色体位置上作图的正常DNA样品和肿瘤DNA样品的log2比率的代表性数据。
[0062] 图 36D 显不了使用 Comprehensive Cancer Panel?(Life Technologies, CA)在跨 基因组的染色体位置上作图的正常DNA样品和肿瘤DNA样品的log2比率的代表性数据。
[0063] 图 37A 显不了使用 Comprehensive Cancer Panel?(Life Technologies, CA)在跨 基因组的染色体位置上作图的两个三体性DNA样品(X0 DNA样品和XXY DNA样品)的log2 比率的代表性数据。
[0064] 图 37B 显不了使用 Comprehensive Cancer Panel? (LifeTechnologies, CA)在跨基 因组的染色体位置上作图的两个三体性DNA样品(X0 DNA样品和XXXXY DNA样品)的log2 比率的代表性数据。
[0065] 图 38A 显不了使用 Comprehensive Cancer Panel?(Life Technologies, CA)在跨 基因组的染色体位置上作图的三体性21DNA样品(儿子)和正常(母方)DNA样品的log2 比率的代表性数据。
[0066] 图38B是来自图38A的代表性数据的展开图,聚焦于染色体21和性染色体。
[0067] 图38C是来自图38A的代表性数据的展开图,聚焦于染色体2。
[0068] 图39A显示了来自结肠 DNA FFPE样品的染色体17内的扩增子的过度代表的代表 性数据。
[0069] 图39B显示了来自结肠 DNA FFPE样品的染色体17内的来自图39A的代表性数据 的图示。
[0070] 图40A和图40B显示了使用本文公开的确定拷贝数变异的方法获得的跨域NUP98 基因的18个扩增子的频率。图40A显示:相对于预期的扩增子频率,发现1个样品具有2 倍的扩增子代表。图40B提供了跨NUP98基因的相对于来自其它扩增子的数据的过度代表 的扩增子的盒式图。
[0071] 概述
[0072] 在一些实施方式中,本公开内容总地来说涉及确定一个或多个样品的拷贝数变异 的方法。在一些实施方式中,本方法包括确定存在于样品中的一个或多个基因的拷贝数变 异。在一些实施方式中,本方法包括通过确定基因丢失和/或基因重复来确定一个或多个 基因的拷贝数变异。在一些实施方式中,本方法包括确定存在于样品中的一个或多个染色 体的拷贝数变异。在一些实施方式中,本方法包括确定相同样品中的一个或多个基因的拷 贝数变异和一个或多个染色体的拷贝数变异。在一些实施方式中,确定拷贝数变异的方法 可包括鉴定一个或多个样品中的染色体丢失、染色体插入和/或染色体重复。在一些实施 方式中,拷贝数变异包括确定样品中非整倍性的存在。在一些实施方式中,拷贝数变异包括 鉴定样品的杂合性的丢失。在一些实施方式中,确定拷贝数变异的方法可以包括同时确定 一个或多个样品的拷贝数变异。在一些实施方式中,本方法包括使用基于ISFET的测序方 法确定一个或多个样品的拷贝数变异。在一些实施方式中,本方法包括同时确定一个或多 个样品中的一个或多个染色体的染色体丢失、染色体插入和/或染色体重复。
[0073] 在一些实施方式中,确定拷贝数变异的方法包括通过下列步骤扩增样品中的多个 不同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个不同的 靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物 中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待 扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶序列切 割所述可切割基团;通过将至少一个接头连接至至少一个扩增的靶序列产生一个或多个接 头连接的扩增的靶序列;使用引物再扩增所述至少一个接头连接的扩增的靶序列;对至少 一个扩增的接头连接的靶序列进行测序;计算所述至少一个扩增的接头连接的靶序列的测 序读取(sequencing read)的数目;和确定所述至少一个扩增的接头连接的祀序列的拷贝 数变异。
[0074] 在一些实施方式中,本方法包括通过下列步骤扩增两个或更多个样品中的多个不 同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个不同的靶 序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物中 的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待扩 增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶序列切割 所述可切割基团;通过将至少一个不同的条码接头连接至来自每个样品的至少一个扩增的 靶序列产生一个或多个条码接头连接的扩增的靶序列;使用引物再扩增来自每个样品的所 述至少一个条码接头连接的扩增的靶序列;对来自每个样品的至少一个扩增的接头连接的 扩增的靶序列进行测序;计算来自每个样品的所述至少一个扩增的接头连接的靶序列的测 序读取的数目;和确定每个样品的所述至少一个扩增的接头连接的靶序列的拷贝数变异。
[0075] 在一些实施方式中,确定染色体拷贝数变异的方法包括通过下列步骤扩增样品中 的多个不同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个 不同的靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异 性引物中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括 对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶 序列切割所述可切割基团;通过将至少一个接头连接至至少一个扩增的靶序列产生一个或 多个接头连接的扩增的靶序列;使用引物再扩增所述至少一个接头连接的扩增的靶序列; 对至少一个扩增的接头连接的靶序列进行测序;计算所述至少一个扩增的接头连接的靶序 列的测序读取的数目;和确定所述至少一个扩增的接头连接的靶序列的染色体拷贝数变 异。
[0076] 在一些实施方式中,计算一个或多个扩增的接头连接的靶序列的测序读取的数 目可以包括本领域普通技术人员已知的任何方法。通常而言,每个扩增的接头连接的靶 序列的测序读取的数目被报告为:每个扩增的接头连接的靶序列的总的映射的测序读取 的数目。在一些实施方式中,本方法可包括计算测序运行中的每个扩增的接头连接的靶 序列的测序读取的数目。在一些实施方式中,本方法可包括计算一组选择的扩增的接头 连接的靶序列的测序读取的数目,例如与特异性基因组坐标或基因相关的映射的测序读 取的数目。在一些实施方式中,本方法可包括计算来自一个或多个样品的一个或多个扩 增的接头连接的靶序列的测序读取的数目,例如配对的遗传样品;来自不同来源的样品, 例如水来源和食品来源;或来自不同个体或动物的样品,例如亲代样品和子代样品。通常 而言,样品包含足够的遗传材料,以进行所述一个或多个不同靶序列的扩增。在一些实施 方式中,所述样品可包括单个细胞,从单个细胞提取的DNA,或分离自循环的肿瘤细胞的 DNA。例如,根结本文的方法,可以在测定例如Ion Torrent Hotspot Mutation Panel?(Life Technologies, CA, Catalog No. 4471262), the Comprehensive Cancer Panel?(Life Technologies, CA, Catalog No. 4477685), or the Inherited Disease Panel(Life Technologies, CA, Catalog No. 447686)中使用基因组DNA或福尔马林固定的石錯包埋的 (FFPE)DNA,在进行了扩增和接头连接步骤之后,在测序平台例如Ion Torrent Proton?或 PGM? platform (Life Technologies, CA, Catalog No. 4462917)上对文库进行测序。然而,在 本文公开的方法中可以使用任何能够计算每个扩增子的映射的读取数目的测序平台。
[0077] 测序平台的数据输出可以任选地以这样的方式来过滤以使操作者能够选择一个 或多个扩增的接头连接的靶序列来进行拷贝数测定。在一些实施方式中,测序平台的数 据输出可以任选地被过滤以选择一个或多个扩增的接头连接的靶序列以进行拷贝数测 定,这通过计算每个选择的扩增的接头连接的靶序列的测序读取的数目来进行。在一些 实施方式中,跨多个样品提供选择的扩增的接头连接的靶序列的测序读取的数目,例如 通过使用多个条码化的文库。在一些实施方式中,选择的扩增的接头连接的靶序列与一 个或多个目标基因相关。在其它实施方式中,测序平台的数据输出可以任选地被过滤以 计算与已知的病症或疾病相关的一个或多个扩增的接头连接的靶序列的测序读取的数 目。在一些实施方式中,测序平台的数据输出可以被过滤以计算与癌症或遗传疾病相关 的基因的测序读取的数目,例如通过使用Ion Ampliseq? Inherited Disease Panel (Life Technologies, CA, Catalog No. 4477686)或 Ion Ampliseq? Comprehensive Cancer Panel (Life Technologies, CA, Catalog No. 4477685)和 Ion Torrent Suite 软件。在一些 实施方式中,输出可以任选地被配置为计算跨基因组的一个或多个扩增的接头连接的靶序 列(通过例如染色体坐标或基因坐标作图的)的测序读取的数目。
[0078] 在一些实施方式中,本公开内容的扩增的接头连接的靶序列对应于与一个或多个 基因或染色体相关的扩增子。在一些实施方式中,为每个目标基因或染色体制备多个扩增 子。在一些实施方式中,扩增子跨基因的编码区和/或UTR区。在一些实施方式中,扩增的 接头连接的靶序列被设计为沿着基因或遍及基因的长度在交错的或常规相间的间隔发生。 在一些实施方式中,扩增的接头连接的靶序列被设计为跨基因组的每个染色体的间隔发 生。在一些实施方式中,扩增的接头连接的靶序列被设计为与相同样品中的另一个扩增的 接头连接的靶序列不重叠。在一些实施方式中,扩增的接头连接的靶序列被设计为扩增与 肿瘤相关的基因。用于本公开的方法的祀标特异性引物的实例包括来自Hotspot Mutation Panel?, Inherited Disease Panel? 和 Comprehensive Cancer Panel? 的引物库,都可从 Life Technologies, CA 商购获得。
[0079] 在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括: 确定扩增的接头连接的靶序列的总的映射的测序读取的数目。在一些实施方式中,计算扩 增的接头连接的靶序列的测序读取的数目可以包括:确定相对于同一个测序运行中获得的 总的映射的测序读取的数目,扩增的接头连接的靶序列的总的映射的测序读取的数目。在 一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:将扩增的接 头连接的靶序列的总的映射的测序读取除以测序运行中获得的总的映射的测序读取,乘以 100,以获得"百分率频率"。例如,相对于单一测序运行中等于100的总的映射测序读取(包 括扩增子A、B、C、D和E),单个扩增的接头连接的靶序列的等于1的总的映射的测序读取 (扩增子A)将对应于1%的频率。在一些实施方式中,计算扩增的接头连接的靶序列的测 序读取的数目可以包括:确定在指定阈值之上的对于扩增的接头连接的靶序列获得的测序 读取的数目。在一些情况下,所述阈值可以包括人工阈值,例如大于40个总的映射的读取 /扩增的接头连接的靶序列,或大于〇. 5百分率频率。
[0080] 在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括: 一个样品中的扩增的接头连接的靶序列的总的映射的测序读取的数目除以第二样品中的 相同的扩增的接头连接的靶序列的总的映射的测序读取的数目,以产生"百分率比率"。
[0081] 在一些实施方式中,样品之一是参考样品,其不含拷贝数变异(即,是正常DNA样 品)。在一些实施方式中,样品之一是参考样品,其不含基因或染色体拷贝数变异。在一些 实施方式中,第二样品是目标样品,其基因拷贝数变异或染色体拷贝数变异是待确定的。在 一些实施方式中,每个样品可以是目标样品,其基因拷贝数变异或染色体拷贝数变异是待 测的(在不存在参考样品的情况下)。例如,已知基因 ERBB2在一些形式的结肠癌中是高 度重复的。含有高水平的ERBB2重复的样品可以使用本文的方法被鉴定为具有拷贝数变异 (见图39A和图39B)。在该情况下,发现位于ERBB2内的几个扩增的接头连接的靶序列的总 的映射的测序读取的数目相对于同一测序运行中位于ERBB2邻近位置的其它基因显著较 高(高20倍)。因此,无需参考样品,操作者能够直接从测序输出确定哪些扩增的接头连接 的靶序列显著升高(或降低)。在一些实施方式中,本公开内容的用于确定样品中一个或多 个核酸的拷贝数变异的方法可用于鉴定含有拷贝数变异的样品中的核酸。在一些实施方式 中,选择性鉴定那些含有拷贝数变异的核酸在遗传疾病分析和治疗中是特别有用的。使用 上述选择性方法,操作者能够鉴定特定基因的拷贝数变异或大的基因组重复或缺失的拷贝 数变异,其通常表征为致病性突变。检测这些拷贝数变异可用于治疗或预后目的。例如,含 有部分缺失的基因相对于全长基因可能对于某些药物敏感。肿瘤通常含有缺失或重复的一 个或多个外显子,本文公开的用于确定拷贝数变异的方法可以与预后治疗性目的偶联。在 一些实施方式中,本文公开的方法可用于监控样品中拷贝数变异的时间进程。例如,可以监 控具有发生结肠癌风险的个体在几年的时间内的拷贝数变异(他们的DNA中的),如果观察 到拷贝数变异的变化,并且则该拷贝数变异与结肠癌中发现的基因过度代表或基因代表不 足相关,则肿瘤学家可能希望考虑与进行拷贝数变异测试的个体的结肠癌谱匹配的治疗方 案。
[0082] 在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目还可以包 括:确定一个或多个扩增的接头连接的靶序列的百分率比率的以2为底的对数比率。一般 地,为了确定扩增的接头连接的靶序列的以2为底的对数比率,将第一样品中的扩增的接 头连接的靶序列的映射的测序读取的总数目与第二样品中相同的扩增的接头连接的靶序 列的映射的测序读取的总数目进行比较,以获得百分率比率。然后使用已经确定的百分率 比率计算每个扩增的接头连接的靶序列的以2为底的对数比率(log 2比率)。例如,将来自 样品1的扩增的接头连接的靶序列(扩增子A)的映射的测序读取的总数目与来自不同样 品(样品2)的相同的扩增的接头连接的靶序列(扩增子A)的映射的测序读取的总数目进 行比较以计算百分率比率。然后使用每个扩增的接头连接的靶序列的百分率比率计算以2 为底的对数。在一些实施方式中,可以将l〇g 2比率跨一个或多个基因、跨染色体和/或跨 基因组作图。在该实施方式中,每个l〇g2比率对应于每个扩增的接头连接的靶序列相对于 来自另一个样品的对应的扩增的接头连接的靶序列的标准化。当比较肿瘤样品的测序数 据与匹配的正常组织样品的测序数据时,或者当比较遗传上相关个体例如祖父母、父母和/ 或子女时,或者当比较来自不同细胞系的细胞时,l〇g 2比率的图是特别有用的可视化工具, 因为它提供了容易的可视形式,通过它鉴定无关项,因此,鉴定哪些扩增的接头连接的靶序 列在目标样品中是过度代表的或代表不足的。
[0083] 在一些实施方式中,百分率频率可用于确定目标样品中一个或多个基因和/或染 色体的拷贝数变异。例如,一旦计算了百分率频率,其可用于确定任意扩增的接头连接的靶 序列是否实质上偏离样品中的任何其它扩增的接头连接的靶序列,或是否实质上偏离参考 样品或对应的目标基因或染色体的预期的百分率频率。例如,百分率频率降低0. 5或更多 可能指示扩增的接头连接的靶序列内的缺失。相反,百分率频率升高1. 〇或更多可能指示 扩增的接头连接的靶序列内的重复(见图40A和图40B)。
[0084] 在一些实施方式中,log2比率可用于确定目标样品中一个或多个基因和/或染色 体的拷贝数变异。例如,一旦计算了 l〇g2比率,其可用于确定任意扩增的接头连接的靶序 列是否实质上偏离样品中的任何其它扩增的接头连接的靶序列,或是否实质上偏离参考样 品或对应的目标基因或染色体的预期的百分率频率。例如,l〇g 2比率降低0. 5或更多可能 指示扩增的接头连接的靶序列内的缺失(见图38A)。相反,log2比率升高1. 0或更多可能 指示扩增的接头连接的靶序列内的重复(见图37B)。
[0085] 在一些实施方式中,倍数增加可用于确定目标样品中一个或多个基因和/或染色 体的拷贝数变异。例如,使用本文公开的方法,可以计算一个或多个目标样品的百分率比 率。一旦计算了百分率比率,其可用于确定样品相对于参考或对照样品的倍数增加。如果 倍数增加与零实质上不同,则差异可以与目标样品中遗传材料的丢失或重复相关联。例如, 发现20倍的倍数增加与染色体17中扩增的接头连接的靶序列的重复相关联(见图39A)。 [0086] 在一些实施方式中,确定至少一个扩增的接头连接的靶序列的拷贝数变异不需要 使用参考或对照样品。在一些情况下,使用本文公开的方法扩增目标样品产生具有实质上 偏离水平的过度代表或代表不足的测序数据。基于这样的测序结果,可以直接确定哪些扩 增的接头连接的靶序列在样品是过度代表的或代表不足的。本文中提供的确定拷贝数变异 的实例是代表性的而非穷举性的或限制性的。考虑到其它的用于确定拷贝数变异的适当方 法可以替代上述步骤。
[0087] 在一些实施方案中,本公开内容总的来说涉及用于进行核酸的多重扩增的方法、 组合物、系统、装置和试剂盒。在一些实施方案中,所述方法包括扩增包括两个或更多个靶 序列的样品中的多个靶序列。任选地,可在扩增条件下,在聚合酶存在的情况下,使用一个 或多个靶特异性引物扩增来自样品的多个目的靶序列以产生多个扩增的靶序列。扩增任选 地包括在扩增条件下将包含至少一个靶序列的核酸分子与一个或多个靶特异性引物和至 少一种聚合酶接触。接触可产生一个或多个扩增的靶序列。
[0088] 在一些实施方案中,公开的方法(和相关组合物、系统、装置和试剂盒)可包括将 至少一个接头连接至扩增的靶序列的至少一个来产生一个或多个接头连接的扩增的靶序 列。接头可包括至少一个基本上不与靶序列、不与扩增的靶序列和/或不与核酸分子互补 的序列。
[0089] 在一些实施方案中,扩增可产生至少两个彼此互补低于50%的扩增的靶序列。在 一些实施方案中,至少一个扩增的靶序列基本上不与样品中的另一个靶序列互补。在一些 实施方案中,扩增的靶序列可以基本上不与不包括靶序列的样品中的任一种或多种核酸分 子互补。
[0090] 在一些实施方案中,公开的方法(以及相关组合物、系统、装置和试剂盒)可涉及 再扩增至少一个扩增的靶序列。例如,可再扩增接头连接的扩增的靶序列以产生至少一个 再扩增的接头连接的扩增的靶序列。在一些实施方案中,可将接头连接的扩增的靶序列中 的至少一个与一个或多个接头或它们的互补序列以及聚合酶在扩增条件下接触,以产生至 少一个再扩增的接头连接的扩增的靶序列。在一些实施方案中,至少一个接头或其互补序 列基本上不与至少一个扩增的靶序列互补。
[0091] 在一些实施方案中,本公开内容总的来说涉及组合物(以及使用这样的组合物的 相关方法、试剂盒、装置和系统),其包含一个或多个用于与样品中的至少一个靶序列杂交, 和任选地扩增所述靶序列的靶特异性引物。在一些实施方案中,组合物可包括多个用于扩 增样品中的1、2或更多个靶序列的靶特异性引物。组合物还可包括一个或多个接头。
[0092] 在一些实施方案中,靶序列包括一个或多个突变热点、单核苷酸多态性(SNP)、短 串联重复(STR)、编码区、外显子和基因。在一些实施方案中,在单个反应中,使用本文中公 开的组合物(和相关试剂盒、装置和系统)通过一个或多个方法扩增的靶序列的数目可以 是数十、数百或数千个靶序列。在一些实施方案中,在单个多重扩增中扩增的不同靶的数目 可以为至少 100、300、500、750、1000、2500、5000、7500、10000、12500、15000 或更多。
[0093] 在一些实施方案中,靶特异性引物、接头、扩增的靶序列或核酸分子可包括一个或 多个可切割的部分。在本文中也称为可切割基团。任选地,方法还可包括切割靶特异性引 物、接头、扩增的靶序列或核酸分子的至少一个可切割基团。可在公开的方法的任何其它步 骤之前或之后进行切割。在一些实施方案中,切割步骤在扩增后和连接之前进行。在一个实 施方案中,切割包括在连接之前切割至少一个扩增的靶序列。可切割的部分可存在于修饰 的核苷酸、核苷或核碱基中。在一些实施方案中,可切割部分可包括在目标靶序列中非天然 存在的核碱基。在一些实施方案中,可将尿啼陡或尿苷掺入基于DNA的核酸中作为可切割 基团。在一个示例性实施方案中,尿嘧啶DNA糖基化酶可用于从核酸切割可切割基团。在 另一个实施方案中,可将肌苷掺入基于DNA的核酸中作为可切割基团。在一个不例性实施 方案中,EndoV可用于在肌苷残基附近切割,其它酶例如Klenow可用于产生能够平末端连 接的平末端片段。在另一个示例性实施方案中,酶hAAG可用于从核酸切割肌苷残基,从而 产生可通过一个或多个酶例如Klenow进一步加工(以产生能够平末端连接的平末端片段) 的无碱基位点。
[0094] 在一些实施方案中,本文中公开的方法(以及相关试剂盒、组合物、装置和系统) 可包括扩增样品的至少两个彼此不同的靶序列(例如,第一靶序列和第二靶序列)。在一些 实施方案中,本文中公开的方法(以及相关试剂盒、组合物、装置和系统)包括同时扩增彼 此互补不足50 %的第一靶序列和第二靶序列。在一些实施方案中,第一靶序列和第二靶序 列彼此基本上不互补。
[0095] 在一些实施方案中,本文中公开的方法(以及相关试剂盒、组合物、装置和系统) 可包括使用至少两个彼此不同的靶特异性引物(例如,第一靶特异性引物和第二靶特异性 引物)进行扩增。在一些实施方案中,第一靶特异性引物可与第一靶序列的至少一些部分 具有至少50%的互补性。在一些实施方案中,第一靶特异性引物可与样品中的另一个靶序 列基本上不互补。例如,第一靶特异性引物可与第二靶序列基本上不互补。任选地,第一靶 特异性引物可与样品中的第一靶序列基本上互补,并且可与样品中除第一靶序列外的任何 其它核酸分子的任何部分基本上不互补。
[0096] 任选地,本文中公开的多重扩增的方法包括使用至少一个靶特异性引物扩增样品 中的靶序列的至少一部分,所述引物与包含对应靶序列的核酸分子的至少一些部分基本上 互补。在一些实施方案中,至少一个祀特异性引物与对应的祀序列的至少一些部分基本上 互补。在一些实施方案中,扩增可包括使用包括靶特异性正向引物和靶特异性反向引物的 引物对。在一些实施方案中,靶特异性引物可包括至少一个与包含对应靶序列或其互补序 列的核酸分子的至少一些部分基本上互补或基本上同一的序列。任选地,靶特异性引物基 本上不与存在于样品中的任何其它核酸分子互补。在一些实施方案中,靶特异性引物可包 括至少一个与对应的靶序列或其互补序列的至少一些部分基本上互补或基本上同一的序 列。在一些实施方案中,靶特异性引物可包括至少一个与对应的靶序列或其互补序列的至 少一些部分互补或同一的序列。在一些实施方案中,祀特异性引物不包括任何这样的核酸 序列:所述核酸序列在长度上为至少5个连续核苷酸、8个核苷酸、10个连续核苷酸或15个 连续核苷酸,并且与其对应祀序列的至少一些部分基本上不互补。在一些实施方案中,革巴 特异性引物可在严格条件下与样品中对应的靶序列的至少一些部分杂交。在一些实施方案 中,靶特异性引物的至少一个基本上不与除其对应靶序列外的存在于样品中的任何核酸序 列互补。
[0097] 在一些实施方案中,一个或多个靶特异性引物可被设计来排除一个或多个序列基 序。例如,靶特异性引物的至少一个可被设计为不包括在靶特异性引物中重复5次或更多 次的三联体核苷酸基序。任选地,靶特异性引物的至少一个可被设计为不包括重复3次或 更多次的核苷酸序列"ACA"。此外,靶特异性引物的至少一个可被设计为不包括在长度上大 于8个核苷酸的同聚体。任选地,本文中公开的方法的靶特异性引物的至少一个可被设计 为具有低于85%的GC含量。
[0098] 在一些实施方案中,本文中公开的一个或多个扩增法包括进行靶特异性扩增。进 行靶特异性扩增可包括使用一个或多个专有靶特异性引物(即不包括任何共有或通用序 列基序的引物)扩增一个或多个靶序列。通常地,靶特异性引物的一个或多个与它们的对 应靶序列的至少一些部分基本上互补,或与包含对应靶序列的核酸分子的一些部分基本上 互补。在一些实施方案中,一个、一些或全部靶特异性引物在它们的(即,引物的)整个长 度上与它们的对应祀序列的至少一些部分基本上互补,或与包含对应祀序列的核酸分子的 一些部分基本上互补。
[0099] 在一些实施方案中,样品中的核酸分子、扩增的靶序列、接头或靶特异性引物包括 5'末端和3'末端。5'末端可包括游离5'磷酸基团或其等同物;3'末端可包括游离3'羟 基或其等同物。任选地,扩增的靶序列的末端可基本上不与另一个扩增的靶序列的末端互 补。在一些实施方案中,3'末端从3'轻基可包括约30个核苷酸或约15个核苷酸。在一些 实施方案中,5'末端从5'磷酸基团可包括约30个核苷酸或约15个核苷酸,在一些实施方 案中,任一个具有3'末端和5'末端的扩增的靶序列可基本上不与任何其它扩增的靶序列 的任何部分互补。
[0100] 任选地,公开的方法还可包括将一个或多个包含通用引发序列的接头连接至作为 这样的靶特异性扩增的结果形成的扩增产物。例如,在一些实施方案中,可将一个或多个接 头连接至扩增的靶序列。任选地,连接至扩增的靶序列的接头易被外切核酸酶降解。在一 些实施方案中,可将对外切核酸酶降解易感的接头连接至扩增的靶序列的3'末端。在一些 实施方案中,连接至扩增的靶序列的接头不包括保护基团。在一些实施方案中,接头不包括 保可在降解或消化条件下阻止核酸降解或消化的保护基团。在不包含保护基团的核酸存在 的情况下接头连接的扩增的靶序列的随后的酶促消化提供了选择性消化未保护的核酸的 方法。在一些实施方案中,接头可包括DNA条形码或标签序列。
[0101] 在一些实施方案中,本文中公开的方法(以及相关试剂盒、系统、装置和组合物) 可包括将具有3'末端和5'末端的扩增的靶序列与连接反应混合物接触。在一些实施方案 中连接反应混合物可包含一个或多个接头和连接酶来产生至少一个接头连接的扩增的靶 序列。在一些实施方案中,在连接之前,连接混合物中没有一个接头包含靶特异性序列。在 一些实施方案中,在连接之前,连接混合物中没有一个接头包含与扩增的靶序列的3'末端 或5 '末端基本上互补的序列。任选地,扩增的靶序列的3 '末端或5 '末端包括约30个核苷 酸,并且在一些情况下是指距离扩增的靶序列的3'末端或5'末端的约15个核苷酸。在一 些实施方案中,在连接之前,连接混合物中没有一个接头可在高度严格度下与扩增的靶序 列的一些部分杂交。在一些实施方案中,连接可包括一个或多个接头至一个或多个扩增的 革巴序列的直接连接。在一个实施方案中,连接可包括进行平末端连接。例如,平末端连接的 过程可包括将基本上平末端双链扩增的靶序列连接至基本上平末端双链接头。在一些实施 方案中,连接不包括在将接头连接至扩增的靶序列之前一个或多个另外的寡核苷酸接头。
[0102] 在一些实施方案中,本公开内容总地来说涉及用于进行靶序列的扩增的方法(以 及使用公开的方法的相关组合物、系统、装置和试剂盒),并且可包括消化步骤。在一些实 施方案中,方法还包括连接步骤,并且在连接步骤之前进行消化步骤。在一些实施方案中, 可部分消化扩增的靶序列,然后进行连接步骤。例如,可通过酶促、热或化学方法消化扩增 的靶序列。在一些实施方案中,可消化扩增的靶序列,随后进行连接,以产生平末端扩增的 靶序列。在一些实施方案中,平末端扩增的靶序列可在消化的扩增的靶序列的5'末端包含 5'磷酸基团。
[0103] 在一些实施方案中,本公开内容总地来说涉及用于进行多重核酸扩增的方法、组 合物、系统、装置和试剂盒。在一些实施方案中,方法(以及使用这样的方法的相关组合物、 试剂盒、装置和系统)包括在扩增条件下,在聚合酶存在的情况下使用一个或多个靶特异 性引物扩增一个或多个靶序列来产生扩增的靶序列,以及将接头连接至扩增的靶序列。此 夕卜,方法可包括再扩增接头连接的扩增的靶序列以形成再扩增的接头连接的扩增的靶序 列。在一些实施方案中,再扩增的接头连接的扩增的靶序列可使用不超过两轮靶特异性选 择来产生。
[0104] 在一些实施方案中,一个或多个靶特异性引物、靶序列或接头可包括可切割基团。 此外,可切割基团可位于靶特异性引物、靶序列或接头的末端上或末端附近的核苷酸位置。 在一些实施方案中,可切割基团可位于具有可切割基团的核酸的3'末端或5'末端的15个 核苷酸内。在一些实施方案中,可切割基团可位于靶特异性引物的中央核苷酸或在其附近。 在一些实施方案中,一个或多个可切割基团可存在于靶特异性引物或接头中。在一些实施 方案中,靶特异性引物或接头中的一个或多个可切割基团的切割可产生多个具有不同熔解 温度的核酸片段。在一个实施方案中,一个或多个可切割基团在靶特异性引物或接头中的 放置可通过在切割可切割基团后,测定每一个核酸片段的可比较的最高的最低熔解温度来 调节或操作。在一些实施方案中,可切割基团可以是尿嘧啶或尿苷部分。在一些实施方案 中,可切割基团可以是肌苷部分。在一些实施方案中,至少50 %的靶特异性引物可包括至少 一个可切割基团。在一些实施方案中,每一个靶特异性引物包括至少一个可切割基团。
[0105] 在一个实施方案中,本文中公开了多重核酸扩增法,所述方法包括a)在聚合酶存 在的情况下使用一个或多个靶特异性引物扩增一个或多个靶序列以产生扩增的靶序列,和 b)将接头连接至扩增的靶序列以形成接头连接的扩增的靶序列。在一些实施方案中,可在 溶液中进行扩增以便扩增的靶序列或靶特异性引物不连接至固体载体或表面。在一些实施 方案中,可在溶液中进行连接以便扩增的靶序列或接头不连接至固体载体或表面。在另一 个实施方案中,可在溶液中进行扩增和连接以便扩增的靶序列、靶特异性引物或接头不连 接至固体支持物或表面。
[0106] 在一些实施方案中,本公开内容总地来说涉及用于合成样品中的两个或更多个靶 序列的方法、组合物、系统、装置和试剂盒。在一个实施方案中,合成方法包括a)在聚合条 件下,在聚合酶存在的情况下使用多个靶特异性引物合成两个或更多个靶序列以产生多个 合成的靶序列。在一些实施方案中,方法还包括将一个或多个接头连接至合成的靶序列。在 一些实施方案中,目标靶序列包括一个或多个突变热点、单核苷酸多态性(SNP)、短串联重 复(STR)、编码区、外显子和基因。在一些实施方案中,可使用本文中公开的组合物(和相关 方法、试剂盒、装置和系统)在多重反应中合成的靶序列的数目在单个样品中可以为数十、 数百或数千个靶序列。任选地,在聚合条件下,在聚合酶存在的情况下,使用一个或多个靶 特异性引物可合成来自样品的多个目标靶序列,以产生多个合成的靶序列。在一些实施方 案中,合成的靶序列与另一个合成的靶序列的互补性可低于50%。在一些实施方案中,合成 的靶序列可基本上不与样品中的另一个靶序列互补。在一些实施方案中,合成的靶序列可 基本上不与样品中不为目标祀序列的任何一个或多个核酸分子互补。在一些实施方案中, 合成靶序列可包括将接头连接至合成的靶序列,从而产生接头连接的合成的靶序列。
[0107] 在一些实施方案中,本公开内容总地来说涉及从多个靶序列合成靶序列。例如, 合成的方法可包括在聚合条件下,在聚合酶存在的情况下使用多个靶特异性引物合成靶序 列,以产生多个合成的靶序列。合成还可包括再合成至少一个接头连接的合成的靶序列。在 一些实施方案中,再合成可包括在聚合条件下将至少一个接头连接的合成的靶序列与至少 一个接头或其互补序列和聚合酶接触,以产生多个再合成的接头连接的合成的靶序列。在 一些实施方案中,再合成的接头连接的合成的靶序列可使用不超过两轮靶特异性选择来产 生。
[0108] 在一些实施方案中,用于合成靶序列的方法可包括合成和连接步骤。在一些实施 方案中,连接不包括与合成的靶序列的部分基本上互补的接头。在一些实施方案中,接头基 本上不与来自合成的靶序列的3'末端或5'末端的约30个连续核苷酸或约20个连续核苷 酸互补。在一些实施方案中,接头可包括至少一个与通用引物的至少一部分基本上互补或 与其基本上同一的序列。
[0109] 在一些实施方案中,本公开内容总地来说涉及用于进行多重核酸扩增的方法、组 合物、系统、装置和试剂盒。在一个实施方案中,方法包括在扩增条件下在聚合酶存在的情 况下,使用一个或多个靶特异性引物扩增一个或多个靶序列;将接头连接至扩增的靶序列; 和再扩增至少一个接头连接的扩增的靶序列。在一些实施方案中,再扩增包括在扩增条件 下将接头连接的扩增的靶序列与一个或多个接头(或它们的互补序列)和聚合酶接触,以 产生至少一个再扩增的接头连接的扩增的靶序列。在一些实施方案中,扩增的靶序列与另 一个扩增的靶序列的互补性可低于50%。在一些实施方案中,扩增的靶序列可基本上不与 样品中的另一个靶序列互补。在一些实施方案中,扩增的靶序列可基本上不与样品中的不 为目标靶序列的任一个或多个核酸分子互补。在一些实施方案中,扩增的靶序列可连接至 至少一个接头或它们的互补序列,以产生一个或多个接头连接的扩增的靶序列。在一些实 施方案中,接头连接的扩增的靶序列可被再扩增以产生至少一个再扩增的接头连接的扩增 的靶序列。在一些实施方案中,接头或它们的互补序列基本上不与样品中任何其它核酸分 子的任何部分互补。在一些实施方案中,接头或它们的互补序列基本上不与至少一个扩增 的靶序列互补。在一个实施方案中,在再扩增步骤过程中一个或多个接头或它们的互补序 列可以是通用引物。在一个实施方案中,连接步骤还可包括将DNA条形码或DNA标签序列 连接至扩增的靶序列,随后将接头连接至扩增的靶序列。
[0110] 在一些实施方案中,可按"仅添加(addition-only) "法进行本公开内容的扩增和 合成方法。在一些实施方案中,仅添加法不包括为了在扩增或合成步骤中进一步操作而除 去第一反应混合物(包含扩增或合成组合物)的全部或部分。在一些实施方案中,可将仅 添加法自动化例如以用于高通量处理。
[0111] 在一些实施方案中,本公开内容总地来说涉及用于进行核酸扩增和核酸合成的组 合物(以及使用公开的组合物的相关试剂盒、方法、系统和装置)。在一些实施方案中,本文 中公开的组合物的一种或多种(以及相关方法、试剂盒、系统和装置)可包括至少一个靶特 异性引物和/或至少一个接头。在一些实施方案中,组合物包括多个在长度上为约15至约 40个核苷酸的靶特异性引物或接头。在一些实施方案中,组合物包括一个或多个包含一个 或多个可切割基团的靶特异性引物或接头。在一些实施方案中,可将一个或多个类型的可 切割基团掺入靶特异性引物或接头。在一些实施方案中,可切割基团可位于靶特异性引物 或接头的3'末端或其附近。在一些实施方案中,可切割基团可位于末端核苷酸、倒数第二 个核苷酸,或对应于短于靶特异性引物或接头的核苷酸长度的50%的任何位置。在一些实 施方案中,可将可切割基团掺入位于靶特异性引物或接头中央的残基或其附近。例如,具有 40个碱基的靶特异性引物可在核苷酸位置15-25上包含切割基团。因此,靶特异性引物或 接头可在其3'末端、其5'末端内或中央位置上包含多个可切割基团。在一些实施方案中, 靶特异性引物的5'末端仅包含非可切割的核苷酸。在一些实施方案中,可切割基团可包括 修饰的核碱基或修饰的核苷酸。在一些实施方案中,可切割基团可包括在对应的核酸中非 天然存在的核苷酸或核碱基。例如,DNA核酸可包括RNA核苷酸或核碱基。在一个实例中, 基于DNA的核酸可包括尿啼陡或尿苷。在另一个实例中,基于DNA的核酸可包括肌苷。在 一些实施方案中,可切割基团可包括可通过酶促、化学或热方法从靶特异性引物或接头切 割的部分。在一些实施方案中,可使用尿嘧啶DNA糖基化酶从靶特异性引物或接头切割尿 嘧啶或尿苷部分。在一些实施方案中,可使用hAAG或EndoV从靶特异性引物或接头切割肌 苷部分。
[0112] 在一些实施方案中,本公开内容总体上涉及包括长度为约15至约40个核苷酸的 靶特异性引物的组合物,所述引物具有位于靶特异性引物的末端附近的可切割基团,与双 链靶序列的第一链杂交。在一些实施方案中,引物基本上与双链靶序列的第一链互补。在 一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含长度为约15至约40个 核苷酸的靶特异性引物(所述引物具有位于靶特异性引物的末端附近的可切割基团,与双 链靶序列的第一链杂交)和长度为约15至约40个核苷酸的第二靶特异性引物(所述引物 具有位于第二靶特异性引物的末端附近的可切割基团,与双链靶序列的第二链杂交)。在一 些实施方案中,第二靶特异性引物基本上与双链靶序列的第二链互补。
[0113] 在一些实施方案中,本公开内容总地来说涉及用于进行核酸扩增和核酸合成的组 合物(以及使用公开的组合物的相关试剂盒、方法、系统和装置)。在一些实施方案中,组合 物包含长度为约15至约40个核苷酸的靶特异性引物,其具有位于靶特异性引物末端附近 的尿嘧啶核苷酸和位于靶特异性引物的中央核苷酸附近的第二尿嘧啶核苷酸。在一些实施 方案中,本公开内容总地来说涉及用于进行核酸扩增和核酸合成的组合物(以及使用公开 的组合物的相关试剂盒、方法、系统和装置)。在一些实施方案中,组合物包含长度为约15 至约40个核苷酸的靶特异性引物,其具有位于靶特异性引物的3'末端附近的肌苷核苷酸 和位于靶特异性引物的中央核苷酸附近的至少第二肌苷核苷酸。
[0114] 在一些实施方案中,本公开内容总地来说涉及包含至少一个靶特异性引物或至少 一个靶特异性引物引对的组合物。在一些实施方案中,本公开内容总地来说涉及包含多个 靶特异性引物的组合物。任选地,组合物可包含至少100, 200, 300, 500, 750, 1000, 1250, 15 00, 1750, 2000, 2500, 3000, 4000, 5000, 7500或10, 000个靶特异性引物或靶特异性引物对。 在一些实施方案中,包含多个靶特异性引物的组合物包括本文中公开的靶特异性引物的至 少一个。在一些实施方案中,包含多个靶特异性引物的组合物包含至少一个与本文或同时 提交的序列表中提供的核酸序列之任一具有至少90%的同一性的靶特异性引物。在一些 实施方案中,包含多个靶特异性引物的组合物包括本文中公开的一个或多个靶特异性引物 对,或一个或多个与本文中提供的引物对核酸序列之任一具有至少90%的同一性的引物 对。在一些实施方案中,包含多个靶特异性引物的组合物可与本文或同时提交的序列表中 公开的核酸序列的任一个或多个具有至少91 %,92%,93%,94%,95%,96%,97%,98% 或99%的同一性的百分比同一性。在一些实施方案中,包含多个靶特异性引物的组合物可 包含选自表2, 3, 13, 14, 15, 17和19(来自2012年4月27日提交的美国申请号13/458, 739, 通过引用方式全文并入本文)的任一个或多个靶特异性引物。在一些实施方案中,包含多 个靶特异性引物的组合物可包含选自表2,3, 13, 14, 15, 17和19(来自2012年4月27日 提交的美国申请号13/458, 739,通过引用方式全文并入本文)的任一个或多个靶特异性 引物对。在一些实施方案中,包含多个靶特异性引物的组合物总地来说涉及选自SEQ ID N0:l-103、143的任一个或多个核酸序列,或包括来自选自SEQ ID N0:l-103、143的任一 个核酸序列的至少15个连续核苷酸。在一些实施方案中,组合物总地来说涉及由SEQ ID NO: 1-103U43中所示的核酸序列的任一个或多个组成的分离的核酸序列。
[0115] 在一些实施方案中,本公开内容总地来说涉及包含长度为约15个核苷酸至约40 个核苷酸的靶特异性引物的组合物。在一些实施方案中,本公开内容总地来说涉及包含多 个至少2种靶特异性引物(长度为约15个核苷酸至约40个核苷酸)的组合物。在一些实 施方案中,组合物包含多个使用本文中概述的引物选择标准或引物选择法设计的长度为约 15个核苷酸至约40个核苷酸的靶特异性引物对。
[0116] 在一些实施方案中,组合物包括至少一个在其整个长度上基本上与样品中的至少 一个靶序列互补的靶特异性引物。在一些实施方案中,组合物包括多个靶特异性引物,其中 基本上所有的所述多个多个靶特异性引物包括在它们的整个引物长度上与样品中的一个 或多个靶序列互补的核酸序列。在一些实施方案中,组合物包括至少一个在其整个长度上 与样品中至少一个靶序列互补的靶特异性引物。在一些实施方案中,组合物包括多个靶特 异性引物,其中基本上所有的所述多个多个靶特异性引物包括在它们的整个引物长度上与 样品中的一个或多个靶序列互补的核酸序列。
[0117] 在一些实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物, 所述引物具有位于所述多个靶特异性引物的至少一个的3'末端的可切割基团。在一些实 施方案中,组合物包括位于基本上所有的所述多个靶特异性引物的3'末端的可切割基团。 在一些实施方案中,可切割基团可包括尿啼陡核碱基、肌苷核苷或其类似物。在一些实施方 案中,一个或多个靶特异性引物的3'末端可包括超过一个可切割基团和/或超过一种可切 割基团。例如,具有位于一个靶特异性引物的3'末端的可切割基团的组合物可在相同靶特 异性引物的3'末端包括一个尿嘧啶部分和肌苷部分。在一些实施方案中,组合物可包括至 少一个在3'末端核苷酸上包括非可切割部分的靶特异性引物。例如,靶特异性引物可在除 靶特异性引物的3'末端的末端核苷酸外的靶特异性引物的3'末端包括可切割基团。在一 些实施方案中,组合物可包括多个靶特异性引物,其中基本上所有靶特异性引物在除末端 核苷酸位置外的3'末端包括可切割基团。
[0118] 在一些实施方案中,本公开内容总地来说涉及组合物,所述组合物包含多个具有 位于靶特异性引物的至少一个的中央核苷酸附近或周围的可切割基团的靶特异性引物。在 一些实施方案中,组合物包括位于基本上所有的所述多个靶特异性引物的中央核苷酸的附 近或周围的可切割基团。例如,在具有40个核苷酸的靶特异性引物中,可切割基团可位于 中央核苷酸附近,例如位于第15个核苷酸至第25个核苷酸。在一些情况下,中央核苷酸"附 近"可以指整个靶特异性引物的长度的百分比。例如在40个核苷酸的靶特异性引物中,中 央可切割基团的位置可包括从靶特异性引物的长度的约40%至约60%的任何位置。在一 些实施方案中,具有奇数个核苷酸的靶特异性引物的中央核苷酸包括靶特异性引物的中央 核苷酸。在具有偶数个核苷酸的靶特异性引物中,中央核苷酸可包括在中央核苷酸位置的 任一侧的一个核苷酸。例如,在20个核苷酸的靶特异性引物中,中央核苷酸可包括核苷酸 位置10、核苷酸位置11或两者。
[0119] 在一些实施方案中,本公开内容总地来说涉及包含多个在5'末端仅具有非可切割 的核苷酸的靶特异性引物的组合物。在一些实施方案中,组合物可包括基本上所有的所述 多个的在5'末端仅具有非可切割核苷酸的靶特异性引物。在一些实施方案中,仅具有非可 切割核苷酸的所述多个靶特异性引物的5'末端从5'末端可包括不足10个核苷酸。在一 些实施方案中,5'末端从5'末端可包括不足8, 7, 6, 5, 4, 3或2个核苷酸。在一些实施方案 中,具有非可切割核苷酸的5'末端可包括少于50%的靶特异性引物的长度,少于40%的靶 特异性引物的长度,少于30 %的靶特异性引物的长度,少于20 %的靶特异性引物的长度, 或少于10%的靶特异性引物的长度(从5'末端)。
[0120] 在一些实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物, 所述靶特异性引物的至少一个在引物的整个长度上包括少于20%的包含可切割基团的核 苷酸。在一些实施方案中,组合物包含多个靶特异性引物,其中基本上所有靶特异性引物在 每一个引物的整个长度上包含少于20%的含有可切割基团的核苷酸。例如,长度为20个核 苷酸的靶特异性引物可包括4个或更少的切割基团。在一些实施方案中,本公开内容总地 来说涉及包含多个靶特异性引物的组合物,其中靶特异性引物的至少一个在引物的整个长 度上包含少于10%的含有可切割基团的核苷酸。在一些实施方案中,组合物包含多个靶特 异性引物,其中基本上所有靶特异性引物在每一个引物的整个长度上包含少于10%的含有 可切割基团的核苷酸。例如,长度为20个核苷酸的靶特异性引物可包含2个或更少的切割 基团。
[0121] 在一些实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物, 所述引物具有最少的对所述多个引物中的靶特异性引物的至少一个的交叉杂交。在一些 实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物,所述引物具有最 少的对所述多个引物的中的基本上所有靶特异性引物的交叉杂交。在一些实施方案中, 对所述多个引物中的一个或多个靶特异性引物的最少交叉杂交可通过引物二聚体或二聚 体-二聚体的形成来评价。在一些实施方案中,组合物可在多重PCR扩增反应中包括相较 于在相应的扩增条件下现有技术的多重PCR扩增反应更少的引物二聚体。
[0122] 在一些实施方案中,本公开内容总地来说涉及包含多个靶特异性引物的组合物, 其中靶特异性引物的至少一个包括最少的对存在于样品中的非特异性序列的交叉杂交。在 一些实施方案中,组合物包含多个靶特异性引物,其中基本上所有靶特异性引物包括最少 的对存在于样品中的非特异性序列的交叉杂交。在一些实施方案中,最少的对存在于样品 中的非特异性序列的交叉杂交可通过"脱靶读取的百分比"的存在或"在靶读取的百分比" 的减少来评价。在一些实施方案中,本文中公开的组合物可在多重PCR扩增反应中提供相 较于在对应扩增条件下现有技术的多重PCR扩增反应更少的"脱靶读取的百分比"或"在靶 读取的百分比"的增加。给定的多重扩增的"重"通常是指在根据本公开内容的单个多重扩 增期间扩增的不同靶特异性序列的数目。在一些实施方案中,重可以为约12重、24重、48 重、96重、192重、384重、768重、1536重、3072重、6144重或更高。在一些实施方案中,最少 的对存在于样品中的非特异性序列的交叉杂交可包括低于15%、低于12%或少于10%的 脱靶读取。在一些实施方案中,每多重扩增的在靶读取的百分率可大于85% 92%、94%、95%、96%、97%、98% 或更多。
[0123] 在一些实施方案中,本公开内容总地来说涉及包含多个具有最小自我互补的靶特 异性引物的组合物。在一些实施方案中,组合物包括至少一个不形成二级结构例如环或发 夹的靶特异性引物。在一些实施方案中,组合物包括多个靶特异性引物,其中大部分(即, 超过50%)或基本上所有的所述多个靶特异性引物不能形成二级结构。给定的多重扩增 的"重"通常是指在根据本公开内容的单个多重扩增期间扩增的不同靶特异性序列的数目。 在一些实施方案中,重可以为约12重、24重、48重、96重、192重、384重、768重、1536重、 3072重、6144重或更高。在一些实施方案中,最小自我互补性可包括少于10%,少于8%, 少于5%或少于3%的具有允许靶特异性引物形成二级结构的自我互补性的所述多个靶特 异性引物。
[0124] 在一些实施方案中,本公开内容总地来说涉及包含多个在3'末端或5'末端具有 最小核苷酸序列重叠的靶特异性引物的组合物。在一些实施方案中,组合物可在至少一个 靶特异性引物的3'末端中包括最小核苷酸序列重叠。在一些实施方案中,组合物可在基本 上所有的所述多个靶特异性引物的3'末端中包括最小核苷酸序列重叠。在一些实施方案 中,组合物可在至少一个靶特异性引物的5'末端包括最小核苷酸序列重叠。在一些实施方 案中,组合物可在基本上所有的所述多个靶特异性引物的5'末端中包括最小核苷酸序列重 叠。在一些实施方案中,组合物可在至少一个靶特异性引物的3'末端和5'末端中包括最 小核苷酸序列重叠。在一些实施方案中,组合物可在基本上所有的所述多个靶特异性引物 的3'末端和5'末端包括最小核苷酸序列重叠。在一些实施方案中,一个或多个靶特异性 引物之间的核苷酸序列重叠的量少于8个核苷酸。在一些实施方案中,一个或多个祀特异 性引物之间的核苷酸序列重叠的量少于5个核苷酸。在一些实施方案中,所述多个引物的 一个或多个靶特异性引物之间的核苷酸序列重叠的量少于8, 7, 6, 5, 4, 3, 2或1个核苷酸。 在一些实施方案中,组合物可包括多个包含一个或多个核苷酸的核苷酸序列缺口的祀特异 性引物。在一些实施方案中,组合物可在所述多个靶特异性引物的两个或更多个引物之间 包括1,2, 3, 4, 5, 10, 15, 20或更多个核苷酸的核苷酸序列缺口。在一些实施方案中,组合物 可在所述多个靶特异性引物的两个或更多个靶特异性引物之间包括约50个核苷酸的核苷 酸序列缺口。在一些实施方案中,组合物可在所述多个靶特异性引物的基本上所有靶特异 性引物之间包括约10、20、30、40或50个核苷酸的核苷酸序列缺口。
[0125] 在一些实施方案中,本公开内容总地来说涉及包含多个长度为约15个核苷酸至 约40个核苷酸的靶特异性引物的组合物,所述引物具有至少两个或更多个下列标准:位于 基本上所有的所述多个引物的3'末端的可切割基团、位于基本上所有的所述多个引物的中 央核苷酸的附近或周围的可切割基团、基本上所有的所述多个引物在5'末端仅包括非可切 割部分、最少的对所述多个引物中的基本上所有引物的交叉杂交、最少的对存在于样品中 的非特异性序列的交叉杂交、最小的自我互补性以及所述多个引物中基本上所有引物的3' 末端或5'末端上的最小核苷酸序列重叠。在一些实施方案中,组合物可包括上述标准的任 意3、4、5、6或7项。
[0126] 在一些实施方案中,本公开内容总地来说涉及包含多个长度为约15个核苷酸至 约40个核苷酸的至少2种靶特异性引物的组合物,所述引物具有下列标准的两个或更多 个:位于基本上所有的所述多个引物的中央核苷酸的附近或周围的可切割基团、基本上所 有的所述多个引物在5'末端仅包括非可切割核苷酸、基本上所有的所述多个引物在引物的 整个长度上具有少于20%的包含可切割基团的核苷酸、至少一个引物具有在其整个长度上 与存在于样品中的靶序列互补的核酸序列、最少的对所述多个引物中基本上所有引物的交 叉杂交、最少的对存在于样品中的非特异性序列的交叉杂交,以及所述多个引物中基本上 所有引物的3'末端或5'末端上的最小核苷酸序列重叠。在一些实施方案中,组合物可包 括上述标准的任意3、4、5、6或7项。
[0127] 在一些实施方案中,本公开内容总地来说涉及包含多个按照本文公开的标准设 计的靶特异性引物或包括本文中公开的靶特异性引物的任一个或多个的组合物,其中所 述多个靶特异性引物的至少一个在其整个长度上与选自如下基因的一个或多个基因的至 少一部分基本上互补:ABI1 ;ABL1 ;ABL2 ;ACSL3 ;ACSL6 ;AFF1 ;AFF3 ;AFF4 ;AKAP9 ;AKT1 ; AKT2 ;ALK ;APC ;ARHGAP26 ;ARHGEF12;ARID1A ;ARNT;ASPSCR1 ;ASXL1 ;ATF1 ;ATIC ;ATM ; AXIN2 ;BAP1 ;BARD1 ;BCAR3 ;BCL10 ;BCL11A;BCL11B;BCL2;BCL3 ;BCL6 ;BCL7A ;BCL9 ;BCR ; BIRC3;BLM ;BMPR1A ;BRAF ;BRCA1 ;BRCA2 ;BRD3 ;BRD4 ;BRIP1 ;BUB1B ;CARD11 ;CARS ;CASC5 ; CBFA2T3 ;CBFB ;CBL ;CBLB ;CBLC ;CCDC6 ;CCNB1IP1 ;CCND1 ;CCND2 ;CD74 ;CD79A ;CDC73 ; CDH1 ;CDH11 ;CDK4 ;CDK6 ;CDKN2A ;CDKN2B ;CDKN2C ;CDX2 ;CEBPA ;CEP110 ;CHEK1 ;CHEK2 ; CHIC2 ;CHN1 ;CIC ;CIITA ;CLP1 ;CLTC ;CLTCL1 ;⑶L1A1 ;CREB1 ;CREB3L2 ;CREBBP;CRTC1 ; CRTC3 ;CSF1R ;CTNNB1 ;CXCR7 ;CYLD ;CYTSB ;DCLK3 ;DDB2 ;DDIT3 ;DDR2 ;DDX10 ;DDX5 ;DDX6 ; DEK ;DGKG ;DICER1 ;·ΜΤ3Α ;EGFR ;EIF4A2 ;ELF4 ;ELL ;ELN ;EML4 ;EP300 ;EPS15 ;ERBB2 ; ERBB4 ;ERC1 ;ERCC2 ;ERCC3 ;ERCC4 ;ERCC5 ;ERG ;ETV1 ;ETV4;ETV5 ;ETV6 ;EWSR1 ;EXT1 ; EXT2 ;EZH2 ;FAM123B ;FANCA ;FANCC ;FANCD2 ;FANCE ;FANCF ;FANCG ;FAS ;FBXW7 ;FCRL4 ; FGFR1 ;FGFR10P ;FGFR2 ;FGFR3 ;FH ;FIP1L1 ;FLCN ;FLI1 ;FLT1 ;FLT3 ;FNBP1 ;F0XL2 ;F0X01 ; F0X03 ;F0X04 ;F0XP1 ;FUS ;GAS7 ;GATA1 ;GATA2 ;GATA3 ;GMPS ;GNAQ ;GNAS ;G0LGA5 ;GOPC ; GPC3 ;GPHNGPR124 ;HIP1 ;HIST1H4I ;HLF ;HNF1A;HNRNPA2B1 ;H00K3 ;H0XA11 ;H0XA13 ; H0XA9 ;H0XC11 ;H0XC13 ;H0XD13 ;HRAS ;HSP90AA1 ;HSP90AB1 ;IDH1 ;IDH2 ;IKZF1 ;IL2 ; IL21R ;IL6ST ;IRF4 ;ITGA10 ;ITGA9 ;ITK ;JAK1 ;JAK2 ;JAK3 ;KDM5A ;KDM5C ;KDM6A ;KDR ; KDSR ;KIAA1549;KIT ;KLF6 ;KLK2 ;KRAS ;KTN1 ;LASP1 ;LCK ;LCP1 ;LHFP ;LIFR ;LM02 ;LPP ; MAF ;MALT1 ;MAML2 ;MAP2K1 ;MAP2K4 ;MDM2 ;MDM4 ;MECOM ;MEN1 ;MET ;MITF ;MKL1 ;MLH1 ;MLL ; MLLT1 ;MLLT10 ;MLLT3 ;MLLT4 ;MLLT6 ;MN1 ;MPL ;MRE11A ;MSH2 ;MSH6 ;MSI2 ;MSN ;MTCP1 ; MTOR ;MUC1 ;MYB ;MYC ;MYCL1 ;MYCN ;MYH11 ;MYH9 ;MYST3 ;MYST4 ;NACA ;NBN ;NCOAl ;NCOA2 ; NC0A4 ;NEK9 ;NF1 ;NF2 ;NFE2L2 ;NFKB2 ;NIN ;NKX2-1 ;NLRP1 ;NONO ;NOTCHl ;NOTCH2 ;NPM1 ; NR4A3 ;NRAS ;NSD1 ;NTRK1 ;NTRK3 ;NUMA1 ;NUP214 ;NUP98 ;OLIG2 ;OMD ;PAFAH1B2 ;PALB2 ; PATZ1 ;PAX3 ;PAX5 ;PAX7 ;PAX8 ;PBRM1 ;PBX1 ;PCM1 ;PDE4DIP ;PDGFB ;PDGFRA ;PDGFRB ; PERI ;PHOX2B ;PICALM ;PIK3CA;PIK3R1 ;PIM1 ;PLAG1 ;PML ;PMS1 ;PMS2 ;POU2AFl ;POU5Fl ; PPARG;PPP2R1A;PRCC ;PRDM16 ;PRF1 ;PRKAR1A ;PRRX1 ;PSIP1 ;PTCH1 ;PTEN ;PTPN11 ; RABEP1 ;RAD50 ;RAD51L1 ;RAF1 ;RANBP17 ;RAP1 ⑶SI ;RARA ;RB1 ;RBM15 ;RECQL4 ;REL ;RET ; RHOH ;RNF213 ;ROSl ;RPN1 ;RPS6KA2 ;RUNX1 ;RUNX1T1 ;SBDS ;SDHAF2 ;SDHB ;SETD2 ;SFPQ ; SFRS3 ;SH3GL1 ;SLC45A3 ;SMAD4 ;SMARCA4 ;SMARCB1 ;SMO ;SOCSl ;SRC ;SRGAP3 ;SS18 ; SS18L1 ;STIL ;STK11 ;STK36 ;SUFU ;SYK ;TAF15 ;TAF1L ;TAL1 ;TAL2 ;TCF12 ;TCF3 ;TCL1A ; TET1 ;TET2 ;TEX14 ;TFE3 ;TFEB ;TFG ;TFRC ;THRAP3 ;TLX1 ;TLX3 ;TMPRSS2 ;TNFAIP3 ;TOPl ; TP53 ;TPM3 ;TPM4 ;TPR ;TRIM27 ;TRIM33 ;TRIP11 ;TSC1 ;TSC2 ;TSHR ;USP6 ;VHL ;WAS ; WHSC1L1 ;WRN ;WT1 ;XPA ;XPC ;ZBTB16 ;ZMYM2 ;ZNF331 ;ZNF384 和 ZNF521。
[0128] 在一些实施方案中,本公开内容总地来说涉及包含多个按照本文公开的标准设计 的靶特异性引物或包括本文中公开的靶特异性引物的任一个或多个的组合物,其中所述 多个靶特异性引物的至少一个在其整个长度上与选自如下基因的一个或多个基因的至少 一部分基本上互补:ABL1 ;AKT1 ;ALK ;APC ;ATM ;BRAF ;CDH1 ;CDKN2A ;CSF1R ;CTNNB1 ;EGFR ; ERBB2 ;ERBB4 ;FBXW7 ;FGFR1 ;FGFR2 ;FGFR3 ;FLT3 ;GNAS ;HNF1A ;HRAS ;IDH1 ;JAK2 ;JAK3 ; KDR;KIT;KRAS ;MET ;MLH1 ;MPL ;N0TCH1 ;NPM1 ;NRAS ;PDGFRA ;PIK3CA ;PTEN ;PTPN11 ;RB1 ; RET ;SMAD4 ;SMARCB1 ;SM0 ;SRC ;STK11 ;TP53 和 VHL。
[0129] 在一些实施方案中,本公开内容总地来说涉及包含多个按照本文公开的标准设 计的靶特异性引物或包括本文中公开的靶特异性引物的任一个或多个的组合物,其中所 述多个靶特异性引物的至少一个在其整个长度上与选自如下基因的一个或多个基因的至 少一部分基本上互补:ABCA4 ;ABCC8 ;ABCD1 ;ACADVL ;ACTA2 ;ACTC ;ACTC1 ;ACVRL1 ;ADA ; AIPL1 ;AIRE ;ALK1 ;ALPL ;AMT ;APC ;APP ;APTX ;AR ;ARL6 ;ARSA ;ASL ;ASPA ;ASS ;ASS1 ;ATL ; ATM ;ATP2A2 ;ATP7A ;ATP7B ;ATXN1 ;ATXN2 ;ATXN3 ;ATXN7 ;BBS6 ;BCKDHA ;BCKDHB ;BEST1 ; BMPR1A ;BRCA1 ;BRCA2 ;BRIP1 ;BTD;BTK ;C2 或 f25 ;CA4 ;CALR3 ;CAPN3 ;CAV3 ;CCDC39 ; CCDC40 ;CDH23 ;CEP290 ;CERKL ;CFTR ;CHAT ;CHD7 ;CHEK2 ;CHM ;CHRNA1 ;CHRNB1 ;CHRND ; CHRNE ;CLCN1 ;CNBP ;CNGB1 ;C0H1 ;⑶L11A1 ;⑶L11A2 ;⑶L1A1 ;C0L1A2 ;⑶L2A1 ;C0L3A1 ; ⑶L4A5 ;C0L5A1 ;⑶L5A2 ;C0L7A1 ;⑶L9A1 ;CRB1 ;CRX ;CTDP1 ;CTNS ;CYP21A2 ;CYP27A1 ; DAX1 ;DBT;DCX ;DES ;DHCR7 ;DJ1 ;DKC1 ;DLD;DMD ;DMPK ;DNAAF1 ;DNAAF2 ;DNAH11 ;DNAH5 ; DNAI1 ;DNAI2 ;DNAL1 ;·Μ2 ;D0K7 ;DSC2 ;DSG2 ;DSP ;DYSF ;DYT1 ;EMD ;ENG ;EYA1 ;EYS ;F8 ; F9 ;FANCA ;FANCC ;FANCF ;FANCG ;FANCJ ;FANDC2 ;FBN1 ;FBX07 ;FGFR1 ;FGFR3;FM03 ;FMR1 ; F0XL2 ;FRG1 ;FRMD7 ;FSCN2 ;FXN ;GAA ;GALT ;GBA ;GBE1 ;GCSH ;GDF5 ;GJB2 ;GJB3 ;GJB6 ; GLA ;GLDC ;GNE ;GNPTAB ;GPC3 ;GPR143 ;GUCY2D ;HBA1 ;HBA2 ;HBB ;HD ;HERG ;HEXA ;HFE ; HHF ;HIBCH ;HLA-B27 ;HMBS ;HPLH1 ;HPRP3 ;HR ;HTNB ;HTT ;IKBKAP ;IKBKG ;IL2RG ;IMPDH1 ; ITGB4 ;JAG1 ;JPH3 ;KCNE1 ;KCNE2 ;KCNH2 ;KCNQ1 ;KCNQ4 ;KIAA0196 ;KLHL7 ;KRAS ;KRT14 ; KRT5 ;L1CAM ;LAMB3 ;LAMP2 ;LDB3 ;LMNA ;LMX18 ;LRAT ;LRRK2 ;MAPT ;MC1R ;MECP2 ;MED12 ; MEN1 ;MERTK ;MFN2 ;MKKS ;MLH1 ;MMAA ;MMAB ;MMACHC ;MMADHC ;MPZ ;MSH2 ;MTM1 ;MTND5 ; MTTG ;MTTI ;MTTK ;MTTL1 ;MTTQ ;MUT ;MYBPC3 ;MYH11 ;MYH6 ;MYH7 ;MYL2 ;MYL3 ;MYLK2 ; MY07A ;ND5 ;ND6 ;NEMO ;NF1 ;NF2 ;NIPBL ;NR0B1 ;NR2E3 ;NRAS ;NSD1 ;0CA2 ;OCRL ;0PA1 ; OTC ;PABPN1 ;PAFAH1B1 ;PAH ;PARK2 ;PARK7 ;PARKIN ;PAX3 ;PAX6 ;PCDH15 ;PEX1 ;PEX2 ; PEX10;PEX13 ;PEX14 ;PEX19 ;PEX26 ;PEX3 ;PEX5 ;PINK1 ;PKD1 ;PKD2 ;PKD3 ;PKHD1 ;PKP2 ; PLEC1 ;PLODl ;PMM2 ;PMP22 ;POLG ;PPT1 ;PRCD ;PRKAG2 ;PRNP ;PROMl ;PRPF3 ;PRPF8 ;PRPH2 ; PRPN ;PSEN1 ;PSEN2 ;PTCH1 ;PTPN11 ;RAB7A ;RAF1 ;RAI1 ;RAPSN ;RB1 ;RDH12 ;RDS ;RECQL3 ; RET ;RHO ;ROR2 ;RP1 ;RP2 ;RP9 ;RPE65 ;RPGR ;RPGRIP1 ;RPL11 ;RPL35A ;RPS10 ;RPS17 ; RPS19 ;RPS24 ;RPS26 ;RPS6KA3 ;RPS7 ;RPSL5 ;RS1 ;RSPH4A ;RSPH9 ;RYR1 ;RYR2 ;SALL4 ; SCA3 ;SCN5A ;SCN9A ;SEMA4A ;SERPINA1 ;SERPING1 ;SGCD ;SH3BP2 ;SHOX ;SIX1 ;SIX5 ; SLC25A13 ;SLC25A4 ;SLC26A4 ;SMAD4 ;SMN1 ;SNCA ;SNRNP200 ;SODl ;SOSl ;SOX9 ;SP110 ; SPAST ;SPATA7 ;SPG3A ;SPG4 ;SPG7 ;TAF1 ;TBX5 ;TCOFl ;TGFBR1 ;TGFBR2 ;TNFRSC13C ; TNNC1 ;TNNI3 ;TNNT1 ;TNNT2 ;TNXB ;TOPORS ; TORI A ;TP53 ;TPM1 ;TRNG ;TRNI ;TRNK ;TRNL1 ; TRNQ ;TSC1 ;TSC2 ;TTN ;TTPA ;TTR ;TULP1 ;TWIST1 ;TXNDC3 ;TYR ;USH1C ;USH1H ;USH2A ;VCL ; VHL ;VPS13B ;WAS ;WRN ;WT1 和 ZNF9。
[0130] 在一些实施方案中,本公开内容总地来说涉及包含多个按照本文公开的标准设计 的靶特异性引物或包括本文中公开的靶特异性引物的任一个或多个的组合物,其中所述多 个靶特异性引物的至少一个在其整个长度上与选自如下基因的一个或多个与乳腺癌相关 的基因的至少一部分基本上互补:AIM1、AR、ATM、BARD1、BCAS1、BRIP1、CCND1、CCND2、CCNE1、 CDH1、CDK3、CDK4、CDKN2A、CDKN2B、CAMK1D、CHEK2、DIRAS3、EGFR、ERBB2、EPHA3、ERBB4、ETV6、 GNRH1、KCTD9、CDCA2、EBF2、EMSY、BNIP3L、PNMA2、DPYSL2、ADRA1A、STMN4、TRM35、ΡΑΚΙ、 AQP11、CLSN1A、RSF1、KCTD14、THRSP、NDUFC2、ALG8、KCTD21、USP35、GAB2、DNAH9、ZNF18、 MYOCD、STK11、TP53、JAK1、JAK2、MET、PDGFRA、PML、PTEN、RET、TMPRSS2、WNK1、FGFR1、IGF1R、 PPP1R12B、PTPRT、GSTM1、IP08、MYC、ZNF703、MDM1、MDM2、MDM4、MKK4、P14KB、NC0R1、NBN、 PALB2、RAD50、RAD51、ΡΑΚΙ、RSF1、INTS4、ZMIZ1、SEPHS1、F0XM1、SDCCAG1、IGF1R、TSHZ2、 RPSK6K1、PPP2R2A、MTAP、MAP2K4、AURKB、BCL2、BUB1、CDCA3、CDCA4、CDC20、CDC45、CHEK1、 F0XM1、HDAC2、IGF1R、KIF2C、KIFC1、KRAS、RB1、SMAD4、NC0R1、UTX、MTHDFD1L、RAD51AP1、TTK 和 UBE2C。
[0131] 在一些实施方案中,本公开内容总地来说涉及多核苷酸的组合,其中多核苷酸的 组合包括至少一个选自表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请 号13/458, 739,通过引用方式全文并入本文)的多核苷酸,以及一个或多个另外的不依赖 于本文中公开的多核苷酸的多核苷酸。在一些实施方案中,本公开内容总地来说涉及多核 苷酸的组合,其中多核苷酸的组合包括与选自表2、3、13、14、15、17和19(来自2012年4月 27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)的一个或多个多核苷酸 具有至少90%的同一性的多核苷酸。在一些实施方案中,本公开内容涉及选自表2、3、13、 14、15、17和19(来自2012年4月27日提交的美国申请号13/458, 739,通过引用方式全文 并入本文)的 2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、500、1000、2000、 3000、4000、5000、6000、7000、8000、9000、10, 000 或更多个多核苷酸。
[0132] 在一些实施方案中,本公开内容总地来说涉及多核苷酸的组合,其中多核苷酸的 组合包括至少一个选自表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申 请号13/458, 739,通过引用方式全文并入本文)的多核苷酸,以及一个或多个另外的不依 赖于本文中公开的多核苷酸的多核苷酸。在一些实施方案中,本公开内容总地来说涉及多 核苷酸的组合,其中多核苷酸的组合包括至少一个与选自表2、3、13、14、15、17和19(来自 2012年4月27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)的一个或多 个多核苷酸具有至少90%的同一'丨生的多核苷酸。在一些实施方案中,本公开内容涉及选自 表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458, 739,通过引 用方式全文并入本文)的 2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、500、 1000、2000、3000、4000、5000、6000、7000、8000、9000、10, 000 或更多个多核苷酸或一个或多 个与其具有至少90%的同一性的多核苷酸。
[0133] 在一些实施方案中,本公开内容总地来说涉及一对多核苷酸,其与选自EGFR、BRAF 或KRAS的至少一个基因的部分特异性退火。在一个实施方案中,一对与EGFR基因的一 部分特异性退火的多核苷酸包括下列扩增子ID的任一个或多个:229910389、227801665、 229055506、230397881、230175199、230195609、228630698、230632980、227722022、 232978808、231616816、230481741、231198336、229919273、227816834、228030652、 230679876、229747025、228741519、228636601、230635054、230738160、232984355、 228941652、230495367、231212482、229608278、230461276、228035285、230683371、 230173849、330137554、228857751、230742871、232237229、228956984、228732632、 231222418、231493149、229630617、229052979、230392156、230683680、230187475、 228709018、230628101、227716821、227830783、232260099、230075336、231314233 和 231239581。在一个实施方案中,一对与BRAF基因的一部分特异性退火的多核苷酸包括下 列扩增子 ID 的任一个或多个:222636793、223460541、223967627、326913823、223739184、 223944056、224404546、222922922、224119138、223519358、223465859、223971374、 222680486、223741661、223950351、224410546、222935598、224119999、222629880、 223175118、223719489、225222024、222684242、223700378、222258987、222895407、 223103332、222635553、223177865、223960162、326889377、223588249、223708886、 222259284、222903910和223104608。在一个实施方案中,一对与KRAS基因的一部分特异性 退火的多核苷酸包括下列扩增子ID的任一个或多个:233361228、234355242、234355242、 233466735、233466735、231132733、231132733、234764991、234764991、233467720、 233467720、231133990、231133990、233356818、326772204 和 326772204。
[0134] 在一些实施方案中,本公开内容总体上涉及用于扩增样品中的一个或多个靶序列 的试剂盒(以及使用这样的试剂盒的相关组合物、方法、装置和系统)。在一些实施方案 中,用于扩增样品中的一个或多个靶序列的试剂盒包括至少一个可扩增样品中的至少一个 靶序列的靶特异性引物。在一些实施方案中,试剂盒可包括至少两个可扩增样品中的至少 一个靶序列的靶特异性引物。在另一个实施方案中,试剂盒可包括多个用于扩增样品中的 至少两个靶序列的靶特异性引物,其中试剂盒包括a)与选自SEQ ID NO: 1-103、143的核酸 序列具有至少90%的同一性的第一靶特异性引物,其在有义方向上与第一靶序列基本上互 补;b)与选自SEQ ID NO: 1-103、143的核酸序列具有至少90%的同一性的第二靶特异性引 物,其在反义方向上与第一靶序列基本上互补;c)与选自SEQ ID NO: 1-103、143的核酸序列 具有至少90%的同一性的第三靶特异性引物,其在有义方向上与第二靶序列基本上互补; 和d)与选自SEQ ID N0:l-103、143的核酸序列具有至少90%的同一性的第四靶特异性引 物,其在反义方向上与第二靶序列基本上互补。在一些实施方案中,样品可以是包含环境、 水、微生物学、昆虫学、植物、真菌、动物或哺乳动物核酸的样品。在一些实施方案中,样品可 包括临床、手术、医生、法医或实验室获得的核酸样品。
[0135] 在一些实施方案中,本公开内容总地来说涉及用于扩增样品中的多个靶序列的方 法,包括在扩增条件下将样品的至少一些部分与至少一个本文中公开或使用本文中公开的 引物选择标准设计的靶特异性引物和聚合酶接触,从而产生至少一个扩增的靶序列。在一 些实施方案中,方法还包括将至少一个接头连接至至少一个扩增的靶序列,从而产生至少 一个接头连接的扩增的靶序列。在一些实施方案中,方法包括表2、3、13、14、15、17和19 (来 自2012年4月27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)中提供 的靶特异性引物的任一个或多个或与表2、3、13、14、15、17和19(来自2012年4月27日提 交的美国申请号13/458, 739,通过引用方式全文并入本文)中提供的靶特异性引物的任一 个或多个具有至少90%的同一性的任何核酸序列。
[0136] 在一些实施方案中,本公开内容总地来说涉及通过用一个或多个本文中公开的靶 特异性引物或使用本文中公开的引物选择标准设计的一个或多个靶特异性引物扩增存在 于样品中的至少一个靶序列产生的扩增产物。在一些实施方案中,本公开内容总地来说涉 及通过在扩增条件下,将样品中的至少一个靶序列与本文中公开的一个或多个靶特异性引 物或使用本文中公开的引物选择标准设计的一个或多个靶特异性引物接触产生的扩增产 物。在一些实施方案中,扩增产物可包括与癌症或遗传病相关的一个或多个突变。例如,可 将怀疑包含一个或多个与至少一种癌症相关的突变的样品进行本文中公开的扩增法的任 一个。可任选地将从选择的扩增法获得的扩增产物与已知在所述至少一种癌症方面是非癌 性、从而可用作参照样品的正常样品或匹配样品相比较。在一些实施方案中,通过本文中公 开的方法获得的扩增产物可任选地使用任何适当的核酸测序平台来进行测序,以测定扩增 产物的核酸序列,和任选地将其与来自正常或非癌性样品的测序信息相比较。在一些实施 方案中,扩增产物可包括一个或多个与抗生素抗性、致病性或遗传修饰相关的标志。在一些 实施方案中,可将通过在扩增条件下将至少一个靶序列与至少一个靶特异性引物接触获得 的一种或多种扩增产物的核酸序列用于测定遗传变体在一个或多个扩增产物中的存在或 不存在。
[0137] 在一些实施方案中,本公开内容总地来说涉及用于进行核酸扩增和核酸合成的组 合物(以及使用公开的组合物的相关试剂盒、方法、系统和装置)。在一些实施方案中,组合 物包含多个靶特异性引物对,至少一个靶特异性引物对包括靶特异性正向引物和靶特异性 反向引物。在一些实施方案中,组合物包括至少100、200、500、750、1000、2500、5000、7500、 10000、12000、15000、17500、20000或50000个不同的引物对,所述引物对的一些或全部可 以是靶特异性的。任选地,不同靶特异性引物对的至少两个针对(即,特异于)不同的靶序 列。
[0138] 在一些实施方案中,组合物包含至少一个可特异于至少一个扩增的靶序列的靶特 异性引物对。在一些实施方案中,组合物包含多个靶特异性引物对,至少两个靶特异性引物 对特异于不同的扩增的靶序列。在一些实施方案中,组合物包含靶特异性引物对,所述引物 对的每一个成员包括靶特异性引物,所述引物可与第一扩增的序列的至少一部分或其互补 序列杂交并且基本上不与样品中的任何其它扩增的序列的3'末端或5'末端互补。在一些 实施方案中,组合物包含至少一个可基本上不与样品中任何其它核酸分子的部分互补的靶 特异性引物对。在一些实施方案中,组合物包含多个靶特异性引物对,所述引物对在靶特异 性引物对内的一个或多个位置上包括一个或多个可切割基团。
[0139] 在一些实施方案中,组合物包含一个或多个靶特异性引物对,所述引物对可扩增 短的串联重复、单核苷酸多态性、基因、外显子、编码区、外显子组、或其部分。例如,多个靶 特异性引物对可一致地扩增一个基因、外显子、编码区、外显子组、或其部分。在一些实施方 案中,组合物包含靶特异性引物对,所述引物对被设计为使得使用所述一个或多个靶特异 性引物对扩增的核苷酸序列的重叠最小化。在一些实施方案中,可在3'末端、5'末端或两 端使一个或多个靶特异性引物之间的核苷酸序列重叠最小化。在一些实施方案中,多个靶 特异性引物中的至少一个引物在3'末端、5'末端或二者上包含少于5个核苷酸的核苷酸序 列重叠。在一些实施方案中,多个靶特异性引物的至少一个靶特异性引物相较于所述多个 靶特异性引物包括至少一个核苷酸的核苷酸序列缺口。在一些实施方案中,组合物包含一 个或多个靶特异性引物对,所述引物对被设计用来完全扩增一个或多个基因或外显子。例 如,多个靶特异性引物对可被设计用来一致地扩增(即,提供所有核苷酸的100%的代表) 单个基因或外显子。
[0140] 在一些实施方案中,至少两对靶特异性引物能够与模板核酸上的位置杂交和用作 利用聚合酶的模板依赖性引物延伸的底物。在一些实施方案中,模板依赖性引物延伸可包 括位于至少两对引物的引物的杂交位点之间的模板的区域的扩增,从而导致扩增区域或 "扩增子"的形成。通常地,扩增子的序列包括位于引物的杂交位点之间的模板的序列,以及 至少部分引物自身的序列。在一些实施方案中,扩增反应可包括至少约5、10、25、50、100、 150、200、250、400、500、750、1000、1200、1250、1500、1750、2000、2250、2500、2750、3000、 5000、7500或10, 000个不同的引物对。在一些实施方案中,扩增反应可导致产生至少约5、 10、25、50、100、150、200、250、400、500、750、1000、1200、1250、1500、1750、2000、2250、2500、 2750、3000、5000、7500或10,000个不同的扩增子。在一些实施方案中,使至少约75%、 80%、90%、95%、97%或99%的在扩增反应过程中产生的扩增子具有相似的大小,例如,扩 增子在大小上彼此相异不超过5、10、25、50、75、100、500、1000或2000个核苷酸。在一些实 施方案中,任意两个扩增子之间在长度上的差异不超过1%、5%或10%的扩增反应混合物 的平均扩增子长度。任选地,平均扩增子长度为约50、60、70、80、90、100、110、120、130、140、 150、200、250、500、1000、2000、10, 000个核苷酸或更大。在一些实施方案中,混合物中扩增 子间在长度的标准差不大于〇. l、〇. 25、0. 4、0. 5、0. 75、1、1. 5、2. 0、2. 4或3. 0。
[0141] 在一些实施方案中,组合物包含靶特异性引物对,所述引物对被设计来产生与相 邻的扩增的靶序列重叠单个核苷酸的扩增的靶序列。在一些实施方案中,组合物包含靶特 异性引物对,所述引物对被设计来产生不与相邻的扩增的靶序列重叠的扩增的靶序列。例 如,靶特异性引物对可被设计来产生间隔一个或多个核苷酸的扩增的靶序列。在一些实施 方案中,组合物包含被设计来使扩增的靶序列间隔约50个核苷酸的靶特异性引物对。
[0142] 在一些实施方案中,组合物包含多个外显子特异性或基因特异性靶特异性引物 对,所述引物对可基本上与单个外显子或基因互补。在一些实施方案中,组合物包含多个可 基本上与一个或多个外显子或基因互补的外显子特异性或基因特异性靶特异性引物对。在 一些实施方案中,组合物包含多个基本上互补的外显子特异性或基因特异性靶特异性引物 对并且没有两个引物对扩增超过10%的相同靶序列。在一些实施方案中,没有两个靶特异 性引物对扩增相同的外显子或基因。在一些实施方案中,靶特异性引物对扩增靶序列的约 100至约600个核苷酸。在一些实施方案中,靶特异性引物对可用于扩增约25 %至100 %的 外显子、基因或编码区。在一些实施方案中,组合物包含多个靶特异性引物对来产生多个扩 增的靶序列,并且没有单个扩增的靶序列相较于其它扩增的靶序列过表达超过50%。在一 些实施方案中,组合物包含多个靶特异性引物对,所述引物对被设计来产生多个基本上同 质(即,在GC含量、熔解温度或扩增的靶序列的长度上是均一的)的扩增的靶序列。在一 些实施方案中,所述多个靶特异性引物对在序列上重叠不超过5个核苷酸。
[0143] 在一些实施方案中,本公开内容总地来说涉及用于在多重PCR反应中防止或消除 非特异性扩增产物的方法。在一些实施方案中,方法包括(以及使用公开的方法所使用的 相关组合物、试剂盒、系统和装置)将一个或多个靶特异性引物对与具有多个靶序列的样 品中的靶序列杂交,延伸杂交的靶特异性引物以形成多个扩增的靶序列,使扩增的靶序列 变性和退火以形成多个双链的扩增的靶序列,以及对含有双链的扩增的靶序列的样品进行 消化步骤以消除非特异性扩增产物。在一些实施方案中,方法包括在一个或多个靶特异性 引物对的一个或多个位置上包括一个或多个可切割基团。在一些实施方案中,每一个靶特 异性引物对包括至少一个可切割基团。在一些实施方案中,引物对的每一个靶特异性引物 包括可切割基团。在一些实施方案中,消化是酶促或化学消化。在一些实施方案中,消化步 骤包括部分消化扩增的靶序列的靶特异性引物。在一些实施方案中,方法包括热稳定性聚 合酶。在一些实施方案中,热稳定性聚合酶可任选地通过热或化学处理来再活化。
[0144] 在一些实施方案中,组合物包含多个针对一种或多种疾病或障碍的靶特异性引物 对。在一些实施方案中,靶特异性引物对可基本上互补于与一种或多种癌症关联或相关的 靶序列。在一些实施方案中,靶特异性引物对可基本上互补于与一种或多种先天性或遗传 性障碍关联或相关的靶序列。在一些实施方案中,一个或多个靶特异性引物对可与一种或 多种神经性、代谢性、神经肌肉性、发育性、心血管性或自身免疫性障碍相关。在一些实施方 案中,一个或多个靶特异性引物对可与一个或多个与一种或多种神经性、代谢性、神经肌肉 性、发育性、心血管性或自身免疫性障碍相关的基因或外显子相关。在一些实施方案中,所 述多个靶特异性引物可包括与哺乳动物的肿瘤发生相关的基因或基因片段。
[0145] 在一些实施方案中,本公开内容总地来说涉及组合物(以及使用公开的组合物 的相关试剂盒、方法、系统和装置),所述组合物包含本文中公开的、包含在实施例中以及 相关附录、补充资料和附于其的序列表中,并包括2012年4月27日提交的美国申请号 13/458, 739(通过引用方式全文并入本文)中的所有表格中的引物的任何引物、一些引物 或所有引物。在一些实施方案中,本公开内容总地来说涉及组合物(以及使用公开的组合 物的相关试剂盒、方法、系统和装置),所述组合物包含实施例中使用的引物池的任何引物 池或其任何亚组。例如,在一些实施方案中,本公开内容总地来说涉及包含一个或多个靶特 异性引物的组合物,所述引物选自表2、3、13、14、15、17和19(来自2012年4月27日提交 的美国申请号13/458, 739,通过引用方式全文并入本文)中所列的引物,所述引物包括成 组的使用本公开内容的设计方法和选择标准设计和选择的引物,并且已被用于进行根据本 文中公开的方法的高度多重的扩增。本领域技术人员可容易理解的是,还可预期表2、3、13、 14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式全 文并入本文)中所示的每一个引物组的任何亚组支持多重扩增,因为已显示每一个表(例 如2012年4月27日提交的美国申请号13/458,739中的表格,该文献通过引用方式全文 并入本文)的完整组的引物支持这样的多重扩增,并且预期从池中除去特定引物对不会显 著改变剩余引物为了进行多重扩增的目的的性能。在一些实施方案中,本公开内容总地来 说涉及包含任意 1、2、5、10、25、50、100、250、500、750、1000、2500、5000、7500、10000、12500、 50000、100000或更多个表2、3、13、14、15、17和19(来自2012年4月27日提交的美国申请 号13/458, 739,通过引用方式全文并入本文)中所示的不同的靶特异性引物对的组合物。 在一些实施方案中,本公开内容涉及包含至少1、2、5、10、25、50、100、250、500、750、1000、 2500、5000、7500、10000、12500、50000、100000 或更多个选自 2、3、13、14、15, 17 和 19 (来自 2012年4月27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)的引物或 它们的互补序列的组合物。在一些实施方案中,本公开内容涉及包含至少1、2、5、10、25、50、 100、250、500、750、1000、2500、5000、7500、10000、12500、50000、100000 或更多个与表 2、3、 13、14、15、17和19(来自2012年4月27日提交的美国申请号13/458,739,通过引用方式 全文并入本文)的任何引物具有至少85%的同一性或互补性的引物的组合物。在一些实施 方案中,组合物包含至少一个 1、2、5、10、25、50、100、250、500、750、1000、2500、5000、7500、 10000、12500、50000、100000 或更多个选自表2、3、13、14、15、17和19(来自2012年4月27 日提交的美国申请号13/458, 739,通过引用方式全文并入本文)的引物或其互补序列,其 中至少一个引物包含至少一个核苷酸置换。核苷酸置换包括用任何其它核苷酸或核碱基对 任意引物的任意核苷酸残基或核碱基的替代,并且可包含例如嘌呤对嘌呤的置换、嘧啶对 嘧啶的置换、嘌呤对嘧啶的置换以及嘧啶对嘌呤的置换。在一些实施方案中,组合物的至少 一个引物可包含任意1、2、3、4、或更多个核苷酸置换。在一些实施方案中,组合物的至少一 个引物包括至少一个这样的引物:其中引物的含尿嘧啶核苷酸残基或核碱基的任一个、一 些或全部被含胸腺嘧啶的核苷酸残基或核碱替代。在一些实施方案中,组合物的至少一个 引物包括至少一个这样的引物:其中引物的含尿嘧啶核苷酸残基或核碱基的任1个、2个、3 个、4个、5个或更多个被含胸腺嘧啶的核苷酸残基或核碱替代。
[0146] 在一些实施方案中,靶特异性引物对可包括包含体细胞突变或种系突变的核酸序 列。在一些实施方案中,种系或体细胞突变可发现于表1,4, 16或18(来自2012年4月27 日提交的美国申请号13/458, 739,通过引用方式全文并入本文)中提供的基因的任一个或 多个中。在一些实施方案中,靶特异性引物对可用于扩增可用于检测具有小于5%的等位基 因频率的突变的存在的靶序列。在一些实施方案中,所述多个靶特异性引物包括至少500, 至少1000,至少3000,至少6000,至少10000,至少12000或更多个靶特异性引物对。
[0147] 在一些实施方案中,本公开内容总地来说涉及用于进行多重核酸扩增或多重核酸 合成的试剂盒。在一些实施方案中,试剂盒包括多个靶特异性引物。在一些实施方案中,试 剂盒还可包括聚合酶、至少一个接头和/或切割试剂。在一些实施方案中,试剂盒还可包括 dATP,dCTP,dGTP,dTTP和/或抗体。在一些实施方案中,切割试剂是可切割存在于一个或 多个靶特异性引物中的一个或多个切割基团的任何试剂。在一些实施方案中,切割试剂可 包括酶或化学试剂。在一些实施方案中,切割试剂可包括具有对于无嘌呤碱基的亲和力的 酶。在一些实施方案中,切割试剂可包括具有对于第一可切割基团的亲和力的第一酶,并且 还可包括具有对于第二可切割基团的亲和力的第二酶。在一些实施方案中,试剂盒还可包 括具有对于无碱基位点的亲和力的酶。在一些实施方案中,聚合酶是热稳定性聚合酶。在 一些实施方案中,试剂盒可包括一种或多种防腐剂、佐剂或核苷酸测序条形码。
[0148] 在一些实施方案中,本公开内容总地来说涉及用于测定拷贝数变异的方法(以及 相关组合物、系统、试剂盒和装置),包括进行本文中公开的扩增法的任何扩增法。
[0149] 详述
[0150] 下列不同示例性实施方案的说明仅仅是示例性和解释性的,并且不被解释为以任 何方式进行限定或限制。根据说明书和附图以及根据权利要求,本教导的其它实施方案、特 性、目标和有利方面将是显然的。
[0151] 如本文中所述,"扩增"或"扩增反应"及它们的变型通常是指籍以复制核酸分子 (称为模板核酸分子)的至少一部分或将其拷贝进入至少一个另外的核酸分子的任何作用 或过程。另外的核酸分子任选地包括与模板核酸分子的至少一些部分基本上同一或基本上 互补的序列。模板核酸分子可以是单链或双链的,并且另外的核酸分子可独立地是单链或 双链的。在一些实施方案中,扩增包括用于产生至少一个拷贝的核酸分子的至少一些部分 或产生至少一个拷贝的与核酸分子的至少一些部分互补的核酸序列的模板依赖性体外酶 催化的反应。扩增任选地包括核酸分子的线性或指数复制。在一些实施方案中,使用等温条 件进行这样的扩增;在其它实施方案中,这样的扩增可包括热循环。在一些实施方案中,扩 增是在单个扩增反应中包括多个靶序列的同时扩增的多重扩增。靶序列的至少一些可位于 单个扩增反应中包含的相同核酸分子上或不同靶核酸分子上。在一些实施方案中,"扩增" 包括单独的或组合的基于DNA和RNA的核酸的至少一些部分的扩增。扩增反应可包括单链 或双链核酸底物并且还可包括本领域技术人员已知的扩增过程的任何扩增过程。在一些实 施方案中,扩增反应包括聚合酶链式反应(PCR)。
[0152] 如本文中所述,"扩增条件"及其衍生词,通常是指适合用于扩增一个或多个核酸 序列的条件。这样的扩增可以是线性的或指数的。在一些实施方案中,扩增条件可包括等 温条件或可选择地可包括热循环条件,或等温与热循环条件的组合。在一些实施方案中,适 合用于扩增一个或多个核酸序列的条件包括聚合酶链式反应(PCR)条件。通常地,扩增条 件是指足以扩增核酸例如一个或多个靶序列,或扩增连接至一个或多个接头的扩增的靶序 列例如接头连接的扩增的靶序列的反应混合物。一般而言,扩增条件包括用于扩增或用于 核酸合成的催化剂例如聚合酶;对待扩增的核酸具有一定程度的互补性的引物;和一旦与 核酸杂交便促进引物延伸的核苷酸,例如脱氧核糖核苷酸三磷酸(dNTP)。扩增条件可能需 要引物与核酸的杂交或退火,引物的延伸和其中将延伸的引物与正在经历扩增的核酸序列 分离的变性步骤。通常地,但非必需地,扩增条件可包括热循环;在一些实施方案中,扩增条 件包括多个循环:其中退火、延伸和分离的步骤被重复。通常地,扩增条件包括阳离子例如 Mg++或Mn++(例如,MgCl2等)并且还可包括具有离子强度的多种改性剂。
[0153] 如本文中所述,"靶序列"或"目标靶序列"及其衍生词,通常是指可按照本公开 内容扩增或合成的任何单链或双链核酸序列,包括怀疑或预期存在于样品中的任何核酸序 列。在一些实施方案中,靶序列以双链形式存在,并且在添加靶特异性引物或附加的接头之 前,包含待扩增或合成的特定核苷酸序列的至少一部分或其互补序列。靶序列可包括在利 用聚合酶进行延伸之前与用于扩增或合成反应的引物杂交的核酸。在一些实施方案中,该 术语是指这样的核酸序列:其序列同一性、核苷酸的顺序或位置通过本公开内容的一个或 多个方法来确定。
[0154] 如本文中所定义,"样品"及其衍生词以其最广含义使用,包括怀疑包含靶的任何 样本、培养物等。在一些实施方案中,样品包含〇嫩,1?隱,?嫩,1^隱,核酸的嵌合、杂交或多重 形式。样品可包括任何含有一个或多个核酸的生物、临床、手术、农业、大气或基于水的样 本。该术语还包括任何分离的核酸样品例如基因组DNA、新鲜冷冻的或福尔马林固定的石 蜡包埋的核酸样本。考虑到任何可用的遗传样品可用于确定拷贝数变异。在一些实施方式 中,样品可包括DNA样品。在一些实施方式中,DNA样品可犾自组织样品、血液抽取、血楽、 肿瘤样品、活检样品、唾液、尿液、毛发、精液、痰、卵等。在一些实施方式中,DNA样品可获自 细胞培养物或细胞系。在一些实施方式中,DNA是基因组DNA、片段化的基因组DNA或福尔 马林固定的石蜡包埋(FFPE)的DNA。在一些实施方式中,样品的量等于单个细胞中的DNA 的量,或比其更多。在一些实施方式中,样品的量包括约3pg DNA或更多。
[0155] 如本文中所述,"接触"及其衍生词,当用于指两个或更多个组分时,通常是指籍以 促进或实现提及的组分的靠近、接近、混合或掺和而不一定需要此类组分的物理接触的任 何过程,以及包括将含有提及的组分的任一种或多种的溶液彼此混合。可以以任何特定顺 序或组合接触提及的组分,并且组分的引述的特定顺序不是限定性的。例如,"将A与B和 C接触"包括其中首先将A与B接触,随后与C接触的实施方案,和其中将C与A接触,随后 与B接触的实施方案,以及其中将A和C的混合物与B接触的实施方案等。此外,这样的接 触不一定需要接触过程的最终结果是包含所有提及的组分的混合物,只要在接触过程中在 一些点上所有提及的组分同时存在或同时包含在相同混合物或溶液中。例如,"将A与B和 C接触"可包括其中首先将C与A接触以形成第一混合物,随后将第一混合物与B接触以形 成第二混合物,之后从第二混合物除去C的实施方案;任选地随后还可除去A,仅留下B。当 待接触的提及的组分的一个或多个包括所述多个(例如,"将靶序列与多个靶特异性引物和 聚合酶接触")时,则所述多个的每一个成员可被视为接触过程的单个组分,以便接触可包 括以任何顺序或组合将所述多个的任一个或多个成员与所述多个的任何其它成员和/或 与任何其它提及的组分接触(例如,可将所述多个靶特异性引物的一些但非全部与靶序列 接触,随后与聚合酶接触,随后与所述多个靶特异性引物的其它成员接触)。
[0156] 如本文中所述,术语"引物"及其衍生物通常是指可与目标靶序列杂交的任何多核 苷酸。在一些实施方案中,引物还可用于引发核酸合成。通常地,引物用作可利用聚合酶将 核苷酸聚合至其上的底物;然而,在一些实施方案中,引物可被掺入合成的核酸链并且提供 另一个引物可与其杂交以引发与合成的核酸分子互补的新链的合成的位点。引物可由核苷 酸或其类似物的任意组合组成,所述核苷酸或类似物可被任选地连接以形成具有任何适当 长度的线性聚合物。在一些实施方案中,引物是单链寡核苷酸或多核苷酸(为了本公开内 容的目的,术语"多核苷酸"和"寡核苷酸"在本文中可互换使用,并且不一定表明两者之间 长度上的任何差异)。在一些实施方案中,引物是单链的但其也可以是双链的。引物任选 地天然产生,如在纯化的限制性消化物中,或可合成产生。在一些实施方案中,当暴露于扩 增或合成条件时,引物用作用于扩增或合成的起始点;这样的扩增或合成可以以模板依赖 性的方式发生,并且任选地导致与靶序列的至少一部分互补的引物延伸产物的形成。示例 性的扩增或合成条件可包括将引物与多核苷酸模板(例如,包含靶序列的模板)、核苷酸和 诱导剂例如聚合酶在适当的温度和pH下接触以诱导核苷酸至靶特异性引物的末端上的聚 合。如果是双链,可任选地在被用于制备引物延伸产物之前,处理引物以分开其链。在一些 实施方案中,引物是寡脱氧核糖核苷酸或寡核糖核苷酸。在一些实施方案中,引物可包含一 个或多个核苷酸类似物。靶特异性引物的确切长度和/或组成(包括序列)可影响许多性 质,包括熔解温度(Tm)、GC含量、二级结构的形成、重复核苷酸基序、预测的引物延伸产物 的长度、跨目标核酸分子的覆盖程度、存在于单个扩增或合成反应中的引物的数目、核苷酸 类似物或修饰的核苷酸在引物中的存在等。在一些实施方案中,可将引物与扩增或合成反 应中的相容性引物配对以形成由正向引物和反向引物组成的引物对。在一些实施方案中, 引物对的正向引物包含与核酸分子的链的至少一部分基本上互补的序列,引物对的反向引 物包含与所述链的至少一部分基本上同一的序列。在一些实施方案中,正向引物和反向引 物能够与核酸双链体的相对链杂交。任选地,正向引物引发第一核酸链的合成,并且反向引 物引发第二核酸链的合成,其中第一和第二链基本上彼此互补,或可杂交形成双链核酸分 子。在一些实施方案中,扩增或合成产物的一个末端由正向引物确定并且扩增或合成产物 的另一个末端由反向引物确定。在一些实施方案中,当需要长的引物延伸产物的扩增或合 成,例如扩增外显子、编码区或基因时,可产生几个覆盖期望的长度以使得能够充分扩增所 述区域的引物对。在一些实施方案中,引物可包括一个或多个可切割基团。在一些实施方 案中,引物长度在长度上在约10至约60个核苷酸,约12至约50个核苷酸和约15至约40 个核苷酸的范围内。通常地,引物能够与对应的靶序列杂交并且当在dNTP和聚合酶存在的 情况下暴露于扩增条件时经历引物延伸。在一些情况下,特定核苷酸序列或引物的一部分 在扩增反应开始时是已知的,或可通过本文中描述的方法的一个或多个方法来测定。在一 些实施方案中,引物在引物中的一个或多个位置上包括一个或多个可切割基团。
[0157] 如本文中所述,"靶特异性引物"及其衍生词,通常是指单链或双链多核苷酸,通 常寡核苷酸,其包括至少一个与包含靶序列的核酸分子的至少一部分具有至少50 %的互补 性,通常至少75%的互补性或至少85 %的互补性,更常见地至少90 %的互补性,更常见地 至少95%的互补性,更常见地至少98 %或至少99%的互补性或同一性的序列。在这样的 情况下,靶特异性引物与靶序列被描述为彼此"对应"。在一些实施方案中,靶特异性引物 能够与对应的靶序列(或与靶序列的互补序列)的至少一部分杂交;这样的杂交可任选地 在标准杂交条件下或在严格杂交条件下进行。在一些实施方案中,靶特异性引物不能与靶 序列,或与其互补序列杂交,但能够与包含靶序列的核酸链的一部分或其互补序列杂交。在 一些实施方案中,祀特异性引物包括至少一个与祀序列自身的至少一部分具有至少75 %的 互补性,通常地至少85 %的互补性,更常见地至少90 %的互补性,更常见地至少95%的互 补性,更常见地至少98 %的互补性,或更常见地至少99 %的互补性的序列;在其它实施方 案中,靶特异性引物包括至少一个与除靶序列外的核酸分子的至少一部分具有至少75%的 互补性,通常地至少85 %的互补性,更常见地至少90 %的互补性,更常见地至少95%的互 补性,更常见地至少98 %的互补性,或更常见地至少99 %的互补性的序列。在一些实施方 案中,靶特异性引物基本上不与存在于样品中的其它靶序列互补;任选地,靶特异性引物基 本上不与存在于样品中的其它核酸分子互补。在一些实施方案中,存在于样品中的不包括 或对应于靶序列(或靶序列的互补序列)的核酸分子被称为"非特异性"序列或"非特异 性核酸"。在一些实施方案中,靶特异性引物被设计来包括与其对应靶序列的至少一部分基 本上互补的核苷酸序列。在一些实施方案中,靶特异性引物在其整个长度上与包括其对应 靶序列的核酸分子的至少一部分具有至少95%的互补性,或至少99%的互补性或同一性。 在一些实施方案中,靶特异性引物可在其整个长度上与其对应靶序列的至少一部分具有至 少90%、至少95%的互补性、至少98%的互补性或至少99%的互补性或同一性。在一些实 施方案中,正向靶特异性引物和反向靶特异性引物定义了可用于通过模板依赖性引物延伸 扩增靶序列的靶特异性引物对。通常地,靶特异性引物对的每一个引物包括至少一个与包 括对应靶序列的核酸分子的至少一部分基本上互补但与样品的至少一个其它靶序列具有 低于50%的互补性的序列。在一些实施方案中,可在单个扩增反应中使用多个靶特异性引 物对进行扩增,其中每一个引物对包括正向靶特异性引物和反向靶特异性引物,每一个引 物包括至少一个与样品中的对应靶序列基本上互补或基本上同一的序列,并且每一个引物 对具有不同的对应靶序列。在一些实施方案中,靶特异性引物可在其3'末端或其5'末端 与存在于扩增反应中的任何其它靶特异性引物基本上不互补。在一些实施方案中,靶特异 性引物可包括最小的对存在于扩增反应中的其它靶特异性引物的交叉杂交。在一些实施方 案中,靶特异性引物包括最小的对扩增反应混合物中的非特异性序列的交叉杂交。在一些 实施方案中,靶特异性引物包括最小的自我互补性。在一些实施方案中,靶特异性引物可包 括一个或多个位于3'末端的可切割基团。在一些实施方案中,靶特异性引物可包括一个或 多个位于靶特异性引物的中央核苷酸附近或周围的可切割基团。在一些实施方案中,一个 或多个靶特异性引物在靶特异性引物的5'末端仅包括非可切割核苷酸。在一些实施方案 中,靶特异性引物相较于一个或多个不同的靶特异性引物在引物的3'末端或5'末端包括 最小的核苷酸序列重叠,任选地在相同扩增反应中。在一些实施方案中,单个反应混合物中 的1,2, 3, 4, 5, 6, 7, 8, 9, 10或更多个靶特异性引物包括上述实施方案的一个或多个实施方 案。在一些实施方案中,单个反应混合物中基本上所有的所述多个祀特异性引物包括上述 实施方案的一个或多个实施方案。
[0158] 如本文中所述,"聚合酶"及其衍生词通常是指可催化核苷酸(包括其类似物)至 核酸链中的聚合的任何酶。通常地但非必需地,这样的核苷酸聚合可以以模板依赖性方式 存在。这样的聚合酶可包括但不限于天然存在的聚合酶及其任何亚基和截短形式、突变型 聚合酶、变体聚合酶、重组、融合或工程化的聚合酶、化学修饰的聚合酶、合成的分子或装配 体以及保留催化这样的聚合的能力的其任何类似物、衍生物或片段。任选地,聚合酶可以是 包含一个或多个突变(包括用其它氨基酸对一个或多个氨基酸的替代、一个或多个氨基酸 从聚合酶的插入或缺失、或两个或更多个聚合酶的部分的连接)的突变型聚合酶。通常地, 聚合酶包含一个或多个活性部位,在该部位上可发生核苷酸结合和/或核苷酸聚合的催化 作用。一些示例性聚合酶包括但不限于DNA聚合酶和RNA聚合酶。如本文中所述,术语"聚 合酶"及其变体还指包含彼此连接的至少两个部分的融合蛋白,其中第一部分包含可催化 核苷酸至核酸链中的聚合并且连接至包含第二多肽的第二部分的肽。在一些实施方案中, 第二多肽可包括报告酶或持续合成能力增强性结构域。任选地,聚合酶可具有5'外切核酸 酶活性或末端转移酶活性。在一些实施方案中,聚合酶可任选地例如通过使用热、化学品或 新的量的聚合酶至反应混合物中的再添加来再活化。在一些实施方案中,聚合酶可包括任 选地可再活化的热启动聚合酶或基于适体的聚合酶。
[0159] 如本文中所述,术语"核苷酸"及其变体包括可选择地性结合至聚合酶,或可通过 聚合酶聚合的任何化合物,包括但不限于任何天然存在的核苷酸或其类似物。通常地,但非 必需的,在核苷酸与聚合酶的选择性结合后,核苷酸通过聚合酶被聚合至核酸链中;然而偶 尔地核苷酸可从聚合酶解离而不被掺入核酸链(在本文中称为"非生产性"事件的事件)。 这样的核苷酸不仅包括天然存在的核苷酸而且还包括任何类似物,无论其结构如何,其可 选择性结合聚合酶或可通过聚合酶进行聚合。虽然天然存在的核苷酸通常包括碱基、糖和 磷酸部分,但本公开内容的核苷酸可包括不存在此类部分之任一、一些或全部的化合物。在 一些实施方案中,核苷酸可任选地包括含有3、4、5、6、7、8、9、10或更多个磷原子的磷原子 的链。在一些实施方案中,可将磷原子链连接至糖环的任意碳,例如5'碳。磷链可通过间 插〇或S连接至糖。在一个实施方案中,链中的一个或多个磷原子可以是具有P和0的磷酸 基团的部分。在另一个实施方案中,链中的磷原子可通过间插〇、順、5、亚甲基、取代的亚甲 基、亚乙基、取代的亚乙基、CNH 2、C(0)、C(CH2)、CH2CH2或C(0H)CH 2R(其中R可以是4-吡啶 或1-咪唑)连接在一起。在一个实施方案中,链中的磷原子可具有含有0、BH3*S的侧基。 在磷原子链中,具有除〇外的侧基的磷原子可以是取代的磷酸基团。在磷原子链中,具有除 〇外的间插原子的磷原子可以是取代的磷酸基团。核苷酸类似物的一些实例描述于Xu,美 国专利号7, 405, 281中。在一些实施方案中,核苷酸包含标记并且在本文中称为"标记的核 苷酸";标记核苷酸的标记在本文中称为"核苷酸标记"。在一些实施方案中,标记可以以连 接至末端磷酸基团(即离糖最远的磷酸基团)的荧光染料的形式存在。可用于公开的方法 和组合物的核苷酸的一些实例包括但不限于核糖核苷酸、脱氧核糖核苷酸、修饰的核糖核 苷酸、修饰的脱氧核糖核苷酸、核糖核苷酸多磷酸、脱氧核糖核苷酸多磷酸、修饰的核糖核 苷酸多磷酸、修饰的脱氧核糖核苷酸多磷酸、肽核苷酸、修饰的肽核苷酸、金属核苷、核苷膦 酸酯以及修饰的磷酸-糖主链核苷酸、前述化合物的类似物、衍生物或变体等。在一些实施 方案中,核苷酸可包含非氧部分例如硫-或硼-部分来替代桥连核苷酸的α磷酸与糖或核 苷酸的α与β磷酸或核苷酸的β与 Υ磷酸、或核苷酸的任意其它两个磷酸之间或其任何 组合的氧部分。"核苷酸5'-三磷酸"是指在5'位置上具有三磷酸酯基团的核苷酸,有时称 为"ΝΤΡ"或"dNTP"和"ddNTP"来特别地指出核糖的结构特征。三磷酸酯基团可包括对不同 氧的硫置换,例如α -硫-核苷酸5' -三磷酸。关于核酸化学的综述,参见:Shabarova,Z. 和 Bogdanov, A. Advanced Organic Chemistry of Nucleic Acids, VCH, New York, 1994。
[0160] 如本文中所述,术语"延伸"及其变体,当用于指称给定的引物时,包括给定的聚 合酶的任何体内或体外酶促活性特征,所述特征与一个或多个核苷酸至已有的核酸分子的 末端的聚合相关。通常地但非必需的,这样的引物延伸以模板依赖性方式发生;在模板依 赖性延伸过程中,碱基的顺序和选择通过已建立的碱基配对法则来驱动,所述法则可包括 Watson-Crick型碱基配对法则,或可选择地(和特别地在牵涉核苷酸类似物的延伸反应的 情况下)通过一些其它类型的碱基配对范型来驱动。在一个非限定性实例中,延伸通过聚 合酶将核苷酸聚合在核酸分子的3' 0H末端上来发生。
[0161] 如本文中所述,术语"部分"及其变型,当用于指称给定的核酸分子例如引物或模 板核酸分子时,包括核酸分子长度(包括核酸分子的部分或整个长度)内的任何数目的连 续核苷酸。
[0162] 如本文中所述,术语"同一性"和"同一的"及其变型,当用于指两个或更多个核酸 序列时,是指在两个或更多个序列(例如,核苷酸或多肽序列)在序列上的相似性。在两 个或更多个同源序列的背景中,序列或其子序列的百分比同一性或同源性表示所有为相同 的单体单位(例如,核苷酸或氨基酸)的百分比(g卩,约70%的同一性,优选75%、80%、 85 %、90 %、95 %、98 %或99 %的同一性)。当在比较窗口或指定的区域内就最大对应性比 较和对齐(如使用BLAST或BLAST2. 0序列比较算法,利用下面描述的缺省参数测量的,或 通过手工比对和目测检测测量的)时,百分比同一性可以是在指定的区域范围内。当在氨 基酸水平上或核苷酸水平上存在至少85%的同一性时,序列被认为是"基本上同一的"。优 选地,同一性在长度为至少约25、50或100个核苷酸,或横跨至少一个比较的序列的整个 长度的区域范围内存在。用于测定百分比序列同一性和序列相似性的典型算法是BLAST 和 BLAST2. 0 算法,所述算法描述于 Altschul 等人,Nuc. Acids Res. 25:3389-3402 (1977) 中。其它方法包括 Smith&Waterman,Adv.Appl. Math. 2:482(1981)和 Needleman&Wunsch,J. Mol. Biol. 48:443(1970)等的算法。两个核酸序列基本上同一的另一个指标是两个分子或 其互补序列在严格杂交条件下彼此杂交。
[0163] 如本文中使用的术语"互补性"和"互补"及其变型是指可以以反向平行方向(如 在杂交的双链体中)在两个或更多个单个的对应位置上进行累积碱基配对的任意两个或 更多个核酸序列(例如,模板核酸分子、靶序列和/或引物的部分或全部)。这样的碱基配 对可按照任何一套已建立的法则,例如按照Watson-Crick碱基配对法则或按照一些其它 碱基配对范式来进行。任选地,在第一与第二核酸序列之间可存在"完全"或"完整"互补 性,其中第一核酸序列中的每一个核苷酸可与第二核酸序列上的对应反向平行位置中的核 苷酸进行稳定碱基配对相互作用。"部分"互补性描述了其中至少20 %但少于100 %的一 个核酸序列的残基与另一个核酸序列中的残基互补。在一些实施方案中,至少50%但少 于100%的一个核酸序列的残基与另一个核酸序列中的残基互补。在一些实施方案中,至 少70 %,80 %,90 %,95 %或98 %但少于100 %的一个核酸序列的残基与另一个核酸序列 中的残基互补。当至少85%的一个核酸序列的残基与另一个核酸序列中的残基互补时,序 列被认为是"基本上互补的"。在一些实施方案中,两个互补或基本上互补的序列能够在标 准或严格杂交条件下彼此杂交。"非互补的"描述其中少于20%的一个核酸序列的残基与 另一个核酸序列中的残基互补的核酸序列。当少于15%的一个核酸序列的残基与另一个 核酸序列中的残基互补时,序列被认为是"基本上不互补的"。在一些实施方案中,两个非 互补或基本上非互补的序列不能在标准或严格杂交条件下彼此杂交。"错配"可在任何位 置存在于两个不互补的相对核苷酸中。互补核苷酸包括在生理条件下在DNA复制过程中被 NDA聚合酶高效地彼此相对地掺入的核苷酸。在通常的实施方案中,互补核苷酸可在彼此反 向平行的位置中的核苷酸和/或多核苷酸的核碱基之间彼此形成碱基对,例如通过特异性 Watson-Crick型氢键形成的A-T/U和G-C碱基对,或通过一些其它类型的碱基配对范式形 成的碱基对。其它人工碱基对的互补性可基于其它类型的氢键合/或碱基的疏水性和/或 两个碱基之间的形状互补性。
[0164] 如本文中所述,"扩增的靶序列"及其衍生词,通常是指通过靶序列的扩增,使用本 文中提供的靶特异性引物和方法扩增靶序列产生的核酸序列。扩增的靶序列相对于靶序列 可以是相同的有义序列(在第二轮和随后偶数计数轮的扩增中产生的正链)或反义序列 (艮P,在第一轮和随后的奇数计数轮的扩增中产生的负链)。为了本公开内容的目的,扩增 的靶序列与反应中的另一个扩增的靶序列的任意部分具有少于50%的互补性。
[0165] 如本文中所述,术语"连接"及其衍生词通常是指用于将两个或更多个分子共价地 连接在一起,例如将两个或更多个核苷酸彼此共价连接的作用或过程。在一些实施方案中, 连接包括连接核酸的相邻核苷酸之间的切口。在一些实施方案中,连接包括在第一核酸分 子的末端与第二核酸分子的末端之间形成共价键。在一些实施方案例如其中待连接的核酸 分子包括常规核苷酸残基的实施方案中,连接可包括在一个核酸的5'磷酸基团与第二核酸 的3'羟基之间形成共价键,从而形成连接的核酸分子。在一些实施方案中,可使用用于连 接切口或在相邻核苷酸之间将5'磷酸键合至3'羟基的任何方法。在示例性实施方案中, 可使用酶例如连接酶。通常为了本公开内容的目的,可将扩增的靶序列连接至接头以产生 接头连接的扩增的靶序列。
[0166] 如本文中所述,"连接酶"及其衍生词,通常是指能够催化两个底物分子的连接的 任何试剂。在一些实施方案中,连接酶包括能够催化核酸的相邻核苷酸之间的切口连接的 酶。在一些实施方案中,连接酶包括能够催化一个核酸分子的5'磷酸与另一个核酸分子的 3'羟基之间的共价键形成,从而形成连接的核酸分子的酶。适当的连接酶可包括但不限于 T4DNA连接酶、T4RNA连接酶和大肠杆菌DNA连接酶。
[0167] 如本文中所述,"连接条件"及其衍生词,通常是指适合于将两个分子彼此连接的 条件。在一些实施方案中,连接条件适合于封闭核酸之间的切口或缺口。如本文中所定义, "切口"或"缺口"是指在核酸序列的内部核苷酸内缺乏单核苷酸戊糖环的5'磷酸至相邻单 核苷酸戊糖环的3'羟基的直接结合的核酸分子。如本文中所述,术语切口或缺口与该术语 在本领域中的使用一致。通常地,可在适当的温度和pH下,在酶例如连接酶存在的情况下 将切口或缺口连接。在一些实施方案中,T4DNA连接酶可在约70-72 °C的温度连接核酸之间 的切口。
[0168] 如本文中所述,"平末端连接"及其衍生词,通常是指两个平末端双链核酸分子彼 此的连接。"平末端"是指其中核酸分子的一条链的末端中的基本上所有核苷酸与相同核 酸分子的另一条链中的相对核苷酸碱基配对的双链核酸分子的末端。如果核酸分子具有 包含在长度上超过2个核苷酸的单链部分(在本文中称为"悬突"),则其不是平末端的。 在一些实施方案中,核酸分子的末端不包含任何单链部分,以便末端的一条链中的每一个 核苷酸与相同核酸分子的另一条链中的相对核苷酸碱基配对。在一些实施方案中,彼此 连接的两个平末端核酸分子的末端不包含任何重叠、共有或互补的序列。通常地,平末端 连接不包括使用另外的寡核苷酸接头来帮助双链的扩增的祀序列与双链接头,例如Mitra 和Varley,US2010/0129874(2010年5月27日公布的)中描述的补丁寡核苷酸(patch oligonucleotide)连接。在一些实施方案中,平末端连接包括切口平移反应来封闭在连接 过程中产生的切口。
[0169] 如本文中所述,术语"接头"或"接头及其互补序列"及其衍生物,通常是指可连接 至本公开内容的核酸分子的任意线性寡核苷酸。任选地,接头包括基本上不与样品内的至 少一个靶序列的3'末端或5'末端互补的核酸序列。在一些实施方案中,接头基本上不与存 在于样品中的任何靶序列的3'末端或5'末端互补。在一些实施方案中,接头包括基本上 不与扩增的靶序列互补的任何单链或双链线性寡核苷酸。在一些实施方案中,接头基本上 不与样品的至少一个、一些或全部核酸分子互补。在一些实施方案中,适当的接头长度在长 度上在约10-100个核苷酸,约12-60个核苷酸和约15-50个核苷酸的范围内。一般地,接 头可包括核苷酸和/或核酸的任意组合。在一些方面,接头可在一个或多个位置上包含一 个或多个可切割基团。在另一个方面中,接头可包括与引物例如通用引物的至少一部分基 本上同一的,或基本上互补的序列。在一些实施方案中,接头可包含条形码或标签来帮助下 游编目、鉴定或测序。在一些实施方案中,当在适当的温度和pH下,特别地在聚合酶和dNTP 存在的情况下连接至扩增的靶序列时,单链接头可用作用于扩增的底物。
[0170] 如本文中所述,"再扩增"及其衍生词通常指籍以将扩增的核酸分子的至少一部分 通过任何适当的扩增法(在一些实施方案中称为"第二"扩增或"再扩增")进一步扩增,从 而产生再扩增的核酸分子的任何过程。第二扩增无需与籍以产生扩增的核酸分子的原始扩 增法相同;再扩增的核酸分子也不需要与扩增的核酸分子完全相同或完全互补;所需的是 再扩增的核酸分子包含扩增的核酸分子的至少一部分或其互补序列。例如,再扩增可包括 使用不同的扩增条件和/或不同的引物,包括与初始扩增不同的靶特异性引物。
[0171] 如本文中所定义,"可切割基团"通常是指在掺入核酸后可在适当的条件下被切割 的任何部分。例如,可将可切割基团掺入靶特异性引物、扩增的序列、接头或样品的核酸分 子。在示例性实施方案中,靶特异性引物可包含可切割基团,所述切割基团被掺入扩增的 产物并且随后在扩增后被切割,从而从扩增的产物除去靶特异性引物的部分或全部。可通 过可接受的方法从靶特异性引物、扩增的序列、接头或样品的核酸分子切割或除去可切割 基团。例如,可通过酶促、热、光氧化或化学处理从靶特异性引物、扩增的序列、接头或样品 的核酸分子除去可切割基团。在一个方面,可切割基团可包含非天然存在的核碱基,例如, 寡脱氧核糖核苷酸可包含一个或多个RNA核碱基,例如可通过尿嘧啶糖基化酶除去的尿嘧 啶。在一些实施方案中,可切割基团可包括一个或多个修饰的核碱基(例如7-甲基鸟嘌 呤,8-氧-鸟嘌呤,黄嘌呤,次黄嘌呤,5, 6-二氢尿嘧啶或5-甲基胞嘧啶)或一个或多 个修饰的核苷(即,7-甲基鸟苷,8-氧-脱氧鸟苷,黄苷,肌苷,二氢尿苷或5-甲基胞 苷)。修饰的核碱基或核苷酸可通过酶促、化学或热的方式从核酸除去。在一个实施方案 中,可切割基团可包括可在扩增(或合成)后,在暴露于紫外光后从引物除去的部分(即, 溴脱氧尿苷)。在另一个实施方案中,可切割基团可包括甲基化胞嘧啶。通常地,甲基化胞 嘧啶可以例如在扩增(或合成)诱导后,在亚硫酸氢钠处理后从引物切割。在一些实施方 案中,可切割部分可包括限制性位点。例如,引物或靶序列可包括特异于一种或多种限制酶 的核酸序列,并且在扩增(或合成)后,可用一种或多种限制性酶处理引物或靶序列,以便 除去切割基团。通常地,对于靶特异性引物、扩增的序列、接头或样品的核酸分子,可在一个 或多个位置上包含一个或多个可切割基团。
[0172] 如本文中所述,"切割步骤"及其衍生词,通常是指籍以从靶特异性引物、扩增的序 列、接头或样品的核酸分子切割或除去可切割基因的任何过程。在一些实施方案中,切割步 骤包括化学、热、光氧化或消化过程。
[0173] 如本文中所述,术语"杂交"与其在本领域中的应用一致,通常是指两个核酸分子 经历碱基配对相互作用的过程。当一个核酸分子的任何部分是与另一个核酸分子的任何部 分碱基配对时,两个核酸分子被称作是杂交;不一定需要两个核酸分子在它们各自整个的 长度上杂交,在一些实施方案中,核酸分子的至少一个可包括不与另一个核酸分子杂交的 部分。短语"严格条件下的杂交"及其变型通常是指在其下靶特异性引物与靶序列的杂交 在高杂交温度和低离子强度存在的情况下发生的条件。在一个示例性实施方案中,严格杂 交条件包括在约60-68°C含有约30mM硫酸镁、约300mM Tris-硫酸盐,pH8. 9和约90mM硫 酸铵的含水环境,或其等同物。如本文中所述,短语"标准杂交条件"及其变型通常是指在 其下引物与寡核苷酸(即,靶序列)的杂交在低杂交温度和高离子强度存在的情况下发生 的条件。在一个示例性实施方案中,标准杂交条件包括在约50-55°C含有约100mM硫酸镁、 约500mM Tris-硫酸盐,pH8. 9和约200mM硫酸铵的含水环境或其等同物。
[0174] 如本文中所述,"三重核苷酸基序"及其衍生词,通常是指连续在3个核苷酸上重复 的任何核苷酸序列例如AAA或CCC。通常地,三重核苷酸基序在本公开内容的靶特异性引物 (或接头)中不会重复超过5次。
[0175] 如本文中所述,"ACA核苷酸基序"及其衍生词,通常是指核苷酸序列"ACA"。一般 而言,该基序在本公开内容的靶特异性引物(或接头)中不会重复3次或更多次。
[0176] 如本文中所述,"同聚物"及其衍生词,通常是指在长度上为8个核苷酸或更多核苷 酸的任何重复核苷酸序列,例如AAAAAAAA或CCCCCCCC。一般而言,如本文中所定义,同聚物 不存在于本公开内容的靶特异性引物(或接头)中。
[0177] 如本文中所述,"GC含量"及其衍生词,通常是指核酸分子的胞嘧啶和鸟嘌呤的含 量。一般而言,本公开内容的靶特异性引物(或接头)的GC含量为85%或更低。更常见 地,本公开内容的靶特异性引物或接头的GC含量为15-85%。
[0178] 如本文中所述,术语"末端"及其变型,当用于指核酸分子例如靶序列或扩增的靶 序列时,可包括核酸分子的末端30个核苷酸、末端20个核苷酸,甚至更常见地末端15个核 苷酸。由连接的系列连续核苷酸组成的线性核酸分子通常包括至少两个末端。在一些实施 方案中,核酸分子的一个末端可包括3'羟基或其等同物,并且可称为"3'末端"及其衍生 词。任选地,3'末端包括未连接至单核苷酸戊糖环的5'磷酸基团的3'羟基。通常地,3' 末端包括一个或多个与包含未连接的3'羟基的核苷酸相邻的5'连接的核苷酸,通常地30 个与3'羟基相邻的核苷酸,通常地末端20个,更常见地末端15个核苷酸。一般而言,一个 或多个连接的核苷酸可表示为存在于寡核苷酸中的核苷酸的百分比,或可提供为许多与未 连接的3'羟基相邻的连接的核苷酸。例如,3'末端可包括短于50%的寡核苷酸的核苷酸 长度。在一些实施方案中,3'末端不包括任何未连接的3'羟基,但可包括能够用作核苷酸 通过引物延伸和/或核苷酸聚合连接的位点。在一些实施方案中,术语"3'末端"例如,当 指靶特异性引物时,可在3'末端包含末端10个核苷酸、末端5个核苷酸、末端4、3、2或更 少的核苷酸。在一些实施方案中,术语"3'末端",当指靶特异性引物时,可包括位于3'末 端第10个(或更少)核苷酸位置的核苷酸。
[0179] 如本文中所述,"5'末端"及其衍生词,通常是指核酸分子例如靶序列或扩增的靶 序列的末端,其包括游离5'磷酸基团或其等同物。在一些实施方案中,5'末端包括未与相 邻的单核苷酸戊糖环的3'羟基连接的5'磷酸基团。通常地,5'末端包括一个或多个与5' 磷酸相邻的连接的核苷酸,通常地30个与包含5'磷酸基团的核苷酸相邻的核苷酸,通常地 末端20个,更常见地末端15个核苷酸。一般而言,一个或多个连接的核苷酸可表示为存在 于寡核苷酸中的核苷酸的百分比或可提供为许多与5'磷酸相邻的连接的核苷酸。例如,5' 末端可短于50%的寡核苷酸的核苷酸长度。在另一个示例性实施方案中,5'末端可包括约 15个与包含末端5'磷酸的核苷酸相邻的核苷酸。在一些实施方案中,5'末端不包括任何 未连接的5'磷酸基团但可包括能够用作至3'羟基或另一个核酸分子的3'末端的附着的 位点的任何部分。在一些实施方案中,术语"5'末端"例如当指靶特异性引物时,可在5'末 端上包含末端10个核苷酸、末端5个核苷酸、末端4、3、2或更少的核苷酸。在一些实施方 案中,术语"5'末端",当指靶特异性引物时,可包含位于距离5'末端10个(或更少)位置 上的核苷酸。在一些实施方案中,靶特异性引物的5'末端可仅包括非可切割的核苷酸(例 如不包含一个或多个本文中公开的可切割基团的核苷酸),或可切割核苷酸,这可由本领域 技术人员来容易的确定。
[0180] 如本文中所述,"保护基团"及其衍生语,通常是指可被掺入接头或靶特异性引物、 赋予靶特异性引物或接头化学选择性或保护其免受消化或化学降解的任何部分。通常地, 但不是必需地,保护基团可在靶特异性引物或接头中包含现有官能团的修饰,以实现化学 选择性。适当类型的保护基团包括醇、胺、磷酸、羰基或羧酸保护基团。在示例性实施方案 中,保护基团可包括具有碳原子的链的间隔子化合物。
[0181] 如本文中所述,"DNA条形码"或"DNA标签序列"及其衍生词,通常是指接头内的独 特的短的(6-14个核苷酸)核酸序列,其可用作区分或分离样品中的多个扩增的靶序列的 '钥匙'。为了本公开内容的目的,可将DNA条形码或DNA标签序列掺入接头的核苷酸序列。
[0182] 如本文中所述,短语"两轮靶特异性杂交"或"两轮靶特异性选择"及其衍生词通 常是指籍以将相同靶序列经历两轮连续的基于杂交的靶特异性选择的任何过程,其中靶序 列与靶特异性序列杂交。每一轮基于杂交的靶特异性选择可包括多个与靶特异性序列的至 少一些部分的靶特异性杂交。在一个示例性实施方案中,一轮靶特异性选择包括牵涉靶序 列的第一区域的第一靶特异性杂交和牵涉靶序列的第二区域的第二靶特异性杂交。第一与 第二区域可以相同或不同。在一些实施方案中,每一轮基于杂交的靶特异性选择可包括两 个靶特异性寡核苷酸(例如,正向靶特异性引物和反向靶特异性引物)的使用,以便每一轮 选择包括两个靶特异性杂交。
[0183] 如本文中所述,"可比较的最大最低熔解温度"及其衍生词,通常是指在切割可切 割基团后,每一个核酸片段针对单个接头或靶特异性引物的熔解温度(Tm)。比较通过单个 接头或靶特异性引物产生的每一个核酸片段的杂交温度以确定阻止来自靶特异性引物或 接头的任何核酸片段与靶序列的杂交所需的最大最低温度。一旦已知最大杂交温度,则可 能例如通过沿着引物的长度移动可切割基团的位置操作接头或靶特异性引物,来获得针对 每一个核酸片段的可比较的最大最低熔解温度。
[0184] 如本文中所述,"仅添加"及其衍生词,通常是指一系列步骤,其中将试剂和组分添 加至第一或单个反应混合物中。通常地,系列步骤不包括将反应混合物从第一容器移至第 二容器以完成系列步骤。一般而言,仅添加法不包括在包含反应混合物的容器外操作反应 混合物。通常地,仅添加法易于进行自动化和高通量。
[0185] 如本文中所述,"合成"及其衍生词,通常指包括利用聚合酶,任选地以模板依赖性 方式进行核苷酸聚合的反应。聚合酶通过来自核苷三磷酸(NTP)、脱氧核苷三磷酸(dNTP) 或双脱氧核苷三磷酸(ddNTP)的核苷单磷酸至正在延伸的寡核苷酸链的3'羟基的转移来 合成寡核苷酸。为了本公开内容的目的,合成包括杂交的接头或靶特异性引物通过来自脱 氧核苷三磷酸的核苷单磷酸的转移进行的系列延伸。
[0186] 如本文中所述,"聚合条件"及其衍生词,通常是指适合于核苷酸聚合的条件。在通 常的实施方案中,这样的核苷酸聚合通过聚合酶来催化。在一些实施方案中,聚合条件包括 用于引物延伸(任选地以模板依赖性的方式),从而导致合成核酸序列产生的条件。在一些 实施方案中,聚合条件包括聚合酶链式反应(PCR)。通常地,聚合条件包括使用足以合成核 酸并且包含聚合酶和核苷酸的反应混合物。聚合条件可包括用于靶特异性引物与靶序列的 退火以及引物在聚合酶的存在下以模板依赖性的方式进行的延伸的条件。在一些实施方案 中,聚合条件可使用热循环来实施。此外,聚合条件可包括多个循环,其中,重复退火、延伸 和分离两个核酸链的步骤。通常地,聚合条件包括阳离子例如MgCl 2。一般而言,一个或多 个核苷酸形成核酸链的聚合包括将核苷酸通过磷酸二酯键彼此连接,然而,在特定核苷酸 类似物的背景中替代性连接可以是可能的。
[0187] 如本文中所述,术语"核酸"是指天然核酸、人造核酸、其类似物或其组合,包括多 核苷酸和寡核苷酸。如本文中所述,术语"多核苷酸"和"寡核苷酸"可互换使用,并且意 指核苷酸的单链和双链聚合物,包括但不限于通过核苷酸间磷酸二酯键连接(例如,3' -5' 和2' -5'、反向连接例如3' -3'和5' -5')的2' -脱氧核糖核苷酸(核酸)和核糖核苷酸 (RNA)、分支结构或核酸类似物。多核苷酸具有伴随的抗衡离子例如H+、NH4+、三烷基铵、Mg 2+、 Na+等。寡核苷酸可完全由脱氧核糖核苷酸,完全由核糖核苷酸组成或为其嵌合混合物。寡 核苷酸可由核碱基和糖类似物组成。多核苷酸通常在大小上从少数单体单位例如(5-40) (此时它们在本领域中更常见地被称为寡核苷酸)变化至几千个单体核苷酸单位(此时它 们在本领域更常见地被称为多核苷酸);然而,为了本发明的目的,寡核苷酸和多核苷酸都 可具有任何适当的长度。除非另有所指,否则无论何时显示寡核苷酸序列,应当理解核苷酸 以5'至3'的顺序从左至右显示,并且"A"表示脱氧腺苷,"C"表示脱氧胞苷,"G"表示脱氧 鸟苷,"T"表示胸苷,"U'表示尿苷。寡核苷酸被认为具有"5'末端"和"3'末端",因为单 核苷酸通常通过一个核苷酸的5'磷酸或等同基团至其相邻核苷酸的3'羟基或等同基团的 连接(任选地通过磷酸二酯键或其它适当的连接)进行反应而形成寡核苷酸。
[0188] 如本文中所述,术语"切口平移"及其变型包括将核酸链内的一个或多个切口或缺 口沿着核酸平移至新位置。在一些实施方案中,当双链接头被连接至双链扩增的靶序列时, 切口可形成。在一个实例中,引物可在其5'末端包含可连接至双链扩增的靶序列、从而在 互补链中在接头与扩增的靶序列之间留下切口的磷酸基团。在一些实施方案中,切口平移 导致切口至核酸链的3'末端的移动。在一些实施方案中,移动切口可包括接头连接的扩增 的靶序列进行切口平移反应。在一些实施方案中,切口平移反应可以是偶联的5'至3'DNA 聚合/降解反应,或被偶联至5'至3' DNA聚合/链置换反应。在一些实施方案中,移动切 口可包括在切口位置进行DNA链延伸反应。在一些实施方案中,移动切口可包括对切口进 行单链外切核酸酶反应以形成接头连接的扩增的靶序列的单链部分,和对接头连接的扩增 的靶序列的单链部分进行DNA链延伸反应至新的位置。在一些实施方案中,切口在与连接 的位置相对的核酸链中形成。
[0189] 如本文中所述,术语"聚合酶链式反应"("PCR")是指K.B.Mullis美国专利号 4, 683, 195和4, 683, 202 (通过引用并入本文)的方法,其描述了用于在基因组DNA的混合 物中增加目标多核苷酸的区段的浓度而无需克隆或纯化的方法。该用于扩增目标多核苷酸 的方法由如下步骤组成:将大量过量的两个寡核苷酸引物引入包含期望的目标多核苷酸的 DNA混合物,随后在DNA聚合酶存在的情况下进行精确的一系列热循环。两个引物与目标 双链多核苷酸的其各自的单链互补。为了进行扩增,将混合物变性,随后使引物与目标多核 苷酸分子内的其互补序列退火。退火后,引物通过聚合酶延伸以形成新的一对互补链。可 多次重复变性、引物退火和聚合酶延伸的步骤(即,变性、退火和延伸组成一个"循环";可 存在许多"循环")来获得高浓度的期望的目标多核苷酸的扩增区段。期望的目标多核苷酸 的扩增区段(扩增子)的长度可通过引物彼此相对的相对位置来确定,因此,该长度是个可 控制参数。由于重复该过程的原因,该方法称为"聚合酶链式反应"(下文中称为"PCR")。 因为目标多核苷酸的期望的扩增区段在混合物中成为主要核酸序列(在浓度上),因此它 们被称作"PCR扩增的"。如本文中所定义,包含多个靶核酸分子的样品内的靶核酸分子是 通过PCR扩增的。在对上述方法的改进中,可使用多个不同的引物对(在一些情况下,每目 标靶核酸分子一个或多个引物对,从而形成多重PCR反应)来PCR扩增靶核酸分子。通过 使用多重PCR,可能从样品同进扩增多个目标核酸分子来形成扩增的靶序列。还可能通过 几个不同的方法(例如,利用生物分析仪或qPCR定量,利用标记探针杂交;掺入生物素化引 物,随后进行抗生物素蛋白-酶缀合物检测;将 32P_标记的脱氧核苷酸三磷酸例如dCTP或 dATP掺入扩增的靶序列)来检测扩增的靶序列。可利用适当的引物组扩增任何寡核苷酸序 列,从而允许从基因组DNA、cDNA、福尔马林固定的石蜡包埋的DNA、细针活检组织和各种其 它来源扩增靶核酸分子。具体地,通过本文中公开的多重PCR产生的扩增的靶序列自身是 用于随后的PCR扩增或各种下游测定或操作的高效底物。
[0190] 如本文中所定义,"多重扩增"是指使用至少一个靶特异性引物进行的样品内两个 或更多个靶序列的选择性和非随机扩增。在一些实施方案中,进行多重扩增,以便在单个 反应容器中扩增一些或所有靶序列。给定的多重扩增的"重数(plexy)"或"重(plex)"通 常是指在该单个多重扩增过程中扩增的不同的靶特异性序列的数目。在一些实施方案中, 重可以是约 12-重、24-重、48-重、96-重、192-重、384-重、768-重、1536-重、3072-重、 6144-重或更多重。
[0191] 在一些实施方式中,本公开内容总地来说涉及确定一个或多个样品的拷贝数变异 的方法。在一些实施方式中,本方法包括确定存在于样品中的一个或多个基因的拷贝数变 异。在一些实施方式中,本方法包括通过确定基因丢失和/或基因重复来确定一个或多个 基因的拷贝数变异。在一些实施方式中,本方法包括确定存在于样品中的一个或多个染色 体的拷贝数变异。在一些实施方式中,本方法包括确定相同样品中的一个或多个基因的拷 贝数变异和一个或多个染色体的拷贝数变异。在一些实施方式中,确定拷贝数变异的方法 可包括鉴定一个或多个样品中的染色体丢失、染色体插入和/或染色体重复。在一些实施 方式中,拷贝数变异包括确定样品中非整倍性的存在。在一些实施方式中,拷贝数变异包括 鉴定样品的杂合性的丢失。在一些实施方式中,确定拷贝数变异的方法可以包括同时确定 一个或多个样品的拷贝数变异。在一些实施方式中,本方法包括使用基于ISFET的测序方 法确定一个或多个样品的拷贝数变异。在一些实施方式中,本方法包括同时确定一个或多 个样品中的一个或多个染色体的染色体丢失、染色体插入和/或染色体重复。
[0192] 在一些实施方式中,确定拷贝数变异的方法包括通过下列步骤扩增样品中的多个 不同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个不同的 靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物 中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待 扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶序列切 割所述可切割基团;通过将至少一个接头连接至至少一个扩增的靶序列产生一个或多个接 头连接的扩增的靶序列;使用引物再扩增所述至少一个接头连接的扩增的靶序列;对至少 一个扩增的接头连接的靶序列进行测序;计算所述至少一个扩增的接头连接的靶序列的测 序读取(sequencing read)的数目;和确定所述至少一个扩增的接头连接的祀序列的拷贝 数变异。
[0193] 在一些实施方式中,本方法包括通过下列步骤扩增两个或更多个样品中的多个不 同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个不同的靶 序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物中 的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待扩 增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶序列切割 所述可切割基团;通过将至少一个不同的条码接头连接至来自每个样品的至少一个扩增的 靶序列产生一个或多个条码接头连接的扩增的靶序列;使用引物再扩增来自每个样品的所 述至少一个条码接头连接的扩增的靶序列;对来自每个样品的至少一个扩增的接头连接的 扩增的靶序列进行测序;计算来自每个样品的所述至少一个扩增的接头连接的靶序列的测 序读取的数目;和确定每个样品的所述至少一个扩增的接头连接的靶序列的拷贝数变异。
[0194] 在一些实施方式中,确定染色体拷贝数变异的方法包括通过下列步骤扩增样品中 的多个不同靶序列:在单一扩增反应混合物中产生多个不同的扩增的靶序列,将所述多个 不同的靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异 性引物中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括 对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一个扩增的靶 序列切割所述可切割基团;通过将至少一个接头连接至至少一个扩增的靶序列产生一个或 多个接头连接的扩增的靶序列;使用引物再扩增所述至少一个接头连接的扩增的靶序列; 对至少一个扩增的接头连接的靶序列进行测序;计算所述至少一个扩增的接头连接的靶序 列的测序读取的数目;和确定所述至少一个扩增的接头连接的靶序列的染色体拷贝数变 异。
[0195] 一般地,确定拷贝数变异的方法包括从样品扩增多个不同的靶序列。在一些实施 方式中,不同的靶序列包括侧翼于单核苷酸多态性(SNP)的一个或多个核酸序列。从而,侧 翼于SNP的靶序列的扩增导致对应于SNP的核酸序列的扩增,因此导致测序步骤中SNP的 鉴定。因此,在一些实施方式中,本方法包括从一个或多个样品鉴定一个或多个单核苷酸多 态性。
[0196] 因此,鉴定样品中的一个或多个SNP的方法包括通过下列步骤扩增样品中的侧翼 于一个或多个SNP的多个不同的靶序列:在单一扩增反应混合物中产生侧翼于一个或多个 SNP的多个不同的扩增的靶序列,将侧翼于一个或多个SNP的多个不同的靶序列与多个靶 标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物的至少一个和扩 增的靶序列的至少一个包括可切割基团和对应于一个或多个SNP的核酸序列,并且其中所 述扩增包括对于待扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择;从至少一 个扩增的靶序列切割可切割基团;通过将至少一个接头连接至至少一个扩增的靶序列而产 生一个或多个接头连接的扩增的靶序列;使用引物再扩增所述至少一个接头连接的扩增的 靶序列;对至少一个扩增的接头连接的靶序列进行测序;计算至少一个扩增的接头连接的 靶序列的测序读取的数目;和确定一个或多个SNP在一个或多个扩增的接头连接的靶序列 中的存在。
[0197] 在一些实施方式中,一个或多个扩增的接头连接的靶序列的测序包括本领域普通 技术人员已知的任何适用的方法或平台。在一些实施方式中,测序可以包括ISFET,基于离 子的或基于桥式PCR的测序。在一些实施方式中,测序可以包括测序平台,例如Ion Torrent Proton?或PGM?平台(Life Technologies, CA, Catalog No. 4462917)。在一些实施方式中, 测序平台可以任选地包括进行本方法的另外的步骤的软件,例如计算测序读取的数目和/ 或确定拷贝数变异。
[0198] 在一些实施方式中,计算一个或多个扩增的接头连接的靶序列的测序读取的数 目可以包括本领域普通技术人员已知的任何方法。通常而言,每个扩增的接头连接的靶 序列的测序读取的数目被报告为:每个扩增的接头连接的靶序列的总的映射的测序读取 的数目。在一些实施方式中,本方法可包括计算测序运行中的每个扩增的接头连接的靶 序列的测序读取的数目。在一些实施方式中,本方法可包括计算一组选择的扩增的接头 连接的靶序列的测序读取的数目,例如与特异性基因组坐标或基因相关的映射的测序读 取的数目。在一些实施方式中,本方法可包括计算来自一个或多个样品的一个或多个扩 增的接头连接的靶序列的测序读取的数目,例如配对的遗传样品;来自不同来源的样品, 例如水来源和食品来源;或来自不同个体或动物的样品,例如亲代样品和子代样品。通常 而言,样品包含足够的遗传材料,以进行所述一个或多个不同靶序列的扩增。在一些实施 方式中,所述样品可包括单个细胞,从单个细胞提取的DNA,或分离自循环的肿瘤细胞的 DNA。例如,根结本文的方法,可以在测定例如Ion Torrent Hotspot Mutation Panel?(Life Technologies, CA, Catalog No. 4471262), the Comprehensive Cancer Panel?(Life Technologies, CA, Catalog No. 4477685), or the Inherited Disease Panel(Life Technologies, CA, Catalog No. 447686)中使用基因组DNA或福尔马林固定的石錯包埋的 (FFPE)DNA,在进行了扩增和接头连接步骤之后,在测序平台例如Ion Torrent Proton?或 PGM?platform(Life Technologies, CA, Catalog No. 4462917)上对文库进行测序。然而,在 本文公开的方法中可以使用任何能够计算每个扩增子的映射的读取数目的测序平台。
[0199] 测序平台的数据输出可以任选地以这样的方式来过滤以使操作者能够选择一个 或多个扩增的接头连接的靶序列来进行拷贝数测定。在一些实施方式中,测序平台的数 据输出可以任选地被过滤以选择一个或多个扩增的接头连接的靶序列以进行拷贝数测 定,这通过计算每个选择的扩增的接头连接的靶序列的测序读取的数目来进行。在一些 实施方式中,跨多个样品提供选择的扩增的接头连接的靶序列的测序读取的数目,例如 通过使用多个条码化的文库。在一些实施方式中,选择的扩增的接头连接的靶序列与一 个或多个目标基因相关。在其它实施方式中,测序平台的数据输出可以任选地被过滤以 计算与已知的病症或疾病相关的一个或多个扩增的接头连接的靶序列的测序读取的数 目。在一些实施方式中,测序平台的数据输出可以被过滤以计算与癌症或遗传疾病相关 的基因的测序读取的数目,例如通过使用Ion Ampliseq? Inherited Disease Panel (Life Technologies, CA, Catalog No. 4477686)或 Ion Ampliseq? Comprehensive Cancer Panel (Life Technologies, CA, Catalog No. 4477685)和 Ion Torrent Suite 软件。在一些 实施方式中,输出可以任选地被配置为计算跨基因组的一个或多个扩增的接头连接的靶序 列(通过例如染色体坐标或基因坐标作图的)的测序读取的数目。
[0200] 在一些实施方式中,本公开内容的扩增的接头连接的靶序列对应于与一个或多个 基因或染色体相关的扩增子。在一些实施方式中,为每个目标基因或染色体制备多个扩增 子。在一些实施方式中,扩增子跨基因的编码区和/或UTR区。在一些实施方式中,扩增的 接头连接的靶序列被设计为沿着基因或遍及基因的长度在交错的或常规相间的间隔发生。 在一些实施方式中,扩增的接头连接的靶序列被设计为跨基因组的每个染色体的间隔发 生。在一些实施方式中,扩增的接头连接的靶序列被设计为与相同样品中的另一个扩增的 接头连接的靶序列不重叠。在一些实施方式中,扩增的接头连接的靶序列被设计为扩增与 肿瘤相关的基因。用于本公开的方法的祀标特异性引物的实例包括来自Hotspot Mutation Panel?, Inherited Disease Panel? 和 Comprehensive Cancer Panel? 的引物库,都可从 Life Technologies, CA 商购获得。
[0201] 在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括: 确定扩增的接头连接的靶序列的总的映射的测序读取的数目。在一些实施方式中,计算扩 增的接头连接的靶序列的测序读取的数目可以包括:确定相对于同一个测序运行中获得的 总的映射的测序读取的数目,扩增的接头连接的靶序列的总的映射的测序读取的数目。在 一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括:将扩增的接 头连接的靶序列的总的映射的测序读取除以测序运行中获得的总的映射的测序读取,乘以 100,以获得"百分率频率"。例如,相对于单一测序运行中等于100的总的映射测序读取(包 括扩增子A、B、C、D和E),单个扩增的接头连接的靶序列的等于1的总的映射的测序读取 (扩增子A)将对应于1%的频率。在一些实施方式中,计算扩增的接头连接的靶序列的测 序读取的数目可以包括:确定在指定阈值之上的对于扩增的接头连接的靶序列获得的测序 读取的数目。在一些情况下,所述阈值可以包括人工阈值,例如大于40个总的映射的读取 /扩增的接头连接的靶序列,或大于〇. 5百分率频率。
[0202] 在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目可以包括: 一个样品中的扩增的接头连接的靶序列的总的映射的测序读取的数目除以第二样品中的 相同的扩增的接头连接的靶序列的总的映射的测序读取的数目,以产生"百分率比率"。
[0203] 在一些实施方式中,样品之一是参考样品,其不含拷贝数变异(即,是正常DNA样 品)。在一些实施方式中,样品之一是参考样品,其不含基因或染色体拷贝数变异。在一些 实施方式中,第二样品是目标样品,其基因拷贝数变异或染色体拷贝数变异是待确定的。在 一些实施方式中,每个样品可以是目标样品,其基因拷贝数变异或染色体拷贝数变异是待 测的(在不存在参考样品的情况下)。例如,已知基因 ERBB2在一些形式的结肠癌中是高 度重复的。含有高水平的ERBB2重复的样品可以使用本文的方法被鉴定为具有拷贝数变异 (见图39A和图39B)。在该情况下,发现位于ERBB2内的几个扩增的接头连接的靶序列的 总的映射的测序读取的数目相对于同一测序运行中位于ERBB2邻近位置的其它基因显著 较高(高20倍)。因此,无需参考样品,操作者能够直接从测序输出确定哪些扩增的接头连 接的靶序列显著升高(或降低)。
[0204] 在一些实施方式中,计算扩增的接头连接的靶序列的测序读取的数目还可以包 括:确定一个或多个扩增的接头连接的靶序列的百分率比率的以2为底的对数比率。一般 地,为了确定扩增的接头连接的靶序列的以2为底的对数比率,将第一样品中的扩增的接 头连接的靶序列的映射的测序读取的总数目与第二样品中相同的扩增的接头连接的靶序 列的映射的测序读取的总数目进行比较,以获得百分率比率。然后使用已经确定的百分率 比率计算每个扩增的接头连接的靶序列的以2为底的对数比率(log 2比率)。例如,将来自 样品1的扩增的接头连接的靶序列(扩增子A)的映射的测序读取的总数目与来自不同样 品(样品2)的相同的扩增的接头连接的靶序列(扩增子A)的映射的测序读取的总数目进 行比较以计算百分率比率。然后使用每个扩增的接头连接的靶序列的百分率比率计算以2 为底的对数。在一些实施方式中,可以将l〇g 2比率跨一个或多个基因、跨染色体和/或跨 基因组作图。在该实施方式中,每个l〇g2比率对应于每个扩增的接头连接的靶序列相对于 来自另一个样品的对应的扩增的接头连接的靶序列的标准化。当比较肿瘤样品的测序数 据与匹配的正常组织样品的测序数据时,或者当比较遗传上相关个体例如祖父母、父母和/ 或子女时,或者当比较来自不同细胞系的细胞时,l〇g 2比率的图是特别有用的可视化工具, 因为它提供了容易的可视形式,通过它鉴定无关项,因此,鉴定哪些扩增的接头连接的靶序 列在目标样品中是过度代表的或代表不足的。
[0205] 在一些实施方式中,可以使用本文公开的方法测定样品的拷贝数变异。在一些实 施方式中,拷贝数变异可以包括染色体变异和/或等位基因变异,使用本文公开的一个或 多个方法。在一些实施方式中,可以使用公开的方法对一个或多个样品进行核型分型。在一 些实施方式中,可以使用公开的方法测定两个或更多个样品的拷贝数变异,染色体变异和/ 或等位基因变异。在一些实施方式中,可以使用公开的方法测定样品的杂合性的丢失。在 一些实施方式中,两个样品可以包括:(a) 1个参考样品和1个目标样品;(b) 2个参考样品; (c)2个目标样品;或(d)单个样品的一式两份。在其它实施方式中,可以同时测定三个或 更多个样品的拷贝数变异、染色体变异和/或等位基因变异。任选地,样品之一可以包括参 考样品。在一些实施方式中,参考样品可以包括已知的遗传内容,或包括含有正常拷贝数的 一个或多个基因或染色体的对照样品。在一些实施方式中,对照样品可以包括一个或多个 基因或染色体的正常拷贝数,因此,可用于与一个或多个目标样品进行对比。此处,如果目 标样品产生与正常的对照样品实质上相似的l〇g 2比率或百分率频率,则可以得出结论:目 标样品含有正常拷贝数的存在于对照样品中的该一个或多个基因和/或染色体。
[0206] 在一些实施方式中,对照样品可以包括异常拷贝数的一个或多个目标基因或染色 体,并且可用于与目标样品进行比较。在该情况下,如果目标样品产生与异常的对照样品实 质上相似的l〇g 2比率或百分率频率,则可以得出结论:目标样品含有异常拷贝数的存在于 该异常对照样品中的该一个或多个基因和/或染色体。
[0207] 在一些实施方式中,异常对照样品可以包括一种或多种形式的非整倍性。在一 些实施方式中,异常对照样品可以包括三体性,例如三体性8,三体性9,三体性13,三体性 16,三体性18,三体性21和/或三体性22。在一些实施方式中,异常对照样品可以包括性 染色体的非整倍性,例如X〇(Turner氏综合征),XXX(三X综合征);XXXX(四X综合征), XXXXX(五 X 综合征),XXY(klinefelter 氏综合征),XXYY,XXXY,XXYYY,XXXYY,XXXXY, XYY (XYY 综合征),XYYY 和 / 或 XYYYY。
[0208] 在一些实施方式中,目标样品可以包括一种或多种形式的非整倍性。在一些实施 方式中,目标样品可以包括三体性,例如三体性8,三体性9,三体性13,三体性16,三体性 18,三体性21和/或三体性22。在一些实施方式中,目标样品可以包括性染色体的非整倍 性,例如X〇 (Turner氏综合征),XXX (三X综合征);XXXX (四X综合征),XXXXX (五X综合 征),XXY(klinefelter 氏综合征),XXYY,XXXY,XXYYY,XXXYY,XXXXY,XYY(XYY 综合征), ΧΥΥΥ和/或ΧΥΥΥΥ。在一些实施方式中,目标样品可以包括杂合性的丢失。在一些实施方 式中,目标样品可以包括来自相关或不相关的遗传来源的多个DNA样品。
[0209] 在一些实施方案中,本公开内容总地来说涉及用于在一群核酸分子中的一个或多 个靶核酸分子的选择性扩增中,避免或减少扩增假象(例如,引物二聚体)的形成的方法、 组合物、系统、装置和试剂盒。
[0210] 在一些实施方案中,本公开内容总地来说涉及从一群核酸分子扩增多个靶特异性 序列。在一些实施方案中,方法包括使一个或多个靶特异性引物对与靶序列杂交,延伸引物 对的第一引物,使来自一群核酸分子的延伸的第一引物产物变性,将延伸的第一引物产物 与引物对的第二引物杂交,延伸第二引物以形成双链产物,将靶特异性引物对从双链产物 消化掉以产生多个扩增的靶序列。在一些实施方案中,消化包括从扩增的靶序列部分消化 一个或多个靶特异性引物。在一些实施方案中,可将扩增的靶序列连接至一个或多个接头。 在一些实施方案中,接头可包含一个或多个DNA条形码或标签序列。在一些实施方案中,扩 增的靶序列一旦被连接至接头,就可经历切口平移反应和/或再次扩增以产生接头连接的 扩增的靶序列的文库。
[0211] 在一些实施方案中,本公开内容总地来说涉及多个靶特异性扩增子的制备和形 成。在一些实施方案中,方法包括将一个或多个靶特异性引物对与核酸分子杂交,延伸引物 对的第一引物,将延伸的第一引物与核酸分子变性,将引物对的第二引物与延伸的第一引 物产物杂交,延伸第二引物,消化靶特异性引物对以产生多个靶特异性扩增子。在一些实施 方案中,可将接头连接至靶特异性扩增子的末端,随后进行切口平移反应以产生多个适合 用于核酸测序的靶特异性扩增子。在一些实施方案中,可使用桥式扩增或emPCR来扩增一 个或多个靶特异性扩增子,以产生多个适合用于核酸测序的克隆性模板。在一些实施方案 中,本公开内容总地来说涉及用于制备靶特异性扩增子文库,用于多种下游处理或测定例 如核酸测序或克隆性扩增的方法。在一个实施方案中,本公开内容涉及使用具有可切割基 团的引物在具有多个靶序列的核酸样品上进行靶特异性多重PCR的方法。
[0212] 在一个实施方案中,可使用本文中概述的靶特异性扩增技术,从一群核酸分子制 备待使用Ion Torrent PGM?或Ion Torrent Proton?系统测序的核酸模板。任选地,在革巴特 异性扩增后,可进行第二和/或第三扩增法,包括但不限于文库扩增步骤和/或克隆性扩增 步骤例如emPCR。
[0213] 在一些实施方案中,本公开内容涉及包含多个靶特异性引物对的组合物,每一个 引物对包含具有至少一个可切割基团的正向引物和反向引物,所述可切割基团位于a) 3'末 端或5'末端,和/或b)位于靶特异性引物的中央核苷酸位置周围,并且其中靶特异性引物 对可基本上不与组合物中的其它引物对互补。在一些实施方案中,组合物包含至少1000, 2 000, 3000, 4000, 6000, 9000, 12000或更多个靶特异性引物对。在一些实施方案中,靶特异 性引物对在长度上包含约15个核苷酸至约40个核苷酸,其中至少一个核苷酸被可切割基 团替代。在一些实施方案中,可切割基团可以是尿苷核苷酸。在一些实施方案中,靶特异性 引物组被设计来扩增与临床或病理病况相关的外显子、基因、外显子组或基因组的区域,例 如,与癌症例如结肠癌相关的一个或多个单核苷酸突变(SNP)的扩增,或与遗传病例如囊 性纤维化相关的突变的扩增。在一些实施方案中,靶特异性引物对,当与靶序列杂交和如 本文中所述扩增时,可产生在长度上为约100至约500个碱基的接头连接的扩增的靶序列 的文库。在一些实施方案中,没有一个接头连接的扩增的靶序列在文库中过表达超过30% (相较于文库中的其余接头连接的扩增的靶序列)。在一些实施方案中,接头连接的扩增的 靶序列文库在GC含量、扩增的靶序列长度或熔解温度(Tm)上基本上是同质的。
[0214] 在一些实施方案中,本公开内容总地来说涉及用于进行多重PCR的试剂盒,其包 括多个具有可切割基团的靶特异性引物、DNA聚合物、接头、dATP、dCTP、dGTP和dTTP。在一 些实施方案中,可切割基团可以是尿嘧啶核苷酸。试剂盒还可包括一种或多种抗体、核酸条 形码、纯化溶液或柱子。
[0215] 在一些实施方案中,本公开内容涉及用于产生靶特异性扩增子文库的试剂盒,其 包括多个具有可切割基团的靶特异性引物、DNA聚合酶、接头,dATP,dCTP,dGTP,dTTP和切 割试剂。在一些实施方案中,试剂盒还包括一种或多种抗体、核酸条形码、纯化溶液或柱子。
[0216] 在一个实施方案中,本公开内容总地来说涉及从单个核酸来源或样品扩增多个靶 特异性序列。在另一个实施方案中,本公开内容总地来说涉及从两个或更多个核酸来源、样 品或物种靶特异性扩增两个或更多个靶序列。例如,根据本公开内容预期单个核酸样品可 包括基因组DNA或福尔马林固定的石蜡包埋的(FFPE)DNA。还预期样品可来自单个个体、来 自遗传上相关的成员的核酸样品的集合、来自遗传上无关的成员的多个核酸样品、来自单 个个体的多个核酸样品(匹配的)例如肿瘤样品和正常组织样品,或来自单个来源(其包 含两种不同形式的遗传物质例如获自母亲受试者的母亲和胎儿DNA)的遗传物质,或在包 含植物或动物DNA的样品中的存在污染性细菌DNA。在一些实施方案中,核酸物质的来源可 包括获自新生儿的核酸,例如通常作为新生儿筛查的血液样品获得的。在一些实施方式中, 核酸材料的来源可以包括单个细胞,因此基因组的单一拷贝。
[0217] 核酸样品可包括高分子量材料例如基因组DNA或cDNA。样品可包括低分子量材料 例如获自FFPE或存档的DNA样品的核酸分子。在另一个实施方案中,低分子量材料包括酶 促或机械剪切的DNA。样品可包括无细胞的循环DNA例如获自母亲受试者的材料。在一些 实施方案中,样品可包括获自生物活检组织、肿瘤、刮片、拭子、血液、粘液、尿、血浆、精液、 头发、激光捕获显微切割、手术切除以及其它临床或实验室获得的样品的核酸分子。在一些 实施方案中,样品可以是流行病学、农业、法医或病原性样品。
[0218] 在一些实施方案中,样品可包括获自动物例如人或哺乳动物来源的核酸分子。在 另一个实施方案中,样品可包括获自非哺乳动物来源例如植物、细菌、病毒或真菌的核酸分 子。在一些实施方案中,核酸分子的来源可以是存档的或灭绝的样品或物种。
[0219] 在一些实施方案中,本公开内容总地来说涉及正常或患病组织、活检组织、核心、 肿瘤或其它样品的至少一个靶序列的选择性扩增。在一些实施方案中,本公开内容总地来 说涉及至少一个靶序列的选择性扩增以及患病组织、核心、活检组织或肿瘤样品中的突变 的检测和/或鉴定。在一些实施方案中,患病或正常样品可包括完整基因组DNA、福尔马林 固定的石蜡包埋的组织(FFPE)、剪切的或酶促处理的DNA。在一些实施方案中,本公开内容 涉及至少一个靶序列的选择性扩增和临床上可控告的突变的检测和/或鉴定。在一些实施 方案中,本公开内容涉及与药物抗性或药物敏感性相关的突变的检测和/或鉴定。在一些 实施方案中,本公开内容总地来说涉及与器官移植或器官排斥相关的遗传标志的鉴定和/ 或定量。
[0220] 在一些实施方案中,本公开内容总地来说涉及无细胞的循环DNA中的至少一个靶 序列的选择性扩增。在一些实施方案中,样品中至少一个靶序列的选择性扩增包括不同核 酸分子的混合物。选择性扩增可任选地伴随在循环DNA中观察到的突变的检测和/或鉴定。 在一些实施方案中,选择性扩增可任选地伴随与癌症或遗传病例如代谢性、神经肌肉性、发 育性、心血管性、自身免疫性或其它遗传性障碍相关的突变的检测和/或鉴定。
[0221] 在一些实施方案中,靶特异性引物和引物对是能扩增核酸分子的特定区域的靶特 异性序列。在一些实施方案中,靶特异性引物可扩增基因组DNA或cDNA。在一些实施方案 中,靶特异性引物可扩增哺乳动物DNA例如人DNA。在一些实施方案中,选择性扩增所需的 DNA的量可以为约lng至1微克。在一些实施方案中,一个或多个靶序列的选择性扩增所需 的DNA的量可以为约lng、约5ng或约10ng。在一些实施方案中,靶序列的选择性扩增所需 的DNA的量是约10ng至约200ng。
[0222] 在一些实施方案中,至少一个靶序列的选择性扩增还包括扩增的靶序列的核酸测 序。任选地,方法还包括检测和/或鉴定存在于样品中的通过扩增的靶序列的核酸测序鉴 定的突变。
[0223] 在一些实施方案中,靶序列或扩增的靶序列针对与癌症相关的突变。在一些实施 方案中,靶序列或扩增的靶序列针对与一种或多种选自如下癌症的癌症相关的突变:头颈 癌、脑癌、乳腺癌、卵巢癌、宫颈癌、结直肠癌、子宫内膜癌、胆囊癌、胃癌、膀胱癌、前列腺癌、 睾丸癌、肝癌、肺癌、肾(肾细胞)癌、食管癌、胰腺癌、甲状腺癌、胆管癌、垂体瘤、肾母细胞 瘤、卡波西肉瘤、骨肉瘤、胸腺癌、皮肤癌、心脏癌、口癌和喉癌、白血病、神经母细胞瘤和非 何杰金氏淋巴瘤。在一个实施方案中,突变可包括置换、插入、倒位、点突变、缺失、错配和 易位。在一个实施方案中,突变可包括拷贝数的变化。在一个实施方案中,突变可包括种 系或体细胞突变。在一个实施方案中,与癌症相关的突变位于的表1或4(见2012年4月 27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)中提供的或美国申请号 61/598,881(通过引用整体并入本文)的表7中提供的基因的至少一个中。在一些实施方 案中,突变可以是表18(见2012年4月27日提交的美国申请号13/458,739,通过引用方 式全文并入本文)中提供的或美国申请61/598, 881 (通过引用整体并入本文)的表7中提 供的基因组坐标中任一项。在一些实施方案中,针对与癌症相关的突变的靶序列可包括表 10(见2012年4月27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)中 提供的突变的任一个或多个。在一些实施方案中,突变可发现于表16或表18 (二者见2012 年4月27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)中提供的基因组 坐标的任一个或多个内。
[0224] 在一些实施方案中,与癌症相关的突变位于选自如下基因的基因的至少一个 中:ABI1 ;ABL1 ;ABL2 ;ACSL3 ;ACSL6 ;AFF1 ;AFF3 ;AFF4;AKAP9 ;AKT1 ;AKT2 ;ALK ;APC ; ARHGAP26 ;ARHGEF12 ;ARID1A ;ARNT ;ASPSCR1 ;ASXL1 ;ATF1 ;ATIC;ATM ;AXIN2 ;BAP1 ; BARD1 ;BCAR3 ;BCL10 ;BCL11A;BCL11B;BCL2;BCL3;BCL6 ;BCL7A;BCL9 ;BCR ;BIRC3 ;BLM ; BMPR1A ;BRAF ;BRCA1 ;BRCA2 ;BRD3 ;BRD4 ;BRIP1 ;BUB1B ;CARD11 ;CARS ;CASC5 ;CBFA2T3 ; CBFB ;CBL ;CBLB ;CBLC ;CCDC6 ;CCNB1IP1 ;CCND1 ;CCND2 ;CD74 ;CD79A ;CDC73 ;CDH1 ; CDH11 ;CDK4 ;CDK6 ;CDKN2A ;CDKN2B ;CDKN2C ;CDX2 ;CEBPA ;CEP110 ;CHEK1 ;CHEK2 ;CHIC2 ; CHN1 ;CIC ;CIITA ;CLP1 ;CLTC ;CLTCL1 ;⑶L1A1 ;CREB1 ;CREB3L2 ;CREBBP ;CRTC1 ;CRTC3 ; CSF1R ;CTNNB1 ;CXCR7 ;CYLD ;CYTSB ;DCLK3 ;DDB2 ;DDIT3 ;DDR2 ;DDX10 ;DDX5 ;DDX6 ;DEK ; DGKG ;DICER1 ;DNMT3A ;EGFR ;EIF4A2 ;ELF4 ;ELL ;ELN ;EML4 ;EP300 ;EPS15 ;ERBB2 ;ERBB4 ; ERC1 ;ERCC2 ;ERCC3 ;ERCC4 ;ERCC5 ;ERG ;ETV1 ;ETV4 ;ETV5 ;ETV6 ;EWSR1 ;EXT1 ;EXT2 ; EZH2 ;FAM123B ;FANCA ;FANCC ;FANCD2 ;FANCE ;FANCF ;FANCG ;FAS ;FBXW7 ;FCRL4 ;FGFR1 ; FGFR10P ;FGFR2 ;FGFR3 ;FH ;FIP1L1 ;FLCN ;FLI1 ;FLT1 ;FLT3 ;FNBP1 ;F0XL2 ;F0X01 ;F0X03 ; F0X04 ;F0XP1 ;FUS ;GAS7 ;GATA1 ;GATA2 ;GATA3 ;GMPS ;GNAQ ;GNAS ;G0LGA5 ;G0PC ;GPC3 ; GPHNGPR124 ;HIP1 ;HIST1H4I ;HLF ;HNF1A ;HNRNPA2B1 ;H00K3 ;H0XA11 ;H0XA13 ;H0XA9 ; H0XC11 ;H0XC13 ;H0XD13 ;HRAS ;HSP90AA1 ;HSP90AB1 ;IDH1 ;IDH2 ;IKZF1 ;IL2 ;IL21R ; IL6ST ;IRF4 ;ITGA10 ;ITGA9 ;ITK ;JAK1 ;JAK2 ;JAK3 ;KDM5A ;KDM5C ;KDM6A ;KDR ;KDSR ; KIAA1549 ;KIT ;KLF6 ;KLK2 ;KRAS ;KTN1 ;LASP1 ;LCK ;LCP1 ;LHFP ;LIFR ;LM02 ;LPP ;MAF ; MALT1 ;MAML2 ;MAP2K1 ;MAP2K4 ;MDM2 ;MDM4 ;MEC0M ;MEN1 ;MET ;MITF ;MKL1 ;MLH1 ;MLL ; MLLT1 ;MLLT10 ;MLLT3 ;MLLT4 ;MLLT6 ;MN1 ;MPL ;MRE11A ;MSH2 ;MSH6 ;MSI2 ;MSN ;MTCP1 ; MTOR ;MUC1 ;MYB ;MYC ;MYCL1 ;MYCN ;MYH11 ;MYH9 ;MYST3 ;MYST4 ;NACA ;NBN ;NC0A1 ;NC0A2 ; NC0A4 ;NEK9 ;NF1 ;NF2 ;NFE2L2 ;NFKB2 ;NIN ;NKX2-1 ;NLRP1 ;N0N0 ;N0TCH1 ;N0TCH2 ;NPM1 ; NR4A3 ;NRAS ;NSD1 ;NTRK1 ;NTRK3 ;NUMA1 ;NUP214 ;NUP98 ;0LIG2 ;0MD ;PAFAH1B2 ;PALB2 ; PATZ1 ;PAX3 ;PAX5 ;PAX7 ;PAX8 ;PBRM1 ;PBX1 ;PCM1 ;PDE4DIP ;PDGFB ;PDGFRA ;PDGFRB ; PERI ;PH0X2B ;PICALM;PIK3CA;PIK3R1 ;PIM1 ;PLAG1 ;PML;PMS1 ;PMS2 ;P0U2AF1 ;P0U5F1 ; PPARG ;PPP2R1A ;PRCC ;PRDM16 ;PRF1 ;PRKAR1A ;PRRX1 ;PSIP1 ;PTCH1 ;PTEN ;PTPN11 ; RABEP1 ;RAD50 ;RAD51L1 ;RAF1 ;RANBP17 ;RAP1 ⑶SI ;RARA ;RB1 ;RBM15 ;RECQL4 ;REL ;RET ; RHOH ;RNF213 ;R0S1 ;RPN1 ;RPS6KA2 ;RUNX1 ;RUNX1T1 ;SBDS ;SDHAF2 ;SDHB ;SETD2 ;SFPQ ; SFRS3 ;SH3GL1 ;SLC45A3 ;SMAD4 ;SMARCA4 ;SMARCB1 ;SM0 ;S0CS1 ;SRC ;SRGAP3 ;SS18 ; SS18L1 ;STIL ;STK11 ;STK36 ;SUFU ;SYK ;TAF15 ;TAF1L ;TAL1 ;TAL2 ;TCF12 ;TCF3 ;TCL1A ; TET1 ;TET2 ;TEX14 ;TFE3 ;TFEB ;TFG ;TFRC ;THRAP3 ;TLX1 ;TLX3 ;TMPRSS2 ;TNFAIP3 ;T0P1 ; TP53 ;TPM3 ;TPM4 ;TPR ;TRIM27 ;TRIM33 ;TRIP11 ;TSC1 ;TSC2 ;TSHR ;USP6 ;VHL ;WAS ; WHSC1L1 ;WRN ;WT1 ;XPA ;XPC ;ZBTB16 ;ZMYM2 ;ZNF331 ;ZNF384 和 ZNF521。
[0225] 在一些实施方案中,与癌症相关的突变位于选自如下基因的至少一个基因中: ABL1 ;AKT1 ;ALK ;APC;ATM ;BRAF ;CDH1 ;CDKN2A ;CSF1R ;CTNNB1 ;EGFR ;ERBB2 ;ERBB4 ; FBXW7 ;FGFR1 ;FGFR2;FGFR3;FLT3 ;GNAS ;HNF1A ;HRAS ;IDH1 ;JAK2;JAK3;KDR ;KIT ;KRAS ; MET ;MLH1 ;MPL ;N0TCH1 ;NPM1 ;NRAS ;PDGFRA ;PIK3CA ;PTEN ;PTPN11 ;RB1 ;RET ;SMAD4 ; SMARCB1 ;SM0 ;SRC ;STK11 ;TP53 和 VHL。
[0226] 在一些实施方案中,扩增的靶序列针对表18(见2012年4月27日提交的美国申 请号13/458, 739,通过引用方式全文并入本文)中提供的基因组坐标的任一个或多个。在 一些实施方案中,表2、3或17(见2012年4月27日提交的美国申请号13/458, 739,通过引 用方式全文并入本文)中提供的癌症靶特异性引物的任一个或多个可用于扩增存在于样 品中的通过本文中描述的方法公开的靶序列。
[0227] 在一些实施方案中,来自表2、3或17(见2012年4月27日提交的美国申请号 13/458, 739,通过引用方式全文并入本文)的癌症靶特异性引物可包括2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 40, 60, 80, 100, 150, 200, 400, 500, 800, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 800 0, 9000, 10, 000, 11,000, 12, 000, 13, 000或更多个靶特异性引物。在一些实施方案中,扩增 的靶序列可包括在表10或18(二者见2012年4月27日提交的美国申请号13/458, 739,通 过引用方式全文并入本文)中提供的基因组坐标上产生(使用扩增子ID靶特异性引物)的 扩增的靶序列的任一个或多个。在一些实施方案中,与癌症相关的靶特异性引物的至少一 个与至少一个选自SEQ ID N0:1-103、143的核酸序列具有90%的同一性。在一些实施方案 中,与癌症相关的靶特异性引物的至少一个在其整个长度上与样品中的至少一个靶序列互 补。在一些实施方案中,与癌症相关的靶特异性引物的至少一个在3'末端包含非可切割核 苷酸。在一些实施方案中,在3'末端上的非可切割核苷酸包括末端3'核苷酸。在一个实 施方案中,扩增的靶序列针对具有与癌症相关的突变的单个外显子。在一些实施方案中,本 公开内容总地来说涉及样品中超过一个靶序列的选择性扩增和与癌症相关的突变的检测 和/或鉴定。在一些实施方案中,扩增的靶序列包含表2(见2012年4月27日提交的美国 申请号13/458, 739,通过引用方式全文并入本文)中提供的两个或更多个核苷酸序列。在 一些实施方案中,扩增的靶序列可包含使用表18 (见2012年4月27日提交的美国申请号 13/458, 739,通过引用方式全文并入本文)中提供的或美国申请61/598, 881 (通过引用整 体并入本文)的表7中提供的扩增子ID靶特异性引物在基因组坐标上产生的任一个或多 个扩增的靶序列。在一个实施方案中,扩增的靶序列包括来自美国申请61/598, 881 (通过 引用整体并入本文)的表 1-5 或表 6 和 7 的 100, 200, 500, 1000, 2000, 3000, 6000, 8000, 10 ,000, 12, 000或更多个扩增子,另见2012年4月27日提交的美国申请号13/458, 739,通过 引用方式全文并入本文。在一些实施方案中,本公开内容总地来说涉及临床上可控告的突 变的检测和任选地鉴定。如本文中所述,术语"临床上可控告的突变"包括本领域技术人员 已知的或可与(但不限于)癌症治疗的预后相关的突变。在一个实施方案中,癌症治疗的 预后包括鉴定与癌症对药物、药物组合或治疗方案的应答或无应答相关的突变。在一个实 施方案中,本公开内容总地来说涉及从一群核酸分子扩增多个与癌症的发作、进展或好转 关联或相关的靶序列。
[0228] 在一些实施方案中,使用本文中公开的引物标准设计靶特异性引物。在一些实 施方案中,使用本文中公开的引物标准设计靶特异性引物,并且所述引物针对与乳腺癌相 关的一个或多个基因。在一些实施方案中,与乳腺癌相关的靶特异性引物包括至少一个选 自一个或多个基因的靶特异性引物,所述基因选自:AMI、AR、ATM、BARD1、BCAS1、BRIP1、 CCND1、CCND2、CCNE1、CDH1、CDK3, CDK4, CDKN2A、CDKN2B、CAMK1D、CHEK2、DIRAS3、EGFR、 ERBB2、EPHA3、ERBB4、ETV6、GNRH1、KCTD9、CDCA2、EBF2、EMSY、BNIP3L、PNMA2、DPYSL2、 ADRA1A、STMN4、TRM35、ΡΑΚΙ、AQP11、CLSN1A、RSF1、KCTD14、THRSP、NDUFC2、ALG8、KCTD21、 USP35、GAB2、DNAH9、ZNF18、MYOCD、STK11、TP53、JAK1、JAK2、MET、PDGFRA、PML、PTEN、RET、 TMPRSS2、WNK1、FGFR1、IGF1R、PPP1R12B、PTPRT、GSTM1、IP08、MYC、ZNF703、MDM1、MDM2、 MDM4,MKK4、P14KB、NCOR1、NBN、PALB2、RAD50、RAD51、ΡΑΚΙ, RSF1、INTS4、ZMIZ1、SEPHS1、 FOXM1、SDCCAG1、IGF1R、TSHZ2、RPSK6K1、PPP2R2A、MTAP、MAP2K4、AURKB、BCL2、BUB1、CDCA3、 CDCA4、CDC20、CDC45、CHEK1、FOXM1、HDAC2、IGF1R、KIF2C、KIFC1、KRAS、RBI、SMAD4、NCOR1、 UTX、MTHDFD1L、RAD51AP1、TTK 和 UBE2C。
[0229] 在一些实施方案中,本公开内容总地来说涉及针对与先天性疾病或遗传病相关的 突变的靶序列的扩增。在一些实施方案中,本公开内容可包括针对体细胞或种系突变的靶 序列的扩增。在一些实施方案中,突变可以是常染色体显性的或常染色体隐性的。在一个 实施方案中,与先天性疾病或遗传病相关的突变位于表4(见2012年4月27日提交的美国 申请号13/458, 739,通过引用方式全文并入本文)中提供的基因或疾病的至少一个中。在 一些实施方案中,本公开内容涉及扩增样品中与一个或多个遗传疾病相关的靶序列,所述 遗传病选自:腺苷氨基水解酶缺乏症(ADA);丙种球蛋白缺乏血症,X染色体伴性遗传1型; Alagille综合征;所有肥大和扩张型心肌病;先天性普秃(ALUNC);阿尔佩斯综合征;甲抗 胰蛋白酶缺乏症;α地中海贫血-东南亚;肌萎缩侧索硬化-卢?格里格病;雄激素不敏 感综合征;无虹膜;强直性脊柱炎;家族性腺瘤性息肉病;精氨酸琥珀酸裂合酶缺乏症;致 心律失常性右室发育异常/心肌病;共济失调伴眼动失用症2型;共济失调伴维生素 Ε缺 乏症;共济失调性毛细血管扩张;自体免疫多内分泌症;β -羟异丁酰基CoA脱酰酶缺乏 (HIBCH缺乏);生物素酶缺乏;睑裂狭小、倒转型内眦赘皮和上睑下垂;Bloom综合征;短指 畸形;短指畸形-高血压综合征;短指畸形B1型;腿-耳-肾障碍;BRCA1 ;躯干发育异常; Canavan ;脑腱性黄瘤症;Ceroid-lipofuscinoses-Batton ;行性神经性腓骨肌萎缩2B型; 进行性神经性腓骨肌萎缩1B型;神经性腓骨肌萎缩2A2型;charge综合征;巨颌症;无脉 络膜;维生素 P缺乏;瓜胺酸血症第I型;Coffin-Lowry综合征;科恩综合征;Collagen4A5 ; 普通易变免疫缺陷病;先天性肾上腺皮质增生症;先天性白内障,面部畸形和神经病;成 人先天性la型糖基化障碍;先天性肌无力综合征;德朗热综合征;囊性纤维化;胱氨酸病; 毛囊角化病;结蛋白沉积性肌病;非综合征型耳聋;先天性纯红细胞再生障碍性贫血;双皮 质综合征;Duane综合征;迪谢纳/贝克尔肌营养不良症;Dysferlinopathy ;先天性角化 不良;早发性阿尔茨海默病;早发性张力障碍(DYT1) ;Ehlers Danlos ;Ehlers-Danlos综 合征,经典类型;Ehlers-Danlos综合征,运动过强型;Ehlers-Danlos综合征,脊柱后 侧凸形式;X染色体伴性遗传埃-德二氏肌营养不良;单纯型大疱性表皮松解症;法布里 病;面肩胛肱型肌营养不良症;家族性自主神经功能异常(HSAN III);家族性高胰岛素血症 (ΠΠ );家族性肥厚性心肌病;家族性转甲状腺素蛋白淀粉样变性;范可尼贫血;脆性X染 色体;Friedreich共济失调;FRMD7-相关幼儿眼球震颤;弗赖恩斯综合征;Galactosemia ; 戈谢病;甘氨酸脑病;糖原贮积病VI型;噬血细胞性淋巴组织细胞增多症;血友病A ;血 友病B ;具有免疫缺乏的肝静脉闭塞性疾病与免疫机能;遗传性出血性毛细血管扩张症; 遗传性压迫易感性神经病;遗传性非息肉病性结肠癌;糖胺酶A缺乏症;HFE相关遗传性 血色素沉着病;Holt-Oram综合征;亨廷顿病;羟甲基后胆色素原合酶(HMBS)缺乏症;低 磷酸酯酶症;包涵体肌病2 ;色素失调症;幼年性息肉病综合征;卡尔曼综合征;先天性黑 蒙症;利伯先天性黑朦10 ;李-佛美尼综合症;肢带型肌营养不良2A型;LIS1-相关无脑 回畸形;长Q-T间期综合征;眼脑肾综合征;恶性过热易感;枫糖尿病;MAPT-相关障碍; 麦-考二氏综合征;MECP2-Rett综合征;Menkes ;异染性脑白质营养不良;甲基丙二酸血 症;黏脂症第二型;多发性内分泌瘤病1型;多发性内分泌瘤病2型;先天性肌强直;强直 性肌营养不良1型;2型肌强直性营养障碍;甲髌骨综合征;线形体肌病;神经纤维瘤病1 型;神经纤维瘤病2型;努南综合症;眼白化病,X染色体伴性遗传;眼皮肤白化病1型; 2型眼皮肤白化病;眼咽肌营养不良;视觉萎缩1型;鸟氨酸氨甲酰基转移酶缺乏症;成骨 不全;帕金森病;彭德莱综合征;过氧化物酶体生物发生紊乱,Zellweger ;苯丙酮尿症; 多囊肾疾病;庞皮病-GSD II ;原发性纤毛运动障碍;色素性视网膜炎;视网膜母细胞瘤; Saethre-Chotzen综合征;SCN9A-相关遗传性红斑性肢痛病;SHOX-相关单倍剂量不足;镰 状细胞病;Smith-Lemli-Opitz综合征;Smith-Magenis综合症;小儿巨脑畸形综合征;痉 挛性截瘫3A ;痉挛性截瘫7 ;痉挛性截瘫8 ;痉挛性截瘫1型;痉挛性截瘫4型;脊髓性肌萎 缩;脊髓小脑共济失调2 ;脊髓小脑共济失调3 ;脊髓小脑共济失调7 ;脊髓小脑运动失调症 1型;Stickler综合征;致死性发育不良;胸主动脉瘤和主动脉夹层;特雷彻-柯林斯综合 征;三甲基胺尿症;结节性硬化;Udd远端型肌营养不良症;Usher综合征1型;极长链酰基 CoA脱氢酶缺乏症;希佩尔-林道综合征;Waardenburg综合征1型;Werner综合征;肾母 细胞瘤;肝豆状核变性;Wiskott-Aldrich ;X染色体伴性遗传先天性肾上腺发育不良;X染 色体伴性遗传肾上腺脑白质营养不良;X染色体伴性遗传张力障碍帕金森综合征;X染色体 伴性遗传年性视网膜劈裂症;X染色体伴性遗传肌小管性肌病;X染色体伴性遗传 SCIDS和 Zellweger 综合征。
[0230] 在一个实施方案中,与先天性疾病或遗传病相关的突变可包括置换、插入、倒 位、点突变、缺失、错配和易位。在一些实施方案中,与遗传病或先天性疾病相关的突变 包括拷贝数变化。在一些实施方案中,本公开内容总地来说涉及至少一个靶序列的选择 性扩增和与遗传病相关的突变的检测和/或鉴定。在一些实施方案中,与先天性疾病或 遗传病相关的突变可位于选自如下基因的基因的一个或多个中:ABCA4 ;ABCC8 ;ABCD1 ; ACADVL ;ACTA2 ;ACTC ;ACTC1 ;ACVRL1 ;ADA ;AIPL1 ;AIRE ;ALK1 ;ALPL;AMT ;APC ;APP ;APTX ; AR ;ARL6 ;ARSA ;ASL ;ASPA ;ASS ;ASS1 ;ATL ;ATM ;ATP2A2 ;ATP7A ;ATP7B ;ATXN1 ;ATXN2 ; ATXN3 ;ATXN7 ;BBS6 ;BCKDHA ;BCKDHB ;BEST1 ;BMPR1A;BRCA1 ;BRCA2 ;BRIP1 ;BTD ;BTK ;C2 或 f25 ;CA4 ;CALR3 ;CAPN3 ;CAV3 ;CCDC39 ;CCDC40 ;CDH23 ;CEP290 ;CERKL ;CFTR ;CHAT ;CHD7 ; CHEK2 ;CHM ;CHRNA1 ;CHRNB1 ;CHRND ;CHRNE ;CLCN1 ;CNBP ;CNGB1 ;C0H1 ;C0L11A1 ;⑶L11A2 ; ⑶L1A1 ;C0L1A2 ;⑶L2A1 ;C0L3A1 ;⑶L4A5 ;C0L5A1 ;⑶L5A2 ;C0L7A1 ;⑶L9A1 ;CRB1 ;CRX ; CTDP1 ;CTNS ;CYP21A2 ;CYP27A1 ;DAX1 ;DBT ;DCX;DES ;DHCR7 ;DJ1 ;DKC1 ;DLD;DMD ;DMPK ; DNAAF1 ;DNAAF2 ;DNAH11 ;DNAH5 ;DNAI1 ;DNAI2 ;DNAL1 ;DNM2 ;D0K7 ;DSC2 ;DSG2 ;DSP ;DYSF ; DYT1 ;EMD ;ENG ;EYA1 ;EYS ;F8 ;F9 ;FANCA ;FANCC ;FANCF ;FANCG ;FANCJ ;FANDC2 ;FBN1 ; FBX07 ;FGFR1 ;FGFR3 ;FM03 ;FMR1 ;F0XL2 ;FRG1 ;FRMD7 ;FSCN2 ;FXN ;GAA ;GALT ;GBA ;GBE1 ; GCSH ;GDF5 ;GJB2 ;GJB3 ;GJB6 ;GLA ;GLDC ;GNE ;GNPTAB ;GPC3 ;GPR143 ;GUCY2D ;HBA1 ; HBA2 ;HBB ;HD ;HERG ;HEXA ;HFE ;HHF ;HIBCH ;HLA-B27 ;HMBS ;HPLH1 ;HPRP3 ;HR ;HTNB ;HTT ; IKBKAP ;IKBKG ;IL2RG ;IMPDH1 ;ITGB4 ;JAG1 ;JPH3 ;KCNE1 ;KCNE2 ;KCNH2 ;KCNQ1 ;KCNQ4 ; KIAA0196 ;KLHL7 ;KRAS ;KRT14 ;KRT5 ;L1CAM ;LAMB3 ;LAMP2 ;LDB3 ;LMNA ;LMX18 ;LRAT ; LRRK2 ;MAPT ;MC1R ;MECP2 ;MED12 ;MEN1 ;MERTK ;MFN2 ;MKKS ;MLH1 ;MMAA ;MMAB ;MMACHC ; MMADHC;MPZ ;MSH2 ;MTM1 ;MTND5 ;MTTG ;MTTI ;MTTK ;MTTL1 ;MTTQ ;MUT ;MYBPC3 ;MYH11 ; MYH6 ;MYH7 ;MYL2 ;MYL3 ;MYLK2 ;MY07A ;ND5 ;ND6 ;NEMO ;NF1 ;NF2 ;NIPBL ;NR0B1 ;NR2E3 ; NRAS;NSD1 ;0CA2 ;OCRL ;0PA1 ;OTC ;PABPN1 ;PAFAH1B1 ;PAH ;PARK2 ;PARK7 ;PARKIN ;PAX3 ; PAX6 ;PCDH15 ;PEX1 ;PEX2 ;PEX10 ;PEX13 ;PEX14 ;PEX19 ;PEX26 ;PEX3 ;PEX5 ;PINK1 ;PKD1 ; PKD2;PKD3 ;PKHD1 ;PKP2 ;PLEC1 ;PL0D1 ;PMM2;PMP22 ;POLG ;PPT1 ;PRCD ;PRKAG2 ;PRNP ; PR0M1 ;PRPF3 ;PRPF8 ;PRPH2 ;PRPN ;PSEN1 ;PSEN2 ;PTCH1 ;PTPN11 ;RAB7A ;RAF1 ;RAI1 ; RAPSN ;RB1 ;RDH12 ;RDS ;RECQL3 ;RET ;RHO ;ROR2 ;RP1 ;RP2 ;RP9 ;RPE65 ;RPGR ;RPGRIP1 ; RPL11 ;RPL35A ;RPS10 ;RPS17 ;RPS19 ;RPS24 ;RPS26 ;RPS6KA3 ;RPS7 ;RPSL5 ;RS1 ;RSPH4A ; RSPH9 ;RYR1 ;RYR2 ;SALL4 ;SCA3 ;SCN5A ;SCN9A ;SEMA4A ;SERPINA1 ;SERPING1 ;SGCD ; SH3BP2 ;SHOX ;SIX1 ;SIX5 ;SLC25A13 ;SLC25A4 ;SLC26A4 ;SMAD4 ;SMN1 ;SNCA ;SNRNP200 ; SOD1 ;SOSl ;SOX9 ;SP110 ;SPAST ;SPATA7 ;SPG3A ;SPG4 ;SPG7 ;TAF1 ;TBX5 ;TCOFl ;TGFBR1 ; TGFBR2 ;TNFRSC13C ;TNNC1 ;TNNI3 ;TNNT1 ;TNNT2 ;TNXB ;TOPORS ;T0R1A ;TP53 ;TPM1 ;TRNG ; TRNI ;TRNK ;TRNL1 ;TRNQ ;TSC1 ;TSC2 ;TTN ;TTPA ;TTR ;TULP1 ;TWIST1 ;TXNDC3 ;TYR ;USH1C ; USH1H ;USH2A ;VCL ;VHL ;VPS13B ;WAS ;WRN ;WT1 和 ZNF9。
[0231] 在一些实施方案中,针对一种或多种遗传病或先天性疾病的靶特异性引物可选自 表15(见2012年4月27日提交的美国申请号13/458,739,通过引用方式全文并入本文) 中提供的靶特异性引物的任一个或多个。在一些实施方案中,来自表15 (见2012年4月 27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)的靶特异性引物可包 括 2, 3, 4, 5, 6, 7, 8, 9, 10, 20, 40, 60, 80, 100, 150, 200, 400, 500, 800, 1000, 2000, 3000, 4000, 5000, 6000, 7000, 8000, 9000, 10, 000, 11,000, 12, 000, 13, 000 或更多个靶特异性引物。在 一些实施方案中,扩增的靶序列可包括在表16(见2012年4月27日提交的美国申请号 13/458, 739,通过引用方式全文并入本文)中提供的基因组坐标上产生(使用扩增子ID靶 特异性引物)的扩增的靶序列的一个或多个。在一些实施方案中,与先天性疾病或障碍相 关的靶特异性引物的至少一个与至少一个选自SEQ ID N0:1-103、143的核酸序列具有至少 90%的同一性。在一些实施方案中,与先天性疾病或障碍相关的靶特异性引物的至少一个 在其整个长度上与样品中的至少一个靶序列互补。在一些实施方案中,与先天性疾病或障 碍相关的靶特异性引物的至少一个在3'末端包含非可切割的核苷酸。在一些实施方案中, 3'末端上的非可切割的核苷酸包括末端3'核苷酸。在一个实施方案中,靶序列或所得的 扩增的靶序列针对具有与遗传病相关的突变的外显子。在一些实施方案中,先天性疾病或 遗传病扩增的靶序列可包括表15 (见2012年4月27日提交的美国申请号13/458, 739,通 过引用方式全文并入本文)或美国申请61/598, 881 (通过引用整体并入本文)的表8中提 供的两个或更多个靶特异性引物。在一些实施方案中,扩增的靶序列可包括使用表16(见 2012年4月27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)或美国申 请61/598, 881 (通过引用整体并入本文)的表9中提供的扩增子ID靶特异性引物在基因 组坐标上产生的扩增的靶序列的任一个或多个。在一些实施方案中,先天性疾病或遗传病 扩增的靶序列可包括表15(见2012年4月27日提交的美国申请号13/458, 739,通过引用 方式全文并入本文)中提供的两个或更多个靶特异性引物。在一些实施方案中,扩增的靶 序列可包括使用表16(见2012年4月27日提交的美国申请号13/458,739,通过引用方 式全文并入本文)中提供的扩增子ID靶特异性引物在基因组坐标上产生的扩增的靶序列 的任一个或多个。在一个实施方案中,先天性疾病或遗传病靶特异性引物可包括美国申请 61/598, 881 (通过引用整体并入本文)的表8中提供的靶特异性引物的任一个或多个。在 一些实施方案中,根据本文中概述的靶特异性引物选择标准来设计任一个或多个靶特异性 引物。在一些实施方案中,本公开内容总地来说涉及样品中超过一个靶序列的选择性扩增 和与先天性疾病或遗传病相关的突变的检测和/或鉴定。在一个实施方案中,本公开内容 总地来说涉及多个与先天性疾病或遗传病关联的或相关的靶序列的扩增。
[0232] 在一些实施方案中,靶特异性引物被制备来扩增与先天性疾病或遗传病相关的人 基因组的区域或片段。在一些实施方案中,靶特异性引物可被制备来扩增与如下障碍相关 的人基因组的区域:遗传障碍例如囊性纤维化、Alagille综合征、阿尔佩斯综合征、α地中 海贫血、肌萎缩侧索硬化、强直性脊柱炎、共济失调性毛细血管扩张、先天性肌无力综合征、 达里埃病、先天性再生障碍性贫血、早发性阿尔茨海默病、Ehlers-Danlos综合征、单纯大疱 性表皮松解、家族性肥大性心肌病、范可尼贫血、甘氨酸脑病、遗传性出血性毛细血管扩张 症、亨廷顿病、幼年性息肉病综合征、莱伯氏先天性黑蒙、QT延长综合征、枫糖尿病、马凡综 合征、线粒体脑肌病、甲基丙二酸血症、多发性内分泌瘤病2型、努南综合征、帕金森病、过 氧化物生物合成障碍、Primary Cilary Dyskineasia、网膜色素变性、Stickler综合征、胸 主动脉瘤和主动脉夹层、复合性结节性硬化病、Usher综合征、Werner综合征、Werner病和 Zellweger综合征。在一些实施方案中,可从表4(见2012年4月27日提交的美国申请号 13/458, 739,通过引用方式全文并入本文)中提供的基因的任一个或多个来制备靶特异性 引物。
[0233] 在一些实施方案中,本公开内容总地来说涉及检测与一个或多个新生儿障碍相关 的靶序列或扩增的靶序列的存在。在一些实施方案中,本公开内容总地来说涉及检测通过 用一个或多个本文中公开的靶特异性引物扩增样品(所述样品包含至少一个与新生儿障 碍相关的靶序列)获得的扩增的靶序列的存在。在一些实施方案中,本公开内容总地来说 涉及检测通过用根据本文中提供的引物标准设计的靶特异性引物扩增样品(所述样品包 含至少一个与新生儿障碍相关的靶序列)获得的扩增的靶序列的存在。
[0234] 在一些实施方案中,一个或多个新儿障碍可包括2-甲基-3-羟丁酸尿症 (2M3HBA) ;2_甲基丁酰-辅酶A脱氢酶缺乏症(2MBG) ;3-甲基戊烯二酸尿症(3MGA); 精氨酸血症(ARG);生物喋呤辅因子合成缺陷(BI0PT-BS);生物喋呤辅酶再生的缺陷 (BI0PT-REG);肉碱酰基转移酶(CACT);甲基丙二酸血症(CBL-C,D);瓜胺酸血症第II型 (CIT-II);肉碱棕榈酰转移酶-I(CPT-Ia);肉碱棕榈酰转移酶II(CPT-II);二烯酰辅酶A 还原酶(De-Red);戊二酸尿症II型(GA-II);半乳糖表异构酶(GALE);半乳糖激酶(GALK); 良性高苯丙氨酸血(H-PHE);异丁酰辅酶A脱氢酶(IBG);中短链L-3-羟基酰辅酶A脱氢 酶(M/SCHAD);丙二酸血症(MAL);中链酮脂酰辅酶A硫解酶(MCKAT);高蛋氨酸血症(MET); 短链酰基辅酶A脱氢酶(SCAD);酪氨酸血症II型(TYR-II);酪氨酸血症III型(TYR-III); 生物素酶(ΒΙ0);囊性纤维化(CF);转移酶缺乏性半乳糖血症(GALT) ;Sickle-C病(HBS/ C);先天性肾上腺增生(CAH);先天性甲状腺功能减退症(CH);镰状细胞性贫血(HB S/S); S-i3eta地中海贫血(HB S/A);重症联合免疫缺陷(SCID) ;5_羟脯氨酸尿(5-0X0) ;6_磷 酸葡萄糖脱氢酶(G6PD);非酮性高甘氨酸血症(NKH);氨甲酰磷酸合成酶(CPS);高氨血症 /鸟氨酸血症/瓜氨酸血症(鸟氨酸转运缺陷)(HHH);脯氨酸血症(PRO);乙基丙二酸脑病 变(EMA);人免疫缺陷病毒(HIV);弓形虫病(TOXO) ;3-甲基巴豆辅酶A羧化酶(3-MCC); 肉碱摄取缺陷(CUD);长链3-羟酰基-辅酶A脱氢酶(LCHAD);苯丙酮尿症/高苯丙氨酸 血症(PKU);精氨酸琥珀酸尿症(ASA);戊二酸血症1型(GA-1);中链脂酰基辅酶A脱氢酶 (MCAD);丙酸血症(丙酰辅酶A羧化酶)(PROP) ;β酮硫解酶(线粒体乙酰乙酰辅酶A硫解 酶;短链酮脂酰硫解酶;T2) (BKT);高胱氨酸尿(胱硫醚β合酶)(HCY);多羧酶缺乏(羧 化全酶合成酶)(MCD);三功能蛋白缺乏症(TFP);甲基丙二酸血症(维生素 Β12障碍)(CBL Α,Β) ;3_羟基-3-甲基戊二酸尿症(3-羟基-3-甲戊二酰-CoA裂合酶)(HMG);枫糖尿病 (支链酮酸脱氢酶)(MSUD);酪氨酸血症1型(TYR-1);瓜氨酸血症I型(精氨琥珀酸盐合 成酶)(CIT I);异戊酸血症(异戊烯辅酶A脱氢酶)(IVA);甲基丙二酸血症(甲基丙二酰 CoA变位酶)(MUT)和极长链酰基辅酶A脱氢酶(VLCAD)。
[0235] 在一些实施方案中,本公开内容总地来说涉及用于检测新生儿筛查障碍的靶特异 性引物。在一些实施方案中,针对新生儿障碍(包括上文中提供的障碍)的靶特异性引物 可使用本文中公开的引物标准来制备。在一些实施方案中,本公开内容总地来说涉及通过 如下步骤检测新生儿障碍:将可能包含一个或多个针对一个或多个新生儿障碍的靶序列的 样品接触,扩增样品中的一个或多个靶序列,从而获得至少一个扩增的与至少一个新生儿 障碍相关的靶序列。在一些实施方案中,多个靶特异性引物可被设计来从样品扩增多个靶 序列,从而提供任选地在单个方法或过程中检测多个新生儿障碍的方法。在一些实施方案 中,可将被设计来扩增多个与一个或多个新生儿障碍相关的扩增的靶序列的靶特异性引物 混合,以新生儿筛查小组的形式提供。
[0236] 在一些实施方案中,靶序列或扩增的靶序列针对从法医样品获得的核酸。在一个 实施方案中,法医样品可包含获自罪案现扬的核酸,获自失踪人士 DNA数据库的核酸,获自 与法医研究相关的实验室的核酸,或包括通过法律实施机构、一个或多个军事服务或任何 这样的人员获得的法医样品。在一些实施方案中,祀核酸可存在于一种或多种体液包括但 不限于血液、痰、血浆、精液、尿和血清中。在一些实施方案中,靶序列可获自头发、皮肤、组 织样品、尸体剖检或受害者的遗物。在一些实施方案中,核酸包括一个或多个可获自患病动 物或人的靶序列。在一些实施方案中,靶序列可包括获自非人DNA例如微生物、植物或昆 虫DNA的核酸。在一些实施方案中,靶序列或扩增的靶序列针对人鉴定的目的。在一些实 施方案中,本公开内容总地来说涉及用于鉴定来自动物包括人的核酸样品的方法。在一些 实施方案中,本公开内容总地来说涉及用于鉴定法医样品的特征的方法。在一些实施方案 中,本公开内容总地来说涉及使用一个或多个本文中公开的靶特异性引物或一个或多个使 用本文中概述的引物标准制备的靶特异性引物的人鉴定法。
[0237] 在一个实施方案中,包含至少一个靶序列的法医或人鉴定样品可使用本文中公开 的靶特异性引物的任一个或多个或使用本文中概述的引物标准来进行扩增。在一些实施方 案中,包含一个或多个靶序列的法医或人鉴定样品可通过用表13和14 (二者见2012年4月 27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)中提供的任一个或多个 靶特异性引物扩增至少一个或多个靶序列来鉴定。表13 (见2012年4月27日提交的美国 申请号13/458, 739,通过引用方式全文并入本文)提供了以引物对的形式提供的多个针对 与人鉴定相关的单核苷酸多态性(SNP)的靶特异性引物。表14 (见2012年4月27日提交 的美国申请号13/458, 739,通过引用方式全文并入本文)提供了以引物对的形式提供的多 个针对与人鉴定相关的短串联重复(STR)的靶特异性引物。个体遗传了一个拷贝的来自每 一个亲代的STR,所述STR可具有或可以不具有相似的重复序列大小。STR标志中的重复序 列的数目在个体间可以是高度可变的,这使得STR能有效地用于人鉴定的目的。在一些实 施方案中,靶特异性引物例如表14(见2012年4月27日提交的美国申请号13/458, 739,通 过引用方式全文并入本文)中提供的那些引物或如本文中公开的制备的靶特异性引物(所 述引物针对基因牙釉蛋白(AMG))可用于确定提供样品的个体的性别。例如,针对牙釉蛋白 基因的引物可使用本文中公开的对于例如内含子1是特异性的标准来制备。当使用这样的 靶特异性引物扩增样品后,来自男性样品相对女性样品的扩增产物将通常导致在长度上相 异数个核苷酸的扩增产物(扩增的靶序列),从而提供了确定提供样品的个体的性别的简 单方法。
[0238] 在一个实施方案中,包含一个或多个靶序列的样品可使用本文中公开的靶特异性 引物的任一个或多个来进行扩增。在另一个实施方案中,可将使用本文中公开的方法(和 相关组合物、系统、装置和试剂盒)获得的扩增的靶序列偶联至下游处理,例如但不限于核 酸测序。例如,一旦知道扩增的靶序列的核酸序列,就可将核酸序列与一个或多个参照样品 例如Hgl9基因组相比较。Hgl9基因组通常在基因组学领域中用作人的参照基因组样品。 在一些实施方案中,怀疑包含一个或多个SNP和/或STR的样品可通过用表13和14 (二者 见2012年4月27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)中提供 的靶特异性引物的任一个或多个扩增怀疑包含SNP或STR的样品来鉴定。因此,来自扩增 过程的输出可任选例如通过核酸测序进行分析,以确定预期的基于靶特异性引物的扩增产 物是否存在于扩增输出中。适当的SNP或STR扩增产物的鉴定可在一些情况下提供关于样 品来源或其特征(例如,男性或女性样品或具有特定祖先来源的样品)的额外信息。
[0239] 预期本领域技术人员可容易地使用本文中公开的引物标准制备一个或多个靶特 异性引物而无需过度实验。还预期本领域技术人员可使用本文中公开的标准容易地制备一 个或多个靶特异性引物,以鉴定至少一个医学上相关的多态性。在一些情况下,医学上相关 的多态性可用于法医或人鉴定目的。一般而言,医学上相关的多态性包括与多个群体(例 如,欧洲高加索人群)中的至少一个疾病状态相关的多态性。在一些实施方案中,医学上相 关的多态性包括下文概述的多态性的任一个或多个。
[0240] 多态性高加索人MAF染色体 基园 与多态性相关的疾病 rsll37101 0.449 !p3l LEPR 肥胖症,胰岛素抗药性,非霍奇金淋巴瘤 rs486907 0.408 li|25 l^ASEL 前列腺癌 rs i 042031 0.208 2ρ24 ΛΡΟΒ 心血管疾病,血脂异常 rs23l775 0.379 2q33 CTLA4 多发性硬化,自身免疫疾病 ?5186 0.348 3q2I AGTE1 代谢综合征,主动脉动脉瘤,左《室鹰?大 ι>6280 0.35 3ql3.3 DRD3 精神分裂症 rs 1693482 0.477 4q2I iMMlC 酒精依賴性,冠状动豚心脏病 rs 1799883 0.373 4q28 FABP2 代谢综合征,二型糖暴病 rs4444903 0.392 4q25 t:GF rs4l>6l 0.208 4ρΙ6.? ADD! 高血压,冠状动脉疾病 rsl(i42714 0.467 5(|.? ADKB2 肥胖症,('(ΗΜ) rs35l855 0.283 5q35.1 FCFR4 癌症 rs537fl 0.242 6p24 IDN1 哮嗔,睡瞩吸暫停 rs6296 0.322 6ql3 HTRIB 物廣瀘用 i>2227983 0.25 7pl2.3 EGFR 癌症 rs213950 (1.492 7(丨31.2 CM U 囊性纤维化 rs7493 0.237 7q2!.3 PON2 心肌梗死 rs328 0.27,^ 8p22 LPL 左心室肥大 rs2;i832ft6 0.475 9p21 冠状动脉疾病 is 1800861 0.25 lfl(|1t.2 RET 巨结肠,甲状腺癌 rs!801253 0.283 10q24 ADRB1 胰岛素抗药性 rs22 27564 0.341 10q24 PLAU 阿尔茨海默病,哮喘 rs 1799750 0.433 llq22.3 MMP1 子宫内膜异位症,骨质溶解,类凤湿关节炎 rsi(li)3Sr;i) (1.342 Ι2ρΙ3.3 V ΛΜ 高血压 rsft.i 13 0.4;iS 1;h|14 ΙΠ--2Λ 精神疾病
[0241] rs2236225 ¢).396 14q24 M i'HH)l 神经管缺损 rs 1800588 i).W 15^21 II PC 冠祆动脉疾病 cs243S65 (U98 i(u\\?> MMP2 癌症 rs4(i73 0.342 Hk丨24 C\ ΒΛ 冠祆动脉疾病 cs7i)S272 0.478 16q21 CL:: Tl1 冠状动脉疾病 rs 1800012 0.188 l^q:1.3 骨质疏松 rs4291 0.354 17q23 ACE 抑郁,尔茨海默病 rs47t)23! ! 0.33! Πρ? l t:L.VC2 前列腺癌 rs 16430 ¢).37 18pU.3 [V)SF1 TYMS 癌症 (?>601338 ¢1.391 19(丨 13.3 H i 2 感染易感性 rsfiSS β.45 1<)ρ13.2 I」.) I..· 阿尔茨海默病,冠狀动驂ΛΛ rs7121 0.458 20ql3.3 GNAS 肥胖症,癌症 rs234706 0.333 21q22 CBS 裂 口缺陷 rs468() Ci.483 :2ql 1.2i COM i 精神分裂症.Λ?ΗΙ) AMG β.5 Χρ22·3 AMG 性到标志
[0242] 在一些实施方案中,医学上相关的多态性可存在于相应疾病相关基因的单个外 显子中。在一些实施方案中,本公开内容总地来说涉及样品中至少一个靶序列的选择性 扩增和医学上相关的多态性的检测和/或鉴定。在一些实施方案中,本公开内容总地来 说涉及样品中至少一个靶序列的选择性扩增和SNP或STR的检测和/或鉴定。在一些实 施方案中,扩增的靶序列可通过用表13或14(二者见2012年4月27日提交的美国申请 号13/458, 739,通过引用方式全文并入本文)的一个或多个靶特异性引物扩增样品来产 生。在一些实施方案中,扩增的靶序列可包括在上述多态性表中提供的基因坐标上产生 的扩增的靶序列的任一个或多个。在一个实施方案中,扩增的靶序列可使用来自表13或 14(二者见2012年4月27日提交的美国申请号13/458, 739,通过引用方式全文并入本文) 的靶特异性引物的一个或多个来制备。在一些实施方案中,任一个或多个对应于SEQ ID N0:50354-50451的靶特异性引物可用于选择性扩增存在于样品中的至少一个靶序列。在一 些实施方案中,为了法医或人鉴定的目的,至少一个选自SEQ ID NO:50354-50451的靶特异 性引物可用于从样品扩增靶序列。
[0243] 在一些实施方案中,用于人鉴定的靶特异性引物可选自表13或14(见2012年4 月27日提交的美国申请号13/458, 739,通过引用方式全文并入本文)提供的靶特异性引物 的任一个或多个。在一些实施方案中,来自表13或14(见2012年4月27日提交的美国申 请号13/458, 739,通过引用方式全文并入本文)的靶特异性引物可包括1,2, 3, 4, 5, 6, 7, 8 ,9, 10, 15, 20, 22, 25, 27, 30, 35, 38, 40, 42, 45或更多个靶特异性引物。在一些实施方案中, 与人鉴定相关的靶特异性引物的至少一个与表13或14(见2012年4月27日提交的美国 申请号13/458, 739,通过引用方式全文并入本文)中提供的靶特异性引物的至少一个具有 至少90%的同一性。在一些实施方案中,与人鉴定相关的靶特异性引物的至少一个在其整 个长度上与样品中的至少一个靶序列互补。在一些实施方案中,与人鉴定相关的靶特异性 引物的至少一个在3'末端包含非可切割的核苷酸。在一些实施方案中,3'末端上的非可切 割的核苷酸包括末端3'核苷酸。
[0244] 在一些实施方案中,本公开内容总地来说涉及用于在多重PCR中减少扩增假象的 形成的方法(和相关组合物、系统、装置和试剂盒)。在一些实施方案中,相较于现有技术的 标准多重PCR,以更少的数目或产率获得引物二聚体或非特异性扩增产物。在一些实施方案 中,扩增假象的减少部分地通过在多重PCR反应中使用靶特异性引物对来控制。在一个实 施方案中,多重PCR反应中靶特异性引物对的数目可超过1000, 3000, 5000, 10000, 12000或 更多个。在一些实施方案中,本公开内容总地来说涉及用于使用包含可切割基团的靶特异 性引物进行多重PCR的方法(和相关组合物、系统、装置和试剂盒)。在一个实施方案中,包 含可切割基团的靶特异性引物可包含:对于每一个引物对的每个引物,一个或多个可切割 的部分。在一些实施方案中,包含可切割基团的靶特异性引物包含既非正常存在于非患病 样品中也非对于正在经历多重PCR的核酸的群体是天然的核苷酸。例如,靶特异性引物可 包括一个或多个非天然核酸分子例如,但不限于胸腺嘧啶二聚体、8-氧-2' -脱氧鸟嘌呤、 肌苷、脱氧尿苷、溴脱氧尿苷、无嘌呤核苷酸等。
[0245] 在一些实施方案中,公开的方法(和相关组合物、系统等)包括任选地使用靶特异 性引物,从核酸群体初始扩增靶序列。在一些实施方案中,公开的方法包括使用靶特异性正 向和反向引物对扩增靶序列。靶特异性正向和反向引物对可任选地包括一个或多个内含子 特异性和/或外显子特异性正向和反向引物对。在一些实施方案中,每一个引物对针对单 个或分散的外显子。在一些实施方案中,公开的方法包括使用包含至少一个可切割基团的 外显子特异性正向和反向引物对扩增靶序列。在一些实施方案中,靶特异性正向和反向引 物对包含尿嘧啶核苷酸作为一个或多个可切割基团。在一个实施方案中,靶特异性引物对 可在每一个引物对的正向和反向引物的每一个中包含尿嘧啶核苷酸。在一个实施方案中, 靶特异性正向或反向引物包含1、2、3或更多个尿嘧啶核苷酸。在一些实施方案中,公开的 方法包括使用包含至少两个尿嘧啶核苷酸的靶特异性正向和反向引物对从一群具有多个 靶序列的核酸扩增至少 10, 50, 100, 200, 500, 1000, 2000, 3000, 5000, 6000, 8000, 10000, 120 〇〇或更多个靶序列。
[0246] 在一些实施方案中,靶特异性引物(包括但不限于内含子特异性和外显子特异性 引物,所述引物可以是正向和/或反向引物)可使用根据指定的设计标准产生寡核苷酸序 列的算法从新设计。例如,引物可按照本文中指定的标准的任一个或多个来选择。在一些实 施方案中,靶特异性引物的一个或多个被选择或设计为满足下列标准的任一个或多个:(1) 在引物序列内包含两个或更多个修饰的核苷酸,其中至少一个包含在引物的末端附近或末 端上并且其中至少一个包含在引物序列的中央核苷酸位置上或其附近;(2)在长度上为约 15至约40个碱基的引物长度;(3)约60°C至约70°C的(4)与存在于目标靶基因组或样 品中的非靶序列的低交叉反应性;(5)对于给定的反应中的每一个引物,至少前4个核苷酸 (从3'至5'方向进行)的序列不与存在于相同反应中的任何其它引物内的任何序列互补; 和(6)扩增子都不包含与任何其它扩增子内的任何序列互补的具有至少5个核苷酸的任何 连续区段。
[0247] 在一些实施方案中,靶特异性引物包括一个或多个被设计来从样品扩增长度为约 100个碱基对至约500个碱基对的靶序列的引物。在一些实施方案中,靶特异性引物包括多 个被设计来扩增靶序列的引物对,其中预测扩增的靶序列彼此在长度上变化不超过50%, 通常不超过25 %,更常见地不超过10 %或5 %。例如,如果一个靶特异性引物对被选择或被 预测来扩增长度为1〇〇个核苷酸的产物,则其它引物对被选择或预测来扩增长度为50-150 个核苷酸,通常地长度为75-125个核苷酸,更常见地长度为90-110个核苷酸或95-105个 核苷酸或99-101个核苷酸的产物。
[0248] 在一些实施方案中,扩增反应中的至少一个引物对不是按照任何预定的选择标 准来从头设计。例如,至少一个引物对可以是随机选择或产生的,或先前选择或产生来用 于其它应用的寡核苷酸序列。在一个示例性实施方案中,扩增反应可包含至少一个选自 Tiu丨Via η?探针试剂 (Roche Molecular Systems)的引物对。⑧试剂包括标 记的探针并且可用于,除其它以外,任选地实时测量存在于样品中的靶序列的量。TaqMan技 术的一些实例公开于美国专利号 5, 210, 015、5, 487, 972、5, 804, 375、6, 214, 979、7, 141,377 和7, 445, 900 (通过引用整体并入本文)。
[0249] 在一些实施方案中,可以例如利用光学可检测标记物标记扩增反应中的至少一个 引物以有促进特定目标应用。例如,标记可促进靶模板和/或扩增产物的定量,靶模板和/ 或扩增产物的分离等。
[0250] 在一些实施方案中,扩增反应中的引物的一个或多个可用于核酸样品的基因分 型。
[0251] 在一些实施方案中,靶特异性引物可以以一组靶特异性引物对的形式提供于单个 扩增容器中。在一些实施方案中,可以以靶特异性引物对的一个或多个等分提供靶特异性 引物,在进行多重PCR反应之前可将其在单个扩增容器或反应室中混合。在一个实施方案 中,靶特异性引物可以以靶特异性正向引物的池和靶特异性反向引物的单独的池的形式提 供。在另一个实施方案中,可将靶特异性引物对混合成亚组例如非重叠靶特异性引物对。在 一些实施方案中,可在例如PCR板上的单个反应室或微孔中提供靶特异性引物对的池,以 使用热循环仪进行多重PCR。在一些实施方案中,靶特异性正向和反向引物对可与靶序列基 本上互补。
[0252] 在一些实施方案中,进行多重PCR扩增的方法包括将多个具有正向和反向引物的 靶特异性引物对与一群靶序列接触以形成多个模板/引物双链体;将DNA聚合酶和dNTP的 混合物添加至所述多个模板/引物双链体,以在充足的温度进行充足的时间来通过模板依 赖性合成延伸每一个靶特异性引物对的任一(或两个)正向或反向引物,从而产生多个延 伸的引物产物/模板双链体;使延伸的引物产物/模板双链体变性;使延伸的引物产物与 来自靶特异性引物对的互补引物退火;和在DNA聚合酶和dNTP存在的情况下延伸退火的引 物以形成多个靶特异性双链核酸分子。在一些实施方案中,可以以任何顺序进行扩增PCR 法的步骤。在一些情况下,可进一步最优化本文中公开的方法以除去一个或多个步骤,并且 仍然获得充足的待用于多种下游处理的扩增的靶序列。例如,纯化或提纯步骤的数目可被 改变来包括比本文中公开的更多或更少的步骤,只要扩增的靶序列以充足的产率产生。
[0253] 在一些实施方案中,靶特异性引物对在引物的3'或5'末端不包含常见的延伸 (尾)。在另一个实施方案中,靶特异性引物不包含标签或通用序列。在一些实施方案中, 靶特异性引物对被设计来消除或减少促进非特异性扩增的形成的相互作用。
[0254] 在一个实施方案中,靶特异性引物对包含:每正向和反向靶特异性引物至少一个 可切割基团。在一个实施方案中,可切割基团可以是尿嘧啶核苷酸。在一个实施方案中,靶 特异性引物对在扩增的靶序列产生后被部分或基本上除去。在一个实施方案中,去除可包 括靶特异性引物对的酶促、热或碱处理,作为扩增的靶序列的部分。在一些实施方案中,进 一步处理扩增的靶序列以形成平末端扩增产物,在本文中称为平末端扩增的靶序列。
[0255] 在一些实施方案中,方法、组合物、试剂盒、系统和装置中公开的靶特异性引物的 任一个或多个可使用下列引物选择标准来设计。
[0256] 存在对于用于鉴定或设计产物的新方法、计算机可读介质和系统或试剂盒的需 要,其使用PCR富集一个或多个目的基因组区域(其可以是例如lkb至1Mb的累积区域) 以用于随后测序。
[0257] 存在对于用于鉴定或设计产物的新方法、计算机可读介质和系统或试剂盒的需 要,其包括使一个或多个目标基因组区域或靶的覆盖度最大化同时使脱靶杂交、引物的数 目和引物池的数目的一项或多项最小化的引物和测定。
[0258] 根据本申请中体现的教导和原理,提供了鉴定或设计产物的新方法、计算机可读 介质和系统,或试剂盒,其使用PCR富集一个或多个目的基因组区域以用于随后测序,和/ 或包括使一个或多个目标基因组区域或靶的覆盖度最大化同时使脱靶杂交、引物的数目和 引物池的数目的一项或多项最小化的引物和测定。
[0259] 图17举例说明用于按照示例性实施方案设计引物或测定的系统。系统包括数据 接收模块1701、引物提供模拟1702、评分(芯片PCR)模块1703、评分(SNP重叠)模块1704、 滤过模块1705、混合模块1706和报告模块1707。系统还包括数据库1708,其可包括关于遗 传注释的数据、SNP相关数据或其它遗传数据例如重复序列、染色体、位置、方向等的鉴定, 例如,或任何其它类型的与目标基因组区域或靶相关的信息,以及数据库1709,其可包括引 物相关数据例如熔解温度(Tm)、染色体、位置、方向和SNP重叠信息等,例如,或任何其它类 型的可与引物相关的信息。系统可使用一个或多个软件构件于一个或多个计算中或使用一 个或多个计算执行,所述软件构件对于可能正在定购可使用这样的系统设计的订制引物或 测定的用户可能是不可获得的或释放的。用户可至少部分地通过网络可访问数据通道,通 过以任何适当的格式提供一个或多个目标基因组区域或靶,订购订制的引物或测定。在示 例性实施方案中,提供了进行步骤(包括与模块1701-1707和数据库1708及1709)相关的 一般步骤(例如,接收数据,提供引物,对引物和/或扩增子评分,滤过引物和/或扩增子, 混合引物和/或扩增子,报告结果和查询数据库)的方法。
[0260] 图18举例说明用于按照示例性实施方案设计引物或测定的系统。该系统包括靶 产生器模块,其可产生一个或多个基于坐标的目标基因组区域或靶并且可从注释数据库 (其可包括关于基因注释的数据、SNP相关数据或其它基因数据例如重复、染色体、位置、方 向等的鉴定,例如,以及关于引物的信息或任何其它类型的可与目标基因组区域或靶相关 的信息)查询和/或接收信息;设计模块,其可设计一个或多个引物或测定和,以及确定 和/或应用用于引物或测定的各种评分和滤过程序,并且可进行各种质量控制程序;加载 模块,其可将引物或测定和/或相关信息(例如质量控制结果,例如)加载至引物数据库 (其可与注释数据库交流或包含在注释数据库内,以及其可包括引物相关数据例如熔解温 度(Tm)、染色体、位置、方向和SNP重叠信息等,例如,或任何其它类型的可与引物相关的信 息);SNP重叠/重复序列重叠模块;驱动模块;拼接模块(tiler module),其可确定使目标 基因组区域或靶的覆盖度最大化的一个亚组的扩增子或小区;混合器模块,其可将扩增子 或小区的混合物确定为一个或多个扩增子的池;和报告产生器模块。可使用一个或多个软 件构件在一个或多个计算机和/或服务器中或使用所述计算机和/或服务器执行系统,所 述软件构件对于可能正在定购可使用这样的系统设计的订制引物或测定的用户可能是不 可获得的或释放的。用户可至少部分地通过网络可访问数据通道,通过以任何适当的格式 提供一个或多个目标基因组区域或靶,订购订制的引物或测定。在示例性实施方案中,提供 了进行步骤(包括与这些模块和数据库相关的一般步骤)的方法。
[0261] 图19举例说明包含被一对根据示例性实施方案设计的引物包围的插入序列的扩 增子序列。扩增子可包含包围绕插入序列的正向引物和反向引物。两个引物可一起形成测 定,其可订制和订购。扩增子的引物组分可以是一个拷贝的掺入引物,而非潜在样品,并且 一个或多个插入物可被选择来覆盖靶。
[0262] 图20举例说明包含被根据示例性实施方案设计的一对引物包围的插入物的扩增 子序列(其在本文中可称为"小区")的PCR扩增。显示了变性、退火和延伸步骤,最终导致 扩增子的指数增长。
[0263] 图21(第1部分-第3部分)举例说明给定的靶区域的一组候选扩增子,每一个 扩增子包含被一对引物包围的插入物,以用于根据示例性实施方案的拼接和混合。点线表 示靶区域(在本实施例中在染色体19上)的边界。在本实施例中有112个候选扩增子用 于覆盖靶区域,但候选扩增子的数目当然是不同的(包括低得多或高得多的),并且可通过 考虑计算资源、靶区域的长度和任何其它相关因子来选择。
[0264] 根据不同的示例性实施方案,提供了使用设计管道(design pipeline)来设计引 物的方法,其允许设计横跨目标基因组区域的寡核苷酸引物,同时结合各种设计标准和考 虑(包括扩增子大小、引物组成、潜在的脱靶杂交和引物的SNP重叠)的寡核苷酸引物。在 实施方案中,设计管道(design pipeline)包括几个可如接下来所述连续执行的功能模块。
[0265] 第一,在实施方案中,序列检索模块可被构造来基于关于用户所期望的终产物的 操作者说明书检索序列。操作者可索取由染色体和基因组坐标指定的或由基因符号指定器 指定的基因组区域的引物对的设计。在后一种情况下,序列检索模块可基于外显子坐标检 索序列。操作者还可指定是否包括5' UTR序列(非翻译序列)。
[0266] 第二,在实施方案中,测定设计模块可被构造来使用设计引擎设计引物对,其可以 例如是公共工具例如Primerf或另一种引物设计软件,所述软件可产生横跨通过序列检索 模块检索的整个序列区域的引物对。引物对可被选择来在整个核苷酸序列上致密地拼接。 引物设计可基于各种参数,包括:(1)引物的熔解温度(其可使用J〇hnSantaL Ucia,Jr.,"A unified view of polymer,dumbbel1, and oligonucleotide DNAnearest-neighbor thermodynamics, " Proc. Natl. Acad. Sci. USA,第 95 卷,1460-1465 (1998)(将其内容通过 引用整体并入本文)中所示的最邻近算法来计算),(2)引物组成(例如,核苷酸组成例如 GC含量可利用软件来测定和滤过以及罚分,对于引物发夹形成、引物的3'末端的GC含量的 组成亦如此,并且可被评价的特定参数是成段的同聚体核苷酸、发夹形成、GC含量和扩增子 大小),(3)正向引物、反向引物和扩增子的评分(可将评分加起来以获得探针组评分,评分 可反映扩增子确认与期望的参数之间的密切程度),和(4) 一些T至U的转换(可这样放 置T :引物的T界定的片段的预测的Tm具有最小平均Tm)。
[0267] 第三,在实施方案中,引物定位图模块可被构造来使用定位图软件(例如, e-PCR (NCBI),参见 Rotmistrovsky 等人,uk web server for performing electronic PCR, ''Nucleic Acids Research,第 32 卷,W108-W112(2004),和 Schuler, "Sequence Mapping by Electronic PCR, ''Genome Research,第 7 卷,541-550 (1997)(将这两篇文献通 过引用整体并入本文)或其它相似软件)来将引物定位至基因组。引物定位可使用错配矩 阵来评分。在实施方案中,完全匹配可接收为〇的评分,错配引物可接收大于〇的评分。错 配矩阵考虑了错配的位置和错配的性质。例如,错配矩阵可将错配评分赋予特定基序(例 如,AA,AC, AG, CA,CC,CT,GA,GG,GT,TC,TG,ΤΤ,A-,c-,G-,T-,-A, -c,-G 和-T,其中'-,表示 不确定的碱基或缺口)与特定位置(例如,3'末端上的碱基、距离3'末端的第二碱基、距离 3'末端的第三碱基、距离5'末端的第三碱基、距离5'末端的第二碱基、5'末端上的碱基和 其间的位置)的每一个组合,这可凭经验来获得,可被选择来反映更接近3'末端的错配相 较于更接近5 '末端的错配倾向于更弱的PCR反应,从而通常可更大。具有不确定的碱基或 缺口的基序的错配评分可被赋予与其一致的其它基序的评分的平均值(例如,A-可被赋予 AA、AC和AG的评分的平均值)。对于特定评分阈值,基于命中数目,可计算扩增子成本。
[0268] 第四,在实施方案中,SNP模块可被构造来测定潜在的SNP和重复区域:SNP可被定 位至引物并且基于SNP离3'末端的距离,可将引物作为潜在候选者进行滤过。类似地,如 果引物与重复区域重叠至特定百分比,则引物可能被滤过。
[0269] 第五,在实施方案中,拼接器模块可被构造来基于扩增子成本(参见引物定位) 和选择一组覆盖靶同时确保靶的拼接引物的选择不依赖于可存在于用户索取中的其它靶 (以便无论用户仅索取该靶还是另外的靶以及无论扩增子将帮助覆盖该靶还是另外的靶, 相同组的靶的引物都将被选择)所必需的引物数目来使用功能。
[0270] 第六,在实施方案中,混合器模块可被构造来使用混合算法,该算法防止扩增子重 叠并且确保池中引物的平均数目偏离不超过预设值。
[0271] 图22举例说明根据示例性实施方案的方法。在步骤2201中,模块或其它硬件和 /或软件构件接收一个或多个目标基因组区域或序列。在步骤2202中,模块或其它硬件和 /或软件构件确定接收的一个或多个目标基因组区域或序列的一个或多个靶序列。在步骤 2203中,模块或其它硬件和/或软件构件为测定的一个或多个靶序列中的每一个提供一个 或多个引物对。在步骤2204中,模块或其它硬件和/或软件构件对一个或多个引物对进行 评分,其中评分包括基于一个或多个引物对的芯片PCR的性能的罚分,并且其中评分还包 括对于一个或多个引物对的SNP重叠的分析。在步骤2205中,模块或其它硬件和/或软件 构件基于多个因素(包括至少罚分和SNP重叠的分析)滤过一个或多个引物对,以鉴定对 应于一个或多个目标基因组区域或序列的一个或多个候选扩增子序列的一组滤过的引物 对。
[0272] 根据示例性实施方案,提供了方法,包括:(1)接收一个或多个目标基因组区域或 序列;(2)确定接收的一个或多个目标基因组区域或序列的一个或多个靶序列;(3)为确定 的一个或多个靶序列的每一个提供一个或多个引物对;(4)对一个或多个引物对评分,其 中评分包括基于一个或多个引物对的芯片PCR的性能的罚分,并且其中评分还包括对于一 个或多个引物对的SNP重叠的分析;(5)基于多个因素(包括至少罚分和SNP重叠的分析) 滤过一个或多个引物对,以鉴定对应于一个或多个目标基因组区域或序列的一个或多个候 选扩增子序列的一组滤过的引物对。
[0273] 在不同的实施方案中,接收一个或多个目标基因组区域或序列可包括接收一组一 个或多个基因符号或标识符。接收一个或多个目标基因组区域或序列可包括接收一组一个 或多个基因组坐标或其它基因组位置标识符。接收一个或多个目标基因组区域或序列可包 括接收一组一个或多个BED坐标。
[0274] 在不同的实施方案中,测定一个或多个靶序列可包括测定一个或多个外显子或编 码区,所述外显子或编码区对应于一个或多个目标基因组区域或序列的每一个。测定一个 或多个靶序列可包括就一个或多个目标基因组区域或序列在其中的存在和与其相关的信 息查询扩增子或其它基因组序列数据库。
[0275] 在不同的实施方案中,提供一个或多个引物对可包括设计一个或多个引物对。提 供一个或多个引物对可包括就一个或多个目标基因组区域或序列或一个或多个引物对在 其中的存在和与其相关的信息查询扩增子或其它基因组序列数据库。
[0276] 在不同的实施方案中,芯片PCR的性能可包括针对任何物种的参照或先前测序的 基因组进行芯片PCR。芯片PCR的性能可包括针对hgl9参照基因组进行芯片PCR。针对参 照基因组的芯片PCR的性能可包括测定一个或多个引物对的每一个的多个脱靶杂交。针对 参照基因组的芯片PCR的性能可包括测定一个或多个引物对的每一个的最坏情况下的属 性或评分。芯片PCR的性能可包括测定一个或多个引物对的每一个的一个或多个基因组坐 标。芯片PCR的性能可包括测定一个或多个引物对的每一个的一个或多个预测的扩增子序 列。芯片PCR的性能可包括就一个或多个目标基因组区域或序列或一个或多个引物对的芯 片PCR结果在其中的存在和与其相关的信息查询扩增子或其它基因组序列数据库。
[0277] 在不同的实施方案中,SNP重叠的分析可包括确定一个或多个引物对的每一个的 SNP种类。SNP重叠的分析可包括就一个或多个目标基因组区域或序列或一个或多个引物 对的SNP重叠结果在其中的存在和与其相关的信息查询扩增子或其它基因组序列数据库。
[0278] 在不同的实施方案中,所述多个因素可包括下列一个或多个:正向SNP重叠的指 示、反向SNP重叠的指示、正向重复的频率的指示、反向重复的频率的指示、一个或多个引 物对的每一个的脱靶杂交的指示以及一个或多个引物对的每一个的组成。所述多个因素可 包括下列一个或多个:正向三联体因子、反向三联体因子、正向A run因子、反向A run因子、 正向C run因子、反向C run因子、正向G run因子、反向G run因子、正向T run因子和反向 T run因子。所述多个因素可包括下列一个或多个:一个或多个引物对的每一个包括一个或 多个同聚物所达到的程度的指示。所述多个因素可包括一个或多个引物对的每一个包括一 个或多个重复序列所达到的程度的指示。所述多个因素可包括一个或多个引物对的长度, 其中一个或多个引物对的评分随长度变得比最小长度阈值短而减小,以及随长度变得比最 大长度阈值长而减小。所述多个因素可在一个或多个引物对中包括最大数目的给定的碱 基,其中一个或多个引物对的评分随给定的碱基的数目超过最大碱基包含阈值而减小。所 述多个因素可包括给定的碱基的连续事件的最大数目,其中一个或多个引物对的评分随给 定的碱基的连续事件的数目超过最大连续碱基包含阈值而减小。
[0279] 所述多个因素可包括一组两个给定的碱基最大百分比,其中一个或多个引物对的 评分随两个给定的碱基的百分比增加而减小。所述多个因素可包括G和C碱基的最大百分 t匕,其中一个或多个引物对的评分随G和C碱基的百分比的增加而减小。所述多个因素可 包括一个或多个引物对的预测的熔解温度相对于最小和最大熔解温度阈值的偏差。所述多 个因素可包括一个或多个引物对的引物二聚体包含的数目。所述多个因素可包括一个或多 个引物对的局部互补性的水平。所述多个因素可包括一个或多个引物对的每一个的复杂度 水平的指示。所述多个因素可包括一个或多个引物的每一个的SNP重叠的指示。
[0280] 在不同的实施方案中,方法可包括选择一个亚组的一个或多个候选扩增子序列, 所述序列基本上覆盖一个或多个目标基因组区域或序列,同时将与候选扩增子序列相关的 成本函数降至最低。将成本函数降至最低可包括产生包含源顶点、一个或多个扩增子顶点 和汇点顶点的重叠图。
[0281] 在不同的实施方案中,方法可包括将引物对的滤过组中与一个或多个候选扩增子 序列的选择的亚组对应的引物对装配成多个单独的引物对的池。装配引物对可包括至少基 于给定的池中的扩增子序列之间的最小阈值距离将引物对的滤过组中与一个或多个候选 扩增子序列的选择的亚组对应的一个或多个引物对的包含限制于给定的池中。最小阈值距 离可以为例如约5个碱基对至约100个碱基对,或约15个碱基对至约90个碱基对,或约25 个碱基对至约75个碱基对,或约40个碱基对至约60个碱基对。在一些实施方案中,扩增 子之间的最小阈值距离可包括任何整数,包括负整数。例如为0的值可表示任何两个扩增 子被允许"接触",为-8的值表示任何两个扩增子可重叠达到8个碱基。
[0282] 在不同的实施方案中,将引物对的滤过组装配进引物对的多个单独池可包括分开 管之间的引物对,以防止扩增子在任何给定的管内重叠。装配引物对可包括至少基于给定 的池的预定扩增子容量将引物对的滤过组中与一个或多个候选扩增子序列的选择的亚组 对应的一个或多个引物对的包含限制于给定的池中。装配引物对可包括至少基于使给定的 池的大小与平衡因子与单独的池的大小的最大值之间的产物相关的不等式,将引物对的滤 过组中与一个或多个候选扩增子序列的选择的亚组对应的一个或多个引物对的包含限制 于给定的池中。
[0283] 在不同的实施方案中,方法可包括提供报告数据的信息的任一个或多个组件的报 告,所述数据通过接收、提供、评分、滤过、选择和装配步骤中的任一个或多个而使用或产 生。
[0284] 根据示例性实施方案,提供了包含指令的非短暂性机器可读存储介质,所述指令, 当被处理器执行时,使得处理器进行下列方法,所述方法包括:(1)接收一个或多个目标基 因组区域或序列;(2)确定接收的一个或多个目标基因组区域或序列的一个或多个靶序 列;(3)为确定的一个或多个靶序列的每一个提供一个或多个引物对;(4)对一个或多个引 物对进行评分,其中评分包括基于一个或多个引物对的芯片PCR的性能的罚分,并且其中 评分还包括一个或多个引物对的SNP重叠的分析;和(5)基于多个因素(包括至少罚分和 SNP重叠的分析)滤过一个或多个引物对,以鉴定对应于一个或多个目标基因组区域或序 列的一个或多个候选扩增子序列的一组滤过的引物对。
[0285] 在不同的实施方案中,这样的非短暂性机器可读存储介质可包含指令,所述指令, 当被处理器执行时,使得处理器进行下列方法,所述方法还包括:(6)选择基本上覆盖一个 或多个目标基因组区域或序列同时使得与候选扩增子序列相关的成本函数减小至最小的 一个亚组的一个或多个候选扩增子序列;和(7)将引物对的滤过组中与一个或多个候选扩 增子序列的选择的亚组对应的引物对装配进入引物对的多个单独的池。
[0286] 根据示例性实施方案,提供了系统,其包括:(1)机器可读内存;和(2)被构造来执 行机器可读指令的处理器,所述指令,当被处理器执行时,使得系统进行步骤,包括:(a)接 收一个或多个目标基因组区域或序列;(b)确定接收的一个或多个目标基因组区域或序列 的一个或多个靶序列;(c)为确定的一个或多个靶序列的每一个提供一个或多个引物对; (d)对一个或多个引物对进行评分,其中评分包括基于一个或多个引物对的芯片PCR的性 能的罚分,并且其中评分还包括一个或多个引物对的SNP重叠的分析;和(e)基于多个因素 (包括至少罚分和SNP重叠的分析)滤过一个或多个引物对,以鉴定对应于一个或多个目标 基因组区域或序列的一个或多个候选扩增子序列的一组滤过的引物对。
[0287] 在不同的实施方案中,这样的系统的处理器还可被构造来执行机器可读指令,所 述指令,当被处理器执行时,使得系统进行步骤,包括:(f)选择基本上覆盖一个或多个目 标基因组区域或序列同时使得与候选扩增子序列相关的成本函数减小至最小的的一个亚 组的一个或多个候选扩增子序列;和(g)将引物对的滤过组中与一个或多个候选扩增子序 列的选择的亚组对应的引物对装配进入引物对的多个单独的池。
[0288] 根据不同的示例性实施方案,可将不同的参数或标准用于选择引物和/或扩增 子。
[0289] 在实施方案中,可使用正向SNP评分,如果在正向引物的碱基对的给定长度(例如 4,例如)内不存在SNP,所述评分可被赋予为1的数字属性/评分,或者如果在4个碱基对 的长度内存在1个或多个SNP,则被赋予为0的数字属性。在一个实施方案中,如果在来自 正向引物的3'末端的碱基对的给定长度内不存在SNP,则正向SNP评分可被赋予为1的数 字属性/评分。在一些实施方案中,SNP可包括在UCSC的Genome Browser网页上发现的一 个或多个SNP,包括但不限于称为"dbSNP132common"的SNP参考表。为1的属性/评分可 以是最小属性/评分,以便未达到该属性/评分将导致不合格。属性/评分测定的碱基长 度阈值可比4更低或更高,可以为例如5, 6, 7, 8, 9, 10, 15, 20,或更一般地大于4的任何正整 数。属性/评分可以不是二元的,其可以是在碱基对的给定长度内SNP的数目的更复杂的 线性或非线性函数。
[0290] 在实施方案中,可使用反向SNP评分,如果在反向引物的碱基对的给定长度(例如 4,例如)内不存在SNP,所述评分可被赋予为1的数字属性/评分,或者如果在4个碱基对 的长度内存在1个或多个SNP,则被赋予为0的数字属性。在一个实施方案中,如果在来自 反向引物的3'末端的碱基对的给定长度内不存在SNP,则反向SNP评分可被赋予为1的数 字属性/评分。在一些实施方案中,SNP可包括在UCSC的Genome Browser网页上发现的一 个或多个SNP,包括但不限于称为"dbSNP132common"的SNP参考表。为1的属性/评分可 以是最小属性/评分,以便未达到该属性/评分可导致不合格。属性/评分测定的碱基长 度阈值可比4更低或更高,可以为例如5, 6, 7, 8, 9, 10, 15, 20,或更一般地大于4的任何正整 数。属性/评分可以不是二元的,其可以是在碱基对的给定长度内SNP的数目的更复杂的 线性或非线性函数。
[0291] 在实施方案中,可使用正向重复序列评分,如果在正向引物的碱基对的给定长度 (例如4,例如)内不存在重复序列,所述评分可被赋予为1的数字属性/评分,或者如果在 4个碱基对的长度内存在1个或多个重复序列,则被赋予为0的数字属性。在一个实施方案 中,如果正向引物与已知的重复序列存在少于30 %的重叠,则正向重复评分可被赋予为1 的数字属性/评分。在一些实施方案中,已知的重复序列可包括一个或多个UCSC的Genome Browser报导的重复序列,例如由来自UCSC的屏蔽重复序列的hgl9基因组提供的重复序列 区域。为1的属性/评分可以是最小属性/评分,以便未达到该属性/评分可导致不合格。 属性/评分测定的碱基长度阈值可比4更低或更高,可以为例如5, 6, 7, 8, 9, 10, 15, 20,或更 一般地大于4的任何正整数。属性/评分可以不是二元的,其可以是在碱基对的给定长度 内重复序列的数目的更复杂的线性或非线性函数。
[0292] 在实施方案中,可使用反向重复序列评分,如果在反向引物的碱基对的给定长度 (例如4,例如)内不存在重复序列,所述评分可被赋予为1的数字属性/评分,或者如果在 4个碱基对的长度内存在1个或多个重复序列,则被赋予为0的数字属性。在一个实施方案 中,如果反向引物与已知的重复序列存在少于30 %的重叠,则反向重复评分可被赋予为1 的数字属性/评分。在一些实施方案中,已知的重复序列可包括一个或多个UCSC的Genome Browser报导的重复序列,例如由来自UCSC的屏蔽重复序列的hgl9基因组提供的重复序列 区域。为1的属性/评分可以是最小属性/评分,以便未达到该属性/评分可导致不合格。 属性/评分测定的碱基长度阈值可比4更低或更高,可以为例如5, 6, 7, 8, 9, 10, 15, 20,或更 一般地大于4的任何正整数。属性/评分可以不是二元的,其可以是在碱基对的给定长度 内重复序列的数目的更复杂的线性或非线性函数。
[0293] 在不同的实施方案中,可使用正向三联体评分、反向三联体评分、正向A run评分、 反向A run评分、正向C run评分、反向C run评分、正向G run评分、反向G run评分、正向 Trim评分和反向Trim评分的一个或多个,其可被赋予等于整个引物内的正向三联体、反向 三联体、正向A run、反向A run、正向C run、反向C run、正向G run、反向G run、正向T run 和反向T run的数目的数字属性/评分。为3的属性/评分可以是三联体的最大属性/评 分,以便未能保持在该属性/评分或未能低于该属性/评分可导致不合格。为5的属性/ 评分可以是run的最大属性/评分,以便未能保持在该属性/评分或未能低于该属性/评 分可导致不合格。属性/评分可以不是二元的,其可以是三联体/run的数目的更复杂的线 性或非线性函数。
[0294] 在实施方案中,引物的长度可受到最小引物长度阈值和最大引物长度的限制,并 且可设置引物的长度评分以使其随长度变得比最小引物长度阈值短而减小,以及随长度变 得比最大引物长度阈值长而减小。在实施方案中,最小引物长度阈值可以为16。在其它实 施方案中,最小引物长度阈值可以为例如15, 14, 13, 12, 11,10, 9, 8, 7, 6或5,并且还可以为 例如17, 18, 19, 20, 21,22, 23和24。在实施方案中,最大引物长度阈值可以为28。在其它 实施方案中,最大引物长度阈值可以为例如29, 30, 31,32, 33, 34, 35, 36, 37, 38, 39和40,以 及还可为例如27, 26, 25, 24, 23, 22, 21和20。在实施方案中,例如,如果长度阈值得以满足, 则引物长度标准可被赋予为1. 〇的评分,并且随着引物长度偏离最小或最大长度阈值,该 评分可下降至0. 0。例如,如果最大引物长度阈值被设置至28,则如果长度不超过28,评分 可被设置至1. 〇,如果长度为29,则评分可被设置至0. 7,如果长度为30,则评分可被设置至 0. 6,如果长度为31,则评分可被设置至0. 5,如果长度为32,则评分可被设置至0. 3,如果长 度为33,则评分可被设置至0. 1,以及如果长度为34或更长,则评分可被设置至0. 0。当然, 可使属性/评分在除〇. 〇和1. 〇外的值之间的范围内,确定评分如何随相对于阈值增加的 差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述函数不导致与长度 阈值进一步偏离的引物的评分的增加。
[0295] 在实施方案中,引物中的G碱基的(或A、C或T碱基)的数目受到最大阈值的限 制,并且设置引物的相应评分以使其随着G碱基(或A、C或T碱基)的数目超过最大阈 值而减小。在实施方案中,最大阈值可以为3。在其它实施方案中,最大阈值可以为例如 2, 4, 5, 6, 7, 8, 9和10。在实施方案中,例如,如果最大阈值得以满足,则G碱基(或A、C或T 碱基)的数目标准可被赋予1. 〇的评分,并且该评分随着G碱基(或A、C或T碱基)的数 目偏离最大阈值可下降至〇. 0。例如,如果最大阈值被设置至4,则如果G碱基(或A、C或 T碱基)的数目不超过4,评分可被设置至1. 0,如果数目为5,则评分可被设置至0. 9,如果 数目为6,则评分可被设置至0. 8,如果数目为7,则评分可被设置至0. 6,如果数目为8,则评 分可被设置至〇. 4,如果数目为9,则评分可被设置至0. 2,以及如果数目为10或更多,则评 分可被设置至〇. 0。当然,可使评分在除〇. 〇和1. 〇外的值之间的范围内,确定评分如何随 G碱基(或A、C或T碱基)的数目与最大阈值之间增加的差异而变化的函数可以是任何其 它或更复杂的线性或非线性函数,所述函数不导致与最大阈值进一步偏离的引物的评分的 增加。
[0296] 在实施方案中,引物中的环(例如,发夹)中的连续的和总的匹配的数目可受到最 大阈值的限制,并且设置引物的相应评分以使其随环中连续的和总的匹配的数目超过最大 阈值而减小。在实施方案中,连续匹配的最大阈值可为3,以及总的匹配的最大阈值可为5。 在其它实施方案中,连续匹配的最大阈值可以为例如2, 4, 5, 6, 7, 8, 9和10,总的匹配的最 大阈值可为例如3, 4, 6, 7, 8, 9, 10, 11,12, 13, 14和15。在实施方案中,例如,如果最大阈值 得以满足,则环标准中连续和总的匹配的数目可被赋予1.0的评分,并且该评分可随环中 连续的和总的匹配的数目偏离相应的最大阈值下降至0.0。例如,如果连续匹配的最大阈值 被设置至3,则如果连续匹配的数目不超过3,评分可被设置至1. 0,如果数目为4,则评分可 被设置至〇. 9,如果数目为5,则评分可被设置至0. 7,如果数目为6,则评分可被设置至0. 4, 如果数目为7,则评分可被设置至0. 2,如果数目为8,则评分可被设置至0. 1,以及以及如果 数目为9或更多,则评分可被设置至0. 0。例如,如果总的匹配的最大阈值被设置至5,则如 果总的匹配的数目不超过5,评分可被设置至1. 0,如果数目为6,则评分可被设置至0. 9,如 果数目为7,则评分可被设置至0. 8,如果数目为8,则评分可被设置至0. 6,如果数目为9,则 评分可被设置至〇. 4,如果数目为10,则评分可被设置至0. 2,如果数目为11,则评分可被设 置至0. 1,以及如果数目为12或更多,则评分可被设置至0. 0。当然,可使评分在除0. 0和 1.0外的值之间的范围内,确定评分如何随连续/总的匹配的数目与相应的最大阈值之间 增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述函数不导致 与最大阈值进一步偏离的引物的评分的增加。
[0297] 在实施方案中,引物的最后5个碱基的G和C碱基(或A、C、G和T碱基的任意两 个)的数目可受到最大阈值的限制,并且可设置相应的引物的评分以使其随G和C碱基(或 A、C、G和T碱基的任意两个)的数目超过最大阈值而减小。在实施方案中,最大阈值可以为 2。在其它实施方案中,最大阈值可以为例如3、4和5。在实施方案中,例如,如果最大阈值 得以满足,则G和C碱基(或A、C、G和T碱基的任意两个)的数目标准可被赋予1. 0的评 分,例如,随着G和C碱基(或A、C、G和Τ碱基的任意两个)的数目偏离最大阈值,则该评 分可下降至〇. 0。例如,如果最大阈值被设置至2,则如果G和C碱基(或A、C、G和T碱基 的任意两个)的数目不超过2,那么评分可被设置至1. 0,如果数目为3,则评分可被设置至 〇. 8,如果数目为4,则评分可被设置至0. 4,以及如果数目为5,则评分可被设置至0. 1。当 然,可使评分在除〇. 〇和1. 〇外的值之间的范围内,确定评分如何随G和C碱基(或A、C、G 和T碱基的任意两个)的数目与相应的最大阈值之间增加的差异而变化的函数可以是任何 其它或更复杂的线性或非线性函数,所述函数不导致与最大阈值进一步偏离的引物的评分 的增加。在其它实施方案中,例如,该标准考虑了更大的喊基窗口中,例如在最后6个喊基, 最后7个喊基,最后8个喊基等等中的G和C喊基(或A、C、G和T喊基的任意两个)的数 目。
[0298] 在实施方案中,引物中G和C碱基(或A、C、G和T碱基的任意两个)的百分比可 受到最小和最大阈值的限制,并且可设置相应的引物的评分以使其随G和C碱基(或A、C、 G和T碱基的任意两个)的百分比偏离最小或最大阈值而减小。在实施方案中,例如,最 小阈值可以为0.2(20% ),最大阈值可为0.8(80% )。在其它实施方案中,例如,最小阈值 可为约0.2(20% )与约0.5(50% )之间的任意百分比,最大阈值可以为约0.8(80% )与 0. 5(50% )之间的任意百分比。在实施方案中,例如,如果最小和最大阈值得以满足,则G 和C碱基(或A、C、G和T碱基的任意两个)的百分比标准可被赋予1. 0的评分,并且如果 任一阈值未得以满足,则该值可下降至〇. 0。当然,可使评分在除〇. 〇和1. 〇外的值之间的 范围内,确定评分如何随G和C碱基(或A、C、G和T碱基的任意两个)的百分比与最小或 最大阈值之间增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所 述函数不导致与最小或最大阈值进一步偏离的引物的评分的增加。
[0299] 在实施方案中,引物的熔解温度(Tm)可受最小和最大阈值的限制,并且可设置相 应的引物的评分以使其随熔解温度偏离最小或最大阈值而减小。在实施方案中,例如,最 小阈值可以为60,最大阈值可为67,靶熔解温度为62。在其它实施方案中,例如,最小阈 值可为约55与约65之间的值,最大阈值可以为约62与约72之间的值。在实施方案中, 例如,如果最小和最大阈值得以满足,则熔解温度标准可被赋予1. 0的评分,并且如果任一 阈值未得以满足,则评分可下降至〇. 0。当然,可使评分在除〇. 〇和1. 〇外的值之间的范 围内,确定评分如何随熔解温度与最小或最大阈值之间增加的差异而变化的函数可以是 任何其它或更复杂的线性或非线性函数,所述函数不导致与最小或最大阈值进一步偏离 的引物的评分的增加。引物的烙解温度可使用John SantaLucia, Jr.,"A unified view of polymer, dumbbell, and oligonucleotide DNA nearest-neighbor thermodynamics,,'Proc. Natl. Acad. Sci. USA,第95卷,1460-1465(1998)(将其公开内容通过引用整体并入本文) 中所示的教导来计算。
[0300] 在实施方案中,引物中的引物二聚体倾向性可受到3'末端上的连续引物二聚体的 最大阈值和整个长度上的总的连续匹配的最大阈值限制,并且可设置相应的引物的评分以 使其随引物二聚体倾向性偏离最大阈值而减小。在实施方案中,3'末端上的连续引物二聚 体的最大阈值可以为4,整个长度上的总的连续匹配的最大阈值可以为8。在其它实施方案 中,例如,3'末端上的连续引物二聚体的最大阈值可以为约2至约6之间的值,整个长度上 的总的连续匹配的最大阈值可以为约4至10之间的值。在实施方案中,例如,如果阈值得 以满足,则引物二聚体倾向性标准可被赋予为1. 〇的评分,如果阈值未得到满足,则该评分 可下降至0. 0。当然,可使评分在除0. 0和1. 0外的值之间的范围内,确定评分如何随引物 二聚体倾向性与最大阈值之间增加的差异而变化的函数可以是任何其它或更复杂的线性 或非线性函数,所述函数不导致与最大阈值进一步偏离的引物的评分的增加。
[0301] 在实施方案中,扩增子序列中的G和C碱基(或A、C、G和T碱基的任意两个)的 百分比可受到最小和最大阈值的限制,并且可设置相应的扩增子的评分以使其随G和C碱 基(或A、C、G和T碱基的任意两个)的百分比偏离最小或最大阈值而减小。在实施方案 中,最小阈值可为〇.〇(〇% ),最大阈值可为1.0(100% )。在其它实施方案中,例如最小阈 值可为约〇· 1(10% )与约〇· 25(25%)之间的任意百分比,最大阈值可为约0· 75(75% )与 0. 9(90% )之间的任意百分比。在实施方案中,例如,如果最小和最大阈值得以满足,则G 和C碱基(或A、C、G和T碱基的任意两个)的百分比标准可被赋予为1. 0的评分,如果任 一阈值未得到满足,则评分可下降至〇. 0。当然,可使评分在除〇. 〇和1. 〇外的值之间的范 围内,确定评分如何随G和C碱基(或A、C、G和T碱基的任意两个)的百分比与最小或最 大阈值之间增加的差异而变化的函数可以是任何其它或更复杂的线性或非线性函数,所述 函数不导致与最小或最大阈值进一步偏离的扩增子的评分的增加。
[0302] 在实施方案中,扩增子序列的长度可受到最小扩增子长度阈值和最大扩增子长度 的限制,并且可设置相应的扩增子的长度评分以使其随长度变得比最小扩增子长度阈值短 时而减小,以及随长度变得比最大扩增子长度阈值长而减小。在实施方案中,最小扩增子长 度阈值可为110。在其它实施方案中,例如,最小引物长度阈值可为约80与约140之间的 值。在实施方案中,最大扩增子长度阈值可为240。在其它实施方案中,例如,最大扩增子长 度阈值可为约200与约280之间的值。在实施方案中,如果长度阈值得以满足,则扩增子长 度标准可被赋予为1.0的评分,如果任一标准未得以满足,则扩增子长度标准可被赋予为 0.0的评分。在另一个实施方案中,随着扩增子长度偏离最小或最大长度阈值,该评分可下 降至0. 0。例如,如果最大扩增子长度阈值被设置至240,则如果长度不超过240,评分可被 设置至1. 0,如果长度为至少250,则评分可被设置至0. 8,如果长度为至少260,评分可被设 置至0. 6,如果长度为至少270,评分可被设置至0. 4,如果长度为至少280,评分可被设置至 〇. 1,以及如果长度为至少290,则评分可被设置至0. 0。当然,可使评分在除0. 0和1. 0外 的值之间的范围内,确定评分如何随相对于阈值的增加的差异而变化的函数可以是任何其 它或更复杂的线性或非线性函数,所述函数不导致与长度阈值进一步偏离的扩增子的评分 的增加。
[0303] 根据示例性实施方案,提供了用于使用一个或多个扩增子的池从多个候选扩增子 选择一个亚组(其在本文中可称为"拼接")的扩增子(其在本文中可称为"小区")以覆盖 一个或多个特定的期望的(例如,订制的)基因组区域或靶的方法。方法可包括接收一组一 个或多个靶和一组候选扩增子作为输入,并且可包括输出一个亚组的候选扩增子以及亚组 中的每一个扩增子至池(其中该扩增子可被多重化)中的分配作为输出。可使用具有任何 适当的大小的扩增子。在实施方案中,例如,测定或引物设计可适应200bp扩增子和150bp 扩增子,例如,其对于某些挑战性样品例如FFPE可以是特别有用的。在实施方案中,测定 或引物设计可经改造适合于与一个或多个特定文库试剂盒例如Ion AmpliSeq? Library试 剂盒2. 0相容。
[0304] 根据示例性实施方案,提供了用于拼接和混合的方法,包括(1)从一组输入扩增 子选择一个亚组的扩增子(这在本文中可称为"拼接"),以便该亚组的扩增子(i)覆盖与 输入扩增子的组中的扩增子所覆盖的同样多的靶,(ii)具有很多比输入扩增子的组小的扩 增子,和(iii)使扩增子的质量最大化;和(2)将扩增子的该亚组中的每一个扩增子或小区 分配或拼接至池中以允许每一个池被多重化。
[0305] 图23举例说明用于根据示例性实施方案拼接一个或多个给定的靶的多个扩增子 的方法。在步骤2301中,模块或其它硬件和/或软件构件根据它们的起始位点分选一个或 多个给定的靶(或当提供为输入时,确保已以这样的方式对给定的靶进行了预分选)。在步 骤2302中,模块或其它硬件和/或软件构件根据插入物起始位点分选扩增子(或当作为输 入提供时,确保已以这样的方式对扩增子进行了预分选)。在步骤2303中,模块或其它硬件 和/或软件构件合并存在于分选的一个或多个靶中的重叠靶。在步骤2304中,对于每一个 合并的重叠靶,模块或其它硬件和/或软件构件(i)确定什么扩增子具有与靶重叠的插入 物以及将这样的扩增子鉴定为候选扩增子,和(ii)使用一个或多个给定的靶和候选扩增 子的函数确定小区。在步骤2305中,模块或其它硬件和/或软件构件输出确定的小区。在 一些实施方案中,可在或可以不在聚集任何靶扩增子之前合并靶,可聚集扩增子以用于未 合并的靶,并且,如果两个靶共有至少一个扩增子,这样的两个靶可被合并在一起(并且两 个靶中的一个可以已代表一组合并的输入扩增子)。
[0306] 根据示例性实施方案,提供了用于拼接一个或多个给定的靶的多个扩增子的方 法,包括:(1)根据它们的起始位点分选一个或多个给定的靶,或当作为输入提供时,确保 给定的靶已以这样的方式进行了预分选;(2)根据插入物的起始位点分选扩增子,或当作 为输入提供时,确保扩增子已以这样的方式进行了预分选;(3)合并存在于分选的一个或 多个靶中的重叠靶;(4)对于每一个合并的重叠靶,(i)确定什么扩增子具有与靶重叠的插 入物以及将这样的扩增子鉴定为候选扩增子,和(ii)使用一个或多个给定的靶和候选扩 增子的函数确定小区;和(5)输出小区。
[0307] 图24举例说明根据示例性实施方式的用于确定一个或多个给定的靶和候选扩增 子的小区的方法。在步骤2401中,模块或其它硬件和/或软件构件产生候选插入物的重叠 图,该图包括源顶点、一个或多个扩增子顶点和沿着一个或多个连接顶点的边的汇点顶点。 在步骤2402中,模块或其它硬件和/或软件构件确定了边成本函数或使用已确定的边成本 函数。在步骤2403中,模块或其它硬件和/或软件构件从源顶点至汇点顶点发现这样的的 边成本函数的最低成本路径。在步骤2404中,模块或其它硬件和/或软件构件从源至汇点 的最低成本路径提取小区。在步骤2405中,模块或其它硬件和/或软件构件返回提取的小 区。
[0308] 根据示例性实施方案,提供了用于确定一个或多个给定的靶和候选扩增子的小区 的方法,包括:(1)产生候选插入物的重叠图,重叠图包括一组顶点V和一组边E(例如,图G =(V,E)),这样产生包括(i)使V等于候选扩增子的组(其每一个被赋予相应的顶点)与 由源组件和汇点组件组成的组的合并(例如,V= {扩增子}U{源,汇点}),(ii)将源顶点 与所有初始顶点连接并且将汇点顶点连接至所有末端顶点,(iii)将每一个扩增子顶点连 接至所有随后的适当的重叠,和(iv)将缺口左边上的最右边的顶点连接至该缺口的右边 上的最左边的顶点;(2)确定边成本函数或使用已确定的边成本函数;(3)从源顶点至每个 顶点发现这样的边成本函数的最低成本路径;(4)从源至汇点的最低成本路径提取小区; 和(5)返回提取的小区。
[0309] 图25A举例说明一组用于覆盖组定的靶区域的候选扩增子,每一个包含被一对引 物包围的插入物,用于根据示例性实施方案的拼接和混合。点线表示靶区域(在本实施例 中在染色体19上)的边界。
[0310] 图25B举例说明一组用于产生图的顶点。顶点V包括对应于图25A中举例说明的 15个候选扩增子的15个扩增子顶点(白色)以及源顶点(浅灰色或绿色,左)和汇点顶点 (深灰色或红色,右)。
[0311] 图26A举例说明图25A的15个候选扩增子,除3个在它们的插入物与靶区域的起 始位点之间具有至少一定重叠的"初始"扩增子被突出显示外。
[0312] 图26B举例说明利用边将源顶点连接至对应于图26A的初始扩增子的3个顶点。
[0313] 图27A举例说明图25A的15个候选扩增子,除3个在它们的插入物与靶区域的末 端之间具有至少一些重叠的"末端"扩增子被突出显示外。
[0314] 图27B举例说明利用边将汇点顶点连接至对应于图27A的末端扩增子的3个顶 点。
[0315] 图28A举例说明图25A的15个候选扩增子,除用于构建内边的各种扩增子被突出 显示外。
[0316] 图28B举例说明根据示例性实施方案进行的一些扩增子插入物顶点至随后的适 当的重叠的连接。显示了连接9767127扩增子顶点与9767463和9767519扩增子顶点(其 插入物与9767127扩增子顶点的插入物重叠)的箭头,以及连接9767610扩增子顶点与 9767780和9767756扩增子顶点(其插入物与9767610扩增子顶点的插入物重叠)的箭头。
[0317] 图29A举例说明根据示例性实施方案进行的另外的扩增子插入物顶点至随后的 适当的重叠的连接。还显示了当候选扩增子不完全覆盖靶时可产生的断开或缺口。
[0318] 图29B举例说明图25A的15个候选扩增子以及根据示例性实施方案的图29A中 显不的缺口的基础。
[0319] 图30A举例说明可用于根据示例性实施方案从源至汇点拼接本实例中的靶的3个 可能的另外的边。在实施方案中,在可能的路径中,可选择具有最低成本的路径。
[0320] 图30B举例说明根据示例性实施方案将成本赋予图的连接扩增子顶点的边的每 一个的边成本函数的示例性定义。
[0321] 图30C举例说明根据示例性实施方案的图30B的实例中的从源至汇点的最低成本 通路。
[0322] 图31举例说明图25A的15个候选扩增子,除对应于形成图30C中显示的最低成 本通路的顶点的5个扩增子被突出显示外。
[0323] 根据示例性实施方案,可使用0(|V| + |E|)算法确定最低成本通路。最低成本 通路可如下确定:(1)对于每一个顶点V,(i)从源顶点至V初始化D[v]至无穷大(过 程的到目前为止的最低成本)以及将D[源]初始化为0,和(ii)将Pred[ V]初始化为 空(从源顶点至v的最低成本路径中的v的前任);和(2)对于拓扑排序中的每一个顶 点u,对于ad j [u]中的每一个顶点V,如果D [u] +成本(u, v) <D [v],则使D [v] = D [u] + 成本(U,v)以及Pred[V] =11。关于用于在图上构建路径的算法的更多信息可见于 Di jkstra, uk Note on Two Problems in Connexion with Graphs, ,?Numerische Mathematik, 第 1 卷,269-271 (1959)和 Sniedovich, "Di jkstra's algorithm revisited: the dynamic programming connexion, ''Control and Cybernetics,第 35 卷,599_62〇(2〇〇6)(将所述两 篇文献通过引用整体并入本文)中。
[0324] 根据示例性实施方案,路径的成本(例如,扩增子+ "联合"冗余性)可以是形成 路径的边的和。在实施方案中,路径的成本可使用下面的公式1来确定:
[0325]

【权利要求】
1. 用于确定拷贝数变异的方法,包括扩增样品中的多个不同的靶序列,包括: a) 在单一扩增反应混合物中产生多个不同的扩增的靶序列,其是通过:将多个不同的 靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物 中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待 扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择; b) 从至少一个扩增的靶序列切割可切割基团; c) 通过将至少一个接头连接至至少一个扩增的祀序列产生一个或多个接头连接的扩 增的靶序列; d) 使用引物再扩增所述至少一个接头连接的扩增的靶序列; e) 对至少一个扩增的接头连接的靶序列进行测序; f) 计算所述至少一个扩增的接头连接的靶序列的测序读取的数目;和 g) 确定所述至少一个扩增的接头连接的靶序列的拷贝数变异。
2. 权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括 染色体或基因重复。
3. 权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括 染色体或基因缺失。
4. 权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括 杂合性的丢失。
5. 权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括 与癌症相关的拷贝数变异。
6. 权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括 与遗传疾病相关的拷贝数变异。
7. 权利要求1的方法,其中确定至少一个扩增的接头连接的靶序列的拷贝数变异包括 与非整倍性相关的拷贝数变异。
8. 权利要求7的方法,其中所述非整倍性是性染色体非整倍性。
9. 权利要求8的方法,其中所述非整倍性选自X0, XXX,XXXX,XXXXX,XXY,XXYY,XXXY,XX YYY,XXXYY,XXXXY,XYY,XYYY 或 XYYYY。
10. 用于确定拷贝数变异的方法,包括扩增两个或更多个样品中的多个不同的靶序列, 包括: a) 在单一扩增反应混合物中产生多个不同的扩增的靶序列,其是通过:将多个不同的 靶序列与多个靶标特异性引物和聚合酶在扩增条件下接触,其中所述多个靶标特异性引物 中的至少一个和扩增的靶序列的至少一个包括可切割基团,并且其中所述扩增包括对于待 扩增的靶序列中的至少一个的不超过一轮的靶标特异性选择; b) 从至少一个扩增的靶序列切割可切割基团; C)通过将至少一个不同的条码接头连接至来自每个样品的至少一个扩增的靶序列产 生一个或多个条码接头连接的扩增的靶序列; d) 使用引物再扩增来自每个样品的至少一个条码接头连接的扩增的靶序列; e) 对来自每个样品的至少一个扩增的接头连接的靶序列进行测序; f) 计算来自每个样品的至少一个扩增的接头连接的靶序列的测序读取的数目;和 g)确定每个样品的至少一个扩增的接头连接的靶序列的拷贝数变异。
11. 权利要求10的方法,其中计算包括确定扩增的接头连接的靶序列的映射的测序读 取的总数目除以映射的测序读取的总数目。
12. 权利要求10的方法,其中计算包括确定扩增的接头连接的靶序列的百分率比率。
13. 权利要求10的方法,其中计算包括确定扩增的接头连接的靶序列的百分率频率。
14. 权利要求10的方法,其中计算包括确定扩增的接头连接的靶序列的log2比率。
15. 权利要求10的方法,其中确定拷贝数变异包括与病症或疾病相关的至少一个扩增 的接头连接的靶序列的过度代表。
16. 权利要求10的方法,其中确定拷贝数变异包括与病症或疾病相关的至少一个扩增 的接头连接的靶序列的不足代表。
【文档编号】C12Q1/68GK104053786SQ201280066951
【公开日】2014年9月17日 申请日期:2012年10月29日 优先权日:2011年11月29日
【发明者】J·利蒙, M·安德森, M·桑顿 申请人:生命技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1