包含基因组DNA和cDNA两者的总核酸的富集和新一代测序的制作方法

文档序号:9382599阅读:393来源:国知局
包含基因组DNA和cDNA两者的总核酸的富集和新一代测序的制作方法
【专利说明】
[0001] 相关申请的夺叉引用
[0002] 本申请要求保护于2013年3月11日提交的题目为ENRICHMENT AND NEXT GENERATION SE QUENCING OF TOTAL NUCLEIC ACID 的美国临时申请 No. 61/776, 666 的权 益,出于所有目的,其通过引用整体并入本文。
技术领域
[0003] 本发明涉及通过分析核酸混合物来进行新一代测序和疾病诊断,例如癌症诊断。
【背景技术】
[0004] 核酸序列分析工具是鉴定基因改变的基础,所述基因改变可进而用于诊断遗传疾 病、预测对药物治疗的响应性以及分析药物的药物基因组学。一个实例是癌症诊断。导致 癌症的遗传变异包括单核苷酸变异(SNV)、插入和缺失(Indel)、拷贝数变异(CNV)以及易 位等。因为分析经常涉及在有限量的样品中测定稀有遗传改变,所以灵敏度是很大的挑战。 当分析组织样品(例如,癌样品)中的体细胞突变时,所述组织样品通常包含与携有突变之 细胞混合的正常细胞,尤其如此。
[0005] 新一代测序(NGS)是用于分子特征谱和表征与疾病(诸如癌症)相关的不同类型 遗传变异的有力工具。人基因组DNA复杂并且具有许多重复序列。这提出了对序列分析的 另外挑战。首先,目的核酸可能在核酸混合物中显著为非代表性。其次,分析复杂DNA样品 的成本可能极为昂贵,特别是在分析基因组DNA并检测多个遗传突变的情况下。虽然已经 开发出了许多新一代测序方法,但是仍然需要灵敏、准确和有效的方法用于核酸制备和测 序分析。
[0006] 本文所引用的所有参考文献的内容均通过引用以其整体并入本文。
[0007] 发明概沐
[0008] 在一个方面,本申请提供了从测试样品(例如,人测试样品)获得富集的目的核酸 群的方法,其包括:(a)提供包含获自测试样品之基因组DNA序列和cDNA序列的核酸混合 物;(b)使核酸混合物与一组探针在足以使所述核酸与所述探针杂交的条件下接触,其中 所述探针与存在于所述核酸混合物中的目的核酸互补;以及(c)将与所述探针杂交的核酸 与未杂交的那些核酸分离;从而获得富集的目的核酸群。在一些实施方案中,通过将由所述 测试样品产生的基因组DNA文库与cDNA文库混合来获得所述核酸混合物。在一些实施方 案中,通过(i)将所述测试样品中的RNA逆转录为cDNA以及(ii)产生包含基因组DNA序 列和cDNA序列的DNA文库以提供核酸混合物来获得所述核酸混合物。
[0009] 在根据(或适用于)上述实施方案中任一个的一些实施方案中,至少一种所述探 针与存在于基因组DNA序列中的目的核酸以及存在于cDNA序列中的目的核酸互补。
[0010] 在根据(或适用于)上述实施方案中任一个的一些实施方案中,基因组DNA序列 与cDNA序列以预定比率存在于混合物中。
[0011] 在根据(或适用于)上述实施方案中任一个的一些实施方案中,目的核酸包含多 个外显子序列、多个内含子序列、多个内含子-外显子接合点或多个非编码区序列。
[0012] 在根据(或适用于)上述实施方案中任一个的一些实施方案中,探针组包含至少 约100个不同的探针。
[0013] 在根据(或适用于)上述实施方案中任一个的一些实施方案中,与核酸混合物内 的互补区相比,探针至少约IOX摩尔过量。
[0014] 在根据(或适用于)上述实施方案中任一个的一些实施方案中,探针包含与原癌 基因、肿瘤抑制基因、酪氨酸激酶基因、磷酸酶基因或血管基因互补的序列。
[0015] 在根据(或适用于)上述实施方案中任一个的一些实施方案中,在使探针与核酸 混合物接触之前或之后,将探针与固体支持物连接。在一些实施方案中,所述方法还包括从 固体支持物洗脱探针以及与探针杂交的目的核酸。
[0016] 在根据(或适用于)上述实施方案中任一个的一些实施方案中,其还包括扩增所 述目的核酸。
[0017] 在根据(或适用于)上述实施方案中任一个的一些实施方案中,其还包括分析所 富集的核酸,例如,对所富集的目的核酸进行测序。
[0018] 在另一方面,提供了表征测试样品中的核酸的方法,其包括:(a)提供包含获自测 试样品的基因组DNA序列和cDNA序列的核酸混合物;以及(b)对混合物中的基因组DNA序 列和cDNA序列同时进行测序。在一些实施方案中,通过将由测试样品产生的基因组DNA文 库与cDNA文库混合来获得所述核酸混合物。在一些实施方案中,通过(i)将测试样品中的 RNA逆转录为cDNA以及(ii)产生包含基因组DNA序列和cDNA序列的DNA文库以提供核酸 混合物来获得所述核酸混合物。
[0019] 在根据上述实施方案中任一个的一些实施方案中,表征包括确定测试样品中基因 组DNA序列中的变异,所述变异包括但不限于染色体重排、单核苷酸变异(SNV)或拷贝数变 异(CNV)。在一些实施方案中,染色体重排包括DNA序列的缺失、插入和易位。
[0020] 在根据上述实施方案中任一个的一些实施方案中,表征包括确定测试样品中RNA 转录物中的变异,所述变异包括但不限于缺失、插入、易位、SNV或差别基因表达。
[0021] 在根据上述实施方案中任一个的一些实施方案中,其中所述方法包括在测序步骤 之前从核酸混合物富集目的核酸。在一些实施方案中,富集包括(a)使所述核酸混合物与 一组探针在足以使所述核酸与所述探针杂交的条件下接触,其中所述探针与存在于所述核 酸混合物中的目的核酸互补;以及(b)将与所述探针杂交的核酸与未杂交的那些核酸分 离;从而获得富集的目的核酸群。
[0022] 在根据上述实施方案中任一个的一些实施方案中,所述方法还包括在测序步骤之 前,向所富集的核酸群添加初始的核酸混合物。在一个可替选的实施方案中,所述方法还包 括在测序步骤之前,向所富集的核酸群添加基因组DNA序列。在另一个可替选的实施方案 中,所述方法还包括在测序步骤之前,向所富集的核酸群添加cDNA序列。
[0023] 在根据上述实施方案中任一个的一些实施方案中,所述核酸混合物还包含来自对 照样品的基因组DNA序列,所述对照样品例如为,来自相同个体或不同个体的对照样品。
[0024] 在根据上述实施方案中任一个的一些实施方案中,所述核酸混合物还包含来自对 照样品的cDNA序列,所述对照样品例如为,来自相同个体或不同个体的对照样品。
[0025] 还提供了适用于本文所述的任一方法的试剂盒和制品。
[0026] 由以下的详细描述并经过本发明的实践,本发明的另一些实施方案、特征和优点 将变得明显。
[0027] 为简明起见,在本说明书中引用的出版物的公开内容(包括专利)通过引用并入 本文。
[0028]发明详沐
[0029] 本发明提供了核酸制备和富集方法,所述方法允许对来源于相同测试样品(例 如,来自单个个体的测试样品)的基因组DNA和RNA(cDNA)同时进行分析和测序。同时分 析使得最大化利用稀有宝贵样品并简化了在临床环境中的核酸操作和分析。基因组DNA和 RNA(cDNA)的组合分析提供了测试样品中基因组和转录组有关的互补信息。这使得可获得 测试样品的完整核酸特征谱,其反映了基因组变异和转录水平上的变异两者。此外,通过分 析基因组DNA所获得的信息和通过分析RNA(cDNA)所获得的信息可彼此重叠,从而使得互 相验证并增加核酸分析的可信度。
[0030] 因此,在一个方面,本发明提供了从包含获自相同测试样品的基因组DNA序列和 cDNA序列的核酸混合物来获得富集的目的核酸群的方法。
[0031] 在另一方面,提供了表征(例如,测序)包含获自相同测试样品的基因组DNA序列 和cDNA序列的核酸混合物中的核酸的方法。
[0032] 还提供了用于本文所述的方法的试剂盒、组合物和制品。
[0033] 定义
[0034] 术语"富集"是指增加样品中的特定核酸序列相对于在富集之前作为整体最初存 在于所述样品中的核酸序列水平之相对丰度的过程。因此,富集步骤提供了相对百分比或 分数的增加,而不是直接增加例如目的核酸序列的绝对拷贝数。在富集步骤之后,可将样品 称为富集的核酸群。
[0035] 如本文所使用的,核酸样品的"复杂度"是指存在于该样品中的不同独特序列的数 量。如果样品比其所来源的核酸样品更不复杂,则认为所述样品具有"降低的复杂度"。
[0036] 如本文所使用的,"固体支持物"是指具有与标签结合的性质的固体或半固体材 料,所述性质为固有的或经过与一些赋予该性质的组分(例如,抗体、链霉亲和素、核酸或 其他结合配体)连接而获得。这样的结合可以为直接或间接的。固体支持物的实例包括但 不限于硝化纤维素和尼龙膜、基于琼脂糖或纤维素的珠(例如,Sepharose)以及顺磁珠。
[0037] 如本文所使用的,术语"文库"是指核酸序列的集合。
[0038] 如本文所使用的,术语"特异性杂交"意指核酸与具有互补序列的核酸杂交。如本 文所使用的,核酸分子的一部分可与另一个核酸分子上的互补序列特异性杂交。即,对于一 部分该序列与另一个分子"特异性杂交"而言,并不需要核酸序列的整个长度杂交。
[0039] 可在本文中互换使用的核酸或寡核苷酸的"部分"或"区域"是2个或更多个碱基 的连续序列。在另一些实施方案中,区域或部分为至少约3个、5个、10个、15个、20个、25 个连续核苷酸的任意一个。
[0040] 如本文中所使用的,序列"突变"或"变异"是指与参考序列相比,在目的序列中的 任何序列改变。参考序列可以是野生型序列或希望与目的序列对比的序列。突变包括序列 中的单个核苷酸改变或多于一个核苷酸的改变,其出于诸如替换、缺失或插入的机制。
[0041]当例如第一核酸或引物的至少两个连续碱基可以以反向平行关系与第二核酸的 至少一个子序列组合或者与第二核酸的至少一个子序列杂交以形成双链体时,核酸或引物 与另一核酸"互补"。在一些实施方案中,在例如引物与靶核酸序列之间的互补性并非100% 完美的。
[0042] 本文所使用的术语"目的核酸"是指研究者的目的核酸。
[0043] 如本文所使用的"扩增"通常是指产生期望序列的两个或更多个拷贝的过程。如 本文所使用的,"核酸"是指任何长度的核苷酸聚合物,并且包括DNA和RNA。核苷酸可以为 脱氧核糖核苷酸、核糖核苷酸、经修饰的核苷酸或碱基和/或其类似物,或者可通过DNA或 RNA聚合酶并入聚合物的任何物质。核酸可包括经修饰的核苷酸,例如,甲基化核苷酸及其 类似物。
[0044] 如本文所使用的,"寡核苷酸"通常是指(通常但并非必须为)长度不超过约200 个核苷酸的短的、通常为单链的、通常为合成的核酸。术语"寡核苷酸"和"核酸"并不互相 排斥。上述对于核酸的描述等于并完全适用于寡核苷酸。
[0045] 本文所使用的"断裂"核酸是指将核酸破碎成不同的核酸片段。可例如通过剪切 或通过酶促反应来实现断裂。
[0046] "引物"通常为短的单链核酸,通常具有游离3' -OH基团,其通过与靶序列杂交来 与目的靶标结合,并且随后促进与靶标互补之核酸的聚合。
[0047] "杂交"和"退火"是指其中一个或更多个核酸反应以形成复合物的反应,所述复 合物通过核苷酸残基的碱基之间的氢键稳定化。氢键键合可通过Watson-Crick碱基配对、 Hoogstein结合或以任何其他的序列特异性方式来发生。
[0048] 本文所使用的"接头(adaptor) "是指可与核酸片段结合的寡核苷酸。
[0049] 如本文所使用的,关于两个核酸(例如接头和核酸片段)的术语"连接"是指共价 连接两个单独的核酸以产生具有连续骨架的单个更大核酸。
[0050] 术语"3' "通常是指在核酸或寡核苷酸中的一个区域或位置,其为在同一核酸或寡 核苷酸中的另一区域或位置的下游。
[0051] 术语"5' "通常是指在核酸或寡核苷酸中的一个区域或位置,其为在同一核酸或寡 核苷酸中的另一区域或位置的上游。
[0052] 本文所使用的"阵列"包括具有核酸或其他分子的空间或光学上可定位的区域的 排列。当阵列是核酸阵列时,所述核酸可在沿着核酸链的任意一个点或多个点处被物理上 吸附至阵列、化学上吸附至阵列或与阵列共价连接。
[0053] 如本文所使用的,术语"单核苷酸变异"或简称"SNV"是指基因组序列中相对于野 生型等位基因的单核苷酸位置处的改变。
[0054] 术语"拷贝数变异"或简称"CNV"是指基因组序列中相对于野生型基因组DNA的 基因拷贝数的改变。
[0055] 如本文所使用的,术语"变性"是指核酸双链体分离为两个单链。
[0056] 应理解,本文所述的本发明的方面和实施方案包括"由各方面和实施方案组成"和 /或"基本上由各方面和实施方案组成"。
[0057] 如本文所使用的,除非另外指明,否则未用数量词修饰的名词包括复数形式。
[0058] 如本领域技术人员所理解的,本文提及"约"的值或参数包括(描述)涉及该值或 参数本身的实施方案。例如,提及"约X"的描述包括对"X"的描述。
[0059] 本发明的方法
[0060] 在一些实施方案中,本申请提供了从测试样品获得富集的目的核酸群的方法,其 包括:(a)使所述核酸混合物与一组探针在足以使所述核酸与所述探针杂交的条件下接 触,其中所述探针与存在于所述核酸混合物中的目的核酸互补,并且其中核酸混合物包含 获自测试样品的基因组DNA序列和cDNA序列;以及(b)将与所述探针杂交的核酸与未杂交 的那些分离;从而获得富集的目的核酸群。
[0061] 在一些实施方案中,提供了从测试样品获得富集的目的核酸群的方法,其包括: (a)提供包含获自测试样品的基因组DNA序列和cDNA序列的核酸混合物;(b)使所述核酸 混合物与一组探针在足以使所述核酸与所述探针杂交的条件下接触,其中所述探针与存在 于所述核酸混合物中的目的核酸互补;以及(c)将与所述探针杂交的核酸与未杂交的那些 分离;从而获得富集的目的核酸群。
[0062] 在一些实施方案中,提供了从测试样品获得富集的目的核酸群的方法,其包括: (a)将由测试样品产生的基因组DNA文库与由测试样品产生的cDNA文库混合以提供核酸 混合物;(b)在使所述核酸混合物与一组探针足以使所述核酸与所述探针杂交的条件下接 触,其中所述探针与存在于所述核酸混合物中的目的核酸互补;以及(c)将与所述探针杂 交的核酸与未杂交的那些分离;从而获得富集的目的核酸群。在一些实施方案中,提供了 从测试样品获得富集的目的核酸群的方法,其包括:(a)以预定比率(例如,以约10 : 1、 5 : 1、2 : 1、1 : 1、1 : 2、1 : 5、1 : 10的比率)将由测试样品产生的基因组DNA文
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1