包含基因组DNA和cDNA两者的总核酸的富集和新一代测序的制作方法_6

文档序号:9382599阅读:来源:国知局
分析方法来分析核酸,所述分析方法包括但不限于,例如,DNA测序 (使用 Sanger、焦磷酸测序或 Roche/454、Helicos、Illumina/Solexa 和 ABI (SOLID)测序系 统)、Life Technology(Ion Torrent)、聚合酶链式反应测定、珠阵列测定、引物延伸测定、 酶错配切割测定、支链杂交测定、NASBA测定、分子信标测定、循环探针测定、连接酶链式反 应测定、侵入性切割结构测定、ARMS测定或夹心杂交测定。可以对所述核酸分子进行测序 或分析是否存在SNP或者相对于参照序列的其他差异。
[0134] 在一些实施方案中,通过本文所述的方法产生的核酸可用于包含两个或更多个 SNP的染色体区域的NP单体型分析,用于富集用于配对末端测序法的DNA序列,用于产生长 读数序列的靶片段,分离倒置、缺失、易位断点,用于对整个基因区域(外显子和内含子)进 行测序以揭示导致异常剪接或调控的突变。
[0135] 多态性(例如单核苷酸多态性("SNP"))在整个基因组中基本上随机分布。多态 性可以是任何长度的序列的插入、缺失、重复或重排,包括单核苷酸的缺失、插入或碱基变 化。多态性可以是天然存在的,或者其可以与变体表型相关。使用本文所述的方法(例如 通过富集目的序列)可允许群体中的不同个体中或甚至在来自单一个体的不同样品中基 本上重现基本相似的复杂度降低的亚群。因为多态性基本上在整个基因组中随机分布,许 多的多态性序列将存在于复杂度降低的核酸序列群中。可对这种复杂度降低的亚群进行分 析以鉴定多态性或确定该亚群内多态性基因座的基因型。
[0136] 本文所述的方法还可用于例如,药物基因组学领域,药物基因组学试图将多态性 基因座的特异性等位基因的知识与群体中个体对特定药物的响应方式联系起来。大概的估 计是,对于每种药物,10%至40%的个体不做出最佳响应。为了建立对给定药物的响应谱, 必须将关于接受药物的那些个体的多态性基因座的基因型与所述药物的治疗效果联系起 来。使用大量的多态性基因座频繁地进行这种分析。一旦通过分析群中的多态性基因座已 评估了药物遗传响应谱,就必须确定与响应特定药物相关的那些基因座有关的临床患者的 基因型。因此,鉴定大量个体中大量的多态性基因座的序列的能力对于临床应用建立药物 响应谱和鉴定个体基因型两者都很重要。
[0137] 利用Illumina测序法对使用本文所述方法产生的核酸(例如包括接头的单链 核酸和由探针富集的核酸)进行测序分析。Illumina测序法包括桥扩增技术,其中在 SBS之前,与固相结合的引物被用于液相单链核酸的延伸和扩增(参见,例如,Mercier等 (2005) "Solid Phase DNA Amplification :A Brownian Dynamics Study of Crowding Effects. "Biophysical Journal 89 :32-42 ;Bing 等(1996) "Bridge Amplification: A Solid Phase PCR System for the Amplification and Detection of Allelic Differences in Single Copy Genes. ',Proceedings of the Seventh International Symposium on Human Identification,Promega Corporation Madison,WI)〇
[0138] Illumina测序技术需要制备侧翼具有配对末端接头序列的单链核酸。每个配对 末端接头含有独特的引物杂交序列。将核酸分布到包被有单链寡核苷酸的流动池(Flow cell)表面,单链寡核苷酸对应于存在于单链核酸侧翼接头上的引物杂交序列。单链的接 头连接的核酸与流动池表面结合并暴露于用于基于聚合酶之延伸的试剂。当连接的片段的 游离端/远端与表面上互补的寡核苷酸"桥连"时,发生引物配对,在退火步骤期间,来自一 个结合引物的延伸产物与其他结合引物串联形成第二个桥。重复的变性和延伸导致在数以 百万计的独特位置中单分子的局部扩增,跨流动池表面产生了克隆的"簇"。
[0139] 然后将流动池放到测序模块内的流体盒中,其中添加引物、DNA聚合酶和荧 光标记的可逆的终止核苷酸(例如A、C、G和T)以使得单核苷酸并入到每个簇的各 个克隆的DNA中。在每个并入步骤之后,在对整个流动池进行高分辨率成像以鉴定并 入到流动池之每个簇位置处的核苷酸。在成像步骤之后,进行化学步骤以解封并入 核苷酸的3'端以允许随后并入另一个核苷酸。进行迭代循环以产生一系列的图像, 每个表示在特定簇处的单一碱基延伸。这个系统通常产生高达20至50个核苷酸的 序列读数。关于这个测序系统的更多细节在,例如,Bennett等(2005) "Toward the 1,OOOdollars human genome. 'Tharmacogenomics 6 :373-382 ;Bennett,S. (2004)"Solexa Ltd. " Pharmacogenomics 5 :433-438 ;和 Bentley,D.R. (2006) "Whole genome re-sequencing. "Curr Opin Genet Dev 16 :545-52 中进行了讨论。
[0140] 制备用于Illumina系统的模板的第一阶段是DNA断裂,例如通过声能断裂 (Covaris)〇
[0141] 本文提供的方法可容易地适于与Illumina平台一起使用。具体地,本文所述的接 头序列非常适用于Illumina测序法的目的。
[0142] 在一些实施方案中,可通过在高通量仪器上的多重测序对多个测试样品(以及对 照样品)同时进行测序。例如,这可通过使用每个样品的单独的条形码序列使它们在数据 分析中有所差别来实现。
[0143] 在一些实施方案中,使用单分子实时测序来分析通过本文所述方法产生的核酸。 单分子实时测序(Single molecule real-time sequencing,SMRT)是另一种大规模平行测 序技术,其可用于以高通量方式对环化单链核酸进行测序。由Pacific Biosciences开发 和商品化的SMRT技术依赖于多通道零模波导(zero-mode waveguide,ZMff)阵列,在其中可 以同时进行数千个测序反应。ZMff是产生能观察到的足够小照明观察体积的结构,例如,单 链DNA分子通过单一 DNA聚合酶的模板依赖性合成(参见,例如,Levene等(2003) "Zero Mode Waveguides for single Molecule Analysis at High Concentrations',,Science 299 :682-686)。当DNA聚合酶将互补的荧光标记核苷酸并入到正合成的DNA链中时,该酶 将每个核苷酸维持在检测体积内数十毫秒,例如,比未并入的核苷酸扩散进出检测体积所 花费时间量更长的数量级。在这段时间中,荧光团发出颜色对应于核苷酸碱基的身份的荧 光。然后,作为核苷酸并入循环的一部分,聚合酶断裂先前将荧光团保持在适当位置的键并 且染料扩散出检测体积。在并入之后,信号立即返回到基线并重复该过程。ZMff的附加描 述以及它们在单分子分析中的应用(例如SMRT测序)可参见,例如,公开的美国专利申请 No. 2003/0044781和美国专利No. 6, 917, 726,出于所有目的,其各自通过引用整体并入本 文。还参见,Levene 等(2003) "Zero Mode Waveguides for single Molecule Analysis at High Concentrations", Science 299 :682-686 和 Eid 等(2009) "Real-Time DNA Sequencing from Single Polymerase Molecules',,Science 323 :133-138。
[0144] 通过本文所述的方法产生的核酸可适于与SMRT测序平台一起使用。例如,在合成 之后,可使用催化单链DNA片段分子内连接的酶(例如CircLigaseTm、CircLigaseTm II或 ThermoPhageTm)使单链核酸环化并分配给ZMW。或者,可在环化之前将子链断裂。任选地, 例如,如上所述,在环化前可从断裂的子链群富集目的序列。
[0145] 在一些实施方案中,所述方法还包括数据分析。例如,从头测序需要组装测序读 数。全基因组/转录组分析需要与参考数据库进行比较。RNA的表达水平的测定需要量化 读数的算法。单核苷酸变异的确定需要与参考序列进行比较。用于数据分析的工具和软件 是本领域已知的。
[0146] 试剂盒和制品
[0147] 本申请还提供了用于本文所述的任何一种方法的试剂盒和制品。用于进行所述方 法的任意组分或制品都可以用于包装到试剂盒中。
[0148] 例如,所述试剂盒可包含可用于制备核酸混合物的组分,包括逆转录酶、引物、接 头、用于文库构建的试剂等。在一些实施方案中,所述试剂盒包含或还包含可用于富集目的 核酸的组分,其包括但不限于,探针组、杂交试剂、固体支持物、用于扩增的试剂等。在一些 实施方案中,所述试剂盒包含或还包含可用于分析混合物中之核酸(富集或未富集)的组 分,包括例如用于测序分析的试剂。在一些实施方案中,所述试剂盒还包含用于实施本文所 述的任一种或更多种方法的说明书。在一些实施方案中,所述试剂盒还包含用于数据分析 和报告的软件。
【主权项】
1. 从测试样品中获得富集的目的核酸群的方法,其包括: (a) 提供包含获自所述测试样品的基因组DNA序列和cDNA序列的核酸混合物; (b) 使所述核酸混合物与一组探针在足以使所述核酸与所述探针杂交的条件下,接触, 其中所述探针与存在于所述核酸混合物中的目的核酸互补;以及 (c) 将与所述探针杂交的核酸与未杂交的核酸分离; 从而获得富集的目的核酸群。2. 根据权利要求1所述的方法,其中通过使由所述测试样品产生的基因组DNA文库与 cDNA文库混合来获得所述核酸混合物。3. 根据权利要求1所述的方法,其中通过⑴将所述测试样品中的RNA逆转录为cDNA 以及(ii)产生包含基因组DNA序列和cDNA序列的DNA文库以提供核酸混合物来获得所述 核酸混合物。4. 根据权利要求1至3中任一项所述的方法,其中至少一种所述探针与存在于基因组 DNA序列中的目的核酸以及存在于cDNA序列中的目的核酸互补。5. 根据权利要求1至4中任一项所述的方法,其中所述基因组DNA序列与cDNA序列以 预定比率存在于所述混合物中。6. 根据权利要求1至5中任一项所述的方法,其中所述测试样品是人样品。7. 根据权利要求1至6中任一项所述的方法,其中所述目的核酸包含多个外显子序列、 多个内含子序列、多个内含子-外显子接合点或多个非编码区中的序列。8. 根据权利要求1至7中任一项所述的方法,其中所述探针组包含至少约100个不同 的探针。9. 根据权利要求1至8中任一项所述的方法,其中与所述核酸混合物内的互补区相比, 所述探针至少约IOX摩尔过量。10. 根据权利要求1至9中任一项所述的方法,其中所述探针包含与原癌基因、肿瘤抑 制基因、酪氨酸激酶基因、磷酸酶基因或血管基因互补的序列。11. 根据权利要求1至10中任一项所述的方法,其中在使所述探针与所述核酸混合物 接触之前或之后,将所述探针与固体支持物连接。12. 根据权利要求11所述的方法,其还包括从所述固体支持物洗脱所述探针以及与所 述探针杂交的目的核酸。13. 根据权利要求1至12中任一项所述的方法,其还包括扩增所述目的核酸。14. 根据权利要求1至13中任一项所述的方法,其还包括分析所富集的核酸。15. 根据权利要求14所述的方法,其中所述分析包括对所富集的目的核酸进行测序。16. 表征测试样品中的核酸的方法,其包括:(a)提供包含获自所述测试样品的基因组 DNA序列与cDNA序列的核酸混合物;以及(b)对所述混合物中的所述基因组DNA序列和 cDNA序列同时进行测序。17. 根据权利要求16所述的方法,其中通过使由所述测试样品产生的基因组DNA文库 与cDNA文库混合来获得所述核酸混合物。18. 根据权利要求16所述的方法,其中通过(i)将所述测试样品中的RNA逆转录为 cDNA以及(ii)产生包含基因组DNA序列和cDNA序列的DNA文库以提供核酸混合物来获得 所述核酸混合物。19. 根据权利要求16至18中任一项所述的方法,其中所述表征包括确定所述测试样品 中基因组DNA序列中的变异。20. 根据权利要求19所述的方法,其中所述基因组DNA序列中的变异包括染色体重排、 单核苷酸变异(SNV)或拷贝数变异(CNV)。21. 根据权利要求20所述的方法,其中所述染色体重排包括DNA序列的缺失、插入和易 位。22. 根据权利要求16至21中任一项所述的方法,其中所述表征包括确定所述测试样品 中RNA转录物中的变异。23. 根据权利要求22所述的方法,其中所述RNA转录物中的变异包括缺失、插入、易位、 SNV或差别基因表达。24. 根据权利要求16至23中任一项所述的方法,其中所述方法包括在所述测序步骤之 前从所述核酸混合物富集目的核酸。25. 根据权利要求24所述的方法,其中所述富集包括: (a) 使所述核酸混合物与一组探针在足以使所述核酸与所述探针杂交的条件下接触, 其中所述探针与存在于所述核酸混合物中的目的核酸互补;以及 (b) 将与所述探针杂交的核酸与未杂交的核酸分离; 从而获得富集的目的核酸群。26. 根据权利要求24或25所述的方法,其中所述方法还包括在所述测序步骤之前,向 所富集的目的核酸群添加初始的核酸混合物。27. 根据权利要求24或25所述的方法,其中所述方法还包括在所述测序步骤之前,向 所富集的核酸群添加基因组DNA序列。28. 根据权利要求24或25所述的方法,其中所述方法还包括在所述测序步骤之前,向 所富集的核酸群添加cDNA序列。29. 根据权利要求1至28中任一项所述的方法,其中所述核酸混合物还包含来自对照 样品的基因组DNA序列。30. 根据权利要求1至29中任一项所述的方法,其中所述核酸混合物还包含来自对照 样品的cDNA序列。31. 根据权利要求29或30所述的方法,其中所述对照样品和所述测试样品来自同一个 体。32. 根据权利要求29或30所述的方法,其中所述对照样品和所述测试样品来自不同的 个体。
【专利摘要】本发明涉及对包含获自测试样品的基因组DNA序列和cDNA序列的核酸混合物进行富集和测序的方法。
【IPC分类】C12Q1/68
【公开号】CN105102633
【申请号】CN201480014306
【发明人】张以琳
【申请人】以琳生物药物有限公司
【公开日】2015年11月25日
【申请日】2014年3月10日
【公告号】CA2904899A1, WO2014164486A1
当前第6页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1