用于测定核苷酸序列的方法

文档序号:8287406阅读:891来源:国知局
用于测定核苷酸序列的方法
【专利说明】
[0001] 相关申请的交叉引用
[0002] 根据35U. S.C. § 119(e),本申请要求2012年5月10日提交的U. S.临时申请号 61/645, 364和2012年8月3日提交的U.S.临时申请号61/679, 302的优先权,以引用的方 式将其内容全部并入本文。
[0003] 序列表
[0004] 本申请包含序列表,所述序列表已通过EFS-Web以ASCII形式提交,并以引用的方 式将其全部并入本文。所述ASCII副本于2013年3月8日创建,命名为030258-074962-PCT_ SL. txt,大小为41,722字节。
[0005] 政府支持
[0006] 本发明是在由美国国立卫生研宄院(National Institutes of Health)授予的基 金号5R21CA161590的联邦资助下完成的。美国政府对本发明享有一定权利。
技术领域
[0007] 本文所述的技术涉及测定寡核苷酸序列的方法。
【背景技术】
[0008] 相比全基因组、全外显子组以及全转录组测序,下一代测序(next-generation sequencing)前的革El富集更具成本效益,因此更适于在研宄发现和临床应用中广泛实施。例 如,由革E富集方法提供的高覆盖深度(high coverage depth)能够实现较宽动态范围的等 位基因计数(在基因表达和拷贝数评估中)以及对低频突变的检测(用于评价癌症中的 体细胞突变的关键特征)。目前用于下一代测序的富集方案的实例包括:基于杂交的捕获 分析(TruSeq Capture,Illumina ;SureSelect Hybrid Capture,Agilent)和基于聚合酶 链式反应(PCR)的分析(HaloPlex,Agilent ;AmpliSeq,Ion Torrent ;TruSeq Amp I icon, Illumina ;乳液/数字PCR,Raindance)。基于杂交的方法不仅捕获到被捕获探针覆盖的靶 向序列,还捕获到了消耗测序能力的附近的脱祀碱基(near off-target bases)。此外,这 些方法都比较费时、劳动密集、并且特异性水平较低。基于PCR扩增的方法较简单且较快 速,但根据常规设计需要使用位于靶基因座两翼的正向引物和反向引物。特别地,对于检测 具有未知融合伴侣(fusion partner)的基因组重排(genomic rearrangements)来说,PCR 是不适用的。

【发明内容】

[0009] 本文所述的技术针对测定寡核苷酸序列的方法。在一些实施方式中,本文所述的 方法涉及在对序列进行测序前对靶序列进行富集。
[0010] 在一个方面,本文所述的技术涉及测定与已知祀核苷酸序列邻接(contiguous to)的核苷酸序列的方法,所述方法包括:(a)将包含已知靶核苷酸序列的靶核酸与通用 寡核苷酸尾部接头(adaptor)连接;(b)用第一接头引物和第一革巴特异性引物扩增所述革巴 核酸的一部分和所述通用寡核苷酸尾部接头的扩增链;(C)用第二接头引物和第二靶特异 性引物扩增由步骤(b)产生的扩增子的一部分;(d)使用第一测序引物和第二测序引物 对由步骤(C)产生的扩增部分进行测序;其中,所述通用寡核苷酸尾部接头包含第一可连 接双链末端和第二未配对末端;其中,所述通用寡核苷酸尾部接头包含封闭链(blocking strand)和扩增链(amplification strand);其中,所述封闭链包含5'双链部分;其中,所 述扩增链包含未配对5'部分、3'双链部分和3'T突出(overhang);其中,所述扩增链包含与 第一测序引物和第二测序引物相同的核酸序列;其中,所述封闭链和所述扩增链的双链部 分基本上(substantially)互补,并形成包含3'T突出的第一可连接双链末端;其中,所述 双链部分足够长,以在连接温度下维持双链形式;其中,所述第一靶特异性引物包含能在退 火温度下特异性退火至所述靶核酸的已知靶核苷酸序列的核酸序列;其中,所述第二靶特 异性引物包含3'部分和5'部分,所述3'部分含有能够特异性退火至由步骤(b)产生的扩 增子所包含的已知靶核苷酸序列的一部分的核酸序列,所述5'部分含有与第二测序引物相 同的核酸序列,并且所述第二靶特异性引物相对于所述第一靶特异性引物嵌套(nested); 其中,所述第一接头引物包含与所述第一测序引物的5'部分相同的核酸序列;以及其中, 所述第二接头引物包含与所述第一测序引物的一部分相同的核酸序列,并且相对于所述第 一接头引物嵌套。
[0011] 在一些实施方式中,通用寡核苷酸尾部接头的封闭链可进一步包含3'未配对部 分,所述3'未配对部分基本上不与扩增链的5'未配对部分互补;以及其中,封闭链的3'未 配对部分基本上不与任何引物互补,或基本上不同于任何引物。在一些实施方式中,第二接 头引物可通过至少3个核苷酸相对于第一接头引物嵌套。在一些实施方式中,含有与第一 测序引物和第二测序引物相同的核酸序列的扩增链的部分可至少部分包含于扩增链的5' 未配对部分中。
[0012] 在一些实施方式中,第一靶特异性引物可进一步包含5'标签序列部分,所述5'标 签序列部分包含基本上不与任何引物的任何其它部分互补或基本上不同于任何引物的任 何其它部分的高GC含量的核酸序列。在一些实施方式中,第一靶特异性引物可进一步包含 5'标签序列部分,所述5'标签序列部分包含在退火温度下不会特异性退火至任何引物或其 互补物的任何其它部分的高GC含量的核酸序列。在一些实施方式中,第二接头引物可与全 长第一测序引物相同。在一些实施方式中,特异性退火至已知靶的靶特异性引物的部分可 在PCR缓冲液中在约65°C的温度下特异性退火。
[0013] 在一些实施方式中,所述方法可进一步在步骤(a)之前包括如下步骤:对核酸 进行机械剪切;使所述核酸经历末端修复;使所述核酸经历磷酸化;以及使所述核酸经历 腺苷酸化。在一些实施方式中,样品可包括基因组DNA。在一些实施方式中,样品可包括 RNA,并且所述方法可进一步包括使所述样品经历逆转录酶方案(reverse transcriptase regimen)的第一步骤。在一些实施方式中,所述逆转录酶方案可包括使用随机六聚体 (random hexamers)〇
[0014] 在一些实施方式中,已知革巴序列可包含于基因重排(gene rearrangement)中。 在一些实施方式中,基因重排可存在于选自于由如下核酸所组成的组中的核酸中:基因组 DNA、RNA和cDNA。在一些实施方式中,基因重排可包含癌基因(oncogene)。在一些实施方 式中,基因重排可包含融合癌基因。
[0015] 在一些实施方式中,可通过下一代测序法对核酸产物进行测序。在一些实施方式 中,下一代测序法可包括选自于由以下方法所组成的组中的方法:I〇n Torrent、Illumina、 S0LiD、454、大规模平行签名测序(Massively Parallel Signature Sequencing)、固相可 逆染料终止物测序(reversible dye-terminator sequencing)以及DNA纳米球测序(DNA nanoball sequencing)。在一些实施方式中,第一测序引物和第二测序引物兼容所选的下 一代测序法。
[0016] 在一些实施方式中,所述方法可包括将样品或样品的单独部分与多组第一靶特异 性引物和第二靶特异性引物接触。在一些实施方式中,所述方法可包括将包含样品的单一 反应混合物与多组第一靶特异性引物和第二靶特异性引物接触。在一些实施方式中,多组 第一靶特异性引物和第二靶特异性引物可特异性退火至由不同基因所包含的已知靶核苷 酸序列。在一些实施方式中,至少两组第一靶特异性引物和第二靶特异性引物可特异性退 火至已知靶核苷酸序列的不同部分。在一些实施方式中,至少两组第一靶特异性引物和第 二靶特异性引物可特异性退火至含有已知靶核苷酸序列的单个基因的不同部分。在一些 实施方式中,至少两组第一靶特异性引物和第二靶特异性引物可特异性退火至含有已知靶 核苷酸序列的基因的不同外显子。在一些实施方式中,多个第一靶特异性引物可包含相同 的5'标签序列部分。在一些实施方式中,通用寡核苷酸尾部接头可进一步包含条形码部分 (barcode portion)。在一些实施方式中,可将多种样品各自与具有独特(unique)条形码 部分的通用寡核苷酸尾部接头接触,其中,在步骤(a)后将所述样品合并(pooled)。
[0017] 在一些实施方式中,各个扩增步骤可包括长度为5个循环-20个循环的PCR扩增 方案循环组。在一些实施方式中,可将靶特异性引物和接头引物设计成在约61-72?的退火 温度下会特异性退火至它们的互补序列。在一些实施方式中,可将靶特异性引物和接头引 物设计成在约65°C的退火温度下会特异性退火至它们的互补序列。
[0018] 在一些实施方式中,样品可包括获得自受试者的生物样品。在一些实施方式中,样 品可获得自需要治疗与遗传改变(genetic alteration)相关的疾病的受试者。在一些实施 方式中,疾病可为癌症。在一些实施方式中,样品可包括肿瘤细胞群。在一些实施方式中, 样品可包括肿瘤活组织切片(biopsy)。在一些实施方式中,癌症可为肺癌。
[0019] 在一些实施方式中,已知靶序列可包含于疾病相关基因中。在一些实施方式中,已 知靶序列可包含于样品中的基因重排产物中。在一些实施方式中,基因重排产物可为癌基 因。
[0020] 在一些实施方式中,已知靶序列可包含来自选自以下基因的组中的基因的序列: ALK、ROSl和RET。在一些实施方式中,至少一组第一靶特异性引物和第二靶特异性引物可 选自于由以下引物所组成的组:SEQ ID NO :5和SEQ ID NO :6;SEQ ID NO :7和SEQ ID NO: 8 ;SEQ ID NO :9 和 SEQ ID NO :10 ;SEQ ID NO :11 和 SEQ ID NO :12 ;SEQ ID NO :13 和 SEQ ID NO :14 ;SEQ ID NO :15 和 SEQ ID NO :16 ;SEQ ID NO :17 和 SEQ ID NO :18 ;SEQ ID NO : 19和 SEQ ID NO :20 ;SEQ ID NO :21 和 SEQ ID NO :22 ;SEQ ID NO :23和 SEQ ID NO :24 ;SEQ ID NO :25 和 SEQ ID NO :26 ;SEQ ID NO :27 和 SEQ ID NO :28 ;SEQ ID NO :29 和 SEQ ID NO : 30 ;SEQ ID NO :31 和 SEQ ID NO :32 ;SEQ ID NO :33和 SEQ ID NO :34 ;SEQ ID NO :35和 SEQ ID NO :36 ;以及 SEQ ID NO :37 和 SEQ ID NO :38。
[0021] 在一些实施方式中,在从受试者的肿瘤获得的样品中,ALK的基因重排的存在可说 明肿瘤易受以选自于由如下物质组成的组中的治疗剂进行的治疗的影响:ALK抑制剂、克 唑替尼(crizotinib) (PF-02341066)、AP26113、LDK378、3-39、AF802、IPI-504、ASP3026、 AP-26113、X-396、GSK-1838705A、CH5424802 以及 NVP-TAE684。
[0022] 在一些实施方式中,在从受试者的肿瘤获得的样品中,ROSl的基因重排的存在可 说明肿瘤易受以选自于由如下物质组成的组中的治疗剂进行的治疗的影响:ROS抑制剂、 ALK 抑制剂、克唑替尼(PF-02341066)、AP26113、LDK378、3-39、AF802、IPI-504、ASP3026、 AP-26113、X-396、GSK-1838705A、CH5424802 以及 NVP-TAE684。
[0023] 在一些实施方式中,在从受试者的肿瘤获得的样品中,RET的基因重排的存在可 说明肿瘤易受以选自于由如下物质组成的组中的治疗剂进行的治疗的影响:RET抑制剂、 DP-2490、DP-3636、SU5416、BAY 43-9006、BAY 73-4506 (瑞格非尼,regorafenib)、ZD6474、 NVP-AST487、索拉非尼(sorafenib)、RPI_1、XL184、凡德他尼(vandetanib)、舒尼替尼 (sunitinib)、伊马替尼(imatinib)、帕挫帕尼(pazopanib)、阿西替尼(axitinib)、莫特塞 尼(motesanib)、吉非替尼(gefitinib)以及醉前素 A(withaferin A)。
[0024] 在一个方面,本文所述的技术涉及治疗癌症的方法,所述方法包括:根据本文所述 的方法,对获得自需要治疗癌症的受试者的肿瘤样品中一种以上癌基因重排的存在进行检 测;给予对于具有任何检测到的癌基因重排的肿瘤有效的癌症治疗。在一些实施方式中, 选自于由以下物质组成的组中的治疗剂可对于具有ALK癌基因重排的肿瘤有效:ALK抑制 剂、克唑替尼(PF-02341066)、AP26113、LDK378、3-39、AF802、IPI-504、ASP3026、AP-26113、 X-396、GSK-1838705A、CH5424802以及NVP-TAE684。在一些实施方式中,选自于由以下物质 组成的组中的治疗剂可对于具有ROSl癌基因重排的肿瘤有效:ROSl抑制剂、ALK抑制剂、克 唑替尼(PF-02341066)、AP26113、LDK378、3-39、AF802、IPI-504、ASP3026、AP-26113、X-396、 GSK-1838705A、CH5424802以及NVP-TAE684。在一些实施方式中,选自于由以下物质组成 的组中的治疗剂可对于具有RET癌基因重排的肿瘤有效:RET抑制剂、DP-2490、DP-3636、 SU5416、BAY 43-9006、BAY 73-4506(瑞格非尼)、ZD6474、NVP-AST487、索拉非尼、RPI-1、 XL184、凡德他尼、舒尼替尼、伊马替尼、帕唑帕尼、阿西替尼、莫特塞尼、吉非替尼以及醉茄 素 A。
[0025] 在一个方面,本文所述的技术涉及测定需要治疗癌症的受试者是否会对给定治疗 作出响应的方法,所述方法包括:根据本文所述的方法,对获得自受试者的肿瘤样品中癌基 因重排的存在进行检测;其中,如果检测到存在癌基因重排,确定所述受试者对靶向癌基因 重排产物的治疗作出响应。
[0026] 在一些实施方式中,当检测到存在ALK癌基因重排时,受试者可对选自于由如下 物质所组成的组中的治疗剂作出响应:ALK抑制剂、克唑替尼(PF-02341066)、AP26113、 LDK378、3-39、AF802、IPI-504、ASP3026、AP-26113、X-396、GSK-1838705A、CH5424802 以 及NVP-TAE684。在一些实施方式中,当检测到存在ROSl癌基因重排时,受试者可对选自 于由如下物质所组成的组中的治疗剂作出响应:ALK抑制剂、克唑替尼(PF-02341066)、 AP26113、LDK378、3-39、AF802、IPI-504、ASP3026、AP-26113、X-396、GSK-1838705A、 CH5424802 以及 NVP-TAE684。
[0027] 在一些实施方式中,当检测到存在RET癌基因重排时,受试者会对选自于由如 下物质所组成的组中的治疗剂作出响应:RET抑制剂、DP-2490、DP-3636、SU5416、BAY 43-9006、BAY 73-4506(瑞格非尼)、ZD6474、NVP-AST487、索拉非尼、RPI-1、XL184、凡德他 尼、舒尼替尼、伊马替尼、帕唑帕尼、阿西替尼、莫特塞尼、吉非替尼以及醉茄素 A。
[0028] 在一些实施方式中,癌症可为肺癌。
【附图说明】
[0029] 图1描绘了用于靶向RNA和DNA测序的文库构建实例的图示说明。1)使用来自 FFPE样本的总核酸作为起始材料,应用双链cDNA合成的标准程序。或者,起始材料也可为 剪切的gDNA。2)纯化(cleanup)后,使双链cDNA或gDNA经历末端修复和dA加尾,然后直 接连接半截短(half-truncated)Y接头,其间不需要纯化。3)SPRI纯化后,使用多重基因特 异性引物(GSPl)和Ion Torrent短长度正向引物A 5'20-mer(A20),以65°C的退火温度使 连接的样品经历14个循环的PCR扩增。4)第二SPRI纯化后,使用标记有Ion Torrent反 向引物(P1_GSP2)的多重嵌套基因特异性引物(GSPl的3'下游并在同一方向)和正向引 物A (全长30-mer),以65°C的退火温度使样品经历另外的14个循环的PCR扩增。5)最后 的第三SPRI纯化后,产物为准备好进行下游乳液PCR和测序的Ion Torrent文库。可在步 骤2后进行样品合并。
[0030] 图2描绘了映射(mapping)结果,证明在ROSl序列的一个测序运行中的不同引 物(点)延伸产物,所述结果包括对应于基因组DNA (跨内含子-外显子边界)、cDNA (跨 外显子)和融合cDNA(在外显子34上,融合伴侣SLC34A2上的映射在此处未示出)的读段 (reads)。达到了 91. 8% 的特异性(127, 446/138, 787)。
[0031] 图3A以ROSl为例描绘了嵌套引物靶向策略的图解展示。关于R0SUALK和RET, 分析靶组(assay target panel)包括总共17对GSPl和GSP2。图3B描绘了使用gDNA和 cDNA模板的代表性延伸产物的可能类型。
[0032] 图4A描绘了使用Integrative Genomics Viewer的可视化读段映射。图4B描绘 了两个可变剪接融合序列的序列。图4C描绘了报告所涉及的基因(注释有外显子、读码框 和融合读段覆盖度详情)中的融合转录本的总结表。
[0033] 图5描绘了示例性测序运行的结果。
[0034] 图6和图7分别描绘了 ALK序列和RET序列的测序运行结果的实例。
[0035] 图8描绘了本文所述的靶向测序方法的图解展示。
[0036] 图9描绘了说明性的通用寡核苷酸尾部接头的示意图。
【具体实施方式】
[0037] 本文所述技术的实施方式涉及对寡核苷酸序列进行测定(即,测序)的方法。在 一些实施方式中,本文所述的方法涉及在测序步骤前富集靶序列的方法。在一些实施方式 中,在测序步骤之前,待富集的靶序列的一个末端的序列是未知的。
[0038] 为方便起见,下文提供了在说明书、实施例以及所附权利要求中使用的一些术语 和短语的含义。除非另有说明或在上下文中有所暗示,下列术语和短语包括下文提供的含 义。提供所述定义以辅助描述【具体实施方式】,而由于本发明的范围仅受权利要求所限,因此 并不意味着限制所请求保护的发明。除非另有定义,本文所使用的所有技术术语和科学术 语具有与本发明所属技术领域中的普通技术人员通常所理解的相同的含义。如果在本领域 中术语的使用和本文所提供的术语定义之间存在明显不一致,应以本说明书中所提供的定 义为准。
[0039] 为方便起见,在此收集了在说明书、实施例和所附权利要求中采用的某些术语。
[0040] 本文使用的术语"降低(decrease) "、"减少(reduced/reduction) "或"抑制 (inhibit)"通常都意味着统计学显著量的降低。然而,为避免疑义,"减少(reduced/ reduction) "、"降低(decrease)"或"抑制(inhibit)"表示相比参比水平降低至少10%, 例如降低至少约20%、或至少约30%、或至少约40%、或至少约50%、或至少约60%、或至 少约70%、或至少约80%、或至少约90%、或上至并包括降低100% (如,相比参比样品的 缺失水平或不可检测水平)、或相比参比水平降低在10%到100%之间的任意量。在标志 物(marker)或症状(symptom)的情况下,意味着这种水平的统计学显著降低。例如,所述 降低可为至少10 %、至少20 %、至少30 %、至少40 %或更多,并优选降至被认为是未患此种 病症的个体的正常范围内的水平。
[0041] 本文使用的术语"增加(increased/increase) "、"增强(enhance) "或"活化 (activate) "通常都意味着统计学显著量的增加;为避免疑义,术语"增加(increased/ increase)"、"增强(enhance)"或"活化(activate)"表示相比参比水平增加至少10%,例 如增加至少约20%、或至少约30%、或至少约40%、或至少约50%、或至少约60%、或至少 约70%、或至少约80%、或至少约90%、或上至并包括增加100%、或相比参比水平增加在 10%到100%之间的任意量;或相比参比水平至少约2倍、或至少约3倍、或至少约4倍、或 至少约5倍、或至少约10倍的增加、或在2倍和10倍之间的任意量的增加、或是更大量的 增加。
[0042] 本文所使用的术语"受试者"是指人或动物。通常,所述动物为脊椎动物,如灵长类 动物、嗤齿动物、家畜或狩猎动物(game animal)。灵长类动物包括黑猩猩、食蟹猴、蜘蛛猴 和猕猴(如恒河猴)。啮齿动物包括小鼠、大鼠、旱獭(woodchucks)、雪貂(ferrets)、兔和 仓鼠。家畜和狩猎动物包括牛(cows)、马、猪、鹿、野牛、水牛、猫科物种(如,家猫)、犬科物 种(如,狗、狐狸、狼)、鸟类物种(如,鸡、鸸鹋(emu)、鸵鸟)和鱼类(如,鳟鱼(trout)、鲶 鱼和鲑鱼)。在一些实施方式中,受试者为哺乳动物,例如,灵长类动物、如人类。术语"个 体"、"患者"和"受试者"在本文中可互换使用。
[0043] 优选地,受试者为哺乳动物。所述哺乳动物可为人、非人灵长类动物、小鼠、大鼠、 狗、猫、马或牛,但不限于这些实例。除人以外的哺乳动物可有利于用作代表例如肺癌动物 模型的受试者。受试者可以为雄性或雌性。
[0044] 受试者可为先前已被诊断患有或鉴定为遭受或患有需要治疗的病症(例如,癌 症)、或与此种病症相关的一种以上并发症的受试者,并且所述受试者任选已接受对所述病 症或与所述病症相关的一种以上并发症的治疗。或者,受试者还可为先前未曾被诊断为患 有所述病症(例如,癌症)或与所述病症相关的一种以上并发症的受试者。例如,受试者可 为表现出针对所述病症或与所述病症相关的一种以上并发症的一种以上风险因素的受试 者,或者可为并未表现出风险因素的受试者。
[0045] 对于特定病症的治疗"有需要的受试者"可为患有该病症、被诊断为患有该病症、 或处于发展为该病症的风险中的受试者。
[0046] 本文所使用的"与遗传改变相关的疾病"指的是至少部分由相对于健康野生型受 试者而言受试者的遗传物质的改变(例如,删除、插入、SNP、基因重排)引起的任何疾病。 如果改变增加受试者发展成疾病的风险、增加受试者对疾病(包括传染性疾
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1