利用解链温度和通用碱基的突变分析的制作方法

文档序号:10556831阅读:664来源:国知局
利用解链温度和通用碱基的突变分析的制作方法
【专利摘要】本发明描述了用于确定基因组基因座中存在或不存在突变体等位基因的方法和寡核苷酸探针。所述探针以不同的解链温度(Tm)结合靶序列的不同等位基因。所述方法确定所述探针与靶序列杂交时的Tm,从而确定在所述靶序列中存在或不存在变体核酸,如突变体等位基因。在靶序列中可能存在不感兴趣的变体,例如,表型沉默的突变。为了确保这些变体不影响探针的Tm,所述探针包含发生此类不感兴趣的变体的通用碱基位点。
【专利说明】利用解链温度和通用碱基的突变分析 发明领域
[0001] 本发明涉及用于基因组分析的方法和组合物,并且特别是用于确定基因组基因座 中存在或不存在突变体等位基因的方法和组合物。
[0002] 发明背景
[0003] 核酸探针经常用于鉴定基因组或扩增的DNA中特异性靶序列的存在。探针与靶标 的退火或解链温度受所述探针与所述靶标共有的互补区长度和另外在互补碱基对之间存 在任何错配的影响。这可以用来检测变体(例如,SNPs或多个重复)的存在。可以设计探针具 有针对野生型序列的第一解链温度(Tm),并且所述探针与所述靶标的退火,例如,通过在退 火时的荧光显现进行监测。如果Tm不同于预期的值,那么该靶序列包含变体。
[0004] 国际专利申请W02012/093262记述了使用寡核苷酸探针检测和分析单核苷酸多态 性(SNPs)的方法,所述寡核苷酸探针与变体等位基因以比其与野生型等位基因杂交的Tm低 的Tm杂交。所述方法使用聚合酶链式反应(PCR)在介于第一和第二Tm之间的温度扩增包括 靶序列的基因组片段。如果所述靶序列是野生型的,那么所述探针保持与所述靶标结合,并 且防止扩增;如果所述靶序列是变体,那么所述探针不与所述靶标结合,并且扩增发生。以 这种方式,可以确定变体的存在,并且在样品中选择性富集所述变体等位基因。
[0005] 国际专利申请W02013/041853描述了用于确定包括SNPs和短的串联重复(STRs)的 多态性的探针。所述探针包括由接头核酸序列连接的第一和第二区域,以使所述第一和第 二区域具有独立的Tm。取决于变体或野生型等位基因存在于第一靶标区域还是第二靶标区 域,可以设计所述探针序列,以具有不同的Tm。使用该接头探针允许使用单一的寡核苷酸探 针来检测比利用常规探针可能检测的序列更长的序列中的变体。
[0006] 然而,并不是所有的变体都有临床重要性。特别地,尽管一些突变可能与表型变化 (例如,对特定药物的敏感性)相关,但是其他的可能是表型中性的,或者甚至是沉默的。尤 其是,沉默突变是这样的突变:其中在核苷酸序列中的突变在编码的多肽序列中不产生相 对应的突变。这典型地是在特定密码子的第三个碱基中存在突变的情形。
[0007] 下表摘自 http: //en .wikipedia .org/w/index. php?ti tie = Genetic_code&oldid = 567109686,显示了遗传密码,并且举例说明了密码的简并性,并且显示了哪些突变可能 是表型沉默的。例如,由UUU到UUC的突变仍然编码苯丙氨酸,因此,对表达的蛋白没有影响。
[0008] 标准的遗传密码
[0009]
[0010] 其他的突变可能对所表达的蛋白序列有一些影响,但是仍然没有临床影响,例如, 用功能相似的氨基酸取代一种氨基酸。
[0011]目前的检测方法要么特异性针对一种具体的突变,因此不能更普遍地(可能存在 多种突变的情形)使用,要么对任意的突变都敏感,因此将鉴定没有意义的突变和有临床意 义的突变。
[0012]拥有借以不检测没有意义的突变而仍然足够灵敏以鉴定一定范围的其他突变的 方法将是合乎需要的。
[0013] 发明概述
[0014] 按照本发明的第一方面,提供用于检测多态性靶核酸序列(所述靶序列存在于给 定群体内的多种等位基因中)中变体核酸序列的存在的方法,所述方法包括:
[0015] a)提供包含寡核苷酸探针和靶核酸序列的反应混合物,所述寡核苷酸探针在与靶 序列的第一等位基因杂交时具有第一解链温度(Tm),并且在与靶序列的第二等位基因杂交 时具有第二较低的Tm,其中所述探针在不希望检测到变体的位点包含至少一个通用碱基;
[0016] b)允许所述探针与靶核酸序列杂交;并且
[0017] c)当所述探针与所述靶核酸序列杂交时,确定所述探针的Tm;
[0018] 由此确定是否存在变体核酸序列。
[0019] 通用碱基是能够与四种典型核酸碱基(A,C,G,T)中的任一种形成沃森-克里克碱 基对的碱基。通用碱基的实例包括2'-脱氧肌苷(次黄嘌呤脱氧核苷酸)衍生物、硝基吡咯 (nitroazole)类似物和疏水芳族无氢键合的碱基。用于本发明的优选通用碱基包括d-肌苷 和5-硝基吲哚。
[0020] 不希望检测到变体的位点优选是这样的残基:该处的突变是表型沉默突变(例如, 典型地,密码子中的第三个碱基,该处的突变不改变所表达的氨基酸);或者其可以是这样 的残基:该处的突变确实改变肽序列,但是产生的是不改变所表达的肽的特性的保守替换。 当然,也可以使用本发明的方法来阻止任意需要的突变的检测;其不必是沉默突变。
[0021] 以这种方式,所述探针将以相同的Tm与仅在与所述通用碱基相对应的残基处不同 的等位基因杂交。仅当所述等位基因在不存在通用碱基的残基处不同时,才观察到改变的 Tm;以这种方式,可以妨碍某些突变的存在的检测,而不改变所述探针检测一定范围的不同 的突变的能力。
[0022] 在一些实施方案中,所述探针可以在不希望检测到变体的位点包含多于一个通用 碱基。多于一个这样的位点也可以或作为替代存在于所述探针中。
[0023] 第一等位基因可以指定为野生型的;并且第二等位基因可以包括多种变体(例如, 多个不同的SNPs,以及在单一变体等位基因中的多个SNPs),条件是所述探针与第一和第二 等位基因杂交时的相对Tm如上文所述。
[0024] 优选地,所述探针是DNA。
[0025]第一和第二等位基因之间的序列差异优选在所述探针结合的区域内部;即,在所 述探针与第一等位基因之间的任何错配都不在所述探针的末端。
[0026]所述探针的长度可以是多至10、20、30、40或50个核苷酸。更长或更短的探针也可 以,尽管其可能难以获得针对不同等位基因的Tm之间的适当的区分或者具有引物与更短的 探针的Tm。
[0027] 确定探针的Tm的步骤可以进一步包括将所述探针的Tm与预期的Tm比较,以确定所 述等位基因是否是变体等位基因。
[0028] 步骤c),确定所述探针与所述靶核酸序列杂交时的Tm,可以包括下述步骤:在等于 或低于第二Tm的第一温度检测所述探针与所述靶标的杂交,和在等于或低于第一 Tm而高于 第二Tm的第二温度检测杂交。
[0029] 所述探针可以被标记。例如,所述探针可以包含荧光或放射性标记,或者可以用第 二探针可以结合的配体标记。优选地,用荧光标记来标记所述探针,并且优选地,取决于所 述探针是已经与靶标链杂交(即,所述探针是双链核酸的一部分)还是没有杂交(所述探针 是单链的),所述标记还产生差异性的信号。优选的探针是HyBeacon?探针(例如,参见 Mol Cell Probes(分子细胞探针).2002年 10月;16(5) :319-26, "Ultra-rapid DNA analysis using HyBeacon Probes and direct PCR amplification from saliva(使用 HyBeacon探针和对唾液的直接PCR扩增进行的超快速DNA分析)",French DJ,Archard CL, Andersen MT,McDowell DG)。差异性信号的产生允许容易且快速地分析所述探针是否已经 与靶标结合。
[0030]所述方法还包括优先扩增靶序列的第二等位基因的步骤。这可以在步骤c)之前包 括下述步骤:
[0031] b2)向反应混合物提供一对用于核酸扩增的寡核苷酸引物,所述引物与侧连寡核 苷酸探针结合位点的第一和第二位点处的核酸杂交;其中引物:样品的Tm高于探针:第二等 位基因的Tm;
[0032] b3)将反应混合物维持在介于探针:第一等位基因的Tm与探针:第二等位基因的Tm 之间的温度,以使所述探针优先与第一等位基因杂交;
[0033] b4)对反应混合物进行热循环扩增,所述扩增包括解链阶段、退火阶段和延伸阶 段,其中延伸和退火阶段的温度介于探针:第一等位基因的Tm与探针:第二等位基因的Tm之 间,以使所述探针在这这些阶段与第一等位基因杂交;由此扩增第二等位基因;并且
[0034] 其中步骤c)包括在等于或低于探针:第二等位基因的Tm的温度检测所述探针与样 品的杂交;在等于或低于探针:第一等位基因的Tm的较高的温度检测所述探针与样品的杂 交;并且比较这两个杂交;由此检测扩增的第二等位基因。
[0035]这允许在检测和确定Tm之前使用通用碱基探针选择性地扩增等位基因。这可以用 来富集可能仅有少许第二等位基因拷贝的样品。所述探针最初通过在延伸阶段保持与第一 等位基因结合而用来阻断第一等位基因的扩增,然后在扩增后检测所述等位基因。在延伸 阶段,所述寡核苷酸探针保持与第一等位基因杂交。这防止与相同核酸杂交的引物的链延 伸,而由于所述探针不与所述等位基因杂交,因此与第二等位基因杂交的引物自由进行链 延伸。以这种方式,第二等位基因将优先被扩增。在某些实施方案中,引物中的一条或两条 可以与探针结合位点重合,以使所述探针与所述引物竞争结合;这可以防止引物的结合,并 且因此防止链延伸。在其他实施方案中,引物和探针不重合,但是引物防止进一步的链延 伸。
[0036]检测杂交的探针分子的步骤可以进一步包括定量扩增混合物中第一和第二等位 基因的相对量。在本发明的某些实施方案中,检测步骤可以在扩增步骤之前以及之后进行。 在优选的实施方案中,第一和第二等位基因的比率可以通过下述测定:将所述反应混合物 维持在等于或低于探针:第二等位基因的Tm的第一温度;检测杂交的探针分子;将所述反应 混合物升温至高于探针:第二等位基因的Tm但是等于或低于探针:第一等位基因的Tm的第 二温度;并且检测杂交的探针分子。在第一较低的温度,探针将与第一和第二等位基因都杂 交,而在第二较高的温度,探针将仅与所述第一等位基因杂交。
[0037]引物优选地在探针结合的区域之外的区域结合;即,第一引物结合探针靶标的3'_ 方向,而第二引物结合探针靶标的5'-方向(记住:引物将结合在双链DNA的不同链上)。当引 物进行链延伸时,这被结合的探针所阻断,使得该链不能被扩增。在某些实施方案中,引物 可以结合在探针结合的区域的附近,或者甚至可以与探针重合一个、两个、三个或更多个核 苷酸,尽管这不是优选的。当然,两个引物可以与探针靶标不同程度地重合,或者一个引物 可以重合,而另一个引物不重合。在探针与引物重合的情形中,则所述探针可以优选在所述 引物的3'端与引物竞争结合,并且以这种方式防止延伸。
[0038]在本发明的优选的实施方案中,扩增反应是聚合酶链式反应(PCR)。在某些实施方 案中,引物可以以不同的浓度提供;优选地,引物中的一个以限速量提供,并且所述扩增反 应是不对称PCR。在不对称PCR中,两个靶标DNA链中的一个被优先扩增,由于使用限速引物, 因此只有另一个引物可用于起始链延伸。正义链或反义链之一可以是被靶向用于优先扩增 的链;优选地,优先扩增的链是与所述探针互补的链。
[0039] 所述探针可以包含一个、两个、三个、四个、五个或更多个通用碱基。
[0040] 在某些实施方案中,所述探针可以包含与第一靶核酸序列互补的第一核酸序列; 与第二靶核酸序列互补的第二核酸序列;和连接所述第一和第二核酸序列的接头核酸序 列;其中所述接头隔开第一和第二两个序列,使得与第一靶核酸序列退火的第一序列的解 链温度和与第二靶核酸序列退火的第二序列的解链温度不相关。
[0041] 接头区的存在允许探针被分成具有不同杂交特征的功能元件。包含这些接头产生 "泡状"结构,从热动力学角度上将所述探针的各个元件分开,从而提供具有不同结合特征 的区域。此外,接头核酸序列的存在允许整个探针具有单个多核苷酸分子的特征,但是作用 上如同由分开的较短核酸探针构成。当第一和第二序列与它们各自的靶序列杂交时,结构 区可以折叠形成环。
[0042] 所述探针结构允许探测相邻的区域,而较长的探针(例如,跨越第一和第二靶标区 域的单一探针)不能通过Tm分析提供充分的区分变体的报告。因此,优选地,第一和第二靶 核酸序列是相邻的。
[0043] 优选地,所述接头是核苷接头;更优选地,所述接头包含多聚脱氧核糖核苷酸;最 优选地,所述接头包含或由多聚脱氧肌苷组成。相对于天然碱基,脱氧肌苷由于较弱的氢键 键合而具有低解链温度。可以使用其他的核苷。
[0044] 优选地,所述接头长度多至5、10、15、20、30、40、50个核苷酸。
[0045]第一和第二核酸序列中的至少一个是报告子区。报告子区包括标记的结构部分; 优选荧光标记。这允许在与靶序列结合时检测探针,并且监测某一温度范围内的退火,从而 确定任何变体靶序列的存在。探针优选地不包含猝灭剂结构部分,也不包含要与猝灭剂一 起使用的标记。适当的标记包括FAM、TET、HEX、R0X、TAMRA、Cy3和Cy5。其他适当的标记是技 术人员已知的。优选地,所述标记结合在T核苷酸上,尽管也可以使用任意适当的核苷酸。 [0046] 报告子区长度优选为15-200个nt,更优选为15-150个,长度更优选为15-100个或 20-100个、30-80个、40-60个或约 50 个 nt。
[0047] 报告子区可以进一步包含阻断区;即,用于阻断DNA聚合酶导致的核酸链延伸的部 分,由此在例如PCR过程中防止链延伸。聚合酶阻断基团是应该具有阻断聚合物的进一步延 伸的功能特性的基团。阻断基团可以是能够连接到核苷酸上的任意化学基团,其允许修饰 的核苷酸的5'端连接到DNA链中另一个核苷酸的3'端而不允许核苷酸连接到修饰的核苷酸 的3'羟基基团。适当地,3'位置不存在0H基团防止聚合酶活性导致的进一步延伸。在特别优 选的实施方案中,阻断基团选自乙酰基、CH 3、甘氨酰基、亮氨酰基和丙氨酰基基团。在另一 个实施方案中,阻断基团可以是二肽或三肽的形式。
[0048] 在本发明优选的实施方案中,第一和第二核酸序列是报告子区。它们可以包含不 同的标记。所述探针可以用作多路报告子,允许使用单一探针在扩展范围内检测靶序列。
[0049] 在本发明的某些实施方案中,可以提供多种寡核苷酸探针,优选两种。所述探针中 的一个或两者都可以包含至少一个通用碱基;优选二者都包含至少一个通用碱基。优选地 选择与靶序列的相邻部分杂交的探针。这允许更大的有效的靶标"读取长度",而没有必须 提供单一的长探针的限制。此外,由于技术人员可能预期到两个相邻的探针可能彼此干扰, 特别是探针的3'和/或5'端存在化学修饰(诸如延伸阻断剂或标记)的情形中,因此,有效检 测靶序列相邻的部分的能力是出乎意料的。
[0050] 在本发明优选的实施方案中,当提供多种寡核苷酸探针时,全部(优选两种)都是 上文所述的"接头探针";即,包含通过接头核酸序列连接的与第一和第二靶序列互补的第 一和第二核酸序列。这样的排列提供对靶标相对长的部分的变体序列的检测,并且针对靶 标的尺寸而平衡探针的尺寸。
[0051] 靶序列可以是微生物药物抗性基因的一部分。在优选的实施方案中,靶序列是结 核分枝杆菌(Mycobacterium tuberculos i s )基因,优选rpoB。该基因造成利福平 (rifampin)抗性。在其他实施方案中,革E1序列可以是患者自身的基因,例如,以确定对某些 药物和其他治疗的易感性,或诊断遗传病症。
[0052]按照本发明的另一个方面,提供一种寡核苷酸探针,其在与靶序列的第一等位基 因杂交时具有第一解链温度(Tm),并且在与靶序列的第二等位基因杂交时具有第二较低的 Tm,其中所述探针在不希望检测到变体的位点上包含至少一个通用碱基。
[0053]通用碱基的实例包括2'-脱氧肌苷(次黄嘌呤脱氧核苷酸)衍生物、硝基吡咯类似 物和疏水芳族无氢键合的碱基。用于本发明的优选通用碱基包括d-肌苷和5-硝基吲哚。 [0054]不希望检测到变体的位点优选是这样的残基:该处的突变是表型沉默突变(例如, 典型地,密码子中的第三个碱基,在该处的突变不改变所表达的氨基酸);或者其可以是这 样的残基:该处的突变确实改变肽序列,但是产生的是不改变所表达的肽的特性的保守替 换。
[0055]在一些实施方案中,探针可以在不希望检测到变体的位点包含多于一个的通用碱 基。多于一个这样的位点也可以或作为替代存在于所述探针中。
[0056] 优选地,所述探针是DNA。
[0057] 所述探针可以被标记。例如,所述探针可以包含荧光或放射性标记,或者可以用第 二探针可以结合的配体标记。优选地,用荧光标记来标记所述探针,并且优选地,取决于所 述探针是已经与靶标链杂交(即,所述探针是双链核酸的一部分)还是没有杂交(所述探针 是单链的),所述标记还产生差异性的信号。优选的探针是HyBeacon?探针(例如,参见 Mol Cell Probes(分子细胞探针).2002年 10月;16(5) :319-26, "Ultra-rapid DNA analysis using HyBeacon Probes and direct PCR amplification from saliva(使用 HyBeacon探针和对唾液的直接PCR扩增进行的超快速DNA分析)",French DJ,Archard CL, Andersen MT,McDowell DG)〇
[0058] 所述探针可以包含一个、两个、三个、四个、五个或更多个通用碱基。
[0059]在某些实施方案中,所述探针可以包含与第一靶核酸序列互补的第一核酸序列; 与第二靶核酸序列互补的第二核酸序列;和连接所述第一和第二核酸序列的接头核酸序 列;其中所述接头隔开第一和第二两个序列,使得与第一靶核酸序列退火的第一序列的解 链温度和与第二靶核酸序列退火的第二序列的解链温度不相关。
[0060]优选地,所述接头是核苷接头;更优选地,所述接头包含多聚脱氧核糖核苷酸;最 优选地,所述接头包含多聚脱氧肌苷或由多聚脱氧肌苷组成。相对于天然碱基,脱氧肌苷由 于较弱的氢键键合而具有低解链温度。可以使用其他的核苷。
[0061 ] 优选地,所述接头长度多至5、10、15、20、30、40、50个核苷酸。
[0062]第一和第二核酸序列中的至少一个是报告子区。报告子区包括标记的结构部分; 优选荧光标记。这允许在与靶序列结合时检测探针,并且监测某一温度范围内的退火,从而 确定任何变体靶序列的存在。探针优选不包含猝灭剂结构部分,也不包含要与猝灭剂一起 使用的标记。适当的标记包括FAM、TET、HEX、R0X、TAMRA、Cy3和Cy5。其他适当的标记是技术 人员已知的。优选地,所述标记结合在T核苷酸上,尽管也可以使用任意适当的核苷酸。 [0063] 报告子区长度优选为15-200个nt,更优选为15-150个,长度更优选为15-100个或 20-100个、30-80个、40-60个或约 50 个 nt。
[0064] 报告子区可以进一步包含阻断区;即,用作阻断DNA聚合酶导致的核酸链延伸的部 分,由此在例如PCR过程中防止链延伸。聚合酶阻断基团是应该具有阻断聚合物的进一步延 伸的功能特性的基团。阻断基团可以是能够连接到核苷酸上的任意化学基团,其将允许修 饰的核苷酸的5'端连接到DNA链中另一个核苷酸的3'端而不允许核苷酸连接到修饰的核苷 酸的3'羟基基团。适当地,3'位置不存在0H基团防止聚合酶活性导致的进一步延伸。在特别 优选的实施方案中,阻断基团选自乙酰基、CH 3、甘氨酰基、亮氨酰基和丙氨酰基基团。在另 一个实施方案中,阻断基团可以是二肽或三肽的形式。
[0065] 在本发明优选的实施方案中,第一和第二核酸序列是报告子区。它们可以包含不 同的标记。所述探针可以用作多路报告子,允许使用单一探针在扩展范围内检测靶序列。
[0066] 在本发明的某些实施方案中,可以提供多种寡核苷酸探针,优选两种。所述探针中 的一个或两者都可以包含至少一个通用碱基;优选二者都包含至少一个通用碱基。优选地 选择与靶序列的相邻部分杂交的探针。在本发明优选的实施方案中,当提供多种寡核苷酸 探针时,全部(优选两种)都是上文所述的"接头探针";即,包含通过接头核酸序列连接的与 第一和第二靶序列互补的第一和第二核酸序列。
[0067] 靶序列可以是微生物药物抗性基因的一部分。在优选的实施方案中,靶序列是结 核分枝杆菌基因,优选rpoB。该基因造成利福平抗性。在其他实施方案中,靶序列可以是患 者自身的基因,例如,以确定对某些药物和其他治疗的易感性,或诊断遗传病症。
[0068] 在本发明特定的实施方案中,所述探针可以包含选自SEQ ID N0 5至SEQ ID N0 10的序列,或可以包含所述序列的修饰版本或选自SEQ ID NO 1至SEQ ID NO 4的序列的修 饰版本。"修饰版本"意指这样的序列:其通过缺失或添加一个、两个或三个核苷酸而不同; 或通过取代一个、两个、三个、四个、五个、六个、七个或八个核苷酸(包括用非标准核苷酸取 代标准核苷酸,例如,用通用碱基或备用碱基取代)而不同;或二者。修饰版本还可以或作为 替代包括不同长度和/或组成的接头序列;备用的荧光标记;或备用的通用碱基。
[0069] 本发明的另一个方面提供多种寡核苷酸探针,如前文所述。
[0070] 本发明的另一个方面提供一种试剂盒,所述试剂盒包含一种或多种上文所述的寡 核苷酸探针和侧连探针与其杂交的靶核酸位点的引物对。
[0071] 附图简述
[0072] 图1显示探针构建的示意图(摘自W02013/041853)。
[0073]图2显示rpoB基因从密码子505到533的核心的共有序列以及单个突变体。
[0074] 图3显示用在本实施例中跨越密码子507-520和521-533的两个接头探针的rpoB基 因的核心上的位置。
[0075] 图4显示通用碱基5-硝基吲哚-CE亚磷酰胺的结构。
[0076] 图5显示用于本实施例中的接头探针的序列。
[0077] 图6显示当针对具有突变的模板rpoB序列使用时,接头探针解链温度的变化的检 测。
[0078]图7显示来自图6的反应的代表性解链曲线。
[0079]图8显示使用组合的两种接头探针针对密码子507-533中的突变观察到的解链温 度的变化。
[0080] 图9显示低拷贝数样品的结果的检测。
[0081] 发明详述
[0082]首先参考图1,这显示用于本发明的探针的一般结构。探针由三个区域组成:第一 报告子序列,其与第一靶序列具有同源性;接头序列,在该情形中,其包含五个肌苷核碱基; 和第二报告子序列,其与第二靶序列具有同源性。第二报告子在3'端还包含阻断序列,其在 聚合反应中防止链延伸。每个报告子区具有不同的退火温度,并且具有一个或多个荧光核 苷酸,优选FAM-T,或不同的/多种颜色。所述报告子用于报道特定序列或序列变体(例如, SNPs、插入、缺失等)的存在。这允许用单一的探针检测扩大范围的多个序列。调整每个区域 以在野生型序列的情形中具有相似的(或相同的)Tm,而在突变的情形中具有改变的Tm,使 得使用者只需要检测变化的Tm就能获知变体的存在。"相似的"意指Tm相差至多2、1.5、1、 0.5Γ。
[0083] 现在提供使用多路报告子探针检测结核分枝杆菌rP〇B基因中的变体的实例。结核 分枝杆菌(M. tuberculosis)中的多药耐药性是复杂的。利福平是一线结核分枝杆菌药物, 并且是在治疗前在领域中鉴定的主要靶标。利福平抗性分支结核杆菌在rpoB基因的81-bp 核心区中具有突变,其编码RNA聚合酶的β-亚基。96 %的结核分枝杆菌利福平抗性临床分离 株在该基因中具有突变。密码子516、526或531中的突变导致高水平的利福平抗性。然而,检 测在81-bp基因区域中的突变典型地需要多种常规的探针,它们中的一些需要是重合的,由 此需要多个检测步骤。
[0084] 使用所述的接头探针以某种方式解决这一问题,但是仍然留下问题没有解决:一 些突变是表型沉默的,对药物抗性没有影响。因此,本发明利用掺有通用碱基的接头探针以 防止检测此类沉默突变,同时仍然能够以高灵敏性检测需要的突变。
[0085] 图2显示rpoB基因从密码子505到533的野生型共有序列以及该区域内已知的突变 (沉默的和不沉默的)。明显的是,存在大量已知的突变,并且沉默突变的灵敏性检测将冒着 对于重要突变的诊断检测的选择性(和有用性)的风险。
[0086]为了证明本发明的原理,合成两个接头探针,其覆盖跨越MTB rpoB基因的密码子 507-520和520-533的90bp区域。使用氰基乙基亚磷酰胺法制备寡核苷酸。图3显示探针针对 基因组序列的位置。探针的两个报告子结构域标记为Z1和Z2;在每个探针中这些通过接头 (图3中未显示)连接。每个探针的3'端包含阻断剂基团。注意,两个接头探针覆盖基因组序 列的相邻区域。
[0087]使用具有图3所示的序列的未修饰的探针,可以利用由探针序列与靶序列之间的 错配所导致的解链温度变化来检测所述靶序列中突变的存在。可以以高灵敏性检测单个碱 基错配。例如,参见国际专利申请W02013/041853,其描述了使用相似的探针(尽管只有单个 探针,不是相邻的探针对)检测rpoB基因中的SNP突变。
[0088]本文所述的实验的目的是研究在所选位置处阻碍突变的检测的可能性。为了这一 目的,从防止表型沉默突变被检测的角度,使用通用碱基5-硝基吲哚-CE亚磷酰胺(Glen Research;图4)取消突变对解链曲线去稳定作用的影响。在密码子507>520中共有4个密码 子鉴定为具有不可知的第三碱基,并且用5-硝基吲哚或d-肌苷置换这些碱基,以研究该碱 基对中和去稳定作用的影响。
[0089]图5提供了探针的序列。在该图中,标准DNA碱基具有常用的符号(A,C,G,T),非标 准碱基或修饰用数字表示:1 =荧光素 dT; 2 =磷酸酯单元;3 =三甲氧基芪;4 = 5-硝基吲 哚;* =肌苷残基(5个/探针)。不同的探针如下所述:
[0090] rpoB(507>520)连接的-探针(SEQ ID NO 1)-标记的探针,其包括接头、荧光残基 和阻断剂,覆盖密码子507-520。
[0091] rpoB(507>520)(SEQ ID N0 2)-标记的核苷酸探针,其跨越密码子507-520,没有 接头或阻断剂。
[0092] rpoB(520>533)连接的-探针(SEQ ID N0 3)-标记的探针,其包括接头、荧光残基 和阻断剂,覆盖密码子521-533
[0093] rpoB(520>533)(SEQ ID N0 4)-标记的核苷酸探针,其跨越密码子521-533,没有 接头或阻断剂。
[0094] ID N0 5)-标记的探针,其包括接头、荧光残基和阻 断剂,在探针的每个报告子部分具有5-硝基吲哚替代的单个沉默突变,覆盖密码子507-520〇
[0095] rpoB(507>520)JS(SEQ ID N0 6)-印〇8(507>520)_沉默_1 的较短版本。
[0096] rpOB(520>533)_沉默_全部(SEQIDN0 7)-标记的探针,其包括接头、荧光残基和 阻断剂,在探针的每个报告子部分具有四个5-硝基吲哚替代的沉默突变,覆盖密码子521-533〇
[0097] 印必(507>520)_沉默_全部(SEQ ID N0 8)-标记的探针,其包括接头、荧光残基和 阻断剂,在探针的每个报告子部分具有5-硝基吲哚替代的所有沉默突变,覆盖密码子507-520〇
[0098] rpoB(507>520)JSA(SEQ ID N0 9)-印〇8(507>520)_沉默_1 的较短版本。
[0099] rpoB(507>520)_shortB(SEQ ID NO 10)-印〇8(507>520)_沉默_全部的较短版本。
[0100] 用于从样品PCR扩增靶rpoB序列的引物显示如下:
[0101] FWD 引物 vl
[0102] (5'>3')
[0103] GCAGACGTTGATCAACATCCC(SEQ ID NO 11)
[0104] FWD 引物 v2
[0105] (5,>3,)
[0106] CGTGGAGGCGATCACACCGCAGACGTT(SEQ ID NO 12)。
[0107] 莖里
[0108] 使用引物扩增包含rpoB的样品,并且用rpoB(507>520)连接的探针探针和rpoB (520>533)连接的探针二者(无一包含沉默的突变位点)进行解链曲线分析。数据显示单个 和多个突变可以作为探针解链温度的变化进行检测(图6&7)。图6(上图)显示文献中报道的 每个密码子的突变频率。红(实心的)点表示在印度这些突变的频率。图6的下图显示507> 520探针上的507>520之间的密码子的突变,和520>533探针上的520>533之间密码子的突变 对报道的解链温度(作为来自野生型的偏差)的影响。
[0109] 与在密码子520-533中存在突变且因此以74.8°C±1.14°C的平均TM的TM变化表示 的模板相比,对于探针rpoB(520>533)连接的探针在密码子507-520中存在突变且因此不被 所述探针报道的模板中报道的TM表示为77.5°C ±0.27°C的峰值。
[0110]代表性的解链曲线显示在图7中,其使用分离的探针由临床RRDR分离株D516V(上) 和N531L(下)提供rpoB中rpoB突变的解链曲线分析。在上图中,使用覆盖密码子507>520的 探针,与N531L(紫色,右侧峰)(突变落在探针范围之外且对于该探针报道在72.2°C的野生 型(黑色,右侧峰)位置)相比较,D516V模板(橙色,左侧峰)报道为在69.9°C具有峰,。相反 地,与N531L突变体(紫色,左侧峰)(其报道在位置73.5°C处)相比较,当使用相同的模板联 合覆盖520>533的探针时,对于D516V(橙色,右侧峰)报道的位置是野生型(黑色,右侧峰) 75.9。。。
[0111] 用5-硝基吲哚的导致野生型表型(沉默突变)的碱基置换表现出取消去稳定的作 用。之前表明是沉默的、但是可用常规SNP探针检测的507和514的两个突变被完全中和(图 7)。如果需要,可以使用相同的方法中和520>533中潜在的10个位置。
[0112] 图8显示使用完全沉默的探针rpoB(507>520)沉默_全部和不沉默的探针rpoB(520 >533)连接的-探针的组合在rpoB基因上一系列不同SNP或多个突变中观察到的Tm的变化。 明显的是,沉默突变507.3、508.2、512.1和514.2将1'111保持在野生型范围内,而与野生型相 比,其他不沉默的突变表现出较大的Tm变化。这证实了该方法和探针是稳健的。
[0113] 图8显示507>520之间的密码子突变对507>520探针的影响,和520>533之间的密码 子突变对520>533探针的影响。在与表型沉默突变相对应的位置(其中碱基被5-硝基吲哚置 换),变化被阻抑。还显示了具有多个突变的模板在两个探针的报道位置产生变化,或者同 样地,在与沉默突变相对应的碱基处被5-硝基吲哚置换时,变化被沉默,以允许正确的表型 报道。
[0114] 多个突变与具有增加的错配数量的增加的TM变化相关。还以大的TM变化检测缺 失。
[0115] 使用少至100种(上)或10种(下)样品,测定是高灵敏性的(图9)。这使得能够检测 所有密码子中的突变,包括密码子516、526、531和533中的关键突变,并且另外中和密码子 507和514中的沉默突变(之前已经在备选产物中报道为有问题的)的作用。
[0116] 我们相信这种两个标记的-探针的组合代表着灵敏且最先进的对于RIF-突变检测 的测试,并且所述方法同等适用于其他基因组基因座。
【主权项】
1. 一种用于检测多态性靶核酸序列中存在变体核酸序列的方法,所述靶序列存在于给 定群体内的多个等位基因中,所述方法包括: a) 提供包含寡核苷酸探针和靶核酸序列的反应混合物,所述寡核苷酸探针在与所述靶 序列的第一等位基因杂交时具有第一解链温度(Tm),并且在与所述靶序列的第二等位基因 杂交时具有第二较低的Tm,其中所述探针在不希望检测到变体的位点包含至少一个通用碱 基; b) 允许所述探针与靶核酸序列杂交;并且 c) 当所述探针与所述靶核酸序列杂交时,确定所述探针的Tm; 由此确定是否存在变体核酸序列。2. 权利要求1所述的方法,其中所述通用碱基选自2'-脱氧肌苷(次黄嘌呤脱氧核苷酸) 衍生物、硝基吡咯类似物和疏水芳族无氢键合的碱基。3. 权利要求1的方法,其中所述通用碱基选自d-肌苷和5-硝基吲哚。4. 任一前述权利要求所述的方法,其中所述不希望检测到变体的位点是该处的突变是 表型沉默突变的残基。5. 任一前述权利要求所述的方法,其中所述不希望检测到变体的位点是该处的突变产 生不改变所表达的肽的特性的保守替换的残基。6. 任一前述权利要求所述的方法,其中所述探针在不希望检测到变体的位点包含多于 一个通用碱基。7. 任一前述权利要求所述的方法,其中所述探针包含多于一个不希望检测到变体的位 点。8. 任一前述权利要求所述的方法,其中所述确定所述探针的Tm的步骤进一步包括将所 述探针的Tm与预期的Tm比较,从而确定所述等位基因是否是变体等位基因。9. 任一前述权利要求所述的方法,其中所述确定所述探针的Tm的步骤包括下述步骤: 检测所述探针与靶标在等于或低于第二Tm的第一温度的杂交,并且检测在等于或低于第一 Tm但高于第二Tm的第二温度的杂交。10. 任一前述权利要求所述的方法,其中所述探针被标记。11. 权利要求10所述的方法,其中所述标记是荧光或放射性标记,或是第二探针可以结 合的配体。12. 权利要求10或11所述的方法,其中,取决于所述探针是否已经与靶标链杂交,所述 标记产生差异性的信号。13. 任一前述权利要求所述的方法,其进一步包括优先扩增所述靶序列的第二等位基 因的步骤。14. 权利要求13所述的方法,其中所述方法在步骤c)之前包括下述步骤: b2)向所述反应混合物提供一对用于核酸扩增的寡核苷酸引物,所述引物与侧连寡核 苷酸探针结合位点的第一和第二位点处的核酸杂交;其中引物:样品的Tm高于探针:第二等 位基因的Tm; b3)将所述反应混合物维持在介于探针:第一等位基因的Tm与探针:第二等位基因的Tm 之间的温度,以使所述探针优先与第一等位基因杂交; b4)对所述反应混合物进行热循环扩增,所述扩增包括解链阶段、退火阶段和延伸阶 段,其中延伸和退火阶段的温度介于探针:第一等位基因的Tm与探针:第二等位基因的Tm之 间,以使所述探针在这些阶段与第一等位基因杂交;由此扩增第二等位基因;并且 其中步骤c)包括在等于或低于探针:第二等位基因的Tm的温度检测所述探针与样品的 杂交;在等于或低于探针:第一等位基因的Tm的较高的温度检测所述探针与样品的杂交;并 且比较这两个杂交;由此检测扩增的第二等位基因。15. 权利要求14所述的方法,其中所述检测杂交的探针分子的步骤进一步包括定量扩 增混合物中第一和第二等位基因的相对量。16. 权利要求15所述的方法,其中第一和第二等位基因的比率通过下述定量:将所述反 应混合物维持在等于或低于探针:第二等位基因的Tm的第一温度;检测杂交的探针分子;将 所述反应混合物升温至高于探针:第二等位基因的Tm但是等于或低于探针:第一等位基因 的Tm的第二温度;并且检测杂交的探针分子。17. 权利要求14-16中任一项所述的方法,其中第一引物结合所述探针靶标的3'-方向, 而第二引物结合所述探针靶标的5方向。18. 权利要求14-17中任一项所述的方法,其中引物中的一种以限速量提供,并且所述 扩增反应是不对称PCR。19. 任一前述权利要求所述的方法,其中所述探针包含一个、两个、三个、四个、五个或 更多个通用碱基。20. 任一前述权利要求所述的方法,其中所述探针包含与第一靶核酸序列互补的第一 核酸序列;与第二靶核酸序列互补的第二核酸序列;和连接所述第一和第二核酸序列的接 头核酸序列;其中所述接头隔开第一和第二两个序列,使得与第一靶核酸序列退火的第一 序列的解链温度和与第二靶核酸序列退火的第二序列的解链温度不相关。21. 权利要求20所述的方法,其中所述第一和第二靶核酸序列是相邻的。22. 权利要求20或21所述的方法,其中所述接头是核苷接头;更优选地,所述接头包含 多聚脱氧核糖核苷酸;最优选地,所述接头包含多聚脱氧肌苷或由多聚脱氧肌苷组成。23. 权利要求20、21或22所述的方法,其中所述接头长度多至5、10、15、20、30、40、50个 核苷酸。24. 权利要求20-23中任一项所述的方法,其中所述第一和第二核酸序列二者都是报告 子区,其各自包含标记。25. 任一前述权利要求所述的方法,其中所述探针包含阻断区。26. 任一前述权利要求所述的方法,其中提供多个寡核苷酸探针,优选提供两个寡核苷 酸探针。27. 权利要求26所述的方法,其中所述多个探针各自包含至少一个通用碱基。28. 权利要求26或27所述的方法,其中选择所述探针,使其与所述靶序列的相邻部分杂 交。29. 权利要求26-28中任一项所述的方法,其中所述多个探针中的每一个是权利要求 20-24中任一项定义的接头探针。30. 任一前述权利要求所述的方法,其中所述靶序列是微生物药物抗性基因的一部分, 优选是结核分枝杆菌(Mycobacterium tuberculosis)基因的一部分,更优选是rpoB的一部 分。31. 权利要求1-29中任一项所述的方法,其中所述靶序列是对针对某些药物或其他治 疗的敏感性有影响的基因。32. 权利要求1-29中任一项所述的方法,其中所述靶序列是造成遗传病症的基因。33. -种寡核苷酸探针,所述寡核苷酸探针在与靶序列的第一等位基因杂交时具有第 一解链温度(Tm),并且在与靶序列的第二等位基因杂交时具有第二较低的Tm,其中所述探 针在不希望检测到变体的位点包含至少一个通用碱基。34. 根据权利要求33所述的探针,其中所述通用碱基是2'-脱氧肌苷(次黄嘌呤脱氧核 苷酸)衍生物、硝基吡咯类似物或疏水芳族无氢键合的碱基。35. 根据权利要求33所述的探针,其中所述通用碱基是d-肌苷或5-硝基吲哚。36. 根据权利要求33-35所述的探针,其在所述不希望检测到变体的位点包含多于一个 通用碱基。37. 根据权利要求33-36所述的探针,其包含多于一个不希望检测到变体的位点。38. 根据权利要求33-37所述的探针,其中所述探针是DNA。39. 根据权利要求33-38所述的探针,其中所述探针被标记。40. 根据权利要求33-39所述的探针,其中所述探针包含一个、两个、三个、四个、五个或 更多个通用碱基。41. 根据权利要求33-40所述的探针,其中所述探针包含与第一靶核酸序列互补的第一 核酸序列;与第二靶核酸序列互补的第二核酸序列;和连接所述第一和第二核酸序列的接 头核酸序列;其中所述接头隔开第一和第二两个序列,使得与第一靶核酸序列退火的第一 序列的解链温度和与第二靶核酸序列退火的第二序列的解链温度不相关。42. 根据权利要求41所述的探针,其中所述接头是核苷接头;更优选地,所述接头包含 多聚脱氧核糖核苷酸;最优选地,所述接头包含多聚脱氧肌苷或由多聚脱氧肌苷组成。43. 根据权利要求41或42所述的探针,其中所述接头长度多至5、10、15、20、30、40、50个 核苷酸。44. 根据权利要求41-43所述的探针,其中所述第一和第二核酸序列二者都是报告子 区,其各自包含标记。45. 根据权利要求44所述的探针,其中所述报告子区还包含阻断区。46. 根据权利要求33-45中任一项所述的探针,其包含选自SEQ ID NO 5至SEQ ID NO 10的核苷酸序列,或选自SEQ ID NO 1至SEQ ID NO 10的序列的修饰版本。47. -种包含多种根据权利要求33-46所述的探针的试剂盒。48. 权利要求47所述的试剂盒,其中选择所述多种探针与靶序列的相邻部分杂交。49. 权利要求47或48所述的试剂盒,其中所述多种探针是权利要求41-46所述的各个探 针。
【文档编号】C12Q1/68GK105916999SQ201480065325
【公开日】2016年8月31日
【申请日】2014年9月30日
【发明人】本·科布
【申请人】艾皮斯托姆有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1