等位基因的偏向扩增的制作方法

文档序号:581441阅读:434来源:国知局
专利名称:等位基因的偏向扩增的制作方法
等位基因的偏向扩增本申请要求美国专利临时申请第61/112,495号和第61/117,371号的优先权,其全文通过引用纳入本文。
背景技术
人类基因组计划(human genome project)已经成功完成人类DNA大多数区域的测序。疾病相关基因和序列改变的鉴定工作继续快速推进。采用连锁研究将表型和遗传标记例如简单序列重复(simple sequence repeats)或单核苷酸多态性(SNP)关联以鉴定候选基因。序列改变包括导致错义、框架移动或剪接突变的SNP、插入、和缺失,因此可用来精确定出负责突变的基因和范围。然而,即使已知遗传细节,这钟知识仍难以用于常规医学实践,很大程度上是因为分析DNA的方法昂贵且复杂。当成本显著降低且方法明显简化时,预期DNA分析将能用于日常临床实践而有效检测疾病检测和更好的治疗。理想的DNA分析是快速、简便、且价廉的。当疾病由数量有限的突变所造成时,或当少许序列变化造成大部分的疾病案例时,直接基因分型是可行的。传统方法的范围从PCR产物的限制性消化到封闭管荧光方法。 DNA分析的封闭管方法可简单易行。PCR—旦启动,不再需要添加试剂或分离。然而,当一种等位基因少量存在时,该等位基因可能难以检测出。目前鉴定序列变异的最佳方法是测序。尽管其成本在降低,测序仍然是一种复杂的过程,在用于具体的遗传诊断或或药物遗传学时并不快速、简便、或价廉。标准的测序需要七步1)通过PCR扩增,幻清洁PCR产物,;3)加入循环测序试剂,4)进行双脱氧终止的循环测序,幻清洁终止产物,6)通过电泳分离,和7)数据分析。这一复杂过程可以自动化并已在一些测序中心实现,但其测序复杂性仍远高于本发明所述方法。此外,当分析大的或者多个基因时,返回的测序产物经常有超过90%是正常产物。而且,现有的测序方法无法鉴定低拷贝等位基因,特别是当等位基因在等位基因中的占比低于20%时。鉴定这些低拷贝等位基因的存在对许多情况,例如鉴定肿瘤样品或外周液体如血液中某些癌基因的突变或变化至关重要。这些等位基因的存在与否对于治疗方案的选择特别重要,例如当检测/ 证实为常见体细胞突变(p53、EGFR、BRAF)和早期鉴定为突变细菌感染(例如疟疾)时禁用标准疗法。相对占优的野生型背景中能发现低水平突变等位基因的其它例子是在线粒体 DNA中和存在于母体循环内的胎儿DNA。此外,需要检测低水平的外遗传突变。例如,近来发现BRCAl启动子1-10%之间的甲基化与乳腺癌表型相关(Snell等,2008,Breast Cancer Research)。已知基于PCR的技术用于富集样品中含量较少的等位基因和突变的组分。当突变的基因型未知时,可采用COLD-PCR(Li J等,Nat Med 2008;14:579-84)。这种技术可检测出比例低至1 100的突变等位基因与野生型基因。然而,由于其非特异性并检测产生的任何变异,必需用其它分析鉴定产物。对于富集已知SNP,一些最常用的技术是 ARMS (Newton CR 等,Nucleic Acids Res 1989 ;17 :2503-16)、PNA 介导的 PCR(Nielsen PE 等,Science 1991 ;254 :1497-500 ;Dabritz J 等,Br J Cancer 2005;92 :405-12)、LNA 介导的 WTB—PCR(Dominguez PL 禾口 Kolodney MS. Wild-type blocking polymerase chainreaction for detection of single nucleotide minority mutations from clinical specimens.(检测临床样本中含量较少的单核苷酸突变的野生型阻断聚合酶链反应) Oncogene 2005 ;24 :6830-4)、MAMA-PCR(Cha RS 等,PCR Methods Appl 1992 ;2 14-20)、 TaqMAMA(Li B·,Genomics 2004 ;83 :311-20 ;Easterday WR^jBiotechniques 2005 ;38 731-5)、和 SCORPION 引物(Whitcombe D 等,Nat Biotechnol 1999 ; 17 :804-7)。这些方法通过等位基因特异性PCR检测突变、注意到定量循环(ACq)的差异并能检测1 1000比例的突变等位基因与野生型。已引入高分辨率解链作为扫描PCR扩增子中杂合序列变体的均相方法。参见例如,美国专利7,387,887和7,582,429号,其全文通过引用纳入本文。基于双链DNA饱和染料的应用,高分辨率解链能以> 99%的灵敏度检测最长400bp扩增子中的SNP和插入/缺失。自2003年引入以来,已开发用于高分辨率解链的其它应用,包括采用小扩增子或未标记探针(LUNAPR0BES )进行已知序列变体的基因分型。未标记探针的3’端被封闭以防止 PCR的延伸,且可采用双链DNA饱和染料,例如LCGREEN Plus (犹他州盐湖城的爱达荷技术公司(Idaho Technology, Salt Lake City,UT)),根据探针解链温度(Tm)区分等位基因的基因型。探针序列可设计为与任一等位基因匹配,并根据理想匹配与错配探针之间ATm 最大化而设计。关于未标记探针应用的更多信息参见美国专利7,387,887,其通过引用纳入本文。已经发现探针本身可用于低占比等位基因的偏向扩增。下述实施例1-5中采用未标记探针。实施例6-8中采用折返(Snapkick)引物。折返引物中,引物包含针对靶核酸某基因座的特异性探针元件和模板特异性引物区,其中探针元件是模板特异性引物区的5’。扩增后,探针元件与该基因座杂交通过分子内反应形成发夹,或与其互补链通过分子间反应杂交。从而,折返引物将该探针元件掺入到同一寡核苷酸中。折返引物可以被标记,但通常采用不标记的,方式与不标记探针相似。对于折返引物的具体讨论参见WO 2008/109823 (PCT/US08/56217),其全文纳入本文。尽管本文采用了未标记的探针和未标记的折返引物,但应当理解所述探针也可以是标记的。当采用未标记探针时,这些探针倾向于略大于其它探针(通常大25-30bp)使双链DNA结合染料产生足够的荧光信号,由于这种长度它们特别适于偏向优先扩增错配等位基因。探针(无论是未标记的探针、折返探针元件,还是其它探针)与高占比的等位基因匹配,可凭经验根据两个等位基因的解链峰之间的重叠程度,通过将PCR的退火温度(或延伸温度,如果采用)设定在理想匹配的Tm与略低于错配探针的Tm之间,例如设为低占比等位基因的Tm或约在两个Tm值之间约一半处,而确定“等位基因偏向扩增”。退火温度为中等Tm时,理想匹配的探针与其靶标(通常为野生型等位基因)结合并足够稳定以阻滞扩增。在一种实施方式中,在LIGHTSCANNER 32(“LS32”,爱达荷技术公司)上进行快速循环 PCR以帮助靶退火温度的严谨性并阻滞野生型等位基因的扩增,不过应当理解其它设备也适合。还可采用无外切活性(eX0_)的聚合酶以避免探针消化并帮助偏向扩增较低Tm的等位基因。

发明内容
因此,本文描述等位基因的偏向扩增。
本发明的一个方面中,提供扩增和检测生物样品中等位基因的方法,其中所述生物样品包含靶核酸的第一等位基因和第二等位基因,存在的第一等位基因浓度高于第二等位基因,该方法包括以下步骤在生物混合物中加入热稳定性聚合酶、探针、和为扩增靶核酸设置的引物对,使设置的探针与靶核酸杂交,所述探针与第一等位基因杂交时具有第一 Tm,与第二等位基因杂交时具第二 Tm,其中第一 Tm高于第二 Tm ;通过变性温度与退火温度 (退火温度低于第一 Tm)之间的热循环,扩增生物混合物中的靶核酸;和检测第一等位基因和第二等位基因。在示范性实施方式中,进行循环(扩增)的温度变化速率至少为4°C /秒,更好例如至少6°C /秒。在其它示范性实施方式中,采用解链曲线分析检测第一等位基因和第二等位基因。在一个示范性实施例中,解链曲线分析包括采用饱和染料和未标记探针的高分辨率解链。在另一种示范性方法中,,提供了采用折返引物扩增和检测生物样品中等位基因的方法,所述生物样品包含靶核酸的第一等位基因和第二等位基因,存在的第一等位基因浓度高于第二等位基因,该方法包括以下步骤在生物样品中加入热稳定性聚合酶、第一引物和第二引物,使设置的引物扩增靶核酸,其中第一引物包含靶核酸某基因座的特异性探针元件和模板特异性引物区,所述探针元件是模板特异性引物区的5’,使设置的探针元件与靶核酸杂交,所述探针元件与第一等位基因杂交时具有第一 Tm,与第二等位基因杂交时具有第二 Tm,其中第一 Tm高于第二 Tm ;通过变性温度与退火温度(退火温度低于第一 Tm) 之间的热循环扩增生物混合物中的靶核酸;和检测第一等位基因和第二等位基因。在另一种实施方式中,提供了用于本文所述方法的试剂盒。所述试剂盒包含引物、 其它探针元件(作为折返引物的一部分或者作为单独的探针)、且可包含聚合酶、dNTPs、荧光染料、和PCR缓冲液中的一种或多种。在还有另一种实施方式中,提供了检测等位基因占比的方法。通过以下本文提供的对实施本发明最佳模式的示范性优选实施方式的详细说明, 本发明的其它特征对于本领域技术人员将是显而易见的。简要说明

图1显示了疟疾恶性疟原虫(P. falciparum)CRT基因的未标记探针基因分型试验
的结果(一式三份)。(----)样品为野生型(3D7)、(......)样品为突变型(7G8)、和
(-·-·-··)显示三种不同的突变样品(FCR3)。图2显示了采用未标记探针所得标准化导数峰。野生型等位基因的Tm为62 °C,而突变型等位基因的Tm为M°C。采用58°C退火温度,偏向扩增50-50混合样品中的突变型
等位基因。样品如下(-------)=100%突变型,(......)=50%突变型,(-)=25%
突变型,(----)=12.5%突变型,(-----)=6. 25%突变型,(----)=
3. 13%突变型,(----)=1. 5%突变型,(-·-·-·-)= 0. 75%突变型。这种偏向扩增使得突
变型等位基因的分辨率提高约 IOX (倍),且灵敏度达到低于0. 7-1. 5%。图3显示,采用慢的热循环(1. 5-2. O0C /秒)和8种不同的退火温度未能成功偏
向扩增与图2相同的疟疾靶基因(野生型3D7株(----突变型7G8株(·‘___‘_),和等位
基因等比例杂合(......))。-{}_
图如-b显示了采用8种不同退火温度和exo+聚合酶(图4a)或exo_聚合酶不成
功和成功地偏向扩增等位基因的结果,分别为(......)在不同退火温度下和(-------)在
69°C退火温度下时,野生型(----),突变型(_‘__’_‘_),和等比例等位基因杂合子(......)。图如-c显示了对PAH基因外显子11采用慢的热循环仪(1.5-2.0°C/秒)和梯度
退火温度(高Tm纯合子(-·-·-·-),杂合子(50 50混合)(-……),低Tm纯合子(----)
)等位基因偏向扩增方法的结果图如显示导数解链全曲线,图恥显示了标准化的探针解链峰,和图5c显示的扩增曲线,其表明变化仅依据退火温度而不依据探针靶(基因)稳定性的不同。图6a_c显示了采用快速循环设备和60°C退火温度扩增PAH基因外显子11 (高Tm 纯合子(-._.-._),杂合子(5O 5O混合)( ___-),低Tm纯合子(----))图ea显示导数
解链全曲线,图6b显示了探针标准化的解链峰,和图6c显示扩增曲线。图7a_c与图6a_c相似,但采用62 °C退火温度。图fe-c与图6a_c相似,但采用64°C退火温度。图9a_c与图6a_c相似,但采用65 °C退火温度。图IOa-C与图6a_c相似,但采用67°C退火温度。图lla-c与图6a_c相似,但采用68°C退火温度。图Ih-C与图6a_c相似,但采用69 °C退火温度。图13a_c与图6a_c相似,但采用70°C退火温度。图14a_d显示了法医学SNP rs 1490413 A/G扩增子的解链,采用不同的变性温度((-)=IA IOG ;(......)= IA 100G ;(----)= IA 1000G ;()=
A G ;(........)= G ;(____)= A)。图15-d与图Ha-d类似,但采用了不同的退火温度((-)=IA IOG ;
(......)=IA 100G ; (----) = IA 1000G ; (-------) = A G ; (........) = G ;
(----)=A)。图16-d与图Ha-d类似,但采用了不同的延伸温度((-)=IA IOG ;
(......)=IA 100G ; (----) = IA 1000G ; (-------) = A G ; (........) = G ;
(----)=A)。图17-d与图Ha-d类似,但采用了不同的延伸时间((-)=IA IOG ;
(......)=IA 100G ; (----) = IA 1000G ; (-------) = A!G; (........) = G ;
(----)=A)。图18-d与图Ha-d类似,但采用了不同的镁浓度((-)=IA IOG ;(-
.....)=IA 100G ; (----) = IA 1000G ; (-------) = A G ;(........)= G ;(-
---)=A)。图19-d与图Ha-d类似,但显示探针元件具有不同长度((----)=A ;
(........)=G ;(-------)= A G)。
9
图20a_b显示了与图20a相似的一式三份试验((----)=1 10000 ;
(........)=1 1000 ;(_______■)= 1 100 ;(----)= 1 10 ;(......)= A G;(_)
=G ;(........)= A)。图20a显示了探针元件的解链,而图20b显示了全扩增子解链。图21a_b显示采用折返引物扩增B-raf突变V600E扩增子的解链((____)
=野生型;(_______)= B-raf 突变;(_)= 1 1000 ;(......)= 1 100 ;(........)=
1 10 ;(----)= 1 1)。图21a显示了探针元件的解链,而图21b显示了全扩增子的解链。图22显示盲法研究B-raf突变的解链结果。图23显示采用折返引物扩增EGFR外显子19缺失的解链((---.)=野
生型;(-------)=缺失型;(----)=1 1 ;(......)= 1 10 ; (........)= 1 50;
(----)=1 100 ;(........)= 1 1000 ;(_.-·.·-)= 1 5000 ;(____)=
1 10000)。图M显示三种样品的标准化解链曲线的负导数(negative derivative)野生型 Dw(T),纯合突变型Dm(T),和比例混合样品Df(T)。标明了较低和较高温度的等位基因峰IY 和TH。利用(峰)幅度的差异a-e计算出突变型等位基因的占比Fm,作为两等位基因占比的加权平均估计值f OY) = a/d和f (Th) = c/e,其中权重系数& = a/(a+b)和wH = b/ (a+b)。然后计算出突变型等位基因的占比Fm = If OY)+wHf (Th) = (a2e+bcd)/(de(a+b))0图25的示意图显示含有与突变型(或占少数)等位基因和与野生型(或占多数) 等位基因二者错配的折返探针元件。若谨慎选择PCR延伸条件,聚合酶可以自由延伸超过不稳定的突变发夹,但野生型延伸受阻滞,导致突变型等位基因的富集。图26a_b显示采用5’外切核酸酶阴性聚合酶和折返引物PCR进行等位基因富集时,延伸时间(图^a)和Mg++浓度(图^ )的影响。占少数的等位基因的比例为 1 100(圆形)或1 1000(三角形)。在图^a中,野生型探针的Tm为75°C,并因此选择延伸温度为70°C,延伸时间从0到20秒不等,游离Mg++浓度为1. 2mM。在图^b中,所用的游离Mg++浓度为0. 8mM、ImM, 1. 2mM、1. 7mM、和2. 2mM,野生型探针的iTm分别为73°C、74°C、 75°C、76°C、和77。C,延伸温度为70°C时长0秒。延伸时间越短和Mg++浓度越低,则所得突变型等位基因的比例越高。实验一式三份进行,标明标准偏差。发明详述突变型等位基因未经等位基因偏向扩增的检测灵敏度经测定为约5% (Wall,M 等,美国人类遗传学会(American Society of Human Genetics),2007)。该研究涉及在基于多孔板的LIGHTSCANNER(爱达荷技术公司)设备上采用未标记的探针和高分辨率解链。 选择几种常见的多态性作为靶标并开发了未标记探针试验来测定几种随机DNA样品的基因型。对每个基因座,选择3份样品代表各种可能的基因型。定量测定代表纯合形式基因型的两个样品并按以下比例混合95 5、90 10,75 25,50 50,25 75,10 90、和 5 95。将未标记探针的解链曲线转变成导数峰,并计算探针在各解链温度下的峰高。该研究能区分两种等位基因低至5%的等位基因占比。然而,当占比低于5%时难以区分等位基因。LIGHTSCANNER 32 (LS32)是一种集成了快速PCR、实时监测、和高分辨率解链的新型复合仪器。可以在同一设备中无缝进行PCR和解链分析。用饱和双链DNA的结合染料, 例如LCGREEN Plus进行解链分析可鉴定片段中(例如,40-1000bp)的序列变化。此外, 例如采用LCGREEN染料和未修饰的寡核苷酸探针或折返引物,还能进行位点特异性基因分型(参见WO 2008/109823,其全文通过引用纳入本文)。也可采用其它探针系统,例如 SIMPLEPROBE、TAQMAN、HYBPROBE、和本领域已知的其它探针系统。其它示范性探针系统包括 PNA、LNA、或任何含有合成碱基类似物的探针、生物素标记探针、或任何序列依赖性对模板链有特异性亲和力使等位基因间产生Tm差异的杂交蛋白质/核酸或大分子或结构。此外, 尽管本文实施例中采用未标记探针实例为较长的未标记探针,可以采用不同长度的未标记探针以提供两个等位基因之间Tm的合适差异。可在同次运行中同时进行扩增子解链分型和基于探针的分型。LS32将PCR和高分辨率解链分型自动化成统一的“无人”系统。高分辨率DNA解链分析开发于2003年(参见美国专利7,387,887和7,583,429 号,已通过引用纳入本文)。正如名字所提示,该过程加热DNA并记录DNA双螺旋解开(或 “解链”)成两条单链时产生的信号。DNA具体如何解链取决于样本的DNA序列。在饱和染料的帮助下,可以区分样品之间DNA序列中单个位置的不同,即便长度超过800个碱基的片段。高分辨率解链是强有力的遗传分析技术。高分辨率解链的优点如下 一切都在溶液中完成(过程无需物理分离), 系统是封闭管(无污染风险),· PCR以外的成本极低(可采用标记的探针,但显著增加成本),和 方法简便(无需自动化、添加试剂、或中间纯化)。LS32集成了高分辨率解链与PCR,最多可分析32个样品,能够在15分钟内扩增, 随后进行自动化高分辨率解链。尽管本发明公开考虑到有其它系统可进行快速循环然后进行高分辨率解链,LS32非常适用于本方法并在本文中许多实施例中用作示范性仪器。实施例1.采用高分辨率解链进行基因分型。采用以下引物和探针扩增疟疾恶性疟原虫(P. falciparum) CRT基因pfCRT 正向-5,TTCTTGTCTTGGTAAATGTGCTCA (SEQ ID NO. 1)pfCRT 反向-5,CGGATGTTACAAAACTATAGTTACCAAT(SEQ ID NO. 2)pfCRT 探针-5,GTGTATGTGTAATGAATAAAATTTTTG-C3 阻断剂(SEQ ID NO. 3)探针中,带下划线的碱基为SNP位点,所显示的是与野生型匹配的碱基。尽管显示了 5个SNP位点,但本研究中仅采用了 4个。对于疟疾恶性疟原虫CRT基因3D7的两个突变株(7G8and Dd2),按初始95°C保持 15秒,然后95 °C下2秒和58 °C下15秒扩增55轮,测得的温度变化速率约为4_6。C /秒。热循环后,样品95°C保持2秒,然后以10°C /秒的温度变化速率冷却至400C保持30秒。从45°C 到88°C解链,温度变化速率为0. 3°C /秒,连续采集数据。探针解链的结果如图1所示(未显示扩增子的解链)。探针设计为与野生型等位基因的各基因座理想匹配(密码子72、75和 76)。因此,样品3D7(----)显示了该探针可能的最高解链峰(Tm)。样品7G8(------)在72 (TT错配)和76 (CT错配)位与探针错配。样品Dd2、Vl/S、和FCR3 (-.-·-·■)基因型相同 (见下文测序结果),且在75 (75位密码子的第一和第三碱基GT和AA错配)和76 (CT错配)
位与探针错配。若样品仅在一个碱基位点与探针错配,解链峰将在(......)和(----)峰
之间。若样品在所有4个位点与探针错配,则预计解链峰低于(-·-·-·-)峰。实施例2.低(含量)等位基因占比的检测。采用前述引物和探针扩增疟疾恶性疟原虫(P. falciparum)CRT基因。制备了含有不同比例野生型和上述7G8突变型的混合物。根据观察到的未标记探针的Tm(野生型和突变型等位基因分别为62°C和), 采用58°C退火温度(低Tm+l/2ATm)诱导一系列稀释度的混合样品中突变型等位基因的等位基因偏向扩增。在LS32上进行快速循环(温度变化速率为6-10°C),结果如图2所示。 这一方案得到的等位基因偏向扩增因子约为10X(倍),能够区分低至0. 75-1. 5%的突变型等位基因。其它实验证实了这种发现,能够区分到低至约0. 1%。尽管所采用的退火温度在两个Tm间约一半处,应当理解也可采用能使错配探针靶标与匹配探针靶标杂交物相比不成比例失稳定的任何温度。这可能发生于各种情况,取决于各探针的相对Tm值、所用的退火温度程序、转变速率(特别是50°C -80°C范围内)、和聚合酶的温度依赖活性。例如, 退火温度比错配探针靶标杂交物的较低Tm高至少1.01,更好高至少2.01。还发现,退火温度等于或稍低于探针与错配等位基因的Tm时,能充分降低错配探针靶标的结合以偏向扩增等位基因。不受限于任何具体理论,预计聚合酶的活性可能受到探针结合(在此示范性实施例中为野生型)的负面影响,而Tm较低的等位基因(在此示范性实施例中为突变型)的扩张则不受阻碍。如实施例4所示,优选采用缺乏5’一 3’外切核酸酶活性的eX0_聚合酶、例如KLENTAQ。然而,应当理解可以采用存在探针结合时受到阻碍的任何聚合酶。此外,受到阻碍是指扩增可产生,但效率降低,例如,匹配的等位基因的扩增效率降低10%或更多,再例如,降低50 %或更多。当用同一方法在标准热模块循环仪(温度变化速率为1. 5-2. O0C )上进行退火温度设置时,未观察到等位基因偏向扩增。推测这是由于退火和变性温度之间转变速率较慢, 为在稍高于野生型Tm的温度下进行延伸提供了额外的时间。因此,需要联用优先偏向探针与优势等位基因杂交的退火温度、因结合探针的存在而受阻碍的聚合酶、和充分快速加热的温度变化速率的组合,例如不含专设的延伸保持(通常为约72°C ),使得这种联用优先扩增较少的等位基因。实施例3.热循环温度变化速率的影响。本实施例中采用传统的模块热循环仪,温度变化速率在1. 5-2. 0°C。图3显示
了疟疾CRT野生型3D7株(---)、突变型7G8株(-·-·-·-)、和含等比例等位基因的杂合
子在聚合酶的存在下,经95°C保持2分钟初始变性,然后通过55轮94°C 30秒、 50-68°C之间(50°C、51. 4°C >53. 6°C >56. 8°C、61. 4°C >64. 6°C >66. 8°C、和 68°C ) 30 秒的梯度退火步骤,即各样品采用94°C变性温度和一种不同的退火温度进行循环。图3显示,尽管采用了 8种不同的退火温度,未发现优先扩增Tm较低等位基因产生的杂合子。采用56.8°C和61.4°C的退火温度(预计最大等位基因偏向扩增在该范围内) 扩增的四个样品显示为(-------_),它们与其它杂合子的结果基本不能相区分。
12
其它实验显示,6°C /秒的温度变化速率对目前进行的基本所有试验都产生了满意的结果。尽管各试验会有差异,对于大多数试验,预期至少为4°C的温度变化速率应该是充分的速率,而很多试验在为2. 0°C或更低的温度变化速率时不能显示等位基因偏向扩增。 还应当理解,只要在达到程序预定的退火温度之前,在较高温度下引物充分稳定而开始杂交和聚合酶有延伸活性,那么变性温度与退火温度之间的冷却速率即可产生偏向扩增。实施例4.低(含量)等位基因占比的检测。研究了与采用无外切活性()的聚合酶(Klentaq+eEnzyme抗体)相比,采用外切阳性(exo+)聚合酶(NEB Taq)的影响。用下列引物和探针扩增p53外显子8的99bp片段p53x8 正向CTACTGGGACGGAACAGCTT (SEQ ID NO. 4)p53x8 反向GTGAGGCTCCCCTTTCTTG (SEQ ID NO. 5)p53x8 prbl 探针TGAGGTGCgTGTTTGTGCCTGTC (SEQ ID NO. 6)探针3’端有三碳间隔臂以阻断延伸,观察到的Tm约为75°C。突变型在第9位碱基错配,上文用小写的“g”表示(G_>T),观察到的Tm约为69°C。
图4a显示了野生型(----)、突变型(-·-’-·_)、和等比例等位基因混合的杂合子(......)
在具有exo+聚合酶存在下的扩增,95°C保持2分钟初始变性,随后94°C 30秒、63_73°C之间梯度退火温度(各样品的退火温度稍有不同)30秒、和77°C延伸,共55个轮。图如显示,尽管采用了 8种不同退火温度,未发现优先扩增Tm较低等位基因产生的杂合子。样品 (-------)的退火温度为69°C,仍未显示偏向扩增。图4b显示的反应与图如所示相似,但采用exo_聚合酶。这些实验平行进行且运行方案与图如所示完全相同。由图4b可见,偏向扩增突变型等位基因。因此,需要采用受
到探针杂交影响的,例如exo—聚合酶,或其它聚合酶。样品(-------)对应于69°C,在本实
施例中,其提供了最佳的等位基因偏向扩增。实施例5.退火温度分析。在本实施例中,研究了退火温度的影响。本实施例中使用的靶标是人PAH外显子 11。采用人基因组DNA,浓度为15ng/反应,使用下列引物和未标记探针。正向引物AAGACAGCCATCCAAAATTACAC (SEQ ID NO. 7)反向引物TTTGTCACCACCTCACCTTACTT(SEQID NO. 8)探针GAGTTCCAGCCCCTgTATTACGTG-C3阻断剂(SEQ ID NO. 9)采用上述引物扩增得到105bp的扩增子。G/C SNP rs772897以小写字母表示。在
所有这些实施例中,高Tm的纯合子表示为(-·-·-·-),杂合子(50 50混合)表示为(......),
和低Tm的纯合子表示为(----)。图fe-c显示了在iCycler (伯乐公司(Bio-Rad))中以下列循环条件扩增的结果 95°C保持2分钟初始变性,随后94°C 30秒和XV 30秒,共55轮循环,其中X是60_72°C之间的退火温度,增量为1°C ;即各样品用94°C的变性温度和一种不同退火温度进行循环,温度变化速率为1.5-2.0°C/秒。PCR之后,95 °C解链30秒,然后28 °C 30秒形成异质双链。所得扩增子在 LIGHTSCANNER上以标准加热速率从45°C加热到95°C解链。如图恥所示,无论采用哪种退火温度,杂合子都显示基本平均的解链峰,表明没有偏向低Tm等位基因。如上文讨论的,据信1. 5-2. O0C /秒的温度变化速率对一些试验可能太低,使得未标记探针从高Tm等位基因上解链从而得以延伸。注意到该试验有时导致某些非特异性扩增,如图5c中阴性对照所示 (菱形)。非特异性扩增通常导致交叉点推迟且扩增曲线的荧光较低,以及在导数解链曲线中缺少适当的解链峰。图6a_c显示了以约4_6°C /秒的扩增温度变化速率快速循环扩增同一靶标的结果,采用60°C的退火温度。观察到较低Tm等位基因的Tm约为67X,而较高Tm等位基因的 Tm为约72°C。因此,600C的退火温度在较低Tm等位基因解链峰的极低端,且远远低于较高 Tm等位基因的全峰。如图6b所示,低Tm纯合子和杂合子显示的解链曲线几乎相同,而高 Tm纯合子显示主要为非特异性扩增,表明完全偏向低Tm等位基因并基本消除了所有高Tm 等位基因的扩增。图7a_c显示采用62°C退火温度获得的相同结果。然而,尽管低Tm纯合子和杂合子显示的解链曲线几乎相同,在70°C时杂合子可见一个很小峰,且高Tm纯合子显示有一些扩增。高Tm等位基因的交叉点迁移约6. 5个循环。检查高Tm等位基因的解链峰显示62°C 小面积的解链峰。因为杂交是动态平衡,据信一些百分数的探针会从高Tm等位基因上解链,即使在62°C时,因而允许有一些最低限度的扩增。由于探针与高Tm等位基因的结合很稳定而强烈偏向低Tm等位基因。图fe-c显示采用64退火温度的相同结果。高Tm等位基因的扩增被推迟,但不如采用62°C的退火温度那么多(约4个循环对约6.5个循环)。杂合子中,70°C有一个小的但易区分的解链峰,显示对杂合子中的Tm较高的等位基因有一定扩增。图9a_c显示采用65退火温度的结果。高Tm纯合子的扩增仅退迟了约2. 5个循环,而杂合子在70°C显示更明显的峰。仍强烈偏向低Tm等位基因。图IOa-C显示采用67退火温度的结果。该退火温度位于两个Tm值之间的一半处。 高Tm纯合子的扩增仅推迟了约1. 5个循环。而杂合子清晰显示70°C有解链峰,仍强烈偏向扩增低Tm等位基因。图lla-c显示采用68退火温度的结果。高Tm纯合子的扩增仅推迟了约0. 6个循环。杂合子清晰显示出70°C有解链峰,但65°C的峰仍较大。图Ih-C显示采用69退火温度的结果。该退火温度比高Tm等位基因的Tm仅低 1°C。高Tm纯合子的扩增仅推迟了约0.7个循环。解链峰显示仍偏向扩增低Tm等位基因。图13a_c显示采用70退火温度的结果。该退火温度与高Tm等位基因的Tm几乎相同。高Tm纯合子的扩增仅推迟了约0.4个循环。解链峰显示只略微偏向扩增低Tm等位基因。由于该实施例中引物的Tm,采用显著高于70°C的退火温度难以得到扩增。若延伸引物以提高其Tm,预计超过但接近高Tm等位基因Tm的退火温度仍可能干扰高Tm等位基因的扩增,而不干扰低Tm等位基因的扩增,只要退火温度在高Tm解链峰的曲线之下。在一些实施方式中,可能只需要检测等位基因中非常少的低Tm等位基因的存在。 该情况下,可能需要低的退火温度,如图6b或6b所示。在其它实施方式中,可能需要选择偏向低Tm等位基因但仍能扩增高Tm等位基因的退火温度。这样的实施方式中,可能需要等于或稍高于低Tm等位基因Tm的退火温度,如9b或IOb所示。根据具体的试验,可能需要其它程度的等位基因偏向。在一种实施方式中,采用突变型等位基因的Tm,通过运行50 50的野生型突变型混合样品来确定某具体试验的退火温度。若存在等位基因偏向扩增,可观察到野生型峰的降低。若野生型峰未显著降低,可以降低退火温度,例如以2°C的幅度,然而也可采用其它幅度,并重新运行该样品混合物直至发生野生型等位基因的完全消失。通常需要采用稍高于该消失温度的退火温度。因此,优化的退火温度可以示范性地为高于消失温度2°C。 退火温度是否可用所需灵敏度水平的突变型等位基因的系列稀释液在野生型等位基因存在下来证实。实施例6.采用折返引物的偏向扩增等位基因本实施例中,利用rsl49041370含有A/G改变的SNP来研究采用折返引物富集等
位基因。采用Puregen (简特拉系统(Gentra Systems))中的DNA分离试剂盒从人血中提取DNA。通过NanoDrop (热科学公司(Thermo kientif ic))和PCR的交叉点定量测得DNA 浓度。应当理解,相同的PCR交叉点表明DNA模板浓度相同。使用以下引物正向引物AGCTCAGAACTGCCTGGTGT(SEQID NO. 10)反向引物acGTTCTTTGCAeAACTGGCTGGtctctgggctgtccacacctgaa(SEQID NO. 11) 探针元件在反向引物中以大写字母表示,SNP位点在其中以下划线表示。引物为反向引物 3’端的23bp部分。在反向引物5’端两个以小写字母表示的碱基是错配的,可防止探针元件结合在互补的扩增子上时的延伸。反向引物尾是G等位基因的理想互补。扩增子大小为 133bp。PCR 以 10 μ 1 的反应体积进行,包含 1. 5、2、或 3mmol/L MgCl2、50mmol/L Tris (pH 8. 3)、500mg/L牛血清白蛋白、200ymol/L各dNTP、0. 4单位KLENTAQ聚合酶(AB肽公司(AB Peptides)) ,64ng/μ 1 Ati-Taq 单克隆抗体(易酶公司(eENZYME))、0· 5x LCGREEN Plus、 0. 05 μ m正向引物、0. 5 μ m折返引物(反向)、和50ng人基因组DNA。PCR在LIGHTCYCLER(罗氏(Roche))中进行,95 °C变性(保持0秒)、63 °C退火(保持0)、和63 °C延伸(保持2秒),共 70轮。PCR后,从LIGHTCYCLER中取出毛细管样品,放入高分辨率解链仪器HR-I (爱达荷技术公司),并从60°C至92°C以0. 5°C /秒的变化速率解链。应当理解,这种使用LIGHTCYCLER 的PCR方法再用HR-I解链的过程相当于在LS32中扩增并进行PCR后的解链。LIGHTCYCLER 中的温度变化速率与LS32仪器中的快速循环相当。采用指数背景消减(参见美国专利申请第2009-0222503号,其通过引用纳入本文)将解链曲线标准化,并用Savitsky-Golay拟合(Palais R和Wittwer CT. Methods Enzymol 2009 ;454 :323-43)求微分。在一种实施方式中,通过如图M所示的加权峰高计算具体方案的等位基因占比。具体而言,Dw(T)为野生型样品标准化解链曲线的负导数,Dm(T) 是50 50纯合突变型样品的标准化解链曲线的负导数,和Df(T)是两者比例混合物的标准化解链曲线的负导数。若折返探针元件与野生型等位基因匹配,Dffl(T)将在低的温度IY出峰,Dw(T)则会在高的温度Th出峰,IY <TH。Df(T)通常显示在IY处与错配的等位基因解链和在Th处与匹配的等位基因解链相对应的两个峰。突变型等位基因的占比按两项评估的加权平均计算Fm = wLf (Tl) +wHf (Th),其中&和Wh是权重,f (Tl)和f (Th)是各温度的峰的各估计值。根据混合样品在未混合样品基线上超过较大峰的幅度确定权重= a/(a+b)and wH = b/(a+b)(图Μ)。得到的各估计值f ΟΥ)和f (Th)在各温度下成比例:f(TL) = a/dm f(TH) =c/e。因此Fm= (a2e+bcd)/(de(a+b))0应当理解,若改变方案影响到杂合子的峰高(例如,改变退火温度、Mg++浓度、延伸时间等),a、b、c、d、和e的值将改变,等式对特定的50 50杂合子曲线形状有效。因此,该等式提供了调整以计算返回各等位基因的起始浓度。应当理解,可用本方法或其它方法,例如通过与系列稀释液比较,计算出本文所述任何实施方式的等位基因占比。其他方法是本领域已知的。参加美国专利申请第2003-0104438 号,其通过引用纳入本文。在下面实施例9中提供关于等位基因占比计算方法的其它信息。PCR过程中稀有等位基因富集的效果1.变性温度采用95°C、90°C、89°C或88°C的变性温度进行PCR。如图Ha-d所示,变性温度95°C相对于90°C不影响错配峰的富集。88°C的变性温度太低,且模板没有扩增好。2.退火温度在图lfe-d中,变性温度维持在95°C,且延伸温度为76°C,而退火温度为551、581、611、或631。如采用未标记探针所见,当延伸温度保持在接近匹配等位基因的Tm时,退火温度对于等位基因扩增比例没有任何影响。3.延伸温度在图16a_d中,变性温度维持在95°C,且退火温度为63°C,而延伸温度为741、721、701、或681。如采用未标记探针所见,延伸温度越低(直至温度接近匹配探针的Tm),扩增越富集错配的等位基因。4.延伸时间图17a_b显示延伸时间缩短,从5秒减至1秒,错配等位基因得到显著富集。采用68°C延伸温度和1秒延伸时间,1 1和1 10混合物的扩增产物中主要是A等位基因,且1 100混合物的扩增产物中各等位基因各约50%。1 1000混合物明显不同于纯G等位基因。因此,等位基因富集程度与PCR延伸时间密切关联。如图26a所总结,延伸时间为20秒(常规PCR的典型时间)时,未能充分富集含突变型野生型比例为1 1000的样品用于检测。然而,随着延伸时间的缩短,这些稀有等位基因变得易于检测。在延伸时间为0秒的极端情况下,得到的突变型等位基因的占比从0.1% (1 1000) 增至四%。缩短延伸时间对灵敏度的改善具有加速PCR完成的额外优点,例如可加速到仅需20-25分钟( 20秒/循环)。5. Mg浓度在图18a-c中,采用上述第4步的循环条件,且Mg浓度为1. 5mM、2mM 和3mM。最低的镁浓度(1.5mm Mg缓冲液)在1 1000中提供了稀有等位基因的良好扩增。最高的镁浓度看来导致主要和次要等位基因的扩增基本相同。图26b总结了采用 2.2福-0.8!111范围的游离1%++浓度、1 1000比例的突变野生型模板的进一步研究。随着Mg++浓度降低,突变型占比显著增加,从不可检测增至48%。一种解释可能是较低的Mg++ 浓度可能提高杂合子扩增,因此提高了异质双链体的比例。另一种解释可能是较低Mg++浓度下突变等位基因不形成发夹,从而使突变等位基因更易扩增。6.尾长改变尾长(探针元件),采用 9bp CTm 64 °C )U3bp(Tm72°C )U7bp(Tm 74°C)和21bp(Tm 77°C )。较长的尾Tm较高,且如图19a_d所示,较高的Tm富集错配等位基因。当采用较短的尾,可以通过降低延伸温度低于匹配等位基因的Tm,获得对较少等位基因的富集。图14-19所示结果与前述未标记探针所得结果一致。在本实施例中,但当采用所选延伸温度时,大多数或所有匹配探针元件结合,而大多数错配探针元件解链,因而优先扩增错配的等位基因。图16显示,随着延伸温度降低,越发偏向错配等位基因的扩增。此外, 在本实施例中,还发现采用折返引物时,较短的延伸时间和较低的Mg浓度有利于错配等位
16基因的扩增,例如可以分析1 1000或甚至更高比例的DNA,如图20所示。预期这些效果也可见于采用未标记探针和本发明的其它探针。不受限于任何具体理论,据信出于上面讨论未标记探针的原因,采用折返引物有利于扩增错配的等位基因。然而,由于折返引物形成分子内环结构,据信匹配的探针区段在与另一靶序列的分子间相互作用中或当该环位于下游(如采用上述正向引物进行扩增子的扩增那样)时不仅会干扰延伸,而且会干扰折返(反向)引物与成环扩增产物的退火。图 25显示了通过折返引物富集等位基因的可能机理。折返探针元件与突变等位基因错配,使发夹失稳且使聚合酶能展开二级结构并完成全长PCR产物的延伸(图25,左图)。然而,折返探针元件与野生型等位基因完全匹配,由更稳定的发夹阻断了延伸并防止形成全长PCR 产物(图25,右图)。由于差异扩增取决于由单个错配引起的发夹的相对稳定性,成功的富集可能取决于扩增条件,包括聚合酶的置换活性、与发夹稳定性及延伸时间相关的退火温度。据信,折返引物偏向扩增错配等位基因的程度可能大于未标记探针。最后,已发现采用折返引物与采用未标记探针相比,exo+聚合酶与等位基因富集更相容。这可能是由探针元件5’错配导致的。实施例7.采用折返引物的盲法肿瘤鉴定。甲状腺结节相当常见,可见于约5%的女性和的男性,其中超过90%为良性的增生性结节或滤泡性腺瘤。若是恶性,诊断通常为乳头状甲状腺癌(papillary thyroid carcinoma, PTC) 15种涉及原癌基因RET ( 一种酪氨酸激酶)的嵌合mRNA中的一种常被认为是PTC的病因。髓甲状腺癌和乳头状甲状腺癌都与RET基因的激活突变紧密相关。在 20-40%的PTC病例中存在由于染色体反转或易位导致的RET重排。然而,近来BRAF基因的体细胞突变c. 1799T > A导致缬氨酸取代为谷氨酸p. V600E,被认为是PCT中最常见的改变,造成80%以上的甲状腺癌。这一氨基酸取代导致促分裂原活化的蛋白激酶(MAPK)途径的组成型激活和去调节。本实施例中,研究了 B-raf突变V600E(T — Α)的点突变。采用Puregen (简特拉系统)中的DNA分离试剂盒从人细胞系HTB-72 (ATCC)中提取B-raf V600E纯合突变DNA。通过NanoDrop (热科学公司(Thermo Scientific))定量测得DNA浓度并用PCR交叉点调整。由ARUP (犹他州盐湖城)提供47对预试的肿瘤组织和针头甲状腺结节DNA样品进行盲试(Leslie R Rowe等,CytoJournal 2006,3:10)。采用下列引物,标识与实施例6相同正向弓丨物tgttttcctttacttactacacctcag(SEQ ID NO. 12)反向弓丨 *:aaTCTAGCTACAGIGAAATCTCGATGtcagtggaaaaatagcctcaattc(SEQ ID NO. 13)扩增子大小为l^bp。PCR 以 10 μ 1 的反应体积进行,包含 2mmol/L MgCl2、50mmol/L Tris (pH8. 3)、 500mg/L牛血清白蛋白、200 μ mo 1/L各dNTP、0. 4单位的KLENTAQ聚合酶(AB肽公司)、64ng/ μ 1 Ati-Taq单克隆抗体(易酶公司)、0· 5xLCGREEN Plus、0. 05 μ m正向引物、0. 5 μ m折返引物(反向)、和50ng人基因组DNA。PCR在LIGHTCYCLER(罗氏)中进行,95°C变性(保持 O秒)、52°C退火(保持0)、和64°C延伸(保持0秒),共70轮。PCR后,从LIGHTCYCLER中取出毛细管样品,放入高分辨率解链仪器HR-I,并从60°C至88°C以0. 5°C /秒的变化速率解链。
为了比较,在标准的对称PCR中采用上述相同的正向引物和反向引物的引物元件 (tcagtggaaaaatagcctcaattc (SEQ ID NO. 14))扩增 183bp 的扩增子。采用该标准 PCR,可以检测1 25比例的B-raf突变野生型,而上段所述折返引物PCR方案可富集PCR以便检测1 100(图21a-b)。采用测序证实了结果。盲法分析后,所有样品是相一致的,除了 2个样品用折返引物呈阳性但用杂交探针呈阴性外。一个针头样品的V600E含量低于1%。这么小的频率不能用标准PCR检测,但
如图22中(-----)线((_ — — _)为1 100对照)所示,这可以通过折返引物富集检测。实施例8.采用折返引物检测小的缺失。已经在患有非小细胞肺癌(NSCLC)的患者中检测出表皮生长因子受体(EGFR)的体细胞突变,它们与用药物Gefitinib或Erlotinib治疗的敏感度相关。两种最常见的体细胞EGFR突变是外显子19小的缺失和L858R点突变(占约85% )。在本实施例中,采用 EGFR外显子19证明折返引物富集方法可以检测小的缺失。采用Puregen (简特拉系统)中的DNA分离试剂盒从人细胞系CRL-5883 (ATCC)中提取 EGFR纯合突变 E746-A750DNA。通过NanoDrop (热科学公司(Thermo Scientific))定量测定DNA浓度量并用PCR交叉点调整。采用下列引物,标识与实施例6相同正向引物TGGATCCCAGAAGGTGAGAA(SEQID NO. 15)反向引物ccAGAGAAGCAACATCTCCGAAAGagcagaaactcacatcgagga(SEQID NO. 16)同上,探针元件与野生型匹配。在野生型中,野生型扩增子的大小为131bp。研究了几种缺失,其探针元件有部分重叠。PCR 以 10 μ 1 的反应体积进行,包含 2mmol/L MgCl2、50mmol/L Tris (pH8. 3)、 500mg/L牛血清白蛋白、200 μ mo 1/L各dNTP、0. 4单位的KLENTAQ聚合酶(AB肽公司)、64ng/ μ 1 Ati-Taq单克隆抗体(易酶公司)、0· 5xLCGREEN Plus、0. 05 μ m正向引物、0. 5 μ m折返引物(反向)、和50ng人基因组DNA。PCR在LIGHTCYCLER(罗氏)中进行,95°C变性(保持0 秒)、55°C退火(保持0)、和64°C延伸(保持0秒-在该温度下检测每个样品保持0. 2V ), 共70轮循环。PCR后,从LIGHTCYCLER中取出毛细管样品,放入高分辨率解链仪器HR-I (爱达荷技术公司),并从60°C至88°C以0. 5°C /秒的变化速率解链。在本实施例中,缺失导致解链峰显著分离且所采用的退火和延伸温度都基本低于整个野生型峰。如图23所示,通过折返引物富集PCR可以容易地区分(甚至突变型为稀有等位基因与野生型DNA比例为1 10000的)EGFR外显子19缺失E476-A750与野生型。实施例9.确定等位基因占比的方法PCR产物在DNA染料存在下解链时,测得原始荧光R (T)对温度T的依赖性包含两种主要组成。对于饱和的、插入型(高分辨率)染料,M(T)与温度T时呈双链dsDNA状态的DNA总量呈密切正比。其余的原始荧光B(T),例如,可通过指数衰减模拟,特别是在当前感兴趣的温度方案中,即,那在短的寡核苷酸(未标记或折返)探针变性成其无规卷绕形式的温度方案中。例如,用指数背景减除方法(参见美国专利申请第2009-0222503号,其通过引用纳入本文)去除B(T)后,将M(T)按比例标准化并去除背景荧光F(T)、例如在
范围内,所得曲线通过凸面组合(即非负系数之和,其总和等于1)很好地近似于两态范特霍夫热力学解链曲线这些B(T)和F(T)的模型在文献(Palais R和Wittwer CT, Methods
18in Enzymology 454 :323-43,2009)中都有描述。在本文所提供的示范性实施方式中,可以在探针解链温度方案中通过减少参与反应的物质数量而显著简化所述模型。由于采用了探针,例如未标记探针和折返引物,天然双等位基因二倍体杂合子中四种可能的双链只正常产生两种,而在该探针温度范围的解链曲线中存在合成的扩增子解链混合物。由此,F⑴为凸面组合F(T) = cM Fm (T)+Cff Fff(T),S卩,其中等位基因占比的非负系数 和 满足cM+cw= 1。通过线性微分,适当标准化解链曲线的负导数曲线D(T)为对应于两种双链体(例如,探针与WT和探针与MUT)的类似限定并标准化的负导数曲线的凸面组合。D(T) = -F,(T) = cM Dm(T)+Cff Dff(T)。因此,如图2所示,负导数显示两个峰,其幅度可通过下文所述几种方法之一测量,并反映了两种产物的相对比例,推测其一与探针匹配(以反义互补序列),另一 Tm较低的含有某些错配。在此,称前者为WT后者为MUT,但是应当理解理想匹配不总是野生型等位基因而错配的等位基因可能不总含有突变。重要的告诫是,对于初始模板占比的定量问题,需要关于扩增的相对效率的信息来评估初始等位基因的频率。如上面多个实施例所示,可扩增两个含有相同初始等位基因比例的样品,而不同水平地选择性富集特定等位基因,导致测定的产物最终等位基因比例非常不同。相反,初始比例不同的样品可能产生相同比例的最终产物,例如,若采用适当的差异性扩增方案。本文所述方法以外,也可采用,例如制备系列稀释液的标准曲线等方法, 及各种理论方法,在任何具体的可重现扩增方案(例如延伸时间,镁浓度)中,从最终产物的比例转变而获得初始模板的比例。在计算等位基因占比的一种示范性方法中,用Da(T)标示样品的标准化解链曲线的负导数,下标a表示野生型(W)、纯合突变型(m)、或两者的比例混合物(f)。若折返引物 (或未标记探针或其它探针)与野生型等位基因匹配,纯突变型的负导数曲线Dm(T)将在 Tl显示峰而纯野生型的负导数Dw(T)将在Th显示峰,其中L为较低而H为较高即IY < Tho (应当理解若折返引物与突变型等位基因匹配,则可以简单地互换下面IY和Th的作用)比例混合物的负导数曲线Df(T)通常显示为对应于折返引物解链的双峰,其一来自较低温度 IY下的错配等位基因,另一来自较高温度Th下的匹配等位基因。当等位基因混合物比例远远偏离等数时,较少等位基因在相应温度处出弱峰或完全没有峰。考虑到这一情况,突可以采用两个估值的加权平均来定量变型等位基因。Fm = wLf (Tl)+wHf (Th),分别在这些解链温度之一处得至Ij。each obtained at one of these melting temperatures.通过混合样品的幅度相对高于在其它温度解链的未混合样品的基线,可确定各温度峰的权重wL = (Df (Tl) -Dw (Tl) ) / (Df (Tl) +Df (Th) - (Dw (Tl) +Dm (Th)))(在图 24 中=a/ (a+b)和wH = (Df (Th) -Dm (Th) ) / (Df (Tl) +Df (Th) - (Dw (Tl) +Dm (Th)))(在图 24 中=b/ (a+b))权重为正值,其和为1,并且它们偏向更清晰明确的峰。
可通过将 (10线性插入在两种温度WDw(T)与0 1(10之间,获得各估计值f (ιγ)、 f(TH)f (TL) = (Df (TL) -Dw (TL)) / (Dm (TL) -Dw (TL))(在图 24 中=a/b)和 f (Th) = (Df (Th) -Dw (Th) ) / (Dm (Th) -Dw (Th))(在图 24 中=c/e)在混合物为纯野生型,使得Df = Dw的极端情况下,我们发现f (IY) =0且f(TH)= 0,还有ι = 0且% = 1,所以Fm = 0。在混合物为纯突变型,使得Df = Dffl的极端情况下, 我们发现 f (Tl) = 1 且 f(TH) = 1,还有 Wl = 0 且 Wh= 1,所以 Fm = Wl+Wh= 1。综合起来,就图M中的定量测定而言,Fm = a/ (a+b) (a/d) +b/ (a+b) (c/e) = (aae+bcd) / (de (a+b))如上文实施例6中所讨论的那样。可以用权重的选择来消除一些由于探针从错配模板到匹配模板的重退火和解链过程中的非线性影响。尽管本例和提供的其它示范性实施例使用了两种等位基因,应当理解这些等式概括到超过两种等位基因的混合物是直截了当的。一种替换的实施方式是仅采用与较高的峰相关的值,即,a/d或c/e。在这种实施方式中,应当理解3和C直接相关,并因此仅使用这些值中的一个。另一种替换方式在实验方案中包括包括天然的杂合样品(HET),采用设计的扩增条件,以产生基本上相等于上述定量程序的产物峰,内插样品峰和WT与MUT的那些峰使样品的相对幅度反向内插到0. 5-1之间,而上文为0-1之间。例如f (Tl) = 0. 5+0. 5 (Df (Tl) -Dh (Tl) ) / (Dm (Tl) -Dh (Tl))f (Th) = 0. 5-0. 5 (Df (Tl) -Dh (Tl) ) / (Dw (Tl) -Dh (Tl))并分别用HET和MUT在 γ的峰以及HET和WT在Th的峰估算突变型等位基因占比。作为校验,若Df = Dh,两个等位基因占比都是0. 5,若Df = Dw,突变型等位基因占比为 0. 0,若Df = Dm,突变型等位基因占比为1. 0。例如,这些值可以完全按前文所述加权。任选地,这些值可以按上述等式加权,或者可以给予较高峰对应的值以完全权重。可用其它方式确定a、b、C、d、e各值。除了简单地寻找温度及相应的逐点 (pointwise)最大值的相应值,可采用二次拟合法来拟合各峰,获得最高峰二次拟合的温度和最高点值,和相同温度时其它曲线拟合的值。此外,峰高可用含各峰(例如可采用上述定位峰方法之一)温度区间内相应曲线之间的面积替代,例如,可用最高峰衰减至Ι/e(天然指数衰减系数)乘以其最大值的积确定峰宽。与美国专利申请第2003-0104438号中的TMBSP定量方法类似,下文描述的方法基于热力学。然而,本文所述的示范性方法为非迭代的。相反地,本文所述方法快速且易于实施,并保留了高度精确性。还包括基于简单的通过范特霍夫导数曲线的凸面组合进行D(T) 的Levenberg-Marquardt最佳非线性最小二乘法拟合,将与两种双链体(探针与WT和探针与MUT)各自相关的热力学参数ΔΗ与AS视作除等位基因占比以外的变量。还可以由已知的序列和最近邻参数(nearest-neighbor parameter)(包括在标准实验条件下采用高分辨率解链得到的专用参数)设定这些值,这种情况下拟合简化为两参数线性最小二乘法问题。
基于热力学的非线性最小二乘法(Thermodynamically based nonlinear least squares, TMBNLS)获得D⑴对六个未知参数cM、Δ ΗΜ、Δ SM、cw、Δ Hw、Δ Sff的最佳非线性最小二乘法拟合D(T) = cM D ( Δ Hm, Δ SM) +cff D ( Δ Hff, Δ Sff) ·在此,D(AH,AS)是分析范特霍夫解链曲线的负导数,由两个参数Δ H禾Π Δ S禾口具体的实验条件唯一地确定。采用Levenberg-Marquardt算法进行拟合。基于热力学的最小二乘法(Thermodynamically based least squares, TMBLS) 获得D(T)对两个未知参数cM、Cff的最佳线性最小二乘法拟合D(T) = cM D ( Δ Hm, Δ SM) +cff D ( Δ Hff, Δ Sff)在此,D(AH,AS)是分析范特霍夫解链曲线的负导数,由两个参数ΔΗ和AS和具体的实验条件唯一地确定。在标准实验室条件下的高分辨率解链获得的已知四分子参数,采用最近邻求和指定参数ΔΗμ、Δ Sm、ΔΗ 、ASfftj采用2x2矩阵系统的正规方程进行该拟合。尽管参考优选实施方式对本发明作了详细描述,但可在本发明范围和精神内按下列权利要求中所述和定义作出变动和修改。
2权利要求
1.一种扩增和检测生物样品中等位基因的方法,其中所述生物样品包含靶核酸的第一等位基因和第二等位基因,存在的第一等位基因浓度高于第二等位基因,该方法包括以下步骤在生物样品中加入热稳定性聚合酶、探针和为扩增生物样品中靶核酸设置的引物对, 其中设置的探针与靶核酸杂交,所述探针与第一等位基因杂交时具有第一 Tm,与第二等位基因杂交时具有第二 Tm,其中第一 Tm高于第二 Tm,通过在变性温度与退火温度之间的热循环扩增生物样品中的靶核酸,其中退火温度低于第一 Tm,以及检测第二等位基因。
2.如权利要求1所述的方法,其特征在于,所述退火温度在第二Tm与第一 Tm之间约一半处。
3.如权利要求1-2中任一项所述的方法,其特征在于,所述退火温度比第二Tm至少高1.0°C。
4.如权利要求1-3中任一项所述的方法,其特征在于,所述退火温度比第二Tm至少高2.0°C。
5.如权利要求1-2中任一项所述的方法,其特征在于,所述退火温度大约等于第二Tm。
6.如权利要求1-5中任一项所述的方法,其特征在于,所选择的退火温度应使单链平衡偏向错配的探针扩增子杂交,超过匹配的探针扩增子杂交。
7.如权利要求1-6中任一项所述的方法,其特征在于,所述热循环包括退火和变性温度之间的温度变化速率至少为4°C /秒。
8.如权利要求7所述的方法,其特征在于,所述热循环包括退火与变性温度之间的温度变化速率至少为6°C /秒。
9.如权利要求1-8中任一项所述的方法,其特征在于,所述聚合酶是不具无外切活性的exo—聚合酶。
10.如权利要求1-9中任一项所述的方法,其特征在于,所述第二等位基因的等位基因占比为5%或更低。
11.如权利要求1-110中任一项所述的方法,其特征在于,所述第二等位基因的等位基因占比为3%或更低。
12.如权利要求1-11中任一项所述的方法,其特征在于,所述第二等位基因的等位基因占比为1.5%或更低。
13.如权利要求1-12中任一项所述的方法,其特征在于,所述第一等位基因为野生型。
14.如权利要求1-13中任一项所述的方法,其特征在于,通过解链曲线分析,检测所述第一等位基因和第二等位基因。
15.如权利要求14所述的方法,其特征在于,所述解链曲线分析包括采用饱和染料的高分辨率解链。
16.如权利要求14所述的方法,其特征在于,所述解链曲线分析包括检测未标记探针的解链。
17.如权利要求1-16中任一项所述的方法,其特征在于,所述检测步骤包括分析扩增交叉点。
18.如权利要求1所述的方法,其特征在于,该方法还包括检测第一等位基因。
19.如权利要求18所述的方法,其特征在于,该方法还包括计算第一等位基因和第二等位基因的等位基因占比。
20.如权利要求19所述的方法,其特征在于,所述计算步骤包括按Fm= wLf (Tl) +wHf (Th) 估算第二等位基因的占比,其中1和%是权重而fOY)和f(TH)是从第一等位基因与第二等位基因各自的纯合子和第一等位基因与第二等位基因50 50混合物的标准品计算出的各温度峰的各个估算值。
21.如权利要求21所述的方法,其特征在于,所述探针是连接于引物对之一5’末端的探针元件。
22.—种扩增和检测生物样品中等位基因的方法,所述生物样品包含靶核酸的第一等位基因和第二等位基因,存在的第一等位基因浓度高于第二等位基因,该方法包括在生物样品中加入热稳定性聚合酶、第一引物和第二引物,设置所述引物以扩增靶核酸,其中第一引物包含针对靶核酸某基因座的特异性探针元件和模板特异性引物区,所述探针元件是模板特异性引物区的5’,设置的所述探针元件与靶核酸杂交,所述探针元件与第一等位基因杂交时具有第一 Tm,与第二等位基因杂交时具有第二 Tm,其中第一 Tm高于第二 Tm,通过变性温度与退火温度之间的热循环,扩增生物样品中的靶核酸,其中退火温度低于第一 Tm,,以及检测第一等位基因和第二等位基因。
23.如权利要求22所述的方法,其特征在于,所述扩增步骤还包括通过延伸温度循环, 所述延伸温度高于退火温度并低于第一 Tm。
24.如权利要求23所述的方法,其特征在于,所述扩增步骤包括在退火温度下保持不到5秒钟。
25.如权利要求M所述的方法,其特征在于,所述保持时间是1秒钟。
26.如权利要求23所述的方法,其特征在于,在延伸温度下保持0秒。
27.如权利要求22-26中任一项所述的方法,其特征在于,所述加入步骤包括加入Mg++ 到浓度低于2. OmM。
28.如权利要求27所述的方法,其特征在于,所述Mg++浓度为约1.5mM。
29.如权利要求22- 中任一项所述的方法,其特征在于,所述探针元件至少含17个碱基。
30.如权利要求22-29中任一项所述的方法,其特征在于,所述第二等位基因的等位基因占比为或更低。
31.如权利要求22-30中任一项所述的方法,其特征在于,通过解链曲线分析,检测第一等位基因和第二等位基因。
32.如权利要求31所述的方法,其特征在于,所述解链曲线分析包括采用饱和染料的高分辨率解链。
33.如权利要求22所述的方法,其特征在于,该方法还包括计算第一等位基因和第二等位基因的等位基因占比。
34.如权利要求22所述的方法,其特征在于,所述计算步骤包括按Fm= wLf (Tl) +wHf (Th)估算第二等位基因的占比,其中1和%是权重,fOY)和f(TH)是各温度峰的各自评估值。
35.一种扩增和检测生物样品中等位基因的试剂盒,其中所述生物样品包含靶核酸的第一等位基因和第二等位基因,存在的第一等位基因浓度高于第二等位基因,该试剂盒包含热稳定性聚合酶, 探针,为扩增生物样品中靶核酸设置的引物对,其中设置所述探针与靶核酸杂交,所述探针与第一等位基因杂交时具有第一 Tm,与第二等位基因杂交时具有第二 Tm,其中第一 Tm高于第二 Tm,通过变性温度与退火温度之间的热循环扩增生物样品中靶核酸的说明书,其中退火温度低于第一 Tm。
36.如权利要求35所述的试剂盒,其特征在于,所述探针是连接于引物对之一5’末端的探针元件。
37.如权利要求35所述的试剂盒,其特征在于,还包含在加入生物样品时能提供低于 2. OmM浓度Mg++的缓冲液。
38.如权利要求35所述的试剂盒,其特征在于,所述第二等位基因的等位基因占比为 10%或更低。
39.如权利要求35中所述的试剂盒,其特征在于,所述第二等位基因的等位基因占比为5%或更低。
40.一种测定含有第一等位基因和第二等位基因的样品中等位基因占比的方法,其包括以预定的扩增条件扩增第一等位基因, 以预定的扩增条件扩增第二等位基因,以预定的扩增条件扩增第一等位基因和第二等位基因的已知混合物, 产生扩增的第一等位基因、第二等位基因和已知混合物各自的导数解链曲线, 利用这些导数解链曲线产生第一等位基因占比的等式, 以预定的扩增条件扩增第一等位基因和第二等位基因的未知混合物,以及利用该等式测定未知混合物中第一等位基因的等位基因占比。
41.如权利要求41所述的方法,其特征在于,所述已知混合物是第一等位基因和第二等位基因的50 50混合物,所述等式是Fm= (a2e+bcd)/(de(a+b)),其中 Fffl =第一等位基因的等位基因占比, a =已知混合物的导数解链曲线中第一等位基因的峰高, b=已知混合物的导数解链曲线中第二等位基因的峰高,C=第二等位基因在第二等位基因解链曲线中的峰高与第二等位基因在已知混合物的导数解链曲线中峰高的差异,d=第一等位基因在第一等位基因解链曲线中的峰高,以及 e=第二等位基因在第二等位基因解链曲线中的峰高。
42.如权利要求41所述的方法,其特征在于,所述第一和第二等位基因各自的导数解链曲线各有一个峰,已知混合物的导数解链曲线有两个峰,分别对应于第一和第二等位基因的导数解链曲线中的峰,和利用峰高二次拟合产生所述等式。
43.如权利要求41所述的方法,其特征在于,所述等式为热力学等式,通过获得最佳非线性最小二乘法拟合于D(T) = cM D(AHm, Δ Sm)+cw D(AHff, ASw),其中D(T)=未知混合物的导数解链曲线cM=第一等位基因的等位基因占比,cw=第二等位基因的等位基因占比,Hm和、是与第一等位基因相关的热力学参数,和Hw和、是与第二等位基因相关的热力学参数。
全文摘要
提供了分析核酸的方法。在一种示范性方法中,采用等位基因偏向扩增法优先扩增靶核酸的低含量等位基因。
文档编号C12P19/34GK102378815SQ200980151657
公开日2012年3月14日 申请日期2009年11月6日 优先权日2008年11月7日
发明者C·N·甘德李, J·T·米奇尼, L·周, R·A·帕莱斯 申请人:犹他大学研究基金会
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1