靶序列的富集的制作方法

文档序号:570832阅读:547来源:国知局

专利名称::靶序列的富集的制作方法靶序列的富集相关申请本申请要求保护2007年8月1日提交的美国临时申请号60/962,838的利益。上述申请的完整教授内容通过引用的方式并入本文。
背景技术
:遗传分析中常遇到的情况要求在极为过量的非变异序列(‘参考序列’)存在时鉴定低百分数的变异DNA序列(‘靶序列’)。这类情况的例子包括(a)在大量过量的正常等位基因存在下鉴定并对少数突变的等位基因测序;(b)遗传分析中在大量过量的非甲基化等位基因存在下鉴定少数甲基化等位基因(或相反情况);(c)鉴定母体血液中循环的少数胎儿DNA序列并进行基因分型,在所述母体血液中也存在极为过量的母体DNA序列;和(d)在极为过量的野生型等位基因存在下鉴定癌症患者(或可疑患有癌症的人)血液中的肿瘤_循环DNA。尽管最近描述了用于种系或高优势体细胞突变的可靠高通量筛选方法(Thomas,R.K.等人(2007)NatGenet,39,347-351;Chou,L.S.等人(2005)AmJClinPathol,124;330-338;Thomas,R.K.等人(2006)NatMed,12;852_855),检测具有不均一性、基质杂质的肿瘤或体液中的低优势体细胞突变仍成问题。另外,鉴定这些突变的临床意义在几种情况中重要。例如(a)在肺腺癌中,不能通过常规测序鉴定的低水平EGFR突变可以引起对酪氨酸激酶抑制剂的阳性应答(Paez,J.G.,.等人(2004)Science,304;1497-1500.)或耐药性(Janne,P.A.等人(2006)ClinCancerRes,12;751-758)(b)血浆中用作早期检测(Diehl,F.等人(2005)ProcNatlAcadSciUSA,102;16368-16373)或肿瘤治疗应答(Kimura,Τ.等人(2004)ArmNYAcadSci,1022;55-60)的生物标记的突变不能使用常规方法测序;并且(c)频繁具有基质杂质如胰腺或前列腺的肿瘤中的突变可以因野生型等位基因存在被掩蔽,因而要求耗费劳动力的显微解剖或完全漏掉突变。发明概述本发明涉及用于富集来自样品的低丰度等位基因的方法、组合物、软件和装置。所述方法部分地基于包括在临界变性温度或“Tc”保温反应混合物的的改良核酸扩增方法。通过使用本发明,明显改善全部基于PCR的技术的现有检测限。“临界温度”或“Tc”指低于参考序列解链温度“Tm”的温度。在一些实施方案中,Tc低于参考序列和靶序列的Tm。临界温度利用双链靶序列或交叉杂交的靶-参考双链DNA双链体的更低Tm,从而先于所述参考/参考同双链体偏好地变性这些双链体。当靶序列和参考序列交叉杂交时,沿着短(例如<200bp)双链DNA序列任意位置处一个或更多单核苷酸错配的微小序列差异将导致该序列解链温度(Tm)的细微但可预测性改变(Lipsky,R.H.等人(2001)ClinChem,47,635-644;Liew,M.等人(2004)ClinChem,50,1156-1164)。根据错配的确切序列关系和位置,考虑0.1-20°C的解链温度改变。临界变性温度(Tc)是这样的温度,在所述温度以下参考核酸序列的PCR效率剧烈下降。例如,如果PCR变性温度设在87V,良好地扩增167bpp53序列,如果设在86.5°C,适度地扩增,并且如果PCR变性温度设在86V或更低,不产生可检测的产物。因而在本例子中,Tc是大约86.5°C。在第一方面,本发明涉及用于富集可疑具有靶序列和参考序列的核酸样品中靶序列的方法。该方法包括使扩增反应混合物经历高于参考序列解链温度“Tm”的第一变性温度处理。随后,降低扩增反应混合物的温度,从而导致单链靶序列和参考序列杂交以形成双链分子。因而,该反应包括靶-靶、参考-参考的杂交同双链体和靶链-参考链的杂交异双链体。就定义而言,异双链体是不完全匹配的双链体,然而它含有维持反应混合物中双链体形式的链间足够同源。就定义而言,同双链体是完全匹配的双链体。反应混合物的温度随后提高至Tc,从而导致靶_参考序列杂交双链体的偏好性变性。Tc或临界温度低于参考序列的Tm并且可以通过本文所述方法确定。在该Tc上,靶-参考序列双链体(和仅在具有比参考序列更低的Tm时,靶-靶序列双链体)基本上变性,而靶_靶双链体(如果具有等于或大于参考序列Tm的Tm)和参考-参考序列双链体基本上不变性。“基本上”意指在给定的变性或非变性形式中至少60%、优选至少70%、更优选至少80%、甚至更优选至少90%并且最优选至少98%。在偏好地变性靶-参考双链体和靶-靶双链体(比参考序列具有更低Tm的那些双链体)后,向反应混合物施加降低的温度,从而导致引物对与靶序列复性。复性的引物随后被延伸,因而相对于样品中的参考序列富集靶序列。在另一个方面,本发明涉及富集靶序列的又一种方法。在该方法中,通过施加高于参考序列Tm的第一变性温度使可疑含有每种靶序列和参考序列的核酸样品变性。其次,靶链和参考链相互复性,从而形成双链靶-参考序列双链体。该靶-参考序列双链体形式形成并连同双链的靶-靶和参考-参考序列双链体一起存在于反应混合物中。通过施加所述Tc至样品偏好地使双链靶_参考双链体和靶_参考序列双链体变性。在该Tc上,靶-参考序列双链体(和仅在具有比参考序列更低的Tm时,靶-靶序列双链体)基本上变性,而靶_靶双链体(如果具有等于或大于参考序列Tm的Tm)和参考-参考序列双链体基本上不变性。“基本上”意指在给定的变性或非变性形式中至少60%、优选至少70%、更优选至少80%、甚至更优选至少90%并且最优选至少98%。一对引物随后与靶序列复性并被延伸,因而相对于样品中的参考序列增加靶序列的浓度。仍在另一个方面,本发明涉及用于通过实行核酸扩增反应方法而富集靶序列的方法。该扩增反应方案包括第一变性温度和第二变性温度。第一变性温度高于参考序列的Tm并且第二变性温度低于参考序列的Tm。在另一种方面,本发明涉及通过使扩增反应混合物经历降低该反应混合物的温度并延伸引物对的Tc处理而富集靶序列的方法,其中所述靶序列具有比相应参考序列更低的Tm。该扩增反应混合物可疑含有靶序列和参考序列的每一种。该Tc低于参考序列的Tm,因而允许以更低Tm偏好性地变性靶序列。在该Tc上,靶-参考序列双链体和靶-靶序列双链体基本上变性,而参考-参考序列双链体本上不变性。“基本上”意指在给定的变性或非变性形式中至少60%、优选至少70%、更优选至少80%、甚至更优选至少90%并且最优选至少98%。降低反应混合物温度的步骤导致引物对与靶序列复性。复性的引物随后由聚合酶延伸,因而相对于参考序列增加样品中靶序列的量。仍又在另一个方面,本发明涉及通过使扩增反应混合物经历复性条件和Tc的多个循环而富集靶序列的方法。可疑具有每种靶序列和参考序列的扩增反应混合物首先经历高于参考序列Tm的第一变性温度处理。其次,样品在温度不同的两个保温步骤之间循环。在第一保温步骤中,降低温度,从而导致靶序列与参考序列杂交,从而形成双链体。在第二保温步骤中,提高温度至低于参考序列Tm的Tc。在该Tc上,靶-参考序列双链体(和仅在具有比参考序列更低的Tm时,靶-靶序列双链体)基本上变性,而靶_靶双链体(如果具有等于或大于参考序列Tm的Tm)和参考-参考序列双链体基本上不变性。“基本上”意指在给定的变性或非变性形式中至少60%、优选至少70%、更优选至少80%、甚至更优选至少90%并且最优选至少98%。随后重复这些第一和第二步骤一次或更多次。一旦循环保温步骤结束,降低反应混合物的温度,从而导致引物对与靶序列复性。这些引物随后由聚合酶延伸,因而相对于样品中的参考序列富集靶序列。附图简述图1说明使用第一变性温度和Tc靶序列的本发明富集方法的一个实施方案。图2说明使用往复复性/Tc步骤的本发明富集方法的一个实施方案。图3说明所测试的借助靶序列富集方法富集的p53和Kras突变。图4说明用靶序列富集方法富集p53突变等位基因。图5说明用靶序列富集方法富集Kras突变等位基因。图6说明来自肺肿瘤和结肠肿瘤的临床样品中突变等位基因的富集。图7说明缺少错配形成步骤的富集方法的实施方案对突变等位基因的富集。图8A-8D说明在常规实时PCR中或通过以实时模式应用的本发明富集方法的野生型和突变P53外显子的扩增曲线。(a)显示常规实时PCR中连续稀释细胞系的扩增曲线,其中所述细胞系在P53外显子8突变中含有突变体。(b)显示以实时PCR模式应用时本发明的富集方法中对连续稀释的细胞系的扩增曲线,其中所述细胞在P53外显子8突变中含有突变体。(c)显示常规实时PCR中4份临床肿瘤样品的扩增曲线,其中已知所述临床肿瘤样品之一含有P53外显子8突变(CT20)。(d)显示以实时PCR模式对所述4份临床肿瘤样品应用时本发明富集方法的扩增曲线。图9A-D说明使用DNA检测染料(LCGreen)时野生型和突变p53的外显子8的常规和富集实时PCR扩增曲线。(a)显示含有突变(SW480、TL6、CT20)和野生型(R27、TL8、TL18、TL81、TL82)p53外显子8的样品的常规实时PCR的扩增曲线。(b)显示以实时模式对含有突变(SW480、TL6、CT20)和野生型(R27、TL8、TL18、TL81、TL82)p53外显子8的样品应用时,来自本发明富集方法的扩增曲线。(c)显示含有突变(SW480、CT7、HCC、CT20)和野生型p53外显子8的样品的常规实时PCR的扩增曲线。(b)显示以实时模式对含有突变(SW480、CT7、HCC、CT20)和野生型p53外显子8的样品应用时本发明富集方法的扩增曲线。图10A-B说明有机溶剂(例如3%DMS0)对靶富集的影响。(a)实时PCR中野生型和突变体P53外显子8的扩增曲线。(b)以实时模式对突变和野生型p53外显子8应用时本发明富集方法的扩增曲线。图11说明AA761EGFR突变的Taql消化之后,使用本发明富集方法的改良限制性片段长度多态性(RFLP)检测。(a)说明当常规PCR或富集方法后110,000(突变体基因组)稀释时野生型和突变(AA761)EGFR的检测。(b)说明通过常规PCR加以分析时野生型EGFR的检测。发明详述本发明涉及用于富集来自样品的低丰度等位基因(例如靶序列)的方法、组合物、软件和装置。本发明部分地涉及通过施加临界变性温度至反应混合物选择性地富集靶序列。临界变性温度或Tc是低于参考序列解链温度Tm的温度。该临界温度利用双链靶序列或交叉杂交的靶_参考双链DNA双链体的更低Tm,从而先于所述参考/参考同双链体偏好地变性这些双链体。众多已知突变检测方法仍可从使用选择性富集靶序列的本发明受益。在大部分突变和测序反应中利用PCR作为遗传检验的初始步骤。通常,扩增核酸序列(例如基因组DNA/cDNA)作为第一步骤,随后是双脱氧测序或突变筛选法(例如SSCP、dHPLC、MALDI-TOF、焦磷酸测序法、高分辨率解链法)。因此,如果在筛选之前的PCR步骤期间进行含突变序列(例如靶序列)的富集,则基本上全部突变检测方法的检测限将一律受益。如本文中所用,术语“富集靶序列”指相对于样品中的相应参考序列,增加靶序列的量并提高靶序列的比率。例如,在样品中靶序列对参考序列的比率初始地是5%至95%的情况下,靶序列可以在扩增反应中被偏好地扩增,从而产生70%靶序列对30%参考序列的比率。因而,存在靶序列相对于参考序列的14倍富集。靶序列的富集导致靶序列相对于富集前的参考序列增加2倍至200倍。靶的富集是优于参考序列的至少2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、50倍、60倍、70倍、80倍、90倍、100倍、150倍、200倍或更多倍数富集。靶序列的富集产生与参考序列相比具有10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、80%、90%、95%或更多靶序列的样品(例如10%靶序列90%参考序列至95%靶序列5%参考序列)。如本文中所用,术语“靶序列”指核酸样品中比参考序列较不优势的核酸。靶序列占据样品中少于50%的参考序列+靶序列的总量。优选地,靶序列相对于参考序列在RNA和/或DNA水平上以110、115、120、125倍、130、135、140、145、150、160、170、180、190、1100、1150、1200倍或更低水平表达。在一个实施方案中,靶序列是突变等位基因。例如,样品(例如血液样品)可以含有众多正常细胞和少数癌细胞。正常细胞含有非突变或野生型等位基因,而少数癌细胞含有体细胞突变。在这种情况下,突变体是靶序列而野生型序列是参考序列。在另一个实施方案中,本发明涉及检测从母亲获得的核酸样品中的胎儿DNA。在这个实施方案中,靶序列存在于胎儿DNA中而更优势的母亲DNA含有参考序列。如本文中所用,靶序列意图包括从妊娠母亲获得的胎儿DNA。如本文中所用,“靶链”指靶序列的单核酸链。靶序列长约17-2000个核苷酸。在一个实施方案中,靶序列长20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、350、400、450、500、600、700、800、900个或更多个核苷酸。靶序列与对应的参考序列共有至少50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同源性,不过与该参考序列不同至少一个核苷酸。可以借助PCR,采用与用于参考序列的那些引物对相同的引物对扩增本发明的靶序列。如本文中所用,术语“参考序列,,指核酸样品中比对应靶序列(例如相同基因,但不同的核酸序列)更优势的核酸。参考序列占据样品中超过50%的总体参考序列+靶序列。优选地,参考序列相对于靶序列在RNA和/或DNA水平上以10倍、15倍、20倍、25倍、30倍、35倍、40倍、45倍、50倍、60倍、70倍、80倍、90倍、100倍、150倍、200倍或更高水平表达。在一个实施方案中,参考序列是野生型等位基因。例如,样品(例如血液样品)可以含有众多正常细胞和少数癌细胞。正常细胞含有非突变或野生型等位基因,而少数癌细胞含有体细胞突变。在这种情况下,该野生型序列是参考序列而突变序列是靶序列(例如突变等位基因)。如本文中所用,“参考链”指参考序列的单核酸链。参考序列长约17-2000个核苷酸。在一个实施方案中,参考序列长20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、350、400、450、500、600、700、800、900个或更多个核苷酸。参考序列将与对应的靶序列共有至少50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多同源性,不过与该靶序列不同至少一个核苷酸。可以通过PCR,采用与用于靶序列的那些引物对相同的引物对扩增本发明的参考序列。术语“等位基因”指基因、其部分或DNA非编码区的变异形式,其中所述变异形式在核苷酸序列中具有至少一个差异的同源染色体上占据相同基因座或位置。术语“等位基因”可以用来描述来自任意生物的DNA,所述的任意生物包括但不限于细菌、病毒、真菌、原虫、霉菌、酵母、植物、人、非人动物和古细菌。等位基因可以存在于单个细胞(例如,两个等位基因,一个等位基因从父亲遗传并且另一个来自母亲)或细胞群体内部(例如,来自正常组织的野生型等位基因和来自发病组织的体细胞突变等位基因)。等位基因可以长17-2000个核苷酸。在一个实施方案中,等位基因长20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、250、300、350、400、450、500、600、700、800、900个或更多个核苷酸。等位基因通常将相互共有50%、60%、70%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或更多的同源性。可以通过PCR,采用相同的引物对扩增本发明的等位基因。在一个实施方案中,本发明用来富集多态性。任意给定的基因可以没有、具有一种或多种等位形式(多态性)。产生等位基因的常见突变性改变可以是天然或人工(例如化学致癌原)缺失、添加或替换核苷酸的结果。这些类型的改变的每一种可以单独或与其余类型组合在给定序列中出现一次或更多次。已经报道了几种不同类型的多态性。限制性片段长度多态性(RFLP)是DNA序列中变更限制性片段长度的变异(Botstein等人,Am.J.Hum.Genet.32:314_331(1980))。限制性片段长度多态性可以创造或缺失限制性位点,因而改变限制性片段的长度。RFLP已经广泛地用于人和动物遗传分析中(见WO90/13668;WO90/11369;Donis-Keller,Cell51319-337(1987);Lander等人,Genetics121:85-99(1989))。当可遗传性状可能连锁于特定的RFLP时,某个体中该RFLP的存在性可以用来预测该个体也将显示展示该性状的可能性。RFLP以与本文所述的富集方法联合使用,从而增强对多态性的检测。此类方法在本文实施例9中描述。其他多态性采取包含串联、二、三和四核苷酸重复基序的短串联重复序列(STR)形式。这些串联重复序列也称作可变数目的串联重复(VNTR)多态性。VNTR已经用于身份和父子关系分析(美国专利号5,075,217;Armour等人,FEBSLett.307113-115(1992);Horn等人,WO91/14003Jeffreys,EP370,719)和大量的遗传作图研究中。其他多态性采取相同物种的个体之间单核苷酸变异的形式。此类多态性远比RFLP、STR(短串联重复序列)和VNTR(可变数目的串联重复序列)频繁。一些单核苷酸多态性出现于编码蛋白质的序列中,在这种情况下,所述多态性形式之一可以导致缺陷蛋白质或其他变异蛋白质表达并潜在地导致遗传病。其他单核苷酸多态性出现在非编码区中。这些多态性中某些也可以导致缺陷蛋白质表达(例如作为缺陷剪接作用的结果)。其他单核苷酸多态性没有表型效果。其他突变还包括体细胞突变。体细胞突变是DNA中受孕后出现的变异。体细胞突变可以在除生殖细胞(精子和卵子)之外的任何身体细胞中出现并因而不传递至儿童。这些变异可能(但不总是)导致癌症或其他疾病。如本文中所用,术语“野生型”指群体中对于某种基因最常见的多核苷酸序列或等位基因。通常,野生型等位基因将从正常细胞获得。本文中所用,术语“突变体”指核酸序列中的核苷酸改变(即单个或多个核苷酸替换、缺失或插入)。携带突变的核酸具有在序列上不同于对应野生型多核苷酸序列的核酸序列(突变等位基因)。本发明的方法尤其用于选择性地富集含有1和500个之间核苷酸序列改变的突变等位基因。与对应的野生型等位基因相比,突变等位基因可以具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、60、70、80、90、100、200,300,400或500个核苷酸序列改变。优选地,突变等位基因中的突变将含有1和10个之间的核苷酸序列改变并且更优选地含有1和5个之间的核苷酸序列改变。该突变等位基因将与野生型等位基因具有50%,60%,70%,80%,85%,90%,91%,92%,93%,94%,95%,96%、97%、98%、99%或更多的同源性。通常,突变等位基因将从发病的组织或细胞获得并与疾病状态相关。如本文中所用,术语“解链温度”或“Tm”指多核苷酸与其互补序列解离的温度。通常,Tm可以定义为这样的温度,在该温度上双链体核酸分子中的一半Watson-Crick碱基对被破坏或解离(即“解链”),而其余一半Watson-Crick碱基对仍完好处于双链构象。换句话说,1定义为两条互补序列的50%核苷酸复性(双链)且50%核苷酸变性(单链)的温度。Tm因而定义了从双链核酸分子至单链核酸分子的转变过程(或反过来从单链核酸分子至双链核酸分子的转变过程)的中间点。Tm可以通过众多方法估计,例如按照Wetmur1991(ffetmur,J.G.1991.DNAprobes!applicationsoftheprinciplesofnucleicacidhybridization.CritRevBiochemMolBiol26:227_259,该文献因而通过引用的方式并入)的最近邻计算法和借助商用程序,所述商用程序包括01igOTMPrimerDesign和互联网上可利用的程序。或者,Tm可以通过实际实验确定。例如,双链DNA结合或嵌入染料溴化乙啶或SYBR-绿(MolecularProbes)可以用在确定核酸实际Tm的解链曲线测定法中。用于确定核酸Tm的额外方法是本领域熟知的并且在本文描述。如本文中所用,临界温度”或“Tc”指低于参考序列“Tm”的温度。施加Tc以偏好地变性双链的靶序列双链体或靶序列/参考序列双链的双链体,从而导致扩增反应期间靶序列的选择性富集。临界变性温度(Tc)是这样的温度,在所述温度以下给定核酸序列的PCR效率剧烈下降。例如,如果PCR变性温度设在87V,良好地扩增167bpp53序列,如果设在86.5°C,适度地扩增,并且如果PCR变性温度设在86°C或更低,不产生可检测的产物。因而在本例子中,Tc是大约86.50C。Tc低于参考序列Tm约.1-20°C。更优选地,Tc低于参考序列Tm约·l-10°c、·1-9°C、·l-8°c、·l-7°c、·1-6°C、·2°C_5°C、·3°C-4.5°C、·4-4°C、·5-3.5°C、.5-3°C、.5-3°C、.5-2.5°C、.5_2°C、.5-1.5°C、.5_1°C。在一些实施方案中,Tc低于参考序列和靶序列的Tm。例如,Tc可以低于靶序列1约.1-10°C、.1-90C,.1-8°C1-71-6°C、·2°C_5°C、·3°C-4.5°C、·4-4°C、·5-3.5°C、·5_3°C、·5_3°C、·5-2.5°C、·5_2°C、·5-1.5°C、·5-1°C。如本文中所用,术语“选择性变性”或“偏好性变性”指偏好地破坏靶序列或靶/参考序列双链体的双链核酸分子中碱基对之间的氢键以产生单链靶序列。靶序列的选择性变性通过施加临界温度至含有靶序列和参考序列的样品实现。本文中所用,“引物对”指与靶序列和参考序列的对立链复性从而在PCR反应期间形成扩增产物的两条引物。该引物对如此设计,从而具有该反应Tc的Tm。如本文中所用,术语“交叉杂交”指在相异一个或多个核苷酸的两个核酸序列之间借助互补性G与C碱基之间和互补性A与T碱基或A与U碱基之间氢键形成所产生的双链体。这两个互补性核酸序列以反平行构象形成氢键。在优选施方案中,这两个核酸序列是靶序列和参考序列。交叉杂交的DNA将在参考序列与靶序列之间差异的位置处含有错配。所述错配可以包括多态性、突变、插入、缺失和产生此类差异的其他变异。例如,甲基化。例如,含有一个或多个核苷酸的环和/或单链区出现于缺失/插入位点处。交叉杂交一般涉及使靶序列和参考序列变性,例如通过加热,随后在导致杂交和双链体形成发生的条件(如温度)下复性。如本文中所用,“反应混合物”是可疑含有靶序列双链体的混合物,其中所述混合物包含导致靶序列变性的合适缓冲液。如本文中所用,“同一性”或“同源性”指两个聚合物分子例如两个多核苷酸或两个多肽之间的次级单位序列相似性。当这两个分子中的次级单位位置被相同单体性次级单位占据时,例如,若两个多肽之每一多肽中的某位置被丝氨酸占据,则这两个多肽在该位置上相同。两个序列之间的同一性是匹配数或相同位置的直接函数,例如,如果两个肽或复合物序列中一半(例如长度10个次级单位的聚合物中的5个位置)位置是相同的,则这两个序列是50%相同的;如果90%的位置(例如10个位置中9个位置)匹配,则这两个序列共享90%序列同一性。核苷酸同一性百分数可以通过BLAST的默认参数确定。对于序列比较,一般地一个序列充当检验序列与之比较的参考序列。当使用序列比较算法时,将检验序列和参考序列输入计算机,根据需要指定次级序列坐标,并指定序列算法程序参数。可以使用默认程序参数或可以指定备选参数。基于程序参数,序列比较算法随后相对于参考序列计算检验序列的序列同一性百分数。比较窗口包括针对具有任一连续位置数的节段的参考,所述的连续位置数选自由20至600、通常约50至约200、更通常约100至约150的组成的组,其中一个序列可以与具有相同连续位置数的参考序列在这两个序列最佳比对后进行比较。用于比较的序列比对方法是本领域熟知的。用于比较的最佳序列比对可以这样进行,例如通过Smith和Waterman,Adv.App1.Math.2482(1981)的局部同源性算法、通过Needleman和Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法、通过Pearson和Lipman,Proc.Nat‘1.Acad.Sci.USA85:2444(1988)的相似性搜索方法、通过这些算法的计算机化执行(GAP、BESTFIT、FASTA,和TFASTAintheWisconsinGenetics软件包,GeneticsComputerGroup,575ScienceDr.、Madison、Wis.)或通过手工比对和目视审查(见,例如,CurrentProtocolsinMolecularBiolog(Ausubel等人编著,1995增补))。适用于确定序列同一性和序列相似性百分数的算法例子是BLAST和BLAST2.O算法,它们分别在Altschul等人,Nuc.AcidsRes.25:3389_3402(1977)和Altschul等人,J.Mol.Biol.215=403-410(1990)中描述。用于开展BLAST分析的软件是通过国家生物技术信息中心((http://www.ncbi.nlm.nih.gov/))可公开获得的。该算法涉及首先通过查询序列中长度W的短字鉴定高评分序列对(HSP),其中所述短字与数据库序列中具有相同长度的字比对时匹配或满足某些正值阈评分Τ。T称作邻居字评分阈值(上文的Altschul等人)。这些初始邻居字hit充当启动搜索的种子以发现含有这些种子的更长HSP。所述字hit沿每个序列向两个方向延伸,只要可以提高累积比对评分。对于核苷酸序列,使用参数M(—对匹配残基的报酬评分;总是>0)和N(错配残基的的惩罚评分;总是<0)计算累积评分。对于氨基酸序列,使用评分矩阵来计算累积评分。字hit在每个方向上的延伸在以下情况时停止累积比对评分从其最大实现值跌落达量X;累积评分因积累一个或更多负评分残基比对比对结果而达到或低于零;或抵达两个序列二者之一的末端。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用字长度(W)ll、期望(E)10、M=5、N=-4和两条链的比较作为默认。对于氨基酸序列,BLASTP程序使用字长度(W)11和期望(E)10,以及BL0SUM62评分矩阵(见Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA8910915(1989))、比对结果(B)50、M=5、N=_4和两条链的比较作为默认。BLAST算法也进行两个序列之间相似性的统计分析(见,例如,Karlin和Altschul,Proc.Nat'1Acad.Sci.USA90:58735787(1993))。由BLAST算法提供的相似性的一种度量是最小总和概率(P(N)),其提供两个核苷酸序列或氨基酸序列之间的匹配会因偶然发生的概率指示。例如,如果最小总和概率在检验核酸与参考核酸的比较中小于约0.2、更优选小于约0.01并且最优选小于约0.001,则将认为核酸相似于参考序列。在第一方面,本发明涉及用于富集可疑具有靶序列和参考序列的核酸样品中靶序列的方法。参考序列和靶序列可以在本方法中使用之前被扩增。即参考序列和目的靶序列可以在本方法中使用之前在PCR反应中从基因组模板扩增。随后为用于选择性富集方法中,转移来自该PCR反应的等分试样。或者,参考序列和靶序列无需经历第一PCR反应,不过可以在选择性富集方法中以它们的天然形式(例如基因组DNA)使用。靶序列和参考序列可以从包括基因组DNA、cDNA、病毒DNA、哺乳动物DNA、胎儿DNA或细菌DNA的任意核酸序列获得。在参考序列通常是野生型等位基因而靶序列是突变等位基因的同时,也可以反之亦然。突变等位基因可以包括任意一个或多个核苷酸缺失、插入或改变。在一些实施方案中,突变等位基因是体细胞突变。在其他实施方案中,靶序列是甲基化DNA而参考序列为非甲基化DNA。或者,靶序列为非甲基化DNA而参考序列是甲基化DNA。一般如此设计本发明方法中使用的引物,从而产生大小约17至1000碱基、更优选约25至500碱基和最优选约50至100碱基的参考序列和靶序列扩增产物。该方法包括使扩增反应混合物经历高于参考序列解链温度“Tm”的第一变性温度处理。核酸的Tm可以通过实验确定或通过计算估计。技术人员十分了解用于确定核酸Tm的众多熟知方法,其中所述方法的某些在本文描述。根据PCR中所用标准方法设置第一变性温度。因而,第一变性温度应当足够地高,从而导致靶序列和参考序列的充分变性(例如96°C)。在一个实施方案中,第一变性温度高于参考序列Tm约1°C至30°C,参考序列的Tm更优选地高于参考序列Tm约5°C至20°C。随后,降低扩增反应混合物的温度,从而导致靶序列和参考序列杂交。在优选施方案中,该杂交温度或中间温度(低于第一变性温度和Tc,但高于引物复性/延伸温度的温度,例如约60°C至80°C)高于引物对的Tm,并因而导致靶序列与参考序列杂交而阻止引物对与靶序列和/或参考序列的结合。这个复性步骤导致双链的靶_靶、参考_参考和靶_参考序列的杂交双链体形成。随后通过提高反应混合物的温度至所述Tc偏好地变性靶-参考杂交双链体。Tc或临界温度低于参考序列的Tm并且可以通过本文所述方法确定。在一个实施方案中,Tc低于参考序列的Tm约.3°C_5°C并且更优选低于约.5°C至1.5°C。通常,Tc将是约70-90°。如果靶序列具有与参考序列相比产生更低Tm的核苷酸序列,靶-靶杂交双链体也可以被偏好地变性。在该Tc上,靶-参考序列双链体(和仅在具有比参考序列更低的Tm时,靶-靶序列双链体)基本上变性,而靶-靶双链体(如果具有等于或大于参考序列Tm的Tm)和参考-参考序列双链体基本上不变性。“基本上”意指在给定的变性或非变性形式中至少60%、优选至少70%、更优选至少80%、甚至更优选至少90%并且最优选至少98%。一般施加该Tc约1秒至5分钟、更优选2秒至1分钟并且最优选5秒至30秒。在偏好性地变性靶_参考和/或靶_靶序列杂交双链体后,降低反应混合物的温度,从而导致引物对与靶序列复性。复性的引物随后由核酸聚合酶延伸,因而相对于样品中的参考序列富集靶序列。该方法的所述步骤通常重复多个循环,旨在引起靶序列和参考序列充分扩增。在一个实施方案中,该方法的步骤重复5-40个循环并更优选地重复10-30个循环。最佳循环数可以由本领域普通技术人员确定。优选地,本发明方法在PCR装置中进行,更优选地在实时反应条件下在实时检测PCR装置如SMARTCYCLER实时PCR装置(C印heid,Sunnyvale,CA)和Mx3005P实时PCR装置(Stratagene,LaJolla,CA)中进行。在这个实施方案中,反应混合物可以包含用于量化和/或监测该反应的扩增产物的核酸检测试剂(例如核酸检测染料如SYBRGreen染料或LC-Green染料或有效偶联于荧光染料的探针)。一旦靶序列的富集完成,可以进一步加工该样品(例如以鉴定由该方法富集的任意遗传变异,例如,经历测序反应)。富集的参考序列可以由多种方法进一步加工,所述方法包括MALDI-T0F、HR解链法、双脱氧测序、单分子测序、焦磷酸测序、RFLP、数字PCR和定量PCR。仍在另一个方面,本发明涉及用于通过实行核酸扩增反应方法而富集靶序列的方法。该扩增反应方法包括第一变性温度和第二变性温度。第一变性温度高于参考序列的Tm并且第二变性温度低于参考序列的Tm。该方法包括使扩增反应混合物经历高于参考序列解链温度“Tm”的第一变性温度处理。核酸的Tm可以通过实验确定或通过计算估计。技术人员十分了解用于确定核酸Tm的众多熟知方法。第一变性温度通常如一般将选择PCR反应的变性温度那样进行选择并且应当足够地高,从而导致靶序列和参考序列的变性。在一个实施方案中,第一变性温度高于参考序列Tm约1°C至30°C,参考序列的Tm更优选地高于参考序列1约51至20°C。第二变性温度低于参考序列的Tm并且可以通过本文所述方法确定。在一个实施方案中,Tc低于参考序列的Tm约.3°C_5°C并且更优选低于参考序列的Tm约.5°C至1.5°C。通常,Tc将是约70-90°。一般施加第二变性温度约1秒至5分钟、更优选2秒至1分钟并且最优选5秒至30秒。在另一种方面,本发明涉及通过使扩增反应混合物经历降低该反应混合物的温度并延伸引物对的Tc处理而富集靶序列的方法。该扩增反应混合物可疑含有靶序列和参考序列。在这个方面,靶序列具有低于参考序列1的!。该Tc低于参考序列的Tm,因而导致因其核苷酸组成(例如缺失)而具有比参考序列更低的、的靶序列的偏好变性。如同本发明的其他方面,参考序列和靶序列可以在本方法中使用之前扩增。即参考序列和目的靶序列可以在本方法中使用之前在PCR反应中从基因组模板扩增。随后为用于选择性富集方法中,转移来自该PCR反应的等分试样。或者,参考序列和靶序列无需经历第一PCR反应,不过可以在选择性富集方法中以它们的天然形式(例如基因组DNA)使用。所述靶序列和参考序列可以从包括基因组DNA、cDNA、病毒DNA、哺乳动物DNA、胎儿DNA或细菌DNA的任意核酸序列获得。在参考序列通常是野生型等位基因而靶序列是突变等位基因的同时,也可以反之亦然。突变等位基因可以包括任意一个或多个核苷酸缺失、插入或改变。在一些实施方案中,突变等位基因是体细胞突变。一般如此设计本发明方法中使用的引物,从而产生大小约15至1000碱基、更优选约25至500碱基和最优选约50至100碱基的参考序列和靶序列扩增产物。通过提高反应混合物的温度至所述Tc偏好地变性靶_靶杂交双链体。Tc或临界温度低于参考序列的Tm并且可以通过本文所述方法确定。在一个实施方案中,Tc低于参考序列的Tm约.3°C_5°C并且更优选低于参考序列的Tm约.5°C至1.5°C。通常,Tc将是约70-90°C。一般施加该Tc约1秒至5分钟、更优选2秒至1分钟并且最优选5秒至30秒。在该Tc上,靶-参考序列双链体和靶-靶序列双链体基本上变性,而参考_参考序列双链体本上不变性。“基本上”意指在给定的变性或非变性形式中至少60%、优选至少70%、更优选至少80%、甚至更优选至少90%并且最优选至少98%。降低反应混合物温度的步骤导致引物对与靶序列复性。复性的引物随后由聚合酶延伸,因而增加样品中靶序列的量。该方法的所述步骤通常重复多个循环,旨在引起靶序列和参考序列充分扩增。在一个实施方案中,该方法的步骤重复5-40个循环并更优选地重复10-30个循环。最佳循环数可以由本领域普通技术人员确定。优选地,本发明方法在PCR装置中进行,更优选地在实时反应条件下在实时检测PCR装置如SMARTCYCLER实时PCR装置(Cepheid,Sunnyvale,CA)和Mx3005P实时PCR装置(Stratagene,Lajolla,CA)中进行。在这个实施方案中,反应混合物可以包含用于量化和/或监测该反应的扩增产物的核酸检测试剂(例如核酸检测染料如SYBRGreen染料或LC-Green染料或有效偶联于荧光染料的探针)。一旦靶序列的富集完成,可以进一步加工该样品,例如,经历测序反应。富集的等位基因可以由多种方法进一步加工,所述方法包括MALDI-TOF、HR解链法、双脱氧测序、单分子测序、焦磷酸测序、RFLP、数字PCR和定量PCR。仍又在另一个方面,本发明涉及通过使扩增反应混合物经历复性条件和通过施加Tc所致变性条件的轮换步骤而富集靶序列的方法。具有每种靶序列和参考序列的扩增反应混合物首先经历高于参考序列Tm的第一变性温度处理。如在其余方面那样,参考序列和靶序列可以在本方法中使用之前被扩增。即参考序列和目的靶序列可以在本方法中使用之前在PCR反应中从基因组模板扩增。随后为用于选择性富集方法中,转移来自该PCR反应的等分试样。或者,参考序列和靶序列无需经历第一PCR反应,不过可以在选择性富集方法中以它们的天然形式(例如基因组DNA)使用。所述靶序列和参考序列可以从包括基因组DNA、cDNA、病毒DNA、哺乳动物DNA、胎儿DNA或细菌DNA的任意核酸序列获得。在参考序列通常是等位基因而靶序列是突变等位基因的同时,也可以反之亦然。突变等位基因可以包括任意一个或多个核苷酸缺失、插入或改变。在一些实施方案中,突变等位基因是体细胞突变。在其他实施方案中,靶序列是甲基化DNA而参考序列为非甲基化DNA。或者,靶序列为非甲基化DNA而参考序列是甲基化DNA。一般如此设计本发明方法中使用的引物,从而产生大小约15至1000碱基、更优选约25至500碱基和最优选约50至100碱基的参考序列和靶序列扩增产物。核酸的、可以通过实验确定或通过计算估计。技术人员十分了解用于确定核酸Tffl的众多熟知方法。第一变性温度通常如一般将选择PCR反应的变性温度那样进行选择并且应当足够地高,从而导致靶序列和参考序列的变性。在一个实施方案中,第一变性温度高于参考序列Tm约l°c至30°C,参考序列的Tm更优选地高于参考序列Tm约5°C至20°C。其次,样品在温度不同的两个保温步骤之间循环。在第一保温步骤中,降低温度,从而导致靶序列与参考序列杂交。在第二保温步骤中,提高温度至低于参考序列Tm的Tc。随后重复这些第一和第二步骤一次或更多次,更优选3-20次并且最优选5-10次。第一保温步骤导致靶_靶、参考_参考和靶_参考序列的杂交双链体形成。在优选施方案中,该杂交温度或中间温度(低于第一变性温度和Tc,但高于引物复性/延伸温度的温度,例如约60°C至80°C)高于引物对的Tm,并因而导致靶序列与参考序列杂交而阻止引物对与靶序列和/或参考序列的结合。随后通过在第二保温步骤中提高反应混合物的温度至所述Tc偏好地变性靶-参考和靶-靶(只要该靶具有比参考序列更低的TJ杂交双链体。Tc或临界温度低于参考序列的Tm并且可以通过本文所述方法确定。在一个实施方案中,Tc低于参考序列的Tm约.3°C_5°C并且更优选低于参考序列的Tm约.5°C至1.5°C。通常,Tc将是约70-90°C。如果靶序列具有与参考序列相比产生更低Tm的核苷酸序列,靶-靶杂交双链体也被偏好地变性。一般施加该Tc约1秒至5分钟、更优选2秒至1分钟并且最优选5秒至30秒。一旦循环保温步骤结束,降低反应混合物的温度,从而导致一个或多个引物与靶序列复性。这些引物随后由聚合酶延伸,因而富集靶序列。—旦每个步骤完成,则该反应可以重复多个循环,旨在引起靶序列和参考序列充分扩增。在一个实施方案中,该方法的步骤重复5-40个循环并更优选地重复10-30个循环。最佳循环数可以由本领域普通技术人员确定。优选地,本发明方法在PCR装置中进行,更优选地在实时反应条件下在实时检测PCR装置如SMARTCYCLER实时PCR装置(C印heid,Sunnyvale,CA)和Mx3005P实时PCR装置(Stratagene,LaJolla,CA)中进行。在这个实施方案中,反应混合物可以包含用于量化和/或监测该反应的扩增产物的核酸检测试剂(例如核酸检测染料如SYBRGreen染料或LC-Green染料或有效偶联于荧光染料的探针)。一旦靶序列的富集完成,样品可以经历其他方法处理。其他方法包括MALDI-TOF、HR解链法、双脱氧测序、单分子测序、焦磷酸测序、RFLP、数字PCR和定量PCR。在另一个实施方案中,本发明的方法可以用来检测甲基化是否已经出现在靶序列或参考序列中。在又一个实施方案中,所述方法使用基因组DNA来分析甲基化。16甲基化检测方法包括用于甲基化敏感处理DNA的化学方法或酶方法。化学处理包括将DNA与亚硫酸氢钠保温,所述的亚硫酸氢钠选择性地将非甲基化胞嘧啶转换成尿嘧啶。该DNA首先进行热变性并随后可以用pH5-7的5M亚硫酸氢盐处理。在亚硫酸氢盐处理前使用除去预先存在的尿嘧啶的基因组DNA预处理法。这种预处理法由pH7的5mM羟胺存在下的尿嘧啶糖基化酶处理组成。修饰的DNA现在可以在本发明的方法中使用。因为参考序列或靶序列的甲基化胞嘧啶被转换成尿嘧啶,故与(靶或参考序列的)对立链成双时,它们现在将在反应的交叉杂交步骤期间形成错配。在又一个方面,本发明的任意方法用来富集多重反应中的多种不同靶序列。在这个实施方案中,所述方法包括针对额外靶序列的额外组引物对。在另一个方面,本发明涉及计算机可读取介质,其具有用于开展发明任意方法的程序指令。在又一个方面,本发明涉及用于富集靶序列的PCR系统。该系统包括用于执行计算机可读取介质的程序指令的存储器。图1和图2说明本发明的两个不同方面。图1说明本发明的一个方面,其中所述方法使用具有第一变性温度和临界变性温度或Tc的扩增反应。图2也说明具有第一变性温度和Tc的扩增反应,不过还包括在反应的引物复性和延伸相之前往复或重复多次复性及临界变性温度步骤。图1显示用于富集具有靶序列和参考序列核酸样品中靶序列的方法。所述靶序列和参考序列可以从包括基因组DNA、cDNA、病毒DNA、哺乳动物DNA、胎儿DNA或细菌DNA的任意核酸序列获得。在参考序列通常是等位基因而靶序列是突变等位基因的同时,也可以反之亦然。突变等位基因可以包括任意一个或多个核苷酸缺失、插入或改变。在一些实施方案中,突变等位基因是体细胞突变。在其他实施方案中,靶序列是甲基化DNA而参考序列为非甲基化DNA。或者,靶序列为非甲基化DNA而参考序列是甲基化DNA。该方法包括使扩增反应混合物经历高于参考序列解链温度“Tm”的第一变性温度(图1)处理。核酸的、可以通过实验确定或通过计算估计。技术人员十分了解用于确定核酸Tm的众多熟知方法,其中所述方法的某些在本文描述。第一变性温度通常如一般将选择PCR反应的变性温度那样进行选择并且应当足够地高(例如94°C),从而导致靶序列和参考序列的充分变性。在一个实施方案中,第一变性温度高于参考序列Tm约1°C至30°C,参考序列的Tm更优选地高于参考序列Tm约5°C至20°C。随后,降低扩增反应混合物的温度,从而导致靶序列和参考序列杂交(图1B)。这个复性步骤导致靶_靶、参考_参考和靶_参考序列的杂交双链体形成。复性温度的确定是技术人员熟知的。本发明方法中使用的引物设计成具有这样的Tm,所述Tm防止所述引物在这个中间温度与靶序列和参考序列结合,从而这些引物不干扰突变(靶)序列和野生型(参考)序列的交叉杂交。因为靶序列中的突变,故大部分靶序列的结构与参考序列错配,并因而与参考序列成双时具有比完全匹配的参考/参考同双链体更低的解链温度。随后通过提高反应混合物的温度至所述Tc偏好地变性靶_参考杂交双链体(图1C)。Tc或临界温度低于参考序列的Tm并且可以通过本文所述方法确定。在一个实施方案中,Tc低于参考序列的Tm约.3°C_5°C并且更优选低于参考序列的Tm约.5°C至1.5°C。通常,Tc将是约70-90°。如果靶序列具有与参考序列相比产生更低、的核苷酸序列,靶-靶杂交双链体也可以被偏好地变性。一般施加该Tc约1秒至5分钟、更优选2秒至1分钟并且最优选5秒至30秒。在偏好性地变性靶_参考和/或靶_靶序列杂交双链体后,降低反应混合物的温度,从而导致一种或多种引物对与靶序列复性(图1D)。复性的引物随后由核酸聚合酶延伸,因而富集样品内所含核酸群体中的靶序列。该方法的所述步骤通常重复多个循环,旨在引起靶序列和参考序列充分扩增。在一个实施方案中,该方法的步骤重复5-40个循环并更优选地重复10-30个循环。最佳循环数可以由本领域普通技术人员确定。优选地,本发明方法在PCR装置中进行,更优选地在实时反应条件下在实时检测PCR装置如SMARTCYCLER实时PCR装置(C印heid,Sunnyvale,CA)和Mx3005P实时PCR装置(Stratagene,LaJolla,CA)中进行。在这个实施方案中,反应混合物可以包含用于量化和/或监测该反应的扩增产物的核酸检测试剂(例如核酸检测染料如SYBRGreen染料或LC-Green染料或有效偶联于荧光染料的探针)。一旦靶序列的富集完成,可以进一步加工该样品,例如,经历测序反应。富集的等位基因可以由多种方法进一步加工,所述方法包括MALDI-TOF、HR解链法、双脱氧测序、单分子测序、焦磷酸测序、RFLP、数字PCR和定量PCR。通过在每个PCR-循环中开展富集方法,突变序列(靶序列)的量先于所述序列(参考序列)逐步富集。纯合突变和杂合突变均通过本方法富集。相对于在94°C变性温度进行常规PCR,富集含有突变的序列10-60倍是寻常的。在给定的临界变性温度(Tc),突变富集同时在全部序列位置处发生,尽管以不同效率进行,这取决于序列环境和PCR扩增子的整体大小。使用适宜的DNA解链软件,临界变性温度Tc和在任意位置处的预期富集均是可预测的并且可以实验地验证。因而取决于突变在何处,可以预期稍微不同的富集,然而在全部情况下,可以实现相当大的富集并且因而改善下游测定法(例如测序反应)的检测限。图2说明通过使扩增反应混合物经历复性和临界变性温度的轮换步骤而富集靶序列的方法的实施方案。该实施方案利用在临界温度的偏好性变性和在杂交温度的偏好性交叉杂交。具有每种靶序列和参考序列的扩增反应混合物首先经历高于参考序列Tm的第一变性温度处理(图2A)。其次,样品在温度不同的两个保温步骤之间循环。在第一保温步骤中,降低温度,从而导致靶序列偏好地与参考序列杂交(图2B)。在第二保温步骤中,提高温度至Tc(图2C)。随后重复这些第一和第二步骤一次或更多次,更优选3-20次并且最优选5-10次。给定序列的偏好性杂交温度是野生型等位基因以比含有突变的等位基因更快的速率与自身逆转杂交的温度。因为突变的等位基因远比野生型等位基因少,故野生型等位基因与自身的交叉杂交比突变等位基因与突变等位基因的交叉杂交或突变等位基因与等位基因(后者形成错配)的交叉杂交更快地进行。因此,当PCR温度降低至交叉杂交温度时,突变等位基因的交叉杂交程度不如野生型等位基因的交叉杂交程度。在优选施方案中,该杂交温度或中间温度(低于第一变性温度和Tc,但高于引物复性/延伸温度的温度,例如约60°C至80°C)高于引物对的Tm,并因而导致靶序列与参考序列杂交而阻止引物对与靶序列和/或参考序列的结合。其次,提高反应的温度至Tc,从而引起靶_参考和靶_靶杂交双链体偏好地变性(图2C)。Tc或临界温度低于参考序列的Tm并且可以通过本文所述方法确定。在一个实施18方案中,Tc低于参考序列的1约.3°C_5°C并且更优选低于参考序列的1约.5°C至1.5°C。通常,Tc将是约70-90°。如果靶序列具有与参考序列相比产生更低Tm的核苷酸序列,靶_靶杂交双链体也可以被偏好地变性。一般施加该Tc约1秒至5分钟、更优选2秒至1分钟并且最优选5秒至30秒。该过程重复几次,往复于复性温度(图2B)和临界温度(图2C)之间,每次选择性地产生比单链形式序列更多的单链形式的突变序列。一旦循环保温步骤结束,降低反应混合物的温度,从而导致一个或多个引物与靶序列复性(图2D)。这些引物随后由聚合酶延伸,因而富集靶序列。该方法的所述步骤通常重复多个循环,旨在引起靶序列和参考序列充分扩增。在一个实施方案中,该方法的步骤重复5-40个循环并更优选地重复10-30个循环。最佳循环数可以由本领域普通技术人员确定。优选地,本发明方法在PCR装置中进行,更优选地在实时反应条件下在实时检测PCR装置中进行。一旦靶序列的富集完成,样品可以经历其他方法处理。其他方法包括MALDI-T0F、HR解链法、双脱氧测序、单分子测序、焦磷酸测序、RFLP、数字PCR和定量PCR。数字PCR可以与富集方法联合用于超低水平突变的检测中。在数字PCR中,将DNA样品稀释成单个分子,从而在每个PCR反应中起始材料是野生型或突变的。在源自相同起始材料的大量PCR反应后,分离并检测突变分子。Fluidigm(SouthSanFrancisco,CA)出售多种基于数字PCR的系统,它们可以与本发明一起使用。因此,可以同时在数千个平行富集反应中从单个分子进行实时富集,从而允许鉴定源自突变DNA的PCR反应。这种系统特别用于检测癌症基因组中的超低突变。数字PCR与富集方法的组合可以类似地有益于单分子测序应用。核酸扩增反应在一个实施方案中,本发明方法中使用的核酸样品包含具有靶序列和参考序列的基因组DNA。在另一个实施方案中,本发明方法的核酸样品包含先前在核酸扩增反应中扩增的靶序列和参考序列。技术人员将理解存在可用于扩增核酸的众多方法。最流行的方法可能是聚合酶链反应(PCR;例如见,美国专利号4,683,195和4,683,202,以及Saiki等人,Science2301350-1354(1985)和Gyllensten等人,PNAS(USA)85:7652_7656(1985))。PCR方法的优选变型是非对称PCR(例如见Mao等人,Biotechniques27(4):674_678(1999);Lehbein等人,Electrophoresis19(8-9)1381-1384(1998);Lazaro等人,Molec.Cell.Probes6(5)=357-359(1992);和美国专利号6,197,499)。其他扩增方法包括,但不限于链置换扩增(SDA)(见,Walker等人,Nuc.AcidsRes.20(7)1691-1696(1992)以及美国专利号5,744,311,5,648,211和5,631,147)、滚环扩增(RCA)(见PCT公开WO97/19193)、基于核酸序列的扩增(NASBA)(见Compton,Nature350:91-92(1991);以及美国专利号5,409,818和5,554,527)、转录物介导的扩增(TMA)(见Kwoh等人,PNAS(USA)861173-1177(1989),以及美国专利号5,399,491),自持式序列复制(3SR)(见Guatelli等人,PNAS(USA)871874-1879(1990)和连接酶链反应(LCA)(见美国专利号5,427,930禾口5,792,607)。本发明方法使用改良的PCR。PCR如Mullis和Faloona,1987,MethodsEnzymol.,155335中所述进行,所述文献通过引用的方式并入本文。聚合酶链反应(PCR)技术在美国专利号4,683,202,4,683,195和4,800,159中披露。在其最简单形式下,PCR是使用与对立链杂交并分布于靶DNA中目的区域侧翼的两条寡核苷酸引物,用于酶合成特定DNA序列的体外方法。涉及模板变性、引物复性和复性引物由DNA聚合酶延伸的重复系列的反应步骤致其末端由所述引物5'末端定义的特定片段的指数式累积。据报道PCR能够引起特定DNA序列选择性富集达IO9倍。PCR方法也在Saiki等人,1985,Science2301350中描述。使用模板DNA(靶序列和参考序列)(至少Ifg;更有用地,Ι-lOOOng)和至少25pmol寡核苷酸引物进行PCR。常见反应混合物包括2μ1的DNA,25pmol寡核苷酸引物,2.5μ1的适合缓冲液,0.4μ1的1.25μMdNTP,2.5单位TaqDNA聚合酶(Stratagene)和去离子水至25μ1总体积。使用可编程热循环仪进行PCR。根据实际的严格性要求调整PCR循环的每个步骤的长度和温度以及循环数。复性温度和时间由引物预期与模板复性的效率和待容忍的错配程度二者决定。优化引物复性条件的严格性的能力完全在本领域中等技术人员的知识范围内。使用30°C与72°C之间的复性温度。模板分子的初始变性通常在92°C与99°C之间进行4分钟,随后是由变性(94-99°C,15秒至1分钟)、复性(如上文所讨论那样确定的温度;1-2分钟)和延伸(72°C,1分钟)组成的20-40个循环。终末延伸步骤通常在72°C实施4分钟并且可以后续一个在4°C的无限(0-24小时)步骤。PCR使用核酸聚合酶或催化核苷酸三磷酸聚合的酶。通常,所述酶将在与靶序列复性的引物3'末端启动合成并将在5'-方向沿模板前进。已知的DNA聚合酶包括例如大肠杆菌(E.coli)DNA聚合酶I、T7DNA聚合酶、嗜热栖热菌(Thermusthermophilus)(Tth)DNA聚合酶、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)DNA聚合酶、ThermococcuslitoralisDNA聚合酶、水生栖热菌(Thermusaquaticus)(Taq)DNA聚合酶和强烈炽热球菌(Pyrococcusfuriosus)(Pfu)DNA聚合酶。术语“核酸聚合酶”也包括RNA聚合酶。如果核酸模板是RNA,则“核酸聚合酶”指RNA依赖性聚合活性,如逆转录酶。在本发明的方法中,PCR方法还包括关键变性步骤。这些方法在本文充分地描述并在图1和图2中说明。优选地,所述富集方法在PCR装置中进行,更优选地在实时反应条件下在实时PCR装置中进行。实时反应条件还使用核酸检测试剂(例如染料或探针)旨在PCR产物产生时测量/检测之。在一个实施方案中,所述富集方法以多重模式实施。多重PCR是在PCR反应中使用多于一个引物对来检测多于一种靶序列时的PCR。多重PCR的目标是同时扩增多于一种靶序列并因而节省时间和使开支最小化。它能够在一个运行中扩增多种靶序列。通常,多重PCR连同本发明一起使用旨在富集同时扩增的全部序列中的少数等位基因,如此设计引物,从而所得的PCR-扩增子全部共有大致相同的Tc(临界变性温度)。确定L和TcTm可以定义为这样的温度,在该温度上双链体核酸分子中的一半Watson-Crick碱基对被破坏或解离(即“解链”),而其余一半Watson-Crick碱基对仍完好处于双链构象。“临界温度”、“临界变性温度”或“Tc”指低于参考序列Tm的温度。施加Tc以选择性地变性核酸样品中双链靶序列或靶序列/参考序列双链的双链体,从而导致扩增反应期间靶序列的选择性富集。给定成对的核酸链的Tm指示链与链结合作用的稳定性并且取决于链的互补性、序列长度,GC含量、双链区内部存在或不存在错配和不太重要的其他因素,例如样品的盐浓度(Lewin,GenesV,第5章,OxfordUniversityPressandCellPress:NewYork,(1994)第109-126页;SantaLucia,1998)。一般通过使样品经历温度的持续增加并且连续测量杂交双链体至单链的解离过程而实验地确定解链点温度。解离过程可以由众多不同的方法检测,例如通过UV吸光度转变、双链DNA结合染料的荧光、通过表面等离子共振或优选地通过荧光检测。在后者情况下,杂交探针通常用荧光实体标记,并且荧光信号的产生或多或少取决于杂交双链体的形成。Tm可以实验决地确定或基于本领域普通技术人员已知的充分定义的方法进行估计。观察和分析核酸变性跃迁的方法包括通过差异性扫描量热法(DSC)在样品变性时测量该样品内部的熵改变(Kulinski等人,NucleicAcidsRes.19(9):2449_2455(1991);PanerφA,Biopolymers29:1715-1734(1990);VolkerφA,Biopolymers50:303-318(1999))、测量共价连接的成对荧光团的荧光(Vamosi和Clegg,Biochemistry3714300-14316(1998))和监测核酸增色度的改变(Haugland,“InVitroApplicationsforNucleicAcidStainsandProbes,,,在HandbookofFluorescentProbesandResearchChemicalss,第6版,MolecularProbesInc,EugeneOR(1996)第161-174页)。双链核酸的Tm值也可以通过监测与核酸组合的双链DNA-特异性染料的荧光观察到(Wittwer等人,1996)。双链特异性染料是结合核酸的荧光团。一般,这些染料的荧光在结合至配对的核酸时增加(Wittwer等人,BioTechniques22:176-181(1997))。Ririe等人(1997)证实可以通过解链曲线分析,使用双链核酸结合染料SYBRGreenI区分后期PCR产物。SYBRGreenI偏好地与双链核酸结合(Haugland,1996)。用于确定双链核酸Tm的其他合适染料包括SYBRGold、溴化乙啶、吖啶橙、碘化丙啶、PicoGreen、Hoechst33258、Hoechst33342、Hoechst34580、YO-PRO_1和YOYO_1。例如,MolecularProbes(Eugene,Oreg.)目录第八版HandbookofFluorescentProbesandResearchProducts(2001年5月在CD-ROM上的;该文献通过引用的方式并入本文)第8章列出可以在本发明中使用的许多染料。如技术人员将理解,任何双链核酸结构的解链通常在限定温度范围内在巨大比例的相似核酸群中发生并且一般将在该核酸的大致Tm上具有解链峰(特别迅速的跃迁)。因而,荧光发射的此类变化峰可以用来计算双链核酸的Tm。解链温度谱可以通过-dF/dT对T作图以图示方式描述,其中dF是所测量荧光发射的的改变,dT是该核酸温度的改变并且和T是该核酸的温度。这种图示将显示荧光最迅速改变发生的温度峰值,其指示解链温度。用于确定双链核酸Tm的其他方法是本领域已知的,包括在美国专利号7,226,736和6,030,115中描述的那些方法,所述每个专利因而通过引用的方式完整地并入。Tm可以从经验等式预测。已知Tm依赖于形成互补碱基对(η)的核酸的序列的长度、该序列中的G和C含量、盐浓度(μ)和样品溶液中的变性剂(%FA),并且一般遵循经验等式Tm=81.5+16.61og(y)+0.41(%GC)-500/n_0.61(%FA)。Tm可以通过众多方法估计,例如按照Wetmurl991(Wetmur,J.G.1991.DNAprobes!applicationsoftheprinciplesofnucleicacidhybridization.CritRevBiochemMolBiol26:227_259,该文献因而通过引用的方式并入)的最近邻计算法和借助商用程序,所述商用程序包括01igOTMPrimerDesign和互联网上可利用的程序。“临界温度”或“Tc”指低于参考序列“Tm”的温度。施加Tc以先于参考/参考序列双链体变偏好地性双链的靶序列双链体或靶序列/参考序列双链的双链体,从而导致扩增反应期间靶序列的选择性富集。临界温度利用双链靶序列或交叉杂交的靶_参考双链DNA双链体的更低Tm。当靶序列和参考序列交叉杂交时,沿着短(例如<200bp)双链DNA序列任意位置处一个或更多单核苷酸错配的微小序列差异将导致该序列解链温度(Tm)的细微但可预测性改变(Lipsky,R.H.等人(2001)ClinChem,47,635-644;Liew,M.等人(2004)ClinChem,50,1156-1164)。取决于错配的确切序列关系和位置,0.5-1.5°C的解链温度改变对至多到200bp的序列是常见的。因而,靶-参考序列的复性因错配将基本上具有比已知等位基因(例如参考序列)更低的Tm。至少部分地,本发明利用完全匹配序列与错配序列之间的细微Tm差异。因为临界变性在每个PCR循环中进行,故含有突变的等位基因的差异性富集以指数方式被激励并导致循环结束时突变等位基因和野生型等位基因之间整体扩增效率的巨大差异。Tc低于参考序列1约.1-20°C。更优选地,Tc低于参考序列Tm约.1-15°C、·1-10°C、·1-9°C、·1-8°C、·1_7°C、·1_6°C、.2C_5°C、.3C—4.5°C、.4_4°C、.5—3.5°C、.5_3°C、·53C-、·52·5C-、·52C-、·51.5C-、·51C-。在一些实施方案中,Tc可以低于参考序列和靶序列的Tm。例如,在一个例子中,野生型序列的Tm是84°C并且突变序列的Tm是83.8°C。当使用快速形式的富集方法时,最佳Tc是83.5°C。在一些优选施方案,如此选择Tc,从而它低于参考序列和全部可能靶序列的Tm。例如,在一个例子中,野生型序列的Tm是841并且在不同位置处突变(单点突变)的序列的、是83.8°C、83.7°C、83.9°C、83.6°C、83.75°C。当使用快速形式的富集方法时,最佳Tc是83.5"C。临界变性温度(Tc)是这样的温度,在所述温度以下给定核酸序列的PCR效率剧烈下降。例如,如果PCR变性温度设在87V,良好地扩增167bpp53序列,如果设在86.5°C,适度地扩增,并且如果PCR变性温度设在86°C或更低,不产生可检测的产物。如同Tm,给定序列的Tc可以实验地或通过计算确定。为实验地确定给定PCR产物的Tc,执行嵌入染料(LC-GREEN或SYBR-Green)存在下的实时解链曲线以获得序列的平均解链温度Tm(见关于确定Tm的上文)。低于Tm约0.5-1.5°C温度通常是导致靶序列富集的适宜临界变性温度。也可通过确定DNA序列的ΔΤω估计Tc,其中所述ΔTm因(如在交叉杂交的靶-参考双链体中会存在的)碱基对错配所致。与完美参考/参考序列匹配相比,这种差异是从约.1°C至约12.5°C。因而,在一个实施方案中,Tc可以由等式Tc=Tm-ATm描述,其中Tm是参考/参考序列双链体的解链温度并且△Tm是因一个或更多碱基对错配所致参考序列Tm的改变,其中所述碱基对错配可以在靶/参考序列的交叉杂交期间形成。已经发现ATm取决于靶/参考序列双链体的长度、取决于鸟嘌呤-胞嘧啶百分(%GC)含量并且还取决于双链体中点突变或碱基对错配的位置。例如,如果错配位于双链体的任意末端,ΔΤω通常将更低,一般在约.1°C至约8°C范围内。例如,如果错配位于双链体的中央,ΔΤω通常相对较高,一般在约.2°C至约irC范围内。ΔTm通常等于靶_参考交叉杂交双链体中每个碱基错配百分数约.5°C至约1.5°C。应当理解ΔTm将不仅根据双链体的长度和突变位置变化,还将取决于序列的具体顺序。因而,全部此类变化均在本公开的范围内。本发明的核酸用于本发明中的核酸序列本发明提供富集核酸样品中靶序列的方法并且也使用引物以扩增模板核酸序列。如本文中所用,术语“核酸”、“多核苷酸”和“寡核苷酸”指待检测的引物、探针和寡聚物片段,并且上位于聚脱氧核糖核苷酸(含有2-脱氧-D-核糖)、聚核糖核苷酸(含有D-核糖)和任意其他类型的多核苷酸,所述多核苷酸是嘌呤或嘧啶碱基或修饰的嘌呤或嘧啶碱基(包含非碱性部位)的糖苷。在术语“核酸”、“多核苷酸”和“寡核苷酸”之间不存在详细的有意区分,并且这些将互换使用。这些术语仅指分子的一级结构。因而,这些术语包括双链和单链DNA,以及双链和单链RNA。寡核苷酸实际上不从任何现存或天然序列物理地衍生,不过可以以任意方式产生,包括化学合成、DNA复制、逆转录或其组合。术语“寡核苷酸”或“核酸”意指基因组DNA或RNA、半合成或合成来源的cDNA的多核苷酸,所述多核苷酸因其合成来源或操作而(1)不与自然界中同该多核苷酸联合的多核苷酸的全部或一部分联合;和/或(2)连接至自然界中与该多核苷酸连接的多核苷酸不同的多核苷酸。在一个实施方案中,所述方法中使用的核酸含有修饰的核苷酸,从而增加参考/参考序列同双链体与靶/参考序列异双链体之间的变性温度差异。此类修饰将增强靶序列的富集。可以在富集方法之前或期间掺入修饰或非天然的核苷酸。构思用于本发明方法中的修饰核苷酸包括二氨基_嘌呤类似物(例如2’-0-甲基-2,6-二氨基嘌呤)、尿嘧啶、肽核酸类似物、上述类似的生物素修饰类似物、上述类似的荧光团修饰的类似物、肌苷、7-去氮鸟嘌呤、2'-脱氧-2'-氟-β-D-阿拉伯糖核酸(2’F-ANA)核苷酸、锁核酸(LNAs)、ENA2'-0,4'-C-乙烯-桥接核酸和其他。修饰的核苷酸可以掺入本发明的任意核酸,包括模板、引物和探针核酸。这些修饰可以增加匹配碱基与和错配碱基之间的Tm差异并因而提高用本发明方法获得的富集作用。例如,锁核酸代表一类构象受限的核苷酸类似物,所述的核苷酸类似物例如在通过参考并入的WO99/14226中描述,提高核酸的解链温度。在Koshkin,Α.Α.等人,Tetrahedron(1998),54:3607_3630)^PObika,S.等人,TetrahedronLett.(1998),395401-5404)中描述含有锁核苷酸的寡核苷酸,所述两份文献通过引用的方式并入。锁核苷酸导入寡核苷酸改善了针对互补序列的亲和力并提高解链温度达几度(Braasch,D.Α.和D.R.Corey,Chem.Biol.(2001),8:1_7)。本发明可以用本领域已知的任意LNA(例如在WO99/14226和在LatorraD等人,2003.Hum.Mutat.22:79_85中披露的那些LNA)实施。互补性无需是完全的;稳定的双链体可以含有错配碱基对或不匹配的碱基。核酸
技术领域
的技术人员可以在考虑众多变量的情况下经验地确定双链体稳定性,所述变量例如包括寡核苷酸的长度,寡核苷酸的碱基组成和序列、离子强度和错配碱基对的发生率。核酸双链体的稳定性由解链温度或“Tm”度量。本发明提供用于扩增模板核酸序列的寡核苷酸弓I物。术语“引物”可以指多于一种引物并且指这样的寡核苷酸,无论天然存在(如纯化的限制性消化产物中)或合成地产生,其中所述寡核苷酸处在催化互补于核酸链的引物延伸产物合成的条件下之时,能够充当沿互补链合成的起始点。此类条件包括在适宜缓冲液(“缓冲液”包括作为辅因子或影响PH、离子强度等的取代基)中存在四种不同的脱氧核糖三磷酸核苷和聚合诱导剂如DNA聚合酶或逆转录酶和在适合的温度上。为扩增中的最大效率,引物优选地是单链的。根据本发明有用的寡核苷酸引物是与模板核酸序列可杂交并引发核酸链的酶合成的单链DNA或RNA分子。引物互补于核酸分子汇集物中存在的一部分靶分子。构思通过化学合成或酶合成方法制备本发明的寡核苷酸引物。或者,这种分子或其片段是天然存在的,并从其天然来源分离或从供货者处购买。寡核苷酸引物的长度是5至100个核苷酸,理想地是17至40个核苷酸,尽管不同长度的引物是有用的。用于扩增的引物优选地长约17-25个核苷酸。也通过解链温度估计方法设计具有特定解链温度(Tm)的根据本发明有用的引物。包括01igo、PrimerDesign和互联网上可用的程序(包括Primer3和OligoCalculator)的商用程序可以用来计算根据本发明有用的核酸序列的Tm。优选地,根据本发明有用的扩增引物的Tm(如通过例如OligoCalculator计算)优选地在约45°C与65°C之间并更优选地在约50°C与60°C之间。一般,当两个核酸序列在至少14至25个核苷酸区段范围内基本上互补(在至少14至25个核苷酸区段范围内至少约65%互补、优选至少约75%、优选至少约90%互补)时,选择性杂交出现。见通过引用方式并入本文的Kanehisa,M.,1984,NucleicAcidsRes.12:203。因而,预计在引发部位处容忍某种程度的错配。这种错配可以是细微的,如单、二或三核苷酸。或者,错配区域可以包括环,所述环定义为其中在4个或更多个核苷酸不间断串联中存在错配的区域。在一个实施方案中,富集方法可以与肽核酸(PNA)引物组合使用,从而提高突变富集的灵敏度。PNA仅用来抑制野生型(参考)序列的扩增。在这个实施方案中,可以如此合成引物以区分靶(突变)序列和参考序列。基于PNA的引物以比结合突变序列的引物更高的热稳定性和特异性识别并结合互补野生型序列。这不仅增加PNA引物-参考核酸与常规引物-靶核酸之的Tm差异,还防止基于PNA的引物被DNA聚合酶延伸,因而引起靶序列进一步富集。此类测定法是本领域已知的并且在Orum等人NucleicAcidsResearch,21(23)5332-5336(1993)中描述。可以在考虑这些的同时设计寡核苷酸弓I物并根据以下方法合成它们。寡核苷酸引物设计策略设计用于测序或PCR目的特定寡核苷酸引物涉及选择这样的序列,所述序列能够识别靶序列,不过具有最少的预测二级结构。寡核苷酸序列可以仅结合于或可以不仅仅结合于靶核酸中的单个位点。另外,通过分析寡核苷酸的长度和GC含量优化该寡核苷酸的Tm。另外,当设计用于扩增基因组DNA的PCR引物时,所选引物序列不显示与GenBank数据库(或其他可用数据库)中序列的明显匹配。通过使用轻易可用的计算机程序促进设计根据本发明有用的引物,其中开发所述计算机程序以辅助评价上文所述的几个参数并优化引物序列。此类程序的例子是DNAStar软件包(DNAStar,Inc.;Madison,WI)的“PrimerSelect”、OLIGO4.0(NationalBiosciences,Inc.)、PRIMER、OligonucleotideSelectionProgram、PGEN禾口Amplify(在Ausubel等人,1995,ShortProtocolsinMolecularBiology,3版,JohnWiley&Sons中描述)O在优选施方案中,如此设计本发明的引物,从而其具有低于靶/参考序列交叉杂交步骤期间所施加温度的Tm。因而,在这个实施方案中,引物在这个杂交步骤期间不与靶序列或参考序列复性(见图1)。在一个实施方案中,引物的Tm在交叉杂交复性步骤温度以下5-10°C。^^使用本领域也熟知的技术合成引物本身。用于制备具有特定序列的寡核苷酸的方法是本领域已知的,并且包括例如克隆和限制酶消化分析适宜序列和直接化学合成。一旦设计,则使用商用自动化寡核苷酸合成仪(市售)或VLSIPS技术,通过合适的化学合成方法(包括例如Narang等人,1979,MethodsinEnzymology,68:90描述的磷酸三酯法、Brown等人,1979,MethodsinEnzymology,68109描述的磷酸二酯法、在Beaucage等人,1981,TetrahedronLetters,221859中披露的二乙基焦磷酰胺法和在美国专利号4,458,066中披露的固体支持物法)或通过其他化学方法制备寡核苷酸。引物也可以用修饰的核酸通过本领域熟知的方法合成。MM如本文中所用,“样品”指任意物质,其含有或假定含有目的核酸(靶序列和参考序列)或本身是含有或假定含有目的核酸的核酸。术语“样品”因而包括核酸(基因组DNA、cDNA、RNA)、细胞、生物、组织、流体或物质(其包括但不限于例如血浆、血清、脑脊液、淋巴液、滑膜液、尿、泪、粪便)、皮肤、呼吸道、肠道生殖道的外分泌物、唾液、血液细胞、肿瘤、器官、组织的样品、体外细胞培养物成分的样品、天然分离物(如饮用水、海水、固体材料)、微生物标本和已经用核酸示踪分子“标记”的物体或标本。本发明的核酸序列可以从基因组DNA扩增。基因组DNA可以根据以下方法从组织或细胞分离。或者,本发明的核酸序列可以通过本领域熟知的方法从血液分离。分离特定组织以促进从该组织检测基因的变异形式。为从哺乳动物组织分离基因组DNA,将组织切碎并冷冻于液氮中。冷冻的组织用预冷的研钵研磨成细粉并且以每IOOmg组织1.2ml消化缓冲液悬浮于消化缓冲液(IOOmMNaCl,IOmMTris-HCl,pH8.0,25mMEDTA,pH8.0,0.5%(w/v)SDS,0.lmg/ml蛋白酶K)。为从哺乳动物组织培养细胞分离基因组DNA,将细胞通过以500xg离心5分钟沉淀,重悬于I-IOml冰冷的PBS中,以500xg离心5分钟再沉淀并重悬于1体积的消化缓冲液中。消化缓冲液中的样品在50°C保温(伴以振荡)12-18小时,并随后用等体积的酚/氯仿/异戊醇提取。如果离心步骤(1700Xg,10分钟)后相没有分离,添加另一个体积的消化缓冲液(无蛋白酶K)并重复离心步骤。如果在两相的界面处浓稠白色物质明显,则重复有机物提取步骤。在提取上层相后,将水层转移至一个新管内,向其中添加1/2体积的7.5M乙酸铵和2体积的100%乙醇。核酸通过1700Xg上离心2分钟沉淀、用70%乙醇洗涤、空气干燥并以lmg/ml重悬于TE缓冲液(IOmMTris-HCl,pH8.0,ImMEDTA,pH8.0)中。通过在37°C在0.1%SDS和1μg/ml无DNA酶的RNA酶存在保温样品1小时并重复提取和乙醇沉淀步骤,除去残余RNA。根据该方法的基因组DNA的产率预计是大约2mgDNA/lg细胞或组织(上文的Ausubel等人)。按照该方法分离的基因组DNA可以根据本发明使用。也可以从全血提取靶DNA。例如,血液可以通过标准方法抽至收集管,优选地包含硅化玻璃,所述收集管不含抗凝剂以制备血清,或含有EDTA、柠檬酸钠、肝素或相似的抗凝齐IJ,最优选地含有EDTA,以制备血浆。尽管并非绝对要求,优选方法是血浆或血清应当从全血分离。血浆或血清可以通过离心、优选以300至800Xg温和离心5至10分钟从全血分离。因为肝素可能干扰PCR,故肝素化血液的使用可能要求用肝素酶预处理。因而,EDTA是血液标本的优选抗凝剂。可以在本发明方法使用新鲜收集的血浆或血清或冷冻(贮存的)并随后融化的血浆或血清。贮存的血浆或血清应当保持在_20°C至_70°C,而新鲜收集的血浆或血清保持冷藏或维持在冰上直至使用。DNA可以随后通过本领域熟知的方法以及本文所述那些方法提取。诊断测定法本发明提供用于从患者样品富集靶序列以诊断、检测、监测、评价或治疗疾病、尤其动物或人类中肿瘤疾病或增生性疾病的方法。在优选施方案中,核酸从编码肿瘤基因或其他肿瘤相关DNA的核酸衍生。靶序列的偏好性富集允许进一步分析或操作DNA。例如,可以分析富集的等位基因以定义从中衍生所述DNA的细胞的特征。根据想要的信息,可以几种方法中任意方法,包括核酸测序、RFLP、数字PCR、光谱法(包括质子NMR光谱法)、生物化学分析和免疫分析。在一个实施方案中,扩增的DNA通过从琼脂糖凝胶切下突变DNA条带进行分离、再扩增、克隆至质粒载体例如PGEM-T载体质粒(Promega)并使用商业试剂盒如Sequenase2.0(USB)测序。定义靶DNA特征并因而定义例如肿瘤的分析法提供了广泛的临床用途,包括描述、表征或对细胞(例如肿瘤)(无论已知或隐匿)分类,如通过组织源、通过类型(如恶变前或恶变)、表型和基因型并通过描述或表征肿瘤特征、生理学和生物化学,从而获得对肿瘤侵袭力、转移嗜好和针对多种疗法的敏感性或耐受性的理解,因而允许预测针对现行或计划疗法的反应,并进一步允许评价预后。靶DNA特征与先前活组织检查或手术标本的比较允许与该标本相比进一步评价肿瘤不均一性或相似性并因而评价肿瘤复发。在靶序列的选择性富集后,也可以从该DNA转录或制造互补性核糖核酸(RNA)。在优选的施方案中,通过在扩增反应中使用带RNA聚合酶启动子区的引物进行RNA的转录,其中所述RNA聚合酶启动子连接于针对目的DNA的标准引物序列(步骤3)。随后从连接的启动子区转录与该DNA互补的RNA。在备选方法中,将扩增的等位基因DNA克隆至表达载体,并转录与该DNA互补的RNA。另外,作为任选的优选施方案,在体外翻译反应中使用互补性RNA来生产肿瘤相关或肿瘤特异性蛋白质。等位基因表征、肿瘤衍生或肿瘤相关性DNA的扩增及互补性RNA的表征、转录以及翻译成肿瘤相关或肿瘤特异性蛋白提供在确定疗法和开发肿瘤特异性疗法中的重要用途。胞外DNA的测序或互补性RNA的转录允许确定或开发反义化合物,包括对胞外DNA适度特异的合成性寡核苷酸和其他反义构建体,如通过构建表达质粒,如通过调整Aoki等人(1995,CancerRes.55=38103816)的方法。类似地,定义肿瘤特征允许确定特异性单克隆抗体或对扩增的DNA适度特异的疫苗疗法。相应免疫原性蛋白质的生产可以用于开发肿瘤特异性单克隆抗体。类似地,翻译的蛋白质可以用于肿瘤特异性疫苗开发。特别有价值的是本发明允许开发和应用这些肿瘤-特异性疗法或诊断法,甚至仅存在恶变前肿瘤、早期癌症或隐匿癌症时也是如此。因而,在肿瘤负荷低、免疫功能相对完好并且患者未受损害(这些均提高治愈的可能性)时,本发明允许治疗性介入。对所富集序列的其他处理本发明方法与MALDI-T0F、高分辨率解链或单分子测序的组合将应对突变检测中3种截然不同的需要快速检测已知或可疑与临床结果相关的体细胞突变(MALDI-T0F);对各份患者样品快速扫描未知体细胞突变(HR-解链)、随后对少数外显子选择性测序和对‘苛刻样品’(来自具有不均一性、基质污染或体液的肿瘤中的样品)中多种基因的海量平行测序(单分子测序,SMS),在所述样品中临床相关突变可以处于0.5-5%水平。质谱法在一个实施方案中,使富集的靶序列经历MALDI-T0F测序。质谱法(MS)已经形成DNA测序中的一种有力工具。质谱计产生可在飞摩尔和纳摩尔范围内以秒或分钟获得的直接质量量值(dirctmassmeasurement)。基质辅助解吸电离(MALDI)时间飞行(TOF)MS已经成功地用于快速DNA测序和有效确定DNA分子大小。MALDI-TOFMS的出现已经使电离完好巨大的DNA分子和测量其质荷比更容易。500核苷酸(nt)长度的单链和双链聚合酶链反应(PCR)产物已经由MALDI-TOFMS检测。使用减少DNA片段化的优化基质激光组合,已经以精度士0.5-1%报道了合成性DNA、质粒DNA的限制酶片段和大小至多到2180nt的RNA转录物的红外MALDI质谱。虽然已经通过MALDI-TOFMS检测了大的寡聚物,不过通常认为现在惯例至多到100聚物。对于几种基因而言,临床重要的突变并不在基因组中随机出现(例如在大部分已知肿瘤基因中出现的增加功能的点突变)。相反,影响相对少数密码子的改变往往是大部分体细胞突变的原因。则原则上,有限数目的审慎设计的遗传测定法应当有效地探查巨大比例的临床相关突变。例如,Garraway及同事(Thomas,R.K.等人(2007)NatGenet,39,347-351)证实RAS、EGFR和BRAF中每个基因16-44个MALDI-TOF测定法捕获了人恶性肿瘤中迄今对这些基因观察到的90%-99%突变优势。因而,提出高通量基因分型可能提供大规模检测临床标本中关键和/或’可靶向’癌症突变的有效手段。MALDI-T0F理想地适用于检测非异质性肿瘤样品中先前鉴定的突变。然而,尽管关于MALDI-TOF对种系突变或SNP-鉴定的可靠性没有疑问,然而在检测体细胞突变方面的经验是相对新近的。因而,当使用具有<10%突变细胞的异质性样品(例如胰腺癌、肺癌或前列腺癌)或当准备筛选来自体液的DNA时,MALDI-T0F的可靠性大幅度降低。通过改善灵敏度,本发明的富集方法能够使MALDI-T0F检测低水平体细胞突变并还将提供对主流外科肿瘤样品筛选法为必需的所要求的可靠性。高分辨率解链法在另一个实施方案中,使富集的靶序列经历高分辨率解链法。通过突变扫描法而非个体突变基因分型法更容易筛选沿外显子在众多位置处含有临床相关突变的基因,如p53。HR-解链法是最近几年引入的高通量突变扫描技术,具有发现SNP或种系突变的出色能力(Chou,L.S.等人(2005);AmJClinPathol,124,330-338;ffittwer,C.Τ.等人(2003);ClinChem,49,853-860;Reed,G.H.和Wittwer,C.Τ·(2004);ClinChem,50,1748-1754)。在嵌入荧光染料(LCGreen或Sybr-Green)存在下PCR扩增目的基因组区域后,不做任何扩增后处理,即刻通过仔细的解链曲线分析和与野生型的比较实时鉴定突变的存在。此外,高分辨率解链解链分析在使用常规方法时所要求的一部分时间内同时实现基因扫描和突变基因分型(即SNP鉴定),与此同时维持管封闭环境。PCR需要<30分钟(毛细管)或1.5小时(96-孔或384-孔平板)而解链搜索花费每只毛细管1-2分钟或或每平板5分钟。然而,如同MALDI-T0F,使用HR-解链法的优势不能对低于大约20%突变体-对-野生型比率的体细胞突变外推,因而不能借助HR-解链法可靠地筛选几个类型的临床样品。通过提高检测限,本发明能够将HR-解链法的便利性和高通量应用于主流外科肿瘤样品筛选法并且还用于检测具有基质污染的‘苛刻’临床样品或来自体液的DNA中的低水平体细胞突变。单分子测序在另一个实施方案中,使富集的靶序列经历单分子测序法(Thomas,R.K.等人(2006);NatMed,12,852-855)。单分子测序法的能力也会得益于本发明的并入。例如对于患者样品中的突变筛选,在启动第二轮测序前仍需要在常规PCR仪中从基因组DNA中PCR扩增所选的外显子。另外,检测临床样品中在1-5%突变体-对-野生型比率水平上的突变要求对众多‘个体事件’重复测序,以获得可接受的统计值。这最终降低通量能力,并且对于1%水平上的突变,如果所述突变居优势,仅可以同时筛选10-20个序列,如与大约4,000个序列形成对比(per454LifeSciences,TechnicalService)。通过在单分子测序之前开展本发明,突变的优势作为总体数目或等位基因的一部分将提高1-2个数量级,因而提高单分子测序法的通量至同等程度。在一个实施方案中,在单分子测序反应的内部乳化阶段期间应用选择性富集方法。在这个实施方案中,使富集的靶序列经历焦磷酸测序法。引物延伸在另一个实施方案中,使富集的靶序列经历引物延伸测序反应。在引物延伸中,使用寡核苷酸来相对于序列已知的核酸评估序列中该序列预定位置处的变异。提供作为单链分子的样品寡核苷酸,该单链分子与诱导剂、标记的核苷酸和引物混合以形式混合物,其中所述引物具有与分布在预定位置侧翼的区域相同的序列,所述混合物基本上缺少由以下碱基构成的核苷酸,所述碱基不同于构成标记核苷酸的碱基。随后使该混合物经历这样的条件,所述条件引起引物与单链分子复性并形成掺入标记核苷酸的引物延伸产物,并且对该混合物分析含有标记核苷酸的引物延伸产物的存在性(美国专利号5,846,710)。缓冲液构思在本发明扩增方法中包含有机溶剂以增加错配和匹配双链体之间的Tm差异。某些有机溶剂的包含可以改善靶序列的富集。例如,包含有机溶剂可以增加参考DNA序列和靶序列之间的变性温度差异并因而辅助偏好地扩增靶序列。有机溶剂如DMS0、甲酰胺、甜菜碱或甘油(Pomp,D.和Medrano,J.F.,Biotechniques,10,58-59(1991))可以增加错配(参考/参考)序列与匹配(靶/参考)序列之间的Tm差异。因此,由于本发明的中间杂交步骤(交叉_杂交)形成含有错配的靶-参考序列,故有利的是包含有机溶剂至它们不抑制聚合酶作用的程度。因而,在一些实施方案中,反应混合物以1-10%体积对体积或优选3-8%体积对体积或最优5-6%体积对体积的水平补充有DMS0、甲酰胺、甜菜碱、甘油或其组合。实施例8说明DMSO在富集方法中的用途。使用有机溶剂的另一个实践优势是对给定序列适宜的Tc在反应中使用有机溶剂时改变。因而,在DMSO不存在下,序列的Tc是83.5°C,在3%DMS0存在下,该Tc是80.5°C。因而,通过添加不同量的DMSO或其他溶剂至不同序列,可以确保Tc对于全部序列是相同的。这对于单个PCR仪运行中针对多种序列进行众多富集反应是有用的,因为变性温度随后对全部序列是相同的。实施例实施例1.用于富集靶序列的材料与方法用于确认COLD-PCR的序列为确认本发明,使用一系列在p53外显子8和Kras外显子2(密码子12-13)的不同位置含有突变的基因组DNA和细胞系(图3)。p53外显子8突变与肺癌中的不良预后相关并且是癌症患者血浆中的低优势突变。类似地,Kras突变在肺腺癌中具有预后意义。富集方法和引物PCR在0.IXLC-Green嵌入染料存在下并按照实时方式在Cepheid仪进行。PCR的实时追踪并非必需但是方便,因而将其用于全部实验。对于167bp的p53序列,正常PCR首先进行10个循环旨在产生用于富集方法中的足够产物。C印heid仪用以下循环参数编程95°C,120秒;(95°C,15秒/55°C荧光读出ON,30秒/72°C,1分钟延伸)X10个循环。所得PCR产物随后11000稀释并进行以下富集方法处理,所述富集方法也在图1中说明。95°C,15秒;70°C,120秒;在Tc=86.5°C变性3秒;55°C荧光读出ON持续30秒;随后72°C,1分钟延伸,30个循环。为制备用于Sanger双脱氧测序法的PCR产物,所述产物用核酸外切酶I和Shrimp碱性磷酸酶处理。以下引物用于所述测序方法中167bp片段5'-GCTTCTCTTTTCCTATCCTG-3'正向;5'-CTTACCTCGCTTAGTGCT-3'反向;对于87bp和210bp的p53片段和135bp的Kras片段,富集方法如上文所述,不过临界变性温度分别设在Tc=83.5,87.5和80°C。用于所述测序方法中的引物是5'-TGGTAATCTACTGGGACG—3'正向;5,CGGAGATTCTCTTCCTCT-3'反向(87bpp53外显子8片段)5'-GCTTCTCTTTTCCTATCCTG-3'正向;5,-TAACTGCACCCTTGGTC-3'反向(210bpp53外显子8片段)5,-AACTTGTGGTAGTTGGACCT-3,正向;5,-CTCTATTGTTGGATCATATT-3,反向(Kras外显子2片段)。在3-6个独立实验中检验全部富集方法的重复性。MMp53外显子8突变当使用临界变性温度Tc=86.5°C的富集方法应用于167bp外显子8片段时,富集对于所测试的全部突变是明显的。图4描述各自结果。例如,在该富集方法后,如通过观察测序图色谱图估计,来自HCC细胞的野生型细胞中初始稀释降至5%突变体-对-野生型比率的DNA变为约70%突变体-对-野生型比率(即富集达大约14倍)。类似地,在该富集方法后,富集来自SW480细胞(在密码子273处的纯合G>A突变)的10倍稀释至野生型的DNA达大约7倍。还观察到CT7样品(杂合C>A突变)富集达大约12倍并且MDA-MB231样品((杂合C>T突变)富集达大约6倍。借助富集方法扩增的野生型P53样品显示无突变(图4)。如图2中所列出,在对于167bp片段研究的全部p53突变范围内,富集作用变化达5-14倍。富集过程提高含有突变的全部序列的优势,无论突变在何处。Kras密码子12/13突变图5说明来自Kras的135bp片段的结果。所述结果与94°C变性温度上进行的常规巢式PCR比较并且随后进行Sanger测序。图5说明使用Sanger测序,可以明白无误地检测到低至3%突变体-对-野生型的突变。实施例2临床样品的Sanger测序为使用本发明分析临床样品,使先前按照常规PCR测序的20份结肠肿瘤临床样品和肺腺癌临床样品经历如实施例1中所述的富集方法和sanger测序。结果显示借助常规PCR-Sanger测序所鉴定的全部突变也通过所述富集方法、随后测序而鉴定到。然而,所述富集方法还鉴定到常规测序错过的突变。图描述了2临床样品TL64和CT20,其中通过p53外显子8密码子273的所述富集方法-Sanger测序检测到低优势G>A突变,不过所述突变没有通过测序随后常规PCR法检测到。使用基于RFLP的测序法实施突变存在性的独立验证。此外,在源自结肠癌症患者的血浆_循环DNA中通过所述富集方法-Sanger测序法检测到P53外显子8(G>A)突变,而通过常规PCR-Sanger测序法没有检测到此突变。其次,使用从福尔马林固定(FFPE)的标本获得的DNA,也揭示被常规测序法错过的p53(C>Τ)突变,其中所述标本从非细胞肺癌症患者(NSCLC)获得(图6)。图6中的底部色谱图显示从一位NSCLC患者获得的另一份FFPE样品中Kras密码子12突变的检测结果。随后通过RFLP方法独立地从基因组DNA验证由所述富集方法鉴定的突变。因而,使用COLD-PCR-测序法,被常规PCR-测序法错过的相关突变轻易变得可检测。实施例3._可以在无错配复性步骤下富集降低L的突变当变性温度设在临界温度(Tc)时,PCR对核苷酸序列的依赖性如此明显,从而甚至PCR期间不形成错配的情况下,存在降低Tm的那些突变的富集。因而,当G和A等位基因存在时,A-等位基因将在COLD-PCR期间富集,因为这降低该等位基因的Tm。为证实这一点并且也为检验富集过程对所检验序列的大小的依赖性,检验了含有与P53外显子8的167bp片段相同的突变的87bp片段和210bp片段(图3)。如同167bp片段那样,通过巢式PCR、随后借助所述富集方法从初始P53外显子8扩增子扩增这两个片段。然而,在这种情况下,使用实施例1的扩增方案的缩短形式,不过省去在70°C的错配形成步骤以及94°C步骤(对于87bp片段,临界变性温度Tc=83.5°C并且对于210bp片段,Tc=87.5°C)。因而,在这种形式的富集方法中,PCR仅在临界变性温度(Tc)、引物结合步骤(例如55°C)和引物合成步骤(例如72°C)之间循环。图7A显示87bp片段的测序色谱图(根据突变存在87bp序列上哪个地点,进行正向测序或反向测序)。数据显示使用这种形式的改良富集方法,20-50倍富集87bp片段。例如,在所述富集即大约50倍富集后,SW480DNA的突变体-对-野生型DNA的初始稀释产生50%突变体-对-野生型。随后的Sanger测序揭示出‘杂合’序列。在图7B中描述大小对借助所述缩略富集方法的富集作用的影响。该数据说明富集作用对<IOObp的片段最高,不过对于至多到210bp的片段仍明显(大约8-10倍)。实施例4-虽然各种癌样品中遇到的大部分(大约70%)突变降低Tm,然而大约15%的突变提高τω(例如A>G)而大约15%的突变持平Tm(例如G>C)。为能够富集全部可能的突变,包括G>A和A>G突变和缺失,优选完整的富集程序(图1)。为展示能够富集具有提高或降低Tm的突变的靶序列,借助图1的富集方法扩增具有C或T核苷酸(野生型对HCC细胞系)的167bpp53外显子8片段。形成两种混合物,一种混合物少量地具有C等位基因(CT110)并且另一种混合物少量地具有T等位基因(TC110)。在所述富集方法或备选地在常规PCR后,将产物测序。在两种情况下,均富集少数的等位基因即C或T,这取决于哪种等位基因在扩增前更稀少。假定地,错配的序列具有比C或T等位基因更低的解链温度,因而通过进行图1的方案,错配d序列总是被偏好地变性。因此,通过富集方法期间在中间温度(大约70°C)形成错配,总是存在少数等位基因的富集,即便特定核苷酸改变趋向于提高局部Tm。实施例5-MALDI-T0F测序本发明也期望改善大部分其他基于PCR的技术,包括用于体细胞突变检测的MALDI-T0F。为证实这点,使用实施例1中用于Sanger测序的相同模式来比较富集方法对常规PCR之后的MALDI-T0F,其中所述Sanger测序旨在使用野生型样品内含有突变的细胞系的连续稀释物鉴定具体P53外显子8突变。在所述富集方法或常规PCR后,通过在37°C与0.3Ushrimp碱性磷酸酶(USB)保温20分钟随后在85°C保温5分钟以失活该酶而从反应除去过量dNTP。在SNP或插入/缺失范围内的单引物延伸以终浓度600nM每种延伸引物、50μMd/ddNTP和0.126U热测序酶(Thermosequenase)(SolisBiodyne)进行并在94°C保温2分钟,随后45个下述循环94°C,5秒;52°C,5秒和72°C,5秒。所用的延伸引物由MALDI-TOFHarvardCoreFacility使用MassArrayAssayDesign软件3.1.2.2版对所研究的每种p53突变设计。针对每种突变所用的引物是p53_sw480CAGGACAGGCACAAACA;p53_CT7:AGGACAGGCACAAACAC;p53_DU145:ACAGCTTTGAGGTGCGT;KRAS_SW480:TGTGGTAGTTGGACCTG;KRAS_A549:ACTCTTGCCTACGCCAC。随后通过添加阳离子交换树脂,随后混合并离心以沉淀管内容物而将反应物脱盐。将延伸产物点样于384孔光谱CHIP,随后MALDI-T0F质谱仪(Sequenom)上运行。结果在表I中显示。在表I的第三列中列出突变富集倍数。通过与使用常规PCRMALDI-T0F时获得的值比较来计算富集作用。对于大部分所研究的突变,获得10-60富集倍数。当突变体-对-野生型降低时,富集作用增加,这表明富集倍数对突变初始浓度的非线性依赖性。表IPS3突变显示了多种P53外显子8突变的%突变或野生型等位基因__MALDI-TOF结果__pS3外显子8突变=14484G>A___富集-PCR_筛选的细胞系稀释物_%A突变体%G野生型富集_SW480-野生型比率1:5常规PCR_15_85__SW480-野生型比率1:10常规PCR_5(质谱检测限)95__SW480-野生型比率1:33常规PCR_O_100__SW480-野生型比率1:10CO.L.D-PCR45_55_-9_SW480-野生型比率1:100CO.L.D-PCR33_67_>10_SW480-野生型比率1:300CO.L.D-PCR31_69_>30_仅野生型,CO.L.D-PCR_0_100_%_MALDI-TOF结果__p53外显子8突变=14483C>T___CO丄.D-PCR筛选的细胞系稀释物_%T突变体%C野生型富集_CT7-野生型比率1:5常规PCR_28_72_N/A_CT7-野生型比率1:10常规PCR_18_82_N/A_CT7-野生型比率1:33常规PCR_5(质谱检测限)95_NM._CT7-野生型比率1:100CO.L.D-PCR45_54_-18_CT7-野生型比率1:200CO.L.D-PCR28_72_-40_CT7-野生型比率1:300CO.L.D-PCR27_73_-60_仅野生型,CO.L.D-PCR_0_100_%_MALDI-TOF结果__p53外显子8突变=14486G>T__CO.L.D-FCR筛选的细胞系稀释物_%G突变体%T野生型富集_DU145-野生型比率1:5常规PCR_28_72_NTA_DU145-野生型比率1:10常规PCR_18_82_Ν/Α_DU145-野生型比率1:33常规PCR_0_100_NM._<table>tableseeoriginaldocumentpage33</column></row><table>富集-PCR-MALDI-TOF与常规-PCR-MALDI-TOF的比较。在最末列中列出获得的突变富集。实施例6-比较基于TAQMAN的常规实时PCR和基于富集的实时PCR进行核酸扩增反应以比较常规实时下的TAQMAN探针测定法和基于富集的实时PCR0比较这两种实时检测方法,在野生型序列中的多种稀释度上分析具有p53外显子8内G>A突变的基因组DNA和临床肿瘤样品。将源自SW480的基因组DNA连续稀释(13、110、130、1100禾Pl300)至野生型DNA中。具体地,在0.2μΜTaqman探针5,-6-Fam-TTTGAGGTGCATGTTTGTGCC-BHQ_1_3,存在下,在20ng基因组DNA上直接进行实时PCR反应,其中所述Taqman探针完全匹配源自SW480细胞的DNA上含有p53突变的序列。其他试剂的终浓度是1XGoTaqFlexi缓冲液(Promega),1XGoTaq聚合酶(Promega)O.2mM各种dNTP,0.2μΜ正向引物,5'-TGGTAATCTACTGGGACG-3',Ο.2μΜ反向引物,5,-CGGAGATTCTCTTCCTCT-3‘,MgCl23mM,加DNA。PCR扩增子的大小是87bp并且Tc=83.5°C。快速COLD-PCR循环是95°C,120秒;(95°C,15秒;58°C荧光读数0N,60秒)X25个循环;(83.50C15秒;58°C荧光读数0N,60秒)X25个循环。对于常规PCR循环,使用相同程序,不过变性温度在整个PCR期间是95°C。在独立实验中重复实验至少5次。在图8A和8B中描述扩增曲线,所述扩增曲线说明当应用于源自结肠癌症细胞系SW480的基因组DNA时常规和富集实时PCR的灵敏度。图8B证实富集实时PCR可以在1300突变体对野生型等位基因比率上检测突变的存在。相反,在除Tc步骤之外完全相同的条件下实施的常规实时PCR仅可以在110最大稀释度上检测突变体(图8A)。因而,使用富集方法,该测定法的灵敏度更好30倍。在图8C和8D中说明具有p53外显子8突变的临床肿瘤样品(已知所述临床样品之一含有在P53外显子8中的一个低水平突变(5%突变体对野生型)CT20)中常规和富集实时PCR的灵敏度的扩增曲线。富集实时PCR轻易地能够检测突变(图8D),而常规PCR不能(图8C)。已知为野生型样品的剩余样品(TL6、TL8和TL18)在相同条件下不扩增(图8C)。实施例7-借助富集实时PCR的突变扫描产生核酸扩增反应混合物以比较使用DNA检测染料的常规和富集实时PCR检测沿P53外显子8任意位置含有突变的样品的能力。该方法提供了鉴定未知突变或杂合SNP的快速且便利方法。因而,本发明方法可以由本领域普通技术人员采用以扫描大量基因的种系或体细胞突变用于各种不同的用途(例如在具有发生乳腺/卵巢CA的高风险的群体中扫描BRCA1/2突变,扫描完整遗传突进以鉴定突变等)。图9A和9B说明扩增曲线,所述扩增曲线比较在已知含有p53外显子8内突变的多种细胞系和临床样品中使用LC-Green染料的常规和富集实时PCR。数据表明实时常规PCR(图9A)不能区别突变体(SW480、TL6和CT20)和野生型(R27、TL8、TL18、TL81和TL82)样品,而富集实时PCR能够区分(图9B)。富集方法对于含有突变的样品提供比野生型样品更早的阈值检测。图9C和9D说明来自与图9A和9B中所述完全相同的反应条件下制备的扩增反应中的结果,不过所述样品全部是肺肿瘤。数据表明实时常规PCR(图9C)不能区别突变样品和野生型样品,而富集实时PCR能够区分(图9D)。富集方法对于含有突变的样品提供比野生型样品更早的阈值检测。另外,富集检测方法能够鉴定样品TL6中先前未知的C>T突变。实施例8-有机溶齐时曾力D常规,禾Π曾强型实时PCR其月丨旬突变的富集制备核酸扩增反应混合物以评估有机溶剂对常规和富集实时PCR的影响。反应在有机溶剂有机溶剂(3%DMS0)存在或不存在下进行。所用方法与如实施例7中所述和在图9C和9D中所绘那样相同,除了添加3%DMSO之外。有机溶剂的存在增强含有突变序列的样品与含有野生型序列的那些样品的扩增曲线之间的区分(图10)。例如,野生型样品和突变体样品之间阈值差异从大约5个循环(无DMSO的实时富集,见图9A)增加至超过10个循环(有DMSO的实时富集,见图10A)。实施例9-使用与富集PCR组合的RFLP检测超低水平突变与RFLP-PCR组合的富集PCR可以用与改善超低水平突变的鉴定,例如用于在极早阶段即治疗前鉴定癌症基因组中的随机突变或癌样品中的抗性突变。例如,用TaqI酶选择性地消化含有野生型EGFR外显子19的样品。随后使至多到110,000突变体-对-基因组DNA的稀释物以富集模式(Tc=81.5或81°C)或以常规PCR模式(95°C经历PCR处理。突变的富集作用由TaqI消化随后dHPLC量化(图11)。存在的突变的量通过在约7min停留时间上独立突变峰的存在进行量化。在富集方法后,突变峰比常规PCR后明显得多。总之,富集方法明显地改善借助RFLP-PCR所鉴定的极低水平突变的检测。本文中引用的全部专利、专利申请和公开的参考文献因而通过引用的方式完整并入。尽管已经参考本发明的优选实例实施方案具体地显示和描述了本发明,本领域技术人员会理解可以在其中进行形式和细节方面的多种改变而不脱离由所附权利要求书包括的本发明范围。权利要求用于富集靶序列的方法,所述方法包括a.使可疑具有所述靶序列和参考序列的反应混合物经历高于参考序列解链温度(Tm)的第一变性温度,从而允许所述靶序列和所述参考序列变性,其中所述靶序列至少50%同源于所述参考序列并且是可通过与所述参考序列相同的引物对扩增的;b.降低扩增反应混合物的温度,从而允许靶链/参考链双链体的形成;c.使所述扩增反应混合物经历低于所述参考序列Tm的临界温度(Tc),从而允许步骤(b)的所述双链体的偏好性变性以形成变性的靶链和参考链。d.降低反应混合物的温度,从而允许所述引物对与所述靶链和参考链复性;并且e.延伸所述引物对,从而相对于所述参考序列富集所述靶序列。2.用于富集靶序列的方法,所述方法包括a.通过使可疑具有所述靶序列和参考序列的核酸样品经历高于所述参考序列解链温度(Tm)的第一变性温度而变性所述核酸样品;b.形成靶链/参考链双链体;c.通过使核酸样品经历低于所述参考序列Tm的临界温度(Tc)而变性所述靶链/参考链双链体;d.将所述引物对与所述靶链和参考链复性;并且e.延伸所述引物对,从而相对于所述参考序列富集所述靶序列。3.用于富集靶序列的方法,所述方法包括使可疑具有所述靶序列和参考序列的核酸样品经历第一变性温度和第二变性温度,其中所述第一变性温度高于所述参考序列的Tm,从而引起所述靶序列和参考序列的变性,并且所述第二变性温度低于所述参考序列的Tm,从而引起靶链/参考链双链体的偏好性变性,并且使所述的核酸样品经历核酸扩增条件,从而相对于所述参考序列富集所述的靶序列。4.用于富集靶序列的方法,所述方法包括执行包含第一变性温度和第二变性温度的核酸扩增反应方案,其中所述第一变性温度高于参考序列的Tm,从而引起所述靶序列和参考序列的变性并且所述第二变性温度低于所述参考序列的Tm,从而引起靶链/参考链双链体的偏好性变性。5.用于富集靶序列的方法,所述方法包括a.使可疑具有靶序列和参考序列的反应混合物经历低于所述参考序列Tm的临界温度(Tc),从而偏好地变性所述靶序列;b.降低反应混合物的温度,从而引起引物对与所述靶序列复性;并且c.延伸所述引物对,从而相对于所述参考序列富集所述靶序列。6.用于富集靶序列的方法,所述方法包括a.使可疑具有靶序列和参考序列的反应混合物经历高于所述参考序列解链温度(Tm)的第一变性温度,从而引起所述靶序列和参考序列的变性;b.备选地重复一次或更多次以下步骤i降低反应混合物的温度,从而引起靶链/参考链双链体的形成,和ii使所述反应混合物经历低于所述参考序列Tm的临界温度(Tc),从而引起靶链/参考链双链体的偏好性变性。c.降低反应混合物的温度,从而引起引物对与所述的靶序列和参考序列复性;并且d.延伸所述引物对,从而相对于所述的参考序列富集所述靶序列。7.用于富集靶序列的方法,所述方法包括a.使可疑具有靶序列和参考序列的反应混合物经历高于所述参考序列解链温度(Tm)的第一变性温度,从而引起所述靶序列和参考序列的变性;b.备选地重复一次或更多次以下步骤i降低反应混合物的温度,从而引起靶链/参考链双链体的形成,和使所述反应混合物经历低于所述参考序列Tm并低于相同扩增子中任意靶序列Tm的临界温度(Tc)处理,从而引起靶链/参考链双链体的偏好性变性,c.降低反应混合物的温度,从而引起引物对与所述靶序列和参考序列复性;并且d.延伸所述引物对,从而相对于所述的参考序列富集所述靶序列。8.权利要求2的方法,其中在进行步骤d之前重复步骤b和c两次或更多次。9.权利要求1-3和5-8任一项的方法,其中所述靶序列和参考序列首先通过PCR扩增。10.权利要求1-3和5-8任一项的方法,其中所述参考序列是野生型等位基因。11.权利要求10的方法,其中所述靶序列是突变等位基因。12.权利要求11的方法,其中所述突变等位基因包含一个或多个核苷酸缺失。13.权利要求11的方法,其中所述突变等位基因包含一个或多个核苷酸插入。14.权利要求11的方法,其中所述突变等位基因包含一个或多个核苷酸改变。15.权利要求11的方法,其中所述靶序列是体细胞突变。16.权利要求1-3和5-15任一项的方法,其中所述靶序列和参考序列是15至1000个碱基。17.权利要求16的方法,其中所述靶序列和参考序列是25至500个碱基。18.权利要求16的方法,其中所述靶序列和参考序列是50至200个碱基。19.权利要求1-18任一项的方法,其中所述第一变性温度比所述参考序列Tm高1°C至30"C。20.权利要求19的方法,其中所述第一变性温度比所述参考序列Tm高5°C至20°C。21.权利要求1、2或5-20任一项的方法,其中所述Tc比所述参考序列Tm低.3°C_5°C。22.权利要求1、2或5-20任一项的方法,其中所述Tc比所述参考序列Tm低.5°C至1.5°C。23.权利要求3或4的方法,其中所述第二变性温度比所述参考序列Tm低.3°C-5°C。24.权利要求3或4的方法,其中所述第二变性温度比所述参考序列Tm低.5°C至1.5°C。25.权利要求1-24任意项的方法,其中所述方法重复2个或更多个循环。26.权利要求1-24任意项的方法,其中所述方法重复5-40个循环。27.权利要求1-24任意项的方法,其中所述方法重复10-30个循环。28.权利要求1-24任意项的方法,还包括使所述富集的靶序列经历进一步处理。29.权利要求1-24任意项的方法,其中所述进一步处理选自由MALDI-TOF、HR解链、双脱氧测序、单分子测序、焦磷酸测序、RFLP、数字PCR和定量PCR组成的组。30.权利要求1-29任一项的方法,其中所述靶序列具有比所述参考序列更低的Tm。31.权利要求1-29任一项的方法,其中所述靶序列具有比所述参考序列更高的Tm。32.权利要求1、2或5-8任一项的方法,其中所述Tc应用1秒-5分钟。33.权利要求1、2或5-8任一项的方法,其中所述Tc应用2秒-1分钟。34.权利要求1、2或5-8任一项的方法,其中所述Tc应用5秒-30秒。35.权利要求3或4的方法,其中所述第二变性温度应用1秒_5分钟。36.权利要求3或4的方法,其中所述第二变性温度应用2秒-1分钟。37.权利要求3或4的方法,其中所述第二变性温度应用5秒-30秒。38.权利要求1-3或5-22、25-34任一项的方法,其中所述引物对在与所述靶序列复性时具有低于Tc的解链温度。39.权利要求1、2或5-22、25-34任一项的方法,其中所述Tc是70_85°C。40.权利要求3或4的方法,其中所述第二变性温度是70-85°C。41.权利要求1-40任一项的方法,其中所述靶序列和参考序列是人DNA。42.权利要求1-41任一项的方法,其中所述靶序列是已经用亚硫酸氢钠处理过的甲基化DNA。43.权利要求1-42任一项的方法,其中参考序列是已经用亚硫酸氢钠处理过的甲基化DNA。44.权利要求1-43任一项的方法,其中所述反应混合物包含核酸检测染料。45.权利要求44任一项的方法,其中所述方法在实时PCR装置中进行。46.计算机可读取介质,包含用于进行权利要求1-8任一项的方法的程序指令。47.用于富集靶序列的系统,所述系统包含用于执行权利要求46的计算机可读取介质的程序指令的的存储器。48.权利要求11的方法,其中所述突变等位基因包含SNP。49.权利要求1的方法,其中所述第一变性温度是90-99°C并且所述的Tc是65_89°C。50.权利要求1的方法,其中所述第一变性温度是86-99°C并且所述的Tc是65_85°C。51.权利要求1的方法,其中所述第一变性温度是80-99°C并且所述的Tc是65_79°C。52.权利要求1-3和5-8任一项的方法,其中所述方法用来富集两种或更多种不同的靶序列并且所述方法还包括对所述靶序列特异的一个或更多个额外引物对。53.权利要求1、2、5、6-22、25-34、38-39、41-45和48-52任一项的方法,其中所述方法还包括鉴定所述Tc,其中所述Tc允许所述靶序列/参考序列双链体的偏好性变性。54.权利要求3或4的方法,其中所述方法还包括鉴定所述第二变性温度,其中所述第二变性温度允许所述靶序列/参考序列双链体的偏好性变性。55.权利要求1的方法,其中所述引物对具有低于步骤(b)中所用温度的解链温度。56.权利要求6的方法,其中所述引物对具有低于步骤(b)(i)中所用温度的解链温度。57.权利要求55的方法,其中所述引物对的解链温度低于步骤(b)的温度至少5°C。58.权利要求56的方法,其中所述引物对的解链温度低于步骤(b)(i)的温度至少5°C。59.权利要求1-45或48-58任一项的方法,其在实时反应条件下进行。60.权利要求59的方法,其中实时反应条件使用核酸检测染料。61.权利要求59的方法,其中实时反应条件使用标记的探针。62.权利要求1-45或48-61任一项的方法,其中所述方法在多重测定法中进行。63.权利要求1-45或48-61任一项的方法,其中所述方法在数字PCR平台中进行。64.权利要求1-3或5-8任一项的方法,其中反应混合物包含修饰的核酸。65.权利要求64的方法,其中修饰的核酸是肽核酸。66.权利要求65的方法,其中修饰的核酸是对参考序列特异的引物。67.权利要求1-45或48-66任一项的方法,其中反应混合物包含有机溶剂。68.权利要求67的方法,其中有机溶剂选自由DMSO、甲酰胺、甜菜碱、甘油或其组合组成的组。69.权利要求1、2、5-22、25-34或38-68的方法,其中所述Tc低于参考序列和靶序列二者的Tm。全文摘要本发明涉及用于富集来自样品的低丰度等位基因的方法、组合物、软件和装置。所述方法部分地基于包括在临界变性温度或“Tc”保温反应混合物的改良核酸扩增方法。通过使用本发明,明显改善全部基于PCR的技术的现有检测限。文档编号C12P19/34GK101815789SQ200880109823公开日2010年8月25日申请日期2008年7月31日优先权日2007年8月1日发明者G·马克里吉奥古斯申请人:达纳-法伯癌症研究院有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1