用于分析重复序列的mPCR方法与流程

文档序号:12697617阅读:614来源:国知局
用于分析重复序列的mPCR方法与流程

本申请要求2010年10月29日提交的美国临时申请No.61/408,367的权益,其通过提述完整并入本文。

本申请中所描述的工作在来自Eunice Kennedy Shriver国立儿童健康和人类发展研究所(National Institute of Child Health&Human Development)的拨款号R43HD060450和R44HD060450下部分得到联邦政府资助。因而,联邦政府可以具有本发明的某些权利。

本发明属于核酸分析领域,特别地,涉及用于测定富含GC的模板和产物的甲基化状态的方法。另外,本发明涉及可以依照本文中所描述的方法使用的GC参照标准品。

在某些实施方案中,使用本文中所描述的方法来测定富含GC的基因座的甲基化状态。在一些情况中,富含GC的区域的扩充与各种疾病状态有关。与CGG重复扩充有关的基因座的例子是X染色体上脆性X智力低下-1基因(FMR1)的5’非翻译区(UTR)。此区域中扩充成大于200个CGG重复与FMR1基因的超甲基化有关,并且称为“完全突变”等位基因。这些等位基因与FMR1蛋白生成的损失及病症脆性X综合征(FXS)有关。FXS可以包括智力低下、孤独症、卵巢功能早衰、及其它认知和行为状态。(J.Mol Diag.10(6):496-501(2008))。

用于测定富含GC的模板和FMR1的甲基化状态的方法包括Southern印迹(SB)分析和聚合酶链式反应(PCR)策略。SB分析提供了三联体重复区的大小的粗略测量和甲基化的评估。可以使用甲基化敏感性酶(其不切割甲基化位点)来区别甲基化的和未甲基化的等位基因。然而,通过SB分析测定甲基化状态限于通过凝胶电泳充分解析的等位基因。SB分析还受到需要的基因组DNA(gDNA)材料的量和与高通量规程不相容的繁重工作流限制。(Genet.Med.7(8):584-587(2005))。

PCR策略可以在测定三联体重复区的大小中提供较大的准确性。然而,扩增富含GC的长序列(包括FMR1 5’UTR的完全突变等位基因)中的限制已经约束重复区的量化。例如,已经尝试了对FMR1PCR的优化,并且其包括对常规PCR测定条件的修改。(见Genome Res.6(7):633-8,(1996);J.Mol.Diagn.8:544-550,(2006);及Am J Med Genet.51(4):527-34,(1994))。新近,已经开发出允许可靠扩增超过200个CGG重复的PCR技术。见美国申请No.2010/0209970,其通过提述完整并入本文。然而,单独的PCR不允许表征富含GC的模板的甲基化状态。

几种策略组合PCR与用于评估甲基化的其它方法。大多数方法已经利用5-甲基胞嘧啶对亚硫酸氢盐转化(bisulfite conversion)的抗性以揭示甲基化状态。然而,对于FMR1,例如,基于亚硫酸氢盐的甲基化PCR方法实际上已经限于仅评估男性样品,这是由于混淆女性样品解读的混合甲基化状态,和/或所述方法已经表明对扩充等位基因的有限效用。(见Hum.Mutation 14:71-79,(1999);Clin.Chem.52:1492-1500,(2006);J.Med.Genet.41:1-8,(2004);及Hum.Genet.108:450-458,(2001))。已经报告了亚硫酸氢盐处理的备选,诸如使用甲基化敏感性限制酶,然而,对女性样品的分析仍然是有问题的。(J.Mol Diag.10(6):496-501,(2008))。

至今,除了SB外没有单一办法在男性和女性样品两者中表明对扩充等位基因的精确甲基化评估。因此,需要可以用于表征富含GC的基因座的甲基化和重复状态的快速的、精确的、具有简单工作流的测定法。

本文中所描述的方法涉及基于PCR的技术,其可以在男性和女性样品两者中检测并解析富含GC的重复长度范围间的甲基化状态。总体工作流适合于常规测试和高通量筛选应用,并且为不需要SB分析的全面FMR1分析提供基础。

在一个实施方案中,所述方法涉及表征DNA样品中的FMR基因座,包括下列步骤:

a)使所述样品的第一部分与甲基化敏感性DNA酶接触;

b)将GC参照标准品添加至所述样品,其中所述参照标准品具有至少75%GC丰度;

c)将所述样品的所述第一部分和第二部分进行DNA扩增反应,所述第一部分和第二部分各自含有所述GC参照标准品,其中用不同标记物标记每个部分中的扩增DNA;并

d)分析来自所述样品的所述第一和所述第二部分的扩增DNA,由此表征所述FMR基因座的甲基化状态。

在某些实施方案中,步骤(d)包括毛细管电泳(CE)。在其它实施方案中,在单次CE运行中分析来自所述第一和所述第二部分的所述扩增DNA。在一些方法中,所述GC参照标准品缺乏所述甲基化敏感性DNA酶的识别位点。在某些方法中,所述GC参照标准品具有与天然存在的FMR等位基因不重叠的CE迁移时间。例如,所述GC参照标准品可以具有小于约20、约24至27、或大于约32个CGG重复的相对保留时间。在其它例子中,所述GC参照标准品具有约175至约225个CGG重复的相对保留时间。在一些实施方案中,在使所述第一部分与所述DNA酶接触后将所述GC参照标准品添加至所述样品。

在其它实施方案中,所述扩增反应能够扩增至少200个CGG重复。某些扩增反应包含具有大于1,诸如约2.5至约10的GC/AT比率的dNTP混合物。在某些方法中,FMR基因座是FMR1。在一些方法中,甲基化敏感性DNA酶选自:Hpa II、Eag I、或Nru I。

在其它实施方案中,使所述样品的所述第二部分与对照酶接触。在一些例子中,所述对照酶选自EcoRI和Sau3A1。在其它例子中,所述对照酶选自EcoRI、DpnI、NaeI、和HindIII-HF。

本文中所描述的某些实施方案涉及分析人DNA样品的方法,包括下列步骤:

a)使所述样品的第一部分与甲基化敏感性DNA酶接触;

b)将GC参照标准品添加至所述样品,其中所述参照标准品具有至少75%GC丰度;

c)将所述样品的所述第一部分和第二部分进行DNA扩增反应,其中用不同标记物标记每个部分中的扩增DNA;并

d)分析来自所述样品的所述第一和所述第二部分的扩增DNA,由此检测与脆性X综合征、脆性X关联震颤共济失调综合征、和/或脆性X关联原发性卵巢功能不全有关的基因型。

本文中所描述的某些实施方案涉及包含下式的核酸序列的GC参照标准品:5’-A-B-C-3’,其中A是包含SEQ ID NO:40的至少10个连续核苷酸的序列,其中A能够与基因组FMR1 5’非翻译区特异性杂交;C是包含SEQ ID NO:41的至少10个连续核苷酸的序列,其中C能够与基因组FMR1 5’非翻译区特异性杂交;且B是具有至少75%GC丰度的序列,并且长度为X-300-X+10个核苷酸。X是下列各项之和:a)介于A的3’端与SEQ ID NO:40的最后一个核苷酸之间的核苷酸数目;和b)从SEQ ID NO:41的第一个核苷酸至C的5’端的核苷酸数目。

在某些实施方案中,B的长度为150-200个核苷酸。在其它实施方案中,B具有至少90%GC丰度。在其它实施方案中,B具有至少94%GC丰度。在一个实施方案中,A包含GCGCTCAGCTCCGTTTCGGT(SEQ ID NO:17)。在又一个实施方案中,C包含AGTGCGGGGCTCCAATGGCG(SEQ ID NO:39)。

应当理解,前述一般性描述和以下详细描述都仅仅是例示性且解释性的,而并不如要求保护的那样限制本发明。

附图简述

图1提供了用于测定富含GC的等位基因的甲基化状态的规程工作流的例子,其中使用HpaII作为甲基化敏感性DNA酶。

图2显示了GC参照标准品的例子,所述GC参照标准品设计为以不与天然存在的富含GC的FMR1基因座重叠的相对保留时间迁移。

图3A显示了具有已知FMR1甲基化分数的甲基化DNA标准品的电泳图。每条迹线包括来自细胞系DNA的完全突变等位基因(约645个CGG)的背景中DNA标准品的概况(profile)。

图3B显示了已知输入甲基化的DNA标准品对检出的百分比甲基化的线性拟合的图。背景完全甲基化的645个CGG的等位基因的量化是叠加的(均值=104±5%)。

图4A-D显示了进行mPCR的4种细胞系样品的毛细管电泳图,及匹配的SB数据。

图5A-D显示了具有完全突变等位基因的4种代表性临床样品的毛细管电泳图,及匹配的SB数据。

图6A-D显示了4种代表性临床女性前突变样品的毛细管电泳图,及匹配的SB数据。

图7显示了HEX和FAM通道两者中正常的31个CGG的等位基因的背景中占临床完全突变等位基因的1%质量分数的滴定。

图8显示了占完全未甲基化的完全突变样品(#125)的90%质量分数的背景中占完全甲基化完全突变样品(#08)的10%质量分数的滴定。

图9显示了使用EagI或HpaII分析的临床样品的比较。

图10显示了用于测定富含GC的等位基因的甲基化状态的备选规程工作流,并且将消化对照和CGG DNA对照(CGG参照标准品)在将样品分成两个部分并进行消化反应前添加至样品,在所述消化反应之一中使用HpaII作为甲基化敏感性DNA酶。

图11A-D显示了进行依照图10的备选工作流的mPCR测定法的4种细胞系DNA样品的代表性毛细管电泳图,及来自平行Southern印迹分析的比较数据。在峰下面的框中提供原始保留时间(第一行)、峰身份(第二行)、和峰强度(第三行)。峰强度表示为任意荧光单位的最大值荧光(峰高度)。峰身份缩写如下:DIG.C=消化对照;REF=GC参照标准品;FM=完全突变等位基因;PM=前突变等位基因;NOR=正常等位基因。

图12A-G显示了进行依照图10的备选工作流的mPCR测定法的7种临床标本的代表性毛细管电泳图,及来自平行Southern印迹分析的比较数据。峰下面的框提供了如在图11A-D中的信息。

发明详述

在某些方面,本发明提供了用于表征富含GC的核酸模板的甲基化状态的方法。在例示性的实施方案中,该方法牵涉在存在GC参照标准品的情况中与PCR组合用甲基化敏感性DNA酶处理。本文中所描述的方法可以称为“mPCR”方法。

为了帮助了解本发明,首先定义某些术语。贯穿整个申请提供其它定义。

在权利要求书和/或说明书中与术语“包含”结合使用时,词语“一个/种”或“所述/该”的使用可以意指“一个/一种”,但是它还与“一个/种或多个/种”、“至少一个/种”、和“一个/种或超过一个/种”的意义一致。

“GC/AT比率”意指给定溶液或混合物中dCTP,dGTP及其所有核苷酸类似物的总数的浓度与dATP、dTTP、dUTP及其所有核苷酸类似物的总数的浓度的比率。

“dNTP”代表三磷酸脱氧核苷酸,并且指dATP、dCTP、dGTP、dTTP、dUTP、及其类似物。

“核苷酸类似物”是包含与天然碱基腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)、或尿嘧啶(U)不同的碱基模块、与脱氧核糖相同或相似的糖模块、和至少一个磷酸盐或多个磷酸盐(例如,二磷酸盐或三磷酸盐)模块的分子或离子。核苷酸类似物指特定核苷酸,特别是dATP、dCTP、dGTP、dTTP、或dUTP的类似物,此时它包含三磷酸盐和糖模块及碱基,所述三磷酸盐和糖模块两者的结构和构型适合于通过聚合酶掺入核酸双螺旋中,所述碱基在核酸双螺旋中的碱基配对特性和在核酸双螺旋中通过DNA聚合物掺入基因座与五种先前所列的核苷酸之一最相似,只是dTTP的类似物一般也会是dUTP的类似物,且反之亦然。

“GC丰度”是核酸中作为鸟嘌呤残基、胞嘧啶残基、或其类似物的总体核碱基残基的分数或百分比。例如,含有正好30个胞嘧啶、正好30个鸟嘌呤、正好一个胞嘧啶类似物、和正好一个鸟嘌呤类似物的100nt核酸具有62%的GC丰度。在一些实施方案中,富含GC的模板可以含有至少51,55,60,65,70,75,80,85,90,95,96,97,98,99或99.5%鸟嘌呤残基、鸟嘌呤残基、或其类似物。

I.表征甲基化状态的方法

在某些实施方案中,本发明涉及表征富含GC的核酸模板的甲基化状态的方法。一般地,该方法包括下列步骤:使样品的第一部分与甲基化敏感性DNA酶接触,将GC参照标准品添加至所述样品,将所述样品的所述第一部分和第二部分进行核酸扩增反应,并分析来自所述样品的所述第一和所述第二部分的扩增核酸。在一些实施方案中,所述第一部分和第二部分是差别标记的。

在又一些实施方案中,在扩增前使所述第二部分与对照酶接触,其中所述对照酶不切割扩增序列。对照酶可以选自例如,EcoRI、DpnI、NaeI、和HindIII-HF。其它可能性包括Sau3A、NheI、TfiI、ApaLI、MluCI、NcoI、ScaI、StuI、XmnI和Hpy16611。在一些实施方案中,对照酶选自具有识别位点的限制性内切核酸酶,所述识别位点不存在于通过DNA扩增反应扩增的区域内。在一些实施方案中,对照酶选自如下的酶,该酶在通过DNA扩增反应扩增的区域内的非靶位点处展现几乎没有的非特异性切割(星活性),诸如在通过DNA扩增反应扩增的区域内对非靶位点的小于20%、15%、10%、5%、3%、或1%切割。切割程度按照在通过DNA扩增反应扩增的区域内经历至少一次切割事件的分子的分数表示。

在其它实施方案中,在单一测定法中实施对第一和第二部分的分析。

图1和10显示了概述依照本发明方法的例示性测定法的图。

在某些实施方案中,可以使用本文中所描述的方法来检测与FXS、脆性X关联震颤共济失调综合征、和脆性X关联原发性卵巢功能不全有关的基因型。与这些状况有关的遗传基因座是本领域中已知的,并且包括但不限于FMR1、FMR2、FMR1的5’UTR、FMR2的5’UTR、FMR1的5’UTR内的CGG重复、和FMR2的5’UTR内的CCG重复。如本文中所使用,术语“FMR基因座”指FMR1基因座或FMR2基因座。在别的实施方案中,可以使用所述方法来检测与富含GC的三核苷酸重复病症,诸如FXS、脆性X关联震颤共济失调综合征、和脆性X关联原发性卵巢功能不全、强直性肌营养不良,亨延顿(Huntington)氏病、脊延髓肌萎缩症(spinobulbar muscular atrophy)、齿状核红核苍白球丘脑下核萎缩(Dentatorubropallidoluysian atrophy)、和/或脊髓小脑性共济失调(spinocerebellar ataxia)有关的基因型。与这些状况有关的遗传基因座是本领域中已知的,并且包括但不限于FMR1,FMR2,DMPK,ZNF9,HTT,AR,ATN1,ATXN1-3,ATXN7,ATXN10,CACNA1A,SCA8,PPP2R2B和TBP。见例如Nat Genet.1996May;13(1):105-8;Nat Genet.1996May;13(1):109-13。这些基因座处富含GC的区域的超扩充和/或超甲基化与疾病有关。

A.GC参照标准品

在一些方面,本发明涉及可以依照本文中所描述的方法使用的GC参照标准品。本文中所描述的方法的GC参照标准品是外部参照标准品,并且设计为与FMR基因座共扩增。在一些实施方案中,可以使用GC参照标准品来评估遗传基因座(诸如FMR1基因附近存在的富含GC的基因座)中存在的CGG重复的数目。在例示性的实施方案中,GC参照标准品设计为使得它具有期望的CE相对保留时间。

如本文中所使用,术语“相对保留时间”指与给定长度和/或GC丰度的其它扩增产物的迁移时间相比从GC参照标准品扩增的产物在CE中迁移通过毛细管花费的时间量。在某些实施方案中,与含有已知数目的CGG重复的序列比较GC参照标准品的相对保留时间。在一些例子中,使用GC参照标准品来测定来自人受试者的FMR1基因座中的CGG重复数目。在某些实施方案中,使用相同的扩增引物与遗传基因座比较GC参照标准品的相对保留时间。在一些实施方案中,GC参照标准品在CE测定法中具有如下的相对保留时间,使得它不与天然存在的FMR1等位基因重叠。例如,在测定FMR1基因座中的甲基化状态和CGG重复数目的测定法中,可以包括如下的GC参照标准品,其与含有CGG重复的天然存在的基因组等位基因相比具有0个CGG重复的相对保留时间。另一个实施方案包括具有约40个CGG重复的相对保留时间的GC参照标准品。在其它实施方案中,与基因组样品相比,GC参照标准品具有小于约20、约24至约27、或大于约32个CGG重复的相对保留时间。

例示性的GC参照标准品含有具有下式的序列:

5’-A-B-C-3’

其中A和C代表由正向和反向PCR引物识别的序列,且B是富含GC的序列。一般地,GC参照标准品具有至少50,60,70,75,80,85,90,91,92,93,94,95,96,97,98或99%的GC丰度。序列A可以选自富含GC的区域或CGG重复区上游的基因组序列,而序列C可以选自所述区域下游的基因组序列。在扩增反应期间,这些序列或其互补物可以作为引物识别位点使用,使得与靶序列使用相同引物来扩增参照标准品。

在某些实施方案中,序列A和C分别选自富含GC的区域上游和下游的FMR1 5’-UTR。A和C序列或其互补物可以作为扩增反应的引物使用。序列A的例子包括:CGG TGG AGG GCC GCC TCT GAG C(SEQ ID NO:1),CAG GCG CTC AGC TCC GTT TCG GTT T(SEQ ID NO:2),CAG TCA GGC GCT CAG CTC CGT TTC G(SEQ ID NO:3),TCC GGT GGA GGG CCG CCT CTG AGC(SEQ ID NO:4),GGT TCG GCC TCA GTC AGG CGC TCA GCT CCG TTT CG(SEQ ID NO:5),GGG TTC GGC CTC AGT CAG GCG CTC AGC TCC GTT TCG(SEQ ID NO:6),GCG GGC CGG GGG TTC GGC CTC AGT CA(SEQ ID NO:7),CAG CGG GCC GGG GGT TCG GCC TCA G(SEQ ID NO:8),GCA GCG GGC CGG GGG TTC GGC CTC A(SEQ ID NO:9),GGG CCG GGG GTT CGG CCT CAG TCA G(SEQ ID NO:10),GGG GTT CGG CCT CAG TCA GGC GCT CA(SEQ ID NO:11),GGG GTT CGG CCT CAG TCA GGC GCT CAG(SEQ ID NO:12),GGC GCT CAG CTC CGT TTC GGT TTC ACT TCC(SEQ ID NO:13),TCA GGC GCT CAG CTC CGT TTC GGT TTC A(SEQ ID NO:14),CAC TTC CGG TGG AGG GCC GCC TCT GA(SEQ ID NO:15),TTC CGG TGG AGG GCC GCC TCT GAG C(SEQ ID NO:16),和GCG CTC AGC TCC GTT TCG GT(SEQ ID NO:17)。

序列C的例子包括:CAC CTC TCG GGG GCG GGC TCC(SEQ ID NO:18),ACC TCT CGG GGG CGG GCT CCC(SEQ ID NO:19),ATG GAG GAG CTG GTG GTG GAA GTG CG(SEQ ID NO:20),CAC CTC TCG GGG GCG GGC TCC CG(SEQ ID NO:21),ACC TCT CGG GGG CGG GCT CCC GG (SEQ ID NO:22),CAC CTC TCG GGG GCG GGC TCC CGG(SEQ ID NO:23),CAC CTC TCG GGG GCG GGC TCC CGG CG(SEQ ID NO:24),ACC TCT CGG GGG CGG GCT CCC GGC GC(SEQ ID NO:25),ACC TCT CGG GGG CGG GCT CCC GGC G(SEQ ID NO:26),TGG TGG AAG TGC GGG GCT CCA ATG GCG C(SEQ ID NO:27),TGG AAG TGC GGG GCT CCA ATG GCG C(SEQ ID NO:28),GGA AGT GCG GGG CTC CAA TGG CGC T (SEQ ID NO:29),GTG GAA GTG CGG GGC TCC AAT GGC G(SEQ ID NO:30),TGG TGG TGG AAG TGC GGG GCT CCA A(SEQ ID NO:31),GAG GAG CTG GTG GTG GAA GTG CGG GGC T(SEQ ID NO:32),AGG AGC TGG TGG TGG AAG TGC GGG GCT C(SEQ ID NO:33),CTG GTG GTG GAA GTG CGG GGC TCC AAT G(SEQ ID NO:34),AGA TGG AGG AGC TGG TGG TGG AAG TGC GGG(SEQ ID NO:35),GGA AGT GCG GGG CTC CAA TGG CGC TTT CTA(SEQ ID NO:36),GGA AGT GCG GGG CTC CAA TGG CGC TT(SEQ ID NO:37),TGG AGG AGC TGG TGG TGG AAG TGC G (SEQ ID NO:38),和AGT GCG GGG CTC CAA TGG CG(SEQ ID NO:39)。

SEQ ID NO 40和41显示了CGG重复区上游和下游的FMR1序列。在某些实施方案中,序列A包含来自SEQ ID NO:40的至少10个核苷酸,而序列C包含来自SEQ ID NO:41的至少10个核苷酸。

序列B是一种富含GC的序列,并且可以具有一定的长度,使得参照标准品在CE分析中具有特定的相对保留时间。可以相对于具有限定长度和GC特征的已知标准品测量保留时间。例如,可以选择序列B的长度,从而与基因组样品相比,参照标准品具有小于约20、约24至约27、或大于约32个CGG重复的相对保留时间。可以选择序列B的长度,从而参照标准品具有小于0或约0个CGG的相对保留时间。在某些例子中,参照标准品具有约-100,-90,-80,-70,-60,-50,-40,-30,-20,-10或0个CGG重复的相对保留时间。在一些实施方案中,GC参照标准品具有小于或等于3,2,1,0,-1,-2,-3,-4,-5,-10,-15,或-20个CGG重复的相对保留时间。参照标准品的相对保留时间可以选择为使得它不与引物峰或天然存在的FMR1等位基因重叠。GC参照标准品的相对保留时间也可以选择为使得它不与消化对照(下文讨论)(在使用一种时)重叠。

GC参照标准品可以具有负相对保留时间,例如,在参照标准品比自基因组样品扩增的产物具有更少的在富含GC的区域周围的侧翼序列时。如此,GC参照标准品实际上可以含有正数个CGG重复,但是具有的保留时间等于由于侧翼序列含量差异而具有负数个CGG重复的假设基因组样品。

在一些实施方案中,B的长度是X-300至X+10个核苷酸的长度,其中X是下列各项之和:

a)介于序列A的3’端与富含GC的区域的开始之间的核苷酸数目;和

b)介于富含GC的区域的结尾与序列C的5’端之间的核苷酸数目。

在一些实施方案中,B包含以下序列或由以下序列构成:CGGCGGCGGaGGCGGCGGCGGCGGCGGCGGCGGCGGCGGtGGaGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGaGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGaGGCGGCGGCGG(SEQ ID NO:48)。在一些实施方案中,B包含SEQ ID NO:48的至少50、75、100、或125个核苷酸。在一些实施方案中,B包含以下序列或由以下序列构成:CGGCGGCGGaGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGaGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGaGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGaGGCGGCGGCGG(SEQ ID NO:49)。在一些实施方案中,B包含SEQ ID NO:49的至少50、75、100、或125个核苷酸。在一些实施方案中,B包含以下序列或由以下序列构成,所述序列在严格条件下与SEQ ID NO:48或SEQ ID NO:49杂交。

严格杂交条件的例子是于42℃在包含50%甲酰胺、5X SSC(其中1X SSC是150mM NaCl、15mM柠檬酸三钠)、50mM磷酸钠(pH 7.6)、5X登哈特(Denhardt)氏溶液、10%硫酸右旋糖苷、和20μg/ml变性的、剪切的鲑鱼精DNA的溶液中杂交,接着于65℃在包含0.1X SSC的溶液中清洗。

图2显示了GC参照标准品的例子,所述GC参照标准品具有不与来自富含GC的FMR1基因座的天然存在的序列重叠的相对保留时间。

在某些实施方案中,GC参照标准品包含在质粒或其它载体内。质粒或其它载体可以是线性化的(例如通过限制酶消化来实现),或者保持完整。在一个实施方案中,质粒是pBR322。在将GC参照标准品作为较大的DNA分子(诸如质粒)的一部分添加至样品或样品的一部分时,扩增反应没有必要扩增较大DNA分子的所有部分(例如,可以不扩增的序列可以包括质粒复制起点、抗生素抗性标志物、居间非编码序列,等等),并且出于本公开内容的目的,在测定GC参照标准品的相对保留时间或GC丰度中不考虑包含GC参照标准品的分子中的此类非扩增序列。

可以在用甲基化敏感性DNA酶处理之前或之后将GC参照标准品添加至核酸样品。在用甲基化敏感性DNA酶处理之前添加GC参照物可以降低误差,该误差在其它情况中可以源自将GC参照标准品移液入样品的两个部分,其中之一用甲基化敏感性DNA酶处理,而其中之一不然。也就是说,在用甲基化敏感性DNA酶处理前将GC参照物添加至样品时,可以在将样品分成两个部分前将其添加至样品。在甲基化敏感性DNA酶或对照酶前将GC参照标准品添加至样品的实施方案中,GC参照标准品没有被DNA酶切割,例如,它可以缺乏DNA酶的识别位点和/或它可以是甲基化的,使得它对甲基化敏感性DNA酶的切割有抗性。在用甲基化敏感性DNA酶处理样品的一部分后将GC参照标准品添加至样品时,将GC参照标准品添加至样品的第一和第二部分。对样品添加的GC参照标准品量可以随扩增反应类型和扩增程度(例如,循环数目或等温温育的长度)而变化。例如,在使用PCR作为扩增反应的一些实施方案中,可以添加约750至约12,000个拷贝的GC参照标准品来进行每个PCR反应。

B.消化对照

本文中所描述的方法可以包括使用消化对照。消化对照设计为与样品DNA中的区域,诸如FMR基因座共扩增。消化对照是未甲基化的,并且含有至少一个甲基化敏感性DNA酶识别位点,并且如此在用甲基化敏感性DNA酶处理后被切割。因此,此对照模板报告甲基化敏感性限制性内切核酸酶的消化效率。

在一些实施方案中,消化对照具有一定的结构和长度,使得它在CE分析中具有特定的相对保留时间。在扩增反应包括PCR的实施方案中,可以使用相同的引物来扩增基因组靶基因座和消化对照。源自甲基化敏感性DNA酶消化的消化对照片段不支持消化对照的扩增。在一些实施方案中,与基因组样品相比,消化对照具有小于约20、约24至约27、或大于约32个CGG重复的相对保留时间。在某些例子中,消化对照具有约-100、-90、-80、-70、-60、-50、-40、-30、-20、-10或0个CGG重复的相对保留时间。在一些实施方案中,消化对照具有小于或等于3、2、1、0、-1、-2、-3、-4、-5、-10、-15、或-20个CGG重复的相对保留时间。消化对照的相对保留时间可以选择为使得它不与引物峰或天然存在的FMR1等位基因重叠。消化对照的相对保留时间也可以选择为使得它不与GC参照标准品重叠。

在某些实施方案中,消化对照包含在质粒或其它载体内。质粒或其它载体可以是线性化的(例如通过用限制酶消化来实现),或保持完整。在一个实施方案中,质粒是pBR322。在将消化对照作为较大DNA分子(诸如质粒)的一部分添加至样品或样品的一部分时,扩增反应没有必要扩增较大DNA分子的所有部分(例如,可以不扩增的序列可以包括质粒复制起点、抗生素抗性标志物、居间非编码序列,等等),并且出于本公开内容的目的,在测定消化对照的相对保留时间或GC丰度中不考虑包含消化对照的分子中的此类非扩增序列。

在一些实施方案中,消化对照包含如下序列或由如下序列组成:TCAGGCGCTCAGCTCCGTTTCGGTTTCACGGTGACGGAGGCGCCGCTGCCCGGGGGCGTGCGGCAGCGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCGGCTGGGCCTCGAGCGCCCGCAGCCCAGGAAGTGGAAGTGCGGGGCTCCAATGGCGCT(SEQ ID NO:50)。加下划线的部分是可以进行调节以修饰所得扩增子大小的侧翼序列的例子。在一些实施方案中,消化对照包含SEQ ID NO:50的至少100、150、175、200、或220个核苷酸或由SEQ ID NO:50的至少100、150、175、200、或220个核苷酸组成。在一些实施方案中,消化对照包含如下的序列或由如下的序列组成,所述序列在严格条件下与SEQ ID NO:50杂交。在一些实施方案中,消化对照包含如下的序列或由如下的序列组成,所述序列是SEQ ID NO:50的变型,其修饰为使得它具有更大或更小数目的CGG重复,从而消化对照具有如上文所讨论的相对保留时间。

在一些实施方案中,消化对照和参照标准品的相对保留时间相差1、2、3、4、5、6、7、8、9、10、或更多个CGG重复的等同物。可以在富含GC的扩增反应中发生模板或引物滑动,生成在长度上与初始靶物相差约1-3个CGG重复的产物。如此,在具体的实施方案中,消化对照和参照标准品的相对保留时间相差4或更多个CGG重复的等同物以使信号重叠最小化。在一些实施方案中,消化对照和参照标准品两者都具有小于或等于3、2、1、0、-1、-2、-3、-4、-5、-10、或-15个CGG重复的相对保留时间。在一些实施方案中,消化对照具有上文在部分I.A中对GC参照标准品的一些实施方案所描述的通用一级结构,包括如上文所描述的A、B、和C序列。在消化对照和GC参照标准品两者都包含如上文所描述的A、B、和C序列时,消化对照中的A、B、或C区段中至少一种在长度上可以与其在GC参照标准品中的对应物不同,使得消化对照具有与参照标准品的长度相差至少1、2、3、4、5、或更多个CGG重复的等同物的长度。消化对照仍会具有适合于甲基化敏感性核酸酶消化的甲基化状态(该状态可以与参照标准品的甲基化状态相反)。

对样品添加的消化对照量可以随扩增反应类型和扩增程度(例如,循环数目或等温温育的长度)而变化。例如,在使用PCR作为扩增反应的一些实施方案中,可以添加约750至约12,000个拷贝的消化对照来进行每个PCR反应。

C.甲基化敏感性核酸酶

本文中所描述的方法可以包括使用甲基化敏感性核酸酶。在一些例子中,核酸酶是DNA酶,诸如限制酶。本文中所提供的方法的甲基化敏感性核酸酶差别切割FMR基因座中基于其甲基化状态扩增的部分。对照核酸酶不切割所述部分。

甲基化敏感性DNA酶包括AatII,Acc65I,AccI,AciI,AclI,AfeI,AgeI,AeI-HFTM,AhdI,AleI,ApaI,ApaLI,AscI,AsiSI,AvaI,AvaII,BaeI,BanI,BbvCI,BceAI,BcgI,BfuAI,BfuCI,BglI,BmgBI,BsaAI,BsaBI,BsaHI,BsaI,BsaI-HFTM,BseYI,BsiEI,BsiWI,BslI,BsmAI,BsmBI,BsmFI,BspDI,BspEI,BsrBI,BsrFI,BssHII,BssKI,BstAPI,BstBI,BstUI,BstZ17I,BtgZI,Cac8I,ClaI,DraIII,DrdI,EaeI,EagI,EagI-HFTM,EarI,EciI,EcoRI,EcoRI-HFTM,EcoRV,EcoRV-HFTM,FauI,Fnu4HI,FokI,FseI,FspI,HaeII,HgaI,HhaI,HincII,HinfI,HinP1I,HpaI,HpaII,Hpy166II,Hpy188III,Hpy99I,HpyAV,HpyCH4IV,KasI,MboI,MluI,MmeI,MspA1I,MwoI,NaeI,NarI,NciI,NgoMIV,NheI,NheI-HFTM,NlaIV,NotI,NotI-HFTM,NruI,Nt.BbvCI,Nt.BsmAI,Nt.CviPII,PaeR7I,PhoI,PleI,PmeI,PmlI,PshAI,PspOMI,PspXI,PvuI,RsaI,RsrII,SacII,SalI,SalI-HFTM,Sau3AI,Sau96I,ScrFI,SfaNI,SfiI,SfoI,SgrAI,SmaI,SnaBI,StyD4I,TfiI,TliI,TseI,TspMI,XhoI,XmaI或ZraI(New England Biolabs;Nature Protocols 1:1621-1636(2006))。

在某些实施方案中,甲基化敏感性DNA酶选自HpaI,NruI,EagI,BssHII和HhaI。在某些实施方案中,甲基化敏感性DNA酶是HpaII。

下文显示了选择的甲基化敏感性DNA酶的识别位点。

在某些实施方案中,用甲基化敏感性核酸酶处理样品的第一部分,而用对照核酸酶处理第二部分。对照核酸酶可以是不切割扩增基因座的限制酶。对照核酸酶可以是非甲基化敏感性核酸酶。许多限制酶及其特异性是本领域中公知的。可以在所描述的方法中使用的对照核酸酶的例子包括HindIII-HF,DpnI,NaeI,EcoRI或Sau3A1,等等。上文在部分1的初始部分中更为详细地讨论了对照核酸酶。

D.扩增方法

本发明的方法还包括核酸扩增。存在用于扩增核酸序列的许多方法,包括本领域技术人员已知的逆转录、聚合酶链式反应(PCR)、实时PCR(RT-PCR)、核酸序列-碱基扩增(NASBA)、连接酶链式反应、多重可连接探针扩增、Invader技术(Third Wave)、滚环扩增、体外转录、链置换扩增、转录介导的扩增(TMA)、RNA(Eberwine)扩增、环介导的等温扩增,等等。在一些实施方案中,所述方法进一步包括加工通过扩增反应诸如滚环扩增或环介导的等温扩增生成的连环化扩增产物,例如通过内切核水解切割存在于扩增模板或掺入引物中的识别位点来进行,以便为下游分析提供非连环化扩增产物。

典型的PCR反应包括选择性扩增靶核酸种类的多个扩增步骤,或循环。典型的PCR反应包括三个步骤:使靶核酸变性的变性步骤;使PCR引物(正向和反向引物)组与互补DNA链退火的退火步骤;和热稳定性DNA聚合酶延伸引物的延伸步骤;通过将这些步骤重复多次,扩增DNA片段以生成与靶DNA序列对应的扩增子。典型的PCR反应包括变性、退火和延伸的20或更多个循环。在许多情况中,可以同时实施退火和延伸步骤,在该情况中所述循环仅含有两个步骤。

在某些方法中,对每种靶序列使用引物组。在一些实施方案中,单一引物组可以扩增GC参照标准品和靶核酸两者。在某些实施方案中,引物的长度取决于许多因素,包括但不限于引物间期望的杂交温度、靶核酸序列、和要扩增的不同靶核酸序列的复杂性。在某些实施方案中,引物的长度是约15至约35个核苷酸。在其它实施方案中,引物的长度等于或少于15、20、25、30或35个核苷酸。在其它实施方案中,引物的长度大于35个核苷酸。在一些实施方案中,引物组包含与SEQ ID NO:40杂交的一种引物,和与SEQ ID NO:41杂交的第二种。引物可以包含SEQ ID NO:40中描述的至少10个连续核苷酸,或者引物可以包含与SEQ ID NO:41所述的链互补的至少10个连续的核苷酸。

在某些实施方案中,所述方法包括能够扩增至少100、150、200、300、400、500、600、700、800、900、1000、2000或更多个CGG重复的PCR反应。能够扩增富含GC的大模板的例示性方法记载于例如美国公开文本No.2010/0209970,其通过提述完整并入本文。

PCR反应可以包括以大于1的GC/AT比率且以有助于使用富含GC的模板合成DNA的总dNTP浓度提供dNTP。GC/AT比率可以是约1.1、1.2、1.4、1.6、2、2.5、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25或更高。GC/AT比例可以介于1.1和20、1.1和15、1.1和10、1.1和8、1.1和7、1.1和6、1.1和5、1.2和25、1.4和25、1.6和25、2和25、3和25、4和25、5和25、2和15、2.5和10、或4和10之间。总dNTP浓度可以是约0.4、0.5、0.6、0.7、0.8、0.9、1、1.2、1.5、2、或3mM。dNTP浓度可以介于0.4和3mM、0.5和3mM、0.6和3mM、0.7和3mM、0.8和3mM、0.9和3mM、1和3mM、0.4和2mM、0.4和1.5mM、0.4和1.2mM、0.4和1mM、0.4和0.9mM、0.4和0.8mM、0.4和0.7mM、0.5和2mM、0.5和1mM、或0.6和0.9mM之间。

PCR反应中使用的DNA聚合酶可以包含野生型、经修饰的、嗜热性、嵌合的、工程化的聚合酶、和/或超过一种聚合酶的混合物。例如,DNA聚合酶可以包括精确聚合酶(Exact Polymerase)(5PRIME GmbH)、AccuSureTM DNA聚合酶(Bioline)、PhusionTM AccuPrimeTMPfx(Invitrogen)、Platinum Taq DNA聚合酶高保真性(Invitrogen)、PhireTM热启动DNA聚合酶(Hot Start DNA Polymerase)(New England Biolabs)、Phusiona热启动高保真性DNA聚合酶(New England Biolabs)、JumpStartTM REDTaqTM DNA聚合酶(Sigma-Aldrich)、PfuUltraTM热启动DNA聚合酶(Stratagene)、Cx热启动DNA聚合酶(Stratagene)、PrimeSTARTM HS DNA聚合酶(Takara)、Extensor高保真性(Hi-Fidelity)PCR酶(ABgene)、ACCUZYMETM DNA聚合酶(Bioline)、SAHARATM DNA聚合酶(Bioline)、VELOCITY DNA聚合酶(Bioline)、AccuPOLTM DNA聚合酶(GeneChoice,Inc.)、UniPOLTM DNA聚合酶(GeneChoice,Inc.)、Elongase酶混合物(Invitrogen)、Pfx50TM DNA聚合酶(Invitrogen)、Phusion DNA聚合酶(New England Biolabs)、KOD HiFi DNA聚合酶(Novagen)、KOD XL DNA聚合酶(Novagen)、Expand 20kb PLUS热稳定性DNA聚合酶混合物(Roche Applied Science)、扩充高保真性(Expand High Fidelity)PLUS热稳定性DNA聚合酶混合物(Roche AppliedScience)、扩充高保真性热稳定性DNA聚合酶混合物(Roche Applied Science)、扩充长模板热稳定性DNA聚合酶混合物(Roche Applied Science)、Easy-ATM高保真性PCR克隆酶(Stratagene)、EXLTM DNA聚合酶(Stratagene)、增强型DNA聚合酶(Stratagene)、II融合DNA聚合酶(Stratagene)、Kapa LongRangeTM DNA聚合酶(Kapa Biosystems)、Kapa HiFiTM DNA聚合酶(Kapa Biosystems)、Kapa2GTM强力(Robust)DNA聚合酶(Kapa Biosystems)、Kapa2GTM强力热启动DNA聚合酶(Kapa Biosystems)、Kapa2GTM快速DNA聚合酶(Kapa Biosystems)、Kapa2GTM快速热启动DNA聚合酶(Kapa Biosystems)、LA TAQ DNA聚合酶(Takara)、Optimase DNA聚合酶(Transgenomic,Inc.)、Exo-Pfu DNA聚合酶(Stratagene)、HotMaster Taq DNA聚合酶(5PRIME GmbH)、HotTaq DNA聚合酶(Abnova Corporation)、AmpliTaqDNA聚合酶(Applied Biosystems)、Bst DNA聚合酶Lg Frag(New England Biolabs)、MasterAmpTMTfl DNA聚合酶(EPICENTRE Biotechnologies)、Red Hot DNA聚合酶(ABgene)、Thermoprime Plus DNA聚合酶(ABgene)、Taq-red DNA聚合酶(AppliChem GmbH)、BIO-X-ACTTM长DNA聚合酶(Bioline)、BIO-X-ACTTM短DNA聚合酶(Bioline)、Bioline HybriPolTMDNA聚合酶(Bioline)、BioTherm Taq DNA聚合酶(eEnzyme LLC)、EU-Taq DNA聚合酶(eEnzyme LLC)、Synergy Taq DNA聚合酶(eEnzyme LLC)、RedPOLTM DNA聚合酶(GeneChoice,Inc.)、AccuPrimeTM富含DNA的聚合酶(Invitrogen)、3173DNA聚合酶、Exo Minus(Lucigen)、9Degrees North(Modified)DNA聚合酶(New England Biolabs)、Therminator DNA聚合酶(New England Biolabs)、Pwo DNA聚合酶(Roche Applied Science)、Paq5000TM DNA聚合酶(Stratagene)、YieldAceTM聚合酶(Stratagene)、e2TAKTM DNA聚合酶(Takara)、或天然存在的DNA聚合酶,其来自P.kodakaraensis、激烈火球菌(P.furiosus)、T.gorgonarius、T.zilligii、海岸热球菌(T.litoralis)“VentTM”、P.GB-D“Deep Vent”、T.9N-7、T.aggregans、T.barossii、T.fumicolans、速生热球菌(T.celer)、火球菌属(Pyrococcus)物种菌株ST700、太平洋热球菌(T.pacificus)、P.abysii、T.profundus、T.siculi、T.hydrothermalis、热球菌属(Thermococcus)物种菌株GE8、T.thioreducens,P.horikoshii或T.onnurineus NA1、热球菌属物种9°N-7、热球菌属物种GI-J、热球菌属物种MAR-13、热球菌属物种GB-C、热球菌属物种GI-H、水生栖热菌(Thermus aquaticus)、嗜热栖热菌(Thermusthermophilus)、Thermus caldophilus、丝状栖热菌(Thermus filiformis)、黄栖热菌(Thermus flavus)、海栖热袍菌(Thermotoga maritima)、嗜热脂肪芽胞杆菌(Bacillus stearothermophilus)或热坚芽胞杆菌(Bacillus caldotenax)。

在例示性的实施方案中,在扩增反应期间标记扩增的核酸。在某些例子中,用第一标记物标记用甲基化敏感性DNA酶处理的样品部分,并且用第二标记物标记样品的对照部分。在一些实施方案中,每种标记物通过CE可检测。

标记物包括但不限于:光发射、光散射、和光吸收化合物,其产生或淬灭可检测的荧光、化学发光、或生物发光信号(参见例如Kricka,L.,Nonisotopic DNA Probe Techniquies,Academic Press,San Diego(1992)及Garman A.,Non-Radioactive Labeling,Academic Press(1997))。用作标记物的荧光报告染料包括但不限于荧光素(参见例如美国专利No.5,188,934,6,008,379和6,020,481)、罗丹明(参见例如美国专利No.5,366,860,5,847,162,5,936,087,6,051,719及6,191,278)、苯并吩口恶嗪类(benzophenoxazines)(参见例如美国专利No.6,140,500)、包含供体和接受体对的能量转移荧光染料(参见例如美国专利No.5,863,727;5,800,996;及5,945,526)、和花青(cyanine)(参见例如WO 9745539)。荧光素染料的例子包括但不限于6-羧基荧光素;2',4',1,4,-四氯荧光素;和2',4',5',7',1,4-六氯荧光素。花青染料的例子包括红外染料D1、D2、D3或D4。其它标记物可以源自丽丝胺(lissamine)、藻红蛋白(phycoerythrin)、Cy2、Cy3、Cy3.5、Cy5、Cy5.5、Cy7、FluorX(Amersham)、Alexa 350、Alexa 430、AMCA、BODIPY 630/650、BODIPY 650/665、BODIPY-FL、BODIPY-R6G、BODIPY-TMR、BODIPY-TRX、Cascade Blue、Cy3、Cy5、6-FAM、异硫氰酸荧光素、HEX、6-JOE、Oregon Green 488、Oregon Green 500、Oregon Green 514、Pacific Blue、REG、罗丹明绿(Rhodamine Green)、罗丹明红(Rhodamine Red)、Renographin、ROX、SYPRO、TAMRA、四甲基罗丹明、和/或德克萨斯红(Texas Red),以及能够自另一种标记物产生可检测的且截然不同的染料信号的任何其它荧光模块。荧光素染料的例子包括但不限于6-羧基荧光素;2',4',1,4,-四氯荧光素;和2',4',5',7',1,4-六氯荧光素。在某些方面,荧光标记物选自与CE分析相容的SYBR-Green、6-羧基荧光素("FAM")、TET、NED、ROX、VICTM、或JOE。例如,在某些实施方案中,标记物是能够以不同光谱可解析波长发射光的不同荧光团(例如,4种不同颜色荧光团);某些此类标记的探针是本领域中已知的,并且在上文及美国专利No.6,140,054中描述。在一些实施方案中使用包含报告物荧光团和淬灭剂荧光团的双重标记荧光探针。其它例子可以包括染料,其是常见染料的商品化替代物。应当领会,荧光团对选择为具有独特的发射光谱,从而它们可以容易地区别。

在又一个方面,标记物是用来增强、稳定化、或影响双链体杂交的杂交稳定化模块,例如插入剂和插入染料(包括但不限于溴化乙啶和SYBR-Green)、小沟结合剂、和交联官能团(参见例如Blackburn等编"DNA and RNA Structure"于Nucleic Acids in Chemistry and Biology(1996))。

应当领会,在单一测定法中使用两种或更多种标记物的情况中,选择具有独特发射光谱的标记物,使得它们可以容易地区别。在一些例子中,可以使用FAM和HEX标记物来标记样品的第一部分和第二部分。在其它实施方案中,在本文中所描述的方法中,FAM或HEX可以与NED或ROX标记物等一起使用。

E.分析方法

在一些实施方案中,分析扩增的核酸以测定甲基化状态。在例示性的实施方案中,分析方法是使用本领域技术人员熟悉的仪器诸如ABI 3100、3130、3730、或3500型的毛细管电泳(CE)。其它实现包括能够电泳筛分DNA和多色分辨的任何仪器。例如,也可以使用用于检测WellRed红外染料(D1、D2、D3和D4)的Beckman Vidiera或SEQ6000毛细管电泳系统或者合并IRDyes的Li-Cor仪。可以使用的其它方法包括微射流CE系统诸如Agilent 2100生物分析仪及类似的平台、质谱术、琼脂糖凝胶电泳及随后的扫描密度测定法、和使用磷相仪(phosphorImager)或放射自显影照片的扫描密度测定法分析放射性标记的产物。在其它实施方案中,在单一CE测定法中分析来自样品的第一和第二部分的扩增核酸。

某些分析方法诸如CE容许同时表征模板中存在的CGG重复的甲基化状态和数目。在某些实施方案中,用36或50cm柱使用POP-4、5、6、或7液体聚合物实施CE分析。在一个实施方案中,液体聚合物是POP-7。

在某些实施方案中,可以计算百分比甲基化。可以依照本领域中合适的方法,例如,诸如峰高度、曲线下面积(积分)、或曲线拟合等方法测定在CE电泳图、磷相仪扫描、密度计量扫描、质谱、或其它形式的数据中观察的峰强度。然后,可以比较来自作为对照处理的和通过甲基化敏感性DNA酶进行消化的样品部分的相应峰的峰强度;可以使用GC参照标准品标准化峰强度。例如,可以通过以与对样品的同一部分中的GC参照标准品观察到的峰强度的比率表述每个观察到的峰强度来实施标准化。

在其它实施方案中,甲基化状态可以表征为非甲基化的或甲基化的。在又一些实施方案中,甲基化状态可以分类为非甲基化的、部分甲基化的、或完全甲基化的。

II.样品

本文中提供的方法涉及表征样品中核酸模板的甲基化状态。在某些实施方案中,核酸样品自人获得。例如,样品可以是患者样品。“患者样品”是来自患者的任何生物学标本。该术语包括但不限于生物学流体诸如血液、血清、血浆、尿液、脑脊液、泪液、唾液、淋巴、透析液、灌洗液、精液、和其它液体样品,及生物学起源的细胞和组织。细胞和组织可以包括口腔细胞、漱口水收集物、或皮肤细胞,包括毛囊。该术语还包括自人分离的细胞或自其衍生的细胞,包括培养中的细胞、细胞上清液、和细胞裂解物。它进一步包括器官或组织培养物衍生的流体、组织生检样品、肿瘤生检样品、粪样品、和自生理学组织提取的流体、及自实体组织分离的细胞、组织切片、和细胞裂解物。它还可以包括尸体检查实体组织样品,诸如那些来自脑的。在一些实施方案中,样品含有小于约80、100、150、200、500、或1,000ng DNA。

在一些例子中,样品包括基因组DNA。可以在进行本发明的方法前将DNA与样品的其它非DNA组分分开。许多DNA分离和纯化方法是本领域中已知的。

样品可以含有DNA模板。在本文中所描述的某些方法中,DNA模板可以是由DNA聚合酶催化的反应中的合成靶物。DNA模板的GC丰度可以大于或等于75、80、85、90、95、96、97、98、99、或99.5%C和G残基。DNA模板可以包含含有C和G残基的二、三、或四核苷酸重复。DNA模板可以包含疾病关联基因座内或附近的序列。DNA模板可以至少包含FMR1或FMR2基因的5’UTR的一部分。DNA模板可以包含FMR1 5’UTR的CGG重复或FMR2基因的5’UTR中的CCG重复。DNA模板的大小可以是约50、100、200、300、500、或700bp、或1、1.5、2、2.5、3、4、5、7、或10kb。DNA模板的大小可以介于50bp和10kb、100bp和10kb、200bp和10kb、300bp和10kb、500bp和10kb、700bp和10kb、1kb和10kb、1.5bp和10kb、2bp和10kb、3bp和10kb、50bp和7kb、50bp和5kb、50bp和4kb、50bp和3kb、50bp和2kb、50bp和1.5kb、100bp和7kb、200bp和5kb、或300bp和4kb之间。

III.实施例

以下实施例例示了本发明的多个实施方案,而并不意图限制本发明的范围。

实施例1:用于表征甲基化状态的工作流

图1显示了本文中所描述的mPCR方法的例子。用含有甲基化敏感性DNA酶诸如HpaII I(其降解未甲基化的模板,但是保留甲基化的等位基因)的反应混合物,或者用没有甲基化敏感性酶的对照混合物处理样品DNA。将样品DNA的每个部分在存在外部GC参照标准品的情况下进行PCR。PCR进一步能够扩增具有超过200个CGG重复的等位基因。针对HpaII部分和对照部分的引物具有不同标记物(例如FAM和HEX)。然后,将PCR产物合并,并通过毛细管电泳分析。CE上扩增子信号的丧失指示任一HpaII位点处的消化和甲基化的缺乏,而信号的保留指示相应等位基因的甲基化。从用HpaII消化的给定等位基因的扩增子产量相对于相应未消化的等位基因的扩增子产量的比率测定等位基因甲基化的分数。相对于外部GC参照标准品的信号标准化此比率。

实施例2:实验规程

A.临床和细胞系DNA样品

来自血液样品的gDNA遵循机构审查委员会批准从在M.I.N.D.研究所诊所看到的受试者获得(Filipovic-Sadic等,Clin Chem 2010;56:399-408)。细胞系DNA样品获自Coriell细胞库(Coriell Cell Repositories)(CCR,Coriell医学研究所(Coriell Institute for Medical Research),Camden,NJ)。在PCR前将临床和细胞系DNA样品在10mM Tris,0.5mM EDTA,pH 8.8中稀释至20ng/μL。

B.FMR1甲基化PCR

使用AmplideXTM甲基化PCR试剂(Asuragen,Inc.,Austin,Texas)制备来自每份样品的两个40ng gDNA的等分试样以进行甲基化评估。限制酶来自New England Biolabs。将DNA的一个等分试样与消化缓冲液和甲基化敏感性酶(HpaII,除非另有记录)混合,并将第二等分试样与消化缓冲液和对照酶诸如Sau3AI或EcoRI混合。限制酶以终浓度0.15U/μl存在于反应混合物中。表1中显示了每个反应中缓冲液组分的终浓度的例子(不包括来自酶贮存缓冲液的试剂影响)。

表1:例示性的反应条件

将HpaII和对照反应于37℃在密封的96孔板中温育2小时。对经HpaII处理的(FAM引物)或非HpaII对照(HEX引物)产物制备甲基化PCR试剂的不同PCR主混合物,并直接分配到限制酶消化或对照消化混合物中。每种主混合物含有mPCR AMP缓冲液(Asuragen,产品目录编号145152)、富含GC的聚合酶混合物(Asuragen,产品目录编号145153)、去离子水、和mPCR引物(Fwd:5’TCAGGCGCTCAGCTCCGTTTCGGTTTCA-3’(SEQ ID NO:42);Rev:5’-FAM-或HEX-AAGCGCCATTGGAGCCCCGCACTTCC(SEQ ID NO:43))(Filipovic-Sadic,2010)。每种主混合物还含有外部GC参照标准品(约3000-12,000个拷贝/PCR反应,这取决于PCR循环数目)。

除了自消化缓冲液遗留的额外的0.67mM MgCl2、2.66mM二Tris丙烷(pH 7.0)、和0.266mM DTT(对于消化混合物A样品);额外的10mM TrisHCl(pH 7.5)和20mM NaCl(对于消化混合物B样品);或额外的2.66mM TrisHCl(pH 7.5)和26.6μg/ml BSA(对于消化混合物C样品)外,最终的PCR缓冲液/试剂条件与在AmplideXTM FMR1试剂盒(Asuragen,产品目录编号49402;美国申请No.2010/0209970)中相同。

某些反应可以使用具有40个CGG的相对保留时间的GC参照标准品(SEQ ID NO:44;“40-CGG对照”),其通过将非人DNA序列的30个核苷酸插入含有30个CGG重复的质粒来构建。在PCR步骤期间,从质粒扩增参照标准品。其它例子包括具有0个CGG的相对保留时间的参照标准品(Asuragen,产品目录编号49441;SEQ ID NO:45;“0-CGG对照”),其也包含在质粒中。也使用具有其它迁移时间的非质粒对照,如记录的。

以95℃持续5分钟的初始热变性步骤,接着是97℃持续35秒,62℃持续35秒和72℃持续4分钟的25个循环,和72℃持续10分钟PCR扩增样品。将扩增子准备好进行CE分析,或于-15至-30℃贮存。

如下描述FMR1扩增子的序列以及探查的两个HpaII位点的标示。

5’-X-(CGG重复区)-Y-3’

其中X是TCAGGCGCTCAGCTCCGTTTCGGTTTCACTTTGGAGGGCCGCCTCTGAGCGGGCGGCGGGCCGACGGCGAGCGCGGGCGGCGGCGGTGACGGAGGCGCCGCTGCCAGGGGGCGTGCGGCAGCG(SEQ ID NO:46);且Y是CTGGGCCTCGAGCGCCCGCAGCCCACCTCTCGGGGGCGGGCTCCGCTAGCAGGGCTGAAGAGAAGATGGAGGAGCTGGTGGTGGAAGTGCGGGGCTCCAATGGCGCTT-3’(SEQ ID NO:47)。

在SEQ ID NO:46和47中,加下划线的区域指明以正向和反向引物为边界的序列,而斜体的且加下划线的CCGG序列标示两个HpaII位点。

C.毛细管电泳(CE)

除了指明的情况外,对实验使用3130xl通用分析仪(Applied Biosystems Inc.,ABI,Foster City,CA)。将总共2μL未纯化的PCR产物(各来自经HEX标记的产物和经FAM标记的产物的1μL)与11μL HI-DI(ABI)和2μL ROX1000Size Ladder(Asuragen)混合,于95℃热变性2分钟,并转移到CE系统以进行分析。除了指明的情况外,注射遵循标准的片段分筛条件(36cm,POP7),其使用2.5kV持续20秒和以15kV运行40分钟的注射。在指明的情况中使用ABI 3500xL CE(50cm,POP7)。由于POP7聚合物的分辨率限制,具有大于250个CGG重复的所有FMR1扩增子在CE上具有相似的迁移率。

D.数据分析

使用GeneMapper 4.0(4.1,对于3500xL数据)或PeakScanner V1.0软件(ABI)分析电泳图。通过从具有20、29、31、54和119个CGG重复的模板生成的对照扩增子的线性回归测定碱基对大小向CGG重复数目的转化(Filipovic-Sadic,2010)。使用(Sizei-230.3/2.975)将每个峰的峰大小转化成CGG重复长度。

在MS Excel中将每个检测的等位基因的CGG重复长度和百分比甲基化的结果制成表格。百分比甲基化%Mi以相对于GC参照标准品扩增子峰高度(CTRLHEX或CTRLFAM)标准化的、经消化的(Peaki,FAM)和未消化的样品(Peaki,HEX)之间的峰高度比率计算,如方程式1中显示的:

约100%或名义上超过100%的甲基化数值评分为完全甲基化的。此类数值通常在用于充分呈现的等位基因的测定法的变化范围内观察到,如下文记录的,但是在等位基因特异性信号接近CE仪的检测下部范围并且如此相对于GC参照标准品峰信号在定量上不太可靠时在低丰度等位基因(例如,仅占临床完全突变样品的1%质量分数的输入)的甲基化评估中有时是夸大的(例如,120至137%)。

E.Southern印迹分析

对80份临床样品实施SB分析,如记载于Tassone等,J Mol Diagn2008;10:43-9的。使用EcoRI和EagI(NEB)制备细胞系DNA以进行SB。分类评估SB图像(未甲基化的、部分甲基化的和完全甲基化的等位基因),并测定每份样品中的甲基化百分比,如记载于Tassone,2008的。

实施例3:用甲基化DNA标准品和样品的mPCR的准确性和可再现性

为了评估两色mPCR工作流的准确性,开发一组8种含有30个CGG重复和已知甲基化分数的限定分析标准品。从30个CGG重复的等位基因的PCR产物制备甲基化的和未甲基化的DNA对照,所述PCR产物遵循标准的方案(Sambrook J,Fritsch EF,Maniatis T.Molecular Cloning:A Laboratory Manual.第2版Cold Spring Harbor,NY:CSHL Press,1989)克隆入pBR322中。将30个CGG的标准品用Hpa II甲基转移酶(New England Biolabs,NEB,Ipswich,MA)甲基化,并用HindIII(NEB)线性化。

将0-100%的各种比例的甲基化的或未甲基化的30个CGG的标准品混合,并在20ng/μL 645个CGG的细胞系DNA(NA04025,CCR)中稀释至1.5x 104个拷贝/μL。细胞系DNA样品获自Coriell细胞库(CCR,Coriell医学研究所,Camden,NJ)。将每份样品在消化混合物A中进行HpaII消化(对于对照反应,在消化混合物A中的Sau3A1),在存在40-CGG-对照的情况下进行25个PCR循环,以及进行CE,如实施例2中所描述的。

图3A中显示了一系列电泳图,其突出显示了30个CGG的标准品在FAM通道中的信号比例变化。随着百分比甲基化增加,30个CGG的标准品的信号相对于40-CGG-对照和混合的645个CGG的完全突变等位基因的峰升高。将峰高度变化相对于40-CGG-对照峰高度标准化,并与HEX通道中标准化的比率比较(方程式1)。在已知甲基化分数与mPCR后凭经验得到的分数之间观察到线性关系(R2=0.998),如在三个不同运行日里由两名操作者实施的(图3B),其中在x轴上标示输入甲基化,并且在y轴上标示测量的甲基化。对于每个评估标准品,645个CGG的等位基因的甲基化测定为定量的(104±5%)(图3B)。

在2种CE仪平台(ABI 3130xl和3500xL)上在2种标准等位基因(30和32个CGG,来自女性临床样品)和2种完全突变等位基因(550个CGG和940个CGG)的8个重复间进一步评估mPCR的可再现性。表2中呈现了甲基化分数、标准差、变差系数(CV)、和95%置信区间(CI)。

表2:在两种CE平台间对正常等位基因和完全突变等位基因的甲基化mPCR评估。

计算的mPCR甲基化分数在两种不同平台间产生CV=7-8%(对于正常等位基因),和CV=8-16%(对于完全突变等位基因)。另外,使用8种细胞系样品(包括4种完全突变样品),mPCR结果在2名不同操作者间是可再现的(CV=7%)。有时超过100%的百分比甲基化的测量是所述方法的规定变化的结果,并且出于与SB分析的比较目的,将此类样品作为完全甲基化制成表格。如下文实施例中表明的,mPCR方法产生至少与SB分析一样好的临床样品结果。

实施例4:细胞系DNA的mPCR评估及与SB分析的比较

用8种来自男性和女性样品两者的包含正常的、前突变和完全突变等位基因的商品化细胞系DNA模板评估mPCR。将样品在消化混合物A中进行HpaII消化(对于对照反应,在消化混合物A中的Sau3A1),在存在40-CGG-对照的情况下进行25个PCR循环,以及进行CE,如实施例2中所描述的。表3中汇总了来自mPCR和SB分析的等位基因大小和甲基化状态的结果。

表3:8种细胞系DNA样品的mPCR和SB分析的比较。在图4中以粗体显示样品。

图4A-D中显示了具有匹配SB数据的4种样品的电泳图。在每幅图中,顶部小图显示了没有用HpaII处理的样品部分,而底部小图显示了经消化的样品。在每幅图中显示了来自表3的样品ID以及重复长度。使用Coriell名称(对于大于250个CGG),及在小于250个CGG时使用PCR的结果标记图4中的重复长度。每幅图还包括通过mPCR测定的甲基化百分比。标记为“对照”的峰标示40-CGG-对照。

在每种情况中,mPCR结果与相应的SB数据在定性上一致。例如,如图4A中显示的,男性前突变等位基因(NA06892,90个CGG)通过mPCR呈现2%甲基化,这与仅在SB的未甲基化区域中检出的产物的存在一致。与完全甲基化完全突变等位基因组合的女性正常等位基因(NA07537,图4C)的偏斜X失活(8%甲基化)也与SB分析,及先前发表的数据(Zhou等,Clin Chem52:1492-1500(2006))一致。

mPCR提供了长度多达约250个CGG的复杂样品中等位基因特异性甲基化状态的更为详细的解读。例如,镶嵌(mosaic)女性样品(NA06896,依照CCR的“23/95-140”)检测为具有23、112、136个CGG的一级峰(primary peak)和153、175、196、和219个CGG的4个额外的低丰度峰(图4D)。23个CGG和112个CGG的峰是部分甲基化的,136个CGG的峰是完全甲基化的,而153-219的峰是完全未甲基化的。

这些结果与来自SB分析的结果在定性上相似。SB揭示了主要未甲基化的23个CGG的等位基因、较宽的一组扩充的未甲基化的等位基因(<5.2kb)、和更为限定的一组扩充的甲基化等位基因。重要地,mPCR数据揭示了对SB中的未甲基化污点(smear)样式的个别大小镶嵌贡献。例如,SB图像与如通过mPCR报告的部分甲基化的112个CGG和未甲基化的153-219个CGG的较高重复等位基因一致。

实施例5:用临床DNA样品的甲基化PCR测定法性能

用一组80份临床标本评估FMR1mPCR测定法,所述临床标本代表整个范围的临床相关等位基因大小和甲基化状态,并且选自先前对等位基因大小评估的相同组(Filipovic-Sadic,2010)。如实施例4中所述的那样实施实验。还通过SB测定甲基化状态(Tassone,2008)。将CGG重复长度、百分比甲基化及与SB数据的比较对每份临床样品制成表格(表4)并汇总(表5)。在表4中,将使用mPCR检测的等位基因分组以匹配SB的分辨率限制。具有完全突变等位基因的样品是灰色阴影的,并且那些样品在图5和6中以粗体显示。在每幅图中,标记为“对照”的峰指示40-CGG-对照。

X失活(Rousseau等,J Med Genet 28:830-6(1991))是正常和完全突变样品中女性正常等位基因的百分比甲基化的倒数。平均X失活是0.51(对于正常女性等位基因)(n=8)和0.67(对于女性完全突变(n=12)样品的正常等位基因),这与由de Vries等(分别为0.50和0.71)(de Vries等,Am J Hum Genet 58:1025-32(1996))报告的数值一致。

表4:mPCR重复长度和百分比甲基化与通过SB的分类调用(call)和估计甲基化的比较。

a Rousseau等和de Vries等;数据仅可用于某些样品。

b完全=没有小于5.4kb显带的证据,部分=在印迹的两个区域中显带的证据,非=没有大于5.4kb显带的证据。

c以甲基化的和未甲基化的分开条带之间的条带强度的百分比估值导出。

d图6中显示了电泳图和SB图像。

e图5中显示了电泳图和SB图像。

f在160个CGG(60%甲基化的)处检出的低丰度等位基因。

表5:mPCR和SB分析在具有大于等于55个CGG重复的临床样品的甲基化评估中的一致性。

mPCR结果与SB分析一致,然而,mPCR相对于SB简化并改善不同甲基化状态的检测和解读。由于CE的分辨率较高,SB未解析已经通过mPCR区别的一些等位基因(诸如相似大小的两个前突变)。在这些情况中,将等位基因分类以匹配SB分析的分辨率限制。

经由两种不同实验解决mPCR的灵敏性。首先,31个CGG的正常等位基因背景中占临床完全突变等位基因的仅仅1%质量分数的滴定在HEX和FAM通道两者中都可检出(图7)。其次,可以在占完全未甲基化的完全突变样品(#125)的90%质量分数的背景中鉴定占完全甲基化完全突变样品(#08)的10%质量分数(图8)。这两种样品的甲基化状态得到SB分析确认,如表4中显示的。如此,与图3一致,甚至可以使用临床样品检出10%甲基化镶嵌。

A.完全突变等位基因中甲基化状态的鉴定和解析。

图5中显示了代表性完全突变样品的电泳图和匹配的SB图像。如先前所描述的(Filipovic-Sadic,2010),这些实验中使用的CE构造限制扩增子与那些具有小于250CGG的扩增子的区别解析,并且如此较大的重复扩充物的扩增产物共迁移,尽管精确评估较宽种类的完全突变的总体百分比甲基化,如通过下文的数据支持的。例如,在男性完全突变样品#88(图5A)中,扩充的等位基因主要在SB的甲基化区域中检出,在未甲基化区域中有微弱的产物(约10-20%信号)。mPCR揭示了此样品的82%甲基化,这与SB结果一致。此外,对女性完全突变样品#117使用SB观察到正常等位基因的部分甲基化,扩充等位基因的完全甲基化(图5B)。mPCR结果还指示30CGG等位基因的部分(44%)甲基化,和扩充等位基因的完全(104%)甲基化。

mPCR简化在对于SB而言可以成问题的更为复杂的样品中甲基化状态的鉴定。男性完全突变样品#125(图5C)在未甲基化区域(3至>5kb范围)间呈现低强度污点。使用mPCR,完全突变峰在HEX而非FAM通道中清楚检出,尽管扩增出40-CGG-对照。如此,完全突变等位基因是未甲基化的。在另一个例子(图5D)中,解析大小和甲基化镶嵌性的罕见样式。通过SB分析,完全突变等位基因似乎是部分甲基化的,而mPCR揭示具有偏斜甲基化的两种截然不同的等位基因大小。在未甲基化的较长模板中观察到占优势的完全突变信号,而约200个CGG的不太丰富的模板是完全甲基化的。如此,镶嵌性的大小通过mPCR更为清楚地解析,并且甲基化样式比通过SB指示的甲基化样式更复杂。

B.通过SB分析掩盖的女性前突变等位基因中新颖的偏移样式的鉴定

图6中显示了4种代表性女性前突变样品的电泳图和匹配的SB图像。每种样品的特征性特征是检出较长等位基因的两组重复大小,即53和54-56个CGG、70和71-75个CGG、90和92-101个CGG、及107和109-125个CGG(分别为图6A-D)。在消化和用经FAM标记的引物扩增后,仅检出每个镶嵌样品内较短的CGG重复长度。因为在特征性女性样品的经Hpa II处理的FAM通道中没有观察到大小镶嵌性,在相当重复长度的11种测试的男性前突变等位基因之任一的PCR后也没有观察到它,所以似乎此样式不是聚合酶“打滑(stuttering)”的假象。在每种情况中,前突变等位基因的更多扩充CGG重复是完全未甲基化的。在测试分组内的84%(19名中的16名)女性前突变样品中鉴定出此相同的镶嵌性和偏斜的甲基化样式。相反,SB的分辨率限制仅产生一条可检出的前突变条带,并且如此遮掩此水平的生物学详情。另外,观察到的偏斜镶嵌性对于分析甲基化的HpaII位点不是特异性的。具体地,还用EagI而不是HpaII实施mPCR分析。对对照反应使用消化混合物B中的EcoRI。EagI分析利用如下的CGG对照,其以约-12.8个CGG重复的相对保留时间迁移,并且源自PCR扩增子,而不是基于质粒的40-CGG-对照。另外,PCR引物选择为使得EagI识别位点存在于扩增子中。在用EagI,而不是HpaII处理模板时观察到相同样式,并且使用mPCR方法的修改分析,所述mPCR方法的修改容许评估EagI甲基化位点(图9;“Ref”指HpaII样品中的40-CGG-对照和EagI样品中的-12.8GCC对照)。

mPCR研究规程可以支持高体积样品分析,每名操作者仅需要一天和约2小时的总共亲自实践时间(其中很多可以是自动化的)来加工多至48份样品。另外,mPCR需要仅80ng DNA的输入——与SB相比降低50至100倍,且与亚硫酸氢盐(Panagopoulos等,Hum Mutat 14:71-9(1999);Zhou等,Clin Chem52:1492-500(2006);Dahl等,Nucleic Acids Res 35:e144(2007))或先前报告的HpaII介导的PCR方法(Carrel等,Am J Med Genet 64:27-30(1996);Kline等,Fertil Steril 85:1488-95(2006);Allen等,Am J Hum Genet 51:1229-39(1992))相比降低10倍。因此,与神经元细胞,诸如口腔或皮肤细胞共享外胚层细胞谱系的全血备选样品类型可以适合于mPCR分析,即使它们没有给SB提供足够的DNA产量。

此研究中评估的mPCR技术代表基于PCR的方法,其在男性和女性样品两者中在CGG重复长度的整个范围间检测并解析甲基化状态。总体工作流适合于常规测试和高通量筛选应用。该方法为不需要SB分析的全面FMR1分析提供基础。

实施例6:用其它甲基化敏感性酶的mPCR

为了证明mPCR方法的通用性,使用酶EagI和NruI,及HpaII分析选择的临床样品。一般如实施例2中所描述的那样实施实验,用消化混合物B中的EagI或NruI处理样品2小时,并用消化混合物B中的EcoRI处理对照样品2小时。非质粒-12.8CGG标准品可用于EagI实验,并且非质粒-41CGG标准品与NruI样品一起使用。用于EagI和NruI实验的PCR引物选择为使得扩增子含有合适酶的识别位点。如实施例4中所描述的那样实施HpaII实验。表6比较这些实验的结果。使用各种酶的结果区别非甲基化的与甲基化的等位基因,以及非甲基化的、部分甲基化的、和部分甲基化的等位基因。

表6:HpaII、EagI、和NruI结果的比较

实施例7:使用“0CGG”参照标准品来评估HpaII位点处甲基化的甲基化PCR测定法性能。

使用0-CGG-对照来评估来自Coriell细胞库的6种样品的甲基化状态,所述0-CGG-对照具有在生物学FMR1等位基因的检测范围外部的相对保留时间。使用消化混合物C中的HpaII或Sau3A1(对照),和27个PCR循环,如实施例2中所描述的那样实施实验。如表7中显示的,参照标准品的选择不改变甲基化状态范围(2%甲基化至定量甲基化)间的甲基化数据的解读。将结果与如实施例4中所描述的使用40-CGG-对照产生的那些结果比较。

表7:使用“40CGG”和“0CGG”参照标准品比较FMR1甲基化状态。

实施例8:对照核酸酶

本文中所描述的方法可以包括在对照反应中使用内切核酸酶以切割在FMR1基因座的扩增区外部的大基因组DNA,并且降低与甲基化敏感性消化反应中的那些DNA模板相当且如此对于PCR扩增相当有利的DNA模板的大小。

许多限制酶及其特异性识别位点是充分表征的。为测试选择总共14种商品化的限制性内切核酸酶,包括Sau3A,EcoRI,NaeI,DpnI,HindIII-HF,NheI,TfiI,ApaLI,MluCI,NcoI,ScaI,StuI,XmnI和Hpy16611。

可以在所述方法中使用的限制酶的例子包括Sau3A,EcoRI,NaeI,DpnI和HindIII-HF。Sau3A就模板上的非靶位点的切割而言展现降低的选择性。EcoRI,NaeI,DpnI和HindIII-HF展现出高度的选择性,因为观察到模板(即,以SEQ ID NO:40和41为边界的FMR1基因座区)中非靶位点的很少切割或无切割。

表8:在对照消化反应中测试的限制性内切核酸酶的比较。

实施例9:用于表征甲基化状态的备选工作流

图10中显示了用于表征甲基化状态的备选工作流。在此工作流中,将基因组DNA样品与消化对照和GC参照标准品(在图中称为CGG DNA对照)一起预混合。将DNA混合物的每个部分用甲基化敏感性核酸酶(HpaII)或对照核酸酶(HindIII-HF)进行处理。随后,使用相应的经FAM标记的引物(HindIII-HF反应)或经HEX标记的引物(HpaII反应)将经消化的DNA混合物进行PCR扩增。然后,将PCR产物合并,并通过毛细管电泳分析。

消化对照和GC参照标准品两者在电泳图的早期窗中迁移,并且不干扰样品特异性概况。在经HEX标记的PCR中丧失来自消化对照的扩增子指示HpaII消化的效率。使用GC参照标准品来标准化经FAM标记的和经HEX标记的PCR产物之间的信号强度。使用GC参照标准品在限制酶消化前的添加来标准化每个反应中基因组DNA量的变化性。因此,每个等位基因的甲基化百分比以在相对于来自相应反应的GC参照标准品标准化后经消化的(HEX)和对照反应(FAM)之间的峰高度比率测定。

实施例10:在备选工作流中细胞系DNA的mPCR评估和与SB分析的比较

用来自男性和女性样品两者的包含正常的、前突变、和完全突变等位基因的4种商品化细胞系DNA模板(Coriell医学研究所)评估依照实施例9的备选工作流的mPCR。将每种样品与包含SEQ ID NO:50的消化对照和GC参照标准品(其中A、B、和C序列分别包含SEQ ID NO 17、48、和39)预混合。在添加消化对照和GC参照标准品后,将样品分成两个部分。将样品的一个部分进行HpaII消化,而将另一个进行HindIII-HF消化作为对照反应。然后,使用如在实施例9中的标记引物用两个部分之每个实施25-27个PCR扩增循环,并通过CE解析产物。还通过SB分析来自相同细胞系的DNA。表9中汇总了来自mPCR和SB的等位基因大小和甲基化状态结果。图11A-11D中显示了4种样品的电泳图及相应的SB数据。在每幅图中,顶部小图显示了作为对照的用HindIII-HF处理的样品部分,并且底部小图揭示了用HpaII消化的相同样品。每幅图还包括通过mPCR测定的甲基化百分比。

对于每种样品,mPCR结果始终与SB数据一致。例如,两份男性完全突变样品(NA07862和NA06852)通过mPCR测量为具有≥100%甲基化,这与仅在SB中大于200CGG的等位基因的甲基化区域中存在产物一致。

另外,mPCR提供关于具有复杂镶嵌性的样品中的等位基因特异性甲基化状态的更为详细的信息。例如,两份镶嵌女性样品(NA06896,23/96-140和NA20242,30/73)在SB上检测未具有一级峰,但是这些样品在通过mPCR分析时还揭示SB上不显现的低丰度的峰(图11C-11D)。mPCR数据还揭示每种等位基因对SB上的甲基化样式的单独贡献。例如,NA06896检测为具有完全甲基化的113CGG和138CGG等位基因,和143至>200CGG的未甲基化的较大的等位基因(图11C),这与SB中报告的部分甲基化的FM一致。

表9:4种细胞系DNA样品的mPCR和SB分析的比较。给出100%或更大甲基化的测量的所有样品分类得分为“≥100%”。

实施例11:在备选工作流中用临床DNA标本的mPCR评估

用代表一批临床相关等位基因大小和甲基化状态的一组12种临床标本进一步评估依照实施例9依照备选工作流的mPCR测定法。如实施例10中所描述的,实施实验。表10中汇总了来自mPCR的等位基因大小和甲基化状态结果和与SB的比较。图12A-12G中提供了表10中以*标记的样品的电泳图及相应的SB数据。

mPCR结果与SB分析良好地一致。mPCR比SB提供更高的分辨率,而且容许更为详细地检测及解读不同甲基化状态。SB不解析的一些等位基因通过mPCR容易地区别(诸如相似大小的两个等位基因)。例如,样品#7含有通过SB不能区别的30和31个CGG的等位基因。在mPCR中,这两个等位基因清楚地检测为具有甲基化的30个CGG和未甲基化的31个CGG(图12F),如此揭示了通过SB分析不能检出的等位基因特异性甲基化。

表10:14份临床样品的mPCR和SB分析的比较。图2中显示了以*标记的样品。具有100%或更大的甲基化的所有样品分类得分为“≥100%”。

***

通过考虑本文中公开的发明的说明书和实践,本发明的其它实施方案对于本领域技术人员会是显而易见的。意图认为说明书和例子仅仅是例示性的,本发明的真正范围和精神以所附权利要求书指示。方法中特定次序的步骤列表不应解释为指示所述步骤必须以所述次序实施,除非在存在有相反的明确指示或一个步骤的结果是另一步骤的发生需要的情况中。例如,“使样品的第一部分与甲基化敏感性DNA酶接触”和“将GC参照标准品添加至样品”的步骤可以以任何次序实施,因为步骤无一需要另一个的结果。另一方面,“将样品的第一部分和第二部分进行DNA扩增反应,所述第一部分和第二部分各自含有所述GC参照标准品”在“将GC参照标准品添加至样品”后出现,因为进行的步骤需要样品部分中存在GC参照物,其源自添加步骤。

本文中引用的所有参考文献通过提述完整并入本文。在通过提述并入的出版物和专利或专利申请与说明书中含有的本发明矛盾的程度,说明书会代替任何矛盾的材料。

序列表

<110> LATHAM, Gary J.

CHEN, Liangjing

HADD, Andrew

SAH, Sachin

CAO, Ru

<120> 用于分析重复序列的mPCR方法

<130> 10256.0037-00000

<150> US 61/408,367

<151> 2010-10-29

<160> 50

<170> PatentIn version 3.5

<210> 1

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 1

cggtggaggg ccgcctctga gc 22

<210> 2

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 2

caggcgctca gctccgtttc ggttt 25

<210> 3

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 3

cagtcaggcg ctcagctccg tttcg 25

<210> 4

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 4

tccggtggag ggccgcctct gagc 24

<210> 5

<211> 35

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 5

ggttcggcct cagtcaggcg ctcagctccg tttcg 35

<210> 6

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 6

gggttcggcc tcagtcaggc gctcagctcc gtttcg 36

<210> 7

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 7

gcgggccggg ggttcggcct cagtca 26

<210> 8

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 8

cagcgggccg ggggttcggc ctcag 25

<210> 9

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 9

gcagcgggcc gggggttcgg cctca 25

<210> 10

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 10

gggccggggg ttcggcctca gtcag 25

<210> 11

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 11

ggggttcggc ctcagtcagg cgctca 26

<210> 12

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 12

ggggttcggc ctcagtcagg cgctcag 27

<210> 13

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 13

ggcgctcagc tccgtttcgg tttcacttcc 30

<210> 14

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 14

tcaggcgctc agctccgttt cggtttca 28

<210> 15

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 15

cacttccggt ggagggccgc ctctga 26

<210> 16

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 16

ttccggtgga gggccgcctc tgagc 25

<210> 17

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 17

gcgctcagct ccgtttcggt 20

<210> 18

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 18

cacctctcgg gggcgggctc c 21

<210> 19

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 19

acctctcggg ggcgggctcc c 21

<210> 20

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 20

atggaggagc tggtggtgga agtgcg 26

<210> 21

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 21

cacctctcgg gggcgggctc ccg 23

<210> 22

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 22

acctctcggg ggcgggctcc cgg 23

<210> 23

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 23

cacctctcgg gggcgggctc ccgg 24

<210> 24

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 24

cacctctcgg gggcgggctc ccggcg 26

<210> 25

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 25

acctctcggg ggcgggctcc cggcgc 26

<210> 26

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 26

acctctcggg ggcgggctcc cggcg 25

<210> 27

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 27

tggtggaagt gcggggctcc aatggcgc 28

<210> 28

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 28

tggaagtgcg gggctccaat ggcgc 25

<210> 29

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 29

ggaagtgcgg ggctccaatg gcgct 25

<210> 30

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 30

gtggaagtgc ggggctccaa tggcg 25

<210> 31

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 31

tggtggtgga agtgcggggc tccaa 25

<210> 32

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 32

gaggagctgg tggtggaagt gcggggct 28

<210> 33

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 33

aggagctggt ggtggaagtg cggggctc 28

<210> 34

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 34

ctggtggtgg aagtgcgggg ctccaatg 28

<210> 35

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 35

agatggagga gctggtggtg gaagtgcggg 30

<210> 36

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 36

ggaagtgcgg ggctccaatg gcgctttcta 30

<210> 37

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 37

ggaagtgcgg ggctccaatg gcgctt 26

<210> 38

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 38

tggaggagct ggtggtggaa gtgcg 25

<210> 39

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 39

agtgcggggc tccaatggcg 20

<210> 40

<211> 478

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 40

ccgcggaatc ccagagaggc cgaactggga taaccggatg catttgattt cccacgccac 60

tgagtgcacc tctgcagaaa tgggcgttct ggccctcgcg aggcagtgcg acctgtcacc 120

gcccttcagc cttcccgccc tccaccaagc ccgcgcacgc ccggcccgcg cgtctgtctt 180

tcgacccggc accccggccg gttcccagca gcgcgcatgc gcgcgctccc aggccacttg 240

aagagagagg gcggggccga ggggctgagc ccgcgggggg agggaacagc gttgatcacg 300

tgacgtggtt tcagtgttta cacccgcagc gggccggggg ttcggcctca gtcaggcgct 360

cagctccgtt tcggtttcac ttccggtgga gggccgcctc tgagcgggcg gcgggccgac 420

ggcgagcgcg ggcggcggcg gtgacggagg cgccgctgcc agggggcgtg cggcagcg 478

<210> 41

<211> 500

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 41

ctgggcctcg agcgcccgca gcccacctct cgggggcggg ctcccggcgc tagcagggct 60

gaagagaaga tggaggagct ggtggtggaa gtgcggggct ccaatggcgc tttctacaag 120

gtacttggct ctagggcagg ccccatcttc gcccttcctt ccctcccttt tcttcttggt 180

gtcggcggga ggcaggcccg gggccctctt cccgagcacc gcgcctgggt gccagggcac 240

gctcggcggg atgttgttgg gagggaagga ctggacttgg ggcctgttgg aagcccctct 300

ccgactccga gaggccctag cgcctatcga aatgagagac cagcgaggag agggttctct 360

ttcggcgccg agccccgccg gggtgagctg gggatgggcg agggccggcg gcaggtacta 420

gagccgggcg ggaagggccg aaatcggcgc taagtgacgg cgatggctta ttcccccttt 480

cctaaacatc atctcccagc 500

<210> 42

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 42

tcaggcgctc agctccgttt cggtttca 28

<210> 43

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 43

aagcgccatt ggagccccgc acttcc 26

<210> 44

<211> 400

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 44

aagcttcagc gggccggggg ttcggcctca gtcaggcgct cagctccgtt tcggtttcac 60

ttcccgtgga gggccgcctc tgagcgggcg gcgggccgac ggcgagcgcg ggcggcggcg 120

gtgacggagg cgccgctgcc agggggcgtg cggcagcgcg gcggcggcgg cggcggcggt 180

ggcgacggag gcggcggcgg cgtcggcggc ggcagcggag gcggcggcgg cggcggcggc 240

ggcggcggct gggcctcgtg cgcccgcagc ccacctcttg ggggcggtct ccccgcgcta 300

gcagggctga agagaagaca gtgttcattc atcgccatca gctgcagctg gaggagctgg 360

tggtggaagt gcggggctcc aatggcgctt tctaggatcc 400

<210> 45

<211> 248

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 45

gaattctcag gcgctcagct ccgtttcggt ttcacgctgc cagggggcgt gcggcagcgc 60

ggcggcggag gcggcggcgg cggcggcggc ggcggcggtg gaggcggcgg cggcggcggc 120

ggcggcggcg gcggcggcgg aggcggcggc ggcggcggcg gcggcggcgg cggcggcgga 180

ggcggcggcg gctgggcctc gagcgcccgc agcccaggaa gtgcggggct ccaatggcgc 240

ttgtcgac 248

<210> 46

<211> 127

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 46

tcaggcgctc agctccgttt cggtttcact tccggtggag ggccgcctct gagcgggcgg 60

cgggccgacg gcgagcgcgg gcggcggcgg tgacggaggc gccgctgcca gggggcgtgc 120

ggcagcg 127

<210> 47

<211> 112

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 47

ctgggcctcg agcgcccgca gcccacctct cgggggcggg ctcccggcgc tagcagggct 60

gaagagaaga tggaggagct ggtggtggaa gtgcggggct ccaatggcgc tt 112

<210> 48

<211> 132

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 48

cggcggcgga ggcggcggcg gcggcggcgg cggcggcggt ggaggcggcg gcggcggcgg 60

cggcggcggc ggcggcggcg gaggcggcgg cggcggcggc ggcggcggcg gcggcggcgg 120

aggcggcggc gg 132

<210> 49

<211> 132

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 49

cggcggcgga ggcggcggcg gcggcggcgg cggcggcggc ggaggcggcg gcggcggcgg 60

cggcggcggc ggcggcggcg gaggcggcgg cggcggcggc ggcggcggcg gcggcggcgg 120

aggcggcggc gg 132

<210> 50

<211> 223

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 50

tcaggcgctc agctccgttt cggtttcacg gtgacggagg cgccgctgcc cgggggcgtg 60

cggcagcgcg gcggcggcgg cggcggcggc ggcggcggcg gcggcggcgg cggcggcggc 120

ggcggcggcg gcggcggcgg cggcggcggc ggcggcggcg gcggcggctg ggcctcgagc 180

gcccgcagcc caggaagtgg aagtgcgggg ctccaatggc gct 223

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1