对fmr1和fmr2基因5’非翻译区进行表征的pcr方法

文档序号:392462阅读:372来源:国知局

专利名称::对fmr1和fmr2基因5’非翻译区进行表征的pcr方法
技术领域
:本发明属于DNA合成与分析领域,特别是涉及富含GC的模板和产物。MM自从首次分离到DNA合成酶并确定了体外合成DNA的条件,DNA合成反应已被广泛在生物技术、医药和研究应用中用于制备和分析目的。聚合酶链式反应,或PCR是可以快速和指数性扩增DNA序列的一类DNA合成反应。与其他循环进行的合成反应一样,PCR涉及以循环的方式反复拷贝靶序列。典型的PCR实施过程包括提供与待扩增序列末端互补的引物、合适的缓冲液、镁盐、脱氧核苷三磷酸(dNTPs)和嗜热DNA聚合酶。包含在例如基因组DNA样品中的模板或靶DNA与这些成分在水溶液中接触。混合物在不同温度进行循环,这些温度促进模板的变性、引物与模板的退火、然后聚合酶对引物的延伸,从而产生更多产物。由于每个循环的产物可以在随后的反应中作为模板,产物的量几乎指数增长直至其他反应成分(开始过量存在)被耗尽。参见例如美国专利4,683,202;M.J.McPherson&S.G.Moller,PCR:TheBasics(2ndEd.,Taylor&Francis)(2006)。PCR与其他形式的循环进行的核酸合成反应对于分子生物学、生物技术、以及日渐地对于医学都是标准工具。PCR和相关技术的关键优势是快速、低成本、敏感度、可用于高通量分析以及多能性。扩增只需要几小时甚至更短时间、少数的个别反应可能只耗费1美元以下的试剂、需要的模板量通常在纳克级别、自动化使得每个机器人每天可以进行几千个反应,可以设计出用于扩增几乎任何序列的引物。PCR及相关技术被广泛用于分析和制备应用。PCR的典型制备用途是用于扩增序列使它可以克隆到异源载体中。PCR重要的分析应用包括涉及具有大小多态性的基因座的病情诊断或基因型确定。表现出医学相关的大小多态性的基因座一个例子是,位于人X染色体上的FMRl基因的5’非翻译区(UTR)。正常个体的该区域内通常有5-44个CGG重复。相反,含有200到2000或更多个CGG重复的基因座等位基因指示着脆性X染色体综合征(FXQ。这种等位基因被称为全突变等位基因(FullMutationalleles)0它们在遗传学上不稳定。患有FXS的个体可能有诸如共济失调、卵巢早衰、学习障碍和其他认知/行为状况(包括类自闭症症状)的症状的各种组合。PCR多能性的一个令人遗憾的例外是难以扩增富含GC序列的长片段,包括FMRl5'UTR的全突变等位基因。对FMRlPCR进行的优化企图包括对常规PCR方法条件的改进。参见GenomeRes.6(7):633-8(1996);NucleicAcidsRes.25(19):3957-8(1997);J.Mol.Diagn8:544-550(2006);Am.J.Med.Genet.51(4):527-34(1994)。但是在FMRlPCR方法发展了15年多以后,即使最近的2008年(Genet.Med.10(10):714-9(2008)),一篇发表的关于检测新生儿中脆性X染色体的试验性筛选研究仍报道说“在确定女性中FMRl重复数目的内部验证过程中使用的...两种定量链式聚合酶反应(PCR)分析方法未能产生可靠和可重复的结果(粗体是后加的),此外“由初级或次级分离物进行的二次PCR的失败高度提示FMRlCGG重复的异常大小”。因此,本领域技术人员仍然把可重复地PCR扩增全突变脆性X染色体等位基因看作是有待解决的问题。在通过PCR检测含有超过100个重复的CGG三联重复区时观察到,随着重复数目的增加,检测越来越弱(J.Mol.Diagn.7:605-12(2005))。这一困难,结合FXS综合征的各不相同的特性,导致为了检测全突变等位基因使用诸如Southern印迹的程序(同上)。Southern印迹通常比PCR更耗时,成本更高,没有PCR适合用于高通量应用。Tassone等(J.Mol.Diagn.10:43-49Q008);"Tassone2008”)最近发表的文章描述了用于不经等位基因的全长扩增来检测较长CGG等位基因的分析法。还可参见W02008/011170。该方法利用了与延展的CGG区内的位点杂交的嵌合PCR引物,这样如果存在宽的PCR产物弥散带就表明延展等位基因阳性(同上46页)。随机杂交策略可能导致非特异性扩增和分辨力不足。这篇文章中使用的基础PCR条件已被多个不同实验室进行了检验,似乎可以成功扩增的CGG重复数目是大约350CGG重复。参见例如Salutoetal.,J.Mol.Diagn.7:605-612(2005)Tassone2008中的非特异扩增很明显。Tassone2008图1所示的琼脂糖凝胶中的弥散带似乎含有的产物超过了包含350个重复的扩增子的预期最大长度,因此可能弥散带大部分不代表CGG重复的特异产物(参见Tassone2008的图1;泳道5中的弥散带似乎延伸到上样孔内的空间)。Tassone等在图3的图标中指出他们使用了High-Lowladder(Bionexus,Oakland,CA)作为分子量标记,图1中的标记似乎与图3的相同。High-Lowladder中最大的条带大约101Λ,而图1中的弥散带超过了该条带。这一长度也比分析中使用的样品的预期全长产物长。列出的最大等位基因大小是615个CGG重复。因此,通过给1845nt重复加上大约200nt旁侧序列估计出全长产物预期大约21Λ。非特异性产物会降低基于扩增的脆性X染色体关联等位基因状态的确定方法的准确性和可信度。此外,用于检测脆性X染色体的一些单纯基于基因特异性引物设计的常规PCR方法有局限性。例如,这类方法根据PCR扩增子的迁移率提供对CGG重复数目的一个估计。为了能够准确地确定重复数目,通常相对外部校准物(例如一组合适的分子量标准)来测量扩增子迁移率。能够不依赖外部校准物的情况下准确确定CGG的数目将是可取的。而且,FMRl等位基因可能含有散布在CGG重复中的AGG序列,通常位于重复区段的5’区域。对AGG序列元件的了解可以从一方面表征等位基因。AGG序列元件可以用于临床决策。例如注意到某个仅含有59个重复的FMRl等位基因,从母亲到她的孩子中延展为全突变等位基因的病例,并且已知该等位基因缺乏任何AGG元件。参见Nolinetal.,Am.J.Hum.Genet.72=454-464(2003)。的确,全突变如果会,也是很少在第一批20个CGG重复之后含有AGG元件,生物物理研究表明在CGG重复区段中带有AGG“中断者”的模板更可能采取更常规的DNA结构,更稳定和易于被准确地复制。参见例如Wfeisman-Shomeretal.,NucleicAcidsRes.28:1535-41(2000);Zhongetal.,Am.J.Med.Genet.64:261-5(1996);Larsenetal.,Am.J.Med.Genet.93:99-106(2000);禾口Dombrowskietal.,Hum.Mol.Genet.118371-7W2002)。因此,需要对FMRl基因中诸如AGG元件的中断元件进行作图的技术。所以中断元件作图具有与脆性X染色体综合征,以及其他重复相关疾病有关的研究和诊断应用。现有的AGG元件作图方法包括测序和限制性酶切图谱。DNA测序技术比较繁重,特别是因为该技术通常需要对目标序列进行富集或分离(无论是体外或通过电脑模拟),在脆性X染色体诊断测试中不是常规进行的。基于限制性酶切图谱的方法使用MnlI酶(酶识别GAGG序列,在所述序列5’方向7个碱基对处切割)来根据包含FMRl5’UTR中CGG重复区的PCR产物被消化得到的片段大小来推测AGG的位置。参见例如Eichleretal.,Nat.Genet.8:88-94(1994);Zhongetal.,Am.J.Hum.Genet.57:351-361(1995)。Eichler等的方法包括重复区的PCR扩增、产物纯化、过夜酶切消化、电泳7小时以及Southern印迹。在Zhong等的方法中,“将PCR产物用酚/氯仿提取一次,乙醇沉淀并在10升中用5单位MnlI于37°C部分消化50-70分钟(thePCRproductwasextractedoncewithphenol/chloroform,ethanolprecipitated,andpartiallydigestedin10literswith5unitsatfor50_70min.),,(同上353页)。之后进行电泳和Southern印迹。这两种方法除了PCR和电泳还涉及多个步骤,包括纯化/清理、限制酶切和Southern印迹。本文提供了方法对FMRl和FMR2基因的5’UTR中CGG重复进行定量,以及中断序列的序列成分进行鉴定、定量和揭示。本发明潜在的应用包括给脆性X染色体测试的临床应用。一些实施方案中,发明涉及分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括(a)提供至少两个不同引物,包括含有066、0^、606、06(、60或66(重复的第一引物;和与CGG富含区之外的位点退火的第二引物;(b)用所述至少两个不同引物和包含至少一种CGG富含区的至少一种模板进行PCR,其中所述PCR产生一组产物;(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式(representation);以及(d)得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息。一些实施方案中,发明涉及分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括(a)提供至少三种不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复和5,侧翼(flap)的第一引物;与CGG富含区之外的位点退火的第二引物;和具有第一引物的5’侧翼所包含的序列的第三引物,其中第一引物提供的浓度低于第三引物;(b)用所述至少三种不同引物和所述至少一种模板进行PCR,其中所述PCR产生一组产物;(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;以及(d)由上述表现形式得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息。一些实施方案中,发明涉及分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括(a)提供两种不同引物,其中第一引物含有CGG、CCG、GCG、CGC、GCC或GGC重复;第二引物与CGG富含区之外的位点退火;(b)用所述至少两种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产生一组产物;(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;以及(d)由所述表现形式得出关于CGG重复数目的信息。一些实施方案中,发明涉及分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括(a)提供三种不同引物,其中第一引物含有CGG、CCG、GCG、CGC、GCC或GGC重复和5’侧翼;第二引物与CGG富含区之外的位点退火;第三引物具有第一引物的5’侧翼所包含的序列;(b)用所述三种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产生一组产物;(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;以及(d)由所述表现形式得出关于CGG重复数目的信息。一些实施方案中,发明涉及包含选自SEQIDNO44和SEQIDNO45的序列的寡核苷酸。应当理解,如权利要求,以上概述和下面的详述仅用于示范和解释,不是对发明的限制。发明详述发明涉及扩增CGG重复区全部或部分的扩增反应。一些实施方案中,CGG重复区包含在FMRl的5,UTR或FMR2的5,UTR中。发明涉及这样的扩增反应,所述反应使用与CGG重复区以外退火的引物,和与CGG重复序列、序列的序列置换或反向互补(GCG、CCG、CGC、GCC或GGC)退火的引物。与CGG重复区以外(上游或下游)退火的引物可以是正向或反向引物。引物可以与CGG重复区旁侧的序列退火。这类正向引物的例子包括CGGTGGAGGGCCGCCTCTGAGC(SEQIDNO:1)、CAGGCGCTCAGCTCCGTTTCGGTTT(SEQIDNO:2)、CAGTCAGGCGCTCAGCTCCGTTTCG(SEQIDNO:3)、TCCGGTGGAGGGCCGCCTCTGAGC(SEQIDNO:4)、GGTTCGGCCTCAGTCAGGCGCTCAGCTCCGTTTCG(SEQIDNO:5)、GGGTTCGGCCTCAGTCAGGCGCTCAGCTCCGTTTCG(SEQIDNO:6)、GCGGGCCGGGGGTTCGGCCTCAGTCA(SEQIDNO:7)、CAGCGGGCCGGGGGTTCGGCCTCAG(SEQIDNO:8)、GCAGCGGGCCGGGGGTTCGGCCTCA(SEQIDNO9),GGGCCGGGGGTTCGGCCTCAGTCAG(SEQIDNO:10)、GGGGTTCGGCCTCAGTCAGGCGCTCA(SEQIDNO:11)、GGGGTTCGGCCTCAGTCAGGCGCTCAG(SEQIDNO12)、GGCGCTCAGCTCCGTTTCGGTTTCACTTCC(SEQIDNO13),TCAGGCGCTCAGCTCCGTTTCGGTTTCA(SEQIDNO14),CACTTCCGGTGGAGGGCCGCCTCTGA(SEQIDNO15)、TTCCGGTGGAGGGCCGCCTCTGAGC(SEQIDNO:16)禾口TCAGGCGCTCAGCTCCGTTTCGGTTTCACGGCGGCGGCGGCGGA(SEQIDNO:44)。这类反向引物的例子包括CGCACTTCCACCACCAGCTCCTCCA(SEQIDNO:17)、GGAGCCCGCCCCCGAGAGGTG(SEQIDNO18)、GGGAGCCCGCCCCCGAGAGGT(SEQIDNO19)、CGCACTTCCACCACCAGCTCCTCCAT(SEQIDNO:20)、CGGGAGCCCGCCCCCGAGAGGTG(SEQIDNO:21)、CCGGGAGCCCGCCCCCGAGAGGT(SEQIDNO22),CCGGGAGCCCGCCCCCGAGAGGTG(SEQIDNO:23)、CGCCGGGAGCCCGCCCCCGAGAGGTG(SEQIDNO:24)、GCGCCGGGAGCCCGCCCCCGAGAGGT(SEQIDNO25)、CGCCGGGAGCCCGCCCCCGAGAGGT(SEQIDNO:26)、GCGCCATTGGAGCCCCGCACTTCCACCA(SEQIDNO27),GCGCCATTGGAGCCCCGCACTTCCA(SEQIDNO28),AGCGCCATTGGAGCCCCGCACTTCC(SEQIDNO:2、CGCCATTGGAGCCCCGCACTTCCAC(SEQIDNO:30)、TTGGAGCCCCGCACTTCCACCACCA(SEQIDNO:31)、AGCCCCGCACTTCCACCACCAGCTCCTC(SEQIDNO:3、GAGCCCCGCACTTCCACCACCAGCTCCT(SEQIDNO33),CATTGGAGCCCCGCACTTCCACCACCAG(SEQIDNO:34)、CCCGCACTTCCACCACCAGCTCCTCCATCT(SEQIDNO35),TAGAAAGCGCCATTGGAGCCCCGCACTTCC(SEQIDNO:36)、MGCGCCATTGGAGCCCCGCACTTCC(SEQIDNO:37)、MGCGCCATTGGAGCCCCGCACTTCCCCGCCGCCGCCGCCG(SEQIDNO43)和AAGCGCCATTGGAGCCCCGCACTTCCCCGCCGCCGCCGCCT(SEQIDNO45)。发明进一步涉及方法及其用途,包括提供引物TCAGGCGCTCAGCTCCGTTTCGGTTTCACTTCCGGT(SEQIDNO38)、AGCGTCTACTGTCTCGGCACTTGCCCGCCGCCGCCG(SEQIDNO39)、TCAGGCGCTCAGCTCCGTTTCGGTTTCA(SEQIDNO:40)和TCAGGCGCTCAGCTCCGTTTCGGTTTCACGGCGGCGGCGGCGG(SEQIDNO:41)。发明还涉及包含SEQIDNOs1-38或40之一并在3,端附加CGG重复或其置换和反转序列的引物。发明进一步涉及包括提供引物的方法及其用途,所述引物含有多个序列CGG的三核苷酸重复或其置换和反转序列。在一些实施方案中,引物中的CGG重复数量是四个或五个。在一些实施方案中,引物含有12-15个核苷酸的三核苷酸重复序列。在一些实施方案中,引物含有从3个到10个的多个重复。引物可能含有3、4、5、6、7、8、9或10个重复,和任选的1或2个C和/或G残基的其他部分重复。还可以提供其他引物来保证例如多态位点的结合,或者用于扩增大小已知区域作为内部标准。在一些实施方案中,与CGG重复序列退火的引物对包含中断元件的CGG富含区内的位点优先结合。与CGG重复序列退火的引物优先结合至少一种包含中断元件的位点,通过例如在PCR反应中使用该引物和如上所述与CGG富含区之外结合的反向第二引物,会导致选择性扩增包含所述中断元件的至少一种产物。优先结合活性可以是对包含CGG和AGG元件的位点,或者它们的置换和/或反转序列特异的,比如包含(1)一个AGG元件或者包含A的部分AGG元件,以及(三、四、五、或六个CGG元件和任选的部分CGG元件的位点。优先结合的程度,表达为使用所述引物和结合到CGG富含区之外的反向第二引物进行的扩增反应中被选择性扩增的产物与背景产物的比率,可以是至少3倍、4倍、5倍或6倍;或者可以在3-12倍、3-10倍、3-8倍、4-12倍、4-10倍、4-8倍、3-7倍、4-7倍、3-6倍或4-6倍的范围内。所述至少一种被选择性扩增的产物通常其长度对应沿着模板从与包含中断元件的位点优先结合时第一引物的5’端到与CGG富含区之外位点结合时第二引物的5’端之间的距离。—些实施方案中,与CGG重复序列退火并优先结合包含中断元件的CGG富含区内的位点的引物可能在与CGG重复序列退火的引物部分的内部或者末端含有A、T或U残基,或者换句话说,在CGG、CCG、GCG、CGC、GCC或GGC重复之中或者末端含有A、T或U残基;参见例如以上SEQIDNOs44和45。A、T或U残基可以发生在引物的3,端。当A、T或U残基发生在CGG、CCG、GCG、CGC或GCC、GGC重复的末端时,A、T或U残基与最后一个完整CGG、CCG、GCG、CGC、GCC或GGC重复之间可能有也可能没有部分CGG、CCG、GCG、CGC、GCC或GGC重复。如下文更详细的描述,可以用非天然核苷酸残基代替A、T或U残基,所述非天然核苷酸残基比其他天然核苷酸残基更优先与T/U或A残基配对。类似地,也可能用一或多个比其他天然核苷酸残基更优先与C或G残基配对的非天然核苷酸残基代替构成CGG、CCG、GCG、CGC,GCC或GGC重复的一或多个G和/或C。在本来是由CGG、CCG、GCG、CGC、GCC或GGC重复(任选含有A、T、U或如上讨论的相应的非天然残基)构成的序列中存在一或多个这种非天然残基不影响所述序列在本发明公开中被认为是CGG、CCG、GCG、CGC、GCC或GGC重复序列。在非锚定分析法中,提供的第一引物对不包含中断元件的CGG富含区有优先结合活性。在非锚定方法结果中,较低水平的产物表明存在着中断元件,因为这些产物的合成涉及第一引物结合到包含中断元件的位点上并延伸。低水平的产物在电泳图中显示为缺口或者被较高峰包围的低峰。在锚定分析法中,提供的第一引物对包含中断元件的CGG富含区有优先结合活性。应当注意,可以给这样的反应提供对包含中断元件的CGG富含区内的位点有优先结合活性的引物,所述反应其中的至少一种模板包含至少一种含有0、1或复数个中断元件的CGG富含区;引物“对包含中断元件的CGG富含区有优先结合活性”的说法并不表示例如CGG富含区一定包含复数个中断元件。锚定分析法中,较高水平的产物表明存在着中断元件,因为这些产物的合成涉及第一引物与包含中断元件的位点结合并延伸。高水平产物可能在电泳图中显示为被低峰和/或基线信号包围的峰尖。一些实施方案中,锚定分析法中使用的第一引物在CGG重复之中或者3’端包含A、T或U残基。一些实施方案中,锚定分析法中使用的第一引物包含比其他天然核苷酸残基更容易与A或T/U残基配对的非天然核苷酸残基。非天然核苷酸残基是包含腺嘌呤、胸腺嘧啶、鸟嘌呤、胞嘧啶和尿嘧啶(分别是A、T、G、C和U)之外的核苷碱基的核苷酸残基。优先与A或T/U残基配对的非天然核苷酸残基的例子包括,但不限于比其他天然残基更易于与A或T/U配对的T、U或A的加合物(例如5-取代的尿嘧啶类似物);和包含诸如例如假尿嘧啶和二氨基嘌呤的核苷碱基的残基。两种引物与双链核酸模板的相反两链结合时,它们被认为是反向的引物。本文中,当序列发生在包含CGG重复的链中CGG富含区的5’方向时,序列是CGG富含区的上游。本文中,当序列发生在包含CGG重复的链中CGG富含区的3’方向时,序列是CGG富含区的下游。本发明的方法可能涉及包括提供至少两种或至少三种不同引物的扩增反应。在一些实施方案中,提供了至少三种不同引物,其中的一种引物是另一引物的亚序列。在一些实施方案中,一个引物是包含CGG重复和5’侧翼序列的嵌合引物,另一个引物具有嵌合引物5’侧翼序列的序列。应当注意,具有嵌合引物5’侧翼序列之序列的引物可以,但不必须具有嵌合引物的全部非重复序列。换句话说,一个引物的部分或全部序列可以由另一个引物的序列构成;例如,嵌合引物包含5’侧翼序列,另一个引物可以包含部分或全部5’侧翼的序列。在一些实施方案中,引物含有12-15个核苷酸的CGG重复序列。5’侧翼序列可能对应与CGG重复区相邻或靠近的序列,或者与CGG重复区内的和周围的序列无关。在一些实施方案中,嵌合引物的长度大约是35、40、45、50或55nt。在一些实施方案中,一或多种引物的Tm在60V-75V的范围内,例如大约60V、65°C、70V或75°C。一些实施方案中,提供了至少三种不同引物,其中一种引物提供的浓度低于另一种引物的浓度。例如,任选提供的嵌合引物浓度低于具有嵌合引物5’侧翼序列之序列的引物的浓度。浓度的比率,以倍数表示,可能在2-10,000或更大的范围内,例如是10、20、50、100、200、500、1,000,2,000,5,000或10,000。这种实施方案中,处于较低浓度的引物可以在扩增反应早期的几轮中被耗尽,因此延伸通常全部或者几乎全部来自仍然存在的引物(开始处于较高浓度)。本发明涉及扩增核酸的反应。扩增反应的例子包括,但不限于PCR、NASBA(基于核酸序列性扩增)和SDA(链置换扩增)。参见例如美国专利4,683,202(PCR);美国专利6,326,173;J.ofVirol.Methods151:283-293(2008)(NASBA);以及美国专利5,648,211(SDA)。以上文献均通过引用并入本文。技术人员知道适合提供何种试剂。这些方法每一种都涉及在有助于DNA聚合发生和含有模板的溶液中进行DNA的合成,因此涉及使用DNA聚合酶、核苷酸和二价阳离子(以盐提供,特别是镁)。这些方法的不同在于提供其他的催化活性、使用热循环温育或等温温育以及引物的使用和结构。通常还要提供合适PH的缓冲液,比如pH7和8、6.5和8.5、6和9之间,或者大约7.4或7.5。根据本发明的PCR,至少提供一对与相反两链的末端或者目标区域结合的引物,这样它们各自引导朝向另一引物的合成。反应在不同温度循环从而推动高温下底物变性步骤、低温下引物退火步骤,以及在可能但不一定比退火步骤的温度高的温度下进行延伸。由于一个循环的产物可以在下个循环中作为底物,发生扩增。在NASBA中,除了DNA聚合酶,还提供RNA聚合酶(RNAP),后者也可能是逆转录酶(RT)(例如,可以利用RNA或DNA模板催化DNA合成的酶)。提供的引物类似于PCR中使用的那些,但至少一种引物还包含RNAP可以识别的启动子序列。因此,RT的产物作为RNAP的模板,而RNAP合成RNA作为RT的模板,从而发生扩增。一些形式的NASBA中,提供RNaseH在通过RT合成了RNA-DNA杂交体后产生单链DNA。通过RT和RNAP的联合作用,在不需要反复热变性的情况下进行扩增。SDA技术中以等温和异步方式进行DNA扩增,意味着不是利用循环式热变性来分开两条链的,而是通过DNA合成本身进行链置换,其中3’OH的延伸导致下游链被置换。3’OH先是由外部引物提供,然后通过切口反应提供。需要提供两对引物。‘内部’的一对引物与扩增子周围结合,并且包含含有限制性酶切位点的5’侧翼。另一对“外部”引物定位在远侧,即离目标区域更远。内部引物可以与模板结合,被延伸,然后被相应外部引物的合成所置换。之后,发生置换的DNA通过例如第二链合成成为双链。下一步是将双链分子的一条链切口,这可以通过使用经修饰的核苷酸和限制酶切位点来实现,其中一条链(而非另一条链)上的所述切割位点由于修饰核苷酸而失活。反应中提供了与该位点对应的限制性内切酶,从而生成切口。所得到的切口处的3’OH被DNA聚合酶延伸,将一条链(可以再作为模板要注意,一些展示的链并非最初是全长,但由于形成切口,内部引物帽的远端缺乏互补。这不会削弱引物结合(该引物的非帽部分具有足以稳定退火的长度)且,通过引物结合,产生5’突出端,使聚合酶能进行填充)置换,重新形成的双链分子再次成为切口反应的底物,然后被延伸和置换,导致扩增发生。过程中不需要进行反复热变性。一些实施方案中,本发明的方法包括提供GC/AT比率大于1并且总dNTP浓度有助于利用富含GC的模板来合成DNA的dNIPs。参见美国专利申请12/371,306。GC/AT比率可以是大约1.1、1.2,1.4,1.6、2、2·5、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25或更高。GC/AT比率可以在1.1和20、1.1禾Π15、1.1禾Π10、1.1禾Π8、1禾Π15、1.1和7、1.1禾口6、1.1和5、1·2禾口25、1.4和25、1.6和25、2禾口25、3禾口25、4禾口25、5禾口25、2禾口15、2.5和10,或者4和10之间。总dNTP浓度可以是大约0.4,0.5,0.6,0.7,0.8,0.9、1、1·2、1.5、2或3mM。dNTP浓度可以在0.4和3mM、0.5和3mM、0.6和3mM、0.7和3mM、0.8和3mM、0.9和3mM、1和3mM、0.4和2mM、0.4和1.5mM、0.4和1.2mM、0.4和lmM、0.4和0.9mM、0.4和0.8mM、0.4和0.7mM、0.5和2mM、0.5和ImM,或者0.6和0.9mM之间。“GC/AT比率”意味着给定溶液或混合物中,dCTP、dGTP及其所有核苷酸类似物的总浓度与dATP、dTTP、dUTP及其所有核苷酸类似物的总浓度的比率。“dNTP”代表脱氧核苷三磷酸,是指dATP、dCTP、dGTP、dTTP、dUTP及其类似物。“核苷酸类似物”是包含天然碱基腺嘌呤(A)、胞嘧啶(C)、鸟嘌呤(G)、胸腺嘧啶(T)或尿嘧啶(U)之外的碱基部分、与脱氧核糖相同或类似的糖部分、以及至少一种磷酸或多个磷酸(例如二磷酸或三磷酸)部分的分子或离子。核苷酸类似物是特定核苷酸(特别是dATP、dCTP、dGTP、dTTP或dUTP)的类似物,当它包含结构和构型都适合通过聚合酶引入核酸双螺旋的三磷酸和糖部分,以及这样的碱基时,所述碱基在核酸双螺旋中的碱基配对特性和被DNA聚合酶引入核酸双螺旋的位点与以上列举的5种核苷酸之一非常类似,除了dTTP的类似物通常也是dUTP的类似物,反之亦然。与包括但不限于“核苷”、“碱基”、“核苷碱基”或“残基”等名词关联使用的名词“类似物”应当按照和与“核苷酸”关联时同样方式地解释。一些实施方案中,可以提供强化剂。强化剂有助于成功进行产生富含GC的产物的反应。PCR反应中通常可以包括多种强化剂来提供产量、特异性和一致性,并且可能是通过降低模板DNA的Tm来实现。强化剂可能通过螺旋去稳定、反应抑制剂中和或其他机理,包括未知机理来发挥作用。强化剂包括,但不限于甜菜碱、甜菜碱类似物、甘油、牛血清白蛋白(BSA)、聚乙二醇、氯化四甲胺、7-脱氧-GTP、中性去污剂、二甲基亚砜(DMSO)、甲醇、乙醇、异丙醇、甲酰胺、丙酮、乙酰胺、N-甲基甲酰胺、N,N-二甲基甲酰胺、丙酮、乙酰甲胺、N-甲基乙酰甲胺、N,N-二甲基乙酰甲胺、2-吡咯烷酮、N-甲基吡咯烷酮、丙酰胺和异丁烯胺。中性去污剂包括,但不限于TWEEN-20、β-辛基-葡萄糖苷、辛基-β-硫-吡喃葡萄糖苷、TritonX-100、TritonX_114、NP-40、Brij_35、Brij_58、Tween-80、PluronicF-68、PluronicF-127、脱氧BigCHAP、CHAPS、CHES、壬基苯氧基聚乙氧乙醇(Tergitol-typeNP-40)和辛基苯氧基聚乙氧乙醇(Ig印alCA-630)。甜菜碱类似物包括,但不限于同型丹醇(homodeanol)甜菜碱、丹醇甜菜碱、丙酸甜菜碱、同型甘油甜菜碱、二乙醇同型甜菜碱、三乙醇同型甜菜碱、羟丙基同型甜菜碱、N-甲基-N-(2-羧乙基)吗啉内盐、N-甲基-N-(2-羧乙基)哌啶内盐、N-甲基-N-(2-羧乙基)吡咯内盐、N,N-二甲基-N-(2-羟乙基)-N-(2-磺乙基)铵内盐、N,N-二甲基-N-(2-羟乙基)-N-(3-磺丙基)铵盐、N,N-二羟乙基-N-甲基-N-(3-磺丙基)铵内盐、N,N-二甲基-N-(2-羟乙基)-N-(4-磺丁基)铵内盐、N-甲基-N-(3-磺丙基)吗啉内盐和N-甲基-N-(3-磺丙基)哌啶内盐。可以提供的甜菜碱、甜菜碱类似物和/或其他强化剂摩尔浓度在0.01和5M、0.01和4M、0.01和3M、0.01禾口2.5M、0.02和5M、0.03和5M、0.04和5M、0.05和5M、0.07和5M、0.1禾口5M、0.2禾口5M、0.3禾口5M、0.4禾口5M、0.5禾口5M、0.7禾口5M、1禾口5M、1.5禾口5M、0.1和4M、0.5和3M、1和2.5M,或者1.5和2.5M之间,例如大约0.01,0.02,0.05,0.1,0.2,0.5、0.75、1、1.25,1.5,1.6,1.7,1.8,1.9,2.0,2.1,2.2,2.3,2.4,2.5、3、3·5、4、4·5或5M。替代地,可以提供的强化剂w/v或ν/ν百分比浓度在0.1和50%,0.2和50%,0.5和50%、1和50%,2和50%,5和50%,0.1和40%,0.1和30%,0.1和20%,0.5和40%,1和30%或者2禾口20%之间,例如大约0.1,0.2,0.5、1、2、5、10、15、20、25、30、35、40、45或50%的体积百分比。中性去污剂可以提供体积百分比在0.0001和10%,0.0002和10%,0.0005和10%,0.001和10%,0.002和10%,0.005和10%,0.01禾口10%,0.02禾口10%,0.05禾口10%,0.0001和5%,0.0001和2%,0.0001和1%,0.0005和1%,或者0.001和之间,例如大约0.0001,0.0002,0.0003,0.0004,0.0005,0.0006,0.0007,0.0008,0.0009,0.001,0.002、0.003,0.004,0.005,0.006,0.007,0.008,0.009,0.01,0.02,0.03,0.04,0.05,0.06,0.07、0.08,0.09,0.1,0.2,0.3,0.4,0.5,0.6,0.7,0.8,0.9、1、2、3、4、5、6、7、8、9或10%的体积百分比。本领域技术人员能够确认各种强化剂的适宜浓度。本发明涉及这样的方法,所述方法包括给扩增反应提供缓冲液。所述缓冲液可以包括例如但不限于,三羟甲基氨基甲烷(Tris)、双三羟基甲氨基丙烷(bis-trispropane)、重碳酸盐、磷酸盐、甘氨酸、组氨酸、4-(2-羟乙基)-1-哌嗪乙磺酸(HEPEQ、3-(N-吗啉)丙磺酸(M0PQ和各种共轭碱/酸及其盐。本发明涉及这样的方法,所述方法包括提供至少一种DNA聚合酶由dNIPs以模板依赖性方式合成DNA。DNA聚合酶可以包括野生型、改造过的、嗜热的、嵌合的、工程化的和/或一种以上聚合酶的混合物。DNA聚合酶可以包括ExactPolymerase(5PRIMEGmbH),AccuSureDNAPolymerase(Bioline),PhusionAccuPrimePfx(Invitrogen)、PlatinumTaqDNAPolymeraseHighFidelity(Invitrogen)、PhireHotStartDNAPolymerase(NewEnglandBiolabs)、PhusionHotStartHigh-FidelityDNAPolymerase(NewEnglandBiolabs)>JumpStartREDTaqDNAPolymerase(Sigma-Aldrich)、PfuUltraHotstartDNAPolymerase(Stratagene)、PfuTurboCxHotstartDNAPolymerase(Stratagene)、PrimeSTARHSDNAPolymerase(Takara)、ExtensorHi-FidelityPCREnzyme(ABgene)、ACCUZYMEDNAPolymerase(Bioline),SAHARADNAPolymerase(Bioline),VELOCITYDNAPolymerase(Bioline)、GeneChoiceAccuPOLDNAPolymerase(GeneChoice,Inc.).GeneChoiceUniPOLDNAPolymerase(GeneChoice,Inc.)、ElongaseEnzymeMix(Invitrogen)、Pfx50DNAPolymerase(Invitrogen)、PhusionDNAPolymerase(NewEnglandBiolabs)、KODHiFiDNAPolymerase(Novagen)、KODXLDNAPolymerase(Novagen)、Expand20kbPLUSThermostableDNApolymerasemixture(RocheAppliedScience)、ExpandHighFidelityPLUSThermostableDNApolymerasemixture(RocheAppliedScience)、ExpandHighFidelityThermostableDNApolymerasemixture(RocheAppliedScience)、ExpandLongTemplateThermostableDNApolymerasemixture(RocheAppliedScience)、Easy-AHigh-FidelityPCRCloningEnzyme(Stratagene)、EXLtmDNAPolymerase(Stratagene)、HerculaseEnhancedDNAPolymerase(Stratagene)、Herculase⑧IIFusionDNAPolymerase(Stratagene)、KapaLongRangeDNAPolymerase(KapaBiosystems)、KapaHiFiDNAPolymerase(KapaBiosystems)、Kapa2GRobustDNAPolymerase(KapaBiosystems)、Kapa2GRobustHotStartDNAPolymerase(KapaBiosystems)、Kapa2GFastDNAPolymerase(KapaBiosystems)、Kapa2GFastHotStartDNAPolymerase(KapaBiosystems)、LATAQDNAPolymerase(Takara)、OptimaseDNAPolymerase(Transgenomic,Inc.)、Exo-PfuDNAPolymerase(Stratagene)、HotMasterTaqDNAPolymerase(5PRIMEGmbH)、HotTaqDNAPolymerase(AbnovaCorporation)、AmpliTaqGold⑧DNAPolymerase(AppliedBiosystems)、BstDNAPolymeraseLgFrag(NewEnglandBiolabs)、MasterAmpTflDNAPolymerase(EPICENTREBiotechnologies)ΛRedHotDNAPolymerase(ABgene)、ThermoprimePlusDNAPolymerase(ABgene)、Taq-redDNAPolymerase(AppliChemGmbH)、BIO-X-ACTtmLongDNAPolymerase(Bioline)、BIO-X-ACTShortDNAPolymerase(Bioline)、BiolineHybriPolDNAPolymerase(Bioline)、BioThermTaqDNAPolymerase(eEnzymeLLC)、EU-TaqDNAPolymerase(eEnzymeLLC)、SynergyTaqDNAPolymerase(eEnzymeLLC)ΛGeneChoiceRedPOLDNAPolymerase(GeneChoice,Inc.)^AccuPrimeGC-RichDNAPolymerase(Invitrogen)ΛPyroPhage3173DNAPolymerase、ExoMinus(Lucigen)、9DegreesNorth(Modified)DNAPolymerase(NewEnglandBiolabs)、TherminatorDNAPolymerase(NewEnglandBiolabs)、PwoDNAPolymerase(RocheAppliedScience)、Paq5000DNAPolymerase(Stratagene)、YieldAceDNAPolymerase(Stratagene)、e2TAKDNAPolymerase(Takara)或来自下述的天然存在的DNA聚合酶火球菌(P.kodakaraensis)、强烈火球菌(P.furiosus)、热球菌(T.gorgonarius、Τ.zilligii、Τ.Iitoralis“VentTM”)、P.GB-D"DeepVent”、热球菌(Τ.9Ν-7、Τ.aggregans、Τ.barossii、Τ.fumicolans、Τ.celer)、火球菌(Pyrococcussp.ST700株)、太平洋热球菌(T.pacificus)、海底火球菌(P.abysii)、深栖热球菌(T.profundus)、Τ.siculi、热水热球菌(Τ.hydrothermalis)、Thermococcussp.GE8株、Τ·thioreducens)、火球菌(P.horikoshii)或热球菌(T.onnurineusNAl、Thermococcussp.9°N_7、Thermococcussp.GI-JΛThermococcussp.MAR—13、Thermococcussp.GB-CΛThermococcussp.GI-H)、水生栖热菌(Thermusaquaticus)、嗜热栖热菌(Thermusthermophiles)、栖热菌(Thermuscaldophilus)、丝状栖热菌(Thermusfiliformis)、黄栖热菌(Thermusflavus)、海栖热袍菌(Thermotogamaritime)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)或热坚芽抱杆菌(Bacilluscaldotenax)。通过发明获得的数据,例如测试结果,可以用于诊断是否存在某状况或疾病的过程。利用本发明获得的数据可以用于确定某个体的基因型。通过发明获得的数据可以用于检测与脆性X染色体综合征、脆性X染色体相关震颤共济失调、和脆性X染色体相关原发性卵巢功能不全关联的基因型。与这些状况相关的基因座是本领域已知的,包括但不限于FMR1、FMR2、FMRl的5'UTR、FMR2的5'UTR、FMRl的5'UTR内的CGG重复,以及FMR2的5’UTR内的CGG重复。在其他实施方案中,通过发明获得的数据可以用于检测与富含GC三核苷酸重复紊乱和/或中断元件关联的基因型,比如脆性X染色体综合征、脆性X染色体相关震颤共济失调综合征、脆性X染色体相关原发性卵巢功能不全、强直性肌营养不良、亨廷16顿舞蹈症、脊延髓肌萎缩、齿状核红核苍白球丘脑下核萎缩和/或脊髓小脑性共济失调。中断元件,正如其名字暗示的,打断一系列的重复序列。CGG富含区可能包含或不包含中断元件。因此,CGG富含区可以包含一系列三核苷酸重复,在这些系列中有至少一种中断元件。与这些状况相关的基因座是本领域已知的,包括但不限于FMR1、FMR2、DMPK、ZNF9、HTT、AR、ATN1、ATXN1-3、ATXN7、ATXN10、CACNA1A、SCA8、PPP2R2B禾口TBP。参见例如Nat.Genet.13(1)105-8(1996);Nat.Genet.13(1)109-13(1996)。方法可以包括确定CGG富含区任何一端,例如任何一端的60、90、120、150、180、210、M0、270或300bp内是否存在中断元件,所述CGG富含区是样品中含有的至少一种等位基因所包含的。确定样品中含有的至少一种等位基因所包含的CGG富含区任何一端给定距离内是否存在中断元件,应当理解为包括确定整个CGG富含区内是否存在中断元件,从而整个CGG富含区都处于任何一端给定距离内。一些实施方案中,方法包括不依靠辅助或反射方法对至少一种CGG富含区进行分析,所述辅助或反射方法包括诸如Southern印迹、限制性消化或测序(例如Sanger测序、Maxam-Gilbert测序、连接法测序(ligationsequencing)以及包括可逆中止碱基测序和焦磷酸测序的单分子边合成边测序(又称为第二代测序技术))的程序。但方法可以包括如本文所述确定至少一种CGG富含区的相关信息,比如长度和/或中断元件组成和位置。一些实施方案中,方法包括通过高分辨率技术,由文中所述扩增反应产生的产物大小和丰度来获取确定至少一种CGG富含区相关信息,比如长度和/或中断元件组成或位置的充分必要fn息。关于至少一种CGG富含区中是否存在中断序列或中断序列处于至少一种CGG富含区的何处的信息可能包括的信息有比如样品中的至少一种模板所包含的至少一种CGG富含区是否含有中断序列;在有一个以上不同模板的情况中,样品中的每个模板是否含有中断序列;至少一种CGG富含区中存在的中断序列数目的下界估计;和/或至少一种中断元件的至少一种位置(包括如下文讨论的,确定到给定准确水平)。鉴于本领域普通技术人员的知识,以上列出的具体类型的信息不包括其他类型可以通过本文明确或暗含地公开的发明方法确定的信息。一些实施方案中,方法包括进行至少两个分析,其中每个分析包括(a)提供引物,其中所述至少两个分析的引物不是相同的;(b)进行扩增反应来产生一组产物;(c)将产物分开,展现所述至少两个分析产生的产物的大小和丰度;以及(d)得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息。一些实施方案中,得出的信息包括那些如果只进行一个分析则无法得到的信息,比如在样品包含至少两个不同的含有CGG富含区的模板和CGG富含区中的至少一种存在至少一种中断元件的情况中,至少两个CGG富含区中的哪一个包含至少一种中断元件。例如,图10中显示了根据一个分析的结果,这类信息可能不明确的情形。文中讨论了其他可能的不明确之处,以及如何解决的例子。在一些实施方案中,至少两个分析包括锚定分析和非锚定分析。在一些实施方案中,所述至少两个分析使用了包含CGG、CCG、GCG、CGC、GCC或GGC重复的反方向引物。就是说,第一分析可以包括提供引物,所述引物含有一个包含重复的朝着上游方向的引物;第二分析可以包括提供引物,所述引物含有一个包含重复的朝着下游方向的引物;或者相反。在一些实施方案中,方法包括至少三个分析,包括至少两个非锚定分析和至少一种锚定分析,或者反过来。所述至少两个非锚定(或锚定)分析可以如前一段落讨论的,使用包含CGG、CCG、GCG、CGC、GCC或GGC重复的反方向引物。应当注意一些情况中,“一组产物”可能不包含复数个大的或可检测到的产物,比如在用包含最多一个CGG富含区的样品进行的锚定分析中,而其中CGG富含区含有最多一个中断序列。如果一个分析所用的引物中至少有一个与其他分析所用的引物不同,则方法之间的引物被认为“不相同”;换句话说,一些引物可以是一样的。方法可以包括通过进行如上所述的至少两个分析,确定杂合、异倍体或镶嵌基因型的至少一种细节,其中扩增反应使用不相同的引物组,所述至少一种细节是通过比较至少两个扩增反应的结果而确定的。样品的基因型是指样品的来源的基因型;对于混合样品的情况,这个名词涵盖了多个个体基因型。具有杂合基因型的样品包含来自这样的细胞的遗传物质,所述细胞含有包含CGG富含区的基因座的两个等位基因。具有镶嵌基因型的样品包含含有CGG富含区的基因座的至少两个等位基因,并且样品所来源的细胞中含有CGG富含区的基因座的等位基因中至少一种是基因不同的。具有镶嵌基因型的样品所包含的至少两个等位基因可以根据它们的丰度划分为主要或次要等位基因。丰度最大的等位基因被认为是主要等位基因,丰度最小的等位基因被认为是次要等位基因;当存在两个以上等位基因时,根据它们的相对丰度(表达为百分比)在算术上是更接近具有最大丰度还是最小丰度的等位基因来分类为主要或次要。例如,在包含相对丰度分别为60%、31%和9%的第一、第二和第三等位基因的样品中,第二等位基因被认为是次要等位基因。主要和次要等位基因的存在也可能是异倍体造成的,例如,如果基因组包含三个拷贝的CGG富含区,其中两个是相同的(主要等位基因),一个不同(次要等位基因)。异倍体在下文有详细讨论。一些实施方案中,方法包括检测样品是否包含相对丰度至少δ^Α1^、?1^』1^、9%、10%、15%、20%或25%的次要等位基因。应当理解,次要等位基因的CGG富含区与主要等位基因的CGG富含区不同。例如,次要等位基因含有的CGG富含区可能有不同的重复数目和/或不同的AGG元件分布。一些实施方案中,方法包括检测样品是否包含含有中断元件的次要等位基因。一些实施方案中,方法包括以下文讨论的准确程度检测中断元件在次要等位基因中的位置。具有异倍体基因型的样品包含不是整倍数的含CGG富含区的基因座的多个等位基因。对于配子和已经发生减数分裂的种系细胞中的常染色体基因座,整倍数是1;除了雄性配子和已经发生减数分裂的雄性种系细胞中的性染色体基因座,对个体细胞,整倍数可能是0或1,对于群体平均为大约0.5(根据存在的携带X和Y染色体的细胞的数量而有差别)。对于雄性体细胞和还未发生减数分裂的雄性种系细胞中的X染色体基因座,整倍数也是1。对于体细胞和还未发生减数分裂的种系细胞中常染色体上的基因座,对于雌性体细胞和还未发生减数分裂的雌性种系细胞中的X染色体基因座,整倍数是2。样品有可能具有杂合、异倍体和镶嵌这些情况中的一种以上。镶嵌基因型可能发生在例如来自一些个体的样品中,所述个体包含来源于不同祖细胞(接合子、囊胚细胞、干细胞等)的细胞,或者包含由于体细胞突变(包括重复数目的改变,比如重复延展)而基因不同的细胞。异倍体存在于一些综合征中,例如唐氏、特纳氏和克氏(Klinefelter’s),也可能经由染色体不分离事件体细胞发生;这类事件会产生能够提供异倍体样品的个体,可能也是或者不是杂合体。可以对样品进行分析来确定有关基因型的至少一种细节,所述样品包含含有CGG富含区的基因座的至少两个不同等位基因(由于该基因座是杂合、异倍体或镶嵌中的至少一种情况)。所述至少一种细节可以包括所述至少两个不同等位基因中的一个、两个、都没有或者两个以上(如果可行)是否包含至少一种中断元件。所述至少一种细节可以包括所述至少两个不同等位基因中的至少一种所包含的中断元件的最小数目。例如,可以确定出一个等位基因包含至少一种中断元件。所述至少一种细节可以进一步包括另一个等位基因包含例如至少两个中断元件。所述至少一种细节可以包括所述至少一种中断元件在一个等位基因上的位置。一些实施方案中,所述至少一种细节包括由单个分析的结果不能明白地确定的关于杂合、异倍体和/或镶嵌样品的基因型的至少一种细节。以下列举了根据单个分析的结果可能是含糊的细节1.单个分析的结果可能表明存在至少一种中断元件,但该结果对于哪个等位基因包含所述至少一种中断元件可能不清楚。2.单个分析的结果可能表明存在至少两个中断元件,但该结果对于这些中断元件包含在相同等位基因或不同等位基因中可能不清楚。3.单个分析的结果可能表明存在至少三个中断元件,但该结果对于所述至少三个中断元件在至少两个不同等位基因中是如何分布的可能不清楚。4.单个分析的结果可能对于第一等位基因的某位点是否存在中断元件不明确,比如被第二等位基因对应的大的峰信号遮盖了产物大小和丰度的表现。在一些实施方案中,本发明的方法导致合成的产物不含或者没有较大部分的非特异性扩增物质。在一些实施方案中,当模板是以下实施例1-3中描述的样品之一时,方法导致合成的产物不含或者没有较大部分的非特异性扩增物质。在一些实施方案中,本发明的方法导致合成的产物不含或者没有较大部分的超过预期大小的非特异性扩增物质,所述预期大小是通过将CGG富含区长度加上根据第二引物退火位置进行的调整后计算得到的。一些实施方案中,通过对产物大小和含量表现的信号进行光密度测定或整合,确定产物含有低于20%、15%UO^jW、2%或的物质大于前一句中描述的预期大小。在一些实施方案中,所述表现是电泳图。正如本文定义的,当产物如上确定含有低于大约10%的物质超过预期大小时,产物“基本不含”非特异性扩增物质。发明涉及包括对模板进行分析的方法,所述模板含有富含GC的重复序列,比如例如CGG或CCG三核苷酸。所述分析可以包括实施扩增反应和以高分辨率将产物分开。高分辨率可能是足够将包含例如20与21、或20与22、或20与23、或20与24、或20与25个三核苷酸重复的产物区分开;或者在一些实施方案中,是足够将长度相差1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17或18个核苷酸或碱基对的产物区分开的分辨率。可以应用在本发明的方法中实现这一分离步骤的技术的例子包括,但不限于毛细管电泳和聚丙烯酰胺凝胶电泳(PAGE;—些PAGE实施方案在本领域经常被称为“跑测序胶”),或者“芯片实验室”类型的微流体/电泳系统。用于进行毛细电泳的仪器可以从例如AppliedBiosystems(ABI),Beckman,Agilent和Qiagen等供货商购买,合适的仪器包括但不限于ABI310、3100、3130/3130xl或3730/3730x1;BeckmanP/ACEMDQ;Agilent2100Bioanalyzer和QiagenQIAxcel。通过电泳分离产物的过程可能包括使用液体聚合物,例如均由AppliedBiosystems销售的P0P-7、P0P-6、P0P_5或P0P-4。在一些实施方案中,产物的分离使用了可以根据大小精确地将含有大约250、300、350、400或更多个三核苷酸重复的产物分开的聚合物,比如例如P0P-4。以高分辨率分离产物组可以利用机器实现,例如从包含电压源(例如DC电泳)的机器、包含压力源(例如泵)的机器和包含柱子或毛细管的机器中选择的适合进行化学分离的机器。当然机器可以包含上述组成部分中的一种以上。以高分辨率分离产物可以产生产物大小和丰度的表现形式。该表现形式可以是本领域技术人员能够肉眼或者借助仪器(比如例如带有合适软件的计算机或光密度计)解释的图像或图形,从而理解反应产物的大小和含量。在一些实施方案中,表现形式是电泳图、照片、图形、曲线或放射自显影图像。这些表现形式可能来源于或者记录自产物或者结合在产物上的染料分子所发射的光子或β颗粒;可以通过例如摄影术或电子学方法对它们进行检测,并处理或显影生成所述表现形式。本发明涉及的方法包括由产物大小和丰度表现形式获取关于CGG重复数目(即模板中包含多少CGG重复或者总的三核苷酸重复)的信息。这类信息获取可能包括计数表现形式中可观察到的种类的数目从而确定重复数量(从最小产物包含的重复数目开始,可能是例如4或幻,或者根据表现形式中观察到的最大产物的位置估计重复数目。在一些实施方案中,CGG富含区包含于FMRl的5,UTR或FMR2的5,UTR。在一些实施方案中,方法包括检测CGG富含区中是否存在中断元件。在一些实施方案中,所述中断元件是AGG三核苷酸。检测是否存在这些中断元件可以通过例如确定模板中第一引物结合显著减少的位置;或者通过确定与相邻长度相比,产物的量明显减少的一组长度来实现。例如,如果在含有至少总共14个三核苷酸重复的区域中第10个三核苷酸是AGG,并且使用包含4个CGG重复的引物进行了扩增反应,可以预期相对含有9和14个重复的相邻产物,含有10、11、12和13个CGG重复的产物存在的量明显减少。含量的减少程度可能在25%到95%或更高的范围内,例如减少25%,30%,35%,40%,45%,50%,55%,60%、65%、70%、75%、80%、85%、90%或95%。减少程度通常取决于样品的接合性;例如对于有些样品,可能相应产物的量的减少显示在25%到75%的范围内,所述样品中CGG富含区就包含该CGG富含区的等位基因而言,或者就特定AGG重复而言是来自杂合子。对于另一些样品,可能相应产物的量的减少显示在50%到95%或更高的范围内,所述样品中CGG富含区就包含该CGG富含区的等位基因而言,或者就特定AGG重复而言是来自半合子或纯I=I丁ο在一些实施方案中,方法不需要使用外部标准或校准物,比如例如参照标准或分子量大小标准。之所以可以实现这一独立性是因为在一些实施方案中,可以利用长度相差一个三核苷酸重复的产物所对应的峰来数出最大产物的大小,其中计数可以表明模板中的重复的数量(根据引物所包含的重复数量进行必要调节)。一些实施方案中,产物大小和含量表现形式中的峰之间的间距可以用于通过例如外推来估计最大产物的大小;当对应较大重复数量的峰的分辨率不足以数出所有峰,包括最大产物的峰时,这一点很有用。在一些实施方案中,方法可以将CGG富含区中的重复数量明确到100、50、20、10、5、4、3、2、1或0个重复以内。对一个量确定到了0个单位以内意味着确定了它的准确数值。在一些实施方案中,方法包括将CGG富含区中的重复数量明确到100、50、20、10、5、4、3、2、1或0个重复以内。例如,方法可以包括确定出CGG富含区中的重复数量含有少于70个CGG重复,明确到5、4、3、2、1或0个重复以内;确定出CGG富含区中的重复数量含有70-120个CGG重复,明确到10、5、4或3个重复以内;或者确定出CGG富含区中的重复数量含有超过120个CGG重复,最多大约200个CGG重复,明确到20、10或5个重复以内。对于更大的CGG重复区很难准确确定因为缺少可靠的已知标准。在一些实施方案中,方法可以确定出中断元件的位置在60、45、30、15、12、9、6、5、4、3、2、1或0个核苷酸以内。可以将中断元件的位置确定为例如相对CGG富含区任何一端的距离。一些实施方案中,引物中的至少一种包含放射性或电磁性可检测的部分。放射性可检测的部分包括发射可检测颗粒(比如β或Y颗粒)的放射性同位素,例如14C、3H、32P、3节、3、和1251。电磁学可检测的部分包括与电磁辐射(包括吸收、发射或这两者)以可检测的方式发生相互作用的化学实体,比如发色团和荧光团,例如荧光素、FAM、花青染料、罗丹明染料等。本发明的其他方面可以部分地由以下描述中给出,和部分地由说明书显而易见,或者经过实践本发明而得知。借助尤其是所附权利要求中指出的元素和各种组合,可以认识并获得本发明的各方面。附图简述并入本说明书并构成说明书一部分的附解了发明的多个实施方案,与描述部分一起解释了发明的原理。图1概括了包含AGG三核苷酸的CGG富含模板的扩增。引物序列是权利要求1.分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括(a)提供至少两种不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复的第一引物;和与CGG富含区之外的位点退火的第二引物;(b)用所述至少两种不同引物和包含至少一种CGG富含区的至少一种模板进行PCR,其中所述PCR产生一组产物;(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;以及(d)得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息。2.分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括(a)提供至少三种不同引物,包括含有CGG、CCG、GCG、CGC、GCC或GGC重复和5’侧翼的第一引物;与CGG富含区之外的位点退火的第二引物;和具有第一引物的5’侧翼所包含的序列的第三引物,其中第一引物提供的浓度低于第三引物;(b)用所述至少三种不同引物和所述至少一种模板进行PCR,其中所述PCR产生一组产物;(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式;以及(d)由上述表现形式得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息。3.权利要求1或2中任一项所述的方法,包括由所述表现形式得出关于中断序列在CGG富含区中处于何处的信息。4.权利要求1或2中任一项所述的方法,其中所述中断序列是AGG元件。5.权利要求1或2中任一项所述的方法,进一步包括由所述表现形式得出关于CGG重复数目的信息。6.权利要求5所述的方法,其中所述关于CGG重复数目的信息决定了CGG富含重复区包含多于还是少于200个CGG重复。7.权利要求6所述的方法,其中所述关于CGG重复数目的信息决定了CGG富含区内存在的CGG重复数目。8.权利要求1或2中任一项所述的方法,附带条件是由上述表现形式得出关于所述至少一种CGG富含区中是否存在中断序列,或者中断序列在所述至少一种CGG富含区中处于何处的信息时,没有使用外部标准或校准物。9.权利要求1或2中任一项所述的方法,其中所述CGG富含区包含在FMRl的5’UTR中。10.权利要求1或2中任一项所述的方法,其中所述CGG富含区包含在FMR2的5’UTR中。11.权利要求1或2中任一项所述的方法,其中所述高分辨率技术可以将长度相差3个核苷酸或碱基对的产物区分开。12.权利要求1或2中任一项所述的方法,其中所述高分辨率技术是毛细管电泳。13.权利要求1或2中任一项所述的方法,其中所述表现形式是电泳图。14.权利要求1或2中任一项所述的方法,其中从所述表现形式得出关于CGG富含区中是否存在中断序列、或者中断序列在所述CGG富含区中处于何处的信息,包括确定第一引物结合显著减少的位置。15.权利要求1或2中任一项所述的方法,其中从所述表现形式得出关于CGG富含区中是否存在中断序列,或者中断序列在所述CGG富含区中处于何处的信息包括确定与相邻长度的产物量相比,产物的量明显减少的一个或多个长度。16.权利要求1或2中任一项所述的方法,其中从所述表现形式得出关于CGG富含区中是否存在中断序列,或者中断序列在所述CGG富含区中处于何处的信息包括确定与相邻长度的产物量相比,产物的量减少至少50%的一个或多个长度。17.权利要求1或2中任一项所述的方法,其中从所述表现形式得出关于CGG富含区中是否存在中断序列,或者中断序列在所述CGG富含区中处于何处的信息包括确定与相邻长度的产物量相比,产物的量减少至少90%的一个或多个长度。18.权利要求1或2中任一项所述的方法,其中从所述表现形式得出关于CGG富含区中是否存在中断序列,或者中断序列在所述CGG富含区中处于何处的信息包括确定与相邻长度的产物量相比,产物的量减少至少25%的一个或多个长度,其中所述CGG富含区就包含该CGG富含区的等位基因而言,是来自杂合子。19.权利要求1或2中任一项所述的方法,其中所述第一引物包含4或5个CGG或CCG重复。20.权利要求1或2中任一项所述的方法,其中所述第二引物选自SEQIDNOs1_38。21.权利要求1或2中任一项所述的方法,其中所述至少一种引物包含放射性或电磁性可检测的部分。22.权利要求1或2中任一项所述的方法,其中所述至少一种引物包含荧光团。23.权利要求1或2中任一项所述的方法,其中所述方法是锚定的分析法。24.权利要求23所述的方法,其中第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复之中或3,端包含选自A、T、AG、CT、AGG和CCT的亚序列。25.权利要求M所述的方法,其中第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含A。26.权利要求M所述的方法,其中第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含CCT。27.权利要求23所述的方法,进一步包括检测所述至少一种CGG富含区所包含的至少一种中断元件。28.权利要求27所述的方法,进一步包括确定样品是否包含中断元件位置不同的主要和次要等位基因。29.权利要求1或2中任一项所述的方法,其中所述方法是非锚定的分析法。30.权利要求2所述的方法,其中提供的所述第一引物和第三引物的浓度使得第三引物的摩尔浓度比第一引物多至少100倍。31.权利要求2所述的方法,其中提供的所述第一引物和第三引物的浓度使得第三引物的摩尔浓度比第一引物多至少500倍。32.权利要求2所述的方法,其中提供的所述第一引物和第三引物的浓度使得第三引物的摩尔浓度比第一引物多至少900倍。33.权利要求2所述的方法,其中所述第二引物与CGG富含区下游退火,所述第三引物与CGG富含区上游退火。34.权利要求2所述的方法,其中所述第二引物与CGG富含区上游退火,所述第三引物与CGG富含区下游退火。35.权利要求1或2中任一项所述的方法,进一步包括提供至少另外的第一引物和任选另外的第二引物,所述另外的第一引物包含CGG、CCG、GCG、CGC、GCC或GGC重复;用至少另外的第一引物、选自步骤(a)中第二引物和另外的第二引物的引物,以及至少一种模板进行第二PCR,其中第二PCR产生第二组产物;以高分辨率技术将第二组PCR产物分开,产生第二个产物大小和丰度的表现形式;其中步骤(a)的第一引物对不含有中断元件的CGG富含区内的位点有优先结合活性,而另外的第一引物对含有中断元件的CGG富含区内的位点有优先结合活性。36.权利要求35所述的方法,其中所述另外的第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含A。37.权利要求35所述的方法,其中所述另外的第一引物在CGG、CCG、GCG、CGC、GCC或GGC重复的3’端包含T。38.权利要求35所述的方法,进一步包括确定至少一种CGG富含区的至少一种长度。39.权利要求38所述的方法,其中所述样品包含来自对于CGG区倍性至少为2的细胞的遗传物质,并且该方法包括确定至少两个CGG富含区的至少两个长度。40.权利要求38所述的方法,其中所述样品包含含有CGG富含区的等位基因,所述CGG富含区包含至少100个CGG重复。41.权利要求35所述的方法,进一步包括确定样品是否包含中断元件位置不同的主要和次要等位基因。42.权利要求35所述的方法,其中所述另外的第一引物相对第一引物取向相反。43.权利要求42所述的方法,其中第一引物结合CGG富含区时其3’端朝向下游,另外的第一引物结合CGG富含区时其3’端朝向上游。44.权利要求43所述的方法,其中所述方法包括检测至少一种中断元件并确定包含所述至少一种中断元件的CGG富含区的大小。45.权利要求44所述的方法,其中样品包含至少第一和第二等位基因,并且第一和第二等位基因包含长度不同的CGG富含区。46.权利要求35所述的方法,进一步包括提供至少另外的第三引物和任选另外的第四引物,所述另外的第三引物包含CGG、CCG、GCG、CGC、GCC或GGC重复;用至少另外的第三引物、选自另外的第二引物和另外的第四引物的引物,以及至少一种模板进行第三PCR,其中第三PCR产生第三组产物;以高分辨率技术将第三组PCR产物分开,产生第三个产物大小和丰度的表现形式;其中另外的第三引物相对步骤(a)的第一引物取向相反,并且与另外的第一引物不同。47.权利要求46所述的方法,进一步包括确定样品所包含的至少一种等位基因任意一端150bp内是否存在中断元件。48.权利要求47所述的方法,进一步包括确定至少一种等位基因所包含的至少一种中断元件的至少一种位点。49.权利要求1或2中任一项所述的方法,进一步包括提供至少另外的第一引物和另外的第二引物,所述另外的第一引物包含CGG、CCG、GCG、CGC、GCC或GGC重复;用至少另外的第一引物和另外的第二引物,以及至少一种模板进行第二PCR,其中第二PCR产生第二组产物;以高分辨率技术将第二组PCR产物分开,产生第二个产物大小和丰度的表现形式;其中另外的第一引物与步骤(a)的第一引物取向相反。50.权利要求49所述的方法,其中第一引物和另外的第一引物中的至少一种对不含中断元件的CGG富含区中的位点有优先结合活性。51.权利要求50所述的方法,其中第一引物对不含中断元件的CGG富含区中的位点有优先结合活性,而另外的第一引物对包含中断元件的CGG富含区中的位点有优先结合活性。52.权利要求51所述的方法,其中样品包含含有不同长度的CGG富含区的至少两个等位基因,该方法进一步包括确定所述至少两个等位基因的长度。53.权利要求52所述的方法,进一步包括检测至少一种中断元件和确定包含所述至少一种中断元件的等位基因的长度。54.分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括(a)提供至少两种不同引物,其中第一引物含有CGG、CCG、GCG、CGC、GCC或GGC重复;和第二引物与CGG富含区之外的位点退火;(b)用所述至少两种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产生一组产物;(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式,其中长度相差3个核苷酸的产物能够被分开;以及(d)由所述表现形式得出关于CGG重复数目的信息。55.分析样品中至少一种模板所包含的至少一种CGG富含区的方法,所述方法包括(a)提供至少三种不同引物,其中第一引物包含CGG、CCG、GCG、CGC、GCC或GGC重复和5’侧翼;第二引物与CGG富含区之外的位点退火;第三引物具有与第一引物的5’侧翼相同的序列,并且第一引物提供的浓度低于第三引物;(b)用所述至少三种不同引物和包含CGG富含区的模板进行PCR,其中所述PCR产生一组产物;(c)利用分辨率高的技术将产物分开,产生产物大小和丰度的表现形式,其中长度相差3个核苷酸的产物能够被分开;以及(d)由上述表现形式得出关于CGG重复数目的信息。56.权利要求M或55中任一项所述的方法,其中所述关于CGG重复数目的信息确定CGG富含重复区包含多于还是少于200个CGG重复。57.权利要求M或55中任一项所述的方法,其中所述信息确定CGG富含区内存在的CGG重复数目。58.权利要求M或55中任一项所述的方法,附带条件是由上述表现形式得出关于CGG重复数目的信息时,没有使用外部标准或校准物。59.权利要求M或55中任一项所述的方法,其中所述CGG富含区包含在FMRl的5’UTR中。60.权利要求M或55中任一项所述的方法,其中所述CGG富含区包含在FMR2的5’UTR中。61.权利要求讨或55中任一项所述的方法,其中所述高分辨率技术可以将长度相差3个核苷酸或碱基对的产物区分开。62.权利要求M或55中任一项所述的方法,其中所述高分辨率技术是毛细管电泳。63.权利要求M或55中任一项所述的方法,其中所述表现形式是电泳图。64.权利要求M或55中任一项所述的方法,其中所述第一引物包含4或5个CGG或CCG重复ο65.权利要求讨或55中任一项所述的方法,其中所述第二引物选自SEQIDNOs1_38。66.权利要求M或55中任一项所述的方法,其中至少一种引物含有荧光团。67.权利要求55所述的方法,其中提供的所述第一引物和第三引物的浓度是第三引物的摩尔浓度比第一引物多至少100倍。68.权利要求55所述的方法,其中提供的所述第一引物和第三引物的浓度是第三引物的摩尔浓度比第一引物多至少500倍。69.权利要求55所述的方法,其中提供的所述第一引物和第三引物的浓度是第三引物的摩尔浓度比第一引物多至少900倍。70.权利要求55所述的方法,其中所述第二引物与CGG富含区下游退火,所述第三引物与CGG富含区上游退火。71.权利要求55所述的方法,其中所述第二引物与CGG富含区上游退火,所述第三引物与CGG富含区下游退火。72.寡核苷酸,包含选自SEQIDNO44和SEQIDNO45的序列。全文摘要本公开涉及通过利用一组至少其中之一包含CGG重复区的一部分的引物扩增一组产物并分离所述产物产生产物大小和丰度的表现形式,从而确定三核苷酸(例如CGG)重复区内是否存在AGG或中断元件及其位置的方法,和确定该区域内存在的重复数目的方法。文档编号C12Q1/68GK102449171SQ201080032511公开日2012年5月9日申请日期2010年2月16日优先权日2009年3月24日发明者G.J.拉萨姆,S.萨,陈良进申请人:奥斯瑞根公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1