通过竞争pcr测定dna拷贝数目的方法

文档序号:580663阅读:1628来源:国知局
专利名称:通过竞争pcr测定dna拷贝数目的方法
通过竞争PCR测定DNA拷贝数目的方法本发明涉及用于准确地测定在特定基因座上携带的DNA拷贝的数目(拷贝数目) 的方法。公认的是罕见的大规模微观基因组异常与疾病相关(Chance等人,1993 ; Driscoll等人,1992)。近年来多个标志性的研究显示了更小的亚微观DNA拷贝数目变异 (CNV)(—般地为缺失、重复或者插入的> 11Λ的片段)为人类基因组中的变异的重要来源(在O^euk等人,2006)中综述)。CNV在健康的个体中是基因突变的常见来源(Conrad 等人,2006 ;Hinds 等人,2006 ;McCarro 11 等人,2006 ;Redon 等人,2006),这暗示着一些不导致显著的表型改变。然而由于CNV能够扰乱整个基因以及调控区域(Hinds等人,2006 ; McCarroll等人,2006 ;Sebat等人,2004 ;Sharp等人,2005),越来越多的CNV显示出对于人类表型的多样化起重要的贡献,并在疾病的易感受性中起作用(Aitman等人,2006 ; Gonzalez等人,2005 ;Lucito等人,2007 ;Sebat等人,2007)。因此,疾病相关的CNV的鉴定在临床上及在旨在确定疾病相关的病原途径的研究中都是重要的。CNV的研究中的关键步骤涉及在疾病相关的研究中特定的基因座的分析,以及为了达到这一点,必须将CNV在大规模的临床群体中准确地分类。基于阵列的方法学(Carter 2007)使得能够检测及表征大量的CNV。然而,此类方法的发展主要地用于旨在准确地检测CNV的研究,以及为了保持低的假阳性检测率,一般地设置严格的入选标准,所述标准可能经常导致夸大的假阴性率(McCarroll和Altshuler 2007)。因此公认地需要采用独立方法的确定性的分析,从而准确地确定通过基于阵列的方法鉴定的CNV的发生率。关联研究要求大量样品各个基因座上的基因型的极其准确的测定。为了对CNV进行关联分析,在各个样品(0,1,2,3等等)中准确地测定拷贝数目的所有水平是必要的。通过基于阵列的研究中所得的数据所判断的DNA拷贝数目通常不落入不连续的种类,而可能一般地形成连续的分布。实际上,近期对通过基于阵列的探索研究而鉴定1500个CNV的评估显示,仅70的所称的数据(也即DNA拷贝数目的准确测定)为基因分型检测所期待的标准(McCarroll和Altshuler 2007)。该问题对于含有更低数量探针的更小的CNV而言可能是更大的问题。公认的是,即使是相对小的错误率也可能显著地减少关联研究的效力 (Moskvina等人,2006),因此不准确的拷贝数目的评估是不可接受的,并影响到I型(也即假阳性)及II型(也即假阴性)的误差。为了解决这一问题,一些人尝试将该数据拟合到合适的不连续的种类中(Redon等人,2006 ;Stranger等人,2007),然而该方式有严重的局限性(McCarroll 2008)并可能对于一些CNV而言,比其他的更容易接受。考虑到这一点,更令人满意的方式应该是,开发以足够高的质量评价DNA拷贝数目的检测,并适当地减少人为引入的实验噪音。该方式也应该能便于在大的复制样品中进行CNV的经济的关联分析。 这些问题的结果是,最近在CMV研究中,开发临床群体中基因组拷贝数量多态性的有效、准确及不昂贵测量的方法被认为是最迫切的需要之一(McCarroll和Altshuler 2007 ;Todd 2006)。存在多种方法能准确定量DNA拷贝数目(Armour等人,2007 ;Armour等人,2000 ;
4Charbonnier 等人,2000 ;Heid 等人,1996 ;Schouten 等人,2002 ;Suls 等人,2006),然而其
没有哪个尤其好地适宜大规模的关联分析,这或者由于该检测需要加强的优化,或者由于在这些检测上发展的分析平台不最适于高通量的研究。竞争PCR是成熟的技术,其涉及在竞争物序列的存在下扩增试验DNA序列,所述竞争物序列除一个单独的核苷酸之外相同, 这使得两个序列能够区分。在已知竞争物的浓度时,能将试验序列准确地定量。一般地,竞争物的来源为合成的DNA序列,然而,对于分析大量的基因座的研究而言,要求要合成的竞争物匹配各个基因座通常是不切实际的。为了避免这一情况,其他人表明通过在已知拷贝数目的平行基因座的存在下,通过扩增所述试验基因座,能获得非常准确的DNA拷贝数目的评估(Armour等人,2007)。然而,不是所有的试验基因座都具有非缺失/重复的平行序列,这限制了可以由此方式分析的检测的数量。本发明人选择了替代的方式,并通过利用两个密切相关的物种的同源基因组序列之间的高度保守,使用竞争PCR来测定DNA拷贝数目。作为概念的证明,作者通过使用一只黑猩猩(Pan troglodytes)的整个基因组作为竞争物,准确地测定在人类(智人)特定基因座上的拷贝数目而实现了这一点。因此,在本发明的第一个方面,提供了用于测定在研究物种的DNA中特定试验基因座上的拷贝数目的方法,所述方法包括步骤(i)使所述研究物种的DNA样品(研究样品)和至少一个竞争物样品共扩增,所述 DNA样品包含试验基因座,所述竞争物样品包含得自紧密相关的物种的同源DNA序列;(ii)使用至少一种合适的分子检测靶向在所述同源DNA序列内的在两个物种之间非保守的核苷酸,从而区分研究样品和竞争物样品的DNA序列;(iii)对于靶向非保守的核苷酸的各检测,定量所述研究物种中存在的DNA的量,; 以及(iv)测定所述研究物种的试验基因座上的DNA拷贝数目的定量评估;其中所述竞争物样品包含与研究物种的DNA序列同源的DNA,并含有至少一个非保守的核苷酸,从而可以通过至少一种合适的分子检测区分研究样品及竞争物样品。所述扩增步骤可以通过任意适用的方法进行,如聚合酶链式反应(PCR)。在本发明的一个实施例中,所述研究物种可以为智人。当本方法用于疾病诊断或者相关的研究,或者如下文讨论地用于遗传指纹方法中时是尤其有用的。当研究物种为智人时,紧密相关的物种可以为猿类,例如为黑猩猩(Pan troglodytes),以及这是本发明人用于概念的证明的实例。然而,当研究物种为智人时,也可以使用其他的紧密相关的物种, 尤其地使用猿类,如大猩猩物种或者倭黑猩猩(Pan paniscus)。紧密相关的物种的概念是遗传学本领域技术人员所熟知的,该技术人员在为了选定的研究物种选择适用的紧密相关的物种时没有困难,这是由于已知紧密相关的物种的选择是根据引物所结合的特定的序列(或者多个序列),在两个选定的物种之间应该具有充足的同源性,从而能够同时地分析目标和竞争物基因座。研究样品可以包含多于一个试验基因座,以及实际上可以包含多个试验基因座, 如高达5,高达10,高达20,高达30,高达40或者高达50个基因座。在一些情况下,试验基因座的数量可以显著地高于此,例如数百个,数千个或者甚至大于一百万。所有的基因座能够使用本发明的方法同时地进行分析。
研究样品可以包含来自研究物种的个体的一条或者多条染色体或者甚至整个基因组的DNA,或者由研究物种的个体的一个或者多个染色体或者甚至整个基因组构成的 DNA。试验基因座或者多个基因座可以在进行本方法之前已经预先确定作为目标区域。 可选地,试验基因座可以是此前未知的,并可以仅仅地是一个区域,其在本方法的步骤进行之后证明与参照或者竞争物基因组相比,具有DNA拷贝数目的增加或者减少。本发明的方法可以因此用于分析样品中的大量的拷贝数目多态性,并从而获得个体的独一无二的遗传学特征。因此其在“DNA指纹”方法中,以及在建立遗传学数据库中是潜在地有用的。在该方法中,试验基因座优选地是预先确定的,但是有可能使用未确定的试验基因座,从而将本方法用于检测研究样品中的个体的全部拷贝数目变异。竞争物样品可以包含来自竞争物物种的单个个体的一条或者多条染色体或者甚至整个基因组的DNA,或者由竞争物物种的单个个体的一条或者多条染色体或者甚至整个基因组构成的DNA,并且后者的选择是有利的,这是由于其导致了对于所有的检测只需要单一的竞争物样品,并因此极大地增加在多重中分析大量的基因座的潜力。在本方法进行之前未确定试验基因座的情况下,这也是有用的。 试验基因座可以为或者包括DNA序列,在研究物种中,该序列的拷贝数目变异(拷贝增加或者拷贝缺失)与表型变异有关,例如帕金森症,DiGeorge综合征Q2qllDS),癌症, Charcot-Marie Tooth, CYP450 代谢。作为对照,可以将试验基因座上的拷贝数目与内标对照基因座上的拷贝数目相比。内标基因座可以为在试验或者研究物种中,没有拷贝增加或者拷贝缺失的迹象的DNA 序列。可以通过将研究物种和竞争物物种的分别的同源基因组序列进行比对,并且鉴别两个物种之间不同的核苷酸,从而设计所述非保守的核苷酸。随后可以设计分子检测来靶向所述非保守的核苷酸。对于靶向非保守非保守的核苷酸的各检测,相对于竞争物物种的测试物种存在的等位基因的量(测试DNAiw)可以使用任意合适的方法、实验室仪器及软件来确定。可以使用的实验室仪器及软件包括,如kquenom MassARRAY 系统。参考各自的标准曲线,可以使用例如测试DNA数量=EXP[(测试DNA相对χ m)+c]的等式来评估研究物种基因组中各检测基因座上存在的DNA的数量(测试DNAs量)。研究物种样品基因组中的给定的试验基因座上所评估的DNA拷贝数目可以通过任何合适的方法测定,例如在试验及内标基因座上确定的测试DNA s^的比率,分别为在不存在CNV中期待1 1的比率,对于杂合缺失期待0.5,对于杂合重复期待1.5。在这种情况下,将各个比率除以0. 5,能提供在试验基因座上的DNA拷贝数目的评估值。在一些情况下,如下文所讨论,使用靶向来自相同的基因座上不同的非保守核苷酸的多个检测是有利的。其可以用于分别地测定研究物种在试验及内标基因座上的平均 DNA ,并从而更准确地测定试验基因座上的平均拷贝数量。在一些情况下,如下文所讨论,使用多个参照是有利的,也即研究的或者内标,多个基因座或者基因座。这改进了所述检测的准确度。由于本发明的方法使得DNA序列的拷贝数目能够测定,其也具有诊断与基因组拷贝数目变异有关的疾病或表型的用途。因此,在本发明的第二个方面,提供了用于诊断疾病或者特定表型的方法,所述疾病或者表型已知与研究物种的基因组中特定染色体DNA序列(试验基因座)的DNA拷贝数目的变化有关,所述方法包括(i)使研究物种的DNA样品(研究样品)和至少一个竞争物样品共扩增,所述DNA 样品包含试验基因座,所述竞争物样品包含得自紧密相关的物种的同源DNA序列;(ii)使用至少一种合适的分子检测靶向在所述同源DNA序列内的在两个物种之间非保守的核苷酸,从而区分所述研究样品和竞争样品的DNA序列;(iii)对于靶向非保守的核苷酸的各检测,定量研究物种中存在的DNA的量;以及(iv)测定研究物种中试验基因座上的DNA拷贝数目的定量评估值;其中所述竞争物样品包含与所述研究物种的DNA序列同源的DNA,并含有至少一个非保守的核苷酸,从而可以通过至少一种合适的分子检测区分研究样品和竞争物样品, 并且其中在所述试验基因座上的DNA拷贝数目的增加或者损失与所述疾病或表型有关。所述试验基因座可以为DNA序列,该序列的拷贝数目变异(拷贝增加或者拷贝损失)与研究物种的表型变异有关,如帕金森病,DiGeorge综合征Q2qllDS),癌症, Charcot-Marie Tooth, CYP450 代谢。其他的特征与本发明的第一个方面一致。本发明的方法可以可选地用于测定基因组DNA中基因座或者多个基因座上的拷贝数目变异与疾病或者症状的联系。因此,在本发明的第三个方面,提供了测定基因组DNA中的拷贝数目变异(CNV)与疾病或者症状的联系的方法,所述方法包括(i)使来自具有疾病或者症状的研究物种的患者DNA样品(研究样品)与至少一个竞争物样品共扩增,所述竞争物样品包含得自紧密相关的物种的同源DNA;(ii)使用至少一种合适的分子检测靶向在所述同源DNA序列内的在两个物种之间非保守的核苷酸,从而区分研究样品的和竞争样品的DNA序列;(iii)对于靶向非保守的核苷酸的各检测,定量所述研究物种中存在的DNA的量;以及(iv)测定所述研究物种中一个或者多个试验基因座上的DNA拷贝数目的定量评估值,其中在试验基因座上的拷贝数目变异可以指示和疾病或者症状的联系;其中,所述竞争物物种的DNA序列与研究物种的DNA序列是同源的,并含有至少一个非保守的核苷酸,从而可以通过至少一种合适的分子检测区分研究序列和竞争物序列。在本发明的这个方面,在本方法的开始,试验基因座可以是未知的。可选地,试验基因座或者多个基因座可以选择为在怀疑与疾病或者症状有关的基因组的区域中。研究样品可以包含该基因组的部分,包括该试验基因座或者多个基因座,或者患者的整个基因组。极其优选的是,所述方法使用得自多个患者的研究样品进行重复,以获得在特定的试验基因座的拷贝数目变异与疾病或者症状之间的有确实根据的联系。为了确认结果,也优选使用来自研究物种的一名或者多名患者的参照样品进行本
7方法的步骤(i)到(iv),所述患者未患有所述疾病或者症状。选择参照样品,使其对于研究样品是同源的,以及因此具有与研究样品相同的长度及来自基因组的相同区域。在本方法中使用越多的研究样品及参照样品,试验基因座上的拷贝数量变异与疾病或者症状之间的任何联系的准确度也越大。其他优选的特征如本发明第一方面所描述。本发明以下参考实施例及图进行更详细的描述,其中作者具有概念的证明,通过使用单独的黑猩猩(Pan troglodytes)的整个基因组作为竞争物,精确地测定人类(智人) 基因组的特定的基因座上的拷贝数量。表1 在PARK2基因座上的拷贝数量评估值通过MLPA和qicPCR在2名患者及10名健康对照中测定PARK2外显子上的拷贝数量,所述患者含有此前表征的突变(以灰色高亮显示)。仅在10个对照样品中计算各 qicPCR检测的平均值、标准差以及变化系数。

图1 图解表示了定量的种间竞争PCR(qicPCR)的原理人类及黑猩猩特异性的等位基因使用等位基因‘C’和‘G’分别地表示。图2 通过MPLA及qicPCR测定的PARK2基因座上的拷贝数目的比较在两名具有此前表征的PARK2突变的患者中,通过qicPCR和MLPA测定的PARK2 外显子3,4,5,6,8,9,10和11拷贝数目评估。外显子3(a和b)和外显子6的检测高亮显示,所述检测分别地探测了我们的试验样品PD-Ol和PD-02中的缺失和重复。图3a 参照样品数量的增加对于通过qicPCR评估拷贝数目的影响。图北试验检测数量的增加对于通过qicPCR判断的拷贝数目的影响。上方的垂直条代表对于22qllDS患者以及对照通过qicPCR测定的hsCN的范围, 而柱状图代表了 CV。在各个参数下测定的silhouette计分范围显示为较下方的垂直条。 对于每次测量,平均值以小的水平条给出。图4 增加参照及试验检测的数量对于通过qicPCR评估拷贝数目的影响在10名具有22qllDS的患者中和10名无缺失的对照中,对于试验1到5以及参照检测的所有组合,确定了在22qll上的hsCN。为了简化,仅表示了 22qllDS样品的CV,然而在无缺失的对照的数据中观察到了类似的形式。图5 多重qicPCR检测的再现性在10名22qllDS患者(左侧)及10名无缺失对照(右侧)中,使用两种独立的多重qicPCR,确定了在22qll上的hsCN。各个组(panel)重复分析三次,以1,2,3代表各 qicPCR组,其分别表示为三角形,十字以及圆形。图6 在753个样品中评估的22qll上的拷贝数目重复单个多重qicPCR组的实验,从而在20名22qllDS患者中(左侧)以及733 名对照中(右侧)确定22qll上的hsCN。
实施例方法样品所有的受试者均是无关的,并为参加遗传学研究提供了手写的知情许可。
帕金森病(PD)样品我们初始的分析基于两名诊断患有PD的患者,该患者此前表征为携带PARK2突变;患者PD-Ol在外显子3上半合子地缺失,而PD-02携带外显子6的杂合重复。所有的突变通过MLPA以分子方法测定。22qllDS样品我们分析了 20名在22qll处携带半合子缺失的无关个体,其中使用N25探针(Oncor Inc, Gaithersburg, Md)通过原位杂交荧光测定。对照样品选用全部773名无关的个体作为对照,其细节于前文描述(Williams 等人,2004)。用作PD患者对照的10个样品未进行PARK2突变筛选,然而考虑到该致病性突变的罕见性,其不可能为携带者。然而已经预先排除了全部的样品中典型的22qll缺失区域的存在(Ivanov等人,2003)。黑猩猩Pan Troglodytes的DNA得自EB176(JC)细胞系,其保存于 ECACC (http //www. ecacc. org. uk/)。分子检测MLPA 检测使用SALSA P051/P052帕金森MLPA探针试剂盒(MRC Holland),按照生产商的说明分析样品。各个试剂盒包括用于PARK2基因的外显子1到12的探针。所有步骤在同一台MJ thermocycler上进行。“~~■般而目, 将IOOng的DNA在98°C下变性,并通过与1. 5 μ 1 SALSA探针混合物及1. 5 μ 1的MLPA缓冲液孵育(16-17小时,60°C )将其杂交到探针上。连接反应通过以下进行将8 μ 1的杂交产物与32 μ 1的连接酶-65混合物在下孵育15 分钟,随后在98°C下5分钟。在50 μ 1的反应中进行PCR,其使用10 μ 1的连接产物,4 μ 1 的IOx SALSA PCR缓冲液以及10 μ 1聚合酶混合物。所述PCR的循环条件为60°C的热起动,随后35个循环的95°C下30秒,60°C下30秒,以及72°C下60秒,随后72°C下20分钟。 PCR产物在ABI 3100 Sequencer (Applied Biosystems)上进行分析,使用 GeneScan500 Rox 内标尺寸标准品。qicPCR 检测PCRPCR在MJ thermocycler上,在5 μ 1的反应中进行,其使用12ng的干燥的基因组 hsDNA, 12ng 的 ptDNA,在多重中的 0. 5pmol 的各引物,250 μ MdNTP,0. 325 μ 1 的 10Χ 20mM MgCl PCR缓冲液以及0. 1个单位的Hotstar Taq聚合酶Oliagen)。PCR循环参数为95°C 下15分钟,随后45个循环的94°C下12秒,56°C下的30秒以及72°C下1分钟,随后在72°C 下3分钟。引物的延伸引物的延伸在MJ thermocycler上,在9μ 1的反应中进行,其使用7μ 1 SAP处理的PCR产物,在多重中的6. 6pmol到13. 3pmol的各引物,0. 25 μ 1的iplex缓冲液,0. 25 μ 1 的iplex终止混合物以及0. 05 μ 1的iplex酶(kquenom)。PCR循环参数为94°C下30秒, 随后40个循环的94°C下5秒,以及巢式的五个循环的52°C下5秒和80°C下5秒,随后72°C 下3分钟。qicPCR检测选择通过将人类(智人)和黑猩猩(Pan troglodytes)各自的基因组DNA序列使用 UCSC Blat (http://genome, ucsc.edu/)比对,对种间序列差异进行识别。识别了在人类和黑猩猩之间不同的核苷酸,并参考UCSC基因组浏览器人类的2006年3月版本,以及位于 Broad Institute(http://www. broad, mit. edu/ftp/pub/assemblies/mammals/chimp_ SNPs/)的黑猩猩基因组数据库,将已知的人类和黑猩猩SNP排除。随后使用%(1此110111 Assay Design v3. 1软件,设计了单核苷酸延伸检测,以靶向非保守的核苷酸。为了研究PD患者中的突变,我们使用了 PARK2基因座(NCBI版本36. 1,chr6 161,689,662-162,784,495)上的人类参考序列及其在Pan troglodyte中的同源序列 (genome 版本 2 版 l,chr6 :164,335,097-165,462,200)。为了研究在 22qll 上的缺失,我们将人类基因组 NCBI 版本 36. 1,chr22 :18131905-18, 222,087 与其在 Pan troglodyte 中同源区域(genome版本2版1,chr22 :18221742-18316567)进行了比对。随后设计引物延伸检测(Sequenom iplex 88)来靶向在PARK2基因座上(22个检测)和在22qll上(11个检测)的两个物种之间不保守的总计30个核苷酸(附表1)。通过鉴定在人类和黑猩猩之间在多个常染色体区域上不保守的核苷酸来设计内标检测,所述区域此前未显示容纳普通的 CNV(附表2)的迹象。将靶向PARK2基因座的qicPCR检测设计为两个独立的多重反应,其各自包括9个及11个独立的试验检测及单独的参照检测。靶向22qll的qicPCR检测设计为两个独立的多重反应,其各自包括五个22qll的试验检测及五个参照检测。用于qicPCR的引物示于附表1及附表2中。标准曲线来自单个人类参照样品的基因组DNA通过pico green分析定量到32ng/ul,并随后顺序地稀释到16ng/ul,8ng/ul,4ng/ul,2ng/ul和lng/ul。对于各次滴定,然后按照生产商关于iplex化学法的说明,使用:3ul的hsDNA和的ptDNA^ig/ul)进行PCR,随后引物延伸。在^^1^0111 MassARRAY 系统上分析之后,测定分别对于人类和黑猩猩等位基因特异的延伸的引物的峰面积。然后各个基因座(hsDNA相关)上相对于ptDNA的hsDNA的量通过下文进行评估hsDNA相对=hs峰高/ (hs峰高+pt峰高)通过将hsDNA相对(χ轴)与已知的hsDNA的浓度(y轴)的对数作图得到参考标准曲线,并从其判断直线等式的斜率和截距,y = mx+c。对各个引物延伸检测进行此简单及快速的过程。qicPCR 分析如前文所述,对于各个试验样品,使用等浓度的基因组hsDNA和ptDNA (其各为 :3ul,约为如g/ul)进行检测。随后测定峰下方的面积,以及将该数据用于评估各个引物延伸检测的hsDNA相对,所述峰分别对应于人和黑猩猩核苷酸的延伸的引物峰(图1)。参考相应的标准曲线,在各个引物延伸检测(hsDNA数量)中的hsDNA的数量通过以下的进行评估hsDNA 数量=EXP [ (hsDNA 相对 χ m) +c]其中m及c得自参考标准曲线。评估的在试验基因座上的hsDNA拷贝数目测定为hsDNA数量在试验及内标的基因座上分别测定的比率在无CNV的情况下期待1 1的比率,对于杂合缺失为0.5,对于杂合重复为1.5。将各个比率除以0.5提供了在试验基因座(hsCN)上的人类DNA拷贝数目的评估值。当使用来自同一基因座的多重试验检测时,我们首先测定了在试验基因座上的
10平均hsDNA数量,并随后通过计算与hsDNA数量的比率评估了平均hsDNA拷贝数目,所述的 hsDNA数量在各个独立的参照检测中确定。Silhouette 计分Silhouette计分为用于数据群的解释和检验的图像上的帮助,其提供了当将数据点分配到群体的时候,其分类好坏程度的量度(Lovmar等人,200幻。总而言之,其通过比较群内的各个数据点的距离与各个数据点在任意其他群中的距离而确定。对各个qicPCR检测使用软件ClusterA计算总平均的silhouette计分(Lovmar等人,2005)。结果和讨论qicPCR 的评价为了开始评价qicPCR,我们分析了总计12个探针,所述探针设计为检测在PARK2 基因座上的外显子,并将结果与已确立的MPLA (Schouten等人,200 技术所得到的数据进行比较。所有的探针在10个健康的对照中和两名PD个体中分析,所述PD个体此前表征携带PARK2突变。测定用于靶向PARK2外显子3和6的检测的人类DNA拷贝数目(hsCN) 的分析建立了,qicPCR能够检测在各自PD样品中外显子3上的杂合缺失(平均hsCN = 1. 08)以及外显子6上的杂合重复(平均hsCN = 2. 88)(表1)。没有检测在10个对照样品任一个中检测到拷贝数目的变化的迹象(外显子3a;平均hsCN = 1.92(1.8-2.0)外显子 3b ;平均 hsCN = 1. 76(1. 66-1. 88)外显子 6 ;平均 hsCN = 2. 16(2. 04 = 2. 26)),表 1。 qicPCR的hsCN评估与MPLA所得到的那些的直接比较显示,两种方法的结果高度相关,r =0. 82,ρ = 0.005(表1和图2)。在PD患者中或者10个对照中,在未靶向PARK2外显子 3或者6的qicPCR检测中,均未观察到拷贝数目变化的迹象(平均hsCN = 1.98,95% CI ; 1.9-2. 06),表1。对各个样品进行总计四次重复试验。在各个技术重复中测定的hsCN平均值的比较显示,qicPCR的结果是可再现的(具有拷贝增加、拷贝损失的样品以及未显示出变异迹象的样品的变异系数分别为0. 035,0. 09和0. 01)。将三个PARK2外显子使用两个独立的探针进行检测。对于10个对照样品所测定的hsCN的比较显示每对探针的结果是一致的;外显子3 (外显子3a ;平均hsCN = 0. 96(95% CI ;0. 90-1. 01)外显子3b ;平均hsCN = 0. 88 (95 % CI ;0. 83-0. 94) :CV = 0. 06),外显子 5 (外显子 5a ;平均 hsCN = 0. 93 (95 % CI ; 0. 88-0. 98)外显子 5b ;平均 hsCN = 1. 03 (95 % CI ;0. 99-1. 07) :CV = 0. 07)以及外显子 8(外显子 8a ;平均 hsCN = 0. 96(95% CI ;0. 91-1. 0)外显子 8b ;平均 hsCN = 1. 01(95% CI ;0. 95-1. 06) :CV = 0. 04),表 1。大的样品中qicPCR的评价为了可应用到给定CNV中的大规模的联合分析,qicPCR应该允许基因座上的hsCN 能够自动地以< 0. 的错误率载入> 95%的样品,这是当前的高通量SNP基因分型平台的典型标准(Sawcer等人,2004)。因此在各个基因座上的hsCN评价在大量的样品下充分稳定是必要的,从而使具有不同水平的拷贝数目的那些能够清楚地区分。我们使用两个准则来评估qicPCR得到的数据的质量。首先,在已知存在于我们的数据集中的拷贝数目的各种类(正常,单独拷贝损失)中,所有样品的评估的hsCN的变异系数分析使得能在各组内特异地评估数据的一致性。其次,我们使用了 silhouette计分 (Lovmar等人,2005)来评估通过qicPCR评估的hsDNA所形成的不同的群的质量。这是基于所有其他数据点的相对位置,可以将数据点无目的地分配到不同的组中的准确度的有效量度。从-I到+1范围,检测值> 0. 65的Silhouette计分通常被认为是高质量的,其在各个组内的数据点之间具有最小的距离,以及在组之间具有大的距离。通过计算由6次独立的SNP基因分型检测(iplex,Sequenom)获得的数据的CV,我们按照经验确定了在高质量的基因分型检测中数据点的群所期待的CV,其中所述基因分型检测我们此前计分认为是高质量的(以< 0. 的错误率载入> 95%的样品)。所有具有> 0. 65的silhouette计分以及对于所有群的数据点的CV为< 0. 1 (平均=0. 05 (0. 04最小值-0. 07最大值))。基于此我们将我们对于基因分型质量的标准设定为silhouette计分> 0. 65以及CV < 0. 1。为了评估qicPCR是否足够强大到满足基因分型检测所期待的标准,我们分析了两个独立的多重的组,其各个由五个独立的试验检测构成,所述检测设计用于检测染色体 22qll上的拷贝数目变异(qicPCR22qlla和qicPCR22qllb)。两个多重检测一开始在10名此前诊断具有22qllDS的个体及10名健康的对照中进行了分析。与PARK2基因座上获得的初步数据相比,分析大量的样品显示了与单个参照探针相比,尽管测定各个22qll试验探针的hsDNA拷贝数目使得2211qllDS样品(平均hsCN= 1. 10(0. 58-1.84)) 一般而言与非缺失的对照受试者有差别(平均hsCN = 2. 14(1. 16-3. 62)),数据的质量缺少对于基因分型检测所期待的(平均silhouette计分 =0. 16(-0. 03-0. 32);对于22qllDS样品及非缺失的对照的hsCN的CV分别地=0. 25和 0. 28)。我们推论在通过qicPCR测定的hsCN中的测量误差能够通过以下减少1)将多个独立的无联系的参照基因座取平均;和/或2、将靶向相同试验基因座的多个独立的试验探针取平均。我们因此开始系统地评估与这些参数相联系的可变性。使用数目增加的独立对照检测(1至幻作为参照,使用单个试验探针评估hsCN,在22qllDS及非缺失的样品中对于平均评估的hsCN均产生了更严格的置信区间(图3a)。然而,平均CV的适度减少 (22qllDS ;0. 25 到 0. 19 对照 0. 28 到 0.21)以及 silhouette 计分的少量上升(0. 16(-0. 03 最小值-0. 32最大值)到0. 32 (0. 26最小值-0. 36最大值)(图3a)未达到所要求的表现。为了评价增加试验检测的数目的影响,我们考虑了所有的22qll试验探针为靶向单个CmK22qll基因座)的独立的检测。随后使用单个的22qll试验探针,以及也从独立的22qll试验探针2,3,4和5的平均值计算各个样品的hsDNA绝对值。随后参考在同一多重的组中扩增的单一对照检测,测定hsCN的评估值。这再次显示了独立的试验检测的数目从1个增加到5个对于22qllDS及非缺失的样品的hscopy数目产生了更严格的置信区间(图3b),然而在CV中的微小的减少(22qllDS ;0. 25到0. 19 对照0. 28到0. 21)以及silhouette计分的微小的上升(0. 16 (-0. 03最小值-0. 32最大值)到0. 40 (-0. 02最小值-0. 65最大值))未满足对于基因分型检测所期待的标准(图北)。我们随后评价了在同样的多重反应中,增加独立的试验探针数目及独立的对照探针的数目的影响。计算基因座的hsDNA数量(所述hsDNA数量为至少4个独立的试验检测的平均值),随后通过与至少4个参照检测进行比较而测定基因座的平均hsCN,得到数据质量的相当大的改进(图4),其中低CV <0.09以及高的silhouette计分(> 0. 77)满足我们对于基因分型检测的预先定义的标准。我们使用22qll试验检测(qicPCR22qllb)的完全独立的多重的组进行了相同的qicPCR的评估,以检测在22qll上的拷贝数目的变化。 同一套样品的分析显示,通过标记物的各多重的组对22qll上的hsCN的评估是类似的(图5),并且当使用至少4个独立的检测和参照检测时,CV及silhouette计分都满足我们预先测定的准则(数据未给出)。考虑到我们的经验,一些检测的表现可能当规模放大时变得较不稳健,我们分析了更大系列的753个样品,其由733个非缺失的对照以及20个新的22qllDS样品组成,该样品与在优化检测中的那些样品是独立的,沿着对照样品分散。对于各个样品,在22qll基因座上的hsCN测定为5个基因座特异的试验探针和所有位于同一多重反应中的5个参照探针的平均。将全部的样品重复分析,并从两个实验的重复中获得类似的结果(图6)。 全部的22qllDS样品能从20个对照样品中清楚地区分(silhouette计分=0. 81)(图6)。 22qllDS样品的平均hsCN估值为0. 96 (0. 46最小值-1. 48最大值),平均CV = 0. 20 (0. 14 最小值-0. 23最大值),尽管非缺失的对照为2. 07 (1. 68最小值-2. 82最大值),平均CV =0. 06 (0. 05最小值-0. 07最大值)。期待高通量的基因分型检测对于分析大量的样品是足够稳健的(排除率< 5% ),同时保持非常低的基因型错误率(< 0. )。使用单独的 Excel (Microsoft)电子数据表对我们的样品进行预先不知的基因分型(这附属于简单的半自动流程),从而,如果通过qicPCR测定的hsCN落入期待的整数的+/-40%之内(1个拷贝=0. 6-1. 4,2个拷贝=1. 6-2. 4),将样品称作携带1或者2个拷贝数目。落在这些范围之外的hsCN评估值被认为是基因分型失败。各单独通过实验的分析产生> 97%的样品得以基因分型,准确率为100% (总共46/1506个样品未能进行基因分型)。进一步地,将hsCN 确定为各多重的组的两次重复实验的平均值进一步改进了基因分型的质量,其中> 99. 4% 的样品得以基因分型,其准确率为100% (总共5/753个重复分析的样品未能进行基因分型),这表明简单地通过进行一次重复实验,能够进一步改进通过qicPCR的CNV的定量基因分型的质量。qicPCR的准确度高度地依赖于参照基因座自身在拷贝数目上不变化。尽管很明显不可能在任何给定的参照基因座完全消除罕见的CNV,可以通过选择来自此前未显示普通 CNV迹象的基因组区域的参照基因座,使该风险明显地减少。进一步地,能够通过设计各多重反应以包括多个参照基因座来进一步地减少这一可能性,所述的参照基因座选自不同的基因组区域,从而使得存在于一个对照区域的罕见CNV被检测或者从分析中排除。另一个潜在的问题是SNP在引物结合位点上的存在。大多数SNP对于人类或者黑猩猩是特异性的(Kehrer-Sawatzki和Cooper 2007)。位于试验或者参照基因座的引物结合位点的人类特异性SNP(hsSNP)可能导致多态的错配,其可能导致由于等位基因特异的 “丢失”导致通过qicPCR的拷贝数目的评估的可变性。因此,位于试验及参照检测的引物下的hsSNP可能分别导致在试验基因座上,所评估的拷贝数目的明显减少或者增加。试验和参照检测都应该排除hsSNP的存在,在目标或者参照基因座上的无意识选择可能导致高度不稳定的检测。考虑到qicPCR检测只参照单独的黑猩猩基因组进行hscopy数目的评估,在其非故意地被选作检测靶标或者其在引物序列下导致错配时,黑猩猩特异性的SNP(ptSNP) 的存在很可能对于qicPCR检测的准确性具有很小的影响。然而,如果参照黑猩猩DNA样品的基因型对于在人类中保守的相同核苷酸是同源的,那么非故意地靶向ptSNP的qicPCR 检测会失败。理想地应该避免ptSNP,然而由于参照黑猩猩基因组序列主要得自单个的供体 (Clint),这一任务应该通过使用来自qicPCR检测的“Clint”的DNA来帮助完成。估计单个的核苷酸取代以人类和黑猩猩基因组之间平均比率为1. 23%而发生,在两个物种之间对应于固定的趋异(divergence)为 1.06% (Consortium2005)。然而,非保守的核苷酸并非一致地与CpG岛分布在人类基因组中,并且远侧区域显示了趋异的增加的比率(Consortium 2005)。考虑到这一点,分开为1Mb的人类基因组的分析指出,和黑猩猩的趋异比率为从0. 006到0. 022变化(Consortium 2005),这暗示着即使在人类基因组中最保守的区域,我们也能够期待非保守的核苷酸平均每 200bp发生一次。因此,由于最保守的估计表明非保守的核苷酸至少像SNP—样地常见,可能可以设计qicPCR检测以靶向绝大部分的人类基因组。很清楚的是,不可能通过qicPCR分析不具有黑猩猩同源染色体的人类序列,然而,人类和黑猩猩基因组序列的比较性分析指出,这一数字非常小,仅53 个基因( 0.2%)确定在任一物种中都是缺失的(Consortium 2005)。旨在通过阵列方法对CNV进行基因分型的大规模的研究的结果可能是含糊不清的,并通常要求通过独立的检测进行验证。由于qicPCR检测靶向趋异的核苷酸,随后其能作为独立的检测来验证通过更传统的方法(SNP,CGH)检测到的CNV。进一步地,考虑到固定的非保守核苷酸的高频率,潜在地可能设计qicPCR检测以分析小CNV ( < 21Λ),后者正越来越成为CNV研究的目标。在这一研究中,我们表明了 qicPCR能够准确地区分正常拷贝数目O个拷贝)和1个单拷贝缺失(1个拷贝)及1个单拷贝增加(3个拷贝)。疾病关联的多个报告涉及到更复杂的CNV,典型地具有彡4DNA拷贝(Aitman等人,2006 ;Gonzalez等人,2005 ;Hollox等人, 2008)。尽管我们在本研究中还没有进行这类本质的检测,此前已经证明使用旁系同源比率试验(paralogue ratio test)的竞争PCR对于基因型复合CNV具有足够的灵敏度(Armour 等人,2007 ;Hollox等人,2008)。考虑到这一点以及本研究中所报道的数据的灵敏度,以下是可能的qicPCR足够灵敏到允许更复杂的拷贝数目多态性的基因分型。本研究中进行的所有检测使用kquenom Massarray基因分型平台进行,其最适于分析30_40个检测的多重的组,并因此限于同时分析 6个CNV。考虑到qicPCR潜在地可以使用任意的SNP基因分型检测(所述检测对各等位基因产生信号强度的定量读数)进行,可以将其用于当前可得的基于阵列的平台并因此提供可以用于非常大规模的CNV基因分型研究的可能。附表1 用于qicPCR检测的引物
1权利要求
1.用于测定研究物种的DNA中特定的试验基因座上的拷贝数目的方法,所述方法包括以下步骤(i)使所述研究物种的DNA样品(研究样品)和至少一个竞争物样品共扩增,所述DNA 样品包含试验基因座,所述竞争物样品包含得自紧密相关的物种的同源DNA序列;( )使用至少一种合适的分子检测靶向所述同源DNA序列内的在两个物种之间非保守的核苷酸,从而区分所述研究样品和竞争物样品的DNA序列;(iii)对于靶向非保守的核苷酸的各检测,定量所述研究物种中存在的DNA的量;以及(iv)测定在所述研究物种中的试验基因座上的DNA拷贝数目的定量评估值;其中所述竞争物样品包含与所述研究物种的DNA序列同源的DNA,并含有至少一个非保守的核苷酸,从而可以通过至少一种合适的分子检测区分所述研究样品和竞争物样品。
2.如权利要求1所述的方法,其中所述研究样品包含多于一个试验基因座。
3.如权利要求1或者权利要求2所述的方法,其中所述研究样品包含来自所述研究物种的个体的至少一条染色体或者整个基因组的DNA,或者所述研究样品包含由所述研究物种的个体的至少一条染色体或者整个基因组组成的DNA。
4.如权利要求1到3任一项所述的方法,其中所述试验基因座或者多个基因座在所述方法进行之前预先确定为目标区域。
5.如权利要求1到3任一项所述的方法,其中所述试验基因座或者多个基因座此前是未知的。
6.如权利要求1到5任一项所述的方法,其中所述试验基因座为DNA序列,该序列的拷贝数目变异(拷贝增加或者拷贝损失)与所述研究物种中的表型变异有关。
7.用于诊断疾病或者特定表型的方法,所述疾病或者特定表型已知与研究物种的基因组中特定的染色体DNA序列(试验基因座)的DNA拷贝数目的变化有关,所述方法包括(i)使所述研究物种的DNA样品(研究样品)和至少一个竞争物样品共扩增,所述样品包含试验基因座,所述竞争物样品包含得自紧密相关的物种的同源DNA序列;( )使用至少一种合适的分子检测靶向在所述同源DNA序列内的在两个物种之间非保守的核苷酸,从而区分所述研究样品和竞争物样品的DNA序列;(iii)对于靶向非保守的核苷酸的各个检测,定量所述研究物种中存在的DNA的量;以及(iv)测定所述研究物种中试验基因座上的DNA拷贝数目的定量评估值;其中所述竞争物样品包含与所述研究样品的DNA序列同源的DNA,并含有至少一个非保守的核苷酸,从而可以通过至少一种合适的分子检测区分所述研究样品和竞争物样品, 并且其中在所述试验基因座上的DNA拷贝数目的增加或者损失与所述疾病或表型有关。
8.如权利要求7所述的方法,其中所述试验基因座为DNA序列,该序列的拷贝数目变异 (拷贝增加或者拷贝损失)与所述研究物种中的表型变异有关,如帕金森病,DiGeorge综合征(22qlIDS),癌症,Charcot-Marie iTooth, CYP450 代谢。
9.测定基因组DNA中的拷贝数目变异(CNV)与疾病或者症状的联系的方法,所述方法包括(i)使来自具有所述疾病或者症状的研究物种的患者的DNA样品(研究样品)与至少一个竞争物样品共扩增,所述竞争物样品包含得自紧密相关的物种的同源DNA;(ii)使用至少一种合适的分子检测靶向在所述同源DNA序列内的在两个物种之间非保守的核苷酸,从而区分研究样品和竞争物样品的DNA序列;(iii)对于靶向非保守的核苷酸的各检测,定量所述研究物种中存在的DNA的量;以及(iv)测定在所述研究物种中的一个或者多个试验基因座上的DNA拷贝数目的定量评估值,其中在试验基因座上的拷贝数目变异可以指示与所述疾病或者症状的联系;其中,所述竞争物物种的DNA序列与所述研究物种的DNA序列是同源的,并且含有至少一个非保守的核苷酸,从而可以通过至少一种合适的分子检测区分所述研究序列及竞争物序列。
10.如权利要求9所述的方法,其中所述试验基因座此前是未知的。
11.如权利要求9所述的方法,其中所述试验基因座或者多个基因座选择为在被怀疑与所述疾病或者症状有关的基因组的区域中。
12.如权利要求11所述的方法,其中所述研究样品包含来自患者的至少一条染色体或者整个基因组的DNA,或者包含由患者的至少一条染色体或者整个基因组组成的DNA。
13.如权利要求9到12任一项所述的方法,其进一步包括使用得自多个患者的研究样品进行所述方法。
14.如权利要求9到13任一项所述的方法,其进一步包括使用来自所述研究物种的一名或者多名患者的参照样品进行步骤(i)到(iv),所述患者未患有所述疾病或者症状。
15.如权利要求1到14任一项所述的方法,其中所述扩增步骤通过聚合酶链式反应 (PCR)进行。
16.如权利要求1到15任一项所述的方法,其中所述研究物种为智人。
17.如权利要求16所述的方法,其中所述紧密相关的物种为猿类,如黑猩猩(Pan troglodytes),大猩猩物种或者倭黑猩猩(Pan paniscus)。
18.如权利要求1到17任一项所述的方法,其中所述竞争物样品包含来自所述竞争物物种的所述个体的至少一条染色体或者整个基因组的DNA,或者包含由所述竞争物物种的所述个体的至少一条染色体或者整个基因组组成的DNA。
19.如权利要求1到18任一项所述的方法,其中通过比对所述研究物种和竞争物物种的各自同源的基因组序列,并且鉴定两个物种之间不同的核苷酸,来设计所述非保守的核苷酸。
全文摘要
本发明涉及用于测定在特定基因座上的DNA拷贝数目的方法。所述方法包括使研究物种的DNA样品与竞争物样品共扩增,所述DNA样品包含试验基因座,所述竞争物样品包含得自紧密相关的物种的同源DNA序列。
文档编号C12Q1/68GK102439167SQ200980123018
公开日2012年5月2日 申请日期2009年6月18日 优先权日2008年6月20日
发明者M·C·欧当诺万, M·J·欧文, N·M·威廉姆斯 申请人:加的夫大学学院咨询有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1