应用snp阵列测量染色体、基因或特定核苷酸序列拷贝数的方法

文档序号:580133阅读:429来源:国知局
专利名称:应用snp阵列测量染色体、基因或特定核苷酸序列拷贝数的方法
应用SNP阵列测量染色体、基因或特定核苷酸序列拷贝数
的方法
背景技术
1.发明领域本发明涉及测量染色体、基因或特定核苷酸序列拷贝数的方法,其包括如下步骤 (a)将纯合DNA与测试样品DNA混合;(b)利用SNP阵列分析该DNA混合物;以及(c)通过 测量纯合DNA与测试样品DNA信号输出的差异来测定染色体、基因或特定核苷酸序列的拷 贝数。2.相关技术描述特定染色体序列的改变常常与人类疾病和综合症有关。这些改变包括如一个 完整染色体的添加或缺失,如在唐氏综合征中;几百万个碱基对的缺失,如在迪乔治综合 征中;以及小染色体片段的缺失或重复,如在贝克尔或杜兴肌营养不良中。亚端粒缺失 (subtelomericdeletion)在智力迟钝患者中也经常被报道(Lamb等,1989)。此外,特定基 因如BRCAl或MLH1/MLH2的染色体区域在肿瘤中也常常被改变,已知这对于基因表达是重 要的(Petrij-Bosch等,1997 ;Wijnen等,1998)。从应用ERBB2特异性抗体治疗乳腺癌患 者——其具有扩增的ERBB2基因——的实例可知,基因拷贝数改变的分析对于癌症患者的 治疗可能是重要的(Leyland-Jones和Smith,2001)。目前,许多技术被用来测定染色体改变的拷贝数。测量染色体数目和结构改变最 标准的方法是核型分析方法。根据该方法,需要培养患者的血液、成纤维细胞或羊膜细胞, 并且需要很多时间和人力来解释其结果。核型分析方法通常仅仅可以检测1百万个碱基 或更多个碱基的染色体改变。该敏感性问题可以用荧光原位杂交(FISH)方法来弥补。然 而,FISH方法也需要很多时间和人力并且通常无法每次测量四个或更多个不同靶基因的 改变(Klinger 等,1992)。此外,多色染色体涂染方法(multicolor chromosome painting method)作为核型分析自动化的方法而引入。该方法通过用不同颜色的荧光物质标记每个 染色体部分使得染色体的缺失、重复或易位容易被检测(美国专利号6,066,459)。尽管多 色染色体涂染方法与核型分析方法相比敏感性略微增加,但其基本上需要核型分析所需的 细胞培养和后处理。为了克服对时间和人力的要求,最近已经开发了几种分子方法来检测染色体的 改变。基于阵列的比较基因组杂交(CGH)是最有前途的方法之一并且已经尝试了许多试 验以用于诊断遗传疾病或检测癌症组织中染色体的改变(Pinkel等,1998;美国专利号 6,197,501和6,159,685)。该方法将BAC克隆固定在基材表面以形成阵列,并且将预标记 的标准DNA和样品DNA与该阵列杂交。根据该方法,比较标准DNA和样品DNA的信号相对 量,以检测诸如缺失或重复的染色体改变。另外,存在通过用多重PCR方法测量相对扩增来测定拷贝数的方法(Rahil 等,2002)。最近,作为其改进的方法,引入了多重连接依赖性探针扩增(multiplex ligation-dependent probe amplification)(MLPA)(Schouten 等,2002; 专 利 号 W09615271)。
杂合性丢失(LOH)是检测染色体缺失或重复的最常见的方法。微卫星标记已经被 用于LOH的研究(Call等,1990)。然而,应用微卫星标记的LOH方法除纯合缺失的情况以 外不能区别染色体改变是缺失还是重复。Pont-Kindon和Lyon (2003)报道了应用SNP检测染色体异常的另一种方法。它们 应用解链曲线分析来检测杂合等位基因的相对量。当两个等位基因的相对量不同于正常比 率时,该方法检测到存在三体性。另外,引入了利用SNP阵列检测染色体缺失或重复的方法(Lindblad-Toh等, 2000)。该方法巨大的潜力在于,可以延伸阵列以检测大量SNP。然而,用于检测染色体改变 的SNP阵列的局限性在于,其需要测试DNA中存在杂合等位基因。常见SNP是存在于5%以 上的群中的SNPJfi SNP的数目和用于CNV(拷贝数变异)的杂合体频率在单一基因中是低 的。因此,为了检测感兴趣的特定SNP,对于方法的改进存在迫切需求。因此,本发明人努力解决上述问题并且开发了测量染色体、基因或特定核苷酸序 列拷贝数的更加有效的方法。最终,本发明人开发了包括如下步骤的方法将纯合DNA与测 试样品DNA混合,以及利用能够测量稀有SNP的SNP阵列分析该DNA混合物,以测量每个样 品信号输出的差异。他们发现,该方法与测定特定基因拷贝数的其它分子方法相比能够得 到更精确的值,以及明显减少成本和所需人力,从而完成本发明。发明概述本发明的目的是提供测量染色体、基因或特定核苷酸序列拷贝数的方法,其包括 如下步骤(a)将纯合DNA与测试样品DNA混合;(b)利用SNP阵列分析该DNA混合物;以 及(c)通过测量纯合DNA与测试样品DNA信号输出的差异来测定染色体、基因或特定核苷 酸序列的拷贝数。发明效果根据本发明的测量染色体、基因或特定核苷酸序列拷贝数的分析试剂盒和方法, 当测定特定基因的拷贝数时可以得到比其它分子方法更精确的值,以及当分析染色体的改 变时显著减少时间和需要的人力。因此,该方法与已知方法相比可以容易地检测染色体或 基因的重复和缺失。附图简述

图1是显示当单独分析正常测试样品DNA和分析正常测试样品DNA和纯合DNA的 11混合物时每个等位基因的相对信号强度的示意图;图2是显示当一个等位基因的缺失发生时每个等位基因的相对信号强度的示意 图;图3是说明本发明实验方法和分析方法的示意图;图4是显示通过应用纯合的葡萄胎(水泡状脂块)细胞系DNA和唐氏综合征细胞 DNAWl 1混合物分析拷贝数的SNP阵列结果的示意图;图5是显示通过应用唐氏综合征样品(测试样品)和正常对照DNA(纯合体)分 析拷贝数的Illumina SNP阵列(317K Duo)结果的示意图,其中三角表示染色体1上的SNP 分析结果以及菱形表示染色体21上的SNP分析结果;图6是显示应用唐氏综合征DNA(染色体1和染色体21)作为样品的Illumina SNP 阵列(317K Duo)分析后信号强度比较结果的示意图,其中三角表示染色体1上的SNP分析
4结果以及菱形表示染色体21上的SNP分析结果;以及图7是显示应用唐氏综合征DNA(染色体1和染色体21)作为样品的Illumina SNP 阵列(317K Duo)分析后每个SNP的信号比的示意图,其中三角表示染色体1上的SNP分析 结果以及菱形表示染色体21上的SNP分析结果。优选实施方式描述在一个方面,为了达到上述目的,本发明涉及测量染色体、基因或特定核苷酸序列 拷贝数的方法,其包括如下步骤(a)将纯合DNA与测试样品DNA混合;(b)利用SNP阵列分 析该DNA混合物;以及(c)通过测量纯合DNA与测试样品DNA信号输出的差异来测定染色 体、基因或特定核苷酸序列的拷贝数。具体地,步骤(a)中的纯合DNA为任何细胞系,而没有限制,只要其是纯合的,以及 依照本发明的目的,优选源自单性生殖细胞系或葡萄胎细胞系的纯合体。如本文所用,术语“单性生殖细胞系”指由未受精的卵(η)发育的二倍体(2η)细 胞系,以及术语“葡萄胎细胞系”指来自大量异常胚胎组织的细胞系,其中DNA(2η)仅源自 精子(η)。因此,单性生殖细胞系和葡萄胎细胞系的所有DNA均是纯合DNA。如本文所用,术语“纯合体”除上述单性生殖细胞系或葡萄胎细胞系之外还可以是 单倍型(haplotype)或BAC克隆DNA。将DNA混合物扩增,然后用于下一步骤,SNP阵列中。如本文所用,术语“扩增”指进一步合成目标序列的过程。扩增过程可以通过本领 域中使用的常规方法来完成,而没有限制,优选聚合酶链反应(PCR)。完成该过程以从样品 获得足够的DNA。一般而言,扩增过程包括退火、合成(延伸或延长)和变性的过程。样品 序列通过上述方法进行扩增,然后用于SNP阵列中。如本文所用,术语“样品”是来自活有机体的生物物质以及主要指来源于人的生物 物质。术语“测试样品”指用于测量染色体、基因或特定核苷酸序列拷贝数的对象。待用作 测试样品的样品种类没有具体的限制,以及其可以优选是从怀疑具有染色体数目异常或改 变的个体获得的样品。在本发明的优选实施例中,来自唐氏综合征对象的样品被用作测试 样品,并且分析基因拷贝数的改变。步骤(b)是对扩增的DNA片段化和标记,以及将标记的DNA杂交在SNP阵列芯片 上的步骤。此时,优选根据掺入SNP位置的碱基类型使用不同种类的荧光材料。当通过SNP 阵列分析纯合DNA和样品DNA的混合物时,信号比可以通过两种不同类型细胞或两种不同 碱基——当碱基彼此不同时——的等位基因获得。如果染色体异常如缺失或重复出现,则 信号比变得与正常染色体的信号比不同。在本发明中,SNP阵列可以通过本领域中通常使 用的SNP阵列方法和商业获得的SNP阵列芯片例如Affymetrix制造的SNP阵列芯片(10K、 100K、500K等)来完成。如本文所用,术语“单核苷酸多态性”(SNP)是单核苷酸的多态性。也即,在种群 中,基因组中的单核苷酸在配对的染色体成员之间不同,并且SNP通常每300-1000个碱基 对出现大约一次。因此,在人基因组中存在三百万个SNP。SNP分为rSNP(调节SNP),其发现于与转录活性调节有关的区域如启动子区域 中;cSNP(编码SNP),其诱导外显子的氨基酸突变;iSNP(内含子SNP),其发现于内含子中; sSNP (沉默SNP),其诱导外显子的沉默突变;以及gSNP (基因组SNP),其发现于其它基因组 区域中,并且可用于本发明的SNP的类型并不限于这些实例。
5
在人基因组中,99. 9%的DNA序列是相同的,以及剩余0. 的DNA含有与种群多 样性相关的序列变异,如疾病易感性或药物个体反应。最近,据报道,SNP与药物的敏感性 或副作用直接相关。因为SNP是非常丰富的并且分布于整个基因组中,所以它们是可以用 于研究疾病易感性或药物个体反应的可靠的多态性。通过研究SNP,可以了解自然遗传变异 和疾病之间的关系,并且也可以分析药物敏感性或副作用。因此,这些SNP研究可以提供进 一步筛选遗传疾病和设计个性化药物治疗的出发点。一般而言,SNP由非常高度保守的周围序列进行定义。一个单核苷酸与任何一个其 它核苷酸的置换,或核苷酸的缺失或重复导致SNP。具体而言,稀有SNP指等位基因频率低 于5%的SNP,以及常见SNP指等位基因频率高于5%的SNP。稀有SNP可以根据种(race/ ethnicity)不同而发生。依照本发明的目的,稀有SNP的定义可能根据定义的种群是否限 于人种或是否限于特定种群而不同。还有,明显的是,即使变异在一个种群中作为常见SNP 而存在,其在其它种群中也可以是稀有SNP。因此,即使稀有SNP仅存在于某一种群中,其 在本发明中也被认为是稀有SNP。如上所述,根据种(race/ethnicity)不同而发生的稀有 SNP可以用于组成有效的阵列。基于待分析的种群的特异性,可以测定种群规模。因此,明 显的是,稀有SNP的定义可以不同。这些SNP特性(profile)用可于筛选特定种群以及人 种的疾病模型。如本文所用,术语“多态位点”指可以发现不同碱基的位置。通常,SNP具有至少两 个等位基因,以及其频率在一般情况下指或更高的出现。最经常出现的等位基因的形式 被称为野生型形式,以及不经常出现的等位基因的形式被称为突变的等位基因。如本文所用,术语“等位基因”指同源染色体上存在于给定基因座中的相同基因的 不同形式。等位基因可以用来表示多态性的一种形式,例如大部分SNP是双等位基因的。如本文所用,术语“SNP阵列芯片”指生物微芯片,其能够通过排列和附着几百至几 十万个生物分子作为探针来分析样品DNA中所含有的SNP的存在,所述生物分子如具有已 知序列的DNA、DNA片段、cDNA、寡核苷酸、RNA或RNA片段,它们被以一定的间隔固定在由玻 璃、硅或尼龙形成的小固体基材上。根据互补的程度,样品中含有的核酸和固定在表面的探 针之间发生杂交。通过检测和判断杂交,可以同时获得关于样品中含有的物质的信息。步骤(c)是通过测量纯合DNA与测试样品DNA信号输出的差异来测定染色体、基 因或特定核苷酸序列的拷贝数的步骤。信号检测可以通过本领域中使用的任何常规方法完成,而没有限制,例如激光诱 导荧光检测方法、电化学检测方法、质量检测方法或表面等离子共振(SPR)。在激光诱导荧 光检测方法中,荧光物质与样品DNA偶联,在杂交后,应用荧光检测设备检测反应的结果, 以通过光学方法测定杂交。在电化学检测方法中,通过应用电化学反应,即电极上其它化学 物质的还原和氧化反应,检测杂交。在质量检测方法中,探针和样品DNA之间的相互作用被 电信号化和检测。作为通常的实例,有电化学石英晶体微天平(QCM)检测方法,其根据固定 在高频率振荡的石英上的捕获探针的质量测量频率变化。表面等离子共振(SPR)是一种这 样的现象其在生物分子如蛋白结合至传感器的表面后引起信号改变,以及通过光学方法, 如沿着金属表面传递的自由电子的量化振动,检测探针质量改变产生的sra信号改变。该 方法能够检测因质量差异引起的DNA结合亲和性,而不用另外的荧光物质标记样品。优选 的方法可以是激光诱导荧光检测方法。
染色体、基因或特定核苷酸序列的拷贝数可以通过测量纯合DNA与测试样品DNA 信号输出的差异容易地测定。通过本发明的测定拷贝数的方法,可以测定增加的拷贝数和 减少的拷贝数。也即,可以测定因染色体重复而增加的拷贝数(例如,常染色体中的三体性 或四体性)和因染色体缺失而减少的拷贝数。具体地,在变更纯合等位基因的情况下,也就是,当测试样品DNA的SNP等位基因 是纯合的,但其碱基序列不同于纯合细胞系DNA等位基因的碱基序列时,测试样品和纯合 细胞系的SNP等位基因彼此不同。因此,测量每个DNA的SNP信号(SR)比率,从而分析拷 贝数的改变。式样品的SNP信号/纯合细胞系的SNP信号例如,当样品DNA和纯合细胞系DNA的1 1混合物用于SNP阵列中时,每个DNA 的SNP信号(SR)比率将是1 1。就此而言,如果比率不是1 1,则表明拷贝数的改变。 如果在实践过程中难以将混合比率保持在1 1,则测量两个DNA的总信号比率,以校正 SR,从而更加精确地测量拷贝数的改变。此外,当测试样品DNA是纯合等位基因时,通过本发明的方法两种碱基的信号强 度出现1 3或3 1的比率。比率根据拷贝数的改变而变化。因此,即使测试样品DNA 是纯合等位基因,也可以测定拷贝数。与单独分析正常DNA的已知方法相比,本发明的方法能够提供关于拷贝数改变的 更加有价值的信息。依照本发明的一个优选实施方式,与仅应用测试样品的已知分析方法 相比(图6和7),即使应用很小量的SNP,通过本发明的方法也可以很容易和精确地检测特 定物质的染色体重复和缺失(图6和7)。如本文所用,术语“变更(alter)纯合等位基因”指这样的SNP,其中测试样品DNA 的SNP等位基因是纯合的,但其碱基序列不同于纯合细胞系DNA等位基因的碱基序列,以及 该术语由本发明人为更好地描述而引入。在优选的实施方式中,当本发明的方法应用于稀有SNP的SNP阵列时,关于拷贝数 改变的信息可以更加有用地获得。例如,如图1和2中所示,在单独分析正常DNA样品后,六个SNP中两个可以只用在 SNP阵列中。然而,当在稀有SNP之中,仅选择纯合细胞系DNA中发现的SNP用于SNP阵列 中时,即使应用小量的SNP也可以获得大量信息。也即,当由频率为5%的SNP组成的SNP 阵列被用来分析100个SNP时,发现大约10个杂合SNP,由此可以获得关于拷贝数改变的信 息。同时,当由频率低于的稀有SNP组成的SNP阵列被用来分析100个SNP时,可以有 利地使用阵列中98%以上的杂合等位基因。另外,可以使用所有低频率的SNP。因此,在单 性生殖细胞系中,选择具有许多稀有SNP的细胞系或使用其它种的纯合细胞系来更加准确 地测定特定区域拷贝数的改变。同样,本发明的方法对于仅由稀有SNP组成的SNP阵列非常有用,而且也可应用于 商业获得的由稀有和常见SNP组成的SNP阵列。也即,应用商业获得的SNP阵列单独分析 变更纯合等位基因,以测定拷贝数。本发明的实践可以采用有机化学、聚合物技术、分子生物学(包括重组技术)、细 胞生物学、生物化学和免疫学的常规技术和描述,其均在本领域的技能内。这些常规技术
7包括聚合物阵列合成、杂交、连接和应用标记检测杂交。这些常规的技术和描述可以发现 在标准实验室手册中,诸如Genome Analysis :A Laboratory Manual Series (Vols. I-IV)、 Using Antibodies :A Laboratory Manual、Cells :A Laboratory Manual、PCR Primer A Laboratory Manual 禾口 Molecular Cloning :A Laboratory Manual (全部来自 Cold Spring Harbor Laboratory Press)、Biochemistry (Stryer, L. Freeman, New York)、 Oligonucleotide Synthesis :A Practical Approach(Gait,1984, IRL Press, London) Lehninger Principles of Biochemistry(Nelson 禾口 Cox,2000, W. H. Freeman Pub., New York)和 Biochemistry (Berg 等 2002,W. H. Freeman Pub.,New York),所有这些通过引用其 全部并入本文,用于所有目的。 在本发明中可用于聚合物阵列合成的方法和技术已经描述在美国序列号
09/536;,841、WO 00,/58516、美国专利号5,143,854,5, 242,974,5, 252,743,5,324,633、5,384,261,5,405,783,5,424,186,5,451,683、5,482,867,5,491,074,5,527,681、5,550,215,5,571,639,5,578,832,5,593,839、5,599,695,5,624,711,5,631,734、5,795,716,5,831,070,5,837,832,5,856,101、5,858,659,5,936,324,5,968,740、5,974,164,5,981,185,5,981,956,6,025,601、6,033,860,6,040,193,6,090,555、
6,136,269,6, 269,846 和 6,428,752 以及 WO 99/36760 和 WO 01/58593 中,它们通过引用其 全部均并入本文,用于所有目的。核酸阵列描述在许多专利中,包括美国专利号5,412,087,6, 147,205,6, 262,216、 6,310, 189,5,889, 165和5,959,098,但相同的技术用于多肽阵列。本发明还可以考虑基因表达监测技术、序型分析技术、文库筛选技术和基因型分 型技术。基因表达监测和序型分析方法可以显示在美国专利号5,800, 992,6, 013,449、 6,020,135,6, 033,860,6, 040,138,6, 177,248 和 6,309,822 中。基因型分型及其应用显示 在美国序列号 10/442,021、10/013,598 和美国专利号 5,856,092,6, 300,063,5, 858,659、 6,284,460,6, 361,947,6, 368,799 和 6,333,179 中。在本发明中,基因组样品可以通过各种机制扩增,其中一些可以采用PCR。 参见,例如,PCR Technology principles and Applications for DNA 扩增(Ed. H. A. Erlich, Freeman Press, NY, N. Y. ,1992) ;PCRProtocols :A Guide to Methods and Applications(Eds. Innis, et al. , Academic Press, San Diego, Calif. ,1990) ;Mattila 等,Nucleic Acids Res.19,4967(1991) ;Eckert φ, PCR Methods and Applications 1, 17(1991) ;PCR(Eds. McPherson et al.,IRL Press, Oxford);以及美国专利号 4,683,202、 4,683,195,4, 800,159,4, 965,188 和 5,333,675。杂交测定的方法描述在=Maniatis 等 Molecular Cloning :A Laboratory Manual (2nd Ed. Cold Spring Harbor, N. Y. , 1989) ;Berger 禾口 Kimmel Methods in Enzymology, Vol. 152, Guide to Molecular Cloning Techniques(Academic Press,Inc., San Diego, Calif. , 1987) ;Young 和 Davism,P. N. A. S,80 :1194(1983)中。杂交的信号检测的方法描述在美国专利号5,143,854,5, 578,832 ;5,631,734 ; 5,834,758 ;5,936,324 ;5,981,956 ;6,025,601 ;6,141,096 ;6,185,030 ;6,201,639 ; 6,218,803 ;和 6,225,625 以及 W099/47964 中。本发明的实践还可以采用常规生物学方法、软件和系统。本发明的计算机软件
8产品通常包括具有计算机可执行指令的计算机可读介质,所述计算机可执行指令用于 完成本发明方法的逻辑步骤。适合的计算机可读介质包括软盘、⑶-R0M/DVD/DVD-R0M、 硬盘驱动器、闪存、ROM/RAM、磁带等。计算机可执行指令可以以适合的计算机语言或几 种语言的组合编写。基本的计算生物学方法描述在Introduction to Computational Biology Methods(PffS Publishing Company, Boston,1997) ;Computational Methods in Molecular Biology,(Elsevier,Amsterdam,1998) ;Bioinformatics Basics Application in Biological Science and Medicine(CRC Press, London,2000)禾口 Bioinformatics :A Practical Guide for Analysis of Gene and Proteins(Wiley & Sons, Inc. ,2. sup. nd ed.,2001)中。本发明还可以利用各种计算机程序产品和软件,用于多种目的,如探针设计、数据 管理、分析和仪器操作。参见,美国专利号5,593,839,5, 795,716,5, 733,729,5, 974,164、 6,066,454,6, 090,555,6, 185,561,6, 188,783,6, 223,127,6, 229,911 和 6,308,170。本发明可以用来诊断和筛选因重复和缺失的染色体异常,如三体性、单体性和性 染色体异常。另外,本发明用于诊断因小染色体缺失的遗传性疾病,如杜兴肌营养不良,以 及用于检测疾病中小染色体的改变,所述疾病具有多种原因所引发的遗传倾向,诸如智力 迟钝、阿尔茨海默病和糖尿病。进一步,本发明可以用来分析肿瘤组织中致癌基因和肿瘤抑 制基因拷贝数的变化,或总染色体数目的异常。染色体的拷贝数因个体而不同,据报道,这 种拷贝数变异与一些疾病相关(Iafrate等,2004)。因此,本发明可以用于检测个体之间的 拷贝数变异。具体而言,与已知方法相比,本发明的分析方法是强有力的工具,其可以检测 高于3η的增殖和有效分析小染色体区域的扩增。下面,参考下列实施例对本发明进行更加 详细的描述。然而,这些实施例仅用于说明性目的,本发明不意欲受实施例限制。实施例1.用于检测增加的拷贝数的SNP阵列在单独分析正常测试样品DNA和分析正常测试样品DNA和纯合DNA的1 1混合 物后,每个等位基因的相对信号强度被显示。正常测试样品(正常)中等位基因的相对信号 强度显示在图的左侧。当拷贝数变为三体性时等位基因的相对信号强度显示在图的右侧, 其中每个DNA链的改变被分别描述。在分析了关于测试样品和纯合DNA的所有等位基因的 信息后,根据本发明的方法应用SNP阵列分析每个等位基因。当拷贝数可测量时,其由O表 示。当拷贝数不可测量时,其由X表示。P表示,拷贝数的增加或减少不能通过特定等位基 因的相对信号强度测定,但却发现改变,并且所述增加或减少能够通过总信号强度测定。实施例2.用于检测减少拷贝数的SNP阵列一个等位基因的缺失被显示为每个等位基因的相对信号强度,其中每个DNA链的 缺失被分别描述。当SNP阵列仅在测试样品上进行时,缺失不能由一个等位基因的结果测 定,以及缺失的可能性可以通过分析邻近的等位基因来测定。然而,当应用本发明的方法 时,可以分析每个等位基因,从而测定缺失,并且与现有方法相比其分析性能改进很多(图 2)。实施例3.纯合葡萄胎DNA和唐氏综合征患者DNA——来自纯合葡萄胎细胞系和 具有三个拷贝的染色体21的唐氏综合征患者——的SNP阵列以1 1的比率彼此混合,然 后将该SNP阵列用来分析拷贝数。除染色体21和X染色体之外,SR被发现为1 1、1 3 和3 1。染色体21被发现显示2 3、3 2、1 4和4 1的SR,其中2 3或3 2的SR表明唐氏综合征患者中三个拷贝的染色体21 (图4)。实施例4.唐氏综合征和正常对照DNA的Illumina SNP阵列,唐氏综合征DNA和 正常对照DNA被用作样品,并且分别与葡萄胎DNA(1 1)混合。然后,Illumina SNP阵列 (317K Duo)被用来进行SNP分析。只有在葡萄胎中显示AA并且在唐氏综合征细胞中显示 BB的SNP被单独分析。300个相应的SNP被分别从染色体1和21中提取并且分析(图5)。 结果发现,唐氏综合征中的额外染色体21(3n)的拷贝数容易与正常染色体1 (2η)的拷贝数 区分。为了证实本发明的检测方法的有用性,唐氏综合征DNA(正常染色体1和三个拷 贝的染色体21,无纯合对照DNA)被作为样品用来通过Illumina SNP阵列(317 DUO)完成 SNP分析。分析通常通过信号强度比较的方法和通过分析A和B等位基因信号强度比的方 法来完成。如在本发明的方法中,300个SNP结果被提取,并且然后每个结果均显示在图表 中(图6和7)。结果,当应用本发明的方法时(图5),与只分析信号强度而不与正常对照样品混 合的方法(图6)相比,染色体或基因扩增可以更容易区分。具体而言,当仅应用测试样品 分析信号强度时,染色体21的信号强度(由菱形表示)比染色体1的信号强度增加得多, 但总体变化太高以致无法区分信号。另外,当分析每个峰的信号强度比时(图7),比值在0. 5上下波动,因此难以区 分信号的扩增和减少。具体地,正常染色体1具有在0. 5附近杂合体的比值,以及染色体 21 (3n)具有在0.66和0.33附近的比值。因此,难以区分样品的染色体21的扩增和减少 (图7)。而且,如果染色体增殖高于8η (而非3η)或小部分染色体被增殖,则难以区别信号 与背景。例如。如果染色体或基因的扩增在4或5倍以上,则比值变得接近1或0,使分析 难以进行。与具有上述问题的已知方法相比,本发明的应用正常对照组和测试样品混合物的 分析方法的优势在于,可以容易地区别染色体增殖,可以精确地分析高于3η的增殖,以及 也可以有效地分析小部分染色体的扩增。
权利要求
测量染色体、基因或特定核苷酸序列拷贝数的方法,包括如下步骤(a)将纯合DNA与测试样品DNA混合;(b)利用SNP阵列分析所述DNA混合物;以及(c)通过测量所述纯合DNA与所述测试样品DNA信号输出的差异来测定染色体、基因或特定核苷酸序列的拷贝数。
2.根据权利要求1所述的方法,其中所述纯合DNA是单性生殖细胞系或葡萄胎细胞系 的 DNA。
3.根据权利要求1所述的方法,其中所述纯合DNA是克隆的DNA片段。
4.根据权利要求1所述的方法,其中所述纯合DNA在步骤(a)中与所述测试样品DNA 以1 1的比率混合。
5.根据权利要求1所述的方法,其中所述SNP阵列是被设计来测量稀有SNP的SNP阵列。
6.根据权利要求1所述的方法,其中在步骤(c)中,如果所述纯合DNA和所述测试样 品DNA是变更纯合等位基因,则所述纯合DNA和所述测试样品DNA的SNP等位基因的信号 比(SR)通过下式测量样品的SNP信号/纯合细胞系的SNP信号,然后与其它区域的信号 比比较,以测定染色体、基因或特定核苷酸序列拷贝数的改变。
7.根据权利要求1所述的方法,其中如果所述测试样品DNA是杂合等位基因,则将两个 碱基的信号强度与其它区域的信号强度进行比较,以测定染色体、基因或特定核苷酸序列 拷贝数的改变。
全文摘要
本发明涉及测量染色体、基因或特定核苷酸序列拷贝数的方法,其包括如下步骤(a)将纯合DNA与测试样品DNA混合;(b)利用SNP阵列分析该DNA混合物;以及(c)通过测量纯合DNA与测试样品DNA信号输出的差异来测定染色体、基因或特定核苷酸序列的拷贝数。
文档编号C12Q1/68GK101918597SQ200980101478
公开日2010年12月15日 申请日期2009年3月5日 优先权日2008年3月11日
发明者洪暻满 申请人:国立癌中心
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1