检测染色体异常的方法

文档序号:9252013阅读:913来源:国知局
检测染色体异常的方法
【专利说明】检测染色体异常的方法 发明领域
[0001] 本发明涉及检测染色体异常的方法,具体地讲,本发明涉及胎儿染色体异常例如 三体性21 (唐氏综合征)的诊断,其包括在胎儿妊娠期间得自母体血液的血浆样品中的无 细胞DNA分子的序列分析。
[0002] 发明背景 唐氏综合征(Down'ssyndrome)是一种相对常见的遗传障碍,每800个活产婴儿中大 约有一个罹患该综合征。该综合征是由额外的全染色体21 (三体性21、T21)的存在所致, 或较不常见地,由额外的该染色体的大部分的存在所致。涉及其它常染色体的三体性(即 T13或T18)也发生在活产婴儿中,但比T21更罕见。
[0003] 通常,存在由额外染色体或染色体缺陷所致的胎儿非整倍性的病症,在母体无细 胞血浆DNA中的胎儿DNA分子群体中产生失调,这是可检测的。
[0004] 开发用于胎儿染色体异常的产前诊断的可靠方法在生殖保健中是一项长期目标 (Puszyk等人,2008,PrenatDiagn28,1-6)。基于通过羊膜穿刺术和绒毛膜绒毛取样 而获得胎儿材料的方法是侵入性的,并且对于妊娠具有不可忽视的风险,甚至是在有经验 的临床医生手中也如此。在目前的实践中,这样的侵入性诊断的方法在具有增加唐氏妊娠 机会的征兆(因母亲年龄的原因,或用生化检验或超声检查的先期筛查)的情况下被经常使 用。需要可靠的、可用于头3个月妊娠的、快速出结果的和廉价的非侵入性产前诊断(NIPD) 方法。
[0005] 为达到该目标已经获得了进展,即通过利用以下发现:孕妇血浆中的无细胞DNA 包含胎儿来源的组分(Lo等人,1997,Lancet350,485-487)。无细胞血浆DNA(在下文 称为"血浆DNA")主要由短DNA分子(80-200bp)构成,典型地其中5%-20%是胎儿来源的, 其余的是母体的(Birch等人,2005,ClinChem51,312-320;Fan等人,2010,Clin Chem56,1279-1286)。对于血浆DNA分子的细胞起源以及它们进入血液和随后从循环中 被清除掉的机制,了解的很少。然而,普遍认为胎儿组分主要是胎盘内的凋亡细胞死亡的结 果(Bianchi,2004,Placenta25,S93-S101)。胎儿来源的血浆DNA分子部分因大量个体 差异而各有不同。叠加在个体差异上的是胎儿组分随孕龄增加而增加的总趋势(Birch等 人,2005,出处同上;Galbiati等人,2005,HumGenet117,243-248)。胎儿组分在 妊娠早期、典型地早在第8周时容易检测。
[0006] 原则上,如果血浆中的无细胞胎儿DNA没有被母体成分稀释的话,通过与正常妊 娠相比,表征T21的额外染色体将预期导致50%过量的源自该染色体的DNA分子。然而,对 于胎儿来源的无细胞血浆DNA的组分采取典型值10%,所导致的失调预期仅为5%,或相对于 正常妊娠为1. 00的值而言,染色体21-衍生的片段的数量相对增加到1. 05的值。在血浆 DNA的胎儿组分小于或大于10%的值的情况下,在母体血浆中的分子群体中的染色体21-衍 生的分子数量的失调将会相应地更小或更大。
[0007] 因此,对于T21的诊断检验基础是,获得来自母体血浆的DNA分子的核苷酸序列数 据("DNA测序")。一旦部分或全部核苷酸序列信息已得自单个DNA分子后,必须应用生物 信息技术,最简单的是通过与一个或多个参考人类基因组进行比较,将单个分子指定到其 来源的染色体。在涉及到T21胎儿的妊娠的情况下,分子群体的轻微失调是可检测的,因为 染色体21-衍生的分子数量超过正常妊娠的预期数量。
[0008] 考虑到以下事实:染色体21仅包含人类基因组的一小部分(小于2%),为了采集 来自该染色体的足够大的数量用于可靠诊断,必须随机采取来自母体血浆的大量DNA分子 样品,测序和通过生物信息学指定到特定染色体。以下两项所需的血浆DNA分子的总数,小 于所有或大部分胎儿基因组的样品采集所需,但有至少几十万个分子:(1)通过衍生自它 们的核苷酸序列信息来表征,和然后(2)可靠地指定到染色体位置。所需的最少数量是血 浆DNA部分的函数,所述部分构成母体无细胞血浆DNA分子群体的胎儿组分。典型地,该数 量介于一百万或几百万分子之间。
[0009] 应用该方法的挑战是相当大的,因为在来自特定染色体位置的DNA分子的统计中 需要高的定量准确率。此外,来自母体血浆的DNA是基因组的混合物,其中胎儿组分是少部 分。该定量技术的困难与识别DNA样品中的特定基因座上的突变在性质上是不同的。
[0010] 鉴于对于足够大量的血浆DNA可以获得一些核苷酸序列数据,并且鉴于可以可靠 地应用生物信息学方法来将足够大的数量指定到它们的染色体来源,可以应用统计学方法 来确定血浆DNA分子群体中的染色体失调的存在或不存在,具有统计学置信度。
[0011] 这种对来自母体血浆的DNA片段的随机样品、而不是仅由全基因组的一部分所构 成的样品的测序想法,就是NIH)方法学的基础,该方法描述于Fan等乂,2008,Proc Natl Acad Sci U S A 105,16266-16271和Chiu等乂,2008,Proc Natl Acad Sci U S A 105, 20458-20463〇
[0012] 在该领域的先前的诊断方法学已经利用大规模平行DNA测序技术,得到高质量序 列数据,相对无误差,以获得足够长度的序列,以指定到它们的染色体来源。迄今为止已知 的为了该目的而使用大规模平行测序(也称为下一代测序或第二代测序)的这些方法的 明显缺点,是测序是以高质量在全服务(full-service)基因组测序仪(主要是Illumina HiSeq)上进行的,所述测序仪产生非常大量的数据,需要耗费时间和昂贵的生物信息学。运 行时间和分析过程总共可能需要数周。另一个缺点是这些装置的资本支出是巨大的(现在 完全超过五十万美元),这限制了广泛使用它们。此外,多路能力被限制,阻碍这些昂贵机器 和进一步限制了使用快速通量诊断大量患者。然而,对于非侵入性产前诊断有临床需要,使 得甚至这些种种缺点也未阻止开始开发大规模平行测序。
[0013] 然而,某些自动化测序装置典型地产生的序列数据的质量比常规基因组测序所需 的差得远。如此产生的序列数据的特征在于频繁误差。这些误差是各种各样的,但最常见 的是非常频繁的"indel",这是由测序装置发出错误的额外碱基(插入)或缺失碱基所致的 误差。此外,在对小的均聚物的运行(即若干相同碱基的运行)进行有效测序时具有固有 的无能。此外,测序误差也可包括"错配",其中碱基被错误地指定。
[0014] 这种"经济级"测序是通过一些台式高通量测序仪例如IonTorrent测序平台廉 价和快速产生的一类。该测序平台是基于半导体测序技术(Rothberg等人,2011,Nature475,348-352)。在聚合酶-催化的反应中,当一个核苷酸掺入到生长中的DNA链时,就释 放一个质子。通过检测pH的相关变化,该技术检测核苷酸是否已经添加。半导体芯片用4 种DNA核苷酸前体之一(dATP、dCTP、dGTP或dTTP)序贯注入。如果核苷酸没有掺入到生长 中的链,就不产生电压;如果添加两个核苷酸,电压变化大约两倍。对碱基均聚物运行的测 序当均聚物长度增加时是困难的。Indel误差(假碱基插入或缺失)是频繁的,尤其是与均 聚物运行相关时。
[0015] 在可以对DNA样品测序之前,工作流程包括连接特定的衔接头序列,和乳化PCR。 制备时间典型地小于6小时,并且测序运行本身小于3小时。IonTorrent测序平台以及其 它高通量台式测序仪的性能,最近已经有综述(Loman等乂 2012,NatureBiotechnology 30(5),434-439;Liu等乂 2012,JournalofBiomedicineandBiotechnology2012, 卜 11;Quail等乂 2012,BMCGenomics, 13(341))。通过IonTorrent装置产生的序列 数据的质量被认为特征在于频繁的indel误差。
[0016] 胎儿异常领域内的准确诊断是至关重要的。因此非常需要诊断方法学,其容忍非 常频繁的插入或缺失(indel)误差和误操作的短均聚物运行,典型地通过某些自动化测序 装置来表征。
[0017]发明概述 依照本发明的第一方面,提供在得自女性受试者的生物样品中检测胎儿染色体异常的 方法,所述方法包括以下步骤: (a) 获得在所述生物样品内的核酸分子的序列数据; (b) 在所述序列数据内的每个核酸序列和对应于参考基因组的独特部分的序列之间 进行匹配分析,使得每个匹配的核酸被指定到所述参考基因组内的特定染色体或所述染色 体的一部分,其中所述匹配分析对于对应于所述参考基因组中的碱基的每个核酸内的每个 碱基产生准确率分值并对于任何插入、缺失、模糊(ambiguity)和/或取代产生罚分,使得 如果每个核酸的总分值达到预定分值阈值,匹配被指定;和 (c) 测定指定到靶染色体的匹配的核酸总数相对于指定到一个或多个参考染色体的 每个的匹配
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1