等位基因调用和倍性调用的方法

文档序号:8412775阅读:452来源:国知局
等位基因调用和倍性调用的方法
【专利说明】
[0001] 本申请是2009年8月4日递交的申请号为200980139431. 3,发明名称为"等位基 因调用和倍性调用的方法"的分案申请。
技术领域
[0002] 本发明大体上涉及获得和操纵用于医疗预测目的的高保真基因数据的领域。
【背景技术】
[0003] 2006年,在全球范围内大约进行了 800, 000例体外受精(IVF)周期。其中大约 150, 000个周期在美国进行,涉及植入前基因诊断(P⑶)的大约有10, 000。目前的植入前 基因诊断(PGD)技术不规范、价格昂贵而且非常不可靠:筛查疾病相关基因座或非整倍体 的错误率大约为10 %,每次筛查试验大约花费5, 000美元,并且一对夫妇常常被迫选择是 检测折磨约50%体外受精(IVF)胚胎的非整倍体,还是筛查单细胞疾病相关的基因座。为 了平行筛查非整倍体、单基因疾病例如囊性纤维化,以及对通过全基因组关联研宄已知多 个基因标记的复杂疾病表型的敏感性,十分需要一种能可靠测定单细胞基因数据且不太昂 贵的技术。
[0004] 今天大多数植入前基因诊断(PGD)的重点是高级别染色体异常,例如非整倍体以 及以成功植入和带回家的婴儿为主要成果的平衡易位。植入前基因诊断(PGD)的另一个重 点是基因疾病的筛查,其主要成果是父母一方或双方为携带者的健康婴儿不受基因遗传疾 病的折磨。在这两种情况下,将转移和植入到母亲体内的基因不理想胚胎排除加强了这种 期望成果的可能性。
[0005] 体外受精(IVF)过程中的植入前基因诊断(PGD)方法目前包括从早期胚胎的约8 个细胞中提取单细胞用于分析。从人类胚胎中分离单细胞的技术性很强,其目前在体外受 精(IVF)诊所是常规性的。极体和卵裂球均已被成功分离。最常见的技术是从第3天的胚 胎(6或8细胞阶段)中除去单卵裂球。将胚胎转移到特殊的细胞培养基(缺少钙和镁的 标准培养基)内,并用酸性溶液、激光或机械技术在透明带中引入一个孔。然后,技术员使 用活检吸管除去具有可见细胞核的单个卵裂球。采用各种技术检测单个(或偶尔多个)卵 裂球的DNA特征。由于一个细胞只能提供单复制的DNA,直接检测DNA非常容易出错或者有 噪音。十分需要一种可以校正或者使这种有噪音的基因测量更精确的技术。
[0006] 正常人的每个二倍体细胞中有两组23染色体,有一个复制来自一方父母。具有额 外或缺失染色体的细胞状态的非整倍体,以及具有两个特定染色体均来源于一方父母的细 胞状态的单亲二倍体,被认为是很大比例植入失败和流产以及一些遗传疾病的原因。只有 当个体的特定细胞是非整倍体时,才说该个体表现为镶嵌性。除了增加成功怀孕的机会外, 值得一提的是,染色体异常的检测可以确定个体或胚胎的状态,例如唐氏综合征、克氏综合 征和特纳综合征等。染色体异常的测试在潜在母亲的年龄增加时尤为重要:35至40岁时, 估计有40 %至50 %的胚胎是不正常的,40岁以上时,超过一半的胚胎可能不正常。非整倍 体的主要原因是在减数分裂过程中不分离。母体不分离构成所有不分离的约88%,其中约 65%发生在减数分裂I中,而23%发生在减数分裂II中。人类非整倍体的常见类型包括缘 于减数分裂I不分离的三体、单体和单亲二体。在减数分裂II不分离中产生的一种特殊类 型的三体或者M2三体中,一个额外的染色体与两个正常染色体中的一个相同。M2三体特别 难以检测。非常需要一种更好的方法,其能以高精确度有效检测出大部分或全部染色体上 许多或所有类型的非整倍体,包括既能区分非整倍体和整倍体,还能区分不同类型的非整 倍体之间的方法。
[0007] 传统用于预测非整倍体和嵌合体的方法一一核型分析,正让位于其它更高流通 量、更符合成本效益的方法,例如流式细胞仪(FC)和荧光原位杂交(FISH)。目前,绝大多 数的产前诊断使用可以确定大染色体畸变的荧光原位杂交(FISH),以及能够确定少量单核 苷酸多态性(SNP)或其它等位基因调用的聚合酶链式反应/电泳。荧光原位杂交(FISH) 的一个优点是它比核型分析便宜,但该技术太过复杂和昂贵,以致通常只能选择小部分染 色体测试(通常是染色体13、18、21、X、Y ;有时也为8、9、15、16、17、22);此外,荧光原位杂 交(FISH)的专属性水平较低。目前大约75%的植入前基因诊断(PGD)使用荧光原位杂交 (FISH)测定高级别的染色体异常,例如非整倍体,其错误率约为10-15%。非常需要一种具 有较高流通量、较低成本、更准确的用于筛查非整倍体的方法。
[0008] 根据0ΜΜ,与已知疾病相关的遗传等位基因的数目超过380,并且正稳步攀升。因 此,分析胚胎DNA上的多位点或与特定表型相关的基因座变得越来越相关。植入前遗传学 诊断对产前诊断的一个明确的优点是,一旦检测到不期望的表型,它可以避免一些有关可 能的选择行为的伦理问题。需要一种方法,其在植入前阶段能对胚胎进行更广泛的基因分 型。
[0009] 有许多改进的技术使得在一个或几个基因座上的遗传变异诊断能处于单细胞水 平。这些包括:分裂间期染色体转换、对比性基因组杂交、荧光聚合酶链式反应、小测序和全 基因组扩增。由所有这些技术得到的数据其可靠性依赖于DNA制剂的质量。因此,需要更 好的扩增单细胞DNA的制备方法和植入前基因诊断(PGD),并且正在研宄中。所有的基因分 型技术在用于单细胞、少量细胞或DNA片段时,都面临着完整性问题,最突出的是等位基因 遗漏(AD0)。这在体外受精的情形下加剧,因为杂交反应的效率低,而且该技术必须操作迅 速,以便在最大胚胎存活时间范围内对胚胎进行基因分型。十分需要一种方法,其在测量一 个或少量细胞的基因数据,尤其是当存在时间限制时,能减轻高等位基因遗漏(ADO)率的 问题。
[0010] 概述
[0011] 在本发明的一个【具体实施方式】中,所披露的方法能使用次要的基因数据作为信息 源,来重建不完整或有噪音的基因数据,包括确定个人等位基因、单倍体、序列、插入、缺失、 重复的特性,以及确定目标个体的染色体拷贝数,所有都具有高保真性。本文的重点在于来 自人类主体的基因数据,更特别的是在于尚未植入的胚胎或发育中的胎儿,以及相关个体。 应当指出,所披露的方法适用于各种情形下一系列生物的基因数据。所述用于整理基因数 据的技术与体外授精过程中的植入前诊断、与羊膜穿刺术配合的产前诊断、绒毛膜绒毛活 检、胎儿组织采样和非侵入性产前诊断的情形最相关,其中少量胎儿遗传物质被从母体血 液中分离。使用该方法可有助于重点诊断遗传疾病、染色体拷贝数的预测、缺陷或异常增加 的可能性,以及预测个体对各种疾病和非疾病表型的易感性,从而强化临床和生活方式的 决定。
[0012] 在本发明的一个【具体实施方式】中,用于确定目标个体至少一个染色体倍性态的方 法包括:从目标个体以及从一个或多个相关个体获得基因数据;对目标个体的每个染色体 创立至少一个倍性态假说的集合;使用一种或多种专业技术来确定集合中每个倍性态假说 的统计概率,对于所使用的每种专业技术,考虑所获得的基因数据;对于每个倍性态假说, 组合由一种或多种专业技术测定的统计概率;以及基于每个倍性态假说的组合统计概率, 确定目标个体中每个染色体的倍性态。
[0013] 在本发明的一个【具体实施方式】中,用于确定目标个体、目标个体的父母一方或双 方,任选一个或多个相关个体的等位基因集合中等位基因状态的方法包括:从目标个体、父 母一方或双方、任何相关个体获得基因数据;对目标个体、父母一方或双方,任选一个或多 个相关个体创立至少一个等位基因假说的集合,其中所述假说描述了等位基因集合中可能 的等位基因状态;测定考虑了所得基因数据的假说集合中每个等位基因假说的统计概率; 以及基于每个等位基因假说的统计概率,确定目标个体、父母一方或双方和任选一个或多 个相关个体的等位基因集合中每个等位基因的等位状态。
[0014] 在本发明的一个【具体实施方式】中,用于确定目标个体至少一个染色体倍性态的方 法包括:从目标个体、目标个体的父母一方或双方、目标个体的一个或多个同胞获得基因数 据,其中所述的基因数据包括涉及至少一个染色体的数据;通过使用一种或多种专业技术, 确定目标个体和目标个体一个或多个同胞的至少一个染色体的倍性态,其中所述的专业技 术均不需要输入定相的基因数据;使用信息化方法,确定目标个体、目标个体的父母、目标 个体一个或多个同胞的定相基因数据,所述由目标个体、目标个体的父母和目标个体一个 或多个同胞获得的基因数据确定为那个染色体上的整倍体;以及使用一种或多种专业技 术,再次确定目标个体至少一个染色体的倍性态,所述专业技术至少有一种需要输入定相 的基因数据,和由目标个体、目标个体的父母、目标个体的一个或多个同胞确定的定相基因 数据。
[0015] 在本发明的一个【具体实施方式】中,该方法利用了目标胚胎的基因数据、来自母亲 和父亲的基因数据例如二倍体组织样本,以及一种或多种如下的可能性基因数据的信息: 来自父亲的精子、来自母亲的二倍体样本,或来源于母亲和父亲配子的相同或其它胚胎的 卵裂球,联合减数分裂机理和目标胚胎DNA缺陷性测定的信息,以便以高度的可信度在关 键基因座的位置用计算机模拟重建胚胎DNA。在本发明的一方面,来源于其它相关个体例如 其它胚胎、兄弟和姐妹、祖父母或其它亲戚的基因数据,也可用来增加重建胚胎DNA的保真 度。在本发明的一个【具体实施方式】中,这些基因数据可用来测定个体一个或多个染色体的 倍性态。在本发明的一方面,由一组相关个体测量的每个基因数据集合被用来增加其它基 因数据的保真度。重要的是要注意本发明的一方面,父母和其它次要基因数据不仅可以重 建测量不佳的单核苷酸多态性(SNP),而且可以重建插入、删除、重复和根本不能测量的单 核苷酸多态性(SNP)或整个DNA区域。在本发明的另一个方面,目标个体的基因数据,连同 相关个体的次要基因数据被用来测定个体一个、几个或所有染色体的倍性态或拷贝数。
[0016] 在本发明的一个【具体实施方式】中,使用或未使用相关个体基因数据的胎儿或胚胎 的染色体组数据可用来检测细胞是否为非整倍体,也就是说细胞内错误的染色体数目存 在的地方,或者细胞中是否存在错误数目的性染色体。基因数据还可用来检测单亲源二 体一一存在两个特定染色体的状态,它们均来源于一对父母。这通过创立一组有关DNA潜 在状态的假说来实现,并且测试看哪种假说具有最大的可能性给出真实的测量数据。要注 意的是,使用高通量的基因分型数据来筛查非整倍体,既能用来自每个胚胎的单个卵裂球 测量多种疾病相关的基因座,又可以筛查非整倍体。
[0017] 在本发明的一个【具体实施方式】中,对存在于多个基因座上的扩增或未扩增基因物 质数量的直接测量结果,可用于检测单倍体、单亲源二体、匹配的三体、不匹配的三体、四体 和其它非整倍体状态。本发明的一个【具体实施方式】利用了这样的事实,即在某些条件下,扩 增的平均水平和测量信号输出结果不随染色体变化,从而在一组邻位基因座上测定的基因 物质的平均数量与存在的同源染色体成比例,并且倍性态能以统计显著的形式被调用。在 另一个【具体实施方式】中,不同的等位基因具有不同统计学的特性扩增曲线,其给出了特定 的亲代背景和特定的倍性态;这些特性差异可用来确定染色体的倍性态。
[0018] 在本发明的一个【具体实施方式】中,如本发明一方面所确定的倍性态可用于为本发 明的等位基因调用实施例选择适宜的输入。在本发明的另一方面,来自目标个体和/或一 个或多个相关个体的定相的重建基因数据可用作本发明倍数体调用的输入。在本发明的一 个【具体实施方式】中
当前第1页1 2 3 4 5 6 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1