多胎妊娠的分子测试的制作方法

文档序号:510114阅读:189来源:国知局
多胎妊娠的分子测试的制作方法
【专利摘要】本发明提供了用于使用取自母亲的生物样品测定多胎妊娠的接合性的方法、系统和仪器。可对于特定染色体区域分析样品(例如血浆)中的胎儿和母体DNA,以鉴定胎儿中的基因差异。例如,当胎儿是二卵的时候,用于测量主要或次要等位基因的标准化参数对于不同染色体区域可显示出变化。如果胎儿是遗传上相同的,则此类变化可相对于期望值进行测定。提供统计方法用于分析标准化参数的变化,以测定胎儿DNA浓度和在多个基因座处的母系-胎儿混合基因型。亲本基因型和单元型信息也可用于鉴定不同亲本单元型的继承,以指示在胎儿中的遗传差异。
【专利说明】多胎妊娠的分子测试
[0001]与相关申请的交叉参考
[0002]本申请要求来自2011年2月24日提交的名称为“MOLECULAR TES TING OF TWINPREGNANCIES”的美国临时申请号61/446,256的优先权,并且是它的非临时申请,所述美国临时申请的完整内容以引用方式并入本文用于所有目的。
[0003]本申请涉及2010年11月5日提交的、Lo等人共同拥有的名称为〃Fet al GenomicAnalysis From A Maternal Biological Sample"的美国专利申请号 12/940, 993 (代理人案号80015-006710US ),所述美国专利申请的公开内容全文以引用方式并入。
【背景技术】
[0004]多胎妊娠指的是其中孕妇怀有超过一个胎儿的妊娠。双胎妊娠是最常见形式的多胎妊娠。单卵双生指的是源自相同受精卵的一对双胞胎。因此,该对双胞胎具有整个全基因组的相同基因构成。二卵双生是源自两个不同受精卵的一对双胞胎。该对双胞胎的基因构成将是不同的。相反,这对双胞胎的基因构成的相似性将类似在不同时间出生的一对同胞。
[0005]关于双胎妊娠的接合性的信息常规上已通过超声扫描(Chauhan SP等人Am JObstet Gynecol2010;203:305-315)或侵入性产前诊断(例如羊膜穿刺术)(Chen CP等人Hum R印rod2000;15:929-934)获得。此类接合性信息可用于后续产科管理。例如,在执行羊膜穿刺术以用于非整倍性检测的事件中,涉及二卵双生的妊娠将要求每个羊膜囊的个别取样。对于涉及两个羊膜囊的单卵双生妊娠,理论上仅需要两个羊膜囊之一的取样。然而,超声扫描可以是不准确或受限制的(例如胎儿具有不同性别),并且侵入性产前诊断可导致对胎儿和/或母亲有害。
[0006]相应地,希望提供关于具有多胎儿的妊娠的接合性信息的新技术。

【发明内容】

[0007]本发明的实施例提供了用于使用取自母亲的生物样品测定多胎妊娠的接合性的方法、系统和仪器,其对于胎儿是非侵入性的。可对于特定染色体区域分析样品(例如血浆)中的胎儿和母体DNA,以鉴定胎儿中的基因差异。例如,当胎儿是二卵的时,用于测量主要(primary)或次要(secondary)等位基因的标准化参数可显示关于不同染色体区域的变化。如果胎儿是遗传上相同的,则此类变化可相对于期望值进行测定。提供统计方法以用于分析标准化参数的变化,以测定胎儿DNA浓度和在多个基因座处的母系-胎儿混合的基因型。亲本基因型和单元型信息也可用于鉴定不同亲本单元型的继承,以指示在胎儿中的遗传差异。在其他利益中,多胎妊娠的接合性的测定可帮助例如使用母血完成的非侵入性产前测试程序的使用。
[0008]根据一个实施例,用于分析具有多个胎儿的妊娠女性的生物样品以测定妊娠女性的至少两个胎儿是否是二卵的方法。生物样品包含胎儿和母体DNA。在第一染色体区域内的一个或多个第一基因座中的每一基因座处测定妊娠女性的基因型。母亲在第一基因座中的每一基因座处是纯合的,或在第一基因座中的每一基因座处是杂合的。第一基因座中的每一个显示出生物样品中各自的主要等位基因和各自的次要等位基因。对于第一基因座中的每一个,各自的主要等位基因比各自的次要等位基因更丰富。在生物样品中在一个或多个第一基因座处测量一个或多个主要等位基因的第一个量和/或一个或多个次要等位基因的第二个量。获得对于第一个量或第二个量的标准化参数。比较标准化参数与截断值,以测定如果胎儿对于第一染色体区域是遗传上相同的,则标准化参数是否在统计上不同于期望值。期望值得自生物样品的测量。基于标准化参数与截断值的比较,测定妊娠女性的至少两个胎儿是否是二卵的。
[0009]根据另一个实施例,在生物样品中测量在一个或多个第一基因座处测量的一个或多个胎儿特异性序列的第一个量。获得对于第一个量的标准化参数。比较标准化参数与截断值,以测定如果胎儿对于第一染色体区域是遗传上相同的,则标准化参数是否在统计上不同于期望值。期望值得自生物样品的测量。随后,基于标准化参数与截断值的比较,测定妊娠女性的至少两个胎儿是否是二卵的。
[0010]根据另一个实施例,对于多个染色体区域中的每一个,在生物样品中在各自的染色体区域中的一个或多个基因座中的每一基因座处测量一个或多个等位基因,并且在每个基因座处测定每个测量的等位基因的各自量。基于测量的等位基因的各自量测定胎儿中的至少两个是否已继承来自第一亲本的各自染色体区域的不同单元型。测定其中胎儿中的至少两个已继承来自第一亲本的不同单元型的染色体区域的第一个量。比较第一个量与一个或多个截断值,以测定胎儿中的至少两个是否是二卵的。
[0011]根据另一个实施例,如下制备直方图。对于多个染色体区域中的每一个:鉴定在各自的染色体区域中的一个或多个基因座,在生物样品中在所述基因座处检测到各自的第一等位基因和各自的第二等位基因,在生物样品中在一个或多个基因座处测量一个或多个第一等位基因的第一个量和/或一个或多个第二等位基因的第二个量,并且获得对于第一个量或第二个量的标准化参数。基于对于标准化参数具有指定值的多个染色体区域增大直方图的计数器。鉴定对应于基因座的染色体区域,在所述基因座处母亲是纯合的并且胎儿中的至少一个是杂合的,或在所述基因座处母亲是杂合的并且胎儿中的至少一个是纯合的。使多组分混合模型与对应于鉴定的染色体区域的直方图拟合。多组分混合模型包括对于多个组分中的每一个的混合系数。使用混合系数中的至少两个测定胎儿中的至少两个是否是二卵的。
[0012]根据另一个实施例,提供了测定来自具有至少两个胎儿的妊娠女性的生物样品中的胎儿DNA百分比的方法。对于多个染色体区域中的每一个:鉴定在各自的染色体区域中的一个或多个基因座,在生物样品中在所述基因座处检测到各自的第一等位基因和各自的第二等位基因,在生物样品中在一个或多个基因座处测量一个或多个第一等位基因的第一个量和/或一个或多个第二等位基因的第二个量,并且获得对于第一个量或第二个量的标准化参数。基于对于标准化参数具有指定值的多个染色体区域增大直方图的计数器。使概率分布的线性组合与直方图拟合,其中胎儿DNA百分比是概率分布的线性组合的输入。改变输入胎儿DNA百分比, 以发现最佳化概率分布的线性组合与直方图的拟合的最佳胎儿DNA百分比。
[0013]其他实施例涉及与本文描述的方法相关的系统和计算机可读介质。[0014]本发明的性质和优点的更佳理解可关于下述详述和附图获得。
【专利附图】

【附图说明】
[0015]图1是示出根据本发明的实施例的方法100的流程图,所述方法100用于分析具有多个胎儿的妊娠女性的生物样品,以测定妊娠女性的至少两个胎儿是否是二卵的。
[0016]图2A和2B显示了当对于给定染色体区域已知在两个基因座处的亲本单元型时,用于测定胎儿的接合性的例子。图2A显示了其中母亲在两个基因座处是纯合的并且父亲是杂合的例子。图2B显示了其中母亲在两个基因座处是杂合的并且父亲是纯合的例子。
[0017]图3还显示了其中基因座具有四个不同等位基因的微卫星分析的例子。
[0018]图4是示出根据本发明的实施例的方法400的流程图,所述方法400用于分析具有多个胎儿的妊娠女性的生物样品,以测定妊娠女性的至少两个胎儿对于第一染色体区域是否是遗传上不同的。
[0019]图5是示出方法500的流程图,所述方法500用于通过测定对于来自第一亲本的第一染色体区域的表观部分参数(fractional parameter)(例如胎儿DNA浓度)测定妊娠女性的至少两个胎儿对于该第一染色体区域是否是遗传上不同的。
[0020]图6和7示出了根据本发明的实施例,使用母体血浆中的胎儿DNA部分(fraction)中的区域基因组变化揭示双胎妊娠的接合性。
[0021 ] 图8显示了根据本发明的实施例,对于贡献等量的胎儿DNA的二卵双生的胎儿DNA浓度的示例直方图。
[0022]图9显示了根据本发明的实施例,当两个胎儿对母体血浆样品贡献不同量的DNA时,基于SNP分析的部分(fractional)胎儿DNA分布的直方图。
[0023]图10显示了在怀有一对二卵双生的孕妇中重组对表观部分胎儿DNA浓度(fractional fetal DNA concentration)的作用的例子。
[0024]图11是示出根据本发明的实施例的方法1100的流程图,所述方法1100测定来自具有至少两个胎儿的妊娠女性的生物样品中的胎儿DNA百分比,并且测定胎儿中的至少两个是否是二卵的。
[0025]图12A-12E是显示根据本发明实施例的推导SNP分析的结果的表。
[0026]图13显示了关于二卵妊娠的两个不同峰的鉴定。
[0027]图14显示了关于单卵妊娠的一个峰的鉴定。
[0028]图15显示了对于怀有单卵和二卵双生的孕妇的不同染色体区域的血浆部分胎儿DNA浓度。
[0029]图16显示了假定一对单卵双生的存在,测定随机变异的水平的模拟分析。
[0030]图17显示了根据本发明的实施例,示出对于三个胎儿(胎儿A、B和C)的多个可能峰的直方图。
[0031]图18显示了可与根据本发明的实施例的系统和方法一起使用的示例计算机系统1800的方框图。
[0032]定义
[0033]如本文使用的术语“生物样品”指的是取自受试者(例如人,例如孕妇)并含有一种或多种目的核酸分子的任何样品。例子包括血浆、唾液、胸膜液、汗、腹水液、胆汁、尿、血清、胰液、粪便和宫颈涂片样品。
[0034]术语“核酸”或“多核苷酸”指的是以单链或双链形式的脱氧核糖核酸(DNA)或核糖核酸(RNA)及其聚合物。除非具体限制,该术语包含含有天然核苷酸的已知类似物的核酸,所述类似物具有与参考核酸相似的结合性质并且以与天然存在的核苷酸相似的方式代谢。除非另有说明,特定核酸序列无疑还包含其保守修饰的变体(例如简并密码子置换)、等位基因、直系同源物、SNP和互补序列以及明确指示的序列。具体地,简并密码子置换可通过生成其中一个或多个所选(或全部)密码子的第三个位置由混合碱基和/或脱氧肌苷残基置换的序列来实现(Batzer MA 等人,Nucleic Acid Resl991; 19:5081 ;0htsuka E 等人,JBiol Cheml985; 260:2605-2608 ;和 Rossolini GM 等人,Mol Cell Probesl994; 8:91-98)。术语核酸可与基因、cDNA、mRNA、小非编码RNA、微小RNA(miRNA)、Piw1-相互作用RNA和由基因或基因座编码的小发夹RNA(shRNA)互换使用。
[0035]术语“基因”意指涉及于产生多肽链或转录的RNA产物的DNA区段。它可包括在编码区前和后的区域(引导区和非转录尾区)以及在各个编码区段(外显子)之间的间插序列(内含子)。
[0036]如本文使用的术语“反应”指的是涉及化学、酶促或物理反应的任何过程,所述反应指示特定目的多核苷酸序列的存在或不存在。“反应”的例子是扩增反应例如聚合酶链反应(PCR)。“反应”的另一个例子是通过合成、连接、杂交或降解的测序反应。“信息反应”是指示一个或多个特定目的多核苷酸序列的存在的反应,并且在一种情况下仅存在一个目的序列。如本文使用的术语“孔”指的是在局限结构内的预`定位置处的反应,所述局限结构例如孔形小瓶、小室、PCR阵列中的室、乳状液中的小滴、颗粒、纳米孔或表面上的区域。
[0037]如本文使用的术语“过度表现的核酸序列”指的是比生物样品中的其他序列更丰富的在两个目的序列(例如临床有关序列和本底序列)中的核酸序列。
[0038]如本文使用的术语“基于”意指“至少部分基于”,并且指的是在另一个值的测定中使用的一个值(或结果),例如在方法`的输入和该方法的输出的关系中发生的。如本文使用的术语“衍生”还指的是方法的输入和该方法的输出的关系,例如当衍生是公式的计算时发生的。
[0039]如本文使用的术语“定量数据”意指得自一个或多个反应且提供一个或多个数值的数据。例如,显示用于特定序列的荧光标记的孔数目将是定量数据。
[0040]如本文使用的术语“参数”意指表征定量数据集和/或定量数据集之间的数字关系的数值。例如,在第一核酸序列的第一个量和第二核酸序列的第二个量之间的比(或比的函数)是参数。
[0041]如本文使用的,术语“基因座”或其复数形式是在整个基因组上具有变化的任何长度的核苷酸(或碱基对)的位置或地址。术语“等位基因”指的是在相同物理基因组基因座处的备选DNA序列,其可导致或不导致不同的表型性状。在具有每个染色体(除了男性人受试者中的性染色体外)的两个拷贝的任何特定二倍体生物中,关于每个基因的基因型包含在那个基因座处存在的等位基因对,其在纯合子中是相同的并且在杂合子中是不同的。生物群体或物种一般包括在多个个体中的每个基因座处的多个等位基因。其中在群体中发现超过一个等位基因的基因组基因座称为多态位点。在基因座处的等位基因变化可测量为存在的等位基因数目(即多态性程度),或群体中的杂合子比例(即杂合性率)。序列(例如基因)的存在或不存在也视为等位基因变化的类型,因为基因座可包括该序列或不包括该序列。例如通过连接通常在缺失序列前和后出现的序列,可鉴定序列(例如RHD基因)的这种不存在。如本文使用的,术语“多态性”指的是人基因组中的任何个体间变化,与其频率无关。此类变化的例子包括但不限于单核苷酸多态性、简单串联重复多态性、插入-缺失多态性、突变(其可以是引起疾病的)和拷贝数变化。
[0042]如本文使用的术语“单元型”指的是在相同染色体或染色体区域上一起传递的在多个基因座处的等位基因组合。单元型可指的是少至一对基因座或染色体区域或整个染色体。“染色体区域”指的是关于特定染色体的多个核苷酸位置。染色体区域可以是整个染色体或较小的部分。在正常人中,染色体区域将具有两个单元型,区域在其内的染色体的每个拷贝一个。两个单元型在染色体区域中可以是相同或不同的。
[0043]如本文使用的术语“截断值”意指其值用于在生物样品分类的两个或更多个状态(例如患病和非患病)之间仲裁的数值。例如,如果参数大于截断值,则作出定量数据的第一分类(例如患病状态);或如果参数小于截断值,则作出定量数据的不同分类(例如非患病状态)。
[0044]如本文使用的术语“不平衡”意指如通过一些临床有关核酸序列中的至少一个截断值定义的与参考数量的任何显著偏差。例如,参考数量可以是3/5的比,并且因此如果测量的比是1:1,则将发生不平衡。
[0045]术语“测序标签”指的是得自核酸分子的全部或部分的序列,例如DNA片段。在一个实施例中,仅测序片段的一个末端,例如约30bp。测序标签随后可与参考基因组比对。作为另外一种选择,可测序片段的两个末端,以生成两个测序标签,其可提供比对中的更大准确度,并且还提供片段长度。在另外一个实施例中,线性DNA片段可例如通过连接而环化,并且可测序跨越连接位点的部分。
[0046]术语“通用测序”指的是其中衔接子加入片段的末端并且用于测序的引物附着至衔接子的测序。因此,任何 片段均可用相同引物进行测序,并且因此测序可以是随机的。
[0047]如本文使用的术语“分类”指的是与样品的特定性质相关的任何数目或其他字符(包括字)。例如,“ + ”号可表明样品分类为具有缺失或扩增。术语“截断”和“阈值”指的是在操作中使用的预定数目。例如,截断大小可指的是超过其的片段被排除的大小。阈值可以是超过或低于其就应用特定分类的值。这些术语中的任一均可在这些背景中的任一中使用。
[0048]术语“直方图”指的是贮存在指定范围内的多个数据点的计数的数据结构。例如,染色体区域数目显示出在一组值上的参数(例如胎儿DNA百分比)。
[0049]术语“最佳的”指的是测定为在数字上优于一个或多个其他值的任何值。例如,最佳值不一定是最可能的值,而是可仅仅满足标准(例如来自先前值的成本函数中的变化在容许量内)。
【具体实施方式】
[0050]胎儿DNA已显示存在于孕妇的血浆和血清中(Lo等人Lancetl997; 350:485-487 ;和美国专利6,258,540)。母体血浆或血清中的胎儿DNA的分析具有它是相对非侵入性的优点,仅需要母亲血液的样品。与用于产前筛选的常规非侵入性方法例如超声扫描比较,测试母体血浆或血清中的胎儿DNA将允许胎儿遗传信息的直接评估。此处,我们示出了可如何分析母体血浆或血清(或其他生物样品)中的DNA的原理,以区分孕妇是怀有单卵还是二卵胎儿(例如一对单卵或二卵双生)。
[0051]首先,跨越多个染色体区域的分析测定在胎儿基因组之间的差异水平,其用于执行关于胎儿接合性的分类。接下来,我们讨论分析特定染色体区域的具体例子,以测定当两个不同父系单元型在多个基因座处是已知的,并且母亲在这些基因座处是纯合的时(还讨论了其中母亲是杂合的并且父亲是纯合的例子),胎儿在该区域中是否在遗传上不同(例如如果双胞胎各自已继承不同的父系单元型)。还描述了当两个亲本的基因型信息均是已知时的其他例子,例如当三个或更多个不同等位基因在特定基因座处时。随后,描述了比较和/或鉴定在表观胎儿DNA浓度的量度中的变化或跨越区域的其他参数的变化的技术。此类技术可使用明确的母系基因型信息,或经由含有胎儿和母体DNA的生物样品的测量例如孕妇的血浆推导母系基因型。还解释了用于多胎妊娠的推导技术。
[0052]1.使用不同染色体区域测定接合性
[0053]单卵胎儿是遗传上相同的,而二卵胎儿是遗传上不同的。遗传差异的程度将类似于在其他妊娠时相同亲本生育的其他同胞。然而,由于统计机率,二卵胎儿可共享在基因组的部分处的相同遗传序列。
[0054]胎儿通常对于特定染色体区域具有两个单元型(其可以是相同或不同的),关于染色体的两个拷贝各自的一个单元型。如果胎儿是单卵的,则胎儿将在染色体区域中具有相同的两个单元型。此外,由于统计机率,二卵胎儿可对于给定染色体区域具有相同对的单元型。实施例可分析多个染色体区域,以测定胎儿是否已继承不同单元型,并且随后不同的区域百分比(或其他参数)用于测定胎儿是单卵的还是二卵的。可分析指定数目的染色体区域以获得所需统计显著性。
[0055] A.方法
[0056]图1是示出根据本发明的实施例的方法100的流程图,所述方法100用于分析具有多个胎儿的妊娠女性的生物样品,以测定妊娠女性的至少两个胎儿是否是二卵的。生物样品包括胎儿和母体DNA。例如,可使用来自孕妇的血浆。方法100可使用计算机系统实现,如本文描述的任何方法可以一样。
[0057]在步骤110中,对于多个染色体区域中的每一个,在各自的染色体区域中的一个或多个基因座中的每一基因座处测量生物样品中的一个或多个等位基因。在生物样品中的DNA可通过多种技术进行分析,所述多种技术包括定量聚合酶链反应(PCR)、数字PCR、测序(例如Sanger测序和大规模平行测序)、连接、杂交和质谱法(例如Sequenom MassARRAY平台),以测量在该基因座处的特定等位基因。对于测序,在测序前可执行富集步骤,以增加来自特定组的染色体区域的DNA片段的百分比。在一个实施例中,可使用溶液相(例如使用Agilent SureSelect平台)或固体相(例如使用Roche NimbleGen平台)杂交执行此类富集步骤。测量步骤自身可使用得自任何一种或多种上述技术的数据实现。例如,测序标签可与参考基因组比对,以鉴定由其获得测序标签的相应DNA片段的位置和等位基因。可用于分析生物样品中的DNA的一种方法是称为选择区域数字分析(DANSR)的技术,其涉及杂交、连接、扩增和大规模平行测序的步骤(Sparks AB等人Am J ObstetGynecol2012;do1:10.1016/j.ajog.2012.01.030)。[0058]可使用的大规模平行测序平台的例子包括Illumina Genome Analyzer平台、LifeTechnologies S0LiD、1n Torrent and 1n Proton 系统、Roche454 系统、来自 Helicos 的单分子测序系统、Pacific Biosciences、或基于纳米孔的系统(例如来自Oxford NanoporeTechnologies的系统)。在另一个实施例中,执行靶标测序,其中捕获或扩增所选基因组区域(例如含有SNP或其他类型的变化例如微卫星多态性的那些),并且随后优先对于此类捕获或扩增区域执行大规模平行测序。在一个实施例中,使用Agilent SureSelect系统执行革巴标测序(Liao GJ等人Clin Chem2011; 57:92-101)。祀标测序还可使用Roche NimbleGen系统执打。
[0059]数字PCR可用于分析母体血衆中的单个DNA分子(Vogelstein B和KinzlerKff.Proc Natl Acad Sci USA1999; 96:9236-9241 ;Lo YMD 等人 Proc Natl Acad SciUSA2007; 104; 13116-13121)。数字PCR可使用多种平台执行,包括但不限于微流体(Lun FMF 等人 Clin Chem2008; 54:1664-1672),乳滴 PCR (Dressman D 等人 ProcNatl Acad Sci USA2003; 100:8817-8822),包括 RainDance 平台(Kiss MM 等人 AnalChem2008;80:8975-8981)。
[0060]在步骤120中,测定每个测量的等位基因的各自量。例如,可测序(例如使用通用测序)样品中的DNA片段,以获得测序标签(其可以是配对末端标签),并且测序标签可与参考基因组比对,以鉴定片段的基因组位置。如果母亲和/或胎儿的基因组在基因座处均具有变化,则对于该基因座测量不同等位基因。可跟踪对应于在基因座处的每个等位基因的片段的各自量。在特定基因座处的特定等位基因的各自量可以多种方式进行测量,例如通过片段的数目或比例、在相同多态位点处的不同等位基因之间的比、在微阵列杂交上的信号强度、在实时PCR中的阈值循环或阈值循环中的差异、如通过数字PCR检测的对于等位基因阳性的反应的比例或数目、和质谱法分析中的峰高。
[0061]在步骤130中,对于多个染色体区域中的每一个,基于测量的等位基因的各自量测定胎儿中的两个是否已继承来自第一亲本的各自染色体区域的不同单元型。如果一个胎儿继承第一单元型并且另一个胎儿继承不同单元型,则这指示二卵。如果存在超过两个胎儿,则一对可继承相同单元型并且不同对可继承不同单元型。在一个实施例中,不同单元型的继承可由在一个或多个基因座处测量的等位基因数据推断。例如,推导方法可用于鉴定胎儿基因组中的差异,如下文描述的。
[0062]在另一个实施例中,来自亲本中的一个或多个的基因型信息可以是已知的。此类信息可允许来自仅一个胎儿的测量用于测定不同单元型是否已从第一亲本继承。例如,如果在第一基因座处在亲本中存在三个不同基因型,则随后可使用仅第一基因座作出决定。然而,如果在基因座处仅存在两个基因型,则随后可能需要在另一基因座处的测量。一些例子在下文提供。
[0063]如果多个基因座用于染色体区域,则来自基因座的数据可以不同方式组合。例如,如果已知等位基因与特定单兀型相关,则随后在特定基因座处具有特定等位基因的片段数目的计数有效成为关于特定单元型的片段数目的计数。例如,通过总计具有第一单元型的等位基因和基因座的片段计数,可测定对应于第一亲本(例如父亲)的第一单元型的片段数目。作为另外一种选择,可对于每个基因座独立地作出测定,并且关于每个基因座的测定可就一致性进行比较。[0064]在步骤140中,测定其中胎儿中的至少两个已继承来自第一亲本的不同单元型的染色体区域的第一个量。第一个量可仅仅是已鉴定为在胎儿之间具有差异的染色体区域数目。作为另一个例子,第一个量可以是鉴定为在胎儿之间具有差异的染色体区域百分比。
[0065]在步骤150中,比较第一个量与一个或多个截断值,以测定两个胎儿是单卵的还是二卵的。例如,第一个量可以是百分比(或其他比例),例如10%,并且这个量可与截断值比较,其中超过5%分类为二卵的。可基于所需准确度、步骤130中的测定准确度、使用的染色体区域数目、和群体中的不同染色体区域的连锁不平衡和分析的不同染色体区域之间的重组概率,测定截断值,其在下一个部分中描述。在一个方面,如果存在超过两个胎儿,则测定可仅是一对是二卵的,从而留下另一对是单卵的可能性。
[0066]B.关于单元型检测的统计分析
[0067]如上所述,来自亲本的染色体区域的两个单元型(即当不同时)的继承指示该对双胞胎是二卵而不是单卵的。例如,在染色体区域的第一基因座处的两个父系单元型的检测将指示该对双胞胎是二卵的。然而,存在用于检测母体血浆样品中的染色体区域的仅一个父系单元型的几种可能解释。
[0068]首先,两个胎儿可仅偶然地已继承来自父亲的染色体区域中的相同父系单元型。当它们是一对单卵双生时,它们将跨越全基因组一直继承来自父亲的相同父系单元型。然而,即使它们是二卵双生,对于任何特定区域也存在它们将继承来自父亲的相同父系单元型的50%机率。然而,该对二卵双生将跨越全基因组继承相同父系单元型将是非常不可能的。
[0069]在另一种情况下,两个二卵双生胎儿可继承不同的父系单元型,但由于取样不足,仅一个父系单元型在特定分析中检测到。这`些多种情况发生的概率依赖对于特定染色体区域分析的在母体血浆样品中的部分胎儿DNA浓度和母体血浆DNA分子数目。下文,我们提供了关于对应于染色体区域的多少分子以及多少染色体区域可用于取得具有足够统计力的强分类的计算,以使由于取样不足的假单元型解读的机率降到最低。
[0070]需要分析的对应于特定染色体区域的分子数目可以下述方式进行测定。当父系单元型存在于母体血浆中时,在特定母体血浆DNA样品中检测到它的概率依赖携带那个父系单元型的胎儿DNA的部分浓度和分析的分子总数目,并且受泊松分布控制。
[0071]表1显示了对应于需要分析的目的染色体区域的分子数目,使得具有在母体血浆中存在但在特定样品中未检测到的父系单元型的概率小于1%。该数字基于下式进行计算:0.01>exp(-N X f/2),其中N是需要分析的`分子数目;f是由单个双胞胎儿贡献的部分胎儿DNA浓度;并且exp是指数函数。分子数目是用于分析染色体区域的任何基因座处的DNA片段数目。需要分析以实现检测父系单元型的所需确定性的分子数目可通过测量染色体区域中的一个基因座直到表1中列出的数目来取得。作为另外一种选择,如果分析相同染色体区域中的几个基因座,则需要分析的分子数目/基因座可减少至基因座数目乘以分析的平均分子数目/基因座达到表1中列出的分子数目的程度。
[0072]
【权利要求】
1.一种用于分析具有多个胎儿的妊娠女性的生物样品以测定妊娠女性的至少两个胎儿是否是二卵的方法,所述生物样品包含胎儿和母体DNA,所述方法包括: 测定第一染色体区域内的一个或多个第一基因座中的每一基因座处的所述妊娠女性的基因型,所述妊娠女性在所述一个或多个第一基因座中的每一基因座处是纯合的,或在所述一个或多个第一基因座中的每一基因座处是杂合的,其中所述第一基因座中的每一个显示出所述生物样品中各自的主要等位基因和各自的次要等位基因,其中对于所述第一基因座中的每一个,所述各自的主要等位基因比所述各自的次要等位基因更丰富; 在所述生物样品中在所述一个或多个第一基因座处测量一个或多个主要等位基因的第一个量和/或一个或多个次要等位基因的第二个量; 获得所述第一个量或所述第二个量的标准化参数;和 比较所述标准化参数与截断值,以测定如果所述胎儿对于所述第一染色体区域是遗传上相同的,则所述标准化参数是否在统计上不同于期望值,所述期望值得自所述生物样品的测量;和 基于所述标准化参数与所述截断值的比较,测定所述妊娠女性的至少两个胎儿是否是二卵的。
2.根据权利要求1所述的方法,其还包括: 在所述生物样品中在所述第一基因座中的每一基因座处检测所述各自的主要等位基因和所述各自的次要等位基因。
3.根据权利要求1所述的方法,其中获得所述标准化参数包括: 测量来自不同染色体区域内的一个或多个基因座的一种或多种序列的第三个量;和 使用所述第三个量计算所述标准化参数。
4.根据权利要求1所述的方法,其中获得所述标准化参数包括: 在所述生物样品中在所述一个或多个第一基因座处测量所述一个或多个主要等位基因的第一个量和所述一个或多个次要等位基因的第二个量; 测定来自所述第一个量和所述第二个量的第一参数,所述第一参数提供在所述第一个量和所述第二个量之间的相对量;和 使用所述第一参数作为所述第一个量的标准化值。
5.根据权利要求1所述的方法,其中获得所述标准化参数包括: 使用校准过程执行所述测量步骤;和 使用所述第一个量或所述第二个量作为所述标准化参数。
6.根据权利要求1所述的方法,其中所述期望值是所述生物样品中的胎儿DNA浓度。
7.根据权利要求6所述的方法,其还包括: 使用一种或多种后生标记测量所述胎儿DNA浓度。
8.根据权利要求7所述的方法,其中所述一种或多种后生标记包括一种或多种DNA甲基化标记。
9.根据权利要求6所述的方法,其还包括: 通过下述使用遗传标记计算所述胎儿DNA浓度: 测量具有选自一种或多种胎儿特异性序列的胎儿特异性序列的DNA片段的第三个量,其中所有所述胎儿具有所述胎儿特异性序列;获得对于所述第三个量的标准化值;和 使用所述标准化值作为所述胎儿DNA浓度。
10.根据权利要求9所述的方法,其中所述胎儿均为男性,并且其中所述一种或多种胎儿特异性序列在Y染色体上。
11.根据权利要求9所述的方法,其中所述胎儿特异性序列是RHD基因,其中所述母亲是RhD-阴性的,并且其中所有所述胎儿为RhD-阳性的。
12.根据权利要求9所述的方法,其还包括: 鉴定一个或多个第二基因座,在所述基因座处所述胎儿具有各自的第一等位基因,并且所述母亲不具有所述各自的第一等位基因,其中所述胎儿特异性序列是所述各自的第一等位基因,其中获得对于所述第三个量的标准化值包括: 测量在所述一个或多个第二基因座处的等位基因的总量; 由所述第三个量与所述总量的比计算所述胎儿DNA浓度。
13.根据权利要求1所述的方法,其中所述一个或多个基因座包括RHD基因的基因座,通过所述RHD基因的不存在表示的,所述母亲对于等位基因是纯合的,并且其中所述胎儿中的至少一个是RhD-阳性的。
14.根据权利要求1所述的方法,其还包括: 测定在第二染色体区域内的一个或多个第二基因座中的每一基因座处的所述妊娠女性的基因型,所述妊娠女性在所述一个或多个第一基因座中的每一基因座处是纯合的,或在所述一个或多个第一基因座中的每一基因座处是杂合的,其中所述第二基因座中的每一个显示出所述生物样品中各自的主要等位基因和各自的次要等位基因; 在所述生物样品中在所述一个或多个第二基因座处测量所述一个或多个主要等位基因的第三个量和/或所述一个或多个次要等位基因的第四个量; 获得对于所述第三个量或所述第四个量的第二标准化参数;和 使用所述第二标准化参数获得所述期望值。
15.根据权利要求14所述的方法,其中所述第二标准化参数用作所述期望值。
16.根据权利要求14所述的方法,其还包括: 计算对于其他染色体区域的另外的标准化参数; 由第一组染色体区域的所述标准化参数计算第一统计值;和 使用所述第一统计值作为所述期望值。
17.根据权利要求16所述的方法,其中对于所述第一组的染色体区域的所有基因座,所述各自的主要等位基因比所述各自的次要等位基因更丰富。
18.根据权利要求16所述的方法,其中所述第一统计值是在对于所述第一组染色体区域的标准化参数的直方图中所述标准化参数的值中的峰的位置。
19.根据权利要求16所述的方法,其还包括: 由包括所述第一染色体区域的第二组染色体区域的参数计算第二统计值, 其中比较所述标准化参数与所述截断值包括: 比较所述第二统计值与所述截断值。
20.根据权利要求19所述的方法,其还包括: 通过分析所计算参数的直方图鉴定所述第一组和第二组染色体区域,其中所述第一组染色体区域对应于所述直方图中的第一个峰,并且所述第二组染色体区域对应于所述直方图中的第二个峰。
21.根据权利要求14所述的方法,其还包括: 计算对于其他染色体区域的另外的标准化参数, 其中比较所述标准化参数与所述截断值以测定所述标准化参数是否在统计上不同于所述期望值通过下述实现: 计算所述标准化参数的值中的方差;和 比较所述方差与阈值。
22.根据权利要求21所述的方法,其中所述方差是所述标准化参数中的标准差。
23.根据权利要求1所述的方法,其中使用得自大规模平行测序、靶标大规模平行测序、PCR、定量PCR、实时PCR、数字PCR、连接、杂交或质谱法的数据执行所述测量。
24.一种用于分析具有多个胎儿的妊娠女性的生物样品以测定妊娠女性的至少两个胎儿是否是二卵的方法,所述生物样品包含胎儿和母体DNA,所述方法包括: 在所述生物样品中在一个或多个第一基因座处测量一种或多种胎儿特异性序列的第一个量; 获得对于所述第一个量的标准化参数;和 比较所述标准化参数与截断值,以测定如果所述胎儿对于所述第一染色体区域是遗传上相同的,则所述标准化参数是否在统计上不同于期望值,所述期望值得自所述生物样品的测量;和` 基于所述标准化参数与所述截断值的比较,测定所述妊娠女性的至少两个胎儿是否是二卵的。
25.根据权利要求24所述的方法,其中所述胎儿特异性序列在Y染色体上。
26.根据权利要求24所述的方法,其中所述胎儿特异性序列是RHD基因,并且其中所述妊娠女性是RhD-阴性的。
27.根据权利要求24所述的方法,其中所述期望值是所述生物样品中的胎儿DNA浓度。
28.根据权利要求24所述的方法,其中所述一个或多个第一基因座在第一染色体区域内,所述方法还包括: 在所述生物样品中在一个或多个第二基因座处测量一种或多种另外的胎儿特异性序列的第二个量,所述第二基因座在与所述第一染色体区域不同的第二染色体区域内; 获得对于所述第二个量的另外的标准化参数;和 使用所述另外的标准化参数获得所述期望值。
29.一种用于分析具有多个胎儿的妊娠女性的生物样品以测定所述妊娠女性的至少两个胎儿是否是二卵的方法,所述生物样品包含胎儿和母体DNA,所述方法包括: 对于多个染色体区域中的每一个: 在各自的染色体区域中的一个或多个基因座中的每一基因座处: 测量所述生物样品中的一个或多个等位基因;和 测定每个测量的等位基因的各自量; 基于所测量的等位基因的各自量,测定所述胎儿中的至少两个是否已继承来自第一亲本的所述各自的染色体区域的不同单元型;测定其中所述胎儿中的至少两个已继承来自所述第一亲本的不同单元型的染色体区域的第一个量;和 比较所述第一个量与一个或多个截断值,以测定所述胎儿中的至少两个是否是二卵的。
30.根据权利要求29所述的方法,其中所述第一个量是比例。
31.根据权利要求29所述的方法,所述方法还包括: 对于第一染色体区域测定在多个基因座处的所述第一亲本的两个单元型, 其中测定所述胎儿中的至少两个已继承来自所述第一亲本的所述第一染色体区域的不同单元型包括: 鉴定所述第一染色体区域中的第一基因座和第二基因座,在所述基因座处所述第一亲本是杂合的; 在所述生物样品中检测在所述第一基因座处的所述第一亲本的第一单元型;和 在所述生物样品中检测在所述第二基因座处的所述第一亲本的第二单元型。
32.根据权利要求31所述的方法,其中所述第一亲本是母亲,其中所述父亲对于第一等位基因在所述第一基因座处是纯合的,并且所述母亲对于在所述第一基因座处的所述第一等位基因和第二等位基因是杂合的,所述第一等位基因在所述母亲的第一单元型上,并且所述第二等位基因在所述母亲的第二单元型上,其中在所述生物样品中检测在所述第一基因座处的所述第一亲本的第一单元型包括: 测定在所述第一基因座处测量的所述第一等位基因的各自量以统计上显著量超过在所述第二基因座处测量的所述第二等位基因的各自量; 其中所述父亲对于第三等位基因在所述第二基因座处是纯合的,并且所述母亲对于在所述第二基因座处的所述第三等位基因和第四等位基因是杂合的,所述第三等位基因在所述母亲的第一单元型上,并且所述第四等位基因在所述母亲的第二单元型上,其中在所述生物样品中检测在所述第二基因座处的所述第一亲本的第二单元型包括: 测定在所述第二基因座处测量的所述第四等位基因的各自量以统计上显著量超过在所述第二基因座处测量的所述第三等位基因的各自量。
33.根据权利要求31所述的方法,其中所述第一亲本是父亲,其中所述第二亲本对于第一等位基因在所述第一基因座处是纯合的,并且所述第一亲本对于在所述第一基因座处的所述第一等位基因和第二等位基因是杂合的,其中在所述生物样品中检测在所述第一基因座处的所述第一亲本的第一单元型包括: 在所述生物样品中检测在所述第一基因座处的所述第二等位基因。
34.根据权利要求31所述的方法,其中所述第一基因座和所述第二基因座足够接近,使得在所述第一基因座和所述第二基因座之间的重组概率小于0.1%。
35.根据权利要求29所述的方法,其中所述第一亲本是父亲,所述方法还包括: 鉴定在第一染色体区域中的第一基因座,其中所述第一亲本对于第一等位基因和第二等位基因是杂合的,两者在所述第一基因座处在所述第二亲本中不存在, 其中测定所述胎儿中的至少两个已继承来自所述第一亲本的所述第一染色体区域的不同单元型包括: 检测在所述第一基因座处的所述第一等位基因和所述第二等位基因 。
36.根据权利要求35所述的方法,其中所述第一等位基因和所述第二等位基因含有不同数目的短串联重复。
37.一种测定来自具有至少两个胎儿的妊娠女性的生物样品中的胎儿DNA百分比的方法,所述生物样品包含胎儿和母体DNA,所述方法包括: 通过下述制备直方图: 对于多个染色体区域中的每一个: 鉴定在各自的染色体区域中的一个或多个基因座,在所述生物样品中在所述基因座处检测到各自的第一等位基因和各自的第二等位基因; 在所述生物样品中在所述一个或多个基因座处测量一个或多个第一等位基因的第一个量和/或一个或多个第二等位基因的第二个量;和 获得对于所述第一个量或所述第二个量的标准化参数;和 基于对于所述标准化参数具有指定值的多个染色体区域增大计数器; 使概率分布的线性组合与所述直方图拟合,其中所述胎儿DNA百分比是所述概率分布的线性组合的输入;和 改变所述输入胎儿DNA百分比,以发现最佳化所述概率分布的线性组合与所述直方图的拟合的最佳胎儿DNA百分比。
38.根据权利要求37所述的方法,其中所述概率分布的线性组合具有两个概率分布,其中两个概率分布依赖所述胎儿DNA百分比。
39.根据权利要求37所述的方法,其中所述概率分布的线性组合具有四个概率分布,其中所述概率分布中的两个依赖所述胎儿DNA百分比。
40.根据权利要求37所述的方法,其中由所述第一个量和所述第二个量计算所述标准化参数,所述标准化参数提供在所述第一个量和所述第二个量之间的相对量。
41.根据权利要求37所述的方法,其中所述概率分布是二项式分布或高斯分布。
42.根据权利要求37所述的方法,其还包括: 基于所述最佳胎儿DNA百分比,鉴定对应于基因座的概率分布,在所述基因座处所述母亲是纯合的并且所述胎儿中的至少一个是杂合的; 使多组分混合模型与所鉴定的概率分布拟合,所述多组分混合模型包括对于多个组分中的每一个的混合系数;和 当所述混合系数中的至少两个超过阈值时,测定所述胎儿中的至少两个是二卵的。
43.根据权利要求42所述的方法,其中所述阈值依赖所述混合系数中的至少一个。
44.根据权利要求42所述的方法,其中所述混合模型的组分的峰的位置受约束,以具有超过预定值的分离缺口。
45.一种用于分析妊娠女性的生物样品以测定所述妊娠女性的至少两个胎儿是否是二卵的方法,所述生物样品包含胎儿和母体DNA,所述方法包括: 通过下述制备直方图: 对于多个染色体区域中的每一个: 鉴定在各自的染色体区域中的一个或多个基因座,在所述生物样品中在所述基因座处检测到各自的第一等位基因和各自的第二等位基因; 在所述生物样品中在所述一个或多个基因座处测量一个或多个第一等位基因的第一个量和/或一个或多个第二等位基因的第二个量;和 获得对于所述第一个量或所述第二个量的标准化参数;和 基于对于所述标准化参数具有指定值的多个染色体区域增大计数器; 鉴定对应于基因座的染色体区域,在所述基因座处所述母亲是纯合的并且所述胎儿中的至少一个是杂合的,或在所述基因座处所述母亲是杂合的并且所述胎儿中的至少一个是纯合的; 使多组分混合模型与对应于所鉴定的染色体区域的直方图拟合,所述多组分混合模型包括对于多个组分中的每一个的混合系数;和 使用所述混合系数中的至少两个测定所述胎儿中的至少两个是否是二卵的。
46.根据权利要求45所述的方法,其中所述多组分混合模型具有三个组分。
47.根据权利要求45所述的方法,其中所述多组分混合模型是高斯混合模型。
48.根据权利要求45所述的方法,其还包括: 通过鉴定与对于所述第一染色体区域的相应标准化参数具有最高重叠的所述混合模型的组分,测定所述胎儿对于第一染色体区域的所述一个或多个基因座的基因型。
49.根据权利要求45所述的方法,其中当所述混合系数中的至少两个超过阈值时,所述胎儿中的至少两个测定为二卵的。
50.根据权利要求45所述的方法,其中所述混合模型的组分的峰的位置受约束,以具有超过预定值的分离缺 口。
51.根据权利要求45所述的方法,其中鉴定所述染色体区域包括: 对于所述生物样品的给定胎儿DNA百分比,使概率分布的线性组合与所述直方图拟合;和 鉴定对应于基因座的概率分布,在所述基因座处所述母亲是纯合的并且所述胎儿中的至少一个是杂合的,或在所述基因座处所述母亲是杂合的并且所述胎儿中的至少一个是纯合的,其中使所述多组分混合模型与所鉴定的概率分布拟合。
52.根据权利要求45所述的方法,其还包括: 使用一种或多种后生标记测定所述给定胎儿DNA百分比。
53.根据权利要求52所述的方法,其中所述一种或多种后生标记包括一种或多种DNA甲基化标记。
54.一种计算机产品,其包括贮存用于控制处理器执行操作的多个指令的非临时性计算机可读介质,所述指令包括上述方法中的任一个。
55.一种计算机系统,其包括执行上述方法中的任一个的装置。
【文档编号】C12Q1/68GK103492589SQ201280016005
【公开日】2014年1月1日 申请日期:2012年2月24日 优先权日:2011年2月24日
【发明者】卢煜明, 赵慧君, 陈君赐, 梁德杨, 江培勇 申请人:香港中文大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1