利用靶向扩增和测序的非侵入性胎儿基因组筛查的制作方法

文档序号:469912阅读:332来源:国知局
利用靶向扩增和测序的非侵入性胎儿基因组筛查的制作方法
【专利摘要】本发明提供了利用靶向扩增和测序的非侵入性胎儿基因组筛查的方法、系统和装置。选取了用于确定,例如,两个序列(或两组序列)的比率的失衡的一个或多个截止值。可以至少部分地基于含有母体核酸序列背景的诸如母体血浆的样品中胎儿DNA的百分比来确定所述截止值。还可以基于每一反应的序列的平均浓度来确定该截止值。在一方面,从估计含有特定核酸序列的信息孔的比例来确定该截止值,其中该比例基于上文所述的百分比和/或平均浓度来确定。可以利用诸如序贯概率比检验(SPRT)的许多不同类型的方法来确定该截止值。
【专利说明】利用靶向扩增和测序的非侵入性胎儿基因组筛查
[0001]优先权的要求
[0002]本申请要求于2007年7月23日提交的、题目为“核酸序列失衡的测定”的第60/951438号美国临时申请(代理公司案卷号016285-005200US)的优先权,并且是所述临时申请的正式申请,该临时申请的全部内容通过引用的方式并入本文用于所有目的。
[0003]相关申请的交叉引用
[0004]本申请还涉及同时提交的、题目为“利用基因组测序诊断胎儿染色体非整倍性”的正式申请(代理公司案卷号016285-005220US),该正式申请的全部内容通过引用的方式并入本文用于所有目的。
发明领域
[0005]本发明一般地涉及通过确定两个不同核酸序列之间的失衡对基因型和疾病进行的诊断检测,更具体地,涉及通过检测母体血液样品对胎儿的唐氏综合征、其它染色体非整倍性、突变和基因型的鉴定。本发明还涉及癌症的检测、移植的监测和传染病监测。
[0006]发明背景
[0007]遗传疾病、癌症和其它病况通常由两个对应的染色体或等位基因或其它核酸序列中的失衡导致或产生两个对应的染色体或等位基因或其它核酸序列中的失衡。也就是说,一个序列相对于另一序列的量大于或小于正常值。通常地,正常比率恰好是50/50的比率。唐氏综合征(21三体性 )是具有额外的染色体21失衡的这类疾病。
[0008]21三体性的常规产前诊断方法包括通过诸如羊膜穿刺取样或绒毛膜绒毛取样的侵入性操作的胎儿物质的取样,这引起胎儿丢失的有限风险。诸如通过超声波扫描术和生化标记物的筛查的无创性方法已经用于在确定性的侵入性诊断方法前对孕妇进行风险分级(risk-stratify)。然而,这些筛查方法通常测量与21三体性有关的附带现象,而不是核心染色体异常,因此该筛查方法的诊断准确性不是最佳的,并且具有其它劣势,例如受孕龄影响大。
[0009]1997年发现的母体血浆中循环的无细胞胎儿DNA为无创产前诊断提供了新的可能性(Lo, YMD and Chiu, RWK2007Nat Rev Genet8, 71-77)。尽管这种方法已经容易地应用于性连锁(Costa, JM et al.2002N Engl J Med346, 1502)和某些单基因病症(Lo, YMDet al.1998N Engl J Med339, 1734-1738)的产前诊断,但是该方法在胎儿染色体非整倍性的产前检测的应用表现出相当的挑战(Lo,YMD and Chiu, RWK2007,见上文)。首先,胎儿核酸与经常能够干扰分析的母体来源的核酸的高背景共同存在于母体血浆中(Lo,YMD etal.1998Am J Hum Genet62,768-775)。其次,胎儿核酸主要以无细胞形式在母体血浆中循环,这使得难以获得胎儿基因组中的基因或染色体的剂量信息。
[0010]最近实现了克服这些挑战的明显发展(Benachi,A&Costa, JM2007Lancet369, 440-442)。一种方法检测母体血浆中的胎儿特异性核酸,从而克服了母体背景干扰的问题(Lo, YMD and Chiu, RWK2007,见上文)。从源自胎盘的DNA/RNA分子中的多态性等位基因的比率来推断染色体21的剂量。然而,当样品含有较低量的靶向的基因时,这种方法较不准确,并且只能应用于对靶向的多态性是杂合的胎儿,如果使用了一种多态性,则该靶向的多态性只是群体的子集。
[0011]Dhallan 等人(Dhal lan, R, et al.2007,见上文,Dhal lan, R, etal.2007Lancet369, 474-481)描述了通过向母体血浆中添加甲醛来富集循环的胎儿DNA比例的替代策略。通过评价对于染色体21上的单核苷酸多态性(SNP)遗传自父亲的胎儿特异性等位基因比非胎儿特异性等位基因的比率,来确定由母体血浆中胎儿贡献的染色体21序列的比例。类似地计算参考染色体的SNP比率。然后通过检测染色体21的SNP比率与参考染色体的SNP比率之间统计学的显著差异来推断胎儿染色体21的失衡,其中使用确定的小于0.05的P值来定义显著。为了保证高群体覆盖,祀向每个染色体多于500个的SNP。然而,对富集高比例的甲醛的有效性仍有争议(Chung, GTY, et al.2005ClinChem51, 655-658),因此,该方法的可重复性需要进一步的评价。此外,由于每个胎儿和母亲将提供每个染色体的不同数目的SNP的信息,所以SNP比率比较的统计学检验的效能在不同个例之间是可变的(Lo, YMD&Chiu, RffK.2007Lancet369, 1997)。而且,由于这些方法依赖于遗传多态性的检测,所以它们局限于对这些多态性是杂合的胎儿。
[0012]利用聚合酶链式反应(PCR)以及从21三体性胎儿和整倍体胎儿获得的羊膜细胞(amniocyte)培养物中的染色体21基因座和参考基因座的DNA定量,基于21三体性胎儿中染色体21的DNA序列的1.5倍的增加,Zimmermann等人(2002Clin Chem48, 362-363)能够区分这两组胎儿。由于DNA模板浓度的2倍差异组成了只有一个阀值循环的差别(Ct),所以1.5倍差异的鉴别已经是常规实时PCR的极限。为了实现更精细程度的定量鉴别,亟需替代的策略。因此,出于这一目的,本发明的某些实施方案使用数字PCR(Vogelstein,B etal.1999Proc Natl Acad Sci USA96, 9236-9241)。
[0013]已经开发了数字PCR来检测核酸样品中偏移的等位基因比率(Chang,HW etal.2002J Natl Cancer Inst94,1697-1703)。数字PCR在临床上已经被证实对于检测肿瘤DNA样品中的杂合性丢失(LOH)是有用的(Zhou, ff.et al.2002Lancet359, 219-225)。对于数字PCR结果分析,以前的研究采用了序贯概率比检验(SPRT)来将实验结果分类为提示样品中存在 LOH 或不存在 LOH(El Karoui et al.2006Stat Med25, 3124-3133)。在以前的研究所用的方法中,确定LOH的截止值(cutoff value)使用了 DNA中两个等位基因的固定参考比率,该比率为2/3。由于母体血浆中胎儿核酸的量、比例和浓度是可变的,所以这些方法对于使用母体血浆中的母体核酸背景中的胎儿核酸来检测21三体性是不合适的。
[0014]期望具有基于循环的胎儿核酸分析的胎儿21三体性(和其它失衡)检测的无创检测,特别是不依赖于遗传多态性和/或胎儿特异性标记物的使用的无创检测。还期望具有截止值和序列记数的准确测定,这能够减少准确性所需的数据孔的数目和/或母体血浆核酸分子的量,从而提供了增加的效率和成本效益。还期望该无创检测具有高灵敏度和特异性以将误诊断降至最低。
[0015]母体血浆中胎儿DNA检测的另一应用是单基因病症的产前诊断,例如β-地中海贫血症。然而,由于胎儿DNA只组成了母体血浆DNA的一小部分,所以这种方法被认为只能够检测胎儿从其父亲遗传但是其母亲没有的突变。这种突变的实例包括导致β-地中海贫血症的β-球蛋白基因的密码子41/42的4bp缺失(Chiu RffK etal.2002Lancet, 360, 998-1000)和导致囊性纤维化的囊性纤维化跨膜传导调节因子基因的Q890X 突变(Gonzalez-Gonzalez et al.2002Prenat Diagn, 22,946-8)。然而,由于 β-地中海贫血症和囊性纤维化都是常染色体隐性条件的,其中在该疾病自身显现前,胎儿需要继承来自双亲中每个的突变,所以只检测遗传自父亲的突变只会使得胎儿患有该疾病的风险从25%增加至50%。这在诊断上不是理想的。因此,当胎儿能够被排除具有纯合疾病状态时,现有方法的主要诊断应用是用于在母体血浆中不能检测到遗传自父亲的胎儿突变的情况。然而,这种方法在诊断上的劣势是,结论是基于父亲突变的阴性检测做出的。因此,允许从母体血浆中确定完整的胎儿基因型(纯合正常、纯合突变体或杂合)而没有上文的限制的方法是非常理想的。
[0016]发明简述
[0017]本发明的实施方案提供了用于确定在生物样品中是否存在核酸序列失衡(例如,等位基因失衡、突变失衡或染色体失衡)的方法、系统和装置。例如,选择了用于确定两个序列(或两组序列)的量的比率的失衡的一个或多个截止值。
[0018]在一实施方案中,至少部分地基于诸如母体血浆或血清或尿的含有母体核酸序列背景的生物样品中的胎儿(临床相关的核酸)序列的百分比来确定所述截止值。在另一实施方案中,基于多个反应中的序列的平均浓度来确定所述截止值。在一方面,从估计含有特定核酸序列的信息孔的比例来确定所述截止值,其中该比例是基于上文所述的百分比和/或平均浓度来确定的。
[0019]可以使用许多不同类型的方法来确定所述截止值,例如SPRT、假发现(falsediscovery)、置信区间、接收器工作特性(receiver operating characteristic) (ROC)。这种策略还在能够做出置信分类(confident classification)前将检测所要求的量降至最少。这种策略与模板的量通常是有限的血浆核酸分析是特别相关的。
[0020]根据一示例性·实施方案,提供了用于确定生物样品中是否存在核酸序列失衡的方法,该方法包括:接收来自多个反应的数据,其中该数据包括:(1)表明临床相关的核酸序列的第一量的第一组定量数据;和(2)表明不同于所述临床相关的核酸序列的背景核酸序列的第二量的第二组定量数据;从这两个数据组来确定参数;从多个反应的每一个中的参考核酸序列的平均浓度导出第一截止值,其中该参考核酸序列是所述临床相关的核酸序列或所述背景核酸序列;将所述参数与所述第一截止值比较;并且,基于该比较来确定是否存在核酸序列失衡的分类。
[0021]根据另一示例性实施方案,提供了用于确定生物样品中是否存在核酸序列失衡的方法,该方法包括:接收来自多个反应的数据,其中该数据包括:(I)表明临床相关的核酸序列的第一量的第一组定量数据;和(2)表明不同于所述临床相关的核酸序列的背景核酸序列的第二量的第二组定量数据,其中,所述临床相关的核酸序列和所述背景核酸序列来自第一类型的细胞和来自一种或多种第二类型的细胞;从这两个数据集来确定参数;从得自核酸序列的量的测量的第一百分比导出第一截止值,该核酸序列来自生物样品中所述第一类型的细胞;将所述参数与所述截止值比较;并且,基于该比较来确定是否存在核酸序列失衡的分类。
[0022]本发明的其它实施方案涉及与本文所述的方法相关的系统和计算机可读取的介质。
[0023]参照下文的发明详述和附图将更好地理解本发明的特性和优势。[0024]附图简述
[0025]图1是示出数字PCR实验的流程图。
[0026]图2A示出本发明实施方案的数字RNA-SNP和RCD方法。
[0027]图2B显示了在癌症中可频繁检测到的染色体畸变的实例的表格。
[0028]图3示出按照本发明的实施方案用于确定唐氏综合征的具有SPRT曲线的图。
[0029]图4显示了按照本发明的实施方案利用胎儿细胞百分比来确定疾病状态的方法。
[0030]图5显示了按照本发明的实施方案利用平均浓度来确定疾病状态的方法。
[0031]图6显示的表格的列出了按照本发明的实施方案对于表示为每孔的平均参考模板浓度0?)的一系列模板浓度而言,21三体性样品的预期数字RNA-SNP等位基因比率和Pro
[0032]图7显示的表格列出了按照本发明的实施方案对于表示为每孔的平均参考模板浓度Οτι,)的一系列模板浓度而言,21三体性样品中的10%、25%、50%和100%的部分胎儿DNA浓度的预期Pr。
[0033]图8显示的图示出了按照本发明的实施方案,数字RNA-SNP分析的0.1、0.5和1.0的m,值的SPRT曲线的差异程度。
[0034]图9A显示了按照本发明的实施方案在96孔数字RNA-SNP分析中比较用于分类整倍体和21三体性实例的新和旧SPRT算法的有效性的表格。
[0035]图9B显示了按照本发明的实施方案在384孔数字RNA-SNP分析中比较用于分类整倍体和21三体性实例的新和旧SPRT算法的有效性的表格。
[0036]图10的表格显示了按照本发明的实施方案,对于给定的信息计数,被正确或错误分类为整倍体或非整倍体以及那些不可分类的胎儿的百分比。
[0037]图11是表格1100,显示了按照本发明的实施方案,纯(100%)胎儿DNA样品的数字RCD分析的计算机模拟。
[0038]图12是表格1200,显示了按照本发明的实施方案,m,=0.5的数字RCD分析的准确性的计算机模拟的结果,该数字RCD分析用于对来自具有不同部分浓度的胎儿DNA的整倍体或21三体性胎儿的样品进行分类。
[0039]图13A显示了按照本发明的实施方案,整倍体妊娠和21三体性妊娠的胎盘组织的数字RNA-SNP分析的表格1300。
[0040]图13B显示了按照本发明的实施方案,来自整倍体妊娠和21三体性妊娠的母体血浆的数字RNA-SNP分析的表格1350。
[0041]图14A-14C显示的图示例了按照本发明实施方案得自RCD分析的截止曲线。
[0042]图15A显示了按照本发明的实施方案,整倍体妊娠和21三体性妊娠的胎盘组织中的数字RNA-SNP分析的表格。
[0043]图15B显示了按照本发明的实施方案,来自一个母体血浆样品的12个反应板的数字RNA-SNP数据的表格。
[0044]图15C显示了按照本发明的实施方案,来自整倍体妊娠和21三体性妊娠的母体血浆的数字RNA-SNP分析的表格。
[0045]图16A显示了按照本发明的实施方案,整倍体胎盘和18三体性胎盘的数字RNA-SNP分析的表格。[0046]图16B显示了按照本发明的实施方案,整倍体胎盘和18三体性胎盘的数字RNA-SNP数据的SPRT解释。
[0047]图17显示了按照本发明的实施方案,整倍体妊娠和21三体性妊娠的50%胎盘/母体血液细胞DNA混合物的数字RCD分析的表格。
[0048]图18显示的SPRT曲线示例了按照本发明的实施方案,用于正确分类的判定边界(decision boundary)。
[0049]图19显示了按照本发明的实施方案,来自整倍体妊娠和21三体性妊娠的羊水样品的数字RCD分析的表格。
[0050]图20显示了按照本发明的实施方案,来自整倍体妊娠和18三体性妊娠的胎盘DNA样品的数字RCD分析的表格(E=整倍体;T18=18三体性)。
[0051]图21显示了按照本发明的实施方案,整倍体妊娠和21三体性妊娠的50%胎盘/母体血液细胞DNA混合物的多重数字RCD分析的表格(E=整倍体;Τ21=21三体性;U=未分类的)。
[0052]图22A和22B显示按照本发明的实施方案,50%整倍体或21三体性胎盘基因组DNA/50%母体血沉棕黄色层(buffy coat) DNA混合物的多重数字RCD分析的表格。Unclass表示不可分类的并且T21表示21三体性。
[0053]图23显示了雄性和雌性配偶都携带相同突变的情况。
[0054]图24A显示按照本发明的实施方案,雌性/雄性和雄性/雄性DNA混合物的数字RMD分析的表格。
[0055]图24B显示了按照本发明的实施方案,25%雌性与75%雄性DNA混合物的数字RMD分析的表格。
[0056]图25显示了按照本发明的实施方案,模拟母体血浆样品HbE突变的15%_50%DNA混合物的数字RMD分析的表格。
[0057]图26A显示了按照本发明的实施方案,模拟母体血浆样品⑶41/42突变的5%_50%的DNA混合物的数字RMD分析的表格。
[0058]图26B显示了按照本发明的实施方案,模拟母体血浆样品⑶41/42突变的20%的DNA混合物的数字RMD分析的表格。
[0059]图27显示了可用于本发明的实施方案的系统和方法的示例性计算机装置的方框图。
[0060]定义
[0061]本文所用的术语“生物样品”意指取自个体(例如,诸如孕妇的人)并含有一种或多种感兴趣的核酸分子的任何样品。
[0062]术语“核酸”或“多核苷酸”意指脱氧核糖核酸(DNA)或核糖核酸(RNA)及其单链或双链形式的聚合物。除非特别地限定,该术语包括含有天然核苷酸的已知类似物的核酸,其具有与参考核酸类似的结合特性,并且以与天然存在的核苷酸类似的方式进行代谢。除非另外指明,特定的核酸序列还隐含地包括其保守地修饰的变体(例如,简并密码子取代)、等位基因、直向同源物、SNP和互补序列以及明确地指出的序列。具体地,简并密码子取代可以通过产生如下的序列实现:其中一个或多个选择的(或全部)密码子的第三位被混合碱基和/或脱氧次黄苷残基取代(Batzer et al., Nucleic AcidRes.19:5081(1991);Ohtsuka et al., J.Biol.Chem.260:2605-2608 (1985)和 Rossoliniet al.,Mol.Cell.Probes8:91-98 (1994))。术语核酸与基因、cDNA、mRNA、小非编码 RNA、微RNA(miRNA)、Piwi_相互作用RNA以及基因或基因座编码的短发夹RNA(shRNA)可交换使用。
[0063]术语“基因”表示与产生多肽链有关的DNA的片段。其可以包括编码区之前和之后的区域(前导区和非转录尾区)以及单独的编码片段(外显子)之间的间插序列(内含子)。
[0064]本文所用的术语“反应”意指与表示感兴趣的特定多核苷酸序列的存在或不存在的化学、酶或物理作用有关的任何过程。“反应”的实例是诸如聚合酶链式反应(PCR)的扩增反应。“反应”的另一实例是通过合成或通过连接的测序反应。“信息反应”是表明一种或多种感兴趣的特定多核苷酸序列的存在的反应,并且在一种情况下,只存在一种感兴趣的序列。本文所用的术语“孔”意指在有限的结构内的预定位置的反应,例如,PCR阵列中的孔状小管、单元或室。
[0065]本文所用的术语“临床相关的核酸序列”能够指对应于更大的基因组序列的片段的多核苷酸序列或者指更大的基因组序列自身,该多核苷酸序列的潜在失衡被检测。一个实例是染色体21的序列。其它实例包括染色体18、13、X和Y。仍然其它的实例包括胎儿遗传自其双亲中一个或两个的突变的遗传序列或遗传多态性或拷贝数变异。仍然其它的实例包括在恶性肿瘤中突变、缺失或扩增的序列,例如,发生了杂合性丢失或基因重复的序列。在某些实施方案中,多个临床相关的核酸序列或该临床相关的核酸序列等同的多个标记物能够用于提供检测失衡的数据。例如,来自染色体21上的5个不连续序列的数据能够以累加的方式用于确定可 能的染色体21失衡,从而将所需的样品体积有效地减少至1/5。
[0066]本文所用的术语“背景核酸序列”意指与所述临床相关的核酸序列的正常比率是已知的核酸序列,例如,I比I的比率。作为一个实例,所述背景核酸序列和所述临床相关的核酸序列是来自相同的染色体并且由于杂合性而不同的两个等位基因。在另一实例中,所述背景核酸序列是与另一等位基因杂合的一个等位基因,所述另一等位基因是所述临床相关的核酸序列。而且,某些背景核酸序列和临床相关的核酸序列的每一个可以来自不同的个体。
[0067]本文所用的术语“参考核酸序列”意指每个反应的平均浓度是已知的或者已经被等同地测量过的核酸序列。
[0068]本文所用的术语“过度表现的(overrepresented)核酸序列”意指在生物样品中的两个感兴趣的序列(例如,临床相关的序列和背景序列)之中丰度比另一序列更高的的核酸序列。
[0069]本文所用的术语“基于”表示“至少部分地基于”,并且意指在确定另一值时所用的一个值(或结果),例如,发生在方法的输入和该方法的输出的联系中。本文所用的术语“导出”也意指方法的输入和该方法的输出的联系,例如,当导出是公式的计算时发生。
[0070]本文所用的术语“定量数据”表示从一个或多个反应获得并且提供一个或多个数值的数据。例如,显示特定序列的荧光标记物的孔的数目是定量数据。
[0071]本文所用的术语“参数”表示表征定量数据组和/或定量数据组之间的数值联系的数值。例如,第一核酸序列的第一量与第二核酸序列的第二量之间的比率(或比率的函数)是参数。[0072]本文所用的术语“截止值”表示用于在生物样品的两个或更多个类别状态(例如,患病和未患病)之间进行裁定(arbitrate)的数值。例如,如果参数大于截止值,将定量数据分为第一类(例如,患病状态),或者如果该参数小于该截止值,则将定量数据分为另一类(例如,未患病状态)。
[0073]本文所用的术语“失衡”表示由临床相关的核酸序列的量中至少一个截止值所定义的与参考量的任何显著偏差。例如,该参考量能够是3/5的比率,因此如果测量的比率是1:1,则发生了失衡。
[0074]发明详述
[0075]本发明提供了方法、系统和装置,用于确定在生物样品中,与临床相关的核酸序列相对于其它非临床相关的序列的参考(例如,未患病)量比较,是否存在增加或减少(例如,染色体或等位基因失衡)。选择一个或多个截止值来确定与参考量相比是否存在变化(即,失衡),例如,关于两个序列(或两组序列)的量的比率。检测到的参考量变化可以是临床相关的核酸序列与其它非临床相关的序列的关系的任何偏差(上升或下降)。因此,参考状态可以是任何比率或其它量(例如,除了 1-ι的对应),并且表示变化的测量状态可以是任何比率或不同于由一个或多个截止值所确定的参考量的其它量。
[0076]所述临床相关的核酸序列和所述背景核酸序列可以来自第一类型的细胞和来自一种或多种第二类型的细胞。例如,源自胎儿/胎盘细胞的胎儿核酸序列存在于诸如母体血浆的生物样品中,该生物样品包含源自母体细胞的母体核酸序列的背景。因此,在一实施方案中,至少部分地基于生物样品中所述第一类型的细胞的百分比来确定截止值。注意,可以通过任何源自胎儿的基因座来测定样品中胎儿序列的百分比,并且不限于测量所述临床相关的核酸序列。在另一实施方案中,至少部分地基于诸如血浆、血清、唾液或尿的生物样品中肿瘤序列的百分比来确定截止值,该生物样品包含源自体内的非恶性细胞的核酸序列的背景。
·[0077]仍然在另一实施方案中,基于多个反应中序列的平均浓度来确定截止值。在一方面,从估计含有特定核酸序列的信息孔的比例来确定所述截止值,其中该比例是基于上文所述的百分比和/或平均浓度来确定的。可以使用许多不同类型的方法来确定截止值,例如,SPRT、假发现、置信区间、接收器工作特性(ROC)。这种策略还能够在做出确信的分类前将检测所要求的量降至最少。这与模板的量通常有限的血浆核酸分析是特别相关的。尽管通过数字PCR来表现这种策略,但是也可以使用其它方法。
[0078]数字PCR包括极端稀释的核酸的多个PCR分析,从而大部分阳性扩增反映了来自单个模板分子的信号。由此数字PCR允许计数单独的模板分子。分析的PCR总数中的阳性扩增的比例允许估计原始或未稀释的样品中的模板浓度。这种技术被认为允许检测各种遗传现象(Vogelstein, B et al.1999,见上文),并且最近被用于检测肿瘤样品(Zhou, ff.etal.2002,见上文)和癌症患者血浆(Chang, HW et al.2002,见上文)中的杂合性丢失。由于通过数字PCR的模板分子定量不依赖于报道染料与核酸浓度之间的剂量反应关系,所以理论上数字PCR分析的精度应当高于实时PCR的精度。因此,数字PCR潜在地能够允许鉴别靶基因座与参考基因座之间更精细程度的定量差异。
[0079]为了对此进行检测,我们首先评价数字PCR是否能够测定母体血浆中来自染色体
21的胎盘转录物,PLAC4mRNA 的等位基因比率(Lo, YMD, et al.2007Nat Medl3, 218-223),从而区分21三体性胎儿和整倍体胎儿。这种方法被称为数字RNA-SNP方法。我们然后评价数字PCR增加的精度是否能够允许检测胎儿的染色体非整倍性而不依赖于遗传多态性。我们将这种方法称为数字相关的染色体剂量(RCD)分析。数字RNA-SNP方法依赖于多态性,但是在定量鉴别中要求较低的精度,而数字相关的染色体剂量(RCD)分析不依赖于多态性,但是对于定量鉴别要求较高的精度。
[0080]1.数字 RNA-SNP
[0081]A.概述
[0082]数字PCR能够检测DNA样品中两个等位基因的等位基因比率偏移的存在。例如,数字PCR已经用于检测肿瘤DNA样品中的杂合性丢失(LOH)。假定在DNA样品中有两个等位基因,即A和G,并且A等位基因将在细胞中随着LOH而丢失。当在肿瘤样品的50%的细胞中存在LOH时,该DNA样品中G:A的等位基因比率将是2:1。然而,如果在该肿瘤样品中不存在LOHJU G:A的等位基因比率的比率将是1:1。
[0083]图1是示出数字PCR实验的流程图。在步骤110中,将DNA样品稀释,然后分配至单独的孔中。注意,发明人已经确定在原始样品中,某些血浆核酸种类已经被充分地稀释。因此,如果某些模板已经以需要的浓度存在,则不需将它们稀释。在以前的研究中(例如,Zhou et al.2002,见上文),将DNA样品稀释至特定的“模板DNA”的平均浓度约是每孔的两个模板中的一个模板0.5分子的程度。注意,术语“模板DNA”看起来意指A等位基因或G等位基因,并且没有为这种具体的浓度提供原理阐述。
[0084]在步骤120中,在每个孔中进行PCR过程来同时检测A等位基因和/或G等位基因。在步骤130中,在每个孔中鉴定了标记物(例如,通过荧光),例如,A、G、A和G或者A和G都不是。在没有LOH的情况下,DNA样品中的A等位基因与G等位基因的丰度将是相同的(每孔一个拷贝)。因此,孔对该A等位基因与对该G等位基因是阳性的概率是相同的。这通过对该A等位基因或对该G等位基因是阳性的孔的数目相似反映出。然而,当在肿瘤样品的50%或更多的细胞中存在LOH时,G等位基因和A等位基因的等位基因比率将至少是2:1。以前的方法简单地假定,样品是至少50%癌性的。因此,孔对G等位基因是阳性的概率将高于对A等位基因是阳性的概率。因此,对G等位基因是阳性的孔的数目将大于对A等位基因是阳性的孔的数目。
[0085]在步骤140中,为了分类数字PCR的结果,计数对每个等位基因是阳性的,但是对另一等位基因不是阳性的孔。在上文的实例中,计数了对A等位基因是阳性,但对G等位基因是阴性的孔的数目和对G等位基因是阳性,但对A等位基因是阴性的孔的数目。在一实施方案中,表现出较少的阳性孔的等位基因被视为参考等位基因。
[0086]在步骤150中,信息孔的总数被确定为对所述两个等位基因的任一个是阳性的孔的数目的总和。在步骤160中 ,计算了由具有较多的阳性孔的等位基因贡献的信息孔的比例(PJ (参数的实例)。Pf只对具有较多阳性孔的等位基因是阳性的孔的数目/只对一个等位基因(A或G)是阳性的孔的总数。其它实施方案能够使用具有一个等位基因的全部孔除以具有至少一个等位基因的全部孔。
[0087]在步骤170中,确定Pr的值是否表示等位基因失衡。由于期望准确度和效能,所以这一任务并非简单的。确定失衡的一种方法使用了 Bayesian类似然方法,序贯概率比检验(SPRT)。SPRT是允许随着数据的积累比较两种概率假设的方法。换言之,SPRT是将数字PCR结果分类为表示等位基因偏移存在或不存在的统计学方法。该方法具有将获得特定统计功效和准确度所需要分析的孔的数目减至最小的优势。
[0088]在示例性的SPRT分析中,将针对无效假设和备选假设来检验实验结果。当在样品中有等位基因比率偏移时,则接受备选假设。当在样品中没有等位基因比率偏移时,则接受无效假设。将该匕值与两个截止值比较以接受无效假设或备选假设。如果没有接受任何一个假设,则将该样品标记为未分类的,这表示观察到的数字PCR结果不足以以期望的统计学可信度将该样品进行分类。
[0089]通常基于在假设中给出的假定下的己固定值来计算接受无效假设或备选假设的截止值。在所述无效假设中,假定样品没有表现出等位基因比率偏移。因此,对A等位基因和G等位基因是阳性的每个孔的概率将是相同的,因此,匕的预期值将是1/2。在所述备选假设中,Pr的预期值是2/3,或者大约是0.5与2/3的中间值,例如0.585。并且,由于有限的实验数目,能够选择上限(.585+3/N)和表示为(.585-3/N)的下限。
[0090]B.唐氏综合征的检测
[0091]在本发明的一实施方案中,数字SNP用于从孕妇血浆中检测胎儿唐氏综合征。使用对胎儿/胎盘细胞特异性的标记物可以测量染色体21中的等位基因比率。例如,为了确定观察到的PLAC4等位基因的过度表现的程度是否是统计学显著的,使用SPRT。
[0092]根据一示例性的实施方案,数字RNA-SNP确定了位于PLAC4mRNA的A/G SNP,rs8130833的多态性等位基因比率的失衡,该mRNA是从染色体21转录并被胎盘表达的。对于杂合的整倍体胎儿,A等位基因和G等位基因应当在胎儿基因组中被相等地表现(1:1基因组比率);而在21三体性中,三体的染色体21将与胎儿基因组中的一个SNP等位基因的额外拷贝有关,从而获得2:1的比率。数字PCR的目的是确定分析的样品中的两个PLAC4等位基因的量是 否相等。因此,A PLAC4等位基因和G PLAC4等位基因都是靶模板。设计了实时PCR测定来扩增PLAC4mRNA,并且通过TaqMan荧光探针来鉴别这两个SNP等位基因。分析步骤的示意图示于图2A中。
[0093]图2A示出本发明实施方案的数字RNA-SNP方法200。在步骤210中,接收样品。在步骤220中,在提取的RNA样品中将诸如PLAC4mRNA的核酸序列定量。在一实施方案中,通过PLAC4mRNA的实时PCR来进行这种定量。在一方面,这个步骤为操作者提供在靶标达到数字PCR分析的“范围”前所需的稀释程度的概念。
[0094]在步骤230中,将样品稀释。在步骤240中,测量稀释的样品的浓度。稀释的样品浓度可以被证实为约I个模板/孔(即,参考序列或非参考序列或任何一个等位基因)。某些实施方案使用第IV部分所述的技术来进行这一测量。例如,我们将稀释的样品分配至实时PCR分析的96个孔中来保证实现了可用的稀释。如在后文中将解释的,稀释浓度也可以是未知的,从而省略这一步骤。
[0095]在步骤250中,在阵列的每个孔中进行数字PCR。例如,将相同的稀释的样品分配至实时PCR分析的384个孔中。从PCR结果中鉴定了每个核酸序列的标记物的量和信息孔的数目。信息孔被定义为仅对A等位基因或G等位基因是阳性,而不是对两个等位基因都是阳性的孔。在步骤260中,计算匕的预期值。在后文中将更详细地讨论这些步骤。所述计算包括从步骤250所测定的值来确定参数。例如,可以计算每孔的实际平均模板浓度。
[0096]在步骤270中,可以进行SPRT或其它似然比率检验来确定是否存在失衡。对于整倍体情况,我们预期相等数目的A阳性孔和G阳性孔。然而,当分析来自21三体性胎儿的模板分子时,只含有一个等位基因的孔的数目将大于只含有另一等位基因的孔的数目。简而言之,等位基因失衡对21三体性是预期的。
[0097]如上文所述的,SPRT是 Bayesian 类似然方法(Bayesian-type likelihoodmethod),该方法允许随数据的积累比较两个概率假设。在21三体性检测的数字PCR分析中,当存在等位基因失衡时(即,检测到21三体性),则接受备选假设;当没有等位基因失衡时(即,没有检测到21三体性),则接受无效假设。更多数目计数的等位基因被称为潜在地过度表现的等位基因,并且将计算该等位基因在全部信息孔中的比例(Pr)。如果该已表明了足够程度的对21三体性样品预期的等位基因失衡,则应用SPRT来进行确定。
[0098]可操作地,能够通过使用具有一对SPRT曲线的图来应用和解释SPRT,构建该SPRT曲线来定义接受或拒绝任何一个假设的概率边界。图3示出按照本发明的实施方案用于确定唐氏综合征的SPRT曲线的图。当能做出确信的分类时,SPRT曲线将对潜在过度表现的等位基因是阳性的信息孔的所需比例已(y-轴)对信息孔的给定的总数(X-轴)作图。如图3所示,上部曲线设定接受备选假设的概率边界,而下部曲线设定接受无效假设的概率边界。
[0099]将实验推导出的匕值与预期匕值相比较以便接受或拒绝任一假设。如果接受无效假设,则将该样品分类为从怀有整倍体胎儿的孕妇获得的样品。如果接受备选假设,则将该样品分类为从怀有21三体性胎儿的孕妇获得的样品。可选择地,如果给定数目的信息计数的匕没有达到疾病分类所要求的统计学可信度,则不能接受任何一个假设。在有更多的可用数据以前,这些情况被视为不可分类的。如果疾病分类是不可能的,则可以进行额外的384孔板直到累积的数据可以通过SPRT来分类。
[0100]因此,对于给定水平的可信度,SPRT比其它统计学方法提供了更少的所需检测量的优势。在实践中,只 要积累了所需量的数据,SPRT就允许接受或拒绝任何一个假设,从而将不需要的额外分析降至最低。这种特性与通常以低浓度存在的血浆核酸的分析特别相关,其中可用的模板的数目是有限的。除了严格的分类以外,所述分类还可以包括百分比准确度。例如,来自与截止值比较的分类可以提供表现出具有某一百分比的核酸序列失衡的可能性的样品,或者,等效地提供准确至某一百分比或其它值的确定失衡。
[0101]利用母体血浆或血清中的胎儿核酸,可以应用类似的方法来确定关于突变或遗传多态性的胎儿基因型。应当记得的是,胎儿将从其母亲遗传胎儿一半的基因组。作为示例,考虑具有两个等位基因A和B的特定遗传基因座。如果母亲是基因型为AB的杂合子,则胎儿理论上能够具有AA、BB或AB的基因型。如果胎儿的基因型为AB,即,与母亲相同,则母体血浆中将只有AB基因型的核酸(既来自母亲又来自胎儿)。因此,在母体血浆中观察到了核酸或等位基因的平衡。在另一方面,如果胎儿的基因型为AA或BB,则在母体血浆中将分别有过度表现的A等位基因或B等位基因的等位基因失衡。这种考虑还适用于导致疾病的突变(例如,导致囊性纤维化、β -地中海贫血症或脊髓型肌萎缩的那些突变),在这种情况下,A能够被考虑为野生型等位基因,而B能够被考虑为突变体等位基因。
[0102]I1.数字 RCD
[0103]数字RNA-SNP的劣势是,其只能应用于被分析的SNP是杂合的个例。一个改进是,基于循环的胎儿核酸分析的检测胎儿21三体性或其它胎儿染色体非整倍性(例如,18三体性、13三体性和性染色体非整倍性)的无创检测与遗传多态性的使用无关将是理想的。因此,在一实施方案中,通过相对于位于参考染色体,即本研究中的染色体I上的基因座的非多态性的染色体21基因座的数字PCR分析来测定染色体剂量。从21三体性个例中区分整倍体胎儿基因组中染色体21比染色体I的比率偏离2:2的变化。在21三体性检测的数字PCR分析中,要比较的两个假设将是没有染色体失衡(B卩,没有检测到21三体性)的无效假设和存在染色体失衡(即,检测到了 21三体性)的备选假设。
[0104]这种方法能够被推广至与其它染色体非整倍性有关的其它染色体,例如,18三体性中的染色体18、13三体性中的染色体13、特纳综合征中的染色体X。另外,除了染色体1,与非整倍性无关的其它染色体也能够用作参考染色体。通过分析在癌症中通常部分地缺失的染色体比参考染色体的比率的变化,能够将类似的方法应用于检测癌症。通常部分地缺失的染色体的实例包括直结肠癌中的染色体5q、肺癌中的染色体3p和鼻咽癌中的染色体9p。图2B列出了某些导致序列失衡的某些常见的与癌症有关的染色体畸变。
[0105]图2A还示出本发明实施方案的数字RCD方法205。在步骤220-230的一实施方案中,例如,通过Nanodrop技术,将提取的DNA定量,并稀释至每孔大约一个靶模板的浓度,所述靶模板来自染色体21或标准化的染色体(例如,染色体I)的。在步骤240的一实施方案中,在384孔板中使用两个TaqMan探针进行数字RCD分析前,可以进行如下证实:通过分析稀释的DNA样品来证实约37%的水平的孔是否是阴性的,该分析只通过使用96孔格式的染色体I探针的测定来进行。37%的显著性将在后面的第IV部分中进行讨论。
[0106]步骤240的检测和步骤250的结果可以用设计成扩增存在于两条染色体上的种内同源序列(paralogous sequence) (Deutsch, S.et al.2004J Med Genet41, 908-915)的实时PCR测定来完成,所述染色体被通过一对TaqMan探针鉴别的平行同源序列变化所区分。在本文中,信息孔被定义为对任一染色体21或染色体I基因座是阳性的,而对这两条染色体不都是阳性的孔。对于整倍体胎儿,对任一基因座是阳性的信息孔的数目应当大致相等。对于21三体性胎儿,应当有与染色体I阳性孔相比,染色体21阳性孔的过度表现。在下文的部分中描述了过度表现的确切比例。
[0107]II1.并入胎儿序列的百分比
[0108]上文所述的方法200和205的实施方案的劣势在于胎儿特异性的标记物是必需的。因此,在本发明的一实施方案中使用了非胎儿特异性的标记物。为了使用这种非胎儿特异性的标记物,本发明的实施方案测量了母体血浆(即,生物样品)中胎儿DNA的部分浓度(fractional concentration)。通过这些信息,可以按照如下步骤来计算更有用的P1?值。
[0109]即便对于母体血浆中胎儿DNA的小的部分百分比,21三体性胎儿将通过释放至母体血衆中的胎儿DNA的基因组当量(genome-equivalent) (GE)贡献额外剂量的染色体21序列。例如,含有50GE/ml总DNA和5GE/ml胎儿贡献的DNA (即,10%胎儿DNA部分浓度)的来自整倍体妊娠的母体血浆样品将会含有每毫升母体血浆总共100个拷贝(90个母体拷贝+10个胎儿拷贝)的染色体21序列。对于21三体性妊娠,每个胎儿GE将贡献3个拷贝的染色体21,这导致母体血浆中总共105个拷贝/ml (90个母体拷贝+15个胎儿拷贝)的染色体21序列。因此,在10%的胎儿DNA浓度时,三体妊娠母体血浆中源自染色体21的序列的量将是整倍体情况的1.05倍。因此,如果能够开发测定这种小程度的定量差异的分析方法,将实现不依赖于多态性的胎儿21三体性的无创产前诊断检测。
[0110]因此,过度表现的程度将取决于分析的DNA样品中部分胎儿DNA浓度。例如,当分析胎盘DNA时,胎儿基因组中的理论RCD比率应当是3:2,即,1.5倍的差异。然而,如上文所述的,当分析含有10%的胎儿母体血浆时,该理论RCD比率将降至1.05。通过将只对染色体21基因座是阳性的孔的数目除以信息孔的总数来计算实验导出的己。用计算的已和理论RCD比率来对实验导出的进行SPRT分析。
[0111]图4表示按照本发明的实施方案,利用胎儿核酸百分比来确定疾病状态的方法400。在步骤410中,测量了胎儿物质的部分百分比。在一实施方案中,通过测量相对于非胎儿特异性标记物(即,在母亲和胎儿中都存在的基因序列)的胎儿特异性标记物(例如,Y染色体,遗传多态性标记物(例如,SNP)、胎盘外遗传特征(epigenetic signature))的量来确定所述部分百分比。通过实时PCR、数字PCR、测序反应(包括大规模平行基因组测序)或任何其它定量方法来进行实际的测量。在一方面,优选地不使用对于本测量能够潜在地处于等位基因失衡的基因祀标。
[0112]在步骤420中,进行了数字PCR或其它测量方法,包括将样品稀释,将该稀释的样品置于孔中并测量每孔中的反应。在步骤430中,将PCR结果用于鉴定不同参考核酸序列(例如染色体或等位基因)的标记物。在步骤440中,计算了过度表现的序列的实际比率(Pr)。在步骤450中,利用样品中胎儿物质的百分比来计算用于确定疾病状态的截止值。在步骤460中,从该实际匕和该截止值来确定是否存在失衡。
[0113]在一实施方案中,将参考核酸序列的部分百分比并入数字RNA-SNP方法中。因此,当研究由于癌细胞的LOH时,能够用少于50%癌细胞的肿瘤样品来进行这一步骤。还可以将这一步骤用于多于50%的癌细胞的样品以获得更准确的已,并因此减少将导致错误诊断的假阳性的数目。在另一实施方案中,将胎儿核酸百分比并入数字PCR方法中以确定胎儿是否已遗传了父母的基因突变(例如,导致囊性纤维化或β_地中海贫血症或脊髓型肌萎缩的突变)或确定来自母体血浆核酸分析的多态性。
[0114]IV.并入 毎孔的平询浓度
[0115]以前的方法(例如,Zhou, W.et al.2002,见上文)的另一个劣势是要求每孔的平均模板浓度(m)是每孔I个。考虑到难以获得确切的浓度,这能够导致误差。而且,甚至对于每孔I个模板的确切浓度,以前的方法忽略了孔中的模板的统计学分布。在以前的方法,即,老的算法中,假定接受备选假设的匕的预期值是等位基因比率,因此,该匕的预期值与每孔中的模板DNA的平均浓度无关。
[0116]然而,由于稀释样品中模板的天然统计变异(statistical variation),将不会有确切的每孔I个模板。本发明的实施方案测量至少一种序列的平均浓度,然后将该平均浓度用于计算截止值,即预期的匕。在一方面,这种计算包括了统计学分布以确定含有不同核酸序列的孔的概率,然后将该概率用于确定预期的已。
[0117]在一实施方案中,获取了一种参考核酸序列的平均浓度,其在一实例中是DNA样品中较低浓度的核酸序列。在样品不具有失衡的情况下,样品中两种序列的浓度将是相同的,并且任何一种都能够被视为参考等位基因。在样品具有,例如,LOH的情况下,在癌细胞中缺失的等位基因将被视为参考等位基因。将该参考等位基因的平均浓度表示为πν。在另一实施方案中,浓度较高的序列可以被视作参考序列。Α.数字SNP:使用SPRT和数字PCR的实例
[0118]图5显示了按照本发明的实施方案,使用平均模板浓度来确定疾病状态的方法500。在步骤510中,测量了不同序列的量。例如,可以通过计数如上文所解释的数字PCR实验中的标记物来进行这一步骤。然而,可以通过其它方法来进行这一步骤,该方法不包括扩增步骤或者不使用荧光标记物,但是能够使用其它属性,例如如同质量的物理属性、比旋光属性或碱基配对属性。
[0119]在步骤520中,测定了过度表现的序列的实际比例。如上文所述的,可以通过获取只表现出过度表现的序列的孔的数目,然后将该数目除以信息孔的数目来完成这个步骤。在步骤530中,测量了至少一种序列(参考序列)的平均浓度。在一实施方案中,所述参考序列是过度表现的序列。在另一实施方案中,所述参考序列是过少表现(underrepresented)的序列。可以通过计数在数字PCR实验中对参考序列是阴性的孔的数目来进行测量。如在下个分段中所述的,通过泊松分布(Poisson distribution)来描述阴性孔的比例与平均目标浓度之间的关系。
[0120]在步骤540中,例如,使用泊松分布来计算对不同的序列是阳性的孔的预期量。该预期量可以是每孔的序列的概率、每孔的平均序列、含有序列的孔的数目或其它合适的量。在步骤550中,从该预期的量计算预期的P,。在步骤560中,例如,通过使用SPRT,从预期的已计算截止值。在步骤570中,确定了核酸序列失衡的分类。现在将描述方法500的具体方面。
[0121]1.确定序列的预期暈
[0122]一旦从步骤530知道了每孔的平均浓度(反应或反应混合物),就可以在步骤540中计算表现出该序列的孔的预期数目。这种量可以表示为%、分数值或整数值。利用具体的实例进行说明,假定每孔的参考模板的平均浓度OiO是每孔0.5个,并且21三体性胎儿在PLAC4SNP,rs8130833的基因型是AGG。因此,参考模板是A等位基因,并且过度表现的模板是G等位基因。
[0123]在一实施方案中,假定A等位基因在诸如数字PCR的测量方法的孔的反应混合物中的分布是泊松分布。在其它实施方案中,使用了其它分布函数,例如二项分布。
[0124]泊松方程式是:,其中,n=每孔的模板分子的数目;Ρ(η)=η个模板分子在
特定的孔中的概率;并且m=特定的数字PCR实验中一个孔中的模板分子的平均数目。
[0125]因此,在0.5的平均A等位基因的浓度下,不含A等位基因的任何分子的任何孔的概率是:
【权利要求】
1.通过分析母体血液样品确定胎儿非整倍性存在或缺失的方法,所述母体血液样品包括胎儿和母体的无细胞基因组DNA,所述方法包括: 扩增来自第一染色体的第一特异性靶基因座的DNA和扩增来自至少一条第二染色体的第二特异性靶基因座的DNA ; 测序所述扩增的DNA以获得序列标签; 确定来自所述第一染色体的第一特异性靶基因座的序列标签的第一量; 确定来自所述至少一条第二染色体的第二特异性靶基因座的序列标签的第二量;以及比较序列标签的所述第一量和所述第二量,以确定所述第一染色体是否存在胎儿非整倍性。
2.如权利要求1所述的方法,其中所述扩增DNA包括纳升聚合酶链式反应(PCR)、乳液PCR、polony PCR和滚动循环扩增中的至少一种。
3.如权利要求1所述的方法,其中所述扩增DNA使用正向引物和反向引物来扩增来自特异性靶基因座的DNA。
4.如权利要求3所述的方法,其中所述扩增来自所述特异性靶基因座的DNA产生由所述正向引物和所述反向引物限定长度的扩增子。
5.如权利要求1所述的方法,其中将相同的引物对用于扩增来自所述第一特异性靶基因座中的一个的DNA和来自所述第二特异性靶基因座中的一个的DNA。
6.如权利要求1所述的方法,其中基于比较所述第一量和所述第二量确定所述第一染色体是否存在胎儿非整倍性包括:· 确定所述生物样品中胎儿DNA的部分浓度; 利用所述部分浓度来确定所述第一量和所述第二量之间差别的截止值,以表明所述第一染色体存在胎儿非整倍性。
7.如权利要求6所述的方法,其中确定所述生物样品中胎儿DNA的部分浓度包括定量所述女性个体与所述胎儿之间的多态性差异。
8.如权利要求7所述的方法,其中所述定量包括: 鉴定所述女性个体是纯合而胎所述儿是杂合的靶多态性位点;以及比较所述靶多态性位点处胎儿特异性等位基因的量与所述靶多态性位点处共同等位基因的量,以确定胎儿DNA的部分浓度,所述共同等位基因不是胎儿特异性的。
9.如权利要求6所述的方法,其中确定所述生物样品中胎儿DNA的部分浓度包括: 比较第一基因座处表现出胎儿特异性甲基化方式的DNA分子的量与所述第一基因座处DNA分子的总量。
10.如权利要求1所述的方法,其中确定所述第一量包括: 确定来自所述第一特异性靶基因座中的每一个的序列标签的量;以及 进行所述量的加和。
11.如权利要求10所述的方法,其还包括: 在计算加和之前修正所述量。
12.如权利要求1所述的方法,其中确定所述第一量包括: 将所述序列标签与人基因组进行比对;以及 计数与所述第一特异性靶基因座比对的序列标签的数目。
13.如权利要求1所述的方法,其中比较所述第一量和所述第二量以确定所述第一染色体是否存在胎儿非整倍性包括: 确定所述第一量相对于所述第二量的比例;以及 将所述比例与参考值比较,以确定所述第一染色体是否存在胎儿非整倍性。
14.确定怀有胎儿的女性个体的生物样品中胎儿非整倍性存在或缺失的方法,所述生物样品包括来自所述女性个体和来自所述胎儿的无细胞基因组DNA,所述方法包括: 富集所述生物样品中来自第一染色体的第一特异性靶基因座和至少一条第二染色体的第二特异性靶基因座的DNA,以获得富集的样品; 测序所述富集的样品中的DNA分子,以获得序列标签; 确定来自所述第一染色体的第一特异性靶基因座的序列标签的第一量; 确定来自至少一条第二染色体的第二特异性靶基因座的序列标签的第二量; 基于比较所述第一量和所述第二量,确定所述第一染色体是否存在胎儿非整倍性。
15.如权利要求14所述的方法,其中第一特异性靶基因座和第二特异性靶基因座中的至少一对是种内同源的。
16.如权利要求14所述的方法,其中富集所述生物样品包括: 利用基于杂交的技术。
17.如权利要求16所述的方法,其中所述利用基于杂交的技术包括:` 利用寡核苷酸阵列来选择来自所述第一染色体的第一特异性靶基因座和所述至少一条第二染色体的第二特异性靶基因座的DNA。
18.如权利要求14所述的方法,其中富集所述生物培养包括: 扩增来自所述第一染色体的第一特异性靶基因座和所述至少一条第二染色体的第二特异性靶基因座的DNA。
19.如权利要求18所述的方法,其中将相同的引物对用于扩增来自所述第一特异性靶基因座中的一个的DNA和来自所述第二特异性靶基因座中的一个的DNA。
20.如权利要求14所述的方法,其中确定所述第一量包括: 将所述序列标签与人基因组进行比对;以及 计数与所述第一特异性靶基因座中的一个比对的序列标签的数目。
21.如权利要求14所述的方法,其中确定所述第一量包括: 确定来自所述第一特异性靶基因座中的每一个的序列标签的各自量;以及 进行所述各自量的加和。
22.如权利要求21所述的方法,其还包括: 在计算加和之前修正所述各自量。
23.如权利要求14所述的方法,其中所述测序包括连接。
24.如权利要求14所述的方法,其中基于比较所述第一量和所述第二量以确定所述第一染色体是否存在胎儿非整倍性包括: 确定来自所述第一量和所述第二量的参数,其中所述参数提供了所述第一量和所述第二量之间的相对量;以及 将所述参数与一个或多个截止值比较,以确定所述第一染色体是否存在胎儿非整倍性的分类。
25.如权利要求14所述的方法,其中基于比较所述第一量和所述第二量以确定所述第一染色体是否存在胎儿非整倍性包括: 确定所述生物样品中胎儿DNA的部分浓度; 利用所述部分浓度来确定所述第一量和所述第二量之间差别的截止值,以表明所述第一染色体存在胎儿非整倍性。
26.如权利要求25所述的方法,其中确定所述生物样品中胎儿DNA的部分浓度包括定量所述女性个体和所述胎儿之间的多态性差异。
27.如权利要求26所述的方法,其中所述定量包括: 鉴定所述女性个体是纯合而所述胎儿是杂合的靶多态性位点;以及比较所述靶多态性位点处胎儿特异性等位基因的量与所述靶多态性位点处共同等位基因的量,以确定胎儿DNA的部分浓度,所述共同等位基因不是胎儿特异性的。
28.如权利要求25所述的方法,其中所述胎儿是男性,并且其中确定所述生物样品中胎儿DNA的部分浓度包括: 确定Y染色体DNA浓度。
29.如权利要求25所述的方法,其中确定所述生物样品中胎儿DNA的部分浓度包括: 比较第一基因座处表现出胎儿特异性甲基化方式的DNA分子的量与所述第一基因座处DNA分子的总量。
30.如权利要求29所述的·方法,其中所述源自胎儿的DNA分子是高度甲基化的,而源自母体的DNA分子是低甲基化的。
【文档编号】C12Q1/68GK103849684SQ201410052009
【公开日】2014年6月11日 申请日期:2008年7月23日 优先权日:2007年7月23日
【发明者】卢煜明, 赵慧君, 陈君赐, 徐仲锳, 庄家俊 申请人:香港中文大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1