通过数字pcr对核酸的分析的制作方法

文档序号:570615阅读:594来源:国知局
专利名称:通过数字pcr对核酸的分析的制作方法
通过数字PCR对核酸的分析相关申请的交叉引用本申请要求于2007年8月3日提交的第60/953,872号美国临时专利申请的优先 权,该临时申请的公开内容被通过引用的方式整体并入本文。
背景技术
核酸大小的分析用于许多研究和诊断应用中。诸如琼脂糖凝胶电泳、聚丙烯酰胺 凝胶电泳和毛细管电泳的电泳通常用于分析核酸的大小。质谱法也用于分析核酸大小,因 为不同大小的核酸片段,例如那些通过引物延伸反应制备的核酸,具有不同的分子量(Ding and Cantor, 2003, Proc Natl Acad Sci USA,100,7449-7453)。下面是核酸大小分析的用途的一些实例。例如,能够通过用限制性酶处理,然后 通过分析处理的产物的大小来检测产生限制性酶切位点的突变的存在。特定大小的较短 片段的存在表明存在突变。相反地,对应于非限制性状态的较长DNA片段的存在表示没有 突变。如果所用的限制性酶对靶DNA片段的甲基化状态是敏感的,则这种分析还能够用于 分析DNA甲基化。因此,如果使用只切割未甲基化的DNA的酶,则较短的限制酶切DNA片 段表示存在未甲基化的DNA。相反地,较长的非限制性DNA片段的存在表示存在甲基化的 DNA。如果使用切割甲基化的DNA而不切割未甲基化的DNA的酶,诸如McrBC (Sutherland, et al. 1992, J Mol Biol,225,327-348),这些结果的解释将是相反的。作为另一实例,已知母体血浆中的无细胞胎儿DNA的大小小于母体DNA (Chan, et al. 2004,Clin Chem, 50,88-92 ;Li, et al. 2004,ClinChem,50,1002-1011)(还参见,第 03405742. 2 号欧洲专禾lj 申请“Non-invasive detection of fetal genetic traits (月台 儿遗传特征的无创检测)”)。因此,通过电泳的大小分级已经用于富集母体血浆中的胎儿 DNA(Li, et al. 2005,JAMA,293,843-849)在肿瘤学领域中,已经在癌症患者中观察到了增加的DNA完整性(Hanley, et al. 2006, Clin Cancer Res,12,4569—4574 Jiang,et al. 2006,Int J Cancer,119, 2673-2676 ;Umetani,et al. 2006, J Clin Oncol,24,4270-4276 ;Wang,et al. 2003,Cancer Res,63,3966-3968)(还参见第6,964,846号美国专利)。这种现象被认为涉及与肿瘤相关 的坏死改变。通过对不同大小的扩增子各自的实时PCR测定分析了癌症患者中的DNA完整 性。Exact Sciences还拥有专营的DNA完整性测定(更多信息参见网页exactsciences. com/applied/applied, html)。DNA大小分析还用于分析源自病毒的核酸序列,例如鼻咽癌患者和某些淋巴癌患 者血浆中的 EB 病毒(Epstein-Barr virus, EBV)DNA 的大小(Chan, et al. 2003,Cancer Res,63,2028-2032)。核酸大小分析还用于测量RNA的完整性(Wong,et al. 2006,Clin Cancer Res, 12,2512-2516 ;Wong, et al. 2005, Clin Chem,51,1786-1795)。这种分析可以 用于临床诊断,因为已经在癌症患者中观察到了降低的RNA完整性。还已表明,孕妇血浆中 的胎盘RNA由部分降解的片段组成,并且具有5’优势(Wong,et al. 2005, Clin Chem, 51, 1786-1795)。有人指出氧化应激会降低这些胎盘来源的mRNA的完整性(Rusterholz,et al. 2007,Fetal Diagn Ther,22,313-317)。数字PCR及随后的DNA测序已经用于分析结肠直肠肿瘤患者中血浆DNA的大小分布(Diehl,et al. 2005,Proc Natl Acad Sci USA, 102,16368-16373)。本发明提供了用于分析核酸大小,特别是源自相同的较长序列的核酸的大小,以 及测试样品中不同长度的这些核酸的相对丰度的新方法。发明概述本发明提供了分析样品中的靶核酸的新方法。靶核酸能够是源自诸如相同的基 因或相同的染色体区域的相同来源的不同长度的核酸,尽管该靶核酸可以源自一个个体 或者源自多个个体(例如,来自孕妇的样品可以含有来自她自己和她的胎儿的核酸;或者 来自移植受者的样品可以含有来自受者和供者的核酸),或者源自多于一种类型的细胞 (例如,肿瘤细胞、胎盘细胞、血细胞)。这种方法包括下述步骤首先从样品制备多个相 等(或相同)的组分。在这些相等的组分中,至少50%的组分在每一个组分中含有不多 于一个的靶核酸分子。在某些情况下,从样品直接获得相等量的这些多个组分,在其它的 情况下,从稀释或者从首先由部分或全部样品制备的较不常用的浓度获得同样是相等量 的这些多个组分。在某些实施方案中,要求保护的方法的第一个步骤是通过微流体系统 进行的。在其它的实施方案中,能够通过使靶标结合至固体表面来制备所述组分,例如, 桥式扩增(bridgeamplifixation)系统开始部分(prelude)(网页是 www. promeRa. com/ Reneticidproc/ussymp7proc/0726. html)在某些实施方案中,待分析的样品来自孕妇,例如,该样品可以是血液、血浆、血 清、唾液或宫颈灌洗(cervical lavage)样品。在某些情况下,每个靶核酸包含染色体13、 18、21、X或Y的至少一部分;或者每个靶核酸可以包含遗传多态性(例如,单核苷酸多态性 (SNP));或者每个核酸可以包含与疾病有关的基因(例如,地中海贫血症中的球 蛋白基因或囊性纤维化中的囊性纤维化跨膜传导调节因子基因)的至少一部分或者与这 种基因有关的遗传多态性(例如,球蛋白基因座位中的SNP rs713040、rsl0768683和 rs7480526)。在其它的实施方案中,待分析的样品来自癌症患者。例如,该样品可以是血液、血 浆、血清、唾液或肿瘤组织。在某些情况下,每个靶核酸包含KRAS、erbB-2、pl6、RASSFlA基 因序列的至少一部分;或者每个靶核酸来自病毒基因组,例如EB病毒(EBV)、人乳头状瘤病 毒(Human Papilloma Virus, HPV)或乙型肝炎病毒(HBV)。其次,在多个相等组分的每个中进行相同的扩增反应。在每一个组分中,使用至 少3种不同的寡核苷酸引物与至少两种反向引物组合的至少一种正向引物,或者与至少 一种反向引物组合的至少两种正向引物。每种正向或反向引物具有不同并且确定的核苷酸 序列,其被设计成每个正向/反向引物对允许扩增靶核酸序列的不同区域,从而获得不同 长度的扩增产物(即,扩增子)。在某些实施方案中,该扩增反应是聚合酶链式反应(PCR) 或PCR的变体,例如乳液PCR(emulsionPCR)、实时PCR、逆转录PCR(RT-PCR)或实时RT-PCR 或在固体表面进行的PCR,如桥式扩增系统(网页是www. promeRa. com/Reneticidproc/ ussymp7proc/0726. html)。对于RT-PCR,存在逆转录的在先步骤,其从初始存在于样品中 的靶RNA序列产生DNA序列,然后能够扩增该DNA序列。在某些情况下,在PCR中存在诸如 SYBR Green或LC Green的荧光染料。当在要求保护的方法的第二个步骤中进行扩增反应时,能够同时或分别地向反应混合物中添加多种引物。即,不同的正向/反向引物组可以全部同时存在于该反应中,从而 允许同时产生全部可能的扩增子,或者该反应可以以至少一个引物组开始,然后再添加一 种或多种引物以提供另外的引物组,从而允许以连续的方式进行初始和附加的扩增反应。在第三个步骤中,基于扩增子扩增的正向/反向引物组,检测并互相区分通过样 品的多个相等组分中的每个组分内的扩增反应产生的多核苷酸序列或序列(即,扩增子)。 多种方法可用于检测步骤,例如熔融曲线分析、电泳、流式细胞术或利用与可检测标记物连 接的探针的序列特异性杂交,每个探针具有不同的可检测标记物并且与从一对正向和反向 引物扩增的核苷酸序列特异性地杂交。在某些情况下,可检测的标记物是不同的荧光分子。 在其它的情况下,通过使用不同的寡核苷酸引物引发每个不同的扩增子的聚合过程的引物 延伸反应来进行要求保护的方法的第三个步骤。通过质谱法或电泳来检测引物延伸反应的 产物。在某些实施方案中,通过BEAMing来进行第二和第三个步骤。在第四个步骤中,根据不同扩增子的存在,在各自的类别中计数组分的数目。例 如,在扩增反应中使用一种正向引物(A)和两种反向引物(a和b)。如果组分#1对正向引 物A和反向引物a的扩增产物扩增子Aa是阳性的,并且该组分对正向引物A和反向引物b 的扩增产物扩增子Ab也是阳性的,则组分#1在Aa+/Ab+的类别中将被计数一次。在另一方 面,如果组分#2对扩增子Aa是阳性的,但对扩增子Ab不是阳性,则组分#2将在Aa+/Ab_的 类别中被计数一次。全部阴性反应不需要计数,因为它们的数目能够从组分的总数和含有 至少一个扩增子的组分的数目推导出来。附图简述

图1-12示出引物设计的多种方案以及用于在涉及不同引物组的扩增反应后检测 不同的多核苷酸序列的多种方法。图13 使用不同大小组合的测定计算的妊娠末三个月(thirdtrimester)母体血 浆中的胎儿百分比。图a、b和c表示单独的妊娠末三个月母体血浆样品的结果。图d表示 这三个母体血浆样品的平均结果。图14 使用不同大小组合的测定计算的妊娠前三个月(firsttrimester)母体血 浆中的胎儿百分比。图a、b、c和d表示单独的妊娠前三个月母体血浆样品的结果。图e表 示这三个母体血浆样品的平均结果。定义术语“核酸”或“多核苷酸”意指脱氧核糖核酸(DNA)或核糖核酸(RNA)及其单 链或双链形式的聚合物。除非特别地限定,该术语包括含有天然核苷酸的已知类似物的核 酸,所述类似物具有与参考核酸类似的结合特性,并且以与天然存在的核苷酸类似的方式 进行代谢。除非另外指明,特定的核酸序列还隐含地包括其保守地修饰的变体(例如,简 并密码子取代)、等位基因、直向同源物、单核苷酸多态性(SNP)和互补序列以及明确地指 出的序列。具体地,简并密码子取代可以通过产生如下的序列实现其中一个或多个选择 的(或全部)密码子的第三位被混合碱基和/或脱氧次黄苷残基取代(Batzer et al., Nucleic AcidRes. 19:5081(1991) ;Ohtsuka et al.,J. Biol. Chem. 260 :2605_2608 (1985) 和 Rossolini et al.,Mol. Cell. Probes 8:91-98(1994))。本文所用的术语“寡核苷酸” 一般与术语“多核苷酸”互换地使用,尽管相对较短长度的多核苷酸序列(例如,不多于50 个核苷酸,优选不多于30个核苷酸,并且更优选不多于15-20个核苷酸)通常意指“寡核苷酸”。术语“基因”意指与产生多肽链有关的基因组DNA的片段,其包括与基因产物的转 录/翻译及转录/翻译的调控有关的编码区的前和后的区域(前导区和非转录尾区)以及 单独的编码片段(外显子)之间的间插序列(内含子)。在本申请中,在样品中被分析的“靶核酸”是来源相同(例如,来自相同的染色体、 基因组座位或基因,尽管该分子可以来自一个个体或多个个体或者多于一种类型的细胞, 例如肿瘤细胞、胎盘细胞、血细胞等),但长度不同的核酸分子的集合(collection)。例如,
球蛋白编码序列的片段可以在测试样品中以可变长度的“靶核酸分子”存在。因为这些 靶核酸中的每个都含有至少一部分的球蛋白基因,所以具有与球蛋白基因中不同 位置对应(或互补)的序列的引物能够以要求保护的方法用于靶核酸的长度分析。而源自 诸如相同基因的相同来源的可变长度的核酸被共同称为“靶核酸”,所用的术语“1 ( 一 )个 靶核酸分子”意指靶核酸集合的任一成员,而不管其长度或实际序列。本文所用的“核苷酸序列特异性杂交”意指检测多核苷酸的存在和/或量的方法, 该方法基于多核苷酸在合适的杂交条件下,与已知序列的多核苷酸或寡核苷酸探针形成 Watson-Crick碱基配对的能力。这种杂交方法的实例包括DNA印迹法和RNA印迹法。本文所用的“引物”意指寡核苷酸,其能够用于诸如聚合酶链式反应(PCR)的扩增 方法,以扩增预定的靶核苷酸序列。在通常的PCR中,需要一个正向引物和一个反向引物的 至少一组引物以扩增靶多核苷酸序列。通常,当扩增由(+)链和(_)链组成的靶DNA序列 时,正向引物是能够在反应条件下与(_)链的3’末端杂交的寡核苷酸,因而能够起始新(+) 链的聚合;而反向引物是能够在反应条件下与(+)链的3’末端杂交的寡核苷酸,因而能够 起始新㈠链的聚合。例如,正向引物可以具有与⑴链的5’末端相同的序列,而反向引 物可以具有与㈠链的5’末端相同的序列本发明的方法包括使用多组正向和反向引物的扩增反应。这些扩增反应可以同时 或不同时发生。例如,当在相同的反应混合物中同时存在一组或多组引物时,扩增反应可以 与其它扩增反应“同时”发生。在另一方面,当在反应混合物中,在不同的时间补齐至少一 组引物时,扩增反应可以“连续地”发生,从而使用该特定引物组的扩增与其它扩增反应在 不同的时间发生。如在本申请中所用的,“微流体系统”意指通常是自动化系统的系统,其能够以所 需的精度操作非常小体积的流体样品。适合本发明的“微流体系统”能够精确地从流体样 品中取出一个或多个等份并将所述等份分配至分离的单独地定义的隔室(例如板上单独 的孔)。每个等份的体积通常在纳升(10_9升)至皮升(10_12升)的范围内。如在本申请中所用的,“乳液聚合酶链式反应”意指聚合酶链式反应,其中将水性 溶液的反应混合物添加至大体积的诸如油的不溶于水的第二液相中,并将该反应混合物在 扩增过程前乳化,从而反应混合物的小滴充当微反应器并因此在至少某些微反应器中实现 靶核酸更高的浓度。如在本申请中所用的,“BEAMing”(小珠、乳液、扩增和磁)意指改进的乳液PCR方 法。将至少一种PCR引物与已知的结合对的一个成员(partner)结合。例如,可以将生物 素部分与PCR中所用的正向引物结合。在每个反应隔室中提供了包被有诸如链霉抗生物素 蛋白的该结合对的另一成员的一个或多个金属小珠。当扩增步骤完成时,使来自被标记的引物的扩增子吸附至被包被的小珠上,然后能够通过磁性小珠浓缩并分离该扩增子。对于 BEAMing 更多的描述,参见,例如,Diehl et al.,Nat. Methods. 2006 Jul ;3 (7) :551_9。如在本申请中所用的,“熔融曲线分析”意指其中确定双链DNA的熔点的分析,其 通过测量表明DNA分子从双链状态向单链状态转变的可检测信号的变化来进行。通常地, 在该测定中使用诸如溴化乙锭或SYBR Green的荧光染料,其通过碱基对之间的插入,只结 合双链DNA,因而不结合单链DNA。通过逐渐地升高DNA和标记的物质(例如,SYBR Green) 的混合物的温度,同时监测标记物信号的水平进行该测定。当DNA链分离或“熔化”时,信 号输出发生快速而明显的变化。由此能够测定熔点温度。因为双链DNA分子的熔点由包括 长度、核苷酸序列以及两条链匹配的程度在内的因素决定,所以这种测定能够用于区分不 同长度和序列的DNA分子。“固相上的PCR”是产生固定在固体表面或支持物上的扩增产物的聚合酶链式反应 类型,其。“桥式扩增”是一个实例。该技术使用结合在固相上的引物用来延伸和扩增溶液 相靶核酸序列。顾名思义,该技术意指在退火步骤中,来自一个结合的引物的延伸产物形成 到其它结合的引物的桥的事实。全部扩增产物共价地结合在表面上,并且能够进行检测和 定量而不需要电泳。在一项研究中,开发了桥式系统以扩增和检测单核苷酸序列多态性。携 带5’ _氨基的引物被共价连接到二氧化硅、聚甲基丙烯酸甲酯或聚苯乙烯小珠支持物上, 并在标准PCR反应条件下用于代替溶液相引物。通过将32P_标记的三磷酸脱氧核苷酸掺 入支持物结合的形式来监测扩增反应。通过固相产物的限制酶切分析来证实正确产物的存 在。在本方案的另一变体中,通过与用一种或多种类型荧光报道分子标记的一个或多个荧 光探针杂交来检测扩增反应。发明详述本发明提供了通过使用单分子分析定量地测量不同大小的核酸分子的方法。因 此,将含有核酸的样品稀释或分级至使许多测试孔将不含有任何靶核酸分子的程度。对于 含有靶核酸分子的孔,大部分的孔只含有单个分子。然后通过扩增不同大小的靶序列的一 系列嵌套的引物扩增反应孔中所包含的核酸分子,例如,使用几组正向和反向引物的一系 列聚合酶链式反应(PCR)。扩增后,含有长核酸模板的孔将含有最长的扩增子加上全部较小 的扩增子。含有较短核酸模板的孔将产生一种或多种扩增子,其大小高达模板分子所界定 (delineate)的大小。因此,通过计数含有扩增子的每个组合的孔的数目,能够测定原始样 品中核酸分子的大小分布。这种分析的一个配置示于图1中。该配置由3个PCR引物组成引物1、引物2和 引物3。引物1和引物3形成长PCR产物。引物2和引物3形成短PCR产物。长和短PCR 产物的大小能够根据不同的应用变化。在该配置的一种形式中,长产物能够是200bp而短 产物能够是80bp。长产物还能够是,例如,100bp、150bp、250bp、300bp、350bp或450bp。短 产物的长度能够是70bp、60bp、50bp、40bp、30bp或25bp。长和短产物的大小的不同组合是 可能的,并用于不同的应用中。因此,可以同时使用所述3个引物以数字方式扩增上文中描 述的稀释或分级的核酸样品(Vogelstein and Kinzler, 1999,Proc Natl Acad Sci USA, 96, 9236-9241)(还参见,第6,440,706号、第6,753,147号美国专利以及第20050130176号、第 20060046258号(特别是第0040部分)和第20040096892号美国专利申请公开)。本发明与Diehl 等人的发明不同(Proc Natl Acad Sci USA,102,16368-16373,2005),他们使用数字PCR以及随后通过DNA测序在分别的PCR中测定血浆DNA片段的大小, 但是没有获得或分析存在于单个扩增反应中的不同大小的多个扩增子。本发明的方法既能够用于DNA靶标也能够用于RNA靶标,并且将DNA聚合酶直接 用于DNA靶标。对于RNA靶标,首先需要进行逆转录步骤。因此,能够通过使用不同的酶 的逆转录步骤及随后的DNA扩增步骤,或者使用诸如嗜热栖热菌(Thermus thermophilus) (Tth)聚合酶的酶,其既具有逆转录酶功能又具有DNA聚合酶功能(Myersand Gelfand 1991,Biochemistry, 30, 7661-7666)来扩增 RNA 靴标。如果孔含有长核酸片段并且含有引物1和引物3之间的序列,则其既具有来自引 物1/引物3的PCR产物,又具有来自引物2/引物3的PCR产物。在另一方面,如果孔含有 只包含引物2和引物3的序列的短核酸片段,则只形成来自引物2/引物3的PCR产物。能够使用许多方法检测在每个孔中形成了哪种产物。一个实例是使用琼脂糖凝胶 电泳或毛细管电泳。另一种方法是添加诸如SYBRGreen或LC Green的结合双链DNA的荧光 染料,然后进行熔融曲线分析(Ririe, et al. 1997,Anal Biochem,245,154-160 ;ffittwer, et al. 2003,Clin Chem,49,853-860)。熔融曲线分析能够用于区分由引物1/引物3和由 引物2/引物3所产生的产物。如图2所示,另一种方法是向系统中添加两种荧光探针。用不同的荧光报道分 子标记的这种方案中的两种探针能够是TaqMan探针、分子信标或者对本领域技术人员公 知的用于进行实时 PCR 的其它探针(Heid, et al. 1996,Genome Res,6,986-994 ;Lo, et al. 1998, Am J HumGenet,62,768-775)。因此,含有至少与引物1和引物3所界定的核酸片 段一样长的核酸片段的孔将产生长PCR产物(由引物1/引物3产生)并且将含有既来自 探针1又来自探针2的荧光信号。在另一方面,含有至少与引物2和引物3所界定的核酸 片段一样长,但是比引物1和引物3所界定的核酸片段短的核酸片段的孔将产生短PCR产 物(由引物2/引物3产生)并且将只含有来自探针2的荧光信号。这种实时数字PCR分 析能够在对本领域技术人员公知的任何仪器中进行,例如Applied Biosystems 7900序列 检测器(Sequence Detector)或者诸如Fluidigm BioMark系统的具有微流体芯片的实时 PCR 系统(Warren,etal. 2006,Proc Natl Acad Sci USA,103,17807-17812)或者 BioTrove 的OpenArray技术(网页是 www, biotrove. com/technologies/thru/,以及 Morrison, et al. ,2006,Nucleic Acids Res 34 :el23)。用于给孔评分的另一方法示于图3中。对于这一配置,首先使用引物1、引物 2和引物3进行数字PCR。其后,使用延伸引物1和延伸引物2,使来自每个孔的扩增产 物进行引物延伸反应,例如使用来自Sequenom的同类MassEXTEND测定(homogenous MassEXTENDassay)(Ding and Cantor 2003, Proc Natl Acad Sci USA,100,7449—7453)。 对于延伸反应,使用包含或不包含三磷酸脱氧核苷酸的三磷酸双脱氧核苷酸。在一个配置 中,如果存在长PCR产物(由引物1/引物2产生),则延伸引物1和延伸引物2都将被延 伸。在该配置中,如果只存在短PCR产物(由引物2/引物3产生),则只有延伸引物2将被 延伸。然后,例如,使用基质辅助激光解吸/电离飞行时间质谱法分析来自每个孔的延伸产 物(Ding and Cantor 2003,Proc Natl Acad SciUSA,100,7449-7453)。延伸引物 1 和延 伸引物2的设计使得这些引物的延伸形式在质谱仪中容易被区分。在其它的实施方案中, 能够用测序引物代替延伸引物,并且通过测序反应区分各自的扩增子。
上述配置仅作为示例性目的,使用了测量两种不同大小的核酸片段的量的方案。 然而,这种方法能够用于测量3种或更多种大小类别的核酸片段的浓度。图4示出这种一 般概念。在这个配置中,使用了多种正向引物引物1、引物2、引物3...至引物X。使用了 一种反向引物,引物R。如果我们有比最长的扩增子即,引物1/引物R所界定的扩增子更 长的模板核酸片段,则产生全部PCR产物。然而,短于最长的扩增子的核酸模板将产生扩增 子的子集,即,比模板的长度更短或与其相等的那些扩增子。通过计数具有这些不同类型的 PCR产物组合的每种的孔的数目,能够确定原始核酸样品的大小分布。这种多引物配置(S卩,引物1至引物X,和引物R)中的PCR产物能够使用荧光探针 来检测,每种荧光探针用不同的荧光报道分子或荧光报道分子的组合进行了标记。参见图 5。多引物延伸测定还能够用于检测这些多重PCR产物,例如,使用来自Sequenom的 同类MassEXTEND测定(Ding and Cantor 2003, ProcNatl Acad Sci USA,100,7449-7453)。 对于延伸反应,使用包括或不包括三磷酸脱氧核苷酸的三磷酸双脱氧核苷酸。在一个配置 中,如果存在长PCR产物(由引物1/引物R产生),则全部延伸引物都将被延伸(参见下文 的示意图)。在这一配置中,随着渐短的模板核酸,只有靶向各自的PCR产物的延伸引物将 被延伸。然后,使用电泳,或者通过使用诸如基质辅助激光解吸/电离飞行时间质谱法的质 谱法(Ding andCantor 2003,Proc Natl Acad Sci USA,100,7449-7453)来分析来自每孔 的延伸产物。延伸引物的设计使得它们的延伸产物在质谱仪或电泳中容易被区分。这个方 案示于图6中。在其它实施方案中,能够用测序引物代替延伸引物,并且通过测序反应区分 各自的扩增子。在上述全部配置中,我们已经借助一个方向上有两种或更多种引物,并且在相反 的方向上只有一种引物的配置示例了本发明的原理。然而,也可以在相反的方向上使用多 于一种引物来实施本发明。一个这样的配置示于图7中。在两个方向上都有多个引物的一 个优势在于,对于给定数目的引物,可能的PCR产物的数目并且因此的大小类别高于在相 反的方向上只使用一种引物的方案。例如,总共4种引物,其中2种引物在一个方向,2种引 物在相反的方向(如上所述),4个大小类别是可能的(一个最长、一个最短、以及两个中等 的类别(它们能够具有不同的大小))。在另一方面,如果3种引物在一个方向,并且只有1 种引物在相反的方向,则只有3个大小类别是可能的。与在相反方向上包括一个引物的配置类似,对于在两个方向上都使用多于1个 引物的配置,能够通过电泳、荧光探针和引物延伸及随后的质谱法来检测各种PCR产物。 而且,能够以本发明的所述的方式进行数字PCR的其它变体,其包括纳升PCR微板系统 (Morrison, et al. 2006,Nucleic Acids Res, 34, el 23)、乳液 PCR(Dressman,et al. 2003, Proc Natl Acad Sci USA,100,8817-8822)以及 polony PCR(Mitra andChurch 1999, Nucleic Acids Res,27,e34)。
实施例仅通过示例而不是限制的方式提供下文的实施例。本领域的技术人员将容易地了 解能够改变或修饰各种非关键性的参数而获得基本上相同或类似的结果。实施例1 血沉棕黄色层(buffy coat)样品和血浆样品中的DNA大小分析
10
本实施例示出本发明在比较血沉棕黄色层和血浆中的DNA的大小中的用途。如先 前所报道的,血浆DNA天然是短的(Chan et al.,见上文),而血沉棕黄色层DNA是基因组 DNA,因此预期其比血浆DNA更长。从雄性个体中获得两个血浆样品和一个血沉棕黄色层样 品。这些DNA样品应当既有X染色体序列又有Y染色体序列。在本实施例中,靶向ZFX和 ZFY基因。PCR引物和延伸引物的序列列于下文的表中引物序列 ZFX和ZFY是同源基因,因而可以通过相同的引物共扩增。在我们的测定中,通过 S延伸引物的延伸产物来区分这两个基因。本测定的配置示于图8中。将血沉棕黄色层DNA样品和两个血浆DNA样品稀释至单分子水平。通过连续稀 释DNA样品并用96孔格式的0 -球蛋白基因实时PCR测定的检测来确定对应于每孔一个 模板的 DNA 的量。使用 2X TaqManUniversal PCR Master Mix (Applied Biosystems)进 行反应,反应体积为5 u L。在每一反应中使用300nM的每种引物和200nM的探针。弓丨物序 列是 5,-GTGCACCTGACTCCTGAGGAGA-3,和 5,-CCTTGATACCAACCTGCCCAG-3,,并且探针序列 是 5,- (VIC) AAGGTGAACGTGGATGAAGTTGGTGG (TAMRA) _3,,其中 TAMRA 是 6-羧基四甲基罗丹 明(6-carboxytetramethylrhodamine)。在 ABI PRISM 7900HT 序列检测系统(Sequence Detection System) (Applied Biosystems)中进行反应,反应条件是 50°C、2min,95 °C、 lOmin,然后95°C、15s进行50个循环,以及60°C、lmin。通过数字PCR来测定模板DNA的大小。在5_uL PCR反应中扩增DNA。每个反应 包含含有 1.875mM MgCl2&1.25X HotStar Taq PCR 缓冲液(Qiagen)、另外的 1. 625mM MgCl2 (Qiagen)、dATP、dGTP和 dCTP各 50 ii M、100 ii M dUTP (Applied Biosystems)、213bp-和 82bp-扩增子的正向引物各lOOnM(Integrated DNA Technologies)、200nM反向引物以及 0. 1U HotStar Taq 聚合酶(Qiagen)。在 95°C 下开始 PCR 反应持续 15min,然后 94°C、20s, 551、308,721、11^11进行50个循环,最后在721下孵育31^11。对血沉棕黄色层样品进行 了 384个数字PCR,并且对每个血浆样品进行192个数字PCR。将PCR产物用虾碱性磷酸酶处理,其条件为0. 12 ii L虾碱性磷酸酶(Sequenom)、 0. 068 u L MassARRAY 同类 MassEXTEND (hME)缓冲液(Sequenom)和 0. 612 u L 水。将 混合物在37 °C下孵育40min,然后85 °C下孵育5min。然后进行hME测定每个反应含 有463nM 213bp-扩增子的延伸引物、771nM 82bp-扩增子的延伸引物、1. 15U热测序酶(Thermosequenase)以及 ddATP、ddCTP、ddTTP 和 dGTP (Sequenom)各 64ii M。反应条件是 94°C、2min,然后 94°C、5s,52°C、5s,以及 72°C、5s 进行 80 个循环。结果列于下文的表中。L表示存在通过延伸引物L的延伸产物,这表明存在213bp 的长PCR产物。X和Y分别表示存在来自延伸引物S的X和Y延伸产物。因此,如果单独存 在X或Y信号,则表明存在短于或等于82bp的模板DNA。相反地,L延伸产物的存在应当伴 随X信号或Y信号,这在表中表示为LX或LY。如果只存在L信号,则表示通过引物B/引物 C的短PCR或者通过S的延伸反应失败。如表中所示,在任何孔都没有发生这种情况。
上文的数据表明,血沉棕黄色层样品主要含有至少长达213bp的DNA分子,因为大 部分的孔具有LX或LY组合的信号。只有6个孔含有短X或Y信号。21个LXY孔表明这些 孔含有多于一个的分子,其中至少一个是长分子(长X或长Y分子)。相反地,如只有X信号和只有Y信号的优势所证明的,两个血浆样品主要含有短于 213bp的序列。实施例2 通过数字PCR进行的孕妇血浆中DNA的大小分析孕妇血浆中的DNA主要源自母体细胞,小部分源自胎儿(Lo,et al. 1998,Am J Hum Genet,62,768-775)。当作为整体研究总DNA时,孕妇血浆中的DNA大于未怀孕妇女血 浆中的DNA (Chan,et al. 2004,Clin Chem,50,88-92)。在另一方面,当比较母体血浆中源 自胎儿和源自母体的DNA时,则源自胎儿的DNA的大小一般小于源自母亲的DNA(Chan,et al. 2004,见上文)。本文所述的通过基于数字PCR的方法进行的大小分析允许测量母体血浆中不同 大小的DNA的相对浓度。通过其中孕妇怀有男性胎儿的模型系统说明这种方法的原理。胎 儿DNA含有X和Y染色体序列,而母体DNA含有X染色体序列,但不含有Y染色体序列。ZFX 基因被用作X染色体的标志物,而ZFY基因被用作Y染色体的标志物。该系统的配置与实施 例1中所述的系统的配置完全相同。通过引物延伸及随后的质谱法检测长和短PCR产物。 短PCR产物还能够分为源自X染色体的PCR产物和源自Y染色体的PCR产物。源自X-和 源自Y-的产物的引物延伸产物能够通过它们的质量来区分。如实施例1中所述的,能够从数字PCR系统预期不同类型的信号。因此,长PCR 产物的延伸产物L的存在表示存在至少与由引物A和引物C所界定的序列一样长的模板 DNA(或者至少与可由引物A和引物C所扩增的序列一样长,该序列能够比这两个引物所界 定的序列稍短)。预期特定的孔中L的存在将伴随X或Y或者既伴随X又伴随Y(如果在 特定的孔中有多于一个的分子)。在另一方面,如果孔含有X或Y的信号,但是不含有L的 信号,则这标明存在模板分子,其短于引物A和引物C所界定的序列,但长于引物B和引物 C所界定的序列。
因为胎儿DNA富含较短的DNA片段,所以预期对Y ( S卩,胎儿)信号是阳性、但没有 L信号的孔的比例高于对Y和L信号都是阳性的孔的对应比例。换言之,本发明将允许选择 性地集中在含有特定大小的模板分子的孔的子集。为了示例上文的概念,使用这个系统进行母体血浆样品的试验。结果列于下文的 表中 可以看出,大部分含有Y染色体(即,胎儿DNA)的孔含有短模板DNA,这由它们含 有指示短DNA的Y信号,而不含指示长DNA的LY信号组合的事实所证明。含有LX信号组 合的相对大量的孔主要含有源自孕妇(即,非胎儿DNA)的DNA。作为通过数字PCR的大 小分析的用途的示例,对于实例M2891P,没有进行大小分析时,384个孔中的22个孔(即, 5.7%)含有Y特异性(S卩,胎儿)信号。在另一方面,当检查含有短模板DNA的孔(即, 那些具有X信号或Y信号,但是没有L信号的孔)时,具有Y特异性信号的孔的比例增加至 16/(16+97),即 14. 1%。这种方法的优势在于,能够容易地改变感兴趣的大小窗口。例如,通过进一步降低 短PCR的大小,例如,降低至60bp、50bp或40bp以及更低,能够进一步增加显示出胎儿特异 性信号的孔。类似地,还能够容易地将长PCR的大小变为150bp至200bp或lOObp至149bp。这种方法比诸如电泳(Li, et al. 2004,Clin Chem,50,1002-1011)的以前报道的 方法有明显的优势,因为电泳步骤以及电泳后的DNA收获具有潜在地被污染倾向。本发明的方法能够与增加母体血浆中胎儿DNA的微量浓度的现有方法,例如,电 泳(Li,et al. 2004, Clin Chem,50,1002-1011)协同作用,以及与使用甲醛或其它添加剂以 抑制母体血浆中源自母体的DNA的浓度(Dhallan,et al. 2004,JAMA, 291,1114-1119)协同 作用。实施例3 通过甲基化敏感限制性内切酶处理进行甲基化分析取决于靶序列处或靶序列周围的DNA甲基化状态,某些限制性内切酶将切割或不 切割它们的靶序列。大部分甲基化敏感限制性内切酶切割未甲基化的序列,但是不切割甲 基化的序列。还有诸如McrBC的相对少量的酶切割甲基化的序列,使未甲基化的序列保持 完整(Sutherland, et al. 1992,J Mol Biol,225,327-348)。无论在哪种情况下,限制酶切的DNA片段比未切割的模板更短。因此,本发明能够 用于获得关于被切割和未被切割的DNA分子的定量信息。在本实施例中,将编码maspin的基因SERPINB5作为例子(Dokras,et al. 2002, Placenta, 23, 274-280)。SERPINB5在胎盘中是低甲基化的,而在孕妇的血细胞中是高度甲 基化的(Chim,et al. 2005, Proc Natl Acad Sci USA,102,14753-14758)。在图9所示的方案中,设计了两种正向引物(引物1和引物2)和一种反向引物。 一种正向引物(引物1)位于甲基化敏感限制性内切酶的限制位点的上游,例如SERPINB5 基因的-178位的Hpall位点的上游。如图中所示,当诸如Hpall的甲基化敏感限制性内 切酶切割血浆DNA时,高度甲基化的母体血细胞DNA不会被切割。在另一方面,对于低甲基化的胎儿(胎盘)DNA,Hpall将切割该位点。对于使用这种策略的母体血浆DNA的数字 PCR分析,按照文献所述提取母体血浆DNA(Lo,et al. 1998, Am J Hum Genet,62,768-775), 然后用Hpall酶消化该血浆DNA。然后通过使用引物2和引物3,加上这两个引物之间的 TaqMan探针的实时PCR定量Hpall处理的血浆DNA。然后,将Hpall处理的血浆DNA稀释 以用于随后的数字PCR分析,并且平均每个反应孔只含有一个能够用引物2和引物3扩增 的SERPINB5分子。然后,使用引物1、引物2和引物3的组合,对稀释的Hpall处理的血浆 DNA进行数字PCR分析。还添加两种TaqMan或杂交探针,一种探针靶向引物2和引物3之 间的序列,另一种探针跨越引物1和引物2之间的Hpall限制位点。用不同荧光报道分子 标记这两种探针,例如用FAM标记一种探针,而用VIC标记另一种探针。如果孔含有包含母 体SERPINB5序列的分子,则来自两种探针的信号都将存在。另一方面,如果孔含有包含胎 儿SERPINB5序列的分子,则只存在来自引物2和引物3之间的探针的信号。因此,含有胎 儿信号模式的孔的数目的计数将允许我们计数胎儿SERPINB5分子的数目。为了示例上述概念的实用性,在试验室中进行了下文的实施例。测定设计长和短SERPINB5测定使用两种正向引物(Mpn_正向L和Mpn_正向S) 和一种共用的反向引物(Mpn_反向)。长和短PCR产物的检测分别取决于探针Mpn_探针L 和Mpn_探针S。甲基化敏感限制性内切核酸酶的酶切位点位于Mpn_探针L和Mpn_正向S 之间。因此,预期两个PCR产物在模拟消化(mock-digested)的DNA样品中都是可检测的。 随着限制性内切酶的添加,预期低甲基化的DNA样品的长信号的检测将减少。引物和探针 的序列如下所示引物和探针序列 甲基化敏感限制性内切酶消化于37°C下,在20iiL的反应混合物中,使用甲基化 敏感限制性内切核酸酶,Hpall (New EnglandBiolabs)将母体血细胞DNA和胎盘DNA样品 消化16小时。将100 u g的每个DNA样品用20U的Hpall酶消化。每个样品包括了模拟消 化的等份。对于模拟消化,使等量的DNA置于相同的消化条件下,但不添加酶。7900平台上的实时PCR 在来自两对母体血细胞和胎盘的模拟消化和Hpall消化 的DNA样品上成对地进行长和短SERPINB5测定。每个5 y L实时PCR包括1X TaqMan Universal PCR Master Mix(AppliedBiosystems)、TaqMan 探针 L 和探针 S(Applied Biosystems)各 62. 5nM、正向引物 L(Integrated DNA Technologies)和通用反向引 物(Integrated DNA Technologies)各 900nM 以及 450nM 正向引物 S (Integrated DNATechnologies) 0每个样品总共进行32个重复,其中每个反应加入6. 25pg DNA。热模式 (thermal profile)为 50°C、2min,95°C、lOmin,然后 95°C、15s 进行 50 个循环,以及 60°C、 lmin。Fluidigm平台上的实时PCR 在来自一对母体血细胞和胎盘的模拟消化和Hpall 消化的DNA样品上进行SERPINB5启动子序列的数字PCR。对于每个面板(panel)(相当于 765 个反应孑L),将 IX TaqMan Universal PCR Master Mix (Applied Biosystems)、 TaqMan 探针 L 和探针 S (Applied Biosystems)各 31. 25nM、正向引物 L(Integrated DNATechnologies)和通用反向引物(Integrated DNA Technologies)各 900nM 以及 450nM 正向引物 S (Integrated DNA Technologies)与 3. 5ng DNA样品混合。热模式是50°C、2min, 95°C、lOmin,然后 95°C、15s 进行 40 个循环,以及 58°C、lmin。MM7900平台上的实时PCR 对于进行和未进行酶消化的母体血细胞DNA,检测的长和 短SERPINB5分子的水平类似。对于两个胎盘样品,酶消化后可检测的长DNA分子的水平降 低,而进行和未进行酶消化的短DNA的水平保持类似。
Fluidigm平台上的实时PCR 对于进行和未进行酶消化的母体血细胞DNA,检测的 长和短SERPINB5分子的水平类似。对于胎盘样品,酶消化后可检测的长DNA分子的数目降 低,而进行和未进行酶消化的短DNA的数目保持类似。 利用这一原则,还能够开发用于检测甲基化状态与SERPINB5相反的胎儿DNA分子 的系统。一种这样的DNA靶标是RASSF1A基因,其在胎盘中是高度甲基化的,但在母体血细 胞中是低甲基化的(Chan,et al. 2006,Clin Chem,52,2211-2218 ;Chiu,et al. 2007,Am J Pathol, 170,941-950),即用于计数母体血浆中源自胎儿的RASSF1A序列。用切割未甲基化 的母体RASSF1A而留下完整的胎儿序列的限制性内切酶切割后,能够用本发明中所述的基 于数字PCR的大小分析系统来分析限制性酶切产物。在这种条件下,将通过特定的孔中的 两种探针信号的存在来确定胎儿部分。对本领域技术人员显而易见的是,结合SERPINB5与RASSF1A系统这两者的多 重PCR系统将是可能的,并且用不同的报道分子标记四种荧光探针的每一种。可选择地, 能够将SERPINB5和RASSF1A系统单独地应用于不同的数字PCR分析。在任一方案中,将只对源自胎儿的SERPINB5序列是阳性的孔的数目与只对源自胎儿的RASSF1A序列是 阳性的孔的数目进行比较。这些数目的比值或差异将表明胎儿是否具有18三体性。这 些数目(SERPINB5/RASSF1A)增加的比值预示18三体性。序贯概率比检验(Sequential Probability Ratio Test) (Zhou et al.2001, Nat Biotechnol,19,78-81 ;Zhou, et al. 2002, Lancet, 359, 219-225)或其它本领域技术人员熟知的统计学方法能够用于为诊断 18三体性的可信度提供统计学证据。图9所示的方案能够用于检测母体血浆中的其它胎儿特异性序列,只要能够找到 能够区分胎儿与母体核酸的酶切位点(例如,甲基化敏感限制性内切酶的酶切位点,但也 能够使用其它的酶)。如实施例1和2中所示,除了使用荧光探针检测不同的PCR产物以夕卜,还可以使用 引物延伸反应以及随后的质谱法。实施例4 从母体血浆中检测胎儿染色体非整倍性在另一项研究中,我们最近证明了使用数字相对染色体剂量(RCD)检测非整倍 体和整倍体DNA的混合物中非整倍体DNA的存在的可行性(Lo YMD,Lun FMF,Chan KCA, Tsui NBY, Chong KC, Lau TK, Leung TY, Zee BCY, Cantor CR, Chiu RWK. Digital PCR for themolecular detection of fetal chromosomal aneuploidy (用于胎儿染色体非整倍性 分子检测的数字 PCR). Proc. Natl. Acad. Sci. U. S. A. 104 :13116_13121,2007)。非整倍体 DNA的一个实例是从患有21三体性(Down综合征)的个体获得的非整倍体DNA。非整倍体 和整倍体DNA的混合物的一个实例是从怀有患有21三体性的胎儿的孕妇获得的母体血浆 DNA。对于数字RCD分析,胎儿DNA的比例越高,检测非整倍体DNA的存在所需的数字 PCR测定的数目就越少。因此,本发明的用途将允许我们集中于母体血浆中特定大小范围的 DNA分子的亚群,其中,源自胎儿的DNA分子的部分浓度(fractional concentration)高于 母体血浆中的总DNA中的该浓度。作为本发明用于检测来自母体血浆的胎儿染色体非整倍性的用途的示例,使用 了图10所示的设计。引物1、引物2和引物3靶向种内同源基因座(paralogous loci) (Deutsch, et al. 2004,J Med Genet,41,908-915),例如位于染色体 21 和染色体 1 上的一 对基因座。在后一个实施例中,染色体21和染色体1上的基因座彼此具有明显的同源性, 而只有相对少量的核苷酸不同。因此,引物1、引物2和引物3的设计使得两个种内同源基 因具有实际上相同的序列。两个引物对(1)引物1/引物3(长PCR产物)和(2)引物2/ 引物3(短PCR产物)都将扩增染色体21和染色体1的种内同源基因。设计延伸引物1使 它会结合并延伸来自任一种内同源基因的引物1/引物3 PCR产物。来自每个种内同源基 因的延伸引物1的延伸产物不必是互相区分的。延伸引物2被设计成结合两个种内同源基 因的PCR产物。设计延伸引物2的靶位点使得延伸后,来自染色体21和染色体1的种内同 源基因的延伸产物可互相区分。该分析的第一个步骤是将样品DNA稀释至大部分反应孔将不扩增或只扩增单一 模板分子的程度。然后,进行使用引物1、引物2和引物3的PCR扩增。然后进行使用延伸 引物1和延伸引物2的大规模延伸反应。然后通过诸如使用基质辅助激光解吸/电离质谱 法(Ding andCantor 2003,Proc Natl Acad Sci USA,100,7449-7453)的质谱法来分析来自每个孔的延伸产物,如果其存在的话。来自每个孔的质谱将告诉我们,在扩增前,该孔含 有何种模板分子。因此,显示出延伸引物1的延伸产物的任何孔表明其含有长度至少与引 物1和引物3所界定的长度一样长的模板DNA分子。含有延伸引物1产物的孔也被预期含 有延伸引物2的延伸产物。相反地,只含有延伸引物2的延伸产物(如果其存在的话),但是不含有来自延伸 引物1的延伸产物的任何孔表明它含有短DNA模板。短DNA至少与引物2和引物3所界定 的序列一样长,但是比引物1和引物3所界定的序列短。延伸引物2的延伸产物的质量将 表明产物是否源自染色体21或染色体1共生同源基因。因为母体血浆中的胎儿DNA比源自母体的对应部分相对更短(Chan,et al. 2004, Clin Chem, 50,88-92),所以对于胎儿21三体性的无创产前诊断,将分析集中在只显示延伸 引物2产物而没有显示延伸引物1产物的孔的子集将是有利的。含有源自胎儿的模板DNA 的这些孔的比例将高于考虑全部孔而不考虑这种大小分析的结果的比例。这种集中的孔 的子集还能够再分为显示染色体21信号的子集和显示染色体1信号的子集。如果胎儿具 有21三体性,与显示染色体1信号的孔的数目相比,显示染色体21信号的孔的数目应当是 过多表现的(overr印resented)。能够通过许多方法获得这种过多表现的统计学证据,这 些方法包括序贯概率比检验(SPRT) (Zhou, et al. 2001,NatBiotechnol,19,78-81 ;Zhou, et al. 2002,Lancet,359,219-225 ;Lo YMD, Lun FMF, Chan KCA, Tsui NBY, Chong KC, Lau TK,Leung TY,ZeeBCY,Cantor CR,Chiu RWK. Digital PCR for the molecular detection offetal chromosomal aneuploidy (用于胎儿染色体非整倍性分子检测的数字PCR). Proc. Natl. Acad. Sci. U. S. A. 104 :13116-13121,2007)、假发现率(El Karoui, et al. 2006,Stat Med,25,3124-3133)等。仅通过示例,而不是作为对本发明的限制描述了使用共生同源序列作为靶标的上 文的实施例。能够使用染色体21和参考染色体的单独引物和延伸引物来实施本发明。在 这种配置中,将三个引物的每一个用于染色体21和参考染色体。实际上可以使用多于三个 的引物以覆盖数字分析的大小范围。而且,除了 21三体性以外,通过靶向与非整倍性有关 的染色体,例如,18三体性中的染色体18、13三体性中的染色体13、性染色体非整倍性的染 色体X和染色体Y,这种方法能够用于检测其它染色体非整倍性。除了数字RCD以外,本发明还用于增强其它方法的稳健度,所述方法已被描述为 用于从母体血浆中检测胎儿染色体非整倍性,例如,在潜在的非整倍体和参考染色体上表 现出单核苷酸多态性的等位基因比率(allelic ratio)的应用(Dhallan,et al. 2007, Lancet, 369,474-481),以及胎儿特异性核酸种类的等位基因比率的应,例如,使用胎儿特 异性甲基化识别标志(Tong, et al. 2006,Clin Chem,52,2194-2202)。实施例5 病毒核酸的大小分析本发明所述的数字大小测量技术能够用于病毒核酸的大小分析。这种大小分析将 为病毒感染有关的疾病,其包括但不限于与病毒感染有关的癌症,提供诊断和监测信息。病 毒感染的实例包括鼻咽癌(NPC)、某些淋巴癌(例如,Hodgkin淋巴癌和NK细胞淋巴癌)以 及某些胃癌中的EB病毒、宫颈癌中的人乳头状瘤病毒(HPV)以及肝细胞癌中的乙型肝炎病 毒(HBV)。作为这种应用的实例,图11中所示的引物和探针配置被设计成靶向EBV基因组中
17的序列,如BamHI-W片段中的序列,或EBNA-I基因中的序列。当将这种系统应用于具有长EBV DNA的样品,甚至是完整的病毒粒子时,与诸如 来自NPC患者的血浆的具有短EBV DNA的样品相比,长DNA的比例将降低,而短DNA的比 例将增加。在大约96%的NPC患者和7%的未患有NPC的个体的血浆中已经检测到了 EBVDNA(Lo, et al. 1999,Cancer Res,59,1188-1191)。该数字大小测量系统能够用于区分 NPC患者与未患有癌症的个体的血浆中的EBV DNA。作为示例如何实现这个目的,能够开发 用于EBV DNA的数字大小测量系统。能够将该系统应用于面临患NPC风险的个体的血浆。 当不使用该数字大小测量系统时,预期大约的个体的血浆是EBV DNA阳性的,即使他们 没有患NPC(Lo,et al. 1999,Cancer Res,59,1188-1191)。当使用该数字大小测量系统时, 能够确立血浆中长和短EBV DNA片段的相对和绝对浓度。能够从一组NPC患者和一组被认 为面临患NPC高风险的NPC个体的范围中确定血浆中的长和短EBVDNA片段的绝对和/或 相对浓度的参考范围。相反地,具有正常个体范围内的值的那些个体被认为是低NPC风险 的。预期该数字大小测量的使用将降低用诸如鼻咽内窥镜检查的额外研究步骤研究后一组 个体的成本。这一系统还可以用于与EBV有关的其它癌症,例如某些淋巴癌(Lei,et al., 2002,Clin Cancer Res 8 :29_34 禾口 Lei et al. ,2000, Br JHaematol 111:239—246)实施例6 含有与肿瘤有关的分子改变的核酸的大小分析许多分子改变与肿瘤过程有关,该分子改变包括癌基因突变(例如,KRAS突变) (Anker, et al. 1997,Gastroenterology,112,1114-1120)、癌基因扩增(例如,erbB-2 扩 增)(Chiang,et al. 1999,ClinCancer Res,5,1381-1386)以及肿瘤抑制基因的启动子过 度甲基化(例如,pl6 和 RASSF1A 过度甲基化)(Baylin, et al. 2001,Hum Mol Genet, 10, 687-692 ;Hesson,et al. 2007, Dis Markers, 23, 73-87 ;ffong,et al. 1999,Cancer Res,59, 71-73)。与癌症检测和监测的特别相关的是在癌症患者的体液中也观察到了许多这种变 化,所述体液包括血液(包括其各种成分,包括血浆和血清)、尿、唾液、腹膜液等。许多这 些液体含有肿瘤和非肿瘤核酸的混合物。预期这两类核酸具有不同的大小。而且,与未患 有癌症的个体相比,癌症患者在诸如血浆的某些体液中还具有DNA的不同的总体大小分布 (Jiang, et al. 2006, Int J Cancer,119,2673-2676)。因此,本文所述的数字大小测量技术 还能够用于检测、监测和预测癌症患者。作为本技术的应用的示例,构建了图12中所示的实施例。在这个实施例中,诸如 KRAS的癌基因中的突变是待检测的。构建了关于KRAS基因的引物和探针序列。探针2和探针3的设计使得它们能够 区分KRAS基因的突变(探针2)或野生型(探针3)序列的存在。用不同的荧光报道分子 标记探针1、探针2和探针3。因此,数字PCR分析后,相当比例的孔将不含有任何信号。对 于具有探针信号的那些孔,具有来自探针1的信号的任何孔将预示长模板DNA的存在。这 种探针1信号将伴随来自探针2 (如果存在突变体模板)或探针3 (如果存在野生型模板) 的信号。如果在孔中有多于一个的模板分子,则探针2和探针3信号都有可能同时存在。如 果不存在来自探针1的信号,则表明该孔中存在短模板分子。在这个孔中,探针2或探针3 信号的存在将分别表明存在短突变体模板或短野生型模板。还能够利用引物延伸以及随后的质谱法来实施这一系统。在该系统中,将用延伸 引物1代替探针1,能够用单一延伸引物2代替探针2和探针3。延伸引物2能够被设计成在突变的5’的一个碱基处终止,从而通过分子量区分来自突变体和野生型模板的延伸产 物。还有可能的是,构建的系统使长模板能够通过荧光探针检测,而通过引物延伸以 及随后的质谱法来区分突变体和野生型模板。本领域的技术人员能够根据本文所述的核心 发明构建变体。在检测体液中的癌基因扩增时,数字大小测量技术能够用于鉴定最容易观察与肿 瘤有关的癌基因扩增的大小窗。实施例7 通过基于数字PCR的大小分析的短核酸片段的集中分析方法通过设计指定某些长度组合的扩增子的PCR引物,能够在更大的核酸分子群中实 现预定大小窗的核酸分子的亚群的选择性分析。通过表示母体血浆中胎儿DNA的选择性富 集示例这种情况。母体血浆中的循环胎儿DNA以前被报道为长度短于母体来源的DNA分子 的长度(Chan et al. ,2004 Clin Chem,50,88-92)。为了在母体血浆中的长母体DNA分子 中选择性地区分短胎儿DNA分子,研究了用于检测母体血浆中的长或短DNA模板的多种PCR 扩增子大小。从怀有男性胎儿的孕妇中收集母体血浆。指定213bp至51bp扩增子大小的 6个PCR测定被设计成针对ZFX和ZFY基因区域。X染色体上ZFX靶标既存在于母体基因 组中,又存在于胎儿基因组中。Y染色体上的ZFY靶标只存在于胎儿基因组中。扩增子长度 和PCR及延伸引物的序列示于下文的表格中。 a,这些测定的命名方式是,由下划线分隔的前面的数和后面的数分别表明多重测 定中长和短PCR测定的扩增子的大小b,引物序列如下所示 在384孔的格式中进行数字PCR。如实施例1中所述,进行引物延伸测定并在质谱 系统(Sequenom)中测定大小特异性的延伸产物。通过检测相关的大小特异性延伸产物来 确定检测的DNA分子的大小。使用短延伸引物S-a或S-b,ZFX或ZFY基因将产生不同质量 的延伸产物。ZFX或ZFY的基因片段的鉴定基于短扩增子内的相关延伸产物的检测。MS在本研究的第一部分中,在三个妊娠末三个月母体血浆样品中,研究了不同大小 的短和长扩增子的组合的6个PCR测定。使用实施例1所述的两种方法计算胎儿DNA百分 比。首先利用含有X特异性信号和Y特异性信号的孔计算该百分比,而不考虑大小。然后 利用只显示短DNA扩增子的信号的孔重新计算该百分比。如图13所示,与同时利用长分子 和短分子计算的部分胎儿DNA浓度(fractional fetal DNAconcentration)相比,只利用 短DNA分子计算的部分胎儿DNA浓度更高。还计算了达到的部分胎儿DNA浓度或富集百分 比的增量。图13d示出三个血浆样品的平均结果。测定179_64和213_82表现出通过这种 大小分析策略的最大增量,而测定213_51在该实施例评价的6个测定中表现出最高的胎儿 百分比。因此,选择这三个测定用于来自更早孕龄的母体血浆样品的进一步研究。在本研究的第二部分中,在四个妊娠前三个月的母体血浆样品中研究了测定 179_64、213_51和213_82。通过这种大小分析策略的部分胎儿DNA浓度和富集百分比示于 图14中。如示出4个母体血浆样品的平均数据的图14e所示,测定179_64表现出最高的 富集百分比。该结果证明179bp和64bp扩增子的组合表现出区分母体血浆中母体和胎儿 分子的最强能力,从而获得最大程度的胎儿DNA富集。在本研究的第三部分中,还在总共10个妊娠前三个月的母体血浆样品中研究了 测定179_64。结果列于下文的表中。通过使用大小测量策略,计算的部分胎儿DNA浓度平 均增加了 36%。
从全部片段计算的胎儿%实施例8 母体血浆中的胎儿单核苷酸多态性的DNA大小分析方法还将母体血浆胎儿DNA定量的大小分析策略用于母体血浆中胎儿SNP的检测。将 PLAC4上的多态性SNP(rs8130833)用于区分来源于胎儿和来源于母体的DNA分子。设计了 扩增子大小为179bp和63bp的双重PCR测定。通过63bp-测定扩增PLAC4 SNP。引物的序 列列于下文的表中正向PCR引物(5,至3,)长扩增子短扩增子反向PCR引物(5,至3,)延伸引物(5,至3,)长扩增子短扩增子
ACGTTGGATGGCCTGGAAGTAACGTGATCC ACGTTGGATGTAGAACCATGTTTAGGCCAG ACGTTGGATGGCAACACCATTTGGGTTAAAT
AGTATAGAGCCATAAAAGCC AGGCCAGATATATTCGTC 收集来自10位孕妇的妊娠首三月的血浆样品。这些女性具有与她们所怀的胎儿 不同的SNP的基因型。在384孔的格式中进行数字PCR。然后如在实施例1中所述的,进行 引物延伸测定,并使用质谱法(Sequenom)确定从短或长扩增子产生的延伸产物。基于短扩 增子的延伸产物的质量来区分SNP等位基因。MM结果示于下文的表中。与从同时含有短DNA片段和长DNA片段的孔计算的胎儿特 异性SNP等位基因的部分浓度相比,使用只含有短扩增子的信号的孔计算的该部分浓度平 均增加了 31%。
21 如果胎儿SNP是致病突变,例如导致地中海贫血症、镰形细胞贫血或血红蛋白 E疾病的0 -球蛋白基因中的SNP或者导致囊性纤维化的囊性纤维化跨膜传导调节因子基 因中的SNP,也能使用这种方法。出于所有的目的,本申请中引用的全部专利、专利申请和其它出版物,包括公开的 氨基酸或多核苷酸序列,都通过弓I用的方式以其整体并入本文。
权利要求
分析样品中核酸的方法,其包括下述步骤(i)从所述样品制备多个相等的组分,其中多于50%的所述组分中每组分含有不多于1个靶核酸分子;(ii)使用至少一种正向引物与至少两种反向引物,或者使用至少两种正向引物与至少一种反向引物在每个组分中进行扩增反应,其中每种所述正向或反向引物具有不同并且确定的核苷酸序列;(iii)在每个组分中检测从每对正向和反向引物扩增的核苷酸序列;以及(iv)计数检测出从不同对的正向和反向引物扩增的核苷酸序列的不同组合的组分的数目,从而确定所述样品中不同长度的所述靶核苷酸的相对量。
2.如权利要求1所述的方法,其中所述多个相等组分是来自所述样品的多个相等的稀 释物。
3.如权利要求1所述的方法,其中步骤(i)是通过微流体系统进行的。
4.如权利要求1所述的方法,其中所述扩增反应是聚合酶链式反应(PCR)。
5.如权利要求4所述的方法,其中所述PCR是实时PCR。
6.如权利要求4所述的方法,其中在所述PCR中存在荧光染料。
7.如权利要求6所述的方法,其中所述荧光染料是SYBRGreen或LC Green。
8.如权利要求1所述的方法,其还包括在步骤(i)或步骤(ii)前的逆转录步骤。
9.如权利要求1所述的方法,其中所述从不同对的正向和反向引物扩增的核苷酸序列 具有不同的长度。
10.如权利要求1所述的方法,其中步骤(ii)是通过乳液聚合酶链式反应进行的。
11.如权利要求1所述的方法,其中步骤(iii)是通过熔融曲线分析进行的。
12.如权利要求9所述的方法,其中步骤(iii)是通过电泳进行的。
13.如权利要求1所述的方法,其中步骤(iii)是通过利用带有可检测标记物的探针的 序列特异性杂交进行的,其中每种探针具有不同的可检测标记物并且特异性地与从一对正 向和反向引物扩增的核苷酸序列杂交。
14.如权利要求13所述的方法,其中所述可检测标记物是不同的荧光分子。
15.如权利要求1所述的方法,其中步骤(iii)是通过引物延伸反应或通过测序反应进 行的。
16.如权利要求15所述的方法,其中所述引物延伸反应的产物通过质谱法检测。
17.如权利要求1所述的方法,其中步骤(iii)是通过流式细胞术进行的。
18.如权利要求1所述的方法,其中步骤(ii)和(iii)是通过BEAMing进行的。
19.如权利要求1所述的方法,其中步骤(ii)中的所述扩增反应使用不同对的正向和 反向引物连续地进行。
20.如权利要求1所述的方法,其中步骤(ii)中的所述扩增反应使用不同对的正向和 反向引物同时进行。
21.如权利要求1所述的方法,其中所述样品来自孕妇。
22.如权利要求21所述的方法,其中所述样品是血液、血浆、血清、唾液或宫颈灌洗样品。
23.如权利要求21所述的方法,其中每个所述靶核酸包含染色体13、18、21、X或Y的至少一部分。
24.如权利要求21所述的方法,其中每个所述靶核酸包含与遗传疾病或遗传多态性有 关的基因的至少一部分。
25.如权利要求24所述的方法,其中所述基因是球蛋白基因或囊性纤维化跨膜传 导调节因子基因。
26.如权利要求24所述的方法,其中所述遗传多态性是单核苷酸多态性(SNP)。
27.如权利要求1所述的方法,其中所述样品来自癌症患者。
28.如权利要求27所述的方法,其中所述癌症是鼻咽癌、淋巴癌、肝细胞癌或宫颈癌。
29.如权利要求27所述的方法,其中所述样品是血液、血浆、血清、唾液或肿瘤组织。
30.如权利要求27所述的方法,其中每个所述靶核酸包含癌基因或肿瘤抑制基因的至 少一部分。
31.如权利要求30所述的方法,其中所述癌基因或肿瘤抑制基因是KRAS、erbB-2,pl6 或 RASSF1A。
32.如权利要求1所述的方法,其中每个所述靶核酸来自病毒基因组。
33.如权利要求32所述的方法,其中所述病毒是EB病毒、人乳头状瘤病毒或乙型肝炎病毒。
全文摘要
本发明提供了分析核酸长度和核酸在样品中的相对丰度的方法,该方法基于个别模板分子的数字扩增。本发明具有许多应用,其包括在无创产前诊断、移植监测以及癌症和与病毒有关的疾病的检测和监测中的应用。
文档编号C12Q1/68GK101855363SQ200880101668
公开日2010年10月6日 申请日期2008年8月1日 优先权日2007年8月3日
发明者卢煜明, 赵慧君 申请人:香港中文大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1