确定样品中序列多度的方法

文档序号:440043阅读:269来源:国知局
专利名称:确定样品中序列多度的方法
技术领域
本发明涉及一种确定样品中预先确定的序列或多个与该预先确定的序列相同或几乎相同的(同源的)序列的多度的方法。
背景技术
除了序列分析外,定量分析核酸是分子医学中的重要挑战。为了根本上认识细胞、组织和器官的生物学,必须了解例如在DNA层面上或其转录本(RNA层面)上基因序列的组成和多度。生物体之间的个体性差异以及基因引起的疾病和倾向的原因在于序列差异(突变,例如缺失、插入)和多度,序列以该多度存在。因此,对基因组(DNA)和转录本组(Transkriptoms,RNA)的定量分析成为分子医学的中心问题。
全部基因信息固定在生物体的基因组中。信息载体(具有碱基次序G、A、T和C的核酸的基因序列;=DNA)的改变可以表现为疾病。对于确定的序列片段的定量说明常常是诊断所必须的。归因于基因序列不同多度的病症实例是多种多样的全染色体的三体性/单体性三染色体21,唐氏综合症涉及全染色体(21),每个细胞存在3个模版(不是2个模版)。
重复单元亨廷顿舞蹈病某一单元(CAG)直接连接存在于超过37个模版中。形成疾病的倾向随这种单元重复数而升高。个体中不稳定的三核序列的其它例子是肯尼迪综合症或脊髓小脑运动失调1。
小序列片段的染色体微缺失数量增多的临床综合症表明,染色体微缺失起到一定作用。存在大量实例,如沃-赫综合症(缺失4p16.3)、威-拜综合症(7q11.23,与全部基因缺失有关)或者普-拉-威综合症(15q11-q13),它们仅涉及父系基因。微重复较少见,因为方法原因目前发现这样的片段很困难。
点突变很多病症的出现准确地说是因为一个碱基位置发生改变,这引起所得蛋白质的功能受损。即使对于这种情况(单核苷酸多态性,SNPs),定量说明也具有决定性意义,因为突变或等位基因不存在于所有细胞中,或者可以不同频度地表达。不位于基因序列中的这种突变非常频繁地存在于基因组中,通常不导致病症。因此其适合作为标记物,因为很多肿瘤细胞易于丧失两个双亲等位基因中的一个(失去杂合性,LOH)。观察到两个原始的序列变体中仅存在一个对肿瘤诊断有潜在的非常的意义。数字PCR属于方法研究进展,可靠并定量理解该症状(US 6,440,706 B1)。
在所有所述的实施例中通过对序列片段量化来进行分子诊断,即,必须证实样品中含有预先确定的序列的频数。
现有技术今天,在诊断和研究中主要使用以下方法来解决上述关于DNA的任务US 5,817,462公开了染色体特异性探针分子用于Wege FISH方法中的原位杂交(荧光原位杂交)。通过不同荧光团的不同组合可以同时证实所有的人染色体。
待分析的染色体与染料标记的杂交探针接触,因此可以发现序列互补的片段。在序列特异性杂交后,进行洗涤步骤,然后在荧光显微镜下评价细胞的荧光信号。如果存在荧光信号,则该序列也存在,因此,例如可以推断存在完整的染色体。如果不存在荧光信号,则或者缺少该染色体,或者该探针区域存在微缺失。现在,通过FISH可以平行确定一个基因组内多个不同序列的模版数,通过所用的荧光染料在进行评价时区别这些序列。该数量受可同时使用的荧光染料数的限制。通常研究全部具有相同遗传状态的细胞群。
FISH分析很难确认有效。DE Rooney编辑,2001人细胞遗传学构成分析(Human Cytogenetics Constitutional Analysis),牛津大学出版社,该书中为了解释FISH分析结果,指出“应该选择用于分裂间期分析的样品,以高效率(>90%)进行杂交”。一方面,这意味着必须计数至少100个细胞,另一方面,以上论述通常排除了通过FISH进行单细胞诊断。该方法不适用于单细胞诊断。
其中可以平行确定多个序列的模版数的另一种方法是CGH(比较基因组杂交,WO 00/24925,Karyotyping Means and Methods)。在此,用一种荧光染料(例如红色)标记患者DNA,用第二种染料(例如绿色)标记参比DNA。混合同样量的不同DNA群,并随着染色体的扩散而在玻璃表面杂交。互补链将竞争该染色体片段上的结合位点。如果序列片段在患者DNA和参比DNA中同样多,则显示染色体相应杂交位点上绿色和红色之比为1∶1。如果一种颜色占主导,则表明患者DNA或者复制或者缺失相应的片段。在荧光显微镜中分析染色体的扩散,荧光显微镜限制了方法的分辨率,其分辨率约为10~30Mb(1Mb=1兆碱基=106序列组成单位)。在染色体扩散的CGH情况下,单个染色体上的确定序列只能准确地结合一个(红色或绿色标记的)探针。只是该方法的差的空间分辨率会导致同时获得多个信号,可以对之进行统计性比例分析。
所述方法的一种特别方式是矩阵CGH(芯片(Chip)或阵列格式(ArrayFormat)),其中代替染色体的扩散,基因片段以离散的DNA阵列测量点的形式存在。在此也进行两种杂交信号的强度对比。对于CGH,要么必须使样品扩增(例如通过PCR),要么必须存在多个名义上相同的细胞。
定量的实时PCR法原则上适于证实最少量的核酸(原则上是序列的模版)。所述定量分析是通过内标物实现的(Hagen-Mann,K.&Mann,W.(1995)RT-PCRand alternative methods to PCRfor in vitro amplification ofnucleic acids.Exp.Clin.Endocrinol.103150-155)。该方法用于常规诊断。但起始材料的量不能任意减小,因为用少量起始分子(10-100)作为起始材料,会由于指数扩增而使得随机误差很大,不再能进行定量说明。
除了PCR外还提供了基于酶的其它扩增方法,其在所述范围内不能定量说明(例如NASBA、LCR、SDA RT-PCR或Qβ-复制酶;bersicht inHagen-Mann&Mann 1995)。
上述所有方法在定量分析序列时都有不同缺点,因此不适于绝对性说明模版数。
现在并不存在用以计数序列片段(在0、1、2、3到约10范围内)的简便并可靠的方法,因为两种发展完全相反地进行a)没有进行扩增而工作,这样就需要大量细胞(通常对于CGH而言,数量为106);另外,荧光是不可测的。由于杂交反应的复杂性(非特定性结合、交叉反应、缓慢的动力学,并且大多是未知的)和昂贵的样品预处理(样品纯化,嵌入荧光染料时未知的效率),所以对基因序列进行定量化在实验上很复杂,并且对结果的解释完全无意义。
b)对少量起始材料进行定量的扩增反应,以便例如从实时PCR的信号升高来确定规定序列的模版数(0、1、2、3......意义上)。在此情况下,由于指数扩增速率引起的误差较高。
US 6,440,706 B1公开了一种确定样品中序列的相对多度的方法,称为数字扩增或数字PCR。在此,尽可能稀释样品,并分配于多个反应容器中,使得在一个反应容器中存在尽可能不多于一个的要研究序列的单个分子。然后用多个引物扩增分配于多个反应容器中的样品,所述引物分别对于序列之一是特定的,并设定确定的标记物。扩增后,通过在扩增产物中结合的标记物认识到在哪个反应容器中存在什么样的序列。通过计数分别含有确定序列的反应容器,可以查明该序列在原始样品中的量比例。该方法带来明显的不确定性,这主要是由稀释系列造成的,因为决不能绝对可靠地弄清楚反应容器中是否不再含有更多的序列分子,因此结果会发生偏差。此外,用该方法仅能确定相对的比例而不是绝对的量。
WO 2004/027089公开了另一种能够确定序列相对多度的方法。在该方法中,例如要确定基因材料的多个可定义的分量之一(即,独立的核酸或序列)在样品中的多度是否多于或少于其它可定义的分量。现有技术该方法的一种具体实施方式
涉及确定细胞中单个染色体的相对多度,例如确定是否存在非整倍体。在WO 2004/027089公开的方法的该实施方式中,首先用一种非特异性引物或多种这样的引物进行单细胞扩增,例如全基因组扩增(WGA),在此理论上必须分别扩增对于一种染色体而言多个特异的目标序列。不过,由于这样的全基因组扩增不能100%有效地进行,所以在统计平均上不能扩增理论上通过引物可扩增的所有目标序列。在扩增反应后,检测对于各染色体而言特定的目标序列。
用上述方法都不能计数样品中,例如十个或更少的基本相同的序列的个数。多数方法原则上不适于定量证实这种小数目的序列。只有用数字PCR可以查明以相对少量存在的不同序列的相对多度。由于使用稀释系列,查明仅以很少量例如10个或更少量存在的序列的相对多度是成问题的。

发明内容
本发明的目的是,提供一种确定样品中预先确定的序列或者与该预先确定的序列相同或几乎相同的(同源的)序列的多度的方法,该方法即使在样品中序列数量少的情况下也可以可靠、简便并且低成本地实施。
本发明是通过权利要求1的方法实现的。本发明有利的技术方案记载在从属权利要求中。
用于确定样品中预先确定的序列或者相同或几乎相同的(同源的)序列的多度的本发明方法包括以下步骤-进行一个或多个扩增反应,用所述反应可以将样品中的一或多个序列的若干目的片段扩增成扩增产物,-检测样品中该序列的确定的目的片段是否被扩增,和-通过扩增产物中确定的目的片段存在或不存在的多度来确定样品中该一或多个序列的多度。
权利要求2中记载了本发明方法的一种优选实施方式。该方法用于确定样品中一个预先确定的序列或者多个与该预先确定的序列相同或几乎相同的序列的多度n,其包括以下步骤(a)提供样品,其中含有待确定多度n的所述序列,(b)提供引物,用所述引物可以将样品中预先确定的序列的m个目的片段分别扩增为不同的扩增产物,(c)用(a)的样品和(b)的引物进行一个或多个扩增反应,选择反应条件,使得成功扩增的反应数取决于样品中预先确定的序列的多度n,(d)检测步骤(c)中扩增的目的片段并确定成功扩增的反应数,(e)确定样品中含有的预先确定的序列的多度n。
优选将样品中含有的预先确定的序列的多度n与一或多个对照物进行比较,所述对照物中存在具有已知多度的预先确定的序列。所述对照物或者可以是平行进行本发明方法的对照样品,在该情况下,对于平行的对照样品,采用与样品进行扩增反应相同的反应条件。也可以使对照样品不依赖于所述样品而进行本发明方法,并建立有效性数据或参比数据,将其用作与样品比较的对照物。
原始序列的多个目的片段,例如,可以通过使用多个分别对于该序列中的确定的目的片段或少数确定的目的片段而言是特异的引物对或引物组合而进行扩增,或者通过使用分别对于多个确定的目的片段而言是特异的引物而进行扩增。
对于本发明目的而言,术语“引物”不仅包括单个引物,而且还包括引物对(即,分别是向前引物和向后引物)和引物组合(对于一确定的目的片段而言多于一个向前和向后引物)。
使用扩增多个确定的目的片段的引物的PCR方法被称为IRS-PCR(内重复序列PCR)或WGA-PCR(全基因组扩增PCR),即,所述引物在扩增多个不同序列的范围内是非特异的。
本发明的发明人注意到,当扩增序列的多个不同的确定的目的片段时,被扩增的不同目的片段数取决于样品中最初存在的序列数。样品中存在的序列数越少,则由其扩增的不同目的片段数也越少。
认为,造成这种情况的原因是,每次扩增的结果都伴随一定的概率或效率,即,每次扩增都不是绝对可靠地进行的。因此,例如在同时扩增多个不同片段时,在各个不同片段的扩增反应之间形成竞争,因此,当样品材料中仅存在一个或少量预先确定的序列时,与扩增大量序列时相比,被扩增的各个不同片段更少。
效率取决于多个因素,例如取决于引物的选择、要扩增的序列的长度和其它反应条件,例如在PCR情况下为温度方案、循环时间、循环数、反应物浓度、反应体积、聚合酶等。本领域的技术人员能够调节这些参数,从而达到所希望的效率。
通过确定这些因素,还可以在一定范围内确定扩增的效率。例如,如果序列以尽可能大的可靠性得到扩增,但仅以较小数目存在,则效率尽可能接近1是有利的。这例如对于诊断性PCR(检测病原体)和类似的其他应用是有利的。
另一方面,如在本发明方法中那样,除了区别在于是否样品仅含有单倍、二倍、三倍或类似小数目的预先确定的序列外,更有利的是,将扩增效率调节到平均值,例如0.1到0.9的范围,优选0.2到0.8,优选0.3到0.7,优选0.4到0.6,最优选为约0.5。扩增效率应该在这样的范围内,使得可以统计上有意义地说明原始存在的序列,即核酸分子的绝对数量。
因此,术语“效率”作如下解释,表示在假定存在任意多的起始材料情况下的扩增概率。适于本发明的扩增效率通常为0.5到1。与之相反,确定的片段扩增的实际概率在序列的起始模版数少的情况下取决于起始材料量,即,样品中预先确定的序列数,并且原则上可以覆盖0到1整个可能的范围。
因此,例如,在对序列的多个目的片段扩增的确定的条件下,即使对于涉及的这些多个目的片段而言选择了适当的引物,对序列的多个目的片段的扩增也不是在每个扩增反应中扩增所有的目的片段。这尤其涉及到当目的片段被扩增的原始模板,即原始序列,仅存在较少的模版数时,例如在0、1、2、3、4、5、6、7、8、9、10的范围内。
由于任何扩增反应都有一定的误差概率,因此很难用现有技术的方法区分含有用于扩增反应的不同数目模板的不同样品。例如一个样品可以含有两个序列,由其每次确定的目的片段被扩增,第二个样品可以含有三个这样的序列,由其确定的目的片段被扩增。目前,当原始模板数在所述小范围时,用现有技术的扩增方法不可能根据扩增反应结果推断出原始模板数,即,样品中原始存在的序列的多度。
不过,本发明方法能够确定样品中原始存在的序列的绝对数目,特别是当该数目,对于本发明目的而言用n表示,在n=0、1、2、3、4、5、6、7、8、9、10时。优选n在0~100范围内,优选0~30,优选0~10,优选0~5。特别优选调节本发明方法,使得可以定量确定的序列数为n=0、1、2、3和4的样品。
为此优选这样选择扩增条件,使得n=1时扩增反应的效率在0.2~0.8范围内,优选为0.4~0.6。特别优选所述扩增效率为约0.5。这意味着,当一个序列,样品中该序列数n=1(即,该序列在样品中出现一次,亦即仅有一个模板),并且对于该序列而言,m个目的片段被扩增时,在效率为0.5情况下,则扩增反应后统计平均上仅可检测到一半的目的片段。
因此,本发明方法能够定量说明样品中存在的序列的模版数。为此目的进行扩增反应,以便将序列上多个不同的目的片段扩增成扩增产物。当该预先确定的序列(由其会扩增多个目的片段)仅以很少的模版数存在,并且扩增效率小于1时,则很有可能不是所有所选的目的片段都实际上在扩增反应中被扩增,即使经过多个循环。如果通过检测该多个目的片段而将样品扩增反应的结果与预先确定的序列进行比较,以及如果将该结果与含有2个模版预先确定的序列的样品在同样条件下进行的扩增反应进行比较,则对于具有2个模版的样品而言,可得到较高数目的阳性可检测的扩增的目的片段是统计上有意义的概率。


参考以下附图进一步解释本发明,附图为图1是第一个实施例的结果表,和图2a、2b是用于检测预先确定的片段的电泳实验图。
图3表示对一方面Coriell公司的7个细胞系染色体的存在或不存在情况和另一方面根据本发明方法的情况进行比较。
白色格子染色体存在(各方法的结果一致)。划斜线的格子不存在染色体(各方法的结果一致)。划点的格子本发明方法表明存在染色体,而其它方法表明不存在。黑色格子本发明方法表明不存在染色体,而其它方法表明存在。
图4表示用Vysis公司的杂交试剂盒进行人卵细胞FISH-分析的结果。
图5表示用“TIFFAnalyser”程序的扫描图像分析。
具体实施例方式
以下更详细地解释该统计估算法。
存在或不存在用特定引物或引物对进行的基于定义的PCR方案(尤其是温度方案、循环数、反应物浓度、体积、检测扩增产物时的阈值)的扩增产物取决于起始材料中序列的模版数。以下在想象的实验中示例性解释本发明的计数方法以可靠度>=90%区别出样品中的模版数0、1和>=2。如果所述模版数是极体极体中的染色体,则因此区别出单体性(极体中的模版数为2)、健康细胞(极体中的模版数为1)和三体性(极体中的模版数为0)的情况。首先用m=8的不同的荧光标记的引物和定义的PCR方案对具有已知模版数n=0、1、2的对照样品进行PCR。通过在阵列上每次杂交,以存在的扩增产物5倍于背景信号为阈值来检测扩增产物。在每次k=100的实验中,对于模版数n的三种情况,得到以下多度分布表1阳性扩增的数目0/81/82/83/84/85/86/87/88/8n=098 2 0 0 0 0 0 0 0n=12 13 24 57 3 1 0 0 0n=20 0 0 0 3 40 35 20 2假定,该分布即使对于更大的数k也不改变,则由该表可以得出以下结论如果对于具有未知模版数的样品进行相同的实验,并且得到结果5/8、6/8、7/8或8/8阳性,则可以以必要的确定性得出模版数=2的结论。如果结果是0/8阳性,则原始模版数以>90%的置信度为n=0。如果结果是2/8、3/8,则模版数以必要的确定性为n=1。结果1/8和4/8不能以必要的确定性作出决定。如果在这种情况下也想能以必要的确定性作出决定,则例如可以增加不同扩增的数m,或者改变PCR方案。在另一想象实验中m=12,并用相应的对照样品得到以下表2的多度分布表2阳性扩增的数目0/12 1/12 2/12 3/12 4/12 5/12 6/12 7/12 8/12 9/12 10/12 11/12 12/12n=0955 0 0 0 0 0 0 0 0 0 0 0n=10 0 3 2044303 0 0 0 0 0 0n=20 0 0 0 0 0 0 3 274515 7 3这里,阳性扩增反应数没有重叠,即,所有相关的值n可以以必要的置信区间进行区别。现在,在其它PCR条件下对对照样品进行其它想象实验结果如下(循环数从I=30减少到I=27)表3阳性扩增的数目0/12 1/12 2/12 3/12 4/12 5/12 6/12 7/12 8/12 9/12 10/12 11/12 12/12n=0982 0 0 0 0 0 0 0 0 0 0 0n=10 1 142240203 0 0 0 0 0 0n=20 0 0 0 0 0 3 10303215 7 3这里,不能清楚说明值1/12和6/12。现在在进一步的迭代步骤中可以研究,例如通过调整检测的阈值而重新得到基于相同实验的没有重叠的结果。
优化本发明计数方法的目标通常是用尽可能少的PCR反应m在希望的范围内更可靠地区分模版数n。为此必须相应优化PCR条件,并且如果必要的化相应优化引物。然后可以将所得的参数附加在本发明试剂盒上,并为使用者解释其结果。
表4表明,当彼此独立的研究结果的数目增加时,报告的统计确定性提高。基础是正态分布表4

不论在使用名义上相同的起始材料的多个单独实验中(对于最后一种情况,在32个彼此独立的单独反应中)还是在惟一的多重反应中(例如基于单细胞的32-重反应)获得的目标序列相关的结果都是不重要的。
在实施本发明方法时,可以在多重实验中相互表示出扩增反应的依赖性。
对于本发明方法而言,优选设定反应条件,使得以上示例性描述的成功的扩增反应的分布尽可能尖锐。这意味着,特别是对于证实具有低多度的预先确定的序列,可以将n=1的样品与n=2的样品以及n=3的样品区别开。
令人惊讶地表明,在扩增反应情况下,特别是在PCR扩增情况下,如以上所述,在设定的条件下,分布比认为的要尖锐得多。
因此,本发明方法还特别适于确定小数目序列的多度,其数目优选在0~10范围内。根据序列数预期的数值范围,优选可以这样设定独立的PCR反应数m和PCR条件,使得预期的序列数结果的可靠性最佳化。
优选只使用单细胞的基因组作为样品材料,从而用本发明方法可以可靠地确定是否不存在预先确定的序列,或者存在一倍或二倍或三倍或四倍或五倍,等等。
本发明方法还特别适合于极体分析。
预先确定的序列例如可以是染色体,但其也可以是染色体的一段或染色体的一部分。所述预先确定的序列也可以是基因或较大的序列片段。本发明方法原则上可以用于各种核酸和核酸序列,例如甚至用于质粒和其它人造序列。因此,以下描述的实施方式不是限制性解释,而是适合于任何定量检测起始样品中小数目的核酸序列。所述核酸序列可以是DNA、RNA、mRNA、cDNA或基因组DNA。
本发明方法特别适于确定单细胞中的染色体数,即,本方法适于查明异倍体的存在情况。
本发明方法可以多种实施方式进行。
在第一种实施方式中,例如对于染色体分析所述,用特定的引物进行单细胞扩增。在此不必使细胞首先进行WGA,即非特定扩增。
不过,在优选的第二种实施方式中首先进行WGA,以便使单细胞或少数几个细胞的核酸材料进行非特定性扩增。然后进行根据权利要求1的特定性扩增。即使在这种先后相连的两个扩增反应中,例如PCR’s,扩增产物数也取决于样品中原始存在的要计数序列的模版数。对于这种总过程,可以通过实验确定类似于表1到3的表,使用者在此基础上可以推论出其样品的模版数。在此,对于扩增产物的存在或不存在情况,也可以形成确定的概率分布。
在特异性扩增情况下,用特异的引物或相应的引物对/引物组合可以使细胞进行扩增反应,在此这样选择引物或引物对,使得对于每个染色体,可以扩增m个确定的和特异的目的片段。对于染色体分析而言,要扩增的目的片段数m优选至少为4,更优选至少为6,更优选至少为8。对每个染色体也可以选择多个目的片段,例如10、12、14、16、20、30或更多。不过在此可以听任技术人员对每个染色体选择合适数目的目标序列。对于每个染色体而言特异的目标序列的数目m(在此,m是指对每个染色体而言)应该足够大,使得在成功和不成功的扩增反应的统计分布情况下,最终可以说明原始存在的模板分子数。另一方面,每个染色体特异的目的片段数m不应太多,从而所使用的引物或引物对的数目不超过合理程度。如上所述,技术人员可以根据分析和扩增方法主动选择每个染色体要扩增的目的片段数m,并且还可以确定相应的扩增条件。
为了本发明目的进行对照实验,其中对照样品分别选自具有已知数目n个核酸分子的细胞,例如其中完全不存在核酸的细胞作为对照物0,其中一次存在该核酸的细胞作为对照物1,等等。然后用相应选择的引物或引物对对所有这些对照样品进行扩增反应,这样优化扩增条件,使得对于其中核酸出现一次(n=1)的对照样品,该核酸特异的目的片段数为m=4到30,并且扩增效率在约为0.5的范围内。这意味着,当含有两个模版核酸的对照样品2在同样扩增条件下进行扩增时,扩增效率明显较高。这点也可以从表1看出。
所述本发明的第一个实施方式特别好的适于证实单个细胞中的染色体数。该方法特别是适于极体分析,其中,极体可以具有单倍体或二倍体染色体组。这里,优选为每个染色体选择约4~30个,优选6个,优选8个目的片段,所述目的片段对各染色体是特异的。各目的片段在各染色体上优选仅出现一次,因此是特异的。这时,当用对一个染色体而言的一组引物或者用对所有染色体而言的多组这样的引物对这样的细胞进行扩增时,则如上所述,扩增反应不是在所有情况下都产生扩增产物,即,每个染色体的m个目的片段中的几个不被扩增,并且随后也不能被检测到。例如可以设定条件,使得当染色体仅存在一次时,例如各染色体的八个目的片段中仅有四个(统计平均)被扩增。结果表明,用相应的探针的随后检测得到4/8的结果。如果事先借助对照样品确定扩增效率值为0.5,则可以由结果4/8推断染色体在样品中存在一次。
采用实施例1可以研究极体是一次还是两次含有染色体2。极体中一次或两次存在染色体的问题对于研究极体是重要的。不过在其它问题中,明智的是确定预先确定的序列是否以其它多度存在,以及可能的数量范围是否不仅只包括如本实例中的1和2那样仅包含两个,而是如三、四或五个的数量范围。为了可以包括较大的数量范围在内,例如在样品中是否含有三、四、五或六次预先确定的序列,原则上也可以采用本发明方法。较大的计数范围可以仅用较大的统计依据进行统计。这里要扩增并检测预先确定的序列的多个不同片段。
本发明方法特别适于确定多度或计数小数目的预先确定的序列,例如小于20,小于10,优选小于5或3,因为对于样品中较少数目的预先确定的序列,统计展开成功扩增的序列片段数是特别突出的。
在实施例1中,使用χ2检验作为统计方法。不过,其它统计方法也适于评价扩增结果,例如可以是平均值比较(t-检验、F-检验)、变量分析法(ANOVA、MANOVA)、多域χ2检验或等级对数线性(hierarchischeloglineare)法。
不过,在优选的第二种实施方式中,可以不用对特异的目的片段是特异的引物对样品进行扩增反应,而首先进行全基因组扩增。对于根据权利要求1由特异性扩增进行的WGA扩增,也可以通过用已知数量为n个的起始核酸(模板)统计确定对照样品,这样确定扩增条件,使基于扩增的目的片段数的阳性(即成功的)和阴性(即不成功的)扩增反应的统计分布与事先选择的目的片段数(m)进行比较,推论出原始存在的核酸数(n)。多度表(表1、2、3)则涉及两种扩增的组合。
该第二种实施方式的一个实例记载在实施例1中。
在本发明范围内,可以扩增待检测的序列中多个不同的预先确定的片段的任何扩增方法都适合于样品的扩增。为此可以使用如实施例1中那样的单个引物。不过也可以使用分别对于确定的片段或少数几个片段而言为特异性的多个引物对。
例如可以通过电泳、DNA-阵列上的杂交分析、珠-体系(Bead-System)或其它光学测量、电测量或电化学测量而分析扩增产物。
为了确定单个细胞或少数几个名义上相同的细胞的基因组中序列的多度,以下方法方案是有意义的1.1个细胞,WGA-扩增(非特定性单细胞-扩增),随后的PCR反应(标记物-PCR)空间分离,检测片段(相应于以上实施方式);2.1个细胞,WGA-扩增(非特定性单细胞-扩增),通过复合杂交检测片段;3.1个细胞,多重PCR,直接检测片段,没有进一步扩增;4.少数名义上相同的细胞,每个反应容器中含有一个细胞的多重PCR,检测片段,没有进一步扩增;5.少数名义上相同的细胞,每个反应容器含有一个细胞的特异性PCR(准确说是一个)反应,检测片段,没有进一步扩增;6.少数名义上相同的细胞,每个反应容器含有一个细胞的特异性PCR(准确说是一个)反应,每个反应和细胞再分别用不同的引物对扩增,检测片段。
方法1~3也可以用少数名义上相同的细胞进行,其数目优选是已知的,例如≤10。
在以上给出的方案1和2中,相应于上述实施方式的WGA-扩增而实施WGA-扩增。这样的单细胞-扩增也被称为统计扩增。
在方案2中证实片段,没有通过复合杂交而进一步扩增。复合杂交是指这样的方法,其中同时存在若干探针,如DNA-阵列或珠-体系的情况那样。
在方案3和4的情况下实施多重PCR。这是用若干特异的引物同时在反应容器中实施的PCR。用各引物对优选准确扩增序列的一个片段。用这种多重PCR可以适当地同时扩增两个到十个片段。当片段数较多时会出现问题,因为那时扩增将是非特定性的。
在方案4中,几个名义上相同的细胞的遗传材料的信息概括在样品中。在方案5和6中,几个名义上相同的细胞的遗传材料首先彼此独立地分别在不同反应容器中用准确扩增一个片段的特定PCR进行研究。然后检测该片段,没有进一步扩增(方案5),或者进行进一步扩增(方案6)。
当分析中使用多个细胞时,则确定多度的不确定性较大。分析单个细胞时可最佳地确定多度。如果存在多个名义上相同的细胞,则可以将结果进行比较。本发明方法特别适于分析单个细胞(例如极体,来自母亲血液的单个胎儿细胞等)的基因组。
用本发明方法可以确定样品中预先确定的序列的多度。所述预先确定的序列可以是多次存在于样品中的独立分子。不过它们也可以形成束的形式而多次存在。因此,本发明方法可以用以独立分子形式存在的预先确定的序列相同的方法计数以束的形式多次出现的预先确定的序列。不过,待确定的序列必须足够长,从而可以彼此独立地扩增多个片段。预先确定的序列的长度至少为100个碱基,优选为几百个碱基。
用本发明方法可以同时确定多个不同的预先确定的序列的多度,在此,不同的序列也可以在不同束中或在同一束中形成。在相同的束上,不同的序列还可以重叠。
用本发明方法可以确定不同样品的预先确定的序列的相对多度。不过本发明方法也可以通过系列实验而确证,使得在扩增产物中存在或不存在确定的片段的多度能够给出与样品中预先确定的序列的绝对数目相关的说明。
本发明方法可以用于确定存在于同一束中的序列的多度,以及用于确定存在于不同束中的序列的多度。不过,所述序列应该具有足够长度,使得可通过引物寻址不同片段。
本发明另一主题在于一种用于实施本发明方法的试剂盒,包括(i)一个或多个特异性引物,用所述引物可以将样品中多度待定的预先确定的序列的m个目的片段分别扩增成不同的扩增产物,(ii)可包括或不包括的对照样品,用于对照样品中预先确定的序列的每个可能的多度值n,和/或(iii)可包括或不包括的用(i)的引物进行扩增反应的结果,和/或具有待计数序列的已知多度的对照样品例如来自(ii)的对照样品的结果,
(iv)扩增反应的反应条件报告。
该试剂盒还可以包括一种或多种非特异性引物,所述引物可以根据预定的方案非特异性地扩增预先确定的序列。
对照扩增反应结果的报告可以以贮存数据形式实现,或者可以将印刷材料附在试剂盒上,使用者可以由此读出结果,并可以与真实样品的特有结果进行比较。
本发明方法还可以在小空间上,例如在固体载体、芯片或载玻片等上进行。也可以在多眼板如微滴定板中进行该方法。所述固体载体优选是载玻片、CD或用于DNA-阵列-格式的其它类似的固体载体。
本发明另一主题是一种适于实施本发明方法的装置。该装置优选包括用于检测核酸的设备,所述核酸例如被标记的探针所“捕获”,即,例如用于检测荧光或比色测量法的设备。该装置或者还包括用作对比数据的贮存数据,以便可以将扩增结果分配给对照数据,使得通过比较能够确定在样品中原始含有的预先确定的序列的绝对数目。除了在装置中贮存的对照数据,该装置还可以另外包括或与代替对照数据而包括对照物位点,在这些位点上可以在与样品相同的条件下分析该对照样品。所述对照样品含有,例如要在真实实验中检测的核酸或者以以下数目存在的预先确定的序列n=0、n=1、n=2、n=3等。对照物同样进行本发明方法,如同用真实样品那样。
通过以下实施例来解释本发明的方法实施例1研究染色体2在极体中是出现一次还是两次。
为此,提取一个极体然后用蒸馏水洗涤,并放在涂覆的载玻片上。所述极体形成样品1。为进行比较,以同样方式配制具有两个极体的样品2。
单细胞-WGA-PCR用单细胞-WGA-PCR扩增这两种样品。设计单细胞-WGA-PCR以扩增单个细胞或少数几个细胞的遗传材料。在载玻片上进行单细胞-WGA-PCR,在此,在样品上分别加入1μl PCR-混合物和5μl矿物油。
25μl PCR-混合物由以下成份组成19.125μl 一次用量的水2.5μl MgCl2(25mM)2.5μl dNTP混合物(各2mM)0.375μl Qiagen的HotStar Taq-DNA聚合酶(5U/μl)0.5μl Ale1引物(100pmol/μl)Ale1引物具有以下序列Ale1 5′-TCCCAAAGTGCTGGGATTACAG-3′(SEQ ID No.1)分别由一个样品、上述PCR-混合物和油膜组成的PCR-配料用以下PCR-条件进行循环变性 在95℃下15分钟40次循环在94℃下30秒在62℃下30秒在72℃下30秒伸长在72℃下10分钟用PCR同时扩增样品的多个不同片段。因此也可将其称为WGA-PCR。
将PCR产物转入20μl TE缓冲液中。取2μl在聚丙烯酰胺-凝胶上进行分析,取15μl用标记物-PCR进行扩增。其余的在-20℃下冷冻。
标记物-PCR设计标记物-PCR,以检测样品确定的片段是否被单细胞-WGA-PCR所扩增。
采用标记物-PCR,用对于这些片段而言分别为特异性的其他引物对分别扩增单细胞PCR的PCR-产物的各部分。为各单个标记物-PCR配制以下PCR配料1.5925μl一次用量的水0.6μl 缓冲液0.6μl MgCl2(25mM)0.0325μlPromega的Taq-聚合酶(5U/μl)0.075μl 单细胞-PCR的PCR-产物2.5μl 提供的引物(2pmol/μl)将引物对预先放在微滴定板的反应容器中,并将其余PCR-配料滴入其中。为了检测在单细胞-PCR中由染色体2扩增的片段,使用以下八对引物对RH1027905′-TGAAGTCATCGTCTATAAGGCA-3′ 5′-TCTATTTGTCCTGGGACCCA-3′SHGC-31419 5′-TCCTATTTTGAGGGCGAGG-3′ 5′-ATAAATACAAACATGTCAGACTGGG-3′SHGC-62010 5′-AAGGTTTTATAATGGAAACACTG-3′ 5′-TGAGTTCTGGAATTCATTACATA-3′RH1028135′-CCAACCACTTCAAGAAATAGGC-3′ 5′-AATACAGTGTGGCCAAAGCC-3′SHGC-30955 5′-GTTTTTTCTTTGAGTGACACAAGC-3′5′-ACTTGTGTGATTTGTAAGCTGAAC-3′G62066 5′-GCCTCACAAGCCTCATCAGT-3′5′-CGGACTTGTCTAGAAATGAGCA-3′G31877 5′-TTGGCCTCCACTTTACAGAC-3′5′-CACCCGGCCTATGGACAGA-3′SHGC-144725 5′-ATGGACAGGATGGTGATAAGGAA-3′ 5′-AGATGCAAGGAAAGATGCTTACG-3′以上引物的序列表示在SEQ ID No.2~17中。
采用以下PCR条件,两个样品在8对PCR配料中分别用以上给出的引物对分别进行扩增变性95℃下3分钟35次循环 95℃下30秒55℃下30秒72℃下30秒伸长 72℃下10分钟扩增后,分别用在聚丙烯酰胺凝胶上荷载的缓冲液如下分析16个扩增产物,分析是否分别存在预先确定的序列片段,即,扩增是阳性还是阴性。在聚丙烯酰胺凝胶上的电泳-实验相应的图表示在图2a和2b中,其中图2a表示样品1的带,图2b表示样品2的带。通过这些图可以看到,在样品1中检测到两个阳性扩增产物。其余六个其它扩增产物是阴性的,即,通过标记物-PCR引物的选择只有预先确定的染色体2的两个片段被单细胞-PCR所扩增。对于样品2,检测到八个阳性扩增产物,即,所有八个预先确定的片段都被单细胞PCR所扩增。该结果概括在图1中。
在图2a和2b所示的实施例中清楚看到,对于样品2,所有八个片段都被扩增,与之相反,对于样品1,只有标有数字2和7的片段被扩增,其中,标有数字2的片段的信号较弱。原则上应确定一个阈值,用该阈值可以区分开片段的阳性扩增与阴性扩增,从而得到纯数字结果,例如,也可用“0”表示阴性扩增,用“1”表示阳性扩增。必须取决于所选择的方法而凭经验确定该阈值,用以检测片段。
实施例1印象很深刻地表明以下效果,样品中预先确定的序列数目较少的情况(这里样品1的染色体2)与样品中预先确定的序列数目较多的情况(这里样品2的染色体2)相比,更少的序列片段被扩增。
可以用统计方法确定这些结果是基于纯偶然的变质样品,还是具有意义。合适的统计方法是χ2检验(也叫卡方检验),例如在L.Cavalli-Sforza,Biometrie,Gustav Fischer Verlag Stuttgart,1974在第22章所述。使用该检验时,对于确定的结果得到χ2值为9.6,并且误差概率P为0.003。这意味着,“所观察的多度中的区别是偶然的”这样的假设,其被否定的误差概率为P=0.003。
因此,用该方法可以确定,样品2含有比样品1更多的染色体2。
如果多次进行上述的方法,并对结果进行统计评价,则基于通过扩增产物中确定的片段存在或不存在的多度而确定的统计数据,可以确定样品中染色体2的绝对数目。这表示计数样品中预先确定的序列的绝对数目的方法的有效性。关于该有效性要考虑以上描述的阈值的影响。如果该阈值设置较高,则片段的阳性扩增较少,与之相反,阈值较小时,则阳性扩增较多。
实施例2测试7种细胞系(P1-2到P1-8)存在还是不存在确定的染色体。所述细胞系由Coriell得到。所述由Coriell得到的细胞已经由Coriell自己测试了存在还是不存在确定的染色体。用本发明方法同样可以测试这些细胞。结果表示在图3中。
提供细胞的DNA,根据货物签条,其中含有人染色体确定的系列。除了Coriell的该说明外,还可以从Coriell的网站获得基于印迹测试的测试结果。无从获知为什么该公司提供两组报告。印迹测试的公开内容即使对检测仅包含在细胞碎片部分中的染色体也是足够灵敏的。图3的第三行表示在各情况下芯片的结果。
结果本发明方法的结果90%以上与其它方法的结果是一致的。
根据本发明,对Coriell-细胞实验进行PCR分别将10ng染色体DNA用于25μl Ale PCR(用引物Ale1进行全基因组-扩增;参见实施例1),并按照标准条件进行循环


将25μl PCR-配料纯化(PCR-纯化试剂盒Macherey&Nagel),并加入250μl洗脱缓冲液中。分别将其中1μl加到Master Mix提供的的芯片的每个锚(Anker)上。

用以下条件对其进行循环和杂交。

然后洗涤载玻片,并进行扫描(Axxon或Tecan的标准扫描仪)。
实施例3在人卵细胞成熟分裂期间,具有4个模版的序列的二倍染色体组减少到仅有一个模版的成熟卵细胞。分裂发生在2个步骤中a.卵细胞中的同源染色体分开第1极体b.成熟卵细胞中的染色单体分开第2极体第一极体含有2个模版序列,成熟卵细胞以及第二极体分别含有一个模版序列。
可考虑以下分布(某些情况下为错误分布)成熟卵细胞含有4模版极体不含有模版成熟卵细胞含有3模版极体含有一模版成熟卵细胞含有2模版极体含有2模版成熟卵细胞含有1模版极体含有3模版成熟卵细胞不含模版极体含有4模版存在错误分布,并可以用于证明本发明方法的准确性。
在该实施例中研究对应的极体和卵细胞。如果荧光原位杂交(FISH)显示4个正确的信号,则在极体中检测不到序列。如果FISH显示3个或更少的信号,则本发明方法一定是阳性的(极体含有至少一个模版)。
以下实验显示芯片结果与建立的FISH方法是一致的。根据每个试剂盒中的Vysis公司的记录,对单细胞进行处理并进行FISH杂交。
用Vysis公司的杂交试剂盒进行的人卵细胞FISH-分析的结果表示在图4中。最大的点(原图中为蓝色)是荧光标记的探针分子,其特异性检测染色体16。4个阳性信号(没有人工产物)表示卵细胞中存在4个染色单体;而减数分裂期间,该染色单体错误地保留在卵细胞中的。
每个芯片的相应的分析在全基因组扩增后,研究极体扩增产物中存在/不存在所有染色体。实验进行方式如上实施例1和2中所述。PCR条件和各成分如实施例2中那样,不过模板(DNA)被芯片上作为模板的极体所代替。
扫描结果通过Alopex公司的程序″TIFFAnalyzer″对图形数据进行图像分析。没有检测到染色体16。该分析的结果表示在图5的第5栏中。
因此,相应的第一极体不含有染色体16。这可以通过芯片显示。
权利要求
1.确定样品中预先确定的序列或者多个与该预先确定的序列相同或几乎相同的序列的多度的方法,包括以下步骤-进行一个或多个扩增反应,通过所述反应可以将样品中该一或多个序列的多个不同目的片段扩增成扩增产物,-检测样品的所述序列的确定的不同目的片段是否被扩增,和-通过扩增产物中确定的不同目的片段存在或不存在的多度来确定样品中该一或多个序列的多度。
2.根据权利要求1的确定样品中预先确定的序列或者多个与该预先确定的序列相同或几乎相同的序列的多度的方法,包括以下步骤(a)提供样品,其中含有待确定多度n的所述序列,(b)提供引物,用所述引物将样品中预先确定的序列的m个目的片段分别扩增为不同的扩增产物,(c)用(a)的样品和(b)的引物进行一个或多个扩增反应,选择反应条件,使得成功的扩增反应数取决于样品中预先确定的序列的多度n,(d)检测步骤(c)扩增的目的片段并确定成功的扩增反应数,(e)确定样品中含有的预先确定的序列的多度n。
3.根据权利要求1或2的方法,进一步包括以下步骤(f)通过与一或多个对照物进行比较而确定样品中含有的预先确定的序列的多度n,所述对照物中预先确定的序列以已知的多度存在。
4.根据权利要求3的方法,步骤(f)的对照物是含有已知多度的所述序列的对照样品,并且所述对照样品在与样品相同的扩增条件下扩增。
5.根据权利要求3的方法,步骤(f)的对照物是来自对照样品的有效数据,所述对照样品含有已知多度的所述序列,并且在与样品相同的扩增条件下扩增。
6.根据前述任意一项权利要求的方法,实施步骤(b)的扩增反应包括以下步骤(i)用一或多个非特异的引物进行第一个扩增反应,所述引物非特异性扩增所述预先确定的序列,(ii)用对各目的片段而言为特异的引物进行第二个扩增反应。
7.根据前述任意一项权利要求的方法,所述样品是单个细胞和/或包含所述序列的单个细胞。
8.根据前述任意一项权利要求的方法,所述样品是极体和/或包含所述序列的单个极体。
9.根据前述任意一项权利要求的方法,所述预先确定的序列是染色体或是其片段或部分。
10.根据前述任意一项权利要求的方法,样品中预先确定的序列待确定的多度n在0~100的范围内,优选在0~30的范围内,优选在0~10的范围内。
11.根据权利要求10的方法,样品中预先确定的序列待确定的多度n在0~5的范围内。
12.根据权利要求11的方法,样品中预先确定的序列待确定的多度n为0、1、2或3。
13.根据前述任意一项权利要求的方法,为成功的扩增反应确定阈值。
14.根据前述任意一项权利要求的方法,选择反应条件,使得对于给定的目的片段,n=1时扩增反应的效率在0.2和<1之间。
15.根据权利要求10的方法,选择反应条件,使得对于给定的目的片段,n=1时扩增反应的效率在0.4和0.6之间,优选为约0.5。
16.根据前述任意一项权利要求的方法,对预先确定的序列而言,特异的目的片段数m至少为4。
17.根据权利要求16的方法,对预先确定的序列而言,特异的目的片段数m至少为6。
18.根据权利要求16或17的方法,对预先确定的序列而言,特异的目的片段数m至少为8。
19.根据前述任意一项权利要求的方法,在通过存在或不存在确定的不同目的片段的扩增产物而确定样品中预先确定的一或多个序列的多度n时使用有效的数据,所述有效的数据由含有已知多度的预先确定的序列的对照样品获得,因此确定预先确定的序列的绝对多度n。
20.根据前述任意一项权利要求的方法,使用一类适于扩增所述一或多个序列的不同目的片段的引物(统计性引物)进行扩增反应。
21.根据权利要求20的方法,为了研究所述预先确定的序列的确定的目的片段是否被扩增,扩增产物通过多种分别对于一或多个确定的不同目的片段而言为特异性的引物进行扩增。
22.根据前述任意一项权利要求的方法,为在样品中进行扩增反应,使用多种分别对于一或多个确定的不同目的片段而言为特异性的引物。
23.根据前述任意一项权利要求的方法,通过电泳、DNA-阵列上的杂交分析、标记法、珠-体系或其它光学、电学或电化学的测量法研究扩增产物的不同片段的存在情况,从而确定各目的片段的扩增产物量是否超过确定的阈值。
24.根据前述任意一项权利要求的方法,使用有标记的特异的引物,并且在研究确定的不同目的片段时检测是否通过为各引物分配给确定的不同目的片段的标记超过预先确定的阈值。
25.根据前述任意一项权利要求的方法,通过统计分析扩增产物中确定的目的片段的多度而确定所述预先确定的一或多个序列的多度。
26.根据权利要求25的方法,所述统计分析的错误概率小于10%,优选小于1%。
27.一种实施权利要求1到26中任意一项的方法的试剂盒,包括(i)一或多个特异的引物,用其可以将样品中的多度待定的预先确定的序列的m个目的片段分别扩增成不同的扩增产物,(ii)可包括或不包括的对照样品,用于对照样品中预先确定的序列每个可能的多度值n,和/或(iii)可包括或不包括的用(i)的引物进行扩增反应的结果,和/或具有待计数的序列已知多度的对照样品的结果,(iv)扩增反应的反应条件报告。
28.根据权利要求27的试剂盒,进一步包括(v)一或多种非特异的引物,用所述引物可以非特异性扩增预先确定的序列。(vi)可包括或不包括的用(i)和(v)的引物进行扩增反应的结果,和/或具有待计数的序列已知多度的对照样品的结果,(vii)扩增反应的反应条件报告。
29.根据权利要求27或28的试剂盒,进一步包括进行扩增反应的试剂。
30.根据权利要求27到29中任意一项的试剂盒,进一步包括进行扩增反应和/或检测扩增的目的片段的固体载体。
31.根据权利要求30的试剂盒,所述固体载体是芯片或载玻片。
32.根据权利要求27到31中任意一项的试剂盒,进一步包括适于检测特定的目的片段的探针。
33.实施权利要求1到26中任意一项的方法的装置,所述装置包括(a)在其上进行根据权利要求1到26中任意一项的方法的固体载体,(b)用于检测由(a)在固体载体上得到的扩增产物的设备,以及(c)或者存储的由对照样品得到的对照数据,所述对照样品中预先确定的序列以已知的多度存在,或者(d)对照物位点,在所述位点上可以在与权利要求1到26中任意一项的方法相同的条件下分析对照样品。
全文摘要
本发明涉及一种确定样品中预先确定的序列或者多个与该预先确定的序列相同或几乎相同的序列的多度的方法。该方法包括以下步骤进行一个或多个扩增反应,通过所述反应可以将样品该一或多个序列的多个不同片段扩增成扩增产物,检测样品中该序列的确定的不同片段是否被扩增,以及通过扩增产物中确定的不同片段存在或不存在的多度来确定样品中该一或多个序列的多度。
文档编号C12Q1/68GK1997757SQ200580021916
公开日2007年7月11日 申请日期2005年7月27日 优先权日2004年7月27日
发明者沃夫冈·曼, 克里斯托弗·高尔 申请人:阿德瓦里提克斯股份公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1