通过同时探查和酶介导检测的多态性基因座多重分析的制作方法

文档序号:411812阅读:511来源:国知局
专利名称:通过同时探查和酶介导检测的多态性基因座多重分析的制作方法
技术领域
本发明总体上涉及分子诊断学和遗传分型或分析(profiling)。本发明涉及用于高度多态性基因的多重分析的方法、过程和探针。本发明还涉及人白细胞抗原(HLA)基因复合物和囊性纤维化跨膜传导调节蛋白基因(CFTR)的分子分型和分析(profiling),并且涉及与之相关的组合物、方法和设计。
背景技术
有效、快速且明确地分析目的基因核酸序列多态性的能力在分子诊断方法的发展中起重要作用,它的用途包括遗传检测、载体筛查、基因分型或遗传分析(profiling)以及鉴定试验。例如,遗传检测和载体筛查的目的是确定目的基因中是否存在与一种具体疾病有关的突变。无论多态性基因座是否含有已知致病的突变,对它们的分析通常有利于临床,例如在药物基因组基因分型或HLA分子分型中,测定同种异体组织和骨髓移植的移植供体与预期受体的HLA基因座中等位基因的匹配程度。
当希望使大量患者标本的分析容易进行时,多态性的多重分析面临相当高的复杂性,由于新的多态性、遗传标记和突变需要被识别并且必须被包括在分析中,这种复杂性将可能增加。需要处理这种多重形式分析中的复杂性,以确保可靠的测定性能、并适应高样本量,但现有方法对这种复杂性的处理具有局限性,因此需要新的多态性和突变的多重分析方法,这是本发明的主题。例如,用本发明的方法分析编码囊性纤维化跨膜传导(CFTR)通道和人白细胞抗原(HLA)的遗传基因座。囊性纤维化(CF)是白种人中最常见的隐性疾病之一,在美国的发病率为2000个活产儿中有1例。人群中约有4%携带一种CF突变。CFTR基因具有高度变异性迄今为止已经鉴定了超过900种突变(参见http//www.genet.sickkids.on.ca/cftr,在此引用作为参考)。CFTR基因的表征通过促进序列特异性探针的发展,提供了CF分子诊断的钥匙(Rommens等人,1989;Riordan等人,1989;Kerem等人,1989,均在此引用作为参考)。国立卫生研究院(NIH)资助的共同发展会议推荐对具有CF阳性家族史的成人进行CFTR突变的载体筛查(NIH1997)。美国医学遗传学学院(ACMG)载体筛查委员会推荐在总人口载体筛查中使用全人种突变组(pan-ethnic mutation panel),其中包括一组2 5种致病CF突变,它们在美国总人口中的等位基因频率>0.1%(参见http//www.faseb.org/genetics/acmg,在此引用作为参考)。ACMG组中的突变也包括德系犹太人和非洲-美洲人群中最常见的突变。
已经报道了检测CFTR突变的几种方法,包括变性梯度凝胶电泳(Devoto等人,1991);单链构象多态性分析(Plieth等人,1992);限制性片段长度多态性(RFLP)(Friedman等人,1991);使用等位基因特异性引物(ASPs)的扩增(Gremonesi等人,1992),和使用等位基因特异的寡核苷酸(ASO)探针杂交(Saiki等人,1986)。广泛使用的一种方法包括PCR扩增,随后将扩增的靶链印迹到膜上,用可匹配正常(“野生型”)或突变构型的寡核苷酸对这些链进行探针杂交。具体而言,在这种斑点印迹形式中多重PCR与ASO杂交被联合使用以筛查12种CF突变(Shuber等人,1993)。在几种情况下,利用基质固定的寡核苷酸探针阵列以“反向斑点印迹”形式进行对已知基因组DNA序列变异的检测(Saiki,RK等人,1989)。通过光蚀刻(photolithographic)法原位合成的短寡核苷酸阵列被用来检测CFTR基因编码区中的已知突变(Cronin,MT.等人,1996)。已经报告了使用逆转录酶的引物延伸作为检测CFTR中Δ508突变的一种方法(Pastinen,T.,2000)。该方法早在1989年即已报道(Wu,D.Y.等人,Proc.Natl.Acad.Sci.USA.862757-2760(1989),Newton,C.R.等人,Nucleic Acids Res.172503-2506(1989))。如在下文中进一步讨论的,尽管在研究实验室设置中提供了合理的检测,但是这些方法需要相当的劳动,周转时间慢,样本处理能力低,因此每个样品需要的成本高。
关于点状微阵列,曾经描述了几种点样方法,以及多种固定探针的基质材料和方法。然而,现有方法的点状阵列不仅显示显著的阵列-阵列可变性,而且显示显著的斑点-斑点可变性,这是使测定的可靠性和灵敏度受到限制的一个方面。另外,点状阵列难以小型化到小于目前的斑点大小(一般为500μm的中心上100μm直径),从而增加了总样本体积,导致较慢的测定动力学,限制了杂交测定的性能,在点状阵列上可能需要多达18小时才能完成。此外,点状阵列的使用包括用高度专业化的聚焦激光扫描装置读取数值。在一个替代方法中,描述了用光蚀刻法原位合成的寡核苷酸阵列。然而,制造阵列的复杂性限制了常规定制,费用昂贵,并且在诊断应用中缺乏灵活性。
主要组织相容性复合物(MHC)包括人白细胞抗原(HLA)基因复合物,它位于人6号染色体的短臂上。该区编码调节作为免疫应答基础的细胞-细胞相互作用的细胞表面蛋白。不同的HLA I类基因座编码44,000道尔顿的多肽,它们在细胞表面与β-2微球蛋白结合,介导细胞毒性T淋巴细胞对靶细胞的识别。HLA II类基因座编码细胞表面的杂二聚体,它由29,000道尔顿和34,000道尔顿的多肽组成,介导辅助T淋巴细胞对靶细胞的识别。HLA抗原通过在“自身”蛋白质中向T细胞呈递外源致病肽介导免疫应答的启动。因此,大的肽系统是需要的,因为它提高了宿主的免疫应答能力。另一方面,相应的高度免疫遗传多态性是异体移植中的显著难点,HLA基因座的错配是异体移植物排斥的主要原因之一。供体与预期受体的HLA基因座中等位基因的匹配程度是异体组织和骨髓移植成功的一个主要因素。
HLA I类区的HLA-A、HLA-B和HLA-C基因座以及HLA II类区的HLA-DRB、HLA-DQB、HLA-DQA、HLA-DPB和HLA-DPA基因座具有极高的多态性。迄今为止,WHO的HLA系统因子命名委员会已经命名了225种HLA A等位基因(HLA A*0101,A*0201等),444种HLA-B等位基因,111种HLA-C等位基因,358种HLA-DRB等位基因,22种HLA-DQA等位基因,47种HLA-DQB等位基因,20种HLA-DPA等位基因和96种HLA-DPB等位基因(参见IMGT/HLA序列数据库,http//www3.ebi.ac.uk80/imgt/hla/index.html和Schreuder,G.M.Th.等人,Tissue Antigens.54409-437(1999),均在此引用作为参考)。
HLA分型是用来测定移植供体免疫遗传谱的一种常规方法。HLA分型的目的在于以目的基因座内一组指定多态性的分析为基础,以需要的分辨水平测定患者的等位基因构型。HLA的分子分型日益成为优于传统血清学分型的选择方法,因为它不需要活细胞,具有更高的等位基因分辨率,并且将HLA分型扩展到血清学不适用的II类(Erlich,H.A.等人,Immunity.14347-356(2001))。
当前用于临床HLA分型的一种方法使用聚合酶链反应(PCR)和序列特异的寡核苷酸探针(SSO或SSOP),该探针可以与扩增的靶序列杂交,产生一种图谱,作为HLA分型的基础。
全部现有HLA等位基因的序列信息允许设计用于表征已知HLA多态性以及杂交测序的序列特异寡核苷酸(SSO)和等位基因特异寡核苷酸(ASO)(Saiki,R.K.Nature 324163-166(1986),Cao,K.等人,RevImmunogenetics,19991177-208)。
在SSO分析(也被称为“斑点印迹形式”)的一个实施方案中,从患者中提取DNA样品,扩增,以8×12网格的形式印迹到一组尼龙膜上。向每个膜的每个斑点上添加一种放射性标记的寡核苷酸探针;在杂交后,通过放射自显影检查斑点,并评分为阳性(1)或阴性(0)。对于每个患者样品,通过分析所有膜所构建的1和0的字符串决定了等位基因的构型。“反向斑点印迹形式”的多重SSO分析方式使用固定在平面载体上的几组寡核苷酸探针(Saiki,R.等人,ImmunologicalRev.167193-199(1989),Erlich,H.A.Eur.J.Immunogenet.1833-55(1991))。
另一种HLA分型方法使用聚合酶催化的序列特异性引物的延伸(SSPs)来辨别等位基因。DNA聚合酶的高度特异性通常使这种方法具有良好的特异性。在SSP方法中,使用对于每种多态性序列基序或基序对特异的引物对和缺乏3′→5′外切核酸酶活性的DNA聚合酶进行PCR扩增,使得只有3’端与模板完全互补(“匹配”)的引物才发生延伸(因而扩增)。相应PCR产物的存在通过凝胶电泳分析确定。高度多态性基因座的一个实例是HLA II类DR基因的280nt DNA片段,其具有多态性发生率高的特征。
以使用序列特异性探针(SSP)为基础的HLA分型,也被称为表型分型(phototyping)(Dupont,B.Tissue Antigen.46353-354(1995)),已经发展为一种常规用于I类和II类分型的商品化技术,(Bunce,M.等人,Tissue Antigens.46355-367(1995),Krausa,P和Browning,M.J.,Tissue Antigens.47237-244(1996),Bunce,M.等人,Tissue Antigens.4581-90(1995))。然而,现有技术水平的SSP方法对分别检测扩增子的广泛凝胶电泳分析的要求严重阻碍了能够达到高处理量的多重测定形式的实施。而本发明的方法能够克服这一缺点。
在以前的应用、特别是在多重形式中,没有考虑到延伸反应中高度多态性基因座,和非指定多态性位点作为干扰性多态位点的作用。因此,需要提供能够检测指定位点、并且适应非指定位点的存在而不受这些非指定位点干扰的用于多态性基因座多重分析的方法、组合物和过程。
发明概述本发明提供在非指定多态性位点存在下同时探查多个指定多态性位点而不受这些非指定位点干扰的方法和过程。提供了便于这种同时探查的几组探针。本发明还提供了识别HLA基因复合物和CFTR基因的多态性的方法、过程和探针。
利用探针延伸或延长的检测方法,其特异性在本质上优于利用杂交的方法,特别是在多重形式中,因为序列构型的辨别不再依赖于差异性杂交,而是依赖于酶识别的保真度。迄今为止,酶介导分析方法的绝大多数应用都使用单碱基探针延伸。然而,类似于HLA分型SSP方法中所使用的,探针延伸如本文所述为多态性的多重分析提供了几个优点。例如,容易适用于单核苷酸以及多核苷酸多态性。如此处所述的方法通常仅用单标记物检测即可实施,适于同时以及连续地探查多态性基因座,并且兼顾探针设计的复杂性。
本发明一方面提供一种用于同时测定一个或多个靶核苷酸序列内多个指定多态性位点的核苷酸组成的方法。该方法包括下列步骤(a)提供一组或多组探针,每个探针都能与一个指定多态性位点附近范围内的该一个或多个靶核苷酸序列的亚序列退火;(b)使这组探针接触该一个或多个靶核苷酸序列,形成杂交复合物,使探针序列内的探查位点与该指定多态性位点直接比对(alignment);(c)对于每种杂交复合物,确定探查位点与指定多态性位点之间是匹配还是错配;和(d)确定该指定多态性位点的组成。
本发明还提供一种用于序列特异地放大在分析生物样品的目的核酸序列时产生的测定信号的方法。该方法包括下列步骤(a)提供能够与目的序列形成杂交复合物的一组固定化探针;(b)在可使目的序列与至少一种固定化探针退火形成杂交复合物的条件下,使这组固定化探针接触含有目的序列的生物样品;(c)将杂交复合物与一种聚合酶接触,使杂交复合物内所含的探针延伸或延长;(d)将探针的延伸或延长转换为光学信号;和(e)实时记录这组固定化探针发出的光学信号。
本发明还提供一种形成用于同时探查位于一个或多个靶核酸序列内的指定多态性位点的覆盖探针组的方法。该方法包括下列步骤(a)确定其探查位点能够与指定多态性位点比对的延长探针的序列;(b)进一步测定一组完全的简并探针,以适应所有非指定位点以及未选择的指定多态性位点,同时仍能使探针的探查位点与指定多态性位点比对;和(c)通过除去所有被包容的多态性,降低简并性程度。
本发明提供识别靶多核苷酸序列内一个或多个指定位点处多态性的方法。该方法包括下列步骤(a)提供一种或多种能够探查所述指定位点的探针;(b)为每个指定位点赋值,同时适应位于每个这种多态性附近范围内的非指定多态性位点。
本发明还提供识别靶多核苷酸序列内一个或多个指定位点处多态性的方法。该方法包括为这些指定位点提供一个探针组,并且根据每种探针的末端延伸的起始将该探针组分为不同的探针亚组。
本发明还提供同时探查多个多态性位点的方法,包括通过应用一个或多个温度循环实现靶标的线性扩增,进行多重延伸测定的步骤。
本发明还提供同时探查多个多态性位点的方法。该方法包括在温控条件下运用退火和延伸步骤的组合进行多重延伸测定的步骤。
本发明还提供一种用于同时探查一个或多个相邻靶序列内S个多态性位点处核苷酸组成的方法,Ps={cp(s);1≤s≤S},该方法通过进行下列步骤,给每个cp赋予一组有限可能数值中的一个(a)提供一组指定的固定化寡核苷酸探针(也叫延伸探针),每种探针在优选比对中均能与位于指定多态性位点附近的靶标亚序列退火,这种优选比对使探针序列内的一个探查位点与指定的多态性位点直接并列,该探针还含有能够启动延伸或延长反应的末端延伸起始(TEI)区;(b)使一个或多个靶序列与这组固定化寡核苷酸探针退火,形成探针-靶杂交复合物;(c)对于每种探针-靶杂交复合物,确定探查位点与相应指定多态性位点之间组成的匹配或错配。
结合下述实施方案(仅用于说明目的)的详细描述,可以更加清楚地理解本发明的其它目的、特征和优点。
附图简述

图1a是设计用来探查HLA-DR中指定位点的探针组和内部参照的图示。
图1b是交错引物设计的图解。
图2是基于容错效应的等位基因结合模式的变化图示。
图3是使用连接的引物结构分离锚定序列和多态性检测序列的图示。
图4显示模拟的由等位基因组合引起的等位基因识别的不确定性。
图5显示一种用来降低由等位基因组合引起的等位基因识别的不确定性的方法。
图6是杂交和延伸组合的图示。
图7显示用合成寡核苷酸作为靶标的一种模型反应。
图8显示以eMAP形式检测真实患者标本获得的结果。
图9显示DR基因座的eMAP引物延伸结果。
图10显示DR基因座的eMAP结果。
图11显示A基因座外显子3的eMAP结果。
图12显示A基因座外显子3的eMAP SSP结果,这是非指定多态性的一个包容实例。
图13是可变突变位点的微珠固定化探针延伸的图示。
图14是使用固定于微珠表面的引物进行的PCR的图示。
图15是使用组合PCR产物进行的多探针延伸的图示。
图16是多重CF突变的探针延伸结果图示。图16a是使用合成靶标的探针延伸图示。图16b是在PCR反应中使用微珠进行的探针延伸图示。
图17是具有温控循环的一步延伸的结果图示。
图18是使用标记的dNTP和其它3种未标记dNTPs的引物延伸图示。
图19是使用标记的ddNTP和其它3种未标记dNTPs的引物延伸图示。
图20是引物延伸的图示,其中用4种未标记的dNTPs进行延伸,产物用可与延伸的未标记产物杂交的标记寡核苷酸探针检测。
图21是引物延伸的图示,其中添加一种标记的靶标和4种未标记的dNTPs。该图表明,在对芯片施以高温时,只有使用延伸产物才能使微珠保留标记的靶标。
图22是序列特异性探针所固定的线性扩增的图示。
图23是发夹探针的应用图示。
图24是本发明用于分析囊性纤维化和德系犹太人疾病突变的说明。
发明详述本发明提供用于高度多态性基因座多重分析的组合物、方法和设计;高度多态性基因座即特征在于高密度特定的(“指定的”)多态性位点以及干扰性非指定多态性位点的基因座。这些位点的多重分析通常涉及针对同一靶标上相邻位点的探针序列的显著重叠,以致为任何特定或指定位点设计的探针通常也覆盖相邻的多态性位点。现有技术也没有解决包括CFTR和HLA在内的重要基因的分析中的干扰。为了举例说明本发明的方法,分析了HLA基因复合物和CFTR基因。
本发明提供用于平行或多重分析显示高密度多态性位点的核酸序列中多态性(“MAP”)的组合物和方法。在一个给定的核酸序列中,每个多态性位点包含一个或多个核苷酸的差异。
本发明提供用于同时探查核酸序列内整个一套所指定多态性的方法和组合物。本发明提供用来测定每个这种位点处组成的组合物、方法和设计,从而提供从目的序列的这组可能构型中选择给定具体样品的实际构型的必要信息。本发明也用来缩小该样品中这组可能序列的范围。因此,在某些实施方案中,通过分配给一个指定位点对应于核苷酸身份的可能的数值之一来确定序列组成是有用的或是必要的。在其它实施方案中,确定与已知参照序列匹配或非匹配的位点组成就足够了,如在本文的突变分析中对“野生型”或“突变”的指定。由此提供的序列测定的能力在此被称为确证性测序或重测序。在一个优选实施方案中,本发明提供了对囊性纤维化跨膜传导调节蛋白(CFTR)基因和人白细胞抗原(HLA)基因复合物的延伸介导的多态性多重分析(eMAP)。
本发明的方法和组合物可用于提高靶区多态性分析的可靠性和精确性,该靶区中除了要探查的多态性位点之外还含有其它多态性位点。这些非指定位点是分析中干扰的来源。根据具体的测定应用,对于同一多态性位点可以涉及一种或多种不同组成的探针,如此处提供的几个实施例所详述。本发明的一个具体目的在于提供有效、快速、确定的分析目的基因多态性的组合物和方法。这种分析可用于分子诊断学检验,例如为了遗传学检测、载体筛查、基因分型或遗传分析、鉴定实验、亲子鉴定和法医所设计的实验。
靶序列的制备可以用本领域公知的方法进行。在一个非限制性实施例中,从患者获得细胞或组织样品。然后用标准技术如PCR(例如非对称PCR)扩增含有靶序列(例如HLA的外显子2和3)的核酸区。
当所分析的多态性位点的组成与该探针中的比对位点互补(“匹配”)时,用于检测多态性位点的探针作为聚合酶催化的延伸反应的起点。本发明的探针通常足够长,以避免与无关的DNA靶序列退火。在某些实施方案中,探针的长度可能约为10-50个碱基,更优选地约15-25个碱基,更优选地18-20个碱基。可以利用本领域公知的方法和组合物将探针通过接头部分固定于固体载体上。
此处所用的术语“核酸”或“寡核苷酸”是指单链或双链形式的脱氧核糖核酸或核糖核酸。该术语也包括具有合成骨架的核酸样结构。DNA骨架类似物包括磷酸二酯、硫代磷酸酯、二硫代磷酸酯、甲基膦酸酯、氨基磷酸酯、烷基磷酸三酯、氨基磺酸酯、3′-硫缩醛、亚甲基(甲基亚氨基)、3′-N-氨基甲酸、吗啉代氨基甲酸酯和肽核酸(PNAs)。参见《寡核苷酸和类似物,实用方法》(编者F.Eckstein),牛津大学出版社IRL出版社(1991);《反义策略》,纽约科学院年报,vol.600,编者Baserga和Denhardt(NYAS 1992);Milligan,J.Med.Chem.,vol.36,pp.1923-1937;《反义研究和应用》(1993,CRC Press)。PNAs含有非离子骨架,如N-2(2-氨乙基)甘氨酸单位。硫代磷酸酯键在WO 97/03211;WO 96/39159;和Mata,Toxicol.Appl.Pharmacol.144189-197(1997)中有描述。该术语所包括的其它合成骨架包括甲基膦酸酯键或交替的甲基膦酸酯键和磷酸二酯键(Strauss-Soukup,Biochemistry,368692-8698(1997)和苄基膦酸酯键(Samstag,Antisense Nucleic Acid Drug Dev.,6153-156(1996))。术语“核酸”包括基因、cDNAs和mRNAs。
如此处所用的术语“杂交”是指一种核酸分子优先与一种特定的核苷酸序列在严格条件下结合、形成双链或杂交。术语“严格条件”是指探针优先与相应靶序列杂交,而与其它序列很少杂交或者根本不杂交的条件。“严格杂交”是依赖于序列的,在不同条件下不同。核酸杂交的详尽指南可见于例如Tijssen,《生物化学和分子生物学实验室技术》(Laboratory Techniques in Biochemistry and MolecularBiology),Elsevier,NY(1993)。高度严格的杂交和洗涤条件通常选择为比具体序列在确定离子强度和pH下的热熔点(Tm)约低5℃。Tm是50%的靶序列与完全匹配的探针杂交时的温度(在确定的离子强度和pH下)。极严格条件的选择是在等于一种特定探针的Tm的温度下进行测定。高度严格洗涤条件的一个实例是用0.15M NaCl在72℃下洗涤约15分钟。严格洗涤条件的一个实例子是用0.2×SSC在65℃下洗涤15分钟。参见Sambrook,《分子克隆实验室手册》(第二版),vol.1-3(1989)。
如此处所用的术语“指定位点”被定义为一种给定核酸上的目的多态性位点(即准备识别的多态性位点)。术语“非指定位点”是指与指定位点共存的任何多态性位点或给定核酸上非目的位点的位点。
如此处所用的术语“相关指定位点”是指相关存在的多态性位点。一般而言,为了识别这组多态性位点所属的等位基因,必须识别该组的每个成员。
如此处所用的术语“选择的指定位点”是指一种给定核酸上也与本发明探针序列的3’端重叠的目的多态性位点。“非选择的指定位点”是指不与本发明探针序列的3’端重叠的目的多态性位点。
如此处所用的“干扰性非指定位点”是指距离本发明探针序列的3’端1-5个碱基以内的非指定多态性位点。“非干扰性非指定位点”是指距离本发明探针序列的3’端超过5个碱基的非指定位点。非干扰性非指定位点端可能更靠近探针序列的5’端(与3’端相比)。
在某些实施方案中,本发明的探针包含一个“末端延伸起始”区(也被称为″TEI″区)和一个双链锚定(″DA″)区。TEI区涉及探针序列的一部分,一般是探针的3个或4个3’端位点。TEI区用来与部分靶核酸序列在指定多态性位点处比对,以启动聚合酶催化的探针延伸。DA区一般包含探针序列内的其它位点,优选地用来与部分靶序列在靠近(3-5个碱基以内)指定多态性的区域内比对。
如此处所用的术语“紧邻范围”是指沿给定核酸链1-5个碱基的距离。“附近范围”是指沿给定核酸链1-10个碱基的距离。术语“容错范围”是指与靶序列杂交的探针的TEI区中仍然允许探针退火和延伸的错配总数。一般而言,杂交探针TEI区中2个以上的错配即超出容错范围。
术语“微球”、“微粒”、“微珠”和“颗粒”在此可以互换使用。微珠的组成包括但不限于塑料、陶瓷、玻璃、聚苯乙烯、甲基苯乙烯、丙烯酸系聚合物、顺磁材料、氧化钍溶胶、碳石墨、二氧化钛、乳胶或交联葡聚糖如琼脂糖、纤维素、尼龙、交联胶束和特氟隆。参见BangsLaboratories,Fishers IN的《微球检测指南》。这些颗粒不必是球形的,可以是多孔的。微珠的大小可以由纳米级(例如100nm)到毫米级(例如1mm),约0.2微米到约200微米的微珠是优选的,更优选地,约0.5微米到约5微米的微珠是特别优选的。
本发明用于同时探查一条或多条靶链内的一组指定多态性位点的方法,包括首先使一组固定的序列特异性寡核苷酸探针与靶核酸链退火,通过该组退火的序列特异性固定化寡核苷酸探针的聚合酶催化的延伸,探查指定多态性位点的构型。一种延伸探针通过与一种给定靶标的序列退火,从而形成杂交复合物(“双链体”),来探查指定位点。探针的3’端位于或靠近靶标内的指定位点,如果3’端探针的组成与靶标在探查位点处的组成匹配(即互补),则聚合酶催化的探针延伸启动。如此处所述,探针可以被设计成以指定位点位于3’端附近范围内的方式退火。
在本发明的一个实施方案中,一个具体指定位点的探查可以使用一种或两种探针。设计探针时考虑探查位点和指定多态性位点附近一定范围内非指定多态性位点处的多态性或突变的可能性。在本文中,术语“多态性”是指核酸序列中的任何变化,而术语“突变”是指与一种表型有关或认为与表型有关的基因序列变化。在一个优选实施方案中,这多种探针序列中包括与附近范围内的所有位点中的具体靶序列匹配的至少一种探针,以确保延伸。
在某些实施方案中,本发明公开了用一组L≥S个寡核苷酸引物来平行探查选自长度为N的靶序列的S个多态性位点的组合物和方法。
根据具体测定应用的需要,同一多态性位点可以使用一种或多种不同组成的探针,如此处提供的几个实施例所详述。
每种指定探针均由长度为M的核苷酸序列组成,该序列在3’端处或附近含有一个探查位点(即,在杂交后与所分析的多态性位点比对)。尽管3’端是优选的,但是也可以使用距3’端3-4个碱基内的位点。引物固定于固相载体上(可以通过接头序列或其它接头部分连接),并且根据它与载体的结合来鉴定。探针序列被设计为允许引物与靶标退火,以在探针与靶标之间形成杂交复合物,确保探查位点与指定多态性位点的比对,优选构型在探针的3’端提供一个探查位点,并且3’端与指定多态性位点比对。用特定探查位点组成的指定探针探查指定多态性位点的核苷酸组成,此步骤为该位点分配两个值中的一个,即匹配的,数字表示为1,或非匹配的,数字表示为0。在HLA分子分型中,获得的长度为L的二进制串以理想的分型分辨率识别等位基因。
在一个优选实施方案中,探查步骤利用指定探针的延伸。按照反映现有杂交复合物中靶序列的顺序向探针序列中添加一个或多个三磷酸核苷,聚合酶催化的这种反应产生延伸的杂交复合物。为了使这种延伸反应继续进行,长度为M的指定引物必须含有一个长度为M*≤M的末端延伸起始区,在此也被称为末端延伸起始序列(或TEI序列),该序列含有探查位点。如果指定探查位点的组成与指定多态性位点的组成匹配,则延伸正常进行。
现有技术中对检测成功延伸的方法已有描述,包括使用标记的脱氧三磷酸核苷(dNTPs)或二脱氧三磷酸核苷(ddNTPs)。本发明也公开了为检测成功延伸提供光学标签的新方法,它不需要标记的dNTPs或ddNTPs,这是一种优点,因为现有的聚合酶引入标记的dNTPs或ddNTPs的效率低。
然而,本发明所述高度多态性基因座中多态性位点的密度,使得当与靠近指定多态性位点的靶亚序列退火时,针对所选多态性位点的指定引物可能与相邻的多态性位点重叠。
也就是说,一种用来探查靶标在所选多态性位点之一处的构型的寡核苷酸探针,为了在与正确的靶亚序列退火中确保特异性和热稳定性而将其构建为足够的长度,该探针将与邻近的其它多态性位点比对。这些干扰性多态性位点可包括非指定位点,以及靶序列内未选择的指定位点。
在溶液中进行的一种多重SSP反应中,针对选择的邻近多态性的指定探针之间的部分重叠可能导致探针之间互相竞争同一靶标。本发明通过探针固定化显著减少了这种复杂性。
对于多重差异杂交,指定探针与靶标之间一个或多个位点的错配可能影响杂交复合物的热稳定性。即,施加于整个反应混合物的任何一组退火条件可以在探针与靶标之间产生不同程度的退火,并且可能影响随后探针延伸反应的结果,从而使随后可能需要亚序列重测序的实验具有不确定性。
紧邻位于指定探针3’端或其附近的探查位点的非指定多态性位点特别不利于探针TEI序列启动延伸反应的效率。
鉴于单核苷酸以及多核苷酸多态性,目前可用的催化延伸反应的聚合酶辨别指定引物内探查位点与多态性位点组成之间匹配与错配的能力取决于从引物的3’端对探查位点的替换。
在一个产生最佳辨别力的优选实施方案中,探查位点位于探针的3’端。假定使用一种长度为M、针对公式PM(S*)={cp(m);1≤m≤M}中的选择位点s*而设计的探针序列(系数m以引物的5′至3′方向增加),这种构型提供了指定位点s*与探针序列中位点M的比对;对于多核苷酸的多态性,也涉及位点M-1(对于二核苷酸多态性)和M-2(对于三核苷酸多态性)等。
在高度多态性基因座多重分析所预料的情况下,由于与限制SSO分析效力密切相关的“次最佳”退火条件引起的复杂性,使用聚合酶催化延伸反应所带来的特异性提高的优点大大减少或丧失。
对于任何给定的指定多态性位点具有相同探查位点组成的多重探针序列,其设计的优化应考虑干扰性多态性包容的概念。在不限制普遍性的条件下考虑单核苷酸多态性的例子,s*的比对从3’端向位点M-1、M-2、...、M-m*的位移致使分辨力逐渐减弱。也就是说,当指定多态性位点与内部探针位点m*比对时,延伸反应不再能辨别匹配和错配。反之,在探查位点位于探针3’端的优选实施方案中,附近的非指定多态性对延伸反应效率的不利影响同样随着与3’端的距离而降低。也就是说,与1和m*之间的位点比对的非指定多态性不影响延伸反应。
探针内长度为M-m*+1的末端序列在此被称为给定引物的TEI序列。通常1<m*<M,TEI序列可能只包含少量的末端探针位点;在某些情况下,m*=1,因此探针序列包含完整的探针序列。
通过在多重探针设计中考虑到干扰性多态性位点的公知序列变异,本发明适应在指定探针序列长度内存在这些干扰性多态性位点。具体而言,由于存在长度为M-m*+1的TEI序列,用于给定探针长度M的备选探针序列构型的数量显著减少。也就是说,为了确保延伸反应的有效分辨力,使预期的备选探针序列的构型限于TEI序列的长度即足够。在一个优选实施方案中,预先考虑所有可能的备选序列,这样这些备选探针序列之一将在所有位点m*、m*+1、...、M-1、M与靶标匹配。
对于每个选择的多态性位点,如果所有指定探针都是通过与编码的固相载体单独结合来分别编码,则这些具有预期序列的探针的多样性增加了编码的复杂性。但是,将这组探针置于常用固相载体上可以减少这种复杂性。也就是说,对于任何指定探针,只有其探查位点的组成被编码,这一概念在此被称为TEI序列汇集(pooling)或探针汇集。完全的探针序列汇集使编码复杂性降低到原始设计的程度,其中没有预期的探针序列。也可以是部分汇集。
在某些优选实施方案中,探针延伸中使用的聚合酶是缺乏3’-5’外切核酸酶活性的DNA聚合酶。这类聚合酶的实例包括T7 DNA聚合酶、T4 DNA聚合酶、ThermoSequenase和Taq聚合酶。当靶核酸序列是RNA时,可以使用逆转录酶。除了聚合酶之外,还添加三磷酸核苷,优选地添加所有4种碱基。例如可以添加dNTPs或类似物。在其它某些实施方案中,可以添加ddNTPs。标记的核苷酸类似物,如Cye3-dUTP,也可以用来进行检测。
使用标记的脱氧三磷酸核苷(dNTPs)或双脱氧三磷酸核苷(ddNTPs)来检测成功延伸的现有技术方法已经被描述。本发明公开了用光学标签检测成功延伸的新方法,因而不需要使用标记的dNTPs或ddNTPs。这是有利的,因为现有的聚合酶在应用于标记dNTPs或ddNTPs中效率较低。
本发明提供用于对高度多态性靶区进行精确多态性分析的方法和组合物。在这里,高度多态性序列是指在探针接触的一部分序列内不仅含有指定或探查的多态性位点,而且含有潜在分析误差来源的非指定多态性位点的序列。类似的考虑与多重PCR反应的设计、组合物和方法有关。在一个优选实施方案中,由引导和退火亚序列组成的覆盖(covering)性多组PCR探针在编码的微粒上展示,通过探针延伸产生微珠展示的扩增子。微珠的装配可以在扩增之前或之后在平面基质上形成,以实现探针的解码和成像。
在一个实施方案中,本发明提供含有3’端“引导”亚序列(在此也被称为末端延伸起始(TEI)区)和退火亚序列(在此也被称为双链锚定(DA)区)的探针。TEI区一般包含探针序列的3个或4个3’端位点。TEI区用来与指定多态性位点处的部分靶序列比对,以启动聚合酶催化的探针延伸。探针延伸说明整个TEI区的组成和靶序列的相应部分完全匹配。包含探针序列内其余位点的DA区优选地用来与靠近(3-5个碱基内)指定多态性的区域内的部分靶序列比对。双链锚定区用来确保特异且强的退火,并非用于多态性分析。如此处所述,DA和TEI区可能在探针内彼此直接相邻,或者可以通过分子链(moleculartether)连接。后一种方法使DA区的位置具有灵活性,以避开与指定位点直接相邻的非指定多态性。选择DA区的组成和长度,以实现形成稳定的序列特异性杂交复合体(“双链体”),同时适应(即考虑)位于该靶区内的一个或多个非指定多态性的存在。选择退火亚序列的长度,通过使探针与未选择靶亚序列之间的序列同源性最小化,使得交叉杂交最小化。退火亚序列的长度通常超过引导亚序列的长度,因此不能形成双链体通常意味着不能产生延伸产物。
延伸反应在检测位于TEI区内的多态性上具有高特异性。对于DA区中的非指定多态性,延伸反应以相当于或低于某些条件下完全匹配的水平进行。这被称为延伸反应的容错效应。如此处实施例所述,在探针设计中利用容错性来分析指定和非指定的多态性。
本发明某些实施方案所述的高度多态性基因座中多态性位点的密度使得当针对指定多态性位点的探针与靠近指定多态性位点的靶亚序列退火时,能够与相邻的多态性位点重叠。也就是说,一种用来探查选择的指定多态性位点处靶标的构型、并被构建为具有与正确靶亚序列退火中足以确保特异性和热稳定性的长度的寡核苷酸探针,将与邻近的多态性位点比对。这些干扰性多态性位点可能包括靶序列中的非指定位点,以及指定的但是未选择的多态性位点。
具体而言,本发明所预期的非指定多态性可能干扰双链体的形成,从而干扰或完全抑制探针延伸。在一个实施方案中,本发明提供包容这些非指定多态性的覆盖探针组的设计。一个覆盖探针组包括用于同时探查核酸序列内指定多个多态性位点的探针。对于每个位点,覆盖探针组包括至少一种能够与靶标退火的探针,以便在随后延伸反应的基础上,为该位点分配两个可能的值之一“匹配的”(延伸)或“不匹配的”(不延伸)。
可与每个指定位点结合的覆盖探针组可以含有在一个或多个位点处不同的两种或多种探针,在此也被称为简并组。在某些实施方案中,探针序列可含有能够与DNA中遇到的所有核苷酸形成碱基对的通用核苷酸。在某些实施方案中,探针可以附着于编码的微粒上,特别是,覆盖组或简并组中的两种或多种探针可以附着于同一类型的微粒上。两种或多种探针与微粒或微珠附着的过程被称为“探针汇集”。
这里,在遗传分析的两个代表性领域描述了与延伸介导的多态性多重分析有关的覆盖探针组的设计,(1)多个无关的指定多态性和突变的评分,如CF的突变分析和德系犹太人(AJ)疾病载体的筛查,和(2)一组相关多态性的评分,如HLA分子分型。在第一种情况中,用于突变全部多样性的覆盖组包括多个亚组,每个亚组与一个指定位点有关。在这种情况下,用两种或多种探针来确定杂合性。对于普通SNP鉴定和确证性测序,可以使用简并探针组,对于每个多态性位点该简并探针组可含有多达4种标记(例如微珠展示的)探针。在第二种情况中,覆盖组包括如此处详述的为使组中探针数量最小化而构建的亚组。指定探针组用来根据延伸图谱识别等位基因特异的序列构型。
这种包容或识别非指定多态性位点的方法尤其可以用于序列特异性探针的多重延伸,也可以与探针的单碱基延伸联合使用,也被称为微测序(参见例如Pastinen等人,Genome Res.7606-614(1997),在此引用作为参考)。
与单碱基探针延伸方法不同,本发明的延伸介导的分析方法不仅可以用来检测SNPs,而且也可以用来检测其它类型的多态性,如多(例如二、三等)核苷酸多态性,以及在高度多态性基因座如HLA的分型中常见的插入和缺失。在这些复杂系统中,根据本发明方法的序列特异性探针延伸简化了检测步骤,因为每个目的多态性靶位点使用两种或多种探针,并且检测步骤只用于检测两种或多种探针中哪一种被延伸了,而不是象单碱基探针延伸那样为了辨别两种延伸的探针而进行检测。因此,尽管本发明的方法适于在检测步骤中使用多种荧光团或发色团标记,但是一种通用标记通常足以进行序列特异的探针延伸。这与单碱基延伸方法相反,后者用于多重形式时至少需要两种荧光团或发色团标记。
DNA甲基化在某些实施方案中,提供了测定DNA甲基化状态的方法和组合物。胞嘧啶甲基化早已被认为是哺乳动物细胞中基因沉默的一个重要因素。在大量转录因子识别位点中的单CpG二核苷酸处,胞嘧啶甲基化足以阻断结合,并且与几种疾病有关。eMAP能够用来测定基因组DNA的甲基化状态,用于诊断和其它目的。DNA的修饰是通过亚硫酸氢钠处理将未甲基化的胞嘧啶转化为尿嘧啶。在除去亚硫酸氢盐并完成化学转化后,这种修饰的DNA被用作PCR的模板。设计了一对探针,一个对于目的基因已经甲基化的DNA特异,另外一个对于未甲基化的DNA特异。使用DNA聚合酶、一种标记的dNTP和3种dNTPs或ddNTPs的未标记混合物进行eMAP。特定微珠表面上的延伸产物能够表示甲基化状态。
选择性测序在本发明的其它一些实施方案中,选择性测序(也被称为“测序”)用于同时探查核酸序列内整个一组指定多态性,以测定每个位点处的组成。选择性测序能够提供必要的信息,用来从目的序列的一组可能构型中选择具体样品的实际构型,或者缩小该样品中可能序列组的范围。在选择性测序中,延伸反应使用的探针长度决定了能够测定的序列长度。对于较长的DNA序列,可以利用交错探针设计将序列连接在一起。因此,已知的序列组合能够得到证实,而未知的序列组合能够被识别为新的等位基因。
囊性纤维化载体筛查本发明的一个实际应用包括对囊性纤维化跨膜传导(CFTR)基因中一大组非指定突变在内的一组指定突变和多态性的分析。该组中的每个指定突变均与疾病有关,必须独立评分。在最简单的点突变中,使用两种编码探针以确保它们各自3’端与指定位点的比对,其中一种探针用于野生型,另一种用于改变的(“突变的”)靶序列。
然而,如此处几个实施例所述,为了确保无论指定位点附近的具体靶序列构型如何都能延伸,也用其它探针来匹配任何可能的构型。在一个优选实施方案中,构建一个覆盖探针组,其含有展示对应于相应靶亚序列所有已知或可能变异的TEI序列的探针。在位于指定位点附近的其它延伸抑制性非指定多态性的存在下,这确保了延伸。
在某些实施方案中,识别非指定位点中的具体靶构型不是必需的,只要覆盖组中提供的序列之一与靶序列精确匹配,因而在TEI区内与靶序列匹配以确保延伸即可。在这种情况下,具有相同3’端的所有或某些覆盖探针可以分配相同的编码。在一个优选实施方案中,这些探针可以与相同的固相载体结合(“探针汇集”)。探针汇集减少了代表TEI序列必需数量所需的不同固体载体的数量。在一个特别优选的实施方案中,固体载体是一组不同微粒或不同微粒阵列,它们可以原位解码。为了识别靶区内的其它多态性,覆盖探针组中包含其它探针是阐明不同群体的单倍型的有用方法。
HLA本发明的另一个应用包括人白细胞抗原(HLA)复合物的遗传分析,可以识别编码I类HLA抗原(优选地HLA-A、HLA-B、HLA-C或其任意组合)和II类HLA抗原(优选地包括HLA-DR、HLA-DQ、HLA-DP或其任意组合)的HLA区内的一种或多种等位基因。I类和II类基因座也可以同时分析。
与多个无关指定突变的独立评分相反,等位基因(或等位基因组)的识别依赖于完整的一组延伸反应的评分。这些反应的每一个包括一种或多种针对选择的一组指定多态性位点成员的探针。这组延伸反应产生一种特有的延伸信号模式。在一个优选实施方案中,产生一种二进制模式,为匹配(因而延伸的)探针赋值“1”,为未延伸的探针赋值“0”。给定长度的二进制模式(“串”)唯一地确定一种等位基因或一组等位基因。
HLA分型所需的探针总数取决于希望的分辨率。术语“分辨率”在此是指等位基因辨别的程度。优选地,本发明方法可以对足以辨别不同抗原组的HLA等位基因进行分型。例如,A*01和A*03是不同的抗原组,在临床应用中必须加以辨别。国家骨髓捐赠者计划(NMDP)为供体的分子分型推荐了一个系列(panel)。NMDP系列所需的低到中分辨的意思是无论何时不同抗原组都应当能够被辨别。此外,尽管不是所有等位基因都必需被辨别,一组内至少某些等位基因应当被辨别。在某些实施方案中,本发明可以如NMDP标准所定义的(www.NMDPresearch.org)(在此引用作为参考)对HLA等位基因以低到中分辨率分型。
以这样的分辨率,A*01、A*03等将总是能够被识别。A*0101和A*0102可能不是总能辨别。对于SSO法,现有的NMDP系列含有30种用于HLA-A的探针;48种用于HLA-B的探针;31种用于HLA-DR-B的探针。高分辨率的HLA分型是指每个组的大多数等位基因都被鉴定的情况。在这种情况下,A*0101和A*0102将被区别。为了达到这种分辨率,I类和II类分型需要约500-1000种探针。在某些实施方案中,本发明方法提供高分辨率的HLA分型,至少达到Cao等人在Rev.Immunogentics,1177-208(1999)(在此引用作为参考)所述的程度。
本发明还提供指定位点和为这些指定位点设计探针组的策略,以便根据延伸反应信号模式产生唯一的等位基因分配。覆盖探针的设计必须考虑每种探针的TEI和DA区的各自不同的功能。
构建可与给定指定位点结合的覆盖组探针,其中包括亚组。每个亚组又包括展示相同TEI区的探针。TEI区内一个位点的错配或DA区内三个或更多位点的错配将阻碍延伸。因此,组成上具有这种差异的两种探针的延伸通常产生不同的延伸模式。在平行延伸反应中所有这些探针都可能是多重的,只要它们被分别编码。在一个优选实施方案中,通过将探针附着于颜色编码的微珠完成编码。
展示相同TEI亚序列并展示在不超过2个位点上不同的DA亚序列的探针通常产生延伸反应,其产量(因而信号强度)相当于或低于完全匹配。在显示错配包容的第一种情况中,与所述探针匹配的等位基因组将扩展,以包括展示DA区内被包容错配序列构型的等位基因。在仅显示部分包容的第二种情况中描述了三种方法,来进一步阐明等位基因匹配模式。在第一种方法中,覆盖组包括在各自的DA区内展示一个或两个核苷酸多态性的探针。通过定量比较覆盖组内不同探针产生的信号强度获得有关靶序列的信息。在第二种方法中,使用包含通过链(tether)连接的分离的TEI和DA区的探针,使DA区更加远离TEI区,以避免靶多态性。在第三种方法中,探针被任选地汇集,使得匹配的等位基因组仅有限地扩增。
在本发明的某些实施方案中,探针优选地设计为与已知与HLA基因座内等位基因组合有关的某些靶序列互补。已知的多态性是文献中的或从可搜索的序列数据库(例如www.NMDProcessing.org)中能够获得的多态性。在某些实施方案中,目的HLA基因属于HLA I类组(例如HLA-A、HLA-B或HLA-C或其组合)。在其它某些实施方案中,目的HLA基因属于HLA II类组(例如DR、DQ、DP或其组合)。HLA I类和II类基因座可以组合检查和同时探查。
以前在SSP/凝胶法中使用的探针也可以在本发明中使用。优选地,Bunce等人,Tissue Antigen,46355-367(1995)和/或Bunce等人,Tissue Antigen,4581-90(1995)(均在此引用作为参考)所述的探针可在制备本发明的探针中使用。WO 00/65088;欧洲申请号98111696.5;WO 00/70006;和Erlich等人,Immunity,14347-356(2001)(均在此引用作为参考)提供的探针序列或HLA序列信息可以用于设计本发明的探针。
编码的微珠阵列的复杂性易于调节,以适应必需的分型分辨率。例如,当4种不同的亚阵列中均使用32种类型的微珠时,可以使用总共128种探针,在多重延伸反应中获得中等水平的HLA I类和II类分型分辨率。类似地,使用128种微珠和4种亚阵列,或64类微珠和8种亚阵列,可以使用总共512种探针,在多重延伸反应中获得高分辨率的HLA I类和II类分型。
编码的微珠阵列形式与高通量分析相适应。例如,本发明的某些实施方案提供一种适应多个样品的载体,其形式与96孔微孔板的大小相适应,使得样品分配可以用标准机器人流体处理装置操作。这种形式能够适应置于芯片上的多个编码的微珠阵列,并且允许在一个多芯片载体上同时对多个患者样品的每个进行多个分型反应。在每名患者检测128种类型的96孔载体中,能够以现有SSP或SSO方法无法达到的通量速度测定10,000种以上的基因型。
在本发明的某些实施方案中,延伸反应能够与随后的杂交反应相组合,以将同一DNA靶链上的不同亚序列关联起来,这种能力在此被称为“定相(phasing)”。定相解决了等位基因的不同组合产生特定延伸模式的可能性所引起的等位基因分配的不确定性。类似地,定相可以在单倍体分型(haplotying)中用来将多态性分配给同一DNA链或染色体。
在本发明的某些实施方案中,延伸反应的退火和延伸步骤能够组合为一步反应。此外,产生连续或不连续温度变化的装置可以被引入到该系统中来,以适应多重反应中具有不同解链温度的多个探针的多个最佳条件。
在本发明的某些实施方案中,编码的微珠阵列在固体基质上形成。这些固体基质可以包括任何适宜的固体材料,如具有足够的机械强度、并且如果需要能够经受加工步骤的玻璃或半导体。在某些实施方案中,固体基质被分成不连续的单元,称为“芯片”。包含编码的微珠阵列的芯片如果被装载到多芯片载体上,可以单个地或成组地加工。例如,可以使用标准温度控制方法设定单个芯片或多芯片载体的操作温度,或者对它们施加预编程的温度改变顺序。此外,也可以利用随机编码阵列检测(“READ”)的直接成像能力分析芯片,如PCT/US01/20179所公开的,其内容在此引用作为参考。使用READ,芯片上整个编码微珠阵列的多重分析是可能的。此外,在READ形式中,预编程的温度循环的应用提供了延伸产物的实时芯片上扩增。对于基因组、线粒体或其它DNA,线性芯片上扩增可以不需要测定前的DNA扩增,如PCR,从而显著缩短完成整个分型实验所需的时间。因此时间敏感的应用,如尸体的分型成为可能。更重要的是,这种方法消除了多重PCR的复杂性,这是许多遗传筛查和多态性分析中的限速步骤。在一个优选实施方案中,一种流控盒被用于样品和试剂注射以及温度控制。
在一个实施方案中,本发明提供一种多态性分析方法,其中通过使用一个或多个“退火-延伸-检测-变性”温度循环,每个靶核酸序列都被用作多延伸反应中的模板。该方法实现了原位检测延伸产物的线性扩增。这种额外的能力避免了需要序列特异性扩增多核苷酸样品的第一步。
通过整合测定步骤与循环信号扩增不仅简化并加快了遗传分析的完成,而且不需要开发、检测和进行多重PCR步骤。本发明的方法还提供了一种高通量形式,用于多个患者样品的同时遗传分析。
本发明的几个实施方案用于序列特异性探针的多重延伸,以允许同时评价大量不同的靶标。在某些实施方案中,寡核苷酸探针被固定于固体载体上,在单表面如硅或玻璃表面上产生密集的探针模式。在某些实施方案中,预先合成的寡核苷酸探针被固定于固体载体上,例如括硅、化学修饰的硅、玻璃、化学修饰的玻璃或塑料。这些固体载体可以是微珠的形式。寡核苷酸阵列的分辨率取决于输送系统的空间分辨率和输送的核苷酸溶液体积的物理空间需求。[参见Guo等人,Nucleic Acids Res.225456-5465(1994);Fahy等人,Nucleic AcidRes.211819-1826(1993);Wolf等人,Nuc.Acids Res.152911-2926(1987);和Ghosh等人,Nuc.Acids Res.155353-5372(1987).]。
本发明提供多重分析方法。在某些实施方案中,延伸探针组以保持其身份的方式被固定在固相上,例如通过空间上分离不同探针和/或以化学方法编码探针身份。然后使一种或多种溶液携带的靶标在退火和延伸反应中接触固定化的多种探针。通过固定使探针彼此在空间上分开降低了延伸产物识别中的不确定性。因此,本发明具有优于现有PCR-SSP方法的优点,后者不适于高通量形式,因为(i)每个PCR扩增需要2种探针;(ii)在多重同源反应中,重叠探针之间对高度多态性基因如HLA的竞争;(iii)在这种多重反应中辨别具体产物的困难。
在一个优选实施方案中,探针通过各自的5’端与编码的微粒(“微珠”)附着,这些微粒具有可以唯一地识别所附着探针的可以区分的化学或物理特征。探针捕获接触微珠的溶液中的目的靶序列。在特定微珠上展示的探针的延伸产生可光学检测的信号或可以转换为可光学检测信号的化学信号。在一个多重延伸反应中,每个参与反应的微珠的光学标签唯一地对应于该珠上展示的探针。探针延伸步骤后,通过颗粒鉴定和检测,例如通过流式细胞仪,可以确定探针的身份。
在某些实施方案中,在延伸步骤前微珠可以以平面阵列排列于基质上。微珠也可以在平面基质上装配,以利于延伸步骤后的成像。此处所述的方法和系统提供了一种高通量检测形式,它允许整个微珠阵列的快速成像,和对多个患者样品同时进行遗传分析。
微珠阵列可以是随机编码的阵列,其中阵列内微珠的可以区分的化学或物理特征表明与微珠附着的寡核苷酸探针的身份。阵列也可以按照READ形式形成。
微珠阵列可以使用分批方法制备,产生用途特异的基质(例如晶体大小的芯片)。编码的并与寡核苷酸探针附着的微珠(例如约108微珠/100μl悬液的范围)与基质(例如硅芯片)结合,在基质指定区域上装配形成密集阵列。在某些实施方案中,微珠阵列含有4000个直径为3.2μm的微珠,微珠阵列的大小为300μm×300μm。随着微珠的大小不同,密度也不同。多个微珠阵列也能够在同一芯片上的不连续流体区室内同时形成。这些方法在2002年7月9目提交的美国申请系列号10/192,351中公开,在此全文引用作为参考。
微珠阵列可以用通称为“LEAPS”的方法形成,如美国专利号6,251,691和PCT国际申请号PCT/US00/25466中所述,均在此引用作为参考。
本发明使用的基质(例如芯片)可以是根据LEAPS界面模建(patterning)法模建的平面电极的形式。例如,基质可以用氧化物或其它绝缘材料模建,在施加的交流电场存在下产生希望的阻抗梯度结构。可以设计模式,产生交流电场诱导的流体流动和相应颗粒转运的希望的结构。利用半导体加工技术,基质可以以晶片大小模建。另外,也可以使基质区室化,方法是浇注可紫外线模建、光学透明的聚合物薄膜,使希望的流体导管和区室的平面固定在基质上。这些导管和区室将流体限定在一个或几个不连续的区室中,从而适用于一个给定基质上的多个样品。
微珠阵列可以用LEAPS制备,方法是提供第一个平面电极,它与第二个平面电极基本平行(“夹心”结构),两个电极通过一个间隙(gap)分开,其中含有可极化的液体介质如电解质溶液。第二个平面电极的表面或内部可以用界面模建法模建。向间隙内加入微珠。当对间隙施加交流电压时,微珠在第二个电极(例如“芯片”)上形成随机编码的阵列。
在LEAPS的另一个实施方案中,微珠阵列可以在光敏电极(例如“芯片”)上形成。优选地,上述夹心结构也使用平面光敏电极和另一种平面电极。同样,两个电极用一个间隙分开,其中含有电解质溶液。向间隙内加入功能化和编码的微珠。在施加交流电压以及光线后,微珠在光敏电极上形成阵列。
在本发明的某些实施方案中,微珠可能与化学或物理上可以区分的特征关联。例如,可以用几组可光学区分的标签对微珠染色,例如含有一种或多种荧光团或发色团染料的标记,这些染料可以通过激发波长、发射波长、激发态寿命或发射强度辨别。可以用可光学辨别的标签以特定比例对微珠染色,如Fulwyler,US 4,717,655(Jan 5,1988)所公开的。也可以根据本领域技术人员公知的方法使颗粒膨胀,实现染色(Molday,Dreyer,Rembaum & Yen,J.Mol Biol 64,75-88(1975);L.Bangs,″Uniformlatex Particles,Seragen Diagnostics,1984)。例如,膨胀以及用两种颜色大量染色可以编码多达12种类型的微珠,每一类型分别有4个强度水平,以4种标定摩尔比混合。此外,国际申请号PCT/US 98/10719(在此全文引用作为参考)所述的组合颜色编码方法也能够用来使微珠阵列具有可光学辨别的标签。除了化学编码外,也可以通过PCT/US0/20179所述的方法使微珠具有磁性。
除了用染料化学编码外,具有某些寡核苷酸引物的微珠也可以在空间上被分开(“空间编码”),使得微珠的位置提供了关于微珠身份的信息。例如,利用表面附近颗粒的光控电动装配(LEAPS),能够在阵列装配过程中在单一液相内实现空间编码。根据交变电场和/或投射到基质上的光模式,可以用LEAPS以任何希望的构型装配平面微珠阵列。
LEAPS可以用来在硅芯片与溶液的界面处产生横向阻抗梯度,以调节介导阵列装配的电流体动力。电需要是有限的在两个平面电极之间的流体间隙(一般为100μm)上施加一般低于10Vpp的低交流电压。这一装配过程是快速的,并且是可光学编程的在施加的电场下几秒钟之内形成含有几千个微珠的阵列。在区室化芯片表面上的多个液相中也可以形成多个亚阵列。
阵列在形成后可以被固定化。例如,通过施加直流电压产生随机编码的阵列可以固定微珠阵列。直流电压一般设定为5-7V(对于2-6μm的微珠和100-150μm的间隙),并以″反偏压″配线施加<30秒,使得n掺杂的硅基质形成正极,这种直流电压使阵列被压缩到实现阵列内相邻微珠之间接触的程度,同时使微珠向邻近电极表面的高电场区域移动。一旦充分紧密地接近,微珠即通过范德华力介导的物理吸附锚定。在微珠表面上提供一群从微珠表面延伸的“链”可以实现这一吸附过程;聚赖氨酸和链亲和素已经被用于这一目的。
在某些实施方案中,颗粒阵列可以通过化学方法固定,例如形成复合的凝胶-颗粒薄膜。在形成这种凝胶复合颗粒薄膜的一个典型方法中,提供了一种微粒悬液,它也含有单体、交联剂和原位凝胶形成的引发剂。利用LEAPS将颗粒在基质上装配为一个平面装配体。在电极之间的流体空隙上施加频率为几百到几千赫兹的1-20Vp-p的交流电压。在施加的交流电压存在下,在阵列装配后,利用红外(IR)灯将小室加热到约40-45℃、或者利用汞灯源光加热引发液相的聚合。产生的凝胶可有效地捕获颗粒阵列。凝胶可以由单体浓度为20%-5%的丙烯酰胺和双丙烯酰胺的混合物组成(丙烯酰胺∶双丙烯酰胺=37.5∶1,摩尔比),但是也可以使用其它任何低粘度水溶性单体或单体混合物。利用该方法制备的化学固定的功能化微粒阵列可用于多种生物测定,例如配体受体结合测定。
在一个实例中,用低浓度的偶氮二异丁脒(azodiisobutyramidine)二盐酸盐作为热引发剂形成热水凝胶,以确保聚合混合物的总离子强度为约0.1mM到1.0mM。用于紫外线聚合的引发剂是Irgacure2959(2-羟基-4′-羟基乙氧基-2-甲基苯丙酮,Ciba Geigy,Tarrytown,NY)。向单体中加入引发剂,达到1.5重量%溶液。
在某些实施方案中,颗粒阵列可以用机械方法固定。例如,可以用标准半导体加工方法在硅基质的低电阻区产生微孔阵列。颗粒阵列可以用这些结构构成。在某些实施方案中,利用LEAPS介导的水动力学和有质动力转运并在有孔阵列上积累颗粒。然后切断交流电场,颗粒被捕获到微孔内,从而被机械限制。除去过量的微珠,在基质表面上留下一个空间有序的随机微珠阵列。
基质(例如芯片)能够被置于一个或多个封闭的间隔内,样品和试剂可以通过流体相互连接输入或输出该间隔。也可以在开放的间隔形式如在微量滴定板上进行反应。试剂可以用机器人液体处理设备转移到芯片之上,多个样品可以同时处理。这种形式适用于现有微量滴定板形式的标准样品处理和液体处理,并集成了样品处理和阵列检测。
在本发明的某些实施方案中,编码的微珠在基质表面而不是在阵列内装配。例如,通过将微珠悬液点样到基质的多个区域内,并且使微珠在重力下沉淀,微珠装配体能够在基质上形成。与LEAPS形成的微珠阵列相反,这些装配体通常呈现混乱的低密度结构或非平面结构,包括微珠的堆集(stacking)或聚集(clumping),从而妨碍了受到影响的微珠的成像。然而,通过将化学编码的微珠混合物点样到基质上多个不连续位置内所获得的空间和颜色编码组合仍然允许多重分析技术(multiplexing)。
在某些实施方案中,利用检测后的阵列图像与阵列的解码图像比较来揭示化学或物理学上可以区分的特征,以及探针的延长。这种比较能够用例如具有成像检测器和计算机化图像捕获及分析装置的光学显微镜完成。阵列的检测图像被用来检测表明探针延伸的光学标签。解码的图像被用来确定化学和/或物理学上可以辨别的特征,这些特征能够唯一地识别微珠表面展示的探针。这样,阵列中每个颗粒上的探针身份可以根据可辨别的特征识别。
在分析从解码和检测图像获得的数据时可以使用图像分析算法。这些算法可以用来获得阵列内每个微珠的量化数据。分析软件以阵列的亮视野图象为模板自动定位微珠的中心,根据类型将微珠分组,为每个微珠分配量化强度,去除如血清标本中不规则形状的“基质”材料所产生的“疵点”,分析背景强度统计数字,并评价所有微珠类型的背景修正的平均强度以及相应的方差。这些算法的例子如PCT/US01/20179所述。
探针延伸可以用光学标签的改变表示,或者用可转换为光学标签改变的化学信号的改变表示,这些信号例如来源于展示延伸探针的微珠。本领域公知的直接和间接标记方法可用于此目的。直接标记是指延伸产生的光学标签的改变;间接标记是指延伸引入改变,而该改变需要一个或更多额外步骤来产生可检测的光学标签。在某些实施方案中,荧光团或发色团染料可以附着于作为探针延伸成分加入的一种核苷酸上,使得探针延伸改变微珠的光学标签,这是通过例如改变荧光强度、或者使展示延伸产物的微珠的光学标签具有其它改变来实现。
实施例通过下列实施例,本发明将被更好地理解。这些实施例应当被理解为只是说明性的,不能被视为以任何方式限制本发明。
实施例1用于多重SSP分析的交错探针设计用于每种多态性的探针被固定于固相载体上,提供能够以最小的相互干扰同时进行多个退火和延伸反应的形式。具体而言,该方法提供一种适合重叠探针的设计,如图1所示。在该实施例中,我们考虑了3个等位基因等位基因A、等位基因B和等位基因C。探针1和2检测与各自的3’端比对的SNPs,而探针3和4检测与各自的3’端比对的两个核苷酸多态性。探针1和2所针对的多态性位点位于探针3和4所针对的多态性位点上游5个核苷酸处。这种设计允许每种探针结合它相应的靶标,当在指定多态性位点处完全匹配时允许进行延长。因此,探针1和3与等位基因A匹配,探针2以及可能是探针3与等位基因B匹配,探针1和4与等位基因C匹配。
实施例2用于HLA分型的探针设计为了设计用来分析DRB基因从碱基106到碱基125的多态区的探针,对于该长20个碱基的片段,DRB数据库中有22个不同类型的序列。在下表中列出7 DRB1*0101 TTCTTGTGGCAGCTTAAGTT104 DRB1*03011 TTCTTGGAGTACTCTACGTC26DRB1*04011 TTCTTGGAGCAGGTTAAACA1 DRB1*0434 TTCTTGGAGCAGGTTAAACC3 DRB1*07011 TTCCTGTGGCAGGGTAAGTA
1DRB1*07012 TTCCTGTGGCAGGGTAAATA28 DRB1*0801TTCTTGGAGTACTCTACGGG1DRB1*0814TTCTTGGAGTACTCTAGGGG1DRB1*0820TTCTTGGAGTACTCTACGGC1DRB1*0821TTCTTGGAGTACTCTATGGG1DRB1*09012 TTCTTGAAGCAGGATAAGTT2DRB1*10011 TTCTTGGAGGAGGTTAAGTT1DRB1*1122TTCTTGGAGCAGGCTACACA1DRB1*1130TTCTTGGAGTTCCTTAAGTC18 DRB1*15011 TTCCTGTGGCAGCCTAAGAG9DRB3*01011 TTCTTGGAGCTGCGTAAGTC1DRB3*0102TTCTTGGAGCTGTGTAAGTC1DRB3*0104TTCTCGGAGCTGCGTAAGTC16 DRB3*0201TTCTTGGAGCTGCTTAAGTC1DRB3*0212TTCTTGCAGCTGCTTAAGTC6DRB4*01011 TTCTTGGAGCAGGCTAAGTG14 DRB5*01011 TTCTTGCAGCAGGATAAGTA第一列包括共享第三列所列序列的等位基因数,第二列包括等位基因名称之一。我们选择20-碱基片段的最后三个碱基作为TEI区,并且根据其TEI区对序列组分类,获得下列组1 104 DRB1*03011 TTCTTGGAGTACTCTACGTCe11 DRB1*1130TTCTTGGAGTgCctTAaGTC9 DRB3*01011 TTCTTGGAGctgcgTAaGTC1 DRB3*0102TTCTTGGAGctgTgTAaGTC1 DRB3*0104TTCTcGGAGctgcgTAaGTC16 DRB3*0201TTCTTGGAGctgctTAaGTCe21 DRB3*0212TTCTTGcAGctgctTAaGTC
27 DRB1*0101 TTCTTGTGGCAGCTTAAGTT1 DRB1*09012TTCTTGaaGCAGgaTAAGTT2 DRB1*10011TTCTTGgaGGAGgTTAAGTT326 DRB1*04011TTCTTGGAGCAGGTTAAACA1 DRB1*1122 TTCTTGGAGCAGGcTAcACA41 DRB1*0434 TTCTTGGAGCAGGTTAAACC53 DRB1*07011TTCCTGTGGCAGGGTAAGTA14 DRB5*01011TTCtTGcaGCAGGaTAAGTA61 DRB1*07012TTCCTGTGGCAGGGTAAATA728 DRB1*0801 TTCTTGGAGTACTCTACGGGe31 DRB1*0814 TTCTTGGAGTACTCTAgGGG1 DRB1*0821 TTCTTGGAGTACTCTAtGGG81 DRB1*0820 TTCTTGGAGTACTCTACGGC918 DRB1*15011TTCCTGTGGCAGCCTAAGAG10 6 DRB4*01011TTCTTGGAGCAGGCTAAGTG对于同一组的序列,该组第一个序列和其它序列之间的不同以小写字母标出。用3种探针序列说明我们的探针设计原则的应用。选择第一组的第一个序列作为探针e1;选择第一组的第6个序列作为探针e2;选择第一组的第7个序列作为探针e3。
由于靶标与探针的TEI区需要完全互补,第2组到第10组的序列不产生e1和e2的延伸产物。类似的,除第7组之外,其它组的序列不产生e3的延伸产物。每组的延伸反应模式彼此均不相同。
同一组的序列有两类情况。例如,e1和e2在退火区内6个位点中有一个核苷酸不同。因此,与e1和e2匹配的靶标将不产生其它序列的延伸产物,e1和e2也是不同的探针。类似的,第1组第2个到第7个序列的靶标将不产生探针e1的延伸产物。
除了与e1匹配的靶标外,其余5个序列仅仅在一个或两个核苷酸上与e2不同,如下所示1,2..............................M16 DRB3*0201 TTCTTGGAGCTGCTAAGTC e21 DRB1*1130 TTCTTGGAGtTCCTTAAGTC a9 DRB3*01011 TTCTTGGAGCTGCgTAAGTC b1 DRB3*0102 TTCTTGGAGCTGtgTAAGTC c1 DRB3*0104 TTCTcGGAGCTGCgTAAGTC d1 DRB3*0212 TTCTTGcAGCTGCTTAAGTC e这些序列是交叉反应性的。当序列b和e(它们与e2的不同在于分别在位点M-7和M-14处的一个碱基)的靶标与探针e2退火时,退火区中的非指定多态性将被包容,延伸反应将进行,直到与完全匹配的序列基本相同的程度。当序列a、c、d(它们与e2有两个核苷酸不同)的靶标与探针e2退火时,延伸反应只显示对非指定多态性的部分包容。改善这种状况的一个方法是为a、c、d提供不同的探针,然后通过分析信号强度定量分析延伸产物的产量,以识别正确的序列。一个替代方法是向e2探针中添加一个能够分开退火区与TEI区的物理性接头(例如链),将退火区中的非指定多态性一起跨过。
对于第7组的序列,e3探针部分包容其它两个序列。可以汇集这3个序列。e2探针将对30种等位基因而不是28种等位基因产生延伸产物。
实施例3利用错配包容来改变等位基因结合模式用探针DR-13e(GGACATCCTGGAAGACGA)来靶向DRB基因的281-299碱基。包括等位基因DRB1*0103在内的34种等位基因与该序列完全匹配。因此,在结合模式中,13e对于这34种等位基因是阳性的(即,对于这34种等位基因,13e将产生延伸产物)。其它几个等位基因显示相同的TEI区,但在各自的退火区中显示非指定多态性。例如,5种等位基因,如DRB1*0415,在位点4处含有T而不是A,而4种等位基因,如DRB1*1136,在该位点含有C。由于退火区中的错配包容,与这9种等位基因互补的靶序列将产生类似于完全匹配序列的延伸反应模式。结果在图2中显示。T0-3和T0-4是分别与等位基因*0415和*1136完全互补的序列。
DRB1*0103 GACATCCTGGAAGACGA 34种等位基因DRB1*0415 GACTTCCTGGAAGACGA 5种等位基因DRB1*1136 GACCTCCTGGAAGACGA 4种等位基因实施例4用于跨过非指定多态性的探针接头结构的设计如图3所示,为了确保特异且强的退火,锚定序列来源于保守序列区。它并非用于多态性检测。为此,用于多态性检测的一个较短序列通过一个中性化学接头与锚定序列连接。用于多态性检测的序列的较短长度将限制对紧邻指定位点的非指定多态性的可能干扰,从而减少了为适应这种干扰性多态性所需的可能的序列组合数。该方法在某些情况下避开了高密度的多态性位点。例如,利用考虑到额外多态性的探针,能够区别实施例3中所列的序列。接头和序列的说明性设计在下面列出接头13-5 AGCCAGAAGGAC/间隔区18/间隔区18/GGAAGACGA接头13-8 AGCCAGAAGGAC/间隔区18/间隔区18/AGACGA接头13-11 AGCCAGAAGGAC/间隔区18/间隔区18/CGA实施例5定相当两个或多个等位基因的组合能够产生相同反应模式时,本发明也可用于减少由此产生的不确定性。在图4和图5所示的模拟情况下,与探针1和探针3匹配因而产生延伸产物的等位基因A,和当探针2和探针4存在于同一多重反应中时,与其匹配的等位基因B,它们所产生的总反应模式与匹配探针1和探针2的等位基因C和匹配探针3和探针4的等位基因D的组合所产生的总反应模式相同。利用本发明提供的检测方法能够减少或消除这种不确定性,通过用一种标记的检测探针(其用来靶向与探针3相同的多态性位点)杂交,分析探针1的延伸产物。如果分析结果是阳性的,那么只有一个等位基因组合,即组合1是可能的,因为探针1和探针3与同一等位基因结合。检测探针可以用本发明公开的或本领域公知的任何方法标记。如果这种识别检测步骤与多重延伸反应检测一起进行,如图5所示的延伸检测和探针杂交检测使用不同的标记。
在该方法中,联合使用延伸和杂交给同一“相位”分配两个或多个多态性,来解决这种不确定性。对于本领域中设计的其它遗传学研究的单倍型分析,定相作为一个重要考虑迅速出现。通过与靶标连续反应能,多种探针可以被包括进来,或者多种探针能够被安排在同一反应中,用不同标记进行检测。
结合探针延伸与杂交反应的能力在使用来自HLA-B外显子3的样品序列的实验中得到证实。结果显示在图6中。探针SB3P在反应中延伸,延伸产物用标记的DNA探针检测。对于图6A和图6B所示的两种样品,SB127r和SB3P、SB285r和SB3P分别处于同一相位。
实施例6使用随机编码探针阵列的HLA分型模型反应为了说明多态性的辨别,用一种合成单链作为靶标进行模型反应。使用直径为3.2μm的颜色编码的甲苯磺酰基功能化微珠作为固相载体。利用本领域公知的标准方法(Bangs.L.B.,″Uniform LatexParticles″,Seragen Diagnostics Inc.,p.40),使用蓝色染料(吸收/发射419/466nm)和绿色染料(吸收/发射504/511)的不同组合,染色的颗粒产生一组32个可以辨别的颜色代码。染色的微珠用生物素结合蛋白Neutravidin(Pierce,Rockford,IL)功能化,以介导生物素化探针的固定。在一个典型的小规模偶联反应中,含有1%微珠的200μl悬液用500μl 100mM磷酸缓冲液/pH 7.4(缓冲液A)洗涤3次,重悬浮于500μl该缓冲液中。向微珠悬液中加入20μl 5mg/mlneutravidin后,密封反应液,在37℃下过夜。偶联的微珠然后用500μl含有10mg/ml BSA的PBS/pH 7.4(缓冲液B)洗涤1次,重悬浮于500μl该缓冲液中,在37℃下反应1小时,以阻断微珠表面上的未反应位点。阻断后,用缓冲液B洗涤微珠3次,贮存于200μl该缓冲液中。
在该模型反应系统中,合成了两对探针,它们在各自的3’端含有SNPs。各自的序列如下SSP13AAGGACATCCTGGAAGACG;SSP24AAGGACATCCTGGAAGACA;SSP16ATAACCAGGAGGAGTTCCSSP36ATAACCAGGAGGAGTTCG.
探针在5’端生物素化;在生物素与寡核苷酸之间插入一个15碳三乙二醇接头,使表面固定对随后反应的破坏作用最小化。对于每种探针,与编码微珠的偶联用50μl微珠悬液进行。用500μl 20mMTris/pH 7.4,0.5MNaCl(缓冲液C)洗涤微珠一次,微珠重悬浮于300μ1该缓冲液中。向微珠悬液中加入2.5μl 100μM探针溶液,在室温下反应30分钟。然后用20mM Tris/pH7.4,150mM NaCl,0.01%triton洗涤微珠3次,将微珠贮存于20mM Tris/pH 7.4,150mM NaCl中。
提供了下列长度为33个碱基的合成靶标TA16 GTCGAAGCGCAGGAACTCCTCCTGGTTATGGAATA36 GTCGAAGCGCACGAACTCCTCCTGGTTATAGAATA13 GGCCCGCTCGTCTTCCAGGATGTCCTTCTGGCTTA24 GGCCCGCTTGTCTTCCAGGATGTCCTTCTGGCT靶标与4种探针(SSP13,SSP24,SSP16,SSP36)在芯片上反应。向芯片上添加一等份10μl的100nM靶标在退火缓冲液(0.2M NaCl,0.1%Triton X-100,10mM Tris/pH 8.0,0.1mM EDTA)中的溶液,在30℃下反应15分钟。然后用同一缓冲液洗涤芯片一次,然后用延伸反应混合物覆盖芯片,延伸反应混合物包含100nM TAMRA-ddCTP(吸收/发射550/580)(PerkinElmerBioscience,Boston,MA),10μM dATP-dGTP-dTTP,ThermoSequenase(Amersham,Piscataway,NJ),溶于厂商提供的结合缓冲液。反应在60℃下进行5分钟,然后用水洗涤芯片。用具有自动滤光片转换器(包括分别用于蓝色、绿色解码图像和测定图像的羟基香豆素、HQ窄带GFP和HQ Cy3滤光片)的Nikon荧光E800显微镜对芯片进行解码和测定图像。Apogee CCDKX85(Apogee Instruments,Auburn,CA)用于采集图像。在每个反应中,只有完全匹配的靶标才能被延伸生成,对于此处检测的SNPs,匹配与不匹配靶标之间的区别约为13倍-30倍;图7对TA13进行了说明。
实施例7患者样品的HLA-DR分型用标准PCR方案处理从患者中提取的DNA样品。使用下列引物进行普通DR扩增正向引物GATCCTTCGTGTCCCCACAGCACG反向引物GCCGCTGCACTGTGAAGCTCTC.
PCR方案如下95℃7min 1个循环,95℃30sec,60℃30sec,7 2℃1min 35个循环,72℃7min 1个循环。
长度为287个碱基、覆盖DR基因座的PCR产物在100℃下变性5分钟,在冰上冷却,与如实施例6模型反应所述的退火缓冲液混合。向每个芯片加一等份10μl,在40℃下反应15分钟。如实施例6所述进行延伸反应以及随后的图像采集。
对使用患者样品产生的PCR产物进行序列特异性探针的多重延伸,产生根据探针设计的结果。在平行测试的4种探针(SSP13,SSP16,SSP24,SSP36)中,SSP13延伸,而SNP探针SSP24只显示背景结合,无关的SSP16和SSP36探针也只显示背景结合。如图8所示,SSP的多重延伸显著提高了匹配与不匹配SNPs之间的分辨力,从以匹配和不匹配序列特异性寡核苷酸探针杂交为基础的分析的大约2倍提高到至少20倍。
实施例8组特异性扩增当SSOs多重杂交不能使杂合等位基因组合明确地分配时,组特异性扩增(GSA)的引物最常用。在这种情况下,选择GSA引物以扩增所选择的几组具体等位基因,以消除不确定性,这种不确定性是延误分析的另一个劳动密集的测定步骤。使用本发明的方法,优选地使用在随机编码的微珠阵列上展示探针的实施方案,GSA引物可以作为探针加入多重反应中,从而除去该分析的整个第二步。
实施例9使用细胞系对HLA-DR、-A和-B基因座的分析设计用于延伸介导的HLA-DR、HLA-A和HLA-B多重分析的探针,并用标准细胞系检测。这些探针来源于以前文献中报告的SSP探针(Bunce,M.等人,Tissue Antigens.46355-367(1995),Krausa,P和Browning,M.J.,Tissue Antigens.47237-244(1996),Bunce,M.等人,Tissue Antigens.4581-90(1995))。
用于DR的探针是SR2 ACGGAGCGGGTGCGGTTGSR3 GCTGTCGAAGCGCACGGSR11CGCTGTCGAAGCGCACGTTSR19GTTATGGAAGTATCTGTCCAGGTSR23ACGTTTCTTGGAGCAGGTTAAACSR32CGTTTCCTGTGGCAGGGTAAGTATASR33TCGCTGTCGAAGCGCACGASR36CGTTTCTTGGAGTACTCTACGGGSR39TCTGCAGTAGGTGTCCACCASR45CACGTTTCTTGGAGCTGCGSR46GGAGTACCGGGCGGTGAGSR48GTGTCTGCAGTAATTGTCCACCTSR52CTGTTCCAGGACTCGGCGASR57CTCTCCACAACCCCGTAGTTGTASR58CGTTTCCTGTGGCAGCCTAAGASR60CACCGCGGCCCGCGCSR67GCTGTCGAAGCGCAAGTCSR71GCTGTCGAAGCGCACGTANEG AAAAAAAAAAAAAAAAAA某些探针在其各自的3’端有一个SNP位点,例如SR3和SR33(分别是G和A);SR11、SR67和SR71(分别是T、C和A)。另外,相对于SR11、67和71组的探针,探针SR3和33在3’端有一个碱基交错。
SR3 GCTGTCGAAGCGCACGGSR33TCGCTGTCGAAGCGCACGASR11CGCTGTCGAAGCGCACGTTSR67GCTGTCGAAGCGCAAGTCSR71GCTGTCGAAGCGCACGTA
反应条件如实施例7所示,不同之处在于退火温度为55℃而不是40℃,延伸温度为70℃而不是60℃。双链DNA如实施例7一样使用。在现在的条件下单链DNA产生更好的结果。单链DNA的产生方法是,只使用一种探针,在同一PCR程序中重新扩增最初的PCR产物。两种细胞系W51和SP0010的结果在图9和图10中显示。阴性对照NEG与所选类型的微珠偶联。其它探针的信号强度减去NEG被认为是探针的真实信号,用这些数值绘图。Y轴单位是实验所用照相机的信号单位。对于每个样品,阳性与阴性探针之间的差别是明确的。具体而言,与SSO分析中通常遇到的情况不同,不必与其它样品进行对比以确测定每种探针的可靠阈值。
用于HLA-A的探针是SAD CACTCCACGCACGTGCCASAF GCGCAGGTCCTCGTTCAASAQ CTCCAGGTAGGCTCTCAASAR CTCCAGGTAGGCTCTCTGSAX GCCCGTCCACGCACCGSAZ GGTATCTGCGGAGCCCGSAAP CATCCAGGTAGGCTCTCAASA8 GCCGGAGTATTGGGACGASA13 TGGATAGAGCAGGAGGGTSA16 GACCAGGAGACACGGAATA图11和图12所示的A基因座外显子3的结果也是明确的。图12还显示了非指定多态性的错配包容的一个实例。即,当在位点M-18处展示为C而不是A的等位基因0201与探针SAAP不完全匹配时,延伸反应仍然进行,因为聚合酶在探针3’端检测到对指定多态性的完全匹配,并包容位点M-18的错配。
用于HLA-B的探针是SB220 CCGCGCGCTCCAGCGTGSB246 CCACTCCATGAGGTATTTCCSB229 CTCCAACTTGCGCTGGGASB272 CGCCACGAGTCCGAGGAASB285 GTCGTAGGCGTCCTGGTCSB221 TACCAGCGCGCTCCAGCTSB197 AGCAGGAGGGGCCGGAASB127 CGTCGCAGCCATACATCCASB187 GCGCCGTGGATAGAGCAASB188 GCCGCGAGTCCGAGGACSB195 GACCGGAACACACAGATCTT
使用这些探针对HLA-B外显子2进行分型的实验用参照细胞系进行。对于HLA-A,获得明确的结果(在此未显示)。
实施例10CF突变分析—用于探针延伸的探针和阵列设计该实施例描述了在颜色编码的颗粒上展示的平面探针阵列的设计和应用,这些探针被设计成在各自的3’端处或附近展示几个-最常为2个选择的碱基组成,并用来与CFTR靶基因内的目的指定区比对。
利用从Genebank(www.ncbi.nlm.nih.gov)获得的CFTR基因序列设计16-mer探针,用于ACMG-CF突变组中25种CFTR突变的多重分析。利用PROBE 3.0(http//www.genome.wi.mit.edu)设计探针序列,与各自的外显子序列比对(http//searchlauncher.bcm.tmc.edu/seq-search/alignment.html)。寡核苷酸设计为含有15-21个核苷酸,富含30-50%G+C的碱基组成,合成后含有5’生物素TEG(SynthegenTX);为了处理小的缺失,TEI区的可变序列被置于探针3’端处或距3’端3-5个位点之内。探针组成在下表中列出。
CF突变分析使用17个纯蓝色或蓝绿色染色的微珠的组合。合成长48个碱基的人β-肌动蛋白基因(编号#X00351),在每个反应中作为内部阳性对照。每个阵列上包含长16个碱基的互补探针。为了分析ACMG-CF突变组中的25种CFTR突变,用来自Genebank(www.ncbi.nlm.nih.gov)的CFTR基因序列进行探针设计。探针序列用PROBE 3.0(http//www.genome.wi.mit.edu)设计。每个探针序列与各自的外显子序列比对(http//searchlauncher.bcm.tmc.edu/seq-search/alignment.html)。合成寡核苷酸使之具有5’生物素TEG(Synthegen TX),在0.5M NaCl存在下将寡核苷酸偶联到微珠表面。通过LEAPS将微珠固定在芯片表面上。
外显子突变序列
3G85E CCC CTA AAT ATA AAA AGA TTCG85E-X CCC CTA AAT ATA AAA AGA TTT41148 ATT CTC ATC TCC ATT CCA A1148-X ATT CTC ATC TCC ATT CCA G621+1G>T TGT GTG CAA GGA AGT ATT AC621+1G>T-XTGT GTG CAA GGA AGT ATT AAR117H TAG ATA AAT CGC GAT AGA GCR117H-XTAG ATA AAT CGC GAT AGA GT5711+1G>T TAA ATC AAT AGG TAC ATA CTAA ATC AAT AGG TAC ATA A7R334W ATG GTG GTG AAT ATT TTC CGR334W-XATG GTG GTG AAT ATT TTC CAR347P ATT GCC GAG TGA CCG CCA TGCR347P-XATT GCC GAG TGA CCG CCA TGG1078delT CAC AGA TAA AAA CAC CAC AAA1078delT-X CAC AGA TAA AAA CAC CAC AA1078delT-X-2 CAC AGA TAA AAA CAC CAC A9A455E TCC AGT GGA TCC AGC AAC CGA455E-XTCC AGT GGA TCC AGC AAC CT10 508CAT AGG AAA CAC CAA AGA TI507 CAT AGG AAA CAC CAA AF508 CAT AGG AAA CAC CAA T11 1717-1G>A CTG CAA ACT TGG AGA TGT CC1717-1G>A CTG CAA ACT TGG AGA TGT CT551D TTC TTG CTC GTT GAC551D-X TTC TTG CTC GTT GATR553 TAAAGAAATTCTTGCTCGR553X TAAAGAAATTCTTGCTCAR560 ACCAATAATTAGTTATTCACCR560X ACCAATAATTAGTTATTCACG
G542 GTGTGATTCCACCTTCTC CG542XGTGTGATTCCACCTTCTC AINT-121898 AGG TAT TCA AAG AAC ATA C1898-X AGG TAT TCA AAG AAC ATA T132183deLA TGT CTG TTT AAA AGA TTG T2183deLA-X TGT CTG TTT AAA AGA TTG CINT 14B 2789 CAA TAG GAC ATG GAA TAC2789-X CAA TAG GAC ATG GAA TAC TINT 163120 ACT TAT TTT TAC ATA C3120-X ACT TAT TTT TAC ATA T18D1152ACT TAC CAA GCT ATC CAC ATCD1152ACT TAC CAA GCT ATC CAC ATGINT 193849+10kbC>T-WT1CCT TTC Agg GTG TCT TAC TCG3849+10kbC>T-M1 CCT TTC Agg GTG TCT TAC TCA19R1162AAT GAA CTT AAA GAC TCGR1162-X AAT GAA CTT AAA GAC TCA3659delC-WT1 GTA TGG TTT GGT TGA CTT GG3659delCX-M1 GTA TGG TTT GGT TGA CTT GTA3659delC-WT2 GTA TGG TTT GGT TGA CTT GGT A3659delCX-M2 GTA TGG TTT GGT TGA CTT GT A20W1282ACT CCA AAG GCT TTC CTCW1282-X CT CCA AAG GCT TTC CTT21N1303K TGT TCA TAG GGA TCC AAGN1303K-X TGT TCA TAG GGA TCC AACb β肌动蛋白 AGG ACT CCA TGC CCA G
在0.5M NaCl存在下,探针被附着于纯蓝色或蓝绿色染色的差别编码的微珠上。利用LEAPS将微珠固定在芯片表面。每个反应均包含合成的48碱基人β-肌动蛋白基因(编号#X00351)作为内部阳性对照。
阵列设计—在一个优选实施方案中,将25种CF突变分为4个不同的组,以使每组成员之间的序列同源性最小。即,将突变归入不同的组,以使任一组中的探针序列之间的重叠最小,从而使多重分析条件下的交叉杂交最小。颜色编码的微珠上展示的每一组均装配为不同的阵列。(这种4-芯片阵列设计的结果在下面的实施例中描述)。在此也公开了替代的加强阵列设计。
实施例11通过使用READ的探针延伸进行多重CF突变分析使用L.McCurdy,Thesis,Mount Sinai School of Medicine,2000所述的方法(在此引用作为参考),在多重PCR(mPCR)反应中,用相应的探针扩增从几名患者中提取的基因组DNA。该mPCR反应使用在5’端以通用序列标签的嵌合引物。反义引物在5’端磷酸化(Synthegen,TX)。用Perkin Elmer 9600热循环仪进行28个扩增循环,每个循环包括变温48秒、94℃10秒的变性步骤,变温36秒、60℃10秒的退火步骤,变温38秒、72℃40秒的延伸步骤,每种反应液(50μl)含有500ng基因组DNA,1×PCR缓冲液(10mM Tris HCL,50mM KCL,0.1%Triton X-100),1.5mM MgCl2,各200μM PCR级dNTPs和5单位Taq DNA聚合酶。测定每个探针对的最佳探针浓度。在扩增后,用可买到的试剂盒(Qiagen)纯化产物,除去所有试剂。DNA浓度通过分光光度分析测定。
用反义5’磷酸化引物扩增PCR产物。为了产生单链DNA模板,PCR反应产物与2.5单位外切核酸酶在1×缓冲液中37℃温育20分钟,随后加热到75℃10分钟灭活酶。在这些条件下,该酶从5’磷酸化末端开始消化双链DNA的一条链,释放5’-磷酸单核苷酸(J.W.Little等人,1967)。单链靶标也可以用本领域公知的其它方法产生。
向含有10mM Tris-HCL(pH 7.4),1mM EDTA,0.2M NaCl,0.1%Triton X-100的退火混合物中加入单个或汇集的PCR产物(各20ng)。退火混合物与(实施例10的)微珠展示的CF探针的编码阵列接触,在37-55℃下温育20分钟。然后加入延伸混合物,其含有3U ThermoSequenase(Amersham Pharmacia Biotech NJ)、1×酶缓冲液,以及荧光素标记的或TAMRA-标记的脱氧核苷酸(dNTP)类似物(NEN LifeSciences),和1μmole每种类型未标记的各种dNTP,延伸反应在60℃进行3分钟。微珠阵列用去离子无菌水(dsH2O)洗涤5-15分钟。利用装备有CCD照相机的荧光显微镜记录包含阵列内每个微珠的荧光信号的图像。分析图像,确定每种延伸探针的身份。结果在图15中显示。
实施例12覆盖探针的应用在CFTR基因的外显子10内已经鉴定了几个SNPs。外显子10中的多态性在本实施例的最后列出。已经在Δ508的序列中找到下列9个SNPs,是CFTR基因中最常见的突变(http//snp.cshl.org)dbSNP213450 A/GdbSNP180001 C/TdbSNP1800093 G/T1648 A/GdbSNP100092 C/GdbSNP1801178 A/GdbSNP1800094 A/GdbSNP1800095 G/A探针设计为适合所有可能的SNPs,合成探针,并与颜色编码的微珠偶联。考虑到所有可能的SNPs,修饰用于靶扩增的引物(实施例11所述)。PCR扩增的靶标介导末端匹配的探针的延伸。从该分析中收集的信息有两方面突变和SNPs的识别。
外显子10的多态性
1 cactgtagct gtactacctt ccatctcctc aacctattcc aactatctga atcatgtgcc61 cttctctgtg aacctctatc ataatacttg tcacactgta ttgtaattgt ctcttttact121 ttcccttgta tcttttgtgc atagcagagt acctgaaaca ggaagtattt taaatatttt181 gaatcaaatg agttaataga atctttacaa ataagaatat acacttctgc ttaggatgat241 aattggaggc aagtgaatcc tgagcgtgat ttgataatga cctaataatg atgggtttta301 tttccagact tcaCttctaa tgAtgattat gggagaactg gagccttcag agggtaaaat361 taagcacagt ggaagaattt cattctgttc tcagttttcc tggattatgc ctggcaccat421 taaagaaaat AtCAtctTtg gtgtttccta tgatgaatat agatacagaa gcgtcatcaa481 agcatgccaa ctagaAgagG taagaaacta tgtgaaaact ttttgattat gcatatgaac541 ccttcacact acccaaatta tatatttggc tccatattca atcggttagt ctacatatat601 ttatgtttcc tctatgggta agctactgtg aatggatcaa ttaataaaac acatgaccta661 tgctttaaga agcttgcaaa cacatgaaat aaatgcaatt tattttttaa ataatgggtt721 catttgatca caataaatgc attttatgaa atggtgagaa ttttgttcac tcattagtga781 gacaaacgtc tcaatggtta tttatatggc atgcatatag tgatatgtgg t实施例13CF突变分析—使用模型系统的微珠上探针延伸图13提供了检测CF基因突变T117H的概述。靶标如实施例11所述进行PCR扩增。将3’端可变的两个17碱基的探针固定在颜色编码的微珠上。靶核酸序列与TAMRA-标记的dCTP、未标记的dNTPs和热稳定的DNA聚合酶一起加入。
3’端可变的互补17-mer寡核苷酸探针由商品供应商合成(Synthegen TX),其含有通过一个12-C间隔区连接的5’生物素(生物素-TEG),通过反相HPLC纯化。探针固定在颜色编码的微珠上。探针附着于颜色编码的微珠上。也提供合成的48-mer寡核苷酸,它在指定可变位点含有A、T、C或G,对应于的囊性纤维化基因外显子4的更变(R117H)。
向含有10mM Tris-HCL(pH 7.4),1mM EDTA,0.2M NaCl,0.1%Triton X-100的退火混合物中加入1μM合成靶标。退火混合物与编码的微珠阵列接触,在37℃下温育20分钟。然后加入延伸混合物,其含有3U Thermo Sequenase(Amersham Pharmacia Biotech NJ)、1×酶缓冲液,以及TAMRA-标记的脱氧核苷酸(dNTP)类似物(NEN LifeSciences),和1μM的各类未标记的dNTP,延伸反应在60℃进行3分钟。然后用dsH2O洗涤微珠阵列5-15分钟,利用装备有CCD照相机的荧光显微镜记录包含阵列内每个微珠发出的荧光信号的图像。分析这些图像,确定每种延伸探针的身份。如下分析信号用CCD照相机捕获图像,比较能用微珠颜色解码的两种探针之间的信号强度。野生型探针与加入的靶标完全匹配,因此产生延伸产物,而突变探针未观察到延伸。结果在图16a中显示。
实施例14CF突变分析—使用微珠标签(Bead-Tagged)引物的PCR和综合检测该实施例说明了悬液中微珠表面上的探针延伸,随后是微珠在芯片表面上的装配和固定以用于图像分析。设计对应于CFTR基因突变R117H并含有可变的3’端的寡核苷酸(图14),合成该寡核苷酸使其含有一个含12C间隔区的5’生物素-TEG(Synthegen,Texas)。探针如下附着于蓝色染色的微珠上向1×TE(100mM Tris-HCl,10mM EDTA),500mM NaCl的微珠溶液中加入2μM探针,在室温下反应45分钟。用1×TE,150mM NaCl洗涤微珠3次,并将微珠悬浮于50μl相同溶液中。向含有1×缓冲液(100mM Tris-HCl,pH 9.0,1.5mM MgCl2,500mM KCl)的PCR混合物中加入每种类型的微珠各1μl,40μM Cy5-标记的dCTP(Amersham Pharmacia Biotech NJ),80μM其它三种类型的dNTPs,和3U Taq DNA聚合酶(Amersham Pharmacia Biotech NJ)。在扩增前再向PCR混合物中添加野生型互补靶标(40ng)。在PerkinElmer 9600热循环仪中进行11个循环的PCR扩增,每个循环包括90℃变性30秒,55℃退火30秒,72℃延伸20秒。扩增后,用1×TE缓冲液离心洗涤微珠4次,并置于芯片表面。如以上实施例所述记录图像,用WO 01/98765所述的软件对图象进行分析。结果显示与野生型探针偶联的微珠特异扩增,而与突变探针偶联的微珠没有扩增。结果在图16b中显示。
该实施例显示将使用微珠标签探针的多重PCR与随后微珠在平面表面上的装配进行综合,以进行快速成像分析。在一个优选实施方案中,一种微流体连接的多区室装置可以用于如此处所述的模板扩增。例如,有多个能够进行温度循环并在每个区室中发生一个mPCR反应(产生所有希望的扩增子的一部分)的区室,这些区室可以如下使用(1)在4个区室的每一个中用不同的探针对进行PCR,如本实施例所述使用编码的微珠-标签引物;(2)在所有PCR反应完成后,汇集展示扩增子的微珠;(3)装配随机阵列;和(4)记录图像并分析数据。阵列装配可以用包括LEAPS在内的几种现有技术方法之一完成。
实施例15CF突变分析—在温控反应器中的一步退火和延伸如实施例11所述,在多重PCR(mPCR)反应中使用相应引物扩增从几名患者中提取的基因组DNA。在扩增后,使用商品试剂盒(Qiagen)纯化产物,除去所有试剂。DNA浓度通过分光光度分析测定。向含有10mM Tris-HCL(pH 7.4),1mM EDTA,0.2M NaCl,0.1%Triton X-100的退火混合物中加入单个或汇集的PCR产物(各20ng)。退火混合物与延伸混合物混合,后者含有3U Thermo Sequenase(AmershamPharmacia Biotech NJ),1×酶缓冲液,以及荧光素标记的或TAMRA-标记的脱氧核苷酸(dNTP)类似物(NEN Life Sciences),和1-10μmole每种类型的未标记dNTP,并与颜色编码的阵列所展示的寡核苷酸探针阵列接触。寡核苷酸如以上实施例所述设计并合成。退火和延伸反应在温控循环仪中进行。温度步骤如下65℃,60℃,55℃,50℃,45℃各3分钟,温度之间的变温不超过30秒。微珠阵列然后用dsH2O洗涤5-15分钟,用装备有CCD照相机的荧光显微镜记录包含阵列内每个微珠发出的荧光信号的图像。分析这些图像,确定每种延伸探针的身份。典型结果在图17中显示。
实施例16覆盖探针的汇集为了分析指定的多态性,设计具有30-50%G+C碱基组成的20-mer寡核苷酸(Oligo)延伸探针,其在3’端含有一个可变位点(G/T),用来与指定的多态性位点比对。两个非指定多态性位点预计在位点10(C/A)和位点15(T/G)处。设计概述如下野生型探针序列Oligo 1在位点20为″G″,在位点10为″C″,在位点15为″T″.
Oligo 2在位点20为″G″,在位点10为″C″,在位点15为″G″.
Oligo 3在位点20为″G″,在位点10为″A″,在位点15为″T″.
Oligo 4在位点20为″G″,在位点10为″A″,在位点15为″G″.
突变探针序列Oligo 1在位点20为″T″,在位点10为″C″,在位点15为″T″.
Oligo 2在位点20为″T″,在位点10为″C″,在位点15为″G″.
Oligo 3在位点20为″T″,在位点10为″A″,在位点15为″T″.
Oligo 4在位点20为″T″,在位点10为″A″,在位点15为″G″.
汇集所有探针,使用以上实施例的方案使其附着于一种类型的颜色编码的微珠上。当向展示汇集探针的这些微珠上添加单链靶标时,只要一种探针与指定多态性完全比对就将产生延伸产物。
实施例17杂合与纯合构型中的指定多态性为了辨别杂合与纯合构型,改进以上实施例的设计,使之含有第二组探针,以识别与探针3’端比对的C/A指定多态性,并可以指出杂合突变还是纯合的突变。
在以上实施例中,预计两个非指定多态性位点位于位点10(C/A)和位点15(T/G)处。设计概述如下第1组Oligo 1在位点20为″C″,在位点10为″C″,在位点15为″T″.
Oligo 2在位点20为″C″,在位点10为″C″,在位点15为″G″.
Oligo 3在位点20为″C″,在位点10为″A″,在位点15为″T″.
Oligo 4在位点20为″C″,在位点10为″A″,在位点15为″G″.
第2组Oligo 5在位点20为″A″,在位点10为″C″,在位点15为″T″.
Oligo 6在位点20为″A″,在位点10为″C″,在位点15为″G″.
Oligo 7在位点20为″A″,在位点10为″A″,在位点15为″T″.
Oligo 8在位点20为″A″,在位点10为″A″,在位点15为″G″.
汇集第1组的寡核苷酸,使用以上实施例的方案将其附着于单一颜色(例如绿色)编码的微珠上。汇集第2组的寡核苷酸,使用以上实施例的方案将其附着于第二种颜色(例如橙色)编码的微珠上。如前所述,汇集这些微珠,并固定在芯片表面上。然后,引入靶标,如以上实施例所述进行芯片上的反应。如果只有绿色微珠上的探针延伸,则该个体含有正常的(或野生型)等位基因。如果只有橙色微珠上的探针延伸,则个体的突变是纯合的。如果绿色和橙色微珠上的探针均延伸,则该个体的该等位基因是杂合的。这一设计可用于识别已知和未知的突变。
实施例18—确证性测序(“重测序”)本发明的设计能够用于具体区域的重测序。当芯片上的探针延伸反应需要证实时,可以使用这一试验,如对于CF突变组中I506V、I507V、F508C和7T的反射检测(reflex test)。长度为20-30个碱基的所述序列通过所有可变位点的多重探查在芯片上测序。通过为不明确的位置设计特异的探针,以及如实施例16和17所述进行探针汇集来实现测序。
实施例19使用一种标记dNTP和三种未标记dNTPs的延伸通过掺入至少一种标记dNTP,实时检测所有延伸产物,并根据它们与编码的固相载体的结合进行识别。使用实施例6和7所述的测定条件,延伸反应中使用四甲基罗丹明-6-dCTP和未标记的dATP、dTTP和dGTP,产生如图18所示的荧光标记的延伸产物。也可以使用其它的dNTPs染料标记(如BODIPY-标记的dUTP和Cy5-标记的dUTP)。类似地也可以使用其它任何标记的dNTP。延伸产物的长度取决于DNA聚合酶容许的标记dNTP的量。现有的酶通常对链修饰的部分(如生物素和洋地黄毒苷)显示较高的容许量,这些修饰部分然后在第二步中可以与标记的亲和素或抗体反应,获得延伸产物的间接标记。当使用这些小分子时,产生可测定几百个碱基长度的延伸产物。
实施例20使用一种标记ddNTP和三种未标记dNTPs的延伸为了终止延伸反应,可以掺入TAMRA-标记的ddCTP,如图19所示。使用TAMRA-标记的ddCTP的芯片反应如实施例6和7所述进行。在含有TAMRA-ddCTP和未标记dTTP、dATP和dGTP的反应混合物中,在靶标与匹配探针退火后,当完成第一种ddCTP的掺入时,延伸反应终止。这可能在掺入第一种碱基时发生,产生单碱基延伸产物,或者可能在掺入一些未标记的dNTPs后发生。
实施例21使用4种未标记dNTPs的延伸,利用标记探针杂交的检测使用全套4种未标记dNTPs延伸探针,在聚合酶的“原始”条件下产生几百个碱基长度的延伸产物,其长度只受退火模板长度和芯片上反应条件的限制。高温变性后,在第二步中通过与标记寡核苷酸探针(序列设计为与延伸产物的一部分互补)杂交来检测延伸产物。此过程在图20中显示。
实施例22使用4种未标记dNTPs的延伸,通过标记的模板检测对于在多重杂交测定中常规使用的标准方案,通过掺入标记的探针,在PCR过程中能够将要分析的DNA靶本身标记。在如实施例6和7所述的条件下,标记靶标与探针退火。用未标记的dNTPs延长匹配的探针。在延伸反应完成后,通过将温度(Tdel)设定为如下的值进行检测高于靶标与不匹配探针形成的复合物的解链温度(T不匹配),但是低于靶标与匹配因而延伸的探针形成的复合物的解链温度(T匹配))。后一种显示双链区长片段的复合物,比前者显著地更加稳定,因此(T不匹配)<T<(T匹配)。T值一般为70-80℃。在这些条件下,只有靶标与被延伸探针形成的复合物才是稳定的,而靶标与不匹配探针形成的复合物以及相应固相载体发出的荧光信号都将失去。也就是说,与其它设计相反,检测到与不匹配探针相关的信号强度降低,而不是与匹配探针相关的信号强度提高。图21说明了不需要标记dNTPs或ddNTPs的设计。在本发明的优选实施方案中这是有用的,其中标记dNTPs或ddNTPs能够被非特异地吸附到编码颗粒上,从而提高信号背景,并降低测定的分辨力。另外,使用标记的靶标,该方案直接适用于通过序列特异的寡核苷酸杂交进行的多态性分析方法。
实施例23实时芯片上的信号放大以平面几何形状使用的一种标准温控装置,如图22所示的装置,允许对SSPs的多重延伸使用编程的温度变化。在实施例6和7的条件下,一种特定模板在多次重复的“变性-退火-延伸”循环中的每一次均介导一种探针的延伸。在第一个循环中,靶分子与探针结合,探针延伸或延长。在下一个循环中,靶分子在“变性”阶段(一般为95℃)与第一种探针分离,然后在“退火”阶段(一般为55℃)与另一种探针分子退火,并且在“延伸”阶段(一般为72℃)介导探针的延伸。在N个循环中,每个模板介导N个探针的延伸,该方案对应于线性扩增(图30)。在本发明的一个优选实施方案中,编码微珠的平面阵列用来在多重延伸反应中展示探针,对两个平面、平行基质之间所含的反应混合物施加一系列温度循环。光可直接及于一种基质,使编码微珠的整个阵列直接成像。优选的实施方案通过在每个循环完成时立即记录整个微珠阵列的图像来提供实时扩增。
基因组、线粒体或其它富集的DNA能够利用芯片上线性扩增直接检测,而不需要序列特异性扩增。当样品中含有足以进行检测量的DNA时,这是可能的。在微珠阵列形式中,如果检测每个微珠的信号需要104个荧光团,30个循环的线性扩增将使必要的数量减少到约300个。假定阵列内使用100个所需类型的微珠,必需的荧光团总数将是约105个,这个数字在临床标本中一般能够获得。例如,用于HLA临床分子分型的典型PCR反应用0.1-1μg基因组DNA进行。1μg人基因组DNA对应于约10-18摩尔,因此是6×105个拷贝的目的基因。小型化微珠阵列平台和芯片上扩增所需的小量样品使得PCR前样品的直接应用成为可能。这不仅简化了样品制备,更重要的是消除了多重PCR的复杂性,这种复杂性是多重遗传分析发展中常见的一个限速步骤。
实施例24为了分析CF突变,构建针对指定和非选择多态性的探针文库为了提高延伸探针的特异性,并避免假阳性,设计延伸探针使之适应靶序列中存在的所有已知的多态性。另外,设计PCR引物也要考虑指定和非指定的多态性。
选择CFTR基因外显子7上R347P1172处的G/C突变作为指定多态性,该突变是对囊性纤维化的标准人群载体筛查组内的25种突变之一。在对于总人口载体筛查的突变组中包括外显子7内的3个CF突变(http//www.faseb.org/genetics/acmg)。已经报告了同一位点处的多态性G/T/A(http//www.genet.sickkids.on.ca/cftr),另外,也报告了位点1175、1178、1186、1187和1189处的非指定多态性。所有这些多态性都能够干扰预期的探针延伸。
下面说明了用于eMAP的一组针对R347P(以粗体G表示)的简并探针的构建,它的周围有许多非指定多态性,以大写字母表示5′3′延伸的正常靶序列 Gca Tgg Cgg tca ctC GgC a简并延伸探针组Ngt Ycc Ycc agt gaY RcY t3′5′其中N=a,c,g或t;R(嘌呤)=a或g,Y(嘧啶)=c或t,意味着该组有128种简并性。
用于突变分析的引物汇集-构建简并组的主要目的是提供至少一种与靶序列足够匹配的探针序列,以确保探针的退火和延伸。通过提供与指定多态性相关的整个一组可能的探针序列,原则上这总是可以获得的,在构建覆盖组的优选模式中,如果为了完全汇集探针而将所有探针都置于一种类型的微珠上,在本实施例中该组的简并性程度128将导致测定信号强度相应减小两个数量级。分开的池(pool)通过将探针组分配于多个类型微珠上,将改善这种情况,但是这是以提高阵列的复杂性为代价的。
首先,探针池被分为最少两个或多个池,对于指定多态性位点的每种可能的组成,每个池在探针位点M处(即探针的3’端)具有互补的组成。在本实施例中,指定的靶组成的阳性识别需要4个这样的池。然后,以距离指定位点的顺序连续检查非指定多态性位点。其中,TEI区内的位点对于确保延伸特别重要。即,构建每个池,使之含有所有可能的针对TEI区内非指定位点的探针组成。最后,对于可变基因克隆和测序的简并探针的构建,通过将中性碱基如肌苷置于位于TEI区之外的探针位点内(条件是已知它们永远不会与靶标中的G并列),使该组的简并性最小。在该实施例中要考虑探针位点M-16和M-18中的非指定多态性。即,4个池之每一个的最小简并性将增加到4种,信号强度相应降低。作为经验,信号降低优选地限于8的因子。
总之,4个池将覆盖靶序列,其中每一个池唯一地分配给一种微珠类型,并且含有8种简并探针序列。这些序列类似于以下所示M变量池的序列用于CF突变R347P的探针库R347P Cgt Acc Gcc agt gaG GgC3′5′池1 Cgt Acc Gcc agt gaG IgICgt Acc Gcc agt gaC IgICgt Acc Ccc agt gaG IgICgt Acc Ccc agt gaC IgICgt Tcc Gcc agt gaG IgICgt Tcc Gcc agt gaC IgICgt Tcc Ccc agt gaG IgICgt Tcc Ccc agt gaC IgI
池2 Ggt Acc Gcc agt gaG IgIGgt Acc Gcc agt gaC IgIGgt Acc Ccc agt gaG IgIGgt Acc Ccc agt gaC IgIGgt Tcc Gcc agt gaG IgIGgt Tcc Gcc agt gaC IgIGgt Tcc Ccc agt gaG IgIGgt Tcc Ccc agt gaC IgI池3 Agt Acc Gcc agt gaG IgIAgt Acc Gcc agt gaC IgIAgt Acc Ccc agt gaG IgIAgt Acc Ccc agt gaC IgIAgt Tcc Gcc agt gaG IgIAgt Tcc Gcc agt gaC IgIAgt TcC Ccc agt gaG IgIAgt Tcc Ccc agt gaC IgI池4 Tgt Acc Gcc agt gaG IgITgt Acc Gcc agt gaC IgITgt Acc Ccc agt gaG IgITgt Acc Ccc agt gaC IgITgt Tcc Gcc agt gaG IgITgt Tcc Gcc agt gaC IgITgt Tcc Ccc agt gaG IgITgt Tcc Ccc agt gaC IgI反义链上非指定多态性的类型通常不同于正义链,因此为反义链构建简并探针组可能是有利的。对于简并延伸探针的构建,可以根据类似的原则构建简并杂交探针组,以使简并性最小化。
实施例25通过eMAP的“单管”CF突变分析该实施例涉及进行eMAP测定的方法和组合物,其中退火和延伸步骤在一个反应器中发生。该实施方案是有用的,因为它不需要在反应器之间转移样品,以及纯化或提取步骤,因而简化了检测,并且减少了错误的可能性。一个非限制性示范方案如下。
使用相应引物通过多重PCR(mPCR)反应扩增从几名患者中提取的基因组DNA。PCR条件和试剂组成如下。
引物设计合成不含任何修饰的正义引物和5’端含有“磷酸”的反义引物。多重PCR分两组进行。第一组扩增包括外显子5、7、9、12、13、14B、16、18和19。第二组扩增包括外显子3、4、10、11、20、21和内含子19的引物。外显子5、7、11上的5’磷酸基修饰包含在正向引物上,以使用反义靶标进行探针延伸。而其它所有扩增子使用正义靶标,将磷酸基置于反向引物上。
PCR主混合物组成对于10μl反应液/样品成分体积(μl)10×PCR缓冲液 1.025mM MgCl20.7dNTPs(2.5mM) 2.0引物混合物(多重性10×) 1.5Taq DNA聚合酶 0.3ddH2O 1.5DNA3.0总共 10PCR循环94℃5min,94℃10sec.,60℃10sec.,72℃40sec,72℃5min,循环数28-35反应体积可以根据实验需要进行调节。用Perkin Elmer 9600热循环仪进行扩增。测定每个引物对的最佳引物浓度。扩增后,取出5μl产物进行凝胶电泳。单链DNA靶标如下产生向5μl PCR产物中加入2μl外切核酸酶,在37℃下温育15分钟,将酶在80℃下变性15分钟。变性后加入1μl 10×外切核酸酶缓冲液和1μlλ外切核酸酶(5U/μl),在37℃下温育20分钟,75℃加热10分钟终止反应。
芯片上的延伸将用于26种CF突变的野生型和突变探针偶联到微珠表面上,并在芯片阵列上装配。探针也分为两组。为了反射试验装配第三组,包括5T/7T/9T多态性。
第1延伸组,芯片表面上总共31组微珠簇编号 突变1 G85E-WT2 G85E-M3 621+1G>T-WT4 621+1G>T-M5 R117H-WT6 R117H-M7 β肌动蛋白8 I148T-WT9 I148T-M10 508-WT11 F50812 I50713 G542X-WT14 G542X-M15 G551D-WT16 G551D-M17 R553X-WT18 R553X-M19 生物素20 1717-1G>A-WT21 1717-1G>A-M22 R560T-WT23 R560T-M24 3849+10kbT-WT25 3849+10kbT-M26 W1282X-WT27 W1282X-M28 N1303K-WT29 N1303K-M30 OLIGO-C第2延伸组,芯片表面上总共28组簇编号突变
1 711+1G>T-WT2 711+1G>T-M3 R334W-WT4 R334W-M5 1078delT-WT6 1078delT-M7 β肌动蛋白8 R347P-WT9 R347P-M10A455E-WT11A455E-M121898+1G>A-WT131898+1G>A-WT142184delA-WT152184delA-M162789+5G-WT172789+5G-M18生物素193120+1G>A-WT203120+1G>A-WT21R1162X-WT22R1162X-M233659delC-WT243659delC-M25D1152-WT26D1152-M27OLIGO-CmPCR第2组第3延伸组,总共6组簇编号 突变1 β肌动蛋白1 Oligo C2 5T3 7T4 9T5 生物素为了在单次和/或多重靶标延伸测定中使用,优化了延伸反应缓冲液,由Tris-HCl(pH 8.5)1.2mM,EDTA 1μM,DTT 10μM,KCl 1μM,MgCl213μM,2-巯基乙醇10μM,甘油0.5%,Tween-200.05%和Nonidet 0.05%组成。向每个芯片上添加10μl延伸反应混合物,其中含有1×反应缓冲液,0.1μM标记dNTP,1.0μMdNTPs混合物,3UDNA聚合酶和5μl(约5ng)靶DNA(患者标本)。向芯片表面添加反应混合物,在53℃下温育15分钟,然后60℃3分钟。芯片用含有0.01%SDS的洗涤缓冲液洗涤,覆盖清洁的盖片,用生物阵列溶液成像系统分析。分析这些图像确定每种被延伸探针的身份。
实施例26CF突变分析—单管单芯片一步延伸将用于26种CF突变和对照的探针偶联到51种微珠的表面上。探针偶联的微珠在单个芯片表面装配。从几名患者标本中提取基因组DNA,如以上实施例所述,在多重PCR(mPCR)反应中用相应引物扩增。扩增后,用λ外切核酸酶产生单链DNA产物。将一种或汇集的PCR产物(约5ng)加入反应混合物中,混合物中含有反应缓冲液、脱氧核苷酸(dNTP)类似物(NEN Life Sciences),每种未标记的dNTP和DNA聚合酶(Amersham Pharmacia Biotech,NJ)。退火/延伸反应在温控循环仪中进行。温度步骤如下53℃20分钟,60℃3分钟。微珠阵列然后用含有0.01%SDS的dsH2O洗涤5-15分钟。用配备有CCD照相机的荧光显微镜记录包含阵列内每个微珠发出的荧光信号的图像。分析这些图像,确定每种延伸的探针的身份。
以下列出了含有26种CF突变的微珠芯片的组成。
第4延伸组,总共51组簇编号突变1 β肌动蛋白2 G85E-WT3 G85E-M4 621+1G>T-WT5 621+1G>T-M6 R117H-WT7 R117H-M8 I148T-WT9 I148T-M10711+1G>T-WT11711+1G>T-M12A455E-WT13A455E-M14508-WT15F50816I50717R533-WT
18R533-M19G542-WT20G542-M21G551D-WT22G551D-M23R560-WT24R560-M251898+1G-WT261898+1G-M272184delA-WT282184delA-M292789+5G>A-WT302789+5G>A-M313120+1G-WT323120+1G-WT33D1152-WT34D1152-M35R1162-WT36R1162-M37OLIGO-C38W1282X-WT39W1282-M40N1303K-WT41N1303-M42R334-WT43R334-M441078delT-WT451078delT-M463849-10kb-WT473849-10kb-M491717-1G>A-WT501717-1G>A-WT51生物素实施例27通过eMAP识别三种或更多碱基缺失和/或插入利用延伸反应分析含有3个以上碱基缺失或插入的突变。设计探针,将突变碱基置于3’端3-5个碱基之前。野生型探针设计为包含或者不包含突变碱基(在突变前终止)。以下是ATCTC缺失和/或AGGTA插入所致突变的一个实例。探针设计如下1.WT1-----------------------ATCTCgca2.WT2-----------------------3.M1------------------------gca(仅有缺失)4.M2------------------------AGGTAgca(缺失和插入)将野生型探针偶联到不同编码的微珠表面上,或者如本发明所述汇集。将用于突变1(M1缺失)和2(M2插入)的探针偶联到不同的微珠上。这两种野生型探针提供类似的信息,而突变探针能够显示在具体样品中识别的突变类型。
实施例28发夹探针在本发明的某些实施方案中,微珠展示的引发探针形成发夹构型。发夹结构可在5’端包含与TEI区和DA序列互补的序列片段,如图23所示。在竞争性杂交反应中,在DA区优先与靶序列杂交时,发夹结构随即打开。在此条件下,TEI区将与指定多态性位点比对,并且将发生延伸反应。这种反应的竞争性能够用来控制探针的容错水平。
实施例29通过定制微珠阵列上展示的等位基因特异性寡核苷酸的多重延伸,对囊性纤维化和德系犹太人疾病突变进行分析用囊性纤维化突变的ACMG+组,已经评价了用于高通量突变多重分析的一种新型分析法。另外,也开发了德系犹太人疾病组,来检测已知可引起泰-萨二氏病(Tay-Sachs)、Canavan、高雪氏病(Gaucher)、尼曼氏病(Niemann-Pick)、布卢姆综合征(BloomSyndrome)、范康尼氏贫血症(Fancomi Animia),家族性植物神经功能不全(Familial Dysautonomia)和粘脂贮积症(mucolipodosis)IV型的共同突变。
在延伸介导的多重多态性分析(eMAP)中,含有可变3’端序列的等位基因特异性寡核苷酸(ASO)附着于颜色编码的微珠上,这些微珠随后在硅芯片上排列。根据整个阵列发出的荧光信号的瞬时成像同时检测正常和突变序列的延伸产物。
在该实施例中,用几百份临床患者样本评价ACMG CF微珠芯片。如图24所示,这种分析对通过标准DNA分析识别的所有突变正确地评分。
总之,包括定制微珠的多重延伸分析被用来研究对应于ACMG+和德系疾病组的突变。定制的微珠可以用于DNA和蛋白质分析。由于以下几个原因,这些定制的微珠的使用是有利的,包括(1)瞬时成像—该试验的耗时在2小时之内,(2)自动图像采集和分析,(3)小型化,这意味着试剂消耗低,(4)利用晶片技术合成微珠芯片,使得需要时能够大量生产上百万芯片。
权利要求
1.一种用于同时检测位于一个或多个靶核苷酸序列内的指定多态性位点的核苷酸组成的方法,该方法包括下列步骤(a)提供一组或多组探针,每种探针都能与位于指定多态性位点附近范围的所述一个或多个靶核苷酸序列的亚序列退火;(b)使这组探针与所述一个或多个靶核苷酸序列接触,通过使探针序列内的探查位点与指定多态性位点直接比对,形成杂交复合物;(c)对于每种杂交复合物,检测探查位点与指定多态性位点之间是否存在匹配或错配;和(d)确定指定多态性位点的组成。
2.权利要求1的方法,其中所述一种或多种靶核苷酸序列是用一组或多组引物以多重PCR反应合成。
3.权利要求2的方法,其中所述引物组是简并引物组。
4.权利要求1的方法,其中所述靶标是基因组DNA片段。
5.权利要求1的方法,其中所述靶标是cDNA片段。
6.权利要求1的方法,其中一组或多组探针在基质上空间编码。
7.权利要求1的方法,其中一组或多组探针被固定在编码微粒上。
8.权利要求7的方法,其中编码微粒被装配成随机编码的阵列。
9.权利要求1的方法,其中每个探针含有能够启动延伸或延长反应的末端延伸起始区。
10.权利要求9的方法,其中该反应由缺乏3’→5’核酸外切酶活性的聚合酶催化。
11.权利要求1的方法,其中步骤(c)包括添加一种或多种脱氧核苷三磷酸。
12.权利要求11的方法,其进一步包括使用能够延伸或延长探针的聚合酶。
13.权利要求12的方法,其中所述聚合酶缺乏3’→5’核酸外切酶活性。
14.权利要求11的方法,其中至少一种脱氧核苷三磷酸被标记,以产生与延长产物相关的可光学检测的信号。
15.权利要求1的方法,其中通过探针与荧光标记的靶标退火形成荧光杂交复合物,使光学标记附着于一种或多种探针。
16.权利要求15的方法,其进一步包括使用一种能够延伸或延长探针的聚合酶,通过添加一种或多种脱氧核苷三磷酸,形成延长的杂交复合物来展示匹配。
17.权利要求16的方法,其进一步包括通过检测光学标签的稳定性识别延长产物,检测条件是温度被设定为高于靶标与不匹配探针形成的任何杂交复合物的解链温度、但是低于靶标与延长探针形成的任何延伸杂交复合物的解链温度。
18.权利要求15的方法,其中来自探针组的一种或多种探针被固定于编码微粒上,并且检测光学标签的改变。
19.权利要求15的方法,其中来自探针组的一种或多种探针被固定于以随机编码阵列排列的编码微粒上。
20.权利要求19的方法,其中所述阵列以空间编码的方式排列。
21.权利要求15的方法,其中检测光学标签的改变并确定颗粒的身份。
22.一种序列特异性放大分析生物样品中目的核酸序列时产生的分析信号的方法,该方法包括下列步骤(a)提供能够与目的序列形成杂交复合物的一组固定化探针;(b)在可使目的序列与至少一种固定化探针退火形成杂交复合物的条件下,使所述固定化探针组接触含有所述目的序列的所述生物样品;(c)使所述杂交复合物接触一种聚合酶,使所述杂交复合物内所含的探针延伸或延长;(d)将探针的延伸或延长转换为光学信号;和(e)实时记录这组固定化探针发出的光学信号。
23.权利要求22的方法,其进一步包括进行一个或多个循环,每个循环都包括“退火-延伸/延长-检测-变性”步骤,其中每个循环都导致延伸或延长的探针数以算术级数增加。
24.权利要求23的方法,其包括下列步骤(a)设定有利于杂交复合物形成的第一个温度;(b)设定有利于聚合酶催化延伸的第二个温度;(c)将延伸或延长转换为光学信号;(d)记录/成像所有固定化探针发出的光学信号;和(e)设定第三个温度,以确保所有杂交复合物的变性。
25.一种形成用于同时探查一种或多种靶核酸序列内的指定多态性位点的覆盖探针组的方法,该方法包括下列步骤(a)确定其探查位点能够与指定多态性位点比对的延伸探针的序列;(b)进一步确定一整套简并探针,以适应所有非指定的以及未选择的指定多态性位点,而仍然能使探针的探查位点与指定多态性位点比对;和(c)通过除去所有被包容的多态性,降低简并程度。
26.权利要求25的方法,其中所述覆盖组含有至少两种探针,它们对每个指定位点具有不同的探查位点组成。
27.权利要求25的方法,其中步骤(c)中复杂度的降低通过探针汇集实现。
28.一种识别一个或多个靶核苷酸中一个或多个指定位点多态性的方法,该方法包(a)提供一种或多种能够探查所述指定位点的探针;(b)通过延长用来探查指定位点的一种或多种探针,形成延伸产物;和(c)确定所述两个或多个位点处的组成。
29.权利要求28的方法,其进一步包括通过使用来探查第二个指定位点的第二种探针与延伸产物退火,形成杂交复合物。
30.一种识别靶多核苷酸序列内一个或多个指定位点多态性的方法,该方法包括(a)提供一种或多种能够探查所述指定位点的探针;(b)为每个指定位点赋值,同时适应位于每个多态性附近范围的非指定多态性位点。
31.权利要求30的方法,其中探针与靶序列之间的同源性通过多重技术分析。
32.一种测定靶核苷酸序列的一个或多个指定位点多态性的方法,该方法包括提供一对或多对能够检测缺失的探针的步骤,其中缺失被置于探针3’端或距3’端3-5个碱基之内。
33.一种识别靶核苷酸序列内两个或更多指定位点多态性的方法,该方法包括(a)选择多个指定多态性位点,以允许等位基因分配;(b)提供两种或更多种能够同时探查该多个指定位点的探针;(c)为每个指定位点赋值;和(d)组合这些值以确定等位基因或等位基因组的身份,并适应邻所述近指定多态性的非指定位点。
34.一种测定靶多核苷酸序列内一个或多个指定位点多态性的方法,该方法包括为该指定位点提供一个探针组,并且根据每个探针的末端延伸起始将该探针组分成不同的探针亚组。
35.权利要求34的方法,其进一步包括以下步骤对所述探针组进行多重分析,在不受探针组内其它探针干扰的情况下测定该探针组中的每个探针,改变靶多核苷酸序列的等位基因匹配模式,以包括探针组包容的等位基因。
36.权利要求35的方法,其中改变靶多核苷酸序列的等位基因匹配模式的步骤包括汇集一个或多个探针组,使之包括匹配的等位基因。
37.权利要求36的方法,其中改变靶多核苷酸序列的等位基因匹配模式的步骤包括比较该探针组产生的信号强度的步骤。
38.权利要求37的方法,其进一步包括分离探针组中末端延伸起始区和双链锚定区的步骤。
39.一种同时探查多个多态性位点的方法,包括通过施加一个或多个温度循环实现靶标的线性扩增,进行多重延伸测定的步骤。
40.一种同时探查多个多态性位点的方法,包括在温控条件下运用退火和延伸步骤的组合进行多重延伸测定的步骤。
41.一种同时探查一个或多个相邻靶序列内S个多态性位点处的核苷酸组成的方法,Ps={cp(s);1<=s<=S},该方法通过进行下列步骤,给每个cp分配一组有限可能数值之一(a)提供一组指定的固定化寡核苷酸探针,也被称为延伸探针,每种探针在优选比对中均能与位于指定多态性位点附近的靶标亚序列退火,这种优选比对使探针序列内的一个探查位点与指定的多态性位点直接并列,该探针还含有能够启动延伸或延长反应的末端延伸起始(TEI)区;(b)使一个或多个靶序列与该组固定化寡核苷酸探针退火,形成探针-靶杂交复合物;(c)对于每种探针-靶杂交复合物,确定探查位点与相应指定多态性位点之间组成的匹配或错配。
42.权利要求41的方法,其中探针以空间编码的方式固定于基质上。
43.权利要求41的方法,其中探针固定于编码的微粒上,随后在基质上装配成随机编码的阵列。
44.权利要求41的方法,其中确定匹配或错配的步骤包括使用能够延伸或延长探针的聚合酶,探针的探查位点组成与靶标内指定多态性位点的组成匹配,通过添加其中之一被标记的一种或多种三磷酸核苷,只有这些探针可以产生可光学检测的信号。
45.权利要求41的方法,其中通过荧光标记靶标与这些引物退火形成荧光杂交复合物,光学标签与第一步中所有固定化探针结合,其中第二步包括使用能够延伸或延长展示末端匹配的探针的聚合酶,通过添加一种或多种三磷酸核苷,只有这些探针形成延伸的杂交复合物,其中在超过任何杂交复合物的解链温度、但不超过任何延伸杂交复合物的解链温度的温度值下,根据光学标签的稳定性识别延伸产物。
46.权利要求45的方法,其中探针固定于编码的微粒上,通过流式细胞仪检测光学标签的改变,并确定颗粒的身份。
47.权利要求45的方法,其中探针固定于以随机编码阵列排列的编码微粒上,所述阵列以空间编码的方式任意排列,通过直接成像检测光学标签的改变,确定颗粒的身份。
48.一种序列特异地扩增分析生物样品中目的核酸序列时产生的测定信号的方法,该方法包括下列步骤(a)提供一种温控样品容纳装置,其具有可实时记录该装置内产生的光学反应信号的温控装置;(b)在所述样品容纳装置内提供一组能够与目的序列形成杂交复合物的可辨别的固定化寡核苷酸探针;(c)使序列与这组固定化寡核苷酸探针退火,形成杂交复合物;(d)使所述杂交复合物接触一种聚合酶,使杂交复合物内所含的匹配探针延伸或延长;(e)提供将匹配探针的延伸或延长转换为光学反应信号的装置;(f)提供能够实时记录这组固定化探针发出的光学反应信号的光学记录/成像装置;(g)进行一个或多个“退火-延伸-检测-变性”循环,每个循环以算术级数提高延伸或延长的探针数,包括下列步骤(i)设定有利于杂交复合物形成的第一个温度;(ii)设定有利于聚合酶催化延伸的第二个温度;(iii)将延伸转换为光学信号;(iv)记录/成像所有固定化探针发出的光学信号/光学标签;和(v)设定第三个温度,以确保所有杂交复合物的变性。
49.一种同时测定一种或多种靶标内多个指定位点构型的方法,该方法包括为所述靶标的扩增提供引物;提供探针阵列;利用探针阵列进行产生延伸产物的反应;和检测所述延伸产物。
50.一种测定一种或多种核酸内至少一个指定位点构型的方法,所述方法包括提供一种或多种核酸的多个拷贝,每种所述核酸含有至少一种多态性;(a)选择至少一种多态性作为指定位点;(b)提供两种或多种能够同时探查每个所述指定位点的探针,测定所述每个指定位点的组成,每一类探针均包含i.一个末端延伸起始区,用来与所述指定位点处部分所述核酸比对,并且能够启动聚合酶催化的所述探针的延伸,ii.一个可变双链锚定区,用来与所述核酸的不同部分比对,(c)在至少一些探针能够与所述一种或多种核酸杂交的条件下,使所述探针与所述一种或多种核酸的多个拷贝接触;(d)进行延伸反应,该反应可延长与所述核酸退火的所述探针组的成员;(e)检测该延伸反应;和(f)为每个指定位点赋值。
51.根据权利要求50的方法,其进一步包括为了确定每个指定位点的身份而合并数值的步骤。
52.根据权利要求51的方法,其中为所述至少一个指定位点分配的值对应于所述至少一个指定位点处的核苷酸。
53.根据权利要求51的方法,其中如果所述探针与所述核酸完全匹配,则为所述至少一个指定位点分配的值对应于“1”,如果所述探针与所述核酸不完全匹配,则为“0”。
54.根据权利要求51、52或53的方法,其中合并所述值,以确定等位基因或等位基因组的身份。
55.根据权利要求50的分析方法,其中所述末端延伸起始区与所述双链锚定区直接相邻。
56.根据权利要求50的分析方法,其中所述末端延伸起始区与双链锚定区通过一个分子链连接。
57.根据权利要求50的分析方法,其中设计所述探针组中所述探针的双链锚定区时考虑非指定位点的多态性。
58.根据权利要求50的方法,其中所述一种或多种核酸是从CFTR基因中获得。
59.权利要求58的方法,其中探针与正义或反义DNA链的靶序列比对。
60.权利要求59的方法,其中在平行反应中分析探针与靶序列之间的同源性。
61.权利要求50的方法,其中所述至少一种多态性是一个缺失。
62.权利要求50的方法,其中所述至少一种多态性是一个插入。
63.权利要求50的方法,其中所述至少一种多态性是单核苷酸多态性。
64.权利要求62的方法,其中每个探针的一部分被用来检测缺失,该部分位于3’端或距3’端3-5个碱基内。
65.权利要求50的分析方法,其中所述一种或多种核酸是从HLA基因中获得。
66.根据权利要求63的分析方法,其中含有相同末端延伸区的探针被分在一起。
67.一种同时探查一种或多种核酸内一组指定多态性的方法,该方法包括(a)提供一种或多种核酸的多个拷贝,所述一种或多种核酸含有一组指定的多态性;(b)使所述一种或多种核酸的多个拷贝接触多种类型的探针,其中每种所述类型的探针均能够与所述核酸退火,并且具有与其它类型探针不同的长度;(c)核酸与探针退火;(d)延伸探针;(e)检测延伸的探针;和(f)确定所述核酸内所述指定多态性的序列。
68.一种测定核酸序列的方法,该方法包括(a)提供一种核酸的多个拷贝,所述核酸具有至少一种多态性;(b)选择至少一种多态性作为指定位点;(c)提供多种类型的探针,所述每种类型的探针均包含一个用来探查所述指定位点处部分所述核酸的末端延伸起始区,如果所述末端延伸起始区与指定位点完全比对,则能够启动所述探针的延伸;一个用来与所述核酸不同部分比对的可变双链锚定区,其中多种类型的探针与一种或多种固体载体偶联,和进行检测,以确定所述核酸的序列。
69.根据权利要求68的方法,其中进行测定的步骤包括使所述探针接触所述核酸,其中所述探针与包含微珠的固体载体连接,所述微珠以平面阵列排列;使至少一种类型的探针与所述核酸退火;延伸与核酸退火的探针;和检测哪种探针被延伸,以确定所述核酸的所述指定多态性位点的序列。
70.一种测定一种或多种核酸内至少一个指定位点的序列的方法,所述方法包括(1)提供一种缓冲溶液,所述缓冲溶液包含(a)一种或多种核酸的多个拷贝,每种所述核酸均含有多态性位点,选择至少一个多态性位点作为指定位点;(b)两种或多种类型的探针,每种所述类型的探针均含有一个末端延伸起始区,用来探查所述指定位点处部分所述核酸,如果所述末端延伸起始区与所述指定位点完全比对,则末端延伸起始区能够启动探针延伸;一个用来与所述核酸的不同部分比对的可变双链锚定区;(c)一种聚合酶;(d)多种类型的dNTP,其中至少一种dNTP被标记;(2)加热所述缓冲溶液至第一个温度,使所述探针与所述多拷贝的一种或多种核酸退火;(3)加热所述缓冲溶液至第二个温度,使所述退火的探针延伸;(4)检测延伸的探针,确定一种或多种核酸的指定位点的序列。
71.一种测定一种或多种核酸内至少一个指定位点序列的方法,该方法包括提供一种或多种核酸的多个拷贝,每种所述核酸都含有至少一种多态性;选择每种核酸上的至少一种多态性作为指定位点;提供两种或多种类型的探针,所述每一类探针均包含一个末端延伸起始区,用来探查所述指定位点处的部分所述核酸,如果所述末端延伸起始区与所述指定位点完全比对,则末端延伸起始区能够启动探针延伸;一个用来与所述核酸的不同部分比对的可变双链锚定区;其中所述两种或多种探针与一种或多种固体载体偶联,所述探针与所述多个拷贝的一种或多种核酸退火;进行延伸反应,该反应可延长与核酸退火的探针;检测所述延伸反应;为每个指定位点赋值;和合并这些值,确定每个指定位点的身份。
72.权利要求71的方法,其中所述固体载体是编码的微珠,并且其中该方法进一步包括在基质上装配所述编码的微珠形成阵列的步骤。
73.一种测定核酸序列的方法,所述方法包括提供一种核酸的多个拷贝,所述核酸含有多态性;选择至少一种多态性作为指定位点;使核酸的多个拷贝接触多种类型的探针,其中每种探针包含一个末端延伸起始区,用来与所述指定位点处的部分所述核酸比对,并且能够启动聚合酶催化的所述探针延伸,还包含一个用来与所述核酸的不同部分比对的可变双链锚定区,并且其中所述探针附着于阵列中的编码微珠上;在促进所述核酸与所述探针退火的条件下,使所述核酸接触所述探针;使用至少一种标记的dNTP在所述探针上进行延伸反应;使阵列内每个微珠发出的荧光信号成像,确定所述延伸探针的身份;测定核酸序列。
74.一种测定核酸的指定多态性位点序列的试剂盒,该试剂盒包含多种类型的探针,其中每种探针包含一个末端延伸起始区,用来与在所述指定位点处的部分所述核酸比对,并且能够启动所述探针延伸;一个用来与所述核酸的不同部分比对的可变双链锚定区。
75.根据权利要求74的试剂盒,其中探针形成编码的探针阵列。
76.根据权利要求74的试剂盒,其进一步含有进行所述探针与所述核酸退火的试验装置,所述试验装置还包括延伸所述退火探针的装置。
77.根据权利要求74的试剂盒,其进一步包括检测哪种探针被延伸的装置。
78.一种同时探查核酸的多个多态性位点的方法,该方法包括提供含有多个多态性位点的核酸;进行一个或多个退火-延伸-检测循环,每个循环都以算术级数增加被延伸探针的数量,并且包括下列步骤设定有利于杂交复合物形成的第一个温度;提供能够与所述核酸序列形成杂交复合物的一组可辨别的固定化寡核苷酸探针;所述核酸与所述固定化寡核苷酸探针组退火,形成包括含匹配探针的一组杂交复合物;设定有利于聚合酶催化延伸的第二个温度;使所述杂交复合物组接触一种聚合酶以延伸杂交复合物内所含的匹配探针;将延伸转换为光学信号;记录固定化探针组或延伸产物发出的试验信号;设定第三个温度,以确保所有杂交复合物变性。
79.权利要求78的方法,其中所述寡核苷酸探针与一种固体载体偶联。
80.权利要求79的方法,其中所述固体载体包括多个编码的微珠。
81.权利要求80的方法,其中所述编码的微珠排列为阵列,所述阵列位于基质上。
82.权利要求81的方法,其中所述基质是一种芯片。
83.一种扩增核酸的方法,所述方法包括提供与多种编码微珠偶联的多种探针,其中所述每种探针只与一种编码微珠偶联;提供能够与至少一种探针退火的模板分子进行至少一个扩增循环,所述至少一个循环包括所述模板与所述至少一种探针退火;延伸退火的探针;和使退火的模板变性。
84.一种测定核酸中多态性位点组成的方法,该方法包括提供一种核酸,所述核酸含有多态性位点;选择至少两个多态性位点作为指定位点;提供能够探查指定位点的两种或多种探针;探查指定位点,以明确两个或多个这种指定位点的存在,并确定该两个或多个位点处的组成,其中探查指定位点的步骤包括在第一种探针与所述核酸之间形成杂交复合物;通过延伸所述第一种探针形成延伸产物;和通过延伸产物与用来探查第二个指定位点的第二种探针退火,形成杂交复合物。
85.根据权利要求84的方法,其中杂交步骤之后是在其它指定位点处的一个或多个杂交步骤。
86.一种检测延伸反应的方法,所述方法包括提供多种探针;将所述探针与允许识别所述探针的编码微珠偶联;使所述编码微珠与含有核酸和dATP、dCTP、dTTP和dGTP的溶液接触,其中一类所述dNTP包含一种标记;提供一种聚合酶;进行延伸反应;和检测延伸反应的产物。
87.根据权利要求86的方法,其中所述标记是一种荧光标记。
88.一种检测延伸反应的方法,所述方法包括提供多种探针;将所述探针与允许识别所述探针的编码微珠偶联;使所述编码微珠与含有一种标记ddNTP和三种dNTP的溶液接触;提供一种聚合酶;进行延伸反应;和检测延伸反应的产物。
89.一种检测延伸反应的方法,该方法包括提供多种探针;将所述探针与允许识别所述探针的编码微珠偶联;使所述编码微珠与含有dATP、dTTP、dGTP和dCTP的溶液接触;提供一种聚合酶;进行延伸反应,获得延伸的探针;提供与所述延伸探针的一部分互补的一种标记寡核苷酸探针;使所述探针与所述延伸的探针退火;和检测所述延伸的探针。
90.一种检测延伸反应的方法,所述方法包括提供一种标记的靶序列;提供多种类型探针,其中所述类型探针之一与所述标记的靶序列完全互补;将所述探针与允许识别所述探针的编码微珠偶联;使所述标记的靶标与所述探针退火;进行延伸反应,获得延伸的探针;加热退火的探针至一定温度,该温度足以变性含有不匹配的探针但保持对应于完全匹配探针的双链结构;和通过确定加热后哪种编码微珠含有结合的靶序列,识别对应于完全匹配探针的延伸产物。
91.一种探针,其选自实施例2中列出的探针。
92.一种探针,其选自实施例3中列出的探针。
93.一种探针,其选自实施例9中列出的探针。
94.一种探针,其选自实施例10中列出的探针。
95.一种探针,其选自实施例12中列出的探针。
全文摘要
本发明提供识别一个或多个指定位点的多态性、而不受邻近这些指定位点的非指定位点干扰的方法和过程。为了测定每个指定位点的组成,提供了能够探查这些指定位点的探针。通过本发明的方法,能够识别CFTR基因和HLA基因复合物内的一个或多个突变。
文档编号C12P19/34GK1608137SQ02824854
公开日2005年4月20日 申请日期2002年10月15日 优先权日2001年10月15日
发明者艾丽斯·相·李, 格扎拉·哈史米, 迈克尔·休 申请人:生物芯片技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1