与多重基因组获得和丢失分析相关的方法和组合物的制作方法

文档序号:571421阅读:239来源:国知局
专利名称:与多重基因组获得和丢失分析相关的方法和组合物的制作方法
技术领域
本文描述的技术大体涉及核酸检测用方法和组合物。更具体而言,所描述的是基 因组获得和丢失分析用方法和组合物。
背景技术
通过对基因组获得和丢失的检测分析可以对构成疾病、行为和认知病症以及其他 遗传病变的病因的遗传性异常进行检测和诊断。Array-CGH(aCGH)是一种多重分析方法,其中固定的DNA探针捕获来自测试样本 和参照样本的经标记的互补基因组DNA序列。每一个探针都会产生一个由探针序列界定的 组成序列中的一个序列的测试量/参照量的比值。在aCGH中,通常使用细菌人工染色体 (BAC)作为固定到阵列固体支持物上的探针材料。典型的BAC序列长度介于大约IOOkb至 大约250kb之间,通常的长度为175kb。这一长度的探针非常适合aCGH,原因在于它们长到 足以形成大的杂交信号,并且不会对小的突变如SNP产生响应,然而又短到足以提供充分 的基因组解析力,从而较为精确地检测基因组获得或者丢失的断点(break point)。例如, 一个设计精良的BAC阵列可以检测微缺失综合征如1ρ36缺失综合征或DiGeorge综合征中 不同大小的缺失区域,其中跨越疾病相关区域的不同部分的缺失可以对应不同的表型。所谓组成型aCGH微阵列的设计正趋于使用多种单独的探针,例如与先天DNA障碍 相关的每一个基因组区域中的BAC探针,从而以较高的解析力检测基因组获得和丢失的程 度。较高的解析力会揭示出更多有关获得或丢失区域的确切大小和边界的信息。但是,存 在可能并不需要对获得或者丢失区域的确切大小和边界进行高解析力检测的情况。非整倍性是基因组获得-丢失异常的实例,其中以高解析力检测断点不再可行。 非整倍性是一条完整的染色体(平均大小超过IOOmb)的获得(最为典型,如三体性)或丢 失,这与微缺失障碍相反,在后者中,缺失区域的典型长度可能仅1至IOmb左右。在aCGH分 析中,非整倍性检测(也称为染色体计数法)可以使用少到一种BAC探针来进行,但是从所 述单种探针获得的样本/正常比值的噪音会使得结果不确切。使用靶向受试者染色体的多 种探针(其中大多数探针全都表现出相同的获得或丢失)为采用aCGH分析的非整倍性检 测结果提供了更多的可信度,并且这是CGH分析的常规构建方法。在明确地“称为”或确定 为获得或者丢失之前,大部分阵列分析都需要某个区域中的至少两种或三种或更多种BAC 探针的一致的比值信号。获得或者丢失区域中额外的个体探针分子会增加获得或者丢失检测的可信度,这在分析信号比有噪音的情况下是有价值的。噪音因为多种原因而存在于分析之中。有时, 分析有噪音仅仅是因为探针固定或者样本孵育条件不一致或者是因为标记、杂交、洗涤或 干燥中条件并非最佳。在其他情况下,噪音可能是由于使用全基因组扩增(WGA)如phi-29 或DOP PCR方法扩增的样本所引起的,其中扩增样本表现出序列特异性扩增偏好。在初始 的样本量有限时,例如来自单个细胞或者来自仅几个细胞的DNA时,使用WGA。这样的扩增 样本具有随基因组的不同部分而改变的DNA产物产量(扩增偏好),从而将基因组获得_丢 失噪音叠加到通常会导致在多种分别排列或分析的BAC探针之间形成显著的样本/参照比 值反应差异的分析上。补偿这一噪音的标准方法是使用多种探针以跨越目的基因组序列区 域,并以某些方式,例如将贯穿基因组区域的比值反应取平均值、利用多种探针的复合结果 来作出贯穿该区域的获得_丢失结论。在寡核苷酸CGH阵列中,将多种分别排列或者分析 的探针之间的比值取平均值是特别常见的,这通常表现出比BAC阵列更大的探针与探针之 间的比值差异。遗憾的是,为了增加可信度而使用针对同一区域的多种分别排列或分析的探针可 能受到限制。例如,存在这样的固定探针阵列的布局,其中使用多种分别排列或分析的探针 来检测各非整倍性问题重重。一些CGH阵列形式局限于其能容纳的探针数目。所述阵列的 一个实例是印在微量板孔底部的阵列,或者印在显微镜用载玻片基底上一个小区域上的阵 列,所述基底被构造成可在单个基底上容纳多个独立的样本。这些阵列通常使用9(3X3点 阵列矩阵)至100(10X10)种探针。在所述100重的例子中,最多能容纳4种探针来对24 条染色体(1-22,X和Y)中的每一条进行计数,并且对于染色体计数法而言,阵列的整个容 量将被有效地用尽。除了平面微阵列之外,另一种同时使用多种探针来测量样本中的基因组获得和 丢失的方法是使用一系列固定有探针的编码颗粒或微球。使用最为广泛的颗粒平台是 Luminex xMAP系统,所述系统使用荧光颜色编码来区分一百个不同的微球或小球类型。在 基因组获得-丢失分析中,该系统可以支持最多达100种不同的探针。同微阵列一样,这一 编码微球平台并不支持对由竞争性杂交得到比值的双染双色读数,但是通过对各测试样本 和参照样本进行独立的并行分析、进行恰当地标准化并计算比值可以生成相同的比值。在最大探针数受到局限的这些多重分析形式中,一直都需要对最多24条染色体 (1-22,加上X和Y)的非整倍性进行可靠地分析、但不为此目的而使用全部或者即使大部 分的可能的探针系列。例如,在先天性障碍分析系列中,通常最希望的是不仅要探测非整 倍性,还要探测几种微缺失障碍。同样地,使用一种或者两种低分辨力的探针而非更多的 常规探针,可以稳定地进行微缺失障碍分析(例如WoIf-Hirschhorn、Willams-Beuren, Cri-du-Chat等),从而在探针受限的平台上分析更多障碍。类似地,在癌症细胞遗传学中, 除了所需解析力为整条染色体或者染色体臂丢失的其他区域之外,通常还有几个需要相当 高解析力的获得-丢失数据的区域。当仅需要低解析力的基因组区域并不利用系列中相当 数量的探针,从而为更多针对需要更高解析力的区域的探针腾出了分析平台容量时,这些 系列将更为有用。因此,需要这样的方法和组合物,其能可靠地分析染色体水平和染色体臂水平的 获得和丢失,同时使得可以选择用一种或者多种较高解析力的探针同时地分析其他的基因 组区域。
8

发明内容
本文描述了一种分析DNA样本的方法,所述方法包括提供一种与基底相连的复合 核酸探针。所述复合核酸探针含有与参照基因组的基因组区域中两个或者更多个基因组座 位特异性杂交的核酸序列。所述基因组区域的特征在于具有第一末端和第二末端以及置于 所述末端之间的至少400kb的中间区域。所述复合核酸探针包含基本上与含有所述基因组 区域第一末端的完整第一基因组座位特异性地杂交的核酸序列,以及基本上与含有所述第 二末端的完整第二基因组座位特异性地杂交的核酸序列。所述第一基因组座位和第二基因 组座位通常各自含有至少约lOOkb。任选地,复合探针的核酸序列与所述基因组内的其他座 位特异性地杂交。与基底相连的复合核酸探针在足以实现特异性杂交的严格度下与样本基因组DNA 杂交。与基底相连的复合核酸探针也与参照基因组DNA杂交。检测指示所述与基底相连的复合核酸探针与所述样本基因组DNA特异性杂交的 第一信号,同时检测指示所述与基底相连的复合核酸探针与所述参照基因组DNA特异性杂 交的第二信号。将所述第一信号与所述第二信号进行比较,从而检测所述第一和第二信号 之间的差异,所述差异指示所述样本DNA和所述参照DNA之间的差异。与参照基因组的基因组区域中的两个或者更多个基因组座位特异性杂交的核酸 序列可以来源于两个或者更多个大插入DNA载体。例如,所述核酸序列来源于两个或者 更多个大插入DNA载体,例如细菌人工染色体、酵母人工染色体、人类人工染色体、黏粒、质 粒、噬菌粒、噬菌体DNA和F黏粒。与参照基因组的基因组区域中的两个或者更多个基因组 座位特异性杂交的核酸序列可以来源于分离的染色体和/或分离的染色体片段。在一个具体的可选方案中,与参照基因组的基因组区域中的两个或者更多个基因 组座位特异性杂交的核酸序列为来源于两个或者更多个大插入DNA载体、分离的染色体、 分离的染色体片段或者这些或者其他核酸来源的组合的扩增子。在一个具体的可选方案中,基底为多个颗粒如多个编码颗粒。在另一个可选方案 中,所述基底为平面基底。与参照基因组的基因组区域中的两个或者更多个基因组座位特异性杂交的核酸 序列各自的长度范围为约20-250,000个核苷酸,包括端值。本文提供了一种分析样本核酸的方法,所述方法包括提供包含两个或者更多个编 码颗粒系列的混合物的多重试剂,所述编码颗粒系列被编码,从而使得每一编码颗粒系列 的各个颗粒均可检测地区别于其他每一编码颗粒系列的各个颗粒。所述编码颗粒含有所连 接的与参照基因组的至少一个基因组座位特异性杂交的核酸序列,并且至少一个编码颗粒 系列含有所连接的复合核酸探针。所述多重试剂可同时地或者平行地与样本基因组核酸并与参照核酸杂交。检测指示所述连接的核酸序列与可检测地标记的样本核酸特异性杂交的第一信 号以及指示所述连接的核酸序列与可检测地标记的参照核酸特异性杂交的第二信号。然后 鉴定所述编码颗粒,从而将颗粒编码情况与所述第一信号或与所述第二信号联系起来。然 后比较各个编码颗粒系列的所述第一信号和所述第二信号,并且所述第一和第二信号的差 异指示所述样本和所述参照核酸之间的差异。
9
本文提供了一种用于分析核酸的试剂,所述试剂含有与固体基底相连的第一复合 核酸探针。所述第一复合核酸探针包含与参照基因组的基因组区域中两个或者更多个基因 组座位特异性杂交的核酸序列。所述基因组区域的特征在于具有第一末端和第二末端以及 置于所述第一末端和第二末端之间的至少400kb的中间区域。所述第一复合核酸探针包含 基本上与含有所述基因组区域第一末端的完整第一基因组座位特异性杂交的核酸序列,以 及基本上与含有所述基因组区域第二末端的完整第二基因组座位特异性杂交的核酸序列。在一个具体的可选方案中,用于分析核酸的试剂含有至少两种复合探针,并且可 以包括更多种复合探针。例如,与固体基底相连的第二复合核酸探针含有与参照基因组的 第二基因组区域中两个或者更多个基因组座位特异性杂交的核酸序列。所述第二基因组区 域的特征是具有第一末端和第二末端,并且具有置于所述第一末端和第二末端之间的至少 400kb的中间区域。所述第二复合核酸探针包含基本上与含有所述第二基因组区域第一末 端的完整第一基因组座位、以及基本上与含有所述第二基因组区域第二末端的完整第二基 因组座位特异性杂交的核酸序列。在一个可选方案中,所述固体基底是平面基底。含有一种或者多种复合探针的阵 列可以包含在平面基底上。在另一个可选方案中,非复合探针也可以包含在该平面基底上, 从而提供一组复合探针和其他探针。在另一方面,所述固体基底为第一种多个颗粒。第二种复合探针或非复合探针可 以与第二种多个颗粒连接。所述第一种多个颗粒和所述第二种多个颗粒被可区别地编码,用于某些分析类型 中。任选地,混合所述第一种多个和第二种多个可区别地编码颗粒,从而提供一种多重分析 试剂。连接有额外探针的额外颗粒可以以多重分析形式或者独立分析形式用于本文所描述 的核酸分析中。本文提供了一种制备用于分析DNA的与基底相连的复合核酸探针试剂的方法,所 述方法包括分离基本上与含有参照基因组的基因组区域的第一末端的完整第一基因组座 位特异性杂交的第一核酸序列。所述方法包括分离基本上与含有参照基因组的基因组区域 的第二末端的完整第二基因组座位特异性杂交的第二核酸序列。混合所述第一和所述第二 核酸序列,从而制备复合探针,并随后将所述复合探针连接到固体基底,从而制备与基底相 连的复合核酸探针试剂,用于分析核酸如基因组DNA。在一个具体的可选方案中,所述第一核酸序列分离自第一种大插入载体,所述第 二核酸序列分离自第二种大插入载体。例如,所述第一核酸序列分离自第一种BAC,所述第 二核酸序列分离自第二种BAC。任选地,在混合之前或者之后扩增所述第一和所述第二核酸序列。具体实施方案提供了利用两种或者多种参照样本的方法。具体实施方案提供了分析DNA样本的方法,所述方法包括提供与基底相连的核 酸探针;使所述与基底相连的核酸探针与获自受试者的样本基因组DNA杂交;使所述与基底相连的核酸探针与第一种参照基因组DNA杂交;并使所述与基底相 连的核酸探针与第二种参照基因组DNA杂交。随后检测指示所述与基底相连的核酸探针与 所述样本基因组DNA特异性杂交的第一信号、指示所述与基底相连的核酸探针与所述第一 种参照基因组DNA特异性杂交的第二信号以及指示所述与基底相连的核酸探针与所述第二种参照基因组DNA特异性杂交的第三信号。比较所述第一信号和所述第二信号,从而检 测所述第一信号和第二信号之间的差异,所述第一和第二信号的差异指示所述样本DNA和 所述第一种参照DNA之间的差异。还比较所述第一信号和所述第三信号,从而检测所述第 一和第三信号之间的差异,所述第一和第三信号之间的差异指示所述样本DNA和所述第二 种参照DNA之间的差异。任选地,根据分析所述DNA样本的方法的实施方案,将所述样本DNA和所述第一种 参照DNA之间的差异与所述样本DNA和所述第二种参照DNA之间的差异进行比较。在又一个可选方案中,所述第一种参照基因组DNA包括男性特异的基因组DNA,所 述第二种参照基因组DNA包括女性特异的基因组DNA,从而使得对所述第一和第二信号的 差异的比较以及所述第一和第三信号的差异的比较可指示受试者的性别。在另一个可选方案中,所述第一种参照基因组DNA包括第一种病症特异的基因组 DNA,所述第二种参照基因组DNA包括第二种病症特异的基因组DNA。因此,对所述第一和第 二信号的差异的比较与所述第一和第三信号的差异的比较可指示所述受试者的疾病状态。—些实施方案提供了这样的方法,其中所述第一种参照基因组DNA包括第一种病 症特异的基因组DNA,所述第二种参照基因组DNA包括第二种病症特异的基因组DNA,并且 对所述第一和第二信号之间的差异的比较以及对所述第一和第三信号之间的差异的比较 指示了所述受试者的新陈代谢年龄。所述与基底相连的核酸探针可以包含多个编码颗粒和/或一个平面基底。任选 地,所述与基底相连的核酸探针包括多种寡核苷酸和/或多种扩增子。所述与基底相连的 核酸探针可以包括分离自大插入DNA载体和/或分离的染色体DNA的插入DNA。本发明的实施方案提供了分析DNA样本的方法,所述方法包括提供含有连接有 扩增子的编码颗粒的第一编码颗粒系列。所述扩增子包含合在一起基本上代表完整第一模 板DNA序列的随机核酸序列。使所述第一编码颗粒系列的扩增子与可检测地标记的样本 DNA、可检测地标记的第一种参照DNA以及可检测地标记的第二种参照DNA杂交。检测指示 所述第一编码颗粒系列的扩增子与可检测地标记的样本DNA特异性杂交的第一信号。检测 指示所述第一编码颗粒系列的扩增子与可检测地标记的第一种参照DNA特异性杂交的第 二信号。检测指示所述第一编码颗粒系列的扩增子与可检测地标记的第二种参照DNA特异 性杂交的第三信号。比较所述第一信号和所述第二信号,以检测所述第一和第二信号之间 的差异,所述第一和第二信号的差异指示所述样本DNA和所述参照DNA之间的差异。比较 所述第一信号和所述第三信号,以检测所述第一和第三信号之间的差异,所述第一和第三 信号的差异指示所述样本DNA和所述第二种参照DNA之间的差异。在一个任选方案中,所述扩增子的长度范围为大约500-1200个核苷酸,包括端 值。具体实施方案的方法还包括提供含有连接有扩增子的编码颗粒的第二编码颗粒 系列,其中所述扩增子包含合在一起基本上代表完整第二模板DNA序列的随机核酸序列。 使所述第二编码颗粒系列的扩增子与可检测地标记的样本DNA、可检测地标记的第一种参 照DNA和可检测地标记的第二种参照DNA杂交。检测指示所述第二编码颗粒系列的扩增子 与可检测地标记的样本DNA特异性杂交的第一信号。检测指示所述第二编码颗粒系列的扩 增子与可检测地标记的第一种参照DNA特异性杂交的第二信号。检测指示所述第二编码颗
11粒系列的扩增子与可检测地标记的第二种参照DNA特异性杂交的第三信号。比较所述指示 所述第二编码颗粒系列的扩增子的特异性杂交的第一信号和所述指示所述第二编码颗粒 系列的扩增子的特异性杂交的第二信号,以检测所述第一信号和第二信号之间的差异,所 述第一和第二信号的差异指示所述样本DNA和所述第一种参照DNA之间的差异。比较所述 指示所述第二编码颗粒系列的扩增子的特异性杂交的第一信号和所述指示所述第二编码 颗粒系列的扩增子的特异性杂交的第三信号,以检测所述第一和第三信号之间的差异,所 述第一和第三信号的差异指示所述样本DNA和所述第二种参照DNA之间的差异。任选地,所述第一和第二编码颗粒系列以混合物的形式提供。检测颗粒编码情况, 从而将各颗粒系列的身份与通过样本和参照DNA杂交获得的具体信号联系起来。


图1是示出一个实施方案的流程图,该实施方案包括使用两个扩增反应由模板 DNA制备扩增子,并将扩增子作为探针固定于一系列编码小球上,其中该系列中的小球均具 有相同的ID代码;图IA是示出一个实施方案的流程图,该实施方案包括由单个BAC克隆制备BAC扩 增子,并将该扩增子作为探针固定到一系列编码小球上,从而形成一个小球系列,其中该系 列中的小球全都具有相同的ID代码;图2是示出一个实施方案的流程图,所述实施方案包括混合m个不同的编码小球 系列,各系列均具有其各自被固定的BAC-扩增子探针DNA,它们合在一起形成多重编码小 球系列;图3是示出一个实施方案的流程图,所述实施方案包括使用多重编码小球系列在 η个样本上进行多重基因组获得和丢失分析;图3Α为示出一个实施方案的流程图,所述实施方案包括使用多重编码小球系列 在η个样本上进行多重基因组获得和丢失分析;图4为SBS标准的96孔微孔板的模式图,其示出了平行地对46份样本运行分析 的两份对照和两份样本的示例性位置;图5为使用男性的13号染色体上具有三体性的Coriell DNA样本所形成的数据 的一个实例;图6为使用男性的18号染色体上具有三体性的Coriell DNA样本所形成的数据 的一个实例;图7为使用女性的21号染色体上具有三体性的Coriell DNA样本所形成的数据 的一个实例;图8为使用具有X染色体5拷贝扩增的Coriell DNA样本所形成的数据的一个实 例;图9为一张图表,其示出了用于在示例性分析中形成固定到编码小球上的扩增子 的BAC克隆、其染色体和CytoBand位置、阴性对照寡核苷酸的序列和固定有各扩增子探针 的小球系列的小球ID (Luminex小球区);图IOA是示出根据本文所述方法的一个方面的一种制备复合探针的方法的简化 流程图IOB是示出根据本文所述方法的一个方面的一种制备复合探针的方法的简化 流程图;图11是示出根据本文所述方法的一个方面的一种制备复合探针的方法的简化流 程图;图12是由测试分析获得的数据绘制的图,示出了复合探针与DiGeorge综合征参 照DNA样本的使用;图13是一幅示出由使用两种参照基因组DNA样本的Luminex小球阵列获得-丢 失分析得到的比值数据的图;和图14是一幅示出由使用两种参照基因组DNA样本的Luminex小球阵列获得-丢 失分析得到的比值数据的图。
具体实施例方式本文提供了与染色体获得和丢失分析相关的方法和组合物。泛泛的说,本文描述 了与使用与基底相连的核酸探针的基因组DNA获得和丢失分析相关的方法和组合物。本文使用的科技术语旨在具有本领域普通技术人员通常所理解的含义。这 些术语在多部权威的参考书中被定义和使用,所述参考书例如包括J. Sambrook and D.W. Russell, Molecular Cloning :A Laboratory Manual, Cold Spring Harbor Laboratory Press ;3rd Ed. ,2001 ;F. Μ. Ausubel, Ed. , Short Protocols in Molecular Biology, Current Protocols ;5th Ed. , 2002 ;B.Alberts et al. , Molecular Biology of the Cell,4th Ed. , Garland,2002 ;D.L. Nelson and Μ. M. Cox, Lehninger Principles of Biochemistry,4th Ed. , W. H. Freeman & Company,2004 ; 禾口 Herdewijn, P. (Ed·), Oligonulceotide Synthesis :Methods and Applications, Methods in Molecular Biology, Humana Press,2004。本文所使用的术语“核酸”是指任何形式(包括单链、双链的寡核苷酸或多核苷 酸)的具有多于1个核苷酸的RNA或DNA分子。泄本文所使用的术语“探针”是指用于识别靶核酸的核酸,所述靶核酸与所述探针特
异性结合。用于本文所述分析中的核酸探针可以包括细胞或者生物体的基因组的全部的或 者部分。所述核酸探针可以包括表现为一条或者多条染色体、染色体的一部分、基因座、基 因或基因的一部分的DNA。所述核酸探针可以为任何形式如载体中的插入物,所述载体例 如包括细菌人工染色体、酵母人工染色体、人类人工染色体、黏粒、质粒、噬菌粒、噬菌体DNA 或F黏粒。所述核酸探针可以是显微切割的染色体DNA形式。因此,尽管本文描述的具体 实例是作为核酸探针DNA来源的BAC,但是也可以使用其他类型的克隆,如PAC、YAC、黏粒、 F黏粒、cDNA等。在具体应用中,核酸被用作用于扩增的模板材料,所得到的扩增子或其部分被用 作探针。用于形成核酸探针、样本或者参照的核酸均通过本领域已知方法获得,例如如 J.Sambrook and D. W. Russell, Molecular Cloning :A Laboratory Manual,Cold Spring
13Harbor Laboratory Press ;3rd Ed. ,2001 或 F. Μ. Ausubel, Ed. , Short Protocols in Molecular Biology, Current Protocols ;5th Ed.,2002 所述。核酸还可以购买获得和 / 或使用市售试剂盒获得。复合探针具体实施方案提供了一种复合核酸探针,所述复合核酸探针含有与参照基因组中 目标基因组区域的两个或者更多个基因组座位特异性杂交的核酸序列。所述基因组区域的 特征是具有第一末端和第二末端以及置于所述末端之间的至少400kb的中间区域。复合核 酸探针包含基本上与含有基因组区域第一末端的完整第一基因组座位特异性杂交的核酸 序列,以及基本上与含有第二末端的完整第二基因组座位特异性地杂交的核酸序列。第一 基因组座位和第二基因组座位通常分别都含有至少大约lOOkb,并且可以更大。与参照基因组的基因组区域中两个或者更多个基因组座位特异性杂交的核酸序 列可以来源于两个或者更多个大插入DNA载体。例如,所述核酸序列来源于两个或者更多 个大插入DNA载体,如细菌人工染色体、酵母人工染色体、人类人工染色体、Pl来源的人工 染色体(PAC)、黏粒、质粒、噬菌粒、噬菌体DNA和F黏粒。与参照基因组的基因组区域中两 个或者更多个基因组座位特异性杂交的核酸序列也可以来源于分离的染色体和/或分离 的染色体片段。在一个具体的可选方案中,与参照基因组的基因组座位中两个或者更多个基因组 座位特异性杂交的核酸序列为由来源于两个或者更多个大插入DNA载体、分离的染色体、 分离的染色体片段或者这些或其他核酸来源的组合的模板扩增得到的扩增子。在具体实施方案中,与参照基因组的基因组区域中两个或者更多个基因组座位特 异性杂交的核酸序列以寡核苷酸和/或多核苷酸的形式提供,其各自的长度范围为大约 20-250,000个核苷酸,包括端值,并且合在一起基本上可与含有所述基因组区域第一末端 的完整第一基因组座位特异性杂交,并基本上与含有所述基因组区域第二末端的完整第二 基因组座位特异性杂交。因此,复合探针可以含有2种或更多种BAC的汇集物(pool),或者来源于2种或 更多种BAC的插入DNA。任选地,所述汇集物可以含有来源于4种至约100种BAC (包括端 值)的插入DNA。所述探针DNA可以提取自经培养的BAC,或者在一个具体的实施方案中, 可以为利用例如简并寡核苷酸引物(DOP)PCR或连接反应介导的PCR由BAC DNA获得的扩 增子。可以使用其他大插入物克隆如PAC、YAC、黏粒、F黏粒等来替代BAC。也可以使用大 量寡核苷酸的汇集物。在一个具体的方面,固定的复合探针可以是来源于经分选的染色体的DNA。可以 使用分选细胞的流式细胞仪(也称为荧光激活的细胞分选仪;FACS)来形成经分选染色体 的汇集物,其中所述分选以对基因组的AT富集区和GC富集区特异的染料之间的信号比为 基础。由所述经分选染色体提取的DNA可以通过WGA扩增,并用荧光染料标记,以在中期染 色体FISH分析中用作染色体涂染探针。类似地,染色体臂涂染探针也可以通过以下方式制 备对利用激光捕获显微切割从中期染色体展片(metaphase spread)分离的经分选染色 体臂的DNA进行扩增。以微点阵形式固定或者固定在编码颗粒上的固定全染色体或染色体 臂探针产生分别代表跨越所述全染色体或臂的平均获得或者丢失情况的杂交比信号,其方 式与跨越整个染色体或臂的颇为大量的BAC汇集物相似。
14
复合探针在多重基因组获得_丢失分析(例如本文所述的多重基因组获得_丢失 分析)中起到多种作用。它们包括染色体计数(非整倍性检测)、微缺失或其他综合征的检 测或者作为对照。将复合探针用作对照来确定正常的常染色体应答(当前样本/参照比值 的水平=1.0)可以对较大跨度的基因组上的应答取平均,从而可以降低个体之间的正常 拷贝数差异所引起的比值噪音。制备复合探针的方法本文提供了一种制备与基底相连的用于分析DNA的复合核酸探针试剂的方法。分 离基本上与含有参照基因组的基因组区域第一末端的完整第一基因组座位特异性杂交的 第一核酸序列。另外,分离至少一种基本上与含有所述参照基因组DNA的所述基因组区域 第二末端的完整第二基因组座位特异性杂交的第二核酸序列。术语“分离”在用于核酸时是 指核酸与同其天然一起存在的其他物质(如细胞、蛋白和其他核酸)基本分离。混合所述 第一和所述第二核酸序列,从而制备复合探针,并在随后将所述复合探针连接到固体基底, 从而制备与基底相连的复合核酸探针试剂,用于分析核酸如基因组DNA。在一个具体的可选方案中,所述第一核酸序列分离自第一种大插入载体,所述第 二核酸序列分离自第二种大插入载体。例如,所述第一核酸序列为分离自第一种BAC的DNA 插入物,所述第二核酸序列为分离自第二种BAC的DNA插入物。在又一个可选方案中,所述第一核酸序列为分离自第一种BAC的人类基因组DNA 插入物,所述第二核酸序列为分离自第二种BAC的人类基因组DNA插入物。任选地,在混合之前或者之后扩增所述核酸序列。例如,在混合之前或者之后扩增 所述第一和所述第二或者更多的核酸序列。由复合探针中核酸序列靶向的基因组座位的数目并不局限于两种,可以为三种、 四种或更多种,如大约4-100种或更多种。因此,同样地,与基因组座位特异性杂交的具体 核酸序列的数目也不局限于两种,可以为三种、四种或更多种,如大约4-100种或更多种。复合探针的一个实例是使用来自五种BAC的插入DNA制备的复合探针,所述插入 DNA被定位到与DiGeorge微缺失综合征相对应的CytoBand 22pll. 2。所用五种BAC的中 心座位跨越大约0. 45mb (445kb),对于175kb的典型BAC长度,所述总跨度略高于600kb。 对从所述五种BAC中每一种分离的插入DNA进行扩增,并将所得到的扩增子汇集起来制备 复合探针。随后将所述复合探针连接到一个系列的Luminex编码多重微球,所述微球全都 具有相同的小球编码身份,用于在多重基因组获得-丢失分析中用作22pll. 2 CytoBand探 针。因此,在一个具体的实例中,2种、3种、4种、5种或更多种,(如6_100种或更多种) 来自BAC或其他大插入载体的插入物,可以用作与确定基因组区域中具体基因组座位特异 性杂交的核酸序列。用于连接探针(包括复合探针)的固体基底(包括半固体基底),可以为多种材料 中的任何一种,如玻璃;塑料,如聚丙烯、聚苯乙烯、尼龙;纸;硅;硝酸纤维素;或核酸可以 与之连接以用于进行分析的任何其他材料。所述基底可以为多种形式或者形状中的任何一 种,包括平面的(如硅片和玻璃板)和三维的(如颗粒、微量滴定板、微量滴定孔、针、纤维
寸J ο
在具体的方面,与探针相连的固体基底为颗粒。与探针相连的颗粒可以为任何探针可与之相连的固体或半固体颗粒,该颗粒适合 核酸杂交分析,并且在杂交和检测条件下是稳定的且不溶的。所述颗粒可以为任何形状 (如圆柱形、球形等)、尺寸、组成或具有任何理化特征。可以对粒度或组成进行选择,从而 使得颗粒可以在例如具有特定孔径的过滤器上或者通过一些其他的物理性质(如磁性)与 流体相分离。所使用的微粒如微球的直径可以小于一毫米,例如,直径的尺寸范围为约0. 1 至约1,000微米(包括端值),如直径为约3-25微米(包括端值),或者直径为约5-10 微米(包括端值)。所使用的纳米颗粒如纳米小球的直径可为约1纳米(nm)至约 100, OOOnm(包括端值),例如,尺寸范围为约10-1,OOOnm(包括端值),或者例如,尺寸范围 为200-500nm (包括端值)。在某些实施方案中,所使用的颗粒为小球,特别是微球和纳米小 球。举例来说,颗粒为有机或无机颗粒,如玻璃或金属颗粒,并且可以为合成的或者天 然的聚合物的颗粒,所述聚合物如聚苯乙烯、聚碳酸酯、聚硅酮(silicon)、尼龙、纤维素、琼 脂糖、葡聚糖和聚丙烯酰胺。在具体的实施方案中,颗粒为乳胶小球。在具体的实施方案中,所使用的颗粒含有用于连接核酸的官能团。例如,颗粒可 以含有羰基、胺、氨基、羧酸基团、卤素、酯、醇、脲、醛、氯甲基、氧化硫、一氧化氮、环氧基和 /或甲苯磺酰基官能团。颗粒的官能团、对其的修饰及其与化学部分(如核酸)的连接为 本领域所熟知,例如如 Fitch, R. Μ. , Polymer Colloids :A Comprehensive Introduction, Academic Press, 1997中所述。美国专利No. 6,048, 695描述了一种用于将核酸探针如扩增 子连接到基底如颗粒上的示例性方法。在另一个具体的实例中,1-乙基-3_[3-二甲基氨丙 基]碳化二亚胺盐酸盐(EDC或EDAC化学品)可以用来将核酸连接到编码颗粒。编码颗粒为基于某个特征可以与其他颗粒区分开的颗粒,所述特征例如包括光学 性质如颜色、反射指数和/或压印图案或光学可检测的图案。例如,可以使用光学标签、化 学标签、物理标签或者电学标签来编码颗粒。编码颗粒可以含有一个或者多个荧光团或与 之相连,所述荧光团可以通过例如激发和/或发射波长、发射强度、激发态寿命或这些的组 合、或者其他光学特征进行区分。可以使用光学条形码来对颗粒进行编码。在具体的实施方案中,一个颗粒系列的各颗粒均用相同的代码进行编码,从而使 得一个颗粒系列的各颗粒都可以与另一个颗粒系列的各颗粒区分开。在其他实施方案中, 可以对单个颗粒系列使用两种或者多种代码。例如,各颗粒都可以含有独特的代码。在某 些实施方案中,颗粒编码包含一个代码,但不包含颗粒与对基因组DNA特异的核酸探针之 间的联系,或者兼而有之。在具体的实施方案中,代码镶嵌在例如颗粒内部,或者以在杂交和分析期间稳定 存在的方式与颗粒相连。可通过任何可检测的方式提供代码,如通过全息编码,通过荧光性 质、颜色、形状、尺寸、光发射、量子点发射等,以鉴定颗粒,并由此鉴定固定于其上的捕获探 针。在一些实施方案中,代码不是由核酸提供。一个示例性平台利用浸渍于聚合物颗粒内的荧光染料的混合物,作为鉴定固定有 特定俘获探针的颗粒系列的每个成员的工具。另一个示例性平台使用全息条码来鉴定圆 柱形玻璃颗粒。例如,Chandler等人(美国专利No. 5,981,180)描述了一种基于颗粒的系统,其中不同的颗粒类型由不同比例的两种或更多种浸渍于聚合物颗粒内的荧光染料的 混合物编码。Soini (美国专利No. 5,028,545)描述了一种基于颗粒的多重分析系统,该系 统采用时间分辨荧光进行颗粒鉴定。Fulwyler(美国专利No. 4,499,052)描述了一种使 用通过颜色和/或尺寸区分的颗粒的示例性方法。美国专利申请公开文本20040179267、 20040132205、20040130786、20040130761、20040126875、20040125424 和 20040075907 描述 了由全息条码编码的示例性颗粒。美国专利No. 6,916,661描述了与纳米颗粒有关的聚合 物微粒,所述纳米颗粒具有为颗粒提供代码的染料。尽管本文详细描述的一个实施方案利用的是Luminex编码小球平台,但是也可以 使用其他类型的编码颗粒分析平台,如VeraCode小球和BeadXpress系统(Illumina Inc., San Diego CA)、xMAP 3D (Luminex)等。可以使用磁性Luminex小球,该小球使得可以使用 板状磁铁和移液管而不使用过滤板和多头抽真空装置进行洗涤步骤。这其中的每一个平台 通常都以羰基小球的形式提供,但是也可以对其进行构建,从而使其含有不同的偶联化学 组成,如氨基-硅烷。与基底的连接核酸探针与基底的连接可以通过将核酸有效地键合到固体或半固体基底的多种 方法中的任何一种实现,举例说来,所述方法包括吸附和化学键合。核酸可以直接地键合至 所述编码颗粒的材料,或者间接地(例如通过键合至分布于颗粒之上的包衣或接头)键合 至所述编码颗粒。可以合成核酸,并且/或者在合成后对其进行修饰,从而使其含有用于将 所述核酸键合至颗粒的官能团。例如,用作探针的核酸序列可以含有羰基、胺、氨基、羧酸基 团、卤素、酯、醇、脲、醛、氯甲基、氧化硫、一氧化氮、环氧基和/或甲苯磺酰基官能团。与基底相连的探针(包括复合探针)可以为单链的和/或双链的核酸。在具体实 施方案中,在双链核酸被连接时,在将其固定于基底之后使其变性成为单链以进行制备,从 而用于分析方法的某些实施方案中。任选地,在固定之前使双链核酸探针变性,然后将单链 的核酸连接至基底。扩增子试剂组合物在具体实施方案中,提供了一种用于分析核酸的试剂,所述试剂包含连接有作为 探针的扩增子的多个编码颗粒。在其他具体实施方案中,所连接的扩增子由多于一种模板扩增得到,从而形成了 复合探针。在某些实施方案中,与多个编码颗粒连接的扩增子每一个都含有与模板基因组核 酸的一部分相同或者完全互补的核酸序列,并且所述扩增子合在一起基本上代表完整的模 板基因组核酸。图1示出一种制备用于分析基因组DNA的试剂的方法的一个实施方案。如图1所 示,提供了一个模板核酸(1)。使用筒并寡核苷酸引物(DOP)在第一扩增反应中扩增所述模 板(2),从而产生第一扩增产物。所述模板核酸可以是能够使用核酸扩增方法被复制的任何核酸。用于所述第一扩增反应的模板DNA任选地为基因组DNA,其大小范围通常为约 20-300kb,但是该模板也可以更小或者更大。术语“基因组的”指细胞或者生物体的基因 组的DNA,其不仅包括由细胞或者生物体的基因组的DNA复制得到的DNA(如克隆得到的
17DNA),还包括从细胞或生物体直接分离得到的DNA (如显微切割的染色体DNA)。模板DNA可 以包括细胞或者生物体的全部的或者部分的基因组。模板DNA可以包括表现为一种或者多 种染色体、染色体的一部分、基因座、基因或基因的一部分的DNA。模板DNA可以为任何形 式,如载体中的插入物,所述载体例如包括细菌人工染色体、酵母人工染色体、人类人工染 色体、黏粒、质粒、噬菌粒、噬菌体DNA或F黏粒。模板DNA可以是显微切割的染色体DNA形 式。因此,尽管本文描述的具体实例是以BAC作为模板DNA来源,但是也可以使用其他类型 的克隆,如PAC、YAC、黏粒、F黏粒、cDNA等。根据具体的实施方案,可以一起或者分别地扩增来自于这些或者其他来源中任何 一种的多个模板,合并得到的来自所述多个模板的扩增子为复合探针。模板基因组DNA通过本领域已知的方法获得,例如描述于以下文献中的方法 J. Sambrook and D. W. Russell, Molecular Cloning :A Laboratory Manual, Cold Spring Harbor Laboratory Press ;3rd Ed. , 2001,或者 F. M. Ausubel, Ed. , Short Protocols in Molecular Biology, Current Protocols ;5th Ed. ,2002。模板 DNA 还可以购买获得和 / 或 使用分离基因组DNA的商用试剂盒获得。使用体外扩增方法可以实现对模板DNA的扩增。术语“扩增方法”指这样一种方 法或技术,即所述方法或技术用于复制模板核酸,由此产生包括所述模板核酸的全部或者 部分的多个拷贝的核酸,所产生的核酸也称为扩增子。扩增子任选地含有存在于引物中且不存在于原始DNA模板中的核酸序列。所述引 物来源的核酸增加了功能性,例如用于其他扩增反应的引物结合位点,和/或与基底进行 化学键合的官能团。举例而言,扩增方法包括PCR、连接反应介导的PCR(LM-PCR)、phi_29PCR和其他核 酸扩增方法,例如如 C. W. Dieffenbach et al. , PCR Primer :A Laboratory Manual, Cold Spring Harbor Laboratory Press,2003 ;禾口 V. Demidov et al. , DNA Amplification Current Technologies and Applications, Taylor & Francis, 2004 中所述。可以使用具体的DNA模板来源和核酸扩增方法的多种结合。术语“寡核苷酸引物”指能够在合适的反应条件下担当引物延伸产物的合成起始 位点的核酸。寡核苷酸引物的长度通常为约10-30个连续的核苷酸。寡核苷酸引物与模板 核酸的一个区域完全互补或者基本互补,因而在杂交条件下,所述寡核苷酸引物与模板核 酸的所述互补区域退火。引物延伸产物合成的合适反应条件包括存在合适的反应组分(包 括但不限于聚合酶和核苷三磷酸)。对于适合用于扩增反应中的寡核苷酸引物的设计为本 领域所熟知,例如如 A. Yuryev et al. , PCR Primer Design, Humana Press, 2007 中所述。术语“简并寡核苷酸引物”指含有具有随机或者半随机核苷酸序列的核酸的引 物。对于适合用于具体核酸扩增反应的简并寡核苷酸引物的设计为本领域所熟知,例如如 A. Yuryev et al.,PCR Primer Design, Humana Press,2007 中所述。可以使用具有大约 5-8个核苷酸的随机或半随机核苷酸序列。在其他实施方案中,随机或半随机核苷酸六聚体 包含在用于第一扩增反应的简并寡核苷酸引物中。在具体的实施方案中所使用的简并寡核苷酸引物每一个均包含一个5'恒定 DNA区段、一个中间随机DNA区段和一个3'锚定区段,例如如Fiegler et al.,Genes Chromosomes Cancer,36(4) :361_74,2003 ;禾口 Telenius, et al. , Genomics 13:718—25,
181992中所述。5'恒定DNA区段任选地具有在所有DOP中均相同的核苷酸序列。3'锚定区段 任选地具有经测定在模板核酸中具有所需出现频率的核苷酸序列。对具体的核酸序列出现 频率的分析为本领域所熟知,例如如 Milosavljic,A. and Jurka,J.,1993,Comput. Applic. Biosci. ,9 407-411 ;Pesole, G. et al.,1992,Nucleic acids, Res. ,20 2871-2875 ;和 Hutchinson, G. B.,1996,Comput. Appl. Biosci.,12 :391_398 中所述。在具体的实施方案中,DOP含有约17-25个连续的核苷酸,其中约7_12个连续的 核苷酸包含于5'恒定DNA区段之中,约5-8个连续的核苷酸包含于随机DNA区段之中,约 5-8个连续的核苷酸包含于3'锚定区段之中。第一扩增反应产生含有多个扩增子的第一反应产物。第一反应产物中的各扩增子 均含有与DNA模板的一个随机部分相同或者完全互补的一段DNA序列以及与第一种反应弓I 物的5'恒定DNA序列相同的一段DNA序列。本文中使用的术语“互补的”是指核苷酸之间的沃森-克里克碱基配对,具体地 指核苷酸通过氢键彼此键合,胸腺嘧啶或尿嘧啶残基通过两个氢键与腺嘌呤残基相连,而 胞嘧啶和鸟嘌呤残基通过三个氢键相连。通常,核酸所包含的核苷酸序列被描述为与指定 的第二核苷酸序列具有某一“百分比的互补度”。例如,一段核苷酸序列可以与指定的第二 核苷酸序列具有80%、90%或100%的互补度,这表明一段10个核苷酸的序列中有8个、 9个或者10个核苷酸与指定的第二核苷酸序列互补。例如,核苷酸序列3' -TCGA-5' 与核苷酸序列5' -AGCT-3 ‘ 100%互补。另外,核苷酸序列3' -TCGA-与核苷酸序列 5' -TTAGCTGG-3'的一个区域100%互补或完全互补。参照图1,使用第一反应产物扩增子作为模板DNA进行第二扩增反应(3)。第二扩 增反应⑶包括“通用”寡核苷酸引物,之所以这样称谓是因为该通用引物与在第一扩增反 应中使用的DOP的5'恒定DNA区段相同或者完全互补。通用寡核苷酸引物包含在第一扩 增反应中使用的DOP的5'恒定DNA区段,所述5'恒定DNA区段位于该通用引物的3'末 端。通用寡核苷酸引物任选地在其5’末端含有其他连续的核苷酸。在一个具体的可选方案中,在通用寡核苷酸引物的5’端含有一个官能团,用于将 由第二扩增反应产生的扩增子连接至编码固体或半固体基底如编码颗粒。例如,在通用寡 核苷酸引物的5’端含有一个胺基基。在另一个可选方案中,可以对由第二扩增反应产生的 扩增子进行修饰,从而使其含有用于键合至固体或者半固体基底的官能团。修饰核酸从而 使其含有能够键合至固体或者半固体基底的官能团为本领域所熟知。在一个具体的实施方案中,与颗粒相连的每一个单独的扩增子均含有与模板DNA 序列的一个随机部分相同的一个DNA区段。每一个单独的扩增子均还含有一个恒定DNA区 段,所述恒定DNA区段同与模板DNA序列的一个随机部分相同的DNA区段毗邻。扩增子的 恒定DNA区段任选地含有一个末端官能团,用于将扩增子连接到编码颗粒。在一个具体的 实施方案中,所述扩增子的恒定DNA区段含有一个5'末端胺基团,用于将扩增子连接到编 码颗粒。如图1所示,将第二反应产物的扩增子固定于第一种多个编码颗粒上(4)。第二扩 增反应的扩增子与所述编码颗粒的连接可通过多种可有效地键合核酸与固体或者半固定 基底的方法之一实现,所述方法例如包括吸附和化学键合。扩增子可以与编码颗粒的材料 直接键合,或者与编码颗粒间接键合,例如,通过键合至分布于颗粒上的包衣或接头。可以合成扩增子,并且/或者在合成后对其进行修饰,从而使其含有一个用于将扩增子键合到 颗粒上的官能团。例如,扩增子可以含有羰基、胺、氨基、羧酸基团、商素、酯、醇、脲、醛、氯甲 基、氧化硫、一氧化氮、环氧基和/或甲苯磺酰基官能团。通常,作为第二扩增反应的产物的扩增子是双链的,并且该双链的扩增子与颗粒 相连。因此,所述双链扩增子的两条链都呈现于每一个颗粒之上。在将扩增子固定于颗粒 之后使其变性成为单链,以进行制备,从而用于分析方法的具体实施方案中。任选地,在固 定之前使双链扩增子变性,然后将单链的扩增子与颗粒相连。如所述,第一和第二扩增反应两者中的每一个扩增子均含有与模板DNA序列的一 个随机部分相同的一段核酸序列,从而使由第一扩增反应产生的扩增子合在一起基本上代 表完整的模板DNA序列,由第二扩增反应产生的扩增子合在一起基本上代表完整的模板 DNA序列。用于分析基因组DNA的第一颗粒系列和第一试剂为连接有扩增子的编码颗粒,所 述扩增子是第二扩增反应的产物,其合在一起基本上代表在第一扩增反应中用作模板的完 整基因组DNA序列。在具体的实施方案中,与颗粒相连的每一个单独的扩增子的长度范围为约 500-1200个核苷酸(包括端值)。因此,通过所连接的由所述模板扩增得到的相对较小的 扩增子,相对较大的模板核酸基本完整地呈现于一个系列的编码颗粒之上。如上文所述,各颗粒系列均含有连接有扩增子的编码颗粒,所述扩增子是第二扩 增反应的产物,其合在一起基本上代表在第一扩增反应中用作模板的完整基因组DNA序 列。含有扩增子的颗粒数目取决于诸多因素如模板尺寸、扩增子尺寸以及可用于将扩增 子连接到颗粒之上的结合位点的数目,所述含有扩增子的颗粒数目足以使得合在一起基 本上代表在第一扩增反应中用作模板的完整基因组DNA序列。通常,足以使得合在一起 基本上代表在第一扩增反应中用作模板的完整基因组DNA序列的颗粒数目的范围为约 1-10,000 (包括端值)。使用第二种基因组DNA模板进行扩增并将作为第二扩增反应的产物的扩增子(如 上所述)连接至第二种多个编码颗粒,形成了另外的颗粒系列。所述第二种多个编码颗粒 可检测地不同于所述第一种多个编码颗粒,从而形成用于分析基因组DNA的第二编码颗粒 系列和第二试剂。类似地,将第三种或后续的基因组DNA模板用于形成扩增反应的反应产物,并将 该反应产物连接至第三种或后续的多个编码颗粒。所述第三种或后续的多个编码颗粒中的 每一种均可检测地不同于其他的每一种多个编码颗粒,从而获得用于分析基因组DNA的第 三或后续的编码颗粒系列和第三或后续的试剂。多重试剂某些实施方案提供了一种用于分析基因组DNA的多重试剂,所述多重试剂包含两 个或更多个颗粒系列的混合物。在具体的实施方案中,每一编码颗粒系列的各个编码颗粒 均可检测地区别于其他每一编码颗粒系列的各个编码颗粒。在具体的实施方案中,至少一个颗粒系列包含复合探针。任选地,多于一个颗粒系 列包含复合探针。在具体的实施方案中,每一编码颗粒系列均连接有扩增子,所述扩增子为如本文
20所述的第二扩增反应的产物,并且合在一起基本上代表在第一扩增反应中用作模板的完整 基因组DNA序列,其中不同的基因组模板由与其他各编码颗粒系列相连的扩增子所代表。一个具体实施方案的一种多重试剂包括连接有扩增子的第一编码颗粒系列和连 接有扩增子的第二编码颗粒系列,所述与第一编码颗粒系列相连的扩增子合在一起基本上 代表插入第一细菌人工染色体中的完整模板DNA序列,而所述与第二编码颗粒系列相连的 扩增子合在一起基本上代表插入第二细菌人工染色体中的完整模板DNA序列。例如,与第一编码颗粒系列相连的扩增子含有与人13号染色体DNA的一部分相同 的核酸序列,而与第二编码颗粒系列相连的扩增子含有与人18号染色体DNA的一部分相同 的核酸序列。与第三或后续的编码颗粒系列相连的扩增子含有与人的另一染色体或染色体 的另一非重叠区域的DNA相同的核酸序列。本文所描述的多重试剂可以在单个分析中同时分析多个靶标,如多个基因组座位 (genomic loci)0通过至少混合第一编码颗粒系列和第二编码颗粒系列形成了用于分析基因组DNA 的多重试剂。图2示出了一种形成多重试剂的方法的一个实施方案。如图所示,任何数目“m” 的编码颗粒系列均可以包含在所述多重试剂中。因此,例如,“m”可以为至少2、3、4、5、10、 15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100 或 200 个不同的编码颗粒
系列。一个系列的连接有扩增子的编码颗粒与一个或者多个其他系列的连接有扩增子的编 码颗粒联合形成用于分析样本中基因组获得和丢失的多重试剂。在一个具体的实施方案中,包含结合的复合探针的一个编码颗粒系列与具有结合 的复合探针或非复合探针的一个或多个其他编码颗粒系列相联合,形成用于分析样本中基 因组获得和丢失的多重试剂。分析方法具体实施方案提供了一种分析DNA样本的方法,所述方法包括提供一种与基底相 连的复合核酸探针。所述复合核酸探针含有与参照基因组的基因组区域中两个或者更多个 基因组座位特异性杂交的核酸序列。所述基因组区域的特征在于具有第一末端和第二末端 以及介于所述末端之间的至少400kb的中间区域。所述复合核酸探针包含基本上与含有所 述基因组区域第一末端的完整第一基因组座位特异性杂交的核酸序列,以及基本上与含有 第二末端的完整第二基因组座位特异性杂交的核酸序列。所述第一基因组座位和第二基因 组座位各自通常含有至少大约lOOkb。任选地,复合探针的核酸序列与所述基因组区域中的 其他座位特异性杂交。在又一个可选方案中,参照基因组为一个或者多个人类基因组。与所述基底相连的复合核酸探针在足以实现特异性杂交的严格度下与样本基因 组DNA杂交。所述与基底相连的复合核酸探针还在相同或者相似的条件下与参照基因组 DNA杂交,从而可以进行比较。检测指示所述与基底相连的复合核酸探针与所述样本基因组DNA特异性杂交的 第一信号,以及指示所述与基底相连的复合核酸探针与所述参照基因组DNA特异性杂交的 第二信号。比较所述第一信号和第二信号,从而检测所述第一和第二信号之间的差异,该差 异指示所述样本DNA和所述参照DNA之间的差异。分析样本核酸的方法的具体实施方案包括提供含有两个或者更多个编码颗粒系
21列的混合物的多重试剂,所述编码颗粒系列被编码,从而使每一编码颗粒系列的各颗粒可 检测地区别于其他每一编码颗粒系列的各颗粒。所述编码颗粒包含所连接的与参照基因组 的至少一个基因组座位特异性杂交的核酸序列,并且至少一个编码颗粒系列含有连接的复 合核酸探针。所述多重试剂同时地或者平行地与样本基因组核酸和参照核酸杂交。检测指示所连接的核酸序列与可检测地标记的样本核酸特异性杂交的第一信号, 并检测指示所连接的核酸序列与可检测地标记的参照核酸特异性杂交的第二信号。然后鉴 定所述编码颗粒,从而将颗粒编码情况与所述第一信号或者与所述第二信号联系起来。随 后比较各个编码颗粒系列的第一信号和第二信号,所述第一和第二信号的差异指示所述样 本和参照核酸之间的差异。在具体的实施方案中,分析基因组DNA的方法包括提供连接有扩增子的编码颗 粒,所述扩增子合在一起基本上代表完整的模板基因组核酸。在具体的实施方案中,提供了 连接有扩增子的编码颗粒,所述扩增子合在一起基本上代表不止一个拷贝的完整的模板基 因组核酸。在具体的实施方案中,准备用于分析基因组获得和/或丢失的基因组DNA样本用 可检测标记进行标记。参照DNA也用可检测标记进行标记,用于与样本DNA进行比较。样 本和参照DNA可以用相同的或者不同的可检测标记进行标记,这取决于所使用的分析安 排。例如,在具体的实施方案中,用不同的可检测标记所标记的样本和参照DNA可以在同一 容器中一起使用,用于同与编码颗粒相连的扩增子杂交。在其他实施方案中,用相同的可检
测标记所标记的样本和参照DNA可以在分开的容器中使用,用于同与颗粒相连的扩增子杂 、-父。术语“可检测标记”指可提供可检测信号并且可以与核酸连接的任何原子或部分 (moiety)。所述可检测标记的实例包括荧光部分、化学发光部分、生物发光部分、配体、磁性 颗粒、酶、酶底物、放射性同位素和生色团。多种标记样本和参照核酸如DNA的方法中的任何一种方法均可以用于本分析中, 如核酸的缺口平移或化学标记。例如,通过使用如下的核苷酸进行聚合反应可以引入可检 测标记,所述核苷酸包括至少一些经修饰的核苷酸,如经修饰后含有生物素、地高辛、荧光 素或花菁的核苷酸。在一些实施方案中,通过随机弓I物法和聚合反应弓I入可检测标记。其他 实例包括缺□平移(Roche Applied Science, Indianapolis Ind. ;Invitrogen, Carlsbad Calif.)和化学标记(Kreatech ULS,Amsterdam NL)。对核酸的可检测标记为本领域所熟 知,并且可以使用适合标记核酸(例如基因组DNA)的任何标记方法。在又另一个实施方案中,避免用可检测标记对样本和参照核酸例如DNA单独地进 行共价标记。例如,未标记的基因组DNA样本与固定至编码颗粒的扩增子杂交。事先标记的 报告序列也在与所述扩增子的俘获探针序列相邻但不重叠的序列处与该扩增子_样本DNA 复合物和扩增子_参照DNA复合物杂交。所述经标记的报告序列可以在同一或者不同的杂 交反应中被杂交。通过这种方式,所述经标记的报告序列可以在更大规模的环境中被大量 生产,与在分析时单独地标记每一个样本相比,降低了每个分析的成本。“样本”和“参照”核酸例如基因组DNA可以获自任何适合的来源。本文描述的具体 方法包括使用受试个体的样本基因组DNA。基因组样本和/或参照DNA可以从几乎任何的组织中提取,所述组织包括但不限于血液、羊水、实体瘤、活检器官、颊部拭子、绒毛膜绒毛、 胚泡和卵裂球、妊娠物、唾液、尿液等。从经福尔马林固定、石蜡包埋(FFPE)的病理学样本 提取的留存样本同样也是利用此方法分析的样本基因组DNA的来源。样本和/或参照基因 组DNA还可以获自体外来源如细胞系。从这些来源或其他来源获得基因组DNA的方法为本 领域所熟知。在具体的实施方案中,就待分析的样本DNA的具体特征来对参照DNA进行表征。例 如,如果打算对样本DNA进行分析以检测具体基因或染色体座位的复制情况,则对参照DNA 进行表征,从而获知有多少个拷贝的该基因或者座位包含在参照DNA中。通常,使用来自相 同物种的样本和参照DNA。参照DNA可以是来源于性别相同的多个正常受试者,特别是人类受试者的基因组 DNA的汇集混合物。汇集自多个正常受试者的DNA可以商购获得。在一些实施方案中,使用了不止一种参照DNA,并在使用其他参照DNA的方法中获 得其他的信息。因此,例如,在一个具体的实施方案中,将两种参照基因组DNA样本与测试基因组 DNA样本进行比较。将获自男性受试者的第一种参照基因组DNA和获自女性受试者的第二 种参照基因组DNA与获自性别有待确定的受试者如产前胎儿的测试基因组DNA样本进行比 较。本发明分析包括将至少两种参照基因组DNA样本与测试基因组DNA样本相比较, 所述分析的一个具体特征是减少了分析结果的模糊度,并增加了其可信度。例如,如图14 所示,在使用男性特异参照和女性特异参照进行分析时,仅用男性特异参照获得的模糊结 果被弄清楚。可以使用本文所述的分析来检测或者表征与染色体获得或丢失相关的障碍。先天 的或者天生的障碍包括全部染色体的三体性、较小基因组座位(大约200kb至20mb)的扩 增或缺失以及亚端粒区域或着丝粒区域的扩增或缺失。许多癌症的特征也在于可能与类 型、阶段、药物抗性或治疗响应有联系的染色体获得和丢失。可以使用本方法就染色体稳定 性对实验室细胞系(包括干细胞系)进行表征。因此,可以使用两种或者更多种参照基因组DNA样本,所述样本代表影响到基因 组DNA的进行性疾病、病症或障碍的不同阶段,并且将所述两种或者更多种参照与一个基 因组DNA测试样本进行比较,所述测试样本来自欲相对于所述参照来确定其病症的受试个 体。例如,将各种癌症、其他障碍和/或年龄与基因组DNA的进行性缺失联系起来,例如线 粒体DNA缺失与端粒变短。尽管本文所描述的方法和组合物主要涉及来源于人的核酸,但是可以理解的是, 也可以将本文所述的方法和组合物用于分析来源自许多生物体中的任一种的分析样本基 因组DNA,所述生物体包括但不限于非人类的灵长类、啮齿动物、兔、狗、猫、马、牛、猪、山羊 和绵羊。还可以分析非哺乳动物来源的样本DNA,举例来说,包括鱼和其他水生生物、鸟类、 禽类、细菌、病毒、植物、昆虫、爬行类、两栖类、真菌和分支杆菌。同样地,参照DNA也可以为 人类DNA或者来自于各种生物体中的任何一种的DNA,所述生物体包括但不限于非人类的 灵长类、啮齿类、兔、狗、猫、马、牛、猪、山羊、绵羊以及非哺乳动物来源,举例而言,所述非哺 乳动物来源包括鱼和其他水生生物、鸟类、禽类、细菌、病毒、植物、昆虫、爬行类、两栖类、真
23菌和分歧杆菌。所述与基底相连的核酸探针与受试个体的可检测地标记的样本基因组DNA杂交, 从而实现所述与基底相连的核酸探针与所述样本和/或参照核酸的特异性杂交。在本文描述的分析的具体实施方案中,与编码颗粒相连的扩增子与受试个体的可 检测地标记的样本基因组DNA杂交,从而实现所述扩增子DNA与所述可检测地标记的样本 基因组DNA的特异性杂交。此外,与编码颗粒相连的DNA序列与可检测地标记的参照基因
组DNA杂交,由此实现所述扩增子DNA和所述可检测地标记的参照基因组DNA的特异性杂交。术语“杂交”是指互补核酸的配对和结合。出现在两个核酸之间的杂交程度因诸 如核酸的互补程度、核酸的解链温度Tm和杂交条件的严格度等因素而异,正如本领域所熟 知的那样。术语“杂交条件的严格度”指与具体的常用添加剂如甲酰胺和Denhart’ s溶 液相关的杂交介质的温度、离子浓度和组成条件。与特定的核酸相关的具体杂交条件的 确定是常规的,并且为本领域所熟知,例如如J. Sambrook and D. W. Russell, Molecular Cloning :A Laboratory Manual,Cold Spring Harbor Laboratory Press ;3rd Ed. ,2001 ; 和 F. Μ· Ausube1, Ed. , Short Protocols in Molecular Biology, Current Protocols ;5th Ed.,2002中所述。高严格度的杂交条件为仅允许基本互补的核酸进行杂交的那些杂交条 件。通常,互补度为约85-100%的核酸被认为是高度互补的,会在高严格度条件下杂交。中 严格度条件的实例有互补度居中(互补度为约50-84%)的核酸以及互补度高的核酸进行 杂交的条件。相反,低严格度的杂交条件为互补度低的核酸进行杂交的那些杂交条件。术 语“特异性杂交”和“特异性地杂交”是指一具体的核酸与样本中的目标核酸进行杂交,但 基本不与目标核酸之外的核酸杂交。所述分析可以在任何合适的容器中进行。在具体的实施方案中,例如,在准备分析 多个样本时,可以使用多室容器。举例说来,多室容器包括多坑基底,如载玻片、硅片或硅盘 (silicon tray) 0在一些实施方案中,将每个样本放于多孔板不同的孔之中。例如,多孔板 可以是96-孔、384-孔、1024-孔或者1536-孔分析板。还包括对第一信号的检测和对第二信号的检测,所述第一信号指示所连接DNA序 列与受试个体的可检测地标记的基因组DNA的特异性杂交,所述第二信号指示所连接DNA 序列与可检测地标记的参照基因组DNA的特异性杂交。使用任何合适的方法来在本文所述的分析中检测信号,举例说来,所述方法包括 光谱法、光学法、光化学法、生物化学法、酶学法、电学法和/或免疫化学法。通过评估一个或者多个可检测标记的信号,可以检测每一颗粒指示杂交程度的信 号。通常对各颗粒逐一进行评估。例如,可以使颗粒通过流式细胞仪。示例性流式细胞仪 包括 Beckman Coulter 公司(Fullerton Calif.)的 Coulter Elite-ESP 流式细胞仪或 FACScan. TM.流式细胞仪,以及Cytomation,Inc.,Fort Collins,Colo 的M0FL0. TM.流式细 胞仪。除了流式细胞术之外,还可以将离心机用作颗粒分离和归类的工具。一个合适的系统 为描述于美国专利No. 5,926,387中的系统。除了流式细胞术和离心之外,还可以将自由流 动电泳装置用作颗粒分离和归类的工具。一个合适的系统为描述于美国专利No. 4,310,408 中的系统。还可以将颗粒置于表面上,并进行扫描或成像。在某些实施方案中,检测指示所述与基底相连的核酸序列与可检测地标记的样本核酸(如受试个体的基因组DNA)特异性杂交的第一信号。还检测指示所述与基底相连的 核酸探针与可检测地标记的参照基因组DNA特异性杂交的第二信号。在其他实施方案中,检测指示所述与编码颗粒相连的DNA序列与受试个体的可检 测地标记的基因组DNA特异性杂交的第一信号。同时,检测指示所述与编码颗粒相连的DNA 序列与可检测地标记的参照基因组DNA特异性杂交的第二信号。比较所述第一信号和所述第二信号,从而获得有关所述样本和参照核酸的信息。 在某些实施方案中,比较所述第一信号和所述第二信号,从而获得有关受试个体的基因组 DNA与参照基因组DNA相比较的信息。在具体的实施方案中,将与一个或者多个颗粒系列的扩增子杂交的参照DNA和样 本DNA的可检测标记的信号比用来评估该样本和参照DNA之间的差异,所述差异指示例如 基因组获得和/或丢失。在某些实施方案中,参照DNA和样本DNA与一个或者多个颗粒系列的探针例如扩 增子在同一个容器(如多孔板的一个孔)中杂交。杂交之后,两个标记在一起分析,即在杂 交物中同时检测到两个可检测标记,或者,将杂交物分成两个(或者更多个)部分,分别地 对每一个部分进行评估,从而对可检测标记进行检测。可以将评估结果用来提供所述两个 可检测标记的信号比。这种方法使得可以使用竞争性杂交来对各分析之间的任何变异进行 标准化在加入有相同颗粒的同一容器中同时分析参照和实验样本。任选地,可检测地标记的参照DNA和可检测地标记的样本DNA与一个或多个颗粒 系列在不同的容器(例如,多孔板的不同孔)中杂交。在另一个实例中,可检测地标记的参 照DNA和可检测地标记的样本DNA与连接在平面阵列不同位置处的一个或者多个探针杂 交。可以获得这两个可检测标记的信号比,以评估所述样本DNA和参照DNA之间的差异。在 使用这种方法时,几个或者多个实验样本可以共用一个参照样本。对于每天涉及多个样本 的实验,通过避免对多个双份正常样本进行标记,可以节约试剂和人工成本。同时,也没有 必要对样本进行处理,从而获得不同的部分以便分别进行分析。每个样本都可以仅评价一 次。在具体的实施方案中,通过其编码信息来对编码颗粒进行鉴定,从而将颗粒编码 情况与第一信号和第二信号联系起来。因此,例如,将第一和第二信号与含有人13号染色 体DNA的第一编码颗粒系列的编码颗粒关联。对所述与第一编码颗粒系列关联的第一信号 和第二信号进行比较,从而获得受试个体13号染色体DNA与13号染色体参照DNA相比较的 信息。类似地,将第一和第二信号与含有人18号染色体DNA的第二编码颗粒系列关联。对 所述与第二编码颗粒系列关联的第一信号和第二信号进行比较,从而获得受试个体18号 染色体DNA与18号染色体参照DNA相比较的信息。本文的附图和描述对最佳方式进行了阐释,但是可以用许多备选材料和方法进行 替代。本领域的技术人员会认识到合适的备选材料和方法,并且无需进行过多试验即可制 备和使用所述的组合物和方法。多种缓冲液和其他分析组分的组成均可被替代。用于培养、纯化、扩增、变性、偶联、杂交、报告物连接、洗涤和小球处理的条件全都 可以由使用者来改变,从而适合具体类型的细胞、模板基因组DNA、样本、所选报告物等。使用少到30ng的样本DNA也可以很好地进行本文实施例部分的分析。在生物学来
25源产生的用于所述分析的DNA不足的情况下,可以通过许多全基因组扩增(WGA)方法(如 DOP PCR或phi-29PCR)对样本进行扩增。使用WGA处理的样本时,可以以同样的方法对参 照DNA进行处理,从而使任何序列特异性扩增的偏差均可以基本由样本/参照的信号比来 校正。提供了用于分析DNA的试剂盒。在具体的实施方案中,提供了一种试剂盒,其含有 编码颗粒系列和/或两个或更多个编码颗粒系列的混合物。任选地,试剂盒含有使用编码 颗粒系列和/或含有两个或者更多个编码颗粒系列的多重试剂的说明材料。任选地,还含 有辅助试剂,如缓冲液、酶、洗涤溶液、杂交溶液、可检测标记、检测试剂等。下文的实施例对用于分析的组合物和方法的实施方案进行了阐释。提供这些实施 例的目的是进行说明,不能将其看作是对组合物和方法的范围进行限制。实施例实施例1用于基因组DNA分析的小球系列试剂的制备图IA示出了由单个BAC克隆制备BAC扩增子并将该扩增子作为探针固定到一个 系列的编码小球上的流程图。在此实施例中,该系列中的小球全都具有相同的ID代码。原料为活的BAC克隆材料(10),即一段插入到大肠杆菌细菌细胞基因组内的长 (通常为100-200kb)的人DNA序列。取出一小片冷冻的BAC甘油储液材料,并将其用作标 准细菌细胞培养方法的原料(11)。根据标准的BAC培养方案,在37°C下于装有35ml培养 基的50ml管中过夜培养细胞,并用抗生素进行选择。然后在4°C将培养得到的细胞离心20 分钟,使其离心到管底,取出并弃去上清液。将细胞沉淀重悬于含有RNase的缓冲液中,然 后使用LyseBlue (Qiagen,Valencia CA)和SDS裂解。以大约20,OOOg将裂解液(12)离心 (13) 30分钟,并收集上清(溶液中含有DNA),弃去沉淀。将上清液重复离心15分钟。收集 含有溶解的BAC DNA的澄清上清液,同时弃去离心到管底的细胞碎片、蛋白质和其他杂质。 使用Qiagen基因组-Tip 20/G柱纯化试剂盒,从上清液中提取和提纯BAC DNA (17)。此试 剂盒含有纯化柱(15),以及洗涤和洗脱缓冲液(16)。洗脱之后,通过异丙醇(19)沉淀法将 现已高度纯化的BAC DNA进行沉淀并成为沉淀团块。产量通常是20至200ng的纯化BAC DNA(18)。可以将此BAC DNA以干燥沉淀物形式储存,或者重悬于水中,直接用于随后的步 骤中。然后,使用两轮聚合酶链式反应(PCR)扩增,制备基本上代表各BAC DNA的完整序 列物的大量PCR扩增子。第一轮PCR(20)是非特异性简并寡核苷酸引物(DOP)的PCR,其 使用DOP引物混合物(21) ,DOP PCR聚合酶(22)和DOP PCR缓冲液(23),并将上面制备的 BAC DNA(IS)用作模板。第二轮PCR扩增(25),利用针对DOP引物的已知序列基序的单个引 物。使用两轮PCR来产生产量为大约20 μ g的扩增子终产物(29),用于随后将扩增子(29) 偶联(32)至编码小球(30)。如下制备扩增子。制备50 μ 1各BAC DNA的第一 DOP PCR混合物,其含有10 X DOP PCR 缓冲液5. 0 μ 1IOmMdNTP' s (每一种)Ι.ΟμΙ50mM MgCl5. 0 μ 1
26
10 μ M DOP 引物混合物(每一种) 10. 0 μ 120 至 50ng BAC DNA 模板2. 0 μ 1Platinum Taq 聚合酶0. 5 μ 1/K21. 5μ 1总体积50. Ομ DOP PCR 缓冲液(23)含有 20mM Tris HCL(ρΗ8· 4)、50mMKCl 和 5mM MgCl0 dNTP (Amersham Biosciences, Piscataway NJ)白勺&贞力 200 μ Μ。 Platinum TAQ (Applied BioSystems)的浓度为 5 单位/μ 。DOP 引物混合物(21),参见 Fiegler et al. 2003, Genes Chromosomes Cancer, 36 (4) :361_74,包括三个系列具有以下 22-mer 序列 的简并寡核苷酸(Operon Biotechnologies, Huntsville AL),其中N代表随机的核苷酸:5' CCGACTCGAGNNNNNNCTAGAA 3‘ SEQ ID No. 15' CCGACTCGAGNNNNNNTAGGAG 3‘ SEQ ID No. 25' CCGACTCGAGNNNNNNTTCTAG 3‘ SEQ ID No. 3其中N表示随机的核苷酸。使用Qiagen基因组-Tip 20/G柱纯化试剂盒,将溶于水的BACDNA模板(18)通过 柱纯化法(17)纯化。Platinum Taq 聚合酶(22) (Invitrogen, Carlsbad CA)的浓度为 5 单 位 / μ 1 ο根据以下温度/时间条件,在GeneAmp 9700热循环仪(Applied BioSystems, Foster City CA)中进行第一轮扩增(20)3. 0 分钟 94°C1. 5 分钟 94 °C2. 5分钟30°C,9个循环0. 10C/ 秒 72 "C (斜率)3. 0 分钟 72 °C1. 0 分钟 94 °C1. 5 分钟 62 °C,30 个循环2.0 分钟 72 °C8.0 分钟 72 °C4.0°C (稳定状态)然后,将第一轮DOP PCR(20)的扩增子产物(24)用作第二轮PCR(25)的模板。第 二轮中的单一引物(26)具有针对第一轮(20)中使用的DOP引物的共有序列部分的特异 性。此引物(26)经胺修饰,从而使所得扩增子(29)还在一个末端具有胺基团,以有助于在 下一步中简单地偶联至编码小球(32)。如下进行第二轮PCR。制备100μ 1各BAC扩增子模板的第二 PCR混合物,其含有10 X PCR 缓冲液10. Ομ IOmMdNTP' s (每一种)2. 0 μ 150mM MgCl10. 0 μ 110 μ M 胺引物15. Ομ
27
模板(来自PCR#1)Platinum Taq水总体积
2. 0μ 1 0. 5μ 1 58. 5μ 1 100. O μ 1PCR 2 缓冲液(28)含有 20mM Tris HCL(ρΗ8· 4)、50mM KCl 禾口 5mM MgCl。 dNTP (Amersham Biosciences, Piscataway NJ)白勺&it 力 200 μ Μ。 Platinum TAQ (Applied BioSystems)的浓度为 5 单位 / μ 1。与胺相连的引物(Operon)具有以下序列。5 ‘ -GGAAACAGCCCGACTCGAG-3 ‘ SEQ ID NO. 4反应(25)中的模板为来自上一轮DOP PCR(20)的DOP扩增子。根据以下温度/ 时间条件,在GeneAmp 9700热循环仪(Applied BioSystems)上进行第二轮扩增(25)10 分钟 95 °C1. 0 分钟 95 °C1. 5 分钟 60°C,35 个循环7.0 分钟 72 °C10 分钟 72 °C4.0°C (稳定状态)然后,使用基于磁性小球的试剂盒(9)(PCR Clean Beads, Agencourt Bioscience Corp. , Beverley ΜΑ),根据制造商的方案,纯化此第二 PCR产物(29)。随后将经纯化的扩 增子(29),重悬于40 μ 1水中,并于-20°C下储存,直至用于下文所述的小球偶联步骤中。以50 μ 1的标准小球浓度的规模,在Luminex羧基小球(30) (Luminex,Austin TX),上进行编码小球偶联过程(32),以将所述扩增子产物(29)作为探针DNA固定到编码小 球的表面之上,得到大约650,000个小球。所述小球由聚苯乙烯制备,直径大约为5. 6 μ m, 并由受控量的两种或者多种荧光染料编码,从而有助于在专用流式细胞仪读取装置上检 测其小球ID。将50 μ 1的悬浮小球(30)(全都具有一个小球ID或区域),从送递它们的 Luminex管中转移到一个1. 5ml Eppendorf管进行偶联(32),并通过涡旋和超声处理来确 保悬浮。然后,以12,000RPM将小球离心3分钟,并在不干扰小球沉淀物的情况下除去小球 缓冲上清液。将25μ1 MES缓冲液加入各小球管,然后进行涡旋和超声处理。另外地,将 10 μ g各BAC的PCR 2扩增子(29)加入第二系列的1. 5ml离心管中,随后将各管中的DNA 在 SpeedVac (ThermoFisher Scientific, Waltham ΜΑ)中彻底干燥。然后,将一份小球悬液 转移到各DNA管中,并将各管涡旋和超声处理5秒钟进行混合,仔细地跟踪与各BAC有联系 的小球ID (区域)。接下来,将1. 5 μ 1刚溶解的EDC (31) (1_乙基_3_ [ 二甲基氨丙基]_碳二亚胺盐酸 盐,Pierce,Rockford IL)以10mg/ml的浓度加入各管中,立即涡旋,并在室温下避光(目 的是保留Luminex小球的荧光编码)孵育30分钟。在15分钟时再次混合。然后再一次地 重复EDC添加、孵育和再次混合。然后,将500 μ 1 TNT 缓冲液(0. IM Tris ρΗ 7. 5,0. 15Μ NaCl, 0. 02% Tween 20) 加入各管中并进行涡旋。然后在微型离心机上以12,000RPM将所述管离心4分钟,使小球 分布到底部,并小心地除去上清液。接下来,加入500 μ 1 0. 1% SDS,并且再以12,000RPM
28将小球离心4分钟,小心地除去上清液。最后,将50μ 1 IXTE缓冲液(IOmM Tris ρΗ 7.5, ImM EDTA)加至各管,并进行涡旋。该小球系列(33)——固定有扩增子探针(29)——可以作为用于基因组DNA分析 的多重小球系列的一个组分纳入。实施例2DNA分析用多重编码小球系列试剂的制备图2是示出将m个不同的编码小球系列(各自具有各自的固定的BAC-扩增子探 针DNA)混合在一起来制备多重编码小球系列的流程图。通过超声处理、旋转管容器、涡旋或类似方法,将编码小球系列34、35、36和37制 成悬液。然后,使用移液管将各小球系列的整分试样转移到另一个容器中,各个小球系列在 该容器中合并和混合,然后变性(38),从而有助于随后在分析中与固定在所述小球上的探 针DNA的杂交。在一个详尽的实施例中,将各50 μ 1的2个或多个小球系列——每一系列在一个 单独的管子里,每一编码小球系列均固定有探针DNA(33)——分批地合并到一个1. 5ml离 心管内。在合并大约10个小球系列之后,将管离心,并小心除去上清液,目的是减少体积。 再次重复,直至合并所有的小球系列(例如,Luminex 200系统至多支持100个编码小球ID 或区域)。在将所有的小球系列合并成为一个多重小球系列之后,将固定的探针DNA变性。 在对小球进行离心并除去上清之后,加入500 μ 1 0. INNaOH,并在室温下孵育2分钟。然后 对小球进行离心,并小心地除去上清。加入500 μ 1 IOmM Tris、15mM NaCL.O. 2% Tween 20, 涡旋该管,然后对小球进行离心,并除去上清液。然后重复进行此洗涤步骤。最后,用IXTE 缓冲液将体积调整为500 μ 1,并将此多重小球系列(39)在4°C下避光保存,直至用于分析 中。实施例3多重基因组获得和丢失分析图3是展示一个实施方案的流程图,所述实施方案包括使用多重编码小球系列在 η个样本上进行多重基因组获得和丢失分析。该流程图示出了方法的实施方案,包括提供经 标记的样本和参照DNA (5),所述样本和参照DNA与两个或者更多个编码小球系列杂交(6), 检测所述标记样本和参照DNA与所述编码小球系列杂交的信号(7),和比较所述信号以确 定所述样本和参照DNA之间的差异(8)。图3Α为展示一个实施方案的流程图,所述实施方案包括使用多重编码小球系列 对η个样本进行多重基因组获得和丢失分析。在此实施例中,平行分析了两个DNA样本和两个参照。事实上,可以同时地以微量 板形式平行分析几十个样本。也可以平行分析比此数目更多或者更少的样本和参照。在此实施例中,将四个DNA样本(40和41代表两个参照,而42和43代表两个分析 样本)用生物素进行酶学标记并纯化。参照样本通常为正常男性和女性的合并样本,如人 类女性基因组DNA和人类男性基因组DNA (Promega,Madison WI)。将各DNA样本和参照与 生物素标记的核苷酸(45) (PerkinElmer,Boston ΜΑ)、非标记核苷酸(49) (PerkinElmer)、 随机引物(47) (Operon, Biotechnologies, Huntsville AL)和 Klenow 片段聚合酶(46)(Epicentre Biotechnologies,Madison WI)合并起来。孵育(44)之后,使用 DNA 柱纯化试 剂盒(49)(如 Purelink DNA Mini Kit(Invitrogen))纯化(50)反应产物。大约 5 μ 1 的 约200ng/y 1经标记的样本用于此分析随后的杂交。然后,使各生物素标记的样本或参照(51-54)与固定在多重编码小球系列(56)的 小球上的探针杂交(55)使用了每个小球系列(各探针类型)的大约500个小球;在此55 重实施例中,使用了总共大约55X500 = 27,500个小球/杂交。因为编码情况,各编码小球系列的小球可以区别于其他编码小球系列每一系列的 小球。此55个小球系列中的每一系列均含有多个编码小球,与所述编码小球相连的扩增子 基本上代表完整的模板基因组DNA片段。各小球系列的模板DNA代表图9所列的一个基因 组座位。杂交反应中包括含有Cot-IDNA、甲酰胺、硫酸葡聚糖和1.9XSSC的杂交缓冲 液。总体积大约为15 μ 1,且反应在硬的PCR型硬质微量板如Bio-Rad HSP 9631 (Bio-Rad Laboratories, Hercules CA)的孔中进行。使用铝箔封口机(MSF 1001,Bio-Rad)严密地 封住该板,将蒸发降至最低。在1150rpm的微量板振荡培养箱(Wallac NCS Incubator, PerkinElmer)中于50°C过夜进行杂交孵育(55)。在杂交孵育(55)之后,与四个样本杂交的四个多重小球系列(58-61),就可以进 行杂交洗涤(63),然后与荧光报告物(65) —起孵育,再进行报告物洗涤(67)。首先,将 100 μ 1洗涤缓冲液a (2 X SSC,50 %甲酰胺)加入各孔之中,然后重新封闭该板,并在振荡培 养箱(转动速率为1150rpm)于50°C下孵育20分钟。然后将各孔内含物转移到Millipore 0. 46 μ m HT 过滤板(Millipore,Billerica MA)。之后,使用 Millipore MSVMHTS00 多头抽 真空装置从各孔中真空除去液体。接下来,将100 μ 1洗涤缓冲液b(2XSSC,0. 1% Igepal 清洁剂)加入各孔,然后在50°C下再进行一次为期20分钟的振荡孵育,并进行真空抽吸。 随后,将100 μ 1洗涤缓冲液c (0. 2 X SSC)加入各孔,并在50°C下重复为期20分钟的振荡孵 育,然后进行真空抽吸。然后,将100 μ 1 IXPhycoLink SA溶液(链亲和素-藻红蛋白报告物),64,加入 各孔。此报告物溶液是通过将 2 μ 1 500 XPhycoLink SAPJ13S (Prozyme, San Leandro CA) 混合到Iml报告物稀释液中形成,其中所述稀释液为1XPBS、0. 1% BSA和0. 05% Tween 20。将此报告物溶液与多重小球系列在1050RPM的振荡培养箱中于25°C下孵育30分钟。 孵育之后,使用如前面的洗涤步骤中的多头抽真空装置从过滤板的孔中吸出溶液。然后用洗涤缓冲液d(66)将小球洗涤两次(67),所述洗涤缓冲液d为含0.01% Tween 20的1XPBS。将100 μ 1加入过滤板的各孔中,然后通过板孔底部的过滤器真空抽 吸掉液体。再一次加入100 μ 1,并在1050RPM的振荡培养箱中于25°C下孵育2分钟。所述 第二次洗涤并不进行抽吸,而是用来悬浮小球以进行读数。之后,本实施例中的四个小球系列(68-71)即可在Luminex 200系统(Luminex Corporation, Austin TX)上读数(72)。依次读取各孔中的小球的信号和小球ID,并记录 下各孔或样本的各小球ID (小球区域)的前50个小球的荧光强度中值,并输出到在一个数 据文件(73)中。没有发现小球交联;设定Luminex读数仪,使其分析各区域的50个小球, 并且并未记录到失败。图4是96孔SBS标准微量板(80)的示意图,其示出用于平行地对46个样本进行
30分析的两份参照和两份样本的示例性位置。各标记样本的两份重复杂交可用于确保孔密封 失败情况下的数据形成,所述孔密封失败会导致试剂从单个孔蒸发。在双份重复没有受到 影响时,该样本仍然形成数据。使用此微量板和编码小球方法,实验员单人即可同时分析例 如46个样本和2个参照,并且全都双份重复进行,在第一天进行标记,杂交过夜,并在第二 天进行洗涤和读数。或者,分析可以不重复进行或者不止两个重复地进行。所示出的是双 份的两个参照(81和82)以及双份的样本,样本的一个实例在83处标示出。图5是使用男性的13号染色体上具有三体性的Coriell DNA样本形成数据的一 个实例;此数据由通过Luminex读数仪获得的各小球区域的中间荧光值计算得到。从所有 其他信号中减去阴性对照小球29、54和56的平均值(参见图9)。然后,求出来自九个常染 色体克隆的信号与来自男性和女性参照DNA的相应克隆信号的比值。计算标准化因子,从 而在将该因子应用到所有的常染色体克隆信号之时,其会使得平均的常染色体比值为数值 1。然后,将此标准化因子应用到所有的样本信号。将所得比值作图,并示于图5。请注意,13号染色体的克隆的比值全都在范围1.3 至1. 6之间,而18和21号染色体的克隆以及其他常染色体克隆除了有一个之外全都低于 1.2。13号染色体中的三体性很容易显现。同样地,样本与男性参照相比的比值图(方块数 据点)对于X和Y性染色体实际上都是平坦的。此乃男性样本所应有的反应。样本与女性 参照相比较的图(菱形数据点),对于X而言下移,而对于Y而言上升,这同样也是男性样本 应有的反应。图6是使用男性的18号染色体上具有三体性的Coriell DNA样本所形成的数据 的一个实例。如针对图5所述的那样,形成数据并作图。图7是使用女性的21号染色体上具有三体性的Coriell DNA样本所形成的数据 的一个实例。如针对图5所述的那样,形成数据并作图。图8是使用X染色体5-拷贝扩增的Coriell DNA样本所形成的数据的一个实例。 如针对图5所述的那样,形成数据并作图。图9为一张图表,其示出具有用于在示例性分析中形成扩增子的人基因组DNA插 入物的BAC克隆、其染色体和cyto条带位置、阴性对照寡核苷酸的序列以及各扩增子探针 所固定的小球系列的小球ID(Luminex小球区域)。将图5-8中χ轴上顺序编号的作图点与 图9中自上而下列出的BAC关联。BAC RP11-186J16被固定到两个不同的小球区域(42和 86)。与人基因组没有序列同源性的一个寡核苷酸被选择作为阴性对照。所使用的具体 阴性对照寡核苷酸为5 ‘ GTCACATGCGATGGATCGAGCTC 3 ‘ SEQ ID No. 5 ;5 ‘ CTTTATCATCGTTCCCACCTTAAT 3 ‘ SEQ ID No. 6 ;5' GCACGGACGAGGCCGGTATGTT 3' SEQ ID No. 7。将与阴性对照寡核苷酸相连的三个小球区域29、54和56所形成的信号取平均值, 并从所有其他小球信号中减去,然后再计算比值。实施例4图IOA是示出根据本文所述一个方面的一种制备复合探针的方法的简化流程图。来自于一个来源的探针DNA (92)和来自于另一个来源的探针DNA (93)任选地通过PCR分别 被扩增(94和95),从而得到扩增子探针,随后混合所述扩增子探针形成复合探针(96)。将 所述复合探针连接至基底(97)形成与基底相连的复合探针(98)。图IOB是示出根据本文所述一个方面的一种制备复合探针的方法的简化流程图, 其中可以将探针DNA(92和93)汇集形成复合混合物99,然后进行任选的PCR扩增(100), 从而制备复合探针材料(96),所述复合探针材料连接至基底(97)形成与基底相连的复合 探针(98)。图11是示出根据本文所述方法一个方面的一种制备复合探针的方法的简化流程 图。示出了一幅染色体模式图(101),该模式图示出所关注的染色体(在本实施方案中,是 22号染色体)的CytoBand (102)。示出用于分析的具有目的区域中基因组座位的一个五种 BAC的系列(103),且各BAC基因组座位大致被搁置于所述染色体模式图上。在本实施方案 中,来自五种BAC且被定位到与DiGeorge微缺失综合征相对应的CytoBand 22pll. 2的DNA 被用于制备所述复合探针。该图中的所述染色体模式图示意性地示出选自一个CytoBand 的五种示例性BAC的基因组邻近关系;在此方法中,所述BAC DNA并非从人染色体提取。利用常规方案从所述五种培养的BAC中的每一种中提取和纯化DNA。将所培养的 细菌细胞裂解,并通过离心和柱纯化(Qiagen,Valencia CA)来沉淀并随后纯化DNA (104)。 随后,将从各BAC中纯化的DNA(105)用作简并寡核苷酸引物(DOP)PCR扩增(106)的模板。 接下来,将DOP引物序列用作特异性PCR引物,对所述DOP产物进行特异性PCR扩增。这 一方法得到了五种单独的扩增子探针(107)。接下来,将这些单独的探针(107)汇集起来 (108),形成复合探针(109)。然后,将所述复合探针固定到一个系列的Luminex编码多重微 球(全都具有一个小球“区域”,即具有相同的小球编码身份)(110),用于在多重基因组获 得-丢失分析中用作22pll.2Cytoband探针。所述单独的探针(107)的每一种也被单独地 固定,每一种被固定到具有一个独特身份的小球系列上,从而使得其反应可以与所述复合 探针的反应相比较。图12是测试分析的数据曲线图,示出了复合探针与DiGeorge综合征参照DNA样 本(Coriell Institute for Medical Research, Camden NJ)的使用。使用固定在 Luminex 编码微球上的PCR产物探针在Luminex xMAP平台上进行分析。使用DOP PCR由BAC DNA制 备所述PCR产物探针。固定所述探针,微球系列上的每一种探针都可以被Luminex系统分 别鉴定,并如本文所述进行测试分析。所述多重探针组包括八种来自基因组座位的常染色 体探针,所述常染色体探针预计在DNA样本与男性和女性DNA参照之间没有表现出获得或 者丢失。所述多重探针组还包括六种X染色体探针和五种Y染色体探针作为阳性对照,从 而在将测试样本与相反性别的参照进行比较时,可以观察到性染色体中已知的获得或者丢 失的比值反应。所述多重探针组还包括位于DiGeorge综合征缺失的座位处的五种22qll. 2 探针(123),参见下表I。所述五种BAC的中心座位跨越大约0. 45mb (445kb),并且对于其 175kb的典型长度,总跨度略高于600kb。表I. BAC及其中心的Chr 22线性定位位置(mb)BACpterF517. 7765040M5117. 8000000
32
RP11-16CRP11-316L10RPl 1-18608
1017. 9469780 18.1740250 18.2284550参照图12,此为DiGeorge综合征样本与男性和女性正常参照DNA两者相比较的 两个数据系列的比值图。数据系列120是DiGeorge样本与男性参照DNA相比较的比值反 应;其表明所有X染色体探针中均有相对的获得(125),而在所有Y染色体探针中均有丢失 (126)。该反应表明,所述样本来自于女性。数据系列121是同一样本与女性参照DNA的比 较,其表明,对于X和Y性染色体探针,比值反应均接近1. 0,这确认了该样本来自于女性。 图中1.0的比值线(122)指示在样本与正常参照相比没有基因组获得或者丢失时,对于任 何给定探针而言,样本/参照比值的预期结果。将常染色体探针(127)加入到此组,作为预 期会产生大约1.0比值的对照,它们的确如此。来自于22q. 11. 2座位的五种探针(123)均包含在此组中。这五种探针与男性和 女性参照DNA相比,全都表现出比值小于1,这与所述样本中在该座位处的已知基因组缺失 相一致。最后,将一个类型的多重小球偶联到含有所述五种22qll. 2探针的混合物或汇集 物的复合探针(123)。所述复合探针的比值反应(124)也指示缺失,其与所汇集的所述五种 组成型探针的平均反应相当一致。实施例5图13是根据本发明的一个方面由Luminex小球阵列获得_丢失分析得到的比值 数据。该数据来自于从产前羊水样本提取的胎儿DNA,所述胎儿的性别并不明确知晓。进行 分析,并且男性和女性参照在同一 96-孔微量板的不同孔中同时进行分析。图例(136)标 识出两个数据标记,表示参比女性的(菱形作图点)和参比男性的(方形作图点)。比值 =1.0的水平线(132)位于该图的中心。所述比值标尺(133)为该图的纵轴。示出了具有 针对女性参照形成的样本/参照比值的第一数据图(130)。对于该图,针对X染色体探针 的数据(134)表现出比值小于1,针对Y染色体探针的数据(135)与女性相比表现出获得。 这与男性样本是一致的。第二数据图(131)利用接近比值等于1.0的线的男性参照群,也 与男性样本一致。两个数据系列都显示出阵列中的其他探针并没有明显地偏向X探针的左 侧,表明是一个正常样本。表II示出与图13和14中X轴上顺序编号的作图点有关的BAC身份。表IL
3权利要求
一种分析DNA样本的方法,包括提供一种与基底相连的复合核酸探针,所述复合核酸探针含有与参照基因组的基因组区域中的两个或者更多个基因组座位特异性杂交的核酸序列,所述基因组区域的特征在于具有第一末端和第二末端以及置于所述第一末端和第二末端之间的至少400kb的中间区域,其中所述复合核酸探针包含基本上与含有所述第一末端的完整第一基因组座位以及基本上与含有所述第二末端的完整第二基因组座位特异性地杂交的核酸序列;使所述与基底相连的复合核酸探针与样本基因组DNA杂交;使所述与基底相连的复合核酸探针与参照基因组DNA杂交;检测指示所述与基底连接的复合核酸探针与所述样本基因组DNA特异性杂交的第一信号,以及指示所述与基底相连的复合核酸探针与所述参照基因组DNA特异性杂交的第二信号;并且比较所述第一信号和所述第二信号,从而检测所述第一信号和第二信号之间的差异,所述第一信号和第二信号之间的差异指示所述样本DNA和所述参照DNA之间的差异,由此分析所述DNA样本。
2.权利要求1的方法,其中所述基底为多个颗粒。
3.权利要求1的方法,其中所述基底为多个编码颗粒。
4.权利要求1的方法,其中所述基底为平面基底。
5.权利要求1的方法,其中所述第一基因组座位和第二基因组座位各自含有至少约 IOOkb。
6.权利要求1的方法,其中所述与参照基因组的基因组区域中的两个或者更多个基因 组座位特异性杂交的核酸序列来源于两个或者更多个大插入DNA载体。
7.权利要求6的方法,其中所述两个或者更多个大插入DNA载体选自细菌人工染色体、 酵母人工染色体、人类人工染色体、黏粒、质粒、噬菌粒、噬菌体DNA和F黏粒。
8.权利要求1的方法,其中所述与参照基因组的基因组区域中的两个或者更多个基 因组座位特异性杂交的核酸序列从选自如下的来源获得分离的染色体和分离的染色体片 段。
9.权利要求1的方法,其中所述与参照基因组的基因组区域中的两个或者更多个基因 组座位特异性杂交的核酸序列为从选自如下的来源获得的扩增子两个或者更多个的大插 入DNA载体、分离的染色体、分离的染色体片段,一个大插入DNA载体和分离的染色体,以及 一个大插入DNA载体和分离的染色体片段。
10.权利要求1的方法,其中所述样本基因组DNA被可检测地标记。
11.权利要求1的方法,其中所述参照基因组DNA被可检测地标记。
12.权利要求1的方法,其中所述与参照基因组的基因组区域中的两个或者更多个基 因组座位特异性杂交的核酸序列各自具有的长度范围为约20-250,000个核苷酸,包括端 值。
13.权利要求1的方法,其中所述样本DNA为获自受试个体的DNA。
14.权利要求13的方法,其中所述样本DNA为获自受试个体的基因组DNA。
15.权利要求1的方法,其中所述样本DNA为人类DNA。
16.权利要求1的方法,还包括使所述与基底相连的复合核酸探针与第二种参照基因组DNA杂交;检测指示所述与基底相连的复合核酸探针与所述第二种参照基因组DNA特异性杂交 的第三信号;并且比较所述第一信号和所述第三信号,从而检测所述第一和第三信号之间的差异,所述 第一和第三信号之间的差异指示所述样本DNA与所述第二种参照DNA之间的差异,由此分 析所述DNA样本。
17.一种分析样本DNA的方法,包括提供包含两个或者更多个编码颗粒系列的混合物的多重试剂,所述编码颗粒系列被编 码,从而使得每一编码颗粒系列的各个颗粒均可检测地区别于其他每一编码颗粒系列的各 个颗粒,所述编码颗粒含有所连接的与参照基因组的至少一个基因组座位特异性杂交的核 酸序列,其中至少一个编码颗粒系列含有所连接的复合核酸探针,所述复合核酸探针包含 与参照基因组的基因组区域中两个或者更多个基因组座位特异性杂交的核酸序列,所述基 因组区域的特征在于具有第一末端和第二末端以及置于所述第一末端和第二末端之间的 至少400kb的中间区域,其中所述复合核酸探针包含基本上与含有所述第一末端的完整第 一基因组座位、以及基本上与含有所述第二末端的完整第二基因组座位特异性杂交的核酸 序列;使所述多重试剂与样本基因组DNA杂交;使所述多重试剂与参照基因组DNA杂交;检测指示所述连接的核酸序列与可检测地标记的DNA特异性杂交的第一信号;检测指示所述连接的核酸序列与可检测地标记的参照DNA特异性杂交的第二信号;鉴定所述编码颗粒,从而将颗粒编码情况与所述第一信号联系起来;鉴定所述编码颗粒,从而将颗粒编码情况与所述第二信号联系起来;并且比较各个编码颗粒系列的所述第一信号和第二信号,其中所述第一和第二信号之间的 差异指示所述样本和参照DNA之间的差异,由此分析DNA。
18.一种用于分析DNA的试剂,包含与固体基底相连的第一复合核酸探针,所述第一复合核酸探针包含与参照基因组的 基因组区域中两个或者更多个基因组座位特异性杂交的核酸序列,所述基因组区域的特征 在于具有第一末端和第二末端以及置于所述第一末端和第二末端之间的至少400kb的中 间区域,其中所述第一复合核酸探针包含基本上与含有所述第一末端的完整第一基因组座 位、以及基本上与含有所述第二末端的完整第二基因组座位特异性杂交的核酸序列。
19.权利要求18的用于分析DNA的试剂,还包含与固体基底相连的第二复合核酸探针,所述第二复合核酸探针包含与参照基因组的 第二基因组区域中两个或者更多个基因组座位特异性杂交的核酸序列,所述第二基因组区 域的特征是具有第一末端和第二末端,并且具有置于所述第一末端和第二末端之间的至少 400kb的中间区域,其中所述第二复合核酸探针包含基本上与含有所述第二基因组区域第 一末端的完整第一基因组座位、以及基本上与含有所述第二基因组区域第二末端的完整第 二基因组座位基本上特异性杂交的核酸序列。
20.权利要求18的试剂,其中所述固体基底为平面基底。
21.权利要求19的试剂,其中所述固体基底为进一步包含所述第一复合核酸探针的平面基底。
22.权利要求18的试剂,其中所述固体基底为第一种多个颗粒。
23.权利要求19的试剂,其中所述固体基底为第二种多个颗粒。
24.权利要求23的试剂,其中所述第一种多个颗粒和第二种多个颗粒被可区别地编码。
25.一种制备用于分析DNA的与基底相连的复合核酸探针的方法,包括分离基本上与含有参照基因组的基因组区域的第一末端的完整第一基因组座位特异 性杂交的第一核酸序列;分离基本上与含有参照基因组的基因组区域的第二末端的完整第二基因组座位特异 性杂交的第二核酸序列;混合所述第一和所述第二核酸序列,从而制备复合探针;将所述复合探针连接到固体基底,从而制备用于分析DNA的与基底相连的复合核酸探 针试剂。
26.权利要求25的方法,其中所述第一和所述第二核酸序列含有用于与所述固体基底 反应的官能团。
27.权利要求25的方法,其中所述第一核酸序列分离自第一大插入载体,并且所述第 二核酸序列分离自第二大插入载体。
28.权利要求25的方法,其中所述第一和所述第二核酸序列在混合之前进行扩增。
29.权利要求25的方法,其中所述第一和所述第二核酸序列在混合之后进行扩增。
30.一种分析DNA样本的方法,包括 提供与基底相连的核酸探针;使所述与基底相连的核酸探针与获自受试者的样本基因组DNA杂交; 使所述与基底相连的核酸探针与第一种参照基因组DNA杂交; 使所述与基底相连的核酸探针与第二种参照基因组DNA杂交; 检测指示所述与基底相连的核酸探针与所述样本基因组DNA特异性杂交的第一信号、 指示所述与基底相连的核酸探针与所述第一种参照基因组DNA特异性杂交的第二信号以 及指示所述与基底相连的核酸探针与所述第二种参照基因组DNA特异性杂交的第三信号; 比较所述第一信号和所述第二信号,从而检测所述第一和第二信号之间的差异,所述 第一和第二信号的差异指示所述样本DNA和所述第一种参照DNA之间的差异;并且比较所述第一信号和所述第三信号,从而检测所述第一和第三信号之间的差异,所述 第一和第三信号之间的差异指示所述样本DNA和所述第二种参照DNA之间的差异,由此分 析所述DNA样本。
31.权利要求30的方法,还包括将所述样本DNA和所述第一种参照DNA之间的差异与所述样本DNA和所述第二种参照 DNA之间的差异进行比较。
32.权利要求30的方法,其中所述第一种参照基因组DNA包括男性特异的基因组DNA, 其中所述第二种参照基因组DNA包括女性特异的基因组DNA,并且其中对所述第一和第二 信号的差异的比较以及对所述第一和第三信号的差异的比较指示了受试者的性别。
33.权利要求30的方法,其中所述第一种参照基因组DNA包括第一种病症特异的基因组DNA,其中所述第二种参照基因组DNA包括第二种病症特异的基因组DNA,并且其中对所 述第一和第二信号的差异的比较以及对所述第一和第三信号的差异的比较指示了所述受 试者的疾病状态。
34.权利要求30的方法,其中所述第一种参照基因组DNA包括第一种病症特异的基因 组DNA,其中所述第二种参照基因组DNA包括第二种病症特异的基因组DNA,并且其中对所 述第一和第二信号的差异的比较以及对所述第一和第三信号的差异的比较指示了受试者 的新陈代谢年龄。
35.权利要求30的方法,其中所述与基底相连的核酸探针包含多个编码颗粒。
36.权利要求30的方法,其中所述与基底相连的核酸探针包含平面基底。
37.权利要求30的方法,其中所述与基底相连的核酸探针包含多种寡核苷酸。
38.权利要求30的方法,其中所述与基底相连的核酸探针包含多种扩增子。
39.权利要求30的方法,其中所述与基底相连的核酸探针包含分离自大插入DNA载体 的插入DNA。
40.权利要求30的方法,其中所述与基底相连的核酸探针包含分离的染色体DNA。
41.一种分析DNA样本的方法,包括提供含有连接有扩增子的编码颗粒的第一编码颗粒系列,所述扩增子包含合在一起基 本上代表完整第一模板DNA序列的随机核酸序列;使所述第一编码颗粒系列的扩增子与可检测地标记的样本DNA杂交;使所述第一编码颗粒系列的扩增子与可检测地标记的第一种参照DNA杂交;使所述第一编码颗粒系列的扩增子与可检测地标记的第二种参照DNA杂交;检测指示所述第一编码颗粒系列的扩增子与可检测地标记的样本DNA特异性杂交的 第一信号、指示所述第一编码颗粒系列的扩增子与可检测地标记的第一种参照DNA特异性 杂交的第二信号、以及指示所述第一编码颗粒系列的扩增子与可检测地标记的第二种参照 DNA特异性杂交的第三信号;比较所述第一信号和所述第二信号,以检测所述第一和第二信号之间的差异,所述第 一和第二信号的差异指示所述样本DNA和所述参照DNA之间的差异;并且比较所述第一信号和所述第三信号,以检测所述第一和第三信号之间的差异,所述第 一和第三信号的差异指示所述样本DNA和所述第二种参照DNA之间的差异,由此分析所述 DNA样本。
42.权利要求41的方法,其中所述扩增子的长度范围为大约500-1200个核苷酸,包括端值。
43.权利要求41的方法,其中所述可检测地标记的样本DNA是获自受试个体的可检测 地标记的DNA。
44.权利要求43的方法,其中所述可检测地标记的样本DNA是获自受试个体的可检测 地标记的基因组DNA。
45.权利要求41的方法,其中所述可检测地标记的样本DNA是人类DNA。
46.权利要求41的方法,还包括提供含有连接有扩增子的编码颗粒的第二编码颗粒系列,所述扩增子包含合在一起基 本上代表完整第二模板DNA序列的随机核酸序列;使所述第二编码颗粒系列的扩增子与可检测地标记的样本DNA杂交; 使所述第二编码颗粒系列的扩增子与可检测地标记的第一种参照DNA杂交; 使所述第二编码颗粒系列的扩增子与可检测地标记的第二种参照DNA杂交; 检测指示所述第二编码颗粒系列的扩增子与可检测地标记的样本DNA特异性杂交的 第一信号、指示所述第二编码颗粒系列的扩增子与可检测地标记的第一种参照DNA特异性 杂交的第二信号、以及指示所述第二编码颗粒系列的扩增子与可检测地标记的第二种参照 DNA特异性杂交的第三信号;比较所述指示所述第二编码颗粒系列的扩增子的特异性杂交的第一信号和所述指示 所述第二编码颗粒系列的扩增子的特异性杂交的第二信号,以检测所述第一和第二信号之 间的差异,所述第一和第二信号的差异指示所述样本DNA和所述第一种参照DNA之间的差 异;并且比较所述指示所述第二编码颗粒系列的扩增子的特异性杂交的第一信号和所述指示 所述第二编码颗粒系列的扩增子的特异性杂交的第三信号,以检测所述第一和第三信号之 间的差异,所述第一和第三信号的差异指示所述样本DNA和所述第二种参照DNA之间的差已
47.权利要求46的方法,其中所述第一和第二编码颗粒系列以混合物的形式提供,并 且还包括将所述第一编码颗粒系列的编码情况与指示所述第一编码颗粒系列的扩增子与可检 测地标记的样本DNA特异性杂交的第一信号和指示所述第一编码颗粒系列的扩增子的特 异性杂交的第二信号联系起来;并且将所述第二编码颗粒系列的编码情况与指示所述第二编码颗粒系列的扩增子与可检 测地标记的样本DNA特异性杂交的第一信号和指示所述第二编码颗粒系列的扩增子的特 异性杂交的第二信号联系起来。
48.一种基本上如本文中所述的DNA分析方法。
49.一种基本上如本文中所述的DNA分析用试剂。
全文摘要
本发明提供了用于检测基因组DNA获得和丢失的组合物和方法。本发明的分析的实施方案包括使用一种与基底相连的复合核酸探针,所述复合核酸探针与参照基因组的基因组区域中的两个或者更多个基因组座位特异性杂交。所述基因组区域的特征在于具有第一末端和第二末端以及置于所述第一末端和第二末端之间的至少400kb的中间区域。所述复合核酸探针包含基本上与含有所述第一末端的完整第一基因组座位以及基本上与含有所述第二末端的完整第二基因组座位特异性杂交的核酸序列。本发明提供了包括对两个或者更多个基因组DNA参照进行评估的方法和组合物。
文档编号C12Q1/68GK101939448SQ200880126212
公开日2011年1月5日 申请日期2008年11月24日 优先权日2007年12月5日
发明者K·E·阿得勒 申请人:珀金埃尔默·拉斯公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1