定量核酸酶保护测序(qNPS)的制作方法

文档序号:393216阅读:1290来源:国知局
专利名称:定量核酸酶保护测序(qNPS)的制作方法
定量核酸酶保护测序(qNPS)本发明在广义上涉及用于在核酸靶标的鉴定和检测中进行定量核酸酶保护测序(qNPS)的组合物和方法。更具体地,本发明提供了用于使用测序来分析来自生物样本的核酸的组合物和方法。本发明提供了一种用于解决测序面临的几个难题并改善了研究和诊断应用的新方法——定量核酸酶保护测序(qNPS )。所述方法使用仅需样本裂解的核酸酶保护测定来产生用于测序的DNA (或其他合成的)探针,所述探针自身可被测序,或者偶联于(a)基因特异性标签从而鉴定基因而不必对所述核酸酶保护探针自身测序,和/或(b)实验特异性标签从而可将来自不同患者的样本合并到单次运行中。所公开的qNPS作为一种研究和发现工具以及作为诊断测试使得对固定或不溶的样本以及其他样本的测序成为可能且费用较低。还公开了用于在当前系统(例如454、Solexa、S0LID)和下一代平台(例如单分子测 序)上测序的方法。qNPS提供了目标明确的或者有针对性的用于研究和诊断的测序能力,例如i)成本低/样本少;ii)高样本通量;iii)减少测序运行时间并简化数据分析;iv)允许靶标基因的高效测序而无来自其他基因(例如来自宿主的病原体的基因)的背景干扰;v)提供精确方式来测量基因表达、表达的单核苷酸多态性(SNP)、DNA SNP、DNA甲基化、rRNA、miRNA、突变等的特征集,这些可用作生物标记;vi)使得能够从所有样本类型测序,特别是从固定的例如福尔马林固定的组织或者固定的细胞内染色并分选的样本测序;以及vii)将被测序的样本的复杂程度从全基因大大简化到仅核酸酶保护探针或由所述探针保护的靶标序列。
动物组织和临床样本通常通过以石蜡包埋的福尔马林固定(FFPE)的组织的形式的固定进行保存。因此,组织基因表达和DNA的商业可行的诊断测定必须能够使用FFPE。此外,几百万这类样本在临床中心和医院存档,并且对应的治疗形式和临床结果是已知的。因此,FFPE样本代表了用于快速和高效鉴定诊断生物标记并藉此开发和验证预后和诊断测定的珍贵资源。用于研究和诊断应用的测序面临几个难题。所公开的定量核酸酶保护测序(qNPS)方法使用仅涉及裂解方式的核酸酶保护测定来产生用于测序的探针(例如DNA探针),其可被直接测序,或者可偶联于例如(i)基因特异性标签从而使得可鉴定所测量的基因序列而无需对所述核酸酶保护探针自身测序,和/或(ii)实验特异性标签——一种对于每个独立样本都是独特的标签,从而使得不同样本(例如来自不同患者或来自不同治疗或实验的样本)可合并到单次测序运行中但在测序后仍可被区分。qNPS提供了诸如以下的测序能力i)成本低/样本少;ii)高样本通量;iii)减少测序运行时间并简化数据分析;iv)允许靶标基因的高效测序而无非靶标基因或基因序列的背景干扰,包括例如无宿主组织基因组干扰的宿主组织的病原体基因或者移植组织的测序;v)提供精确方式来测量基因表达、表达的单核苷酸多态性(SNP)、DNA SNP、DNA甲基化、所有RNA包括miRNA、rRNA、突变或其他核苷酸靶标等的特征集,这些可用作生物标记;vi)使得能够从所有样本测序,所述样本包括特别是固定的组织,例如福尔马林固定的组织或者苏木素-伊红(H&E)染色的组织或者戊二醛固定的组织,如固定的细胞内染色并分选的细胞;以及Vii)将被测序的样本的复杂程度从全基因大大简化到仅核酸酶保护探针。在一个方面,本发明提供了用于当代测序仪例如454、Solid和Solexa测序仪,以及下一代单分子测序仪和以后的测序仪的探针和方法。虽然这些系统中许多具有允许多个样本并行测序的多个通道,但每次测序运行的成本为7000-9000美元,并且运行可能持续几天。单分子测序仪例如PacBio可实现100-200美元/样本的成本,但这在计入样本制备成本时仍旧昂贵。降低每样本成本并增加样本通量的方法是使用用于鉴定从每次实验中测序出的分子的可测序“标签”(称为“实验标签”),在多通道测序仪的每个通道内,在每次测序运行中测试多个样本。缩短所述序列读取长度可提高效率。仅对所述核酸酶保护探针测序而不测整个基因或基因片段,或者使用短的独特基因标签来鉴定所述靶标序列,实现了在测序被用于确定及定量基因水平或存在(但不鉴定基因序列的未知差异)的应用中的这一效率。基因标签的使用还简化了核酸酶保护探针设计,因为能进行测序的末端不必是独特的。然而,所述核酸酶保护探针或为所述探针所保护的靶标寡核苷酸可不使用基因标签而直接进行测序。在这种情况下,所述靶标序列中变异的存在一当其导致所述核酸酶 保护探针的SI切断或部分水解时(形成所产生的部分探针序列的图谱)或者当对所述靶标寡核苷酸的被保护部分进行测序时一也可被确定。还可设计所述方法以包括确定所述突变。这将在本文做进一步讨论。测序对于确定可使人易患某些疾病或者可警示有害药物代谢的基因组DNA的差异是非常有力的。然而,大量开发仍旧采用可用于诊断的测序方法以确定患者病症及对治疗的预测反应,所述方法要求例如评估临床相关样本类型的基因表达、miRNA水平、DNA甲基化状态和其他突变。基因测序公司在商业探索上尚未关注此领域来提供成本越来越低的基因组测序。从固定的(例如石蜡包埋的福尔马林固定(FFPE))的组织测序是有问题并困难的,尽管临床样本通常以FFPE组织的形式通过固定保存。因此,不管目的是确定假定的生物标记或者疾病及药物机制,还是开发并继而作为商业可行的组织基因表达和NDA的诊断测定的基础进行应用,所述测定都须能够使用FFPE。此外,几百万这类样本在临床中心和医院存档,并且FFPE供者的相应治疗形式和患者的临床结果是已知的。因此,FFPE及其他固定样本代表了用于快速高效鉴定药物靶标、疾病标记和通路以及诊断生物标记,并开发和验证预后和诊断测定,或者用于鉴定基因以及与疾病进展或药物活性有关的甲基化状态或突变表达变化的珍贵资源。对FFPE的DNA和RNA测序不仅在测序上有问题,而且对于基于阵列的方法和PCR也有问题,这很可能出于相同的原因一大部分的基因组DNA以及转录组RNA与组织交联。这种交联必须逆转并且必须回收靶标基因用于处理和分析。从FFPE回收的总RNA通常是部分降解的,不管是由于固定还是由于从FFPE提取RNA的过程。在研究环境中,降解太多以至于无法分析的样本可被简单地丢弃;但在诊断环境下,丢弃患者的样本是不允许的。因此,尽管测序的效力是被认识到的,然而在研究环境下或特别是在诊断环境下测序在FFPE的应用面临相当大的挑战。从研究角度而言,福尔马林固定的石蜡包埋的(FFPE)组织的信息内容仍旧锁在大批归档的这些样本中,等待精确且简单的分析方法。所有上述内容适用于所有核酸——DNA、RNA、tRNA、rRNA、miRNA等——以及那些序列内的突变。
测序应用面对的另一难题是每样本的成本。目前,每次测序运行可花费7000-10000美元。不管是需要对不同的患者样本测序,还是需要对来自不同实验的样本测序,各个样本分别测试(即使在一个设备(例如454或Solexa)的各个通道中测试不同的样本),每样本成本约为1000美元。本申请公开的发明提供了使用连接于每分子的实验标签,将不同的实验或患者样本合并在同一设备通道内的单次运行中的能力。这些标签被测序以独特地分别识别出被合并为单个测序样本的来自各单个实验或患者样本的所有分子。例如,通过将100个患者的样本(来自每患者样本的qNPS产物,各自以不同的独特实验标签标记)合并在单次例如3天的运行中,每样本的测序成本仅为约10美元。以测量100基因/样本的该水平成本,诊断测试以及常规实验或筛选测定即使在加上处理样本(例如采集样本、处理样本等)的成本后也是容易接受的。使用实验标签不仅降低每样本成本,而且它们可实现高样本通量,例如,通过使100或1000不同实验在单个通道内单次运行中被测序。例如,每通道合并100个样本,8000个样本可在8通道测序仪的单次运行中被测试。这可实现,例如,覆盖许多基因靶标/样本的高通量筛选应用。 qNPS方法的另一优点是其产生的简化的数据分析。由于仅靶标分子与所述核酸酶保护探针杂交,样本中其余的基因组DNA和RNA要么被破坏要么不能测序(例如,由于不具有连接在其上的测序衔接体分子),仅留下定量的核酸酶保护探针组或其保护的要测序的靶标寡核苷酸。由于这些探针和靶标的序列是已知的,因此参比序列数据库仅需由这些序列而非整个基因组组成。此外,如果常规的基因标识标签组被纳入被测序的NPP加合物中,那么测序信息的解卷积会进一步简化。本质上,序列分析可简化为“数”每个识别的已知序列或合成核酸酶保护探针的部分序列以及生成的可测序加合物或所述靶标寡核苷酸的数量,以及确定所述靶标寡核苷酸的序列的任何差异。此方法的另一优点是可对稀少的分子测序,或者例如可由宿主组织对例如来自病原体的靶标分子测序而不需繁重地对宿主基因组测序。同样重要的,当测序用于定量测量表达基因的水平时,重要的是能够测量以数千拷贝/细胞的水平表达的基因,以及以每细胞仅一个拷贝的水平被测量的基因。通过消除全基因组的背景,并仅关注目的靶标基因,并实际上通过将所述靶标基因本身缩短为较短序列(例如50个碱基的所述核酸酶保护探针),或者缩短为甚至更短的基因标识标签,提高测序的效率以及扩大丰度极为不同的测量基因的动态范围。仅对所述核酸酶保护探针测序或使用基因标识标签还可减少读取时间,使得可快得多地获得测序结果。此外,由于qNPS方法利用样本的裂解,并且不需要提取或反转录(例如对于基因表达),因此其可完全并简单地自动化。这对于高通量筛选是必需的,并且对于诊断测定或常规实验室测定也是有利的。此外,裂解的样本含有所有靶标分子,例如所有mRNA和所有miRNA。提取方法经常丢失mRNA和miRNA的一种或另一种的一部分,或者需要将RNA与DNA分离。需要明确的是,qNPS可在任何样本上进行,包括(例如)纯化的RNA、miRNA、DNA或cDNA。所有类型的靶标分子均可通过qNPS测量。实例是DNA、DNA单核苷酸多态性(SNP)、甲基化的DNA水平、mRNA表达、mRNASNP、miRNA水平、rRNA水平、siRNA、tRNA、基因融合或其他突变、蛋白结合的DNA或RNA,以及cDNA等。可与设计后核酸酶保护探针之杂交的任何物质,——即使所述靶标分子自身从未被测序并且通常大多数优选被破坏,——均可通过测序来定量和识别。核酸酶保护探针可保护所述靶标分子不被核酸酶作用以进行测序,并且基因标签和实验标签可连接于靶标分子而非核酸酶保护探针。在两者中的任一种情况下,如NPP —样,之后任选地所述靶标分子可有可无。测序本文使用的“测序”是指确定无支链的生物多聚体的一级结构(或一级序列)。测序结果是称为序列的符号线性图示,其简明地总结了被测序分子例如多核苷酸或多肽的原子水平结构的大部分信息。当分子是多核苷酸例如RNA或DNA时,测序可用于获得分子在核苷酸水平上的信息,然后所述信息可用于解密关于所述分子自身和/或由其编码的多肽的多种二级信息。当所述多核苷酸是RNA分子时,由于所述分子不稳定及其易于被核酸酶(例如RNA 酶)降解,通常优选首先将样本反转录以产生DNA片段,然后可通过本文所述的任意方法测序。这仍是本发明的一个可选实施方案。然而,qNPS避免了对反转录的需要,而是通过杂交和核酸酶活性将所述靶标RNA序列转化为互补DNA探针序列。如本领域理解的,有时需要对RNA分子而非编码RNA的基因序列测序,因为RNA分子不一定与其DNA模板同线性。并且某些生物体本身就是RNA,例如RNA病毒。例如,内含子切除和剪接是导致所述两种多核苷酸之间的非线性的两个事件。在本发明的其他实施方案中,可使用本领域已知的其他方法来分析细胞或组织的全转录组。任何测序方法均可用于本发明。DNA测序是确定给定DNA片段的核苷酸顺序的方法。到目前为止,已使用链终止方法(由Frederick Sanger开发)进行大多数DNA测序。此技术利用使用修饰的核苷酸底物的DNA合成反应的序列特异性终止。在链终止物测序中,通过使用在模板DNA上的特异位点与所述模板互补的短的寡核苷酸“引物”在所述位点处引发延伸。使用复制DNA的酶一DNA聚合酶一来延伸寡核苷酸引物。与所述引物和DNA聚合酶一起,还包含四种脱氧核苷酸碱基(DNA构件),以及低浓度的链终止核苷酸(最常见为双脱氧核苷酸)。通过DNA聚合酶有限引入所述链终止核苷酸产生仅在使用特定核苷酸的位置处终止的一系列相关DNA片段。然后,在平板聚丙烯酰胺凝胶上,或者现在更常用的,在充满粘性聚合物的狭窄的玻璃管(毛细管)内,通过电泳按大小分离所述片段。标记引物的另一方法是标记终止物,通常称为“染料终止物测序”。此方法的主要优点是可在单个反应中进行完全测序组,而不是引物标记方法所需要的四个反应。这通过分别以不同荧光染料一其在不同的波长下发出荧光一标记所述双脱氧核苷酸链终止物的每一种来实现。此方法较所述染料引物方法更加容易、经济和快速。焦磷酸测序已被例如Biotage (用于低通量测序)和454Life Sciences (用于高通量测序)商业化。后一个平台可用单个机器在7小时运行中大致测100兆碱基。在基于阵列的方法(被454Life Sciences商业化)中,单链DNA与小珠退火并通过EmPCR扩增。然后,将这些DNA结合的小珠连同在ATP的存在下产生光的酶置于纤维光学芯片上的孔中。当将游离核苷酸从此芯片上洗下时,当核苷酸与其互补碱基对结合时产生ATP,随之产生光。加入一种(或多种)核苷酸导致产生光信号的反应,所述光信号为设备中的CCD照相机所记录。信号强度与纳入单核苷酸流中的核苷酸的数量(例如同聚物延伸长度)成比例。目前的测序仪(SoleXa、454、Solid)将靶标序列捕捉到测序芯片或小珠上,扩增后测序。下一代单分子测序在捕捉后不进行扩增。使用衔接体序列或Poly A尾进行捕捉。或者,可无捕捉步骤。取而代之的是,(例如)捕捉的聚合酶可用于捕捉经过的寡核苷酸并对其测序。454或Solexa的测序通常涉及文库制备,所述文库制备通过DNA的随机片段化,继而体外连接常用衔接体序列而实现。对于qNPS,DNA随机片段化的步骤可被绕过,并且衔接体序列可与核酸酶保护探针,或者核酸酶保护探针的基因标签或实验标签体外连接。Shendure and Ji (2008)综述了测序方法,并且随后还简单总结了所述454和Solexa系统。对于454和Solexa,分别使用乳液PCR或桥式PCR产生克隆聚集扩增子用作测序特征。这些方法的共同点是,来自任何给定的单文库分子的PCR扩增子最终空间聚集到平面基板上的单一位置(Solexa,原位polony,桥式PCR),或到微米级小珠的表面(454,乳液PCR),所述 小珠可回收并排成阵列(乳液PCR)。所述测序过程本身由酶驱动生物化学和基于成像的数据采集的交替循环构成。这些平台依赖于借助合成的测序,即引发的模板的连续延伸。酶辨识和成像的连续迭代用于为每个阵列特征建立连续的测序读取结果。数据通过每个循环(例如,通过聚合酶引入荧光标记的核苷酸)的全阵列成像采集。对于454,测序引物与通用衔接体在适当的位置和方向杂交,紧邻未知序列的起始或qNPS可测序加合物例如核酸酶保护探针或者基因或实验标签。测序通过焦磷酸测序进行。将携带扩增子的小珠与嗜热脂肪芽孢杆菌(Bacillus stearothermophilus, Bst)聚合酶和单链结合蛋白一起预孵育,然后沉积在皮升级孔的微阵列中,每孔一个小珠,使此生物化学兼容基于阵列的测序。还加入了更小的小珠,携带固定化酶也是焦磷酸测序(ATP硫酸化酶和萤光素酶)所需要的。在测序过程中,半有序阵列的一侧用作流动槽(flow cell),以引入和除去测序试剂。另一侧与用于基于CCD的信号检测的光学纤维束连接。在每个循环中,引入单一种类的未标记的核苷酸。对于这种引入导致纳入的测序,焦磷酸借助ATP硫酸化酶和萤光素酶释放,对于特异性阵列坐标产生由CCD检测的突发光。经过多个循环,检测到的纳入事件的模式揭示了各个小珠代表的模板序列。对于Solexa,扩增的测序特征通过桥式PCR产生。正向和反向PCR引物均通过柔性接头连接于固体基质,从而在扩增过程中从任何单一模板分子产生的所有扩增子保持固定并聚集到阵列上的单一物理位置。所述桥式PCR在依赖于Bst聚合酶的延伸与甲酰胺变性的交替循环方面有些非常规。所产生的“簇(cluster)”各自由约1000个克隆扩增子构成。几百万个簇在单流动槽上的八个独立“泳道”的每一个“泳道”内可被扩增成可辨别位置(从而可在相同设备运行中平行进行8个独立实验的测序)。在簇产生后,扩增子是线性化的,并且测序引物与目的区域侧翼的通用衔接体序列杂交。每循环的序列辨识(sequenceinterrogation)由使用修饰的DNA聚合酶和四种核苷酸的混合物的单碱基延伸构成。这些核苷酸是“可逆的终止物”,因为在3’羟基位置的化学可裂解部分只允许在每循环中发生单碱基纳入,并且四种荧光标记之一——也是化学可裂解的——对应每种核苷酸的身份。在四个通道中单碱基延伸并获得图像后,两基团均化学裂解用于下一循环。目前常规进行最长达36bp的读取长度。这决定了 qNPS加合物的目标长度(7个测序起始和实验标签碱基,10到15个喊基的通用捕捉序列2,以及5个基因标签喊基)。
其他测序方法正在或将要开发,本领域技术人员可以看到,qNPS探针、基因标签、实验标签和类似的可测序加合物(如下文讨论)将适用于这些系统上的测序。qNPSqNPS是与测序根本不同的方法,该方法使用定量的核酸酶保护测定以将组织裂解液中的不稳定的RNA或其他靶标分子(或纯化的RNA或DNA),甚至当交联时,化学计量地转化为稳定的单链DNA靶标(核酸酶保护探针),所述单链DNA靶标可在溶液中回收而无需捕捉或分离,所述回收利用核酸酶保护步骤并(视需要)用碱处理以将所述核酸酶保护探针与保护性靶标分子分离,并且对于RNA,水解所述RNA靶标。然后,核酸酶保护探针在SI核酸酶水解后剩余的量通过测序确定,所述测序可包括测序探针自身和检测所提到的部分探针序列。目前,这种核酸酶保护测定的产品(一般称为qNPA ,H. T. G.,Inc.,Tucson, AZ 85706)是使用高度敏感的基于阵列的读取结果测量的,从而提供了每个靶标基因的水平的度量。参见例如US6, 232,066、US 6,238,869、WO 2008-121927,其以引用的方式全文纳入本文。大量出版物还描述了 qNPA 的应用(Altar et al, 2208 and2009, Kris et al, Martel etal 2002 and 2004, Roberts et al, Rimsza et al, Sawada et al, and Seligmann et al)。qNPS测定可以以被设计成许多不同的方式,但都利用了这样的观念,即产生NPP,其经受核酸酶反应(例如,SI降解)作为被测序的中心加合物,或产生加合物,其部分或全部可被测序以特异性地识别和定量所述NPP或提到的剩余核酸酶保护探针序列,从而识别和定量所述靶标基因。所述方法还会识别靶标基因的一部分中的任何改变的存在,这是由核酸酶保护探针或者在靶向同一基因的多个核酸酶保护探针之间测量的。从用于qNPS测定的样本产生所述核酸酶保护探针(NPP)如图I所示进行,与公开的 qNPA 方法相似(Roberts et al, 2007;Martel et al2002 and 2004)。所述测定包含被设计成对每个不同的靶标特异的一种或多种不同的核酸酶保护探针。因此,100个基因的测量需要设计和合成100种不同的核酸酶保护探针(每个基因一种)或者数百种不同的NPP(每个基因数种)。这些NPP最优选由DNA构成,长度可为约10至约100或约200或更多碱基,但更优选20至75碱基,最优选20至50碱基。图I的步骤I示出了将裂解试剂和大大过量的核酸酶保护探针(NPP)加入样本。在此图中,只示出了一种靶标分子(RNA)和核酸酶保护探针,但一个RNA靶标分子被指示为与组织交联(由“X”指示),另一个为溶解形式。所述测定也可对提取(或纯化)的RNA或其他靶标分子进行。所述探针被设计成对所述靶标分子特异,具有类似的Tm但具有足够独特的序列,以允许所述探针通过测序区分,或支持基因标签结合的特异性杂交。优选将所述样本在约95°C或约105°C加热约10分钟以变性所述靶标分子,使其成为单链并可进行杂交。使用不同的变性溶液,此变性温度可以改变,只要温度和缓冲液组成的组合可导致单链靶标DNA或RNA的形成。然后,将所述样本在规定的温度孵育一段时间(例如,对于50-mer核酸酶保护探针,60° C下6小时)以允许探针与所述靶标分子杂交。加入一种核酸酶(例如,SI核酸酶)或核酸酶混合物并进行孵育(例如对于50-mer核酸酶保护探针,50°C下60分钟),在这段时间内核酸酶破坏所有多余的未 与靶标分子杂交(并因此是不受保护的)的核酸酶保护探针、样本中的所有非靶标分子(例如RNA或DNA)和所述靶标分子的突出单链区,并且视需要在不与所述靶标序列配对的碱基处切断所述探针,留下化学计量量的靶标分子/核酸酶保护探针双链(步骤2)或部分探针双链(其中存在提到的不配对)。见下文。在此图中,“X”代表由固定发生的靶标分子与组织的交联。所述核酸酶保护探针与所交联的靶标分子杂交而无需逆转交联。可以选择条件从而导致非配对碱基的单核苷酸差异不被切断,或者可使用仅将未配对碱基切断至杂交的核酸酶保护探针的末端的核酸酶,例如核酸外切酶。核酸酶处理后,所述探针仍可与交联的靶标分子序列联结。然而,在步骤3中加入碱基,并将所述样本加热到95°C。这离解了所述靶标分子/核酸酶保护探针二聚体,留下单链状态的核酸酶保护探针,对于RNA,还水解所述RNA靶标分子。对于qNPS,这一点后的步骤可能不同,取决于将如何测序所述核酸酶保护探针。由所述NPP形成的不同加合物在连续的图中示出。如果不使用基因标签或实验标签,那么所述探针可直接与适合所述测序系统的衔接体分子连接(或者可使用例如末端脱氧核糖核酸转移酶Tdt加上polyA尾巴),并用于测序(图2A)。图I (步骤4到8)和图2示出了在允许杂交的温度下为每种核酸酶保护探针加入过量的标签接头(并与之孵育)。基于标签接头的使用,可形成几种可能的可测序加合物。例如,可将标签接头的25个碱基设计成与一种特异的核酸酶保护探针的3’末端互补,从而将与该探针杂交(步骤4)。可设计标签接头的 其余部分,使其在加入过量的这些标签(图I步骤5)后杂交(并因此在所述核酸酶保护探针的3’端捕捉)基因标签序列(图2B)和/或(任选地)实验标签序列的通用(或实验特异序列)部分(图2C),或仅实验标签的通用(或特异)部分(图2D),然后在允许这些标签杂交所述标签接头的温度下孵育。注意这些步骤可组合或单独进行。对于测序仪在要测序的分子一端或每端需要衔接体捕捉序列的情况,所述标签接头可延伸所述核酸酶保护探针的全长,并进一步包括与所述(例如,5’)衔接体序列互补的序列。然而,更优选地,加入与核酸酶保护探针的5’端杂交并包含与5’衔接体序列互补的序列的第二衔接体接头(步骤6),然后再加入所述衔接体序列(步骤7)。在此相同情况下,所述基因标签或所述实验标签,无论哪一种作为3’端末端倒数第二序列,均可以用于测序的3’衔接体序列合成。在所述完整加合物杂交在一起后,可将所述序列使用例如T4DNA连接酶(或非酶化学法,如例如Pinoet al, Lutay et al, Schabarova et al 或 US 7033753 中所描述)连接在一起,如图 I (步骤8)和图2中角箭头所示,以形成完整可测序加合物。在此方法中,所有来自要测序的靶标RNA、DNA等的寡核苷酸都是合成的,通过杂交和(例如酶或非酶)连接装配,并通过衔接体序列或(例如酶)多聚腺苷酸化制备以捕捉到所述测序芯片上。虽然示出的可测序加合物包含所述NPP,然而本领域技术人员会看到,含标签接头的加合物也可制备为要测序的加合物(制备为所述可测序加合物),或者,如果不被破坏,所述靶标寡核苷酸可制备为可测序加合物。如果所述靶标寡核苷酸被测序或包含可测序加合物,那么所述NPP可包含非可测序组件,例如LNA、氨基酸、肽、肽核酸、适体等。可制备在两端均有衔接体的可测序加合物,从而将其切断(例如通过第二核酸酶反应),提供两个可测序加合物。有许多方法将poly-A (或poly-T)捕捉序列连接至所述可测序加合物。一种是酶法(例如,使用脱氧核苷酸转移酶,Tdt)。另一种是通过杂交和连接。第三种是简单通过合成到终止所述可测序加合物的3’寡核苷酸上。理想地,只有所述可测序加合物结合于所述测序介质,而副产物被除去。例如,图3或4中所示的衔接体序列可为poly-A,而清除可通过凝胶或核酸酶(例如SI)。对于核酸酶清除,所述保护性序列包含poly-T。使用实验标签是为了将一个样本与另一个区分开。步骤I到5将在对于每个样本的不同测定(例如微孔板的不同孔)内进行,但所述标签接头已被设计为还捕捉实验标签的通用序列(见图2C),并且所述实验标签(例如,还含有所述3’衔接体序列)将在步骤5后加入,然后进行步骤6-8,全部在区分不同实验或不同患者样本的不同反应容器进行。本领域技术人员可看到,对于各个实验标签能够合成不同的标签接头,所述标签接头包含所述特异性实验标签的互补序列,而不是加至各个实验标签的通用序列,将所述实验标签的长度缩短至恰好是所述实验特异性序列。在连接所述实验标签(或基因标签加实验标签)后,可合并不同的样本,因为实验标签的序列会确定测序的加合物来自哪个反应或来自哪个患者,因此对于凝胶纯化(或其他纯化方法或不需实际分离的清除),每次测序运行只需运行一个凝胶(或清除或纯化反应或过程)。用T4DNA连接酶的连接需要5’磷酸基才能工作。通常,合成的寡核苷酸无5’磷酸基,然而,可在合成过程中加入5’磷酸基。因此,如果合成所述衔接体接头和标签接头从而使其对接在一起,但没有5’磷酸基,它们将不会连接在一起,促进例如随后的清除。另一种向寡核苷酸加入磷酸基的方法(除合成以外)是使用T4多核苷酸激酶和ATP。可使用其他连接方法,包括非酶方法。然而,连接不是必需的步骤。在NPP与标签接头和标签杂交,或者如果作为核酸酶保护探针的一部分纳入的标签可为互补寡核苷酸所 保护,形成具有核酸酶抗性的或可纯化的复合物,不需要连接,因为所述标签已经纳入所述NPP并将反映NPP的量,并因此反映靶标DNA或RNA的量,并且将在测序时识别NPP,并因此识别靶标RNA/DNA,即便其在测序时与所述NPP分离。所有之前的步骤均为试剂添加和孵育,直至凝胶纯化或其他分离方法前没有分离(如果分离是必需的或想要的)。过量的每种试剂仍存在于反应混合物中(如图I所示的每种正在产生的加合物的左侧),以及不完全加合物例如标签接头与所述标签分子但不是所述核酸酶保护探针杂交的产物,或者所述衔接体分子与所述衔接体接头杂交的产物,但在复合物中也不包括所述核酸酶保护探针。在这一点上,有几个可能的后续步骤,但只示出了一个(凝胶纯化)。优选的下一步骤是在捕捉到所述测序珠或芯片上之前清除所述混合物。如果与所述核酸酶保护探针杂交的衔接体接头和标签接头的序列被几个碱基隔开(在加合物装配后通过酶法添加磷酸基的情况下),或者它们不被磷酸化(即使它们互相对接),那么它们不会连接在一起。因此,可将所有实验或患者样本的反应混合物合并在一起,加热或变性以形成单链寡核苷酸,并纯化可测序加合物,例如通过基于其可观更长长度的凝胶电泳。也可以使用本领域已知的或从本领域改进的进行清除的其他方式。图2B到2E示出了具有衔接体序列的加合物的制备。它们也可制备为不具有这些序列,但以一些其他形式捕捉到所述测序芯片上或具有用于测序的制剂。例如,取而代之的,可将Poly-A尾巴合成到所述可测序加合物的3’末端。如果需要互补链不是多聚腺苷酸化,那么可以封闭该序列的3’末端,例如通过合成具有3’氨基残基或具有3’碳(如C3)间隔区的寡核苷酸。这是使用合成序列而不是靶标本身或作为可测序加合物一部分的所述靶标的生物合成衍生物来制备可测序加合物的优点。一些测序系统可直接捕捉可测序加合物,例如通过连接的聚合酶或寡核苷酸结合部分,或者通过化学或电的或电化学方法,从而所述可测序加合物不需要特异性衔接体或捕捉序列或部分。清除所述测序反应产物的优选方法是例如通过再次使用SI核酸酶进行第二核酸酶消化。在一种情况下,在连接前加入将实验标签/衔接体序列,并且如果所述衔接体接头和标签接头被设计为彼此对接,其中之一的5’末端被磷酸化,并且加入3’互补实验标签/衔接体序列从而其可在与所述实验标签/3’衔接体序列杂交后连接于所述标签接头,那么含有核酸酶保护探针的加合物和所述接头/保护性互补序列均会(分别)连接在一起,当所述接头与所述核酸酶保护探针连接时,形成彼此杂交的两个完全加合物(图3A)。在导致所有比这两个加合物短的加合物解离的温度下以SI核酸酶处理将破坏所有其他种类(其中一些示于图3A),只留下含有所述核酸酶保护探针的可测序加合物以及所述接头加合物。一旦变性,只有具有合适的捕捉衔接体序列的加合物(所述核酸酶保护探针加合物)将被捕捉到所述测序芯片或小珠上,并且含有接头的加合物将被洗掉。这种“双SI”方法的优点是,直到所述加合物被捕捉到测序芯片或小株上之前没有分离步骤。图4A示出了形成所述可测序NPP加合物的不同方案,其中所述标签接头在与所述实验标签(ET)可变序列(VS)(在测序时唯一识别所述孔或实验的序列)互补的残基处含有肌苷,然后是与3’衔接体(3’Acomp)互补的序列。此相同的含肌苷接头可用于形成上述可测序加合物(图I和2),并且其中需要多聚腺苷酸化(而不是使用衔接体序列),或者其中使用凝胶纯化或其他分离或纯化方法。图4B示出了使用不需要连接并可通过合成制备的单个合成结合5’衔接体标签/标签接头/3’衔接体互补序列。在使用不需扩增的系统——例如Helic0s单分子测序方法——的情况下,可能需要连接poly-A尾巴。图4C和D示出了该方法的方案,其可以利用凝胶纯化进行清除(例如,在多聚腺苷酸化之前),或者如示出的在多聚腺苷酸化、捕捉和测序之前利用核酸酶步骤进行清除。在这两种情况下,由于NPP本身并不被测序,只需要标签接头来将合适的基因标签和实验标签与所述NPP杂交,从而它们可连接在一起。在核酸酶步骤后,通过酶法将poly-A尾巴合成到3’端上。这可导致poly-A尾巴合成到所述标签接头的3’端上,从而它也将被测序,或者如果所述标签接头的3’端被封闭,那么所述poly-A尾巴将仅合成到所述含有NPP的加合物上。在所述NPP以其全部或部分被测序以确定所述靶标基因的情况下,所述poly-A尾巴或衔接体(视需要)可以直接或通过所述实验标签和/或标签接头连接于所述NPP,以实现其测序。在NPP与靶标(例如)DNA杂交并且所述系统利用所述NPP的直接测序的情况下,所述NPP保护的靶标序列(例如DNA)也可被测序,并被修饰以在与NPP相同的时间并以与NPP相同的方式测序。同样,被构造为形成含有所述NPP的可测序加合物的任何互补接头,可以以平行的方式处理,也可以转换成可测序加合物。在这些情况下,两个互补序列将被检测、鉴定和计数,对所述方法提供一定水平的冗余。本领域技术人员可以想出在测序之前清除所述反应混合物的其他方法,例如使用 凝胶纯化或生物素/抗生物素蛋白捕捉和释放或毛细管电泳或大量分离或清除方法的任一种。例如,核酸酶保护探针可被生物素化或其它半抗原结合并被捕捉到抗生物素蛋白或抗半抗原包被的小珠或表面,洗涤,然后释放以进行测序。同样,连接的核酸酶保护探针加合物可被捕捉到互补的寡核苷酸上,洗涤,然后释放以进行测序。所述捕捉寡核苷酸不需要具有特别的特异性,因为所述qNPS过程消除了大部分的基因组或转录组,仅留下已与靶标杂交的NPP,并且因为特异性将在测序水平上被确定。本领域技术人员还可看到,可清除和测序所述接头复合物,而不是含有所述核酸酶保护探针的加合物。因此,所述可测序加合物可以是与所述NPP杂交的加合物,或所述NPP衍生的加合物。这些加合物的两个实例示于图5,虽然也可配置其他加合物。图5A示出了使用与之前的图和讨论中相同的NPP的使用,但在这种情况下,加入含有所述3’衔接体、所述NPP的互补序列、以及位于通用序列(其反过来捕捉所述实验标签接头)末端的突出基因标签序列的寡核苷酸。此实验标签接头反过来捕捉还含有所述5’衔接体序列的实验标签。如果使用核酸酶清除,那么需要加入保护性5’衔接体序列探针。在需要poly-A尾巴进行测序的情况下,所述衔接体序列不是必需的,并且不需包括在内。图5B示出了 3’到5’的核酸酶保护探针的使用。此结构可用于前图示出的或在之前的讨论中描述的以及后面提到的加合物的任一种。可测序寡核苷酸(如接头)与所述NPP杂交的部分,而不是使用基因标签来确定基因。本领域技术人员会看到,存在关于探针的这些排布的多种变型和组合,无论是否形成含有所述NPP的用于测序的加合物。可测序加合物包括经历核酸酶反应仍然存在的产物,或者衍生自所述产物或被用作模板。可测序加合物包括经历核酸酶反应仍然存在并且是第二核酸酶反应产物的产物,或者衍生自所述产物或被用作模板。可测序加合物是一个或多个核酸酶反应的产物或衍生自所述产物。包含所述可测序加合物或用于装配所述可测序加合物的合成寡核苷酸可被制备为允许或不允许酶或非酶修饰,例如连接或添加Poly-A序列。它们可以含有天然或非天然的核苷酸(例如,锁核酸或LNA或者肽核酸或PNA等)。它们可在测序前在溶液中或表面 上进行扩增,或者扩增可在所述核酸酶保护步骤之前进行。对于在454或Solexa平台上测序,所述可测序加合物必须首先被捕捉和扩增。这通常需要聚合酶反应。用于qNPS的常用裂解缓冲液是一种被设计成变性核酸酶以防止RNA破坏、促进杂交,同时允许SI活性的裂解缓冲液。这种类型的溶液可抑制聚合酶活性,从而抑制扩增,除非先洗涤芯片。洗涤也可用于除去不具有捕捉衔接体序列的核苷酸。在测序利用Poly-A尾巴进行捕捉的情况下,可在清除后使用末端脱氧核苷酸转移酶(Tdt)—其在3’端延伸所述Poly-A残基一合成。为防止含有接头的加合物或不打算测序的加合物的3’末端被poly-A尾巴延伸,所述标签接头的3’残基可被不支持多聚腺苷酸化的残基或修饰残基修饰(图4C和4D)。本领域技术人员可看到,反向测序可以使用合适设计的含有所述核酸酶保护探针和其他含信息序列的加合物;或者,所述核酸酶保护探针的互补序列(某些情况下称为“接头”)以及加合物构建体,可以代替含有核酸酶保护探针的加合物被测序,只要所述互补加合物被合适地设计(例如,参见图5)或者例如如在本申请中对含有核酸酶保护探针的加合物所描述的。于95°C在(例如qNPA)裂解缓冲液中孵育使得RNA可进行杂交,虽然此裂解产物的PCR可导致DNA扩增,表明所述裂解产物中可能有基因组DNA,只是对于NPP杂交没有充分变性。于105° C孵育使基因组DNA可进行NPP探针杂交。105° C孵育后进行SI (核酸酶)处理会破坏所有未杂交的DNA以及未杂交的RNA和NPP。因为通过使用合适设计的、具有与NPP的3’或5’序列互补的序列的接头探针,衔接体与所述单链NPP杂交并连接,因此未被SI水解的任何(例如,双链)DNA (或相关RNA)不应具有与其连接的衔接体,并因此不会被捕捉到454和Solexa型测序仪使用的测序小珠或芯片上,并不会被测序。在所述NPP互补寡核苷酸被测序的情况下,至少一种衔接体可被直接纳入作为所述序列的一部分,因此该衔接体序列不可能与有可能未被SI水解的DNA连接。在凝胶(或其他)纯化的情况下,所述DNA可以与连接的加合物分离,从而在测序之前被除去。对于将Poly-A尾巴加入实验标签(或者在不使用实验标签的情况下加入基因标签,或在不使用实验标签或基因标签的情况下加入NPP)的单分子测序,任何DNA也可被多聚腺苷酸化,除非它在使用测序加合物的凝胶纯化时被先分离(多聚腺苷酸化之前),或者在例如于例如105° C使用裂解,然后进行NPP杂交,然后在合适的条件下进行核酸酶(如SI)步骤的情况下被先破坏。在这个方案中,所述NPP可靶向mRNA的剪接点从而没有DNA (其可能干扰mRNA的测量)会被测量。也可测量miRNA (或siRNA),虽然在这种情况下所述NPP的长度将仅为(例如)约22碱基以匹配所述miRNA的长度。通过在已经或尚未发生甲基化的位点形成碱基错配,并且通过恰当地使用互补肌苷残基,通过使用其他核酸酶或限制性酶来切断所述错配的残基,可以测量DNA和表达的SNP以及DNA甲基化。这些加合物(为所述NPP所保护)的直接测序也是可能的。例如,DNA SNP可通过以下方式被测序使用可能存在SNP的序列的NPP,在所述单碱基错配不被切断的条件下用SI处理,然后通过在高于杂交Tm的温度下孵育继而加入大大过量的与所述靶标DNA杂交并允许合适地加入衔接体的接头而使仍然存在的DNA靶标序列可以与所述NPP解离(所离解的NPP会竞争性地防止大大过量的接头引起的重新解离)等,以形成包括所述靶标DNA自身及(视需要)实验标签的可测序加合物。在此 方法的改进中,所述NPP可含有与被保护序列内的SNP位点或多SNP或突变位点互补的肌苷以确保第一核酸酶步骤靶标DNA被保护,并且同样所述接头寡核苷酸可含有肌苷以在使用核酸酶清除步骤的情况下确保保护。或者,可使用具有可能突变的碱基的NPP探针。此夕卜,当野生型序列NPP在所述SNP或突变错配处被核酸酶切断时,可处理并测序所述NPP的具体序列以确定所述突变的存在情况和位置。在所述NPP用于在任何错配均不被切断或水解(例如通过使用核酸外切酶,或在较低严格条件下使用核酸内切酶,或通过使用需要多个相邻错配进行切断的核酸酶)的条件下选择含有突变的靶标(例如DNA)区域的情况下,可处理并测序所述靶标(例如DNA)以精确确定所述突变。也可纳入非靶标寡核苷酸序列,所述非靶标寡核苷酸序列可用作允许捕捉到所述测序芯片上的衔接体,或者用作在合成时直接纳入所述NPP的基因标签或实验标签。此非靶标序列不会与靶标寡核苷酸杂交,并通常会被核酸酶切断。然而,如果使所述NPP的这种非靶标序列与互补寡核苷酸杂交(在将所述NPP加入含有靶标寡核苷酸的样本之前、同时或之后,但在核酸酶步骤之前),那么当以核酸酶处理时,由于每个碱基均与互补碱基杂交,所述非靶标NPP序列将被保护并且所述NPP将保持完整。可改变条件,从而即使在所述核酸靶标序列与所述NPP的非靶标序列之间有单个未杂交的碱基,这也是成立的。此方法可产生可直接测序的NPP加合物,其连接有所需要的衔接体序列,可被捕捉到所述测序芯片上并在不使用任何连接反应的情况下测序。本领域技术人员可设计方法以在测序前清除所述反应,以除去短的非靶标序列/互补序列双链。例如,可在碱中加热核酸酶处理后样本以解离所述双链,然后加入过量的与所述NPP的非靶标序列和所述核酸靶标特异性序列的一部分(例如前25个碱基)互补的寡核苷酸。因此,如果在此较长的寡核苷酸可杂交而较短的非靶标序列互补寡核苷酸不可杂交的温度下进行杂交,那么就得到在第二核酸酶反应后将只含有已与核酸靶标杂交的NPP的配制剂。然后,可将此配制剂加热以使其解离,然后加至其可通过其衔接体序列被捕捉并被测序的测序芯片。在需要更高敏感性的情况下,可扩增所述靶标寡核苷酸或由其衍生的产物,或者先对所述NPP产物进行PCR或其他形式的酶扩增。然后形成的产物可准备以与所述未扩增的NPP产物相同的方法进行测序,或者在扩增过程中,可纳入所述基因标签和/或实验标签和/或衔接体序列,作为例如所述引物和延伸构建体的一部分。即使当不需扩增时,也可进行一个或两个循环的PCR或酶反应以连接基因标签和/或实验标签和/或衔接体。由所述NPP通过后续生物合成步骤产生的此加合物也可通过杂交反应例如对于产生所述可测序NPP加合物或与所述NPP互补的加合物所描述的那些杂交反应来完成。清除可通过凝胶或其他纯化方法,或在充分保护的情况下,通过后续SI (或其他核酸酶)反应或本领域已知的或从本领域改进的其他方式。另一类型的NPP是环形探针,类似于挂锁(Padlock) (PadP)或环形DNA探针(例如类似于Baner et al or Prins et al描述的构建体)。PadP可测序加合物示于图9。此PadP构建体可被构建为含有衔接体和标签,其在探针与样本中的靶标杂交后使用(例如)核酸外切酶时不会被切断。例如,所述PadP探针可被合成为含有5’衔接体,以及位于其3’端的与所述靶标杂交的约10到约30或约50或约100或约200个碱基。可存在间隔区,然后是限制性核酸酶位点,然后是5’基因标签,然后是与所述靶标杂交的PadP探针的剩余部分(另外的约10、约30、约50、约100、约200个碱基),在其5’端磷酸化以支持连接。因此, 当与靶标杂交(步骤I)时,所述PadP的探针的两部分可连接以形成环形DNA加合物。通过循环,这可被扩增(步骤2)。在连接后,可将混合物加热至约95° C以使所述环形探针与所述靶标(例如RNA)解离,然后降低温度从而过量的探针可与在此情况下用作扩增模板的靶标(例如RNA)重新杂交,然后在连接后再次升高温度,进行约30个循环以产生约30个拷贝的环形探针/靶标模板RNA。在步骤3中,使用核酸外切酶来破坏所有线性DNA (以及例如靶标RNA),包括过量的PadP,只留下所述环形PadP探针。步骤4视需要开始以所述实验标签进行标记的过程,首先以限制性酶处理以打开所述环形DNA探针,然后使用标签接头来杂交并连接所述实验标签。已经描述了用于形成所述PadP探针的实验条件。NPP构建体可被设计为可直接被测序,一种称为“直接核酸酶探针测序”(DNPS)的方法。一种这样的构建体示于图I。在所述核酸酶保护探针被直接测序并且使用加入用于测序的衔接体序列或加入Poly-A尾巴或其他捕捉分子的目前商业方法的情况下,所述SI产物可被直接测序。然而,当使用接头将加合物连接在一起时,由于加入衔接体、基因标签、实验标签或其他序列,过量的标签探针、衔接体或接头,可能需要在测序前在“清除”步骤中消除。可以使用数种策略。最简单的策略是在低于将被测序的连接加合物(例如,探针、检测接头、实验标签、基因标签和(视需要)衔接体的复合体)的解链温度(Tm)、但高于所述接头与复合于所述加合物的组分的接头但不复合于所述完全加合物本身的解链温度的温度下孵育。以这种方式,它们解链分离,并且连同未杂交的接头、实验和基因标签被SI (或其他核酸酶或核酸酶混合物)破坏。然后,破坏(例如)SI活性,例如通过加热到95° C或通过酶法例如使用蛋白酶K或使用抑制剂。这种“两阶段”核酸酶保护方法可形成这样的方案,即直至捕捉到所述测序表面上的时点,没有任何分离步骤只有加入过程。可进行通过测序核酸酶保护探针来测序基因并确定丰度,而无需测序整个核酸酶保护探针。如果选择所述核酸酶保护探针的3’端使得末端2到约7或约25个碱基的组合对每个测量的基因呈现唯一的序列,那么这是对于确定所述基因需要测序的全部核酸酶保护探针,并且通过计数被测序的这类加合物的数量,可确定样本中每种基因的量。实验标签(对每个实验不同的标签)可附加于所述核酸酶保护探针以使得多个实验的qNPA产物可合并在一起进行测序。
如何测序和量化剪接点、外显子和突变的实例,以及完成所述核酸酶保护步骤后的结果示于图6A。如何测序单核苷酸多态性(SNP)和甲基化DNA的实例示于图6B。这些单碱基修饰是利用其他酶例如RNase的活性来检测表达的SNP,或者利用亚硫酸氢盐处理继而尿嘧啶DNA糖基化酶检测甲基化DNA位点的结合效应而检测的。本领域技术人员可以看出如何类似地通过测序检测和测量DNA SNP。在每种情况下,设计一种对照序列,对靶标基因或所述靶标基因的所有变体都是共同的,还有对(可能突变或甲基化的)目的位点具有特异性的探针。探针还可被设计为与特异性剪接点、可缺失的特异性外显子或特异性基因融合体杂交。红色的“x”表示探针序列未被保护并因此被例如SI降解,或者其中所述靶标序列会被切断并且因此所述核酸酶保护探针会解离并被SI破坏。在只有单个错配碱基的情况下,可能需要向例如SI中加入其他酶例如RNase,或需要使用切断所述单碱基的不同酶。本领域技术人员会看出,存在可单独使用或组合来进行这些切断的大量酶、修饰酶或具有类似活性的分子。所述核酸酶保护探针可通过(使用本发明他处所述的方法)加入实验 标签而被进一步修饰,以使得来自多个实验的样本可合并到单次测序运行中。所述测序衔接体可以连接到所述核酸酶保护探针上(或在使用实验标签的情况下,如果所述实验标签不是以所述衔接体序列在其3’端自身合成的,也可连接至实验标签)。可将所述核酸酶保护探针的5’端在其合成过程中磷酸化,然后可使用接头,所述接头与所述核酸酶保护探针的5’碱基(例如,25个碱基)杂交并具有与5’衔接体序列杂交的互补序列,从而(例如,使用T4DNA连接酶)使所述衔接体附加于所述核酸酶保护探针的5’端(在这里它们可连接在一起)。或者,加入ATP并使用合适的DNA连接酶(例如,T4DNA连接酶)可自磷酸化并连接。对于3’衔接体,所述衔接体自身可被磷酸化,并且所述接头被设计为与所述核酸酶保护探针的3’碱基(例如,25个碱基)杂交并包含所述3’衔接体的互补序列,从而其以使其可连接到所述核酸酶保护探针上的方式杂交并添加至所述探针的3’端。在合适的条件下,也可以使用T4多核苷酸激酶和ATP使5’端磷酸化,然后使用T4DNA连接酶连接。在其他合适的条件下,T4DNA连接酶可自磷酸化,然后连接。在需要将Poly A尾巴加至所述核酸酶保护探针的3’端的情况下,可以使用Tdt将其加入。在一种优选方法中,存在一种(或多种)核酸酶保护探针测量靶标基因的序列,所述基因在野生型和突变体之间是同源的,或者在DNA甲基化被测量的情况下不进行甲基化,然后针对所述突变或DNA甲基化的位点设计第二探针。这样可确定总水平以及突变比例。也可简单地通过制备针对所述靶标基因的多个区域的探针然后从qNPA反应测序所述探针而使用qNPS来检测未知的突变。所述探针可纳入包括实验标签的构建体中,衔接体序列可纳入用于测序的加合物中。可以利用一种酶或酶的组合的核酸酶活性来切断错配的碱基,并视需要检测SNP。在那些碱基的位置接近所述核酸酶保护探针的末端的情况下,在切断温度下整个短链会解离开并被破坏,留下变短的探针序列。如果接近所述探针的中部,那么可常规地设计条件从而所有序列将解链解离开并被破坏。或者,如果SNP或多个错配碱基位于近所述核酸酶保护探针的中间区域,可使用这样的条件所述核酸酶保护探针被切断但不解离开,那么测序将识别所述特异性突变位点。通过使用针对相同基因的多个探针,可比较所述探针数量来确定突变在哪里发生。在这种情况下,可以以目前在各自平台上测序所使用的方式进行所需衔接体的连接。剩余的所述核酸酶保护探针末端的序列不会知晓,因此不能设计衔接体接头序列。或者,可使用带有核酸酶保护探针末端杂交肌苷序列
的衔接体-此时不必知道所述核酸酶保护探针的末端的具体组成。或者,可如他处所述
进行所述衔接体修饰过程。所述衔接体将被合适地连接至完整的NPP,并且因此仅这些会被测序。在所有给出的实例中,所述衔接体序列、poly-A序列或完全根据需要的其他所需的捕捉分子可以使用本领域已知的方法加至所述NP或具有基因标签或实验标签的加合物,或者不使用这些实例中多种情况下描述的接头和方法进行测序。对于单分子测序仪,可测序带或不带实验标签和基因标签的核酸酶保护探针或连接有3’捕捉序列的探针,而根本不需要衔接体序列或仅在3’端具有衔接体(或捕捉)序列。对于实验标识标签和基因标识标签的连接,连接步骤可能是必需的(例如,使用T4DNA连接酶),然后是清除,然后在必要时(例如,对于下一代测序仪如Helicos),可能需要只连接一个衔接体序列(例如,在3’端),或者连接或合成poly A尾巴,使用(例如)末端脱氧核苷酸转移酶(Tdt)在poly A尾巴的3’端延伸,或者连接另一种通用捕捉序列或分子以允许被捕捉到测序芯片上。在本发明的此处和他处描述的构建体均可被制备以在这些设备上进行测序。图2、4和5示出了为在所述测序仪的同一运行/通道内的多路实验,以及为使用基因标识标签来减少所需的读取长度而设计的构建体。对于标签的连接,在进行核酸酶保护步骤3-5后进行连接步骤是必需的(例如,使用T4DNA连接酶(lygase)),然后是清除,然后在必要时(例如对于下一代测序仪如Helicos),使用末端脱氧核苷酸转移酶(Tdt)在polyA尾巴的3’端延伸以允许被捕捉到测序芯片或合适的衔接体分子上。要注意,如果所述裂 解缓冲液抑制这些步骤的任一个,那么可使用允许逆转录和PCR的稀释缓冲液。基于阵列的测定的接头检测可用于将实验标签连接至所述核酸酶保护探针。然后,使用T4DNA连接酶将所述探针和所述标签连接在一起。还可纳入基因标识标签,有可能将所述序列读取降低至10个碱基(正好所述两个标签)。或者,通过选择靶标基因序列区域从而使所述核酸酶保护探针的3’端对每个基因是独特的(例如,5-7个3’末端碱基的序列是独特的),仅此区域必须被测序以确定每个测量的基因。可将不与靶标DNA或RNA互补的标签直接纳入所述NPP (例如通过合成),并在核酸酶步骤中由互补的寡核苷酸序列保护,因此其不会被水解,或者其可由耐核酸酶水解但仍可测序的序列构成。通过将所述标签测序寡核苷酸与所述靶标序列对接起来,可防止核酸酶切断,只要在所述NPP构建体中没有未配对的碱基。通过测序进行qNPA测定的检测步骤的优点包括测序而无需例如从固相例如组织中提取;避免对多个样本的每一个分别进行检测操作——全部均可在一个溶液中同时进行;避免例如由于使用高浓度的检测接头引起的探针之间的弱交叉反应;增强SNP测定;等
坐寸o在一个实施方案中,本发明提供以下方面方面I :可测序加合物不含有所述靶标寡核苷酸。方面2 :可测序加合物不含有所述靶标寡核苷酸,也不是使用生物合成步骤形成。方面3 :可测序加合物包括经历核酸酶反应仍然存在的产物,或者衍生自所述产物或用作所述产物的模板。方面4 :可测序加合物包括经历核酸酶反应仍然存在并且是第二核酸酶反应的产物,或者衍生自所述产物或用作所述产物的模板。方面5 :可测序加合物是一个或多个核酸酶反应的产物或衍生自所述产物。方面6 :可测序加合物通过使用合成寡核苷酸形成。方面7 :可测序加合物通过使用合成寡核苷酸和杂交反应形成。方面8 :如7中的可测序加合物,还由使用包含所述可测序加合物的连接反应形成,或用于装配所述可测序加合物。方面9 :包含所述可测序加合物或用于装配所述可测序加合物,基于NPP装配或通过纳入NPP的合成寡核苷酸。方面10 :包含所述可测序加合物或用于装配所述可测序加合物的合成寡核苷酸,被制备为允许或不允许酶修饰,例如连接或添加Poly-A序列,并且包含或不含非天然核苷 酸(例如锁核酸或肽核酸等)。方面11 :含有NPP或基于NPP装配的可测序加合物在测序前在溶液中或在表面上被扩增。方面12 :含有这样的序列的可测序加合物,即该序列在产生一定量的可测序加合物后被连接,所述量可定量地反映靶标寡核苷酸的量,该靶标寡核苷酸的序列(例如基因标签)可用于识别所述加合物并因此识别所靶标寡核苷酸。方面13 :含有这样的序列的可测序加合物,即该序列在产生一定量的可测序加合物后被连接,所述量可定量地反映靶标寡核苷酸的量,(其序列,例如实验标签)可用于确定含有所述靶标寡核苷酸的反应,并因此允许合并多个反应并同时测序。


本发明的多个特征和随之而来的优点将被更充分地理解,当结合附图考虑时所述特征和优点将被更好地理解,所述附图中几幅图中类似的标识符号表示相同或相似的部分,其中图I提供从用于定量核酸酶保护测序(qNPS)测定的样本产生所述核酸酶保护探针(NPP)的示意简图。示出了使用接头(绿色)将基因标签(或实验标签)与任意所需的受体序列(蓝色)连接,以及使用另外的接头(紫色)将衔接体(红色)加至所述NPP的另一端,最后进行连接。在每种情况下,不仅形成可测序加合物,而且有过量的接头、衔接体和标签序列积聚。示出了使用凝胶纯化来将所述可测序加合物与其他短序列分离。图2示出了处理NPP以进行测序。图2A示出了在后续处理中的两种可能,包括PoIy-A添加或衔接体序列添加。图2B到图2E示出了具有基因标签、实验标签和/或衔接体序列的加合物的制备。图3概括了用于测序的qNPS探针和标记加合物以及使用核酸酶步骤进行清除。弯箭头指示连接点。产生了可测序NPP加合物及其互补物。检索表定义了用于形成所述可测序加合物的不同寡核苷酸。图4示出了装配所述可测序加合物的另一种方法。图4A示出了形成所述可测序NPP加合物的不同方案,其中所述标签接头在与所述实验标签(ET)可变序列(VS)(在测序时唯一识别所述孔或实验的序列)互补的残基处含有肌苷,然后是与3’衔接体互补的序列(3’Acomp)。图4B示出了使用不需要连接并可通过合成制备的单一合成结合5’衔接体标签/标签接头/3’衔接体互补序列。图4C和4D示出了可以利用凝胶纯化进行清除(例如,在多聚腺苷酸化之前)的这一方法的方案,或者如示出的在多聚腺苷酸化、捕捉和测序之前利用核酸酶步骤进行清理。图5示出了含有及不含有所述NPP的可测序加合物。图6提供了如何测序和定量剪接点、外显子和突变的图示。图6A文字说明。用于对基因的所有变体共同的区域上的mRNA进行测量的探针。对于野生型(左侧)和删除了外显子2的突变体示出了(公共外显子I)和用于测量两个外显子之间的剪接点(外显子1/2连接点)一其中所述连接点可为外显子I至外显子2或外显子I至外显子3—或者用于测量外显子(2和3),其中之一可删除(外显子2)。要注意,删除外显子2导致SI对用于外显子2的探针的全部破坏,以及对于外显子1/2剪接点的探针的外显子2特异的一半的破坏,由红色“x” SI指示。如何测序单核苷酸多态性(SNP)和甲基化DNA的实例示于图6B。图6B文字说明。示出了用于测量表达SNP (左图)或甲基化DNA位点(右图)的探针。对于表达SNP,示出了两种可能性野生型或SNP。使用了两种探针,一种用于对照区(1),一种具 有位于探针(2)中间的SNP。用Rnase处理切断SNP中的错配,然后所述探针(现在仅每端25个碱基)在用于所述SI反应的50-mer Tm下解离开并被SI破坏。对于甲基化的DNA,使用相同的两探针策略,但是首先使用亚硫酸氢盐将未甲基化的C转化为U,产生错配,然后使用尿嘧啶DNA糖基化酶切断所述DNA,从而所述探针将解离开并被SI破坏。图7示出了成功测序在qNPA方法的最后产生的进入所述裂解和杂交缓冲溶液中的转录本。图7文字说明。使用Sanger测序法,ABI3700。将具有所需测序引物(T7F)的线性DNA样本(约2. 5kb PCR)提交到亚利桑那大学测序中心。将加有或未加稀释缓冲液(qDil)的qNPA裂解缓冲液稀释到2X-20X。I: I加入qDil导致2X稀释。每个稀释度重复两次。相同稀释度还用反向引物重复(结果未示出)。为进行测序,将2.5iU 50ng/iil的DNA混入总体积15iU的反应混合物中。这相当于6X稀释度。红色无序列;浅绿色50-100bp序列;深绿色500-600bp序列。图8示出了测量匹配的裂解产物相对于提取RNA的PCR结果,以表明CT值的等价性。此处,对从样本纯化的RNA或来自相同样本的qLysis产物进行PCR以测量一大组不同细胞样本混合物的三个基因加持家基因GAPDH。每个数据点均是一式三份的平均值。每种混合物均在三个不同实验中测试。将CT值通过减去GAPDH的CT值标准化。将所述纯化RNA相对所述qLysis样本所需的稀释因子进行校正,并显示产生PadP可测序探针所需的步骤的序列。所述基因标签和5’衔接体,以及限制性内切位点,是原始PadP探针的一部分。所述探针与靶标RNA连接形成环形DNA,然后被打开并且所述实验标签和3’衔接体杂交并连接,形成用于测序的加合物。图9示出了用于产生PadP可测序加合物的代表性示意方法。所述基因标签和5’衔接体,以及限制性内切位点,是原始线性探针的一部分。所述探针以这样的方式与所述靶标核酸杂交,即所述探针的5’和3’端与相邻碱基杂交,从而可在所述核酸模板上连接在一起形成环形探针(例如DNA探针)。然后加入核酸酶(例如核酸外切酶)以破坏未杂交的核酸靶标和过量的线性探针。然后将所述探针与核酸靶标分离(例如在碱中加热),并破坏所述核酸酶活性。打开环形探针,并且视需要将实验标签和视需要的3’衔接体杂交并连接,制备用于测序的加合物。使线性探针与所述核酸靶标杂交、连接以形成环形探针并与所述核酸靶标分离的过程可在多个循环中重复通过循环加热引起解离。由于线性探针过量,当温度降低时,线性探针将杂交,继而可被连接,然后在下一高温循环下释放,从而在进行所述核酸酶水解步骤之前扩增环形探针的量。如果没有进一步的阐述,我们相信,本领域技术人员通过使用前面的描述,可最大限度地利用以下的发明。因此,以下具体的优选实施方案应被视为仅用于举例说明,而不以任何方式限制本公开的其余部分。实施例I :用于所述qNPA测定的裂解缓冲液被设计成用来灭活酶并防止RNA降解,但在有限稀释为杂交稀释缓冲液后,其允许SI活性并有利于以严格特异性杂交。然而,所述裂解缓冲液组分可抑制反转录和聚合酶活性。因此,抑制聚合酶活性可防止成功PCR,除非除去所述缓冲液或者稀释掉或中和掉所述抑制活性。可在所述核酸酶测定完成后加入稀释缓冲液以中和所述裂解和其他缓冲液的抑制活性。图7示出了成功测序在qNPA方法的最后产生的进入所述裂解和杂交缓冲溶液中的转录本。在水中的10倍稀释使得测序成功。然而,如 果使用中和稀释缓冲液(qDil)而不是水进行稀释,那么只需4倍稀释来产生与在水中测序的转录本相同的测序结果(500至600碱基对的读取长度)。然而,使用中和qDil稀释缓冲液允许在仅2倍稀释后测序,但读取长度减少到50至100个碱基对,因此是成功的,但受到裂解和杂交缓冲液的影响。认识到对于在测序前需要对靶标DNA进行PCR的系统,也可能存在来自所述裂解和杂交缓冲液的干扰,我们使用从细胞制备的cDNA相对于从相同细胞制备并用所述qDil稀释缓冲液稀释的裂解产物测试了 PCR效率。测量对GAPDH标准化的三个基因,混合物之间没有差异(图8)。相关性为0. 97。实施例2 将NPP设计为对剪接点或外显子以及靶标基因的其他区域特异,从而在各种情况下所述探针均对仅见于转录组中的单个基因中的序列特异。为允许所述核酸酶保护探针或所述探针的一部分的直接测序(直接核酸酶保护探针测序,或DNPS),在理想情况下前5、10,20或30个3’碱基足够特异从而其测序唯一地确定仅一个基因。在核酸酶反应后,通过将剩余的探针纳入含有如前文和下文所述的所需衔接体或捕捉序列或分子的测序加合物,将所述剩余的探针制备用于测序。在另一种方法中,将实验标签加至3’端。在又一种方法中,将基因标签加至3’端从而使所述核酸酶保护探针序列本身不必被测序,并且所述探针的3’端也不必对转录组中仅一个基因特异。在再一种方案中,基因标签和实验标签均纳入要测序的加合物中。在另一个实例中,通过前文和下文所述的方法制备所述NPP的互补序列和所述可测序加合物。实施例3 含有带有基因标签和实验标签的加合物的NPP的构建。此方法的一个优点是所述标签杂交步骤在破坏了所有天然物质(例如RNA)的SI和碱步骤之后,因此特异性仅需确保所述正确的标记与其自身互补序列杂交而不与另一标签的互补序列杂交。类似地,仅所述核酸酶保护探针需要为靶标特异的。所述探针本身不被测序。相反,基因标签被纳入加合物,所述加合物被全部测序以确定由该特异性核酸酶保护探针——所述基因标签与之特异性杂交——测量的基因。在用于进行FFPE上的qNPA (3,4)的标准方案后,将样本在裂解缓冲液中裂解,在核酸酶保护探针混合物的存在下加入蛋白酶K。在于37°C初始孵育30分钟后,将所述样本加热到95°C,然后冷却并于55°C孵育2小时,以允许所述探针与其各自的靶标mRNA杂交。然后加入SI核酸酶以水解不与靶标杂交的过量探针,以及不与探针杂交的RNA,留下靶标/探针双链。60分钟孵育后,加入碱并将样本加热到95°C 10分钟,解离探针/RNA双链体并水解所述靶标RNA序列。将所述样本中和,然后加入3’标签接头的混合物,每种接头具有与一个特异性探针的3’端25个碱基互补的特异性25个碱基序列,并含有对一个基因标识标签特异的序列。在第二个实例中,所述标签接头还含有通用的所述基因标签序列3’的序列,与一组实验标签共同的5’末端序列特异性杂交。所述基因标签序列可包括若干种设计,但在这种情况下由以下序列组成与所述基因标签的5’末端序列互补的序列,此序列不被测序,继而是对每个基因标签独特并且是每个基因标签3’端序列的7喊基标签序列,此序列被测序以识别每个基因。在所述标签接头的3’末端序列也与实验标签杂交的情况下,所述实验标签的5’互补序列对于每个实验标签是相同的。因为加入各自不同的实验标签来区分各个实验核酸酶保护反应(例如,分别测定的样本),因此不可能存在“错误”的实验标签杂交。在这种情况下,将各个样本准备在微孔板的不同孔中并向每孔中加入不同的实验标签。虽然加入标签接头、基因标签和实验标签可以是顺序的,但在此实施例中是一起加入,加入的标签接头相对经历所述SI核酸酶保护反应仍然存在的核酸酶保护探针过剩,但相对加入的基因标签和加入的实验标签的量处于有限浓度,从而所有 标签接头被所述标签序列本身所饱和。所述基因标签和实验标签均被5’端磷酸化。此外,所述实验标签还在其3’端包含与所述Solexa测序芯片上的3’端捕捉序列互补的衔接体序列。所述核酸酶保护探针的5’端也被磷酸化。在加入所述3’标签接头和标签的同一时间,加入5’衔接体接头的混合物,其由含有对每种探针的5’端互补的基因序列和与由所述Solexa测序芯片5’捕捉序列捕捉的5’衔接体序列互补的5’序列的序列构成。同时加入所述5’衔接体序列本身,相对5’衔接体接头过量。于50°C孵育发生所有合适的杂交后,形成在图2Exx所示的加合物,然后进行连接反应(使用T4DNA连接酶)。随后将所述反应混合物跑凝胶,切出高分子量的带,加载于Solexa芯片,扩增并测序。在此实施例中,所述基因标签由两个相同的基因识别序列构成,为识别每个基因提供测序冗余。此外,所述实验标签的5’端——用于与标签接头杂交——每个其他位置包含LNA,提供对于此序列中的碱基数更高的Tm,并使其尽可能短从而测序所述实验标签和基因标签所需的读取长度尽可能短。实施例4 进行实施例3中所述的相同方法,除了不使用凝胶纯化以外。相反,使用5’磷酸化的衔接体接头和5’磷酸化的标签接头,并向每个反应中加入与加至该反应的实验标签以及所述3’衔接体序列互补的寡核苷酸,如图3所示。因此,当进行此连接步骤时,此短寡核苷酸被连接于所述标签接头,因而在完全杂交和连接的加合物中没有短于100个碱基的序列。然后于65°C用SI核酸酶孵育所述反应混合物,作为“清除”反应。在此孵育温度下,所述完全加合物的组分的Tm使得没有部分解离开并被SI水解,而过量标签接头与每个标签(由于所述连接的标签少于50个碱基)之间以及过量的5’衔接体与衔接体接头之间的杂交充分解链,从而使SI将其水解。然后,将经历此SI反应存在的加合物加热至95°C以使其从所述保护接头上解离并破坏SI的活性,然后使所述加合物捕捉到所述Solexa芯片上,扩增并测序。实施例5
进行了构建用于在利用Poly-A尾巴在测序介质上捕捉所述可测序加合物的系统例如Helicose系统上测序的加合物的实例。构建了图2C所示的加合物,无3’衔接体。在进行凝胶纯化清除后,使用Tdt使此加合物在其3’端多聚腺苷酸化。制备这种相同的加合物并在所述Tdt反应前用SI核酸酶清除,然后测序。或者,构建图2C所示的加合物,其中Poly-A 3’衔接体被合成作为使用Tdt实验标签的部分,并且此产物在测序前通过凝胶纯化清除。使用Poly-T互补序列来保护所述poly-A尾巴,在测序前使用SI核酸酶来清除所述加合物。实施例6 使用全血作为样本进行实验例4的实验。将所述全血以I: I与2X (双倍浓度)裂解缓冲液混合,加热至95°C 10分钟,然后在微量离心机中离心除去团块。然后将上清按实施例4所述进行qNPS。实施例I 使用被病毒感染的人体细胞作为样本进行实验例4的实验。所使用的探针被设计成测量所述病毒基因。作为在其他物种的混合物中测量来自任何物种的基因而没有不想要的序列信息引起的对测序样本的干扰和“杂乱”的一个实例,结果表明了在人类基因的背景下选择性地测量病毒基因的能力。实施例8:使用由来自未分化的Thp-I细胞以及分化并经LPS刺激的Thp-I细胞的裂解产物的混合物构成的一系列样本进行实验例4的实验。实施例9:于95°C裂解并孵育样本,然后与NPP杂交,用SI处理,加入标签接头、基因标签、实验标签,杂交并连接,然后于105°C孵育,然后加入含有LNA的实验标签保护序列,于37°C孵育以允许20个或更多碱基的连接加合物互补寡核苷酸序列重新杂交(过量的标签接头、基因标签、实验标签和实验标签保护序列将仍然存在),然后SI水解,然后多聚腺苷酸化,最终通过凝胶电泳清除,然后测序。测序所述互补DNA (标签接头可与其杂交)的仅一个拷贝,并且该拷贝不含实验或基因标签。因此,如果测量100个基因,那么仅存在此被测序的互补DNA的100个分子/细胞作为背景,并且这些序列不包含任何基因标签或实验标签序列信肩、O实施例10:合成NPP,除与所述靶标核酸互补的碱基序列以外,其包含可作为用于被捕捉到所述测序芯片上的捕捉衔接体序列的非靶标序列,或者可作为基因标签的序列,或者可作为实验标签的序列,或者包含这些功能中的几个的序列。将所述NPP与过量的与所述NPP的非靶标序列互补的寡核苷酸合并并孵育从而使其可杂交在一起。然后将此混合物加入含有靶标核酸的样本中,并在杂交后以SI核酸酶处理,进行常规qNPA方案。由于在所述NPP与所述核酸靶标杂交的部分和与所述非靶标互补寡核苷酸杂交的部分之间所有碱基均具有与其杂交的互补碱基,因此与所述核酸靶标杂交的NPP不被SI核酸酶切断,而是仍保持完 整,而不与靶标寡核苷酸杂交NPP被水解直至受保护的非靶标序列的点。在碱中加热后加入跨越所述非靶标序列和所述靶标寡核苷酸序列的一部分的互补寡核苷酸,并使其在仅含有互补核酸酶靶标序列的NPP会杂交而更短的非靶标序列保护寡核苷酸和仍然存在的非序列NPP序列片段均不能杂交的温度下与NPP竞争性杂交。然后进行第二 SI核酸酶处理,然后可测序仍然存在的NPP,其具有被捕捉到所测序芯片所需的序列。该方案不需结合所述衔接体序列的任何连接,因为其是所述合成NPP加合物的一部分。通过用本发明的一般或具体描述的试剂和/或操作条件替换前述实施例中所用的那些,可以成功地重复前述实施例。从前述描述,本领域技术人员可容易地确定本发明的实质特征,并且可在不背离其精神和范围的情况下,对本发明进行多种改变和改进,以使其适合不同的用途和条件的发明。所有本文引用的出版物和专利均以引用的方式纳入本文。参考文献 I. Martel, R. R.,I. W. Botros, M. P. Rounseville,J. P. Hinton,R. R. Staples,D. A. Morales,J. B. Farmer,and B. E. Seligmann. Multiplexed screening assay for mRNAcombining nuclease protection with luminescent array detection. Assay and DrugDeyelopnent Technologies. 2002,I(1-1) :61-71.2. Martel. R.,M. P. Rounsevi lie, I. W. Botros, R. Kr i s, S. Felder andB. E. Seligmann. Multiplexed Molecular Prof iling (MMP) Transcription Assay inArayPlates for High-Throughput Measurement of Gene Expression in GeneCloning and Expression Technologies,Q. Lu and M. Weiner, Eds.,Eaton Publishing,Natick(2002).3. Robin Roberts, Costi Sabalos,Ralph Martel, Michael LeBlanc,JosephUnger, Ihab Botros,Bruce Seligmann,Thomas Miller,Thomas Grogan and LisaRimsza(2007) “Quantitative Nuclease Protection Assay in Paraffin-EmbeddedTissue Replicates Prognostic Microarray Gene Expression in Diffuse Large-B-CellLymphoma,,Laboratory Investigation, 87 :979-997.4.Lisa Rimsza,Michael LeBlanc, Joseph Unger, Thomas Miller,ThomasGrogan, Daniel Persky, Ralph Martel, Constantine Sabalos, Bruce Seligmann, RitaBraziel, Elias Campo, Andreas Rosenwald, Joseph Connors, Laurie Sehn, NathalieJohnson, and Randy Gascoyne(2008) “Gene expression predicts overall survivalin paraffin embedded tissues of diffuse large B cell lymphoma treated withR-CH0P” Blood,2008 Oct 15,112(8) :3425-335. pechhold,S.,Stouffer,M.,Walker, G.,Martel R.,Seligmann,B,Hang,Y.,Stein R.,Harlan, DM.,and Pechhold,K. (2009) mRNA analysis ofintracytoplasmically-stained, FACS—purified pancreatic islet cell subsetsusing the quantitative nuclease protection assay. Nature Biotechnology,TR21220A.6. Pino S,Ciciriello F,Costanzo G,and Di Mauro E (2008). Nonenzymatic RNALitgation in Water. Journal of Biological Chemistry, Vol. 283 No. 52 :26494-36503.7.Lutay AV, Chernolovskaya EL, Zenkova MA, Vlassov VV (2006). Thenonenzyatic template-directed ligation of oligonucleotides. Biosciences,3,243-249.
8. Shabarova ZA, Merenkova IN,Oretskaya TS, Sokolova NI,Skripkin EA,Alexeyeva EV,Balakin AG, Bogdanov(1991). Chemical ligation of DNA :the firstnon-enzymatic assembly of a biologically active gene. Nucleic Acids Research,Vol. 19 No. 15 :4247-4251.9.United States Patent 7,033,753. Inventor Kool, Eric T !Assignee :University of Rochester. Compositions and methods for nonenzymatic ligation ofoligonuclotides and detection of genetic polyrmorphisms. April 25,2006.10. Baner J,Isaksson A, Waldenstrom E,Jarvlus J,Landegren U,NilssonM(2003). Parallel gene analysis with allele-specific padlock probes and tagmicroarrays. Nucleic Acids Research 31(17) el03(1-7).
11. Prins TW, vanDi jk JP, Beenen HG,Van Hoef AM,Voorhuijzen MM,SchoenCD,Aarts HJM,Kok EJ(1008). Optimised padlock probe ligation and microarraydetection of multiple (non-authorised)GMOs in single reaction. BMC Genomics 9:584(1-12).
权利要求
1.检测生物样本中至少ー种靶标的方法,包括 (i)使所述样本与至少ー种与所述靶标特异性结合的核酸酶保护探针(NPP)接触, ( )在有效除去任何未结合的NPP的条件下使所述样本暴露于ー种或多种试剂, (iii)任选地使结合的NPP与所述靶标分离,以及 (iv)对所述NPP、其互补序列或含所述NPP或互补序列的分子测序。
2.根据权利要求I所述的方法,包括检测结合或游离形式的所述NPP。
3.根据权利要求I所述的方法,其中所述靶标是固定或交联或不溶的。
4.根据权利要求I所述的方法,其中所述靶标是核酸。
5.根据权利要求4所述的方法,其中所述核酸分子包括核糖核酸(RNA)分子或脱氧核糖核酸(DNA)分子,或者任选地含有非天然碱基的反义核苷酸。
6.根据权利要求5所述的方法,其中所述RNA是信使RNA(mRNA)、核糖体RNA (rRNA)、转移 RNA (tRNA)、小 RNA (miRNA)、siRNA 和反义 RNA,或者病毒 RNA (vRNA)。
7.根据权利要求5所述的方法,其中所述DNA是基因组DNA(gDNA)、线粒体DNA (mtDNA)、叶绿体 DNA (cpDNA)或病毒 DNA (vDNA)、cDNA 或转染 DNA。
8.根据权利要求I所述的方法,其中所述NPP包括可特异性结合所述靶标的核酸。
9.根据权利要求8所述的方法,其中所述NPP包括DNA分子。
10.根据权利要求9所述的方法,其中所述NPP为单链(ssDNA)或支链DNA(bDNA)分子,或者含有LNA或PNA或包含非天然碱基的多核苷酸。
11.根据权利要求I所述的方法,其中所述NPP是可特异性结合所述靶标的核酸,并且步骤(ii)包括用核酸酶或核酸酶混合物处理以有效除去任何未结合的NPP。
12.根据权利要求11所述的方法,其中所述靶标是核酸。
13.根据权利要求11所述的方法,其中所述靶标是RNA分子、小RNA、siRNA或任选地包含非天然碱基的反义RNA。
14.根据权利要求13所述的方法,其中所述靶标RNA分子与所述完整NPP分子或其一部分杂父。
15.根据权利要求11所述的方法,其中所述NPP为单链(ssDNA)或支链(bDNA)DNA。
16.根据权利要求11所述的方法,其中所述核酸酶或核酸酶混合物是DNA酶、RNA酶或其组合。
17.根据权利要求11所述的方法,其中所述核酸酶或核酸酶混合物是核酸内切酶、核酸外切酶或其组合。
18.根据权利要求11所述的方法,其中所述NPP是DNA分子并且所述核酸酶或核酸酶混合物是DNA酶和RNA酶。
19.根据权利要求11所述的方法,其中所述核酸酶是SI核酸酶。
20.根据权利要求11所述的方法,其中所述核酸酶或核酸酶混合物是核酸外切酶。
21.根据权利要求I所述的方法,其中所述生物样本被固定。
22.根据权利要求I所述的方法,其中所述生物样本包含引起靶标分子交联的试剂。
23.根据权利要求I所述的方法,其中所述靶标是交联的。
24.检测生物样本中至少ー种核酸靶标的方法,包括 (i)使所述样本与至少ー种核酸酶保护探针(NPP)接触,所述NPP是在足以促进所述靶标与所述NPP结合的条件下可特异性杂交于所述核酸靶标的核酸分子, (ii)在有效除去任何未结合的NPP的条件下使所述样本暴露于ー种或多种核酸酶, (iii)任选地使结合的NPP与所述靶标分离 (V)扩增所述NPP或含有所述NPP的加合物,以及 (V)对所述NPP测序。
25.根据权利要求24所述的方法,其中所述靶标是不溶的或固定的。
26.根据权利要求25所述的方法,其中所述不溶性核酸是交联的mRNA、miRNA或vRNA。
27.根据权利要求24所述的方法,其中所述NPP是ssDNA或bDNA或适体。
28.根据权利要求24所述的方法,其中所述NPP是DNA并且步骤(ii)中的核酸酶包含DNA酶、RNA酶或其组合。
29.根据权利要求24所述的方法,其中所述NPP是DNA并且步骤(ii)中的核酸酶包含核酸外切酶、核酸内切酶或其组合。
30.根据权利要求24所述的方法,其中步骤(ii)中的核酸酶包含SI核酸酶。
31.根据权利要求24所述的方法,包括Solexa测序、454测序、链终止测序、染料终止测序或焦磷酸测序。
32.根据权利要求24所述的方法,包括单分子测序。
33.根据权利要求31所述的方法,包括PCR扩增。
34.根据权利要求I所述的方法,其中无需提取所述靶标分子对其进行检测。
35.根据权利要求I所述的方法,其中无需溶解所述靶标分子对其进行检测。
36.根据权利要求I所述的方法,还包括使用所述靶标分子作为模板以生物合成方式产生NPP。
37.根据权利要求I所述的方法,包括将特异性结合所述NPP或其部分的寡核苷酸测序。
38.根据权利要求24所述的方法,包括将特异性结合所述NPP或其部分的寡核苷酸测序。
39.检测生物样本中至少ー种靶标的方法,包括 (i)使所述样本与至少ー种可与所述靶标特异性结合的核酸酶保护探针(NPP)接触, (ii)在有效除去任何未结合的NPP和未与所述NPP杂交的靶标的条件下使所述样本暴露于ー种或多种试剂, (iii)任选地使结合的NPP与所述靶标分离, (iv)任选地扩增所述NPP,或者所述NPP的互补序列,或者所述祀标,或者含有所述NPP或靶标或所述NPP的互补序列的加合物,以及 (V)对所述NPP,或者所述祀标,或者所述NPP的互补序列,或者含有所述NPP或所述革巴标或所述NPP的互补序列的加合物测序。
40.根据权利要求39所述的方法,其中所述靶标分子包含核糖核酸(RNA)分子或脱氧核糖核酸(DNA)分子,或者任选地含有非天然碱基的反义核苷酸。
41.根据权利要求39所述的方法,其中所述RNA是信使RNA(mRNA)、核糖体RNA (rRNA)、转移 RNA (tRNA)、小 RNA (miRNA)、siRNA 和反义 RNA,或者病毒 RNA (vRNA)。
42.根据权利要求39所述的方法,其中所述DNA是基因组DNA(gDNA)、线粒体DNA (mtDNA)、叶绿体 DNA (cpDNA)或病毒 DNA (vDNA)、cDNA 或转染 DNA。
43.根据权利要求39所述的方法,其中所述NPP包含可特异性结合所述靶标的核酸,或者部分或全部由肽核酸构成,或者部分或全部由LNA或非天然碱基或修饰碱基构成。
44.根据权利要求39所述的方法,其中所述NPP包含不可测序的组分。
45.可测序加合物,包含 包含与生物靶标杂交的多核苷酸序列的核酸酶保护探针(NPP); 第一标签,其包含从所述NPP的3’端经所述标签序列的5’端延伸的多核苷酸序列;以及任选, 第二标签,其包含从所述第一标签的3’端延伸的多核苷酸序列。
46.根据权利要求45所述的可测序加合物,其还包含衔接体,所述衔接体包含从所述NPP的游离3’端或从含有所述第一和所述第二标签序列的NPP加合物的3’端延伸的多核苷酸序列,或者包含所述加合物的倒数第二个标签序列的3’端。
47.根据权利要求45所述的可测序加合物,其中所述第一标签和所述第二标签独立地为基因标签和实验标签。
48.根据权利要求45所述的可测序加合物,包含所述基因标签和所述衔接体。
49.根据权利要求45所述的可测序加合物,包含所述基因标签、所述实验标签和所述衔接体。
50.根据权利要求45所述的可测序加合物,包含实验标签。
51.根据权利要求45所述的可测序加合物,同时包含实验标签和所述衔接体。
52.根据权利要求45所述的可测序加合物,其还包含衔接体,所述衔接体包含从在3’端含有一个或多个标签序列和/或衔接体的所述NPP或NPP加合物的游离5’端延伸的多核苷酸序列。
53.根据权利要求52所述的可测序加合物,包含所述基因标签和所述衔接体。
54.根据权利要求52所述的可测序加合物,包含所述基因标签、所述实验标签和所述衔接体。
55.根据权利要求52所述的可测序加合物,包含所述实验标签和所述衔接体。
56.根据权利要求52所述的可测序加合物,包括同时含有两个衔接体的加合物。
57.制备权利要求45所述的可测序加合物的方法,包括 使具有所述核酸酶保护探针(NPP)的3'端的互补序列以及所述第一标签的5’端的互补序列的接头与所述NPP杂交; 使基因标签序列或实验标签序列与所述互补序列杂交; 任选地使所述第一标签,以及如果存在的第二标签,与所述NPP连接以形成可测序加合物。
58.根据权利要求56所述的可测序加合物,其中倒数第二个标签在其3'末端含有衔接体序列以被捕捉到测序平台上。
59.制备权利要求45所述的可测序加合物的方法,包括 使具有所述核酸酶保护探针(NPP)3,端的互补序列并且具有所述第一标签的互补序列和所述第二标签5’端的互补序列的接头与所述NPP杂交; 使所述第一标签序列和第二标签序列与所述互补序列杂交;任选地使所述第一标签序列与所述NPP连接并使所述第二标签序列与所述第一标签序列连接以形成所述可测序加合物。
60.根据权利要求59所述的可测序加合物,其中倒数第二个标签在其3'末端含有衔接体序列以被捕捉到测序平台上。
61.制备权利要求59所述的可测序加合物的方法,还包括 使在5’端具有所述核酸酶保护探针(NPP)的5’端的互补序列并在3’端具有衔接体序列的3’端的互补序列的接头杂交; 使所述衔接体序列与所述接头的互补序列杂交; 使所述衔接体序列与所述NPP连接以形成所述可测序加合物。
62.制备权利要求57所述的可测序加合物的方法,还包括 (i)使用所述NPP的第一引物扩增所述NPP或靶标;以及 ( )任选地使第二引物与第一扩增步骤的产物杂交,其中所述第二引物任选地包含衔接体序列,以及 (iii)再扩增(ii)的产物以产生可测序加合物。
63.制备权利要求62所述的可测序加合物的方法,还包含基因标签序列作为线性NPP的一部分。
64.制备权利要求62所述的可测序加合物的方法,还包含实验标签序列作为线性NPP的一部分。
65.制备权利要求62所述的可测序加合物的方法,还包含衔接体序列作为线性NPP的一部分。
66.制备权利要求62所述的可测序加合物的方法,还包含一个或多个标签序列和/或衔接体序列作为线性NPP的一部分。
67.制备权利要求62所述的可测序加合物的方法,还包含连接到线性NPP上的实验标签。
68.制备权利要求62所述的可测序加合物的方法,还包含如下所述NPP,所述NPP具有不与所述靶标互补但在核酸酶步骤中与互补寡核苷酸杂交并因此不从结合于所述靶标的NPP上水解或切断的序列。
69.制备权利要求62所述的可测序加合物的方法,还包括在连接步骤后用核酸酶或核酸酶混合物纯化或孵育以除去所述可测序加合物以外的加合物。
70.检测生物样本中至少ー种靶标的方法,包括 (i)使所述样本与至少ー种线性核酸酶保护探针(NPP)接触,所述探针的末端特异性地与所述靶标结合从而其5’和3'端与所述靶标的相邻碱基杂交, ( )连接所述NPP以形成环形寡核苷酸, (iii)任选地解离所述环形NPP,使线性NPP的第二分子与所述靶标杂交,并连接, (iv)任选在连续循环中重复(iv), (v)加入核酸酶以破坏所述样本中的所有线性单链寡核苷酸,以及 (vi)切断所述环形NPP以线性化所述NPP,以及 (vii)对所述线性NPP测序。
71.检测生物样本中至少ー种靶标的方法,包括(i)使所述样本与至少ー种可与所述靶标特异性结合的核酸酶保护探针(NPP)接触,( )在有效除去任何未结合的NPP和未与所述NPP杂交的靶标的条件下使所述样本暴露于ー种或多种试剂, (iii)任选地使结合的NPP与所述靶标分离, (iv)任选地扩增所述NPP,或者所述NPP的互补序列,或者所述祀标,或者含有以下物质的加合物 包含与生物靶标杂交的多核苷酸序列的核酸酶保护探针(NPP); 第一标签,其包含从所述NPP的3’端经所述标签序列的5’端延伸的多核苷酸序列;以及任选, 第二标签,其包含从所述第一标签的3’端延伸的多核苷酸序列,以及 (V)对所述NPP,或者所述祀标,或者所述NPP的互补序列,或者所述加合物测序。
全文摘要
本发明提供了一种用于解决测序面临的几个难题并改善了研究和诊断应用的新方法——定量核酸酶保护测序(qNPSTM)。所述方法使用仅需样本裂解的核酸酶保护测定来产生用于测序的核酸探针例如DNA探针,所述探针可偶联基因特异性标签从而使得可鉴定基因而不必对所述核酸酶保护探针自身测序,和/或可以偶联实验特异性标签,藉此将来自不同患者的样本可合并到单次运行中。所公开的qNPS作为一种研究和发现工具以及作为诊断测试使得可对固定的或不溶的样本测序并且费用较低。
文档编号C12Q1/68GK102712955SQ201080060488
公开日2012年10月3日 申请日期2010年11月3日 优先权日2009年11月3日
发明者B·塞利格曼 申请人:Htg分子诊断有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1