通过质谱分析法测序核酸分子的制作方法

文档序号:388279阅读:2498来源:国知局
专利名称:通过质谱分析法测序核酸分子的制作方法
通过质谱分析法测序核酸分子本发明涉及分析和/或测定核酸分子的核苷酸序列的方法。
背景技术
核酸分子被用作诊断工具和/或治疗剂,由此,可以通过筛选部分或完全随机化的核酸分子文库鉴定核酸分子,或者根据计算机算法辅助的互补序列进行预测,如针对反义、siRNA和miRNA所进行的。核酸分子可以是单链或双链分子,它们可以被构造或不被构造,它们可以缀合至肽、蛋白质、多糖和其它较大分子,它们的糖主链(骨架)可以由核糖、 脱氧核糖和/或其修饰的衍生物组成。核酸分子的功能可以基于a)以反义核酸分子、催化核酸分子、siRNA分子和微RNA分子形式与mRNA进行序列特异性杂交并且关闭 mRNA(Couzin,2004 ;Crooke,2004 ;Hannon,2002 Juliano 等人, 2008 ;Scherer & Rossi,2003 ;Schlosser 等人,2006 ;Usman & Blatt,2000 ;Weigand等人, 2006 ;Zhang & Farwel1,2008);b)或者核酸分子与靶分子结合和/或通过核酸分子阻断靶分子的功能,其中核酸分子包括适配体、Spiegelmers和诱馆核酸(Carothers & Szostak,2006 ;Cload等人, 2006 ;Eulberg 等人,2006 ;Mann & Dzau, 2000 ;Nimjee 等人,2006 ;Realini 等人,2006);c)或者它们对免疫系统的刺激作用,例如,以CpG-DNA (ffeiner, 2000)和随机寡核
苷酸形式。这种核酸分子作为诊断工具和/或作为治疗剂的生产、开发和使用使验证核酸分子同一性的方法成为必要,其中对于灵敏、精确和可重复的分析存在需要。同一性的验证需要测定核酸分子的分子量和长度以及其碱基组成、序列、和糖部分和核苷酸内键合的同一性。使用的方法应是特异性的,允许鉴定修饰的碱基和修饰的糖部分,添加或缺失产物以及脱嘌呤产物。核苷酸序列的测定必须是完全的,并且其必须显示任何化学或酶促操作没有不利地影响碱基或主链。修饰的核酸分子的表征特别具有挑战性——如果它们是核酸酶稳定的。这种核酸酶稳定的核酸分子在糖主链的2’ -位被修饰或者由镜像核苷酸组成。但是,已经开发了多种技术,包括例如电泳、酶促和化学分析、阵列技术和质谱分析法,以测定核酸分子的核苷酸序列。通过酶促和化学分析进行核酸的核苷酸序列测定在二十世纪70年代,开发了三种核酸分子测序技术,它们是在许多实验室中实践的普通并且相对快速的方法。Maxam和GiIber的DNA测序方法。由Maxam和Gilbert描述的方法描述了这样的过程,其中末端标记的DNA分子以核碱基特异性的方式化学断裂。然后,核酸分子序列中的每一碱基位置从核碱基特异断裂产生的片段的分子量进行测定。单独的反应被设计以在鸟嘌呤、腺嘌呤、胞嘧啶和胸腺嘧啶、和单独的胞嘧啶处优先断裂。在这四种反应的产物经由不断增加片段大小的增加的负电荷通过分子量分辨时,例如使用聚丙烯酰胺凝胶电泳,可以从分辨凝胶上的片段的模式读取DNA分子的序列(Maxam & Gilbert,1977)。Sanger的DNA测序方法。由Sanger等人开发的其它方法利用双脱氧核苷三磷酸(缩写ddNIPs)的链终止能力和DNA聚合酶并入具有与DNA聚合酶的天然底物——脱氧核苷三磷酸(缩写dNTPs)——几乎相等保真度的ddNTP的能力。简而言之,引物分子——通常为寡核苷酸分子,和模板DNA分子在有用浓度的所有四种dNIPs和有限量的单一 ddNTP 的存在下进行温育。DNA聚合酶偶尔将终止链延伸的双脱氧核苷酸并入增长中的扩增链中。 因为双脱氧核苷酸没有3’ -羟基,所以失去聚合酶的起始点。聚合产生不同大小的核酸分子片段的混合物,其全部具有相同的5’ -末端。通过例如聚丙烯酰胺凝胶电泳进行的混合物的分部分离产生表示核酸分子中每一核苷酸存在和位置的模式(图案)。与四种ddNTP 每一种的反应允许以与使用由Maxam和Gilbert开发的技术(Maxam&GiIbert,1977)所进行的相似的方式从分辨凝胶读取核酸分子序列(Sanger等人,1977)。Peattie的RNA测序方法。由于RNA分子具有不同的化学特征以及与DNA分子相比 RNA分子具有更大的不稳定性,Maxam和Gilbert的化学方法不适用于RNA分子。Peattie 开发了测序RNA分子的化学方法,其中RNA分子被3’放射标记并且以核碱基特异性的方式化学断裂。然后,核酸分子的核酸序列中的每一核苷酸位置根据由核碱基特异性的断裂产生的核酸分子的分子量确定。单独的反应被设计以在鸟嘌呤、腺嘌呤或鸟嘌呤、在胞嘧啶和尿嘧啶以及在单独的尿嘧啶处优先断裂。当例用例如迁移率不同经由聚丙烯酰胺凝胶电泳通过分子量分辨这四种反应的产物时,可以从分辨凝胶上片段的模式读取RNA分子的序列 (Peattie,1979)。基于Sanger方法的RNA测序方法。最一般的RNA分子序列鉴定方法是如前面描述的Sanger方法。在RNA分子的情况下,双脱氧链终止反应由读取RNA分子模板并插入互补脱氧核苷酸的逆转录酶催化。与在DNA测序中使用的聚合酶相同,逆转录反应被双脱氧核苷酸抑制(Zimmern & Kaesberg, 1978)。RNA指纹分析。在RNA指纹法中,用两种或更多种内切核酸酶单独消化RNA分子, 其中内切核酸酶特异性断裂。从每一断裂反应得到的RNA分子片段通过电荷(第一方向) 和长度(第二方向)进行分离。电荷分离通过在醋酸纤维素条上使用高压电泳进行。此后,RNA分子片段被转移至DEAE纤维素纸用以在第二方向上进行分离。通过重叠来自单独的酶促消化反应的层析分辨(色谱分辨,chromatographically resolved)片段测定序列 (Branch 等人,1989)。基于禾口 / 或对于 Sanger、Maxam 禾口 Gilbert 以及 Peattie (Maxam & Gilbert,
1977;Peattie, 1979 ;Sanger等人,1977)的方法,对这些方法发展了几种改进和/或修改 荧光标记代替放射性标记、后标记技术(post-labeling techniques)、酶促切割代替化学断裂、分步漫游点方法(st印-wise wandering spot method)、RNA和DNA的替代断裂反应(Donis-Keller 等人,1977 ;Gupta 等人,1976 ;Gupta & Randerath,1977 ;Lockard 等人,
1978;Proudnikov & Mirzabekov, 1996 ;Stanley & Vassilenko, 1978 ;Tanaka 等人,1980 ; Waldmann 等人,1987 ;Wu 等人,1996)。但是,每一种技术都具有固有的局限。例如Maxam和Gilbert (Maxam & Gilbert, 1977)以及Peattie (Peattie,1979)公开了化学降解方法,而Sanger等人(Sanger等人, 1977)公开了使用互补链引物延伸的链终止技术。这些技术中的每一种利用四种单独的反应混合物来产生在长度上具有单个核苷酸不同的片段的嵌套组(nested set),因而表示全部的核苷酸序列。基于其大小和终止核苷酸,通过聚丙烯酰胺凝胶电泳进行片段分辨以确定片段的次序并且因此测定核酸分子的核苷酸序列。凝胶的灌制和核酸分子的电泳分离是耗时的操作。使用凝胶电泳来测定核酸分子的序列是潜在的误差来源,这是由于带压缩效应,其中相邻的核酸分子片段是未分辨的,并且每一单独链的鉴定基于相对值即迁移时间的测量。潜在的误差来源是,例如,核酸分子和其片段的结构。例如,使用Thin Layer Chromatography (薄层层析,缩写,TLC)的RNA指纹分析方法对于未知(修饰的)结构的表征是不适当的(Limbach,1996)。因此,通过质谱分析法进行核酸分子的序列测定是克服这些限制的有希望的方法 (Limbach,1996)。通过质谱分析法进行核酸的核苷酸序列测定质谱分析法(缩写MS)是分析化合物分子量的有利工具。对于核酸分子分析,MS 可适用于核酸分子测序、核酸分子修饰检测和核酸分子片段测定。通过MS分析核酸主要受到离子化效率的限制以及受到几种适用的检测方法的分辨能力的限制。只有带电的分子可以通过质量检测器(mass detector)分析。因此,在被引入质量分析器之前,待分析的分子需要被有效地离子化。为了在质谱分析之前有效地使核酸分子离子化,通常使用下述技术电喷射离子化(缩写ESI) O^erm等人,1989)和基质辅助激光解吸电离(matrix -assisted laser desorption/ionization)(缩写 MALDI) (Karas & Hillenkamp,1988)。ESI将溶液中的分子或离子转化为蒸汽相中的离子,其主要通过蒸发带电的溶液小滴进行。ESI可以产生质荷比(质量-电荷比)在商业可得质谱分析器的线性范围内的多种带电荷离子的分布。尽管存在于溶液中的化合物的混合物可以通过ESI-MS 直接分析,但是由于不同化合物的多种电荷、过多电荷的竞争以及盐加成物干扰,这种程序可能例如遭遇复杂的谱。因此,电喷射离子化通常直接在下游与分离机理结合。当多种关键参数如流速、离子化模式、缓冲液和溶剂添加剂被最优化时,这种程序促进有效的离子化。尽管ESI-MS是灵敏的,只需要尘摩尔(毫微微摩尔,femtomole)量的样品,但是对于甚至简单的核酸分子来说,其依赖于多个电荷以获得有效的离子化并且产生复杂且难以解释的多个电荷的谱。因此,实际上,ESI-MS的应用依赖于能使数据“解卷积(去卷积, deconvolution) ”软件包的可用性。解卷积包括使用基于算法的计算过程以确定来自多电荷质量-谱数据的分子未带电荷(中性)质量。例如与飞行时间(缩写T0F)质量分析器联合使用的基质辅助激光解吸电离(缩写MALDI)具有大的测序核酸分子的潜力,这是因为其相对宽的质量范围和高的取样速率。 对于大质量生物分子如核酸分子的常规分析,与ESI-MS相比,通常优选MALDI-MS,因为大质量的生物分子可以容易地被离子化和分析。此外,MALDI-MS主要产生单一带电的种类, 其大大简化了谱特别是包含寡核苷酸的混合物的那些谱的解释。但是,一般而言,核酸分子的MALDI-MS分析可能遭遇高分子量核酸分子片段分辨力缺乏、核酸不稳定性以及来自样品制备试剂的干扰。较长的核酸分子可能产生更宽、不太强的信号,因为MALDI将对较高分子量的离子赋予更大的动能。尽管可以用于分析高分子量核酸,但是MALDI-MS可能诱导核酸分子主链的断裂,其使得到的谱进一步复杂化。虽然与ESI相比,MALDI对于离子抑制不太灵敏,但是对于MALDI分析来说,离子抑制仍然是问题,并且必须使利用样品清洁策略,和/或色谱分离。然而,MALDI不易于与基于溶液的技术的直接结合,并且一般地以离线或在线模式进行操作。
用于测序的直接质谱法不依赖于外部反应产生序列特异性离子的任何质谱法都被认为是直接的测序方法。前面提到的TAs、ESI和MALDI是用于核酸分子的选择的离子化方法(Limbach,1996)。 这些方法的详细综述由Limbach和Nordhoff等人给出(Limbach,1996 ;Nordhoff等人, 1996)。解吸/离子化诱导的断裂。核酸分子的分裂(解离,dissociations)可以由于在解吸/离子化过程期间赋予核酸分子过多能量发生。该分裂以相对快的时间量程发生,导致产生通常难以精确鉴定的离子。ESI主要产生稳定的、完整的分子离子。解吸/离子化诱导的大多数分裂可在MALDI中见到,其中在MALDI-TOF-MS中,存在四种不同的时间量程用于解吸/离子化诱导的分裂迅速、快速、快速亚稳定的和亚稳定的。理论上,在这些时间量程的任一期间发生的分裂将产生可被用于确定核酸分子序列的核酸分子片段离子。在实践中,分析者很少对断裂的程度进行控制。这些片段的大多数导致分子离子峰加宽,这导致分辨力和灵敏性的损失(Limbach,1996)。串联质谱分析法。MS-MS(也称串联质谱分析法)包括在质谱仪内发生化学反应之前和之后测量离子的质荷比(m/z),其中包括m/z变化(Baker等人,1993 ;BoSChenok & Sheil, 1996 ;Kawase 等人,1991 ;Limbach 等人,1995 ;Little 等人,1995 ;Marzilli 等人, 1999 ;Ni等人,1996 ;恥等人,1998b,W. M. A. Niessen,2002)。在化学反应之前,在质谱仪的第一阶段中选择m/z值(该离子称为前体或母体离子)。然后,化学反应发生,其通常涉及与中性气体分子的碰撞(称为碰撞诱导分裂或CID的方法)。大多数情况下,氦或氩被用作碰撞气体。该反应可以发生在质谱仪的两个质量阶段之间的过渡区(碰撞间)。通过此反应,前体离子的分解可以产生多种产物离子(这些被称为子离子或产物离子)。然后可以通过质谱仪的第二阶段检测带电片段。可以以两种模式进行MS-MS:首先,“空间的(in space) "MS-MS,即,两个质谱分析仪可以空间上分开,例如通过QT0F(四极-飞行时间)器械分开。其次,“时间的”MS-MS,即,在同一空间内可以发生方法中的不同步骤,但是在时间上是分开的,例如在离子阱器械中。W. M.A. Niessen Q006)已经对CID过程进行了精确的描述。用于核酸分子的序列鉴定的串联质谱分析法的适用性可以在Limbach和 Nordhoff 等人(Limbach,1996 ;Nordhoff 等人,1996)的综述文章中查到。CID 是在 MS-MS 中诱导断裂的最广泛应用的方法。基于多电荷阴离子核苷酸分裂,该方法利用从两个末端双向测序的概念,其假设寡核苷酸的主链沿着链顺序地分离(解离)。在成功应用时,得到的片段代表序列特异性的断裂模式。对于RNA断裂的最初报道之一由Cerny等人(1987) 给出。根据现有知识,“双向”概念利用构造从5’ 一3’方向的序列的c系列离子和构造 3’ —5’方向的序列的y系列离子(SchUrch等人,2002)。然而,可形成其它子离子,其可能使测序过程复杂化、支持测序过程或使测序过程能够进行。由于断裂可以发生在磷酸酯、 糖和碱基位点的事实,对得到的谱的解释被复杂化并且所述方法被限于具有小于25个核苷酸的核酸(Alazard等人,2002)。该限制可以归于多种因素诸如中性损失(没有被离子化的子离子不能被检测到)、检测器的检测限制问题或有限的分辨力。碰撞能量也发挥了关键作用。低碰撞能量产生较少的序列相关离子,而较高的碰撞能量可以导致其它离子系列,其使得数据解释复杂化。与DNA的CID——其在近几年内已经被彻底地研究——相反,关于RNA的CID的方面仍旧没有被充分解决。由于通过MS测序核酸分子的“直接方法”的局限性,已将发展了下述间接方法并且其被用于通过质谱分析法测定核酸分子的序列。用于测序的间接质谱法如本文优选使用的,用于测序的“间接质谱法”指在产生样品的气相离子之前进行核酸分子的制备,从其应该测定序列。用于作为证实预测的核酸分子组成的工具的质量测量的间接质谱法在本文中不进行讨论。进一步的信息被提供在Limbach (Limbach,1996)的综述中。依赖于连续主链断裂的任何质谱测序方法的应用取决于质量梯状物的形成。序列信息通过确定质谱中连续峰之间的质量差获得。在寡脱氧核苷酸的情况下,预期的连续峰之间的质量差与下述损使对应dC = 289. 05、dT = 304. 05、dA = 313. 06和dG = 329. 05 (精确的质量基值(exact massbased values) )0对于寡核糖核苷酸,质量差是C = 305. 04,U =306. 03、A = 329. 05和dG = 345. 05 (精确的质量基值)。由于核酸序列测定方法依赖于连续η-聚体(n-mer)的质量测量,所以由于在四种DNA分子残基之间存在相对大的质量差,与RNA分子相比,DNA分子更易于表征。由于核糖核苷酸U和C之间小的、仅1道尔顿单位的质量差,为了准确地区分U和C,测量需要的精确性更高。对于序列测定,质量梯状物方法具有一个明显的优势导致期望信息的两个质量测量中的差异给出核苷酸残基的特征。核酸酶消化后核酸分子梯状物的分析。通过使用5’ 一>3’磷酸二酯酶和/或 3’ 一>5’磷酸二酯酶水解核苷酸产生DNA或RNA分子片段。通常地,使用两种酶的组合来鉴定所有的核苷酸。截短的和/或断裂的核酸分子通过MALDI-T0F-MS或ESI-MS进行分析。通过改进的技术如延迟提取,样品清洁,酶、缓冲液PH和基质的最优化(Bentzley等人,1998 ;Bentzley 等人,1996 ;Faulstich 等人,1997 ;Glover 等人,1995 ;Kirpekar 等人, 1994 ;Owens 等人,1998 ;Pieles 等人,1993 ;Schuette 等人,1995 ;Smirnov 等人,1996 ;Wu & Aboleneen, 2001 ;胁等人,1998a)可以获得可达35个核苷酸的增强的分辨力(Alazard等人,2002)。但是,酶法测序(enzymatic sequencing)限于不包括其糖主链修饰的核酸分子。 而且,一些核酸酶是单链特异性的。一些核酸分子特别是长的寡核苷酸诸如适配体显示出双链序列部分,这导致对于核酸酶消化来说为更差底物的分子内和/或分子间结构。化学消化后核酸分子梯状物的分析。除了外切核酸酶,化学试剂可以用于在质谱测量之前控制核酸分子降解。如果核酸分子被修饰,那么化学试剂是特别需要的,其中特异性选择修饰以增加核酸分子对酶促消化的稳定性。与酶促消化方法相当,化学断裂反应按照它们对DNA和RNA分子的特异性以及它们对不同核碱基的特异性进行分类。可以在MS 分析之前使用的RNA和DNA分子的碱基特异性反应由Peattie和Maxam-Gilbert (Maxam & Gilbert, 1977 ;Peattie, 1979)描述。但是,DNA分子的磷酸二酯主链的非特异性(随机) 断裂通过酸水解进行(Shapiro & Danzig,1972) ;RNA分子的磷酸二酯主链的非特异性(随机)断裂通过碱水解、使用酸(例如,甲酸)(Farand & Beverly,2008)、在生理pH下聚胺 (Komiyama & Yoshinari, 1997)进行。利用DNA或RNA分子的磷酸二酯主链的非特异性(随机)断裂,产生的用于序列测定的核酸分子的质量梯状物可能是复杂的,因为任何连接位点都可能潜在地被化学试剂断裂。核碱基特异的化学断裂也可以随机地发生在各个核碱基所处的核酸分子内每一位置。如果产生单个断裂位点,则出现两个特定的片段一个来自5’-末端而一个来自3’-末端。如果两个片段都可以在质谱中检测,那么存在比核酸分子序列测定所需要的更多的信息。这两种离子系列可能是混乱的来源。混乱的其它来源来自内部断裂。如以前指出的, 沿着核酸分子主链的单个断裂产生两个片段——一个片段来源于5’ -末端而另一个片段来源于3’-末端。沿着核酸分子主链的又一个断裂反应产生三个片段第一片段是5’-末端,第二片段是3’ -末端而第三片段将不包括任一末端。因为5’ -或3’ -末端被用作参考点,所以包含5’ -或3’ -末端的片段可以被用于构造质量梯状物。相反地,内部片段不能用于构造质量梯状物。此外,在内部片段和末端片段之一的质量相同的情况下,不正确的解释可能产生。而且,这些内部片段的存在可能导致期望的5’ -或3’ -末端片段的离子抑制。因此,化学消化的反应条件必须被仔细地调整为单一断裂条件(Limbach,1996),但是与随机断裂反应相同,控制此的能力是有限的。核酸测序可以通过化学断裂反应随后通过质谱分析法分析断裂反应进行(Farand & Beverly,2008)。Farrand和Berverly使用高度修饰的核酸分子,其包含2’脱氧核糖核苷酸、2’ -氟核糖核苷酸、2’ -0-甲基核糖核苷酸、无碱基核糖核苷酸和核糖核苷酸的混合物,其中甲酸被用于降解核糖核苷酸;氢氧化钠被用于降解核糖核苷酸、2’ -氟核糖核苷酸、2’ -0-甲基核糖核苷酸和无碱基残基;哌啶被用于核糖核苷酸、2’ -氟核糖核苷酸和脱氧-鸟嘌呤。碱基特异的反应(如Peattie Maxam & Gilbert所报道的)也被用于获得片段。在精确质量分析期间,包含链的最后一个核苷酸的短片段(长度为1-3个核苷酸)难以被LC-MS保留。因此,需要串联质谱分析法以证实包含3’-末端羟基的最后两个或三个核苷酸(Farand & Beverly,2008)。内切核酸酶消化和化学消化后核酸分子梯状物的分析。RNA分子内U和C之间的小的质量差(IDa)使得利用部分外切核酸酶消化然后进行MALDI-T0F的明确分配(如DNA分子所显示的)变得困难。 外切核酸酶消化导致不清楚的序列分配,其中嘧啶碱基C和U不能彼此区分。因此,Tolson 和Nicholson发展了将序列特异性内切核酸酶和化学方法结合以分辨RNA分子的这些序列不清楚的方法(Tolson & Nicholson,1998)。因为酶促反应的特异性不是所期望的,因此作者使用胼/苯胺处理RNA,产生由在U处分裂形成的特征片段(Tolson & Nicholson,1998)。Sanger双脱氧终止反应后核酸分子梯状物的分析。Sanger测序策略允许通过使用质谱分析法如MALDI或ESI质谱分析法,分析由核碱基特异的链终止获得的嵌套片段,根据其不同的分子量组合序列信息。该方法通过增加终止基团的量、使用循环测序、优化反应条件、纯化延伸产物、消除盐加成物以及利用延迟提取技术来进行改进以获得更好的分辨力(Fu 等人,I"8 ;Harksen 等人,I"9 ;Kirpekar 等人,I"8 ;Koster 等人,I"6 ;Monforte & Becker, 1997 ;Mouradian 等人,1996 ;Roskey 等人,1996 ;Shaler 等人,1995 ;Taranenko 等人,1998 ;Taranenko等人,1997)。使用这种MALDI-T0F测序方法,可以分析由多于100个核苷酸组成的DNA分子的序列(Taranenko等人,1998)。可选地,如在US 5,547, 835中所示,上述方法之一已与其中模板用生物素标记并且结合到链亲和素包被磁珠上的固相测序方法结合。通过在寡核苷酸引物、链终止核苷三磷酸和/或在链延长核苷酸三磷酸中引入质量修饰以及使用允许通过与具有质量区别的分子量的标签特异性探针杂交倍增的整合标签序列,可以增加生产率(throughput)。但是,所有这些“ Sanger-基”测序方法都需要靶序列的一些现有知识或引入已知序列作为引物结合位点。因此,在本发明下的问题是提供测定核酸分子的核苷酸序列的方法,特别是在核酸分子包括L型核苷酸或由L型核苷酸组成的情况下。在本发明下的另外的问题是提供测定核酸分子特别是包括L型核苷酸或由L型核苷酸组成的核酸分子的核苷酸序列,其中,这种方法克服了或避免了现有技术方法的至少
一些缺点。该问题通过独立权利要求的主旨解决。优选的实施方式可以取自从属权利要求。在第一方面,通过测定核酸分子的核苷酸序列的方法,解决了本发明下的问题,其也是第一方面的第一实施方式,上述方法包括下述步骤d)提供具有至少一个修饰的核酸分子的多个分子;b)随机地断裂多个修饰的核酸分子因而提供修饰的核酸分子片段和未修饰的核酸分子片段;c)分离修饰核酸分子片段和未修饰的核酸分子片段;d)根据其长度、质量和/或电荷分离或分辨所述修饰的核酸分子片段,其中这种分离或分辨生成修饰的核酸片段的模式;和e)任选地,可视化所述修饰的核酸片段的模式。在也是第一方面的第一实施方式的实施方式的第一方面的第二实施方式中,所述方法进一步包括下述步骤f)从所述修饰的核酸片段的模式推断所述核酸分子的所述核苷酸序列。在也是第一方面的第一和第二实施方式的实施方式的第一方面的第三实施方式中,所述多个分子的单个核酸分子在待测定核苷酸序列的所述核酸分子的所述核苷酸序列的5’端、3’端或其内部具有至少一个修饰。在也是第一方面的第一、第二和第三实施方式的实施方式的第一方面的第四实施方式中,断裂通过化学断裂、酶促切割(酶促断裂)、通过加热断裂和/或利用二价离子断裂完成。在也是第一方面的第一、第二、第三和第四实施方式的实施方式的第一方面的第五实施方式中,断裂是化学断裂,优选地是核苷酸非特异性的断裂。在也是第一方面的第一、第二、第三、第四和第五实施方式的实施方式的第一方面的第六实施方式中,断裂是有限的断裂。在也是第一方面的第一、第二、第三、第四、第五和第六实施方式的实施方式的第一方面的第七实施方式中,断裂是有限的随机断裂,优选地是有限的化学随机断裂。在也是第一方面的第一、第二、第三、第四、第五、第六和第七实施方式的实施方式的第一方面的第八实施方式中,断裂的步骤提供片段——优选地修饰片段——的混合物, 其中这种片段的混合物包括核酸分子的所有可能核苷酸序列片段。在也是第一方面的第八实施方式的实施方式的第一方面的第九实施方式中,所述混合物包括其核苷酸序列待被测定的修饰的全长形式的核酸分子。。在也是第一方面的第一、第二、第三、第四、第五、第六、第七、第八和第九实施方式的实施方式的第一方面的第十实施方式中,修饰的核酸分子片段通过所述修饰与相互作用配偶体相互作用分离修饰的核酸分子片段与未修饰的核酸分子片段,其中这类相互作用配偶体与支持物连接。在也是第十实施方式的实施方式的第一方面的第十一实施方式中,支持物是固体支持物。在也是第一方面的第十和第十一实施方式的实施方式的第一方面的第十二实施方式中,优选地通过洗涤,从与相互作用配偶体相互作用的修饰的核酸分子片段除去未修饰核酸分子片段。在也是第一方面的第十、第十一和第十二实施方式的实施方式的第一方面的第十三实施方式中,修饰的核酸分子片段从支持物释放,优选地通过从相互作用配偶体释放所述修饰,通过从支持物释放相互作用配偶体或通过从核酸分子片段断裂所述修饰或其一部分或部分。在也是第一方面的第一、第二、第三、第四、第五、第六、第七、第八和第九实施方式的实施方式的第一方面的第十四实施方式中,通过质量区分、大小区分、疏水性区分、电荷区分、离子区分、氢键合区分和/或液相介导提取的分离将修饰的核酸分子片段与未修饰的核酸分子分离,优选地除去未标记的核酸分子片段。在也是第一方面的第一至第十四实施方式任一种的实施方式的第一方面的第十五实施方式中,修饰的核酸片段的模式包括修饰的核酸片段的梯状物。在也是第一方面的第一至第十五实施方式任一种的实施方式的第一方面的第十六实施方式中,修饰的核酸片段的模式通过质谱分析法生成并且优选地推断核酸分子的核酸序列。在也是第一方面的第一至第十六实施方式任一种的实施方式的第一方面的第十七实施方式中,修饰的核酸片段的模式被生成,并且单个片段的质量通过质谱分析法测定,并且优选地推断核酸分子的核酸序列。在也是第一方面的第一至第十七实施方式任一种的实施方式的第一方面的第十八实施方式中,核酸分子的核苷酸序列是未知的。在也是第一方面的第一至第十八实施方式任一种的实施方式的第一方面的第十九实施方式中,从修饰的核酸分子片段推断核酸分子的核苷酸序列的步骤包括下列步骤fa)测定最小修饰的核酸分子片段——n+x,其中χ = 0——的质量和/或核苷酸序列;fb)测定与最小修饰的核酸分子片段——n+x,其中χ = 0——的质量有一个核苷酸差异的修饰的核酸分子片段——Π+Χ,其中X = 1——的质量;fc)测定修饰的核酸分子片段——n+x,其中χ = 1——的质量与最小修饰的核酸分子片段——Π+Χ,其中X = 0——的质量之间的质量差;fd)将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至最小修饰的核酸分子片段——n+x,其中χ = 0——的序列生成修饰的核酸分子片段——n+x, 其中χ = 1——的序列。在也是第一方面的第十九实施方式的实施方式的第一方面的第二十实施方式中, 重复步骤fb)到fd),其中对于每一重复,χ增加加数1,并且对于第一次重复χ是2,并且其中在步骤fb)中,测定与修饰的核酸分子片段n+(x-l)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,在步骤fc)中,测定修饰的核酸分子片段n+x的质量和修饰的核酸分子片段n+(x-l)的质量之间的质量差,和在步骤fd)中,将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-l)的序列生成修饰的核酸分子片段n+x的序列。在也是第一方面的第二十实施方式的实施方式的第一方面的第二十一实施方式中,对于步骤fb)至fd)的第m次重复,χ如下x = m+1。在也是第一方面的第一至第十七实施方式任一种的实施方式的第一方面的第二十二实施方式中,核酸分子的核苷酸序列是已知的,并且优选地,所述方法是用于证实核酸分子的核苷酸序列。在也是第一方面的第二十二实施方式的实施方式的第一方面的第二十三实施方式中,从修饰的核酸片段的模式推断核酸分子的核苷酸序列的步骤包括下列步骤fa)测定与最小修饰的核酸分子片段——n+x,其中χ = 0——的质量有一个核苷酸差异的修饰的核酸分子片段——Π+Χ,其中X = 1——的质量;fb)测定修饰的核酸分子片段——n+x,其中χ = 1——的质量与最小修饰的核酸分子片段——Π+Χ,其中X = 0——的质量之间的质量差;fc)将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至最小修饰的核酸分子片段——n+x,其中χ = 0——的序列生成修饰的核酸分子片段——n+x, 其中χ = 1——的序列。在也是第一方面的第二十三实施方式的实施方式的第一方面的第二十四实施方式中,其中对于每一重复,X增加加数1,并且对于第一次重复X是2,并且其中在步骤fa) 中,测定与修饰的核酸分子片段n+(x-l)的质量有1个核苷酸差异的修饰的核酸分子片段 n+x的质量,在步骤fb)中,测定修饰的核酸分子片段n+x的质量和修饰的核酸分子片段 η+(x-1)的质量之间的质量差,和在步骤fc)中,将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至修饰的核酸分子片段n+(x-l)的序列生成修饰的核酸分子片段n+x的序列。在也是第一方面的第二十四实施方式的实施方式的第一方面的第二十五实施方式中,对于步骤fa)至fc)的第m次重复,χ如下x = m+l。在也是第一方面的第二十二、二十三、二十四和二十五实施方式的实施方式的第一方面的第二十六实施方式中,最小修饰的核酸分子片段——n+x,其中χ = 0——的质量和/或核苷酸序列是已知的。在也是第一方面的第二十二实施方式的实施方式的第一方面的第二十七实施方式中,从修饰的核酸片段的模式推断核酸分子的核苷酸序列的步骤包括下列步骤fa)测定与最小修饰的核酸分子片段——n+x,其中χ = 0——的质量有一个核苷酸差异的修饰的核酸分子片段——Π+Χ,其中X = 1——的质量;fb)将修饰的核酸分子片段——n+x,其中χ = 1——的质量归于其核苷酸序列已知的核酸分子的核酸分子片段——n+x,其中χ = 1——的计算质量,并通过将不同的核苷酸种类加至最小修饰的核酸分子片段——n+x,其中χ = 0——的序列生成修饰的核酸分子片段——n+x,其中χ = 1——的序列。
在也是第一方面的第二十七实施方式的实施方式的第一方面的第二十八实施方式中,重复步骤fa)到fb),其中对于每一重复,χ增加加数1,并且对于第一次重复χ是2,并且其中在步骤fa)中,测定与修饰的核酸分子片段n+(x-l)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,和在步骤fb)中,将修饰的核酸分子片段——n+x,其中χ = 1——的质量归于其核苷酸序列已知的核酸分子的核酸分子片段——n+x,其中χ = 1—— 的计算质量,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-l)的序列生成片段n+x的修饰的核酸分子序列。在也是第一方面的第二十八实施方式的实施方式的第一方面的第二十九实施方式中,对于步骤fa)至fc)的第m次重复,χ如下x = m+l。在也是第一方面的第十九至第二十九实施方式任一种的实施方式的第一方面的第三十实施方式中,所述修饰存在于核酸分子片段的5’端,和最小修饰的核酸分子片段包括全长核酸分子的末端5’核苷酸,或者其中所述修饰存在于核酸分子片段的3’端,和最小修饰的核酸分子片段包括全长核酸分子的末端3’核苷酸。在也是第一方面的第一至第三十实施方式任一种的实施方式的第一方面的第三十一实施方式中,修饰是包括一个部分 (moiety)的未分修饰。。在也是第一方面第三十一实施方式的实施方式的第一方面的第三十二实施方式中,所述部分被用于分离修饰的核酸分子片段和未修饰的核酸分子。在也是第一方面第三十二实施方式的实施方式的第一方面的第三十三实施方式中,所述部分被用于在生成的模式中分离或分辨修饰的核酸分子片段。在也是第一方面的第一至第三十实施方式任一种的实施方式的第一方面的第三十四实施方式中,修饰是包括至少第一部分和第二部分的多分修饰,其中任选地至少第一部分和第二部分通过连接体连接。在也是第一方面第三十四实施方式的实施方式的第一方面的第三十五实施方式中,第一部分被用于分离修饰的核酸分子片段和未修饰的核酸分子,而第二部分被用于在生成的模式中分离或分辨修饰的核酸分子片段。在也是第一方面的第三十一至第三十五实施方式任一种的实施方式的第一方面的第三十六实施方式中,用于分离修饰的核酸分子片段和未修饰的核酸分子的所述部分包括针对相互作用配偶体的配体,其中这类相互作用配偶体存在于支持物上,优选连接到这类支持物,和配体和相互作用配偶体之间的相互作用介导修饰的核酸分子片段在支持物上的固定。在也是第一方面的第三十六实施方式的实施方式的第一方面的第三十七实施方式中,固定选自化学固定、亲和固定、磁固定。在也是第一方面的第三十七实施方式的实施方式的第一方面的第三十八实施方式中,固定是亲和固定。在也是第一方面的第三十八实施方式的实施方式的第一方面的第三十九实施方式中,介导核酸分子和核酸分子片段在支持物上的固定的相互作用选自生物素-抗生物素蛋白相互作用、生物素-中性抗生物素蛋白相互作用、生物素-链亲和素相互作用、抗原-抗体相互作用、两个寡核苷酸的相互作用——其中核酸分子由DNA、RNA、LNA、PNA或其组合组成,钙调蛋白和钙调蛋白结合肽的相互作用、白蛋白和汽巴蓝(Cibracon Blue)的相互作用、金属-螯合剂和金属-螯合支持物的相互作用。在也是第一方面的第三十一至第三十九实施方式任一种的实施方式的第一方面的第四十实施方式中,用于分离修饰的核酸分子片段和未修饰的核酸分子的部分选自生物素、寡核苷酸、钙调蛋白结合肽、白蛋白和金属-螯合剂。在也是第一方面的第一至第四十实施方式任一种的实施方式的第一方面的第四十一实施方式中,通过下列方法,将修饰的核酸分子片段与未修饰的核酸分子分离,所述方法选自过滤、透析、层析、磁场、离心和沉淀。在也是第一方面的第四十一实施方式的实施方式的第一方面的第四十二实施方式中,层析是大小排阻层析,其中根据大小或由于通过修饰所赋予的修饰片段的增加的大小,将修饰的核酸片段与未修饰的核酸分子分离。。在也是第一方面的第三十一至第四十二实施方式任一种的实施方式的第一方面的第四十三实施方式中,被用于在生成的模式中分离或分辨修饰的核酸分子片段的部分选自质量标签或亲脂标签。在也是第一方面的第一至第四十三实施方式任一种的实施方式的第一方面的第四十四实施方式中,通过针对质量或大小区分的方法分离或分辨修饰的核酸分子片段,所述方法优选地选自过滤、透析、层析和质谱分析法,优选地,这样的方法是MS、LCMS或ESI MS。在也是第一方面的第一至第四十四实施方式任一种的实施方式的第一方面的第四十五实施方式中,通过基于疏水相互作用的方法分离或分辨修饰的核酸分子片段,所述方法优选为RP-HPLC。在也是第一方面的第三十四至第四十五实施方式任一种的实施方式的第一方面的第四十六实施方式中,连接体是疏水连接体。在也是第一方面的第三十四至第四十六实施方式任一种的实施方式的第一方面的第四十七实施方式中,连接体是可断裂(可切割)连接体。在也是第一方面的第四十七实施方式的实施方式的第一方面的第四十八实施方式中,连接体是选择性可切割连接体,更优选地,所述选择性可断裂连接体是可酶切割的、 可化学断裂的、可光致断裂的或可热断裂的。在也是第一方面的第一至第四十八实施方式任一种的实施方式的第一方面的第四十九实施方式中,所述核酸分子选自RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子、PNA、LNA和其组合,优选RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子以及包含脱氧核糖核苷酸和核糖核苷酸的核酸分子。在也是第一方面的第一至第四十九实施方式任一种的实施方式的第一方面的第五十实施方式中,核酸分子选自适配体、Spiegelmer、核糖核酸酶、Spiegelzyme、反义分子、 siRNA 分子禾口诱馆分子(decoy molecule),优选 Spiegelmers0在也是第一方面的第一至第五十实施方式任一种的实施方式的第一方面的第五十一实施方式中,核酸分子是RNA分子和/或核苷酸修饰的RNA分子。在也是第一方面的第五十一实施方式的实施方式的第一方面的第五十二实施方式中,断裂是RNA分子和/或核苷酸修饰的RNA分子的化学化学断裂,其通过碱水解、胺或聚胺进行。
在也是第一方面的第五十一实施方式的实施方式的第一方面的第五十三实施方式中,断裂是RNA分子和/或核苷酸修饰的RNA分子的酶切割,其通过使用核酸酶,优选核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。在也是第一方面的第五十一实施方式的实施方式的第一方面的第五十四实施方式中,断裂是通过加热RNA分子和/或核苷酸修饰的RNA分子的断裂。在也是第一方面的第五十一实施方式的实施方式的第一方面的第五十五实施方式中,断裂是通过使用二价阳离子的RNA分子和/或核苷酸修饰的RNA分子的断裂。在也是第一方面的第一至第五十实施方式任一种的实施方式的第一方面的第五十六实施方式中,核酸是DNA分子和/或核苷酸修饰的RNA分子。在也是第一方面的第五十六实施方式的实施方式的第一方面的第五十七实施方式中,断裂是DNA分子和/或核苷酸修饰的DNA分子的化学断裂,其通过使用酸水解进行。在也是第一方面的第五十六实施方式的实施方式的第一方面的第五十八实施方式中,断裂是DNA分子和/或核苷酸修饰的DNA分子的酶切割,其通过使用核酸酶,优选脱氧核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。在也是第一方面的第十六至第五十八实施方式任一种的实施方式的第一方面的第五十九实施方式中,质谱分析法选自直接质谱分析法(direct mass spectrometry), LC-MS 禾口 MS/MS。在也是第一方面的第一至第五十九实施方式任一种的实施方式的第一方面的第六十实施方式中,测定核酸分子的特定质量指纹。在也是第一方面的第六十实施方式的实施方式的第一方面的第六十一实施方式中,特定质量指纹被用于核酸分子的鉴定和/或质量控制。在也是第一方面的第一至第六十一实施方式任一种的实施方式的第一方面的第六十二实施方式中,核酸分子或核酸分子的多个分子的至少一个修饰在步骤a)或b)之前被加到核酸分子的5’端或3’端。在也是第一方面的第一至第六十二实施方式任一种的实施方式的第一方面的第六十三实施方式中,核酸分子或核酸分子的多个分子包括非核酸部分。在也是第一方面的第六十三实施方式的实施方式的第一方面的第六十四实施方式中,非核酸部分在步骤a)或b)之前从核酸分子或核酸分子的多个分子除去。。在也是第一方面的第六十四实施方式的实施方式的第一方面的第六十五实施方式中,在步骤a)或b)之前,在第一步骤中,非核酸部分从核酸分子或核酸分子的多个分子除去,而在第二步骤中,核酸分子或核酸分子的多个分子的修饰被加到核酸分子或核酸分子的多个分子的核苷酸序列的5’端、3’端或内部的核苷酸。在第二方面,通过测定核酸分子的核苷酸序列的方法,解决了本发明下的基本问题,其也是第二方面地第一实施方式,上述方法包括下列步骤a)提供具有至少一个修饰的核酸分子的多个分子;b)随机断裂多个修饰的核酸分子因而提供修饰的核酸分子片段;c)根据其长度、质量和/或电荷分离或分辨修饰的核酸分子片段,其中这种分离或分辨生成修饰的核酸片段的模式;和d)任选地,可视化所述修饰的核酸片段的模式。
在也是第二方面的第一实施方式的实施方式的第二方面的第二实施方式中,在步骤b)或C)之后获得的反应混合物包含不具有所述至少一个修饰的一个或多个核酸分子或其片段。在也是第二方面的第一和第二实施方式的实施方式的第二方面的第三实施方式中,可视化修饰的核酸片段的模式利用至少一个修饰,优选地所述修饰允许区分具有所述修饰的核酸分子和不具有所述修饰的核酸分子。在也是第二方面的第一、第二和第三实施方式的实施方式的第二方面的第四实施方式中,修饰选自质量标签、在给定波长比核酸分子具有显著更多UV吸光度的部分、亲脂部分、具有限定分子量的聚合物、放射标记和赋予改变的离子迁移率的部分。在也是第二方面的第四实施方式的实施方式的第二方面的第五实施方式中,在给定波长比核酸分子具有显著更多UV吸光度的部分选自发色团、染料和荧光标记。在也是第二方面的第一至第五实施方式任一种的实施方式的第二方面的第六实施方式中,方法进一步包括下列步骤e)从修饰的核酸片段的模式推断核酸分子的核苷酸序列。在也是第二方面的第一至第六实施方式任一种的实施方式的第二方面的第七实施方式中,多个分子的单个核酸分子在其核苷酸序列待测定的核酸分子的核苷酸序列的5’ 端、3’端或其内部具有至少一个修饰。在也是第二方面的第一至第七实施方式任一种的实施方式的第二方面的第八实施方式中,断裂通过化学断裂、酶切割、通过加热断裂和/或通过使用二价阳离子断裂进行。在也是第二方面的第一至第八实施方式任一种的实施方式的第二方面的第九实施方式中,断裂是化学断裂,优选核苷酸非特异性断裂。在也是第二方面的第一至第九实施方式任一种的实施方式的第二方面的第十实施方式中,断裂是有限的断裂。在也是第二方面的第一至第十实施方式任一种的实施方式的第二方面的第十一实施方式中,断裂是有限的随机断裂,优选有限的化学随机断裂。在也是第二方面的第一至第十一实施方式任一种的实施方式的第二方面的第十二实施方式中,断裂步骤步骤提供片段的混合物,优选是修饰片段的混合物,其中这类片段的混合物包括核酸分子的所有可能核苷酸序列片段。在也是第二方面的第十二实施方式的实施方式的第二方面的第十三实施方式中, 混合物包括其核苷酸序列待被测定的修饰的全长形式的核酸分子。在也是第二方面的第一至第十三实施方式任一种的实施方式的第二方面的第十四实施方式中,修饰的核酸片段的模式包括修饰的核酸片段的梯状物。在也是第二方面的第一至第十四实施方式任一种的实施方式的第二方面的第十五实施方式中,修饰的核酸片段模式通过质谱分析法——优选地LC-MS——生成,并且优选地,推断核酸分子的核酸序列。在也是第二方面的第一至第十四实施方式任一种的实施方式的第二方面的第十六实施方式中,修饰的核酸片段的模式被生成,并且单个片段的质量通过质谱分析法测定,并且优选地推断核酸分子的核酸序列。
在也是第二方面的第一至第十六实施方式任一种的实施方式的第二方面的第十七实施方式中,核酸分子的核苷酸序列是未知的。在也是第二方面的第一至第十七实施方式任一种的实施方式的第二方面的第十八实施方式中,从修饰的核酸片段的模式推断核酸分子的核苷酸序列的步骤包括下列步骤fa)测定最小修饰的核酸分子片段n+x其中x = 0的质量和/或核苷酸序列;fb)测定与最小修饰的核酸分子片段n+x其中χ = 0的质量有一个核苷酸差异的修饰的核酸分子片段n+x其中χ = 1的质量;fc)测定修饰的核酸分子片段n+x其中χ = 1的质量与最小修饰的核酸分子片段 n+x其中x = 0的质量之间的质量差;fd)将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至最小修饰的核酸分子片段n+x其中χ = 0的序列生成修饰的核酸分子片段n+x其中χ = 1的序列。在也是第二方面的第十八实施方式的实施方式的第二方面的第十九实施方式中, 重复步骤fb)到fd),其中对于每一重复,χ增加加数1,并且对于第一次重复χ是2,并且其中在步骤fb)中,测定与修饰的核酸分子片段n+(x-l)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,在步骤fc)中,测定修饰的核酸分子片段n+x的质量和修饰的核酸分子片段n+(x-l)的质量之间的质量差,和在步骤fd)中,将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至修饰的核酸分子片段n+(x-l)的序列生成修饰的核酸分子片段n+x的序列。在也是第二方面的第十九实施方式的实施方式的第二方面的第二十实施方式中, 对于步骤fb)至fd)的第m次重复,χ如下x = m+1。在也是第二方面的第一至第十六实施方式任一种的实施方式的第二方面的第二十一实施方式中,核酸分子的核苷酸序列是已知的,并且优选地,该方法用于证实核酸分子的核苷酸序列。在也是第二方面的第二十一实施方式的实施方式的第二方面的第二十二实施方式中,从修饰的核酸片段的模式推断核酸分子的核苷酸序列的步骤包括下列步骤fa)测定与最小修饰的核酸分子片段n+x其中x = 0的质量有一个核苷酸差异的修饰的核酸分子片段n+x其中χ = 1的质量;fb)测定修饰的核酸分子片段n+x其中χ = 1的质量与最小修饰的核酸分子片段 n+x其中x = 0的质量之间的质量差;fc)将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至最小修饰的核酸分子片段n+x其中χ = 0的序列生成修饰的核酸分子片段n+x其中χ = 1的序列。在也是第二方面的第二十二实施方式的实施方式的第二方面的第二十三实施方式中,重复步骤fa)至fc),其中对于每一重复,χ增加加数1,并且对于第一次重复χ是2, 并且其中在步骤fa)中,测定与修饰的核酸分子片段n+(x-l)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,在步骤fb)中,测定修饰的核酸分子片段n+x的质量和修饰的核酸分子片段n+(x-1)的质量之间的质量差,和在步骤fc)中,将该质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至修饰的核酸分子片段n+(x-l)的序列生成片段n+x的序列。在也是第二方面的第二十三实施方式的实施方式的第二方面的第二十四实施方式中,对于步骤fa)至fb)的第m次重复,χ如下x = m+l。在也是第二方面的第二十一至第二十四实施方式任一种的实施方式的第二方面的第二十五实施方式中,最小修饰的核酸分子片段n+x其中χ = 0的质量和/或核苷酸序列是已知的。在也是第二方面的第二十一实施方式的实施方式的第二方面的第二十六实施方式中,从修饰的核酸片段的模式推断核酸分子的核苷酸序列的步骤包括下列步骤fa)测定与最小修饰的核酸分子片段n+x其中x = 0的质量有一个核苷酸差异的修饰的核酸分子片段n+x其中χ = 1的质量;fb)将修饰的核酸分子片段n+x其中χ = 1的质量归于其核苷酸序列已知的核酸分子的核酸分子片段n+x其中χ = 1的计算质量,并通过将不同的核苷酸种类加至最小修饰的核酸分子片段n+x其中χ = 0的序列生成修饰的核酸分子片段n+x其中χ = 1的序列。在也是第二方面的第二十六实施方式的实施方式的第二方面的第二十七实施方式中,重复步骤fa)到fb),其中对于每一重复,χ增加加数1,并且对于第一次重复χ是2, 并且其中在步骤fa)中,测定与修饰的核酸分子片段n+(x-l)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,和在步骤fb)中,将修饰的核酸分子片段n+x其中χ = 1 的质量归于其核苷酸序列已知的核酸分子的核酸分子片段n+x其中χ = 1的计算质量,并通过将不同的核苷酸种类加至修饰的核酸分子片段n+(x-l)的序列生成片段n+x的修饰的核酸分子序列。在也是第二方面的第二十七实施方式的实施方式的第二方面的第二十八实施方式中,对于步骤fa)至fc)的第m次重复,χ如下x = m+l。在也是第二方面的第十八至第二十八实施方式任一种的实施方式的第二方面的第二十九实施方式中,修饰存在于核酸分子片段的5’端,和最小修饰的核酸分子片段包括全长核酸分子的末端5’核苷酸,或者其中修饰存在于核酸分子片段的3’端,和最小修饰的核酸分子片段包括全长核酸分子的末端3’核苷酸。在也是第二方面的第一至第二十九实施方式任一种的实施方式的第二方面的第三十实施方式中,修饰被用于在生成的模式中分离或分辨修饰的核酸分子片段。在也是第二方面的第一至第三十实施方式任一种的实施方式的第二方面的第三十一实施方式中,修饰是荧光标记,其波长吸光度不同于核酸分子的核碱基的波长吸光度。在也是第二方面的第一至第三十一实施方式任一种的实施方式的第二方面的第三十二实施方式中,核酸分子选自RNA分子、DNA分子、核苷酸修饰的RNA分子、核苷酸修饰的DNA分子、PNA、LNA以及其组合,优选RNA分子、DNA分子、核苷酸修饰的RNA分子、核苷酸修饰的DNA分子以及包含脱氧核糖核苷酸和核糖核苷酸的核酸分子。在也是第二方面的第一至第三十二实施方式任一种的实施方式的第二方面的第三十三实施方式中,核酸分子选自适配体、Spiegelmers、核糖核酸酶、Spiegelzyme、反义分子、siRNA分子和诱饵分子,优选Spiegelmers。
在也是第二方面的第一至第三十三实施方式任一种的实施方式的第二方面的第三十四实施方式中,核酸分子是RNA分子和/或核苷酸修饰的RNA分子。在也是第二方面的第三十四实施方式的实施方式的第二方面的第三十五实施方式中,断裂是RNA分子和/或核苷酸修饰的RNA分子的化学断裂,并且这种断裂通过碱水解进行。在也是第二方面的第三十四实施方式的实施方式的第二方面的第三十六实施方式中,断裂是RNA分子和/或核苷酸修饰的RNA分子的酶切割,其通过使用核酸酶,优选核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。在也是第二方面的第三十四实施方式的实施方式的第二方面的第三十七实施方式中,断裂是通过加热RNA分子和/或核苷酸修饰的RNA分子的断裂。在也是第二方面的第三十四实施方式的实施方式的第二方面的第三十八实施方式中,断裂是通过使用二价阳离子的RNA分子和/或修饰的RNA分子的断裂,或是通过加热断裂和断裂剂(裂解剂,cleaving agent)的组合。在也是第二方面的第一至第三十三实施方式任一种的实施方式的第二方面的第三十九实施方式中,核酸是DNA分子和/或核苷酸修饰的DNA分子。在也是第二方面的第三十九实施方式的实施方式的第二方面的第四十实施方式中,断裂是DNA分子和/或核苷酸修饰的DNA分子的化学断裂,其通过使用酸水解进行。在也是第二方面的第三十九实施方式的实施方式的第二方面的第四十一实施方式中,断裂是DNA分子和/或核苷酸修饰的DNA分子的酶切割,其通过使用核酸酶,优选脱氧核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。在也是第二方面的第一至第四十一实施方式任一种的实施方式的第二方面的第四十二实施方式中,测定核酸分子的特定质量指纹。在也是第二方面的第四十二实施方式的实施方式的第二方面的第四十三实施方式中,特定质量指纹被用于核酸分子的鉴定和/或质量控制。在也是第二方面的第一至第四十三实施方式任一种的实施方式的第二方面的第四十四实施方式中,核酸分子或核酸分子的多个分子的至少一个修饰在步骤a)或b)之前被加到核酸分子的5’端或3’端。在也是第二方面的第一至第四十四实施方式任一种的实施方式的第二方面的第四十五实施方式中,核酸分子或核酸分子的多个分子包括非核酸部分。在也是第二方面的第四十五实施方式的实施方式的第二方面的第四十六实施方式中,非核酸部分在步骤a)或b)之前从核酸分子或核酸分子的多个分子除去。在也是第二方面的第四十六实施方式的实施方式的第二方面的第四十七实施方式中,在步骤a)或b)之前,在第一步骤中,非核酸部分从核酸分子或核酸分子的多个分子除去,而在第二步骤中,核酸分子或核酸分子的多个分子的修饰被加到核酸分子或核酸分子的多个分子的核苷酸序列的5’端、3’端或内部的核苷酸。在第三方面,通过测定核酸分子的核苷酸序列的方法,解决了本发明下的基本问题,其也是第三方面的第一实施方式,所述方法包括下列步骤b)提供核酸分子的多个分子;b)使核酸分子的多个分子进行核碱基选择性处理,其中形成核酸分子的核碱基种类的一个或数个被选择性地修饰,并且其中在这种核碱基选择性处理之后,核酸分子的一些可选择性处理的核碱基被修饰,并且核酸分子的一些可选择性处理的核苷酸或核碱基保持未修饰;c)选择性地在修饰的核碱基的3’,化学断裂核酸磷酸主链,其中不是所有修饰的核碱基的核酸磷酸主链被断裂;d)通过LC-MS和/或LC-MS-MS分析核酸分子片段;和e)以增加的大小的顺序鉴定具有完整末端的核酸分子片段,并且从其生成核酸分子的序列,其中优选地,核酸分子片段具有相同的完整末端,更优选相同的完整3’末端。在也是第三方面的第一实施方式的实施方式的第三方面的第二实施方式中,核酸分子选自RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子、PNA、LNA、 包含脱氧核糖核苷酸和核糖核苷酸的核酸分子、以及其组合,优选RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子。在也是第三方面的第一和第二实施方式的实施方式的第三方面的第三实施方式中,核酸分子选自适配体、Spiegelmers、核糖核酸酶、Spiegelzyme、反义分子、SiRNA分子和诱馆分子,优选Spiegelmers。在也是第三方面的第一、第二和第三实施方式的实施方式的第三方面的第四实施方式中,核酸分子是RNA分子和/或核酸修饰的RNA分子。在也是第三方面的第一至第四实施方式的实施方式的第三方面的第五实施方式中,可选择性处理的核碱基选自鸟苷、腺苷、胞苷、胸苷和尿嘧啶。在也是第三方面的第一至第五实施方式的实施方式的第三方面的第六实施方式中,使用胼、乙酸和苯胺的组合选择性处理所述核碱基U,导致5’磷酸酯附加的3’片段和苯胺修饰的核糖5’片段。在也是第三方面的第六实施方式的实施方式的第三方面的第七实施方式中,5’磷酸酯附加的3’片段和完整核酸分子在权利要求113的步骤d)中比苯胺修饰的核糖5’片段更有效离子化。在也是第三方面的第七实施方式的实施方式的第三方面的第八实施方式中,5’磷酸酯附加的3’片段在权利要求113的步骤d)中比苯胺修饰的核糖5’片段更有效离子化。在也是第三方面的第八实施方式的实施方式的第三方面的第九实施方式中,5’磷酸酯附加的3’片段在权利要求113的步骤e)中使用。在本发明的第一、第二和第三方面中任一方面的每一和任一实施方式的实施方式中,核酸分子包括多于25个核苷酸或核碱基。在本发明的第一、第二和第三方面中任一方面的每一和任一实施方式的实施方式中,核酸分子包括多于35个的核苷酸或核碱基。在本发明的第一、第二和第三方面中任一方面的每一和任一实施方式的实施方式中,核酸分子包括26至50个核碱基或36至50个核碱基,优选地包括沈至45个核碱基或者36至45个核碱基。应认识到的是,术语核碱基和核苷酸在与本发明相关联的情况下可以互换使用。在本发明的第一、第二和第三方面中任一方面的每一和任一实施方式的实施方式中,核酸分子或核酸分子的多个分子的聚集被减少。
在本发明的第一、第二和第三方面中任一方面的每一和任一实施方式的实施方式中,通过加入离液序列高的溶液至步骤a)到c)的任一步骤,优选a)和b)的任一步骤,减少聚集。本发明人惊奇地发现如此推断或测定核酸分子的核苷酸序列是可能的通过随机地以不完全的方式断裂多个所述核酸分子并且分辨因此生成的所述核酸分子的片段的混合物,成为核酸分子的片段模式,其中从这样的片段模式可以推断或测定所述核酸分子的核酸序列。片段的混合物一般也包括修饰的核酸分子片段,其中所述修饰的核酸分子片段也通过所述随机和不完全断裂多个所述核酸分子生成,典型地,从一个或多个所述核酸分子生成,其中所述核酸分子包括修饰。核酸分子片段的模式通过修饰的核酸分子片段如此形成或展示。换句话说,直接或间接推断出核苷酸序列所基于的模式是修饰的核酸片段的模式。在与本方法有关的情况下,优选的是,不完全并且优选的随机断裂生成彼此有一个核苷酸差异的所述核酸的所有可能片段的表示。在与本发明有关联的情况下,如果没有明确指示相反,术语核酸分子的片段 (fragments of the nucleic acid molecule)与核酸分子片段(nucleic acid molecule fragments)以可互换的方式使用。基于该原则,本发明包括三个基本过程。在经历根据第一方面的本发明的方法的第一过程中,分离修饰的核酸分子片段和未修饰的核酸分子片段。这种分离提供经历分离和/或分辨步骤的修饰的核酸分子片段的混合物,所述分离和/或辨别步骤提供修饰的核酸分子片段的模式。在第一过程中,修饰潜在地直接或间接地用于分离修饰的核酸分子片段和未修饰的核酸分子,等等。在经历根据第二方面的本发明的方法的第二过程中,在断裂步骤后,修饰的核酸分子片段和未修饰的核酸分子片段没有被分离。相反地,修饰核酸分子片段和未修饰核酸分子片段的混合物经历分离和/或分辨步骤,所述分离和/或辨别步骤提供修饰的核酸分子片段的模式。在该第二过程中,修饰潜在地被直接或间接地用于指引过程(addressing process),等等。这种指引过程是允许靶向混合物的单个修饰的核酸分子片段的过程。靶向典型地是这样的在提供模式的分离步骤或分辨步骤之后,只有修饰的核酸分子片段被显示,而未修饰的核酸分子不被显示,尽管它们仍然存在于混合物中。优选地,这种显示由至少一个修饰介导或由至少一个修饰产生。由于靶向,因而在该意义上,仅修饰的核酸分子片段实际上经历根据本发明的方法的进一步的步骤(一个或多个)。在经历根据第三方面的本发明的方法的第三过程中,其核苷酸序列待测定的核酸分子的多个分子经历处理。基本上,这种处理以选择性的方式修饰形成核酸分子的核碱基一个种类。例如,处理是这样的只有核酸分子中的U被选择性地修饰。但是,重要地不是所有核酸分子的U都被修饰。但是,如果考虑核酸分子的多个分子,则在统计学上,这种核酸分子的每一选择性修饰的核碱基(nuclecAasis)都被修饰。结果,如此修饰的核酸分子或核酸分子的多个分子被断裂,优选地被化学断裂以致核酸的主链,优选地核酸磷酸主链以选择性方式在单个修饰的核碱基3’方向上被断裂。通过这样做,生成所有可能的片段, 优选地,根据其长度,它们可经历直接或间接的分析。在优选的实施方式中,这种分析通过 LC-MS禾口 /或LC-MS-MS手段进行。将会认识到的是,根据本发明的方法的可能的特征,更具体而言,分别与本发明的三个过程和方面之一相关联的特征——其与所述三个方面之一相关联在本文中概述,可以形成如本文所概述的测定本发明的核酸分子的核苷酸序列的任何方面,因而的本发明的过程以及任何方法的一部分。如在本文优选使用的,分离是将物质的混合物转化、分开或分离(isolation)成两种或更多种不同的产物。在某些实施方式中,分离包括将5'片段、3'片段和内部片段的混合物转化成仅仅是5'片段或3'片段的混合物。在其它实施方式中,如进行的,分离包括将5'片段或3'片段的混合物例如用LC分开成更进一步的分开物(divisions),如单个组分,在LC中峰代表单个片段或小的片段组。在其它实施方式中,分离包括从5'片段、 3'片段和内部片段的混合物分离(is0lating)5'片段或3'片段,其中例如LC将进行上面的转化和分开步骤。本领域技术人员将会认识到,分离可能不是绝对的。相反地,分离的产品可以仍然包含也已包含在已经经历分离的原料中的化合物,尽管其处于降低的水平。如本文优选使用的,分辨力是从物质混合物和/或彼此区分、检测或显示不同的产物的能力。在某些实施方式中,分辨将从未标记的片段中区别/检测/显示标记的片段。 在其他的实施方式中,其将被用于使标记的片段彼此区分,例如,质谱,以及LC,以在与片段 2不同的保留时间示出片段1。两种实施方式原则上可以在同一步骤中同时实现。如本文优选使用的,“核酸分子(nucleic acid molecule) ”和“多核酸分子 (nucleic acid molecules) ”是指多核苷酸或寡核苷酸如脱氧核糖核酸(缩写DNA)和核糖核酸(缩写RNA)。而且,术语“核酸分子(a nucleic acid molecule) ”包括多个核酸分子。 术语“核酸分子(nucleic acid molecule) ” 和“多核酸分子(nucleic acid molecules)” 应该被理解为包括,作为等价物的,从核苷酸类似物、单链(正义或反义)和双链多核苷酸或寡核苷酸制得的RNA或DNA的变体或类似物。脱氧核糖核苷酸包括脱氧腺嘌呤、脱氧胞嘧啶、脱氧鸟嘌呤和脱氧胸腺嘧啶。核糖核苷酸包括腺嘌呤、胞嘧啶、鸟嘌呤和尿嘧啶。提及作为“多核苷酸”的核酸分子以其最宽的意义使用,以指通过共价键连接的两个或更多个核苷酸或核苷酸类似物,其包括单链或双链分子。术语“寡核苷酸”也在本文中使用以指通过共价键连接的两个或更多个核苷酸或核苷酸类似物,但是如本文定义的,寡核苷酸包括少于100个的核苷酸。如本文所用的,在一个实施方式中,术语核酸分子包括脱氧核糖核苷酸和核糖核苷酸。这种核酸分子也称为杂化物(杂种,hybrid)、杂合核酸分子或嵌合核酸分子。本领域技术人员将会认识到,按照如本文所述的本发明方法的核酸分子的测序也可以与其它技术组合以合成(synthesise)作为由RNA和下列任何或全部组成的杂化物的核酸分子2'功能化RNA如2' -0-甲基、2’-氨基、2’-C-烯丙基、2’-氟、2’-0-烯丙基; DNA、LNA、D-和L-构象的核酸分子的组合、在磷位置具有修饰的核苷酸。例如DNA+RNA。可选地,用碱水解将得到一半片段,但是可以对的确要(do get)的片段使用MS/MS技术以测序整个分子。如果是DNA的一段序列,那么可以测序RNA,并且可以对DNA进行MS/MS等。 也要认识到的是,就本发明而言,许多变化对于本领域技术人员来说将是明显的。本领域技术人员也将认识到仍有按照如本文所述的本发明的方法测序核酸分子的可能性,在所述核酸分子中修饰不在3’或5’末端处,而且可以距离这样的末端多至25 个核苷酸。这在例如标记是DNA-M0D-RNA的情况下是可能的。或者,例如,如果修饰距离端部为5个核苷酸,则能测序的最小的片段将是11聚体(Ilmer),其中11聚体的其余部分用 MS/MS测序。最后,本领域技术人员也将认识到在本实施方式或任何其它实施方式中,修饰可以在核碱基上。同样地,如本文优选使用的,经历本发明方法的核酸可以包括至少一个LNA核苷酸。在本发明方法的实施方式中,核酸由LNA核苷酸组成。同样地,如本文优选使用的,经历本发明方法的核酸可以包括至少一个PNA核苷酸。在本发明方法的实施方式中,核酸由PNA核苷酸组成。核酸分子的特征在于形成核酸分子的所有连续的核苷酸通过一个或多于一个共价键彼此连锁(linked)或彼此连接(connected)。更具体而言,这种核苷酸的每一个优选地通过磷酸二酯键或其它的键与两个其它的核苷酸连锁或连接,形成连续核苷酸的一段序列。然而,在这种排列中,两个末端核苷酸,即,优选地在5’端和3’端处的核苷酸,被各自与单个核苷酸连锁,这仅仅在这样的条件下这种排列是线性排列并且不是环形排列,因而是线性而不是环形分子。在本申请的另一实施方式中,核酸分子包括至少两组连续核苷酸,其中在每一组连续核苷酸内,每一核苷酸优选地通过磷酸二酯键或其它的键与两个其它的核苷酸连锁或连接,形成连续核苷酸的一段序列。然而,在这种排列中,两个末端核苷酸,即,优选地在 5’端和3’端处的核苷酸,仅仅每个被与单个核苷酸连锁。然而,在这样的实施方式中,两组连续的核苷酸不通过这样的共价键彼此连锁或彼此连接通过共价键——优选地在所述两个核苷酸的一个的糖部分和所述两个核苷酸或核苷的另一个的磷部分之间形成的共价键——将一组的一个核苷酸与另一组或其它组的一个核苷酸连锁。但是,在可选的实施方式中,两组连续的核苷酸通过这样的共价键彼此连锁或彼此连接通过共价键——优选地在所述两个核苷酸的一个的糖部分和所述两个核苷酸或核苷的另一个的磷部分之间形成的共价键——将一组的一个核苷酸与另一组或其它组的一个核苷酸连锁。优选地,所述至少两组连续的核苷酸不通过任何共价键连锁。在另一优选的实施方式中,所述至少两组通过不同于磷酸二酯键的共价键连锁。术语核酸分子优选地还包括D-核酸分子或L-核酸分子。优选地,核酸分子是 L-核酸分子。此外,核酸分子的一个或几个部分作为D-核酸分子存在以及核酸分子的至少一个或几个部分是L-核酸分子是可能的。术语核酸分子的“部分”应当指小至一个核苷酸。这样的核酸分子在本文中一般分别称为D-和L-核酸分子。因此,在优选的实施方式中,根据本发明的核酸分子由L-核苷酸组成并且包括至少一种D-核苷酸。这种D-核苷酸优选地附着于不同于限定核酸分子的一段序列的部分,优选其这样的部分,在这氧的部分中涉及与核酸分子的其它部分的相互作用。优选地,这种D-核苷酸在任何一段序列和任何核酸的末端处被附着。如本文所用,L-核酸是由L-核苷酸组成的核酸分子,优选地完全由L-核苷酸组成的核酸分子。如本文所用,D-核酸是由D-核苷酸组成的核酸分子,优选地完全由D-核苷酸组成的核酸分子。同样地,如果没有相反指示,任何核苷酸序列在本文中以5’ 一 3’的方向提供。不论核酸分子是否由D-核苷酸、L-核苷酸或两者的组合组成——其中组合是例如随机的组合或者由至少一种L-核苷酸和至少一种D-核酸组成的一段序列的限定序列, 核酸分子可以由脱氧核糖核苷酸(一种或多种)、核糖核苷酸(一种或多种)或其组合组成。不论核酸分子是否是D-核苷酸、L-核苷酸、它们的混合物、DNA、或RNA、或其每一和任意组合,如本文优选地使用的,术语核酸分子也应该包括单链核酸分子和双链核酸分子,其中优选地,经历根据本发明的方法的核酸分子是单链核酸。如果其核苷酸序列的待测序定的核酸分子是由两个独立的链即第一链和第二链组成的双链结构,那么这样的链优选被分离,并且每一分离的链然后经历根据本发明的方法。可选地,如果所述两个链中只有第一链显示修饰——根据本发明方法的第一过程,所述修饰被用于分离修饰的核酸分子片段与未修饰的核酸分子片段,并且根据本发明方法的第二过程,所述修饰被用于指引 (address)过程中,则双链核酸的这种分离不是必须的。应该理解这种双链核酸分子的第二链的核苷酸序列可以被测定,因此优选地在平行的方法中,所述第二链显示这种修饰而第一链不显示。在进一步可选的方法中,第一链和第二链的修饰是不同的。如本文中优选使用的,术语核酸分子也应包括具有内部间隔区的核酸分子。优选地,内部间隔区被用于连锁核酸分子的两个核苷酸序列。优选地,这种内部间隔区是包含至少一个,优选地多个乙二醇部分的亲水间隔区。对于本领域技术人类来说,多种内部间隔区各自是已知的并且可以使用如由Pils和Micura(Pils & Micura,2000)描述的下述标准进行选择。内部间隔区应该不干扰或不会干扰碱基对本身。由于包含芳香碳环的间隔区类型堆积在末端碱基对,因此其是不太适合的(Lewis等人,1999)。但是,由于基于乙二醇的或源于乙二醇的间隔区具有良好的水溶解性和高的构象柔性(Durand等人,1990 ;Ma等人, 1993 ;Thomson等人,1993),因此,它们满足不干扰碱基对的要求。优选地,间隔区包括一个或几个乙二醇部分或由一个或几个乙二醇部分组成,其中氧被CH2、磷酸酯或硫置换或取代。如本文中优选使用的,术语核酸分子也应该包括核苷酸修饰的核酸分子。核酸分子可以是核苷酸修饰的RNA或核苷酸修饰的DNA分子。其中通过用抗核酸酶基团例如, 2’ -氨基、2’ -C-烯丙基、2’ -氟、2’ -0-甲基、2’ -H在单个的核苷酸处大量修饰RNA或DNA 分子以增加稳定性(参见综述,^rnian & Cedergren,1992)。具有核苷酸——包括碱基(一个或多个)、糖主链和/或磷酸酯键——修饰的化学合成核酸分子可以通过血清核糖核酸酶防止它们的降解,这可以增加核酸分子的体内效力在本领域中存在数个描述糖、碱基和磷酸酯修饰的实例,所述修饰可以被引入核酸分子,获得核酸酶稳定性和效力的显著增强。例如,核酸分子通过用抗核酸酶基团例如2’ -氨基、2’ -C-烯丙基、2’ -氟、2’ -0-甲基、2’ -0-烯丙基、2’ -H的修饰和核苷酸碱基修饰被修饰以增强稳定性和/或增强生物学活性(参见综述,Burgin等人,1996 ; Usman & Cedergren,199 。在本领域内已将大量描述了核酸分子的糖修饰(参见国际专利申请 WO 91/03162、WO 92/07065、WO 93/15187、WO 97/26270 ;WO 98/13526 ;US 专利 US 5,334,711、US 5,716,824 ;US 5,627,053 ; (Beigelman 等人,1995 ;Pieken 等人,1991 ; Usman & Cedergren,199 。这些出版物描述了测定糖、碱基和/或磷酸酯修饰等并入核酸分子而不调节催化作用的位置的一般方法和策略,并且其通过引用并入本文。鉴于这样的教导,类似的修饰可以如本文描述的被使用以修饰本发明的核酸分子,只要这种核酸分子具有结合它们各自的靶的能力。
尽管用硫代磷酸酯、二硫代磷酸酯和/或5’ -甲基膦酸酯键化学修饰寡核苷酸核苷酸间键提高了稳定性,但是过多的修饰可能引起一些毒性或降低的活性。因此,当设计核酸分子时,这些核苷酸间键的量应该被最少化。这些键浓度的减少应该降低毒性。如本文中优选使用的,术语核酸分子也应该包括完全封闭(closed)的核酸分子。 如果根据本发明的其核苷酸序列待被测定的核酸分子优选地通过共价键——其中更优选地,这种共价键在本文公开的核酸分子序列的5’端和3’端之间形成——封闭,则可以获得完全封闭的,即,环形的核酸分子结构。如本文中优选使用的,术语核酸分子也应该包括包含非核酸分子部分的任何核酸分子。这种非核酸分子部分可以选自肽、寡肽、多肽、蛋白质、糖类、将在下述更详细概述的各种基团。因而,术语核酸分子也应该包括包含至少一个核酸部分和至少一个另外的部分——其可以被用于促进将核酸分子递送到生物学系统诸如细胞内——的嗫合物和/或复合物。所提供的嗫合物和复合物可以通过将治疗化合物转移通过细胞膜,改变药物动力学和/或调节本发明的核酸分子的定位而赋予治疗活性。优选地,这些种类的嗫合物和复合物适于递送分子穿过细胞膜,所述分子包括但不限于小分子、脂类、磷脂、核苷、核苷酸、核酸、抗体、毒素、带负电荷聚合物和其他聚合物,例如蛋白质、肽、激素、糖类、聚乙二醇或聚胺。一般而言,所描述的转运蛋白被设计为单独使用或者作为多组分系统的部分使用,其具有或不具有可降解的连接体。这些化合物被期望提高在血清的存在与不存在下核酸分子到源于不同组织的多种细胞类型内的递送和/或定位(参见美国专利US 5, 854, 038) 0本文描述的分子的嗫合物可以经由生物可降解的连接体诸如生物可降解的核酸连接体分子附着于具有生物学活性的分子。如在下面与其序列待被测定的核酸分子相关联详述的,非核酸部分可以是PEG部分,即,聚(乙二醇)部分,或HES部分,S卩,羟乙基淀粉部分。非核酸部分,优选地PEG和/或HES部分可以直接或通过连接体附着(连接)于核酸分子。核酸分子包括一个或多个修饰,优选地一个或多个PEG和/或HES部分也在本发明的范围之内。在一个实施方式中,单个连接体分子将多于一个的PEG部分或HES部分附着到核酸分子。与本发明相关所使用的连接体本身可以是直链的或支链的。这些种类的连接体对于本领域技术人员来说是已知的并且在专利申请WO 2005/074993和WO 2003/035665 中被进一步描述。在优选的实施方式中,连接体是生物可降解的连接体。此外,由于从核酸分子释放修饰,生物可降解的连接体允许在动物体内优选地在人体内的停留时间方面等改变核酸分子的特征。生物可降解连接体的使用允许更好地控制核酸分子的停留时间。这种生物可降解连接体的优选实施方式是诸如在下述——但不限于下述一一国际专利申请中描述的那些生物可降解连接体W0 2006/052790、WO 2008/034122、WO 2004/092191 和 WO 2005/099768,其中在国际申请WO 2004/092191和WO 2005/099768中,连接体是聚合寡核苷酸前体药物——其由一个或两个本文描述的修饰、核酸分子和其间的生物可降解连接体的部分组成。如本文优选使用的,“核苷酸”包括但不限于,天然存在的DNA核苷单、二和三磷酸 脱氧腺苷单、二和三磷酸;脱氧鸟苷单、二和三磷酸;脱氧胸苷单、二和三磷酸;和脱氧胞苷单、二和三磷酸(本文分别称为dA、dG、dT和dC或A、G、T和C)。术语核苷酸也包括天然存在的RNA核苷单、二和三磷酸腺苷单、二和三磷酸;鸟苷单、二和三磷酸;尿苷单、二和三磷酸;和胞苷单、二和三磷酸(本文分别称为A、G、U和C),称为碱基-糖-磷酸酯组合,其是核酸分子即,DNA分子和RNA分子的单体单元。然而,也就是说,术语“核苷酸”指包含环状呋喃型糖(在RNA中为p-D/L-核糖,而在DNA中位P-D/L-2'-脱氧核糖)的任何化合物,所述化合物在5’位置处被磷酸化并且具有在C-I'糖位置经由-葡糖基(glycosol) Cl' -N键连接的嘌呤或嘧啶型碱基。核苷酸可以是天然的或合成的,包括已被质量修饰的核苷酸,还包括具有带修饰碱基(例如,5-甲基胞苷)和修饰糖基团(例如2' -0-甲基核糖基、2' -0-甲氧基乙基核糖基、2'-氟核糖基、2'-氨基核糖基等)的修饰的核苷的核苷酸。术语“核碱基(nuc 1 eobase) ”包括天然存在的核酸碱基腺嘌呤(A)、鸟嘌呤 (G)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)乙基非天然存在的核碱基诸如黄嘌呤、二氨基嘌呤、8-氧-N6-甲基腺嘌呤、7-脱氮黄嘌呤、7-脱氮鸟嘌呤、N4,N4-乙烯基胞嘧啶 (ethanocytosin)、N6,N6-乙烯基_2,6- 二氨基嘌呤、5-甲基胞嘧啶、5 (C3-C6)-炔基-胞嘧啶、5-氟尿嘧啶、5-溴尿嘧啶、假异胞嘧啶、2-羟基-5-甲基-4-三唑吡啶、异胞嘧啶、 异鸟嘌呤、肌苷以及在Freier & Altmann的出版物中美国专利US 5,432, 272 (Freier & Altmann, 1997)中描述的“非天然存在的”核碱基。因此,术语“核碱基”不仅包括已知的嘌呤和嘧啶杂环,而且也包括其杂环类似物和互变异构体。在第一步,提供其序列待被测定的多个核酸分子。该多个核酸分子优选地包括多个单个分子,其允许在随机断裂所述多个核酸分子之后,产生核酸分子的所有可能片段或所有相关片段的表示。如本文优选使用的,术语片段在狭义上指包括或由如此核苷酸序列组成的核酸分子,所述如此核苷酸序列与全长核酸分子相比,就核苷酸序列而言,比全长核酸分子短一个或多于一个核苷酸。其序列待被测定的核酸分子在本文中也称为亲本(母本)核酸分子。如本文优选使用的,术语5’片段指具有完整5’末端的片段,具体而言,是包括亲本核酸分子5’末端核苷酸的那些片段。相似地,如本文使用的,术语3’片段指具有完整3’ 末端的片段,即,包括亲本核酸分子3’末端核苷酸的那些片段。如本文使用的,术语内部片段指不包含完整末端并且因此同时缺少5’和3’末端核苷酸的那些片段。如本文优选使用的,术语完整的在与5’末端和3’末端相关联的情况下,指如果是 5’末端,优选地其核苷酸序列待被测定的核酸分子的5’末端核苷酸存在于核酸分子中,更优选地存在于核酸分子的多个分子或其片段(一个或多个)中,并且如果是3’末端,优选地其核苷酸序列待被测定的核酸分子的3’末端核苷酸存在于核酸分子中,更优选地存在于核酸分子的多个分子或其片段(一个或多个)中。为了易于描述本发明,术语片段优选地也应包括全长核酸分子。因而,核酸分子的片段可以如一个核苷酸一样短,并且可以如全长核酸分子一样长。本领域技术人员应理解多个片段不一定必须包括所有可能的核酸分子片段。取决于本文描述方法的进一步的目的,具有允许建立核酸分子指纹的有限数目的片段可能是足够的,其中这样的指纹对于鉴定核酸分子是足够的。如本文优选使用的,术语“核酸分子的多个分子”指核酸分子的多个拷贝并且优选地表示亲本核酸分子的多个拷贝。优选地,与此相联系,多个拷贝指允许实践本发明方法的多个拷贝。需要拷贝的精确数目取决于本发明方法的具体实施方式
和与这样的步骤和方法分别相联系所使用的技术。单个片段需要的拷贝数的下限优选地是仍然允许生成模式和推断所述片段的核酸序列的数目。拷贝的一般范围是IX 10_18 to 1X10_3摩尔。如本文优选使用的,核酸分子的拷贝是基本上具有相同核苷酸序列的核酸分子。 更具体而言,核酸分子的拷贝在所述拷贝被制备的核酸分子的所有物理和化学性质上是相同的。核酸分子的多个分子带有或具有修饰。在与本发明的第一和第二过程相联系的情况下,多个所述分子带有或具有修饰的程度为——如上面所概述的——在随机断裂所述多个分子之后,每一可能的片段或每一相关的片段带有或具有这样的修饰。本领域技术人员也将理解这样的片段是核酸分子的种类并且这样的种类典型地不仅作为单拷贝存在而且也作为多个单个拷贝或分子存在。也将理解的是,不是每一这种片段的单拷贝必须带有或具有这样的修饰。此外,存在具有或带有修饰的单个片段的多个拷贝。单个片段拷贝的最小数目取决于在根据本发明的方法的随后步骤中使用的方法,典型地在生成模式中使用的方法。单个片段需要的拷贝数的下限优选地是仍然允许生成模式并且推断所述片段的核酸序列的数目。为了如所述的通过本文方法测序,通过如本文所述的测序方法的核酸分子在其核苷酸序列的5’或3’端处包含修饰或者在其核苷酸序列的5’或3’端处被修饰具有修饰。 因此,未修饰的核酸分子必须被预先修饰,之后它们可以通过本文所述方法进行测序。核酸分子的多个分子具有的修饰可以在合成期间或之前被直接并入寡核苷酸 (例如美国专利US 5,736,6 和US 5,141,813)。可选地,例如,亲核的官能团如脂肪族伯胺,被引入核酸分子上的修饰附着位点处,例如,在核酸分子的5’末端或3’末端处。在核酸分子的固相支持物合成(solid-support synthesis)完成后,核酸分子从支持物断裂并且除去保护基。尽管在合成过程之后,核酸分子包括修饰,但是在另一实施方式中,修饰可以用于添加另一修饰。合成的亲核-核酸分子与例如过量的包含亲电子部分的修饰试剂在均一溶液(homogeneous solution)条件下反应。包含亲电子部分的修饰试剂是例如异硫氰酸酯或活化的酯如N-羟基琥珀酰亚胺(缩写NHS) (Hermanson, 1996)。核酸分子的多个分子具有的修饰在其合成后并且在通过本文描述的方法测序核酸分子之前可以被进一步并入寡核苷酸。用于将修饰装入未修饰核酸分子的方法的实例包括但不限于,酶的和化学操作。例如,使用连接酶,将附着于核苷酸的修饰连接到核酸分子是可能的。一个这样的实例使用"Γ4 RNA连接酶将携带修饰的核苷酸或含有氨基官能团的核苷酸连接到核酸分子的5’端上(Kinoshita等人,1997)。使用化学连接例如通过使用溴化氰连接寡核苷酸也是已建立的技术(Dolirmaya等人,1991 ;Elov等人,1989)。最近已经开发了不使用这种毒性化学品修饰核酸分子的其它方法(Yoshimura等人,2007)。已建立的将修饰引入RNA分子的3’端的技术是用高碘酸钠氧化末端2’、3’顺式二醇以生成二醛,然后用二胺或标记官能化胺(label-functionalised amine)使所述二醛经历双还原性胺化(ftxnidnikov & Mirzabekov,1996)。同前,使用得到的3,胺作为反应性修饰引入修饰。可选地,二醛可以与修饰的卡巴胼衍生物反应以装入修饰而不需要随后的反应(Wu等人,1996)。关于其核苷酸序列待被测定的核酸分子的长度,基本上不存在限制。因此,核酸分子的长度可以如两个核苷酸一样短和如几千个核苷酸一样长。优选地,核酸分子的长度在 15至120个核苷酸之间。本领域技术人员将会认识到,在15至120之间的任何整数都是可能的核酸分子长度。核酸分子长度更优选的范围为大约20至100个核苷酸、大约20至80 个核苷酸、大约20至60个核苷酸、大约20至50个核苷酸以及大约30至50个核苷酸的长度。修饰可以是适合于提供与在本发明相联系的情况下所需要的作用的任何修饰。更具体而言,在与本发明方法的第一过程相联系的情况下所需要的修饰允许分离修饰的核酸分子片段与未修饰的核酸分子片段。与其相反,在与本发明方法的第二过程相联系的情况下,所需要的修饰允许实践指引过程。也会认识到的是,在第一过程和第二过程中,修饰涉及分离或分辨修饰的核酸分子片段。修饰可以具有双重功能或提供两种功能在本发明之内。在这种情况下,修饰可以是未分修饰。可选地和特别地,在其中需要双重功能的那些情况下,修饰可以是,二分或多分修饰。二分或多分功能包括可以直接彼此连接或通过使用连接体连接的第一部分和第二部分。在这种情况下,第一部分或第二部分被用于分离修饰的核酸分子片段与未修饰的核酸分子片段,而第二或第一部分被用于分离或分辨修饰的核酸分子片段。在进一步的步骤中,多个修饰的核酸分子被随机断裂。在这样的断裂之后,分别产生和提供修饰的核酸分子片段和未修饰的核酸分子片段。取决于其核酸序列待被测定的核酸分子的化学性质,多种技术是适用的,它们同样地在本领域内是已知的。断裂可以是下列技术或其组合的任一种物理断裂、化学断裂、酶切割、通过加热断裂和/或通过使用二价阳离子断裂。这些不同的技术是适用的,只要它们在核酸分子内的特定和可预测位点提供断裂并且符合如本文概括的断裂步骤的另外的要求。在核酸分子序列内特定位置处核酸分子的断裂取决于核酸分子的结构、核酸分子的特定核苷酸之间的共价键的物理化学性质、核酸分子的糖主链的物理化学性质、核酸分子的碱基的物理化学性质、核酸分子的特定碱基和糖主链之间的共价键的物理化学性质、 核酸分子的特定原子;针对核酸分子的特定碱基和/或修饰碱基的断裂剂的特异性;或其组合。核酸分子的物理断裂可以通过使用能够打破共价键的任何物理力实现,其中优选地,产生特定的并且可预测的断裂。这种物理力包括但不限于热、电离辐射诸如X-射线、 UV-射线、Y射线。核酸分子片段的大小可以通过调节暴露于辐射的强度和持续时间进行调节。暴露的强度和持续时间也可以被调节以使辐射对核酸分子的不期望的作用最小化。加热——优选达到水沸腾——也可产生核酸分子片段。通过加热核酸分子溶液断裂核酸分子优选在多种标准缓冲液中进行,例如但不限于伯烷基胺如TRIS (三(羟甲基) 氨基甲烷);仲胺如Tricine(N-(三(羟甲基)甲基)甘氨酸);叔胺如三乙胺,Bis-Tris (二 (2-羟乙基)-亚氨基-三(羟甲基)_甲烷)聚胺如亚精胺,HEPES(4-(2-羟乙基)-1-哌嗪乙磺酸)和PIPES (哌嗪-N,N' -二乙磺酸);季盐离子如四丁铵和四乙铵。含有芳香胺例如咪唑的缓冲液在本领域也是已知的。这样的缓冲液可连同盐酸、氢氟酸、氢溴酸、 磷酸、柠檬酸、苯二甲酸、酒石酸、硼酸和本领域已知的其他酸一起使用。包含碱金属的其他适当缓冲液/溶液在本领域也是已知的。其实例为氢氧化物、碳酸盐、碳酸氢盐(hydrogen carbonate)、磷酸盐、酞酸盐、酒石酸盐、硼酸盐和醋酸盐。优选的pH范围为pH_l到pH15,更优选为PH 4到pH 10。优选的浓度为0. 01到100000 ODs/mL,更优选为10到1000 ODs/ mL。进行反应0. 1和5000分钟之间,更优选为5到100分钟。核酸分子的化学断裂可通过核酸分子的磷酸二酯键的二阶阳离子催化断裂、通过烷基化和/或通过包括碱水解和酸水解在内的水解反应进行。RNA的磷酸二酯键的二阶阳离子催化断裂优选在存在但不限于下列离子的情况下进行Mg2+、Ca2+、Be2+、Ba2+、Fe2+、Zn2+、Cu2+、Mn2+、Cd2+、Sr2+、Ni2+、Co2+、Pb2+,其含量为 0. 000001 到10M,更优选为0. 00001到1M。反应温度为0°C到150°C,更优选为10到100°C。进行反应0. 1到5000分钟,更优选为1分钟到120分钟。RNA的磷酸二酯键的断裂也可使用含有伯烷基胺如TRIS (三(羟甲基)氨基甲烷);仲胺如Tricine(N-(三(羟甲基)甲基)甘氨酸);叔胺如三乙胺,Bis-Tris (二(2-羟乙基)-亚氨基-三(羟甲基)_甲烷)聚胺如亚精胺,HEPES(4-(2-羟乙基)-1-哌嗪乙磺酸)和PIPES(哌嗪-N,N' -二乙磺酸);季盐离子如四丁铵和四乙铵的溶液进行。含有芳香胺例如咪唑的缓冲液在本领域也是已知的。在0. 000001到IOM之间,更优选0. 00001 到1M。反应温度为0°C到150°C,更优选为10到100°C。进行反应0. 1到5000分钟,更优选为1分钟到120分钟。核酸分子烷基化作为断裂核酸分子的方法由Browne和Gut & Beck (Browne,2002 ; Gut & Beck,1995)描述。可以使用碱水解断裂RNA分子,这是因为RNA在碱性条件下是不稳定的(NordhofT 等人,1993)。RNA分子的碱水解优选在7. 5到15的pH范围进行,更优选在9到15的pH范围进行。反应温度为0°C到150°C,更优选为50到150°C。进行反应0. 1到5000分钟,更优选为1分钟到100分钟。也可以使用酸水解断裂RNA分子,这是因为RNA在酸存在下——优选在强酸如无机酸像HCl和有机酸如对-Tolene-磺酸存在下——可被水解。RNA分子的酸水解优选在-1 到6. 5的pH范围进行,更优选在1到4的pH范围进行。反应温度为0°C到150°C,更优选为20到100°C。进行反应0. 1到5000分钟,更优选为1分钟到100分钟。在严格条件下, 水解可以断裂核糖和嘌呤以及嘧啶碱基之间的磷酸酯键和N-糖苷键两者。可以使用酸水解断裂DNA分子,这是因为DNA在酸存在下——优选在强酸如无机酸像HCl和有机酸如对-Tolene-磺酸存在下——可被水解。DNA分子的酸水解优选在0到 5.5的pH范围进行,更优选在1到2的pH范围进行。反应温度为0°C到150°C,更优选为 20到100°C。反应进行0. 1到5000分钟,更优选1分钟到100分钟。取决于条件和反应时间的长度,可将核酸分子断裂成包括一个核苷酸片段在内的各种大小。特别地,在严格条件下,水解可以断裂脱氧核糖和嘌呤以及嘧啶碱基之间的磷酸酯键和N-糖苷键两者。基于酸和/或碱水解产生核酸分子片段的方案先前已经描述(Maxam & Gilbert, 1977 ;Peattie,1979 ;Sargent,1988)。酶可用于断裂核酸分子,并通常与通过MS的核酸测序结合使用(Alazard等人, 2002 ;Bentzley 等人,1998 ;Bentzley 等人,1996 ;Faulstich 等人,1997 ;Glover 等人, 1995 ;Kirpekar 等人,1994 ;Owens 等人,1998 ;Pieles 等人,1993 ;Schuette 等人,1995 ; Smirnov等人,1996 ;Wu & Aboleneen,2001 ;Wu等人,1998a)。切割核酸分子的这类酶在本领域是已知的(SambrOOk,2001),并且是商业上可获得的。取决于使用的酶,核酸分子被非特异性切割或者在特定的核苷酸序列处切割。可以使用能够切割核酸分子的任何酶,其包括但不限内切核酸酶、外切核酸酶、核糖核酸酶和DNA酶。内切核酸酶具有切割核酸分子链内键的能力,其中内切核酸酶可以对双链或单链核酸分子具有特异性。核酸分子的切割可以在核酸分子内随机进行,或者可以在核酸分子的特定序列处切割。核酸分子的特定断裂可以使用一种或多种酶以顺序反应或同时进行。 限制性内切核酸酶是内切核酸酶的亚类,其识别双链核酸分子内的特定序列,并通常在识别序列内或近处切割两条链。内切核酸酶可以对某种类型的核酸分子具有特异性,优选对 DNA或RNA分子是特异性的。RNA或DNA分子特异性内切核酸酶的实例是核糖核酸酶H、核糖核酸酶A、核糖核酸酶T1、核糖核酸酶U2、核糖核酸酶P和在国际专利申请W02004/097369 第43页第5行到第44页第4行讨论的核糖核酸酶。为了减少序列测定的不定性,可以进行附加的限定的碱水解。因为在这些条件下,每个磷酸二酯键潜在地被切割,这样可以获得有关遗漏和/或特定切割的信息 (Donis-Keller 等人,1977)。作为内切核酸酶的替代物,对于DNA分子断裂,可以使用DNA糖基化酶。DNA糖基化酶特异性地从给定DNA核酸分子除去某种类型的核碱基(nucleobase)。其中,这些酶可以在核酸分子的序列中产生脱碱基位点,其中脱碱基位点可以通过在脱碱基位点特异性切割暴露的磷酸盐主链并产生表现序列的一组核碱基特异性片段的另一切割酶识别,或者通过化学方法例如碱性溶液和/或加热识别。DNA糖基化酶和其靶核苷酸的一个组合应用将足以产生核酸分子的碱基特异性特征模式。大量DNA糖基化酶是已知的,并且在国际专利申请W02004/097369第44页第13行到第45页第7行讨论。DNA分子的碱基可以用特定化学品修饰,以便修饰的碱基被特异性DNA糖基化酶识别(参见国际专利申请W02004/097369第45页第8行到第45页第沈行)。通过糖基化酶处理和随后的脱碱基位点切割,产生核酸分子片段。本文的核酸分子断裂也可通过本领域普通技术人员已知的二核苷酸特异性断裂试剂进行,并将其作为参考并入本文(W0 94/21663 ;Cannistraro & Kennell,1989)。脱氧核糖核酸酶(简写为DNase)也可用于生成DNA分子片段(Anderson,1981)。 DNase I是将双链DNA和单链DNA消化成多和单核苷酸的内切核酸酶。其他的DNAase是 DNase II、DNase H、DNase IT、DNase IX 等,其在国际专利申请 W02004/097369 第 46 页第 26行到第47页第6行讨论。外切核酸酶是从单链或双链核酸分子例如DNA分子末端切割核苷酸的酶。具有 5'外切核酸酶(从其5'端切割DNA分子)和3'外切核酸酶(从其3'端切割DNA)。除了上面描述的基于蛋白质的酶,DNA酶和RNA酶在本领域是已知的,并且可用于切割核酸分子以产生核酸分子片段(Santoro & Joyce,1997 ;Schlosser等人,2008a ; Schlosser 等人,2008b);美国专利 US 6,326,174、US 6,194,180、US 6,265,167、US 6,096,715 ;US 5,646,020)。离子化断裂核酸分子是又一选择,以便提供随机地断裂,并且例如在质谱分析期间通过在质谱仪的离子源中使用高电压以通过MS使用在离子阱中的碰撞诱导分辨进行片段化来完成(Biemarm,1990)。使用发表的与MS中的单个核苷酸残基相关的质量,根据在所得到的核酸分子的MS断裂模式中观测到的分子量差异推断碱基序列。
可以使用断裂方法的任意组合,以及酶的任意组合形成核酸分子片段。因此,本领域普通技术人员将理解所有这些断裂反应的任意组合包括在本发明的方法中,所述断裂反应例如通过加热、碱性PH、二胺或甚至酸性pH,其可降解RNA—一特别是在升高温度下、离子化和一种或多种酶以及上述组合。此外,产生核酸分子特定片段的方法可以与产生核酸分子随机片段的方法组合。另外,在特异性位点切割核酸分子的一种或多种酶可以与在不同位点特异性切割核酸分子的一种或多种酶组合使用。在另一实例中,切割特定种类核酸分子的酶可以组合使用。在另一实例中,随机切割核酸分子的酶可以与特异性切割核酸分子的酶组合使用。组合使用指在核酸分子上依次或同时进行一种或多种方法。与本发明相关的,断裂或断裂步骤包括随机地断裂多个修饰的核酸分子。如本文优选使用的,术语随机地表示每个核酸分子在其核苷酸序列内及在其一级核酸结构内的一个或多个位点断裂。与本发明相关的,在已知的位点以可重复的方式进行断裂是必然的,尽管其是统计学上的。对于进行本发明,单独分子是否被断裂一次或多次是无关的,只要总的断裂提供核酸分子的所有可能片段和所有相关片段的显示(表现度,representation)。与所述断裂相关的,必须承认通常地并且如在在各自反应中存在,不但修饰的核酸分子种类将被断裂,而且那些不带有或不具有这些修饰的核酸分子种类也将被断裂。至此,断裂不但为随机断裂,而且为限制性断裂,因为非限制性断裂或完全断裂将导致产生单个核苷酸或不适于提供这类显示的片段。在进一步的步骤中,根据本发明的方法包括将修饰的核酸分子与未修饰的核酸分子片段分离的步骤。如本领域普通技术人员所了解的,该步骤优选地仅包括在根据本发明方法的第一过程中。该分离步骤基于修饰核酸分子片段优选地在其整体中与未修饰片段——更优选的在其整体中——的区别原则进行。这类区别可基于质量、大小或疏水相互作用,其是固有的或由于修饰赋予修饰核酸分子片段的或由于修饰非核酸分子片段不具有的。允许这类分离的技术广义上包括过滤、透析和色谱(层析)等,即基于配体和所述配体的相互作用配偶体之间的相互作用的分离。必须承认优选地核酸分子的所有可能片段或所有相关片段的显示基本上在该分离步骤中得以保持。将修饰核酸分子片段与未修饰核酸分子片段分离的特别优选的原则是利用配体作为修饰,包括其用作二分或多分修饰(multipartite modification)的第一或第二部分。在优选的实施方式中,修饰的核酸分子的修饰是直接或间接连接于核酸分子的5’ 或3’ -末端核苷酸的配体。本文间接连接指在配体和核酸分子的5’或3’ -末端核苷酸之间,安装连接体。配体指结合的某些东西。如本文使用的配体是与核酸分子连接的部分,其中配体与允许配体与结合配偶体结合的结合配偶体相互作用,其中由于配体和结合配偶体的结合,与配体连接的核酸分子被固定。在一个实施方式中,相互作用配偶体附着于相(phase),其中这种相与包括修饰的核酸分子片段和优选地也包括未修饰核酸分子片段的相不同。优选地,这种相是固相。这类固相例如通过固相支持物形成。固相支持物优选地选自包含聚合物的基,优选地塑料、玻璃、琼脂糖和金属。由于配体和相互作用配偶体之间的相互作用,配体并因此修饰的核酸分子片段被固定于相互作用配偶体附着的相。根据配体和相互作用配偶体产生的相互作用的类型,固定优选地可以是化学固定、亲和固定或磁固定。特别优选的固定形式是基于下列相互作用的化学固定,其中提供这类相互作用的要素之一是配体,而提供这类相互作用的另一个要素是相互作用配偶体。进行本领域普通技术人员已知的实践的实例包括但不限于胺和活化羧酸,胺加活化氨基甲酸酯,胺和异氰酸酯/异硫氰酸酯,胺加卤化物,胺加马来酰亚胺部分,胺加醛/酮,羟胺或酰胼加酮/醛,胼衍生物和活化羧酸,胼和异氰酸酯/异硫氰酸酯,胼加卤化物,胼加马来酰亚胺部分,胼+醛/酮胼+醛/酮,然后还原胺化硫醇加卤化物,硫醇加马来酰亚胺,硫醇加活化硫醇,硫醇加乙烯砜和其他迈克尔加成反应物(Michael addition reactions)叠氮化物加炔加Cu盐和其他“点击化学(click chemistry),,相互作用配偶体 (Kolb 等人,2001),叠氮化物加活化羧酸经由斯托丁格尔反应(Staudinger reaction),利用烷基或芳基P(III)部分,叠氮化物加附着于吸电子阱的三价膦(斯托丁格尔结扎(Maudinger ligation)),叠氮化物加膦基硫烃酯-无痕斯托丁格尔结扎(phosphinothiol ester-traceless Staudinger ligation),叠氮化物加醛/酮+PWi3 (斯托丁格尔)以形成之后可被任选地还原为相应胺的亚胺,胺加羧基-羧酸官能团加氨基官能团,例如胺、胼,顺式二醇(例如,在RNA分子的3’末端上所见的)被氧化为二醛,其之后例如在如硼氢化物介导的还原后,与胺或胼衍生物形成环胺,硫酯加半胱氨酸-天然结扎和衍生物,硫代磷酸酯(phosphothioate) + α -含卤代羰基的接合体(conjugants),磷酸酯+胺至磷酰胺酯,例如经由磷酸酯活化磷酸酯+醇至磷酸二酯,例如经由活化,CN 102203292 A
醛至形成仲胺(在用硼氢化物还原后),胼基至形成腙,氨基脲至形成缩氨基脲,半胱氨酸衍生物+硫酯酞环氧化物加胺烯/炔+ 二烯/ 二炔,进行第尔斯-阿尔德反应(Diels Alder reaction)和其他的周环反应通过将醛与羟胺反应形成肟羟基或氨基+环氧化物上述反应或至少其一些是Smith和March,2007和Hermanson,2008描述的,等等。也应该知道标签/标记或配体的化学添加也可基于但不限于上述列出的官能团相互作用进行,其中提供这类相互作用的一个要素附于核酸分子,而提供这类相互作用的另一个要素附于标签,相互作用配偶体。特别优选的固定形式是基于下列相互作用的亲和固定,其中提供这类相互作用的一个要素是配体,而提供这类相互作用的另一个要素是相互作用配偶体生物素-抗生物素蛋白相互作用、生物素-中性抗生物素蛋白相互作用、生物素-链亲和素相互作用、抗体和抗原或半抗原的相互作用、两个寡核苷酸的相互作用——其中核酸分子由DNA、RNA、LNA、 PNA或其组合组成,钙调蛋白和钙调蛋白结合肽的相互作用、清蛋白和Cibracon蓝的相互作用、金属-螯合剂和金属-螯合支持物的相互作用。在修饰的核酸分子片段固定后,将未修饰核酸分子片段从修饰的核酸分子片段移出。这种移出是本领域普通技术人员已知的标准过程。优选地,通过洗涤或通过转移包含其上固定修饰的核酸分子片段的相至相互作用的配体附着的相,将未修饰核酸分子片段分别地从反应物和反应容器——在这里已经进行分离步骤——移出分别进入新的反应物和反应容器。如本文使用的术语洗涤指应用液体介质,以便从其修饰片段被螯合的相除去未修饰片段或其他的化学本体。在进一步的子步骤中,固定的修饰的核酸分子片段从相互作用配偶体附着的相移出,因此释放修饰的核酸分子片段。这种释放可以通过本领域普通技术人员已知的任何方法实现。更具体地说,这种释放可以通过加入过量的配体的相互作用配偶体——其与配体与附着于相的相互作用配偶体的结合进行竞争——得到实现。该方法的替代方法是将相互作用配偶体与相分离,以便释放的修饰的核酸分子片段也包括此刻从在这种释放以前附着的相释放的相互作用配偶体。在进一步实施方式中,相互作用配偶体和配体之间的相互作用通过共价键形成,并且相互作用配偶体从配体移出,其中共价键被化学地和/或酶切割或通过光断裂。在可选的实施方式中,相互作用配偶体和配体之间的相互作用通过非共价键形成,并且相互作用配偶体从配体移出,其中非共价结合通过PH、温度和/或离子力的变化,通过配体和/或相互作用配偶体的变性,通过用竞争分子洗脱,通过利用有机溶剂和离液剂进行断裂。在另一实施方式中,通过断裂用于将配体结合到(修饰的)核酸分子片段的连接体,从相互作用配偶体附着的相移出修饰的核酸分子片段。在这种实施方式中,必须确保修饰的核酸分子片段仍然包括允许修饰的核酸分子片段分离或分辨的修饰。在根据本发明的方法的下一步骤——其适用于第一和第二方法——中,修饰的核酸分子片段根据它们的长度、质量和/或电荷被分离或分辨,其中这种分离或分辨产生修饰核酸片段的模式。这种分离通过使用作为修饰的核酸分子片段的部分的修饰进行。在该分辨步骤中,必须使在从作为混合物的未修饰核酸分子片段分离后存在的修饰的核酸分子片段——单独的片段,即单独的片段种类——是可获得的(可引导的, addressable)。该使单独的片段种类为可获得的方法基于所述片段种类在其长度、质量和 /或电荷方面的差异。因此,对修饰的核酸分子片段的混合物运用分辨混合物的技术,以便单独的种类彼此分离。这种分离可以是时间、空间、质量和/或质核比方面的分离。进行这种分离的方法是本领域普通技术人员已知的,并且也在本文进行描述,其包括将被并入说明书本部分以避免不必要重复的公开内容的介绍。如本文优选使用的,时间的分离是其中在显示器(display)上随时间一个种类的片段跟随另一个的分离。在时间上给定的时刻, 则仅一种或有限数量的这些种类存在于显示器,这取决于时间窗的宽度和这种显示器包括的时间窗。如本文优选使用的,空间的分离是其中在显示器上在二维或三维空间的位置处布置或存在一个种类的片段,其中该位置对于修饰核酸分子的不同片段是不同的。取决于显示器包括(覆盖,covered)的空间,所有种类的片段或仅其部分可被包括,即被显示。至此,本文优选使用的术语模式(pattern)指分辨步骤的结果,并且指示随时间优选地在显示器中示出的修饰的核酸分子片段的序列,或者在二维或三维空间中的修饰的核酸分子片段的序列布置或基于质量或质核比的修饰的核酸分子片段的序列的布置。至此,模式优选地为沿时间轴布置的修饰的核酸分子片段的梯状物,在二维或三维空间中布置的修饰的核酸分子片段的梯状物或者其组合。在本发明的范围内,利用修饰的核酸分子片段的模式推断核酸分子的核苷酸序列的步骤实际上使用缺少在将修饰的核酸分子片段与未修饰核酸分子片段分离步骤中使用的所述修饰的修饰核酸分子片段。更具体地说,在修饰的核酸分子片段与未修饰核酸分子片段分离后,从修饰的核酸分子片段移出所述修饰,因此生成修饰的核酸分子片段的模式, 其缺少被用于将修饰的核酸分子片段与未修饰核酸分子片段分离的修饰。这种缺少所述修饰的修饰的核酸分子片段可通过利用将该修饰附于修饰的核酸分子片段的无痕连接体 (traceless linker)生成。这种无痕连接体是在断裂后留下该修饰和缺少曾经正形成无痕连接体的任何原子(一个或多个)、原子的基团(一个或多个)或一个/多个部分的核酸分子片段的连接体。因此,在无痕连接体已分别被断裂和移出后,该修饰和核酸分子片段在长度、质量和/或电荷方面没有显示任何改变。这种无痕连接体的实例在下式中示意性地描述 在本发明的范围内,修饰的核酸分子片段的一个修饰或这类修饰的一部分可从修饰的核酸分子片段移出,优选在将修饰的核酸分子片段与未修饰的核酸分子片段分离之后,其中另外的修饰或所述修饰的部分仍然附着于核酸分子片段。在进一步的实施方式中, 移出修饰留下将该修饰附着于核酸分子片段的连接体,或其附着于核酸分子片段的部分,其中由于该连接体或其部分的存在,这种核酸分子片段仍然可被认为是修饰的核酸分子片段,优选的存在这样的条件这种连接体和其部分分别地适于赋予这类核酸分子修饰的核酸分子片段的特性。本领域普通技术人员应了解,在根据本发明的方法的第一过程中,模式本质上仅由修饰的核酸分子片段组成。然而,不可能排除在进行分辨步骤的反应物中包含一些未修饰核酸分子片段,典型地为副产品,这是由于修饰的核酸分子片段与未修饰核酸分子片段的不完全分离。本领域普通技术人员也应了解,与根据本发明方法的第二过程相关的,模式由修饰的核酸分子片段和未修饰核酸分子片段形成。然而,在该分辨修饰核酸分子片段步骤的意义中的模式仅仅由修饰的核酸分子片段组成,因为仅这些修饰的核酸分子片段包括可在引导(寻址,addressing)方法中使用的修饰。因此,只有修饰的核酸分子片段可以在时间、 空间、质量和/或质核比方面显示,以生成修饰的核酸分子片段的模式。允许分辨步骤的修饰,即用于分离或分辨修饰的核酸分子片段即种类的修饰,可以是如本文定义的未分(imi-partite)修饰或二分修饰或多分修饰的部分。这类修饰优选为标记、质量标签、亲脂标签或亲和标签。在优选的实施方式中,修饰的核酸分子的修饰是直接或间接连接于核酸分子的5’ 或3’ -末端核苷酸的标记。在本文中,间接连接指在标记和核酸分子的5’或3’ -末端核苷酸之间,安装连接体。如本文使用的,术语“标记”指可用于提供可检测的(优选地可定量的)信号并且可附着于核酸分子的核苷酸的任何原子、分子和/或部分。标记可提供通过荧光、化学发光、电化学发光、放射性、比色、X射线衍射或吸收、磁、酶活性等可检测的信号。检测标记包括但不限于,荧光基团[能吸收某种波长的电磁辐射例如光或χ-射线并随后重发射吸收的能量为更长波长的辐射的基团;说明性的实例为DANSYL(5-二甲基氨基)-1-萘磺)、DOXYL (N-氧基-4,4- 二甲基〃恶唑烷)、PROXYL (N-氧基-2,2,5,5-四甲基吡咯烷)、TEMPO (N-氧基-2,2,6,6-四甲基哌啶)、二硝基苯基、吖啶、香豆素、Cy3和Cy5、赤藓红、香豆酸、伞形酮、德克萨斯红、若丹明、四甲基若丹明、Rox、7-硝基苯并-2氧杂-1- 二唑(NBD)、芘、荧光素、铕、钌、钐及其他稀土金属]、花青染料(国际专利申请W01997/45539、 美国专利US 5,366,860和US 5,18. 934)以及化学发光染料(美国专利US 4,931,223 ; Bronstein等人,1994)、放射性同位素标记和化学发光标记(在化学反应期间经由光线发射可检测的标记,例如在美国专利US 4,931,223中示出的;Bronstein等人,1994)。荧光素染料的实例包括6-羧基荧光素(6_FAM)、2',4',1,4_四氯荧光素(TET)、 2',4',5',7',1,4_ 六氯荧光素(HEX)、2',7' -二甲氧基-4',5' -二氯 _6_ 羧基若丹明(J0E)、2'-氯-5'-氟-7',8'-稠合苯基-1,4-二氯-6-羧基荧光素 (caroxyflurescein) (NED)和 2 ‘-氯 _7 ‘-苯基-1,4- 二氯-6-羧基荧光素(VIC)。本领域普通技术人员应该了解,这种修饰即标记在与根据本发明的方法的第二过程有关时是特别有用的。更优选地,这类标记显示与核酸分子通常的吸收或荧光特征不同的吸收或荧光特征。由于这种修饰,修饰的核酸分子片段可以与未修饰核酸分子相区别,并且优选地在显示器中显示,并且经历引导方法。在优选的实施方式中,修饰的核酸分子的修饰是质量标签。在优选的实施方式中, 修饰的核酸分子的修饰是直接或间接连接于核酸分子的5’或3’_末端核苷酸的质量标签。本文中,间接连接指在质量标签和核酸分子的5’或3’ -末端核苷酸之间,安装连接体。质量标签指其分子量大于待测序核酸分子的分子量的标签。因此,与核酸分子连接的质量标签,即修饰的核酸分子——因而该修饰为质量标签,允许修饰的核酸分子与未修饰核酸分子分离。质量标签修饰的核酸分子与未修饰核酸分子的分离可通过过滤、透析和/或层析过程进行。质量标签包括永久附着于核酸分子的部分,并且其带标签的片段是限定质量的, 以便能够精确测定序列。这类标签的实例是限定的亲水聚合物,例如肽、DNA PNA。质量标签也可被仅仅用于促进带标签片段与未带标签片段的分离。在分离后,移出这些质量标签, 仅仅留下期望的核酸分子片段。与未带标签片段分离后断裂的质量标签不必具有限定的质量。因此,可以使用亲水聚合物例如但不限于PEG、蛋白质、抗体、多糖,以及限定的聚合物例如DNA、PNA和肽。质量标签也可被认为是通过其质量可区别的标签。这类区别可用于鉴定带标签片段。鉴定可以如此进行使用MS/MS断裂释出独特质量的标签并因此指示母体分子带标签。 该概念被称为‘子离子’质量标签方法。在进一步实施方式中,质量标签可由限定的同位素分布组成,以便进一步确定标签的特征。在进一步优选的实施方式中,修饰是直接或间接连接于核酸分子的5’或3’_末端核苷酸的亲脂标签。本文中,间接连接指在亲脂标签和核酸分子的5’或3’-末端核苷酸之间,安装连接体。亲脂标签指比待测序核酸分子更亲脂的标签。因此,与核酸分子连接的亲脂标签,即修饰的核酸分子——因而该修饰为亲脂标签,允许修饰的核酸分子与未修饰核酸分子的分离。亲脂标签分离修饰的核酸分子与未修饰核酸分子的分离可通过过滤、透析和/或测序过程进行。亲脂标签包括但不限于具有2到50个碳的脂族链、留体、生物碱、芳环系统。如本文使用的,术语“脂族的”包括饱和的和不饱和的、直链(即不分枝的)、分枝的、无环的、环状的或多环的脂肪族烃,其任选地由一个或多个官能团取代。如本领域普通技术人员了解的,本文“脂族的”拟包括但不限于烷基、烯基、炔基、环烷基、环烯基和环炔基部分。因此, 如本文使用的,术语“烷基”包括直链的、分枝的和环状的烷基。类似的约定应用于其他的通用术语,例如“烯基”、“炔基”等。此外,如本文使用的,术语〃烷基〃、‘‘烯基〃、‘‘炔基"等包括取代的和未取代的基团。因此,说明性的脂族基包括但不限于例如甲基、乙基、 正-丙基、异丙基、环丙基、-CH2-环丙基、乙烯基、烯丙基、正丁基、仲丁基、异丁基、叔丁基、 环丁基、-CHb-环丁基、正戊基、仲戊基、异戊基、叔戊基、环戊基、-CH2-环戊基、正己基、仲己基、环己基、-CH2-环己基部分等,其也可带有一个或多个取代基。烯基包括但不限于乙烯基、丙烯基、丁烯基、1-甲基-2-丁烯-1-基等。代表性的炔基包括但不限于乙炔基、2-丙炔基(炔丙基)、1_丙炔基等。一般而言,如本文使用的,术语“芳基”和“杂芳基”指稳定的单或多环的、杂环的、多环的和多杂环的不饱和部分。取代基包括但不限于先前提到的任意取代基,即对于脂族部分或对于本文公开的其他部分陈述的、导致形成稳定化合物的取代基。在本发明的某些实施方式中,“芳基”指具有一个或二个芳环的单或二环的碳环系统, 其包括但不限于苯基、萘基、四氢萘基、2,3_ 二氢化茚基、茚基等。在本发明的某些实施方式中,如本文使用的术语“杂芳基”指具有五到十个环原子的环状芳基,其中一个环原子选自 S、0和N ;零、一或两个环原子是独立地选自S、0和N的附加杂原子;并且剩余环原子是碳,和该基团经由任何环原子与分子的其余部分相连,例如吡啶基、吡嗪基、嘧啶基、吡咯基、吡唑基、咪唑基、噻唑基、嘴唑基、异喷唑基、噻二唑基、喷二唑基、苯硫基、呋喃基、喹啉基、异喹啉基等。应该理解,芳基和杂芳基可以是未取代的或取代的,其中取代包括用下列部分的任意一个或多个独立地替换其上的一个、两个、三个或更多个氢原子,所述部分包括但不限于脂族的;杂脂族的;芳基;杂芳基;芳烷基;杂芳烷基;烷氧基;芳氧基;杂烷氧基;杂芳氧基;烷基硫代;芳基硫代;杂烷基硫代;杂芳基硫代;-F ;-Cl ;-Br ;-I ;-OH ;-NO2 ;-CN ;-CF3 ;-C H2CF3 ;-CHCl2 ;-CH2OH ;-CH2CH2OH ;-CH2NH2 ;-CH2SO2CH3 ;-C (O)Rx ;-CO2 (Rx) ;-CON (Rx)2 ;-OC(O) Rx ;-OCO2Rx ;-OCON(Rx)2 ;-N(Rx)2 ;-S(O)2Rx ;-NRx(CO)Rx,其中对于 Rx 的每次出现,优选地, Rx为单独地并独立地选自脂族的、杂脂族的、芳基、杂芳基、芳烷基或杂芳烷基,其中上面和此处描述的脂族的、杂脂族的、芳烷基或杂芳烷基取代基的任一种可以是取代的或未取代的、分枝的或无枝的、环状的或无环的,并且其中上面和此处描述的芳基或杂芳基取代基的任一种可以是取代的或未取代的。如本文使用的术语“环烷基”具体地指具有三个到七个,优选地三个到十个碳原子的基团。适当的环烷基包括但不限于环丙基、环丁基、环戊基、环己基、环庚基等,其如同在其他的脂族的、杂脂族的或杂环部分的情况一样,可任选地用取代基取代,所述取代基包括但不限于脂族的;杂脂族的;芳基;杂芳基;芳烷基;杂芳烷基;烷氧基;芳氧基;杂烷氧基;杂芳氧基;烷基硫代;芳基硫代;杂烷基硫代;杂芳基硫代; -F ;-CI ;-Br ;-I ;-OH ;-NO2 ;-CN 厂CF3 ;-CH2CF3 ;-CHCl2 厂CH2OH ;-CH2CH2OH ;-CH2NH2 ;-CH2SO2CH3 厂C( 0)RX ;-CO2 (Rx) ;-CON (Rx)2 ;-OC (O)Rx「0C02Rx ;-OCON (Rx)2 ;-N (Rx)2 ;-S (O)2Rx ;-NRx (CO) Rx,其中对于民的每次出现,优选地,Rx单独地并独立地选自脂族的、杂脂族的、芳基、杂芳基、芳烷基或杂芳烷基,其中上面和此处描述的任何脂族的、杂脂族的、芳烷基或杂芳烷基取代基可以是取代的或未取代的、分枝的或无枝的、环状的或无环的,并且其中上面和此处描述的任何芳基或杂芳基取代基可以是取代的或未取代的。一般合适的取代基的另外实例由在本文描述的实施例中示出的具体实施方式
所说明。如本文使用的术语“杂脂族的”指包含一个或多个氧、硫、氮、磷或硅原子——例如代替碳原子——的脂族部分。杂脂族部分可以是分枝的、无枝的、环状的或无环的,并且包括饱和的和不饱和的杂环例如吗啉代、吡咯烷基等。在某些实施方式中,杂脂族部分通过用一个或多个部分独立地替换其上的一个或多个氢原子进行取代,所述部分包括但不限于脂族的;杂脂族的;芳基;杂芳基;芳烷基;杂芳烷基;烷氧基;芳氧基;杂烷氧基;杂芳氧基;烷基硫代;芳基硫代;杂烷基硫代;杂芳基硫代; -F ;-CI ;-Br ;-I ;-OH ;-NO2 ;-CN 厂CF3 ;-CH2CF3 ;-CHCl2 厂CH2OH ;-CH2CH2OH ;-CH2NH2 ;-CH2SO2CH3 厂C( 0)RX ;-CO2 (Rx) ;-CON (Rx)2 ;-OC (O)Rx「0C02Rx ;-OCON (Rx)2 ;-N (Rx)2 ;-S (O)2Rx ;-NRx (CO) Rx,其中对于民的每次出现,优选地,Rx单独地并独立地选自脂族的、杂脂族的、芳基、杂芳基、芳烷基或杂芳烷基,其中上面和此处描述的任何脂族的、杂脂族的、芳烷基或杂芳烷基取代基可以是取代的或未取代的、分枝的或无枝的、环状的或无环的,并且其中上面和此处描述的任何芳基或杂芳基取代基可以是取代的或未取代的。如本文定义的,允许分辨步骤——即被用于分离或分辨修饰的核酸分子片段即种类——的未分修饰可通过连接体与核酸分子连接。如本文定义的,允许分辨步骤——即被用于分离或分辨修饰的核酸分子片段即种类——的二分或多分修饰可彼此相连接并通过连接体与核酸分子连接。“连接体”指形成连接部分的一个或多个原子,所述连接部分将核酸分子与修饰或修饰的一部分/多个部分连接,或者分别形成对彼此和对核酸分子的修饰。连接体的功能是将所述部分或分子以永久的或非永久的方式连接。在一个实施方式中,非永久的键是可断裂的键。连接体在性质上可以是无环的、环状的、芳基、杂芳基或这些的组合。它可单独地包括碳原子主链或可以是如上面定义的杂脂族的。其可包含其他的部分,例如但不限于脂族的;杂脂族的;芳基;杂芳基;芳烷基;杂芳烷基;烷氧基;芳氧基;杂烷氧基;杂芳氧基; 烷基硫代;芳基硫代;杂烷基硫代;杂芳基硫代;-F ;-CI ;-Br ;-I ;-OH ;-NO2 ;-CN ;-CF3 ;-CH2C F3「CHC12「CH20H「CH2CH20H ;-CH2NH2「CH2S02CH3 ;-C (O)Rx「C02(Rx)「CON (Rx)2「0C (O)Rx「 OCO2Rx ;-OCON(Rx)2 ;-N(Rx)2 ;-S (O)2Rx ;-NRx(CO) Rx,其中对于 Rx 的每次出现,优选地,Rx 单独地并独立地选自脂族的、杂脂族的、芳基、杂芳基、芳烷基或杂芳烷基,其中上面和此处描述的任何脂族的、杂脂族的、芳烷基或杂芳烷基取代基可以是取代的或未取代的、分枝的或无枝的、环状的或无环的,并且其中上面和此处描述的任何芳基或杂芳基取代基可以是取代的或未取代的。连接体可包含断裂位点或可断裂部分——优选地在其主链上,其允许分离分别地通过所述连接体连接(connected)或连接(linked)的分子和部分。例如,在一个实施方式中,断裂连接体将使修饰例如标记分别地与核酸分子和核酸分子片段分离。这类可断裂连接体可以在酸性、碱性或还原条件下断裂。它们也可酶切割或者通过光断裂。在后一种情况中,它们是可光致断裂的连接体。与本发明相关的,多种核酸分子片段利用修饰根据其长度、质量或电荷进行分辨的分辨步骤,可使用至此适合的任何技术。这类技术包括但不限于层析和质谱分析法,并且可以与根据本发明的方法的第一和第二过程结合使用。特别优选的技术是质谱分析技术, 其可与层析组合。如本文使用的,提及质谱分析法包括本领域普通技术人员已知的任何适当的质谱仪形式。优选允许精确分析核酸分子的质谱分析技术。例如,由于核酸分子的过度断裂发生,所谓的“硬”电离技术,例如电子和快原子轰击(FAB)电离方法不适于核酸分子的分析。 各种质谱仪形式(电离原理与不同的质量分析仪结合)是使用软电离技术的领域中的技术人员已知的。这类形式包括电喷射、大气压光致电离(缩写APPI)、大气压化学电离(缩写APCI)、基质辅助激光解吸电离(缩写MALDI)、基质辅助激光解吸电离飞行时间(缩写 MALDI-T0F)、红外基质辅助激光解吸/电离质谱(缩写IR-MALDI)、正交-TOF (缩写0-T0F)、 轴向-Tof (缩写A-T0F)、离子回旋共振(缩写ICR)、傅里叶变换直线/反射(Fourier Tranform Linear/Ref lecton)(缩写RET0F)、激光解吸电离(缩写LDI)、快原子轰击(缩写 FAB)、解吸电喷射电离(缩写DESI)、二氧化硅上解吸电离(缩写DI0S)、液体二次离子质谱 (缩写 LSIMS)。电喷射电离(缩写ESI)包括从施加高电压的毛细管的顶端喷射分析物的稀溶液。 然后,喷射通过引起在液面电荷分离并因此使成滴(emerging drop) (Taylor锥)变形的静电力实现。这最终分解产生数千的微米大小的小滴,所述小滴进一步发展成之后分析的带电分子。由于该技术的温和性以及对极性和离子化合物的偏爱,发现其在生物聚合物分析领域容易应用。大气压光致电离(缩写APPI)经常被用来电离难以电离的非极性本体例如甾体, 但是该技术也适用于极性本体。其是LC/MS电离技术,其中使用加热器在大气压下蒸发LC 洗脱液。所得到的气体被引导通过由电离气体分子的放电灯(例如UV灯)生成的光子束。
大气压化学电离(缩写APCI)包括加热包含溶液的分析物(一般地是来自HPLC 的流动相)至超过400°C的温度,用高流速的氮气喷射,并且使所得到的气溶胶云状物经历电晕放电产生离子。其不同于ESI,因为其是气相电离方法,而不是液相电离方法。一般地, APCI比ESI产生更多的断裂。快原子轰击(缩写FAB)包括利用高能中性原子束,一般为Xe或Ar,其撞击包含样品的固体基质,引起解吸和电离。其用于难以进入气相的大的生物分子。通过从离子源使离子加速通过电荷-交换室(charge-exchange cell)产生原子束。离子与中性原子相撞获得电子以形成高能量原子束。FAB谱一般包含较少的片段和假分子离子信号(例如, [M+H]+、[M+Na]+、加合物),使FAB可用于分子量测定。然而,基质贡献许多低m/Z信号,其重现性的缺乏使谱解释复杂化。此外,该方法易于被小杂质抑制效果。基质辅助激光解吸电离(缩写MALDI)是激光介导的蒸发和电离大生物分子例如蛋白质或DNA片段的方法。生物分子分散在固体基质例如3-羟基吡啶羧酸(3-HPA)中。 紫外激光器脉冲烧蚀携带一些大分子的基质成为电离形式的气相,所以它们可以被提取入质谱仪。大范围的MALDI允许测定上至500kDa的分子量,通常测定5到IOOkDa的分子量 (即,例如聚合物、生物分子、复合物、酶),这取决于分析器。MALDI技术可以例如与飞行时间分析器或傅里叶变换质谱仪结合。前者具有低分辨率和准确度,而后者是非常精确的,但是具有低动态范围,并且其操作更复杂。激光解吸电离(缩写LDI)是用高强度激光脉冲照射分子,形成之后分析的离子。 该早期技术的限制是在大约5到IOkDa质量的锐截止(sharp cut-off),并且需要将其与 TOF质量分析器结合。解吸电喷射电离(缩写DESI)是一种电离技术,其中电喷射源产生带电的小滴,其被引导在固体样品处数毫米到数厘米距离内。带电小滴通过与表面的相互作用获得样品, 之后形成可以被提取入质谱仪的高度带电的离子。二氧化硅上解吸电离(缩写DI0S)是沉积在多孔硅表面上的样品的激光解吸/电
1 O表面增强的激光解吸/电离(缩写SELDI)是与MALDI相似的变体,但是使用生物化学亲和靶。表面增强的净解吸(缩写SEND)是MALDI的变体,其中基质与靶表面共价连接。表面辅助的激光解吸/电离(缩写SALDI)可被描述为使用液体加颗粒基质的 MALDI0二次离子质谱(缩写SIMQ包括用高能量一次离子轰击分析物涂布的表面以生成样品(二次)离子。能量转移引起样品分子解吸入气相,在那里它们经历离子/分子反应形成二次离子。形成后,通过对提取应用高电压并聚焦透镜,样品离子可被加速离开源。在该方法的普通变化中——被称为液体二次离子质谱(缩写LSIMQ,分析物被溶于不挥发性液体基质中,然后被置于探针顶端。用一次离子轰击该混合物(通常35keV的Cs+)导致形成基质离子并导致间接的样品电离。在这方面,LSIMS与较老的被称为快原子轰击(缩写 FAB)的技术非常相似,快原子轰击(缩写FAB)也使用基质。如其名称指示的,FAB电离使用快速中性原子(例如Ar)束,而不是离子束,但是FAB和LSIMS的电离机制是相同的,实际上两个术语经常被混淆。
如上所述的,这类离子源可以在一个时间段内提供有洗脱液,该洗脱液已通过液相色谱或毛细管电泳被从混合物分离。串联质谱分析法也可用于提高描述的方法,以便充当片段特征的附加证实。串联质谱分析法——也称为MS/MS,包括多个质谱分析选择步骤,其中一些形式的断裂在阶段之间发生。对于核酸分子的序列鉴定,串联质谱的适用性可以在数篇综述文章(Limbach, 1996 ;Nordhoff等人,1996 ;Wu & McLuckey, 2004)中查阅,碰撞诱导分裂(CID)的气相断裂可使用应用例如离子阱、傅里叶变换、离子回旋共振和三重-四重分析器的串联质谱分析进行(Baker等人,1993 ;Boschenok & Sheil, 1996 ;Kawase等人,1991 ;Limbach等人,1995 ; Little等人,1995 ;Marzilli等人,1999 ;Ni等人,1996)。在MALDI-MS后,经由源后衰减和迅速断裂,可生成未修饰的和修饰的核酸分子的这类片段(Juhasz等人,1996 ;Stemmler等人,1993 ;Talbo & Mann, 1996)。液相色谱-质谱(缩写LC-MQ允许分离不挥发性化合物的复杂混合物,然后引入质谱仪。对于具有高分子量或太敏感而不能加热来通过GC进行分析的化合物,其被广泛使用。在正负离子模式中,联接于LC的最常见的电离法是ESI和大气化学电离(缩写APCI)。 LC在大多数情况下通过反相高效液相色谱(缩写RP-HPLC)进行。也可用于分辨各种种类的修饰的核酸分子种类的傅里叶变换质谱法(缩写FTMS) 的基础是允许通过这类技术如电子碰撞电离、化学电离、MALDI和ESI形成的离子积聚和储藏数分钟时期的离子阱(彭宁室(Perming cell))。在该时间期间,可继续(follow)离子与中性分子的反应。对于质量测量,该方法在质谱分析法中具有最高的分辨能力、高的质量上限、高灵敏度、无损检测和高准确度。因为其使用傅里叶变换检测,所以信号平均和同时宽质量检测是可能的。在本发明的范围内,质谱指从通过质谱分析法分析核酸分子或其片段获得的数据显示(图形地或数字编码的)。质谱是在分离或分辨步骤中生成的模式的实施方式,也在本发明的范围内。对于质谱,核酸分子的断裂模式指特性分布和信号标记(例如峰或其数字表示)。 一般而言,如本文使用的,断裂模式指通过核酸分子特异性断裂生成的片段组。这类片段模式是在分离或分辨步骤中生成的模式的实施方式。依赖于连续主链断裂的任何质谱仪测序方法的应用取决于质量梯状物的形成。 序列信息通过测定质谱中连续峰之间的质量差获得。在寡脱氧核苷酸的情况下,连续峰之间期望的质量差相应于下列的损失dC = 289. 05、dT = 304. 05、dA = 313. 06和dG = 3 . 05 (精确的质量基值)。对于寡核糖核苷酸,质量差为C = 305. 04、U = 306. 03、A = 329. 05和dG = 345. 05 (精确的质量基值)。如本文使用的,在质谱法背景中的质量信号指输出数据,其是具有特定质量的分子的数量或相对数量。信号包括“峰”和其数字表示。公知的是,质谱仪测量“质核比”(m/ ζ)而不是样品组分的实际“分子量”。使用的具体质谱仪的校准应该在试验之前进行。对于检测多个带电分子(例如当使用电喷射电离)的质谱仪,粗略估计的质量可以例如通过使获得的质核比值乘以分子上电荷的数量进行确定。在实践中,中性分子质量的计算通过应用使用称为解卷积(deconvolution)方法的软件包进行。因此,本领域已知的用于检测、 确定和/或计算质量的每一方法可用于获得本文方法包括的质量。
如本文使用的,“解卷积质量”指平均分子量或单同位素的精确分子量。精确分子量的应用受到质量分析器分辨率的限制。当分析具有较高分子量的分子时,可能更难以阐明化合物的同位素模式(模式)。在此情况下,可使用平均质量来鉴定显示较高分子量的化合物。然而,当使用精确质量时,需要运用单同位素质量,这是因为这考虑到C和U之间的区别。然而,必须证实单同位素质量以适当的丰度存在,以便进行鉴定。如本文使用的,术语“峰”指从质谱仪谱(“质谱”)的基线信号向上凸出的突出部分,其相应于片段的质量和强度。峰可以从质谱通过手工或自动“峰发现”程序提取出。如本文使用的,质谱中峰的质量指通过“峰发现”程序计算的质量。如本文使用的,质谱中峰的强度指通过“峰发现”程序计算的强度,其取决于参数, 所述参数包括但不限于质谱中的峰高度和其信噪比。如本文优选使用的,计算质量被定义为通过加和根据其分子式确定的分子包含的单个元素的质量贡献确定的分子或片段的理论质量。计算的质量可以是精确质量或分子量,这取决于是否使用元素的精确质量或平均质量。例如,具有C3H602分子式的分子的计算质量具有计算的74. 037道尔顿的单同位素精确质量,如通过下式得到的(3X 12. 000) + (6X1. 0078)+ (2 X 15. 9949),而平均质量为74. 079道尔顿,这考虑天然的最大丰度的同位
ο如本文优选使用的,观测质量是通过质谱仪实验上发现的质量值。如本文优选使用的,精确质量是分子的精确分子量,其中每个原子的原子质量基于每种元素的单同位素形式的普通同位素。如本文优选使用的,观测的精确质量是分子的精确单同位素分子量,如使用质谱仪实验上测定的。如本文优选使用的,计算的精确质量是分子的精确单同位素分子量,如通过加和根据其分子式确定的分子包含的单个单同位素元素的质量贡献理论确定的。如本文优选使用的,平均分子量是结构的平均分子量,其中原子质量基于元素的所有同位素的天然丰度。如本文优选使用的,观测的平均分子量是分子的平均分子量,如使用质谱仪实验上测定的。如本文优选使用的,计算的平均分子量是是分子的平均分子量,如通过使用根据其分子式确定的分子包含的所有元素的原子量理论确定的。应该了解,根据本发明的方法也可与具体的核酸分子相关使用。这类具体的核酸分子是例如适配体、Spiegelmers、反义分子、核糖核酸酶、诱铒寡核苷酸和siRNA分子。在优选实施方式中,这种具体的核酸分子用于治疗、诊断和/或美容领域。在本发明的范围内,单链核酸分子可以形成不同并稳定的三维结构并且特异性地与靶分子如抗体结合。这类由D-核苷酸组成的核酸分子被称为适配体。适配体可以针对数种靶分子例如小分子、蛋白质、核酸甚至细胞、组织和生物体进行鉴定,并且可以抑制特定靶分子的体外和/或体内功能。适配体通常通过靶直接选择方法——称为体外选择或通过指数富集的配体系统进化(缩写SELEX)——进行鉴定(Bock等人,1992 ;Ellington & Szostak, 1990 ;Tuerk & Gold,1990)。未修饰适配体被从血流迅速地清除,其半衰期为数分钟到数小时,主要由于核酸酶降解和通过肾从身体清除,这是适配体固有的低分子量的结果。因此,为了治疗上使用适配体,其必须在糖(例如核糖)主链的2’位置进行修饰(Cload 等人,2006)。使适配体不稳定的普遍存在的核酸酶由手性构件(building block)即L-氨基酸组成。因此,核酸酶的结构也固有地是手性的,这产生立体特异性的底物识别。因此,这些酶仅仅接受恰当手性结构的底物分子。因为适配体和天然存在的核酸分子由D-核苷酸组成, 所以L-寡核苷酸应该免于酶识别和随后的降解。由于相同的原理,不幸地在这种情况下, 天然发展无酶活性以扩增这类镜像核酸。因此,L-核酸适配体不能直接地使用SELEX方法获得。尽管立体化学的原理显示最终导致期望的功能性L-核酸适配体的迂路(detour)。如果体外选择的(D-)适配体结合其天然标靶,则该适配体的结构镜像具有相同的特性与天然靶的镜像结合。这里,相互作用配偶体具有相同的(非天然的)手性。由于生命和大部份生物化学化合物的纯手型,这类对映(enantio)-RNA配体当然将具有限的实际用途。另一方面,如果SELEX方法针对(非天然的)镜像靶进行,则将获得识别该(非天然的)靶的适配体。所述适配体的相应镜像结构——期望的L-适配体——又识别天然靶。生成生物稳定的核酸分子的该镜像选择过程在1996首先出版(Klussmarm等人,1996 ;Nolte 等人,1996),并且导致生成不但显示对给定靶分子的高亲和性和特异性而且同时也显示生物稳定性的功能性镜像核酸分子配体。单链核酸分子是这类配体结合L-核酸分子——其被称为'Spiegelmer'(来自德语单词'Spiegel',镜子)在本发明的范围内(Eulberg 等人,2006)。本文公开的核酸分子——优选spiegelmer或适配体——包括如此部分,其优选为高分子量部分和/或优选允许就在动物体优选人体内停留时间等方面修饰核酸分子特性。这类修饰的特别优选实施方式是如本文使用的核酸分子的聚乙二醇化(PEGylation) 和(HESylation),PEG代表聚(乙二醇(ethylene glycole))和HES代表羟乙基淀粉。如本文优选使用的,聚乙二醇化是核酸分子的修饰,其中这类修饰由附着于核酸分子的PEG 部分组成。如本文优选使用的,羟乙基淀粉化是核酸分子的修饰,其中这类修饰由附着于核酸分子的HES部分组成。这些修饰以及使用这类修饰修饰核酸分子的方法在欧洲专利申请 EPl 306 382中描述,其公开内容通过引用以其整体由此并入。优选地,由高分子量部分组成或包括高分子量部分的修饰的分子量为大约2,000 至250,OOODa,优选地20,000至200,OOODa0在PEG作为这类高分子量部分的情况中,分子量优选为20,000至120,OOODa,更优选为40,000至80,OOODa0在HES作为这类高分子量部分的情况中,分子量优选为20,000至200,OOODa,更优选为40,000至150,OOODa0 HES修饰地方法在例如德国专利申请DE 1 2004 006 249. 8中描述,其公开内容通过引用以其整体由此并入。在本发明的范围内,如在专利申请WO 2005/074993和WO 2003/035665中进一步描述的,PEG和HES可以以直链或分枝形式使用。原则上,可以对核酸分子在其任何位置进行这类修饰。优选地,对核酸分子的5’ -末端核苷酸、3’ -末端核苷酸和/或5’核苷酸和 3’核苷酸之间的任何核苷酸进行这类修饰。修饰和优选地PEG和/或HES部分可以直接地或通过连接体附着于本发明的核酸分子。根据本发明的核酸分子包含一个或多个修饰,优选地一个或多个PEG和/或HES 部分,也在本发明的范围内。在一个实施方式中,单独连接体分子将多于一个PEG部分或HES部分附着于根据本发明的核酸分子。与本发明联合使用的连接体本身可以是直链的或分枝的。这种连接体是本领域普通技术人员已知的,并且在专利申请W02005074993和 W02003035665中被进一步描述。在优选的实施方式中,连接体是生物可降解的连接体。生物可降解的连接体由于从根据本发明的核酸释放修饰,所以允许就在动物体优选人体内的停留时间等方面修饰根据本发明的核酸的特性。使用生物可降解的连接体可允许较好地控制根据本发明的核酸的停留时间。这类生物可降解的连接体的优选实施方式是在下述国际专利申请中描述的生物可降解的连接体,但不限于所述国际专利申请W02006/052790、W02008/034122、 W02004/092191 和 W02005/099768,其中在国际专利申请 W02004/092191 和 W02005/099768 中,连接体是由本文描述的一个或二个修饰、核酸分子和之间的生物可降解的连接体组成的聚合寡核苷酸前体药物的部分。核酸分子的修饰是生物可降解的修饰在本发明的范围内,其中生物可降解的修饰直接地或通过连接体附着于核酸分子。生物可降解的修饰由于从核酸分子释放修饰, 所以允许就在动物体优选人体内的停留时间等方面修饰核酸分子的特性。使用生物可降解的修饰可允许较好地控制核酸分子的停留时间。这类生物可降解的优选修饰的实施方式是生物可降解的,如在下述国际专利申请中描述的,但不限于所述国际专利申请WO 2002/065963、WO 2003/070823、WO 2004/113394 和 WO 2000/41647。如本文使用的,术语“生物可降解的”指在生物系统中讲解,例如酶促降解或化学降解。除了上述的修饰,可以使用其它的修饰来修饰根据本发明的核酸的特性,其中这类修饰选自蛋白质、脂类例如胆固醇和糖链例如淀粉酶、葡聚糖等。反义核酸分子也是单链核酸分子。反义核酸分子特异性地与mRNA链结合,通过结合,mRNA被阻止将mRNA转录成基因产物。此外,mRNA被RNAseH消化降解(Scherer & Rossi, 2003)。反义核酸分子由D-核酸分子如RNA、修饰的RNA、DNAjfWW DNA、PNA、LNA 和其组合组成。核糖核酸酶是催化化学反应的单链D-核酸分子。许多天然核糖核酸酶催化其自身断裂或其它RNA例如mRNA的断裂。核糖核酸酶结合mRNA链并特异性将其切割。通过这种切割或降解靶特异性mRNA分子,避免靶分子的表达(Usman & Blatt,2000)。由于基因表达中的改变已成为正常发育和疾病发病机理的更好理解部分,所以基因表达的转录因子和其它调节子已成为潜在治疗介入的愈加有吸引力的靶。一般地,转录因子是核蛋白,其在基因调控中起关键作用,并且可对基因表达施加正或负的作用。这些调节蛋白质结合在它们靶基因的启动子区域中发现的特定序列。这些结合序列的长度通常为6到10个碱基对,并且偶而发现多重重复。因为转录因子可以识别其相对短的结合序列——甚至在不存在周围基因组DNA情况下,所以短的带有共有结合位点的放射性标记的寡脱氧核苷酸(缩写0DN)可以在电泳迁移率变动分析(electrophoretic mobility shift assay)中用作探针,其鉴定并定量核提取物中的转录因子结合活性。近来,带有特定转录因子的共有结合序列的ODNs已被开发作为在活细胞中操作基因表达的工具。该策略包括这类“诱饵”ODNs的细胞内递送,然后其被靶因子识别并结合。诱铒占据转录因子的DNA结合位点使得蛋白质不能随后与靶基因的启动子区域结合(Mann & Dzau,2000)。诱铒ODN用于基因表达的治疗操作首先由Morishita等在1995年描述(Morishita等人,1995)。他们报告在气囊损伤时,使用带有E2F转录因子家族的共有结合位点的ODNs治疗大鼠颈动脉,并且发现对E2F-1特异的诱铒防止该上调,并阻断损伤血管中的平滑肌增殖和内膜增生(Morishita等人,1995)。除该最初的体内应用之外,转录因子诱铒还被用于阻断小鼠下颂下腺中肾素基因启动子中的负调节元件,这证明诱铒可被用于增加以及抑制体内基因活性 CTomita 等人,1999)。主要在大小上不同的SiRNA分子、miRNA分子或RNAi分子的基础设计基本上如此 核酸分子包含双链结构。双链结构包含第一链和第二链。更优选地,第一链包含邻近核苷酸的第一序列(stretch),并且第二链包含邻近核苷酸的第二序列。至少第一序列和第二序列基本上是彼此互补的。这类互补性一般地基于Watson-Crick碱基配对或其它的本领域普通技术人员已知的碱基配对机制,其包括但不限于Hoogsteen碱基配对等。本领域普通技术人员明白取决于这类双链结构的长度,就碱基互补性而言,完全匹配不是必须要求的。 然而,在一些实施方式中,这类完全互补性是优选的。错配也是可容忍的,主要地条件是双链结构仍然适合于启动RNA干涉机制,并且优选地,这类双链结构在如分别包含或原则上包含这类细胞、组织和器官的细胞、组织和生物体内主要存在(prevailing)的生理条件下仍然稳定地形成。更优选地,双链结构在生理缓冲液中、37°C下是稳定的。第一序列一般地至少部分地与靶核酸互补,并且第二序列至少部分地与靶核酸相同——按照碱基互补,第一序列和第二序列之间的关系被具体给定。靶核酸优选为mRNA。 尽管其它形式的RNA例如hnRNAs也适合于这类目标。这类siRNA分子、miRNA分子和RNAi 分子分别地适合于启动RNA干涉响应——其导致靶分子mRNA的敲落(knock-down)。至此, 这种核酸分子适合于通过减少mRNA水平的表达来降低靶分子的表达。尽管RNA干涉可以在使用分别包含数打和有时甚至数百核苷酸和核苷酸对的长核酸分子时观测到,但是较短的siRNA分子、miRNA分子和RNAi分子通常是优选的。第一序列和/或第二序列长度的更优选范围为大约15到四个连续核苷酸,优选地19到25个连续核苷酸,以及更优选地19到23个连续核苷酸。更优选地,第一序列和第二序列都具有相同的长度。在进一步实施方式中,双链结构包含优选地15和四之间、优选地18到25、更优选为19到23和最优选地19到21个碱基对。本领域普通技术人员明白,siRNA分子、miRNA分子、RNAi分子和介导RNAi的其它核酸的具体设计可以根据当前和未来设计原则分别改变。当前,分别存在一些siRNA分子、 miRNA分子、RNAi分子和介导RNAi的其它核酸的设计原则。siRNA分子、miRNA分子、RNAi 分子和介导RNAi的其它核酸的设计原则在国际专利申请W0/2008/052774中描述,其公开内容通过引用以其整体由此并入。不管siRNA的这些不同设计如何,本领域普通技术人员明白,根据其来源或功能, 三种类型的天然存在的小RNA已被描述短的干涉RNA(缩写siRNA),重复关联的短干涉 RNA(缩写rasiRNA)和microRNA(缩写miRNAs)。实际上,dsRNA可以通过以RNA为模板的 RNA聚合(例如从病毒)或通过重叠转录物杂交(例如从重复序列例如转基因阵列或转座子)产生。这类dsRNA产生siRNA或rasiRNA,其通常指导mRNA降解和/或染色质修饰。 另外,包含互补的或近似互补的20到50个碱基对的反向重复序列的内源转录物向后折叠到它们自身之上形成dsRNA发夹结构。这些dsRNA被加工成介导转录抑制的miRNA,尽管它们也可指导mRNA降解。最终,长dsRNA或siRNAs的人工引入已在培养的细胞和活体生物体中都被选定为失活基因表达的工具(Meister & Tuschl,2004)。优选使用的术语质量分别(质量歧视效应,mass discrimination)指修饰的核酸分子片段与未修饰(unmodified)或非修饰(non-modified)的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的质量差异,并针对所述质量差异进行。优选使用的术语大小分别指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的大小差异,并针对所述大小差异进行。优选使用的术语疏水性分别指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的疏水性差异,并针对所述疏水性差异进行。优选使用的术语电荷分别指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的电荷差异,并针对所述电荷差异进行。优选使用的术语离子分别指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的离子强度差异,并针对所述离子强度差异进行。优选使用的术语氢键合(氢键,hydrogen bonding)分别指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的氢键合差异——优选是这类氢键合程度的差异,并针对所述差异进行。优选使用的术语质量分别(质量歧视效应,mass discrimination)指修饰的核酸分子片段与未修饰或非修饰的核酸分子片段的分离基于修饰的核酸分子片段和未修饰核酸片段之间的质量差异,并针对所述质量差异进行。对于这种特定核酸分子用于治疗、诊断和/或美容领域的事实,根据本发明的方法不但可以用于确定核酸分子的核苷酸序列,而且可用于包含一个或数个这种特定核酸分子的制备物的质量控制。至此,本发明也涉及质量控制的方法,其包括确定根据本发明的核酸分子的核苷酸序列的步骤,其中这类核酸分子被包含在制备物或样品中,其中制备物和样品分别地已在前面的步骤中提供。在本发明的范围内,其核苷酸序列待被测定的核酸分子不必是全长核酸分子。相反,这类全长核酸分子的仅仅一个或数个部分被用作其核苷酸序列待被根据本发明的方法测定的核酸分子可能是足够的。本发明的方法是用于确定核酸分子的指纹的方法,也在本发明的范围内,如本文优选使用的,核酸分子的指纹是核酸分子片段的特征模式。换句话说,对于识别核酸分子或其指纹,有时不必知道精确的核苷酸序列,而是知道这类特征模式。在优选的实施方式中, 这类特征模式是在根据本发明的方法的步骤中获得的,在所述步骤中分别分辨和分离修饰的核酸分子片段。也应该了解,对于鉴定或测定核酸分子的指纹,这类方法另外包含与根据本发明确定核苷酸序列的方法的相同步骤。各个SEQ. ID. Nos.、本文使用的核酸分子的化学性质、其实际序列和内部参考数字在下表中总结。
权利要求
1.测定核酸分子的核苷酸序列的方法,包括下列步骤b)提供具有至少一个修饰的所述核酸分子的多个分子;b)随机断裂多个修饰的核酸分子,因此提供修饰的核酸分子片段和未修饰核酸分子片段;C)分离所述修饰的核酸分子片段和所述未修饰核酸分子片段;d)根据其长度、质量和/或电荷分离或分辨所述修饰的核酸分子片段,其中这种分离或分辨生成修饰的核酸片段的模式;和e)任选地,可视化所述修饰的核酸片段的模式。
2.根据权利要求1所述的方法,其中所述方法进一步包括下列步骤f)从所述修饰的核酸片段的模式推断所述核酸分子的所述核苷酸序列。
3.根据权利要求1到2任一项所述的方法,其中所述多个分子的单个核酸分子在待测定核苷酸序列的所述核酸分子的所述核苷酸序列的5’端、3’端或其内部具有至少一个修饰。
4.根据权利要求1到3任一项所述的方法,其中所述断裂通过化学断裂、酶切割、通过加热断裂和/或通过使用二价阳离子断裂进行。
5.根据权利要求1到4任一项所述的方法,其中所述断裂是化学断裂,优选是核苷酸非特异性断裂。
6.根据权利要求1到5任一项所述的方法,其中所述断裂是有限的断裂。
7.根据权利要求1到6任一项所述的方法,其中所述断裂是有限的随机断裂,优选是有限的化学随机断裂。
8.根据权利要求1到7任一项所述的方法,其中所述断裂步骤提供片段的混合物,优选是修饰片段的混合物,其中这类片段的混合物包括所述核酸分子的所有可能核苷酸序列。
9.根据权利要求8所述的方法,其中所述混合物包括其核苷酸序列待被测定的修饰的全长形式的核酸分子。
10.根据权利要求1到9任一项所述的方法,其中通过所述修饰与相互作用配偶体相互作用分离所述修饰的核酸分子片段与所述未修饰的核酸分子片段,其中这类相互作用配偶体与支持物连接。
11.根据权利要求10所述的方法,其中所述支持物是固体支持物。
12.根据权利要求10到11任一项所述的方法,其中优选地通过洗涤,从与所述相互作用配偶体相互作用的所述修饰的核酸分子片段除去所述未修饰核酸分子片段。
13.根据权利要求10到12任一项所述的方法,其中所述修饰的核酸分子片段从所述支持物释放,优选地通过从所述相互作用配偶体释放所述修饰,通过从所述支持物释放所述相互作用配偶体或通过从所述核酸分子片段断裂所述修饰或其一部分或部分。
14.根据权利要求1到9任一项所述的方法,其中通过由于质量分别、大小分别和/或疏水性分别、电荷分别、离子分别、氢键合分别或液相调节提取的分离将所述修饰的核酸分子片段与所述未修饰核酸分子分离,其中优选地,移出所述未标记的核酸分子片段。
15.根据权利要求1到14任一项所述的方法,其中所述修饰的核酸片段的模式包括修饰的核酸片段的梯状物。
16.根据权利要求1到15任一项所述的方法,其中所述修饰的核酸片段的模式通过质谱分析法生成,并且优选地推断所述核酸分子的核酸序列。
17.根据权利要求1到15任一项所述的方法,其中所述修饰的核酸片段的模式被生成,并且所述单个片段的质量通过质谱分析法测定,并且优选地推断所述核酸分子的核酸序列。
18.根据权利要求1到17任一项所述的方法,其中所述核酸分子的核苷酸序列是未知的。
19.根据权利要求1到18任一项所述的方法,其中所述从修饰的核酸片段的模式推断所述核酸分子的核苷酸序列的步骤包括下列步骤fa)测定最小修饰的核酸分子片段——n+x,其中χ= 0——的质量和/或核苷酸序列;fb)测定与所述最小修饰的核酸分子片段——n+x,其中χ= 0——的质量有一个核苷酸差异的所述修饰的核酸分子片段——n+x,其中χ = 1——的质量;fc)测定所述修饰的核酸分子片段——n+x,其中χ= 1——的质量与所述最小修饰的核酸分子片段——n+x,其中χ = 0——的质量之间的质量差;fd)将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述最小修饰的核酸分子片段——n+x,其中χ = 0——的序列生成所述修饰的核酸分子片段——n+x,其中χ = 1——的序列。
20.根据权利要求19所述的方法,其中重复步骤fb)到fd),其中对于每一重复,χ增加加数1,并且对于第一次重复χ是2,并且其中在步骤fb)中,测定与修饰的核酸分子片段 η+(x-1)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,在步骤fc)中,测定所述修饰的核酸分子片段n+x的质量和所述修饰的核酸分子片段η+(x-1)的质量之间的质量差,和在步骤fd)中,将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-1)的序列生成所述修饰的核酸分子片段n+x的序列。
21.根据权利要求20所述的方法,其中对于步骤fb)到fd)的第m次重复,χ为如下 χ = m+lo
22.根据权利要求1到17任一项所述的方法,其中所述核酸分子的核苷酸序列是已知的,并且优选地,所述方法用于证实所述核酸分子的核苷酸序列。
23.根据权利要求22所述的方法,其中所述从修饰的核酸片段的模式推断所述核酸分子的核苷酸序列的步骤包括下列步骤fd)测定与最小修饰的核酸分子片段——n+x,其中χ = 0——的质量有一个核苷酸差异的修饰的核酸分子片段——n+x,其中χ = 1——的质量;fb)测定所述修饰的核酸分子片段——n+x,其中χ= 1——的质量与所述最小修饰的核酸分子片段——n+x,其中χ = 0——的质量之间的质量差;fc)将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述最小修饰的核酸分子片段——n+x,其中χ = 0——的序列生成所述修饰的核酸分子片段——n+x,其中χ = 1——的序列。
24.根据权利要求23所述的方法,其中重复步骤fa)到fc),其中对于每一重复,χ增加加数1,并且对于第一次重复χ是2,并且其中在步骤fa)中,测定与修饰的核酸分子片段 n+(x-1)的质量有1个核苷酸差异的所述修饰的核酸分子片段n+x的质量,在步骤fb)中,测定所述修饰的核酸分子片段n+x的质量和所述修饰的核酸分子片段η+(x-1)的质量之间的质量差,和在步骤fc)中,将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-l)的序列生成所述修饰的核酸分子片段n+x 的序列。
25.根据权利要求M所述的方法,其中对于步骤fa)到fc)的第m次重复,χ为如下 χ = m+lo
26.根据权利要求22到25任一项所述的方法,其中所述最小修饰的核酸分子片段—— n+x,其中χ = 0——的质量和/或核苷酸序列是已知的。
27.根据权利要求22所述的方法,其中所述从修饰的核酸片段的模式推断所述核酸分子的核苷酸序列的步骤包括下列步骤fa)测定与最小修饰的核酸分子片段——n+x,其中χ= 0——的质量有一个核苷酸差异的所述修饰的核酸分子片段——n+x,其中χ = 1——的质量;fb)将所述修饰的核酸分子片段——n+x,其中χ= 1——的质量归于其核苷酸序列已知的核酸分子的核酸分子片段——n+x,其中χ = 1——的计算质量,并通过将不同的核苷酸种类加至最小修饰的核酸分子片段——n+x,其中χ = 0——的序列生成所述修饰的核酸分子片段——n+x,其中χ = 1——的序列。
28.根据权利要求27所述的方法,其中重复步骤fa)到fb),其中对于每一重复,χ增加加数1,并且对于第一次重复χ是2,并且其中在步骤fa)中,测定与修饰的核酸分子片段 n+(x-1)的质量有1个核苷酸差异的所述修饰的核酸分子片段n+x的质量,和在步骤fb) 中,将所述修饰的核酸分子片段——n+x,其中χ = 1——的质量归于其核苷酸序列已知的核酸分子的核酸分子片段——n+x,其中χ = 1——的计算质量,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-1)的序列生成片段n+x的所述修饰的核酸分子序列。
29.根据权利要求观所述的方法,其中对于步骤fa)到fc)的第m次重复,χ为如下 χ = m+lo
30.根据权利要求19到四任一项所述的方法,其中所述修饰存在于所述核酸分子片段的5’端,和所述最小修饰的核酸分子片段包括所述全长核酸分子的末端5’核苷酸,或者其中所述修饰存在于所述核酸分子片段的3’端,和所述最小修饰的核酸分子片段包括所述全长核酸分子的末端3’核苷酸。
31.根据权利要求1到30任一项所述的方法,其中所述修饰是包括一个部分的未分修饰。
32.根据权利要求31所述的方法,其中所述部分被用于分离所述修饰的核酸分子片段和所述未修饰核酸分子。
33.根据权利要求32所述的方法,其中所述部分被用于在生成的模式中分离或分辨所述修饰的核酸分子片段。
34.根据权利要求1到30任一项所述的方法,其中所述修饰是包括至少第一部分和第二部分的多分修饰,其中任选地所述第一部分和所述第二部分通过连接体连接。
35.根据权利要求34所述的方法,其中所述第一部分被用于分离所述修饰的核酸分子片段和所述未修饰核酸分子,而所述第二部分被用于在生成的模式中分离或分辨所述修饰的核酸分子片段。
36.根据权利要求31到35任一项所述的方法,其中用于分离所述修饰的核酸分子片段和所述未修饰核酸分子的所述部分包括针对相互作用配偶体的配体,其中这类相互作用配偶体存在于支持物上,优选连接到这类支持物,和所述配体和所述相互作用配偶体之间的相互作用介导所述修饰的核酸分子片段在所述支持物上的固定。
37.根据权利要求36所述的方法,其中所述固定选自化学固定、亲和固定、磁固定。
38.根据权利要求37所述的方法,其中所述固定是亲和固定。
39.根据权利要求38所述的方法,其中介导所述核酸分子和所述核酸分子片段在所述支持物上的固定的相互作用选自生物素-抗生物素蛋白相互作用、生物素-中性抗生物素蛋白相互作用、生物素-链亲和素相互作用、抗原-抗体相互作用、两个寡核苷酸的相互作用——其中核酸分子由DNA、RNA、LNA、PNA或其组合组成,钙调蛋白和钙调蛋白结合肽的相互作用、白蛋白和Cibracon蓝的相互作用、金属-螯合剂和金属-螯合支持物的相互作用。
40.根据权利要求31到39任一项所述的方法,其中用于分离所述修饰的核酸分子片段和所述未修饰核酸分子的所述部分选自生物素、寡核苷酸、钙调蛋白结合肽、白蛋白和金属-螯合剂。
41.根据权利要求1到40任一项所述的方法,其中通过下列方法,将所述修饰的核酸分子片段与所述未修饰核酸分子分离,所述方法选自过滤、透析、层析、磁场、离心和沉淀。
42.根据权利要求41所述的方法,其中层析是大小排阻层析,其中根据其大小或由于通过修饰所赋予的修饰片段的增加的大小,将所述修饰的核酸片段与所述未修饰核酸分子分离。
43.根据权利要求31到42任一项所述的方法,其中被用于在生成的模式中分离或分辨所述修饰的核酸分子片段的所述部分选自质量标签或亲脂标签。
44.根据权利要求1到43任一项所述的方法,其中通过针对质量或大小分别的方法分离或分辨所述修饰的核酸分子片段,所述方法优选地选自过滤、透析、层析和质谱分析法, 优选地,这样的方法是MS、LCMS或ESI MS。
45.根据权利要求1到44任一项所述的方法,其中通过基于疏水相互作用的方法分离或分辨所述修饰的核酸分子片段,所述方法优选为RP-HPLC。
46.根据权利要求34到45任一项所述的方法,其中所述连接体是疏水连接体。
47.根据权利要求34到46任一项所述的方法,其中所述连接体是可断裂连接体。
48.根据权利要求47所述的方法,其中所述连接体是可选择断裂的连接体,更优选地, 所述可选择断裂的连接体是可酶切割的、可化学断裂的、可光致断裂的或可热断裂的。
49.根据权利要求1到48任一项所述的方法,其中所述核酸分子选自RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子、PNA、LNA和其组合,优选RNA分子、DNA 分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子以及包含脱氧核糖核苷酸和核糖核苷酸的核酸分子。
50.根据权利要求1到49任一项所述的方法,其中所述核酸分子选自适配体、 Spiegelmers,核糖核酸酶、Spiegelzymes,反义分子、siRNA分子和诱铒分子,优选 Spiegelmers0
51.根据权利要求1到50任一项所述的方法,其中所述核酸分子是RNA分子和/或核苷酸修饰的RNA分子。
52.根据权利要求51所述的方法,其中所述断裂是所述RNA分子和/或所述核苷酸修饰的RNA分子的化学断裂,其通过碱水解、胺或聚胺进行。
53.根据权利要求51所述的方法,其中所述断裂是所述RNA分子和/或所述核苷酸修饰的RNA分子的酶切割,其通过使用核酸酶,优选核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。
54.根据权利要求51所述的方法,其中所述断裂是通过加热所述RNA分子和/或所述核苷酸修饰的RNA分子的断裂。
55.根据权利要求51所述的方法,其中所述断裂是通过使用二价阳离子的所述RNA分子和/或所述核苷酸修饰的RNA分子的断裂。
56.根据权利要求1到50任一项所述的方法,其中所述核酸分子是DNA分子和/或核苷酸修饰的DNA分子。
57.根据权利要求56所述的方法,其中所述断裂是所述DNA分子和/或所述核苷酸修饰的DNA分子的化学断裂,其通过使用酸水解进行。
58.根据权利要求56所述的方法,其中所述断裂是所述DNA分子和/或所述核苷酸修饰的DNA分子的酶切割,其通过使用核酸酶,优选脱氧核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。
59.根据权利要求16到58任一项所述的方法,其中所述质谱分析法选自直接质谱分析法、LC-MS 禾口 MS/MS ο
60.根据权利要求1到59任一项所述的方法,其中测定核酸分子的特定质量指纹。
61.根据权利要求60所述的方法,其中所述特定质量指纹用于核酸分子的鉴定和/或质量控制。
62.根据权利要求1到61任一项所述的方法,其中所述核酸分子或所述核酸分子的多个分子的所述至少一个修饰在步骤a)或b)之前被加到所述核酸分子的5’端或3’端。
63.根据权利要求1到62任一项所述的方法,其中所述核酸分子或所述核酸分子的多个分子包括非核酸部分。
64.根据权利要求63所述的方法,其中所述非核酸部分在步骤a)或b)之前从所述核酸分子或所述核酸分子的多个分子移出。
65.根据权利要求64所述的方法,其中在步骤a)或b)之前,在第一步骤中,所述非核酸部分从所述核酸分子或所述核酸分子的多个分子移出,而在第二步骤中,所述核酸分子或所述核酸分子的多个分子的修饰被加到所述核酸分子或所述核酸分子的多个分子的核苷酸序列的5’端、3’端或内部的核苷酸。
66.测定核酸分子的核苷酸序列的方法,包括下列步骤c)提供具有至少一个修饰的所述核酸分子的多个分子;b)随机断裂多个修饰的核酸分子,因此提供修饰的核酸分子片段;c)根据其长度、质量和/或电荷分离或分辨所述修饰的核酸分子片段,其中这类分离或分辨生成修饰的核酸片段的模式;和d)任选地,可视化所述修饰的核酸片段的模式。
67.根据权利要求66所述的方法,其中在步骤b)或c)之后获得的反应混合物包含不具有所述至少一个修饰的一个或多个核酸分子或其片段。
68.根据权利要求66和67的一项所述的方法,其中可视化所述修饰的核酸片段的模式利用所述至少一个修饰,优选地所述修饰允许区分具有所述修饰的核酸分子和不具有所述修饰的核酸分子。
69.根据权利要求66到68任一项所述的方法,其中所述修饰是选自下列的修饰质量标签、在给定波长比核酸分子具有显著更多UV吸光度的部分、亲脂部分、具有限定分子量的聚合物、放射标记和赋予改变的离子迁移率的部分。
70.根据权利要求69所述的方法,其中在给定波长比所述核酸分子具有显著更多UV吸光度的所述部分选自发色团、染料和荧光标记。
71.根据权利要求66到70任一项所述的方法,其中所述方法进一步包括下列步骤e)从所述修饰的核酸片段的模式推断所述核酸分子的所述核苷酸序列。
72.根据权利要求66到71任一项所述的方法,其中所述多个分子的单个核酸分子在其核苷酸序列待测定的所述核酸分子的核苷酸序列的5’端、3’端或其内部具有至少一个修饰。
73.根据权利要求66到72任一项所述的方法,其中所述断裂通过化学断裂、酶切割、通过加热断裂和/或通过使用二价阳离子断裂进行。
74.根据权利要求66到73任一项所述的方法,其中所述断裂是化学断裂,优选是核苷酸非特异性断裂。
75.根据权利要求66到74任一项所述的方法,其中所述断裂是有限的断裂。
76.根据权利要求66到75任一项所述的方法,其中所述断裂是有限的随机断裂,优选是有限的化学随机断裂。
77.根据权利要求66到76任一项所述的方法,其中所述断裂步骤提供片段的混合物, 优选是修饰片段的混合物,其中这类片段的混合物包括所述核酸分子的所有可能核苷酸序列片段。
78.根据权利要求77所述的方法,其中所述混合物包括其核苷酸序列待被测定的修饰的全长形式的核酸分子。
79.根据权利要求66到78任一项所述的方法,其中所述修饰的核酸片段的模式包括修饰的核酸片段的梯状物。
80.根据权利要求66到79任一项所述的方法,其中所述修饰的核酸片段的模式通过质谱分析法,优选地通过LC-MS生成,并且优选地推断所述核酸分子的核酸序列。
81.根据权利要求66到79任一项所述的方法,其中所述修饰的核酸片段的模式被生成,并且所述单个片段的质量通过质谱分析法测定,并且优选地推断所述核酸分子的核酸序列。
82.根据权利要求66到81任一项所述的方法,其中所述核酸分子的核苷酸序列是未知的。
83.根据权利要求66到82任一项所述的方法,其中所述从修饰的核酸片段的模式推断所述核酸分子的核苷酸序列的步骤包括下列步骤fa)测定最小修饰的核酸分子片段n+x其中χ= 0的质量和/或核苷酸序列;fb)测定与所述最小修饰的核酸分子片段n+x其中χ= 0的质量有一个核苷酸差异的所述修饰的核酸分子片段n+x其中χ = 1的质量;fc)测定所述修饰的核酸分子片段n+x其中χ= 1的质量与所述最小修饰的核酸分子片段n+x其中χ = 0的质量之间的质量差;fd)将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述最小修饰的核酸分子片段n+x其中χ = 0的序列生成所述修饰的核酸分子片段n+x其中χ =1的序列。
84.根据权利要求83所述的方法,其中重复步骤fb)到fd),其中对于每一重复,χ增加加数1,并且对于第一次重复χ是2,并且其中在步骤fb)中,测定与修饰的核酸分子片段 η+(x-1)的质量有1个核苷酸差异的所述修饰的核酸分子片段n+x的质量,在步骤fc)中, 测定所述修饰的核酸分子片段n+x的质量和所述修饰的核酸分子片段η+(x-1)的质量之间的质量差,和在步骤fd)中,将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-1)的序列生成所述修饰的核酸分子片段n+x 的序列。
85.根据权利要求84所述的方法,其中对于步骤fb)到fd)的第m次重复,χ为如下 χ = m+lo
86.根据权利要求66到81任一项所述的方法,其中所述核酸分子的核苷酸序列是已知的,并且优选地,所述方法用于证实所述核酸分子的核苷酸序列。
87.根据权利要求86所述的方法,其中所述从修饰的核酸片段的模式推断所述核酸分子的核苷酸序列的步骤包括下列步骤fa)测定与最小修饰的核酸分子片段n+x其中χ= 0的质量有一个核苷酸差异的所述修饰的核酸分子片段n+x其中χ = 1的质量;fb)测定所述修饰的核酸分子片段n+x其中χ= 1的质量与所述最小修饰的核酸分子片段n+x其中χ = 0的质量之间的质量差;fc)将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述最小修饰的核酸分子片段n+x其中χ = 0的序列生成所述修饰的核酸分子片段n+x其中χ =1的序列。
88.根据权利要求87所述的方法,其中重复步骤fa)到fc),其中对于每一重复,χ增加加数1,并且对于第一次重复χ是2,并且其中在步骤fa)中,测定与修饰的核酸分子片段 n+(x-1)的质量有1个核苷酸差异的修饰的核酸分子片段n+x的质量,在步骤fb)中,测定所述修饰的核酸分子片段n+x的质量和所述修饰的核酸分子片段η+(x-1)的质量之间的质量差,和在步骤fc)中,将所述质量差归于不同的核苷酸种类,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-1)的序列生成片段n+x的序列。
89.根据权利要求88所述的方法,其中对于步骤fa)到fb)的第m次重复,χ为如下 χ = m+lo
90.根据权利要求86到89任一项所述的方法,其中所述最小修饰的核酸分子片段n+x 其中χ = 0的质量和/或核苷酸序列是已知的。
91.根据权利要求86所述的方法,其中所述从修饰的核酸片段的模式推断所述核酸分子的核苷酸序列的步骤包括下列步骤fa)测定与最小修饰的核酸分子片段n+x其中χ = 0的质量有一个核苷酸差异的所述修饰的核酸分子片段n+x其中χ = 1的质量;fb)将所述修饰的核酸分子片段n+x其中χ = 1的质量归于其核苷酸序列已知的核酸分子的核酸分子片段n+x其中χ = 1的计算质量,并通过将所述不同的核苷酸种类加至所述最小修饰的核酸分子片段n+x其中χ = 0的序列生成所述修饰的核酸分子片段n+x其中 χ = 1的序列。
92.根据权利要求91所述的方法,其中重复步骤fa)到fb),其中对于每一重复,χ增加加数1,并且对于第一次重复χ是2,并且其中在步骤fa)中,测定与所述修饰的核酸分子片段n+(x-l)的质量有1个核苷酸差异的所述修饰的核酸分子片段n+x的质量,和在步骤 fb)中,将所述修饰的核酸分子片段n+x其中χ = 1的质量归于其核苷酸序列已知的核酸分子的核酸分子片段n+x其中χ = 1的计算质量,并通过将所述不同的核苷酸种类加至所述修饰的核酸分子片段n+(x-1)的序列生成片段n+x的所述修饰的核酸分子序列。
93.根据权利要求92所述的方法,其中对于步骤fa)到fc)的第m次重复,χ为如下 χ = m+lo
94.根据权利要求83到93任一项所述的方法,其中所述修饰存在于所述核酸分子片段的5’端,和所述最小修饰的核酸分子片段包括所述全长核酸分子的末端5’核苷酸,或者其中所述修饰存在于所述核酸分子片段的3’端,和所述最小修饰的核酸分子片段包括所述全长核酸分子的末端3’核苷酸。
95.根据权利要求66到94任一项所述的方法,其中所述修饰被用于在生成的所述模式中分离或分辨所述修饰的核酸分子片段。
96.根据权利要求66到95任一项所述的方法,其中所述修饰是荧光标记,其波长吸光度不同于所述核酸分子的核碱基的波长吸光度。
97.根据权利要求66到96任一项所述的方法,其中所述核酸分子选自RNA分子、DNA 分子、核苷酸修饰的RNA分子、核苷酸修饰的DNA分子、PNA、LNA和其组合,优选RNA分子、 DNA分子、核苷酸修饰的RNA分子、核苷酸修饰的DNA分子和包含脱氧核糖核苷酸和核糖核苷酸的核酸分子。
98.根据权利要求66到97任一项所述的方法,其中所述核酸分子选自适配体、 Spiegelmers,核糖核酸酶、Spiegelzymes,反义分子、siRNA分子和诱铒分子,优选 Spiegelmers0
99.根据权利要求66到98任一项所述的方法,其中所述核酸分子是RNA分子和/或核苷酸修饰的RNA分子。
100.根据权利要求99所述的方法,其中所述断裂是所述RNA分子和/或所述核苷酸修饰的RNA分子的化学断裂,其通过碱水解进行。
101.根据权利要求99所述的方法,其中所述断裂是所述RNA分子和/或所述核苷酸修饰的RNA分子的酶断裂,其通过使用核酸酶,优选核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。
102.根据权利要求99所述的方法,其中所述断裂是通过加热所述RNA分子和/或所述核苷酸修饰的RNA分子的断裂。
103.根据权利要求99所述的方法,其中所述断裂是通过使用二价阳离子或通过加热断裂和断裂剂的组合的所述RNA分子和/或所述修饰的RNA分子的断裂。
104.根据权利要求66到98任一项所述的方法,其中所述核酸是DNA分子和/或核苷酸修饰的DNA分子。
105.根据权利要求104所述的方法,其中所述断裂是所述DNA分子和/或所述核苷酸修饰的DNA分子的化学断裂,其通过使用酸水解进行。
106.根据权利要求104所述的方法,其中所述断裂是所述DNA分子和/或所述核苷酸修饰的DNA分子的酶断裂,其通过使用核酸酶,优选脱氧核糖核酸酶,和/或核酸基酶,优选核酸基酶进行。
107.根据权利要求66到106任一项所述的方法,其中测定核酸分子的特定质量指纹。
108.根据权利要求107所述的方法,其中所述特定质量指纹用于核酸分子的鉴定和/ 或质量控制。
109.根据权利要求66到108任一项所述的方法,其中所述核酸分子或所述核酸分子的多个分子的所述至少一个修饰在步骤a)或b)之前被加到所述核酸分子的5’端或3’端。
110.根据权利要求66到109任一项所述的方法,其中所述核酸分子或所述核酸分子的多个分子包括非核酸部分。
111.根据权利要求110所述的方法,其中所述非核酸部分在步骤a)或b)之前从所述核酸分子或所述核酸分子的多个分子移出。
112.根据权利要求111所述的方法,其中在步骤a)或b)之前,在第一步骤中,所述非核酸部分从所述核酸分子或所述核酸分子的多个分子移出,并且在第二步骤中,所述核酸分子或所述核酸分子的多个分子的修饰被加到所述核酸分子或所述核酸分子的多个分子的核苷酸序列的5’端、3’端或内部的核苷酸。
113.测定核酸分子的核苷酸序列的方法,包括下列步骤a)提供所述核酸分子的多个分子;b)使所述核酸分子的所述多个分子进行核碱基选择性处理,其中形成所述核酸分子的核碱基种类的一个或数个被选择性地修饰,并且其中在这种核碱基选择性处理之后,核酸分子的一些可选择性处理的核碱基被修饰,并且所述核酸分子的一些可选择性处理的核苷酸或核碱基保持未修饰;c)选择性地在修饰的核碱基的3’,化学断裂核酸磷酸主链,其中不是所有修饰的核碱基的核酸磷酸主链被断裂;d)通过LC-MS和/或LC-MS-MS分析核酸分子片段;和e)以增加的大小的顺序鉴定具有完整末端的核酸分子片段,并且从其生成所述核酸分子的序列,其中优选地,所述核酸分子片段具有相同的完整末端,更优选相同的完整3’末端。
114.根据权利要求113所述的方法,其中所述核酸分子选自RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的DNA分子、PNA、LNA、包含脱氧核糖核苷酸和核糖核苷酸的核酸分子、和其组合,优选RNA分子、DNA分子、核苷酸修饰的RNA分子和核苷酸修饰的 DNA分子。
115.根据权利要求113到114任一项所述的方法,其中所述核酸分子选自适配体、Spiegelmers、核糖核酸酶、Spiegelzymes、反义分子、siRNA分子和诱铒分子,优选 Spiegelmers0
116.根据权利要求113到115任一项所述的方法,其中所述核酸分子是RNA分子和/ 或核苷酸修饰的RNA分子。
117.根据权利要求113到116任一项所述的方法,其中所述可选择性处理的核碱基选自鸟苷、腺苷、胞苷、胸苷和尿嘧啶。
118.根据权利要求113到117任一项所述的方法,其中使用胼、乙酸和苯胺的组合选择性处理所述核碱基U,导致5’磷酸酯附加的3’片段和苯胺修饰的核糖5’片段。
119.根据权利要求118所述的方法,其中所述5’磷酸酯附加的3’片段和所述完整核酸分子在权利要求113的步骤d)中比苯胺修饰的核糖5’片段更有效电离。
120.根据权利要求119所述的方法,其中所述5’磷酸酯附加的3’片段在权利要求113 的步骤d)中比苯胺修饰的核糖5’片段更有效电离。
121.根据权利要求120所述的方法,其中所述5’磷酸酯附加的3’片段在权利要求113 的步骤e)中使用。
122.根据权利要求1到121任一项所述的方法,其中所述核酸分子包括多于25个核苷酸或核碱基。
123.根据权利要求1到122任一项所述的方法,其中所述核酸分子包括多于35个核苷酸或核碱基。
124.根据权利要求1到123任一项所述的方法,其中所述核酸分子包括沈到50个核碱基或36到50个核碱基,优选沈到45个核碱基或36到45个核碱基。
125.根据权利要求1到IM任一项所述的方法,其中所述核酸分子或所述核酸分子的多个分子的聚集被减少。
126.根据权利要求125所述的方法,其中通过加入离液序列高的溶液至步骤a)到c) 的任一步骤,优选a)和b)的任一步骤,减少所述聚集。
全文摘要
本发明涉及测定核酸分子的核苷酸序列的方法,包括下列步骤a)提供具有至少一个修饰的核酸分子的多个分子;b)随机断裂多个修饰的核酸分子,因此提供修饰的核酸分子片段和未修饰核酸分子片段;c)分离所述修饰的核酸分子片段和所述未修饰核酸分子片段;d)根据其长度、质量和/或电荷分离或分辨所述修饰的核酸分子片段,其中这类分离或分辨生成修饰的核酸片段的模式;和e)任选地,可视化所述修饰的核酸片段的模式。
文档编号C12Q1/68GK102203292SQ200980143211
公开日2011年9月28日 申请日期2009年10月29日 优先权日2008年10月29日
发明者J·图尔纳, J·胡斯, S·克鲁斯曼 申请人:南克森制药公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1