利用大小分离技术分析核酸分子的方法和组合物的制作方法

文档序号:3550046阅读:263来源:国知局
专利名称:利用大小分离技术分析核酸分子的方法和组合物的制作方法
技术领域
本发明总地涉及分析核酸分子的方法和组合物,特别是涉及可在各种核酸反应中利用的标记物,其中需要按大小分离核酸分子。
检测和分析核酸分子是生物学中最重要的技术之一。这些技术是分子生物学的核心并在其他生物学领域中的作用迅速扩展。
总地说来,一类分析核酸反应的技术涉及按长度分离核酸分子。例如,一项广泛使用的技术,即聚合酶链反应(PCR)(参见美国专利No.4,683,195、4,683,202和4,800,159)已变成鉴定存在于样品中的序列和为进一步操作合成DNA分子的广泛应用的技术。
简单地说,在PCR中,利用以几何和线性方式合成新DNA链的酶促反应扩增DNA序列。扩增后,必须检测并鉴定DNA序列。因为是非特异性扩增(否则扰乱分析)或须纯化,所以须在检测前分离PCR反应产物。基于产物的大小(即长度)分离时可得到最有用的信息。给出核酸分子的最高分率的方法是电泳分离。在该方法中,对适当的凝胶加载各个PCR反应物并经受电压。可被处理的样品数目受凝胶中孔数的限制。在大多数凝胶装置上,可在单一凝胶中分离大约10至64个样品。因此,处理大数目的样品是很麻烦和消耗材料的。
为了获得数据,必须将电泳分离与某些检测系统联合起来。常用和几乎唯一的核酸检测系统是利用嵌入染料或放射活性标记,在较少情况下用非放射活性标记。嵌入染料如溴乙锭使用较简单。在电泳期间使染料包含在凝胶基质中,或者在电泳之后将凝胶浸渍在含染料溶液中。某些情况下染料可直接显示,但在更多情况下,特别是对溴乙锭来说,则用光(如紫外光)激发出产生荧光。尽管这种标记看来容易使用,但染料有很大的缺点。首先,染料不敏感,而且须使用大量核酸分子才能显示产物。其次,染料是可引起突变或致癌的。
比染料更敏感的检测技术是使用放射活性(或非放射活性)标记。一般在PCR反应中包括放射标记的核苷酸或放射标记的引物。分离后,以放射自显影法“显示”放射标记。虽然更敏感,但检测中有胶片限制的问题,例如相关性丧失和非线性。可用磷影像分析来检测标记来克服这些限制。然而,放射标记有安全要求,增加资源利用和必需专门化设备及人员训练。为此,使用非放射活性标记已越来越普通。在这样的系统中,核苷酸含有标记,如荧光团、生物素或洋地黄毒苷,其可用与生色底物有反应性的酶标记的抗体或其他分子(如配体对的另一成员)检测。如上所述,这些系统并没有上述安全性问题,但使用不稳定的成分并可产生非特异性反应,导致高的本底(即低信-噪比)。
本发明提供可用于多种核酸反应的新的组合物及方法,并进一步提供其他相关优点。
简单地说,本发明提供可应用于多种配体对反应的组合物及方法,其中要求基于大小分离感兴趣的分子,如核酸分子。在本文提供的公开内容的基础上可提高的代表性方法的例子包括,PCR、差异展示法、RNA指纹法、PCR-SSCP、寡聚物连接检测法、核酸酶消化法(如基于外切和内切核酸酶的检测法)及双脱氧指纹法。可在很广泛的领域里利用本文公开的方法,例如用于临床或研究的诊断、多态性测定及遗传图谱的建立。
在本发明的一个方面,提供了鉴定核酸分子的方法,该方法包括以下步骤(a)从一个或多个选择的核酸分子产生标记的核酸分子,其中标记是与特定的核酸片段相互关联的;并且是可用非荧光光谱法或电位测定法检测的;(b)按大小分离标记的片段;(c)从标记片段上裂解标记;以及(d)用非荧光光谱法和电位测定法检测标记,从而鉴定核酸分子。
在本发明的相关方面内,提供了检测选定的核酸分子的方法,其包括以下步骤(a)在足以使标记的核酸探针与互补的所选靶核酸序列杂交的条件下使标记的核酸探针与标记的核酸分子结合足够长时间,其中标记的核酸探针是可用非荧光光谱法或电位测定法检测的;(b)改变杂交的标记探针、未杂交的探针或靶分子,或探针靶杂交体的大小;(c)按大小分离标记的探针;(d)从标记的探针上切掉标记;以及(e)用非荧光光谱法或电位测定法检测标记,从而确定检测选择的核酸分子。
在本发明的另一个方面内,提供了对选择的生物体进行基因型鉴定(genotyping)的方法,其包括以下步骤(a)从选择的靶分子中产生标记的核酸分子,其中标记是与特定片段相互关联的并可用非荧光光谱法或电位测定法检测;(b)按序列长度分离标记的分子;(c)从标记的分子上裂解标记;以及(d)用非荧光光谱法或电位测定法检测标记,从而确定所说生物体的基因型。
在另一个方面,本发明提供了对选择的生物体进行基因型鉴定的方法,其包括以下步骤(a)在足以使标记分子与靶分子杂交的条件和时间下使标记的核酸分子与选择的靶分子结合,其中标记是与特定的片段相互关联并且可用非荧光光谱法或电位测定法检测的;(b)按序列的长度分离标记的片段;(c)从标记的片段上裂解标记;以及(d)用非荧光光谱法或电位测定法检测标记,从而确定生物体的基因型。
从本发明的上下文中应理解到,“生物学样品”不仅包括得自活生物体(例如哺乳动物、鱼、细菌、寄生虫、病毒、真菌等)或环境(如空气、水或固体样品)的样品,而且包括可人工或合成产生的生物学材料(例如噬菌体文库、有机分子文库、基因组克隆的集合体、cDNA克隆、RNA克隆等)。生物学样品的代表性例子包括生物学液体(如血液、血清、脑脊液、尿液)、生物细胞(如干细胞、B或T细胞、肝细胞、成纤维细胞等),以及生物组织。最后,可进行基因型鉴定的生物体的代表性例子包括基本上任何单细胞或多细胞生物体,如温血动物、哺乳动物或脊椎动物(如人、黑猩猩、恒河猴、马、牛、猪、羊、狗、猫、大鼠和小鼠以及它们的细胞)、细菌、寄生虫、病毒、真菌及植物。
在上述方法的各个实施方案中,可通过连接、裂解或延伸(如PCR)反应产生本发明的核酸探针和/或分子。在其他相关方面,可用非3′标记的寡核苷酸引物(例如5′标记的寡核苷酸引物)或二脱氧核苷酸终止子标记核酸探针或分子。
在本发明的其他实施方案中,可在给定的反应内同时利用4、5、10、15、 20、25、30、35、40、45、50、60、70、80、90、100、200、250、300、350、400、450或多于500个不同的和独特标记的分子。其中各个标记对于选择的核酸分子或片段或探针都是特有的,并可分别鉴定的。
在本发明的再一个实施方案中,可用荧光法、质谱法、红外光谱法、紫外光谱法或恒电势电流测定法(如利用库仑检测器或电流检测器)检测标记。适当的光谱检测技术的例子包括飞行时间质谱法、四极质谱法、磁扇形场质谱、电扇形场质谱法。这些技术的特定实例包括离子俘获质谱法、电喷射离子化质谱法、离子喷射质谱法、液体电离质谱法、大气压流电离质谱法、电子电离质谱法、快原子轰击电离质谱法、MALDI质谱法、光电离飞行时间质谱法、激光小滴质谱法、MALDI-TOF质谱法、APCI质谱法、纳米喷射质谱法、雾化喷射电离质谱法、化学电离质谱法、共振电离质谱法、次级电离质谱法和热喷射质谱法。
本发明的其他实施方案中,可利用区别分子大小(真正的线性大小或三维结构大小)的方法将靶分子、杂交的标记探针、未杂交的探针或靶分子、探针靶杂交体,或标记的核酸探针或分子与其他分子分离开。这些方法的代表性例子包括凝胶电泳、毛细管电泳、微通道电泳、HPLC、大小排阻层析、过滤、聚丙烯酰胺凝胶电泳、液相层析、反向大小排阻层析、离子交换层析、反向液相层析、脉冲场电泳、倒转电场电泳、透析和荧光活化的液体小滴分选。另外,也可将靶分子、杂交的标记探针、未杂交的探针或靶分子、探针靶杂交体,或标记的核酸探针或分子结合到固相载体(例如孔心纤维(Amicon Corporation,Danvers,Mass.)、小珠(Polysciences,Warrington,Pa.)、磁性小珠(Robbin Scientific,MaintainView,Calif.)、平板、平皿和烧瓶(Corning Glass Works,Corning,NY)、筛网(Becton,Dickinson,Mountain View,Calif.)、屏和固体纤维(参见Edelman等人的美国专利No.3,843,324;Kurode等人,美国专利No.4,416,777)、膜(Millipore Corp.,Bedford,Mass.)及浸量尺)上。在本发明的某些实例中,如果第一或第二个成员,或暴露的核酸被结合到固载体上,则本文公开的发明可进一步包括洗涤未结合材料的固相载体的步骤。
在其他实施方案中,可用化学、氧化、还原、酸敏感性、碱敏感性、酶促、电化学、热及光敏感性方法裂解标记的核酸分子或探针。在其他实施方案中,可以连续的方式,例如在可实现自动化的单一装置上完成分离、裂解和检测步骤。
在本发明的某些实施方案中,可用选自下列一组中的方法改变杂交的标记探针、未杂交的探针或靶分子,或探针靶杂交体的大小聚合酶延伸、连接、核酸外切酶消化、核酸内切酶消化、限制性酶消化、位点特异性重组酶消化、连接、错配特异性核酸酶消化、甲基化性核酸酶消化、将探针共价连接到靶分子上以及杂交。
本文公开的方法和组合物可有多方面的应用,例如包括鉴定PCR扩增子、RNA指纹法、差异展示、单链构型多态性检测、二脱氧指纹法、限制性酶谱和限制性片段长度多态性、DNA指纹法、基因型鉴定、突变检测、寡核苷酸连接检测、序列特异性扩增,用于诊断、法医、身份鉴定、发育生物学、生物学、分子医学、毒理学、动物育种。
参见下列详细描述和附图,本发明的这些及其他方面将变得明显。此外,下面列出的更详细地描述某些方法步骤或物质(例如质粒等)的各种参考文献被全文列入本文作为参考。


图1显示合成可化学裂解的质谱检测标记物的五氟苯基酯(以释放出带羧基酰胺末端的标记)的流程。
图2显示合成可化学裂解的质谱检测标记物的五氟苯基酯(以释放带羧酸末端之标记)的流程。
图3-6和8显示合成一组36个光化学可裂解之质谱标记的四氟苯基酯的流程。
图7显示合成一组36个末端为胺的光化学可裂解之质谱标记物的流程。
图9显示从相应的一组36个光化学可裂解之质谱标记酸的四氟苯基酯制得的36个光化学可裂解的质谱标记的寡核苷酸的合成反应步骤。
图10显示从一组36个末端为胺的光化学可裂解之质谱标记物制得的36个光化学可裂解的质谱标记寡核苷酸的合成反应流程。
图11举例显示用质谱法同时检测多个标记。
图12显示单独α-氰基基体的质谱图。
图13显示模式构建的标记的核酸片段。
如上面提到的,本发明提供分析核酸分子的方法和组合物,其中需要按大小分离核酸分子。本方法允许同时检测包括核酸和片段、蛋白质、肽等在内的感兴趣的分子。简单地说,本发明的一个方面提供其中感兴趣的分子或其前体通过不稳定键与标记物连接的化合物。因此,本发明的化合物可用下列结构通式表示T-L-X其中T是标记部分,L是作为或含有不稳定键的接头部分,X是感兴趣的分子(MOI)部分或可供以使MOI结合到T-L上的功能团部分(Lh)。因此本发明的化合物可由下列更特异的通式代表T-L-MOI和T-L-Lh出于如下详细描述的原因,可特意使几组T-L-MOI经受使不稳定键断裂的条件,而从化合物的其余部分上释放出标记部分。然后用一种或多种分析技术鉴定标记部分的特征,从而提供有关标记部分结构的直接信息以及(更重要的)相应的MOI鉴定的间接信息。
作为本发明有代表性的其中L为直接键的化合物的一个简单实例,可参见下列结构(ⅰ)
在结构(ⅰ)中,T是连接到羰基基团上的合氮多环芳族残基,X是MOI(更具体地讲为以胺基团为末端的核酸片段),并且L是形成酰胺基团的键。相对于T中的键来说,如本领域所知,酰胺键是不稳定的,酰胺键可受到不影响标记部分内键的酸或碱性条件的化学裂解(断裂)。因此,可按下示方式释放出标记部分(即含有T的裂解产物)
然而,接头L可能不只是如上实例中所示的直接键,在此可参见本发明的另一个具有下示构(ⅱ)的代表性化合物
已知具有邻位硝基苄胺残基(见结构(ⅱ)内加方框的部分)是光解不稳定的,在这些化合物暴露于特定波长的光化幅射时将引起苄胺键的选择性裂解(参见结构(ⅱ)中标有加重线的键)。因此,结构(ⅱ)具有与结构(ⅰ)相同的T和MOI基团,但接头基团含有多个原子和键,其中有一特殊的不稳定键。因此如下所示,结构(ⅱ)的光解可从化合物的其余部分释放出标记部分(含T部分)。
因此本发明提供这样的化合物,即在其遇有适当的裂解条件后经受裂解反应,从而从化合物的余留部分释放出标记部分。可用标记部分、MOI(或其前体,Ln)以及将两个基团连接在一起的不稳定键来描述本发明的化合物。或者,可用形成化合物的各个组分来描述本发明的化合物。因此可将本发明的化合物描述为如下所述的标记反应物、接头反应物和MOI反应物。
标记反应物由化学柄(Th)和可变部分(Tvc)组成,因而标记反应物可视为具有下列通式结构Tvc-Th为了举例说明这一通式,可参见结构(ⅲ),其显示可用于制备结构(ⅱ)化合物的标记反应物。如下所示,具有结构(ⅲ)的标记反应物含有标记可变部分和标记柄
在结构(ⅲ)中,标记柄(-C(=O)-A)简单地提供一个使标记反应物与接头反应物反应形成T-L部分的通路。结构(ⅲ)中的基团“A”表示羧基基团处于化学活性状态,所以其很容易与其他柄偶联。例如“A”可以是羟基或五氟苯氧基和许多其它基团。如下文详述的,本发明提供很多可与标记可变部分结合的可能的标记柄。因此标记可变部分是式T-L-X中“T”的一部分,并且也将是从裂解L的反应所形成的标记部分的一部分。
也如下文详细讨论的,因为在按照本发明制备各组化合物中,期望每组的成员有独特的可变部分,所以如此命名标记可变部分,从而得以用分析技术将个个成员彼此区分开。作为一个例子,结构(ⅲ)的标记可变部分可以是可根据紫外或质谱区分开的下列一组中的成员
同样,接头反应物可用其侧翼连接有接头不稳定组分的化学柄(至少需要两个,每个都称为Lh)来描述,其中接头不稳定组分由要求的不稳定部分(L2)和可能存在的不稳定部分(L1和L3)组成,此时可能存在的不稳定部分可有效地用于将L2与柄Lh分开,并且必要的不稳定部分则用于在接头不稳定组分内提供不稳定键。因此,接头反应物可视为具有下列通式Lh-L1-L2-L3-Lh可就结构(ⅳ)来举例说明用于描述接头反应物的通式,结构(ⅳ)也是从结构(ⅱ)的化合物得出的
如在结构(ⅳ)中示例的那样,原子可以起到一种以上的功能作用。因此在结构(ⅳ)中,苄基氮在允许接头反应物通过酰胺形成反应连接到标记反应物上的过程中发挥化学柄的功能,并且在继后还可作为不稳定部分L2的必要结构部分,其中苄基碳-氮键对光裂解是特别敏感的。结构(ⅳ)也说明接头反应物虽没有L1基团,但可能有L3基团(此处为亚甲基)。同样,接头反应是可以有L1基团但没有L3基团,或者可以有L1和L3基团,或者可以没有L1也没有L3基团。在结构(ⅳ)中,存在靠近羰基基团的基团“P”,表明羰基基团是受到保护不参予反应的。给定这一构型,标记反应物(ⅲ)的活化的羰基基团即可彻底地与接头反应物(ⅳ)的胺基团反应,以形酰胺键并得到式T-L-Lh的化合物。
MOI反应物是感兴趣分子的适当反应活性形式。其中感兴趣的分子是核酸片段,适当的MOI反应物是通过其5′羟基基团结合到磷酸二酯基团上,然后结合到以氨基基团终止的亚烷基链上的核酸片段。然后该氨基基团与结构(ⅳ)的羰基基团反应(当然是在使羰基去保护之后,并且最好是在继后活化羰基基团以有利于与胺基团反应之后),从而使MOI连接到接头上。
当以时间先后次序考虑时,本发明可看作是用标记反应物(具有化学标记柄和标记可变部分)、接头反应物(具有两个化学接头柄、要求的不稳定部分及0-2个可能存在的不稳定部分)以及MOI反应物(具有感兴趣的分子组分和感兴趣分子的化学柄)形成T-L-MOI。因此,为了形成T-L-MOI,首先使标记反应物和接头反应物一起反应以提供T-L-Lh,然后使MOI反应物与T-L-Lh反应以提供T-L-MOI,或者(较不优选)首先使接头反应物和MOI反应物一起反应以提供Lh-L-MOI,然后使Lh-L-MOI与标记反应物反应以提供T-L-MOI。为方便起见,从可用于形成这类化合物的标记反应物、接头反应物及MOI反应物的角度来描述式T-L-MOI的化合物。当然,也可用其他(通常是更麻烦的)方法来制备式T-L-MOI的同样化合物,并落入本发明T-L-MOI化合物的范围之内。
在任何情况下,本发明都使T-L-MOI化合物在经受裂解条件时从化合物其余部分中释放出标记部分。标记部分将至少包括标记可变部分,并且典型地还包括来自标记柄的某些或所有原子,来自被用于将标记反应物连接到接头反应物上的接头柄的某些或所有原子,任选的不稳定部分L1(如果该基团存在于T-L-MOI中时),并将可能含有取决于L2之精确结构和裂解化学性质的必要不稳定部分L2的某些部分。为方便起见,标记部分可称为含T部分,因为T一般将构成标记部分的主要部分(按质量计)。
在给出关于本发明一个方面的导论后,下文将详细描述T、L和X各组分。这一描述是以某些术语的下述定义开始的,这些定义将在下文中用于描述T、L和X。
本文所用的术语“核酸片段”是指与选择的核酸分子互补的(即互补于其全部或部分),并可衍生于天然或合成或重组产生的分子,包括非天然存在的分子,有时可以是双链或单链形式的;并包括寡核苷酸(如DNA或RNA)、引物、核酸类似物(如PNA)、借助聚合酶以5′至3′方向延伸的寡核苷酸、化学或酶促裂解的核酸、以二脱氧终止子终止的或在3′或5′末端带帽以防止在5′或3′末端聚合的核酸,以及这些形式的组合。核酸片段与选择的靶核酸分子互补一般是指在整个片段长度上表现有至少约70%特异碱基配对。核酸片段较好表现有至少约80%特异性碱基配对;最好至少约90%。确定百分错配(从而百分特异碱基配对)的方法是本领域已知的,并且是基于参照全碱基配对时作为Tm函数的百分错配。
本文所使用的术语“烷基”,无论单独或联合的,均指含有1-10,较好1-6个,最好1-4个碳原子的饱和直链或支链烃残基。这类残基的例子包括但不只限于甲基、乙基、正丙基、异丙基、正丁基、异丁基、仲丁基、叔丁基、戊基、异戊基、己基、癸基等。术语“亚烷基”是指饱和的含有1-10个,较好1-6个,最好1-4个碳原子的直链或支链烃二基。这样的残基的例子包括但不只限于亚甲基、亚乙基(-CH2-CH2-)、亚丙基等。
术语“链烯基”(单独或结合的)是指在总共2-10个,较好2-6个,最好2-4个碳原子链中至少有1个碳-碳双链的直链或支链烃基。这样的基团的例子包括但不只限于乙烯基、E和Z-丙烯基、异丙烯基、E-和Z-丁烯基、E-和Z-异丁烯基、E-和Z-戊烯基、癸烯基等。术语“亚链烯基”是指在总共2-10个,较好2-6个,最好2-4个碳原子链中至少有1个碳-碳双键的直链或支链烃双基。这样的双基的例子包括但不只限于次甲基(=CH2),亚乙烯基(-CH=C-)、亚丙烯基(-CH2-CH=CH-)等。
术语“炔基”,无论单独或组合使用,均指在总共2-10个,较好2-6个,最好2-4个碳原子链中至少有1个碳-碳三键的直链或支链烃残基。这样的残基的例子包括但不只限于乙炔基、丙炔基(炔丙基)、丁炔基、己炔基、癸炔基等。术语“亚炔基”单独或联合使用均指总共有2-10个,较好2-6个,最好2-4个碳原子的链中至少有1个碳一碳三键的直链或分支链烃双基。这样的双基的例子包括但不只限于亚乙炔基(-C≡C-)、亚丙炔基(-CH2-C≡C-)等。
术语“环烷基”(单独或组合的)是指含3至8个,较好3至6个碳原子的饱和的环形的碳原子排列。这样的环烷基残基的例子包括但不只限于环丙基、环丁基、环戊基、环己基等。术语“环亚烷基”是指环烷基的双基形式。
术语“芳基”是指(整个由碳和氢组成)选自苯基、萘基、茚基、2,3二氢化茚基、薁基、芴基和蒽基的碳环芳香基团;或选自呋喃基、噻吩基、吡啶基、吡咯基、噁唑基、噻唑基、咪唑基、吡唑基、2-吡唑啉基、吡唑烷基、异噁唑基、异噻唑基、1,2,3-噁二唑基、1,2,3-三唑基、1,3,4-噻二唑基、哒嗪基、嘧啶基、吡嗪基、1,3,5-三嗪基、1,3,5三噻烷基、中氮茚基、吲哚基、异吲哚基、3H-吲哚基、二氢吲哚基、苯并[b]呋喃基、2,3-二氢苯并呋喃基、苯并[b]噻吩基、1H-吲唑基、苯并咪唑基、苯并噻唑基、嘌呤基、4H-喹嗪基、喹啉基、异喹啉基、噌啉基、2,3-二氮杂萘基、喹唑啉基、喹喔啉基、1,8-二氮杂萘基、喋啶基、咔唑基、吖啶基、吩嗪基、吩噻嗪基和吩噁嗪基的杂环芳香基团。
本申请中限定的“芳基”基团可独自含有1至4个取代基,其独立地选自氢、卤素、羟基、氨基、硝基、三氟甲基、三氟甲氧基、烷基、链烯基、炔基、氰基、羧基、烷氧羰基、1,2-二氧亚乙基、烷氧基、链烯氧基或炔氧基、烷基氨基、链烯基氨基、炔基氨基、脂族或芳族酰基、烷氧羰基氨基、烷基磺酰氨基、吗啉代羰基氨基、硫代吗啉代羰基氨基、N-烷基胍基、芳烷氨基磺酰基;芳烷氧基烷基;N-芳烷氧基脲;N-羟基脲;N-链烯基脲;N,N-(烃基,羟基)脲;杂环基;硫代芳氧基取代的芳基;N,N-(芳基、烷基)肼基;Ar′取代的磺酰基杂环基;芳烷基取代的杂环基;环烷基和环烯基取代的杂环基;环烷基缩合的芳基;芳氧基取代的烷基;杂环基氨基;脂族或芳族酰基氨基羰基;脂族或芳族酰基取代的链烯基;Ar′取代的氨基羰基氧基;Ar′,Ar′-二取代的芳基;脂族或芳族酰基取代的酰基;环烷基羰基烷基;环烷基取代的氨基;芳氧基羰基烷基;二氨基磷酸或酯。
“Ar”是具有1至3个取代基的如上文定义的碳环或杂环芳基,所述取代取选自氢、卤素、羟基、氨基、硝基、三氟甲基、三氟甲氧基、烷基、链烯基、炔基、1,2-二氧亚甲基、1,2-二氧亚乙基、烷氧基、链烯氧基、炔氧基、烷氨基、链烯基氨基或炔基氨基、烷基羰氧基、脂族或芳族酰基、烷基羰基氨基、烷氧基羰基氨基、烷基磺酰氨基、N-烷基或N,N-二烷基脲。
术语“烷氧基”单独或联合均指烷基醚残基,其中术语“烷基”定义同上。适当的烷基醚残基的例子包括但不只限于甲氧基、乙氧基、正丙氧基、异丙氧基、正丁氧基、异丁氧基、仲丁氧基、叔丁氧基等。
术语“链烯氧基”单独或联合均指式链烯基-O-的残基,其中术语“链烯基”定义同上,但条件是该残基不是烯醇醚。适当的链烯氧基残基的例子包括但不只限于烯丙氧基、E-和Z-3-甲基-2-丙烯氧基等。
术语“炔氧基”单独或合用均指式炔基-O-的残基,其中术语“炔基”定义同上,但条件是该残基不是炔醇醚。适当的炔氧基残基的例子包括但不只限于炔丙氧基、2-丁炔氧基等。
术语“硫代烷氧基”是指式烷基-S-的硫醚残基,其中烷基定义同上。
术语“烷基氨基”单独或联合使用均指单一或二烷基取代的氨基残基(即式烷基-NH-或(烷基)2-N-的残基),其中术语“烷基”定义同上。适当的烷基氨基残基的例子包括但不只限于甲氨基、乙氨基、丙氨基、异丙氨基、叔丁氨基、N,N-二乙氨基等。
术语“链烯氨基”单独或联合均使用均指式链烯基-NH-或(链烯基)2N-的残基,其中术语“链烯基”定义同上,但条件是该残基不是烯胺。这样的链烯基氨基残基的例子是烯丙氨基残基。
术语“炔氨基”单独或联合使用均指式炔基-NH-或(炔基)2N-的残基,其中术语“炔基”定义同上,但条件是该残基不是炔胺。这样的炔氨基残基的例子是炔丙氨基残基。
术语“酰胺”是指-N(R1)-C(=O)-或-C(=O)-N(R1)-,其中R1定义为包括氢及其他基团。术语“取代的酰胺”是指其中R1不是氢的状态,而术语“未取代的胺”是指其中R1是氢的状态。
术语“芳氧基”单独或联合使用均指式芳基-O-的残基,其中芳基定义同前。芳氧基残基的例子包括但不只限于苯氧基、萘氧基、吡啶氧基等。
术语“芳氨基”单独或联合使用均指式芳基-NH-的残基,其中芳基的定义同上所述。芳氨基的例子包括但不只限于苯氨基(苯胺基)、萘氨基、2-,3-和4-吡啶氨基等。
术语“芳基缩合的环烷基”单独或联合使用均指与芳基残基分享两个相邻原子的环烷基残基,其中术语“环烷基”和“芳基”定义同上。芳基缩合的环烷基残基的例子是与苯缩合的环丁基残基。
术语“烷基羰基氨基”单独或联合使用均指式烷基-CONH的残基,其中术语“烷基”定义同上。
术语“烷氧基羰基氨基”单独或联合使用均指式烷基-OCONH-的残基,其中术语“烷基”定义同上。
术语“烷基磺酰氨基”单独或联合使用均指式烷基-SO2NH-的残基,其中术语“烷基”定义同上。
术语“芳磺酰氨基”单独或联合使用均指式芳基-SO2-NH-的残基,其中术语“芳基”的定义同上所述。
术语“N-烷基脲”单独或联合使用均指式烷基-NH-CO-NH-的残基,其中术语“烷基”定义如上。
术语“N-芳基脲”单独或联合使用均指式芳基-NH-CO-NH-的残基,其中术语“芳基”定义同上。
术语“卤素”单独或结合使用是指氟、氯、溴和碘。
术语“烃残基”是指只需要一个氢原子就可以成为独立的稳定分子的碳和氢的排布。因此,烃残基在一个碳原子上有一个开放化合价位点,通过该位点烃残基可结合到其他原子上。烃基的例子有烷基、链烯基、炔基、环烷基等。
术语“烃双基”是指只需要两个氢原子就可以成为独立的稳定分子的碳和氢的排布。因此,烃双残基在一个或两个碳原子上有两个开放化合价位点,通过该位点烃残基可结合到其他原子上。烃双基的例子有亚烷基、亚链烯基、亚炔基、亚环烷基等。
术语“烃基”是指具有单一价位点整个由碳和氢组成的任何稳定排布,借助价位点其结合到另一个部分上,因此包括烷基、链烯基、炔基、环烷基、环链烯基、芳基(没有杂原子掺入芳环中)、芳烷基、烷芳基等。烃残基也称为烃基。
术语“亚烃基”是指具有两个价位点整个由碳和氢组成的任何稳定的排布,借助价位点使之结合到其他部分上的,因此该术语包括亚烷基、亚链烯基、亚炔基、亚环烷基、亚环链烯基、亚芳基(没有杂原子掺入到亚芳环中)、芳基亚烷基、烷基亚芳基等。烃双基也称为亚烃基。
术语“烃基-O-亚烃基”是指结合到氧原子上的烃基基团,其中氧原子同样也在两个使亚烃基基团结合到其他部分上的价位点之一处结合到亚烃基基团上。术语“烃基-S-亚烃基”、“烃基-NH-亚烃基”和“烃基-酰胺-亚烃基”具有等同的含义,只所说的氧分别代之以硫、-NH-或酰胺基团。
术语“N-(烃基)亚烃基”是指其中两个价位点之一结合到氮原子上,并且氮原子同时结合到氢和烃基基团上的亚烃基基团。术语“N,N-二(烃基)亚烃基”是指其中两个价位点之一结合到氮原子上,并且氮原子同时结合到两个烃基基团上的亚烃基基团。
术语“烃酰基-亚烃基”是指通过酰基(-C(=O)-)基团结合到亚烃基基团的两个价位点之一上的烃基基团。
术语“杂环烃基”和“杂环基”是指包括碳原子和多达4个的选自氧、氮、磷和硫和原子(称为杂原子)的稳定的环形排布。环排布可以是3-7个原子的单环形式的,或者是8-11个原子的双环形式的。环可以是饱和或未饱和的(包括芳香环),并且可以是或不是苯缩合的。环中的氮和硫原子可以是任何氧化形式的,包括季铵化形式的氮。杂环烃基可以在任何内环碳或杂原子处连接从而产生稳定的结构。优选的杂环烃基包括含有1或2个氮杂原子的5-7元单环杂环。
取代的杂环烃基是指上文限定的杂环烃基,其中至少其一个环原子结合到伸出环的指定的取代基上。
就烃基和亚烃基基团而言,术语“任何其中一个或多个氢被相等数目的氟取代的前述基团的衍生物”是指含有碳、氢和氟子,但不含其他原子的分子。
术语“活化的酯”是含有可很容易被亲核试剂如胺、醇或硫醇亲核试剂取代的“离去基团”的酯。这样的离去基团是已知的,并包括而不限于N-羟基琥珀酰亚胺、N-羟基苯并三唑、卤素(卤离子)、包括四氟苯氧基在内的烷氧基、硫代烷氧基等。术语“被保护的酯”是指被蔽避的或以其它方法致无反应性的酯基(如参见Greene,“有机合成中的保护基团”)。
考虑到上述定义,本领域技术人员可很容易地理解本申请全文中所使用的其他化学术语。这些术语可以单独使用或以其任何组合方式使用。残基的优选的或更优选的链长度适用于所有这些组合。A.标记的核酸片段的产生如上文提到的,本发明的一个方面提供用于DNA测序的一般方案,其允许在每个泳道中使用16个以上的标记;进行连续检测,可以检测标记并且如基于荧光的常规测序一样,在按大小分离时读出序列。该方案可适用于基于标记分子的大小分离的任何DNA技术。以下更详细地讨论用于本发明的适当标记和接头,以及测定核酸序列的方法。
1.标记本文使用的术语“标记”一般是指用于专门鉴定“感兴趣的分子”的化学部分,特别是指标记可变部分以及标记反应物、标记组分和标记部分的可能与之紧密结合的部分。
可用于本发明的标记具有以下几个特性1)其能够与所有其他标记分开。与其他化学部分的这种区别可能是基于标记的色谱行为(特别是在裂解反应之后)、其光谱或电势性质或其某些组合。可用于区分标记的光谱方法包括质谱(MS)、红外(IR)、紫外(UV)及荧光,其中优选的是MS、IR和UV,并且MS是最优选的光谱法。电势电流法是优选的电势检测法。
2)当以10-22至10-6摩尔存在时即可检测标记。
3)标记具有化学柄,通过该柄其可连接到MOI上,借以专门地鉴定之。连接可以是直接连到MOI上,或通过“接头”基团连接到MOI上。
4)标记对于所有其经受的操作,包括与MOI连接或与之裂解开,以及对其所连接的MOI的任何操作都是化学上稳定的。
5)标记对于其所连接的MOI上进行的操作无明显干扰。例如,如果标记是连接到寡核苷酸上,标记必须是对涉及寡核苷酸的任何杂交或酶促反应(例如PCR测序反应)都没有明显干扰的。同样,如果标记是连接到抗体上,则它必须对该抗体的抗原识别没有明显的干扰。
欲用某些光谱或电势测定法检测的标记部分应具有提高该方法之检测敏感性和特异性的性质。典型地,标记部分将具有那些性质,因为这些性质已被设计到标记可变部分中,其一般将构成标记部分的主要部分。在下面的讨论中,使用“标记”一词一般是指标记部分(即含有标记可变部分的裂解产物),但也可以为是指标记可变部分本身,因为其为负责提供标记部分中特异可检测性质的那部分。在式T-L-X的化合物中,“T”部分将含有标记可变部分。标记可变部分已被设计成可用例如质谱法鉴定的成分,这样T-L-X的“T”部分便可称为Tms。同样,含有T的T-L-X的裂解则可称为含Tms的部分。可用下述质谱和电势测定法鉴定含Tms部分的性质。
a.MS标记的特征当标记可用质谱法分析时(即为MS可读的标记,本文也称之为MS标记或“含Tms部分”),标记的基本特征是其能够被离子化。因此在设计MS可读标记中,于其中掺入可在MS中的离子化条件下携带正电荷或负电荷的化学功能团是一个优选要素。这一特征是提供改善的离子形成效率以及检测的更大总体灵敏度,特别是在电喷射离子化过程中。支持离子化电荷的化学功能团可来自Tms或L或这两者。例如Sunner,J.等人(Anal.Chem,60:1300-1307(1988))描述了可提高质谱法检测分析物的相对灵敏度的因素。
有利于携带负电荷的优选的功能团是有机酸,如酚式羟基、羧酸、膦酸、磷酸、三唑、磺酰脲、全氟醇和磺酸。
有利于在离子化条件下带正电荷的优选的功能团是脂族或芳香胺。赋予MS标记以提高的可检测性的胺功能团包括季铵类(即具有4个键,每个都连到碳原子上的胺,参见Aebersold,美国专利No.5,240,859)和叔胺(即有各自连到碳原子上的3个键的胺,其包括例如存在于吡啶中的C=N-C基团,参见Hess等人,Anal.Biochem,224:373,1995;Bures等人,Anal.Biochem.224:364,1995)。特别优选的是位阻季胺。叔胺和季铵可以是烷基或芳基胺。含Tms部分必须带有至少一个可离子化基团,但也可具有一个以上的可离子化基团。优选的电荷状态是每个标记都是单一离子化的。因此,最好是每个含Tms部分(及每个标记可变部分)都只含有单一的位阻胺或有机酸基团。
可形成含Tms部分之一部分的适当的胺残基包括下示基团
用质谱法鉴定标记较好是基于其分子质量对电荷的比例(m/z)。MS标记的优选分子质量范围是从大约100至2000道尔顿,含Tms部分较好有至少约250道尔顿的质量,更好至少约300道尔顿,最好至少约350道尔顿。质谱法一般难于区分具有低于约200-250道尔顿之母离子的残片(取决于精密设备),因此本发明的含Tms部分最好有大于上述范围的质量。
如上面解释的,含Tms部分可含有存在于标记可变部分中的原子以外的原子,并确实不存在可Tms本身中的原子。因此,Tms本身的质量可小于约250道尔顿,只要含Tms部分具有至少约250道尔顿的质量即可。因此,Tms的质量范围可为15(即甲基)至约10,000道尔顿,较好是100至大约5,000道尔顿,最好是大约200至大约1,000道尔顿。
当标记掺入有一种以上具明显丰度之同位素的原子时,用质谱法分辨这些标记就比较困难。因此,欲进行质谱鉴定的优选T基团(Tms基团)含有碳,氢和氟中至少一种,以及可能有的选自氧、氮、硫、磷和碘的原子。虽然Tms中可存在其他原子,但它们的存在有时会使质谱数据更难以分析。Tms基团中除氢和/或氟外,最好只有碳、氮和氧原子。
氟在Tms基团中是可能有的甚至优选的原子。与氢相比,当然氟要重得多。因此,氟而不是氢原子的存在使Tms基团有更高的质量,从而使T上SM基团达到并超过如上文所述的预期的大于250道尔顿的质量。此外,用氟取代氢可使含Tms部分有更大的挥发性,并且当使用质谱法作为检测方法时分析物有更大的挥发性可提高检测的灵敏度。
Tms的分子式落入C1-500N0-100O0-100S0-10P0-10HαFβIδ的范围之内,式中α、β和δ的总和足以饱和C、N、O、S和P原子的未饱和价。C1-500N0-100O0-100S0-10P0-10HαFβIδ是指Tms含有至少一个,并可含有从1至500任何数目的碳原子,此外还可任意地含有多至100个氮原子(“N0-”是Tms不需含有任何氮原子)、多至100个氧原子,以及多至10个硫原子和多至10个磷原子。符号α、β和δ代表Tms中氢、氟和碘原子的数目,这些数目中的任何两个都可能是0,并且这些数目的总和等于C、N、O、S和P原子的总的未饱和的价数。Tms优选具有落入C1-50N0-10O0-10HαFβ范围内的分子式,其中α和β的总和分别等于存在于该部分中的氢和氟原子的数目。
b.IR标记的特征有机化学基团的IR检测有两种基本形式随机扫描IR和吸收IR。随机扫描IR光谱和吸收IR光谱是互补的光谱法。一般说来,喇曼激发取决于键极性改变,而IR吸收则取决于键偶极性改变。弱IR吸收线变成强喇曼线,且反之亦然。波数是IR光谱的特征性单位。IR标记有3个不同应用的光谱区在12500至4000cm-1处的近IR,4000至600cm-1处的中IR,600至30cm-1处的远IR。为了本文所述的以化合物作为鉴定MOI、探针或引物的标记的应用,应优选中红外光谱区。例如,羧酸、羧酸酯和酰胺、碳酸烷基和芳基酯、氨基甲酸酯和酮应检测羰基伸缩(1850至1750cm-1)。N-H弯曲(1750至160cm-1)将用于鉴定胺、铵离子和酰胺。在1400至1250cm-1,检测R-OH弯曲以及酰胺中的C-N伸缩。在900至690cm-1检测芳族取代方式(ArNH2的C-H弯曲,N-H弯曲)。饱和的C-H、烯烃、芳环、双和三键、酯、缩醛、缩酮、铵盐、N-O化合物和肟、硝基、N-氧化物和硝酸酯、偶氮、腙、苯醌、羧酸、酰胺,以及内酰胺都具有振动红外相关性数据(参见Pretsch et al.,有机化合物结构测定的光谱数据,Springer-Verlag,New York,1989)。优选的化合物应包括在2230至2210cm-1表现出很强的伸缩振动的芳族腈。其他有用类型的化合物是具有在2140和2100cm-1之间产生尖锐吸收带之强伸缩振动的芳族炔。第三种类型的化合物是在2160至2120cm-1区表现有强吸收带的芳族叠氮化物。硫氰酸酯是在2275至2263cm-1有强吸收的有代表性的化合物。
c.UV标记的特征Scott在其著作(天然产物紫外光谱的解析,Permagon Press,NewYork,1962)中给出了有机发色团类型和它们各自的紫外可见光特征的汇编。发色团是负责特定光吸收的原子或原子群或电子群。对共轭系统中的π至π*最大吸收存在经验规则(参见Pretsch等,有机化合物结构测定的光谱数据,p.B65和B70,Springer-Verlag,New York,1989)。优选的化合物(用共轭系统)应具有n至π*和π至π*转换。这样的化合物的例子是酸性紫T、吖啶橙、吖啶黄G、亮兰G、刚果红、结晶紫、孔雀绿草酸盐、间胺黄、亚甲蓝、甲基橙、甲基紫B、萘酚绿B、油蓝N、油红O、4-苯偶氮酚、藏红、溶剂绿3和苏丹橙G,所有这些化合物都是可以市场上得到的(Aldrich,Milwaukee,WD。例如Jane,I.等,J.Chrom.323:191-225(1985)中列出了其他一些适用的化合物。
d.荧光标记的特征荧光探针大多直接根据吸收度和荧光发射波长及强度鉴定和定量分析。发射光谱(荧光和磷光)比吸收光谱更加敏感,并得以更特异的检测。其他光物理学特征如受激状态半寿期和荧光各向异性则使用不那么广泛。通常最有用的强度参数是吸收的摩尔消光系数(ε)和荧光的量子产率(QY)。在单一被长处ε的值是特定的(通常是探针吸收最大值),而QY则是通过整个荧光光谱分布图的总光电发射的度量。荧光激发(通过吸收)通常使用窄的光学带宽(<20nm),而荧光检测带宽的可变度大得多,其最大灵敏度范围从全谱带到最大分辨率的窄谱带(~20nm)。每种探针分子的荧光强度是与δ和QY的乘积成正比的。在同前有实际应用重要性的荧光团中,这些参数的范围是δ约为10,000至100,000cm-1M-1,QY为0.1至1.0。可用作荧光标记的化合物是荧光素、若丹明、λ蓝470、λ绿、λ红664、λ红665、吖啶橙和碘化Propidium,这些化合物均可从Lambda Fluorescence Co.(Pleasant Gap.PA)购得。荧光化合物例如尼罗红、德克萨斯红、丽丝胺TM、BODIPYTM则可从MolecularProbe(Eugene,OR)购得。
e.电势标记的特征电化学检测(ECD)的原理是基于在某些外加电压下化合物氧化或还原,供出或接受电子而产生可被检测的电流。当某些化合物经受电位差时,分子在工作电极表面经受到分子重排,丢失(氧化)或获得(还原)电子,这样的化合物可以说是电活性的并经受电化学反应。在HPLC洗脱液通过电极流动时,EC检测器在电极表面施加电压。从柱上洗脱的电活性化合物供出电子(氧化)或获得电子(还原)同时产生电流峰。重要的是,所产生的电流量取决于分析物的浓度和所施加的电压,每种化合物均具有其开始氧化或还原所需特异性电压。目前最通用的电化学检测器是电流检测器,其中电势保持恒定并在其后检测由电化学反应产生的电流。这种类型的光谱测定法目前称为“恒电位电流测法”。市售安培计可得自ESA,Inc.,Chelmford,MA。
当检测效率为100%时,特异化检测器称为“库仑检测器”。就选择性和灵敏度来说,库仑检测器具有许多实践优点,从而使此类检测器特别适用于一个阵列中。在库仑检测器中,对于给定的分析物浓度,将信号电流作为对工作电极外加电势(电压)的函数作图。所得到的S形曲线图称为电流-电压曲线或流体动力电压电流图(HDV)。HDV允许最好地选择对工作电极施加的电势,以使所观察到的信息达到最大。ECD的主要优点是其固有的灵敏度,检测的电流水平在亚非摩尔(10-15摩尔)范围。
包括许多生物化学品、药物及杀虫剂在内的大量化学物质及化合物都是有电化学活性的。即使它们的半波电势(最大信号半数值时的电势)只有30-60mV的差异,仍可有效地分辨层析共洗脱的化合物。
最近发展的库仑传感器当在基于液相层析的分离中用作检测器时,可选择性地鉴定和分辨共洗脱化合物。因此这些阵列化的检测器还可补加在检测器本身中完成的另一组分离。目前的仪器具有原则上只受获得数据的速率限制的16个波道。可在EC阵列上分辨的化合物的数目是受层析限制的(即受板数限制)。然而,如果层析共洗脱的两种或多种化合物的半波电位差为30-60mV,则该阵列即能够区分之。化合物成为电化学活性化合物的能力有赖于其具有EC活性基团(即-OH、-O、-N、-S)。
已使用库仑检测器成功地检测的化合物包括5-羟基色胺、3-甲氧基-4-羟苯基乙二醇、尿黑酸、多巴胺、变肾上腺素、3-羟犬尿氨酸、乙酰米诺芬(acetominophen)、3-羟色醇、5-羟吲哚基乙酸、苯酚、邻甲酚、焦培酚、2-硝基苯酚、4-硝基苯酚、2,4-二硝基苯酚、4,6-二硝基甲酚、3-甲基-2-硝基苯酚、2,4-二氯苯酚、2,6-二氯苯酚、2,4,5-三氯苯酚、4-氯-3-甲基苯酚、5-甲基苯酚、4-甲基-2-硝基苯酚、2-羟苯胺、4-羟苯胺、1,2-苯二胺、苯并儿茶素、巴特隆、chlortholuron、敌草隆、isoproturon、利谷隆、methohromuron、麦多隆、绿谷隆、monuron、蛋氨酸、色氨酸、酪氨酸、4-氨基苯甲酸、4-羟苯甲酸、4-羟香豆酸、7-甲氧基香豆素、5,7,4′-三羟黄酮、黄岑苷元、咖啡酸、儿茶素、矢车菊苷、绿原酸、大豆黄素、野麻根素、洋芜荽黄素、表儿茶素没食子酸盐、表加兰儿茶素、表加蓝儿茶素没食子酸盐、丁子香酚、半齿泽兰素、阿魏酸、非瑟酮、高良姜精、没食子酸、桅子宁、染料木黄酮、龙胆酸、桔皮苷、鸢尾配基、莰非醇、无色花青素、藤黄菌素、楝子素、桑色素、杨梅黄酮、柚皮苷、柚皮素-7-芸香糖苷、花葵素、甲基花青素、根皮素、红车轴草异丙酮、原儿茶酸、鼠李黄素、槲皮素、樱花素、黄芩配基、莨菪亭、丁香醛、丁香酸、柑桔黄酮、troxerutin、伞形酮、香草酸、1,3-二甲基四氢异喹啉、6-羟多巴胺、r-猪毛菜醇、N-甲基-猪毛菜醇、四氢异喹啉、阿米替林、阿林吗啡、辣椒辣素、氯氮、氯丙嗪、道诺红菌素、地昔帕明、多塞平、氟西汀、氟西泮(氟安定)、米帕明、异丙基肾上腺素、甲氧明、吗啡、吗啡-3-葡糖苷酸、去甲替林、奥沙西泮(去甲羟安定)、苯福林(去氧肾上腺素)、曲米帕明、抗坏血酸、N-乙酰-5-羟色胺、3,4-二羟苄胺、3,4-二羟扁桃酸(DOMA)、3,4-二羟苯乙酸(DOPAC)、3,4-二羟苯丙氨酸(L-DOPA)、3,4-二羟苯基乙二醇(DHPG)、3-羟基氨茴酸、2-羟基苯乙酸(2HPAC)、4-羟苯甲酸(4HBAC)、5-羟吲哚-3-乙酸(5HIAA)、3-羟犬尿氨酸、3-羟偏桃酸、3-羟-4-甲氧基苯乙胺、4-羟苯乙酸(4HPAC)、4-羟苯基乳酸(4HPLA)、5-羟色氨酸(5HTP)、5-羟色醇(5HTOL)、5-羟色胺(5HT)、5-羟色胺硫酸盐、3-甲氧基-4-羟苯基乙二醇(MHPG)、5-甲氧基色胺、5-甲氧基色氨酸、5-甲氧基色醇、3-甲氧基酪胺(3MT)、3-甲氧基酪氨酸(3-OM-DOPA)、5-甲基半胱氨酸、3-甲基鸟嘌呤、蟾毒色胺、多巴胺、多巴胺-3-葡糖苷酸、巴多胺-3-硫酸酯、多巴胺-4-硫酸酯、肾上腺素、麻黄宁、叶酸、谷胱苷肽(还原态)、鸟嘌呤、鸟苷、尿黑酸(HGA)、高香草酸(HVA)、高香草醇(HVOL)、高藜芦酸、硫酸hva、次黄嘌呤、吲哚、吲哚-3-乙酸、吲哚-3-乳酸、犬尿氨酸、褪黑素、变肾上腺素、N-甲基色胺、N-甲基酪胺、N,N-二甲基色胺、N,N-二甲基酪胺、去甲肾上腺肾、去甲变肾上腺素、章鱼胺、吡哆醛、磷酸吡哆醛、吡哆胺、脱氧肾上腺素、色醇、色胺、酪胺、尿酸、香草扁桃酸(vma)、黄嘌呤及黄苷。其他化合物如可参见Jane,I.等,J.Chrom.323:191-225(1985)和Musch,G.等,J.Chrom.348:99-110(1985)。可用本领域已知的方法将这些化合物掺入到式T-L-X的化合物中。例如,具有羧酸基团的化合物可与胺、羟基等反应以形成酰胺、酯及T和L间的其他键合。
除上述性质外,无论打算使用什么检测方法,标记都最好具有模式化学结构。这将有助于使用组合化学技术构建大数目的结构上相关的标记。例如,希望Tms有几种性质。期望当以质谱法检测含Tms部分时,其含有支持单一离子化带电状态的功能团(更简单地称为“质谱灵敏度增强”基团,或简称为MSSE)。另外,希望以其作为含Tms部分的家族中的一个成员,该家族的每个成员都有不同的质量/电荷比例,而在质谱检测中又有差不多同样的灵敏度。因此,希望该家族的成员有同样的MSSE。为了得以产生化合物的家族,已发现可通模式合成路线方便地产生标记反应物,因而可将标记成分本身看作是含有模式的。
对于Tms基团的结构,一个优选的模式是Tms具有下列通式T2-(J-T3)n-其中T2是从碳和一个或多个氢、氟、碘、氧、氮、硫和磷形成的具有15至500道尔顿的质量范围的有机残基;T3是从碳和一个或多个氢、氟、碘、氧、氮、硫和磷形成的具有50至1000道尔顿的质量范围的有机残基;J是直接键,或诸如酰胺、酯、胺、硫醚、醚、硫代酯、二硫化物、硫代醚、脲、硫脲、氨基甲酸酯、硫代氨基甲酸酯、西夫碱、还原态西夫碱、亚胺、肟、腙、磷酸酯、膦酸酯、磷酰胺、膦酰胺、磺酸酯、氨磺酰或碳-碳键的功能团;n是1至50的整数,这样当n大于1时,每个T3和J都是独立选择的。
模式结构T2-(J-T3)n-提供了进入T-L-X化合物家族的方便途径,其中家族的每个成员都有不同的T基团。例如,当T是Tms,并且每个家族成员都期望有同样的MSSE时,T3基团之一即可提供这种MSSE结构。为了就Tms的质量而言提供家族成员间的可变性,家族成员间的T2基团可以是变化的。例如,一个家族成员可以有T2=甲基,而另一个有T2=乙基,再一个则有T2=丙基等。
为了提供质量的大跳跃,可以设计T3基团以向T-L-X上加入相当大的(如1百至几百个)质量单位。这样的T3基团可称为分子量范围调整基团(“WRA”)。如果用一组具有超出限制范围的质量的T2基团工作,WRA是相当有用的。可使用单一组T2基团,仅仅通过在Tms中掺入一个或多个WRAT3基团来产生有宽质量范围的Tms基团。因此,举一个简单的例子,如果一组T2基团为Tms提供250-340道尔顿的质量范围,加入例如作为T3基团的100个道尔顿的WRA,则使用同一组T2基团,就可提供350-440道尔顿的质量范围。同样,加入两个100道尔顿MWA基团(各自作为T3基团)便提供接近450-540道尔顿的质量范围,可继续这种WRA基团的递增加入,以为Tms基团提供很大的质量范围。优选的式T2-(J-T3)n-L-X的化合物具有通式RVWC-(RWRA)W-RMSSE-L-X,其中VWC是“T2”基团,WRA和MSSE中的每一个都是“T3”基团。图13中举例说明了这一结构,并代表了制备Tms的一种模式方法。
在通式T2-(J-T3-)n-中,T2和T3较好是选自烃基、烃基-O-亚烃基、烃基-S-亚烃基、烃基-NH-亚烃基、烃基-酰胺-亚烃基、N-(烃基)亚烃基、N,N-二(烃基)亚烃基、烃基酰基-亚烃基、杂环基烃基,其中杂原子选自氧、氮、硫和磷,取代的杂环基烃基,其中杂原子选自氧、氮、硫和磷,且取代基选自烃基、烃基-O-亚烃基、烃基-NH-亚烃基、烃基-S-亚烃基、N-(烃基)亚烃基、N,N-二(烃基)亚烃基以及烃基酰基-亚烃基。此外,T2和/或T3可以是前面列出的潜在T2/T3基团中任何一个的衍生物,即一个或多个氢原子被氟原子取代。
还就通式T2-(J-T3)n-来说,优选的T3具有式-G(R2)-,其中G是具有单一R2取代基的C1-6亚烷基链。因此,如果G是亚乙基(-CH2-CH2-),则两个亚乙基碳中的任一个可具有R2取代基,并且R2选自烷基、链烯基、炔基、环烷基、芳基缩合的环烷基、环烯基、芳基、芳烷基、芳基取代的链烯基或炔基、环烷基取代的烷基、环烯基取代的环烷基、联芳基、烷氧基、链烯氧基、炔氧基、芳烷氧基、芳基取代的链烯氧基或炔氧基、烷氨基、链烯氨基或炔氨基、芳基取代的烷氨基、芳基取代的链烯氨基或炔基氨基、芳氧基、芳氨基、N-烷基脲取代的烷基、N-芳基脲取代的烷基、烷基羰基氨基取代的烷基、氨基羰基取代的烷基、杂环基、杂环基取代的烷基、杂环基取代的氨基、羧烷基取代的芳烷基、氧代碳环缩合的芳基和杂环基烷基;环烯基、芳基取代的烷基和芳烷基、羟基取代的烷基、烷氧基取代的烷基、芳烷氧基取代的烷基、烷氧基取代的烷基、芳烷氧基取代的烷基、氨基取代的烷基、(芳基取代的烷氧基羰基氨基)取代的烷基、硫羟取代的烷基、烷基磺酰取代的烷基、(羟基取代的烷硫基)取代的烷基、硫代烷氧基取代的烷基、烃基酰基氨基取代的烷基、杂环酰基氨基取代的烷基、烃基取代的杂环基酰基氨基取代的烷基、烷基磺酰氨基取代的烷基、芳基磺酰氨基取代的烷基、吗啉代烷基、硫代吗啉代烷基、吗啉代羰基取代的烷基、硫代吗啉代羰基取代的烷基、(N-(烷基、链烯基或炔基)-或N,N-[二烷基、二链烯基、二炔基或(烷基、链烯基)-氨基]羰基取代的烷基、杂环基氨基羰基、杂环基亚烷基氨基羰基、杂环基氨基羰基取代的烷基、杂环基亚烷基氨基羰基取代的烷基、N,N-[二烷基]亚烷基氨基羰基、N,N-[二烷基]亚烷基羰基取代的烷基、烷基取代的杂环基羰基、烷基取代的杂环基羰基-烷基、羧基取代的烷基、二烷基氨基取代的酰基氨基烷基,以及选自精氨酸、天冬酰胺、谷氨酰胺、S-甲基半胱氨酸、蛋氨酸和其相应的亚砜和砜衍生物、甘氨酸、亮氨酸、异亮氨酸、别异亮氨酸、叔亮氨酸、正亮氨酸、苯丙氨酸、酪氨酸、色氨酸、脯氨酸、丙氨酸、鸟氨酸、组氨酸、谷氨酸、缬氨酸、苏氨酸、丝氨酸、天冬氨酸、β-氰基丙氨酸及别苏氨酸的氨基酸侧链;炔基和杂环基羰基、氨基羰基、酰氨基、一或二烷基氨基羰基、一或二芳基氨基羰基、烷基芳基氨基羰基、二芳基氨基羰基、一或二酰基氨基羰基、芳族或脂族酰基、被选自氨基、羧基、羟基、巯基、一或二烷基氨基、一或二芳基氨基、烷基芳基氨基、二酰基氨基、一或二芳基氨基、烷氧基、链烯氧基、芳氧基、硫代烷氧基、硫代链烯氧基、硫代炔氧基、硫代芳氧基和杂环基任意取代的烷基。优选的式T2-(J-T3-)n-L-X的化合物具有下示结构
其中G是(CH2)1-6,其中由单一“G”代表的CH2基团中一个并且只有一个上的氢原子被-(CH2)c-酰胺-T4所取代,T2和T4是式C1-25N0 -9HαFβ的有机残基,其中α和β的总和足以饱和C、N和O原子可能未饱和的价;酰胺是
R1是氢或C1-10烷基;C是0至4的整数,n是1至50的整数,其中当n大于1时,G、c、酰胺、R1和T4是独立地选择的。
在另一个优选实施方案中,式T2-(J-T3-)n-L-X的化合物具有下示结构
其中T5是式C1-25N0-9O0-9HαFβ的有机残基,其中α和β的和足以饱和C、N和C原子的可能未饱和的价;T5包括叔或季胺或有机酸;m是0-49的整数,且T2、T4、R1、L和X是如前定义的基团。
另一个具有式T2-(J-T3-)n-L-X的优选化合物则有以下具体结构
其中T5是式C1-25N0-9O0-9HαFβ的有机残基,其中α和β的总和足以饱和C、N和O原子的可能未饱和的价;T5包括叔或季胺或有机酸;m是0-49的整数,且T2、T4、c、R1、“酰胺”、L和X已在前面给出了定义。
在上面的具有T5基团的结构中,-酰胺-T5较好是使有机酸与从“G”延伸的游离氨基基因反应而方便地制得的下列基团之一
当上述化合物具有T5基团,并且“G”基团具有游离羧基基团(或其反应性等同物)时,则优选的-酰胺-T5基团是如下所示的,可使适当的有机胺与从“G”基团延伸的游离羧基基团反应而方便地制得的基团
在本发明的三个优选实施方案中,T-L-MOI具有下示结构
或者
或者
其中T2和T4是式C1-25N0-9O0-9S0-3P0-3HαFβIδ的有机残基,其中α、β和δ的总和足以饱和C、N、O、S和P原子可能未饱和的价;G是(CH2)1-6,其中由每个G代表的CH2基团上的一个并且只有一个氢被-(CH2)c-酰胺-T4取代;酰胺是
R1是氢或C1-10烷基;c是从0至4的整数;“C2-C10”代表具有2至10个碳原子的亚烃基基团,“ODN-3′-OH”代表有末端3′羟基基团的核酸片段(即在核酸片段的3′末端以外的位置连接到(C1-C10));n是从1至50的整数,这样当n大于1时,独立地选择G、c、酰胺、R1和T4。最好没有三个杂原子结合到同一个碳原子上。
在上面列出的含有T2-C(=0)-N(R1)-基团的结构中,该基团可由式HN(R1)-的胺与选自下面例子中的有机酸反应而生成,下面所列出的只是某些实例,但并没有无遗漏地列出所有可能的有机酸。所说有机酸的例子包括甲酸、乙酸、丙酸、丙炔酸、氟乙酸、2-丁炔酸、环丙烷羧酸、丁酸、甲氧乙酸、二氟己酸、4-戊炔酸、环丁烷羧酸、3,3-二甲基丙烯酸、戊酸、N,N-二甲基甘氨酸、N-甲酰-Gly-OH、乙氧基乙酸、(甲硫基)乙酸、吡咯-2-羰酸、3-糠酸、异噁唑-5-羧酸、反式-3-己烯酸、三氟乙酸、己酸、Ac-Gly-OH、2-羟-2-甲基丁酸、苯甲酸、烟酸、2-吡嗪羧酸、1-甲基-2-吡咯羧酸、2-环戊烯-1-乙酸、环戊烷乙酸、(S)-(-)-2-吡咯烷酮-5-羧酸、N-甲基-L-脯氨酸、庚酸、Ac-b-Ala-OH、2-乙基-2-羟丁酸、2-(2-甲氧基乙氧基)乙酸、对甲苯甲酸、6-甲基烟酸、5-甲基-2-吡嗪羧酸、2,5-二甲基吡咯-3-羧酸、4-氟苯甲酸、3,5-二甲基异噁唑-4-羧酸、3-环戊基丙酸、辛酸、N,N-二甲基琥珀氨酸、苯基丙炔酸、肉桂酸、4-乙基苯甲酸、对甲氧基苯甲酸、1,2,5-三甲基吡咯-3-羧酸、3-氟-4-甲基苯甲酸、Ac-DL-炔丙基甘氨酸、3-(三氟甲基)丁酸、1-哌啶丙酸、N-乙酰脯氨酸、3,5-二氟苯甲酸、Ac-L-Va-OH、吲哚-2-羧酸、2-苯并呋喃羧酸、苯并三唑-5-羧酸、4-正丙基苯甲酸、3-二甲基氨基苯甲酸、4-乙氧基苯甲酸、4-(甲硫基)苯甲酸、N-(2-糠酰)甘氨酸、2-(甲硫基)烟酸、3-氟-4-甲氧基苯甲酸、Tfa-Gly-OH、2-萘甲酸、喹哪啶酸、Ac-L-Ile-OH、3-甲基吲哚烯-2-羧酸、2-喹喔啉羧酸、1-甲基吲哚-2-羧酸、2,3,6-三氟苯甲酸、N-甲酰-L-Met-OH、2-[2-(2-甲氧基乙氧基)乙氧基]乙酸、4-正丁基苯甲酸、N-苯甲酰甘氨酸、5-氟吲哚-2-羧酸、4-正丙氧基苯甲酸、4-乙酰-3,5-二甲基-2-吡咯羧酸、3,5-二甲氧基苯甲酸、2,6-二甲氧基烟酸、环己烷戊酸、2-萘基乙酸、4-(1H-吡咯-1-基)苯甲酸、吲哚-3-丙酸、间三氟甲基苯甲酸、5-甲氧基吲哚-2-羧酸、4-戊基苯甲酸、Bz-b-Ala-OH、4二乙基氨基苯甲酸、4-正丁氧基苯甲酸、3-甲基-5-CF3-异噁唑-4-羧酸、(3,4-二甲氧基苯基)乙酸、4-联苯基羧酸、新戊酰-Pro-OH、辛酰基-Gly-OH、(2-萘氧基)乙酸、吲哚-3-丁酸、4-(三氟甲基)苯基乙酸、5-甲氧基吲哚-3-乙酸、4-(三氟甲氧基)苯甲酸、Ac-L-Phe-OH、4戊氧基苯甲酸、Z-Gly-OH、4-羧基-N-(呋喃-2-基甲基)吡咯烷-2-酮、3,4-二甲氧基苯甲酸、2,4-二甲基-5-CO2Et-吡咯-3-羧酸、N-(2-氟苯基)琥珀酰胺酸、3,4,5-三甲氧基苯甲酸、N-苯基邻氨基苯甲酸、3-苯氧基苯甲酸、壬酰-Gly-OH、2-苯氧基吡啶-3-羧酸、2,5-二甲基-1-苯基吡咯-3-羧酸、反式-4-(三氟甲基)肉桂酸、5-(甲基-2-苯基噁唑-4-基)乙酸、4-(2-环己烯氧基)苯甲酸、5-甲氧基-2-甲基吲哚-3-乙酸、反式-4-可塔宁羧酸、Bz-5-氨基戊酸、4-己氧基苯甲酸、N-(3-甲氧基苯基)琥珀酰胺酸、Z-Sar-OH、4-(3,4-二甲氧基苯基)丁酸、Ac-O-氟-DL-Phe-OH、N-(4-氟苯基)戊酰胺酸、4′-乙基-4-联苯基羧酸、1,2,3,4-四氢吖啶羧酸、3-苯氧基苯基乙酸、N-(2,4-二氟苯基)琥珀酰胺酸、N-癸酰基-Gly-OH、(+)-6-甲氧基-a-甲基-2-萘乙酸、3-(三氟甲氧基)肉桂酸、N-甲酰-DL-Trp-OH,(R)-(+)-a-甲氧基-a-(三氟甲基)苯乙酸、Bz-DL-Leu-OH、4-(三氟甲氧基)苯氧基乙酸、4-庚氧基苯甲酸、2,3,4-三甲氧基肉桂酸、2,6-二甲氧基苯甲酰基-Gly-OH、3-(3,4,5-三甲氧基苯基)丙酸、2,3,4,5,6-五氟苯氧基乙酸、N-(2,4-二氟苯基)戊酰胺酸、N-十一酰基-Gly-OH、2-(4-氟苯甲酰基)苯甲酸、5-三氟甲氧基吲哚-2-羧酸、N-(2,4-二氟苯基)二甘醇氨酸、Ac-L-Trp-OH、Tfa-L-苯基甘氨酸-OH、3-碘代苯甲酸、3-(4-正戊基苯甲酰基)丙酸、2-苯基-4-喹啉羧酸、4-辛氧基苯甲酸、Bz-L-Met-OH、3,4,5-三乙氧基苯甲酸、N-月桂酰-Gly-OH、3,5-双(三氟甲基)苯甲酸、Ac-5-甲基-DL-Trp-OH、2-碘苯基乙酸、3-碘-4-甲基苯甲酸、3-(4-正己基苯甲酰基)丙酸、N-己酰-L-Phe-OH、4-壬氧基苯甲酸、4'-(三氟甲基)-2-联苯基羧酸、Bz-L-Phe-OH、N-三癸酰基-Gly-OH、3,5-双(三氟甲基)苯基乙酸、3-(4-正庚基苯甲酰基)丙酸、N-庚酰-L-Phe-OH、4-癸氧基苯甲酸、N-(α,α,α-三氟-间甲苯基)邻氨基苯甲酸、2-[3-(三氟甲基)苯胺基]盐酸、4-(2-羟基六氟异丙基)苯甲酸、N-肉豆蔻酰-Gly-OH、3-(4-正辛基苯甲酰基)丙酸、N-辛酰基-L-Phe-OH、4-十-烷氧基苯甲酸、3-(3,4,5-三甲氧基苯基)丙酰-Gly-OH、8-碘代萘酸、N-十五酰-Gly-OH、4-十二烷氧基苯甲酸、N-棕榈酰-Gly-OH和N-硬脂酰-Gly-OH。可从下列公司购得这些有机酸Aclvanced Chem Tech,Louisville,KY;Bachem BioscienceInc.,Torrance,CA;Caliochem-Novabiochem Corp.,San Diego,CA;Farchan Laboratories Inc.,Gainesville FL;Lancaster Synthesis,Windham NH;以及MayBridge Chemical Company(c/o Ryan Scientific),Columbia,SC。这些公司的产品目录中使用上述识别这些酸的缩写字。
f.作为制备标记的手段的组合化学技术组合化学是导致生产大的化学文库的一类合成策略(例如参见PCT申请公开号WO94/08051)。可使用这些组合文库作为鉴定感兴趣分子(MOI)的标记。组合化学可定义为一组彼此有不同结构的不同“结构单元”的系统的和重复的共价连接,借以产生一大组互异的分子。结构单元可以采取天然产生和合成的许多形式,例如可以是亲核试剂、亲电子试剂、二烯类、烷化剂或酰化剂、二胺、核苷酸、氨基酸、糖、脂、有机单体、合成纤维及其组合。用于连接结构单元的化学反应包括烷基化、酰化、氧化、还原、水解、取代、消除、加成、环化、缩合等。该方法可产生化合物文库,如寡聚合的、非寡核合的或其组合。如果是寡聚合的,化合物可以是分支的,不分支的或环化的。可用组合化学方法制备的寡聚结构的例子包括寡肽、寡核苷酸、寡糖、聚脂质、聚酯、聚酰胺、聚氨酯、聚脲、聚醚、聚(磷衍生物),例如磷酸酯、膦酸酯、磷酰胺、膦酰胺、亚磷酸酯、phorsphinamide等,以及聚(硫衍生物),如砜、磺酸酯、亚硫酸酯、氨磺酰、亚磺酰胺等。
一个通用类型的寡聚物组合文库是肽组合文库。当前肽化学和分子生物学的技术创新已使人们能够制备并使用由数千万到数亿个不同的肽序列组成的文库。可将这样的文库分成三大类。一类文库包括化学合成可溶性非载体结合的肽文库(如参见Houghten等,自然354:84,1991)。第二类包括化学合成呈现在塑料针、树脂球或棉布上的与支持物结合的肽文库(Geysen等,Mol.Immunol.23:709,1986;Lam等,自然354:82,1991;Eichler和Houghten,生物化学(Biochemistry)32:11035,1993)。在前两类中,结构单元一般是L-氨基酸、D-氨基酸、非天然氨基酸或其某些混合物或组合。第三类是使用分子生物学方法在丝状噬菌体或质粒表面上制备肽或蛋白质(Scott和Craig,Curr.Opinion Biotech.5:40,1994)。可溶性的非载体组和的肽文库似乎适合于包括用作标记在内的许多应用。可以用例如全甲基化步骤扩展肽文库中可利用的化学多样性(Ostresh等,Proc.Natl.Acad.Sci.,USA 91:11138,1994)。
可以制得肽组合文库的大量变体,例如其中可修饰肽骨架,和/或用模拟基团取代酰胺键。可以使用的酰胺模拟基团包括脲、氨基甲酸酯(尿烷)及羰基亚甲基等。重新构建骨架,以从每个氨基酸的酰胺氮而不是α碳发出侧链,从而得到称为类肽的化合物文库(Simon等,Proc.Natl.Acad.Sci.,USA 89:9367,1992)。
另一个常见类型的寡聚物组和文库是寡核苷酸组合文库,其中结构单元是某种形式的天然存在的或非天然的核苷酸或多糖衍生物,包括其中各种有机和无机基团可取代磷酸酯键,并且氮和硫可取代醚键中的氧(Schneider等,生物化学34:9599,1995;Freier等,J.Med.Chem.38:344,1995;Frank,生物技术杂志(J.Biotechnology)41:259,1995;Schneider等,已公开的PCT WO942052,Ecker等,核酸研究(NucleicAcids Res.)21:1853,1993)。
最近已描述了组和生产非寡聚的小分子化合物集群的方法(DeWitt等,Proc.Natl.Acad.Sci.USA 90:690,1993;Bunin等,Proc.Natl.Acad.Sci.USA 91:4708,1994)。适于制成小分子文库的结构包括各种有机分子,例如杂环、芳族、无环、脂族化合物、类固醇、抗生素、酶抑制剂、配体、激素、药物、生物碱、阿片样物质、萜类、卟啉、毒素、催化剂以及其组合。
g.组合合成标记的特异性方法以下概述制备和使用不同组的含胺MS标记的两种方法。在两种方法中,利用固相合成可使人们得以用组合化学的技术同时平行地合成很大数目的标记的接头。在第一种方法中,最后从寡核苷酸上裂解掉标记后得以释放出羧酰胺。在第二种方法中,切掉标记后产生羧酸。用于这些方法中的化学成分和连接元件的缩写符号如下R =树脂FMOC =芴基甲氧基羰基保护基团All=烯丙基保护基团CO2H =羧酸基团CONH2=羧酰胺基团NH2=氨基基团OH=羟基基团CONH =酰胺键COO =酯链NH2-Rink-CO2H=4-[(α-氨基)-2,4-二甲氧基苄基]-苯氧基苯丁酸(Rink接头)OH-1MeO-CO2H =(4-羟甲基)苯氧基丁酸OH-2MeO-CO2H =(4-羟甲基)-3-甲氧基)苯氧基乙酸NH2-A-COOH =侧链中有脂族或芳族胺功能团的氨基酸X1…Xn-COOH=具独特分子量的一组n个不同的羧酸oligo1…oligo(n) =一组n个寡核苷酸HBTU =O-苯并三唑-1-基-N,N,N′,N′-四甲基脲六氟磷酸盐方法1中各步骤的顺序如下OH-2MeO-CONH-R↓FMOC-NH-Rink-CO2H;偶联(如HBTU)FMOC-NH-Rink-COO-2MeO-CONH-R↓哌啶(除去FMOC)NH2-Rink-COO-2MeO-CONH-R↓FMOC-NH-A-COOH;偶联(例如HBTU)FMOC-NH-A-CONH-Rink-COO-2MeO-CONH-R↓哌啶(除去FMOC)NH2-A-CONH-Rink-COO-2MeO-CONH-R↓分为n等份↓↓↓↓偶联到n种不同的酸X1……Xn-COOH上X1……Xn-CONH-A-CONH-Rink-COO-2MeO-CONH-R↓↓↓↓↓用1%TFA从树脂上切下标记的接头X1……Xn-CONH-A-CONH-Rink-COOH↓↓↓↓↓偶联到n个寡聚体上(oligo1…oligo(n))(例如通过Pfp酯)X1……Xn-CONH-A-CONH-Rink-CONH-oligo1…oligo(n)↓合并标记的寡聚体↓完成测序反应↓从测序反应中分离不同长度的片段(例如通过HPLC或CE)↓用25%-100%TFA从接头上切下标记X1……Xn-CONH-A-CONH↓用质谱分析方法2中各步骤的顺序如下OH-1MeO-CO2-All↓FMOC-NH-A-CO2H;偶联(例如,HBTU)FMOC-NH-A-COO-1MeO-CO2-All↓钯(除去烯丙基)FMOC-NH-A-COO-1MeO-CO2H↓OH-2MeO-CONH-R;偶联(例如,HBTU)FMOC-NH-A-COO-1MeO-COO-2MeO-CONH-R↓哌啶(除去FMOC)NH2-A-COO-1MeO-COO-2MeO-CONH-R↓分成n个等份↓↓↓↓↓偶联到n个不同的酸X1……Xn-CO2H上X1……Xn-CONH-A-COO-1MeO-COO-2MeO-CONH-R↓↓↓↓↓用1%TFA从树脂上切掉标记的接头X1……Xn-CONH-A-COO-1MeO-CO2H↓↓↓↓↓偶联到n个寡聚体上(oligo1…oligo(n))(例如,通过Pfp酯)X1……Xn-CONH-A-COO-1MeO-CONH-oligo1…olgo(n)↓合并标记的寡聚体↓完成测序反应↓从测序反应中分离不同长度的片段(例如通过HPLC或CE)↓用25-100%TFA从接头上切掉标记X1……Xn-CONH-A-CO2H↓用质谱法分析2.接头本文中所说的“接头”成分(或L)是指用于通过共价化学键将“标记”(或T)接合到“感兴趣分子”(或MOI)上的直接共价键或有机化学基团。此外,直接键本身或接头成分内的一个或多个键可在允许从T-L-X化合物的其余部分(包括MOI成分)中释放出(或者说是裂解掉)T的条件下裂解。存在于T内的标记可变部分应是对裂解条件稳定的。最好尽快完成裂解,例如在几分钟内,特别是在15秒钟或更短时间内。
一般来说,使用接头使每一大组标记连接到一相似的大组MOI上。典型的是将单个标记-接头组合连接到各个MOI上(得到各种各样的T-L-MOI),但在某些情况下,可在每个MOI上连接一个以上的标记-接头组合(得到各种(T-L)n-MOI)。在本发明的另一个实施方案中,通过接头上的多个独立的位点将两个或多个标记结合到单一接头上,然后将此多标记-接头组合连接到单个MOI上(得到各种(T)n-L-MOI)。
在对这组标记的MOI进行了各种操作后,使用特异的化学和/或物理条件裂解接头中的一个或多个共价键,结果从MOI上释出标记。该可裂解的键可以是或不是某些当标记、接头和MOI连接在一起时所形成的同样键。接头的设计将在很大程度上决定完成裂解所需的条件。因此,可根据它们特别敏感的裂解条件来指称接头。当接头对光不稳定时(即倾向于通过与光化照射接触而裂解),则接头可称为Lhv。同样,可用Lacid、Lbase、L[O]、Lenz、Lelc、LΔ和Lss来命名分别对酸、碱、化学氧化、化学还原、酶的催化活性(更简单地说是对“酶”)、电化学氧化或还原、升高的温度(“热”)及硫醇交换特别敏感的接头。
某些类型的接头对每一类型的裂解条件不稳定,而其他一些接头则对几种类型的裂解不稳定。此外,在能够结合多个标记的接头(得到(T)n-L-MOI型结构)中,各个标记结合位点可以是对不同的裂解条件不稳定的。例如,在其上结合有两个标记的接头中,其中一个标记可以是只对碱不稳定,另一个则只对光解作用不稳定。
可用于本发明的一种接头具有几个特征1)接头具有化学柄(Lh),通过该柄使接头连接到MOI上。
2)接头具有第二个分立的化学柄(Lh),通过该柄使标记连接到接头上。如果多个标记连接到单一接头上((T)n-L-MOI型结构),则对每个标记存在一个分立的柄。
3)除了允许裂解,以使含T的部分从包括MOI在内的化合物其余部分上释放下来的条件外,接头对其所经受的所有操作都是稳定的。因此,接头在标记连接到接头上、接头连接到MOI上,以及在对MOI进行的使标记和接头(T-L)与之连接的任何操作期间都是稳定的。
4)接头在T-L连接到MOI上时并不明显地干扰对MOI进行的操作。如果T-L连接到寡核苷酸上,T-L一定不能对寡核苷酸所参于的任何杂交和酶促反进(如PCR)造成以确切干扰。同样,如果T-L连接到抗体上,则其一定不能对该抗体的抗原识别有明显的干扰。
5)使用对标记的可检测性没有不利影响的物理或化学方法,以高度控制的方法将标记从化合物上裂解下来。
对于任何给定的接头,最好是接头能够连接到宽范围的各种MOI上,而且各种标记可以连接到接头上。这样的灵活性是有利的,因为这样可使T-L连接物的文库一旦制备之后,即可与几种不同的MOI一起使用。
如上文解释的,一种优选的接头具有下列通式Lh-L1-L2-L3-Lh其中每个Lh都是一个能用于将接头连接到标记反应物上和感兴趣的分子反应物上的反应活性柄。L2是接头的基本部分,因为L2赋予接头以不稳定性。L1和L3是可任意存在的基团,其可有效地用于使L2与柄Lh分离开。
L1(按照定义,其比L3更接近于T)可用于使T与必要的不稳定部分L2分离开。如果裂解反应产生可使含T部分的结构发生随机改变的特殊反应性基团(如游离基)时,则这种分离可能是有用的。当裂解位点进一步与含T部分分离开时,在此裂解位点形成的反应性基团就不太可能破坏含T部分的结构。另外,因为L1中的原子一般存在与含T部分,这些L1原子可赋予含T部分以有利的性质。例如,当含T部分是含Tms部分时,希望作为含Tms部分之结构的一部分(例如作为MSSE)存在位阻胺,该位阻胺可能存在于L1不稳定部分中。
在其他例子中,接头成分中可能只存在L1和/或L3,这是因为接头的供应商选择出售具这种L1和/或L3基团形式的接头。在这些情况下,使用具有L1和/或L3基团的接头,即使对掺入它们的化合物没有带来任何特殊的性能优点,但也没有什么损害(只要这些基因并不抑制裂解反应即可)。因此,本发明允许在接头成分中存在L1和/或L3基团。
L1和/或L3基团可以是直接键(在这种情况下,实际不存在该基团)、亚烃基基团(例如亚烷基、亚芳基、亚环烷基等)、-O-亚烃基(例如-O-CH2-、O-CH2CH(CH3)4-等)或亚烃基-(O-亚烃基)w-,其中w是1到10的整数(例如-CH2-O-Ar-,-CH2-(O-CH2CH2)4-等)。
随着固相合成的出现,已发表了大量关于对特异性反应条件不稳定的接头的文章。在典型的固相合成中,固相载体通过不稳定的接头结合反应性位点,并且在反应性位点产生待合成的分子。当该分子被完全合成之后,使固相载体-接头-分子构建体受从固相载体上放出所说的分子的裂解条件。已发展的用于这一目的(或可能用于这一目的)的不稳定性接头也可很容易于用作本发明的接头反应物。
Lloyd-Williams,P等人(“会聚性固相肽合成”),四面体报告(Tetrahedron Report)No.347,49(48):11065-11133(1993))深入地讨论了对光化性照射(即光解)、酸、碱及其他裂解条件不稳定的接头。有关敏感性接头的其他信息来源易于得到。
如上文所讨论的,不同的接头设计将赋予在不同的特异性物理或化学条件下的可裂解性。用于裂解各种不同设计的接头的条件包括酸、碱、氧化、还原、氟化物、巯基交换、光解及酶促条件。
满足上文列出的接头一般标准的可裂解的接头是本领域技术人员已知的,并包括Pierce(Rockford,IL)提供的目录中的那些。例子包括· 双(琥珀酰亚氨基琥珀酸)乙二醇酯(EGS),为可被羟胺裂解(1M,37℃,3-6小时)的胺反应性交联剂;· 酒石酸二琥珀酰亚氨酯(DST)和磺基-DST,其为可被0.015M过碘酸钠裂解的胺反应性交联剂;· 双[2-(琥珀酰亚氨氧基羰基氧基)乙基]砜(BSOCOES)和磺基-BSOCOES,其为可被碱(pH11.6)裂解的胺反应性交联剂;· 1,4-二-[3′-(2′-吡啶二硫基(丙酰胺基)丁烷(DPDPB),可经硫羟交换或还原作用裂解的吡啶二硫醇交联剂;· N-[4-(对叠氮基水杨酰胺基)-丁基]-3'-(2'-吡啶二硫基)丙酰胺(APDP),为可经硫羟交换或还原裂解的吡啶二硫醇交联剂;· 双-[β-4-(叠氮基水杨酰胺基)乙基]-二硫化物,为可经硫羟交换或还原作用裂解的光反应性交联剂;· N-琥珀酰亚氨基-(4-叠氮苯基)-1,3′-二硫基丙酸酯(SADP),可经硫羟交换或还原反应裂解的光反应性交联剂;· 硫代琥珀酰亚氨基-2-(7-叠氮基-4-甲基香豆素-3乙酰胺)乙基-1,3′-二硫丙酸酯(SAED),可经硫羟交换或还原反应裂解的光反应性交联剂;· 磺基琥珀酰亚氨基-2-(间叠氮基-邻硝基苯甲酰氨基)-乙基-1,3′-二硫丙酸酯(SAND),可经硫羟交换或还原反应裂解的光反应性交联剂。
可裂解接头的其他例子和可用于释放标记的裂解条件如下所述。可被氟化物或在酸性条件下裂解的甲硅烷基连接基团。可被光源裂解(光解)的3-,4-,5-,或6-取代的-2-硝基苄氧基或2-,3-,5-,或6-取代的-4-硝基苄氧基连接基团。可被Ce(NH4)2(NO3)6裂解(氧化)的3-,4-,5-或6-取代的-2-烷氧基苯氧基或2-,3-,5-,或6-取代的-4-烷氧基苯氧基连接基团。可被氢氧化物(碱)、酸或LiAIH4(还原)裂解的NCO2(尿烷)接头。可被O3、OsO4/IO4-或KMnO4(氧化)裂解的3-戊烯基、2-丁烯基或1-丁烯基连接基团。可被O2、Br2、MeOH或酸裂解的2-[3-,4-,或5-取代的-呋喃基]氧基连接基团。
裂解其他不稳定连接基团的条件包括可用酸裂解叔烷氧基连接基团;可用H3O+裂解的甲基(二烷基)甲氧基或4-取代的-2-烷基-1,3-二氧戊环-2-基连接基团;可用氟化物或酸裂解的2-甲硅烷基乙氧基连接基团;可在碱性条件下裂解的2-(X)-乙氧基(其中X=酮、酯、酰胺、氰基、NO2、硫醚、亚砜、砜)连接基团;可用酸或在还原条件下裂解的2-,3-,4-,5-,或6-取代的苄氧基连接基团;可用(Ph3P)3RhCl(H)裂解的2-丁烯氧基连接基团;可用Li、Mg或BuLi裂解的3-,4-,5-或6-取代的-2-溴苯氧基连接基团;可用Hg2+裂解的甲基硫代甲氧基连接基团;可用Zn或Mg裂解的2-(X)-乙氧基(其中X=卤素)连接基团;可经氧化(例如用Pb(OAc)4)裂解的2-羟基乙氧基连接基团。
优选的接头是被酸或光解作用裂解的接头。在已为固相肽合成而发展的酸敏感性接头中,有几种可用于将标记连接到MOI上。在Lloyd-Williams等人的综述(四面体49:11065-11133,1993)描述了其中的某些接头。一类有用的接头是基于对烷氧基苄基醇,其中两种接头4-羟基甲基苯氧基乙酸和4-(4-羟甲基-3-甲氧基苯氧基)丁酸可购自Advanced ChemTech(Louisville,KY)。这两个接头可通过连接到苄醇上的酯键连接到标记上,并且通过连到羧酸上的酰胺键连接到含胺MOI上。用不同浓度的三氟乙酸从MOI裂解掉由这些分子连接的标记。裂解这些接头导致标记上的羧酸的释放。酸裂解通过相关接头如2,4-二甲氧基-4'-(羧甲氧基)-二苯甲基胺(可以FMOC保护的形式购自AdvancedChem Tech公司)连接的标记,导致被释出的标记上的羧酰胺的释放。
已为固相肽合成而发展的大部分光敏感性接头也可用于本申请(参见Lloyd-Williams的综述)。这些接头通常是基于2-硝基苄酯或2-硝基苄酰胺。最近文献中报导过的光敏感接头的两个例子是4-(4-(1-Fmoc-氨基)乙基)-2-甲氧基-5-硝基苯氧基)丁酸(Holmes和Jones,J.Org.Chem.60:2318-2319,1995)和3-(Fmoc-氨基)-3-(2-硝基苯基)丙酸(Brown等,Molecular Diversity 1:4-12,1995)。两接头均可通过羧酸连接到MOI的胺上。通过在标记上的羧酸和接头上的胺之间形成酰胺而使标记接到接头上。通常用350nm波长的紫外光以本领域已知的强度和时间完成对光敏感接头的裂解。裂解接头导致标记上伯酰胺的释放。光可裂解的接头的例子包括硝基苯基甘氨酸酯,内-和外-2-苯并降冰片烷基氯和甲磺酸,以及3-氨基-3(2-硝基苯基)丙酸。酶促裂解的例子包括可裂解酯键的酯酶、裂解磷酸二酯键的核酸酶、裂解肽键的蛋白酶等。
优选的接头成分具有如下所示的邻硝基苄基结构
其中位置a、b、c、d或e上的一个碳原子被-L3-X取代,L1(其较好是直接键)在上述结构中存在于N(R1)的左边。这样的接头成分对选择性光诱导的对标有“a的碳和N(R1)之间的键裂解是敏感的。R1对裂解反应并不重要,但最好选自氢和烃基。本发明指出上述结构中-N(R1)-可被-O-替换。另外,在上示结构中,位置b、c、d或e中的一个或多个位置可被烷基、烷氧基、氟、氯、羟基、羟酸酯或酰胺取代,其中这些取代基在各种情形中被独立地选择。
另一个带有化学柄Lh的优选接头成分具有下示结构
其中位置b、c、d或e中的一个或多个位置由氢、烷基、烷氧基、氟、氯、羟基羧酸酯或酰胺取代,R1是氢或烃基,且R2是-OH或保护或活化羧酸以利于与另一个部分偶联的基团。氟碳和氢氟碳基团是活化羧酸以利与另一个部分偶联的优选基团。
3.感兴趣的分子(MOI)MOI的例子包括核酸或核酸类似物(如PNA)、核酸的片段(即核酸片段)、合成的核酸或片段、寡核苷酸(如DNA或RNA)、蛋白质、肽、抗体或抗体片段、受体、受体配基、配体对的成员、细胞因子、激素、寡糖、合成的有机分子、药物及其组合。
优选的MOI包括核酸片段。优选的核酸片段是与存在于用来碱基测序的载体中的序列互补的引物序列。核酸片段较好是在片段的3′末端以外,并且最好是在片段的5′末端直接或间接连接到标记上。可以从商业来源(例如Promega,Madison,WI)买到或基于基因数据库(例如Dib等,自然380:152-154,1996和GEPH Genotype Database,http://www,cephb.fr)制得。
本文使用的术语MOI包括MOI的衍生物,其含有使MOI连接到T-L-Lh上的功能团。例如,在5′末端有磷酸二酯并且该磷酸二酯也结合到亚烷基胺上的核酸片段即是MOI。美国专利4,762,779中描述了这样一种MOI。作了内部修饰的核酸片段也是MOI。对核酸片段的内部修饰的一个例子是将已经过修饰的碱基(例如A、G、C、T、U)加到反应性功能基团上。可从例如Glen Research,Herndon,VA购得这种经过内部修饰的核酸片段。对核酸片段进行内部修饰的另一个例子是使用无碱基亚磷酸酰胺合成修饰的磷酸二酯,将后者放在核酸片段的糖和磷酸基团之间。该无碱基亚磷酸酰胺含有一反应性基团,所说的基团允许含有该亚磷酸酰胺衍生部分的核酸片段连接到另一个部分如T-L-Lh化合物上。例如可从Clonetech Laboratories,Inc.,Palo Alto,CA购得这样的无碱基亚磷酸酰胺。
4.化学柄(Lh)化学柄是作为第一分子的一部分存在的同稳定而具反应性的原子排布,该柄可进行与作为第二分子的一部分存在的互补化学柄的化学反应,从而形成两分子间的共价结合。例如,化学柄可以是羟基基团,而互补化学柄则可以是羧酸基团(或其活化的衍生物,例如氢氟芳基酯),经反应后这两个柄之间形成将两分子连接在一起的共价键(特别是酯基团)。
化学柄可用于许许多多共价键形成反应中,通过这些反应使标记连接到接头上,并使接头连接到MOI上。这样的反应包括烷基化(例如形成醚,硫醚)、酰化(如形成酯、酰胺、氨基甲酸酯、脲、硫脲)、磷酸化(如形成磷酸酯、膦酸酯、磷酰胺、膦酰胺)、磺酰化(如形成磺酸酯、氨磺酰)、缩合(如形成亚胺、肟、腙)、甲硅烷基化、二硫化物形成,以及经光解作用生成反应性中间体(如氮烯或碳烯)。一般说来,适于将标记连接到接头上的柄和键形成反应也适于使接头接到MOI上,反之亦然。在某些情况下,MOI可能预先进行修饰的衍生作用,以提供连接接头所需的柄。
一种类型的特别适用于将接头连接到MOI上的键是二硫键。其形成需要在接头上存在巯基基团(“柄”),并且在MOI上存在另一个巯基基团。然后中度氧化条件即足以使两个巯基结合成二硫化物。也可使用过量的适当二硫化物交换试剂例如二硫化吡啶来诱导二硫键形式。因为二硫化物的形成是很容易逆转的,所以必要时可使用二硫键作为释放标记的可裂解键。一般可在相似的温和条件下,使用过量的适当巯基交换剂如二硫苏糖醇来完成反应。
为使标记(或连有接头的标记)连接到寡核苷酸上,特别有利的是形成酰胺键。可用亚磷酰胺酯例如6-单甲氧基三苯甲基己基氰乙基-N,N-二异丙基亚磷酰胺酯(可购于Glenn Research,Sterling,VA)很容易的将伯脂族胺柄导入到合成的寡核苷酸上。与被导入的伯胺相比,见于天然核苷酸中的胺例如腺苷和鸟苷实际上是无反应性的。反应性的这种差异构成与被导入的伯胺而不是核苷胺选择性地形成酰胺及相关结合基团(如脲、硫脲、氨磺酰)之能力的基础。
如在分子探针供货目录(Molecular Probes catalog)(Eugene,OR)中所列出的,胺反应性功能基团的部分细目包括活化的羧酸酯、异氰酸酯、异硫氰酸酯、磺酰卤和二氯三氮烯。活性酯是对胺修饰的极好试剂,因为所形成的酰胺产物是很稳定的。另外,这些试剂与脂族胺有很好的反应性,而与寡核苷酸的核苷酸胺则是低反应性的。活性酯的例子包括N-羟基琥珀酰亚胺酯、五氟苯基酯、四氟苯基酯及对硝基苯基酯。因为活性酯可由实际上任何含有羧酸的分子制得,所以它们是很有用的。Bodansky(肽化学的原理(第二版),Springer Verlag,London,1993)列出了制造活性酯的方法。
5.接头连接一般使用单一类型的接头将特定组或家族的标记连接到特定组或家族的MOI上。在本发明的优选实施方案中,可按一种统一的方法创造所有的各种T-L-MOI结构。如果一组T-L-MOI结构的数目多,这样做是特别有利的,因为它得以使用组合化学或其他平行的加工技术制备这一组结构。以相似的方式,使用单一类型的接头可以利用某种统一的方法裂解所有的各种T-L-MOI结构。另外,这对于一大组T-L-MOI结构是有利的,因为这样可以按平行的重复的和/或自动化的方式处理该组结构。
但也有本发明的其他实施方案,其中使用两种或多种类型的接头将不同亚组的标记连接到相应亚组的MOI上。在这种情况下,可使用选择性裂解条件独立地裂解各个接头,而不裂解存在于其他亚组MOI上的接头。
有许多共价键形成反应适于将标记连接到接头上,并将接头连接到MOI上。这样的反应包括烷基化(例如形成醚,硫醚)、酰化(如形成酯、酰胺、氨基甲酸酯、脲、硫脲)、磷酸化(如形成磷酸酯、膦酸酯、磷酰胺、膦酰胺)、磺酰化(如形成磺酸酯、氨磺酰)、缩合(如形成亚胺、肟、腙)、甲硅烷基化、二硫化物形成,以及经光解作用生成反应性中间体(如氮烯或碳烯)。一般说来,适于将标记连接到接头上的柄和键形成反应也适于使接头接到MOI上,反之亦然。在某些情况下,MOI可能预先进行修饰或衍生作用,以提供连接接头所需的柄。
一种类型的特别适用于将接头连接到MOI上的键是二硫键。其形成需要在接头上存在巯基基团(“柄”),并且在MOI上存在另一个巯基基团。然后中度氧化条件即足以使两个巯基结合成二硫化物。也可使用过量的适当二硫化物交换试剂例如二硫化吡啶来诱导二硫键形式。因为二硫化物形成是很容易逆转的,所以必要时可使用二硫键作为释放标记的可裂解键。一般可在相似的温和条件下,使用过量的适当巯基交换剂如二硫苏糖醇来完成反应。
为使标记连接到寡核苷酸上,特别有利的是形成酰胺键。可用亚磷酰胺酯例如6-单甲氧基三苯甲基己基氰乙基-N,N-二异丙基亚磷酰胺酯(可购于Glenn Research,Sterling,VA)很容易的将伯脂族胺柄导入到合成的寡核苷酸上。与被导入的伯胺相比,见于天然核苷酸中的胺例如腺苷和鸟苷实际上是无反应性的。反应性的这种差异构成与被导入的伯胺而不是核苷胺选择性地形成酰胺及相关结合基团(如脲、硫脲、氨磺酰)之能力的基础。
如在分子探针供货目录(Molecular Probes catalog)(Eugene,OR)中所列出的,胺反应性功能基团的部分细目包括活化的羧酸酯、异氰酸酯、异硫氰酸酯、磺酰卤和二氯三氮烯。活性酯是对胺修饰的极好试剂,因为所形成的酰胺产物是很稳定的。另外,这些试剂与脂族胺有很好的反应性,而与寡核苷酸的核苷酸胺则是低反应性的。活性酯的例子包括N-羟基琥珀酰亚胺酯、五氟苯基酯、四氟苯基酯及对硝基苯基酯。因为活性酯可由实际上任何含有羧酸的分子制得,所以它们是很有用的。Bodansky(肽化学的原理(第二版),Springer Verlag,London,1993)列出了制造活性酯的方法。
有许多可作为接头的商品交联剂(如参见Pierce Cross-linkers,Pierce Chemical Co.,Rockford,IL)。其中同双官能胺反应性交联剂的例子是同双官能亚氨酸酯和N-羟基琥珀酰亚氨(NHS)酯。还存在具有两个或多个不同反应性基团的异双官能交联剂,其允许进行系列反应。亚氨酸酯在碱性pH条件下与胺迅速反应。当NHS酯与伯或仲胺反应时产生稳定的产物。马来酰亚胺、烷基卤和芳基卤、α-卤酰基和吡啶二硫化物是巯基反应性的。在pH6.5-7.5范围内马来酰亚胺是对巯基(硫氢基)基团特异的,并在碱性pH可变成胺反应性的。在生理条件下硫醚键是稳定的。α-卤乙酰基交联剂含有碘乙酰基团并且是对巯基有反应性的。咪唑可与碘乙酰基团反应,但反应非常缓慢。吡啶二硫化物与巯基基团反应形成二硫键。碳二亚胺将羧基化合物偶联到酰肼的伯胺上以形成酰基-肼键。芳基叠氮化物是在接触紫外或可见光之前呈化学惰性的光亲和试剂。当这样的化合物在250-460nm光解时,形成反应性芳基氮烯。反应性芳基氮是烯相对非特异的。乙二醛对精氨酸的胍基部分有反应性。
在本发明的一个典型实施方案中,首先使标记结合到接头上,然后再使标记和接头的组合体结合到MOI上,以产生结构T-L-MOI。或者,可首先使接头结合到MOI,然后再使接头和MOI的组合体结合到标记上。一个例子是其中MOI为DNA引物或寡核苷酸。在这种情况下,典型的是首先使标记与接头结合,然后再使T-L结合到DNA引物或寡核苷酸上,所得组合体即可用于测序反应。
一种有用的形式是其中使标记通过化学敏感性接头可逆性地连接到MOI(如寡核苷酸或DNA测序引物)上。接头的一种优选设计使接头接触到挥发性有机酸例如三氟乙酸(TFA)时被裂解。特别是TFA适于与包括电喷射法在内的大多数MS离子化方法配合使用。
如下文详细描述的,本发明提供基因型鉴定的方法。可用于基因型鉴定的组合物包括有下示通式的多个化合物Tms-L-MOI其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟中至少一种,并可包括选自氧、氮、硫、磷和碘的原子。该式中,L是允许从化合物的其余部分裂解出含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自于叔胺、季胺和有机酸。式中,MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上。在该组合物中,至少两个化合物具有同样的Tms,但这些分子的MOI基团具有不同的核酸长度。
另一种用于基团分型方法的组合物包括多个有下示通式的化合物Tms-L-MOI其Tms是可用质谱法检测的有机基团,包含碳,氢和氟的至少一种,并可包括选自氧、氮、硫、磷和碘的原子。该式中,L是允许从化合物的其余部分裂解出含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自于叔胺、季胺和有机酸。该式中,MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上。该组合物中,至少两个化合物具有同样的Tms,但那些化合物在柱层析中具有不同的洗脱时间。
可用于基因型鉴定的另一种组合物包括多个有下列通式的化合物Tms-L-MOI其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟的至少一种,并可包括选自氧、氮、硫、磷和碘的原子。该式中,L是允许从化合物的其余部分裂解出含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自于叔胺、季胺和有机酸。该式中,MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上。该组合物中,没有两个化合物具有同样MOI核苷酸长度且有同样的Tms。
在上述组合物中,多个是是大于2,最好是大于4。另外,MOI中的核酸片段具有与载体的一部分互补的序列,其中片段能够引导多核苷酸合成。多个化合物中成员的Tms基团最好至少差2amu,并可至少差4amu。
本发明还提供包括多组化合物的组合物,每组化合物都有下列通式Tms-L-MOI其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟的至少一种,并可包括选自氧、氮、硫、磷和碘的原子。该式中,L是允许从化合物的其余部分裂解出含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自于叔胺、季胺和有机酸。该式中,MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上。在该组合物中,第一组化合物中的成员具有完全相同的Tms基因,但具有不同的MOI基团,即MOI中有不同数目的核苷酸;并且第一组内至少有10个成员,其中各组间Tms基团至少相差2amu。多组较好是至少3组,且最好是至少5组。
本发明还提供包括多组化合物的组合物,每组化合物都下列通式Tms-L-MOI其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟的至少一种,并可包括选自氧、氮、硫、磷和碘的原子。该式中,L是允许从化合物的其余部分裂解出含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自于叔胺、季胺和有机酸。该式中,MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上。在该组合物中,一组内的化合物具有同样的洗脱时间,但有不同的Tms基团。
此外,本发明提供了用于基因型鉴定的试剂盒。试剂盒包括多个扩增引物对,其中至少一个引物有下列通式Tms-L-MOI其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟的至少一种,并可包括选自氧、氮、硫、磷和碘的原子。该式中,L是允许从化合物的其余部分裂解出含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自于叔胺、季胺和有机酸。该式中,MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上。并且每个引物对都与不同的位点结合。在试剂盒中,所说的多个是至少3个,且最好至少5个。
如上所述,本发明提供了测定核酸分子序列的组合物及方法。简单地说,这样的方法总地包括以下步骤(a)产生标记的核酸片段,其互补于从核酸分子之第一末端到第二末端的选择的核酸分子(如标记的片段),其中标记是与特定的或选择的核苷酸相互关联的,并可用许多检测方法的任一种检测,(b)按序列长度分离标记的片段,(c)从标记的片段上裂解标记,以及(d)检测标记,并从而确定核酸分子的序列。下面更详地讨论各个方面。B.诊断方法1.引言如上文指出的,本发明还提供各种可利用上述标记和/或接头以代替传统标记(如放射活性或酶标记)的方法,借以在给定的方法中提高特异性、灵敏度、或可同时分析的样品数目。可提高上述性质的有代表性的方法包括RNA扩增(参见Lizardi等,生物技术(Bio/Technology)6:1197-1202,1988;Kramer等,自然(Nature)339:401-402,1989;Lomeli等,临床化学(Clinical Chem.)35(9):1826-1831,1989;美国专利No.4,786,600),及利用LCR或聚合酶链反应(“PCR”)的DNA扩增(参见美国专利No.4,683,195、4,683,202和4,800,159)。
在本发明的一个方面,提供了鉴定核酸分子或片段(或检测选择的核酸分子或片段的存在)的方法,其包括以下步骤(a)从一个或多个选择的核酸分子产生标记的核酸分子,其中标记是与特定的核酸片段相互关联的;并且是可用非荧光光谱法或电位测定法检测的;(b)按大小分离标记的片段;(c)从标记的片段上裂解标记;以及(d)用非荧光光谱法和电位测定法检测标记,从而鉴定核酸分子。
在本发明的相关方面,提供了检测选择的核酸分子的方法,其包括以下步骤(a)在足以使标记的核酸探针与互补的所选靶核酸序列杂交的条件下使标记的核酸探针与靶核酸分子结合足够长时间,其中标记的核酸探针是可用非荧光光谱法或电位测定法检测的;(b)改变杂交的标记探针、未杂交的探针或靶分子、或探针靶杂交体的大小;(c)按大小分离标记的探针;(d)从标记的探针上切掉标记;以及(e)用非荧光光谱法和电位测定法检测标记,从而确定选择的核酸分子。下面更详细地讨论这些和其他相关技术。
2.PCR
PCR可在数小时内数亿次地扩增任何来源(病毒、细菌、植物或人)的所需DNA序列。因为PCR反应是高度特异的、易于实现自动化,并且能够扩增极小量的样品,所以是特别有价值的。为此,PCR已对临床医学、遗传性疾病的诊断、法医科学及进化生物学产生了巨大影响。
简单地说,PCR是一种基于专门化聚合酶的方法,该酶可在含有4种DNA碱基和靶序列侧翼的2个DNA片段(引物,各大约20碱基长)的混合物中合成给定的DNA链的互补链。加热混合物以分离合有靶序列之双DNA各链,然后冷却以使(1)引物找到并结合到分离的链上的其互补序列,并且(2)聚合酶将引物延伸成新的互补链。重复加热和冷却循环以成指数倍增靶DNA,因为每次新的双链分离就变成两个进一步合成新链的模板。在1小时中,20次PCR循环可将靶序列扩增一百万倍。
在本发明一个实施方案中,提供了利用PCR技术鉴定例如生物学样品中的核酸分子,或检测选择的核酸分子的方法。简单地说,这些方法包括在PCR期间产生一系列标记的核酸片段,并按大小分离所得片段的步骤。可利用本文描述的任何技术完成大小分离步骤,其中包括凝胶电泳(如聚丙烯酰胺凝胶电泳)或更好是HPLC。然后从分离的片段上裂解掉标记,并用各种检测技术检测之。本文已描述了这类技术的例子,其中包括质谱、红外光谱、恒电势电流测定或紫外光谱等。3.RNA指纹法和差别显示法当模板是RNA时,指纹法中的第一个步骤是逆转录。Liang和Pardee(科学(Science)257:967,1992)首先描述了一种RNA指纹方法,其中使用基于Oligo(dT)但在5′末端有两个碱基“锚”的逆转录引物(如Oligo5′-(dT11)CA-3′)。引导主要发生在poly(A)尾的5′末端,并且主要在截至到5′-UpG-poly(rA)-3′的序列中,选择性地接近1/12的聚脉苷酸化RNA。逆转录并变性之后,在所得第一条cDNA链上进行随意引导。现在可使用PCR产生产物的指纹结构,其最好地匹配引物并且衍生于mRNA和聚腺苷酸化异源RNA的3′末端。该方案已被称为“差异展示”(differential display)。
或者,也可在反转录的第一个步骤中使用随机引物,选择那些在与引物的3′末端有6-8碱基匹配的RNA内部区域。在此之后用相同或不同的任意引物随机引导所得到的第一条cDNA链,并进行PCR。这种特殊方案适用于RNA中任何位置,包括开放读框(Welsh等,核酸研究(Nuc.Acids.Res.)20:4965,1992)。另外,其可使用在未聚腺苷酸化的RNA上,例如许多细菌RNA上。这种由任意引物PCR得到的RNA指纹法的变化形式称为RAP-PCR。
如果对已经受了不同的实验处理或有不同发育历史的细胞、组织或其他生物材料的样品进行RNA的任意引物PCR指纹分析,可检测样品间基因表达的差异。对于每个反应,假设发生同样数目的有效PCR倍增事件,并且cDNA产物初始浓度的差异都作为最终指纹强度的比率而保留。在凝胶上的单一泳道内的带强度之间没有有意义的联系,强度是匹配和长度的函数。但每种上样的RNA保持各泳道间的比例,从而得以检测差异表达的RNA。即使在循环的次数足以使PCR反应达到饱和时,仍保持样品间起始材料的比例。这是因为达到饱和所需的倍增数几乎完全受构成大部分指纹的恒定产物的控制。在这方面,PCR指纹法不同于单一产物的常规PCR,在常规方法中,除非在扩增的指数期取产物样品,否则不能保持样品间的起始材料比例。
在本发明的一个实施方案中,提供了利用RNA指纹技术检定例如生物样品中的核酸分子,或检测选择的核酸分子的方法。简单地说,这些方法一般包括产生一系列标记的核酸片段的步骤。经PCR或相似的扩增程序产生片段,然后按大小分离之。大小分离步骤例如可以是本文所描述的任何技术,例如包括凝胶电泳(如聚丙烯酰胺凝胶电泳)或优选的HPLC。然后从分离的片段上裂解掉标记,并用相应的检测技术检测标记。适用技术的代表性例子包括质谱、红外光谱、恒电势电流测定法或紫外光谱法。任何给定的核酸片段的相对量并不重要,但当参照对照样品时带的大小是可提供信息的。
4.基于荧光的PCR单链构象多态性(PCR-SSCP)除RFLP方法外,还有几种方法可用于分析碱基替代多态性。Orita等人已设计了一种基于变性DNA中构象差异分析这些多态性的方法。简单地说,使用限制性酶消化或PCR产生相对小的DNA片段,然后变性并在非变性聚丙烯酰胺凝上电泳分辨之。碱基替代导致的单链DNA片段中构象差异是根据电泳迁移率检测的。链内碱基配对产生高度序列特异性的并且电泳迁移率不同的单链构象。然而,在使用常规SSCP进行的不同研究中检测率范围从35%到近100%,同时最高检测率常常需要几种不同的条件。原则上,也可用该方法分析基于短的插入式缺失的多态性。该方法是鉴定DNA中点突变和缺失的最强有力的工具之一(SSCP-PCR,Dean等,细胞(Cell)61:863,1990)。
在本发明的一个实施方案中,提供利用PCR-SSP的技术检测例如生物学样品中选择的核酸分子或鉴定核酸分子的方法。简单地说,这些方法一般包括产生一系列标记的核酸片段的步骤。然后按大小分离经PCR产生的片段。大小分离步骤最好是非变性的,并且在分离方法处理之前变性处理核酸片段。例用可用凝胶电泳法(如聚丙烯凝胶电泳)或HPLC法完成大小分离步骤。然后从分离的片段上裂解掉标记并用相应的检测技术(如质谱法、红外光谱法、恒电势电位测定法或紫外光谱法)检测标记。
5.双脱氧指纹法(ddF)已描述过另一种方法(ddF,Sarkar等,基因组(Genomics)13:441,1992),当以回顾或前展方式试验时,用于检测人IX因子基因中的100%单个碱基改变。当分析患乙型肝炎病人的基因组DNA时,检测到全部84个不同的序列改变。
简单地说,当将标记用于基因型鉴定或其他目的时,可以使用的另一种方法是双脱氧指纹化。该方法利用Sanger测序反应中的二脱氧终止子。该方法的原理如下将待测序的靶核酸放在具有双脱氧终止子的反应中,该终止子互补于靶核酸中已知发生了突变的碱基。例如,如果突变导致A→G的改变,反应应在C双脱氧终止子反应中完成。使用PCR引物定位和扩增感兴趣的靶序列。如果推测的靶序列含有A→G改变,则由于在扩增的序列中掺入双脱氧终止子而改变序列群体的大小。在标记的这一特定应用中,将产生一个在突变情况下具有可推测大小的片段。可将标记连接到PCR引物的5′末端上并提供标示样品类型和双脱氧终止子类型的“图谱”。发生PCR扩增反应,例如可用HPLC或PAGE方法按大小分离所得到的片段。在分离步骤结束时,将DNA片段收集在一个时序参考框中,裂解标记,由于掺入给定的双脱氧终止子而产生早熟链,故可根据链长度来确定有无突变。
应特别提到的是,ddf导致双脱氧终止区段的获得或丢失,和/或获得或一个终子区段或产物的迁移率变动。因此,在该方法中是在高本底的其他分子量片段中搜索一个片段迁移率的变动。一个优点是预知与设定的突变相联系的片段长度。
在本发明的一个实施方案中,提供利用PCR-SSP技术鉴定例如生物学样品中核酸分子或检测选择的核酸分子的方法。简单地说,这些方法一般包括产生一系列标记的核酸片段的步骤。然后按大小分离片段。大小分离步骤最好是非变性的,并且在分离方法处理之前变性处理核酸片段。例用可用凝胶电泳法(如聚丙烯凝胶电泳)或优选的HPLC法完成大小分离步骤。然后从分离的片段上裂解掉标记并用相应的检测技术(如质谱法、红外光谱法、恒电势电位测定法或紫外光谱法)检测标记。
6.限制性图谱和RFLP限制性核酸内切酶识别短的DNA序列和在那些特异性位点切割DNA片段。某些限制性酶(rare-cutter)的切割位点很稀少,从而产生小数目的很大片段(几千至百万bp)。大多数酶很频繁地切割DNA,从而产生大量小的片段(小于一百至大于一千bp)。有4碱基识别位点的限制性酶将产生平均256碱基长的片段,6碱基识别位点将产生4000碱基长的片段,8碱基识别位点将产生64,000碱基长的片段。因为已鉴定了数百种不同的限制性酶,故可将DNA切割成许多不同的小片段。
已建立了许多分析DNA多态性的技术。最广泛使用的方法有限制性片段长度多态性(RFLP)方法、联合限制性酶消化、凝胶电泳、膜转印迹和与克隆DNA探针杂交等。根据印迹上标记片段长度的变化检测多态性。可使用PFLP方法来分析当序列改变落入限制性酶切点内时碱基替代,或者通过选择在重复单元以外切割的限制酶分析小卫星/VNTR。琼脂糖凝胶通常不能提供区分相差单一重复单元的小卫星/VNTR等位基因所需的分率率,但许多小卫星/VNTR是可变的,故仍可得到有高度信息价值的标志。
本发明的一个实施方案中,提供利用限制性图谱技术或RFLP鉴定例如生物学样品中的核酸分子,或检测选择的核酸分子的方法。简单地说,这些方法一般包括产生一系列标记的核酸片段的步骤,其中所产生的片段用限制性酶消化。通过进行标记探针与经过消化的靶核酸的杂交步骤产生标记片段。杂交步骤可在限制性核酸酶消化之前或之后进行。然后按大小分离所得到的消化的核酸片段。例用可用凝胶电泳法(如聚丙烯凝胶电泳)或优选的HPLC法完成大小分离步骤。然后从分离的片段上裂解掉标记并用相应的检测技术(如质谱法、红外光谱法、恒电势电位测定法或紫外光谱法)检测标记。
7.DNA指纹法DNA指纹法包括展示来自特定DNA样品中的一组DNA片段。目前已有多种DNA指纹技术(Jeffries等,自然314:67,1985;Welsh和McClelland,核酸研究19:861,1991),其中大多数是使用RCR产生片段。选用何种指纹技术要决决于应用目的,例如DNA分型、DNA标记作图及研究例如原核生物、植物、动物、人等生物体。在过去的几年里已发展了许多适合这些需要的指纹方法,包括随机扩增的多态性DNA(RAPD)、DNA扩增指纹(DAF)和任意引物PCR(AP-PCR)。这些方法都是基于用任意选择的PCR引物扩增随机基因组DNA片段。可在没有序列知识的情况下产生任何DNA的DNA片段图形。所产生的图形取决于PCR引物的序列和模板DNA的性质。在低退火温度下完成PCR,以使引物退火到DNA的多个基因座上。当引物结合位点是在允许扩增的距离范围内时产生DNA片段。原则上,单个引物即足以产生带型图。
已描述了一种称为AFLP的DNA指纹新技术(Vos等,核酸研究23:4407,1995)。AFLP技术是基于用PCR扩增法检测基因组限制性片段,并可用于检测任何来源的或复合来源的DNA。简单地说,使用有限的通用引物对在没有先前的序列知识的情况下产生指纹。可经选择特定的引物组来“协调”在单一反应中检测的片段数目。AFLP技术是坚定可靠的,因为其中引物退火使用了严格的反应条件PFLP技术的可靠性是与PCR技术的效率相结合的。
在本发明的一个实施方案中,提供了利用DNA指纹技术鉴定例如生物学样品中的核酸分子,或检测选择的核酸分子的方法。简单地说,这些方法一般包括产生一系列标记的核酸片段,然后按大小分离片段的步骤。例用可用凝胶电泳法(如聚丙烯凝胶电泳)或HPLC法完成大小分离步骤。然后从分离的片段上裂解掉标记,并用相应的检测技术(如质谱法、红外光谱法、恒电势电位测定法或紫外光谱法)检测标记。
8.可裂解的标记应用于基因型鉴定和多态性检测a.引言虽然有少数已知的人DNA多态性是基于非重复序列的插入、缺失或其他重排,但绝大多数还是基于单个碱基取代或串联重复序列数目的改变。碱基取代在人基因组中是很常见的,平均每200-500bp出现一次。串联重复序列的长度变化在基因组中也是常见的,数千个碱基中至少有数十个散在的多态位点(称为基因座)。串联重复多态性的重复区长度范围为(dA)n(dT)n序列中的1bp至α-卫星DNA中的至少170bp。串联重复多态性可分为两大类,其由小卫星/可变数目的串联重复(VNTR)(典型的重复长度为数十个碱基对并有数十至数千总重复单位)及微卫星(重复长度最多6bp且最大总长度约为70bp)组成。迄今所鉴定的大多数微卫星多态性是基于(dC-dA)n或(dG-dT)n二核苷酸重复序列的。微卫星多态性的分析包括以聚合酶链反应(PCR)扩增含有重复段的小DNA片段,然后在变性聚丙烯酰胺凝胶上电泳分离扩增的DNA。PCR引物互补于侧接于重复段的独特序列。按传统使用聚丙烯酰胺凝胶,而不是琼脂糖凝胶分离微卫星,因为等位基因间的大小常常只差一个重复段。
因此,在本发明的一个方面提供了对选择的生物体进行基因型鉴定的方法,其包括以下步骤(1)从选择的靶分子产生标记的核酸分子,其中标记是与特定的片段相互关联的,并且是可用非荧光光谱法或电位测定法检测的,(b)按序列长度分离标记的分子,(c)从标记的分子上裂解标记,以及(d)用非荧光光谱法或电位测定法检测标记,从而确定生物体的基因型。
在另一个方面,提供了对选择的生物体进行基因型鉴定的方法,其包括以下步骤(a)在足以使标记分子与靶分子杂交的条件和时间下使标记的核酸分子与选择的靶分子结合,其中标记是与特定的片段相互关联并且可用非荧光光谱法或电位测定法检测的;(b)按序列的长度分离标记的片段;(c)从标记的片段上裂解标记;以及(d)用非荧光光谱法或电位测定法检测标记,从而确定生物体的基因型。
b.可裂解标记应用于基因型鉴定PCR方法鉴定限制性片段长度多态性(PFLP)结合了凝胶电泳和检测与特定PCR引物相关的标记。一般说来,一个PCR引物将具有一个特异的标记。因此标记将代表一组PCR引物并进而代表预定的DNA片段长度。根据凝胶中或凝胶洗脱物中标记的片段长度的变化测定多态性。聚丙烯酰胺凝胶电泳通常将提供区分相差单个重复单位的小卫星/VNTR等位基因所需的分辨率。分析微卫星多态性涉及聚合酶链反应(PCR)扩增含有重复片段的DNA小片段,然后在变性聚丙烯酰胺凝胶上电泳分离扩增的DNA,或然后以HPLC法分离DNA片段。扩增的DNA将用在引物5′末端有可裂解标记的引物标记。经链延伸后引物被掺入到新合成的链中。PCR引物互补于侧接于重复段片段的独特序列。也可以如上述微卫星一样多地扩增小卫星/VNTR多态性。
对许多类型DNA序列多态性的描述已提供了了解人类基因组结构的根本性基础(Botstein等,Am.J.Human Genetics 32:p314,1980;Donis-Keller,细胞51:319,1987;Weissenbach等,自然359:794)。使用这些DNA多态性促进了广泛构架连锁图的构建,并已为由连锁定位疾病基因提供了实际可行为手段。微卫星二核苷酸标记正显示为鉴定已证明含有突变并在某些情况下引起疾病的人类基因的有力工具。基因组二核苷酸重复是高多态性的(Weber,1990,基因组分析,Vol.1,pp.159-181,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY;Weber和Wong,1993,Hum.Mol.Genetics,2,p1123)并可具有多达24个等位基因。可使用与二核苷酸重复段周围的独特区域互补的引物以PCR法扩增微卫星二核苷酸重复。扩增后,合并几个扩增的基因座(多重化),然后按大小分离。将扩增的微卫星片段应用于大小分离步骤,然后鉴定大小并进而鉴定等位基因的方法即所谓的基因型鉴定。已报导了将允许高度多重复合的染色体特异性标记用于全基因扫描以进行连锁分析(Davies等,1994,自然371,p130)。
可在与微卫星有关的基因型鉴定中使用标记来发挥作用。简单地说,构建携带标记的PCR引物并用于小心选择的PCR反应,以扩增二、三或四核苷酸重复序列。然后用HPLC或PAGE等方法按大小分离扩增产物。以时序方式收集DNA片段,从各个DNA片段上裂解掉标记并根据与大小分离步骤中的内部标准品的比较来推测长度。参考扩增产物的大小进行等位基因鉴定。
借助可裂解标记进行基因型鉴定,有可能将多个样品合并到单一分离步骤上。实现这一目的有两种通用方法。用于高通过量筛选的第一种通用方法是检测一大群个体中的单一多态性。在该方法中使用单一或重叠组的PCR引物,并且每个扩增反应用一种类型的DNA样品进行。可在分步骤中合并的样品数目与每种检测技术可产生的可裂解标记的数目(即用于质谱仪的400-600个标记)成正比。因此可同时鉴定一大群个体中的1个至几个多态性。第二种方法是使用可对单一DNA样品鉴定许多多态性(例如鉴定个体的基因型)的多组PCR引物。在该方法中,将PCR引物合并在产生不同长度的PCR产物的单一扩增反应中。每个引物对或重叠的引物组均由一特异的可裂解标记编码,这就意味着每个PCR片段将由一特异性标记编码。基于单一分离步骤进行反应(见下文)。可在分步骤中合并的样品数目与每种检测技术可产生的可裂解标记的数目(即用于质谱仪的400-600个标记)成正比。
c.突变的酶检测法和标记的应用在该特定应用或方法中,经酶促裂解给定核酸双链中错配的碱基对来检测异源双链中的错配。使用一组特异性引物以PCR方法扩增待检查是否存在突变的DNA序列,变性处理扩增的产物,与变性的参考片段混合并杂交,从而导致异源双链的形成。然后用如果存在错配时可识别并裂解双链的酶处理异源双链。这样的酶可以是核酸酶S1、绿豆核酸酶、“解离酶”、T4核酸内切酶Ⅳ等。基本上可使用任何一种在体外识别错配并裂解所产生之错配的酶。用适当的酶处理,例如用HPLC或PAGE方法按大小分离DNA双链。按时序收集DNA片段。裂解并检测标记。根据片段的迁移率相对于野生型参考片段所出现的偏移检测突变的存在。
d.标记应用于寡核苷酸连接检测法(OLA)最初由Landegren等人(Landergren等,科学241:487,1988)描述的寡核苷酸连接检测法是一种鉴定(已知)很大而复杂的基因组中的序列的有用技术。OLA反应的原理是基于当两个诊断寡核苷酸在特定的DNA靶上彼此相邻而杂交时,连接酶共价连接它们的能力。如果在探针接合处的序列不是完美碱基配对时,探针将不被连接酶连接。当位于“上游”探针的3′端时,热稳定性连接酶区分潜在的单个碱基配对差异的能力为分辨单个碱基配对提供了机会(Barony,PNAS USA 88:189,1991)。在标记的应用中,标记应附着于被连接到扩增产物上的探针上。完成OLA后,基于大小分离各片段,裂解标记并以质谱法检测之。
e.序列特异性扩增可使用有互补于突变体或正常寡核苷酸序列之3′末端的PCR引物选择性地扩增一个或其他等位基因(Newton等,核酸研究,17,p2503;1989,基因组,5,p535;Okayama等,1989,J.Lab.Clin.Med.,114,p105;Sommer等,1989,Mayo Clin.Proc.,64,1361;Wu等,PNAS USA,86,p2757)。在经PAGE扩增后通常可显现出PCR产物,但序列特异性扩增的原则可被应用于固相程式。
f.标记在某些基于扩增的检测法方面的潜在应用病毒的基因型鉴定标记的一个潜在应用是通过与标记的探针杂交对病毒进行基因型鉴定或病毒鉴定。例如,F+RNA大肠杆菌噬菌体可能是肠内病毒污染之指示剂的有用候选物。以核酸杂交方法进行基因型鉴定是可代替血清分型的可靠、快速、简便而又便宜的方法(Kafatos等,核酸研究7:1541,1979)。扩增技术和核酸杂交技术已被成功地就用于分类各种微生物,其中包括大肠杆菌(Feng,分子细胞探针(Mol.Cell Probes)7:151,1993)、轮状病毒(Sethabutr等,J.Med.Virol.37:192,1992)、丙型肝炎病毒(Stuyver等,J.Gen.Virol.74:1093,1993)和单纯疱疹病毒(Matsumoto等,J.Virol.Methods 40:119,1992)。
肿瘤中突变分析的预后应用已描述了各种实验性哺乳动物和人恶性病变中的基因改变,并代表了在肿瘤发生中所观察到的先后发生的形态学改变的形态学基础(Vogelstein等,NEJM 319:525,1988)。近年来,随着分子生物学技术的进展,已对某些染色体上的等位基因丢失或肿瘤抑制基因的突变以及几种癌基因(例如c-myc、c-jun和ras家族)作了大量研究。先前的工作(Finkelstein等,Arch.Surg.128:526,1993)已鉴定了K-ras癌基因中特定类型的点突变与结肠癌诊断的阶段之间的相互关系。结果提示突变分析可提供有关肿瘤侵占性的重要信息,包括转移的模式和扩散。最近已证明了对三期结肠癌所作TP53和K-ras-2突变分析的预后价值(Pricolo等,Am.J.Surg.171:41,1996)。因此可以明显看出,对肿瘤和癌前细胞的基因型鉴定,以及特异性突变检测在人类肿瘤的治疗中将变得越来越重要。C.DNA片段的分离需要分析的样品常常是在复杂基质中的许多成分的混合物。对于含有未知成分的样品,必须将各成分彼此分离开,从而可用其他分析方法鉴定每种个别成份。在恒定条件下混合物中各成份的分离性质是恒定的,一旦检定后即可利用这些分离性质去鉴定和定量每种成份。这样的方法在层析和电泳分析性分离中是很典型的。
1.高效液相层析(HPLC)高效液相层析(HPLC)是分离溶解于溶液中之化合物的层析分离技术。HPLC装置由流动相储存器、泵、注样器、分离柱和检测器组成。向柱内注射等分的样品混合物以分离化合物。混合物中不同成份由于它们在流动液相和固定相之间的分配行为不同,而以不同的速率通过柱。
最近,已显示在带有化学结合的烷基链的非多孔PS/DVB颗粒上进行IP-RO-HLPC在分析双和单链核酸中可替代毛细管电泳,提供迅速分离和相似程度的分辨率(Huber等,1993,Anal.Biochem.,212,p351;Huber等,1993,核酸研究,21,p1061;Huber等,1993,生物技术(Biotechniques),16,p898)。与离子交换层析相反,其并不总是以链长度的函数保留双链DNA(因为AT碱基对与带正电荷的固定相相互作用比GC碱基对更强),IP-RP-HPLC能够严格地依据大小进行分离。
已发展了使用乙酸三乙铵作为离子配对试剂的方法,可借助高效液相层析法在烷基化非多孔2.3μM聚(苯乙烯-二乙烯基苯)颗粒上成功地分离磷酸二酯寡核苷酸(Oefner等,1994,And.Biochem,223,p39)。所描述的技术允许分离大小范围为50到200核苷酸的长度上只差4至8个碱基对的PCR产物。
2.电泳电泳是基于离子(或如本文所述的DNA)在电场中迁移率的分离技术。带负电荷的DNA迁移向正电极,而带正电荷的离子则向负电极泳动。为安全起见,一个电极通常是接地的,另一个则正或负向偏置的。带电的离子或DNA依赖它们的总电荷、大小和形状不同而有不同的迁移率,并因此可被分离开。电极装置由高电压能源、电极、缓冲液和缓冲液的载体如聚丙烯酰胺凝胶,或毛细管组成。开口毛细管用于许多类型的样品,其他凝胶载体则通常用于蛋白质混合物或DNA片段等生物学样品。
3.毛细管电泳(CE)毛细管电泳(CE)正在以其各种表现形式(游离溶液、等速电泳、等电聚焦、聚丙烯酰胺凝胶、胶束电动“层析”)发展为一种以高分辨率迅速分离很小样品体积的复杂混合物的方法。与MS的固有灵敏度和选择性结合,CE-MS是生物分析的潜在高效率技术。在本文公开的新的应用中,将这两种方法相对接将产生其速率超过目前的测序方法几个数量级的优越DNA测序方法。
CE和电喷射离子化(ESI)流速之间的一致性,以及两者都因(而且主要是用于)溶液中的离子种类而得以简化这一事实提供了极具吸引力的组合基础。已描述了毛细管在区带电泳(CZE)和毛细管等速电泳与建立在ESI基础上的四极质谱仪的组合(Olivares等,Anal.Chem.59:1230,1987;Smith等,Anal.Chem.60:436,1988;Loo等,Anal.Chem.179:404,1989;Edmonds等,J.Chroma.474:21,1989;Loo等,J.MicrocolumnSep.1:223,1989;Lee等,J.Chromatog.458:313,1988;Smith等,J.Chromatog.480:211,1989;Grese等,J.Am.Chem.Soc.111:2835,1989)。小肽很容易以高敏感性(飞摩尔)经受CZE分析。
DNA片段的最有力的分离方法是聚丙烯酰胺凝胶电泳(PAGE),通常是板凝胶格式。但当前技术的主要限制是完成对测序反应中产生的DNA片段的凝胶电泳需要相当长的时间。使用毛细管电泳(其利用超薄凝胶)可实现数量级增加。在游离溶液中,当加入碱时所有DNA均以同样迁移率迁移到第一点的值,从而导致质量和电荷的补偿。在聚丙烯酰胺凝胶中,DNA片段作为长度的函数筛分并迁移,并且该方法现已被应用于CE。用交联聚丙烯酰胺现已达到每米有很大的塔板数(每米107塔板,Cohen等,Proc.Natl.Acad.Sci.,USA 85:9660,1988)。如所描述的这样CE柱也应用于DNA测序。在标准测序仪中,CE的方法原理上比板凝胶电泳快25倍。例如,每小时可读出300个碱基。板凝胶电泳中分离速度受到可在不产生过多热产生情况下施加给凝胶的电场大小限制。因此,所达到的CE速度越大使用的电场强度越高(CE中的300V/cm对板凝胶电泳中的10V/cm)。毛细管方法降低了电流量并因而降低了电能和热量生成。
Smith等人(Smith等,核酸研究18:4417,1990)已提出平行使用多个毛细管以增加通过量。同样Mathies和Huang(Mathies和Huang,自然359:167,1992)已引入了在平行阵列的毛细管上完成分离并证明有高测序通过量的毛细管电泳(Huang等,Anal.Chem.64:967,1992;Huang等,Anal.Chem.64:2149,1992)。毛细管电泳的主要缺点是可装在毛细管上的样品数量有限。在毛细管电泳开始时,分离前浓缩大量样品可增加负载能力,而检测水可降低几个数量级。在CE中最通用的预浓缩方法是样品堆积。最近已详述了样品堆积(Chien和Burgi,Anal.Chem.64:489A,1992)。样品堆积依赖于样品缓冲液和毛细管缓冲液之间的基质差异(pH,离子强度),这样通过样品带的电场就比毛细管区域中的电场大。在样品堆积中,导入在低浓度缓冲液中的大体积样品在毛细管柱的顶部预浓缩。毛细管内充入同样成分但有较高浓度的缓冲液。当样品离子达到毛细管缓冲液和较低的电场时,它们就堆积到浓缩带中。样品堆积增加可检测性1-3个数量级。
预浓缩的另一种方法是在对分析物进行游离区带CE分离之前应用等速电泳(ITP)。ITP是允许在毛细管上装入微升体积样品的电泳技术。该技术依赖于在分别比分析物有较高和较低迁移率的两种缓冲液(前导和收尾电解质)之间插入样品。该技术本来就是一种浓缩技术,其中分析物浓缩在以同样速度迁移的区带中。该技术目前不象上述的堆积方法那么通用,这是因为它需几次选择前导和收尾电解质,并且在分离进行期间只能分离阳离子或阴离子分析物。
DNA测序方法的要点是显著地选择性电泳分离DNA或寡核苷酸片段。该方法有显著的选择性是因为每个片段都只根据核苷酸的差异被分辨出来。已实现分离多达1000个片段(1000bp)。用可裂解的标记进行测序的其他优点如下所述。当在利用可裂解的标记以聚丙烯酰胺凝胶电泳法分离DNA片段时,不需要使用板凝胶格式。因为合并大量的样品(4到2000个),所以不必象使用现有的染料-引物或染料-终止方法(即AB1373测序仪)那样平行地分离样品。因为没有理由进行平行电泳,也就没有理由使用板凝胶。因此,可在电泳分离方法中利用管凝胶格式。Grossman(Grrossman等,Genet.Anal.Tech.Appl.9:9,1992)已证明,当使用管凝胶格式代替板凝胶格式时可得到相当大的优点。这是由于与板凝胶相比,在管格式中散失Joule热的能力更大。从而导致电泳速度更快(快50%),而对高分子量DNA片段(大于1000nt)有更高的分辨率。在基因组测序中读出长序列是很关键的。因此,在测序中使用可裂解标记,还具有允许使用者利用最有效和敏感并具有最高分辨率的DNA分离方法的优点。
4.微装配式装置毛细管电泳(CE)是DNA测序、法医分析、PCR产物分析及限制性片段大小分离的高效率方法。因为毛细管凝胶可施加高得多的势场,所以CE远比传统的板PAGE快得多。但CE具有每个凝胶只能处理一个样品的缺点。本方法结合了CE的更快的分离速度和平行分离多份样品的能力。使用微装置式装置的基本原理是通过使泳道大小微型化至约100微米,从而能增加电泳中的信息密度。电子工业常规使用微装配技术制造有小于1微米特征的电路板。目前毛细管排列的密度限于毛细管的外径。通道的微装配产生高密度的排列。微装配也允许进行用玻璃纤维不可能实现的物理装配,并使通道直接连接到电路片的其他装置上。以前很少在微电路片上构建过用于分离技术的装置。已在硅芯片上装配了气相层析仪(Terry等,IEEE Trans.Electron Device,ED-26:1880,1979)和液相层析仪(Manz等,Sens.Actuators B1:249,1990),但这些装置未被广泛使用。几个研究小组报导了在微装配装置上分离荧光染料和氨基酸(Manz等,J.Chromatography 593:253,1992;Effenhauser等,Anal.Chem,65:2637,1993)。最近Woolley和Mathies(Woolley和Mathies,Proc.Natl.Acad.Sci.91:11348,1994)已证明,可用光刻蚀法和化学刻蚀法在玻璃基质上制造大量的分离通道。通道内充入羟乙基纤维素(HEC)分离基质。已显示可在短短两分钟内分离DNA限制性片段。
D.标记的裂解如上文所讨论的,不同的接头设计可在不同的特异性物理或化学条件下提供可裂解性(“敏感性”)。用于裂解各种接头设计的条件包括酸、碱、氧化、还原、氟化物、琉基交换、光解及酶促条件。
可满足上文列出的接头的一般性标准的可裂解接头是本领域技术人员已知的,并包括见于Pierce(Rockord,IL)的商品目录中的那些接头。例子包括· 双(琥珀酰亚氨基琥珀酸)乙二醇酯(EGS),为可被羟胺裂解(1M,37℃,3-6小时)的胺反应性交联剂;· 酒石酸二琥珀酰亚氨酯(DST)和磺基-DST,其为可被0.015M过碘酸钠裂解的胺反应性交联剂;· 双[2-(琥珀酰亚氨氧基羰基氧基)乙基]砜(BSOCOES)和磺基
-BSOCOES,其为可被碱(pH11.6)裂解的胺反应性交联剂;· 1,4-二-[3′-(2′-吡啶二硫基(丙酰胺基)丁烷(DPDPB),可经硫羟交换或还原作用裂解的吡啶二硫醇交联剂;· N-[4-(对叠氮基水杨酰胺基)-丁基]-3′-(2′-吡啶二硫基)丙酰胺(APDP),为可经硫羟交换或还原裂解的吡啶二硫醇交联剂;· 双-[β-4-(叠氮基水杨酰胺基)乙基]-二硫化物,为可经硫羟交换或还原作用裂解的光反应性交联剂;· N-琥珀酰亚氨基-(4-叠氮苯基)-1,3′-二硫基丙酸酯(SADP),可经硫羟交换或还原反应裂解的光反应性交联剂;· 硫代琥珀酰亚氨基-2-(7-叠氮基-4-甲基香豆素-3乙酰胺)乙基-1,3′-二硫丙酸酯(SAED),可经硫羟交换或还原反应裂解的光反应性交联剂;· 磺基琥珀酰亚氨基-2-(间叠氮基-邻硝基苯甲酰氨基)-乙基-1,3′-二硫丙酸酯(SAND),可经硫羟交换或还原反应裂解的光反应性交联剂。
可裂解接头的其他例子和可用于释放标记的裂解条件如下所述。可被氟化物或在酸性条件下裂解的甲硅烷基连接基团。可被光源裂解(光解)的3-,4-,5-,或6-取代的-2-硝基苄氧基或2-,3-,5-,或6-取代的-4-硝基苄氧基连接基团。可被Ce(NH4)2(NO3)6裂解(氧化)的3-,4-,5-或6-取代的-2-烷氧基苯氧基或2-,3-,5-,或6-取代的-4-烷氧基苯氧基连接基团。可被氢氧化物(碱)、酸或LiAlH4(还原)裂解的NCO2(尿烷)接头。可被O3、OsO4/IO4-或KMnO4(氧化)裂解的3-戊烯基、2-丁烯基或1-丁烯基连接基团。可被O2、Br2、MeOH或酸裂解的2-[3-,4-,或5-取代的-呋喃基]氧基连接基团。
裂解其他不稳定连接基团的条件包括可用酸裂解叔烷氧基连接基团;可用H3O+裂解的甲基(二烷基)甲氧基或4-取代的-2-烷基-1,3-二氧戊环-2-基连接基团;可用氟化物或酸裂解的2-甲硅烷基乙氧基连接基团;可在碱性条件下裂解的2-(X)-乙氧基(其中X=酮、酯、酰胺、氰基、NO2、硫醚、亚砜、砜)连接基团;可用酸或在还原条件下裂解的2-,3-,4-,5-,或6-取代的苄氧基连接基团;可用(Ph3P)3RhCl(H)裂解的2-丁烯氧基连接基团;可用Li、Mg或BuLi裂解的3-,4-,5-或6-取代的-2-溴苯氧基连接基团;可用Hg2+裂解的甲基硫代甲氧基连接基团;可用Zn或Mg裂解的2-(X)-乙氧基(其中X=卤素)连接基团;可经氧化(例如用Pb(OAc)4)裂解的2-羟基乙氧基连接基团。
优选的接头是被酸或光解作用裂解的接头。在已为固相肽合成而发展的酸敏感性接头中,有几种可用于将标记连接到MOI上。在Lloyd-Williams等人的综述(四面体49:11065-11133,1993)描述了其中的某些接头。一类有用的接头是基于对烷氧基苄基醇,其中两种接头4-羟基甲基苯氧基乙酸和4-(4-羟甲基-3-甲氧基苯氧基)丁酸可购自Advanced Chem Tech(Louisville,KY)。这两个接头可通过连接到苄醇上的酯键连接到标记上,并且通过连到羧酸上的酰胺键连接到含胺MOI上。用不同浓度的三氟乙酸从MOI裂解掉由这些分子连接的标记。裂解这些接头导致标记上的羧酸的释放。酸裂解通过相关接头如2,4-二甲氧基-4'-(羧甲氧基)-二苯甲基胺(可以FMOC保护的形式购自AdvancedChem Tech公司)连接的标记,导致被释出的标记上的羧酰胺的释放。
已为固相肽合成而发展的大部分光敏感性接头也可用于本申请(参见Lloyd-Williams的综述)。这些接头通常是基于2-硝基苄酯或2-硝基苄酰胺。最近文献中报导过的光敏感接头的两个例子是4-(4-(1-Fmoc-氨基)乙基)-2-甲氧基-5-硝基苯氧基)丁酸(Holmes和Jones,J.Org.Chem.60:2318-2319,1995)和3-(Fmoc-氨基)-3-(2-硝基苯基)丙酸(Brown等,Molecular Diversity 1:4-12,1995)。两接头均可通过羧酸连接到MOI的胺上。通过在标记上的羧酸和接头上的胺之间形成酰胺而使标记接到接头上。通常用350nm波长的紫外光以本领域已知的强度和时间完成对光敏感接头的裂解。光化学裂解装置的商品来源是Aura Industries Inc.(Staten Island,NY)和Agrenetics(Wilmington,MA)。裂解接头导致标记上伯酰胺的释放。光可裂解的接头的例子包括硝基苯基甘氨酸酯,内-和外-2-苯并降冰片烷基氯和甲磺酸,以及3-氨基-3(2-硝基苯基)丙酸。酶促裂解的例子包括可裂解酯键的酯酶、裂解磷酸二酯键的核酸酶、裂解肽键的蛋白酶等。E.标记的检测检测方法一般依赖于某些类型光谱场中的吸收和发射。当原子或分子吸收光时,进入的能量将量化结构激发到较高能量水平。激发的类型取决于光的波长。电子被紫外或可见光激发到较高轨道,红外光激发分子振动,并且微波激发旋转。吸收光谱是作为波长函数的光吸收。原子或分子的光谱依赖于其能量水平结构。吸光光谱可用于鉴定化合物。具体的吸收光谱方法包括原子吸收光谱法(AA)、红外光谱法(IR)和紫外可见光谱法(UV-Vis)。
被激到高能水平的原子或分子因发出幅射而衰变到较低水平。如果跃迁是在同一自旋状态间进行该光称为荧光,如果跃迁发生在不同自旋状态之间则是磷光。分析物的发射强度与浓度成线性关系(在低浓度下),并用于定量发光物质。具体的发射光谱方法包括原子发射光谱法(AES)、原子荧光光谱法(AFS)、分子激光诱导的荧光法(LIF)和X射线荧光法(XRF)。
当电磁幅射通过物质时,大部分幅射以其原来的方向继续前进,但小部分向其他方向散射。以入射光的同样波长散射的光称为雷利散射。在透光固体中由于振动散射的光称为布里渊散射。布里渊散射典型的是从入射光偏移0.1到1个波数。不透明固体中由于分子中振动或光声子散射的光称为喇曼散射。喇曼散射光从入射光偏移多达4000个波数。特异性散射光谱方法包括喇曼光谱法。
IR光谱法是检测被样品吸光的中红外光的波长和强度。中红外光(2.5-50μm,4000-200cm-1)是足以激发分子振动到较高能量水平的光。IR吸收带的波长是特异类型的化学键所特有的,并且IR光谱一般最适于鉴定有机和有机金属分子。
近红外吸收光谱(NIR)是检测被样品吸收的近红外光的波长和强度。近红外光跨越800nm-2.5μm(12,500-4000cm-1)范围并且是足以激泛音和分子振动组合达到较高能量水平的光。NIR典型地被用于定量检测有机官能基团,特别是O-H、N-H和C=O。NIR仪的组成和设计相似于UV-VIS吸收光谱仪。光源通常是钨灯,检测器通常是PbS固态检测器。样品容器可以是玻璃或石英的,并且典型的溶剂是CCl4和CS2。NIR光谱的方便装置使之适于联机监测和过程控制。
紫外和可见光吸收光谱是测量由样品吸收的近紫外和可见光的波长和强度。真空中UV吸收发生在100-100nm(105-50,000cm-1);石英UV在200-350nm(50,000-28,570cm-1),可见光在350-800(28,570-12,500cm-1),并且符合Beer-Lambert-Bouguet定律。紫外和可见光是足以加速外围电子到较高能量水平的光。UV-Vis光谱通常可应用于溶液中的分子和无机离子或复合物。US-Vis光谱受到光谱宽度特征的限制。光源通常是氘灯(用于UV检测)和钨灯(用于可见光检测)。用波长分离器如棱镜或光栅单色仪选择这些连续光源的波长。经扫描波长分离器得到光谱,并可根据光谱或在单一波长处进行定量检测。
质谱是利用离子化原子或分子的质量对电荷比例的不同将它们彼此分离开。因此质谱可用于原子或分子的定量,并且还用于确定分子的化学和结构信息。分子具有不同的片段化特征,从而为鉴定化合物提供结构信息。质谱仪的一般操作如下。造成气相离子,基于它们的质量对电荷比例在空间或时间上分离离子,并检测各个质荷比离子的量。质谱仪的离子分离能力是由分辨率描述的,其定义为R=m/Am,其中m是离子质量,Δm是质谱中两个可分辨峰之间的质量差异。例如分辨率为1000的质谱仪可分辨开m/z为100.0的离子与m/z为100.1的离子。
一般说来,质谱仪由离子源、质量选择分析器和离子检测器组成。磁扇形场、四极和飞行时间设计也需要抽提和加速离子以将离子从来源区域转移到质量分析器中。下面讨论几种质量分析器设计(磁扇形场质谱、四极质谱或飞行时间质谱)的详细内容。磁扇形场质谱的单聚焦分析器利用180、90或60度的颗粒束路径。影响颗粒的各种力分离有不同质量/电荷比例的离子。用双聚焦分析器,在这种类型的仪器中加入静电分析器,以分离有不同动能的颗粒。
用于四极质谱的四极质量滤器由平行排列的4个金属棒组成。施加的电压影响在4个棒之间中心部分向下飞行之离子的轨迹。对于给定的DC和AC电压,只有某些质量/电荷比例的离子通过四极滤器,而所有其他的离子则被抛出它们原来的路径。当改变棒上的电压时监测通过四级滤器的离子,以得到质谱。
飞行时间质谱利用通过“漂移区”的过渡时间的差异分离不同质量的离子。其以脉冲发射模式运行,所以离子必须在脉冲中产生和/或被提取。发射脉冲的电场将所有离子以qV的动能加速到无场漂移区,其中q是离子电荷,V是施加的电压。因为离子动能是0.5mV2,所以较轻的离子比较重离子有更高的速度,并较快地到达漂移区末端的检测器。离子检测器的输出作为时间的函数展示在示波器上,以得到质谱。
离子形成过程是质谱分析的起始点。化学电离是一种利用试剂离子与分析物分子(标记)反应以通过质子或氢负离子转移形成离子的方法。试剂离子是向电子碰撞(EI)离子源内导入过量(相对于标记)甲烷而产生的。电子碰撞产生CH4+和CH3+,它们进一步与甲烷反应形成CH5+和C2H5+。电离标记的另一种方法是通过等离子体和辉光放电。等离子体是有效地激发并电离原子的热的部分电离的气体。辉先放电是保持在两个电极之间的低压等离子体。电子碰撞电离利用电子束,通常是由钨丝产生的电子束电离气相原子或分子。来自电子束的电子撞掉分析物原子或分子的电子以产生离子。电子喷射电离(ESI)利用很细的针和一系列分离器(Skimner)。样品溶液被喷射到离子源小室中以形成小滴。当排出毛细管时小滴携带电荷并且当溶剂蒸发时小滴消失,留下高带电分析物分子。ESI特别适用于难以蒸发或电离的生物大分子。快速原子轰击(FAB)利用冲击固体样品的中性原子和Xe或Ar的高能束以引起解吸附和电离。其用于难以进入气相的生物大分子。FAB很少引起片段化并通常给出大的分子离子峰,使之适用于分子量测定。经加速从离子源通过电荷交换室的离子产生原子束。离子在与中性原子碰撞中吸收电子形成高能原子束。激光电离是一种激光脉冲剥落样品表面的材料并产生微等离子体的方法,后者电离某些样品成分。基质辅助的激光解吸电离(MACDI)是蒸发和电离大生物分子如蛋白质或DNA片段的LIMS方法。将生物分子分散于固体基质如烟酸上。UV激光脉冲将携带某些大分子的基质以离子化形式剥落到气相中,以使它们可被提取到质谱仪内。等离子体解吸电离(PD)利用252Cf的衰变,产生两个以相反方向迁移的碎片。一个碎片冲击样品激发出1-10个分析物离子。另一个碎片冲击检测器并引发开始采集数据。该电离方法特别适用于大的生物分子。共振电离是其中将一个或多个激光束调至使气相原子和分子共振跃迁的频率,使之以分步方式加速到其离子化电势以上,以产生离子。次级电离(SIMS)利用离子束例如3He+、16O+或40Ar+聚焦在样品表面上并使材料溅蚀到气相中。火花源是一种穿过两电极发出电流脉冲以电离固体样品中分析物的方法。
标记在从所连接的分子上裂解之前、期间或之后,可能变成带电的。基于离子“解吸”的电离方法,从固体或液体表面直接形成或发射离子,得以增加电离方法的应用至非挥发性和热敏感性化合物。这些方法不要求在电离前中性分子挥发,并且总地大大减少了分子的热降解。这些方法包括场解吸(Becky,场电离和场解吸质谱的原理,Pergamon,Oxford,1977)、等离子体解吸(Sundqvist和Macfarlane,Mass Spectrom.Rev.)、激光解吸(Karas和Hillenkange,Anal.Clem.60:2299,1998;Karas等,Angew.Chem.101:805,1989)、快粒子轰击(如快原子轰击、FAB和次级离子质谱、SIMS;Barber等,Anal.Chem.54:645A,1982)及热喷射(TS)电离(Vestal,Mass Spectrom.Rev.2:447,1983)。热喷射广泛应用于与液相层析联机组合。也已显示连续流动FAB方法(Caprioli等,Anal.Chem.58:2949,1986)有重要的应用潜力。更完全的电离/质谱法组合包括离子捕获质谱、电喷射电离质谱、离子喷射质谱、液体电离质谱、大气压电离质谱、电子电离质谱、亚稳定原子轰击电离质谱、快原子轰击电离质谱、MALDI质谱、光化电离飞行时间质谱、激光小滴质谱、MALDI-TOF质谱、APCI质谱、纳米喷射质谱、雾化喷射电离质谱、化学电离质谱、共振电离质谱、次级离子质谱、热喷射质谱。
这些电离方法适合于非挥发性生物化合物具有交迭实用范围。电离效率主要取决基质组合物和化合物类型。目前可得到的结果表明,TS分子量上限约为8000道尔顿(Jones和Krolik,质谱快讯,1:67,1987)。因为TS实践主要是用四极质谱仪,所以在较高质量/电荷比例(m/z)下敏感性一般都不成比例。飞行时间(TOF)质谱仪是可从市场上购得的,并具有m/z范围只受检测器效率限制的优点。最近,已引入了另外两种电离方法。这两种方法现在称为基质辅助的激光解吸(MALDI,Karas和Hilenkamp,Anal.Chem.60:2299,1988;Karas等,Angew.Chem.101:805,1989)和电喷射电离(ESI)。这两种方法都有很高的电离效率(即很高的[产生的分子离子]/[消耗的分子]比例)。限定技术最终潜力的灵敏度取决于样品大小、离子的量、流速、检测效率及实际电离效率。
电喷射质谱是建立在60年代首先提出的理论(Dole等,J.Chem.Phys.49:2240,1968)基础上的。电喷射电离(ESI)是一种产生用质谱法分析的带电分子的手段。简单地说,电喷射电离在强静电场中由雾化液体产生高带电小滴。一般在干浴气体中于大气压下形成高带电小滴,经中性溶剂蒸发而收缩,直到电荷排斥力克服内聚力,导致“库仑爆炸”。电离的准确机制尚有争论并且已有几个研究小组提出了假设(Blades等,Anal.Chem.63:2109-14,1991;Kebarle等,Anal.Chem.65:A972-86,1993;Fenn,J.Am.Soc.Mass.Spectram.4:524-35,1993)不管离子形成的基本过程如何,ESI总是于温和条件下从溶液中产生带电荷分子。
用小量有机分子获得有用质谱数据的能力有赖于离子的有效产生。ESI的电离效率与分子的正电荷量有关。实验性改善电离作用通常包括使用酸性条件。改善电离的另一种方法是在可能时使用季胺(参见Aekersold等,蛋白科学(Protein Science)1:494-503,1992;Smith等,Anal.Chem.60:436-41,1988)。
以下进一步详细描述电喷射电离。电喷射离子的产生需要两个步骤在接近大气压下分散高带电小滴,然后在诱导蒸发条件下处理。使分析物分子的溶液通过保持在高电势下的针。在针的尖端,溶液分散到含分析物分子的带高电荷小滴的气雾中。小滴迅速地蒸发并通过一个场解吸或残留蒸发的过程,质子化的蛋白质分子被释放到气相中。电喷射一般是通过对来自毛细管的小的液体流(一般为1-10μL/分钟)施加高电场而产生的。一般在毛细管和位置相距0.2-2cm的反电极之间施加3-6kV的电势差(其中依据去溶剂化的程度,可通过小孔由MS提取电子、带电团、甚至带电小滴样品)。电场导致电荷在毛细管末端液体表面上积聚;因此液体流速、比电阻和表示张力是小滴形成中的重要因素。高电场导致液体表面的破坏和高带电液体小滴的形成。根据毛细管偏压可产生带正电荷或负电荷小滴。负离子型需要在电子清除剂例如氧的存在以抑制放电。
可将各种液体静电喷射到真空中,或者可借助喷雾剂喷射。只使用喷雾电场导致对液体导电率和介电常数的某些实际限制。室温下以相当于<10-4M的含水电解质溶液的有用液体流速进行稳定电喷射需要小于10-5欧姆的溶液导电率。发现该模式对ESI-MS是最有用的,适当的液体流速导致液体作为细雾分散。离毛细管的距离非常短,小滴直径常常相当均匀并且约为1μm。特别重要的是,对于较高液体流速,总电喷射离子电流只稍有增加。有证据表明加热对于操纵电喷射是有用的。例如,稍微加热可使含水溶液很容易电喷射,推测是由于降低了粘度和表面张力。热辅助和气体雾化辅助电喷射允许使用较高的液体流速,但增加小滴带电的程度。分子离子的形成需要有影响初始小滴群体蒸发的条件。为此,可在较高压力下借助于中度温度(<60℃)的干气体流,在通过界面运输期间加热,并且(特别是在使用离子俘获法的情况下)经在相对低的压力下高能碰撞而实现之。
虽然构成ESI之基础的详细过程尚不确定,但经ESI产生的很小小滴似乎允许溶液中的几乎所有各种带电颗粒在蒸发残留溶剂后被转移到气相中。然后质谱检测需要离子在去溶剂化后具有可检测的m/z范围(四极装置要求<4000道尔赖),并且能以足够的效率产生和传输。已发现很宽范围的溶剂都适合于ESI-MS,而且电离效率基本上不依赖于分子量,提示其为一种高度无区别的和广泛适用的电离方法。
电喷射离子“源”在接近大气压条件下起作用。电喷射“源”一般是金属或玻璃毛细管,加上一种相对可反电极电偏离液体溶液的方法。溶液,典型的是含有分析物并常含有其他添加剂如乙酸的水-甲醇混合物,流向毛细管末端。已描述了一种ESI源(Smith等,Anal.Chem.62:885,1990),其可容纳基本上任何溶剂系统。ESL的典型流速为1-10μL/分钟。对ESI-MS界面的基本要求是尽可能有效地从高压区向MS加样并输送离子。
ESI的效率可以是很高的,从而为本发明有用的极敏感的装置提供了基础。对于单一带电荷的检测对象来说,目前的装置性能可提供在检测器中的总离子电流为2×10-12A或约107计数/秒。在该装置性能的基础上,如果分析物完全被电离,浓度低到10-10M或大约10-18mol/秒的单一种带电粒子将产生可检测的离子流(大约10个计数/秒)。例如,使用与毛细管区带电泳的ESI界面,已得到了季铵离子的10-18摩尔检测下限(Smith等,Anal.Chem.59:1230,1988)。对于分子量为1000的化合物,电荷平均数为1,电荷状态近似数为1,峰宽度(m/z)为1,并且最大强度强度(离子/秒)是1×1012。
在得到ESI质谱中实际消耗相当少的样品(Smith等,Anal.Chem.60:1948,1988)。使用扇页装置的阵列检测器(其允许同时检测光谱的各部分)也可获得实质性效益。因为目前只检测由ESI形成的约10-5的所有离子,所以关注限制装置性能的因素可以为改善灵敏度提供基础。本领域技术人员可以理解到,本发明包括并容纳对电离和检测方法的改进。
界面最好是放在分离装置(使用凝胶)和检测器(例如质谱)之间。界面最好有下列特征(1)能够以不连续的时间间隔收集DNA片段,(2)浓缩DNA片段,(3)从电泳缓冲液和介质中除去DNA片段,(4)从DNA片段上切掉标记,(5)将标记与DNA片段分离开,(6)处理DNA片段,(7)将标记放在挥发性溶液中,(8)挥发并电离标记,(9)将标记放置或运送到喷射装置,由此将标记导入质谱仪。
当DNA片段从凝胶的底部洗脱时,界面也有“收集”DNA片段的能力。凝胶可以包括板凝胶、管状凝胶、毛细管凝胶等。可用几种方法收集DNA片段。第一种方法是使用电场,其中DNA片段被收集到电极上或接近电极处。第二种方法是其中使液体流流过凝胶底部以收集DNA片段。可以接合两种方法的特征,其中可将DNA收集到流动的液体流中,其后利用电场浓缩。最终结果是从完成分离方法的介质中除去DNA片段。这就是说,可以使用电场将DNA片段从一类溶液“拖拉”到另一类溶液中。
一旦DNA片段处在适当的溶液(与电喷射和质谱相容的)中,标记即可从DNA片段上裂解下来。然后可利用电场将DNA片段与标记分离开(该标记最好带有与DNA标记相反的电荷)。然后再使用电场或流动液体将标记导入电喷射装置内。
根据它们的吸收和荧光发射波长及强度最直接地鉴定并定量荧光标记。
虽然常规荧光分光光度计是适应性极强的,其可提供连续范围的激发和发射波长(lEX、lS1、lS2),但例如流式细胞计数仪和激光扫描显微镜等更专业化的装置则需要可在单一的固定波长激发的探针。在现代装置中,这通常是氩激光的488nm光谱线。
每个探针分子的荧光强度都与ε和QY的乘积成正比例。在目前实践中有重要性的荧光团中,这些参数的范围为ε大约10000至100,000cm-1M-1,QY为0.1至1.0。当高强度光照将吸收驱向饱和时,限制荧光可检测性的因素是被激发的荧光团的不可逆性破坏(光漂白)。光漂白的实际影响取决于所用的荧光检测技术。
本领域技术人员可以看出,装置(界面)可被安排在分离和检测步骤之间,以便使大小分离和标记检测(在时间上)连续进行。这样就将分离方法和装置与检测方法和装置联合起来,构成单一装置。例如,将界面置于分离技术操作和以质谱法或电势电流测定法进行的检测之间。
界面的功能主要是从分析物中释放出(如质谱)标记。有几种有代表性的界面装置。界面的设计依据于对可裂解接头的选择。就可光裂解的接头来说,需要能量或光源。对于热不稳性接头、碱敏感性接头或二硫化物接头,需在界面内加入试剂。对于热敏感性接头,需要能量或热源。对于酶敏感性接头(例如特异性蛋白酶)和肽接头、核酸酶及DNA或RNA接头、糖基化酶、HRP或磷酸酶及裂解后不稳定的接头(例如相似于化学发光底物)则需要加入酶。界面的其他特征包括最小带加宽,在注入质谱仪内之前将DNA与标记分离开。分离技术包括基于电泳方法的技术和亲和技术、按大小保留(透析)技术、过滤等。
也有可能以俘获电泳法浓缩标记(或核酸-接头-标记构建体),然后释放到与所选用的特定类型的电离方法相匹配的替代试剂流中。界面也能够将标记(或核酸-接头-标记构建体)俘获到微球上,将微球射入小室内之后进行激光解吸/蒸发。也可能提取到替代缓冲液中(例如从毛细管电泳缓冲液穿过可通透膜进入疏水缓冲液中)。在某些应用中也可能期望将标记间歇性地传送到质谱仪中,这可能包括界面另外的功能。界面的另一个功能是将标记从多个柱送入对每个柱都有一旋转时间狭缝的质谱仪中。另外,有可能将标记从单个柱传送到按时间分开的多个质谱检测仪中,在数毫秒时间里收集每组标记,然后送入质谱仪。
下面列出的是可用于本发明的分离和检测技术设备的代表性销售商。Hoefer Scientific Instruments(San Francisco,CA)生产用于测序的电泳装置(Two StepTM,Poker FaceTMⅡ)。Pharmacia Biotech(Piscataway,NJ)生产用于DNA分离和测序的电泳装置(PhastSystem用于PCR-SSCP分析,MacroPhor System用于DNA测序)。Rerkin Elmer/Applied Biosystems Division(ABI,FosterCity,CA)生产基于荧光素染料的半自动测序仪(ABI373和ABI377)。Analytical Spectral Devices(Boulder,CO)生产UV分光光度计。Hitachi Instruments(日本东京)生产原子吸收光谱仪、荧光光谱仪、LC和GC质谱仪、NMR光谱仪及UV-Vis光谱仪。PreSeptiveBiosystems(Framingham,MA)生产质谱仪(VoyagerTMElite)。Bruker Instruments Inc.(Manning Park,MA)生产FTIR光谱仪(Vector22)、FF喇变光谱仪、飞行时间质谱仪(Reflex IITM)、离子俘获质谱仪(EsquireTM)和Maldi质谱仪。Analytical Technology Inc.(ATI,Boston,MA)制造毛细管凝胶电泳装置、UV检测器和二极管阵列检测仪。Teledyne Electronic Technologies(Mountain View,CA)制造离子俘获质谱仪(3DQ DiscoveryTM和3DQ ApogeeTM)。Perkin Elmer/Applied Biosystems Division(Foster city,CA)制造可与电喷射匹配的Sciex质谱仪(三联四极LC/MS/MS,API 100/300)。Hewlett-Packard(Santa Clara,CA)生产质量选择性检测器(HP5972A)、MALDI-TOF质谱仪(HP G2025A)、二极管阵列检测器、CE装置、HPLC装置(HP1090)及UV光谱仪。FinniganCorporation(San Jose,CA)制造质谱仪(磁扇形场(MAT95STM)、四极光谱仪(MAT95SQTM)和四种其他的相关质谱仪)。Rainin(Emevyville,CA)制造HPLC装置。
本文描述的方法和组合使得可以使用裂解的标记确定样品类型和核酸鉴定的图谱。在每个测序方法开始时,为每个特定的(选择的)引物指定一个特殊的独特标记。标记指示不同的样品类型、双脱氧终止子类型(就Sanger测序反应而言)或优选两者。具体地说,标记指示引物类型,引物类型又指示载体类型,载体类型又指示样品身份。标记也可能指示双脱氧终止子类型(ddTTP、ddCTP、ddGTP、ddATP),其中参考放有标记引物的双脱氧核苷酸反应。然后完成测序反应并及时按大小依次分离所得到的片段。
在时间框架中从片段上切下标记并在时间框架内检测和记录之。将标记图谱与时间框架相比较以构成序列。即,在按大小分离之后及时记录所有标记的鉴定数据并且在数据框架中变成相互关联的。按大小分离步骤可分离开按一个核苷酸递增的核酸片段,因此按一个核苷酸的增量分离了相关的标记。由于予知双脱氧终止子或核苷酸图谱和样品类型,很容易以线性方式推断出序列。
下列实施例是按举例说明方式,而不是以限制的方法提供的。
除另外指出者外,用于实施例中的化学品均可从Aldrich ChemicalCompany,Milwaukee,WI得到。本文使用具有所指出的含义的下列缩写词ANP=3-(Fmoc-氨基)-3-(2-硝基苯基)丙酸NBA=4-(Fmoc-氨基乙基)-3-硝基苯甲酸HATU=O-7-氮杂苯并三唑-1-基-N,N,N’,N’-四甲基脲六氟磷酸盐DIEA=二异丙基乙胺MCT=一氯三嗪NMN=4-甲基吗啡啉MNP=N-甲基吡咯烷酮ACT357=ACT357肽合成仪,购目Advanced ChomTech,Inc.LouisvilleKYACT=Advanced Chem Tech,Inc.,Louisvile,KYNovaBiochem=CalBiochem-NovaBiochem International,San diego,CATFA=三氟乙酸Tfa=三氟乙酰iNIP=N-甲基异哌啶甲酸Tfp=四氟苯基DIAEA=2-(二异丙基氨基)乙胺MCT=一氯三氮烯5’-AH-ODN=有5’-氨基己基尾的寡脱氧核苷酸。
实施例实施例1用于可裂解分子鉴定剂测序中的酸敏感性接头的制备A可化学裂解的质谱标记五氟苯基酯的合成,以释放带羧酰胺末端的标记图1显示反应流程。步骤A.在ACTA357肽合成仪(ACT)的收集容器中用DMF悬浮TentaGel SAC树脂(化合物Ⅱ;得自ACT;1当量)。加入溶于DMF的化合物Ⅰ(3当量)、HATU(3当量)和DIEA(7.5当量)并将收集容器振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗树酯。将Ⅰ偶联到树脂上并重复洗涤步骤,得到化合物Ⅲ。步骤B.将树脂(化合物Ⅲ)与DMF中的25%哌啶混合并振荡10分钟。除去溶剂,用NMP(2X)、MeOH(2X)和DMF(2X)洗树脂,并直接用于步骤C。步骤C.将步骤B的去保护的树脂悬浮于DMF中并向其中加入DMF中的FMOC保护的在其侧链中含有胺官能团的氨基酸(化合物Ⅳ,如α-N-FMOC-3-(3-吡啶基)-丙氨酸,可购自Synthetech,Albany,OR;3当量)、HATU(3当量)和DIEA(7.5当量)。将容器振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗树酯。将Ⅳ偶联到树脂上并重复洗涤步骤,以得到化合物Ⅴ。步骤D.按步骤B中所述用哌啶处理树脂(化合物Ⅴ)以除去FMOC基团。然后用ACT357将收集容器中的去保护的树脂等分到16个反应容器中。步骤E.将得自步骤D的16等份的去保护树脂悬浮于DMF中。向各反应容器中加入溶于DMF中的适当的羧酸Ⅵ1-16(R1-16CO2H3,3当量)、HATU(3当量)和DIEA(7.5当量)。将容器振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗各等份的树脂。将Ⅵ1-16偶联到各等份的树脂上并重复洗涤步骤,得到化合物Ⅶ1-16。步骤F.用CH2CI2(3X)洗各等份的树脂(化合物Ⅶ1-16)。向各反应容器内加入在CH2CH2中的1%TFA并将容器振荡30分钟。将溶剂从反应容器过滤到各个试管中。用CH2CI2(2X)和MeOH(2X)洗各等份的树脂并将滤液合并到各个试管中。真空中蒸发各个试管。得到化合物Ⅷ1-16。步骤G.将每份游离羧酸Ⅷ1-16溶解于DMF中。向各溶液内加入吡啶(1.05当量),然后再加入三氟乙酸五氟苯酯(1.1当量)。室温下将混合物搅拌45分钟。用EtOAc稀释该溶液,用1M柠檬酸水溶液(3X)和5%NaHCO3水溶液(3X)洗,在Na2SO4上干燥,过滤并真空蒸发,得到化合物Ⅸ1-16。
B.可化学裂解的质谱标记五氟苯基酯的合成,以释放带羧酸末端的标记图2显示反应流程。步骤A.将4-(羟甲基)苯氧基丁酸(化合物Ⅰ;1当量)与DIEA(2.1当量)和烯丙基溴(2.1当量)合并在CHCl3中并加热回流2小时。用EtOAc稀释混合物,用1N HCl(2X)、pH9.5碳酸盐缓冲液(2X)及盐水(1X)洗,在Na2SO4上干燥,并真空蒸发得到化合物Ⅰ的烯丙酯。步骤B.将步骤A中的化合物Ⅰ的烯丙酯(1.75当量)与FMOC保护的在其侧链中含有胺官能团的氨基酸(化合物Ⅱ,如α-N-FMOC-3-(3-吡啶基)-丙氨酸,可购自Synthetech,Albany,OR;1当量)、N-甲基吗啉(2.5当量)和HATU(1.1当量)合并到CH2Cl2中,并室温搅拌4小时。用CH2Cl2稀释混合物,用1M柠檬酸水溶液(2X)、水(1X)和5%NaHCl3水溶液(2X)洗,在Na2SO4上干燥并真空蒸发。经快速层析(CH2Cl2→EtOAc)分离化合物Ⅲ。步骤C.将化合物Ⅲ溶解于CH2Cl2中,加入Pd(PPh3)4(0.07当量)和N-甲基苯胺(2当量),并将混合物室温搅拌4小时。用CH2Cl2稀释混合物,用1M柠檬酸水溶液(2X)和水(1×)洗,在NaSO4上干燥并真空蒸发。经快速层析(CH2Cl2→EtOAc)分离化合物Ⅳ。步骤D.在ACT357肽合成仪(Advanced ChemTech Inc(ACT),Louisvile,KY)的收集容器内用DMF悬浮TentaGel S AC树脂(化合物Ⅴ;1当量),加入溶于DMF中化合物Ⅳ(3当量)、HATU(3当量)和DIEA(7.5当量)并将收集容器振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗树脂。将Ⅳ偶联到树脂上并重复洗涤步骤,得到化合物Ⅵ。步骤E.将树酯(化合物Ⅵ)与DMF中的25%哌啶混合并振荡5分钟。过滤树脂,然后与DMF中的25%哌啶混合并振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗树脂。然后用ACT357将去保护的树脂从收集容器中等分到16个反应容器中。步骤F.将步骤E的16等份去保护的树脂悬浮于DMF中。向各反应容器内加入溶于DMF的适当的羧酸Ⅶ1-16(R1-16CO2H;3当量)、HATU(3当量)和DIEA(7.5当量)。将容器振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗各等份树脂。将Ⅶ1-16偶联到树脂上并重复洗涤步骤,得到化合物Ⅷ1-16。步骤G.用CH2Cl2(3X)洗各等份树脂(化合物Ⅷ1-16)。向各反应容器内加入在CH2Cl2中的1%TFA并将容器振荡30分钟。从反应容器中将溶剂过滤到各个试管内。用CH2Cl2(2X)和MeOH(2X)洗各等份的树脂,并将滤液合并到各个试管内。真空蒸发各个试管,得到化合物Ⅸ1-16。步骤H.将各游离羧酸Ⅸ1-16溶解于DMF中。向各溶液内加入吡啶(1.05当量),然后再加入三氟乙酸五氟苯酯(1.1当量).将混合物室温搅拌45分钟。用EtOAc稀释溶液,用1M拧檬酸水溶液(3X)和5%NaHCO3溶液(3X)洗,在Na2SO4上干燥,过滤并真空蒸发,得到化合物Ⅹ1-16。
实施例2证明T-L-X的光裂解室温下用近紫外光照射实施例11中制备的T-L-X化合物7分钟。使用在350mm处有发射峰的Rayonett荧光紫外灯(Southern NewEngland Ultraviolet Co.,Middletown,CT)作为紫外光源。将灯放在离含样品平皿15cm距离处。SDS凝胶电泳显示在这些条件下85%以上的混合物被裂解。
实施例3制备荧光标记的引物和证明荧光团的裂解寡核苷酸的合成和纯化使用制造商提供的标准亚磷酰胺化学,或H-膦酸酯化学(GlennResearch Sterling,VA)在自动DNA合成仪上制备寡核苷酸(ODN)。适当封闭的dA、dG、dC和T亚磷酰胺是以这些形式从市场上购得的,并且可很容易地将合成的寡核苷转化成这种适当的形式。使用由制造商提供的标准亚磷酰胺,或H-膦酸酯化学制备寡核苷酸。使用标准方法寡核苷酸。使用12μm 300#Rainin(Emeryville,CA)Dynamax C-84.2×250反相柱以HPLC对带5′三苯甲基的寡核苷酸进行层析,使用0.1N Et3NH+OAc-(pH7.0)中的15%至55%MeCN梯度洗脱20分钟。当完成脱三苯甲基化时,进一步用凝胶排阻层析法纯化寡核苷酸。在碱性pH条件下用PRP柱(Alltech,Deerfield,IL)并用PAGE法分析检查寡核苷酸的质量。
2,4,6-三氯三嗪衍生的寡核苷酸的制备使10至1000μg 5′-末端胺连接的寡核苷酸与过量重结晶的氰尿酰氯在溶于碱性(最好pH8.3至8.5)缓冲液内的10%N-甲基吡咯烷酮中于19℃至25℃下反应30至120分钟。终反应混合物由0.15M硼酸钠(pH8.3)、2mg/ml重结晶的氰尿酰氯和500μg/ml各寡核苷酸组成。在G50Sephedex(Pharmacia,Piscataway,NJ)柱上经排阻层析除去未反应的氰尿酰氯。
然后使经过活化的如上纯化的寡核苷酸在室温下于0.15M硼酸钠(pH8.3)中与100倍过量的半胱胺反应1小时。在G50 Sephadex柱上经大小排阻层析除去未反应的半胱胺。然后使衍生的ODN与胺反应性荧光颜料反应。将所得到的ODN制备物分成3份,每份各与(a)20倍摩尔过量的德克萨斯红磺酰氯(Molecular Probes,Eugene,OR)、与(b)20倍摩尔过量的丽斯胺磺酰氯(MolecularProbes,Eugene,OR),(c)20倍摩尔过量的荧光素异硫氰酸酯反应。终反应条件是在0.15M硼酸钠(pH8.3)中于室温下反应1小时。在G50Sephadex柱上经大小排阻层析除去未反应的荧光颜料。
为了从寡核苷酸上裂解荧光颜料,将ODN调整到1×10-5摩尔,然后在TF(TF是0.01M Tris,pH7.0,5mM EDTA)中稀释(12,3倍稀释)。向100μl体积的ODN中加入25μl 0.01M二硫苏糖醇(DTT)。一组相同的对照物中不加DDT。将混合物室温下保温15分钟。在黑色微滴定板中检测荧光。从保温管中除去溶液(150μl)并放在黑色微滴定板(Dynatek Laboratories,Chantilly,VA)中。使用FluoroskanⅡ荧光计(Flow Laboratories,McLean,VA)直接读平板,其中使用495nm激光波长并监测520nm发射波来检测荧光素,使用591nm激发波长并监测612nm的发射波以检测德克萨斯红,并使用570nm激发波长并监测590nm发射波以检测丽丝胺。荧光团的摩尔数未裂解的裂解的游离的RFU RFU RFU1.0×105M6.4 1200 13453.3×106M2.4 451 4561.1×106M0.9 135 1303.7×107M0.3 44481.2×107M0.1215.3 16.04.1×107M0.144.9 5.11.4×108M0.132.5 2.84.5×109M0.120.8 0.9数据表明,当荧光团从ODN上裂解下来时,相对荧光约增加200倍。
实施例4制备标记的M13序列引物并证明标记的裂解制备2,4,6-三氯三嗪衍生的寡核苷酸1000μg 5′末端胺连接的寡核苷酸(5′-己胺-TGTAAAACGACGGCCAGT-3′)(Seq.ID No.1)与过量重结晶的氰尿酰氯在10%N-甲基吡咯烷酮碱性(较好pH8.3至8.5)缓冲液中19至25℃下反应30至120分钟。终反应条件由0.15M硼酸钠(pH8.3)、2mg/ml重结晶的氰尿酰氯和500μg/ml每种寡核苷酸构成。在G50 Sephadex柱上经大小排阻层析除去未反应的氰尿酰氯。
然后使活化的纯化的寡核苷酸与100倍过量的半胱胺在0.15M硼酸钠(ph8.3)中室温反应1小时。在G50 Sephadex柱上经大小排阻层析除去未反应的半胱胺。然后使衍生的ODN与各种酰胺反应。将所得的ODN制品分成12份,每份与(25摩尔过量)下列酸的五氟苯酯反应(1)4-甲氧基苯甲酸,(2)4-氟苯甲酸,(3)甲苯甲酸,(4)苯甲酸,(5)吲哚-3-乙酸,(6)2,6-二氟苯甲酸,(7)烟酸N-氧化物,(8)2-硝基苯甲酸,(9)5-乙酰水杨酸,(10)4-乙氧基苯甲酸,(11)肉桂酸,(12)3-氨基烟酸。反应在0.2M硼酸钠(pH8.3)中37℃进行2小时。在G50 Sephadex上经凝胶排阻层析纯化衍生的ODN。
为了从寡核苷酸上裂解掉标记,将ODN调整到1×10-5摩尔然后在TE(TE是0.01MTris,ph7.0,5mM EDTA)中用50%EtOH(VV)进行稀释(12,3倍稀释)。向100μl体积ODN中加入25μl 1M二硫苏糖醇(DTT)。一组同样的对照物中则不加DTT。室温下保温30分钟。然后加NaCl至0.1M并加入2体积EtOH以沉淀ODN。以14,000g于4℃下离心15分钟以除去溶液中的ODN。保留上清液,彻底干燥。然后将沉淀物溶解于25μl MeOH。以质谱检测法检测沉淀物中标记的存在。
用于本研究的质谱仪是外部离子源傅里叶变换质谱仪(FTMS)。使为MALDI分析所制备的样品沉积到直接探子的尖端并插入到离子源中。当激光脉冲照射样品时离子从该源中被抽提出来并通入长的四极离子导槽中,由此将它们聚焦并输送到位于超导磁铁中心孔内的FTMS分析仪小室中。
光谱产生如下信息。在下列分子量处强度从25到100相对强度单位变化的峰(1)指示4-甲氧基苯甲酸衍生物的212.1amu,(2)指示4-氟苯甲酸衍生物的200.1amu,(3)指示甲苯酸衍生物的196.1amu,(4)指示苯甲酸衍生物的182.1amu,(5)指示吲哚-3-乙酸衍生物的235.2amu,(6)指示2,6-二氟苯甲酸衍生物的218.1amu,(7)指示烟酸N-氧化物的199.1amu,(8)指示2-硝基苯甲酰胺的227.1amu,(9)指示5-乙酰水杨酸衍生物的179.18amu,(10)指示4-乙氧基苯甲酸衍生物的226.1amu,(11)指示肉桂酸衍生物的209.1amu,(12)指示3-氨基烟酸衍生物的198.1amu。
结果表明分子量(MV)鉴定剂从引物上被裂解下来并可用质谱法检测。
实施例5一组式R1-36-Lys(ε-1NIP)-ANP-Tfp化合物的制备图3举例说明平行合成一组36个T-L-X化合物(X=Lh),其中Lh是活化的酯(特别四氟苯基酯),L2是邻硝基苄胺基团,L3是连接Lh和L2的亚甲基基团,T具有其中赖氨酸的羧酸基团已连接到L2苄胺基团的氮原子上形成酰胺键的模式结构,且分子量可变成分R1-36(其中这些R基团相当于如本文定义的T2,并可通过本文所列出的任何一种特异性羧酸被导入)通过赖氨酸的α-氨基基团连接,而质谱灵敏度增强子基团(通过N-个基异哌啶甲酸导入的)则通过赖氨酸的ε-氨基基团结合。
参见图3步骤A.在ACT357的收集容器内用DMF悬浮NovaSyn HMP树脂(可购自NovaBiochem;1当量)。加入溶于DMF的化合物Ⅰ(得自ACT的ANP;3当量)、HATU(3当量)和NMM(7.5当量)并将收集容器振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗树酯。将Ⅰ偶联到树脂上并重复洗涤步骤,得到化合物Ⅱ。步骤B.将树脂(化合物Ⅱ)与DMF中的25%哌啶混合并振荡5分钟,过滤树脂与DMF中的25%哌啶混合并振荡10分钟。除去溶剂,用NMP(2X)、MeOH(2X)和DMF(2X)洗树脂,并直接用于步骤C。步骤C.将步骤B的去保护的树脂悬浮于DMF中并向其中加入DMF中的FMOC保护的在其侧链中含有被保护官能团的氨基酸(Fmoc-赖氨酸(Aloc)-OH,购自BeSeptive Biosystems;3当量)、HATU(3当量)和NMM(7.5当量)。将容器振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗树酯。将Fmoc-Lys(Aloc)-OH偶联到树脂上并重复洗涤步骤,以得到化合物Ⅳ。步骤D.用CH2Cl2(2X)洗树脂(化合物Ⅳ),然后悬浮在(PPh3)4Pd(0)(0.3当量)和PhSiH3(10当量)在CH2Cl2中的溶液中。将混合物振荡1小时。除去溶剂并用CH2Cl2(2X)洗树脂。重复钯处理步骤。除去溶剂并用CH2Cl2(2X)、溶于DMF中的N,N-二异丙基乙铵二乙基二硫代氨基甲酸酯(2X)、DMF(2X)洗树酯,得到化合物Ⅴ。步骤E.将步骤D得到的去保护的树脂与步骤C中所述的N-甲基异哌啶甲酸偶联,得到化合物Ⅵ。步骤F.用ACT357收集容器中的Fmoc保护的树脂Ⅵ等分到36个反应容器中,得到化合物Ⅵ1-36。步骤G.按步骤B中所述使树脂(化合物Ⅵ1-36)与哌啶反应,以除去FMOC基团。步骤H.将步骤G的36等份去保护的树脂悬浮于DMF中。向各反应容器中加入溶于DMF的适当的羧酸(R1-36CO2H;3当量)、HATU(3当量)和NMM(7.5当量)。将容器振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗各等份的树酯。将R1-36CO2H偶联到树脂上并重复洗涤步骤,以得到化合物Ⅷ1-36。步骤Ⅰ.用CH2Cl2(3X)洗各等份的树脂(化合物Ⅷ1-36)。向各反应容器内加入90∶5∶5的TFA∶H2O∶CH2Cl2并将容器振荡120分钟。将容剂从反应容器过滤到各个试管中。用CH2Cl2(2X)和MeOH(2X)洗等分的树脂并将滤液合并到各个试管内。在真空中蒸发各个试管,得到化合物Ⅸ1-36。步骤J.将各游离羧酸Ⅸ1-36溶解于DMF。向各溶液内加入吡啶(1.05当量),然后加入三氟乙酸四氟苯基酯(1.1当量)。室温下将混合物搅拌45分钟。用EtOAc稀释溶液,用5%NaHCO3水溶液(3X)洗,在Na2SO4上干燥,过滤和真空蒸发,得到化合物Ⅹ1-36。
实施例6一组式R1-36-Lys(ε-1NIP)-NBA-Tfp化合物的制备图4举例说明平行地合成一组36种T-L-X化合物(X=Lh),其中Lh是活化的酯(特别四氟苯基酯),L2是邻硝基苄胺基团,L3是连接Lh和L2之间的直接键,其中Lh直接连接到L2基团的芳环上。T具有其中赖氨酸的羧酸基团已被连接到L2苄胺基团氮原子上形成酰胺键的模式结构,且分子量可变的成分R1-36(其中这些R基团相当于如本文定义的T2,并可通过本文所列的任何一种特异性羧酸被导入)是通过赖氨酸的α氨基基团被结合的,而质谱增强子基团(通过N-甲基异哌啶甲酸被导入)则是通过赖氨酸的ε氨基基团结合的。
参见图4步骤A.按照实施例5的步骤A中所述的方法将NovaSyn HMP树脂偶联到化合物Ⅰ(按照Brown等,Molecular Diversity,1,4(1995))的方法制备的NBA)上,得到化合物Ⅱ。步骤B-J.按照实施例5的步骤B-J所述处理树脂(化合物Ⅱ),得到化合物Ⅹ1-36。
实施例7一组式1INP-LYs(ε-R1-36)-ANP-Tfp化合物的制备图5图解说明平行地合成一组36种T-L-X化合物(X=Lh),其中Lh是活化的酯(特别四氟苯基酯),L2是邻硝基苄胺基团,L3是连接Lh和L2的亚甲基基团,T具有其中赖氨酸的羧酸基团已被连接到L2苄胺基团之氮原子上形成酰胺键的模式结构,且分子量可变的成分R1-36(其中这些R基团相当于如本文定义的T2,并可通过本文所列的任何一种特异性羧酸被导入)是通过赖氨酸的α氨基基团结合的,而质谱增强子基团(通过N-甲基异哌啶甲酸被导入)则是通过赖氨酸的ε氨基基团结合的。
参见图5步骤A-C.同实施例5。步骤D.按实施例5的步骤B中所述用哌啶处理树脂(化合物Ⅳ),以除去FMOC基团。步骤E.步骤D中树脂上保护的α-胺与实施例5步骤C中描述的N-甲基异哌啶甲酸偶联,得到化合物Ⅴ。步骤F.同实施例5。步骤G.按实施例5步骤D所述用钯处理树脂,以除去Aloc基团。步骤H-J.按实施例7中所述的同样方法制备化合物Ⅹ1-36。
实施例8一组式R1-36-Glu(γ-DIAEA)-ANP-Tfp化合物的制备图6图解说明平行合成一组36个T-L-X化合物(X=Lh),其中Lh是活化的酯(特别四氟苯基酯),L2是邻硝基苄胺基团,L3是连接Lh和L2的亚甲基基团,T具有其中谷氨酸的羧酸基团已被连接到L2苄胺基团氮原子上形成酰胺键的模式结构,且分子量可变的成分R1-36(其中这些R基团相当于如本文定义的T2,并可通过本文所列的任何一种特异性羧酸被导入)是通过谷氨酸的α氨基基团被结合的,而质谱增强子基团(通过2-(二异丙氨基)乙胺导入的)则是通过谷氨酸的γ-羧酸结合的。参见图6步骤A-B.同实施例5。步骤C.按实施例5的步骤C中所述的偶联方法使去保护的树脂(化合物Ⅲ)偶联到Fmoc-Glu-(OAl)-OH上,得到化合物Ⅳ。步骤D.用CH2Cl2(2X)洗树脂(化合物Ⅳ)上的烯丙基酯并与(PPh3)4Pd(0)(0.3当量)和N-甲基苯胺(3当量)在CH2Cl2中的溶液混合。将混合物振荡1小时。除去溶剂并用CH2Cl2(2X)洗树脂。重复钯处理步骤。除去溶剂并用CH2Cl2(2X)、溶于DMF中的N,N-二异丙基乙铵二乙基二硫代氨基甲酸酯(2X)、DMF(2X)洗树酯,得到化合物Ⅴ。步骤E.将得自步骤D的去保护的树脂悬浮在DMF中并经混合HATU(3当量)和NMM(7.5当量)而活化。将容器振荡15分钟。除去溶剂并用NMP(1X)洗树脂。将树脂与2-(二异丙基氨基)乙胺(3当量)和NMM(7.5当量)混合。将容器振荡1小时。将2-(二异丙基氨基)乙胺偶联到树脂上并重复洗涤步骤,得到化合物Ⅵ。步骤F-J.同实施例5。
实施例9一组式R1-36-Lys(ε-1NIP)-ANP-Lys(ε-NH2)-NH2化合物的制备图7图解显示平行地合成一组36种T-L-X化合物(X=Lh),其中Lh是胺(特别是赖氨酸衍生残基的ε氨基基团),L2是邻硝基苄胺基团,L3是连接Lh和L2的氨甲酰取代的亚烷基氨基酰基亚烷基基团,T具有其中赖氨酸的羧酸基团已被连接到L2苄胺基团氨原子上形成酰胺键的模式结构,且分子量可变的成分R1-36(其中这些R基团相当于如本文定义的T2,并可通过本文所列的任何一种特异性羧酸被导入)是通过赖氨酸的α氨基基团结合的,而质谱增强子基团(通过N-甲基异哌啶甲酸被导入)则是通过赖氨酸的ε氨基基团结合的。参见图7步骤A.将Fmoc-Lys(Boc)-SRAM树脂(可得自ACT;化合物Ⅰ)与溶于DMF的25%哌啶混合并振荡5分钟。过滤树脂,然后与溶于DMF的25%哌啶混合并振荡10分钟。除去溶剂,用NMP(2X)、MeOH(2X)和DMF(2X)洗树脂,并直接用于步骤B中。步骤B.加入DMF中的树脂(化合物Ⅱ)、ANP(可购自ACT;3当量)、HATU(3当量)和NMM(7.5当量)并将收集容器振荡1小时。除去溶剂并用NMP(2X)、MeOH(2X)和DMF(2X)洗树脂。将Ⅰ偶联到树脂上并重复洗涤步骤,得到化合物Ⅲ。步骤C-J.按实施例7步骤B-Ⅰ所述方法处理树脂(化合物Ⅲ),得到化合物Ⅹ1-36。
实施例10一组式R1-36-Lys(ε-Tfa)-Lys(ε-IINP)-ANP-Tfp化合物的制备图8图解显示平行地合成一组36个T-L-X化合物(X=Lh),其中Lh是活化的酯(特别是四氟苯酯),L2是邻硝基苄胺基团且L3是连接Lh和L2的亚甲基,T具有其中第一个赖氨酸的羧酸基团已连接到L2苄胺基团氮原子上以形成酰胺键的模式结构,质谱灵敏度增强子基团(通过N-甲基异哌啶甲酸导入的)通过第一个赖氨酸的ε-氨基基团结合,第二个赖氨酸分子已通过第一个赖氨酸的α氨基基团被连接到第一个赖氨酸上,分子量调整基团(具有三氟乙酰结构)则是通过第二个赖氨酸的ε氨基基团结合的,并且分子量可变成分R1-36(这些R基团相当于本文定义的T2,并且可通过本文所示出的任何特异性羧酸被导入)通过第二个赖氨酸的α氨基基团被结合。参见图8步骤A-E.这些步骤与实施例5的步骤A-E完全相同。步骤F.按实施例5中步骤B所述方法用哌啶处理树脂(化合物Ⅵ),以除去FMOC基团。步骤G.使用实施例5的步骤C中所述的偶联方法将去保护的树脂(化合物Ⅶ)偶联到Fmoc-Lys(Tfa)-OH上,得到化合物Ⅷ。步骤H-K.按实施例5步骤F-J所述处理树脂(化合物Ⅷ),得到化合物Ⅸ1-36。
实施例11一组式R1-36-Lys(ε-1NIP)-ANP-5′-AH-ODN化合物的制备图9举例显示了平行地合成一组36个T-L-X化合物(X=MOI,MOI是核酸片段,ODN),该组化合物衍生于实施例7的酯(其中X是活化酯的其他T-L-X化合物可使用同样方法)。MOI通过磷酸二酯-亚烷基胺基团借MOI的5′端连接到T-L上。
参见图9步骤A.按照Van Ness等,核酸研究,19,3345(1991)中所述的改良的生物素化方法制备化合物Ⅻ1-36。向其中一种5′氨己基寡核苷酸(化合物Ⅺ1-36,1mg)在200mM硼酸钠(pH8.3,250ml)中的溶液内加入一种四氟苯基酯(得自实施例7的化合物Ⅹ1-36,在250ml NMP中100倍摩尔过量)。在室温下保温反应过夜。经Sephadex G50层析从化合物Ⅻ1-36中除去未反应的和水解的四氟苯基酯。
实施例12一组式R1-36-Lys(ε-1NIP)-ANP-Lys(ε-(MCT-5′-AH-ODN))-NH2化合物的制备图10举例显示平行地合成一组衍生于实施例11胺的36种T-L-X化合物(X=MOI,MOI是核酸片段,ODN)(可使用同样方法制备其X是胺的其他T-L-X化合物)。MOI通过磷酸二酯-亚烷基胺基团借MOI的5′端连接到T-L上。
参见图10步骤A.按Van Ness等,核酸研究,19,3345(1991)中描述的方法制备5′-[6-(4,6-二氯-1,3,5-三嗪-2-基氨基)己基]寡核苷酸Ⅻ1-36。步骤B.向5′-[6-(4,6-二氯-1,3,5-三嗪-2-基氨基)己基]寡核苷酸(化合物Ⅻ1-36)在100mM硼酸钠(pH8.3)中的1mg/ml浓度溶液加入100倍摩尔过量的选自R1-36-Lys(ε-iNIP)-ANP-Lys(ε-NH2)NH2的伯胺(实施例11中的化合物Ⅹ1-36)。室温下将溶液混合过夜。使用H2O作为洗涤溶液(3X)通过300MW截留值的膜(Amicon,Beverly,MA)超滤除去未反应的胺使体积减少到100ml以分离化合物ⅩⅢ1-36。
实施例13演示用质谱法同时检测多个标记本实施例描述质谱检测法同时检测多个化合物(标记)的能力。在该特定实施例中,将31种化合物与基质混合,沉积在固相载体上并干燥之,然后用激光解吸。将所得到的离子导入质谱仪中。
等摩量混合下列化合物(购自Aldrich,Milwaukee,WI)以达到0.002M的终浓度(每种化合物)苯甲酰胺(121.14)、烟酰胺(122.13)、吡嗪酰胺(123.12)、3-氨基-4-吡唑羧酸(127.10)、2-噻酚羧酰胺(127.17)、4-氨基苯甲酰胺(135.15)、甲苯酰胺(135.17)、6-甲基烟酰胺(136.15)、3-氨基烟酰胺(137.14)、烟酰胺N-氧化物(138.12)、3-羟吡啶酰胺(138.13)、4-氟苯甲酰胺(139.13)、肉桂酰胺(147.18)、4-甲氧基苯甲酰胺(151.17)、2,6-二氟苯甲酰胺(157.12)、4-氨基-5-咪唑羧酰胺(162.58)、3,4-吡啶二羧酰胺(165.16)、4-乙氧基苯甲酰胺(165.19)、2,3-吡嗪二羧酰胺(166.14)、2-硝基苯甲酰胺(166.14),3-氟-4-甲氧基苯甲酸(170.4)、吲哚-3-乙酰胺(174.2)、5-乙酰水杨酰胺(179.18)、3,5-二甲氧基苯甲酰胺(181.19)、1-萘乙酰胺(185.23)、8-氯-3,5-二氨基-2-吡嗪羧酰胺(187.59)、4-三氟甲基苯甲酰胺(189.00)、5-氨基-5-苯基-4-吡唑-羧酰胺(202.22)、1-甲基-2-苄基-丙二酸酯(207.33)、4-氨基-2,3,5,6-四氟基甲酰胺(208.11)、2,3-萘二羧酸(212.22)。将这些化合物以上述浓度放在DMSO中。然后将1μl材料与α-氰基-4-羟基肉桂酸基质(1∶10,000稀释之后)混合并沉积到固体不锈钢载体上。
然后使用Protein TOF质谱仪(Bruker,Manning Park MA)用激光照射以使材料解吸,并以线性和反射操作模式检测所得离子。观察到下列m/z值(图11)121.1-->苯甲酰胺(121.14)122.1-->烟酰胺(122.13)123.1-->吡嗪酰胺(123.12)124.1125.2127.3-->3-氨基-4-吡唑羧酸(127.10)127.2-->2-噻吩羧酰胺(127.17)135.1-->4-氨基苯甲酰胺(135.15)135.1-->甲苯酰胺(135.17)136.2-->6-甲基烟酰胺(136.15)137.1-->3-氨基烟酰胺(137.14)138.2-->烟酰胺N-氧化物(138.12)138.2-->3-羟吡啶酰胺(138.13)139.2-->4氟苯甲酰胺(139.13)140.2147.3-->肉桂酰胺(147.18)148.2149.24-甲氧基苯甲酰胺(151.17)152.22,6-二氟苯甲酰胺(157.12)158.34-氨基-5-咪唑-羧酰胺(162.58)163.3165.2-->3,4-吡啶-二羧酰胺(165.16)165.2-->4-乙氧基苯甲酰胺(165.19)166.2-->2,3-吡嗪二羧酰胺(166.14)166.2-->2-硝基苯甲酰胺(166.14)3-氟-4-甲氧苯甲酸(170.4)171.1172.2173.4吲哚-3-乙酰胺(174.2)178.3179.3-->5-乙酰水杨酰胺(179.18)181.2-->3,5-二甲氧萘苯甲酰胺(181.19)182.2-->
1-萘乙酰胺(185.23)186.2
8-氯-3,5-二氨基-2-吡嗪羧酰胺(187.59)188.2189.2-->4-三氟甲基-苯甲酰胺(189.00)190.2191.2192.35-氨基-5-苯基-4-吡啶-羧酰胺(202.22)203.2203.41-甲基-2-苯基-丙二酸酯(207.33)4-氨基-2,3,5,6-四氟苯甲酰胺(208.11)212.2-->2,3-萘二羧酸(212.22)219.3221.2228.2234.2237.4241.4数据表明31种化合物中有21种出现在预期质量的范围中,31化合物中有9种出现在超出预期质量范围有n+H质量(1个原子质量单位,amu)的范围中。后一种现象可能是由于化合物内胺的质子化作用。因此31种化合物均可用MALDI质谱法检测。更重要的是,该实施例证明可用质谱法同时检测多个标记。
单独α-氰基基质(图11)在146.2、164.1、172.1、173.1、189.1、190.1、191.1、192.1、212.1、224.1、228.0、234.3处产生峰。光谱中其他已鉴定的质量是由于所购买的化合物中因没有进一步纯化这些化合物而带的污染物。
实施例14微卫星标志PCR扩增使用下述标准PCR条件扩增微卫星标志。简单地说,在含有40ng基因组DNA、各50pmol引物、0.125mM dNTP和1单位Tag聚合酶的总体积50μl反应混合物中完成PCR反应。1X扩增缓冲液含有10mMTris碱,pH9,50mM KCl、1.5mM MgCl2、0.1% Tr.iton X-100和0.01%明胶。使用“热起始”程序进行反应在96℃5分钟第一次变性步骤后加入Tag聚合酶。经35次循环完成扩增变性(94℃,40秒)和退火(55℃,30秒)。最后一次退火后以延伸步骤(72℃,2分钟)终止扩增过程。因为将得到的扩增产物较短(90至350bp长)并且温度从55℃升高到94℃(以1℃/秒的上升率达到的)的时间间隔足够长,所以没有72℃的步骤即可完成DNA延伸。
从上文可以理解到,虽然本文已为举例说明的目的描述了本发明的特定实施方案,但可在不背离本发明的精神和范围的前提下作出各种改动。
权利要求
1.鉴定核酸分子的方法,其包括(a)从一个或多个选择的核酸分子产生标记的核酸分子,其中标记是与特定的核酸片段相互关联的;并且是可用非荧光光谱法或电位测定法检测的;(b)按大小分离标记的片段;(c)从标记的片段上裂解标记;以及(d)用非荧光光谱法或电位测定法检测标记,从而鉴定所述核酸分子。
2.检测选择的核酸分子的方法,其(a)在足以使标记的核酸探针与互补的选择的靶核酸序列杂交的条件下使标记的核酸探针与靶核酸分子结合足够长时间,其中标记的核酸探针是可用非荧光光谱法或电位测定法检测的;(b)改变杂交的标记探针的大小、未杂交的探针或靶分子的大小、或探针靶杂交体的大小;(c)按大小分离标记的探针;(d)从标记的探针上切掉标记;以及(e)用非荧光光谱法或电位测定法检测标记,从而检测选择的核酸分子。
3.根据权利要求1或2的方法,其中用质谱法、红外光谱法、紫外光谱法或恒电势电流测定法检测标记。
4.根据权利要求1的方法,其中产生4个以上标记的核酸片段,并且其中各个标记对于选择的核酸片段都是独特的。
5.根据权利要求2的方法,其中利用4个以上标记的核酸探针,并且其中各个标记对于选择的核酸片段都是独特的。
6.根据权利要求1或2的方法,其中所说的靶核酸分子是经引物延伸得到的。
7.根据权利要求2的方法,其中用选自聚合酶延伸、连接、核酸外切酶消化和核酸内切酶消化的方法改变所说的杂交的标记探针、未杂交的探针或靶分子、或探针靶杂交体的大小。
8.根据权利要求1或2的方法,其中用选自凝胶电泳、毛细管电泳、微通道电泳、HPLC、大小排阻层析和过滤的方法分离标记的分子。
9.根据权利要求1或2的方法,其中用选自氧化、还原、酸敏感性、碱敏感性、酶促、电化学、热和光敏感性方法裂解标记的分子。
10.根据权利要求1或3的方法,其中用飞行时间质谱、四极质谱、磁扇形场质谱和电扇形场质谱法检测标记。
11.根据权利要求10的方法,其中利用选自库仑检测器和电流检测器以恒电势电流测定法检测所说的标记。
12.根据权利要求1或2的方法,其中以连续方式完成分离、裂解和检测的步骤。
13.根据权利要求1或2的方法,其中在单一装置上以连续方式完成分离、裂解和检测步骤。
14.根据权利要求13的方法,其中分离、裂解和检测的步骤是自动化的。
15.根据权利要求1或2的方法,其中所说的标记的分子或探针是从5′标记的核苷酸终止子产生的。
16.根据权利要求1或2的方法,其中所说的标记的分子或探针是从标记的二脱氧核苷酸终止子产生的。
17.对选择的生物体进行基因型鉴定的方法,其包括(a)从选择的靶分子中产生标记的核酸分子,其中标记是与特定片段相互关联并可用非荧光光谱法或电位测定法检测的;(b)按序列长度分离标记的分子;(c)从标记的分子上裂解标记;以及(d)用非荧光光谱法或电位测定法检测标记,从而确定所说生物体的基因型。
18.对选择的生物体进行基因型鉴定的方法,其包括(a)在足以使标记分子与靶分子杂交的条件下使标记的核酸分子与选择的靶分子结合足够长时间,其中标记是与特定的片段相互关联并且可用非荧光光谱法或电位测定法检测的;(b)按序列的长度分离标记的片段;(c)从标记的片段上裂解标记;以及(d)用非荧光光谱法或电位测定法检测标记,从而确定生物体的基因型。
19.根据权利要求17或18的方法,其中标记的分子是从选自基因组克隆、cDNA克隆和RNA克隆的克隆集合体中产生的。
20.根据权利要求17或18的方法,其中所说的标记的分子是经聚合酶链反应产生的。
21.根据权利要求17或18的方法,其中用质谱法、红外光谱法、紫外光谱法或恒电势电流测定法检测标记。
22.根据权利要求17或18的方法,其中产生4个以上标记的核酸分子,并且其中各个标记对于选择的核酸片段都是独特的。
23.根据权利要求17或18的方法,其中所说的靶核酸分子是经引物延伸得到的。
24.根据权利要求17或18的方法,其中用选自凝胶电泳、毛细管电泳、微通道电泳、HPLC、大小排阻层析和过滤的方法分离标记的分子。
25.根据权利要求17或18的方法,其中用选自氧化、还原、酸敏感性、碱敏感性、酶促、电化学、热和光敏感性方法裂解标记的分子。
26.根据权利要求17或18的方法,其中用飞行时间质谱、四极质谱、磁扇形场质谱和电扇形场质谱法检测标记。
27.根据权利要求17或18的方法,其中利用选自库仑检测器和电流检测器以恒电势电流测定法检测所说的标记。
28.根据权利要求17或18的方法,其中以连续方式完成分离、裂解和检测的步骤。
29.根据权利要求17或18的方法,其中在单一装置上以连续方式完成分离、裂解和检测步骤。
30.根据权利要求17或18的方法,其中分离、裂解和检测的步骤是自动化的。
31.根据权利要求17或18的方法,其中所说的标记的分子是从非3′标记的寡核苷酸引物产生的。
32.根据权利要求17或18的方法,其中所说的标记的分子是从标记的二脱氧核苷酸终止子产生的。
33.根据权利要求1、2或17的方法,其中所说的标记的分子是从生物学样品中得到的。
34.含有下式的多个化合物的组合物Tms-L-MOI其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟中至少一种,以及选自氧、氮、硫、磷和碘的任选原子;L是允许从化合物的其余部分裂解掉含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自叔胺、季胺和有机酸;MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上,并且其中至少两个化合物具有同样的Tms,但这些分子的MOI基团具有不同的核苷酸长度。
35.包含有式多个化合物的组合物Tms-L-MOI其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟中至少一种,以及选自氧、氮、硫、磷和碘的任选原子;L是允许从化合物的其余部分裂解掉含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自叔胺、季胺和有机酸;MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上,并且其中至少两个化合物具有同样的Tms,但那些化合物具有不同的柱层析洗脱时间。
36.包含有下式的多个化合物的组合物Tms-L-MOI其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟中至少一种,以及选自氧、氮、硫、磷和碘的任选原子;L是允许从化合物的其余部分裂解掉含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自叔胺、季胺和有机酸;MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上,并且其中没有两个具有同样MOI核苷酸长度也具有同样的Tms的化合物。
37.权利要求34-36中任何一项的组合物,其中多个是大于2个。
38.权利要求34-36中任何一项的组合物,其中多个是大于4个。
39.权利要求34-36中任何一项的组合物,其中核酸片段具有互补于载体之一部分的序列,其中该片段能够引发多核苷酸合成。
40.权利要求34-36中任何一项的组合物,其中多个化合物之成员的Tms基团相差至少2amu。
41.权利要求34-36中任何一项的组合物,其中多个化合物之成员的Tms基团核差至少4amu。
42.包含多组化合物的组合物,每组化合物均具有下列通式Tms-L-MOI其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟中至少一种,以及选自氧、氮、硫、磷和碘的任选原子;L是允许从化合物的其余部分裂解掉含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自叔胺、季胺和有机酸;MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上,并且第一组化合物内的成员具有相同的Tms基团,但具有不同的MOI基团,其中MOI中有不同数目的核苷酸,且第一组内至少有10个成员,各组间Tms基团至少相差2amu。
43.根据权利要求42的组合物,其中多组是至少3组。
44.根据权利要求42的组合物,其中多组是至少5组。
45.包含多组化合物的组合物,各组化合物均具有下列通式Tms-L-MOI其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟中至少一种,以及选自氧、氮、硫、磷和碘的任选原子;L是允许从化合物的其余部分裂解掉含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自叔胺、季胺和有机酸;MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上,并且其中,一组内的化合物具有同样的洗脱时间,但有不同的Tms基团。
46.包含多个扩增引物对的基因型鉴定试剂盒,其中至少一个引物具有下列通式Tms-L-MOI其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟中至少一种,以及选自氧、氮、硫、磷和碘的任选原子;L是允许从化合物的其余部分裂解掉含Tms部分的有机基团,其中含Tms部分包括当化合物经受质谱分析时支持单一离子化带电状态的功能团,并选自叔胺、季胺和有机酸;MOI是核酸片段,其中L在MOI之3′末端以外的位置连接到MOI上,并且每个引物对与不同的基因座相结合。
47.根据权利要求46的试剂盒,其中多个是至少3个。
48.根据权利要求46的试剂盒,其中多个是至少5个。
全文摘要
公开了为各种核酸反应而特别设计的标记和接头,其适合于其中需要按大小分离核酸分子的各种核酸反应。
文档编号C07B61/00GK1212020SQ97192555
公开日1999年3月24日 申请日期1997年1月23日 优先权日1996年1月23日
发明者J·范尼斯, J·C·特邦, J·J·豪伯特, J·T·默利甘 申请人:拉普吉恩公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1