测定核酸分子序列的方法和组合物的制作方法

文档序号:451172阅读:345来源:国知局
专利名称:测定核酸分子序列的方法和组合物的制作方法
技术领域
本发明总地涉及测定核酸分子序列的方法和组合物,特别是涉及允许同时测定多个核酸序列的方法和组合物。
脱氧核糖核苷酸(DNA)测序是生物学的基本技术。其在分子生物学中起到核心作用,并且在生物学的其他方面起到迅速扩展的作用。人类基因组计划是旨在读出整个人类基因组密码的一项多国参予的工作。其为生物学中进行的最大项目,并已开始对医学产生了重要影响。发展成本低廉而快速的测序技术将会确保这一计划的成功。确实,NIH和人类基因组项目的DOE分支机构已资助了旨在改良测序技术的实质性工作,但没有对目前的实践产生实质性影响(Sulston和Waterston,自然(Nature)376:175,1995)。
在过去的二十年里,检测和分析核酸序列已形成了生物学研究的组成部分之一。这种方法与其他新的研究工具及方法学一起使科学家得以研究基因及基因产物,从而更好地了解这些基因的功能,以及发展新的治疗和诊断方法。
1977年建立了两种不同的DNA测序方法学,并且如今仍在使用。简单地说,Sanger(Proc.Natl.Acad.Sci(USA)74:5463,1977)描述的利用二脱氧终止子的酶学方法包括借助于DNA聚合酶从单股模板合成DNA链。Sanger测序方法依赖于这样的事实,即该二脱氧核苷酸(ddNTP)以某种方式作为正常脱氧核苷酸(即使以低效率)掺入到生长链中。然而,ddNTP不同于正常脱氧核苷酸(dNTP)在于它们缺乏链延伸所必需的3'-OH基团。当ddNTP掺入到DNA链中时,3'-羟基基团缺乏阻止了新的磷酸二酯键形成,并且DNA片段因ddNTP与模板DNA中的碱基互补而终止。Maxam和Gilbert方法(Maxam和Gilbert,Proc.Natl.Acad.Sci.(USA),74:560,1977)则是利用原DNA的化学降解方法(两种情况下DNA都必须是克隆的)。两种方法都产生从待测序之DNA片段中的特定的点开始并在每个碱基处终止的片段群体。每个片段的终止都取决于原始DNA片段内特定碱基的定位。用聚丙烯酰胺凝胶电泳法分离DNA片段并从凝胶的放射自显影图上读出DNA碱基(腺嘌呤、胞嘧啶、胸腺嘧啶、鸟嘌呤;也分别称为A、C、T、G)的次序。
大量DNA集合测序策略(Church和Kieffer-Higgins,科学(Science)24:185,1988)是新近出现的DNA测序方法之一。集合测序策略包括合并许多DNA模板(样品)并加工作为集合体的样品。为了在加工结束时分离序列信息,开始时将感兴趣的DNA分子连接到一组寡核苷酸“标记”上。合并标记的DNA分子、扩增并在96孔板中化学断裂。电泳分离合并的样品后,将DNA转移到固相载体上并与一系列特异性标记的寡核苷酸杂交。然后按原始集合体中有的标记数目,对这些膜进行相同数目次数的探查,在各组探查中产生与标准DNA测序方法相似的放射自显影图谱。因此每个反应和凝胶产生相当于从常规反应和凝胶所得数据量乘以所使用的探针数目的数据量。如果使用碱性磷酸酶作为报导酶,则可使用在化学发光检测程式中检测的1,2-二氧杂丁环底物。但这种集合策略的主要缺点是只能通过Southern转印测序凝胶并且对集合体中的每个克隆在该膜上进行一次杂交读出序列。
除了测序方法学的发展外,由于自动DNA测序工具的出现也加快了测序速度。简单地说,这些方法是使用荧光素标记的引物以代替其中使用放射标记成分的方法。荧光素染料被连接到测序引物或ddNTP终止子上。自动操作方法现已利用聚合酶链反应(PCR)技术,并导致线性扩增策略的发展。目前的商品测序工具允许在单一泳道上进行所有4个双脱氧终止子反应。每个双脱氧终止子反应由独特的荧光引物代表(每种类型的碱基一个荧光团A,T,C,G)。每个泳道只代表一个模板DNA(即DNA样品)。目前的凝胶允许在64个分立的泳道中电泳分离多达64个样品。用光照射凝胶泳道,然后检测从荧光团发射的光,从而检测不同的ddNTP终止的片段。每个电泳步骤长约4-6小时。每次电泳分离分辨约400-600个核苷酸(nt),因此每个测序仪每小时可测定6000nt序列。
还报道了使用质谱法研究核酸单体成分(Hignite,摘自《质谱的生物化学应用》,Waller和Darmer(编),Wiley-Interscience,第16章,pp.527,1972)。简单地说,对于较大的寡聚体,等离子体吸收检测长达14个碱基的被保护的合成寡核苷酸,以及长达4个碱基的未保护的寡核苷酸已取得了显著的早期成功。如检测蛋白质一样,已证明ESIMS也适用于寡核苷酸(Covey等,Rapid Comm.in Mass Spec.2:249-256,1988)。这些分子在溶液中是离子化的,在酸性桥接磷酸二酯和/或末端磷酸部分带有电荷,并且除钠加合物外,可在气相中产生多个带电的分子阴离子。
用普通的ddNTP技术测定小于100个碱基的DNA序列比测定较大的DNA模板更为复杂,因而有时要利用化学降解法。然而,化学分解方法需要大约50pmol放射活性32P末端标记的材料、6个化学步骤、电泳分离以及膜曝光。对于小的寡核苷酸(<14nt),联合使用电喷射离子化法(ESI)和傅立叶转化(FT)质谱法(MS)速度快得多,而且更敏感。以高(105)分辨率检测的带多个电荷之离子的解离产物代表连续断裂,借以在1分钟内提供亚皮摩尔量样品的全序列(Little等,J.Am.Chem.Soc.116:4893,1994)。为进行分子量检测,ESI/MS技术已扩展到检测更大的片段(Potier等,Nuc.Acids Res.22:3895,1994)。ESI/FTTMS技术似乎是传统测序方法和检测长100mer的核酸中定点突变的有价值的补充。最近已使用更敏感的ESI源获得了上样量为3×10-13摩尔的50mer序列的光谱数据。
以质谱技术检测DNA序列的其他手段是,其中用某元素的个别同位素标记,并在电泳分离混合物中不同大小的DNA后以质谱法分析不同的同位素(上述的其他方法是利用质谱的分辨率分离并检测不同长度的DNA寡核苷酸,故充其量也只是一种难以应用的建议)。下述所有方法均利用Sanger方法将测序引物转变成一系列多出1个核苷酸的不同长度的DNA片段。每个酶促合成的DNA分子都含有原始引物、目的DNA一部分的复制序列,以及二脱氧终止子。这就是说,产生的一组DNA分子都含有引物和彼此差一个残基的不同长度。
Bremen等人(生物质谱,New York,Elsevier,p.219,1990)描述了使用硫的4种稳定同位素作为DNA标记的方法,使人们能检测已用毛细管电泳法分离的DNA片段。使用ddNTP的α-硫代类似物,将单个硫同位素掺入到各个DNA片段中。因此可按照末端核苷酸独特地标记4种类型的DNA片段(以ddTTP、ddATP、ddGTP、ddCTP为末端的);例如,32S标记以A为末端的片段,33S标记G,34S标记C,36S标记T,并且混合在一起上样至电泳柱,由改良的喷墨指印机头得到几个皮升的层析级分,然后在燃烧炉中完全燃烧。该方法将被标记的DNA的硫代磷酸氧化成SO2,然后可在四极质谱或磁扇形场质谱仪中分析之。SO2的质量单位呈现在A结尾的片段为64,G为65,C为66,T为68。当DNA片段从柱中出现时,保持DNA片段的分辨率要取决于得到足够小的级分。因为质谱仪是直接与毛细管凝胶柱偶联的,所以分析的速率是由电泳速率决定的。不幸的是该方法花费很高、释放放射性气体,并且没有商品化。该方法还存在另外两个基本限制条件(a)不能耐受质量为64、65、66或68的其他成分(同量异序污染物),并且(b)硫同位素的百分天然丰度(32S为95.0,33S为0.75,34S为4.2,36S为0.11)控制着灵敏度和成本。因为32S是95%天然富有的,所以其他同位素必须富集到>99%才能除去污染的32S。天然丰度<1%的同位素要达到99%富集率费用是相当高的;即使36S被纯化100倍,其仍含有如36S的或多或少的34S。
Gilbert描述了由寡聚体合成仪、膜上的阵列、检测杂交的检测器及中央计算机组成的自动DNA测序装置(EPA 92108678.2)。合成仪合成并标记有任意推测之序列的多个寡聚体。使用寡聚体探测膜上固定的DNA。检测器识别杂交模式并将那些模式送入中央计算机,其构成一个序列并推测下一个寡聚体合成周期的序列。通过重复过程,可以自动方式获得DNA序列。
Brennen描述了基于寡聚体连接检测核酸序列的方法(美国专利No.5,403,708)。描述了形成与核酸模板杂交之连接产物的方法和组合物。引物与DNA模板杂交,然后寡核苷酸的随机延伸集合物也于连接酶存在下与引导模板杂交。连接酶将杂交的寡聚体共价连接到引物上。修饰后可以检测以N个核苷酸相间隔的核酸模板中第一组靶核苷酸残基之一个或多个成员的序列。在该方法中,形成标记的连接产物,其中掺入到连接产物中的标记的位置和类型可提供有关核酸模板中核苷酸残基的信息,标记的核苷酸残基与之碱基配对。
Koster描述了在用核酸外切酶降解DNA后以质谱仪测定DNA序列的方法(PCT/US94/02938)。所述的方法是一种直接检测DNA序列的简单方法(不使用Sanger反应)。将DNA克隆到标准载体中,固定5'末端,然后通过核酸外切酶在3'端顺序地降解,并以质谱法检测酶解产物(核苷酸)。
Weiss等人描述了用于荧光倍增DNA测序的自动杂交/影象装置(PCT/US94/11918)。该方法是基于酶联探针与含有由典型Sanger反应产生的按大小分离DNA片段的膜杂交这一思想而建立的。
目前对测序信息的客观需求大于由已有测序仪器如AB1377和Phormacia ALF所能提供的信息。现有技术的根本限制之一是可使用目前的标记系统分辨的标记的数目较小。上文讨论的Church集合系统使用更多的标记,但这些标记的使用和检测是很费时费力的。
本发明公开了可用于以比上述方法有更快的速度和更高的敏感性,并进一步提供其他相关优点的测定核酸分子序列的新的组合物及方法。
简单地说,本发明提供了测定核酸分子序列的方法、化合物、组合物、试剂盒及检测系统。本发明的一个方面是提供测定核酸分子序列的方法。该方法包括以下步骤(a)产生与选择的靶核酸分子互补的标记的核酸片段,其中标记物是与特定核苷酸相关联的,并且是可用非荧光光谱测定法和电位测定法检测的;(b)按顺序长度分离标记的片段;(c)从标记的片段上切掉标记物;以及(d)用非荧光光谱测定法或电位测定法检测标记物,从而确定核酸分子的序列。在优选实施方案中,用质谱法、红外光谱法、紫外光谱法及稳压电流分析法测定标记物。
另一个方面,本发明提供下列结构式的化合物Tms-L-X其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟中至少一种,并可包括选自氧、氮、硫、磷及碘的原子;L是可使含Tms的部分与化合物的其余部分裂解开的有机基团,其中含Tms的部分包括当化合物经受质谱检测时支持单一离子化带电状态的功能团,并且选自叔胺、季胺和有机酸;X是选自羟基、氨基、巯基、羧酸、卤代烷基的功能团,或活化或抑制该功能团与其他部分偶联之活性的衍生物,或者是核酸片段,其中在核酸片段3'末端以外的位置连接到L上;条件是该化合物不通过X连接到固相载体上,其质量不小于250道尔顿。
另一方面,本发明提供了包括多个式Tms-L-MOI之化合物的组合物,其中Tms是可用质谱法检测的有机基团,包含碳,氢和氟中至少一种,以及可包含选自氧、氮、硫、磷及碘的原子;L是允许含Tms的部分与化合物的其余部分裂解开的有机基团,其中含Tms的部分包括当化合物经受质谱检测时支持单一离子化荷电状态的功能团,并选自叔胺、季胺和有机酸;MOI是核酸片段,其中L在MOI的3'末端以外的位置被结合到MOI上;并且其中没有两个化合物有同样的Tms或同样的MOI。
另一个方面,本发明提供含有水和式Tms-L-MOI之化合物的组合物,式中Tms是可用质谱法检测的有机基团,包括碳,氢和氟中至少一种,以及还可含有选自氧、氮、硫、磷及碘的原子;L是允许含Tms的部分与化合物的其余部分裂解开的有机基团,其中含Tms的部分包括当化合物经受质谱检测时支持单一离子化荷电状态的功能团并选自叔胺、季胺和有机酸;且MOI是核酸片段,其中L在MOI的3'末端以外的位置被结合到MOI上。
另一个方面,本发明提供包括多组化合物的组合物,每组化合物都具有结构式Tms-L-MOI,其中Tms是可用质谱法检测的有机基团,包括碳,氢和氟中至少一种,并可包括选自氧、氮、硫、磷及碘的原子;L是可使含Tms的部分与化合物的其余部分裂解开的有机基团,其中含Tms的部分包括当化合物经受质谱检测时支持单一离子化带电状态的功能团,并且选自叔胺、季胺和有机酸;且MOI是核酸片段,其中L在MOI的3'末端以外的位置被结合到MOI上;其中在一组内,所有成员都具有相同的Tms基团,并且MOI片段具有可变长度,并以选自ddAMP、ddGMP、ddCMP和ddTMP的相同二脱氧核苷酸终止;并且其中各组之间,Tms基团相差至少2个原子质量单位(amu)。
另一方面,本发明提供包括如上文中所描述第一多组化合物,并与第二多组具有式Tms-L-MOI的化合物组合的组合物,式中Tms是可用质谱法检测的有机基团,包括碳,氢和氟中至少一种,以及还可含有选自氧、氮、硫、磷及碘的原子;L是允许含Tms的部分与化合物的其余部分裂解开的有机基团,其中含Tms的部分包括当化合物经受质谱检测时支持单一离子化带电状态的功能团并选自叔胺、季胺和有机酸;且MOI是核酸片段,其中L在MOI的3'末端以外的位置被结合到MOI上;并且其中第二多组内的所有成员都具有以选自ddAMP、ddGMP、ddCMP和ddTMP的同样二脱氧核苷酸终止的MOI序列;条件是存在于第一多组化合物中的二脱氧核苷酸与存在于第二多组化合物中的不是同样的二脱氧核苷酸。
在另一方面,本发明提供用于DNA测序分析的试剂盒。该试剂盒包括多个容器组,每个容器组包括至少5个容器,其中第一容器含有一种载体,第二、三、四和五个容器含有式Tms-L-MOI的化合物,其中Tms是可用质谱法检测的有机基团,包括碳,氢和氟中的至少一种,并可包括选自氧、氮、硫、磷及碘的原子;L是可使含Tms的部分与化合物的其余部分裂解开的有机基团,其中含Tms的部分包括当化合物经受质谱检测时支持单一离子化带电状态的功能团,并且选自叔胺、季胺和有机酸;且MOI是核酸片段,其中L在MOI的3'末端以外的位置被结合到MOI上;这样第二、第三、第四和第五容器的MOI是完全相同的并互补于该组容器内载体的一个部分,每个容器内Tms基团不同于试剂盒中的其他Tms基团。
在另一个方面,本发明提供用于测定核酸分子序列的系统。该系统包括分离标记的核酸片段的分离装置、从标记的核酸片段上裂解与特定核苷酸相关联的并可用电化学检测法检测的标记物的装置,以及稳压电流分析法的装置。
在本发明的其他实施方案中,在给定的反应内可同时利用4、5、10、15、20、25、30、35、40、50、60、70、80、90、100、200、250、300、350、400、450或多于500个不同的且独特的标记的分子,其中每个标记对于选择的核酸片段、探针或第一式第二成员都是独特的,并且是可以分别鉴定的。
在参见下列详细描述和附图后可进一步理解本发明的这些和其他方面。此外,下文所列的参考文献中都更详细地描述了某些方法或物质(如质粒等),因此均以其全文引入本文作为参考。


图1显示合成可化学裂解的质谱检测标记物的五氟苯基酯(以释放出带羧基酰胺末端的标记)的流程。
图2显示合成可化学裂解的质谱检测标记物的五氟苯基酯(以释放带羧酸末端之标记)的流程。
图3-6和8显示合成一组36个光化学可裂解之质谱标记的四氟苯基酯的流程。
图7显示合成一组36个末端为胺的光化学可裂解之质谱标记物的流程。
图9显示从相应的一组36个光化学可裂解之质谱标记酸的四氟苯基酯制得的36个光化学可裂解的质谱标记的寡核苷酸的合成反应步骤。
图10显示从一组36个末端为胺的光化学可裂解之质谱标记物制得的36个光化学可裂解的质谱标记寡核苷酸的合成反应流程。
图11举例显示用质谱法同时检测多个标记。
图12显示单独α-氰基基体的质谱图。
图13显示模式构建的标记的核酸片段。
简单地说,本发明的一个方面提供其中感兴趣的分子或其前体通过不稳定键与标记物连接的化合物。因此,本发明的化合物可用下列结构通式表示T-L-X其中T是标记部分,L是作为或含有不稳定键的接头部分,X是感兴趣的分子(MOI)部分或可供以使MOI结合到T-L上的功能团部分(Lh)。因此本发明的化合物可由下列更特异的通式代表T-L-MOI和T-L-Lh出于如下详细描述的原因,可特意使几组T-L-MOI经受使不稳定键断裂的条件,而从化合物的其余部分上释放出标记部分。然后用一种或多种分析技术鉴定标记部分的特征,从而提供有关标记部分结构的直接信息以及(更重要的)相应的MOI鉴定的间接信息。
作为本发明有代表性的其中L为直接键的化合物的一个简单实例,可参见下列结构(ⅰ)
在结构(ⅰ)中,T是连接到羰基基团上的合氮多环芳族残基,X是MOI(更具体地讲为以胺基团为末端的核酸片段),并且L是形成酰胺基团的键。相对于T中的键来说,如本领域所知,酰胺键是不稳定的,酰胺键可受到不影响标记部分内键的酸或碱性条件的化学裂解(断裂)。因此,可按下示方式释放出标记部分(即含有T的裂解产物)
然而,接头L可能不只是如上实例中所示的直接键,在此可参见本发明的另一个具有下示结构(ⅱ)的代表性化合物
已知具有邻位硝基苄胺残基(见结构(ⅱ)内加方框的部分)是光解不稳定的,在这些化合物暴露于特定波长的光化幅射时将引起苄胺键的选择性裂解(参见结构(ⅱ)中标有加重线的键)。因此,结构(ⅱ)具有与结构(ⅰ)相同的T和MOI基团,但接头基团含有多个原子和键,其中有一特殊的不稳定键。因此如下所示,结构(ⅱ)的光解可从化合物的其余部分释放出标记部分(含T部分)。
因此本发明提供这样的化合物,即在其遇有适当的裂解条件后经受裂解反应,从而从化合物的余留部分释放出标记部分。可用标记部分、MOI(或其前体,Ln)以及将两个基团连接在一起的不稳定键来描述本发明的化合物。或者,可用形成化合物的各个组分来描述本发明的化合物。因此可将本发明的化合物描述为如下所述的标记反应物、接头反应物和MOI反应物。
标记反应物由化学柄(Th)和可变部分(Tvc)组成,因而标记反应物可视为具有下列通式结构Tvc-Th为了举例说明这一通式,可参见结构(ⅲ),其显示可用于制备结构(ⅱ)化合物的标记反应物。如下所示,具有结构(ⅲ)的标记反应物含有标记可变部分和标记柄结构(ⅲ)
在结构(ⅲ)中,标记柄(-C(=O)-A)简单地提供一个使标记反应物与接头反应物反应形成T-L部分的通路。结构(ⅲ)中的基团“A”表示羧基基团处于化学活性状态,所以其很容易与其他柄偶联。例如“A”可以是羟基或五氟苯氧基和许多其它基团。如下文详述的,本发明提供很多可与标记可变部分结合的可能的标记柄。因此标记可变部分是式T-L-X中“T”的一部分,并且也将是从裂解L的反应所形成的标记部分的一部分。
也如下文详细讨论的,因为在按照本发明制备各组化合物中,期望每组的成员有独特的可变部分,所以如此命名标记可变部分,从而得以用分析技术将个个成员彼此区分开。作为一个例子,结构(ⅲ)的标记可变部分可以是可根据紫外或质谱区分开的下列一组中的成员
同样,接头反应物可用其侧翼连接有接头不稳定组分的化学柄(至少需要两个,每个都称为Lh)来描述,其中接头不稳定组分由要求的不稳定部分(L2)和可能存在的不稳定部分(L1和L3)组成,此时可能存在的不稳定部分可有效地用于将L2与柄Lh分开,并且必要的不稳定部分则用于在接头不稳定组分内提供不稳定键。因此,接头反应物可视为具有下列通式Lh-L1-L2-L3-Lh可就结构(ⅳ)来举例说明用于描述接头反应物的通式,结构(ⅳ)也是从结构(ⅱ)的化合物得出的
如在结构(ⅳ)中示例的那样,原子可以起到一种以上的功能作用。因此在结构(ⅳ)中,苄基氮在允许接头反应物通过酰胺形成反应连接到标记反应物上的过程中发挥化学柄的功能,并且在继后还可作为不稳定部分L2的必要结构部分,其中苄基碳-氮键对光裂解是特别敏感的。结构(ⅳ)也说明接头反应物虽没有L1基团,但可能有L3基团(此处为亚甲基)。同样,接头反应是可以有L1基团但没有L3基团,或者可以有L1和L3基团,或者可以没有L1也没有L3基团。在结构(ⅳ)中,存在靠近羰基基团的基团“P”,表明羰基基团是受到保护不参予反应的。给定这一构型,标记反应物(ⅲ)的活化的羰基基团即可彻底地与接头反应物(ⅳ)的胺基团反应,以形酰胺键并得到式T-L-Lh的化合物。
MOI反应物是感兴趣分子的适当反应活性形式。其中感兴趣的分子是核酸片段,适当的MOI反应物是通过其5'羟基基团结合到磷酸二酯基团上,然后结合到以氨基基团终止的亚烷基链上的核酸片段。然后该氨基基团与结构(ⅳ)的羰基基团反应(当然是在使羰基去保护之后,并且最好是在继后活化羰基基团以有利于与胺基团反应之后),从而使MOI连接到接头上。
当以时间先后次序考虑时,本发明可看作是用标记反应物(具有化学标记柄和标记可变部分)、接头反应物(具有两个化学接头柄、要求的不稳定部分及0-2个可能存在的不稳定部分)以及MOI反应物(具有感兴趣的分子组分和感兴趣分子的化学柄)形成T-L-MOI。因此,为了形成T-L-MOI,首先使标记反应物和接头反应物一起反应以提供T-L-Lh,然后使MOI反应物与T-L-Lh反应以提供T-L-MOI,或者(较不优选)首先使接头反应物和MOI反应物一起反应以提供Lh-L-MOI,然后使Lh-L-MOI与标记反应物反应以提供T-L-MOI。为方便起见,从可用于形成这类化合物的标记反应物、接头反应物及MOI反应物的角度来描述式T-L-MOI的化合物。当然,也可用其他(通常是更麻烦的)方法来制备式T-L-MOI的同样化合物,并落入本发明T-L-MOI化合物的范围之内。
在任何情况下,本发明都使T-L-MOI化合物在经受裂解条件时从化合物其余部分中释放出标记部分。标记部分将至少包括标记可变部分,并且典型地还包括来自标记柄的某些或所有原子,来自被用于将标记反应物连接到接头反应物上的接头柄的某些或所有原子,任选的不稳定部分L1(如果该基团存在于T-L-MOI中时),并将可能含有取决于L2之精确结构和裂解化学性质的必要不稳定部分L2的某些部分。为方便起见,标记部分可称为含T部分,因为T一般将构成标记部分的主要部分(按质量计)。
在给出关于本发明一个方面的导论后,下文将详细描述T、L和X各组分。这一描述是以某些术语的下述定义开始的,这些定义将在下文中用于描述T、L和X。
本文所用的术语“核酸片段”是指与选择的核酸分子互补的(即互补于其全部或部分),并可衍生于天然或合成或重组产生的分子,包括非天然存在的分子,有时可以是双链或单链形式的;并包括寡核苷酸(如DNA或RNA)、引物、核酸类似物(如PNA)、借助聚合酶以5'至3'方向延伸的寡核苷酸、化学或酶促裂解的核酸、以二脱氧终止子终止的或在3'或5'末端带帽以防止在5'或3'末端聚合的核酸,以及这些形式的组合。核酸片段与选择的靶核酸分子互补一般是指在整个片段长度上表现有至少约70%特异碱基配对。核酸片段较好表现有至少约80%特异性碱基配对;最好至少约90%。确定百分错配(从而百分特异碱基配对)的方法是本领域已知的,并且是基于参照全碱基配对时作为Tm函数的百分错配。
本文所使用的术语“烷基”,无论单独或联合的,均指含有1-10,较好1-6个,最好1-4个碳原子的饱和直链或支链烃残基。这类残基的例子包括但不只限于甲基、乙基、正丙基、异丙基、正丁基、异丁基、仲丁基、叔丁基、戊基、异戊基、己基、癸基等。术语“亚烷基”是指饱和的含有1-10个,较好1-6个,最好1-4个碳原子的直链或支链烃二基。这样的残基的例子包括但不只限于亚甲基、亚乙基(-CH2-CH2-)、亚丙基等。
术语“链烯基”(单独或结合的)是指在总共2-10个,较好2-6个,最好2-4个碳原子链中至少有1个碳-碳双链的直链或支链烃基。这样的基团的例子包括但不只限于乙烯基、E和Z-丙烯基、异丙烯基、E-和Z-丁烯基、E-和Z-异丁烯基、E-和Z-戊烯基、癸烯基等。术语“亚链烯基”是指在总共2-10个,较好2-6个,最好2-4个碳原子链中至少有1个碳-碳双键的直链或支链烃双基。这样的双基的例子包括但不只限于次甲基(=CH2),亚乙烯基(-CH=C-)、亚丙烯基(-CH2-CH=CH-)等。
术语“炔基”,无论单独或组合使用,均指在总共2-10个,较好2-6个,最好2-4个碳原子链中至少有1个碳-碳三键的直链或支链烃残基。这样的残基的例子包括但不只限于乙炔基、丙炔基(炔丙基)、丁炔基、己炔基、癸炔基等。术语“亚炔基”单独或联合使用均指总共有2-10个,较好2-6个,最好2-4个碳原子的链中至少有1个碳一碳三键的直链或分支链烃双基。这样的双基的例子包括但不只限于亚乙炔基(-C≡C-)、亚丙炔基(-CH2-C≡C-)等。
术语“环烷基”(单独或组合的)是指含3至8个,较好3至6个碳原子的饱和的环形的碳原子排列。这样的环烷基残基的例子包括但不只限于环丙基、环丁基、环戊基、环己基等。术语“环亚烷基”是指环烷基的双基形式。
术语“芳基”是指(整个由碳和氢组成)选自苯基、萘基、茚基、2,3-二氢化茚基、薁基、芴基和蒽基的碳环芳香基团;或选自呋喃基、噻吩基、吡啶基、吡咯基、噁唑基、噻唑基、咪唑基、吡唑基、2-吡唑啉基、吡唑烷基、异噁唑基、异噻唑基、1,2,3-噁二唑基、1,2,3-三唑基、1,3,4-噻二唑基、哒嗪基、嘧啶基、吡嗪基、1,3,5-三嗪基、1,3,5-三噻烷基、中氮茚基、吲哚基、异吲哚基、3H-吲哚基、二氢吲哚基、苯并[b]呋喃基、2,3-二氢苯并呋喃基、苯并[b]噻吩基、1H-吲唑基、苯并咪唑基、苯并噻唑基、嘌呤基、4H-喹嗪基、喹啉基、异喹啉基、噌啉基、2,3-二氮杂萘基、喹唑啉基、喹喔啉基、1,8-二氮杂萘基、喋啶基、咔唑基、吖啶基、吩嗪基、吩噻嗪基和吩噁嗪基的杂环芳香基团。
本申请中限定的“芳基”基团可独自含有1至4个取代基,其独立地选自氢、卤素、羟基、氨基、硝基、三氟甲基、三氟甲氧基、烷基、链烯基、炔基、氰基、羧基、烷氧羰基、1,2-二氧亚乙基、烷氧基、链烯氧基或炔氧基、烷基氨基、链烯基氨基、炔基氨基、脂族或芳族酰基、烷氧羰基氨基、烷基磺酰氨基、吗啉代羰基氨基、硫代吗啉代羰基氨基、N-烷基胍基、芳烷氨基磺酰基;芳烷氧基烷基;N-芳烷氧基脲;N-羟基脲;N-链烯基脲;N,N-(烃基,羟基)脲;杂环基;硫代芳氧基取代的芳基;N,N-(芳基、烷基)肼基;Ar'取代的磺酰基杂环基;芳烷基取代的杂环基;环烷基和环烯基取代的杂环基;环烷基缩合的芳基;芳氧基取代的烷基;杂环基氨基;脂族或芳族酰基氨基羰基;脂族或芳族酰基取代的链烯基;Ar'取代的氨基羰基氧基;Ar',Ar'-二取代的芳基;脂族或芳族酰基取代的酰基;环烷基羰基烷基;环烷基取代的氨基;芳氧基羰基烷基;二氨基磷酸或酯。
“Ar”是具有1至3个取代基的如上文定义的碳环或杂环芳基,所述取代取选自氢、卤素、羟基、氨基、硝基、三氟甲基、三氟甲氧基、烷基、链烯基、炔基、1,2-二氧亚甲基、1,2-二氧亚乙基、烷氧基、链烯氧基、炔氧基、烷氨基、链烯基氨基或炔基氨基、烷基羰氧基、脂族或芳族酰基、烷基羰基氨基、烷氧基羰基氨基、烷基磺酰氨基、N-烷基或N,N-二烷基脲。
术语“烷氧基”单独或联合均指烷基醚残基,其中术语“烷基”定义同上。适当的烷基醚残基的例子包括但不只限于甲氧基、乙氧基、正丙氧基、异丙氧基、正丁氧基、异丁氧基、仲丁氧基、叔丁氧基等。
术语“链烯氧基”单独或联合均指式链烯基-O-的残基,其中术语“链烯基”定义同上,但条件是该残基不是烯醇醚。适当的链烯氧基残基的例子包括但不只限于烯丙氧基、E-和Z-3-甲基-2-丙烯氧基等。
术语“炔氧基”单独或合用均指式炔基-O-的残基,其中术语“炔基”定义同上,但条件是该残基不是炔醇醚。适当的炔氧基残基的例子包括但不只限于炔丙氧基、2-丁炔氧基等。
术语“硫代烷氧基”是指式烷基-S-的硫醚残基,其中烷基定义同上。
术语“烷基氨基”单独或联合使用均指单一或二烷基取代的氨基残基(即式烷基-NH-或(烷基)2-N-的残基),其中术语“烷基”定义同上。适当的烷基氨基残基的例子包括但不只限于甲氨基、乙氨基、丙氨基、异丙氨基、叔丁氨基、N,N-二乙氨基等。
术语“链烯氨基”单独或联合均使用均指式链烯基-NH-或(链烯基)2N-的残基,其中术语“链烯基”定义同上,但条件是该残基不是烯胺。这样的链烯基氨基残基的例子是烯丙氨基残基。
术语“炔氨基”单独或联合使用均指式炔基-NH-或(炔基)2N-的残基,其中术语“炔基”定义同上,但条件是该残基不是炔胺。这样的炔氨基残基的例子是炔丙氨基残基。
术语“酰胺”是指-N(R1)-C(=O)-或-C(=O)-N(R1)-,其中R1定义为包括氢及其他基团。术语“取代的酰胺”是指其中R1不是氢的状态,而术语“未取代的胺”是指其中R1是氢的状态。
术语“芳氧基”单独或联合使用均指式芳基-O-的残基,其中芳基定义同前。芳氧基残基的例子包括但不只限于苯氧基、萘氧基、吡啶氧基等。
术语“芳氨基”单独或联合使用均指式芳基-NH-的残基,其中芳基的定义同上所述。芳氨基的例子包括但不只限于苯氨基(苯胺基)、萘氨基、2-,3-和4-吡啶氨基等。
术语“芳基缩合的环烷基”单独或联合使用均指与芳基残基分享两个相邻原子的环烷基残基,其中术语“环烷基”和“芳基”定义同上。芳基缩合的环烷基残基的例子是与苯缩合的环丁基残基。
术语“烷基羰基氨基”单独或联合使用均指式烷基-CONH的残基,其中术语“烷基”定义同上。
术语“烷氧基羰基氨基”单独或联合使用均指式烷基-OCONH-的残基,其中术语“烷基”定义同上。
术语“烷基磺酰氨基”单独或联合使用均指式烷基-SO2NH-的残基,其中术语“烷基”定义同上。
术语“芳磺酰氨基”单独或联合使用均指式芳基-SO2-NH-的残基,其中术语“芳基”的定义同上所述。
术语“N-烷基脲”单独或联合使用均指式烷基-NH-CO-NH-的残基,其中术语“烷基”定义如上。
术语“N-芳基脲”单独或联合使用均指式芳基-NH-CO-NH-的残基,其中术语“芳基”定义同上。
术语“卤素”单独或结合使用是指氟、氯、溴和碘。
术语“烃残基”是指只需要一个氢原子就可以成为独立的稳定分子的碳和氢的排布。因此,烃残基在一个碳原子上有一个开放化合价位点,通过该位点烃残基可结合到其他原子上。烃基的例子有烷基、链烯基、炔基、环烷基等。
术语“烃双基”是指只需要两个氢原子就可以成为独立的稳定分子的碳和氢的排布。因此,烃双残基在一个或两个碳原子上有两个开放化合价位点,通过该位点烃残基可结合到其他原子上。烃双基的例子有亚烷基、亚链烯基、亚炔基、亚环烷基等。
术语“烃基”是指具有单一价位点整个由碳和氢组成的任何稳定排布,借助价位点其结合到另一个部分上,因此包括烷基、链烯基、炔基、环烷基、环链烯基、芳基(没有杂原子掺入芳环中)、芳烷基、烷芳基等。烃残基也称为烃基。
术语“亚烃基”是指具有两个价位点整个由碳和氢组成的任何稳定的排布,借助价位点使之结合到其他部分上的,因此该术语包括亚烷基、亚链烯基、亚炔基、亚环烷基、亚环链烯基、亚芳基(没有杂原子掺入到亚芳环中)、芳基亚烷基、烷基亚芳基等。烃双基也称为亚烃基。
术语“烃基-O-亚烃基”是指结合到氧原子上的烃基基团,其中氧原子同样也在两个使亚烃基基团结合到其他部分上的价位点之一处结合到亚烃基基团上。术语“烃基-S-亚烃基”、“烃基-NH-亚烃基”和“烃基-酰胺-亚烃基”具有等同的含义,只所说的氧分别代之以硫、-NH-或酰胺基团。
术语“N-(烃基)亚烃基”是指其中两个价位点之一结合到氮原子上,并且氮原子同时结合到氢和烃基基团上的亚烃基基团。术语“N,N-二(烃基)亚烃基”是指其中两个价位点之一结合到氮原子上,并且氮原子同时结合到两个烃基基团上的亚烃基基团。
术语“烃酰基-亚烃基”是指通过酰基(-C(=O)-)基团结合到亚烃基基团的两个价位点之一上的烃基基团。
术语“杂环烃基”和“杂环基”是指包括碳原子和多达4个的选自氧、氮、磷和硫和原子(称为杂原子)的稳定的环形排布。环排布可以是3-7个原子的单环形式的,或者是8-11个原子的双环形式的。环可以是饱和或未饱和的(包括芳香环),并且可以是或不是苯缩合的。环中的氮和硫原子可以是任何氧化形式的,包括季铵化形式的氮。杂环烃基可以在任何内环碳或杂原子处连接从而产生稳定的结构。优选的杂环烃基包括含有1或2个氮杂原子的5-7元单环杂环。
取代的杂环烃基是指上文限定的杂环烃基,其中至少其一个环原子结合到伸出环的指定的取代基上。
就烃基和亚烃基基团而言,术语“任何其中一个或多个氢被相等数目的氟取代的前述基团的衍生物”是指含有碳、氢和氟子,但不含其他原子的分子。
术语“活化的酯”是含有可很容易被亲核试剂如胺、醇或硫醇亲核试剂取代的“离去基团”的酯。这样的离去基团是已知的,并包括而不限于N-羟基琥珀酰亚胺、N-羟基苯并三唑、卤素(卤离子)、包括四氟苯氧基在内的烷氧基、硫代烷氧基等。术语“被保护的酯”是指被蔽避的或以其它方法致无反应性的酯基(如参见Greene,“有机合成中的保护基团”)。
考虑到上述定义,本领域技术人员可很容易地理解本申请全文中所使用的其他化学术语。这些术语可以单独使用或以其任何组合方式使用。残基的优选的或更优选的链长度适用于所有这些组合。A.标记的核酸片段的产生如上文提到的,本发明的一个方面提供用于DNA测序的一般方案,其允许在每个泳道中使用16个以上的标记;进行连续检测,可以检测标记并且如基于荧光的常规测序一样,在按大小分离时读出序列。该方案可适用于基于标记分子的大小分离的任何DNA技术。以下更详细地讨论用于本发明的适当标记和接头,以及测定核酸序列的方法。
1.标记本文使用的术语“标记”一般是指用于专门鉴定“感兴趣的分子”的化学部分,特别是指标记可变部分以及标记反应物、标记组分和标记部分的可能与之紧密结合的部分。
可用于本发明的标记具有以下几个特性1)其能够与所有其他标记分开。与其他化学部分的这种区别可能是基于标记的色谱行为(特别是在裂解反应之后)、其光谱或电势性质或其某些组合。可用于区分标记的光谱方法包括质谱(MS)、红外(IR)、紫外(UV)及荧光,其中优选的是MS、IR和UV,并且MS是最优选的光谱法。电势电流法是优选的电势检测法。
2)当以10-22至10-6摩尔存在时即可检测标记。
3)标记具有化学柄,通过该柄其可连接到MOI上,借以专门地鉴定之。连接可以是直接连到MOI上,或通过“接头”基团连接到MOI上。
4)标记对于所有其经受的操作,包括与MOI连接或与之裂解开,以及对其所连接的MOI的任何操作都是化学上稳定的。
5)标记对于其所连接的MOI上进行的操作无明显干扰。例如,如果标记是连接到寡核苷酸上,标记必须是对涉及寡核苷酸的任何杂交或酶促反应(例如PCR测序反应)都没有明显干扰的。同样,如果标记是连接到抗体上,则它必须对该抗体的抗原识别没有明显的干扰。
欲用某些光谱或电势测定法检测的标记部分应具有提高该方法之检测敏感性和特异性的性质。典型地,标记部分将具有那些性质,因为这些性质已被设计到标记可变部分中,其一般将构成标记部分的主要部分。在下面的讨论中,使用“标记”一词一般是指标记部分(即含有标记可变部分的裂解产物),但也可以为是指标记可变部分本身,因为其为负责提供标记部分中特异可检测性质的那部分。在式T-L-X的化合物中,“T”部分将含有标记可变部分。标记可变部分已被设计成可用例如质谱法鉴定的成分,这样T-L-X的“T”部分便可称为Tms。同样,含有T的T-L-X的裂解则可称为含Tms的部分。可用下述质谱和电势测定法鉴定含Tms部分的性质。
a.MS标记的特征当标记可用质谱法分析时(即为MS可读的标记,本文也称之为MS标记或“含Tms部分”),标记的基本特征是其能够被离子化。因此在设计MS可读标记中,于其中掺入可在MS中的离子化条件下携带正电荷或负电荷的化学功能团是一个优选要素。这一特征是提供改善的离子形成效率以及检测的更大总体灵敏度,特别是在电喷射离子化过程中。支持离子化电荷的化学功能团可来自Tms或L或这两者。例如Sunner,J.等人(Anal.Chem,60:1300-1307(1988))描述了可提高质谱法检测分析物的相对灵敏度的因素。
有利于携带负电荷的优选的功能团是有机酸,如酚式羟基、羧酸、膦酸、磷酸、三唑、磺酰脲、全氟醇和磺酸。
有利于在离子化条件下带正电荷的优选的功能团是脂族或芳香胺。赋予MS标记以提高的可检测性的胺功能团包括季铵类(即具有4个键,每个都连到碳原子上的胺,参见Aebersold,美国专利No.5,240,859)和叔胺(即有各自连到碳原子上的3个键的胺,其包括例如存在于吡啶中的C=N-C基团,参见Hess等人,Anal.Biochem,224:373,1995;Bures等人,Anal.Biochem.224:364,1995)。特别优选的是位阻季胺。叔胺和季铵可以是烷基或芳基胺。含Tms部分必须带有至少一个可离子化基团,但也可具有一个以上的可离子化基团。优选的电荷状态是每个标记都是单一离子化的。因此,最好是每个含Tms部分(及每个标记可变部分)都只含有单一的位阻胺或有机酸基团。
可形成含Tms部分之一部分的适当的胺残基包括下示基团
用质谱法鉴定标记较好是基于其分子质量对电荷的比例(m/z)。MS标记的优选分子质量范围是从大约100至2000道尔顿,含Tms部分较好有至少约250道尔顿的质量,更好至少约300道尔顿,最好至少约350道尔顿。质谱法一般难于区分具有低于约200-250道尔顿之母离子的残片(取决于精密设备),因此本发明的含Tms部分最好有大于上述范围的质量。
如上面解释的,含Tms部分可含有存在于标记可变部分中的原子以外的原子,并确实不存在可Tms本身中的原子。因此,Tms本身的质量可小于约250道尔顿,只要含Tms部分具有至少约250道尔顿的质量即可。因此,Tms的质量范围可为15(即甲基)至约10,000道尔顿,较好是100至大约5,000道尔顿,最好是大约200至大约1,000道尔顿。
当标记掺入有一种以上具明显丰度之同位素的原子时,用质谱法分辨这些标记就比较困难。因此,欲进行质谱鉴定的优选T基团(Tms基团)含有碳,氢和氟中至少一种,以及可能有的选自氧、氮、硫、磷和碘的原子。虽然Tms中可存在其他原子,但它们的存在有时会使质谱数据更难以分析。Tms基团中除氢和/或氟外,最好只有碳、氮和氧原子。
氟在Tms基团中是可能有的甚至优选的原子。与氢相比,当然氟要重得多。因此,氟而不是氢原子的存在使Tms基团有更高的质量,从而使T上SM基团达到并超过如上文所述的预期的大于250道尔顿的质量。此外,用氟取代氢可使含Tms部分有更大的挥发性,并且当使用质谱法作为检测方法时分析物有更大的挥发性可提高检测的灵敏度。
Tms的分子式落入C1-500N0-100O0-100S0-10P0-10HαFβIδ的范围之内,式中α、β和δ的总和足以饱和C、N、O、S和P原子的未饱和价。C1-500N0-100O0-100S0-10P0-10HαFβIδ是指Tms含有至少一个,并可含有从1至500任何数目的碳原子,此外还可任意地含有多至100个氮原子(“N0-”是Tms不需含有任何氮原子)、多至100个氧原子,以及多至10个硫原子和多至10个磷原子。符号α、β和δ代表Tms中氢、氟和碘原子的数目,这些数目中的任何两个都可能是0,并且这些数目的总和等于C、N、O、S和P原子的总的未饱和的价数。Tms优选具有落入C1-50N0-10O0-10HαFβ范围内的分子式,其中α和β的总和分别等于存在于该部分中的氢和氟原子的数目。
b.IR标记的特征有机化学基团的IR检测有两种基本形式随机扫描IR和吸收IR。随机扫描IR光谱和吸收IR光谱是互补的光谱法。一般说来,喇曼激发取决于键极性改变,而IR吸收则取决于键偶极性改变。弱IR吸收线变成强喇曼线,且反之亦然。波数是IR光谱的特征性单位。IR标记有3个不同应用的光谱区在12500至4000cm-1处的近IR,4000至600cm-1处的中IR,600至30cm-1处的远IR。为了本文所述的以化合物作为鉴定MOI、探针或引物的标记的应用,应优选中红外光谱区。例如,羧酸、羧酸酯和酰胺、碳酸烷基和芳基酯、氨基甲酸酯和酮应检测羰基伸缩(1850至1750cm-1)。N-H弯曲(1750至160cm-1)将用于鉴定胺、铵离子和酰胺。在1400至1250cm-1,检测R-OH弯曲以及酰胺中的C-N伸缩。在900至690cm-1检测芳族取代方式(ArNH2的C-H弯曲,N-H弯曲)。饱和的C-H、烯烃、芳环、双和三键、酯、缩醛、缩酮、铵盐、N-O化合物和肟、硝基、N-氧化物和硝酸酯、偶氮、腙、苯醌、羧酸、酰胺,以及内酰胺都具有振动红外相关性数据(参见Pretsch et al.,有机化合物结构测定的光谱数据,Springer-Verlag,New York,1989)。优选的化合物应包括在2230至2210cm-1表现出很强的伸缩振动的芳族腈。其他有用类型的化合物是具有在2140和2100cm-1之间产生尖锐吸收带之强伸缩振动的芳族炔。第三种类型的化合物是在2160至2120cm-1区表现有强吸收带的芳族叠氮化物。硫氰酸酯是在2275至2263cm-1有强吸收的有代表性的化合物。
c.UV标记的特征Scott在其著作(天然产物紫外光谱的解析,Permagon Press,NewYork,1962)中给出了有机发色团类型和它们各自的紫外可见光特征的汇编。发色团是负责特定光吸收的原子或原子群或电子群。对共轭系统中的π至π*最大吸收存在经验规则(参见Pretsch等,有机化合物结构测定的光谱数据,p.B65和B70,Springer-Verlag,New York,1989)。优选的化合物(用共轭系统)应具有n至π*和π至π*转换。这样的化合物的例子是酸性紫T、吖啶橙、吖啶黄G、亮兰G、刚果红、结晶紫、孔雀绿草酸盐、间胺黄、亚甲蓝、甲基橙、甲基紫B、萘酚绿B、油蓝N、油红O、4-苯偶氮酚、藏红、溶剂绿3和苏丹橙G,所有这些化合物都是可以市场上得到的(Aldrich,Milwaukee,WI)。例如Jane,I.等,J.Chrom.323:191-225(1985)中列出了其他一些适用的化合物。
d.荧光标记的特征荧光探针大多直接根据吸收度和荧光发射波长及强度鉴定和定量分析。发射光谱(荧光和磷光)比吸收光谱更加敏感,并得以更特异的检测。其他光物理学特征如受激状态半寿期和荧光各向异性则使用不那么广泛。通常最有用的强度参数是吸收的摩尔消光系数(ε)和荧光的量子产率(QY)。在单一被长处ε的值是特定的(通常是探针吸收最大值),而QY则是通过整个荧光光谱分布图的总光电发射的度量。荧光激发(通过吸收)通常使用窄的光学带宽(<20nm),而荧光检测带宽的可变度大得多,其最大灵敏度范围从全谱带到最大分辨率的窄谱带(~20nm)。每种探针分子的荧光强度是与δ和QY的乘积成正比的。在同前有实际应用重要性的荧光团中,这些参数的范围是δ约为10,000至100,000cm-1M-1,QY为0.1至1.0。可用作荧光标记的化合物是荧光素、若丹明、λ蓝470、λ绿、λ红664、λ红665、吖啶橙和碘化Propidium,这些化合物均可从Lambda Fluorescence Co.(Pleasant Gap.PA)购得。荧光化合物例如尼罗红、德克萨斯红、丽丝胺TM、BODIPYTM则可从MolecularProbe(Eugene,OR)购得。
e.电势标记的特征电化学检测(ECD)的原理是基于在某些外加电压下化合物氧化或还原,供出或接受电子而产生可被检测的电流。当某些化合物经受电位差时,分子在工作电极表面经受到分子重排,丢失(氧化)或获得(还原)电子,这样的化合物可以说是电活性的并经受电化学反应。在HPLC洗脱液通过电极流动时,EC检测器在电极表面施加电压。从柱上洗脱的电活性化合物供出电子(氧化)或获得电子(还原)同时产生电流峰。重要的是,所产生的电流量取决于分析物的浓度和所施加的电压,每种化合物均具有其开始氧化或还原所需特异性电压。目前最通用的电化学检测器是电流检测器,其中电势保持恒定并在其后检测由电化学反应产生的电流。这种类型的光谱测定法目前称为“恒电位电流测法”。市售安培计可得自ESA,Inc.,Chelmford,MA。
当检测效率为100%时,特异化检测器称为“库仑检测器”。就选择性和灵敏度来说,库仑检测器具有许多实践优点,从而使此类检测器特别适用于一个阵列中。在库仑检测器中,对于给定的分析物浓度,将信号电流作为对工作电极外加电势(电压)的函数作图。所得到的S形曲线图称为电流-电压曲线或流体动力电压电流图(HDV)。HDV允许最好地选择对工作电极施加的电势,以使所观察到的信息达到最大。ECD的主要优点是其固有的灵敏度,检测的电流水平在亚非摩尔(10-15摩尔)范围。
包括许多生物化学品、药物及杀虫剂在内的大量化学物质及化合物都是有电化学活性的。即使它们的半波电势(最大信号半数值时的电势)只有30-60mV的差异,仍可有效地分辨层析共洗脱的化合物。
最近发展的库仑传感器当在基于液相层析的分离中用作检测器时,可选择性地鉴定和分辨共洗脱化合物。因此这些阵列化的检测器还可补加在检测器本身中完成的另一组分离。目前的仪器具有原则上只受获得数据的速率限制的16个波道。可在EC阵列上分辨的化合物的数目是受层析限制的(即受板数限制)。然而,如果层析共洗脱的两种或多种化合物的半波电位差为30-60mV,则该阵列即能够区分之。化合物成为电化学活性化合物的能力有赖于其具有EC活性基团(即-OH、-O、-N、-S)。
已使用库仑检测器成功地检测的化合物包括5-羟基色胺、3-甲氧基-4-羟苯基乙二醇、尿黑酸、多巴胺、变肾上腺素、3-羟犬尿氨酸、乙酰米诺芬(acetominophen)、3-羟色醇、5-羟吲哚基乙酸、苯酚、邻甲酚、焦培酚、2-硝基苯酚、4-硝基苯酚、2,4-二硝基苯酚、4,6-二硝基甲酚、3-甲基-2-硝基苯酚、2,4-二氯苯酚、2,6-二氯苯酚、2,4,5-三氯苯酚、4-氯-3-甲基苯酚、5-甲基苯酚、4-甲基-2-硝基苯酚、2-羟苯胺、4-羟苯胺、1,2-苯二胺、苯并儿茶素、巴特隆、chlortholuron、敌草隆、isoproturon、利谷隆、methohromuron、麦多隆、绿谷隆、monuron、蛋氨酸、色氨酸、酪氨酸、4-氨基苯甲酸、4-羟苯甲酸、4-羟香豆酸、7-甲氧基香豆素、5,7,4'-三羟黄酮、黄岑苷元、咖啡酸、儿茶素、矢车菊苷、绿原酸、大豆黄素、野麻根素、洋芜荽黄素、表儿茶素没食子酸盐、表加兰儿茶素、表加蓝儿茶素没食子酸盐、丁子香酚、半齿泽兰素、阿魏酸、非瑟酮、高良姜精、没食子酸、桅子宁、染料木黄酮、龙胆酸、桔皮苷、鸢尾配基、莰非醇、无色花青素、藤黄菌素、楝子素、桑色素、杨梅黄酮、柚皮苷、柚皮素-7-芸香糖苷、花葵素、甲基花青素、根皮素、红车轴草异丙酮、原儿茶酸、鼠李黄素、槲皮素、樱花素、黄芩配基、莨菪亭、丁香醛、丁香酸、柑桔黄酮、troxerutin、伞形酮、香草酸、1,3-二甲基四氢异喹啉、6-羟多巴胺、r-猪毛菜醇、N-甲基-猪毛菜醇、四氢异喹啉、阿米替林、阿林吗啡、辣椒辣素、氯氮_、氯丙嗪、道诺红菌素、地昔帕明、多塞平、氟西汀、氟西泮(氟安定)、米帕明、异丙基肾上腺素、甲氧明、吗啡、吗啡-3-葡糖苷酸、去甲替林、奥沙西泮(去甲羟安定)、苯福林(去氧肾上腺素)、曲米帕明、抗坏血酸、N-乙酰-5-羟色胺、3,4-二羟苄胺、3,4-二羟扁桃酸(DOMA)、3,4-二羟苯乙酸(DOPAC)、3,4-二羟苯丙氨酸(L-DOPA)、3,4-二羟苯基乙二醇(DHPG)、3-羟基氨茴酸、2-羟基苯乙酸(2HPAC)、4-羟苯甲酸(4HBAC)、5-羟吲哚-3-乙酸(5HIAA)、3-羟犬尿氨酸、3-羟偏桃酸、3-羟-4-甲氧基苯乙胺、4-羟苯乙酸(4HPAC)、4-羟苯基乳酸(4HPLA)、5-羟色氨酸(5HTP)、5-羟色醇(5HTOL)、5-羟色胺(5HT)、5-羟色胺硫酸盐、3-甲氧基-4-羟苯基乙二醇(MHPG)、5-甲氧基色胺、5-甲氧基色氨酸、5-甲氧基色醇、3-甲氧基酪胺(3MT)、3-甲氧基酪氨酸(3-OM-DOPA)、5-甲基半胱氨酸、3-甲基鸟嘌呤、蟾毒色胺、多巴胺、多巴胺-3-葡糖苷酸、巴多胺-3-硫酸酯、多巴胺-4-硫酸酯、肾上腺素、麻黄宁、叶酸、谷胱苷肽(还原态)、鸟嘌呤、鸟苷、尿黑酸(HGA)、高香草酸(HVA)、高香草醇(HVOL)、高藜芦酸、硫酸hva、次黄嘌呤、吲哚、吲哚-3-乙酸、吲哚-3-乳酸、犬尿氨酸、褪黑素、变肾上腺素、N-甲基色胺、N-甲基酪胺、N,N-二甲基色胺、N,N-二甲基酪胺、去甲肾上腺肾、去甲变肾上腺素、章鱼胺、吡哆醛、磷酸吡哆醛、吡哆胺、脱氧肾上腺素、色醇、色胺、酪胺、尿酸、香草扁桃酸(vma)、黄嘌呤及黄苷。其他化合物如可参见Jane,I.等,J.Chrom.323:191-225(1985)和Musch,G.等,J.Chrom.348:99-110(1985)。可用本领域已知的方法将这些化合物掺入到式T-L-X的化合物中。例如,具有羧酸基团的化合物可与胺、羟基等反应以形成酰胺、酯及T和L间的其他键合。
除上述性质外,无论打算使用什么检测方法,标记都最好具有模式化学结构。这将有助于使用组合化学技术构建大数目的结构上相关的标记。例如,希望Tms有几种性质。期望当以质谱法检测含Tms部分时,其含有支持单一离子化带电状态的功能团(更简单地称为“质谱灵敏度增强”基团,或简称为MSSE)。另外,希望以其作为含Tms部分的家族中的一个成员,该家族的每个成员都有不同的质量/电荷比例,而在质谱检测中又有差不多同样的灵敏度。因此,希望该家族的成员有同样的MSSE。为了得以产生化合物的家族,已发现可通模式合成路线方便地产生标记反应物,因而可将标记成分本身看作是含有模式的。
对于Tms基团的结构,一个优选的模式是Tms具有下列通式T2-(J-T3)n-其中T2是从碳和一个或多个氢、氟、碘、氧、氮、硫和磷形成的具有15至500道尔顿的质量范围的有机残基;T3是从碳和一个或多个氢、氟、碘、氧、氮、硫和磷形成的具有50至1000道尔顿的质量范围的有机残基;J是直接键,或诸如酰胺、酯、胺、硫醚、醚、硫代酯、二硫化物、硫代醚、脲、硫脲、氨基甲酸酯、硫代氨基甲酸酯、西夫碱、还原态西夫碱、亚胺、肟、腙、磷酸酯、膦酸酯、磷酰胺、膦酰胺、磺酸酯、氨磺酰或碳-碳键的功能团;n是1至50的整数,这样当n大于1时,每个T3和J都是独立选择的。
模式结构T2-(J-T3)n-提供了进入T-L-X化合物家族的方便途径,其中家族的每个成员都有不同的T基团。例如,当T是Tms,并且每个家族成员都期望有同样的MSSE时,T3基团之一即可提供这种MSSE结构。为了就Tms的质量而言提供家族成员间的可变性,家族成员间的T2基团可以是变化的。例如,一个家族成员可以有T2=甲基,而另一个有T2=乙基,再一个则有T2=丙基等。
为了提供质量的大跳跃,可以设计T3基团以向T-L-X上加入相当大的(如1百至几百个)质量单位。这样的T3基团可称为分子量范围调整基团(“WRA”)。如果用一组具有超出限制范围的质量的T2基团工作,WRA是相当有用的。可使用单一组T2基团,仅仅通过在Tms中掺入一个或多个WRA T3基团来产生有宽质量范围的Tms基团。因此,举一个简单的例子,如果一组T2基团为Tms提供250-340道尔顿的质量范围,加入例如作为T3基团的100个道尔顿的WRA,则使用同一组T2基团,就可提供350-440道尔顿的质量范围。同样,加入两个100道尔顿MWA基团(各自作为T3基团)便提供接近450-540道尔顿的质量范围,可继续这种WRA基团的递增加入,以为Tms基团提供很大的质量范围。优选的式T2-(J-T3)n-L-X的化合物具有通式RVWC-(RWRA)W-RMSSE-L-X,其中VWC是“T2”基团,WRA和MSSE中的每一个都是“T3”基团。图13中举例说明了这一结构,并代表了制备Tms的一种模式方法。
在通式T2-(J-T3-)n-中,T2和T3较好是选自烃基、烃基-O-亚烃基、烃基-S-亚烃基、烃基-NH-亚烃基、烃基-酰胺-亚烃基、N-(烃基)亚烃基、N,N-二(烃基)亚烃基、烃基酰基-亚烃基、杂环基烃基,其中杂原子选自氧、氮、硫和磷,取代的杂环基烃基,其中杂原子选自氧、氮、硫和磷,且取代基选自烃基、烃基-O-亚烃基、烃基-NH-亚烃基、烃基-S-亚烃基、N-(烃基)亚烃基、N,N-二(烃基)亚烃基以及烃基酰基-亚烃基。此外,T2和/或T3可以是前面列出的潜在T2/T3基团中任何一个的衍生物,即一个或多个氢原子被氟原子取代。
还就通式T2-(J-T3)n-来说,优选的T3具有式-G(R2)-,其中G是具有单一R2取代基的C1-6亚烷基链。因此,如果G是亚乙基(-CH2-CH2-),则两个亚乙基碳中的任一个可具有R2取代基,并且R2选自烷基、链烯基、炔基、环烷基、芳基缩合的环烷基、环烯基、芳基、芳烷基、芳基取代的链烯基或炔基、环烷基取代的烷基、环烯基取代的环烷基、联芳基、烷氧基、链烯氧基、炔氧基、芳烷氧基、芳基取代的链烯氧基或炔氧基、烷氨基、链烯氨基或炔氨基、芳基取代的烷氨基、芳基取代的链烯氨基或炔基氨基、芳氧基、芳氨基、N-烷基脲取代的烷基、N-芳基脲取代的烷基、烷基羰基氨基取代的烷基、氨基羰基取代的烷基、杂环基、杂环基取代的烷基、杂环基取代的氨基、羧烷基取代的芳烷基、氧代碳环缩合的芳基和杂环基烷基;环烯基、芳基取代的烷基和芳烷基、羟基取代的烷基、烷氧基取代的烷基、芳烷氧基取代的烷基、烷氧基取代的烷基、芳烷氧基取代的烷基、氨基取代的烷基、(芳基取代的烷氧基羰基氨基)取代的烷基、硫羟取代的烷基、烷基磺酰取代的烷基、(羟基取代的烷硫基)取代的烷基、硫代烷氧基取代的烷基、烃基酰基氨基取代的烷基、杂环酰基氨基取代的烷基、烃基取代的杂环基酰基氨基取代的烷基、烷基磺酰氨基取代的烷基、芳基磺酰氨基取代的烷基、吗啉代烷基、硫代吗啉代烷基、吗啉代羰基取代的烷基、硫代吗啉代羰基取代的烷基、(N-(烷基、链烯基或炔基)-或N,N-[二烷基、二链烯基、二炔基或(烷基、链烯基)-氨基]羰基取代的烷基、杂环基氨基羰基、杂环基亚烷基氨基羰基、杂环基氨基羰基取代的烷基、杂环基亚烷基氨基羰基取代的烷基、N,N-[二烷基]亚烷基氨基羰基、N,N-[二烷基]亚烷基羰基取代的烷基、烷基取代的杂环基羰基、烷基取代的杂环基羰基-烷基、羧基取代的烷基、二烷基氨基取代的酰基氨基烷基,以及选自精氨酸、天冬酰胺、谷氨酰胺、S-甲基半胱氨酸、蛋氨酸和其相应的亚砜和砜衍生物、甘氨酸、亮氨酸、异亮氨酸、别异亮氨酸、叔亮氨酸、正亮氨酸、苯丙氨酸、酪氨酸、色氨酸、脯氨酸、丙氨酸、鸟氨酸、组氨酸、谷氨酸、缬氨酸、苏氨酸、丝氨酸、天冬氨酸、β-氰基丙氨酸及别苏氨酸的氨基酸侧链;炔基和杂环基羰基、氨基羰基、酰氨基、一或二烷基氨基羰基、一或二芳基氨基羰基、烷基芳基氨基羰基、二芳基氨基羰基、一或二酰基氨基羰基、芳族或脂族酰基、被选自氨基、羧基、羟基、巯基、一或二烷基氨基、一或二芳基氨基、烷基芳基氨基、二酰基氨基、一或二芳基氨基、烷氧基、链烯氧基、芳氧基、硫代烷氧基、硫代链烯氧基、硫代炔氧基、硫代芳氧基和杂环基任意取代的烷基。
优选的式T2-(J-T3-)n-L-X的化合物具有下示结构
其中G是(CH2)1-6,其中由单一“G”代表的CH2基团中一个并且只有一个上的氢原子被-(CH2)c-酰胺-T4所取代,T2和T4是式C1-25N0-9HαFβ的有机残基,其中α和β的总和足以饱和C、N和O原子可能未饱和的价;酰胺是
R1是氢或C1-10烷基;C是0至4的整数,n是1至50的整数,其中当n大于1时,G、c、酰胺、R1和T4是独立地选择的。
在另一个优选实施方案中,式T2-(J-T3-)n-L-X的化合物具有下示结构
其中T5是式C1-25N0-9O0-9HαFβ的有机残基,其中α和β的和足以饱和C、N和C原子的可能未饱和的价;T5包括叔或季胺或有机酸;m是0-49的整数,且T2、T4、R1、L和X是如前定义的基团。
另一个具有式T2-(J-T3-)n-L-X的优选化合物则有以下具体结构
其中T5是式C1-25N0-9O0-9HαFβ的有机残基,其中α和β的总和足以饱和C、N和O原子的可能未饱和的价;T5包括叔或季胺或有机酸;m是0-49的整数,且T2、T4、c、R1、“酰胺”、L和X已在前面给出了定义。
在上面的具有T5基团的结构中,-酰胺-T5较好是使有机酸与从“G”延伸的游离氨基基因反应而方便地制得的下列基团之一
当上述化合物具有T5基团,并且“G”基团具有游离羧基基团(或其反应性等同物)时,则优选的-酰胺-T5基团是如下所示的,可使适当的有机胺与从“G”基团延伸的游离羧基基团反应而方便地制得的基团
在本发明的三个优选实施方案中,T-L-MOI具有下示结构
其中T2和T4是式C1-25N0-9O0-9S0-3P0-3HαFβIδ的有机残基,其中α、β和δ的总和足以饱和C、N、O、S和P原子可能未饱和的价;G是(CH2)1-6,其中由每个G代表的CH2基团上的一个并且只有一个氢被-(CH2)c-酰胺-T4取代;酰胺是
R1是氢或C1-10烷基;c是从0至4的整数;“C2-C10”代表具有2至10个碳原子的亚烃基基团,“ODN-3'-OH”代表有末端3'羟基基团的核酸片段(即在核酸片段的3'末端以外的位置连接到(C1-C10));n是从1至50的整数,这样当n大于1时,独立地选择G、c、酰胺、R1和T4。最好没有三个杂原子结合到同一个碳原子上。其中T2和T4是式C1-25N0-9O0-9HαFβ的有机残基,其中α和β的总和足以饱和C、N和O原子的可能未饱和的价;G是(CH2)1-6,其中由各个G代表的CH2基团上的一个并且只是一个氢被-(CH2)c-酰胺-T4所取代;酰胺是
R1是氢或C1-10烷基;c是从0到4的整数;“ODN-3'-OH”代表具有末端3'羟基基团的核酸片段;n是从1到50的整数,当n大于1时,酰胺、R1各T4是独立选择的。
在上面列出的含有T2-C(=O)-N(R1)-基团的结构中,该基团可由式HN(R1)-的胺与选自下面例子中的有机酸反应而生成,下面所列出的只是某些实例,但并没有无遗漏地列出所有可能的有机酸。所说有机酸的例子包括甲酸、乙酸、丙酸、丙炔酸、氟乙酸、2-丁炔酸、环丙烷羧酸、丁酸、甲氧乙酸、二氟己酸、4-戊炔酸、环丁烷羧酸、3,3-二甲基丙烯酸、戊酸、N,N-二甲基甘氨酸、N-甲酰-Gly-OH、乙氧基乙酸、(甲硫基)乙酸、吡咯-2-羰酸、3-糠酸、异噁唑-5-羧酸、反式-3-己烯酸、三氟乙酸、己酸、Ac-Gly-OH、2-羟-2-甲基丁酸、苯甲酸、烟酸、2-吡嗪羧酸、1-甲基-2-吡咯羧酸、2-环戊烯-1-乙酸、环戊烷乙酸、(S)-(-)-2-吡咯烷酮-5-羧酸、N-甲基-L-脯氨酸、庚酸、Ac-b-Ala-OH、2-乙基-2-羟丁酸、2-(2-甲氧基乙氧基)乙酸、对甲苯甲酸、6-甲基烟酸、5-甲基-2-吡嗪羧酸、2,5-二甲基吡咯-3-羧酸、4-氟苯甲酸、3,5-二甲基异噁唑-4-羧酸、3-环戊基丙酸、辛酸、N,N-二甲基琥珀氨酸、苯基丙炔酸、肉桂酸、4-乙基苯甲酸、对甲氧基苯甲酸、1,2,5-三甲基吡咯-3-羧酸、3-氟-4-甲基苯甲酸、Ac-DL-炔丙基甘氨酸、3-(三氟甲基)丁酸、1-哌啶丙酸、N-乙酰脯氨酸、3,5-二氟苯甲酸、Ac-L-Va-OH、吲哚-2-羧酸、2-苯并呋喃羧酸、苯并三唑-5-羧酸、4-正丙基苯甲酸、3-二甲基氨基苯甲酸、4-乙氧基苯甲酸、4-(甲硫基)苯甲酸、N-(2-糠酰)甘氨酸、2-(甲硫基)烟酸、3-氟-4-甲氧基苯甲酸、Tfa-Gly-OH、2-萘甲酸、喹哪啶酸、Ac-L-Ile-OH、3-甲基吲哚烯-2-羧酸、2-喹喔啉羧酸、1-甲基吲哚-2-羧酸、2,3,6-三氟苯甲酸、N-甲酰-L-Met-OH、2-[2-(2-甲氧基乙氧基)乙氧基]乙酸、4-正丁基苯甲酸、N-苯甲酰甘氨酸、5-氟吲哚-2-羧酸、4-正丙氧基苯甲酸、4-乙酰-3,5-二甲基-2-吡咯羧酸、3,5-二甲氧基苯甲酸、2,6-二甲氧基烟酸、环己烷戊酸、2-萘基乙酸、4-(1H-吡咯-1-基)苯甲酸、吲哚-3-丙酸、间三氟甲基苯甲酸、5-甲氧基吲哚-2-羧酸、4-戊基苯甲酸、Bz-b-Ala-OH、4-二乙基氨基苯甲酸、4-正丁氧基苯甲酸、3-甲基-5-CF3-异噁唑-4-羧酸、(3,4-二甲氧基苯基)乙酸、4-联苯基羧酸、新戊酰-Pro-OH、辛酰基-Gly-OH、(2-萘氧基)乙酸、吲哚-3-丁酸、4-(三氟甲基)苯基乙酸、5-甲氧基吲哚-3-乙酸、4-(三氟甲氧基)苯甲酸、Ac-L-Phe-OH、4戊氧基苯甲酸、Z-Gly-OH、4-羧基-N-(呋喃-2-基甲基)吡咯烷-2-酮、3,4-二甲氧基苯甲酸、2,4-二甲基-5-CO2Et-吡咯-3-羧酸、N-(2-氟苯基)琥珀酰胺酸、3,4,5-三甲氧基苯甲酸、N-苯基邻氨基苯甲酸、3-苯氧基苯甲酸、壬酰-Gly-OH、2-苯氧基吡啶-3-羧酸、2,5-二甲基-1-苯基吡咯-3-羧酸、反式-4-(三氟甲基)肉桂酸、5-(甲基-2-苯基噁唑-4-基)乙酸、4-(2-环己烯氧基)苯甲酸、5-甲氧基-2-甲基吲哚-3-乙酸、反式-4-可塔宁羧酸、Bz-5-氨基戊酸、4-己氧基苯甲酸、N-(3-甲氧基苯基)琥珀酰胺酸、Z-Sar-OH、4-(3,4-二甲氧基苯基)丁酸、Ac-O-氟-DL-Phe-OH、N-(4-氟苯基)戊酰胺酸、4'-乙基-4-联苯基羧酸、1,2,3,4-四氢吖啶羧酸、3-苯氧基苯基乙酸、N-(2,4-二氟苯基)琥珀酰胺酸、N-癸酰基-Gly-OH、(+)-6-甲氧基-a-甲基-2-萘乙酸、3-(三氟甲氧基)肉桂酸、N-甲酰-DL-Trp-OH,(R)-(+)-a-甲氧基-a-(三氟甲基)苯乙酸、Bz-DL-Leu-OH、4-(三氟甲氧基)苯氧基乙酸、4-庚氧基苯甲酸、2,3,4-三甲氧基肉桂酸、2,6-二甲氧基苯甲酰基-Gly-OH、3-(3,4,5-三甲氧基苯基)丙酸、2,3,4,5,6-五氟苯氧基乙酸、N-(2,4-二氟苯基)戊酰胺酸、N-十一酰基-Gly-OH、2-(4-氟苯甲酰基)苯甲酸、5-三氟甲氧基吲哚-2-羧酸、N-(2,4-二氟苯基)二甘醇氨酸、Ac-L-Trp-OH、Tfa-L-苯基甘氨酸-OH、3-碘代苯甲酸、3-(4-正戊基苯甲酰基)丙酸、2-苯基-4-喹啉羧酸、4-辛氧基苯甲酸、Bz-L-Met-OH、3,4,5-三乙氧基苯甲酸、N-月桂酰-Gly-OH、3,5-双(三氟甲基)苯甲酸、Ac-5-甲基-DL-Trp-OH、2-碘苯基乙酸、3-碘-4-甲基苯甲酸、3-(4-正己基苯甲酰基)丙酸、N-己酰-L-Phe-OH、4-壬氧基苯甲酸、4'-(三氟甲基)-2-联苯基羧酸、Bz-L-Phe-OH、N-三癸酰基-Gly-OH、3,5-双(三氟甲基)苯基乙酸、3-(4-正庚基苯甲酰基)丙酸、N-庚酰-L-Phe-OH、4-癸氧基苯甲酸、N-(α,α,α-三氟-间甲苯基)邻氨基苯甲酸、2-[3-(三氟甲基)苯胺基]盐酸、4-(2羟基六氟异丙基)苯甲酸、N-肉豆蔻酰-Gly-OH、3(4-正辛基苯甲酰基)丙酸、N-辛酰基-L-Phe-OH、4-十一烷氧基苯甲酸、3-(3,4,5-三甲氧基苯基)丙酰-Gly-OH、8-碘代萘酸、N-十五酰-Gly-OH、4-十二烷氧基苯甲酸、N-棕榈酰-Gly-OH和N-硬脂酰-Gly-OH。可从下列公司购得这些有机酸Aclvanced Chem Tech,Louisville,KY;Bachem BioscienceInc.,Torrance,CA;Caliochem-Novabiochem Corp.,San Diego,CA;Farchan Laboratories Inc.,Gainesville FL;Lancaster Synthesis,Windham NH;以及MayBridge Chemical Company(c/o Ryan Scientific),Columbia,SC。这些公司的产品目录中使用上述识别这些酸的缩写字。
f.作为制备标记的手段的组合化学技术组合化学是导致生产大的化学文库的一类合成策略(例如参见PCT申请
发明者J·范尼斯, J·C·特邦, J·J·豪伯特, J·T·默利甘 申请人:拉普吉恩公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1