修饰的核苷或核苷酸的制作方法

文档序号:16062170发布日期:2018-11-24 12:18阅读:717来源:国知局

背景

发明领域

本文描述的一些实施方案涉及包含3’-羟基保护基的修饰的核苷酸或核苷以及它们在多核苷酸测序方法中的应用。本文所述的某些实施方案涉及制备3’-羟基被保护的核苷酸或核苷的方法。

相关技术描述

通过改进用于表征分子或其生物反应的技术,在某种程度上使得对分子的研究有所进展。特别是核酸dna和rna的研究已受益于开发用于序列分析和杂交事件研究的技术。

改进核酸研究的技术中的一个实例是开发固定化核酸的制备阵列。这些阵列代表性地由固定至固相载体材料上的高密度多核苷酸矩阵构成。见,例如,fodor等人,trendsbiotech.12:19-26,1994,该文献描述了使用化学敏感的玻璃表面来组装核酸的方法,该玻璃表面由遮盖物(mask)保护但在限定的区域被暴露以允许附接适当修饰的核苷亚磷酰胺。还可以通过将已知的多核苷酸在预定位置处“点样”至固相载体上的技术来制造制备阵列(例如,stimpson等人,proc.natl.acad.sci.92:6379-6383,1995)。

一种测定与阵列结合的核酸的核苷酸序列的方法被称作“合成法测序”或“sbs”。理想化地,这种测定dna序列的技术需要受控地(即,一次一个)并入相对于正被测序的核酸的正确的互补核苷酸。因为每个核苷酸残基被逐个测序,因此,这允许通过在多次循环中加入核苷酸来精确测序,从而防止发生一系列不受控制的并入。使用附着于被并入的核苷酸的合适的标记来读取该被并入的核苷酸,然后除去该标记部分并随后进行下一轮测序。

为保证仅发生单个并入,向加入至生长链上的每个标记的核苷酸中加入结构修饰(“保护基”)以确保只有一个核苷酸被并入。在已加入具有保护基的核苷酸之后,然后在不干扰正被测序的dna的完整性的反应条件下,将所述保护基除去。然后,随着并入下一个经保护的标记的核苷酸,所述测序循环能够继续进行。

为适用于dna测序,核苷酸以及更通常为三磷酸核苷通常需要3’-羟基保护基,以防止用于将其并入至多核苷酸链内的聚合酶在加入所述核苷酸上的碱基时继续复制。对能够加至核苷酸上且依然合适的基团的类型有很多限制。所述保护基应防止另外的核苷酸分子被加入至多核苷酸链中,且同时在不破坏该多核苷酸链的情况下易于从糖部分中除去。此外,修饰的核苷酸需要耐受聚合酶或用于将该修饰的核苷酸并入多核苷酸链内的其他适合的酶。因此,理想的保护基表现出长期的稳定性,可高效地被聚合酶并入,阻止核苷酸二次并入或进一步并入,并且具有在不破坏多核苷酸结构的温和条件下被除去的能力,优选地在水性条件下被除去。

先前已描述了可逆的保护基。例如,metzker等人,(nucleicacidsresearch,22(20):4259-4267,1994)公开了八种3’-修饰的2-脱氧核糖核苷5’-三磷酸酯(3’-修饰的dntp)的合成和应用,并在两组dna模板测定中对并入活性进行了测试。wo2002/029003描述了一种测序方法,其可能包括在聚合酶反应中使用烯丙基保护基对dna生长链上的3’-oh基团加帽。

另外、我们先前在国际申请公开no.wo2004/018497中报导了开发了许多可逆保护基和在dna相容的条件下将它们脱保护的方法,由此通过参考的方式将其全部内容并入本文。

概述

本文描述的某些实施方案涉及修饰的核苷酸或核苷分子,其包含嘌呤或嘧啶碱基和核糖或脱氧核糖的糖部分,所述糖部分具有可除去的3’-羟基保护基,形成与3’-碳原子共价连接的结构-o-c(r)2n3,其中

r选自氢、-c(r1)m(r2)n、-c(=o)or3、c(=o)nr4r5、-c(r6)2o(ch2)pnr7r8和-c(r9)2o-ph-c(=o)nr10r11

r1和r2各自独立地选自氢、任选取代的烷基或卤素;

r3选自氢或任选取代的烷基;

r4和r5各自独立地选自氢、任选取代的烷基、任选取代的芳基、任选取代的杂芳基、或任选取代的芳烷基;

r6和r9各自选自氢、任选取代的烷基或卤素;

r7、r8、r10和r11各自独立地选自氢、任选取代的烷基、任选取代的芳基、任选取代的杂芳基、或任选取代的芳烷基;

m为0-3的整数;以及

n为0-3的整数;条件是m+n的总和等于3;以及

p为0-6的整数;条件是r1和r2不能均为卤素;以及至少一个r不为氢。

本文描述的某些实施方案涉及制备在测序反应中与目标单链多核苷酸互补的生长多核苷酸的方法,包括将本文所述的修饰的核苷酸分子并入所述生长的互补多核苷酸,其中所述修饰的核苷酸的并入防止了任何后续的核苷酸引入所述生长的互补多核苷酸中。

本文描述的某些实施方案涉及测定目标单链多核苷酸的序列的方法,包括监测互补核苷酸的顺序并入,其中至少一个并入的互补核苷酸是本文描述的修饰的核苷酸分子;以及检测所述修饰的核苷酸分子的特性。在某些实施方案中,通过末端转移酶、末端聚合酶或逆转录酶来完成修饰的核苷酸分子的并入。

本文描述的某些实施方案涉及试剂盒,其包含多个本文描述的修饰的核苷酸或核苷分子和包装材料。在某些实施方案中,通过检测与碱基连接的可检测标记来测定所述修饰的核苷酸的特性。在某些这类实施方案中,在引入下一个互补核苷酸之前,将3’-羟基保护基和可检测标记除去。在某些这类实施方案中,3’-羟基保护基和可检测标记在单步的化学反应中除去。

附图的简要说明

图1a示例性说明了多种3’-oh保护基。

图1b示例性说明了多种3’-oh保护基的热稳定性。

图2a示例性说明了三种不同3’-oh保护基的脱保护速率曲线。

图2b显示了三种不同3’-oh保护基的脱保护完成一半的时间(deprotectionhalftime)的图表。

图3显示了多种具有热稳定的3’-oh保护基的修饰的核苷酸的定相(phasing)值和预定相(prephasing)值,并与标准的保护基比较。

图4a显示了并入混合物(imx)中mono-fffns-a-异构体的2×400bp测序数据。

图4b显示了并入混合物(imx)中mono-fffns-b-异构体的2×400bp测序数据。

发明详述

一个实施方案为包含3’-oh保护基的修饰的核苷酸或核苷。在一个实施方案中,所述3’-oh保护基为单氟甲基取代的叠氮基甲基保护基。在另一个实施方案中,所述3’-oh保护基为c-酰氨基取代的叠氮基甲基保护基。另一个实施方案涉及具有二氟甲基取代的叠氮基甲基3’-oh保护基的修饰的核苷酸。

定义

除非另外定义,本文使用的所有技术术语和科学术语具有与本领域普通技术人员所通常理解含义相同的含义。使用术语“包括”以及该术语的其他形式并非限制。使用术语“具有”以及该术语的其他形式并非限制。如本说明书中所使用的,不论在过渡短语中还是在权利要求书中,术语“包含”应解释为具有开放性的含义。即,以上术语应与短语“至少含有”或“至少包括”同义地进行解释。例如,当在方法的上下文中使用时,术语“包含”意味着该方法至少包括已叙述的步骤,但可以包括另外的步骤。当在化合物、组合物、或装置的上下文中使用时,术语“包含”意味着该化合物、组合物或装置至少包括已叙述的特征或组分,但可以包括另外的特征或组分。

如本文中使用的,常见的有机缩略语的定义如下:

ac乙酰基

ac2o乙酸酐

aq.水性/水相

bn苄基

bz苯甲酰基

boc或boc叔丁氧羰基

bu正丁基

cat.催化的

cbz苄氧羰基

℃摄氏温度

datp脱氧三磷酸腺苷

dctp脱氧三磷酸胞苷

dgtp脱氧三磷酸鸟苷

dttp脱氧三磷酸胸苷

ddntp双脱氧核苷酸

dbu1,8-二氮杂双环[5.4.0]十一碳-7-烯

dca二氯乙酸

dce1,2-二氯乙烷

dcm二氯甲烷

diea二异丙基乙胺

dma二甲基乙酰胺

dme乙二醇二甲醚

dmfn,n’-二甲基甲酰胺

dmso二甲亚砜

dppa叠氮磷酸二苯酯

et乙基

etoac乙酸乙酯

ffn全功能核苷酸(fullyfunctionalnucleotide)

g克

gpc凝胶渗透色谱法

h或hr小时

ipr异丙基

kpiph7.0的10mm磷酸钾缓冲液

kps过硫酸钾

ipa异丙醇

imx并入混合物(incorporationmix)

lcms液相色谱法-质谱

lda二异丙基氨基锂

m或min分钟

mcpba间氯过氧苯甲酸

meoh甲醇

mecn乙腈

mono-f-ch2f

mono-fffn修饰的核苷酸,其在叠氮基甲基3’-oh保护基的亚甲基位具有-ch2f取代的

ml毫升

mtbe甲基叔丁基醚

nan3叠氮化钠

nhsn-羟基琥珀酰亚胺

pg保护基

ph苯基

ppt沉淀

rt室温

sbs合成法测序

tea三乙胺

tempo(2,2,6,6-四甲基哌啶-1-基)氧化物

tcdi1,1’-硫羰基二咪唑

tert,t叔

tfa三氟乙酸

thf四氢呋喃

temed四甲基乙二胺

μl微升

如本文中使用的,术语“阵列”指与一个或多个基质相连的不同的探针分子的群体,以至于该不同的探针分子能够根据相对位置而彼此区别开。阵列可以包括不同的探针分子,它们各自位于基质上不同的可寻址位置。可选地或另外地,阵列可以包括各自带有不同的探针分子的相互分离的基质,其中不同的探针分子可以根据基质所附着的表面上的基质的位置来识别,或根据基质在液体中的位置来识别。其中相互分离的基质位于表面上的示例性阵列包括但不限于:例如美国专利no.6,355,431b1、us2002/0102578和pct公开第wo00/63437号中所描述的那些阵列,包括在孔内的珠。可用于本发明以区分在液体阵列中的珠,例如使用微流体装置,例如荧光激活细胞分选仪(facs)的示例性模式描述于例如美国专利no.6,524,793中。可以在本发明中使用的阵列的实例还包括但不限于:美国专利no.5,429,807、5,436,327、5,561,071、5,583,211、5,658,734、5,837,858、5,874,219、5,919,523、6,136,269、6,287,768、6,287,776、6,288,220、6,297,006、6,291,193、6,346,413、6,416,949、6,482,591、6,514,751和6,610,482中所描述的阵列,以及wo93/17126、wo95/11995、wo95/35505、ep742287和ep799897中所描述的阵列。

如本文中使用的,术语“共价连接的”或“共价键合的”指形成化学键合,其特征为在原子间共享电子对。例如,共价连接的聚合物涂层指与基质的功能化表面形成化学键的聚合物涂层,相对于经由其他方式例如粘附或静电相互作用连接至所述表面。可以理解与表面共价连接的聚合物也能够通过除共价连接以外的其它方式键合。

如本文中使用的,任何“r”基团,例如但不限于:r2、r3、r4、r5、r6、r7和r8,代表能够与指定的原子连接的取代基。r基团可以是取代的也可以是未取代的。如果将两个“r”基团描述为“合在一起”,则所述r基团与和它们所连接的原子一起能够形成环烷基、芳基、杂芳基或杂环。例如但不限于:如果指明r2和r3,或者r2、r3或r4,与和其相连的原子“合在一起”或“连接在一起”,则意味着它们相互共价键合以形成环,其实例如下文所述:

每当描述基团为“任选取代的”时,该基团可以为未取代的,或者被一个或多个指明的取代基取代。同样的,当描述基团为“未取代的或取代的”时,如果是取代的,则取代基可选自一个或多个指明的取代基。如果没有指明取代基,则意味着指明的“任选取代的”或“取代的”基团可以单独地且独立地被一个或多个基团取代,所述基团单独地且独立地选自官能团,其包括但不限于:烷基、烯基、炔基、环烷基、环烯基、环炔基、芳基、杂芳基、杂脂环基、芳烷基、杂芳烷基、(杂脂环基)烷基、羟基、被保护的羟基、烃氧基、芳氧基、酰基、巯基、烷硫基、芳硫基、氰基、卤素、硫代羰基、o-氨基甲酰基、n-氨甲酰基、o-硫代氨基甲酰基、n-硫代氨基甲酰基、c-酰氨基、n-酰氨基、s-磺酰氨基、n-磺酰氨基、c-羧基、被保护的c-羧基、o-羧基、异氰酸基(isocyanato)、硫代氰酸基(thiocyanato)、异硫代氰酸基(isothiocyanato)、硝基、甲硅烷基、氧硫基、亚磺酰基、磺酰基、卤代烷基、卤代烃氧基、三卤代甲磺酰基、三卤代甲磺酰氨基、氨基、单取代的氨基、二取代的氨基及其被保护的衍生物。

如本文中使用的,“烷基”指直链或支链的烃链,其包括完全饱和的(无双键或三键)的烃基。在某些实施方案中,所述烷基可以具有1-20个碳原子(每当其在本文中出现时,如“1-20”的数值范围是指给定范围内的包括端点在内的每个整数;例如,“1-20个碳原子”意味着烷基可以由1个碳原子、2个碳原子、3个碳原子等组成,直到并包括20个碳原子,然而本定义也涵盖了未指定数值范围的术语“烷基”的出现)。所述烷基也可以是具有约7个-约10个碳原子的中等大小的烷基。所述烷基也可以是具有1-6个碳原子的低级烷基。化合物的烷基可以被指定为“c1-c4的烷基”或类似的指定。仅举例说明,“c1-c4的烷基”表示烷基链中存在一到四个碳原子,即所述烷基链选自甲基、乙基、丙基、异丙基、正丁基、异丁基、仲丁基和叔丁基。典型的烷基包括但绝不限于甲基、乙基、丙基、异丙基、丁基、异丁基、叔丁基、戊基和己基。所述烷基可以是取代的或未取代的。

如本文中使用的,“烯基”指在直链或支链的烃链中含有一个或多个双键的烃基基团。烯基可以是未取代的或取代的。

如本文中使用的,“炔基”指在直链或支链的烃链中含有一个或多个三键的烃基基团。炔基可以是未取代的或取代的。

如本文中使用的,“环烷基”指完全饱和的(无双键或三键)单环或多环的烃环系统。当由两个或更多个环组成时,所述环可以以稠合的形式结合在一起。环烷基可以在环中含有3-10个原子。在某些实施方案中,环烷基可以在环中含有3-8个原子。环烷基可以是未取代的或取代的。典型的环烷基包括但绝不限于环丙基、环丁基、环戊基、环己基、环庚基和环辛基。

如本文中使用的,“芳基”指碳环(全部为碳)的单环或多环芳香环系统(包括,例如,稠环、桥环或螺环系统,其中两个碳环共享化学键,例如,一个或多个芳环带有一个或多个芳环或非芳环),其具有遍及至少一个环的完全离域的π电子系统。芳基中的碳原子数可变。例如,在某些实施方案中,所述芳基可以为c6-c14芳基、c6-c10芳基或c6芳基。芳基的实例包括但不限于苯、萘和甘菊环。芳基可以是取代的或未取代的。

如本文中使用的,“杂环基”指包含至少一个杂原子(例如,o、n、s)的环系统。这类系统可以是不饱和的,可以包括部分不饱和,或可以包含一些芳香部分,或为完全芳香的。杂环基可以是未取代的或取代的。

如本文中使用的,“杂芳基”指单环或多环的芳香环系统(环系统具有至少一个为完全离域的π电子系统的环),其包含一个或多个杂原子,即碳以外的元素,包括但不限于氮、氧和硫,并且包含至少一个芳香环。杂芳基的环中的原子数可变。例如,在某些实施方案中,杂芳基可包含4-14个环内原子、5-10个环内原子或5-6个环内原子。此外,术语“杂芳基”包括稠环系统,其中两个环,例如至少一个芳环和至少一个杂芳环,或者至少两个杂芳环共享至少一个化学键。杂芳环的实例包括但不限于呋喃、呋咱、噻吩、苯并噻吩、酞嗪、吡咯、噁唑、苯并噁唑、1,2,3-噁二唑、1,2,4-噁二唑、噻唑、1,2,3-噻二唑、1,2,4-噻二唑、苯并噻唑、咪唑、苯并咪唑、吲哚、吲唑、吡唑、苯并吡唑、异噁唑、苯并异噁唑、异噻唑、三唑、苯并三唑、噻二唑、四唑、吡啶、哒嗪、嘧啶、吡嗪、嘌呤、蝶啶、喹啉、异喹啉、喹唑啉、喹喔啉、邻二氮杂萘和三嗪。杂芳基可以是取代的或未取代的。

如本文中使用的,“杂脂环族的”或“杂脂环基”指三、四、五、六、七、八、九、十,直至18元的单环、二环和三环的环系统,其中碳原子与1-5个杂原子一起组成所述环系统。杂环可以任选地含有一个或多个以如下这样方式定位的不饱和键,然而在遍及所有的环中不存在完全离域的π电子系统。所述杂原子独立地选自氧、硫和氮。杂环可以进一步包含一个或多个羰基或硫代羰基官能团,使本定义包括氧代系统和硫代系统,诸如内酰胺、内酯、环状酰亚胺、环状硫代酰亚胺和环状氨基甲酸酯。当由两个或更多个环组成时,这些环可以以稠合形式结合在一起。另外,在杂脂环中的任何氮可以被季铵化。杂脂环基或杂脂环族的基团可以是未取代的或取代的。这种“杂脂环族的”或“杂脂环基”基团的实例包括但不限于1,3-二噁英、1,3-二氧六环、1,4-二氧六环、1,2-二氧戊环、1,3-二氧戊环、1,4-二氧戊环、1,3-氧硫杂环己烷、1,4-氧硫杂环己二烯、1,3-氧硫杂环戊烷、1,3-二硫杂环戊二烯、1,3-二硫戊环、1,4-氧硫杂环己烷、四氢-1,4-噻嗪、2h-1,2-噁嗪、马来酰亚胺、琥珀酰亚胺、巴比妥酸、硫代巴比妥酸、二氧代哌嗪、乙内酰脲、二氢尿嘧啶、三噁烷、六氢-1,3,5-三嗪、咪唑啉、咪唑烷、异噁唑啉、异噁唑烷、噁唑啉、噁唑烷、噁唑烷酮、噻唑啉、噻唑烷、吗啉、环氧乙烷、哌啶n-氧化物、哌啶、哌嗪、吡咯烷、吡咯烷酮、吡咯烷二酮(pyrrolidione)、4-哌啶酮、吡唑啉、吡唑烷、2-氧代吡咯烷、四氢吡喃、4h-吡喃、四氢噻喃、硫吗啉、硫吗啉亚砜、硫吗啉砜,以及它们的苯并-稠合的类似物(例如,苯并咪唑啉酮、四氢喹啉、3,4-亚甲基二氧基苯基)。

如本文中使用的,“芳烷基”和“芳基(烷基)”指通过低级亚烷基连接的作为取代基的芳基。芳烷基的低级亚烷基和芳基可以是取代的或未取代的。实例包括但不限于苄基、2-苯基烷基、3-苯基烷基和萘基烷基。

如本文中使用的,“杂芳烷基”和“杂芳基(烷基)”指通过低级亚烷基连接的作为取代基的杂芳基。杂芳烷基的低级亚烷基和杂芳基可以是取代的或未取代的。实例包括但不限于2-噻吩基烷基、3-噻吩基烷基、呋喃基烷基、噻吩基烷基、吡咯基烷基、吡啶基烷基、异噁唑基烷基和咪唑基烷基,以及它们的苯并-稠合的类似物。

如本文中使用的,“烃氧基”指式–or,其中r为上文定义的烷基、烯基、炔基、环烷基、环烯基或环炔基。烃氧基的非限制性实例为甲氧基、乙氧基、正丙氧基、1-甲基乙氧基(异丙氧基)、正丁氧基、异丁氧基、仲丁氧基和叔丁氧基。烃氧基可以是取代的或未取代的。

如本文中使用的,“c-酰氨基”基团指“-c(=o)n(rarb)”基团,其中ra和rb可以独立地为氢、烷基、烯基、炔基、环烷基、环烯基、环炔基、芳基、杂芳基、杂脂环基、芳烷基或(杂脂环基)烷基。c-酰氨基可以是取代的或未取代的。

如本文中使用的,“n-酰氨基”基团指“rc(=o)n(ra)-”基团,其中r和ra可以独立地为氢、烷基、烯基、炔基、环烷基、环烯基、环炔基、芳基、杂芳基、杂脂环基、芳烷基或(杂脂环基)烷基。n-酰氨基可以是取代的或未取代的。

本文使用的术语“卤素原子”、“卤素”或“卤代”意为元素周期表的第七列的放射稳定原子中的任一种,诸如氟、氯、溴和碘。

本文使用的术语“胺”指–nh2基团,其中一个或多个氢可以任选地被r基团取代。r可以独立地为氢、烷基、烯基、炔基、环烷基、环烯基、环炔基、芳基、杂芳基、杂脂环基、芳烷基或(杂脂环基)烷基。

本文使用的术语“醛”指–rc-c(o)h基团,其中rc可以不存在,或独立地选自亚烷基、亚烯基、亚炔基、亚环烷基、亚环烯基、亚环炔基、亚芳基、亚杂芳基、亚杂脂环基、亚芳烷基或亚(杂脂环基)烷基。

本文使用的术语“氨基”指–nh2基团。

本文使用的术语“羟基”指–oh基团。

本文使用的术语“氰基”指“-cn”基团。

本文使用的术语“叠氮基”指–n3基团。

本文使用的术语“巯基”指–sh基团。

本文使用的术语“羧酸”指–c(o)oh。

本文使用的术语“硫氰酸根”指–s-c≡n基团。

本文使用的术语“氧基胺(oxo-amine)”指–o-nh2基团,其中–nh2上的一个或多个氢可以任选地被r基团取代。r可以独立地为氢、烷基、烯基、炔基、环烷基、环烯基、环炔基、芳基、杂芳基、杂脂环基、芳烷基或(杂脂环基)烷基。

如本文中使用的,“核苷酸”包括含氮的杂环碱基、糖、以及一个或多个磷酸酯基团。它们是核酸序列的单体单元。在rna中,所述糖为核糖,而在dna中,所述糖为脱氧核糖,即,该糖缺少在核糖中存在的羟基。含氮的杂环碱基可以为嘌呤或嘧啶碱基。嘌呤碱基包括腺嘌呤(a)和鸟嘌呤(g),及其修饰的衍生物或类似物。嘧啶碱基包括胞嘧啶(c)、胸腺嘧啶(t)和尿嘧啶(u),及其修饰的衍生物或类似物。脱氧核糖的c-1原子与嘧啶的n-1或嘌呤的n-9相键合。

如本文中使用的,“核苷”与核苷酸在结构上相似,但缺少磷酸酯部分。核苷类似物的一个实例为其中标记与碱基连接且不存在与糖分子相连的磷酸酯基团的核苷类似物。本文使用的术语“核苷”为本领域技术人员所理解的一般含义。实例包括但不限于包含核糖部分的核糖核苷以及包含脱氧核糖部分的脱氧核糖核苷。修饰的戊糖部分是其中氧原子已被碳原子替换和/或碳原子已被硫或氧原子替换的戊糖部分。“核苷”是可具有被取代的碱基和/或糖部分的单体。此外,可以将核苷并入至更大的dna和/或rna聚合物和低聚物中。

本文使用的术语“嘌呤碱基”为本领域技术人员所理解的其一般含义,且包括其互变异构体。类似的,本文使用的术语“嘧啶碱基”为本领域技术人员所理解的其一般含义,且包括其互变异构体。任选取代的嘌呤碱基的非限制性实例包括嘌呤、腺嘌呤、鸟嘌呤、次黄嘌呤、黄嘌呤、别黄嘌呤、7-烷基鸟嘌呤(例如,7-甲基鸟嘌呤)、可可碱、咖啡因、尿酸和异鸟嘌呤。嘧啶碱基的实例包括但不限于胞嘧啶、胸腺嘧啶、尿嘧啶、5,6-二氢尿嘧啶和5-烷基胞嘧啶(例如,5-甲基胞嘧啶)。

如本文中使用的,“衍生物”或“类似物”意为合成的具有修饰的碱基部分和/或修饰的糖部分的核苷酸或核苷。scheit,nucleotideanalogs(johnwiley&son,1980)和uhlman等人,chemicalreviews90:543-584,1990中论述了这类衍生物和类似物。核苷酸类似物也包括修饰的磷酸二酯连接,包括硫代磷酸酯连接、二硫代磷酸酯连接、烷基磷酸酯连接、苯胺磷酸酯连接和氨基磷酸酯连接。本文中使用的“衍生物”、“类似物”和“修饰的”可互换使用,并且由本文所定义的术语“核苷酸”和“核苷”所涵盖。

如本文中使用的,术语“磷酸酯”为本领域技术人员所理解的其一般含义,并包括其质子化形式(例如)。如本文中使用的,术语“单磷酸酯”、“二磷酸酯”和“三磷酸酯”为本领域技术人员理解的其一般含义,且包括质子化形式。

本文使用的术语“保护基”指加入分子中以防止该分子中的现有基团进行不希望的化学反应的任何原子或原子组。有时“保护基”和“封闭基团”可互换使用。

如本文中使用的,前缀“光”或“光-”意为涉及光或电磁辐射。该术语可包含全部或部分的电磁光谱,包括但不限于光谱中的一个或多个通常被称为无线电部分、微波部分、红外线部分、可见光部分、紫外线部分、x射线部分或伽马射线部分的范围。光谱的所述部分可以是被表面的金属区域如本文所述的那些金属所阻挡的部分。可选择地或另外地,光谱的所述部分可以是通过表面的空隙区域如由玻璃、塑料、二氧化硅或本文所述的其它材料制成的区域的部分。在特别的实施方案中,可以使用能穿过金属的辐射。可选择地或另外地,可以使用被玻璃、塑料、二氧化硅或本文所述的其他材料遮蔽的辐射。

如本文中使用的,术语“定相(phasing)”指sbs中的现象,该现象由3’终止子和荧光团的不完全除去引起,不能通过聚合酶在给定的测序循环中将dna链的一部分完全并入到簇中。预定相(pre-phasing)是由在不存在有效的3’终止子的情况下核苷酸的并入所引起的,并且该并入事件预先进行了1个循环。定相和预定相使特定循环的提取强度由当前循环的信号和来自先前和随后循环中的噪声组成。随着循环数的增加,受定相所影响的每簇的序列部分也会增加,妨碍正确碱基的识别。在合成法测序(sbs)过程中,痕量的未保护或未封闭的3’-oh的存在能引起预定相。在制造过程中或可能在储存过程和试剂处理过程中可以产生未保护的3’-oh核苷酸。因此,令人惊讶地发现了降低预定相的发生率的核苷酸类似物,其相比于现有的核苷酸类似物在sbs应用中提供了巨大优势。例如,所提供的核苷酸类似物能够使sbs周期加快,降低定相值和预定相值,以及延长测序读取长度。

3’-oh保护基-c(r)2n3

本文描述的某些实施方案涉及修饰的核苷酸或核苷分子,其具有可除去的3’-羟基保护基-c(r)2n3,其中r选自氢、-c(r1)m(r2)n、-c(=o)or3、-c(=o)nr4r5、-c(r6)2o(ch2)pnr7r8和-c(r9)2o-ph-c(=o)nr10r11,其中r1、r2、r3、r4、r5、r6、r7、r8、r9、r10、r11、m、n和p由上文定义。

在某些实施方案中,一个r为氢且另一个r为-c(r1)m(r2)n。在某些这样的实施方案中,-c(r1)m(r2)n选自-chf2、-ch2f、-chcl2或-ch2cl。在一个实施方案中,-c(r1)m(r2)n为-chf2。在另一个实施方案中,-c(r1)m(r2)n为-ch2f。

在某些实施方案中,一个r为氢且另一个r为-c(=o)or3。在某些这样的实施方案中,r3为氢。

在某些实施方案中,一个r为氢且另一个r为-c(=o)nr4r5。在某些这样的实施方案中,r4和r5均为氢。在另一些这样的实施方案中,r4为氢且r5为c1-6烷基。在另一些实施方案中,r4和r5均为c1-6烷基。在一个实施方案中,r5为正丁基。在另一个实施方案中,r4和r5均为甲基。

在某些实施方案中,一个r为氢且另一个r为-c(r6)2o(ch2)pnr7r8。在某些这样的实施方案中,r6均为氢。在某些这样的实施方案中,r7和r8均为氢。在某些这样的实施方案中,p为0。在另一些这样的实施方案中,p为6。

在某些实施方案中,一个r为氢且另一个r为-c(r9)2o-ph-c(=o)nr10r11。在某些这样的实施方案中,r9均为氢。在某些这样的实施方案中,r10和r11均为氢。在另一些这样的实施方案中,r10为氢且r11为取代的烷基。在一个实施方案中,r11为氨基取代的烷基。

3’-oh保护基的脱保护

在某些实施方案中,所述3’-oh保护基在与膦的脱保护反应中被除去。-c(r)2n3中的叠氮基团可以通过修饰的核苷酸或核苷分子与膦接触而转化为氨基。可选择地,-c(r)2n3中的叠氮基团可以通过这类分子与硫醇、特别是与诸如二硫苏糖醇(dtt)的水溶性硫醇接触而转化为氨基。在一个实施方案中,所述膦为三(羟甲基)膦(thp)。除非另外说明,对核苷酸的提及也旨在适用于核苷。

可检测标记

本文描述的某些实施方案涉及常规可检测标记的使用。可通过任何适合的方法进行检测,包括荧光光谱学或其他光学手段。优选的标记为荧光团,该荧光团在吸收能量后发出限定波长的辐射。已知许多种适合的荧光标记。例如,welch等人(chem.eur.j.5(3):951-960,1999)公开了丹酰基-功能化的荧光部分,其可在本发明中使用。zhu等人(cytometry28:206-211,1997)描述了荧光标记cy3和cy5的使用,其也可以在本发明中使用。prober等人(science238:336-341,1987)、connell等人(biotechniques5(4):342-384,1987)、ansorge等人(nucl.acidsres.15(11):4593-4602,1987)和smith等人(nature321:674,1986)也公开了适合使用的标记。其他可商业购得的荧光标记包括但不限于荧光素、若丹明(包括tmr、德克萨斯红和rox)、alexa、氟硼荧、吖啶、香豆素、芘、苯并蒽和花青苷。

本申请中也可以使用多重标记,例如双荧光团fret盒(tet.let.46:8867-8871,2000)、也可以使用多荧光体树枝状系统(j.am.chem.soc.123:8101-8108,2001)。虽然优选荧光标记,对于本领域的普通技术人员来说其他形式的可检测标记也明显适用。例如微颗粒,包括量子点(empodocles等人,nature399:126-130,1999)、金纳米颗粒(reichert等人,anal.chem.72:6025-6029,2000)和微珠(lacoste等人,proc.natl.acad.sciusa97(17):9461-9466,2000)也都可以使用。

本申请也可以使用多组分标记。多组分标记是依赖于与用于检测的另外化合物的相互作用的标记。在生物学中最常用的多组分标记是生物素-链霉亲和素系统。生物素用作与核苷酸碱基相连接的标记。然后单独加入链霉亲和素使检测发生。可以使用其他多组分系统。例如,二硝基苯酚具有可商业购得的可用于检测的荧光抗体。

除非另外说明,对核苷酸的提及也旨在适用于核苷。本申请也将就dna进行进一步描述,而该描述也适用于rna、pna和其他核酸,除非另外指明。

连接基团

在本文描述的某些实施方案中,可以将修饰的核苷酸或核苷分子的嘌呤或嘧啶碱基与上文描述的可检测标记相连接。在某些这类实施方案中,所用的连接基团可裂解。使用可裂解的连接基团确保了在需要时所述标记能够在检测后被除去,这避免了与随后并入的任何标记的核苷酸或核苷的任何干扰信号。

在另一些实施方案中,所使用的连接基团是不可裂解的。因为在并入了本发明的标记核苷酸的每个情况中,不需要随后并入核苷酸,因此不需要将标记从核苷酸中除去。

本领域技术人员了解双脱氧核苷三磷酸酯在所谓的sanger测序法及相关方案(sanger型)中的效用,其依赖于在特定类型核苷酸处的随机链终止。sanger型测序方案的一个实例是由metzker描述的bass方法。

通常通过实施如下实验来操作sanger及sanger型方法,在该实验中提供八类核苷酸,其中四类核苷酸包含3’-oh基团;四类核苷酸遗漏了oh基团且该核苷酸彼此不同地被标记。所用的遗漏了3’-oh基团的核苷酸为双脱氧核苷酸(ddntps)。如本领域技术人员所熟知的,当所述ddntps被不同地标记时,通过测定被并入的末端核苷酸的位置,并结合此信息,可以测定目标寡核苷酸的序列。

应认识到本申请中的核苷酸在sanger法及相关方案中具有效用,因为通过使用ddntps实现的相同效果可以通过使用本文描述的3’-oh保护基来实现:均防止了后续核苷酸的并入。

此外,应领会到通过在连接的磷酸酯基团中使用放射性的32p,可以测定对3’-oh被保护的核苷酸的并入的监测。这些可以或者存在于ddntps自身中或者存在于用于延伸的引物中。

可裂解的连接基团是本领域中熟知的,并且可应用常规化学将连接基团与核苷酸碱基和标记相连。可通过任何适合的方法裂解所述连接基团,包括暴露于酸、碱、亲核试剂、亲电试剂、自由基、金属、还原剂或氧化剂、光、温度、酶等。还可以使用用于断裂3’-o-保护基键的相同催化剂裂解本文中讨论的连接基团。如greene&wuts,protectivegroupsinorganicsynthesis(有机合成中的保护基),johnwiley&sons中所公开的,合适的连接基团可修改自标准的化学保护基。guillier等人(chem.rev.100:2092-2157,2000)中还公开了用于固相合成的合适的可裂解的连接基团。

使用术语“可裂解的连接基团”并非意味着需要除去整个连接基团,例如,从核苷酸碱基中除去。当可检测标记与碱基相连接时,核苷裂解位点可位于连接基团上的位置,该位置能够确保在裂解后一部分的连接基团仍与所述核苷酸碱基保持连接。

当可检测标记与碱基相连接时,连接基团可以连接在核苷酸碱基上的任何位置上,只要watson-crick碱基配对仍然能够进行。对于嘌呤碱基,优选地,连接基团经由嘌呤或优选的脱氮杂嘌呤类似物的7位、经由8-修饰的嘌呤、经由n-6修饰的腺苷或n-2修饰的鸟嘌呤连接。对于嘧啶,优选地经由胞嘧啶、胸腺嘧啶或尿嘧啶上的5-位以及胞嘧啶上的n-4位连接。

a.亲电裂解的连接基团

亲电裂解的连接基团典型地被质子所裂解,并包括对酸敏感的裂解。合适的连接基团包括修饰的苄基系统,诸如三苯甲基、对烃氧基苄基酯和对烃氧基苄基酰胺。其他适合的连接基团包括叔丁氧羰基(boc)基团和缩醛系统。

为制备合适的连接分子,还可以考虑在硫缩醛或其他含硫保护基的裂解中使用诸如镍、银或汞的亲硫金属。

b.亲核裂解的连接基团

在连接分子的制备中,亲核裂解也是被公认的方法。可以使用在水中不稳定的基团(即,能够在碱性ph值下简单地裂解),例如酯类,以及对非水性亲核试剂不稳定的基团。氟离子可用于裂解诸如三异丙基硅烷(tips)或叔丁基二甲基硅烷(tbdms)的基团中的硅氧键。

c.可光解的连接基团

可光解的连接基团在糖化学中被广泛使用。优选地,激活裂解所需的光不影响修饰的核苷酸中的其他组分。例如,如果使用荧光团作为标记,优选地,该荧光团吸收与裂解所述连接分子所需的光不同波长的光。适合的连接基团包括那些基于o-硝基苄基化合物和硝基藜芦基化合物的连接基团。也可以使用基于安息香化学的连接基团(lee等人,j.org.chem.64:3454-3460,1999)。

d.还原条件下的裂解

已知多种对还原裂解敏感的连接基团。使用基于钯催化剂的催化氢化已用于裂解苄基和苄氧羰基基团。二硫键还原也为本领域所知。

e.氧化条件下的裂解

基于氧化的方法为本领域所公知。这些方法包括对烃氧基苄基的氧化以及硫和硒连接基团的氧化。使用碘溶液(aqueousiodine)来使二硫化物和其他基于硫或硒的连接基团裂解也在本发明的范围内。

f.安全拉手型连接基团

安全拉手型连接基团(safety-catchlinker)为那些在两步中裂解的连接基团。在优选的系统中,第一步是反应性亲核中心的产生,随后的第二步涉及分子内环化,这导致裂解。例如,可以用肼或光化学方法处理乙酰丙酸酯连接来释放活性的胺,然后所述胺被环化以使分子中其他位置的酯裂解(burgess等人,j.org.chem.62:5165-5168,1997)。

g.经消除机理裂解

也可以使用消除反应。可以使用诸如芴甲氧羰基和氰基乙基的基团的碱催化的消除以及烯丙基系统的钯催化的还原消除。

在某些实施方案中,连接基团可包含间隔单元。连接基团的长度并不重要,只要所述标记与核苷酸保持足够的距离,以免干扰核苷酸与酶之间的相互作用。

在某些实施方案中,连接基团可由与3’-oh保护基类似的功能组成。这会使脱保护和脱保护方法更加有效,因为仅需要单一处理就除去标记和保护基。特别优选的连接基团是可通过膦裂解的含叠氮化物的连接基团。

测序方法

本文描述的修饰的核苷或核苷酸可以与各种测序技术联合使用。在某些实施方案中,测定目标核酸的核苷酸序列的过程可以是自动化过程。

本文提供的核苷酸类似物可以用于测序程序中,例如合成法测序(sbs)技术中。简单来说,可以通过将目标核酸与一种或多种标记的核苷酸、dna聚合酶等接触来引发sbs。其中使用目标核酸作为模板延伸引物的那些特征将并入可被检测的标记的核苷酸。任选的,标记的核苷酸可以进一步包括可逆终止性质,即,一旦核苷酸已被加入到引物中,终止引物的进一步延伸。例如,可以将具有可逆终止子部分的核苷酸类似物加入到引物中,以至于不会发生后续的延伸直至递送去封闭试剂以除去所述部分。因此,对于使用可逆终止的实施方案,可以将去封闭试剂递送至流动的细胞中(在进行检测之前或之后)。在不同的递送步骤之间可以进行洗涤。然后可以将此循环重复n次,由n个核苷酸延伸所述引物,由此检测长度为n的序列。示例性的sbs程序、流体系统以及易适于与本公开的方法产生的阵列联用的检测平台描述于例如,bentley等人,nature456:53-59(2008)、wo04/018497、wo91/06678、wo07/123744、美国专利no7,057,026、7,329,492、7,211,414、7,315,019或7,405,281、以及美国专利申请公开第2008/0108082a1号,各自以参考的方式并入本文。

可以使用采用循环反应的其他测序程序,例如焦磷酸测序。随着将特定的核苷酸并入初始的核酸链,焦磷酸测序检测无机焦磷酸酯(ppi)的释放(ronaghi等人,analyticalbiochemistry242(1),84-9(1996)、ronaghi,genomeres.11(1),3-11(2001)、ronaghi等人science281(5375),363(1998)、美国专利nos.6,210,891、6,258,568和6,274,320,各自以参考的方式并入本文)。在焦磷酸测序中,释放的ppi可以通过由atp硫酸化酶将其转化为三磷酸腺苷(atp)来检测,且生成的atp可以通过荧光素酶产生的光子来检测。因此,可通过发光检测系统监测测序反应。用于基于荧光的检测系统的激发辐射源对于焦磷酸测序程序而言不是必需的。适用的流体系统、检测器以及能够用于将焦磷酸测序应用于本公开的阵列的程序描述于例如,wipo专利申请ser.no.pct/us11/57111、美国专利申请公开no.2005/0191698a1、美国专利no.7,595,883、以及美国专利no.7,244,559,各自以参考的方式并入本文。

连接法测序反应也同样适用,包括,例如,shendure等人.science309:1728-1732(2005)、美国专利no.5,599,675、以及美国专利no.5,750,341所描述的连接法测序反应,各自以参考的方式并入本文。某些实施方案可包括杂交法测序程序,例如,bains等人,journaloftheoreticalbiology135(3),303-7(1988)、drmanac等人,naturebiotechnology16,54-58(1998)、fodor等人,science251(4995),767-773(1995)、以及wo1989/10977中所描述的杂交法测序程序,各自以参考的方式并入本文。在连接法测序和杂交法测序二者中,存在于含凝胶的孔(或其他的凹形特征物)中的核酸经历寡核苷酸递送和检测的重复循环。用于sbs方法的流体系统如本文阐述,或如本文所引用的参考文献所述,所述流体系统易适于递送用于连接法测序或杂交法测序程序的试剂。典型地,所述寡核苷酸被荧光标记并且能够使用荧光检测器进行检测,该荧光检测器与本文或本文所引用的参考文献中就sbs程序所描述的检测器类似。

某些实施方案可以使用涉及实时监测dna聚合酶活性的方法。例如,核苷酸并入可以通过在带有荧光团的聚合酶与γ-磷酸酯-标记的核苷酸之间的荧光共振能量转移(fret)相互作用来检测,或使用零级波导来检测。用于基于fret的测序的技术和试剂描述于,例如,levene等人science299,682–686(2003)、lundquist等人opt.lett.33,1026–1028(2008)、korlachetal.proc.natl.acad.sci.usa105,1176–1181(2008),此公开内容以参考的方式并入本文。

某些sbs实施方案包括检测在核苷酸并入延伸产物时释放的质子。例如,基于检测被释放的质子的测序可以使用电检测器和可从iontorrent(guilford,ct,生命科技子公司)商购的相关技术,或者使用美国专利申请公开no.2009/0026082a1、2009/0127589a1、2010/0137143a1、或2010/0282617a1中描述的测序方法和系统,各自以参考的方式并入本文。

本申请还包括以下技术方案:

1.修饰的核苷酸或核苷分子,其包含嘌呤或嘧啶碱基和核糖或脱氧核糖糖部分,所述糖部分具有可除去的3’-羟基保护基,所述可除去的3’-羟基保护基形成与所述3’-碳原子共价连接的结构-o-c(r)2n3,其中

r选自氢、-c(r1)m(r2)n、-c(=o)or3、c(=o)nr4r5、-c(r6)2o(ch2)pnr7r8和-c(r9)2o-ph-c(=o)nr10r11

r1和r2各自独立地选自氢、任选取代的烷基或卤素;

r3选自氢或任选取代的烷基;

r4和r5各自独立地选自氢、任选取代的烷基、任选取代的芳基、任选取代的杂芳基或任选取代的芳烷基;

r6和r9各自选自氢、任选取代的烷基或卤素;

r7、r8、r10和r11各自独立地选自氢、任选取代的烷基、任选取代的芳基、任选取代的杂芳基或任选取代的芳烷基;

m为0-3的整数;

n为0-3的整数;条件是m+n的总和等于3;以及

p为0-6的整数;条件是r1和r2不能均为卤素;以及至少一个r不为氢。

2.如技术方案1所述的修饰的核苷酸或核苷分子,其中一个r为氢且另一个r为-c(r1)m(r2)n。

3.如技术方案1或2所述的修饰的核苷酸或核苷分子,其中-c(r1)m(r2)n选自-chf2、-ch2f、-chcl2或-ch2cl。

4.如技术方案1-3中任一项技术方案所述的修饰的核苷酸或核苷分子,其中-c(r1)m(r2)n为-chf2。

5.如技术方案1-3中任一项技术方案所述的修饰的核苷酸或核苷分子,其中-c(r1)m(r2)n为-ch2f。

6.如技术方案1所述的修饰的核苷酸或核苷分子,其中一个r为氢且另一个r为-c(=o)or3

7.如技术方案6所述的修饰的核苷酸或核苷分子,其中r3为氢。

8.如技术方案1所述的修饰的核苷酸或核苷分子,其中一个r为氢且另一个r为-c(=o)nr4r5

9.如技术方案1或8所述的修饰的核苷酸或核苷分子,其中r4和r5均为氢。

10.如技术方案1或8所述的修饰的核苷酸或核苷分子,其中r4为氢且r5为c1-6烷基。

11.如技术方案1或8所述的修饰的核苷酸或核苷分子,其中r4和r5均为c1-6烷基。

12.如技术方案1所述的修饰的核苷酸或核苷分子,其中一个r为氢且另一个r为-c(r6)2o(ch2)pnr7r8

13.如技术方案1或12所述的修饰的核苷酸或核苷分子,其中r6均为氢。

14.如技术方案1、12和13中任一项技术方案所述的修饰的核苷酸或核苷分子,其中r7和r8均为氢。

15.如技术方案1和12-14中任一项技术方案所述的修饰的核苷酸或核苷分子,其中p为0。

16.如技术方案1和12-14中任一项技术方案所述的修饰的核苷酸或核苷分子,其中p为6。

17.如技术方案1所述的修饰的核苷酸或核苷分子,其中一个r为氢且另一个r为-c(r9)2o-ph-c(=o)nr10r11

18.如技术方案1或17所述的修饰的核苷酸或核苷分子,其中r9均为氢。

19.如技术方案1、17和18中任一项技术方案所述的修饰的核苷酸或核苷分子,其中r10和r11均为氢。

20.如技术方案1、17和18中任一项技术方案所述的修饰的核苷酸或核苷分子,其中r10为氢且r11为氨基取代的烷基。

21.如技术方案1-14中任一项技术方案所述的修饰的核苷酸或核苷分子,其中在使用膦的脱保护反应中除去所述3’-羟基保护基。

22.如技术方案21所述的修饰的核苷酸或核苷分子,其中所述膦为三(羟甲基)膦(thp)。

23.如技术方案1-22中任一项技术方案所述的修饰的核苷酸或核苷分子,其中所述碱基经由可裂解的连接基团或不可裂解的连接基团与可检测标记连接。

24.如技术方案1-22中任一项技术方案所述的修饰的核苷酸或核苷分子,其中所述3’-羟基保护基经由可裂解的连接基团或不可裂解的连接基团与可检测标记连接。

25.如技术方案23或24所述的修饰的核苷酸或核苷分子,其中所述连接基团是可裂解的。

26.如技术方案23-25中任一项技术方案所述的修饰的核苷酸或核苷分子,其中所述可检测标记为荧光团。

27.如技术方案23-26中任一项技术方案所述的修饰的核苷酸或核苷分子,其中所述连接基团为对酸不稳定的、对光不稳定的或含有二硫键。

28.制备在测序反应中与目标单链多核苷酸互补的生长的多核苷酸的方法,其包括将技术方案1-27中任一项技术方案所述的修饰的核苷酸分子并入所述生长的互补多核苷酸,其中所述修饰的核苷酸的并入防止了任何后续的核苷酸引入所述生长的互补多核苷酸中。

29.如技术方案28所述的方法,其中所述修饰的核苷酸分子的并入通过末端转移酶、末端聚合酶或逆转录酶来实现。

30.测定目标单链多核苷酸的序列的方法,其包括

监测互补核苷酸的顺序并入,其中并入的至少一个互补核苷酸是技术方案23-27中任一项技术方案所述的修饰的核苷酸分子;以及

检测所述修饰的核苷酸分子的特性。

31.如技术方案30所述的方法,其中通过检测与所述碱基连接的所述可检测标记来测定所述修饰的核苷酸的特性。

32.如技术方案30或31所述的方法,其中在引入所述下一个互补核苷酸之前,将所述3’-羟基保护基和所述可检测标记除去。

33.如技术方案32所述的方法,其中所述3’-羟基保护基和所述可检测标记在单步的化学反应中除去。

34.试剂盒,包含多个技术方案1-27中任一项技术方案所述的修饰的核苷酸或核苷分子以及用于其的包装材料。

35.如技术方案34所述的试剂盒,还包含酶和适合于所述酶的作用的缓冲液。

实施例

以下实施例中进一步详细公开另外的实施方案,所述实施例不以任何方式有意限制权利要求的范围。实施例1-3中例示了多种具有被保护的3’-羟基的修饰的核苷酸的合成。

实施例1

具有3’-oh保护基的核苷酸的合成

方案1示例性说明了用于制备具有单氟甲基取代的叠氮基甲基作为3’-oh保护基的修饰的核苷酸的合成路线。化合物1a-1f使用修饰的胸腺嘧啶(t-pa)作为碱基。可以使用的碱基的其他非限制性实例包括cbz-pa、admf-pa和gpac-pa,其结构显示于上文的方案1中。

实验程序

于4℃下,向起始核苷1a(1.54g,2.5mmol)的无水ch3cn(25ml)溶液中加入2,6-二甲基吡啶(0.87ml,7.5mmol)、(2-氟乙基)(4-甲氧基苯基)硫烷(mpsf)(3.26g,17.5mmol),然后加入bz2o2(纯度50%,8.47g,17.5mmol)。反应混合物缓慢升温至室温。将所述混合物再搅拌6小时。tlc监测(etoac:dcm=2:8v/v)至可见该起始核苷被完全消耗。然后将反应减压浓缩至油状残留物。将石油醚(500ml)加入该混合物中,并用力搅拌10分钟。将石油醚层倾倒出,将剩余物用石油醚重复处理2次。将油状残留物在dcm/nahco3(1:1)(300ml)之间分配。分离有机层,水层用dcm进一步萃取(2×150ml)。合并的有机层用mgso4干燥,过滤并减压蒸除易挥发成分。通过biotag硅胶柱(50g),使用从石油醚到石油醚:etoac1:1(v/v)的梯度来纯化粗产物1c,得到1.63g核苷1b,为浅黄色泡沫(非对映异构体,产率82%)。1hnmr(d6dmso,400mhz):δ,0.95(s,9h,tbu),2.16–2.28(m,2h,h-2’),3.67(s,ome),3.65-3.85(m,2h,hh-5’),3.77(dd,j=11.1,4.5hz,1h,hh-5’),3.95-3.98(m,1h,h-4’),4.04(m,2h,ch2f),4.63-4.64(m,1h,h-3’),5.01-5.32(s,1h,ch),6.00(m,1h,h-1’),6.72-6.87(m,3h,ar),7.35-7.44(m,7h,ar),7.55-7.60(m,4h,ar),7.88(s,1h,h-6),9.95(brt,1h,nh),11.70(s,1h,nh)。

在n2下,向带有分子筛的起始核苷1b(1.14g,1.4mmol)的无水ch2cl2(14ml)溶液中加入环己烯(1.44ml,14mmol)。用干冰/丙酮浴将混合物冷却至-78℃。在n2下在90分钟内缓慢添加磺酰氯(580μl,7.2mmol)的dcm(14ml)溶液。20分钟后在该温度下tlc(etoac:石油醚=1:1v/v)表明起始核苷被完全消耗。减压(以及25℃的室温)下蒸除易挥发成分,并迅速地将油状残留物置于高真空中经过10分钟直到其呈泡沫状。粗产物用n2吹扫,然后溶解于无水dmf(5ml)中,并立即加入nan3(470mg,7mmol)。所得悬浮液在室温下搅拌2小时,或直到tlc表明反应完成且形成两个异构体(a和b)形式的1c。将反应混合物在etoac:nahco3(1:1)(200ml)之间分配。分离有机层,水层用etoac进一步萃取(2×100ml)。合并的有机萃取物用mgso4干燥,过滤并减压蒸除易挥发成分。通过biotag硅胶柱(25g),使用从石油醚到石油醚:etoac1:1(v/v)的梯度分离1c的两个非对映异构体(a和b),为浅黄色泡沫。

异构体a(370mg,产率:38%)。1hnmr(d6dmso,400mhz):δ1.02(s,9h,tbu),2.35–2.43(m,2h,h-2’),3.76-3.80(m,1h,h-5’),3.88-3.92(m,1h,h-5’),4.10-4.12(m,1h,h-4’),4.14(d,j=4.1hz2h,nhch2),4.46-4.60(m,3h,h-3’,ch2f),5.05-5.09(m,1h,chn3),6.11(t,j=6.1hz,1h,h-1’),7.47-7.51(m,6h,ar),7.64-7.68(m,4h,ar),7.97(s,1h,h-6),10.03(bt,1h,j=10.0hz,nh),11.76(s,1h,nh).19fnmr:-74.3(cf3),-230.2(ch2f)。

异构体b(253mg,产率:26%)。1hnmr(d6dmso,400mhz):δ1.01(s,9h,tbu),2.38–2.42(m,2h,h-2’),3.74-3.78(m,1h,h-5’),3.86-3.90(m,1h,h-5’),4.00-4.05(m,1h,h-4’),4.12(d,j=4.1hz2h,nhch2),4.45-4.60(m,3h,h-3’,ch2f),5.00-5.14(m,1h,chn3),6.09(t,j=6.1hz,1h,h-1’),7.41-7.50(m,6h,ar),7.63-7.66(m,4h,ar),7.95(s,1h,h-6),10.01(bs,1h,nh),11.74(s,1h,nh).19fnmr:-74.5(cf3),-230.4(ch2f)。

将起始材料1c(异构体a)(500mg,0.71mmol)溶解于thf(3ml)中,并在冰浴中冷却至4℃。然后缓慢加入tbaf(1.0m的thf溶液,5wt.%水,1.07ml,1.07mmol),历时5分钟。将反应混合物缓慢加热至室温。用tlc(石油醚:etoac3:7(v/v))监测反应进程。反应在1小时后终止,届时通过tlc不再可见起始材料。将反应溶液溶解在etoac(50ml)中,并加入nahco3(60ml)。将两层分离,并用另外的dcm萃取水层(50ml×2)。合并有机萃取物,干燥(mgso4),过滤,并蒸发,得到黄色油。通过biotag硅胶柱,使用从石油醚:etoac8:2(v/v)到etoac的梯度来纯化粗产物1d(异构体a),为白色固体(183mg,产率:56%)。

异构体a:1hnmr(400mhz,d6-dmso):δ2.24-2.35(m,2h,h-2’),3.56-3.66(m,2h,h-5’),3.96-4.00(m,1h,h-4’),4.23(s,2h,ch2nh),4.33-4.37(m,1h,h-3’),4.43-4.51(m,ch2f),5.12(br.s,1h,chn3),5.23(br.s,1h,5’-oh),6.07(t,j=6.7hz,1h,h-1’),8.26(s,1h,h-6),10.11(brs,1h,nh),11.72(brs,1h,nh)。19fnmr:-74.3(cf3),-230.5(ch2f)。

对于1c(异构体b),以360mg的规模实施了相同的反应,得到了相应的产物1d(异构体b,150mg,63%)。1hnmr(400mhz,d6-dmso):δ2.24-2.37(m,2h,h-2’),3.57-3.70(m,2h,h-5’),3.97-4.01(m,1h,h-4’),4.23(br.s,2h,ch2nh),4.33-4.37(m,1h,h-3’),4.44-4.53(m,ch2f),5.11-5.21(br.s,1h,chn3),5.23(br.s,1h,5’-oh),6.07(t,j=6.6hz,1h,h-1’),8.23(s,1h,h-6),10.09(brs,1h,nh),11.70(brs,1h,nh)。19fnmr:-74.1(cf3),-230.1(ch2f)。

相应的三磷酸酯1e的制备以及进一步将染料附接至核碱基上以得到完全功能化的三磷酸核苷(ffn)1f已报导于wo2004/018497,并通常为本领域技术人员所熟知。

实施例2

具有3’-oh保护基的核苷酸的合成

方案2示例性说明了用于制备具有c-酰氨基取代的叠氮基甲基作为3’-oh保护基的修饰的核苷酸的合成路线。化合物2a-2i使用修饰的胸腺嘧啶(t-pa)作为碱基。可以使用的碱基的其他非限制性实例包括cbz-pa、admf-pa和gpac-pa,其结构显示于上文的方案1中。在实验程序中,报道了具有n,n-二甲基-c(=o)-取代的叠氮基甲基保护基(r=nme2)的化合物2f和后续的反应。也制备了具有其他c-酰氨基的化合物,例如n-乙基-c(=o)-(r=nhet)。

实验程序

于4℃下,向起始核苷2a(4.27g,6.9mmol)的无水ch3cn(50ml)溶液中加入2,6-二甲基吡啶(2.4ml,20.7mmol)、s(ch2ch2oac)2(12.2g,69mmol),然后加入bz2o2(纯度50%,33.4g,69mmol)。反应混合物缓慢升温至室温。将所述混合物再搅拌12小时。tlc监测(etoac:dcm=4:6v/v)直至可见该起始核苷被完全消耗。然后将反应减压浓缩至油状残留物。将石油醚(800ml)加入该混合物中,并用力搅拌10分钟。将石油醚层倾倒出,剩余物用石油醚重复处理2次。然后将油状残留物在dcm/nahco3(1:1)(1000ml)之间分配。分离有机层,水层用dcm进一步萃取(2×500ml)。合并的有机层用mgso4干燥,过滤并减压蒸除易挥发成分。通过biotag硅胶柱(100g),使用从石油醚到石油醚:etoac2:8(v/v)的梯度来纯化粗产物2b,得到浅黄色泡沫(4.17g,产率:74%,非对映异构体)。

在n2下,向带有分子筛的起始核苷2b(4.54g,5.56mmol)的无水ch2cl2(56ml)溶液中加入环己烯(5.62ml,56mmol)。用冰浴将混合物冷却至4℃。在n2下缓慢添加磺酰氯(1.13ml,13.9mmol)的dcm(25ml)溶液,历时90分钟。30分钟后在该温度下,tlc(etoac:dcm=4:6v/v)表明有10%的起始核苷2b剩余。向反应混合物中另外加入磺酰氯(0.1ml)。tlc表明2b完全转化。减压(以及25℃的室温)蒸除易挥发成分,并迅速地将油状残留物置于高真空中10分钟直到其呈泡沫状。粗产物用n2吹扫,然后溶解于无水dmf(5ml)中,并立即加入nan3(1.8g,27.8mmol)。所得悬浮液在室温下搅拌2小时,或直到tlc表明反应完全并形成两种异构体(a和b)形式的2c。反应混合物在etoac:nahco3(1:1)(1000ml)之间分配。将有机层分离,水层用etoac进一步萃取(2×300ml)。合并的有机萃取物然后用mgso4干燥,过滤并减压蒸除易挥发成分。通过biotag硅胶柱(100g),使用从石油醚到石油醚:etoac1:1(v/v)的梯度分离两种非对映异构体2c(异构体a和b),为浅黄色泡沫。异构体a:1.68g,产率:40.7%,异构体b:1.79g,产率:43.2%。

向起始核苷2c(异构体a)(1.63g,2.2mmol)的meoh/thf(1:1)(20ml)溶液中缓慢加入naoh(1m水溶液)(2.2ml,2.2mmol),并在4℃下搅拌。用tlc(etoac:dcm=4:6v/v)监测反应进程。反应在1小时后终止,届时通过tlc不再可见起始材料。将反应混合物在dcm:nahco3(1:1)(150ml)之间分配。分离有机层,水层用dcm进一步萃取(2×70ml)。合并的有机萃取物用mgso4干燥,过滤并减压蒸除易挥发物质。通过biotag硅胶柱(10g),使用从石油醚:etoac(8:2)(v/v)到etoac的梯度纯化粗产物2d,为浅黄色泡沫(1.1g,产率:71%)。

对于2c(异构体b,1.57g)重复相同的反应,并得到了相应的产物2d(异构体b,1.01g,69%产率)。

室温下,向起始核苷2d(异构体a)(700mg,1mmol)的ch3cn(10ml)溶液中添加tempo(63mg,0.4mmol)和baib(644mg,2mmol)。用tlc(etoac:dcm=7:3v/v)监测反应进程。反应在2小时后终止,届时通过tlc不再可见起始材料。将反应混合物在dcm:na2s2o3(1:1)(100ml)之间分配。分离有机层,水层用dcm进一步萃取(2×70ml)。然后用nacl(饱和溶液)洗涤合并的有机萃取物。有机层在未经mgso4干燥的情况下减压蒸发,以防止产物沉淀析出。通过biotag硅胶柱(10g),使用从石油醚:etoac(1:1)(v/v)到etoac再到meoh:etoac(1:9)的梯度纯化粗产物2e,为浅黄色泡沫(异构体a,482mg,68%产率)。

对2d(异构体b,700mg)实施相同的反应,并得到相应的产物2e(异构体b,488mg,69%产率)。

室温下,向起始核苷2e(异构体a)(233mg,0.33mmol)的ch3cn(10ml)溶液中加入hunig’s碱(173μl,1mmol)和bop(165mg,0.39mmol)。搅拌5分钟后,用me2nh(2m的thf溶液)(0.41ml,0.82mmol)处理溶液。用tlc(meoh:dcm=1:9v/v)监测反应进程。反应在2小时后终止,届时通过tlc不再可见起始材料。反应混合物在dcm:nahco3(1:1)(50ml)之间分配。分离有机层,水层用dcm进一步萃取(2×30ml)。合并的有机萃取物用mgso4干燥,过滤并减压蒸除易挥发成分。通过biotag硅胶柱(10g),使用从dcm:etoac(8:2)(v/v)到etoac的梯度纯化粗产物2f(r=nme2),为浅黄色泡沫(异构体a,220mg,90%产率)。

对2e(异构体b,249mg)实施相同的反应,并得到了相应的产物2f(异构体b,240mg,92%产率)。

将起始材料2f(异构体a和b的混合物)(455mg,0.61mmol)溶解于thf(2ml)中,并用冰浴冷却至4℃。然后,缓慢加入tbaf(1.0m的thf溶液,5wt.%水,1.0ml,1.0mmol),历时5分钟。将反应混合物缓慢加热至室温。用tlc(etoac)监测反应进程,反应在1小时后终止,届时通过tlc不再可见起始材料。将反应溶液溶解在dcm(30ml)中,并加入nahco3(30ml)。将两层分离,并用另外的dcm萃取水层(30ml×2)。合并有机萃取物,干燥(mgso4),过滤,并蒸发,得到黄色油。通过biotag硅胶柱(10g),使用从dcm:etoac8:2(v/v)到etoac再到meoh:etoac(2:8)的梯度纯化粗产物2g,为白色固体(52%产率,160mg)。

相应的三磷酸酯2h的制备以及进一步将染料附接至核碱基上以得到完全功能化的三磷酸核苷(ffn)2i已报导于wo2004/018497,并通常为本领域技术人员所熟知。

实施例3

带有3’-oh保护基的核苷酸的合成

方案3示例性说明了用于制备具有二氟甲基取代的叠氮基甲基3’-oh保护基的修饰的核苷酸的合成路线。化合物3a-3i使用修饰的胸腺嘧啶(t-pa)作为碱基。可以使用的碱基的其他非限制性实例包括cbz-pa、admf-pa和gpac-pa,其结构显示于上文的方案1中。3b,3c和3d的合成程序描述于实施例2中。

实验程序

于-78℃下,将n-叔丁基苯硫腈氯化物(181mg,0.84mmol)的无水dcm(2ml)溶液缓慢添加至起始核苷3d(异构体a)(490mg,0.7mmol)与dbu(209μl,1.4mmol)的无水dcm(5ml)溶液中。反应混合物于-78℃下搅拌2小时。用tlc(etoac:dcm4:6v/v)监测反应进程。反应在2小时后终止,此时tlc表明仍剩余10%的起始材料,以防止过度反应。将反应混合物在dcm:nahco3(1:1)(50ml)之间分配。水层用dcm进一步萃取(2×30ml)。合并有机萃取物,干燥(mgso4),过滤、并蒸发,得到黄色油。通过biotag硅胶柱(10g),使用从石油醚:etoac(8:2)(v/v)到石油醚:etoac(2:8)(v/v)的梯度纯化粗产物3e,为浅黄色泡沫(异构体a,250mg,51%产率)。

对3d(异构体b,480mg)实施相同的反应,并得到了相应的产物3e(异构体b,240mg,50%产率)。

于4℃(冰浴)下,将dast(181mg,0.84mmol)的dcm(2.5ml)溶液缓慢添加至起始核苷3e(异构体a)(342mg,0.49mmol)、etoh(15μl,0.25mmol)的dcm(2.5ml)溶液中。将反应混合物于4℃下搅拌1小时。用tlc(etoac:石油醚=3:7v/v)监测反应进程。反应在1小时后终止。将反应混合物在dcm:nahco3(1:1)(50ml)之间分配。水层用dcm进一步萃取(2×30ml)。合并有机萃取物,干燥(mgso4),过滤,并蒸发,得到黄色油。通过biotag硅胶柱(10g),使用从石油醚:etoac(9:1)(v/v)到石油醚:etoac(2:8)(v/v)的梯度纯化粗产物3f,为浅黄色泡沫(异构体a,100mg,28%)。

对3e(异构体b,480mg)实施相同的反应,并得到了相应的产物3f(异构体b,240mg,50%产率)。

将起始材料3f(异构体a)(124mg,0.17mmol)溶解于thf(2ml)中,并用冰浴冷却至4℃。然后,缓慢加入tbaf(1.0m的thf溶液,5wt.%水,255μl,10.255mmol),历时5分钟。将反应混合物缓慢加热至室温。用tlc(etoac)监测反应进程。反应在1小时后终止,届时通过tlc不再可见起始材料。将反应溶液溶解于dcm(30ml)中,并加入到nahco3(30ml)中。将两层分离,水层用另外的dcm萃取(30ml×2)。合并有机萃取物,干燥(mgso4),过滤,并蒸发,得到黄色油。通过biotag硅胶柱(4g),使用从dcm:etoac8:2(v/v)到etoac再到meoh:etoac(2:8)的梯度纯化粗产物3g,为浅黄色泡沫(异构体a,54%产率,44mg)。

异构体a:1hnmr(400mhz,d6-dmso):δ2.24-2.35(m,2h,h-2’),3.56-3.66(m,2h,h-5’),3.96-4.00(m,1h,h-4’),4.23(s,2h,ch2nh),4.33-4.37(m,1h,h-3’),4.85(s,2h,och2n3),5.23(t,j=5.1hz,1h,5’-oh),6.07(t,j=6.7hz,1h,h-1’),8.19(s,1h,h-6),10.09(brs,1h,nh),11.70(brs,1h,nh)。19fnmr:-74.4(cf3),-131.6(ch2f)。

对3f(异构体b,133mg)实施相同的反应,并得到了相应的产物3g(异构体b,48mg,54%产率)。1hnmr(400mhz,d6-dmso):δ2.27-2.44(m,2h,h-2’),3.58-3.67(m,2h,h-5’),4.00-4.02(m,1h,h-4’),4.24(d,j=4.1hz,2h,ch2nh),4.57-4.58(m,1h,h-3’),5.24-5.29(m,2h,5’-oh,ochn3),6.07-6.34(m,2h,h-1’,chf2),8.19(s,1h,h-6),10.09(brs,1h,nh),11.70(brs,1h,nh)。19fnmr:-74.2(cf3),-131.4(ch2f)。

相应的三磷酸酯3h的制备以及进一步将染料附接至核碱基上以得到完全功能化的三磷酸核苷(ffn)3i已报导于wo2004/018497,并通常为本领域技术人员所熟知。

实施例4

3’-oh保护基的热稳定性测试

针对多种3’-oh保护基的热稳定性进行了研究(图1a)。通过在60℃下,加热0.1mm的在ph=9缓冲液(tis-hcl50mm,nacl50mm,吐温0.05%,mg2so46mm)中的每种3’-oh被保护的核苷酸来评价热稳定性。选取了多个时间点,并使用hplc来分析未被封闭的材料的形成。发现-ch2f和-c(o)nhbu的稳定性比标准物叠氮基甲基(-ch2n3)保护基高约2倍。发现-cf2h基团的稳定性比该标准物高约10倍(图1b)。

实施例5

3’-oh保护基的脱保护

又研究了多种3’-oh保护基的脱保护反应速率。将标准物叠氮基甲基保护基的脱保护速率与-ch2f取代的叠氮基甲基和-c(o)nhbu取代的叠氮基甲基进行比较。观察到使用膦(1mmthp)作为脱保护试剂时,相比于所述标准物叠氮基甲基保护基,两种更加热稳定的3’-oh封闭基被更快地除去。见图2a。例如,-ch2f和-c(o)nhbu的半存留期(half-life)分别为8.9分钟和2.9分钟,相比之下叠氮基甲基的半存留期为20.4分钟(图2b)。

实施例6

测序实验

制备具有-ch2f(mono-f)取代的叠氮基甲基3’-oh保护基的修饰的核苷酸,并在miseq平台上评价了其测序性能。预期3’-oh保护基的增加的稳定性会使得用于测序化学的核苷酸质量更高,并具有更少的污染的3’-未被封闭的核苷酸。在sbs测序试剂盒中3’-未被封闭的核苷酸的存在会因此导致预定相事件,将该预定相事件读为预定相值。

首先使用短的12次循环测序实验来产生定相值和预定相值。根据以下浓度使用mono-f取代的叠氮基甲基保护的ffns:ffa-染料1(2um)、fft-染料2(10um)、ffc-染料3(2um)和ffg-染料4(5um)。mono-f取代的叠氮基甲基基团包括异构体a和b。两种染料——染料2在标准miseq试剂盒中,而染料5用于标记fft。表1显示了多种具有mono-f取代的叠氮基甲基的异构体a和b的核苷酸组合,并针对定相影响和预定相影响进行了评价。在所有情况下,预定相值都大幅低于对照——使用标准v2miseq试剂盒核苷酸作为对照(图3)。

表1

测序质量测试

在miseq上实施了2×400bp测序,以评价这些核苷酸对于改善测序质量的潜力。根据制造商的说明书(illuminainc.,圣迭戈,ca)实施测序运行。标准并入缓冲液被替换为含有全部mono-f封闭的ffn的并入缓冲液,各自具有单独的染料标记:ffa-染料1(2um)、fft-染料2(1um)、ffc-染料3(2um)和ffg-染料4(5um)。使用的dna库由b仙人掌属基因组dna根据标准truseqht方案来制得。

在两组测序实验中(使用mono-f封闭的异构体a和b),观察到非常低的预定相值。与低的定相值相联系,在这两组情况中,应用这些新的核苷酸产生了优异的2×400bp测序数据,且>80%的碱基在q30以上(见图4a异构体a的q分值,以及图4b异构体b的q分值图)。这些结果证实了相比miseqv2试剂盒(2×250bp,在典型的r&d测序实验中80%的碱基>q30,或者按照规定的说明书,70%的碱基>q30)具有显著改进。如下文所示,表2综合了当在imx中使用全部mono-fffns-a-异构体时的测序数据。表3综合了在imx中使用全部mono-fffns-b-异构体的测序数据。

表2

表3

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1