本申请要求于2018年3月15日提交的美国第62/643,633号临时申请的权益,其全部内容通过引用整体并入本文。
通过引用并入&序列表
在本申请中,引用了各种出版物和专利。这些参考文献的完整引用可以在权利要求书之前的说明书结尾处找到。这些出版物和专利的全部公开内容通过引用整体并入到本申请中,以更充分地描述本发明所属领域的技术水平。
本申请通过引用并入了存在于名为“190314_90419-a-pct_sequencelisting_rbr.txt”的文件中的核苷酸和/或氨基酸序列,该文件的大小为3kb,并于2019年3月14日以ibm-pc机格式创建,具有与ms-windows操作系统的兼容性,该文件作为本申请的一部分包含在于2019年3月14日提交的文本文件中。
背景技术:
dna测序是生物学和医学研究中的基本工具,并且对个性化医学的范例特别重要。为了最终实现$1,000基因组的目标,已经研究了各种新的dna测序方法。最主要的方法是边合成边测序(sbs),该方法可确定聚合酶反应过程中的dna序列(hyman1988;ronaghietal.1998;juetal.2003;li2003;braslavskyetal.2003;rupareletal.2005;marguliesetal.2005;juetal.2006;wuetal.2007;guoetal.2008;bentleyetal.2008;harrisetal.2008;eidetal.2009;rothbergetal.2011)。当前广泛使用的高通量sbs技术(bentleyetal.2008)使用以前开发的可切割的荧光核苷酸可逆终止子(nrt)测序化学技术((juetal.2003;juetal.2006)。这些可切割的荧光nrt是基于以下原理设计的:四种核苷酸(a、c、g、t)中的每一种都通过将独特的可切割的荧光团连接到碱基的特定位置并用一个小的可逆部分对3'-oh基团进行封端来进行修饰,以使它们仍被dna聚合酶识别为底物。因此,可切割的荧光nrt涉及两个位点修饰(juetal.2003;juetal.2006):碱基上的用作报告基团的荧光染料,和用于对3′-oh基团进行封端的小的化学部分,以在核苷酸掺入后暂时终止聚合酶反应以进行序列测定。掺入并检测信号后,切割荧光团并去除3′-oh封端部分,以恢复下一个循环中的聚合酶反应。这些可切割的荧光nrt已被证明是重新改造的聚合酶的良好底物,并已广泛用于下一代dna测序系统中(juetal.2006;bentleyetal.2008)。而且,由于在每个循环中仅鉴别出一个碱基,因此它们能够准确确定均聚物序列。
已经使用了采用可切割的荧光核苷酸类似物作为可逆终止子对表面固定的dna进行测序的sbs方法(juetal.2003;lietal.2003;rupareletal.2005;juetal.2006;wuetal.2007;guoetal.2008)。在这种方法中,核苷酸在两个特定位置处被修饰,以使它们仍可被dna聚合酶识别为底物:(i)将具有不同荧光发射的不同荧光团通过可切割的接头连接到四种碱基中的每一种碱基的特定位置,并且(ii)3'-oh基团被一个小的化学可逆部分所封端。dna聚合酶仅将与共价连接至表面的dna模板上的碱基互补的单个核苷酸类似物掺入。掺入后,检测到独特的荧光发射以鉴别掺入的核苷酸。随后除去荧光团,并使3'-oh基团化学再生,这使得聚合酶反应的下一个循环得以进行。因为dna芯片上的较大表面可以具有高密度的不同的点样的(spotted)dna模板,所以每个循环可以并行鉴别多个碱基,从而可以同时对大量dna分子进行测序。先前的研究工作已经牢固地建立了分子水平策略,以通过将可切割的荧光染料连接到碱基上并用一个小的部分对3′-oh进行可逆地封端来合理地修饰核苷酸以进行sbs。
已经报道了一类具有未被保护的3'-oh和在碱基和荧光染料之间连接的可切割的二硫接头的核苷酸类似物(turcattietal.2008;mitraetal.2003)。但是,在引物/模板上进行dna聚合酶催化的延伸反应并对掺入的碱基进行成像后,二硫键(disulfidelinkage)的切割产生游离的反应性-sh基团,该-sh基团必须在第二次延伸反应可以进行之前用如下所示的烷基化剂碘乙酰胺封端。该封端步骤不仅在该过程中增加了额外的步骤,而且由于核苷酸碱基部分上的较长的残尾,而限制了连续添加多个核苷酸。通过这种方法,测序读取长度被限制为仅10个碱基(turcattietal.2008)。其他基于二硫的方法也需要进行类似的封端反应,以使游离的sh基团不发生反应(mitraetal.2003)。
技术实现要素:
本发明提供了一种核酸测序方法,其包括:
a)提供至少一种与引物杂交的核酸模板;
b)用聚合酶和选自以下的至少一种来延伸与所述核酸模板杂交的引物:
i)荧光标记的核苷酸类似物,其中所述荧光标记的核苷酸类似物具有通过可切割的接头与碱基连接的标记和3'-羟基基团上的保护基团,其中不同的核苷酸可以具有不同的锚和不同的可切割基团;
ii)锚标记的核苷酸类似物,其中所述锚标记的核苷酸类似物具有通过可切割的接头与碱基连接的锚和3'-羟基基团上的保护基团,其中不同的核苷酸可以具有不同的锚和不同的可切割基团;或者
iii)荧光标记的核苷酸类似物和锚标记的核苷酸类似物的组合,其中所述荧光标记的核苷酸类似物或锚标记的核苷酸类似物具有通过可切割的接头与碱基连接的标记和3'-羟基基团上的保护基团,其中不同的核苷酸可以具有不同的可切割的基团;
c)任选地用3′被保护的且没有任何碱基修饰的核苷酸来延伸任何未延伸的引物,并鉴别由于掺入了荧光核苷酸类似物而产生的荧光信号;
d)任选地用荧光标记的锚结合分子来标记锚连接的引物延伸产物;
e)鉴别由于在步骤d中进行的标记而新产生的荧光信号以部分或完全地鉴别所掺入的核苷酸;
f)任选地重复步骤d和步骤e;
g)任选地用特异性可切割剂从荧光标记的核苷酸上切割标记,该特异性可切割剂切割接头中的一种,但不切割正交接头;
h)鉴别由于在步骤f中进行的切割而导致的荧光丢失,以部分或完全地鉴别所掺入的核苷酸;
i)任选地重复步骤g和步骤h;
j)通过比较步骤c、步骤e和步骤h中获得的结果,确定掺入的特定核苷酸类似物;
k)从延伸的引物上切割任何剩余的标记或锚,同时恢复3'-羟基基团;和
l)重复执行步骤a至步骤k以获取核酸模板的序列,从而对核酸进行测序。
本发明还提供了一种核酸测序方法,其包括:
a)提供至少一种与引物杂交的核酸模板;
b)用聚合酶和和一组带有标记和锚的正交集的核苷酸类似物(a、c、g和t)延伸与所述核酸模板杂交的引物,第一核苷酸类似物具有直接与碱基连接的荧光标记,第二核苷酸类似物具有直接与碱基连接的不同的荧光标记,第三核苷酸类似物具有与碱基连接的锚部分,第四核苷酸类似物具有与碱基连接的不同的锚部分,其中所述荧光或锚标记的核苷酸类似物具有通过相同类型的可切割接头与碱基连接的标记和3′-羟基位置上的具有相同的可切割部分的保护基团;
c)任选地用3′被保护的且没有任何碱基修饰的核苷酸来延伸任何未延伸的引物,并鉴别由于掺入了荧光核苷酸类似物而产生的荧光信号;
d)用荧光标记的锚结合分子来标记包含锚部分的引物延伸产物,其中用于连接至两种不同的锚的锚结合分子包含与步骤b中的核苷酸类似物相同的两种荧光标记;
e)鉴别由于在步骤d中进行的标记而新产生的荧光信号,以确定剩余的两种掺入的核苷酸类似物;
f)从引物延伸产物上切割任何剩余的染料和锚,并恢复3′-羟基基团;并且
重复执行步骤a至步骤f,以获得核酸模板的序列。
本发明还提供了一种核酸测序方法,其包括:
a)提供与引物杂交的核酸模板;
b)用聚合酶和荧光标记的核苷酸类似物(a、c、g和t)的正交集延伸与所述核酸模板杂交的引物,第一核苷酸类似物具有通过可切割的接头直接与碱基连接的荧光染料,第二核苷酸类似物具有通过不同类型的可切割的接头直接与碱基连接的相同的荧光染料,第三核苷酸类似物具有通过第一类型的可切割的接头直接与碱基连接的第二染料,第四核苷酸类似物具有通过第二类型的可切割的接头直接与碱基连接的第二染料,其中第二可切割的接头中的可切割的部分可以在与3′-羟基位置处的可切割的保护部分相同的条件下被切割;
c)任选地用3'被保护的且没有任何碱基修饰的核苷酸来延伸任何未延伸的引物,并鉴别由于掺入了荧光标记的核苷酸类似物而产生的荧光信号,从而部分确定了四种核苷酸中的两种的掺入;
d)用切割第一类型的接头的特异性试剂从掺入引物中的荧光标记的核苷酸上切割染料;
e)鉴别由于在步骤d中进行的切割而导致的荧光丢失;
f)通过比较步骤c和步骤e中获得的结果,确定掺入的特定核苷酸类似物;
g)从延伸的引物上切割任何剩余的染料,同时恢复3′-羟基基团;并且
重复执行步骤a至步骤g,以获得核酸模板的序列。
本发明还提供了一种核酸测序方法,其包括:
a)提供至少一种与引物杂交的核酸模板;
b)用聚合酶和锚标记的核苷酸类似物(a、c、g和t)的正交集延伸与所述核酸模板杂交的引物,第一核苷酸类似物具有通过第一类型的可切割的接头直接与碱基连接的锚部分,第二核苷酸类似物具有通过第二类型的可切割的接头直接与碱基连接的相同的锚部分,第三核苷酸类似物具有通过第一类型的可切割的接头直接与碱基连接的第二锚部分,第四核苷酸类似物具有通过第二类型的可切割的接头直接与碱基连接的第二锚部分,其中第二类型的可切割的接头中的可切割的部分可以在与3′-羟基位置处的可切割的保护部分相同的条件下被切割;
c)任选地用3'被保护的且没有任何碱基修饰的核苷酸来延伸任何未延伸的引物;
d)使用对第一锚具有特异性的荧光标记的锚结合分子,来标记用具有第一锚的核苷酸类似物延伸的引物;
e)鉴别由于在步骤d中进行的标记而产生的荧光信号,以部分地确定4种掺入的核苷酸类似物中的2种;
f)使用对第二锚具有特异性的荧光标记的锚结合分子,来标记用具有第二锚的核苷酸类似物延伸的引物,其中所述荧光标记是与对第一锚具有特异性的锚结合分子相连接的相同的标记;
g)鉴别由于在步骤f中进行的标记而新产生的荧光信号,以部分地确定4种掺入的核苷酸类似物中的另外2种;
h)用切割第一类型的接头的特异性可切割剂从荧光标记的核苷酸上切割标记和锚;
i)鉴别由于在步骤h中进行的切割而导致的荧光丢失;从而
j)通过比较步骤e、步骤g和步骤i中获得的结果,确定掺入引物中的特定核苷酸类似物;
k)从延伸的引物上切割任何剩余的染料或锚,同时恢复3′-羟基基团;并且
重复执行步骤a至步骤i,以获得核酸模板的序列。
本发明还提供了一种核酸测序方法,其包括:
a)提供至少一种与引物杂交的核酸模板;
b)用聚合酶和锚标记的核苷酸类似物(a、c、g和t)的正交集延伸与所述核酸模板杂交的引物,第一核苷酸类似物具有通过第一类型的可切割的接头直接与碱基连接的染料,第二核苷酸类似物具有通过第二类型的可切割的接头直接与碱基连接的相同的染料,第三核苷酸类似物具有通过第一类型的可切割的接头直接与碱基连接的锚部分,第四核苷酸类似物具有通过第二类型的可切割的接头直接与碱基连接的相同的锚部分,其中第二类型的可切割的接头中的可切割的部分可以在与在3'-羟基位置处的可切割的保护部分相同的条件下被切割;
c)任选地用3'被保护的且没有任何碱基修饰的核苷酸来延伸任何未延伸的引物,并鉴别荧光信号以部分地确定四种核苷酸类似物中的两种;
d)使用对锚具有特异性的荧光标记的锚结合分子,来标记用具有所述锚的核苷酸类似物延伸的引物;
e)鉴别由于步骤d中进行的标记而新产生的荧光,以部分地确定四种掺入的核苷酸中的另外两种;
f)用切割第一类型的接头的特异性可切割剂从荧光标记的核苷酸上切割染料和锚;
g)鉴别由于在步骤f中进行的切割而导致的荧光丢失;从而
h)通过比较步骤c、步骤e和步骤g中获得的结果,确定掺入引物中的特定核苷酸类似物;
i)从延伸的引物上切割任何剩余的染料或锚,同时恢复3'-羟基基团;并且
重复执行步骤a至步骤i,以获得核酸模板的序列。
本发明还提供了具有以下结构的双脱氧核苷酸三磷酸酯(ddntp)类似物:
其中:
i)碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、次黄嘌呤或它们的类似物;
ii)可切割的接头为ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物,并通过嘧啶(c、u)的5位或嘌呤(a、g)的7位与碱基连接;
iii)碱基和标记之间的所述可切割的接头包含长度不同的聚合物分子;
iv)标记包括荧光染料、荧光染料簇、用于染料连接的锚和/或用于染料连接的锚簇。
本发明还提供了具有以下结构的核苷酸类似物:
其中,碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、次黄嘌呤或它们的类似物;可切割的接头包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物;碱基和标记之间的连接物包括聚合物分子;阻断物是包含无碱基糖或修饰的核苷或它们的组合的2-50个单体单元的核苷酸或寡核苷酸;阻断物通过可切割的接头与嘧啶(c、u)的5位和脱氮嘌呤(a、g、i)的7位相连接,
其中阻断物是在通过核苷酸聚合酶掺入核苷酸类似物之后阻止其他核苷酸或核苷酸类似物进一步掺入引物链的分子;
标记包括荧光染料、荧光染料簇、用于通过锚结合分子连接荧光染料的锚或用于通过锚结合分子连接荧光染料的锚簇,其中标记与阻断物相连接。
本发明还提供了具有以下结构的核苷酸类似物:
其中,碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、次黄嘌呤或它们的类似物;x是可切割的触发部分,包括ss(dtm)、偶氮、烯基、2-硝基苄基或叠氮基;连至标记(y)的波浪线包括各种长度的聚合物分子;y是标记,包括荧光染料、荧光染料簇、用于结合荧光染料的锚部分或用于结合荧光染料的锚部分的簇。
本发明还提供了具有以下结构的核苷酸类似物:
其中,碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、次黄嘌呤或它们的类似物;x是可切割的基团,包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物;w是可切割的基团,包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物;
其中x和w包含相同或不同的可切割的基团;
y是标记,包括荧光染料、荧光染料簇、用于结合荧光染料的锚部分或用于结合荧光染料的锚部分的簇;
z是fret供体或受体染料。
本发明还提供了具有以下结构的核苷酸类似物:
其中,碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、次黄嘌呤或它们的类似物;x是可切割的基团,包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物;w是可切割的基团,包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物;
其中x和w包含相同或不同的可切割的基团;
y是标记,包括荧光染料、荧光染料簇、用于结合荧光染料的锚部分或用于结合荧光染料的锚部分的簇。
附图说明
图1:两种通用的核苷酸类似物结构,其涵盖了第i-iii节的大多数变体。
图2:第i节中用于sbs成像的重要核苷酸类似物的通用结构。
图3a:第ii节中用于sbs成像的重要核苷酸类似物的通用结构。
图3b:第iii节中用于sbs成像的重要核苷酸类似物的通用结构。
图3c:第iv节中用于sbs成像的重要核苷酸类似物的通用结构。
图4:用于第i-iii节的另一类分子,其中能量转移发生在位于相同核苷酸类似物上不同位置处的供体和受体之间。
图5:用于使用方案i中描述的方法进行2-色dnasbs的3'-o-ss(dtm)-dntp-ss-染料(3'-o-ss-datp-7-ss-rox和3'-o-ss-dutp-5-ss-bodipyfl)和3'-o-ss(dtm)-dntp-ss-偶氮-染料(3'-o-ss-dctp-5-偶氮-rox或3’-o-ss-dctp-5-ss-偶氮-rox、3’-o-ss-dgtp-7-偶氮-bodipyfl或3’-o-ss-dgtp-7-ss-偶氮-bodipyfl)。
图6:用于使用方案ii中描述的方法进行1-色dnasbs的3’-o-ss(dtm)-dntp-ss-染料(3’-o-ss-datp-7-ss-atto647n)、3’-o-ss(dtm)-dntp-偶氮-染料(3’-o-ss-dttp-5-偶氮-atto647n或3’-o-ss-dttp-5-ss-偶氮-atto647n)、3'-o-ss(dtm)-dntp-ss-锚(3’-o-ss-dctp-5-ss-生物素)、3’-o-ss-dgtp-7-ss-偶氮-锚(3’-o-ss-dgtp-7-偶氮-生物素或3’-o-ss-dgtp-7-ss-偶氮-生物素)和相应的染料标记的结合分子(atto647n标记的链霉亲和素)。
图7:用于使用方案iii中描述的方法进行1-色dnasbs的3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素和3’-o-ss-dgtp-7-ss-tco)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dttp-5-偶氮-tco或3’-o-ss-dttp-5-ss-偶氮-tco和3’-o-ss-dctp-5-偶氮-生物素或3’-o-ss-dctp-5-ss-偶氮-生物素)和相应的染料标记的结合分子(atto647n标记的链霉亲和素和atto647n标记的四嗪)。
图8a-图8c:用于使用方案iv中描述的方法进行1-色dnasbs的3’-o-ss(dtm)-dntp-ss-锚簇(3’-o-ss-dctp-5-ss-生物素簇)、3’-o-ss(dtm)-dntp-偶氮-锚簇(3’-o-ss-dgtp-7-偶氮-生物素簇或3’-o-ss-dgtp-7-ss-偶氮-生物素簇)、3’-o-ss(dtm)-dntp-ss-染料簇(3’-o-ss-datp-7-ss-atto647n簇)和3’-o-ss(dtm)-dntp-偶氮-染料簇(3’-o-ss-dttp-5-偶氮-atto647n或3’-o-ss-dttp-5-ss-偶氮-atto647n)以及相应的染料标记的结合分子(atto647n标记的链霉亲和素)。
图9a-图9b:用于使用方案v中描述的方法进行2-色dnasbs的3’-o-ss(dtm)-dntp-ss-锚簇(3’-o-ss-datp-7-ss-生物素簇、3’-o-ss-dgtp-7-ss-tco簇)和3’-o-ss(dtm)-dntp-偶氮-锚簇(3’-o-ss-dctp-5-偶氮-生物素簇或3’-o-ss-dctp-5-ss-偶氮-生物素簇、3’-o-ss-dttp-5-偶氮-tco簇或3’-o-ss-dttp-5-ss-偶氮-tco簇)以及相应的染料标记的结合分子(rox标记的链霉亲和素和alexa488标记的四嗪)。
图10a:用于使用方案via中描述的方法进行2-色dnasbs的3’-o-ss(dtm)-dntp-ss-染料簇(3’-o-ss-datp-7-ss-rox簇、3’-o-ss-dttp-5-ss-bodipyfl簇)和3’-o-ss(dtm)-dntp-ss-锚簇(3’-o-ss-dctp-5-ss-生物素簇、3’-o-ss-dgtp-7-ss-tco簇)以及相应的染料标记的结合分子(rox标记的链霉亲和素和bodipyfl标记的四嗪)。
图10b:用于使用方案vib中描述的方法进行2-色dnasbs的3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素和3’-o-ss-dgtp-7-ss-tco)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dttp-5-偶氮-tco和3’-o-ss-dctp-5-偶氮-生物素)以及相应的量子点标记的结合分子(qdot525标记的链霉亲和素和qdot605标记的四嗪)。
图10c:用于使用方案vic中描述的方法进行一种激光-2-色dnasbs的3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素和3’-o-ss-dgtp-7-ss-tco)、3’-o-ss-dntp-ss-锚-簇(3’-o-ss-dttp-5-ss-生物素-生物素-tco和3’-o-ss-dctp-5-ss-生物素-tco)以及相应的量子点标记的结合分子(qdot525标记的链霉亲和素和qdot605标记的四嗪)。
图10d:用于使用方案vid中描述的方法进行2-色dnasbs的3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dttp-5-偶氮-tco和3’-o-ss-dctp-5-偶氮-生物素)、3’-o-锚-ss(dtm)-dntp(3’-o-tco-ss(dtm)-dgtp)以及相应的量子点标记的结合分子(qdot605标记的四嗪和qdot525标记的链霉亲和素)。如果需要,可以将各种长度的延伸的peg接头置于如图10c所示的量子点标记的结合分子上。
图10e:用于使用方案vie中描述的方法进行一种激光-2-色dnasbs的3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素和3’-o-ss-dgtp-7-ss-tco)、3’-o-锚-ss(dtm)-dntp-ss-锚-簇(3’-o-tco-ss-dttp-5-ss-生物素-生物素和3’-o-tco-ss-dctp-5-ss-生物素)以及相应的量子点标记的结合分子(qdot605标记的四嗪和qdot525标记的链霉亲和素)。如果需要,可以将各种长度的延伸的peg接头置于如图10c所示的量子点标记的结合分子上。
图11:用于基于荧光共振能量转移(fret)的边合成边测序的核苷酸可逆终止子的通用结构。
图12a:用于使用方案viia中描述的方法进行1-色dnasbs的3’-o-ss(dtm)-dntp-ss-供体染料-锚(3’-o-ss-datp-7-ss-cy3-生物素和3’-o-ss-dgtp-7-ss-cy3-tco)、3’-o-ss(dtm)-dntp-供体染料-偶氮-锚(3’-o-ss-dttp-5-偶氮-cy3-tco或3’-o-ss-dttp-5-ss-偶氮-cy3-tco和3’-o-ss-dctp-5-偶氮-cy3-生物素或3’-o-ss-dctp-5-ss-偶氮-cy3-生物素)以及相应的受体染料标记的结合分子(cy5标记的链霉亲和素和cy5标记的四嗪)。尽管未在该图中示出,但可将供体染料-锚的簇而不是每种的单个拷贝置于核苷酸类似物上。
图12b-图12c:用于使用方案viib中描述的方法进行1-色dnasbs的3’-o-锚-ss(dtm)-dntp-偶氮-供体染料(3’-o-tco-ss-dttp-5-ss-偶氮-cy3、3’-o-tco-ss-dttp-5-偶氮-cy3、3’-o-生物素-ss-dctp-5-ss-偶氮-cy3和3’-o-ss-生物素-dctp-5-偶氮-cy3)、3’-o-锚-ss(dtm)-dntp-ss-供体染料(3’-o-生物素-ss-datp-7-ss-cy3、3’-o-tco-ss-dgtp-7-ss-cy3)以及相应的受体染料标记的结合分子(cy5标记的链霉亲和素和cy5标记的四嗪)。在该图中,锚分子通过在炔烃和叠氮化物之间形成三唑而与ss键连接。另一种选择是通过氨基和酸之间的酰胺键将锚连接至ss键。
图12d-图12e:可用于使用方案viib中描述的方法进行1-色dnasbs的、作为分子的替代集合的3’-o-锚-ss(dtm)-dntp-偶氮-受体染料(3’-o-tco-ss-dttp-5-ss-偶氮-cy5、3’-o-tco-ss-dttp-5-偶氮-cy5、3’-o-生物素-ss-dctp-5-ss-偶氮-cy5和3’-o-ss-生物素-dctp-5-偶氮-cy5)、3’-o-锚-ss(dtm)-dntp-ss-受体染料(3’-o-生物素-ss-datp-7-ss-cy5、3’-o-tco-ss-dgtp-7-ss-cy5)以及相应的供体标记的结合分子(量子点标记的链霉亲和素和量子点标记的四嗪,或cy3标记的链霉亲和素和cy3标记的四嗪)。例如,可以将qd用作cy5的供体,而不是使用cy3作为cy5的供体。在该图中,锚分子通过在炔烃和叠氮化物之间形成三唑而与ss键连接。另一种选择是通过氨基和酸之间的酰胺键将锚连接至ss键。
图13:3’-o-ss-dntp-偶氮-染料或-锚的一般合成。
图14a-14b:3’-o-ss-dntp-偶氮-染料的合成:以3’-o-ss-dctp-5-偶氮-bodipyfl和3’-o-ss-dgtp-7-偶氮-rox为例。
图15a-15b:3’-o-ss-dntp-偶氮-锚的合成:以3’-o-ss-dctp-5-偶氮-生物素和3’-o-ss-datp-7-偶氮-tco为例。
图16:锚分子簇nhs酯的合成:以生物素簇nhs酯和tco簇nhs酯为例。
图17:染料簇nhs酯的合成以及bodipyfl簇nhs酯、rox簇nhs酯和atto647n簇nhs酯的示例结构。
图18:3’-o-dtm(ss)-dntp-ss-染料簇的合成:以3’-o-dtm(ss)-datp-7-ss-rox簇和3’-o-dtm(ss)-dttp-5-ss-bodipyfl簇为例。
图19:3’-o-dtm(ss)-dntp-ss-锚簇的合成:以3’-o-dtm(ss)-dctp-5-ss-生物素簇和3’-o-dtm(ss)-dgtp-7-ss-tco簇为例。
图20:3’-o-dtm(ss)-dntp-偶氮-染料或-锚簇的一般合成。
图21:锚或染料簇-偶氮-nhs酯的合成:以tco-、生物素-和atto647n-偶氮nhs酯为例。
图22:3’-o-dtm(ss)-dntp-偶氮-染料或锚簇的合成:以3’-o-dtm(ss)-dttp-5-偶氮-tco簇、3’-o-dtm(ss)-dttp-5-偶氮-atto647n簇和3’-o-dtm(ss)-dgtp-7-偶氮-生物素簇为例。
图23a:供体染料-锚-nhs酯的合成,以cy3-tco-nhs酯和cy3-生物素-nhs酯为例。
图23b:二-锚-nhs酯的合成(以tco-生物素-nhs酯为例)。
图24a:供体染料-锚簇-nhs酯的合成,以cy3-生物素簇-nhs酯为例。
图24b:三锚簇-nhs酯的合成(以生物素-生物素-tco-nhs酯为例)。
图25:供体染料-锚(或锚簇)-偶氮接头-nhs酯的合成,以cy3-生物素-偶氮-nhs酯和cy3-tco簇-偶氮-nhs酯为例。
图26:3’-o-ss-dntp-供体染料锚(或锚簇)的一般合成。
图27:3’-o-ss-dntp-偶氮-染料-锚(或-锚簇)的一般合成。
图28:3’-o-dtm(ss)-dntp-ss-染料-锚的合成:以3’-o-dtm(ss)-datp-7-ss-cy3-生物素和3’-o-dtm(ss)-dgtp-7-ss-cy3-tco为例。
图29a-29b:3’-o-ss-dntp-偶氮-染料-锚的合成:以3’-o-ss-dctp-5-偶氮-cy3-生物素和3’-o-ss-dttp-5-偶氮-cy3-tco为例。
图30a:3’-o-dtm(ss)-dntp-可切割的接头(例如ss或偶氮)-供体染料(例如cy3)-锚簇(生物素、tco或pba)的合成示例。
图30b:3’-o-锚-ss(dtm)-dntp-偶氮-供体染料(以3’-o-tco-ss-dttp-5-ss-偶氮-cy3和3’-o-tco-ss-dttp-5-偶氮-cy3为例)的合成。
图30c:3’-o-锚-ss(dtm)-dntp-偶氮-供体染料(3’-o-生物素-ss-dctp-5-ss-偶氮-cy3和3’-o-生物素-ss-dctp-5-偶氮-cy3)的合成。
图30d-30e:3’-o-锚-ss(dtm)-dntp-ss-供体染料(以3’-o-tco-ss-dgtp-7-ss-cy3、3’-o-生物素-ss-datp-7-ss-cy3为例)的合成。
图30f:染料(供体或受体)-锚-炔烃、n3簇酸和n3簇-偶氮-酸的合成。
图30g:染料(供体或受体)-锚簇-nhs酯和染料(供体或受体)-锚簇-偶氮-nhs酯的合成。
图30h:3’-o-ss-dntp-ss-染料(供体或受体)-锚簇的一般合成。
图30i:3’-o-ss-dntp-ss-偶氮-染料(供体或受体)-锚簇的一般合成。
图30j:3’-o-ss-dntp-偶氮-染料(供体或受体)-锚簇的一般合成。
图30k:用于量子点(qd)标记的结合分子(以qd标记的四嗪为例)的合成的一般方法。可以将商购的羧酸改性的qd与四嗪peg胺偶联,得到qd标记的四嗪。
图31a-31e:使用3’-o-ss(dtm)-dntp-ss-染料(3’-o-ss-datp-7-ss-rox、3’-o-ss-dttp-5-ss-bodipyfl)和3’-o-ss(dtm)-dntp-偶氮-染料(3’-o-ss-dctp-7-偶氮-rox、3’-o-ss-dgtp-5-偶氮-bodipyfl)进行2-色dnasbs的方案i的示意图。
图32a-32d:使用3’-o-ss(dtm)-dntp-ss-染料(3’-o-ss-datp-7-ss-atto647n)、3’-o-ss(dtm)-dntp-偶氮-染料(3’-o-ss-dttp-5-偶氮-atto647n)、3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-dctp-5-ss-生物素)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dgtp-7-偶氮-生物素)和相应的染料标记的结合分子(atto647n标记的链霉亲和素)进行1-色dnasbs的方案ii的示意图。
图33a-33d:示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dttp-5-偶氮-tco、3’-o-ss-dctp-5-偶氮-生物素)和相应的染料标记的结合分子(atto647n标记的链霉亲和素和atto647n标记的四嗪)进行1-色dnasbs的方案iii的示意图。
图34a-34c:示出了使用3’-o-ss(dtm)-dntp-ss-染料簇(3’-o-ss-datp-7-ss-atto647n簇)、3’-o-ss(dtm)-dntp-偶氮-染料簇(3’-o-ss-dttp-5-偶氮-atto647n簇)、3’-o-ss(dtm)-dntp-ss-锚簇(3’-o-ss-dctp-5-ss-生物素簇)、3’-o-ss(dtm)-dntp-偶氮-锚簇(3’-o-ss-dgtp-7-偶氮-生物素簇)和相应的染料标记的结合分子(atto647n标记的链霉亲和素)进行1-色dnasbs的方案iv的示意图。
图35a-35d:示出了使用3’-o-ss(dtm)-dntp-ss-锚簇(3’-o-ss-datp-7-ss-生物素簇、3’-o-ss-dgtp-7-ss-tco簇)、3’-o-ss(dtm)-dntp-偶氮-锚簇(3’-o-ss-dctp-5-偶氮-生物素簇、3’-o-ss(dtm)-dttp-5-偶氮-tco簇)和相应的染料标记的结合分子(rox标记的链霉亲和素和alexa488标记的四嗪)进行2-色dnasbs的方案v的示意图。
图36a-36c:示出了使用3’-o-ss(dtm)-dntp-ss-染料簇(3’-o-ss-datp-7-ss-rox簇、3’-o-ss-dttp-5-ss-bodipyfl簇)、3’-o-ss(dtm)-dntp-ss-锚簇(3’-o-ss-dctp-5-ss-生物素簇、3’-o-ss-dgtp-7-ss-tco簇)和相应的染料标记的锚结合分子(链霉亲和素-rox、四嗪-bodipyfl)进行2-色dnasbs的方案via的示意图。
图37a-37c:示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dttp-5-偶氮-tco、3’-o-ss-dctp-5-偶氮-生物素)和相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)进行2-色dnasbs的方案vib的示意图。
图38a-38d:示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco、3’-o-ss-dttp-5-ss-生物素/生物素/tco、3’-o-ss-dctp-5-ss-生物素/tco)和相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)进行2-色dnasbs的方案vic的示意图。
图39a-39c:示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dttp-5-偶氮-tco、3’-o-ss-dctp-5-偶氮-生物素)、3’-o-锚-ss(dtm)-dntp(3’-o-tco-ss-dgtp)和相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)进行2-色dnasbs的方案vid的示意图。
图40a-40c:示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco)、3’-o-锚-ss(dtm)-dntp-ss-锚(3’-o-tco-ss-dctp-5-ss-生物素、3’-o-tco-ss-dttp-5-ss-生物素/生物素)和相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)进行2-色dnasbs的方案vie的示意图。
图41a-41d:示出了使用3’-o-ss(dtm)-dntp-ss-供体染料-锚(3’-o-ss-datp-7-ss-cy3-生物素、3’-o-ss-dgtp-7-ss-cy3-tco)、3’-o-ss(dtm)-dntp-偶氮-供体染料-锚(3’-o-ss-dttp-5-偶氮-cy3-tco、3’-o-ss-dctp-5-偶氮-cy3-生物素)和相应的染料标记的结合分子(cy5标记的链霉亲和素和cy5标记的四嗪)进行1-色dnasbs的方案viia的示意图。
图42:用于使用方案ix中描述的方法进行2-色dnasbs的ddntp-ss-染料(ddatp-7-ss-rox和ddutp-5-ss-bodipyfl)和ddntp-ss-偶氮-染料(ddctp-5-偶氮-rox和ddgtp-7-偶氮-bodipyfl)。还示出了ddctp-5-ss-偶氮-rox和ddgtp-7-ss-偶氮-bodipyfl的结构,这些结构中,在偶氮基团和碱基之间具有额外的ss键。使用这种ss-偶氮接头的可能的优点是在切割后,保留了oh而不是nh2基团。用此种ddntp类似物终止的引物上nh2反应性基团的积累可能会干扰其附近的未来延伸反应。
图43:用于使用方案x中描述的方法进行1-色dnasbs的ddntp-ss-染料(ddatp-7-ss-atto647n)、ddntp-偶氮-染料(ddttp-5-偶氮-atto647n或ddttp-5-ss-偶氮-atto647n)、ddntp-ss-锚(ddctp-5-ss-生物素)、ddgtp-7-ss-偶氮-锚(ddgtp-7-偶氮-生物素或ddgtp-7-ss-偶氮-生物素)和相应的染料标记的结合分子(atto647n标记的链霉亲和素)。
图44:用于使用方案xi中描述的方法进行1-色dnasbs的ddntp-ss-锚(ddatp-7-ss-生物素和ddgtp-7-ss-tco)、ddntp-偶氮-锚(ddctp-5-偶氮-生物素或ddctp-5-ss-偶氮-生物素、ddttp-5-偶氮-tco或ddttp-5-ss-偶氮-tco)和相应的染料标记的结合分子(atto647n标记的链霉亲和素和atto647n标记的四嗪)。
图45a-45c:用于使用方案xii中描述的方法进行1-色dnasbs的ddntp-ss-锚簇(ddctp-5-ss-生物素簇)、ddntp-偶氮-锚簇(ddgtp-7-偶氮-生物素簇或ddgtp-7-ss-偶氮-生物素簇)、ddntp-ss-染料簇(ddatp-7-ss-atto647n簇)和ddntp-偶氮-染料簇(ddttp-5-偶氮-atto647n或ddttp-5-ss-偶氮-atto647n)和相应的染料标记的结合分子(atto647n标记的链霉亲和素)。
图46a-46b:用于使用方案xiii中描述的方法进行2-色dnasbs的ddntp-ss-锚簇(ddatp-7-ss-生物素簇、ddgtp-7-ss-tco簇)和ddntp-偶氮-锚簇(ddctp-5-偶氮-生物素簇或ddctp-5-ss-偶氮-生物素簇、ddttp-5-偶氮-tco簇或ddttp-5-ss-偶氮-tco簇)和相应的染料标记的结合分子(rox标记的链霉亲和素和alexa488标记的四嗪)。
图47:用于使用方案xiv中描述的方法进行2-色dnasbs的ddntp-ss-染料簇(ddatp-7-ss-rox簇、ddttp-5-ss-bodipyfl簇)和ddntp-ss-锚簇(ddctp-5-ss-生物素簇、ddgtp-7-ss-tco簇)和相应的染料标记的结合分子(rox标记的链霉亲和素和bodipyfl标记的四嗪)。
图48:用于使用方案viii和方案xv中描述的方法进行4-色dnasbs的ddntp-ss-染料(ddatp-7-ss-rox、ddttp-5-ss-r6g、ddctp-5-ss-alexa488和ddgtp-7-ss-cy5)。
图49a:用于使用方案xvia中描述的方法进行4-色dnasbs的ddntp-ss-锚(ddctp-5-ss-生物素和ddgtp-7-ss-tco)和ddntp-ss-染料(ddatp-7-ss-rox和ddutp-5-ss-bodipyf1)和相应的染料标记的结合分子(tamra标记的链霉亲和素和cy5标记的四嗪)。
图49b:用于使用方案xvib中描述的方法进行2-色dnasbs的ddntp-ss-锚(ddatp-7-ss-生物素和ddgtp-7-ss-tco)、ddntp-偶氮-锚(ddttp-5-偶氮-tco或ddttp-5-ss-偶氮-tco和ddctp-5-偶氮-生物素或ddctp-5-ss-偶氮-生物素)和相应的量子点标记的结合分子(qdot525标记的链霉亲和素和qdot605标记的四嗪)。
图49c:用于使用方案xvic中描述的量子点方法进行一种激光-2-色dnasbs的ddntp-ss-锚(ddatp-7-ss-生物素和ddgtp-7-ss-tco)、ddntp-ss-锚-簇(ddttp-5-ss-生物素-生物素-tco和ddctp-5-ss-生物素-tco)和相应的量子点标记的结合分子(qdot525标记的链霉亲和素和qdot605标记的四嗪)。
图50:用于基于荧光共振能量转移(fret)的边合成边测序的ddntp类似物的通用结构。
图51a-51b:用于使用方案xvii中描述的方法进行1-色dnasbs的ddntp-ss-供体染料-锚(ddatp-7-ss-cy3-生物素和ddgtp-7-ss-cy3-tco)、ddntp-供体染料-偶氮-锚(ddttp-5-偶氮-cy3-tco或ddttp-5-ss-偶氮-cy3-tco和ddctp-5-偶氮-cy3-生物素或ddctp-5-ss-偶氮-cy3-生物素)和相应的受体染料标记的结合分子(cy5标记的链霉亲和素和cy5标记的四嗪)。
图52:ddntp-pa(ddctp-5-pa、ddutp-5-pa、ddgtp-7-pa和ddatp-7-pa)的结构(guoetal2008,juetal2016us2016/0024574a1;hobbs&trainor1992us5151507a.)
图53:ddntp-ss-nh2(ddctp-5-ss-nh2和ddutp-5-ss-nh2)的合成。
图54:ddntp-ss-nh2(ddgtp-7-ss-nh2和ddatp-7-ss-nh2)的合成。
图55a-55b:ddntp-偶氮-染料的合成:以ddctp-5-偶氮-bodipyfl和ddgtp-7-偶氮-rox为例。
图56a-56b:ddntp-偶氮-锚的合成:以ddctp-5-偶氮-生物素和ddatp-7-偶氮-tco为例。
图57:ddntp-ss-染料簇的合成:以ddatp-7-ss-rox簇和ddttp-5-ss-bodipyfl簇为例。
图58:ddntp-ss-锚簇的合成:以ddctp-5-ss-生物素簇和ddgtp-7-ss-tco簇为例。
图59:ddntp-偶氮-染料或-锚簇的一般合成。
图60:ddntp-偶氮-染料或锚簇的合成:以ddttp-5-偶氮-tco簇、ddttp-5-偶氮-atto647n簇和ddgtp-7-偶氮-生物素簇为例。
图61:ddntp-供体染料锚(或锚簇)的一般合成。
图62:ddntp-偶氮接头-供体染料--锚的一般合成。
图63:ddntp-ss-染料-锚的合成:以ddatp-7-ss-cy3-生物素和ddgtp-7-ss-cy3-tco为例。
图64a-64b:ddntp-偶氮-染料-锚的合成:以ddctp-5-偶氮-cy3-生物素和ddutp-5-偶氮-cy3-tco为例。
图65a:ddntp-可切割的接头(以ss或偶氮为例)--供体染料(以cy3为例)-锚簇(以生物素、tco或pba为例)的示例合成。
图65b:ddntp-ss-染料(供体或受体)-锚簇的一般合成。
图65c:ddntp-ss-偶氮-染料(供体或受体)-锚簇的一般合成。
图65d:ddntp-偶氮-染料(供体或受体)-锚簇的一般合成。
图66:示出了使用四种ddntp-可切割的接头-染料核苷酸类似物和四种核苷酸可逆终止子进行杂交测序的一般方案viii的示意图。
图67a-67b:示出了使用ddntp-ss-染料(ddatp-7-ss-rox、ddttp-5-ss-bodipyfl)、ddntp-偶氮-染料(ddgtp-7-偶氮-bodipyfl、ddctp-5-偶氮-rox)和3’-o-ss-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案ix的示意图。
图68a-68c:使用ddntp-ss-染料(ddatp-7-ss-atto647n)、ddntp-偶氮-染料(ddttp-5-偶氮-atto647n)、ddntp-ss-锚(ddctp-5-ss-生物素)、ddntp-偶氮-锚(3’-o-ss-dgtp-7-偶氮-生物素)、相应的染料标记的结合分子(atto647n标记的链霉亲和素)和3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案x的示意图。
图69a-69d:示出了使用ddntp-ss-锚(ddatp-7-ss-生物素、ddgtp-7-ss-tco)、ddntp-偶氮-锚(ddttp-5-偶氮-tco、ddctp-5-偶氮-生物素)、相应的染料标记的结合分子(atto647n标记的链霉亲和素和atto647n标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案xi的示意图。
图70a-70c:示出了使用ddntp-ss-染料簇(ddatp-7-ss-atto647n簇)、ddntp-偶氮-染料簇(ddttp-5-偶氮-atto647n簇)、ddntp-ss-锚簇(ddctp-5-ss-生物素簇)、ddntp-偶氮-锚簇(ddgtp-7-偶氮-生物素簇)、相应的染料标记的结合分子(atto647n标记的链霉亲和素)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案xii的示意图。
图71a-71d:示出了使用ddntp-ss-锚簇(ddatp-7-ss-生物素簇、ddgtp-7-ss-tco簇)、ddntp-偶氮-锚簇(ddctp-5-偶氮-生物素簇、ddttp-5-偶氮-tco簇)、相应的染料标记的结合分子(rox标记的链霉亲和素和alexa488标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xiii的示意图。
图72a-72c:示出了使用ddntp-ss-染料簇(ddatp-7-ss-rox簇、dttp-5-ss-bodipyfl簇)、ddntp-ss-锚簇(ddctp-5-ss-生物素簇、ddgtp-7-ss-tco簇)、相应的染料标记的锚结合分子(链霉亲和素-rox、四嗪-bodipyfl)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xiv的示意图。
图73a-73b:示出了使用ddntp-ss-染料(ddatp-7-ss-rox、dttp-5-ss-r6g、ddctp-5-ss-alexa488、ddgtp-7-ss-cy5)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行4-色dnasbs的方案xv的示意图。
图74a-74c:示出了使用ddntp-ss-染料(ddatp-7-ss-rox、dttp-5-ss-bodipyfl)、ddntp-ss-锚(ddctp-5-ss-生物素、ddgtp-7-ss-tco)、相应的染料标记的锚结合分子(链霉亲和素-tamra、四嗪-cy5)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行4-色dnasbs的方案xvia的示意图。
图75a-75c:示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dttp-5-偶氮-tco、3’-o-ss-dctp-5-偶氮-生物素)、相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xvib的示意图。
图76a-76c:示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco、3’-o-ss-dttp-5-ss-生物素/生物素/tco、3’-o-ss-dctp-5-ss-生物素/tco)、相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)以进行2-色dnasbs的方案xvic的示意图。
图78:具有未被保护的3'-oh基团的核苷酸终止子的通用结构。给出了核苷酸、可切割的接头(底部示出的结构)、保护基团和染料的示例。
图79:具有通过不可切割的接头连接至嘧啶的5位或嘌呤的7位的聚合物链的双脱氧核苷酸类似物。除此图中所示的ddgtp类似物外,其它所有接头和聚合物之间都包含cy3染料。此处描述了这些修饰的ddntp类似物被dna聚合酶延伸的能力(图97和图98)。
图80:用于逐步单-色sbs(方案xviii)的含有3'-oh的dntp-ss-阻断物-染料分子的示例。
图81:用于进行单-色边合成边测序(方案xix)的含有3'-oh的dntp-可切割的接头-阻断物-染料分子的示例。
图82:用于单-色边合成边测序(方案xx)的含有3'-oh的dntp-可切割的接头-阻断物-染料、dntp-可切割的接头-阻断物-锚和染料标记的锚结合分子的示例。
图83:用于二-色边合成边测序(方案xxi)的含有3'-oh的dntp-可切割的接头-阻断物-染料、dntp-可切割的接头-阻断物-锚和染料标记的锚结合分子的示例。
图84:用于四-色边合成边测序(方案xxiia)的含有3'-oh的dntp-ss-阻断物-染料分子的示例。
图85:在多核苷酸阻断物上具有染料簇的含有3'-oh的datp-ss-阻断物分子的示例。
图86:在多核苷酸阻断物上具有染料簇的含有3'-oh的dctp-ss-阻断物分子的示例。
图87:在多核苷酸阻断物上具有染料簇的含有3'-oh的dgtp-ss-阻断物分子的示例。
图88:在多核苷酸阻断物上具有染料簇的含有3′-oh的dutp-ss-阻断物分子的示例。
图89a:在多核苷酸阻断物上具有锚簇的含有3'-oh的dutp-ss-阻断物分子的示例。用含有单一染料的锚结合分子标记导致形成这些核苷酸类似物上的染料簇。
图89b:用于使用方案xxiib中所描述的方法进行2-色dnasbs的含有3'-oh的dntp-可切割的接头-阻断物-锚和量子点标记的锚结合分子(qdot525标记的链霉亲和素和qdot605标记的四嗪)的示例。
图89c-89d:用于使用方案xxiic中所描述的方法进行2-色dnasbs的含有3'-oh的dntp-可切割的接头-阻断物-锚(datp-ss-阻断物-生物素、dgtp-ss-阻断物-tco、dctp-ss-阻断物-生物素-tco、dttp-ss-阻断物-生物素-生物素-tco)和量子点标记的锚结合分子(qdot525标记的链霉亲和素和qdot605标记的四嗪)。
图90:用于能量转移辅助的sbs的dntp-ss-阻断物-cy3-生物素、dntp-ss-阻断物-cy3-tco、cy5标记的链霉亲和素和cy5标记的四嗪的通用结构。
图91:用于能量转移辅助的sbs的dntp-偶氮-阻断物-cy3-生物素、dntp-偶氮-阻断物-cy3-tco、cy5标记的链霉亲和素和cy5标记的四嗪的通用结构。
图92a-92b:用于单-色sbs(方案xxiii)的核苷酸类似物(datp-ss-阻断物-cy3-生物素、dgtp-ss-阻断物-cy3-tco、dctp-偶氮-阻断物-cy3-生物素和dttp-偶氮-阻断物-cy3-tco)和标记的结合分子(cy5标记的四嗪和cy5标记的链霉亲和素)。
图93a:用于fret辅助的sbs(例如,方案xxiii)的具有多种染料或多种锚的dntp-ss-阻断物的通用结构。在该示例中,连接至ss可切割的接头的结构是由线性聚合物组成的阻断物,该线性聚合物具有供体染料和受体染料的2次重复(iteration)或供体染料和用于结合受体染料(例如,cy5、alexa647、atto647n)的锚的2次重复。可以将多于两个的拷贝(copy)连接到这种聚合物上。重要构思是,在将锚结合部分与受体染料结合后,供体染料和受体染料之间的距离将达到最大能量转移的理想距离(接近5nm),而重复单元之间将有足够的间隔以防止淬灭(quenching)。除此处示出的线性排列外,供体染料和锚/受体染料可以位于树枝状聚合物的不同分支上。可以使用包含偶氮、烯丙基、2nb或其他部分的不同的可切割的接头。
图93b:用于能量转移辅助sbs的dntp-ss-阻断物-cy3-锚(生物素、tco)簇和cy5标记的链霉亲和素和cy5标记的四嗪的通用结构。
图93c:用于能量转移辅助的bs的dntp-ss-阻断物-cy3-锚(生物素、tco)簇和cy5标记的链霉亲和素和cy5标记的四嗪的通用结构。
图94:用于合成含有3'-oh的dntp-ss-阻断物-染料/锚分子的一般方案。
图95:用于合成含有3'-oh的dntp-偶氮-阻断物-染料/锚分子的一般方案。
图96:将fret盒连接至dntp-ss-接头。可以使用相同的方案将此类盒连接至包含不同的可切割的接头的dntp、ddntp(第二节)或nrt(第一节)。
图97:示出了使用四种dntp-ss-阻断物-染料分子(datp-ss-阻断物-atto647n、dctp-ss-阻断物-atto647n、dgtp-ss-阻断物-atto647n、dttp-ss-阻断物-atto647n)进行单-色逐步测序的方案xviii的示意图。
图98:示出了使用dntp-可切割的接头-阻断物-染料(datp-烯丙基-阻断物-atto647n、dttp-ss-阻断物-atto647n、dctp-偶氮-阻断物-atto647n、dgtp-2-硝基苄基-阻断物-atto647n)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案xix的示意图。
图99a-99d:示出了使用dntp-可切割的接头-阻断物-染料(datp-偶氮-阻断物-atto647n、dctp-ss-阻断物-atto647n)、dntp-可切割的接头-阻断物-锚(dttp-偶氮-阻断物-生物素和dgtp-ss-阻断物-生物素)、相应的染料标记的锚结合分子(链霉亲和素-atto647n)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案xx的示意图。
图100a-100c:示出了使用dntp-ss-阻断物-染料(datp-ss-阻断物-rox、dttp-ss-阻断物-atto647n)、dntp-ss-阻断物-锚(dctp-ss-阻断物-生物素和dgtp-ss-阻断物-tco)、相应的染料标记的锚结合分子(链霉亲和素-rox和四嗪-atto647n)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xxi的示意图。
图101:示出了使用dntp-ss-阻断物-染料(datp-ss-阻断物-rox、dttp-ss-阻断物-bodipyfl、dctp-ss-阻断物-tamra和dgtp-ss-阻断物-atto647n)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行4-色dnasbs的方案xxiia的示意图。
图102a-102c:示出了使用dntp-ss-阻断物-锚(datp-ss-阻断物-生物素、dgtp-ss-阻断物-tco)、dntp-偶氮-阻断物-锚(dttp-偶氮-阻断物-tco、dctp-偶氮-阻断物-生物素)、相应的染料标记的结合分子(量子点1(绿色)-标记的链霉亲和素和量子点2(红色)-标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xxiib的示意图。
图103:示出了使用dntp-ss-阻断物-锚(datp-ss-阻断物-生物素、dgtp-ss-阻断物-tco、dttp-ss-阻断物-生物素/生物素/tco、dctp-ss-阻断物-生物素/tco)、相应的染料标记的结合分子(量子点1(绿色)-标记的链霉亲和素和量子点2(红色)-标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xxiic的示意图。
图104a-104d:示出了使用dntp-ss-阻断物-供体染料-锚(3’-o-ss-datp-7-ss-阻断物-cy3-生物素、3’-o-ss-dgtp-7-ss-阻断物-cy3-tco)、3’-o-ss(dtm)-dntp-偶氮-阻断物-cy3-锚(3’-o-ss-dttp-5-偶氮-阻断物-cy3-tco、3’-o-ss-dctp-5-偶氮-阻断物-cy3-生物素)、相应的染料标记的结合分子(cy5标记的链霉亲和素和cy5标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案xxiii的示意图。
图105:用于使用方案xxiv中描述的方法进行4-色dnasbs的3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-datp、3’-o-bodipyfl-peg4-ss(dtm)触发物-dgtp)和3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp、3’-o-tco-ss(dtm)触发-dctp)以及相应的染料标记的结合分子(r6g标记的四嗪和cy5标记的链霉亲和素)。r=烷基:甲基、乙基、丙基、叔丁基。
图106:使用方案xxv中描述的方法进行2-色sbs的3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-datp、3’-o-bodipyfl-peg4-ss(dtm)触发物-dgtp)、3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp、3’-o-tco-ss(dtm)触发物-dctp)和相关的染料标记的锚结合分子(rox标记的链霉亲和素、bodipyfl标记的四嗪)。r=烷基:甲基、乙基、丙基、叔丁基。
图107:使用方案xxvi中描述的方法进行2-色sbs的3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp、3’-o-tco-ss(dtm)触发物-dgtp)、3’-o-锚-偶氮触发物-dntp(3’-o-生物素-偶氮触发物-datp、3’-o-tco-偶氮触发物-dctp)和相关的染料标记的锚结合分子(rox标记的链霉亲和素、bodipyfl-peg4标记的四嗪)。
图108:使用方案xxvii中描述的方法进行1-色sbs的3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-dctp)、3’-o-染料-偶氮触发物-dntp(3’-o-rox-peg4-偶氮触发物-dgtp)、3’-o-染料-烯丙基触发物-dntp(3’-o-rox-peg4-烯丙基触发物-datp)和3’-o-染料-2nb触发物-dntp(3’-o-rox-peg4-2nb触发物-dttp)。
图109:使用方案xxviii中描述的方法进行1-色sbs的3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-datp)、3’-o-染料-偶氮触发物-dntp(3’-o-rox-peg4-偶氮触发物-dgtp)、3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp)、3’-o-锚-偶氮触发物-dntp(3’-o-生物素-偶氮触发物-dctp)和适当的染料标记的锚结合分子(rox标记的链霉亲和素)。
图110:3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-datp)的合成。
图111:3’-o-染料-ss(dtm)触发物-dntp(3’-o-bodipyfl-peg4-ss(dtm)触发物-dgtp)的合成。
图112:3’-o-锚-ss(dtm)触发物-dntp(3’-o-tco-ss(dtm)触发物-dctp)的合成。
图113:3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp)的合成。
图114:3’-o-染料-偶氮触发物-dntp(3’-o-rox-peg4-偶氮触发物-dgtp)的合成。
图115:3’-o-锚-偶氮触发物-dntp(3’-o-tco-偶氮触发物-dctp)的合成。
图116:3’-o-锚-偶氮触发物-dntp(3’-o-生物素-偶氮触发物-datp)的合成。
图117:3’-o-染料-烯丙基触发物-dntp(3’-o-rox-peg4-烯丙基触发物-datp)的合成。
图118:3’-o-染料-2nb触发物-dntp(3’-o-rox-peg4-2nb触发物-dttp)的合成。
图119:示出了使用3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-datp、3’-o-bodipyfl-peg4-ss(dtm)触发物-dgtp)、3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp、3’-o-tco-ss(dtm)触发物-dctp)和相关的染料标记的锚结合分子(cy5标记的链霉亲和素、r6g标记的四嗪)进行4-色sbs的方案xxiv的示意图。
图120:示出了使用3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-datp、3’-o-bodipyfl-peg4-ss(dtm)触发物-dgtp)、3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp、3’-o-tco-ss(dtm)触发物-dctp)和相关的染料标记的锚结合分子(rox标记的链霉亲和素、bodipyfl标记的四嗪)进行2-色sbs的方案xxv的示意图。
图121a-121c:示出了使用3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp、3’-o-tco-ss(dtm)触发物-dgtp)、3’-o-锚-偶氮触发物-dntp(3’-o-生物素-偶氮触发物-datp、3’-o-tco-偶氮触发物-dctp)和相关的染料标记的锚结合分子(rox标记的链霉亲和素、bodipyfl标记的四嗪)进行2-色sbs的方案xxvi的示意图。
图122a-122c:示出了使用3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-dctp)、3’-o-染料-偶氮触发物-dntp(3’-o-rox-peg4-偶氮触发物-dgtp)、3’-o-染料-烯丙基触发物-dntp(3’-o-rox-peg4-烯丙基触发物-datp)和3’-o-染料-2nb触发物-dntp(3’-o-rox-peg4-2nb触发物-dttp)进行1-色sbs的方案xxvii的示意图。
图123a-123c:示出了使用3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-datp)、3’-o-染料-偶氮触发物-dntp(3’-o-rox-peg4-偶氮触发物-dgtp)、3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp)、3’-o-锚-偶氮触发物-dntp(3’-o-生物素-偶氮触发物-dctp)和合适的染料标记的锚结合分子(rox标记的链霉亲和素)进行1-色sbs的方案xxviii的示意图。
图124a-124b:a.3’-o-ss-datp-ss-rox的malditofms谱。b.用连二亚硫酸钠处理后3’-o-ss-datp-ss-rox的malditofms谱。
图125:生物素-peg4-偶氮接头nhs酯的合成。
图126:dna引物-偶氮接头-生物素缀合物的合成。
图127:通过na2s2o4处理切割偶氮接头并释放dna引物。
图128a:切割前的hplc谱图。
图128b:示出了切割后的hplc谱图。
图129:用于单-色sbs的通用的一组染料和锚标记的正交可切割的3'被保护的核苷酸类似物和标记试剂:所有核苷酸类似物均具有3'保护基团(在此处的实施例中示出了叔丁基-ss-甲基(-ch2-ss-叔丁基);也可使用其他3'保护基团,例如:-ch2-ss-ch3;-ch2-ss-ch2ch3;-ch2-n3;-ch2-ch=ch2等)。两种具有锚(例如生物素),两种具有染料(例如cy5)。对于这些核苷酸中的两种,染料或锚通过可切割的接头1(包含可被thp切割的ss基团)连接至碱基,对于其他的两种,染料或锚通过可切割的接头2(包含可以被连二亚硫酸钠切割的偶氮基团)。标记分子由能够特异性结合锚(链霉亲和素)和相同的染料的分子组成。通常,接头中的一种(例如,ss)可以被除去保护基团(例如,叔丁基-ss-甲基或叠氮基甲基)的相同的试剂(例如,thp)切割。在追加(chase)步骤中添加了一组未标记的nrt(例如3′-o-叠氮基甲基-dntp)。
图130:使用诸如图129中所示的那些正交可切割的核苷酸类似物进行单-色sbs的方案的简化示意。每种核苷酸具有cy5或生物素与ss接头或偶氮接头的不同的组合。矩形代表包含多个拷贝的连接引物-环-模板分子(尽管可以使用线性引物和连接模板或其他模板/引物排列)的区域,其中模板链中的下一个碱基从左到右为c、g、t或a。与四种核苷酸类似物和therminatorix孵育后,成像将在第一区域和第四区域显示阳性信号(代表利用g或t的引物链的延伸),而在第二区域和第三区域显示阴性信号(利用a或c的延伸)。用未标记的nrt(例如3′-o-叠氮基甲基-dntp)进行追加步骤,以延伸尚未被cy5或生物素标记的nrt延伸的任何引物。用链霉亲和素-cy5标记后,所有四个区域的成像都将显示阳性信号,从而确认先前可能的掺入事件。用连二亚硫酸钠(na2s2o4)切割偶氮接头后的成像将显示在第三区域和第四区域中阳性信号的丢失,而不是第一区域和第二区域。由于偶氮基团在a和t核苷酸上,这表明在区域1至4中,分别掺入了g、c、a和t。最后,用thp处理来切割ss接头并去除叔丁基-ss甲基阻断物,为下一个测序循环做准备。底部的5个数字代码表示五个成像步骤中的每一个中的信号(中间的三个步骤用下划线标出),阳性信号由1表示,阴性信号由0表示。很明显,四种可能的核苷酸类似物中的每一种的掺入将通过独特的数字代码显示(仅考虑三个中间成像步骤,010表示a,011表示c,111表示g,110表示t;仅考虑第二成像步骤和第四成像步骤,00表示a,01表示c,11表示g,10表示t)。
图131:在实施例3中合成和表征的四种nrt类似物:(1)3′-o-叔丁基-ss(dtm)-dttp-peg4-偶氮-cy5;(2)3'-o-叔丁基-ss(dtm)-dgtp-ss-cy5;(3)3'-o-叔丁基-ss(dtm)-datp-peg4-偶氮-生物素;(4)3'-o-叔丁基-ss(dtm)-dctp-ss-生物素。
图132:3'-o-叔丁基-ss(dtm)-dttp-peg4-偶氮-cy5的合成。
图133:3'-o-叔丁基-ss-dttp-peg4-偶氮-cy5的maldi-tofms表征。
图134a-134b:测试3'-o-叔丁基-ss-dttp-偶氮-cy5的连续掺入和切割。如详细方法中所述进行单碱基延伸反应,延伸产物的maldi-tof质谱在图134a中示出。如图所示,发生了基本上完全的延伸,没有可见的引物峰。然后如详细方法中所述,用连二亚硫酸钠切割延伸产物以切割接头并除去cy5,并且表明完全切割的maldi-tof质谱示于图134b中。最后,如图134c中的maldi-tof质谱图所示,用thp对3'保护基团进行了切割。在该图中,仅示出了模板序列的一部分,并且引物中的粗体t表示单碱基延伸的引物序列。
图135:3'-o-叔丁基-ss(dtm)-datp-peg4-偶氮生物素的合成。
图136:maldi-tofms迹线,以确认3'-o-叔丁基-ss(dtm)-datp-peg4-偶氮-生物素的合成。
图137a-137b:测试3'-o-叔丁基-ss-datp-偶氮-生物素的连续掺入和切割。如详细方法中所述进行单一碱基延伸反应,并且在上图中示出延伸产物的maldi-tof质谱图。如图所示,发生了基本上完全的延伸,没有可见的引物峰。然后如详细方法中所述,用连二亚硫酸钠切割延伸产物以切割接头并除去cy5,并且在下图中示出了表明完全切割的maldi-tof质谱图。在该图中,仅示出了模板序列的一部分,并且引物中的粗体a表示单碱基延伸的引物序列。
图138:3'-o-叔丁基-ss-dctp-ss-生物素的maldi-tofms表征。
图139:3'-o-叔丁基-ss-dgtp-ss-cy5的maldi-tofms表征。
图140a-140c:示出了使用具有偶氮和ss接头以及生物素和cy5的所有组合的核苷酸可逆终止子的正交集进行单-色边合成边测序的示意图。
图141:将引物-环模板dna分子附着到载玻片上。如图所示,将模板t1、模板t2、模板t3和模板t4(它们是5'-氨基修饰的自引发模板dna)点在nhs酯活化的codelink载玻片(surmodicsinc.,mn)的矩形区域中,每个矩形区域中441(21×21)个斑点(spot)。这四种模板的第一个测序循环将使用核苷酸类似物t、g、c和a,下一个循环将使用核苷酸类似物a、a、a和t等。
图142:用载玻片固定的模板进行单-色边合成边测序的第一个循环的结果。
图143:筛选dna聚合酶以掺入图79中所示的标记的ddctp。左:以相对于标记的ddctp的不同比例的26-碱基长的自引发环化模板(1μm)进行单碱基延伸反应(在泳道3、5和7中为20μm;在泳道4、6和8中为10μm)。用5uklenow(外切-)(neb)、13u测序酶(affymetrix)或4u热测序酶(affymetrix)以20ul反应体积中于37℃温育1小时。在8m尿素/15%聚丙烯酰胺凝胶上分离产物,并用sybrgold染色。如泳道7和泳道8所示,用热测序酶获得最佳掺合(incorporation)。还测试了therminatorii和iii,但与klenow相似,它们显示出的完全反应较差。右:使用引物和四种不同的模板的结果,这些模板对图79中的四种标记的双脱氧核苷酸中的每一种都是特异性的。该反应包含10pmol生物素化引物(15bp)、15pmol互补线性模板(21bp)、1u热测序酶和100pmol双脱氧核苷酸类似物。使用所有四种核苷酸类似物获得在sybrgold染色的变性凝胶上可视化的延伸产物(泳道4、6、8和10)。由于ddg-dsp17类似物在聚合物链中不包含任何嘌呤碱基或嘧啶碱基,因此在泳道10中只能看到sybrgold染色的模板和延伸产物。第一个泳道仅包含引物,第二个泳道仅包含模板,泳道3、5、7和9仅含有相应的双脱氧核苷酸类似物作为对照(同样,由于聚合物尾部中不存在碱基,泳道9中没有可见的条带)。
图144:使用在3'末端附近具有荧光化的dt的自引发环化引物的荧光强度随时间的变化。a.将不同浓度的ddctp(0至10μm)添加到含有热测序酶、0.3μm单荧光素标记的自引发模板和10μmdctp的溶液中。产生半最大荧光强度的未改性ddctp的浓度为约0.5μm。b.在存在相同模板和5μmdctp的情况下,用图79中所示的标记的ddctp(0至5μm)进行了相同的实验。结果表明,聚合物标记的ddctp的表观ic50为约0.25μm。
图145:用于单-色sbs的通用的一组染料和锚标记的正交可切割的ddntp类似物和标记试剂:双脱氧核苷酸类似物中的两种具有锚(例如,生物素),两种具有染料(例如,cy5)。对于这些核苷酸中的两种,染料或锚通过可切割的接头1(包含可被thp切割的ss基团)连接至碱基,对于其他两种,染料或锚通过可切割的接头2(含有可以被连二亚硫酸钠切割的偶氮基团)连接至碱基。标记分子由能够特异性结合锚的分子(链霉亲和素)和相同的染料组成。这种混合sbs方法的要求是单独的一组四种未标记的可逆终止子(例如叠氮甲基dntp)。
图146:使用诸如图145中所示的那些正交可切割的核苷酸类似物进行单-色sbs的方案的简化示意。每种ddntp具有cy5或生物素与ss接头或偶氮接头的不同的组合。矩形表示包含多个拷贝的连接引物-环-模板分子的区域,其中模板链中的下一个碱基从左到右为c、g、t或a。与四种未标记的核苷酸可逆终止子(nrt,例如3'-叠氮基甲基dntp)和therminatorix温育以延伸大部分引物后,与四种标记的ddntp和热测序酶一起温育。成像将在第一区域和第四区域显示阳性信号(代表利用g或t的引物链的延伸),而在第二区域和第三区域显示阴性信号(利用a或c的延伸)。用链霉亲和素-cy5标记后,所有四个区域的成像都将显示阳性信号,从而确认先前可能的掺入事件。用连二亚硫酸钠(na2s2o4)切割偶氮接头后的成像将显示在第三区域和第四区域中阳性信号的丢失,而不是第一区域和第二区域。由于偶氮基团在a和t核苷酸上,这表明在区域1至4中,分别掺入了g、c、a和t。最后,用thp处理来切割ss接头并去除用nrt延伸的任何引物上的叠氮基甲基,为下一个测序循环做准备。每个矩形左侧的1、2和3数字代码表示三个指示的成像步骤中的每一个的累加信号,阳性信号由1表示,阴性信号由0表示。很明显,四种可能的核苷酸类似物中的每一种的掺入将通过独特的数字代码显示(考虑到所有这三个成像步骤,0101表示a,011表示c,111表示g,110表示t;仅考虑这些成像步骤的第一个步骤和第三个步骤,00表示a,01表示c,11表示g,10表示t)。
图147a-147b:用于进行单-色sbs的一组核苷酸类似物。
图148:偶氮-接头nhs酯的合成。
图149:ddutp-5-偶氮-cy5的合成。
图150:maldi-tofms迹线证实了ddgtp-7-ss-cy5的正确合成。
图151:ddatp-7-偶氮-生物素的合成。
图152:maldi-tofms迹线证实了ddatp-7-偶氮-生物素的正确合成。
图153:ss接头nhs酯的合成。
图154:ddgtp-7-ss-cy5的合成。
图155:maldi-tofms迹线证实了ddgtp-7-ss-cy5的正确合成。
图156:ddctp-5-ss-生物素的合成。
图157:maldi-tofms迹线证实了ddctp-5-ss-生物素的正确合成。
图158:maldi-tof质谱结果显示ddttp-5-偶氮-cy5的有效掺入和切割。
图159:maldi-tof质谱结果显示ddatp-7-偶氮-生物素的有效掺入和切割。
图160:maldi-tof质谱结果显示ddgtp-7-ss-cy5的有效掺入和切割。
图161:maldi-tof质谱结果显示ddctp-5-ss-生物素的有效掺入和切割。
图162a-162c:示出了使用具有偶氮和ss接头以及生物素和cy5的所有组合的ddntp类似物的正交集,进行单-色边合成边测序的示意图。
图163a-163f:使用载玻片固定的模板进行单-色边合成边测序的前五个循环的结果。
具体实施方式
本发明提供了一种核酸测序方法,其包括:
a)提供至少一种与引物杂交的核酸模板;
b)用聚合酶和下述中的任一种延伸与所述核酸模板杂交的引物:
i)荧光标记的核苷酸类似物,其中所述荧光标记的核苷酸类似物具有通过可切割的接头与碱基连接的标记和3'-羟基基团上的保护基团,其中不同的核苷酸可以具有不同的锚和不同的可切割的基团;
ii)锚标记的核苷酸类似物,其中所述锚标记的核苷酸类似物具有通过可切割的接头与碱基连接的锚和3'-羟基基团上的保护基团,其中不同的核苷酸可以具有不同的锚和不同的可切割的基团;或者
iii)荧光标记的核苷酸类似物和锚标记的核苷酸类似物二者的组合,其中所述荧光标记的核苷酸类似物或锚标记的核苷酸类似物具有通过可切割的接头与碱基连接的标记和3'-羟基基团上的保护基团,其中不同的核苷酸可以具有不同的可切割的基团;
c)任选地用3'被保护的且没有任何碱基修饰的核苷酸来延伸任何未延伸的引物,并鉴别由于掺入了荧光核苷酸类似物而产生的荧光信号;
d)任选地用荧光标记的锚结合分子来标记锚连接的引物延伸产物;
e)鉴别由于在步骤d中进行的标记而新产生的荧光信号以部分或完全地鉴别所掺入的核苷酸;
f)任选地重复步骤d和步骤e;
g)任选地用特异性可切割剂从荧光标记的核苷酸上切割标记,该特异性可切割剂切割接头中的一种,但不切割正交接头;
h)鉴别由于在步骤f中进行的切割而导致的荧光丢失,以部分或完全地鉴别所掺入的核苷酸;
i)任选地重复步骤g和步骤h;
j)通过比较步骤c、步骤e和步骤h中获得的结果,确定掺入的特定核苷酸类似物;
k)从延伸的引物上切割任何剩余的标记或锚,同时恢复3'-羟基基团;和
l)重复执行步骤a至步骤k以获取所述核酸模板的序列,从而对核酸进行测序。
在进一步的实施方案中,该方法包括1种标记、2种不同的标记、3种不同的标记或4种不同的标记。本发明还提供了一种方法(instantmethod),其中标记通过可切割的接头直接与碱基连接。本发明还提供了一种方法,其中标记包括染料簇。本发明还提供了一种方法,其中标记包括能量转移供体染料和受体染料。本发明还提供了一种方法,其包括1种锚类型、2种不同的锚类型、3种不同的锚类型或4种不同的锚类型以及相等数量的标记的锚结合分子。本发明还提供了一种方法,其中锚包含生物素、tco、dbco和四嗪,并且标记的锚结合分子分别包含链霉亲和素、四嗪、叠氮和tco。本发明还提供了一种方法,其中将锚结合分子用荧光有机染料或量子点标记。本发明还提供了一种方法,其中荧光有机染料标记选自包括荧光素、若丹明、花青、atto或dyomics染料的一组染料。本发明还提供了一种方法,其中锚包括锚簇。
本发明还提供了一种方法,其中:
a)锚或锚簇包含供体染料或受体染料,
b)一个锚结合分子或多个锚结合分子包含对应于锚或锚簇上的供体/受体染料的供体染料或受体染料,和
c)锚或锚簇与一个锚结合分子或多个锚结合分子的连接导致能量从供体染料转移到受体染料,其中供体可以是量子点。
本发明还提供了一种方法,其包括1种可切割的接头类型、2种可切割的接头类型、3种可切割的接头类型或4种可切割的接头类型。
本发明还提供了一种方法,其中一种可切割的接头或多种可切割的接头包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物,切割剂分别包括thp、连二亚硫酸钠、pd(0)和紫外光(~340nm)。
本发明还提供了一种方法,其中存在四种不同的标记的核苷酸类似物,每种具有不同的标记,并且在步骤c中确定掺入的核苷酸的身份。本发明还提供了一种方法,其中存在两种不同的标记的核苷酸类似物,并且其中由步骤c和步骤e的组合的结果来确定掺入的核苷酸。本发明还提供了一种方法,其中存在两种不同的标记的核苷酸类似物,并且其中由步骤c和步骤g的组合的结果来确定掺入的核苷酸。本发明还提供了一种方法,其中存在一种染料标记的核苷酸类似物,并且其中由步骤c、步骤e和步骤g的组合的结果来确定掺入的核苷酸。
本发明还提供了一种核酸测序方法,其包括:
a)提供至少一种与引物杂交的核酸模板;
b)用聚合酶和一组带有标记和锚的正交集的核苷酸类似物(a、c、g和t)延伸与所述核酸模板杂交的引物,第一核苷酸类似物具有直接与碱基连接的荧光标记,第二核苷酸类似物具有直接与碱基连接的不同的荧光标记,第三核苷酸类似物具有与碱基连接的锚部分,第四核苷酸类似物具有与碱基连接的不同的锚部分,其中所述荧光或锚标记的核苷酸类似物具有通过相同类型的可切割的接头与碱基连接的标记和3'-羟基位置上的具有相同的可切割部分的保护基团;
c)任选地用3'被保护的且没有任何碱基修饰的核苷酸来延伸任何未延伸的引物,并鉴别由于掺入了荧光核苷酸类似物而产生的荧光信号;
d)用荧光标记的锚结合分子来标记包含锚部分的引物延伸产物,其中用于连接至两种不同的锚的锚结合分子包含与步骤b中的核苷酸类似物相同的两种荧光标记;
e)鉴别由于在步骤d中进行的标记而新产生的荧光信号,以确定剩余的两种掺入的核苷酸类似物;
f)从引物延伸产物上切割任何剩余的染料和锚,并恢复3'-羟基基团;和
重复执行步骤a至步骤f,以获得所述核酸模板的序列。
本发明还提供了一种方法,其中标记包括染料簇。本发明还提供了一种方法,其中标记包括能量转移供体染料和受体染料。本发明还提供了一种方法,其中锚包含生物素、tco、dbco和四嗪,并且荧光标记的锚结合分子分别包含链霉亲和素、四嗪、叠氮和tco。本发明还提供了一种方法,其中可切割的接头包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物,并且切割剂分别包括thp、连二亚硫酸钠、pd(0)和紫外光(~340nm)。
本发明还提供了一种方法,其中将锚结合分子用荧光有机染料或量子点标记。本发明还提供了一种方法,其中锚包括锚簇。
本发明还提供了一种方法,其中:
a)锚或锚簇包含供体染料或受体染料,
b)一个锚结合分子或多个锚结合分子包含对应于锚或锚簇上的供体/受体染料的供体染料或受体染料,和
c)锚或锚簇与一个锚结合分子或多个锚结合分子的连接导致能量从供体染料转移到受体染料,其中供体可以是量子点。
本发明还提供了一种核酸测序方法,其包括:
a)提供与引物杂交的核酸模板;
b)用聚合酶和荧光标记的核苷酸类似物(a、c、g和t)的正交集延伸与所述核酸模板杂交的引物,第一核苷酸类似物具有通过可切割的接头直接与碱基连接的荧光染料,第二核苷酸类似物具有通过不同类型的可切割的接头直接与碱基连接的相同的荧光染料,第三核苷酸类似物具有通过第一类型的可切割的接头直接与碱基连接的第二染料,第四核苷酸类似物具有通过第二类型的可切割的接头直接与碱基连接的第二染料,其中第二可切割的接头中的可切割的部分可以在与3′-羟基位置处的可切割的保护部分相同的条件下被切割;
c)任选地用3'个被保护的且没有任何碱基修饰的核苷酸来延伸任何未延伸的引物,并鉴别由于掺入了荧光标记的核苷酸类似物而产生的荧光信号,从而部分地确定四种核苷酸中的两种的掺入;
d)用切割第一类型的接头的特异性试剂从掺入引物中的荧光标记的核苷酸上切割染料;
e)鉴别由于在步骤d中进行的切割而导致的荧光丢失;
f)通过比较步骤c和步骤e中获得的结果,确定掺入的特定核苷酸类似物;
g)从延伸的引物上切割任何剩余的染料,同时恢复3'-羟基基团;和
重复执行步骤a至步骤g,以获得所述核酸模板的序列。
本发明还提供了一种方法,其中荧光标记选自包括荧光素、若丹明、花青、atto或dyomics染料的一组染料。本发明还提供了一种方法,其中标记包括染料簇。本发明还提供了一种方法,其中标记包括能量转移供体染料和/或受体染料。
本发明还提供了一种方法,其中可切割的接头包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物,并且切割剂分别包括thp、连二亚硫酸钠、pd(0)和紫外光(~340nm)。
本发明还提供了一种核酸测序方法,其包括:
a)提供至少一种与引物杂交的核酸模板;
b)用聚合酶和锚标记的核苷酸类似物(a、c、g和t)的正交集延伸与所述核酸模板杂交的引物,第一核苷酸类似物具有通过第一类型的可切割的接头直接与碱基连接的锚部分,第二核苷酸类似物具有通过第二类型的可切割的接头直接与碱基连接的相同的锚部分,第三核苷酸类似物具有通过第一类型的可切割的接头直接与碱基连接的第二锚部分,第四核苷酸类似物具有通过第二类型的可切割的接头直接与碱基连接的第二锚部分,其中第二类型的可切割的接头中的可切割的部分可以在与3'-羟基位置处的可切割的保护部分相同的条件下被切割;
c)任选地用3'被保护的且没有任何碱基修饰的核苷酸来延伸任何未延伸的引物;
d)使用对第一锚具有特异性的荧光标记的锚结合分子来标记用具有第一锚的核苷酸类似物延伸的引物;
e)鉴别由于在步骤d中进行的标记而产生的荧光信号,以部分地确定4种掺入的核苷酸类似物中的2种;
f)使用对第二锚具有特异性的荧光标记的锚结合分子来标记用具有第二锚的核苷酸类似物延伸的引物,其中所述荧光标记是与对第一锚具有特异性的锚结合分子相连接的相同的标记;
g)鉴别由于在步骤f中进行的标记而新产生的荧光信号,以部分地确定4种掺入的核苷酸类似物中的另外2种;
h)用切割第一类型的接头的特异性可切割剂从荧光标记的核苷酸上切割染料和锚;
i)鉴别由于在步骤h中进行的切割而导致的荧光丢失;从而
j)通过比较步骤e、步骤g和步骤i中获得的结果,确定掺入引物中的特定核苷酸类似物;
k)从延伸的引物上切割任何剩余的染料或锚,同时恢复3′-羟基基团;和
重复执行步骤a至步骤i,以获得核酸模板的序列。
本发明还提供了一种方法,其中染料包含染料簇。本发明还提供了一种方法,其中染料包括能量转移供体染料和受体染料。本发明还提供了一种方法,其中锚包含生物素、tco、dbco和四嗪,并且荧光标记的锚结合分子分别包括链霉亲和素、四嗪、叠氮和tco。本发明还提供了一种方法,其中将锚结合分子用有机染料或量子点标记。本发明还提供了一种方法,其中锚包括锚簇。
本发明还提供了一种方法,其中:
a)锚或锚簇包含供体染料或受体染料,
b)一个锚结合分子或多个锚结合分子包含对应于锚或锚簇上的供体/受体染料的供体染料或受体染料,和
c)锚或锚簇与一个锚结合分子或多个锚结合分子的连接导致能量从供体染料转移到受体染料,其中供体可以是量子点。
本发明还提供了一种方法,其中可切割的接头包含ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物,并且切割剂分别包括thp、连二亚硫酸钠、pd(0)和紫外光(~340nm)。
本发明还提供了一种核酸测序方法,其包括:
a)提供至少一种与引物杂交的核酸模板;
b)用聚合酶和锚标记的核苷酸类似物(a、c、g和t)的正交集延伸与所述核酸模板杂交的引物,第一核苷酸类似物具有通过第一类型的可切割的接头直接与碱基连接的染料,第二核苷酸类似物具有通过第二类型的可切割的接头直接与碱基连接的相同的染料,第三核苷酸类似物具有通过第一类型的可切割的接头直接与碱基连接的锚部分,第四核苷酸类似物具有通过第二类型的可切割的接头直接与碱基连接的相同的锚部分,其中第二类型的可切割的接头中的可切割的部分可以在与在3'-羟基位置处的可切割的保护部分相同的条件下被切割;
c)任选地用3′被保护的且没有任何碱基修饰的核苷酸来延伸任何未延伸的引物,并鉴别荧光信号以部分地确定四种核苷酸类似物中的两种;
d)使用对锚具有特异性的荧光标记的锚结合分子来标记用具有所述锚的核苷酸类似物延伸的引物;
e)鉴别由于步骤d中进行的标记而新产生的荧光,以部分地确定四种掺入的核苷酸中的另外两种;
f)用切割第一类型的接头的特异性可切割剂从荧光标记的核苷酸上切割染料和锚;
g)鉴别由于在步骤f中进行的切割而导致的荧光丢失;从而
h)通过比较步骤c、步骤e和步骤g中获得的结果,确定掺入引物中的特定核苷酸类似物;
i)从延伸的引物上切割任何剩余的染料或锚,同时恢复3'-羟基基团;和
重复执行步骤a至步骤i,以获得核酸模板的序列。
本发明还提供了一种方法,其中染料包括染料簇。本发明还提供了一种方法,其中染料包括能量转移供体染料和受体染料。
本发明还提供了一种方法,其中锚包括生物素、tco、dbco和四嗪,并且荧光标记的锚结合分子分别包括链霉亲和素、四嗪、叠氮和tco。本发明还提供了一种方法,其中将锚结合分子用荧光有机染料或量子点标记。本发明还提供了一种方法,其中锚包括锚簇。
本发明还提供了一种方法,其中:
a)锚或锚簇包含供体染料或受体染料,
b)一个锚结合分子或多个锚结合分子包含对应于锚或锚簇上的供体/受体染料的供体染料或受体染料,和
c)锚或锚簇与一个锚结合分子或多个锚结合分子的连接导致能量从供体染料转移到受体染料,其中供体可以是量子点。
本发明还提供了一种方法,其中可切割的接头包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物,切割剂分别包括thp、连二亚硫酸钠、pd(0)和紫外光(~340nm)。
本发明还提供了具有以下结构的双脱氧核苷酸三磷酸(ddntp)类似物:
其中:
i)碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、次黄嘌呤或它们的类似物;
ii)可切割的接头为ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物,并通过嘧啶(c、u)的5位或嘌呤(a、g)的7位与碱基连接;
iii)碱基和标记之间的可切割的接头包含长度不同的聚合物分子;
iv)标记包括荧光染料、荧光染料簇、用于染料连接的锚和/或用于染料连接的锚簇。
本发明还提供了双脱氧核苷酸三磷酸(ddntp)类似物,其中标记是具有相应的供体或受体染料的能量转移染料或能量转移染料簇,其中供体染料可以是量子点。本发明还提供了双脱氧核苷酸三磷酸(ddntp)类似物,其中标记是锚,并且所述锚包含生物素、dbco、tco或四嗪,其中相应的锚结合分子包含链霉亲和素、叠氮化物、tco或四嗪,并且进一步包含单一染料或单一染料的簇,其中所述锚结合分子上的染料包括有机染料或量子点。
本发明还提供了一种用于确定核酸中一系列连续核苷酸残基中的每一个的身份的方法,其包括:
a)使多个核酸模板与(i)上述双脱氧核苷酸三磷酸(ddntp)类似物、(ii)具有以下结构的脱氧核苷酸三磷酸(dntp)类似物、(iii)核酸聚合酶和(iv)至少两个相同的引物接触:
其中碱基包含腺嘌呤、鸟嘌呤、胞嘧啶、尿嘧啶、胸腺嘧啶、次黄嘌呤或它们的类似物,并且其中r是可切割的化学基团,每个引物与多个核酸中的一个单独的核酸在下述条件下杂交:允许与待鉴别的连续核苷酸残基互补的ddntp类似物与引物之一的3'末端形成磷酸二酯键,以及允许与待鉴别的连续核苷酸残基互补的dntp类似物与另一个引物的3'末端形成磷酸二酯键;
b)鉴别已形成磷酸二酯键的ddntp类似物的荧光团,从而鉴别连续的核苷酸;
c)从已形成磷酸二酯键的ddntp类似物上切割荧光团,并从已形成磷酸二酯键的dntp上切割可切割的化学基团;
d)对每个待鉴别的连续的核苷酸残基重复进行步骤a)至步骤c),直到鉴别出最终的连续的核苷酸残基为止;
e)重复步骤a)和步骤b)以鉴别最终的连续的核苷酸残基,从而确定核酸中一系列连续的核苷酸残基中的每一个的身份。
本发明还提供了一种具有以下结构的核苷酸类似物:
其中,碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、次黄嘌呤或它们的类似物;可切割的接头包含ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物;碱基和标记之间的连接物包括聚合物分子;阻断物是包含无碱基糖或修饰的核苷或它们的组合的2-50个单体单元的核苷酸或寡核苷酸;阻断物通过可切割的接头与嘧啶(c、u)的5位和脱氮嘌呤(a、g、i)的7位相连接,
其中阻断物是在通过核苷酸聚合酶掺入核苷酸类似物之后阻止其他核苷酸或核苷酸类似物进一步掺入引物链的分子;
标记包括荧光染料、荧光染料簇、用于通过锚结合分子连接荧光染料的锚或用于通过锚结合分子连接荧光染料的锚簇,其中标记与阻断物相连接。
本发明还提供了核苷酸类似物,其中标记选自荧光素、若丹明、花青、atto或dyomics染料。本发明还提供了核苷酸类似物,其中标记包含cy3、cy5和atto647n。本发明还提供了核苷酸类似物,其中标记是具有供体和受体染料的能量转移染料或能量转移染料的簇,其中供体染料可以是量子点。本发明还提供了核苷酸类似物,其中标记是能量转移染料,供体染料是荧光素、cya、cy3,受体染料是若丹明110、r6g、tamra、rox、cy5、atto647n、alexa647。
本发明还提供了核苷酸类似物,其中标记是锚,所述锚包含生物素、dbco、tco或四嗪,并且其中锚结合分子包含链霉亲和素、叠氮化物、四嗪或tco,并且进一步包含单一染料、单一染料的簇或能量转移染料。本发明还提供了核苷酸类似物,其中锚结合分子被有机染料或量子点标记。
本发明还提供了核苷酸类似物,其中可切割的接头是基于dtm的。本发明还提供了核苷酸类似物,其中可切割的接头是基于偶氮的。
本发明还提供了一种组合物,其包含四种不同类型的本发明的核苷酸类似物,其中将不同的染料连接到所述四种不同的核苷酸类似物中的每一种上。本发明还提供了一种组合物,其包含四种不同类型的本发明的核苷酸类似物,其中所述核苷酸类似物中的两种包含第一染料,其余两种核苷酸类似物包含第二染料。本发明还提供了一种组合物,其包含四种不同类型的本发明的核苷酸类似物,其中一种类型的染料通过相同的可切割的接头连接至所述四种核苷酸中的每一种上。本发明还提供了一种组合物,其包含四种不同类型的本发明的核苷酸类似物,其中一种类型的染料通过不同的可切割的接头连接至所述四种核苷酸中的每一种上。
本发明还提供了一种核酸的逐步测序方法,其包括:
a)提供至少一种与引物杂交的核酸模板;
b)用聚合酶和如上所述的荧光标记的核苷酸类似物延伸与所述核酸模板杂交的引物;
c)鉴别用荧光标记的核苷酸类似物延伸的引物,以确定所添加的核苷酸的掺入;
d)从延伸的引物上切割染料;
e)用聚合酶和如上所述的具有与步骤b)的核苷酸类似物不同的碱基的荧光标记的核苷酸类似物,延伸与所述核酸模板杂交的引物;
f)鉴别用荧光标记的核苷酸类似物延伸的引物,以确定所添加的核苷酸的掺入;
g)从延伸的引物上切割染料;
h)用聚合酶和如上所述的具有与步骤b)和步骤e)的核苷酸类似物不同的碱基的荧光标记的核苷酸类似物,延伸与所述核酸模板杂交的引物;
i)鉴别用荧光标记的核苷酸类似物延伸的引物,以确定所添加的核苷酸的掺入;
j)从延伸的引物上切割染料;
k)用聚合酶和如上所述的具有与步骤b)、步骤e)和步骤h)的核苷酸类似物不同的碱基的荧光标记的核苷酸类似物,延伸与所述核酸模板杂交的引物;
l)鉴别用荧光标记的核苷酸类似物延伸的引物以确定所添加的核苷酸的掺入;
m)从延伸的引物上切割染料;和
重复进行步骤a)至步骤m)以获得核酸模板的序列。
本发明还提供了一种具有以下结构的核苷酸类似物:
其中,碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、次黄嘌呤或它们的类似物;x是可切割的触发物部分,包含ss(dtm)、偶氮、烯基(alkenyl)、2-硝基苄基或叠氮基;连至标记(y)的波浪线包括各种长度的聚合物分子;y是标记,包括荧光染料、荧光染料簇、用于结合荧光染料的锚部分或用于结合荧光染料的锚部分的簇。
本发明还提供了一种核酸测序方法,其包括:
a)提供至少一种与引物杂交的核酸模板;
b)用聚合酶和一组四种不同的如上所述的核苷酸类似物延伸与所述核酸模板杂交的引物,每种核苷酸类似物具有通过不同类型的触发部分与3′羟基连接的相同的染料;
c)任选地用3′被保护的且没有任何碱基修饰的核苷酸来延伸任何未延伸的引物,并鉴别用荧光标记的核苷酸类似物延伸的引物;
d)用特异性试剂切割荧光标记的核苷酸类似物,所述特异性试剂切割第一类型的触发物,但不恢复3′-羟基基团;
e)鉴别由于在步骤d中进行的切割而导致的荧光丢失;
f)确定掺入的第一类型的特定核苷酸类似物;
g)用特异性试剂切割荧光标记的核苷酸类似物,所述特异性试剂切割第二类型的触发部分,但不恢复3′-羟基基团;
h)鉴别由于步骤g中进行的切割而导致的荧光丢失;
i)确定掺入的第二类型的特定核苷酸类似物;
j)用特异性试剂切割荧光标记的核苷酸类似物,所述特异性试剂切割第三类型的触发部分,但不恢复3'-羟基基团;
k)鉴别由于步骤j中进行的切割而导致的荧光丢失;
l)由此确定掺入的第三类型的特定核苷酸类似物并通过减法确定掺入的第四类型的特定核苷酸类似物;
m)从延伸的引物上切割任何剩余的染料或锚,同时恢复3'-羟基基团;和
重复执行步骤a至步骤m,以获得核酸模板的序列。
本发明还提供了一种具有以下结构的核苷酸类似物:
其中,碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、次黄嘌呤或它们的类似物;x是可切割的基团,包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物;w是可切割的基团,包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物;
其中x和w包含相同或不同的可切割的基团;
y是标记,包含荧光染料、荧光染料簇、用于结合荧光染料的锚部分或用于结合荧光染料的锚部分的簇;
z是fret供体或受体染料。
本发明还提供了一种方法,其中根据方案xxiv-xxviii的方法用四种类型的本发明的核苷酸类似物进行测序,其中z是fret供体或受体染料,y是锚,并且锚y结合分子是与z相容的fret受体或供体染料。
本发明还提供了一种方法,其中锚结合分子上的染料包括供体染料,并且其中供体染料是量子点。
本发明还提供了具有以下结构的核苷酸类似物:
其中,碱基包括腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶、尿嘧啶、次黄嘌呤或它们的类似物;x是可切割的基团,包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物;w是可切割的基团,包括ss(dtm)、偶氮、ss-偶氮、烯丙基、2-硝基苄基、叠氮基甲基或叠氮基甲基衍生物;
其中x和w包含相同或不同的可切割的基团;
y是标记,包含荧光染料、荧光染料簇、用于结合荧光染料的锚部分或用于结合荧光染料的锚部分的簇。
本发明还提供了一种方法,其中根据方案xxiv-xxviii的方法,用四种类型的本发明的核苷酸类似物进行测序,其中y1是用于通过特定锚结合分子连接一种类型的量子点的锚或锚簇,y2是用于通过第二特定锚结合分子连接第二类型的量子点的锚或锚簇。
一种参考任何一个实施例的基本上如上文所述的核苷酸三磷酸类似物。
一种包含多于一种的参考任何一个实施例的基本上如上文所述的核苷酸三磷酸类似物的组合物。
一种参考任何一个实施例的基本上如上文所述的双脱氧核苷酸三磷酸类似物。
一种包含多于一种的参考任何一个实施例的基本上如上文所述的双脱氧核苷酸三磷酸的组合物。
一种参考任何一个实施例的基本上如上文所述的核酸测序方法。
一种制备参考任何一个实施例的基本上如上文所述的核苷酸三磷酸类似物或双脱氧核苷酸三磷酸类似物的方法。
一种试剂盒,其包括一种或多种的参考任何一个实施例的基本上如上文所述的核苷酸三磷酸类似物或双脱氧核苷酸三磷酸类似物。
尽管在本文中示出并描述了本发明的各种实施方案,但是对于本领域技术人员而言显而易见的是,这些实施方案仅以示例的方式提供。在不背离本发明的情况下,可以进行多种变化、改变和替换。应当理解,可以采用本文所述的本发明的实施方案的各种替代方案。
术语
如本文所用,除非另有说明,否则以下术语中的每一个应具有以下阐述的定义。
a-腺嘌呤;
c-胞嘧啶;
g-鸟嘌呤;
t-胸腺嘧啶;
u-尿嘧啶;
dna-脱氧核糖核酸;
rna-核糖核酸;
除非另有说明,“核酸”是指任何核酸分子,包括但不限于dna、rna及其杂交体。在一个实施方案中,形成核酸分子的核酸碱基可以是碱基a、碱基c、碱基g、碱基t和碱基u以及它们的衍生物。
这些碱基的“衍生物”或“类似物”在本领域中是众所周知的,并且以pcr系统、试剂和消耗品为例进行说明(perkinelmercatalog1996-1997,rochemolecularsystems,inc.,布兰斯堡,新泽西州,美国)。
“核苷酸残基”是在被掺入多核苷酸并因此成为多核苷酸的一个单体之后的状态存在的单核苷酸。因此,核苷酸残基是多核苷酸(例如dna)的核苷酸单体,其在它的糖的3'位置处通过磷酸二酯键与该多核苷酸的一个相邻的核苷酸单体结合,并通过它的磷酸基团与第二相邻的核苷酸单体结合,例外的情况是(i)3'端核苷酸残基仅通过它的磷酸基团的磷酸二酯键与该多核苷酸的一个相邻的核苷酸单体结合,以及(ii)5'端核苷酸残基仅通过它的糖的3'位的磷酸二酯键与该多核苷酸的一个相邻的核苷酸单体结合。
“基底”或“表面”是指以固相存在的可以附着核酸或试剂的任何合适的介质。非限制性示例包括芯片、珠子、纳米孔结构和柱。在一个实施方案中,固体基底可以存在于包括水溶液、凝胶或流体的溶液中。
“杂交”是指基于众所周知的序列互补性原理将一个单链核酸退火结合到另一核酸上。在一个实施方案中,另一核酸是单链核酸。核酸之间杂交的倾向取决于它们的环境(milieu)的温度和离子强度、核酸的长度和互补程度。这些参数对杂交的影响是本领域众所周知的(参见sambrookj,fritschef,maniatist.1989.molecularcloning:alaboratorymanual.coldspringharborlaboratorypress,newyork.)。如本文所用,引物序列或dna延伸产物与另一核酸的杂交应意指进行充分的退火,以使引物或dna延伸产物分别可通过与可形成磷酸二酯键的可用核苷酸或核苷酸类似物形成磷酸二酯键来延伸。
如本文所用,除非另有说明,否则“独特的”或与另一种碱基或列举的列表中的碱基“不同”的碱基应表示该碱基具有与另一种或多种碱基不同的结构。例如,“独特的”或与腺嘌呤、胸腺嘧啶和胞嘧啶“不同”的碱基包括鸟嘌呤碱基或尿嘧啶碱基。
如本文所用,除非另有说明,与参考分子的标记或标签部分“不同”的标记或标签部分是指该标记或标签部分具有不同于其他/参考标记或标签部分的化学结构。
如本文所用,除非另有说明,否则“引物”是指寡核苷酸,其在与多核苷酸模板形成双链体时能够充当聚合酶掺入的点并且从它的3'端沿着模板延伸,从而形成延伸的双链体。
如本文所用,“烷基”包括具有指定碳原子数的支链和直链饱和脂族烃基,并且可以是未取代的或取代的。因此,“c1-cn烷基”中的c1-cn包括具有1、2、...、n-1或n个直链或支链排列的碳原子的基团。例如,“c1-c5烷基”包括具有1、2、3、4或5个直链或支链排列的碳原子的基团,并且具体包括甲基、乙基、正丙基、异丙基、正丁基、叔丁基和戊基。
如本文所用,“烯基”是指直链或支链的包含至少1个碳碳双键的非芳族烃基,并且可以存在至多最大可能数目的非芳族碳-碳双键,并且可以是未取代或取代的。例如,“c2-c5烯基”是指分别具有2、3、4或5个碳原子和至多1、2、3或4个碳-碳双键的烯基。烯基基团包括乙烯基、丙烯基和丁烯基。
术语“炔基”是指直链或支链的包含至少1个碳碳三键的烃基,并且可以存在至多最大可能数目的非芳族碳-碳三键,并且可以是未取代或取代的。因此,“c2-c5炔基”是指具有2或3个碳原子和1个碳-碳三键的炔基,或具有4或5个碳原子和至多2个碳-碳三键的炔基。炔基基团包括乙炔基、丙炔基和丁炔基。
术语“取代的”是指如上所述的官能团,例如烷基或烃基,其中与其中包含的与氢原子连接的至少一个键被与非氢或非碳原子连接的键取代,条件是维持正常的化合价且取代可导致生成稳定的化合物。被取代的基团(substitutedgroup)还包括其中与一个或多个碳原子或一个或多个氢原子键合的一个或多个键被一个或多个与杂原子键合的键(包括双键或三键)所取代的基团。取代基的非限制性示例包括上述官能团,例如n,从而形成-cn。
该专利申请分为四节,每一节关注具有不同特征的核苷酸类似物。测序方案的示例可以在每一节中找到。尽管可以在几个节中找到几种类似的方案,但是某些节具有独特的方案。
图1所示的两种通用的核苷酸类似物结构涵盖了第i-iii节的大多数变体。所有核苷酸可以是图1顶部所示的种类,所有核苷酸可以是图1底部所示的种类,或者可以使用一些顶部的种类和一些底部的种类的混合物。接头结构(在3'oh和标记之间,以及在碱基和标记之间)可以包括不同长度的聚合物(例如,peg、烷烃等)。可以使用三磷酸基或多磷酸基。
核苷酸类似物包含3'-被保护的结构(第i节和第iv节)(r=or',其中r′可以是不同的可切割的基团),用于使用核苷酸可逆性终止子的边合成边测序类型,在以前的pct申请中也可找到所述核苷酸可逆性终止子(juetalwo2017/058953a1;juetalwo2017/205336a1)。这些核苷酸类似物可以仅在碱基上具有修饰,仅在3′基团上具有修饰,或者在碱基和3'基团上都具有修饰。碱基上的修饰可以包括各种可切割的接头、各种染料或染料簇,以及用于随后连接染料或染料簇的多种锚或锚簇。3'位置可以被各种可切割的基团保护,并且可以进一步连接到染料或锚(用于随后连接染料)上。在第iv节中,描述了所谓的3'-触发核苷酸,其中碱基可如上所述进行修饰,但是3'修饰具有两个分支,较小的一个分支包含各种可切割的基团中的一种,而较长的一个分支包含各种染料或锚。在这种情况下,切割可恢复3'-oh,并去除任何3'连接的染料或锚。
对于在第ii节中描述的杂交测序方法,使用了两组核苷酸,一组由具有多种染料或锚的ddntp(r=h)组成,这些染料或锚通过多种可切割的接头与碱基连接,第二组由未标记的核苷酸可逆终止子组成,该终止子具有多种3'保护基团中的任一种。对于第iii节中描述的方法,使用了不同类型的核苷酸终止子类似物。它们具有3'-oh基团(r=oh),但具有多种仅允许添加一个核苷酸类似物的保护(延伸抑制)基团,以及通过多种可切割的接头与碱基连接的多种染料或锚。稍后将在四个节中的每一节中提供更多详细的示例和结构。另外,三磷酸基可以用四磷酸基、五磷酸基、六磷酸基或更高级的多磷酸基代替。
图2中示出的是第i节中用于sbs成像的重要核苷酸类似物的通用结构。所有核苷酸可以是图2顶部所示的种类,所有核苷酸可以是图2底部所示的种类,或者可以使用一些顶部的种类和一些底部的种类的混合物。接头结构(在3′oh或碱基与标记之间)可以包含不同长度的聚合物(例如peg、烷烃等),可以使用三磷酸基或多磷酸基。
图3a中示出的是第ii节中用于sbs成像的重要核苷酸类似物的通用结构。另外,由于以下是永久性终止子,因此同时添加一组非荧光可逆终止子以允许进行逐步边合成边测序。碱基和标记之间的接头结构可以包括不同长度的聚合物(例如,peg、烷烃等)。可以使用三磷酸基或多磷酸基。
图3b中示出的是第iii节中用于sbs成像的重要核苷酸类似物的通用结构。
图3c中示出的是第iv节中用于sbs成像的重要核苷酸类似物的通用结构。3′oh和标记之间的接头结构可以包括不同长度的聚合物(例如peg、烷烃等)。可以使用三磷酸基或多磷酸基。
图4中示出了用于第i-iii节的另一类分子,其中能量转移发生在位于相同核苷酸类似物上不同位置处的供体和受体之间。在所有这些情况下,如果z代表fret供体,则fret受体将被连接到待与y相连接的锚结合分子上。如果z表示fret受体,则fret供体将被连接到待与y相连接的锚结合分子上。fret供体包括有机染料和量子点。接头的长度将被设计为在不淬灭的情况下实现最大的能量传递。可以在x和w处放置相同或不同的可切割的部分。可以使用三磷酸基或多磷酸基。
在以下四节的每节中,提出了利用上述类型的核苷酸类似物的各种sbs方案。在第i、iii和iv节中,这些方案可用于单个模板分子以及用于扩增模板的整体(ensemble)。在第ii节中,由于使用了ddntp类似物,因此仅描述了整体测序。
四个节中的大多数方案利用核苷酸类似物上的可切割的基团、染料或锚的正交组,其中四种核苷酸中的每一种具有与其余部分正交的特征,例如2种染料和2种锚的正交组合或2种染料和2种可切割的接头的正交组合。这些组合允许进行2-色(每个测序循环2个成像步骤),甚至允许1-色测序(每个循环3个成像步骤)。
在本申请中,在各种方案中使用的大多数核苷酸类似物在3'o位置处包含二硫代甲基(dtm(ss))保护基团,并且通常在碱基和染料或锚分子之间的接头中包含可切割的dtm(ss)基团。以前的方法中,将ss基团置于碱基和染料之间,但切割后会形成游离的反应性sh基团,在可进行第二个延伸反应之前,该基团必须先用碘乙酰胺封端(mitraetal2003,turcattietal2008)。这限制了测序读取的长度。在本申请中所述的在碱基和荧光团之间的新的基于dtm的接头不需要在用thp切割后将所得的游离sh基团封端,因为切割产物立即崩解(collapse)为稳定的oh基团。
第i节:具有二硫保护的3'位和碱基上修饰的核苷酸类似物:核苷酸类似物的正交基团
先前已经描述了基于二硫接头的核苷酸作为可逆终止子用于dna测序(juetalwo2017/058953a1;juetalwo2017/205336a1)。本文公开了使用核苷酸类似物的12种新的sbs方案,其中:(1)核苷酸类似物的3'位置被二硫代甲基(dtm)部分保护,该二硫代甲基部分可以用三(羟丙基)膦(thp)特异性地切割;(2)通过ss或其他可切割的接头将荧光染料或锚(用于随后连接荧光染料)连接至碱基。在这些方案中的三个方案中,染料簇或锚簇用于增强信号,以增加单分子测序的容易性。
尽管在该节中示出的所有示例中的3'-保护基团是叔丁基-二硫代甲基,但是也可以使用其他烷基基团,例如甲基-二硫代甲基或乙基-二硫代甲基。
在本专利申请中提及dtm的任何地方,它都可以指二硫代甲基基团或连接到3′-o位置的各种烷基或其他取代的二硫代甲基基团。也可以使用其他保护基团(偶氮、烯丙基、2-硝基苄基、叠氮基甲基),特别是如果该基团作为碱基和染料或锚之间的所有接头中的一般可切割的基团而存在的情况下。除了核苷三磷酸类似物外,核苷四磷酸、核苷五磷酸、核苷六磷酸和高级核苷多磷酸类似物也是可行的替代方案。
在以下方案中,作为第二(非dtm)可切割的接头的示例,将偶氮基团置于接头中;示出了连二亚硫酸钠作为示例性切割剂(参见图124a-128b,展示了连二亚硫酸钠对偶氮基团的切割效率和在这些条件下ss键的稳定性)。atto647n、rox和bodipyfl用作荧光团的示例;提供生物素或tco作为锚的示例;链霉亲和素或四嗪用作锚结合分子的示例。但是,接头中的各种其他可切割的基团(例如,烯丙基、2-硝基苄基基团)、切割剂(例如,pd(0)、~340nm光)、荧光团、锚(例如,dbco、n3、四嗪)*和锚结合分子(例如n3、dbco、tco)*也是可行的。
荧光染料可以由单一染料分子、表现出能量转移的染料对、连接在线性或支链聚合物的多个位置处的染料簇以及量子点组成。尽管本节中未提供任何示例,但可以使用其他标记,例如包括拉曼标签的非荧光标记,以及将纳米孔中的离子电流信号降低到不同程度、在离子通道内具有不同的停留时间的标签组,或者两者兼而有之。
方案i是需要两个检测步骤的2-色sbs方案。方案ii和方案iii是单-色方案,需要三个检测步骤来确定掺入的核苷酸。方案iv是使用锚和染料簇并需要三个检测步骤的1-色方案。方案v和方案via是使用锚和染料簇并分别需要三个检测步骤和两个检测步骤的2-色方案。方案vib和方案vic是利用了量子点(qd)的2-色方案,其中用于qd标记的锚全部存在于碱基上。方案vid和方案vie是利用了量子点的2-色方案,其中用于qd标记的锚存在于不同核苷酸类似物的碱基和/或3'-o位置上。方案viia和方案viib是利用了能量转移染料的1-色方案,每个方案都需要三个成像步骤。
这些方案中的一些包括可选的确认性成像步骤。在添加包含染料或锚的核苷酸类似物后,可以进行使用未标记核苷酸类似物的追加(chasing),以确保每个dna引物链都已延伸,以避免异步反应,并且可以在各个步骤之间采用洗涤以去除先前组的试剂和/或释放的染料。这些方案可用于整体或单分子测序。在整体测序的情况下,通过追加核苷酸类似物进行的延伸以及由此导致的延伸引物子集的信号缺失,仍然允许观察到用标记的核苷酸类似物延伸的剩余的引物所产生的信号。在单分子测序的情况下,追加步骤(chasestep)是可选的。在使用追加(chasing)进行单分子测序的情况下,如果将追加核苷酸类似物(而不是适当的标记的核苷酸类似物)掺入生长中的dna链中,则不会读取该位置处的碱基,尽管将在适当的循环中读取随后的碱基(followingbase)。因此,除了在没有获得信号的已知位置之外,序列将是准确的。
单分子测序
如上所述,本文所述的许多方案可用于整体或单分子测序。在单分子荧光测序的情况下,由于未掺入荧光核苷酸或游离的荧光标记分子(例如带有荧光团的锚结合分子),信号和背景的敏感性是两个主要问题。诸如全内反射荧光(tirf)显微镜或随机光学重建显微镜(storm)的特殊仪器可用于检测单个荧光分子。tirf显微镜可能是其中最常见的一种,并且是helicosbiosciences单分子测序方法中使用的一种,它依赖于载玻片表面处产生的渐逝波,这种波随着距表面的距离而迅速衰减。在距表面100nm的数量级内,可获得强信号。此外,由于大多数游离荧光核苷酸或标记分子不在该100nm窗口内,因此几乎没有背景。尽管如此,仍无法完全消除背景。类似的原理也出现在加利福尼亚太平洋生物科学公司的零模波导(zmw)中,其中距70nm直径孔的底部的距离为100nm。因此,虽然大多数游离的荧光分子(4种不同的颜色的)将被排除在外,但少数将进入zmw,在那里它们可能会产生假阳性信号。
本文公开了至少两种方法,其可以进一步影响使用tirf显微镜的单分子测序。在第一种方法中,为了进一步提高灵敏度,在下面的某些方案中(方案iv-via),使用了染料簇或锚簇以用于随后连接多种染料。在主要目的为降低检测背景荧光的可能性的第二种方法中,利用了供体染料和受体染料(以彼此相距较短的距离放置)之间的荧光共振能量转移(方案viia和方案viib)。fret与tirf显微镜的组合以前已有报道,使用一种核苷酸上的cy3供体和第二核苷酸上的cy5受体来获得至多5个碱基的指纹(braslavskyetal2003)。典型的荧光能量转移的福斯特半径为约5nm(1nm至10nm之间)。在利用同一核苷酸上的供体和受体之间的能量转移的上述第二种方法中,因为用于激发供体染料的激光无法直接激发受体染料,所以溶液中的游离浮动的荧光受体分子必须在1-10nm范围内才能被视为错误信号。这种可能性极低,这意味着只有受体染料被故意置于供体染料的~5nm范围内,或者位于直接连接至核苷酸类似物的聚合物分子的同一段(samestretch)上,或者当直接连接到具有锚的核苷酸类似物的供体染料和连接到锚结合分子上的受体染料缀合而聚集在一起时才有可能。
供体染料和受体染料的选择也很重要。例如,具有宽吸收窗但荧光量子产率低的供体染料可用于增加受体染料的斯托克斯位移荧光发射(hungetal1996)。例如,已表明已知cya(花青染料)供体和作为受体的荧光素或若丹明衍生物满足这些条件。
本文进一步公开了一种方法,该方法通过具有直接连接于核苷酸(线性链或树枝状构象)的供体-受体染料对的簇或供体染料簇和用于将多个受体染料连接在锚结合分子上的锚(例如,对于方案viia),既可以增加信号,减少背景检测,又可以减少错过掺入事件的机会。潜在地,这种组合方法可用于通过最先进的光学系统实现单分子sbs,其成本和占地面积(footprint)比tirf显微镜低。
涉及每种核苷酸类似物上的单一染料的方案
方案i:使用两种染料和两种可切割的接头的2-色sbs;掺入后和第一次切割后成像。在方案i中,使用核苷酸类似物的正交集,一种具有通过ss键连接到碱基的染料1,一种具有通过偶氮键连接到碱基的染料1,一种具有通过ss键连接到碱基的染料2,一种具有通过偶氮键连接到碱基的染料2。添加四种核苷酸类似物后的成像将明确地表明两种类型的核苷酸类似物中的任何一种的掺入。用连二亚硫酸钠切割偶氮接头后,成像将明确地显示掺入了哪种核苷酸类似物。然后,用thp进行切割将去除剩余的染料,并恢复3′-oh基团,以用于随后的测序循环。在所示的示例中,染料1是rox,染料2是bodipyfl。也可以使用染料和可切割的接头的其他组合。
图31a-31e包含使用3’-o-ss(dtm)-dntp-ss-染料(3’-o-ss-datp-7-ss-rox、3’-o-ss-dttp-5-ss-bodipyfl)和3’-o-ss(dtm)-dntp-偶氮-染料(3’-o-ss-dctp-7-偶氮-rox、3’-o-ss-dgtp-5-偶氮-bodipyfl)进行2-色dnasbs的方案i的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-rox、3'-o-ss-dttp-5-ss-bodipyfl、3'-o-ss-dctp-7-偶氮-rox和3'-o-ss-dgtp-5-偶氮-bodipyfl)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加(chase):将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何染料标记的dntp延伸的生长中的dna链的子集(subset)中。生长中的dna链被四种染料标记的核苷酸类似物(a、c、g、t)中的一种或不具有染料的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,洗去未掺入的染料标记的核苷酸后,检测dna产物上每种荧光染料产生的独特的荧光信号,使得可以部分鉴别掺入的核苷酸,以进行序列测定:rox信号表明掺入了a或c,bodipyfl信号表明掺入了t或g。步骤4,通过向加长的dna链中添加连二亚硫酸钠(na2s2o4)来切割偶氮接头,导致从掺入的c中去除rox,并从掺入的g中去除bodipyfl。步骤5,洗去切割下的染料后,第二轮检测dna产物上每种荧光染料产生的独特的荧光信号,使得可以鉴别掺入的核苷酸以进行序列测定。rox信号的消失表示掺入了c,而bodipyfl信号的消失表示掺入了g。rox信号保留表明掺入了a,而bodipyfl信号保留表明掺入了t。接下来,在步骤6中,用thp处理dna产物来切割ss接头,导致残留的荧光染料的去除和dna延伸产物上的游离3'-oh基团的再生,这为dna测序反应的下一个循环做好了准备。荧光图像的示意图如图31e中所示。空心圆和空心三角形表示“无荧光信号”,实心圆和实心三角形表示“两个不同的波长的荧光信号”。在本节中,可以为其他2-色sbs方案构造类似的示意图。尽管在方案i中未指出,但是如果需要,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长(read)。该方案中使用的修饰的核苷酸的结构如图5所示。
方案ii:使用一种染料、一种锚和两种可切割的接头的1-色sbs;在掺入后、标记后和第一次切割后成像。在方案ii中,使用核苷酸类似物的正交集,一种具有通过ss键连接到碱基的染料1,一种具有通过偶氮键连接到碱基的染料1,一种具有通过ss键连接到碱基的锚1,一种具有通过偶氮键连接到碱基的锚1。添加四种核苷酸类似物后的成像将明确地表明两种类型的核苷酸类似物中的任何一种的掺入。通过锚1结合分子用染料1标记后的成像将明确地证实其他两种类型的核苷酸类似物中的任何一种的掺入。(成像是可选的,但建议在此步骤中进行。)最后,用连二亚硫酸钠切割偶氮接头将明确地表明掺入了哪种核苷酸类似物。然后,用thp进行切割将去除剩余的染料,并恢复3'-oh基团,以用于随后的测序循环。在所示的示例中,染料1是atto647n,锚1是生物素。也可以使用染料、锚和可切割的接头的其他组合。
图32a-32d包含使用3’-o-ss(dtm)-dntp-ss-染料(3’-o-ss-datp-7-ss-atto647n)、3’-o-ss(dtm)-dntp-偶氮-染料(3’-o-ss-dttp-5-偶氮-atto647n)、3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-dctp-5-ss-生物素)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dgtp-7-偶氮-生物素)和相应的染料标记的结合分子(atto647n标记的链霉亲和素)进行1-色dnasbs的方案ii的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-atto647n、3'-o-ss-dttp-5-偶氮-atto647n、3'-o-ss-dctp-5-ss-生物素和3'-o-ss-dgtp-7-偶氮-生物素)加入到固定的引发的dna模板中使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到步骤1中没有用任何染料标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种染料标记的核苷酸类似物(a、c、g、t)中的一种或不具有染料或锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,洗去未掺入的染料标记的核苷酸和核苷酸终止子后,检测dna产物上每种荧光染料产生的荧光信号,使得可以部分鉴别掺入的核苷酸以进行序列测定,atto647n信号表明掺入了a或t。步骤4,用链霉亲和素-atto647n进行标记。洗掉剩余的游离标记后,在步骤5中检测到新的atto647n信号表明掺入了c或g。接下来,在步骤6中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而除去g和t上的任何荧光染料。步骤7,洗去切割下的染料后,进行成像。在此步骤中,如果已经确定掺入的核苷酸可能是a或t,则荧光消失表明其为t,而荧光保留表明其为a。类似地,对于先前确定为c或g的信号,荧光消失将明确地表明掺入了g,而荧光保留将表明掺入了c。接下来,在步骤8中,用thp处理dna产物来切割ss接头,从而去除剩余的荧光染料并导致dna延伸产物上的游离3'-oh基团的再生。洗掉thp后,任选的成像步骤(未示出)将确认所有染料均已去除,为下一个测序循环做准备。方案ii的底部示出了荧光图像的示意图。空心圆表示“无荧光信号”,实心圆表示“荧光信号”。在本节中,可以为其他1-色sbs方案构造类似的示意图。尽管在方案ii中没有指出,但是如果需要的话,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图6所示。
方案iii:使用两种锚和两种可切割的接头的1-色sbs:在每个标记步骤后和第一次切割后成像。在方案iii中,使用核苷酸类似物的正交集,一种具有通过ss键连接到碱基的锚1,一种具有通过偶氮键连接到碱基的锚1,一种具有通过ss键连接到碱基的锚2,一种具有通过偶氮键连接到碱基的锚2。进行掺入。然后,在将染料1连接到锚1结合分子的第一标记步骤后进行成像将表明掺入了两种类型的核苷酸类似物中的任何一种。在将染料1连接到锚2结合分子的第二标记步骤后进行成像将确认掺入了其他两种类型的核苷酸类似物中的任何一种。(成像是任选的,但建议在此步骤进行。)用连二亚硫酸钠切割偶氮接头后成像将表明掺入了特定的核苷酸类似物。然后,用thp进行切割将去除剩余的染料,并恢复3′-oh基团,以用于随后的测序循环。在所示的示例中,染料1是atto647n,锚1是生物素,锚2是tco。也可以使用染料、锚和可切割的接头的其他组合。
在2-染料方案的情况下,选择具有良好分离的吸收和发射光谱的染料。2-色方案,特别是1-色方案旨在减少所需的光学设备的尺寸、成本和复杂性。
尽管提出的所有方案都使用dna模板和引物、2-脱氧核苷酸类似物和dna聚合酶,但是原则上可以对方案进行调整以包括用于rna依赖性dna聚合酶以及dna或rna依赖性rna聚合酶的合适的模板、引物和核苷酸类似物。
图33a-33d包含示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dttp-5-偶氮-tco、3’-o-ss-dctp-5-偶氮-生物素)和相应的染料标记的结合分子(atto647n标记的链霉亲和素和atto647n标记的四嗪)进行1-色dnasbs的方案iii的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-生物素、3'-o-ss-dttp-5-偶氮-tco、3'-o-ss-dctp-5-偶氮-生物素和3'-o-ss-dgtp-7-ss-tco)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3′-o-叔丁基二硫代甲基(ss)-datp、3′-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何锚标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种锚标记的核苷酸类似物(a、c、g、t)中的一种或不具有锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-atto647n进行标记。该染料将特异性结合a核苷酸类似物和c核苷酸类似物,但不结合g类似物和t类似物。步骤4,洗去剩余的游离标记和多余的核苷酸后,检测到新的atto647n信号表明掺入了a或c。步骤5,用四嗪-atto647n进行标记。该染料将特异性结合g核苷酸类似物和t核苷酸类似物,但不结合a类似物和c类似物。步骤6,洗去剩余的游离标记和多余的核苷酸后,检测到新的atto647n信号表明掺入了g或t。接下来,在步骤7中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而除去t和c上的任何荧光染料。步骤8,洗去切割下的染料后,进行成像以确定atto647n荧光的存在。在此步骤中,如果已经确定掺入的核苷酸可能是a或c,则荧光丢失将表明其为c,而保留荧光将表明其为a。类似地,对于先前确定为g或t的信号,荧光丢失将明确地表明掺入了t,而保留荧光将表明掺入了g。接下来,在步骤9中,用thp处理dna产物来切割ss接头,从而去除残留的荧光染料,并导致dna延伸产物上的游离3'-oh基团的再生。步骤10,在洗掉thp之后,任选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。尽管在方案iii中没有指出,但是如果需要的话,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图7所示。
涉及每种核苷酸类似物上的染料簇的方案
方案iv:使用一种染料簇、一种锚簇和两种可切割的接头的1-色sbs;在掺入后、标记后和第一次切割后成像。与方案ii的唯一区别是锚簇(锚1簇)或染料簇(染料1簇)连接到碱基。在标记步骤中,多种染料将结合到锚簇上。在所示的示例中,染料1簇是atto647n簇,而锚1簇是生物素簇。也可以使用染料簇、锚簇和可切割的接头的其他组合。
图34a-34c包含示出了使用3’-o-ss(dtm)-dntp-ss-染料簇(3’-o-ss-datp-7-ss-atto647n簇)、3’-o-ss(dtm)-dntp-偶氮-染料簇(3’-o-ss-dttp-5-偶氮-atto647n簇)、3’-o-ss(dtm)-dntp-ss-锚簇(3’-o-ss-dctp-5-ss-生物素簇)、3’-o-ss(dtm)-dntp-偶氮-锚簇(3’-o-ss-dgtp-7-偶氮-生物素簇)和相应的染料标记的结合分子(atto647n标记的链霉亲和素)进行1-色dnasbs的方案iv的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-atto647n簇、3'-o-ss-dttp-5-偶氮-atto647n簇、3'-o-ss-dctp-5-ss-生物素簇、3'-o-ss-dgtp-7-偶氮-生物素簇)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3′-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何染料簇或锚簇标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种染料簇或锚簇标记的核苷酸类似物(a、c、g、t)中的一种或不具有染料或锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,洗掉未掺入的染料标记的核苷酸和核苷酸终止子后,检测dna产物上每种荧光染料产生的荧光信号,使得可以部分鉴别掺入的核苷酸类似物以进行序列测定,atto647n信号表明掺入了a或t。步骤4,用链霉亲和素-atto647n进行标记。洗掉剩余的游离标签后,在步骤5中检测到新的atto647n信号表明掺入了c或g。接下来,在步骤6中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而去除g和t上的任何荧光染料。步骤7,洗掉切割下的染料后,进行成像。在此步骤中,如果已经确定掺入的核苷酸类似物可能是a或t,则荧光丢失将表明其为t,而保留荧光将表明其为a。类似地,对于先前确定为c或g的信号,荧光丢失将明确地表明掺入了g,而保留荧光将表明掺入了c。接下来,在步骤8中,用thp处理dna产物来切割ss接头,从而除去剩余的荧光染料,并导致dna延伸产物上的游离3'-oh基团的再生。洗掉thp后,任选的成像步骤(未示出)将确认所有染料均已去除,为下一个测序循环做准备。尽管在方案iv中没有指出,但是如果需要的话,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图8所示。
方案v:使用两种锚簇、2种染料和两种可切割的接头的2-色sbs:在每个标记步骤之后和第一次切割后成像。与方案iii有些相似,但两种不同的染料簇(锚1簇和锚2簇)中的一种与碱基相连接。在标记步骤中,多种染料将结合到锚簇上。在第一个标记步骤之后,染料1荧光的存在将表明两种可能掺入的核苷酸类似物。在第二个标记步骤之后,染料2荧光的出现将验证其他两种类型的核苷酸类似物的掺入。成像是任选的,但建议在此步骤进行。用连二亚硫酸钠切割偶氮接头后进行成像将表明掺入的特定的核苷酸类似物。然后,用thp进行切割将去除剩余的染料,并恢复3'-oh基团,以用于随后的测序循环。在此示例中,锚1簇包含生物素,锚2簇包含tco,染料1是rox,染料2是alexa488。也可以使用染料、锚和可切割的接头的其他组合。
图35a-35d包含示出了使用3’-o-ss(dtm)-dntp-ss-锚簇(3’-o-ss-datp-7-ss-生物素簇、3’-o-ss-dgtp-7-ss-tco簇)、3’-o-ss(dtm)-dntp-偶氮-锚簇(3’-o-ss-dctp-5-偶氮-生物素簇、3’-o-ss(dtm)-dttp-5-偶氮-tco簇)和相应的染料标记的结合分子(rox标记的链霉亲和素和alexa488标记的四嗪)进行2-色dnasbs的方案v的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-生物素簇、3'-o-ss-dttp-5-偶氮-tco簇、3'-o-ss-dctp-5-偶氮-生物素簇和3'-o-ss-dgtp-7-ss-tco簇)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3′-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3′-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何锚簇标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种锚簇标记的核苷酸类似物(a、c、g、t)中的一种或不具有染料簇或锚簇的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-rox进行标记。该染料将特异性结合a核苷酸类似物和c核苷酸类似物,但不结合g类似物和t类似物。步骤4,洗掉剩余的游离标记和多余的核苷酸后,检测到新的rox信号表明掺入了a或c。步骤5,用四嗪-alexa488进行标记。该染料将特异性结合g核苷酸类似物和t核苷酸类似物,但不结合a类似物和c类似物。步骤6,洗去剩余的游离标记和多余的核苷酸后,检测到新的alexa488信号表明掺入了g或t。接下来,在步骤7中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而去除了t和c上的任何荧光染料。步骤8,洗掉切割下的染料簇后,进行成像。在此步骤中,如果已经确定掺入的核苷酸可能是a或c,则丢失rox荧光将表明其为c,而保留rox荧光将表明其为a。类似地,对于先前确定为g或t的信号,alexa488荧光的丢失将明确地表明掺入了t,而保留荧光将表明掺入了g。接下来,在步骤9中,用thp处理dna产物来切割ss接头,从而除去剩余的荧光染料簇并导致dna延伸产物上的游离3'-oh基团的再生。步骤10,在洗掉thp之后,任选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。尽管在方案ⅴ中没有指出,但是如果需要的话,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致较长的读长。该方案中使用的修饰的核苷酸的结构如图9所示。
方案via:使用两种染料簇、两种锚簇和一种可切割的接头的2-色sbs:在掺入和标记步骤之后进行成像。在方案via中,染料1簇、染料2簇、锚1簇和锚2簇分别通过ss键连接到四种碱基上。进行掺入。成像将明确地表明两种类型的核苷酸类似物的掺入。接下来,分别将锚1结合分子和锚2结合分子连接到染料1和染料2的单个拷贝上来进行标记。成像将明确地表明其他两种类型的核苷酸类似物的掺入。然后,用thp进行切割将去除剩余的染料,并恢复3'-oh基团,以用于随后的测序循环。在所示的示例簇中,染料1是rox,染料2是bodipyfl,锚1是生物素,锚2是tco。也可以使用染料簇和锚簇的其他组合。
在单个分子测序的情况下,使用染料簇和锚簇的上述方法对于增加灵敏度特别有用。
图36a-36c包含示出了使用3’-o-ss(dtm)-dntp-ss-染料簇(3’-o-ss-datp-7-ss-rox簇、3’-o-ss-dttp-5-ss-bodipyfl簇)、3’-o-ss(dtm)-dntp-ss-锚簇(3’-o-ss-dctp-5-ss-生物素簇、3’-o-ss-dgtp-7-ss-tco簇)和相应的染料标记的锚结合分子(链霉亲和素-rox、四嗪-bodipyfl)进行2-色dnasbs的方案via的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-rox簇、3'-o-ss-dttp-5-ss-bodipyfl簇、3'-o-ss-dctp-5-ss-生物素簇、3'-o-ss-dgtp-7-ss-tco簇)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3′-o-ss-核苷酸类似物掺入到在步骤1中没有用任何锚簇或染料簇标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种锚簇或染料簇标记的核苷酸类似物(a、c、g、t)中的一种或不具有染料簇或锚簇的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,洗掉未掺入的染料或锚标记的核苷酸后,检测dna产物上每种荧光染料产生的独特的荧光信号,使得可以鉴别两种掺入的核苷酸以进行序列测定:rox信号表明掺入了a,bodipyfl信号表明掺入了t。步骤4,用将与生物素锚簇结合的链霉亲和素-rox分子和将与tco锚簇结合的四嗪-bodipyfl分子进行标记。步骤5,洗涤后,第二轮检测dna产物上每种荧光染料产生的独特的荧光信号,使得可以鉴别剩余的两种掺入的核苷酸以进行序列测定。新的rox信号表明掺入了c;新的bodipyfl信号表明掺入了g。接下来,在步骤6中,用thp处理dna产物来切割ss接头,从而去除剩余的荧光染料簇,并导致dna延伸产物上的游离3'-oh基团的再生,这为dna测序反应的下一个循环做好了准备。步骤7,洗掉thp后,任选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。尽管在方案via中没有指出,但是如果需要,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图10a所示。
涉及量子点的方案
方案vib:使用两种锚、两种量子点和两种可切割的接头的2-色sbs:在标记之后和切割之后进行成像。在方案vib中,核苷酸类似物的正交集包括通过ss键连接的锚1、通过ss键连接的锚2、通过偶氮键连接的锚1和通过偶氮键连接的锚2,每一种锚均连接至不同的碱基。进行掺入。然后添加具有量子点1(qd1)的锚1结合分子和具有qd2的锚2结合分子。由于量子点的宽吸收光谱,利用单激光(singlelaser)对两种qd进行激发成像后,qd1荧光的出现将掺入的核苷酸类似物的选择限定为两种可能性,而qd2荧光的出现将掺入的核苷酸类似物的选择限定为其他两种替代选择。在用连二亚硫酸钠切割偶氮接头之后,再次用单激光进行的成像将表明掺入的特定的核苷酸类似物。然后,使用thp进行切割将去除剩余的qd,并恢复3'-oh基团,以用于后续的测序循环。在所示的示例中,锚是生物素和tco,可切割的接头是偶氮和ss,qd1和qd2分别是绿色发射体和红色发射体,但是也可以使用可切割的接头、锚和不同的qd的其他组合。
图37a-37c包含示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dttp-5-偶氮-tco、3’-o-ss-dctp-5-偶氮-生物素)和相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)进行2-色dnasbs的方案vib的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-生物素、3′-o-ss-dgtp-7-ss-tco、3′-o-ss-dttp-5-偶氮-tco、3'-o-ss-dctp-5-偶氮-生物素)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3′-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何锚标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种锚标记的核苷酸类似物(a、c、g、t)中的一种或不具有锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-qd1和四嗪-qd2进行标记。qd1将特异性结合a核苷酸类似物和c核苷酸类似物,而qd2将结合g类似物和t类似物。步骤4,洗去剩余的游离标记和多余的核苷酸后,检测到qd1荧光将表明掺入了a或c,检测到qd2荧光将表明掺入了g或t。接下来,在步骤5中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而去除t和c上的qd。步骤6,洗去切割下的qd后,进行成像以确定存在qd1(绿色)和qd2(红色)荧光。在此步骤中,如果已经确定掺入的核苷酸可能是a或c,则荧光丢失将表明其为c,而保留荧光将表明其为a。类似地,对于先前确定为g或t的信号,荧光的丢失将明确地表明掺入了t,而保留荧光将表明掺入了g。接下来,在步骤7中,用thp处理dna产物来切割ss接头,从而去除剩余的qd并导致dna延伸产物上的游离3'-oh基团的再生。步骤8,洗掉thp后,任选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。尽管在方案vib中未指出,但是如果需要,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图10b所示。
方案vic:使用不同比例的两种锚和两种量子点的2-色sbs:标记后进行成像。在方案vic中,四种核苷酸类似物均通过ss接头连接至锚1或锚2,锚1:锚2为1:1的混合物和锚1:锚2为2:1的混合物。在掺入所有四种核苷酸类似物之后,用具有qd1的锚1-结合分子和具有qd2的锚2-结合分子进行标记步骤。由于量子点的宽吸收光谱,用单激光激发两种qd进行的成像将显示由于qd1而产生的荧光、由于qd2而产生的荧光或取决于qd1和qd2的比例的中间荧光(intermediatefluorescence),以表明掺入的特定的核苷酸类似物。然后,使用thp进行切割将去除剩余的qd,并恢复3'-oh基团,以用于后续的测序循环。在所示的示例中,锚是生物素和tco,qd1和qd2分别是绿色发射体和红色发射体,但是也可以使用锚和不同的qd的其他组合。
图38a-38d包含示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco、3’-o-ss-dttp-5-ss-生物素/生物素/tco、3’-o-ss-dctp-5-ss-生物素/tco)和相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)进行2-色dnasbs的方案vic的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-生物素、3'-o-ss-dgtp-7-ss-tco、3'-o-ss-dttp-5-ss-生物素/生物素/tco、3'-o-ss-dctp-5-ss-生物素/tco)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何锚标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种锚标记的核苷酸类似物(a、c、g、t)中的一种或不具有锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-qd1和四嗪-qd2进行标记。仅有qd1将与a核苷酸类似物结合,仅有qd2将与g类似物结合,两个qd1分子和一个qd2分子将与t类似物结合,一个qd1分子和一个qd2分子将与c类似物结合。步骤4,洗去剩余的游离qd和多余的核苷酸后,检测到qd1荧光(绿色)将表明掺入了a,检测到qd2荧光(红色)将表明掺入了g,检测到qd1荧光和qd2荧光的均等混合将表明掺入了c,检测到qd1:qd2荧光为2:1的混合将表明掺入了t。接下来,在步骤5中,用thp处理dna产物来切割ss接头,从而去除qd并导致dna延伸产物上游离3′-oh基团的再生。步骤6,洗掉thp后,任选的成像步骤将确认已除去所有qd,为下一个测序循环做准备。方案vic的底部示出了荧光光谱的示意图,表明该方法的比例特性(ratiometricnature)。尽管在方案vic中没有指出,但是如果需要,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图10c所示。
方案vid:使用两种锚、两种量子点和两种可切割的接头的2-色sbs,其中锚存在于碱基或3′位置处或者两个位置上都存在锚:在标记后和切割后进行成像。该方案在原理上与方案vib相同,不同之处为用于连接量子点的锚可以连接到碱基、3′-o位置或者与碱基和3'-o位置两者都连接。
图39a-39c包含示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dttp-5-偶氮-tco、3’-o-ss-dctp-5-偶氮-生物素)、3’-o-锚-ss(dtm)-dntp(3’-o-tco-ss-dgtp)和相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)进行2-色dnasbs的方案vid的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-生物素、3'-o-ss-dttp-5-偶氮-tco、3'-o-ss-dctp-5-偶氮-生物素、3′-o-tco-ss-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3′-o-叔丁基二硫代甲基(ss)-datp、3′-o-叔丁基二硫代甲基(ss)-dctp、3′-o-叔丁基二硫代甲基(ss)-dttp和3′-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何锚标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种锚标记的核苷酸类似物(a、c、g、t)中的一种或不具有锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-qd1和四嗪-qd2进行标记。qd1将特异性结合a核苷酸类似物和c核苷酸类似物,而qd2将结合g类似物和t类似物。步骤4,洗去剩余的游离标记和多余的核苷酸后,检测到qd1荧光将表明掺入了a或c,检测到qd2荧光将表明掺入了g或t。接下来,在步骤5中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而去除t和c上的qd。步骤6,洗去切割下的qd后,进行成像以确定qd1(绿色)荧光和qd2(红色)荧光的存在。在此步骤中,如果已经确定掺入的核苷酸可能是a或c,则荧光丢失将表明其为c,而保留荧光将表明其为a。类似地,对于先前确定为g或t的信号,荧光丢失将明确地表明掺入了t,而保留荧光将表明掺入了g。接下来,在步骤7中,用thp处理dna产物来切割ss接头,从而去除剩余的qd并导致dna延伸产物上的游离3'-oh基团的再生。步骤8,洗掉thp后,任选的成像步骤将确认已除去所有qd,为下一个测序循环做准备。尽管在方案vid中没有指出,但是如果需要,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图10d所示。
方案vie:使用不同比例的两种锚和两种量子点的2-色sbs,其中锚存在于碱基或3′位置处或者两个位置上都存在锚:标记后进行成像。该方案在原理上与方案vic相同,不同之处为用于连接量子点的锚可以连接到碱基、3′-o位置或者与碱基和3′-o位置两者都连接。
图40a-40c包含示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco)、3’-o-锚-ss(dtm)-dntp-ss-锚(3’-o-tco-ss-dctp-5-ss-生物素、3’-o-tco-ss-dttp-5-ss-生物素/生物素)和相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)进行2-色dnasbs的方案vie的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-生物素、3'-o-ss-dgtp-7-ss-tco、3′-o-tco-ss-dctp-5-ss-生物素、3'-o-tco-ss-dttp-5-ss-生物素/生物素)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3′-o-ss(dtm)-dntp(3′-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3′-o-ss-核苷酸类似物掺入到在步骤1中没有用任何锚标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种锚标记的核苷酸类似物(a、c、g、t)中的一种或不具有锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-qd1和四嗪-qd2进行标记。仅有qd1将与a核苷酸类似物结合,仅有qd2将与g类似物结合,两个qd1分子和一个qd2分子将与t类似物结合,一个qd1分子和一个qd2分子将与c类似物结合。步骤4,洗去剩余的游离qd和多余的核苷酸后,检测到qd1荧光(绿色)将表明掺入了a,检测到qd2荧光(红色)将表明掺入了g,检测到qd1荧光和qd2荧光的均等混合将表明掺入了c,检测到qd1:qd2荧光为2:1的混合将表明掺入了t。接下来,在步骤5中,用thp处理dna产物来切割ss接头,从而去除qd并导致dna延伸产物上的游离3'-oh基团的再生。步骤6,洗掉thp后,任选的成像步骤将确认已除去所有qd,为下一个测序循环做准备。方案vic的底部示出了荧光光谱的示意图,表明该方法的比例特性。尽管在方案vie中没有指出,但是如果需要,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图10e所示。
涉及供体-受体对的方案
方案viia:使用两种锚,一种供体-受体染料对和两种可切割的接头的1-色sbs:在两个标记步骤之后和切割之后进行成像。在方案vii-a中,正交集由以下组成:通过ss键连接的包含供体染料1的锚1、通过偶氮键连接的包含供体染料1的锚1、通过ss键连接的包含供体染料1的锚2和通过偶氮键连接的包含供体染料1的锚2,每一种锚均连接至不同的碱基。进行掺入。添加包含受体染料1的锚1-结合分子。在用供体染料1激发进行成像后,受体染料1发出的荧光将表明两种可能的核苷酸类似物的掺入。接下来,添加包含受体染料1的锚2-结合分子。在用供体染料1激发进行成像后,受体染料1发出的新的荧光将表明其他两种可能的核苷酸类似物的掺入。用连二亚硫酸钠切割偶氮接头后进行的成像将表明掺入的特定的核苷酸类似物。然后,用thp进行切割去除剩余的染料,并恢复3'-oh基团,以用于随后的测序循环。在所示的示例中,可切割的接头是偶氮和ss,供体染料1是cy3,受体染料1是cy5,但是也可使用其他可切割的接头(例如2-硝基苄基或烯丙基)和其他供体-受体对(例如,cya是供体,rox或cy3是供体;fam是供体,rox是受体)。接头可以是具有2个或多个供体染料1分子的长线性链或树状聚合物,在这种情况下,多种受体染料将通过锚-锚结合分子的缀合步骤连接。该方案在如上所述的单分子sbs的情况下将特别有用。
应该认识到,供体染料可以直接连接到锚分子上,而受体染料可以连接到锚结合分子上,如示例所示。但是另一种安排是合理的,其中受体染料在锚部分上,供体染料在锚结合分子上,这实际上是有好处的。例如,在标记步骤中将优先使用非常大的荧光结构,例如量子点(通常为10-50nm的半胶体纳米晶体)。量子点作为fret供体具有优势,因为它们的吸收范围宽,使得可以选择对受体染料没有直接影响的激发波长,由于它们的消光系数非常高,因而相对于有机荧光团具有很高的亮度,但具有相似的量子产率、可调谐性、稳定性且发射光谱的带宽窄。
方案viib:使用两种锚,一种供体-受体染料对和两种可切割的接头的1-色sbs:在两个标记步骤之后和切割之后进行成像。该方案实际上与方案viia相同,不同之处为供体染料连接到碱基上,而用于连接受体染料的锚位于糖的3'位置处。所有步骤均以与方案viia相同的顺序执行。仔细设计碱基和3'位置上的接头将确保供体染料和受体染料彼此之间的距离在fret距离范围内。在此示例中,将供体染料连接到碱基上,将受体染料连接到3'位置,相反的定位(供体染料在3'处,受体染料在碱基上)同样可行。
图41a-41d包含示出了使用3’-o-ss(dtm)-dntp-ss-供体染料-锚(3’-o-ss-datp-7-ss-cy3-生物素、3’-o-ss-dgtp-7-ss-cy3-tco)、3’-o-ss(dtm)-dntp-偶氮-供体染料-锚(3’-o-ss-dttp-5-偶氮-cy3-tco、3’-o-ss-dctp-5-偶氮-cy3-生物素)和相应的染料标记的结合分子(cy5标记的链霉亲和素和cy5标记的四嗪)进行1-色dnasbs的方案viia的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-cy3-生物素、3'-o-ss-dttp-5-偶氮-cy3-tco、3'-o-ss-dctp-5-偶氮-cy3-生物素和3'-o-ss-dgtp-7-ss-cy3-tco)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何锚标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种供体染料-锚标记的核苷酸类似物(a、c、g、t)中的一种或不具有锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-cy5进行标记。该染料将特异性结合a核苷酸类似物和c核苷酸类似物,但不结合g类似物和t类似物。步骤4,洗去剩余的游离标记和多余的核苷酸后,在cy3激发后检测到cy5信号表明掺入了a或c。步骤5,用四嗪-cy5进行标记。该染料将特异性结合g核苷酸类似物和t核苷酸类似物,但不结合a类似物和c类似物。步骤6,洗去剩余的游离标记和多余的核苷酸后,在cy3激发后检测到新的cy5信号表明掺入了g或t。接下来,在步骤7中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而去除t和c上的任何供体-受体染料对。步骤8,洗掉切割下的染料后,在cy3激发后进行成像以确定cy5荧光的存在。在此步骤中,如果已经确定掺入的核苷酸可能是a或c,则cy5荧光丢失将表明其为c,而保留荧光将表明其为a。类似地,对于先前确定为g或t的信号,cy5荧光的丢失将明确地表明掺入了t,而保留荧光将表明掺入了g。接下来,在步骤9中,用thp处理dna产物来切割ss接头,从而去除了剩余的荧光染料并导致dna延伸产物上的游离3'-oh基团的再生。步骤10,在洗掉thp之后,任选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。尽管在方案viia中没有指出,但是如果需要,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图12a所示(具有单个锚和供体染料),但是也可以包括多个锚和供体染料(参见图30a中的示例合成方案)。这也可以包括连接到碱基上的供体-锚对簇(如图26f-h中所示的结构和合成方法)。与其他几种方案一样,该方案可以用于整体sbs或单分子sbs。由于能量转移,仅激发供体染料,以及仅在掺入完成后才通过锚添加受体的事实,因此几乎不会获得背景荧光,这将使该方案对单分子sbs特别有吸引力。
在图5-10e和12a-12e中给出了用于各种方案的核苷酸类似物和其他分子的化学结构。在图11中给出了通用结构方案,在图13-26中给出了用于所述分子的具体化学方案。
可以在表1中找到其他可能的锚和锚结合分子的示例(在某些情况下,它们可以互换(reversed),例如,炔或环辛炔锚和叠氮化物锚结合分子):
第ii节:使用碱基上具有可切割的接头和染料的双脱氧核苷酸(不可逆终止子)和具有二硫保护的3'位的未标记的核苷酸类似物(可逆终止子)的杂交测序:核苷酸类似物的正交基团
ju实验室(guoetal.2008pnas;juetal.us2016/0024574a1)描述了一种利用8种核苷酸的组合集的方法:其中4种为具有通过可切割的接头与碱基连接的染料的双脱氧核苷酸,其他4种是未标记的可逆终止子(3'-oh被保护)。在这种边合成边进行杂交dna测序的方法中,虽然整体中的大多数dna分子都被未标记的核苷酸可逆终止子(nrt)延伸,但一小部分被荧光ddntp延伸,以获得足够的荧光信号,从而在染料的切割之前鉴别该位置处的碱基。尽管在每一轮(round)中丢失了整体中的一些成员,但通过调整比例,从开始时主要是nrt到接近结束时主要是荧光ddntp,该方法被证明可以对几种合成模板进行测序,从而在含有5碱基同聚序列(homopolymericstretch)的模板中实现了32个碱基的长度。本文公开了提供进一步细节的一般方案(方案viii)。guo等人使用了叠氮甲基可切割的基团,然而可以利用任何特异性可切割的部分。在本节中,示例使用3'-o位置处的ss保护基团,以及在碱基与染料或锚之间的接头中的ss、偶氮和其他可切割的基团。
通过创建具有不同的可切割的接头、不同的染料或不同的锚的荧光双脱氧核苷酸类似物的正交或伪正交集(pseudo-orthogonalset),本申请中提出的所有测序方案(包括4-色,2-色和1-色变型)可以被修改以利用荧光双脱氧核苷酸(与未标记的可逆终止子相组合)。在这种情况下,未标记的可逆终止子将与荧光双脱氧核苷酸一起添加,而不是在单独的追加步骤中添加。与以前的某些使用荧光可逆终止子的可用于整体测序和单分子测序的方案不同,该方法仅限于整体测序。
本文公开了使用两组核苷酸类似物的一般方案(方案viii)和11种另外的sbs方案(方案ix-xvii):(1)双脱氧核苷酸类似物,其中染料或用于随后连接染料的锚通过dtm或其他可切割的接头与碱基连接。在这三种方案中,染料簇或锚簇被用来增强信号。(2)脱氧核苷酸类似物,其中用二硫代甲基(dtm)部分来保护核苷酸类似物的3'位置,该二硫代甲基可以用thp特异性切割;以下将这些脱氧核苷酸类似物称为nrt。在sbs的早期轮次中,以非常低的标记的双脱氧核苷酸:未标记的nrt的比例进行添加;在整个过程中该比例逐渐增加;在sbs的最后一轮中,标记的双脱氧核苷酸的浓度高于未标记的nrt。尽管在测序过程中可延伸的生长链逐渐减少,但假设起始整体(startingensemble)为一百万个或更多的模板拷贝,即使在每个测序周期中有3%的生长链被荧光可切割的接头-ddntp标记,也将获得至少30个碱基长的读长,即使在最后几个循环中,也具有足够强的特定信号。尽管相对于其他节中介绍的sbs方案而言,本节描述的杂交测序方法可能会在整体读取长度方面受到限制,但它将为包括用于三体性(trisomies)、癌症、神经细胞损伤等的无创dna检测的许多诊断应用提供足够的序列长度。
尽管在本节中示出的所有示例中的3'-保护基团是叔丁基-二硫代甲基,但是也可以使用其他烷基,例如甲基-二硫代甲基或乙基-二硫代甲基。在本专利申请中提及dtm的任何地方,它都可以指与3'-o相连接的二硫代甲基基团或各种烷基或其他取代的二硫代甲基基团。特别是如果该基团在双脱氧核苷酸的碱基与染料或锚之间的所有接头中作为通用可切割的基团存在,也可以使用其他的3'-保护基团(烯丙基、2-硝基苄基、叠氮基甲基)。除了核苷三磷酸类似物外,核苷四磷酸类似物、核苷五磷酸类似物,核苷六磷酸类似物和更高级的核苷多磷酸类似物也是可行的替代方案。
在以下方案中,将偶氮基团置于接头中作为第二(非dtm)可切割的接头的例子;示出了连二亚硫酸钠作为切割剂的示例(参见图124a-128b,证明了在这些条件下,连二亚硫酸钠对偶氮基团的切割效率和ss键的稳定性)。atto647n、rox和bodipyfl用作荧光团的示例;提供生物素或tco作为锚的示例;链霉亲和素或四嗪用作锚结合分子的示例。但是,接头中的各种其他可切割的基团(例如,烯丙基、2-硝基苄基)、切割剂(例如,pd(0)、~340nm光)、荧光团、锚(例如,dbco、n3、四嗪)*和锚结合分子(例如n3、dbco、tco)*也是可行的。染料可以由单一染料分子、表现出能量转移的染料对、连接在线性或支化聚合物的多个位置处的染料簇或量子点(qd)组成。尽管本节中没有提供示例,但是可以使用其他标记,例如包括拉曼标签的非荧光标签,以及如先前的pct中所述,将纳米孔中的离子电流信号降低到不同程度、在离子通道内具有不同的停留时间或者两者兼而有之的标签组。
一般方案viii示出了仅使用单一模板(显示为4个拷贝)通过合成方法进行的杂交测序的两个循环的结果。该方案旨在说明如何掺入ddntp-可切割的接头-染料/锚分子或相同的核苷酸可逆终止子。方案viii的图例中提供了更多详细信息。
图66包含示出了使用四种ddntp-可切割的接头-染料核苷酸类似物和四种核苷酸可逆终止子进行杂交测序的一般方案viii的示意图。在图66所示的示例中,使用了染料和碱基之间的ss可切割的接头以及dtm3′保护基团。为简单起见,此方案中仅示出了单一模板。在步骤1中,将聚合酶与四种ddntp-ss-染料核苷酸类似物(ddatp-7-ss-rox、ddttp-5-ss-r6g、ddctp-5-ss-alexa488和ddgtp-7-ss-cy5)以及四种3'-叔丁基-ss-dntp(3'-叔丁基-ss-datp、3'-叔丁基-ss-dttp、3'-叔丁基-ss-dctp和3′-叔丁基-ss-dgtp)一起添加。ddntp-ss-染料核苷酸类似物与核苷酸可逆终止子的比例应确保在绝大多数延伸反应中,可逆终止子将被掺入,在该示例中是3′-叔丁基-ss-datp,因为模板链中的下一个碱基是a。在这个示例中,仅有较小的生长的dna链的子集(但足以检测特定的荧光信号)将用荧光ddntp、ddatp-7-ss-rox延伸。步骤2,在用4种3′-叔丁基-dntp进行任选的追加步骤、洗涤和成像后,rox荧光将表明掺入了dda不可逆终止子;在以后的测序循环中,所有dda延伸的链都将丢失。接下来,在步骤3中,添加thp以切割ss基团,从而释放出染料,同时再生用可逆终止子延伸的所有链上的3'-oh基团,为下一轮测序做好准备。在第二个循环中,在步骤1中,将8种核苷酸类似物的相同集与聚合酶一起添加。由于c是模板链中的下一个可用核苷酸,因此在少数情况下,所有带有游离末端3'-oh的链都将用ddgtp-7-ss-cy5延伸,并在大多数情况下用3'-叔丁基-dgtp延伸。步骤2,在任选的追加步骤之后,cy5荧光将表明掺入了ddgtp不可逆终止子;在以后的测序循环中,所有ddg延伸的链都将丢失。再次,在步骤3中,添加thp以切割ss基团,从而释放出染料,同时再生用可逆终止子延伸的所有链上的3'-oh基团,为下一轮测序做好准备。使用所示的模板,在随后的循环中,将添加g、t、c和t。尽管此处仅示出模板的四个拷贝,但实际上,在载玻片上给定位置处克隆扩增的模板的整体将包含一百万个以上的拷贝。因此,即使在每一轮中丢失了整体中的3%的生长链,也有可能对30个的碱基进行测序。该方案中使用的修饰的核苷酸的结构如图48所示。
对于其余十一个方案(方案ix-xv、xvia-c、xvii),如本专利申请的其他节中所述,四种不同的模板的结果(示出了每一种的两个拷贝),要么是掺入了ddntp-可切割的接头-染料/锚分子,要么是掺入了3'-可逆保护的未标记的终止子。尽管仅示出了使用这些核苷酸类似物中的每一种的延伸的分子的示例,前者将代表少数掺入事件(在大多数情况下掺入未标记的nrt),但它们是唯一可以通过荧光成像步骤检测到的。这些方案的说明中提供了更多详细信息。
方案ix是需要两个检测步骤的2-色sbs方案;方案x和方案xi是单-色方案,需要三个检测步骤才能确定掺入的核苷酸。方案xii是使用锚和染料簇的1-色方案,需要三个检测步骤。方案xiii和方案xiv是使用锚和染料簇的2-色方案,分别需要三个检测步骤和两个检测步骤。方案xv是具有一个检测步骤的4-色方案,方案xvia是具有两个检测步骤的4-色方案。方案xvib和方案xvic是利用量子点的2-色方案。方案xvii是一种1-色方案,其利用了供体染料和受体染料之间的能量转移。这些方案中的一些包括任选的确认性成像步骤。与先前描述的方案不同,未标记的核苷酸类似物(nrt)的添加与添加含染料或锚的核苷酸类似物同时进行。这样可以确保仅有一小部分dna分子会用染料标记的ddntp(其为不可逆的终止子)延伸,而大多数将用可逆的终止子延伸。尽管这也应有助于在测序反应过程中保持记录(registry),但可以进行使用相同可逆终止子的其他任选的追加,以确保每个dna引物链均已延伸,从而避免了异步反应。在各个步骤之间必须进行洗涤,以除去先前的试剂和/或释放的染料。
涉及每种双脱氧核苷酸类似物上的单一染料的1-色方案和2-色方案(方案ix-xi)
方案ix:使用两种染料和两种可切割的接头的2-色sbs;在掺入后和第一次切割后进行成像。在方案ix中,使用双脱氧核苷酸类似物的正交集,一种具有通过ss键与碱基连接的染料1,一种具有通过偶氮键与碱基连接的染料1,一种具有通过ss键与碱基连接的染料2,一种具有通过偶氮键与碱基连接的染料2。四种nrt同时添加。添加八种核苷酸类似物后的成像将明确地表明两种类型的双脱氧核苷酸类似物中的任何一种的掺入。在用连二亚硫酸钠切割偶氮接头之后,成像将明确地表明掺入了何种双脱氧核苷酸类似物。然后,用thp进行切割将从无法用于进一步反应的双脱氧核苷酸类似物中除去剩余的染料,并恢复nrt上的3'-oh基团,这代表了随后测序循环中绝大多数的掺入事件。在所示的示例中,染料1是rox,染料2是bodipyfl。也可以使用染料和可切割的接头的其他组合。
图67a-67b包含示出了使用ddntp-ss-染料(ddatp-7-ss-rox、ddttp-5-ss-bodipyfl)、ddntp-偶氮-染料(ddgtp-7-偶氮-bodipyfl、ddctp-5-偶氮-rox)和3’-o-ss-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案ix的示意图。步骤1,将dna聚合酶和八种核苷酸类似物(ddatp-7-ss-rox、ddttp-5-ss-bodipyfl、ddgtp-7-偶氮-bodipyfl、ddctp-5-偶氮-rox、3′-o-叔丁基二硫代甲基(ss)-datp、3′-o-叔丁基二硫代甲基(ss)-dctp、3′-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,任选的追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3′-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何核苷酸类似物延伸的生长中的dna链的子集中。生长中的dna链被四种染料标记的双脱氧核苷酸类似物(a、c、g、t)中的一种或不具有染料的四种核苷酸可逆终止子(a、c、g、t)中的同一种终止。步骤3,洗去未掺入的核苷酸后,检测dna产物上每种荧光染料产生的独特的荧光信号,使得可以部分鉴别掺入的双脱氧核苷酸,以进行序列测定:rox信号表明掺入了dda或ddc,bodipyfl信号表明掺入了ddt或ddg。步骤4,通过向加长的dna链中添加连二亚硫酸钠(na2s2o4)来切割偶氮接头,导致从掺入的ddc中除去rox,并从掺入的ddg中除去bodipyfl。步骤5,洗去切割下的染料后,第二轮检测dna产物上每种荧光染料产生的独特的荧光信号,使得可以鉴别掺入的双脱氧核苷酸以进行序列测定。rox信号的消失表明掺入了ddc,而bodipyfl信号的消失表明掺入了ddg。存在rox信号表明掺入了dda,存在bodipyfl信号表明掺入了ddt。接下来,在步骤6中,用thp处理dna产物来切割ss接头,导致用ddntp延伸的dna分子的子集上的剩余的荧光染料被去除以及用nrt延伸的大多数dna分子上的游离3'-oh基团的再生,使延伸的dna为dna测序反应的下一个循环做好准备。方案i的末尾提供了示出每个成像步骤的预期荧光的示意图。在本节中,可以为其他2-色sbs方案构建相似的示意图。该方案中使用的修饰的核苷酸的结构如图42所示。
方案x:使用一种染料、一种锚和两种可切割的接头的1-色sbs;在掺入、标记和第一次切割后进行成像。在方案x中,使用双脱氧核苷酸类似物的正交集,一种具有通过ss键与碱基连接的染料1,一种具有通过偶氮键与碱基连接的染料1,一种具有通过ss键与碱基连接的锚1,一种具有通过偶氮键与碱基连接的锚1。四种nrt同时添加。添加八种核苷酸类似物后的成像将明确地表明两种类型的双脱氧核苷酸类似物中的任何一种的掺入。通过锚1结合分子用染料1标记后的成像将明确确认其他两种类型的双脱氧核苷酸类似物之一的掺入。(成像是任选的,但建议在此步骤中进行。)最后,用连二亚硫酸钠切割偶氮接头将明确地表明掺入了哪种双脱氧核苷酸类似物。然后,用thp进行切割将从无法用于进一步反应的双脱氧核苷酸类似物中除去剩余的染料,并恢复nrt上的3'-oh基团,这代表了随后的测序循环中的绝大多数的掺入事件。在所示的示例中,染料1是atto647n,锚1是生物素。也可以使用染料、锚和可切割的接头的其他组合。
图68a-68c包含使用ddntp-ss-染料(ddatp-7-ss-atto647n)、ddntp-偶氮-染料(ddttp-5-偶氮-atto647n)、ddntp-ss-锚(ddctp-5-ss-生物素)、ddntp-偶氮-锚(3’-o-ss-dgtp-7-偶氮-生物素)、相应的染料标记的结合分子(atto647n标记的链霉亲和素)和3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案x的示意图。步骤1,将dna聚合酶、四种双脱氧核苷酸类似物(3'-o-ss-datp-7-ss-atto647n、3'-o-ss-dttp-5-偶氮-atto647n、3'-o-ss-dctp-5-ss-生物素和3'-o-ss-dgtp-7-偶氮-生物素)和四种3′-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,任选的追加:将dna聚合酶和四种3′-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3′-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何染料标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种染料标记的双脱氧核苷酸类似物(dda、ddc、ddg、ddt)中的一种或不具有染料或锚的四种核苷酸可逆终止子(a、c、g、t)中的同一种终止。步骤3,洗去未掺入的核苷酸后,检测dna产物上每种荧光染料发出的荧光信号,使得可以部分鉴别掺入的双脱氧核苷酸以进行序列测定,atto647n信号表明掺入了dda或ddt。步骤4,用链霉亲和素-atto647n进行标记。洗去剩余的游离标签后,在步骤5中检测到新的atto647n信号表明掺入了ddc或ddg。接下来,在步骤6中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而去除ddg和ddt上的任何荧光染料。步骤7,洗去切割下的染料后,进行成像。在此步骤中,如果已经确定掺入的核苷酸可能是dda或ddt,则荧光丢失将表明其为ddt,而保留荧光将表明其为dda。类似地,对于先前确定为ddc或ddg的信号,荧光的丢失将明确地表明掺入了ddg,而保留荧光将表明掺入了ddc。接下来,在步骤8中,用thp处理dna产物来切割ss接头,导致用ddntp延伸的dna分子的子集上的剩余的荧光染料被去除以及用nrt延伸的大多数dna分子上的游离3'-oh基团的再生,使延伸的dna为dna测序反应的下一个循环做好准备。洗掉thp后,任选的成像步骤(未示出)将确认所有染料均已去除,为下一个测序循环做准备。在图32d中提供了示出每个成像步骤的预期荧光的示意图。在本节中,可以为其他1-色sbs方案构造类似的示意图。该方案中使用的修饰的核苷酸的结构如图43所示。
方案xi:使用两种锚和两种可切割的接头的1-色sbs:在每个标记步骤之后以及在第一次切割之后进行成像。在方案xi中,使用双脱氧核苷酸类似物的正交集,一种具有通过ss键与碱基连接的锚1,一种具有通过偶氮键与碱基连接的锚1,一种具有通过ss键与碱基连接的锚2,一种具有通过偶氮键与碱基连接的锚2。同时添加四种nrt,并进行掺入。然后,在将染料1连接到锚1-结合分子的第一标记步骤之后进行的成像将表明掺入两种类型的双脱氧核苷酸类似物中的任一种。在将染料1连接到锚2-结合分子的第二标记步骤之后进行的成像将确认掺入其他两种类型的双脱氧核苷酸类似物中的任一种。(成像是任选的,但建议在此步骤进行。)用连二亚硫酸钠切割偶氮接头后进行成像,将表明掺入的特定的双脱氧核苷酸类似物。然后,用thp进行切割将从无法用于进一步反应的双脱氧核苷酸类似物中除去剩余的染料,并恢复nrt上的3'-oh基团,这代表了随后测序循环中绝大多数的掺入事件。在所示的示例中,染料1是atto647n,锚1是生物素,染料2是tco。也可以使用染料、锚和可切割的接头的其他组合。
图69a-69d包含示出了使用ddntp-ss-锚(ddatp-7-ss-生物素、ddgtp-7-ss-tco)、ddntp-偶氮-锚(ddttp-5-偶氮-tco、ddctp-5-偶氮-生物素)、相应的染料标记的结合分子(atto647n标记的链霉亲和素和atto647n标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案xi的示意图。步骤1,将dna聚合酶和八种核苷酸类似物(ddatp-7-ss-生物素、ddgtp-7-ss-tco、ddttp-5-偶氮-tco、ddctp-5-偶氮-生物素、3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,任选的追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3′-o-ss-核苷酸类似物掺入到在步骤1中没有用任何核苷酸类似物延伸的生长中的dna链的子集中。生长中的dna链被四种锚标记的双脱氧核苷酸类似物(dda、ddc、ddg、ddt)中的一种或不具有锚的四种核苷酸可逆终止子(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-atto647n进行标记。该染料将特异性结合dda核苷酸类似物和ddc核苷酸类似物,但不结合ddg类似物和ddt类似物。步骤4,洗去剩余的游离标记和过量的核苷酸后,检测到新的atto647n信号表明掺入了dda或ddc。步骤5,用四嗪-atto647n进行标记。该染料将与ddg核苷酸类似物和ddt核苷酸类似物特异性结合,但不会与dda类似物和ddc类似物结合。步骤6,洗去剩余的游离标记和过量的核苷酸后,检测到新的atto647n信号表明掺入了ddg或ddt。接下来,在步骤7中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而去除ddt和ddc上的任何荧光染料。步骤8,洗去切割下的染料后,进行成像以确定atto647n荧光的存在。在此步骤中,如果已经确定掺入的核苷酸可能是dda或ddc,则荧光丢失将表明其为ddc,而保留荧光将表明其为dda。类似地,对于先前确定为ddg或ddt的信号,荧光的丢失将明确地表明掺入了ddt,而保留荧光将表明掺入了ddg。接下来,在步骤9中,用thp处理dna产物来切割ss接头,导致用ddntp延伸的dna分子的子集上的剩余的荧光染料被去除以及用nrt延伸的大多数dna分子上的游离3'-oh基团的再生,使延伸的dna为dna测序反应的下一个循环做好准备。步骤10,在洗掉thp之后,可选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。该方案中使用的修饰的核苷酸的结构如图44所示。
在2-染料方案的情况下,选择具有良好的单独的吸收和发射光谱的染料。2-色方案,特别是1-色方案旨在减少所需的光学设备的尺寸、成本和复杂性。
尽管提出的所有方案都使用dna模板和引物、双脱氧核苷酸类似物、可逆终止子和dna聚合酶,但是原则上可以对方案进行调整以包括用于rna依赖性dna聚合酶以及dna或rna依赖性rna聚合酶的合适的模板、引物和核苷酸类似物。
涉及每种核苷酸类似物上的染料簇的1-色方案和2-色方案(方案xii-xiv)
方案xii:使用一种染料簇、一种锚簇和两种可切割的接头簇的1-色sbs;在掺入、标记和第一次切割后进行成像。与方案ix的唯一区别是锚簇(锚1簇)或染料簇(染料1簇)连接在双脱氧核苷酸类似物的碱基上。在标记步骤中,多个染料将结合到锚簇上。在所示的示例中,染料1簇是atto647n簇,而锚1簇是生物素簇。也可以使用染料簇、锚簇和可切割的接头的其他组合。
图70a-70c包含示出了使用ddntp-ss-染料簇(ddatp-7-ss-atto647n簇)、ddntp-偶氮-染料簇(ddttp-5-偶氮-atto647n簇)、ddntp-ss-锚簇(ddctp-5-ss-生物素簇)、ddntp-偶氮-锚簇(ddgtp-7-偶氮-生物素簇)、相应的染料标记的结合分子(atto647n标记的链霉亲和素)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案xii的示意图。步骤1,将dna聚合酶和8种核苷酸类似物(ddatp-7-ss-atto647n簇、ddttp-5-偶氮-atto647n簇、ddctp-5-ss-生物素簇、ddgtp-7-偶氮-生物素簇、3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,任选的追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何核苷酸延伸的生长中的dna链的子集中。生长中的dna链用四种染料簇或锚簇标记的双脱氧核苷酸类似物(dda、ddc、ddg、ddt)中的一种或不具有染料或锚的四种核苷酸可逆终止子(a、c、g、t)中的同一种终止。步骤3,洗掉未掺入的染料标记的核苷酸后,检测dna产物上每种荧光染料产生的荧光信号,使得可以部分鉴别掺入的双脱氧核苷酸类似物以进行序列测定,atto647n信号表明掺入了dda或ddt。步骤4,用链霉亲和素-atto647n进行标记。洗去剩余的游离标签后,在步骤5中检测到新的atto647n信号表明掺入了ddc或ddg。接下来,在步骤6中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而去除ddg和ddt上的任何荧光染料。步骤7,洗去切割下的染料后,进行成像。在此步骤中,如果已经确定掺入的核苷酸类似物可能是dda或ddt,则荧光丢失将表明其为ddt,而保留荧光将表明其为dda。类似地,对于先前确定为ddc或ddg的信号,荧光的丢失将明确地表明掺入了ddg,而保留荧光将表明掺入了ddc。接下来,在步骤8中,用thp处理dna产物来切割ss接头,导致用ddntp延伸的dna分子的子集上的剩余的荧光染料被去除以及用nrt延伸的大多数dna分子上的游离3'-oh基团的再生,使延伸的dna为dna测序反应的下一个循环做好准备。洗掉thp后,任选的成像步骤(未示出)将确认所有染料均已去除,为下一个测序循环做准备。该方案中使用的修饰的核苷酸的结构示于图45a-45c中。
方案xiii:使用两种锚簇、2种染料和两种可切割的接头的2-色sbs:在每个标记步骤之后和在第一次切割之后进行成像。与方案x有些类似,但是在双脱氧核苷酸类似物的碱基上连接了两种不同的染料簇(锚1簇和锚2簇)中的一种。在标记步骤中,多个染料将结合到锚簇上。在第一标记步骤之后,染料1的存在将表明两种可能掺入的双脱氧核苷酸类似物。在第二标记步骤之后,染料2的出现将验证其他两种类型的双脱氧核苷酸类似物的掺入。(成像是任选的,但建议在此步骤进行。)用连二亚硫酸钠切割偶氮接头后进行的成像将表明掺入的特定的双脱氧核苷酸类似物。然后,用thp进行切割将从无法用于进一步反应的双脱氧核苷酸类似物中除去剩余的染料,并恢复nrt上的3′-oh基团,这代表了随后的测序循环中绝大多数的掺入事件。在此示例中,锚1簇包含生物素,锚2簇包含tco,染料1是rox,染料2是alexa488。也可以使用染料、锚和可切割的接头的其他组合。
图71a-71d包含示出了使用ddntp-ss-锚簇(ddatp-7-ss-生物素簇、ddgtp-7-ss-tco簇)、ddntp-偶氮-锚簇(ddctp-5-偶氮-生物素簇、ddttp-5-偶氮-tco簇)、相应的染料标记的结合分子(rox标记的链霉亲和素和alexa488标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xiii的示意图。步骤1,将dna聚合酶和八种核苷酸类似物(ddatp-7-ss-生物素簇、ddgtp-7-ss-tco簇、ddctp-5-偶氮-生物素簇、ddttp-5-偶氮-tco簇、3'-o-叔丁基二硫代甲基(ss)-datp、3′-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,任选的追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何核苷酸延伸的生长中的dna链的子集中。生长中的dna链被四种锚簇标记的双脱氧核苷酸类似物(dda、ddc、ddg、ddt)中的一种或不具有染料簇或锚簇的四种核苷酸可逆终止子(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-rox进行标记。该染料将与dda核苷酸类似物和ddc核苷酸类似物特异性结合,但不会与ddg类似物和ddt类似物结合。步骤4,洗去剩余的游离标记和过量的核苷酸后,检测到新的rox信号表明掺入了dda或ddc。步骤5,用四嗪-alexa488标记。该染料将与ddg核苷酸类似物和ddt核苷酸类似物特异性结合,但不会与dda类似物和ddc类似物结合。步骤6,洗去剩余的游离标记和多余的核苷酸后,检测到新的alexa488信号表明掺入了ddg或ddt。接下来,在步骤7中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而去除ddt和ddc上的任何荧光染料。步骤8,洗去切割下的染料簇后,进行成像。在此步骤中,如果已经确定掺入的核苷酸可能是dda或ddc,则丢失rox荧光将表明其为ddc,而保留rox荧光将表明其为dda。类似地,对于先前确定为ddg或ddt的信号,alexa488荧光的丢失将明确地表明掺入了ddt,而保留荧光将表明掺入了ddg。接下来,在步骤9中,用thp处理dna产物来切割ss接头,导致用ddntp延伸的dna分子的子集上的剩余的荧光染料被去除以及用nrt延伸的大多数dna分子上的游离3'-oh基团的再生,使延伸的dna为dna测序反应的下一个循环做好准备。步骤10,在洗掉thp之后,任选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。该方案中使用的修饰的核苷酸的结构示于图46a-46b中。
方案xiv:使用两种染料簇、两种锚簇和一种可切割的接头的2-色sbs:在掺入后和标记步骤之后进行成像。在方案xiv中,染料1簇、染料2簇、锚1簇和锚2簇分别通过ss键连接至双脱氧核苷酸类似物的四种碱基。同时添加nrt并进行掺入。成像将明确地表明两种双脱氧核苷酸类似物的掺入。接下来的标记是将锚1结合分子和锚2结合分子分别连接到染料1和染料2的单一分子上来进行的。成像将表明其他两种双脱氧核苷酸类似物的掺入。然后,用thp进行切割将从无法用于进一步反应的双脱氧核苷酸类似物中除去剩余的染料,并恢复nrt上的3'-oh基团,这代表了随后的测序循环中的绝大多数的掺入事件。在所示的示例中,染料1是rox,染料2是bodipyfl,锚1是生物素,锚2是tco。也可以使用染料簇和锚簇的其他组合。
图72a-72c包含示出了使用ddntp-ss-染料簇(ddatp-7-ss-rox簇、dttp-5-ss-bodipyfl簇)、ddntp-ss-锚簇(ddctp-5-ss-生物素簇、ddgtp-7-ss-tco簇)、相应的染料标记的锚结合分子(链霉亲和素-rox、四嗪-bodipyfl)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xiv的示意图。步骤1,将dna聚合酶和八种核苷酸类似物(ddatp-7-ss-rox簇、dttp-5-ss-bodipyfl簇、ddctp-5-ss-生物素簇、ddgtp-7-ss-tco簇、3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,任选的追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3′-o-叔丁基二硫代甲基(ss)-datp、3′-o-叔丁基二硫代甲基(ss)-dctp、3′-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3′-o-ss-核苷酸类似物掺入到在步骤1中没有用任何核苷酸类似物延伸的生长中的dna链的子集中。生长中的dna链被四种锚簇或染料簇标记的双脱氧核苷酸类似物(dda、ddc、ddg、ddt)中的一种或不具有染料簇或锚簇的四种可逆终止子(a、c、g、t)中的同一种终止。步骤3,洗掉未掺入的核苷酸后,检测dna产物上每种荧光染料产生的独特的荧光信号,使得可以鉴别两种掺入的双脱氧核苷酸而进行序列测定:rox信号表明掺入了dda,bodipyfl信号表明掺入了ddt。步骤4,用将与生物素锚簇结合的链霉亲和素-rox分子和将与tco锚簇结合的四嗪-bodipyfl分子进行标记。步骤5,洗涤后,第二轮检测dna产物上每种荧光染料产生的独特的荧光信号,使得可以鉴别剩余的两种掺入的双脱氧核苷酸以进行序列测定。新的rox信号表明掺入了ddc;新的bodipyfl信号表明掺入了ddg。接下来,在步骤6中,用thp处理dna产物来切割ss接头,导致用ddntp延伸的dna分子的子集上的荧光染料被去除以及用nrt延伸的大多数dna分子上的游离3'-oh基团的再生,使延伸的dna为dna测序反应的下一个循环做好准备。步骤7,洗掉thp后,任选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。该方案中使用的修饰的核苷酸的结构如图47所示。
涉及每种双脱氧核苷酸类似物上的单一染料的4-色方案(方案xv和方案xvi):
方案xv:使用直接与碱基相连接的四种染料的4-色sbs:掺入步骤后进行成像。在方案xv中,染料1、染料2、染料3和染料4分别通过ss键连接至双脱氧核苷酸类似物的四种碱基。同时添加nrt并进行掺入。成像将明确地表明每种类型的核苷酸类似物的掺入。然后,用thp进行切割以将从无法用于进一步反应的双脱氧核苷酸类似物中除去剩余的染料,并恢复nrt上的3′-oh基团,这代表了随后的测序循环中绝大多数的掺入事件。在所示的示例中,染料1是rox,染料2是r6g,染料3是alexa488,染料4是cy5。也可以使用染料的其他的组合。
图73a-73b包含示出了使用ddntp-ss-染料(ddatp-7-ss-rox、ddttp-5-ss-r6g、ddctp-5-ss-alexa488、ddgtp-7-ss-cy5)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行4-色dnasbs的方案xv的示意图。步骤1,将dna聚合酶和8种核苷酸类似物(ddatp-7-ss-rox、ddttp-5-ss-bodipyfl、ddctp-5-ss-生物素、ddgtp-7-ss-tco、3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,任选的追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何核苷酸类似物延伸的生长中的dna链的子集中。生长中的dna链被染料标记的双脱氧核苷酸类似物(dda、ddc、ddg、ddt)中的一种或不具有染料的四种可逆终止子(a、c、g、t)中的同一种终止。步骤3,洗去未掺入的核苷酸后,检测dna产物上每种荧光染料产生的独特的荧光信号,使得可以鉴别四种掺入的双脱氧核苷酸以进行序列测定:rox信号表明掺入了dda;r6g信号表明掺入了ddt;alexa488信号表明掺入了ddc;cy5信号表明掺入了ddg。接下来,在步骤4中,用thp处理dna产物来切割ss接头,导致用ddntp延伸的dna分子的子集上的荧光染料被去除以及用nrt延伸的大多数dna分子上的游离3'-oh基团的再生,使延伸的dna为dna测序反应的下一个循环做好准备。该方案中使用的修饰的核苷酸的结构如图48所示。
方案xvia:使用四种染料和两种锚的4-色sbs:在掺入和标记步骤之后进行成像。在方案xvia中,染料1、染料2、锚1和锚2分别通过ss键连接至双脱氧核苷酸类似物的四种碱基。同时添加nrt并进行掺入。成像将明确地表明两种双脱氧核苷酸类似物的掺入。接下来的标记是分别将锚1结合分子和锚2结合分子连接到染料1和染料2上来进行的。成像将表明其他两种双脱氧核苷酸类似物的掺入。然后,用thp进行切割而将从无法用于进一步反应的双脱氧核苷酸类似物中除去剩余的染料,并恢复nrt上的3'-oh基团,这代表了随后的测序循环中绝大多数的掺入事件。在所示的示例中,染料1是rox,染料2是bodipyfl,锚1是生物素,锚2是tco。也可以使用染料和锚的其他组合。
在4-染料方案的情况下,选择具有良好的单独的吸收和发射光谱的染料。
图74a-74c包含示出了使用ddntp-ss-染料(ddatp-7-ss-rox、ddttp-5-ss-bodipyfl)、ddntp-ss-锚(ddctp-5-ss-生物素、ddgtp-7-ss-tco)、相应的染料标记的锚结合分子(链霉亲和素-tamra、四嗪-cy5)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行4-色dnasbs的方案xvia的示意图。步骤1,将dna聚合酶和8种核苷酸类似物(ddatp-7-ss-rox、ddttp-5-ss-bodipyfl、ddctp-5-ss-生物素、ddgtp-7-ss-tco、3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,任选的追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何核苷酸延伸的生长中的dna链的子集中。生长中的dna链被四种锚或染料标记的双脱氧核苷酸类似物(dda、ddc、ddg、ddt)中的一种或不具有染料或锚的四种可逆终止子(a、c、g、t)中的同一种终止。步骤3,洗掉未掺入的核苷酸后,检测dna产物上每种荧光染料产生的独特的荧光信号,使得可以鉴别两种掺入的双脱氧核苷酸以进行序列测定:rox信号表明掺入了dda,bodipyfl信号表明掺入了ddt。步骤4,用将与生物素结合的链霉亲和素-tamra分子和将与tco结合的四嗪-cy5分子进行标记。步骤5,洗涤后,第二轮检测dna产物上每种荧光染料产生的独特的荧光信号,使得可以鉴别剩余的两种掺入的双脱氧核苷酸以进行序列测定。tamra信号表明掺入了ddc;cy5信号表明掺入了ddg。接下来,在步骤6中,用thp处理dna产物来切割ss接头,导致用ddntp延伸的dna分子的子集上的荧光染料被去除以及用nrt延伸的大多数dna分子上的游离3'-oh基团的再生,使延伸的dna为dna测序反应的下一个循环做好准备。步骤7,洗掉thp后,任选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。该方案中使用的修饰的核苷酸的结构如图49a所示。
涉及量子点的方案
方案xvib:使用两种锚、两种量子点和两种可切割的接头的2-色sbs:在标记后和切割后进行成像。在方案xvib中,双脱氧核苷酸类似物的正交集由通过ss键连接的锚1,通过ss键连接的锚2,通过偶氮键连接的锚1和通过偶氮键连接的锚2组成,每种锚均连接至不同的碱基。进行掺入。然后添加具有量子点1(qd1)的锚1结合分子和具有qd2的锚2结合分子。由于量子点的宽吸收光谱,利用单激光(singlelaser)对两种qd进行激发成像后,qd1荧光的出现将掺入的核苷酸类似物的选择限定为两种可能性,而qd2荧光的出现将掺入的核苷酸类似物的选择限定为其他两种替代选择。在用连二亚硫酸钠切割偶氮接头之后,再次用单激光进行的成像将表明掺入的特定的双脱氧核苷酸类似物。然后,用thp进行切割将去除剩余的染料,并恢复3'-oh基团,以用于随后的测序循环。在所示的示例中,锚是生物素和tco,可切割的接头是偶氮和ss,qd1和qd2分别是绿色发射体和红色发射体,但是也可以使用可切割的接头、锚和不同qd的其他组合。
图75a-75c包含示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco)、3’-o-ss(dtm)-dntp-偶氮-锚(3’-o-ss-dttp-5-偶氮-tco、3’-o-ss-dctp-5-偶氮-生物素)、相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xvib的示意图。步骤1,将dna聚合酶和8种核苷酸类似物(3'-o-ss-datp-7-ss-生物素、3'-o-ss-dgtp-7-ss-tco、3'-o-ss-dttp-5-偶氮-tco、3'-o-ss-dctp-5-偶氮-生物素、3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,任选的追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3′-o-叔丁基二硫代甲基(ss)-datp、3′-o-叔丁基二硫代甲基(ss)-dctp、3′-o-叔丁基二硫代甲基(ss)-dttp和3′-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何核苷酸类似物延伸的生长中的dna链的子集中。生长中的dna链被锚标记的双脱氧核苷酸类似物(dda、ddc、ddg、ddt)中的一种或不具有锚的四种可逆终止子(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-qd1和四嗪-qd2进行标记。qd1将特异性结合a双脱氧核苷酸类似物和c双脱氧核苷酸类似物,而qd2将结合g双脱氧核苷酸类似物和t双脱氧核苷酸类似物。步骤4,洗去剩余的游离标记和多余的核苷酸后,检测到qd1荧光将表明掺入了a或c,检测到qd2荧光将表明掺入了g或t。接下来,在步骤5中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而去除t和c上的qd。步骤6,洗去切割下的qd后,进行成像以确定qd1(绿色)和qd2(红色)荧光的存在。在此步骤中,如果已经确定掺入的双脱氧核苷酸核苷酸可能为a或c,则荧光丢失将表明其为c,而保留荧光将表明其为a。类似地,对于先前确定为g或t的信号,荧光丢失将明确地表明掺入了t,而保留荧光则表明掺入了g。接下来,在步骤7中,用thp处理dna产物来切割ss接头,从而去除剩余的荧光qd并再生dna延伸产物上的游离3′-oh基团。步骤8,洗掉thp后,任选的成像步骤将确认已去除所有染料,为下一个测序循环做准备。该方案中使用的修饰的核苷酸的结构如图49b所示。
方案xvic:使用不同比例的两种锚和两种量子点的2-色sbs:标记后进行成像。在方案xvic中,四种双脱氧核苷酸类似物均通过ss接头连接至锚1、锚2、锚1:锚2为1:1的混合物和锚1:锚2为2:1的混合物。在掺入所有四种核苷酸类似物之后,用具有qd1的锚1-结合分子和具有qd2的锚2-结合分子执行标记步骤。由于量子点的宽吸收光谱,用单激光激发两种qd进行的成像将显示由于qd1而产生的荧光、由于qd2而产生的荧光或取决于qd1和qd2的比例的中间荧光(intermediatefluorescence),以表明掺入的特定的双脱氧核苷酸类似物。然后,用thp进行切割将除去剩余的染料,并恢复3′-oh基团,以用于随后的测序循环。在所示的示例中,锚是生物素和tco,qd1和qd2分别是绿色发射体和红色发射体,但是也可以使用锚和不同的qd的其他组合。
图76a-76c包含示出了使用3’-o-ss(dtm)-dntp-ss-锚(3’-o-ss-datp-7-ss-生物素、3’-o-ss-dgtp-7-ss-tco、3’-o-ss-dttp-5-ss-生物素/生物素/tco、3’-o-ss-dctp-5-ss-生物素/tco)、相应的染料标记的结合分子(量子点1(绿色)标记的链霉亲和素和量子点2(红色)标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)以进行2-色dnasbs的方案xvic的示意图。步骤1,将dna聚合酶和8种核苷酸类似物(3'-o-ss-datp-7-ss-生物素、3'-o-ss-dgtp-7-ss-tco、3′-o-ss-dttp-5-ss-生物素/生物素/tco、3′-o-ss-dctp-5-ss-生物素/tco、3′-o-叔丁基二硫代甲基(ss)-datp、3′-o-叔丁基二硫代甲基(ss)-dctp、3′-o-叔丁基二硫代甲基(ss)-dttp和3′-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,任选的追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3′-o-叔丁基二硫代甲基(ss)-datp、3′-o-叔丁基二硫代甲基(ss)-dctp、3′-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何核苷酸类似物延伸的生长中的dna链的子集中。生长中的dna链被锚标记的双脱氧核苷酸类似物(dda、ddc、ddg、ddt)中的一种或不具有锚的四种可逆终止子(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-qd1和四嗪-qd2进行标记。仅有qd1将与a双脱氧核苷酸类似物结合,仅有qd2将与g双脱氧核苷酸类似物结合,一个拷贝的qd1和一个拷贝的qd2将与c类似物结合,2个拷贝的qd1和1个拷贝的qd2将与t类似物结合。步骤4,在洗掉剩余的游离qd和多余的核苷酸后,将在同时激发qd1和qd2的情况下进行成像。检测到qd1(绿色)荧光将表明掺入了a,检测到qd2(红色)荧光将表明掺入了g,检测到相等比例的qd1荧光和qd2荧光将表明掺入了c,而检测到2:1比例的qd1:qd2荧光将表明掺入了g。接下来,在步骤5中,用thp处理dna产物来切割ss接头,导致荧光qd的去除和dna延伸产物上的游离3′-oh基团的再生。步骤8,洗掉thp后,任选的成像步骤将确认已除去所有qd,为下一个测序循环做准备。示出该方案预期荧光光谱的示意图类似于方案vic底部的示意图,表明该方法的比例特性。该方案中使用的修饰的核苷酸的结构如图49c所示。
涉及供体-受体对的方案
方案xvii:使用两种锚、一种供体-受体染料对和两种可切割的接头的1-色sbs:在两个标记步骤之后和切割之后进行成像。在方案xvii中,通过ss键连接的包含供体染料1的锚1、通过偶氮键连接的包含供体染料1的锚1、通过ss键连接的包含供体染料1的锚2、通过偶氮键连接的包含供体染料1的锚2,各自连接到不同的碱基上。用四种ddntp和四种nrt进行掺入。添加包含受体染料1的锚1-结合分子。在用供体染料1激发成像后,受体染料1发出的荧光将表明两种可能的核苷酸类似物的掺入。接下来,添加包含受体染料1的锚2-结合分子。在用供体染料1激发成像后,受体染料1发出的新的荧光将表明其他两种可能的核苷酸类似物的掺入。用连二亚硫酸钠切割偶氮接头后的成像将表明掺入的特定核苷酸类似物。然后,用thp进行切割将除去剩余的染料,并恢复3′-oh基团,以用于随后的测序循环。在所示的示例中,可切割的接头是偶氮和ss,供体染料1是cy3,受体染料1是cy5,但是也可以使用其他可切割的接头(例如2nb或烯丙基)和其他供体-受体对(例如,cya为供体,rox或cy3为受体;fam为供体,rox为受体)。接头可以是连接有2种或更多种供体染料的长的线性分子或树枝状大分子,在这种情况下,多种受体染料将通过锚-锚结合分子的缀合步骤进行连接。
图77a-77d包含示出了使用ddntp-ss-供体染料-锚(ddatp-7-ss-cy3-生物素、ddgtp-7-ss-cy3-tco)、ddntp-偶氮-锚(ddttp-5-偶氮-cy3-tco、ddctp-5-偶氮-cy3-生物素)、相应的染料标记的结合分子(cy5标记的链霉亲和素和cy5标记的四嗪)和四种3’-o-ss(dtm)-dntps(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案xvii的示意图。步骤1,将dna聚合酶和八种核苷酸类似物(ddatp-7-ss-cy3-生物素、ddgtp-7-ss-cy3-tco、ddttp-5-偶氮-cy3-tco、ddctp-5-偶氮-cy3-生物素、3'-o-叔丁基二硫代甲基(ss)-datp、3′-o-叔丁基二硫代甲基(ss)-dctp、3′-o-叔丁基二硫代甲基(ss)-dttp和3′-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,任选的追加:将dna聚合酶和四种3′-o-ss(dtm)-dntp(3′-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3′-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中,使得能够将互补的3′-o-ss-核苷酸类似物掺入到在步骤1中没有用任何核苷酸类似物延伸的生长中的dna链的子集中。生长中的dna链被四种供体染料-锚标记的双脱氧核苷酸类似物(dda、ddc、ddg、ddt)中的一种或不具有供体染料-锚的四种可逆终止子(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-cy5进行标记。该染料将特异性结合a核苷酸类似物和c核苷酸类似物,但不结合g类似物和t类似物。步骤4,洗去剩余的游离标记和多余的核苷酸后,在cy3激发后检测到cy5信号表明掺入了a或c。步骤5,用四嗪-cy5进行标记。该染料将特异性结合g核苷酸类似物和t核苷酸类似物,但不结合a类似物和c类似物。步骤6,洗去剩余的游离标记和多余的核苷酸后,在cy3激发后检测到新的cy5信号表明掺入了g或t。接下来,在步骤7中,用连二亚硫酸钠处理dna产物来切割偶氮接头,以去除t和c上的荧光供体-受体染料对。步骤8,洗去切割下的染料后,在cy3激发后进行成像以确定cy5荧光的存在。在此步骤中,如果已经确定掺入的核苷酸可能是a或c,则荧光丢失将表明其为c,而保留荧光将表明其为a。类似地,对于先前确定为g或t的信号,荧光的丢失将明确地表明掺入了t,而保留荧光将表明掺入了g。接下来,在步骤9中,用thp处理dna产物来切割ss接头,导致用ddntp延伸的dna分子的子集上的荧光供体-受体染料对被去除以及用nrt延伸的大多数dna分子上的游离3'-oh基团的再生,使延伸的dna为dna测序反应的下一个循环做好准备。步骤10,在洗掉thp之后,可选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。该方案中使用的修饰的核苷酸的结构示于图51a-51b(具有单个锚和供体染料),但是也可以在这些核苷酸类似物上设置多个锚和供体染料(参见图65a-65d中的合成方案)。核苷酸类似物还可以具有通过ss或偶氮接头连接至碱基的多个供体-锚对簇(参见图65b-d中的结构和合成方案)。
应该认识到,如示例所示,供体染料可以直接连接到锚分子上,而受体染料可以连接到锚结合分子上。但是另一种布置同样也可以是合理的,其中受体染料在锚部分上,供体染料在锚结合分子上,这实际上是有好处的。例如,在标记步骤中将优先使用非常大的荧光结构,例如量子点(通常为10-50nm的半胶体纳米晶体)。量子点作为fret供体具有优势,因为它们的吸收范围宽,使得可以选择对受体染料没有直接影响的激发波长,由于它们的消光系数非常高,而具有很高的亮度,但具有与有机荧光团(fluor)相似的量子产率、可调谐性、稳定性且发射光谱的带宽窄。
用于各种方案的核苷酸类似物和其他分子的化学结构如图42-51中所示。图52提供了与ddntp连接的炔丙基基团的已公开的结构,图53-65给出了所述分子的特定化学合成方案。
可以在表2中找到其他可能的锚和锚结合分子的示例(在某些情况下,它们可以互换(reversed),例如,炔或环辛炔锚和叠氮化物锚结合分子):
第iii节:具有3'-oh和防止第二个核苷酸添加的碱基上修饰的核苷酸类似物
helicos生物科学公司(helicosbiosciencescorporation,bowersetal.2009)报道了可以掺入dna中的虚拟终止子的应用,对它们的低的但足够的kpol/kd比进行评估,即使在使用klenow外切dna聚合酶的情况下,保真度好,即使在均聚物链段(stretch)中,第一个核苷酸优先于第二个核苷酸掺入,评估k1/k2之比高达104。虚拟终止子由在3'位置处没有保护基团但具有通过可切割的接头连接到嘧啶碱基的5位或嘌呤碱基的7位的染料的核苷酸组成。该染料又直接或间接连接至抑制剂分子,例如在其3'位和5'位的每一个位置上都具有磷酸基团的核苷酸。在helicos系统中,这些虚拟终止子(a、c、g和t)都具有相同的荧光团,以便进行单-色、单-分子sbs。
作为虚拟终止子,已经报道了具有未被保护的3′-oh和在碱基和荧光染料之间连接的可切割的二硫键(disulfide)接头的nrt(turcottietal2008)。但是,在dna聚合酶催化的引物/模板上进行延伸反应并对掺入的碱基进行成像后,二硫键的切割产生了一个游离的反应性的-sh基团,在进行第二个延伸反应之前,必须用碘乙酰胺对该基团进行封端。该封端(capping)步骤不仅在工艺中增加了额外的步骤,而且由于核苷酸碱基部分上残留的长尾巴而限制了连续添加多个核苷酸。使用这种方法,测序读取长度仅限于10个碱基(turcottietal2008)。其他基于二硫键的方法也需要进行类似的封端反应,以使游离的sh基团不发生反应(mitraetal2003)。
对于长读取长度的sbs策略,优选的是,可切割的接头在测序反应期间是稳定的,需要较少的操作并且在切割反应后在碱基上不留长尾巴。本文描述了包含3'-o-dtm基团和在碱基与染料或锚之间的可切割的dtm接头的核苷酸类似物。这些核苷酸类似物在溶液相dna延伸反应中是良好的终止子和dna聚合酶的底物,并且荧光团和3'-o-dtm基团都可以在水溶液中一步高效去除。用thp切割后,碱基与荧光团之间的新的基于dtm的接头不需要对所生成的游离sh基团进行封端,因为切割产物会立即崩解(collapse)为稳定的oh基团。在本节中,部分地描述了本文公开的本发明的某些核苷酸类似物中的dtm接头以及游离的3'-oh。取决于sbs方案,其他可切割的基团,例如偶氮,将存在于其他核苷酸类似物的接头中。
本文公开了在碱基上具有修饰的可以用作终止子的两种类型的核苷酸。先前已经公开了具有通过光可切割的接头连接到碱基(嘧啶的5位或嘌呤的7位)上的染料的3'-oh核苷酸,用于边合成边进行逐步测序(seoetal2005)。本文公开了图78、80-93中的通用结构和特定结构和图94-96中的一些示例性合成方案。
最近,已经开发出一组核苷酸,所述核苷酸包含与多磷酸基的末端磷酸基相连接的长标签(kumar&sood2006),用于基于纳米孔的边合成边测序(kumaretal2012,fulleretal2016,juetal2007us8889348b2,juetal2013(ep2652153a2(wo2012/083249a2))或包含与碱基相连接的长标签。后者最初是为利用纳米孔检测的单分子电子单碱基延伸反应而开发的标签(juetalwo2016/154215a1),通常由一个接头、一个任选的荧光标记和一个具有封闭端(cappedend)的长(~30个碱基长)寡核苷酸标签组成。示例如图79所示。图143示出了使用各种酶将它们有效地掺入生长中的dna链中。特别是,热测序酶很容易以与未修饰的ddntp大致相同的效率掺入这些核苷酸(图144)。
为了以等同于虚拟终止子的方式起作用,需要进行若干修饰。如图79所示,不使用双脱氧核苷酸,而使用具有未被保护的3'-oh的脱氧核苷酸。接头将具有可切割的部分(例如二硫键、偶氮、2-硝基苄基、烯丙基,叠氮基甲基等)。在某些情况下,包括一种或多种相同的荧光染料的标签将通过可切割的接头直接连接到dntp。在其他情况下,可切割的接头将连接到锚分子(例如,生物素、tco),锚分子可通过锚结合分子(例如,链霉亲和素、四嗪)连接到包括荧光染料的标签。如果标签是多核苷酸链,则标签中的最后一个核苷酸可具有游离的3'-oh基、3'磷酸基或其他基团。如果最后一个核苷酸不是通过磷酸二酯键连接到倒数第二个核苷酸,而是通过它的碱基连接,则末端核苷酸的5'位置可具有磷酸基或其他的修饰。单个染料簇可用于增强灵敏度。这些染料中的一种可以连接到标签中核苷酸的一个子集的例如2-4个碱基上(参见图85-88中的示例)。
类似地,可以将用于随后连接染料的多个锚的实例(instance)连接到聚合物链上(参见图89a中的示例)。可以预见其他变化,例如在标签的最后一个核苷酸和倒数第二个核苷酸之间放置柔性接头,例如peg或烷烃链。此外,寡核苷酸标签可以被多糖、肽或其他聚合物分子代替。关键点是,连接至碱基的此类大基团虽然对掺入第一个碱基的影响很小,但由于空间位阻、竞争与后续核苷酸的结合或其他因素,应强烈抑制随后的掺入。
本文公开了这些含有3'-oh的标记的核苷酸类似物的正交或伪正交组的设计,所述标记的核苷酸类似物在其标签和保护基团中带有不同的可切割的接头、不同的染料或不同的锚。通过这种设计变化,本申请中提出的包括4-色、2-色和1-色变型的基本上所有的测序方案都可以掺入这种类型的“虚拟”终止子,来代替带有可逆3′-保护基团的核苷酸可逆终止子。例如,对于helicos仪器,使用cy5或atto647n作为碱基上的染料部分(要么通过可切割的接头直接连接到碱基上,要么连接到用于标记锚的锚结合分子上,锚本身通过可切割的接头连接到碱基上)的1-色方法将是可选设计。对于其他平台,可以使用一种或多种染料。
本文公开了7种使用核苷酸类似物的另外的sbs方案,其中使用了如上所述的3'-oh终止子。除了这些方案中提出的以外,还可以使用染料、锚和可切割的接头的组合。可以使用其他标记(label),例如,包括拉曼标签的非荧光标签,以及如在先的pct中所述的,将纳米孔中的离子电流信号降低到不同程度、在离子通道内具有不同的停留时间或者两者兼而有之的标签组。
在以下方案中,将偶氮基团置于接头中作为第二正交(非dtm)可切割的接头的示例;示出了连二亚硫酸钠作为切割剂的示例(参见图124a-128b,表明了连二亚硫酸钠对偶氮基团的切割效率);atto647n、rox、tamra和bodipyfl用作荧光团的示例;提供生物素作为锚的示例;链霉亲和素用作锚结合分子的示例。但是,接头中的各种其他可切割的基团(例如,烯丙基、2-硝基苄基)、切割剂(例如,pd(0)、340nm光)、荧光团、锚(例如,tco、dbco、n3、四嗪)*和锚结合分子(例如,四嗪、n3、dbco、tco)*也是可行的。染料可以由单一染料分子、表现出能量转移的染料对、连接在线性或支链聚合物的多个位置处的染料簇、或量子点(qd)组成。除了核苷三磷酸类似物外,核苷四磷酸类似物、核苷五磷酸类似物、核苷六磷酸类似物和更高级的核苷多磷酸类似物也是可行的替代方案。
方案xviii是一种1-色方案,其中以逐步的方式单独地添加四种核苷酸类似物中的每一种。在其余方案中,将所有四种核苷酸类似物一起添加。方案xix是1-色方案,需要四个检测步骤。方案xx是单-色sbs方案,需要三个检测步骤来确定掺入的核苷酸。方案xxi是2-色方案,需要三个检测步骤来确定掺入的核苷酸。方案xxiia是4-色方案。方案xxiib和方案xxiic是利用量子点的2-色方案。方案xxiii是1-色方案,其利用了供体染料和受体染料之间的能量转移。
在添加含染料或锚的核苷酸类似物之后,用未标记的核苷酸可逆终止子类似物进行追加(chasing),以确保每个dna引物链均已延伸,从而避免异步反应,并且在各个步骤之间需要进行洗涤以除去之前的试剂和/或释放的染料。这些方案可用于整体(ensemble)测序或单分子测序。除了方案xviii,在所有方案中均示出了使用核苷酸可逆终止子的追加步骤,尽管该步骤也可以包括在方案xviii中。追加的目的是在平行测序反应中保持定相(phasing)。在整体测序的情况下,通过追加核苷酸类似物进行的延伸以及由此导致的延伸引物的子集的信号缺失,仍然可以观察到由剩余的引物(所述剩余的引物用标记的核苷酸类似物延伸)产生的信号。在单分子测序的情况下,追加是任选的。在使用追加进行单分子测序的情况下,如果将追加的核苷酸类似物(而不是适当的标记的核苷酸类似物))掺入到生长中的dna链中,则不会读取该位置处的碱基,尽管将在适当的循环中读取随后的碱基。因此,除了在没有获得信号的已知位置之外,序列将是准确的。尽管追加步骤是有益的,但潜在的担忧是3'-ss(dtm)核苷酸(nrt)可能会非特异性地连接在可用位点(例如标记的核苷酸类似物上延伸的标签中的磷酸基团)上,因此会阻止其掺入生长链中。这可以通过使用适当浓度的nrt来控制。
单分子测序
如上所述,下面描述的许多方案可以用于整体测序或单分子测序。在单分子荧光测序的情况下,由于未掺入荧光核苷酸或游离的荧光标记分子(例如,带有荧光团的锚结合分子),信号和背景的敏感性是两个主要问题。诸如全内反射荧光(tirf)显微镜或随机光学重建显微镜(storm)的特殊仪器可用于检测单个荧光分子。tirf显微镜可能是其中最常见的一种,并且是helicos使用的用于单分子测序方法的一种,依赖于载玻片表面处产生的渐逝波,这种波随着距表面的距离而迅速衰减。在距表面100nm的数量级内,可获得强信号。此外,由于大多数游离荧光核苷酸或标记分子不在该100nm窗口内,因此几乎没有背景信号干扰。尽管如此,仍不可能完全消除背景信号干扰。类似的原理也出现在太平洋生物科学公司的零模波导(zmw)中,其中距70nm直径孔的底部的距离为100nm。因此,虽然大多数游离的荧光分子(4种不同的颜色的)将被排除在外,但少数将进入zmw,在那里它们可能会产生假阳性信号。
本文公开了可以进一步影响使用tirf显微镜的单分子测序的两种方法。为了进一步提高灵敏度,在下面的某些方案中(方案xviii-xxii),可以使用染料簇或锚簇用于随后连接多种染料(图85-89d)。在主要目的为降低检测背景荧光的可能性的第二种方法中,利用了彼此距离很近的供体染料和受体染料之间的荧光共振能量转移(方案xxiii)。fret与tirf显微镜的组合以前已有报道,使用一种核苷酸上的cy3供体和第二核苷酸上的cy5受体来获得至多5个碱基的指纹(braslavskyetal2003)。典型的荧光能量转移的福斯特半径为约5nm(1nm至10nm之间)。在利用同一核苷酸上的供体和受体之间的能量转移的本文公开的方法中,因为用于激发供体染料的激光不能直接激发受体染料,所以溶液中的游离浮动的荧光受体分子必须在1-10nm范围内才能被视为错误信号。这种可能性极低,这意味着只有受体染料被故意置于供体染料的5nm范围内,或者位于直接连接至核苷酸类似物的聚合物分子的同一段上,或者当直接连接到具有锚的核苷酸类似物的供体染料和连接到锚结合分子上的受体染料缀合而聚集在一起时才有可能。
供体染料和受体染料的选择也很重要。例如,具有宽吸收窗口但荧光量子产率低的供体染料可用于增加受体染料的斯托克斯位移荧光发射(hungetal1996)。已经表明,cya供体和作为受体的荧光素或若丹明衍生物满足这些条件。
本文还公开了一种方法,该方法可以通过具有直接连接于核苷酸(线性链或树枝状构象)的供体-受体染料对的簇或供体染料簇和用于将多个受体染料连接在锚结合分子上的锚(方案xxiii使用结构如图93a-93c所示的化合物),既可以增加信号,减少背景检测,又可以减少错过掺入事件的机会。潜在地,这种组合方法可用于通过最先进的光学系统实现单分子sbs,其成本和占地面积(footprint)比tirf显微镜低。
方案xviii:使用逐步添加的3'-oh终止子的1-色sbs。方案xviii是1-色sbs方案,其中四种3'-oh终止子(a、c、g和t)各自带有相同的染料(在所示示例中为atto647n)、相同的阻断物(在示例中为3'-磷酸修饰的dtmp)和相同的可切割的接头(在示例中为ss)。该方案将用于核苷酸逐步添加的方案中,例如helicos使用的方法。每个循环包括掺入、洗涤、成像和用thp切割。因此,如果模板链中的下一个可用碱基为t、g、a、a,并且3'-oh终止子以a、c、g、t的顺序添加,则在第一个循环中,a将被掺入,且成像将表明掺入事件。洗去核苷酸后,切割ss基团以同时除去染料和阻断物。由于添加的下一个3′-oh终止子是c,因此将其掺入。在洗涤、成像和切割后,添加了一个g,但是由于它与模板链中的下一个可用碱基(a)不互补,因此不会被掺入,并且在洗涤和成像后不会观察到荧光。由于没有掺入,因此可以跳过切割反应。过程继续,添加t,t将被掺入并读取。由于它起终止子的作用,因此在再发生4个循环之前,不会观察到下一个(following)t。重复该过程以继续对模板链进行测序。
图97包含示出了使用四种dntp-ss-阻断物-染料分子(datp-ss-阻断物-atto647n、dctp-ss-阻断物-atto647n、dgtp-ss-阻断物-atto647n、dttp-ss-阻断物-atto647n)进行单-色逐步测序的方案xviii的示意图。一次添加一种核苷酸。在每个测序循环中,在掺入步骤之后,进行洗涤和成像以揭示是否掺入了核苷酸。然后使用thp或tcep处理去除阻断物和染料,并进行清洗和成像以确保已去除所有染料。该方案中使用的分子的结构如图80所示。
方案xix:采用所有四种3′-oh终止子同时添加和连续切割反应的1-色sbs。方案xix也是1-色sbs方案,其中四种虚拟终止子各自带有相同的染料(在所示示例中为atto647n)和阻断物(在示例中为3'-磷酸修饰的dtmp),但每种均具有不同的可切割的接头(在示例中为偶氮、烯丙基、2-硝基苄基和ss)。将仅掺入四种3'-oh终止子中的一种,该终止子与模板链中下一个可用的核苷酸的碱基互补。将使用4种连续切割剂(连二亚硫酸钠、pd(0)、340nm光和thp)进行处理,并在各次切割之间进行洗涤和成像。在给定的切割后荧光丢失将表明被掺入的核苷酸。
图98包含示出了使用dntp-可切割的接头-阻断物-染料(datp-烯丙基-阻断物-atto647n、dttp-ss-阻断物-atto647n、dctp-偶氮-阻断物-atto647n、dgtp-2-硝基苄基-阻断物-atto647n)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案xix的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(datp-烯丙基-阻断物-atto647n、dttp-ss-阻断物-atto647n、dctp-偶氮-阻断物-atto647n、dgtp-2-硝基苄基-阻断物-atto647n)加入到固定的引发的dna模板中使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何染料标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种染料标记的核苷酸类似物(a、c、g、t)中的一种或不具有染料的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,在洗掉未掺入的染料标记的核苷酸后,检测到独特的荧光信号确认掺入,但未表明掺入了哪种核苷酸。步骤4,通过向延长的dna链添加pd(0)来切割烯丙基接头,导致从掺入的a中去除atto647n。步骤5,洗掉切割下的染料后,进行第二轮成像。atto647n信号的丢失表明掺入了a。步骤6,通过向延长的dna链添加连二亚硫酸钠(na2s2o4)来切割偶氮接头,以从掺入的c中除去atto647n。步骤7,洗掉切割下的染料后,进行第三轮成像。atto647n信号的丢失表明掺入了c。步骤8,通过用340nm光处理延长的dna链来切割2-硝基苄基接头,以从掺入的g中去除atto647n。步骤9,洗掉切割下的染料后,进行第四轮成像。atto647n信号的丢失表明掺入了g。步骤10,通过向延长的dna链添加thp来切割ss接头,以从掺入的t中除去atto647n,并且还恢复了用3'-o-ss(dtm)-dntp延伸的任何生长链上的3'-oh基团。步骤11,洗去切割下的染料后,进行最后一轮成像。atto647n信号的丢失证实了t的掺入。dna产物已准备就绪,可用于下一个dna测序反应的循环。该方案中使用的核苷酸的结构如图81所示。
方案xx:采用同时添加的两种具有相同染料的3'-oh终止子和两种具有相同锚的3'-oh终止子的1-色sbs。方案xx是1-色sbs方案,在掺入后、标记后和特定切割步骤后需要三个成像步骤。掺入后的成像揭示了两种类型的核苷酸中的任一种的掺入,标记步骤揭示了其他两种类型的核苷酸中的任一种的掺入,并且第一切割反应表明了具体掺入了哪一种核苷酸。最终的切割反应将系统恢复,以用于下一个测序循环。
图99a-99d包含示出了使用dntp-可切割的接头-阻断物-染料(datp-偶氮-阻断物-atto647n、dctp-ss-阻断物-atto647n)、dntp-可切割的接头-阻断物-锚(dttp-偶氮-阻断物-生物素和dgtp-ss-阻断物-生物素)、相应的染料标记的锚结合分子(链霉亲和素-atto647n)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案xx的示意图。步骤1,将dna聚合酶、两种dntp-可切割的接头-阻断物-染料(datp-偶氮-阻断物-atto647n、dctp-ss-阻断物-atto647n)和两种dntp-可切割的接头-阻断物-锚(dttp-偶氮-阻断物-生物素和dgtp-ss-阻断物-生物素)加入到固定的引发的dna模板中使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何染料或锚标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被两种染料标记的核苷酸类似物(a、c)中的任一种、两种包含锚的核苷酸类似物(g、t)中的任一种或不具有染料或锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,洗去未掺入的核苷酸后,检测到atto647n信号表明掺入了a或c。步骤4,添加链霉亲和素-atto647n,来标记包含生物素锚的分子(g和t)。步骤5,洗涤后,进行成像。新出现的atto647n荧光表明掺入了g或t。步骤6,通过向延长的dna链添加连二亚硫酸钠(na2s2o4)来切割偶氮接头,以从掺入的a或t中去除atto647n。步骤7,洗掉切割下的染料后,进行第三轮成像。初始掺入后出现的atto647n信号的丢失表明掺入了a;仅在标记反应之后才出现的atto647n信号的丢失表明掺入了t。如果在掺入后存在信号,并且在切割后仍然存在信号,则掺入了c。如果信号在标记后出现并且在切割后仍然存在,则添加了g。接下来,在步骤8中,用thp处理dna产物来切割ss接头,从而除去剩余的荧光染料。洗掉thp后,任选的成像步骤(未示出)将确认所有染料均已去除,为下一个测序循环做准备。荧光图像的示意图如图99d所示。空心圆表示“无荧光信号”,实心圆表示“荧光信号”。在本节中,可以为其他1-色sbs方案构造类似的示意图。此方案中使用的核苷酸和锚结合分子的结构如图82所示。
方案xxi:使用两种带有两种不同染料的3'-oh终止子和两种带有两种不同锚的3'-oh终止子的2-色sbs。方案xxi是2-色方法,在掺入后和特异性切割反应后需要两个成像步骤。掺入揭示了两种类型的核苷酸中的任一种的掺入。任选的标记步骤揭示了其他两种类型的核苷酸中的任一种的掺入,并且第一切割反应表明了具体掺入了哪一种核苷酸。最终的切割反应将系统恢复,以用于下一个测序循环。
图100a-100c包含示出了使用dntp-ss-阻断物-染料(datp-ss-阻断物-rox、dttp-ss-阻断物-atto647n)、dntp-ss-阻断物-锚(dctp-ss-阻断物-生物素和dgtp-ss-阻断物-tco)、相应的染料标记的锚结合分子(链霉亲和素-rox和四嗪-atto647n)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xxi的示意图。步骤1,将dna聚合酶、两种dntp-ss-阻断物-染料(datp-ss-阻断物-rox、dttp-ss-阻断物-atto647n)和两种dntp-ss-阻断物-锚(dctp-ss-阻断物-生物素和dgtp-ss-阻断物-tco)以及四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何染料或锚标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被两种染料标记的核苷酸类似物(a、t)中的任一种、两种包含锚的核苷酸类似物(c、g)中的任一种或不具有染料或锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,洗去未掺入的核苷酸后,检测到rox信号表明掺入了a。检测到atto647n信号表明掺入了t。步骤4,添加将标记包含生物素锚的核苷酸类似物(c)的链霉亲和素-rox,和将标记包含tco锚的核苷酸类似物(g)的四嗪-atto647n。步骤5,洗涤后,进行成像。新出现的rox荧光表明掺入了c;新出现的atto647n荧光表明掺入了g。接下来,在步骤6中,用thp处理dna产物来切割ss接头,从而去除了剩余的荧光染料。洗掉thp后,任选的成像步骤(步骤7)将确认已去除所有染料,为下一个测序循环做准备。荧光图像的示意图如图100c中所示。空心圆和空心三角形表示“无荧光信号”,实心圆和实心三角形表示“两个不同的波长的荧光信号”。在本节中,可以为其他2-色sbs方案构造类似的示意图。该方案中使用的核苷酸的结构如图83所示。
方案xxiia:采用同时添加的所有四种3'-oh终止子的4-色sbs。方案xxiia是4-色sbs方案,其中四种3'-oh终止子各自带有不同的染料(示例中为bodipyfl、tamra、rox和atto647n),但相同的阻断物(3'-磷酸修饰的tmp)和接头中的相同的可切割的基团(ss)。在该方案的最简单的形式中,掺入和洗涤后的单次成像将揭示掺入的核苷酸类似物。用thp切割来去除染料和阻断物,为下一个测序循环做准备。
图101包含示出了使用dntp-ss-阻断物-染料(datp-ss-阻断物-rox、dttp-ss-阻断物-bodipyfl、dctp-ss-阻断物-tamra和dgtp-ss-阻断物-atto647n)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行4-色dnasbs的方案xxiia的示意图。步骤1,将dna聚合酶和四种dntp-ss-阻断物-染料(datp-ss-阻断物-rox、dttp-ss-阻断物-bodipyfl、dctp-ss-阻断物-tamra和dgtp-ss-阻断物-atto647n)加入到固定的引发的dna模板中使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何染料标记的dntp延伸的生长中的dna链的子集(subset)中。生长中的dna链被四种染料标记的核苷酸类似物(a、c、g、t)中的一种或不具有染料的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,洗去未掺入的核苷酸后,检测到rox信号表明掺入了a。检测到bodipyfl信号表明掺入了t;检测到tamra信号表明掺入了c。检测到atto647n信号表明掺入了g。接下来,在步骤4中,用thp处理dna产物来切割ss接头,从而除去剩余的荧光染料。洗掉thp后,任选的成像步骤(步骤5)将确认已去除所有染料,为下一个测序循环做准备。该方案中使用的核苷酸的结构如图84所示。
涉及量子点的方案
方案xxiib:使用两种锚、两种量子点和两种可切割的接头的2-色sbs:在标记后和切割后进行成像。在方案xxiib中,3'-oh终止子的正交集由通过ss键连接的锚1、通过ss键连接的锚2、通过偶氮键连接的锚1和通过偶氮键连接的锚2组成,每一种锚均连接至不同的碱基。进行掺入。然后添加具有量子点1(qd1)的锚1结合分子和具有qd2的锚2结合分子。由于量子点的宽吸收光谱,利用单激光(singlelaser)对两种qd进行激发成像后,qd1荧光的出现将掺入的3'-oh终止子的选择限定为两种可能性,而qd2荧光的出现将掺入的3'-oh终止子的选择限定为其他两种替代选择。在用连二亚硫酸钠切割偶氮接头之后,再次用单激光进行的成像将表明掺入的特定的3'-oh终止子。然后,用thp进行切割将除去剩余的染料,并恢复3'-oh基团,以用于后续的测序循环。在图102a-102c所示的示例中,锚是生物素和tco,可切割的接头是偶氮和ss,qd1和qd2分别是绿色发射体和红色发射体,但是也可以使用可切割的接头、锚和不同的qd的其他组合。
图102a-102c包含示出了使用dntp-ss-阻断物-锚(datp-ss-阻断物-生物素、dgtp-ss-阻断物-tco)、dntp-偶氮-阻断物-锚(dttp-偶氮-阻断物-tco、dctp-偶氮-阻断物-生物素)、相应的染料标记的结合分子(量子点1(绿色)-标记的链霉亲和素和量子点2(红色)-标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xxiib的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(datp-ss-阻断物-生物素、dgtp-ss-阻断物-tco、dttp-偶氮-阻断物-tco、dctp-偶氮-阻断物-生物素)加入到固定的引发的dna模板中使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3′-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何染料标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种锚标记的核苷酸类似物(a、c、g、t)中的一种或不具有锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-qd1和四嗪-qd2进行标记。qd1将特异性结合a脱氧核苷酸类似物和c脱氧核苷酸类似物,而qd2将结合g脱氧核苷酸类似物和t脱氧核苷酸类似物。步骤4,洗去剩余的游离标记和多余的核苷酸后,检测到qd1荧光表明掺入了a或c,检测到qd2荧光表明掺入了g或t。接下来,在步骤5中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而除去t核苷酸类似物和c核苷酸类似物上的qd和阻断物。步骤6,洗去切割下的qd后,进行成像以确定qd1(绿色)荧光和qd2(红色)荧光的存在。在此步骤中,如果已经确定掺入的脱氧核苷酸可能是a或c,则荧光丢失将表明其为c,而保留荧光将表明其为a。类似地,对于先前确定为g或t的信号,荧光消失将明确地表明掺入了t,而保留荧光将表明掺入了g。接下来,在步骤7中,用thp处理dna产物来切割ss接头,从而除去剩余的荧光qd和阻断物,并导致dna延伸产物上的游离3'-oh基团的再生。步骤8,洗掉thp后,任选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。尽管在方案xxiib中未指出,但是如果需要,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图89b所示。
方案xxiic:使用不同比例的两种锚和两种量子点的2-色sbs:标记后进行成像。在方案xxiic中,四种3'-oh终止子均通过ss接头连接到锚1、锚2、锚1:锚2为1:1的混合物和锚1:锚2为2:1的混合物。掺入所有四种3'-oh终止子后,用带有qd1的锚1结合分子和带有qd2的锚2结合分子进行标记步骤。由于量子点的宽吸收光谱,用单激光激发两种qd进行的成像将显示由于qd1而产生的荧光、由于qd2而产生的荧光或取决于qd1和qd2的比例的中间荧光,以表明掺入的特定的3′-oh终止子。然后,用thp进行切割将除去剩余的染料,并恢复3'-oh基团,以用于后续的测序循环。在所示的示例中,锚是生物素和tco,qd1和qd2分别是绿色发射体和红色发射体,但是也可以使用锚和不同的qd的其他组合。
图103包含示出了使用dntp-ss-阻断物-锚(datp-ss-阻断物-生物素、dgtp-ss-阻断物-tco、dttp-ss-阻断物-生物素/生物素/tco、dctp-ss-阻断物-生物素/tco)、相应的染料标记的结合分子(量子点1(绿色)-标记的链霉亲和素和量子点2(红色)-标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行2-色dnasbs的方案xxiic的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(datp-ss-阻断物-生物素、dgtp-ss-阻断物-tco、dttp-ss-阻断物-生物素/生物素/tco、dctp-ss-阻断物-生物素/tco)加入到固定的引发的dna模板中使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何染料标记的dntp延伸的生长中的dna链的子集(subset)中。生长中的dna链被四种锚标记的核苷酸类似物(a、c、g、t)中的一种或不具有锚的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-qd1和四嗪-qd2进行标记。仅有qd1将与a双脱氧核苷酸类似物结合,仅有qd2将与g双脱氧核苷酸类似物结合,1个拷贝的qd1和1个拷贝的qd2将与c类似物结合,2个拷贝的qd1和1个拷贝的qd2将与t类似物结合。步骤4,在洗掉剩余的游离qd和多余的核苷酸后,将在同时激发qd1和qd2的情况下进行成像。检测到qd1(绿色)荧光将表明掺入a,检测到qd2(红色)荧光将表明掺入了g,检测到相等比例的qd1荧光和qd2荧光将表明掺入了c,而检测到2:1比例的qd1:qd2荧光将表明掺入了g。接下来,在步骤5中,用thp处理dna产物来切割ss接头,导致荧光qd的去除和dna延伸产物上的游离3′-oh基团的再生。步骤8,洗掉thp后,任选的成像步骤将确认已除去所有qd,为下一个测序循环做准备。尽管在方案xxiic中未指出,但是如果需要,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图89c-89d所示。
涉及供体-受体对的方案
方案xxiii:使用两种锚、一种供体-受体染料对和两种可切割的接头的1-色sbs:在两个标记步骤之后和切割之后进行成像。在方案xxiii中,通过ss键连接的包含供体染料1的锚1、通过偶氮键连接的包含供体染料1的锚1、通过ss键连接的包含供体染料1的锚2和通过偶氮键连接的包含供体染料1的锚2各自连接至不同的碱基。进行掺入。添加包含受体染料1的锚1-结合分子。在用供体染料1激发进行成像后,受体染料1发出的荧光将表明两种可能的核苷酸类似物的掺入。接下来,添加包含受体染料1的锚2-结合分子。在用供体染料1激发进行成像后,受体染料1发出的新的荧光将表明其他两种可能的核苷酸类似物的掺入。用连二亚硫酸钠切割偶氮接头后进行的成像将表明掺入的特定的核苷酸类似物。然后,用thp进行切割将除去剩余的染料,并恢复3'-oh基团,以用于随后的测序循环。在所示的示例中,可切割的接头是偶氮和ss,供体染料1是cy3,受体染料1是cy5,但是也可使用其他可切割的接头(例如2nb或烯丙基)和其他供体-受体对(例如,cya为供体,rox或cy3为受体;fam为供体,rox为受体)。接头-阻断物可以是连接有2个或更多个供体染料的线性分子或树枝状大分子,在这种情况下,多个受体染料将通过锚-锚结合分子的缀合步骤进行连接。
图104a-104d包含示出了使用dntp-ss-阻断物-供体染料-锚(3’-o-ss-datp-7-ss-阻断物-cy3-生物素、3’-o-ss-dgtp-7-ss-阻断物-cy3-tco)、3’-o-ss(dtm)-dntp-偶氮-阻断物-cy3-锚(3’-o-ss-dttp-5-偶氮-阻断物-cy3-tco、3’-o-ss-dctp-5-偶氮-阻断物-cy3-生物素)、相应的染料标记的结合分子(cy5标记的链霉亲和素和cy5标记的四嗪)和四种3’-o-ss(dtm)-dntp(3’-o-叔丁基二硫代甲基(ss)-datp、3’-o-叔丁基二硫代甲基(ss)-dctp、3’-o-叔丁基二硫代甲基(ss)-dttp和3’-o-叔丁基二硫代甲基(ss)-dgtp)进行1-色dnasbs的方案xxiii的示意图。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-ss-datp-7-ss-阻断物-cy3-生物素、3'-o-ss-dgtp-7-ss-阻断物-cy3-tco、3'-o-ss-dttp-5-偶氮-阻断物-cy3-tco、3'-o-ss-dctp-5-偶氮-阻断物-cy3-生物素)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何包含阻断物-供体染料的锚的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种阻断物-供体染料-锚标记的核苷酸类似物(a、c、g、t)中的一种或不具有染料的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,用链霉亲和素-cy5进行标记。该染料将特异性结合a核苷酸类似物和c核苷酸类似物,但不结合g类似物和t类似物。步骤4,洗去剩余的游离标记和多余的核苷酸后,在cy3激发后检测到cy5信号表明掺入了a或c。步骤5,用四嗪-cy5进行标记。该染料将特异性结合g核苷酸类似物和t核苷酸类似物,但不结合a类似物和c类似物。步骤6,洗去剩余的游离标记和多余的核苷酸后,cy3激发后检测到新的cy5信号表明掺入了g或t。接下来,在步骤7中,用连二亚硫酸钠处理dna产物来切割偶氮接头,从而除去t和c上的任何阻断物和供体-受体-染料对。步骤8,洗去切割下的染料后,在激发cy3后进行成像以确定cy5荧光的存在。在此步骤中,如果已经确定掺入的核苷酸可能是a或c,则cy5荧光丢失将表明其为c,而保留荧光将表明其为a。类似地,对于先前确定为g或t的信号,cy5荧光丢失将明确地表明掺入了t,而保留荧光将表明掺入了g。接下来,在步骤9中,用thp处理dna产物来切割ss接头,从而去除剩余的阻断物和cy3-cy5染料对。步骤10,在洗掉thp之后,任选的成像步骤将确认已除去所有染料,为下一个测序循环做准备。虽然在图104a-104d中未示出,但是如果需要,在偶氮基团和碱基之间存在另外的ss键导致在thp处理后在掺入的核苷酸上产生较短的疤痕,这将导致更长的读长。该方案中使用的修饰的核苷酸的结构如图90-92b(具有单锚和供体染料)和图93a-93c(具有2个以上的锚和供体染料)。连接到碱基上的多个供体-锚对簇也可以用来放大能量转移信号(图93a-93c示出了示例结构)。
应该认识到的是,如示例中所示,供体染料可以直接连接至锚分子,而受体染料可以连接至锚结合分子。但是另一种布置同样也可以是合理的,其中受体染料在锚部分上,供体染料在锚结合分子上,这实际上是有好处的。例如,在标记步骤中将优先使用非常大的荧光结构,例如量子点(通常为10-50nm的半胶体纳米晶体)。量子点作为fret供体具有优势,因为它们的吸收范围宽,使得可以选择对受体染料没有直接影响的激发波长,由于它们的消光系数非常高,而相对于有机荧光团(fluor)具有很高的亮度,但具有相似的量子产率、可调谐性、稳定性且发射光谱的带宽窄。
第iv节:“触发物”分子:在一个分支上具有可切割的部分且在另一个分支上具有锚或染料的枝状接头
本文公开了可逆终止子的新用途,其中核苷酸类似物的3'-oh基团被枝状分子保护,以进行边合成边dna(或rna)测序。较短的分支(分支1)由可切割的部分组成,而另一个分支(分支2)直接连接至荧光染料或其他标记,或者锚,该锚用于随后通过锚特异性结合分子进行荧光或其他标记的掺入后结合(post-incorporationbinding)。分支1上可切割的部分的切割导致分支2及其相关的直接或二级连接的标记被去除,同时恢复了3'-oh基团用于随后轮次的sbs。由于它们能够同时造成两个分支的去除,因此此类可切割的部分在本文中称为“触发物”(trigger)。
先前已经公开了使用具有基于叠氮甲基的触发物的触发物分子(juetal2017us9,624,539)。可以被定位成用作触发物的触发可切割基团的示例包括烯丙基、2-硝基苄基(2nb)、偶氮(n2)和二硫代甲基(dtm)基团。这些基团可以在有效且对dna无害的条件下分别被pd(0)、340nm光、连二亚硫酸钠和还原剂(例如tcep、thp或dtt)切割。
锚的示例包括生物素、tco和叠氮化物(n3);相关的锚结合分子是链霉亲和素、四嗪和二苄基环辛炔(dbco)。本节之后的表格中还包含其他锚和锚结合分子的组合。
在2-染料方案的情况下,选择具有良好分离的吸收和发射光谱的染料。为了减小光学设备的尺寸和成本,优选2-色的设计且特别是1-色的设计。
除了核苷三磷酸类似物外,核苷四磷酸类似物、核苷五磷酸类似物、核苷六磷酸类似物和高级核苷多磷酸类似物也是可行的替代物。
本文公开了利用具有可切割的触发物的核苷酸类似物的sbs方案的几个示例。在本文给出的示例中,为了易于表达,所有四种(脱氧)核苷酸类似物(a、c、g和t/u)均具有可切割的触发物。但是,当一种、两种或三种核苷酸类似物具有非枝状结构时,或者即使锚/染料连接至一种、两种或三种核苷酸类似物的碱基上时,这些方案也可以同样有效地运行。一个统一的原则是,至少一种核苷酸类似物带有分支的可切割的3'-oh保护基团和标记/锚。由于所示的所有修饰均位于糖的3'-o位置,因此已选择相对较小的染料(rox和bodipyfl)和锚(生物素和tco)用于本文公开的示例中。先前已经提出了类似的方案(juetalwo2017/058953a1,juetalwo2017/205336a1),但是所述方案具有标准的可切割的接头,而不是此处提出的基于可切割的触发物的接头。其他方案,例如本申请的第i节,也可以适用于包括这些切割触发分子。
方案xxiv是4-色方案,其需要在掺入和标记后进行成像以特异性鉴别掺入的核苷酸类似物,方案xxv和方案xxvi是2-色方案:在方案xxv中掺入和标记后,以及在方案xxvi中标记和第一次切割步骤之后,需要进行成像。方案xxvii和方案xxviii是1-色方案。方案xxvii需要在三个切割步骤中的每一个之后进行成像,而方案xxviii需要在掺入之后和第一个切割步骤之后进行成像。其中一些方案包括任选的确认性成像步骤。与所有先前描述的方案一样,在添加包含染料或锚的核苷酸类似物后,使用未标记的核苷酸类似物进行追加(chasing),以确保每条dna引物链均被延伸,从而避免异步反应,并且在各个步骤之间需要进行洗涤以去除先前的试剂和/或释放的染料。尽管提出的所有方案都使用dna模板和引物、2-脱氧核苷酸类似物和dna聚合酶,但原则上可以采用包括用于rna依赖性dna聚合酶以及dna或rna依赖性rna聚合酶的合适的模板、引物和核苷酸类似物的方案。
方案xxiv:使用1种可切割的触发物分子、两种锚和四种染料的4-色sbs。在方案xxiv中,用含有直接连接到触发物1(在示例中为dtm)的染料1的核苷酸类似物、含有直接连接到触发物1的染料2的核苷酸类似物、具有连接到触发物1的锚1(在示例中为生物素)的核苷酸和具有连接到触发物1的锚2(在示例中为tco)的核苷酸进行掺入,以具体地鉴别两种类型的核苷酸。然后用染料3标记的锚1特异性结合分子(在示例中为链霉亲和素)和染料4标记的锚2特异性结合分子(在示例中为四嗪)进行标记,以具体地鉴别剩余的两种类型的核苷酸。用例如thp切割触发物部分,将除去剩余的染料并恢复3'-oh基团以用于随后的测序循环。在示例中,染料1是rox,染料2是bodipyfl,染料3是cy5,染料4是r6g。也可以使用染料、锚和可切割的触发物接头的其他组合。虽然理论上可以将四种不同的染料直接连接到这四种核苷酸上,而无需使用锚,但是此处描述的方法允许添加四种相对较小的化学基团(rox、bodipyfl、生物素和tco),以免阻碍掺入核苷酸类似物。
图119包含示出了使用3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-datp、3’-o-bodipyfl-peg4-ss(dtm)触发物-dgtp)、3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp、3’-o-tco-ss(dtm)触发物-dctp)和相关的染料标记的锚结合分子(cy5标记的链霉亲和素、r6g标记的四嗪)进行4-色sbs的方案xxiv的示意图。步骤1,将dna聚合酶和四种3'-o-染料/锚-ss(dtm)-dntp(3'-o-rox-peg4-ss(dtm)触发物-datp、3'-o-bodipyfl-peg4-ss(dtm)触发物-dgtp、3'-o-生物素-ss(dtm)触发物-dttp和3'-o-tco-ss(dtm)触发物-dctp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成;步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3′-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss(dtm)-核苷酸类似物掺入到在步骤1中没有用任何染料或锚连接的dntp延伸的生长中的dna链的子集中;步骤3,与cy5标记的链霉亲和素和r6g标记的四嗪一起温育;步骤4,洗去未掺入的核苷酸类似物和过量的标记的锚结合分子后,进行成像。rox信号的存在表明掺入了a,bodipyfl信号的存在表明掺入了g,cy5信号的存在表明掺入了t,而r6g信号的存在表明掺入了c。步骤5,用dtt、tcep或thp进行二硫键的切割,以去除染料并再生所有dna延伸产物上的游离的3′-oh,为随后的sbs循环做好准备。洗去切割剂后,重复步骤1至步骤5,以继续进行4-色dnasbs的后续循环。该方案中使用的修饰的核苷酸的结构如图105所示。
方案xxv:使用1种可切割的触发物分子、两种锚和两种染料的2-色sbs。在方案xxv中,用含有直接连接到触发子1(在示例中为dtm)的染料1的核苷酸类似物、含有直接连接到触发子1的染料2的核苷酸类似物、含有连接到触发子1的锚1(在示例中为生物素)的核苷酸类似物和含有连接到触发子1的锚2(在示例中为tco)的核苷酸类似物进行掺入,以具体地鉴别两种类型的核苷酸。然后用染料1标记的锚1特异性结合分子(在示例中为链霉亲和素)和染料2标记的锚2特异性结合分子(在示例中为四嗪)进行标记,以具体地鉴别剩余的两种类型的核苷酸。用例如thp切割触发物部分,将除去剩余的染料并恢复3'-oh基团以用于随后的测序循环。在示例中,染料1是rox,染料2是bodipyfl。也可以使用染料、锚和可切割的触发物接头的其他组合。本质上,方案xxiv和方案xxv是相同的,只是在后者中仅使用两种染料。
图120包含示出了使用3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-datp、3’-o-bodipyfl-peg4-ss(dtm)触发物-dgtp)、3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp、3’-o-tco-ss(dtm)触发物-dctp)和相关的染料标记的锚结合分子(rox标记的链霉亲和素、bodipyfl标记的四嗪)进行2-色sbs的方案xxv的示意图。步骤1,将dna聚合酶和四种3'-o-染料/锚-ss(dtm)-dntp(3'-o-rox-peg4-ss(dtm)触发物-datp、3'-o-bodipyfl-peg4-ss(dtm)触发物-dgtp、3'-o-生物素-ss(dtm)触发物-dttp和3'-o-tco-ss(dtm)触发物-dctp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成;步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss(dtm)-核苷酸类似物掺入到在步骤1中没有用任何染料或锚连接的dntp延伸的生长中的dna链的子集中;步骤3,洗去未掺入的核苷酸类似物后,进行成像。rox信号的存在将表明掺入了a;bodipyfl信号的存在将表明掺入了g。步骤4,与rox标记的链霉亲和素和bodipyfl标记的四嗪一起温育;步骤5,洗去过量的标记的锚结合分子后,进行成像。新的rox信号的存在表明掺入了t;新的bodipyfl信号的存在表明掺入了c;步骤6,用dtt、tcep或thp进行二硫键的切割,以去除染料并再生所有dna延伸产物上的游离的3'-oh,为随后的sbs的循环做好准备。洗去切割剂后,重复步骤1至步骤6,以继续进行2-色dnasbs的后续循环。该方案中使用的修饰的核苷酸的结构如图106所示。
方案xxvi:使用2种可切割的触发物分子、2种锚和2种染料的2-色sbs。在方案xxvi中,用核苷酸类似物的正交集进行掺入,第一核苷酸类似物具有与触发物1(在此示例中为偶氮)连接的锚1(在此示例中为生物素),第二核苷酸类似物具有与触发物2(在此示例中为dtm)连接的锚1,第三核苷酸类似物具有与触发物1连接的锚2(在此示例中为tco),第四核苷酸类似物具有与触发物2连接的锚2。接下来,用染料1标记的锚1结合分子(示例中的链霉亲和素)和染料2标记的锚2结合分子(示例中的四嗪)进行标记。就这一点而言,成像将揭示已经掺入的两种可选类型的核苷酸中的一种,但没有具体地表明是哪一种。用连二亚硫酸钠切割触发物1后进行的第二轮成像将表明具体掺入了哪种类型的核苷酸。最后,用thp切割触发物2,将除去剩余的染料,并恢复3'-oh基团,以用于随后的测序循环。在示例中,染料1是rox,染料2是bodipyfl。也可以使用染料、锚和可切割的触发物接头的其他组合。方案xxv,也是一种2-色sbs方案,在掺入步骤和标记步骤之后需要进行成像,而方案xxvi在标记步骤和第一次切割步骤之后需要进行成像。
图121a-121c包含示出了使用3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp、3’-o-tco-ss(dtm)触发物-dgtp)、3’-o-锚-偶氮触发物-dntp(3’-o-生物素-偶氮触发物-datp、3’-o-tco-偶氮触发物-dctp)和相关的染料标记的锚结合分子(rox标记的链霉亲和素、bodipyfl标记的四嗪)进行2-色sbs的方案xxvi的示意图。步骤1,将dna聚合酶和四种3'-o-锚-连接的dntp(3'-o-生物素-ss(dtm)触发物-dttp、3'-o-tco-ss(dtm)触发物-dgtp、3'-o-生物素-偶氮触发物-datp、3'-o-tco-偶氮触发物-dctp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成;步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss(dtm)-核苷酸类似物掺入到在步骤1中没有用任何锚连接的dntp延伸的生长中的dna链的子集中;步骤3,与rox标记的链霉亲和素和bodipyfl-peg4标记的四嗪一起温育。步骤4,在洗掉未掺入的核苷酸类似物和过量的染料标记的锚结合分子后,进行成像。rox信号的存在将表明掺入了a或t;步骤5,添加连二亚硫酸钠来切割偶氮触发物,并同时恢复任何用a或c延伸的引物上的3'-oh;步骤6,洗去过量的标记的锚结合分子后,进行成像。rox信号丢失表明掺入了a,而保留rox信号表明掺入了t;同样,bodipyfl信号丢失表明掺入了c,而保留bodipyfl信号表明掺入了g。步骤7,用dtt、tcep或thp进行二硫键的切割,以去除引物上用g或t延伸的引物上的任何剩余的染料,并再生所有dna延伸产物上的游离的3'-oh,这为后续的sbs的循环做好准备。洗去切割剂后,重复步骤1至步骤7,以继续进行2-色dnasbs的后续循环。此方案中使用的修饰的核苷酸的结构如107所示。
方案xxvii:使用4种可切割的触发物分子和一种染料的1-色sbs。在方案xxvii中,用含有连接到触发物1(在此示例中为偶氮)的染料1的核苷酸类似物、含有连接到触发物2(在此示例中为烯丙基)的染料1的核苷酸类似物、含有连接到触发物3(在此示例中为2nb)的染料1的核苷酸类似物和含有连接到触发物4(在此示例中为dtm)的染料1的核苷酸类似物进行掺入。掺入后进行任选但推荐的成像步骤,以确保已掺入核苷酸。然后进行切割反应以逐一去除染料,同时恢复3'-oh基团。在图122a-122c的示例中,切割剂分别是连二亚硫酸钠、pd(0)、340nm光和thp。在前三个切割步骤中的每个步骤之后进行的成像将具体地表明掺入了哪种类型的核苷酸类似物。在示例中,染料1是rox。
图122a-122c包含示出了使用3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-dctp)、3’-o-染料-偶氮触发物-dntp(3’-o-rox-peg4-偶氮触发物-dgtp)、3’-o-染料-烯丙基触发物-dntp(3’-o-rox-peg4-烯丙基触发物-datp)和3’-o-染料-2nb触发物-dntp(3’-o-rox-peg4-2nb触发物-dttp)进行1-色sbs的方案xxvii的示意图。步骤1,将dna聚合酶和四种3′-o-染料-连接的-可切割的触发物-dntp类似物(3′-o-rox-peg4-ss(dtm)触发物-dctp、3′-o-rox-peg4-偶氮触发物-dgtp、3′-o-rox-peg4-烯丙基触发物-datp和3′-o-rox-peg4-2nb触发物-dttp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成;步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3′-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss(dtm)-核苷酸类似物掺入到在步骤1中没有用任何染料连接的dntp类似物延伸的生长中的dna链的子集中;步骤3(任选),在洗涤除去任何未掺入的核苷酸类似物后,成像将非具体地表明掺入了四种核苷酸中的一种。步骤4,用连二亚硫酸钠处理来切割偶氮接头,同时触发用g延伸的dna分子上的3′-oh的恢复。步骤5,洗掉未掺入的核苷酸类似物后,进行成像。rox信号的丢失将表明掺入了g;步骤6,用pd(0)进行处理来切割烯丙基接头,同时触发用a延伸的dna分子上的3'-oh的恢复。步骤7,洗去未掺入的核苷酸类似物后,进行成像。rox信号的丢失将表明掺入了a。步骤8,暴露在340nm光下来切割2-硝基苄基(2nb)接头,同时触发用t延伸的dna分子上的3'-oh的恢复。步骤9,洗去未掺入的核苷酸类似物后,进行成像。rox信号的丢失将表明掺入了t。步骤10,用dtt、tcep或thp进行二硫键的切割,以去除引物上所有的剩余的染料,并恢复任何用c延伸的dna分子上的3'-oh。此时,延伸产物已准备好用于后续的sbs的循环。洗去切割剂后,重复步骤1至步骤10,以继续进行后续的1-色dnasbs的循环。该方案中使用的修饰的核苷酸的结构如图108所示。
方案xxviii:使用2种可切割的触发物分子、一种锚和一种染料的1-色sbs。在方案xxviii中,用核苷酸类似物的正交集进行掺入,其中一种核苷酸类似物具有直接连接到触发物1(在本示例中为偶氮)的染料1,一种核苷酸类似物具有直接连接到触发物2(在本示例中为dtm)的染料1,一种核苷酸类似物具有连接到触发物1的锚1(在本示例中为生物素),一种核苷酸类似物具有连接到触发物2的锚1,掺入后进行成像以非具体地鉴别两种类型的核苷酸类似物的掺入。接下来,用染料1标记的锚1特异性结合分子(在本示例中为链霉亲和素)进行标记,然后进行任选但推荐的成像步骤,以非具体地揭示剩余的两种类型的核苷酸类似物的掺入。用连二亚硫酸钠处理来切割触发物1,然后进行成像,将揭示具体掺入了哪种核苷酸。最后,用thp切割触发物2将去除所有剩余的染料,并恢复3'-oh基团,以用于随后的测序循环。在示例中,染料1是rox。方案xxvii也是一种1-色sbs方案,需要在三个切割步骤中的每一个步骤之后进行成像,而方案xxviii需要在掺入步骤和第一个切割步骤之后进行成像。
图123a-123c包含示出了使用3’-o-染料-ss(dtm)触发物-dntp(3’-o-rox-peg4-ss(dtm)触发物-datp)、3’-o-染料-偶氮触发物-dntp(3’-o-rox-peg4-偶氮触发物-dgtp)、3’-o-锚-ss(dtm)触发物-dntp(3’-o-生物素-ss(dtm)触发物-dttp)、3’-o-锚-偶氮触发物-dntp(3’-o-生物素-偶氮触发物-dctp)和合适的染料标记的锚结合分子(rox标记的链霉亲和素)进行1-色sbs的方案xxviii的示意图。步骤1,将dna聚合酶和四种3'-o-染料/锚-连接的-可切割的触发物-dntp类似物(3′-o-rox-peg4-ss(dtm)触发物-datp、3'-o-rox-peg4-偶氮触发物-dgtp、3'-o-生物素-ss(dtm)触发物-dttp、3'-o-生物素-偶氮触发物-dctp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成;步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3′-o-叔丁基二硫代甲基(ss)-datp、3'-o-叔丁基二硫代甲基(ss)-dctp、3'-o-叔丁基二硫代甲基(ss)-dttp和3'-o-叔丁基二硫代甲基(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss(dtm)-核苷酸类似物掺入到在步骤1中没有用任何染料连接的dntp类似物延伸的生长中的dna链的子集中;步骤3,在洗涤除去任何未掺入的核苷酸类似物后,进行成像将非具体地表明掺入了a或g。步骤4,与rox标记的链霉亲和素一起温育。步骤5,洗去过量的标记的锚结合分子后,进行成像。新的rox信号的出现将非具体地表明掺入了c或t。步骤6,用连二亚硫酸钠进行切割以切断g或c上的偶氮键,同时恢复用g或c延伸的dna分子上的3′oh。步骤7,洗涤除去过量的切割剂后,进行成像。如果确定在步骤3中掺入了a或g,则丢失rox信号将表明掺入了g,而信号的保留将表明掺入了a。类似地,如果在步骤5中确定掺入了c或t,rox信号的丢失将表明掺入了c,而信号的保留将表明掺入了t。步骤8,使用dtt、tcep或thp进行二硫键的切割,以去除引物上所有剩余的染料并恢复任何用a或t延伸的dna分子上的3′-oh。此时,延伸产物现已准备好用于后续的sbs的循环。洗去切割剂后,重复步骤1至步骤8,以继续进行后续的单-色dnasbs的循环。该方案中使用的修饰的核苷酸的结构如图108所示。
从前述内容应该理解,尽管已经示出和描述了特定的实施方式,但是可以对其进行各种修改并且在本文中构想了各种修改。例如,本文公开的方案的其他变型可能是:例如,(a)某些可切割的接头可以是触发物分子,而另一些可以是常规的可切割的接头(无分支的);(b)杂交方法,其中用于一种、两种或三种核苷酸类似物的触发物可切割的接头位于3'位置处,用于其余核苷酸类似物的标准可切割的接头连接至碱基。特别是在使用锚的情况下,连接至锚结合分子的标记可以包括能量转移染料,包括拉曼标签的非荧光标记,以及如先前的pct中所述,将纳米孔中的离子电流信号降低到不同程度、在离子通道内具有不同的停留时间或者两者兼而有之的标签组。
用于各种方案的核苷酸类似物和其他分子的化学结构如图105-109中所示。所述分子的化学合成方案如图110-118中所示。
可以在表3中找到其他可能的锚和锚结合分子的示例(在某些情况下,它们可以互换,例如,炔或环辛炔锚和叠氮化物锚结合分子):
在提供值的范围的情况下,除非上下文另外明确指出,否则应理解,该范围的上限和下限之间的该值的每个居间整数以及该值的每个居间整数的十分之一,以及该范围内的任何其他所述值或居间值都包含在本发明内,除非上下文另外明确指出。某些较小的范围的上限和下限可以独立地包括在该些较小的范围中,并且也包括在本发明内,但要遵守所述范围内的任何明确排除的限制。当所述范围包括一个极限或两个极限时,不包括(i)其中一个或(ii)该两个所包括的极限的范围也包括在本发明中。
本文所述的各种要素的所有组合均在本发明的范围内。本文描述的各种要素的所有子组合也在本发明的范围内。
通过参考以下实验细节将更好地理解本发明,但是本领域技术人员将容易理解,具体实验仅是如在其后的权利要求中更充分地描述的对本发明的说明。在本申请中描述的每个实施方案和特征应该被理解为与包含在其中的每个实施方案都可以进行互换和组合。
实验细节
实施例1:ss接头和偶氮接头的切割相容性。
为了使2-色sbs方法充分起作用,在用连二亚硫酸钠处理以切割偶氮接头时,需要使二硫键(disulfide)接头保持完整。以前有报道说,在室温下不到5分钟即可在10mmna2s2o4中切开偶氮接头(yangetal2010)。
本文公开了使用3'-o-ss-datp-ss-rox(计算值:分子量1344.36da,观察值1345.61)作为模型化合物进行的相容性测试的结果。将2μl的0.1mm3'-o-ss-datp-ss-rox用100μl新制备的25mmna2s2o4(在pbs缓冲液中,[ph7.4])处理,并将混合物在37℃下摇晃30分钟。然后用ziptip进行脱盐,并对产物进行malditofms测量。所得峰显示为1347.37da,表明存在na2s2o4时3'-o-ss-datp-ss-rox的完整性,未观察到切割或降解(图124a-124b)。结果证明,二硫键接头在比切割偶氮接头所需的高得多的连二亚硫酸钠浓度和更长的反应时间下是稳定的。
对3'-ss-dc延伸的ssdna进行了另一个相容性测试。通过在每个经受pcr热循环(65℃下保持30”,45℃下保持30”,38个循环)的pcr反应管中的20μl1xpol缓冲液中加入20pmol外显子8模板、60pmol引物(分子量5144)、2mmmncl2和2utherminator9聚合酶进行单碱基延伸实验。掺入完成后,将na2s2o4溶液添加至反应管中至终浓度为20mm,并在室温下温育40分钟。然后将反应混合物用清洁&浓缩器柱(clean&concentratorcolumn)处理,以纯化ssdna。对所得的寡核苷酸进行maldi-tofms测量。结果表明,将3'-ss-dc掺入了5144引物中,得到未经nas2o4处理的ms峰为5559da的掺入产物。nas2o4处理后的单碱基延伸的寡核苷酸也显示了相同的5559da的ms峰,没有发现额外的切割峰。结果表明,在nas2o4处理以切割偶氮接头后,dna和ss键均保持完整。因此,偶氮和二硫键接头的组合可用于正交切割和2-色以及1-色sbs。
实施例2:用于dna引物偶氮接头生物素缀合物的连二亚硫酸钠切割条件。
本专利申请的许多核苷酸类似物具有在碱基与染料或锚分子之间的含有偶氮的接头。连二亚硫酸钠可用于切割偶氮键(yangetal2010)。使用单独的系统(该系统利用寡脱氧核苷酸和生物素之间的含有偶氮的接头)来确定进行连二亚硫酸盐切割的最佳条件。这项研究的更高目标是开发一种无需断开生物素-链霉亲和素键就可以从链霉亲和素珠中捕获并释放dna的方法、一种在足够温和的条件下对于用于dna、蛋白和其他有机分子而言效率不高的工艺。因此,这意味着是一般的富集方法。本文公开了生物素-偶氮接头-dna化合物的合成和导致偶氮键的完全切割的连二亚硫酸钠条件。
1.生物素-peg4-偶氮接头-dna的合成。如图125所示,进行了生物素-peg4-偶氮接头nhs酯的合成。生物素-peg4-nhs酯与氨基偶氮接头苯甲酸反应生成生物素-偶氮接头-苯甲酸,并进一步通过用dsc处理将其转化为生物素偶氮接头nhs酯。然后将氨基修饰的18聚体寡核苷酸用生物素偶氮接头nhs酯处理,得到dna引物-偶氮接头-生物素缀合物(图126)。预期的dna偶氮生物素缀合物通过hplc纯化并干燥以进行实验测试。
2.dna引物-偶氮接头-生物素缀合物的切割试验(图127)。用na2s2o4处理后,偶氮接头将被切割,dna可从生物素中释放出来。测试了多种切割条件以优化用于所需生物学应用的切割时间和温度。(例如,如果生物素化的寡核苷酸是引物,则其可用于富集用于纳米孔sbs的聚合酶、引物、模板和核苷酸的三元复合物。)在1xpbs缓冲液(ph7.4)中制备na2s2o4的储备溶液(1m),然后将1.25μl和5μl之间的na2s2o4储备溶液(1m)添加到dna溶液(21-32μl)中,并用pbs缓冲液补足至50μl的最终体积。切割反应混合物在不同温度和不同时间长度下进行温育。发现用于定量切割的na2s2o4切割剂的最低工作浓度为25mm。在该浓度下筛选时间和温度条件,如下所述。
条件1:na2s2o4:25mm,温度:室温,时间:30分钟,导致大约80%的切割
1.25μl1mna2s2o4,dna32μl(300ng/μl),5μl10xpbs,补至50μl
条件2:na2s2o4:25mm,温度:30℃,时间:15分钟,导致100%的切割
1.25μl1mna2s2o4,dna21μl(300ng/μl),5μl10xpbs,补至50μl
条件3:na2s2o4:25mm,温度:37℃,时间:0.5分钟,导致100%的切割
1.25μl1mna2s2o4,dna32μl(300ng/μl),5μl10xpbs,补至50μl
hplc用于监测切割结果。图128a表示切割前的hplc谱图,图128b表示切割后的hplc谱图。在上述条件2和条件3下,没有剩余的初始引物-偶氮接头-生物素分子的痕迹。出现一个保留时间更短的新的峰,表明切割产物。
实施例3:使用3'-oh被保护的核苷酸可逆终止子(nrt)、一种锚和两种可切割的接头,边合成边进行单-色荧光测序(sbs)。
在该1-色sbs方案中,在以图32a-32d所示的并且如上文中更详细的描述的方案ii的方式中,需要四种核苷酸类似物:一种nrt具有通过可切割的接头1连接至碱基的染料,一种nrt具有通过可切割的接头2连接至碱基的染料,一种nrt具有通过可切割的接头1连接至碱基的锚,一种nrt具有通过可切割的接头2连接至碱基的锚;这些核苷酸的通用结构如图129所示。所用方案的一般设计如图130所示。该方案由以下组成:用四种nrt进行延伸,用带有相同染料的锚结合分子进行标记,切割可切割的接头2,和最终切割可切割的接头1(并且恢复3'-oh基团)。如果掺入了具有染料和可切割的接头1的nrt,则在延伸步骤后它将显示荧光,并保留此荧光直至第二个切割步骤完成。如果掺入了具有染料和可切割的接头2的nrt,则在延伸步骤后将看到荧光,并且在第一个切割步骤后将丢失荧光。如果掺入了具有锚和可切割的接头1的nrt,则直到标记步骤之后才能看到荧光,并且直到第二个切割步骤之后才会丢失荧光。如果掺入了具有锚和可切割的接头2的nrt,则直到标记步骤之后才能看到荧光,并且在第一个切割步骤之后荧光会丢失。
对于数字读数,其中1代表明显高于背景荧光的外观,0代表仅背景荧光,可以考虑以下三个成像步骤:(1)延伸后成像;(2)标记后成像;(3)第一次切割后成像。因此,第一种nrt将显示111模式,第二种nrt将显示110模式,第三种nrt将显示011模式,第四种nrt将显示010模式。这四种唯一代码使得能够进行碱基识别(base-calling)。
从技术上讲,标记步骤之后的成像不是必需的,因为它只是确认性的,唯一的编码模式11、10、01和00仅从延伸和第一次切割步骤之后的成像中获得。第二次切割后的成像对于碱基识别也不是必须的,因为所有四种核苷酸此时都将显示背景荧光(0)。
在该实施例中,合成并表征了具有图131中所示结构的四种nrt类似物:(1)3'-o-叔丁基-ss(dtm)-dttp-peg4-偶氮-cy5;(2)3'-o-叔丁基-ss(dtm)-dgtp-ss-cy5;(3)3'-o-叔丁基-ss(dtm)-datp-peg4-偶氮-生物素;(4)3'-o-叔丁基-ss(dtm)-dctp-ss-生物素。标记分子是链霉亲和素-cy5。
实施例3a:3'-o-叔丁基-ss(dtm)-dttp-peg4-偶氮-cy5的合成(图132)。
由原料酪胺和4-氨基苯甲酸制备偶氮接头。在用tfa保护酪胺上的氨基基团和4-氨基苯甲酸的亚硝基化以形成重氮盐之后,将这些化合物偶联以形成偶氮化合物,然后将偶氮化合物偶联至peg4接头。这是偶氮接头的稳定形式,可以存储以连接各种核苷酸类似物。在这种情况下,将其转化为nhs酯,并与3'-o-叔丁基-ss-dttp-炔丙基-nh2偶联。除去tfa基团后,将所得化合物与磺基-花青5-nhs酯偶联以产生所需化合物。该方法的详细说明如下所述。图133示出了用于确认正确分子的合成的maldi-tofms迹线(trace)。
3.酪胺上氨基基团的保护:酪胺和4-氨基苯甲酸被用作合成基于偶氮-苯的接头的原料。酪胺上的氨基基团最初以三氟乙酰胺(a1)的形式被保护。将酪胺(500mg,3.65mmol)悬浮在5ml二氯甲烷(dcm)中。向悬浮液中加入三氟乙酸酐(761μl,5.47mmol)和吡啶(587.3μl,7.3mmol),将其在室温下搅拌过夜。通过tlc(dcm:meoh=10:1)监测反应直至反应完成。将10ml饱和nahco3溶液添加至反应混合物以终止反应,然后用dcm(5×50ml)进行萃取。合并所有有机层,经na2so4干燥并在真空下浓缩。残余物通过快速柱色谱纯化。获得760mg的al,其通过1h-nmr表征。
4.重氮盐形成偶氮化合物(a2)的偶联反应:伯芳族胺与亚硝酸钠和强酸(盐酸)在0℃下进行亚硝基化反应生成重氮盐。由亚硝酸钠解离而形成的亚硝鎓离子被4-氨基苯甲酸上的氨基攻击形成重氮盐。重氮盐是通过偶氮偶联制备偶氮化合物的中间体。芳族化合物上的羟基基团是强的对位、邻位直接取代基:取代发生在苯酚的邻位上,而对位被保护。
将4-氨基苯甲酸(895mg,6.53mmol)悬浮在25ml6mhcl中,并在冰浴中冷却。缓慢加入nano2(1.13g,16.3mmol),并将悬浮液在0℃下搅拌40分钟。将三氟-n-(2-(羟基-苯基)-乙基)-乙酰胺(a1)(761mg,3.27mmol)溶于32ml1:1的四氢呋喃(thf):nahco3饱和水溶液中,并在冰浴中冷却。将上述制备的重氮盐溶液在搅拌下于0℃分批加入。监测ph并根据需要通过添加k2co3来保持碱性。将反应混合物温热至室温并搅拌过夜。混合物变成深红色。之后,真空除去thf,并用2mhcl将ph调节至2。用乙酸乙酯(3×50ml)萃取反应混合物,合并萃取物,用1mhcl(30ml)和盐水(30ml)进行洗涤,然后用mgso4干燥并真空浓缩。残余物通过快速柱色谱纯化两次(dcm:meoh=10:1),得到橙色固体状的化合物a2(360mg,0.9mmol)。产物通过1hnmr和hrms表征(c17h14f3n3o4:381.09da,实测值:381.1da)。
在偶氮接头的氨基基团上添加peg4接头(a4):将tfa-nh-偶氮-cooh(a2)(38mg,99.73μmol)溶解在dmf中。向溶解的溶液中加入n’n-二环己基碳二亚胺(dcc)(23.048mg,111.706μmol)、n-羟基琥珀酰亚胺(17.22mg,149.6μmol)和4-二甲基氨基吡啶(dmap)(12.184mg,99.73μmol)。通过薄层色谱法监测反应。当nhs酯类似物a3的转化率达到50%时,将预先溶解在dmf中的胺-peg4-cooh(17.61mg,66.486μmol)加入到反应混合物中。在35℃下搅拌反应过夜。使用反相hplc(hfip缓冲液和meoh)纯化化合物a4,并通过hrms进行表征(c28h36f3n4o9:628.24da,实测值esi+:629.24da)。
peg4-偶氮接头与修饰的核苷酸上的炔丙基接头的缀合(a5):向dmf溶解的tfa-偶氮-peg4-cooh(a4)(1.75mg,2.785μmol)中,加入n,n'-二琥珀酰亚胺基碳酸酯(dsc)(0.856mg,3.34μmol)和4μl的dipea。通过tlc监测反应。在35℃搅拌半小时后,将溶于nahco3/na2co3缓冲液(ph8.6)中的3'-o-叔丁基-ss-dttp-peg4-偶氮-炔丙基-nh2添加到反应混合物中。过夜进行反应。通过c18柱将得到的产物a5,3'-o-叔丁基-ss-dttp-peg4-偶氮-tfa脱盐,然后进行反相hplc纯化(hfip缓冲液和meoh)。化合物a5通过malditofms+表征(c45h61f3n7o22p3s2:1265.25da,实测值1265.25da)。
荧光染料花青5与修饰的核苷酸的氨基基团的连接(a7):通过在300μl氢氧化铵中去除三氟乙酸基团来实现化合物a5,3'-o-叔丁基-ss-dttp-peg4-偶氮-tfa(0.5mg,0.395mol)上的氨基基团的再生。在30℃下搅拌反应5小时。malditofms谱中的1175da(计算值:1169.27)主峰反映了氨基基团成功脱去保护(a6)。向溶解在nahco3/na2co3缓冲液中的化合物a6(~0.5mg,0.395μmol)中加入预先溶解在dmf中的磺基-花青5-nhs酯(1.29mg,1.66μmol)。将反应混合物在37℃避光下搅拌过夜,并使用反相hplc进行纯化。maldi-tofms证实形成了化合物a7,其主峰位于1794.4da(计算值:1794.45da)。
实施例3b:3'-o-叔丁基-ss-dttp-peg4-偶氮-cy5的单碱基掺入,延伸的引物3′-o-叔丁基-ss-dttp-peg4-偶氮-cy5的偶氮接头切割结果,和3′-o-叔丁基-ss-dttp-peg4-偶氮-cy5延伸的引物的二硫键切割反应(图134a-134c)
使用引物(5'-gataggactcatcacca-3′[seqid1])和基于人p53基因的外显子8的一部分的合成dna模板(5′-gaaggagacacgcggccagagagggtcctgtccgtgtttgtgcgtggagttcgacaaggcagggtcatctaatggtgatgagtcctatccttttctcttcgttctccgt-3’[seqid2]),与3'-o-ss(dtm)-dttp-peg4-偶氮-cy5进行如下的单碱基dna延伸反应(sbe)。模板中的粗体字母代表引物的延伸位置。将2μl10x浓缩缓冲液、1μl引物、e8tt(分子量:5163,100μm)、3μl外显子8模板(20μm)、1μl核苷酸(3'-o-叔丁基-ss-dttp-peg4-偶氮-cy5,432μm)、1μltherminatorixdna聚合酶、t9(10u/λ)和12μldh2o合并在一起,总体积为20μl。反应包括在65℃下持续30秒和45℃下持续30秒的38个循环。maldi-tofms证实了单碱基延伸,如图谱中6791.8da(计算值,6782.4da)处的主峰所示。没有观察到引物峰(5163da),表明基本上所有引物都被延伸并且掺入率为100%。
如图134a所示,引物链以基本上100%的效率延伸(看不到引物峰)(反应细节在下面的详细方法中提供)。而且,叔丁基-ss-甲基基团是有效的阻断物,因为尽管模板中连续存在两个a,但仅发生了一个单碱基延伸反应。
在单碱基延伸的引物(e8tt+3'-o-叔丁基-ss-dtmp-peg4-偶氮-cy5,6782.4da)上进行偶氮切割反应。在1xpbs缓冲液(ph7.4)中制备1mna2s2o4储备溶液。将1.25μlna2s2o4溶液与28.75μl1xpbs缓冲液一起添加到延伸的引物溶液(20μl,32μm)中。将反应混合物在37℃下温育并搅拌20分钟。然后,将反应混合物用ziptip纯化,并使用speedvac进行浓缩。切割的延伸的引物的大小通过maldi-tofms表征为6009.44da(计算值:6008.9da)。如图134b所示,在37℃下用25mm的连二亚硫酸钠处理20分钟可导致接头的完全切割(延伸的引物的峰完全消失)。
将三(羟丙基)膦(thp)(1μl,1mm)添加至偶氮切割的延伸的引物(9μl,15μm)(e8tt+3'-o-叔丁基-ss-dtmp-peg4-苯胺,6009.44da)中。反应在65℃下进行25分钟。在基于旋转柱的核酸纯化后(zymopureoligoclean&concentrator),通过maldi-tofms确认产品:5881.4da(计算值:5874.9da)。如图134c所示,在65℃下用1mmthp处理5分钟可以高效地除去保护基团。
实施例3c:3'-o-叔丁基-ss(dtm)-datp-peg4-偶氮-生物素的合成(图135)。
用实施例3a中的接头的nhs酯和3'-o-叔丁基-ss-datp-炔丙基-nh2开始合成,并且以与实施例3a相同的方式进行合成,不同之处在于在最后的偶联步骤中使用生物素-nhs酯。该方法的详细描述如下。图136示出了用于确认正确分子的合成的maldi-tofms迹线。
5.酪胺上氨基基团的保护:酪胺和4-氨基苯甲酸被用作合成基于偶氮-苯的接头的原料。酪胺上的氨基基团最初以三氟乙酰胺(a1)的形式被保护。将酪胺(500mg,3.65mmol)悬浮在5ml二氯甲烷(dcm)中。向悬浮液中加入三氟乙酸酐(761μl,5.47mmol)和吡啶(587.3μl,7.3mmol),将其在室温下搅拌过夜。通过tlc(dcm:meoh=10:1)监测反应直至反应完成。将10ml饱和nahco3溶液添加至反应混合物以终止反应,然后用dcm(5×50ml)进行萃取。合并所有有机层,经na2so4干燥并在真空下浓缩。残余物通过快速柱色谱纯化。获得760mg的al,其通过1h-nmr表征。
6.重氮盐形成偶氮化合物(a2)的偶联反应:伯芳族胺与亚硝酸钠和强酸(盐酸)在0℃下进行亚硝基化反应生成重氮盐。由亚硝酸钠解离而形成的亚硝鎓离子被4-氨基苯甲酸上的氨基攻击形成重氮盐。重氮盐是通过偶氮偶联制备偶氮化合物的中间体。芳族化合物上的羟基基团是强的对位、邻位直接取代基:取代发生在苯酚的邻位上,而对位被保护。
将4-氨基苯甲酸(895mg,6.53mmol)悬浮在25ml6mhcl中,并在冰浴中冷却。缓慢加入nano2(1.13g,16.3mmol),并将悬浮液在0℃下搅拌40分钟。将三氟-n-(2-(羟基-苯基)-乙基)-乙酰胺(a1)(761mg,3.27mmol)溶于32ml1:1的四氢呋喃(thf):nahco3饱和水溶液中,并在冰浴中冷却。将上述制备的重氮盐溶液在搅拌下于0℃分批加入。监测ph并根据需要通过添加k2co3来保持碱性。将反应混合物温热至室温并搅拌过夜。混合物变成深红色。之后,真空除去thf,并使用2mhcl将ph调节至2。用乙酸乙酯(3×50ml)萃取反应混合物,合并萃取物,用1mhcl(30ml)和盐水(30ml)进行洗涤,然后用mgso4干燥并真空浓缩。残余物通过快速柱色谱纯化两次(dcm:meoh=10:1),得到橙色固体状的化合物a2(360mg,0.9mmol)。产物通过1hnmr和hrms表征(c17h14f3n3o4:381.09da,实测值:381.1da)。
3.在偶氮接头的氨基基团上添加peg4接头(a4):将tfa-nh-偶氮-cooh(a2)(38mg,99.73μmol)溶解在dmf中。向溶解的溶液中加入n’n-二环己基碳二亚胺(dcc)(23.048mg,111.706μmol)、n-羟基琥珀酰亚胺(17.22mg,149.6μmol)和4-二甲基氨基吡啶(dmap)(12.184mg,99.73μmol)。通过薄层色谱法监测反应。当nhs酯类似物a3的转化率达到50%时,将预先溶解在dmf中的胺-peg4-cooh(17.61mg,66.486μmol)添加到反应混合物中。在35℃下搅拌反应过夜。使用反相hplc(hfip缓冲液和meoh)纯化化合物a4,并通过hrms进行表征(c28h36f3n4o9:628.24da,实测值esi+:629.24da)。
peg4-偶氮接头与修饰的核苷酸上的炔丙基接头的缀合(a5):向dmf溶解的tfa-偶氮-peg4-cooh(a4)(14.71mg,23.4μmol)中,加入n,n′-二琥珀酰亚胺基碳酸酯(dsc)(7.2mg,28μmol)和8μl的dipea。通过tlc监测反应。在35℃搅拌半小时后,将溶于nahco3/na2co3缓冲液(ph8.5)中的3′-o-叔丁基-ss-datp-炔丙基-nh2(1mg,1.47μmol)添加到反应混合物中。过夜进行反应。将得到的产物a5,3′-o-叔丁基-ss-datp-peg4-偶氮-tfa,在室温下使用teab梯度(ph8.0;0.1-1.0m)通过deae-sephadexa-25上的阴离子交换柱进行纯化,然后进行反相hplc纯化(hfip缓冲液和meoh)。化合物a5通过malditofms+表征(c47h63f3n9o20p3s2:1288.28da,实测值1288.23da)。
生物素与修饰的核苷酸的氨基基团的连接(a7):通过在300μl氢氧化铵中除去三氟乙酸基团来进行化合物a5,3'-o-叔丁基-ss-datp-peg4-偶氮-tfa(0.51mg,0.428μmol)□上的氨基基团的再生。在25℃下搅拌反应3小时。malditofms谱中的1197.2da(计算值:1191.3)主峰反映了氨基基团成功脱去保护(a6)。向溶解在nahco3/na2co3缓冲液中的化合物a6(~0.51mg,0.428μmol)中加入预先溶解在dmf中的磺基-生物素-nhs酯(1.898mg,4.28μmol)。将反应混合物在25℃避光下搅拌过夜,并先使用c18柱纯化,然后进行反相hplc纯化。maldi-tofms证实形成了化合物a7,其由1417.3da(计算值:1417.3da)处的峰指示。
实施例3d:3'-o-叔丁基-ss-datp-peg4-偶氮-生物素的单碱基延伸和3'-o-叔丁基-ss-datp-peg4-偶氮-生物素延伸的引物的偶氮接头的切割(图137a-137b)。
使用合成的3'-o-叔丁基-ss-datp-peg4-偶氮-生物素进行单碱基延伸反应。将引物e8aa-6084(5'-tagatgaccctgccttgtcg-3',位于6084da处)、外显子8模板(参见上述序列)和therminatorixdna聚合酶(t9)与修饰的核苷酸一起加入。在3'-o-叔丁基-ss-datp-peg4-偶氮-生物素(a7)掺入反应中,引物被延伸至7327.4da(预计为7326.3da)。反应38个循环后,使用malditofms未检测到引物峰。掺入结果表明therminatorixdna聚合酶可以识别合成的带有偶氮基的核苷酸,并将其高效地掺入到引物上。
如图137a所示,引物链基本上以100%的效率延伸(看不到引物峰)(反应细节在下面的详细方法中提供)。而且,叔丁基-ss-甲基基团是有效的阻断物,因为尽管模板中连续存在两个t,但仅发生了一个单碱基延伸反应。
用25mm连二亚硫酸钠在1xpbs缓冲液中处理单碱基延伸的引物(6084exaa+3'-o-叔丁基-ss-damp-peg4-偶氮-生物素,7327.4da)。在37℃下搅拌10分钟后,延伸的引物通过malditofms证实被切割。偶氮切割产物表现出6951.1da的分子量,这与6952.3da的预期值一致。如图137b所示,在光谱中未观察到起始的延伸的引物峰(7327.4da),这表明在1-色sbs期间可以用na2s2o4溶液有效切割带有偶氮-苯接头的核苷酸。
实施例3e:3'-o-叔丁基-ss(dtm)-dgtp-ss-cy5和3'-o-叔丁基-ss(dtm)-dctp-ss-生物素的合成。
制备3'-o-叔丁基-ss(dtm)-dntp-ss-nh2化合物,并与实施例3a和实施例3c所述完全相同,将它们连接至磺基-花菁5-nhs酯或生物素-nhs酯。图138-139示出了用于确认正确分子的合成的maldi-tofms迹线。
实施例3f:使用具有偶氮和ss接头以及生物素和cy5的所有组合的正交集的核苷酸可逆终止子进行单-色边合成边测序(图140a-140c)。
根据图140a-140c中所示的示意图,使用3’-o-dtm(ss)-dntp-可切割的接头-染料(3’-o-dtm(ss)-dttp-偶氮-cy5、3’-o-dtm(ss)-dgtp-ss-cy5)、3’-o-dtm(ss)-dntp-可切割的接头-锚(3’-o-dtm(ss)-datp-偶氮-生物素、3’-o-dtm(ss)-dctp-ss-生物素)和锚结合分子-染料(链霉亲和素-cy5)进行1-色dnasbs。步骤1,将dna聚合酶和四种核苷酸类似物(3'-o-dtm(ss)-dttp-偶氮-cy5、3'-o-dtm(ss)-dgtp-ss-cy5、3'-o-dtm(ss)-datp-偶氮-生物素、3'-o-dtm(ss)-dctp-ss-生物素)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到生长中的dna链中以终止dna合成。步骤2,追加:将dna聚合酶和四种3'-o-ss(dtm)-dntp(3'-o-dtm(ss)-datp、3'-o-dtm(ss)-dctp、3'-o-dtm(ss)-dttp和3'-o-dtm(ss)-dgtp)加入到固定的引发的dna模板中使得能够将互补的3'-o-ss-核苷酸类似物掺入到在步骤1中没有用任何染料标记的dntp延伸的生长中的dna链的子集中。生长中的dna链被四种染料标记的核苷酸类似物(a、c、g、t)中的一种或不具有染料的四种核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,在洗掉未掺入的染料标记的核苷酸之后,进行成像步骤。阳性信号将表明掺入了t或g。步骤4,用链霉亲和素-cy5进行标记以将cy5连接于a和c。步骤5,在洗去未使用的标记试剂后,进行第二个成像步骤。获得cy5信号表明掺入了a或c。步骤6,通过向延长的dna链添加连二亚硫酸钠(na2s2o4)来切割偶氮接头,导致从掺入的a和t中去除cy5。步骤7,洗掉切割下的染料后,进行第三轮成像。cy5信号的丢失表明在先前确定掺入了g或t的情况下t的掺入,以及在先前确定掺入了a或c的情况下a的掺入。步骤8,通过向延长的dna链添加thp来切割ss接头,从而去除了所有剩余的染料(在c和g上),并且还恢复了追加步骤中用3'-o-ss(dtm)-dntp延伸的任何生长链上的3'-oh基团。步骤9,洗掉切割下的染料后,进行任选的最后一轮成像。dna产物已准备好用于dna测序反应的下一个循环。此方案中使用的核苷酸的结构如图131所示。在每个步骤的成像图(cartoon)中,黑色表示阳性cy5信号,白色表示阴性信号。请注意,末尾处的总结图(summarycartoon)中的编码表示模板序列,而不是掺入的核苷酸。
使用载玻片固定的模板进行单-色边合成边测序的第一个循环的结果(图142):
每个循环包括图130和图140a-140c中所示的步骤,其利用图132中所示的核苷酸类似物和标记分子,模板的排列如图141所示。此处显示了图142顶部四个区域的结果。
首先,使用therminatorix聚合酶用带有ss或偶氮接头和生物素或cy5的四种3'-o-dtm(ss)-dntp进行延伸。左上部的结果图像示出了左侧两个区域的高信号强度平均值(3,907和3,266au),以及右侧两个区域的背景信号(690和590au)。由于只有t和g的dntp类似物具有cy5,因此左侧区域必定展现出掺入了t或g,而右侧区域表明掺入了a或c。用cy5-链霉亲和素标记后,可获得左下方所示的图像,此时所有四个区域都显示出较高的信号强度(3,931、3,346、2,306和2,357;请注意,应在同一成像步骤中比较信号强度,以说明步骤特异性丧失)。接下来,用连二亚硫酸钠切割偶氮接头,得到右下方的图像。中间的两个区域保留了较高的平均信号强度(2,647和1,781au),而左侧区域和右侧区域此时具有背景荧光强度(581和1,285au)。由于只有a和t的dntp类似物具有偶氮接头,因此从左到右将这四个区域中的掺入定义为t、g、c和a。最后,进行ss接头的切割和任何掺入的dntp类似物上的保护基团的去除,以准备第二个sbs循环。鉴于四个模板的序列,获得的结果正是预期的结果。每个循环中与前3个成像步骤相关的数字代码(1表示阳性信号,0表示背景信号)用于鉴别掺入的核苷酸类似物。因此,在该实施例中,010表示a,011表示c,111表示g,110表示t。
实施例4:聚合物标记的ddntp。
将寡核苷酸聚合物缀合至嘧啶(c和u)的5位和嘌呤(a和g)的7位。为了合成这些分子,首先,如duthie等(2002)所述,用氨基己酸-n羟基琥珀酰亚胺(nhs)酯延伸用于c/u的5-炔丙基氨基-ddntp和用于a/g的7-炔丙基氨基-ddntp,以在ddntp上安装氨基延伸的链。产物通过反相hplc进行纯化。为了使用点击化学方法连接聚合物标签,基于炔烃与叠氮化物之间的环加成反应,通过使延伸的ddntp与叠氮丁酸-nhs酯反应引入叠氮基团。将反应混合物在室温下搅拌过夜,并通过hplc使用0.1m乙酸三乙铵(teac)缓冲液(ph7.5)和乙腈梯度进行纯化,以提供叠氮延伸的ddntp。使每个5′-己炔基-寡核苷酸标签(由trilink定制合成,在200μlh2o中为500nmol)与相应的ddntp-n3核苷酸(750nmol)反应,然后添加溴化铜(50μl,3:1dmso/叔丁醇中的0.1m溶液)和三[(1-苄基-1h-1,2,3-三唑-4-基)甲基]胺(tbta)(100μl,3:1dmso/叔丁醇中的0.1m溶液)。将反应混合物在40℃下搅拌16小时,并通过hplc使用0.1mteac缓冲液(ph7.5)和乙腈梯度进行纯化,并通过maldi-tofms分析对最终产物进行表征。
可切割的接头-阻断物-染料-dntp和可切割的接头-阻断物-et染料的合成:图90-91示出了具有连接到嘧啶(c和u)的5-位和7-脱氮嘌呤(a和g)的7-位的可切割的接头-阻断物部分-染料的脱氧核苷-5'-三磷酸的合成。在无水dmf中,在三苯膦pd(0)、cui和三乙胺的存在下,使5(7)-碘代-2'-脱氧核苷与可切割的接头反应(juetal(2016)wo2016/154215a1)。所得核苷被三磷酸化并用nh4oh水解以除去氨基保护基团。使这些氨基封端的可切割的接头连接的dntp与叠氮丁酸-nhs酯进一步反应以提供n3-封端的dntp,并通过hplc进行纯化。
使用标准亚磷酰胺化学方法,在dna合成仪上合成在5'-末端具有炔基的阻断物核苷酸(图90-91)。在染料连接于炔基封端的阻断物核苷酸后,它与上述叠氮基-封端的dntp反应。对于fret,可以使用标准亚磷酰胺化学方法合成具有一个或多个供体或受体染料或锚和供体染料的et染料盒(juetal1996)(图96)。
筛选用于掺入聚合物标记的ddntp的几种dna聚合酶:为寻找可识别并掺入聚合物标记的ddntp类似物的聚合酶,筛选了已知具有掺入修饰的ddntp的能力的五种dna聚合酶(therminatorii、therminatoriii、klenow、测序酶2.0和热测序酶),用于使用自引发的环状模板和相对于模板的不同比例的聚合物标记的ddntp的sbe。这些模板的序列如下:用于t的5'-cgcggcgcggggttccgcgccgcgagagct-3'[seqid3],和用于c的5'-cgcggcgcggttccgcgccgcgcggcta-3'[seqid4]。反应在37℃下在包含1μm模板、4单位的热测序酶(affymetrix)和20或30μm标记的ddntp的20μl体积下进行1小时。还研究了与5个单位的klenow(外切-)(newenglandbiolabs)、13个单位的测序酶2.0(affymetrix)或4个单位的therminatorii或iii(neb)和具有相同的模板浓度和标记的ddntp的反应。通过8m尿素15%聚丙烯酰胺凝胶电泳分析延伸产物。结果示于图143中,表明了它们被热测序酶掺入的特别高的能力。
使用荧光测定法的核苷酸活性的动力学测量
用引物、热测序酶、dctp和各种稀释度的ddctp或标记的ddctp准备延伸反应。首先,进行一系列sbe反应,最终ddctp浓度范围为0至10μm,dctp浓度为10μm,标记的引物浓度为0.3μm。在这些条件下,引物通过dctp的掺入而延伸,直到遇到ddctp掺入。接下来,在浓度范围为0至5μm的聚合物标记的ddctp的存在下,使用5μmdctp和0.3μm标记的引物进行相同的实验。在spectramax3酶标仪(moleculardevices,llc)上测量荧光强度。结果在图144中提供,其证明了热测序酶可以与常规ddctp一样有效地掺入在碱基上包含非常长的修饰的ddctp类似物。
实施例5:使用杂交方法用未标记的nrt和荧光ddntp、一种锚和两种可切割的接头进行单-色荧光边合成边测序(sbs)
在这种1-色sbs方案中,以上述方案x的方式,需要八种核苷酸类似物:四种3'-o-叠氮基甲基nrt和四种ddntp类似物,其中一种具有通过可切割的接头1连接于碱基的染料,一种具有通过可切割的接头2连接于碱基的染料,一种具有通过可切割的接头1连接于碱基的锚,一种具有通过可切割的接头2连接于碱基的锚。这些核苷酸的通用结构如图145所示(注意它们与图129中那些核苷酸的相似性)。一般的设计如图146所示(同样,注意与图130中所示的方案相似性),由以下组成:用四种nrt进行延伸,用带有相同染料的锚结合分子进行标记,切割可切割的接头2,和最终切割可切割的接头1(也可恢复3'-oh基团)。如果掺入了具有染料和可切割的接头1的ddntp类似物,它将在延伸步骤后显示荧光,并保持该荧光直至第二个切割步骤完成。如果掺入了具有染料和可切割的接头2的ddntp类似物,则在延伸步骤后将看到荧光,而在第一个切割步骤后将丢失荧光。如果掺入了具有锚和可切割的接头1的ddntp类似物,则直到标记步骤之后才能看到荧光,且直到第二个切割步骤之后才丢失荧光。如果掺入了具有锚和可切割的接头2的ddntp类似物,则直到标记步骤之后才能看到荧光,并且在第一个切割步骤之后荧光会丢失。
对于数字读数,其中1代表明显高于背景荧光的外观,0代表仅背景荧光,考虑以下三个成像步骤:延伸后成像、标记后成像和第一次切割后成像。因此,第一种ddntp类似物将显示111模式,第二种ddntp类似物将显示110模式,第三种ddntp类似物将显示011模式,第四种ddntp类似物将显示010模式。这四种唯一代码使得能够进行碱基识别。从技术上讲,标记步骤之后的成像对于碱基识别不是必需的,因为它只是确认性的,唯一的编码模式11、10、01和00仅从延伸后成像和第一步切割步骤之后的成像中获得。第二次切割后的成像也不是必需的,因为所有四种核苷酸此时都将显示背景荧光(0)。如将要描述的,叠氮基甲基dntp可以以下述方式添加:(1)与标记的ddntp一起添加,但是比例要高得多;(2)在追加步骤中标记的ddntp之后添加,即使它们已包含在8种核苷酸类似物的先前混合物中;或(3)在用标记的ddntp延伸之前的温育步骤中添加。第三个选项的结果如下所示。
在该实施例中,除了四种3'-o-叠氮基甲基dntp之外,还合成并表征了具有图147a所示结构的以下四种ddntp类似物:(1)ddttp-5-偶氮-cy5;(2)ddgtp-7-ss-cy5;(3)ddatp-7-偶氮-生物素;(4)ddctp-5-ss-生物素。标记分子是链霉亲和素-cy5。但是,此方法可以使用具有除cy5以外的染料、除生物素以外的锚(临时申请中列出的示例)和除ss和偶氮以外的可切割的基团(临时申请中也列出了示例)的ddntp。
实施例5a:用于合成nrt(1)和nrt(3)的基于偶氮-苯的接头(tfa-偶氮-nhs酯)的合成(图148)。
简而言之,进行了一系列以酪胺和tfa保护的氨基己酸nhs酯开始的缩合反应,然后进行4-氨基苯甲酸和tfa-nhs的连接,以形成基于偶氮-苯的接头。下面提供合成的详细描述。
向酪胺(2g,14.6mmol)溶于8ml无水dmf的溶液中加入tfa保护的氨基己酸-nhs酯(22.0mmol)和二异丙基乙胺(30mmol)。将所得混合物在室温下搅拌过夜。通过tlc(dcm:meoh=10:1)监测反应的完成,用水稀释并用dcm(3×50ml)萃取。合并所有有机层,用na2so4干燥并在真空下浓缩。将残余物通过快速柱色谱(硅胶:5%-10%meoh/dcm)进行纯化,得到氨基基团上有tfa保护的六碳链延伸的酪胺,其为类白色固体(3.5g)。
将4-氨基苯甲酸(298mg,2.18mmol)悬浮于9ml6mhcl中,并在冰浴中冷却。缓慢加入nano2(0.38g,5.43mmol),并将悬浮液在0℃下搅拌40分钟,从而形成重氮盐。将tfa-c6-酪胺(377mg,1.09mmol)溶于11ml1:1四氢呋喃(thf):nahco3饱和水溶液,并在冰浴中冷却。将上述制备的重氮盐溶液在搅拌下于0℃分批加入tfa-c6-酪胺中。监测ph并根据需要通过添加nahco3来保持碱性。将反应混合物温热至室温并搅拌过夜。混合物变成棕红色,进行过滤以除去固体,并用1mhcl(3×25ml)洗涤。真空除去thf,并将混合物用乙酸乙酯(3×50ml)萃取。合并萃取物,并用1mhcl(30ml)和盐水(30ml)进行洗涤,用mgso4干燥并真空浓缩。残余物通过快速柱色谱(dcm:meoh=10:1)进行纯化,得到橙色固体状tfa-偶氮接头-酸(188mg)。产物通过hrms表征(c23h25f3n4o5:494.18da,实测值:494.20da)。
将tfa-偶氮接头-酸(100mg)溶于dcm/吡啶(3ml,2:1,v/v)并添加5当量的tfa-nhs。在室温下搅拌2小时后,蒸发溶剂,用20mldcm稀释,并用水(2×20ml)进行洗涤。有机层经无水na2so4干燥,真空浓缩,并在硅胶柱上使用5%meoh/dcm进行纯化,得到预期的tfa-偶氮接头-nhs酯。
实施例5b:ddutp-5-偶氮-cy5的合成(图149)。
简而言之,将实施例3a的接头与ddttp-戊基-炔丙基-nh2偶联。除去tfa基团后,将所得化合物与磺基-花青5-nhs酯偶联以产生所需化合物。下面提供合成的详细描述。图150示出了用于确认正确分子的合成的maldi-tofms迹线。
向溶解在nahco3/na2co3缓冲液(ph8.8)中的11-ddutp(2μmol)的溶液中,加入200μl的偶氮接头nhs酯(在dmf中为10mg)。将反应混合物在室温下搅拌4小时,然后将反应混合物加至deaea-25离子交换柱(2ml)。用0.1m至1m的teac缓冲液(ph8.0)对该柱进行梯度洗脱。收集包含偶氮接头标记的ddutp的级分(fraction)并进行干燥。向所得的偶氮接头标记的ddutp中,加入0.8ml浓氢氧化铵,并将溶液搅拌4小时。然后将反应混合物干燥(速度真空),将所得的残留产物氨基-偶氮接头标记的ddutp重新溶于400μlnahco3/na2co3缓冲液(ph8.8),并添加cy5nhs(5mg)溶于400μldmf中的溶液。将混合物在室温下搅拌过夜,浓缩至300μl体积,并加到硅胶柱(2ml)上,先后用dcm/meoh(4:1,v/v)和异丙醇/氨/水(5:4:1,v/v)进行洗脱。将包含cy5标记的偶氮-ddttp的级分浓缩至干,并使用梯度洗脱(b(meoh)0-67%,a(hfip缓冲液),40分钟)进行c18反相hplc纯化。收集产物峰,进行干燥并通过malditofms+表征(对ddutp-5-偶氮-cy5的计算值:1621.5da,实测值1622.5da)。
实施例5c:ddatp-7-偶氮-生物素的合成(图151)。
用实施例5a中的接头和ddatp-戊基-炔丙基-nh2开始合成,并且以与实施例5b相同的方式进行合成,不同之处在于在最后的偶联步骤中使用生物素-nhs酯。下面提供合成的详细描述。图152示出了用于确认正确分子的合成的maldi-tofms迹线。
向溶解在nahco3/na2co3缓冲液(ph8.8)中的11-ddatp(2μmol)的溶液中,加入200μl的偶氮接头nhs酯(在dmf中为10mg)。将反应混合物在室温下搅拌4小时,然后将反应混合物加至deaea-25离子交换柱(2ml)。用0.1m至1m的teac缓冲液(ph8.0)对该柱进行梯度洗脱。收集包含偶氮接头标记的ddatp的级分并进行干燥。向所得的偶氮接头标记的ddatp中,加入0.8ml浓氢氧化铵,并将溶液搅拌4小时。然后将反应混合物干燥(speedvac),将所得的残留产物氨基-偶氮接头标记的ddatp重新溶于400μlnahco3/na2co3缓冲液(ph8.8),并添加生物素nhs(5mg)溶于400μldmf中的溶液。将混合物在室温下搅拌过夜,浓缩至300μl体积,并加到硅胶柱(2ml)上,先后用dcm/meoh(4:1,v/v)和异丙醇/氨/水(5:4:1,v/v)进行洗脱。将包含生物素标记的偶氮-ddatp的级分浓缩至干,并使用梯度洗脱(b(meoh)0-67%,a(hfip缓冲液),40分钟)进行c18反相hplc纯化。收集产物峰,进行干燥并通过malditofms+表征(ddatp-7-偶氮-生物素的计算值:1246.4da,实测值1242.1da)。
实施例5d:用于合成ddntp(2)和ddntp(4)的基于ss的接头(tfa-ss-nhs酯)的合成(图153)。
将使用确定的方法(参见方案e2s5,上部两行)合成的炔丙基-ss-nh(tfa)(330mg,1.096mmol)溶解在3mldmf中。将cubr(0.1当量,15.63mg,0.01mmol)和tbta(116.31mg,0.02mmol)溶解在1mldmso-叔丁醇(3/1,v/v)中,向ss接头溶液中加入200μlcubr-tbta溶液,然后将溶解在0.5mldmf中的叠氮丙酸(315mg,2.4mmol)加入反应混合物中。将得到的混合物在室温下搅拌过夜。真空蒸发溶剂,并加入乙酸乙酯(3ml)以重悬反应混合物,使用梯度洗脱(用乙酸乙酯/己烷(50/50)、乙酸乙酯然后用乙酸乙酯/meoh(50/1))对该混合物进行硅胶柱纯化。收集预期的产物级分并进行干燥,得到(tfa)nh-ss-nhs接头-酸。对c13h19f3n4o4s2(m/z416.08)进行ms测量;实测值为417(apci-ms,m+1)和416(apci-ms,m-1)。将得到的tfa-ss接头-酸(95mg)溶于dcm/吡啶(1:4,v/v)并添加5当量的tfa-nhs。在室温下搅拌2小时后,蒸发溶剂和吡啶,并向残余物中加入20ml乙酸乙酯。有机相用水(4×10ml)进行洗涤,然后用无水na2so4进行干燥。在真空下除去乙酸乙酯,得到预期的(tfa)nh-ss-接头-nhs酯。
实施例5e:ddgtp-7-ss-cy5的合成(图154)。
简而言之,将实施例5d的接头与ddgtp-戊基-炔丙基nh2偶联。除去tfa基团后,将所得化合物与磺基-花青5-nhs酯偶联以产生所需化合物。下面提供合成的详细描述。图155示出了用于确认正确分子的合成的maldi-tofms迹线。
向溶解在nahco3/na2co3缓冲液(ph8.8)中的11-ddgtp(2μmol)的溶液中,加入200μl的(tfa)nh-ss-接头-nhs(在dmf中为10mg)。将反应混合物在室温下搅拌4小时,然后加至deaea-25离子交换柱(2ml)。用0.1m至1m的teac缓冲液(ph8.0)对该柱进行梯度洗脱。收集包含(tfa)nh-ss接头标记的ddgtp的级分并进行干燥。向所得的(tfa)nh-ss接头标记的ddgtp中,加入0.8ml浓氢氧化铵,并将溶液搅拌2小时。然后将反应混合物干燥(速度真空)。将所得的残留产物氨基-ss接头标记的ddgtp重新溶解在300μlnahco3/na2co3缓冲液(ph8.8)中,并添加cy5nhs(5mg)溶于300μldmf中的溶液。将混合物在室温下搅拌过夜,然后浓缩至300μl体积,并加到deaea-25离子交换柱(2ml)上,用0.1m至1m的teac缓冲液(ph8.0)进行梯度洗脱。将包含cy5标记的ss-ddgtp的级分浓缩至干,并使用梯度洗脱(b(meoh)0-67%,a(hfip缓冲液),40分钟)进行c18反相hplc纯化。收集产物峰,进行干燥并通过malditofms+表征(对ddgtp-7-ss-cy5的计算值:1595.4da,实测值1596.6da)。
实施例5f:ddctp-5-ss-生物素的合成(图156)。
用实施例2d中的接头和ddctp-戊基-炔丙基-nh2开始合成,并且以与实施例5e相同的方式进行合成,不同之处在于在最后的偶联步骤中使用生物素-nhs酯。下面提供合成的详细描述。图157示出了用于确认正确分子的合成的maldi-tofms迹线。
向溶解在nahco3/na2co3缓冲液(ph8.8)中的11-ddctp(2μmol)的溶液中,加入200μl的(tfa)nh-ss-接头-nhs(在dmf中为10mg)。将反应混合物在室温下搅拌4小时,然后将反应混合物加至deaea-25离子交换柱(2ml)。用0.1m至1m的teac缓冲液(ph8.0)对该柱进行梯度洗脱。收集包含(tfa)nh-ss-接头标记的ddctp的级分并进行干燥。向所得的(tfa)nh-ss-接头标记的ddctp中,加入0.8ml浓氢氧化铵,并将溶液搅拌2小时。然后将反应混合物干燥(速度真空)。将所得的残留产物氨基-ss接头标记的ddctp重新溶解在300μlnahco3/na2co3缓冲液(ph8.8)中,并添加生物素-nhs(6mg)溶于300μldmf中的溶液。将混合物在室温下搅拌过夜,然后浓缩至300μl体积,并加到deaea-25离子交换柱(2ml)上,用0.1m至1m的teac缓冲液(ph8.0)进行梯度洗脱。将包含生物素标记的ss-ddctp的级分浓缩至干,并使用梯度洗脱(b(meoh)0-67%,a(hfip缓冲液),40分钟)进行c18反相hplc纯化。收集产物峰,进行干燥并通过malditofms+表征(对ddctp-5-ss-生物素的计算值:1145.2da,实测值1149.9da)。
实施例5g:ddttp-5-偶氮-cy5的高效掺入和切割(图158)。
如图158的左图所示,引物链以基本上100%的效率延伸(看不到引物峰)(详细信息在下面提供)。如图158右图所示,在45℃下用25mm的连二亚硫酸钠处理1分钟导致接头的完全切割(延伸的引物的峰完全丢失)。
实施例5h:ddatp-7-偶氮-生物素的高效掺入和切割(图159)。
如图159的左图所示,引物链以基本上100%的效率延伸(看不到引物峰)(详细信息在下面提供)。如图159的右图所示,在45℃下用25mm的连二亚硫酸钠处理1分钟导致接头的完全切割(延伸的引物的峰完全丢失)。
实施例5i:ddgtp-7-ss-cy5的高效掺入和切割(图160)。
如图160的左图所示,引物链以基本上100%的效率延伸(看不到引物峰)(详细信息在下面提供)。如图160的右图所示,使用thp处理(下面也提供详细信息)导致接头的完全切割(延伸的引物的峰完全丢失)。
实施例5j:ddctp-5-ss-生物素的高效掺入和切割(图161)。
如图161的左图所示,引物链以基本上100%的效率延伸(看不到引物峰)(详细信息在下面提供)。如图161的右图所示,用thp处理(下面也提供详细信息)导致接头的完全切割(延伸的引物的峰完全丢失)。
实施例5g-5j的方法
用于ddatp-7-偶氮-生物素、ddctp-5-ss-生物素和ddttp-5-偶氮-cy5的模板是5’-gaaggagacacgcggccagagagggtcctgtccgtgtttgtgcgtggagttcgacaaggcagggtcatctaatggtgatgagtcctatccttttctcttcgttctccgt-3’[seqid5]。用于这些ddatp类似物、ddctp类似物和ddttp类似物的引物分别是5’-tagatgaccctgccttgtcg-3’[seqid6]、5’-tctctggccgcgtgtct-3’[seqid7]和5’-gataggactcatcacca-3’[seqid8]。模板链中的粗体a、g和t字母是这三个单碱基延伸的引物的互补位置。
用于ddgtp-7-ss-cy5的模板为,用于该ddgtp类似物的引物为5’-tacccggaggccaagtacggcgggtacgtccttgacaatgtgtacatcaacatcacctaccaccatgtcagtctcggttggatcctctattgtgtccggg-3’[seqid9],用于该ddgtp类似物的引物是5’-gttgatgtacacattgtcaa-3’[seqid10]。模板链中的粗体c是该单碱基延伸的引物的互补位置。
延伸反应包括3μl的模板(60μm)、1μl的引物(100μm)、2μl的上述ddntp类似物中的一种(100μm)、2μl的10xthermopol缓冲液、1μl的therminatorixdna聚合酶(10单位/μl)和11μl的水。延伸是在热循环仪中进行的,包括在65℃下变性1分钟,然后进行如下条件下的38个循环:65℃下持续30秒、45℃下持续30秒、65℃下持续30秒,最后在72℃下进行3分钟的延伸,并在4℃下储存。根据制造商的说明书,使用oligo清洁&浓缩器(zymoresearch)进行脱盐,然后通过maldi-tof-ms检查聚合酶反应的结果。
使用由6μl10xpbsph7.4、6μl新制备的250mmna2s2o4和48μl水组成的缓冲液在37℃下进行连二亚硫酸钠切割反应10分钟。
使用由6μlthp(50mm)、6μlnacl(200mm)、12μl硼酸钠(0.1m,ph9)和36μl水组成的缓冲液在65℃下进行thp切割反应10分钟。
实施例5k:制备包含模板的载玻片(图141)。
下面提供了将模板环引物连接至载玻片的说明。
将5'-氨基-修饰的自引发模板dna(关于环状引物模板的序列及其在载玻片上的排列,参见图141)以30μm的浓度溶于50mm磷酸钠缓冲液(ph9.0)中,并使用spotarray72微阵列打印机器人(perkinelmer,马萨诸塞州)在nhs酯衍生的codelink载玻片(surmodicsinc.,明尼苏达州)上点样。点样完成后,将载玻片在装有饱和氯化钠溶液的潮湿箱中于37℃温育过夜,以固定dna。固定后,通过将载玻片在50mm3-氨基-1-丙醇溶于100mmtris-hcl缓冲液(ph9.0)的溶液中于环境温度下温育2小时,将未反应的nhs酯基团淬灭。最后,将载玻片在沸水中短暂漂洗,用压缩空气风干,并在黑暗的容器中干燥保存直至进一步使用。
实施例5l:用未标记的nrt和带有染料或锚以及在碱基和染料或锚之间的两种可能的可切割的接头中的一种的荧光ddntp类似物,使用杂交方法的成功的荧光sbs(图162a-162c和图163a-163f)。
图162a-162c包含示出了使用ddntp-可切割的接头-染料(ddgtp-7-ss-cy5、ddttp-5-偶氮-cy5)、ddntp-可切割的接头-锚(ddctp-5-ss-生物素、ddatp-7-偶氮-生物素)、3'-o-叠氮基甲基dntp(3'-o-叠氮基甲基-datp、3'-o-叠氮基甲基-dctp、3'-o-叠氮基甲基-dgtp、3'-o-叠氮基甲基-dttp)和锚结合分子-染料(链霉亲和素-cy5)进行1-色dnasbs的示意图。步骤1,将therminatorixdna聚合酶和四种可逆终止子(3'-o-叠氮基甲基-datp、3'-o-叠氮基甲基-dctp、3'-o-叠氮基甲基-dgtp、3'-o-叠氮基甲基-dttp)加入到固定的引发的dna模板中,使得能够将互补的核苷酸类似物掺入到大多数生长中的dna链(>90%)中以终止dna合成。步骤2,添加热测序酶和ddntp类似物(ddgtp-7-ss-cy5、ddttp-5-偶氮-cy5、ddctp-5-ss-生物素、ddatp-7-偶氮-生物素)以延伸大部分剩余的固定的引发的dna模板。此步骤后,生长中的dna链被四种染料或锚标记的双脱氧核苷酸类似物(a、c、g、t)中的一种或不具有染料的四种3'-被保护的可逆终止子核苷酸类似物(a、c、g、t)中的同一种终止。步骤3,洗去未掺入的核苷酸后,进行成像步骤。阳性信号将表明掺入了ddt或ddg。步骤4,用链霉亲和素-cy5进行标记,以将cy5连接于dda和ddc。步骤5,在冲洗掉未使用的标记试剂后,进行第二轮成像。获得cy5信号表明掺入了dda或ddc。步骤6,通过将连二亚硫酸钠(na2s2o4)添加到延长的dna链上来切割偶氮接头,从而从掺入的dda和ddt中去除cy5。步骤7,洗去切割下的染料后,进行第三轮成像。cy5信号的丢失在先前确定掺入了ddg或ddt的情况下表明掺入了ddt,而在先前确定掺入了dda或ddc的情况下表明掺入了dda。步骤8,通过在延长的dna链上添加thp来切割ss接头,从而去除了所有剩余的染料(在ddc和ddg上),并且还恢复了在第一步骤中用3'-o-叠氮基甲基-dntp延伸的任何生长链上的3'-oh基团。洗掉切割下的染料后,进行任选的最后一轮成像。dna产物已准备好用于dna测序反应的下一个循环。该方案中使用的核苷酸的结构在图147a-147b中给出。图162a-162c中,每个步骤中,黑色表示阳性cy5信号,白色表示阴性信号。请注意,末尾处的总结图(summarycartoon)中的编码表示模板序列,而不是掺入的核苷酸。
为第一次延伸准备了以下溶液(溶液a):5μl100μm3′-o-n3-datp、5μl100μm3′-o-n3-dctp、3μl100μm3′-o-n3-dgtp、5μl100μm3'-o-n3-dttp和82μl水。为进行实际延伸,准备了35μl的a溶液、6μl的1单位/μl的therminatorix、6μl的10xthermopol缓冲液(200mmtris-hcl、100mm(nh4)2so4、100mmkcl、20mmmgso4、1%triton-x-100,ph8.8)和13μl的水,并将60μl的溶液置于涵盖载玻片的所有八个点样区域的腔室内,在65℃下保持5分钟。因此,对于a类似物、c类似物和t类似物,3′-叠氮基甲基dntp的近似终浓度为~2.5μm,对于g类似物为~1.5μm。
温育后,将载玻片浸入37℃的1xpbsph7.4、0.1%tween20的溶液中保持5分钟来进行洗涤,并用水进行彻底冲洗。干燥后,扫描载玻片以获得cy5荧光(633nm激光,发射窗口以约670nm为中心)和每个点样区域(spottedarea)的平均强度,其中每个区域都有数百个相同模板的点(spot),如图141所示。
为第二次延伸准备了以下溶液(溶液b):2μl2μmddatp-7-偶氮-生物素、2μl2μmddctp-5-ss-生物素、5μl20μmddgtp-7-ss-cy5和1μl2μmddttp-5-偶氮-cy5。为进行实际延伸,准备了5μl的溶液b、1μl的4单位/μl的热测序酶、6μl的10x缓冲液(260mmtris-hcl,ph9.5,65mmmgcl2)和48μl的水,并将60μl的该溶液添加至载玻片上的dna,在65℃下保持5分钟以进行所述的第一次延伸。四种ddntp类似物的终浓度为:ddatp-7-偶氮-生物素和ddctp-5-ss-生物素的终浓度为~30nm,ddgtp-7-ss-cy5的终浓度为~80nm,ddttp-5-偶氮-cy5的终浓度为~15nm。因此,第一次延伸中的叠氮基甲基dntp与第二次延伸中的ddntp类似物的比例对于a和c为~80x,对于g为~20x,对于t为~150x。
温育后,如上所述对载玻片进行洗涤、漂洗、干燥和扫描。
为了进行标记,将载玻片与60μl溶液在37℃下温育10分钟,该溶液由5μl2μm链霉亲和素-cy5、6μl10xpbs(ph7.4)和49μl水组成。如上所述对载玻片进行洗涤、漂洗、干燥和扫描。
使用60μl的溶液在45℃下于载玻片上进行5分钟的第一次切割,该溶液由6μl250mmna2s2o4、6μl10xpbs(ph7.4)和48μl水组成。温育后,如上所述对载玻片进行洗涤、漂洗、干燥和扫描。
使用60μl的溶液在65℃下于载玻片上进行第二次5分钟的第二次切割,该溶液由6μl50mmthp、6μl200mmnacl、12μl100mm硼酸钠(ph9)和36μl水组成。温育后,如上所述对载玻片进行洗涤、漂洗、干燥和扫描。
用载玻片固定的模板进行单-色边合成边测序的前五个循环的结果。第一个循环的结果如图163a中所示,随后的循环的结果如图163b-163e中所示。所有五个循环的结果总结在图163f所示的条形图中。以循环1(图163a)为例,着眼于上面四个区域,首先使用therminatorix聚合酶用4种3'-o-叠氮基甲基dntp进行延伸,然后使用热测序酶用4种ddntp类似物进行延伸。左上方展示的结果图像示出了左侧两个区域的高信号强度平均值(11,812和10,109au),以及右侧两个区域的背景信号(1,787和2399au)。由于只有t和g的ddntp类似物具有cy5,因此左侧区域必定展现出掺入了t或g,而右侧区域表明掺入了a或c。用cy5-链霉亲和素标记后,可获得左下方所示的图像,此时所有四个区域都显示出较高的信号强度(7,114、5,733、5,062和4,038;请注意,应在同一成像步骤中比较信号强度,以说明步骤特异性丧失)。接下来,用连二亚硫酸钠切割偶氮接头,得到右下方的图像。仅有中间的两个区域保留了较高的平均信号强度(4,160和4,260au),而左侧区域和右侧区域此时具有背景荧光强度(570和947au)。由于只有a和t的ddntp类似物具有偶氮接头,因此从左到右将这四个区域的掺入定义为t、g、c和a。最后,ss接头的切割和任何掺入的3'-o-叠氮基甲基dntp上的保护基团的去除,会在所有四个区域产生背景荧光(304、379、286和261au)。类似的分析表明,对于循环2(图163b),四个上部区域(从左到右)中掺入了a、a、a和t,对于循环3(图163c),掺入了g、g、t和t,对于循环4(图163d),掺入了a、c、c和a,对于循环5(图163e),掺入了g、a、a和g。鉴于四个模板的序列,这些结果正是预期的结果。在图163f中,用同样的数据绘图。这样可以阐明阳性信号与背景信号之间的区别,以及在每个循环的前三个成像步骤中使用数字代码(阳性信号为1,背景信号为0)来识别掺入了a(010)、c(011)、g(111)和t(110)。请注意,在图163a-163f中,编码是指掺入的核苷酸,其与模板编码互补。
从前述内容应该理解,尽管已经图示并描述了特定的实施方式,但是可以对其进行各种修改并且在本文中构思了各种修改。也无意将本发明限制于说明书中提供的特定示例。尽管已经参考前述说明书描述了本发明,但是对本文中优选实施方案的描述和图示并不意味着以限制性的意义来解释。此外,应理解,本发明的所有方面不限于本文所述的依赖于各种条件和变量的具体描述、配置或相对比例。本发明的实施方案的形式和细节上的各种修改对于本领域技术人员将是显而易见的。因此,可以预期的是,本发明还将涵盖任何这样的修改、变化和等同形式。意图以所附权利要求限定本发明的范围,并且由此涵盖这些权利要求范围内的方法和结构及其等同物。
参考文献:
bowers,j.,mitchell,j.,beer,e.,buzby,p.r.,causey,m.,efcavitch,j.w.,jarosz,m.,krzymanska-olejnik,e.,kung,l.,lipson,d.,lowman,g.m.,marappan,s.,mcinerney,p.,platt,a.,roy,a.,siddiqi,s.m.,steinmann,k.,thompson,j.f.(2009)virtualterminatornucleotidesfornext-generationdnasequencing.naturemeth6:593-595.
braslavskyi,hebertb,kartalove,quakesr(2003)sequenceinformationcanbeobtainedfromsinglednamolecules.procnatlacadsciusa100:3960-3964.
duthiers,kalveim,samolssb,hamiltons,livshini,khotm,nampalis,kumars,fullercw(2002)novelcyaninedye-labeleddideoxynucleosidetriphosphatesfordnasequencing.bioconjchem13:699-706.
fullerc,kumars,etal(2016)real-timesinglemoleculeelectronicdnasequencingbysynthesisusingtagged-nucleotidesongeniachip.procnatlacadsciusa113:5233-5238.
guoj,xun,liz,zhangs,wuj,ki,dh,marmams,mengq,caoh,lix,shis,yul,kalachikovs,russojj,turronj,juj(2008)four-colordnasequencingwith3'-o-modifiednucleotidereversibleterminatorsandchemicallycleavablefluorescentdideoxynucleotides.procnatlacadsciusa.105:914-950.
hobbsfwjr,trainorgl(1992)us5151507a.alkynylamino-nucleotides.
hungs-c,juj,mathiesra,glazeran(1996)cyaninedyeswithhighabsorptioncrosssectionasdonorchromophoresinenergytransferprimers.analbiochem243:15-27.
juj(2007)dnasequencingbynanoporeusingmodifiednucleotides.us8889348b2,us20090298072a1.
juj,chenx,lix,liz,hsiehm-k,chienm,shis,renj,guoc,kumars,russojj,taoc,jockuschs,kalachikovs(2017)wo2017/205336a1.nucleotidederivativesandmethodsofusethereof.
juj,choy,kumars,kalachikovs,taoc,chienm,russojj(2016)wo2016/154215a1.polymertaggednucleotidesforsinglemoleculeelectronicsnpassay.
juj,glazeran,mathiesra(1996)cassettelabelingforfacileconstructionofenergytransferfluorescentprimers.nucleicacidsres24:1144-1148.
juj,kimdh,guoj,mengq,liz,caoh(2016)us2016/0024574a1.dnasequencingwithnon-fluorescentnucleotidereversibleterminatorsandcleavablelabelmodifiednucleotideterminators.
juj,kumars,liz,taoc,chienm,russojj,kalachikovs,shepardk,rosensteinjk(2013)dnasequencingbysynthesisusingmodifiednucleotidesandnanoporedetection.ep2652153a2(wo2012083249a2)
juj,lix,chenx,liz,kumars,shis,guoc,renj,hsiehm-k,chienm,taoc,erturke,kalachikovs,russojj(2017)wo2017/058953a1.designandsynthesisofnoveldisulfidelinkerbasednucleotidesasreversibleterminatorsfordnasequencingbysynthesis.
juj,wuj,liz(2017)us9,624,539.dnasequencingbysynthesisusingramanandinfraredspectroscopydetection.
kumars,sooda(2006)labelednucleosidepolyphosphates.us7,041,812
kumars,taoc,chienm,hellnerb,balijepallia,robertsonjwf,liz,russojj,reinerje,kasianowiczj,juj(2012)peg-labelednucleotidesandnanoporedetectionforsinglemoleculednasequencingbysynthesis.scientificreports2,684.
mitrard,shendurej,olejnikj,edytakrzymanskao,churchgm(2003)fluorescentinsitusequencingonpolymerasecolonies.analbiochem320:55–65.
seo,ts,baix,kimdh,mengq,shis,ruparelh,liz,turronj,juj(2005)four-colordnasequencingbysynthesisonachipusingphotocleavablefluorescentnucleotides.procnatlacadsciusa102:5926-5931.
turcattig,romieua,fedurcom,tairia-p(2008)anewclassofreversiblefluorescentnucleotides:synthesisandoptimizationasreversibleterminatorsfordnasequencingbysynthesis.nucleicacidsres36:e25.
yangyy,grammelm,raghavanas,charrong,hanghc(2010)comparativeanalysisofcleavableazobenzene-basedaffinitytagsforbiorthogonalchemicalproteomics.chembiol17:1212-1222.
序列表
<110>哥伦比亚大学董事会
<120>核苷酸类似物及其在核酸测序和分析中的用途
<130>90419-a-pct/jpw/gjg
<150>us62/643,633
<151>2018-03-15
<160>10
<170>patentinversion3.5
<210>1
<211>17
<212>dna
<213>人工序列
<220>
<223>引物
<400>1
gataggactcatcacca17
<210>2
<211>109
<212>dna
<213>人工序列
<220>
<223>合成的dna模板
<400>2
gaaggagacacgcggccagagagggtcctgtccgtgtttgtgcgtggagttcgacaaggc60
agggtcatctaatggtgatgagtcctatccttttctcttcgttctccgt109
<210>3
<211>26
<212>dna
<213>人工序列
<220>
<223>合成的dna模板
<400>3
cgcggcgcggttccgcgccgcgagct26
<210>4
<211>26
<212>dna
<213>人工序列
<220>
<223>合成的dna模板
<400>4
cgcggcgcggttccgcgccgcggcta26
<210>5
<211>109
<212>dna
<213>人工序列
<220>
<223>合成的dna模板
<400>5
gaaggagacacgcggccagagagggtcctgtccgtgtttgtgcgtggagttcgacaaggc60
agggtcatctaatggtgatgagtcctatccttttctcttcgttctccgt109
<210>6
<211>20
<212>dna
<213>人工序列
<220>
<223>引物
<400>6
tagatgaccctgccttgtcg20
<210>7
<211>17
<212>dna
<213>人工序列
<220>
<223>引物
<400>7
tctctggccgcgtgtct17
<210>8
<211>17
<212>dna
<213>人工序列
<220>
<223>引物
<400>8
gataggactcatcacca17
<210>9
<211>100
<212>dna
<213>人工序列
<220>
<223>合成的dna模板
<400>9
tacccggaggccaagtacggcgggtacgtccttgacaatgtgtacatcaacatcacctac60
caccatgtcagtctcggttggatcctctattgtgtccggg100
<210>10
<211>20
<212>dna
<213>人工序列
<220>
<223>引物
<400>10
gttgatgtacacattgtcaa20