用聚合酶将核苷酸连接到多核苷酸的制作方法

文档序号:26589900发布日期:2021-09-10 20:34阅读:201来源:国知局
用聚合酶将核苷酸连接到多核苷酸的制作方法
用聚合酶将核苷酸连接到多核苷酸
1.相关申请的交叉引用
2.本技术要求于2019年8月21日提交的名称为“attaching nucleotides to a polynucleotide with a polymerase”的美国临时专利申请第62/890,065号的权益,该专利申请的全部内容以引用方式并入本文。
3.序列表
4.本技术包含已以ascii格式电子提交的序列表,该序列表据此全文以引用方式并入。所述ascii副本创建于2020年8月7日,命名为ip

1820

pct_sl.txt,大小为3,379字节。


背景技术:

5.许多当前的测序平台使用“边合成边测序”(sbs)技术和基于荧光的检测方法。期望将允许更具成本效益、更快速和更方便的测序和核酸检测的替代测序方法作为sbs的补充。基于电荷的测序是一种有吸引力的方法。
6.目前的边合成边测序(sbs)技术使用在以下两个位置处修饰的核苷酸:1)脱氧核糖的3

(或3

端)羟基(3
′‑
oh),以及2)含氮碱基(a、t、c、g)的嘧啶的5

位或嘌呤的7

位。3
′‑
oh基团用叠氮甲基封端以产生可逆的核苷酸终止子。这可防止在添加单个核苷酸之后进一步延伸。每个含氮碱基分别用荧光团修饰,以提供识别单碱基掺入的荧光读数。随后,移除3
′‑
oh封端基团和荧光团并重复循环。
7.由于修饰脱氧核糖的3
′‑
oh和含氮碱基两者的合成挑战,目前经修饰核苷酸的成本可能很高。存在若干可能的方法来降低经修饰核苷酸的成本。一种方法是将读数标记移动到5
′‑
末端(或5

端)磷酸而不是含氮碱基。在一个示例中,这消除了对单独切割步骤的需要,并允许实时检测进入的核苷酸。在掺入期间,焦磷酸盐与标签一起作为延伸过程的副产物被释放,因此不涉及可切割键。
8.在与这种实时sbs系统相关或用于这种实时sbs系统的环境中评估聚合酶活性而不需要检测带标签的核苷酸本身的方法可能是有益的。例如,能够评估聚合酶在不同测试条件下添加带标签的核苷酸的能力可能是有利的,这些不同的测试条件独立于在设备上测序的环境和条件或与其无关。由于通过设计,核苷酸上的标签可在其掺入新生链时从核苷酸中释放出来,因此测量聚合酶介导的这种带标签的核苷酸的掺入的时间和动力学是具有挑战性的。确定聚合酶能够在各种条件下以高通量方式将带有这种可释放标签的核苷酸以何种程度掺入或在任何情况下以何种速度掺入的能力可有助于部署使用这种带标签的核苷酸和聚合酶的设备上实时sbs系统。


技术实现要素:

9.在一个方面,本发明提供了一种方法,该方法包括使多核苷酸与模板杂交,以及使与该多核苷酸互补的多个核苷酸中的5

最末端核苷酸相邻的第一模板核苷酸5

端与聚合酶和带电荷标签的核苷酸接触,其中该带电荷标签的核苷酸与第一模板核苷酸互补,并且包括连接到该带电荷标签的核苷酸的5

端多磷酸的电荷标签。另一个示例还包括用聚合酶
将带电荷标签的核苷酸连接到多核苷酸,其中该连接包括将电荷标签从带电荷标签的核苷酸分离。
10.在一个示例中,模板结合到基底。在又一个示例中,聚合酶结合到基底。在又一个示例中,模板和聚合酶结合到基底。在另一个示例中,聚合酶选自klenow片段和phi29聚合酶。
11.在又一个示例中,模板连接到基底并且包括连接核苷酸,并且其中该连接核苷酸在第二模板核苷酸和基底之间。在一个示例中,可存在多于20个连接核苷酸,或1至20个连接核苷酸,或10至20个连接核苷酸,或1至10个连接核苷酸,或1至5个连接核苷酸,或5至10个连接核苷酸,或10至15个连接核苷酸,或15至20个连接核苷酸。在又一个示例中,基底是固体载体传导通道,并且该传导通道在使第一模板核苷酸与带电荷标签的核苷酸接触并将带电荷标签的核苷酸连接到多核苷酸期间检测带电荷标签的核苷酸。在又一个示例中,方法包括在溶液中连接带电荷标签的核苷酸,其中该电荷标签包括在溶液中的德拜长度,并且该德拜长度介于约0.5nm和约10nm之间。
12.在一个示例中,带电荷标签的核苷酸为式i的化合物
[0013][0014]
其中n为3至10的整数,m为1至10的整数,t为0至50的整数,x1为直接键、c1‑
c
10
烷基、c1‑
c
10
氧杂烷基、c1‑
c10硫杂烷基或者c1‑
c
10
氮杂烷基,x2为c1‑
c
20
烷基,其中任选地一个或多个ch2残基单独地被肽键或(

o

ch2‑
ch2‑
)
a
取代,其中a为1至24的整数,x3为直接键或寡核苷酸,a为或酰胺键,并且y选自
q为1至100的整数,并且b选自:氨基酸;核苷酸;其中每个r独立地选自y和氢;以及树枝化基元(dendron);并且其中当b为树枝化基元时,q等于1,并且q个b具有电荷和电荷密度。
[0015]
在另一个示例中,电荷介于约

100e和约+100e之间。在又一个示例中,电荷密度介于约

100e/立方纳米和约+100e/立方纳米之间。在又一个示例中,电荷介于约

200e和约+200e之间。在又一个示例中,电荷密度介于约

200e/立方纳米和约+200e/立方纳米之间。
[0016]
在另一个示例中,b包括q个核苷酸并且q大于1。在又一个示例中,多核苷酸选自分支多核苷酸和一个或多个发夹环。在又一个示例中,多核苷酸包括介于两个和五个之间的发夹环。
[0017]
在另一个示例中,q个b包括多肽。在又一个示例中,多肽选自分支多肽、卷曲多肽和卷曲螺旋多肽。在又一个示例中,b包括氨基酸,并且q个b中的一个或多个b包括甲基赖氨酸、二甲基赖氨酸或三甲基赖氨酸。在另一个示例中,b为包括一个或多个结构重复单元和多个末端单元的z代树枝化基元,其中z为1至6的整数,该结构末端单元选自
[0018]
其中p1为1至3的整数,其中p1

ch2‑
基团中的任一个或多个基团任选地被1至3个

o

ch2‑
ch2‑
基团取代,p2为1至3的整数,其中p2

ch2‑
基团中的任一个或多个基团任选地被1至3个

o

ch2‑
ch2‑
基团取代,并且端基选自羧酸、磺酸、膦酸、精胺基基团、氨基基团和季铵基团。
[0019]
在又一个示例中,a通过包括连接反应的反应形成,并且该连接反应选自叠氮

炔烃铜辅助的点击反应、四嗪

反式环辛烯连接、叠氮

二苯并环辛炔基团无铜点击反应和硫醇

马来酰亚胺缀合。在又一个示例中,x2为(

o

ch2‑
ch2‑
)
a
,其中a为1至24的整数,或其中a为24,或其中a为16,或其中a为12,或其中a为8,或其中a为4。
[0020]
在一个示例中,模板连接到基底并且包括连接核苷酸,其中该连接核苷酸在第二模板核苷酸和基底之间,并且x3包括寡核苷酸,其中当电荷标签接近基底时,该寡核苷酸与多个连接核苷酸杂交。在另一个示例中,带电荷标签的核苷酸为式i的化合物
[0021][0022]
其中n为3至10的整数,m为1至10的整数,t为0至50的整数,x1为直接键、c1‑
c
10
烷基、c1‑
c
10
氧杂烷基、c1‑
c
10
硫杂烷基或者c1‑
c
10
氮杂烷基,x2为c1‑
c
20
烷基,其中任选地一个或多个ch2残基单独地被肽键或(

o

ch2‑
ch2‑
)
a
取代,其中a为1至24的整数,x3为直接键或寡核苷酸,a为或酰胺键,并且y选自选自q为1至100的整数,b包括氨基酸,并且q个b具有电荷和电荷密度。
[0023]
在又一个示例中,电荷介于约

100e和约+100e之间。在另一个示例中,电荷密度介于约

100e/立方纳米和约+100e/立方纳米之间。在又一个示例中,电荷介于约

200e和约+200e之间。在又一个示例中,电荷密度介于约

200e/立方纳米和约+200e/立方纳米之间。在又一个示例中,q个b包括多肽。在又一个示例中,多肽选自分支多肽、卷曲多肽和卷曲螺旋多肽。在另一个示例中,q个b中的一个或多个b包括甲基赖氨酸、二甲基赖氨酸或三甲基赖氨酸。
[0024]
在又一个示例中,多肽为包括一个或多个叉的分支多肽,该一个或多个叉中的每个叉包括多个分支,并且该多个分支中的一个或多个分支各自独立地包括多个氨基酸。在又一个示例中,多肽包括三个或更多个叉,并且该多个分支中的一个或多个分支的氨基酸数目为至少四个。在另一个示例中,多肽包括七个或更多个叉。在又一个示例中,该多个分
支中的一个或多个分支的氨基酸数目为至少六个。
[0025]
在又一个示例中,a通过包括连接反应的反应形成,并且该连接反应选自叠氮

炔烃铜辅助的点击反应、四嗪

反式环辛烯连接、叠氮

二苯并环辛炔基团无铜点击反应和硫醇

马来酰亚胺缀合。在另一个示例中,x2为(

o

ch2‑
ch2‑
)
a
,其中a为1至24的整数。在又一个示例中,a为24,或a为16,或a为12,或a为8,或a为4。
[0026]
在又一个示例中,模板连接到基底并且包括连接核苷酸,其中该连接核苷酸在第二模板核苷酸和基底之间,并且x3包括寡核苷酸,其中当电荷标签接近基底时,该寡核苷酸与多个连接核苷酸杂交。
[0027]
在另一个示例中,带电荷标签的核苷酸为式i的化合物
[0028][0029]
其中n为3至10的整数,m为1至10的整数,t为0至50的整数,x1为直接键、c1‑
c
10
烷基、c1‑
c
10
氧杂烷基、c1‑
c
10
硫杂烷基或者c1‑
c
10
氮杂烷基,x2为c1‑
c
10
烷基,其中任选地一个或多个ch2残基单独地被肽键或(

o

ch2‑
ch2‑
)a取代,其中a为1至24的整数,x3为直接键或寡核苷酸,a为或酰胺键,并且y选自酰胺键,并且y选自q为1至100的整数,并且b选自:核苷酸;
其中每个r独立地选自y和氢;并且q个b具有电荷和电荷密度。
[0030]
在又一个示例中,电荷介于约

100e和约+100e之间。在又一个示例中,电荷密度介于约

100e/立方纳米和约+100e/立方纳米之间。在另一个示例中,电荷介于约

200e和约+200e之间。在又一个示例中,电荷密度介于约

200e/立方纳米和约+200e/立方纳米之间。
[0031]
在另一个示例中,b包括q个核苷酸并且q大于1。在又一个示例中,多核苷酸选自分支多核苷酸和一个或多个发夹环。在又一个示例中,多核苷酸包括介于两个和五个之间的发夹环。
[0032]
在另一个示例中,a通过包括连接反应的反应形成,并且该连接反应选自叠氮

炔烃铜辅助的点击反应、四嗪

反式环辛烯连接、叠氮

二苯并环辛炔基团无铜点击反应和硫醇

马来酰亚胺缀合。在又一个示例中,x2为(

o

ch2‑
ch2‑
)
a
,其中a为1至24的整数,或a为24,或a为16,或a为12,或a为8,或a为4。
[0033]
在又一个示例中,模板连接到基底并且包括连接核苷酸,其中该连接核苷酸在第二模板核苷酸和基底之间,并且x3包括寡核苷酸,其中当电荷标签接近基底时,该寡核苷酸与多个连接核苷酸杂交。
[0034]
在另一个示例中,带电荷标签的核苷酸为式i的化合物
[0035][0036]
其中n为3至10的整数,m为1至10的整数,t为0至50的整数,x1为直接键、c1‑
c
10
烷基、c1‑
c
10
氧杂烷基、c1‑
c
10
硫杂烷基或者c1‑
c
10
氮杂烷基,x2为c1‑
c
20
烷基,其中任选地一个或多个ch2残基单独地被肽键或(

o

ch2‑
ch2‑
)
a
取代,其中a为1至24的整数,
[0037]
x3为直接键或寡核苷酸,a为
或酰胺键,并且y选自或酰胺键,并且y选自q为1,并且b包括树枝化基元,并且b具有电荷和电荷密度。
[0038]
在另一个示例中,电荷介于约

100e和约+100e之间。在又一个示例中,电荷密度介于约

100e/立方纳米和约+100e/立方纳米之间。在又一个示例中,电荷介于约

200e和约+200e之间。在另一个示例中,电荷密度介于约

200e/立方纳米和约+200e/立方纳米之间。
[0039]
在又一个示例中,b为包括一个或多个结构重复单元和多个末端单元的z代树枝化基元,其中z为1至6的整数,该结构末端单元选自:
[0040]
其中p1为1至3的整数,其中p1

ch2‑
基团中的任一个或多个基团任选地被1至3个

o

ch2‑
ch2‑
基团取代,p2为1至3的整数,其中p2

ch2‑
基团中的任一个或多个基团任选地被1至3个

o

ch2‑
ch2‑
基团取代,并且端基选自羧酸、磺酸、膦酸、精胺基基团、氨基基团和季铵基团。
[0041]
在又一个示例中,a通过包括连接反应的反应形成,并且该连接反应选自叠氮

炔烃铜辅助的点击反应、四嗪

反式环辛烯连接、叠氮

二苯并环辛炔基团无铜点击反应和硫醇

马来酰亚胺缀合。在另一个示例中,x2为(

o

ch2‑
ch2‑
)
a
,其中a为1至24的整数,或a为24,或a为16,或a为12,或a为8,或a为4。在又一个示例中,模板连接到基底并且包括连接核苷酸,其中该连接核苷酸在第二模板核苷酸和基底之间,并且x3包括寡核苷酸,其中当电荷标签接近基底时,该寡核苷酸与多个连接核苷酸杂交。
[0042]
在另一个示例中,模板还包括与第一模板核苷酸相邻的第二模板核苷酸5'端,并且方法还包括:使第二模板核苷酸与带荧光标签的核苷酸接触,其中该带荧光标签的核苷酸与第二模板核苷酸互补但不与第一模板核苷酸互补;以及用聚合酶将该带荧光标签的核苷酸连接到多核苷酸。在又一个示例中,方法还包括通过测量从多核苷酸发射的荧光来测量带荧光标签的核苷酸与该多核苷酸的连接。在又一个示例中,方法还包括在测量之前从模板洗脱多核苷酸。
[0043]
在另一方面,提供了一种方法,该方法包括检测通过聚合酶向与模板多核苷酸链
互补的新生多核苷酸链掺入标记核苷酸,其中聚合酶通过系链(tether)栓系到固体载体传导通道,该标记核苷酸为式i的化合物
[0044]
其中n为3至10的整数,m为1至10的整数,t为0至50的整数,x1为直接键、c1‑
c
10
烷基、c1‑
c
10
氧杂烷基、c1‑
c
10
硫杂烷基或者c1‑
c
10
氮杂烷基,x2为c1‑
c
20
烷基,其中任选地一个或多个ch2残基被肽键或(

o

ch2‑
ch2‑
)
a
取代,其中a为1至24的整数,x3为直接键或寡核苷酸,其中当标记接近传导通道时,寡核苷酸与系链的受体区域杂交,f1选自荧光团和直接键,并且f2不存在或为荧光团,
[0045]
a为或酰胺键,并且
[0046]
y选自y选自q为1至100的整数,并且
[0047]
b选自:氨基酸;核苷酸;其中r独立地选自y和氢;以及树枝化基元;并且其中当b为树枝化基元时,q等于1,并且q个b具有电荷和电荷密度,并且
[0048]
传导通道用于在掺入期间检测标记核苷酸。
[0049]
在一个示例中,电荷介于约

100e和约+100e之间。在另一个示例中,电荷密度介于约

100e/立方纳米和约+100e/立方纳米之间。在又一个示例中,电荷介于约

200e和约+200e之间。在又一个示例中,电荷密度介于约

200e/立方纳米和约+200e/立方纳米之间。
[0050]
在另一个示例中,b包括q个核苷酸并且q大于1。在又一个示例中,多核苷酸选自分支多核苷酸和一个或多个发夹环。在又一个示例中,多核苷酸包括介于两个和五个之间的发夹环。
[0051]
在另一个示例中,q个b包括多肽。在又一个示例中,多肽选自分支多肽、卷曲多肽和卷曲螺旋多肽。在又一个示例中,b包括氨基酸,并且q个b中的一个或多个b包括甲基赖氨酸、二甲基赖氨酸或三甲基赖氨酸。
[0052]
在另一个示例中,b为包括一个或多个结构重复单元和多个末端单元的z代树枝化基元,其中z为1至6的整数,该结构末端单元选自:
[0053][0054]
其中
[0055]
p1为1至3的整数,其中p1‑
ch2‑
基团中的任一个或多个基团任选地被1至3个

o

ch2‑
ch2‑
基团取代,p2为1至3的整数,其中p2‑
ch2‑
基团中的任一个或多个基团任选地被1至3个

o

ch2‑
ch2‑
基团取代,并且端基选自羧酸、磺酸、膦酸、精胺基基团、氨基基团和季铵基团。
[0056]
在又一个示例中,a通过包括连接反应的反应形成,并且该连接反应选自叠氮

炔烃铜辅助的点击反应、四嗪

反式环辛烯连接、叠氮

二苯并环辛炔基团无铜点击反应和硫醇

马来酰亚胺缀合。
[0057]
在又一个示例中,方法还包括连续掺入多个标记核苷酸,其中当该多个标记核苷酸中每个标记核苷酸的y和该多个标记核苷酸中任何其他标记核苷酸的y彼此不同时,每个标记核苷酸的电荷不同于任何其他标记核苷酸的电荷。在另一个示例中,方法还包括基于由传导通道检测到的电荷识别掺入新生多核苷酸链中的一个或多个标记多核苷酸的y。
[0058]
在又一个示例中,x2为(

o

ch2‑
ch2‑
)
a
,其中a为1至24的整数。在一个示例中,a为
24。在另一个示例中,a为12。在另一个示例中,a为8。在又一个示例中,a为4。
[0059]
在另一方面,提供了一种方法,该方法包括检测通过聚合酶向与模板多核苷酸链互补的新生多核苷酸链掺入标记核苷酸,其中聚合酶通过系链栓系到固体载体传导通道,该标记核苷酸为式i的化合物
[0060][0061]
其中n为3至10的整数,m为1至10的整数,t为0至50的整数,x1为直接键、c1‑
c
10
烷基、c1‑
c
10
氧杂烷基、c1‑
c
10
硫杂烷基或者c1‑
c
10
氮杂烷基,x2为c1‑
c
20
烷基,其中任选地一个或多个ch2残基单独地被肽键或(

o

ch2‑
ch2‑
)
a
取代,其中a为1至24的整数,x3为直接键或寡核苷酸,其中当标记接近传导通道时,寡核苷酸与系链的受体区域杂交,f1选自荧光团和直接键,并且f2不存在或为荧光团,
[0062]
a为或酰胺键,并且
[0063]
y选自选自q为1至100的整数,并且
[0064]
b包括氨基酸,并且q个b具有电荷和电荷密度,并且
[0065]
传导通道用于在掺入期间检测标记核苷酸。
[0066]
在一个示例中,电荷介于约

100e和约+100e之间。在另一个示例中,电荷密度介于约

100e/立方纳米和约+100e/立方纳米之间。在又一个示例中,电荷介于约

200e和约+200e之间。在又一个示例中,电荷密度介于约

200e/立方纳米和约+200e/立方纳米之间。
[0067]
在另一个示例中,q个b包括多肽。在又一个示例中,多肽选自分支多肽、卷曲多肽和卷曲螺旋多肽。在又一个示例中,b包括氨基酸,并且q个b中的一个或多个b包括甲基赖氨酸、二甲基赖氨酸或三甲基赖氨酸。
[0068]
在又一个示例中,多肽为包括一个或多个叉和多个分支的分支多肽,并且该多个分支中的一个或多个分支各自独立地包括多个氨基酸。在又一个示例中,多肽包括三个或更多个叉,并且该多个分支中的一个或多个分支的氨基酸数目为至少四个。在另一个示例中,多肽包括七个或更多个叉。在又一个示例中,该多个分支中的一个或多个分支的氨基酸数目为至少六个。
[0069]
在又一个示例中,a通过包括连接反应的反应形成,并且该连接反应选自叠氮

炔烃铜辅助的点击反应、四嗪

反式环辛烯连接、叠氮

二苯并环辛炔基团无铜点击反应和硫醇

马来酰亚胺缀合。
[0070]
在又一个示例中,方法还包括连续掺入多个标记核苷酸,其中当该多个标记核苷酸中每个标记核苷酸的y和该多个标记核苷酸中任何其他标记核苷酸的y彼此不同时,每个标记核苷酸的电荷不同于任何其他标记核苷酸的电荷。在另一个示例中,方法还包括基于由传导通道检测到的电荷识别掺入新生多核苷酸链中的一个或多个标记多核苷酸的y。
[0071]
在又一个示例中,x2为(

o

ch2‑
ch2‑
)
a
,其中a为1至24的整数。在一个示例中,a为24。在另一个示例中,a为12。在另一个示例中,a为8。在又一个示例中,a为4。
[0072]
在又一方面,提供了一种方法,该方法包括检测通过聚合酶向与模板多核苷酸链互补的新生多核苷酸链掺入标记核苷酸,其中聚合酶通过系链栓系到固体载体传导通道,该标记核苷酸为式i的化合物
[0073][0074]
其中n为3至10的整数,m为1至10的整数,t为0至50的整数,x1为直接键、c1‑
c
10
烷基、c1‑
c
10
氧杂烷基、c1‑
c
10
硫杂烷基或者c1‑
c
10
氮杂烷基,x2为c1‑
c
20
烷基,其中任选地一个或多个ch2残基单独地被肽键或(

o

ch2‑
ch2‑
)
a
取代,其中a为1至24的整数,x3为直接键或寡核苷酸,其中当标记接近传导通道时,寡核苷酸与系链的受体区域杂交,f1选自荧光团和直接键,并且f2不存在或为荧光团,
[0075]
a为或酰胺键,并且
[0076]
y选自y选自q为1至100的整数,并且
[0077]
b选自:核苷酸;其中r选自y和氢;并且传导通道用于在掺入期间检测标记核苷酸。
[0078]
在一个示例中,电荷介于约

100e和约+100e之间。在另一个示例中,电荷密度介于约

100e/立方纳米和约+100e/立方纳米之间。在又一个示例中,电荷介于约

200e和约+200e之间。在又一个示例中,电荷密度介于约

200e/立方纳米和约+200e/立方纳米之间。
[0079]
在另一个示例中,b包括q个核苷酸并且q大于1。在又一个示例中,多核苷酸选自分支多核苷酸和一个或多个发夹环。在又一个示例中,多核苷酸包括介于两个和五个之间的发夹环。
[0080]
在又一个示例中,a通过包括连接反应的反应形成,并且该连接反应选自叠氮

炔烃铜辅助的点击反应、四嗪

反式环辛烯连接、叠氮

二苯并环辛炔基团无铜点击反应和硫醇

马来酰亚胺缀合。
[0081]
在又一个示例中,方法还包括连续掺入多个标记核苷酸,其中当该多个标记核苷酸中每个标记核苷酸的y和该多个标记核苷酸中任何其他标记核苷酸的y彼此不同时,每个标记核苷酸的电荷不同于任何其他标记核苷酸的电荷。在另一个示例中,方法还包括基于由传导通道检测到的电荷识别掺入新生多核苷酸链中的一个或多个标记多核苷酸的y。
[0082]
在又一个示例中,x2为(

o

ch2‑
ch2‑
)
a
,其中a为1至24的整数。在一个示例中,a为24。在另一个示例中,a为12。在另一个示例中,a为8。在又一个示例中,a为4。
[0083]
在另一方面,提供了一种方法,该方法包括检测通过聚合酶向与模板多核苷酸链互补的新生多核苷酸链掺入标记核苷酸,其中聚合酶通过系链栓系到固体载体传导通道,该标记核苷酸为式i的化合物
[0084][0085]
其中n为3至10的整数,m为1至10的整数,t为0至50的整数,x1为直接键、c1‑
c
10
烷基、c1‑
c
10
氧杂烷基、c1‑
c
10
硫杂烷基或者c1‑
c
10
氮杂烷基,x2为c1‑
c
20
烷基,其中任选地一个或多个ch2残基单独地被肽键或(

o

ch2‑
ch2‑
)
a
取代,其中a为1至24的整数,x3为直接键或寡核苷酸,其中当标记接近传导通道时,寡核苷酸与系链的受体区域杂交,f1选自荧光团和直接键,并且f2不存在或为荧光团,
[0086]
a为或酰胺键,并且
[0087]
y选自y选自q为1,并且b包括树枝化基元,并且b具有电荷和电荷密度,并且传导通道用于在掺入期间检测标记核苷酸。
[0088]
在一个示例中,电荷介于约

100e和约+100e之间。在另一个示例中,电荷密度介于约

100e/立方纳米和约+100e/立方纳米之间。在又一个示例中,电荷介于约

200e和约+
200e之间。在又一个示例中,电荷密度介于约

200e/立方纳米和约+200e/立方纳米之间。
[0089]
在另一个示例中,b为包括一个或多个结构重复单元和多个末端单元的z代树枝化基元,其中z为1至6的整数,该结构末端单元选自:
[0090][0091]
其中
[0092]
p1为1至3的整数,其中p1‑
ch2‑
基团中的任一个或多个基团任选地被1至3个

o

ch2‑
ch2‑
基团取代,p2为1至3的整数,其中p2‑
ch2‑
基团中的任一个或多个基团任选地被1至3个

o

ch2‑
ch2‑
基团取代,并且端基选自羧酸、磺酸、膦酸、精胺基基团、氨基基团和季铵基团。
[0093]
在又一个示例中,a通过包括连接反应的反应形成,并且该连接反应选自叠氮

炔烃铜辅助的点击反应、四嗪

反式环辛烯连接、叠氮

二苯并环辛炔基团无铜点击反应和硫醇

马来酰亚胺缀合。
[0094]
在又一个示例中,方法还包括连续掺入多个标记核苷酸,其中当该多个标记核苷酸中每个标记核苷酸的y和该多个标记核苷酸中任何其他标记核苷酸的y彼此不同时,每个标记核苷酸的电荷不同于任何其他标记核苷酸的电荷。在另一个示例中,方法还包括基于由传导通道检测到的电荷识别掺入新生多核苷酸链中的一个或多个标记多核苷酸的y。
[0095]
在又一个示例中,x2为(

o

ch2‑
ch2‑
)
a
,其中a为1至24的整数。在一个示例中,a为24。在另一个示例中,a为12。在另一个示例中,a为8。在又一个示例中,a为4。
[0096]
应当理解,前述概念和下文更详细讨论的附加概念(假设此类概念不相互矛盾)的所有组合都被设想为是本文所公开的发明主题的一部分并且贡献如本文所述的优点和有益效果。
附图说明
[0097]
当参考附图阅读以下详细描述时将更好地理解本公开的这些和其他特征、方面和优点,其中:
[0098]
图1示出了用于执行根据本公开的各方面的方法的流程图。
[0099]
图2示出了根据本公开的各方面的将核苷酸掺入多核苷酸的示例。
[0100]
图3示出了,在一个示例中,通过系链连接到传导通道的聚合酶。
[0101]
图4示出了,在一个示例中,通过核酸系链连接到传导通道并且结合到核苷酸的聚合酶,这些核苷酸可基于电荷或与电荷检测器的接近度来区分。
[0102]
图5示出了,在一个示例中,通过核酸系链连接到传导通道并且结合到核苷酸的聚合酶,这些核苷酸可基于电荷来区分。
[0103]
图6示出了,在一个示例中,栓系到传导通道的聚合酶,其中该传导通道还连接到
受体区域,该受体区域在该示例中包括能够结合(例如,杂交)到核苷酸上的接头内的特异性区域的多个寡核苷酸。
[0104]
图7示出了带有根据本公开的电荷标签的核苷酸类似物的非限制性示例的图示。核苷酸类似物可包括核苷酸多磷酸(诸如如图所示的dt六磷酸)、任选地包括特异性区域的接头区域,以及电荷标签。在该非限制性示例中,接头包括由叠氮

炔烃点击化学形成的共价连接。如下文进一步所述,特异性区域可包含在接头中,并且可有助于在通过聚合酶掺入核苷酸期间促进电荷标签与传导通道的接近。
[0105]
图8示出了,在一个示例中,在标记的寡核苷酸部分的磷酸二酯主链中具有带负电的氧的核苷酸标记。
[0106]
图9a、图9b和图9c示出了,作为示例,用于构建可使用传导通道检测的分支电荷标签的示例性多重单元(multiplier unit)。
[0107]
图10示出了,在一个示例中,通过具有核酸序列(一般表示为10ns的序列)的系链连接到聚合酶(pol)的传导通道。n个核苷酸选自通用碱基和与连接到电荷标签的接头中的核苷酸(例如,特异性区域)互补的碱基。
[0108]
图11示出了,在一个示例中,通过具有受体区域,在该示例中具有核酸序列(一般表示为具有abc区域的7ns的序列;电荷标签部分未示出)的系链连接到聚合酶(pol)的传导通道。聚合酶与靶核酸和标记的ctp类似物复合。ctp类似物上的接头包含具有肌苷(i)的核酸区域和与系链上的受体区域(abc)杂交的特异性区域(a'b'c')。
[0109]
图12示出了,在一个示例中,由于四种不同核苷酸类似物中的每种核苷酸类似物通过每个接头中的特异性区域与系链中的受体区域结合而导致的相对于传导通道处于四种不同位置状态的栓系聚合酶。对于该例示性示例,核苷酸类似物被标识为atp、gtp、ctp和ttp,但可使用任何核苷酸类似物(例如,可使用脱氧核糖核苷酸类似物)。核苷酸类似物中的每个核苷酸类似物具有与其他3个核苷酸类似物长度相同的寡核苷酸部分,但每个核苷酸类似物具有特异性结合序列,该特异性结合序列与其他核苷酸类似物接头所结合的区域相比结合到系链中受体区域的不同区域。电荷标签(在该示例中为寡核苷酸或在其他示例中为其他含磷酸二酯的电荷标签)延伸到与该核苷酸相对的接头末端处的杂交区域之外。
[0110]
图13示出了,在一个示例中,通过聚合酶phi29单核苷酸掺入基于磷酸二酯的电荷标签。
[0111]
图14a、图14b、图14c和图14d示出了根据本公开的各方面的基于肽的电荷标签的示例。
[0112]
图15a、图15b和图15c示出了,在一个示例中,以结构化寡核苷酸作为电荷标签的经修饰核苷酸的几种结构。示出了具有从其延伸的电荷标签的经修饰核苷酸,其中该电荷标签包含与受体区域结合的特异性区域(表示为“胶”)。图15a示出了茎

环形电荷标签,并且图15c示出了三叶草形电荷标签(seq id no:1)。
[0113]
图16a和图16b示出了十字形电荷标签的示例。图16a示出了包括以类似霍利迪结构的构型结合在一起的四个寡核苷酸和单链寡核苷酸突出端的十字形电荷标签。图16b示出了来自图16a的结构,其中肽核酸序列结合到寡核苷酸突出端并且卷曲多肽结构从肽核酸序列的末端延伸。在该示例中,多肽序列具有正电荷。
[0114]
图17示出了多肽电荷标签的几个示例,包括卷曲多肽及其组装。
[0115]
图18a和图18b示出了包括以卷曲螺旋构型布置的多肽的电荷标签的示例的两个视图。
[0116]
图19a和图19b示出了具有分支结构的基于磷酸二酯的电荷标签的示例。图19a将“ttttt ttttt”公开为seq id no:11。
[0117]
图20a、图20b、图20c、图20d和图20e示出了根据本公开的各方面的磷酸二酯电荷标签的非限制性示例。各图按出现顺序分别公开了seq id no:2至seq id no:6。
[0118]
图21a和图21b示出了基于分支肽的电荷标签的示例。
[0119]
图22描绘了根据本公开的各方面的用于合成电荷标签的示例的合成方法。
[0120]
图23a和图23b描绘了根据本公开的各方面的分支肽电荷标签的示例。
[0121]
图24a、图24b和图24c描绘了根据本公开的各方面的线性肽电荷标签(图24a)和分支肽电荷标签(图24b和图24c)的示例。
[0122]
图25a和图25b示出了根据本公开的各方面的基于精胺的电荷标签的示例。
[0123]
图26描绘了根据本公开的各方面的具有用于检测电荷标签的传导通道的装置。
[0124]
图27是描绘了根据本公开的各方面的通过传导通道对各种电荷标签的电荷检测的曲线图。
[0125]
图28是描绘了根据本公开的各方面的通过传导通道对各种电荷标签的电荷检测的曲线图。
[0126]
图29a和图29b描绘了根据不同缓冲液中的各种德拜长度的示例性电荷标签的电荷检测。
具体实施方式
[0127]
本公开涉及用于确定在各种条件下通过聚合酶掺入带电荷标签的核苷酸的方面的方法。用于sbs测序的实时方法或用于通过传导通道检测新生核苷酸链中的核苷酸掺入的其他方法(包括使用核苷酸掺入通过其5

端磷酸基团连接到核苷酸的电荷标签)可包括用于评估在掺入的不同阶段中核苷酸掺入的速率的度量。可测量多种特征的修饰对根据模板将带有电荷标签的核苷酸掺入新生多核苷酸链的核苷酸的能力、速率、动力学或其他特性的影响。有利地,并且如本公开中所提供的,方法可包括独立于在掺入期间通过传导通道检测电荷标签来评估这种效果,诸如当在不包括传导通道的条件下或使用传导通道检测电荷标签的条件下评估或使用掺入条件时。
[0128]
在带电荷的标签已通过核苷酸的5

端磷酸基团连接到核苷酸的情况下,在将该核苷酸掺入到新生寡核苷酸链中时,如果该核苷酸通过该核苷酸的5

端磷酸连接到新生链的游离3

末端,则电荷标签可与该电荷标签解离。例如,如本文所公开的,核苷酸可通过连接到核苷酸糖部分的5

端碳的多磷酸连接到电荷标签。聚合酶可在从核苷酸中移除多磷酸的一部分时从该核苷酸切割电荷标签,与当将核苷酸连接到新生多核苷酸链的3'端氢氧根时聚合酶切割掺入的核苷酸的5'端焦磷酸基团一样。如本文所公开的,实时的类似sbs过程可包括在传导通道附近掺入带电荷标签的核苷酸,使得传导通道可检测与该掺入相关联的电荷标签,从而反映被掺入的碱基。
[0129]
但是在一些示例中,可能期望在不通过传导通道检测电荷标签的情况下执行此类方法的各方面,同时保持测量在掺入之前是否将包括电荷标签的核苷酸添加到新生寡核苷
酸链的能力。即使在带电荷标签的核苷酸的掺入可被其附近的传导通道检测或可检测到,或者无论传导通道是否用于检测此类掺入均可在传导通道附近进行的情况下,通过独立于使用传导通道检测电荷标签的另一种方法来检测此类掺入可能是有益的。
[0130]
可用这种方法获得关于使用带电荷标签的核苷酸和传导通道进行实时碱基检出的方法的特征的度量。装置或表面的结构特征及其对核苷酸掺入的影响、不同聚合酶对核苷酸掺入的能力和动力学、不同核苷酸(诸如包括不同电荷标签的核苷酸、或在电荷标签和核苷酸之间具有不同连接的核苷酸)的掺入特性、在传导通道附近将聚合酶拴系到其上的基底的不同表面化学性质、聚合酶可通过其连接到表面的不同系链的不同特性(包括在传导通道附近)、或如本文所公开的其他特征均可使用如本文所公开的方法进行询问,而与通过如本文所公开的传导通道的电荷检测来检测带电荷标签的核苷酸无关。
[0131]
图1中描绘了一个示例。在该示例中,模板寡核苷酸(向上指向的箭头)与多核苷酸(向下指向的箭头)杂交。在该示例中,在杂交后,可进行洗涤步骤,由此从反应中移除未杂交的、游离的多核苷酸。然后可将杂交的模板和多核苷酸与带电荷标签的核苷酸(由图1中的dn6p表示)和聚合酶一起进一步温育。模板和杂交多核苷酸的序列可以是已知的,并且被设计成使得紧接与该多核苷酸杂交的5'最末端模板核苷酸的5'端的空模板核苷酸可以是已知的。在一个示例中,此类核苷酸可不同于模板的下一个5'端核苷酸。在此类示例中,由于碱基配对规则,有可能通过在反应中仅包括已知与空模板核苷酸互补的一种核苷酸(c、g、a或t)来进行单碱基掺入步骤,该种核苷酸带有电荷标签。
[0132]
如本文所公开的模板、与其杂交的多核苷酸或两者可具有任何合适的长度。在一些示例中,模板、与其杂交的多核苷酸或两者可为相对短的多核苷酸,其长度为大约5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200或更多个核苷酸。在一个示例中,一者、另一者或两者可为引物,即相对较短的多核苷酸,当与互补多核苷酸杂交时,其可充当聚合酶的引物,以通过添加与其互补序列的下一个非杂交核苷酸互补的核苷酸而被聚合酶延伸。在一个示例中,与模板杂交的多核苷酸可为引物。引物可以是任何合适的长度,具体取决于互补多核苷酸诸如模板的长度,引物与该模板杂交并充当聚合酶的引物。在一个示例中,引物的长度可为5、10、15、20、25、30、35、40、45、50、55、60、65、70或75个核苷酸,或这些长度之间的任何居间长度。在一个示例中,引物可长于这样的长度。
[0133]
在该示例中,一旦将单个碱基掺入杂交多核苷酸中,就不能掺入另一个第二核苷酸,因为反应中包括的核苷酸种类不与模板的第二、下一个5'端核苷酸互补。因此,聚合酶可能不会掺入该核苷酸。在其他示例中,带有电荷标签的单种核苷酸也可带有化学修饰,以在将单个碱基掺入杂交多核苷酸中之后减少、最小化或在一些情况下防止第二核苷酸的添加。例如,带电荷标签的核苷酸可带有可逆封端部分,该可逆封端部分可减少、最小化或在一些情况下防止后续核苷酸(例如,3'叠氮甲基或其他可逆封端基团)的添加。在此类示例中,可减少、最小化或在一些情况下防止进一步的核苷酸添加,直到在掺入带电荷标签的核苷酸后对杂交多核苷酸的游离的3'端碳末端进行化学修饰并且可能在这种化学修饰之后。
[0134]
当电荷标签通过连接到核苷酸的5'端碳上的多磷酸连接到核苷酸时,如在本文所公开的示例中,将核苷酸掺入杂交多核苷酸可导致电荷标签从模板和杂交多核苷酸解离。在此类情况下,可能难以确定所掺入的核苷酸是否已被加电荷标签,尤其是以可允许确定
与如上所述的掺入相关联的进一步度量的高通量方式。如本文所公开的,第二核苷酸的掺入可在第一带电荷标签的核苷酸的掺入之后进行,并且第二核苷酸可具有允许其通过常规检测方法进行检测的特征。
[0135]
继续图1描绘的示例,除了使模板和杂交多核苷酸与聚合酶和带电荷标签的核苷酸接触之外,它们还可与全功能核苷酸(在图1中描绘为ffn)接触。ffn可与模板上的下一个5'端核苷酸互补,一个核苷酸在模板的5'端方向上与模板核苷酸相邻,该模板核苷酸与如上所述掺入的带电荷标签的核苷酸互补。
[0136]
在该示例中,此类ffn可不同于模板的下一个5'端核苷酸。在此类示例中,由于碱基配对规则,有可能在用于掺入如上文所公开的带电荷标签的核苷酸之后,通过在反应中仅包括已知与下一个空模板核苷酸互补的一种核苷酸(c、g、a或t)来进行另一个单碱基掺入步骤,该种核苷酸带有可检测部分诸如荧光标签。
[0137]
在该示例中,一旦将ffn掺入杂交多核苷酸中,就不能掺入另一个核苷酸,因为反应中包括的ffn种类不与模板的下一个5'端核苷酸互补。因此,聚合酶可能不会掺入该核苷酸。在其他示例中,单种ffn也可带有化学修饰,以在将ffn掺入杂交多核苷酸中之后减少、最小化或在一些情况下防止另一核苷酸的添加。例如,ffn可带有可逆封端部分,该可逆封端部分可减少、最小化或在一些情况下防止后续核苷酸(例如,3'叠氮甲基或其他可逆封端基团)的添加。在此类示例中,可减少、最小化或在一些情况下防止进一步的核苷酸添加,直到在掺入ffn后对杂交多核苷酸的游离的3'端碳末端进行化学修饰并且可能在这种化学修饰之后。在另一个示例中,ffn可在其3'端碳上缺乏羟基(例如,可为包括可检测标记诸如荧光标签的双脱氧核苷酸),这可减少、最小化或在一些情况下防止后续核苷酸的掺入。
[0138]
在另一个示例中,与本文公开的方法一致,方法可包括除了一个或多个掺入的ffn之外,掺入一个以上的ffn,或一个或多个不带荧光标签的核苷酸。尽管本文描述了一个示例,其中ffn紧接被掺入的上一个带电荷标签的核苷酸的3'端处掺入,并且随后可检测到这种ffn的存在,但是在其他示例中,其他核苷酸可在带电荷标签的核苷酸掺入之后并且在ffn掺入之前掺入,并且/或者一个以上的ffn可与其相邻和/或彼此相邻或与其间隔开和/或彼此间隔开地掺入,并且出于各种原因被检测到。所有这样的示例均包括在本公开中,并且明确地视为可与下文进一步公开的其变型互换。
[0139]
在一个示例中,模板和杂交多核苷酸可顺序地与带电荷标签的核苷酸和ffn一起温育,在温育之间进行洗涤步骤以移除未掺入的核苷酸。例如,在一个示例中,用于掺入杂交多核苷酸中的带电荷标签的核苷酸和ffn两者可具有彼此相同种类的核苷酸(例如,均为g、c、a或t),而可用于与所述核苷酸配对并掺入到杂交多核苷酸中的模板的核苷酸也可彼此相同并且与带电荷标签的核苷酸和ffn互补。在此类示例中,可对带电荷标签的核苷酸进行修饰,以便减少或者在一些情况下最小化或者甚至防止后续核苷酸的掺入(例如,减少、最小化或者防止多个带电荷标签的核苷酸的掺入),诸如上文所公开的(例如,通过包括3'叠氮甲基或其他可逆封端基团)。然后可进行修饰以允许在随后的温育步骤期间随后掺入ffn,其中在温育步骤之间洗出游离的带电荷标签的核苷酸。
[0140]
在另一个示例中,带电荷标签的核苷酸和ffn两者可同时温育。例如,带电荷标签的核苷酸可为不同于ffn的种类(例如,c、g、t或a)。虽然两个核苷酸可与模板以及杂交多核苷酸和聚合酶同时温育,但它们仅可连续掺入,因为它们不与相同模板核苷酸互补。在一个
示例中,带电荷标签的核苷酸中的一个或另一个核苷酸可具有3'可逆封端基团(诸如叠氮甲基或其他可逆封端基团),以在没有化学移除该封端基团的情况下减少、最小化或者在一些情况下防止其后的另一个核苷酸的掺入。在另一个示例中,ffn可在3'端碳上缺乏羟基(诸如双脱氧核苷酸),以减少、最小化或在一些情况下防止随后进一步的核苷酸添加。在此类示例中,可掺入带电荷标签的核苷酸,之后掺入ffn,即使两者可能在一个或多个聚合反应期间同时存在。
[0141]
在一个示例中,模板可连接到基底。例如,模板的3'末端可直接或间接结合到基底诸如固体载体。在另一个示例中,模板的5'末端可直接或间接结合到基底诸如固体载体。在一个示例中,模板可通过一系列核苷酸直接或间接地连接到基底,这一系列核苷酸不旨在或选择用于编码掺入到杂交多核苷酸的核苷酸。例如,完全或至少不是在杂交多核苷酸可以是可延伸的以便掺入与将模板连接到表面的此类模板核苷酸互补并可与该模板核苷酸杂交的核苷酸时,将与此类核苷酸互补的带电荷标签的核苷酸或ffn与模板、杂交多核苷酸和聚合酶一起温育。例如,杂交多核苷酸的3'末端可与模板核苷酸互补杂交,该模板核苷酸距离模板的这种连接核苷酸5'端太远,使得无论是在将带电荷标签的核苷酸或ffn掺入该杂交多核苷酸之前或之后,聚合酶都不能使用这种连接核苷酸作为编码底物来将另外的核苷酸连接到杂交多核苷酸。模板也可通过其他化学连接物(诸如惰性聚合物,诸如聚乙二醇或其他惰性聚合物)连接到基底。
[0142]
在一些示例中,聚合酶反应可在存在带电荷标签的核苷酸以便由聚合酶根据模板进行掺入,而不存在另一种带荧光标签的核苷酸用于随后的掺入的情况下进行。洗涤步骤可在聚合后在存在第一核苷酸的情况下进行,以便移除过量的未掺入的核苷酸。然后可在存在聚合酶(无论是与在聚合酶催化的带电荷标签的核苷酸的掺入期间存在的聚合酶相同还是不同)的情况下,加入带荧光标签的核苷酸用于第二聚合反应。
[0143]
在其他示例中,聚合酶可直接或间接结合到基底诸如固体载体。在另一个示例中,模板可在溶液中并且不结合到基底。在另一个示例中,聚合酶可在溶液中并且不结合到基底。在又一个示例中,杂交多核苷酸可直接或间接结合到基底诸如固体载体。在其他示例中,杂交多核苷酸可在溶液中并且不结合到固体载体。固体载体可包括传导通道,如本文进一步所述。将聚合酶连接到基底的系链可具有适用于给定目的的任何给定长度。各种可用长度和化学组成的系链的示例在下文进一步详细解释。在一些示例中,聚合酶可通过共价连接物(诸如通过惰性聚合物,诸如聚乙二醇或其他惰性聚合物)连接到基底。在一些示例中,第一聚合酶、第二聚合酶或这两种聚合酶可在聚合反应期间处于溶液中,其中模板拴系到固体载体。
[0144]
在一个示例中,可存在介于1和10个之间的将模板引物直接或间接地连接到基底的连接核苷酸,或者可存在介于1和5个之间的将模板引物直接或间接地连接到基底的这种连接核苷酸,或者可存在介于大约5和10个之间的将模板引物直接或间接地连接到基底的这种连接核苷酸,或者可存在介于大约10和15个之间的将模板引物直接或间接地连接到基底的这种连接核苷酸,或者可存在介于大约15和20个之间的将模板引物直接或间接地连接到基底的这种连接核苷酸,或者可存在介于大约1和20个之间的将模板引物直接或间接地连接到基底的这种连接核苷酸,或者可存在介于大约20和30个之间的将模板引物直接或间接地连接到基底的这种连接核苷酸,或者可存在介于大约20和25个之间的将模板引物直接
或间接地连接到基底的这种连接核苷酸,或者可存在介于大约25和30个之间的将模板引物直接或间接地连接到基底的这种连接核苷酸,或者可存在介于大约15和30个之间的将模板引物直接或间接地连接到基底的这种连接核苷酸,或者可存在大约5、10、15、20、25、30个或更多个将模板引物直接或间接地连接到基底的这种连接核苷酸,其中大约意指在其后指示的数字的10%内。
[0145]
合适的基底的非排他性示例可包括:环氧硅氧烷、玻璃和改性的或官能化的玻璃、多面体倍半硅氧烷及其衍生物、塑料(包括丙烯酸、聚苯乙烯以及苯乙烯和其他材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、聚四氟乙烯(诸如得自chemours的)、环烯烃/环烯烃聚合物(诸如得自zeon的)、聚酰亚胺等)、尼龙、陶瓷/陶瓷氧化物、二氧化硅、熔融的二氧化硅或基于二氧化硅的材料、硅酸铝、硅和改性的硅(例如,硼掺杂的p+硅)、氮化硅、氧化硅、五氧化二钽或其他氧化钽、氧化铪、碳、金属、无机玻璃等。基底还可以是玻璃或硅或硅基聚合物(诸如多面体倍半硅氧烷材料),任选地在表面处具有氧化钽或另一种陶瓷氧化物的涂层。基底还可包括传导通道,如下文更详细地描述的。
[0146]
在一个示例中,固体载体可包括传导通道,如本文进一步解释的。在一个示例中,根据下文进一步解释的方法,传导通道可在将带电荷标签的核苷酸掺入多核苷酸链期间检测电荷标签。在一个示例中,将聚合酶连接到固体载体(诸如传导通道)的系链可包括受体区域,并且电荷标签和带电荷标签的核苷酸之间的连接可包括特异性区域,使得受体区域和特异性区域可在掺入带电荷标签的核苷酸期间彼此结合,如下文进一步解释的。在一个示例中,受体区域和与其结合的特异性区域的存在可在将电荷标签掺入杂交多核苷酸期间促进电荷标签与传导通道的缔合,从而增强传导通道对电荷标签的检测。
[0147]
还如下文进一步公开的,在给定的溶液中,带电荷标签的核苷酸的电荷标签可具有给定的德拜长度。德拜长度是电荷载流子在溶液中的净静电效应以及其静电效应持续多远的量度。带电荷标签的核苷酸的电荷标签的德拜长度的计算可根据考虑电荷标签和溶液的特征的公式来计算,如下文更全面描述的。德拜长度可确定电荷标签可与传导通道的接近程度,以便传导通道在将电荷标签掺入杂交多核苷酸期间检测电荷标签。在一个示例中,德拜长度可介于大约0.5nm和大约10nm之间、大约0.5nm和大约1nm之间、大约1nm和大约1.5nm之间、大约1.5nm和大约2nm之间、大约2nm和大约2.5nm之间、大约2.5nm和大约3nm之间、大约3nm和大约3.5nm之间、大约3.5nm和大约4nm之间、大约4nm和大约4.5nm之间、大约4.5nm和大约5nm之间、大约5nm和大约5.5nm之间、大约5.5nm和大约6nm之间、大约6nm和大约6.5nm之间、大约6.5nm和大约7nm之间、大约7.5nm和大约8nm之间、大约8nm和大约8.5nm之间、大约8.5nm和大约9nm之间、大约9nm和大约9.5nm之间、大约9.5nm和大约10nm之间、大约1nm和大约2nm之间、大约2nm和大约3nm之间、大约3nm和大约4nm之间、大约4nm和大约5nm之间、大约5nm和大约6nm之间、大约6nm和大约7nm之间、大约7nm和大约8nm之间、大约8nm和大约9nm之间、大约9nm和大约10nm之间、大约0.5nm和大约5nm之间、大约5nm和大约10nm之间、小于大约0.5nm或大于大约10nm,其中大约意指比其后的数字多或少10%。
[0148]
在一个示例中,第一聚合酶将带电荷标签的核苷酸聚合掺入杂交多核苷酸中,并且第二聚合酶将ffn聚合掺入聚合酶中。在一个示例中,第一聚合酶和第二聚合酶彼此不同。在另一个示例中,第一聚合酶和第二聚合酶可彼此相同。在一些示例中,第一聚合酶和第二聚合酶两者可同时存在;而在其他示例中,通过第一聚合酶掺入带电荷标签的核苷酸
可在存在第一聚合酶且不存在第二聚合酶的情况下发生,并且无论第一聚合酶是否也存在,ffn可随后在存在第二聚合酶的情况下掺入。在一些示例中,在掺入带电荷标签的核苷酸之后、在与ffn一起温育之前洗出第一聚合酶,这在与第二聚合酶一起温育时发生。在一个示例中,第一聚合酶可在给定动力学或在某些条件(诸如ph、张力或比第二聚合酶更优选的其他参数)下掺入带电荷标签的核苷酸,并且/或者第二聚合酶可在给定动力学或在某些条件(诸如ph、张力或比第一聚合酶更优选的其他参数)下掺入ffn。
[0149]
多种合适的聚合酶中的任一种聚合酶均可用于本文所述的方法或组合物中,包括例如从生物系统中分离的基于蛋白质的酶及其功能变体。除非另外指明,否则提及特定聚合酶(诸如下文所例示的那些特定聚合酶)时应理解为包括其功能变体。聚合酶特别有用的功能是使用现有核酸作为模板来催化核酸链的聚合。其他有用的功能在本文其他地方有所描述。可用的聚合酶的示例包括dna聚合酶和rna聚合酶、它们的功能片段以及包括它们的重组融合肽。示例性dna聚合酶包括那些已按结构同源性分类成标识为a、b、c、d、x、y和rt家族的聚合酶。家族a中的dna聚合酶包括,例如,t7 dna聚合酶、真核线粒体dna聚合酶γ、大肠杆菌(e.coli)dna pol i(包括klenow片段)、水生栖热菌(thermus aquaticus)pol i和嗜热脂肪芽孢杆菌(bacillus stearothermophilus)pol i。家族b中的dna聚合酶包括,例如,真核dna聚合酶a、6和e;dna聚合酶c;t4dna聚合酶、phi29 dna聚合酶、超嗜热古菌(thermococcus sp.)90n

7古细菌聚合酶(也称为9
°
n
tm
)及其变体(诸如美国专利申请公布第2016/0032377 a1号中公开的示例)以及rb69噬菌体dna聚合酶。家族c包括,例如,大肠杆菌dna聚合酶iiiα亚基。家族d包括,例如,来自于古细菌的广古菌门(euryarchaeota)亚域的聚合酶。家族x中的dna聚合酶包括,例如,真核聚合酶polβ、polσ、polλ和polμ,以及酿酒酵母(s.cerevisiae)pol4。家族y中的dna聚合酶包括:例如polη、polι、polκ、大肠杆菌pol iv(dinb)和大肠杆菌pol v(umud'2c)。dna聚合酶的rt(逆转录酶)家族包括,例如,逆转录病毒逆转录酶和真核端粒酶。示例性rna聚合酶包括但不限于病毒rna聚合酶,诸如t7 rna聚合酶;真核rna聚合酶,诸如rna聚合酶i、rna聚合酶ii、rna聚合酶iii、rna聚合酶iv和rna聚合酶v;以及古细菌rna聚合酶。任何其他合适的聚合酶,包括但不限于例如美国专利第8,460,910号中所公开的任何聚合酶,也包括在如本文所提及的聚合酶中,任何其他功能性聚合酶也包括在内,包括具有通过与上述提及的聚合酶中的任一种聚合酶进行比较而修饰的序列的那些功能性聚合酶,上述聚合酶仅作为非限制性示例的列表提供。
[0150]
返回图1,在掺入ffn后,可从杂交多核苷酸中洗去带电荷标签的核苷酸、ffn、聚合酶等。在一个示例中,蛋白质被降解以便使未通过常规洗涤步骤移除的任何残余聚合酶变性或以其他方式完全失活。此后,可通过已知的方法检测ffn。例如,可使用已知的光学荧光检测方法在表面上检测ffn,其中在杂交多核苷酸保持与模板杂交的表面上引出荧光并且从该表面检测荧光。因为根据本发明所公开的方法,ffn掺入只能在带电荷标签的核苷酸掺入后发生,所以测量ffn掺入可用作带电荷标签的核苷酸掺入的替代。在另一个示例中,杂交多核苷酸可与模板去杂交并在溶液中被洗脱,因而在所述洗脱溶液中而不是在表面上检测到荧光。可在表面上、在溶液中或其他地方采用用于测量通常连接到用于本文所公开方法的核苷酸上的荧光团的各种已知方法中的任一种方法。在一些示例中,在聚合酶或多核苷酸通过接头连接到表面的情况下,所连接的可以是可切割的,诸如蛋白酶切割位点(如果接头是肽接头)或如果需要能够被破坏以从表面释放聚合酶或多核苷酸的其他化学部分。
[0151]
可通过任何合适的方法进行检测,包括荧光光谱法或其他光学手段。ffn标记可以是在吸收能量后发射限定波长的辐射的荧光团。许多合适的荧光标记是已知的。例如,welch等人,(chem.eur:j.5(3):951

960,1999)公开了可用于本发明的丹酰官能化荧光部分;cockroft等人,(cytometry 28:206

211,1997)描述了荧光标记cy3和cy5的使用,其也可根据本公开的各方面使用。适用的标记也公开于以下参考文献中:prober等人,(science 238:336

341,1987);connell等人,(biotechniques5(4):342

384,1987);ansorge等人,(nucl.acids res,15(11):4593

4602,1987);以及smith等人,(nature 321:674,1986)。其他可商购获得的荧光标记包括但不限于荧光素、罗丹明(包括tmr、texas red和rox)、alexa、bodipy、吖啶、香豆素、芘、苯并蒽和花青素。可采用对前述任何内容的任何合适的修改以用于本文所公开的方法中并且根据本文所公开的方法使用。例如,ffn可包括此类连接的标签。可根据本公开使用可商购获得的带荧光标签的核苷酸。ffn的非限制性一般化示例可描绘如下:
[0152][0153]
在该示例中,荧光团通过接头序列连接到核苷酸的碱基。此类接头可包括用于将荧光团连接到核苷酸的各种化学连接部分。在其他示例中,荧光团可连接到核苷酸的不同部分或核苷酸的不同碱基。在所描绘的非限制性示例中,在3'端碳上指示可逆封端基团,但是此类封端基团不是必需的或存在于本公开所包括的所有示例中。
[0154]
在一个示例中,可通过修饰缓冲液或其他聚合酶反应条件(例如,螯合参与核苷酸碱基配对和/或通过第一聚合酶进行的聚合的溶液组分的金属或其他离子)来终止将带电荷标签的核苷酸掺入杂交多核苷酸中。在不同样品中,带电荷标签的核苷酸的掺入可在掺入停止后的不同时间终止,然后在所有样品的统一条件下掺入ffn。通过比较掺入到不同样品中的多核苷酸中的荧光的量,可比较测定不同样品中带电荷标签的核苷酸的掺入。在其他示例中,不是比较第一聚合酶的聚合持续时间,而是不同的第一聚合酶可相互比较,与不同的基底比较,与不同的带电荷标签的核苷酸比较,与聚合酶、模板和/或杂交多核苷酸所连接到的表面的不同表面化学性质比较,与聚合酶和基底之间的不同系链比较,与电荷标签和核苷酸之间的不同连接物比较,与具有不同缓冲液、ph和/或浓度的不同溶液比较,并且因此可修饰样品间的对于给定电荷标签的不同德拜长度或任何其他变量,并且可通过比较样品之间ffn(例如,通过荧光)掺入的量来比较对电荷标签掺入的影响。在一个示例中,为了进行此类确定,不执行或不需要通过传导通道进行电荷标签检测。
[0155]
核苷酸、模板或杂交多核苷酸不需要为脱氧核糖核苷酸。例如,核苷酸、模板或杂交多核苷酸可为核糖核苷酸。类似地,聚合酶不需要为dna聚合酶,而是可改为rna聚合酶。聚合酶也可为逆转录酶。在此类示例中,可选择带电荷标签的核苷酸和ffn以便适当地与模板核苷酸互补,从而通过聚合酶掺入杂交的聚合酶中。
[0156]
在一个示例中,杂交多核苷酸可变得与模板去杂交然后与模板再杂交。对杂交多核苷酸本身的提及是指在通过聚合酶聚合延伸期间的杂交,因为它掺入了带电荷标签的核苷酸或ffn。在此类掺入之间的杂交多核苷酸的去杂交包括在本文所公开的方法的各方面中。
[0157]
本公开的示例还提供了用于在核酸测序程序中检测到的核苷酸掺入事件的组合物和方法。需要基于电荷差异提供核苷酸差异识别的益处的检测系统,例如允许以高通量方式进行长测序读取。本文所述的示例可满足这种需要,并且也提供其他优点。如下文更详细地描述的带电荷标签的核苷酸作为组分被包括在内,并且同样适用于并且也旨在用于所有前述示例中。
[0158]
如本文所公开的,核苷酸上的昂贵且光敏的荧光标记具有用于不同检测系统的不同标记。常规荧光标记的检测可涉及昂贵的硬件诸如激光器和检测光学器件,这会增加检测仪器的尺寸。此外,使用更强大的软件对所生成的大量信息进行解码。重要的是,如本文所公开的,不需要昂贵的荧光团。通过用电荷标签替换荧光标签,可通过监测系统中的电流的传导通道来检测电荷。这允许进行“实时”测序,并且具有通过减少每个核苷酸掺入的循环时间来实现更快的周转时间的潜力。
[0159]
通过启用“实时”测序,在一个示例中,不涉及3'

oh处的封端基团。这降低了经修饰核苷酸的成本,因为涉及较少的合成步骤。另一个好处是,与化学修饰的大体积3'保护基团相比,聚合酶更适于掺入更靠近天然体系的具有3'oh的核苷酸。
[0160]
用于检测包含电荷的经修饰核苷酸的传导通道可响应于周围的电场。通过将具有电荷的经修饰核苷酸定位成紧密接近传导通道的表面来调节该场。在一些情况下电荷标签与表面的紧密接近度可能是重要的,诸如如果溶液中的盐或其他离子可屏蔽电荷,使其无法被传导通道检测到。特征屏蔽长度称为德拜长度,超过该长度,传导通道可能无法检测到电荷。
[0161]
经修饰核苷酸中包含的电荷可为从

200e到+200e之间的任何值,当完全线性拉伸时,电荷可超过160埃,而传导通道周围的德拜长度可为约1nm。因此,可能需要对核苷酸的携带电荷的修饰进行结构化,以促进传导通道对其的检测。
[0162]
除非另外指明,否则本文所用的术语应理解为具有其普通含义。下面列出本文所用的若干术语及其定义的示例。
[0163]
如本文所用,术语“阵列”是指连接到一个或多个固相基底的一组传导通道或分子,使得这些传导通道或分子可根据其相对位置彼此区分。阵列可包括各自位于固相基底上的不同可寻址位置(例如,在不同传导通道处)的不同分子。另选地,阵列可包括各自带有不同分子的单独的固相基底,其中可根据固相基底在固相基底所连接到的表面上的位置或根据固相基底在液体(诸如流体流)中的位置来识别不同的探针分子。阵列的分子可以是核酸引物、核酸探针、核酸模板或核酸酶诸如聚合酶和核酸外切酶。
[0164]
如本文所用,术语“连接”是指两件事情彼此接合、紧固、粘附、连接或结合的状态。例如,反应组分诸如聚合酶可通过共价键或非共价键连接到固相组分诸如传导通道。共价键的特征在于原子之间共享电子对。非共价键是不涉及共享电子对的化学键,并且可包括例如氢键、离子键、范德华力、亲水相互作用和疏水相互作用。
[0165]
如本文所用,术语“导电通道”旨在表示将其表面处或其周围电场中的扰动转换成
电信号的检测设备的一部分。传导通道可为导电通道。例如,如图3所示,导电通道5可将反应组分(例如,标记的核苷酸)的到达或离开转换成电信号。在本文所公开的示例中,导电通道5还可通过其与标记核苷酸的氧化还原活性电荷标签的相互作用将两种反应组分(模板核酸和标记核苷酸的核苷酸)之间的相互作用转换成可检测信号。
[0166]
导电通道5可以是传导通道2的通道。传导通道2可包括源极端子s和漏极端子d以及连接端子s、d的通道5。通道可具有任何合适的几何形状,例如管、线、板等。
[0167]
如本文所用,术语“传导通道”旨在表示将其表面处或其周围电场中的扰动转换成电信号的检测设备。例如,传导通道可将反应组分的到达或离开转换成电信号。传导通道还可将两种反应组分之间的相互作用或单一反应组分的构象变化转换成电信号。示例性传导通道是场效应晶体管(fet),诸如碳纳米管(cnt)、基于单壁碳纳米管(swnt)的fet、硅纳米线(sinw)fet、石墨烯纳米带fet(以及由2d材料诸如mos2、硅等制造的纳米带fet)、隧道fet(tfet)和陡峭亚阈值斜率设备(参见,例如,swaminathan等人,proceedings of the 51st annual design automation conference on design automation conference,第1

6页,isbn:978
‑1‑
4503

2730

5(2014);以及ionescu等人,nature 479,329

337(2011))。可用于本公开的方法和装置中的fet和swnt传导通道的示例在美国专利申请公布2013/0078622 a1中阐述。
[0168]
端子s、d可为任何合适的导电材料,包括电导体或半导体。合适的源极和漏极材料的示例包括钴、硅化钴、镍、硅化镍、铝、钨、铜、钛、钼、氧化铟锡(ito)、氧化铟锌、金、铂、碳等。
[0169]
传导通道5可包括能够氧化或还原氧化还原活性电荷标签的任何导电或半导电材料。材料可包括有机材料、无机材料或两者。合适的通道材料的一些示例包括硅、碳(例如,玻璃碳、石墨烯等)、聚合物诸如导电聚合物(例如,聚吡咯、聚苯胺、聚噻吩、掺杂有聚(4

苯乙烯磺酸)(pedot

pss)的聚(3,4

亚乙二氧基噻吩)等)、金属、生物分子等。
[0170]
在一些示例中,传导通道5也可为具有纳米级(在1nm至小于1μm的范围内)的至少一个尺寸的纳米结构。在一个示例中,该尺寸是指最大尺寸。作为示例,导电通道5可以是半导电纳米结构、石墨烯纳米结构、金属纳米结构和导电聚合物纳米结构。纳米结构可以是多壁或单壁纳米管、纳米线、纳米带等。
[0171]
如本文所用,当参考核酸使用时,术语“不同”意指核酸具有彼此不相同的核苷酸序列。两种或更多种不同的核酸可具有沿其整个长度不同的核苷酸序列。另选地,两种或更多种不同的核酸可具有沿其长度的相当大部分不同的核苷酸序列。例如,两种或更多种不同的核酸可具有对于两种或更多种分子不同的靶核苷酸序列部分,同时还具有在两种或更多种分子上相同的通用序列部分。术语“不同”可类似地应用于其他分子,诸如聚合酶和核酸酶。
[0172]
如本文所用,当参考项目的集合使用时,术语“每个”旨在识别集合中的单个项目,但不一定是指集合中的每个项目。如果明确公开或上下文另有明确规定,则可能会出现例外情况。
[0173]
如本文所用,当参考反应组分使用时,术语“标记”旨在表示可检测的反应组分或反应组分的可检测部分。可用的标记是可由传导通道检测的电荷标记(也称为电荷标签)。标记可以是待检测的反应组分内在的(例如,聚合酶的带电氨基酸),或者标记可以是反应
组分外在的(例如,氨基酸的非天然存在的修饰)。在一些示例中,标记可包括具有单独功能的多个部分。例如,标记可包括接头组分(诸如核酸)和电荷标签组分。
[0174]
如本文所用,当参考分子的部分使用时,术语“非天然的”旨在指在其天然环境中或在未被人类技术干预干扰的生物系统中未发现与分子连接的部分。在一些示例中,非天然部分是分子的合成修饰,其使得分子在结构上或化学上不同于未修饰的分子或具有天然修饰的分子。如本文所用,当参考用于过程的类似物使用时,术语“非天然的”旨在表示在发生该过程的自然环境中未发现的类似物。在一些示例中,非天然类似物是在结构上或化学上不同于类似物所属类别的其他类型分子的合成类似物。
[0175]
如本文所用,术语“核酸”旨在与其在本领域中的用途一致,并且包括天然存在的核酸或其功能类似物。特别有用的功能类似物能够以序列特异性方式与核酸杂交或能够用作复制特定核苷酸序列的模板。天然存在的核酸通常具有包含磷酸二酯键的主链。类似物结构可具有替代的主链键,包括本领域已知的多种主链键中的任一种主链键,诸如肽核酸(pna)或锁核酸(lna)。天然存在的核酸通常具有脱氧核糖(例如存在于脱氧核糖核酸(dna)中)或核糖(例如存在于核糖核酸(rna)中)。
[0176]
核酸可包含本领域已知的这些糖部分的多种类似物中的任一种。核酸可包括天然的或非天然的碱基。就这一点而言,天然脱氧核糖核酸可具有选自腺嘌呤、胸腺嘧啶、胞嘧啶和鸟嘌呤的一个或多个碱基;并且核糖核酸可具有选自尿嘧啶、腺嘌呤、胞嘧啶和鸟嘌呤的一个或多个碱基。可包含在核酸中的有用的非天然碱基是本领域已知的。
[0177]
如本文所用,术语“核苷酸”旨在包括天然核苷酸及其类似物、核糖核苷酸、脱氧核糖核苷酸、双脱氧核糖核苷酸以及被称为核苷酸的其他分子。该术语可用于指存在于聚合物中的单体单元,例如用于识别存在于dna或rna链中的亚基。该术语还可用于指不一定存在于聚合物中的分子,例如能够通过聚合酶以依赖于模板的方式掺入到多核苷酸中的分子。该术语可指例如在5

碳上具有0、1、2、3个或更多个磷酸基团的核苷单元。例如,核苷四磷酸、核苷五磷酸和核苷六磷酸可以是特别有用的,在5'碳上具有超过6个磷酸基团(诸如7、8、9、10或更多个磷酸基团)的核苷酸也可以是特别有用的。示例性天然核苷酸包括但不限于atp、utp、ctp和gtp(统称ntp),和adp、udp、cdp和gdp(统称ndp),或amp、ump、cmp或gmp(统称nmp),或datp、dttp、dctp和dgtp(统称dntp),和dadp、dtdp、dcdp和dgdp(统称dndp),和damp、dtmp、dcmp和dgmp(dnmp)。示例性核苷酸可包括但不限于任何nmp、dnmp、ndp、dndp、ntp、dntp以及其他nxp和dnxp,其中x代表从2至10的数(统称npp)。
[0178]
非天然核苷酸在本文中也被称为核苷酸类似物,包括不存在于天然生物系统中或基本上不通过聚合酶在其天然环境下(例如在表达聚合酶的非重组细胞中)掺入到多核苷酸中的那些核苷酸。特别有用的非天然核苷酸包括那些通过聚合酶以一种速率掺入到多核苷酸链中的那些非天然核苷酸,该速率显著快于或慢于另一种核苷酸(诸如具有与相同watson

crick互补碱基进行碱基配对的天然核苷酸)通过聚合酶掺入链中的速率。例如,当与天然核苷酸的掺入速率相比时,非天然核苷酸可以至少2倍不同的速率掺入—例如,至少5倍不同、10倍不同、25倍不同、50倍不同、100倍不同、1000倍不同、10000倍不同或更多倍不同。非天然核苷酸在被掺入到多核苷酸中后能够被进一步延伸。示例包括具有3'羟基的核苷酸类似物或在3'位置具有可逆终止子部分的核苷酸类似物,该核苷酸类似物可被移除以允许掺入了该核苷酸类似物的多核苷酸进一步延伸。可使用的可逆终止子部分的示例在例
如美国专利第7,427,673号、第7,414,116号和第7,057,026号以及pct公布wo 91/06678和wo 07/123744中有所描述。应当理解,在一些示例中,具有3'终止子部分或缺乏3'羟基的核苷酸类似物(诸如双脱氧核苷酸类似物)可在已掺入核苷酸类似物的多核苷酸不被进一步延伸的条件下使用。在一些示例中,核苷酸可不包括可逆终止子部分,或该核苷酸将不包括不可逆终止子部分,或该核苷酸将根本不包括任何终止子部分。在5'位置具有修饰的核苷酸类似物也是可用的。
[0179]
如本文所用,术语“保护部分”旨在表示连接到反应组分以减少、最小化或在一些情况下防止反应组分发生特定反应的化合物或其部分。例如,核酸分子可结合到核酸酶,使得该核酸分子减少、最小化或在一些情况下防止该核酸酶通过原本可导致该酶的降解或修饰的处理所导致的降解或修饰。抗体还可用于结合反应组分,以保护反应组分免于降解、失活或其他反应。
[0180]
如本文所用,术语“反应组分”旨在表示参与反应的分子。示例包括在反应中消耗的反应物、通过反应产生的产物、催化剂诸如促进反应的酶、溶剂、盐、缓冲液和其他分子。
[0181]
如本文所用,术语“排斥部分”旨在表示将占据空间以防止或抑制另一分子在该空间处的占据或抑制另一分子在该空间附近并置的分子或其部分。排斥部分可通过空间排斥、电荷排斥、疏水

亲水排斥或其他力起作用。
[0182]
如本文所用,当参考核苷酸使用时,术语“终止子部分”是指抑制或防止核苷酸与第二核苷酸形成共价键的核苷酸部分。例如,就具有戊糖部分的核苷酸而言,终止子部分可减少、最小化或在一些情况下防止在核苷酸的3'氧和第二核苷酸的5'磷酸之间形成磷酸二酯键。终止子部分可以是作为存在于核酸聚合物中的单体单元的核苷酸的一部分,或者终止子部分可以是游离核苷酸(例如,核苷三磷酸)的一部分。作为核苷酸的一部分的终止子部分可为可逆的,使得终止子部分可被修饰以使该核苷酸能够与第二核苷酸形成共价键。在特定示例中,终止子部分诸如可逆终止子部分可连接到核苷酸类似物的戊糖部分的3'位置或2'位置。
[0183]
根据上述定义,可理解下文所述的和在权利要求中列举的示例。
[0184]
本公开提供了可用于核酸测序程序中检测到的核苷酸掺入事件等的组合物、制备此类组合物的方法以及将它们用于此类程序的方法。本文所述的组合物和方法特别适用于例如单分子核酸测序反应,诸如边合成边测序。然而,应当理解,本文所述的组合物和方法可用于任何其他合适的检测方案,包括但不限于单分子检测。其中可使用本文所公开的组合物的用于核酸测序的装置和方法公开于例如美国专利申请第14/798,762号中。
[0185]
例如,核酸测序的方法可包括以下过程:(a)提供栓系到固体载体传导通道的聚合酶;(b)提供一个或多个标记核苷酸,由此当标记接近传导通道时,可通过该传导通道检测该标记的存在;以及(c)检测向与模板核酸互补的新生链中掺入该标记核苷酸。
[0186]
在核酸测序方法的一些示例中,使聚合酶与传导通道保持小于10nm、9nm、8nm、7nm、6nm、5nm、4nm、3nm、2nm或1nm的接近度。
[0187]
在一些示例中,标记或其部分(例如,电荷标签)可在(例如,通过聚合酶)掺入后从核苷酸切割。
[0188]
如本文所提供的,一个或多个标记核苷酸可包括多个电荷标签。例如,一个或多个标记核苷酸可包括每种类型核苷酸的独特电荷标签。例如,带有电荷标签的核苷酸可用于
通过聚合酶根据模板序列合成dna链,该模板序列可包括核苷酸串,包括碱基,例如,腺嘌呤、胸腺嘧啶、鸟嘌呤和胞嘧啶。如本文所公开的带有电荷标签的核苷酸可通过聚合酶掺入到与模板序列互补的核苷酸串中。如本文所公开的,当带有电荷标签的核苷酸被如此掺入时,传导通道可检测给定化合价(意指正或负)和大小的电荷,该电荷与每种核苷酸特异性地和差异性地相关联,允许记录掺入到生长链中的连续核苷酸的同一性,从而记录存在于与生长链互补的模板链中的核苷酸序列。电荷标签可为负电荷标签或正电荷标签,并且可具有为从

200e到+200e,诸如从

175e到+175e,或从

150e到+150e,或从

125e到+125e,或从

100e到+100e,或从

75e到+75e,或从

50e到+50e之间的任何值的电荷。
[0189]
在核酸测序方法中使用的传导通道可包括纳米线fet。任选地,传导通道可包括碳纳米管。传导通道可以是传导通道阵列的一部分。检测过程可包括连续检测多个掺入事件。
[0190]
本文所述的组合物、装置和方法可提供长核酸测序读取;快速读取;测序的高通量能力;以及可扩展的测序平台。在一些示例中,由于本文所述的方法和装置能够提供并行执行的多个读取中的通量的能力,因此可通过执行多个重叠读取来减轻单个读取精度中的任何折衷。
[0191]
图3中示出了示例性传导通道。此处,聚合酶1产生反应位点,其中核苷酸可掺入引物dna模板4中。聚合酶1通过系链3连接到纳米线fet2。该装置提供单分子灵敏度。反应位点处电荷分布的变化(例如,聚合酶构象变化、核苷酸掺入、带电标签的到达或离开、聚合酶与传导通道接近度的变化等)传输到栅极并且可被检测到。
[0192]
在特定示例中,本公开的装置或方法可使用深度缩放的finfet晶体管作为单分子传导通道。finfet传导通道受益于已经由领先的半导体制造商开发的技术。此外,可使用先前公布的组分,包括但不限于:(1)用于将溶菌酶固定在cnt上以实时观察酶加工性的那些组分,如在choi等人,science,335,319(2012)中所述,(2)用于将pol 1klenow片段固定在cnt上并实时观察dna加工性的那些组分,如在olsen等人,j.amer.chem.soc.,135,7885(2013)中所述,(3)用于将转导机制阐明为由于蛋白质变构运动引起带电残基移动的那些组分,如在choi等人,nanolett13,625(2013)中所述。本发明的方法还可采用美国专利申请公布2013/0078622a1中阐述的装置、装置部件和方法。
[0193]
标记核苷酸的一些示例还可包括特异性区域。因此,标记核苷酸可包括核苷酸、连接到核苷酸的磷酸基团的连接分子或接头,以及连接到接头的电荷标签。连接分子或接头可包含可与结合到传导通道的系链上的受体区域杂交的特异性区域。作为示例,特异性区域可以是能够暂时连接或结合到系链上的受体区域的任何核苷酸序列或肽。例如,特异性区域可包括核苷酸序列,并且受体区域可包括核苷酸序列,使得特异性区域和受体区域的序列中的核苷酸之间形成成对结合。在这种情况下,成对结合是指核苷酸之间的标准成对结合,诸如在g和c残基之间,或在a和t或u残基之间。
[0194]
特异性区域可包括核苷酸序列,并且受体区域可包括对应互补的核苷酸序列。在一个示例中,当聚合酶接受核苷酸以掺入到生长的多核苷酸链中(与模板多核苷酸互补)时,可使特异性区域和受体区域彼此足够接近,以便在它们之间形成成对结合。特异性区域和受体区域之间的此类成对结合可促进带电标签和传导通道之间的足够接近,从而促进在掺入核苷酸期间传导通道对电荷标签进行检测。
[0195]
在一个示例中,特异性区域可包括核苷酸序列,该核苷酸序列包括约一个核苷酸
至约六个核苷酸。在另一个示例中,特异性区域还可包括位于核苷酸序列两侧的肌苷。在一些示例中,特异性区域包括在电荷标签的一部分中。例如,特异性区域可由核苷酸或氨基酸的序列的片段或部分组成,这些片段或部分沿线性序列彼此分离,诸如通过电荷标签的部分分离,其中与受体区域的结合可诱导特异性区域的分离区域彼此接近,同时允许电荷标签采用给定的三维结构。
[0196]
在与系链缔合的标记核苷酸的示例中,标记核苷酸和系链之间的特异性结合亲和力与由非特异性结合相互作用产生的弱亲和力相结合。标记核苷酸可包含与系链的一部分互补的特异性区域。这些区域之间的特异性结合可由标准watson

crick碱基配对或其他非共价结合引起。在该示例中,特异性区域还可包括侧接核苷酸序列的肌苷(i)。肌苷是通用碱基,因此可与dna的全部四个天然核苷酸配对。另外的结合相互作用可由通用碱基(例如,肌苷i)与系链上的天然核苷酸的相互作用引起。因此,当标记核苷酸在掺入期间与聚合酶结合时,在标记核苷酸的特异性区域和系链的受体区域之间可发生协同结合,这可大大增加标记核苷酸和系链之间相互作用的稳定性。
[0197]
标记核苷酸与聚合酶之间的相互作用或聚合酶与系链之间的相互作用可导致电荷标签进入传导通道的感测区内。这种相互作用还可有助于将电荷标签保持在感测区内足够长的时间,以进行有效和完整的电荷检测。这种时间可能长达几十毫秒。这种相对较长的相互作用与针对溶液中存在的其他标记核苷酸的相互作用不同,其他标记核苷酸理论上可扩散并短暂地接触或接近传导通道。这种短暂的相互作用可能不够长,无法进行足够的电荷检测,因此在这种情况下,电荷标签不能被传导通道检测到。
[0198]
如本文所公开的,电荷标签可包括多肽、寡核苷酸、低聚肽核酸、或两种或更多种前述物质的任何组合。在一些示例中,电荷标签可包括选自氨基酸、核苷酸和接头的多个元件。这种分子可采用三维结构,以允许电荷标签的各个面携带的电荷凝聚,使得总电荷可凝聚到更小的区域中。这种增加的电荷密度可增加在通过聚合酶将核苷酸类似物掺入生长链期间由传导通道检测到的电荷,从而可确定这种合成中给定种类的核苷酸的存在。采用这种凝聚构象的电荷标签可最大限度地减少其电荷远离传导通道或在传导通道的大表面积上的分散,或两者兼而有之。因此,传导通道可能更有可能检测到电荷标签的更大量或更大比例的电荷。
[0199]
本文所公开的一些示例利用标记核苷酸与聚合酶(单独地或与系链结合)的协同结合,以便将电荷标签带到并保持在传导通道的感测区附近。与系链形成的复合物的稳定性可能相对较低,以致于未与聚合酶结合的标记核苷酸也不会形成复合物(即,在溶液中游离的标记核苷酸可能基本上不与系链结合)。换句话讲,此类复合物的解离率可能足够高,使得寿命很短。然而,当在标记核苷酸和聚合酶之间形成稳定缔合时,连接分子的局部浓度可在系链周围增加,从而导致高的缔合率。这样,与非缔合状态相比,聚合酶缔合状态下的总缔合时间可大大增加。标记核苷酸对聚合酶(单独地或与系链结合)的亲和力的协同效应可相加,得到总体上相当大的结合亲和力。在被聚合酶切割之后,协同效应丧失并且电荷标签也可与传导通道解离。
[0200]
特定示例可利用γ

磷酸标记的核苷酸与聚合酶和系链的协同结合。寡核苷酸部分:系链或特异性区域:受体区域的复合物的稳定性可能相对较低,以致于未与聚合酶结合的γ

磷酸标记的核苷酸也不会形成复合物,使得在溶液中游离的γ

磷酸标记的核苷酸基
本上不与系链结合。然而,核苷酸部分对聚合酶的亲和力和特异性区域(诸如寡核苷酸部分)对系链的受体区域的亲和力的协同效应可相加,得到总体上相当大的结合亲和力。在一些示例中,协同效应可利用核苷酸标记和系链之间的特异性结合亲和力连同由非特异性结合相互作用产生的弱亲和力的组合。例如,如上所述,在一些示例中,特异性结合可由标准watson

crick碱基配对引起,并且非特异性结合相互作用可由混杂碱基(例如,肌苷)与天然核苷酸的相互作用引起。因此,当γ

磷酸标记的核苷酸在掺入期间与聚合酶结合时,可发生协同结合,这可大大增加寡核苷酸部分与系链之间相互作用的稳定性。在γ磷酸被聚合酶切割后,协同效应可能丧失,并且寡核苷酸部分将与系链解离。其他类型的核苷酸部分:系链结合,诸如通过dna、rna、pna、氨基酸或它们的类似物或组合之间的非共价相互作用来促进这种协同效应。
[0201]
如图4所示,聚合酶可固定到传导通道,诸如单壁碳纳米管、硅纳米线或finfet。固定可通过包括dna、rna、pna、氨基酸或它们的类似物或组合的系链来进行。为了便于展示,图4示出了栓系到传导通道的四种聚合酶,每种聚合酶也与不同的γ

磷酸标记的核苷酸类型结合。如图所示,核苷酸可具有连接到γ

磷酸的寡核苷酸部分。与靶核酸的模板链正确匹配的β

或γ

磷酸标记的核苷酸可通过聚合酶保持在适当位置,该聚合酶也可结合到模板足够长的时间以使寡核苷酸部分或其他特异性区域与系链的受体区域暂时杂交(例如,通过watson

crick碱基互补或其他非共价结合)。杂交可导致电荷标签扰动传导通道周围的场,这可由于通过传导通道的晶体管电流的变化而产生可检测信号。该图示出了电荷标签进入在传导通道的1

2nm范围内的场。可将正确匹配的β

或γ

磷酸标记的核苷酸掺入与模板核酸杂交的新生链中。这继而可破坏β磷酸与新掺入的核苷酸之间的键。因此,电荷标签(无论是连接在核苷酸的β

还是γ

位置处)可自由地与系链解离并且远离传导通道扩散,从而使传导通道周围的场返回到其未扰动状态。信号分别在传导通道周围的场被扰动和返回到未扰动状态时的出现和消失可与将核苷酸掺入到靶核酸的新生链中相关联。
[0202]
在模板链的每个位置处掺入新生链中的核苷酸类型可基于掺入每种类型核苷酸中的标记的独特性质来确定。例如,四种类型的dntp可通过特异性区域与系链的缔合区域杂交的位置、特异性区域的长度和/或标记上带电部分的存在、电荷的化合价和电荷的大小来区分。例如,给定核苷酸可具有给定化合价和大小的电荷,其不被具有不同化合价和/或大小的电荷的其他核苷酸共享。传导通道能够检测电荷的化合价和/或大小的差异。在通过拴系到传导通道的聚合酶将具有带电标签的核苷酸掺入新生多核苷酸期间,传导通道可检测作为模板链的核苷酸的互补序列掺入的核苷酸的标签的化合价和/或大小。当聚合酶继续掺入下一种核苷酸,继而与模板的下一核苷酸互补时,掺入新生链中的此类下一种核苷酸的电荷的化合价和/或大小也可由传导通道检测。当将具有电荷标签的连续核苷酸掺入新生链时,以此类推。
[0203]
当传导通道检测到连续的电荷标签时,由电荷标签的差异引起的通过传导通道的电流的差异可被记录并存储在诸如计算机可读存储介质中,该计算机可读存储介质可被编程以便在生长的新生链基于传导通道针对由聚合酶聚合的每次掺入检测到的电荷的化合价和/或大小而被合成时,记录给定的、针对每次此类掺入所确定的核苷酸种类。
[0204]
图4提供了使用2个电荷标签和两个系链杂交位置实现碱基g、a、c和t之间的四态区分的示例。具体地,dctp唯一地用带负电的外在部分标记,dttp唯一地用带正电的外在部
分标记,datp和dgtp基于不存在任何外在电荷部分与其他两种核苷酸类型区分开,并且datp与dgtp基于当寡核苷酸部分与系链杂交时寡核苷酸部分与传导通道的差异接近度区分开。
[0205]
应当理解,可基于正电荷部分、负电荷部分和/或系链杂交位置的多种组合中的任一种组合来区分不同的核苷酸类型。另选地或除此之外,用于区分不同类型核苷酸的电荷部分可在电荷强度上不同,即使电荷具有相同的符号。图5所示的示例性构型提供了基于单个系链杂交位置和四个不同电荷部分的碱基g、a、c和t之间的四态区分。具体地,在该非限制性示例中,dgtp和dctp均含有将它们与datp和dttp区分开的带负电部分,并且dgtp可由于电荷明显高于dctp上的电荷而与dctp区分开。类似地,datp和dttp可由于与dttp部分相比,datp部分上的正电荷更高而彼此区分开。
[0206]
如本文前面所述,可通过使用具有核糖核苷酸的系链和具有2'

o

甲基(2'

o

me)和2'

氟(2'f)修饰的rna碱基的核苷酸标记来增强在沿系链的特定杂交位置处标签放置的精度。另选的构型可使用含有2'

o

me和2'f修饰的核糖核苷酸与具有核糖核苷酸的标记的拴系件,或者系链和标记两者均可包括天然核糖核苷酸与2'

o

me和2'f修饰的核糖核苷酸的混合物。虽然可以使用主要由rna组成的系链和/或寡核苷酸部分,但可能有利的是使用基于dna或基于pna或基于氨基酸的系链和/或寡核苷酸来避免与rna相关的核酸酶敏感性。例如,基于dna或基于pna的系链或基于氨基酸的系链和/或寡核苷酸可包括天然核糖核苷酸或非天然核糖核苷酸类似物,以实现本文所述的结合优点,同时降低不需要的核酸酶消化的风险。在另外的示例中,系链可包括与核苷酸标记中的脱氧核糖核苷酸互补的一个或多个脱氧核糖核苷酸,或者另选地,系链可包括与核苷酸标记中的脱氧核糖核苷酸互补的脱氧核糖核苷酸。
[0207]
将聚合酶连接到传导通道的系链可对于不同的核苷酸序列具有不同的结合位置(例如,受体区域),如本文所公开的若干示例中所示。两个或更多个核苷酸序列的结合位置可以重叠,或者它们可以是离散的而不重叠。出于说明的目的,系链序列在图10中描绘为一系列通用的“n”核苷酸。根据互补规则和所需杂交强度和特异性,可使用多种序列中的任一种序列。取决于系链的长度、受体区域的长度和特异性区域的长度,系链上的一些、全部或没有结合位点可重叠。在一些方面,互补碱基为标准dna碱基,但可使用任何核苷酸类似物(例如,可使用脱氧核糖核苷酸类似物)。
[0208]
核苷酸类似物的特异性区域的系链结合寡核苷酸部分可具有与系链受体区域上的互补序列特异性杂交的核苷酸的序列。在一些示例中,系链结合寡核苷酸部分还可包括非特异性地结合到系链的混杂核苷酸位置。此类位置可提供系链结合寡核苷酸部分与系链之间的弱相互作用,该弱相互作用有利于特定杂交结构的形成。例如,如图11所示,寡核苷酸部分可包括已知与dna的全部四个天然核苷酸混杂地(尽管弱地)结合的若干种肌苷(i)。系链结合寡核苷酸部分(例如,特异性区域)和系链(例如,受体区域)可通过系链结合寡核苷酸部分中的肌苷与系链中的天然核苷酸之间的相互作用形成弱复合物。这可允许序列的特定部分(例如,在图中表示为abc及其互补序列a'b'c')比在不形成弱复合物的情况下扩散所需的缔合更快。此外,一旦特定的复合物形成,肌苷便可提供进一步的稳定性。
[0209]
图11中的非限制性示例性系链结合寡核苷酸部分包括侧接特定序列两侧的混杂核苷酸位置。然而,应当理解,一个或多个混杂核苷酸位置可仅位于特定序列的5'或3'侧。
混杂核苷酸位置的其他示例包括通过简并寡核苷酸合成形成的那些或用本领域已知的其他核苷酸类似物形成以与2种或更多种类型的核苷酸混杂杂交的那些。
[0210]
本文示出的若干示例例示了具有不同长度的寡核苷酸特异性区域的多种不同核苷酸类似物的用途。在此类示例中,不同的核苷酸类似物类型可基于其特异性区域的不同长度来区分。另选地,不同核苷酸类似物可具有可不允许彼此区分的相同或类似长度的系链结合寡核苷酸部分。然而,与其他核苷酸类似物的特异性区域所结合的一个或多个受体区域相比,每种核苷酸类似物可具有结合到系链的不同受体区域的特异性序列。示例性构型在图12中示出,其中聚合酶与不同核苷酸类似物的结合将聚合酶置于四种可区分状态之一。在图12所示的非限制性示例中,atp类似物的系链结合寡核苷酸部分结合到系链上最靠近系链与聚合酶的连接点的位置,ttp类似物的系链结合寡核苷酸部分结合到系链上最远离系链与聚合酶的连接点的位置,并且gtp和ctp类似物的系链结合寡核苷酸部分分别结合到系链上与其他两个核苷酸类似物的系链结合寡核苷酸部分的结合位点相距中间距离的不同位置处。不同核苷酸类似物与聚合酶的结合可将聚合酶定位在距传导通道不同的距离处(例如,导致在系链中形成不同尺寸的环,如图所示)。在其中一个或多个核苷酸类似物包括电荷标签或其他可检测部分(例如,从系链结合寡核苷酸部分的端部延伸,该系链结合寡核苷酸部分的端部远离从将由聚合酶掺入到核苷酸序列中的核苷酸延伸的端部)的示例中,系链结合寡核苷酸部分与系链之间的结合可将电荷标签部分定位在距传导通道不同的距离处。在此类情况下,可至少部分地基于针对可检测电荷标签部分距传导通道的不同距离所产生的信号的差异来区分不同类型的核苷酸类似物。对于该例示性示例,核苷酸类似物被标识为atp、gtp、ctp和ttp,但可使用任何核苷酸类似物(例如,可使用脱氧核糖核苷酸类似物)。
[0211]
在其他示例中,诸如图15a和图15b所示,如本文所公开的带标签的核苷酸的特异性区域可包括各自杂交到系链的受体区域的不同区段的多核苷酸序列。在特异性区域的此类序列之间可以是一段不与受体区域的一部分杂交的核苷酸。因此,这两个序列可与系链的受体区域的对应互补部分和特异性区域的居间部分杂交,其中居间序列在别处自由杂交(诸如特异性区域的此类居间序列的两个互补部分彼此杂交以形成发夹结构,如图15a所示)或自由杂交或自身保持未特异性结合(诸如图15b所示)。在图15a和图15b中,“受体区域”指示与带标签的核苷酸的特异性区域杂交或以其他方式瞬时结合的系链的受体部分。在一些示例中,此类结合可通过传导通道(在图15a和图15b中由系链/受体区域所连接到的线来表示)增加对带电标签的检测。
[0212]
如图6所示的示例所示,将聚合酶连接到传导通道的系链不需要能够杂交到可能存在于类似核苷酸上的电荷标签或特异性序列。相反,传导通道可通过连接与聚合酶的系链分开的受体区域来官能化,核苷酸类似物的特异性区域可结合到该受体区域。不同核苷酸的区分可基于电荷标签的电荷化合价、电荷强度、特异性区域:受体区域结合复合物的长度、或受体区域:特异性区域复合物形成到传导通道或与传导通道相关的接近度或位置、或它们的组合来实现,无论受体区域是聚合酶系链的一部分还是以其他方式连接到传导通道。
[0213]
图7示出了带有根据本公开的电荷标签的核苷酸类似物的例示性示例。这只是如本文所述和所公开的核苷酸类似物的许多示例之一,并且不限制本公开的范围。在该非限
制性示例中,dt六磷酸通过包括特异性区域的接头区域连接到电荷标签。在该非限制性示例中,接头包括由叠氮

炔烃点击反应形成的共价键,但也可替代地采用其他化学物质,如本文进一步公开的。为了便于参考,当描述本文的核苷酸类似物的部分时,根据涉及核苷酸的脱氧核糖上的游离3'羟基的惯例,如图7所示的朝向分子右侧的区域将被称为3'端。相应地,如图7所示的朝向分子左侧的区域(在该示例中电荷标签位于其中)将被称为5'端,作为结合到核苷酸的核糖的5'碳的磷酸基团的延伸。
[0214]
可用于本文所述的装置和方法中的电荷标签的示例是磷酸部分,例如位于核酸部分的5'端。含有磷酸二酯基团的该部分可容易地在可用的寡核苷酸合成方案期间添加,并且可在寡核苷酸部分的末端产生两个带负电的氧,如图8所示。就其磷酸主链而言,多核苷酸链或低聚物也可具有大致与寡核苷酸链中的核苷酸数目成比例的负电荷,并且可包含在电荷标签中。寡核苷酸合成期间的化学磷酸化可通过使用2

[2

(4,4
’‑
二甲氧基三苯甲酰氧基)乙基磺酰基]乙基

(2

氰基乙基)

(n,n

二异丙基)

亚磷酰胺(购自glen research,sterling va,目录号cpr 10

1900)将dmt保护基团转化为5'磷酸基团来实现。可使用三

2,2,2

[3

(4,4'

二甲氧基三苯甲酰氧基)丙氧基甲基]乙基

[(2

氰基乙基)

(n,n

二异丙基)]

亚磷酰胺(购自glen research,sterling va,目录号10

1922

xx)、1,3



[5

(4,4'

二甲氧基三苯甲酰氧基)戊酰氨基]丙基
‑2‑
[(2

氰乙基)

(n,n

二异丙基)]

亚磷酰胺(购自glen research,sterling va,目录号10

1920

xx)、1

[5

(4,4'

二甲氧基三苯甲酰氧基)戊酰氨基]
‑3‑
[5

芴甲氧基羰基氧基戊酰氨基]

丙基
‑2‑
[(2

氰基乙基)

(n,n

二异丙基)]

亚磷酰胺(购自glen research,sterling va,目录号10

1921

xx),或含有各种数目的dmt(4,4'

二甲氧基三苯甲基)或fmoc(芴基甲氧基羰基)部分的寡核苷酸树枝状聚合物(诸如可得自glen research的那些或诸如图9a和图9b的那些(针对双重分支)或图9c的那些(针对三重分支))来制备具有不同数目负电荷的一系列电荷标签。可用的带正电的标签为2

[2

(4

单甲氧基三苯甲基)氨基乙氧基]乙基

(2

氰基乙基)

n,n

二异丙基)

亚磷酰胺(购自glen research,sterling va,目录号10

1905

xx)。另一种可用的带正电部分是5'伯胺,其在适当的ph下可具有单个正电荷。
[0215]
表1提供了可用作本文所述装置或方法中的标记的一些可用修改和电荷的非限制性列表。
[0216]
表1
[0217][0218][0219]
在一个方面,本公开涉及经修饰核苷酸,该经修饰核苷酸包括:核苷酸;连接到该核苷酸的磷酸基团的连接分子;以及连接到该连接分子的电荷标签,其中该电荷标签包括选自核苷酸和氨基酸的多个元件,以及元件之间的任选接头,并且其中该电荷标签包括内部折叠结构或二级结构。在一个示例中,其中电荷标签包括一个或多个磷酸二酯基团,以及元件之间的任选接头。在一些方面,核苷酸可为天然核苷酸或经修饰核苷酸。经修饰核苷酸
结构是本领域普通技术人员已知的,并且可包括对碱基或糖部分的结构修饰(例如,烷基化、氨基基团或保护基团)。在一些示例中,连接分子包括特异性区域。在一些示例中,特异性区域包括具有一至六个核苷酸的核苷酸序列。在一些示例中,电荷标签包含约1个电荷至约100个或约200个电荷。在一些示例中,连接分子包括如下式i所示的从

x2到(ch2)
m
基团的结构。在一个示例中,电荷标签不与本文方法中使用的聚合酶(例如,phi29)结合。在一些示例中,电荷标签包括多个核苷酸,该多个核苷酸包括结合到聚合酶系链中的受体区域的两个非邻接区域,从而在电荷标签中形成发夹结构。
[0220]
核苷酸类似物或标记核苷酸的示例由下式i的化合物表示:
[0221][0222]
其中n为3至10的整数,m为1至10的整数,t为0至50的整数,x1为直接键、c1‑
c
10
烷基、c1‑
c
10
氧杂烷基、c1‑
c
10
硫杂烷基或者c1‑
c
10
氮杂烷基,x2为c1‑
c
20
烷基,其中任选地一个或多个单独的ch2残基被肽键和(

o

ch2‑
ch2‑
)
a
中的一者或多者取代,其中a为1至24的整数,x3为直接键或寡核苷酸,其中当标记接近传导通道时,寡核苷酸与系链的受体区域杂交,f1选自荧光团和直接键,并且f2不存在或为荧光团,
[0223]
a为或酰胺键,并且
[0224]
y选自
q为1至100的整数,并且
[0225]
b选自:氨基酸;核苷酸;其中r选自y和氢;以及树枝化基元;并且其中当b为树枝化基元时,q等于1,并且q个b具有电荷和电荷密度。在一个示例中,提供了一种方法,该方法包括检测通过聚合酶向与模板多核苷酸链互补的新生多核苷酸链掺入标记核苷酸,其中聚合酶通过系链栓系到固体载体传导通道,该标记核苷酸为式i的化合物,并且传导通道用于在掺入期间检测标记核苷酸。
[0226]
在一个示例中,b包括电荷标签,并且该电荷标签包括核苷酸、寡核苷酸、氨基酸、肽核酸或它们的组合,其中该电荷标签具有内部折叠结构或二级结构。
[0227]
如本文进一步解释的,制备式i的化合物可包括通过包括连接反应的反应形成a,并且该连接反应选自叠氮

炔烃铜辅助的点击反应、四嗪

反式环辛烯连接、叠氮

二苯并环辛炔基团无铜点击反应和硫醇

马来酰亚胺缀合。
[0228]
还提供了诸如在将式i的化合物的核苷酸部分掺入到多核苷酸的新生链期间,用电荷检测器检测式i的化合物的电荷标签的方法。在非限制性示例中,检测可在核酸测序期间发生,包括(a)提供栓系到固体载体传导通道的聚合酶;(b)提供一种或多种式i的化合物,由此当标记接近传导通道时,可通过该传导通道检测该化合物的存在;以及(c)使用该传导通道检测向与模板核酸互补的新生链中掺入该化合物。
[0229]
还提供了式i的化合物,其中b包括具有一种或多种茎

环形状、一种或多种三叶草形状、一种或多种管状形状、一种或多种环形形状、一种或多种立方体形状、一种或多种十字形形状、一种或多种球形形状、一种或多种矩形形状、一种或多种锥体形状、一种或多种菱形形状、一种或多种层状形状、一种或多种柱状形状、一种或多种波纹形形状、或上述形状中的两种或更多种形状的任何组合的一种或多种寡核苷酸。在式i的化合物的另一个示例中,b包括具有一种或多种卷曲形状的一种或多种多肽。本发明还提供了式i的化合物,其中b包括形成十字形形状的一种或多种寡核苷酸、键合到该一种或多种寡核苷酸的一种或多种肽核酸分子,以及键合到该一种或多种肽核酸分子的一种或多种多肽。
[0230]
还提供了式i的化合物,其中b具有介于

100e和+100e之间的电荷。还提供了式i的化合物,其中b具有介于

100e和+100e之间的电荷以及介于

100e/立方纳米和+100e/立方纳米之间的电荷密度。还提供了式i的化合物,其中b具有介于

200e和+200e之间的电荷。还提供了式i的化合物,其中b具有介于

200e和+200e之间的电荷以及介于

200e/立方纳米和+200e/立方纳米之间的电荷密度。
[0231]
在一些示例中,式i的化合物可任选地包括荧光团,诸如由f1、f2或两者表示的荧光
团。荧光团的一些非限制性示例包括花青染料(例如,cy2、cy3或cy5)、异硫氰酸荧光素、罗丹明荧光团(例如,四甲基罗丹明)或其他荧光团。式i化合物中荧光团的任选存在可提供额外的用途,诸如用于检测包括荧光团的带标签的核苷酸。例如,含有荧光团的电荷标签的存在不仅可通过检测由该标签携带的电荷的存在、化合价和大小来检测,而且可通过检测荧光发射的方法诸如荧光共振能量转移来检测。
[0232]
还提供了带标签的核苷酸,其中该电荷标签包括一种或多种肽核酸。在一些示例中,电荷标签包括一种或多种肽核酸,并且该一种或多种肽核酸连接到一个或多个带电荷的氨基酸。
[0233]
本发明还提供了形成式i的化合物的方法,其中该电荷标签包括寡核苷酸并且由dna折纸形成。dna折纸可涉及折叠dna以产生纳米级的非任意形状。致密的折纸dna结构可允许高电荷密度,允许式i的不同化合物中电荷密度的变化。较高的电荷、较高的电荷密度以及改变电荷标签的电荷和电荷密度的更大灵活性可增加传导通道对电荷标签的检测概率,并且还允许区分由传导通道检测到的不同电荷标签。可由电荷标签携带的更大范围的电荷允许获得由式i的化合物的不同示例携带的电荷之间的更大差异。在一些示例中,不同的核苷酸可通过由它们作为式i的化合物所连接到的标签携带的电荷彼此区分。因此,传导通道能够基于由不同的此类核苷酸携带的电荷大小的差异来差异性地检测构成式i的化合物的一部分的不同核苷酸。
[0234]
b可包括带正电的氨基酸诸如精氨酸、组氨酸和赖氨酸,从而产生具有正电荷的电荷标签。b可改为包括天冬氨酸和谷氨酸,从而产生具有负电荷的电荷标签。在一些示例中,b为分支多肽、或线性多肽、或环状多肽。在一些示例中,b可为单个氨基酸或具有从2到10个或从11到20个之间的任何数目的氨基酸的多肽。在一些示例中,b的一些氨基酸可能不带电荷,并且在其他示例中,b可含有与b的其他氨基酸带相反电荷的一些氨基酸,然而b仍可保留总体正电荷或负电荷。
[0235]
在式i的该非限制性示例中,直接键合到n个磷酸基团的核苷酸可以是可由聚合酶识别并且掺入到合成的核苷酸序列中,由此与模板序列互补的核苷酸。虽然核苷酸类似物在添加到生长的合成多核苷酸序列期间通过聚合酶保持在适当位置,但类似物的其余部分可从其延伸,并且如本文所公开的,对于传导通道附近的聚合酶,电荷标签(诸如由式i中的b表示并且在其直接结合的带电肽中)可移动或被带到传导通道附近,使得传导通道可感测该电荷的化合价和大小。不同的核苷酸类似物可在类似物的3'端含有不同的核苷酸,并且相应地在类似物的5'端含有不同的肽电荷标签,使得当聚合酶与不同的核苷酸类似物缔合以将核苷酸掺入被合成的核苷酸序列中时,拴系到聚合酶的传导通道可检测电荷化合价和大小的差异。在这些示例中,聚合酶可切割除一个直接与核苷酸类似物的5’核苷酸结合的磷酸基团之外的所有磷酸基团,使得核苷酸类似物的dnmp部分保留在合成的核苷酸序列中,其中5'磷酸基团自由结合到下一个要掺入的核苷酸上,并且被切割的核苷酸类似物的剩余部分自由从复合物中解离。
[0236]
直接结合到3'核苷酸的一个磷酸基团或一系列磷酸基团可包括1、2、3、4、5、6、7、8、9或10个磷酸基团。其他示例可包括多于10个磷酸基团。然后核苷酸类似物的该部分可通过包括1

10个

ch2‑
基团的烷基键连接。其他示例可包括在该位置处的11

20个此类基团。在其他示例中,这些1

10或11

20个

ch2‑
基团中的一个或多个基团可被c1至c
20
烃取代。
[0237]
核苷酸类似物的该部分还可进一步通过0至50个氧杂烷基(诸如

o

ch2‑
ch2‑
基团)连接。在其他示例中,这些0

50个

o

ch2‑
ch2‑
基团中的一个或多个基团可被c1至c
150
烃取代。核苷酸类似物的该部分可进一步通过包括如由x1表示的0

10个

ch2‑
基团的烷基键连接。x1的其他示例可包括在该位置处的11

20个此类基团。在x1的其他示例中,这些1

10或11

20个

ch2‑
基团中的一个或多个基团可被c1至c
20
烃取代。x1还可为直接键、c1‑
c
10
烷基、c1‑
c
10
氧杂烷基、c1‑
c
10
硫杂烷基或者c1‑
c
10
氮杂烷基。
[0238]
如下文更全面描述的,a表示连接基团,核苷酸类似物的5'末端可通过该连接基团连接到朝向核苷酸类似物的3'末端的电荷标签。例如,核苷酸多磷酸可具有附加到脱氧核糖(或核糖)最远侧的5'磷酸基团的官能团,该官能团的末端可为反应性基团。反应性基团是能够与另一化学基团(一起为两个反应性基团)在受控条件下(诸如在一种或多种特定试剂的存在下,或在预定ph或温度下等)反应以在两者间形成一个或多个共价键的化学基团。例如,类似于式i的部分或为式i的部分的示例的组合物(从3'核苷酸直至a或缺少一些数目的键的a)可商购获得或根据已知的方法合成。然后可将反应性基团附加到此类化合物的末端,使得具有另一反应性基团(第一反应性基团可与之反应以形成共价键)的电荷标签可一起反应,从而将电荷标签共价连接到3'核苷酸以形成式i的化合物。
[0239]
x2可连接到a。x2可为c1‑
c
20
烷基,其中单独的ch2残基可独立地被肽键和(

o

ch2‑
ch2‑
)
a
中的一者或多者取代,其中a为1至24的整数。在x2的其他示例中,a可为6至20的整数。在其他示例中,x2的1

20个烷基中的一个或多个烷基可被c1至c
20
烃取代。
[0240]
在一个示例中,b可表示通过磷酸酯键连接到x2的电荷标签。b可包括1至100个含有磷酸二酯基团的部分。在一个示例中,b可包括1至200个含有磷酸二酯基团的部分。由此类磷酸二酯基团中的氧原子携带的负电荷可在b电荷标签上赋予负电荷,其大小与部分的数量成比例。b的q个部分中的每个部分可为与b的其他部分中的任一个部分不同的部分,或者它们可彼此全部相同。例如,b的任一个或多个部分可为具有腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤碱基的dnmp。b的任一个或多个部分可为:
[0241]
c3间隔基其中r为氢。
[0242]
在一些示例中,b的任何部分可包括任何npp(多磷酸核苷酸)。电荷化合价、大小或二者不同于不同3’核苷酸所结合到的其他电荷标签的电荷标签允许通过传导通道区分鉴定核苷酸类似物,因为这些核苷酸类似物在多核苷酸合成期间由拴系在其上的聚合酶保持。在一些示例中,一些核苷酸类似物为式i的化合物或如本文所公开的类似化合物。在一些示例中,用于边合成边测序反应的所有核苷酸都含有带电标签,该带电标签包括如本文所公开的一个或多个磷酸二酯基团,诸如式i的化合物或相关化合物的示例。在其他示例中,用于边合成边测序反应的一些核苷酸含有带电标签,该带电标签包括如本文所公开的一个或多个磷酸二酯基团,诸如式i的化合物或相关化合物的示例,而用于边合成边测序反应的其他核苷酸含有不包括此类化合物的带电标签。
[0243]
在其他示例中,每个b可独立地选自精氨酸、组氨酸和赖氨酸,从而产生具有正电荷的电荷标签。在另一个示例中,每个b可独立地选自天冬氨酸和谷氨酸,从而产生具有负电荷的电荷标签。在一些示例中,q个b为分支多肽、或线性多肽、或环状多肽。在一些示例中,q个b可为单个氨基酸或具有从2到10个或从11到20个之间的任何数目的氨基酸的多肽。在一些示例中,b的一些氨基酸可能不带电荷,并且在其他示例中,b可含有与b的其他氨基酸带相反电荷的一些氨基酸,然而b仍可保留总体正电荷或负电荷。在一些示例中,b可包括非天然氨基酸。
[0244]
在其他示例中,b可为包括一个或多个结构重复单元和多个末端单元的z代树枝化基元,其中z为1至6的整数,该结构末端单元选自:
[0245]
其中p1为1至3的整数,其中p1‑
ch2‑
基团中的任一个或多个基团任选地被1至3个

o

ch2‑
ch2‑
基团取代,p2为1至3的整数,其中p2‑
ch2‑
基团中的任一个或多个基团任选地被1至3个

o

ch2‑
ch2‑
基团取代,并且端基选自羧酸、磺酸、膦酸、氨基基团或季铵基团。
[0246]
b可表示通过其自由价端连接到x2的树枝化基元电荷标签。在一些示例中,本文所公开的树枝化基元可不连接到核苷酸类似物,例如在该树枝化基元已化学键合到核苷酸类似物上之前。b可包括具有2个支化度的结构重复单元,诸如由下式表示:
[0247][0248]
或者,b可包括具有3个支化度的结构重复单元,诸如由下式表示:
[0249][0250]
如本文进一步公开的,树枝化基元电荷标签可以是从1到6代之间的任一代的尺寸。末端结构重复单元上的端基可带正电或带负电。因此,具有2个支化度的树枝化基元可产生具有2
z
电荷的电荷标签,具有3个支化度的树枝化基元可产生具有3
z
电荷的电荷标签(其中每个端基的电荷大小为1,z表示代数)。
[0251]
在b表示树枝化基元的示例中,端基可以是许多带电官能团中的任一种,诸如羧酸、磺酸、膦酸、氨基基团或季铵基团,或任何其他带电官能团。在一些示例中,树枝化基元的结构重复单元可包括在除末端结构重复单元的端基之外的原子上的电荷。例如,作为一个非限制性示例,结构重复单元可在支化点处包含季铵基团,其可携带正电荷。与仅可存在于末端结构重复单元上的带电端基不同,此类内部电荷可存在于树枝化基元中的结构重复单元的每个实例上。
[0252]
可存在肽键,诸如在式i中任选地以x2表示。在其他示例中,代替式i中所示的肽键,可存在c1至c
20
烃,或直接键。
[0253]
对于a,这一将核苷酸连接到电荷标签的接头可通过反应性基团之间的连接反应形成。例如,a可通过具有叠氮(或炔烃)基团的核苷酸与具有炔烃(或叠氮)基团的电荷标签之间的叠氮

炔烃铜辅助的点击反应形成,从而产生诸如以下或其等同物的化学结构:
[0254][0255]
或者,a可通过具有四嗪(或反式环辛烯)基团的核苷酸与具有反式环辛烯(或四嗪)基团的电荷标签之间的四嗪(tet)

反式环辛烯(tco)连接形成,从而产生诸如以下或其等同物的化学结构:
[0256][0257]
或者,a可通过具有叠氮(或二苯并环辛炔)基团的核苷酸和具有二苄基环辛基(或叠氮)基团的电荷标签之间的叠氮

二苯并环辛炔(dbco)基团无铜点击反应形成,从而产生诸如以下或其等同物的化学结构:
[0258][0259]
或者,a可通过具有硫醇(或马来酰亚胺)基团的核苷酸与具有马来酰亚胺(或硫醇)基团的带电标签之间的硫醇

马来酰亚胺缀合形成,从而产生诸如以下或其等同物的化学结构:
[0260]
[0261]
或者,a可通过具有胺(或n

羟基琥珀酰亚胺酯)基团的核苷酸与具有n

羟基琥珀酰亚胺酯(或胺)基团的带电标签之间的n

羟基琥珀酰亚胺酯

胺键反应形成,从而产生酰胺键。
[0262]
通过合适的反应性基团之间的其他连接化学形成的其他合适的连接基团可结合到本公开中以形成3'核苷酸可通过其连接到电荷标签的a的其他结构。
[0263]
式i的b表示电荷标签。如本文所公开的,电荷标签可包括多肽、寡核苷酸、低聚肽核酸或树枝化基元,或前述的至少两者的组合。电荷标签的电荷可由此类部分的带电官能团携带,诸如磷酸二酯键、酰胺基团、羧酸基团或可添加到此类化合物中的其他带电官能团,诸如一种或多种磺酸、膦酸或季铵基团。如本文所公开的,电荷标签可采用特定的三维取向,使得由其元件携带的电荷被保持在一起,并被抑制或在一些情况下被防止散开并远离传导通道。通过增加电荷标签的电荷密度的这种电荷凝聚可增加传导通道检测到的电荷。
[0264]
电荷标签可被合成以便具有适用于形成根据前述的点击化学或连接反应的反应性基团。例如,电荷标签可具有叠氮或炔烃基团(诸如用于通过叠氮

炔烃铜辅助的点击反应共价连接到并包含在核苷酸类似物中作为电荷标签),或四嗪(tet)或反式环辛烯基团(诸如用于通过四嗪(tet)

反式环辛烯(tco)连接共价连接到并包含在核苷酸类似物中作为电荷标签),或叠氮基团或dbco基团(诸如用于通过叠氮

dbco基团无铜点击反应共价连接到并包含在核苷酸类似物中作为电荷标签)、或硫醇(例如半胱氨酸残基)或马来酰亚胺基团(诸如用于通过硫醇

马来酰亚胺缀合共价连接到并包含在核苷酸类似物中作为电荷标签)。也可采用其他已知的连接、点击化学或其他共价连接化学,其中对应的反应性基团连接到电荷标签允许其共价连接到核苷酸类似物。
[0265]
可存在肽键,诸如式i中在a和5'核苷酸之间表示。在其他示例中,代替式i中所示的肽键,可存在c1至c
20
烃,或直接键。
[0266]
一些合适的示例包括式i的化合物的修饰或变型,其结合了上文所讨论的与系链(聚合酶通过其拴系到传导通道)的受体区域可如何与核苷酸类似物的特异性区域杂交或以其他方式形成非共价键的特征。例如,3'核苷酸和5'电荷标签之间的类似核苷酸的一些部分可掺入能够与系链形成非共价键的核苷酸、pna残基或氨基酸,聚合酶通过该系链连接到传导通道,或连接到用从传导通道延伸并连接到该传导通道的受体区域官能化的部分,该传导通道本身可以不是此类系链的一部分,并且还可包括核苷酸、pna残基或氨基酸或它们的组合。前述可取代或添加到如本文所公开的式i化合物的介于5'电荷标签和3'核苷酸之间的区域。此类取代或添加可有助于将类似核苷酸协同结合到聚合酶和系链(或传导通道的除系链之外的官能化部分,以用于与此类取代或添加结合),以促进电荷标签与电荷检测器的检测区域的缔合,该缔合具有适当长的持续时间以允许检测电荷标签从而记录并表示带有此类电荷的核苷酸类似物的掺入,如本文所公开的。
[0267]
在一些示例中,电荷标签对三维结构的采用可通过将特异性区域的原本在空间上不同的元件聚集在一起而导致特异性区域的形成,从而允许如此组装的特异性区域与受体区域的结合。在不采用电荷标签的特定三维结构的情况下,此类特异性区域形成和受体区域结合可能不发生或可能不太可能发生或仅非常短暂地发生。在其他示例中,特异性区域的原本不同元件在结合到受体区域时聚集在一起可诱导或促进电荷标签对给定三维构象
的采用。在一些示例中,采用电荷标签的三维构象以及特异性区域的原本空间远离元件的聚集可以是协同的,使得每个元件促进另一个元件。在一些情况下,电荷标签如此采用的三维构象导致比原本可能出现的电荷密度更高的电荷密度,并且可增加传导通道对电荷标签的检测。
[0268]
可使用肽电荷标签的各种设计。使用固相肽合成,可在电荷标签中包括21个氨基酸中的任一个氨基酸。此外,经修饰的氨基酸也是可商购获得的,并且可被添加到肽电荷标签中以进一步调节其性质。除了使用具有带电荷的侧链的氨基酸诸如精氨酸、组氨酸和赖氨酸(正电)以及天冬氨酸和谷氨酸(负电)之外,还可将其他氨基酸掺入肽电荷标签中以减弱其亲水性、长度和尺寸。
[0269]
如上文所公开的,在一个示例中,肽电荷标签可以线性链(参见图14a)、分支链(参见图14b和图14c)或环状链(参见图14d)的形式存在。
[0270]
通过使用不同长度的氨基酸的不同组合,诸如kkkkk(seq id no:8)或eeeee(seq id no:9)(或带电氨基酸的其他组合,具有或不具有另外的不带电氨基酸),4种不同的核苷酸类似物可被区分用于测序,或者各种核苷酸类似物可基于来自每个肽电荷标签的特征性电流特征而被区分。其他更复杂的三维构象也是可能的。例如,肽电荷标签可采用卷曲构象,诸如α

螺旋。此类结构可包括正电荷和负电荷氨基酸,但总体上带有正电荷或负电荷。例如,带相反电荷的氨基酸的放置可诱导它们之间的结合并采用α

螺旋或其他结构,其中过量的正电荷或过量的负电荷被保持在一起,增加了电荷密度。在其他示例中,类似的结合可促进采用卷曲螺旋结构,包括净正电荷或负电荷的密度。
[0271]
电荷标签也可包括寡核苷酸。可使用上述用于将肽电荷标签连接到核苷酸类似物的点击化学和连接化学反应来将寡核苷酸电荷标签连接到核苷酸类似物。
[0272]
寡核苷酸电荷标签可采用促进以升高的电荷密度压缩其电荷的各种三维取向。例如,寡核苷酸的核苷酸之间的磷酸二酯键可具有负电荷。通过采用凝聚的三维结构,寡核苷酸的负电荷可保持彼此接近,从而增加传导通道对此类电荷标签的检测。例如,寡核苷酸可采用熟知的结构,诸如茎

环结构、三叶草结构或十字形结构(诸如霍利迪交叉)。多核苷酸折纸技术也可用于设计采用增加电荷密度的其他构象的多核苷酸电荷标签。多核苷酸电荷标签可采用管状形状、环形形状、立方体形状或球形形状。此类形状可产生具有比具有相同核苷酸组成但不采用三维构象的寡核苷酸(诸如如果其被拉伸成线性构象)将具有的电荷密度更高的电荷密度的寡核苷酸电荷标签。
[0273]
为方便和清楚起见,本文描述了说明书、实施例和权利要求中采用的某些术语。
[0274]
除非另外指明,否则烷基旨在包括线性或分支的饱和烃结构以及它们的组合。烷基是指具有1至20个碳原子—例如,1至10个碳原子,诸如1至6个碳原子等的烷基。烷基的示例包括甲基、乙基、丙基、异丙基、正丁基、仲丁基、叔丁基等。
[0275]
环烷基是烃的子集并且包括3至8个碳原子的环状烃基。环烷基的示例包括环丙基、环丁基、环戊基、降冰片基等。
[0276]
c1至c
20
烃包括烷基、环烷基、聚环烷基、烯基、炔基、芳基以及它们的组合。示例包括苄基、苯乙基、炔丙基、烯丙基、环己基甲基、金刚烷基、樟脑基和萘乙基。烃是指由氢和碳作为唯一元素组分构成的任何取代基。
[0277]
除非另外指明,否则术语“碳环”旨在包括其中环原子均为碳但具有任何氧化态的
环系。因此,(c3‑
c
12
)碳环是指非芳族和芳族体系,包括诸如环丙烷、苯和环己烯的体系。如果没有另外限制,则碳环是指单环、双环和多环。(c8‑
c
12
)碳多环是指诸如降冰片烷、萘烷、茚满和萘的体系。
[0278]
烷氧基是指通过氧与母体结构连接的直链或支链构型的具有1至20个碳原子—例如1至10个碳原子,诸如1至6个碳原子等的基团。示例包括甲氧基、乙氧基、丙氧基、异丙氧基等。
[0279]
氧杂烷基是指其中一个或多个碳(以及它们相关的氢)已被氧取代的烷基残基。示例包括甲氧基丙氧基、3,6,9

三氧杂癸基等。术语氧杂烷基旨在如本领域所理解的那样[参见“namer and indexing of chemical substances for chemical abstract”,american chemical society出版,2002年版,196,但不限于127(a)—该参考文献全文以引用方式并入]—其是指其中氧通过单键与其相邻原子键合(形成醚键)的化合物;它不是指如存在于羰基中的双键氧。类似地,硫杂烷基和氮杂烷基是指其中一个或多个碳已分别被硫或氮取代的烷基残基。氮杂烷基的示例包括乙基氨基乙基和氨基己基。
[0280]
杂环是指其中一至四个碳被选自n、o和s的杂原子取代的环烷基或芳基碳环残基。杂芳基是其中杂环是芳族的杂环的子集。杂芳环的示例包括:呋喃、苯并呋喃、异苯并呋喃、吡咯、吲哚、异吲哚、噻吩、苯并噻吩、咪唑、苯并咪唑、嘌呤、吡唑、吲唑、噁唑、苯并噁唑、异噁唑、苯并异噁唑、噻唑、苯并噻唑、三唑、四唑、吡啶、喹啉、异喹啉、吡嗪、喹喔啉、吖啶、嘧啶、喹唑啉、哒嗪、噌啉、酞嗪和三嗪。
[0281]
如本文所用,术语“任选取代的”可与“未取代或取代的”互换使用。术语“取代的”是指指定基团中的一个或多个氢原子被指定基团取代。例如,取代的烷基、芳基、环烷基、杂环基等是指其中每个残基中的一个或多个h原子被卤素、卤代烷基、烷基、酰基、烷氧基烷基、羟基低级烷基、羰基、苯基、杂芳基、苯磺酰基、羟基、低级烷氧基、卤代烷氧基、氧杂烷基、羧基、烷氧基羰基[

c(=o)o

烷基]、烷氧基羰基氨基[hnc(=o)o

烷基]、羧酰胺基[

c(=o)nh2]、烷基氨基羰基[

c(=o)nh

烷基]、氰基、乙酰氧基、硝基、氨基、烷基氨基、二烷基氨基、(烷基)(芳基)氨基烷基、烷基氨基烷基(包括环烷基氨基烷基)、二烷基氨基烷基、二烷基氨基烷氧基、杂环基烷氧基、巯基、烷硫基、亚砜、砜、磺酰基氨基、烷基亚磺酰基、烷基磺酰基、烷基磺酰基氨基、芳基磺酰基、芳基磺酰基氨基、酰基氨基烷基、酰基氨基烷氧基、酰基氨基、脒基、芳基、苄基、杂环基、杂环基烷基、苯氧基、苄氧基、杂芳氧基、羟基亚氨基、烷氧基亚氨基、氧杂烷基、氨基磺酰基、三苯甲基、脒基、胍基、脲基、苄氧基苯基和苄氧基取代的烷基、芳基、环烷基或杂环基。“氧代基”也包括在“任选取代的”中提到的取代基中;本领域的技术人员应当理解,因为氧代基为二价基团,所以存在其不适合作为取代基(例如,在苯基上)的情况。在一个示例中,1、2或3个氢原子可被指定基团替代。就烷基和环烷基而言,多于三个氢原子可被氟取代;实际上,所有可用的氢原子均可被氟取代。此类化合物(例如,全氟烷基)属于“氟代烃”的类别。应当清楚,通用术语可涵盖不止一个取代基,即,例如,“卤代烷基”或“卤代苯基”是指其中至少一个但可能不止一个氢被卤素取代的烷基或苯基。在一些示例中,取代基为卤素、卤代烷基、烷基、酰基、羟烷基、羟基、烷氧基、卤代烷氧基、氧杂烷基、羧基、氰基、乙酰氧基、硝基、氨基、烷基氨基、二烷基氨基、烷硫基、烷基亚磺酰基、烷基磺酰基、烷基磺酰基氨基、芳基磺酰基、芳基磺酰基氨基和苄氧基。
[0282]
在描述本文的化合物时,使用术语“被至少一个含氧取代基取代”。含氧取代基为
除了碳和氢之外还含有氧的取代基;含氧取代基还可包括另外的杂原子,诸如氮(例如,羧酰胺或甲磺酰基)。含氧取代基的典型示例包括烷氧基、羟基、氟代烷氧基、甲酰基、乙酰基和其他c1至c6酰基链。
[0283]
非限制性工作示例
[0284]
以下示例旨在示出本公开的特定示例,但绝不旨在限制其范围。
[0285]
根据本公开制备的用于掺入到核苷酸中的电荷标签的一些示例包括以下核苷酸:
[0286]
(聚

t或其他多核苷酸或核苷酸组合)、(聚dspacer)和(聚c间隔基)或任何前述的组合。
[0287]
此类电荷标签的电荷可通过改变含磷酸基团的部分的数目(例如,5、10、15、20、25、30、35、40)或其间的任何数目或范围来改变。可包括多达40个,或从1到40的任何数目。可包括多于40个。根据本公开,可使用这些示例中所示的反式环辛烯基团之外的合适反应性基团。
[0288]
寡核苷酸序列可用作电荷标签,具有由磷酸二酯键中的磷酸赋予的各种长度的电荷。此外,经修饰的寡核苷酸诸如dspacer和c3间隔基核苷酸也可用于产生具有不同亲水性和尺寸的电荷标签。可使用不同的碱基和疏水修饰来修饰寡核苷酸序列,以调节序列特异性、最小化对聚合酶的抑制并优化与表面和接头的相互作用。
[0289]
基于磷酸二酯的电荷标签可连接到核苷酸的5'

末端磷酸。在合成模板链的互补链期间,通过聚合酶将每个核苷酸掺入生长链中时,电荷标记可作为焦磷酸副产物的一部分被释放。标记上的电荷由传导通道上的检测系统检测。基于来自每个标签的特征性电流特征(例如,电荷大小),可使用由标签赋予的电荷的差异大小来区分掺入到合成链中的碱基。
[0290]
根据本公开的类似核苷酸的示例包括但不限于以下核苷酸:
[0291]
[0292]
[0293][0294]
使用亚磷酰胺化学和自动寡核苷酸合成来合成基于磷酸二酯的电荷标签。它们在合成后进行纯化,然后通过正交化学方法连接到特定核苷酸。正交化学方法包括但不限于铜催化的炔烃

叠氮、与dbco和叠氮的无铜点击化学、tco

四嗪连接或硫醇

马来酰亚胺连接。
[0295]
下文的非限制性示例示出了用多种接头对5'氨基核苷酸六磷酸进行的修饰以允许与磷酸二酯电荷标签的正交连接化学。5'

胺脱氧胸腺嘧啶六磷酸(dt6p)(或其他npp)
(1)可用叠氮基

丁酸n

羟基琥珀酰亚胺(nhs)酯(2a)或甲基四嗪nhs酯(2b)官能化,以分别形成叠氮dt6p(3a)或甲基四嗪dt6p(3b)(方案1)。
[0296]
[0297]
方案1. 5'

胺dt6p的官能化。
[0298]
叠氮dt6p(3a)可在cuso4、三羟丙基三唑基甲胺(thpta)配体和抗坏血酸钠的存在下,经由铜(i)辅助的叠氮

炔烃环加成(cuaac),用5'

己炔基缀合至聚

t寡核苷酸(4)的直链,以形成寡核苷酸缀合物(5a)。在c18反相高效液相色谱(hplc)上进行纯化,并用50mm teaa(ph7.5)和乙腈洗脱。与聚t寡核苷酸的cuaac反应的代表性示例示于方案2中。
[0299][0300]
方案2.代表性的cucca反应。
[0301]
将甲基四嗪dt6p(3b)在50mm磷酸盐缓冲液(ph 7.4)中缀合至具有5'

反式环辛烯(tco)基团的聚t寡核苷酸(6)的线性链,形成寡核苷酸缀合物(5b)。在c18反相hplc上进行纯化,并用50mm teaa(ph 7.5)和乙腈洗脱。甲基四嗪

tco连接的代表性示例示于方案3中。
[0302][0303]
方案3.代表性的甲基四嗪

tco连接。
[0304]
将叠氮dt6p(3a)在50mm磷酸盐缓冲液(ph 7.4)中经由无铜应变促进的叠氮

炔烃环加成(spaac)缀合至具有5'

二苯并环辛基(dbco)基团的聚t寡核苷酸(7)的线性链,形成寡核苷酸缀合物(5c)。在c18反相hplc上进行纯化,并用50mm teaa(ph 7.5)和乙腈洗脱。与聚t寡核苷酸的spaac反应的代表性示例示于方案4中。
[0305][0306]
方案4.代表性dbco

叠氮缀合。
[0307]
在以下方案中,叠氮

炔烃点击反应将多磷酸核苷酸连接到电荷标签:
[0308][0309]
[0310]
方案5.通过点击化学进行的代表性缀合。
[0311]
前述示例可诸如通过反转连接反应或点击化学反应的每个反应性基团的位置来修改,从而产生前述连接,但其相对于类似核苷酸的5'和3'端以相反方向取向。
[0312]
反应性基团和接头化学物可根据本公开的各种适用的化学方法附加到核苷酸和电荷标签。在一些非限制性示例中,叠氮或甲基四嗪尾部可通过与适当nhs残基反应而被添加到胺化的npp,该合适的nhs残基可包括不同长度的接头部分,诸如不同长度的peg4接头或peg接头。此类合成方案的非限制性示例包括以下及其变型:
[0313][0314]
不同的nhs部分用于添加叠氮或甲基四嗪反应性基团,并且具有不同的接头长度。非限制性示例包括:
[0315][0316]
不同的npp形成有用于点击或连接化学反应的不同反应性基团,以将它们与电荷标签共价连接。一些非限制性示例包括:
[0317]
与含炔烃电荷标签反应以产生例如下列物质:
[0318][0319]
另选地,含甲基四嗪的npp,诸如与含tco的电荷标签反应以形成以下物质:
[0320][0321]
在其他示例中,使用npp和电荷标签之间的dbco

叠氮点击化学来形成诸如以下的化合物:
[0322][0323]
在其他示例中,核苷酸或电荷标签上的马来酰亚胺基团可经由马来酰亚胺

硫醇反应分别与电荷标签或核苷酸上的硫醇基团反应来连接这两者:
[0324]
例如,在还原剂(诸如三(2

羧乙基)膦)的存在下,分别与含有含硫醇基团的电荷标签或npp反应的含有马来酰亚胺基团的npp或电荷标签导致这两者之间的共价结合,例如,
[0325]
如表2所示,各种铜盐、配体、添加剂、溶剂、反应持续时间和反应温度可用于不同的铜辅助点击化学。
[0326]
表2:cu辅助点击化学
[0327][0328][0329]
可以看出,一般来说,在高cu负载量下,反应可能会进行至完成,但收率低。相比之下,在低cu负载量下,反应可能无法进行至完全完成,但收率可能更高。在中间cu负载量下,反应可进行至完全,并且反应产物可通过hplc以86%收率分离。
[0330]
已经证明掺入了基于磷酸二酯的电荷标签修饰的核苷酸。可用不同的聚合酶诸如phi29(及其变体)和klenow片段,或用于边合成边测序过程的其他聚合酶进行掺入。两种聚合酶均可成功地掺入电荷标签。图13中示出了对于该示例的通过phi29的掺入。在该示例中,将溶液中的单链dna模板多核苷酸序列与缓冲溶液(50mm tris ph 7.5,5mm mncl2,4mm dtt)一起温育,该缓冲溶液包含与此类模板序列的一部分互补的100nm5'

cy5

标记的dna引物(16聚体)、1μm phi29和10μm的给定核苷酸,用于基于模板将单核苷酸掺入引物中。在30摄氏度下温育不同的持续时间后,允许5'掺入带电荷标签的胸苷(与模板链上紧接与引物互补的部分的5'处的腺苷残基互补),淬灭聚合酶反应,使引物去杂交并在凝胶上分离以检测单核苷酸掺入。脱氧核糖胸苷5'

六磷酸(dt6p)之间的键包括t5、t10和t15,其具有胸苷核苷酸的指定重复序列作为电荷标签;t5、t10和t15通过点击化学连接,而t5

tet通过四嗪

tco连接进行连接。c3间隔基(c3)和dspacer(d)寡核苷酸也用作带电标签,通过tco

四嗪连接进行连接。tmr是具有下式的四甲基罗丹明标记的dt6p:
[0331][0332]
并且dttp为无电荷或标记的脱氧胸苷三磷酸以用作对照。
[0333]
参见图13,1310、1320和1330各自分别单独地表示dttp、t10或t5的掺入%(在图13中,它们的曲线彼此重叠并且因此几乎不能彼此区分),1340表示通过t15的掺入,1350表示通过t5

tet的掺入,并且1360、1370和1380各自分别表示tmr、d和c3的掺入%(在图13中,它们的曲线彼此重叠并且因此几乎不能彼此区分)。针对所有示例的掺入在5秒内超过80%。
[0334]
用于合成具有根据本公开的肽电荷标签的核苷酸类似物的合成方案的非限制性示例如下所示
[0335]
[0336][0337]
(“kkkkkc”公开为seq id no:10)
[0338][0339]
在另一个示例中,使用可比较的方案合成具有带负电的氨基酸的电荷标签,而不是如上文所示的带正电的赖氨酸残基,该带负电的氨基酸诸如:
[0340][0341]
在符合本公开的教导内容的范围内,该方案的许多变型是可能的。例如,可使用除赖氨酸之外的氨基酸,包括上文所述的任何带电或不带电的氨基酸,并且它们的数目可大于或小于该示例中所示的肽电荷标签长度。因此可采用具有不同化合价和大小的电荷的肽电荷标签。
[0342]
此外,不同的反应性基团可被添加到核苷酸类似物的5'端,并且具有不同类型和长度的接头部分,诸如,针对如下另外的非限制性示例:
[0343][0344]
叠氮基

peg4 nhs酯
[0345][0346]
甲基四嗪

peg4

nhs酯
[0347]
这些添加可产生具有各种反应性基团(包括叠氮或甲基四嗪反应性基团)的核苷
酸类似物,这些反应性基团附加有各种类型和长度的接头,包括如下核苷酸类似物作为非限制性示例:
[0348][0349]
在其他示例中,类似地添加炔烃、tco或dbco基团或硫醇基团。然后可将对应的反应性基团添加到肽电荷标签,使得两者可通过上文公开的点击或连接化学或技术人员已知的其他方法接合。基于肽的电荷标签可使用用于固相肽合成的芴基甲氧基羰基(fmoc)和叔丁氧羰基(boc)保护基团化学来合成。可在肽合成中的末端引入正交“手柄”反应性基团,以允许缀合至核苷酸或核酸。正交化学方法包括叠氮

炔烃铜辅助的点击反应、与dbco和叠氮的无铜点击化学和tco

四嗪连接。氨基酸的反应性侧链诸如半胱氨酸的硫醇也可用于硫醇

马来酰亚胺化学中。
[0350]
含有具有不同pka的侧链的氨基酸的可用性也使得肽电荷标签在不同ph下带电。例如,组氨酸具有6.04的pka,而赖氨酸具有10.54的pka的侧链。因此,在中性ph下,仅赖氨酸可带电。这还允许通过改变缓冲液环境的ph来进一步调节电荷数量和电荷密度。
[0351]
此外,肽电荷标签可容易地附加到肽核酸(pna)低聚物上,因为肽和pna是用相同的固相肽化学方法合成的。这可用于进一步修饰肽电荷标签的性质,或将电荷标签的缔合性质添加到接头诸如基于核酸的接头。
[0352]
用于合成树枝化基元电荷标签的化合物以及每个末端结构重复单元的对应电荷的示例包括如下:
[0353][0354]
在这些示例中,在树枝化基元的自由价端处示出了不同的反应性基团,以及在支化点和单个结构重复单元的自由末端之间的不同潜在茎长度,但这些仅仅是非限制性示例。
[0355]
以下方案提供了可能的树枝化基元电荷标签结构的例示性示例:
[0356][0357]
示出了,例如,具有酰胺键和(a)末端羧酸或(b)氨基基团的树枝化基元;具有聚(丙烯亚胺)(ppi)键和(c)末端羧酸或(d)氨基基团的树枝化基元;以及具有酯键和(e)末端羧酸或(f)氨基基团的树枝化基元。
[0358]
一般来讲树枝化基元电荷标签可根据发散或会聚合成方法并根据以下代表性方案来合成:
[0359][0360]
在发散合成(a)中,树枝化基元通过一系列从核心向外延伸的反应组装,通常通过重复的迈克尔加成组装。在会聚合成(b)中,树枝化基元从周边通过一系列向内构建的反应构建,并最终连接到核心。
[0361]
根据本公开的这种发散合成方案的一些示例如下:
[0362][0363]
在这些示例中,通过迈克尔加成将甲基丙烯酸酯基团添加到炔烃茎,然后使乙酰基脱保护以形成羧酸基团,或添加乙二胺以形成氨基基团。迈克尔加成的重复循环产生末端官能团数是上一代的两倍的下一代树枝化基元。可添加额外的代,并且可在茎/自由价端处使用不同的反应性基团。在一些示例中,可根据前述合成方案迭代地添加额外的一代或更多代,以增加由标签携带的电荷。电荷的化合价(正或负)可通过在端基处掺入带正电荷或带负电荷的氨基酸而改变。示例如图21a和图21b所示。在两个非限制性示例中,示出了终
止于半胱氨酸残基的电荷标签,其可连接到用于使本文所公开的核苷酸带电的接头区段,但是诸如本文所公开的其他化学物质也旨在作为示例。在图21a中,端基的带正电的赖氨酸残基在2、3或4个分支后,产生不同的末端电荷大小。另选地,如图21b所示,带负电的氨基酸诸如谷氨酸盐可在各代的分支后形成端基,再次产生不同的末端电荷大小。
[0364]
在另一个示例中,电荷标签中的一个或多个赖氨酸残基可被甲基化(例如,三甲基化)。与未甲基化的赖氨酸不同,三甲基化的赖氨酸的电荷不是ph依赖性的。
[0365]
在自由价端具有dbco的另一个示例如下:
[0366][0367]
树枝化基元电荷标签的基于酰胺和ppi树枝化基元的设计及其合成的一些示例包括如下:
[0368][0369]
包括在实施例c

1和c

2中的季铵基团的一些优点在于,它们可能不受ph的影响,可能不与金属配位,并且可能不太可能在合成和处理期间连接到聚(乙烯基膦酸)(pvpa)。
[0370]
在另一个示例中,可使用具有三个支化度的结构重复单元。在又一个示例中,可使用会聚合成而不是发散合成。使用具有三个支化度的单元的有益效果是,与具有仅具有两个支化度的单元的树枝化基元相比,每一代可添加更多的电荷,从而导致获得给定优选电荷所需的代数更少。一个示例如下:
[0371][0372]
在该示例中,结构重复单元用叔丁氧羰基(boc)官能化。随后,
[0373][0374]
可添加dbco基团,并且在乙酰基脱保护时形成羧酸基团。在这种情况下,所得化合物具有

3电荷。在随后的反应中,将上述化合物a加入第二代树枝化基元中,得到

9的电荷,如下:
[0375]
[0376][0377]
通过迭代组合上述步骤,可组合三个二级树枝化基元,以通过根据以下示例的会聚合成产生具有

27的电荷的第三代树枝化基元:
[0378]
[0379][0380]
如下将带有带负电的羧酸基团的树枝化基元转化成带有带正电的胺基团的树枝化基元:
[0381][0382]
在另一个示例中,根据以下方案将羧酸基团转化成胺基团:
[0383][0384]
对于具有+9电荷的第二代,可使用以下方案:
[0385][0386]
并且,可通过会聚合成方案合成第三代树枝化基元,以生成具有+27电荷的树枝化基元,如下:
[0387]
[0388][0389]
取决于根据本公开合成的树枝化基元的自由价端处的反应性基团(其可包括但不限于任何上述示例),可将对应的成对反应性基团附加到核苷酸类似物以允许电荷标签树枝化基元连接到核苷酸类似物。根据前文所述,核苷酸类似物中可包含宽范围的电荷,包括

32、

27、

16、

9、

8、

4、

3、

2、+2、+3、+4、+8、+9、+16、+27和+32。也可使用除前述非限制性示例合成方案中所示的那些之外的带电官能团。
[0390]
在一些示例中,此类分支结构可用于向电荷标签添加多个基于磷酸二酯的电荷。例如,不同于如本文所公开的多核苷酸或其他含磷酸二酯电荷的单条线性链,分支结构诸如根据此处所示的树枝化基元结构可包括作为端基的核苷酸或多核苷酸。通过根据如本文所公开的树枝化基元结构在连续世代中建立这种含磷酸二酯标签的分支,可将多个多核苷酸或其他基于磷酸二酯的电荷组合成单个电荷标签。例如,基于树枝化基元的结构诸如图19a和图19b所示。图19a示出了将三个聚

t序列组合成单个标签的标签的示例,其可根据本文所公开的方法掺入到式i的化合物中。在该示例中,标签携带

30的电荷。图19b示出了将含磷酸二酯的标签组合以产生给定电荷(在该示例中为

30)的若干方式:30个磷酸二酯电荷的线性序列,以3个电荷为10的磷酸二酯序列封端的三重分支结构,或两倍三重分支并以6个电荷为5的磷酸二酯序列封端的结构。增加分支的优点,例如在最后一个示例中与第一个示例相比,可以是更高的电荷密度,其中彼此接近的短电荷序列的浓度更高,这与可远离传导通道延伸的单个延伸序列相反。
[0391]
在其他示例中,基于氨基酸的分支叉结构可包括在电荷标签中。此类基于氨基酸的电荷标签的叉和分支结构的合成方案的示例描绘于图22中。固相肽合成可用于例如根据图22的上分图的线性多肽链中的全部氨基酸序列。通过反复保护游离氨基基团,然后将其移除并添加活化的氨基酸,可合成线性链多肽。因此,带电氨基酸(正电或负电)的线性链可作为电荷标签或电荷标签的一部分生成,以用于连接到核苷酸。非限制性示例描绘于图24a中,其示出了16个带负电的谷氨酸残基的链(seq id no:12)。其他示例可包括不同数目的其他带电氨基酸。
[0392]
如图22的下分图中进一步所描绘的,可使用会聚固相蛋白质合成方法,其中可在合成步骤期间将单独形成的多肽链的长度作为聚合物集合添加。在图22中未描绘的一些示例中,氨基酸或多肽可作为分支独立地添加到叉,其中叉是含有两个氨基基团的结构,而不是如图22所示从单个氨基基团线性连接。例如,如图23a中的左结构所示的具有两个氨基基
团的赖氨酸氨基酸可用作叉状连接点,线性多肽的两个分支可连接到该叉状连接点,根据图22所描绘的固相蛋白质合成方案,每个氨基基团连接一个分支。
[0393]
通过向赖氨酸残基的两个氨基基团添加两条氨基酸链(每条氨基酸链根据例如按照图22的上分图的固相蛋白质合成方案合成),可合成包括具有两个分支的叉的电荷标签,其中每个分支是多肽。根据构成分支的氨基酸的电荷,分支可以是带正电的或带负电的。图23中描绘了两个非限制性示例。在左侧,五赖氨酸分支连接到赖氨酸叉以形成带正电的电荷标签,而在右侧,两个五谷氨酸分支连接到赖氨酸叉以形成带负电的电荷标签。其他类似的示例可具有更长或更短的分支,具有从1到20个之间的任何数目的氨基酸或更多的氨基酸。在一个示例中,每个分支可具有与另一个分支中的氨基酸数目不同数目的氨基酸。每个分支中的氨基酸种类也可在分支之间和/或分支内不同。
[0394]
在其他示例中,可将多个叉连接到中心叉以形成具有多于两个分支的树。例如,可将两个赖氨酸连接到单个赖氨酸叉的氨基基团,得到具有四个可用于随后添加带电氨基酸的氨基基团的中心结构。描绘了在图23所示的中心分子中的一个示例。此处,已通过固相蛋白质合成将赖氨酸添加到中心赖氨酸的每个氨基基团,产生用于随后添加带电氨基酸或肽的四个反应性氨基基团。然后可将包括带电氨基酸的链的多肽添加到该分子的每个氨基基团。图24b中描绘了一个非限制性示例。在该示例中,四谷氨酸链已被添加到四分支叉状赖氨酸结构的四个可用氨基基团中的每个可用氨基基团,诸如图23b的中心分图所描绘。在其他示例中,可添加其他带电氨基酸作为分支中的一个或多个分支。分支还可各自具有与图24b所描绘的示例不同数目的氨基酸,和/或可具有彼此不同数目的氨基酸。示例包括各自独立地具有从1到20个之间的任何数目的或更多个氨基酸的一些或所有分支。分支中的氨基酸种类也可与分支内的其他氨基酸和/或存在于其他分支中的氨基酸不同。
[0395]
继续进行该会聚合成方案,可将两个四分支赖氨酸叉连接到中心赖氨酸叉的氨基基团以形成8分支结构,如图23a的右侧分图所描绘。与前面的示例一样,可将带电氨基酸的链添加到8个游离氨基基团的每个游离氨基基团上以形成电荷标签,同样具有彼此相同或不同长度的分支(每个分支独立地具有1至20个或更多个氨基酸),以及在分支与分支之间或在一个或多个分支内具有不同的带电氨基酸,或在每个分支中具有相同种类的带电氨基酸。在又一个示例中,可将两个8分支叉添加到赖氨酸基团的两个氨基基团以形成16分支结构。图24c中描绘了一个非限制性示例。在该示例中,已将谷氨酸残基添加到结构上的16个氨基基团中的每一个氨基基团。在其他示例中,可将多肽添加到氨基酸基团中的一些或更多个氨基酸基团,同样每个分支具有彼此相同或不同的长度(每个分支独立地具有1至20个或更多个氨基酸)或具有相同数目的氨基酸,并且在分支内和/或分支之间具有相同或不同种类的带电荷氨基酸。
[0396]
需注意,图24a至图24c所描绘的电荷标签的非限制性示例各自具有相同的净电荷,具有16个带负电荷的氨基酸部分(在该示例中为谷氨酸盐)。然而,电荷标签的结构不同,使得由电荷标签携带的电荷的密度和分布在三个示例中的每个示例中都不同。如本文所公开的,在具有包括带电荷的氨基酸的分支的分叉电荷标签中也可采用前述组合中的所有组合,从而提供电荷标签的许多实例,这些电荷标签彼此之间的区别不在于它们所包括的电荷价(正或负),而在于电荷值和电荷标签内的电荷分布或密度。
[0397]
在另一个示例中,电荷可由电荷标签的基于精胺的组分提供。例如,根据本公开,
可将基于精胺的寡阳离子电荷添加到核苷酸并提供正电荷作为电荷标签。寡核苷酸精胺缀合物在ph 7下具有大约2.5个质子化胺。此种带电荷标签的核苷酸的示例示出于图25a和图25b。图25a示出了根据本公开的一个方面的寡核苷酸精胺缀合物的示例,并且图25b示出了具有精胺衍生端基的树枝化基元结构化标签,用于增大可位于电荷标签末端的电荷量。在这两个示例中,本文所公开的用于将电荷标签连接到核苷酸的化学方法可由技术人员进行调整,以根据本公开的各方面将此类精胺衍生的电荷标签连接到核苷酸。
[0398]
下文的非限制性示例示出了用多种接头对5'氨基核苷酸六磷酸进行的修饰以允许与树枝化基元电荷标签的正交连接化学。5'

胺脱氧胸腺嘧啶六磷酸(dt6p)(或其他npp)(1)可用叠氮基

丁酸n

羟基琥珀酰亚胺(nhs)酯(2a)或甲基四嗪nhs酯(2b)官能化,以分别形成叠氮dt6p(3a)或甲基四嗪dt6p(3b)(方案6)。
[0399]
[0400][0401]
方案6. 5'

胺dt6p的官能化。
[0402]
叠氮dt6p(3a)可在cuso4、三羟丙基三唑基甲胺(thpta)配体和抗坏血酸钠的存在下,经由铜(i)辅助的叠氮

炔烃环加成(cuaac),用5'

己炔基缀合至聚

t寡核苷酸(4)的直链,以形成寡核苷酸缀合物(5a)。在c18反相hplc上进行纯化,并用50mm teaa(ph 7.5)和乙腈洗脱。然后甲基四嗪dt6p(3b)可在50mm磷酸盐缓冲液(ph 7.4)中缀合至具有反式环辛烯(tco)基团的树枝化基元,以形成具有树枝化基元电荷标签的核苷酸类似物。
[0403]
另选地,叠氮dt6p(3a)也可在50mm磷酸盐缓冲液(ph 7.4)中经由无铜应变促进的叠氮

炔烃环加成(spaac)缀合至具有二苯并环辛基(dbco)基团的树枝化基元电荷标签,以形成具有树枝化基元电荷标签的核苷酸类似物。
[0404]
在以下方案中,可进行叠氮

炔烃点击反应以将多磷酸核苷酸连接到电荷标签,诸如在其自由价端具有炔烃基团的树枝化基元电荷标签:
[0405][0406]
前述示例可诸如通过反转连接反应或点击化学反应的每个反应性基团的位置来修改,从而产生前述连接,但其相对于类似核苷酸的5'和3'端以相反方向取向。
[0407]
反应性基团和接头化学物可根据本公开的各种适用的化学方法附加到核苷酸和电荷标签。在一些非限制性示例中,叠氮或甲基四嗪尾部可通过与适当nhs残基反应而被添加到胺化的npp,该合适的nhs残基可包括不同长度的接头部分,诸如不同长度的peg4接头或peg接头。此类合成方案的非限制性示例包括以下及其变型:
[0408][0409]
不同的nhs部分可用于添加叠氮或甲基四嗪反应性基团,并且具有不同的接头长度。非限制性示例包括:
[0410][0411]
不同的npp可形成有用于点击或连接化学反应的不同反应性基团,以将它们与电荷标签共价连接。一些非限制性示例包括:
[0412][0413]
其可与含炔烃电荷标签反应,例如在其自由价端具有炔烃基团的树枝化基元电荷标签。
[0414]
另选地,含甲基四嗪的npp,诸如
[0415][0416]
可与含tco的电荷标签反应,例如在其自由价端具有tco基团的树枝化基元电荷标签。
[0417]
在其他示例中,可使用npp与树枝化基元电荷标签之间的dbco

叠氮点击化学。在其他示例中,核苷酸或树枝化基元电荷标签上的马来酰亚胺基团可经由马来酰亚胺

硫醇反应分别与电荷标签或核苷酸上的硫醇基团反应来连接这两者:
[0418]
例如,在还原剂(诸如三(2

羧乙基)膦)的存在下,分别与含有含硫醇基团的电荷标签或npp反应的含有马来酰亚胺基团的npp或电荷标签可导致这两者之间的共价结合,例如,
[0419]
具有可导致高电荷密度的三维构型的电荷标签的一些非限制性例示性示例示出于图15a至图15c、图16a、图16b、图17和图18。图15a至图15c示出了具有寡核苷酸电荷标签的核苷酸类似物的三个示例。例如,寡核苷酸电荷标签可包含5个、10个、15个、20个、25个、30个、35个、40个或更多个寡核苷酸。还示出了传导通道(在这种情况下为纳米线)和与传导通道的官能化连接,具体地为接受区域。接受区域如图所示。寡核苷酸电荷标签示出为从经修饰核苷酸的5'末端延伸的虚线。示出了电荷标签可采取的三种不同的构型。例如,图15a示出了可识别的茎

环结构。在此类结构中,沿茎部分的核苷酸彼此碱基配对,在其间留下环部分,在该示例中被示出为远离受体区域的取向。因此,来自寡核苷酸电荷标签的核苷酸之间的磷酸二酯键的负电荷可保持彼此紧密接近,从而保持比采用线性拉伸构型时可获得的电荷密度更高的电荷密度。
[0420]
例如,图15b示出了另一个示例,其不是电荷标签的茎

环结构,而是电荷标签的凸起区域。在这种情况下,如图15a所示,电荷标签包括特异性区域,其示出为与受体区域相连。此处,特异性区域包括在寡核苷酸被线性拉伸的情况下在空间上彼此不同的寡核苷酸片段。但是,当通过静电吸引诱导与受体区域缔合时,特异性区域的各部分靠拢在一起。该构型与采用茎环构型(图15a)或凸起构型(图15b)一致,在两种情况下均导致电荷标签的电荷密度增加。
[0421]
图15c和图20a至图20e示出了带有磷酸二酯的标签,包括采用各种三维构型诸如茎

环(例如,20a、20b)或三叶草样(例如,15c、20c、20d或20e)形状的多核苷酸。结构化的寡核苷酸电荷标签可通过传导通道检测(参见图26中描绘为用于电荷标签的传导通道检测的结构的装置,如下所述)。这些电荷标签的序列如下:
[0422]
表3:示例性磷酸二酯电荷标签
[0423][0424]
类似于茎

环构型,从中心毂延伸的茎可由核苷酸链形成,该核苷酸链通过watson

crick配对结合规则彼此连接,通过其间的环保持在一起。从中心毂辐射的茎可以是朝向或围绕中心毂取向的连接寡核苷酸链。与其他示例一样,电荷标签中核苷酸碱基的配对结合诱导标签采用使得核苷酸之间的磷酸二酯键的负电荷缩合在一起的构型,从而导致电荷密度与寡核苷酸被线性拉伸时的密度相比增加。
[0425]
寡核苷酸电荷标签的其他三维构型是可能的。由于watson

crick碱基配对,核苷酸之间磷酸二酯键的负电荷可以高电荷密度聚集在一起。可采用各种三维形状,例如,使用dna折纸方法,生成产生高电荷密度的管形、圆形、立方体形、螺旋形、缩合螺旋形、球形或类球体形或其他构型的寡核苷酸电荷标签。
[0426]
图16示出了两个电荷标签的示例,一个标签包括寡核苷酸序列(16a,左侧),另一个标签除包括肽核酸序列和多肽(16b,右侧)之外还包括此类序列。未示出这些电荷标签和核苷酸类似物之间的连接,但这种连接可通过化学连接技术进行,诸如本文所公开的或其他已知的技术。左侧16a的构型为十字形形状。四条寡核苷酸序列以类似霍利迪结构的构型(如可在dna重组事件期间发生)结合在一起。如16a所示,四个多核苷酸的部分根据watson

crick碱基配对彼此结合。每个寡核苷酸还从成对结合的中央部分延伸到单链突出端中。配对结合保持寡核苷酸内磷酸二酯键的负电荷彼此接近,从而增加电荷密度。
[0427]
右侧,在16b中,将肽核酸和多肽序列添加到14a所示的电荷标签,得到电荷标签的另一个非限制性示例。在该示例中,四条肽核酸序列各自在它们的末端连接多肽序列。由于多肽内的一些氨基酸之间的静电吸引,多肽序列形成螺旋结构。然而,在这些示例中,多肽具有净正电荷(尽管其中包含一些有助于采用螺旋构型的带负电荷的氨基酸)。连接多肽对的肽核酸序列的部分也与从碱基配对核心延伸的多核苷酸的单链部分杂交。肽核酸和带正电荷的多肽的绷紧线圈构型之间的强键允许电荷标签带净正电荷并具有高电荷密度。采用类似构造的电荷标签的其他示例可具有净负电荷。
[0428]
图17示出了多肽电荷标签的一些示例,其中多肽采用导致高电荷密度的不同三维构造。多肽的卷曲部分可通过接头序列连接。当接头序列非常短时,卷曲结构可能够以大致总体线性阵列彼此结合。由于多肽内带正电荷和带负电荷的氨基酸之间的静电吸引,这种构型是可能的。然而,总体而言,多肽电荷标签可具有净正电荷或净负电荷。然而,在电荷标签的多肽的卷曲部分之间具有较长接头的情况下,硬脂酸阻碍的减少允许相邻卷曲部分之
间具有更大的弯曲,从而允许采用更复杂的构造,诸如图17的下部所示。这些可能性可导致更高的电荷密度。与图16a和图16b所示的示例一样,这些示例性电荷标签可连接到核苷酸类似物(未示出)。
[0429]
图18a至图18b示出了采用卷曲线圈构造的多肽电荷标签的示例的两个视图(分别为侧视图和纵向视图),其中螺旋内的氨基酸之间以及不同螺旋的氨基酸之间的静电吸引可诱导多肽形成缩合结构。结果可能是,卷曲线圈可具有净负电荷或净正电荷,其中净电荷以高电荷密度保持在一起(与多肽序列被线性拉伸时的电荷密度相比)。
[0430]
对于本文所述的每个示例,利用针对将电荷标签的示例连接到核苷酸的示例而描述的一种类型的点击化学或连接化学,每种此类型的点击化学或连接化学也可用于将电荷标签的任何所述示例连接到核苷酸的任何所述示例。换句话讲,无论其所连接的电荷标签的类型或核苷酸的类型如何,点击化学或连接化学是有用的。
[0431]
因此,包括具有或不具有肽核酸的寡核苷酸、多肽或两者的电荷标签可采用与线性拉伸的线性电荷标签相比具有升高的电荷密度的不同三维构造。电荷标签可具有净负电荷,诸如如果其相对于正电荷包含过量的磷酸二酯或带负电荷的氨基酸,或可具有净正电荷,诸如如果其具有比带负电荷的基团更多的带正电荷氨基酸。基于氨基酸组分之间充分表征的分子相互作用,卷曲线圈可通过计算设计成采用特定紧凑结构。可使用的卷曲线圈的示例包括亮氨酸拉链,其可为例如长度和直径受控的二聚体或三聚体形式。此外,由于控制卷曲线圈紧凑结构的相互作用局限于内部,因此表面可被独立地改造成携带多种电荷。
[0432]
如本文所公开的电荷标签可具有介于

200e和+200e之间、或介于

100e和+100e之间、或介于

40e和+40e之间、或介于

20e和+20e

40和+40之间或其中的任何范围的任何电荷。在一些示例中,电荷标签的净电荷或部分净电荷可被堆积成

200e/立方纳米至+200e/立方纳米、或

100e/立方纳米至+100e/立方纳米、或

40e/立方纳米至+40e/立方纳米、或

20e/立方纳米至+20e/立方纳米或其中的任何范围的密度。
[0433]
在一个示例中,测试装置用于通过传导通道检测电荷标签。此种设备的示意图描绘于图26中。示出了能够检测在其附近的电荷的硅纳米线(nw)场效应晶体管。任选地,如图26所描绘的,表面改性剂可附着到nw,诸如可在用于sbs或其他相关方法的流通池中采用。例如,表面改性剂可以是聚(n

(5

叠氮基乙酰胺基戊基)丙烯酰胺



丙烯酰胺)(也称为pazam)或另一种相关的表面改性剂聚合物。在该示例中,将寡核苷酸接枝到表面改性剂。向接枝寡核苷酸和nw周围的溶液中加入与接枝寡核苷酸互补的另一种寡核苷酸。根据标准watson

crick碱基配对规则确定接枝寡核苷酸和溶液中寡核苷酸的序列以便彼此结合。电荷标签也连接到溶液中寡核苷酸。在图26所描绘的示例中,电荷标签是基于磷酯的标签。然而,本文所公开的电荷标签的示例中的任一个示例也可用于此种系统中。溶液中核苷酸与接枝核苷酸的结合使电荷标签接近nw,使得nw可检测电荷标签中电荷的存在和大小。在一些对照条件下(非互补,与使用互补的溶液中寡核苷酸时的互补相反),使用不与带电荷标签的接枝核苷酸互补的溶液中寡核苷酸。本文公开了使用此种装置和系统来测试传导通道检测不同电荷标签的能力的示例。
[0434]
使用如图26所描绘的装置如下进行传导通道检测电荷标签的能力的测试。对于基线,使ph 5的1ml 10mm磷酸盐缓冲液流过nw,电测量5分钟。之后用空白pbs冲洗两次,再在ph 5的10mm磷酸盐缓冲液中进行5分钟基线测量。然后通过在1ml 500nm互补或非互补寡核
苷酸的2
×
pbs中温育5分钟与电荷标记的溶液中寡核苷酸杂交,之后用1ml 2
×
pbs冲洗,然后用1ml 10mm磷酸盐缓冲液(ph 5)冲洗。然后在ph 5的10mm磷酸盐缓冲液中再进行5分钟测量。然后用1ml 100%甲酰胺洗脱溶液中寡核苷酸并温育15分钟,然后用1ml 10mm磷酸盐缓冲液(ph 5)冲洗,之后在10mm磷酸盐缓冲液(ph 5)中再进行5分钟基线测量。然后用含有附连到溶液中寡核苷酸的不同电荷标签的下一样品重复该过程。
[0435]
一些示例的结果描绘于图27中。在用带有以下电荷标签的溶液中寡核苷酸温育之后,检测了通过多条纳米线的电流,并通过每个nw的电导归一化为电压(mv):c20(具有以下序列(seq id no:7)的磷酸二酯电荷标签:gaacaattccagccttgatatcaacactattgata),16个谷氨酸氨基酸的线性序列(seq id no:12)(“lineare16”)、结构如图24b所描绘的具有16个谷氨酸氨基酸的分支电荷标签(“branchede16”)、结构如图24c所描绘的具有16个谷氨酸氨基酸的“树枝状”分支电荷标签(“dendritice16”)、五个三甲基化赖氨酸残基的线性标签(seq id no:13)和再一个c20(“k5

me3”)(按此顺序)。可以看出,传导通道能够检测相应介于10mv至14mv之间的电荷。在非互补条件下未检测到电流。
[0436]
在另一个示例中,进行了类似的测量,但在这种情况下使用50mm磷酸盐缓冲液(ph 5)。结果示出于图28。在该缓冲液中,由不同电荷标签检测到的mv之间的差值是明显的(即使在具有彼此相同的总电荷量的电荷标签之间),验证了区分不同电荷标签的能力。
[0437]
电荷标签的德拜长度可根据缓冲溶液来计算,在该缓冲溶液中,该电荷标签由传导通道感测。离子溶液中的德拜长度(κ
‑1)可根据如下公式来计算:
[0438][0439]
其中t=~298k;k
b
=1.28e

23j/k;e=1.6e

19c;ε0=8.85e

12f/m;水的ε
r
~78;n
a
=6.022e23;i=离子强度=σc
i
z
i2
,其中c为离子的浓度,z为电荷数(取决于溶液)。在一个示例中,在tris缓冲液(ph 7)中测试电荷标签c20的不同德拜长度,其中c和z以及德拜长度的值如下:
[0440]
表4
[0441][0442]
结果示出于图29a。
[0443]
在另一个示例中,在含有和不含kcl的柠檬酸盐缓冲液中测试电荷标签c20的不同德拜长度,其中c和z以及德拜长度的值如下:
[0444]
表5
[0445][0446]
结果示出于图29b。
[0447]
因此,可通过修改其中电荷标签由传导通道检测的溶液的各方面来修改给定电荷标签的德拜长度,使得电荷标签与传导通道的接近度足以允许在各种条件下检测电荷标签。在图29a和图29b所描绘的示例中,测试了给定电荷标签的0.9nm至8.57nm的德拜长度,如此可确定电荷标签的接近度。在一个示例中,当电荷标签在距导电通道的德拜长度内时,电荷标签可以接近传导通道,以便于并允许传导通道对电荷标签进行电荷检测。
[0448]
测量带有电荷标签的核苷酸的掺入的非限制性示例示出于图2中。使用phi29聚合酶将5s、1m或10m的带磷酸二酯电荷标签的胸苷核苷酸(tettco

dt6p)单独掺入或之后将带荧光标签的叠氮甲基3'封端的腺苷核苷酸(ffa

azm)掺入与溶液中模板寡核苷酸杂交的多核苷酸中。在掺入后,使多核苷酸与模板去杂交并通过测量的ffa

azm的凝胶电泳和掺入分离。如图2所示,用带电荷标签的核苷酸温育,之后用ffa

azm温育检测到掺入多核苷酸中的ffa

azm,作为测量带电荷标签的核苷酸掺入的替代。在不存在核苷酸的情况下(无nuc)或当仅存在一个或另一个核苷酸时未检测到ffa

azm掺入(单独的tettco

dt6p(左侧),或单独的ffa

azm(右侧))。在其他示例中,带荧光标签的核苷酸的掺入可通过多种其他技术进行检测和测量,包括在多核苷酸与模板去杂交后的表面上荧光或溶液中荧光测量。
[0449]
在其他示例中,将带电荷标签的核苷酸掺入与表面连接模板互补的多核苷酸中,之后掺入荧光标记的核苷酸(未示出)。在一个示例中,使用一种聚合酶掺入带电荷标签的核苷酸,使用不同的聚合酶掺入带荧光标签的核苷酸。例如,使用与第一带电荷标签的t核苷酸和与表面连接模板杂交的多核苷酸温育的klenow片段掺入带电荷标签的核苷酸。在洗涤以移除聚合酶、过量的核苷酸等之后,使用在phi29和带荧光标签的a核苷酸中的第二次温育添加与第一掺入的带电荷标签的核苷酸相邻的荧光核苷酸。模板和多核苷酸序列被设
计成在存在聚合酶的情况下,模板需要在多核苷酸的3'末端先添加一个t,然后添加一个a。然后使延伸的多核苷酸去杂交,然后在电泳中运行以检测核苷酸的掺入。phi29催化a的掺入,表明klenow片段也已经掺入了t(因为phi29不可能掺入a,除非t已经首先被添加到多核苷酸的3'端)。在其他示例中,phi29用于掺入t和a两者,在这两步之间有一个洗涤步骤,并且这样做了。在另一个示例中,phi29用于单个聚合酶反应中,同时存在带电荷标签的t和荧光a,并且再一个phi29能够掺入荧光a,表明它也已经掺入带电荷标签的t,表明phi29能够掺入带电荷标签的核苷酸和荧光核苷酸。
[0450]
在本文所公开的技术的一些示例中,提供了存储计算机可读指令的一个或多个计算机可读存储设备或存储器,该计算机可读指令当计算机可读指令由计算机执行时,使得计算机执行本文所公开的方法中的至少任一种。本文的“计算机”可指任何处理器或包含处理器的设备。在一些示例中,系统被配置为执行本文所公开的方法中的任一种方法的至少一部分。在一些示例中,系统联接到存储计算机可读指令的计算机可读存储设备或存储器,该计算机可读指令在被执行时使得系统执行本文所公开的方法中的至少任一种方法。
[0451]
本技术中引用的所有文献和类似材料,包括但不限于专利、专利申请、文章、书籍、论文和网页,无论这些文献和类似材料的格式如何,都明确地全文以引用方式并入。如果所并入文献和类似材料中的一者或多者与本技术不同或矛盾,包括但不限于所定义的术语、术语用法、所描述的技术等,则以本技术为准。
[0452]
应当理解,前述概念和下文更详细讨论的附加概念(假设此类概念不相互矛盾)的所有组合都被设想为是本文所公开的发明主题的一部分。具体地讲,出现在本公开末尾的要求保护的主题的所有组合都被设想为是本文所公开的发明主题的一部分。还应当理解,也可出现在以引用方式并入的任何公开中的本文明确采用的术语应被赋予与本文所公开的特定概念最一致的含义。
[0453]
本说明书通篇提及的“一个示例”、“另一个示例”、“一种示例”等意指结合该示例描述的特定元素(例如,特征、结构和/或特性)包括在本文所述的至少一个示例中,并且可存在于或不存在于其他示例中。此外,应当理解,用于任何示例的所述元素可以任何合适的方式组合在各种示例中,除非上下文另有明确说明。
[0454]
虽然已经详细描述了若干示例,但是应当理解,可以对所公开的示例进行修改。因此,上述说明应被认为是非限制性的。虽然本文可能已经详细描绘和描述了一些示例,但是对于相关领域的技术人员将显而易见的是,在不脱离本公开的实质的情况下可以做出各种修改、添加、替换等,因此这些修改、添加、替换等被认为是在如以下权利要求书中所限定的本公开的范围内。
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1