向跨膜孔输送分析物的方法与流程

文档序号:11633032阅读:331来源:国知局
向跨膜孔输送分析物的方法与流程

本发明涉及向膜中的跨膜孔输送分析物的新方法。所述方法涉及微粒的使用。



背景技术:

目前需要一种具有广泛的应用范围的快速且便宜的多核苷酸(例如,dna或rna)测序和识别技术。现有技术缓慢且昂贵,主要是因为其依赖于扩增技术来制备大量的多核苷酸,并且需要大量专门的荧光化学品用于信号检测。

作为聚合物和各种小分子的直接电生物传感器,跨膜孔(纳米孔)具有巨大潜力。特别是作为潜在的dna测序技术,纳米孔最近受到关注。

当跨纳米孔施加电势时,分析物如核苷酸在桶中短暂停留一段时间时,会产生电流的变化。对核苷酸进行纳米孔检测产生已知特征和持续时间的电流变化。在“链测序”方法中,单个多核苷酸链穿过所述孔并实现对核苷酸的鉴定。链测序可涉及使用多核苷酸结合蛋白来控制多核苷酸穿过所述孔的移动。

之前已经证明,通过将分析物的偶联到存在相关检测器的膜可以实现超低浓度分析物的输送。这样可以将进行检测所需的分析物的量降低几个数量级(wo2012/164270)。



技术实现要素:

发明人已经出乎意料地证明可以使用微粒来提高向膜中的跨膜孔输送分析物的效率。所述微粒使得利用跨膜孔进行检测所需的分析物的量降低了几个数量级。

因此,本发明提供一种向膜中的跨膜孔输送分析物的方法,包括(a)提供连接到微粒的分析物;和(b)将所述微粒输送向所述膜,并由此向所述跨膜孔输送所述分析物。

本发明还提供:

-一种表征多核苷酸分析物的方法,包括(a)在多核苷酸分析物上实施本发明的所述方法;(b)使多核苷酸与跨膜孔相互作用,使得所述多核苷酸移动穿过所述孔;和(c)随着所述多核苷酸相对于所述孔移动,获取一个或多个测量值,其中,所述测量值代表所述多核苷酸的一个或多个特征,并由此表征所述多核苷酸;

-一种使用跨膜孔确定存在分析物、不存在分析物或分析物的一个或多个特征的方法,包括(a)实施本发明的所述方法;(b)使所述分析物与跨膜孔相互作用;和(c)在所述相互作用期间获取一个或多个测量值,其中,所述测量值代表存在所述分析物、不存在所述分析物或所述分析物的一个或多个特征;和

-一种向膜中的跨膜孔输送分析物的试剂盒,包括(a)微粒和(b)一个或多个能够将所述分析物偶联到所述膜的锚定体。

附图说明

图1示出了如何将dna与实施例1中的连接的卡通示意图(未按比例)。双链dna(dsdna)样本通过λdna的片段化获得(以虚线表示,标记为a),并具有与λdna的任一端连接的y-适配器(标记为b)和发夹适配器(标记为c)。两种不同的解旋酶与dsdna样本结合。与y-适配器结合的解旋酶(标记为d)在其氨基酸序列中不存在组氨酸标签(6个连续的组氨酸),而与发夹结合的解旋酶(标记为e)在其氨基酸序列中存在组氨酸标签(6个连续的组氨酸;在图中显示为灰色正方形并标记为f)。当组氨酸标签隔离和下拉式的(his-tagisolationandpulldown)(标记为g)与dsdna样本预孵育时,该珠粒表面上的钴(以黑色圆圈表示,标记为h)此时与酶上的组氨酸结合。dsdna样本还具有两个锚定体(标记为j),其连接到与所述样本杂交的dna链(标记为i),这些锚定体用于将dna连接到膜。该图示出了单个dsdna样本的连接,然而珠粒被钴覆盖,因此非常有可能在单个珠粒上结合多个dsdna样本。

图2示出了当dna文库样本与预孵育(通道4-7)或不与预孵育(通道1-3)时所观察到的通量(每小时测序的兆碱基dna)标准化成最大通量的柱状图。y-轴标记=标准化成最大值的通量,x-轴标记=运行次数。

图3示出了在一添加dna/珠粒样本后的纳米孔芯片系统的明视场图像(brightfieldimage)。在形成膜的芯片区域(该区域由黑色圆圈突出显示在其中一个凹槽上)上观察到少量(被视为小的暗点)。

图4示出了在添加dna/珠粒样本20分钟后纳米孔芯片系统的明视场图像。在形成膜的芯片区域(该区域由黑色圆圈突出显示在其中一个凹槽上)上观察到大簇的(在图中用白色虚线圆圈突出显示)。

图5示出了在添加各种之前(点x)和之后(点y)饱和通道的数量图(y-轴)。被研究的不同的官能团是1-硅烷,2-链霉亲和素和与短的生物素化dna链结合的3-链霉亲和素。

图6示出了向纳米孔系统中添加不同珠粒(1-硅烷,2-链霉亲和素,与短的生物素化dna链结合的3-链霉亲和素;隔离和下拉式4-钴基组氨酸标签)时不再活动(标记为x的柱)的单通道mspa纳米孔的百分比(y-轴)和饱和通道(标记为y的柱)的百分比。

图7示出了在存在链霉亲和素包被的珠粒(标记为2)的情况下或不存在链霉亲和素包被的珠粒(标记为0)的情况下孔数量(y-轴)相对于开孔电流(x-轴,pa)的示意图。

图8a示出了阵列芯片上单个凹槽的侧面的卡通示意图。由tok光致抗蚀剂制成的支柱标记为a,凹槽的侧面标记为b,凹槽内和凹槽上的缓冲液标记为d并显示为深灰色,膜(两亲层)标记为e并用黑线显示,f表示包被在dna中的微粒。该图示出了微粒沉积在油层的边缘上,然后微粒沿着油层的边缘滚动并收集在膜的顶部。图8b示出了阵列芯片中同一单凹槽的俯视图和侧视图(10倍放大)。向缓冲溶液中添加荧光团,并向预处理液(油)中添加不同颜色的荧光团,以说明这些溶液存在在系统中的哪些地方。这些图像说明图8a中以卡通形式示出的系统在阵列芯片中制备,因为这些图像是使用共焦显微镜拍摄的图像。

图9示出了如何输送dna样本(a)到磁性微粒上、检测并随后在输送第二dna样本(b)到磁性微粒上之前从纳米孔移去dna样本(a)、检测第二dna样本(b)并随后从纳米孔移去的卡通示意图。(a)表示没有添加磁性微粒的系统。(b)表示使用磁性微粒输送样本a。(c)表示来自样本a的信息的充分数据收集。(d)表示从系统中移去微粒(其在样本a中进行包被),这通过将磁珠暴露于磁体来完成,所述磁体通过从膜中移去磁性微粒来使样本a从膜中解偶联。(e)表示系统现在没有样本a。(f)表示使用磁性微粒输送第二样本b。(g)表示来自样本b的信息的充分数据收集。(h)表示从系统中移去微粒(其在样本b中进行包被),这通过将磁珠暴露于磁体来完成,所述磁体通过从膜中移去磁性微粒来使样本b从膜中解偶联。为了输送、检测并且然后移去大量样本,可以重复上述过程。

图10示出了dna如何与实施例5中的连接的卡通示意图(未按比例)。双链dna(dsdna)样本通过λdna的片段化获得(以虚线表示,标记为a),并具有与λdna的任一端连接的y-适配器(标记为b)和发夹适配器(标记为c)。与y-适配器结合的解旋酶标记为d。示出了与发夹适配器杂交的寡核苷酸(标记为e)并含有生物素部分(标记为f)。当myonec1(标记为g)与dsdna样本预孵育时,珠粒表面上的链霉亲和素(显示为黑色圆圈并标记为h)将与生物素结合。dsdna样本还具有附加的锚定体(标记为j),其连接到与y-适配器杂交的dna链(标记为i)上,该锚定体用于将dna连接到膜。该图示出了单个dsdna样本的连接,然而珠粒被链霉亲和素覆盖,因此极有可能在单个珠粒上结合多个dsdna样本。

图11示出了样本a和b在实施例6所描述的实验期间的覆盖深度的两个图(y-轴=覆盖深度,x-轴=样本1(见标记为1的区域)和2(见标记为2的区域)的多核苷酸序列中的dna碱基数)。覆盖深度涉及事件的数量(thenumberofinstances),当其在dna序列中的位置已经在经解旋酶控制的dna移动中进行了映射和鉴定时。(a)部分表示向纳米孔系统中仅添加样本1时的覆盖深度,(b)部分表示样本a已经从系统中洗去且样本b已添加到系统中时的覆盖深度。样本1的dna序列比样本2的dna序列长得多。从系统中冲洗掉珠粒(样本1与其连接)并且添加了具有样本2的珠粒之后,样本1的覆盖深度非常低。

图12示出了纳米孔芯片系统的同一区域的两个显微镜图像。(a)表示在添加连接到珠粒的样本a之后纳米孔芯片系统的显微镜图像。在形成膜的芯片区域(该区域由黑色圆圈突出显示在其中一个凹槽上)上观察到大簇的(在图中用白色虚线圆圈突出显示)。(b)表示使用3×1ml体积的缓冲液冲洗纳米孔系统之后纳米孔芯片系统的显微镜图像。在形成膜的芯片区域上没有看见珠粒。

图13a示出了实施例7中描述的低输入方案的示意图。

图13b示出了基于pcr的低输入方案(参见实施例7)的示意图。

图14示出了如实施例8所述的序列捕获工作流程。

序列表的说明

seqdno:1显示了编码ms-b1突变体mspa单体的密码子优化的多核苷酸序列。该突变体缺乏信号序列,并包括以下突变:d90n,d91n,d93n,d118r,d134r和e139k。

seqidno:2显示了mspa单体的ms-b1突变体的成熟形式的氨基酸序列。该突变体缺乏信号序列,并包括以下突变:d90n,d91n,d93n,d118r,d134r和e139k。

seqidno:3显示了编码了α-溶血素-e111n/k147n(α-hl-nn;stoddart等人,pnas,2009;106(19):7702-7707)的一个单体的多核苷酸序列。

seqidno:4显示了α-hl-nn的一个单体的氨基酸序列。

seqidno:5至7显示了mspb,c和d的氨基酸序列。

seqidno:8显示了编码了phi29dna聚合酶的多核苷酸序列。

seqidno:9显示了phi29dna聚合酶的氨基酸序列。

seqidno:10显示了衍生自大肠杆菌中的sbcb基因的密码子优化的多核苷酸序列。其编码来自大肠杆菌的外切核酸酶i酶(ecoexoi)。

seqidno:11显示了来自大肠杆菌的外切核酸酶i酶(ecoexoi)的氨基酸序列。

seqidno:12显示了衍生自大肠杆菌的xtha基因的密码子优化的多核苷酸序列。其编码来自大肠杆菌的外切核酸酶iii酶。

seqidno:13显示了来自大肠杆菌的外切核酸酶iii酶的氨基酸序列。该酶在3’-5’方向上对来自双链dna(dsdna)一条链的5’单磷酸核苷进行分配消化。链上的酶引发需要约4个核苷酸的5’突出。

seqidno:14显示了衍生自嗜热链球菌(t.thermophilus)中的recj基因的密码子优化的多核苷酸序列。其编码来自嗜热链球菌(tthrecj-cd)的recj酶。

seqidno:15显示了来自嗜热链球菌(tthrecj-cd)的recj酶的氨基酸序列。该酶在5’-3’方向上对来自ssdna的5’单磷酸核苷执行进行性消化。链上的酶引发需要至少4个核苷酸。

seqidno:16显示了衍生自噬菌体λexo(redx)基因的密码子优化的多核苷酸序列。其编码噬菌体λ外切核酸酶。

seqidno:17显示了噬菌体λ外切核酸酶的氨基酸序列。所述序列是组装成三聚体的三个相同亚基之一。所述酶在5’-3’方向上对来自dsdna的一条链的核苷酸执行高效的进行性消化(http://www.neb.com/nebecomm/products/productm0262.asp)。链上的酶引发优选需要具有5’磷酸的约4个核苷酸的5’突出。

seqidno:18显示了hel308mbu的氨基酸序列。

seqidno:19显示了hel308csy的氨基酸序列。

seqidno:20显示了hel308tga的氨基酸序列。

seqidno:21显示了hel308mhu的氨基酸序列。

seqidno:22显示了traieco的氨基酸序列。

seqidno:23显示了xpdmbu的氨基酸序列。

seqidno:24显示了dda1993的氨基酸序列。

seqidno:25显示了trwccba的氨基酸序列。

具体实施方式

应当理解,所公开产品与方法的不同应用可以根据本领域的具体需要进行调整。还应当理解,本文中使用的术语仅用于描述并不用于限制本发明的具体实施例。

此外,如本说明书和所附权利要求书中所使用的,除非另有说明,单数形式“一个”、“一种”和“所述”包括复数指示物。因此,例如,“分析物”包括两个或更多个分析物,“微粒”包括两个或更多个微粒,“多核苷酸”包括两个或更多个多核苷酸,“锚定体”指两个或更多个锚定体,“解旋酶”包括两个或更多个解旋酶,“跨膜孔”包括两个或更多个孔等等。

本文中无论是上文还是下文所引用的所有出版物、专利和专利申请均通过引用全部结合在本文中。

本发明的方法

本发明提供一种向膜中的跨膜孔输送分析物的方法。所述方法包括提供连接到微粒的分析物。所述方法还可以包括将所述分析物连接到所述微粒。然后,将所述微粒输送给所述膜,从而向所述跨膜孔输送所述分析物。

发明人出人意料地发现可以通过将分析物连接到微粒来实现向孔输送超低浓度的分析物。这样可以将进行检测所需的分析物的量降低几个数量级。所需分析物的量的减少程度是不可预测的。具体地,发明人出人意料地发现单链多核苷酸的捕获比先前描述的增加至少10个数量级。这对于诊断设备诸如下一代测序系统等主要关注的样本制备要求具有重大意义。

本发明的方法优选用于向膜中的跨膜孔输送浓度增加的分析物。本发明的方法优选是通过向跨膜孔输送浓度增加的分析物来采用膜中的跨膜孔对分析物进行表征的改进方法。输送到跨膜孔的分析物的浓度相对于没有与膜偶联的分析物优选增加至少约1,000倍、至少约10,000倍、至少约100,000倍、至少约1,000,000倍、至少约10,000,000倍、至少约100,000,000倍。

当分析物也偶联到膜时,采用微粒的输送效率特别得到增加。偶联分析物到膜为各种纳米孔-酶测序应用增添了优点。在链测序中,当引入多核苷酸分析物时,孔可能被永久地或暂时地阻断,从而阻止对多核苷酸进行测序。当多核苷酸分析物的一端远离孔定位时,例如,通过偶联或系链方式与膜连接,出人意料地发现不再观察到这种暂时或永久阻断。通过将多核苷酸偶联到膜占用其一端,还用于有效地增加孔上的分析物浓度,从而增加测序系统的工作周期(dutycycle)。输送到跨膜孔的分析物的浓度相对于偶联到膜的分析物优选增加至少约5,6,7,8,9,10,11,12,13,14,15,16,17,18,19倍、至少约20倍、至少约25倍、至少约30倍、至少约35倍、至少约40倍、至少约45倍、至少约50倍或至少约100倍。

本发明的方法优选用于向膜中的跨膜孔输送浓度增加的多核苷酸以便进行表征或测序。本发明的方法优选是通过向跨膜孔输送浓度增加的分析物来采用膜中的跨膜孔对多核苷酸进行表征或测序的改进方法。输送到跨膜孔的多核苷酸的浓度优选增加上述任一量。所述方法当然有利于检测以低浓度存在的分析物。当分析物以约0.001pm至约1nm,例如,小于约0.01pm、小于约0.1pm、小于约1pm、小于约10pm或小于约100pm的浓度存在时,所述方法优选使所述分析物能够输送到跨膜孔(并且可选地,确定存在该分析物或确定其一个或多个特征)。所述方法当然有利于检测以低浓度存在的分析物。当分析物以约0.001pm至约1nm,例如,小于约0.01pm、小于约0.1pm、小于约1pm、小于约10pm或小于约100pm的浓度存在时,所述方法优选允许确定存在该分析物或确定其一个或多个特征。

当存在约10ng或更少,例如,约5ng或更少、约2.5ng或更少、约1.0ng或更少、约0.5ng或更少、约0.1ng或更少、约0.01ng或更少或者约0.001ng或更少的分析物时,所述方法优选能够使该分析物输送到跨膜孔(并且可选地,确定存在该分析物或确定其一个或多个特征)。当存在约5.0飞摩尔(fmol)或更少,例如,约4.0飞摩尔或更少、约3.0飞摩尔或更少、约2.0飞摩尔或更少、约1.0飞摩尔或更少、约0.5飞摩尔或更少、约0.1飞摩尔或更少、约0.01飞摩尔或更少或者约0.001飞摩尔或更少的分析物时,所述方法优选使能该分析物输送到跨膜孔(并且可选地,确定存在该分析物或确定其一个或多个特征)。

因为只能从人类血液中获得少量纯化的多核苷酸,所以本发明的方法对于多核苷酸测序是特别有利的。所述方法优选允许向跨膜孔输送以约0.001pm至约1nm浓度,例如,小于0.01pm、小于0.1pm、小于1pm、小于10pm或小于100pm浓度存在的多核苷酸(并且可选地,估计多核苷酸的序列或允许对多核苷酸进行测序)。

当存在约10ng或更少,例如,约5ng或更少、约2.5ng或更少、约1.0ng或更少、约0.5ng或更少、约0.1ng或更少、约0.01ng或更少或者约0.001ng或更少的多核苷酸时,所述方法优选能使多核苷酸输送到跨膜孔(并且可选地,估计多核苷酸的序列或允许对多核苷酸进行测序)。当存在约5.0飞摩尔(fmol)或更少,例如,约4.0飞摩尔或更少、约3.0飞摩尔或更少、约2.0飞摩尔或更少、约1.0飞摩尔或更少、约0.5飞摩尔或更少、约0.1飞摩尔或更少、约0.01飞摩尔或更少或者约0.001飞摩尔或更少的多核苷酸时,所述方法优选能使多核苷酸输到跨膜孔(并且可选地,估计多核苷酸的序列或允许对多核苷酸进行测序)。

本发明的方法优选允许向跨膜孔输送(并且可选地,表征)分析物或多核苷酸的单个分子。

正如以下更详细讨论的,可以使用本发明来表征相同或相似分析物的两个或更多个版本。这在多核苷酸测序中是有利的,因为这允许对多核苷酸的序列进行多次研究。这使得测序效率和精度得以提高。

将多核苷酸的一端偶联到膜(即使暂时性地)也意味着该末端将被阻止干扰基于纳米孔的测序过程。

本发明的方法还具有其它优点。本发明中使用的微粒可以被设计成从含有其它分析物的样本中选择或捕获目标分析物并将分析物输送到跨膜孔。这将在以下进行更详细的讨论。

用于纳米孔表征或测序的样本制备通常涉及使用微粒纯化分析物,例如,多核苷酸。然后在表征或测序之前移去微粒。如果微粒用于将分析物或多核苷酸输送到跨膜孔,则样本制备方法少了一个步骤,因此更快且更容易实施。

分析物

本发明的方法关注于向膜中的跨膜孔输送分析物。可以输送任一数量的分析物。例如,本发明的方法可能涉及输送两个或更多个分析物,例如,3或更多个、4或更多个、5或更多个、6或更多个、7或更多个、8或更多个、9或更多个、10或更多个、20或更多个、30或更多个、50或更多个、100或更多个、500或更多个、1,000或更多个、5,000或更多个、10,000或更多个、100,000或更多个、1,000,000或更多个或者5,000,000或更多个。可以使用相同的微粒或不同的微粒来输送所述两个或更多个分析物。

如果输送了两个或更多个分析物,则其可以彼此不同。例如,第一分析物可以是蛋白,第二分析物可以是多核苷酸。可选地,两个或更多个分析物可以是不同的多核苷酸。两个或更多个分析物可以是多个拷贝的较长多核苷酸序列(例如,多个拷贝的基因组)的随机片段化产物,因此可以是不同的但却重叠的多核苷酸片段。两个或更多个分析物可以是相同分析物的两个或更多个实例。两个或更多个分析物可以是相同的。这允许校对阅读,特别是如果分析物是多核苷酸时。如果所述方法关注于研究三个或更多个分析物,则其均可以是相同分析物的三个或更多个实例,或者其中的一些可以是相同分析物的不同实例。

本发明的方法可以涉及确定或测量分析物的一个或多个特征。所述方法可以涉及确定或测量分析物的两个、三个、四个或五个或更多个特征。所述一个或多个特征优选选自(i)分析物的尺寸;(ii)分析物的同一性;(iii)分析物的二级结构和(iv)分析物是否是经修饰的。根据本发明,可以测量(i)至(iv)的任一组合,例如{i},{ii},{iii},{iv},{i,ii},{i,iii},{i,iv},{ii,iii},{ii,iv},{iii,iv},{i,ii,iii},{i,ii,iv},{i,iii,iv},{ii,iii,iv}或{i,ii,iii,iv}。本发明的方法优选包括估计多核苷酸的序列或对多核苷酸进行测序。这将在以下进行更详细的讨论。

分析物可以是任一物质。合适的分析物包括但不限于金属离子、无机盐、诸如聚合酸或碱基等聚合物、染料、漂白剂、药物、诊断剂、消遣性药物、爆炸物和环境污染物。

分析物可以是从细胞分泌的分析物。或者,分析物可以是存在于细胞内的分析物,使得在实施本发明之前必须从细胞中提取该分析物。

分析物优选为氨基酸、肽、多肽、蛋白质或多核苷酸。氨基酸、肽、多肽或蛋白质可以是天然存在的或非天然存在的。所述多肽或蛋白质可以在其内包括合成的或经修饰的氨基酸。对氨基酸进行的许多不同类型的修饰是本领域已知的。出于本发明的目的,应当理解,可以通过本领域可用的任一方法来对分析物进行修饰。

所述蛋白质可以是酶、抗体、激素、生长因子或生长调节蛋白,例如,细胞因子。细胞因子可以选自白介素,优选ifn-1、il-2、il-4、il-5、il-6、il-10、il-12或il-13,干扰素,优选il-γ或诸如tnf-α等其它细胞因子。所述蛋白质可以是细菌蛋白质、真菌蛋白质、病毒蛋白质或寄生虫衍生蛋白质。在与孔接触之前,所述蛋白质可以展开以形成多肽链。

所述分析物最优选是多核苷酸,例如,核酸。以下对多核苷酸进行更详细的讨论。多核苷酸可以在其5’末端或3’末端或沿着该链的一个或多个中间点偶联到膜。如下所述,多核苷酸可以是单链或双链的。多核苷酸可以是环状的。多核苷酸可以是适配体、与微小rna杂交的探针或微小rna本身(wang,y.等人;《自然纳米技术》(naturenanotechnology)2011,6,668-674)。所述分析物可以是与蛋白质结合的多核苷酸并且可用于表征该蛋白质,例如,确定其浓度。

当分析物是与微小rna杂交的探针时,探针可以永久或暂时偶联到膜。这将在以下进行更详细的讨论。探针本身可以适于偶联到膜,或者可以与已经偶联到膜的互补多核苷酸杂交。分析物可以是杂交到探针的微小rna的复合物,其中,探针具有独特的序列或条形码,使得其能够被明确地识别。

当分析物是适配体时,适配体可以永久地或暂时地偶联到膜。适配体本身可以适于直接偶联到膜,或者可以与已经偶联到膜的互补多核苷酸杂交。适配体可以结合或不结合到蛋白分析物并且检测适配体的最终目的可以是检测其结合的蛋白分析物的存在、不存在或检测蛋白分析物的一个或多个特征。

多核苷酸

分析物优选为多核苷酸。多核苷酸,例如,核酸,是包含两个或更多个核苷酸的大分子。多核苷酸或核酸可以包含任何核苷酸的任一组合。核苷酸可以是天然存在的或人造的。多核苷酸中的一个或多个核苷酸可能被氧化或甲基化。多核苷酸中的一个或多个核苷酸可能被损坏。例如,多核苷酸可以包含嘧啶二聚体。这种二聚体通常与紫外线造成的损伤相关,并且是皮肤黑素瘤的主要原因。可以对多核苷酸中的一个或多个核苷酸进行修饰,例如,用标记或标签进行修饰。以下对合适的标记进行描述。多核苷酸可以包含一个或多个间隔区。

核苷酸通常含有核碱基、糖和至少一个磷酸基。核碱基和糖形成核苷。

核碱基通常是杂环的。核碱基包括但不限于嘌呤和嘧啶,并且更具体地包括腺嘌呤(a)、鸟嘌呤(g)、胸腺嘧啶(t)、尿嘧啶(u)和胞嘧啶(c)。

糖通常为戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。糖优选为脱氧核糖。

多核苷酸优选包含以下核苷:脱氧腺苷(da)、脱氧尿苷(du)和/或脱氧胸苷(dt)、脱氧鸟苷(dg)和脱氧胞苷(dc)。

核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常包括单磷酸盐、二磷酸盐或三磷酸盐。核苷酸可以包含三个以上的磷酸,例如,4或5个磷酸。磷酸可以连接在核苷酸的5’或3’侧。核苷酸包括但不限于腺苷单磷酸(amp)、鸟苷单磷酸(gmp)、胸苷单磷酸(tmp)、尿苷单磷酸(ump)、5-甲基胞苷单磷酸、5-羟甲基胞苷单磷酸、胞苷单磷酸(cmp)、环腺苷单磷酸(camp)、环鸟苷单磷酸(cgmp)、脱氧腺苷单磷酸(damp)、脱氧鸟苷单磷酸(dgmp)、脱氧胸苷单磷酸(dtmp)、脱氧尿苷单磷酸(dump)、脱氧胞苷单磷酸(dcmp)和脱氧甲基胞苷单磷酸。核苷酸优选选自amp,tmp,gmp,cmp,ump,damp,dtmp,dgmp,dcmp和dump。

核苷酸可以是无碱基的(即,缺少核碱基)。核苷酸也可能缺乏核碱基和糖(即,为c3间隔区)。

多核苷酸中的核苷酸可以以任一方式彼此连接。核苷酸通常如核酸一样通过其糖和磷酸基连接。核苷酸可以如嘧啶二聚体中一样通过其核碱基连接。

多核苷酸可以是单链或双链的。多核苷酸的至少一部分优选是双链的。

多核苷酸可以是核酸,例如,脱氧核糖核酸(dna)或核糖核酸(rna)。多核苷酸可以包含与一条dna链杂交的一条rna链。多核苷酸可以是本领域已知的任一合成核酸,例如,肽核酸(pna)、甘油核酸(gna)、苏糖核酸(tna)、锁核酸(lna)或其它具有核苷酸侧链的合成聚合物。pna骨架由通过肽键连接的重复n-(2-氨基乙基)-甘氨酸单元组成。gna骨架由通过磷酸二酯键连接的重复二醇单元组成。tna骨架由通过磷酸二酯键连接在一起的重复苏糖组成。lna由上述核糖核苷酸形成,其具有连接核糖部分中的2’氧和4’碳的额外桥。

多核苷酸最优选为核糖核酸(rna)或脱氧核糖核酸(dna)。

多核苷酸可以是任一长度。例如,多核苷酸可以是至少10个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个或至少500个核苷酸或核苷酸对长度。多核苷酸可以是1,000个或更多个核苷酸或核苷酸对、5,000个或更多个核苷酸或核苷酸对或100,000个或更多个核苷酸或核苷酸对长度。

样本

分析物可以存在于任一合适的样本中。样本可以是生物样本。可以采用至少一种从任一生物或微生物获得或提取的样本在体外实施本发明。所述生物或微生物通常是古细菌、原核生物或真核生物,并且通常属于这五个生物界之一:植物、动物、真菌、原核生物和原生生物。可以在至少一种从任一病毒获得或提取的样本上在体外实施本发明。样本优选为流体样本。样本通常包括患者的体液。样本可以是尿液、淋巴液、唾液、粘液或羊水,但优选为血液、血浆或血清。通常,样本来源于人类,但是替换地其也可以来自另一种哺乳动物,例如,来自诸如马、牛、羊、鱼、鸡或猪等商业养殖动物或者可以替换地是诸如猫或狗等宠物。可选地,样本可以来源于植物,例如,从诸如谷物、豆类、水果或蔬菜等商业作物中获得的样本,例如:小麦、大麦、燕麦、菜籽油(canola)、玉米、大豆、米、大黄、香蕉、苹果、西红柿、土豆、葡萄、烟草、菜豆(beans)、扁豆、甘蔗、可可、棉花。

样本可以是非生物样本。非生物样本优选为液体样本。非生物样本的实例包括手术液、诸如饮用水、海水或河水等水以及实验室试验用试剂。

在本发明中使用之前通常对样本进行处理,例如,通过离心或穿过膜过滤出不需要的分子或细胞,例如,红细胞。取样后可以立即测定样本。在测定之前通常也可以对样本进行储存,优选-70℃以下。

可以使用根据本发明的任一膜。合适的膜是本领域公知的。膜优选为两亲层。两亲层是由两亲分子形成的层,例如,具有亲水性和亲油性的磷脂质。两亲分子可以是合成的或天然存在的。形成单层的非天然存在的两亲物和两亲物是本领域已知的,并且包括,例如,嵌段共聚物(gonzalez-perez等人;《朗缪尔》(langmuir)2009,25,10447-10450)。嵌段共聚物是聚合物材料,其中,两个或更多个的单体亚单元聚合在一起产生单一聚合物链。嵌段共聚物通常具有每个单体亚单元所贡献的性质。然而,嵌段共聚物可以具有由各个亚单元形成的聚合物所不具有的独特性质。可以对嵌段共聚物进行改造,使得其中一个单体亚单元在水性介质中时是疏水的(即,亲油的),而另一个亚单元是亲水的。在这种情况下,嵌段共聚物可以具有两亲性质并且可以形成模拟生物膜的结构。嵌段共聚物可以是二嵌段(由两个单体亚单元组成),但也可以由两个以上单体亚单元构成,从而形成表现为两亲物的更复杂结构。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。所述膜优选为三嵌段共聚物膜。

古细菌双极四醚脂质(bipolartetraetherlipids)是天然存在的脂质,对其进行构建使得脂质形成单层膜。通常可以在恶劣生物环境中存活的极端微生物、嗜热菌、嗜盐菌和嗜酸菌中发现这些脂质。其稳定性被认为是源于最终双层的融合性质。通过产生具有一般基序亲水-疏水-亲水性的三嵌段聚合物来直接构建模拟这些生物实体的嵌段共聚物材料。该材料可以形成与脂质双层表现类似的单体膜,并且包括从囊泡到层状膜的一系列相行为。由这些三嵌段共聚物形成的膜相比生物脂质膜具有多个优点。由于三嵌段共聚物是合成的,因此可以仔细地控制实际结构,以提供形成膜以及与孔和其它蛋白质相互作用所需的正确链长度和性质。

嵌段共聚物也可以由不分类为脂质亚材料的亚单元构建;例如,疏水性聚合物可以由硅氧烷或其它非烃基单体制成。嵌段共聚物的亲水性亚段也可以具有低的蛋白结合性质,这使得产生当暴露于未加工生物样本时具有高抗性的膜。该头基单元还可以衍生自非典型性脂质头基(headgroup)。

与生物脂质膜相比,三嵌段共聚物膜还具有提高的机械和环境稳定性,例如,更高的操作温度或ph范围。嵌段共聚物的综合性质为广泛应用基于聚合物的膜提供了平台。

膜最优选是申请号为pct/gb2013/052766或pct/gb2013/052767的国际申请中公开的膜之一。

可以对两亲分子进行化学修饰或官能化以促进分析物的偶联。

两亲层可以是单层或双层。两亲层通常是平面的。两亲层可以是弯曲的。两亲层可以是负载型的。两亲层可以是凹形的。如图8所示,两亲层可以从凸起的柱(标记为a)悬吊下来,使得两亲层(与标记为a的柱连接)的周边区域高于图8所示并标记为e的两亲层区域。这样可以使微粒沿着如上所述的膜行进、移动、滑动或滚动。

两亲膜通常是天然可移动的,基本上作为二维流体,并具有约为10-8cms-1的脂质扩散速率。这意味着孔和偶联的分析物通常可以在两亲膜内移动。

膜可以是脂质双层。脂质双层是细胞膜的模型,并作为一系列实验研究的优秀平台。例如,脂质双层可以通过通过单通道记录对膜蛋白进行体外研究。替换地,脂质双层可用作用以检测一系列物质存在的生物传感器。脂质双层可以是任一脂质双层。合适的脂质双层包括但不限于平面脂质双层、负载双层或脂质体。脂质双层优选为平面脂质双层。申请号为pct/gb08/000563(公开为wo2008/102121)、申请号为pct/gb08/004127(公开为wo2009/077734)和申请号为pct/gb2006/001057(公开为wo2006/100484)的国际申请中公开了合适的脂质双层。

脂质双层的形成方法是本领域已知的。实施例中公开了合适的方法。通常通过montal和mueller(《美国国家科学学院院刊》(proc.natl.acad.sci.usa.)1972;69:3561-3566)的方法形成脂质双层,其中,脂质单层在穿过与该界面垂直的孔的任一侧被承载在水溶液/空气界面上。通常,通过首先将脂质溶解在有机溶剂中,然后在孔的任一侧上使一滴溶剂蒸发在水溶液表面上来向电解质水溶液的表面添加所述脂质。一旦有机溶剂蒸发,孔任一侧上的溶液/空气界面物理性上下移动穿过该孔直到形成双层。平面脂质双层可以跨过膜中的孔或跨过凹槽中的开口形成。

montal和mueller的方法受到欢迎,因为其是形成适于蛋白孔插入的优质脂质双层的划算且较直接的方法。其它形成双层的常见方法包括脂质体双层的尖端浸渍、涂覆双层和膜片钳术。

尖端浸渍双层形成法需要使孔表面(例如,吸管尖端)与携带单层脂质的测试溶液的表面相接触。同样,通过使溶解在有机溶剂中的一滴脂质在溶液表面蒸发来首先在溶液/空气界面产生脂质单层。然后,通过langmuir-schaefer工艺形成双层,所述双层需要机械自动化操作来使孔相对于溶液表面移动。

对于涂覆双层法,将溶解在有机溶剂中的一滴脂质直接施加到浸没在水性测试溶液中的孔上。使用画笔或等效物将脂质溶液薄薄地铺展在孔上。溶剂变薄使得形成脂质双层。然而,完全从双层中移去溶剂比较困难,因此,通过该方法形成的双层在电化学测量期间不太稳定并且更容易受噪音影响。

膜片钳术通常用在生物细胞膜的研究中。通过抽吸将细胞膜夹紧在吸管的末端,并且膜的一小片附着在孔上。该方法已适用于通过夹紧脂质体,然后脂质体在吸管的孔上急迫地留下脂质双层密封来制备脂质双层。所述方法需要稳定的巨型单层脂质体,并且需要在具有玻璃表面的材料中制备小孔。

可以通过超声法、挤出法或mozafari法(colas等人(2007);《微胶粒》(micron)38:841-847)形成脂质体。

在优选实施例中,如申请号为pct/gb08/004127(公开为wo2009/077734)的国际申请中所描述的形成脂质双层。在该方法中,有利的是脂质双层由干燥脂质形成。在最优选的实施例中,如wo2009/077734(pct/gb08/004127)中所描述的,跨开口形成脂质双层。

脂质双层由两个相对的脂质层形成。这两层脂质被排列成使得其疏水性尾基朝向彼此以形成疏水性内部。脂质的亲水性头基朝外面对双层每侧上的水性环境。双层可以存在于许多脂质相中,包括但不限于液体无序相(流体层状)、液体有序相、固体有序相(层状凝胶相、交叉凝胶相)和平面双层晶体(层状亚凝胶相、层状结晶相)。

可以采用形成脂质双层的任一脂质组合物,对所述脂质组合物进行选择,使得形成具有所需性质,例如,表面电荷、膜蛋白支撑能力、堆积密度或机械性能的脂质双层。脂质组合物可以包括一种或多种不同的脂质。例如,脂质组合物可以含有多达100种脂质。脂质组合物优选含有1至10种脂质。脂质组合物可以包含天然存在的脂质和/或人造脂质。

脂质通常包括头基、界面部分和两个可以相同或不同的疏水尾基。合适的头基包括但不限于:中性头基,例如,二酰基甘油酯(dg)和神经酰胺(cm);两性离子头基,例如,磷脂酰胆碱(pc),磷脂酰乙醇胺(pe)和鞘磷脂(sm);带负电的头基,例如,磷脂酰甘油(pg);磷脂酰丝氨酸(ps),磷脂酰肌醇(pi),磷酸(pa)和心磷脂(ca);和带正电的头基,例如,三甲基铵-丙烷(tap)。合适的界面部分包括但不限于天然存在的界面部分,例如,基于甘油或基于神经酰胺的部分。合适的疏水性尾基包括但不限于:饱和烃链,例如,月桂酸(正十二烷酸)、肉豆蔻酸(正十四烷酸)、棕榈酸(正十六烷酸)、硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,例如,油酸(顺式-9-十八烷酸);和支链烃链,例如,植烷酰基。链的长度以及不饱和烃链中双键的位置和数目可以变化。链的长度以及支链烃链中支链(例如,甲基)的位置和数目可以变化。疏水性尾基可作为醚或酯与界面部分连接。脂质可以是霉菌酸。

也可以对脂质进行化学修饰。可以对脂质的头基或尾基进行化学修饰。头基已经进行化学修饰的合适脂质包括但不限于:peg修饰的脂质,例如,1,2-二酰基-sn-甘油-3-磷酸乙醇胺-n-[甲氧基(聚乙二醇)-2000];官能化的peg脂质,例如,1,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺-n-[生物素(聚乙二醇)2000];和修饰用于缀合的脂质,例如,1,2-二油酰基-sn-甘油-3-磷酸乙醇胺-n-(琥珀酰基)和1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-n-(生物素)。尾基已经进行化学修饰的合适脂质包括但不限于:可聚合的脂质,例如,1,2-双(10,12-二十三碳二炔酰基)-sn-甘油-3-磷酸胆碱;氟代脂质,例如,1-棕榈酰基-2-(16-氟棕榈酰)-sn-甘油-3-磷酸胆碱;氘代脂质,例如,1,2-二棕榈酰基-d62-sn-甘油-3-磷酸胆碱;和醚连接的脂质,例如,1,2-双-o-植烷酰基-sn-甘油-3-磷酸胆碱。可以对脂质进行化学修饰或官能化以促进分析物的偶联。

两亲层,例如,脂质组合物,通常包括一种或多种影响该层性质的添加剂。合适的添加剂包括但不限于:脂肪酸,例如,棕榈酸、肉豆蔻酸和油酸;脂肪醇,例如,棕榈醇、肉豆蔻醇和油酸醇;甾醇,例如,胆固醇、麦角固醇、羊毛甾醇、谷甾醇和豆甾醇;溶血磷脂,例如,1-酰基-2-羟基-sn-甘油-3-磷酸胆碱;和神经酰胺。

在另一优选实施例中,膜为固态层。固态层可以由有机和无机材料形成,包括但不限于:微电子材料、诸如si3n4、al2o3和sio等绝缘材料、诸如聚酰胺等有机和无机聚合物、诸如特氟龙等塑料或诸如双组分加成固化硅橡胶等弹性体和玻璃。固态层可以由石墨烯形成。申请号为pct/us2008/010637(公开为wo2009/035647)的国际申请中公开了合适的石墨烯层。yusko等人《自然纳米技术》(naturenanotechnology)2011;6:253-260和申请号为2013/0048499的美国专利申请中描述了在不使用微粒的情况下向固态层中的跨膜孔输送蛋白。本发明的方法可用于改进这些文献所公开的方法中的输送。

通常采用(i)包括孔的人造两亲层,(ii)包括孔的天然存在的独立的脂质双层或(iii)其中插入了孔的细胞来实施所述方法。通常采用人造两亲层来实施所述方法,例如,人造三嵌段共聚物层。该层可以包括除了孔之外的其它跨膜和/或膜内蛋白以及其它分子。以下对合适的装置和条件进行讨论。通常在体外实施本发明的方法。

跨膜孔

跨膜孔是在一定程度上跨膜的结构。其允许在施加电势驱动下水合离子跨膜或膜内流动。跨膜孔通常跨整个膜,使得水合离子可以从膜的一侧流到另一侧。然而,跨膜孔不必须跨过膜。其可能在一端封闭。例如,孔可以是膜中的凹槽、间隙、通道、沟槽或狭缝,水合离子可以沿着其流动或者流入其中。

本发明中可使用任一跨膜孔。孔可以是生物的或人造的。合适的孔包括但不限于蛋白质孔、多核苷酸孔和固态孔。孔可以是dna折纸孔(langecker等人;《科学》(science)2012;338:932-936)。

跨膜孔优选为跨膜蛋白孔。跨膜蛋白孔是允许水合离子(例如,分析物)从膜的一侧流到膜的另一侧的多肽或多肽集合。在本发明中,跨膜蛋白孔能够形成孔,所述孔允许在施加电势驱动下水合离子从膜的一侧流到另一侧。跨膜蛋白孔优选允许诸如核苷酸等分析物从膜,例如,三嵌段共聚物膜,的一侧流到另一侧。跨膜蛋白孔允许多核苷酸,例如,dna或rna移动穿过所述孔。

跨膜蛋白孔可以是单体或低聚物。所述孔优选由多个重复的亚基组成,例如,至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个或至少16个亚基。所述孔优选为六聚、七聚、八聚或九聚孔。所述孔可以是同源寡聚体或异源寡聚体。

跨膜蛋白孔通常包含离子可以流过的桶或通道。所述孔的亚基通常围绕中心轴并且向跨膜β桶或通道或跨膜α-螺旋束或通道提供链。

跨膜蛋白孔的桶或通道通常包含有助于与分析物,例如,核苷酸、多核苷酸或核酸,相互作用的氨基酸。这些氨基酸优选位于桶或通道的收缩(constriction)附近。跨膜蛋白孔通常包含一个或多个带正电荷的氨基酸,例如,精氨酸、赖氨酸或组氨酸或芳族氨基酸,例如,酪氨酸或色氨酸。这些氨基酸通常有助于所述孔和核苷酸、多核苷酸或核酸之间的相互作用。

本发明中所使用的跨膜蛋白孔可以衍生自β-桶孔或α-螺旋束孔。β-桶孔包含由β-链形成的桶或通道。合适的β-桶孔包括但不限于β-毒素(例如,α-溶血素、炭疽毒素和白细胞介素)以及细菌的外膜蛋白/孔蛋白(例如,耻垢分枝杆菌孔蛋白(msp),比如:mspa、mspb、mspc或mspd、csgg、外膜孔蛋白f(ompf)、外膜孔蛋白g(ompg)、外膜磷脂酶a和奈瑟氏菌自身转运脂蛋白(nalp))和其它孔(例如,胞溶素)。α-螺旋束孔包括由α-螺旋形成的桶或通道。合适的α-螺旋束孔包括但不限于内膜蛋白和α外膜蛋白,例如,wza和clya毒素。跨膜孔可以衍生自胞溶素。申请号为pct/ep2015/069965的国际申请中对衍生自csgg的合适孔进行了公开。申请号为pct/gb2013/050667(公开为wo2013/153359)的国际申请中对衍生自胞溶素的合适孔进行了公开。跨膜孔可以衍生自msp或α-溶血素(α-hl)。野生型α-溶血素孔由7个相同的单体或亚基形成(即,其为七聚体)。α-溶血素-nn的一个单体或亚基的序列示于seqidno:4中。

跨膜蛋白孔优选衍生自msp,优选衍生自mspa。这种孔是寡聚的,并且通常包含衍生自msp的7,8,9或10个单体。所述孔可以是衍生自msp的包括相同单体的同源寡聚孔。可选地,所述孔可以是衍生自msp的包含至少一个不同于其它单体的单体异源寡聚孔。优选地,所述孔衍生自mspa或其同源物或旁系同源物。

衍生自msp的单体通常包含seqidno:2所示的序列或其变体。seqidno:2是mspa单体的ms-(b1)8突变体。其包括以下突变:d90n,d91n,d93n,d118r,d134r和e139k。seqidno:2的变体是具有不同于seqidno:2的氨基酸序列的多肽,并且保留形成孔的能力。可以使用本领域已知的任一方法来对变体形成孔的能力进行测定。例如,可以将变体与其它合适的亚基一起插入两亲层,并且可以对其寡聚形成孔的能力进行确定。本领域已知用于将亚基插入诸如两亲层等膜中的方法。例如,可以将纯化形式的亚基悬浮在包含三嵌段共聚物的溶液中,使得其扩散到膜,并通过与膜结合以及装配成功能状态进行插入。替换地,可以采用“拾取和放置”方法将亚基直接插入膜中,所述方法在m.a.holden和h.bayley《美国化学会杂志》2005,127,6502-6503以及申请号为pct/gb2006/001057(公开为wo2006/100484)的国际申请中进行了描述。

在seqidno:2的整个氨基酸序列长度上,变体基于氨基酸同一性优选与该序列至少50%同源。更优选地,变体基于氨基酸同一性与seqidno:2的氨基酸序列的整个序列可以至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选至少95%、97%或99%同源。在100个或更多个,例如,125,150,175或200或更多的连续氨基酸(“严格同源”)片段长度上,可以存在至少80%,例如,至少85%、90%或95%的氨基酸同一性。

可使用本领域的标准方法来确定同源性。例如,uwgcg软件包提供了可用于计算同源性的bestfit程序,例如,使用其默认设置(devereux等人;(1984)《核酸研究》(nucleicacidsreserach)12,p387-395)。可使用pileup和blast算法来计算同源性或对序列进行比对(例如,识别等效残基或相应序列(通常在其默认设置上)),例如,如altschuls.f.(1993)《分子进化杂志》(jmolevol)36:290-300;altschul,s.f等人(1990)《分子生物学杂志》(jmolbiol)215:403-10中所描述的。进行blast分析的软件可通过美国国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得。

seqidno:2是mspa单体的ms-(b1)8突变体。相比于mspa,变体可以包含mspb,c或d单体中的突变的任一种。mspb,c和d的成熟形式在seqidno:5至7中进行示出。具体地,变体可以包含存在于mspb中的以下取代:a138p。变体可以包含存在于mspc中的以下取代中的一个或多个:a96g,n102e和a138p。变体可以包含存在于mspd中的以下突变中的一个或多个:缺失g1,l2v,e5q,l8v,d13g,w21a,d22e,k47t,i49h,i68v,d91g,a96q,n102d,s103t,v104i,s136k和g141a。变体可以包含mspb,c和d中一个或多个突变和取代的组合。变体优选包含突变l88n。seqidno:2的变体除了ms-(b1)8的全部突变之外还具有突变l88n,并被称为ms-(b2)8。本发明中使用的孔优选为ms-(b2)8。seqidno:2的变体优选包含d56n,d56f,e59r,g75s,g77s,a96d和q126r中的一个或多个。seqidno:2的变体除了ms-(b1)的全部突变之外还具有突变g75s/g77s/l88n/q126r,并被称为ms-(b2c)。本发明中使用的孔优选为ms-(b2)8或ms-(b2c)8。seqidno:2的变体优选包含n93d。变体更优选地包含突变g75s/g77s/l88n/n93d/q126r。

除了上述之外,还可以对seqidno:2的氨基酸序列进行氨基酸取代,例如,进行多达1,2,3,4,5,10,20或30个取代。保守取代用具有类似化学结构、类似化学性质或类似侧链体积的其它氨基酸取代氨基酸。引入的氨基酸与其所取代的氨基酸可以具有相似的极性、亲水性、疏水性、碱性、酸性、中性或电荷。替换地,保守取代可以引入其他芳香族或脂肪族氨基酸来取代预先存在的芳香族或脂肪族氨基酸。

本文所描述的任何蛋白质,例如跨膜蛋白孔,可以被修饰以帮助它们的鉴定和纯化,例如通过加入组氨酸残基(his标签),天冬氨酸残基(asp标签),链亲和素标签,或flag标签,sumo标签,gst标签或mbp标签,或通过加入信号序列以促进它们从细胞中分泌,该细胞中的多肽不天然地含有该信号序列。引入遗传标签的替换方式是通过化学反应将标签连到孔或构建体上天然或人工位点。这方面的例子是将凝胶迁移试剂与人工连接在所述孔外的的半胱氨酸反应。这已被证明是用于分离溶血素异源寡聚物的方法(chembiol.1997jul;4(7):497-505)。

所述孔可以用显示标记物标记。所述显示标记物可以是使得所述孔被检测的任何合适的标记物。合适的标记物包括,但不限于,荧光分子,放射性同位素,例如125i,35s,酶,抗体,抗原,多核苷酸和配体例如生物素。

本文所描述的任何蛋白质,例如跨膜蛋白孔可以通过人工合成或重组手段制备。例如,所述孔可通过体外翻译和转录(ivtt)合成。该孔的氨基酸序列可以被修饰为包括非天然存在的氨基酸或被修饰以提高蛋白质的稳定性。当通过合成手段制备蛋白质时,可以在制备过程引入所述氨基酸。孔也可随合成或重组生产被改变。

本文所描述的任何蛋白质例如跨膜蛋白孔可以使用本领域已知的标准方法制备。可以使用本领域的标准方法衍生和复制编码孔或构建体的多核苷酸序列。可以使用本领域的标准技术在细菌宿主细胞中表达编码孔或构建体的多核苷酸序列。该孔可在细胞中由重组表达载体原位表达多核苷酸而产生。所述表达载体选择性地携带诱导型启动子以控制所述多肽的表达。这些方法在sambrook,j.和russell,d.(2001)。分子克隆:实验手册,第3版。冷泉港实验室出版社,冷泉港,纽约(molecularcloning:alaboratorymanual,3rdedition.coldspringharborlaboratorypress,coldspringharbor,ny)中描述。

所述孔可以从制备蛋白质的生物体或在重组表达后,通过任何蛋白质液相色谱系统进行纯化,而大规模制备。典型的蛋白液相色谱系统包括fplc、akta系统、bio-cad系统、bio-radbiologic系统和gilsonhplc系统。

微粒

使用微粒来输送分析物。本发明的方法中可以使用任一数量的微粒。例如,本发明的方法可以使用单个微粒或2,3,4,5,6,7,8,9,10,20,30,50,100,1,000,5,000,10,000,100,000,500,000或1,000,000或者更多个微粒。如果使用两个以上的微粒,则微粒可以相同。可选地,可以使用不同微粒的混合物。

每个微粒可以连接一个分析物。可选地,每个微粒可以连接两个或更多个分析物,例如,3或更多个、4或更多个、5或更多个、6或更多个、7或更多个、8或更多个、9或更多个、10或更多个、20或更多个、30或更多个、50或更多个、100或更多个、500或更多个、1,000或更多个、5,000或更多个、10,000或更多个、100,000或更多个、1,000,000或更多个或5,000,000或更多个分析物。微粒可以基本上或完全被分析物包被或覆盖。微粒可以在其基本上全部或全部表面上连接分析物。可以通过适配器将微粒连接到诸如多核苷酸的分析物。适配器可以是y-适配器或发夹适配器(见下文)。

分析物,即,分析物的单个实例,可以与两个或更多个微粒连接。分析物,即,分析物的单个实例,可以与上述任一数量的微粒连接。

微粒是通常以微米(μm)测量其尺寸的微观颗粒。微粒也可以称为微球或微珠。微粒可以是纳米颗粒。纳米颗粒是通常以纳米(nm)测量其尺寸的微观颗粒。

微粒通常具有约0.001μm至约500μm的颗粒尺寸。例如,纳米颗粒可具有约0.01μm至约200μm或约0.1μm至约100μm的颗粒尺寸。更多时候,微粒具有约0.5μm至约100μm,或例如,约1μm至约50μm的颗粒尺寸。微粒可具有约1nm至约1,000nm,例如,约10nm至约500nm、约20nm至约200nm或约30nm至约100nm的颗粒尺寸。

微粒可以是球形或非球形的。球形微粒可称为微球。非球形颗粒可以是,例如,板状、针状、不规则状或管状。如果颗粒是球形的,本文所用的术语“颗粒尺寸”是指颗粒的直径;或者,如果颗粒是非球形的,“颗粒尺寸”是指基于体积的颗粒尺寸。基于体积的颗粒尺寸是与所讨论的非球形颗粒具有相同体积的球体的直径。

如果所述方法中使用两个或更多个微粒,则微粒的平均颗粒尺寸可以是上述任一尺寸,例如,约0.5μm至约500μm。两个或更多个微粒种群优选具有10%或更少,例如,5%或更少或者2%或更少的变异系数(标准偏差与平均值的比)。

可以使用任一方法来确定微粒的尺寸。合适的方法包括但不限于流式细胞术(参见,例如,chandler等人;《血栓形成和止血杂志》(jthrombhaemost.)2011年6月;9(6):1216-24)。

微粒可以由任一材料形成。微粒优选由陶瓷、玻璃、二氧化硅、聚合物或金属形成。聚合物可以是天然聚合物(例如,聚羟基链烷酸酯、葡聚糖、聚丙交酯、琼脂糖、纤维素、淀粉或壳聚糖)或合成聚合物(例如,聚氨酯、聚苯乙烯、聚(氯乙烯)、硅烷或甲基丙烯酸酯)。合适的微粒是本领域已知的并且可商购获得。陶瓷和玻璃微球可从购得。二氧化硅和聚合物微粒可从epruinanopartieles&mierospheres公司购得。微粒也可从polysciencesinc.、bangslaboratoriesinc.和lifetechnologies公司购得。

微粒可以是固体。微粒可以是中空的。微粒可以由聚合物纤维形成。

如果分析物是多核苷酸,则微粒可以衍生自用于提取和分离该多核苷酸的试剂盒。

微粒表面可与分析物相互作用并连接。所述表面可以天然地与分析物相互作用而不进行官能化。通常对微粒表面进行官能化以促进与分析物的连接。合适的官能团是本领域已知的。例如,可以用多聚组氨酸标签(六组氨酸标签、6xhis标签、his6标签或his-标)、ni-nta、链霉亲和素、生物素、寡核苷酸、多核苷酸(例如,dna,rna,pna,gna,tna或lna)、羧基、季胺基、巯基、叠氮基、炔基、dibo、脂质、flag-标签(flag八肽)、多核苷酸结合蛋白(包括以下任一种)、肽、蛋白、抗体或抗体片段对微粒表面进行官能化。以下对抗体片段进行更详细的讨论。参照随附的,也可以采用下述任一连接体或基团对微粒进行官能化。

可以采用与分析物特异性结合的分子或基团对微粒进行官能化。在这种情况下,与微粒连接并输送到跨膜孔的分析物可以称为目标分析物。这允许微粒能够从含有其它分析物的样本中选择或捕获目标分析物。如果分子或基团优先或以高亲和性结合目标分析物,而不结合其它分析物或不同分析物结合或仅以低亲和性与其它分析物或不同分析物结合,则其与目标分析物特异性结合。如果分子或基团以1×10-6m或更少的kd,更优选为1×10-7m或更少、5×10-8m或更少,更优选1×10-8m或更少,或者更优选5×10-9m或更少结合,则其优先或以高亲和性结合。如果分子或基团以1×10-6m或更多的kd,更优选1×10-5m或更多,更优选1×10-4m或更多,更优选1×10-3m或更多,甚至更优选1×10-2m或更多结合,则其以低亲和性结合。

优选地,所述分子或基团以至少10倍,例如,至少50、至少100、至少200、至少300、至少400、至少500、至少1,000或至少10,000倍大于其对其它分析物的亲和性结合目标分析物。可以使用已知的结合测定法来测量亲和性,例如,那些利用荧光和放射性同位素的结合测定法。竞争性结合测定法也是本领域已知的。可以采用hornblower等人在《自然-方法学》(naturemethods)4:315-317(2007年)中所描的纳米孔力谱来测量肽或蛋白与多核苷酸之间的结合强度。

如果目标分析物是多核苷酸,则可以用寡核苷酸或多核苷酸(例如,上述任一种)对微粒进行官能化,所述寡核苷酸或多核苷酸与目标多核苷酸分析物特异性杂交或包含与目标多核苷酸分析物的部分或区域互补的部分或区域。这使得微粒能够从含有其它分析物(例如,其它多核苷酸)的样本中选择或捕获目标多核苷酸分析物。当寡核苷酸或多核苷酸以优先或高亲和性与目标多核苷酸杂交,但基本上不与其它多核苷酸杂交、不与其它多核苷酸杂交或仅以低亲和性与其它多核苷酸杂交时,则其与目标多核苷酸特异性杂交。如果寡核苷酸或多核苷酸以熔解温度(tm)至少2℃,例如,至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃或至少10℃大于其针对其它序列的tm与目标多核苷酸杂交,则其特异性杂交。更优选地,寡核苷酸或多核苷酸以tm至少2℃,例如,至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃、至少10℃、至少20℃、至少30℃或者至少40℃大于其针对其它核酸的tm与目标多核苷酸杂交。优选地,寡核苷酸或多核苷酸以tm至少2℃,例如,至少3℃、至少4℃、至少5℃、至少6℃、至少7℃、至少8℃、至少9℃、至少10℃、至少20℃、至少30℃或者至少40℃大于其针对一个序列的tm与目标多核苷酸杂交,所述序列与目标多核苷酸存在一个或多个核苷酸,例如,1,2,3,4或5或者更多个核苷酸差异。寡核苷酸或多核苷酸通常以至少90℃,例如,至少92℃或至少95℃的tm与目标多核苷酸杂交。可以使用已知技术,包括使用dna微阵列,对tm进行实验测量,或者可以使用公众可获得的tm计算器进行计算,例如,那些在互联网上获得的tm计算器。

允许杂交的条件在本领域是公知的(例如,sambrook等人,冷泉港实验室出版社出版的《分子克隆:实验室手册》第三版(2001年);和《分子生物学实验指南》(currentprotocolsinmolecularbiology)第2章,ausubel等人编著,纽约greenepublishingandwiley-interscience出版(1995))。可以在低严格条件下进行杂交,例如,在37℃下,在30-35%甲酰胺、1mnacl和1%sds(十二烷基硫酸钠)的缓冲溶液存在的情况下,然后在50℃下在1x(0.1650mna+)至2x(0.33mna+)ssc(标准柠檬酸钠)中洗涤。可以在中度严格条件下进行杂交,例如,在37℃下,在40至45%甲酰胺、1mnacl和1%sds的缓冲溶液存在的情况下,然后在55℃下在0.5x(0.0825mna+)至1x(0.1650mna+)ssc中洗涤。可以在高严格条件下进行杂交,例如,在37℃下,在50%甲酰胺、1mnacl、1%sds的缓冲溶液存在的情况下,然后在60℃下在0.1x(0.0165mna+)ssc中洗涤。

所述寡核苷酸或多核苷酸可以包含与目标多核苷酸的部分或区域基本上互补的部分或区域。因此,相比目标多核苷酸中的该部分或区域,寡核苷酸或多核苷酸的区域或部分可以在5,10,15,20,21,22,30,40或50个核苷酸的区域上具有1,2,3,4,5,6,7,8,9,10或更多个错配。

一部分区域通常为50个核苷酸或更少,例如,40个核苷酸或更少、30个核苷酸或更少、20个核苷酸或更少、10个核苷酸或更少或者5个核苷酸或更少。

微粒优选顺磁性或磁性。微粒优选包含顺磁性材料或超顺磁性材料或顺磁性金属或超顺磁性金属,例如,铁。可以使用任一合适的磁性微粒。例如,可以使用从,例如,clontech、promega、invitrogenthermofisherscientific和neb商购可获得的磁珠。在一些实施方案中,微粒包含连接有有机基团(例如,金属螯合基团,诸如次氮基三乙酸(nta))的磁性颗粒。有机组分可以包括,例如,选自-c(=o)o-,-c-o-c-,-c(=o)-,-nh-,-c(=o)-nh,-c(=o)-ch2-i,-s(=o)2-和-s-的基团。有机组分可以包含金属螯合基团,例如,nta(次氮基三乙酸)。通常,诸如金、铁、镍或钴等金属也与金属螯合基团连接。这种磁珠通常用于捕获his-标签蛋白,但也适用于本发明。

微粒最优选是可从lifetechnologies商购可获得的his-tagiba的magstrep珠、neb的链霉亲和素磁珠、beckmancoulter的固相可逆固定(spri)珠或agencourtampurexp珠或myonetm链霉亲和素c1(thermofisherscientific)。

其它方法

本发明还提供一种向膜中的跨膜孔输送分析物的方法,包括:

(a)提供与固体支持物连接的分析物;和

(b)将所述固体支持物输送向所述膜,并由此将所述分析物输送到跨膜孔。

所述方法优选地包括将所述固体支持物靠近或邻近所述膜定位并使所述固体支持物向所述膜移动。所述固体支持物可以接触膜。固体支持物不必须与膜接触。

所述固体支持物可以是任一固体支持物。合适的示例包括但不限于:探针、板、柱、针和试纸条(dipstick)。探针可以是m.a.holden和h.bayley在《美国化学会杂志》2005,127,6502-6503以及申请号为pct/gb2006/001057(公开为wo2006/100484)的国际申请中描述的任一种。

上述以及下述任一实施例,例如,分析物、样本、孔、膜、装置、官能化、连接、输送、偶联、解偶联、移去、洗涤和表征,同样适用于所述方法。

本发明还提供了一种将分析物输送到膜中的跨膜孔的试剂盒,其包含(a)固体支持物和(b)一个或多个能够将分析物偶联到膜的锚定体。下述任一试剂盒实施方案同样适用于该试剂盒。

连接

分析物和微粒可以以任一方式连接。例如,可以使用下述任一偶联方法将分析物连接到微粒。可以使用下述任一方法将分析物特异性连接到微粒。

分析物可以非特异性连接到微粒。分析物可以被吸附到微粒上。如果分析物作为薄膜附着在微粒外表面和/或微粒内表面上,则其被吸附到微粒上。

分析物可以在一个位点上连接到微粒。分析物可以在两个或更多个,例如,3,4,5,6,7,8,9,10或更多个位点上连接到微粒,例如,如果使用了两个或更多个连接体。

蛋白分析物可以通过其天然存在的氨基酸进行连接,例如,半胱氨酸、苏氨酸、丝氨酸、天冬氨酸、天冬酰胺、谷氨酸和谷氨酰胺。可以对天然存在的氨基酸进行修饰以便于连接。例如,可以通过酰化、磷酸化、糖基化或法尼基化对天然存在的氨基酸进行修饰。其它合适的修饰是本领域已知的。对天然存在的氨基酸进行的修饰可以是翻译后修饰。蛋白分析物可以通过引入其序列中的氨基酸进行连接。这些氨基酸优选通过取代引入。引入的氨基酸可以是促进连接的半胱氨酸或非天然氨基酸。合适的非天然氨基酸包括但不限于4-叠氮基-l-苯丙氨酸(faz)以及liuc.c.和schultzp.g.,《生物化学年度评论》(annu.rev.biochem.),2010,79,413-444的图1中包含的编号为1-71的氨基酸中的任一个。

分析物可以通过连接体分子连接到微粒。可以使用一个或多个,例如,两个或三个连接体将分析物连接到微粒。连接体可以包括横跨所需距离的任一分子。连接体的长度可以从一个碳(光气型连接体)到许多埃(angstrom)变化。适于用作连接体的线性分子的示例包括但不限于聚乙二醇(peg)、多肽、多糖、脱氧核糖核酸(dna)、肽核酸(pna)、苏糖核酸(tna)、甘油核酸(gna)、饱和和不饱和烃、聚酰胺。这些连接体可以是惰性的或反应性的,特别是其在限定位点上可以是可化学断裂的,或者可以用荧光团或配体对其自身进行修饰。连接体优选是耐二硫苏糖醇(dtt)的。优选的柔性肽连接体是2至20个,例如,4,6,8,10或16个丝氨酸和/或甘氨酸的片段。更优选的柔性连接体包括(sg)1,(sg)2,(sg)3,(sg)4,(sg)5,(sg)8,(sg)10,(sg)15或(sg)20,其中,s是丝氨酸,g是甘氨酸。优选的刚性连接体是2至30个,例如,4,6,8,16或24个脯氨酸的片段。更优选的刚性连接体包括(p)12,其中,p是脯氨酸。

可以使用一种或多种化学交联剂或一种或多种肽连接体将分析物连接到微粒。合适的化学交联剂是本领域公知的。合适的化学交联剂包括但不限于包括以下官能团的那些:马来酰亚胺、活性酯、琥珀酰亚胺、叠氮化物、炔烃(例如,二苯并环辛醇(dibo或dbco)、二氟环炔烃和直链炔烃)、膦(例如,无痕和非无痕施陶丁格连接中使用的那些)、卤代乙酰(例如,碘乙酰胺)、光气型试剂、磺酰氯试剂、异硫氰酸酯、酰基卤、肼、二硫化物、乙烯基砜、氮丙啶和光反应试剂(例如,芳基叠氮化物、二氮丙啶)。

氨基酸和官能团之间的反应可以是自发的,例如,半胱氨酸/马来酰亚胺,或者可能需要外部试剂,例如,连接叠氮化物和直链炔烃的cu(i)。

优选的交联剂包括2,5-二氧代吡咯烷-1-基3-(吡啶-2-基二硫烷基)丙酸酯、2,5-二氧代吡咯烷-1-基4-(吡啶-2-基二硫烷基)丁酸酯和2,5-二氧代吡咯烷-1-基8-(吡啶-2-基二硫烷基)辛酸酯、二马来酰亚胺peg1k、二马来酰亚胺peg3.4k、二马来酰亚胺peg5k、二马来酰亚胺peg10k、双(马来酰亚胺基)乙烷(bmoe)、双马来酰亚胺己烷(bmh)、1,4-双马来酰亚胺丁烷(bmb)、1,4-双马来酰亚胺基-2,3-二羟基丁烷(bmdb)、bm[peo]2(1,8-双马来酰亚胺二乙二醇)、bm[peo]3(1,11-双马来酰亚胺三乙二醇)、三[2-马来酰亚氨基乙基]胺(tmea)、dtme二硫代二马来酰亚胺乙烷、双马来酰亚胺peg3、双马来酰亚胺peg11、dbco-马来酰亚胺、dbco-peg4-马来酰亚胺、dbco-peg4-nh2、dbco-peg4-nhs、dbco-nhs、dbco-peg-dbco2.8kda、dbco-peg-dbco4.0kda、dbco-15原子-dbco、dbco-26原子-dbco、dbco-35原子-dbco、dbco-peg4-s-s-peg3-生物素、dbco-s-s-peg3-生物素和dbco-s-s-peg11-生物素。最优选的交联剂是3-(2-吡啶基二硫代)丙酸琥珀酰亚胺酯(spdp)和马来酰亚胺-peg(2kda)-马来酰亚胺(α,ω-双马来酰亚胺基聚乙二醇)。

可以对连接体进行标记。合适的标记包括但不限于荧光分子(例如cy3,fam/fitc或alexa555)、放射性同位素、例如,125i,35s,酶、抗体、抗原、多核苷酸和诸如生物素等配体。这种标记允许对连接体的数量进行量化。标记还可以是可断裂的纯化标签,例如,生物素,或在识别方法中出现的特异性序列,例如,本身不存在于蛋白中但通过胰蛋白酶消化而释放的肽。

可以通过保持连接体的浓度大量过剩于分析物和/或微粒中来防止分析物或微粒自身发生交联。替换地,使用两种连接体时可利用“钥匙和锁”结构。每个连接体的仅一端可以一起反应以形成更长的连接体,而连接体的另一端各自与构建体的不同部分(即,分析物或微粒)反应。

分析物与微粒的连接可以是永久的或稳定的(即,分析物在本发明的方法中不会从微粒脱离)。优选的永久或稳定连接是共价连接。

所述连接优选是暂时的,即,分析物可以在本发明的方法过程中从微粒脱离,例如,一旦输送到孔或者当与孔相互作用时。优选的暂时连接是通过杂交。可以使用两个互补的多核苷酸将分析物与微粒连接。替换地,可以使用这样的两个多核苷酸,每个多核苷酸包含了与另一多核苷酸的部分或区域特异性杂交或互补的部分或区域。一个多核苷酸可以与分析物连接,另一个可以与微粒连接。分析物和微粒然后可以通过两个多核苷酸的杂交来进行连接。多核苷酸可以是上述任一个。替换地,如果分析物是多核苷酸,包含了与多核苷酸分析物的部分或区域特异性杂交或互补的部分或区域的多核苷酸可以与微粒连接。

以下参照偶联对此进行更详细的讨论。其它优选的暂时连接包括但不限于利用多聚组氨酸标签(六组氨酸标签、6xhis标签、his6标签或his-标)、ni-nta或链霉亲和素-生物素的连接。

如下所述,可采用多核苷酸结合蛋白,例如,解旋酶,来控制多核苷酸分析物穿过所述孔的移动。在优选的实施方案中,多核苷酸分析物具有与其结合的多核苷酸结合蛋白(即,多核苷酸分析物包含多核苷酸结合蛋白),并且多核苷酸通过多核苷酸结合蛋白与微粒连接。可以使用上述任一方法将多核苷酸结合蛋白与微粒连接。多核苷酸结合蛋白可以是下述任一种蛋白。多核苷酸结合蛋白优选衍生自解旋酶。

输送

所述方法包括将微粒输送向膜。微粒将分析物输送到膜中的跨膜孔。可以以任一方式将微粒输送向膜。所述方法优选地包括将微粒靠近或邻近膜定位并使微粒向膜移动。可以设置微粒距膜任一距离,例如,距膜约500μm或更近、距膜约200μm或更近、距膜约100μm或更近、距膜约50μm或更近或者距膜约30μm或更近。

微粒向膜移动。微粒通常移动到膜上。微粒可以接触膜。微粒不必须接触膜。例如,如果微粒基本上或完全被分析物包被或者如果其基本上全部或全部表面与分析物连接,则微粒可以不接触膜。在一些实施方案中,分析物(例如,多核苷酸)可以比微粒的颗粒尺寸更大或更长。分析物可以充当微粒和膜之间的缓冲层。微粒向膜移动得足够近以将分析物输送到孔。本领域技术人员可以设计所述系统使得分析物被输送到孔。

微粒可以以任一方式向膜移动。所述方法优选包括使微粒沿着电化学梯度、扩散梯度、亲水梯度或疏水梯度移动。梯度是从一个点或时刻转变成另一个点或时刻时所观察到的性质大小的增加或减少。本领域技术人员将了解如何产生上述任一梯度以及如何使微粒沿着这些梯度移动。例如,带电微粒通常沿着电化学梯度移动。微粒通常朝向膜扩散。微粒通常沿着压力梯度在溶液中流动。亲水或疏水性微粒通常沿亲水或疏水梯度移动。分析物和任一相关联的分子,例如,一个或多个锚定体,可能影响微粒的电荷和/或亲水性/疏水性。

所述方法优选包括使微粒在磁场内移动。所述方法优选地包括使用磁场来将微粒输送到膜。以上对磁性微粒进行了讨论。用于产生磁场的合适的方法是已知的,并且包括但不限于磁性材料或电磁体。

所述方法优选地包括使微粒在电场内移动。所述方法优选地包括使用电场来将微粒输送到膜。带电的微粒是本领域已知的并在以上进行了讨论。用于产生电场的合适的方法是已知的。

所述方法优选包括使微粒在压力下移动。所述方法优选地包括使用压力或流来将微粒输送到膜。压力可以是物理性压力或渗透压力。产生这种压力的合适的方法是已知的。

所述方法优选包括使微粒在重力场或重力作用下移动。所述方法优选地包括使用重力来将微粒输送到膜。在溶液中,放置在膜上的致密微粒将在重力影响下向膜移动。所述方法可以包括使微粒沿着表面向膜行进、移动、滑动或滚动。所述表面通常以大约45°至大约69°的角度倾斜离开包含膜的腔室的垂直壁(其中,所述壁几乎与膜的平面垂直)。所述表面通常以相比膜平面约21°,22°,23°,24°,25°,26°,27°,28°,29°,30°,31°,32°,33°,34°,35°,36°,37°,38°,39°,40°,41°,42°,43°,44°至约45°的角度朝向膜倾斜。在优选实施例中,倾斜表面是通过用合适的预处理液(例如,硅油、ar20或十六烷)对包含膜的腔室的一个或多个表面进行预处理而形成。以下对在本发明方法中使用的包含腔室的合适装置进行讨论。

如果微粒接触膜,所述方法可以包括使微粒沿着膜行进、移动、滑动或滚动。如果微粒不接触膜,则所述方法可以包括使微粒平行于膜行进、移动、滑动或滚动。

偶联

分析物优选包含一个或多个能够与膜偶联的锚定体。所述方法优选还包括采用一个或多个锚定体将分析物偶联到膜。

锚定体包含与分析物偶联(或结合)的基团以及与膜偶联(或结合)的基团。每个锚定体可以与分析物和/或膜共价偶联(或结合)。

可以采用任一数量,例如,2,3,4或更多个锚定体将分析物偶联到膜。例如,可以采用两个锚定体,将分析物偶联到膜,其中,每个锚定体分别与分析物和膜偶联(或结合)。

一个或多个锚定体可以包含一个或多个多核苷酸结合蛋白。每个锚定体可以包含一个或多个多核苷酸结合蛋白。多核苷酸结合蛋白可以是下述任一种。

如果膜为两亲层,例如,三嵌段共聚物膜,则一个或多个锚定体优选包括存在于膜中的多肽锚定体和/或存在于膜中的疏水锚定体。疏水锚定体优选为脂质、脂肪酸、固醇、碳纳米管、多肽、蛋白质或氨基酸,例如,胆固醇、棕榈酸酯或生育酚。在优选实施方案中,一个或多个锚定体不是孔。

可以对膜的组分,例如,两亲分子、共聚物或脂质,进行化学修饰或官能化以形成一个或多个锚定体。以下对膜组分的合适的化学修饰以及合适官能化方式的示例进行更详细的讨论。可以对任一比例,例如,至少0.01%、至少0.1%、至少1%、至少10%、至少25%、至少50%或100%的膜组分进行官能化。

可以直接将分析物偶联到膜。用于将分析物偶联到膜的所述一个或多个锚定体优选包括连接体。所述一个或多个锚定体可以包括一个或多个,例如,2,3,4或更多个连接体。可以使用一个连接体将多个,例如,2,3,4或更多个分析物偶联到膜。

优选的连接体包括但不限于诸如多核苷酸、聚乙二醇(peg)、多糖和多肽等聚合物。这些连接体可以是直链、支链或环状的。例如,连接体可以是环状多核苷酸。如果分析物本身是多核苷酸,则其可以与环状多核苷酸连接体上的互补序列杂交。

一个或多个锚定体或一种或多种连接体可以包括可以切割或分解的组分,例如,限制位点或光敏基团。

官能化连接体及其偶联分子的方式是本领域已知的。例如,用马来酰亚胺基团官能化的连接体与蛋白质中的半胱氨酸残基反应并连接。在本发明的上下文中,蛋白质可以存在于膜中,可以是分析物本身或可以用于偶联(或结合)到分析物。这将在以下进行更详细的讨论。

可以采用“锁和钥匙”结构来避免分析物交联。各连接体的仅一端可以一起反应以形成更长的连接体,各连接体的另一端分别与分析物或膜反应。这样的连接体在申请号为pct/gb10/000132(公开为wo2010/086602)的国际申请中进行描述。

优选在以下所讨论的测序实施方案中使用连接体。如果多核苷酸分析物直接与膜永久偶联,就这一点而言,多核苷酸分析物在其与孔相互作用时不解偶联,则由于膜和孔之间的距离,测序运行不能继续到多核苷酸的末端,一些序列数据将丢失。如果使用连接体,则多核苷酸分析物可以被处理完全。

偶联可以是永久的或稳定的。换言之,偶联可以为以下这样,即,使得当与孔相互作用时,分析物保持与膜偶联。

偶联可以是暂时的。换言之,偶联可以为以下这样,即,当分析物与孔相互作用时,分析物可以与膜解偶联。对于诸如适配体检测和多核苷酸测序等某些应用,偶联的瞬时性质是优选的。如果永久或稳定的连接体直接与多核苷酸的5’或3’末端连接,并且连接体比膜与跨膜孔通道之间的距离短,则因测序运行不能继续到多核苷酸的末端时,某些序列数据将会丢失。如果偶联是暂时的,当偶联端随机脱离膜时,则可以多核苷酸可以被处理完全。以下对形成永久/稳定或暂时链接的化学基团进行更详细的讨论。可以利用胆固醇或脂肪酰基链将分析物暂时偶联到两亲层或三嵌段共聚物膜。可以使用长度为6至30个碳原子的任一脂肪酰基链,例如,棕榈酸。

在优选实施方案中,将多核苷酸分析物(例如,核酸)与诸如三嵌段共聚物膜或脂质双层等两亲层偶联。以上已使用各种不同的连接策略(tetheringstrategies)来将核酸与合成脂质双层偶联。这些总结在下表3中。

表3

合成的多核苷酸分析物和/或连接体可以使用修饰的亚磷酰胺在合成反应中官能化,其更容易与直接添加的适合的锚定基团如胆固醇、生育酚、棕榈酸酯、硫醇、脂质和生物素基团并存。这些不同的连接化学给予多核苷酸一系列连接选择。每个不同的修饰基团以稍微不同的方式偶联到所述多核苷酸且偶联并非总是持久的,所以给予分析物到膜的不同的停留时间。暂时性偶联的优点如上所述。

将多核苷酸偶联到连接体或官能化膜也可以通过许多其它方式实现,使得互补的反应基团或锚定基团可被添加到所述多核苷酸。先前已经描述了向多核苷酸的任一末端添加反应基团。可以采用t4多核苷酸激酶和atpγs向ssdna或dsdna的5’末端添加硫醇基团(grant,g.p.和p.z.qin(2007);在核酸的5’端连接氮氧自由基自旋标记的简便方法(afacilemethodforattachingnitroxidespinlabelsatthe5’terminusofnucleicacids)”;《核酸研究期刊》(nucleicacidsres)35(10):e77)。可以采用t4多核苷酸激酶和γ-[2-叠氮基乙基]-atp或γ-[6-叠氮基己基]-atp向ssdna或dsdna的5’-磷酸基添加叠氮化物基团。采用硫醇或点击化学,可以将系链(tether)共价连接到分析物,所述系链含有硫醇、碘乙酰胺opss或马来酰亚胺基团(与硫醇反应)或dibo(二苯并环辛炔)或炔基(与叠氮化物反应)。可以采用末端转移酶添加更多选择的化学基团,例如,生物素、硫醇和荧光团,从而将修饰的寡核苷酸掺入ssdna的3’端(kumar,a.,p.tchen等人(1988);“采用末端脱氧核苷酸转移酶对合成寡核苷酸探针进行非放射性标记(nonradioactivelabelingofsyntheticoligonucleotideprobeswithterminaldeoxynucleotidyltransferase)”;《分析生物化学期刊》(analbiochem)169(2):376-82)。链霉亲和素/生物素和/或链霉亲和素/脱硫生物素偶联可用于任何其它分析物。以下实施例描述了如何使用链霉亲和素/生物素和链霉亲和素/脱硫生物素将多核苷酸偶联到膜。采用适当修饰的核苷酸(例如,胆固醇或棕榈酸酯)和末端转移酶也可以将锚定体直接添加到多核苷酸。

一个或多个锚定体优选通过杂交将分析物偶联到膜。杂交可以存在于一个或多个锚定体的任一部分中,例如,在一个或多个锚定体与分析物之间、在一个或多个锚定体内或者在一个或多个锚定体与膜之间。一个或多个锚定体中的杂交允许以上述暂时方式进行偶联。例如,连接体可以包括两个或多个,例如,3,4或5个杂交在一起的多核苷酸。如果分析物是多核苷酸,则一个或多个锚定体可以与多核苷酸分析物杂交。一个或多个锚定体可以直接与多核苷酸分析物杂交,直接与连接到多核苷酸分析物的y适配器和/或前导序列杂交,或直接与连接到多核苷酸分析物的发夹环适配器杂交(如下进行更详细的描述)。可选地,一个或多个锚定体可以与一个或多个(例如,2或3个)杂交到多核苷酸分析物的中间多核苷酸(或“夹板”)杂交,或与连接到多核苷酸分析物的y适配器和/或前导序列杂交,或与连接到多核苷酸分析物的发夹环适配器杂交(如下进行更详细的描述)。

一个或多个锚定体可以包括单链或双链多核苷酸。锚定体的一个部分可以连接到单链或双链多核苷酸分析物。已采用t4rna连接酶i对短链ssdna的连接进行了描述(troutt,a.b.,m.g.mcheyzer-williams等人(1992);“锚定连接的pcr:具有单侧特异性的简单扩增技术(ligation-anchoredpcr:asimpleamplificationtechniquewithsingle-sidedspecificity)”《美国国家科学学院院刊》89(20):9823-5)。替换地,单链或双链多核苷酸可以连接到双链多核苷酸分析物,然后通过热或化学变性分离两条链。对于双链多核苷酸,可以向双链体的一端或两端添加一条单链多核苷酸,或向一端或两端添加双链多核苷酸。为了向双链多核苷酸上添加单链多核苷酸,这可以采用用于连接单链多核苷酸其它区域的t4rna连接酶i来实现。为了将双链多核苷酸添加到双链多核苷酸分析物,此时连接可以是“平端的”,分析物和添加的多核苷酸上分别具有互补的3’da/dt尾(通常针对许多样本制备应用进行,防止形成串联体或者二聚体)或采用通过限制消化分析物而产生的“粘性末端”且连接相容适配器。然后,当双链体熔解时,如果单链多核苷酸用于连接,则每个单链在5’或3’末端发生修饰,如果双链多核苷酸用于连接,则5’末端、3’末端或这两个末端发生修饰。

如果多核苷酸分析物是合成链,则可以在多核苷酸化学合成过程中掺入一个或多个锚定体。例如,可以采用连接有反应性基团的引物来合成多核苷酸。

腺苷酸化多核苷酸是连接反应中的中间体,其中,腺苷单磷酸连接到多核苷酸的5’-磷酸基。可以使用各种试剂盒来产生该中间体,例如,neb的5’dna腺苷酸化试剂盒。通过在反应中用atp替代修饰的核苷酸三磷酸酯,然后可以向多核苷酸的5’添加反应性基团(如硫醇、胺、生物素、叠氮化物等)。也可以采用带有适当修饰的核苷酸(例如,胆固醇或棕榈酸酯)的5’dna腺苷酸化试剂盒直接将锚定体添加到多核苷酸。

扩增基因组dna片段的常见技术是使用聚合酶链反应(pcr)。这里,采用两个合成的寡核苷酸引物,可以产生同一dna片段的多个拷贝,其中,对于每个拷贝,双链体中每个链的5’将是合成的多核苷酸。可以通过采用聚合酶向单链或双链dna的3’末端添加单个或多个核苷酸。可以使用的聚合酶的示例包括但不限于末端转移酶、克列诺酶(klenow)和大肠杆菌poly(a)聚合酶。通过在反应中用atp取代修饰的核苷酸三磷酸酯,此时,可以将诸如胆固醇、硫醇、胺、叠氮化物、生物素或脂质等锚定体掺入双链多核苷酸。因此,扩增的多核苷酸的每个拷贝都会含有锚定体。

理想地,将分析物偶联到膜而不需要使分析物官能化。这可以通过将一个或多个锚定体(例如,多核苷酸结合蛋白或化学基团)偶联到膜并使一个或多个锚定体与分析物相互作用或通过使膜官能化来实现。一个或多个锚定体可以通过本文所述的任一方法偶联到膜。具体地,一个或多个锚定体可以包括一种或多种连接体,例如,马来酰亚胺官能化连接体。

在本实施方案中,分析物通常是rna、dna、pna、tna或lna,并且可以是双链或单链。本实施方案特别适用于基因组dna分析物。

一个或多个锚定体可以包括与单链或双链多核苷酸、分析物内的特异性核苷酸序列或分析物内的修饰核苷酸模式或存在于多核苷酸上的任一其它配体偶联、结合或相互作用的任一基团。

用于锚定体的合适的结合蛋白包括但不限于:大肠杆菌单链结合蛋白、p5单链结合蛋白、t4gp32单链结合蛋白、topovdsdna结合区域、人组蛋白、大肠杆菌hudna结合蛋白和其它古细菌、原核或真核单链或双链多核苷酸(或核酸)结合蛋白,包括下述所列举的。

特异性核苷酸序列可以是被转录因子、核糖体、内切核酸酶、拓扑异构酶或复制起始因子所识别的序列。修饰核苷酸模式可以是甲基化模式或损伤模式。

一个或多个锚定体可以包括偶联、结合、插入(intercalateswith)到多核苷酸分析物或与多核苷酸分析物相互作用的任一基团。所述基团可以通过静电、氢键或范德华相互作用插入到多核苷酸分析物或与多核苷酸分析物相互作用。这种基团包括赖氨酸单体、聚赖氨酸(其与ssdna或dsdna相互作用)、溴化乙锭(其插入dsdna)、通用碱基或通用核苷酸(其可以与任一多核苷酸分析物杂交)和锇复合物(其可以与甲基化碱基反应)。因此,可以采用与膜连接的一个或多个通用核苷酸将多核苷酸分析物偶联到膜。每个通用核苷酸可以采用一种或多种连接体偶联到膜。通用核苷酸优选包括以下核碱基之一:次黄嘌呤、4-硝基吲哚、5-硝基吲哚、6-硝基吲哚、甲酰基吲哚、3-硝基吡咯、硝基咪唑、4-硝基吡唑、4-硝基苯并咪唑、5-硝基吲唑、4-氨基苯并咪唑或苯基(c6-芳香环)。通用核苷酸更优选地包括以下核苷之一:2’-脱氧肌苷、肌苷、7-脱氮-2’-脱氧肌苷、7-脱氮肌苷、2-氮杂-脱氧肌苷、2-氮杂-肌苷、2-o’-甲基肌苷、4-硝基吲哚2’-脱氧核糖核苷、4-硝基吲哚核糖核苷、5-硝基吲哚2’-脱氧核糖核苷、5-硝基吲哚核糖核苷、6-硝基吲哚2’-脱氧核糖核苷、6-硝基吲哚核糖核苷、3-硝基吡咯2’-脱氧核糖核苷、3-硝基吡咯核糖核苷、次黄嘌呤的非环状糖类似物、硝基咪唑2’-脱氧核糖核苷、硝基咪唑核糖核苷、4-硝基吡唑2’-脱氧核糖核苷、4-硝基吡唑核糖核苷、4-硝基苯并咪唑2’-脱氧核糖核苷、4-硝基苯并咪唑核糖核苷、5-硝基吲唑2’-脱氧核糖核苷、5-硝基吲唑核糖核苷、4-氨基苯并咪唑2’-脱氧核糖核苷、4-氨基苯并咪唑核糖核苷、苯基c-核糖核苷、苯基c-2’-脱氧核糖核苷、2’-脱氧水粉蕈素、2’-脱氧异鸟嘌呤核苷、k-2’-脱氧核糖、p-2’-脱氧核糖和四氢吡咯。通用核苷酸更优选地包括2’-脱氧肌苷。通用核苷酸更优选为imp或dimp。通用核苷酸最优选为dpmp(2’-脱氧-p-核苷单磷酸)或dkmp(n6-甲氧基-2,6-二氨基嘌呤单磷酸)。

一个或多个锚定体可以通过hoogsteen氢键(其中,两个核碱基通过氢键保持在一起)或反向hoogsteen氢键(其中,一个核碱基相对于另一个核碱基旋转180°)偶联(或结合)到多核苷酸分析物。例如,一个或多个锚定体可以包括一个或多个核苷酸、一个或多个寡核苷酸或与多核苷酸分析物形成hoogsteen氢键或反向hoogsteen氢键的一个或多个多核苷酸。这些类型的氢键允许第三个多核苷酸链缠绕在双链螺旋上并形成三链体。一个或多个锚定体可以通过与双链体形成三链体来偶联(或结合)到双链多核苷酸分析物。

在本实施方案中,至少1%、至少10%、至少25%、至少50%或100%的膜组分可以被官能化。

当一个或多个锚定体包括蛋白质时,其可以无需进行进一步官能化直接锚定到膜中,例如,如果其已经具有与膜相容的外部疏水区域。这种蛋白的示例包括但不限于跨膜蛋白、膜内蛋白和膜蛋白。替换地,所述蛋白可以被表达具有与膜相容的基因融合的疏水区域。这种疏水蛋白区域是本领域已知的。

在输送到膜之前,一个或多个锚定体优选与分析物混合,但是一个或多个锚定体可以与膜接触并随后与分析物接触。

另一方面,可以使用上述方法对分析物进行官能化,使得其可以被特异性结合基团识别。具体地,可以用诸如生物素(用于与链霉亲和素结合)、直链淀粉(用于与麦芽糖结合蛋白或融合蛋白结合)、ni-nta(用于与多组氨酸或多组氨酸标记的蛋白质结合)或肽(例如,抗原)等配体对分析物进行官能化。

根据优选实施例,当分析物与优先旋入孔的前导序列连接时,一个或多个锚定体可以用于将多核苷酸分析物偶联到膜。以下将对前导序列进行更详细的讨论。优选地,将多核苷酸分析物结合(例如,连接)到优先旋入孔的前导序列。这种前导序列可以包括均聚多核苷酸或无碱基区域。所述前导序列通常设计为直接或经由一个或多个中间多核苷酸(或夹板)与一个或多个锚定体杂交。在这种情况下,一个或多个锚定体通常包括与前导序列中的序列或一个或多个中间多核苷酸(或夹板)中的序列互补的多核苷酸序列。在这种情况下,一个或多个夹板通常包括与前导序列中的序列互补的多核苷酸序列。

当然,可以将上述用于将多核苷酸偶联到膜(例如,两亲层)的任一方法应用于其它分析物和膜组合。在一些实施方案中,将氨基酸、肽、多肽或蛋白质偶联到两亲层,例如,三嵌段共聚物层或脂质双层。可以使用各种用于化学连接这些分析物的方法。化学连接中使用的分子示例是edc(1-乙基-3-[3-二甲基氨基丙基]碳二亚胺盐酸盐)。也可以采用市售的试剂盒(thermopierce,partno.22980)向多核苷酸的5’末端添加反应性基团。合适的方法包括但不限于使用了组氨酸残基和ni-nta的暂时亲和性连接以及通过反应性半胱氨酸、赖氨酸或非天然氨基酸的更稳定的共价连接。

分析物表征

本发明进一步还关注于采用跨膜孔来确定存在分析物、不存在分析物或确定分析物的一个或多个特征。这通常包括(i)使分析物与跨膜孔相互作用并且(ii)在所述相互作用期间获取一个或多个测量值,其中,所述测量代表存在所述分析物、不存在所述分析物或其一个或多个特征。

可进行各种不同类型的测量。这包括但不限于:电测量和光测量。可行的电测量包括:电流测量,阻抗测量,测量隧道(ivanovap等人,nanolett.2011jan12;11(1):279-85),以及fet测量(国际申请wo2005/124888)。光测量可以与电测量结合使用(sonigv等人,revsciinstrum.2010jan;81(1):014301)。所述测量可以是跨膜电流测量例如流经所述孔的离子电流的测量。

电测量可如stoddartd等人,procnatlacadsci,12;106(19):7702-7,liebermankr等人,jamchemsoc.2010;132(50):17961-72,和国际申请wo-2000/28312所描述的使用标准单声道记录设备进行。或者,电测量可以使用多通道系统进行,例如如在国际申请wo-2009/077734和国际申请wo-201i/067559中所描述的。

所述方法优选在跨膜施加电势下进行实施。所施加的电势可以是电压电势。替换地,所施加的电势可以是化学电势。这种情况的示例为跨膜(例如,两亲层)采用盐梯度。盐梯度在holden等人发表在2007年7月11日的《美国化学会杂志》129(27):8650-5的文章中进行了公开。在一些情况下,采用随着多核苷酸相对所述孔移动时穿过所述孔的电流来估计或确定所述多核苷酸的序列。这就是链测序。

所述方法优选包括(i)使分析物与孔相互作用;以及(ii)测量在该相互作用期间通过所述孔的电流,并由此确定存在分析物、不存在分析物或所述分析物的一个或多个特征。

如果电流以对于分析物来说特异性的方式流过所述孔(即,如果检测到与分析物相关的特定电流流过孔),则存在分析物。如果电流不以对于分析物来说特异性的方式流过孔,则不存在分析物。类似地,可以使用在该相互作用期间流过孔的电流来确定分析物的特征。

因此,本发明涉及分析物的纳米孔感测。本发明可以用于根据对通过孔的电流的不同影响来区分结构类似的分析物。本发明还可以用于测量样本中特定分析物的浓度。

本发明还可以用于传感器中,所述传感器在批量感测应用中使用大量或数以千计的孔。

在分析物和孔之间相互作用期间,分析物以对该分析物来说特异的方式影响流过孔的电流。例如,特定分析物将在特定平均时间段内和特定程度上减少流过孔的电流。换言之,流过孔的电流对于特定分析物是特有的。可以进行对照实验以确定特定分析物对流过孔的电流的影响。然后可以将在测试样本上实施本发明方法所产生的结果与这种对照实验得到的结果进行比较,以便鉴定样本中的特定分析物,确定样本中是否存在特定分析物或确定每个分析物的特征。可以使用以代表特定分析物的方式影响流过孔的电流的频率来确定样本中该分析物的浓度。

解偶联

本发明的方法可涉及将分析物从膜解偶联。如果使用本发明的方法输送多个分析物,优选至少10%的分析物从膜解偶联。例如,至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的分析物可以从膜解偶联。优选地,所有分析物从膜解偶联。可以使用孔来确定从膜解偶联的分析物的量。

可以采用任一已知方法将分析物从膜解偶联。优选不采用孔将分析物与膜解偶联。优选不采用电压或施加的电势将分析物从膜解偶联。

所述方法优选还包括通过从膜移去一个或多个锚定体来使分析物从膜解偶联。所述方法更优选地包括使一个或多个锚定体与试剂接触,所述试剂对于一个或多个锚定体的亲和性比一个或多个锚定体对于膜的亲和性要高。竞争性结合或免疫放射测定法确定分子的特异性结合能力的各种方案是本领域公知的(例如,参见maddox等人,《实验医学杂志》(j.exp.med.)158,1211-1226,1993)。所述试剂从膜移去一个或多个锚定体,从而使分析物解偶联。所述试剂优选为糖。可以使用任何与一个或多个锚定体结合的亲和性高于一个或多个锚定体对于膜的亲和性的糖。所述糖可以是如下所述的环糊精或其衍生物。

所述一个或多个锚定体优选包括疏水锚定体,例如,胆固醇,所述试剂优选为环糊精或其衍生物或脂质。环糊精或其衍生物可以是eliseev,a.v.和schneider,h-j(1994)在《美国化学会杂志》116,6081-6088中公开的任一种。所述试剂更优选为7-6-氨基-β-环糊精(am7-βcd)、6-单脱氧-6-单氨基-β-环糊精(am1-βcd)或7-(6-脱氧-6-胍基)-环糊精(gu7-βcd)。可以使用本文中公开的任一脂质。

所述一个或多个锚定体优选包括链霉亲和素、生物素或脱硫生物素,所述试剂优选为生物素、脱硫生物素或链霉亲和素。生物素和脱硫生物素与链霉亲和素结合的亲和性均高于链霉亲和素与膜结合的亲和性,反之亦然。生物素比脱硫生物素对于链霉亲和素具有更强的亲和性。因此,可以使用生物素、或脱硫生物素将包括链霉亲和素的锚定体从膜中移去,反之亦然。

所述一个或多个锚定体优选包括蛋白质,并且所述试剂优选为与所述蛋白质特异性结合的抗体或其片段。如果抗体优先或以高亲和性与蛋白质结合,而不与其它或不同蛋白质结合或仅以低亲和性结合,则其与所述蛋白质特异性结合。如果抗体以1×10-6m或更少,更优选1×10-7m或更少、5×10-8m或更少,更优选1×10-8m或更少或者更优选5×10-9m或更少的kd结合,则其优先或以高亲和性结合。如果抗体以1×10-6m或更多的kd,更优选1×10-5m或更多,更优选1×10-4m或更多,更优选1×10-3m或更多,甚至更优选1×10-2m或更多的kd结合,则其以低亲和性结合。可使用任一方法来检测结合或特异性结合。抗体与蛋白质结合的定量测量方法是本领域已知的。抗体可以是单克隆抗体或多克隆抗体。抗体的合适片段包括但不限于fv、f(ab’)和f(ab’)2片段以及单链抗体。此外,抗体或其片段可以是嵌合抗体或其片段、cdr移植抗体或其片段或人源化抗体或其片段。

所述方法可以包括使一个或多个锚定体与降低其偶联到膜的能力的试剂接触。例如,可以干扰一个或多个锚定体的结构和/或疏水性,从而降低其与膜偶联的能力的试剂。一个或多个锚定体优选包括胆固醇,试剂优选为胆固醇脱氢酶。一个或多个锚定体优选包括脂质,试剂优选为磷脂酶。一个或多个锚定体优选包括蛋白,并且试剂优选为蛋白酶或尿素。合适的锚定体和试剂的其它组合对于本领域技术人员而言是清楚的。

所述方法可以包括通过使分析物从一个或多个锚定体分离来将分析物从膜解偶联。这可以以任一方式完成。例如,可以在包括连接体的一个或多个锚定体中切割连接体。本实施方案特别适用于涉及一个或多个通过杂交连接的锚定体。这种锚定体在上文中进行了讨论。

所述方法可以包括通过使分析物和一个或多个锚定体与试剂接触来将分析物从膜解偶联,其中,所述试剂与分析物竞争结合一个或多个锚定体。竞争性结合的确定和测量方法是本领域已知的。试剂优选为多核苷酸,其与分析物竞争杂交一个或多个锚定体。例如,如果所述分析物使用涉及杂交的一个或多个锚定体偶联到膜,则可以使用也杂交到该杂交位点的多核苷酸与所述一个或多个锚定体接触来使所述分析物解偶联。通常,以高于分析物和一个或多个锚定体浓度的浓度添加所述多核苷酸试剂。替换地,与分析物相比,该多核苷酸试剂可以更强地与一个或多个锚定体杂交。

所述方法可以包括(i)使分析物和一个或多个锚定体与尿素、三(2-羧乙基)膦(tcep)、二硫苏糖醇(dtt)、链霉亲和素或生物素、uv光、酶或结合剂接触;(ii)加热分析物和一个或多个锚定体;或(iii)改变ph值。尿素、三(2-羧乙基)膦(tcep)或二硫苏糖醇(dtt)能够破坏锚定体并将分析物从膜分离。如果锚定体包括链霉亲和素-生物素连接,则链霉亲和素试剂竞争结合生物素。如果锚定体包括链霉亲和素-脱硫生物素连接,则生物素试剂竞争结合链霉亲和素。uv光可用于分解光敏基团。酶和结合剂可用于切割、分解或解开锚定体。优选酶包括但不限于外切核酸酶、内切核酸酶或解旋酶。优选结合剂包括但不限于酶、抗体或其片段或单链结合蛋白(ssb)。可以使用任一下述酶或上述抗体。热量和ph可用于破坏杂交和其它连接。

如果通过将分析物从一个或多个锚定体分离来将分析物从膜解偶联,则一个或多个锚定体将保留在膜中。保留的一个或多个锚定体可用于与输送到膜的另一分析物偶联。例如,也可以采用与一个或多个保留在膜中的锚定体杂交的多核苷酸来输送第二分析物。替换地,可以采用独立于从第一分析物分离的锚定体的一个或多个锚定体(即,一个或多个其它锚定体)将第二分析物偶联到膜。该一个或多个单独锚定体可以是与用于将第一分析物偶联到膜的同一类型的锚定体,或者可以是不同类型的锚定体。

所述方法优选还包括通过从膜移去微粒来使分析物从膜解偶联。以下对从膜中移去微粒的方法进行了讨论。如果分析物与微粒连接的强度大于分析物与膜偶联的强度,则移去微粒会使分析物从膜解偶联。如下所述,可以对连接和偶联强度进行测量。采用微粒对分析物解偶联可有助于从系统中移去分析物的所有实例,使得可以采用另一个微粒来向跨膜孔输送第二分析物(其可以与第一分析物相同或不同)。

移去或洗涤

所述方法优选还包括从膜中移去微粒。如果使用多个微粒,则可以移去至少10%的微粒,例如,可以移去至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的微粒。所述方法更优选地还包括从膜中移去所有微粒。这可以以任一方式完成。可以采用磁场将微粒从膜中移去。替换地或另外地,可以采用基于流的方法将微粒从膜移去。例如,可以用缓冲液洗涤膜。以下对合适的缓冲液进行讨论。

所述该方法优选包括:

(a)提供连接到第一微粒的在第一样本中的第一分析物;

(b)将所述第一微粒输送向所述膜,并由此将所述第一分析物输送到所述跨膜孔;

(c)从所述膜移去所述第一微粒;

(d)提供连接到第二微粒的在第二样本中的第二分析物;

(e)将所述第二微粒输送向所述膜,并由此将所述第二分析物输送到所述跨膜孔。

所述第一分析物可以与第二分析物相同。如果两个分析物是多核苷酸,这将允许校对阅读。第一分析物可以不同于第二分析物,例如,类型(例如,蛋白和多核苷酸)和/或同一性(例如,两个不同的多核苷酸)不同。两个样本可以相同或不同。

在一个实施方案中,所述方法优选还包括(i)在步骤(b)和(c)之间,使所述第一分析物与所述跨膜孔相互作用并在相互作用期间获取一个或多个测量值,其中,所述测量值代表存在所述第一分析物、不存在所述第一分析物或所述第一分析物的一个或多个特征和/或(ii)在步骤(e)之后,使所述第二分析物与所述跨膜孔相互作用并在相互作用期间获取一个或多个测量值,其中,所述测量值代表存在所述第二分析物、不存在所述第二分析物或所述第二分析物的一个或多个特征。

在另一个实施方案中,所述第一分析物和第二分析物是多核苷酸,并且所述方法还包括:(i)在步骤(b)和(c)之间,使第一多核苷酸与所述跨膜孔相互作用,使得所述第一多核苷酸移动穿过所述孔并且当所述第一多核苷酸相对于所述孔移动获取一个或多个测量值,其中,所述测量值代表所述第一多核苷酸的一个或多个特征,并由此表征所述第一多核苷酸和/或(ii)在步骤(e)后,使第二多核苷酸与所述跨膜孔相互作用,使得所述第二多核苷酸移动穿过所述孔,并且当所述第二多核苷酸相对于孔移动获取一个或多个测量值,其中,所述测量值代表所述第二多核苷酸的一个或多个特征,并由此表征所述第二多核苷酸。

在所述移去方法中的步骤(c)优选包括移去微粒和第一分析物。

多核苷酸表征

本发明的方法优选涉及表征多核苷酸。使用本发明将多核苷酸输送到跨膜孔,并且使用所述孔来表征多核苷酸。

输送后,所述方法包括(i)使多核苷酸与跨膜孔相互作用,使得多核苷酸移动穿过所述孔,和(ii)随着所述多核苷酸相对于孔移动获取一个或多个测量值,其中,所述测量代表所述多核苷酸的一个或多个特征,并由此表征所述多核苷酸。

可以研究任一数目的多核苷酸。例如,本发明的方法可以涉及表征两个或更多个多核苷酸,例如,3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、10个或更多个、50个或更多个、100个或更多个、500个或更多个、1,000个或更多个、5,000个或更多个、10,000个或更多个、100,000个或更多个、1,000,000个或更多个、或者5,000,000个或更多个多核苷酸。可以使用相同微粒或不同微粒来输送两个或更多个多核苷酸。

如果表征两个或更多个多核苷酸,则其可以彼此不同。所述两个或更多个多核苷酸可以是相同多核苷酸的两个或更多个实例。这允许校对阅读。

多核苷酸可以是天然存在的或人造的。例如,所述方法可用于验证制备的两个或更多个寡核苷酸的序列。通常在体外实施这些方法。

所述方法可以涉及测量每个多核苷酸的两个、三个、四个或五个或更多个特征。所述一个或多个特征优选选自(i)多核苷酸的长度;(ii)多核苷酸的同一性;(iii)多核苷酸的序列;(iv)多核苷酸的二级结构,以及(v)多核苷酸是否是经修饰的。根据本发明,可以对(i)至(v)的任一组合进行测量,例如{i},{ii},{iii},{iv},{v},{i,ii},{i,iii},{i,iv},{i,v},{ii,iii},{ii,iv},{ii,v},{iii,iv},{iii,v},{iv,v},{i,ii,iii},{i,ii,iv},{i,ii,v},{i,iii,iv},{i,iii,v},{i,iv,v},{ii,iii,iv},{ii,iii,v},{ii,iv,v},{iii,iv,v},{i,ii,iii,iv},{i,ii,iii,v},{i,ii,iv,v},{i,iii,iv,v},{ii,iii,iv,v}或{i,ii,iii,iv,v}。

对于(i),例如,可以通过确定多核苷酸和孔之间的相互作用数量或多核苷酸和孔之间的相互作用持续时间来测量多核苷酸的长度。

对于(ii),可以以多种方式测量多核苷酸的同一性。可以结合测量多核苷酸的序列或不测量多核苷酸的序列来测量多核苷酸的同一性。前者很简单;对多核苷酸进行测序,从而进行识别。后者可以通过几种方式完成。例如,可以测量多核苷酸中特定基序的存在(不测量多核苷酸的剩余序列)。可选地,所述方法中对特定电和/或光信号进行测量可以将多核苷酸识别为来自特定来源。

对于(iii),可以如先前所述对多核苷酸的序列进行确定。stoddartd等人在《美国国家科学院院刊》12;106(19):7702-7中、liebermankr等人在《美国化学社会杂志》2010;132(50):17961-72中以及公开号为wo2000/28312的国际申请中描述了合适的测序方法,尤其是使用电学测量的那些测序方法。

对于(iv),可以以各种方式测量二级结构。例如,如果所述方法涉及电学测量,则可以采用驻留时间变化或流过孔的电流变化来测量二级结构。这使得能够区分出多核苷酸的单链和双链区域。

对于(v),可以测量存在或不存在任一修饰。所述方法优选包括确定是否用一个或多个蛋白质或采用一个或多个标记、标签或间隔区通过甲基化、氧化、损伤对多核苷酸进行修饰。特异的修饰将导致与孔的特异性相互作用,其可以使用下述方法进行测量。例如,可以根据甲基胞嘧啶与每个核苷酸相互作用期间流过孔的电流来将其与胞嘧啶区别开来。

可以采用适合于研究膜/孔系统的任一装置来实施所述方法,在所述系统中,孔存在于膜中。可以使用适用于跨膜孔感测的任一装置来实施所述方法。例如,所述装置包括包含水溶液的腔室和将腔室分成两个部分的分隔物。所述分隔物通常具有缺口,在其中形成有包含孔的膜。替换地,所述分隔物形成其中存在孔的膜。

可以采用申请号为pct/gb08/000562(wo2008/102120)的国际申请中所描述的装置来实施所述方法。

所述方法可以涉及随着多核苷酸相对于孔移动,测量通过孔的电流。因此,所述装置还可以包括能够跨膜和孔施加电势并测量电信号的电路。可以使用膜片钳或电压钳来实施所述方法。所述方法优选涉及使用电压钳。

本发明的方法可以涉及随着多核苷酸相对于孔移动,测量通过孔的电流。测量穿过跨膜蛋白孔的离子电流的合适条件是本领域已知的并且在实施例中进行了公开。通常在跨膜和孔施加电压的情况下实施所述方法。所使用的电压通常为+5v至-5v,例如,+4v至-4v、+3v至-3v或+2v至-2v。所使用的电压通常为-600mv至+600mv或-400mv至+400mv。所使用的电压优选在具有下限和上限的范围内,其中,所述下限选自-400mv,-300mv,-200mv,-150mv,-100mv,-50mv,-20mv和0mv,并且所述上限独立地选自+10mv,+20mv,+50mv,+100mv,+150mv,+200mv,+300mv和+400mv。所使用的电压范围更优选在100mv至240mv,最优选在120mv至220mv。通过使用增加的施加电势,可以提高孔对不同核苷酸之间的区别能力。

通常在存在任一电荷载体的情况下实施所述方法,例如,金属盐,比如碱金属盐、卤化物盐;例如,氯化物盐,比如碱金属氯化物盐。电荷载体可以包括离子液体或有机盐,例如,四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵或1-乙基-3-甲基咪唑鎓氯化物。在上述示例性装置中,盐存在于腔室中的水溶液中。通常使用氯化钾(kcl)、氯化钠(nacl)、氯化铯(cscl)或亚铁氰化钾和铁氰化钾的混合物。优选kci、nacl以及亚铁氰化钾和铁氰化钾的混合物。电荷载体在所述膜上可以是不对称的。例如,电荷载体的类型和/或浓度可以在所述膜的每一侧上不同。

盐浓度可以处于饱和状态。盐浓度可以是3m或更低,通常为0.1至2.5m、0.3至1.9m、0.5至1.8m、0.7至1.7m、0.9至1.6m或1m至1.4m。盐浓度优选为150mm至1m。优选使用至少0.3m,例如,至少0.4m、至少0.5m、至少0.6m、至少0.8m、至少1.0m、至少1.5m、至少2.0m、至少2.5m或至少3.0m的盐浓度来实施所述方法。高盐浓度提供高的信噪比,并使得代表存在有核苷酸的电流在正常电流波动背景下得到识别。

通常在存在缓冲液的情况下实施这些方法。在上述示例性装置中,缓冲液存在于腔室中的水溶液中。本发明的方法中可使用任一缓冲液。通常,缓冲液是磷酸盐缓冲液。其它合适的缓冲液为hepes和tris-hcl缓冲液。通常在ph值为4.0至12.0、4.5至10.0、5.0至9.0、5.5至8.8、6.0至8.7或7.0至8.8或7.5至8.5的情况下实施所述方法。所用的ph值优选为约7.5。

可以在温度为0℃至100℃、15℃至95℃、16℃至90℃、17℃至85℃、18℃至80℃、19℃至70℃或20℃至60℃的情况下实施所述方法。通常在室温下实施所述方法。可选地,在支持酶发挥功能的温度下实施所述方法,例如,约37℃。

输送后,所述方法优选包括a)使多核苷酸与孔和多核苷酸结合蛋白相互作用,使得多核苷酸移动穿过所述孔并且多核苷酸结合蛋白控制多核苷酸穿过所述孔的移动;和b)随着多核苷酸相对于孔移动,测量流过孔的电流,其中,所述电流代表多核苷酸的一个或多个特征,并由此表征多核苷酸。

多核苷酸结合蛋白可以是任一能够与多核苷酸结合并控制其移动穿过所述孔的蛋白。本领域中直接判断蛋白是否与多核苷酸结合。蛋白通常与多核苷酸相互作用并修饰多核苷酸的至少一种性质。蛋白可以通过裂解多核苷酸以形成单个核苷酸或更短的核苷酸链,例如,二核苷酸或三核苷酸来对其进行修饰。部分(moiety)可以通过定向多核苷酸或将其移动到特定位置来对其进行修饰,即,控制其的移动。

多核苷酸结合蛋白优选衍生自多核苷酸处理酶。多核苷酸处理酶是能够与多核苷酸相互作用并修饰多核苷酸的至少一种性质的多肽。所述酶可以通过裂解多核苷酸以形成单个核苷酸或更短的核苷酸链,例如,二核苷酸或三核苷酸来对其进行修饰。所述酶可以通过定向多核苷酸或将其移动到特定位置来对其进行修饰。只要多核苷酸处理酶能够结合多核苷酸并控制其移动穿过所述孔,其就不需要显示酶活性。例如,可以对所述酶进行修饰以移去其酶活性,或者可以在防止其发挥酶功能的条件下进行使用。以下对这种条件进行更详细的讨论。

多核苷酸处理酶优选衍生自核酸分解酶。在酶的构建体中使用的多核苷酸处理酶更优选地衍生自酶分类(ec)组3.1.11,3.1.13,3.1.14,3.1.15,3.1.16,3.1.21,3.1.22,3.1.25,3.1.26,3.1.27,3.1.30和3.1.31中的任一个。所述酶可以是申请号为pct/gb10/000133(公开为wo2010/086603)的国际申请中公开的那些酶中的任一个。

优选酶为聚合酶、外切核酸酶、解旋酶、移位酶和拓扑异构酶,例如,旋转酶。合适的酶包括但不限于来自大肠杆菌的外切核酸酶i(seqidno:11)、来自大肠杆菌的外切核酸酶iii酶(seqidno:13)、来自嗜热链球菌的recj(seqidno:15)和噬菌体λ外切核酸酶(seqidno:17)、tatd外切核酸酶及其变体。包括seqidno:15中所示序列的三个亚基或其变体相互作用形成三聚体外切核酸酶。聚合酶可以是3173dna聚合酶(其可从公司商购获得)、sd聚合酶(可从购得)或其变体。所述酶优选为phi29dna聚合酶(seqidno:9)或其变体。拓扑异构酶优选为酶分类(ec)组5.99.1.2和5.99.1.3中的任一个。

所述酶最优选衍生自解旋酶。解旋酶可以是或者衍生自hel308解旋酶、recd解旋酶,例如,trai解旋酶或trwc解旋酶、xpd解旋酶或dda解旋酶。解旋酶可以是或者衍生自hel308mbu(seqidno:18)、hel308csy(seqidno:19)、hel308tga(seqidno:20)、hel308mhu(seqidno:21)、traieco(seqidno:22)、xpdmbu(seqidno:23)或其变体。

解旋酶可以是以下国际申请中公开的任一解旋酶、修饰解旋酶或解旋酶构建体:申请号为pct/gb2012/052579(公开为wo2013/057495);pct/gb2012/053274(公开为wo2013/098562);pct/gb2012/053273(公开为wo2013/098561);pct/gb2013/051925(公开为wo2014/013260);pct/gb2013/051924(公开为wo2014/013259);pct/gb2013/051928(公开为wo2014/013262)和pct/gb2014/052736(公开为wo2015/055981)。

解旋酶优选地包括seqidno:25(trwccba)所示的序列或其变体、seqidno:18(hel308mbu)所示的序列或其变体或seqidno:24(dda)所示的序列或其变体。对于跨膜孔,变体可以以下述任一方式不同于天然序列。seqidno:24的优选变体包括(a)e94c和a360c或(b)e94c,a360c,c109a和c136a,然后,可选地(δm1)g1(即,缺失m1,然后添加g1)。其也可以被称为m1g。下述任一变体还可以包括m1g。

根据本发明,可以使用任一数量的解旋酶。例如,可以使用1,2,3,4,5,6,7,8,9,10或更多的解旋酶。在一些实施方式中,可以使用不同数量的解旋酶。

本发明的方法优选包括使多核苷酸与两个或更多个解旋酶接触。两个或更多个解旋酶通常是相同的解旋酶。两个或更多个解旋酶可以是不同的解旋酶。

两个或更多个解旋酶可以是上述解旋酶的任一组合。两个或更多个解旋酶可以是两个或更多个dda解旋酶。两个或更多个解旋酶可以是一个或多个dda解旋酶和一个或多个trwc解旋酶。两个或更多个解旋酶可以是相同解旋酶的不同变体。

两个或更多个解旋酶优选地彼此连接。两个或更多个解旋酶更优选地彼此共价连接。可以以任一顺序并使用任一方法来连接解旋酶。本发明中采用的优选解旋酶构建体在以下国际申请中进行描述:申请号为pct/gb2013/051925(公开为wo2014/013260);pct/gb2013/051924(公开为wo2014/013259);pct/gb2013/051928(公开为wo2014/013262)和pct/gb2014/052736。

seqidno:9,11,13,15,17,18,19,20,21,22,23,24或25的变体是具有氨基酸序列不同于seqidno:9,11,13,15,17,18,19,20,21,22,23,24或25的氨基酸序列,并且保留了多核苷酸结合能力的酶。可以使用本领域已知的任一方法来对此进行测量。例如,变体可以与多核苷酸接触,并且可以对其与多核苷酸结合及沿多核苷酸移动的能力进行测量。变体可以包括促进多核苷酸结合和/或促进其在高浓度盐和/或室温下活性的修饰。可以对变体进行修饰,使得其结合多核苷酸(即,保留多核苷酸结合能力),但不发挥解旋酶的功能(即,当提供有促进移动的所有必需组分时,例如,atp和mg2+,不沿多核苷酸移动)。这种修饰是本领域已知的。例如,在解旋酶中对mg2+结合域的修饰通常导致不能发挥解旋酶的功能的变体。这些类型的变体可以作为分子制动器(见下文)。

在seqidno:9,11,13,15,17,18,19,20,21,22,23,24或25的整个氨基酸序列长度上,变体基于氨基酸同一性优选与该序列至少50%同源。更优选地,基于氨基酸同一性,变体多肽可以与seqidno:9,11,13,15,17,18,19,20,21,22,23,24或25的氨基酸序列在整个序列上至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,更优选地,至少95%、97%或99%同源。在200或更多个,例如,230,250,270,280,300,400,500,600,700,800,900或1000或更多个连续氨基酸的片段上,可以具有至少80%,例如,至少85%、90%或95%的氨基酸同一性(“严格同源性”)。对同源性进行如上所述的确定。参照上述seqidno:2和4,变体可以以上述任一方式不同于野生型序列。所述酶可以与孔共价连接。可以采用任一方法将酶与孔共价连接。

优选的分子制动器为trwccba-q594a(具有突变q594a的seqidno:25)。这种变体不作为解旋酶发挥作用(即,当提供有促进移动的所有必需组分时,例如,atp和mg2+,结合多核苷酸,但不沿其移动)。

在链测序中,所述多核苷酸是顺着或逆着施加的电势穿过所述孔易位的。逐步或前进式作用在双链多核苷酸上的核苷酸外切酶可以在孔的顺侧使用,以将余下的单链在施加的电势下供应穿过所述孔或在相反电势作用下在反侧使用。同样地,解开双链dna的解旋酶也可以以类似的方式使用。聚合酶也可被使用。也有测序应用的可能性,该测序应用需要链逆着施加的电势移位,但该dna必须在反向电势或没有电势的条件下先被酶“捕获”。在具有电势的情况下,结合后,电势翻转,链将从顺侧穿过孔到反侧,并在电流作用下保持伸展的构象。单链dna核酸外切酶或单链dna依赖性聚合酶可以作为分子马达以受控逐步的方式将最近易位的单链从反式到顺式逆着所施加的电势拉过孔。

所述方法中可以使用任一解旋酶。解旋酶相对于孔可以以两种模式工作。首先,优选地以以下方式使用解旋酶来实施所述方法,使得所述解旋酶顺着由施加的电压产生的场将多核苷酸移动穿过孔。在该模式下,在孔中先捕获多核苷酸的5’末端,并且解旋酶将多核苷酸移动到孔中,使得其顺着所述场穿过孔,直到最终易位穿到所述膜的反侧。替换地,优选地以以下方式实施所述方法,使得所述解旋酶逆着由施加的电压产生的场将多核苷酸移动穿过孔。在该模式中,在孔中先捕获多核苷酸的3’末端,并且解旋酶移动多核苷酸通过所述孔,使得所述多核苷酸逆着施加的场从孔中被拉出,直到其最终被返回膜的顺侧。

也可以以相反方向实施所述方法。可以在孔中先捕获多核苷酸的3’末端,并且解旋酶可以将多核苷酸移动到孔中,使得所述多核苷酸顺着所述场穿过孔,直到其最终易位穿到所述膜的反侧。

当未提供给解旋酶促进移动的必要组分或对解旋酶进行修饰以阻碍或阻止其移动时,其可以结合多核苷酸并且作为制动器减慢多核苷酸的移动,在所述多核苷酸被所施加的场拉进所述孔中时。在非主动模式中,无论多核苷酸的3’或5’被捕获,都是所施加的场朝着所述反侧将多核苷酸拉进到孔中,并且将酶用作制动器。当处于非主动模式时,解旋酶控制的多核苷酸的移动可以以多种方式进行描述,包括棘轮(ratcheting)、滑动和制动。也可以以这种方式使用缺乏解旋酶活性的解旋酶变体。

可以以任一顺序使多核苷酸与多核苷酸结合蛋白和孔接触。优选地,当多核苷酸与多核苷酸结合蛋白(比如:解旋酶)和孔接触时,多核苷酸首先与该蛋白形成复合物。当跨孔施加电压时,多核苷酸/蛋白复合物此时与孔形成复合物并控制多核苷酸穿过所述孔的移动。

可以在存在游离核苷酸或游离核苷酸类似物和促进多核苷酸结合蛋白起作用的酶辅助因子的情况下实施所述使用多核苷酸结合蛋白方法中的任何步骤。游离核苷酸可以是一个或多个上述任意单个核苷酸。游离核苷酸包括但不限于腺苷单磷酸(amp)、腺苷二磷酸(adp)、腺苷三磷酸(atp)、鸟苷单磷酸(gmp)、鸟苷二磷酸(gdp)、鸟苷三磷酸(gtp)、胸苷单磷酸(tmp)、胸苷二磷酸(tdp)、胸苷三磷酸(ttp)、尿苷单磷酸(ump)、尿苷二磷酸(udp)、尿苷三磷酸(utp)、胞苷单磷酸(cmp)、胞苷二磷酸(cdp)、胞苷三磷酸(ctp)、环腺苷单磷酸(camp)、环鸟苷单磷酸(cgmp)、脱氧腺苷单磷酸(damp)、脱氧腺苷二磷酸(dadp)、脱氧腺苷三磷酸(datp)、脱氧鸟苷单磷酸(dgmp)、脱氧鸟苷二磷酸(dgdp)、脱氧鸟苷三磷酸(dgtp)、脱氧胸苷单磷酸(dtmp)、脱氧胸苷二磷酸(dtdp)、脱氧胸苷三磷酸(dttp)、脱氧尿苷单磷酸(dump)、脱氧尿苷二磷酸(dudp)、脱氧尿苷三磷酸(dutp)、脱氧胞苷单磷酸(dcmp)、脱氧胞苷二磷酸(dcdp)和脱氧胞苷三磷酸(dctp)。游离核苷酸优选选自amp、tmp、gmp、cmp、ump、damp、dtmp、dgmp或dcmp。游离核苷酸优选为腺苷三磷酸(atp)。酶辅助因子是使构建体发挥功能的因子。酶辅助因子优选为二价金属阳离子。二价金属阳离子优选为mg2+、mn2+、ca2+或co2+。酶辅助因子最优选是mg2+

解旋酶和分子制动器

在优选实施方案中,所述方法包括:

(a)提供连接到微粒的多核苷酸分析物,其中,所述多核苷酸分析物具有连接到其的一个或多个解旋酶和一个或多个分子制动器;

(b)将微粒输送向膜,并由此将多核苷酸输送到跨膜孔;

(c)跨所述孔施加电势,使得所述一个或多个解旋酶和所述一个或多个分子制动器聚集在一起,并且二者均控制所述多核苷酸穿过所述孔的移动;以及

(d)随着所述多核苷酸相对于孔移动,获取一个或多个测量值,其中,所述测量值代表所述多核苷酸的一个或多个特征,并由此表征所述多核苷酸。

这类方法在申请号为pct/gb2014/052737的国际申请中进行详细讨论。

一个或多个解旋酶可以是上述任一种。一个或多个分子制动器可以是结合到多核苷酸的任一化合物或分子并减慢多核苷酸穿过所述孔的移动。一个或多个分子制动器优选包括一个或多个结合到多核苷酸的化合物。一个或多个化合物优选为一个或多个大环化合物。合适的大环化合物包括但不限于环糊精、杯芳烃、环肽、冠醚、瓜环、柱芳烃、其衍生物或其组合。环糊精或其衍生物可以是eliseev,a.v.和schneider,h-j.在(1994)《美国化学会杂志》(j.am.chem.soc)116,6081-6088中公开的任一种。所述试剂更优选为7-6-氨基-β-环糊精(am7-βcd)、6-单脱氧-6-单氨基-β-环糊精(am1-βcd)或7-(6-脱氧-6-胍基)-环糊精(gu7-βcd)。

多核苷酸分析物中的间隔区

一个或多个解旋酶可以停滞在申请号为pct/gb2014/050175的国际申请中所述的一个或多个间隔区。本发明中可以使用该国际申请中公开的一个或多个解旋酶和一个或多个间隔区的任一结构。

双链多核苷酸

如果多核苷酸分析物是双链的,则所述方法优选还包括提供这样的多核苷酸,所述多核苷酸在一端设置发夹适配器,并将多核苷酸的两条链分离以形成单链多核苷酸构建体。然后可以使单链多核苷酸构建体与本发明的孔相互作用。以这种方式连接和调查双链构建体上的两条链提高了表征的效率和准确性。

可以使用本领域已知的方法来设计合适的发夹适配器。发夹环可以是任一长度。发夹环通常为110个或更少的核苷酸长度,例如,100个或更少的核苷酸、90个或更少的核苷酸、80个或更少的核苷酸、70个或更少的核苷酸、60个或更少的核苷酸、50个或更少的核苷酸、40个或更少的核苷酸、30个或更少的核苷酸、20个或更少的核苷酸或者10个或更少的核苷酸长度。发夹环优选为约1至110、2至100、5至80或者6至50个核苷酸长度。如果该环涉及适配器的差异选择性,则优选长度较长的发夹环,例如,50至110个核苷酸。类似地,如果该环不涉及如下所述的选择性结合,则优选长度较短的发夹环,例如,1至5个核苷酸。

发夹适配器可以设置在多核苷酸的任一端,即,5’或3’末端。可以使用本领域已知的任一方法将发夹适配器连接到多核苷酸。可以使用连接酶,例如,t4dna连接酶、大肠杆菌dna连接酶、taqdna连接酶、tmadna连接酶和9°ndna连接发夹适配器连接酶。

可以使用本领域已知的任一方法将多核苷酸的两条链分离开来。例如,其可以被多核苷酸结合蛋白或者采用有利于脱杂交的条件(有利于脱杂交的条件的示例包括但不限于高温、高ph以及添加可以破坏氢键或碱基对的试剂,如甲酰胺和尿素)分离开来。

发夹适配器优选包括选择性结合部分。这使得多核苷酸能够被纯化或分离。选择性结合部分为可以基于其结合性质所选择的部分。因此,选择性结合部分优选为与表面特异性结合的部分。如果选择性结合部分与表面结合的程度比本发明中使用的任一其它部分更大,则其与表面特异性结合。在优选实施方案中,所述部分与本发明中使用的其它部分不结合的表面结合。

合适的选择性结合部分是本领域已知的。优选的选择性结合部分包括但不限于生物素、多核苷酸序列、抗体、抗体片段(例如,fab和scsv)、抗原、多核苷酸结合蛋白、多组氨酸尾和gst标签。最优选的选择性结合部分是生物素和选择性多核苷酸序列。生物素与用抗生物素蛋白包被的表面特异性结合。选择性多核苷酸序列与用同源序列包被的表面特异性结合(即,杂交)。替换地,选择性多核苷酸序列与用多核苷酸结合蛋白包被的表面特异性结合。

发夹适配器和/或选择性结合部分可以包括能够切割、切开(nicked)、裂解或水解的区域。这种区域可以设计用于使多核苷酸在纯化或分离后从其结合的表面被移去。合适的区域是本领域已知的。合适的区域包括但不限于rna区域、包含脱硫生物素和链霉亲和素的区域、二硫键和光可分裂区域。

前导序列

多核苷酸分析物可以设置有优先旋入孔的前导序列。前导序列有利于本发明所述方法。前导序列被设计为优先旋入跨膜孔,从而有助于多核苷酸分析物穿过所述孔的移动。前导序列也可以用于将多核苷酸连接到如上所述的一个或多个锚定体。

前导序列通常包括聚合物。聚合物优选是带负电荷的。聚合物优选为诸如dna或rna等的多核苷酸、修饰多核苷酸(例如,无碱基dna)、pna、lna、聚乙二醇(peg)或多肽。前导序列优选包括多核苷酸,更优选地包括单链多核苷酸。前导序列可以包括上述任一多核苷酸。单链前导序列最优选包括单链dna,例如,聚dt区段。前导序列优选地包括一个或多个间隔区。

前导序列可以是任一长度,但是长度通常为10至150个核苷酸长度,例如,20至150个核苷酸长度。前导序列的长度通常取决于所述方法中使用的跨膜孔。

双偶联

本发明的方法可以涉及双链多核苷酸的双偶联。所述方法优选包括:

(a)提供连接到微粒的双链多核苷酸,其中,所述多核苷酸的一端具有y适配器,另一端具有发夹环适配器,其中,所述y适配器包括一个或多个用于将多核苷酸偶联到膜的第一锚定体,所述发夹环适配器包括一个或多个用于将多核苷酸偶联到膜的第二锚定体,其中,发夹环适配器偶联到膜的强度大于y适配器偶联到膜的强度;

(b)将微粒输送向膜,并由此将多核苷酸输送到跨膜孔;

(c)使多核苷酸与孔相互作用,使得多核苷酸的至少一条链移动穿过所述孔;

(d)随着多核苷酸的至少一条链相对于所述孔移动,获取一个或多个测量值,其中,所述测量值代表所述多核苷酸的至少一条链的一个或多个特征,并由此表征所述多核苷酸。在优选的实施方案中,多核苷酸的两条链移动穿过所述孔。

这类方法在申请号为pct/gb2015/050991的国际申请中进行详细讨论。

双链多核苷酸的一端设置有y适配器,另一端设置有发夹环适配器。所述y适配器和/或发夹适配器通常是多核苷酸适配器。其可以由上述任一多核苷酸形成。

y适配器通常包括(a)双链区域和(b)单链区域或在另一端不互补的区域。如果y适配器包括单链区域,则可以将其描述为具有突出。在y适配器中存在非互补区域使得适配器具有y形状,因为与双链部分不同,这两条链通常不彼此杂交。y适配器包括一个或多个第一锚定体。以上对锚定体进行了更详细的讨论。

y适配器优选地包括优先旋入孔的前导序列。以上对前导序列进行了讨论。

发夹适配器优选包含如上所述的选择性结合部分。发夹适配器和/或选择性结合部分可以包含能够切割、切开、裂开或水解的区域。

可以使用本领域已知的任一方法将y适配器和/或发夹适配器连接到多核苷酸。可以使用诸如t4dna连接酶、大肠杆菌dna连接酶、taqdna连接酶、tmadna连接酶和9°ndna连接酶等连接酶来连接一个或两个所述适配器。替换地,可以采用下述的本发明方法来向多核苷酸添加适配器。

在优选的实施方案中,所述方法包括对双链多核苷酸进行修饰,使得其一端包含y-适配器,另一端包含发夹环适配器。可以采用任一修饰方式。所述方法优选包括对本发明所述的双链多核苷酸进行修饰。这将在以下进行更详细的讨论。可以以任一方式组合所述修饰和表征方法。

发夹适配器偶联(或结合)到膜的强度大于y适配器偶联(或结合)到膜的强度。可以以任一方式对此进行测量。申请号1406147.7和140781.8的英国申请的实施例中公开了测量偶联(或结合)强度的合适方法。

发夹环适配器的偶联(或结合)强度优选是锚定体适配器的偶联(或结合)强度的至少1.5倍,或者是锚定体适配器的偶联(或结合)强度的例如,至少两倍、至少三倍、至少四倍、至少五倍,至少十倍。发夹环适配器对于膜的亲和常数(kd)优选是y适配器的亲和常数的至少1.5倍,例如,是y适配器的偶联强度的至少两倍、至少三倍、至少四倍、至少五倍,或者至少十倍。

发夹环适配器比y适配器以更强方式偶联(或结合)到膜存在多种形式。例如,发夹环适配器可以包括比y适配器更多的锚定体。例如,发夹环适配器可以包括2,3或更多个第二锚定体,而y适配器可以包括一个第一锚定体。

一个或多个第二锚定体偶联(或结合)到膜的强度可以大于一个或多个第一锚定体偶联(或结合)到膜的强度。一个或多个第二锚定体偶联(或结合)到发夹环适配器的强度可以大于一个或多个第一锚定体偶联(或结合)到y适配器的强度。一个或多个第一锚定体和一个或多个第二锚定体可以通过杂交与其各自的适配器连接,并且一个或多个第二锚定体中的杂交强度比一个或多个第一锚定体要大。本发明中也可以采用这些实施方式的任一组合。可以使用本领域的已知技术来测量偶联(或结合)强度。

一个或多个第二锚定体优选地包括偶联(或结合)到膜的一个或多个基团,其强度大于第一锚定体中的一个或多个基团偶联(或结合)到膜的强度。在优选实施方案中,采用胆固醇将发夹环适配器/一个或多个第二锚定体偶联(或结合)到膜,采用棕榈酸酯将y适配器/一个或多个第一锚定体偶联(或结合)到膜。胆固醇比棕榈酸酯更强地与三嵌段共聚物膜和脂质膜结合。在替换的实施方案中,采用诸如棕榈酸酯等单酰基物质将发夹环适配器/一个或多个第二锚定体偶联(或结合)到膜,采用诸如二棕榈酰卵磷脂等二酰基物质将y适配器/一个或多个第一锚定体偶联(或结合)到膜。

添加发夹环和前导序列

通过使多核苷酸与mua转座酶和双链mua底物组接触,双链多核苷酸可以设置有y和发夹适配器,其中,所述底物组的一部分为包括前导序列的y适配器,并且所述底物组的一部分为发夹环适配器。转座酶将双链多核苷酸分析物片段化,并将mua底物与片段的一端或两端连接。这制备出多个修饰双链多核苷酸,其一端包括前导序列,另一端包括发夹环。然后,可以使用本发明的方法对修饰双链多核苷酸进行研究。

这些基于mua的方法在申请号为pct/gb2014/052505的国际申请中进行了公开。这些方法也在申请号为pct/gb2015/050991的国际申请中进行了详细讨论。

修饰的多核苷酸分析物

在本发明所述的输送和表征之前,可以通过在聚合酶形成修饰的多核苷酸分析物的条件下,将多核苷酸分析物用作模板使多核苷酸分析物与聚合酶和游离核苷酸组接触,来对多核苷酸分析物进行修饰,其中,在形成修饰的多核苷酸分析物时,所述聚合酶用不同核苷酸种类取代多核苷酸分析物中的一个或多个核苷酸种类。然后,可以将修饰的多核苷酸分析物添加到微粒并输送向膜。这种类型的修饰在申请号为pct/gb2015/050483的国际申请中进行了描述。可以采用上述任一聚合酶。聚合酶优选为克列诺酶(klenow)或9°north。

其它表征方法

在另一个实施方案中,在输送到跨膜孔之后,通过检测随着聚合酶将核苷酸掺入多核苷酸释放的标记物质来表征多核苷酸分析物。聚合酶采用多核苷酸分析物作为模板。每个标记的物质对于每个核苷酸是特异性的。多核苷酸分析物被输送到跨膜孔,然后与聚合酶和标记的核苷酸接触,使得当通过聚合酶向多核苷酸添加核苷酸时,磷酸盐标记的物质依次释放,其中磷酸盐物质含有对于每个核苷酸特定的标记。聚合酶可以是上述任一种。采用孔对磷酸盐标记的物质进行检测,并由此表征多核苷酸分析物。这种类型的方法在申请号为13187149.3(公布为ep2682460)的欧洲申请中进行了公开。上述任一实施方式同样适用于该方法。

试剂盒

本发明还提供一种用于将分析物输送到膜中的跨膜孔的试剂盒,其包含(a)微粒和(b)一个或多个能够将分析物偶联到膜的锚定体。微粒和一个或多个锚定体可以是结合本发明方法所讨论的上述任一种。如果所述试剂盒用于将多核苷酸输送到孔,则微粒优选是用于提取和/或纯化多核苷酸的试剂盒的一部分。

所述试剂盒优选还包含能够优先旋入跨膜孔的发夹环和/或前导序列。试剂盒可以包括y适配器。试剂盒优选还包含多核苷酸结合蛋白。上文对优选的发夹环、前导序列、y适配器和多核苷酸结合蛋白进行了讨论。

结合本发明方法所讨论的上述任一实施方案同样适用于试剂盒。试剂盒还可以包含膜的组分,例如,两亲层或三嵌段共聚物膜的组分。试剂盒还可以包含跨膜蛋白孔。

本发明所述试剂盒可以另外包括一个或多个能够使上述任一实施例得以实施的其它试剂或仪器。试剂盒可以包括磁体或电磁体。这种试剂或仪器包括以下一种或多种:合适的缓冲液(水溶液)、从受体获得样本的装置(例如,血管或包括针头的仪器)、用于扩增和/或表达多核苷酸的装置、上文限定的膜或电压或膜片钳装置。试剂可以以干燥状态存在于试剂盒中,使得流体样本重新悬浮该试剂。试剂盒还可以,可选地,包括能够使试剂盒用于本发明所述方法的说明书或有关所述方法可以用于哪种生物体的细节。

以下实施例对本发明进行说明。

实施例

实施例1

该实施例描述了将结合到dna上的解旋酶与组氨酸标签隔离和下拉式的(lifetechnologies)连接的样本制备程序,然后将珠粒添加到纳米孔系统中,以检测解旋酶控制的dna移动。图1示出了如何将dna与珠粒连接的卡通示意图。dna还与连接有锚定体的dna链杂交(一个具有锚定体的dna与y适配器杂交,第二个具有锚定体的dna与发夹适配器杂交(参见图1)),这有助于将dna输送到膜中的纳米孔。采用珠粒将dna输送到纳米孔的实验与添加相同浓度的dna到纳米孔系统的对照实验相比,观察到浓度有所增加。

材料和方法

1.1对组氨酸标签隔离和下拉式进行洗涤处理

将包含组氨酸标签隔离和下拉式的储备样本进行涡旋,以使彻底重悬在整个溶液中。将珠粒溶液样本(10μl)从储备溶液中移去,并添加到eppendorfproteinlow-bind管(1.5ml)中。将所述管放置在磁性架上,一旦所有的珠粒都粘附在磁体上,就移去上清液。将缓冲液(500μl的500mmkcl;ph值为8.0;25mm磷酸钾缓冲液)添加到磁珠样本中,通过涡旋使珠粒重新悬浮。然后将所述管放置在磁性架上,一旦珠粒粘附到磁体上,就移去上清液。将缓冲液洗涤和上清液移去步骤再重复两次,使得采用缓冲液(500mmkcl;ph值为8.0;25mm磷酸钾缓冲液)总共洗涤珠粒三次。然后使珠粒重新悬浮在(10μl的500mmkcl、ph值为8.0和25mm磷酸钾缓冲液)中,这被称为经洗涤的珠粒储备溶液。在使用前,涡旋珠粒储备溶液,以使彻底重新悬浮在整个溶液中。

1.2将dna(预先结合解旋酶)与连接

向洗涤过的(见下表5)添加dna文库(其包含片段化的双链λdna,然后与y适配器(其具有与前导序列连接的解旋酶)和发夹适配器(其具有与发夹连接的不同的组氨酸标记解旋酶)连接,最后与已连接有锚定体的dna的两条链杂交(见图1)),样本在室温下孵育至少1小时。该样本称为dna/珠粒样本2。

表5

1.3电生理学

在设置实验之前,将dna/珠粒样本2(0.52μl)添加到缓冲液(145.5μl的25mm磷酸钾缓冲液;ph值为8.0;500mmkcl)和燃料混合物(4μl的mgcl2(75mm)和atp(75mm))。

在缓冲液(25mm磷酸钾缓冲液、150mm亚铁氰化钾(ii)和150mm铁氰化钾(iii);ph值为8.0)中,从插入嵌段共聚物的单个mspa纳米孔中获得电学测量值。在实现单个孔插入嵌段共聚物中之后,然后将缓冲液(2ml的25mm磷酸钾缓冲液、150mm亚铁(ii)氰化钾、150mm铁(iii)氰化钾;ph值为8.0)流过系统以移去任何过量的mspa纳米孔。

在添加样本之前,将过量的缓冲液(500mm的kcl、25mm磷酸钾;ph值为8.0)流过纳米孔系统。然后将dna/珠粒样本2和燃料预混合物(总共155μl)流入单个纳米孔实验系统。在-120mv下进行实验,并且监测解旋酶控制的dna移动。

还进行了类似的对照实验,其中将相同浓度的dna文库(其未与结合)添加到纳米孔系统中,如上所述监测经解旋酶控制的dna移动。

结果

观察对照反应(其中,dna不与珠粒结合)和dna/珠粒样本2的解旋酶控制的dna移动。图2示出了七种不同的纳米孔实验(1-3是没有珠粒的对照反应,4-7是dna/珠粒样本2)。对照实验采用了具有两个锚定体的dna,而珠粒实验采用了珠粒和两个锚定体,以帮助将dna输送到纳米孔。将在图2中所观察到的通量值进行标准化,相比于测试的运行(运行4)观察到的最大通量。在所有三个实验中,观察到不与珠粒结合的dna文库的标准化通量值约为15。而dna/珠粒样本2导致标准化通量值为大约90。因此,当dna文库与预孵育时,观察到标准化通量大幅增加。这意味着有助于将dna直接输送到纳米孔系统,并且与对照相比浓度增加。

实施例2

本实施例描述了如何拍摄纳米孔芯片阵列的图像,其显示了如何观察到将dna直接输送到具有mspa纳米孔的膜。随时间拍摄到系统图像显示,观察到珠粒集中在其中插入有纳米孔的膜表面上。

材料和方法

2.1制备连接有dna的

如实施例1.1所述洗涤并如实施例1.2所述将dna与珠粒连接。

2.2芯片成像

采用20x物镜的显微镜捕获纳米孔芯片系统的一系列明视场(brightfield)图像。

结果

图3和图4示出了拍摄到的纳米孔芯片系统的两个明视场图像。图3示出了一添加dna/珠粒样本之后的芯片。在芯片槽上可以看到少量的小黑珠粒,用于插入纳米孔的膜位于该芯片槽中(一些珠粒在图中用黑色箭头突出显示)。图4示出了在添加dna/珠粒样本20分钟之后的纳米孔芯片系统的同一区域。在芯片槽上观察到大簇珠粒,用于插入纳米孔的膜位于该芯片槽(图中通过簇周围的虚线白色圆圈突出显示这些珠粒簇中的一些)。图8a示出了珠粒如何集中在膜上的卡通示意图。因此,从拍摄的芯片图像中可以看出,珠粒位于每个膜的中心,将附近的dna样本输送给纳米孔。

实施例3

本实施例描述了如何测试不同类型的珠粒以了解其如何影响在纳米孔芯片阵列实验中形成的膜的稳定性。测试的珠粒没有一个导致膜显著损伤,因此,这些珠粒可用于增强dna向纳米孔系统的输送。

材料和方法

2.1制备具有各种表面涂层的

对具有以下官能团的(1-硅烷、2-链霉亲和素、与短的生物素化dna链结合的3-链霉亲和素、隔离和下拉式4-钴基组氨酸标签)进行测试以确定其对膜的影响。提供在不同的存储溶液中。将储备瓶涡旋10秒,然后将储存溶液中的珠粒样本(30μl)添加到eppendorf中。通过将eppendorf放置在磁体旁边,然后移去上清液,来将珠粒与储存溶液分离。然后将缓冲液(500μl的25mm磷酸钾缓冲液;ph值为8.0;500mmkcl)添加到管中,并将样本涡旋10秒。然后将缓冲液和珠粒分离开来,丢弃洗涤缓冲液。然后将珠粒重悬在缓冲液(30μl的25mm磷酸钾缓冲液;ph值为8.0;500mmkcl)中,然后对珠粒进行稀释(将4μl储备珠粒添加到150μl的缓冲液(25mm磷酸钾缓冲液;ph值为8.0;500mmkcl),其还含有短链的随机序列dna)。

2.2确定膜稳定性的电学测试

在缓冲液(25mm磷酸钾缓冲液、150mm亚铁(ii)氰化钾和150mm铁(iii)氰化钾;ph值为8.0)中,在具有多个凹槽的阵列芯片上获得电学测量值,在所述凹槽上嵌段共聚物形成膜,并且单个mspa纳米孔插入膜中。在嵌段共聚物中实现单个孔之后,将缓冲液(3ml的25mm磷酸钾缓冲液、150mm亚铁(ii)氰化钾、150mm铁(iii)氰化钾;ph值为8.0))流过系统以移去任何过量的mspa纳米孔。在添加珠粒溶液之前,将缓冲液(3ml的25mm磷酸钾缓冲液;ph值为8.0;500mmkcl)流过系统,然后施加180mv的电势,并监测系统(添加珠粒之前)。然后将缓冲液中不同的样本(与短链的随机序列dna混合)流入单个纳米孔实验芯片系统,并施加180mv的电势。添加短链的随机dna序列,以便将单个mspa纳米孔鉴定为随着其移动通过纳米孔产生特征电流信号的链。

结果

在添加珠粒之前和之后,对饱和且不能使用的各个通道的数量进行统计。图5中的点x显示了在针对不同的官能团(1*=硅烷、2*=链霉亲和素和3*=与短的生物素化dna链结合的链霉亲和素)添加之前的饱和通道数量。图5中的点y显示了在添加不同的(1=硅烷、2=链霉亲和素和3=与短的生物素化dna链结合的链霉亲和素)之后的饱和通道数量。对于链霉亲和素官能化珠粒以及与短的生物素化dna链结合的链霉亲和素官能化珠粒,观察到饱和通道数量相对较小地增加。然而,当用硅烷覆盖珠粒时,观察到饱和通道数量稍微大的增加。

图6示出了向纳米孔系统中添加珠粒(1-硅烷,2-链霉亲和素,与短的生物素化dna链结合的3-链霉亲和素;隔离和下拉式4-钴基组氨酸标签)时,不再活动的单通道mspa纳米孔的百分比和饱和通道的百分比。所有不同包被的珠粒导致小于20%的mspa纳米孔丢失(不再是活性纳米孔)且小于10%的通道饱和,除了硅烷之外,其导致小于50%的mspa纳米孔丢失和约30%的通道饱和。由于添加珠粒后饱和通道的百分比低于不再活动mspa纳米孔的百分比,因此mspa纳米孔的减少不可能仅仅是由于膜破裂引起的。

图7示出了开孔电流不受添加链霉亲和素包被的珠粒的影响。线0对应于不存在珠粒,线2对应于存在链霉亲和素包被的珠粒,这两者均在施加电势为180mv的情况下导致约350pa的开孔电流。

根据图5-7所示的数据,可以采用所测试的任一磁珠官能团(1-硅烷,2-链霉亲和素,与短的生物素化dna链结合的3-链霉亲和素,隔离和下拉式4-钴基组氨酸标签)来将dna输送到纳米孔。

实施例4

本实施例描述了如何使用磁性微粒来将多个不同的样本输送给跨膜蛋白孔。使用磁性微粒将样本a输送给跨膜蛋白孔(mspa)。然后使用纳米孔系统检测该样本。然后使用磁体将样本a从膜表面中移去。样本a连接到微粒的强度大于样本a偶联到膜的强度,因此微粒的移去使样本a从膜解偶联。一旦移去了样本a,就使用磁性微粒将样本b输送给纳米孔。该样本也使用纳米孔系统进行检测,随后用磁体移去。通过使用该方法在纳米孔系统中测试多个样本。

材料和方法

4.1珠粒制备和样本连接

以类似于上述实施例1步骤1.1的方法对磁珠进行洗涤。以类似于实施例1步骤1.2的方法将样本a和b连接到磁性微粒。

4.2电生理学

如实施例1步骤1.3所述,将连接有样本a或b的微粒在缓冲液和燃料混合物中进行稀释。如实施例1步骤1.3所述,制备单个mspa纳米孔。

将样本a添加到纳米孔系统中,并且监测解旋酶控制的dna移动。在收集到样本a足够的数据后,将磁体置于纳米孔系统上10分钟。这使得磁性微粒朝向磁体吸引并远离膜中的跨膜蛋白孔。从系统中移去样本a后,然后将连接有样本b的磁性微粒流过纳米孔系统,并监测解旋酶控制的dna移动。在收集到样本b足够的数据后,将磁体置于纳米孔系统上10分钟。这使得连接有样本b的磁性微粒朝向磁体吸引并远离膜中的跨膜蛋白孔。这使得样本b从可用于检测其他样本的纳米孔系统中移去。

结果

本实施例表明,使用磁性微粒能够输送大量不同的样本、检测大量不同的样本并随后从纳米孔系统中移去大量不同的样本。这是因为样本a和b与微粒连接的强度大于样本a和b与膜偶联的强度,因此,微粒的移去使样本a和b从膜解偶联,并将其从纳米孔系统中移去。图9示出了上述4.2中描述的步骤的卡通示意图。

实施例5

本实施例描述了用以将dna分子与myonetm链霉亲和素c1(thermofisherscientific产品编no:65001)连接,然后将珠粒添加到纳米孔系统中,以检测解旋酶控制的dna移动的样本制备程序。将dna与“锚定的”寡核苷酸杂交:将一个寡核苷酸与y适配器杂交,并帮助将dna输送到膜中的纳米孔上;与发夹适配器杂交的第二寡核苷酸含有促进dna分子与磁珠结合的生物素部分(参见图10)。

材料和方法

对myonec1进行洗涤处理

对含有myonec1的储备样本进行涡旋,以使彻底重悬在整个溶液中。从储备溶液中移去珠粒溶液样本(1μl),并添加到eppendorfdnalobind管(1.5ml)中。将所述管放置在磁性架上,一旦所有的珠粒均粘附在磁体上,就移去上清液。将结合缓冲液(作为thermofisher试剂盒的一部分提供,目录号60101)(40μl)添加到磁珠样本(kilobasebindertm试剂盒)中,通过涡旋使珠粒重悬。然后将所述管放置在磁性架上,一旦珠子粘附到磁体上,就移去上清液。将缓冲液洗涤和上清液移去步骤再重复两次,使得珠粒用缓冲液洗涤总共三次,这被称为洗涤过的珠粒储备溶液。在使用前,将珠粒储备溶液进行涡旋,以使彻底重悬在整个溶液中。

将dna(预先结合解旋酶)与连接

向洗涤过的添加dna文库(其包含片段化的双链λdna,其然后与y适配器(其具有与前导序列连接的解旋酶)和发夹适配器连接,然后再与两个锚定寡核苷酸杂交(如图10所示))(见下表6),将样本在室温下孵育15分钟(伴有混合)。15分钟后,将样本置于磁性架上以沉淀珠粒。移去上清液,并用80μl洗涤缓冲液(2mnacl,10mmtris.hcl(ph值为7.5),1mmedta)(kilobasebindertm试剂盒)洗涤珠粒。移去所述洗涤缓冲液,重复洗涤步骤。最后,将洗涤过的且沉淀的珠粒重新悬浮于12μl的500mmkcl,ph值为8.0,25mm磷酸钾缓冲液中。该样本为dna/珠粒样本3。

表6

电生理学

在设置实验之前,将dna/珠粒样本3(3μl)添加到缓冲液(143μl的25mm磷酸钾缓冲液;ph值为8.0;500mmkcl)和燃料混合物(4μl的mgcl2(75mm)和atp(75mm))中。

在缓冲液(25mm磷酸钾缓冲液、150mm亚铁(ii)氰化钾和150mm铁(iii)氰化钾;ph值为8.0)中,从插入嵌段共聚物的单个mspa纳米孔中获得电学测量值。在实现单个孔插入嵌段共聚物中之后,然后将缓冲液(2ml的25mm磷酸钾缓冲液、150mm亚铁(ii)氰化钾、150mm铁(iii)氰化钾;ph值为8.0)流过系统以移去任何过量的mspa纳米孔。

在添加样本之前,将过量的缓冲液(500mm的kcl、25mm磷酸钾;ph值为8.0)流过纳米孔系统。然后将dna/珠粒样本3和燃料预混合物(总共155μl)流入单个纳米孔实验系统。在-120mv下进行实验,并且监测解旋酶控制的dna移动。

结果

对于dna/珠粒样本3,观察解旋酶控制的dna移动。与myonetm链霉亲和素c1(thermofisherscientific产品号:65001)预孵育的dna文库呈现出的浓度增强相似与实施例1中采用组氨酸标记珠粒观察到的。这意味着有助于将dna直接输送给纳米孔系统。

实施例6

本实施例示出了如何通过使用缓冲液冲洗物理性从流动细胞移去珠粒,来将连接到珠粒的样本从纳米孔芯片阵列中移去。

材料和方法

对来自两个独立的生物体的dna样本进行单独制备,并与实施例1(见1.1和1.2)所述的组氨酸标签隔离和下拉式磁珠连接。将从第一生物体制备的样本(样本a)添加到如实施例1.3所述的纳米孔系统中,并且监测来自第一生物体的dna的解旋酶控制的dna移动1小时。然后使用3×1ml体积的缓冲液冲洗纳米孔阵列体系,以便将珠粒冲洗出系统。然后将从第二生物体制备的样本(样本b)添加到如实施例1.3所述的纳米孔系统中,并且监测来自第二生物体的dna的解旋酶控制的dna移动1小时。将解旋酶控制的dna移动映射到由两个基因组组成的对照上(参见图11)。图11(a)示出了当系统中仅存在样本a时实验的深度覆盖,图11(b)示出了缓冲液冲洗通过系统且样本b添加之后实验第二小时的深度覆盖。所述映射表明,简单的缓冲液冲洗将大部分样本a从纳米孔系统中移去。可以在系统上进行进一步冲洗,以便增加从系统中移去的附着有样本a的珠粒数量。图12示出了在添加样本a后(图12a)和3×1ml缓冲液冲洗后纳米孔系统的同一区域的放大图像。图12a示出了在其中膜形成的纳米孔系统区域上集中了珠粒,图12b示出了在缓冲液冲洗之后珠粒已经从系统中移去。

实施例7

本实施例示出了如何在不需要pcr的情况下对工作流程进行改进以最大限度地提高低输入样本(<100ng起始材料)的通量。

材料和方法:

图13a示出了新的低输入方案的示意图。在该方案中,将文库加载到纳米孔系统上进行分析,同时链仍然与珠粒结合。

相反,图13b示出了基于pcr的低输入方案的示意图。基于pcr的方案的最后步骤是延长的:用户需要使用链霉亲和素珠粒对制备的测序文库进行清洁,并且需要在加载到纳米孔系统上进行分析之前将文库与珠粒洗脱开来。

结果:

在新的低输入方案中,采用重力来将珠粒吸附到膜表面,增加膜上dna分子的局部浓度。这将系统的灵敏度提高了一个数量级,允许我们将输入需求从1μg降低到0.025μg(25ng)。省略pcr步骤意味着消除了放大偏差,节省了几个小时的实验室时间。无pcr方案与更长的片段兼容,从而提供更长的读取。另外还保留了表观遗传修饰。当使用在剪切成约8kb的基因组dna上时,新的低输入方案的2d读取长度分布类似于输入dna的片段长度分布。这表明珠粒加载并不引入任一明显的片段长度偏差。

实施例8

本实施例示出了在测序之前序列捕获如何使得感兴趣的基因座富集,从而更有效地使用测序运行。

材料和方法:

通过将文库片段与针对感兴趣区域特定探针杂交,以在文库制备期间进行序列捕获(参见图14)。设计了自定义的探针组,其对于λ噬菌体基因组而言是特定的,其由平铺在1-碱基间隔上的120nt寡核苷酸组成,并由agilent合成。将λ基因组dna与大肠杆菌dna混合,其中,基因以等摩尔比混合。使用fragmentase将基因组dna分裂成约2kb。按照agilent的标准sureselect方案进行序列捕获,其中,将pcr延伸时间调整以说明更长的片段。然后使用纳米孔系统分析所得到的文库。

结果:

λdna构成约1%的起始dna,但在捕获后,我们获得目标70%的读数。

当不需要分析整个基因组或基因组对于测序仪的通量而言太大时,序列捕获是有用的。总的感兴趣的区域可以更长,相比由pcr富集所实现的或者可能需要太多的pcr。序列捕获在测序和数据分析上节省了资金和时间。

序列表

<110>牛津纳米孔技术公司

<120>向跨膜孔输送分析物的方法

<130>n404138wo

<150>gb1418469.1

<151>2014-10-17

<160>25

<170>patentinversion3.5

<210>1

<211>558

<212>dna

<213>人工序列

<220>

<223>耻垢分枝杆菌孔蛋白a突变体

(d90n/d91n/d93n/d118r/d134r/e193k)

<400>1

atgggtctggataatgaactgagcctggtggacggtcaagatcgtaccctgacggtgcaa60

caatgggatacctttctgaatggcgtttttccgctggatcgtaatcgcctgacccgtgaa120

tggtttcattccggtcgcgcaaaatatatcgtcgcaggcccgggtgctgacgaattcgaa180

ggcacgctggaactgggttatcagattggctttccgtggtcactgggcgttggtatcaac240

ttctcgtacaccacgccgaatattctgatcaacaatggtaacattaccgcaccgccgttt300

ggcctgaacagcgtgattacgccgaacctgtttccgggtgttagcatctctgcccgtctg360

ggcaatggtccgggcattcaagaagtggcaacctttagtgtgcgcgtttccggcgctaaa420

ggcggtgtcgcggtgtctaacgcccacggtaccgttacgggcgcggccggcggtgtcctg480

ctgcgtccgttcgcgcgcctgattgcctctaccggcgacagcgttacgacctatggcgaa540

ccgtggaatatgaactaa558

<210>2

<211>184

<212>prt

<213>人工序列

<220>

<223>耻垢分枝杆菌孔蛋白a突变体

(d90n/d91n/d93n/d118r/d134r/e139k)

<400>2

glyleuaspasngluleuserleuvalaspglyglnaspargthrleu

151015

thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp

202530

argasnargleuthrargglutrpphehisserglyargalalystyr

354045

ilevalalaglyproglyalaaspgluphegluglythrleugluleu

505560

glytyrglnileglypheprotrpserleuglyvalglyileasnphe

65707580

sertyrthrthrproasnileleuileasnasnglyasnilethrala

859095

propropheglyleuasnservalilethrproasnleupheprogly

100105110

valserileseralaargleuglyasnglyproglyileglngluval

115120125

alathrpheservalargvalserglyalalysglyglyvalalaval

130135140

serasnalahisglythrvalthrglyalaalaglyglyvalleuleu

145150155160

argprophealaargleuilealaserthrglyaspservalthrthr

165170175

tyrglygluprotrpasnmetasn

180

<210>3

<211>885

<212>dna

<213>人工序列

<220>

<223>α-溶血素突变体(e111n/k147n)

<400>3

atggcagattctgatattaatattaaaaccggtactacagatattggaagcaatactaca60

gtaaaaacaggtgatttagtcacttatgataaagaaaatggcatgcacaaaaaagtattt120

tatagttttatcgatgataaaaatcacaataaaaaactgctagttattagaacaaaaggt180

accattgctggtcaatatagagtttatagcgaagaaggtgctaacaaaagtggtttagcc240

tggccttcagcctttaaggtacagttgcaactacctgataatgaagtagctcaaatatct300

gattactatccaagaaattcgattgatacaaaaaactatatgagtactttaacttatgga360

ttcaacggtaatgttactggtgatgatacaggaaaaattggcggccttattggtgcaaat420

gtttcgattggtcatacactgaactatgttcaacctgatttcaaaacaattttagagagc480

ccaactgataaaaaagtaggctggaaagtgatatttaacaatatggtgaatcaaaattgg540

ggaccatacgatcgagattcttggaacccggtatatggcaatcaacttttcatgaaaact600

agaaatggttctatgaaagcagcagataacttccttgatcctaacaaagcaagttctcta660

ttatcttcagggttttcaccagacttcgctacagttattactatggatagaaaagcatcc720

aaacaacaaacaaatatagatgtaatatacgaacgagttcgtgatgattaccaattgcat780

tggacttcaacaaattggaaaggtaccaatactaaagataaatggacagatcgttcttca840

gaaagatataaaatcgattgggaaaaagaagaaatgacaaattaa885

<210>4

<211>293

<212>prt

<213>人工序列

<220>

<223>α-溶血素突变体(e111n/k147n)

<400>4

alaaspseraspileasnilelysthrglythrthraspileglyser

151015

asnthrthrvallysthrglyaspleuvalthrtyrasplysgluasn

202530

glymethislyslysvalphetyrserpheileaspasplysasnhis

354045

asnlyslysleuleuvalileargthrlysglythrilealaglygln

505560

tyrargvaltyrserglugluglyalaasnlysserglyleualatrp

65707580

proseralaphelysvalglnleuglnleuproaspasngluvalala

859095

glnileserasptyrtyrproargasnserileaspthrlysasntyr

100105110

metserthrleuthrtyrglypheasnglyasnvalthrglyaspasp

115120125

thrglylysileglyglyleuileglyalaasnvalserileglyhis

130135140

thrleuasntyrvalglnproaspphelysthrileleugluserpro

145150155160

thrasplyslysvalglytrplysvalilepheasnasnmetvalasn

165170175

glnasntrpglyprotyraspargaspsertrpasnprovaltyrgly

180185190

asnglnleuphemetlysthrargasnglysermetlysalaalaasp

195200205

asnpheleuaspproasnlysalaserserleuleuserserglyphe

210215220

serproaspphealathrvalilethrmetasparglysalaserlys

225230235240

glnglnthrasnileaspvaliletyrgluargvalargaspasptyr

245250255

glnleuhistrpthrserthrasntrplysglythrasnthrlysasp

260265270

lystrpthraspargsersergluargtyrlysileasptrpglulys

275280285

gluglumetthrasn

290

<210>5

<211>184

<212>prt

<213>耻垢分枝杆菌

<400>5

glyleuaspasngluleuserleuvalaspglyglnaspargthrleu

151015

thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp

202530

argasnargleuthrargglutrpphehisserglyargalalystyr

354045

ilevalalaglyproglyalaaspgluphegluglythrleugluleu

505560

glytyrglnileglypheprotrpserleuglyvalglyileasnphe

65707580

sertyrthrthrproasnileleuileaspaspglyaspilethrala

859095

propropheglyleuasnservalilethrproasnleupheprogly

100105110

valserileseralaaspleuglyasnglyproglyileglngluval

115120125

alathrpheservalaspvalserglyproalaglyglyvalalaval

130135140

serasnalahisglythrvalthrglyalaalaglyglyvalleuleu

145150155160

argprophealaargleuilealaserthrglyaspservalthrthr

165170175

tyrglygluprotrpasnmetasn

180

<210>6

<211>184

<212>prt

<213>耻垢分枝杆菌

<400>6

glyleuaspasngluleuserleuvalaspglyglnaspargthrleu

151015

thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp

202530

argasnargleuthrargglutrpphehisserglyargalalystyr

354045

ilevalalaglyproglyalaaspgluphegluglythrleugluleu

505560

glytyrglnileglypheprotrpserleuglyvalglyileasnphe

65707580

sertyrthrthrproasnileleuileaspaspglyaspilethrgly

859095

propropheglyleugluservalilethrproasnleupheprogly

100105110

valserileseralaaspleuglyasnglyproglyileglngluval

115120125

alathrpheservalaspvalserglyproalaglyglyvalalaval

130135140

serasnalahisglythrvalthrglyalaalaglyglyvalleuleu

145150155160

argprophealaargleuilealaserthrglyaspservalthrthr

165170175

tyrglygluprotrpasnmetasn

180

<210>7

<211>183

<212>prt

<213>耻垢分枝杆菌

<400>7

valaspasnglnleuservalvalaspglyglnglyargthrleuthr

151015

valglnglnalagluthrpheleuasnglyvalpheproleuasparg

202530

asnargleuthrargglutrpphehisserglyargalathrtyrhis

354045

valalaglyproglyalaaspgluphegluglythrleugluleugly

505560

tyrglnvalglypheprotrpserleuglyvalglyileasnpheser

65707580

tyrthrthrproasnileleuileaspglyglyaspilethrglnpro

859095

propheglyleuaspthrileilethrproasnleupheproglyval

100105110

serileseralaaspleuglyasnglyproglyileglngluvalala

115120125

thrpheservalaspvallysglyalalysglyalavalalavalser

130135140

asnalahisglythrvalthrglyalaalaglyglyvalleuleuarg

145150155160

prophealaargleuilealaserthrglyaspservalthrthrtyr

165170175

glygluprotrpasnmetasn

180

<210>8

<211>1830

<212>dna

<213>枯草杆菌噬菌体phi29

<400>8

atgaaacacatgccgcgtaaaatgtatagctgcgcgtttgaaaccacgaccaaagtggaa60

gattgtcgcgtttgggcctatggctacatgaacatcgaagatcattctgaatacaaaatc120

ggtaacagtctggatgaatttatggcatgggtgctgaaagttcaggcggatctgtacttc180

cacaacctgaaatttgatggcgcattcattatcaactggctggaacgtaatggctttaaa240

tggagcgcggatggtctgccgaacacgtataataccattatctctcgtatgggccagtgg300

tatatgattgatatctgcctgggctacaaaggtaaacgcaaaattcataccgtgatctat360

gatagcctgaaaaaactgccgtttccggtgaagaaaattgcgaaagatttcaaactgacg420

gttctgaaaggcgatattgattatcacaaagaacgtccggttggttacaaaatcaccccg480

gaagaatacgcatacatcaaaaacgatatccagatcatcgcagaagcgctgctgattcag540

tttaaacagggcctggatcgcatgaccgcgggcagtgatagcctgaaaggtttcaaagat600

atcatcacgaccaaaaaattcaaaaaagtgttcccgacgctgagcctgggtctggataaa660

gaagttcgttatgcctaccgcggcggttttacctggctgaacgatcgtttcaaagaaaaa720

gaaattggcgagggtatggtgtttgatgttaatagtctgtatccggcacagatgtacagc780

cgcctgctgccgtatggcgaaccgatcgtgttcgagggtaaatatgtttgggatgaagat840

tacccgctgcatattcagcacatccgttgtgaatttgaactgaaagaaggctatattccg900

accattcagatcaaacgtagtcgcttctataagggtaacgaatacctgaaaagctctggc960

ggtgaaatcgcggatctgtggctgagtaacgtggatctggaactgatgaaagaacactac1020

gatctgtacaacgttgaatacatcagcggcctgaaatttaaagccacgaccggtctgttc1080

aaagatttcatcgataaatggacctacatcaaaacgacctctgaaggcgcgattaaacag1140

ctggccaaactgatgctgaacagcctgtatggcaaattcgcctctaatccggatgtgacc1200

ggtaaagttccgtacctgaaagaaaatggcgcactgggttttcgcctgggcgaagaagaa1260

acgaaagatccggtgtataccccgatgggtgttttcattacggcctgggcacgttacacg1320

accatcaccgcggcccaggcatgctatgatcgcattatctactgtgataccgattctatt1380

catctgacgggcaccgaaatcccggatgtgattaaagatatcgttgatccgaaaaaactg1440

ggttattgggcccacgaaagtacgtttaaacgtgcaaaatacctgcgccagaaaacctac1500

atccaggatatctacatgaaagaagtggatggcaaactggttgaaggttctccggatgat1560

tacaccgatatcaaattcagtgtgaaatgcgccggcatgacggataaaatcaaaaaagaa1620

gtgaccttcgaaaacttcaaagttggtttcagccgcaaaatgaaaccgaaaccggtgcag1680

gttccgggcggtgtggttctggtggatgatacgtttaccattaaatctggcggtagtgcg1740

tggagccatccgcagttcgaaaaaggcggtggctctggtggcggttctggcggtagtgcc1800

tggagccacccgcagtttgaaaaataataa1830

<210>9

<211>608

<212>prt

<213>枯草杆菌噬菌体phi29

<400>9

metlyshismetproarglysmettyrsercysalaphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyalapheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealalysaspphelysleuthrvalleulysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalargtyr

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglulys

225230235240

gluileglygluglymetvalpheaspvalasnserleutyrproala

245250255

glnmettyrserargleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysargserargphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspleutrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrthrsergluglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glygluglugluthrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatrpalaargtyrthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrgluileproaspvalilelysaspilevalaspprolyslysleu

465470475480

glytyrtrpalahisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysgluvalaspglylys

500505510

leuvalgluglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelyslysgluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysprovalgln

545550555560

valproglyglyvalvalleuvalaspaspthrphethrilelysser

565570575

glyglyseralatrpserhisproglnpheglulysglyglyglyser

580585590

glyglyglyserglyglyseralatrpserhisproglnpheglulys

595600605

<210>10

<211>1390

<212>dna

<213>大肠杆菌

<400>10

atgatgaacgatggcaaacagcagagcaccttcctgtttcatgattatgaaaccttcggt60

acccatccggccctggatcgtccggcgcagtttgcggccattcgcaccgatagcgaattc120

aatgtgattggcgaaccggaagtgttttattgcaaaccggccgatgattatctgccgcag180

ccgggtgcggtgctgattaccggtattaccccgcaggaagcgcgcgcgaaaggtgaaaac240

gaagcggcgtttgccgcgcgcattcatagcctgtttaccgtgccgaaaacctgcattctg300

ggctataacaatgtgcgcttcgatgatgaagttacccgtaatatcttttatcgtaacttt360

tatgatccgtatgcgtggagctggcagcatgataacagccgttgggatctgctggatgtg420

atgcgcgcgtgctatgcgctgcgcccggaaggcattaattggccggaaaacgatgatggc480

ctgccgagctttcgtctggaacatctgaccaaagccaacggcattgaacatagcaatgcc540

catgatgcgatggccgatgtttatgcgaccattgcgatggcgaaactggttaaaacccgt600

cagccgcgcctgtttgattatctgtttacccaccgtaacaaacacaaactgatggcgctg660

attgatgttccgcagatgaaaccgctggtgcatgtgagcggcatgtttggcgcctggcgc720

ggcaacaccagctgggtggccccgctggcctggcacccggaaaatcgtaacgccgtgatt780

atggttgatctggccggtgatattagcccgctgctggaactggatagcgataccctgcgt840

gaacgcctgtataccgccaaaaccgatctgggcgataatgccgccgtgccggtgaaactg900

gttcacattaacaaatgcccggtgctggcccaggcgaacaccctgcgcccggaagatgcg960

gatcgtctgggtattaatcgccagcattgtctggataatctgaaaatcctgcgtgaaaac1020

ccgcaggtgcgtgaaaaagtggtggcgatcttcgcggaagcggaaccgttcaccccgagc1080

gataacgtggatgcgcagctgtataacggcttctttagcgatgccgatcgcgcggcgatg1140

aaaatcgttctggaaaccgaaccgcgcaatctgccggcgctggatattacctttgttgat1200

aaacgtattgaaaaactgctgtttaattatcgtgcgcgcaattttccgggtaccctggat1260

tatgccgaacagcagcgttggctggaacatcgtcgtcaggttttcaccccggaatttctg1320

cagggttatgcggatgaactgcagatgctggttcagcagtatgccgatgataaagaaaaa1380

gtggcgctgc1390

<210>11

<211>485

<212>prt

<213>大肠杆菌

<400>11

metmetasnaspglylysglnglnserthrpheleuphehisasptyr

151015

gluthrpheglythrhisproalaleuaspargproalaglnpheala

202530

alaileargthraspserglupheasnvalileglygluprogluval

354045

phetyrcyslysproalaaspasptyrleuproglnproglyalaval

505560

leuilethrglyilethrproglnglualaargalalysglygluasn

65707580

glualaalaphealaalaargilehisserleuphethrvalprolys

859095

thrcysileleuglytyrasnasnvalargpheaspaspgluvalthr

100105110

argasnilephetyrargasnphetyraspprotyralatrpsertrp

115120125

glnhisaspasnserargtrpaspleuleuaspvalmetargalacys

130135140

tyralaleuargprogluglyileasntrpprogluasnaspaspgly

145150155160

leuproserpheargleugluhisleuthrlysalaasnglyileglu

165170175

hisserasnalahisaspalametalaaspvaltyralathrileala

180185190

metalalysleuvallysthrargglnproargleupheasptyrleu

195200205

phethrhisargasnlyshislysleumetalaleuileaspvalpro

210215220

glnmetlysproleuvalhisvalserglymetpheglyalatrparg

225230235240

glyasnthrsertrpvalalaproleualatrphisprogluasnarg

245250255

asnalavalilemetvalaspleualaglyaspileserproleuleu

260265270

gluleuaspseraspthrleuarggluargleutyrthralalysthr

275280285

aspleuglyaspasnalaalavalprovallysleuvalhisileasn

290295300

lyscysprovalleualaglnalaasnthrleuargprogluaspala

305310315320

aspargleuglyileasnargglnhiscysleuaspasnleulysile

325330335

leuarggluasnproglnvalargglulysvalvalalailepheala

340345350

glualagluprophethrproseraspasnvalaspalaglnleutyr

355360365

asnglyphepheseraspalaaspargalaalametlysilevalleu

370375380

gluthrgluproargasnleuproalaleuaspilethrphevalasp

385390395400

lysargileglulysleuleupheasntyrargalaargasnphepro

405410415

glythrleuasptyralagluglnglnargtrpleugluhisargarg

420425430

glnvalphethrproglupheleuglnglytyralaaspgluleugln

435440445

metleuvalglnglntyralaaspasplysglulysvalalaleuleu

450455460

lysalaleutrpglntyralaglugluilevalserglyserglyhis

465470475480

hishishishishis

485

<210>12

<211>804

<212>dna

<213>大肠杆菌

<400>12

atgaaatttgtctcttttaatatcaacggcctgcgcgccagacctcaccagcttgaagcc60

atcgtcgaaaagcaccaaccggatgtgattggcctgcaggagacaaaagttcatgacgat120

atgtttccgctcgaagaggtggcgaagctcggctacaacgtgttttatcacgggcagaaa180

ggccattatggcgtggcgctgctgaccaaagagacgccgattgccgtgcgtcgcggcttt240

cccggtgacgacgaagaggcgcagcggcggattattatggcggaaatcccctcactgctg300

ggtaatgtcaccgtgatcaacggttacttcccgcagggtgaaagccgcgaccatccgata360

aaattcccggcaaaagcgcagttttatcagaatctgcaaaactacctggaaaccgaactc420

aaacgtgataatccggtactgattatgggcgatatgaatatcagccctacagatctggat480

atcggcattggcgaagaaaaccgtaagcgctggctgcgtaccggtaaatgctctttcctg540

ccggaagagcgcgaatggatggacaggctgatgagctgggggttggtcgataccttccgc600

catgcgaatccgcaaacagcagatcgtttctcatggtttgattaccgctcaaaaggtttt660

gacgataaccgtggtctgcgcatcgacctgctgctcgccagccaaccgctggcagaatgt720

tgcgtagaaaccggcatcgactatgaaatccgcagcatggaaaaaccgtccgatcacgcc780

cccgtctgggcgaccttccgccgc804

<210>13

<211>268

<212>prt

<213>大肠杆菌

<400>13

metlysphevalserpheasnileasnglyleuargalaargprohis

151015

glnleuglualailevalglulyshisglnproaspvalileglyleu

202530

glngluthrlysvalhisaspaspmetpheproleuglugluvalala

354045

lysleuglytyrasnvalphetyrhisglyglnlysglyhistyrgly

505560

valalaleuleuthrlysgluthrproilealavalargargglyphe

65707580

proglyaspaspgluglualaglnargargileilemetalagluile

859095

proserleuleuglyasnvalthrvalileasnglytyrpheprogln

100105110

glygluserargasphisproilelyspheproalalysalaglnphe

115120125

tyrglnasnleuglnasntyrleugluthrgluleulysargaspasn

130135140

provalleuilemetglyaspmetasnileserprothraspleuasp

145150155160

ileglyileglyglugluasnarglysargtrpleuargthrglylys

165170175

cysserpheleuproglugluargglutrpmetaspargleumetser

180185190

trpglyleuvalaspthrphearghisalaasnproglnthralaasp

195200205

argphesertrppheasptyrargserlysglypheaspaspasnarg

210215220

glyleuargileaspleuleuleualaserglnproleualaglucys

225230235240

cysvalgluthrglyileasptyrgluileargsermetglulyspro

245250255

serasphisalaprovaltrpalathrpheargarg

260265

<210>14

<211>1275

<212>dna

<213>嗜热链球菌

<400>14

atgtttcgtcgtaaagaagatctggatccgccgctggcactgctgccgctgaaaggcctg60

cgcgaagccgccgcactgctggaagaagcgctgcgtcaaggtaaacgcattcgtgttcac120

ggcgactatgatgcggatggcctgaccggcaccgcgatcctggttcgtggtctggccgcc180

ctgggtgcggatgttcatccgtttatcccgcaccgcctggaagaaggctatggtgtcctg240

atggaacgcgtcccggaacatctggaagcctcggacctgtttctgaccgttgactgcggc300

attaccaaccatgcggaactgcgcgaactgctggaaaatggcgtggaagtcattgttacc360

gatcatcatacgccgggcaaaacgccgccgccgggtctggtcgtgcatccggcgctgacg420

ccggatctgaaagaaaaaccgaccggcgcaggcgtggcgtttctgctgctgtgggcactg480

catgaacgcctgggcctgccgccgccgctggaatacgcggacctggcagccgttggcacc540

attgccgacgttgccccgctgtggggttggaatcgtgcactggtgaaagaaggtctggca600

cgcatcccggcttcatcttgggtgggcctgcgtctgctggctgaagccgtgggctatacc660

ggcaaagcggtcgaagtcgctttccgcatcgcgccgcgcatcaatgcggcttcccgcctg720

ggcgaagcggaaaaagccctgcgcctgctgctgacggatgatgcggcagaagctcaggcg780

ctggtcggcgaactgcaccgtctgaacgcccgtcgtcagaccctggaagaagcgatgctg840

cgcaaactgctgccgcaggccgacccggaagcgaaagccatcgttctgctggacccggaa900

ggccatccgggtgttatgggtattgtggcctctcgcatcctggaagcgaccctgcgcccg960

gtctttctggtggcccagggcaaaggcaccgtgcgttcgctggctccgatttccgccgtc1020

gaagcactgcgcagcgcggaagatctgctgctgcgttatggtggtcataaagaagcggcg1080

ggtttcgcaatggatgaagcgctgtttccggcgttcaaagcacgcgttgaagcgtatgcc1140

gcacgtttcccggatccggttcgtgaagtggcactgctggatctgctgccggaaccgggc1200

ctgctgccgcaggtgttccgtgaactggcactgctggaaccgtatggtgaaggtaacccg1260

gaaccgctgttcctg1275

<210>15

<211>425

<212>prt

<213>嗜热链球菌

<400>15

metpheargarglysgluaspleuaspproproleualaleuleupro

151015

leulysglyleuargglualaalaalaleuleugluglualaleuarg

202530

glnglylysargileargvalhisglyasptyraspalaaspglyleu

354045

thrglythralaileleuvalargglyleualaalaleuglyalaasp

505560

valhispropheileprohisargleuglugluglytyrglyvalleu

65707580

metgluargvalprogluhisleuglualaseraspleupheleuthr

859095

valaspcysglyilethrasnhisalagluleuarggluleuleuglu

100105110

asnglyvalgluvalilevalthrasphishisthrproglylysthr

115120125

proproproglyleuvalvalhisproalaleuthrproaspleulys

130135140

glulysprothrglyalaglyvalalapheleuleuleutrpalaleu

145150155160

hisgluargleuglyleuproproproleuglutyralaaspleuala

165170175

alavalglythrilealaaspvalalaproleutrpglytrpasnarg

180185190

alaleuvallysgluglyleualaargileproalasersertrpval

195200205

glyleuargleuleualaglualavalglytyrthrglylysalaval

210215220

gluvalalapheargilealaproargileasnalaalaserargleu

225230235240

glyglualaglulysalaleuargleuleuleuthraspaspalaala

245250255

glualaglnalaleuvalglygluleuhisargleuasnalaargarg

260265270

glnthrleugluglualametleuarglysleuleuproglnalaasp

275280285

proglualalysalailevalleuleuaspprogluglyhisprogly

290295300

valmetglyilevalalaserargileleuglualathrleuargpro

305310315320

valpheleuvalalaglnglylysglythrvalargserleualapro

325330335

ileseralavalglualaleuargseralagluaspleuleuleuarg

340345350

tyrglyglyhislysglualaalaglyphealametaspglualaleu

355360365

pheproalaphelysalaargvalglualatyralaalaargphepro

370375380

aspprovalarggluvalalaleuleuaspleuleuprogluprogly

385390395400

leuleuproglnvalphearggluleualaleuleugluprotyrgly

405410415

gluglyasnprogluproleupheleu

420425

<210>16

<211>738

<212>dna

<213>噬菌体λ

<400>16

tccggaagcggctctggtagtggttctggcatgacaccggacattatcctgcagcgtacc60

gggatcgatgtgagagctgtcgaacagggggatgatgcgtggcacaaattacggctcggc120

gtcatcaccgcttcagaagttcacaacgtgatagcaaaaccccgctccggaaagaagtgg180

cctgacatgaaaatgtcctacttccacaccctgcttgctgaggtttgcaccggtgtggct240

ccggaagttaacgctaaagcactggcctggggaaaacagtacgagaacgacgccagaacc300

ctgtttgaattcacttccggcgtgaatgttactgaatccccgatcatctatcgcgacgaa360

agtatgcgtaccgcctgctctcccgatggtttatgcagtgacggcaacggccttgaactg420

aaatgcccgtttacctcccgggatttcatgaagttccggctcggtggtttcgaggccata480

aagtcagcttacatggcccaggtgcagtacagcatgtgggtgacgcgaaaaaatgcctgg540

tactttgccaactatgacccgcgtatgaagcgtgaaggcctgcattatgtcgtgattgag600

cgggatgaaaagtacatggcgagttttgacgagatcgtgccggagttcatcgaaaaaatg660

gacgaggcactggctgaaattggttttgtatttggggagcaatggcgatctggctctggt720

tccggcagcggttccgga738

<210>17

<211>226

<212>prt

<213>噬菌体λ

<400>17

metthrproaspileileleuglnargthrglyileaspvalargala

151015

valgluglnglyaspaspalatrphislysleuargleuglyvalile

202530

thralasergluvalhisasnvalilealalysproargserglylys

354045

lystrpproaspmetlysmetsertyrphehisthrleuleualaglu

505560

valcysthrglyvalalaprogluvalasnalalysalaleualatrp

65707580

glylysglntyrgluasnaspalaargthrleuphegluphethrser

859095

glyvalasnvalthrgluserproileiletyrargaspglusermet

100105110

argthralacysserproaspglyleucysseraspglyasnglyleu

115120125

gluleulyscysprophethrserargaspphemetlyspheargleu

130135140

glyglypheglualailelysseralatyrmetalaglnvalglntyr

145150155160

sermettrpvalthrarglysasnalatrptyrphealaasntyrasp

165170175

proargmetlysarggluglyleuhistyrvalvalilegluargasp

180185190

glulystyrmetalaserpheaspgluilevalproglupheileglu

195200205

lysmetaspglualaleualagluileglyphevalpheglyglugln

210215220

trparg

225

<210>18

<211>760

<212>prt

<213>伯顿拟甲烷球菌属

<400>18

metmetilearggluleuaspileproargaspileileglyphetyr

151015

gluaspserglyilelysgluleutyrproproglnalaglualaile

202530

glumetglyleuleuglulyslysasnleuleualaalaileprothr

354045

alaserglylysthrleuleualagluleualametilelysalaile

505560

arggluglyglylysalaleutyrilevalproleuargalaleuala

65707580

serglulysphegluargphelysgluleualapropheglyilelys

859095

valglyileserthrglyaspleuaspserargalaasptrpleugly

100105110

valasnaspileilevalalathrserglulysthraspserleuleu

115120125

argasnglythrsertrpmetaspgluilethrthrvalvalvalasp

130135140

gluilehisleuleuaspserlysasnargglyprothrleugluval

145150155160

thrilethrlysleumetargleuasnproaspvalglnvalvalala

165170175

leuseralathrvalglyasnalaargglumetalaasptrpleugly

180185190

alaalaleuvalleuserglutrpargprothraspleuhisglugly

195200205

valleupheglyaspalaileasnpheproglyserglnlyslysile

210215220

aspargleuglulysaspaspalavalasnleuvalleuaspthrile

225230235240

lysalagluglyglncysleuvalphegluserserargargasncys

245250255

alaglyphealalysthralaserserlysvalalalysileleuasp

260265270

asnaspilemetilelysleualaglyilealaglugluvalgluser

275280285

thrglygluthraspthralailevalleualaasncysilearglys

290295300

glyvalalaphehishisalaglyleuasnserasnhisarglysleu

305310315320

valgluasnglypheargglnasnleuilelysvalileserserthr

325330335

prothrleualaalaglyleuasnleuproalaargargvalileile

340345350

argsertyrargargpheaspserasnpheglymetglnproilepro

355360365

valleuglutyrlysglnmetalaglyargalaglyargprohisleu

370375380

aspprotyrglygluservalleuleualalysthrtyraspgluphe

385390395400

alaglnleumetgluasntyrvalglualaaspalagluaspiletrp

405410415

serlysleuglythrgluasnalaleuargthrhisvalleuserthr

420425430

ilevalasnglyphealaserthrargglngluleupheaspphephe

435440445

glyalathrphephealatyrglnglnasplystrpmetleugluglu

450455460

valileasnaspcysleuglupheleuileasplysalametvalser

465470475480

gluthrgluaspilegluaspalaserlysleupheleuargglythr

485490495

argleuglyserleuvalsermetleutyrileaspproleusergly

500505510

serlysilevalaspglyphelysaspileglylysserthrglygly

515520525

asnmetglyserleugluaspasplysglyaspaspilethrvalthr

530535540

aspmetthrleuleuhisleuvalcysserthrproaspmetarggln

545550555560

leutyrleuargasnthrasptyrthrilevalasnglutyrileval

565570575

alahisseraspgluphehisgluileproasplysleulysgluthr

580585590

asptyrglutrpphemetglygluvallysthralametleuleuglu

595600605

glutrpvalthrgluvalseralagluaspilethrarghispheasn

610615620

valglygluglyaspilehisalaleualaaspthrserglutrpleu

625630635640

methisalaalaalalysleualagluleuleuglyvalglutyrser

645650655

serhisalatyrserleuglulysargileargtyrglyserglyleu

660665670

aspleumetgluleuvalglyileargglyvalglyargvalargala

675680685

arglysleutyrasnalaglyphevalservalalalysleulysgly

690695700

alaaspileservalleuserlysleuvalglyprolysvalalatyr

705710715720

asnileleuserglyileglyvalargvalasnasplyshispheasn

725730735

seralaproileserserasnthrleuaspthrleuleuasplysasn

740745750

glnlysthrpheasnaspphegln

755760

<210>19

<211>707

<212>prt

<213>海绵共生古菌

<400>19

metargilesergluleuaspileproargproalaileglupheleu

151015

gluglygluglytyrlyslysleutyrproproglnalaalaalaala

202530

lysalaglyleuthraspglylysservalleuvalseralaprothr

354045

alaserglylysthrleuilealaalailealametileserhisleu

505560

serargasnargglylysalavaltyrleuserproleuargalaleu

65707580

alaalaglulysphealaglupheglylysileglyglyileproleu

859095

glyargprovalargvalglyvalserthrglyasppheglulysala

100105110

glyargserleuglyasnasnaspileleuvalleuthrasngluarg

115120125

metaspserleuileargargargproasptrpmetaspgluvalgly

130135140

leuvalilealaaspgluilehisleuileglyaspargserarggly

145150155160

prothrleuglumetvalleuthrlysleuargglyleuargserser

165170175

proglnvalvalalaleuseralathrileserasnalaaspgluile

180185190

alaglytrpleuaspcysthrleuvalhisserthrtrpargproval

195200205

proleusergluglyvaltyrglnaspglygluvalalametglyasp

210215220

glyserarghisgluvalalaalathrglyglyglyproalavalasp

225230235240

leualaalagluservalalagluglyglyglnserleuilepheala

245250255

aspthrargalaargseralaserleualaalalysalaseralaval

260265270

ileproglualalysglyalaaspalaalalysleualaalaalaala

275280285

lyslysileileserserglyglygluthrlysleualalysthrleu

290295300

alagluleuvalglulysglyalaalaphehishisalaglyleuasn

305310315320

glnaspcysargservalvalglugluglupheargserglyargile

325330335

argleuleualaserthrprothrleualaalaglyvalasnleupro

340345350

alaargargvalvalileserservalmetargtyrasnserserser

355360365

glymetsergluproileserileleuglutyrlysglnleucysgly

370375380

argalaglyargproglntyrasplysserglyglualailevalval

385390395400

glyglyvalasnalaaspgluilepheaspargtyrileglyglyglu

405410415

progluproileargseralametvalaspaspargalaleuargile

420425430

hisvalleuserleuvalthrthrserproglyilelysgluaspasp

435440445

valthrgluphepheleuglythrleuglyglyglnglnserglyglu

450455460

serthrvallyspheservalalavalalaleuargpheleuglnglu

465470475480

gluglymetleuglyargargglyglyargleualaalathrlysmet

485490495

glyargleuvalserargleutyrmetaspprometthralavalthr

500505510

leuargaspalavalglyglualaserproglyargmethisthrleu

515520525

glypheleuhisleuvalserglucyssergluphemetproargphe

530535540

alaleuargglnlysasphisgluvalalaglumetmetleugluala

545550555560

glyargglygluleuleuargprovaltyrsertyrglucysglyarg

565570575

glyleuleualaleuhisargtrpileglygluserproglualalys

580585590

leualagluaspleulysphegluserglyaspvalhisargmetval

595600605

gluserserglytrpleuleuargcysiletrpgluileserlyshis

610615620

glngluargproaspleuleuglygluleuaspvalleuargserarg

625630635640

valalatyrglyilelysalagluleuvalproleuvalserilelys

645650655

glyileglyargvalargserargargleupheargglyglyilelys

660665670

glyproglyaspleualaalavalprovalgluargleuserargval

675680685

gluglyileglyalathrleualaasnasnilelysserglnleuarg

690695700

lysglygly

705

<210>20

<211>720

<212>prt

<213>伽马耐受超嗜热菌

<400>20

metlysvalaspgluleuprovalaspgluargleulysalavalleu

151015

lysgluargglyileglugluleutyrproproglnalaglualaleu

202530

lysserglyalaleugluglyargasnleuvalleualaileprothr

354045

alaserglylysthrleuvalsergluilevalmetvalasnlysleu

505560

ileglngluglyglylysalavaltyrleuvalproleulysalaleu

65707580

alagluglulystyrarggluphelysglutrpglulysleuglyleu

859095

lysvalalaalathrthrglyasptyraspserthraspasptrpleu

100105110

glyargtyraspileilevalalathralaglulyspheaspserleu

115120125

leuarghisglyalaargtrpileasnaspvallysleuvalvalala

130135140

aspgluvalhisleuileglysertyraspargglyalathrleuglu

145150155160

metileleuthrhismetleuglyargalaglnileleualaleuser

165170175

alathrvalglyasnalaglugluleualaglutrpleuaspalaser

180185190

leuvalvalserasptrpargprovalglnleuargargglyvalphe

195200205

hisleuglythrleuiletrpgluaspglylysvalglusertyrpro

210215220

gluasntrptyrserleuvalvalaspalavallysargglylysgly

225230235240

alaleuvalphevalasnthrargargseralaglulysglualaleu

245250255

alaleuserlysleuvalserserhisleuthrlysproglulysarg

260265270

alaleugluserleualaserglnleugluaspasnprothrserglu

275280285

lysleulysargalaleuargglyglyvalalaphehishisalagly

290295300

leuserargvalgluargthrleuilegluaspalapheargglugly

305310315320

leuilelysvalilethralathrprothrleuseralaglyvalasn

325330335

leuproserpheargvalileileargaspthrlysargtyralagly

340345350

pheglytrpthraspileprovalleugluileglnglnmetmetgly

355360365

argalaglyargproargtyrasplystyrglyglualaileileval

370375380

alaargthraspgluproglylysleumetgluargtyrilearggly

385390395400

lysproglulysleuphesermetleualaasngluglnalaphearg

405410415

serglnvalleualaleuilethrasnpheglyileargserphepro

420425430

gluleuvalargpheleugluargthrphetyralahisglnarglys

435440445

aspleuserserleuglutyrlysalalysgluvalvaltyrpheleu

450455460

ilegluasnglupheileaspleuaspleugluaspargpheilepro

465470475480

leupropheglylysargthrserglnleutyrileaspproleuthr

485490495

alalyslysphelysaspalapheproalailegluargasnproasn

500505510

propheglyilepheglnleuilealaserthrproaspmetalathr

515520525

leuthralaargargargglumetgluasptyrleuaspleualatyr

530535540

gluleugluasplysleutyralaserileprotyrtyrgluaspser

545550555560

argpheglnglypheleuglyglnvallysthralalysvalleuleu

565570575

asptrpileasngluvalproglualaargiletyrgluthrtyrser

580585590

ileaspproglyaspleutyrargleuleugluleualaasptrpleu

595600605

mettyrserleuilegluleutyrlysleuphegluprolysgluglu

610615620

ileleuasntyrleuargaspleuhisleuargleuarghisglyval

625630635640

argglugluleuleugluleuvalargleuproasnileglyarglys

645650655

argalaargalaleutyrasnalaglypheargservalglualaile

660665670

alaasnalalysproalagluleuleualavalgluglyileglyala

675680685

lysileleuaspglyiletyrarghisleuglyileglulysargval

690695700

thrgluglulysprolysarglysglythrleugluasppheleuarg

705710715720

<210>21

<211>799

<212>prt

<213>亨氏产甲烷螺菌

<400>21

metgluilealaserleuproleuproaspserpheileargalacys

151015

hisalalysglyileargserleutyrproproglnalaglucysile

202530

glulysglyleuleugluglylysasnleuleuileserileprothr

354045

alaserglylysthrleuleualaglumetalamettrpserargile

505560

alaalaglyglylyscysleutyrilevalproleuargalaleuala

65707580

serglulystyraspglupheserlyslysglyvalileargvalgly

859095

ilealathrglyaspleuaspargthraspalatyrleuglygluasn

100105110

aspileilevalalathrserglulysthraspserleuleuargasn

115120125

argthrprotrpleuserglnilethrcysilevalleuaspgluval

130135140

hisleuileglysergluasnargglyalathrleuglumetvalile

145150155160

thrlysleuargtyrthrasnprovalmetglnileileglyleuser

165170175

alathrileglyasnproalaglnleualaglutrpleuaspalathr

180185190

leuilethrserthrtrpargprovalaspleuargglnglyvaltyr

195200205

tyrasnglylysileargpheseraspsergluargproileglngly

210215220

lysthrlyshisaspaspleuasnleucysleuaspthrilegluglu

225230235240

glyglyglncysleuvalphevalserserargargasnalaglugly

245250255

phealalyslysalaalaglyalaleulysalaglyserproaspser

260265270

lysalaleualaglngluleuargargleuargaspargaspglugly

275280285

asnvalleualaaspcysvalgluargglyalaalaphehishisala

290295300

glyleuileargglngluargthrileileglugluglypheargasn

305310315320

glytyrilegluvalilealaalathrprothrleualaalaglyleu

325330335

asnleuproalaargargvalileileargasptyrasnargpheala

340345350

serglyleuglymetvalproileprovalglyglutyrhisglnmet

355360365

alaglyargalaglyargprohisleuaspprotyrglyglualaval

370375380

leuleualalysaspalaproservalgluargleuphegluthrphe

385390395400

ileaspalaglualagluargvalaspserglncysvalaspaspala

405410415

serleucysalahisileleuserleuilealathrglyphealahis

420425430

aspglnglualaleuserserphemetgluargthrphetyrphephe

435440445

glnhisprolysthrargserleuproargleuvalalaaspalaile

450455460

argpheleuthrthralaglymetvalglugluarggluasnthrleu

465470475480

seralathrargleuglyserleuvalserargleutyrleuasnpro

485490495

cysthralaargleuileleuaspserleulyssercyslysthrpro

500505510

thrleuileglyleuleuhisvalilecysvalserproaspmetgln

515520525

argleutyrleulysalaalaaspthrglnleuleuargthrpheleu

530535540

phelyshislysaspaspleuileleuproleuprophegluglnglu

545550555560

gluglugluleutrpleuserglyleulysthralaleuvalleuthr

565570575

asptrpalaaspgluphesergluglymetileglugluargtyrgly

580585590

ileglyalaglyaspleutyrasnilevalaspserglylystrpleu

595600605

leuhisglythrgluargleuvalservalglumetproglumetser

610615620

glnvalvallysthrleuservalargvalhishisglyvallysser

625630635640

gluleuleuproleuvalalaleuargasnileglyargvalargala

645650655

argthrleutyrasnalaglytyrproaspproglualavalalaarg

660665670

alaglyleuserthrilealaargileileglygluglyilealaarg

675680685

glnvalileaspgluilethrglyvallysargserglyilehisser

690695700

seraspaspasptyrglnglnlysthrprogluleuleuthraspile

705710715720

proglyileglylyslysmetalaglulysleuglnasnalaglyile

725730735

ilethrvalseraspleuleuthralaaspgluvalleuleuserasp

740745750

valleuglyalaalaargalaarglysvalleualapheleuserasn

755760765

serglulysgluasnserserserasplysthrglugluileproasp

770775780

thrglnlysileargglyglnsersertrpgluasppheglycys

785790795

<210>22

<211>1756

<212>prt

<213>大肠杆菌

<400>22

metmetserilealaglnvalargseralaglyseralaglyasntyr

151015

tyrthrasplysaspasntyrtyrvalleuglysermetglygluarg

202530

trpalaglylysglyalagluglnleuglyleuglnglyservalasp

354045

lysaspvalphethrargleuleugluglyargleuproaspglyala

505560

aspleuserargmetglnaspglyserasnlyshisargproglytyr

65707580

aspleuthrpheseralaprolysservalsermetmetalametleu

859095

glyglyasplysargleuileaspalahisasnglnalavalaspphe

100105110

alavalargglnvalglualaleualaserthrargvalmetthrasp

115120125

glyglnsergluthrvalleuthrglyasnleuvalmetalaleuphe

130135140

asnhisaspthrserargaspglngluproglnleuhisthrhisala

145150155160

valvalalaasnvalthrglnhisasnglyglutrplysthrleuser

165170175

serasplysvalglylysthrglypheilegluasnvaltyralaasn

180185190

glnilealapheglyargleutyrargglulysleulysgluglnval

195200205

glualaleuglytyrgluthrgluvalvalglylyshisglymettrp

210215220

glumetproglyvalprovalglualapheserglyargserglnala

225230235240

ileargglualavalglygluaspalaserleulysserargaspval

245250255

alaalaleuaspthrarglysserlysglnhisvalaspprogluile

260265270

argmetalaglutrpmetglnthrleulysgluthrglypheaspile

275280285

argalatyrargaspalaalaaspglnargthrgluileargthrgln

290295300

alaproglyproalaserglnaspglyproaspvalglnglnalaval

305310315320

thrglnalailealaglyleusergluarglysvalglnphethrtyr

325330335

thraspvalleualaargthrvalglyileleuproprogluasngly

340345350

valilegluargalaargalaglyileaspglualaileserargglu

355360365

glnleuileproleuaspargglulysglyleuphethrserglyile

370375380

hisvalleuaspgluleuservalargalaleuserargaspilemet

385390395400

lysglnasnargvalthrvalhisproglulysservalproargthr

405410415

alaglytyrseraspalavalservalleualaglnaspargproser

420425430

leualailevalserglyglnglyglyalaalaglyglnarggluarg

435440445

valalagluleuvalmetmetalaarggluglnglyarggluvalgln

450455460

ileilealaalaaspargargserglnmetasnleulysglnaspglu

465470475480

argleuserglygluleuilethrglyargargglnleuleuglugly

485490495

metalaphethrproglyserthrvalilevalaspglnglyglulys

500505510

leuserleulysgluthrleuthrleuleuaspglyalaalaarghis

515520525

asnvalglnvalleuilethraspserglyglnargthrglythrgly

530535540

seralaleumetalametlysaspalaglyvalasnthrtyrargtrp

545550555560

glnglyglygluglnargproalathrileilesergluproasparg

565570575

asnvalargtyralaargleualaglyaspphealaalaservallys

580585590

alaglyglugluservalalaglnvalserglyvalarggluglnala

595600605

ileleuthrglnalaileargsergluleulysthrglnglyvalleu

610615620

glyhisprogluvalthrmetthralaleuserprovaltrpleuasp

625630635640

serargserargtyrleuargaspmettyrargproglymetvalmet

645650655

gluglntrpasnprogluthrargserhisaspargtyrvalileasp

660665670

argvalthralaglnserhisserleuthrleuargaspalaglngly

675680685

gluthrglnvalvalargileserserleuaspsersertrpserleu

690695700

pheargproglulysmetprovalalaaspglygluargleuargval

705710715720

thrglylysileproglyleuargvalserglyglyaspargleugln

725730735

valalaservalsergluaspalametthrvalvalvalproglyarg

740745750

alagluproalaserleuprovalseraspserprophethralaleu

755760765

lysleugluasnglytrpvalgluthrproglyhisservalserasp

770775780

seralathrvalphealaservalthrglnmetalametaspasnala

785790795800

thrleuasnglyleualaargserglyargaspvalargleutyrser

805810815

serleuaspgluthrargthralaglulysleualaarghisproser

820825830

phethrvalvalsergluglnilelysalaargalaglygluthrleu

835840845

leugluthralaileserleuglnlysalaglyleuhisthrproala

850855860

glnglnalailehisleualaleuprovalleugluserlysasnleu

865870875880

alaphesermetvalaspleuleuthrglualalysserphealaala

885890895

gluglythrglyphethrgluleuglyglygluileasnalaglnile

900905910

lysargglyaspleuleutyrvalaspvalalalysglytyrglythr

915920925

glyleuleuvalserargalasertyrglualaglulysserileleu

930935940

arghisileleugluglylysglualavalthrproleumetgluarg

945950955960

valproglygluleumetgluthrleuthrserglyglnargalaala

965970975

thrargmetileleugluthrseraspargphethrvalvalglngly

980985990

tyralaglyvalglylysthrthrglnpheargalavalmetserala

99510001005

valasnmetleuproalasergluargproargvalvalglyleu

101010151020

glyprothrhisargalavalglyglumetargseralaglyval

102510301035

aspalaglnthrleualaserpheleuhisaspthrglnleugln

104010451050

glnargserglygluthrproasppheserasnthrleupheleu

105510601065

leuaspglusersermetvalglyasnthrglumetalaargala

107010751080

tyralaleuilealaalaglyglyglyargalavalalasergly

108510901095

aspthraspglnleuglnalailealaproglyglnserphearg

110011051110

leuglnglnthrargseralaalaaspvalvalilemetlysglu

111511201125

ilevalargglnthrprogluleuargglualavaltyrserleu

113011351140

ileasnargaspvalgluargalaleuserglyleugluserval

114511501155

lysproserglnvalproargleugluglyalatrpalaproglu

116011651170

hisservalthrglupheserhisserglnglualalysleuala

117511801185

glualaglnglnlysalametleulysglyglualapheproasp

119011951200

ileprometthrleutyrglualailevalargasptyrthrgly

120512101215

argthrproglualaarggluglnthrleuilevalthrhisleu

122012251230

asngluaspargargvalleuasnsermetilehisaspalaarg

123512401245

glulysalaglygluleuglylysgluglnvalmetvalproval

125012551260

leuasnthralaasnileargaspglygluleuargargleuser

126512701275

thrtrpglulysasnproaspalaleualaleuvalaspasnval

128012851290

tyrhisargilealaglyileserlysaspaspglyleuilethr

129513001305

leuglnaspalagluglyasnthrargleuileserproargglu

131013151320

alavalalagluglyvalthrleutyrthrproasplysilearg

132513301335

valglythrglyaspargmetargphethrlysseraspargglu

134013451350

argglytyrvalalaasnservaltrpthrvalthralavalser

135513601365

glyaspservalthrleuseraspglyglnglnthrargvalile

137013751380

argproglyglngluargalagluglnhisileaspleualatyr

138513901395

alailethralahisglyalaglnglyalasergluthrpheala

140014051410

ilealaleugluglythrgluglyasnarglysleumetalagly

141514201425

phegluseralatyrvalalaleuserargmetlysglnhisval

143014351440

glnvaltyrthraspasnargglnglytrpthraspalaileasn

144514501455

asnalavalglnlysglythralahisaspvalleugluprolys

146014651470

proasparggluvalmetasnalaglnargleupheserthrala

147514801485

arggluleuargaspvalalaalaglyargalavalleuarggln

149014951500

alaglyleualaglyglyaspserproalaargpheilealapro

150515101515

glyarglystyrproglnprotyrvalalaleuproalapheasp

152015251530

argasnglylysseralaglyiletrpleuasnproleuthrthr

153515401545

aspaspglyasnglyleuargglypheserglygluglyargval

155015551560

lysglyserglyaspalaglnphevalalaleuglnglyserarg

156515701575

asnglygluserleuleualaaspasnmetglnaspglyvalarg

158015851590

ilealaargaspasnproaspserglyvalvalvalargileala

159516001605

glygluglyargprotrpasnproglyalailethrglyglyarg

161016151620

valtrpglyaspileproaspasnservalglnproglyalagly

162516301635

asnglygluprovalthralagluvalleualaglnargglnala

164016451650

gluglualaileargarggluthrgluargargalaaspgluile

165516601665

valarglysmetalagluasnlysproaspleuproaspglylys

167016751680

thrgluleualavalargaspilealaglyglngluargasparg

168516901695

seralailesergluarggluthralaleuprogluservalleu

170017051710

arggluserglnarggluargglualavalarggluvalalaarg

171517201725

gluasnleuleuglngluargleuglnglnmetgluargaspmet

173017351740

valargaspleuglnlysglulysthrleuglyglyasp

174517501755

<210>23

<211>726

<212>prt

<213>伯顿拟甲烷球菌属

<400>23

metserasplysproalaphemetlystyrphethrglnsersercys

151015

tyrproasnglnglnglualametaspargilehisseralaleumet

202530

glnglnglnleuvalleuphegluglyalacysglythrglylysthr

354045

leuseralaleuvalproalaleuhisvalglylysmetleuglylys

505560

thrvalileilealathrasnvalhisglnglnmetvalglnpheile

65707580

asnglualaargaspilelyslysvalglnaspvallysvalalaval

859095

ilelysglylysthralametcysproglnglualaasptyrgluglu

100105110

cysservallysarggluasnthrphegluleumetgluthrgluarg

115120125

gluiletyrleulysargglngluleuasnseralaargaspsertyr

130135140

lyslysserhisaspproalaphevalthrleuargaspgluleuser

145150155160

lysgluileaspalavalgluglulysalaargglyleuargasparg

165170175

alacysasnaspleutyrgluvalleuargseraspserglulysphe

180185190

argglutrpleutyrlysgluvalargserproglugluileasnasp

195200205

hisalailelysaspglymetcysglytyrgluleuvallysargglu

210215220

leulyshisalaaspleuleuilecysasntyrhishisvalleuasn

225230235240

proaspilepheserthrvalleuglytrpileglulysgluprogln

245250255

gluthrilevalilepheaspglualahisasnleugluseralaala

260265270

argserhisserserleuserleuthrgluhisserileglulysala

275280285

ilethrgluleuglualaasnleuaspleuleualaaspaspasnile

290295300

hisasnleupheasnilepheleugluvalileseraspthrtyrasn

305310315320

serargphelyspheglygluarggluargvalarglysasntrptyr

325330335

aspileargileseraspprotyrgluargasnaspilevalarggly

340345350

lyspheleuargglnalalysglyasppheglyglulysaspaspile

355360365

glnileleuleuserglualasergluleuglyalalysleuaspglu

370375380

thrtyrargaspglntyrlyslysglyleuserservalmetlysarg

385390395400

serhisileargtyrvalalaaspphemetseralatyrilegluleu

405410415

serhisasnleuasntyrtyrproileleuasnvalargargaspmet

420425430

asnaspgluiletyrglyargvalgluleuphethrcysileprolys

435440445

asnvalthrgluproleupheasnserleupheservalileleumet

450455460

seralathrleuhispropheglumetvallyslysthrleuglyile

465470475480

thrargaspthrcysglumetsertyrglythrserpheprogluglu

485490495

lysargleuserilealavalserileproproleuphealalysasn

500505510

argaspasparghisvalthrgluleuleugluglnvalleuleuasp

515520525

serilegluasnserlysglyasnvalileleuphepheglnserala

530535540

pheglualalysargtyrtyrserlysilegluproleuvalasnval

545550555560

provalpheleuaspgluvalglyileserserglnaspvalargglu

565570575

gluphepheserileglyglugluasnglylysalavalleuleuser

580585590

tyrleutrpglythrleusergluglyileasptyrargaspglyarg

595600605

glyargthrvalileileileglyvalglytyrproalaleuasnasp

610615620

argmetasnalavalgluseralatyrasphisvalpheglytyrgly

625630635640

alaglytrpgluphealaileglnvalprothrilearglysilearg

645650655

glnalametglyargvalvalargserprothrasptyrglyalaarg

660665670

ileleuleuaspglyargpheleuthraspserlyslysargphegly

675680685

lyspheservalphegluvalpheproproalagluargsergluphe

690695700

valaspvalaspproglulysvallystyrserleumetasnphephe

705710715720

metaspasnaspglugln

725

<210>24

<211>439

<212>prt

<213>肠杆菌噬菌体t4

<400>24

metthrpheaspaspleuthrgluglyglnlysasnalapheasnile

151015

valmetlysalailelysglulyslyshishisvalthrileasngly

202530

proalaglythrglylysthrthrleuthrlyspheileilegluala

354045

leuileserthrglygluthrglyileileleualaalaprothrhis

505560

alaalalyslysileleuserlysleuserglylysglualaserthr

65707580

ilehisserileleulysileasnprovalthrtyrglugluasnval

859095

leuphegluglnlysgluvalproaspleualalyscysargvalleu

100105110

ilecysaspgluvalsermettyrasparglysleuphelysileleu

115120125

leuserthrileproprotrpcysthrileileglyileglyaspasn

130135140

lysglnileargprovalaspproglygluasnthralatyrileser

145150155160

prophephethrhislysaspphetyrglncysgluleuthrgluval

165170175

lysargserasnalaproileileaspvalalathraspvalargasn

180185190

glylystrpiletyrasplysvalvalaspglyhisglyvalarggly

195200205

phethrglyaspthralaleuargaspphemetvalasntyrpheser

210215220

ilevallysserleuaspaspleuphegluasnargvalmetalaphe

225230235240

thrasnlysservalasplysleuasnserileilearglyslysile

245250255

phegluthrasplysasppheilevalglygluileilevalmetgln

260265270

gluproleuphelysthrtyrlysileaspglylysprovalserglu

275280285

ileilepheasnasnglyglnleuvalargileileglualaglutyr

290295300

thrserthrphevallysalaargglyvalproglyglutyrleuile

305310315320

arghistrpaspleuthrvalgluthrtyrglyaspaspglutyrtyr

325330335

argglulysilelysileileserseraspglugluleutyrlysphe

340345350

asnleupheleuglylysthralagluthrtyrlysasntrpasnlys

355360365

glyglylysalaprotrpseraspphetrpaspalalysserglnphe

370375380

serlysvallysalaleuproalaserthrphehislysalaglngly

385390395400

metservalaspargalapheiletyrthrprocysilehistyrala

405410415

aspvalgluleualaglnglnleuleutyrvalglyvalthrarggly

420425430

argtyraspvalphetyrval

435

<210>25

<211>970

<212>prt

<213>肉毒杆菌

<400>25

metleuservalalaasnvalargserproseralaalaalasertyr

151015

phealaseraspasntyrtyralaseralaaspalaaspargsergly

202530

glntrpileglyaspglyalalysargleuglyleugluglylysval

354045

glualaargalapheaspalaleuleuargglygluleuproaspgly

505560

serservalglyasnproglyglnalahisargproglythraspleu

65707580

thrpheservalprolyssertrpserleuleualaleuvalglylys

859095

aspgluargileilealaalatyrargglualavalvalglualaleu

100105110

histrpalaglulysasnalaalagluthrargvalvalglulysgly

115120125

metvalvalthrglnalathrglyasnleualaileglyleuphegln

130135140

hisaspthrasnargasnglngluproasnleuhisphehisalaval

145150155160

ilealaasnvalthrglnglylysaspglylystrpargthrleulys

165170175

asnaspargleutrpglnleuasnthrthrleuasnserilealamet

180185190

alaargpheargvalalavalglulysleuglytyrgluproglypro

195200205

valleulyshisglyasnpheglualaargglyileserargglugln

210215220

valmetalapheserthrargarglysgluvalleuglualaargarg

225230235240

glyproglyleuaspalaglyargilealaalaleuaspthrargala

245250255

serlysgluglyilegluaspargalathrleuserlysglntrpser

260265270

glualaalaglnserileglyleuaspleulysproleuvalasparg

275280285

alaargthrlysalaleuglyglnglymetglualathrargilegly

290295300

serleuvalgluargglyargalatrpleuserargphealaalahis

305310315320

valargglyaspproalaaspproleuvalproproservalleulys

325330335

glnaspargglnthrilealaalaalaglnalavalalaseralaval

340345350

arghisleuserglnargglualaalaphegluargthralaleutyr

355360365

lysalaalaleuasppheglyleuprothrthrilealaaspvalglu

370375380

lysargthrargalaleuvalargserglyaspleuilealaglylys

385390395400

glygluhislysglytrpleualaserargaspalavalvalthrglu

405410415

glnargileleusergluvalalaalaglylysglyaspserserpro

420425430

alailethrproglnlysalaalaalaservalglnalaalaalaleu

435440445

thrglyglnglypheargleuasngluglyglnleualaalaalaarg

450455460

leuileleuileserlysaspargthrilealavalglnglyileala

465470475480

glyalaglylysserservalleulysprovalalagluvalleuarg

485490495

aspgluglyhisprovalileglyleualaileglnasnthrleuval

500505510

glnmetleugluargaspthrglyileglyserglnthrleualaarg

515520525

pheleuglyglytrpasnlysleuleuaspaspproglyasnvalala

530535540

leuargalaglualaglnalaserleulysasphisvalleuvalleu

545550555560

aspglualasermetvalserasngluasplysglulysleuvalarg

565570575

leualaasnleualaglyvalhisargleuvalleuileglyasparg

580585590

lysglnleuglyalavalaspalaglylysprophealaleuleugln

595600605

argalaglyilealaargalaglumetalathrasnleuargalaarg

610615620

aspprovalvalargglualaglnalaalaalaglnalaglyaspval

625630635640

arglysalaleuarghisleulysserhisthrvalglualaarggly

645650655

aspglyalaglnvalalaalagluthrtrpleualaleuasplysglu

660665670

thrargalaargthrseriletyralaserglyargalaileargser

675680685

alavalasnalaalavalglnglnglyleuleualaserarggluile

690695700

glyproalalysmetlysleugluvalleuaspargvalasnthrthr

705710715720

argglugluleuarghisleuproalatyrargalaglyargvalleu

725730735

gluvalserarglysglnglnalaleuglyleupheileglyglutyr

740745750

argvalileglyglnasparglysglylysleuvalgluvalgluasp

755760765

lysargglylysargpheargpheaspproalaargileargalagly

770775780

lysglyaspaspasnleuthrleuleugluproarglysleugluile

785790795800

hisgluglyaspargileargtrpthrargasnasphisargarggly

805810815

leupheasnalaaspglnalaargvalvalgluilealaasnglylys

820825830

valthrphegluthrserlysglyaspleuvalgluleulyslysasp

835840845

aspprometleulysargileaspleualatyralaleuasnvalhis

850855860

metalaglnglyleuthrseraspargglyilealavalmetaspser

865870875880

arggluargasnleuserasnglnlysthrpheleuvalthrvalthr

885890895

argleuargasphisleuthrleuvalvalaspseralaasplysleu

900905910

glyalaalavalalaargasnlysglyglulysalaseralaileglu

915920925

valthrglyservallysprothralathrlysglyserglyvalasp

930935940

glnprolysservalglualaasnlysalaglulysgluleuthrarg

945950955960

serlysserlysthrleuasppheglyile

965970

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1