聚合物的测量的分析的制作方法

文档序号:467200阅读:273来源:国知局
聚合物的测量的分析的制作方法
【专利摘要】分析了聚合物通过纳米孔易位过程中进行的聚合物的时序系列的测量。测量取决于纳米孔中的k链节的特性,k链节是聚合物的k个聚合物单元,其中,k是正整数。所述方法包括:从测量系列得出代表测量特性的时序特征的特征向量;以及测定得出的特征向量和至少一种其他特征向量之间的相似性。
【专利说明】聚合物的测量的分析

【技术领域】
[0001] 本发明总体上涉及分析在聚合物通过纳米孔的易位过程中进行的包含聚合物单 元的聚合物,例如但不限于多核苷酸的测量的领域。

【背景技术】
[0002] 通常,通过使用膜限制溶液的两个池之间的物质流动,进行纳米孔测量。提供在膜 中的孔以允许物质从溶液的一个池转移到另一个。孔具有纳米尺度上的至少一个尺寸。随 着物质通过孔易位,测量该物质。最常用的设置依赖施加电压的应用以驱动分子物种通过 纳米孔。将电极放置在每个溶液体积中,并且溶液包含电解质,通常为盐,如I M NaCl。在 电极之间施加的电压还驱动电解质通过孔并且产生电流。当物质通过孔时,其改变在电流 测量中直接观察到的离子的流动。电流阻塞的程度和物质花费在纳米孔中的持续时间指示 物质的特性。
[0003] 通过使聚合物通过纳米孔来分析聚合物的原始概念由Branton等人 (US-5, 795, 782)在1996年提出。在这种情况下,DNA分子通过嵌入在脂膜中的纳米孔。将 电极放置在膜的每一侧上,并且施加的电压用于驱动DNA分子从膜的一侧至另一侧。在DNA 分子的易位过程中,测量通过孔的跨膜电流。示出的是:当DNA通过纳米孔时,DNA的不同 序列将引起不同的观察电流。使用核苷酸的均聚物进行这些早期实验,其中,聚合物自由地 易位纳米孔。在这些实验中,聚合物易位的速率非常快(?5 ii s/碱基),造成聚合物中的 单个核苷酸的特性难以确定。
[0004] 为了克服快速DNA易位的限制,Branton等人公开了使用聚合酶以控制DNA通过 纳米孔易位的速度。该优雅方案已经被本领域中的许多研究者采用并修改,其已经导致了 许多出版物。基本概念是给聚合物的运动提供棘轮,这可以包括分子发动机或分子制动。
[0005] 早期研究集中在使用聚合酶来控制DNA的运动。使用Klenow片段进行了许多研 究,但这些实验受限于纳米孔顶部上的DNA-酶复合物的短持续时间。研发了许多方案以补 偿这种弱结合(例如,参见 Olasagasti 等,Nat Nanotechnol. 2010 Nov ;5 (11) : 798-806, Ashkenasy 等,Angew Chem Int Ed Engl. 2005 Feb 18 ;44 (9): 1401-4)。
[0006] 在2010, Akeson等人公开了 Phi29 DNA聚合酶(DNAP)可以在纳米 孔的顶部上起作用(例如,参见Lieberman等,J Am Chem Soc. 2010 Dec22 ; 132 (50) : 17961-72, 61/402, 903)。Phi29 DNAP粘合至模板DNA的强度足以允许在纳米孔的 顶部上进行多重酶循环,从而,允许以棘轮方式拉动DNA通过纳米孔。文章还披露了在其中 抑制酶运动的条件下,Phi29 DNAP可以用于控制DNA运动通过纳米孔。在这些条件下,对 于酶促作用而言必不可少的Mg2+有效地通过加入金属螯合剂乙二胺四乙酸(EDTA)去除。 施加的电压提供了 DNA链上的力,并且Phi29 DNAP通过孔限制链的"拉开(unzipping)"。 该研究表明纳米孔系统中的酶可以起分子发动机的作用或起分子制动的作用。
[0007] 除了使用聚合酶作为分子棘轮之外,已经证明的是:一些解旋酶家族可以 用于提供控制多核苷酸运动通过纳米孔(例如,参见US 61/549,998(N115020)、US 61/581,332(N115505)、US 61/581,340(N115506))。解旋酶(helicase)具有许多使得它们 适合用于纳米孔系统的性能。
[0008] 减缓靶单链DNA易位的替代方法是沿着靶链的长度杂交ssDNA(hyb-DNA)的附加 部分。在施加的电压下,DNA的靶链迅速穿过孔。一旦链的双链部分到达纳米孔的收缩处, 链的易位停止,允许在固定位置处读取聚合物的电流。通过外加场的力,hyb-DNA部分未杂 交,并且靶DNA链继续易位纳米孔直至遇到另一个hyb-DNA。以这种方式,获得了在多个固 定位置处针对DNA链的电流标记。通过使用复杂样品制备技术,Derrington等人提出使用 该方法测序DNA链的方法。
[0009] 从这些方法产生的数据共享主要特征;DNA的易位发生在谨慎的阶段,其中,每一 个阶段代表纳米孔中的聚合物的位置并且每一个聚合物位置具有特征电流水平。有时,电 流水平可以表现出波动,称为偏差。这些特征导致了采用"嘈杂阶梯波(noisy st印wave)" 形式的信号。
[0010] 更通常地,系统的一些性能取决于纳米孔中的聚合物单元,并且采用了该性能的 测试。例如,可以通过将纳米孔放置在绝缘膜中,并且在分析物分子的存在下测量通过纳米 孔的电压驱动的离子转运来产生测量系统。通过纳米孔控制聚合物的运动导致许多表明聚 合物序列的测量的不同水平。
[0011] 在之前的研究中,焦点已经在于测定聚合物的基础序列。通常,在这些方法中,通 过比较这些状态的电流水平与来自参考数据的已知电流水平,已经单独地分析了信号中的 每一状态。该方法将电流信号转化成评价聚合物序列。对此进行说明的另一种方式是该方 法将来自信号空间的信息转化成序列空间。然而,在研发可以可靠地确定序列的测量系统 中存在实际困难。
[0012] 对于依赖于k个聚合物单元的组的每一测量值,典型的是许多类型的测量系统, 包括大多数的目前已知的纳米孔,其中,k是复数的整数,以下称为'k链节'。这是由于多于 一个聚合物单元有助于观察到的离子电流,并且可以被概念性地认为具有比被测量的聚合 物单元更大的"钝读取头(bluntreader head)"的测量系统。在这种情形下,待解决的不 同k链节的数目增加了 k的乘幂。例如,如果存在n个可能的聚合物单元,待解决的不同k 链节的数目是nk。尽管可期望的是具有对于不同k链节测量之间的清楚分离,对于这些测 量中的一些,常见的是重叠。特别地,具有高数目的k链节,可能难以解析由不同k链节产 生的测量,难以解析关于聚合物的衍生信息的损害,例如,评价聚合物单元的基础序列。 [0013]许多研究已经旨在设计提供依赖于单个聚合物单元的可解析测量的测量系统。然 而,例如,由于可以产生基础物理或生物系统中固有变化的改变程度的测量中的变化,和/ 或由于被测量的小幅度性能而不可避免的测量噪音,这已经在实践中被证明困难。其他工 作已经接受依赖于k链节的测量,但已经旨在设计其中来自不同k链节的测量可彼此解析 的测量系统。然而,实际限制再次意味着这非常困难。由一些不同k链节产生的信号分布 通常可以重叠。


【发明内容】

[0014] 根据本发明,提供了分析聚合物通过纳米孔的易位过程中进行的聚合物时序系列 测量(聚合物的时序测量结果,time-ordered series of measurements of a polymer) 的方法,其中,测量(测量结果,measurement)取决于纳米孔中的k链节(k-mers)的特性(identity), k链节是聚合物的k个聚合物单元,其中,k是正整数,所述方法包括:
[0015] 从测量系列中得出代表测量的特性的时序特征的特征向量;以及
[0016] 测定得出的特征向量和至少一种其他特征向量之间的相似性。
[0017] 尽管之前的研究已经尝试得出来自测量的精确序列,本发明利用许多应用不需要 待指定的精确的聚合物序列的优点。这些包括显著量的诊断、临床、科学、基因应用,其中, 可以廉价地、迅速地获得期望结果,并且在没有依赖于序列信息的情况下达到更高的精确 度。特别地,本发明涉及代表测量特性的时序特征的特征向量的得出。然后,测定提供可用 于许多应用中的信息的得出的特征向量和至少一种其他特征向量之间的相似性。
[0018] 因此,本发明不需要指定聚合物序列,即,测量信号转化成序列空间不是必须的。 这在许多应用中提供了聚合物的有用分析,但由于没有必要解析序列中的每一个单个的聚 合物单元,减少了测量系统操作上的负担。测量系统限制的这种减少还增加了测量系统的 范围。这可以允许使用更容易设计或操作的测量系统,或可以允许使用具体地适合于分析 聚合物的特定特性的测量系统,甚至在不能够提供完全的序列信息的情况下。
[0019] 本发明的基础特征是将为测量的时序系列的原始信号转化成时序特征的特征向 量。当聚合物通过纳米孔易位时,得出测量的系列,并且由此提供整个序列上的信息,即使 这是不完全的。特征向量的得出提供了也是时序性的但具有减少的数据集的表示。该特征 向量可以被认为聚合物的"标记"。然后,将特征向量与至少一种其他特征向量相比较以测 定相似性。至少一种其他特征向量可以是例如储存在存储器中的特征向量或以相同方式得 出的另一个特征向量。根据相似性,可以得出聚合物的特性。
[0020] 在一些信号下,存在连续测量的组依赖于对于每一个组不同的各个k链节的每一 个k链节的足够的分辨率。在这种情况下,得出特征向量的步骤可以包括识别连续测量的 组,并且,相对于各个组,得出代表组的测量特性的一种或更多种特征的值。例如,特征可以 包括:测量组的平均值;测量组的周期;测量组的偏差(方差,variance);测量组的分布; 或它们的任何组合。
[0021] 本发明还可适用于具有较小分辨率的信号,使得一些k链节可以提供仅单个测量 或根本没有测量。
[0022] 如以上所提及的,在一些情况下,相对于至少一个类别,得出的特征向量可以与储 存在存储器中的至少一种其他特征向量相比较。在这种情况下,可以在全部或部分得出的 特征向量和储存在存储器中的至少一种其他特征向量整体之间,或可替换地,在全部或部 分得出的特征向量和储存在存储器中的至少一种其他特征向量的部分之间测定相似性。
[0023] 该方法可以进一步包括:根据测定的相似性,将从其中得到得出的特征向量的聚 合物分类为属于所述类别。这提供了研究的聚合物的特性。
[0024] 可以根据待测定的聚合物选择储存在存储器中的至少一种其他特征向量,或可替 换地,可以使用储存在存储器中的多个其他特征向量的库。
[0025] 在一些应用中,可以从具有重叠区域的两种或更多种特征向量获得结合的特征向 量,其中,在结合的特征向量之间测定得出的特征向量的相似性。结合的特征向量的非重叠 区域可以用于测定得出的特征向量之间的相似性,例如,以识别得出的特征向量的特定的 局部区域。
[0026] 因此,所述方法可以用于测定得出的特征向量和一种或更多种特征向量的连续或 非连续区域之间的相似性。
[0027] 在一些应用中,得出的特征向量的多个部分可以与储存的特征向量的全部、部分 或多个部分相比较。
[0028] 如以上所提及的,在其他情况下,得出的特征向量可以与作为使用相同方法得出 的特征向量的至少一种其他特征向量相比较。相对于彼此,这提供了研究的多种聚合物的 特性识别。在这种情况下,所述方法可以进一步包括将相似特征向量的簇识别为一类,并且 将由其得出特征向量的聚合物分类为属于识别的类。
[0029] 在一个实例中,其中,存在使用相同方法得出的多个其他特征向量,该方法可以进 一步包括根据特征向量的重叠部分的相似性,识别从作为共同聚合物的片段的聚合物得出 的特征向量。
[0030] 当将聚合物分类时,该方法可以进一步包括计数属于不同类别的特征向量的数 目。这提供了研究的聚合物的群体分析。
[0031] 当将聚合物分类时,该方法可以进一步包括识别局部区域,其中,得出的特征向量 不同于相对于其中聚合物被分类为属于其的类别的特征向量。
[0032] 在相似的技术中,其中,聚合物具有期望的特性,得出的特征向量可以与储存在存 储器中的特征向量相比较,并且相似性的测定包括测定其中得出的特征向量不同于储存在 存储器中的至少一种其他特征向量的局部区域。
[0033] 其中得出的特征向量不同于所期望的局部区域的这种识别提供了在许多应用中 非常有力的分析技术,其中聚合物的长序列的相对小的区域中的变化显著。这种技术的一 个实例是识别作为多核苷酸的聚合物中的突变。
[0034] 该方法可以在之前已经做出的一系列测量上进行。可替换地,该方法可以进一步 包括:通过纳米孔易位聚合物,以及形成聚合物的测量的连续系列。
[0035] 分析测量系列的方法可以用于根据分析来评价目标聚合物的存在、不存在或量的 方法中。
[0036] 在这种情况下,聚合物可以包括两种或更多种聚合物的混合物,并且可以测定一 种或更多种聚合物的相对量。
[0037] 评价靶聚合物的存在、不存在或量的方法可以应用至包括以下的方法中的聚合物 分析物:将聚合物分析物破碎成聚合物;以及执行评价破碎的聚合物的方法。当聚合物是 多核苷酸并且聚合物单元是核苷酸时,可以通过限制性酶破碎聚合物分析物。
[0038] 分析测量的系列的方法可以应用在包括以下的测定聚合物中的改变的方法中:在 一段时期内,通过纳米孔反复易位聚合物;在每一次易位过程中,形成聚合物的测量的连续 系列;分析测量的每一系列。在这种情况下,测定得出的特征向量和至少一种其他特征向量 之间的相似性的步骤可以包括:(a)测定从测量的各个系列得出的得出特征向量和相同的 至少一种其他特征向量之间的相似性,或(b)测定从测量的系列得出的所有得出特征向量 之间的相似性。
[0039] 当聚合物是多核苷酸并且聚合物单元是核苷酸时,该方法可以用于测定修饰碱基 或点突变的存在。
[0040] 通常,这些方法可以用于引导治疗或诊断或用于识别个体。
[0041] 本发明具有许多应用。一些非限制性实例或应用如下。
[0042] 本发明可以应用至用于聚合物的分析的单分子标签自由检测系统,例如,纳米孔 系统。对于这种系统,通常包括在给出的聚合物位置处被多于一种单体单元影响的识别元 件。在这些系统中,提取测量和聚合物序列之间的关系可以具有挑战性或资源需求。
[0043] 本发明可以应用至任何聚合物分析系统,其中,聚合物标记指明聚合物的特性,并 且其中,确切的聚合物序列对于测定所述特性不是必须知晓的。实例包括但不限于:检测单 核苷酸多态性(SNP)、存在或不存在特定序列、分组和计数聚合物序列、设计标签和生物标 记、以及识别修饰或损坏的DNA。
[0044] 例如,该方法可以用于测定样品中的靶聚合物分析物的存在、不存在或量。该方法 可以用于测量相对于阈值的量。该方法可以用于测定聚合物的混合物中的一种或更多种靶 聚合物的相对量。
[0045] 根据单个样品的分析,该方法可以用于引导治疗或诊断。可替换地,例如,在一段 时期内所述方法可以进行多次以监视个体的疾病或改善的进展。例如,在用作治疗诊断时, 该方法可以用于监视治疗效能。
[0046] 例如,所述方法可以用在法医应用中以例如通过测定短串联重复、可变串联重复 等的存在来检测线粒体DNA中的SNP用于个体DNA图谱、用于个体的遗传指纹。
[0047] 在没有评价聚合物的聚合物单元序列的情况下,可以执行所有方法。

【专利附图】

【附图说明】
[0048] 为了能够更好的理解,现在将通过非限制性实施例,参照附图,来描述本发明的实 施方式,其中:
[0049] 图1是包括纳米孔的测量系统的示意图;
[0050] 图2是通过测量系统,随着时间测定的事件的信号的绘图;
[0051] 图3是在包括纳米孔的测量系统中的两种不同多核苷酸的测量的频率分布的图;
[0052] 图4和图5分别是643链节系数和10245链节系数相对于来自应用至实验得出的 电流测量的集合的一阶线性模型的预测值的绘图;
[0053] 图6是分析包括聚合物测量的输入信号的方法的流程图;
[0054] 图7是图6的状态检测步骤的流程图;
[0055] 图8和图9分别是经历状态检测步骤的输入信号和得到的测量系列的绘图;
[0056] 图10和图11是图6的相似性测定步骤的实施例的流程图;
[0057] 图12是针对该方法的实施例2,针对由它们的重叠识别的序列的三个片段的特征 向量的绘图;
[0058] 图13是与实施例2中的所有库序列相比较,候选分子的相似性得分的绘图;
[0059] 图14是与实施例2中的最佳匹配库分子比对的候选分子的绘图;
[0060] 图15是针对实施例2中的176候选分子的分类的直方图;
[0061] 图16是该方法的实施例3中的特征向量的曲线图,说明了 SNP对于分子13的影 响;
[0062]图17是针对具有实施例3中的分子13中的三个SNP的176候选分子的分类的直 方图;
[0063] 图18是测定的分子与实施例3中的库特征向量比对的曲线图;
[0064] 图19是测量值和库特征向量之间的位置解析差异的绘图,说明了实施例3中SNP 的位置;
[0065] 图20是测量值和没有实施例3中SNP的库特征向量之间的位置解析差异的绘图;
[0066] 图21是数据与该方法的实施例4中一致的标记的最终比对的绘图;
[0067] 图22是在实施例4中的近似位置337处的候选分子51-60中的位置解析差异的 绘图;
[0068] 图23和图24是通过该方法的实施例5中分别针对两簇和三簇数据集的比对相似 性得分上的邻近连接形成的树图;
[0069] 图25至图27是与针对实施例5中的每一个识别簇的最终比对数据一致的标记的 曲线图;
[0070] 图28和图29是实施例5中分别针对两簇和三簇实验分类的直方图;
[0071] 图30是通过该方法的实施例6中的比对相似性得分上的邻近连接形成的树图;以 及
[0072]图31是与针对实施例6中的三个片段的每一个的数据最终比对一致的标记的曲 线图。

【具体实施方式】
[0073] 可以应用的聚合物如下。
[0074] 聚合物可以是生物聚合物。聚合物可以是天然的或合成的。聚合物可以是多核苷 酸(或核酸)、多肽如蛋白质、多糖、或任何其他聚合物。在多肽的情况下,聚合物单元可以 是天然存在或合成的氨基酸。在多糖的情况下,聚合物单元可以是单糖。
[0075] 可以应用的多核苷酸如下。
[0076] 多核苷酸如核酸是包含两种或更多种核苷酸的大分子。多核苷酸或核酸可以包括 任何核苷酸的任何组合。核苷酸可以是天然存在的或人造的。靶多核苷酸中的一种或更多 种核苷酸可以被氧化或甲基化。靶多核苷酸中的一种或更多种核苷酸可以被损坏。靶多核 苷酸中的一种或更多种核苷酸可以例如用标签或标记修饰。靶多核苷酸可以包括一个或更 多个间隔。
[0077] 核苷酸通常包含核碱基、糖和至少一个磷酸根基团。核碱基通常是杂环的。核碱基 包括但不限于,嘌呤和嘧啶,并且更具体的是腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶和胞嘧啶。 糖通常是戊糖。核苷酸糖包括但不限于,核糖和脱氧核糖。核苷酸通常是核糖核苷酸或脱 氧核糖核苷酸。核苷酸通常包括单磷酸酯、二磷酸酯或三磷酸酯。磷酸酯可以连接在核苷 酸的5'或3'侧上。
[0078]核苷酸包括但不限于,腺苷一磷酸(AMP)、腺苷二磷酸(ADP)、腺苷三磷酸(ATP)、 鸟苷一磷酸(GMP)、鸟苷二磷酸(⑶P)、鸟苷三磷酸(GTP)、胸苷一磷酸(TMP)、胸苷二磷酸 (TDP)、胸苷三磷酸(TTP)、尿苷一磷酸(UMP)、尿苷二磷酸(UDP)、尿苷三磷酸(UTP)、胞苷 一磷酸(CMP)、胞苷二磷酸(⑶P)、胞苷三磷酸(CTP)、5_甲基胞苷一磷酸、5-甲基胞苷二磷 酸、5-甲基胞苷三磷酸、5-羟甲基胞苷一磷酸、5-羟甲基胞苷二磷酸、5-羟甲基胞苷三磷 酸、环腺苷一磷酸(cAMP)、环鸟苷一磷酸(cGMP)、脱氧腺苷一磷酸(dAMP)、脱氧腺苷二磷 酸(dADP)、脱氧腺苷三磷酸(dATP)、脱氧鸟苷一磷酸(dGMP)、脱氧鸟苷二磷酸(dGDP)、脱 氧鸟苷三磷酸(dGTP)、脱氧胸苷一磷酸(dTMP)、脱氧胸苷二磷酸(dTDP)、脱氧胸苷三磷酸 (dTTP)、脱氧尿苷一磷酸(dUMP)、脱氧尿苷二磷酸(dUDP)、脱氧尿苷三磷酸(dUTP)、脱氧胞 苷一磷酸(dCMP)、脱氧胞苷二磷酸(d⑶P)以及脱氧胞苷三磷酸(dCTP)、5_甲基-2'-脱 氧胞苷一磷酸、5-甲基-2'-脱氧胞苷二磷酸、5-甲基-2'-脱氧胞苷三磷酸、5-羟甲 基-2'-脱氧胞苷一磷酸、5-羟甲基-2'-脱氧胞苷二磷酸以及5-羟甲基-2'-脱氧 胞苷三磷酸。核苷酸优选选自AMP、TMP、GMP、UMP、dAMP、dTMP、dGMP、或dCMP。核苷酸可以 是无碱基的(即,缺乏核碱基)。核苷酸可以包括其他修饰。特别地,合适的修饰的核苷 酸包括但不限于,2'-氨基嘧啶(如,2'-氨基胞苷和2'-氨基尿苷)、2'-羟基嘌呤 (如,2'-氟嘧啶(如,2'-氟胞苷和2'-氟尿苷)、羟基嘧啶(如,5' -a-P-borano 尿苷)、2' -0-甲基核苷酸(如,2' -0-甲基腺苷、2' -0-甲基鸟苷、2' -0-甲基胞苷和 2' -0-甲基尿苷)、4'-硫代嘧啶(如,4'-硫代尿苷和4'-硫代胞苷)以及核苷酸具 有核碱基的修饰(如,5-戊炔基-2脱氧尿苷、5-(3-氨基丙基)-尿苷和1,6-二氨基己 基-N-5-氨基甲酰基甲基尿苷)。
[0079] 核苷酸可以是无碱基的(S卩,缺乏核碱基)。
[0080]多核苷酸可以是单链或双链。多核苷酸可以包括一种或更多种双链区域以及一种 或更多种单链区域。多核苷酸可以是核酸,如脱氧核糖核酸(DNA)或核糖核酸(RNA)。靶多 核苷酸可以包括杂交至DNA的一条链的RNA的一条链。多核苷酸可以是本领域中已知的任 何合成核酸,如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁定的核酸(LNA)或具有核 苷酸侧链的其他合成聚合物。
[0081]使用该方法可以表征全部或仅部分的靶多核苷酸。靶多核苷酸可以是任何长度。 例如,多核苷酸的长度可以是至少10、至少50、至少100、至少150、至少200、至少250、至少 300、至少400、或至少500个核苷酸对。多核苷酸的长度可以是1000或更多个核苷酸对、 5000或更多个核苷酸对,或长度是100000或更多个核苷酸对。
[0082]靶多核苷酸存在于任何合适的样品中。本发明通常在已知包括或疑似包括靶多核 苷酸的样品上进行。可替换地,本发明可以在样品上进行以确认它们在样品中的存在是已 知或期望的一种或更多种靶多核苷酸的特性。
[0083]可以研究的样品如下。
[0084]样品可以是生物样品。本发明可以在从任何生物或微生物获得或提取的样品上体 外进行。生物或微生物通常是古生物、原核生物或真核生物,并且通常属于五界之一:植物 界、动物界、真菌界、原核生物界和原生生物界。本发明可以在从任何病毒获得或提取的样 品上体外进行。样品优选是流体样品。样品的原始状态可以是固体或半固体,其随后被处理 以提供流体样品。这种的实例是排泄物、皮肤、组织、毛发、骨和肌肉。样品通常包括患者的 体液。样品可以选自例如尿、血液、血浆、血清、淋巴液、唾液、间隙液、泪液、粘液或羊水。通 常,样品是人源的,但可替换地,其可以来自其他哺乳动物,如来自商业农场动物,如马、牛、 绵羊或猪,或可以可替换地是宠物,如猫或狗。可替换地,植物来源的样品通常从以下获得: 经济作物,如谷类、豆类、水果或蔬菜,例如,小麦、大麦、燕麦、芸苔、玉米、大豆、水稻、香蕉、 苹果、西红柿、土豆、葡萄、烟草、黄豆、扁豆、甘蔗、可可、棉花。
[0085]样品可以是非生物样品。非生物样品优选是流体样品。非生物样品的实例包括手 术流体,水如饮用水、海水或河水,以及工业样品,如用于实验室试验的试剂、从聚合物试剂 的合成获得的样品。
[0086] 通常在测定之前处理样品,例如,通过离心法或通过经过过滤掉不想要的分子或 细胞如红血细胞的膜。样品可以在被取出时立即测量。在测定之前,样品通常还可以被储 存,优选地,在-70°C以下。
[0087] 还可以对样品进行在US 61/490860中提出的任何处理、设计或修饰。
[0088] 可以用在测量系统中的膜如下。
[0089] 根据本发明,可以使用任何膜。合适的膜在本领域中众所周知。膜优选是两亲性 层。两亲性层是由两亲性分子如磷脂形成的层,其具有亲水性和亲油性。两亲性层可以是 单层或双层。膜可以是共嵌段聚合物如由(Gonzalez-Perez et al.,Langmuir, 2009, 25,1 0447-10450)所公开的。
[0090] 膜可以是脂双层。脂双层是细胞膜的模型,并且对于一系列实验研究起优异平台 的作用。例如,通过单通道记录,脂双层可以用于膜蛋白的体外研究。可替换地,脂双层可 以用作生物传感器以检测一系列物质的存在。合适的两亲性层包括但不限于,平面脂双 层、支撑双层或脂质体。脂双层优选是平面脂双层。国际申请号PCT/GB08/000563(以WO 2008/102121公开)、国际申请号PCT/GB08/004127(以WO 2009/077734公开)以及国际申 请号PCT/GB2006/001057(以2006/100484公开)中公开了合适的脂双层。
[0091] 用于形成脂双层的方法在本领域中是已知的。实施例中公开了合适的方法。通常 通过 Montal 和 Mueller 的方法(Proc. Natl. Acad. Sci. USA.,1972 ;69:3561-3566)形成脂 双层,其中,在穿过垂直于界面的孔的任一侧的水溶液/空气界面上形成脂单层。
[0092] Montal和Mueller的方法普遍使用,因为该方法是形成适合蛋白孔插入的良好质 量的脂双层的具有成本效益并且相对直接的方法。双层形成的其他常见方法包括尖部浸 渍、涂漆双层以及脂质体双层的膜片夹紧。
[0093] 在一个优选的实施方式中,如在国际申请号PCT/GB08/004127 (以WO 2009/077734公布)中所描述的形成两亲性层。
[0094]在另一个优选的实施方式中,膜是固态层。固态层不是生物起源。换句话说,固 态层不是获得自或分离自生物环境,如生物或细胞,或生物可获得结构的合成制造版本。 可以从包括但不限于以下的有机或无机物质形成固态层:微电子材料,绝缘材料如Si 3N4、 Al2O3以及SiO,有机和无机聚合物如聚酰胺,塑料如Teflon?或弹性体如双组分加成固化 硅橡胶,以及玻璃。固态层可以由单原子层如石墨、或仅几个原子厚度的层形成。国际申请 号PCT/US2008/010637(以WO 2009/035647公开)中公开了合适的石墨层。固态膜还可 以支撑由生物材料获得的纳米孔,Hall等(Nat Nanotechnol. 2010 Dec ;5 (12) : 874-7)和 Bell 等(Nano Lett.2012 Janll;12(l):512-7)以及国际申请号 PCT/US2011/039621(以 W0/2012/005857公开)已经公开了非限制性实例。
[0095]该方法通常使用(i)包括孔的人造两亲性层,(ii)包括孔的分离的、天然存在的 两亲性层;或(iii)具有插入在其中的孔的单元来进行。该方法优选使用人造两亲性层来 进行。双层可以包括除了孔之外的其他跨膜和/或膜内蛋白以及其他分子。以下讨论了合 适的装置和条件。本发明的方法通常在体外进行。
[0096] 可以应用的纳米孔如下。
[0097] 测量系统包括纳米孔。在聚合物通过纳米孔的易位过程中进行测量。聚合物通过 纳米孔的易位产生可以观察到的测量性能中的特性信号,并且可以整体被称为"事件"。[0098] 纳米孔是通常具有广泛地说纳米级的尺寸的孔,其允许聚合物通过其中。在此,提 及"孔"是指该意义上的纳米孔。
[0099] 纳米孔可以是生物孔或固态孔。
[0100] 固态孔通常是固态层中的孔。固态孔可以与提供聚合物的替换或附加测量的其他 组件如隧道电极(Ivanov AP et al.,Nano Lett. 2011 Janl2;ll(l):279-85),或场效应晶 体管(FET)器件(国际申请WO 2005/124888)结合使用。可以通过包括例如WO 00/79257 中描述的那些的已知方法形成固态孔。
[0101] 纳米孔优选是跨膜蛋白孔。跨膜蛋白孔是允许水合离子从膜的一侧流向膜的另一 侧的多肽或多肽集合。在本发明中,跨膜蛋白孔能够形成允许通过施加的电压驱动的水合 离子从膜的一侧流向另一侧的孔。跨膜蛋白孔允许聚合物如DNA或RNA通过孔移动。
[0102]跨膜蛋白孔可以是单体或低聚物。孔优选由几个重复亚基如6、7或8个亚基组成。 孔更优选是七聚体或八聚体孔。
[0103] 跨膜蛋白孔通常包括通过其离子可以流动的桶或通道。孔的亚基通常围绕中心轴 并且有助于与跨膜0桶或通道或跨膜a螺旋束或通道成链。
[0104] 跨膜蛋白孔的桶或通道通常包括促进与分析物如聚合物、核苷酸、多核苷酸或核 酸的相互作用的氨基酸。这些氨基酸优选位于桶或通道的收缩部附近。跨膜蛋白孔通常包 括一种或更多种带正电荷的氨基酸,如精氨酸、赖氨酸或组氨酸,或芳香族氨基酸,如酪氨 酸或色氨酸。这些氨基酸通常促进孔和聚合物、核苷酸、多核苷酸或核酸之间的相互作用。
[0105] 根据本发明使用的跨膜蛋白孔可以获得自P桶孔或a螺旋束孔。0桶孔包括桶 或由P链形成的通道。合适的P桶孔包括但不限于,a-毒素,如a-溶血素、炭疽毒素和 杀白细胞素,以及细菌的外膜蛋白/孔蛋白,如耻垢分枝杆菌孔蛋白(Msp),例如,MspAJF 膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷脂酶A以及奈瑟球菌属(Neisseria)自转 运脂蛋白脂蛋白(NalP)。a-螺旋束孔包含由a-螺旋形成的桶或通道。合适的a-螺旋 束孔包括但不限于,内膜蛋白和外膜蛋白,如WZA和ClyA毒素。跨膜孔可以获得自Msp或 获得自a _溶血素(a -HL)。
[0106] 跨膜蛋白孔优选获得自Msp,优选地,获得自MspA。这种孔将是低聚物并且通常包 括获得自Msp的7、8、9或10个单体。孔可以是获得自包括相同单体的Msp的同源低聚孔。 可替换地,孔可以是获得自包括不同于其他的至少一种单体的Msp的杂低聚孔。优选地,孔 获得自MspA或其同系物或横向同源物(paralog)。
[0107] 获得自Msp的单体包括SEQ ID NO: 2中示出的序列或其变体。SEQ ID NO: 2是MspA 单体的MS-(B1)8突变体。它包括以下突变:090队09謂、093队01181?、01341?和£1391(。5£〇 ID N0:2的变体是具有不同于SEQ ID N0:2并且保留其形成孔的能力的氨基酸序列的多肽。 可以使用本领域中已知的任何方法测定变体形成孔的能力。例如,可以随同其他适当的亚 基一起将变体插入脂双层中,并且可以测定其寡聚化以形成孔的能力。用于将亚基插入膜 如脂双层中的方法在本领域中是已知的。例如,亚基可以以纯化形式悬浮在包含脂双层的 溶液中,使得其扩散至脂双层并且通过结合至脂双层并且组装成功能状态而插入。可替换 地,可以使用 M. A. Holden, H. Bayley. J. Am. Chem. Soc. 2005, 127, 6502-6503 和国际申请号 PCT/GB2006/001057(以 TO 2006/100484 公开)中描述的"拾取放置(pick and place)" 方法将亚基直接插入膜中。
[0108]在SEQ ID NO: 2的整个氨基酸序列长度上,基于氨基酸一致性,变体将优选与该序 列至少50%同源。更优选地,基于氨基酸一致性,变体可以与SEQ ID NO: 2的氨基酸序列在 整个序列上至少55 %、至少60 %、至少65 %、至少70 %、至少75 %、至少80 %、至少85 %、至 少90%,并且更优选至少95%、97%或99%同源。在100或更多,例如125、150、175或200 或更多个连续氨基酸的延伸中,可以存在至少80 %,例如至少85 %、90 %或95 %的氨基酸 一致性("硬同源性")。
[0109] 本领域中的标准方法可以用于确定同源性。例如,UWGCG软件包提供了可以用于 计算同源性的BESTFIT程序(例如,使用它的默认设置)(Devereux et al(1984)Nucleic Acids Research 12,p387-395)。例如,如 Altschul S.F. (1993)J Mol Evol 36:290-300; Altschul,S, F et al (1990) J Mol Biol 215:403-10 中描述的,PILEUP 和 BLAST 算法可以 用于计算同源性或对序列进行比对(如,识别等价残基或相应的序列(通常,使用它们的默 认设置))。用于进行BLAST分析的软件公众可以从美国国家生物技术信息中心(National Center for Biotechnology Information) (http://www. ncbi. nlm. nih. gov/)获得。
[0110] SEQ ID NO: 2是MspA单体的MS-(BI) 8突变体。变体可以包括与MspA相比较的 1^8、(:或0单体中的任何突变。]\^8、(:和0的成熟形式示出在5£〇10勵 :15至17中。特 别地,变体可以包括存在于MspB中的以下取代:A138P。变体可以包括存在于MspC中的一 种或更多种以下取代:A96G、N102E和A138P。变体可以包括存在于MspD中的一种或更多种 以下突变:缺失 Gl、L2V、E5Q、L8V、D13G、W21A、D22E、K47T、I49H、I68V、D91G、A96Q、N102D、 S103T、V104I、S136K和G141A。变体可以包括一种或更多种突变和来自Msp B、C以及D的 取代的组合。变体可以包括突变L88N。除了 MS-Bl的所有突变之外,SEQ IDN0:2的变体具 有突变L88N,并且被称为MS-B2。用于本发明中的孔可以是MS- (B2) 8或MS- (B2C) 8。
[0111] 除了以上所讨论的那些,可以对SEQ ID N0:2的氨基酸序列进行氨基酸取代,例如 最高达1、2、3、4、5、10、20或30个取代。保守取代用相似化学结构、相似化学性能或相似侧 链体积的其他氨基酸代替氨基酸。引入的氨基酸可以与它们替换的氨基酸具有相似的极 性、亲水性、疏水性、碱性、酸性、中性或电荷。可替换地,保守取代可以引入芳香族或脂肪族 的其他氨基酸以替代之前存在的芳香族或脂肪族氨基酸。保守氨基酸变化在本领域中众所 周知并且可以根据以下表2中限定的20种主要氨基酸的性能进行选择。在氨基酸具有相 似的极性时,这还可以通过参考表3中的氨基酸侧链的疏水尺度来确定。
[0112] 表2-氨基酸的化学性能:
[0113]

【权利要求】
1. 一种分析聚合物通过纳米孔的易位过程中进行的聚合物的时序系列测量的方法,其 中,所述测量取决于所述纳米孔中的k链节的特性,k链节是所述聚合物的k个聚合物单元, 其中,k是正整数,所述方法包括: 从所述系列测量得出代表所述测量的特性的时序特征的特征向量;以及 测定所述得出的特征向量和至少一种其他特征向量之间的相似性。
2. 根据权利要求1所述的方法,其中,所述至少一种其他特征向量是在至少一个类别 方面储存在存储器中的至少一种其他特征向量。
3. 根据权利要求2所述的方法,其中,根据待测量的聚合物,选择储存在所述存储器中 的所述至少一种其他特征向量。
4. 根据权利要求2或3所述的方法,其中,储存在所述存储器中的所述至少一种其他特 征向量包括由片段的所述特征向量构成的共同聚合物的总体特征向量。
5. 根据权利要求2至4中任一项所述的方法,其中,所述测定相似性的步骤包括测定全 部或部分所述得出的特征向量和储存在所述存储器中的全部所述至少一种其他特征向量 之间的相似性。
6. 根据权利要求2至4中任一项所述的方法,其中,所述测定相似性的步骤包括测定全 部或部分所述得出的特征向量所述得出的特征向量和储存在所述存储器中的部分的所述 至少一种其他特征向量之间的相似性。
7. 根据权利要求2至6中任一项所述的方法,进一步包括根据所测定的相似性,将所述 得出的特征向量由其得出的所述聚合物分类为属于所述类别。
8. 根据权利要求1所述的方法,其中,所述至少一种其他特征向量是使用相同方法得 出的特征向量。
9. 根据权利要求8所述的方法,其中,所述至少一种其他特征向量是使用相同方法得 出的多个其他特征向量,并且所述方法进一步包括根据所述特征向量的重叠部分的相似 性,识别从作为共同聚合物的片段的聚合物得出的特征向量。
10. 根据权利要求8所述的方法,进一步包括从所识别片段的所述特征向量构成所述 共同聚合物的总体特征向量。
11. 根据权利要求8所述的方法,其中,所述至少一种其他特征向量是使用相同方法得 出的多个其他特征向量,并且所述方法进一步包括将相似特征向量的簇识别为一类以及将 所述特征向量由其得出的所述聚合物分类为属于识别类。
12. 根据权利要求7或11所述的方法,进一步包括计数属于不同类别的特征向量的数 目。
13. 根据权利要求7、11或12所述的方法,进一步包括识别局部区域,其中,所述得出的 特征向量不同于在所述聚合物被分类为属于其的所述类别的特征向量。
14. 根据权利要求1所述的方法,其中,所述至少一种其他特征向量包括储存在存储器 中的特征向量,并且所述测定相似性的步骤包括测定其中所述得出的特征向量不同于储存 在所述存储器中的所述至少一种其他特征向量的局部区域。
15. 根据前述权利要求中任一项所述的方法,其中: 连续测量组取决于对于每个组不同的各个k链节,以及 所述得出特征向量的步骤包括识别连续测量组,并且,对于每个组,得出代表所述组的 所述测量的特性的一种或多种特征的值。
16. 根据前述权利要求中任一项所述的方法,其中,所述特征包括: 所述测量组的平均值; 所述测量组的周期; 所述测量组的偏差; 不对称信息; 所述测量的可靠性信息; 所述测量组的分布;或 它们的任何组合。
17. 根据前述权利要求中任一项所述的方法,其中,所述测量是电气测量。
18. 根据前述权利要求中任一项所述的方法,其中,所述测量包括测量通过所述纳米孔 的离子电流。
19. 根据权利要求18所述的方法,其中,所述测量进一步包括测量除了离子电流之外 的至少一种其他性能。
20. 根据权利要求19所述的方法,其中,所述至少一种其他性能的测量包括FET测量、 光学测量、或两者。
21. 根据前述权利要求中任一项所述的方法,其中,所述聚合物是生物聚合物。
22. 根据前述权利要求中任一项所述的方法,其中,所述聚合物是多核苷酸,并且所述 聚合物单元是核苷酸。
23. 根据前述权利要求中任一项所述的方法,其中,所述纳米孔是生物孔。
24. 根据前述权利要求中任一项所述的方法,其中,所述聚合物通过所述纳米孔的所述 易位以其中用所述纳米孔记录连续的k链节的棘轮方式进行。
25. 根据前述权利要求中任一项所述的方法,其中,通过分子棘轮控制所述聚合物的所 述易位。
26. 根据权利要求25所述的方法,其中,所述分子棘轮是聚合物结合蛋白。
27. 根据前述权利要求中任一项所述的方法,进一步包括: 使所述聚合物易位通过纳米孔;以及 进行所述聚合物的连续系列测量。
28. -种评价靶聚合物的存在、不存在或量的方法,所述方法包括: 使聚合物易位通过纳米孔; 进行所述聚合物的连续系列测量; 使用根据权利要求1至26中任一项所述的方法分析所述系列测量;以及 根据所述分析,评价靶聚合物的存在、不存在或量。
29. 根据权利要求28所述的方法,其中,所述聚合物包括两种或更多种聚合物的混合 物,并且测定一种或多种聚合物的相对量。
30. -种评价聚合物分析物中靶聚合物的存在、不存在或量的方法,所述方法包括: 将所述聚合物分析物破碎成多个聚合物;以及 在所述破碎的聚合物上进行根据权利要求28或29所述的方法。
31. 根据权利要求30所述的方法,其中,所述聚合物是多核苷酸,并且所述聚合物单元 是核苷酸,并且其中,通过限制性酶破碎所述聚合物分析物。
32. 根据权利要求28至31中任一项所述的方法,其中,在没有评价所述聚合物的聚合 物单元的整个序列的情况下测定聚合物的存在、不存在或量。
33. -种测定聚合物中的改变的方法,包括: 在一段时期内,使聚合物反复地易位通过纳米孔; 在每一次易位过程中,进行所述聚合物的连续系列测量;以及 使用根据权利要求1至26中任一项所述的方法,分析每个系列测量,其中,所述测定所 述得出的特征向量和至少一种其他特征向量之间的相似性的步骤包括:(a)测定从每个系 列测量得出的所述得出的特征向量和相同的至少一种其他特征向量之间的相似性,或(b) 测定从所述系列测量得出的所有所述得出的特征向量之间的相似性。
34. 根据权利要求28至33中任一项所述的方法,其中,所述聚合物是多核苷酸,并且所 述聚合物单元是核苷酸,并且所述方法用于测定修饰碱基或点突变的存在。
35. 根据权利要求28至34中任一项所述的方法,用于指导治疗或诊断。
36. -种能够由计算机装置执行并且配置执行以进行根据前述权利要求中任一项所述 的方法的计算机程序。
37. -种配置以进行根据权利要求1至35中任一项所述方法的分析装置。
38. -种诊断装置,包括: 根据权利要求37的分析装置;以及 包括聚合物能够通过其易位的纳米孔的测量系统,所述测量系统被布置为在易位过程 中进行所述聚合物的连续系列测量。
【文档编号】C12Q1/68GK104321441SQ201380020403
【公开日】2015年1月28日 申请日期:2013年2月18日 优先权日:2012年2月16日
【发明者】斯图尔特·威廉·里德, 詹姆斯·安东尼·克拉克, 詹姆斯·怀特, 加文·哈珀 申请人:牛津楠路珀尔科技有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1