突变胞溶素孔的制作方法

文档序号:467451阅读:300来源:国知局
突变胞溶素孔的制作方法
【专利摘要】本发明涉及胞溶素的突变体形式。本发明还涉及使用胞溶素来表征分析物。
【专利说明】突变胞溶素孔

【技术领域】
[0001] 本发明涉及的胞溶素(Iysenin)的突变体形式。本发明还涉及使用胞溶素的突变 体形式进行的分析物表征。

【背景技术】
[0002] 纳米孔感测是一种依靠对分析物分子和受体之间的单个结合或相互作用事件的 观察进行检测的方法。纳米孔传感器可以通过在绝缘膜中放置纳米尺寸的单个孔并在分析 物分子存在下测量在电压驱动下穿过孔进行离子传输而建立。分析物的相似性(identity) 是通过其独特的电流信号而揭示,特别是电流模块(current block)的持续时间和程度以 及电流水平的变化。
[0003] 目前需要能在广泛范围内应用的快速且廉价的核酸(例如DNA或RNA)测序技术。 现有的技术缓慢且昂贵,主要是因为它们依赖于扩增技术来生产大体积核酸并需要大量专 门的荧光化学物质进行信号检测。纳米孔感测具有能够通过减少所需的核苷酸和试剂的量 来提供快速且廉价的核酸测序的潜力。
[0004] 使用纳米孔感测测序核酸的两个主要要素为(1)控制核酸穿过孔的运动和(2)随 着核酸聚合物运动穿过所述孔识别核苷酸。在过去,为了实现对核苷酸的识别,使核酸穿过 溶血素的突变体。这提供的电流信号经证明具有序列依赖性。其还证明了,当使用溶血素 孔时,需要大量的核苷酸以使观察到的电流增加,这使得对所观察的电流与多核苷酸之间 的直接相关性受到质疑。
[0005] 虽然用于核苷酸识别的电流范围已通过溶血素孔的突变得到改进,但是如果核苷 酸之间的电流差异能够被进一步改善的话,测序系统将具有更高的性能。此外,已观察到, 当核酸移动穿过孔时,一些电流状态显示较高的差异。还表明,一些溶血素孔突变体比其他 溶血素孔突变体具有更高的差异。虽然这些状态的差异可能包含序列的特异性信息,但是 希望的是能产生具有较低差异的孔以简化系统。还希望减少使观察到的电流增加的核苷酸 的数量。
[0006] 胞溶素(也被称为efLl)是一种来自蚯蚓赤子爱胜蚓(Eisenia fetida)的体腔 液的经纯化的孔形成毒素(pore-forming toxin)。其特异性结合到鞘磷脂,从而抑制胞溶 素诱导的溶血作用(Yamaji等人,J. Biol. Chem. 1998 ;273 (9) :5300-6)。胞溶素的晶体结构 在 De Colbis 等人,Structure, 2012 ;20:1498 - 1507 中有公开。


【发明内容】

[0007] 出人意料地,本发明人识别出了胞溶素单体内的一个区域,该区域可被修饰为用 以改变该单体和多核苷酸之间的相互作用。该区域对应于SEQ IDN0:2的约44位点到约 126位点。本发明涉及这样的突变体单体:在其中对所述识别出的区域进行一个或多个修 饰以改善所述突变体单体与多核苷酸相互作用的能力。出人意料地,本发明人还证实了,含 有该新的突变体单体的孔具有增强的与多核苷酸相互作用的能力,并因此显示出提高的用 以评估多核苷酸特征如序列特征的性能。出人意料地,所述突变体孔显示出提高的核苷酸 识别能力。特别是,出人意料地,所述突变体孔显示出增加的电流范围,这使得更容易区分 不同核苷酸,并且显示出减少的状态变化,这提高了信噪比。此外,减少了在多核苷酸移动 穿过孔时使电流增加的核苷酸的数目。这使得更容易确定多核苷酸移动穿过所述孔时所观 察到的电流与所述多核苷酸之间的直接关系。
[0008] 因此,本发明提供了一种包含SEQ ID NO:2中所示序列的变体的突变体胞溶素单 体,其中所述单体能够形成孔并且其中所述变体在SEQ ID NO: 2的约44位点到约126位点 的区域内包含一个或多个修饰,所述修饰能改变所述单体与多核苷酸相互作用的能力。
[0009] 本发明还提供:
[0010] -一种构造,包含两个或多个共价连接的源自胞溶素的单体,其中所述单体中的至 少一个为本发明的突变体胞溶素单体;
[0011] - 一种多核苷酸,其编码本发明的突变体胞溶素单体或本发明的基因融合的构造 (genetically fused construct);
[0012] -一个源自胞溶素的同源寡聚孔,包含足够数目的本发明的突变体胞溶素单体;
[0013] -一个源自胞溶素的异源寡聚孔,包含至少一个本发明的突变体胞溶素单体;
[0014] - 一种孔,包含至少一个本发明的构造;
[0015] - 一种表征目标分析物的方法,包括:(a)使目标多核苷酸与本发明的孔接触,使 得目标多核苷酸移动穿过所述孔;和(b)在分析物相对于所述孔移动时获取一个或多个 测量值,其中所述测量值表示所述目标分析物的一个或多个特征并由此表征所述目标分析 物;
[0016] --种形成表征目标多核苷酸用传感器的方法,包括在本发明的孔和多核苷酸结 合蛋白之间形成复合体,并由此形成用于表征目标多核苷酸的传感器;
[0017] --种用于表征目标多核苷酸的传感器,包括在本发明的孔和多核苷酸结合蛋白 之间的复合体;
[0018] -本发明的孔在表征目标分析物中的应用;
[0019] -用于表征目标多核苷酸的试剂盒,包括(a)本发明的孔和(b)多核苷酸结合蛋 白;
[0020] --种用于表征样本中目标多核苷酸的设备,包括(a)多个本发明的孔和(b)多个 多核苷酸结合蛋白;
[0021] -一种提高含SEQ ID N0:2中所示序列的胞溶素单体用于表征多核苷酸的能力的 方法,包括在SEQ ID NO: 2的约44位点到约126位点的区域内进行一个或多个修饰,所述修 饰会改变所述单体与多核苷酸相互作用的能力并且不影响所述单体用于形成孔的能力;
[0022] --种制备本发明的构造的方法,包括将至少一个本发明的突变体胞溶素单体共 价连接到一个或多个源自胞溶素的单体;和
[0023] --种形成本发明孔的方法,包括使至少一个本发明突变体单体或至少一个本发 明构造与足够数目的本发明单体、本发明构造或源自胞溶素的单体进行寡聚用以形成孔。

【专利附图】

【附图说明】
[0024] 图1显示了使用解旋酶(标记为A)控制DNA移动穿过胞溶素纳米孔(标记为B) 的示例图。1)将单链DNA底物与含有胆固醇标签(标记为D)的退火引物添加到双分子层 (标记为C)的顺侧(标记为X)。所述胆固醇标签结合到所述双分子层,使所述底物富集在 所述双分子层表面处。2)被加成到顺侧隔室(compartment)的解旋酶结合到所述DNA。在 二价金属离子和NTP底物的存在下,所述解旋酶沿着所述DNA运动(灰色箭头)。3)在施加 的电压下,纳米孔通过DNA上的前导区部分捕获所述DNA底物。在施加的电势的力的作用 下,所述DNA被牵拉穿过所述孔直到结合在所述DNA上的解旋酶与所述孔的顶部接触,防止 进一步的不受控的DNA移位。在该过程中,双链DNA部分(例如引物)被去除。所述解旋酶 沿着所述DNA以3'到5'的方向运动并逆着所施加的电场将螺旋状(threaded)DNA(DNA的 运动方向用黑色箭头示出)牵拉出所述孔。4)所述解旋酶将所述DNA牵拉出所述纳米孔, 从而将所述DNA供回到所述顺式隔室。穿过所述纳米孔的DNA的最后部分为所述5' -前 导区。5)当所述解旋酶将所述DNA移出所述纳米孔后,所述解旋酶被释放回所述顺侧隔室 中。替代地,如果所述DNA 3'端被捕获,则所述DNA将在3' -5'解旋酶的控制下从顺侧移 动穿过所述孔到达反侧(标记为Y),从而最终在双分子层的反侧上离开。
[0025] 图2显示了实施例1,2, 3, 4, 5和6中所使用的DNA底物设计。所述DNA底物由 PhiX(SEQ ID NO: 13,标记为A)中单链DNA的一 400碱基部分与一 50T 5'-前导区(由链 A虚线区域表示)组成。在50T前导区后退火到该链的是含有3'胆固醇标签(标记为C) 的引物(标记为B),以使使DNA富集在所述双分子层的表面上并由此提高捕获效率。
[0026] 图3显示了插入到DPhPC双分子层中的野生型胞溶素孔的电流轨迹(对于A和B, y轴=电流(pA),x轴=时间(min))。A)显示了在不存在DNA和解旋酶的情况下在+120mV 下观察到约+280pA的稳定开孔(open-pore)电流(625mM KCl, IOOmM Hepes (4-轻乙基哌 嗪乙磺酸),pH 8.0, 75mM亚铁氰化钾(II),25mM铁氰化钾(III) ,IOmM MgCl2,野生型胞溶 素 (SEQ ID勵:2))。抝显示了在添加 DNA、解旋酶和ATP的情况下(0. 3nM 400mer DNA(SEQ IDN0:13和14),Hel308Mbu,(100nM,SEQIDN0:15),lmMATP),没有明显的DNA捕获,并且 没有解旋酶控制的DNA移动穿过所述纳米孔。
[0027] 图4显示了 Hel308Mbu(SEQ ID N0:15)能够以受控的方式移动DNA穿过胞溶素纳 米孔(胞溶素-E84D/E85K,具有突变E84D/E85K的SEQ ID NO: 2),从而随着所述DNA移动 穿过所述纳米孔电流产生逐步的变化。A)显示了 DNA捕获和Hel308Mbu控制的400merDNA 运动的示例性电流轨迹(y轴=电流(pA), X轴=时间(min)),从?400pA的开孔水平观察 到较低的在?200pA下的电流模块(180mV,625mM KCl,100mM H印es pH 8.0,75mM亚铁氰化 钾(II),25mM铁氰化钾,0·3nM 400merDNA(SEQIDN0:13和14),100nMHel308Mbu(SEQID N0:15), ImM ATP, IOmM MgCl2,胞溶素-E84D/E85K (具有突变 E84D/E85K 的 SEQ ID N0:2))。 图中星号表示解旋酶控制的DNA移动。在施加的电势下,结合有解旋酶的DNA被胞溶素纳 米孔捕获。这得到从开孔水平(?400pA)到DNA水平(?220pA)的电流模块。B)显示 了上图轨迹中所述解旋酶控制的DNA移动的放大图(y轴=电流(pA), X轴=时间(min))。 所述DNA水平显示出随着所述酶移动DNA穿过所述孔电流是逐步变化的。
[0028] 图5显示了 Hel308Mbu(SEQ ID N0:15)能以受控方式移动DNA穿过胞溶素纳米 孔(胞溶素-E92N/E94N/E97N/D121N/D126N,具有突变 E92N/E94N/E97N/D121N/D126N 的 SEQ ID N0:2),从而在随着DNA移动穿过所述纳米孔电流产生逐步变化。A)显示了典型 的Hel308Mbu控制400mer DNA移动的示例电流轨迹(y轴=电流(pA),x轴=时间(min)) (120mV,625mM KCl,100mM H印es pH 8.0,75mM 亚铁氰化钾(II),25mM 铁氰化钾,0·3ηΜ 400merDNA(SEQIDN0:13和14),100nMHel308Mbu(SEQIDN0:15),lmMATP,10mMMgCl 2, 胞溶素-E92N/E94N/E97N/D121N/D126N(具有突变E92N/E94N/E97N/D121N/D126N的SEQID NO: 2))。在施加的电势下,DNA被胞溶素纳米孔捕获。该胞溶素突变体显示出高水平的DNA 捕获vs. WT胞溶素。在所述孔中被捕获的DNA产生从开孔水平(?280pA)到DNA水平(? IlOpA)的电流模块。结合有解旋酶的DNA在所述酶移动DNA穿过所述孔时显示出逐步变化 的电流。将解旋酶控制的DNA移动由星号标出。B)为上图轨迹中典型的解旋酶控制的DNA 移动中的一个的放大图(y轴=电流(pA), X轴=时间(min))。所述DNA水平显示出随着所 述酶移动DNA穿过所述孔电流是逐步变化的。
[0029] 图6显示了 Hel308Mbu(SEQ ID NO: 15)能以受控方式移动DNA穿过胞溶素纳米孔 (胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A,具有突变 E84Q/E85K/E92Q/E97S/D126G/ E167A的SEQ ID NO: 2),从而在随着DNA移动穿过所述纳米孔电流产生逐步变化。A)显示 了典型的He 1308Mbu控制的DNA移动的示例电流轨迹(y轴=电流(pA),X轴=时间(min)) (180mV, 625mM KCl, IOOmM H印es pH 8. 0, 75mM 亚铁氰化钾(II),25mM 铁氰化钾,0· 6nM 400merDNA(SEQIDN0:13和14),100nMHel308Mbu(SEQIDN0:15),lmMATP,10mMMgCl 2, 胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A (具有突变 E84Q/E85K/E92Q/E97S/D126G/ E167A的SEQ ID N0:2))。在施加的电势下,DNA被胞溶素纳米孔捕获。该胞溶素突变体显示 出高水平的DNA捕获vs. WT胞溶素。在所述孔中被捕获的DNA产生从开孔水平(?390pA) 到DNA水平(?200pA)的电流模块。结合有解旋酶的DNA显示出随着所述酶移动DNA穿 过所述孔电流是逐步变化的。将解旋酶控制的DNA移动由星号标出。B)为上图轨迹中典型 的解旋酶控制DNA移动中的一个的放大图(y轴=电流(pA), X轴=时间(min))。所述DNA 水平显示出随着所述酶移动DNA穿过所述孔电流是逐步变化的。
[0030] 图7显示出Hel308Mbu(SEQ ID N0:15)能以受控方式移动DNA穿过胞溶素纳米 孔(胞溶素-E76S/E84Q/E85K/E92Q/E97S/D126G/E167A,具有突变 E76S/E84Q/E85K/E92Q/ E97S/D126G/E167A的SEQIDN0:2),从而在随着DNA移动穿过所述纳米孔电流产生逐步 变化。A)显示了典型的Hel308 Mbu控制的DNA移动的示例电流轨迹(y轴=电流(pA),x 轴=时间(s))(+180mV,625mM KCl,100mM H印es pH 8.0,75mM 亚铁氰化钾(II),25mM 铁氰化钾(III),pH 8.0,lmM ATP,10mM MgCl2,0.6nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQ ID N0:15),胞溶素-E76S/E84Q/E85K/E92Q/E97S/D126G/E167A,具有突变 E76S/E84Q/E85K/E92Q/E97S/D126G/E167A 的 SEQ ID N0:2)hB)显示了上图轨迹中解旋酶 控制的DNA移动的一放大图(y轴=电流(pA), X轴=时间(S))。所述DNA水平显示出随着 所述酶移动DNA穿过所述孔电流是逐步变化的。
[0031] 图8显示出Hel308Mbu(SEQ ID N0:15)能以受控方式移动DNA穿过胞溶素纳米 孔(胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/E50S,具有突变 E84Q/E85K/E92Q/E97S/ D126G/E167A/E50S的SEQIDN0:2),从而在随着DNA移动穿过所述纳米孔电流产生逐步 变化。A)显示了典型的Hel308Mbu控制的DNA移动的示例电流轨迹(y轴=电流(pA),x 轴=时间(s))(+120mV,625mM KCl,100mM H 印 es pH 8.0,75mM 亚铁氰化钾(II),25mM 铁氰化钾(III),pH 8.0,lmM ATP,10mM MgCl2,0.3nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQIDN0:15),胞溶素 -E84Q/E85K/E92Q/E97S/D126G/E167A/E50S,具有突变 E84Q/E85K/E92Q/E97S/D126G/E167A/E50S 的 SEQ ID N0:2)hB)显示了上图轨迹中解旋酶 控制的DNA移动的一放大图(y轴=电流(pA), X轴=时间(S))。所述DNA水平显示出随着 所述酶移动DNA穿过所述孔电流是逐步变化的。
[0032] 图9显示了 Hel308Mbu(SEQ ID N0:15)能以受控方式移动DNA穿过胞溶素纳米 孔(胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/E71S,具有突变 E84Q/E85K/E92Q/E97S/ D126G/E167A/E71S的SEQIDN0:2),从而在随着DNA移动穿过所述纳米孔电流产生逐步 变化。A)显示了典型的Hel308Mbu控制的DNA移动的示例电流轨迹(y轴=电流(pA),x 轴=时间(min))(+180mV,625mM KCl,100mM H印es pH 8.0,75mM 亚铁氰化钾(II),25mM 铁氰化钾(III),pH 8.0,lmM ATP,10mM MgCl2,0.3nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQ ID N0:15),胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/E71S,具有突变 E84Q/E85K/E92Q/E97S/D126G/E167A/E71S 的 SEQ ID N0:2).B)显示了上图轨迹中解旋酶控 制的DNA移动的一放大图(y轴=电流(pA), X轴=时间(S))。所述DNA水平显示出随着所 述酶移动DNA穿过所述孔电流是逐步变化的。
[0033] 图10显示了 Hel308Mbu(SEQ ID NO: 15)能以受控方式移动DNA穿过胞溶素纳米 孔(胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/E128S,具有突变 E84Q/E85K/E92Q/E97S/ D126G/E167A/E128S的SEQ ID N0:2),从而在随着DNA移动穿过所述纳米孔电流产生逐步 变化。A)显示了典型的Hel308Mbu控制的DNA移动的示例电流轨迹(y轴=电流(pA),x 轴=时间(s))(+180mV,625mM KCl,100mM H印es pH 8.0,75mM 亚铁氰化钾(II),25mM 铁氰化钾(III),pH 8.0,lmM ATP,10mM MgCl2,0.6nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQIDN0:15),胞溶素 -E84Q/E85K/E92Q/E97S/D126G/E167A/E128S,具有突变 E84Q/E85K/E92Q/E97S/D126G/E167A/E128S 的 SEQ ID 勵:2)。抝显示了上图轨迹中解旋酶 控制的DNA移动的一放大图(y轴=电流(pA), X轴=时间(s))。所述DNA水平显示出随着 所述酶移动DNA穿过所述孔电流是逐步变化的。
[0034] 图11显示了 Hel308Mbu(SEQ ID NO: 15)能以受控方式移动DNA穿过胞溶素纳米 孔(胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/D68S,具有突变 E84Q/E85K/E92Q/E97S/ D126G/E167A/D68S的SEQ ID N0:2),从而在随着DNA移动穿过所述纳米孔电流产生逐步 变化。A)显示了典型的Hel308 Mbu控制的DNA移动的示例电流轨迹(y轴=电流(pA),x 轴=时间(min))(+120mV,625mM KCl,100mM H印es pH 8.0,75mM 亚铁氰化钾(II),25mM 铁氰化钾(III),pH 8.0,lmM ATP,10mM MgCl2,0.3nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQIDN0:15),胞溶素 -E84Q/E85K/E92Q/E97S/D126G/E167A/D68S,具有突变 E84Q/E85K/E92Q/E97S/D126G/E167A/D68S 的 SEQ ID N0:2)。B)显示了上图轨迹中解旋酶 控制的DNA移动的一放大图(y轴=电流(pA), x轴=时间(s))。所述DNA水平显示出随着 所述酶移动DNA穿过所述孔电流是逐步变化的。
[0035] 图12显示了 Hel308Mbu(SEQ ID NO: 15)能以受控方式移动DNA穿过胞溶素纳米 孔(胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/D121S,具有突变 E84Q/E85K/E92Q/E97S/ D126G/E167A/D121S的SEQ ID N0:2),从而在随着DNA移动穿过所述纳米孔电流产生逐步 变化。A)显示了典型的Hel308Mbu控制的DNA移动的示例电流轨迹(y轴=电流(pA),x 轴=时间(s))(+120mV,625mM KCl,100mM H印es pH 8.0,75mM 亚铁氰化钾(II),25mM 铁氰化钾(III),pH 8.0,lmM ATP,10mM MgCl2,0.6nM DNA(SEQ ID N0:13 和 14),100nM Hel308Mbu(SEQIDN0:15),胞溶素-E84Q/E85K/E92Q/E97S/D126G/E167A/D121S,具有突变 E84Q/E85K/E92Q/E97S/D126G/E167A/D121S 的 SEQ ID 勵:2)。抝显示了上图轨迹中解旋酶 控制的DNA移动的一放大图(y轴=电流(pA), X轴=时间(S))。所述DNA水平显示出随着 所述酶移动DNA穿过所述孔电流是逐步变化的。
[0036] 序列表说明
[0037] SEQ ID N0:1示出了编码胞溶素单体的多核苷酸序列。
[0038] SEQ ID NO:2示出了胞溶素单体的氨基酸序列。
[0039] SEQ ID NO: 3示出了编码Phi29DNA聚合酶的多核苷酸序列。
[0040] SEQ ID N0:4示出了 Phi29DNA聚合酶的氨基酸序列。
[0041] SEQ ID N0:5示出了源自大肠杆菌(E. coli)的SbcB基因的密码子优化的多核苷 酸序列。其编码大肠杆菌的核酸外切酶I (EcoExo I)。
[0042] SEQ ID NO:6示出了大肠杆菌的核酸外切酶I (EcoExo I)的氨基酸序列。
[0043] SEQ ID NO: 7示出了源自大肠杆菌的XthA基因的密码子优化的多核苷酸序列。其 编码大肠杆菌的核酸外切酶III。
[0044] SEQ ID N0:8示出了大肠杆菌的核酸外切酶III的氨基酸序列。该酶从双链 DNA(dsDNA)中的一条链沿3' -5'方向执行对5'单磷酸核苷的分配酶解(distributive digestion)。酶在链上的引发需要约4个核苷酸的5'突出。
[0045] SEQ ID N0:9示出了源自极端嗜热菌(T. thermophilus)的recj基因的密码子优 化的多核苷酸序列。其编码极端嗜热菌的RecJ酶(TthRecJ-cd)。
[0046] SEQ ID NO: 10示出了极端嗜热菌的RecJ酶(TthRecJ-cd)的氨基酸序列。该酶 从单链DNA沿5' - 3'方向执行对5'单磷酸核苷的进行性酶解(processive digestion)。 酶在链上的引发需要至少4个核苷酸。
[0047] SEQ ID NO: 11 不出 了源自噬菌体 λ 核酸外切酶(bacteriophage lambda exo) (redX)基因的密码子优化的多核苷酸序列。其编码噬菌体λ核酸外切酶。
[0048] SEQ ID Ν0:12示出了噬菌体λ核酸外切酶的氨基酸序列。该序列是组装成三聚 体的三个相同亚基中的一个。所述酶从双链DNA中的一条链沿5'-3'方向执行对核苷酸的 高进行性酶解(http://www. neb. com/nebecomm/products/productM0262. asp)。酶在链上 的引发优先需要约4个具有5'磷酸的核苷酸的5'突出。
[0049] SEQ ID NO: 13和14示出了在实施例1,2, 3, 4, 5和6中使用的单链DNA的多核苷 酸序列。SEQ ID NO: 14具有3'-胆固醇标签。
[0050] SEQ ID NO: 15 示出了 Hel308Mbu 的氨基酸序列。
[0051] SEQ ID NO: 16示出了胞溶素相关蛋白质(LRP)I的氨基酸序列。
[0052] SEQ ID N0:17示出了胞溶素相关蛋白质(LRP)I的氨基酸序列。
[0053] SEQ ID NO: 18示出了胞溶素相关蛋白质(LRP)I的氨基酸序列。
[0054] SEQ ID N0:19示出了抗癌晶体蛋白-2(parasporin-2)的活性变体的氨基酸序列。 该全长蛋白在其氨基和羧基末端裂开从而形成能够形成孔的活性变体。

【具体实施方式】
[0055] 应理解的是,所公开的产品和方法的不同应用可以根据本领域的具体需求进行调 整。还应理解的是,本文中使用的术语仅仅是为了描述本发明的具体实施方案,不意欲进行 限制。
[0056] 另外,如在本说明书和所附权利要求书中使用的,单数形式的"一个"、"所述"包括 复数指代物,除非文中另有明确说明。因此,例如,涉及"一个突变体单体"时包括"多个突 变体单体",涉及"一个取代"时包括两个或多个这样的取代,涉及"一个孔"时包括两个或多 个这样的孔,涉及"一个多核苷酸"时包括两个或多个这样的多核苷酸,等。
[0057] 所有在本文中引用的出版物、专利和专利申请,无论在前文或后文,均以全文引用 的方式纳入本文中。
[0058] 突夺体朐溶素单体
[0059] 本发明提供了突变体胞溶素单体。所述突变体胞溶素单体可用于形成本发明的 孔。突变体胞溶素单体为其序列由野生型胞溶素单体的序列(即SEQ ID N0:2)变化而来且 在本发明其他单体或者胞溶素的或源自胞溶素的其他单体存在下保持有形成孔的能力的 单体。用于确定突变体单体形成孔的能力的方法是本领域公知的且将在下文更详细论述。 例如,所述突变体单体形成孔的能力可按实施例1中所述确定。
[0060] 所述突变体单体具有改变的与多核苷酸相互作用的能力。因此,含有一个或多个 突变体单体的孔具有提高的核苷酸读取性能,例如显示出(1)提高的多核苷酸捕获和(2) 提高的多核苷酸识别或区分能力。特别地,由所述突变体单体构造的孔能比野生型的能更 容易地捕获核苷酸和多核苷酸。此外,由所述突变体单体构造的孔显示出增加的电流范围, 这使得更容易区分不同的核苷酸,且显示出降低的状态变化,这提高了信噪比。此外,在多 核苷酸移动穿过由所述突变体构造的孔时使电流增加的核苷酸的数目减少了。这使得更容 易确定多核苷酸移动穿过所述孔时所观察到的电流与所述多核苷酸之间的直接关系。所述 突变体的提高的核苷酸读取性能通过五种主要机制实现,即可通过改变下述而实现:
[0061] ?空间位阻(teric)(增加或减小氨基酸残基的尺寸);
[0062] ?电荷(例如引入或去除-ve电荷和/或引入或去除+ve电荷);
[0063] ?氢键合(例如引入可将氢键合至碱基对的氨基酸);
[0064] · π-堆积(例如引入通过离域电子Ji体系而相互作用的氨基酸);和/或 [0065].改变所述孔的结构(例如引入能增加桶状结构或通道的尺寸的氨基酸)。
[0066] 上述五种机制中的任何一种或多种是本发明突变体单体形成的孔的性能得以提 高的原因。例如,含有本发明突变体单体的孔可由于改变的空间位阻、改变的氢键合和改变 的结构而显示出提高的核苷酸读取性能。
[0067] 本发明突变体单体含有SEQ ID NO:2中所示序列的变体。SEQ ID NO:2为胞溶素 单体的野生型序列。SEQ ID N0:2的变体为具有由SEQ ID N0:2的氨基酸序列变化而来的 氨基酸序列且保持有其形成孔的能力的多肽。
[0068] 出人意料地,本发明人识别出了胞溶素单体内的一个区域,该区域可被修饰用以 改变所述单体和多核苷酸之间的相互作用,例如当使用纳米孔通过含所述单体的孔感测表 征所述多核苷酸时。所述区域为SEQ ID N0:2的约44位点到约126位点。通常至少该区 域的一部分为胞溶素的跨膜区域。通常至少该区域的一部分为胞溶素的桶状结构或通道。 通常至少该区域的一部分为胞溶素的内壁或内膜(lining)。
[0069] 胞溶素的跨膜区域经鉴定为SEQ ID N0:2的44位点至67位点(De Colbis等 人,Structure, 2012 ;20:1498 - 1507)。
[0070] 根据本发明,所述变体包含位于SEQ ID N0:2的从约44位点到约126位点的区域 内的一个或多个修饰,所述修饰能改变所述单体或优选地所述区域与多核苷酸相互作用的 能力。所述单体与多核苷酸之间的相互作用可被增加或减小。所述单体与多核苷酸之间的 相互作用增加将例如有助于通过含所述突变体单体的孔对所述多核苷酸的捕获。所述区域 与多核苷酸之间的相互作用减小将例如提高对所述多核苷酸的识别或区分。对所述多核苷 酸的识别或区分可通过以下方式提高,通过减小含有突变体单体的孔的状态的变化(这将 提高信噪比)和/或减小在所述多核苷酸移动穿过含有所述突变体单体的孔时使电流增加 的所述多核苷酸中核苷酸的数目。
[0071] 因此,本发明提供了含有SEQ ID N0:2中所示序列的变体的突变体胞溶素单体,其 中所述单体能够形成孔并且其中所述变体包括SEQ ID NO: 2的从约44位点到约126位点 的一个或多个修饰,所述修饰能改变所述单体与多核苷酸相互作用的能力。
[0072] 所述单体与多核苷酸相互作用的能力可使用本领域公知的方法确定。所述单体可 与多核苷酸以任何方式相互作用,例如通过非共价相互作用如疏水性相互作用、氢键合、范 德华力(Van der Waal's force)、pi〇)-阳离子相互作用或静电力。例如,所述区域与 多核苷酸结合的能力可使用常规结合试验测得。合适的试验包括但不限于,基于荧光的结 合试验、核磁共振(NMR)、等温滴定量热法(ITC)和电子自旋共振(ESR)光谱法。替代地,包 含一个或多个所述突变体单体的孔与多核苷酸相互作用的能力可使用上下文中所述的任 一方法确定。优选的试验在实施例中有描述。
[0073] 所述一个或多个修饰位于SEQ ID NO: 2的约44位点到约126位点的区域中。所述 一个或多个修饰优选位于以下区域中的任一个中:约40位点至约125位点、约50位点至约 120位点、约60位点至约110位点和约70位点至约100位点。如果进行所述一个或多个修 饰是为了提高对多核苷酸的捕获,则更优选在以下区域中的任一个中进行所述修饰:约44 位点至约103位点、约68位点至约103位点、约84位点至约103位点、约44位点至约位点 97、约68位点至约97位点或约84位点至约97位点。如果进行所述一个或多个修饰是为 了提高对多核苷酸的识别或区分,则更优选在以下区域中的任一个中进行所述修饰:约44 位点至约109位点、约44位点至约97位点或约48位点至约88位点。所述区域优选为SEQ ID NO:2的约44位点至约67位点。
[0074] 如果所述一个或多个修饰是用于提高对多核苷酸的识别或区分,则优选在进行用 于提高多核苷酸捕获的一个或多个修饰之外进行修饰。这使得由突变体单体形成的孔能有 效捕获多核苷酸然后表征该多核苷酸,例如按如下所述评估其序列。
[0075] 对蛋白质纳米孔的修饰--用以改变其与多核苷酸相互作用的能力,特别是提高 其捕获和/或识别或区分多核苷酸的能力--在本领域中有充分的文献记载。例如,WO 2010/034018和WO 2010/055307中公开了所述修饰。根据本发明,可对胞溶素单体进行类 似的修饰。
[0076] 可进行任何数目的修饰,如1,2, 5, 10, 15, 20, 30个或更多的修饰。可进行任何修 饰,只要能改变所述单体与多核苷酸相互作用的能力即可。合适的修饰包括,但不限于,氨 基酸取代、氨基酸添加和氨基酸缺失。所述一个或多个修饰优选为一个或多个取代。这在 下文有更详细论述。
[0077] 所述一个或多个修饰优选地(a)改变所述单体的空间位阻效应或优选地改变所 述区域的空间位阻效应,(b)改变所述单体的净电荷或优选地改变所述区域的净电荷,(C) 改变所述单体与所述多核苷酸进行氢键合的能力,或优选地改变所述区域与所述多核苷酸 进行氢键合的能力,(d)引入或去除通过离域电子π体系进行相互作用的化学基团,和/ 或(e)改变所述单体的结构,或优选地改变所述区域的结构。所述一个或多个修饰更优选 地进行(a)至(e)的任意组合,例如(a)和(b) ; (a)和(c) ; (a)和(d) ; (a)和(e) ; (b)和 (c) ; (b)和(d) ; (b)和(e) ; (c)和(d) ; (c)和(e) ; (d)和(e),(a),(b)和(c) ; (a),(b) 和(d) ; (a),(b)和(e) ; (a),(c)和(d) ; (a),(c)和(e) ; (a),(d)和(e) ; (b),(c)和(d); (b),(c)和(e) ; (b),(d)和(e) ; (c),(d)和(e) ; (a),(b),(c) and d) ; (a),(b),(c)和(e); (a),(b),(d)和(e) ; (a),(c),(d)和(e) ; (b),(c),(d)和(e) ; (a),(b),(c)和(d)。
[0078] 对于(a),可增加或减小所述单体的空间位阻效应。根据本发明可以使用改变所 述空间位阻效应的任何方法。引入大体积的(bulky)残基,例如苯丙氨酸(F),色氨酸(W), 酪氨酸(Y)或组氨酸(H),可增加所述单体的空间位阻。所述一个或多个修饰优选地是引 入F、W、Y和H中的一个或多个。可以引入F、W、Y和H的任意组合。所述F、W、Y和H中的 一个或多个可通过添加而引入。所述F、W、Y和H中的一个或多个优选地通过取代而引入。 适于引入这类残基的位置在下面更详细地论述。
[0079] 相反地,去除大体积的残基,例如苯丙氨酸(F)、色氨酸(W)、酪氨酸(Y)或组氨酸 (H),能减少所述单体的空间位阻。所述一个或多个修饰优选地是去除F、W、Y和H中的一个 或多个。可以去除F、W、Y和H的任意组合。所述F、W、Y和H中的一个或多个可通过缺失 而去除。所述F、W、Y和H中的一个或多个优选地通过用具有较小侧基的残基,例如例如丝 氨酸(S)、苏氨酸(T)、丙氨酸(A)和缬氨酸(V)进行取代而去除。
[0080] 对于(b),可用任何方法改变所述净电荷。优选地增加或减少净正电荷。可用任何 方式增加净正电荷。优选地,通过引入、优选通过取代一个或多个带正电的氨基酸和/或通 过中和、优选通过取代一个或多个负电荷而增加净正电荷。
[0081] 优选地,通过引入一个或多个带正电的氨基酸来增加净正电荷。所述一个或多个 带正电的氨基酸可通过添加而引入。所述一个或多个带正电的氨基酸优选地通过取代而引 入。带正电的氨基酸为带净正电荷的氨基酸。所述带正电的氨基酸可以是天然存在的或非 天然存在的。所述带正电的氨基酸可以是合成的或经修饰的。例如,可以专门设计经修饰 的带净正电荷的氨基酸而用于本发明中。对氨基酸的许多不同类型的修饰均是本领域中公 知的。
[0082] 优选的天然存在的带正电的氨基酸包括,但不限于,组氨酸(H)、赖氨酸(K)和精 氨酸(R)。所述一个或多个修饰优选为引入H,K和R中的一个或多个。可以引入任意数目 和任意组合的H,K和R。所述H,K和R中的一个或多个可通过添加而引入。所述H,K和R 中的一个或多个优选地通过取代而引入。适于引入这类残基的位置在下文更详细论述。
[0083] 添加或取代天然存在的氨基酸的方法是本领域公知的。例如,甲硫氨酸(M)可 以用精氨酸(R)取代,通过在编码所述单体的多核苷酸相关位置通过用精氨酸的密码子 (AGA)替换甲硫氨酸的密码子(ATG)而进行。然后所述多核苷酸可按如下所述进行表达。 [0084] 添加或取代非天然存在的氨基酸的方法也是本领域公知的。例如,非天然存在的 氨基酸可以通过将合成氨酰基-tRNA包含到用于表达所述孔的IVTT系统中而引入。替代 地,通过在特定氨基酸的合成(即非天然存在的)类似物存在下,在针对该特定氨基酸为营 养缺陷型的大肠杆菌中表达所述单体,来引入非天然存在的氨基酸。在使用部分肽合成来 产生所述孔的情况下,它们还可以通过裸露连接(naked ligation)而产生。
[0085] 任何氨基酸均可用带正电的氨基酸取代。一个或多个不带电氨基酸、非极性氨基 酸和/或芳香族氨基酸可以用一个或多个带正电的氨基酸取代。不带电的氨基酸没有净电 荷。适宜的不带电的氨基酸包括,但不限于,半胱氨酸(C)、丝氨酸(S)、苏氨酸(T)、甲硫氨 酸(M)、天冬酰胺(N)和谷氨酰胺(Q)。非极性氨基酸具有非极性侧链。适宜的非极性氨基 酸包括,但不限于,甘氨酸(G)、丙氨酸(A)、脯氨酸(P)、异亮氨酸(I)、亮氨酸(L)和缬氨酸 (V)。芳香族氨基酸具有芳香族侧链。适宜的芳香族氨基酸包括,但不限于,组氨酸(H)、苯 丙氨酸(F)、色氨酸(W)和酪氨酸(Y)。优选地,一个或多个带负电的氨基酸用一个或多个 带正电的氨基酸取代。适宜的带负电的氨基酸包括,但不限于,天冬氨酸(D)和谷氨酸(E)。
[0086] 优选的引入包括,但不限于,以下取代:用K取代E,用R取代M,用H取代M,用K取 代M,用R取代D,用H取代D,用K取代D,用R取代E,用H取代E,用R取代N,用R取代T, 用R取代G。最优选地用K取代E。
[0087] 可以引入或取代任何数目的带正电的氨基酸。例如,可以引入或取代 1,2, 5, 10, 15, 20, 25, 30个或更多带正电的氨基酸。
[0088] 更优选地通过中和一个或多个负电荷来增加净正电荷。所述一个或多个负电荷可 以通过用一个或多个不带电的氨基酸、非极性氨基酸和/或芳香族氨基酸取代一个或多个 带负电的氨基酸而进行替代来中和。去除负电荷能增加净正电荷。所述不带电的氨基酸、 非极性氨基酸和/或芳香族氨基酸可以是天然存在的或非天然存在的。它们可以是合成的 或经修饰的。适宜的不带电的氨基酸、非极性氨基酸和芳香族氨基酸如上文所述。优选的 取代包括,但不限于,用Q取代E,用S取代E,用A取代E,用Q取代D,用N取代E,用N取代 D,用G取代D,用S取代D。
[0089] 可以取代任意数目和任意组合的不带电的氨基酸、非极性氨基酸和/或芳香族氨 基酸。例如,可以取代1,2, 5, 10, 15, 20, 25或30个或者更多不带电的氨基酸、非极性氨基 酸和/或芳香族氨基酸。带负电的氨基酸可以用下述氨基酸取代:(1)不带电的氨基酸; (2)非极性氨基酸;(3)芳香族氨基酸;(4)不带电的氨基酸和非极性氨基酸;(5)不带电的 氨基酸和芳香族氨基酸;和(5)非极性氨基酸和芳香族氨基酸;或(6)不带电的氨基酸、非 极性氨基酸和芳香族氨基酸。
[0090] 所述一个或多个负电荷可以通过在一个或多个带负电的氨基酸附近例如1,2, 3 或4个氨基酸范围内或在一个或多个带负电的氨基酸相邻处引入一个或多个带正电的氨 基酸而中和。带正电和带负电的氨基酸的实例如上文所述。所述带正电的氨基酸可以用上 文所述的任何方式引入,例如通过取代而引入。
[0091] 优选地,通过引入一个或多个带负电的氨基酸和/或中和一个或多个正电荷来减 少净正电荷。可以减少净正电荷的方法将从上文关于增加净正电荷的描述中清楚得知。上 文描述的关于增加净正电荷的任何事实方案同样适用于减少净正电荷的情况,不同在于, 电荷正好相反。特别地,所述一个或多个正电荷优选地通过用一个或多个不带电的氨基酸、 非极性氨基酸和/或芳香族氨基酸取代一个或多个带正电的氨基酸而中和或者通过在一 个或多个带正电的氨基酸附近例如1,2, 3或4个氨基酸范围内或在一个或多个带正电的氨 基酸相邻处引入一个或多个带负电的氨基酸而中和。
[0092] 优选地增加或减少净负电荷。上文描述的关于增加或减少净正电荷的任何实施方 案同样分别适用于减少或增加净负电荷的情况。
[0093] 对于(C),可用任何方式改变所述单体进行氢键合的能力。引入丝氨酸(S),苏氨 酸(T),天冬酰胺(N),谷氨酰胺(Q),酪氨酸(Y)或组氨酸(H),可增加所述单体的氢键 合能力。优选地,所述一个或多个修饰为引入S,T,N,Q,Y和H中的一个或多个。可以引入 3,1^,〇,¥和!1的任意组合。所述5,1^,〇,¥和!1中的一个或多个可通过添加而引入。所 述S,T,N,Q,Y和H中的一个或多个优选通过取代而引入。适于引入这类残基的位置在下文 更详细论述。
[0094] 去除丝氨酸(S),苏氨酸(T),天冬酰胺(N),谷氨酰胺(Q),酪氨酸(Y)或组氨酸 (H),可减少所述单体的氢键合能力。优选地,所述一个或多个修饰为去除S,T,N,Q,Y和H 中的一个或多个。可去除S,T,N,Q,Y和H的任意组合。所述S,T,N,Q,Y和H中的一个或多 个可通过缺失而去除。所述S,T,N,Q,Y和H中的一个或多个优选地通过用氢键合能力较差 的其他氨基酸例如丙氨酸(A),缬氨酸(V),异亮氨酸(I)和亮氨酸(L)进行取代而去除。
[0095] 对于(d),引入芳香族残基,例如苯丙氨酸(F),色氨酸(W),酪氨酸(Y)或组氨酸 (H),也可增加所述单体中的π-堆积。去除芳香族残基,例如苯丙氨酸(F),色氨酸(W), 酪氨酸(Y)或组氨酸(Η),也可增加所述单体中的π-堆积。这类氨基酸可参照上文( a)中 的论述而引入或去除。
[0096] 对于(e),根据本发明进行一个或多个修饰来改变所述单体的结构。例如,可去除、 缩短或扩展一个或多个环形区域。这通常有利于多核苷酸进入或离开所述孔。所述一个或 多个环形区域可以在所述孔的顺侧、所述孔的反侧或位于所述孔的两侧。替代地,所述孔的 氨基末端和/或羧基末端的一个或多个区域可以扩展或删除。这通常会改变所述孔的尺寸 和/或电荷。
[0097] 从上文论述中清楚的是,引入某些氨基酸将增加所述单体与多核苷酸通过多于一 种的机制进行相互作用的能力。例如,用H取代E将不仅依照(b)增加净正电荷(通过中 和负电荷)而且将依照(c)增加所述单体进行氢键合的能力。
[0098] 所述变体优选地包括在SEQ ID NO: 2的下述位置中的一个或多个处的取代:M44, N 46, N48, E50, R52, H58, D68, F70, E71, S74, E76, S78, Y79, S80, H81, S82, E84, E85, S86, Q87, S8 9, M90, E92, E94, E97, E102, H103, T104, T106, R115, Q117, N119, D121 和 D126。所述变体优选 地包括在这些位置中的 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11,12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26, 27, 28, 29, 30, 31,32, 33或34位的取代。所述变体优选地包括在SEQ ID NO: 2 的下述位置中的一个或多个处的取代:D68, E71,S74, E76, S78, S80, S82, E84, E85, S86, Q87, S89, E92, E102, T104, T106, R115, Q117, N119和D121。所述变体优选地包括在这些位置中的 1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11,12, 13, 14, 15, 16, 17, 18, 19 或 20 位的取代。经取代进入所述变 体的氨基酸可以是天然存在的氨基酸或其非天然存在的衍生物。经取代进入所述变体的氨 基酸可以是D-氨基酸。上文所列的每个位置均可用天冬酰胺(N),丝氨酸(S),谷氨酰胺 (Q),精氨酸(R),甘氨酸(G),酪氨酸(Y),天冬氨酸(D),亮氨酸(L),赖氨酸(K)或丙氨 酸㈧进行取代。
[0099] 所述变体优选地包括SEQ ID NO:2的以下突变中的至少一个:
[0100] (a) 44位点处的丝氨酸(S);
[0101] (b) 46位点处的丝氨酸(S);
[0102] (c) 48位点处的丝氨酸(S);
[0103] (d) 52位点处的丝氨酸(S);
[0104] (e) 58位点处的丝氨酸(S);
[0105] (f) 68位点处的丝氨酸(S);
[0106] (g) 70位点处的丝氨酸(S);
[0107] (h) 71位点处的丝氨酸(S);
[0108] ⑴76位点处的丝氨酸(S);
[0109] (j) 79位点处的丝氨酸(S);
[0110] (k) 81位点处的丝氨酸(S);
[0111] (1)84位点处的丝氨酸(S),天冬氨酸(D)或谷氨酰胺(Q);
[0112] (m) 85位点处的丝氨酸(S)或赖氨酸(K);
[0113] (η) 87位点处的丝氨酸(S);
[0114] (〇) 90位点处的丝氨酸(S);
[0115] (P) 92位点处的天冬酰胺(N)或谷氨酰胺(Q);
[0116] (q) 94位点处的丝氨酸(S)或天冬酰胺(N);
[0117] (r) 97位点处的丝氨酸(S)或天冬酰胺(N);
[0118] (s) 102位点处的丝氨酸(S);
[0119] ⑴103位点处的丝氨酸(S);
[0120] (U) 121位点处的天冬酰胺(N)或丝氨酸⑶;
[0121] (V) 50位点处的丝氨酸(S);
[0122] (w) 94位点处的天冬酰胺(N)或丝氨酸(S);
[0123] (X) 97位点处的天冬酰胺(N)或丝氨酸(S);
[0124] (y) 121位点处的丝氨酸⑶或天冬酰胺(N);
[0125] (z) 126位点处的天冬酰胺(N)或谷氨酰胺(Q)或甘氨酸(G);和
[0126] (aa) 128位点处的丝氨酸⑶或天冬酰胺(N)。
[0127] 所述变体可以包括任何数目的突变(a)至(aa),例如1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21,22, 23, 24, 25, 26 或 27 个所述突变。所述突变的优选组 合见下文所述。被引入到所述变体中的氨基酸可以是天然存在的氨基酸或其非天然存在的 衍生物。被引入到所述变体中的氨基酸可以是D-氨基酸。
[0128] 所述变体优选包含SEQ ID NO:2的以下突变中的至少一个:
[0129] (a) 68位点处的丝氨酸(S);
[0130] (b) 71位点处的丝氨酸(S);
[0131] (c) 76位点处的丝氨酸(S);
[0132] (d) 84位点处的天冬氨酸(D)或谷氨酰胺(Q);
[0133] (e) 85位点处的赖氨酸(K);
[0134] (f) 92位点处的天冬酰胺(N)或谷氨酰胺(Q);
[0135] (g) 102位点处的丝氨酸(S);
[0136] (h) 121位点处的天冬酰胺(N)或丝氨酸⑶;
[0137] ⑴50位点处的丝氨酸(S);
[0138] (j) 94位点处的天冬酰胺(N)或丝氨酸(S);
[0139] (k) 97位点处的天冬酰胺(N)或丝氨酸(S);和
[0140] (1) 126位点处的天冬酰胺(N)或谷氨酰胺(Q)或甘氨酸(G)。
[0141] 所述变体可以包括任何数目的突变(a)至(1),例如1,2, 3, 4, 5, 6, 7, 8, 9, 10, 11或 12个所述突变。所述突变的优选组合见下文所述。被引入到所述变体中的氨基酸可以是天 然存在的氨基酸或其非天然存在的衍生物。被引入到所述变体中的氨基酸可以是D-氨基 酸。
[0142] 所述变体可以包括在SEQ ID NO:2的约44位点到约126位点的区域外部的一个 或多个额外修饰,所述额外修饰与上述区域内的修饰结合用于提高多核苷酸捕获和/或提 高多核苷酸识别或区分。适宜的修饰包括,但不限于,在D35, E128, E135, E134和E167中的 一个或多个处进行取代。特别地,通过在128, 135, 134和167位点中的一个或多个处的取 代E来去除负电荷,可以提高多核苷酸捕获。在这些位点中的一个或多个处的E可以用上 文所述的任何方式进行取代。优选地,E128, E135, E134和E167全部按上文所述进行取代。 优选用A取代E。换言之,所述变体优选包含E128A,E135A,E134A和E167A中的一个或多个 或者全部。另一优选的取代为D35Q。
[0143] 在一优选的实施方案中,所述变体包含SEQ ID NO:2中的以下取代:
[0144] i. E84D和E85K中的一个或多个,例如两个;
[0145] ii. E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一个或多个,例如 2, 3, 4, 5 或 6 个;
[0146] iii. E92N, E94N, E97N, D121N 和 D126N 中的一个或多个,例如 2, 3, 4 或 5 个;
[0147] iv. E92N, E94N, E97N, D121N, D126N 和 E128N 中的一个或多个,例如 2, 3, 4, 5 或 6 个;
[0148] V. E76S, E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一个或多个,例如 2, 3, 4, 5, 6 或7个;
[0149] vi. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E50S 中的一个或多个,例如 2, 3, 4, 5, 6 或7个;
[0150] vii.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E71S 中的一个或多个,例如 2.3.4.5.6 或 7个;
[0151] viii.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E94S 中的一个或多个,例如 2.3.4.5.6 或 7个;
[0152] ix.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E102S 中的一个或多个,例如 2.3.4.5.6 或 7个;
[0153] X. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E128S 中的一个或多个,例如 2, 3, 4, 5, 6 或7个;
[0154] xLE84Q,E85K,E92Q,E97S,D126G,E167A 和 E135S 中的一个或多个,例如 2.3.4.5.6 或 7个;
[0155] xii.E84Q,E85K,E92Q,E97S,D126G,E167A 和 D68S 中的一个或多个,例如 2.3.4.5.6 或 7个;
[0156] xiii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D121S 中的一个或多个,例如 2.3.4.5.6 或 7个;
[0157] xiv.E84Q,E85K,E92Q,E97S,D126G,E167A 和 D134S 中的一个或多个,例如 2.3.4.5.6 或 7个;
[0158] XV. E84D, E85K和E92Q中的一个或多个,例如2或3个;
[0159] xvi. E84Q, E85K, E92Q, E97S, D126G 和 E135S 中的一个或多个,例如 1,2, 3, 4, 5 或 6 个;
[0160] 义¥丨^851(392〇39453975和01266中的一个或多个,例如1,2,3,4或5个;
[0161] 义¥^^7653851(392〇3975和01266中的一个或多个,例如1,2,3,4或5个;
[0162] xix. E71S, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4 或 5 个;
[0163] XX. D68S, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4 或 5 个;
[0164] xxi. E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3 或 4 个;
[0165] xxii. E84Q, E85K, E92Q, E97S, H103S 和 D126G 中的一个或多个,例如 1,2, 3, 4, 5 或 6个;
[0166] xxiii. E84Q, E85K, M90S, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4, 5 或 6个;
[0167] xxiv. E84Q, Q87S, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4, 5 或 6 个;
[0168] XXV. E84Q, E85S, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4 或 5 个;
[0169] xxvi. E84S, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4 或 5 个;
[0170] xxvii. H81S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4, 5 或 6个;
[0171] xxviii. Y79S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4, 5 或 6个;
[0172] xxix. F70S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4, 5 或 6 个;
[0173] XXX. H58S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4, 5 或 6 个;
[0174] xxxi. R52S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4, 5 或 6 个;
[0175] xxxii. N48S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4, 5 或 6个;
[0176] xxxiii. N46S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4, 5 或 6个;
[0177] xxxiv. M44S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4, 5 或 6个;
[0178] XXXV. E92Q和E97S中的一个或多个,例如两个;
[0179] xxxvi. E84Q, E85K, E92Q 和 E97S 中的一个或多个,例如 1,2, 3 或 4 个;
[0180] xxxvii. E84Q和E85K中的一个或多个,例如两个;
[0181] xxxviii. E84Q, E85K 和 D126G 中的一个或多个,例如 1,2 或 3 个;
[0182] xxxix. E84Q, E85K, D126G 和 E167A 中的一个或多个,例如 1,2, 3 或 4 个;
[0183] xl.E92Q,E97S和D126G中的一个或多个,例如1,2或3个;
[0184] xli. E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个,例如 1,2, 3, 4 或 5 个;
[0185] xlii·E84Q,E85K,E92Q,E97S和E167A中的一个或多个,例如l,2,3,4或5个;
[0186] xliii.E84Q,E85K,E92Q,D126G和E167A中的一个或多个,例如l,2,3,4或5个;
[0187] xliv·E84Q,E85K,E97S,D126G和E167A中的一个或多个,例如l,2,3,4或5个;
[0188] xlv.E84Q,E92Q,E97S,D126G和E167A中的一个或多个,例如l,2,3,4或5个;
[0189] xlvi·E85K,E92Q,E97S,D126G和E167A中的一个或多个,例如l,2,3,4或5个;
[0190] xlvii. E84D, E85K和E92Q中的一个或多个,例如1,2或3个;
[0191] xlviii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D121S 中的一个或多个,例如 1,2,3,4,5,6 或 7个;
[0192] xlix.E84Q,E85K,E92Q,E97S,D126G,E167A 和 D68S 中的一个或多个,例如 1,2,3,4,5,6 或 7个;
[0193] l.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E135S 中的一个或多个,例如 1,2,3,4,5,6 或 7个;
[0194] li.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E128S 中的一个或多个,例如 1,2,3,4,5,6 或 7个;
[0195] lii.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E102S 中的一个或多个,例如 1,2,3,4,5,6 或 7个;
[0196] liii.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E94S 中的一个或多个,例如 1,2,3,4,5,6 或 7个;
[0197] liv.E84Q,E85K,E92Q,E97S,D126G,E167A 和 E71S 中的一个或多个,例如 1,2,3,4,5,6 或 7个;
[0198] lv. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E50S 中的一个或多个,例如 1,2,3,4,5,6 或 7个;
[0199] lvi.E76S,E84Q,E85K,E92Q,E97S,D126G 和 E167A 中的一个或多个,例如 1,2,3,4,5,6 或 7个;
[0200] lvii. E92N, E94N, E97N, D121N, D126N和 E128N 中的一个或多个,例如 1,2, 3, 4, 5 或 6个;
[0201] lviii. E92N, E94N, E97N, D121N 和 D126N 中的一个或多个,例如 1,2, 3, 4
[0202] 或5个;或
[0203] lix. E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一个或多个,例如 1,2, 3, 4, 5 或 6〇
[0204] 在上述中,第一个字母是指SEQ ID NO:2中被替代的氨基酸,数字是指在SEQ ID N0:2中的位置,第二个字母是指替换第一个字母所代表的氨基酸的氨基酸。因此,E84D是 指84位点处的谷氨酸(E)被天冬氨酸⑶取代。
[0205] 所述变体可以包括i至Iix的任一个中的任意数目的取代,例如1,2, 3, 4, 5, 6或 7个。所述变体优选包括上述i至Iix的任一个中所示的所有取代。
[0206] 在一优选的实施方案种,所述变体包括上述i至XV的任一个中的取代。所述变体 可以包括i至XV的任一个中的任意数目的取代,例如1,2, 3, 4, 5, 6或7个。所述变体优选 包括上述i至XV的任一个中所示的所有取代。
[0207] 如果所述一个或多个修饰是用于提高所述单体识别或区分多核苷酸的能力, 则优选在进行上述用于提高多核苷酸捕获的修饰之外进行所述一个或多个修饰,例如 E84Q,E85K, E92Q, E97S, D126G 和 E167A。
[0208] 对所识别区域进行的一个或多个修饰可以是指,用在胞溶素的同源物或旁系同源 物(paralogue)的相应位置存在的氨基酸取代所述区域中的一个或多个氨基酸。胞溶素的 同源物的四个实例在SEQ ID NO: 16至19中示出。这类取代的优点是,它们可能导致突变 体单体形成孔,因为其同源单体也能形成孔。
[0209] 除了上面所讨论的特定的突变外,所述变体可包括其他的突变。这些突变不一定 提高所述单体与多核苷酸相互作用的能力。所述突变可以利于例如表达和/或纯化。基于 氨基酸的相似性,变体与SEQ ID N0:2的整个长度的氨基酸序列具有至少50%同源性。更 优选地,基于氨基酸的相似性,所述变体与SEQ ID NO: 2的整个长度的氨基酸序列具有至少 55%,至少60%,至少65%,至少70%,至少75%,至少80%,至少85%,至少90% 同源性,更优选地至少95% ,97%或99%同源性。在100或更长,例如125, 150, 175或200 或更长的连续氨基酸的长度上,可以具有至少80%,例如至少85%,90%或95%的氨基酸 相似性("严格同源性(hard homology)")。
[0210] 可使用本领域的标准方法测定同源性。例如UWGCG包提供了 BESTFIT程序,该 程序可用于计算同源性,例如使用其默认设置(Devereux等人(1984)核酸s Research 12, p387-395)。PILEUP算法和BLAST算法可用于计算同源性或比对序列(line up sequence)(例如识别等价残基或对应序列(通常基于其默认设置)),例如Altschul S.F. (1993) J Mol Evol 36:290-300 ;Altschul,S. F等人(1990) J Mol Biol 215:403-10 中 所描述的。
[0211] 进行BLAST分析的软件可通过国家生物技术信息中心(National Center for Biotechnology Information) (http://www. ncbi. nlm. nih. gov/)而公开获得。这一算法包 括,首先通过识别查询序列中W长度的短字(short words)来识别高得分序列对(HSP),所 述查询序列中W长度的字在与数据库序列中相同长度的字比对(align with)时能匹配或 满足一些为正值的阈值评分T。T指的是邻近字的得分阈值(Altschul等人,supra)。这 些初始邻近字的匹配记录(hits)用作开启检索以寻找包含它们的HSP的种子。该字匹配 记录沿着每个序列向两个方向扩展到,直到累积比对得分(cumulative alignment score) 增加为止。所述字匹配记录在每个方向的扩展在以下的时候停止:累积比对得分从其取得 的最大值下降X量时;由于一个或多个负得分残基比对的积累而是累积得分趋于零或低于 零时;或任一序列结束时。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLAST程序 使用默认设置:字长(W)为11,BL0SUM62得分矩阵(参见Henikoff and Henikoff (1992) Proc. Natl. Acad. Sci. USA 89:10915-10919)比对值(B)为 50、期望值(E)为 10, M = 5, N =4,以及两条链的比较值。
[0212] BLAST算法对两个序列进行相似性的统计分析;参见例如Karlin and Altschul (1993)Proc. Natl. Acad. Sci. USA 90:5873-5787。由 BLAST 算法提供的相似性的 一个量度为最小和概率(P (N)),该最小和概率表示两个氨基酸序列偶然发生配对的概率。 例如,如果在一个序列与另一个序列相比,最小和概率小于约1,优选小于约0. 1,更优选地 小于约0. 01,最优选地小于约0. 001,则上述第一个序列被认为与上述第二个序列相似。
[0213] 可以对SEQ ID N0:2的除了上述那些氨基酸序列之外的氨基酸序列进行氨基酸取 代,例如多达1,2, 3, 4, 5, 10, 20或30个取代。保守取代是将氨基酸用相似化学结构、相似 化学性能或相似侧链体积的其他氨基酸进行替换。被引入的氨基酸可以具有与它们所替代 的氨基酸相似的极性、亲水性、疏水性、碱性、酸性、中性或电荷。替代地,所述保守取代可以 在之前存在芳香族或脂肪族氨基酸的地方引入另外的芳香族或脂肪族氨基酸。保守的氨 基酸改变是本领域公知的,并且可以根据下表1中所限定的20个主要氨基酸的性质进行 选择。如果氨基酸具有相似的极性,则这还可以通过参照表2中氨基酸侧链的亲水性大小 (hydropathy scale)来石角定。
[0214] 表1 -氨基酸的化学性质

【权利要求】
1. 一种突变体胞溶素单体,含有SEQ ID N0:2中所示序列的变体,其中所述单体能够形 成孔并且其中所述变体含有位于SEQ ID NO:2的约44位点到约126位点的区域内的一个 或多个修饰,所述修饰能改变所述单体与多核苷酸相互作用的能力。
2. 根据权利要求1所述的突变体胞溶素单体,其中所述一个或多个修饰(a)改变所述 单体的空间位阻效应,(b)改变所述单体的净电荷,(c)改变所述单体与所述多核苷酸氢键 合的能力,(d)引入或除去通过离域电子体系进行相互作用的化学基团,和/或(e)改 变所述单体的结构。
3. 根据权利要求2所述的突变体胞溶素单体,其中所述一个或多个修饰增加或降低了 净正电荷。
4. 根据权利要求3所述的突变体胞溶素单体,其中所述净正电荷通过引入一个或多个 带正电的氨基酸和/或中和一个或多个负电荷而增加。
5. 根据权利要求4所述的突变体胞溶素单体,其中所述一个或多个负电荷通过用一个 或多个不带电的氨基酸、非极性氨基酸和/或芳香族氨基酸取代一个或多个带负电的氨基 酸或者通过在一个或多个带负电的氨基酸邻近处引入一个或多个带正电的氨基酸进行中 和。
6. 根据前述权利要求中任一项所述的突变体胞溶素单体,其中所述变体在SEQ ID NO: 2的以下位点中的一个或多个处含有一个取代:M44, N46, N48, E50, R52, H58, D68, F70, E 71, S74, E76, S78, Y79, S80, H81, S82, E84, E85, S86, Q87, S89, M90, E92, E94, E97, E102, H103, T104, T106, R115, Q117, N119, D121和 D126。
7. 根据权利要求6所述的突变体胞溶素单体,其中经取代而进入所述变体的氨基酸选 自天冬酰胺(N)、丝氨酸(S)、谷氨酰胺(Q)、精氨酸(R)、甘氨酸(G)、酪氨酸(Y)、天冬氨酸 (D)、亮氨酸(L)、赖氨酸(K)或丙氨酸(a)。
8. 根据前述权利要求中任一项所述的突变体胞溶素单体,其中所述变体含有以下突变 中的至少一个: (a) 44位点处的丝氨酸(S); (b) 46位点处的丝氨酸(S); (c) 48位点处的丝氨酸(S); (d) 52位点处的丝氨酸(S); (e) 58位点处的丝氨酸(S); (f) 68位点处的丝氨酸(S); (g) 70位点处的丝氨酸(S); (h) 71位点处的丝氨酸(S); (i) 76位点处的丝氨酸(S); (j) 79位点处的丝氨酸(S); (k) 81位点处的丝氨酸(S); (l) 84位点处的丝氨酸(S),天冬氨酸(D)或谷氨酰胺(Q); (m) 85位点处的丝氨酸(S)或赖氨酸(K); (n) 87位点处的丝氨酸(S); (〇)90位点处的丝氨酸(S); (P) 92位点处的天冬酰胺(N)或谷氨酰胺(Q); (q) 94位点处的丝氨酸(S)或天冬酰胺(N); (r) 97位点处的丝氨酸(S)或天冬酰胺(N); (s) 102位点处的丝氨酸(S); (t) 103位点处的丝氨酸(S); (u) 121位点处的天冬酰胺(N)或丝氨酸(S); (v) 50位点处的丝氨酸(S); (w) 94位点处的天冬酰胺(N)或丝氨酸(S); (x) 97位点处的天冬酰胺(N)或丝氨酸(S); (y) 121位点处的丝氨酸(S)或天冬酰胺(N); (z) 126位点处的天冬酰胺(N)或谷氨酰胺(Q)或甘氨酸(G);和 (aa) 128位点处的丝氨酸(S)或天冬酰胺(N)。
9.根据权利要求8所述的突变体胞溶素单体,其中所述变体含有以下取代: i. E84D和E85K中的一个或多个; ii. E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一个或多个; iii. E92N,E94N,E97N,D121N 和 D126N 中的一个或多个; iv. E92N, E94N, E97N, D121N, D126N 和 E128N 中的一个或多个; v. E76S, E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一个或多个; vi. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E50S 中的一个或多个; vii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E71S 中的一个或多个; viii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E94S 中的一个或多个; ix. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E102S 中的一个或多个; x. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E128S 中的一个或多个; xi. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E135S 中的一个或多个; xii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D68S 中的一个或多个; xiii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D121S 中的一个或多个; xiv. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D134S 中的一个或多个; 或 XV. E84D, E85K和E92Q中的一个或多个; xvi. E84Q, E85K, E92Q, E97S, D126G 和 E135S 中的一个或多个; xvii. E85K, E92Q, E94S, E97S 和 D126G 中的一个或多个; xviii. E76S, E85K, E92Q, E97S 和 D126G 中的一个或多个; xix. E71S, E85K, E92Q, E97S 和 D126G 中的一个或多个; XX. D68S, E85K, E92Q, E97S 和 D126G 中的一个或多个; xxi. E85K, E92Q, E97S 和 D126G 中的一个或多个; xxii. E84Q, E85K, E92Q, E97S, H103S 和 D126G 中的一个或多个; 叉叉1^.£84〇3851(,]\1905392〇,£975和01266中的一个或多个; xxiv. E84Q, Q87S, E85K, E92Q, E97S 和 D126G 中的一个或多个; xxv. E84Q, E85S, E92Q, E97S 和 D126G 中的一个或多个; xxvi. E84S, E85K, E92Q, E97S 和 D126G 中的一个或多个; xxvii. H81S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个; xxviii. Y79S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个; xxix. F70S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个; xxx. H58S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个; xxxi. R52S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个; xxxii. N48S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个; xxxiii. N46S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个; xxxiv. M44S, E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个; xxxv. E92Q和E97S中的一个或多个; xxxvi. E84Q, E85K, E92Q 和 E97S 中的一个或多个; xxxvii. E84Q和E85K中的一个或多个; xxxviii. E84Q, E85K 和 D126G 中的一个或多个; xxxix. E84Q, E85K, D126G 和 E167A 中的一个或多个; xl. E92Q, E97S和D126G中的一个或多个; xli. E84Q, E85K, E92Q, E97S 和 D126G 中的一个或多个; xlii. E84Q, E85K, E92Q, E97S 和 E167A 中的一个或多个; xliii. E84Q, E85K, E92Q, D126G 和 E167A 中的一个或多个; xliv. E84Q, E85K, E97S, D126G 和 E167A 中的一个或多个; xlv. E84Q, E92Q, E97S, D126G 和 E167A 中的一个或多个; xlvi. E85K, E92Q, E97S, D126G 和 E167A 中的一个或多个; xlvii. E84D, E85K和E92Q中的一个或多个; xlviii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D121S 中的一个或多个; xlix. E84Q, E85K, E92Q, E97S, D126G, E167A 和 D68S 中的一个或多个; I. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E135S 中的一个或多个; li. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E128S 中的一个或多个; lii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E102S 中的一个或多个; liii. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E94S 中的一个或多个; liv. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E71S 中的一个或多个; lv. E84Q, E85K, E92Q, E97S, D126G, E167A 和 E50S 中的一个或多个; lvi. E76S, E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一个或多个; lvii.E92N,E94N,E97N,D121N,D126N 和 E128N 中的一个或多个; lviii.E92N,E94N,E97N,D121N 和 D126N 中的一个或多个;或 lix. E84Q, E85K, E92Q, E97S, D126G 和 E167A 中的一个或多个。
10.根据权利要求9所述的突变体胞溶素单体,其中所述变体包含i至lix的任一个中 的所有取代。 II. 根据前述权利要求中任一项所述的突变体胞溶素单体,其中所述突变体是经化学 修饰的。
12.根据权利要求11所述的突变体胞溶素单体,其中所述突变体通过下述进行化学修 饰:将分子连接到一个或多个半胱氨酸、将分子连接到一个或多个赖氨酸、将分子连接到一 个或多个非天然氨基酸、表位的酶修饰或末端修饰。
13. 根据权利要求12所述的突变体胞溶素单体,其中所述一个或多个半胱氨酸或一个 或多个非天然氨基酸已通过取代被引入到所述突变体。
14. 根据权利要求12或13所述的突变体胞溶素单体,其中所述分子为(a)能促进含所 述单体的孔和目标分析物、目标核苷酸或目标多核苷酸之间的相互作用的分子适配体,或 (b)多核苷酸结合蛋白。
15. 根据权利要求12至14中任一项所述的突变体胞溶素单体,其中所述连接是通过连 接体而实现。
16. 根据权利要求12至15中任一项所述的突变体胞溶素单体,其中所述分子被连接到 所述变体中的一个或多个位点,所述位点对应于SEQ ID NO: 2的位点1至约位点43和约位 点127至约位点297。
17. -种构造,含有两个或多个共价连接的源自胞溶素的单体,其中所述单体中的至少 一个为权利要求1-16中任一项限定的突变体胞溶素单体。
18. 根据权利要求17所述的构造,其中所述两个或多个单体是相同的或不同的。
19. 根据权利要求17或18所述的构造,其中至少一个单体包含SEQ ID NO: 2中所示的 序列。
20. 根据权利要求17至19中任一项所述的构造,其中所述构造包含两个单体。
21. 根据权利要求17至20中任一项所述的构造,其中所述单体是基因融合的。
22. 根据权利要求17至21中任一项所述的构造,其中所述单体通过连接体而连接。
23. -种多核苷酸,其编码权利要求1至10中任一项所述的突变体胞溶素单体或权利 要求21所述的构造。
24. -种源自胞溶素的同源寡聚孔,包含足够数目的权利要求1至10中任一项所述的 突变体胞溶素单体。
25. -种源自胞溶素的异源寡聚孔,包含至少一个权利要求1至10中任一项所述的突 变体胞溶素单体。
26. 根据权利要求25所述的异源寡聚孔,其中所述孔包含至少一个单体,所述单体包 含SEQ ID N0:2中所示序列或其旁系同源物、同源物或变体。
27. 根据权利要求25或26所述的异源寡聚孔,其中所述孔含有(a) -个权利要求1-9 中任一项所述的突变体胞溶素单体,和(b)足够数目的用以形成所述孔的相同单体,其中 (a)中的突变体单体不同于(b)中的所述相同单体。
28. 根据权利要求25至27中任一项所述的异源寡聚孔,其中所述孔仅包含一个权利要 求1-10中任一项所述的突变体胞溶素单体。
29. 根据权利要求24至28中任一项所述的异源寡聚孔,其中所述突变体胞溶素单体中 的至少一个如权利要求10-15中所述进行化学修饰。
30. -种孔,包含至少一个权利要求17至22中任一项所述的构造。
31. 根据权利要求30所述的孔,其包含(a)权利要求18中所限定的一个构造,和(b) 足够数目的用以形成所述孔的单体,每个单体包含(i) SEQ ID NO: 2中所示的序列,或(ii) 权利要求1-10中任一项所限定的SEQ ID NO:2的变体。
32. 根据权利要求24-32中任一项所述的孔,其中所述构造中的至少一个如权利要求 11-16中所限定进行化学修饰。
33. -种表征目标分析物的方法,包括: (a) 使所述目标多核苷酸与权利要求24-32中任一项所述的孔接触,使得所述目标多 核苷酸移动穿过所述孔;和 (b) 在分析物相对于所述孔移动时获取一个或多个测量值,其中所述测量值表示所述 目标分析物的一个或多个特征并由此表征所述目标分析物。
34. 根据权利要求33所述的方法,其中所述目标分析物为金属离子、无机盐、聚合物、 氨基酸、肽、多肽、蛋白质、核苷酸、寡核苷酸、多核苷酸、染料、漂白剂、药物、诊断剂、消遣性 药物、爆炸性污染物或环境污染物。
35. 根据权利要求34所述的方法,其中所述目标分析物为目标多核苷酸。
36. 根据权利要求35所述的方法,其中步骤(a)包括括使所述目标多核苷酸与所述孔 和多核苷酸结合蛋白接触,并且所述蛋白控制所述目标多核苷酸穿过所述孔的运动。
37. 根据权利要求35或36所述的方法,其中对所述目标多核苷酸的表征包括评估所述 目标多核苷酸的序列或测序所述目标多核苷酸。
38. -种形成用于表征目标多核苷酸的传感器的方法,包括在权利要求24-32中任一 项所述的孔和多核苷酸结合蛋白之间形成复合体,并由此形成用于表征所述目标多核苷酸 的传感器。
39. 根据权利要求38所述的方法,其中所述复合体通过下述而形成:(a)使所述孔和所 述多核苷酸结合蛋白在所述目标多核苷酸的存在下相接触,和(b)跨所述孔施加电势。
40. 根据权利要求39所述的方法,其中所述电势为电压电势或化学电势。
41. 根据权利要求38所述的方法,其中所述复合体通过将所述孔共价连接到所述蛋白 而形成。
42. -种用于表征目标多核苷酸的传感器,包含在权利要求24-32中任一项所述的孔 和多核苷酸结合蛋白之间的复合体。
43. 权利要求24-32中任一项所述的孔在表征目标分析物中的应用。
44. 一种试剂盒,用于表征目标多核苷酸,所述试剂盒包含(a)权利要求24-32中任一 项所述的孔,和(b)多核苷酸结合蛋白。
45. 根据权利要求44所述的试剂盒,其中所述试剂盒还包含芯片,所述芯片包含两性 分子层。
46. -种用于表征样本中目标多核苷酸的设备,包含(a)多个根据权利要求24-32中任 一项所述的孔,和(b)多个多核苷酸结合蛋白。
47. 根据权利要求46所述的设备,其中所述设备包含: 传感器装置,能支撑多个孔并能可操作地使用所述孔和蛋白来实施多核苷酸的表征; 至少一个存储器,用于容纳实施所述表征的材料; 流体学系统,配置成从所述至少一个存储器可控地向所述传感器装置供应材料;和 多个容器,用于接收各样本,所述流体学系统被配置成选择性地从所述容器向所述传 感器装置供应所述样本。
48. -种提高含SEQ ID NO:2中所述序列的胞溶素单体用于表征多核苷酸的能力的方 法,包括在SEQ ID NO:2的约44位点到约126位点的区域内进行一个或多个修饰,所述修 饰能改变所述单体与多核苷酸相互作用的能力并且不影响所述单体用于形成孔的能力。
49. 一种制备权利要求17-22中任一项所述构造的方法,包括将至少一个权利要求 1-16中任一项所述的突变体胞溶素单体共价连接到一个或多个源自胞溶素的单体。
50. -种形成权利要求24-32中任一项所述孔的方法,包括使至少一个权利要求卜16 中任一项所述的突变体单体或至少一个权利要求17-22中任一项所述的构造与足够数目 的权利要求1-16中任一项所述的单体、权利要求17-22中任一项所述的构造或源自胞溶素 的单体进行寡聚,以形成孔。
【文档编号】C12Q1/00GK104350067SQ201380030527
【公开日】2015年2月11日 申请日期:2013年3月15日 优先权日:2012年4月10日
【发明者】马克·布鲁斯, 詹姆斯·克拉克, 安德鲁·海伦, 拉科马·贾亚辛格, 杰恩·华莱士 申请人:牛津纳米孔技术公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1