突变孔的制作方法

文档序号:15881411发布日期:2018-11-09 18:02阅读:242来源:国知局
突变孔的制作方法

本发明涉及csgg的突变形式。本发明还涉及使用csgg的分析物检测和表征。

背景技术

纳米孔感测是一种依赖于观测分析物分子与受体之间的个别结合或相互作用事件的感测方法。可通过在绝缘膜中放置纳米尺寸单孔和测量在分析物分子存在下通过孔的电压驱动的离子转运来产生纳米孔传感器。通过分析物的独特电流标志来揭露分析物的特性,值得注意的是,电流块的持续时间和程度以及电流电平的变化。此类纳米孔传感器是可商购的,如由牛津纳米孔科技有限公司(oxfordnanoporetechnologiesltd)销售的miniontm装置,其包含与电子芯片集成的纳米孔阵列。

目前仍需要横跨广泛应用范围的快速且廉价的核酸(例如dna或rna)测序技术。现有技术缓慢且昂贵,这主要是因为其依赖于扩增技术来产生大体积的核酸且需要大量的用于信号检测的专业荧光化学试剂。纳米孔感测具有通过降低核苷酸和所需的试剂的数量来提供快速且廉价的核酸测序的潜能。

使用纳米孔感测进行核酸测序的两个基本组分是(1)控制通过孔的核酸移动和(2)在核酸聚合物通过孔移动时鉴别核苷酸。在过去,为了实现核苷酸鉴别,核酸已通过溶血素突变。这提供了已表明为序列依赖性的电流标志。还表明,大量的核苷酸引起当使用溶血素孔时所观测的电流,使得在所观测的电流与聚核苷酸问题之间具有直接关系。

虽然用于核苷酸鉴别的电流范围已通过溶血素孔突变来改进,但如果核苷酸之间的电流差异可以进一步改进,那么测序系统将具有更高个性能。另外,已观测到,当核酸通过孔移动时,一些电流状态显示很高的变化。还表明,一些突变溶血素孔比其它的显示更高的变化。虽然这些状态的变化可含有序列特异性信息,但期望生产具有低变化的孔以简化系统。还期望降低引起所观测电流的核苷酸数量。



技术实现要素:

本发明人已出人意料地证实,csgg和其新颖突变可用于表征分析物,如聚核苷酸。本发明涉及突变csgg单体。本发明人已出人意料地证实,包含新颖突变单体的孔具有增强的评估分析物特征的能力,如聚核苷酸的序列。本发明人已制备出出人意料地提供靶聚核苷酸相对于,如通过孔更加一致移动的突变孔。本发明人已制备出出人意料地显示改进的表征准确度的突变孔。特定来说,本发明人已制备出出人意料地显示电流范围增加和状态变化降低的突变孔,所述增加的电流范围使得更容易在不同核苷酸之间进行鉴别,所述状态变化降低增加信噪比。另外,本发明人已制备出出人意料地更容易捕获核苷酸和聚核苷酸的突变孔。在突变csgg单体中,位置192处的精氨酸(r)可被天冬氨酸(d)、谷氨酰氨(q)、苯丙氨酸(f)、丝氨酸(s)或苏氨酸(t)取代。本发明人已出人意料地证实,此类单体且特定来说包含r192d取代的单体比在192位置处无取代的单体容易表达许多。

除非相反地陈述,否则本文所公开的所有氨基酸取代、缺失和/或添加均是参考包含seqidno:2中所示序列的变异体的突变csgg单体。

提及包含seqidno:2中所示序列的变异体的突变csgg单体,涵盖包含如在如下文所公开的其它seqidno中陈述的序列变异体的突变csgg单体。可对包含除seqidno:2中所示以外的序列变异体的csgg单体,进行等效于本文所公开的参考包含seqidno:2中所示序列的变异体的突变csgg单体的那些取代、缺失和/或添加的氨基酸取代、缺失和/或添加。

突变单体可被视为经分离单体。

特定来说,本发明涉及其中位置97处的精氨酸(r)已被色氨酸(w)取代、其中位置93处的精氨酸(r)已被色氨酸(w)取代、其中位置93和97处的精氨酸(r)已被色氨酸(w)取代的突变csgg单体。

本发明还提供一种突变csgg单体,其包含seqidno:2中所示序列的变异体,其中所述变异体包含(a)f191t,(b)v105、a106和i107的缺失和/或r192、f193、i194、d195、y196、q197、r198、l199、l200和e201位置中的一或多个的缺失,如f193、i194、d195、y196、q197、r198和l199的缺失或d195、y196、q197、r198和l199的缺失。

本发明还提供:

-包含seqidno:2中所示序列的变异体的突变csgg单体,所述突变csgg单体包含r192d/q/f/s/t;

-突变csgg单体,其包含(a)r192d;(b)r97w/y和/或r93w/y,优选地r97w、r93w或r93y和r97y;(c)k94q/n;(d)g103k/r和/或t104k/r;和/或(e)f191t,v105、a106和i107的缺失和/或f193、i194、d195、y196、q197、r198和l199的缺失。

突变csgg单体优选地进一步包含y51a和f56q。

由本发明提供的特定突变csgg单体包含seqidno:2中所示序列的变异体,所述变异体包含以下突变:

(1)y51a、f56q和r192d;

(2)y51a、f56q和r97w。

(3)y51a、f56q、r192d和r97w;

(4)y51a、f56q、r192d和r93w;

(5)y51a、f56q、r192d、r93y和r97y;或

(6)y51a、f56q、r192d和r93w。

(7)根据(1)-(6)中任一项所述的突变,和:

(a)v105、a106和1107的缺失。

(b)k94q或k94n;

(c)d195、y196、q197、r198和l199的缺失或f193、i194、d195、y196、q197、r198和l199的缺失;和/或

(d)f191t。

(8)根据(1)-(6)中任一项所述的突变,和:

(i)k94q和v105、a106和i107的缺失;

(ii)k94n和v105、a106和i107的缺失;

(iii)f191t和v105、a106和i107的缺失;

(iv)k94q和f191t;

(v)k94n和f191t;

(vi)k94q、f191t和v105、a106和i107的缺失;或

(vii)k94n、f191t和v105、a106和i107的缺失。

(9)根据(1)-(8)中任一项所述的突变,和:

-t104k或t104r;

-l90r;

-n91r:

-i95r;

-a99r;

-e101k、e101n、e101q、e101t或e101h;

-e44n或e44q;和/或

-q42k。

本发明还提供:

-一种构筑体,其包含两个或更多个共价连接的csgg单体,其中所述单体中的至少一个是本发明的突变单体;

-一种聚核苷酸,其编码本发明的突变单体或本发明的构筑体;

-一种同源寡聚孔,其衍生自csgg,所述同源寡聚孔包含相同的本发明的突变单体或相同的本发明的构筑体;

-一种异源寡聚孔,其衍生自csgg,所述异源寡聚孔包含至少一个本发明的突变单体或至少一个本发明的构筑体;

-一种用于测定靶分析物是否存在或其一或多个特征的方法,其包含:

(a)使靶分析物与本发明的孔接触,使得靶分析物相对于孔移动;和

(b)在所述分析物相对于所述孔移动时,进行一或多个测量,且从而测定所述分析物是否存在或其一或多个特征;

-一种形成用于表征靶聚核苷酸的传感器的方法,其包含在本发明的孔与聚核苷酸结合蛋白之间形成复合体且从而形成用于表征靶聚核苷酸的传感器;

-一种用于表征靶聚核苷酸的传感器,其包含本发明的孔与聚核苷酸结合蛋白之间的复合体;

-一种本发明的孔的用途,其用于测定靶分析物是否存在或其一或多个特征;

-一种用于表征靶分析物的试剂盒,其包含(a)本发明的孔和(b)膜组分;

-一种用于表征样本中的靶分析物的设备,其包含(a)多个本发明的孔和(b)多个膜;

-一种表征靶聚核苷酸的方法,其包含:

a)使聚核苷酸与本发明的孔、聚合酶和标记核苷酸接触,使得磷酸标记物种通过聚合酶依序添加到靶聚核苷酸中,其中磷酸物种含有对各核苷酸具有特异性的标记;和

b)使用所述孔检测所述磷酸标记物种,且从而表征所述聚核苷酸;和

-一种生产本发明的突变单体或本发明的构筑体的方法,其包含在合适宿主细胞中表达本发明的聚核苷酸且从而生产本发明的突变单体或构筑体。

附图说明

图1:示出来自大肠杆菌(e.coli)的csgg。

图2:示出csgg的尺寸。

图3:示出在下的单g易位。对于鸟嘌呤进入到csgg-eco的f56环中存在大屏障。*=g进入f56环。a=g停止与56环相互作用。b=g停止与55环相互作用。c=g停止与51环相互作用。

图4:示出在下的ssdna易位。通过收缩csgg-eco来牵拉dna需要很大的力。

图5:示出在下的ssdna易位。csgg-f56a-n55s和csg-f56a-n55s-y51a突变两个具有较低的ssdna易位屏障。

图6到8:显示与野生型(wt)相比范围增加的突变孔。

图9和10:显示与野生型(wt)相比输送量增加的突变孔。

图11和12:显示与野生型(wt)相比插入增加的突变孔。

图13:显示实例2中使用的dna构筑体x。标记1的区对应于30个spc3间隔子。标记2的区对应于seqidno:42。标记3的区对应于四个isp18间隔子。标记4的区对应于seqidno:43。标记5的区段对应于四个5-硝基吲哚。标记6的区对应于seqidno:44。标记7的区对应于seqidno:45。标记8的区对应于seqidno:46,其具有在seqidno:46的3′端处连接的四个isp18间隔子(标记9的区)。在isp18间隔子的相对端是3′胆固醇系链(标记10)。标记11的区对应于四个spc3间隔子。

图14:显示csgg蛋白的streptrap(通用电气医疗集团(gehealthcare))纯化的实例色谱迹线(x轴标记=洗脱体积(ml)、y轴标记=吸光度(mau))。将样本加载到25mmtris、150mmnacl、2mmedta、0.01%ddm中,且用10mm脱硫生物素洗脱。其中csgg蛋白洗脱的洗脱峰标记为e1。

图15:显示在初始strep纯化之后csgg蛋白的典型sds-page观测的实例。在300v下在1×tgs缓冲液中进行4-20%tgx凝胶(伯乐公司(biorad)电泳22分钟。用宝石红染色剂对凝胶进行染色。泳道1-3显示含有如由箭头指示的csgg蛋白的主要洗脱峰(图14中的标记e1)。泳道4-6对应于含有杂质的主要洗脱峰(图14中的标记e1)尾部的洗脱份。m显示所使用的分子量标记,所述分子量标记是未染色novexsharp(单位=kd)。

图16:显示csgg蛋白的尺寸排阻色谱图(sec)的实例(120mls200(通用电气医疗集团),x轴标记=洗脱体积(ml)、y轴标记=吸光度(mau))。在strep纯化和加热蛋白质样本之后,进行sec。sec的电泳缓冲液是25mmtris、150mmnacl、2mmedta、0.01%ddm、0.1%sds、ph8.0,且在1毫升/分钟速率下进行色谱柱。标记x的迹线显示在220nm下的吸光度,且标记y的迹线显示在280nm下的吸光度。收集标记为星形的峰。

图17:显示在sec之后csgg蛋白的典型sds-page观测的实例。在300v下在1×tgs缓冲液中进行4-20%tgx凝胶(伯乐公司)电泳22分钟,且用宝石红宝染色剂对凝胶进行染色。泳道1显示在strep纯化和加热之后但在sec之前的csgg蛋白样本。泳道2-8显示跨大致48ml-60ml图16(中间峰=55ml)电泳且在图16中用星形标记的峰收集的级分。m显示所使用的分子量标记,所述分子量标记是未染色novexsharp(单位=kd)。对应于csgg-eco孔的条棒由箭头指示。

图18到24:显示与野生型(wt)相比范围增加的突变孔。

图25到30:显示与野生型(wt)相比范围增加的突变孔。

图31显示在模拟期间于0和20ns获取(1到3回合),在孔(csgg-eco-(y51t/f56q)-strepii(c))9(具有突变y51t/f56q的seqidno:2,其中strepii(c)是seqidno:47且在c端处连接,孔突变第20号)上的酶(t4dda-(e94c/c109a/c136a/a360c)(具有突变e94c/c109a/c136a/a360c且接着(δm1)g1g2的seqidno:24))的快照。

图32显示在模拟期间于30和40ns获取(1到3回合),在孔(csgg-eco-(y51t/f56q)-strepii(c))9(具有突变y51t/f56q的seqidno:2,其中strepii(c)是seqidno:47且在c端处连接,孔突变第20号)上的酶(t4dda-(e94c/c109a/c136a/a360c)(具有突变e94c/c109a/c136a/a360c且接着(δm1)g1g2的seqidno:24))的快照。

图33显示在实例5中描述的模拟期间获取,在孔csgg-eco-(y51a/f56q/r97w)-strepii(c))9(具有突变y51a/f56q/r97w的seqidno:2,其中strepii(c)是seqidno:47且在c端处连接,孔突变第26号)上的酶(t4dda-(e94c/f98w/c109a/c136a/k194l/a360c)(具有突变e94c/f98w/c109a/c136a/k194l/a360c且接着(δm1)g1g2的seqidno:24)的快照。

图34显示电流迹线的两个十秒截屏,其显示在无酶控制的情况下通过mspa突变x=mspa-((del-l74/g75/d118/l119)d56f/e59r/l88n/d90n/d91n/q126r/d134r/e139k)8(seqidno:50,其具有突变d56f/e59r/l88n/d90n/d91n/q126r/d134r/e139k和氨基酸l74/g75/d118/l119的缺失)的dna(seqidno:51)的易位。

图35显示电流迹线的两个十秒截屏,其显示在无酶控制的情况下通过csgg-eco-(y51a/f56q/r97w/r192d-strepii(c))9(具有突变y51a/f56q/r97w/r192d的seqidno:2,其中strepii(c)是seqidno:47且在c端处连接)的dna(seqidno:51)的易位。

图36显示电流迹线的两个十秒截屏,其显示在无酶控制的情况下通过csgg-eco-(y51a/f56q/r97w/e101s/r192d-strepii(c))9(具有突变y51a/f56q/r97w/e101s/r192d的seqidno:2,其中strepii(c)是seqidno:47且在c端处连接)的dna(seqidno:51)的易位。

图37显示csgg突变孔的两个凝胶过滤色谱图(120mls200色谱柱)的重叠,所述csgg突变孔:a)csgg-eco-(y51a/f56q/r97w)-strepii(c))9(具有突变y51a/f56q/r97w的seqidno:2,其中strepii(c)是seqidno:47且在c端处连接);和b)csgg-eco-(y51a/f56q/r97w/r192d)-strepii(c))9(具有突变y51a/f56q/r97w/r192d的seqidno:2,其中strepii(c)是seqidno:47且在c端处连接)。csgg-eco-(y51a/f56q/r97w)-strepii(c))9在a280下的吸光度标记为a,且csgg-eco-(y51a/f56q/r97w/r192d)-strepii(c))9在a280下的吸光度标记为b。使两个构筑体均在500ml培养基中生长。使用加载到上色谱柱完全相同的方案和相同的体积来对两个蛋白质进行表达和纯化。电泳缓冲液是25mmtris、150mmnacl、2mmedta、0.01%ddm、0.1%sdsph8。csgg-eco-(y51a/f56q/r97w)-strepii(c))9孔的级分延迟是归因于在akta纯化器10上使用的不同连接配置。吸光度值的差异指示所表达的蛋白质的量,其中吸光度值越高指示所表达的蛋白质的量越高。

图38显示csgg纳米孔的sds-page分析。泳道a-c含有csgg-eco-(y51a/f56q/r97w)-strepii(c))9;泳道d-f含有csgg-eco-(y51a/f56q/r97w/r192d)-strepii(c))9;和泳道m含有分子量标记。使用完全相同的方案来表达和纯化两个孔。在4-20%tgx凝胶(伯乐公司,目录号5671093)上在tgs缓冲液中在300v下使孔进行电泳22分钟。用宝石红染色剂(生命技术公司(lifetechnologies),目录号s1200)对凝胶进行染色。将相同体积的各孔样本加载到凝胶上,以比较在纯化之后所获得的蛋白质的量——泳道a和d含有5μl,泳道b和e含有10μl且泳道c和f含有15μl。

图39显示相较于基线孔突变28(csgg-(wt-y51a/f56q/r97w/r192d-strepii)9)的basecall准确度的八个csgg突变孔的basecall准确度。除由突变28中的r97w和r192d取代造成的准确度改进以外,d195-l199(突变a)、f193-l199(突变b)或v105-i107(突变d)的缺失,或f191t(突变c)的取代使得准确度进一步改进。还在含有额外k94q突变(突变e)的突变孔中测试了对于缺失v105-i107的basecall准确度的效果,且仍观测到准确度相较于基线突变28的改进。引入r93w突变(突变f)或两个r93y和r97w突变(突变h)而非r97w突变(基线突变28),增加basecall准确度。除r93w(突变g)以外的缺失d195-l199引起basecall准确度增强。

图40显示基线突变28csgg-(wt-y51a/f56q/r97w/r192d-strepii)9和突变d的模板速度分布(a)和模板准确度分布(b),所述突变d包含额外的v105-i107的缺失。如实例中所描述,制备模板dna,且通过突变孔。如实例中所描述,测定模板速度和准确度。图40a显示,当使用突变d时,速度分布相较于基线突变更为紧密。图40b显示,突变d相较于基线突变具有更紧密的模板分布。

图41显示实例“波浪线”,其显示通过基线突变28csgg-(wt-y51a/f56q/r97w/r192d-strepii)9呈现的“噪声”孔误差模式。图41的上图显示在“良好”和“噪声”孔状态期间,通过孔的电流流的差异。图41的下图显示从“良好”状态过渡到“噪声”状态的放大图。

图42显示平均在至少5个回合内,与基线突变28具有相同序列但当相较于基线突变28时具有额外k94n突变(突变i)或额外k94q突变(突变j)的突变孔的噪声孔状态的减少,所述基线突变28含有y51a/f56q/r97w/r192d突变。

图43示出具有接合到其每一端的衔接子的模板链的结构。衔接子具有与其预结合的t4dda解螺旋酶。实例中使用的衔接子的各部分的序列显示于seqidno:52到55中。

图44显示突变csgg纳米孔的凝血酶结合适体(tba)事件之间的中值时间,所述突变csgg纳米孔包含以下取代中的一个:q42k(突变k)、e44n(突变l)、e44q(突变m)、l90r(突变n)、n91r(突变o)、i95r(突变p)、a99r(突变q)、e101h(突变r)、e101k(突变s)、e101n(突变t)、e101q(突变u)、e101t(突变v)和q114k(突变w)。中值时间相较于基线孔显著降低,所述基线孔包含突变y51a/f56q/k94q/r97w/r192d-del(v105-i107)(基线突变e),其所有也包括于所测试13个突变中的每一个中。图44显示q42k、e44n、e44q、l90r、n91r、i95r、a99r、e101h、e101k、e101n、e101q、e101t和q114k取代中的每一个增加模板dna捕获速率。图45显示对应于seqidno2、5、6、7、27、28、29、30、32、36、3、35、31、40、33、34、37、39、38、41和4的21种csgg同源物的序列比对

图46显示与图45相同的相对序列比对,其中所预测的α螺旋二级结构区另外加阴影。

图47显示与图45相同的相对序列比对,其中所预测的β折叠二级结构区另外加阴影。

图48显示孔aq和孔97w的原始电子资料的两个实例。

序列表的描述

seqidno:1显示来自大肠杆菌(escherchiacoli)菌株k-12亚株mc4100的编码野生型csgg单体的密码子优化聚核苷酸序列。这个单体不含信号序列。

seqidno:2显示来自大肠杆菌菌株k-12亚株mc4100的野生型csgg单体的成熟形式的氨基酸序列。这个单体不含信号序列。对于此使用的缩写为csgg=csgg-eco。

seqidno:3显示假定蛋白cko_02032[差异柠檬酸杆菌属(citrobacterkoseri)atccbaa-895]的yp_001453594.1:1-248的氨基酸序列,其与seqidno:299%一致。

seqidno:4显示卷曲生产组合件/转运组分csgg、部分[肠道沙门氏菌(salmonellaenterica)]的wp_001787128.1:16-238的氨基酸序列,其与seqidno:298%。

seqidno:5显示卷曲生产组合件/转运蛋白csgg[无丙二酸柠檬酸杆菌属(citrobacteramalonaticus)]的key44978.1|:16-277的氨基酸序列,其与seqidno:298%一致。

seqidno:6显示卷曲生产组合件/转运组分[鼠柠檬酸杆菌icc168(citrobacterrodentiumicc168)]的yp_003364699.1:16-277的氨基酸序列,其与seqidno:297%一致。

seqidno:7显示卷曲生产组合件/转运组分csgg[阿氏肠杆菌lf7a(enterobacterasburiaelf7a)]的yp_004828099.1:16-277的氨基酸序列,其与seqidno:294%一致。

seqidno:8显示编码phi29dna聚合酶的聚核苷酸序列。

seqidno:9显示phi29dna聚合酶的氨基酸序列。

seqidno:10显示衍生自大肠杆菌sbcb基因的密码子优化聚核苷酸序列。其编码大肠杆菌核酸外切酶i(ecoexoi)。

seqidno:11显示大肠杆菌核酸外切酶i(ecoexoi)的氨基酸序列。

seqidno:12显示衍生自大肠杆菌xtha基因的密码子优化聚核苷酸序列。其编码大肠杆菌核酸外切酶iii。

seqidno:13显示大肠杆菌核酸外切酶iii的氨基酸序列。这个酶执行来自双链dna(dsdna)的一条链的5′单磷酸酯核苷在3′-5′方向上的分配消化。链上的酶起始需要大致4个核苷酸的5′悬突。

seqidno:14显示衍生自极端嗜热菌(t.thermophilus)recj基因的密码子优化聚核苷酸序列。其编码极端嗜热菌recj酶(tthrecj-cd)。

seqidno:15显示极端嗜热菌recj酶(tthrecj-cd)的氨基酸序列。这个酶执行来自ssdna的5′单磷酸酯核苷在5′-3′方向上的进行性消化。链上的酶起始需要至少4个核苷酸。

seqidno:16显示衍生自噬菌体λexo(redx)基因的密码子优化聚核苷酸序列。其编码噬菌体λ核酸外切酶。

seqidno:17显示噬菌体λ核酸外切酶的氨基酸序列。所述序列是组装成三聚体的三个相同亚基中的一个。所述酶执行来自dsdna的一个链的核苷酸在5′-3′方向上的高度进行性消化(http://www,neb.com/nebecomm/products/productm0262.asp)。链上的酶起始优选地需要具有5′磷酸的大致4个核苷酸的5′悬突。

seqidno:18显示hel308mbu的氨基酸序列。

seqidno:19显示hel308csy的氨基酸序列。

seqidno:20显示hel308tga的氨基酸序列。

seqidno:21显示hel308mhu的氨基酸序列。

seqidno:22显示traieco的氨基酸序列。

seqidno:23显示xpdmbu的氨基酸序列。

seqidno:24显示dda1993的氨基酸序列。

seqidno:25显示trwccba的氨基酸序列。

seqidno:26显示转运体[雷金斯堡约克氏菌(yokenellaregensburgei)]的wp_006819418.1:19-280的氨基酸序列,其与seqidno:291%一致。

seqidno:27显示卷曲生产组合件/转运蛋白csgg[灰尘粘菌(cronobacterpulveris)]的wp_024556654.1:16-277的氨基酸序列,其与seqidno:289%一致。

seqidno:28显示卷曲生产组合件/转运蛋白csgg[水生拉恩菌hx2(rahnellaaquatilishx2)]的yp_005400916.1:16-277的氨基酸序列,其与seqidno:284%一致。

seqidno:29显示csgg家族卷曲生产组合件/转运组分[抗坏血酸吕克沃尔菌(kluyveraascorbata)atcc33433]的kfc99297.1:20-278的氨基酸序列,其与seqidno:282%一致。

seqidno:30显示csgg家族卷曲生产组合件/转运组分[蜂房哈夫尼菌(hafniaalvei)atcc13337]的kfc86716.1|:16-274的氨基酸序列,其与seqidno:281%一致。

seqidno:31显示涉及形成卷曲聚合物[肠杆菌科细菌菌株fgi57]的未定性蛋白质的yp_007340845.1|:16-270的氨基酸序列,其与seqidno:276%一致。

seqidno:32显示卷曲生产组合件/转运蛋白csgg[类志贺邻单胞菌(plesiomonasshigelloides)]的wp_010861740.1:17-274的氨基酸序列,其与seqidno:270%一致。

seqidno:33显示卷曲生产组合件/转运外膜脂蛋白组分csgg[费希弧菌(vibriofischeri)es114]的yp_205788.1:23-270的氨基酸序列,其与seqidno:260%一致。

seqidno:34显示卷曲生产组合件蛋白质csgg[洛伊氏弧菌(aliivibriologei)]的wp_017023479.1:23-270的氨基酸序列,其与seqidno:259%一致。

seqidno:35显示卷曲生产组合件/转运组分csgg[发光杆菌属(photobacteriumsp.)ak15]的wp_007470398.1:22-275的氨基酸序列,其与seqidno:257%一致。

seqidno:36显示卷曲生产组合件蛋白质csgg[维氏气单胞菌(aeromonasveronii)]的wp_021231638.1:17-277的氨基酸序列,其与seqidno:256%一致。

seqidno:37显示卷曲生产组合件/转运蛋白csgg[希瓦氏菌属(shewanellasp.)ecsmb14101]的wp_033538267.1:27-265的氨基酸序列,其与seqidno:256%一致。

seqidno:38显示卷曲生产组合件蛋白质csgg[恶臭假单胞菌(pseudomonasputida)]的wp_003247972.1:30-262的氨基酸序列,其与seqidno:254%一致。

seqidno:39显示卷曲生产组合件/转运组分csgg[堇色希瓦氏菌(shewanellaviolacea)dss12]的yp_003557438.1:1-234的氨基酸序列,其与seqidno:253%一致。

seqidno:40显示卷曲生产组合件/转运蛋白csgg[詹氏海杆菌(marinobacteriumjannaschii)]的wp_027859066.1:36-280的氨基酸序列,其与seqidno:253%一致。

seqidno:41显示卷曲生产组合件/转运组分csgg[生鲜奶金黄杆菌属(chryseobacteriumoranimense)g311]的cej70222.1:29-262的氨基酸序列,其与seqidno:250%一致。

seqidno:42显示实例2中使用的聚核苷酸序列。

seqidno:43显示实例2中使用的聚核苷酸序列。

seqidno:44显示实例2中使用的聚核苷酸序列。

seqidno:45显示实例2中使用的聚核苷酸序列。

seqidno:46显示实例2中使用的聚核苷酸序列。连接于seqidno:46的3′端的是六个isp18间隔子,其在两个胸腺嘧啶和3′胆固醇teg相对端处连接。

seqidno:47显示strepii(c)的聚核苷酸序列。

seqidno:48显示pro的聚核苷酸序列。

seqidno:49显示编码野生型mspa单体的密码子优化聚核苷酸序列。这个突变不含信号序列。

seqidno:50显示野生型mspa单体的成熟形式的氨基酸序列。这个突变不含信号序列。

seqidno:51显示在实例7和11中使用的凝血酶结合适体的聚核苷酸序列。

seqidno:52显示y衔接子上链的聚核苷酸序列。

seqidno:53显示y衔接子阻断链的聚核苷酸序列。

seqidno:54显示y衔接子胆固醇系链链的聚核苷酸序列。

seqidno:55显示y衔接子下链的聚核苷酸序列。

seqidno:56显示在实例中使用的3.6kb双链dna靶序列的聚核苷酸序列。

具体实施方式

应理解,所公开产物和方法的不同应用可根据所属领域的特定需要来调适。还应理解,本文所用的术语仅出于描述本发明的特定实施例的目的,并且不打算是限制性的。

另外除非上下文另外明确规定,否则如本说明书和所附权利要求书中所使用,单数形式“一(a/an)”和“所述(the)”包括多个指示物。因此,举例来说,提及“聚核苷酸”包括两个或更多个聚核苷酸;提及“一聚核苷酸结合蛋白”包括两个或更多个此类蛋白质;提及“一解螺旋酶”包括两个或更多个解螺旋酶;提及“一单体”是指两个或更多个单体;提及“一孔”包括两个或更多个孔和其类似物。

本文中(不论上文或下文)所列举的所有公开、专利和专利申请均以全文引用的方式并入本文中。

突变csgg单体

本发明的一方面提供突变csgg单体。突变csgg单体可用于形成本发明的孔。突变csgg单体是其序列不同于野生型csgg单体的序列且保持形成孔的能力的单体。用于确定突变单体形成孔的能力的方法在所属领域中是众所周知的,且在下文更详细地论述。

由本发明的一些实施例的csgg单体(包含修饰r97w)构筑的孔显示,当表征(或测序)靶聚核苷酸时,相较于在97处无修饰的其它相同孔,准确度增加。当本发明的csgg单体包含修饰r93w或修饰r93y和r97y而非r97w时,也看到准确度增加。因此,可由一或多个突变csgg单体来构筑孔,所述突变csgg单体包含seqidno:2的r97或r93处的修饰,使得所述修饰增加氨基酸的疏水性。举例来说,此类修饰可包括被含有疏水性侧链的任何氨基酸,包括例如(但不限于)w和y,取代的氨基酸取代。

本发明的一些实施例的包含r192d/q/f/s/t的csgg单体比在位置192处不具有取代的单体更容易表达,这可归因于正电荷的减少。因此,位置192可被降低正电荷的氨基酸取代。本发明的包含r192d/q/f/s/t的单体还可包含额外修饰,所述修饰改进由单体形成的突变孔与分析物(如聚核苷酸)相互作用和表征的能力。

当表征(或测序)靶聚核苷酸时,包含本发明的一些实施例的csgg单体的孔显示准确度增加,所述csgg单体包含v105、a106和i107的缺失,f193、i194、d195、y196、q197、r198和l199的缺失,或d195、y196、q197、r198和l199的缺失和/或f191t。在位置105到107处的氨基酸对应于纳米孔帽中的顺式环;且在位置193到199处的氨基酸对应于孔另一端处的反式环。不希望受理论所束缚,认为,顺式环的缺失改进酶与孔的相互作用,且反式环的移除减少孔反侧上的dna之间的任何不需要的相互作用。

包含本发明的一些实施例的csgg单体的孔,所述csgg单体包含k94q或k94n,显示当表征(或测序)靶聚核苷酸时,相较于在94处无突变的相同孔,噪声孔(即引起信号:噪声比增加的那些孔)的数量减少。发现位置94是在孔的孔室内,且发现是一个关于电流信号噪声的尤其敏感的位置。

包含本发明的一些实施例的csgg单体的孔,所述csgg单体包含t104k或t104r、n91r、e101k/n/q/t/h、e44n/q、q114k、a99r、i95r、n91r、l90r、e44q/n和/或q42k,均表明当用于表征(或测序)靶聚核苷酸时,相较于在这些位置处无取代的相同孔,捕获靶聚核苷酸的能力改进。

使用跨膜孔表征(如测序)聚核苷酸可如在国际申请第pct/gb2012/052343号(公开为wo2013/041878)中所公开来进行。由于靶聚核苷酸相对于孔移动或移动通过孔,可通常通过测量流过孔的离子电流来从所产生的独特离子电流标志来表征分析物。在任何特定时间处测量的电流电平通常取决于一组k聚合物(例如核苷酸)单元,其中k是正整数,且典型电流标志可表示为指示特定k聚体的一系列电流电平。聚核苷酸相对于(如通过)孔的移动可视为从一个k聚体移动到另一个或从k聚体移动到k聚体。表征聚核苷酸的分析技术可例如涉及使用hmm、神经网络和例如前向-后向算法或维特比算法(viterbialgorithm)来测定对应于特定序列的一系列测量的可能性。或者,聚核苷酸可通过测定特征向量和将特征向量与另一特征向量进行比较来表征,所述另一特征向量可为已知的,如在国际申请第pct/gb2013/050381号(公开为wo2013/121224)中所公开。然而,用于表征聚核苷酸的分析技术不必限于以上实例。

当本发明的单体形成跨膜孔且与聚核苷酸结合蛋白一起使用以表征靶聚核苷酸时,一些经修饰位置与聚核苷酸结合蛋白相互作用。举例来说,当单体形成跨膜孔且与聚核苷酸结合蛋白一起使用以表征靶聚核苷酸时,r97w与聚核苷酸结合蛋白相互作用。修饰根据本发明的csgg单体通常提供靶聚核苷酸相对于(如通过)包含单体的跨膜孔的更一致移动。在靶聚核苷酸相对于(如通过)孔移动时,修饰通常提供从一个k聚体到另一个或从k聚体到k聚体的更一致移动。修饰通常允许靶聚核苷酸相对于(如通过)跨膜孔更平稳地移动。修饰通常提供靶聚核苷酸相对于(如通过)跨膜孔更规则或更不规则的移动。

修饰根据本发明的csgg单体(例如r97w)通常降低与靶聚核苷酸相对于(如通过)包含单体的孔移动相关的正向滑动的量。在实例中使用的包括dda解螺旋酶的一些解螺旋酶沿聚核苷酸在5′到3′方向上移动。当聚核苷酸的5′端(远离解螺旋酶移动的末端)由孔捕获时,解螺旋酶按照由所施加的电势造成的场的方向起作用,且将交织的聚核苷酸移动到孔中且移动到反式腔室中。正向滑动涉及dna相对于孔正向移动(即朝向其3′且远离其5′端移动)至少4个连续核苷酸且通常大于10个连续核苷酸。正向滑动可涉及正向移动100个连续核苷酸或更多,且这可在各链中发生大于一次。

修饰csgg单体可降低与靶聚核苷酸相对于(如通过)包含单体的跨膜孔移动相关的噪声。在分析信号时靶聚核苷酸在任何方向上的不需要的移动通常造成电流标志或k聚体电平中的噪声。修饰可通过降低靶聚核苷酸中的与一或多个k聚体(如各k聚体)相关的不需要的移动,来降低这种噪声。修饰可降低靶聚核苷酸中的与一或多个k聚体(如各k聚体)的电流电平或标志相关的噪声。

对于聚核苷酸采用的酶马达在完全催化周期中具有多个步骤,其中atp水解以使聚核苷酸正向移动一个碱基(例如结合atp.mg,水解以产生adp.p.mg,使聚核苷酸正向移动一个碱基,且释放adp/p/mg副产物)。各子步骤过程具有通过所述过程的动力学所测定的特有停留时间分布。如果催化周期的这些子步骤的任一个在读取器中移动聚核苷酸的位置(例如通过相对于酶移动聚核苷酸,或通过改变孔顶部上的酶的位置),接着这可观测为通过孔的电流变化,只要所述变化持续足够长以通过采集电子设备检测到即可。如果子步骤过程未引起构形改变或聚核苷酸中的移动,或发生地太快而难以观测到,那么在理想系统中,对于聚核苷酸正向移动一个整数碱基,完全催化周期将仅引起电流的一个阶跃变化。

对于不含有r97w的孔(例如pro-cp1-eco-(wt-y51a/f56q-strepii(c))9),我们观测到以大致取决于atp.mg浓度的指数停留分布的很长的停留时间水平(其通过模型预测)。对于孔aq,我们也观测到主要电平之间的短暂的子步骤电流电平,如在图48中标示。因为子步骤电流电平是短暂的,所以其在两个相隔较宽的电流电平之间的空隙中最容易观测到。子步骤电平对应于聚核苷酸的中等大致0.5个碱基移动,且在这些条件下,具有大致3毫秒的atp.mg独立的停留时间。

含有r97w的孔(例如pro-cp1-eco-(wt-y51a/f56q/r97w-strepii(c))9)显示类似很长的具有atp.mg依赖性停留时间的主要电平,但在这些条件下或在采集频率下,不显示独特中间子步骤电流电平的迹象(可能解释为,其未发生,发生地太快而难以观测,或子步骤确实发生且对于观测原则上足够缓慢,但实际上其归因于例如酶与孔相互作用的方式而不能观测到)。

原始数据迹线(图48)显示,对于孔pro-cp1-eco-(wt-y51a/f56q/r97w-strepii(c))9(孔97w)和pro-cp1-eco-(wt-y51a/f56q-strepii(c))9(孔aq),通过纳米孔的酶控制dna链易位的相对于时间(x轴,秒)的离子电流(y轴,pa)迹线。各电流电平是保持在纳米孔读取器中的序列改变离子流的结果,且当聚核苷酸改变在纳米孔中的位置时,例如当酶使整个链正向移动一个碱基时,观测到电流逐步变化。在此情况下,dna链部分地含有重复序列(ggtt)n。通过将dda酶负载到合成dna聚核苷酸上和在记录原始数据输出的minion上运行来获得数据(顺式缓冲液:500mmkcl、25mmhepes、ph8、0.6mmmgcl2、0.6mmatp、140mv、37℃、5khz采集频率)。孔97w仅显示来自聚核苷酸的整数个逐步动作的主要电流电平,在电平之间无显著数据密度。相比而言,孔aq具有显著的中间子步骤电平,如在图48中由箭头标示。

突变单体优选地具有改进的聚核苷酸读取特性,即显示改进的聚核苷酸捕获和核苷酸鉴别。特定来说,由突变单体构筑的孔优选地比野生型更容易地捕获核苷酸和聚核苷酸。另外,由突变单体构筑的孔优选地显示电流范围增加和状态变化降低,所述电流范围增加使得更容易在不同核苷酸之间进行鉴别,所述状态变化降低增加信噪比。

另外,优选地减少在聚核苷酸移动通过由突变构筑的孔时引起电流的核苷酸的数量。这使得其更容易鉴定在聚核苷酸移动通过孔时所观测的电流与聚核苷酸序列之间的直接关系。另外,由突变单体构筑的孔可显示增加的输送量,即更可能与分析物(如聚核苷酸)相互作用。这使得使用孔更容易表征分析物。可更容易地将由突变单体构筑的孔插入到膜中。本发明的突变单体包含seqidno:2中所示序列的变异体。seqidno:2是来自大肠杆菌菌株k-12亚株mc4100的野生型csgg单体。seqidno:2的变异体是具有不同于seqidno:2的氨基酸序列且保持其形成孔的能力的多肽。可使用本领域中已知的任何方法来分析变异体形成孔的能力。举例来说,可将变异体连同其它适当亚基一起插入到两亲层中,且可测定其寡聚形成孔的能力。用于将亚基插入到膜(如两亲层)中的方法在本领域中已知。举例来说,可将纯化形式的亚基悬浮于含有三嵌段共聚物膜的溶液中,使得其扩散到膜中且通过结合于膜和组装成功能性状态来插入。

在本文的所有论述中,使用标准的针对氨基酸的一个字母代码。这些如下:丙氨酸(a)、精氨酸(r)、天冬酰胺(n)、天冬氨酸(d)、半胱氨酸(c)、谷氨酸(e)、谷氨酰氨(q)、甘氨酸(g)、组氨酸(h)、异亮氨酸(i)、亮氨酸(l)、赖氨酸(k)、甲硫氨酸(m)、苯丙氨酸(f)、脯氨酸(p)、丝氨酸(s)、苏氨酸(t)、色氨酸(w)、酪氨酸(y)和缬氨酸(v)。也使用标准的取代记法,即q42r意指位置42处的q被r置换。

在本发明的突变单体的一个实施例中,seqidno:2的变异体包含(a)在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变):i41、r93、a98、q100、g103、t104、a106、1107、n108、l113、s115、t117、y130、k135、e170、s208、d233、d238和e244;和/或(b)以下中的一或多个:d43s、e44s、f48s/n/q/y/w/i/v/h/r/k、q87n/r/k、n91k/r、k94r/f/y/w/l/s/n、r97f/y/w/v/i/k/s/q/h、e101i/l/a/h、n102k/q/l/i/v/s/h、r110f/g/n、q114r/k、r142q/s、t150y/a/v/l/s/q/n、r192d/q/f/s/t和d248s/n/q/k/r。变异体可包含(a);(b);或(a)和(b)。

在本发明的一些实施例中,seqidno:2的变异体包含r97w。

在本发明的一些实施例中,seqidno:2的变异体包含r192d/q/f/s/t,优选地r192d/q,更优选地r192d。在(a)中,变异体可包含任何数量的位置和位置的组合处的修饰,如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18或19个位置。在(a)中,变异体优选地包含以下中的一或多个:i41n、r93f/y/w/l/i/v/n/q/s、a98k/r、q100k/r、g103f/w/s/n/k/r、t104r/k、a106r/k、1107r/k/w/f/y/l/v、n108r/k、l113k/r、s115r/k、t117r/k、y130w/f/h/q/n、k135l/v/n/q/s、e170s/n/q/k/r、s208v/i/f/w/y/l/t、d233s/n/q/k/r、d238s/n/q/k/r和e244s/n/q/k/r。

在(a)中,变异体优选地包含提供靶聚核苷酸相对于(如通过)包含单体的跨膜孔的更一致移动的一或多个修饰。特定来说,在(a)中,变异体优选地包含在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变):r93、g103和i107。变异体可包含r93、g103、i107、r93和g103、r93和i107、g103和i107,或r93,g103和i107。变异体优选地包含以下中的一或多个:r93f/y/w/l/i/v/n/q/s、g103f/w/s/n/k/r和i107r/k/w/f/y/l/v。这些可以针对位置r93、g103和i107所示的任何组合存在。

在(a)中,变异体优选地包含允许由突变单体构筑的孔优选地更容易捕获核苷酸和聚核苷酸的一或多个修饰。特定来说,在(a)中,变异体优选地包含在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变):i41、t104、a106、n108、l113、s115、t117、e170、d233、d238和e244。变异体可包含任何数量的位置和位置的组合处的修饰,如1、2、3、4、5、6、7、8、9、10或11个位置。变异体优选地包含以下中的一或多个:i41n、t104r/k、a106r/k、n108r/k、l113k/r、s115r/k、t117r/k、e170s/n/q/k/r、d233s/n/q/k/r、d238s/n/q/k/r和e244s/n/q/k/r。另外或替代地,变异体可包含(c)q42k/r、e44n/q、l90r/k、n91r/k、i95r/k、a99r/k、e101h/k/n/q/t和/或q114k/r。

在(a)中,变异体优选地包含提供更一致移动和增加捕获的一或多个修饰。特定来说,在(a)中,变异体优选地包含在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变)(i)a98、(ii)q100、(iii)g103和(iv)i107。变异体优选地包含以下中的一或多个:(i)a98r/k、(ii)q100k/r、(iii)g103k/r和(iv)i107r/k。变异体可包含{i};{ii};{iii};{iv};{i,ii};{i,iii};{i,iv};{ii,iii};{ii,iv};{iii,iv};{i,ii,iii};{i,ii,iv};{i,iii,iv};{ii,iii,iv}或{i,ii,iii,iv}。

特别优选的是,提供增加捕获分析物(如聚核苷酸)的突变单体包括在位置q42、e44、e44、l90、n91、i95、a99、e101和q114中的一或多个处的突变,所述突变移除在突变位置处的负电荷和/或增加正电荷。特定来说,以下突变可包括于本发明的突变单体中,以产生具有改进的捕获分析物的能力的csgg孔,优选地聚核苷酸:q42k、e44n、e44q、l90r、n91r、i95r、a99r、e101h、e101k、e101n、e101q、e101t和q114k。包含这些突变中的一个与其它有益突变组合的特定突变单体的实例描述于实例11中。

在(a)中,变异体优选地包含提供增加的表征准确度的一或多个修饰。特定来说,在(a)中,变异体优选地包含在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变):y130、k135和s208,如y130、k135、s208、y130和k135,y130和s208,k135和s208,或y130、k135和s208。变异体优选地包含以下中的一或多个:y130w/f/h/q/n、k135l/v/n/q/s和r142q/s。这些取代可以任何数量和组合存在,如针对y130、k135和s208所陈述。

在(b)中,变异体可包含任何数量的取代和取代的组合,如1、2、3、4、5、6、7、8、9、10、11或12个取代。在(b)中,变异体优选地包含提供靶聚核苷酸相对于(如通过)包含单体的跨膜孔更一致移动的一或多个修饰。特定来说,在(b)中,变异体优选地包含以下中的一或多个:(i)q87n/r/k、(ii)k94r/f/y/w/l/s/n、(iii)r97f/y/w/v/i/k/s/q/h、(iv)n102k/q/l/i/v/s/h和(v)r110f/g/n。更优选地,变异体包含k94d或k94q和/或r97w或r97y。变异体可包含:{i};{ii};{iii};{iv};{v};{i,ii};{i,iii};{i,iv};{i,v};{ii,iii};{ii,iv};{ii,v};{iii,iv};{iii,v};{iv,v};{i,ii,iii};{i,ii,iv};{i,ii,v};{i,iii,iv};{i,iii,v};{i,iv,v};{ii,iii,iv};{ii,iii,v};{ii,iv,v};{iii,iv,v};{i,ii,iii,iv};{i,ii,iii,v};{i,ii,iv,v};{i,iii,iv,v};{ii,iii,iv,v}或{i,ii,iii,iv,v}。经修饰以提供靶聚核苷酸相对于(如通过)包含单体的跨膜孔更一致移动的其它优选变异体包括(vi)r93w和r93y。优选变异体可包含r93w和r97w、r93y和r97w、r93w和r97w,或更优选地r93y和r97y。变异体可包含:{vi};{i,vi};{ii,vi};{iii,vi};{iv,vi};{v,vi};{i,ii,vi};{i,iii,vi};{i,iv,vi};{i,v,vi};{ii,iii,vi};{ii,iv,vi};{ii,v,vi};{iii,iv,vi};{iii,v,vi};{iv,v,vi}、{i,ii,iii,vi};{i,ii,iv,vi};{i,ii,v,vi},{i,iii,iv,vi};{i,iii,v,vi};{i,iv,v,vi};{ii,iii,iv,vi};{ii,iii,v,vi};{ii,iv,v,vi};{iii,iv,v,vi}、{i,ii,iii,iv,vi}、{i,ii,iii,v,vi};{i,ii,iv,v,vi};{i,iii,iv,v,vi};{ii,iii,iv,v,vi}或{i,ii,iii,iv,v,vi}。

在(b)中,变异体优选地包含允许由突变单体构筑的孔优选地更容易捕获核苷酸和聚核苷酸的一或多个修饰。特定来说,在(b)中,变异体优选地包含以下中的一或多个:(i)d43s、(ii)e44s、(iii)n91k/r、(iv)q114r/k和(v)d248s/n/q/k/r。变异体可包含:{i};{ii};{iii};{iv};{v};{i,ii};{i,iii};{i,iv};{i,v};{ii,iii};{ii,iv};{ii,v};{iii,iv};{iii,v};{iv,v};{i,ii,iii};{i,ii,iv};{i,ii,v};{i,iii,iv};{i,iii,v};{i,iv,v};{ii,iii,iv};{ii,iii,v};{ii,iv,v};{iii,iv,v};{i,ii,iii,iv};{i,ii,iii,v};{i,ii,iv,v};{i,iii,iv,v};{ii,iii,iv,v}或{i,ii,iii,iv,v}。

在(b)中,变异体优选地包含提供更一致移动和增加捕获的一或多个修饰。特定来说,在(b)中,变异体优选地包含以下中的一或多个:q87r/k、e101i/l/a/h和n102k,如q87r/k;e101i/l/a/h;n102k;q87r/k和e101i/l/a/h;q87r/k和n102k;e101i/l/a/h和n102k;或q87r/k、e101i/l/a/h和n102k。

在(b)中,变异体优选地包含提供增加的表征准确度的一或多个修饰。特定来说,在(a)中,变异体优选地包含f48s/n/q/y/w/i/v。

在(b)中,变异体优选地包含提供表征准确度增加和捕获增加的一或多个修饰。特定来说,在(a)中,变异体优选地包含f48h/r/k。

变异体可包含(a)和(b)两个中的提供更一致移动的修饰。变异体可包含(a)和(b)两个中的提供捕获增加的修饰。

本发明提供seqidno:2的变异体,其使用包含变异体的孔提供增加输送量的用于表征分析物(如聚核苷酸)的分析。此类变异体可包含k94处,优选地k94q或k94n处,更优选地k94q处的突变。包含k94q或k94n突变与其它有益突变组合的特定突变单体的实例描述于实例10和11中。

本发明提供seqidno:2的变异体,其使用包含变异体的孔在用于表征分析物(如聚核苷酸)的分析提供增加的表征准确度。此类变异体包括包含以下的变异体:f191处,优选地f191t处的突变;v105-i107的缺失;f193-l199或d195-l199的缺失;和/或r93和/或r97处,优选地r93y、r97y处,,或更优选地r97w、r93w或r97y和r97y两个处的突变。包含这些突变中的一或多个与其它有益突变组合的特定突变单体的实例描述于实例9中。

在本发明的突变单体的另一实施例中,seqidno:2的变异体包含:(a)一或多个位置r192、f193、i194、d195、y196、q197、r198、l199、l200和e201的缺失;和/或(b)以下中的一或多个的缺失:v139/g140/d149/t150/v186/q187/v204/g205(在本文中称为条带1)、g137/g138/q151/y152/y184/e185/y206/t207(在本文中称为条带2)和a141/r142/g147/a148/a188/g189/g202/e203(在本文中称为条带3)。

在(a)中,变异体可包含任何数量的位置和位置的组合的缺失,如1、2、3、4、5、6、7、8、9或10个位置。在(a)中,变异体优选地包含以下的缺失:

-d195、y196、q197、r198和l199;

-r192、f193、i194、d195、y196、q197、r198、l199和l200;

-q197、r198、l199和l200;

-i194、d195、y196、q197、r198和l199;

-d195、y196、q197、r198、l199和l200;

-y196、q197、r198、l199、l200和e201;

-q197、r198、l199、l200和e201;

-q197、r198、l199;或

-f193、i194、d195、y196、q197、r198和l199。

更优选地,变异体包含以下的缺失:d195、y196、q197、r198和l199或f193、i194、d195、y196、q197、r198和l199。在(b)中,可缺失任何数量的条带和条带1到3的组合,如条带1、条带2、条带3条带1和2、条带1和3、条带2和3,或条带1、2和3。

变异体可包含根据(a)、(b),或(a)和(b)的缺失。

包含根据以上(a)和/或(b)的一或多个位置的缺失的变异体可进一步包含上文和下文所论述的修饰或取代中的任一个。如果在出现于seqidno:2中的缺失位置之后的一或多个位置处进行修饰或取代,那么修饰或取代的一或多个位置的编号必须进行相应的调整。举例来说,如果缺失l199,那么e244变为e243。类似地,如果缺失条带1,那么r192变为r186。

在本发明的突变单体的另一实施例中,seqidno:2的变异体包含(c)一或多个位置v105、a106和i107的缺失。除根据(a)和/或(b)的缺失以外,可进行根据(c)的缺失。

上文所描述的缺失通常降低与靶聚核苷酸相对于(如通过)包含单体的跨膜孔移动相关的噪声。因此,可更准确地表征靶聚核苷酸。

在于特定位置处的不同氨基酸通过/符号分隔的以上段落中,/符号意指“或”。举例来说,q87r/k意指q87r或q87k。

本发明提供seqidno:2的变异体,其提供增加的分析物(如聚核苷酸)的捕获。此类变异体可包含:t104处,优选地t104r或t104k处的突变;n91处,优选地n91r处的突变;e101处,优选地e101k/n/q/t/h处的突变;位置e44处,优选地e44n或e44q处的突变;和/或位置q42处,优选地q42k处的突变。

在seqidno:2中不同位置处的突变可以任何可能的方法来进行组合。特定来说,本发明的单体可包含:改进准确度的一或多个突变、降低噪声的一或多个突变、和/或增强捕获分析物的一或多个突变。

在本发明的突变单体中,seqidno:2的变异体优选地包含以下中的一或多个:(i)在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变):n40、d43、e44、s54、s57、q62、r97、e101、e124、e131、r142、t150和r192,如在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变)n40、d43、e44、s54、s57、q62、e101、e131andt150orn40、d43、e44、e101和e131;(ii)在y51/n55、y51/f56、n55/f56或y51/n55/f56处的突变;(iii)q42r或q42k;(iv)k49r;(v)n102r、n102f、n102y或n102w;(vi)d149n、d149q或d149r;(vii)e185n、e185q或e185r;(viii)d195n、d195q或d195r;(ix)e201n、e201q或e201r;(x)e203n、e203q或e203r;和(xi)以下位置中的一或多个的缺失:f48、k49、p50、y51、p52、a53、s54、n55、f56和s57。变异体可包含(i)到(xi)的任何组合。特定来说,变异体可包含:(其中由空格分隔的圆括号{}中的各变异体表示来自变异体列表的任选变异体,即{i}或{ii}或{iii}或{iv}或{v}等){i}{ii}{iii}{iv}{v}{vi}{vii}{viii}{ix}{x}{xi}{i,ii}{i,iii}{i,iv}{i,v}{i,vi}{i,vii}{i,viii}{i,ix}{i,x}{i,xi}{ii,iii}{ii,iv}{ii,v}{ii,vi}{ii,vii}{ii,viii}{ii,ix}{ii,x}{ii,xi}{iii,iv}{iii,v}{iii,vi}{iii,vii}{iii,viii}{iii,ix}{iii,x}{iii,xi}{iv,v}{iv,vi}{iv,vii}{iv,viii}{iv,ix}{iv,x}{iv,xi}{v,vi}{v,vii}{v,viii}{v,ix}{v,x}{v,xi}{vi,vii}{vi,viii}{vi,ix}{vi,x}{vi,xi}{vii,viii}{vii,ix}{vii,x}{vii,xi}{viii,ix}{viii,x}{viii,xi}{ix,x}{ix,xi}{x,xi}{i,ii,iii}{i,ii,iv}{i,ii,v}{i,ii,vi}{i,ii,vii}{i,ii,viii}{i,ii,ix}{i,ii,x}{i,ii,xi}{i,iii,iv}{i,iii,v}{i,iii,vi}{i,iii,vii}{i,iii,viii}{i,iii,ix}{i,iii,x}{i,iii,xi}{i,iv,v}{i,iv,vi}{i,iv,vii}{i,iv,viii}{i,iv,ix}{i,iv,x}{i,iv,xi}{i,v,vi}{i,v,vii}{i,v,viii}{i,v,ix}{i,v,x}{i,v,xi}{i,vi,vii}{i,vi,viii}{i,vi,ix}{i,vi,x}{i,vi,xi}{i,vii,viii}{i,vii,ix}{i,vii,x}{i,vii,xi}{i,viii,ix}{i,viii,x}{i,viii,xi}{i,ix,x}{i,ix,xi}{i,x,xi}{ii,iii,iv}{ii,iii,v}{ii,iii,vi}{ii,iii,vii}{ii,iii,viii}{ii,iii,ix}{ii,iii,x}{ii,iii,xi}{ii,iv,v}{ii,iv,vi}{ii,iv,vii}{ii,iv,viii}{ii,iv,ix}{ii,iv,x}{ii,iv,xi}{ii,v,vi}{ii,v,vii}{ii,v,viii}{ii,v,ix}{ii,v,x}{ii,v,xi}{ii,vi,vii}{ii,vi,viii}{ii,vi,ix}{ii,vi,x}{ii,vi,xi}{ii,vii,viii}{ii,vii,ix}{ii,vii,x}{ii,vii,xi}{ii,viii,ix}{ii,viii,x}{ii,viii,xi}{ii,ix,x}{ii,ix,xi}{ii,x,xi}{iii,iv,v}{iii,iv,vi}{iii,iv,vii}{iii,iv,viii}{iii,iv,ix}{iii,iv,x}{iii,iv,xi}{iii,v,vi}{iii,v,vii}{iii,v,viii}{iii,v,ix}{iii,v,x}{iii,v,xi}{iii,vi,vii}{iii,vi,viii}{iii,vi,ix}{iii,vi,x}{iii,vi,xi}{iii,vii,viii}{iii,vii,ix}{iii,vii,x}{iii,vii,xi}{iii,viii,ix}{iii,viii,x}{i,ii,iii,iv}{i,ii,iii,v}{i,ii,iii,vi}{i,ii,iii,vii}{i,ii,iii,viii}{i,ii,iii,ix}{i,ii,iii,x}{i,ii,iii,xi}{i,ii,iv,v}{i,ii,iv,vi}{i,ii,iv,vii}{i,ii,iv,viii}{i,ii,iv,ix}{i,ii,iv,x}{i,ii,iv,xi}{i,ii,v,vi}{i,ii,v,vii}{i,ii,v,viii}{i,ii,v,ix}{i,ii,v,x}{i,ii,v,xi}{i,ii,vi,vii}{i,ii,vi,viii}{i,ii,vi,ix}{i,ii,vi,x}{i,ii,vi,xi}{i,ii,vii,viii}{i,ii,vii,ix}{i,ii,vii,x}{i,ii,vii,xi}{i,ii,viii,ix}{i,ii,viii,x}{i,ii,viii,xi}{i,ii,ix,x}{i,ii,ix,xi}{i,ii,x,xi}{i,iii,iv,v}{i,iii,iv,vi}{i,iii,iv,vii}{i,iii,iv,viii}{i,iii,iv,ix}{i,iii,iv,x}{i,iii,iv,xi}{i,iii,v,vi}{i,iii,v,vii}{i,iii,v,viii}{i,iii,v,ix}{i,iii,v,x}{i,iii,v,xi}{i,iii,vi,vii}{i,iii,vi,viii}{i,iii,vi,ix}{i,iii,vi,x}{i,iii,vi,xi}{i,iii,vii,viii}{i,iii,vii,ix}{i,iii,vii,x}{i,iii,vii,xi}{i,iii,viii,ix}{i,iii,viii,x}{i,iii,viii,xi}{i,iii,ix,x}{i,iii,ix,xi}{i,iii,x,xi}{i,iv,v,vi}{i,iv,v,vii}{i,iv,v,viii}{i,iv,v,ix}{i,iv,v,x}{i,iv,v,xi}{i,iv,vi,vii}{i,iv,vi,viii}{i,iv,vi,ix}{i,iv,vi,x}{i,iv,vi,xi}{i,iv,vii,viii}{i,iv,vii,ix}{i,iv,vii,x}{i,iv,vii,xi}{i,iv,viii,ix}{i,iv,viii,x}{i,iv,viii,xi}{i,iv,ix,x}{i,iv,ix,xi}{i,iv,x,xi}{i,v,vi,vii}{i,v,vi,viii}{i,v,vi,ix}{i,v,vi,x}{i,v,vi,xi}{i,v,vii,viii}{i,v,vii,ix}{i,v,vii,x}{i,v,vii,xi}{i,v,viii,ix}{i,v,viii,x}{i,v,viii,xi}{i,v,ix,x}{i,v,ix,xi}{i,v,x,xi}{i,vi,vii,viii}{i,vi,vii,ix}{i,vi,vii,x}{i,vi,vii,xi}{i,vi,viii,ix}{i,vi,viii,x}{i,vi,viii,xi}{i,vi,ix,x}{i,vi,ix,xi}{i,vi,x,xi}{i,vii,viii,ix}{i,vii,viii,x}{i,vii,viii,xi}{i,vii,ix,x}{i,vii,ix,xi}{i,vii,x,xi}{i,viii,ix,x}{i,viii,ix,xi}{i,viii,x,xi}{i,ix,x,xi}{ii,iii,iv,v}{ii,iii,iv,vi}{ii,iii,iv,vii}{ii,iii,iv,viii}{ii,iii,iv,ix}{ii,iii,iv,x}{ii,iii,iv,xi}{ii,iii,v,vi}{ii,iii,v,vii}{ii,iii,v,viii}{ii,iii,v,ix}{ii,iii,v,x}{ii,iii,v,xi}{ii,iii,vi,vii}{ii,iii,vi,viii}{ii,iii,vi,ix}{ii,iii,vi,x}{ii,iii,vi,xi}{ii,iii,vii,viii}{ii,iii,vii,ix}{ii,iii,vii,x}{ii,iii,vii,xi}{ii,iii,viii,ix}{ii,iii,viii,x}{ii,iii,viii,xi}{ii,iii,ix,x}{ii,iii,ix,xi}{ii,iii,x,xi}{ii,iv,v,vi}{ii,iv,v,vii}{ii,iv,v,viii}{ii,iv,v,ix}{ii,iv,v,x}{ii,iv,v,xi}{ii,iv,vi,vii}{ii,iv,vi,viii}{ii,iv,vi,ix}{ii,iv,vi,x}{ii,iv,vi,xi}{ii,iv,vii,viii}{ii,iv,vii,ix}{ii,iv,vii,x}{ii,iv,vii,xi}{ii,iv,viii,ix}{ii,iv,viii,x}{ii,iv,viii,xi}{ii,iv,ix,x}{ii,iv,ix,xi}{ii,iv,x,xi}{ii,v,vi,vii}{ii,v,vi,viii}{ii,v,vi,ix}{ii,v,vi,x}{ii,v,vi,xi}{ii,v,vii,viii}{ii,v,vii,ix}{ii,v,vii,x}{ii,v,vii,xi}{ii,v,viii,ix}{ii,v,viii,x}{ii,v,viii,xi}{ii,v,ix,x}{ii,v,ix,xi}{ii,v,x,xi}{ii,vi,vii,viii}{ii,vi,vii,ix}{ii,vi,vii,x}{ii,vi,vii,xi}{ii,vi,viii,ix}{ii,vi,viii,x}{ii,vi,viii,xi}{ii,vi,ix,x}{ii,vi,ix,xi}{ii,vi,x,xi}{ii,vii,viii,ix}{ii,vii,viii,x}{ii,vii,viii,xi}{ii,vii,ix,x}{ii,vii,ix,xi}{ii,vii,x,xi}{ii,viii,ix,x}{ii,viii,ix,xi}{ii,viii,x,xi}{ii,ix,x,xi}{iii,iv,v,vi}{iii,iv,v,vii}{iii,iv,v,viii}{iii,iv,v,ix}{iii,iv,v,x}{iii,iv,v,xi}{iii,iv,vi,vii}{iii,iv,vi,viii}{iii,iv,vi,ix}{iii,iv,vi,x}{iii,iv,vi,xi}{iii,iv,vii,viii}{iii,iv,vii,ix}{iii,iv,vii,x}{iii,iv,vii,xi}{iii,iv,viii,ix}{iii,iv,viii,x}{iii,iv,viii,xi}{iii,iv,ix,x}{iii,iv,ix,xi}{iii,iv,x,xi}{iii,v,vi,vii}{iii,v,vi,viii}{iii,v,vi,ix}{iii,v,vi,x}{iii,v,vi,xi}{iii,v,vii,viii}{iii,v,vii,ix}{iii,v,vii,x}{iii,v,vii,xi}{iii,v,viii,ix}{iii,v,viii,x}{iii,v,viii,xi}{iii,v,ix,x}{iii,v,ix,xi}{iii,v,x,xi}{iii,vi,vii,viii}{iii,vi,vii,ix}{iii,vi,vii,x}{iii,vi,vii,xi}{iii,vi,viii,ix}{iii,vi,viii,x}{iii,vi,viii,xi}{iii,vi,ix,x}{iii,vi,ix,xi}{iii,vi,x,xi}{iii,vii,viii,ix}{iii,vii,viii,x}{iii,vii,viii,xi}{iii,vii,ix,x}{iii,vii,ix,xi}{iii,vii,x,xi}{iii,viii,ix,x}{iii,viii,ix,xi}{iii,viii,x,xi}{iii,ix,x,xi}{iv,v,vi,vii}{iv,v,vi,viii}{iv,v,vi,ix}{iv,v,vi,x}{iv,v,vi,xi}{iv,v,vii,viii}{iv,v,vii,ix}{iv,v,vii,x}{iv,v,vii,xi}{iv,v,viii,ix}{iv,v,viii,x}{iv,v,viii,xi}{iv,v,ix,x}{iv,v,ix,xi}{iv,v,x,xi}{iv,vi,vii,viii}{iv,vi,vii,ix}{iv,vi,vii,x}{iv,vi,vii,xi}{iv,vi,viii,ix}{iv,vi,viii,x}{iv,vi,viii,xi}{iv,vi,ix,x}{iv,vi,ix,xi}{iv,vi,x,xi}{iv,vii,viii,ix}{iv,vii,viii,x}{iv,vii,viii,xi}{iv,vii,ix,x}{iv,vii,ix,xi}{iv,vii,x,xi}{iv,viii,ix,x}{iv,viii,ix,xi}{iv,viii,x,xi}{iv,ix,x,xi}{v,vi,vii,viii}{v,vi,vii,ix}{v,vi,vii,x}{v,vi,vii,xi}{v,vi,viii,ix}{v,vi,viii,x}{v,vi,viii,xi}{v,vi,ix,x}{v,vi,ix,xi}{v,vi,x,xi}{v,vii,viii,ix}{v,vii,viii,x}{v,vii,viii,xi}{v,vii,ix,x}{v,vii,ix,xi}{v,vii,x,xi}{v,viii,ix,x}{v,viii,ix,xi}{v,viii,x,xi}{v,ix,x,xi}{vi,vii,viii,ix}{vi,vii,viii,x}{vi,vii,viii,xi}{vi,vii,ix,x}{vi,vii,ix,xi}{vi,vii,x,xi}{vi,viii,ix,x}{vi,viii,ix,xi}{vi,viii,x,xi}{vi,ix,x,xi}{vii,viii,ix,x}{vii,viii,ix,xi}{vii,viii,x,xi}{vii,ix,x,xi}{viii,ix,x,xi}{i,ii,iii,iv,v}{i,ii,iii,iv,vi}{i,ii,iii,iv,vii}{i,ii,iii,iv,viii}{i,ii,iii,iv,ix}{i,ii,iii,iv,x}{i,ii,iii,iv,xi}{i,ii,iii,v,vi}{i,ii,iii,v,vii}{i,ii,iii,v,viii}{i,ii,iii,v,ix}{i,ii,iii,v,x}{i,ii,iii,v,xi}{i,ii,iii,vi,vii}{i,ii,iii,vi,viii}{i,ii,iii,vi,ix}{i,ii,iii,vi,x}{i,ii,iii,vi,xi}{i,ii,iii,vii,viii}{i,ii,iii,vii,ix}{i,ii,iii,vii,x}{i,ii,iii,vii,xi}{i,ii,iii,viii,ix}{i,ii,iii,viii,x}{i,ii,iii,viii,xi}{i,ii,iii,ix,x}{i,ii,iii,ix,xi}{i,ii,iii,x,xi}{i,ii,iv,v,vi}{i,ii,iv,v,vii}{i,ii,iv,v,viii}{i,ii,iv,v,ix}{i,ii,iv,v,x}{i,ii,iv,v,xi}{i,ii,iv,vi,vii}{i,ii,iv,vi,viii}{i,ii,iv,vi,ix}{i,ii,iv,vi,x}{i,ii,iv,vi,xi}{i,ii,iv,vii,viii}{i,ii,iv,vii,ix}{i,ii,iv,vii,x}{i,ii,iv,vii,xi}{i,ii,iv,viii,ix}{i,ii,iv,viii,x}{i,ii,iv,viii,xi}{i,ii,iv,ix,x}{i,ii,iv,ix,xi}{i,ii,iv,x,xi}{i,ii,v,vi,vii}{i,ii,v,vi,viii}{i,ii,v,vi,ix}{i,ii,v,vi,x}{i,ii,v,vi,xi}{i,ii,v,vii,viii}{i,ii,v,vii,ix}{i,ii,v,vii,x}{i,ii,v,vii,xi}{i,ii,v,viii,ix}{i,ii,v,viii,x}{i,ii,v,viii,xi}{i,ii,v,ix,x}{i,ii,v,ix,xi}{i,ii,v,x,xi}{i,ii,vi,vii,viii}{i,ii,vi,vii,ix}{i,ii,vi,vii,x}{i,ii,vi,vii,xi}{i,ii,vi,viii,ix}{i,ii,vi,viii,x}{i,ii,vi,viii,xi}{i,ii,vi,ix,x}{i,ii,vi,ix,xi}{i,ii,vi,x,xi}{i,ii,vii,viii,ix}{i,ii,vii,viii,x}{i,ii,vii,viii,xi}{i,ii,vii,ix,x}{i,ii,vii,ix,xi}{i,ii,vii,x,xi}{i,ii,viii,ix,x}{i,ii,viii,ix,xi}{i,ii,viii,x,xi}{i,ii,ix,x,xi}{i,iii,iv,v,vi}{i,iii,iv,v,vii}{i,iii,iv,v,viii}{i,iii,iv,v,ix}{i,iii,iv,v,x}{i,iii,iv,v,xi}{i,iii,iv,vi,vii}{i,iii,iv,vi,viii}{i,iii,iv,vi,ix}{i,iii,iv,vi,x}{i,iii,iv,vi,xi}{i,iii,iv,vii,viii}{i,iii,iv,vii,ix}{i,iii,iv,vii,x}{i,iii,iv,vii,xi}{i,iii,iv,viii,ix}{i,iii,iv,viii,x}{i,iii,iv,viii,xi}{i,iii,iv,ix,x}{i,iii,iv,ix,xi}{i,iii,iv,x,xi}{i,iii,v,vi,vii}{i,iii,v,vi,viii}{i,iii,v,vi,ix}{i,iii,v,vi,x}{i,iii,v,vi,xi}{i,iii,v,vii,viii}{i,iii,v,vii,ix}{i,iii,v,vii,x}{i,iii,v,vii,xi}{i,iii,v,viii,ix}{i,iii,v,viii,x}{i,iii,v,viii,xi}{i,iii,v,ix,x}{i,iii,v,ix,xi}{i,iii,v,x,xi}{i,iii,vi,vii,viii}{i,iii,vi,vii,ix}{i,iii,vi,vii,x}{i,iii,vi,vii,xi}{i,iii,vi,viii,ix}{i,iii,vi,viii,x}{i,iii,vi,viii,xi}{i,iii,vi,ix,x}{i,iii,vi,ix,xi}{i,iii,vi,x,xi}{i,iii,vii,viii,ix}{i,iii,vii,viii,x}{i,iii,vii,viii,xi}{i,iii,vii,ix,x}{i,iii,vii,ix,xi}{i,iii,vii,x,xi}{i,iii,viii,ix,x}{i,iii,viii,ix,xi}{i,iii,viii,x,xi}{i,iii,ix,x,xi}{i,iv,v,vi,vii}{i,iv,v,vi,viii}{i,iv,v,vi,ix}{i,iv,v,vi,x}{i,iv,v,vi,xi}{i,iv,v,vii,viii}{i,iv,v,vii,ix}{i,iv,v,vii,x}{i,iv,v,vii,xi}{i,iv,v,viii,ix}{i,iv,v,viii,x}{i,iv,v,viii,xi}{i,iv,v,ix,x}{i,iv,v,ix,xi}{i,iv,v,x,xi}{i,iv,vi,vii,viii}{i,iv,vi,vii,ix}{i,iv,vi,vii,x}{i,iv,vi,vii,xi}{i,iv,vi,viii,ix}{i,iv,vi,viii,x}{i,iv,vi,viii,xi}{i,iv,vi,ix,x}{i,iv,vi,ix,xi}{i,iv,vi,x,xi}{i,iv,vii,viii,ix}{i,iv,vii,viii,x}{i,iv,vii,viii,xi}{i,iv,vii,ix,x}{i,iv,vii,ix,xi}{i,iv,vii,x,xi}{i,iv,viii,ix,x}{i,iv,viii,ix,xi}{i,iv,viii,x,xi}{i,iv,ix,x,xi}{i,v,vi,vii,viii}{i,v,vi,vii,ix}{i,v,vi,vii,x}{i,v,vi,vii,xi}{i,v,vi,viii,ix}{i,v,vi,viii,x}{i,v,vi,viii,xi}{i,v,vi,ix,x}{i,v,vi,ix,xi}{i,v,vi,x,xi}{i,v,vii,viii,ix}{i,v,vii,viii,x}{i,v,vii,viii,xi}{i,v,vii,ix,x}{i,v,vii,ix,xi}{i,v,vii,x,xi}{i,v,viii,ix,x}{i,v,viii,ix,xi}{i,v,viii,x,xi}{i,v,ix,x,xi}{i,vi,vii,viii,ix}{i,vi,vii,viii,x}{i,vi,vii,viii,xi}{i,vi,vii,ix,x}{i,vi,vii,ix,xi}{i,vi,vii,x,xi}{i,vi,viii,ix,x}{i,vi,viii,ix,xi}{i,vi,viii,x,xi}{i,vi,ix,x,xi}{i,vii,viii,ix,x}{i,vii,viii,ix,xi}{i,vii,viii,x,xi}{i,vii,ix,x,xi}{i,viii,ix,x,xi}{ii,iii,iv,v,vi}{ii,iii,iv,v,vii}{ii,iii,iv,v,viii}{ii,iii,iv,v,ix}{ii,iii,iv,v,x}{ii,iii,iv,v,xi}{ii,iii,iv,vi,vii}{ii,iii,iv,vi,viii}{ii,iii,iv,vi,ix}{ii,iii,iv,vi,x}{ii,iii,iv,vi,xi}{ii,iii,iv,vii,viii}{ii,iii,iv,vii,ix}{ii,iii,iv,vii,x}{ii,iii,iv,vii,xi}{ii,iii,iv,viii,ix}{ii,iii,iv,viii,x}{ii,iii,iv,viii,xi}{ii,iii,iv,ix,x}{ii,iii,iv,ix,xi}{ii,iii,iv,x,xi}{ii,iii,v,vi,vii}{ii,iii,v,vi,viii}{ii,iii,v,vi,ix}{ii,iii,v,vi,x}{ii,iii,v,vi,xi}{ii,iii,v,vii,viii}{ii,iii,v,vii,ix}{ii,iii,v,vii,x}{ii,iii,v,vii,xi}{ii,iii,v,viii,ix}{ii,iii,v,viii,x}{ii,iii,v,viii,xi}{ii,iii,v,ix,x}{ii,iii,v,ix,xi}{ii,iii,v,x,xi}{ii,iii,vi,vii,viii}{ii,iii,vi,vii,ix}{ii,iii,vi,vii,x}{ii,iii,vi,vii,xi}{ii,iii,vi,viii,ix}{ii,iii,vi,viii,x}{ii,iii,vi,viii,xi}{ii,iii,vi,ix,x}{ii,iii,vi,ix,xi}{ii,iii,vi,x,xi}{ii,iii,vii,viii,ix}{ii,iii,vii,viii,x}{ii,iii,vii,viii,xi}{ii,iii,vii,ix,x}{ii,iii,vii,ix,xi}{ii,iii,vii,x,xi}{ii,iii,viii,ix,x}{ii,iii,viii,ix,xi}{ii,iii,viii,x,xi}{ii,iii,ix,x,xi}{ii,iv,v,vi,vii}{ii,iv,v,vi,viii}{ii,iv,v,vi,ix}{ii,iv,v,vi,x}{ii,iv,v,vi,xi}{ii,iv,v,vii,viii}{ii,iv,v,vii,ix}{ii,iv,v,vii,x}{ii,iv,v,vii,xi}{ii,iv,v,viii,ix}{ii,iv,v,viii,x}{ii,iv,v,viii,xi}{ii,iv,v,ix,x}{ii,iv,v,ix,xi}{ii,iv,v,x,xi}{ii,iv,vi,vii,viii}{ii,iv,vi,vii,ix}{ii,iv,vi,vii,x}{ii,iv,vi,vii,xi}{ii,iv,vi,viii,ix}{ii,iv,vi,viii,x}{ii,iv,vi,viii,xi}{ii,iv,vi,ix,x}{ii,iv,vi,ix,xi}{ii,iv,vi,x,xi}{ii,iv,vii,viii,ix}{ii,iv,vii,viii,x}{ii,iv,vii,viii,xi}{ii,iv,vii,ix,x}{ii,iv,vii,ix,xi}{ii,iv,vii,x,xi}{ii,iv,viii,ix,x}{ii,iv,viii,ix,xi}{ii,iv,viii,x,xi}{ii,iv,ix,x,xi}{ii,v,vi,vii,viii}{ii,v,vi,vii,ix}{ii,v,vi,vii,x}{ii,v,vi,vii,xi}{ii,v,vi,viii,ix}{ii,v,vi,viii,x}{ii,v,vi,viii,xi}{ii,v,vi,ix,x}{ii,v,vi,ix,xi}{ii,v,vi,x,xi}{ii,v,vii,viii,ix}{ii,v,vii,viii,x}{ii,v,vii,viii,xi}{ii,v,vii,ix,x}{ii,v,vii,ix,xi}{ii,v,vii,x,xi}{ii,v,viii,ix,x}{ii,v,viii,ix,xi}{ii,v,viii,x,xi}{ii,v,ix,x,xi}{ii,vi,vii,viii,ix}{ii,vi,vii,viii,x}{ii,vi,vii,viii,xi}{ii,vi,vii,ix,x}{ii,vi,vii,ix,xi}{ii,vi,vii,x,xi}{ii,vi,viii,ix,x}{ii,vi,viii,ix,xi}{ii,vi,viii,x,xi}{ii,vi,ix,x,xi}{ii,vii,viii,ix,x}{ii,vii,viii,ix,xi}{ii,vii,viii,x,xi}{ii,vii,ix,x,xi}{ii,viii,ix,x,xi}{iii,iv,v,vi,vii}{iii,iv,v,vi,viii}{iii,iv,v,vi,ix}{iii,iv,v,vi,x}{iii,iv,v,vi,xi}{iii,iv,v,vii,viii}{iii,iv,v,vii,ix}{iii,iv,v,vii,x}{iii,iv,v,vii,xi}{iii,iv,v,viii,ix}{iii,iv,v,viii,x}{iii,iv,v,viii,xi}{iii,iv,v,ix,x}{iii,iv,v,ix,xi}{iii,iv,v,x,xi}{iii,iv,vi,vii,viii}{iii,iv,vi,vii,ix}{iii,iv,vi,vii,x}{iii,iv,vi,vii,xi}{iii,iv,vi,viii,ix}{iii,iv,vi,viii,x}{iii,iv,vi,viii,xi}{iii,iv,vi,ix,x}{iii,iv,vi,ix,xi}{iii,iv,vi,x,xi}{iii,iv,vii,viii,ix}{iii,iv,vii,viii,x}{iii,iv,vii,viii,xi}{iii,iv,vii,ix,x}{iii,iv,vii,ix,xi}{iii,iv,vii,x,xi}{iii,iv,viii,ix,x}{iii,iv,viii,ix,xi}{iii,iv,viii,x,xi}{iii,iv,ix,x,xi}{iii,v,vi,vii,viii}{iii,v,vi,vii,ix}{iii,v,vi,vii,x}{iii,v,vi,vii,xi}{iii,v,vi,viii,ix}{iii,v,vi,viii,x}{iii,v,vi,viii,xi}{iii,v,vi,ix,x}{iii,v,vi,ix,xi}{iii,v,vi,x,xi}{iii,v,vii,viii,ix}{iii,v,vii,viii,x}{iii,v,vii,viii,xi}{iii,v,vii,ix,x}{iii,v,vii,ix,xi}{iii,v,vii,x,xi}{iii,v,viii,ix,x}{iii,v,viii,ix,xi}{iii,v,viii,x,xi}{iii,v,ix,x,xi}{iii,vi,vii,viii,ix}{iii,vi,vii,viii,x}{iii,vi,vii,viii,xi}{iii,vi,vii,ix,x}{iii,vi,vii,ix,xi}{iii,vi,vii,x,xi}{iii,vi,viii,ix,x}{iii,vi,viii,ix,xi}{iii,vi,viii,x,xi}{iii,vi,ix,x,xi}{iii,vii,viii,ix,x}{iii,vii,viii,ix,xi}{iii,vii,viii,x,xi}{iii,vii,ix,x,xi}{iii,viii,ix,x,xi}{iv,v,vi,vii,viii}{iv,v,vi,vii,ix}{iv,v,vi,vii,x}{iv,v,vi,vii,xi}{iv,v,vi,viii,ix}{iv,v,vi,viii,x}{iv,v,vi,viii,xi}{iv,v,vi,ix,x}{iv,v,vi,ix,xi}{iv,v,vi,x,xi}{iv,v,vii,viii,ix}{iv,v,vii,viii,x}{iv,v,vii,viii,xi}{iv,v,vii,ix,x}{iv,v,vii,ix,xi}{iv,v,vii,x,xi}{iv,v,viii,ix,x}{iv,v,viii,ix,xi}{iv,v,viii,x,xi}{iv,v,ix,x,xi}{iv,vi,vii,viii,ix}{iv,vi,vii,viii,x}{iv,vi,vii,viii,xi}{iv,vi,vii,ix,x}{iv,vi,vii,ix,xi}{iv,vi,vii,x,xi}{iv,vi,viii,ix,x}{iv,vi,viii,ix,xi}{iv,vi,viii,x,xi}{iv,vi,ix,x,xi}{iv,vii,viii,ix,x}{iv,vii,viii,ix,xi}{iv,vii,viii,x,xi}{iv,vii,ix,x,xi}{iv,viii,ix,x,xi}{v,vi,vii,viii,ix}{v,vi,vii,viii,x}{v,vi,vii,viii,xi}{v,vi,vii,ix,x}{v,vi,vii,ix,xi}{v,vi,vii,x,xi}{v,vi,viii,ix,x}{v,vi,viii,ix,xi}{v,vi,viii,x,xi}{v,vi,ix,x,xi}{v,vii,viii,ix,x}{v,vii,viii,ix,xi}{v,vii,viii,x,xi}{v,vii,ix,x,xi}{v,viii,ix,x,xi}{vi,vii,viii,ix,x}{vi,vii,viii,ix,xi}{vi,vii,viii,x,xi}{vi,vii,ix,x,xi}{vi,viii,ix,x,xi}{vii,viii,ix,x,xi}{i,ii,iii,iv,v,vi}{i,ii,iii,iv,v,vii}{i,ii,iii,iv,v,viii}{i,ii,iii,iv,v,ix}{i,ii,iii,iv,v,x}{i,ii,iii,iv,v,xi}{i,ii,iii,iv,vi,vii}{i,ii,iii,iv,vi,viii}{i,ii,iii,iv,vi,ix}{i,ii,iii,iv,vi,x}{i,ii,iii,iv,vi,xi}{i,ii,iii,iv,vii,viii}{i,ii,iii,iv,vii,ix}{i,ii,iii,iv,vii,x}{i,ii,iii,iv,vii,xi}{i,ii,iii,iv,viii,ix}{i,ii,iii,iv,viii,x}{i,ii,iii,iv,viii,xi}{i,ii,iii,iv,ix,x}{i,ii,iii,iv,ix,xi}{i,ii,iii,iv,x,xi}{i,ii,iii,v,vi,vii}{i,ii,iii,v,vi,viii}{i,ii,iii,v,vi,ix}{i,ii,iii,v,vi,x}{i,ii,iii,v,vi,xi}{i,ii,iii,v,vii,viii}{i,ii,iii,v,vii,ix}{i,ii,iii,v,vii,x}{i,ii,iii,v,vii,xi}{i,ii,iii,v,viii,ix}{i,ii,iii,v,viii,x}{i,ii,iii,v,viii,xi}{i,ii,iii,v,ix,x}{i,ii,iii,v,ix,xi}{i,ii,iii,v,x,xi}{i,ii,iii,vi,vii,viii}{i,ii,iii,vi,vii,ix}{i,ii,iii,vi,vii,x}{i,ii,iii,vi,vii,xi}{i,ii,iii,vi,viii,ix}{i,ii,iii,vi,viii,x}{i,ii,iii,vi,viii,xi}{i,ii,iii,vi,ix,x}{i,ii,iii,vi,ix,xi}{i,ii,iii,vi,x,xi}{i,ii,iii,vii,viii,ix}{i,ii,iii,vii,viii,x}{i,ii,iii,vii,viii,xi}{i,ii,iii,vii,ix,x}{i,ii,iii,vii,ix,xi}{i,ii,iii,vii,x,xi}{i,ii,iii,viii,ix,x}{i,ii,iii,viii,ix,xi}{i,ii,iii,viii,x,xi}{i,ii,iii,ix,x,xi}{i,ii,iv,v,vi,vii}{i,ii,iv,v,vi,viii}{i,ii,iv,v,vi,ix}{i,ii,iv,v,vi,x}{i,ii,iv,v,vi,xi}{i,ii,iv,v,vii,viii}{i,ii,iv,v,vii,ix}{i,ii,iv,v,vii,x}{i,ii,iv,v,vii,xi}{i,ii,iv,v,viii,ix}{i,ii,iv,v,viii,x}{i,ii,iv,v,viii,xi}{i,ii,iv,v,ix,x}{i,ii,iv,v,ix,xi}{i,ii,iv,v,x,xi}{i,ii,iv,vi,vii,viii}{i,ii,iv,vi,vii,ix}{i,ii,iv,vi,vii,x}{i,ii,iv,vi,vii,xi}{i,ii,iv,vi,viii,ix}{i,ii,iv,vi,viii,x}{i,ii,iv,vi,viii,xi}{i,ii,iv,vi,ix,x}{i,ii,iv,vi,ix,xi}{i,ii,iv,vi,x,xi}{i,ii,iv,vii,viii,ix}{i,ii,iv,vii,viii,x}{i,ii,iv,vii,viii,xi}{i,ii,iv,vii,ix,x}{i,ii,iv,vii,ix,xi}{i,ii,iv,vii,x,xi}{i,ii,iv,viii,ix,x}{i,ii,iv,viii,ix,xi}{i,ii,iv,viii,x,xi}{i,ii,iv,ix,x,xi}{i,ii,v,vi,vii,viii}{i,ii,v,vi,vii,ix}{i,ii,v,vi,vii,x}{i,ii,v,vi,vii,xi}{i,ii,v,vi,viii,ix}{i,ii,v,vi,viii,x}{i,ii,v,vi,viii,xi}{i,ii,v,vi,ix,x}{i,ii,v,vi,ix,xi}{i,ii,v,vi,x,xi}{i,ii,v,vii,viii,ix}{i,ii,v,vii,viii,x}{i,ii,v,vii,viii,xi}{i,ii,v,vii,ix,x}{i,ii,v,vii,ix,xi}{i,ii,v,vii,x,xi}{i,ii,v,viii,ix,x}{i,ii,v,viii,ix,xi}{i,ii,v,viii,x,xi}{i,ii,v,ix,x,xi}{i,ii,vi,vii,viii,ix}{i,ii,vi,vii,viii,x}{i,ii,vi,vii,viii,xi}{i,ii,vi,vii,ix,x}{i,ii,vi,vii,ix,xi}{i,ii,vi,vii,x,xi}{i,ii,vi,viii,ix,x}{i,ii,vi,viii,ix,xi}{i,ii,vi,viii,x,xi}{i,ii,vi,ix,x,xi}{i,ii,vii,viii,ix,x}{i,ii,vii,viii,ix,xi}{i,ii,vii,viii,x,xi}{i,ii,vii,ix,x,xi}{i,ii,viii,ix,x,xi}{i,iii,iv,v,vi,vii}{i,iii,iv,v,vi,viii}{i,iii,iv,v,vi,ix}{i,iii,iv,v,vi,x}{i,iii,iv,v,vi,xi}{i,iii,iv,v,vii,viii}{i,iii,iv,v,vii,ix}{i,iii,iv,v,vii,x}{i,iii,iv,v,vii,xi}{i,iii,iv,v,viii,ix}{i,iii,iv,v,viii,x}{i,iii,iv,v,viii,xi}{i,iii,iv,v,ix,x}{i,iii,iv,v,ix,xi}{i,iii,iv,v,x,xi}{i,iii,iv,vi,vii,viii}{i,iii,iv,vi,vii,ix}{i,iii,iv,vi,vii,x}{i,iii,iv,vi,vii,xi}{i,iii,iv,vi,viii,ix}{i,iii,iv,vi,viii,x}{i,iii,iv,vi,viii,xi}{i,iii,iv,vi,ix,x}{i,iii,iv,vi,ix,xi}{i,iii,iv,vi,x,xi}{i,iii,iv,vii,viii,ix}{i,iii,iv,vii,viii,x}{i,iii,iv,vii,viii,xi}{i,iii,iv,vii,ix,x}{i,iii,iv,vii,ix,xi}{i,iii,iv,vii,x,xi}{i,iii,iv,viii,ix,x}{i,iii,iv,viii,ix,xi}{i,iii,iv,viii,x,xi}{i,iii,iv,ix,x,xi}{i,iii,v,vi,vii,viii}{i,iii,v,vi,vii,ix}{i,iii,v,vi,vii,x}{i,iii,v,vi,vii,xi}{i,iii,v,vi,viii,ix}{i,iii,v,vi,viii,x}{i,iii,v,vi,viii,xi}{i,iii,v,vi,ix,x}{i,iii,v,vi,ix,xi}{i,iii,v,vi,x,xi}{i,iii,v,vii,viii,ix}{i,iii,v,vii,viii,x}{i,iii,v,vii,viii,xi}{i,iii,v,vii,ix,x}{i,iii,v,vii,ix,xi}{i,iii,v,vii,x,xi}{i,iii,v,viii,ix,x}{i,iii,v,viii,ix,xi}{i,iii,v,viii,x,xi}{i,iii,v,ix,x,xi}{i,iii,vi,vii,viii,ix}{i,iii,vi,vii,viii,x}{i,iii,vi,vii,viii,xi}{i,iii,vi,vii,ix,x}{i,iii,vi,vii,ix,xi}{i,iii,vi,vii,x,xi}{i,iii,vi,viii,ix,x}{i,iii,vi,viii,ix,xi}{i,iii,vi,viii,x,xi}{i,iii,vi,ix,x,xi}{i,iii,vii,viii,ix,x}{i,iii,vii,viii,ix,xi}{i,iii,vii,viii,x,xi}{i,iii,vii,ix,x,xi}{i,iii,viii,ix,x,xi}{i,iv,v,vi,vii,viii}{i,iv,v,vi,vii,ix}{i,iv,v,vi,vii,x}{i,iv,v,vi,vii,xi}{i,iv,v,vi,viii,ix}{i,iv,v,vi,viii,x}{i,iv,v,vi,viii,xi}{i,iv,v,vi,ix,x}{i,iv,v,vi,ix,xi}{i,iv,v,vi,x,xi}{i,iv,v,vii,viii,ix}{i,iv,v,vii,viii,x}{i,iv,v,vii,viii,xi}{i,iv,v,vii,ix,x}{i,iv,v,vii,ix,xi}{i,iv,v,vii,x,xi}{i,iv,v,viii,ix,x}{i,iv,v,viii,ix,xi}{i,iv,v,viii,x,xi}{i,iv,v,ix,x,xi}{i,iv,vi,vii,viii,ix}{i,iv,vi,vii,viii,x}{i,iv,vi,vii,viii,xi}{i,iv,vi,vii,ix,x}{i,iv,vi,vii,ix,xi}{i,iv,vi,vii,x,xi}{i,iv,vi,viii,ix,x}{i,iv,vi,viii,ix,xi}{i,iv,vi,viii,x,xi}{i,iv,vi,ix,x,xi}{i,iv,vii,viii,ix,x}{i,iv,vii,viii,ix,xi}{i,iv,vii,viii,x,xi}{i,iv,vii,ix,x,xi}{i,iv,viii,ix,x,xi}{i,v,vi,vii,viii,ix}{i,v,vi,vii,viii,x}{i,v,vi,vii,viii,xi}{i,v,vi,vii,ix,x}{i,v,vi,vii,ix,xi}{i,v,vi,vii,x,xi}{i,v,vi,viii,ix,x}{i,v,vi,viii,ix,xi}{i,v,vi,viii,x,xi}{i,v,vi,ix,x,xi}{i,v,vii,viii,ix,x}{i,v,vii,viii,ix,xi}{i,v,vii,viii,x,xi}{i,v,vii,ix,x,xi}{i,v,viii,ix,x,xi}{i,vi,vii,viii,ix,x}{i,vi,vii,viii,ix,xi}{i,vi,vii,viii,x,xi}{i,vi,vii,ix,x,xi}{i,vi,viii,ix,x,xi}{i,vii,viii,ix,x,xi}{ii,iii,iv,v,vi,vii}{ii,iii,iv,v,vi,viii}{ii,iii,iv,v,vi,ix}{ii,iii,iv,v,vi,x}{ii,iii,iv,v,vi,xi}{ii,iii,iv,v,vii,viii}{ii,iii,iv,v,vii,ix}{ii,iii,iv,v,vii,x}{ii,iii,iv,v,vii,xi}{ii,iii,iv,v,viii,ix}{ii,iii,iv,v,viii,x}{ii,iii,iv,v,viii,xi}{ii,iii,iv,v,ix,x}{ii,iii,iv,v,ix,xi}{ii,iii,iv,v,x,xi}{ii,iii,iv,vi,vii,viii}{ii,iii,iv,vi,vii,ix}{ii,iii,iv,vi,vii,x}{ii,iii,iv,vi,vii,xi}{ii,iii,iv,vi,viii,ix}{ii,iii,iv,vi,viii,x}{ii,iii,iv,vi,viii,xi}{ii,iii,iv,vi,ix,x}{ii,iii,iv,vi,ix,xi}{ii,iii,iv,vi,x,xi}{ii,iii,iv,vii,viii,ix}{ii,iii,iv,vii,viii,x}{ii,iii,iv,vii,viii,xi}{ii,iii,iv,vii,ix,x}{ii,iii,iv,vii,ix,xi}{ii,iii,iv,vii,x,xi}{ii,iii,iv,viii,ix,x}{ii,iii,iv,viii,ix,xi}{ii,iii,iv,viii,x,xi}{ii,iii,iv,ix,x,xi}{ii,iii,v,vi,vii,viii}{ii,iii,v,vi,vii,ix}{ii,iii,v,vi,vii,x}{ii,iii,v,vi,vii,xi}{ii,iii,v,vi,viii,ix}{ii,iii,v,vi,viii,x}{ii,iii,v,vi,viii,xi}{ii,iii,v,vi,ix,x}{ii,iii,v,vi,ix,xi}{ii,iii,v,vi,x,xi}{ii,iii,v,vii,viii,ix}{ii,iii,v,vii,viii,x}{ii,iii,v,vii,viii,xi}{ii,iii,v,vii,ix,x}{ii,iii,v,vii,ix,xi}{ii,iii,v,vii,x,xi}{ii,iii,v,viii,ix,x}{ii,iii,v,viii,ix,xi}{ii,iii,v,viii,x,xi}{ii,iii,v,ix,x,xi}{ii,iii,vi,vii,viii,ix}{ii,iii,vi,vii,viii,x}{ii,iii,vi,vii,viii,xi}{ii,iii,vi,vii,ix,x}{ii,iii,vi,vii,ix,xi}{ii,iii,vi,vii,x,xi}{ii,iii,vi,viii,ix,x}{ii,iii,vi,viii,ix,xi}{ii,iii,vi,viii,x,xi}{ii,iii,vi,ix,x,xi}{ii,iii,vii,viii,ix,x}{ii,iii,vii,viii,ix,xi}{ii,iii,vii,viii,x,xi}{ii,iii,vii,ix,x,xi}{ii,iii,viii,ix,x,xi}{ii,iv,v,vi,vii,viii}{ii,iv,v,vi,vii,ix}{ii,iv,v,vi,vii,x}{ii,iv,v,vi,vii,xi}{ii,iv,v,vi,viii,ix}{ii,iv,v,vi,viii,x}{ii,iv,v,vi,viii,xi}{ii,iv,v,vi,ix,x}{ii,iv,v,vi,ix,xi}{ii,iv,v,vi,x,xi}{ii,iv,v,vii,viii,ix}{ii,iv,v,vii,viii,x}{ii,iv,v,vii,viii,xi}{ii,iv,v,vii,ix,x}{ii,iv,v,vii,ix,xi}{ii,iv,v,vii,x,xi}{ii,iv,v,viii,ix,x}{ii,iv,v,viii,ix,xi}{ii,iv,v,viii,x,xi}{ii,iv,v,ix,x,xi}{ii,iv,vi,vii,viii,ix}{ii,iv,vi,vii,viii,x}{ii,iv,vi,vii,viii,xi}{ii,iv,vi,vii,ix,x}{ii,iv,vi,vii,ix,xi}{ii,iv,vi,vii,x,xi}{ii,iv,vi,viii,ix,x}{ii,iv,vi,viii,ix,xi}{ii,iv,vi,viii,x,xi}{ii,iv,vi,ix,x,xi}{ii,iv,vii,viii,ix,x}{ii,iv,vii,viii,ix,xi}{ii,iv,vii,viii,x,xi}{ii,iv,vii,ix,x,xi}{ii,iv,viii,ix,x,xi}{ii,v,vi,vii,viii,ix}{ii,v,vi,vii,viii,x}{ii,v,vi,vii,viii,xi}{ii,v,vi,vii,ix,x}{ii,v,vi,vii,ix,xi}{ii,v,vi,vii,x,xi}{ii,v,vi,viii,ix,x}{ii,v,vi,viii,ix,xi}{ii,v,vi,viii,x,xi}{ii,v,vi,ix,x,xi}{ii,v,vii,viii,ix,x}{ii,v,vii,viii,ix,xi}{ii,v,vii,viii,x,xi}{ii,v,vii,ix,x,xi}{ii,v,viii,ix,x,xi}{ii,vi,vii,viii,ix,x}{ii,vi,vii,viii,ix,xi}{ii,vi,vii,viii,x,xi}{ii,vi,vii,ix,x,xi}{ii,vi,viii,ix,x,xi}{ii,vii,viii,ix,x,xi}{iii,iv,v,vi,vii,viii}{iii,iv,v,vi,vii,ix}{iii,iv,v,vi,vii,x}{iii,iv,v,vi,vii,xi}{iii,iv,v,vi,viii,ix}{iii,iv,v,vi,viii,x}{iii,iv,v,vi,viii,xi}{iii,iv,v,vi,ix,x}{iii,iv,v,vi,ix,xi}{iii,iv,v,vi,x,xi}{iii,iv,v,vii,viii,ix}{iii,iv,v,vii,viii,x}{iii,iv,v,vii,viii,xi}{iii,iv,v,vii,ix,x}{iii,iv,v,vii,ix,xi}{iii,iv,v,vii,x,xi}{iii,iv,v,viii,ix,x}{iii,iv,v,viii,ix,xi}{iii,iv,v,viii,x,xi}{iii,iv,v,ix,x,xi}{iii,iv,vi,vii,viii,ix}{iii,iv,vi,vii,viii,x}{iii,iv,vi,vii,viii,xi}{iii,iv,vi,vii,ix,x}{iii,iv,vi,vii,ix,xi}{iii,iv,vi,vii,x,xi}{iii,iv,vi,viii,ix,x}{iii,iv,vi,viii,ix,xi}{iii,iv,vi,viii,x,xi}{iii,iv,vi,ix,x,xi}{iii,iv,vii,viii,ix,x}{iii,iv,vii,viii,ix,xi}{iii,iv,vii,viii,x,xi}{iii,iv,vii,ix,x,xi}{iii,iv,viii,ix,x,xi}{iii,v,vi,vii,viii,ix}{iii,v,vi,vii,viii,x}{iii,v,vi,vii,viii,xi}{iii,v,vi,vii,ix,x}{iii,v,vi,vii,ix,xi}{iii,v,vi,vii,x,xi}{iii,v,vi,viii,ix,x}{iii,v,vi,viii,ix,xi}{iii,v,vi,viii,x,xi}{iii,v,vi,ix,x,xi}{iii,v,vii,viii,ix,x}{iii,v,vii,viii,ix,xi}{iii,v,vii,viii,x,xi}{iii,v,vii,ix,x,xi}{iii,v,viii,ix,x,xi}{iii,vi,vii,viii,ix,x}{iii,vi,vii,viii,ix,xi}{iii,vi,vii,viii,x,xi}{iii,vi,vii,ix,x,xi}{iii,vi,viii,ix,x,xi}{iii,vii,viii,ix,x,xi}{iv,v,vi,vii,viii,ix}{iv,v,vi,vii,viii,x}{iv,v,vi,vii,viii,xi}{iv,v,vi,vii,ix,x}{iv,v,vi,vii,ix,xi}{iv,v,vi,vii,x,xi}{iv,v,vi,viii,ix,x}{iv,v,vi,viii,ix,xi}{iv,v,vi,viii,x,xi}{iv,v,vi,ix,x,xi}{iv,v,vii,viii,ix,x}{iv,v,vii,viii,ix,xi}{iv,v,vii,viii,x,xi}{iv,v,vii,ix,x,xi}{iv,v,viii,ix,x,xi}{iv,vi,vii,viii,ix,x}{iv,vi,vii,viii,ix,xi}{iv,vi,vii,viii,x,xi}{iv,vi,vii,ix,x,xi}{iv,vi,viii,ix,x,xi}{iv,vii,viii,ix,x,xi}{v,vi,vii,viii,ix,x}{v,vi,vii,viii,ix,xi}{v,vi,vii,viii,x,xi}{v,vi,vii,ix,x,xi}{v,vi,viii,ix,x,xi}{v,vii,viii,ix,x,xi}{vi,vii,viii,ix,x,xi}{i,ii,iii,iv,v,vi,vii}{i,ii,iii,iv,v,vi,viii}{i,ii,iii,iv,v,vi,ix}{i,ii,iii,iv,v,vi,x}{i,ii,iii,iv,v,vi,xi}{i,ii,iii,iv,v,vii,viii}{i,ii,iii,iv,v,vii,ix}{i,ii,iii,iv,v,vii,x}{i,ii,iii,iv,v,vii,xi}{i,ii,iii,iv,v,viii,ix}{i,ii,iii,iv,v,viii,x}{i,ii,iii,iv,v,viii,xi}{i,ii,iii,iv,v,ix,x}{i,ii,iii,iv,v,ix,xi}{i,ii,iii,iv,v,x,xi}{i,ii,iii,iv,vi,vii,viii}{i,ii,iii,iv,vi,vii,ix}{i,ii,iii,iv,vi,vii,x}{i,ii,iii,iv,vi,vii,xi}{i,ii,iii,iv,vi,viii,ix}{i,ii,iii,iv,vi,viii,x}{i,ii,iii,iv,vi,viii,xi}{i,ii,iii,iv,vi,ix,x}{i,ii,iii,iv,vi,ix,xi}{i,ii,iii,iv,vi,x,xi}{i,ii,iii,iv,vii,viii,ix}{i,ii,iii,iv,vii,viii,x}{i,ii,iii,iv,vii,viii,xi}{i,ii,iii,iv,vii,ix,x}{i,ii,iii,iv,vii,ix,xi}{i,ii,iii,iv,vii,x,xi}{i,ii,iii,iv,viii,ix,x}{i,ii,iii,iv,viii,ix,xi}{i,ii,iii,iv,viii,x,xi}{i,ii,iii,iv,ix,x,xi}{i,ii,iii,v,vi,vii,viii}{i,ii,iii,v,vi,vii,ix}{i,ii,iii,v,vi,vii,x}{i,ii,iii,v,vi,vii,xi}{i,ii,iii,v,vi,viii,ix}{i,ii,iii,v,vi,viii,x}{i,ii,iii,v,vi,viii,xi}{i,ii,iii,v,vi,ix,x}{i,ii,iii,v,vi,ix,xi}{i,ii,iii,v,vi,x,xi}{i,ii,iii,v,vii,viii,ix}{i,ii,iii,v,vii,viii,x}{i,ii,iii,v,vii,viii,xi}{i,ii,iii,v,vii,ix,x}{i,ii,iii,v,vii,ix,xi}{i,ii,iii,v,vii,x,xi}{i,ii,iii,v,viii,ix,x}{i,ii,iii,v,viii,ix,xi}{i,ii,iii,v,viii,x,xi}{i,ii,iii,v,ix,x,xi}{i,ii,iii,vi,vii,viii,ix}{i,ii,iii,vi,vii,viii,x}{i,ii,iii,vi,vii,viii,xi}{i,ii,iii,vi,vii,ix,x}{i,ii,iii,vi,vii,ix,xi}{i,ii,iii,vi,vii,x,xi}{i,ii,iii,vi,viii,ix,x}{i,ii,iii,vi,viii,ix,xi}{i,ii,iii,vi,viii,x,xi}{i,ii,iii,vi,ix,x,xi}{i,ii,iii,vii,viii,ix,x}{i,ii,iii,vii,viii,ix,xi}{i,ii,iii,vii,viii,x,xi}{i,ii,iii,vii,ix,x,xi}{i,ii,iii,viii,ix,x,xi}{i,ii,iv,v,vi,vii,viii}{i,ii,iv,v,vi,vii,ix}{i,ii,iv,v,vi,vii,x}{i,ii,iv,v,vi,vii,xi}{i,ii,iv,v,vi,viii,ix}{i,ii,iv,v,vi,viii,x}{i,ii,iv,v,vi,viii,xi}{i,ii,iv,v,vi,ix,x}{i,ii,iv,v,vi,ix,xi}{i,ii,iv,v,vi,x,xi}{i,ii,iv,v,vii,viii,ix}{i,ii,iv,v,vii,viii,x}{i,ii,iv,v,vii,viii,xi}{i,ii,iv,v,vii,ix,x}{i,ii,iv,v,vii,ix,xi}{i,ii,iv,v,vii,x,xi}{i,ii,iv,v,viii,ix,x}{i,ii,iv,v,viii,ix,xi}{i,ii,iv,v,viii,x,xi}{i,ii,iv,v,ix,x,xi}{i,ii,iv,vi,vii,viii,ix}{i,ii,iv,vi,vii,viii,x}{i,ii,iv,vi,vii,viii,xi}{i,ii,iv,vi,vii,ix,x}{i,ii,iv,vi,vii,ix,xi}{i,ii,iv,vi,vii,x,xi}{i,ii,iv,vi,viii,ix,x}{i,ii,iv,vi,viii,ix,xi}{i,ii,iv,vi,viii,x,xi}{i,ii,iv,vi,ix,x,xi}{i,ii,iv,vii,viii,ix,x}{i,ii,iv,vii,viii,ix,xi}{i,ii,iv,vii,viii,x,xi}{i,ii,iv,vii,ix,x,xi}{i,ii,iv,viii,ix,x,xi}{i,ii,v,vi,vii,viii,ix}{i,ii,v,vi,vii,viii,x}{i,ii,v,vi,vii,viii,xi}{i,ii,v,vi,vii,ix,x}{i,ii,v,vi,vii,ix,xi}{i,ii,v,vi,vii,x,xi}{i,ii,v,vi,viii,ix,x}{i,ii,v,vi,viii,ix,xi}{i,ii,v,vi,viii,x,xi}{i,ii,v,vi,ix,x,xi}{i,ii,v,vii,viii,ix,x}{i,ii,v,vii,viii,ix,xi}{i,ii,v,vii,viii,x,xi}{i,ii,v,vii,ix,x,xi}{i,ii,v,viii,ix,x,xi}{i,ii,vi,vii,viii,ix,x}{i,ii,vi,vii,viii,ix,xi}{i,ii,vi,vii,viii,x,xi}{i,ii,vi,vii,ix,x,xi}{i,ii,vi,viii,ix,x,xi}{i,ii,vii,viii,ix,x,xi}{i,iii,iv,v,vi,vii,viii}{i,iii,iv,v,vi,vii,ix}{i,iii,iv,v,vi,vii,x}{i,iii,iv,v,vi,vii,xi}{i,iii,iv,v,vi,viii,ix}{i,iii,iv,v,vi,viii,x}{i,iii,iv,v,vi,viii,xi}{i,iii,iv,v,vi,ix,x}{i,iii,iv,v,vi,ix,xi}{i,iii,iv,v,vi,x,xi}{i,iii,iv,v,vii,viii,ix}{i,iii,iv,v,vii,viii,x}{i,iii,iv,v,vii,viii,xi}{i,iii,iv,v,vii,ix,x}{i,iii,iv,v,vii,ix,xi}{i,iii,iv,v,vii,x,xi}{i,iii,iv,v,viii,ix,x}{i,iii,iv,v,viii,ix,xi}{i,iii,iv,v,viii,x,xi}{i,iii,iv,v,ix,x,xi}{i,iii,iv,vi,vii,viii,ix}{i,iii,iv,vi,vii,viii,x}{i,iii,iv,vi,vii,viii,xi}{i,iii,iv,vi,vii,ix,x}{i,iii,iv,vi,vii,ix,xi}{i,iii,iv,vi,vii,x,xi}{i,iii,iv,vi,viii,ix,x}{i,iii,iv,vi,viii,ix,xi}{i,iii,iv,vi,viii,x,xi}{i,iii,iv,vi,ix,x,xi}{i,iii,iv,vii,viii,ix,x}{i,iii,iv,vii,viii,ix,xi}{i,iii,iv,vii,viii,x,xi}{i,iii,iv,vii,ix,x,xi}{i,iii,iv,viii,ix,x,xi}{i,iii,v,vi,vii,viii,ix}{i,iii,v,vi,vii,viii,x}{i,iii,v,vi,vii,viii,xi}{i,iii,v,vi,vii,ix,x}{i,iii,v,vi,vii,ix,xi}{i,iii,v,vi,vii,x,xi}{i,iii,v,vi,viii,ix,x}{i,iii,v,vi,viii,ix,xi}{i,iii,v,vi,viii,x,xi}{i,iii,v,vi,ix,x,xi}{i,iii,v,vii,viii,ix,x}{i,iii,v,vii,viii,ix,xi}{i,iii,v,vii,viii,x,xi}{i,iii,v,vii,ix,x,xi}{i,iii,v,viii,ix,x,xi}{i,iii,vi,vii,viii,ix,x}{i,iii,vi,vii,viii,ix,xi}{i,iii,vi,vii,viii,x,xi}{i,iii,vi,vii,ix,x,xi}{i,iii,vi,viii,ix,x,xi}{i,iii,vii,viii,ix,x,xi}{i,iv,v,vi,vii,viii,ix}{i,iv,v,vi,vii,viii,x}{i,iv,v,vi,vii,viii,xi}{i,iv,v,vi,vii,ix,x}{i,iv,v,vi,vii,ix,xi}{i,iv,v,vi,vii,x,xi}{i,iv,v,vi,viii,ix,x}{i,iv,v,vi,viii,ix,xi}{i,iv,v,vi,viii,x,xi}{i,iv,v,vi,ix,x,xi}{i,iv,v,vii,viii,ix,x}{i,iv,v,vii,viii,ix,xi}{i,iv,v,vii,viii,x,xi}{i,iv,v,vii,ix,x,xi}{i,iv,v,viii,ix,x,xi}{i,iv,vi,vii,viii,ix,x}{i,iv,vi,vii,viii,ix,xi}{i,iv,vi,vii,viii,x,xi}{i,iv,vi,vii,ix,x,xi}{i,iv,vi,viii,ix,x,xi}{i,iv,vii,viii,ix,x,xi}{i,v,vi,vii,viii,ix,x}{i,v,vi,vii,viii,ix,xi}{i,v,vi,vii,viii,x,xi}{i,v,vi,vii,ix,x,xi}{i,v,vi,viii,ix,x,xi}{i,v,vii,viii,ix,x,xi}{i,vi,vii,viii,ix,x,xi}{ii,iii,iv,v,vi,vii,viii}{ii,iii,iv,v,vi,vii,ix}{ii,iii,iv,v,vi,vii,x}{ii,iii,iv,v,vi,vii,xi}{ii,iii,iv,v,vi,viii,ix}{ii,iii,iv,v,vi,viii,x}{ii,iii,iv,v,vi,viii,xi}{ii,iii,iv,v,vi,ix,x}{ii,iii,iv,v,vi,ix,xi}{ii,iii,iv,v,vi,x,xi}{ii,iii,iv,v,vii,viii,ix}{ii,iii,iv,v,vii,viii,x}{ii,iii,iv,v,vii,viii,xi}{ii,iii,iv,v,vii,ix,x}{ii,iii,iv,v,vii,ix,xi}{ii,iii,iv,v,vii,x,xi}{ii,iii,iv,v,viii,ix,x}{ii,iii,iv,v,viii,ix,xi}{ii,iii,iv,v,viii,x,xi}{ii,iii,iv,v,ix,x,xi}{ii,iii,iv,vi,vii,viii,ix}{ii,iii,iv,vi,vii,viii,x}{ii,iii,iv,vi,vii,viii,xi}{ii,iii,iv,vi,vii,ix,x}{ii,iii,iv,vi,vii,ix,xi}{ii,iii,iv,vi,vii,x,xi}{ii,iii,iv,vi,viii,ix,x}{ii,iii,iv,vi,viii,ix,xi}{ii,iii,iv,vi,viii,x,xi}{ii,iii,iv,vi,ix,x,xi}{ii,iii,iv,vii,viii,ix,x}{ii,iii,iv,vii,viii,ix,xi}{ii,iii,iv,vii,viii,x,xi}{ii,iii,iv,vii,ix,x,xi}{ii,iii,iv,viii,ix,x,xi}{ii,iii,v,vi,vii,viii,ix}{ii,iii,v,vi,vii,viii,x}{ii,iii,v,vi,vii,viii,xi}{ii,iii,v,vi,vii,ix,x}{ii,iii,v,vi,vii,ix,xi}{ii,iii,v,vi,vii,x,xi}{ii,iii,v,vi,viii,ix,x}{ii,iii,v,vi,viii,ix,xi}{ii,iii,v,vi,viii,x,xi}{ii,iii,v,vi,ix,x,xi}{ii,iii,v,vii,viii,ix,x}{ii,iii,v,vii,viii,ix,xi}{ii,iii,v,vii,viii,x,xi}{ii,iii,v,vii,ix,x,xi}{ii,iii,v,viii,ix,x,xi}{ii,iii,vi,vii,viii,ix,x}{ii,iii,vi,vii,viii,ix,xi}{ii,iii,vi,vii,viii,x,xi}{ii,iii,vi,vii,ix,x,xi}{ii,iii,vi,viii,ix,x,xi}{ii,iii,vii,viii,ix,x,xi}{ii,iv,v,vi,vii,viii,ix}{ii,iv,v,vi,vii,viii,x}{ii,iv,v,vi,vii,viii,xi}{ii,iv,v,vi,vii,ix,x}{ii,iv,v,vi,vii,ix,xi}{ii,iv,v,vi,vii,x,xi}{ii,iv,v,vi,viii,ix,x}{ii,iv,v,vi,viii,ix,xi}{ii,iv,v,vi,viii,x,xi}{ii,iv,v,vi,ix,x,xi}{ii,iv,v,vii,viii,ix,x}{ii,iv,v,vii,viii,ix,xi}{ii,iv,v,vii,viii,x,xi}{ii,iv,v,vii,ix,x,xi}{ii,iv,v,viii,ix,x,xi}{ii,iv,vi,vii,viii,ix,x}{ii,iv,vi,vii,viii,ix,xi}{ii,iv,vi,vii,viii,x,xi}{ii,iv,vi,vii,ix,x,xi}{ii,iv,vi,viii,ix,x,xi}{ii,iv,vii,viii,ix,x,xi}{ii,v,vi,vii,viii,ix,x}{ii,v,vi,vii,viii,ix,xi}{ii,v,vi,vii,viii,x,xi}{ii,v,vi,vii,ix,x,xi}{ii,v,vi,viii,ix,x,xi}{ii,v,vii,viii,ix,x,xi}{ii,vi,vii,viii,ix,x,xi}{iii,iv,v,vi,vii,viii,ix}{iii,iv,v,vi,vii,viii,x}{iii,iv,v,vi,vii,viii,xi}{iii,iv,v,vi,vii,ix,x}{iii,iv,v,vi,vii,ix,xi}{iii,iv,v,vi,vii,x,xi}{iii,iv,v,vi,viii,ix,x}{iii,iv,v,vi,viii,ix,xi}{iii,iv,v,vi,viii,x,xi}{iii,iv,v,vi,ix,x,xi}{iii,iv,v,vii,viii,ix,x}{iii,iv,v,vii,viii,ix,xi}{iii,iv,v,vii,viii,x,xi}{iii,iv,v,vii,ix,x,xi}{iii,iv,v,viii,ix,x,xi}{iii,iv,vi,vii,viii,ix,x}{iii,iv,vi,vii,viii,ix,xi}{iii,iv,vi,vii,viii,x,xi}{iii,iv,vi,vii,ix,x,xi}{iii,iv,vi,viii,ix,x,xi}{iii,iv,vii,viii,ix,x,xi}{iii,v,vi,vii,viii,ix,x}{iii,v,vi,vii,viii,ix,xi}{iii,v,vi,vii,viii,x,xi}{iii,v,vi,vii,ix,x,xi}{iii,v,vi,viii,ix,x,xi}{iii,v,vii,viii,ix,x,xi}{iii,vi,vii,viii,ix,x,xi}{iv,v,vi,vii,viii,ix,x}{iv,v,vi,vii,viii,ix,xi}{iv,v,vi,vii,viii,x,xi}{iv,v,vi,vii,ix,x,xi}{iv,v,vi,viii,ix,x,xi}{iv,v,vii,viii,ix,x,xi}{iv,vi,vii,viii,ix,x,xi}{v,vi,vii,viii,ix,x,xi}{i,ii,iii,iv,v,vi,vii,viii}{i,ii,iii,iv,v,vi,vii,ix}{i,ii,iii,iv,v,vi,vii,x}{i,ii,iii,iv,v,vi,vii,xi}{i,ii,iii,iv,v,vi,viii,ix}{i,ii,iii,iv,v,vi,viii,x}{i,ii,iii,iv,v,vi,viii,xi}{i,ii,iii,iv,v,vi,ix,x}{i,ii,iii,iv,v,vi,ix,xi}{i,ii,iii,iv,v,vi,x,xi}{i,ii,iii,iv,v,vii,viii,ix}{i,ii,iii,iv,v,vii,viii,x}{i,ii,iii,iv,v,vii,viii,xi}{i,ii,iii,iv,v,vii,ix,x}{i,ii,iii,iv,v,vii,ix,xi}{i,ii,iii,iv,v,vii,x,xi}{i,ii,iii,iv,v,viii,ix,x}{i,ii,iii,iv,v,viii,ix,xi}{i,ii,iii,iv,v,viii,x,xi}{i,ii,iii,iv,v,ix,x,xi}{i,ii,iii,iv,vi,vii,viii,ix}{i,ii,iii,iv,vi,vii,viii,x}{i,ii,iii,iv,vi,vii,viii,xi}{i,ii,iii,iv,vi,vii,ix,x}{i,ii,iii,iv,vi,vii,ix,xi}{i,ii,iii,iv,vi,vii,x,xi}{i,ii,iii,iv,vi,viii,ix,x}{i,ii,iii,iv,vi,viii,ix,xi}{i,ii,iii,iv,vi,viii,x,xi}{i,ii,iii,iv,vi,ix,x,xi}{i,ii,iii,iv,vii,viii,ix,x}{i,ii,iii,iv,vii,viii,ix,xi}{i,ii,iii,iv,vii,viii,x,xi}{i,ii,iii,iv,vii,ix,x,xi}{i,ii,iii,iv,viii,ix,x,xi}{i,ii,iii,v,vi,vii,viii,ix}{i,ii,iii,v,vi,vii,viii,x}{i,ii,iii,v,vi,vii,viii,xi}{i,ii,iii,v,vi,vii,ix,x}{i,ii,iii,v,vi,vii,ix,xi}{i,ii,iii,v,vi,vii,x,xi}{i,ii,iii,v,vi,viii,ix,x}{i,ii,iii,v,vi,viii,ix,xi}{i,ii,iii,v,vi,viii,x,xi}{i,ii,iii,v,vi,ix,x,xi}{i,ii,iii,v,vii,viii,ix,x}{i,ii,iii,v,vii,viii,ix,xi}{i,ii,iii,v,vii,viii,x,xi}{i,ii,iii,v,vii,ix,x,xi}{i,ii,iii,v,viii,ix,x,xi}{i,ii,iii,vi,vii,viii,ix,x}{i,ii,iii,vi,vii,viii,ix,xi}{i,ii,iii,vi,vii,viii,x,xi}{i,ii,iii,vi,vii,ix,x,xi}{i,ii,iii,vi,viii,ix,x,xi}{i,ii,iii,vii,viii,ix,x,xi}{i,ii,iv,v,vi,vii,viii,ix}{i,ii,iv,v,vi,vii,viii,x}{i,ii,iv,v,vi,vii,viii,xi}{i,ii,iv,v,vi,vii,ix,x}{i,ii,iv,v,vi,vii,ix,xi}{i,ii,iv,v,vi,vii,x,xi}{i,ii,iv,v,vi,viii,ix,x}{i,ii,iv,v,vi,viii,ix,xi}{i,ii,iv,v,vi,viii,x,xi}{i,ii,iv,v,vi,ix,x,xi}{i,ii,iv,v,vii,viii,ix,x}{i,ii,iv,v,vii,viii,ix,xi}{i,ii,iv,v,vii,viii,x,xi}{i,ii,iv,v,vii,ix,x,xi}{i,ii,iv,v,viii,ix,x,xi}{i,ii,iv,vi,vii,viii,ix,x}{i,ii,iv,vi,vii,viii,ix,xi}{i,ii,iv,vi,vii,viii,x,xi}{i,ii,iv,vi,vii,ix,x,xi}{i,ii,iv,vi,viii,ix,x,xi}{i,ii,iv,vii,viii,ix,x,xi}{i,ii,v,vi,vii,viii,ix,x}{i,ii,v,vi,vii,viii,ix,xi}{i,ii,v,vi,vii,viii,x,xi}{i,ii,v,vi,vii,ix,x,xi}{i,ii,v,vi,viii,ix,x,xi}{i,ii,v,vii,viii,ix,x,xi}{i,ii,vi,vii,viii,ix,x,xi}{i,iii,iv,v,vi,vii,viii,ix}{i,iii,iv,v,vi,vii,viii,x}{i,iii,iv,v,vi,vii,viii,xi}{i,iii,iv,v,vi,vii,ix,x}{i,iii,iv,v,vi,vii,ix,xi}{i,iii,iv,v,vi,vii,x,xi}{i,iii,iv,v,vi,viii,ix,x}{i,iii,iv,v,vi,viii,ix,xi}{i,iii,iv,v,vi,viii,x,xi}{i,iii,iv,v,vi,ix,x,xi}{i,iii,iv,v,vii,viii,ix,x}{i,iii,iv,v,vii,viii,ix,xi}{i,iii,iv,v,vii,viii,x,xi}{i,iii,iv,v,vii,ix,x,xi}{i,iii,iv,v,viii,ix,x,xi}{i,iii,iv,vi,vii,viii,ix,x}{i,iii,iv,vi,vii,viii,ix,xi}{i,iii,iv,vi,vii,viii,x,xi}{i,iii,iv,vi,vii,ix,x,xi}{i,iii,iv,vi,viii,ix,x,xi}{i,iii,iv,vii,viii,ix,x,xi}{i,iii,v,vi,vii,viii,ix,x}{i,iii,v,vi,vii,viii,ix,xi}{i,iii,v,vi,vii,viii,x,xi}{i,iii,v,vi,vii,ix,x,xi}{i,iii,v,vi,viii,ix,x,xi}{i,iii,v,vii,viii,ix,x,xi}{i,iii,vi,vii,viii,ix,x,xi}{i,iv,v,vi,vii,viii,ix,x}{i,iv,v,vi,vii,viii,ix,xi}{i,iv,v,vi,vii,viii,x,xi}{i,iv,v,vi,vii,ix,x,xi}{i,iv,v,vi,viii,ix,x,xi}{i,iv,v,vii,viii,ix,x,xi}{i,iv,vi,vii,viii,ix,x,xi}{i,v,vi,vii,viii,ix,x,xi}{ii,iii,iv,v,vi,vii,viii,ix}{ii,iii,iv,v,vi,vii,viii,x}{ii,iii,iv,v,vi,vii,viii,xi}{ii,iii,iv,v,vi,vii,ix,x}{ii,iii,iv,v,vi,vii,ix,xi}{ii,iii,iv,v,vi,vii,x,xi}{ii,iii,iv,v,vi,viii,ix,x}{ii,iii,iv,v,vi,viii,ix,xi}{ii,iii,iv,v,vi,viii,x,xi}{ii,iii,iv,v,vi,ix,x,xi}{ii,iii,iv,v,vii,viii,ix,x}{ii,iii,iv,v,vii,viii,ix,xi}{ii,iii,iv,v,vii,viii,x,xi}{ii,iii,iv,v,vii,ix,x,xi}{ii,iii,iv,v,viii,ix,x,xi}{ii,iii,iv,vi,vii,viii,ix,x}{ii,iii,iv,vi,vii,viii,ix,xi}{ii,iii,iv,vi,vii,viii,x,xi}{ii,iii,iv,vi,vii,ix,x,xi}{ii,iii,iv,vi,viii,ix,x,xi}{ii,iii,iv,vii,viii,ix,x,xi}{ii,iii,v,vi,vii,viii,ix,x}{ii,iii,v,vi,vii,viii,ix,xi}{ii,iii,v,vi,vii,viii,x,xi}{ii,iii,v,vi,vii,ix,x,xi}{ii,iii,v,vi,viii,ix,x,xi}{ii,iii,v,vii,viii,ix,x,xi}{ii,iii,vi,vii,viii,ix,x,xi}{ii,iv,v,vi,vii,viii,ix,x}{ii,iv,v,vi,vii,viii,ix,xi}{ii,iv,v,vi,vii,viii,x,xi}{ii,iv,v,vi,vii,ix,x,xi}{ii,iv,v,vi,viii,ix,x,xi}{ii,iv,v,vii,viii,ix,x,xi}{ii,iv,vi,vii,viii,ix,x,xi}{ii,v,vi,vii,viii,ix,x,xi}{iii,iv,v,vi,vii,viii,ix,x}{iii,iv,v,vi,vii,viii,ix,xi}{iii,iv,v,vi,vii,viii,x,xi}{iii,iv,v,vi,vii,ix,x,xi}{iii,iv,v,vi,viii,ix,x,xi}{iii,iv,v,vii,viii,ix,x,xi}{iii,iv,vi,vii,viii,ix,x,xi}{iii,v,vi,vii,viii,ix,x,xi}{iv,v,vi,vii,viii,ix,x,xi}{i,ii,iii,iv,v,vi,vii,viii,ix}{i,ii,iii,iv,v,vi,vii,viii,x}{i,ii,iii,iv,v,vi,vii,viii,xi}{i,ii,iii,iv,v,vi,vii,ix,x}{i,ii,iii,iv,v,vi,vii,ix,xi}{i,ii,iii,iv,v,vi,vii,x,xi}{i,ii,iii,iv,v,vi,viii,ix,x}{i,ii,iii,iv,v,vi,viii,ix,xi}{i,ii,iii,iv,v,vi,viii,x,xi}{i,ii,iii,iv,v,vi,ix,x,xi}{i,ii,iii,iv,v,vii,viii,ix,x}{i,ii,iii,iv,v,vii,viii,ix,xi}{i,ii,iii,iv,v,vii,viii,x,xi}{i,ii,iii,iv,v,vii,ix,x,xi}{i,ii,iii,iv,v,viii,ix,x,xi}{i,ii,iii,iv,vi,vii,viii,ix,x}{i,ii,iii,iv,vi,vii,viii,ix,xi}{i,ii,iii,iv,vi,vii,viii,x,xi}{i,ii,iii,iv,vi,vii,ix,x,xi}{i,ii,iii,iv,vi,viii,ix,x,xi}{i,ii,iii,iv,vii,viii,ix,x,xi}{i,ii,iii,v,vi,vii,viii,ix,x}{i,ii,iii,v,vi,vii,viii,ix,xi}{i,ii,iii,v,vi,vii,viii,x,xi}{i,ii,iii,v,vi,vii,ix,x,xi}{i,ii,iii,v,vi,viii,ix,x,xi}{i,ii,iii,v,vii,viii,ix,x,xi}{i,ii,iii,vi,vii,viii,ix,x,xi}{i,ii,iv,v,vi,vii,viii,ix,x}{i,ii,iv,v,vi,vii,viii,ix,xi}{i,ii,iv,v,vi,vii,viii,x,xi}{i,ii,iv,v,vi,vii,ix,x,xi}{i,ii,iv,v,vi,viii,ix,x,xi}{i,ii,iv,v,vii,viii,ix,x,xi}{i,ii,iv,vi,vii,viii,ix,x,xi}{i,ii,v,vi,vii,viii,ix,x,xi}{i,iii,iv,v,vi,vii,viii,ix,x}{i,iii,iv,v,vi,vii,viii,ix,xi}{i,iii,iv,v,vi,vii,viii,x,xi}{i,iii,iv,v,vi,vii,ix,x,xi}{i,iii,iv,v,vi,viii,ix,x,xi}{i,iii,iv,v,vii,viii,ix,x,xi}{i,iii,iv,vi,vii,viii,ix,x,xi}{i,iii,v,vi,vii,viii,ix,x,xi}{i,iv,v,vi,vii,viii,ix,x,xi}{ii,iii,iv,v,vi,vii,viii,ix,x}{ii,iii,iv,v,vi,vii,viii,ix,xi}{ii,iii,iv,v,vi,vii,viii,x,xi}{ii,iii,iv,v,vi,vii,ix,x,xi}{ii,iii,iv,v,vi,viii,ix,x,xi}{ii,iii,iv,v,vii,viii,ix,x,xi}{ii,iii,iv,vi,vii,viii,ix,x,xi}{ii,iii,v,vi,vii,viii,ix,x,xi}{ii,iv,v,vi,vii,viii,ix,x,xi}{iii,iv,v,vi,vii,viii,ix,x,xi}{i,ii,iii,iv,v,vi,vii,viii,ix,x}{i,ii,iii,iv,v,vi,vii,viii,ix,xi}{i,ii,iii,iv,v,vi,vii,viii,x,xi}{i,ii,iii,iv,v,vi,vii,ix,x,xi}{i,ii,iii,iv,v,vi,viii,ix,x,xi}{i,ii,iii,iv,v,vii,viii,ix,x,xi}{i,ii,iii,iv,vi,vii,viii,ix,x,xi}{i,ii,iii,v,vi,vii,viii,ix,x,xi}{i,ii,iv,v,vi,vii,viii,ix,x,xi}{i,iii,iv,v,vi,vii,viii,ix,x,xi}{ii,iii,iv,v,vi,vii,viii,ix,x,xi}或{i,ii,iii,iv,v,vi,vii,viii,ix,x,xi}。

如果变异体包含(i)和(iii)到(xi)中的任一个,那么其可进一步包含在y51、n55和f56中的一或多个处的突变,如在y51、n55、f56、y51/n55、y51/f56、n55/f56或y51/n55/f56处。

在(i)中,变异体可包含在任何数量和以下的组合处突变:n40、d43、e44、s54、s57、q62、r97、e101、e124、e131、r142、t150和r192。在(i)中,变异体优选地包含在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变):n40、d43、e44、s54、s57、q62、e101、e131和t150。在(i)中,变异体优选地包含在以下位置处的一或多个突变(即在以下位置中的一或多个处的突变):n40、d43、e44、e101和e131。在(i)中,变异体优选地包含在s54和/或s57处的突变。在(i)中,变异体更优选地包含在以下处的突变:(a)s54和/或s57;和(b)y51、n55和f56中的一或多个,如在y51、n55、f56、y51/n55、y51/f56、n55/f56或y51/n55/f56处。如果在(xi)中缺失s54和/或s57,那么其在(i)中不会为突变的且反之亦然。在(i)中,变异体优选地包含在t150处的突变,如t150i。或者,变异体优选地包含在以下处的突变:(a)t150;和(b)y51、n55和f56中的一或多个,如在y51、n55、f56、y51/n55、y51/f56、n55/f56或y51/n55/f56处。在(i)中,变异体优选地包含在q62处的突变,如q62r或q62k。或者,变异体优选地包含在以下处的突变:(a)q62;和(b)y51、n55和f56中的一或多个,如在y51、n55、f56、y51/n55、y51/f56、n55/f56或y51/n55/f56处。变异体可包含在d43、e44、q62处或其任何组合的突变,如d43、e44、q62、d43/e44、d43/q62、e44/q62或d43/e44/q62。或者,变异体优选地包含在以下处的突变:(a)d43、e44、q62、d43/e44、d43/q62、e44/q62或d43/e44/q62;和(b)y51、n55和f56中的一或多个,如在y51、n55、f56、y51/n55、y51/f56、n55/f56或y51/n55/f56处。

在(ii)和由/符号分隔的不同位置的本申请的其它地方中,/符号意指“和”,从而y51/n55是y51和n55。在(ii)中,变异体优选地包含在y51/n55处的突变。已提出,csgg中的收缩是由通过残基y51、n55和f56的侧链形成的三个堆叠式同心环构成(goyal等人,2014,《自然(nature)》,516,250-253)。因此,(ii)中的这些残基的突变可降低在聚核苷酸移动通过孔时引起电流的核苷酸的数量,且从而使得其更容易鉴定所观测的电流(在聚核苷酸移动通过孔时)与聚核苷酸之间的直接关系。f56可以下文参考适用于本发明的方法中的变异体和孔而论述任一个方式来突变。

在(v)中,变异体可包含n102r、n102f、n102y或n102w。变异体优选地包含:(a)n102r、n102f、n102y或n102w;和(b)在y51、n55和f56中的一或多个处的突变,如在y51、n55、f56、y51/n55、y51/f56、n55/f56或y51/n55/f56处。

在(xi)中,可缺失任何数量和以下的组合:k49、p50、y51、p52、a53、s54、n55、f56和s57。优选地,可缺失k49、p50、y51、p52、a53、s54、n55和s57中的一或多个。如果在(xi)中缺失y51、n55和f56中的任一个,那么其在(ii)中不会为突变的且反之亦然。

在(i)中,变异体优选地包含以下取代中的一或多个:n40r、n40k、d43n、d43q、d43r、d43k、e44n、e44q、e44r、e44k、s54p、s57p、q62r、q62k、r97n、r97g、r97l、e101n、e101q、e101r、e101k、e101f、e101y、e101w、e124n、e124q、e124r、e124k、e124f、e124y、e124w、e131d、r142e、r142n、t150i、r192e和r192n,如以下中的一或多个:n40r、n40k、d43n、d43q、d43r、d43k、e44n、e44q、e44r、e44k、s54p、s57p、q62r、q62k、e101n、e101q、e101r、e101k、e101f、e101y、e101w、e131d和t150i,或以下中的一或多个:n40r、n40k、d43n、d43q、d43r、d43k、e44n、e44q、e44r、e44k、e101n、e101q、e101r、e101k、e101f、e101y、e101w和e131d。变异体可包含任何数量的取代和这些取代的组合。在(i)中,变异体优选地包含s54p和/或s57p。在(i)中,变异体优选地包含:(a)s54p和/或s57p;和(b)在y51、n55和f56中的一或多个处的突变,如在y51、n55、f56、y51/n55、y51/f56、n55/f56或y51/n55/f56处。在y51、n55和f56中的一或多个处的突变可以是下文论述的那些中的任一个。在(i)中,变异体优选地包含f56a/s57p或s54p/f56a。变异体优选地包含t150i。或者,变异体优选地包含在以下处的突变:(a)t150i;和(b)y51、n55和f56中的一或多个,如在y51、n55、f56、y51/n55、y51/f56、n55/f56或y51/n55/f56处。

在(i)中,变异体优选地包含q62r或q62k。或者,变异体优选地包含:(a)q62r或q62k;和(b)在y51、n55和f56中的一或多个处的突变,如在y51、n55、f56、y51/n55、y51/f56、n55/f56或y51/n55/f56处。变异体可包含d43n、e44n、q62r或q62k或其任何组合,如d43n、e44n、q62r、q62k、d43n/e44n、d43n/q62r、d43n/q62k、e44n/q62r、e44n/q62k、d43n/e44n/q62r或d43n/e44n/q62k。或者,变异体优选地包含:(a)d43n、e44n、q62r、q62k、d43n/e44n、d43n/q62r、d43n/q62k、e44n/q62r、e44n/q62k、d43n/e44n/q62r或d43n/e44n/q62k;和(b)在y51、n55和f56中的一或多个处的突变,如在y51、n55、f56、y51/n55、y51/f56、n55/f56或y51/n55/f56处。

在(i)中,变异体优选地包含d43n。

在(i)中,变异体优选地包含e101r、e101s、e101f或e101n。

在(i)中,变异体优选地包含e124n、e124q、e124r、e124k、e124f、e124y、e124w或e124d,如e124n。

在(i)中,变异体优选地包含r142e和r142n。

在(i)中,变异体优选地包含r97n、r97g或r97l。

在(i)中,变异体优选地包含r192e和r192n。

在(ii)中,变异体优选地包含:f56n/n55q、f56n/n55r、f56n/n55k、f56n/n55s、f56n/n55g、f56n/n55a、f56n/n55t、f56q/n55q、f56q/n55r、f56q/n55k、f56q/n55s、f56q/n55g、f56q/n55a、f56q/n55t、f56r/n55q、f56r/n55r、f56r/n55k、f56r/n55s、f56r/n55g、f56r/n55a、f56r/n55t、f56s/n55q、f56s/n55r、f56s/n55k、f56s/n55s、f56s/n55g、f56s/n55a、f56s/n55t、f56g/n55q、f56g/n55r、f56g/n55k、f56g/n55s、f56g/n55g、f56g/n55a、f56g/n55t、f56a/n55q、f56a/n55r、f56a/n55k、f56a/n55s、f56a/n55g、f56a/n55a、f56a/n55t、f56k/n55q、f56k/n55r,f56k/n55k、f56k/n55s、f56k/n55g、f56k/n55a、f56k/n55t、f56n/y51l、f56n/y51v、f56n/y51a、f56n/y51n、f56n/y51q、f56n/y51s、f56n/y51g、f56q/y51l、f56q/y51v、f56q/y51a、f56q/y51n、f56q/y51q、f56q/y51s、f56q/y51g、f56r/y51l、f56r/y51v、f56r/y51a、f56r/y51n、f56r/y51q、f56r/y51s、f56r/y51g、f56s/y51l、f56s/y51v、f56s/y51a、f56s/y51n、f56s/y51q、f56s/y51s、f56s/y51g、f56g/y51l、f56g/y51v、f56g/y51a、f56g/y51n、f56g/y51q、f56g/y51s、f56g/y51g、f56a/y51l、f56a/y51v、f56a/y51a、f56a/y51n、f56a/y51q、f56a/y51s、f56a/y51g、f56k/y51l、f56k/y51v、f56k/y51a、f56k/y51n、f56k/y51q、f56k/y51s、f56k/y51g、n55q/y51l、n55q/y51v、n55q/y51a、n55q/y51n、n55q/y51q、n55q/y51s、n55q/y51g、n55r/y51l、n55r/y51v、n55r/y51a、n55r/y51n、n55r/y51q、n55r/y51s、n55r/y51g、n55k/y51l、n55k/y51v、n55k/y51a、n55k/y51n、n55k/y51q、n55k/y51s、n55k/y51g、n55s/y51l、n55s/y51v、n55s/y51a、n55s/y51n、n55s/y51q、n55s/y51s、n55s/y51g、n55g/y51l、n55g/y51v、n55g/y51a、n55g/y51n、n55g/y51q、n55g/y51s、n55g/y51g、n55a/y51l、n55a/y51v、n55a/y51a、n55a/y51n、n55a/y51q、n55a/y51s、n55a/y51g、n55t/y51l、n55t/y51v、n55t/y51a、n55t/y51n、n55t/y51q、n55t/y51s、n55t/y51g、f56n/n55q/y51l、f56n/n55q/y51v、f56n/n55q/y51a、f56n/n55q/y51n、f56n/n55q/y51q、f56n/n55q/y51s、f56n/n55q/y51g、f56n/n55r/y51l、f56n/n55r/y51v、f56n/n55r/y51a、f56n/n55r/y51n、f56n/n55r/y51q、f56n/n55r/y51s、f56n/n55r/y51g、f56n/n55k/y51l、f56n/n55k/y51v、f56n/n55k/y51a、f56n/n55k/y51n、f56n/n55k/y51q、f56n/n55k/y51s、f56n/n55k/y51g、f56n/n55s/y51l、f56n/n55s/y51v、f56n/n55s/y51a、f56n/n55s/y51n、f56n/n55s/y51q、f56n/n55s/y51s、f56n/n55s/y51g、f56n/n55g/y51l、f56n/n55g/y51v、f56n/n55g/y51a、f56n/n55g/y51n、f56n/n55g/y51q、f56n/n55g/y51s、f56n/n55g/y51g、f56n/n55a/y51l、f56n/n55a/y51v、f56n/n55a/y51a、f56n/n55a/y51n、f56n/n55a/y51q、f56n/n55a/y51s、f56n/n55a/y51g、f56n/n55t/y51l、f56n/n55t/y51v、f56n/n55t/y51a、f56n/n55t/y51n、f56n/n55t/y51q、f56n/n55t/y51s、f56n/n55t/y51g、f56q/n55q/y51l、f56q/n55q/y51v、f56q/n55q/y51a、f56q/n55q/y51n、f56q/n55q/y51q、f56q/n55q/y51s、f56q/n55q/y51g、f56q/n55r/y51l、f56q/n55r/y51v、f56q/n55r/y51a、f56q/n55r/y51n、f56q/n55r/y51q、f56q/n55r/y51s、f56q/n55r/y51g、f56q/n55k/y51l、f56q/n55k/y51v、f56q/n55k/y51a、f56q/n55k/y51n、f56q/n55k/y51q、f56q/n55k/y51s、f56q/n55k/y51g、f56q/n55s/y51l、f56q/n55s/y51v、f56q/n55s/y51a、f56q/n55s/y51n、f56q/n55s/y51q、f56q/n55s/y51s、f56q/n55s/y51g、f56q/n55g/y51l、f56q/n55g/y51v、f56q/n55g/y51a、f56q/n55g/y51n、f56q/n55g/y51q、f56q/n55g/y51s、f56q/n55g/y51g、f56q/n55a/y51l、f56q/n55a/y51v、f56q/n55a/y51a、f56q/n55a/y51n、f56q/n55a/y51q、f56q/n55a/y51s、f56q/n55a/y51g、f56q/n55t/y51l、f56q/n55t/y51v、f56q/n55t/y51a、f56q/n55t/y51n、f56q/n55t/y51q、f56q/n55t/y51s、f56q/n55t/y51g、f56r/n55q/y51l、f56r/n55q/y51v、f56r/n55q/y51a、f56r/n55q/y51n、f56r/n55q/y51q、f56r/n55q/y51s、f56r/n55q/y51g、f56r/n55r/y51l、f56r/n55r/y51v、f56r/n55r/y51a、f56r/n55r/y51n、f56r/n55r/y51q、f56r/n55r/y51s、f56r/n55r/y51g、f56r/n55k/y51l、f56r/n55k/y51v、f56r/n55k/y51a、f56r/n55k/y51n、f56r/n55k/y51q、f56r/n55k/y51s、f56r/n55k/y51g、f56r/n55s/y51l、f56r/n55s/y51v、f56r/n55s/y51a、f56r/n55s/y51n、f56r/n55s/y51q、f56r/n55s/y51s、f56r/n55s/y51g、f56r/n55g/y51l、f56r/n55g/y51v、f56r/n55g/y51a、f56r/n55g/y51n、f56r/n55g/y51q、f56r/n55g/y51s、f56r/n55g/y51g、f56r/n55a/y51l、f56r/n55a/y51v、f56r/n55a/y51a、f56r/n55a/y51n、f56r/n55a/y51q、f56r/n55a/y51s、f56r/n55a/y51g、f56r/n55t/y51l、f56r/n55t/y51v、f56r/n55t/y51a、f56r/n55t/y51n、f56r/n55t/y51q、f56r/n55t/y51s、f56r/n55t/y51g、f56s/n55q/y51l、f56s/n55q/y51v、f56s/n55q/y51a、f56s/n55q/y51n、f56s/n55q/y51q、f56s/n55q/y51s、f56s/n55q/y51g、f56s/n55r/y51l、f56s/n55r/y51v、f56s/n55r/y51a、f56s/n55r/y51n、f56s/n55r/y51q、f56s/n55r/y51s、f56s/n55r/y51g、f56s/n55k/y51l、f56s/n55k/y51v、f56s/n55k/y51a、f56s/n55k/y51n、f56s/n55k/y51q、f56s/n55k/y51s、f56s/n55k/y51g、f56s/n55s/y51l、f56s/n55s/y51v、f56s/n55s/y51a、f56s/n55s/y51n、f56s/n55s/y51q、f56s/n55s/y51s、f56s/n55s/y51g、f56s/n55g/y51l、f56s/n55g/y51v、f56s/n55g/y51a、f56s/n55g/y51n、f56s/n55g/y51q、f56s/n55g/y51s、f56s/n55g/y51g、f56s/n55a/y51l、f56s/n55a/y51v、f56s/n55a/y51a、f56s/n55a/y51n、f56s/n55a/y51q、f56s/n55a/y51s、f56s/n55a/y51g、f56s/n55t/y51l、f56s/n55t/y51v、f56s/n55t/y51a、f56s/n55t/y51n、f56s/n55t/y51q、f56s/n55t/y51s、f56s/n55t/y51g、f56g/n55q/y51l、f56g/n55q/y51v、f56g/n55q/y51a、f56g/n55q/y51n、f56g/n55q/y51q、f56g/n55q/y51s、f56g/n55q/y51g、f56g/n55r/y51l、f56g/n55r/y51v、f56g/n55r/y51a、f56g/n55r/y51n、f56g/n55r/y51q、f56g/n55r/y51s、f56g/n55r/y51g、f56g/n55k/y51l、f56g/n55k/y51v、f56g/n55k/y51a、f56g/n55k/y51n、f56g/n55k/y51q、f56g/n55k/y51s、f56g/n55k/y51g、f56g/n55s/y51l、f56g/n55s/y51v、f56g/n55s/y51a、f56g/n55s/y51n、f56g/n55s/y51q、f56g/n55s/y51s、f56g/n55s/y51g、f56g/n55g/y51l、f56g/n55g/y51v、f56g/n55g/y51a、f56g/n55g/y51n、f56g/n55g/y51q、f56g/n55g/y51s、f56g/n55g/y51g、f56g/n55a/y51l、f56g/n55a/y51v、f56g/n55a/y51a、f56g/n55a/y51n、f56g/n55a/y51q、f56g/n55a/y51s、f56g/n55a/y51g、f56g/n55t/y51l、f56g/n55t/y51v、f56g/n55t/y51a、f56g/n55t/y51n、f56g/n55t/y51q、f56g/n55t/y51s、f56g/n55t/y51g、f56a/n55q/y51l、f56a/n55q/y51v、f56a/n55q/y51a、f56a/n55q/y51n、f56a/n55q/y51q、f56a/n55q/y51s、f56a/n55q/y51g、f56a/n55r/y51l、f56a/n55r/y51v、f56a/n55r/y51a、f56a/n55r/y51n、f56a/n55r/y51q、f56a/n55r/y51s、f56a/n55r/y51g、f56a/n55k/y51l、f56a/n55k/y51v、f56a/n55k/y51a、f56a/n55k/y51n、f56a/n55k/y51q、f56a/n55k/y51s、f56a/n55k/y51g、f56a/n55s/y51l、f56a/n55s/y51v、f56a/n55s/y51a、f56a/n55s/y51n、f56a/n55s/y51q、f56a/n55s/y51s、f56a/n55s/y51g、f56a/n55g/y51l、f56a/n55g/y51v、f56a/n55g/y51a、f56a/n55g/y51n、f56a/n55g/y51q、f56a/n55g/y51s、f56a/n55g/y51g、f56a/n55a/y51l、f56a/n55a/y51v、f56a/n55a/y51a、f56a/n55a/y51n、f56a/n55a/y51q、f56a/n55a/y51s、f56a/n55a/y51g、f56a/n55t/y51l、f56a/n55t/y51v、f56a/n55t/y51a、f56a/n55t/y51n、f56a/n55t/y51q、f56a/n55t/y51s、f56a/n55t/y51g、f56k/n55q/y51l、f56k/n55q/y51v、f56k/n55q/y51a、f56k/n55q/y51n、f56k/n55q/y51q、f56k/n55q/y51s、f56k/n55q/y51g、f56k/n55r/y51l、f56k/n55r/y51v、f56k/n55r/y51a、f56k/n55r/y51n、f56k/n55r/y51q、f56k/n55r/y51s、f56k/n55r/y51g、f56k/n55k/y51l、f56k/n55k/y51v、f56k/n55k/y51a、f56k/n55k/y51n、f56k/n55k/y51q、f56k/n55k/y51s、f56k/n55k/y51g、f56k/n55s/y51l、f56k/n55s/y51v、f56k/n55s/y51a、f56k/n55s/y51n、f56k/n55s/y51q、f56k/n55s/y51s、f56k/n55s/y51g、f56k/n55g/y51l、f56k/n55g/y51v、f56k/n55g/y51a、f56k/n55g/y51n、f56k/n55g/y51q、f56k/n55g/y51s、f56k/n55g/y51g、f56k/n55a/y51l、f56k/n55a/y51v、f56k/n55a/y51a、f56k/n55a/y51n、f56k/n55a/y51q、f56k/n55a/y51s、f56k/n55a/y51g、f56k/n55t/y51l、f56k/n55t/y51v、f56k/n55t/y51a、f56k/n55t/y51n、f56k/n55t/y51q,f56k/n55t/y51s、f56k/n55t/y51g、f56e/n55r、f56e/n55k、f56d/n55r、f56d/n55k、f56r/n55e、f56r/n55d、f56k/n55e或f56k/n55d。

在(ii)中,变异体优选地包含:y51r/f56q、y51n/f56n、y51m/f56q、y51l/f56q、y51i/f56q、y51v/f56q、y51a/f56q、y51p/f56q、y51g/f56q、y51c/f56q、y51q/f56q、y51n/f56q、y51s/f56q、y51e/f56q、y51d/f56q、y51k/f56q或y51h/f56q。

在(ii)中,变异体优选地包含y51t/f56q、y51q/f56q或y51a/f56q。

在(ii)中,变异体优选地包含:y51t/f56f、y51t/f56m、y51t/f56l、y51t/f56i、y51t/f56v、y51t/f56a、y51t/f56p、y51t/f56g、y51t/f56c、y51t/f56q、y51t/f56n、y51t/f56t、y51t/f56s、y51t/f56e、y51t/f56d、y51t/f56k、y51t/f56h或y51t/f56r。

在(ii)中,变异体优选地包含y51t/n55q、y51t/n55s或y51t/n55a。

在(ii)中,变异体优选地包含:y51a/f56f、y51a/f56l、y51a/f56i、y51a/f56v、y51a/f56a、y51a/f56p、y51a/f56g、y51a/f56c、y51a/f56q、y51a/f56n、y51a/f56t、y51a/f56s、y51a/f56e、y51a/f56d、y51a/f56k、y51a/f56h或y51a/f56r。

在(ii)中,变异体优选地包含:y51c/f56a、y51e/f56a、y51d/f56a、y51k/f56a、y51h/f56a、y51q/f56a、y51n/f56a、y51s/f56a、y51p/f56a或y51v/f56a。

在(xi)中,变异体优选地包含y51/p52、y51/p52/a53、p50到p52、p50到a53、k49到y51、k49到a53的缺失,和k49到s54用单一脯氨酸(p)的置换;和y51到a53、y51到s54、n55/f56、n55到s57、n55/f56用单一p的置换;和n55/f56用单一p的置换;和n55/f56用单一甘氨酸(公克)的置换;和n55/f56用单一丙氨酸(a)的置换;和用单一p的置换,和y51n、n55/f56;和用单一p的置换,和y51q、n55/f56;和用单一p的置换,y51s、n55/f56;和用单一g的置换,和y51n、n55/f56;和用单一g的置换,和y51q、n55/f56;和用单一g的置换,和y51s、n55/f56;和用单一a的置换,和y51n、n55/f56;和用单一a/y51q或n55/f56的置换;和用单一a的置换,和y51s。

变异体更优选地包含:d195n/e203n、d195q/e203n、d195n/e203q、d195q/e203q、e201n/e203n、e201q/e203n、e201n/e203q、e201q/e203q、e185n/e203q、e185q/e203q、e185n/e203n、e185q/e203n、d195n/e201n/e203n、d195q/e201n/e203n、d195n/e201q/e203n、d195n/e201n/e203q、d195q/e201q/e203n、d195q/e201n/e203q、d195n/e201q/e203q、d195q/e201q/e203q、d149n/e201n、d149q/e201n、d149n/e201q、d149q/e201q、d149n/e201n/d195n、d149q/e201n/d195n、d149n/e201q/d195n、d149n/e201n/d195q、d149q/e201q/d195n、d149q/e201n/d195q、d149n/e201q/d195q、d149q/e201q/d195q、d149n/e203n、d149q/e203n、d149n/e203q、d149q/e203q、d149n/e185n/e201n、d149q/e185n/e201n、d149n/e185q/e201n、d149n/e185n/e201q、d149q/e185q/e201n、d149q/e185n/e201q、d149n/e185q/e201q、d149q/e185q/e201q、d149n/e185n/e203n、d149q/e185n/e203n、d149n/e185q/e203n、d149n/e185n/e203q、d149q/e185q/e203n、d149q/e185n/e203q、d149n/e185q/e203q、d149q/e185q/e203q、d149n/e185n/e201n/e203n、d149q/e185n/e201n/e203n、d149n/e185q/e201n/e203n、d149n/e185n/e201q/e203n、d149n/e185n/e201n/e203q、d149q/e185q/e201n/e203n、d149q/e185n/e201q/e203n、d149q/e185n/e201n/e203q、d149n/e185q/e201q/e203n、d149n/e185q/e201n/e203q、d149n/e185n/e201q/e203q、d149q/e185q/e201q/e203q、d149q/e185q/e201n/e203q、d149q/e185n/e201q/e203q、d149n/e185q/e201q/e203q、d149q/e185q/e201q/e203n、d149n/e185n/d195n/e201n/e203n、d149q/e185n/d195n/e201n/e203n、d149n/e185q/d195n/e201n/e203n、d149n/e185n/d195q/e201n/e203n、d149n/e185n/d195n/e201q/e203n、d149n/e185n/d195n/e201n/e203q、d149q/e185q/d195n/e201n/e203n、d149q/e185n/d195q/e201n/e203n、d149q/e185n/d195n/e201q/e203n、d149q/e185n/d195n/e201n/e203q、d149n/e185q/d195q/e201n/e203n、d149n/e185q/d195n/e201q/e203n、d149n/e185q/d195n/e201n/e203q、d149n/e185n/d195q/e201q/e203n、d149n/e185n/d195q/e201n/e203q、d149n/e185n/d195n/e201q/e203q、d149q/e185q/d195q/e201n/e203n、d149q/e185q/d195n/e201q/e203n、d149q/e185q/d195n/e201n/e203q、d149q/e185n/d195q/e201q/e203n、d149q/e185n/d195q/e201n/e203q、d149q/e185n/d195n/e201q/e203q、d149n/e185q/d195q/e201q/e203n、d149n/e185q/d195q/e201n/e203q、d149n/e185q/d195n/e201q/e203q、d149n/e185n/d195q/e201q/e203q、d149q/e185q/d195q/e201q/e203n、d149q/e185q/d195q/e201n/e203q、d149q/e185q/d195n/e201q/e203q、d149q/e185n/d195q/e201q/e203q、d149n/e185q/d195q/e201q/e203q、d149q/e185q/d195q/e201q/e203q、d149n/e185r/e201n/e203n、d149q/e185r/e201n/e203n、d149n/e185r/e201q/e203n、d149n/e185r/e201n/e203q、d149q/e185r/e201q/e203n、d149q/e185r/e201n/e203q、d149n/e185r/e201q/e203q、d149q/e185r/e201q/e203q、d149r/e185n/e201n/e203n、d149r/e185q/e201n/e203n、d149r/e185n/e201q/e203n、d149r/e185n/e201n/e203q、d149r/e185q/e201q/e203n、d149r/e185q/e201n/e203q、d149r/e185n/e201q/e203q、d149r/e185q/e201q/e203q、d149r/e185n/d195n/e201n/e203n、d149r/e185q/d195n/e201n/e203n、d149r/e185n/d195q/e201n/e203n、d149r/e185n/d195n/e201q/e203n、d149r/e185q/d195n/e201n/e203q、d149r/e185q/d195q/e201n/e203n、d149r/e185q/d195n/e201q/e203n、d149r/e185q/d195n/e201n/e203q、d149r/e185n/d195q/e201q/e203n、d149r/e185n/d195q/e201n/e203q、d149r/e185n/d195n/e201q/e203q、d149r/e185q/d195q/e201q/e203n、d149r/e185q/d195q/e201n/e203q、d149r/e185q/d195n/e201q/e203q、d149r/e185n/d195q/e201q/e203q、d149r/e185q/d195q/e201q/e203q、d149n/e185r/d195n/e201n/e203n、d149q/e185r/d195n/e201n/e203n、d149n/e185r/d195q/e201n/e203n、d149n/e185r/d195n/e201q/e203n、d149n/e185r/d195n/e201n/e203q、d149q/e185r/d195q/e201n/e203n、d149q/e185r/d195n/e201q/e203n、d149q/e185r/d195n/e201n/e203q、d149n/e185r/d195q/e201q/e203n、d149n/e185r/d195q/e201n/e203q、d149n/e185r/d195n/e201q/e203q、d149q/e185r/d195q/e201q/e203n、d149q/e185r/d195q/e201n/e203q、d149q/e185r/d195n/e201q/e203q、d149n/e185r/d195q/e201q/e203q、d149q/e185r/d195q/e201q/e203q、d149n/e185r/d195n/e201r/e203n、d149q/e185r/d195n/e201r/e203n、d149n/e185r/d195q/e201r/e203n、d149n/e185r/d195n/e201r/e203q、d149q/e185r/d195q/e201r/e203n、d149q/e185r/d195n/e201r/e203q、d149n/e185r/d195q/e201r/e203q、d149q/e185r/d195q/e201r/e203q、e131d/k49r、e101n/n102f、e101n/n102y、e101n/n102w、e101f/n102f、e101f/n102y、e101f/n102w、e101y/n102f、e101y/n102y、e101y/n102w、e101w/n102f、e101w/n102y、e101w/n102w、e101n/n102r、e101f/n102r、e101y/n102r或e101w/n102f。

本发明形成孔的优选变异体,其中较少核苷酸在聚核苷酸移动通过孔时引起电流,包含y51a/f56a、y51a/f56n、y51i/f56a、y51l/f56a、y51t/f56a、y51i/f56n、y51l/f56n或y51t/f56n,或更优选地y51i/f56a、y51l/f56a或y51t/f56a。如上文所论述,这使得其更容易鉴定所观测的电流(在聚核苷酸移动通过孔时)与聚核苷酸之间的直接关系。

形成显示范围增加的孔的优选变异体包含在以下位置处的突变:

y51、f56、d149、e185、e201和e203;

n55和f56;

y51和f56;

y51、n55和f56;或

f56和n102。

形成显示范围增加的孔的优选变异体包含:

y51n、f56a、d149n、e185r、e201n和e203n;

n55s和f56q;

y51a和f56a;

y51a和f56n;

y51i和f56a;

y51l和f56a;

y51t和f56a;

y51i和f56n;

y51l和f56n;

y51t和f56n;

y51t和f56q;

y51a、n55s和f56a;

y51a、n55s和f56n;

y51t、n55s和f56q;或

f56q和n102r。

形成孔的优选变异体,其中较少核苷酸在聚核苷酸移动通过孔时引起电流,包含在以下位置处的突变:

n55和f56,如n55x和f56q,其中x是任何氨基酸;或

y51和f56,如y51x和f56q,其中x是任何氨基酸。

特别优选的是,变异体包含y51a和f56q。

形成显示输送量增加的孔的优选变异体包含在以下位置处的突变:

d149、e185和e203;

d149、e185、e201和e203;或

d149、e185、d195、e201和e203。

形成显示输送量增加的孔的优选变异体包含:

d149n、e185n和e203n;

d149n、e185n、e201n和e203n;

d149n、e185r、d195n、e201n和e203n;或

d149n、e185r、d195n、e201r和e203n。

形成其中捕获聚核苷酸增加的孔的优选变异体包含以下突变:

d43n/y51t/f56q;

e44n/y51t/f56q;

d43n/e44n/y51t/f56q;

y51t/f56q/q62r;

d43n/y51t/f56q/q62r;

e44n/y51t/f56q/q62r;或

d43n/e44n/y51t/f56q/q62r。

优选变异体包含以下突变:

d149r/e185r/e201r/e203r或y51t/f56q/d149r/e185r/e201r/e203r;

d149n/e185n/e201n/e203n或y51t/f56q/d149n/e185n/e201n/e203n;

e201r/e203r或y51t/f56q/e201r/e203r

e201n/e203r或y51t/f56q/e201n/e203r;

e203r或y51t/f56q/e203r;

e203n或y51t/f56q/e203n;

e201r或y51t/f56q/e201r;

e201n或y51t/f56q/e201n;

e185r或y51t/f56q/e185r;

e185n或y51t/f56q/e185n;

d149r或y51t/f56q/d149r;

d149n或y51t/f56q/d149n;

r142e或y51t/f56q/r142e;

r142n或y51t/f56q/r142n;

r192e或y51t/f56q/r192e;或

r192n或y51t/f56q/r192n。

优选变异体包含以下突变:

y51a/f56q/e101n/n102r;

y51a/f56q/r97n/n102g;

y51a/f56q/r97n/n102r;

y51a/f56q/r97n;

y51a/f56q/r97g;

y51a/f56q/r97l;

y51a/f56q/n102r;

y51a/f56q/n102f;

y51a/f56q/n102g;

y51a/f56q/e101r;

y51a/f56q/e101f;

y51a/f56q/e101n;或

y51a/f56q/e101g

优选地进一步包含在t150处的突变。形成显示插入增加的孔的优选变异体包含t150i。在t150处的突变(如t150i)可与上文所论述突变或其组合中的任一个进行组合。

seqidno:2的优选变异体包含(a)r97w和(b)在y51和/或f56处的突变。seqidno:2的优选变异体包含(a)r97w和(b)y51r/h/k/d/e/s/t/n/q/c/g/p/a/v/i/l/m和/或f56r/h/k/d/e/s/t/n/q/c/g/p/a/v/i/l/m。seqidno:2的优选变异体包含(a)r97w和(b)y51l/v/a/n/q/s/g和/或f56a/q/n。seqidno:2的优选变异体包含(a)r97w和(b)y51a和/或f56q。seqidno:2的优选变异体包含r97w、y51a和f56q。

在本发明的突变单体中,seqidno:2的变异体优选地包含在r192处的突变。变异体优选地包含r192d/q/f/s/t/n/e、r192d/q/f/s/t或r192d/q。seqidno:2的优选变异体包含(a)r97w,(b)在y51和/或f56处的突变和(c)在r192处的突变,如r192d/q/f/s/t/n/e、r192d/q/f/s/t或r192d/q。seqidno:2的优选变异体包含(a)r97w,(b)y51r/h/k/d/e/s/t/n/q/c/g/p/a/v/i/l/m和/或f56r/h/k/d/e/s/t/n/q/c/g/p/a/v/i/l/m,和(c)在r192处的突变,如r192d/q/f/s/t/n/e、r192d/q/f/s/t或r192d/q。seqidno:2的优选变异体包含(a)r97w,(b)51l/v/a/n/q/s/g和/或f56a/q/n,和(c)在r192处的突变,如r192d/q/f/s/t/n/e、r192d/q/f/s/t或r192d/q。seqidno:2的优选变异体包含(a)r97w,(b)y51a和/或f56q,和(c)在r192处的突变,如r192d/q/f/s/t/n/e、r192d/q/f/s/t或r192d/q。seqidno:2的优选变异体包含r97w、y51a、f56q和r192d/q/f/s/t或r192d/q。seqidno:2的优选变异体包含r97w、y51a、f56q和r192d。seqidno:2的优选变异体包含r97w、y51a、f56q和r192q。在于特定位置处的不同氨基酸通过/符号分隔的以上段落中,/符号意指“或”。举例来说,r192d/q意指r192d或r192q。

在本发明的突变单体中,seqidno:2的变异体优选地包含在r93处的突变。seqidno:2的优选变异体包含(a)r93w和(b)在y51和/或f56处的突变,优选地y51a和f56q。d或r192n,v105、a106和i107的缺失。

以上seqidno:2的优选变异体中的任一个可包含k94n/q突变。以上seqidno:2的优选变异体中的任一个可包含f191t突变。本发明还提供一种突变csgg单体,其包含seqidno:2中所示序列的变异体,所述变异体包含在实例中所公开的变异体中存在的突变组合。

用于引入或取代天然存在的氨基酸的方法在所属领域中是众所周知的。举例来说,可通过在编码突变单体的聚核苷酸中的相关位置处用精氨酸的密码子(cgt)置换甲硫氨酸的密码子(atg),而用精氨酸(r)将甲硫氨酸(m)取代。接着,可如下文所论述来表达聚核苷酸。

用于引入或取代非天然存在的氨基酸的方法在所属领域中也是众所周知的。举例来说,可通过在用于表达突变单体的ivtt系统中包括合成氨基酰基-trna来引入非天然存在的氨基酸。替代地,可通过在特定氨基酸营养缺陷型大肠杆菌中在那些特定氨基酸的合成(即非天然存在的)类似物存在下表达突变单体,来引入所述非天然存在的氨基酸。如果突变单体是使用部分肽合成来生产,那么其还可通过裸接合来生产。

变异体

除上文所论述的特定突变以外,变异体可包括其它突变。在seqidno:2的氨基酸序列的整个长度内,基于氨基酸同源性,变异体将优选地与所述序列至少50%同源。更优选地,基于氨基酸同源性,变异体可在整个序列上与seqidno:2的氨基酸序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在100个或更多的延伸段内,例如在125、150、175或200个或更多的邻接氨基酸内,可存在至少80%,例如至少85%、90%或95%氨基酸同源性(“硬同源性”)。

所属领域中的标准方法可用于测定同源性。举例来说,uwgcg程序包提供bestfit程序,其可用于计算同源性,例如用其默认设置(德弗罗等人(1984)《核酸研究(nucleicacidsresearch)》12,第387-395页)。pileup和blast算法可用于计算同源性对序列进行排序(如鉴定等同残基或对应序列(通常用其默认设置)),例如如altschuls.f.(1993)《分子进化杂志(jmolevol)》36∶290-300;altschul,s.f等人(1990)《分子进化杂志》215:403-10中所描述。用于执行blast分析的软件可通过美国国家生物技术信息中心(nationalcenterforbiotechnologyinformation)(http://www.ncbi.nlm.nih.gov/)公开获得。

seqidno:2是来自大肠杆菌菌株k-12亚株mc4100的野生型csgg单体。seqidno:2的变异体可包含存在于另一csgg同源物中的取代中的任一个。优选csgg同源物在seqidno:3到7和26到41中显示。与seqidno:2相比,变异体可包含存在于seqidno:3到7和26到41中的取代中的一或多个的组合。举例来说,可在seqidno:2中的任何一或多个位置处进行突变,所述一或多个位置在seqidno:2与seqidno:3到7和seqidno:26到41中的任一个之间是不同的。此类突变可为seqidno:2中的氨基酸被seqidno:3到7和seqidno:26到41中的任一个的对应位置的氨基酸取代。替代地,在这些位置中的任一个处的突变可为用任何氨基酸的取代,或可为缺失或插入突变,如缺失或插入1到10个氨基酸,如缺失或插入2到8或3到6个氨基酸。除本文所公开的突变以外,在seqidno:2与所有seqidno:3到7和seqidno:26到41之间是保守的氨基酸优选地存在于本发明的变异体中。然而,可在任何一或多个位置处进行保守突变,这些一或多个位置在seqidno:2与所有seqidno:3到7和seqidno:26到41之间是保守的。

本发明提供一种孔形成csgg突变单体,其包含本文所描述的氨基酸中的任何一个或多个,所述氨基酸在csgg单体结构中对应于seqidno:2中的特定位置的位置处被取代成seqidno:2的特定位置。可通过所属领域中的标准技术来测定对应位置。举例来说,上文提到的pileup和blast算法可用于比对csgg单体的序列与seqidno:2,且因此鉴定对应残基。

特定来说,本发明提供一种孔形成csgg突变单体,其包含以下中的任何一个或多个:

-在对应于seqidno:2中的r97的位置处的w;

-在对应于seqidno:2中的r93的位置处的w;

-在对应于seqidno:2中的r97的位置处的y;

-在对应于seqidno:2中的r93的位置处的y;

-在对应于seqidno:2中的r93和r97的各位置处的y;

-在对应于seqidno:2中的r192的位置处的d;

-在对应于seqidno:2中的v105-i107的位置处的残基的缺失;

-在对应于seqidno:2中的f193到l199的一或多个位置处的残基的缺失;

-在对应于seqidno:2中的f195到l199的位置处的残基的缺失;

-在对应于seqidno:2中的f193到l199的位置处的残基的缺失;

-在对应于seqidno:2中的f191的位置处的t;

-在对应于seqidno:2中的k49的位置处的q;

-在对应于seqidno:2中的k49的位置处的n;

-在对应于seqidno:2中的k42的位置处的q;

-在对应于seqidno:2中的e44的位置处的q;

-在对应于seqidno:2中的e44的位置处的n;

-在对应于seqidno:2中的l90的位置处的r;

-在对应于seqidno:2中的l91的位置处的r;

-在对应于seqidno:2中的i95的位置处的r;

-在对应于seqidno:2中的a99的位置处的r;

-在对应于seqidno:2中的e101的位置处的h;

-在对应于seqidno:2中的e101的位置处的k;

-在对应于seqidno:2中的e101的位置处的n;

-在对应于seqidno:2中的e101的位置处的q;

-在对应于seqidno:2中的e101的位置处的t;

-在对应于seqidno:2中的q114的位置处的k。

本发明的csgg孔形成单体优选地进一步包含在对应于seqidno:2中的y51的位置处的a和/或在对应于seqidno:2中的f56的位置处的q。

孔形成突变单体通常保持形成与野生型csgg单体相同的3d结构的能力,如与具有seqidno:2的序列的csgg单体相同的3d结构。csgg的3d结构在本领域中已知且公开于例如cao等人(2014)《美国国家科学院院刊(pnas)》e5439-e5444中。可在野生型csgg序列中进行任何数量的除本文所描述突变以外的突变,其限制条件为,csgg突变单体保持通过本发明的突变赋予其的改进的特性。

通常,csgg单体将保持形成包含三个α-螺旋和五个β-折叠的结构的能力。特定来说,本发明人已显示,可至少在csgg的以下区中进行不影响csgg单体形成跨膜孔的能力的突变:在第一α螺旋(其开始于seqidno:2中的s63)的n端、在第二α螺旋(从seqidno:2的g85到a99)中、在第二α螺旋与第一β折叠之间的环(从seqidno:2的q100到n120)中、在第四和第五β折叠(分别地,seqidno:2的s173到r192和r198到t107)中和在第四与第五β折叠之间的环(seqidno:2的f193到q197)中,所述跨膜孔能够使多肽移位。因此,可以设想,可在任何csgg单体中的这些区中的任一个中进行不影响单体形成可使聚核苷酸移位的孔的能力的其它突变。还预期,可在其它区中进行不影响单体形成可使聚核苷酸移位的孔的能力的突变,所述其它区如:在α螺旋中的任一个(seqidno:2的s63到r76、g85到a99或v211到l236)中;或在β折叠中的任一个(seqidno:2的i121到n133、k135到r142、i146到r162、s173到r192或r198到t107)中。还预期,可在以下中的任一个中进行不影响单体形成可使聚核苷酸移位的孔的能力的一或多个氨基酸的缺失:连接α螺旋与β折叠的环区,和/或在csgg单体的n端和/或c端区中。

可对seqidno:2的氨基酸序列进行除上文所论述的那些以外的氨基酸取代,例如至多1、2、3、4、5、10、20或30个取代。保守取代用具有类似化学结构、类似化学特性或类似侧链体积的其它氨基酸来置换氨基酸。所引入的氨基酸可具有与其置换的氨基酸类似的极性、亲水性、疏水性、碱性、酸性、电中性或电荷。替代地,保守取代可引入代替预先存在的芳族或脂族氨基酸的另一芳族或脂族氨基酸。保守氨基酸改变在所属领域中是众所周知的,且可根据如在下文表2中限定的20中主要氨基酸的特性来选择。当氨基酸具有类似极性时,还可参考表3中的氨基酸侧链的亲水性值来决定这个选择。

表2-氨基酸的化学特性

表3-亲水性值

可从上文所描述的多肽另外缺失seqidno:2的氨基酸序列的一或多个氨基酸残基。可缺失至多1、2、3、4、5、10、20或30个或更多个残基。

变异体可包括seqidno:2的片段。此类片段保持孔形成活性。片段的长度可为至少50、至少100、至少150、至少200或至少250个氨基酸。此类片段可用于产生孔。片段优选地包含seqidno:2的跨膜域,即k135-q153和s183-s208。

替代地或另外,可向上文所描述的多肽中添加一或多个氨基酸。可在seqidno:2或其变异体或片段的氨基酸序列的氨基端或羧基端处提供延长物。延长物的长度可以非常短,例如1到10个氨基酸。替代地,延长物可以较长,例如至多50或100个氨基酸。可将载体蛋白与根据本发明的氨基酸序列融合。其它融合蛋白在下文更详细地论述。

如上文所论述,变异体是具有不同于seqidno:2的氨基酸序列且保持其形成孔的能力的多肽。变异体通常含有seqidno:2的引起孔形成的区。csgg的孔形成能力通过各亚基中的β-折叠提供,所述csgg含有β-折叠桶。seqidno:2的变异体通常包含seqidno:2中形成β-折叠的区,即k135-q153和s183-s208。可对seqidno:2的形成β-折叠的区进行一或多个修饰,只要所得变异体保持其形成孔的能力即可。seqidno:2的变异体优选地在其-螺旋和/或环区内包括一或多个修饰,如取代、添加或缺失。

衍生自csgg的单体可经修饰以辅助其鉴定或纯化,例如通过添加抗生蛋白链菌素标签或通过添加信号序列以促进其从其中单体并不天然地含有此类序列的细胞分泌。其它合适的标签在下文更详细地论述。单体可用显露标记来进行标记。显露标记可以是使单体被检测到的任何合适标记。合适标记在下文描述。

衍生自csgg的单体还可使用d-氨基酸来产生。举例来说,衍生自csgg的单体可包含l-氨基酸与d-氨基酸的混合物。这在用于产生此类蛋白质或肽的所属领域中是常规的。

衍生自csgg的单体含有一或多个特异性修饰以便于核苷酸鉴别。衍生自csgg的单体还可含有其它非特异性修饰,只要其不干扰孔形成即可。本领域中已知多种非特异性侧链修饰,且可对衍生自csgg的单体的侧链进行所述多种非特异性侧链修饰。此类修饰包括例如,通过与醛反应,随后用nabh4、用甲基乙酰亚氨酸脒化或用乙酸酐酰化来对氨基酸还原烷化。

可使用本领域中已知的标准方法来产生衍生自csgg的单体。可以合成方式或通过重组手段来制备衍生自csgg的单体。举例来说,可通过活体外翻译和转录(ivtt)来合成单体。用于产生孔和单体的合适方法在国际申请第pct/gb09/001690号(公开为wo2010/004273)、第pct/gb09/001679号(公开为wo2010/004265)或第pct/gb10/000133号(公开为wo2010/086603)中论述。论述用于将孔插入到膜中的方法。

在一些实施例中,突变单体进行化学修饰。突变单体可以任何方式和在任何位点处进行化学修饰。突变单体优选地通过将一分子与一或多个半胱氨酸连接(半胱氨酸连接)、将一分子与一或多个赖氨酸连接、将一分子与一或多个非天然氨基酸连接、表位的酶修饰或末端的修饰来进行化学修饰。用于进行此类修饰的合适方法在所属领域中是众所周知的。突变单体可通过连接任何分子来进行化学修饰。举例来说,突变单体可通过连接染料或荧光团来进行化学修饰。

在一些实施例中,突变单体用有助于包含单体的孔与靶核苷酸或靶聚核苷酸序列之间的相互作用的分子衔接子来进行化学修饰。衔接子的存在改进孔和核苷酸或聚核苷酸序列的宿主-客体化学,且从而改进由突变单体形成的孔的测序能力。宿主-客体化学的原理在所属领域中是众所周知的。衔接子对于孔的物理或化学特性具有效果,其改进其与核苷酸或聚核苷酸序列的相互作用。衔接子可改变孔的折叠桶或通道的电荷,或特异性地与核苷酸或聚核苷酸序列相互作用或结合于所述核苷酸或聚核苷酸序列,从而促进其与孔相互作用。

分子衔接子优选地是环状分子、环糊精、能够杂交的物种、dna结合剂或嵌入剂、肽或肽类似物、合成聚合物、芳族平面分子、能够结合氢的带正电小分子或小分子。

衔接子可为环状的。环状衔接子优选地具有与孔相同的对称性。衔接子优选地具有八重或九重对称性,这是由于csgg通常围绕中心轴具有八或九个亚基。这一点在下文更详细论述。

衔接子通常通过宿主-客体化学而与核苷酸或聚核苷酸序列相互作用。衔接子通常能够与核苷酸或聚核苷酸序列相互作用。衔接子包含能够与核苷酸或聚核苷酸序列相互作用的一或多个化学基团。所述一或多个化学基团优选地通过非共价相互作用而与核苷酸或聚核苷酸序列相互作用,如疏水性相互作用、氢结合、范德华力(vanderwaal′sforces)、π-阳离子相互作用和/或静电力。能够与核苷酸或聚核苷酸序列相互作用的一或多个化学基团优选地带正电。能够与核苷酸或聚核苷酸序列相互作用的一或多个化学基团优选地包含氨基。氨基可连接于伯、仲或叔碳原子。衔接子甚至更优选地包含氨基环,如6、7或8个氨基的环。衔接子最优选地包含八氨基环。质子化氨基环可与核苷酸或聚核苷酸序列中的带负电磷酸基相互作用。

孔内的衔接子的正确定位可通过衔接子与包含突变单体的孔之间的宿主-客体化学来进行。衔接子优选地包含能够与孔中的一或多个氨基酸相互作用的一或多个化学基团。衔接子更优选地包含通过非共价相互作用而能够与孔中的一或多个氨基酸相互作用的一或多个化学基团,所述非共价相互作用如疏水性相互作用、氢结合、范德华力、π-阳离子相互作用和/或静电力。能够与孔中的一或多个氨基酸相互作用的化学基团通常是羟基或胺。羟基可连接于伯、仲或叔碳原子。羟基可与孔中的不带电氨基酸形成氢键。可使用有助于孔与核苷酸或聚核苷酸序列之间的相互作用的任何衔接子。

合适衔接子包括(但不限于)环糊精、环肽和葫芦脲。衔接子优选地是环糊精或其衍生物。环糊精或其衍生物可以是在eliseev,a.v.和schneider,h-j.(1994)《美国化学学会杂志(j.am.chem.soc.)》116,6081-6088中所公开那些化合物中的任一个。衔接子更优选地是七-6-氨基-β-环糊精(am7-βcd)、6-单脱氧-6-单氨基-β-环糊精(ami-cd)或七-(6-脱氧-6-胍基)-环糊精(gu7-βcd)。gu7-βcd中的胍基具有比am7-βcd中的伯胺高许多的pka,且因此其带更多的正电。这种gu7-βcd衔接子可用于增加孔中的核苷酸的停留时间,增加所测量的剩余电流的准确度、以及增加在高温或低数据获取速率下的碱基检测速率。

如果如在下文更详细地论述来使用3-(2-吡啶二硫代)丙酸丁二酰亚胺酯(spdp)交联剂,那么衔接子优选地是七(6-脱氧-6-胺基)-6-n-单(2-吡啶基)二硫代丙酰基-β-环糊精(am6ampdp1-βcd)。

更多合适的衔接子包括γ-环糊精,其包含9个糖单元且因此具有九重对称性)。γ-环糊精可含有连接子分子,或可进行修饰以包含所有或更多个在上文所论述的β-环糊精实例中使用的经修饰糖单元。

分子衔接子优选地共价连接于突变单体。可使用本领域中已知的任何方法,将衔接子共价连接于孔。通常通过化学连接来连接衔接子。如果通过半胱氨酸连接来连接分子衔接子,那么通过取代优选地将一或多个半胱氨酸引入到突变中,例如折叠桶中。可通过将分子衔接子连接到突变单体中的一或多个半胱氨酸来对突变单体进行化学修饰。所述一或多个半胱氨酸可为天然存在的,即在seqidno:2中的位置1和/或215处。替代地,可通过将分子衔接子连接到在其它位置处所引入的一或多个半胱氨酸来对突变单体进行化学修饰。在位置215处的半胱氨酸可例如通过取代来移除,以确保分子衔接子并不连接到所述位置,而不是在位置1处的半胱氨酸或在另一位置处引入的半胱氨酸。

可通过修饰相邻残基来增强半胱氨酸残基的反应性。举例来说,侧接精氨酸、组氨酸或赖氨酸残基的碱性基团将改变半胱氨酸巯基的pka为更具反应性的s-基的pka。半胱氨酸残基的反应性可通过巯基保护基(如dtnb)来保护。在连接连接子之前,这些可与突变单体的一或多个半胱氨酸残基反应。

可将所述分子直接连接于突变单体。使用连接子,如化学交联剂或肽连接子,所述分子优选地连接于突变单体。

合适化学交联剂在所属领域中是众所周知的。优选交联剂包括3-(吡啶-2-基二磺酰基)丙酸2,5-二氧代吡咯烷-1-基酯、4-(吡啶-2-基二磺酰基)丁酸2,5-二氧代吡咯烷-1-基酯和8-(吡啶-2-基二磺酰基)辛酸2,5-二氧代吡咯烷-1-基酯。最优选交联剂是3-(2-吡啶二硫代)丙酸丁二酰亚胺酯(spdp)。通常,在分子/交联剂复合体共价连接于突变单体之前,分子共价连接于双功能交联剂,但也有可能在双功能交联剂/单体复合体连接于分子之前,双功能交联剂与共价连接于单体。

连接子优选地对二硫苏糖醇(dtt)具有抗性。合适连接子包括(但不限于)基于碘乙酰胺和基于马来酰亚胺的连接子。

在其它实施例中,单体可连接于聚核苷酸结合蛋白。这形成可在本发明的测序方法中使用的模块测序系统。下文论述聚核苷酸结合蛋白。

聚核苷酸结合蛋白优选地共价连接于突变单体。可使用本领域中已知的任何方法,将蛋白质共价连接于单体。可对单体和蛋白质进行化学融合或基因融合。如果从单一聚核苷酸序列表达完全构筑体,那么单体和蛋白质是基因融合的。将单体基因融合于聚核苷酸结合蛋白论述于国际申请第pct/gb09/001679号(公开为wo2010/004265)中。

如果通过半胱氨酸连接来连接聚核苷酸结合蛋白,那么通过取代优选地将一或多个半胱氨酸引入到突变中。将一或多个半胱氨酸优选地引入到在同源物中具有低保守性、指示可容许突变或插入的环区中。因此,其适合于连接聚核苷酸结合蛋白。在此类实施例中,可移除在位置251处的天然存在的半胱氨酸。可通过如上文所描述的修饰来增强半胱氨酸残基的反应性。

可将聚核苷酸结合蛋白直接连接于突变单体或通过一或多个连接子连接于突变单体。可使用在国际申请第pct/gb10/000132号(公开为wo2010/086602)中描述的杂交连接子,来将分子连接于突变单体。替代地,可使用肽连接子。肽连接子是氨基酸序列。肽连接子的长度、柔性和亲水性通常被设计为使得其不干扰单体和分子的功能。优选柔性肽连接子是2到20,如4、6、8、10或16个丝氨酸和/或甘氨酸的延伸段。更优选的柔性连接子包括(sg)1、(sg)2、(sg)3、(sg)4、(sg)5和(sg)8,其中s是丝氨酸且g是甘氨酸。优选刚性连接子是2到30,如4、6、8、16或24个脯氨酸的延伸段。更优选的刚性连接子包括(p)12,其中p是脯氨酸。

突变单体可用分子衔接子和聚核苷酸结合蛋白来进行化学修饰。

可将分子(用所述分子来对单体进行化学修饰)直接连接于单体或通过如以下国际申请中所公开的连接子来连接:第pct/gb09/001690号(公开为wo2010/004273)、第pct/gb09/001679号(公开为wo2010/004265)或第pct/gb10/000133号(公开为wo2010/086603)。

可例如通过添加组氨酸残基(his标签)、天冬氨酸残基(asp标签)、抗生蛋白链菌素标签、flag标签、sumo标签、gst标签或mbp标签,或通过添加促进其从其中多肽并不天然地含有此类序列的细胞分泌的信号序列,来对本文所描述的任一种蛋白质(如本发明的突变单体和孔进行修饰)以辅助其鉴定或纯化。引入基因标签的替代性方案是将标签化学反应到蛋白质上的原生或经工程改造的位置上。此的实例将为将凝胶移动试剂与蛋白质外上经工程改造的半胱氨酸反应。这已证实为一种用于分离溶血素异源寡聚物的方法(《生物化学(chembiol)》.1997年7月;4(7):497-505)。

本文所描述的任一个蛋白质,如本发明的突变单体和孔,可用显露标记来标记。显露标记可以是使蛋白质被检测到的任何合适标记。合适标记包括(但不限于)荧光分子;放射性同位素,例如125i、35s;酶;抗体;抗原;聚核苷酸;和配体,如生物素。

本文所描述的任一个蛋白质,如本发明的单体或孔,可以合成方式或通过重组手段来制备。举例来说,可通过活体外翻译和转录(ivtt)来合成蛋白质。蛋白质的氨基酸序列可进行修饰以包括非天然存在的氨基酸或增加蛋白质的稳定性。当通过合成手段来生产蛋白质时,可在生产期间引入此类氨基酸。还可根据合成或重组生产来改变蛋白质。

还可使用d-氨基酸来生产蛋白质。举例来说,蛋白质可包含l-氨基酸与d-氨基酸的混合物。这在用于产生此类蛋白质或肽的所属领域中是常规的。

蛋白质还可含有其它非特异性修饰,只要其不干扰蛋白质的功能即可。在本领域中已知多种非特异性侧链修饰,且可对蛋白质的侧链进行所述多种非特异性侧链修饰。此类修饰包括例如,通过与醛反应,随后用nabh4、用甲基乙酰亚氨酸脒化或用乙酸酐酰化来对氨基酸还原烷化。

可使用本领域中已知的标准方法来生产本文所描述的任一个蛋白质,包括本发明的单体和孔。可使用所属领域中的标准方法来推导编码蛋白质的聚核苷酸序列且进行复制。可使用所属领域中的标准技术在细菌宿主细胞中表达编码蛋白质的聚核苷酸序列。可通过从重组表达载体原位表达多肽来在细胞中产生蛋白质。表达载体任选地携带诱导性启动子以控制多肽的表达。这些方法描述于sambrook,j.和russell,d.(2001).《分子克隆实验指南(molecularcloning:alaboratorymanual)》第3版.纽约冷泉港的冷泉港实验室出版社(coldspringharborlaboratorypress)中。

可在从蛋白质产生生物体通过任何蛋白质液相色谱系统纯化之后或在重组表达之后,大规模生产蛋白质。典型的蛋白质液相色谱系统包括fplc、akta系统、bio-cad系统、bio-rad生物系统和gilsonhplc系统。

构筑体

本发明还提供一种构筑体,其包含两个或更多个共价连接的csgg单体,其中所述单体中的至少一个是本发明的突变单体。本发明的构筑体保持其形成孔的能力。可如上文所论述来测定此。本发明的一或多个构筑体可用于形成用于表征(如测序)聚核苷酸的孔。构筑体可包含至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9或至少10个单体。构筑体优选地包含两个单体。两个或更多个单体可相同或不同。

构筑体中的至少一个单体是本发明的突变单体。构筑体中的2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个、或10个或更多个单体可为本发明的突变单体。构筑体中的所有单体优选地是本发明的突变单体。突变单体可相同或不同。在一优选实施例中,构筑体包含两个本发明的突变单体。

构筑体中的本发明的突变单体的长度优选地大致相同,或相同。构筑体中的本发明的突变的折叠桶的长度优选地大致相同,或相同。长度可以氨基酸数量和/或长度单位的形式测量。

构筑体可包含不是本发明的突变单体的一或多个单体。不是本发明的突变单体的csgg突变单体包括:单体,其包含seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41;或以下的比较变异体:seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41,其中以上所论述的氨基酸/位置无一个突变。构筑体中的至少一个单体可包含:seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41,或以下中所示序列的比较变异体:seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41。基于氨基酸同源性,seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41的比较变异体,在其整个序列内,与seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41至少50%同源。更优选地,基于氨基酸同源性,比较变异体可在整个序列上与seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41的氨基酸序列,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。

优选地将构筑体中的单体进行基因融合。如果从单一聚核苷酸序列表达完全构筑体,那么单体是基因融合的。可以任何方式来组合单体中的编码序列,以形成编码构筑体的单一聚核苷酸序列。

可以任何构形来将单体基因融合。可通过单体的末端氨基酸来融合单体。举例来说,可将一个单体所述氨基端与另一单体的羧基端融合。构筑体中的第二和随后单体(在氨基到羧基方向上)可在其氨基端端包含甲硫氨酸(其中的每一个与前一个单体的羧基端融合)。举例来说,如果m是单体(不具有氨基端甲硫氨酸),且mm是具有氨基端甲硫氨酸的单体,那么构筑体可包含序列m-mm、m-mm-mm或m-mm-mm-mm。这些蛋氨酸的存在通常由在于编码整个构筑体的聚核苷酸内的编码第二或随后单体的聚核苷酸的5′端处的起始密码子(即atg)的表达造成。构筑体中的第一单体(在氨基到羧基方向上)还可包含甲硫氨酸(例如mm-mm、mm-mm-mm或mm-mm-mm-mm)。

可将两个或更多个单体直接基因融合在一起。优选地使用连接子来将单体进行基因融合。连接子可设计成限制单体的移动性。优选连接子是氨基酸序列(即肽连接子)。可使用上文所论述的任一个肽连接子。

在另一优选实施例中,将单体化学融合。如果例如通过化学交联剂将两部分化学连接,那么两个单体是化学融合的。可使用上文所论述的任一个化学交联剂。可将连接子连接于引入到本发明的突变单体中一或多个半胱氨酸残基。替代地,可将连接子连接于构筑体中的一个单体的末端。

如果构筑体含有不同单体,那么可通过保持连接子的浓度大量过度于单体来预防单体自身的交联。替代地,可在使用两个连接子的情况中使用“锁和钥”排列。各连接子仅一端可反应在一起,以形成较长连接子,且连接子的另一端各自与不同单体反应。此类连接子描述于国际申请第pct/gb10/000132号(公开为wo2010/086602)中。

聚核苷酸

本发明还提供聚核苷酸序列,其编码本发明的突变单体。突变单体可以是上文所论述的那些突变单体中的任一个。基于核苷酸一致性,聚核苷酸序列优选地包含在整个序列上与seqidno:1的序列至少50%、60%、70%、80%、90%或95%同源的序列。在300个或更多个,例如375、450、525或600或更多个连续核苷酸的延伸段上,可存在至少80%,例如至少85%、90%或95%核苷酸一致性(“硬同源性”)。可如上文所描述来计算同源性。基于基因密码的简并,聚核苷酸序列可包含不同于seqidno:1的序列。

本发明还提供聚核苷酸序列,其编码本发明的基因融合构筑体中的任一个。聚核苷酸优选地包含seqidno:1中所示序列的两个或更多个变异体。基于核苷酸一致性,聚核苷酸序列优选地包含在整个序列上与seqidno:1具有至少50%、60%、70%、80%、90%或95%同源性的两个或更多个序列。在600个或更多个,例如750、900、1050或1200或更多个连续核苷酸的延伸段上,可存在至少80%,例如至少85%、90%或95%核苷酸一致性(“硬同源性”)。可如上文所描述来计算同源性。

可使用所属领域中的标准方法来推导聚核苷酸序列且进行复制。可从生产孔的生物体(如大肠杆菌)提取编码野生型csgg的染色体dna。可使用涉及特异性引物的pcr来扩增编码孔亚基的基因。可接着对所扩增的序列进行定点诱变。定点诱变的合适方法在本领域中已知,且包括例如组合链反应。编码本发明的构筑体的聚核苷酸可使用熟知技术来制备,如在sambrook,j.和russell,d.(2001).《分子克隆实验指南》第3版,纽约冷泉港的冷泉港实验室出版社中所描述的那些技术。

可接着将所得聚核苷酸序列并入到重组可复制的载体(如克隆载体)中。载体可用于在相容的宿主细胞中复制聚核苷酸。因此,可通过将聚核苷酸引入到可复制的载体中,将所述载体引入到相容的宿主细胞中,和在产生载体复制的条件下使宿主细胞生长,来制备聚核苷酸序列。可从宿主细胞回收载体。用于克隆聚核苷酸的合适宿主细胞在本领域中已知,且在下文更详细地描述。

可将聚核苷酸序列克隆到合适表达载体中。在表达载体中,聚核苷酸序列通常可操作地连接于控制序列,所述控制序列能够通过宿主细胞实现编码序列的表达。此类表现载体可用于表达孔亚基。

术语“可操作地连接”是指所描述的组分处于允许其以其预期方式起作用的关系的并接。“可操作地连接”于编码序列的控制序列是以在与控制序列相容的条件下实现编码序列的表达的方式接合。可将相同或不同聚核苷酸序列的多个拷贝引入到载体中。

可接着将表达载体引入到合适宿主细胞中。因此,可通过将聚核苷酸序列插入到表达载体中、将载体引入到相容的细菌宿主细胞中和在产生聚核苷酸序列的表达的条件下使宿主细胞生长,来生产本发明的突变单体或构筑体。可将以重组方式表达的单体或构筑体自组装到宿主细胞膜中的孔中。替代地,以此方式生产的重组孔可从宿主细胞移除且插入到另一膜中。当生产包含至少两个不同单体或构筑体的孔时,不同单体或构筑体可分开地在如上文所描述的不同宿主细胞中表达,从宿主细胞移除且组装到独立膜(如兔细胞膜或合成膜)中的孔中。

载体可例如为质粒、病毒或噬菌体载体,其具备复制起点、任选地用于表达所述聚核苷酸序列的启动子和任选地启动子的调控子。载体可含有一或多个可选标记基因,例如四环素抗性基因。可选择启动子和其它表达调控信号,以与被设计成表达载体的宿主细胞相容。通常使用t7、trc、lac、ara或λl启动子。

宿主细胞通常以高水平表达单体或构筑体。将选择用聚核苷酸序列转化的宿主细胞,以与用于转化细胞的表达载体相容。宿主细胞通常是细菌并优选地大肠杆菌。具有λde3溶源,例如c41(de3)、bl21(de3)、jm109(de3)、b834(de3)、tuner、origami和origamib,的任何细胞可表达包含t7启动子的载体。除上文所列的条件以外,列举于以下中的任一个方法可用于表达csgg蛋白:cao等人,2014,《美国国家科学院院刊》,《九聚体细菌淀粉状蛋白分泌通道的结构(structureofthenonamericbacterialamyloidsecretionchannel)》,doi-1411942111;和goyal等人,2014,《自然》,516,250-253《对细菌淀粉状蛋白分泌通道csgg的结构性和机制见解(structuralandmechanisticinsightsintothebacterialamyloidsecretionchannelcsgg)》。

本发明还包含一种生产本发明的突变单体或本发明的构筑体的方法。方法包含在合适宿主细胞中表达本发明的聚核苷酸。聚核苷酸优选地是载体的一部分,且优选地可操作地连接于启动子。

本发明还提供各种孔。本发明的孔对于表征(如测序)聚核苷酸序列是理想的,这是因为其可以较高程度的敏感性在不同核苷酸之间进行鉴别。孔可出人意料地区别dna和rna中的四种核苷酸。本发明的孔可甚至区别甲基化和未甲基化的核苷酸。本发明的孔的基础分辨率出人意料地高。孔显示几乎完全分离所有四种dna核苷酸。基于孔中的停留时间和流过孔的电流,孔进一步在脱氧胞苷单磷酸酯(dcmp)与甲基-dcmp之间进行鉴别。

本发明的孔还可在一系列条件下在不同核苷酸之间进行鉴别。特定来说,孔将在有利于表征(如测序)核酸的条件下在核苷酸之间进行鉴别。本发明的孔可在不同核苷酸之间进行鉴别的程度可通过改变所施加的电势、盐浓度、缓冲液、温度和添加剂的存在(如脲、甜菜碱和dtt)来控制。这允许对孔的功能进行微调,尤其当测序时。这一点在下文更详细论述。本发明的孔还可用于根据与一或多个单体的相互作用而不是根据核苷酸紧接核苷酸,来鉴定聚核苷酸聚合物。

本发明的孔可为经分离,大体上经分离、纯化或大体上纯化的。如果本发明的孔完全不含任何其它组分(如脂质或其它孔),那么其是经分离或纯化的。如果孔是与将不干扰其既定用途的载体或稀释剂混合的,那么其是大体上经分离的。举例来说,如果孔是以包含小于10%、小于5%、小于2%或小于1%的其它组分(如三嵌段共聚物、脂质或其它孔)的形式存在,那么其大体上是经分离或大体上经纯化的。替代地,本发明的孔可存在于膜中。下文论述合适膜。

本发明的孔可呈个别或单一孔存在。替代地,本发明的孔可以同源孔群体或两种或更多种孔的异源群体存在。

同源寡聚孔

本发明还提供一种同源寡聚孔,其衍生自csgg,所述同源寡聚孔包含相同的本发明的突变单体。同源寡聚孔可包含本发明的突变中的任一个。本发明的同源寡聚孔对于表征(如测序)聚核苷酸是理想的。本发明的同源寡聚孔可具有上文所论述的任一个优势。

同源寡聚孔可含有任何数量的突变单体。孔通常包含至少7、至少8、至少9或至少10个相同突变单体,如7、8、9或10个突变单体。孔优选地包含八个或九个相同突变单体。一或多个,如2、3、4、5、6、7、8、9或10个突变单体优选地如上文所论述进行化学修饰。

用于制备孔的方法在下文更详细地论述。

异源寡聚孔

本发明还提供一种异源寡聚孔,其衍生自csgg,所述同源寡聚孔包含至少一个本发明的突变单体。本发明的异源寡聚孔对于表征(如测序)聚核苷酸是理想的。异源寡聚孔可使用本领域中已知的方法来制备(例如《蛋白质科学(proteinsci.)》2002年7月;11(7):1813-24)。

异源寡聚孔含有足够的单体来形成孔。单体可具有任何类型。孔通常包含至少7、至少8、至少9或至少10个单体,如7、8、9或10个单体。孔优选地包含八个或九个单体。

在一优选实施例中,所有单体(如10、9、8或7个单体)均是本发明的突变单体,且其中的至少一个不同于另外的突变单体。在一更优选实施例中,孔包含八个或九个本发明的突变单体,且其中的至少一个不同于另外的突变单体。其所有可彼此不同。

孔中的本发明的突变单体的长度优选地大致相同,或相同。孔中的本发明的突变的折叠桶的长度优选地大致相同,或相同。长度可以氨基酸数量和/或长度单位的形式测量。

在另一优选实施例中,突变单体中的至少一个不是本发明的突变单体。在这个实施例中,残余单体优选地是本发明的突变单体。因此,孔可包含9、8、7、6、5、4、3、2或1个本发明的突变单体。任何数量的孔中的单体可以不是本发明的突变单体。孔优选地包含七或八个本发明的突变单体,且一单体不是本发明的单体。本发明的突变单体可相同或不同。

构筑体中的本发明的突变单体的长度优选地大致相同,或相同。构筑体中的本发明的突变的折叠桶的长度优选地大致相同,或相同。长度可以氨基酸数量和/或长度单位的形式测量。

孔可包含不是本发明的突变单体的一或多个单体。不是本发明的突变单体的csgg单体包括:单体,其包含seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41;或以下的比较变异体:seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41,其中上文关于本发明所论述的氨基酸/位置无一个突变/取代。基于氨基酸同源性,seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41的比较变异体通常在其整个序列上与seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41至少50%同源。更优选地,基于氨基酸同源性,比较变异体可在整个序列上与seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41的氨基酸序列,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。

在所有上文所论述的实施例中,一或多个,如2、3、4、5、6、7、8、9或10个突变单体优选地如上文所论述进行化学修饰。

用于制备孔的方法在下文更详细地论述。

含构筑体的孔

本发明还提供一种孔,其包含至少一个本发明的构筑体。本发明的构筑体包含两个或更多个共价连接的衍生自csgg的单体,其中所述单体中的至少一个是本发明的突变单体。换句话说,构筑体必须含有超过一个单体。孔含有足够的构筑体和(视需要)单体,以形成孔。举例来说,八聚体孔可包含:(a)四个构筑体,其各自包含两个构筑体;(b)两个构筑体,其各自包含四个单体,或(b)一个构筑体,其包含两个单体和六个不形成构筑体的一部分的单体。举例来说,九聚体孔可包含:(a)四个构筑体,其各自包含两个构筑体和一个并不形成构筑体的一部分的单体;(b)两个构筑体,其各自包含四个单体和一并不形成构筑体的一部分的单体,或(b)一个构筑体,其包含两个单体和七个不形成构筑体的一部分的单体。构筑体和单体的其它组合可由所属领域的技术人员来设想。

孔中的至少两个单体是呈本发明的构筑体形式。构筑体和因此孔包含至少一个本发明的突变单体。孔通常总共包含至少7、至少8、至少9或至少10个单体,如7、8、9或10个单体(其中的至少两个必须呈构筑体形式)。孔优选地包含八个或九单体(其中的至少两个必须呈构筑体形式)。

含有构筑体的孔可为同源寡聚物(即包括相同的构筑体)或为异源寡聚物(即其中至少一个构筑体不同于另外的构筑体)。

孔通常含有:(a)一个构筑体,其包含两个单体;和(b)5、6、7或8个单体。构筑体可以是上文所论述的那些突变构筑体中的任一个。单体可以是上文所论述的那些单体中的任一个,包括:本发明的突变单体;单体,其包含seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41;和突变单体,其包含如上文所论述的seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41的比较变异体。

另一典型孔包含超过一个本发明的构筑体,如两个、三个或四个本发明的构筑体。视需要,此类孔进一步包含足够的额外单体或构筑体,来形成孔。额外单体可以是上文所论述的那些单体中的任一个,包括:本发明的突变单体;单体,其包含seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41;和突变单体,其包含如上文所论述的seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41的比较变异体。额外构筑体可以是上文所论述的那些构筑体中的任一个,或可为包含两个或更多个共价连接的csgg单体的构筑体,所述单体各自包含:单体,其包含seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41;或以下的比较变异体:如上文所论述的seqidno:2、3、4、5、6、7、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40或41。

本发明的其它孔仅包含含有2个单体的构筑体,例如孔可包含含有2个单体的4、5、6、7或8个构筑体。至少一个构筑体是本发明的构筑体,即至少一个构筑体中的至少一个单体,并优选地至少一个构筑体中的各单体是本发明的突变单体。包含2个单体的所有构筑体均可为本发明的构筑体。

根据本发明的特异性孔包含四个本发明的构筑体,其各自包含两个单体,其中各构筑体中的至少一个单体,并优选地各构筑体中的各单体是本发明的突变单体。构筑体可寡聚成孔,所述孔具有使得仅各构筑体的一个单体造成孔的通道的结构。通常,构筑体的其它单体将在孔的通道外部上。举例来说,本发明的孔可包含7、8、9或10个构筑体,所述构筑体包含2个单体,其中通道包含7、8、9或10个单体。

可将突变引入到如上文所描述的构筑体中。突变可为交替的,即突变对于两单体构筑体内的各单体是不同的,且构筑体组装为同源寡聚物,从而产生交替的修饰。换句话说,将包含muta和mutb的单体融合和组装,形成a-b:a-b:a-b:a-b孔。替代地,突变可为相邻的,即将相同突变引入到构筑体中的两个单体中,且这接着与不同突变单体或构筑体寡聚。换句话说,将包含muta的单体融合,随后与含mutb的单体寡聚反应,形成a-a:b:b:b:b:b:b。

含构筑体的孔中的本发明的单体中的一或多个可如上文所论述进行化学修饰。

分析物表征

本发明提供一种测定靶分析物是否存在或其一或多个特征的方法。方法涉及:使靶分析物与本发明的孔接触,使得靶分析物相对于(如通过)孔移动,和在分析物相对于孔移动时进行一或多个测量,且从而测定分析物是否存在或其一或多个特征。靶分析物还可被称为模板分析物或所关注的分析物。

步骤(a)和(b)优选地在孔两端施加电势的情况下进行。如下文更详细地论述,所施加的电势通常使得在孔与聚核苷酸结合蛋白之间形成复合体。所施加的电势可为电压电势。替代地,所施加的电势可为化学势。此的实例为在两亲层两端使用盐梯度。盐梯度公开于holden等人《美国化学学会杂志》2007年7月11日;129(27):8650-5中。

方法是用于测定靶分析物是否存在或其一或多个特征。方法可用于测定分析物是否存在或其一或多个特征。方法可涉及测定分析物是否存在或其一或多个特征。方法可包含测定任何数量的分析物是否存在或其一或多个特征,如2、5、10、15、20、30、40、50、100种或更多种分析物。可测定一或多种分析物的任何数量的特征,如1、2、3、4、5、10个或更多个特征。

靶分析物优选地是金属离子、无机盐、聚合物、氨基酸、肽、多肽、蛋白质、核苷酸、寡核苷酸、聚核苷酸、染料、漂白剂、药物、诊断剂、娱乐性药物、爆炸性或环境污染物。方法可涉及测定两种或更多种相同类型的分析物是否存在或其一或多个特征,如两种或更多种蛋白质、两种或更多种核苷酸或两种或更多种药物。替代地,方法可涉及测定两种或更多种不同类型的分析物是否存在或其一或多个特征,如一或多种蛋白质、一或多种核苷酸和一或多种药物。

可从细胞分泌靶分析物。替代地,靶分析物可为存在于细胞内部使得在可进行本发明之前必须从细胞提取分析物的分析物。

分析物优选地是氨基酸、肽、多肽和/或蛋白质。氨基酸、肽、多肽或蛋白质可为天然存在的或非天然存在的。多肽或蛋白质可包括在其合成或修饰氨基酸内。对于氨基酸的多种不同类型修饰在本领域中已知。合适氨基酸和其修饰如上文。出于本发明的目的,应理解,可通过所属领域中任何可用的方法来修饰靶分析物。

蛋白质可酶、抗体、激素、生长因子或生长调控蛋白,如细胞因子。细胞因子可选自:白介素,优选地ifn-1、il-1、il-2、il-4、il-5、il-6、il-10、il-12和il-13;干扰素,优选地il-γ;和其它细胞因子,如tnf-α。蛋白质可为细菌蛋白质、真菌蛋白质、病毒蛋白质或寄生虫来源的蛋白质。

靶分析物优选地是核苷酸、寡核苷酸或聚核苷酸。下文论述核苷酸和聚核苷酸。寡核苷酸是短核苷酸聚合物,其通常具有50个或更少个核苷酸,如40个或更少个、30个或更少个、20个或更少个、10个或更少个或5个或更少个核苷酸。寡核苷酸可包含下文论述的任一个核苷酸,包括无碱基和修饰核苷酸。

靶分析物,如靶聚核苷酸,可存在于下文论述中的任一个合适样本中。

孔通常存在于如下文所论述的膜中。可使用下文论述的方法,来将靶分析物偶联或递送到膜。

下文论述中的任一个测量可用于测定靶分析物是否存在或其一或多个特征。方法优选地包含:使靶分析物与本发明的孔接触,使得靶分析物相对于(如移动通过)孔移动,和在分析物相对于孔移动时测量穿过孔的电流,且从而测定分析物是否存在或其一或多个特征。

如果电流以对分析物具有特异性的方式流过孔(即如果检测到与分析物相关的流过孔的独特电流),那么靶分析物存在。如果电流并不以对核苷酸具有特异性的方式流过孔,那么分析物不存在。可在分析物存在下进行对照实验,以测定如果影响流过孔的电流的方式。

本发明可基于分析物对于穿过孔的电流具有不同效果,而用于区分具有类似结构的分析物。个别分析物可根据当其与孔相互作用时的其电流幅度来在单分子水平下进行鉴定。本发明还可用于测定样本中是否存在特定分析物。本发明还可用于测量样本中的特定分析物的浓度。使用除csgg以外的孔来进行分析物表征在本领域中已知。

聚核苷酸表征

本发明提供一种表征靶聚核苷酸,如测序聚核苷酸的方法。对于使用纳米孔表征或测序聚核苷酸存在两种主要策略,即链表征/测序和核酸外切酶表征/测序。本发明的方法可涉及任一个方法。

在链测序中,通过所施加的电势或抵抗所施加的电势,dna通过纳米孔易位。可在孔的顺侧上使用渐进地或逐渐地对双链dna起作用的核酸外切酶,以在所施加的电势下馈送残余单链,或在逆转电势下在反侧上。同样,使双链dna解旋的解螺旋酶也可以类似的方式使用。还可使用聚合酶。需要链抵抗施加的电势而易位的测序应用也有可能,但dna必须首先在逆转或无电势下由酶“捕获”。随着电势接着切换回后续结合,链应以顺式到反式的方式穿过孔,且通过电流保持为延长的构形。单链dna核酸外切酶或单链dna依赖性聚合酶可充当分子马达,所述分子马达抵抗施加的电势将最近易位的单链以逐步受控方式(反式到顺式)牵拉回反式通过孔。

在一个实施例中,表征靶聚核苷酸的方法涉及使靶序列与本发明的孔和解螺旋酶接触。方法中可以使用任何解螺旋酶。下文论述合适解螺旋酶。解螺旋酶可以相对于孔的两种模式来起作用。首先,优选地使用解螺旋酶进行方法,使得其在由所施加电压造成的场的情况下控制靶序列移动通过孔。在这种模式中,dna的5′端首先在孔中被捕获,且酶控制dna移动到孔中,使得靶序列在场的情况下通过孔,直到其最终易位通过到双层的反侧为止。替代地,优选地进行方法,使得解螺旋酶在抵抗由所施加电压造成的场的情况下控制靶序列移动通过孔。在这种模式中,dna的3′端首先在孔中被捕获,且酶控制dna移动到孔中,使得靶序列抵抗所施加场的情况下牵拉出孔,直到其最终推回到双层的顺侧为止。

在核酸外切酶测序中,核酸外切酶从靶聚核苷酸的一端释放个别核苷酸,且如下文所论述来鉴定这些个别核苷酸。在另一实施例中,表征靶聚核苷酸的方法涉及使靶序列与孔和核酸外切酶接触。可在方法中使用下文论述中的任一个核酸外切酶。酶可共价连接于孔,如下文所论述。

核酸外切酶是通常扣在聚核苷酸的一端且从那个末端一次一个核苷酸来消化序列的酶。核酸外切酶可在5′到3′方向或3′到5′方向上消化聚核苷酸。通常通过选择所使用的酶和/或使用本领域中已知的方法,来决定与核酸外切酶结合的聚核苷酸的末端。在聚核苷酸的任一末端处的羟基或帽结构可通常用于防止或促进核酸外切酶结合于聚核苷酸的特定末端。

方法涉及使聚核苷酸与核酸外切酶接触,使得如上文所论述,以允许表征或鉴定一定比例的核苷酸的速率从聚核苷酸的末端消化核苷酸。进行此的方法在所属领域中是众所周知的。举例来说,edman降解用于从多肽的末端连续地消化单一氨基酸,使得可使用高效液相色谱(hplc)来鉴定其。在本发明中可使用同源方法。

核酸外切酶起作用的速率通常比野生型核酸外切酶的最优速率慢。在本发明的方法中的核酸外切酶的活性的合适速率包括以下的消化速率:0.5到1000个核苷酸每秒、0.6到500个核苷酸每秒、0.7到200个核苷酸每秒、0.8到100个核苷酸每秒、0.9到50个核苷酸每秒或1到20或10个核苷酸每秒。速率优选地是1、10、100、500或1000个核苷酸每秒。核酸外切酶活性的合适速率可以不同方式来实现。举例来说,可根据本发明使用具有降低的最优活性速率的变异体核酸外切酶。

在链表征实施例中,方法包含:使聚核苷酸与本发明的孔接触,使得聚核苷酸相对于(如通过)孔移动,和在聚核苷酸相对于孔移动时进行一或多个测量,其中测量指示聚核苷酸的一或多个特征,且从而表征靶聚核苷酸。

在核酸外切酶表征实施例中,方法包含:使聚核苷酸与本发明的孔和核酸外切酶接触,使得核酸外切酶从靶聚核苷酸的一端消化个别核苷酸,和个别核苷酸相对于(如通过)孔移动,和在个别核苷酸相对于孔移动时进行一或多个测量,其中测量指示个别核苷酸的一或多个特征,且从而表征靶聚核苷酸。

个别核苷酸是单核苷酸。个别核苷酸是不通过核苷酸键结合于另一核苷酸或聚核苷酸的核苷酸。核苷酸键涉及结合于另一核苷酸的糖基团的核苷酸的一个磷酸基。个别核苷酸通常是通过核苷酸键结合于另一聚核苷酸的核苷酸,所述聚核苷酸具有至少5、至少10、至少20、至少50、至少100、至少200、至少500、至少1000或至少5000个核苷酸。举例来说,已从靶聚核苷酸序列(如dna或rna链)消化个别核苷酸。核苷酸可为下文论述的那些中的任一个。

个别核苷酸可以任何方式且在任何位点处与孔相互作用。核苷酸优选地通过如上文所论述的衔接子或结合衔接子而可逆地结合于孔。在核苷酸穿过跨膜的孔时,核苷酸最优选地通过衔接子或结合衔接子而可逆地结合于孔。在核苷酸穿过跨膜的孔时,核苷酸还可通过衔接子或结合衔接子而可逆地结合于孔的折叠桶或通道。

在个别核苷酸与孔之间的相互作用期间,核苷酸通常以对所述核苷酸具有特异性的方式影响流过孔的电流。举例来说,特定核苷酸将减少在特定平均时段流过孔的电流,且减少到特定程度。换句话说,对于特定核苷酸,流过孔的电流是独特的。可进行对照实验,以测定特定核苷酸对于流过孔的电流的影响。接着,可将在测试样本上进行本发明的方法的结果与来自此类对照实验的结果进行比较,以鉴定样本中的特定核苷酸或测定在样品中是否存在特定核苷酸。在所述频率下以指示特定核苷酸的方式影响流过孔的电流的频率,可用于测定样本中的所述核苷酸的浓度。还可计算样本内不同核苷酸的比率。举例来说,可计算dcmp与甲基-dcmp的比率。

方法涉及测量靶聚核苷酸的一或多个特征。靶聚核苷酸还可被称为模板聚核苷酸或所关注的聚核苷酸。

这个实施例也使用本发明的孔。可使用上文关于靶分析物所论述的孔和实施例中的任一个。

聚核苷酸

聚核苷酸(如核酸)是包含两个或更多个核苷酸的大分子。聚核苷酸或核酸可包含任何核苷酸的任何组合。核苷酸可以是天然存在的或人工的。聚核苷酸中的一或多个核苷酸可以是氧化或甲基化的。聚核苷酸中的一或多个核苷酸可以是受损的。举例来说,聚核苷酸可以包含嘧啶二聚体。此类二聚体通常与紫外光的损坏相关,且是皮肤黑色素瘤的主要病因。聚核苷酸中的一或多个核苷酸可例如用标记或标签修饰。合适标记在下文描述。聚核苷酸可包含一或多个间隔子。

核苷酸通常含有核碱基、糖和至少一个磷酸基。核碱基和糖形成核苷。

核碱基通常是杂环的。核碱基包括(但不限于)嘌呤和嘧啶,且更详细地说腺嘌呤(a)、鸟嘌呤(g)、胸腺嘧啶(t)、尿嘧啶(u)和胞嘧啶(c)。

糖通常是戊糖。核苷酸糖包括(但不限于)核糖和脱氧核糖。糖优选地是脱氧核糖。

聚核苷酸优选地包含以下核苷:脱氧腺苷(da)、脱氧尿苷(du)和/或胸苷(dt)、脱氧鸟苷(dg)和脱氧胞苷(dc)。

核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常含有单磷酸、二磷酸或三磷酸。核苷酸可包含超过三个磷酸,如4或5个磷酸。磷酸可连接在核苷酸的5′或3′侧上。核苷酸包括(但不限于):单磷酸腺苷(amp)、单磷酸鸟苷(gmp)、单磷酸胸苷(tmp)、单磷酸尿苷(ump)、单磷酸5-甲基胞啶、单磷酸5-羟基甲基胞苷、单磷酸胞嘧啶核苷(cmp)、环单磷酸腺苷(camp)、环单磷酸鸟苷(cgmp)、单磷酸脱氧腺苷(damp)、单磷酸脱氧鸟苷(dgmp)、单磷酸脱氧胸苷(dtmp)、单磷酸脱氧尿苷(dump)、单磷酸脱氧胞苷(dcmp)和单磷酸脱氧甲基胞苷。核苷酸优选地是选自amp、tmp、gmp、cmp、ump、damp、dtmp、dgmp、dcmp和dump。

核苷酸可以无碱基(即缺乏核碱基)。核苷酸还可缺乏核碱基和糖(即是c3间隔子)。

聚核苷酸中的核苷酸可以任何方式彼此连接。如在核酸中,核苷酸通常通过其糖和磷酸基连接。如在嘧啶二聚体中,核苷酸可通过其核碱基连接。

聚核苷酸可以是单链或双链。聚核苷酸优选地是单链。在实例中,单链聚核苷酸表征是被称作1d。聚核苷酸的至少部分可以是双链。

聚核苷酸可以是核酸,例如脱氧核糖核酸(dna)或核糖核酸(rna)。聚核苷酸可以包含与一条dna链杂交的一条rna链。聚核苷酸可以是所属领域中已知的任何合成核酸,如肽核酸(pna)、甘油核酸(gna)、苏糖核酸(tna)、锁核酸(lna)或具有核苷酸侧链的其它合成聚合物。pna主链由通过肽键连接的n-(2-氨基乙基)-甘氨酸重复单元构成。gna主链由通过磷酸二酯键连接的乙二醇重复单元构成。tna主链由通过磷酸二酯键连接在一起的重复苏糖构成。lna是由如上文所论述的具有将核糖部分中的2′氧和4′碳连接的额外桥的核糖核苷酸形成。桥接核酸(bna)是经修饰的rna核苷酸。其还可被称为受限或不可接近的rna。bna单体可含有五元、六元或甚至七元桥接结构,其具有“固定”的c3′-内糖褶皱。在核糖的2′,4′-位置处合成地并入桥,产生2′,4′-bna单体。

聚核苷酸最优选地是核糖核酸(rna)或脱氧核糖核酸(dna)。

聚核苷酸可以是任何长度的。举例来说,聚核苷酸的长度可以是至少10、至少50、至少100、至少150、至少200、至少250、至少300、至少400或至少500个核苷酸或核苷酸对。聚核苷酸的长度可以是1000个或更多个核苷酸或核苷酸对、5000个或更多个核苷酸或核苷酸对、或100000个或更多个核苷酸或核苷酸对。

可研充任何数量的聚核苷酸。举例来说,本发明的方法可涉及表征2、3、4、5、6、7、8、9、10、20、30、50、100或更多个聚核苷酸。如果表征两个或更多个聚核苷酸,那么其可以是不同的聚核苷酸或两个相同聚核苷酸的例子。

聚核苷酸可以是天然存在的或人工的。举例来说,方法可用于验证所制造寡核苷酸的序列。通常在活体外进行所述方法。

样本

聚核苷酸通常存在于任何合适样本中。通常在已知含有或疑似含有聚核苷酸的样本进行上本发明。替代地,可在确认聚核苷酸的一致性的样本上进行本发明,已知或预期所述聚核苷酸在样本中存在。

样本可以是生物样本。可使用从任何生物体或微生物获得或提取的样本在活体外进行本发明。生物体或微生物通常是古细菌、原核或真核微生物,且通常属于以下五界中的一个:植物界、动物界、真菌界、原核生物界和原生生物界。可在从任何病毒获得或提取的样本上在活体外进行本发明。样本优选地是流体样本。样本通常包含患者的体液。样本可以是尿液、淋巴液、唾液、粘液或羊膜液,但优选地是血液、血浆或血清。

通常,样本是人类来源的;但替代地其可以是来自另一哺乳动物,如来自商业养殖动物,如马、牛、绵羊、鱼、鸡或猪;或替代地可以是宠物,如猫或狗。替代地,样本可以是植物来源的,如从经济作物获得的样本,如谷物、豆科植物、果实或植物,例如小麦、大麦、燕麦、芥花、玉米、大豆、稻谷、大黄、香蕉、苹果、蕃茄、马铃薯、葡萄、烟草、菜豆、小扁豆、甘蔗、可可、棉花。

样本可以是非生物样本。非生物样本优选地是流体样本。非生物样本的实例包括手术液、水(如饮用水、海水或河水)和实验室测试用试剂。

通常在于本发明中使用之前处理样本,例如通过离心或通过穿过滤出不需要的分子或细胞(如红细胞)的膜。可紧接着在获取后进行测量。还可通常在分析之前存储样本,优选地低于-70℃。

表征

方法可涉及测量聚核苷酸的两个、三个、四个或五个或更多个特征。一或多个特征优选地是选自:(i)聚核苷酸的长度;(ii)聚核苷酸的一致性;(iii)聚核苷酸的序列;(iv)聚核苷酸的二级结构;和(v)聚核苷酸是否被修饰。可根据本发明来测量(i)到(v)的任何组合,如:{i}、{ii}、{iii}、{iv}、{v}、{i,ii}、{i,iii}、{i,iv}、{i,v}、{ii,iii}、{ii,iv}、{ii,v}、{iii,iv}、{iii,v}、{iv,v}、{i,ii,iii}、{i,ii,iv}、{i,ii,v}、{i,iii,iv}、{i,iii,v}、{i,iv,v}、{ii,iii,iv}、{ii,iii,v}、{ii,iv,v}、{iii,iv,v}、{i,ii,iii,iv}、{i,ii,iii,v}、{i,ii,iv,v}、{i,iii,iv,v}、{ii,iii,iv,v}或{i,ii,iii,iv,v}。可对于与第二聚核苷酸进行比较的第一聚核苷酸,测量(i)到(v)的不同组合,包括上文所列的那些组合中的任一个。

对于(i),可例如通过测定聚核苷酸与孔之间的相互作用的数量或聚核苷酸与孔之间的相互作用的持续时间,来测量聚核苷酸的长度。

对于(ii),可以多种方式来测量聚核苷酸的一致性。可结合测量聚核苷酸的序列或不测量聚核苷酸的序列,来测量聚核苷酸的一致性。前者是直接了当的;测序聚核苷酸且从而进行鉴定。可以若干方式来进行后者。举例来说,可测量聚核苷酸中的特定基序的存在(而不测量聚核苷酸的残余序列)。替代地,方法中的特定电子和/或光学信号的测量可鉴定来自特定来源的聚核苷酸。

对于(iii),可如先前所描述来测定聚核苷酸的序列。合适测序方法,尤其使用电测量的那些测序方法,描述于以下中:stoddartd等人,《美国国家科学院院刊》,12;106(19):7702-7,liebermankr等人,《美国化学学会杂志》2010;132(50):17961-72,和国际申请wo2000/28312。

对于(iv),可以多种方式来测量二级结构。举例来说,如果方法涉及电测量,那么可使用停留时间的变化或流过孔的电流的变化来测量二级结构。这允许区分单链和双链聚核苷酸的区。

对于(v),可测量是否存在任何修饰。方法优选地包含,用一或多个蛋白质或用一或多个标记、标签或间隔子,测定聚核苷酸是否通过甲基化、通过氧化、通过损坏来修饰。特异性修饰将引起与可使用以下所描述的方法测量的孔的特异性相互作用。举例来说,可基于在孔与各核苷酸相互作用期间流过孔的电流,将甲基胞嘧啶与胞嘧啶区别开。

使靶聚核苷酸与本发明的孔接触。孔通常存在于膜中。下文论述合适膜。可使用适合于研究膜/孔系统的任何设备来进行方法,其中孔存在于膜中。可使用适合于跨膜孔感测的任何设备来进行方法。举例来说,设备包含含有水溶液的腔室和将腔室分隔为两个部分的屏障。屏障通常具有开孔,在开孔中形成含有孔的膜。替代地,屏障形成其中存在孔的膜。

可使用描述于国际申请第pct/gb08/000562号(wo2008/102120)中的设备来进行方法。

可进行各种不同类型的测量。这包括(但不限于)电测量和光学测量。可能电测量包括:电流测量、阻抗测量、隧道测量(ivanovap等人,《纳米快报(nanolett.)》2011年1月12日;11(1):279-85)和fet测量(国际申请wo2005/124888)。可将光学测量与电测量组合(sonigv等人,《科学仪器综述(revsciinstrum.)》2010年1月;81(1):014301)。测量可以是跨膜电流测量,如流过孔的离子电流的测量。

可使用标准单通道记录装置来进行电测量,如stoddartd等人,《美国国家科学院院刊》,12;106(19):7702-7,liebermankr等人,《美国化学学会杂志》2010;132(50):17961-72,和国际申请wo2000/28312中所描述。替代地,可使用多通道系统来进行电测量,例如如国际申请wo2009/077734和国际申请wo2011/067559中所描述。

优选地通过在膜两端施加的电势来进行所述方法。所施加的电势可为电压电势。替代地,所施加的电势可为化学势。此的实例是在膜(如两亲层)两端使用盐梯度。盐梯度公开于holden等人《美国化学学会杂志》2007年7月11日;129(27):8650-5中。在一些例子中,在聚核苷酸相对于孔移动时穿过孔的电流用于评估或测定聚核苷酸的序列。这是链测序。

方法可涉及在聚核苷酸相对于孔移动时测量穿过孔的电流。因此,在方法中使用的设备还可包含能够施加电势和测量膜和孔两端的电信号的电路。可使用贴片钳或电压钳来进行方法。方法优选地涉及使用电压钳。

本发明的方法可涉及在聚核苷酸相对于孔移动时测量穿过孔的电流。用于测量通过跨膜蛋白孔的离子电流的合适条件是所属领域中已知的,且公开于实例中。通常通过在膜和孔两端施加的电压来进行所述方法。所用电压通常是+5v到-5v,如+4v到-4v、+3v到-3v,或+2v到-2v。所用电压通常是-600mv到+600mv或-400mv到+400mv。所用电压优选地在具有下限和上限的范围内,下限选自:-400mv、-300mv、-200mv、-150mv、-100mv、-50mv、-20mv和0mv,上限独立地选自:+10mv、+20mv、+50mv、+100mv、+150mv、+200mv、+300mv和+400mv。所用电压更优选地在100mv到240mv的范围内,并且最优选在120mv到220mv的范围内。有可能通过使用增大的所施加电势来增大通过孔对不同核苷酸之间的鉴别。

通常在存在任何电荷载流子的情况下进行方法,电荷载流子如金属盐,例如碱金属盐、卤盐,例如氯化物盐,例如碱金属氯化物盐。电荷载体可以包括离子液体或有机盐,例如四甲基氯化铵、三甲基苯基氯化铵、苯基三甲基氯化铵,或1-乙基-3-甲基氯化咪唑。在下文论述的示范性设备中,盐在腔室中的水溶液中存在。通常使用氯化钾(kcl)、氯化钠(nacl)、氯化铯(cscl),或亚铁氰化钾和铁氰化钾的混合物。优选kcl、nacl,以及亚铁氰化钾和铁氰化钾的混合物。电荷载流子可以是跨膜不对称的。举例来说,电荷载流子的类型和/或浓度可在膜的各侧上不同。

盐浓度可以是饱和的。盐浓度可以是3m或更低,且通常0.1到2.5m、0.3到1.9m、0.5到1.8m、0.7到1.7m、0.9到1.6m或1m到1.4m。盐浓度优选地是150mm到1m。优选地使用至少0.3m的盐浓度来进行方法,如至少0.4m、至少0.5m、至少0.6m、至少0.8m、至少1.0m、至少1.5m、至少2.0m、至少2.5m或至少3.0m。高盐浓度提供高信噪比且允许在正常电流波动的背景下鉴定指示核苷酸存在的电流。

通常在缓冲液存在下进行方法。在下文论述的示范性设备中,缓冲液在腔室中的水溶液中存在。在本发明的方法中可使用任何缓冲液。通常,缓冲液是磷酸盐缓冲液。其它合适的缓冲液是hepes和tris-hcl缓冲液。通常在以下的ph下来进行方法:4.0到12.0、4.5到10.0、5.0到9.0、5.5到8.8、6.0到8.7或7.0到8.8或7.5到8.5。所用ph优选地是约7.5。

可在以下温度下来进行方法:0℃到100℃、15℃到95℃、16℃到90℃、17℃到85℃、18℃到80℃、19℃到70℃或20℃到60℃。通常在室温下进行方法。任选地在支持酶功能的温度(如约37℃)下进行方法。

聚核苷酸结合蛋白

链表征方法优选地包含使聚核苷酸与聚核苷酸结合蛋白接触,使得蛋白质控制聚核苷酸相对于(如通过)孔的移动。

更优选地,方法包含:(a)使聚核苷酸与本发明的孔和聚核苷酸结合蛋白接触,使得蛋白质控制聚核苷酸相对于(如通过)孔的移动;和(b)在聚核苷酸相对于孔移动时进行一或多个测量,其中测量指示聚核苷酸的一或多个特征,且从而表征聚核苷酸。

更优选地,方法包含:(a)使聚核苷酸与本发明的孔和聚核苷酸结合蛋白接触,使得蛋白质控制聚核苷酸相对于(如通过)孔的移动;和(b)在聚核苷酸相对于孔移动时测量通过孔的电流,其中电流指示聚核苷酸的一或多个特征,且从而表征聚核苷酸。

聚核苷酸结合蛋白可以是能够结合于聚核苷酸且控制其移动通过孔的任何蛋白质。在所属领域中测定蛋白质是否结合于聚核苷酸是直接了当的。蛋白质通常与聚核苷酸相互作用,且修改其的至少一个特性。蛋白质可通过裂解聚核苷酸形成个别核苷酸或较短核苷酸链(如二或三核苷酸)来修改聚核苷酸。蛋白质可通过将聚核苷酸定位或移动到特异性位置(即控制其移动)来修改聚核苷酸。

聚核苷酸结合蛋白优选地衍生自聚核苷酸操作酶。聚核苷酸操作酶是能够与聚核苷酸相互作用且修改其的至少一个特性的多肽。酶可通过裂解聚核苷酸形成个别核苷酸或较短核苷酸链(如二或三核苷酸)来修改聚核苷酸。酶可通过将聚核苷酸定位或移动到特异性位置来修改聚核苷酸。聚核苷酸操作酶并不需要显示酶促活性,只要其能够结合聚核苷酸且控制其移动通过孔即可。举例来说,酶可进行修饰以移除其酶促活性,或可在防止其充当酶的条件下使用。在下文更详细地论述此类条件。

聚核苷酸操作酶优选地衍生自核分解酶。酶的构筑体中所用的聚核苷酸操作酶更优选地是衍生自以下酶分类(ec)组中的任一个的成员:3.1.11、3.1.13、3.1.14、3.1.15、3.1.16、3.1.21、3.1.22、3.1.25、3.1.26、3.1.27、3.1.30和3.1.31。酶可以是在国际申请第pct/gb10/000133号(公开为wo2010/086603)中所公开任一种酶。

优选酶是聚合酶、核酸外切酶、解螺旋酶和拓扑异构酶,如回旋酶。合适酶包括(但不限于)来自大肠杆菌的核酸外切酶i(seqidno:11)、来自大肠杆菌的核酸外切酶iii(seqidno:13)、来自极端嗜热菌的recj(seqidno:15)和噬菌体λ核酸外切酶(seqidno:17)、tatd核酸外切酶和其变异体。包含seqidno:15中所示序列的三个亚基或其变异体相互作用,形成三聚体核酸外切酶。这些核酸外切酶还可用于本发明的核酸外切酶方法中。聚合酶可以是3173dna聚合酶(其可购自公司)、sd聚合酶(可购自)或其变异体。酶优选地是phi29dna聚合酶(seqidno:9)或其变异体。拓扑异构酶优选地是酶分类(ec)组5.99.1.2和5.99.1.3中的任一个的成员。

酶最优选地是衍生自解螺旋酶,如hel308mbu(seqidno:18)、he1308csy(seqidno:19)、hel308tga(seqidno:20)、hel308mhu(seqidno:21)、traieco(seqidno:22)、xpdmbu(seqidno:23)或其变异体。可在本发明中使用任何解螺旋酶。解螺旋酶可以是或衍生自hel308解螺旋酶、recd解螺旋酶(如tral解螺旋酶或trwc解螺旋酶)、xpd解螺旋酶或dda解螺旋酶。解螺旋酶可以是在中以下国际申请中所公开的任何解螺旋酶、修饰解螺旋酶或解螺旋酶构筑体:第pct/gb2012/052579号(公开为wo2013/057495)、第pct/gb2012/053274号(公开为wo2013/098562)、第pct/gb2012/053273号(公开为wo2013098561)、第pct/gb2013/051925号(公开为wo2014/013260)、第pct/gb2013/051924号(公开为wo2014/013259)、第pct/gb2013/051928号(公开为wo2014/013262)和第pct/gb2014/052736号。

解螺旋酶优选地包含seqidno:25中所示的序列(trwccba)或其变异体、seqidno:18中所示的序列(hel308mbu)或其变异体,或seqidno:24中所示的序列(dda)或其变异体。变异体可以下文关于跨膜孔所论述中的任一个方式来不同于原生序列。seqidno:24的优选变异体包含:(a)e94c和a360c;或(b)e94c、a360c、c109a和c136a且接着任选地(δm1)g1g2(即缺失m1且接着添加g1和g2)。

根据本发明可以使用任何数量的解螺旋酶。举例来说,可使用1、2、3、4、5、6、7、8、9、10个或更多个解螺旋酶。在一些实施例中,可使用不同数量的解螺旋酶。

本发明的方法优选地包含使聚核苷酸与两个或更多个解螺旋酶接触。两个或更多个解螺旋酶通常是相同的解螺旋酶。两个或更多个解螺旋酶可以是不同的解螺旋酶。

两个或更多个解螺旋酶可以是上文提到的解螺旋酶的任何组合。两个或更多个解螺旋酶可以是两个或更多个dda解螺旋酶。两个或更多个解螺旋酶可以是一或多个dda解螺旋酶和一或多个trwc解螺旋酶。两个或更多个解螺旋酶可以是相同解螺旋酶的不同变异体。

两个或更多个解螺旋酶优选地彼此连接。两个或更多个解螺旋酶更优选地彼此共价连接。解螺旋酶可以按任何次序和使用任何方法来连接。用于本发明中的优选解螺旋酶构筑体描述于以下国际申请中:第pct/gb2013/051925号(公开为wo2014/013260)、第pct/gb2013/051924号(公开为wo2014/013259)、第pct/gb2013/051928号(公开为wo2014/013262)和第pct/gb2014/052736号。

seqidno:9、11、13、15、17、18、19、20、21、22、23、24或25的变异体是氨基酸序列不同于seqidno:9、11、13、15、17、18、19、20、21、22、23、24或25且其保持聚核苷酸结合能力的酶。这可使用所属领域中已知的任何方法来测量。举例来说,可使变异体与聚核苷酸接触,且可测量其结合于聚核苷酸和沿所述聚核苷酸移动的能力。变异体可包括便于聚核苷酸结合和/或便于其在高盐浓度和/或室温下活性的修饰。变异体可进行修饰,使得其结合聚核苷酸(即保持聚核苷酸结合能力)但不充当解螺旋酶(即当具备所有便于移动的必需组分(例如atp和mg2+)时不沿聚核苷酸移动)。此类修饰是所属领域中已知的。举例来说,解螺旋酶中的mg2+结合域的修饰通常产生不充当解螺旋酶的变异体。这些变异体类型可充当分子制动器(参见下文)。

基于氨基酸同源性,在seqidno:9、11、13、15、17、18、19、20、21、22、23、24或25的氨基酸序列的整个长度上,变异体将优选地与所述序列至少50%同源。更优选地,基于氨基酸同源性,变异体多肽可在整个序列上与seqidno:9、11、13、15、17、18、19、20、21、22、23、24或25的氨基酸序列,至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选地至少95%、97%或99%同源。在200个或更多个,例如230、250、270、280、300、400、500、600、700、800、900或1000个或更多个邻接氨基酸的延伸段上,可存在至少80%,例如至少85%、90%或95%氨基酸同源性(“硬同源性”)。如上文所描述来测定同源性。变异体可以上文关于以上seqidno:2所论述中的任一个方式来不同于野生型序列。酶可共价连接于孔。任何方法可用于将酶共价连接于孔。

优选分子制动器是trwccba-q594a(具有突变q594a的seqidno:25)。变异体并不充当解螺旋酶(即当具备所有便于移动的必需组分(例如atp和mg2+)时,结合聚核苷酸但并不沿其移动)。

在链测序中,通过所施加的电势或抵抗所施加的电势,聚核苷酸通过纳米孔易位。可在孔的顺侧上使用渐进地或逐渐地对双链聚核苷酸起作用的核酸外切酶,以在所施加的电势下馈送残余单链,或在逆转电势下在反侧上。同样,使双链dna解旋的解螺旋酶也可以类似的方式使用。还可使用聚合酶。需要链抵抗施加的电势而易位的测序应用也有可能,但dna必须首先在逆转或无电势下由酶“捕获”。随着电势接着切换回后续结合,链应以顺式到反式的方式穿过孔,且通过电流保持为延长的构形。单链dna核酸外切酶或单链dna依赖性聚合酶可充当分子马达,所述分子马达抵抗施加的电势将最近易位的单链以逐步受控方式(反式到顺式)牵拉回反式通过孔。

方法中可以使用任何解螺旋酶。解螺旋酶可以相对于孔的两种模式来起作用。首先,优选地使用解螺旋酶来进行方法,使得在由所施加电压造成的场的情况下,解螺旋酶使聚核苷酸通过孔移动。在这种模式中,聚核苷酸的5′端首先在孔中被捕获,且解螺旋酶使聚核苷酸移动到孔中,使得其在场的情况下通过孔,直到其最终易位通过到膜的反侧为止。替代地,优选地进行方法,使得抵抗由所施加电压造成的场的情况下,解螺旋酶使聚核苷酸移动通过孔。在这种模式中,聚核苷酸的3′端首先在孔中被捕获,且解螺旋酶使聚核苷酸移动到孔中,使得其抵抗所施加场的情况下牵拉出孔,直到其最终推回到膜的顺侧为止。

还可在相反的方向上进行方法。聚核苷酸的3′端可首先在孔中被捕获,且解螺旋酶可使聚核苷酸移动到孔中,使得其在场的情况下通过孔,直到其最终易位通过到膜的反侧为止。

当解螺旋酶不具备便于移动的必需组分,或进行修饰以阻止或防止其移动时,当其通过所施加的场牵拉到孔中时,其可结合于聚核苷酸,且充当减缓聚核苷酸移动的制动器。在非活动模式中,是3′还是5′向下捕获聚核苷酸是不重要的,是所施加的场,通过充当制动器的酶,朝向反式侧而将聚核苷酸牵拉到孔中。当在非活动模式中时,通过解螺旋酶对聚核苷酸的移动控制可以多种方式(包括棘轮、滑动和制动)描述。还可以这种方式来使用缺乏解螺旋酶活性的解螺旋酶变异体。

可按任何次序使聚核苷酸与聚核苷酸结合蛋白和孔接触。优选的是,当使聚核苷酸与聚核苷酸结合蛋白(如解螺旋酶)和孔接触时,聚核苷酸首先与蛋白质形成复合体。当在孔两端施加电压时,接着聚核苷酸/蛋白质复合体与孔形成复合体,且控制聚核苷酸通过孔的移动。

通常在游离核苷酸或游离核苷酸类似物和有助于聚核苷酸结合蛋白作用的酶辅因子存在下,进行方法中使用聚核苷酸结合蛋白的任何步骤。游离核苷酸可以是上文所论述的任一个个别核苷酸中的一或多个。游离核苷酸包括(但不限于):单磷酸腺苷(amp)、二磷酸腺苷(adp)、三磷酸腺苷(atp)、单磷酸鸟苷(gmp)、二磷酸鸟苷(gdp)、三磷酸鸟苷(gtp)、单磷酸胸苷(tmp)、二磷酸胸苷(tdp)、三磷酸胸苷(ttp)、单磷酸尿苷(ump)、二磷酸尿苷(udp)、三磷酸尿苷(utp)、单磷酸胞苷(cmp)、二磷酸胞苷(cdp)、三磷酸胞苷(ctp)、环单磷酸腺苷(camp)、环单磷酸鸟苷(cgmp)、单磷酸脱氧腺苷(damp)、二磷酸脱氧腺苷(dadp)、三磷酸脱氧腺苷(datp)、单磷酸脱氧鸟苷(dgmp)、二磷酸脱氧鸟苷(dgdp)、三磷酸脱氧鸟苷(dgtp)、单磷酸脱氧胸苷(dtmp)、二磷酸脱氧胸苷(dtdp)、三磷酸脱氧胸苷(dttp)、单磷酸脱氧尿苷(dump)、二磷酸脱氧尿苷(dudp)、三磷酸脱氧尿苷(dutp)、单磷酸脱氧胞苷(dcmp)、二磷酸脱氧胞苷(dcdp)和三磷酸脱氧胞苷(dctp)。游离核苷酸优选地是选自amp、tmp、gmp、cmp、ump、damp、dtmp、dgmp或dcmp。游离核苷酸优选地是三磷酸腺苷(atp)。酶辅因子是一种允许构筑体起作用的因子。酶辅因子优选地是二价金属阳离子。二价金属阳离子优选地是mg2+、mn2+、ca2+或co2+。酶辅因子最优选地是mg2+

解螺旋酶和分子制动器

在一优选实施例中,方法包含:

(a)提供聚核苷酸与一或多个解螺旋酶以及连接于聚核苷酸的一或多个分子制动器;

(b)使聚核苷酸与本发明的孔接触,且在孔两端施加电势,使得一或多个解螺旋酶和一或多个分子制动器带到一起,且均控制聚核苷酸相对于(如通过)孔的移动;

(c)在所述聚核苷酸相对于所述孔移动时,进行一或多个测量,其中测量指示聚核苷酸的一或多个特征,且从而表征聚核苷酸。

这个方法类型在国际申请pct/gb2014/052737中详细论述

一或多个解螺旋酶可以是上文所论述的那些解螺旋酶中的任一个。一或多个分子制动器可以是结合于聚核苷酸且减缓聚核苷酸通过孔的移动的任何化合物或分子。一或多个分子制动器优选地包含结合于聚核苷酸的一或多个化合物。一或多个化合物优选地是一或多个巨环化合物。合适巨环化合物包括(但不限于)环糊精、杯芳烃、环肽、冠醚、葫芦脲、柱状芳烃、其衍生物或其组合。环糊精或其衍生物可以是在eliseev,a.v.和schneider,h-j.(1994)《美国化学学会杂志》116,6081-6088中所公开那些化合物中的任一个。药剂更优选地是七-6-氨基-β-环糊精(am7-βcd)、6-单脱氧-6-单氨基-β-环糊精(am1-cd)或七-(6-脱氧-6-胍基)-环糊精(gu7-βcd)。

一或多个分子制动器优选地是一或多个单链结合蛋白(ssb)。一或多个分子制动器更优选地是:单链结合蛋白(ssb),其包含并不具有净负电荷的羧基端(c端)区;或(ii)经修饰ssb,其包含在其c端区中减少c端区的净负电荷的一或多个修饰。一或多个分子制动器最优选地是国际申请第pct/gb2013/051924号(公开为wo2014/013259)中所公开的ssb中的一个。

一或多个分子制动器优选地是一或多个聚核苷酸结合蛋白。聚核苷酸结合蛋白可以是能够结合于聚核苷酸且控制其移动通过孔的任何蛋白质。在所属领域中测定蛋白质是否结合于聚核苷酸是直接了当的。蛋白质通常与聚核苷酸相互作用,且修改其的至少一个特性。蛋白质可通过裂解聚核苷酸形成个别核苷酸或较短核苷酸链(如二或三核苷酸)来修改聚核苷酸。所述部分可通过将聚核苷酸定位或移动到特异性位置(即控制其移动)来修改聚核苷酸。

聚核苷酸结合蛋白优选地衍生自聚核苷酸操作酶。一或多个分子制动器可衍生自上文所论述的聚核苷酸操作酶中的任一个。phi29聚合酶(seqidno:8)的充当分子制动器的经修饰型式公开于美国专利第5,576,204号中。一或多个分子制动器优选地是衍生自解螺旋酶。

可使用任何数量的衍生自解螺旋酶的分子制动器。举例来说,1、2、3、4、5、6、7、8、9、10个或更多个解螺旋酶可用作分子制动器。如果两个或更多个解螺旋酶用作分子制动器,那么所述两个或更多个解螺旋酶通常是相同的解螺旋酶。两个或更多个解螺旋酶可以是不同的解螺旋酶。

两个或更多个解螺旋酶可以是上文提到的解螺旋酶的任何组合。两个或更多个解螺旋酶可以是两个或更多个dda解螺旋酶。两个或更多个解螺旋酶可以是一或多个dda解螺旋酶和一或多个trwc解螺旋酶。两个或更多个解螺旋酶可以是相同解螺旋酶的不同变异体。

两个或更多个解螺旋酶优选地彼此连接。两个或更多个解螺旋酶更优选地彼此共价连接。解螺旋酶可以按任何次序和使用任何方法来连接。衍生自解螺旋酶的一或多个分子制动器优选地进行修饰,以降低聚核苷酸结合域中的开口的大小,通过所述开口,在至少一个构形状态中,聚核苷酸可与解螺旋酶解结合。这公开于wo2014/013260中。

用于本发明中的优选解螺旋酶构筑体描述于以下国际申请中:第pct/gb2013/051925号(公开为wo2014/013260)、第pct/gb2013/051924号(公开为wo2014/013259)、第pct/gb2013/051928号(公开为wo2014/013262)和第pct/gb2014/052736号。

如果以主动模式使用一或多个解螺旋酶(即当一或多个解螺旋酶具备便于移动的所有必需组分(例如atp和mg2+)时),那么一或多个分子制动器优选地是:(a)以非活动模式使用(即在不存在便于移动的必需组分下使用,或不能主动移动),(b)以主动模式使用,其中一或多个分子制动器在与一或多个解螺旋酶相反的方向上移动,或(c)以主动模式使用,其中一或多个分子制动器在与一或多个解螺旋酶相同的方向上移动,且比一或多个解螺旋酶更缓慢。

如果以非活动模式使用一或多个解螺旋酶(即当一或多个解螺旋酶不具备便于移动的所有必需组分(例如atp和mg2+)时,或不能主动移动),那么一或多个分子制动器优选地是:(a)以非活动模式使用(即在不存在便于移动的必需组分下使用,或不能主动移动),或(b)以主动模式使用,其中一或多个分子制动器在与聚核苷酸相同的方向上沿聚核苷酸移动通过孔。

一或多个解螺旋酶和一或多个分子制动器可在任何位置处连接于聚核苷酸,使得其带到一起且均控制聚核苷酸通过孔的移动。一或多个解螺旋酶和一或多个分子制动器相隔至少一个核苷酸,如相隔至少5、至少10、至少50、至少100、至少500、至少1000、至少5000、至少10,000、至少50,000个核苷酸或更多。如果方法涉及表征在一端具备y衔接子且在另一端具备发夹环衔接子的双链聚核苷酸,那么一或多个解螺旋酶优选地连接于y衔接子,且一或多个分子制动器优选地连接于发夹环衔接子。在这个实施例中,一或多个分子制动器优选地是进行修饰使得其结合聚核苷酸但不充当解螺旋酶的一或多个解螺旋酶。连接于y衔接子的一或多个解螺旋酶优选地在间隔子处停止,如下文更详细地论述。连接于发夹环衔接子的一或多个分子制动器优选地不在间隔子处停止。当一或多个解螺旋酶达到发夹环时,一或多个解螺旋酶和一或多个分子制动器优选地带到一起。在y衔接子连接于聚核苷酸之前或在y衔接子连接于聚核苷酸之后,一或多个解螺旋酶可连接于y衔接子。在发夹环衔接子连接于聚核苷酸之前或在发夹环衔接子连接于聚核苷酸之后,一或多个分子制动器可连接于发夹环衔接子。

一或多个解螺旋酶和一或多个分子制动器优选地不彼此连接。一或多个解螺旋酶和一或多个分子制动器更优选地不彼此共价连接。一或多个解螺旋酶和一或多个分子制动器优选地不连接,如以下国际申请中所描述:第pct/gb2013/051925号(公开为wo2014/013260)、第pct/gb2013/051924号(公开为wo2014/013259)、第pct/gb2013/051928号(公开为wo2014/013262)和第pct/gb2014/052736号。

间隔子

一或多个解螺旋酶可在一或多个间隔子处停止,如在国际申请第pct/gb2014/050175号中所论述。在本发明中可使用在国际申请中所公开的一或多个解螺旋酶和一或多个间隔子的任何构形。

当聚核苷酸的一部分进入孔且沿由施加的电势造成的场移动通过孔时,随着聚核苷酸移动通过孔,一或多个解螺旋酶通过孔而移过间隔子。这是因为聚核苷酸(包括一或多个间隔子)移动通过孔且一或多个解螺旋酶残留在孔上。

一或多个间隔子优选地是聚核苷酸的一部分,例如其中断聚核苷酸序列。一或多个间隔子优选地不是与聚核苷酸杂交的一或多个阻断分子(如减速带)的一部分。

在聚核苷酸中可存在任何数量的间隔子,如1、2、3、4、5、6、7、8、9、10个或更多个间隔子。在聚核苷酸中优选地存在两个、四个或六个间隔子。在聚核苷酸的不同区中可存在一或多个间隔子,如y衔接子和/或发夹环衔接子中的一或多个间隔子。

一或多个间隔子各自提供能量势垒,一或多个解螺旋酶甚至在主动模式中不能克服所述能量势垒。一或多个间隔子可通过降低解螺旋酶的牵引(例如通过从聚核苷酸中的核苷酸移除碱基)或物理地阻断一或多个解螺旋酶的移动(例如使用大型化学基团)来使一或多个解螺旋酶停止。

一或多个间隔子可包含使一或多个解螺旋酶停止的任何分子或所述分子的组合。一或多个间隔子可包含防止一或多个解螺旋酶沿聚核苷酸移动的任何分子或所述分子的组合。测定一或多个解螺旋酶是否在不存在跨膜孔和所施加的电势下在一或多个间隔子处停止是直接了当的。举例来说,可通过page来测量解螺旋酶移动通过间隔子和使dna互补链移位的能力。

一或多个间隔子通常包含线性分子,如聚合物。一或多个间隔子通常具有与聚核苷酸不同的结构。举例来说,如果聚核苷酸是dna,那么一或多个间隔子通常不是dna。特定来说,如果聚核苷酸是脱氧核糖核酸(dna)或核糖核酸(rna),那么一或多个间隔子优选地包含肽核酸(pna)、甘油核酸(gna)、苏糖核酸(tna)、锁核酸(lna)或与核苷酸侧链的合成聚合物。一或多个间隔子可包含在从聚核苷酸的相反的方向上的一或多个核苷酸。举例来说,当聚核苷酸是在5′到3′方向上时,一或多个间隔子在3′到5′方向上可包含一或多个核苷酸。核苷酸可以是上文所论述的那些核苷酸中的任一个。

一或多个间隔子优选地包含:一或多个硝基吲哚,如一或多个5-硝基吲哚;一或多个肌苷;一或多个吖啶;一或多个2-氨基嘌呤;一或多个2-6-二氨基嘌呤;一或多个5-溴-脱氧尿苷;一或多个反向胸苷(反向dt);一或多个反向双脱氧胸苷(ddt;);一或多个双脱氧胞苷(ddc);一或多个5-甲基胞苷;一或多个5-羟甲基胞苷;一或多个2′-o-甲基rna碱基;一或多个异脱氧胞苷(iso-dc);一或多个异脱氧鸟苷(iso-dg);一或多个ispc3基团(即缺乏糖和碱基的核苷酸);一或多个可光分解(pc)集团;一或多个基团;一或多个间隔子9(isp9)基团;一或多个间隔子18(isp18)基团;聚合物或一或多个巯基连接。一或多个间隔子可包含这些基团的任何组合。许多这些基团可购自(integrateddna)。

一或多个间隔子可含有任何数量的这些基团。举例来说,对于2-氨基嘌呤、2-6-二氨基嘌呤、5-溴-脱氧尿苷、反向dt、ddt、ddc、5-甲基胞苷、5-羟甲基胞苷、2′-o-甲基rna碱基、iso-dc、iso-dg、ispc3基团、pc基团、己二醇基团和巯基连接,一或多个间隔子优选地包含2、3、4、5、6、7、8、9、10、11、12个或更多个。一或多个间隔子优选地包含2、3、4、5、6、7、8个或更多个isp9基团。一或多个间隔子优选地包含2、3、4、5或6个或更多个isp18基团。最优选间隔子是四个isp18基团。

聚合物优选地是多肽或聚乙二醇(peg)。多肽优选地包含2、3、4、5、6、7、8、9、10、11、12个或更多个氨基酸。peg优选地包含2、3、4、5、6、7、8、9、10、11、12个或更多个单体单元。

一或多个间隔子优选地包含一或多个无碱基核苷酸(即缺乏核碱基的核苷酸),如2、3、4、5、6、7、8、9、10、11、12个或更多个无碱基核苷酸。在无碱基核苷酸中,核碱基可被-h(idsp)或-oh置换。可通过从一或多个相邻核苷酸移除核碱基,将无碱基间隔子插入到聚核苷酸中。举例来说,聚核苷酸可进行修饰,以包括3-甲基腺嘌呤、7-甲基鸟嘌呤、1,n6-亚乙烯基腺嘌呤肌苷或次黄嘌呤,且可使用人类烷基腺嘌呤dna糖基化酶(haag)来从这些核苷酸移除核碱基。替代地,聚核苷酸可进行修饰,以包括尿嘧啶且用尿嘧啶-dna糖基化酶(udg)移除核碱基。在一个实施例中,一或多个间隔子不包含任何无碱基核苷酸。

一或多个解螺旋酶可通过(即之前)或在各线性分子间隔子上停止。如果使用线性分子间隔子,那么聚核苷酸优选地具备与一或多个解螺旋酶待移动的各间隔子的末端相邻的聚核苷酸的双链区。双链区通常有助于使一或多个解螺旋酶在相邻间隔子上停止。如果在约100mm或更低的盐浓度下进行方法,那么双链区的存在是特别优选的。各双链区的长度通常是至少10个,如至少12个核苷酸。如果在本发明中所用聚核苷酸是单链,那么可通过将较短聚核苷酸与同间隔子相邻的区杂交来形成双链区。较短聚核苷酸通常由与聚核苷酸相同的核苷酸来形成,但可由不同核苷酸来形成。举例来说,较短聚核苷酸可由lna来形成。

如果使用线性分子间隔子,那么聚核苷酸优选地在与一或多个解螺旋酶待移动的各间隔子的末端相反的各间隔子的末端具备阻断分子。这可有助于确保一或多个解螺旋酶仍在各间隔子上停止。在其于溶液中扩散开的情况下,其还可有助于将一或多个解螺旋酶保持在聚核苷酸上。阻断分子可以是下文论述、物理地引起一或多个解螺旋酶停止的任何化学基团。阻断分子可以是聚核苷酸的双链区。

一或多个间隔子优选地包含物理地引起一或多个解螺旋酶停止的一或多个化学基团。一或多个化学基团优选地是一或多个侧链(pendant)化学基团。一或多个化学基团可连接于聚核苷酸中的一或多个核碱基。一或多个化学基团可连接于聚核苷酸主链。可存在任何数量的这些化学基团,如2、3、4、5、6、7、8、9、10、11、12个或更多。合适基团包括(但不限于)荧光团、抗生蛋白链菌素和/或生物素、胆固醇、亚甲基蓝、二硝基苯酚(dnp)、地高辛和/或抗地高辛和二苯基环辛炔基团。

聚核苷酸中的不同间隔子可包含不同停止分子。举例来说,一个间隔子可包含上文所论述的一个线性分子,且另一间隔子可包含物理地引起一或多个解螺旋酶停止的一或多个化学基团。间隔子可包含上文所论述中的任一个线性分子和物理地引起一或多个解螺旋酶停止的一或多个化学基团(如一或多个无碱基基团和荧光团)。

可取决于聚核苷酸的类型和进行本发明的方法的条件,来设计合适间隔子。大部分解螺旋酶结合dna且沿dna移动,且因此可使用不是dna的任何东西来使其停止。合适分子在上文论述。

优选地在存在游离核苷酸和/或存在解螺旋酶辅因子下来进行本发明的方法。这一点在下文更详细论述。在不存在跨膜孔和所施加的电势下,一或多个间隔子优选地能够在存在游离核苷酸和/或存在解螺旋酶辅因子下,使一或多个解螺旋酶停止。

如果如下文所论述在存在游离核苷酸和解螺旋酶辅因子下进行本发明的方法(使得更多解螺旋酶中的一个是在主动模式中),那么一或多个较长间隔子通常用于确保在使一或多个解螺旋酶与跨膜孔接触和施加电势之前,所述一或多个解螺旋酶在聚核苷酸上停止。可在不存在游离核苷酸和解螺旋酶辅因子下使用一或多个较短间隔子(使得一或多个解螺旋酶是在非活动模式中)。

盐浓度还影响一或多个间隔子使一或多个解螺旋酶停止的能力。在不存在跨膜孔施加的电势下,一或多个间隔子优选地能够在约100mm或更低的盐浓度下使一或多个解螺旋酶停止。在本发明的方法中所用的盐浓度越高,通常使用的一或多个间隔子越短,且反之亦然。

优选的特征组合显示于以下表4中。

表4

方法可涉及移动两个或更多个解螺旋酶通过间隔子。在此类情况下,通常增加间隔子的长度,以防止在不存在孔和施加的电势下后置解螺旋酶牵拉前导解螺旋酶通过间隔子。如果方法涉及移动两个或更多个解螺旋酶通过一或多个间隔子,那么可增加上文所论述的间隔子长度至少1.5倍,如2倍、2.5倍或3倍。举例来说,如果方法涉及移动两个或更多个解螺旋酶通过一或多个间隔子,那么可增加以上表4第三列中的间隔子长度1.5倍、2倍、2.5倍或3倍。

本发明的孔可存在于膜中。在本发明的方法中,通常使聚核苷酸与膜中的本发明的孔接触。根据本发明可以使用任何膜。合适膜在所属领域中是众所周知的。膜优选地是两亲层。两亲层是由两亲分子形成的层,所述两亲分子如磷脂,其具有亲水性和亲脂性特性两种。两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物在所属领域中是已知的,且包括例如嵌段共聚物(gonzalez-perez等人,《朗缪尔(langmuir)》,2009,25,10447-10450)。嵌段共聚物是聚合在一起的两个或更多个单体子单元产生单一聚合物链的聚合材料。嵌段共聚物通常具有通过各单体子单元提供的特性。然而,嵌段共聚物可具有由个别子单元形成的聚合物不拥有的独特特性。嵌段共聚物可进行工程改造,使得单体子单元中的一个在水性介质中是疏水性的(即亲脂性),而其它子单元是亲水性的。在此情况下,嵌段共聚物可拥有两亲特性,且可形成模拟生物膜的结构。嵌段共聚物可以是二嵌段的(其由两个单体子单元组成),但也可由超过两个的单体子单元来构筑,形成表现为两亲物的更复杂的排列。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。膜优选地是三嵌段共聚物膜。

古细菌双极四醚脂质是进行构筑使得脂质形成单层膜的天然存在的脂质。这些脂质一般发现于存活于苛刻生物环境中的极端条件的生物、嗜热菌、嗜盐菌和嗜酸菌中。认为其稳定性是源于最终双层的融合性质。通过产生具有一般基序亲水性-疏水性-亲水性的三嵌段聚合物来构筑模拟这些生物实体的嵌段共聚物材料,是直接了当的。这种材料可形成表现类似于脂质双层且涵盖囊泡到层状膜的一系列阶段表现的单体膜。由这些三嵌段共聚物形成的膜在生物脂质膜上保持若干优势。因为合成三嵌段共聚物,所以可小心地控制准确的构筑,以提供形成膜和与孔和其它蛋白质相互作用所需的正确链长度和特性。

还可由不分类为脂质亚材料的子单元来构筑嵌段共聚物,例如可由硅氧烷或其它非基于烃的单体来制成疏水性聚合物。嵌段共聚物的亲水性小节还可拥有很低的蛋白质结合特性,此允许产生当暴露于原始生物样本时具有高度抗性的膜。这种头基单元还可来源于非经典的脂质头基。

与生物脂质膜进行比较,三嵌段共聚物膜还具有增加的机械和环境稳定性,例如高许多的操作温度或ph范围。嵌段共聚物的合成性质提供定制用于广泛范围应用的基于聚合物的膜的平台。

膜最优选地是国际申请第pct/gb2013/052766号或第pct/gb2013/052767号中所公开的膜中的一个。

两亲分子可进行化学修饰或官能化,以便于偶联聚核苷酸。

两亲层可以是单层或双层。两亲层通常是平坦的。两亲层可以是弯曲的。两亲层可以是支撑式的。

两亲膜通常天然地是流动的,基本上以大致10-8cms-1的脂质扩散速率充当二维液体。这意味着孔和偶联的聚核苷酸可通常在两亲膜内移动。

膜可以是脂质双层。脂质双层是细胞膜的模型,且用作一系列实验研究的极佳平台。举例来说,脂质双层可用于通过单通道记录对膜蛋白的活体外研究。替代地,脂质双层可用作检测一系列物质的存在的生物传感器。脂质双层可以是任何脂质双层。合适脂质双层包括(但不限于)平坦脂质双层、支撑式双层或脂质体。脂质双层优选地是平坦脂质双层。合适脂质双层公开于以下中:国际申请第pct/gb08/000563号(公开为wo2008/102121)、国际申请第pct/gb08/004127号(公开为wo2009/077734)和国际申请第pct/gb2006/001057号(公开为wo2006/100484)。

用于形成脂质双层的方法在所属领域中是已知的。脂质双层通常通过montal和mueller的方法(《美国国家科学学院院报(proc.natl.acad.sci.usa.)》,1972;69:3561-3566)来形成,其中脂质单层携载于通过开孔两侧的水溶液/空气界面上,所述开孔垂直于所述界面。通常通过首先将脂质溶解在有机溶剂中,且接着使在开孔两侧上的水溶液的表面上蒸发一滴溶剂,来将脂质添加到水性电解质溶液的表面。一旦有机溶剂已蒸发,那么开孔两侧上的溶液/空气界面来回物理地移动通过开孔,直到形成双层为止。可跨越膜中的开孔或跨越凹槽中的开口形成平坦脂质双层。

montal和米勒的方法是常用的,这是因为是节约成本的,且是形成适合于蛋白孔插入的良好品质脂质双层的相对直接了当的方法。双层形成的其它常见方法包括脂质体双层的尖端浸没、双层涂刷和贴片夹持。

尖端浸没双层形成需要使开孔表面(例如移液管尖端)接触到携载脂质单层的测试溶液的表面。同样,通过将溶解于有机溶剂中的一滴脂质在溶液表面处蒸发来首先在溶液/空气界面处产生脂质单层。接着,通过朗缪尔-沙佛(langmuir-schaefer)过程形成双层,且需要机械自动以使开孔相对于溶液表面移动。

对于涂刷的双层,将溶解于有机溶剂中的一滴脂质直接应用于开孔,所述开孔浸没在水性测试溶液中。使用笔刷或等效物,使脂质溶液稀薄地扩散在开孔内。溶剂的薄化使得形成脂质双层。然而,从双层完全移除溶剂是非常困难的,且因此通过这种方法形成的双层较不稳定且更倾向于在电化学测量期间具有噪声。

贴片夹持是在生物细胞膜研究中常用的。通过抽汲将细胞膜夹持到移液管的末端,且膜贴片变为连接在开孔内。所述方法适用于通过夹持接着爆裂以离开密封在移液管的开孔内的脂质双层的脂质体来产生脂质双层。所述方法需要稳定的、巨大的且单层脂质体和在具有玻璃表面的材料中制造小开孔。

可通过超声处理、挤压或mozafari方法来形成脂质体(colas等人(2007)《micron》38:841-847)。

在一优选实施例中,如国际申请第pct/gb08/004127号(公开为wo2009/077734)中所描述形成脂质双层。在此方法中有利的是,由干燥脂质形成脂质双层。在一最优选实施例中,跨越开口形成脂质双层,如wo2009/077734(pct/gb08/004127)中所描述。

由脂质的两个相对层形成脂质双层。两个脂质层被布置成使得其疏水尾部基团面朝彼此,形成疏水性的内部。脂质的亲水性头基朝外面向双层各侧上的水性环境。双层可存在于多种脂质阶段中,所述阶段包括(但不限于)液体无序阶段(液体片层)、液体有序阶段、固体有序阶段(片层凝胶阶段、交错结合的凝胶阶段)和平坦双层晶体(片层亚凝胶阶段、片层结晶阶段)。

可使用形成脂质双层的任何脂质组合物。选择脂质组合物,使得脂质双层具有所需的特性,如表面电荷、支持膜蛋白的能力、充填密度或所形成的机械特性。脂质组合物可包含一或多种不同脂质。举例来说,脂质组合物可含有至多100种脂质。脂质组合物优选地含有1到10种脂质。脂质组合物可包含天然存在的脂质和/或人工脂质。

脂质通常包含头基、界面部分和可相同或不同的两个疏水尾部基团。合适头基包括(但不限于):中性头基,如二酰基甘油酯(dg)和脑酰胺(cm);两性离子头基,如磷脂酰胆碱(pc)、磷脂酰乙醇胺(pe)和鞘磷脂(sm);带负电头基,如磷脂酰甘油(pg)、磷脂酰丝氨酸(ps)、磷脂酰肌醇(pi)、磷脂酸(pa)和心磷脂(ca);和带正电头基,如三甲基铵丙烷(tap)。合适界面部分包括(但不限于)天然存在的界面部分,如基于甘油或基于脑酰胺的部分。合适疏水尾部基团包括(但不限于):饱和烃链,如月桂酸(正十二烷酸)、肉豆蔻酸(正十四烷酸)、棕榈酸(正十六烷酸)、硬脂酸(正十八烷酸)和花生酸(正二十烷酸);不饱和烃链,如油酸(顺-9-十八烷酸);和分支链烃链,如植烷酰基。链的长度和不饱和烃链中的双键的位置与数量可变化。链的长度和分支链烃链中的分支(如甲基)的位置和数量可变化。疏水尾部基团可作为醚或酯连接于界面部分。脂质可以是分枝菌酸。

脂质还可以进行化学修饰。脂质的头基或尾部基团可以进行化学修饰。头基已进行化学修饰的合适脂质包括(但不限于):peg修饰的脂质,如1,2-二酰基-sn-甘油-3-磷酸乙醇胺-n-[甲氧基(聚乙二醇)-2000];官能化的peg脂质,如1,2-二硬脂酰基-sn-甘油-3磷酸乙醇胺-n-[生物素基(聚乙二醇)2000];和针对结合修饰的脂质,如1,2-二油酰基-sn-甘油-3-磷酸乙醇胺-n-(丁二酰基)和1,2-二棕榈酰基-sn-甘油-3-磷酸乙醇胺-n-(生物素基)。尾部基团已进行化学修饰的合适脂质包括(但不限于):可聚合脂质,如1,2-双(10,12-三辅二炔基)-sn-甘油-3-磷酸胆碱;氟化脂质,如1-软脂酰基-2-(16-氟软脂酰基)-sn-甘油-3-磷酸胆碱;氘化脂质,如1,2-二棕榈酰基-d62-sn-甘油-3-磷酸胆碱;和醚连接的脂质,如1,2-二-o-植烷基-sn-甘油-3-磷酸胆碱。脂质可以进行化学修饰或官能化,以便于偶联聚核苷酸。

两亲层,例如脂质组合物,通常包含将影响层的特性的一或多个添加剂。合适添加剂包括(但不限于):脂肪酸,如棕榈酸、肉豆蔻酸和油酸;脂肪醇,如棕榈醇、肉豆蔻醇和油醇;固醇,如胆固醇、麦角固醇、羊毛固醇、谷固醇和豆固醇;溶血磷脂,如1-酰基-2-羟基-sn-甘油-3-磷酸胆碱;和脑酰胺。

在另一优选实施例中,膜包含固态层。固态层可由两个有机和无机材料形成,所述材料包括(但不限于):微电子材料;绝缘材料,如si3n4、al2o3和sio;有机和无机聚合物,如聚酰胺;塑料,如或弹性体,如二组分加成固化的聚硅氧橡胶;和玻璃。固态层可由石墨烯形成。合适石墨烯层公开于国际申请第pct/us2008/010637号(公开为wo2009/035647)中。如果膜包含固态层,那么孔通常存在于两亲膜或层中,所述两亲膜或层含于固态层内,例如在固态层内的孔洞、孔、空隙、通道、沟槽或缝隙内。所属领域的技术人员可制备合适的固态/两亲性杂合系统。合适系统公开于wo2009/020682和wo2012/005857中。可使用上文所论述的两亲膜或层中的任一个。

通常使用以下来进行方法:(i)人工两亲层,其包含孔,(ii)分离包含孔的天然存在的脂质双层,或(iii)其中插入有孔的细胞。通常使用人工两亲层,如人工三嵌段共聚物层,来进行方法。层可包含其它跨膜和/或膜内蛋白质以及除孔以外的其它分子。下文论述合适设备和条件。通常在活体外进行本发明的方法。

偶联

聚核苷酸优选地与包含孔的膜偶联。方法可包含将聚核苷酸与包含孔的膜偶联。使用一或多个锚,聚核苷酸优选地与膜偶联。使用任何已知的方法,聚核苷酸可与膜偶联。

各锚包含与聚核苷酸偶联(或结合)的基团和与膜偶联(或结合)的基团。各锚可与聚核苷酸和/或膜共价偶联(或结合)。如果使用y衔接子和/或发夹环衔接子,那么使用衔接子,聚核苷酸优选地与膜偶联。

使用任何数量的锚,如2、3、4个或更多个锚,聚核苷酸可与膜偶联。举例来说,使用两个锚,聚核苷酸可与膜偶联,所述两个锚中的每一个分别地与聚核苷酸和膜两个偶联(或结合)。

一或多个锚可包含一或多个解螺旋酶和/或一或多个分子制动器。

如果膜是两亲层,如共聚物膜或脂质双层,那么一或多个锚优选地包含存在于膜中的多肽锚和/或存在于膜中的疏水性锚。疏水性锚优选地是脂质、脂肪酸、固醇、碳纳米管、多肽、蛋白质或氨基酸,例如胆固醇、棕榈酸或生育酚。在优选实施例中,一或多个锚不是孔。

膜的组分,如两亲分子、共聚物或脂质,可进行化学修饰或官能化,以形成一或多个锚。膜的组分的合适化学修饰和合适官能化方式的实例在下文更详细地论述。可对任何比例的膜组分进行官能化,例如至少0.01%、至少0.1%、至少1%、至少10%、至少25%、至少50%或100%。

聚核苷酸可直接与膜偶联。用于将聚核苷酸与膜偶联的一或多个锚优选地包含连接子。一或多个锚可包含一或多个连接子,如2、3、4个或更多个。可使用一个连接子来将超过一个聚核苷酸与膜偶联,如2、3、4个或更多个。

优选连接子包括(但不限于)聚合物,如聚核苷酸、聚乙二醇(peg)、多糖和多肽。这些连接子可以是线性、分支链或环状的。举例来说,连接子可以是环状聚核苷酸。聚核苷酸可与环状聚核苷酸连接子上的互补序列杂交。

一或多个锚或一或多个连接子可包含可进行剪切分解的组分,如限制位点或光不稳定性基团。

官能化连接子和其可偶联分子的方式在所属领域中是已知的。举例来说,用马来酰亚胺基团官能化的连接子将与蛋白质中的半胱氨酸残基反应且连接。在本发明的上下文中,蛋白质可存在于膜中,或可用于与聚核苷酸偶联(或结合)。这一点在下文更详细论述。

可使用“锁和钥”排列来避免聚核苷酸的交联。各连接子的仅一端可一起反应形成较长连接子,且连接子的另一端各自分别与聚核苷酸或膜反应。此类连接子描述于国际申请第pct/gb10/000132号(公开为wo2010/086602)中。

在下文论述的测序实施例中,使用连接子是优选的。如果在当与孔相互作用时聚核苷酸并不解耦(即在步骤(b)或(e)中不解耦)的意义上,聚核苷酸永久性直接与膜偶联,那么在归因于膜与孔之间的距离而测序操作不能持续到聚核苷酸的末端时,将丢失一些序列数据。如果使用连接子,那么聚核苷酸可进行处理完全。

偶联可以是永久性或稳定的。换句话说,偶联可以使得当聚核苷酸与孔相互作用时其仍与膜偶联。

偶联可以是暂时的。换句话说,偶联可以使得当聚核苷酸与孔相互作用时其可与膜解耦。

对于某些应用,如适体检测,暂时性质的偶联是优选的。如果永久性或稳定连接子直接连接于聚核苷酸的5′或3′端,且连接子比膜与跨膜孔的通道之间的距离短,那么在测序操作不能持续到聚核苷酸的末端时,一些序列数据将丢失。如果偶联是暂时的,接着当偶联的末端随机变为不含膜时,那么聚核苷酸可以进行处理完全。形成永久性/稳定或暂时连接的化学基团在下文更详细地论述。使用胆固醇或脂肪酰基链,聚核苷酸可以与两亲层或三嵌段共聚物膜暂时偶联。可使用长度为6到30个碳原子的任何脂肪酰基链,如十六烷酸。

在优选实施例中,聚核苷酸(如核酸)与两亲层(如三嵌段共聚物膜或脂质双层)偶联。先前已用各种不同网络共享的策略进行核酸与合成脂质双层的偶联。这些概述于下表5中。

表5

合成聚核苷酸和/或连接子可在合成反应中使用修饰胺基磷酸酯来官能化,所述修饰胺基磷酸酯容易地与直接添加合适锚定基团相容,所述锚定基团如,胆固醇、生育酚、棕榈酸、巯基、脂质和生物素基团。这些不同的连接化学,产生一套用于与聚核苷酸连接的选项。各不同修饰基团以稍微不同的方式偶联聚核苷酸,且偶联未必总是永久性的,因此对于聚核苷酸与膜,得到不同的停留时间。暂时偶联的优势在上文论述。

聚核苷酸与连接子或与官能化膜的偶联还可可通过多种其它手段来实现,其限制条件为可向聚核苷酸中添加互补反应性基团或锚定基团。向聚核苷酸的任一末端添加反应性基团,先前已有报导。可使用t4聚核苷酸激酶和atpγs向ssdna或dsdna的5′中添加巯基(grant,g.p.和p.z.qin(2007).“《一种用于连接在核酸的5′端处的氮氧化物自旋标记的便捷方法(afacilemethodforattachingnitroxidespinlabelsatthe5′terminusofnucleicacids)》”.《核酸研究》35(10):e77)。可使用t4聚核苷酸激酶和γ-[2-叠氮基乙基]-atp或γ-[6-叠氮基己基]-atp,向ssdna或dsdna的5′-磷酸中添加叠氮基团。使用巯基或点击化学,含有巯基、碘乙酰胺opss或马来酰亚胺基团(与巯基具有反应性)或dibo(二苯并环氧磷)或炔基(与叠氮化物具有反应性)中的任一个的系链,可共价连接于聚核苷酸。可使用末端转移酶将修饰寡核苷酸并入到ssdna的3′中,来添加更多样的化学基团选择(如生物素、巯基和荧光团)(kumar,a.、p.tchen等人(1988).“《通过末端脱氧核苷酸转移酶对合成寡核苷酸探针进行非放射性标记(nonradioactivelabelingofsyntheticoligonucleotideprobeswithterminaldeoxynucleotidyltransferase)》”.《分析生物化学》169(2):376-82)。抗生蛋白链菌素/生物素和/或抗生蛋白链菌素/脱硫生物素偶联可用于任何其它聚核苷酸。以下实例描述聚核苷酸可如何使用抗生蛋白链菌素/生物素和抗生蛋白链菌素/脱硫生物素来与膜偶联。也有可能,可使用末端转移酶(例如胆固醇或棕榈酸)向具有合适修饰的核苷酸的聚核苷酸中直接添加锚。

一或多个锚优选地通过杂交将聚核苷酸与膜偶联。一或多个锚中的杂交允许以如上文所论述的暂时方式偶联。杂交可存在于一或多个锚的任何部分中,如在一或多个锚与聚核苷酸之间,在一或多个锚内或在一或多个锚与膜之间。举例来说,连接子可包含两个或更多个杂交在一起的聚核苷酸,如3、4或5个聚核苷酸。一或多个锚可与聚核苷酸杂交。一或多个锚可直接与聚核苷酸或直接与y衔接子和/或连接于聚核苷酸的前导序列或直接与连接于聚核苷酸的发夹环衔接子杂交(如下文所论述)。替代地,一或多个锚可与一或多个(如2或3个)中间聚核苷酸(或“夹板”)杂交,所述中间聚核苷酸与聚核苷酸、与连接于聚核苷酸的y衔接子和/或前导序列或与连接于聚核苷酸的发夹环衔接子杂交(如下文所论述)。

一或多个锚可包含单链或双链聚核苷酸。锚的一个部分可与单链或双链聚核苷酸接合。已报导使用t4rna接合酶i对ssdna的短碎片的接合(troutt,a.b.、m.g.mcheyzer-williams等人(1992).“《接合锚定的pcr:具有单侧特异性的简单扩增技术(ligation-anchoredpcr:asimpleamplificationtechniquewithsingle-sidedspecificity)》”.《美国国家科学院院刊》89(20):9823-5)。替代地,单链或双链聚核苷酸可与双链聚核苷酸接合,且接着两个链通过热或化学变性分开。对于双链聚核苷酸,有可能,向双螺旋的一个或两个端中添加一片单链聚核苷酸,或向一个或两个端中添加双链聚核苷酸。对于向双链聚核苷酸中添加单链聚核苷酸,这可使用t4rna接合酶i来实现,如与单链聚核苷酸的其它区的接合。对于向双链聚核苷酸中添加双链聚核苷酸,那么分别通过聚核苷酸上的互补3′da/dt尾和所添加聚核苷酸(入对于许多样本制备型应用常规地进行,以防止多联体或二聚体形成),或使用通过限制性消化聚核苷酸和相容衔接子的接合而产生的“粘稠端”,接合可以是“平末端”的。接着,如果单链聚核苷酸用于在5′端、3′端或两端(当双链聚核苷酸用于接合时)处的接合或修饰,那么当双螺旋熔融时,各单链将具有5′或3′修饰。

如果聚核苷酸是合成链,那么可在化学合成聚核苷酸期间并入一或多个锚。举例来说,可使用具有连接于其的反应性基团的引物来合成聚核苷酸。

腺苷酸化聚核苷酸是接合反应中的中间物,其中单磷酸腺苷连接于聚核苷酸的5′-磷酸。用于产生这种中间物的各种试剂盒是可获得的,如来自neb的5′dna腺苷酰化试剂盒。通过在反应中对于修饰核苷酸三磷酸进行取代atp,那么可以向聚核苷酸的5′中添加反应性基团(如巯基、胺、生物素、叠氮化物等)。也有可能,可使用5′dna腺苷酰化试剂盒向具有合适修饰的核苷酸的聚核苷酸中直接添加锚。

用于扩增基因组dna片段的常见技术是使用聚合酶链式反应(pcr)。此处,使用两个合成寡核苷酸引物,可产生大量相同dna片段的拷贝,其中对于各拷贝,双螺旋中的各链的5′将是合成聚核苷酸。可通过使用聚合酶向单或双链dna的3′端中添加单个或多个核苷酸。可使用的聚合酶的实例包括(但不限于)末端转移酶、klenow和大肠杆菌poly(a)聚合酶)。通过在反应中对于修饰核苷酸三磷酸取代atp,那么可将锚(如胆固醇、巯基、胺、叠氮化物、生物素或脂质)并入到双链聚核苷酸中。因此,所扩增聚核苷酸的各拷贝将含有锚。

理想地,聚核苷酸与膜偶联而无须使聚核苷酸官能化。这可通过将一或多个锚(如聚核苷酸结合蛋白或化学基团)与膜偶联和使一或多个锚与聚核苷酸相互作用或通过使膜官能化来实现。一或多个锚可通过本文所描述的任一个方法来与膜偶联。特定来说,一或多个锚可包含一或多个连接子,如马来酰亚胺官能化连接子。

在这个实施例中,聚核苷酸通常是rna、dna、pna、tna或lna,且可以是双或单链。这个实施例尤其适合于基因组dna聚核苷酸。

一或多个锚可包含,与单或双链聚核苷酸、聚核苷酸内的特异性核苷酸序列或聚核苷酸内的修饰核苷酸的图案或存在于聚核苷酸上的任何其它配体偶联、结合或与相互作用的任何基团。

用于锚中的合适结合蛋白包括(但不限于):大肠杆菌单链结合蛋白、p5单链结合蛋白、t4gp32单链结合蛋白、topovdsdna结合区、人类组蛋白、大肠杆菌hudna结合蛋白,和其它古细菌、原核或真核单链或双链聚核苷酸(或核酸)结合蛋白,包括下文所列的那些。

特异性核苷酸序列可以是由转录因子、核糖体、核酸内切酶、拓扑异构酶或复制起始因子识别的序列。修饰核苷酸的图案可以是甲基化或损坏图案。

一或多个锚可包含与聚核苷酸偶联、结合、插入或相互作用的任何基团。基团可通过静电、氢结合或范德华力相互作用插入聚核苷酸中或与其相互作用。此类基团包括赖氨酸单体、聚赖氨酸(其将与ssdna或dsdna相互作用)、溴化乙锭(其插入dsdna)、通用碱基或通用核苷酸(其可与任何聚核苷酸杂交)和锇络合物(其可与甲基化碱基反应)。因此,聚核苷酸可使用连接于膜的一或多个通用核苷酸而与膜偶联。各通用核苷酸可使用一或多个连接子而与膜偶联。通用核苷酸优选地包含以下核碱基中的一个:次黄嘌呤、4-硝基吲哚、5-硝基吲哚、6-硝基吲哚、甲酰基吲哚、3-硝基吡咯、硝基咪唑、4-硝基吡唑、4-硝基苯并咪唑、5-硝基吲唑、4-氨基苯并咪唑或苯基(c6-芳环)。通用核苷酸更优选地包含以下核苷中的一个:2′-脱氧肌苷、肌苷、7-脱氮-2′-脱氧肌苷、7-脱氮-肌苷、2-氮杂-脱氧肌苷、2-氮杂-肌苷、2-o′-甲基肌苷、4-硝基吲哚2′-脱氧核苷、4-硝基吲哚核苷、5-硝基吲哚2′-脱氧核苷、5-硝基吲哚核苷、6-硝基吲哚2′-脱氧核苷、6-硝基吲哚核苷、3-硝基吡咯2′-脱氧核苷、3-硝基吡咯核苷、次黄嘌呤的非环糖类似物、硝基咪唑2′-脱氧核苷、硝基咪唑核苷、4-硝基吡唑2′-脱氧核苷、4-硝基吡唑核苷、4-硝基苯并咪唑2′-脱氧核苷、4-硝基苯并咪唑核苷、5-硝基吲唑2′-脱氧核苷、5-硝基吲唑核苷、4-氨基苯并咪唑2′-脱氧核苷、4-氨基苯并咪唑核苷、苯基c-核苷、苯基c-2′-脱氧核糖基核苷、2′-脱氧烟云杯伞素、2′-脱氧异鸟苷、k-2′-脱氧核苷、p-2′-脱氧核苷和吡咯烷。通用核苷酸更优选地包含2′-脱氧肌苷。通用核苷酸更优选地是imp或dimp。通用核苷酸最优选地是dpmp(2′-脱氧-p-核苷单磷酸)或dkmp(n6-甲氧基-2,6-二氨基嘌呤单磷酸)。

一或多个锚可通过hoogsteen氢键(其中两个核碱基通过氢键保持在一起)或反向hoogsteen氢键(其中一个核碱基相对于其它核碱基旋转180°)与聚核苷酸偶联(或结合)。举例来说,一或多个锚可包含与聚核苷酸形成hoogsteen氢键或反向hoogsteen氢键的一或多个核苷酸、一或多个寡核苷酸或一或多个聚核苷酸。这些氢键类型允许第三聚核苷酸链卷绕双链螺旋于周围,且形成三链螺旋。通过与双链双螺旋形成三链螺旋,一或多个锚可与双链聚核苷酸偶联(或结合)。

在此实施例中,至少1%、至少10%、至少25%、至少50%或100%的膜组分可进行官能化。

当一或多个锚包含蛋白质时,所述一或多个锚可以能够直接锚定到膜中而无需进一步官能化,例如当其已具有与膜相容的外部疏水区时。此类蛋白质的实例包括(但不限于)跨膜蛋白质、膜内蛋白质和膜蛋白。替代地,可表达具有与膜相容的基因融合疏水区的蛋白质。此类疏水性蛋白质区在所属领域中是已知的。

一或多个锚优选地在与膜接触之前与聚核苷酸混合,但一或多个锚可与膜接触且随后与聚核苷酸接触。

在另一方面中,聚核苷酸可使用上文所描述的方法来官能化,使得其可由特异性结合基团识别。具体地说,聚核苷酸可用配体进行官能化,所述配体如,生物素(用于结合于抗生蛋白链菌素)、直链淀粉(用于结合于麦芽糖结合蛋白或融合蛋白)、ni-nta(用于结合于聚组氨酸或聚组氨酸标签的蛋白质)或肽(如抗原)。

根据一优选实施例,一或多个锚可用于当聚核苷酸连接于前导序列时将聚核苷酸与膜偶联,所述前导序列优选地螺旋到孔中。前导序列在下文更详细地论述。较佳地,聚核苷酸连接(如接合)于优选地螺旋到孔中的前导序列。此类前导序列可包含均聚聚核苷酸或无碱基区。前导序列通常设计成直接与一或多个锚杂交,或通过一或多个中间聚核苷酸(或夹板)与所述一或多个锚杂交。在此类情况下,一或多个锚通常包含与前导序列中的序列或一或多个中间聚核苷酸(或夹板)中的序列互补的聚核苷酸序列。在此类情况下,一或多个夹板通常包含与前导序列中的序列互补的聚核苷酸序列。

化学连接中使用的分子的实例是edc(1-乙基-3-[3-二甲基胺基丙基]碳化二亚胺盐酸盐)。还可使用可商购的试剂盒(thermopierce,产品号22980),来向聚核苷酸的5′中添加反应性基团。合适方法包括(但不限于)使用组氨酸残基和ni-nta的暂时亲和力连接,以及通过反应性半胱氨酸、赖氨酸或非天然氨基酸的更稳固共价连接。

双链聚核苷酸

聚核苷酸可以是双链。如果聚核苷酸是双链,那么在接触步骤之前,方法优选地进一步包含使桥接部分(如发夹环)与聚核苷酸的一端接合。可接着在使聚核苷酸与根据本发明孔接触时或之前,将聚核苷酸的两条链分开。在聚核苷酸通过孔移动受聚核苷酸结合蛋白(如解螺旋酶或分子制动器)控制时,可将两条链分开。

以此方式连接和询问双链上的两条链增加表征的效率和准确度。

桥接部分能够连接靶聚核苷酸的两条链。桥接部分通常共价连接靶聚核苷酸的两条链。桥接部分可以是能够连接靶聚核苷酸的两条链的任何东西,其限制条件为桥接部分不干扰单链聚核苷酸通过跨膜孔的移动。

桥接部分可通过在所属领域中已知的任何合适手段连接于靶聚核苷酸。桥接部分可分开地合成,且化学连接或酶促接合于靶聚核苷酸。替代地,桥接部分可以是在靶聚核苷酸加工中产生。

桥接部分连接于在靶聚核苷酸的一端处或附近的靶聚核苷酸。桥接部分优选地连接于在靶聚核苷酸的10个核苷酸末端内的靶聚核苷酸

合适桥接部分包括(但不限于)聚合物连接子、化学连接子、聚核苷酸或多肽。优选地,桥接部分包含dna、rna、修饰dna(如无碱基dna)、rna、pna、lna或peg。桥接部分更优选地是dna或rna。

桥接部分最优选地是发夹环或发夹环衔接子。可使用所属领域中已知的方法来设计合适发夹衔接子。发夹环可以是任何长度。发夹环的长度通常是110个或更少个核苷酸,如100个或更少个核苷酸、90个或更少个核苷酸、80个或更少个核苷酸、70个或更少个核苷酸、60个或更少个核苷酸、50个或更少个核苷酸、40个或更少个核苷酸、30个或更少个核苷酸、20个或更少个核苷酸,或10个或更少个核苷酸。发夹环的长度优选地是约1到110、2到100、5到80或6到50个核苷酸。如果环涉及不同的衔接子的选择能力,那么较长长度的发夹环,如50到110个核苷酸,是优选的。类似地,如果环不涉及如下文所论述的可选择结合,那么较短长度的发夹环,如1到5个核苷酸,是优选的。

发夹衔接子可接合于第一和/或第二聚核苷酸的任一端,即5′或3′端。使可用所属领域中已知的方法,将发夹衔接子接合于第一和/或第二聚核苷酸。可使用接合酶,如t4dna接合酶、大肠杆菌dna接合酶、taqdna接合酶、tmadna接合酶和9ondna接合酶,来接合发夹衔接子。

可使用所属领域中已知的任何方法,来将聚核苷酸的两条链分开。举例来说,可通过聚核苷酸结合蛋白或使用有利于解杂交的条件,来将其分开(有利于解杂交的条件的实例包括(但不限于)高温、高ph和添加可破坏氢结合或碱基配对的药剂,如甲酰胺和脲)。

发夹衔接子优选地包含可选择结合部分。这允许第一和/或第二聚核苷酸纯化或分离。可选择结合部分是可基于其结合特性而选择的部分。因此,可选择结合部分优选地是特异性结合于表面的部分。如果可选择结合部分以比在本发明中使用的任何其它部分高许多的程度结合于表面,那么其特异性结合于表面。在优选实施例中,部分结合于无本发明中使用的其它部分与其结合的表面。

合适选择性结合部分在所属领域中是已知的。优选选择性结合部分包括(但不限于):生物素;聚核苷酸序列;抗体;抗体片段,如fab和scsv;抗原;聚核苷酸结合蛋白;聚组氨酸尾部和gst标签。最优选选择性结合部分是生物素和可选择聚核苷酸序列。生物素特异性结合于涂布有抗生物素蛋白的表面。可选择聚核苷酸序列特异性地结合(即杂交)于涂布有同源序列的表面。替代地,可选择聚核苷酸序列特异性结合于涂布有聚核苷酸结合蛋白的表面。

发夹衔接子和/或可选择结合部分可包含可进行剪切、切割、裂解或水解的区。此类区可设计成允许从其在纯化或分离后结合于其的表面移除第一和/或第二聚核苷酸。合适区在所属领域中是已知的。合适区包括(但不限于)rna区、包含脱硫生物素和抗生蛋白链菌素的区、二硫键和可光裂解区。

双链靶聚核苷酸优选地包含在桥接部分(如发夹环或发夹环衔接子)相对端处的前导序列。前导序列在下文更详细地论述。

进行转角测序

在一优选实施例中,靶双链聚核苷酸在一端具备桥接部分,如发夹环或发夹环衔接子,且方法包含使聚核苷酸与孔接触,使得聚核苷酸的两条链移动通过孔,且在聚核苷酸的两条链相对于孔移动时进行一或多个测量,其中测量指示聚核苷酸的链的一或多个特征,且从而表征靶双链聚核苷酸。在另一优选实施例中,靶双链聚核苷酸在一端具备桥接部分,如发夹环或发夹环衔接子,且方法包含使聚核苷酸与孔和核酸外切酶接触,使得消化聚核苷酸的两条链,形成个别核苷酸。上文所论述的任一个实施例同样应用于这个实施例。

前导序列

在链表征/测序方法中的接触步骤之前,方法优选地包含将聚核苷酸连接于优选地螺旋到孔中的前导序列。前导序列有助于本发明的方法。前导序列设计成优选地螺旋到孔中,且从而有助于聚核苷酸通过孔的移动。前导序列还可用于将聚核苷酸连接于如上文所论述的一或多个锚。

前导序列通常包含聚合物。聚合物优选地是带负电的。聚合物优选地是:聚核苷酸,如dna或rna;修饰聚核苷酸(如无碱基dna);pna;lna;聚乙二醇(peg)或多肽。前导优选地包含聚核苷酸,并且更优选地包含单链聚核苷酸。前导序列可包含上文所论述的任一个聚核苷酸。单链前导序列最优选地包含dna的单链,如聚dt区段。前导序列优选地包含一或多个间隔子。

前导序列可以是任何长度,但其长度通常是10到150个核苷酸,如20到150个核苷酸。前导的长度通常取决于方法中使用的跨膜孔。

前导序列优选地是如下文所定义的y衔接子的一部分。

双重偶联

本发明的方法可涉及双链聚核苷酸的双重偶联。在一优选实施例中,本发明的方法包含:

(a)提供在一端处具有y衔接子和在另一端处具有桥接部分衔接子(如发夹环衔接子)的双链聚核苷酸,其中y衔接子包含用于将聚核苷酸与膜偶联的一或多个第一锚,其中桥接部分衔接子包含用于将聚核苷酸与膜偶联的一或多个第二锚,且其中桥接部分衔接子与膜偶联的强度大于y衔接子与膜偶联的强度;

(b)使步骤(a)中提供的聚核苷酸与本发明的孔接触,使得聚核苷酸相对于(如通过)孔移动;和

(c)在聚核苷酸相对于孔移动时,进行一或多个测量,其中测量指示聚核苷酸的一或多个特征,且从而表征靶聚核苷酸。

这种方法类型在英国申请第1406147.7号中详细论述。

双链聚核苷酸在一端处具备y衔接子和在另一端处具备桥接部分衔接子。y衔接子和/或桥接部分衔接子通常是聚核苷酸衔接子。其可由上文所论述的任一个聚核苷酸形成。

y衔接子通常包含(a)双链区和(b)单链区或在另一端处不互补的区。如果y衔接子包含单链区,那么其可被描述为具有悬突。y衔接子中非互补区的存在给予衔接子其y形状,这是由于不同于双链部分,两条链通常不彼此杂交。y衔接子包含一或多个第一锚。锚在上文更详细地论述。

y衔接子优选地包含优选地螺旋到孔中的前导序列。这一点在上文论述。

桥接部分衔接子优选地包含如上文所论述的可选择结合部分。桥接部分衔接子和/或可选择结合部分可包含可如上文所论述进行剪切、切割、裂解或水解的区。

如果一或多个解螺旋酶和一或多个分子制动器如上文所论述来使用,那么y衔接子优选地包含一或多个解螺旋酶,且桥接部分衔接子优选地包含一或多个分子制动器。

使可用所属领域中已知的方法,将y衔接子和/或桥接部分衔接子接合于聚核苷酸。可使用接合酶,如t4dna接合酶、大肠杆菌dna接合酶、taqdna接合酶、tmadna接合酶和9ondna接合酶,来接合衔接子中的一个或两个。替代地,可使用下文论述的本发明的方法,向聚核苷酸中添加衔接子。

在一优选实施例中,方法的步骤a)包含修饰双链聚核苷酸,使得其包含在一端处的y衔接子且在另一端处的桥接部分衔接子。可使用任何修饰方式。方法优选地包含修饰根据本发明的双链聚核苷酸。这一点在下文更详细论述。可以任何方式对修饰和表征方法进行组合。

桥接部分衔接子与膜偶联(或结合)的强度大于y衔接子与膜偶联(或结合)的强度。这可以任何方式来测量。用于测量偶联(或结合)的强度的合适方法公开于英国申请第1406147.7号的实例中。

桥接部分衔接子偶联(或结合)的强度优选地是y衔接子偶联(或结合)的强度的至少1.5倍,如锚衔接子偶联(或结合)的强度的至少两倍、至少三倍、至少四倍、至少五倍或至少十倍。桥接部分衔接子对于膜的亲和力常数(kd)优选地是y衔接子的亲和力常数的至少1.5倍,如y衔接子的偶联的强度的至少两倍、至少三倍、至少四倍、至少五倍或至少十倍。

存在若干种使桥接部分衔接子比y衔接子更强烈地与膜偶联(或结合)的方式。举例来说,桥接部分衔接子可包含比y衔接子更多的锚。举例来说,桥接部分衔接子可包含2、3个或更多个第二锚,而y衔接子可包含一个第一锚。

一或多个第二锚与膜的偶联(或结合)的强度可大于一或多个第一锚与膜的偶联(或结合)的强度。一或多个第二锚与桥接部分衔接子的偶联(或结合)的强度可大于一或多个第一锚与y衔接子的偶联(或结合)的强度。一或多个第一锚和一或多个第二锚可通过杂交而连接于其相应衔接子,且一或多个第二锚中的杂交的强度比一或多个第一锚中的杂交的强度高。在本发明中还可使用此等实施例的任何组合。可使用所属领域中的已知技术来测量偶联(或结合)的强度。

一或多个第二锚优选地包含以比一或多个第一锚中的一个或多个基团与膜偶联(或结合)更高的强度与膜偶联(或结合)的一个或多个基团。在优选实施例中,桥接部分衔接子/一或多个第二锚使用胆固醇与膜偶联(或结合),且y衔接子/一或多个第一锚使用棕榈酸与膜偶联(或结合)。胆固醇比棕榈酸更强烈地结合于三嵌段共聚物膜和脂质膜。在一替代实施例中,桥接部分衔接子/一或多个第二锚使用单酰基物种(如棕榈酸)与膜偶联(或结合),且y衔接子/一或多个第一锚使用二酰基物种(如二棕榈酰基磷脂酰胆碱)与膜偶联(或结合)。

添加发夹环和前导序列

在提供之前,可使双链聚核苷酸与mua转座酶和双链mua底物群体接触,其中群体中的一部分底物是包含前导序列的y衔接子,且其中群体中的一部分底物是发夹环衔接子。转座酶将双链聚核苷酸分析物分段,且将mua底物与片段的一个或两个端接合。这产生包含在一端处的前导序列和在另一端处的发夹环的多个修饰双链聚核苷酸。可接着使用本发明的方法来研究修饰双链聚核苷酸。

群体中的各底物优选地包含至少一个通用核苷酸的悬突,使得转座酶将模板聚核苷酸分段,且将底物与双链片段的一或两端接合,且从而产生多个片段/底物构筑体,且其中方法进一步包含使悬突与构筑体中的片段接合,且从而生产多个修饰双链聚核苷酸。合适通用核苷酸在上文论述。悬突的长度优选地是五个核苷酸。

替代地,群体中的各底物优选地包含:(i)至少一个悬突;和(ii)在与包含不存在于模板聚核苷酸中的核苷的至少一个悬突相同的链中的至少一个核苷酸,使得转座酶将模板聚核苷酸分段,且使底物与双链片段的一或两端接合,且从而产生多个片段/底物构筑体,且其中方法进一步包含(a)通过选择性地移除至少一个核苷酸来从构筑体移除悬突,且从而生产包含单链间隙的多个双链构筑体,和(b)修复构筑体中的单链间隙,且从而生产多个修饰双链聚核苷酸。聚核苷酸通常包含以下核苷:脱氧腺苷(da)、脱氧尿苷(du)和/或胸苷(dt)、脱氧鸟苷(dg)和脱氧胞苷(dc)。不存在于聚核苷酸中的核苷优选地是无碱基核苷、腺苷(a)、尿苷(u)、5-甲基尿苷(m5u)、胞苷(c)或鸟苷(g),或包含脲、5,6二羟基胸苷、胸苷乙二醇、5-羟基-5甲基乙内酰脲、尿嘧啶乙二醇、6-羟基-5,6-二羟基胸苷、甲基酒石酰脲、7,8-二氢-8-氧代鸟嘌呤(8-氧代鸟嘌呤)、8-氧代腺嘌呤、fapy-鸟嘌呤、甲基-fapy-鸟嘌呤、fapy-腺嘌呤、黄霉毒素b1-fapy-鸟嘌呤、5-羟基-胞嘧啶、5-羟基-尿嘧啶、3-甲基腺嘌呤、7-甲基鸟嘌呤、1,n6-亚乙烯基腺嘌呤、次黄嘌呤、5-羟基尿嘧啶、5-羟甲基尿嘧啶、5-甲酰基尿嘧啶或顺-syn-环丁烷嘧啶二聚体。至少一个核苷酸优选地是来自悬突的10个核苷酸或更少。至少一个核苷酸是悬突中的第一个核苷酸。悬突中的所有核苷酸优选地包含不存在于模板聚核苷酸中的核苷。

这些基于mua的方法公开于国际申请第pct/gb2014/052505号中。其还在英国申请第1406147.7号中详细论述。

在一或多个解螺旋酶与双链聚核苷酸和mua转座酶接触之前,所述一或多个解螺旋酶可连接于穆阿底物y衔接子。替代地,在一或多个解螺旋酶与双链聚核苷酸和mua转座酶接触之前,所述一或多个解螺旋酶可连接于mua底物y衔接子。

在一或多个分子制动器与双链聚核苷酸和mua转座酶接触之前,所述一或多个分子制动器可连接于mua底物发夹环衔接子。替代地,在一或多个分子制动器与双链聚核苷酸和mua转座酶接触之前,所述一或多个分子制动器可连接于mua底物发夹环衔接子。

解偶联

本发明的方法可涉及表征多个靶聚核苷酸和解偶联至少第一靶聚核苷酸。

在一优选实施例中,本发明涉及表征两个或更多个靶聚核苷酸。方法包含:

(a)在第一样本中提供第一聚核苷酸;

(b)在第二样本中提供第二聚核苷酸;

(c)使用一或多个锚,将第一样本中的第一聚核苷酸与膜偶联;

(d)使第一聚核苷酸与本发明的孔接触,使得聚核苷酸相对于(如通过)孔移动;

(e)在第一聚核苷酸相对于所述孔移动时,进行一或多个测量,其中测量指示第一聚核苷酸的一或多个特征,且从而表征第一聚核苷酸;

(f)将第一聚核苷酸从膜解偶联;

(g)使用一或多个锚,将第二样本中的第二聚核苷酸与膜偶联;

(h)使第二聚核苷酸与本发明的孔接触,使得第二聚核苷酸相对于(如通过)孔移动;和

(i)在第二聚核苷酸相对于孔移动时,进行一或多个测量,其中测量指示第二聚核苷酸的一或多个特征,且从而表征第二靶聚核苷酸。

这种方法类型在英国申请第1406155.0号中详细论述。

可以在步骤(g)(即在使第二聚核苷酸与膜偶联之前)之前,进行步骤(f)(即将第一聚核苷酸解偶联)。可以在步骤(f)之前进行步骤(g)。如果在第一聚核苷酸解偶联之前,第二聚核苷酸与膜偶联,那么步骤(f)优选地包含选择性地将第一聚核苷酸从膜解偶联(即从膜解偶联第一聚核苷酸但不解偶联第二聚核苷酸)。所属领域的技术人员可设计其中实现选择性解偶联的系统。可以在同时进行步骤(f)和(g)。这一点在下文更详细论述。

在步骤(f)中,至少10%的第一聚核苷酸优选地从膜解偶联。举例来说,至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%或至少95%的第一聚核苷酸可以从膜解偶联。优选地,所有的第一聚核苷酸均从膜解偶联。可使用孔来测定从膜解偶联的第一聚核苷酸的量。这公开于实例中。

第一聚核苷酸和第二聚核苷酸可彼此不同。替代地,第一和第二聚核苷酸可以是不同的聚核苷酸。在此类情况下,不需要在添加第二聚核苷酸之前移除至少一部分的第一样本。这一点在下文更详细论述。如果方法涉及研究三个或更多个聚核苷酸,那么其所有均可以彼此不同,或其中一些可以彼此不同。

第一聚核苷酸和第二聚核苷酸可以是相同聚核苷酸的两个例子。第一聚核苷酸可以与第二聚核苷酸相同。这允许校对。如果方法涉及研究三个或更多个聚核苷酸,那么其所有均可以所有相同聚核苷酸的三个或更多个例子,或其中一些可以是相同聚核苷酸的独立例子。

第一样本和第二样本可以彼此不同。举例来说,第一样本可来源于人类,且第二样本可来源于病毒。如果第一和第二样本彼此不同,那么其可含有或疑似含有相同的第一和第二聚核苷酸。如果方法涉及研究三个或更多个样本,那么其所有均可以彼此不同,或其中一些可以彼此不同。

第一样本和第二样本优选地是相同样本的两个例子。第一样本优选地与第二样本相同。这允许校对。如果方法涉及研究三个或更多个样本,那么其所有均可以是相同样本的三个或更多个例子,或其中一些可以是相同样本的独立例子。

可研充任何数量的聚核苷酸。举例来说,本发明的方法可涉及表征3、4、5、6、7、8、9、10、20、30、50、100或更多个聚核苷酸。如果使用本发明的方法研究三个或更多个聚核苷酸,那么第二聚核苷酸也从膜解偶联,且对于第三聚核苷酸添加必需的步骤数。对于四个或更多个聚核苷酸来说,也是如此。

本发明的方法涉及从膜解偶联第一聚核苷酸。如果研究三个或更多个聚核苷酸,那么本发明的方法可涉及从膜解偶联第二聚核苷酸。

可使用任何已知方法,从膜解偶联第一聚核苷酸。优选地在步骤(f)中使用跨膜孔,不从膜解偶联第一聚核苷酸。优选地使用电压或施加的电势,不从膜解偶联第一聚核苷酸。

步骤(f)优选地包含通过从膜移除一或多个锚来从膜解偶联第一聚核苷酸。如果移除锚,那么使用其它(或独立)锚将第二聚核苷酸与膜偶联。用于偶联第二聚核苷酸的锚可以是与偶联第一聚核苷酸相同的锚类型或不同的锚类型。

步骤(f)更优选地包含使一或多个锚与对于所述一或多个锚具有比膜对于锚具有的亲和力更高的亲和力的药剂接触。用于竞争性结合或免疫放射分析以测定分子的特异性结合能力的各种方案在所属领域中是众所周知的(参见例如maddox等人,《实验医学杂志(j.exp.med.)》158,1211-1226,1993)。药剂将锚从膜移除,且从而解偶联第一聚核苷酸。药剂优选地是糖。可使用以比一或多个锚对于膜具有的亲和力更高的亲和力结合于一或多个锚的任何糖。糖可以是如下文所论述的环糊精或其衍生物。

如果一或多个锚包含疏水性锚(如胆固醇),那么药剂优选地是环糊精一其衍生物或脂质。环糊精或其衍生物可以是在eliseev,a.v.和schneider,h-j.(1994)《美国化学学会杂志》116,6081-6088中所公开那些化合物中的任一个。药剂更优选地是七-6-氨基-β-环糊精(am7-βcd)、6-单脱氧-6-单氨基-β-环糊精(am1-cd)或七-(6-脱氧-6-胍基)-环糊精(gu7-βcd)。可使用本文所公开的任一个脂质。

如果锚包含抗生蛋白链菌素、生物素或脱硫生物素,那么药剂优选地是生物素、脱硫生物素或抗生蛋白链菌素。生物素和脱硫生物素两个均以比抗生蛋白链菌素结合于膜更高的亲和力结合于抗生蛋白链菌素,且反之亦然。生物素对于抗生蛋白链菌素比脱硫生物素具有更强的亲和力。因此,可使用生物素或抗生蛋白链菌素从膜移除包含抗生蛋白链菌素的锚,且反之亦然。

如果锚包含蛋白质,那么药剂优选地是特异性结合于蛋白质的抗体或其片段。如果抗体以优先或高亲和力结合于蛋白质,但并不结合或仅以很低的亲和力结合于其它或不同蛋白质,那么抗体特异性结合于蛋白质。如果抗体以1×10-6m或更少,更优选地1×10-7m或更少、5×10-8m或更少,更优选地1×10-8m或更少或更优选地5×10-9m或更少的kd结合,那么所述抗体以优先或高亲和性结合。如果抗体以1×10-6m或更多,更优选地1×10-5m或更多,更优选地1×10-4m或更多,更优选地1×10-3m或更多,甚至更优选地1×10-2m或更多的kd结合,那么所述抗体以很低的亲和力结合。任何方法可用于检测结合或特异性结合。定量测量抗体与蛋白质的结合的方法在所属领域中是众所周知的。抗体可以是单克隆抗体或多克隆抗体。合适的抗体片段包括(但不限于)fv、f(ab′)和f(ab′)2片段以及单链抗体。此外,抗体或其片段可以是嵌合抗体或其片段、cdr-接枝抗体或其片段或人源化抗体或其片段。

步骤(f)优选地包含使一或多个锚与药剂接触,所述药剂降低所述一或多个锚与膜偶联的能力。举例来说,药剂可干扰一或多个锚的结构和/或疏水性,且从而降低其与膜偶联的能力。如果锚包含胆固醇,那么药剂优选地是胆固醇脱氢酶。如果锚包含脂质,那么药剂优选地是磷脂酶。如果锚包含蛋白质,那么药剂优选地是蛋白酶或脲。合适锚与药剂的其它组合对于所属领域的技术人员将是清楚的。

步骤(f)优选地包含通过从一或多个锚分离第一聚核苷酸来从膜解偶联第一聚核苷酸。这可以任何手段来进行。举例来说,可以在包含连接子的锚中剪切连接子。这个实施例特别适用于涉及通过杂交连接的锚。此类锚在上文论述。

步骤(f)更优选地包含通过使第一聚核苷酸和一或多个锚与药剂接触来从膜解偶联第一聚核苷酸,所述药剂与第一聚核苷酸竞争与一或多个锚结合。用于测定和测量竞争性结合的方法在所属领域中是已知的。药剂优选地是与第一聚核苷酸竞争与一或多个锚杂交的聚核苷酸。举例来说,如果使用涉及杂交的一或多个锚来使第一聚核苷酸与膜偶联,那么可通过使一或多个锚与也与杂交位点杂交的聚核苷酸接触来解偶联聚核苷酸。通常以高于第一聚核苷酸和一或多个锚的浓度的浓度,来添加聚核苷酸药剂。替代地,聚核苷酸药剂可比第一聚核苷酸更强烈地与一或多个锚杂交。

步骤(f)更优选地包含:(i)使第一聚核苷酸和一或多个锚与脲、三(2-羧乙基)膦(tcep)、二硫苏糖醇(dtt)、抗生蛋白链菌素或生物素、uv光、酶或结合剂接触;(ii)将第一聚核苷酸和一或多个锚加热;或(iii)改变ph。脲、三(2-羧乙基)膦(tcep)或二硫苏糖醇(dtt)能够破坏锚且从膜分离第一聚核苷酸。如果锚包含抗生蛋白链菌素-生物素连接,那么抗生蛋白链菌素药剂将竞争与生物素结合。如果锚包含抗生蛋白链菌素-脱硫生物素连接,那么生物素药剂将竞争与抗生蛋白链菌素结合。uv光可用于分解光不稳定性基团。酶和结合剂可用于剪切、分解或拆开锚。优选酶包括(但不限于)核酸外切酶、核酸内切酶或解螺旋酶。优选结合剂包括(但不限于)酶、抗体或其片段或单链结合蛋白(ssb)。可使用下文论述的酶或上文所论述的抗体中的任一个。加热和ph可用于破坏杂交和其它连接。

如果通过从一或多个锚分离第一聚核苷酸来从膜解偶联第一聚核苷酸,那么一或多个锚将残留在膜中。步骤(g)优选地包含使用从第一聚核苷酸分离的一或多个锚,来使第二聚核苷酸与膜偶联。举例来说,第二聚核苷酸还可具备与残留于膜中的一或多个锚杂交的一或多个聚核苷酸。替代地,步骤(g)优选地包含使用来自从第一聚核苷酸分离的一者(即一或多个其它锚)的一或多个独立锚,来使第二聚核苷酸与膜偶联。所述一或多个独立锚可以是与用于使第一聚核苷酸与膜偶联的锚相同的锚类型,或可以是不同的锚类型。步骤(g)优选地包含使用来自从第一聚核苷酸分离的一或多个锚的一或多个不同锚,来使第二聚核苷酸与膜偶联。

在一优选实施例中,步骤(f)和(g)包含通过使膜与第二聚核苷酸接触,来从膜解偶联第一聚核苷酸,使得第二聚核苷酸与第一聚核苷酸竞争与一或多个锚结合,且置换第一聚核苷酸。举例来说,如果使用涉及杂交的一或多个锚来使第一聚核苷酸与膜偶联,那么可通过使锚与连接于也与一或多个锚中的杂交位点杂交的聚核苷酸的第二聚核苷酸接触,来解偶联第一聚核苷酸。通常以高于第一聚核苷酸和一或多个锚的浓度的浓度,来添加第二聚核苷酸。替代地,第二聚核苷酸可比第一聚核苷酸更强烈地与一或多个锚杂交。

移除或洗涤

尽管在步骤(f)中从膜解偶联第一聚核苷酸,但不必移除或洗掉。如果第二聚核苷酸可容易地区别于第一聚核苷酸,那么不需要移除第一聚核苷酸。

在步骤(f)与(g)之间,方法优选地进一步包含从膜移除至少一些第一样本。可移除至少10%的第一样本,如可移除至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的第一样本。

方法更优选地进一步包含从膜移除所有的第一样本。这可以任何方式来进行。举例来说,可在已解偶联第一聚核苷酸之后,用缓冲液来洗涤膜。合适缓冲液在下文论述。

经修饰聚核苷酸

在表征之前,可通过在使用靶聚核苷酸作为模板,聚合酶形成经修饰聚核苷酸的条件下,使聚核苷酸与聚合酶和游离核苷酸群体接触,来对靶聚核苷酸进行修饰,其中当形成经修饰聚核苷酸时,聚合酶用不同核苷酸物种置换靶聚核苷酸中的一或多个核苷酸物种。接着,经修饰聚核苷酸可具备连接于聚核苷酸的一或多个解螺旋酶和连接于聚核苷酸的一或多个分子制动器。这种修饰类型描述于英国申请第1403096.9号中。可使用上文所论述的任一个聚合酶。聚合酶优选地是klenow或9onorth。

在使用模板聚核苷酸作为模板,聚合酶形成经修饰聚核苷酸的条件下,使模板聚核苷酸与聚合酶接触。此类条件是本领域中已知的。举例来说,通常使聚核苷酸与含聚合酶的可商购的聚合酶缓冲液接触,所述缓冲液如来自newengland的缓冲液。对于klenow的温度优选地是20到37℃,或对于9onorth的是60到75℃。引物或3′发夹通常用作聚合酶延伸的成核点。

使用跨膜孔表征(如测序)聚核苷酸通常涉及分析由k个核苷酸构成的聚合物单元,其中k是正整数(即‘k-聚体’)。这一点在国际申请第pct/gb2012/052343号(公开为wo2013/041878)号中论述。尽管期望在不同聚体的电流测量之间具有清楚的分隔,但这些测量中的一些重叠是常见的。尤其在k聚体中用高数量的聚合物单元,即高的k值,可能变得难以解析由不同k聚体产生的测量,损害关于聚核苷酸的推导信息,例如聚核苷酸的潜在序列的评估。

通过用经修饰聚核苷酸中的不同核苷酸物种来置换靶聚核苷酸中的一或多个核苷酸物种,经修饰聚核苷酸含有不同于靶聚核苷酸中的那些k聚体的k聚体。经修饰聚核苷酸中的不同k聚体能够从靶聚核苷酸中的k聚体产生不同的电流测量,且因此经修饰聚核苷酸提供来自靶聚核苷酸的不同信息。来自经修饰聚核苷酸的额外信息可使得其更容易表征靶聚核苷酸。在一些例子中,经修饰聚核苷酸自身可以更容易进行表征。举例来说,经修饰聚核苷酸可以设计成包括在其电流测量之间具有增加的分隔或清楚的分隔的k聚体,或具有噪声减少的k聚体。

当形成经修饰聚核苷酸时,聚合酶优选地用不同核苷酸物种置换靶聚核苷酸中的两个或更多个核苷酸物种。聚合酶可用独特的核苷酸物种置换靶聚核苷酸中的两个或更多个核苷酸物种中的每一个。聚合酶可用相同的核苷酸物种置换靶聚核苷酸中的两个或更多个核苷酸物种中的每一个。

如果靶聚核苷酸是dna,那么经修饰聚核苷酸中的不同核苷酸物种通常包含不同于腺嘌呤、鸟嘌呤、胸腺嘧啶、胞嘧啶或甲基胞嘧啶的核碱基,和/或包含不同于脱氧腺苷、脱氧鸟苷、胸苷、脱氧胞苷或脱氧甲基胞苷的核苷。如果靶聚核苷酸是rna,那么经修饰聚核苷酸中的不同核苷酸物种通常包含不同于腺嘌呤、鸟嘌呤、尿嘧啶、胞嘧啶或甲基胞嘧啶的核碱基,和/或包含不同于腺苷、鸟苷、尿苷、胞苷或甲基胞苷的核苷。不同核苷酸物种可以是上文所论述的任一个通用核苷酸。

聚合酶可用不同核苷酸物种来置换一或多个核苷酸物种,所述不同核苷酸物种包含一或多个核苷酸物种缺乏的化学基团或原子。化学基团可以是丙炔基、硫基、氧代基、甲基、羟甲基、甲酰基、羧基、羰基、苯甲基、炔丙基或炔丙胺基。

聚合酶可用不同核苷酸物种来置换一或多个核苷酸物种,所述不同核苷酸物种缺乏一或多个核苷酸物种中存在的化学基团或原子。聚合酶可用具有电负性改变的不同核苷酸物种来置换核苷酸物种中的一或多个。具有电负性改变的不同核苷酸物种优选地包含卤素原子。

方法优选地进一步包含从经修饰聚核苷酸中的一或多个不同核苷酸物种选择性地移除核碱基。

分析物递送

靶分析物优选地连接于将分析物递送向膜的微粒。这种递送类型公开于英国申请第1418469.1号中。

可使用任何类型的微粒和连接方法。

其它表征方法

在另一实施例中,利用聚合酶通过检测向靶聚核苷酸中添加的标记物种,来表征聚核苷酸,且接着释放。聚合酶使用聚核苷酸作为模板。各标记的物种对各核苷酸具有特异性。使聚核苷酸与本发明的孔(如本发明的孔)、聚合酶和标记核苷酸接触,使得磷酸标记的物种通过聚合酶依序添加到靶聚核苷酸中,其中磷酸物种含有对各核苷酸具有特异性的标记。可在从核苷酸释放标记物种之前(即在靶聚核苷酸向中添加其时),或在从核苷酸释放其之后,使用孔来检测标记物种。

聚合酶可以是上文所论述的那些聚合酶中的任一个。使用孔检测磷酸标记物种,且从而表征聚核苷酸。这种方法类型公开于欧洲申请第13187149.3(公开为ep2682460)号中。上文所论述的任一个实施例同样应用于这种方法。

标记物种的实例包括(但不限于)聚合物、聚乙二醇、糖、环糊精、荧光团、药物、代谢物、肽。此类标签的非限制性实例可在kumar等人《科学研究(scirep.)》2012;2:684.电子版2012年9月21的研究中找到。

形成传感器的方法

本发明还提供一种形成用于表征靶聚核苷酸的传感器的方法。方法包含在本发明的孔与聚核苷酸结合蛋白(如解螺旋酶或核酸外切酶)之间形成复合体。可通过在存在靶聚核苷酸下使孔和蛋白质接触且接着在孔两端施加电势,来形成复合体。所施加的电势可以是如上文所描述的化学势或电压电势。替代地,可通过将孔共价连接于蛋白质来形成复合体。用于共价连接的方法在所属领域中是已知的,且例如公开于国际申请第pct/gb09/001679号(公开为wo2010/004265)和第pct/gb10/000133号(公开为wo2010/086603)中。复合体是用于表征靶聚核苷酸的传感器。方法优选地包含在本发明的孔与解螺旋酶之间形成复合体。上文所论述的任一个实施例同样应用于这种方法。

本发明还提供一种用于表征靶聚核苷酸的传感器。传感器包含在本发明的孔与聚核苷酸结合蛋白之间的复合体。上文所论述的任一个实施例同样应用于本发明的传感器。

试剂盒

本发明还提供一种用于表征靶聚核苷酸的试剂盒。试剂盒包含本发明的孔和膜的组分。膜优选地由组分形成。孔优选地存在于膜中。试剂盒可包含上文所公开的任一个膜(如两亲层或三嵌段共聚物膜)的组分。

试剂盒可进一步包含聚核苷酸结合蛋白。可使用上文所论述的任一个聚核苷酸结合蛋白。

试剂盒可进一步包含用于使聚核苷酸与膜偶联的一或多个锚。

试剂盒优选地是用于表征双链聚核苷酸,并优选地包含y衔接子和发夹环衔接子。y衔接子优选地具有所连接的一或多个解螺旋酶,且发夹环衔接子优选地具有所连接的一或多个分子制动器。y衔接子优选地包含用于使聚核苷酸与膜偶联的一或多个第一锚,发夹环衔接子优选地包含用于使聚核苷酸与膜偶联的一或多个第二锚,且发夹环衔接子与膜偶联的强度优选地大于y衔接子与膜偶联的强度。

本发明的试剂盒可另外包含使得能够进行上文提到的任一个实施例的一或多个其它试剂或仪器。此类试剂或仪器包括以下中的一或多个:合适缓冲液(水性溶液)、从个体获得样本的装置(如包含针的容器或仪器)、用于扩增和/或表达聚核苷酸的装置,或电压或贴片钳设备。试剂可以干态形式存在于试剂盒中,使得流体样本再悬浮试剂。试剂盒还可任选地包含使得能够用本发明的方法使用试剂盒的说明书或关于何种生物体可使用所述方法的详情。

设备

本发明还提供一种用于表征靶分析物(如靶聚核苷酸)的设备。设备包含多个本发明的孔和多个膜。多个孔优选地存在于多个膜中。孔和膜的数量优选地是相等的。优选地,各膜中存在单一孔。

设备优选地进一步包含用于进行本发明的方法的说明书。设备可以是用于分析物分析的任何常规设备,如阵列或芯片。上文参考本发明的方法所论述的任一个实施例同样适用于本发明的设备。设备可进一步包含存在于本发明的试剂盒中的任一个特征。

设备优选地安设成进行本发明的方法。

设备优选地包含:

传感器装置,其能够支撑多个孔和膜,所述传感器装置能够操作以使用孔和膜来执行分析物表征;和

至少一个通口,其用于递送执行表征用材料。

替代地,设备优选地包含:

传感器装置,其能够支撑多个孔和膜,所述传感器装置能够操作以使用孔和膜来执行分析物表征;和

至少一个储槽,其用于盛放执行表征用材料。

设备更优选地包含:

传感器装置,其能够支撑多个孔和膜,所述传感器装置能够操作以使用孔和膜来执行分析物表征;

至少一个储槽,其用于盛放执行表征用材料;

流控系统,其配置成可控地从至少一个储槽供应材料到传感器装置;和

一个或多个容器,其用于容纳相应样本,所述流控系统配置成选择性地从一个或多个容器供应样本到传感器装置。

设备可以是在国际申请第pct/gb08/004127号(公开为wo2009/077734)、第pct/gb10/000789号(公开为wo2010/122293)、国际申请第pct/gb10/002206号(公开为wo2011/067559)或国际申请第pct/us99/25679号(公开为wo00/28312)中所描述的任一种设备。

以下实例说明本发明。

实例1

本实例描述研究在csgg内的dna行为所进行的模拟。

材料和方法

进行所操控的分子动态模拟,以研究csgg-eco和各种突变对于dna易位的高能屏障的量值。使用gromacs程序包4.0.5版,利用gromos53a6力场和spc水模型来进行模拟。csgg-eco(seqidno:2)的结构取自蛋白质数据库登录号4uv3。为了制备csgg-eco突变的模型,使用pymol对野生型蛋白质结构进行突变。所研究的突变是csgg-eco-(f56a))(具有突变f56a的seqidno:2)、csgg-eco-(f56a-n55s)(具有突变f56a/n55s的seqidno:2)和csgg-eco-(f56a-n55s-y51a)(具有突变f56a/n55s/y51a的seqidno:2)。

接着,将dna放置到孔中。安设两个不同系统:

i.将单一鸟嘌呤核苷酸放置到孔中,恰好在收缩区上(大致残基56环上方的5-10埃)

ii.沿孔轴放置单链dna(ssdna),其中5′端朝向孔的β-折叠桶侧。在这种安设中,ssdna预先螺旋到孔的整个长度中。

接着,将模拟盒溶剂化,且接着使用最陡下降算法使能量降至最低。

使用到300k的berendsen恒温器和berendsen恒压器,在npt集中模拟各系统。在整个模拟中,对于孔的主链应用限制。

为了牵拉dna通过孔,在单一鸟嘌呤模拟中,对于磷原子施加拉力。在ssdna模拟中,对于链的5′端处的磷原子施加拉力。通过在上文提到的dna磷原子与以恒定速度平行于孔轴行进的假想点之间连接弹簧,以恒定速度来施加拉力。应注意,弹簧并不具有任何形状也不确实使其进行任何流体动力学拖拽。弹簧常数等于

结果

单一g易位

如图3中所示,拉力相对于时间的图展现,对于核苷酸进入野生型csgg-eco孔中的苯丙氨酸残基f56的环,存在很大的屏障。对于针对所研究的csgg-eco突变观测到的鸟嘌呤易位,无明显屏障。

ssdna易位

对于ssdna易位,每孔进行两个模拟,其中各回合具有不同的施加的牵拉速度()。如图4中所展示,其示出较快牵拉速度模拟,csgg野生型孔需要最大的拉力来实现ssdna易位。如图5所示,其示出较慢牵拉速度模拟,csgg-eco(野生型,seqidno:2)和csgg-eco-(f56a)孔两个均需要最大的施加力来实现ssdna易位。在ssdna易位通过csgg和mspa基线孔所需的拉力之间进行比较,表明csgg孔的突变需要允许类似的ssdna易位的水平。

实例2

本实例描述若干csgg突变的表征。

材料和方法

在设置实验之前,将dna构筑体x(最终浓度0.1nm,参见图13对于构筑体x的草图表示和描述)与t4dda-e94c/c109a/c136a/a360c(具有突变e94c/c109a/c136a/a360c的seqidno:24,添加到纳米孔系统的最终浓度是10nm,其是以于缓冲液(151.5mmkcl,25mm磷酸钾,5%甘油,ph7.0,1mmedta)中的形式提供),在室温下预先培育五分钟。在五分钟之后,向预混合物中添加tmad(100μm),且将混合物另外培育5分钟。最终,向预混合物中添加mgcl2(添加到纳米孔系统的最终浓度是1.5mm)、atp(添加到纳米孔系统的最终浓度是1.5mm)、kcl(添加到纳米孔系统的最终浓度是500mm)和磷酸钾缓冲液(添加到纳米孔系统的最终浓度是25mm)。

从插入在含嵌段共聚物的缓冲液(25mm磷酸钾缓冲液,150mm亚铁(ii)氰化钾,150mm铁(iii)氰化钾,ph8.0)中的各种单一csgg纳米孔获得电测量。在达到插入在嵌段共聚物中的单一孔之后,接着缓冲液(2ml,25mm磷酸钾缓冲液,150mm亚铁(ii)氰化钾,150mm铁(iii)氰化钾,ph8.0)流过系统,移除任何过量的csgg纳米孔。接着,使150μl的500mmkcl、25mm磷酸钾、1.5mmmgcl2、1.5mmatp、ph8.0流过系统。在10分钟之后,使150μl的500mmkcl、25mm磷酸钾、1.5mmmgcl2、1.5mmatp、ph8.0流过系统,且接着酶(t4dda-e94c/c109a/c136a/a360c,10nm最终浓度)、dna构筑体x(0.1nm,最终浓度)、燃料(mgcl2,1.5mm最终浓度;atp,1.5mm最终浓度)的预混合物(总共150μl)流动到单一纳米孔实验系统中。实验是在-120mv下进行,且进行解螺旋酶控制的dna移动监测。

结果

显示范围增加的孔(图6到8和图18到30)

csgg-eco-(strepii(c))(seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)具有~10pa的范围(参见图6(a)),而以下的csgg-eco孔突变呈现增加的电流范围:

1-csgg-eco-(y51n-f56a-d149n-e185r-e201n-e203n-strepii(c))9(具有突变y51n/f56a/d149n/e185r/e201n/e203n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~30pa的范围(参见图6(b))。

2-csgg-eco-(n55a-strepii(c))9(具有突变n55a的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~35pa的范围(参见图6(c))。

3-csgg-eco-(n55s-strepii(c))9(具有突变n55s的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~40pa的范围(参见图7(a))。

4-csgg-eco-(y51n-strepii(c))9(具有突变y51n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~40pa的范围(参见图7(b))。

5-csgg-eco-(y51a-f56a-strepii(c))9(具有突变y51a/f56a的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~30pa的范围(参见图7(c))。

6-csgg-eco-(y51a-f56n-strepii(c))9(具有突变y51a/f56n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~20pa的范围(参见图8(a))。

7-csgg-eco-(y51a-n55s-f56a-strepii(c))9(具有突变y51a/n55s/f56a的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~30pa的范围(参见图8(b))。

8-csgg-eco-(y51a-n55s-f56n-strepii(c))9(具有突变y51a/n55s/f56n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~30pa的范围(参见图8(c))。

13-csgg-eco-(f56h-strepii(c))9(具有突变f56h的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~35pa的范围(参见图18)。

14-csgg-eco-(f56q-strepii(c))9(具有突变f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~40pa的范围(参见图19)。

15-csgg-eco-(f56t-strepii(c))9(具有突变f56t的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~35pa的范围(参见图20)。

16-csgg-eco-(s54p/f56a-strepii(c))9(具有突变s54p/f56a的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~35pa的范围(参见图21)。

17-csgg-eco-(y51t/f56a-strepii(c))9(具有突变y51t/f56a的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~30pa的范围(参见图22)。

18-csgg-eco-(f56p-strepii(c))9(具有突变f56p的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~30pa的范围(参见图23)。

19-csgg-eco-(f56a-strepii(c))9(具有突变f56a的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~40pa的范围(参见图24)。

20-csgg-eco-(y51t/f56q-strepii(c))9(具有突变y51t/f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~30pa的范围(参见图25)。

21-csgg-eco-(n55s/f56q-strepii(c))9(具有突变n55s/f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~35pa的范围(参见图26)。

22-csgg-eco-(y51t/n55s/f56q-strepii(c))9(具有突变y51t/n55s/f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~35pa的范围(参见图27)。

23-csgg-eco-(f56q/n102r-strepii(c))9(具有突变f56q/n102r的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~30pa的范围(参见图28)。

24-csgg-eco-(y51q/f56q-strepii(c))9(具有突变y51q/f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~40pa的范围(参见图29)。

25-csgg-eco-(y51a/f56q-strepii(c))9(具有突变y51a/f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)呈现~35pa的范围(参见图30)。

显示输送量增加的孔(图9和10)

如可从图9和10看出,以下突变孔(以下9-12)呈现在4小时中多个解螺旋酶控制的dna移动(在图9和10中标记为x)每通道,而图9中显示的csgg-eco-(strepii(c))(seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)(a)通常呈现在4小时中仅1或2个解螺旋酶控制的dna移动(在图9(a)中标记为x)每通道,且相反呈现延长的块区(在图9(a)中标记为y)。

9-csgg-eco-(d149n-e185n-e203n-strepii(c))9(具有突变d149n/e185n/e203n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)(图9(b))

10-csgg-eco-(d149n-e185n-e201n-e203n-strepii(c))9(具有突变d149n/e185n/e201n/e203n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)(图9(c))

11-csgg-eco-(d149n-e185r-d195n-e201n-e203n)-strepii(c))9(具有突变d149n/e185r/d195n/e201n/e203n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)(图10(a))

12-csgg-eco-(d149n-e185r-d195n-e201r-e203n)-strepii(c))9(具有突变d149n/e185r/d195n/e201r/e203n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)(图10(b))

显示插入增加的孔(图11和12)

如可通过比较图11和12看出,图12中显示的突变孔csgg-eco-(t150i-strepii(c))9(具有突变t150i的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接),存在于膜中,所述膜的孔数量相较于csgg-eco-(strepii(c))(seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)孔(图11中显示)增加(~4-5倍)。图11和12中的箭头说明在4小时实验中插入到嵌段共聚物中的csgg-eco纳米孔的数量(图11中,130-140;且在图12中1-11,各自对应于独立纳米孔实验)。多余csgg-eco-(strepii(c))(seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接),三个实验显示插入一个纳米孔,而对于突变孔(csgg-eco-(t150i-strepii(c))9),各实验显示插入至少一个纳米孔,且若干实验显示多个孔插入。

实例3

本实例描述研究用于纯化csgg孔的大肠杆菌纯化方法。

材料和方法

在美国金斯瑞公司(genscriptusainc.)中合成编码多肽pro-csgg-eco-(strepii(c))(seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接,且其中pro是seqidno:48,且在n端处连接)的dna,且克隆到含有胺苄青霉素抗性基因的pt7载体中。通过异丙基β-d-1-硫代半乳糖吡喃糖苷(iptg)来诱导pt7载体的蛋白表达。将dna溶液的浓度调整到400ng/μl。dna(1μl)用于转化lemo21(de3)感受态大肠杆菌细胞(50μl,neb,目录号c2528h)。在转化之前,从lemo21(de3)细胞(德国的基因桥公司(genebridgesgmbh))敲除csgg基因。接着,将细胞向外涂铺在含有胺苄青霉素(0.1mg/ml)的lb琼脂上,且在37℃下培育大致16小时。

使细菌菌落在含有胺苄青霉素的lb板上生长,并入csgg质粒。一个此类菌落用于接种含有羧苄青霉素(0.1mg/ml)的lb培养基的起子培养物(100ml)。使起子培养物在37℃、搅动下生长,直到od600达到1.0-1.2为止。起子培养物用于接种含有羧苄青霉素(0.1mg/ml)和鼠李糖(500μm)的新鲜500mllb培养基,直到o.d.600为0.1。使培养物在37℃、搅动下生长,直到od600达到0.6为止。接着,调整培养物的温度到18℃,且通过添加iptg(0.2mm最终浓度)来起始诱导。在18℃、搅动下,进行诱导大致18小时。

在诱导之后,通过在6,000g下离心30分钟,来集结培养物。将集结粒再悬浮于50mmtris、300mmnacl、含有蛋白酶抑制剂(默克密理博公司539138)、benzonase核酸酶(西格玛公司e1014)和1×bugbuster(默克密理博公司70921)ph8.0(大致10ml缓冲液每克集结粒)中。将悬浮液充分混合,直到其完全均匀为止,接着将样本转移到4℃下的辊式混合器大致5小时。通过在20,000g下离心45分钟来使裂解物集结,且通过0.22μmpes针筒过滤器来过滤上清液。向上获取含有csgg的上清液(称为样本1),以用于通过柱色谱纯化。

样本1应用于5mlstreptrap柱(通用电气医疗集团)。用25mmtris、150mmnacl、2mmedta、0.01%ddmph8来洗涤柱,直到维持10柱体积的稳定基线为止。接着,在返回到150mm缓冲液之前,用25mmtris、2mnacl、2mmedta、0.01%ddmph8来洗涤柱。用10mm脱硫生物素进行洗脱。csgg蛋白的streptrap(通用电气医疗集团)纯化的色谱迹线的实例显示于图14中。洗脱峰标记为e1。图15显示在初始strep纯化之后csgg-eco蛋白的典型sds-page观测的实例。泳道1-3显示含有如由箭头指示的csgg蛋白的主要洗脱峰(图14中的标记e1)。泳道4-6对应于含有杂质的主要洗脱峰(图14中的标记e1)尾部的洗脱份。

合并洗脱峰值,且加热到65℃维持15分钟以移除热不稳定的受污染的蛋白质。在20,000g下对加热的溶液进行离心10分钟,且丢弃集结粒。在120ml葡聚糖凝胶s200柱(通用电气医疗集团)上在25mmtris、150mmnacl、2mmedta、0.01%ddm、0.1%sdsph8中对上清液进行凝胶过滤。在220nm下进行监测,这是归因于蛋白质的低色氨酸组成。在大致55ml体积下洗脱样本(图16显示55ml样本峰(用星形标记)的尺寸排阻柱迹线)。在4-20%tgx上进行洗脱峰(参见图17,伯乐公司),以确认所关注的csgg-eco-(strepii(c))(seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)的孔的存在。合并经鉴定级分,且通过50kdamicon离心柱浓缩。

实例4

本实例描述为研究csgg-eco-(y51t/f56q)-strepii(c))9(具有突变y51t/f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接,孔突变第20号)与t4dda-(e94c/c109a/c136a/a360c)(具有突变e94c/c109a/c136a/a360c且接着(δm1)g1g2的seqidno:24)之间的相互作用进行的模拟。

模拟方法

使用gromacs程序包4.0.5版,利用gromos53a6力场和spc水模型来进行模拟。

csgg-eco-(y51t/f56q)-strepii(c))9(具有突变y51t/f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接,孔突变第20号)模型是基于在蛋白质数据库登录号4uv3和4q79中发现的csgg的晶体结构。使用pymol制备相关突变。接着,使用最陡下降算法,使所得孔模型能量降至最低。t4dda-(e94c/c109a/c136a/a360c))(具有突变e94c/c109a/c136a/a360c且接着(δm1)g1g2的seqidno:24)模型是基于蛋白质数据库登录号3upu中发现的dda1993结构。同样,使用pymol制备相关突变,且使用最陡下降算法使模型能量降至最低。

接着,将t4dda-(e94c/c109a/c136a/a360c)(具有突变e94c/c109a/c136a/a360c且接着(δm1)g1g2的seqidno:24)模型放置在csgg-eco-(y51t/f56q)-strepii(c))9(具有突变y51t/f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接,孔突变第20号)上。用不同的初始酶构形进行三个模拟(回合1到3(0ns),参见图31):

在所有酶构形中,定位酶,使得dna的5′端指向孔,且酶在整个模拟中不受限制。孔主链受限制,且使模拟盒溶剂化。使用到300k的berendsen恒温器和berendsen恒压器,在npt集中模拟系统40ns。

使用gromacs分析软件以及本地写入码两个来分析酶与孔之间的接触。下表显示对于孔和酶氨基酸两个所观测到的接触的数量。表6-8显示孔上的氨基酸接触点,所述氨基酸接触点与酶上的氨基酸接触点相互作用。在三分之二的模拟中,酶在孔上倾斜(参见回合2和3(20、30和40ns),图31和32)。回合1显示,酶尚未倾斜,且因此在表6中显示具有高的相互作用的点可进行优化,以增加孔帽上的酶稳定性。

表6=回合1,酶和孔接触相互作用

表7=回合2,酶和孔接触相互作用

表8=回合3,酶和孔接触相互作用

实例5

本实例描述为了研究以下之间的相互作用而进行的模拟:a)csgg-eco-(y51a/f56q)-strepii(c))9(具有突变y51a/f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接,孔突变第25号)与t4dda-(e94c/f98w/c109a/c136a/k194l/a360c)(具有突变e94c/f98w/c109a/c136a/k194l/a360c且接着(δm1)g1g2的seqidno:24)之间,和b)csgg-eco-(y51a/f56q/r97w)-strepii(c))9(具有突变y51a/f56q/r97w的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接,孔突变第26号)与t4dda-(e94c/f98w/c109a/c136a/k194l/a360c)(具有突变e94c/f98w/c109a/c136a/k194l/a360c且接着(δm1)g1g2的seqidno:24)之间。

模拟方法

如实例4中所描述进行模拟。

csgg-eco-(y51a/f56q)-strepii(c))9(具有突变y51a/f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接,孔突变第25号)和csgg-eco-(y51a/f56q/r97w)-strepii(c))9(具有突变y51a/f56q/r97w的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接,孔突变第26号)模型,是基于在蛋白质数据库登录号4uv3和4q79中发现的csgg的晶体结构。使用pymol制备相关突变。接着,使用最陡下降算法,使所得孔模型能量降至最低。

t4dda-(e94c/f98w/c109a/c136a/k194l/a360c)(具有突变e94c/f98w/c109a/c136a/k194l/a360c且接着(δm1)g1g2的seqidno:24)模型,是基于在蛋白质数据库登录号3upu中发现的dda1993结构。同样,使用pymol制备相关突变,且使用最陡下降算法使模型能量降至最低。

接着,将t4dda-(e94c/f98w/c109a/c136a/k194l/a360c)(具有突变e94c/f98w/c109a/c136a/k194l/a360c且接着(δm1)g1g2的seqidno:24)模型放置在突变孔25和26上。

在模拟中,定位酶,使得dna的5′端指向孔,且酶在整个模拟中不受限制。对于所研究的突变孔中的每一个,进行两个模拟:首先,孔主链受限制,且将模拟盒溶剂化;其次,除帽区以外孔主链受限制,且将模拟盒溶剂化。使用到300k的berendsen恒温器和berendsen恒压器,在npt集中模拟系统40ns。

使用gromacs分析软件以及本地写入码两个来分析酶与孔之间的接触。下表显示对于孔和酶氨基酸两个所观测到的接触的数量(对于突变25和26,其具有t4dda-(e94c/f98w/c109a/c136a/k194l/a360c))。表9(孔主链受限制)和10(孔主链受限制,其中帽区不受限制)显示孔突变25上的氨基酸接触点和用酶(t4dda-(e94c/f98w/c109a/c136a/k194l/a360c))制备的接触的接触数量。表11(孔主链受限制)和12(孔主链受限制,其中帽区不受限制)显示孔突变25(csgg-eco-(y5ia/f56q)-strepii(c))9(具有突变y51a/f56q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)上的氨基酸接触点,所述氨基酸接触点与酶(t4dda-(e94c/f98w/c109a/c136a/k194l/a360c))上的氨基酸接触点相互作用。表13(孔主链受限制)和14(孔主链受限制,其中帽区不受限制)显示孔突变26上的氨基酸接触点和用酶(t4dda-(e94c/f98w/c109a/c136a/k194l/a360c))制备的接触的接触数量。表15(孔主链受限制)和16(孔主链受限制,其中帽区不受限制)显示孔突变26(csgg-eco-(y51a/f56q/r97w)-strepii(c))9(具有突变y51a/f56q/r97w的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)上的氨基酸接触点,所述氨基酸接触点与酶(t4dda-(e94c/f98w/c109a/c136a/k194l/a360c))上的氨基酸接触点相互作用。图33显示孔突变26和t4dda-(e94c/f98w/c109a/c136a/k194l/a360c)的初始快照。

表9

表10

表11

表12

表13

表14

表15

表16

实例6

本实例描述显示表征准确度改进的若干csgg突变的表征。

材料和方法

在此实例中使用的材料和方法是与上文对于实例2所描述的那些相同。用于控制移动的酶是酶1=t4dda-e94c/c109a/c136a/a360c(具有突变e94c/c109a/c136a/a360c的seqidno:24或酶2=t4dda-e94c/f98w/c109a/c136a/k194l/a360c(具有突变e94c/f98w/c109a/c136a/k194l/a360c的seqidno:24)。

使用如在国际申请pct/gb2012/052343(公开为wo/2013/041878)中公开的方法,来计算1d准确度表征测量。

结果

对于mspa突变x=mspa-((del-l74/g75/d118/l119)d56f/e59r/l88n/d90n/d91n/q126r/d134r/e139k)8(seqidno:50,其具有突变d56f/e59r/l88n/d90n/d91n/q126r/d134r/e139k,和氨基酸l74/g75/d118/l119的缺失)(其中dna易位受t4dda-e94c/f98w/c109a/c136a/k194l/a360c控制)的1dbasecall表征准确度是68.7%。所测试的所有突变(参见下表17)显示相较于mspa突变x,1dbasecall表征准确度改进。

27-csgg-eco-(y51a/f56q/r97w/r192q-strepii(c))9(具有突变y51a/f56q/r97w/r192q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

28-csgg-eco-(y51a/f56q/r97w/r192d-strepii(c))9(具有突变y51a/f56q/r97w/r192d的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

29-csgg-eco-(y51a/f56q/k135l/t150i/s208v-strepii(c))9(具有突变y51a/f56q/k135l/t150i/s208v的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

30-csgg-eco-(y51a/f56q/t150i/s208v-strepii(c))9(具有突变y51a/f56q/t150i/s208v的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

31-csgg-eco-(y51a/f56q/s208v-strepii(c))9(具有突变y51a/f56q/s208v的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

32-csgg-eco-(y51a/f56q/t150i-strepii(c))9(具有突变y51a/f56q/t150i的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

33-csgg-eco-(y51a/f56q/k135v/t150y-strepii(c))9(具有突变y51a/f56q/k135v/t150y的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

34-csgg-eco-(y51a/f56q/k135l-strepii(c))9(具有突变y51a/f56q/k135l的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

35-csgg-eco-(y51a/f56q/r97f/r192d-strepii(c))9(具有突变y51a/f56q/r97f/r192d的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

36-csgg-eco-(y51a/f56q/k135l/t150i-strepii(c))9(具有突变y51a/f56q/k135l/t150i的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

37-csgg-eco-((del-d195/y196/q197/r198/l199)-y51a/f56q-strepii(c))9(seqidno:2,其具有突变y51a/f56q和氨基酸d195/y196/q197/r198/l199的缺失,其中strepii(c)是seqidno:47,且在c端处连接)

38-csgg-eco-((del-r192/f193/1194/d195/y196/q197/r198/l199/l200)-y51a/f56q-strepii(c))9(seqidno:2,其具有突变y51a/f56q和氨基酸r192/f193/i194/d195/y196/q197/r198/l199/l200的缺失,其中strepii(c)是seqidno:47,且在c端处连接)

39-csgg-eco-((del-q197/r198/l199/l200)-y51a/f56q-strepii(c))9(seqidno:2,其具有突变y51a/f56q和氨基酸q197/r198/l199/l200的缺失,其中strepii(c)是seqidno:47,且在c端处连接)

40-csgg-eco-((del-i194/d195/y196/q197/r198/l199)-y51a/f56q-strepii(c))9(seqidno:2,其具有突变y51a/f56q和氨基酸i194/d195/y196/q197/r198/l199的缺失,其中strepii(c)是seqidno:47,且在c端处连接)

41-csgg-eco-((del-v139/g140/d149/t150/v186/q187/v204/g205)-y51a/f56q-strepii(c))9(seqidno:2,其具有突变y51a/f56q和氨基酸v139/g140/d149/t150/v186/q187/v204/g205的缺失,其中strepii(c)是seqidno:47,且在c端处连接)

42-csgg-eco-((del-d195/y196/q197/r198/l199/l200)-y51a/f56q-strepii(c))9(seqidno:2,其具有突变y51a/f56q和氨基酸d195/y196/q197/r198/l199/l200的缺失,其中strepii(c)是seqidno:47,且在c端处连接)

43-csgg-eco-((del-y196/q197/r198/l199/l200/e201)-y51a/f56q-strepii(c))9(seqidno:2,其具有突变y51a/f56q和氨基酸y196/q197/r198/l199/l200/e201的缺失,其中strepii(c)是seqidno:47,且在c端处连接)

44-csgg-eco-((del-q197/r198/l199)-y51a/f56q-strepii(c))9(seqidno:2,其具有突变y51a/f56q和氨基酸q197/r198/l199的缺失,其中strepii(c)是seqidno:47,且在c端处连接)

45-csgg-eco-((del-f193/i194/d195/y196/q197/r198/l199)-y51a/f56q-strepii(c))9(seqidno:2,其具有突变y51a/f56q和氨基酸f193/i194/d195/y196/q197/r198/l199的缺失,其中strepii(c)是seqidno:47,且在c端处连接)

46-csgg-eco-(y51a/f56q/r192t-strepii(c))9(具有突变y51a/f56q/r192t的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

47-csgg-eco-(y51a/f56q/n102s-strepii(c))9(具有突变y51a/f56q/n102s的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

48-csgg-eco-(y51a/f56q/q42r-strepii(c))9(具有突变y51a/f56q/q42r的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

49-csgg-eco-(y51a/f56q/r192s-strepii(c))9(具有突变y51a/f56q/r192s的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

50-csgg-eco-(y51a/f56q/g103n-strepii(c))9(具有突变y51a/f56q/g103n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

51-csgg-eco-(y51a/f56q/r97n/n102r-strepii(c))9(具有突变y51a/f56q/r97n/n102r的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

52-csgg-eco-(y51a/f56q/r97l-strepii(c))9(具有突变y51a/f56q/r97l的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

53-csgg-eco-(y51a/f56q/r192d-strepii(c))9(具有突变y51a/f56q/r192d的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

54-csgg-eco-(y51a/f56q/r97n/n102g-strepii(c))9(具有突变y51a/f56q/r97n/n102g的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

55-csgg-eco-(y51a/f56q/f48s-strepii(c))9(具有突变y51a/f56q/f48s的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

56-csgg-eco-(y51a/f56q/g103s-strepii(c))9(具有突变y51a/f56q/g103s的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

57-csgg-eco-(y51a/f56q/e101l-strepii(c))9(具有突变y51a/f56q/e101l的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

58-csgg-eco-(y51a/f56q/r192q-strepii(c))9(具有突变y51a/f56q/r192q的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

59-csgg-eco-(y51a/f56q/k135n/r142n/r192n-strepii(c))9(具有突变y51a/f56q/k135n/r142n/r192n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

60-csgg-eco-(y51a/f56q/r97n-strepii(c))9(具有突变y51a/f56q/r97n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

61-csgg-eco-(y51a/f56q/r192n-strepii(c))9(具有突变y51a/f56q/r192n的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

62-csgg-eco-(y51a/f56q/y130w-strepii(c))9(具有突变y51a/f56q/y130w的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

63-csgg-eco-(y51a/f56q/e101g-strepii(c))9(具有突变y51a/f56q/e101g的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)

表17

实例7

本实例比较多种不同突变纳米孔的dna捕获。

材料和方法

从插入在含嵌段共聚物的缓冲液(25mm磷酸钾缓冲液,150mm亚铁(ii)氰化钾,150mm铁(iii)氰化钾,ph8.0)中的各种单一csgg或mspa纳米孔获得电测量。在达到插入在嵌段共聚物中的单一孔之后,接着缓冲液(2ml,25mm磷酸钾缓冲液,150mm亚铁(ii)氰化钾,150mm铁(iii)氰化钾,ph8.0)流过系统,移除任何过量的纳米孔。接着,使150μl的500mmkcl、25mm磷酸钾、1.5mmmgcl2、1.5mmatp、ph8.0流过系统。在10分钟之后,接着将150μl的dna(seqidno:51,200nm)流动到单一纳米孔实验系统中。实验是在-120mv下进行,且进行解螺旋酶控制的dna移动监测。

结果

csgg突变csgg-eco-(y51a/f56q/r97w/e101s/r192d-strepii(c))9(具有突变y51a/f56q/r97w/e101s/r192d的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)(参见图36)显示,比mspa-((del-l74/g75/d118/l119)d56f/e59r/l88n/d90n/d91n/q126r/d134r/e139k)8(参见图34),更高的捕获速率(例如更容易地捕获dna聚核苷酸)。电流迹线中的各尖峰对应于在不受酶控制的情况下dna聚核苷酸(seqidno:51)通过纳米孔的易位。对于csgg纳米孔-csgg-eco-(y51a/f56q/r97w/e101s/r192d-strepii(c))9,图34中的10秒电流迹线显示比10秒电流迹线更少的dna易位。

当相较于无e101s突变的csgg突变时,位置e101到e101s的突变引起捕获率的增加。图35显示,csgg突变csgg-eco-(y51a/f56q/r97w/r192d-strepii(c))9(具有突变y51a/f56q/r97w/r192d的seqidno:2,其中strepii()是seqidno:47,且在c端处连接)的10秒电流迹线呈现比csgg-eco-(y51a/f56q/r97w/e101s/r192d-strepii(c))9更少的易位。csgg-eco-(y51a/f56q/r97w/r192d-strepii(c))9的易位的平均数是7.25/秒(n=12),且csgg-eco-(y51a/f56q/r97w/e101s/r192d-strepii(c))9的易位的平均数是18/秒(n=14)。

实例8

本实例比较两个不同csgg突变孔的表达水平。

材料和方法

在此实例中用于制备纳米孔(a=csgg-eco-(y51a/f56q/r97w)-strepii(c))9(具有突变y51a/f56q/r97w的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接);和b=csgg-eco-(y51a/f56q/r97w/r192d)-strepii(c))9(具有突变y51a/f56q/r97w/r192d的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接))的材料和方法与上文对于实例3所描述的那些相同。

结果

两个纳米孔a=csgg-eco-(y51a/f56q/r97w)-strepii(c))9(具有突变y51a/f56q/r97w的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接)和b=csgg-eco-(y51a/f56q/r97w/r192d)-strepii(c))9(具有突变y51a/f56q/r97w/r192d的seqidno:2,其中strepii(c)是seqidno:47,且在c端处连接),使用精确相同的方案来表达和纯化,且使用凝胶过滤色谱图(120mls200柱,参见图37)和sds-page分析(参见图38)来分析相同体积的各纳米孔。b(470.3mau)的吸光度值比a(11.4mau)高许多,此指,csgg-eco-(y51a/f56q/r97w/r192d)-strepii(c))9以比csgg-eco-(y51a/f56q/r97w)-strepii(c))9更许多的水平表达。图38中的条带的强度还指示两个孔的表达水平。条带a-c(含有csgg-eco-(y51a/f56q/r97w)-strepii(c))9)比条带d-e(含有csgg-eco-(y51a/f56q/r97w/r192d)-strepii(c))9)的强力低。分析两个的两个方法指示,添加r192d突变极大地增加csgg突变所观测到的表达。

实例9

本实例描述显示表征准确度改进的若干csgg突变的表征。

材料和方法

csg孔

测试以下8个csgg突变孔。上文实例x中描述的突变28用作基线孔。在seqidno:2中制备突变,且纯化标签strepii具有seqidno:47中所示的序列。

基线孔(突变28):csgg-(wt-y51a/f56q/r97w/r192d-strepii)9

突变a:csgg-(wt-y51a/f56q/r97w/r192d-strepii)9-del(d195-l199)

突变b:csgg-(wt-y51a/f56q/r97w/r192d-strepii)9-del(f193-l199)

突变c:csgg-(wt-y51a/f56q/r97w/r192d-strepii)9-f191t

突变d:csgg-(wt-y51a/f56q/r97w/r192d-del(v105-i107)-strepii)9

突变e:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)

突变f:csgg-(wt-y51a/f56q/r192d-strepii)9-r93w

突变g:csgg-(wt-y51a/f56q/r192d-strepii)9-r93w-del(d195-l199)

突变h:csgg-(wt-y51a/f56q/r192d-strepii)9-r93y/r97y

纳米孔制备

为了制备含有嵌段共聚物膜的多个槽孔的纳米孔阵列芯片,所述多个孔各自具有所插入的单一csgg突变纳米孔,使用以下方法。将在大肠杆菌中表达的csgg突变纯化,且存储于在ph8下含有25mmtris、150mmnacl、2mmedta、0.01%ddm、0.1%sds、0.1%brij58的缓冲液中。使用在ph8.0下包含25mm磷酸钾、150mm亚铁(ii)氰化钾、150mm铁(iii)氰化钾的缓冲液,以1∶1000000将这些突变csgg孔进行稀释,且添加到芯片中,在各槽孔中获得单一孔。在孔插入之后,用在ph8.0下包含25mm磷酸钾、150mm亚铁(ii)氰化钾、150mm铁(iii)氰化钾的1ml缓冲液来洗涤阵列芯片,以移除过量的孔。在几分钟之后,用500ml的测序混合液冲洗各芯片两次,所述测序混合液含有470mmkcl、25mmhepes、11mmatp和10mmmgcl2。

dna样本制备

使用以下方法制备dna样本,以用于测序。将1μgdna分析物与40nm的含有同衔接子和平头ta接合酶(获自https://store.nanoporetech.com/)预结合的t4dda解螺旋酶的衔接子混合物一起培育10分钟。衔接子的结构显示于图43中,且衔接子中所含的序列陈述于seqidno:52到55中。接着,使用spri纯化,纯化接合反应混合物,以移除未接合的游离衔接子。在含有在ph10下的40mmcaps、40mmkcl和400nm胆固醇系链的25μl洗脱缓冲液中,洗脱最终接合的混合物。对于各芯片,将12μldna-衔接子接合的混合物与测序混合液(最终体积,150μl)混合,且添加到芯片,以用于测序。接着,在160mv下进行实验6小时。

使用如在wo2013/041878中所公开的方法,来计算1d准确度表征测量。

测量模板速度

通过以下方法来测量模板速度。将各波浪线的basecall与参考序列进行比对。将跨越比对(从比对起始位置减去比对终点位置)的碱基的数量,除对应于比对结束的事件与对应于比对开始的事件之间的时间。

结果

basecall准确度

如图39中所示,发现所有8个csgg突变孔,相较于实例6中描述的基线孔突变28(csgg-(wt-y51a/f56q/r97w/r192d-strepii)9),均具有改进的basecall准确度。如表17中所示,突变28显示在实例6中所测试的所有csgg突变的最高basecall准确度(80.2%),其中实例5中描述的突变25(csgg-(wt-y51a/f56q-strepii)9)是基线突变。因此,除由突变28中的r97w和r192d取代引起的准确度的改进以外,d195-l199、f193-l199或v105-i107的缺失,或f191t的取代,引起另外的准确度的改进。

d195-l199、f193-l199或v105-i107的缺失,或f191t的取代,也各自将预期为在存在csgg序列中的其它突变下或在不存在r97w、r192d、y51a和/或f56q突变下准确度得到改进。举例来说,突变e,其含有除del(v105-i107)突变以外的突变k94q,相较于突变28具有改进的准确度,就如含有del(v105-i107)的突变g一样,所述突变g不含有r97w取代但相反含有r93w取代。

实例26中的表17显示,突变26,其含有r97w取代,具有几乎与突变28(80.2%)一样良好的basecall准确度(79.2%)。这表明,r97w突变是basecall准确度增加的基础。在此实例中,对不含有r97w突变(以及不含有r192d突变)但相反含有

r93w取代(突变f)或r93y取代和r97y取代两个(突变h)的两个突变进行测试,且发现具有比突变28更高的basecall准确度。这显示,r93w和r93y/r97y取代可用于改进csgg纳米孔的basecall准确度。

模板速度和模板准确度

如图40a中所示,突变d(csgg-(wt-y51a/f56q/r97w/r192d-del(v105-1107)-strepii)9),相较于基线突变28csgg-(wt-y51a/f56q/r97w/r192d-strepii)9,具有收紧的速度群体分布。

图40b显示,突变d(csgg-(wt-y51a/f56q/r97w/r192d-del(v105-i107)-strepii)9),相较于基线突变28csgg-(wt-y51a/f56q/r97w/r192d-strepii)9,具有收紧的模板准确度分布。

有利的是,具有收紧的速度和准确度分布,这是由于数据中存在较小的偏差。另外,数据的中值准确度将通过降低所产生的较低准确度数据的量而增加。因此,从csgg纳米孔的v105到i107缺失氨基酸,可用于产生具有用于表征聚核苷酸的改进的特性的csgg纳米孔。

实例10

本实例描述显示噪声孔信号减少的csgg突变的表征。

材料和方法

csg孔

测试以下csgg突变孔。上文实例x中描述的突变28用作基线孔。在seqidno:2中制备突变,且纯化标签strepii具有seqidno:47中所示的序列。

基线孔(突变28):csgg-(wt-y51a/f56q/r97w/r192d-strepii)9

突变i:csgg-(wt-y51a/f56q/r97w/r192d-strepii)9-k94n.

突变j:csgg-(wt-y51a/f56q/r97w/r192d-strepii)9-k94q。

纳米孔制备

如实例9中所描述,制备含有嵌段共聚物膜的多个槽孔的芯片,所述多个槽孔各自具有插入的单一csgg突变纳米孔。

dna样本制备

使用实例9中描述的方法,制备dna样本,以用于测序。

测定在噪声孔状态中的时间花费

如下计算噪声孔状态中的时间花费的百分比。将在各通道内的事件检测的信号分成不重叠的短窗口。对于每个窗口,计算电流电平的平均值和电流电平的分散性。接着,将获得的值传递给分类器,所述分类器返回标示窗口是否含有噪声信号的标记。分类器经过训练,以通过提供噪声信号具有预标记的数据来检测噪声信号。

结果

噪声孔状态

图41显示实例“波浪线”,其显示通过基线突变28csgg-(wt-y51a/f56q/r97w/r192d-strepii)9呈现的“噪声”孔误差模式。图41的上图显示在“良好”和“噪声”孔状态期间,通过孔的电流流的差异。图41的下图显示从“良好”状态过渡到“噪声”状态的放大图。

图42显示平均在至少5个回合内,当相较于基线突变28时,突变孔i和j的噪声孔状态的减少。

突变j和突变i两个的噪声孔状态的时间花费的百分比相较于基线显著地降低。突变i和j与用作基线的突变28恰好相差一个残基。突变i和突变j两个均含有k94的取代。突变i含有k94n突变,且突变ii含有k94q突变。因此,csgg纳米孔中的k94的取代,尤其用n或q取代,可用于产生具有用于表征聚核苷酸的改进的特性的csgg纳米孔。

实例11

本实例描述显示捕获活性增加的若干csgg突变的表征。

材料和方法

csg孔

测试以下csgg突变孔。上文实例9中描述的突变e用作基线孔。在seqidno:2中制备突变,且纯化标签strepii具有seqidno:47中所示的序列。

基线(突变e):csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107).

突变k:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-q42k

突变l:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-e44n

突变m:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-e44q

突变n:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-l90r

突变o:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-n91r

突变p:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-i95r

突变q:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-a99r

突变r:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-e101h

突变s:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-e101k

突变t:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-e101n

突变u:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-e101q

突变v:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-e101t

突变w:csgg-(wt-y51a/f56q/k94q/r97w/r192d-del(v105-i107)-q114k

纳米孔制备

为了制备含有嵌段共聚物膜的多个槽孔的纳米孔阵列芯片,所述多个槽孔各自具有所插入的单一csgg突变纳米孔,使用以下方法。将在大肠杆菌中表达的csgg突变纯化,且存储于在ph8下含有25mmtris、150mmnacl、2mmedta、0.01%ddm、0.1%sds、0.1%brij58的缓冲液中。使用在ph8.0下包含25mm磷酸钾、150mm亚铁(ii)氰化钾、150mm铁(iii)氰化钾的缓冲液,以1∶1000000将这些突变csgg孔进行稀释,且添加到芯片中,在各槽孔中获得单一孔。在孔插入之后,用在ph8.0下包含25mm磷酸钾、150mm亚铁(ii)氰化钾、150mm铁(iii)氰化钾的1ml缓冲液来洗涤芯片,以移除过量的孔。将1ml在ph8.0下含有含240nmtba分析物的25mm磷酸钾、150mm亚铁(ii)氰化钾、150mm铁(iii)氰化钾的溶液冲洗到芯片中。

测定捕获能力

接着,突变孔捕获dna分析物的能力通过其捕获凝血酶结合适体(tba)(seqidno:51)的能力来评定。在180mv下进行实验。为了测量通过孔的tba捕获,计算tba事件之间的中值时间。

结果

如图44中所示,13个突变的tba事件之间的中值时间相较于基线显著地降低,从而指示,所有13个突变均显示模板dna的捕获速率增加。

13突变中的每一个相较于基线孔具有单一氨基酸取代。特定取代是:q42k、e44n、e44q、l90r、n91r、195r、a99r、e101h、e101k、e101n、e101q、e101t和q114k。所有这些突变均包括用不带电氨基酸或带正电氨基酸取代带负电氨基酸,或带正电氨基酸取代不带电氨基酸。因此,可推断,在位置q42、e44、e44、l90、n91、i95、a99、e101和q114中的一或多个处的氨基酸,用在这些位置处移除负电荷和/或增加正电荷的氨基酸取代,引起聚核苷酸的捕获增加。

各种csgg同源物的序列比对

图45显示二十一个csgg同源物之间的序列比对,如上文详述。对以下序列进行多序列比对:seqidno:2、seqidno:3、seqidno:4、seqidno:5、seqidno:6、seqidno:7、seqidno:27、seqidno:28、seqidno:29、seqidno:30、seqidno:31、seqidno:32、seqidno:33、seqidno:34、seqidno:35、seqidno:36、seqidno:37、seqidno:38、seqidno:39、seqidno:40和seqidno:41。

praline软件(一种集成同源性延长和二级结构信息的多序列比对工具箱)用于执行比对,http://www.ibi.vu.nl/programs/pralinewww/,也参见simossisva1,heringaj.;《核酸研究》2005年7月1日;33(万维网服务器问题):w289-94。使用blosum62残基交换矩阵,来对比对进行记分。关于这种方法的详情,参见例如henikoffs、henikoffjg;《美国国家科学学院学报(proc.natl.acad.sci.usa)》第89卷,第10915-10919页,1992年11月。分别地使用12的空隙开口和1的延长罚分。使用psipred的二级结构预测用于引导比对。关于这种方法的详情,参见例如jonesd.t.;《分子生物学杂志》1999年9月17日;292(2):195-202。用于比对序列的以上方法是示范性的,且可使用所属领域中已知的其它序列比对方法。

参考图45的序列比对,序列比对的各区段、在各位置处的保守性通过直方图和得分指示。刻度上的数字0-9指示保守性增加,具有产生与保守氨基类似特性的突变的柱标记有加号(‘+’),且星形符号(‘*’)指示在那个位置处的100%序列一致性。可从序列比对的保守值看出,许多残基显示极高或甚至完美的序列一致性,从而指示这些21个同源物是紧密相关的。

图46显示与图45相同的相对序列比对,其中所预测的α螺旋二级结构区另外加灰色阴影。图47显示与图45相同的相对序列比对,其中所预测的β折叠二级结构区另外加灰色阴影。图46和47显示,这些同源物的所预测的α螺旋和β折叠的区(csgg纳米孔的重要二级结构)是高度保守的。

多序列比对强烈表明所述序列是相关的;不仅是存在很高程度的沿比对的保守性,而且还比对所预测的二级结构元件。

图45、46和47中的序列比对可用作显示彼此比对的相对位置的参考。因此,可鉴定相对于seqidno2鉴定的氨基酸残基和其它csgg同源物中的对应氨基酸残基。为了易于鉴定,残基r97和r192已用星号定位。可从表看出,例如seqidno:2的r192对应于seqidno:32的残基r191和seqidno:37的残基k177。

如参考图45到47将容易地理解,csgg单体是高度保守的。此外,根据关于seqidno:2的突变的知识,有可能测定除seqidno:2以外的csgg单体的突变的等效位置。

因此,提到包含如seqidno:2中所示序列的变异体和如在权利要求书和在说明书中其它地方中陈述的其特异性氨基酸突变的突变csgg单体,还涵盖包含如以下中所示序列的变异体和其对应氨基酸突变的突变csgg单体:seqidno:3、seqidno:4、seqidno:5、seqidno:6、seqidno:7、seqidno:27、seqidno:28、seqidno:29、seqidno:30、seqidno:31、seqidno:32、seqidno:33、seqidno:34、seqidno:35、seqidno:36、seqidno:37、seqidno:38、seqidno:39、seqidno:40和seqidno:41。同样,提到涉及使用关于包含如seqidno:2中所示序列的变异体和如在权利要求书中和在说明书中其它地方陈述的其特异性氨基酸突变的突变csgg单体的孔的构筑体、孔或方法,还涵盖关于包含根据以上所公开的seqidno的序列的变异体和其对应氨基酸突变的突变csgg单体的构筑体、孔或方法。还应理解,本发明延伸到未在说明书中明确鉴定的显示高度保守区的其它变异csgg单体。

序列表

<110>牛津纳米孔技术有限公司(oxfordnanoporetechnologieslimited)

<120>突变孔

<130>n407644wo

<140>tbc

<141>tbc

<150>gb1603656.8

<151>2016-03-02

<150>gb1603657.6

<151>2016-03-02

<150>gb1603658.4

<151>2016-03-02

<160>56

<170>patentinversion3.5

<210>1

<211>786

<212>dna

<213>大肠杆菌(escherichiacoli)

<400>1

tgtctgaccgcaccgccgaaagaagcggcacgtccgaccctgatgccgcgtgcacagtct60

tataaagatctgacccatctgccggctccgacgggcaaaatttttgttagcgtctataac120

atccaggacgaaaccggtcaatttaaaccgtacccggcgagtaatttctccacggccgtt180

ccgcagagtgcaaccgctatgctggtcacggcactgaaagattcccgttggttcattccg240

ctggaacgccagggcctgcaaaacctgctgaatgaacgtaaaattatccgcgcagctcag300

gaaaacggtaccgtggccattaacaatcgtattccgctgcaaagcctgaccgccgcaaac360

atcatggttgaaggctctatcatcggttacgaatcaaacgtcaaatcgggcggtgtgggc420

gcacgttattttggcattggtgctgatacccagtaccaactggaccagatcgcagttaac480

ctgcgcgtggttaatgtcagcaccggcgaaattctgagctctgtgaataccagcaaaacg540

atcctgtcttacgaagtgcaggctggtgtttttcgtttcattgattatcaacgcctgctg600

gaaggcgaagtcggttacacctcaaacgaaccggtgatgctgtgtctgatgtcggcgatt660

gaaacgggtgttattttcctgatcaatgatggcatcgaccgtggtctgtgggatctgcag720

aacaaagccgaacgtcaaaatgacattctggtgaaataccgccacatgagtgttccgccg780

gaatcc786

<210>2

<211>262

<212>prt

<213>大肠杆菌(escherichiacoli)

<400>2

cysleuthralaproprolysglualaalaargprothrleumetpro

151015

argalaglnsertyrlysaspleuthrhisleuproalaprothrgly

202530

lysilephevalservaltyrasnileglnaspgluthrglyglnphe

354045

lysprotyrproalaserasnpheserthralavalproglnserala

505560

thralametleuvalthralaleulysaspserargtrppheilepro

65707580

leugluargglnglyleuglnasnleuleuasngluarglysileile

859095

argalaalaglngluasnglythrvalalaileasnasnargilepro

100105110

leuglnserleuthralaalaasnilemetvalgluglyserileile

115120125

glytyrgluserasnvallysserglyglyvalglyalaargtyrphe

130135140

glyileglyalaaspthrglntyrglnleuaspglnilealavalasn

145150155160

leuargvalvalasnvalserthrglygluileleuserservalasn

165170175

thrserlysthrileleusertyrgluvalglnalaglyvalphearg

180185190

pheileasptyrglnargleuleugluglygluvalglytyrthrser

195200205

asngluprovalmetleucysleumetseralailegluthrglyval

210215220

ilepheleuileasnaspglyileaspargglyleutrpaspleugln

225230235240

asnlysalagluargglnasnaspileleuvallystyrarghismet

245250255

servalproprogluser

260

<210>3

<211>248

<212>prt

<213>克氏柠檬酸杆菌(citrobacterkoseri)

<400>3

metproargalaglnsertyrlysaspleuthrhisleuprometpro

151015

thrglylysilephevalservaltyrasnileglnaspgluthrgly

202530

glnphelysprotyrproalaserasnpheserthralavalprogln

354045

seralathralametleuvalthralaleulysaspserargtrpphe

505560

ileproleugluargglnglyleuglnasnleuleuasngluarglys

65707580

ileileargalaalaglngluasnglythrvalalaileasnasnarg

859095

ileproleuglnserleuthralaalaasnilemetvalgluglyser

100105110

ileileglytyrgluserasnvallysserglyglyvalglyalaarg

115120125

tyrpheglyileglyalaaspthrglntyrglnleuaspglnileala

130135140

valasnleuargvalvalasnvalserthrglygluileleuserser

145150155160

valasnthrserlysthrileleusertyrgluvalglnalaglyval

165170175

pheargpheileasptyrglnargleuleugluglygluileglytyr

180185190

thrserasngluprovalmetleucysleumetseralailegluthr

195200205

glyvalilepheleuileasnaspglyileaspargglyleutrpasp

210215220

leuglnasnlysalagluargglnasnaspileleuvallystyrarg

225230235240

hismetservalproprogluser

245

<210>4

<211>223

<212>prt

<213>肠道沙门氏菌(salmonellaenterica)

<400>4

cysleuthralaproprolysglnalaalalysprothrleumetpro

151015

argalaglnsertyrlysaspleuthrhisleuproalaprothrgly

202530

lysilephevalservaltyrasnileglnaspgluthrglyglnphe

354045

lysprotyrproalaserasnpheserthralavalproglnserala

505560

thralametleuvalthralaleulysaspserargtrppheilepro

65707580

leugluargglnglyleuglnasnleuleuasngluarglysileile

859095

argalaalaglngluasnglythrvalalametasnasnargilepro

100105110

leuglnserleuthralaalaasnilemetvalgluglyserileile

115120125

glytyrgluserasnvallysserglyglyvalglyalaargtyrphe

130135140

glyileglyalaaspthrglntyrglnleuaspglnilealavalasn

145150155160

leuargvalvalasnvalserthrglygluileleuserservalasn

165170175

thrserlysthrileleusertyrgluvalglnalaglyvalphearg

180185190

pheileasptyrglnargleuleugluglygluileglytyrthrser

195200205

asngluprovalmetleucysleumetseralailegluthrgly

210215220

<210>5

<211>262

<212>prt

<213>无丙二酸柠檬酸杆菌(citrobacteramalonaticus)

<400>5

cysleuthralaproprolysglualaalalysprothrleumetpro

151015

argalaglnsertyrlysaspleuthrhisleuproileprothrgly

202530

lysilephevalservaltyrasnileglnaspgluthrglyglnphe

354045

lysprotyrproalaserasnpheserthralavalproglnserala

505560

thralametleuvalthralaleulysaspserargtrpphevalpro

65707580

leugluargglnglyleuglnasnleuleuasngluarglysileile

859095

argalaalaglngluasnglythrvalalaileasnasnargilepro

100105110

leuglnserleuthralaalaasnilemetvalgluglyserileile

115120125

glytyrgluserasnvallysserglyglyvalglyalaargtyrphe

130135140

glyileglyalaaspthrglntyrglnleuaspglnilealavalasn

145150155160

leuargvalvalasnvalserthrglygluileleuserservalasn

165170175

thrserlysthrileleusertyrgluvalglnalaglyvalphearg

180185190

pheileasptyrglnargleuleugluglygluileglytyrthrser

195200205

asngluprovalmetleucysleumetseralailegluthrglyval

210215220

ilepheleuileasnaspglyileaspargglyleutrpaspleugln

225230235240

asnlysalaaspargglnasnaspileleuvallystyrarghismet

245250255

servalproprogluser

260

<210>6

<211>262

<212>prt

<213>鼠柠檬酸杆菌(citrobacterrodentium)

<400>6

cysleuthrthrproprolysglualaalalysprothrleumetpro

151015

argalaglnsertyrlysaspleuthrhisleuprovalprothrgly

202530

lysilephevalservaltyrasnileglnaspgluthrglyglnphe

354045

lysprotyrproalaserasnpheserthralavalproglnserala

505560

thralametleuvalthralaleulysaspserargtrppheilepro

65707580

leugluargglnglyleuglnasnleuleuasngluarglysileile

859095

argalaalaglngluasnglythrvalalaileasnasnargilepro

100105110

leuproserleuthralaalaasnilemetvalgluglyserileile

115120125

glytyrgluserasnvallysserglyglyalaglyalaargtyrphe

130135140

glyileglyalaaspthrglntyrglnleuaspglnilealavalasn

145150155160

leuargvalvalasnvalserthrglygluileleuserservalasn

165170175

thrserlysthrileleusertyrgluvalglnalaglyvalphearg

180185190

pheileasptyrglnargleuleugluglygluileglytyrthrser

195200205

asngluprovalmetleucysleumetseralailegluthrglyval

210215220

ilepheleuileasnaspglyileaspargglyleutrpaspleugln

225230235240

asnlysalaaspargglnasnaspileleuvallystyrargglnmet

245250255

servalproprogluser

260

<210>7

<211>262

<212>prt

<213>阿氏肠杆菌(enterobacterasburiae)

<400>7

cysleuthralaproprolysglualaalalysprothrleumetpro

151015

argalaglnsertyrargaspleuthrhisleuproalaprothrgly

202530

lysilephevalservaltyrasnileglnaspgluthrglyglnphe

354045

lysprotyrproalaserasnpheserthralavalproglnserala

505560

thralametleuvalthralaleulysaspserhistrppheilepro

65707580

leugluargglnglyleuglnasnleuleuasngluarglysileile

859095

argalaalaglngluasnglythrvalalaasnasnasnargmetpro

100105110

leuglnserleualaalaalaasnvalmetilegluglyserileile

115120125

glytyrgluserasnvallysserglyglyvalglyalaargtyrphe

130135140

glyileglyalaaspthrglntyrglnleuaspglnilealavalasn

145150155160

leuargvalvalasnvalserthrglygluvalleuserservalasn

165170175

thrserlysthrileleusertyrgluvalglnalaglyvalphearg

180185190

pheileasptyrglnargleuleugluglygluileglytyrthrser

195200205

asngluprovalmetmetcysleumetseralailegluthrglyval

210215220

ilepheleuileasnaspglyileaspargglyleutrpaspleugln

225230235240

asnlysalaaspalaglnasnprovalleuvallystyrargaspmet

245250255

servalproprogluser

260

<210>8

<211>1830

<212>dna

<213>噬菌体phi-29(bacteriophagephi-29)

<400>8

atgaaacacatgccgcgtaaaatgtatagctgcgcgtttgaaaccacgaccaaagtggaa60

gattgtcgcgtttgggcctatggctacatgaacatcgaagatcattctgaatacaaaatc120

ggtaacagtctggatgaatttatggcatgggtgctgaaagttcaggcggatctgtacttc180

cacaacctgaaatttgatggcgcattcattatcaactggctggaacgtaatggctttaaa240

tggagcgcggatggtctgccgaacacgtataataccattatctctcgtatgggccagtgg300

tatatgattgatatctgcctgggctacaaaggtaaacgcaaaattcataccgtgatctat360

gatagcctgaaaaaactgccgtttccggtgaagaaaattgcgaaagatttcaaactgacg420

gttctgaaaggcgatattgattatcacaaagaacgtccggttggttacaaaatcaccccg480

gaagaatacgcatacatcaaaaacgatatccagatcatcgcagaagcgctgctgattcag540

tttaaacagggcctggatcgcatgaccgcgggcagtgatagcctgaaaggtttcaaagat600

atcatcacgaccaaaaaattcaaaaaagtgttcccgacgctgagcctgggtctggataaa660

gaagttcgttatgcctaccgcggcggttttacctggctgaacgatcgtttcaaagaaaaa720

gaaattggcgagggtatggtgtttgatgttaatagtctgtatccggcacagatgtacagc780

cgcctgctgccgtatggcgaaccgatcgtgttcgagggtaaatatgtttgggatgaagat840

tacccgctgcatattcagcacatccgttgtgaatttgaactgaaagaaggctatattccg900

accattcagatcaaacgtagtcgcttctataagggtaacgaatacctgaaaagctctggc960

ggtgaaatcgcggatctgtggctgagtaacgtggatctggaactgatgaaagaacactac1020

gatctgtacaacgttgaatacatcagcggcctgaaatttaaagccacgaccggtctgttc1080

aaagatttcatcgataaatggacctacatcaaaacgacctctgaaggcgcgattaaacag1140

ctggccaaactgatgctgaacagcctgtatggcaaattcgcctctaatccggatgtgacc1200

ggtaaagttccgtacctgaaagaaaatggcgcactgggttttcgcctgggcgaagaagaa1260

acgaaagatccggtgtataccccgatgggtgttttcattacggcctgggcacgttacacg1320

accatcaccgcggcccaggcatgctatgatcgcattatctactgtgataccgattctatt1380

catctgacgggcaccgaaatcccggatgtgattaaagatatcgttgatccgaaaaaactg1440

ggttattgggcccacgaaagtacgtttaaacgtgcaaaatacctgcgccagaaaacctac1500

atccaggatatctacatgaaagaagtggatggcaaactggttgaaggttctccggatgat1560

tacaccgatatcaaattcagtgtgaaatgcgccggcatgacggataaaatcaaaaaagaa1620

gtgaccttcgaaaacttcaaagttggtttcagccgcaaaatgaaaccgaaaccggtgcag1680

gttccgggcggtgtggttctggtggatgatacgtttaccattaaatctggcggtagtgcg1740

tggagccatccgcagttcgaaaaaggcggtggctctggtggcggttctggcggtagtgcc1800

tggagccacccgcagtttgaaaaataataa1830

<210>9

<211>608

<212>prt

<213>噬菌体phi-29(bacteriophagephi-29)

<400>9

metlyshismetproarglysmettyrsercysalaphegluthrthr

151015

thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile

202530

gluasphisserglutyrlysileglyasnserleuaspgluphemet

354045

alatrpvalleulysvalglnalaaspleutyrphehisasnleulys

505560

pheaspglyalapheileileasntrpleugluargasnglyphelys

65707580

trpseralaaspglyleuproasnthrtyrasnthrileileserarg

859095

metglyglntrptyrmetileaspilecysleuglytyrlysglylys

100105110

arglysilehisthrvaliletyraspserleulyslysleuprophe

115120125

provallyslysilealalysaspphelysleuthrvalleulysgly

130135140

aspileasptyrhislysgluargprovalglytyrlysilethrpro

145150155160

gluglutyralatyrilelysasnaspileglnileilealagluala

165170175

leuleuileglnphelysglnglyleuaspargmetthralaglyser

180185190

aspserleulysglyphelysaspileilethrthrlyslysphelys

195200205

lysvalpheprothrleuserleuglyleuasplysgluvalargtyr

210215220

alatyrargglyglyphethrtrpleuasnaspargphelysglulys

225230235240

gluileglygluglymetvalpheaspvalasnserleutyrproala

245250255

glnmettyrserargleuleuprotyrglygluproilevalpheglu

260265270

glylystyrvaltrpaspgluasptyrproleuhisileglnhisile

275280285

argcysgluphegluleulysgluglytyrileprothrileglnile

290295300

lysargserargphetyrlysglyasnglutyrleulyssersergly

305310315320

glygluilealaaspleutrpleuserasnvalaspleugluleumet

325330335

lysgluhistyraspleutyrasnvalglutyrileserglyleulys

340345350

phelysalathrthrglyleuphelysasppheileasplystrpthr

355360365

tyrilelysthrthrsergluglyalailelysglnleualalysleu

370375380

metleuasnserleutyrglylysphealaserasnproaspvalthr

385390395400

glylysvalprotyrleulysgluasnglyalaleuglypheargleu

405410415

glygluglugluthrlysaspprovaltyrthrprometglyvalphe

420425430

ilethralatrpalaargtyrthrthrilethralaalaglnalacys

435440445

tyraspargileiletyrcysaspthraspserilehisleuthrgly

450455460

thrgluileproaspvalilelysaspilevalaspprolyslysleu

465470475480

glytyrtrpalahisgluserthrphelysargalalystyrleuarg

485490495

glnlysthrtyrileglnaspiletyrmetlysgluvalaspglylys

500505510

leuvalgluglyserproaspasptyrthraspilelyspheserval

515520525

lyscysalaglymetthrasplysilelyslysgluvalthrpheglu

530535540

asnphelysvalglypheserarglysmetlysprolysprovalgln

545550555560

valproglyglyvalvalleuvalaspaspthrphethrilelysser

565570575

glyglyseralatrpserhisproglnpheglulysglyglyglyser

580585590

glyglyglyserglyglyseralatrpserhisproglnpheglulys

595600605

<210>10

<211>1390

<212>dna

<213>大肠杆菌(escherichiacoli)

<400>10

atgatgaacgatggcaaacagcagagcaccttcctgtttcatgattatgaaaccttcggt60

acccatccggccctggatcgtccggcgcagtttgcggccattcgcaccgatagcgaattc120

aatgtgattggcgaaccggaagtgttttattgcaaaccggccgatgattatctgccgcag180

ccgggtgcggtgctgattaccggtattaccccgcaggaagcgcgcgcgaaaggtgaaaac240

gaagcggcgtttgccgcgcgcattcatagcctgtttaccgtgccgaaaacctgcattctg300

ggctataacaatgtgcgcttcgatgatgaagttacccgtaatatcttttatcgtaacttt360

tatgatccgtatgcgtggagctggcagcatgataacagccgttgggatctgctggatgtg420

atgcgcgcgtgctatgcgctgcgcccggaaggcattaattggccggaaaacgatgatggc480

ctgccgagctttcgtctggaacatctgaccaaagccaacggcattgaacatagcaatgcc540

catgatgcgatggccgatgtttatgcgaccattgcgatggcgaaactggttaaaacccgt600

cagccgcgcctgtttgattatctgtttacccaccgtaacaaacacaaactgatggcgctg660

attgatgttccgcagatgaaaccgctggtgcatgtgagcggcatgtttggcgcctggcgc720

ggcaacaccagctgggtggccccgctggcctggcacccggaaaatcgtaacgccgtgatt780

atggttgatctggccggtgatattagcccgctgctggaactggatagcgataccctgcgt840

gaacgcctgtataccgccaaaaccgatctgggcgataatgccgccgtgccggtgaaactg900

gttcacattaacaaatgcccggtgctggcccaggcgaacaccctgcgcccggaagatgcg960

gatcgtctgggtattaatcgccagcattgtctggataatctgaaaatcctgcgtgaaaac1020

ccgcaggtgcgtgaaaaagtggtggcgatcttcgcggaagcggaaccgttcaccccgagc1080

gataacgtggatgcgcagctgtataacggcttctttagcgatgccgatcgcgcggcgatg1140

aaaatcgttctggaaaccgaaccgcgcaatctgccggcgctggatattacctttgttgat1200

aaacgtattgaaaaactgctgtttaattatcgtgcgcgcaattttccgggtaccctggat1260

tatgccgaacagcagcgttggctggaacatcgtcgtcaggttttcaccccggaatttctg1320

cagggttatgcggatgaactgcagatgctggttcagcagtatgccgatgataaagaaaaa1380

gtggcgctgc1390

<210>11

<211>485

<212>prt

<213>大肠杆菌(escherichiacoli)

<400>11

metmetasnaspglylysglnglnserthrpheleuphehisasptyr

151015

gluthrpheglythrhisproalaleuaspargproalaglnpheala

202530

alaileargthraspserglupheasnvalileglygluprogluval

354045

phetyrcyslysproalaaspasptyrleuproglnproglyalaval

505560

leuilethrglyilethrproglnglualaargalalysglygluasn

65707580

glualaalaphealaalaargilehisserleuphethrvalprolys

859095

thrcysileleuglytyrasnasnvalargpheaspaspgluvalthr

100105110

argasnilephetyrargasnphetyraspprotyralatrpsertrp

115120125

glnhisaspasnserargtrpaspleuleuaspvalmetargalacys

130135140

tyralaleuargprogluglyileasntrpprogluasnaspaspgly

145150155160

leuproserpheargleugluhisleuthrlysalaasnglyileglu

165170175

hisserasnalahisaspalametalaaspvaltyralathrileala

180185190

metalalysleuvallysthrargglnproargleupheasptyrleu

195200205

phethrhisargasnlyshislysleumetalaleuileaspvalpro

210215220

glnmetlysproleuvalhisvalserglymetpheglyalatrparg

225230235240

glyasnthrsertrpvalalaproleualatrphisprogluasnarg

245250255

asnalavalilemetvalaspleualaglyaspileserproleuleu

260265270

gluleuaspseraspthrleuarggluargleutyrthralalysthr

275280285

aspleuglyaspasnalaalavalprovallysleuvalhisileasn

290295300

lyscysprovalleualaglnalaasnthrleuargprogluaspala

305310315320

aspargleuglyileasnargglnhiscysleuaspasnleulysile

325330335

leuarggluasnproglnvalargglulysvalvalalailepheala

340345350

glualagluprophethrproseraspasnvalaspalaglnleutyr

355360365

asnglyphepheseraspalaaspargalaalametlysilevalleu

370375380

gluthrgluproargasnleuproalaleuaspilethrphevalasp

385390395400

lysargileglulysleuleupheasntyrargalaargasnphepro

405410415

glythrleuasptyralagluglnglnargtrpleugluhisargarg

420425430

glnvalphethrproglupheleuglnglytyralaaspgluleugln

435440445

metleuvalglnglntyralaaspasplysglulysvalalaleuleu

450455460

lysalaleutrpglntyralaglugluilevalserglyserglyhis

465470475480

hishishishishis

485

<210>12

<211>804

<212>dna

<213>大肠杆菌(escherichiacoli)

<400>12

atgaaatttgtctcttttaatatcaacggcctgcgcgccagacctcaccagcttgaagcc60

atcgtcgaaaagcaccaaccggatgtgattggcctgcaggagacaaaagttcatgacgat120

atgtttccgctcgaagaggtggcgaagctcggctacaacgtgttttatcacgggcagaaa180

ggccattatggcgtggcgctgctgaccaaagagacgccgattgccgtgcgtcgcggcttt240

cccggtgacgacgaagaggcgcagcggcggattattatggcggaaatcccctcactgctg300

ggtaatgtcaccgtgatcaacggttacttcccgcagggtgaaagccgcgaccatccgata360

aaattcccggcaaaagcgcagttttatcagaatctgcaaaactacctggaaaccgaactc420

aaacgtgataatccggtactgattatgggcgatatgaatatcagccctacagatctggat480

atcggcattggcgaagaaaaccgtaagcgctggctgcgtaccggtaaatgctctttcctg540

ccggaagagcgcgaatggatggacaggctgatgagctgggggttggtcgataccttccgc600

catgcgaatccgcaaacagcagatcgtttctcatggtttgattaccgctcaaaaggtttt660

gacgataaccgtggtctgcgcatcgacctgctgctcgccagccaaccgctggcagaatgt720

tgcgtagaaaccggcatcgactatgaaatccgcagcatggaaaaaccgtccgatcacgcc780

cccgtctgggcgaccttccgccgc804

<210>13

<211>268

<212>prt

<213>大肠杆菌(escherichiacoli)

<400>13

metlysphevalserpheasnileasnglyleuargalaargprohis

151015

glnleuglualailevalglulyshisglnproaspvalileglyleu

202530

glngluthrlysvalhisaspaspmetpheproleuglugluvalala

354045

lysleuglytyrasnvalphetyrhisglyglnlysglyhistyrgly

505560

valalaleuleuthrlysgluthrproilealavalargargglyphe

65707580

proglyaspaspgluglualaglnargargileilemetalagluile

859095

proserleuleuglyasnvalthrvalileasnglytyrpheprogln

100105110

glygluserargasphisproilelyspheproalalysalaglnphe

115120125

tyrglnasnleuglnasntyrleugluthrgluleulysargaspasn

130135140

provalleuilemetglyaspmetasnileserprothraspleuasp

145150155160

ileglyileglyglugluasnarglysargtrpleuargthrglylys

165170175

cysserpheleuproglugluargglutrpmetaspargleumetser

180185190

trpglyleuvalaspthrphearghisalaasnproglnthralaasp

195200205

argphesertrppheasptyrargserlysglypheaspaspasnarg

210215220

glyleuargileaspleuleuleualaserglnproleualaglucys

225230235240

cysvalgluthrglyileasptyrgluileargsermetglulyspro

245250255

serasphisalaprovaltrpalathrpheargarg

260265

<210>14

<211>1275

<212>dna

<213>嗜热栖热菌(thermusthermophilus)

<400>14

atgtttcgtcgtaaagaagatctggatccgccgctggcactgctgccgctgaaaggcctg60

cgcgaagccgccgcactgctggaagaagcgctgcgtcaaggtaaacgcattcgtgttcac120

ggcgactatgatgcggatggcctgaccggcaccgcgatcctggttcgtggtctggccgcc180

ctgggtgcggatgttcatccgtttatcccgcaccgcctggaagaaggctatggtgtcctg240

atggaacgcgtcccggaacatctggaagcctcggacctgtttctgaccgttgactgcggc300

attaccaaccatgcggaactgcgcgaactgctggaaaatggcgtggaagtcattgttacc360

gatcatcatacgccgggcaaaacgccgccgccgggtctggtcgtgcatccggcgctgacg420

ccggatctgaaagaaaaaccgaccggcgcaggcgtggcgtttctgctgctgtgggcactg480

catgaacgcctgggcctgccgccgccgctggaatacgcggacctggcagccgttggcacc540

attgccgacgttgccccgctgtggggttggaatcgtgcactggtgaaagaaggtctggca600

cgcatcccggcttcatcttgggtgggcctgcgtctgctggctgaagccgtgggctatacc660

ggcaaagcggtcgaagtcgctttccgcatcgcgccgcgcatcaatgcggcttcccgcctg720

ggcgaagcggaaaaagccctgcgcctgctgctgacggatgatgcggcagaagctcaggcg780

ctggtcggcgaactgcaccgtctgaacgcccgtcgtcagaccctggaagaagcgatgctg840

cgcaaactgctgccgcaggccgacccggaagcgaaagccatcgttctgctggacccggaa900

ggccatccgggtgttatgggtattgtggcctctcgcatcctggaagcgaccctgcgcccg960

gtctttctggtggcccagggcaaaggcaccgtgcgttcgctggctccgatttccgccgtc1020

gaagcactgcgcagcgcggaagatctgctgctgcgttatggtggtcataaagaagcggcg1080

ggtttcgcaatggatgaagcgctgtttccggcgttcaaagcacgcgttgaagcgtatgcc1140

gcacgtttcccggatccggttcgtgaagtggcactgctggatctgctgccggaaccgggc1200

ctgctgccgcaggtgttccgtgaactggcactgctggaaccgtatggtgaaggtaacccg1260

gaaccgctgttcctg1275

<210>15

<211>425

<212>prt

<213>嗜热栖热菌(thermusthermophilus)

<400>15

metpheargarglysgluaspleuaspproproleualaleuleupro

151015

leulysglyleuargglualaalaalaleuleugluglualaleuarg

202530

glnglylysargileargvalhisglyasptyraspalaaspglyleu

354045

thrglythralaileleuvalargglyleualaalaleuglyalaasp

505560

valhispropheileprohisargleuglugluglytyrglyvalleu

65707580

metgluargvalprogluhisleuglualaseraspleupheleuthr

859095

valaspcysglyilethrasnhisalagluleuarggluleuleuglu

100105110

asnglyvalgluvalilevalthrasphishisthrproglylysthr

115120125

proproproglyleuvalvalhisproalaleuthrproaspleulys

130135140

glulysprothrglyalaglyvalalapheleuleuleutrpalaleu

145150155160

hisgluargleuglyleuproproproleuglutyralaaspleuala

165170175

alavalglythrilealaaspvalalaproleutrpglytrpasnarg

180185190

alaleuvallysgluglyleualaargileproalasersertrpval

195200205

glyleuargleuleualaglualavalglytyrthrglylysalaval

210215220

gluvalalapheargilealaproargileasnalaalaserargleu

225230235240

glyglualaglulysalaleuargleuleuleuthraspaspalaala

245250255

glualaglnalaleuvalglygluleuhisargleuasnalaargarg

260265270

glnthrleugluglualametleuarglysleuleuproglnalaasp

275280285

proglualalysalailevalleuleuaspprogluglyhisprogly

290295300

valmetglyilevalalaserargileleuglualathrleuargpro

305310315320

valpheleuvalalaglnglylysglythrvalargserleualapro

325330335

ileseralavalglualaleuargseralagluaspleuleuleuarg

340345350

tyrglyglyhislysglualaalaglyphealametaspglualaleu

355360365

pheproalaphelysalaargvalglualatyralaalaargphepro

370375380

aspprovalarggluvalalaleuleuaspleuleuprogluprogly

385390395400

leuleuproglnvalphearggluleualaleuleugluprotyrgly

405410415

gluglyasnprogluproleupheleu

420425

<210>16

<211>738

<212>dna

<213>噬菌体λ(bacteriophagelambda)

<400>16

tccggaagcggctctggtagtggttctggcatgacaccggacattatcctgcagcgtacc60

gggatcgatgtgagagctgtcgaacagggggatgatgcgtggcacaaattacggctcggc120

gtcatcaccgcttcagaagttcacaacgtgatagcaaaaccccgctccggaaagaagtgg180

cctgacatgaaaatgtcctacttccacaccctgcttgctgaggtttgcaccggtgtggct240

ccggaagttaacgctaaagcactggcctggggaaaacagtacgagaacgacgccagaacc300

ctgtttgaattcacttccggcgtgaatgttactgaatccccgatcatctatcgcgacgaa360

agtatgcgtaccgcctgctctcccgatggtttatgcagtgacggcaacggccttgaactg420

aaatgcccgtttacctcccgggatttcatgaagttccggctcggtggtttcgaggccata480

aagtcagcttacatggcccaggtgcagtacagcatgtgggtgacgcgaaaaaatgcctgg540

tactttgccaactatgacccgcgtatgaagcgtgaaggcctgcattatgtcgtgattgag600

cgggatgaaaagtacatggcgagttttgacgagatcgtgccggagttcatcgaaaaaatg660

gacgaggcactggctgaaattggttttgtatttggggagcaatggcgatctggctctggt720

tccggcagcggttccgga738

<210>17

<211>226

<212>prt

<213>噬菌体λ(bacteriophagelambda)

<400>17

metthrproaspileileleuglnargthrglyileaspvalargala

151015

valgluglnglyaspaspalatrphislysleuargleuglyvalile

202530

thralasergluvalhisasnvalilealalysproargserglylys

354045

lystrpproaspmetlysmetsertyrphehisthrleuleualaglu

505560

valcysthrglyvalalaprogluvalasnalalysalaleualatrp

65707580

glylysglntyrgluasnaspalaargthrleuphegluphethrser

859095

glyvalasnvalthrgluserproileiletyrargaspglusermet

100105110

argthralacysserproaspglyleucysseraspglyasnglyleu

115120125

gluleulyscysprophethrserargaspphemetlyspheargleu

130135140

glyglypheglualailelysseralatyrmetalaglnvalglntyr

145150155160

sermettrpvalthrarglysasnalatrptyrphealaasntyrasp

165170175

proargmetlysarggluglyleuhistyrvalvalilegluargasp

180185190

glulystyrmetalaserpheaspgluilevalproglupheileglu

195200205

lysmetaspglualaleualagluileglyphevalpheglyglugln

210215220

trparg

225

<210>18

<211>760

<212>prt

<213>伯氏甲烷球菌(methanococcoidesburtonii)

<400>18

metmetilearggluleuaspileproargaspileileglyphetyr

151015

gluaspserglyilelysgluleutyrproproglnalaglualaile

202530

glumetglyleuleuglulyslysasnleuleualaalaileprothr

354045

alaserglylysthrleuleualagluleualametilelysalaile

505560

arggluglyglylysalaleutyrilevalproleuargalaleuala

65707580

serglulysphegluargphelysgluleualapropheglyilelys

859095

valglyileserthrglyaspleuaspserargalaasptrpleugly

100105110

valasnaspileilevalalathrserglulysthraspserleuleu

115120125

argasnglythrsertrpmetaspgluilethrthrvalvalvalasp

130135140

gluilehisleuleuaspserlysasnargglyprothrleugluval

145150155160

thrilethrlysleumetargleuasnproaspvalglnvalvalala

165170175

leuseralathrvalglyasnalaargglumetalaasptrpleugly

180185190

alaalaleuvalleuserglutrpargprothraspleuhisglugly

195200205

valleupheglyaspalaileasnpheproglyserglnlyslysile

210215220

aspargleuglulysaspaspalavalasnleuvalleuaspthrile

225230235240

lysalagluglyglncysleuvalphegluserserargargasncys

245250255

alaglyphealalysthralaserserlysvalalalysileleuasp

260265270

asnaspilemetilelysleualaglyilealaglugluvalgluser

275280285

thrglygluthraspthralailevalleualaasncysilearglys

290295300

glyvalalaphehishisalaglyleuasnserasnhisarglysleu

305310315320

valgluasnglypheargglnasnleuilelysvalileserserthr

325330335

prothrleualaalaglyleuasnleuproalaargargvalileile

340345350

argsertyrargargpheaspserasnpheglymetglnproilepro

355360365

valleuglutyrlysglnmetalaglyargalaglyargprohisleu

370375380

aspprotyrglygluservalleuleualalysthrtyraspgluphe

385390395400

alaglnleumetgluasntyrvalglualaaspalagluaspiletrp

405410415

serlysleuglythrgluasnalaleuargthrhisvalleuserthr

420425430

ilevalasnglyphealaserthrargglngluleupheaspphephe

435440445

glyalathrphephealatyrglnglnasplystrpmetleugluglu

450455460

valileasnaspcysleuglupheleuileasplysalametvalser

465470475480

gluthrgluaspilegluaspalaserlysleupheleuargglythr

485490495

argleuglyserleuvalsermetleutyrileaspproleusergly

500505510

serlysilevalaspglyphelysaspileglylysserthrglygly

515520525

asnmetglyserleugluaspasplysglyaspaspilethrvalthr

530535540

aspmetthrleuleuhisleuvalcysserthrproaspmetarggln

545550555560

leutyrleuargasnthrasptyrthrilevalasnglutyrileval

565570575

alahisseraspgluphehisgluileproasplysleulysgluthr

580585590

asptyrglutrpphemetglygluvallysthralametleuleuglu

595600605

glutrpvalthrgluvalseralagluaspilethrarghispheasn

610615620

valglygluglyaspilehisalaleualaaspthrserglutrpleu

625630635640

methisalaalaalalysleualagluleuleuglyvalglutyrser

645650655

serhisalatyrserleuglulysargileargtyrglyserglyleu

660665670

aspleumetgluleuvalglyileargglyvalglyargvalargala

675680685

arglysleutyrasnalaglyphevalservalalalysleulysgly

690695700

alaaspileservalleuserlysleuvalglyprolysvalalatyr

705710715720

asnileleuserglyileglyvalargvalasnasplyshispheasn

725730735

seralaproileserserasnthrleuaspthrleuleuasplysasn

740745750

glnlysthrpheasnaspphegln

755760

<210>19

<211>707

<212>prt

<213>共生餐古菌(cenarchaeumsymbiosum)

<400>19

metargilesergluleuaspileproargproalaileglupheleu

151015

gluglygluglytyrlyslysleutyrproproglnalaalaalaala

202530

lysalaglyleuthraspglylysservalleuvalseralaprothr

354045

alaserglylysthrleuilealaalailealametileserhisleu

505560

serargasnargglylysalavaltyrleuserproleuargalaleu

65707580

alaalaglulysphealaglupheglylysileglyglyileproleu

859095

glyargprovalargvalglyvalserthrglyasppheglulysala

100105110

glyargserleuglyasnasnaspileleuvalleuthrasngluarg

115120125

metaspserleuileargargargproasptrpmetaspgluvalgly

130135140

leuvalilealaaspgluilehisleuileglyaspargserarggly

145150155160

prothrleuglumetvalleuthrlysleuargglyleuargserser

165170175

proglnvalvalalaleuseralathrileserasnalaaspgluile

180185190

alaglytrpleuaspcysthrleuvalhisserthrtrpargproval

195200205

proleusergluglyvaltyrglnaspglygluvalalametglyasp

210215220

glyserarghisgluvalalaalathrglyglyglyproalavalasp

225230235240

leualaalagluservalalagluglyglyglnserleuilepheala

245250255

aspthrargalaargseralaserleualaalalysalaseralaval

260265270

ileproglualalysglyalaaspalaalalysleualaalaalaala

275280285

lyslysileileserserglyglygluthrlysleualalysthrleu

290295300

alagluleuvalglulysglyalaalaphehishisalaglyleuasn

305310315320

glnaspcysargservalvalglugluglupheargserglyargile

325330335

argleuleualaserthrprothrleualaalaglyvalasnleupro

340345350

alaargargvalvalileserservalmetargtyrasnserserser

355360365

glymetsergluproileserileleuglutyrlysglnleucysgly

370375380

argalaglyargproglntyrasplysserglyglualailevalval

385390395400

glyglyvalasnalaaspgluilepheaspargtyrileglyglyglu

405410415

progluproileargseralametvalaspaspargalaleuargile

420425430

hisvalleuserleuvalthrthrserproglyilelysgluaspasp

435440445

valthrgluphepheleuglythrleuglyglyglnglnserglyglu

450455460

serthrvallyspheservalalavalalaleuargpheleuglnglu

465470475480

gluglymetleuglyargargglyglyargleualaalathrlysmet

485490495

glyargleuvalserargleutyrmetaspprometthralavalthr

500505510

leuargaspalavalglyglualaserproglyargmethisthrleu

515520525

glypheleuhisleuvalserglucyssergluphemetproargphe

530535540

alaleuargglnlysasphisgluvalalaglumetmetleugluala

545550555560

glyargglygluleuleuargprovaltyrsertyrglucysglyarg

565570575

glyleuleualaleuhisargtrpileglygluserproglualalys

580585590

leualagluaspleulysphegluserglyaspvalhisargmetval

595600605

gluserserglytrpleuleuargcysiletrpgluileserlyshis

610615620

glngluargproaspleuleuglygluleuaspvalleuargserarg

625630635640

valalatyrglyilelysalagluleuvalproleuvalserilelys

645650655

glyileglyargvalargserargargleupheargglyglyilelys

660665670

glyproglyaspleualaalavalprovalgluargleuserargval

675680685

gluglyileglyalathrleualaasnasnilelysserglnleuarg

690695700

lysglygly

705

<210>20

<211>720

<212>prt

<213>革螨嗜热球菌(thermococcusgammatolerans)

<400>20

metlysvalaspgluleuprovalaspgluargleulysalavalleu

151015

lysgluargglyileglugluleutyrproproglnalaglualaleu

202530

lysserglyalaleugluglyargasnleuvalleualaileprothr

354045

alaserglylysthrleuvalsergluilevalmetvalasnlysleu

505560

ileglngluglyglylysalavaltyrleuvalproleulysalaleu

65707580

alagluglulystyrarggluphelysglutrpglulysleuglyleu

859095

lysvalalaalathrthrglyasptyraspserthraspasptrpleu

100105110

glyargtyraspileilevalalathralaglulyspheaspserleu

115120125

leuarghisglyalaargtrpileasnaspvallysleuvalvalala

130135140

aspgluvalhisleuileglysertyraspargglyalathrleuglu

145150155160

metileleuthrhismetleuglyargalaglnileleualaleuser

165170175

alathrvalglyasnalaglugluleualaglutrpleuaspalaser

180185190

leuvalvalserasptrpargprovalglnleuargargglyvalphe

195200205

hisleuglythrleuiletrpgluaspglylysvalglusertyrpro

210215220

gluasntrptyrserleuvalvalaspalavallysargglylysgly

225230235240

alaleuvalphevalasnthrargargseralaglulysglualaleu

245250255

alaleuserlysleuvalserserhisleuthrlysproglulysarg

260265270

alaleugluserleualaserglnleugluaspasnprothrserglu

275280285

lysleulysargalaleuargglyglyvalalaphehishisalagly

290295300

leuserargvalgluargthrleuilegluaspalapheargglugly

305310315320

leuilelysvalilethralathrprothrleuseralaglyvalasn

325330335

leuproserpheargvalileileargaspthrlysargtyralagly

340345350

pheglytrpthraspileprovalleugluileglnglnmetmetgly

355360365

argalaglyargproargtyrasplystyrglyglualaileileval

370375380

alaargthraspgluproglylysleumetgluargtyrilearggly

385390395400

lysproglulysleuphesermetleualaasngluglnalaphearg

405410415

serglnvalleualaleuilethrasnpheglyileargserphepro

420425430

gluleuvalargpheleugluargthrphetyralahisglnarglys

435440445

aspleuserserleuglutyrlysalalysgluvalvaltyrpheleu

450455460

ilegluasnglupheileaspleuaspleugluaspargpheilepro

465470475480

leupropheglylysargthrserglnleutyrileaspproleuthr

485490495

alalyslysphelysaspalapheproalailegluargasnproasn

500505510

propheglyilepheglnleuilealaserthrproaspmetalathr

515520525

leuthralaargargargglumetgluasptyrleuaspleualatyr

530535540

gluleugluasplysleutyralaserileprotyrtyrgluaspser

545550555560

argpheglnglypheleuglyglnvallysthralalysvalleuleu

565570575

asptrpileasngluvalproglualaargiletyrgluthrtyrser

580585590

ileaspproglyaspleutyrargleuleugluleualaasptrpleu

595600605

mettyrserleuilegluleutyrlysleuphegluprolysgluglu

610615620

ileleuasntyrleuargaspleuhisleuargleuarghisglyval

625630635640

argglugluleuleugluleuvalargleuproasnileglyarglys

645650655

argalaargalaleutyrasnalaglypheargservalglualaile

660665670

alaasnalalysproalagluleuleualavalgluglyileglyala

675680685

lysileleuaspglyiletyrarghisleuglyileglulysargval

690695700

thrgluglulysprolysarglysglythrleugluasppheleuarg

705710715720

<210>21

<211>799

<212>prt

<213>亨氏甲烷螺菌(methanospirillumhungatei)

<400>21

metgluilealaserleuproleuproaspserpheileargalacys

151015

hisalalysglyileargserleutyrproproglnalaglucysile

202530

glulysglyleuleugluglylysasnleuleuileserileprothr

354045

alaserglylysthrleuleualaglumetalamettrpserargile

505560

alaalaglyglylyscysleutyrilevalproleuargalaleuala

65707580

serglulystyraspglupheserlyslysglyvalileargvalgly

859095

ilealathrglyaspleuaspargthraspalatyrleuglygluasn

100105110

aspileilevalalathrserglulysthraspserleuleuargasn

115120125

argthrprotrpleuserglnilethrcysilevalleuaspgluval

130135140

hisleuileglysergluasnargglyalathrleuglumetvalile

145150155160

thrlysleuargtyrthrasnprovalmetglnileileglyleuser

165170175

alathrileglyasnproalaglnleualaglutrpleuaspalathr

180185190

leuilethrserthrtrpargprovalaspleuargglnglyvaltyr

195200205

tyrasnglylysileargpheseraspsergluargproileglngly

210215220

lysthrlyshisaspaspleuasnleucysleuaspthrilegluglu

225230235240

glyglyglncysleuvalphevalserserargargasnalaglugly

245250255

phealalyslysalaalaglyalaleulysalaglyserproaspser

260265270

lysalaleualaglngluleuargargleuargaspargaspglugly

275280285

asnvalleualaaspcysvalgluargglyalaalaphehishisala

290295300

glyleuileargglngluargthrileileglugluglypheargasn

305310315320

glytyrilegluvalilealaalathrprothrleualaalaglyleu

325330335

asnleuproalaargargvalileileargasptyrasnargpheala

340345350

serglyleuglymetvalproileprovalglyglutyrhisglnmet

355360365

alaglyargalaglyargprohisleuaspprotyrglyglualaval

370375380

leuleualalysaspalaproservalgluargleuphegluthrphe

385390395400

ileaspalaglualagluargvalaspserglncysvalaspaspala

405410415

serleucysalahisileleuserleuilealathrglyphealahis

420425430

aspglnglualaleuserserphemetgluargthrphetyrphephe

435440445

glnhisprolysthrargserleuproargleuvalalaaspalaile

450455460

argpheleuthrthralaglymetvalglugluarggluasnthrleu

465470475480

seralathrargleuglyserleuvalserargleutyrleuasnpro

485490495

cysthralaargleuileleuaspserleulyssercyslysthrpro

500505510

thrleuileglyleuleuhisvalilecysvalserproaspmetgln

515520525

argleutyrleulysalaalaaspthrglnleuleuargthrpheleu

530535540

phelyshislysaspaspleuileleuproleuprophegluglnglu

545550555560

gluglugluleutrpleuserglyleulysthralaleuvalleuthr

565570575

asptrpalaaspgluphesergluglymetileglugluargtyrgly

580585590

ileglyalaglyaspleutyrasnilevalaspserglylystrpleu

595600605

leuhisglythrgluargleuvalservalglumetproglumetser

610615620

glnvalvallysthrleuservalargvalhishisglyvallysser

625630635640

gluleuleuproleuvalalaleuargasnileglyargvalargala

645650655

argthrleutyrasnalaglytyrproaspproglualavalalaarg

660665670

alaglyleuserthrilealaargileileglygluglyilealaarg

675680685

glnvalileaspgluilethrglyvallysargserglyilehisser

690695700

seraspaspasptyrglnglnlysthrprogluleuleuthraspile

705710715720

proglyileglylyslysmetalaglulysleuglnasnalaglyile

725730735

ilethrvalseraspleuleuthralaaspgluvalleuleuserasp

740745750

valleuglyalaalaargalaarglysvalleualapheleuserasn

755760765

serglulysgluasnserserserasplysthrglugluileproasp

770775780

thrglnlysileargglyglnsersertrpgluasppheglycys

785790795

<210>22

<211>1756

<212>prt

<213>大肠杆菌(escherichiacoli)

<400>22

metmetserilealaglnvalargseralaglyseralaglyasntyr

151015

tyrthrasplysaspasntyrtyrvalleuglysermetglygluarg

202530

trpalaglylysglyalagluglnleuglyleuglnglyservalasp

354045

lysaspvalphethrargleuleugluglyargleuproaspglyala

505560

aspleuserargmetglnaspglyserasnlyshisargproglytyr

65707580

aspleuthrpheseralaprolysservalsermetmetalametleu

859095

glyglyasplysargleuileaspalahisasnglnalavalaspphe

100105110

alavalargglnvalglualaleualaserthrargvalmetthrasp

115120125

glyglnsergluthrvalleuthrglyasnleuvalmetalaleuphe

130135140

asnhisaspthrserargaspglngluproglnleuhisthrhisala

145150155160

valvalalaasnvalthrglnhisasnglyglutrplysthrleuser

165170175

serasplysvalglylysthrglypheilegluasnvaltyralaasn

180185190

glnilealapheglyargleutyrargglulysleulysgluglnval

195200205

glualaleuglytyrgluthrgluvalvalglylyshisglymettrp

210215220

glumetproglyvalprovalglualapheserglyargserglnala

225230235240

ileargglualavalglygluaspalaserleulysserargaspval

245250255

alaalaleuaspthrarglysserlysglnhisvalaspprogluile

260265270

argmetalaglutrpmetglnthrleulysgluthrglypheaspile

275280285

argalatyrargaspalaalaaspglnargthrgluileargthrgln

290295300

alaproglyproalaserglnaspglyproaspvalglnglnalaval

305310315320

thrglnalailealaglyleusergluarglysvalglnphethrtyr

325330335

thraspvalleualaargthrvalglyileleuproprogluasngly

340345350

valilegluargalaargalaglyileaspglualaileserargglu

355360365

glnleuileproleuaspargglulysglyleuphethrserglyile

370375380

hisvalleuaspgluleuservalargalaleuserargaspilemet

385390395400

lysglnasnargvalthrvalhisproglulysservalproargthr

405410415

alaglytyrseraspalavalservalleualaglnaspargproser

420425430

leualailevalserglyglnglyglyalaalaglyglnarggluarg

435440445

valalagluleuvalmetmetalaarggluglnglyarggluvalgln

450455460

ileilealaalaaspargargserglnmetasnleulysglnaspglu

465470475480

argleuserglygluleuilethrglyargargglnleuleuglugly

485490495

metalaphethrproglyserthrvalilevalaspglnglyglulys

500505510

leuserleulysgluthrleuthrleuleuaspglyalaalaarghis

515520525

asnvalglnvalleuilethraspserglyglnargthrglythrgly

530535540

seralaleumetalametlysaspalaglyvalasnthrtyrargtrp

545550555560

glnglyglygluglnargproalathrileilesergluproasparg

565570575

asnvalargtyralaargleualaglyaspphealaalaservallys

580585590

alaglyglugluservalalaglnvalserglyvalarggluglnala

595600605

ileleuthrglnalaileargsergluleulysthrglnglyvalleu

610615620

glyhisprogluvalthrmetthralaleuserprovaltrpleuasp

625630635640

serargserargtyrleuargaspmettyrargproglymetvalmet

645650655

gluglntrpasnprogluthrargserhisaspargtyrvalileasp

660665670

argvalthralaglnserhisserleuthrleuargaspalaglngly

675680685

gluthrglnvalvalargileserserleuaspsersertrpserleu

690695700

pheargproglulysmetprovalalaaspglygluargleuargval

705710715720

thrglylysileproglyleuargvalserglyglyaspargleugln

725730735

valalaservalsergluaspalametthrvalvalvalproglyarg

740745750

alagluproalaserleuprovalseraspserprophethralaleu

755760765

lysleugluasnglytrpvalgluthrproglyhisservalserasp

770775780

seralathrvalphealaservalthrglnmetalametaspasnala

785790795800

thrleuasnglyleualaargserglyargaspvalargleutyrser

805810815

serleuaspgluthrargthralaglulysleualaarghisproser

820825830

phethrvalvalsergluglnilelysalaargalaglygluthrleu

835840845

leugluthralaileserleuglnlysalaglyleuhisthrproala

850855860

glnglnalailehisleualaleuprovalleugluserlysasnleu

865870875880

alaphesermetvalaspleuleuthrglualalysserphealaala

885890895

gluglythrglyphethrgluleuglyglygluileasnalaglnile

900905910

lysargglyaspleuleutyrvalaspvalalalysglytyrglythr

915920925

glyleuleuvalserargalasertyrglualaglulysserileleu

930935940

arghisileleugluglylysglualavalthrproleumetgluarg

945950955960

valproglygluleumetgluthrleuthrserglyglnargalaala

965970975

thrargmetileleugluthrseraspargphethrvalvalglngly

980985990

tyralaglyvalglylysthrthrglnpheargalavalmetserala

99510001005

valasnmetleuproalasergluargproargvalvalglyleu

101010151020

glyprothrhisargalavalglyglumetargseralaglyval

102510301035

aspalaglnthrleualaserpheleuhisaspthrglnleugln

104010451050

glnargserglygluthrproasppheserasnthrleupheleu

105510601065

leuaspglusersermetvalglyasnthrglumetalaargala

107010751080

tyralaleuilealaalaglyglyglyargalavalalasergly

108510901095

aspthraspglnleuglnalailealaproglyglnserphearg

110011051110

leuglnglnthrargseralaalaaspvalvalilemetlysglu

111511201125

ilevalargglnthrprogluleuargglualavaltyrserleu

113011351140

ileasnargaspvalgluargalaleuserglyleugluserval

114511501155

lysproserglnvalproargleugluglyalatrpalaproglu

116011651170

hisservalthrglupheserhisserglnglualalysleuala

117511801185

glualaglnglnlysalametleulysglyglualapheproasp

119011951200

ileprometthrleutyrglualailevalargasptyrthrgly

120512101215

argthrproglualaarggluglnthrleuilevalthrhisleu

122012251230

asngluaspargargvalleuasnsermetilehisaspalaarg

123512401245

glulysalaglygluleuglylysgluglnvalmetvalproval

125012551260

leuasnthralaasnileargaspglygluleuargargleuser

126512701275

thrtrpglulysasnproaspalaleualaleuvalaspasnval

128012851290

tyrhisargilealaglyileserlysaspaspglyleuilethr

129513001305

leuglnaspalagluglyasnthrargleuileserproargglu

131013151320

alavalalagluglyvalthrleutyrthrproasplysilearg

132513301335

valglythrglyaspargmetargphethrlysseraspargglu

134013451350

argglytyrvalalaasnservaltrpthrvalthralavalser

135513601365

glyaspservalthrleuseraspglyglnglnthrargvalile

137013751380

argproglyglngluargalagluglnhisileaspleualatyr

138513901395

alailethralahisglyalaglnglyalasergluthrpheala

140014051410

ilealaleugluglythrgluglyasnarglysleumetalagly

141514201425

phegluseralatyrvalalaleuserargmetlysglnhisval

143014351440

glnvaltyrthraspasnargglnglytrpthraspalaileasn

144514501455

asnalavalglnlysglythralahisaspvalleugluprolys

146014651470

proasparggluvalmetasnalaglnargleupheserthrala

147514801485

arggluleuargaspvalalaalaglyargalavalleuarggln

149014951500

alaglyleualaglyglyaspserproalaargpheilealapro

150515101515

glyarglystyrproglnprotyrvalalaleuproalapheasp

152015251530

argasnglylysseralaglyiletrpleuasnproleuthrthr

153515401545

aspaspglyasnglyleuargglypheserglygluglyargval

155015551560

lysglyserglyaspalaglnphevalalaleuglnglyserarg

156515701575

asnglygluserleuleualaaspasnmetglnaspglyvalarg

158015851590

ilealaargaspasnproaspserglyvalvalvalargileala

159516001605

glygluglyargprotrpasnproglyalailethrglyglyarg

161016151620

valtrpglyaspileproaspasnservalglnproglyalagly

162516301635

asnglygluprovalthralagluvalleualaglnargglnala

164016451650

gluglualaileargarggluthrgluargargalaaspgluile

165516601665

valarglysmetalagluasnlysproaspleuproaspglylys

167016751680

thrgluleualavalargaspilealaglyglngluargasparg

168516901695

seralailesergluarggluthralaleuprogluservalleu

170017051710

arggluserglnarggluargglualavalarggluvalalaarg

171517201725

gluasnleuleuglngluargleuglnglnmetgluargaspmet

173017351740

valargaspleuglnlysglulysthrleuglyglyasp

174517501755

<210>23

<211>726

<212>prt

<213>伯氏甲烷球菌(methanococcoidesburtonii)

<400>23

metserasplysproalaphemetlystyrphethrglnsersercys

151015

tyrproasnglnglnglualametaspargilehisseralaleumet

202530

glnglnglnleuvalleuphegluglyalacysglythrglylysthr

354045

leuseralaleuvalproalaleuhisvalglylysmetleuglylys

505560

thrvalileilealathrasnvalhisglnglnmetvalglnpheile

65707580

asnglualaargaspilelyslysvalglnaspvallysvalalaval

859095

ilelysglylysthralametcysproglnglualaasptyrgluglu

100105110

cysservallysarggluasnthrphegluleumetgluthrgluarg

115120125

gluiletyrleulysargglngluleuasnseralaargaspsertyr

130135140

lyslysserhisaspproalaphevalthrleuargaspgluleuser

145150155160

lysgluileaspalavalgluglulysalaargglyleuargasparg

165170175

alacysasnaspleutyrgluvalleuargseraspserglulysphe

180185190

argglutrpleutyrlysgluvalargserproglugluileasnasp

195200205

hisalailelysaspglymetcysglytyrgluleuvallysargglu

210215220

leulyshisalaaspleuleuilecysasntyrhishisvalleuasn

225230235240

proaspilepheserthrvalleuglytrpileglulysgluprogln

245250255

gluthrilevalilepheaspglualahisasnleugluseralaala

260265270

argserhisserserleuserleuthrgluhisserileglulysala

275280285

ilethrgluleuglualaasnleuaspleuleualaaspaspasnile

290295300

hisasnleupheasnilepheleugluvalileseraspthrtyrasn

305310315320

serargphelyspheglygluarggluargvalarglysasntrptyr

325330335

aspileargileseraspprotyrgluargasnaspilevalarggly

340345350

lyspheleuargglnalalysglyasppheglyglulysaspaspile

355360365

glnileleuleuserglualasergluleuglyalalysleuaspglu

370375380

thrtyrargaspglntyrlyslysglyleuserservalmetlysarg

385390395400

serhisileargtyrvalalaaspphemetseralatyrilegluleu

405410415

serhisasnleuasntyrtyrproileleuasnvalargargaspmet

420425430

asnaspgluiletyrglyargvalgluleuphethrcysileprolys

435440445

asnvalthrgluproleupheasnserleupheservalileleumet

450455460

seralathrleuhispropheglumetvallyslysthrleuglyile

465470475480

thrargaspthrcysglumetsertyrglythrserpheprogluglu

485490495

lysargleuserilealavalserileproproleuphealalysasn

500505510

argaspasparghisvalthrgluleuleugluglnvalleuleuasp

515520525

serilegluasnserlysglyasnvalileleuphepheglnserala

530535540

pheglualalysargtyrtyrserlysilegluproleuvalasnval

545550555560

provalpheleuaspgluvalglyileserserglnaspvalargglu

565570575

gluphepheserileglyglugluasnglylysalavalleuleuser

580585590

tyrleutrpglythrleusergluglyileasptyrargaspglyarg

595600605

glyargthrvalileileileglyvalglytyrproalaleuasnasp

610615620

argmetasnalavalgluseralatyrasphisvalpheglytyrgly

625630635640

alaglytrpgluphealaileglnvalprothrilearglysilearg

645650655

glnalametglyargvalvalargserprothrasptyrglyalaarg

660665670

ileleuleuaspglyargpheleuthraspserlyslysargphegly

675680685

lyspheservalphegluvalpheproproalagluargsergluphe

690695700

valaspvalaspproglulysvallystyrserleumetasnphephe

705710715720

metaspasnaspglugln

725

<210>24

<211>439

<212>prt

<213>菊欧文菌(dickeyadadantii)

<400>24

metthrpheaspaspleuthrgluglyglnlysasnalapheasnile

151015

valmetlysalailelysglulyslyshishisvalthrileasngly

202530

proalaglythrglylysthrthrleuthrlyspheileilegluala

354045

leuileserthrglygluthrglyileileleualaalaprothrhis

505560

alaalalyslysileleuserlysleuserglylysglualaserthr

65707580

ilehisserileleulysileasnprovalthrtyrglugluasnval

859095

leuphegluglnlysgluvalproaspleualalyscysargvalleu

100105110

ilecysaspgluvalsermettyrasparglysleuphelysileleu

115120125

leuserthrileproprotrpcysthrileileglyileglyaspasn

130135140

lysglnileargprovalaspproglygluasnthralatyrileser

145150155160

prophephethrhislysaspphetyrglncysgluleuthrgluval

165170175

lysargserasnalaproileileaspvalalathraspvalargasn

180185190

glylystrpiletyrasplysvalvalaspglyhisglyvalarggly

195200205

phethrglyaspthralaleuargaspphemetvalasntyrpheser

210215220

ilevallysserleuaspaspleuphegluasnargvalmetalaphe

225230235240

thrasnlysservalasplysleuasnserileilearglyslysile

245250255

phegluthrasplysasppheilevalglygluileilevalmetgln

260265270

gluproleuphelysthrtyrlysileaspglylysprovalserglu

275280285

ileilepheasnasnglyglnleuvalargileileglualaglutyr

290295300

thrserthrphevallysalaargglyvalproglyglutyrleuile

305310315320

arghistrpaspleuthrvalgluthrtyrglyaspaspglutyrtyr

325330335

argglulysilelysileileserseraspglugluleutyrlysphe

340345350

asnleupheleuglylysthralagluthrtyrlysasntrpasnlys

355360365

glyglylysalaprotrpseraspphetrpaspalalysserglnphe

370375380

serlysvallysalaleuproalaserthrphehislysalaglngly

385390395400

metservalaspargalapheiletyrthrprocysilehistyrala

405410415

aspvalgluleualaglnglnleuleutyrvalglyvalthrarggly

420425430

argtyraspvalphetyrval

435

<210>25

<211>970

<212>prt

<213>未知的(unknown)

<400>25

metleuservalalaasnvalargserproseralaalaalasertyr

151015

phealaseraspasntyrtyralaseralaaspalaaspargsergly

202530

glntrpileglyaspglyalalysargleuglyleugluglylysval

354045

glualaargalapheaspalaleuleuargglygluleuproaspgly

505560

serservalglyasnproglyglnalahisargproglythraspleu

65707580

thrpheservalprolyssertrpserleuleualaleuvalglylys

859095

aspgluargileilealaalatyrargglualavalvalglualaleu

100105110

histrpalaglulysasnalaalagluthrargvalvalglulysgly

115120125

metvalvalthrglnalathrglyasnleualaileglyleuphegln

130135140

hisaspthrasnargasnglngluproasnleuhisphehisalaval

145150155160

ilealaasnvalthrglnglylysaspglylystrpargthrleulys

165170175

asnaspargleutrpglnleuasnthrthrleuasnserilealamet

180185190

alaargpheargvalalavalglulysleuglytyrgluproglypro

195200205

valleulyshisglyasnpheglualaargglyileserargglugln

210215220

valmetalapheserthrargarglysgluvalleuglualaargarg

225230235240

glyproglyleuaspalaglyargilealaalaleuaspthrargala

245250255

serlysgluglyilegluaspargalathrleuserlysglntrpser

260265270

glualaalaglnserileglyleuaspleulysproleuvalasparg

275280285

alaargthrlysalaleuglyglnglymetglualathrargilegly

290295300

serleuvalgluargglyargalatrpleuserargphealaalahis

305310315320

valargglyaspproalaaspproleuvalproproservalleulys

325330335

glnaspargglnthrilealaalaalaglnalavalalaseralaval

340345350

arghisleuserglnargglualaalaphegluargthralaleutyr

355360365

lysalaalaleuasppheglyleuprothrthrilealaaspvalglu

370375380

lysargthrargalaleuvalargserglyaspleuilealaglylys

385390395400

glygluhislysglytrpleualaserargaspalavalvalthrglu

405410415

glnargileleusergluvalalaalaglylysglyaspserserpro

420425430

alailethrproglnlysalaalaalaservalglnalaalaalaleu

435440445

thrglyglnglypheargleuasngluglyglnleualaalaalaarg

450455460

leuileleuileserlysaspargthrilealavalglnglyileala

465470475480

glyalaglylysserservalleulysprovalalagluvalleuarg

485490495

aspgluglyhisprovalileglyleualaileglnasnthrleuval

500505510

glnmetleugluargaspthrglyileglyserglnthrleualaarg

515520525

pheleuglyglytrpasnlysleuleuaspaspproglyasnvalala

530535540

leuargalaglualaglnalaserleulysasphisvalleuvalleu

545550555560

aspglualasermetvalserasngluasplysglulysleuvalarg

565570575

leualaasnleualaglyvalhisargleuvalleuileglyasparg

580585590

lysglnleuglyalavalaspalaglylysprophealaleuleugln

595600605

argalaglyilealaargalaglumetalathrasnleuargalaarg

610615620

aspprovalvalargglualaglnalaalaalaglnalaglyaspval

625630635640

arglysalaleuarghisleulysserhisthrvalglualaarggly

645650655

aspglyalaglnvalalaalagluthrtrpleualaleuasplysglu

660665670

thrargalaargthrseriletyralaserglyargalaileargser

675680685

alavalasnalaalavalglnglnglyleuleualaserarggluile

690695700

glyproalalysmetlysleugluvalleuaspargvalasnthrthr

705710715720

argglugluleuarghisleuproalatyrargalaglyargvalleu

725730735

gluvalserarglysglnglnalaleuglyleupheileglyglutyr

740745750

argvalileglyglnasparglysglylysleuvalgluvalgluasp

755760765

lysargglylysargpheargpheaspproalaargileargalagly

770775780

lysglyaspaspasnleuthrleuleugluproarglysleugluile

785790795800

hisgluglyaspargileargtrpthrargasnasphisargarggly

805810815

leupheasnalaaspglnalaargvalvalgluilealaasnglylys

820825830

valthrphegluthrserlysglyaspleuvalgluleulyslysasp

835840845

aspprometleulysargileaspleualatyralaleuasnvalhis

850855860

metalaglnglyleuthrseraspargglyilealavalmetaspser

865870875880

arggluargasnleuserasnglnlysthrpheleuvalthrvalthr

885890895

argleuargasphisleuthrleuvalvalaspseralaasplysleu

900905910

glyalaalavalalaargasnlysglyglulysalaseralaileglu

915920925

valthrglyservallysprothralathrlysglyserglyvalasp

930935940

glnprolysservalglualaasnlysalaglulysgluleuthrarg

945950955960

serlysserlysthrleuasppheglyile

965970

<210>26

<211>262

<212>prt

<213>雷金斯堡约克氏菌(yokenellaregensburgei)

<400>26

cysleuthralaproprolysglualaalalysprothrleumetpro

151015

argalaglnsertyrargaspleuthrhisleuproleuprosergly

202530

lysvalphevalservaltyrasnileglnaspgluthrglyglnphe

354045

lysprotyrproalaserasnpheserthralavalproglnserala

505560

thralametleuvalthralaleulysaspserargtrpphevalpro

65707580

leugluargglnglyleuglnasnleuleuasngluarglysileile

859095

argalaalaglngluasnglythrvalalaaspasnasnargilepro

100105110

leuglnserleuthralaalaasnvalmetilegluglyserileile

115120125

glytyrgluserasnvallysserglyglyvalglyalaargtyrphe

130135140

glyileglyalaaspthrglntyrglnleuaspglnilealavalasn

145150155160

leuargvalvalasnvalserthrglygluvalleuserservalasn

165170175

thrserlysthrileleusertyrgluvalglnalaglyvalphearg

180185190

phevalasptyrglnargleuleugluglygluileglytyrthrser

195200205

asngluprovalmetleucysleumetseralailegluthrglyval

210215220

iletyrleuileasnaspglyilegluargglyleutrpaspleugln

225230235240

glnlysalaaspvalaspasnproileleualaargtyrargasnmet

245250255

seralaproprogluser

260

<210>27

<211>262

<212>prt

<213>灰尘粘菌(cronobacterpulveris)

<400>27

cysleuthralaproprolysglualaalalysprothrleumetpro

151015

argalaglnsertyrargaspleuthrasnleuproaspprolysgly

202530

lysleuphevalservaltyrasnileglnaspgluthrglyglnphe

354045

lysprotyrproalaserasnpheserthralavalproglnserala

505560

thrsermetleuvalthralaleulysaspserargtrppheilepro

65707580

leugluargglnglyleuglnasnleuleuasngluarglysileile

859095

argalaalaglngluasnglythrvalalagluasnasnargmetpro

100105110

leuglnserleuvalalaalaasnvalmetilegluglyserileile

115120125

glytyrgluserasnvallysserglyglyvalglyalaargtyrphe

130135140

glyileglyglyaspthrglntyrglnleuaspglnilealavalasn

145150155160

leuargvalvalasnvalserthrglygluvalleuserservalasn

165170175

thrserlysthrileleusertyrgluvalglnalaglyvalphearg

180185190

pheileasptyrglnargleuleugluglygluileglytyrthrala

195200205

asngluprovalmetleucysleumetseralailegluthrglyval

210215220

ilehisleuileasnaspglyileasnargglyleutrpgluleulys

225230235240

asnlysglyaspalalysasnthrileleualalystyrargsermet

245250255

alavalproprogluser

260

<210>28

<211>262

<212>prt

<213>水生拉恩菌(rahnellaaquatilis)

<400>28

cysleuthralaalaprolysglualaalaargprothrleuleupro

151015

argalaprosertyrthraspleuthrhisleuproserproglngly

202530

argilephevalservaltyrasnileglnaspgluthrglyglnphe

354045

lysprotyrproalacysasnpheserthralavalproglnserala

505560

thralametleuvalseralaleulysaspserlystrppheilepro

65707580

leugluargglnglyleuglnasnleuleuasngluarglysileile

859095

argalaalaglngluasnglyservalalaileasnasnglnargpro

100105110

leuserserleuvalalaalaasnileleuilegluglyserileile

115120125

glytyrgluserasnvallysserglyglyvalglyalaargtyrphe

130135140

glyileglyalaserthrglntyrglnleuaspglnilealavalasn

145150155160

leuargalavalaspvalasnthrglygluvalleuserservalasn

165170175

thrserlysthrileleusertyrgluvalglnalaglyvalphearg

180185190

pheileasptyrglnargleuleugluglygluleuglytyrthrthr

195200205

asngluprovalmetleucysleumetseralailegluserglyval

210215220

iletyrleuvalasnaspglyilegluargasnleutrpglnleugln

225230235240

asnprosergluileasnserproileleuglnargtyrlysasnasn

245250255

ilevalproalagluser

260

<210>29

<211>259

<212>prt

<213>抗坏血酸克吕沃尔菌(kluyveraascobata)

<400>29

cysilethrserproprolysglnalaalalysprothrleuleupro

151015

argserglnsertyrglnaspleuthrhisleuprogluproglngly

202530

argleuphevalservaltyrasnileseraspgluthrglyglnphe

354045

lysprotyrproalaserasnpheserthrservalproglnserala

505560

thralametleuvalseralaleulysaspserasntrppheilepro

65707580

leugluargglnglyleuglnasnleuleuasngluarglysileile

859095

argalaalaglngluasnglythrvalalavalasnasnargthrgln

100105110

leuproserleuvalalaalaasnileleuilegluglyserileile

115120125

glytyrgluserasnvallysserglyglyalaglyalaargtyrphe

130135140

glyileglyalaserthrglntyrglnleuaspglnilealavalasn

145150155160

leuargvalvalasnvalserthrglygluvalleuserservalasn

165170175

thrserlysthrileleusertyrglupheglnalaglyvalphearg

180185190

tyrileasptyrglnargleuleugluglygluvalglytyrthrval

195200205

asngluprovalmetleucysleumetseralailegluthrglyval

210215220

iletyrleuvalasnaspglyileserargasnleutrpglnleulys

225230235240

asnalaseraspileasnserprovalleuglulystyrlysserile

245250255

ilevalpro

<210>30

<211>259

<212>prt

<213>蜂房哈夫尼菌(hafniaalvei)

<400>30

cysleuthralaproprolysglnalaalalysprothrleumetpro

151015

argalaglnsertyrglnaspleuthrhisleuprogluproalagly

202530

lysleuphevalservaltyrasnileglnaspgluthrglyglnphe

354045

lysprotyrproalaserasnpheserthralavalproglnserala

505560

thralametleuvalseralaleulysaspserglytrppheilepro

65707580

leugluargglnglyleuglnasnleuleuasngluarglysileile

859095

argalaalaglngluasnglythralaalavalasnasnglnhisgln

100105110

leuserserleuvalalaalaasnvalleuvalgluglyserileile

115120125

glytyrgluserasnvallysserglyglyalaglyalaargphephe

130135140

glyileglyalaserthrglntyrglnleuaspglnilealavalasn

145150155160

leuargvalvalaspvalasnthrglyglnvalleuserservalasn

165170175

thrserlysthrileleusertyrgluvalglnalaglyvalphearg

180185190

tyrileasptyrglnargleuleugluglygluileglytyrthrthr

195200205

asngluprovalmetleucysvalmetseralailegluthrglyval

210215220

iletyrleuvalasnaspglyileasnargasnleutrpthrleulys

225230235240

asnproglnaspalalysserservalleugluargtyrlysserthr

245250255

ilevalpro

<210>31

<211>255

<212>prt

<213>肠杆菌科细菌(enterobacteriaceaebacterium)

<400>31

cysilethrthrproproglnglualaalalysprothrleuleupro

151015

argaspalathrtyrlysaspleuvalserleuproglnproarggly

202530

lysiletyrvalalavaltyrasnileglnaspgluthrglyglnphe

354045

glnprotyrproalaserasnpheserthrservalproglnserala

505560

thralametleuvalserserleulysaspserargtrpphevalpro

65707580

leugluargglnglyleuasnasnleuleuasngluarglysileile

859095

argalaalaglnglnasnglythrvalglyaspasnasnalaserpro

100105110

leuproserleutyrseralaasnvalilevalgluglyserileile

115120125

glytyralaserasnvallysthrglyglypheglyalaargtyrphe

130135140

glyileglyglyserthrglntyrglnleuaspglnvalalavalasn

145150155160

leuargilevalasnvalhisthrglygluvalleuserservalasn

165170175

thrserlysthrileleusertyrgluileglnalaglyvalphearg

180185190

pheileasptyrglnargleuleugluglyglualaglyphethrthr

195200205

asngluprovalmetthrcysleumetseralaileglugluglyval

210215220

ilehisleuileasnaspglyileasnlyslysleutrpalaleuser

225230235240

asnalaalaaspileasnsergluvalleuthrargtyrarglys

245250255

<210>32

<211>258

<212>prt

<213>类志贺邻单胞菌(plesiomonasshigelloides)

<400>32

ilethrgluvalprolysglualaalalysprothrleumetproarg

151015

alaserthrtyrlysaspleuvalalaleuprolysproasnglylys

202530

ileilevalservaltyrservalglnaspgluthrglyglnphelys

354045

proleuproalaserasnpheserthralavalproglnserglyasn

505560

alametleuthrseralaleulysaspserglytrpphevalproleu

65707580

gluarggluglyleuglnasnleuleuasngluarglysileilearg

859095

alaalaglngluasnglythrvalalaalaasnasnglnglnproleu

100105110

proserleuleuseralaasnvalvalilegluglyalaileilegly

115120125

tyraspseraspilelysthrglyglyalaglyalaargtyrphegly

130135140

ileglyalaaspglylystyrargvalaspglnvalalavalasnleu

145150155160

argalavalaspvalargthrglygluvalleuleuservalasnthr

165170175

serlysthrileleusersergluleuseralaglyvalpheargphe

180185190

ileglutyrglnargleuleugluleuglualaglytyrthrthrasn

195200205

gluprovalmetmetcysmetmetseralaleuglualaglyvalala

210215220

hisleuilevalgluglyileargglnasnleutrpserleuglnasn

225230235240

proseraspileasnasnproileileglnargtyrmetlysgluasp

245250255

valpro

<210>33

<211>248

<212>prt

<213>费希弧菌(vibriofischeri)

<400>33

progluthrsergluserprothrleumetglnargglyalaasntyr

151015

ileaspleuileserleuprolysproglnglylysilephevalser

202530

valtyrasppheargaspglnthrglyglntyrlysproglnproasn

354045

serasnpheserthralavalproglnglyglythralaleuleuthr

505560

metalaleuleuaspserglutrpphetyrproleugluargglngly

65707580

leuglnasnleuleuthrgluarglysileileargalaalaglnlys

859095

lysglngluserileserasnhisglyserthrleuproserleuleu

100105110

seralaasnvalmetilegluglyglyilevalalatyraspserasn

115120125

ilelysthrglyglyalaglyalaargtyrleuglyileglyglyser

130135140

glyglntyrargalaaspglnvalthrvalasnileargalavalasp

145150155160

valargserglylysileleuthrservalthrthrserlysthrile

165170175

leusertyrgluvalseralaglyalapheargphevalasptyrlys

180185190

gluleuleugluvalgluleuglytyrthrasnasngluprovalasn

195200205

ilealaleumetseralaileaspseralavalilehisleuileval

210215220

lysglyvalglnglnglyleutrpargproalaasnleuaspthrarg

225230235240

asnasnproilephelyslystyr

245

<210>34

<211>248

<212>prt

<213>洛伊氏弧菌(aliivibriologei)

<400>34

proaspalasergluserprothrleumetglnargglyalathrtyr

151015

leuaspleuileserleuprolysproglnglylysiletyrvalser

202530

valtyrasppheargaspglnthrglyglntyrlysproglnproasn

354045

serasnpheserthralavalproglnglyglythralaleuleuthr

505560

metalaleuleuaspserglutrpphetyrproleugluargglngly

65707580

leuglnasnleuleuthrgluarglysileileargalaalaglnlys

859095

lysglngluserileserasnhisglyserthrleuproserleuleu

100105110

seralaasnvalmetilegluglyglyilevalalatyraspserasn

115120125

ilelysthrglyglyalaglyalaargtyrleuglyileglyglyser

130135140

glyglntyrargalaaspglnvalthrvalasnileargalavalasp

145150155160

valargserglylysileleuthrservalthrthrserlysthrile

165170175

leusertyrgluleuseralaglyalapheargphevalasptyrlys

180185190

gluleuleugluvalgluleuglytyrthrasnasngluprovalasn

195200205

ilealaleumetseralaileaspseralavalilehisleuileval

210215220

lysglyileglugluglyleutrpargprogluasnglnasnglylys

225230235240

gluasnproilephearglystyr

245

<210>35

<211>254

<212>prt

<213>发光杆菌属(photobacteriumsp)

<400>35

progluthrserlysgluprothrleumetalaargglythralatyr

151015

glnaspleuvalserleuproleuprolysglylysvaltyrvalser

202530

valtyrasppheargaspglnthrglyglntyrlysproglnproasn

354045

serasnpheserthralavalproglnglyglyalaalaleuleuthr

505560

thralaleuleuaspserargtrpphemetproleugluargglugly

65707580

leuglnasnleuleuthrgluarglysileileargalaalaglnlys

859095

lysaspgluileprothrasnhisglyvalhisleuproserleuala

100105110

seralaasnilemetvalgluglyglyilevalalatyraspthrasn

115120125

ileglnthrglyglyalaglyalaargtyrleuglyvalglyalaser

130135140

glyglntyrargthraspglnvalthrvalasnileargalavalasp

145150155160

valargthrglyargileleuleuservalthrthrserlysthrile

165170175

leuserlysgluleuglnthrglyvalphelysphevalasptyrlys

180185190

aspleuleuglualagluleuglytyrthrthrasngluprovalasn

195200205

leualavalmetseralaileaspalaalavalvalhisvalileval

210215220

aspglyilelysthrglyleutrpgluproleuargglygluaspleu

225230235240

glnhisproileileglnglutyrmetasnargserlyspro

245250

<210>36

<211>261

<212>prt

<213>维氏气单胞菌(aeromonasveronii)

<400>36

cysalathrhisileglyserprovalalaaspglulysalathrleu

151015

metproargservalsertyrlysgluleuileserleuprolyspro

202530

lysglylysilevalalaalavaltyrasppheargaspglnthrgly

354045

glntyrleuproalaproalaserasnpheserthralavalthrgln

505560

glyglyvalalametleuserthralaleutrpaspserglntrpphe

65707580

valproleugluarggluglyleuglnasnleuleuthrgluarglys

859095

ilevalargalaalaglnasnlysproasnvalproglyasnasnala

100105110

asnglnleuproserleuvalalaalaasnileleuilegluglygly

115120125

ilevalalatyraspserasnvalargthrglyglyalaglyalalys

130135140

tyrpheglyileglyalaserglyglutyrargvalaspglnvalthr

145150155160

valasnleuargalavalaspileargserglyargileleuasnser

165170175

valthrthrserlysthrvalmetserglnglnvalglnalaglyval

180185190

pheargphevalglutyrlysargleuleuglualaglualaglyphe

195200205

serthrasngluprovalglnmetcysvalmetseralailegluser

210215220

glyvalileargleuilealaasnglyvalargaspasnleutrpgln

225230235240

leualaaspglnargaspileaspasnproileleuglnglutyrleu

245250255

glnaspasnalapro

260

<210>37

<211>239

<212>prt

<213>希瓦氏菌属(shewanellasp.)

<400>37

alaserserserleumetprolysglyglusertyrtyraspleuile

151015

asnleuproalaproglnglyvalmetleualaalavaltyraspphe

202530

argaspglnthrglyglntyrlysproileproserserasnpheser

354045

thralavalproglnserglythralapheleualaglnalaleuasn

505560

aspsersertrppheileprovalgluarggluglyleuglnasnleu

65707580

leuthrgluarglysilevalargalaglyleulysglyaspalaasn

859095

lysleuproglnleuasnseralaglnileleumetgluglyglyile

100105110

valalatyraspthrasnvalargthrglyglyalaglyalaargtyr

115120125

leuglyileglyalaalathrglnpheargvalaspthrvalthrval

130135140

asnleuargalavalaspileargthrglyargleuleuserserval

145150155160

thrthrthrlysserileleuserlysgluilethralaglyvalphe

165170175

lyspheileaspalaglngluleuleuglusergluleuglytyrthr

180185190

serasngluprovalserleucysvalalaseralailegluserala

195200205

valvalhismetilealaaspglyiletrplysglyalatrpasnleu

210215220

alaaspglnalaserglyleuargserprovalleuglnlystyr

225230235

<210>38

<211>233

<212>prt

<213>恶臭假单胞菌(pseudomonasputida)

<400>38

glnaspsergluthrprothrleuthrproargalaserthrtyrtyr

151015

aspleuileasnmetproargprolysglyargleumetalavalval

202530

tyrglypheargaspglnthrglyglntyrlysprothrproalaser

354045

serpheserthrservalthrglnglyalaalasermetleumetasp

505560

alaleuseralaserglytrpphevalvalleugluarggluglyleu

65707580

glnasnleuleuthrgluarglysileileargalaserglnlyslys

859095

proaspvalalagluasnilemetglygluleuproproleuglnala

100105110

alaasnleumetleugluglyglyileilealatyraspthrasnval

115120125

argserglyglygluglyalaargtyrleuglyileaspileserarg

130135140

glutyrargvalaspglnvalthrvalasnleuargalavalaspval

145150155160

argthrglyglnvalleualaasnvalmetthrserlysthriletyr

165170175

servalglyargseralaglyvalphelyspheilegluphelyslys

180185190

leuleuglualagluvalglytyrthrthrasngluproalaglnleu

195200205

cysvalleuseralailegluseralavalglyhisleuleualagln

210215220

glyilegluglnargleutrpglnval

225230

<210>39

<211>234

<212>prt

<213>堇色希瓦氏菌(shewanellaviolacea)

<400>39

metprolysseraspthrtyrtyraspleuileglyleuprohispro

151015

glnglysermetleualaalavaltyrasppheargaspglnthrgly

202530

glntyrlysalaileproserserasnpheserthralavalprogln

354045

serglythralapheleualaglnalaleuasnaspsersertrpphe

505560

valprovalgluarggluglyleuglnasnleuleuthrgluarglys

65707580

ilevalargalaglyleulysglyglualaasnglnleuproglnleu

859095

serseralaglnileleumetgluglyglyilevalalatyraspthr

100105110

asnilelysthrglyglyalaglyalaargtyrleuglyileglyval

115120125

asnserlyspheargvalaspthrvalthrvalasnleuargalaval

130135140

aspileargthrglyargleuleuserservalthrthrthrlysser

145150155160

ileleuserlysgluvalseralaglyvalphelyspheileaspala

165170175

glnaspleuleuglusergluleuglytyrthrserasngluproval

180185190

serleucysvalalaglnalailegluseralavalvalhismetile

195200205

alaaspglyiletrplysargalatrpasnleualaaspthralaser

210215220

glyleuasnasnprovalleuglnlystyr

225230

<210>40

<211>245

<212>prt

<213>詹氏海杆菌(marinobacteriumjannaschii)

<400>40

leuthrargargmetserthrtyrglnaspleuileaspmetproala

151015

proargglylysilevalthralavaltyrserpheargaspglnser

202530

glyglntyrlysproalaproserserserpheserthralavalthr

354045

glnglyalaalaalametleuvalasnvalleuasnaspserglytrp

505560

pheileproleugluarggluglyleuglnasnileleuthrgluarg

65707580

lysileileargalaalaleulyslysaspasnvalprovalasnasn

859095

seralaglyleuproserleuleualaalaasnilemetleuglugly

100105110

glyilevalglytyraspserasnilehisthrglyglyalaglyala

115120125

argtyrpheglyileglyalaserglulystyrargvalaspgluval

130135140

thrvalasnleuargalaileaspileargthrglyargileleuhis

145150155160

servalleuthrserlyslysileleuserarggluileargserasp

165170175

valtyrargpheilegluphelyshisleuleuglumetglualagly

180185190

ilethrthrasnaspproalaglnleucysvalleuseralaileglu

195200205

seralavalalahisleuilevalaspglyvalilelyslyssertrp

210215220

serleualaaspproasngluleuasnserprovalileglnalatyr

225230235240

glnglnglnargile

245

<210>41

<211>234

<212>prt

<213>生鲜奶金黄杆菌属(chryseobacteriumoranimense)

<400>41

proseraspprogluargserthrmetglygluleuthrproserthr

151015

alagluleuargasnleuproleuproasnglulysilevalilegly

202530

valtyrlyspheargaspglnthrglyglntyrlysprosergluasn

354045

glyasnasntrpserthralavalproglnglythrthrthrileleu

505560

ilelysalaleugluaspserargtrppheileproilegluargglu

65707580

asnilealaasnleuleuasngluargglnileileargserthrarg

859095

glnglutyrmetlysaspalaasplysasnserglnserleupropro

100105110

leuleutyralaglyileleuleugluglyglyvalilesertyrasp

115120125

serasnthrmetthrglyglypheglyalaargtyrpheglyilegly

130135140

alaserthrglntyrargglnaspargilethriletyrleuargala

145150155160

valserthrleuasnglygluileleulysthrvaltyrthrserlys

165170175

thrileleuserthrservalasnglyserphepheargtyrileasp

180185190

thrgluargleuleuglualagluvalglyleuthrglnasnglupro

195200205

valglnleualavalthrglualaileglulysalavalargserleu

210215220

ileilegluglythrargasplysiletrp

225230

<210>42

<211>12

<212>dna

<213>人工序列(artificialsequence)

<220>

<223>实例2

<400>42

tttttttttttt12

<210>43

<211>27

<212>dna

<213>人工序列(artificialsequence)

<220>

<223>实例2

<400>43

ggttgtttctgttggtgctgatattgc27

<210>44

<211>3635

<212>dna

<213>人工序列(artificialsequence)

<220>

<223>实例2

<400>44

gccatcagattgtgtttgttagtcgctgccatcagattgtgtttgttagtcgcttttttt60

ttttggaattttttttttggaattttttttttgcgctaacaacctcctgccgttttgccc120

gtgcatatcggtcacgaacaaatctgattactaaacacagtagcctggatttgttctatc180

agtaatcgaccttattcctaattaaatagagcaaatccccttattgggggtaagacatga240

agatgccagaaaaacatgacctgttggccgccattctcgcggcaaaggaacaaggcatcg300

gggcaatccttgcgtttgcaatggcgtaccttcgcggcagatataatggcggtgcgttta360

caaaaacagtaatcgacgcaacgatgtgcgccattatcgcctagttcattcgtgaccttc420

tcgacttcgccggactaagtagcaatctcgcttatataacgagcgtgtttatcggctaca480

tcggtactgactcgattggttcgcttatcaaacgcttcgctgctaaaaaagccggagtag540

aagatggtagaaatcaataatcaacgtaaggcgttcctcgatatgctggcgtggtcggag600

ggaactgataacggacgtcagaaaaccagaaatcatggttatgacgtcattgtaggcgga660

gagctatttactgattactccgatcaccctcgcaaacttgtcacgctaaacccaaaactc720

aaatcaacaggcgccggacgctaccagcttctttcccgttggtgggatgcctaccgcaag780

cagcttggcctgaaagacttctctccgaaaagtcaggacgctgtggcattgcagcagatt840

aaggagcgtggcgctttacctatgattgatcgtggtgatatccgtcaggcaatcgaccgt900

tgcagcaatatctgggcttcactgccgggcgctggttatggtcagttcgagcataaggct960

gacagcctgattgcaaaattcaaagaagcgggcggaacggtcagagagattgatgtatga1020

gcagagtcaccgcgattatctccgctctggttatctgcatcatcgtctgcctgtcatggg1080

ctgttaatcattaccgtgataacgccattacctacaaagcccagcgcgacaaaaatgcca1140

gagaactgaagctggcgaacgcggcaattactgacatgcagatgcgtcagcgtgatgttg1200

ctgcgctcgatgcaaaatacacgaaggagttagctgatgctaaagctgaaaatgatgctc1260

tgcgtgatgatgttgccgctggtcgtcgtcggttgcacatcaaagcagtctgtcagtcag1320

tgcgtgaagccaccaccgcctccggcgtggataatgcagcctccccccgactggcagaca1380

ccgctgaacgggattatttcaccctcagagagaggctgatcactatgcaaaaacaactgg1440

aaggaacccagaagtatattaatgagcagtgcagatagagttgcccatatcgatgggcaa1500

ctcatgcaattattgtgagcaatacacacgcgcttccagcggagtataaatgcctaaagt1560

aataaaaccgagcaatccatttacgaatgtttgctgggtttctgttttaacaacattttc1620

tgcgccgccacaaattttggctgcatcgacagttttcttctgcccaattccagaaacgaa1680

gaaatgatgggtgatggtttcctttggtgctactgctgccggtttgttttgaacagtaaa1740

cgtctgttgagcacatcctgtaataagcagggccagcgcagtagcgagtagcattttttt1800

catggtgttattcccgatgctttttgaagttcgcagaatcgtatgtgtagaaaattaaac1860

aaaccctaaacaatgagttgaaatttcatattgttaatatttattaatgtatgtcaggtg1920

cgatgaatcgtcattgtattcccggattaactatgtccacagccctgacggggaacttct1980

ctgcgggagtgtccgggaataattaaaacgatgcacacagggtttagcgcgtacacgtat2040

tgcattatgccaacgccccggtgctgacacggaagaaaccggacgttatgatttagcgtg2100

gaaagatttgtgtagtgttctgaatgctctcagtaaatagtaatgaattatcaaaggtat2160

agtaatatcttttatgttcatggatatttgtaacccatcggaaaactcctgctttagcaa2220

gattttccctgtattgctgaaatgtgatttctcttgatttcaacctatcataggacgttt2280

ctataagatgcgtgtttcttgagaatttaacatttacaacctttttaagtccttttatta2340

acacggtgttatcgttttctaacacgatgtgaatattatctgtggctagatagtaaatat2400

aatgtgagacgttgtgacgttttagttcagaataaaacaattcacagtctaaatcttttc2460

gcacttgatcgaatatttctttaaaaatggcaacctgagccattggtaaaaccttccatg2520

tgatacgagggcgcgtagtttgcattatcgtttttatcgtttcaatctggtctgacctcc2580

ttgtgttttgttgatgatttatgtcaaatattaggaatgttttcacttaatagtattggt2640

tgcgtaacaaagtgcggtcctgctggcattctggagggaaatacaaccgacagatgtatg2700

taaggccaacgtgctcaaatcttcatacagaaagatttgaagtaatattttaaccgctag2760

atgaagagcaagcgcatggagcgacaaaatgaataaagaacaatctgctgatgatccctc2820

cgtggatctgattcgtgtaaaaaatatgcttaatagcaccatttctatgagttaccctga2880

tgttgtaattgcatgtatagaacataaggtgtctctggaagcattcagagcaattgaggc2940

agcgttggtgaagcacgataataatatgaaggattattccctggtggttgactgatcacc3000

ataactgctaatcattcaaactatttagtctgtgacagagccaacacgcagtctgtcact3060

gtcaggaaagtggtaaaactgcaactcaattactgcaatgccctcgtaattaagtgaatt3120

tacaatatcgtcctgttcggagggaagaacgcgggatgttcattcttcatcacttttaat3180

tgatgtatatgctctcttttctgacgttagtctccgacggcaggcttcaatgacccaggc3240

tgagaaattcccggaccctttttgctcaagagcgatgttaatttgttcaatcatttggtt3300

aggaaagcggatgttgcgggttgttgttctgcgggttctgttcttcgttgacatgaggtt3360

gccccgtattcagtgtcgctgatttgtattgtctgaagttgtttttacgttaagttgatg3420

cagatcaattaatacgatacctgcgtcataattgattatttgacgtggtttgatggcctc3480

cacgcacgttgtgatatgtagatgataatcattatcactttacgggtcctttccggtgaa3540

aaaaaaggtaccaaaaaaaacatcgtcgtgagtagtgaaccgtaagccgttctgtttatg3600

tttcttggacactgattgacacggtttagtagaac3635

<210>45

<211>3636

<212>dna

<213>人工序列(artificialsequence)

<220>

<223>实例2

<400>45

ttttttttttttttttttttttttttttcaagaaacataaacagaacgtgcttacggttc60

actactcacgacgatgttttttttggtaccttttttttcaccggaaaggacccgtaaagt120

gataatgattatcatctacatatcacaacgtgcgtggaggccatcaaaccacgtcaaata180

atcaattatgacgcaggtatcgtattaattgatctgcatcaacttaacgtaaaaacaact240

tcagacaatacaaatcagcgacactgaatacggggcaacctcatgtcaacgaagaacaga300

acccgcagaacaacaacccgcaacatccgctttcctaaccaaatgattgaacaaattaac360

atcgctcttgagcaaaaagggtccgggaatttctcagcctgggtcattgaagcctgccgt420

cggagactaacgtcagaaaagagagcatatacatcaattaaaagtgatgaagaatgaaca480

tcccgcgttcttccctccgaacaggacgatattgtaaattcacttaattacgagggcatt540

gcagtaattgagttgcagttttaccactttcctgacagtgacagactgcgtgttggctct600

gtcacagactaaatagtttgaatgattagcagttatggtgatcagtcaaccaccagggaa660

taatccttcatattattatcgtgcttcaccaacgctgcctcaattgctctgaatgcttcc720

agagacaccttatgttctatacatgcaattacaacatcagggtaactcatagaaatggtg780

ctattaagcatattttttacacgaatcagatccacggagggatcatcagcagattgttct840

ttattcattttgtcgctccatgcgcttgctcttcatctagcggttaaaatattacttcaa900

atctttctgtatgaagatttgagcacgttggccttacatacatctgtcggttgtatttcc960

ctccagaatgccagcaggaccgcactttgttacgcaaccaatactattaagtgaaaacat1020

tcctaatatttgacataaatcatcaacaaaacacaaggaggtcagaccagattgaaacga1080

taaaaacgataatgcaaactacgcgccctcgtatcacatggaaggttttaccaatggctc1140

aggttgccatttttaaagaaatattcgatcaagtgcgaaaagatttagactgtgaattgt1200

tttattctgaactaaaacgtcacaacgtctcacattatatttactatctagccacagata1260

atattcacatcgtgttagaaaacgataacaccgtgttaataaaaggacttaaaaaggttg1320

taaatgttaaattctcaagaaacacgcatcttatagaaacgtcctatgataggttgaaat1380

caagagaaatcacatttcagcaatacagggaaaatcttgctaaagcaggagttttccgat1440

gggttacaaatatccatgaacataaaagatattactatacctttgataattcattactat1500

ttactgagagcattcagaacactacacaaatctttccacgctaaatcataacgtccggtt1560

tcttccgtgtcagcaccggggcgttggcataatgcaatacgtgtacgcgctaaaccctgt1620

gtgcatcgttttaattattcccggacactcccgcagagaagttccccgtcagggctgtgg1680

acatagttaatccgggaatacaatgacgattcatcgcacctgacatacattaataaatat1740

taacaatatgaaatttcaactcattgtttagggtttgtttaattttctacacatacgatt1800

ctgcgaacttcaaaaagcatcgggaataacaccatgaaaaaaatgctactcgctactgcg1860

ctggccctgcttattacaggatgtgctcaacagacgtttactgttcaaaacaaaccggca1920

gcagtagcaccaaaggaaaccatcacccatcatttcttcgtttctggaattgggcagaag1980

aaaactgtcgatgcagccaaaatttgtggcggcgcagaaaatgttgttaaaacagaaacc2040

cagcaaacattcgtaaatggattgctcggttttattactttaggcatttatactccgctg2100

gaagcgcgtgtgtattgctcacaataattgcatgagttgcccatcgatatgggcaactct2160

atctgcactgctcattaatatacttctgggttccttccagttgtttttgcatagtgatca2220

gcctctctctgagggtgaaataatcccgttcagcggtgtctgccagtcggggggaggctg2280

cattatccacgccggaggcggtggtggcttcacgcactgactgacagactgctttgatgt2340

gcaaccgacgacgaccagcggcaacatcatcacgcagagcatcattttcagctttagcat2400

cagctaactccttcgtgtattttgcatcgagcgcagcaacatcacgctgacgcatctgca2460

tgtcagtaattgccgcgttcgccagcttcagttctctggcatttttgtcgcgctgggctt2520

tgtaggtaatggcgttatcacggtaatgattaacagcccatgacaggcagacgatgatgc2580

agataaccagagcggagataatcgcggtgactctgctcatacatcaatctctctgaccgt2640

tccgcccgcttctttgaattttgcaatcaggctgtcagccttatgctcgaactgaccata2700

accagcgcccggcagtgaagcccagatattgctgcaacggtcgattgcctgacggatatc2760

accacgatcaatcataggtaaagcgccacgctccttaatctgctgcaatgccacagcgtc2820

ctgacttttcggagagaagtctttcaggccaagctgcttgcggtaggcatcccaccaacg2880

ggaaagaagctggtagcgtccggcgcctgttgatttgagttttgggtttagcgtgacaag2940

tttgcgagggtgatcggagtaatcagtaaatagctctccgcctacaatgacgtcataacc3000

atgatttctggttttctgacgtccgttatcagttccctccgaccacgccagcatatcgag3060

gaacgccttacgttgattattgatttctaccatcttctactccggcttttttagcagcga3120

agcgtttgataagcgaaccaatcgagtcagtaccgatgtagccgataaacacgctcgtta3180

tataagcgagattgctacttagtccggcgaagtcgagaaggtcacgaatgaactaggcga3240

taatggcgcacatcgttgcgtcgattactgtttttgtaaacgcaccgccattatatctgc3300

cgcgaaggtacgccattgcaaacgcaaggattgccccgatgccttgttcctttgccgcga3360

gaatggcggccaacaggtcatgtttttctggcatcttcatgtcttacccccaataagggg3420

atttgctctatttaattaggaataaggtcgattactgatagaacaaatccaggctactgt3480

gtttagtaatcagatttgttcgtgaccgatatgcacgggcaaaacggcaggaggttgtta3540

gcgcaaaaaaaaaattccaaaaaaaaaattccaaaaaaaaaaagcgactaacaaacacaa3600

tctgatggcagcgactaacaaacacaatctgatggc3636

<210>46

<211>28

<212>dna

<213>人工序列(artificialsequence)

<220>

<223>实例2

<400>46

gcaatatcagcaccaacagaaacaacct28

<210>47

<211>10

<212>prt

<213>人工序列(artificialsequence)

<220>

<223>strepii(c)

<400>47

seralatrpserhisproglnpheglulys

1510

<210>48

<211>15

<212>prt

<213>人工序列(artificialsequence)

<220>

<223>pro

<400>48

metglnargleupheleuleuvalalavalmetleuleusergly

151015

<210>49

<211>558

<212>dna

<213>耻垢分枝杆菌(mycobacteriumsmegmatis)

<400>49

atgggcctggataacgaacttagcctggtggacggccaagatcgcacgctgacggtgcaa60

caatgggataccttcctgaatggtgtgtttccgctggatcgtaaccgcctgacccgtgaa120

tggtttcattccggtcgcgcaaaatatatcgtcgcaggcccgggtgctgacgaattcgaa180

ggcacgctggaactgggttatcagattggctttccgtggtcactgggcgttggtatcaac240

ttctcgtacaccacgccgaatattctgatcgatgacggtgatattaccgcaccgccgttt300

ggcctgaacagcgtgattacgccgaacctgtttccgggtgttagcatctctgccgatctg360

ggcaacggtccgggcattcaagaagtggcaacctttagtgtggacgtttccggcgctgaa420

ggcggtgtcgcggtgtctaatgcccacggtaccgttacgggcgcggccggcggtgtcctg480

ctgcgtccgttcgcgcgcctgattgcgagcaccggcgactctgttacgacctatggcgaa540

ccgtggaatatgaactaa558

<210>50

<211>184

<212>prt

<213>耻垢分枝杆菌(mycobacteriumsmegmatis)

<400>50

glyleuaspasngluleuserleuvalaspglyglnaspargthrleu

151015

thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp

202530

argasnargleuthrargglutrpphehisserglyargalalystyr

354045

ilevalalaglyproglyalaaspgluphegluglythrleugluleu

505560

glytyrglnileglypheprotrpserleuglyvalglyileasnphe

65707580

sertyrthrthrproasnileleuileaspaspglyaspilethrala

859095

propropheglyleuasnservalilethrproasnleupheprogly

100105110

valserileseralaaspleuglyasnglyproglyileglngluval

115120125

alathrpheservalaspvalserglyalagluglyglyvalalaval

130135140

serasnalahisglythrvalthrglyalaalaglyglyvalleuleu

145150155160

argprophealaargleuilealaserthrglyaspservalthrthr

165170175

tyrglygluprotrpasnmetasn

180

<210>51

<211>35

<212>dna

<213>人工序列(artificialsequence)

<220>

<223>凝血酶结合适体

<400>51

ttttttttttttttttttttggttggtgtggttgg35

<210>52

<211>95

<212>dna

<213>人工序列(artificialsequence)

<220>

<223>y衔接子上链

<220>

<221>c3spacer

<222>(1)..(30)

<223>c3间隔子胺基磷酸酯(集成dna技术公司(integrateddnatechnologies):5spc3)

<220>

<221>misc_feature

<222>(1)..(30)

<223>n是a、c、g或t

<220>

<221>misc_feature

<222>(64)..(67)

<223>n是a、c、g或t

<220>

<221>18spacer

<222>(80)..(83)

<223>18-atomhexa-ethyleneglycolspacer(integrateddnatechnologies:isp18)

<400>52

nnnnnnnnnnnnnnnnnnnnnnnnnnnnnnggcgtctgcttgggtgtttaaccttttttt60

tttnnnnaatgtacttcgttcagttacgtattgct95

<210>53

<211>25

<212>dna

<213>人工序列(artificialsequence)

<220>

<223>y衔接子阻断链

<400>53

ttccgcagacgaacccacaaattgg25

<210>54

<211>15

<212>dna

<213>人工序列(artificialsequence)

<220>

<223>y衔接子胆固醇系链

<220>

<221>5'cholesteroltag

<222>(1)..(1)

<400>54

ttgaccgctcgcctc15

<210>55

<211>45

<212>dna

<213>人工序列(artificialsequence)

<220>

<223>y衔接子下链

<220>

<221>misc_feature

<222>(45)..(45)

<223>5phos

<400>55

aactggcgagcggagtttttacatgaagcaagtcaatgcataacg45

<210>56

<211>3561

<212>dna

<213>人工序列(artificialsequence)

<220>

<223>3.6kb靶序列

<400>56

gccatcagattgtgtttgttagtcgctttttttttttggaattttttttttggaattttt60

tttttgcgctaacaacctcctgccgttttgcccgtgcatatcggtcacgaacaaatctga120

ttactaaacacagtagcctggatttgttctatcagtaatcgaccttattcctaattaaat180

agagcaaatccccttattgggggtaagacatgaagatgccagaaaaacatgacctgttgg240

ccgccattctcgcggcaaaggaacaaggcatcggggcaatccttgcgtttgcaatggcgt300

accttcgcggcagatataatggcggtgcgtttacaaaaacagtaatcgacgcaacgatgt360

gcgccattatcgcctagttcattcgtgaccttctcgacttcgccggactaagtagcaatc420

tcgcttatataacgagcgtgtttatcggctacatcggtactgactcgattggttcgctta480

tcaaacgcttcgctgctaaaaaagccggagtagaagatggtagaaatcaataatcaacgt540

aaggcgttcctcgatatgctggcgtggtcggagggaactgataacggacgtcagaaaacc600

agaaatcatggttatgacgtcattgtaggcggagagctatttactgattactccgatcac660

cctcgcaaacttgtcacgctaaacccaaaactcaaatcaacaggcgccggacgctaccag720

cttctttcccgttggtgggatgcctaccgcaagcagcttggcctgaaagacttctctccg780

aaaagtcaggacgctgtggcattgcagcagattaaggagcgtggcgctttacctatgatt840

gatcgtggtgatatccgtcaggcaatcgaccgttgcagcaatatctgggcttcactgccg900

ggcgctggttatggtcagttcgagcataaggctgacagcctgattgcaaaattcaaagaa960

gcgggcggaacggtcagagagattgatgtatgagcagagtcaccgcgattatctccgctc1020

tggttatctgcatcatcgtctgcctgtcatgggctgttaatcattaccgtgataacgcca1080

ttacctacaaagcccagcgcgacaaaaatgccagagaactgaagctggcgaacgcggcaa1140

ttactgacatgcagatgcgtcagcgtgatgttgctgcgctcgatgcaaaatacacgaagg1200

agttagctgatgctaaagctgaaaatgatgctctgcgtgatgatgttgccgctggtcgtc1260

gtcggttgcacatcaaagcagtctgtcagtcagtgcgtgaagccaccaccgcctccggcg1320

tggataatgcagcctccccccgactggcagacaccgctgaacgggattatttcaccctca1380

gagagaggctgatcactatgcaaaaacaactggaaggaacccagaagtatattaatgagc1440

agtgcagatagagttgcccatatcgatgggcaactcatgcaattattgtgagcaatacac1500

acgcgcttccagcggagtataaatgcctaaagtaataaaaccgagcaatccatttacgaa1560

tgtttgctgggtttctgttttaacaacattttctgcgccgccacaaattttggctgcatc1620

gacagttttcttctgcccaattccagaaacgaagaaatgatgggtgatggtttcctttgg1680

tgctactgctgccggtttgttttgaacagtaaacgtctgttgagcacatcctgtaataag1740

cagggccagcgcagtagcgagtagcatttttttcatggtgttattcccgatgctttttga1800

agttcgcagaatcgtatgtgtagaaaattaaacaaaccctaaacaatgagttgaaatttc1860

atattgttaatatttattaatgtatgtcaggtgcgatgaatcgtcattgtattcccggat1920

taactatgtccacagccctgacggggaacttctctgcgggagtgtccgggaataattaaa1980

acgatgcacacagggtttagcgcgtacacgtattgcattatgccaacgccccggtgctga2040

cacggaagaaaccggacgttatgatttagcgtggaaagatttgtgtagtgttctgaatgc2100

tctcagtaaatagtaatgaattatcaaaggtatagtaatatcttttatgttcatggatat2160

ttgtaacccatcggaaaactcctgctttagcaagattttccctgtattgctgaaatgtga2220

tttctcttgatttcaacctatcataggacgtttctataagatgcgtgtttcttgagaatt2280

taacatttacaacctttttaagtccttttattaacacggtgttatcgttttctaacacga2340

tgtgaatattatctgtggctagatagtaaatataatgtgagacgttgtgacgttttagtt2400

cagaataaaacaattcacagtctaaatcttttcgcacttgatcgaatatttctttaaaaa2460

tggcaacctgagccattggtaaaaccttccatgtgatacgagggcgcgtagtttgcatta2520

tcgtttttatcgtttcaatctggtctgacctccttgtgttttgttgatgatttatgtcaa2580

atattaggaatgttttcacttaatagtattggttgcgtaacaaagtgcggtcctgctggc2640

attctggagggaaatacaaccgacagatgtatgtaaggccaacgtgctcaaatcttcata2700

cagaaagatttgaagtaatattttaaccgctagatgaagagcaagcgcatggagcgacaa2760

aatgaataaagaacaatctgctgatgatccctccgtggatctgattcgtgtaaaaaatat2820

gcttaatagcaccatttctatgagttaccctgatgttgtaattgcatgtatagaacataa2880

ggtgtctctggaagcattcagagcaattgaggcagcgttggtgaagcacgataataatat2940

gaaggattattccctggtggttgactgatcaccataactgctaatcattcaaactattta3000

gtctgtgacagagccaacacgcagtctgtcactgtcaggaaagtggtaaaactgcaactc3060

aattactgcaatgccctcgtaattaagtgaatttacaatatcgtcctgttcggagggaag3120

aacgcgggatgttcattcttcatcacttttaattgatgtatatgctctcttttctgacgt3180

tagtctccgacggcaggcttcaatgacccaggctgagaaattcccggaccctttttgctc3240

aagagcgatgttaatttgttcaatcatttggttaggaaagcggatgttgcgggttgttgt3300

tctgcgggttctgttcttcgttgacatgaggttgccccgtattcagtgtcgctgatttgt3360

attgtctgaagttgtttttacgttaagttgatgcagatcaattaatacgatacctgcgtc3420

ataattgattatttgacgtggtttgatggcctccacgcacgttgtgatatgtagatgata3480

atcattatcactttacgggtcctttccggtgaaaaaaaaggtaccaaaaaaaacatcgtc3540

gtgagtagtgaaccgtaagca3561

当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1