经修饰的酶的制作方法

文档序号:11446029阅读:412来源:国知局
经修饰的酶的制造方法与工艺
本发明涉及一种修饰的dda解旋酶,其可用于控制多核苷酸的移动,并且特别有助于测序多核苷酸。
背景技术
:目前需要一种具有广泛的应用范围的快速且廉价的多核苷酸(如dna或rna)测序和鉴定技术。现有的技术是缓慢的且昂贵的,这主要由于它们依赖于扩增技术来产生大量的多核苷酸,且需要大量特定的用于信号检测的荧光化学物质。跨膜孔(纳米孔)作为用于聚合物和各种小分子的直接的、电生物传感器,具有很大的潜力。特别是,目前作为一种有潜力的dna测序技术的纳米孔得到了许多关注。当跨纳米孔施加电势时,在,当分析物如核苷酸在桶(barrel)中短暂停留一段时间时,会产生电流的变化。所述核苷酸的纳米孔检测能产生已知特征和持续时间的电流变化。在链测序方法中,单个多核苷酸链穿过所述孔并实现对核苷酸的鉴定。链测序可包括使用多核苷酸结合蛋白来控制所述多核苷酸穿过所述孔的移动。技术实现要素:令人出乎意料的是,发明人已经鉴定出特异性dda突变体,该突变体具有提升的能力以控制多核苷酸穿过孔的移动。本发明的突变体显示减少的向前滑移(slipping)。这是dna通过至少4个连续核苷酸并且通常通过超过10个连续核苷酸相对孔向前移动的现象。向前滑移可能涉及100个或更多个连续的核苷酸的向前移动,这对于每个多核苷酸可能发生多次。对于多核苷酸测序,向前滑移可能是有问题的。由发明人鉴定的突变体通常包含突变的组合,即(1)与单链dna(ssdna)中的核苷酸相互作用的氨基酸的一个或多个取代,和(2)与跨膜孔相互作用的突变体的一部分上的一个或多个修饰。因此,本发明提供了一种dna依赖性atpase(dda)解旋酶,在其中(a)与单链dna(ssdna)中的一个或多个核苷酸相互作用的至少一个氨基酸被取代,和(b)与跨膜孔相互作用的解旋酶的一部分包括一个或多个修饰,其中,所述解旋酶具有控制多核苷酸的移动的能力。本发明还提供:一种构建体,其包含本发明所述的解旋酶和附加的多核苷酸结合部分,其中,所述解旋酶与所述多核苷酸结合部分连接,并且所述构建体具有控制多核苷酸的移动的能力;一种多核苷酸,其包含对本发明所述的解旋酶或本发明所述的构建体进行编码的序列;一种载体,其包含与启动子可操作地连接的本发明所述的多核苷酸;一种宿主细胞,其包含本发明所述的载体;一种制备本发明所述的解旋酶或本发明所述的构建体的方法,其包括对本发明所述的多核苷酸进行表达,用本发明所述的载体对细胞进行转染或对本发明所述的宿主细胞进行培养;一种控制多核苷酸的移动的方法,包括使所述多核苷酸与本发明所述的解旋酶或本发明所述的构建体接触,从而控制多核苷酸的移动;一种表征目标多核苷酸的方法,包括:(a)使所述目标多核苷酸与跨膜孔和本发明所述的解旋酶或本发明所述的构建体接触,使得所述解旋酶控制目标多核苷酸穿过所述孔的移动;以及(b)随着所述多核苷酸相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表所述目标多核苷酸的一个或多个特征,并由此表征所述目标多核苷酸;一种用于形成表征目标多核苷酸的传感器的方法,包括:在(a)孔和(b)本发明所述的解旋酶或本发明所述的构建体之间形成复合物,从而形成用于表征目标多核苷酸的传感器;一种用于表征目标多核苷酸的传感器,其包含在(a)孔和(b)本发明所述的解旋酶或本发明所述的构建体之间的复合物;本发明所述的解旋酶或本发明所述的构建体的用途,为控制目标多核苷酸穿过孔的移动。一种用于表征目标多核苷酸的试剂盒,其包含(a)孔和(b)本发明所述的解旋酶或本发明所述的构建体;一种用于表征样品中目标多核苷酸的装置,包括(a)多个孔和(b)多个本发明所述的解旋酶或多个本发明所述的构建体;和一系列与多核苷酸连接的两个或多个解旋酶,其中,两个或多个解旋酶中的至少一个是本发明所述的解旋酶。附图说明图1示出了t4dda-e94c/a360c/c109a/c136a(具有e94c/a360c/c109a/c136a突变的seqidno:8)相对于mspa-(g75s/g77s/l88n/d90n/d91n/d118r/q126r/d134r/e139k)8(具有g75s/g77s/l88n/d90n/d91n/d118r/q126r/d134r/e139k突变的seqidno:2=mspa突变体1)或mspa-((缺失-l74/g75/d118/l119)d56n/e59r/l88n/d90n/d91n/q126r/d134r/e139k)8(具有d56n/e59r/l88n/d90n/d91n/q126r/d134r/e139k突变并缺失l74/g75/d118/l119氨基酸的seqidno:2=mspa突变体2)的三种不同的初始模拟取向。运行1和运行2之间的区别在于尽管孔和酶处于相同位点,酶和孔均具有不同的侧链构象。在运行3中,酶相对于纳米孔略微倾斜。图2示出了纳米孔mspa突变体1与酶突变体1的相互作用点的图表(y轴标签=孔/酶接触的数量,x轴标签=孔氨基酸残基数量)。图表的每一行示出了不同酶/纳米孔取向例如,运行1-3的相互作用点。图3示出了酶突变体1与mspa突变体1的相互作用点的图表(y轴标签=孔/酶接触的数量,x轴标签=酶氨基酸残基数量)。图表的每一行示出了不同酶/纳米孔取向例如,运行1-3的相互作用点。图4示出了纳米孔mspa突变体2与酶突变体1的相互作用点的图表(y轴标签=孔/酶接触的数量,x轴标签=孔氨基酸残基数量)。图表的每一行示出了不同酶/纳米孔取向例如,运行1-3的相互作用点。图5示出了酶突变体1与mspa突变体2的相互作用点的图表(y轴标签=孔/酶接触点数量,x轴标签=酶氨基酸残基数量)。图表的每一行示出了不同酶/纳米孔取向例如,运行1-3的相互作用点。图6(a)示出了图表(y轴标签=孔氨基酸残基数量,x轴标签=酶氨基酸残基数量)的两个区域,其示出了来自运行1的孔(mspa突变体2)中的哪些氨基酸与酶(酶突变体1)中的特定氨基酸相互作用。图6(b)示出了图表(y轴标签(a1)=孔氨基酸残基数量,y轴标签(a2)=孔/酶接触的数量,x轴标签=酶氨基酸残基数量)的一个区域,其示出了来自运行3的孔(mspa突变体2)中的哪些氨基酸与酶(酶突变体1)中的特定氨基酸相互作用。图表中的灰色带条表示氨基酸之间的相互作用。灰色带条的暗度对应酶/孔之间的相互作用的数量,其中深灰色=相互作用较多且浅灰色=相互作用较少。每个盒子中的第一氨基酸对应mspa突变体2中的相互作用的氨基酸,第二氨基酸对应酶突变体1中的相互作用的氨基酸。图7示出了实施例3中使用的dna构建体x。a段对应30个ispc3间隔物。b段对应seqidno:60。标记c对应实验中使用的酶突变体。d段对应4个ispl8间隔物。e段对应seqidno:61。f端对应4个ispc3间隔物。g段对应seqidno:62。h段对应seqidno:63。i段对应seqidno:64。j段对应3’胆固醇。图8示出了当解旋酶(t4dda-e94c/f98w/c109a/c136a/k194l/a360c(具有e94c/f98w/c109a/c136a/k194l/a360c突变的seqidno:8,然后(δm1)gl))控制dna构建体x穿过csgg-eco纳米孔(csgg-eco-(y51t/f56q)-strepii(c))9(具有y51t/f56q突变的seqidno:66,其中strepii(c)是seqidno:67并连接在c末端)的移位时的示例性电流迹线(y轴标签=电流(pa),x轴标签=所有三条迹线的时间(s))。b和c段示出了电流迹线a的放大区域。图9示出了当解旋酶(t4dda-e94c/f98w/c109a/c136a/k194l/a360c(具有e94c/f98w/c109a/c136a/k194l/a360c突变的seqidno:8,然后(δm1)gl))控制dna/rna构建体y穿过mspa纳米孔的移位时的示例性电流迹线(y轴标签=电流(pa),x轴标签=时间(s))。标记为1的区域对应rna区域,标记为2的区域对应dna区域。序列表说明seqidno:1表示编码了野生型mspa单体的密码子优化的多核苷酸序列。该突变体缺乏信号序列。seqidno:2表示成熟形式的野生型mspa单体的氨基酸序列。该突变体缺乏信号序列。seqidno:3表示编码α-溶血素-e111n/k147n(α-hl-nn;stoddart等,pnas,2009;106(19):7702-7707)的一种单体的多核苷酸序列。seqidno:4表示α-hl-nn的一种单体的氨基酸序列。seqidno:5至7表示mspb,c和d的氨基酸序列。seqidno:8至23表示表1和表2中所示的dda解旋酶的氨基酸序列。seqidno:24表示优选的hhh域的氨基酸序列。seqidno:25表示来自噬菌体(bacteriophage)rb69的ssb的氨基酸序列,其由gp32基因编码。seqidno:26表示来自噬菌体t7的ssb的氨基酸序列,其由gp2.5基因编码。seqidno:27表示来自疱疹病毒1(herpesvirus1)的ul42持续合成性因子的氨基酸序列。seqidno:28表示pcna的亚基1的氨基酸序列。seqidno:29表示pcna的亚基2的氨基酸序列。seqidno:30表示pcna的亚基3的氨基酸序列。seqidno:31表示phi29dna聚合酶的氨基酸序列。seqidno:32表示来自疱疹病毒1的ul42持续合成性因子的氨基酸序列(1至319)。seqidno:33表示来自噬菌体rb69的ssb的氨基酸序列,即seqidno:25,其c末端缺失(gp32rb69cd)。seqidno:34表示来自噬菌体t7(gp2.5t7-r21idel)的ssb的氨基酸序列(1至210)。全长蛋白在seqidno:96中进行表示。seqidno:35表示hel308hla的第5个域的氨基酸序列。seqidno:36表示hel308hvo的第5个域的氨基酸序列。seqidno:37表示(hhh)2域的氨基酸序列。seqidno:38表示(hhh)2-(hhh)2域的氨基酸序列。seqidno:39表示人线粒体ssb(hsmtssb)的氨基酸序列。seqidno:40表示来自phi29dna聚合酶的p5蛋白的氨基酸序列。seqidno:41表示来自大肠杆菌(e.coli)的野生型ssb的氨基酸序列。seqidno:42表示来自噬菌体t4的ssb的氨基酸序列,其由gp32基因编码。seqidno:43表示ecossb-cterala的氨基酸序列。seqidno:44表示ecossb-cternggn的氨基酸序列。seqidno:45表示ecossb-q152del的氨基酸序列。seqidno:46表示ecossb-g117del的氨基酸序列。seqidno:47表示拓扑异构酶vmka(如甲烷嗜热菌)(methanopyruskandleri)的氨基酸序列。seqidno:48表示拓扑异构酶vmka(如甲烷嗜热菌)的域h-l的氨基酸序列。seqidno:49表示突变体s(大肠杆菌)(escherichiacoli)的氨基酸序列。seqidno:50表示sso7d(硫磺矿硫化叶菌)(sufolobussolfataricus)的氨基酸序列。seqidno:51表示sso10b1(硫磺矿硫化叶菌p2)(sulfolobussolfataricusp2)的氨基酸序列。seqidno:52表示ssol0b2(硫磺矿硫化叶菌p2)的氨基酸序列。seqidno:53表示色氨酸阻遏物(大肠杆菌)的氨基酸序列。seqidno:54表示λ阻遏物(肠杆菌噬菌体λ)(enterobacteriaphagelambda)的氨基酸序列。seqidno:55表示cren7(组蛋白中的泉古菌cren7sso)(histonecrenarchaeacren7sso)的氨基酸序列。seqidno:56表示人组蛋白(智人)(homosapiens)的氨基酸序列。seqidno:57表示dsba(肠杆菌噬菌体t4)(enterobacteriaphaget4)的氨基酸序列。seqidno:58表示rad51(智人)的氨基酸序列。seqidno:59表示pcna滑移夹钳(海洋细菌jl354)(citromicrobiumbathyomarinumjl354)的氨基酸序列。seqidno:60至64表示实施例3中使用的多核苷酸序列。seqidno:65表示编码来自大肠杆菌k-12菌株mc4100亚株(escherchiacolistr.k-12substr.mc4100)的野生型csgg单体的密码子优化的多核苷酸序列。该单体缺乏信号序列。seqidno:66表示来自大肠杆菌k-12菌株mc4100亚株的成熟形式的野生型csgg单体的氨基酸序列。该单体缺乏信号序列。用于此csgg的缩写=csgg-eco。seqidno:67表示strepii(c)的氨基酸序列。seqidno:68至73表示实施例5中使用的多核苷酸序列。具体实施方式应理解,公开的产品和方法的不同应用可以根据本领域的具体需求而调整。可以理解本文中使用的术语仅是为了描述本发明的具体实施方式的目的,而不意为对本发明的限制。此外,如本说明书和所附权利要求书中所使用的,除非另有说明,单数形式“一”、“一个”和“所述”包括复数指代。因此,例如,涉及“解旋酶”时包括“多个解旋酶”,涉及“修饰”时包括两个或多个所述修饰,涉及“跨膜蛋白孔”时包括两个或多个所述孔,等。本文所引用的所有公开物、专利和专利申请,无论在前文或在后文,均以引用的方式全文引入。修饰dda解旋酶本发明提供一种修饰的dda解旋酶。以下将对一个或多个具体的修饰进行更详细的讨论。本发明所述的修饰包括如下所述的一个或多个取代。采用跨膜孔和解旋酶对多核苷酸进行的表征,例如,测序,通常涉及分析由k个核苷酸组成的聚合物单元,其中,k是正整数(即,“k-聚体”)。这在申请号为pct/gb2012/052343(公开为wo2013/041878)的国际申请中进行了讨论。当目标多核苷酸相对于孔移动或移动穿过孔时,通常通过测量流过孔的电流来分析多核苷酸内的不同k-聚体。多核苷酸相对于孔移动,例如移动穿过孔可以被看作是从一个k-聚体移动到另一个或从k-聚体移动到k-聚体。本发明的修饰的解旋酶提供目标多核苷酸相对于跨膜孔,例如,通过跨膜孔的更一致移动。随着目标多核苷酸相对于孔移动,例如,移动穿过孔时,解旋酶优选提供从一个k-聚体到另一个k-聚体或从k-聚体到k-聚体的更一致移动。解旋酶使得目标多核苷酸能够相对于跨膜孔更平稳地移动,例如,更平稳地移动通过跨膜孔。解旋酶优选提供目标多核苷酸相对于跨膜孔,例如,通过跨膜孔的更规则或较少的不规则的移动。对一个或多个与ssdna中一个或多个核苷酸相互作用的氨基酸进行的修饰,特别是取代,使得经修饰的解旋酶显示减少的向前滑移。这是dna通过至少4个连续核苷酸并且通常通过超过10个连续核苷酸相对孔向前移动的现象。向前滑移可能涉及100个或更多个连续的核苷酸的向前移动,这对于每个多核苷酸可能发生多次。对于多核苷酸测序,向前滑移可能是有问题的。修饰通常使解旋酶显示的向前滑移的频率降低至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%。修饰通常会消除向前滑移,即,使解旋酶显示的向前滑移的频率100%降低。修饰通常使解旋酶显示的向前滑移的长度减少到10个核苷酸或更少,例如,9个核苷酸或更少、8个核苷酸或更少、7个核苷酸或更少、6个核苷酸或更少、5个核苷酸或更少、4个核苷酸或更少、3个核苷酸或更少、2个核苷酸或更少或者1个核苷酸。修饰优选地降低解旋酶显示的向前滑移的频率和长度。可以使用本领域已知的任何方法来测量向前滑移。通常,在纳米孔系统中,例如,下述的纳米孔系统中测定解旋酶控制多核苷酸的移动的能力和向前滑移的发生率。如实施例中所述,可以确定解旋酶控制多核苷酸的移动的能力和向前滑移的发生率。修饰,特别是与跨膜孔相互作用的解旋酶的一部分中的修饰,通常降低与目标多核苷酸相对于跨膜孔移动,例如,穿过跨膜孔,相关联的噪声。当正在分析k-聚体时,在任何维度上的目标多核苷酸的不必要移动通常导致对于k-聚体的在电流特征或电平中的噪声。本发明的解旋酶可以通过减少与目标多核苷酸中一个或多个k-聚体(例如,每个k-聚体)相关联的不必要移动来降低这种噪声。解旋酶可以降低与目标多核苷酸中一个或多个k-聚体(例如,每个k-聚体)的电流电平或特征相关联的噪声。在优选实施方案中,目标多核苷酸是双链的,并且解旋酶降低与互补链的移动相关联的噪声比其降低与模板链的移动相关联的噪声程度上要大和/或,解旋酶增加互补链的移动一致性比其增加模板链的移动一致性程度上要大。这对双链目标多核苷酸的链测序是有利的。双链多核苷酸的两个位点优选通过桥连部分,例如,发夹环或发夹环适配器连接。这将在以下进行更详细的讨论。换言之,本发明的修饰的解旋酶更擅长于控制多核苷酸的移动。解旋酶可以控制多核苷酸的移动的程度通常通过以下更详细讨论的修饰发生改变。对本发明的解旋酶进行修饰。与相应的野生型解旋酶或天然解旋酶相比,修饰的解旋酶通常是经过修饰的。本发明的解旋酶是人造的或非天然的。本发明的修饰的解旋酶对于链测序期间控制多核苷酸的移动是有用工具。解旋酶可以以至少两种主动操作模式(当解旋酶提供所有必需组分以促进移动时,例如,atp和mg2+)和一种非主动操作模式(当解旋酶未提供必需组分以促进移动时)控制dna的移动。当提供所有必需组分以促进移动时,解旋酶沿着dna在5’-3’方向上移动,但dna在纳米孔中的取向(取决于dna的哪个末端被捕获)意味着酶可以用于逆着施加的场将dna从纳米孔中移出,或顺着施加的场将dna移进到纳米孔中。当dna的3’末端被捕获时,解旋酶逆着电压施加的场方向运作,将螺旋dna从纳米孔中牵引出来并进入顺式腔。然而,当在纳米孔中dna的5’末端被捕获时,解旋酶顺着电压施加的场方向运作,将螺旋dna推入纳米孔并进入反式腔。当解旋酶未提供必需组分以促进移动时,其可以与dna结合并且当通过施加的场将其牵引进入孔中时,其作为减慢dna移动的制动器。在非主动模式下,dna是否在3’或5’末端被捕获是无关紧要的,而是施加的场将dna牵引进入纳米孔朝向反式侧,其中,酶作为制动器。当处于非主动模式时,解旋酶对dna的移动控制可以以多种方式进行描述,包括棘轮(ratcheting)、滑移和制动。在对多核苷酸,特别是500个或更多个核苷酸构成的多核苷酸进行测序时出现的问题是,控制多核苷酸移动的分子马达可能与多核苷酸脱离。这使得多核苷酸能够被快速地并且以不受控制的方式沿所施加的场的方向牵引穿过孔。本发明的修饰的解旋酶不太可能从正被测序的多核苷酸中解链或脱离。当修饰的解旋酶控制多核苷酸移动穿过纳米孔时,其可以增加多核苷酸的读取长度。在本发明的修饰的解旋酶控制下,移动整个多核苷酸穿过纳米孔的能力使其能够与已知方法相比以改进的精度和速度来估计多核苷酸的特征,例如,其序列。随着链长度增加并且需要持续改进的分子马达时,这变得更加重要。本发明的修饰的解旋酶在控制由500个或更多个核苷酸例如,1000个、5000个、10000个、20000个、50000个、100000个或更多个核苷酸构成的目标多核苷酸的移动时特别有效。本发明的修饰的解旋酶也是等温聚合酶链式反应(pcr)的有用工具。在这种方法中,双链dna的链通常先通过本发明的解旋酶分离,并通过单链dna(ssdna)结合蛋白进行包覆。在第二步中,两个序列特异性引物通常与dna模板的每个边界杂交。然后可以使用dna聚合酶将退火的引物延伸到模板来制备双链dna,本发明的解旋酶然后可以将两种新合成的dna产物用作底物,进入下一轮反应。因此,发展同步的链反应,从而导致所选目标序列的指数扩增。修饰的解旋酶具有控制多核苷酸移动的能力。可以采用本领域已知的任何方法测定解旋酶控制多核苷酸移动的能力。例如,解旋酶可以与多核苷酸接触,并且可以使用标准方法确定多核苷酸的位点。修饰的解旋酶控制多核苷酸移动的能力通常在纳米孔系统例如,下文所述的,特别是如实施例中所述的纳米孔系统中进行测定。本发明的修饰的解旋酶可以是孤立的、基本上孤立的、纯化的或基本上纯化的。如果解旋酶完全没有任何其它组分,如脂质、多核苷酸、孔单体或其它蛋白质,则其是孤立的或纯化的。如果将解旋酶与不会干扰其预期用途的载体或稀释剂混合,则其是基本上孤立的。例如,如果解旋酶以以下形式存在,即,包含小于10%、小于5%、小于2%或小于1%的其它组分(例如脂质、多核苷酸、孔单体或其它蛋白质),则其是基本上孤立的或基本上纯化的。根据本发明,可以对任何dda解旋酶进行修饰。以下对优选的dda解旋酶进行讨论。dda解旋酶通常包括以下五个域:1a(reca式(reca-like)马达)域、2a(reca式马达)域、塔域(towerdomain)、销域(pindomain)和钩域(hookdomain)(xiaopinghe等人,structure;20:1189-1200)。可以使用蛋白质建模来鉴定这些域,在结晶状态下对蛋白质进行x射线衍射测量(ruppb(2009).biomolecularcrystallography:principles,practiceandapplicationtostructuralbiology.newyork:garlandscience.),在溶液中对蛋白质进行核磁共振(nmr)光谱(markranee;cavanagh,john;waynej.fairbrother;arthurw.huntiii;skelton,nnicholasj.(2007).proteinnmrspectroscopy:principlesandpractice(2nded.).boston:academicpress.)或在冷冻水合状态下对蛋白质进行低温电子显微镜检查(vanheelm,gowenb,matadeenr,orlovaev,finnr,papet,cohend,starkh,schmidtr,schatzm,patwardhana(2000).“single-particleelectroncryo-microscopy:towardsatomicresolution.”.qrevbiophys.33:307-69)。通过上述方法确定的蛋白质的结构信息可从蛋白质数据库(pdb)中公开获得。蛋白质建模利用了蛋白质结构比同源物中蛋白质序列更保守这一事实。因此,蛋白质原子分辨率模型的产生取决于对一个或多个蛋白质结构进行鉴定,所述蛋白质结构可能与查询序列的结构相类似。为了评估是否存在合适的蛋白质结构以便用作构建蛋白质模型的“模板”,对蛋白质数据数据库(pdb)进行搜索。如果蛋白质结构与查询序列的序列同一性共享合理的水平,则认为其是合适的模板。如果存在这样的模板,则将模板序列与查询序列进行“对齐”,即,将查询序列中的残基映射到模板残基上。然后,使用序列比对和模板结构来产生查询序列的结构模型。因此,蛋白质模型的质量取决于序列对齐和模板结构的质量。可以进行模拟以评估哪些氨基酸与酶结合位点内的ssdna中的核苷酸接触。可以利用gromacs软件包版本4.0.5,采用amber-99sb力场和tip3p水模型进行模拟。优选方法在实施例中进行了公开。本发明的修饰本发明的解旋酶是这样一种解旋酶,其中,至少一个与单链dna(ssdna)中一个或多个核苷酸相互作用的氨基酸被取代。可以取代任何数量的氨基酸,例如,1个或更多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个或者6个或更多个氨基酸。当解旋酶沿着ssdna移动或者当ssdna移动通过解旋酶时,氨基酸可以顺序地与不同核苷酸相互作用。每个被取代的氨基每次可以与任何数量的核苷酸相互作用,例如,每次一个、两个、三个或更多个核苷酸。与单链dna中一个或多个核苷酸相互作用的氨基酸可以采用上述蛋白质建模来进行鉴定。碱基和/或糖相互作用本发明的解旋酶优选是这样一种解旋酶,其中,用包含较大侧链(r基团)的氨基酸取代至少一个与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸。可以取代任何数量的氨基酸,例如,1个或更多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个或者6个或更多个氨基酸。每个氨基酸可以与碱基、糖或碱基和糖相互作用。可以采用上述蛋白质建模来鉴定与单链dna中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸。以下表1总结了根据本发明可进行修饰的优选dda解旋酶。表1本发明的解旋酶优选包含seqidno:8的变体,其中,所述至少一个与ssdna中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸是h82,n88,p89,f98,d121,v150,p152,f240,f276,s287,h396和y415中的至少一个。这些数字对应seqidno:8中的相关位点,并且相比seqidno:8可能需要在一个或多个氨基酸已经在变体中插入或删除的情况下进行改变。如上所述,本领域技术人员可以确定变体中的相应位点。本发明的解旋酶优选包含seqidno:8的变体,其中,所述至少一个与ssdna中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸是f98和一个或多个h82,n88,p89,d121,v150,p152,f240,f276,s287,h396和y415,例如,f98/h82,f98/n88,f98/p89,f98/d121,f98/v150,f98/p152,f98/f240,f98/f276,f98/s287或f98/h396。本发明的解旋酶优选为seqidno:9,10,11,12,13,14,15,16,17,18,19,20,21,22或23的变体,其中,所述至少一个与ssdna中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸是至少一个与seqidno:8中的h82,n88,p89,f98,d121,v150,p152,f240,f276,s287,h396和y415相对应的氨基酸。本发明的解旋酶优选包含seqidno:9,10,11,12,13,14,15,16,17,18,19,20,21,22或23的变体,其中,所述至少一个与ssdna中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸是与seqidno:8中f98对应的氨基酸和一个或多个与seqidno:8中h82,n88,p89,d121,v150,p152,f240,f276,s287,h396和y415对应的氨基酸,例如,与f98/h82,f98/n88,f98/p89,f98/d121,f98/v150,f98/p152,f98/f240,f98/f276,f98/s287或f98/h396对应的氨基酸。表2示出了与seqidno:8中的h82,n88,p89,f98,d121,v150,p152,f240,f276,s287,h396和y415对应的seqidno:9至23中的氨基酸。表2至少一个与ssdna中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸优选是至少一个插入在ssdna中的核苷酸之间的氨基酸。可以对插入在ssdna中核苷酸之间的氨基酸进行如上所述的建模。所述至少一个插入在ssdna中的核苷酸之间的氨基酸优选为seqidno:8中的p89,f98和v150中的至少一个,例如p89,f98,vi50,p89/f98,p89/v150,f98/v150或p89/f98/v150。所述至少一个插入在seqidno:9,10,11,12,13,14,15,16,17,18,19,20,21,22或23的ssdna中的核苷酸之间的氨基酸优选为至少一个与seqidno:8中的p89,f98和vi50对应的氨基酸,例如,p89,f98,vi50,p89/f98,p89/v150,f98/v150或p89/f98/v150。相应的氨基酸如上表2所示。较大r基团较大侧链(r基团)优选地(a)包含增加数量的碳原子(b)具有增加的长度(c)具有增加的分子体积和/或(d)具有增加的范德华体积。较大侧链(r基团)优选(a);(b);(c);(d);(a)和(b);(a)和(c);(a)和(d);(b)和(c);(b)和(d);(c)和(d);(a),(b)和(c);(a),(b)和(d);(a),(c)和(d);(b),(c)和(d);或(a),(b),(c)和(d)。可以采用本领域中的标准方法对(a)至(d)中的每一个进行测量。较大侧链(r基团)优选地增加所述至少一个氨基酸与所述ssdna中一个或多个核苷酸之间的(i)静电相互作用(ii)氢键和/或(iii)阳离子-pi(阳离子-π)相互作用,比如增加(i),(ii),(iii);(i)和(ii);(i)和(iii);(ii)和(iii);以及(i),(ii)和(iii)。技术人员可以判断是否r基团增加了这些相互作用中的任何一个。例如,在(i)中,诸如精氨酸(r)、组氨酸(h)和赖氨酸(k)等带正电荷的氨基酸具有增加静电相互作用的r基团。例如,在(ii)中,诸如天冬酰胺(n)、丝氨酸(s)、谷氨酰胺(q)、苏氨酸(t)和组氨酸(h)等氨基酸具有增加氢键的r基团。例如,在(iii)中,诸如苯丙氨酸(f)、色氨酸(w)、酪氨酸(y)或组氨酸(h)等芳族氨基酸具有增加阳离子-pi(阳离子-π)相互作用的r基团。以下的具体取代被标记为(i)至(iii)以反映这些变化。其它可能的取代被标记为(iv)。这些(iv)取代通常增加侧链(r基团)的长度。包含较大侧链(r)的氨基酸可以是非天然氨基酸。所述非天然氨基酸可以是以下讨论的任何一种。包含较大侧链(r基团)的氨基酸优选不是丙氨酸(a)、半胱氨酸(c)、甘氨酸(g)、硒代半胱氨酸(u)、甲硫氨酸(m)、天冬氨酸(d)或谷氨酸(e)。组氨酸(h)优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)或天冬酰胺(n)或(iii)苯丙氨酸(f)、酪氨酸(y)或色氨酸(w)取代。组氨酸(h)更优选被(a)n、q或w或(b)y、f、q或k取代。天冬酰胺(n)优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)或组氨酸(h)或(iii)苯丙氨酸(f)、酪氨酸(y)或色氨酸(w)取代。天冬酰胺(n)更优选被r、h、w或y取代。脯氨酸(p)优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)、天冬酰胺(n)、苏氨酸(t)或组氨酸(h);(iii)酪氨酸(y)、苯丙氨酸(f)或色氨酸(w)或(iv)亮氨酸(l)、缬氨酸(v)或异亮氨酸(i)取代。脯氨酸(p)更优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)、天冬酰胺(n)、苏氨酸(t)或组氨酸(h);(iii)苯丙氨酸(f)或色氨酸(w)或(iv)亮氨酸(l)、缬氨酸(v)或异亮氨酸(i)取代。脯氨酸(p)更优选被(a)f,(b)l、v、i、t或f或(c)w、f、y、h、i、l或v取代。缬氨酸(v)优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)、天冬酰胺(n)或组氨酸(h);(iii)苯丙氨酸(f)、酪氨酸(y)或色氨酸(w)或(iv)异亮氨酸(i)或亮氨酸(l)取代。缬氨酸(v)更优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)、天冬酰胺(n)或组氨酸(h);(iii)酪氨酸(y)或色氨酸(w)或(iv)异亮氨酸(i)或亮氨酸(l)取代。缬氨酸(v)更优选被i或h或i、l、n、w或h取代。苯丙氨酸(f)优选被(i)精氨酸(r)或赖氨酸(k);(ii)组氨酸(h)或(iii)酪氨酸(y)或色氨酸(w)取代。苯丙氨酸(f)更优选被(a)w,(b)w、y或h,(c)w、r或k或(d)k、h、w或r取代。谷氨酰胺(q)优选被(i)精氨酸(r)或赖氨酸(k)或(iii)苯丙氨酸(f)、酪氨酸(y)或色氨酸(w)取代。丙氨酸(a)优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)、天冬酰胺(n)或组氨酸(h);(iii)苯丙氨酸(f)、酪氨酸(y)或色氨酸(w)或(iv)异亮氨酸(i)或亮氨酸(l)取代。丝氨酸(s)优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)、天冬酰胺(n)或组氨酸(h);(iii)苯丙氨酸(f)、酪氨酸(y)或色氨酸(w)或(iv)异亮氨酸(i)或亮氨酸(l)取代。丝氨酸(s)优选被k、r、w或f取代。赖氨酸(k)优选被(i)精氨酸(r)或(iii)酪氨酸(y)或色氨酸(w)取代。精氨酸(r)优选被(iii)酪氨酸(y)或色氨酸(w)取代。甲硫氨酸(m)优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)、天冬酰胺(n)或组氨酸(h)或(iii)苯丙氨酸(f)、酪氨酸(y)或色氨酸(w)取代。亮氨酸(l)优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)或天冬酰胺(n)或(iii)苯丙氨酸(f)、酪氨酸(y)或色氨酸(w)取代。天冬氨酸(d)优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)、天冬酰胺(n)或组氨酸(h)或(iii)苯丙氨酸(f)、酪氨酸(y)或色氨酸(w)取代。天冬氨酸(d)更优选被h、y或k取代。谷氨酸(e)优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)、天冬酰胺(n)或组氨酸(h)或(iii)苯丙氨酸(f)、酪氨酸(y)或色氨酸(w)取代。异亮氨酸(i)优选被(i)精氨酸(r)或赖氨酸(k);(ii)谷氨酰胺(q)、天冬酰胺(n)或组氨酸(h);(iii)苯丙氨酸(f)、酪氨酸(y)或色氨酸(w)或(iv)亮氨酸(l)取代。酪氨酸(y)优选被(i)精氨酸(r)或赖氨酸(k)或(iii)色氨酸(w)取代。酪氨酸(y)更优选被w或r取代。解旋酶更优选包含seqidno:8的变体,并且包含(a)p89f;(b)f98w;(c)v150i;(d)v150h;(e)p89f和f98w;(f)p89f和v150i;(g)p89f和v150h;(h)f98w和v150i;(i)f98w和v150h;(j)p89f、f98w和v150i或(k)p89f、f98w和v150h。解旋酶更优选包含seqidno:8的变体,其包含:磷酸基团相互作用本发明的解旋酶优选是这样一种解旋酶,即,至少一个与ssdna中一个或多个核苷酸的一个或多个磷酸基团相互作用的氨基酸被取代。可以取代任何数量的氨基酸,例如,1个或更多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个或者6个或更多个氨基酸。ssdna中的核苷酸各自包含三个磷酸基团。被取代的每个氨基每次可以与任何数量的磷酸基团相互作用,例如,每次一个、两个或三个磷酸基团。与一个或多个磷酸基团相互作用的氨基酸可以采用上述蛋白质建模来进行鉴定。取代优选增加所述至少一个氨基酸和所述ssdna中一个或多个磷酸基团之间的(i)静电相互作用;(ii)氢键和/或(iii)阳离子-pi(阳离子-π)相互作用。以下使用标记(i)、(ii)和(iii)对增加(i)、(ii)和(iii)的优选取代进行讨论。取代优选增加位点的净正电荷。可以采用本领域已知的方法来测量任何位点处的净电荷。例如,可采用等电点来限定氨基酸的净电荷。通常在约7.5处测量净电荷。取代优选是用带正电荷、不带电荷、非极性或芳族的氨基酸取代带负电荷的氨基酸。带负电荷的氨基酸是带有净负电荷的氨基酸。带负电荷的氨基酸包括但不限于天冬氨酸(d)和谷氨酸(e)。带正电荷的氨基酸是带有净正电荷的氨基酸。带正电荷的氨基酸可以是天然存在的或非天然存在的。带正电的氨基酸可以是合成的或修饰的。例如,带有净正电荷的修饰氨基酸可以专门设计用于本发明。对氨基酸进行的多种不同类型的修饰是本领域公知的。优选的天然存在的带正电荷的氨基酸包括但不限于组氨酸(h)、赖氨酸(k)和精氨酸(r)。不带电荷的氨基酸、非极性氨基酸或者芳族氨基酸可以是天然存在的或非天然存在的。其可以是合成的或修饰的。不带电荷的氨基酸没有净电荷。合适的不带电荷氨基酸包括但不限于半胱氨酸(c)、丝氨酸(s)、苏氨酸(t)、甲硫氨酸(m)、天冬酰胺(n)和谷氨酰胺(q)。非极性氨基酸具有非极性侧链。合适的非极性氨基酸包括但不限于甘氨酸(g)、丙氨酸(a)、脯氨酸(p)、异亮氨酸(i)、亮氨酸(l)和缬氨酸(v)。芳族氨基酸具有芳族侧链。合适的芳族氨基酸包括但不限于组氨酸(h)、苯丙氨酸(f)、色氨酸(w)和酪氨酸(y)。解旋酶优选包含seqidno:8的变体,其中,至少一个与ssdna中一个或多个核苷酸的一个或多个磷酸基团相互作用的氨基酸是h64,t80,s83,n242,k243,n293,t394和k397中的至少一个。这些数字对应seqidno:8中的相关位点,并且相比seqidno:8可能需要在一个或多个氨基酸已经在变体中插入或删除的情况下进行改变。本领域技术人员可以确定如上所述的变体中的相应位点。解旋酶优选包含seqidno:9,10,11,12,13,14,15,16,17,18,19,20,21,22或23的变体,其中,所述至少一个与ssdna中一个或多个核苷酸的一个或多个磷酸基团相互作用的氨基酸是与seqidno:8中的h64,t80,s83,n242,k243,n293,t394和k397相对应的至少一个氨基酸。表3示出了与seqidno:8中的h64,t80,s83,n242,k243,n293,t394和k397对应的seqidno:9至23中的氨基酸。表3组氨酸(h)优选被(i)精氨酸(r)或赖氨酸(k);(ii)天冬酰胺(n)、丝氨酸(s)、谷氨酰胺(q)或苏氨酸(t);(iii)苯丙氨酸(f)、色氨酸(w)或酪氨酸(y)取代。组氨酸(h)优选被(a)n、q、k或f或者(b)n、q或w取代。苏氨酸(t)优选被(i)精氨酸(r)、组氨酸(h)或赖氨酸(k);(ii)天冬酰胺(n)、丝氨酸(s)、谷氨酰胺(q)或组氨酸(h)或者(iii)苯丙氨酸(f)、色氨酸(w)、酪氨酸(y)或组氨酸(h)取代。苏氨酸(t)更优选被(a)k、q或n或者(b)k、h或n取代。丝氨酸(s)优选被(i)精氨酸(r)、组氨酸(h)或赖氨酸(k);(ii)天冬酰胺(n)、谷氨酰胺(q)、苏氨酸(t)或组氨酸(h)或者(iii)苯丙氨酸(f)、色氨酸(w)、酪氨酸(y)或组氨酸(h)取代。丝氨酸(s)更优选被h、n、k、t、r或q取代。天冬酰胺(n)优选被(i)精氨酸(r)、组氨酸(h)或赖氨酸(k);(ii)丝氨酸(s)、谷氨酰胺(q)、苏氨酸(t)或组氨酸(h)或者(iii)苯丙氨酸(f)、色氨酸(w)、酪氨酸(y)或组氨酸(h)取代。天冬酰胺(n)更优选被(a)h或q或者(b)q、k或h取代。赖氨酸(k)优选被(i)精氨酸(r)或组氨酸(h);(ii)天冬酰胺(n)、丝氨酸(s)、谷氨酰胺(q)、苏氨酸(t)或组氨酸(h)或者(iii)苯丙氨酸(f)、色氨酸(w)、酪氨酸(y)或组氨酸(h)取代。赖氨酸(k)更优选被(a)q或h或者(b)r、h或y取代。解旋酶更优选包含seqidno:8的变体,并且包含例如(a)h64n,h64q,h64k或h64f;(b)t80k,t80q或t80n;(c)s83h,s83n,s83k,s83t,s83r或s83q;(d)n242h或n242q;(e)k243q或k243h;(f)n293q,n293k或n293h;(g)t394k,t394h或t394n或(h)k397r,k397h或k397y中的所有的一个或多个。组合解旋酶可以是这样一种解旋酶,其中,(a)至少一个与ssdna中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸被包含较大侧链(r基团)的氨基酸取代;和(b)至少一个与ssdna中一个或多个核苷酸的一个或多个磷酸基团相互作用的氨基酸被取代。解旋酶优选包含:(a)seqidno:8的变体,其包含如上限定的f98上的取代,以及在h64,t80,s83,n242,k243,n293,t394和k397中一个或多个上的取代;或者(b)seqidno:9,10,11,12,13,14,15,16,17,18,19,20,21,22或23的变体,其包含在与f98对应的氨基酸上的取代和在一个或多个与seqidno:8中h64,t80,s83,n242,k243,n293,t394和k397对应的氨基酸上的取代。解旋酶优选是seqidno:8的变体,其包含以下位点上的取代:-f98/h64,例如,f98w/h64n,f98w/h64q,f98w/h64k或者f98w/h64f;-f98/t80,例如,f98w/t80k,f98w/t80q,f98w/t80n;-f98/h82,例如,f98w/h82n,f98w/h82q或者f98w/h82w;-f98/s83,例如,f98w/s83h,f98w/s83n,f98w/s83k,f98w/s83t,f98w/s83r或者f98w/s83q;-f98/n242,例如,f98w/n242h,f98w/n242q,f98w/k243q或者f98w/k243h;-f98/n293,例如,f98w/n293q,f98w/n293k,f98w/n293h,f98w/t394k,f98w/t394h,f98w/t394n,f98w/h396y,f98w/h396f,f98w/h396q或者f98w/h396k;或者-f98/k397,例如,f98w/k397r,f98w/k397h或者f98w/k397y。seqidno:9,10,11,12,13,14,15,16,17,18,19,20,21,22或23中的优选组合包括与上面列出的seqidno:8中的组合对应的氨基酸的组合。孔相互作用本发明的解旋酶还是这样一种解旋酶,其中,与跨膜孔相互作用的解旋酶的一部分包含一个或多个修饰,优选一个或多个取代。所述与跨膜孔相互作用的解旋酶的一部分通常是当解旋酶用于控制多核苷酸穿过孔的移动时与跨膜孔相互作用的解旋酶的一部分,例如,以下进行更详细的讨论。当解旋酶用于控制多核苷酸穿过孔的移动时,所述一部分通常包含与孔相互作用或接触的氨基酸,例如,以下进行更详细的讨论。在施加电势下,当解旋酶与正移动穿过孔的多核苷酸结合或连接时,所述一部分通常包含与孔相互作用或接触的氨基酸。在seqidno:8中,与跨膜孔相互作用的一部分通常包含以下位点上的氨基酸,即,1,2,3,4,5,6,51,176,177,178,179,180,181,185,189,191,193,194,195,197,198,199,200,201,202,203,204,207,208,209,210,211,212,213,216,219,220,221,223,224,226,227,228,229,247,254,255,256,257,258,259,260,261,298,300,304,308,318,319,321,337,347,350,351,405,415,422,434,437,438。这些数字对应seqidno:8中的相关位点,并且相比seqidno:8可能需要在一个或多个氨基酸已经在变体中插入或删除的情况下进行改变。如上所述,本领域技术人员可以确定变体中的相应位点。与跨膜孔相互作用的一部分优选包含以下位点上的氨基酸:(a)seqidno:8中的位点:1,2,4,51,177,178,179,180,185,193,195,197,198,199,200,202,203,204,207,208,209,210,211,212,216,221,223,224,226,227,228,229,254,255,256,257,258,260,304,318,321,347,350,351,405,415,422,434,437和438;或者(b)seqidno:8中的位点:1,2,178,179,180,185,195,197,198,199,200,202,203,207,209,210,212,216,221,223,226,227,255,258,260,304,350和438。与跨膜孔相互作用的一部分优选包含seqidno:8中的位点k194,w195,k198,k199和e258上的一个或多个氨基酸,例如,2个、3个、4个或5个。seqidno:8的变体优选包含在(a)k194;(b)w195;(c);d198;(d)k199和(e)e258中一个或多个上的修饰。seqidno:8的变体优选包含:(a)k194,例如,k194l;(b)w195,例如,w195a;(c)d198,例如,d198v;(d)k199,例如,k199l和(e)e258,例如,e258l;中一个或多个上的取代。变体可以包括{a};{b};{c};{d};{e};{a,b};{a,c};{a,d};{a,e};{b,c};{b,d};{b,e};{c,d};{c,e};{d,e};{a,b,c};{a,b,d};{a,b,e};{a,c,d};{a,c,e};{a,d,e};{b,c,d};{b,c,e};{b,d,e};{c,d,e};{a,b,c,d};{a,b,c,e};{a,b,d,e};{a,c,d,e};{b,c,d,e};或者{a,b,c,d,e}。当修饰的多核苷酸结合蛋白与衍生自mspa的孔,特别是以下讨论的任何修饰孔相互作用时,本段中阐述的修饰或取代是优选的。与跨膜孔相互作用的多核苷酸结合蛋白的一部分优选包含seqidno:8中位点194或199上的氨基酸。变体优选包含k194a,k194v,k194f,k194d,k194s,k194w或者k194l和/或k199a,k199v,k199f,k199d,k199s,k199w或者k199l。在seqidno:9,10,11,12,13,14,15,16,17,18,19,20,21,22或23中,与跨膜孔相互作用的一部分通常包含与上述seqidno:8中的那些位点对应的位点上的氨基酸。可以采用以下比对(alignment)方式鉴定与seqidno:9中的那些位点对应的seqidno:9,10,11,12,13,14,15,16,17,18,19,20,21,22和23中的氨基酸。seqidno:8k194w195d198k199e258seqidno:9l230e231h234y235r293seqidno:10w259n260t263y264e326seqidno:11a192d193f196g197a259seqidno:121224k225d228f229q292seqidno:13q213d214y217a218a286seqidno:14q185w186t189n190n248seqidno:15g190w191p194n195k253seqidno:16g177w178q181n182k240seqidno:17k200m201p204m205k261seqidno:18k200p201p204l205k261seqidno:19k193w194e197k198a256seqidno:20n200w201e204n205n264seqidno:21g196w197d200c201e260seqidno:22g195w196e199n200e259seqidno:23s195w196e199k200q259优选组合本发明的解旋酶优选包含seqidno:8的变体,其包含f98上的,例如,f98r,f98k,f98q,f98n,f98h,f98y,f98f或f98w上的取代;以及k194上的,例如,k194a,k194v,k194f,k194d,k194s,k194w或k194l上的取代;和/或k199上的,例如,k199a,k199v,k199f,k199d,k199s,k199w或k199l上的取代。本发明的解旋酶优选包含seqidno:9,10,11,12,13,14,15,16,17,18,19,20,21,22或23的变体,其包含在与seqidno:8中的f98相对应的位点上的取代以及在与seqidno:8中的k194和/或k199相对应的位点上的取代。这些相应的位点可以被seqidno:8中f98,k194和k119的上述任何氨基酸取代。解旋酶优选是seqidno:8的变体,其包含以下位点上的取代:-f98/k194/h64,例如,f98w/k194l/h64n,f98w/k194l/h64q,f98w/k194l/h64k或者f98w/k194l/h64f;-f98/k194/t80,例如,f98w/k194l/t80k,f98w/k194l/t80q或者f98w/k194l/t80n;-f98/k194/h82,例如,f98w/k194l/h82n,f98w/k194l/h82q或者f98w/k194l/h82w-f98/s83/k194,例如,f98w/s83h/k194l,f98w/s83t/k194l,f98w/s83r/k194l,f98w/s83q/k194l,f98w/s83n/k194l,f98w/s83k/k194l,f98w/n88r/k194l,f98w/n88h/k194l,f98w/n88w/k194l或者f98w/n88y/k194l;-f98/s83/k194/f276,例如,f98w/s83h/k194l/f276k;-f98/p89/k194,例如,f98w/p89l/k194l,f98w/p89v/k194l,f98w/p89i/k194l或者f98w/p89t/k194l;-f98/d121/k194,例如,f98w/d121h/k194l,f98w/d121y/k194l或者f98w/d121k/k194l;-f98/v150/k194,例如,f98w/v150i/k194l,f98w/v150l/k194l,f98w/v150n/k194l,f98w/v150w/k194l或者f98w/v150h/k194l;-f98/p152/k194,例如,f98w/p152w/k194l,f98w/p152f/k194l,f98w/p152y/k194l,f98w/p152h/k194l,f98w/p152i/k194l,f98w/p152l/k194l或者f98w/p152v/k194l;-f98/f240/k194,例如,f98w/f240w/k194l,f98w/f240y/k194l或者f98w/f240h/k194l;-f98/n242/k194,例如,f98w/n242h/k194l或者f98w/n242q/k194l;-f98/k194/f276,例如,f98w/k194l/f276k,f98w/k194l/f276h,f98w/k194l/f276w或者f98w/k194l/f276r;-f98/k194/s287,例如,f98w/k194l/s287k,f98w/k194l/s287r,f98w/k194l/s287w或者f98w/k194l/s287f;-f98/n293/k194,例如,f98w/n293q/k194l,f98w/n293k/k194l或者f98w/n293h/k194l;-f98/t394/k194,例如,f98w/t394k/k194l,f98w/t394h/k194l或者f98w/t394n/k194l;-f98/h396/k194,例如,f98w/h396y/k194l,f98w/h396f/k194l,f98w/h396q/k194l或者f98w/h396k/k194l;-f98/k397/k194,例如,f98w/k397r/k194l,f98w/k397h/k194l或者f98w/k397y/k194l;或者-f98/y415/k194,例如,f98w/y415w/k194l或者f98w/y415r/k194l。在任何以上组合中,可以用w195,d198,k199和e258中的任一个取代k194。解旋酶优选是seqidno:9,10,11,12,13,14,15,16,17,18,19,20,21,22或23的变体,其包含在与上述seqidno:8中的组合相对应的氨基酸上的取代。塔域和/或销域和/或1a域中的修饰本发明的解旋酶优选是这样一种解旋酶,其中,至少一个半胱氨酸残基(即,一个或多个半胱氨酸残基)和/或至少一个非天然氨基酸(即,一个或多个非天然氨基酸)被引入i)塔域和/或(ii)销域和/或(iii)1a(reca式马达)域,其中,解旋酶具有控制多核苷酸的移动的能力。这些类型的修饰在申请号为pct/gb2014/052736(wo2015/055981)的国际申请中公开。可以将至少一个半胱氨酸残基和/或至少一个非天然氨基酸引入塔域;销域;1a域;塔域和销域;塔域和1a域或者塔域、销域和1a域。本发明的解旋酶优选是这样一种解旋酶,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域和(ii)销域和/或1a(reca式马达)域中的每个,即,引入塔域和销域;塔域和1a域或者塔域、销域和1a域。可以将任何数量的半胱氨酸残基和/或非天然氨基酸引入每个域。例如,可以引入1,2,3,4,5,6,7,8,9,10或更多个半胱氨酸残基,和/或可以引入1,2,3,4,5,6,7,8,9,10或更多个非天然氨基酸。可以仅引入一个或多个半胱氨酸残基。可以仅引入一个或多个非天然氨基酸。可以引入一个或多个半胱氨酸残基和一个或多个非天然氨基酸的组合。优选通过取代引入所述至少一个半胱氨酸残基和/或至少一个非天然氨基酸。这样做的方法是本领域已知的。这些修饰并不妨碍解旋酶与多核苷酸结合。这些修饰降低了多核苷酸从解旋酶解链或脱离的能力。换言之,所述一个或多个修饰通过防止从多核苷酸链解离而增加了解旋酶的持续合成性(processivity)能力。所述一个或多个修饰通常还增加了酶的热稳定性,所述修饰给其提供了改善的结构稳定性,从而有利于链测序。非天然氨基酸是在解旋酶中不天然存在的氨基。非天然氨基酸优选不是组氨酸、丙氨酸、异亮氨酸、精氨酸、亮氨酸、天冬酰胺、赖氨酸、天冬氨酸、甲硫氨酸、半胱氨酸、苯丙氨酸、谷氨酸、苏氨酸、谷氨酰胺、色氨酸、甘氨酸、缬氨酸、脯氨酸、丝氨酸或酪氨酸。非天然氨基酸更优选地不是前句话中的二十种氨基酸中的任一个或硒代半胱氨酸。本发明中使用的优选非天然氨基酸包括但不限于4-叠氮基-l-苯丙氨酸(faz)、4-乙酰基-l-苯丙氨酸、3-乙酰基-l-苯丙氨酸、4-乙酰乙酰基-l-苯丙氨酸、o-烯丙基-l-酪氨酸、3-(苯硒基)-l-丙氨酸、o-2-丙炔-1-基-l-酪氨酸、4-(二羟基硼基)-l-苯丙氨酸、4-[(乙基硫烷基)羰基]-l-苯丙氨酸、(2s)-2-氨基-3-4-[(丙烷-2-基硫烷基)羰基]苯基;丙酸、(2s)-2-氨基-3-4-[(2-氨基-3-硫烷基丙酰基)氨基]苯基;丙酸、o-甲基-l-酪氨酸、4-氨基-l-苯丙氨酸、4-氰基-l-苯丙氨酸、3-氰基-l-苯丙氨酸、4-氟-l-苯丙氨酸、4-碘-l-苯丙氨酸、4-溴-l-苯丙氨酸、o-(三氟甲基)酪氨酸、4-硝基-l-苯丙氨酸、3-羟基-l-酪氨酸、3-氨基-l-酪氨酸、3-碘代-l-酪氨酸、4-异丙基-l-苯丙氨酸、3-(2-萘基)-l-丙氨酸、4-苯基-l-苯丙氨酸、(2s)-2-氨基-3-(萘-2-基氨基)丙酸、6-(甲基硫烷基)正亮氨酸、6-氧代-l-赖氨酸、d-酪氨酸、(2r)-2-羟基-3-(4-羟基苯基)丙酸、(2r)-2-铵基辛酸酯3-(2,2’-双吡啶-5-基)-d-丙氨酸、2-氨基-3-(8-羟基-3-喹啉基)丙酸、4-苯甲酰基-l-苯丙氨酸、s-(2-硝基苄基)半胱氨酸、(2r)-2-氨基-3-[(2-硝基苄基)硫烷基]丙酸、(2s)-2-氨基-3-[(2-硝基苄基)氧基]丙酸、o-(4,5-二甲氧基-2-硝基苄基)-l-丝氨酸、(2s)-2-氨基-6-([(2-硝基苄基)氧基]羰基;氨基)己酸、o-(2-硝基苄基)-l-酪氨酸、2-硝基苯丙氨酸、4-[(e)-苯基二氮烯基]-l-苯丙氨酸、4-[3-(三氟甲基)-3h-双吖丙啶-3-基]-d-苯丙氨酸(4-[3-(trifluoromethyl)-3h-diaziren-3-yl]-d-phenylalanine)、2-氨基-3-[[5-(二甲基氨基)-1-萘基]磺酰基氨基]丙酸、(2s)-2-氨基-4-(7-羟基-2-氧代-2h-色烯-4-基)丁酸、(2s)-3-[(6-乙酰萘-2-基)氨基]-2-氨基丙酸、4-(羧甲基)苯丙氨酸、3-硝基-l-酪氨酸、o-磺基-l-酪氨酸、(2r)-6-乙酰胺基-2-铵基己酸酯、1-甲基组氨酸、2-氨基壬酸、2-氨基癸酸、l-高半胱氨酸、5-硫烷基正缬氨酸、6-硫烷基-l-正亮氨酸5-(甲基硫烷基)-l-正缬氨酸、n6-[(2r,3r)-3-甲基-3,4-二氢-2h-吡咯-2-基]羰基;-l-赖氨酸、n6-[(苄氧基)羰基]赖氨酸、(2s)-2-氨基-6-[(环戊基羰基)氨基]己酸、n6-[(环戊氧基)羰基]-l-赖氨酸、(2s)-2-氨基-6-[(2r)-四氢呋喃-2-基羰基]氨基;己酸、(2s)-2-氨基-8-[(2r,3s)-3-乙炔基四氢呋喃-2-基]-8-氧代辛酸、n6-(叔丁氧基羰基)-l-赖氨酸、(2s)-2-羟基-6-([(2-甲基-2-丙酰基)氧基]羰基;氨基)己酸、n6-[(烯丙氧基)羰基]赖氨酸、(2s)-2-氨基-6-([(2-叠氮基苄基)氧基]羰基;氨基)己酸、n6-l-脯氨酰基-l-赖氨酸、(2s)-2-氨基-6-[(丙-2-炔-1-基氧基)羰基]氨基;己酸和n6-[(2-叠氮基乙氧基)羰基]-l-赖氨酸。最优选的非天然氨基酸是4-叠氮基-l-苯丙氨酸(faz)。以下表4(分为两部分)对每个dda同源物(seqidno:8至23)中构成每个域的残基进行了鉴定。同源物seqidno1a2adda-rma-dsm9m1-i84+r113-y211r212-e294+g422-s678dda-csp10m1-l147+s166-v240r241-n327+a449-g496dda-sru11m1-l90+e108-h173r174-d260+a371-v421dda-sgo12m1-l115+n136-v205r206-k293+i408-l500dda-vph12b813m1-l96+f114-v194r195-d287+v394-q450dda-vph14m1-l77+v96-v166r167-t249+l372-n421dda-aph6515m1-m81+l99-m171r172-t254+l381-k434dda-aphcc216m1-m68+m86-m158r159-t241+l367-k420dda-cph17m1-l87+a108-m181r182-t262+l393-v443dda-kph18m1-l87+a108-m181r182-t262+l392-v442dda-sphime1319m1-l85+t103-k176r177-n257+l387-v438dda-aphac4220m1-l91+v109-m183r184-t265+l393-i442dda-sphsp1821m1-l87+m105-m179r180-t261+l393-v442dda-yph22m1-l86+v104-k178r179-t260+l390-i439dda-sphs1623m1-l86+v104-m178r179-t260+l391-v441dda-19938m1-l85+v103-k177r178-t259+l390-v439同源物seqid塔销钩dda-rma-dsm9g295-n309+f316-y421y85-l112a310-l315dda-csp10v328-p342+n360-y448k148-n165v343-l359dda-sru11a261-t275+t285-y370g91-e107w276-l284dda-sgo12g294-i307+t314-y407g116-t135r308-y313dda-vph12b813v288-e301+n307-n393g97-p113m302-w306dda-vph14s250-p264+e278-s371k78-e95v265-i277dda-aph6515k255-p269+t284-s380k82-k98v270-f283dda-aphcc216d242-p256+t271-s366k69-k85v257-f270dda-cph17t263-p277+n295-p392k88-k107l278-y294dda-kph18d263-p277+n295-a391k88-k107l278-y294dda-sphime1319a258-p272+n290-p386k86-g102l273-f289dda-aphac4220l266-p280+n298-a392k92-d108l281-f297dda-sphsp1821d262-p276+n294-a392k88-e104h277-f293dda-yph22d261-p275+n293-a389k87-e103l276-f292dda-sphs1623e261-p275+t293-a390k87-e103l276-f292dda-19938d260-p274+n292-a389k86-e102l275-f291表4本发明的解旋酶优选包含seqidno:8的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基d260-p274和n292-a389)和/或(ii)销域(残基k86-e102)和/或(iii)1a域(残基m1-l85和v103-k177)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基n292-a389中。本发明的解旋酶优选包含seqidno:9的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基g295-n309和f316-421)和/或(ii)销域(残基y85-l112)和/或(iii)1a域(残基m1-i84和r113-y211)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基f316-y421中。本发明的解旋酶优选包含seqidno:10的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基v328-p342和n360-y448)和/或(ii)销域(残基k148-n165)和/或(iii)1a域(残基m1-l147和s166-v240)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基n360-y448中。本发明的解旋酶优选包含seqidno:11的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基a261-t275和t285-y370)和/或(ii)销域(残基g91-e107)和/或(iii)1a域(残基m1-l90和e108-h173)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基t285-y370中。本发明的解旋酶优选包含seqidno:12的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基g294-1307和t314-y407)和/或(ii)销域(残基g116-t135)和/或(iii)1a域(残基m1-l115和n136-v205)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基t314-y407中。本发明的解旋酶优选包含seqidno:13的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基v288-e301和n307-n393)和/或(ii)销域(残基g97-p113)和/或(iii)1a域(残基m1-l96和f114-v194)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基n307-n393中。本发明的解旋酶优选包含seqidno:14的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基s250-p264和e278-s371)和/或(ii)销域(残基k78-e95)和/或(iii)a域(残基m1-l77和v96-v166)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基e278-s371中。本发明的解旋酶优选包含seqidno:15的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入到(i)塔域(残基k255-p269和t284-s380)和/或(ii)销域(残基k82-k98)和/或(iii)1a域(残基m1-m81和l99-m171)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基t284-s380中。本发明的解旋酶优选包含seqidno:16的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基d242-p256和t271-s366)和/或(ii)销域(残基k69-k85)和/或(iii)a域(残基m1-m68和m86-m158)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基t271-s366中。本发明的解旋酶优选包含seqidno:17的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基t263-p277和n295-p392)和/或(ii)销域(残基k88-k107)和/或(iii)1a域(残基m1-l87和a108-m181)。优选将所述至少一个半胱氨酸残基和/或至少一个非天然氨基酸引入塔域的残基n295-p392中。本发明的解旋酶优选包含seqidno:18的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基d263-p277和n295-a391)和/或(ii)销域(残基k88-k107)和/或(iii)1a域(残基m1-l87和a108-m181)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基n295-a391中。本发明的解旋酶优选包含seqidno:19的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基a258-p272和n290-p386)和/或(ii)销域(残基k86-g102)和/或(iii)1a域(残基m1-l85和t103-k176)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基n290-p386中。本发明的解旋酶优选包含seqidno:20的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基l266-p280和n298-a392)和/或(ii)销域(残基k92-d108)和/或(iii)1a域(残基m1-l91和v109-m183)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基n298-a392中。本发明的解旋酶优选包含seqidno:21的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基d262-p276和n294-a392)和/或(ii)销域(残基k88-e104)和/或(iii)1a域(残基m1-l87和m105-m179)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基n294-a392中。本发明的解旋酶优选包含seqidno:22的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基d261-p275和n293-a389)和/或(ii)销域(残基k87-e103)和/或(iii)1a域(残基m1-l86和v104-k178)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基n293-a389中。本发明的解旋酶优选包含seqidno:23的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(残基e261-p275和t293-a390)和/或(ii)销域(残基k87-e103)和/或(iii)1a域(残基m1-l86和v104-m178)。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到塔域的残基t293-a390中。本发明的解旋酶优选包含seqidno:8至23中任一项的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域和(ii)销域和/或1a域。本发明的解旋酶更优选包含seqidno:8至23中任一项的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入(i)塔域(ii)销域和(iii)1a域。如上所述,可以引入任何数量和组合的半胱氨酸残基和非天然氨基酸。本发明的解旋酶优选包含seqidno:8的变体,其包含(i)e94c和/或a360c;(ii)e93c和/或k358c;(iii)e93c和/或a360c;(iv)e93c和/或e361c;(v)e93c和/或k364c;(vi)e94c和/或l354c;(vii)e94c和/或k358c;(viii)e93c和/或l354c;(ix)e94c和/或e361c;(x)e94c和/或k364c;(xi)l97c和/或l354c;(xii)l97c和/或k358c;(xiii)l97c和/或a360c;(xiv)l97c和/或e361c;(xv)l97c和/或k364c;(xvi)k123c和/或l354c;(xvii)k123c和/或k358c;(xviii)k123c和/或a360c;(xix)k123c和/或e361c;(xx)k123c和/或k364c;(xxi)n155c和/或l354c;(xxii)n155c和/或k358c;(xxiii)n155c和/或a360c;(xxiv)n155c和/或e361c;(xxv)n155c和/或k364c;(xxvi)(i)至(xxv)和g357c中的任一个;(xxvii)(i)至(xxv)和q100c中的任一个;(xxviii)(i)至(xxv)和i127c中的任一个;(xxix)(i)至(xxv)和q100c和i127c中的任一个;(xxx)e94c和/或f377c;(xxxi)n95c;(xxxii)t91c;(xxxiii)y92l,e94y,y350n,a360c和y363n;(xxxiv)e94y和a360c;(xxxv)a360c;(xxxvi)y92l,e94c,y350n,a360y和y363n;(xxxvii)y92l,e94c和a360y;(xxxviii)e94c和/或a360c和f276a;(xxxix)e94c和/或l356c;(xl)e93c和/或e356c;(xli)e93c和/或g357c;(xlii)e93c和/或a360c;(xliii)n95c和/或w378c;(xliv)t91c和/或s382c;(xlv)t91c和/或w378c;(xlvi)e93c和/或n353c;(xlvii)e93c和/或s382c;(xlviii)e93c和/或k381c;(xlix)e93c和/或d379c;(1)e93c和/或s375c;(li)e93c和/或w378c;(lii)e93c和/或w374c;(liii)e94c和/或n353c;(liv)e94c和/或s382c;(lv)e94c和/或k381c;(lvi)e94c和/或d379c;(lvii)e94c和/或s375c;(lviii)e94c和/或w378c;(lix)e94c和/或w374c;(lx)e94c和a360y;(lxi)e94c,g357c和a360c或(ixii)t2c,e94c和a360c。在(i)至(lxii)中的任一个中,和/或优选为和。本发明的解旋酶优选包含seqidno:9至23中任一个的变体,其包含与(i)至(lxii)中任一项所定义的seqidno:8中的那些位点相对应的位点上的半胱氨酸残基。可以采用以下seqidno:8至23的比对来鉴定与seqidno:8中的那些位点相对应的seqidno:9至23中任一个的位点。本发明的解旋酶优选包含seqidno:11的变体,其包含(a)d99c和/或l341c;(b)q98c和/或l341c或(d)q98c和/或a340c。本发明的解旋酶优选包含seqidno:15的变体,其包含d90c和/或a349c。本发明的解旋酶优选包含seqidno:21的变体,其包含d96c和/或a362c。本发明的解旋酶优选包含与(i)至(1xii)中任一项所定义的seqidno:8至23中任一个的变体,其中,faz代替半胱氨酸被引入到一个或多个特定位点上。faz代替半胱氨酸可以被引入到每个特定位点上。本发明的解旋酶优选包含seqidno:8的变体,其包含(i)e94faz和/或a360c;(ii)e94c和/或a360faz;(iii)e94faz和/或a360faz;(iv)y92l,e94y,y350n,a360faz和y363n;(v)a360faz;(vi)e94y和a360faz;(vii)y92l,e94faz,y350n,a360y和y363n;(viii)y92l,e94faz和a360y;(ix)e94faz和a360y;和(x)e94c,g357faz和a360c。本发明的解旋酶优选还包含一个或多个来自销域的单一氨基酸缺失。可以制备任何数量的单一氨基酸缺失,例如1,2,3,4,5,6,7,8,9,10或更多个。解旋酶更优选包含seqidno:8的变体,其包含e93的缺失、e95的缺失或e93和e95的缺失。解旋酶更优选包含seqidno:8的变体,其包含(a)e94c,n95的缺失和a360c;(b)e93的缺失,e94的缺失,n95的缺失,和a360c;(c)e93的缺失,e94c,n95的缺失和a360c或(d)e93c,n95的缺失和a360c。本发明的解旋酶优选包含seqidno:9至23中任一个的变体,其包含与seqidno:8中的e93对应的位点的缺失、与seqidno:8中的e95对应的位点的缺失或与seqidno:8中的e93和e95对应的位点的缺失。本发明的解旋酶优选还包含一个或多个来自钩域的单一氨基酸缺失。可以制备任何数量的单一氨基酸缺失,例如1,2,3,4,5,6,7,8,9,10或更多个。解旋酶更优选包含seqidno:8的变体,其包含任何数量的位点t278至s287的缺失。解旋酶更优选包含seqidno:8的变体,其包含(a)e94c,y279至k284的缺失和a360c;(b)e94c,t278的缺失,y279,v286和s287以及a360c;(c)e94c,i281的缺失和k284和用单个g的取代和a360c;(d)e94c,k280的缺失和p2845和用单个g的取代和a360c;或(e)y279至k284的缺失、e94c、f276a和a230c。本发明的解旋酶优选包含seqidno:9至23中任一个的变体,其包含与seqidno:8中的278至287对应位点的任何数量的缺失。本发明的解旋酶优选还包含一个或多个来自销域的单一氨基酸缺失和一个或多个来自钩域的单一氨基酸缺失。本发明的解旋酶优选是这样一种解旋酶,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域和/或2a(reca式)域中。如上所述,任何数量和组合的半胱氨酸残基和非天然氨基酸可以被引入用于塔、销和1a域。本发明的解旋酶优选包含seqidno:8的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基l275-f291)和/或2a(reca式)域(残基r178-t259和l390-v439)中。本发明的解旋酶优选包含seqidno:9的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基a310-l315)和/或2a(reca式)域(残基r212-e294和g422-s678)中。本发明的解旋酶优选包含seqidno:10的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基v343-l359)和/或2a(reca式)域(残基r241-n327和a449-g496)中。本发明的解旋酶优选包含seqidno:11的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基w276-l284)和/或2a(reca式)域(残基r174-d260和a371-v421)中。本发明的解旋酶优选包含seqidno:12的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基r308-y313)和/或2a(reca式)域(残基r206-k293和i408-l500)中。本发明的解旋酶优选包含seqidno:13的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基m302-w306)和/或2a(reca式)域(残基r195-d287和v394-q450)中。本发明的解旋酶优选包含seqidno:14的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基v265-i277)和/或2a(reca式)域(残基r167-t249和l372-n421)中。本发明的解旋酶优选包含seqidno:15的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基v270-f283)和/或2a(reca式)域(残基r172-t254和l381-k434)中。本发明的解旋酶优选包含seqidno:16的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基v257-f270)和/或2a(reca式)域(残基r159-t241和l367-k420)中。本发明的解旋酶优选包含seqidno:17的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基l278-y294)和/或2a(reca式)域(残基r182-t262和l393-v443)中。本发明的解旋酶优选包含seqidno:18的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基l278-y294)和/或2a(reca式)域(残基r182-t262和l392-v442)中。本发明的解旋酶优选包含seqidno:19的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基l273-f289)和/或2a(reca式)域(残基r177-n257和l387-v438)中。本发明的解旋酶优选包含seqidno:20的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基l281-f297)和/或2a(reca式)域(残基r184-t265和l393-i442)中。本发明的解旋酶优选包含seqidno:21的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基h277-f293)和/或2a(reca式)域(残基r180-t261和l393-v442)中。本发明的解旋酶优选包含seqidno:22的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基l276-f292)和/或2a(reca式)域(残基r179-t260和l390-i439)中。本发明的解旋酶优选包含seqidno:23的变体,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被进一步引入到钩域(残基l276-f292)和/或2a(reca式)域(残基r179-t260和l391-v441)中。本发明的解旋酶优选包含seqidno:8的变体,其包含(i)i181c;(ii)y279c;(iii)i281c;和(iv)e288c中的一个或多个。解旋酶可以包含(i)至(iv)的任何组合,例如(i);(ii);(iii);(iv);(i)和(ii);(i)和(iii);(i)和(iv);(ii)和(iii);(ii)和(iv);(iii)和(iv);或(i),(ii),(iii)和(iv)。解旋酶更优选包含seqidno:8的变体,其包含(a)e94c,i281c和a360c或(b)e94c,i281c,g357c和a360c。本发明的解旋酶优选包含seqidno:9至23中任一个的变体,其包含与(i)至(iv)、(a)和(b)中所定义的seqidno:8中的那些位点相对应的一个或多个位点上的半胱氨酸残基。解旋酶可以包含这些变体中的任一个,其中,faz代替半胱氨酸被引入到一个或多个特定位点(或每个特定位点)上。本发明的解旋酶被进一步修饰以减少其表面负电荷。可以以与上述公开的dda域相同的方式对表面残基进行鉴定。表面负电荷通常是表面带负电荷的氨基酸,例如,天冬氨酸(d)和谷氨酸(e)。解旋酶优选地被修饰,以通过用一个或多个带正电荷的氨基酸、不带电荷的氨基酸、非极性氨基酸和/或芳族氨基酸取代一个或多个带负电荷的氨基酸,或者通过引入一个或多个带正电荷的氨基酸,优选与一个或多个带负电荷的氨基酸相邻,来中和一个或多个表面负电荷。合适的带正电荷的氨基酸包括但不限于组氨酸(h)、赖氨酸(k)和精氨酸(r)。不带电荷的氨基酸没有净电荷。合适的不带电荷氨基酸包括但不限于半胱氨酸(c)、丝氨酸(s)、苏氨酸(t)、甲硫氨酸(m)、天冬酰胺(n)和谷氨酰胺(q)。非极性氨基酸具有非极性侧链。合适的非极性氨基酸包括但不限于甘氨酸(g)、丙氨酸(a)、脯氨酸(p)、异亮氨酸(i)、亮氨酸(l)和缬氨酸(v)。芳族氨基酸具有芳族侧链。合适的芳族氨基酸包括但不限于组氨酸(h)、苯丙氨酸(f)、色氨酸(w)和酪氨酸(y)。优选的取代包括但不限于用r取代e、用k取代e、用n取代e、用k取代d以及用r取代d。本发明的解旋酶优选包含seqidno:8的变体,并且所述一个或多个带负电荷的氨基酸是d5,e8,e23,e47,d167,e172,d202,d212和e273中的一个或多个。可以中和任何数量的这些氨基酸,例如,它们中的1,2,3,4,5,6,7或8个。可以中和任何组合。本发明的解旋酶优选包含seqidno:9至23中任一个的变体,并且所述一个或多个带负电荷的氨基酸对应seqidno:8中的d5,e8,e23,e47,d167,e172,d202,d212和e273的一个或多个。可以采用以下比对方式确定与seqidno:8中的d5,e8,e23,e47,d167,e172,d202,d212和e273相对应的seqidno:9至23中的氨基酸。本发明的解旋酶优选包含seqidno:8的变体,其包含(a)e94c,e273g和a360c或(b)e94c,e273g,n292g和a360c。优选通过除去一个或多个天然半胱氨酸残基来对本发明的解旋酶进行进一步修饰。可以除去任何数量的天然半胱氨酸残基。seqidno:9至23中的每一个中的半胱氨酸残数量在表1(如#c)中示出。优选通过取代来除去所述一个或多个半胱氨酸残基。优选用丙氨酸(a)、丝氨酸(s)或缬氨酸(v)取代所述一个或多个半胱氨酸残基。本发明的解旋酶优选包含seqidno:8的变体,并且所述一个或多个天然半胱氨酸残基是c109,c114,c136,c171和c412中的一个或多个。可以除去任何数量和组合的这些半胱氨酸残基。例如,seqidno:8的变体可以包含c109;c114;c136;c171;c412;c109和c114;c109和c136;c109和c171;c109和c412;c114和c136;c114和c171;c114和c412;c136和c171;c136和c412;c171和c412;c109,c114和c136;c109,c114和c171;c109,c114和c412;c109,c136和c171;c109,c136和c412;c109,c171和c412;c114,c136和c171;c114,c136和c412;c114,c171和c412;c136,c171和c412;c109,c114,c136和c171;c109,c114,c136和c412;c109,c114,c171和c412;c109,c136,c171和c412;c114,c136,c171和c412;或c109,c114,c136,c171和c412。本发明的解旋酶优选是这样一种解旋酶,其中,至少一个半胱氨酸残基(即,一个或多个半胱氨酸残基)和/或至少一个非天然氨基酸(即,一个或多个非天然氨基酸)仅被引入到塔域中。以上对合适的修饰进行了讨论。本发明的解旋酶优选包含seqidno:8的变体,其包含以下突变:-e93c和k364c;-e94c和k364c;-e94c和a360c;-l97c和e361c;-l97c和e361c和c412a;-k123c和e361c;-k123c,e361c和c412a;-n155c和k358c;-n155c,k358c和c412a;-n155c和l354c;-n155c,l354c和c412a;-δe93,e94c,δn95和a360c;-e94c,δn95和a360c;-e94c,q100c,i127c和a360c;-l354c;-g357c;-e94c,g357c和a360c;-e94c,y279c和a360c;-e94c,i281c和a360c;-e94c,y279faz和a360c;-y279c和g357c;-i281c和g357c;-e94c,y279c,g357c和a360c;-e94c,1281c,g357c和a360c;-e8r,e47k,e94c,d202k和a360c;-d5k,e23n,e94c,d167k,e172r,d212r和a360c;-d5k,e8r,e23n,e47k,e94c,d167k,e172r,d202k,d212r和a360c;-e94c,c114a,c171a,a360c和c412d;-e94c,c114a,c171a,a360c和c412s;-e94c,c109a,c136a和a360c;-e94c,c109a,c114a,c136a,c171a,a360c和c412s;-e94c,c109v,c114v,c171a,a360c和c412s;-c109a,c114a,c136a,g153c,c171a,e361c和c412a;-c109a,c114a,c136a,g153c,c171a,e361c和c412d;-c109a,c114a,c136a,g153c,c171a,e361c和c412s;-c109a,c114a,c136a,g153c,c171a,k358c和c412a;-c109a,c114a,c136a,g153c,c171a,k358c和c412d-c109a,c114a,c136a,g153c,c171a,k358c和c412s;-c109a,c114a,c136a,n155c,c171a,k358c和c412a;-c109a,c114a,c136a,n155c,c171a,k358c和c412d;-c109a,c114a,c136a,n155c,c171a,k358c和c412s;-c109a,c114a,c136a,n155c,c171a,l354c和c412a;-c109a,c114a,c136a,n155c,c171a,l354c和c412d;-c109a,c114a,c136a,n155c,c171a,l354c和c412s;-c109a,c114a,k123c,c136a,c171a,e361c和c412a;-c109a,c114a,k123c,c136a,c171a,e361c和c412d;-c109a,c114a,k123c,c136a,c171a,e361c和c412s;-c109a,c114a,k123c,c136a,c171a,k358c和c412a;-c109a,c114a,k123c,c136a,c171a,k358c和c412d;-c109a,c114a,k123c,c136a,c171a,k358c和c412s;-c109a,c114a,c136a,g153c,c171a,e361c和c412a;-e94c,c109a,c114a,c136a,c171a,a360c和c412d;-e94c,c109a,c114v,c136a,c171a,a360c和c412d;-e94c,c109v,c114a,c136a,c171a,a360c和c412d;-l97c,c109a,c114a,c136a,c171a,e361c和c412a;-l97c,c109a,c114a,c136a,c171a,e361c和c412d;或者-l97c,c109a,c114a,c136a,c171a,e361c和c412s。钩域和/或2a域中的修饰在一个实施方案中,本发明的解旋酶是这样一种解旋酶,其中,至少一个半胱氨酸残基和/或至少一个非天然氨基酸被引入到钩域和/或2a(reca式马达)域中,其中,所述解旋酶具有控制多核苷酸的移动的能力。至少一个半胱氨酸残基和/或至少一个非天然氨基酸优选被引入到钩域和2a(reca式马达)域中。可以将任何数量的半胱氨酸残基和/或非天然氨基酸引入到每个域中。例如,1,2,3,4,5,6,7,8,9,10或更多个半胱氨酸残基可以被引入,和/或1,2,3,4,5,6,7,8,9,10或更多个非天然氨基酸可以被引入。可以仅引入一个或多个半胱氨酸残基。可以仅引入一个或多个非天然氨基酸。可以引入一个或多个半胱氨酸残基和一个或多个非天然氨基酸的组合。优选通过取代引入所述至少一个半胱氨酸残基和/或至少一个非天然氨基酸。这样做的方法是本领域已知的。以上对钩域和/或2a(reca式马达)域的合适修饰进行了讨论。本发明的解旋酶优选为seqidno:8的变体,其包含(a)y279c,i181c,e288c,y279c和i181c;(b)y279c和e288c;(c)i181c和e288c或(d)y279c,i181c和e288c。本发明的解旋酶优选包含seqidno:9至23中任一个的变体,其包含与(a)至(d)中所定义的seqidno:8中的那些位点相对应的一个或多个位点上的突变。表面修饰在一个实施方案中,对解旋酶进行修饰以减少其表面负电荷,其中,解旋酶具有控制多核苷酸的移动的能力。以上对合适的修饰进行了讨论。可以中和任何数量的表面负电荷。本发明的解旋酶优选包含seqidno:8的变体,其包含以下突变:-e273g;-e8r,e47k和d202k;-d5k,e23n,d167k,e172r和d212r;或者-d5k,e8r,e23n,e47k,d167k,e172r,d202k和d212r。其它修饰的解旋酶在一个实施方案中,本发明的解旋酶包含seqidno:8的变体,其包含:-a360k;-y92l和/或a360y;-y92l,y350n和y363n;-y92l和/或y363n;或者-y92l。其它修饰除了以上公开的特定突变之外,seqidno:8的变体可以包含以下突变中的一个或多个:-k38a;-t91f;-t91n;-t91q;-t91w;-v96e;-v96f;-v96l-v96q;-v96r;-v96w;-v96y;-p274g;-v286f;-v286w;-v286y;-f291g;-n292f;-n292g;-n292p;-n292y;-g294y;-g294f;-k364a;和-w378a。除了以上公开的特定突变外,seqidno:8的变体可以包含:本发明的解旋酶优选包含seqidno:8的变体,其包含(a)e94c/a360c/w378a或者(b)e94c/a360c/c109a/c136a/w378a或者(d)e94c/a360c/c109a/c136a/w378a和然后(δm1)g1g2(即,缺失m1,然后加入g1和g2)。seqidno:8至23中任一个的优选变体具有(除了本发明的修饰之外),一个甘氨酸残基(g)取代的n-末端甲硫氨酸(m)。在实施例中,这显示为(δm1)g1。也可以将其称为m1g。上述任一变体还可以包括m1g。本发明最优选的解旋酶包含seqidno:8的变体,其包含:(a)e94c/f98w/a360c/c109a/c136a/k194l;(b)mlg/e94c/f98w/a360c/c109a/c136a/k194l;(c)e94c/f98w/a360c/c109a/c136a/k199l;或(d)mlg/e94c/f98w/a360c/c109a/c136a/k199l。变体解旋酶的变体是一种酶,其具有从野生型解旋酶的氨基酸序列变化而来的氨基酸序列,并具有多核苷酸结合活性。具体地,seqidno:8至23中任一个的变体是一种酶,其具有由seqidno:8至23中任一个的氨基酸序列变化而来并具有多核苷酸结合活性的氨基酸序列。可以采用本领域已知的方法来确定多核苷酸结合活性。合适的方法包括但不限于荧光各向异性、色氨酸荧光和电泳迁移率变动分析(emsa)。例如,可以如实施例所述确定变体与单链多核苷酸结合的能力。变体具有解旋酶活性。这可以以各种方式进行测量。例如,可以采用电生理学、荧光测定或atp水解来测量变体沿着多核苷酸移位的能力。变体可以包括促进多核苷酸对解旋酶进行编码的修饰和/或促进其在高盐浓度和/或室温下活性的修饰。对于整个长度的seqidno:8至23中任一个的氨基酸序列,基于氨基酸相似性或同一性,变体将优选与该序列至少20%同源。更优选地,基于氨基酸同一性,变体多肽与整个序列的seqidno:8至23中任一个的氨基酸序列可以至少30%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选至少95%、97%或99%同源。在100或更多,例如150,200,300,400或500或更多的连续氨基酸长度上,可以具有至少70%,例如至少80%、至少85%、至少90%或至少95%的氨基酸同一性(“严格同源性”)。如下所述,对同源性进行确定。相对于seqidno:2和4,变体可以以下述任一方式不同于野生型序列。具体地,除了上述特定修饰之外,seqidno:8至23中任一个的变体可以包括下述一个或多个取代、一个或多个缺失和/或一个或多个添加。seqidno:8至23中任一个的优选变体在氨基-(n-)末端和/或羧基(c-)末端上具有非天然氨基酸,例如,faz。seqidno:8至23中任一个的优选变体在氨基-(n-)末端和/或羧基(c-)末端具有半胱氨酸残基。seqidno:8至23中任一个的优选变体在氨基-(n-)末端具有半胱氨酸残基,在羧基(c-)末端具有非天然氨基酸,例如,faz,反之亦然。seqidno:8的优选变体包含以下修饰e54g,d151e,i196n和g357a的一个或多个,例如,全部。无连接在一个优选实施方案中,本发明的修饰的解旋酶中引入的半胱氨酸和/或非天然氨基酸彼此之间不连接。连接引入的两个或多个半胱氨酸和/或非天然氨基酸在另一个优选实施方案中,本发明的修饰的解旋酶中引入的两个或多个半胱氨酸和/或非天然氨基酸彼此连接。这通常降低本发明的解旋酶从多核苷酸中解链的能力。任何数量和组合的两个或更多个所述引入的半胱氨酸和/或非天然氨基酸可以彼此连接。例如,3,4,5,6,7,8或多个半胱氨酸和/或非天然氨基酸可以彼此连接。一个或多个半胱氨酸可以与一个或多个半胱氨酸连接。一个或多个半胱氨酸可以与一个或多个非天然氨基酸(例如,faz)连接。一个或多个非天然氨基酸(例如,faz)可以与一个或多个非天然氨基酸(例如,faz)连接。两个或多个半胱氨酸和/或非天然氨基酸可以以任何方式连接。连接可以是瞬时的,例如,非共价连接。甚至瞬时连接将减少多核苷酸从解旋酶中解链。两个或多个半胱氨酸和/或非天然氨基酸优选通过亲和分子连接。合适的亲和分子是本领域已知的。亲和分子优选(a)互补多核苷酸(国际申请号pct/gb10/000132(公开为wo2010/086602);(b)抗体或其片段以及互补表位(biochemistry6thed,w.h.freemanandco(2007)pp953-954);(c)肽拉链(o'sheaetal.,science254(5031):539-544);(d)能够通过β-片体添加(β-sheetsaugmentation)的相互作用(remautandwaksmantrendsbiochem.sci.(2006)31436-444);(e)能够氢键、π堆叠(pi-stacking)或形成盐桥;(f)轮烷(xiangmaandhetianchem.soc.rev.,2010,39,70-80);(g)适体和互补蛋白(james,w.inencyclopediaofanalyticalchemistry,r.a.meyers(ed.)pp.4848–4871johnwiley&sonsltd,chichester,2000)或(h)半螯合剂(hammersteinetal.jbiolchem.2011april22;286(16):14324–14334)。对于(e),氢键发生在与电负性原子结合的质子和另一个电负性原子之间。π堆叠需要两个可以堆叠在一起的芳族环,其中,两个芳族环的平面是平行的。盐桥位于可以使其电子在几个原子上离域(delocalize)的基团之间,例如,天冬氨酸与精氨酸之间。两个或多个部分可以通过六-组氨酸标签(hexa-histag)或ni-nta瞬时连接。两个或多个半胱氨酸和/或非天然氨基酸优选永久连接。在本发明的上下文中,在使用解旋酶时如果连接未断裂或者在使用者的一部分上不进行干预的情况下连接不会断裂,则连接是永久性的,干预的情况例如,使用还原反应来打开-s-s-键。两个或多个半胱氨酸和/或非天然氨基酸优选共价连接。可以采用本领域已知的任何方法使两个或更多个半胱氨酸和/或非天然氨基酸共价连接。两个或多个半胱氨酸和/或非天然氨基酸可以通过其天然存在的氨基酸例如,半胱氨酸、苏氨酸、丝氨酸、天冬氨酸、天冬酰胺、谷氨酸和谷氨酰胺共价连接。可以对天然存在的氨基酸进行修饰以便于连接。例如,可以通过酰化、磷酸化、糖基化或法尼基化对天然存在的氨基酸进行修饰。其它合适的修饰是本领域已知的。对天然存在的氨基酸进行的修饰可以是转译后修饰。两个或更多个半胱氨酸和/或非天然氨基酸可以通过被引入到其序列的氨基酸进行连接。这些氨基酸优选通过取代被引入。引入的氨基酸可以是促进连接的半胱氨酸或非天然氨基酸。合适的非天然氨基酸包括但不限于4-叠氮基-l-苯丙氨酸(faz)、liuc.c.andschultzp.g.,annu.rev.biochem.,2010,79,413-444中的图1中包含的任一个编号为1-71的氨基酸或下列氨基酸中的任一个。引入的氨基酸可以如上所述进行修饰。在优选实施方案中,使用连接器来连接两个或更多个半胱氨酸和/或非天然氨基酸。以下对连接器分子进行更详细的讨论。一种合适的连接方法是半胱氨酸连接。这将在以下进行更详细的讨论。两个或更多个半胱氨酸和/或非天然氨基酸优选采用一个或多个例如,两个或三个连接器连接。所述一个或多个连接器可以设计成减小如上所述的开口尺寸或闭合开口。如果正在使用一个或多个连接器来闭合如上所述的开口,则所述一个或多个连接器的至少一部分优选是取向的,从而当其通过解旋酶结合时不与多核苷酸平行。更优选地,所有连接器均以这种方式取向。如果正在使用一个或多个连接器来闭合如上所述的开口,则所述一个或多个连接器的至少一部分优选地在方向,即当其通过解旋酶结合时以不与多核苷酸平行的方向穿过开口。更优选地,所有连接器均以这种方式穿过开口。在这些实施方案中,所述一个或多个连接器的至少一部分可能垂直于多核苷酸。这种取向有效地闭合了开口,使得多核苷酸不能通过开口从解旋酶中解开。每个连接器可以具有两个或多个功能性末端,例如,两个、三个或四个功能性末端。连接器中的末端的合适结构在本领域中是公知的。一个或多个连接器的一个或多个末端优选与解旋酶共价连接。如果一端为共价连接,则一个或多个连接器可以瞬时连接上述两个或多个半胱氨酸和/或非天然氨基酸。如果两个或所有末端为共价连接,则一个或多个连接器永久连接两个或多个半胱氨酸和/或非天然氨基酸。一个或多个连接器优选为氨基酸序列和/或化学交联剂。合适的氨基酸连接器例如,肽连接器是本领域已知的。通常设计氨基酸或肽连接器的长度、柔性和亲水性,使得其减小开口的尺寸,但不会扰乱解旋酶的功能。优选的柔性肽连接器是2至20个,例如4,6,8,10或16个,丝氨酸和/或甘氨酸氨基酸的链。更优选的柔性连接器包括(sg)1,(sg)2,(sg)3,(sg)4,(sg)5,(sg)8,(sg)10,(sg)15或(sg)20,其中,s是丝氨酸,g是甘氨酸。优选的刚性连接器是2至30个,例如,4,6,8,16或24个,脯氨酸氨基酸的链。更优选的刚性连接器包括(p)12,其中,p是脯氨酸。连接器的氨基酸序列优选包含多核苷酸结合部分。以下对这种部分和与其使用相关的优点进行讨论。合适的化学交联剂是本领域公知的。合适的化学交联剂包括但不限于包括以下官能团的那些化学交联剂:马来酰亚胺、活性酯、琥珀酰亚胺、叠氮化物、炔烃(例如,二苯并环辛炔(dibo或dbco)、二氟环炔烃和线性炔烃)、膦(例如,无痕和非无痕施陶丁格结合中使用的那些)、卤代乙酰基(例如,碘乙酰胺)、光气型试剂、磺酰氯化物试剂、异硫氰酸酯、酰基卤化物、肼、二硫化物、乙烯基砜、氮杂环丙烷和光敏试剂(例如,芳基叠氮化物、二氮杂环丙烷)。氨基酸和官能团之间的反应可以是自发的,例如,半胱氨酸/马来酰亚胺,或者可能需要外部试剂,例如,用于连接叠氮化物和线性炔烃的cu(i)。连接器可以包括跨越所需距离的任何分子。连接器在长度上可以从一个碳(光气型连接器)到许多埃(angstrom)进行变化。线性分子的示例包括但不限于聚乙二醇(peg)、多肽、多糖、脱氧核糖核酸(dna)、肽核酸(pna)、苏糖核酸(tna)、甘油核酸(gna)、饱和和不饱和的烃、聚酰胺。这些连接器可以是惰性的或反应性的,特别是其在限定位点上可以是化学断裂的(cleavable),或者可以用荧光团或配体进行自身修饰。连接器优选是耐二硫苏糖醇(dtt)的。优选的交联剂包括2,5-二氧代吡咯烷-1-基3-(吡啶-2-基二硫烷基)丙酸酯、2,5-二氧代吡咯烷-1-基4-(吡啶-2-基二硫烷基)丁酸乙酯和2,5-二氧代吡咯烷-1-基8-(吡啶-2-基二硫烷基)辛酸酯、二马来酰亚胺peg1k、二马来酰亚胺peg3.4k、二马来酰亚胺peg5k、二马来酰亚胺peg10k、双(马来酰亚胺基)乙烷(bmoe)、双马来酰亚胺己烷(bmh)、1,4-双马来酰亚胺丁烷(bmb)、1,4-双马来酰亚胺基-2,3-二羟基丁烷(bmdb)、bm[peo]2(1,8-双马来酰亚胺二乙二醇)、bm[peo]3(1,11-双马来酰亚胺三乙二醇)、三[2-马来酰亚氨基乙基]胺(tmea)、dtme二硫代二马来酰亚胺乙烷、双马来酰亚胺peg3、双马来酰亚胺peg11、dbco-马来酰亚胺、dbco-peg4-马来酰亚胺、dbco-peg4-nh2、dbco-peg4-nhs、dbco-nhs、dbco-peg-dbco2.8kda、dbco-peg-dbco4.0kda、dbco-15原子-dbco、dbco-26原子-dbco、dbco-35原子-dbco、dbco-peg4-s-s-peg3-生物素、dbco-s-s-peg3-生物素、dbco-s-s-peg11-生物素、(琥珀酰亚胺基3-(2-吡啶基二硫代)丙酸酯(spdp)和马来酰亚胺-peg(2kda)-马来酰亚胺(α,ω-双马来酰亚胺基聚乙二醇)。最优选的交联剂是马来酰亚胺-丙基-srdfwrs-(1,2-乙二胺)-丙基-马来酰亚胺。一个或多个连接器可以是可断裂的。这将在以下进行更详细的讨论。可以使用彼此特异的两个不同连接器来连接两个或更多个半胱氨酸和/或非天然氨基酸。其中一个连接器与一个部分连接,另一个与另一个部分连接。连接器应当反应以形成本发明的修饰的解旋酶。可以使用申请号为pct/gb10/000132(公布为wo2010/086602)的国际申请中描述的杂交连接器来连接两个或更多个半胱氨酸和/或非天然氨基酸。具体地,可以使用两个或更多个连接器来连接两个或更多个半胱氨酸和/或非天然氨基酸,其中,所述两个或更多个连接器各自包含可杂交的区域和能够形成共价键的基团。连接器中的可杂交区域将两个或更多个半胱氨酸和/或非天然氨基酸杂交并连接。连接的半胱氨酸和/或非天然氨基酸然后通过在基团之间形成的共价键耦合。根据本发明,可以使用申请号为pct/gb10/000132(公开为wo2010/086602)的国际申请中公开的任何特异性连接器。可以对两个或更多个半胱氨酸和/或非天然氨基酸进行修饰,然后使用对这两个修饰特异的化学交联剂来连接。可以使用上述任一交联剂。可以对连接器进行标记。合适的标记物包括但不限于荧光分子(例如cy3或555)、放射性同位素、例如,125i,35s,酶、抗体、抗原、多核苷酸和诸如生物素等配体。这种标记物允许对连接器的数量进行量化。标记物还可以是可断裂的纯化标签,例如,生物素,或在鉴定方法中出现的特异性序列,例如,本身不存在于蛋白质中但通过胰蛋白酶消化而释放的肽。连接两个或更多个半胱氨酸的优选方法是通过半胱氨酸连接。这可以通过双功能化学交联剂或通过末端出现半胱氨酸残基的氨基酸连接器来介导。可以对任何双官能连接器的长度、反应性、特异性、刚性和溶解性进行设计以确保开口尺寸充分减小并且解旋酶的功能被保留。合适的连接器包括双马来酰亚胺交联剂,例如,1,4-双(马来酰亚胺基)丁烷(bmb)或双(马来酰亚胺基)己烷。双功能连接器的一个缺点是如果优选在特定位点进行连接,则要求解旋酶不进一步包含表面可接近(accessible)的半胱氨酸残基,因为双功能连接器与表面可接近的半胱氨酸残基的结合可能难以控制,并且可能影响底物结合或活性。如果解旋酶确实包含几个可接近的半胱氨酸残基,则可能需要对解旋酶进行修饰以去除它们,同时确保修饰不影响解旋酶的折叠或活性。这在申请号为pct/gb10/000133(公开为wo2010/086603)的国际申请中进行了讨论。可以通过对例如,肽连接器上的相邻残基进行修饰来增强半胱氨酸残基的反应性。例如,侧链精氨酸、组氨酸或赖氨酸残基的碱基会将半胱氨酸硫醇基团的pka改变为更具反应性的s-基团的pka。半胱氨酸残基的反应性可以被硫醇保护基团,例如5,5’-二硫代双-(2-对硝基苯甲酸)(dtnb)保护。这些保护基团可以在连接器连接之前与解旋酶的一个或多个半胱氨酸残基反应。可以采用固定在小珠(beads)上的还原试剂(例如,固定化的三(2-羧乙基)膦,tcep)来使表面可接近的半胱氨酸选择性去保护。以下对半胱氨酸连接进行更详细的讨论。另一种优选的连接方法是通过faz连接。这可以通过双功能化学连接器或通过末端出现faz残基的多核苷酸连接器来介导。其它修饰也可以对本发明的解旋酶进行修饰以增加(i)塔域与(ii)销域和/或1a域之间的吸引力。根据本发明,可以进行任何已知的化学修饰。这些类型的修饰在申请号为pct/gb2014/052736(wo2015/055981)的国际申请中进行了公开。具体地,本发明提供本发明的解旋酶,其中,至少一个带电荷的氨基酸被引入到(i)塔域和/或(ii)销域和/或(iii)1a(reca式马达)域中,其中,解旋酶具有控制多核苷酸移动的能力。如上所述,可以对解旋酶控制多核苷酸移动的能力进行测量。本发明优选提供本发明的解旋酶,其中,至少一个带电荷的氨基酸被引入到(i)塔域和(ii)销域和/或1a域中。所述至少一个带电荷的氨基酸可以带负电荷的或带正电荷的。所述至少一个带电荷的氨基酸优选地与其在解旋酶中相互作用的任一氨基酸所带的电荷相反。例如,至少一个带正电荷的氨基酸可以被引入到塔域中的与销域中的带负电荷的氨基酸发生相互作用的位点上。所述至少一个带电荷的氨基酸通常被引入到位点,即在野生型(即,未修饰的)解旋酶中的不带电荷的位点上。可以使用所述至少一个带电荷的氨基酸来取代解旋酶中至少一个带相反电荷的氨基酸。例如,带正电荷的氨基酸可以被用来取代带负电荷的氨基酸。合适的带电荷的氨基酸如上讨论。所述至少一个带电荷的氨基酸可以是天然的,例如,精氨酸(r)、组氨酸(h)、赖氨酸(k)、天冬氨酸(d)或谷氨酸(e)。可选地,所述至少一个带电荷的氨基酸可以是人造的或非天然的。可以将任何数量的带电荷的氨基酸引入每个域中。例如,可以将1,2,3,4,5,6,7,8,9,10或更多个带电荷的氨基酸引入每个域中。解旋酶优选包含seqidno:8的变体,其包含在以下一个或多个位点上带正电荷的氨基酸:(i)93;(ii)354;(iii)360;(iv)361;(v)94;(vi)97;(vii)155;(viii)357;(ix)100和(x)127。解旋酶优选包含seqidno:8的变体,其包含在以下一个或多个位点上带负电荷的氨基酸:(i)354;(ii)358;(iii)360;(iv)364;(v)97;(vi)123;(vii)155;(viii)357;(ix)100和(x)127。解旋酶优选包含seqidno:9至23中任一个的变体,所述变体在与(i)至(x)中任一项所定义的seqidno:8中的那些位点相对应的位点上包含带正电荷的氨基酸或带负电荷的氨基酸。可以采用以下seqidno:8至23的比对来鉴定与seqidno:8中的那些位点相对应的seqidno:9至23中任一个的位点。解旋酶优选包含seqidno:8的变体,其通过至少一个带电荷的氨基酸的引入来修饰,使得其在以下位点上包含带相反电荷的氨基酸:(i)93和354;(ii)93和358;(iii)93和360;(iv)93和361;(v)93和364;(vi)94和354;(vii)94和358;(viii)94和360;(ix)94和361;(x)94和364;(xi)97和354;(xii)97和358;(xiii)97和360;(xiv)97和361;(xv)97和364;(xvi)123和354;(xvii)123和358;(xviii)123和360;(xix)123和361;(xx)123和364;(xxi)155和354;(xxii)155和358;(xxiii)155和360;(xxiv)155和361;(xxv)155和364。本发明的解旋酶优选包含seqidno:9至23中任一个的变体,其在与(i)至(xxv)中任一项所定义的seqidno:8中的那些位点相对应的位点上包含带相反电荷的氨基酸。本发明还提供一种解旋酶,其中,(i)至少一个带电荷的氨基酸被引入到塔域中;以及(ii)至少一个带相反电荷的氨基酸被引入到销域和/或1a(reca式马达)域中,其中,所述解旋酶具有控制多核苷酸移动的能力。所述至少一个带电荷的氨基酸可以带负电荷,所述至少一个带相反电荷的氨基酸可以带正电荷,反之亦然。以上对合适的带电荷的氨基酸进行了讨论。可以引入任何数量的带电荷的氨基酸和任何数量的带相反电荷的氨基酸。例如,可以引入1,2,3,4,5,6,7,8,9,10或更多个带电荷的氨基酸和/或可以引入1,2,3,4,5,6,7,8,9,10或更多个带相反电荷的氨基酸。通常在野生型解旋酶中不带电荷的位点上引入带电荷的氨基酸。可采用带电荷的氨基酸中的一种或两种来取代解旋酶中带电荷的氨基酸。例如,带正电荷的氨基酸可以被用来取代带负电荷的氨基酸。可以在上述(i)塔域和(ii)销域和/或1a域中的任一位点上引入带电荷的氨基酸。通常引入带相反电荷的氨基酸使得其在所得的解旋酶中相互作用。解旋酶优选包含seqidno:8的变体,其中,在以下位点上引入带相反电荷的氨基酸:(i)97和354;(ii)97和360;(iii)155和354;或(iv)155和360。本发明的解旋酶优选包含seqidno:9至23中任一个的变体,其在与(i)至(iv)中任一项所定义的seqidno:8中的那些位点相对应的位点上包含带相反电荷的氨基酸。构建体本发明还提供一种构建体,其包含本发明的修饰的解旋酶和附加的多核苷酸结合部分,其中,所述解旋酶与所述多核苷酸结合部分连接,所述构建体具有控制多核苷酸移动的能力。所述构建体是人造的或非天然的。本发明的构建体是在链测序期间控制多核苷酸移动的有用工具。本发明的构建体相比本发明的修饰的解旋酶更不可能从正进行测序的多核苷酸中脱离开来。当构建体控制多核苷酸穿过纳米孔的移位时,所述构建体可甚至提供更大的多核苷酸的读取长度。还可以设计与特异性多核苷酸序列结合的目标构建体。如下进行更详细的讨论,多核苷酸结合部分可以与特异性多核苷酸序列结合,从而将构建体的解旋酶部分靶向特异性序列。构建体具有控制多核苷酸移动的能力。这可以如上所述进行确定。本发明的构建体可以是分离的、基本上分离的、纯化的或基本上纯化的。如果构建体完全没有任何其它组分,如脂质、多核苷酸或孔单体,则其是分离的或纯化的。如果将构建体与不会干扰其预期用途的载体或稀释剂混合,则其是基本上分离的。例如,如果构建体以以下形式存在,即,包含小于10%、小于5%、小于2%或小于1%的其它组分(例如脂质、多核苷酸或孔单体),则其是基本上分离的或基本上纯化的。解旋酶可以是上述本发明解旋酶中的任一种。解旋酶优选与附加的多核苷酸结合部分共价连接。解旋酶可以在不止一个位点,例如两个或三个上与所述部分连接。可以采用本领域已知的任何方法将解旋酶与所述部分共价连接。关于连接两个或多个部分的合适方法如上讨论。解旋酶和部分可以单独制备,然后连接在一起。两个组分可以以任何构型进行连接。例如,它们可以通过其末端(即,氨基或羧基末端)氨基酸进行连接。合适的构型包括但不限于所述部分的氨基末端与解旋酶的羧基末端连接,反之亦然。可选地,两个组分可以通过其序列内的氨基酸进行连接。例如,所述部分可以与解旋酶的环区域中的一个或多个氨基酸连接。在优选实施方案中,所述部分的末端氨基酸与解旋酶的环区域中的一个或多个氨基酸连接。在优选实施方案中,解旋酶与所述部分进行化学连接,例如,通过上述一个或多个连接器分子。在另一优选实施方案中,解旋酶与所述部分进行遗传融合。如果整个构建体从单个多核苷酸序列表达,则解旋酶与部分进行遗传融合。可以以任何方式组合解旋酶和部分的编码序列以形成编码构建体的单个多核苷酸序列。孔与核酸结合蛋白的遗传融合在申请号为pct/gb09/001679(公开为wo2010/004265)的国际申请中进行了讨论。解旋酶和部分可以以任何构型进行遗传融合。解旋酶和部分可以通过其末端氨基酸进行融合。例如,所述部分的氨基末端可以与解旋酶的羧基末端进行融合,反之亦然。所述部分的氨基酸序列优选以框架(frame)的形式添加到解旋酶的氨基酸序列中。换言之,所述部分优选插入解旋酶的序列中。在这些实施方案中,解旋酶和部分通常在两个位点上,即,通过所述部分的氨基和羧基末端氨基酸连接。如果所述部分插入解旋酶的序列中,则所述部分的氨基和羧基末端氨基酸优选非常接近,并且各自与解旋酶或其变体的序列中的相邻氨基酸连接。在优选实施方案中,所述部分插入到解旋酶的环区域中。解旋酶可以与所述部分直接连接。解旋酶优选采用上述一个或多个,例如两个或三个连接器与所述部分连接。所述一个或多个连接器可以设计成限制所述部分的移动性。可以对解旋酶和/或部分进行修饰以促进上述一个或多个连接器连接。可断裂的连接器可用作辅助,以将构建体与非连接的组分分离,并可用于进一步控制合成反应。例如,异双官能连接器可以与解旋酶反应,但不与所述部分反应。如果连接器的自由端可用于将解旋酶蛋白质与表面结合,则可以从混合物中除去第一反应中未反应的解旋酶。随后,连接器可以进行断裂以暴露出与所述部分反应的基团。此外,通过遵循此连接反应的序列,可以首先优化解旋酶的反应条件,然后在连接器断裂后优化所述部分的反应条件。因为连接器被限制在与其连接的区域内,所以第二反应也将更多地针对与所述部分反应的正确位点。在解旋酶/交联剂复合物与所述部分共价连接之前,解旋酶可以与双功能交联剂共价连接。可选地,在双功能交联剂/部分复合物与解旋酶连接之前,所述部分可以与双功能交联剂共价连接。解旋酶和部分可以同时与化学交联剂共价连接。将解旋酶与所述部分连接的优选方法是如上所述的半胱氨酸连接和faz连接。在优选实施方案中,反应性半胱氨酸存在于肽连接器上,所述肽连接器遗传地连接到所述部分。这意味着不一定需要额外的修饰来从所述部分中去除其它可接近的半胱氨酸残基。可以通过将连接器的浓度保持在大量过剩的解旋酶和/或部分中来防止解旋酶或部分自身发生交联。可选地,可以使用“钥匙和锁”结构,其中使用了两个连接器。每个连接器的仅一端可以一起反应以形成更长的连接器,而连接器的另一端各自与构建体的不同部分(即,解旋酶或部分)反应。这将在以下进行更详细的讨论。对连接位点进行挑选使得当构建体与多核苷酸接触时,解旋酶和部分均可以与多核苷酸结合并控制其移动。可以使用解旋酶和部分的多核苷酸结合活性来促进连接。例如,可以使用互补多核苷酸来使解旋酶和部分在它们杂交时结合在一起。解旋酶可以与一个多核苷酸结合,部分可以与互补多核苷酸结合。然后可以使两个多核苷酸彼此杂交。这将使解旋酶与部分紧密接触,使得连接反应更有效率。这特别有助于在正确取向上连接两个或更多个解旋酶以便控制目标多核苷酸的移动。以下示出了可能使用的互补多核苷酸的示例。对于解旋酶-phi29构建体,可以采用以下dna。可以将标签添加到构建体中,使得构建体的纯化变得更加容易。然后,如果需要去除这些标签,则可以对这些标签进行化学或酶断裂。也可以包括荧光团或发色团,这些也可以是可断裂的。构建体的简单纯化方法是在每个蛋白质(即,解旋酶和部分)上包括不同的纯化标签,例如,六-组氨酸标签和strep-如果两种蛋白质彼此不同,则这个方法特别有用。采用两种标签使得仅具有两种标签的物种能够很容易被纯化。如果两种蛋白质不具有两种不同的标签,则可以使用其它方法。例如,可以除去具有游离表面半胱氨酸的蛋白质或连接有连接器的蛋白质,这些蛋白质未反应形成构建体,例如,对马来酰亚胺连接器使用碘乙酰胺树脂。基于不同的dna持续合成性(processivity)性质,本发明的构建体也可以从未反应的蛋白质中进行纯化。具体地,当本发明的构建体控制多核苷酸穿过纳米孔的移位时,基于对多核苷酸的亲和性增加、一旦结合从多核苷酸脱离的可能性降低和/或多核苷酸的读取长度增加,所述构建体从未反应的蛋白质中进行纯化。还可以设计与特异性多核苷酸序列结合的目标构建体。如下进行更详细的讨论,多核苷酸结合部分可以与特异性多核苷酸序列结合,从而将构建体的解旋酶部分靶向特异性序列。多核苷酸结合部分(polynucleotidebindingmoiety)本发明的构建体包含多核苷酸结合部分。多核苷酸结合部分是能够与多核苷酸结合的多肽。所述部分优选能够与限定的多核苷酸序列进行特异性结合。换言之,所述部分优选与特异性多核苷酸序列结合,但是显示比与不同序列的结合强度小至少10倍,或更优选地显示比与不同序列的结合强度小至少100倍,或最优选地显示比与不同序列的结合强度小至少1000倍。所述不同序列可以是随机序列。在一些实施方案中,所述部分与特异性多核苷酸序列结合,但不能测量与不同序列的结合。可以使用与特异性序列结合的部分来设计被定向到这种序列的构建体。所述部分通常与多核苷酸相互作用,并修饰其至少一个性质。所述部分可以通过对多核苷酸进行断裂以形成单个核苷酸或核苷酸的较短链,例如二核苷酸或三核苷酸,来对其进行修饰。所述部分可以通过将多核苷酸取向或将其移动到特定位点,即控制其移动,来对其进行修饰。多核苷酸(例如,核酸)是包含两个或更多个核苷酸的大分子。多核苷酸或核酸可以包含任何核苷酸的任何组合。核苷酸可以是天然存在的或人造的。可以对目标多核苷酸中的一个或多个核苷酸进行氧化或甲基化。目标多核苷酸中的一个或多个核苷酸可以被损坏。例如,多核苷酸可以包含嘧啶二聚体。此类二聚体通常与紫外线导致的损坏相关,且是皮肤黑素瘤的首要原因。可以对目标多核苷酸中的一个或多个核苷酸进行修饰,例如,用标记物或标签。合适的标记物如上所述。目标多核苷酸可以包含一个或多个间隔物。核苷酸通常包含核碱基、糖和至少一个磷酸基团。核碱基通常是杂环的。核碱基包括但不限于嘌呤和嘧啶,更具体地为腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶和胞嘧啶。糖通常是戊糖。核苷酸糖包括但不限于核糖和脱氧核糖。核苷酸通常是核糖核苷酸或脱氧核糖核苷酸。核苷酸通常包含单磷酸、二磷酸或三磷酸。磷酸可以连接在核苷酸的5’或3’侧上。核苷酸包括但不限于单磷酸腺苷(amp)、单磷酸鸟苷(gmp)、单磷酸胸苷(tmp)、单磷酸尿苷(ump)、单磷酸胞苷(cmp)、单磷酸5-甲基胞苷、二磷酸5-甲基胞苷、三磷酸5-甲基胞苷、单磷酸5-羟甲基胞苷、二磷酸5-羟甲基胞苷、三磷酸5-羟甲基胞苷、环单磷酸腺苷(camp)、环单磷酸鸟苷(cgmp)、脱氧单磷酸腺苷(damp)、脱氧单磷酸鸟苷(dgmp)、脱氧单磷酸胸苷(dtmp)、脱氧单磷酸尿苷(dump)和脱氧单磷酸胞苷(dcmp)。核苷酸优选选自amp、tmp、gmp、cmp、ump、damp、dtmp、dgmp、dcmp和dump。核苷酸可以是脱碱基的(即缺少碱基)。核苷酸也可以缺少碱基和糖(即为c3间隔物)。多核苷酸中的核苷酸可以以任何方式彼此连接。如在核酸中一样,核苷酸通常通过其糖和磷酸基团连接。如嘧啶二聚体中一样,所述核苷酸可以通过其碱基连接。多核苷酸可以是单链或双链的。多核苷酸的至少一部分优选是双链的。多核苷酸可以是核酸,例如,脱氧核糖核酸(dna)或核糖核酸(rna)。目标多核苷酸可以包含与一条dna链杂交的一条rna链。多核苷酸可以是本领域已知的任何合成核酸,例如,肽核酸(pna)、甘油核酸(gna)、核糖核酸(tna)、锁定核酸(lna)或其它具有核苷酸侧链的合成聚合物。优选所述部分的三级结构是已知的。对所述部分三维结构的了解使得能够对所述部分进行修饰以促进其在本发明构建体中的功能。所述部分可以是任何尺寸并具有任何结构。例如,所述部分可以是寡聚物,例如,二聚体或三聚体。所述部分优选是由一种单体形成的小的球形多肽。这种部分易于处理,并且不太可能干扰解旋酶控制多核苷酸移动的能力,特别是如果融合到或插入到解旋酶序列中的话。所述部分的氨基和羧基末端优选非常接近。所述部分的氨基和羧基末端更优选存在于所述部分的同一面上。这种实例便于将所述部分插入解旋酶的序列中。例如,如果所述部分的氨基和羧基末端非常接近,则每个末端可以通过基因融合与解旋酶序列中的相邻氨基酸连接。还优选已知所述部分的活性位点的位置和功能。这防止对消除了所述部分的活性的活性位点进行修饰。还使得所述部分能够与解旋酶连接,使得所述部分与多核苷酸结合并控制其移动。对部分可以结合多核苷酸并定向多核苷酸的方式的了解也使得有效的构建体能够被设计。本发明的构建体在链测序时是有用的。所述部分优选在缓冲液背景中与多核苷酸结合,所述缓冲液背景与链测序和核苷酸的鉴别相容。所述部分优选在远高于正常生理水平的盐浓度,例如100mm至2m的盐浓度中至少具有残留活性。更优选地,对所述部分进行修饰以增加其在高盐浓度下的活性。也可以对所述部分进行修饰以改善其持续合成性、稳定性和保质期。可以通过表征来自诸如嗜盐、中度嗜盐细菌、嗜热和中度嗜热生物等嗜极生物的多核苷酸结合部分来确定合适的修饰,并通过定向进化方法来改变嗜温或嗜热核酸外切酶的耐盐性、稳定性和温度依赖性。多核苷酸结合部分优选包含一个或多个域,其独立地选自螺旋-发夹-螺旋(hhh)域、真核单链结合蛋白(ssb)、细菌ssb、古细菌ssb、病毒ssb、双链结合蛋白、滑移夹具、持续合成性因子、dna结合环、复制起始蛋白、端粒结合蛋白、阻遏物、锌指(zincfingers)和增殖细胞核抗原(pcna)。螺旋-发夹-螺旋(hhh)域是多肽基序,其以序列非特异性方式结合dna。其在与聚合酶融合时呈现盐稳定性和持续合成性,并增加其热稳定性。合适的域包括来自如甲烷嗜热菌(methanopyruskandleri)(seqidno:47)的拓扑异构酶v中的域h(残基696-751)和域hi(残基696-802)。如下所述,多核苷酸结合部分可以是如seqidno:48中所示的seqidno:47的域h-l。来自如甲烷嗜热菌的拓扑异构酶v是如下讨论的双链结合蛋白的示例。hhh域优选包含seqidno:24或37或38中所示的序列或其变体。当该域用于本发明的构建体中时,该域增加了解旋酶的持续合成性和耐盐性。seqidno:24或37或38的变体是具有由seqidno:24或37或38的氨基酸序列变化而来并且具有多核苷酸结合活性的氨基酸序列的蛋白质。可以对此进行如上所述的测量。基于氨基酸的同一性,变体通常与整个序列的seqidno:24或37或38具有至少50%的同源性(或上述与解旋酶相关的%同源性中的任一个),并且具有多核苷酸结合活性。变体可以以上述与解旋酶相关的或下述与孔相关的任何方式不同于seqidno:24或37或38。如上所述,变体优选包含一个或多个取代的半胱氨酸残基和/或一个或多个取代的faz残基以便于与解旋酶连接。ssb以序列非特异性方式用高亲和力结合单链dna。ssb以各种形式存在于生命的所有域中,并结合dna作为单体或多聚体。采用氨基酸序列比对和对数(如隐马尔可夫模型),可以根据序列同源性对ssb进行分类。pfam家族(pf00436)包括所有与已知ssb序列相似的蛋白质。然后,可以根据蛋白质的结构分类(structuralclassificationofproteins,scop)对这群ssb进行进一步分类。ssb属于以下系属:分类(class);所有β蛋白,折叠;ob-折叠,总科:核酸结合蛋白,家族;单链dna结合域,ssb。在这个家族中,可以根据亚科对ssb进行分类,其中,在每个亚科中通常表征多个类型物种。ssb可以来自真核生物,比如来自人类、小鼠、大鼠、真菌、原生动物或植物;来自原核生物,比如细菌和古细菌;或来自病毒。真核ssb作为复制蛋白a(rpa)已知。在大多数情况下,真核ssb是由不同尺寸单位形成的异源三聚体。一些较大单位(例如,酿酒酵母的rpa70)是稳定的并且以单体形式结合ssdna。细菌性ssb结合dna作为稳定的同源四聚体(例如,大肠杆菌、耻垢分枝杆菌和幽门螺杆菌)或同聚二聚体(例如,耐辐射球菌和海栖热袍菌)。来自古细菌基因组的ssb被认为与真核rpa有关。它们中只有几个,例如由泉古菌硫磺矿硫化叶菌(crenarchaeotesulfolobussolfataricus)编码的ssb,是同聚四聚体。大多数其它物种中的ssb与真核生物中的复制蛋白更接近,被称为rpa。在这些物种的一部分中,其被证明是单体的(詹氏甲烷球菌和嗜热自养甲烷杆菌)。但是,其它古细菌物种,包括火焰色古球状菌(archaeoglobusfulgidus)和methanococcoidesidesburtonii,似乎各自包含两个开放阅读框,其序列与rpa序列相似。在蛋白质水平没有证据,并且没有关于dna结合能力或寡聚状态的公开数据。然而,这些基因的每一个中存在的两种寡核苷酸/寡糖(ob)折叠(其中一个m.burtoniiorf存在下的三种ob折叠)表明它们也结合单链dna。病毒性ssb结合dna作为单体。这一点以及病毒性ssb相对较小的尺寸使得其适合于与其它蛋白质进行遗传融合,例如,通过柔性肽连接器。可选地,ssb可以分开进行表达并通过化学方法(例如,半胱氨酸、非天然氨基酸)与其它蛋白质连接。这将在以下进行更详细的讨论。ssb优选为(i)包含羧基末端(c-末端)区域的ssb,所述区域不具有净负电荷;或(ii)在其c-末端区域包含一个或多个修饰的修饰ssb,其减少c末端区域的净负电荷。这种ssb不阻塞跨膜孔,因此能够表征目标多核苷酸。ssb,包含不具有净负电荷的c-末端区域,的示例包括但不限于人线粒体ssb(hsmtssb;seqidno:39,人复制蛋白a70kda亚基,人复制蛋白a14kda亚基,来自尖毛虫的端粒末端结合蛋白α亚基,来自尖毛虫的端粒末端结合蛋白β亚基的核心域,来自粟酒裂殖酵母的端粒保护蛋白1(pot1),人potl,来自小鼠或大鼠的brca2的ob-折叠域,来自phi29(seqidno:40)的p5蛋白或这些蛋白中任何一个的变体。变体是具有由野生型蛋白质的氨基酸序列变化而来并且具有单链多核苷酸结合活性的氨基酸序列的蛋白质。可以采用本领域已知(和如上所述)的方法来测定多核苷酸结合活性。例如,变体结合单链多核苷酸的能力可以如实施例中所述进行确定。基于seqidno:39或40在整个序列上的氨基酸同一性,seqidno:39或40的变体通常与seqidno:39或40具有至少50%的同源性(或上述与解旋酶相关的%同源性中的任一个),并且具有单链多核苷酸结合活性。变体可以以与解旋酶相关的上述任一方式不同于seqidno:39或40。具体地,变体可以具有如表7和表8中所示的一个或多个保守取代。ssb,需要在其c-末端区域进行一个或多个修饰以减少净负电荷,的示例包括但不限于大肠杆菌的ssb(ecossb;seqidno:41,结核分枝杆菌的ssb,耐辐射球菌的ssb,嗜热栖热菌的ssb,来自硫磺矿硫化叶菌的ssb,人复制蛋白a32kda亚基(rpa32)片段,来自酿酒酵母的cdc13ssb,来自大肠杆菌的primosomal复制蛋白n(prib),来自拟南芥的prib,假定蛋白at4g28440,来自t4的ssb(gp32;seqidno:42),来自rb69的ssb(gp32;seqidno:25),来自t7的ssb(gp2.5;seqidno:26)或这些蛋白质中任一个的变体。因此,本发明方法中使用的ssb可以衍生自这些蛋白质中的任一个。除了c-末端区域中的一个或多个修饰之外,本方法中使用的ssb还可以包括额外的修饰,其在c-末端区域的外部或者不减少c-末端区域净负电荷。换言之,本发明方法中使用的ssb衍生自野生型蛋白质的变体。变体是具有由野生型蛋白质的氨基酸序列变化而来并且具有单链多核苷酸结合活性的氨基酸序列的蛋白质。如上所述,可以确定多核苷酸结合活性。本发明中使用的ssb可以衍生自seqidno:25,26,41或42的变体。换言之,可以将seqidno:25,26,41或42的变体用作本发明中使用的ssb的起点,但是实际使用的ssb还包括在其c-末端区域中的一个或多个修饰,这减少了c-末端区域的净负电荷。基于seqidno:25,26,41或42在整个序列上的氨基酸同一性,seqidno:25,26,41或42的变体通常与seqidno:25,26,41或42具有至少50%的同源性(或上述与解旋酶相关的%同源性中的任一个),并具有单链多核苷酸结合活性。变体可以以上述与解旋酶相关的任一方式不同于seqidno:25,26,41或42。具体地,变体可以具有如表7和表8中所示的一个或多个保守取代。根据正常的蛋白n到c命名法,可以直接鉴定ssb的c-末端区域。ssb的c-末端区优选为大约ssb的c-末端端部的最后三分之一,例如,ssb的c-末端端部的最后三分之一。ssb的c-末端区域更优选为ssb的c-末端端部的大约最后四分之一、五分之一或八分之一,例如,ssb的c-末端端部的最后四分之一、五分之一或八分之一。可以根据ssb蛋白质一级结构的氨基酸的数量或根据ssb蛋白质一级结构的实际长度来测量ssb的最后三分之一、四分之一、五分之一或八分之一。在n至c方向上的各种氨基酸的长度是本领域已知的。c-末端区域优选地是从ssb的c末端端部的大约最后10个到大约最后60个氨基酸。c-末端区域更优选地是ssb的c-末端端部的大约最后15个、大约最后20个、大约最后25个、大约最后30个、大约最后35个、大约最后40个、大约最后45个、大约最后50个或大约最后55个氨基酸。c-末端区域通常包含甘氨酸和/或脯氨酸富集区域。该脯氨酸/甘氨酸富集区域给c-末端区域提供了灵活性并且可用于鉴定c-末端区域。申请号为pct/gb2013/051924(公开为wo2014/013259)的国际申请中公开了用于减少净负电荷的适当修饰。ssb可以是该国际申请中公开的任一ssb。修饰的ssb最优选包含选自seqidno:33,34,43至46中所示序列的序列。双链结合蛋白用高亲和力结合双链dna。合适的双链结合蛋白包括但不限于突变体s(muts;ncbi参考序列:np_417213.1;seqidno:49)、sso7d(硫磺矿硫化叶菌p2;ncbi参考序列:np_343889.1;seqidno:50;《核酸研究》(nucleicacidsresearch),2004,第32卷第3号,1197-1207)、sso10bl(ncbi参考序列:np_342446.1;seqidno:51)、ssol0b2(ncbi参考序列:np_342448.1;seqidno:52)、色氨酸阻遏物(trp阻遏物;ncbi参考序列:np_291006.1;seqidno:53)、λ抑制子(ncbi参考序列:np_040628.1;seqidno:54)、cren7(ncbi参考序列:np_342459.1;seqidno:55)、主要组蛋白类别h1/h5,h2a,h2b,h3和h4(ncbi参考序列:np_066403.2,seqidno:56)、dsba(ncbi参考序列:np_049858.1;seqidno:57)、rad51(ncbi参考序列:np_002866.2;seqidno:58)、滑移夹具和拓扑异构酶vmka(seqidno:47)或这些蛋白中任一个的变体。基于seqidno:47,49,50,51,52,53,54,55,56,57或58在整个序列上的氨基酸同一性,seqidno:47,49,50,51,52,53,54,55,56,57或58的变体通常与seqidno:47,49,50,51,52,53,54,55,56,57或58具有至少50%的同源性(或上述与解旋酶相关的%同源性中的任一个),并且具有单链多核苷酸结合活性。变体可以以上述与解旋酶相关的任一方式不同于seqidno:47,49,50,51,52,53,54,55,56,57或58。具体地,变体可以具有表7和表8中所示的一个或多个保守取代。大多数聚合酶通过与滑移夹具相互作用来实现持续合成性。通常,这些滑移夹具是包围dsdna的多聚体蛋白(同源二聚体或同源三聚体)。这些滑移夹具需要辅助蛋白(夹具装载器)来使其在atp依赖过程中集合在dna螺旋周围。它们也不作为拓扑系链直接与dna接触。由于滑移夹具通过聚合酶域以特定方式与其同源聚合酶相互作用,所以该片段可以与解旋酶融合,以便刺激解旋酶补充到滑移夹具上。这种相互作用可以通过共价键的生成(引入半胱氨酸或非天然氨基酸)进一步稳定。与dna滑移夹具相关,持续合成性因子是病毒性蛋白,该病毒性蛋白将其同源聚合酶锚定到dna,从而导致所生成片段的长度显著增加。该病毒性蛋白可以是单体的(正如来自单纯疱疹病毒1的ul42一样)或多聚体的(来自巨细胞病毒的ul44是二聚体),其在dna链周围不形成闭合环,并且其直接与dna接触。ul42在不降低其相应聚合酶的速率的情况下,增加了持续合成性,这表明其以不同于ssb的模式与dna相互作用。ul42优选包含seqidno:27或seqidno:32其变体中所示的序列。seqidno:27或32的变体是具有由seqidno:27或32的氨基酸序列变化而来并且具有多核苷酸结合活性的氨基酸序列的蛋白质。可以对此进行如上所述的测量。基于seqidno:27或32在整个序列上的氨基酸同一性,变体通常与seqidno:27或32具有至少50%的同源性(或上述与解旋酶相关的%同源性中的任一个),并且具有多核苷酸结合活性。变体可以以上述与解旋酶相关或下述与孔相关的任一方式不同于seqidno:27或seqidno:32。如上所述,变体优选包含一个或多个取代的半胱氨酸残基和/或一个或多个取代的faz残基,以便于与解旋酶连接。可以通过遗传融合或化学连接(半胱氨酸、非天然氨基酸)完成ul42与解旋酶的连接。由于结合ul42的聚合酶多肽在晶体结构中是可见的,所以这35个氨基酸(残基1200-1235)可以与解旋酶的c-末端融合,该多肽和持续合成性因子之间的天然亲和力用于形成复合物。可以通过引入共价相互作用(半胱氨酸或非天然氨基酸)使相互作用稳定。一个选择是利用天然ul42半胱氨酸(c300),其位于多肽相互作用位点附近,并将位点突变引入到聚合酶多肽(例如,l1234c)中。增加聚合酶持续合成性的已知方法是通过利用噬菌体t7dna聚合酶(残基258-333)的大肠杆菌硫氧还蛋白(trx)和硫氧还蛋白结合域(tbd)之间的相互作用。trx与tbd结合导致多肽的构象变成结合dna的构象。tbd被认为对dna链进行钳制(clampdown)并限制聚合酶的脱离率,从而增加了持续合成性。通过将tbd转移到非持续合成性聚合酶上来制备嵌合聚合酶,从而导致聚合片段的长度增加1000倍。并没有尝试将tbd与任何其它类别的蛋白质连接,但却设计了tbd和trx之间的共价连接,并且可以用于稳定相互作用。一些解旋酶在体内使用辅助蛋白来实现持续合成性(例如,对于大肠杆菌rep解旋酶的来自噬菌体φx174的cisa和来自噬菌体m13的基因ii蛋白)。这些蛋白质中的一些已显示与多于一种解旋酶相互作用(例如,mutl作用于uvrd和rep,但程度不尽相同)。这些蛋白质具有固有的dna结合能力,其中一些鉴定特异性dna序列。这些辅助蛋白中的一些本身与特异性dna序列共价连接的能力也可用于为解旋酶活性创建设定起始点。对染色体末端进行保护的蛋白质以高度特异性方式与端粒ssdna序列结合。这种能力可以按原样利用,也可以通过使用位点突变进行利用以便消除序列特异性。小dna(smalldna)结合基序(如螺旋-转角-螺旋)鉴定特异性dna序列。至于噬菌体434阻遏物,设计62残基片段并显示出保留dna结合能力和特异性。真核蛋白中的基序丰富,锌指由大约30个与dna以特定方式结合的氨基酸组成。通常,每个锌指只鉴定三个dna碱基,但可以对多个锌指进行连接以获得较长序列的鉴定。增殖细胞核抗原(pcna)形成非常紧的夹具(环状物),其沿dsdna或ssdna上下滑移。来自泉古菌的pcna在其为异源三聚体时是独特的,因此可以使一个亚基功能化(functionalise)并保留活性。它的亚基在seqidno:28,29和30中示出。pcna优选为包含seqidno:28,29和30中所示序列或其变体的三聚体。pcna滑移夹具(ncbi参考序列:zp_06863050.1;seqidno:59)形成二聚体。pcna优选为包含seqidno:59或其变体的二聚体。变体是具有由seqidno:28,29,30或59的氨基酸序列变化而来并具有多核苷酸结合活性的氨基酸序列的蛋白质。可以对此进行如上所述测量。变体通常是三聚体或二聚体并且具有多核苷酸结合活性,其中,所述三聚体基于seqidno:28,29和30在整个序列上的氨基酸同一性,包含与seqidno:28,29和30具有至少50%同源性的序列(或上述与解旋酶相关的%同源性中的任一个);所述二聚体基于seqidno:59在整个序列上的氨基酸同一性,包含与seqidno:59具有至少50%同源性的序列(或上述与解旋酶相关的%同源性中的任一个)。变体可以以上述与解旋酶相关或下述与孔相关的任一方式包含不同于seqidno:28,29,30或59的序列。如上所述,变体优选包含一个或多个取代的半胱氨酸残基和/或一个或多个取代的faz残基以便于与解旋酶连接。在优选实施方案中,对来自泉古菌的pcna的亚基1和2(即,seqidno:28和29或其变体)进行连接,例如,遗传融合,并将所得蛋白质与解旋酶连接以形成本发明的构建体。在使用构建体期间,一旦构建体结合了多核苷酸,可以加入亚基3(即,seqidno:30或其变体)以使pcna夹具(或环状物)变完整。在优选实施方案中,将pcna滑移夹具的一个单体(即,seqidno:59或其变体)与解旋酶连接,例如,遗传融合,以形成本发明的构建体。在使用构建体期间,一旦构建体结合了多核苷酸,可以加入第二个单体(即,seqidno:59或其变体)以使pcna夹具(或环状物)变完整。多核苷酸结合基序可以选自以下表5所示基序中的任一种。表5合适的多核苷酸结合基序多核苷酸结合部分优选衍生自多核苷酸结合酶。多核苷酸结合酶是一种多肽,其能够与多核苷酸结合并相互作用和修饰多核苷酸的至少一个性质。所述酶可以通过对多核苷酸进行断裂以形成单个核苷酸或核苷酸的较短链,例如二核苷酸或三核苷酸,来对其进行修饰。所述酶可以通过将多核苷酸取向或移动到特定位点来对其进行修饰。只要多核苷酸结合部分能够结合多核苷酸并控制其移动,其就不需要显示酶活性。例如,所述部分可以衍生自已经进行修饰以便消除其酶活性的酶,或者可以在防止其作为酶的情况下进行使用。多核苷酸结合部分优选衍生自溶核酶。所述酶更优选衍生自酶分类(ec)组3.1.11,3.1.13,3.1.14,3.1.15,3.1.16,3.1.21,3.1.22,3.1.25,3.1.26,3.1.27,3.1.30和3.1.31中的任一个。所述酶可以是申请号为pct/gb10/000133(公开为wo2010/086603)的国际申请中公开的任一个。优选的酶是核酸外切酶、聚合酶、解旋酶和拓扑异构酶,例如,旋转酶。合适的核酸外切酶包括但不限于来自大肠杆菌的核酸外切酶i、来自大肠杆菌的核酸外切酶iii、t嗜热链球菌(t.thermophilus)中的recj和噬菌体λ核酸外切酶、tatd核酸外切酶及其变体。聚合酶优选为部分分类(moietyclassification)(mc)组2.7.7.6,2.7.7.7,2.7.7.19,2.7.7.48和2.7.7.49中的任一个。聚合酶优选是dna依赖性dna聚合酶、rna依赖性dna聚合酶、dna依赖性rna聚合酶或rna依赖性rna聚合酶。聚合酶可以是3173dna聚合酶(其可以从公司商业购得)、sd聚合酶(可以从商业购得)或其变体。多核苷酸结合部分优选衍生自phi29dna聚合酶(seqidno:31)。所述部分可以包含seqidno:101中所示的序列或其变体。seqidno:31的变体是具有由seqidno:31的氨基酸序列变化而来并具有多核苷酸结合活性的氨基酸序列的酶。可以对此进行如上所述测量。所述变体可以包括促进多核苷酸结合和/或促进其在高盐浓度和/或室温下活性的修饰。基于氨基酸同一性,对于seqidno:31的氨基酸序列的整个长度,变体优选与该序列至少50%同源。更优选地,基于氨基酸同一性,对于seqidno:31的氨基酸序列的整个序列,变体多肽与该序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,更优选地,至少95%、97%或99%同源。在200或更多,例如230、250、270或280或更多的连续氨基酸长度上时,可以具有至少80%,例如至少85%、90%或95%的氨基酸同一性(“严格同源性”)。同源性如上所述进行确定。变体可以按下述针对seqidno:2和4所描述的多种方式中的任意一种不同于野生型序列。解旋酶可以是上述任一种,包括seqidno:8至23中的任一个。以下对解旋酶二聚体和多聚体进行详细讨论。多核苷酸结合部分可以是衍生自解旋酶的多核苷酸结合域。例如,多核苷酸结合部分优选包含seqidno:35或36中所示的序列或其变体。seqidno:35或36的变体是具有由seqidno:35或36的氨基酸序列变化而来并且具有多核苷酸结合活性的氨基酸序列的蛋白质。可以对此进行如上所述测量。所述变体可以包括促进多核苷酸结合和/或促进其在高盐浓度和/或室温下活性的修饰。基于氨基酸同一性,对于seqidno:35或36的氨基酸序列的整个长度,变体优选与该序列至少50%同源。更优选地,基于氨基酸同一性,对于seqidno:35或36的氨基酸序列的整个序列,变体多肽与该序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,更优选地,至少95%、97%或99%同源。在40或更多,例如50、60、70或80或更多的连续氨基酸长度上时,可以具有至少80%,例如,至少85%、90%或95%的氨基酸同一性(“严格同源性”)。同源性如上所述进行确定。变体可以按下述与seqidno:2和4所描述的多种方式中的任意一种不同于野生型序列。拓扑异构酶优选为部分分类(mc)组5.99.1.2和5.99.1.3中的任一个。多核苷酸结合部分可以是上述酶中的任一种。所述部分可以用显示标记物进行标记。所述标记物可以是上述任一种。所述部分可以与任何产生部分的生物体(moiety-producingorganism),诸如大肠杆菌、t嗜热链球菌或噬菌体分离开来,或通过合成或重组方式进行制备。例如,所述部分可以通过如下所述的体外转译和转录来合成。所述部分可以在如下所述纯化后大规模生产。解旋酶寡聚物通过以上讨论很明显,多核苷酸结合部分优选衍生自解旋酶。例如,其可以是来自解旋酶的多核苷酸域。所述部分更优选包含一个或多个解旋酶。解旋酶可以是上述与本发明的构建物相关的任一种,包括本发明的解旋酶和根据本发明未进行修饰的解旋酶。在这些实施方案中,本发明的构建体当然包括两个或更多个连接在一起的解旋酶。根据本发明,对解旋酶中的至少一个进行修饰。构建体可以包含两个、三个、四个、五个或更多个解旋酶。换言之,本发明的构建体可以包含解旋酶二聚体、解旋酶三聚体、解旋酶四聚体、解旋酶五聚体等。两个或更多个解旋酶可以以任何方向连接在一起。可以通过每个解旋酶中相同的氨基酸位点或空间上邻近的氨基酸位点连接相同或相似的解旋酶。这被称为“头对头”形式。可选地,可以通过每个解旋酶的相对或不同侧上的位点连接相同或相似的解旋酶。这被称为“头对尾”形式。由三个相同或相似的解旋酶组成的解旋酶三聚体可以包括头对头和头对尾形式。两个或更多个解旋酶可以彼此不同(即,构建体是异源二聚体、三聚体、四聚体或五聚体等)。例如,本发明的构建体可以包括(a)本发明的一个或多个解旋酶和一个或多个根据本发明未进行修饰的解旋酶或(b)本发明的两个或更多个不同的解旋酶。构建体可以包含相同的dda解旋酶的两种不同变体。例如,构建体可以包含上述解旋酶中任一个的两种变体,其中,在每个变体的不同位点上引入一个或多个半胱氨酸残基或faz残基。在这种情况下,解旋酶可以是头对尾的形式。异源二聚体可以以两种可能的方式形成。第一种涉及使用如上所述的同源双功能连接器。可以用大量过量的连接器以这样一种方式,即一个连接器与蛋白质的一个分子连接,对解旋酶变体中的一个进行修饰。然后可以将这种经连接器修饰的变体从未修饰的蛋白质、可能的同源二聚体和未反应的连接器中纯化出来以便与另一个解旋酶变体反应。然后可以将所得到的二聚体从其它物质中纯化出来。第二种涉及使用异源双功能连接器。例如,可以用第一peg连接器对解旋酶变体中的一个进行修饰,其中所述第一peg连接器在其一端包含马来酰亚胺或碘乙酰胺官能团和另一端包含环辛炔官能团(dibo)。如下示出了这种情况的示例:可以用第二peg连接器对第二个解旋酶变体进行修饰,所述第二peg连接器在其一端包含马来酰亚胺或碘乙酰胺官能团和另一端包含叠氮官能团。如下示出了这种情况的示例:然后可以对具有两个不同连接器的两个解旋酶变体进行纯化并点击在一起(使用无铜点击化学copperfreeclickchemistry)以制备二聚体。无铜点击化学由于其期望性质而被用于这些应用中。例如,它对蛋白质是快速、干净且无毒的。然而,其它合适的生物正交化学包括但不限于施陶丁格化学、肼或酰肼/醛或酮试剂(hynic+4fb化学,包括所有的solulinktm试剂)、diels-alder试剂对和硼酸/水杨酸异羟肟酸(salicyhydroxamate)试剂。这两种连接同一解旋酶的两个不同变体的方式对于上述任一构建体也是有效的,其中,解旋酶和部分彼此不同,例如,两个不同解旋酶的二聚体和解旋酶-聚合酶二聚体。类似的方法也可用于连接不同的faz变体。可以用大量过量的连接器以这样一种方式,即一个连接器与蛋白质的一个分子连接,对一个faz变体进行修饰。然后可以将这种经连接器修饰的faz变体从未修饰的蛋白质、可能的同源二聚体和未反应的连接器中纯化出来以便与第二个faz变体反应。然后可以将所得到的二聚体从其它物质中纯化出来。也可以通过连接同一解旋酶或不同解旋酶的半胱氨酸变体和faz变体来制备异源二聚体。可以将一端包含马来酰亚胺或碘乙酰胺官能团和另一端包含dbco官能团的异源双功能peg连接器用于突变体的这种组合中。如下示出了这种连接器的示例(dbco-peg4-马来酰亚胺):通过改变两个官能团之间的peg单元的数量可以改变连接器的长度。解旋酶异源三聚体可以包括三种不同类型的解旋酶。对于包含多于三种解旋酶的寡聚物也是如此。构建体内的两个或更多个解旋酶可以是同一种解旋酶的不同变体,例如,seqidno:8至23中任一个的不同变体。可以在不同位点上对不同变体进行修饰,以便于通过所述不同位点进行连接。因此,异源三聚体可以是头对尾和头对头形式。本发明构建体中的两个或更多个解旋酶可以彼此相同(即,构建体是同源二聚体、三聚体、四聚体或五聚体等)。在这些实施方案中,优选使用每个解旋酶中的相同位点对解旋酶进行连接。因此,解旋酶是头对头连接。可以使用在相同位点上被取代到解旋酶中的半胱氨酸残基或faz残基对解旋酶进行连接。可以采用包含诸如马来酰亚胺或碘乙酰胺等硫醇反应性基团的同源双功能连接器来连接相同解旋酶变体中的半胱氨酸残基。这些官能团可以位于聚乙二醇(peg)链的末端,如下示例:连接器的长度可以变化以适应所需应用。例如,n可以是2,3,4,8,11,12,16或更多。peg连接器由于其具有良好的性质,如水溶性,而是合适的。其它非peg连接器也可用于半胱氨酸连接。通过使用类似的方法,也可以将相同的faz变体制成同源二聚体。可以使用具有dibo官能团的同源双功能连接器来连接相同faz变体的两个分子,从而利用不含cu2+的点击化学制备同源二聚体。以下给出了连接器的示例:peg连接器的长度可以变化,包括2,4,8,12,16或更多个peg单元。也可以制备这种连接器以包含荧光标签以便于量化。也可以将这种荧光标签并入马来酰亚胺连接器。如果本发明的解旋酶中引入了两个或更多个半胱氨酸残基或非天然氨基酸并且不同解旋酶单体中的不同半胱氨酸或非天然氨基酸连接在一起,则也可以以头对尾形式制备同源二聚体或更长的同型寡聚物。例如,可以从包含y279c和g357c的seqidno:8的变体中制备同源寡聚物,一个单体中的279处的c可以与另一单体中的357处的c连接。类似地,可以从包含i281c和g357c的seqidno:8的变体中制备同源寡聚物,一个单体中的281处的c可以与另一单体中的357处的c连接。faz代替c被引入到这些位点时,也是如此。这种c和faz突变体使得能够产生一系列或一连串的解旋酶。多核苷酸序列本发明提供一种包含对本发明解旋酶或本发明构建体进行编码的序列的多核苷酸。所述多核苷酸可以由这样的序列组成。多核苷酸可以是上述任一种。可以使用本领域已知的方法来表达本文中所述蛋白质中的任一种。可以使用本领域的标准方法来分离和复制多核苷酸序列。可以从产生生物体(例如,methanococcoidesburtonii)的解旋酶和/或产生生物体(例如,大肠杆菌)的ssb中提取染色体dna。可以采用涉及特异性引物的pcr来对编码了感兴趣序列的基因进行扩增。然后可以将扩增的序列并入重组可复制载体中,比如克隆载体。所述载体可用于在相容的宿主细胞中复制多核苷酸。因此,可以通过将编码了感兴趣序列的多核苷酸引入可复制载体中,将载体引入相容的宿主细胞中,并在引起载体复制的条件下培养宿主细胞来制备多核苷酸序列。载体可以从宿主细胞中回收出来。本领域已知用于克隆多核苷酸的合适宿主细胞,以下对其进行更详细的描述。多核苷酸序列可以克隆到合适的表达载体中。在表达载体中,多核苷酸序列通常与控制序列可操作地连接,该控制序列能够通过宿主细胞提供编码序列的表达。这种表达载体可用于表达构建体。术语“可操作地连接”是指并列连接,其中,所描述的组分处于允许其以预期方式发挥作用的关系。控制序列可操作地连接编码序列是以这一方式,即编码序列的表达在与控制序列相容的条件下实现,进行连接。可以将相同或不同多核苷酸的多个副本引入载体中。然后将表达载体引入合适的宿主细胞中。因此,可以通过将编码了构建体的多核苷酸序列插入表达载体中,将载体引入相容的细菌宿主细胞中,并在引起多核苷酸表达的条件下培养宿主细胞来制备构建体。载体可以是,例如,提供有复制起点的质粒、病毒或噬菌体载体,可选地,表达所述多核苷酸序列的启动子以及,可选地,启动子的调节子。载体可以包含一个或多个选择性标记基因,例如,氨苄青霉素抗性基因。可以选择启动子和其它表达调节信号以便与宿主细胞相容,对此设计表达载体。通常使用t7、trc、lac、ara或λl启动子。宿主细胞通常以高水平表达构建体。选择用多核苷酸序列转化的宿主细胞与用于转化细胞的表达载体相容。宿主细胞通常是细菌,优选大肠杆菌。任一具有λde3溶原性细菌的细胞,例如,rosetta2(de3)plys、c41(de3)、bl21(de3)、jm109(de3)、b834(de3)、tuner、origami和origamib,均可以表达包含t7启动子的载体。系列本发明还提供一系列与多核苷酸连接(或结合)的两个或更多个解旋酶,其中,所述两个或更多个解旋酶中的至少一个是本发明的解旋酶。所述系列可以包括任何数量的解旋酶,例如,2,3,4,5,6,7,8,9,10或更多个解旋酶。任何数量的解旋酶可以是本发明的解旋酶。所有所述两个或更多个解旋酶优选是本发明的解旋酶。本发明的一个或多个解旋酶可以是上述任一种。两个或更多个解旋酶可以是相同的解旋酶或者可以是不同的解旋酶。例如,如果所述系列包含本发明的两个或更多个解旋酶,则其可以相同或可以不同。所述系列可以包含任何数量和任何组合的本发明解旋酶。一系列两个或更多个解旋酶优选包含至少两个本发明的解旋酶。所述系列可以包含两个或更多个解旋酶,每个解旋酶包含seqidno:8的变体,所述变体包含(或仅包含)(a)p89f;(b)v150i;(c)v150h;(d)p89f和f98w;(e)p89f和v150i;(f)p89f和v150h;(g)f98w和v150i;(h)f98w和v150h;(i)p89f,f98w和v150i或(j)p89f,f98w和v150h。所述系列可以包含两个或更多个解旋酶,每个解旋酶包含seqidno:8的变体,所述变体包含(i)e94c/a360c;(ii)e94c/a360c,然后(δm1)g1g2(即,缺失m1,然后加入gl和g2);(iii)e94c/a360c/c109a/c136a;(iv)e94c/a360c/c109a/c136a,然后(δm1)g1g2(即,缺失m1,然后加入g1和g2);(v)e94c/a360c/w378a;(vi)e94c/a360c/w378a,然后(δm1)g1g2(即,缺失m1,然后加入g1和g2);(vii)e94c/a360c/c109a/c136a/w378a或(viii)e94c/a360c/c109a/c136a/w378a,然后(δm1)g1g2(即,缺失m1,然后加入g1和g2)。所述系列中的本发明一种解旋酶优选包含包含了(i)至(iv)中一个的seqidno:8的变体,所述系列中的本发明另一种解旋酶优选包含含有(v)至(viii)中一个的seqidno:8的变体。除了一个或多个本发明的解旋酶之外,所述系列可以包括不是本发明一部分的一个或多个解旋酶。一个或多个解旋酶可以是或衍生自hel308解旋酶、recd解旋酶(例如,trai解旋酶或trwc解旋酶)、xpd解旋酶或dda解旋酶(例如,seqidno:8至23中的任一个)。一个或多个解旋酶可以是申请号为pct/gb2012/052579(公开为wo2013/057495);pct/gb2012/053274(公开为wo2013/098562);pct/gb2012/053273(公开为wo2013/098561);pct/gb2013/051925(公开为wo2014/013260);pct/gb2013/051924(公开为wo2014/013259)和pct/gb2013/051928(公开为wo2014/013262);以及pct/gb2014/052736(wo2015/055981)的国际申请中公开的解旋酶、修饰的解旋酶或解旋酶构建体中的任一个。具体地,优选对一个或多个解旋酶进行修饰以减小多核苷酸结合域中的开口大小,多核苷酸通过该开口在至少一个构象状态下可以从解旋酶中解链。这在wo2014/013260中进行了公开。所述系列中的两个或更多个解旋酶可以彼此分开。所述系列中的两个或更多个解旋酶可以在多核苷酸移动穿过孔时通过跨膜孔集合在一起。所述系列中的两个或更多个解旋酶可以彼此接触。两个或更多个解旋酶优选彼此不连接,除过经由多核苷酸连接在一起。两个或更多个解旋酶优选彼此不共价连接。两个或更多个解旋酶可以彼此连接或共价连接。解旋酶可以以任何顺序并使用任何方法进行连接。一系列连接的解旋酶可以称为一连串。下文将对本发明所述系列可以连接/结合的多核苷酸进行更详细的讨论。本发明的方法本发明提供一种控制目标多核苷酸移动的方法。所述方法包括使目标多核苷酸与本发明的修饰的解旋酶或本发明的构建体接触,从而控制多核苷酸移动。所述方法优选跨孔施加电势的情况下进行。如下进行更详细的讨论,施加的电势通常导致孔和解旋酶或构建体之间形成复合物。所施加的电势可以是电压电势。可选地,施加的电势可以是化学电势。这方面的示例是在两性分子层上使用盐梯度。盐梯度在holden等人2007年7月11日《美国化学会杂志》(j.am.chem.soc.)129(27):8650-5中进行了公开。本发明还提供一种表征目标多核苷酸的方法。所述方法包括(a)使目标多核苷酸与本发明的跨膜孔和修饰的解旋酶或本发明的构建体接触,使得解旋酶或构建体控制目标多核苷酸穿过孔的移动。所述方法还包括(b)随着所述多核苷酸相对于所述孔移动,获取一个或多个测量值,其中所述测量值代表所述目标多核苷酸的一个或多个特征,并由此表征所述目标多核苷酸。在本发明的所有方法中,解旋酶或构建体可以是上述任一种。在这些方法中可以使用任何数量的本发明解旋酶。例如,可以使用1,2,3,4,5,6,7,8,9,10或更多个解旋酶。如果使用了两个或更多个本发明的解旋酶,则其可以相同或不同。对于本发明所述系列,以上讨论了合适的数量和组合。这些同样适用于本发明的方法。如果使用了两个或更多个解旋酶,则其可以彼此连接。两个或更多个解旋酶可以彼此共价连接。解旋酶可以以任何顺序并使用任何方法进行连接。本发明中使用的优选解旋酶构建体在申请号为pct/gb2013/051925(公开为wo2014/013260);pct/gb2013/051924(公开为wo2014/013259)和pct/gb2013/051928(公开为wo2014/013262);以及pct/gb2014/052736(wo2015/055981)的国际申请中进行了描述。如果使用了两个或更多个解旋酶,其优选彼此不连接,除了经由多核苷酸连接之外。两个或更多个解旋酶更优选地彼此不共价连接。步骤(a)和(b)优选在如上所述跨孔施加电势的情况下进行。在一些实例中,随着多核苷酸相对于孔移动,流经所述孔的电流被用于确定目标多核苷酸的序列。这就是链测序。本发明的方法用于表征目标多核苷酸。以上对多核苷酸进行了限定。可以使用该方法表征全部或仅一部分的目标多核苷酸。目标多核苷酸可以是任何长度。例如,多核苷酸长度可以是至少10个、至少50个、至少100个、至少150个、至少200个、至少250个、至少300个、至少400个或至少500个核苷酸对。多核苷酸长度可以是1000个或更多个核苷酸对、5000个或更多个核苷酸对或100000个或更多个核苷酸对。目标多核苷酸存在于任何合适的样品中。本发明通常在已知包含或怀疑包含目标多核苷酸的样品上进行。可选地,可对样品实施本发明,以确认在样品中的存在是已知的或期望的一个或多个目标多核苷酸的同一性。样品可以是生物样品。本发明可以针对从任何生物体或微生物中获得或提取的样品在体外实施。样品可以是非生物样品。非生物样品优选为流体样品。非生物样品的示例包括手术液、水如饮用水、海水或河水,以及实验室试验用的试剂。跨膜孔是在一定程度上穿过膜的结构。它允许通过施加的电势驱动水合离子使其跨膜流动或在膜内流动。跨膜孔通常穿过整个膜,使得水合离子可以从膜的一侧流到膜的另一侧。然而,跨膜孔不是必须跨越膜。其可以在一端封闭。例如,孔可以是膜中的凹陷,水合离子可以沿着膜中的凹陷流动或者流入其中。本发明中可使用任一跨膜孔。孔可以是生物的或人造的。合适的孔包括但不限于蛋白质孔、多核苷酸孔和固态孔。根据本发明,可以使用任何膜。合适的膜是本领域公知的。膜优选为两性分子层。两性分子层是由两亲分子,诸如磷脂形成的层,其具有至少一个亲水部分和至少一个亲脂或疏水部分。两亲分子可以是合成的或天然存在的。非天然存在的两亲物和形成单层的两亲物是本领域已知的,包括:例如,嵌段共聚物(gonzalez-perezetal.,langmuir,2009,25,10447-10450)。嵌段共聚物是聚合物材料,其中,两个或更多个单体亚单元聚合在一起形成单一聚合物链。嵌段共聚物具有的性质通常由每个单体亚单元贡献。然而,嵌段共聚物可以具有从各个亚单元形成的聚合物所不具有的独特性质。可以对嵌段共聚物进行改造,使得其中一个单体亚单元是疏水性的(即亲脂性的),而其它亚单元在水介质中是亲水性的。在这种情况下,嵌段共聚物可以具有两亲性质,并且可以形成模仿生物膜的结构。嵌段共聚物可以是二嵌段(由两个单体亚单元组成),但也可以由两个以上的单体亚单元构成,以形成相当于两亲物质的更复杂的结构。共聚物可以是三嵌段、四嵌段或五嵌段共聚物。两性分子层可以是单层或双层。两性分子层通常是平面脂质双分子层或支撑双层。两性分子层通常是脂质双分子层。脂质双分子层是细胞膜的模型,并作为一系列实验研究的优秀平台。例如,脂质双分子层可通过单通道记录器用于膜蛋白的体外研究。可选地,脂质双分子层可用作生物传感器用以检测一系列物质的存在。脂质双分子层可以是任何脂质双分子层。合适的脂质双分子层包括但不限于平面脂质双分子层、支撑双层或脂质体。脂质双分子层优选为平面脂质双分子层。合适的脂质双分子层在申请号为pct/gb08/000563(公开为wo2008/102121)的国际申请、申请号为pct/gb08/004127(公开为wo2009/077734)和申请号为pct/gb2006/001057(公开为wo2006/100484)的国际申请中进行了公开。用于形成脂质双分子层的方法是本领域已知的。在实施例中公开了合适的方法。脂质双分子层通常由montal和mueller的方法形成(proc.natl.acad.sci.usa.,1972;69:3561-3566),其中的脂质单分子层在穿过孔的任一侧负载在水溶液/空气界面上,所述孔垂直于所述界面。montal和mueller的方法受到欢迎,因为其是形成适用于蛋白孔插入的优质脂质双分子层的划算且较直接的方法。形成双分子层的其它常见方法包括尖端浸渍、涂覆双层和脂质体双分子层的膜片钳(patch-clamping)。在优选实施方案中,形成脂质双分子层如国际申请no.pct/gb08/004127(公开为wo2009/077734)中所描述。在另一个优选实施方案中,膜是固态层。固态层不属于生物来源。换言之,固态层不是由生物环境获得或分离出的,所述生物环境例如生物体或细胞,或生物学上可获得结构的合成制造形式。固态层可以由有机材料和无机材料形成,包括但不限于,微电子材料,绝缘材料,例如si3n4,al2o3和sio,有机和无机聚合物如聚酰胺,塑料如特氟隆或柔性体如双组分加成固化硅橡胶,以及玻璃。固态层可由单原子层例如石墨烯,或只有几个原子厚度的层形成。合适的石墨层在国际申请no.pct/us2008/010637(公开为wo2009/035647)中公开。所述方法通常使用(i)包含孔的人造两性分子层;(ii)分离的,天然存在的包含孔的脂质双分子层,或(iii)含有孔嵌入其中的细胞。所述方法通常使用人造两性分子层,例如人造脂质双分子层实施。除了孔,该分子层可包含其他跨膜和/或膜内蛋白以及其他分子。合适的设备和条件在下面讨论。本发明的方法通常在体外实施。多核苷酸可以与膜连接(coupledto)。优选使用一个或多个锚定物将多核苷酸与膜连接。可以使用任何已知的方法将多核苷酸与膜连接。每个锚定物包含与多核苷酸连接(或结合)的基团和与膜连接(或结合)的基团。每个锚定物可以与多核苷酸和/或膜共价连接(或结合)。可以使用任何数量的锚定物,例如,2,3,4或更多个锚定物,将每个多核苷酸与膜连接。例如,可以使用两个锚定物将一个多核苷酸与膜连接,每个锚定物分别与多核苷酸和膜连接(或结合)。一个或多个锚定物可以包括一个或多个解旋酶和/或一个或多个分子制动器。如果膜是两性分子层,例如,共聚物膜或脂质双分子层,则一个或多个锚定物优选包含存在于膜中的多肽锚定物和/或存在于膜中的疏水锚定物。疏水锚定物优选为脂质、脂肪酸、固醇、碳纳米管、多肽、蛋白质或氨基酸,例如,胆固醇、棕榈酸酯或生育酚。在优选实施方案中,一个或多个锚定物不是检测器。可以对膜的组分,例如两亲分子、共聚物或脂质,进行化学修饰或官能化以形成一个或多个锚定物。膜组分的合适的化学修饰和合适的官能化方式的示例将在以下进行更详细的讨论。可以对任何比例的膜组分进行官能化,例如,至少0.01%、至少0.1%、至少1%、至少10%、至少25%、至少50%或100%。多核苷酸可以直接与膜连接。用于将多核苷酸与膜连接的一个或多个锚定物优选包含连接器。一个或多个锚定物可以包括一个或多个,例如2,3,4或更多的,连接器。可以使用一个连接器将多于一个,例如,2,3,4或更多个,多核苷酸与膜连接。优选的连接器包括但不限于聚合物,例如,多核苷酸,聚乙二醇(peg),多糖和多肽。这些连接器可以是直链、支链或环状的。例如,连接器可以是环状多核苷酸。多核苷酸可以与环状多核苷酸连接器上的互补序列杂交。一个或多个锚定物或一个或多个连接器可以包括能够被切割以断裂(brokendown)的组分,例如,限制位点或光敏基团。官能化连接器及其可以连接分子的方式在本领域中是已知的。例如,经马来酰亚胺基官能化的连接器会与蛋白质中的半胱氨酸残基反应并与半胱氨酸残基连接。在本发明的上下文中,蛋白质可以存在于膜中或可以用于与多核苷酸连接(或结合)。这将在以下进行更详细的讨论。可以使用“钥匙和锁”结构来避免多核苷酸交联。每个连接器的仅一端可以一起反应以形成更长的连接器,连接器的另一端各自分别与多核苷酸或膜反应。这种连接器在申请号为pct/gb10/000132(公开为wo2010/086602)的国际申请中进行了描述。在下述测序实施方案中优选使用连接器。如果多核苷酸直接与膜永久性连接,这意味着当其与孔相互作用时不会脱离连接,由于膜和检测器之间的距离,测序运行不能继续到多核苷酸末端,所以一些序列数据将丢失。如果使用连接器,则可以完全处理多核苷酸。连接可以是永久的或稳定的。换言之,连接可以是这样,即,当多核苷酸与孔相互作用时保持与膜连接。连接可以是瞬时的。换言之,连接可以是这样,即,当多核苷酸与孔相互作用时可以与膜分离开来。对于某些应用,例如适体检测,优选连接的瞬态性质。如果永久性或稳定性连接器直接与多核苷酸的5’或3’末端连接,并且连接器比膜和跨膜孔通道之间的距离短,则由于测序运行不能继续到多核苷酸的末端,一些序列数据将丢失。如果连接是瞬时的,则当连接端随机脱离膜时,可以完全处理多核苷酸。以下对形成永久性/稳定性或瞬时连接的化学基团进行更详细的讨论。可以使用胆固醇或脂肪酰基链,将多核苷酸与两性分子层或三嵌段共聚物膜瞬时连接。可以使用长度为6至30个碳原子的任一脂肪酰基链,例如,十六烷酸。在优选实施方案中,多核苷酸,例如核酸,与两性分子层,例如三嵌段共聚物膜或脂质双分子层,连接。使用各种不同的系链策略将核酸与合成的脂质双分子层连接。这些在以下表6中进行了总结。表6可以使用合成反应中经修饰的亚磷酰胺对合成的多核苷酸和/或连接器进行官能化,这与直接加入合适的锚定基团,如胆固醇、生育酚、棕榈酸酯、硫醇、脂质和生物素基团,容易相容。这些不同的连接化学物质提供了一系列与多核苷酸连接的选择。每个不同的修饰基团以稍微不同的方式与多核苷酸连接,并且连接并不总是永久性的,所以为多核苷酸与膜连接提供了不同的停留时间(dwelltimes)。瞬时连接的优点如上所述。如果可以向多核苷酸添加互补的反应基团或锚定基团,则也可以通过许多其它方式来实现多核苷酸与连接器或官能化膜的连接。向多核苷酸的任一末端添加反应基团已被报道。可以使用t4多核苷酸激酶和atpγs向ssdna或dsdna的5’添加硫醇基团(grant,g.p.andp.z.qin(2007)."afacilemethodforattachingnitroxidespinlabelsatthe5'terminusofnucleicacids."nucleicacidsres35(10):e77)。可以使用t4多核苷酸激酶和γ-[2-叠氮基乙基]-atp或γ-[6-叠氮基己基]-atp向ssdna或dsdna的5’-磷酸基团添加叠氮基团。使用硫醇或点击化学,可以将系链(tether)与多核苷酸共价连接,其中,所述系链包含硫醇、碘乙酰胺opss或马来酰亚胺基团(对硫醇具有反应性)或dibo(二苯并环辛炔dibenzocyclooxtyne)或炔基(对叠氮化物具有反应性)。可以采用末端转移酶使化学基团(例如,生物素、硫醇和荧光团)的选择更多样化,从而将修饰的寡核苷酸引入ssdna的3’(kumar,a.,p.tchen,etal.(1988)."nonradioactivelabelingofsyntheticoligonucleotideprobeswithterminaldeoxynucleotidyltransferase."analbiochem169(2):376-82)。链霉亲和素/生物素和/或链霉亲和素/脱硫生物素连接可用于任何其它多核苷酸。以下实施例描述了如何使用链霉亲和素/生物素和链霉亲和素/脱硫生物素将多核苷酸与膜连接。可以使用核苷酸经过适当修饰的末端转移酶(例如,胆固醇或棕榈酸酯)来将锚定物直接添加到多核苷酸中,这也是有可能的。一个或多个锚定物优选通过杂交将多核苷酸与膜连接。一个或多个锚定物中的杂交使得连接能够以上述瞬时方式进行。杂交可以存在于一个或多个锚定物的任何部分中,例如,在一个或多个锚定物与多核苷酸之间、一个或多个锚定物内或者一个或多个锚定物与膜之间。例如,连接器可以包含两个或更多个杂交在一起的多核苷酸,例如,3,4或5个多核苷酸。一个或多个锚定物可以与多核苷酸杂交。一个或多个锚定物可以直接与多核苷酸杂交,或直接与连接到多核苷酸的y适配器和/或前导序列杂交,或直接与连接到多核苷酸的桥连部分适配器,例如发夹环适配器,杂交(如下所述)。可选地,一个或多个锚定物可以与一个或多个,例如,2或3个,杂交到多核苷酸的中间多核苷酸(或“夹板(splint)”)杂交、与连接到多核苷酸的y适配器和/或前导序列杂交,或与连接到多核苷酸的桥连部分适配器杂交(如下所述)。一个或多个锚定物可以包括单链或双链多核苷酸。锚定物的一部分可以与单链或双链多核苷酸连接。采用t4rna连接酶i对ssdna的短片段的连接已被报道(troutt,a.b.,m.g.mcheyzer-williams等人(1992);“ligation-anchoredpcr:asimpleamplificationtechniquewithsingle-sidedspecificity.”procnatlacadsciusa89(20):9823-5)。可选地,单链或双链多核苷酸可以与双链多核苷酸连接,然后通过热或化学变性分离这两条链。对于双链多核苷酸,可以将一段单链多核苷酸添加到所述双链体的一端或两端,或将双链多核苷酸添加到所述双链体的一端或两端。对于将单链多核苷酸添加到双链多核苷酸,这可以同连接到单链多核苷酸其它区域一样,使用t4rna连接酶i来实现。对于将双链多核苷酸添加到双链多核苷酸,此时连接可以用分别在多核苷酸和添加的多核苷酸上的互补的3'da/dt尾部(这是常规针对许多样品制备应用进行的,以防止串多联体(concatemer)或者二聚体形成)或使用由多核苷酸的限制消化以及相容适配器的连接而产生的“粘性末端”,进行“平端终止(blunt-ended)”。然后,当双链体熔化时,如果使用单链多核苷酸进行连接,则每个单链将具有5’或3’修饰,或者如果使用双链多核苷酸进行连接,则在5’末端、3’末端或这两个末端上发生修饰。如果多核苷酸是合成链,则可以在化学合成多核苷酸期间引入一个或多个锚定物。例如,可以采用连接有反应基团的引物对多核苷酸进行合成。腺苷酸化多核苷酸是连接反应中的中间体,其中,单磷酸腺苷与多核苷酸的5’-磷酸基团连接。可以使用各种试剂盒来生成该中间体,例如,来自neb的5’dna腺苷酸化试剂盒。通过在反应中用atp取代修饰的核苷酸三磷酸,然后就可以向多核苷酸的5’添加反应基团(如硫醇、胺、生物素、叠氮化物等)。使用具有适当修饰的核苷酸的5’dna腺苷酸化试剂盒(例如,胆固醇或棕榈酸酯)也可以将锚定物直接添加到多核苷酸中。对基因组dna片段进行扩增的常见技术是使用聚合酶链反应(pcr)。此处,采用两个合成的寡核苷酸引物,就可以生成同一dna片段的多个副本,其中,对于每个副本,双链体中每个链的5’将是合成的多核苷酸。可以通过使用聚合酶向单链或双链dna的3’末端添加单个或多个核苷酸。可以使用的聚合酶的示例包括但不限于末端转移酶、克列诺酶(klenow)和大肠杆菌多poly(a)聚合酶。通过在反应中用atp取代修饰的核苷酸三磷酸,然后就可以将诸如胆固醇、硫醇、胺、叠氮化物、生物素或脂质等锚定物引入双链多核苷酸。因此,扩增的多核苷酸的每个副本将包含锚定物。理想情况下,多核苷酸与膜连接而不必使多核苷酸官能化。这可以通过将一个或多个锚定物(例如,多核苷酸结合蛋白或化学基团)与膜连接并使一个或多个锚定物与多核苷酸相互作用或通过使膜官能化来得以实现。一个或多个锚定物可以通过本文所述的任何方法与膜连接。具体地,一个或多个锚定物可以包含一个或多个连接器,例如,马来酰亚胺官能化连接器。在本实施方案中,多核苷酸通常是rna、dna、pna、tna或lna,并且可以是双链或单链。本实施方案特别适用于基因组dna多核苷酸。一个或多个锚定物可以包含与单链或双链多核苷酸、多核苷酸内的特异性核苷酸序列或多核苷酸内的修饰核苷酸的模式或存在于多核苷酸上的任何其它配体连接、结合或相互作用的任何基团。适用于锚定物的结合蛋白包括但不限于:大肠杆菌单链结合蛋白、p5单链结合蛋白、t4gp32单链结合蛋白、topovdsdna结合区域、人组蛋白、大肠杆菌hudna结合蛋白和其它古细菌、原核或真核单链或双链多核苷酸(或核酸)结合蛋白,包括以下所列那些。特异性核苷酸序列可以是转录因子、核糖体、内切核酸酶、拓扑异构酶或复制起始因子所鉴定的序列。修饰核苷酸的模式可以是甲基化或损伤模式。一个或多个锚定物可以包含与多核苷酸连接、结合、嵌入或相互作用的任何基团。所述基团可以通过静电、氢键或范德华相互作用嵌入多核苷酸或与多核苷酸相互作用。这种基团包括赖氨酸单体、聚赖氨酸(其将与ssdna或dsdna相互作用)、溴化乙锭(其将嵌入dsdna)、通用碱基或通用核苷酸(其可以与任何多核苷酸杂交)和锇复合物(其可以与甲基化碱基反应)。因此,可以使用一个或多个连接到膜的通用核苷酸将多核苷酸与膜连接。每个通用核苷酸可以采用一个或多个连接器与膜连接。通用核苷酸优选包含以下核碱基之一:次黄嘌呤、4-硝基吲哚、5-硝基吲哚、6-硝基吲哚、甲酰基吲哚、3-硝基吡咯、硝基咪唑、4-硝基吡唑、4-硝基苯并咪唑、5-硝基吲唑、4-氨基苯并咪唑或苯基(c6-芳族环)。通用核苷酸更优选包含以下核苷之一:2’-脱氧肌苷、肌苷、7-脱氮-2’-脱氧肌苷、7-脱氮肌苷、2-氮杂-脱氧肌苷、2-氮杂-肌苷、2-o’-甲基肌苷、4-硝基吲哚2’-脱氧核糖核苷、4-硝基吲哚核糖核苷、5-硝基吲哚2’-脱氧核糖核苷、5-硝基吲哚核糖核苷、6-硝基吲哚2’-脱氧核糖核苷、6-硝基吲哚核糖核苷、3-硝基吡咯2’-脱氧核糖核苷、3-硝基吡咯核糖核苷、次黄嘌呤的无环糖类似物、硝基咪唑2’-脱氧核糖核苷、硝基咪唑核糖核苷、4-硝基吡唑2’-脱氧核糖核苷、4-硝基吡唑核糖核苷、4-硝基苯并咪唑2’-脱氧核糖核苷、4-硝基苯并咪唑核糖核苷、5-硝基吲唑2’-脱氧核糖核苷、5-硝基吲唑核糖核苷、4-氨基苯并咪唑2’-脱氧核糖核苷、4-氨基苯并咪唑核糖核苷、苯基c-核糖核苷、苯基c-2’-脱氧核糖核苷、2’-脱氧神经氨酸、2’-脱氧肌氨酸、k-2’-脱氧核糖、p-2’-脱氧核糖和吡咯烷。通用核苷酸更优选包含2’-脱氧肌苷。通用核苷酸更优选为imp或dimp。通用核苷酸最优选为dpmp(2’-脱氧-p-核苷单磷酸)或dkmp(n6-甲氧基-2,6-二氨基嘌呤单磷酸)。一个或多个锚定物可以通过胡斯坦(hoogsteen)氢键(其中,两个核碱基通过氢键保持在一起)或反向胡斯坦氢键(其中,一个核碱基相对于另一个核碱基旋转180°)与多核苷酸连接(或结合)。例如,一个或多个锚定物可以包含一个或多个核苷酸、一个或多个寡核苷酸或一个或多个与多核苷酸形成胡斯坦氢键或反向胡斯坦氢键的多核苷酸。这些类型的氢键允许第三个多核苷酸链缠绕在双链螺旋周围并形成三链体。一个或多个锚定物可以通过与双链双链体形成三链体而与双链多核苷酸连接(或结合)。在本实施方案中,至少1%、至少10%、至少25%、至少50%或100%的膜组分可以进行官能化。当一个或多个锚定物包含蛋白时,它们能够无需进行进一步官能化而直接锚定到膜中,例如,如果它们已经具有与膜相容的外部疏水区域。这种蛋白的示例包括但不限于跨膜蛋白、膜内蛋白和膜蛋白。可选地,蛋白可以用与膜相容的基因融合疏水区域表达。这种疏水性蛋白质区域是本领域已知的。一个或多个锚定物优选在与膜接触之前与多核苷酸混合,但是一个或多个锚定物可以与膜接触并随后与多核苷酸接触。另一方面,可以使用上述方法对多核苷酸进行官能化,使得其可以被特异性结合基团识别。具体地,可以采用诸如生物素(用于与链霉亲和素结合)、直链淀粉(用于与麦芽糖结合蛋白或融合蛋白结合)、ni-nta(用于与多组氨酸或多组氨酸标记蛋白结合)或肽(例如,抗原)等配体对多核苷酸进行官能化。根据优选实施方案,当多核苷酸与旋入孔的前导序列连接时,可使用一个或多个锚定物来将多核苷酸与膜连接。以下对前导序列进行更详细的讨论。优选地,将多核苷酸与优先旋入孔的前导序列连接(例如,联接)。这种前导序列可以包含均聚多核苷酸或无碱区域。通常将前导序列设计成直接或经由一个或多个中间多核苷酸(或夹板)与一个或多个锚定物杂交。在这种情况下,一个或多个锚定物通常包含与前导序列中的序列或一个或多个中间多核苷酸(或夹板)中的序列互补的多核苷酸序列。在这种情况下,一个或多个夹板通常包含与前导序列中的序列互补的多核苷酸序列。化学连接中所用的分子的示例是edc(1-乙基-3-[3-二甲基氨基丙基]碳二亚胺盐酸盐)。也可以采用市售的试剂盒(thermopierce,料号:22980)向多核苷酸的5’添加反应基团。合适的方法包括但不限于使用组氨酸残基和ni-nta的瞬时亲和连接以及通过反应性半胱氨酸、赖氨酸或非天然氨基酸进行更强健稳定的共价连接。跨膜孔优选为跨膜蛋白孔。跨膜蛋白孔是允许水合离子(例如,分析物)从膜的一侧流向膜的另一侧的多肽或多肽集合。在本发明中,跨膜蛋白孔能够形成这样的孔,其允许由施加电势所驱动的水合离子从膜的一侧流向另一侧。跨膜蛋白孔优选允许诸如核苷酸等分析物从膜的一侧(例如,脂质双分子层)流向另一侧。跨膜蛋白孔允许诸如dna或rna等多核苷酸移动穿过孔。跨膜蛋白孔可以是单体或寡聚物。所述孔优选由多个重复的亚基,例如至少6个、至少7个、至少8个或至少9个亚基组成。所述孔优选由6,7,8或9个亚基组成。所述孔优选为六聚、六聚体,七聚体,八聚体或九聚体的孔。所述孔可以是同源寡聚物(homo-oligomer)或异源寡聚物(hetero-oligomer)。跨膜蛋白孔通常包含离子可以流过的桶或通道。所述孔的亚基通常围绕中心轴并且向跨膜β桶或通道或跨膜α-螺旋束或通道提供链(strands)。跨膜蛋白孔的桶或通道通常包含有助于与分析物,例如核苷酸、多核苷酸或核酸,相互作用的氨基酸。这些氨基酸优选位于桶或通道的收缩(constriction)附近。跨膜蛋白孔通常包含一个或多个带正电荷的氨基酸,例如,精氨酸、赖氨酸或组氨酸或芳族氨基酸如酪氨酸或色氨酸。这些氨基酸通常有助于孔和核苷酸、多核苷酸或核酸之间的相互作用。本发明中所使用的跨膜蛋白孔可以衍生自β-桶孔或α-螺旋束孔。β-桶孔包含由β-链形成的桶或通道。合适的β-桶孔包括但不限于β-毒素,例如α-溶血素、炭疽毒素和白细胞介素,以及细菌的外膜蛋白/孔蛋白,例如耻垢分枝杆菌孔蛋白(msp),比如:mspa、mspb、mspc或mspd、csgg、外膜孔蛋白f(ompf)、外膜孔蛋白g(ompg)、外膜磷脂酶a和奈瑟氏菌自转运脂蛋白(nalp),和其它孔如lysenin。α-螺旋束孔包括由α-螺旋形成的桶或通道。合适的α-螺旋束孔包括但不限于内膜蛋白和α外膜蛋白,例如,wza和clya毒素。跨膜孔可以衍生自lysenin。申请号为pct/gb2013/050667(公开为wo2013/153359)的国际申请中对衍生自lysenin的合适孔进行了公开。申请号为pct/ep2015/069965的国际申请中对衍生自csgg的合适孔进行了公开。跨膜孔可以衍生自msp或α-溶血素(α-hl)。跨膜蛋白孔优选衍生自msp,优选衍生自mspa。这种孔是寡聚的,并且通常包含衍生自msp的7,8,9或10个单体。孔可以是衍生自含相同单体的msp的同源寡聚孔。可选地,所述孔可以是衍生自msp的异聚寡聚孔,所述msp包含至少一个不同于其它单体的单体。优选地,孔衍生自mspa或其同源物或并系同源物(paralog)。衍生自msp的单体通常包含seqidno:2所示的序列或其变体。seqidno:2是野生型mspa单体。seqidno:2的变体是具有由seqidno:2的氨基酸序列变化而来并且其具有形成孔的能力的氨基酸序列的多肽。可以使用本领域已知的任何方法来对变体形成孔的能力进行测定。例如,可以将变体与其它合适的亚基一起插入两性分子层,并且可以对其寡聚化形成孔的能力进行确定。本领域已知用于将亚基插入诸如两性分子层等膜中的方法。例如,亚基可以以纯化形式悬浮在包含脂质双分子层的溶液中,使得其扩散到所述脂质双分子层,并通过结合到脂质双分子层而插入,并组装成功能状态。可选地,可以采用“拾取和放置”方法将亚基直接插入膜中,所述方法在m.a.holden和h.bayley《美国化学会杂志》2005,127,6502-6503以及申请号为pct/gb2006/001057(公开为wo2006/100484)的国际申请中进行了描述。对于整个长度的seqidno:2的氨基酸序列,基于氨基酸同一性,变体优选与该序列至少50%同源。更优选地,基于氨基酸同一性,变体与整个序列的seqidno:2的氨基酸序列可以至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%且更优选至少95%、97%或99%同源。在100或更多,例如125,150,175或200或更多个的连续氨基酸,可以具有至少80%,例如,至少85%、90%或95%的氨基酸同一性(严格同源性)。可使用本领域的标准方法来确定同源性。例如,uwgcg软件包提供了可用于计算同源性的bestfit程序,例如在其默认设置使用(devereuxetal(1984)nucleicacidsresearch12,p387-395)。可使用pileup、blast和psiblast算法来计算同源性或比对序列(例如,鉴定等效残基或相应序列(通常在它们的默认设置)),例如,如altschuls.f.(1993)jmolevol36:290-300;altschul,s.fetal(1990)jmolbiol215:403-10中所描述的。进行blast分析的软件可通过美国国家生物技术信息中心(http://www.ncbi.nlm.nih.gov/)公开获得。变体可以包含以下突变:d90n,d91n,d93n,d118r,d134r和e139k。变体可以是申请号为pct/gb2012/050301(wo2012/107778)的国际申请中公开的变体中的任一种。变体优选(a)不包含位点90上的天冬氨酸(d);(b)不包含位点91上的天冬氨酸(d);(c)包含位点93上的天冬氨酸(d)或谷氨酸(e);和(d)包含一个或多个修饰,其降低了在单体的帽形成区域和/或桶形成区域中的向内的氨基酸的净负电荷。(d)中优选的突变包括但不限于d118r,q126r,d134r和e139k。变体优选包含位点93上的d90n,d91n,d或e;d118r,d134r和e139k。变体可以是申请号为pct/gb2015/051290的国际申请中所公开变体中的任一种。seqidno:2是mspa单体的ms-(b1)8突变体。相比于mspa,变体可以包含mspb,c或d单体中的任何突变。mspb,c和d的成熟形式在seqidno:5至7中进行示出。具体地,变体可以包含存在于mspb中的以下取代:a138p。变体可以包含存在于mspc中的以下取代中的一个或多个:a96g,n102e和a138p。变体可以包含存在于mspd中的以下突变中的一个或多个:g1缺失,l2v,e5q,l8v,d13g,w21a,d22e,k47t,i49h,i68v,d91g,a96q,n102d,s103t,v104i,s136k和g141a。变体可以包含mspb,c和d的突变体和取代物中的一个或多个的组合。变体优选包含突变l88n。seqidno:2的变体除了ms-(b1)8的全部突变之外还具有突变l88n,并被称为ms-(b2)8。本发明中使用的孔优选为ms-(b2)8。进一步的优选变体包含突变g75s/g77s/l88n/q126r。seqidno:2的变体除了ms-(b1)8的全部突变之外还具有突变g75s/g77s/l88n/q126r,并被称为ms-(b2c)8。本发明中使用的孔优选为ms-(b2)8或ms-(b2c)8。除了上述取代之外,还可以对seqidno:2的氨基酸序列进行氨基酸取代,例如,多达1,2,3,4,5,10,20或30个取代。保守取代用具有类似化学结构、类似化学性质或类似侧链体积的其它氨基酸取代氨基酸。引入的氨基酸相比其所取代的氨基酸可能具有相似的极性、亲水性、疏水性、碱度、酸度、中性或带电性。可选地,保守取代可以引入另一种芳族或脂肪族氨基酸来取代预先存在的芳族或脂肪族氨基酸。保守的氨基酸变化是本领域公知的,并且可以根据以下表7中所定义的20个主要氨基酸的性质来进行选择。当氨基酸具有相似的极性时,也可以结合表8中氨基酸侧链的亲水性水平来对此进行确定。表7氨基酸的化学性质表8亲水性水平seqidno:2的氨基酸序列的一个或多个氨基酸残基可另外从上述多肽中缺失。多达1,2,3,4,5,10,20或30个以上残基可以缺失。变体可以包括seqidno:2的片段。这种片段保留形成孔的活性。所述片段长度可以至少为50,100,150或200个氨基酸。这种片段可用于制备孔。片段优选包含seqidno:2的孔形成域。片段必须包含seqidno:2的残基88,90,91,105,118和134中的一个。通常,片段包含seqidno:2的残基88,90,91,105,118和134中的全部。可以将一个或多个氨基酸可选地或额外地加入到上述多肽中。可以在seqidno:2的氨基酸序列的氨基末端或羧基末端或多肽变体或其片段上提供延伸。所述延伸可能相当短,例如,长度为1至10个氨基酸。可选地,所述延伸可以更长,例如,多达50或100个氨基酸。根据本发明,可以将载体蛋白与氨基酸序列融合。以下将对其它融合蛋白进行更详细的讨论。如上所述,变体是具有由seqidno:2的氨基酸序列变化而来且保留其形成孔能力的氨基酸序列的多肽。变体通常包含seqidno:2中负责孔形成的的区域。包含β-桶的msp的孔形成能力由每个亚基中的β-片体(β-sheets)提供。seqidno:2的变体通常包含seqidno:2中形成β-片体的区域。只要所得变体具有成孔能力,就可以对形成β-片体的seqidno:2的区域进行一个或多个修饰。seqidno:2的变体优选包含其α-螺旋和/或环状区域内的一个或多个修饰,例如,取代、增加或缺失。可以对衍生自msp的单体进行修饰以帮助对它们的鉴定或纯化,例如,通过添加组氨酸残基(hist标签)、天冬氨酸残基(asp标签)、链霉亲和素标签或旗标,或通过添加用以促进其从细胞中分泌的信号序列,多肽在所述细胞中不天然含有这种序列。引入基因标签的替代方法是将标签化学反应到孔上的天然或改造位点上。这种情况的示例是将凝胶转移试剂与在孔外部设计的半胱氨酸反应。已经证明这是一种分离溶血素异源寡聚物的方法(chembiol.1997jul;4(7):497-505)。可以用显示标记物(revealinglabel)对衍生自msp的单体进行标记。显示标记物可以是允许对孔进行检测的任何合适的标记物。以上对合适的标记物进行了描述。也可以使用d-氨基酸来制备衍生自msp的单体。例如,衍生自msp的单体可以包含l-氨基酸和d-氨基酸的混合物。这对制备这种蛋白质或肽而言是本领域常见的。衍生自msp的单体包含一个或多个有助于鉴定核苷酸特异性的修饰。衍生自msp的单体也可以包含其它非特异性修饰,只要这些修饰不影响孔的形成即可。本领域已知许多非特异性侧链修饰,并且可以针对衍生自csgg的单体的侧链进行。这种修饰包括:例如,通过下述进行的氨基酸还原性烷基化:通过与醛反应,然后用nabh4还原,用亚氨酰乙酸甲酯脒化或用乙酸酐酰化。可以使用本领域已知的标准方法来制备衍生自msp的单体。可以通过合成或重组方式制备衍生自msp的单体。例如,可以通过体外转译和转录(ivtt)对孔进行合成。申请号为pct/gb09/001690(公开为wo2010/004273)、pct/gb09/001679(公开为wo2010/004265)或pct/gb10/000133(公开为wo2010/086603)的国际申请中对合适的孔制备方法进行了讨论。将孔插入膜的方法如下所述。跨膜蛋白孔也优选衍生自α-溶血素(α-hl)。在一些实施方案中,对跨膜蛋白孔进行化学修饰。可以以任何方式并在任何位点上对孔进行化学修饰。优选通过将分子与一个或多个半胱氨酸(半胱氨酸连接)连接,将分子与一个或多个赖氨酸连接,将分子与一个或多个非天然氨基酸连接,对表位进行酶修饰或对末端进行修饰来对跨膜蛋白孔进行化学修饰。进行这些修饰的合适方法是本领域公知的。可以通过连接任何分子来对跨膜蛋白孔进行化学修饰。例如,可以通过连接染料或荧光团来对孔进行化学修饰。可以对孔中任何数量的单体进行化学修饰。优选对一个或多个单体,例如2,3,4,5,6,7,8,9或10个单体进行如上所述的化学修饰。可以通过对相邻残基进行修饰来增强半胱氨酸残基的反应性。例如,侧链精氨酸、组氨酸或赖氨酸残基的碱基会将半胱氨酸硫醇基团的pka改变为更具反应性的s-基团的pka。半胱氨酸残基的反应性可以被诸如dtnb等硫醇保护基团保护。这些保护基团可以在连接器连接之前与孔的一个或多个半胱氨酸残基反应。可以直接将分子(其中,孔进行化学修饰)与孔连接,或者通过连接器进行连接,正如申请号为pct/gb09/001690(公布为wo2010/004273)、pct/gb09/001679(公开为wo2010/004265)或pct/gb10/000133(公开为wo2010/086603)的国际申请中所公开的。解旋酶或构建体可以与孔共价地连接。解旋酶或构建体优选不与孔共价地连接。向孔和解旋酶或构建体施加电压通常导致形成能够对目标多核苷酸进行测序的传感器。这将在以下进行更详细的讨论。可以对本文所述的任何蛋白质(即,解旋酶、跨膜蛋白孔或构建体)进行修饰以有助于对它们的鉴定或纯化,例如,通过添加组氨酸残基(his标签)、天冬氨酸残基(asp标签)、链霉亲和素标签、旗号标签(flagtag)、sumo标签、gst标签或mbp标签,或者通过添加促进它们从细胞分泌的信号序列,其中多肽不天然含有这类序列。引入遗传标签的替代方法是将标签化学反应到解旋酶、孔或构建体上的天然或改造位点上。这种情况的示例是将凝胶转移试剂与在孔外部设计的半胱氨酸反应。已经证明这是一种分离溶血素异源寡聚物的方法(chembiol.1997jul;4(7)497-505)。可以用显示标记物标记解旋酶、孔或构建体。显示标记物可以是允许对孔进行检测的任何合适标记。合适的标记物包括但不限于荧光分子、放射性同位素,例如,125i、35s、酶、抗体、抗原、多核苷酸和诸如生物素等配体。可以通过合成或重组方式制备蛋白质。例如,可以通过体外转译和转录(ivtt)对解旋酶、孔或构建体进行合成。可以对解旋酶、孔或构建体的氨基酸序列进行修饰用以包括非天然存在的氨基酸或用以增加蛋白质的稳定性。当通过合成方式制备蛋白质时,可以在制备过程中引入这些氨基酸。也可以在合成或重组制备之后改变解旋酶、孔或构建体。也可以使用d-氨基酸来制备解旋酶、孔或构建体。例如,孔或构建体可以包含l-氨基酸和d-氨基酸的混合物。这在制备这种蛋白质或肽时是本领域常见的。解旋酶、孔或构建体也可以包含其它非特异性修饰,只要这些修饰不影响孔的形成或者解旋酶或构建体的功能即可。本领域已知许多非特异性侧链修饰,并可以对所述蛋白的侧链进行。这种修饰包括:例如通过下述进行的氨基酸还原性烷基化:与醛反应然后用nabh4还原,用亚氨酰乙酸甲酯进行脒基化或用乙酸酐进行酰化。可以使用本领域已知的标准方法来制备解旋酶、孔和构建体。编码了解旋酶、孔或构建体的多核苷酸序列可以采用本领域的标准方法进行衍生和复制。编码解旋酶、孔或构建体的多核苷酸序列可以使用本领域的标准技术来在细菌宿主细胞中表达。可以通过对来自重组表达载体的多肽进行原位表达来在细胞中制备解旋酶、孔和/或构建体。表达载体可选地携带诱导型启动子以控制多肽的表达。这些方法在sambrook,j.andrussell,d.(2001).molecularcloning:alaboratorymanual,3rdedition.coldspringharborlaboratorypress,coldspringharbor,ny中进行了描述。从产生蛋白质的生物体中或重组表达后经任意蛋白质液相色谱系统纯化后,大规模地制备解旋酶、孔和/或构建体。典型的蛋白质液相色谱系统包括fplc、akta系统、bio-cad系统、bio-radbiologic系统和gilsonhplc系统。本发明的方法涉及测量目标多核苷酸的一个或多个特征。所述方法可能涉及测量目标多核苷酸的两个、三个、四个或五个或更多个特征。所述一个或多个特征优选选自(i)目标多核苷酸的长度;(ii)目标多核苷酸的同一性;(iii)目标多核苷酸的序列;(iv)目标多核苷酸的二级结构和(v)目标多核苷酸是否经过修饰。根据本发明,可以对(i)至(v)的任一组合进行测量。对于(i),例如,可以通过确定目标多核苷酸和孔之间的相互作用次数或目标多核苷酸和孔之间的相互作用持续时间来测量多核苷酸的长度。对于(ii),可以以多种方式测量多核苷酸的同一性。可以结合目标多核苷酸的序列的测定,或不联合目标多核苷酸的序列的测定来测定多核苷酸的同一性。前者是直接的;对多核苷酸进行测序,并由此进行鉴定。后者可以通过几种方式完成。例如,可以测定多核苷酸中特定基序的存在(而无需测定多核苷酸的剩余序列)。可选地,所述方法中测定的特定的电和/或光信号的测量值可鉴定来自特定来源的目标多核苷酸。对于(iii),可以如先前所述对多核苷酸的序列进行确定。合适的测序方法,特别是那些使用电测量值的测序方法,描述于stoddartdetal.,procnatlacadsci,12;106(19):7702-7,liebermankretal,jamchemsoc.2010;132(50):17961-72,和国际申请wo2000/28312中。对于(iv),所述二级结构可以以多种方式测量。例如,如果所述方法包含电测量,二级结构可以利用穿过孔的停留时间的改变或电流变化进行测量。这使得能够区别出单链和双链多核苷酸的区域。对于(v),可以测定任何存在或不存在修饰。该方法优选包括确定所述目标多核苷酸是否用一个或多个蛋白质或一个或多个标记物、标签或间隔物通过甲基化、氧化、损伤进行了修饰。特异性修饰将导致与孔的特异性相互作用,其可以使用下述方法进行测定。例如,可以基于孔与每个核苷酸的相互作用过程中穿过孔的电流,区别胞嘧啶与甲基胞嘧啶。可以进行各种不同类型的测量。这包括但不限于:电测量和光测量。可能的电测量包括:电流测量、阻抗测量、隧道测量(ivanovap等人,nanolett.2011jan12;11(1):279-85)和fet测量(公开号为wo2005/124888的国际申请)。光测量可以与电测量相结合(sonigv等人,revsciinstrum.2010jan;81(1):014301)。测量可以是跨膜电流测量,例如,流过孔的离子电流的测量。可以使用标准单通道记录设备进行电测量,stoddartd等人,procnatlacadsci,12;106(19):7702-7,liebermankr等人,jamchemsoc.2010;132(50):17961-72,和国际申请wo-2000/28312所描述的。可选地,可以采用多通道系统进行电测量,例如,如公开号为wo2009/077734和公开号为wo2011/067559的国际申请中所描述的在优选实施方案中,所述方法包括:(a)使目标多核苷酸与本发明的跨膜孔和解旋酶或本发明的构建体接触,使得目标多核苷酸移动穿过孔,并且解旋酶或构建体控制目标多核苷酸穿过孔的移动;以及(b)随着多核苷酸相对于孔移动,测量流经所述孔的电流,其中,所述电流代表目标多核苷酸的一个或多个特征,并由此所述表征目标多核苷酸。可以采用适用于研究膜/孔系统的任何设备来实施所述方法,在所述系统中孔存在于膜中。可以采用适用于感测跨膜孔的任何设备来实施所述方法。例如,所述设备包括一个室,所述室包括水溶液和将该室分割为两部分的屏障(barrier)。所述障碍物通常具有裂缝,其中在缝隙中形成包括孔的膜。或者该屏障形成其中存在孔的膜。可以采用申请号为pct/gb08/000562(wo2008/102120)的国际申请中所描述的设备来执行所述方法。该方法可以包括随着多核苷酸相对于所述孔移动,测量通过所述孔的电流。因此,所述设备还可以包括能够跨膜和孔施加电势并测量电流信号的电路。可以使用膜片钳或电压钳来执行所述方法。所述方法优选包含使用电压钳。本发明的方法可包括随着所述多核苷酸相对于所述孔移动来测量流过所述孔的电流。用于测量通过跨膜蛋白孔的离子电流的合适的条件是本领域已知的,并且在实施例中公开。该方法通过跨膜和孔施加的电压进行实施。所使用的电压通常为+2v至-2v,通常为-400mv至+400mv。所使用的电压优选在具有下限和上限的范围内,其中,所述下限选自-400mv,-300mv,-200mv,-150mv,-100mv,-50mv,-20mv和0mv,所述上限独立地选自+10mv,+20mv,+50mv,+100mv,+150mv,+200mv,+300mv和+400mv。所使用的电压范围更优选在100mv至240mv,最优选在120mv至220mv。可通过对孔施加提高的电势来提高对不同核苷酸的分辨力。该方法通常在任何载荷子,如金属盐,例如碱金属盐,卤盐,例如氯盐,如碱金属氯盐的存在下实施。载荷子可包括离子型液体或有机盐,例如四甲基氯化铵,三甲基氯化铵,氯化苯甲基铵,或1-乙基-3-甲基咪唑鎓氯化物。在上述示例性装置中,盐存在于所述室中的水溶液中。通常使用氯化钾(kcl)、氯化钠(nacl)、氯化铯(cscl)或亚铁氰化钾和铁氰化钾的混合物。优选kcl、nacl和亚铁氰化钾和铁氰化钾的混合物。盐浓度可为饱和的。盐浓度可以是3m或更低,通常为0.1至2.5m、0.3至1.9m、0.5至1.8m、0.7至1.7m、0.9至1.6m或1m至1.4m。盐浓度优选为150mm至1m。令人惊奇地是,hel308、xpd、recd和trai解旋酶在高盐浓度下起作用。优选使用至少0.3m,例如至少0.4m、至少0.5m、至少0.6m、至少0.8m、至少1.0m、至少1.5m、至少2.0m、至少2.5m或至少3.0m的盐浓度来执行所述方法。高盐浓度提供高信噪比,并使得在正常电流波动的背景下,代表核苷酸存在的电流能被识别。通常在存在缓冲液的情况下执行该方法。在上述示例性设备中,缓冲液存在于所述室中以水溶液存在。本发明的方法中可使用任何缓冲液。通常,缓冲液是磷酸盐缓冲液。其它合适的缓冲液包括但不限于hepes和tris-hcl缓冲液。通常在ph值为4.0至12.0、4.5至10.0、5.0至9.0、5.5至8.8、6.0至8.7或7.0至8.8或7.5至8.5的情况下执行所述方法。所用的ph值优选为约7.5。可以在温度为0℃至100℃、15℃至95℃、16℃至90℃、17℃至85℃、18℃至80℃、19℃至70℃或20℃至60℃的情况下执行所述方法。通常在室温下执行所述方法。可选地,该方法可选地在支持酶功能的温度下,例如约37℃实施。可以在存在自由核苷酸或自由核苷酸类似物和/或促进解旋酶或构建体起作用的酶辅助因子的情况下执行所述方法。还可以在不存在自由核苷酸或自由核苷酸类似物并且在不存在酶辅助因子的情况下执行所述方法。自由核苷酸可以是上述任一个或多个单个核苷酸。游离核苷酸包括但不限于单磷酸腺苷(amp)、二磷酸腺苷(adp)、三磷酸腺苷(atp)、单磷酸鸟苷(gmp)、二磷酸鸟苷(gdp)、三磷酸鸟苷(gtp)、单磷酸胸苷(tmp)、二磷酸胸苷(tdp)、三磷酸胸苷(ttp)、单磷酸尿苷(ump)、二磷酸尿苷(udp)、三磷酸尿苷(utp)、单磷酸胞苷(cmp)、二磷酸胞苷(cdp)、三磷酸胞苷(ctp)、环单磷酸腺苷(camp)、环单磷酸鸟苷(cgmp)、脱氧单磷酸腺苷(damp)、脱氧二磷酸腺苷(dadp)、脱氧三磷酸腺苷(datp)、脱氧单磷酸鸟苷(dgmp)、脱氧二磷酸鸟苷(dgdp)、脱氧三磷酸鸟苷(dgtp)、脱氧单磷酸胸苷(dtmp)、脱氧二磷酸胸苷(dtdp)、脱氧三磷酸胸苷(dttp)、脱氧单磷酸尿苷(dump)、脱氧二磷酸尿苷(dudp)、脱氧三磷酸尿苷(dutp)、脱氧单磷酸胞苷(dcmp)、脱氧二磷酸胞苷(dcdp)和脱氧三磷酸胞苷(dctp)。自由核苷酸优选选自amp、tmp、gmp、cmp、ump、damp、dtmp、dgmp或dcmp。自由核苷酸优选为三磷酸腺苷(atp)。酶辅助因子是使解旋酶或构建体起作用的因子。酶辅助因子优选为二价金属阳离子。二价金属阳离子优选为mg2+、mn2+、ca2+或co2+。酶辅助因子最优选是mg2+。目标多核苷酸可以以任何顺序接触解旋酶或构建体和孔。优选地,当目标多核苷酸与解旋酶或构建体和孔接触时,目标多核苷酸首先与解旋酶或构建体形成复合物。当跨孔施加电压时,目标多核苷酸/解旋酶或构建体复合物然后与孔形成复合物并控制多核苷酸穿过孔的移动。其它方法本发明还提供了形成传感器以用于表征目标多核苷酸的方法。所述方法包括:在孔和本发明的解旋酶或本发明的构建体之间形成复合物。解旋酶可以是上述任一种。有关本发明的系列和方法,可以使用以上讨论的本发明的解旋酶的任何数量和组合。可以通过在存在目标多核苷酸的情况下使孔与解旋酶或构建体接触,然后在孔上施加电势来形成复合物。施加的电势可以是如上所述的化学电势或电压电势。可选地,可以通过将孔与解旋酶或构建体共价地连接来形成复合物。用于共价连接的方法是本领域已知的并在以下国际申请中进行了公开,例如,公开在申请号为pct/gb09/001679(公开为wo2010/004265)和申请号为pct/gb10/000133(公开为wo2010/086603)的国际申请。复合物是一种用于表征目标多核苷酸的传感器。所述方法优选包括在衍生自msp的孔和本发明的解旋酶或本发明的构建体之间形成复合物。结合本发明方法所讨论的上述实施方案中的任一个同样适用于所述方法。本发明还提供采用本发明方法制备的传感器。试剂盒本发明还提供一种用于表征目标多核苷酸的试剂盒。在一个实施方案中,试剂盒包含(a)本发明的孔或(b)本发明的解旋酶或本发明的构建体。孔可以是上述任一种。在另一个实施方案中,试剂盒包含(a)本发明的解旋酶或本发明的构建体和(b)一个或多个负载部分。每个负载部分可以是能够与目标多核苷酸连接的任何部分。只要解旋酶或构建体可以结合并且其可以与目标多核苷酸连接,每个负载部分可以是任何长度。一个或多个负载部分优选是合成的或人造的。一个或多个负载部分优选是非天然的。合适的负载部分包括但不限于聚合物连接器、化学连接器、多核苷酸或多肽。一个或多个负载部分优选包含多核苷酸或载体多核苷酸。在这种实施方案中,解旋酶或构建体优选与多核苷酸结合(或连接)。可以使用上述任一种多核苷酸。优选地,一个或多个负载部分包含dna,rna,修饰的dna(例如,脱碱基dna)、rna、pna、lna、bna或peg。一个或多个负载部分更优选包含单链或双链dna或rna。一个或多个负载部分优选包含与一个或多个多核苷酸结合蛋白结合(或连接)的单链多核苷酸。一个或多个负载部分中的至少一个优选为y适配器。y适配器通常包含(a)双链区域和(b)单链区域或另一端不互补的区域。如果y适配器包括单链区域,则可以将其描述为具有突出端(overhang)。在y适配器中存在非互补区域使得适配器具有y形状,因为与双链部分不同,这两条链通常彼此不杂合。y适配器优选地包括一个或多个能够将y适配器与膜连接的锚定物。以上对锚定物进行了更详细的讨论。优选的锚定物是胆固醇。y适配器优选地包含优先旋入孔的前导序列。前导序列有利于本发明的方法。前导序列被设计为优先旋入孔,从而促进目标多核苷酸相对于孔,例如,穿过孔移动。前导序列也可以用于将多核苷酸与如上所述的一个或多个锚定物连接。前导序列通常包含聚合物。聚合物优选是带负电荷的。聚合物优选为多核苷酸,例如,dna或rna,修饰的多核苷酸(例如,脱碱基dna)、pna、lna、bna、聚乙二醇(peg)或多肽。前导序列优选包含多核苷酸,更优选包含单链多核苷酸。前导序列可以包含任何上述多核苷酸。单链前导序列最优选包含单链dna,例如,polydt片段。前导序列优选地包括如下所述的间隔物。前导序列可以是任何长度,但是长度通常为10至150个核苷酸,例如,长度为20至150个核苷酸。前导系列的长度通常取决于方法中使用的跨膜孔。一个或多个负载部分中的至少一个优选是桥连部分。桥连部分最优选是发夹环或发夹环适配器。可以使用本领域已知的方法来设计合适的发夹环适配器。发夹环可以是任何长度。如果用作负载部分,发夹环通常为400个或更少的核苷酸,例如,350个或更少的核苷酸、300个或更少的核苷酸、250个或更少的核苷酸、200个或更少的核苷酸、150个或更少的核苷酸、100个或更少的核苷酸、90个或更少的核苷酸、80个或更少的核苷酸、70个或更少的核苷酸、60个或更少的核苷酸、50个或更少的核苷酸、40个或更少的核苷酸、30个或更少的核苷酸、20个或更少的核苷酸或者10个或更少的核苷酸。发夹环的长度优选为约1至400、2至300、5至200、6至100个核苷酸。当多核苷酸的两个互补部分杂交形成双链序列(称为茎(stem))时,形成发夹环。如果用作负载部分,则发夹环的茎优选为200个或更少的核苷酸对,例如,150个或更少的核苷酸对、100个或更少的核苷酸对、90个或更少的核苷酸对、80个或更少的核苷酸对、70个或更少的核苷酸对、60个或更少的核苷酸对、50个或更少的核苷酸对、40个或更少的核苷酸对、30个或更少的核苷酸对、20个或更少的核苷酸对或者10个或更少的核苷酸对。一个或多个多核苷酸结合蛋白通常与发夹的环结合,即,不是茎。如果目标多核苷酸是双链的,则一个或多个负载部分优选包含y适配器且可选地包含桥连部分,例如,发夹环适配器。如果至少一个或多个负载部分是y适配器,则其可以联合未结合或连接有任何多核苷酸结合蛋白的桥连适配器进行使用。解旋酶或构建体可以在一个或多个负载部分上的一个或多个间隔物处停滞。间隔物在申请号为pct/gb2014/050175(wo2014/135838)的国际申请中进行了限定。优选的间隔物包括但不限于硝基吲哚、5-硝基吲哚、肌苷、吖啶、2-氨基嘌呤、2-6-二氨基嘌呤、5-溴脱氧尿苷、反式胸苷(反式dt)、反式二脱氧胸苷(ddt)、二脱氧胞苷(ddc)、5-甲基胞苷、5-羟甲基胞苷、2’-o-甲基rna碱基、异脱氧胞苷(iso-dc)、异脱氧鸟苷(iso-dg)、ispc3基团(即,缺少糖和碱的核苷酸)、可光裂解(pc)基团、己二醇基团、间隔物9(isp9)基团、间隔物18(isp18)基团、聚合物或硫醇连接。间隔物可以包括这些基团的任一组合。许多这些基团可以从(integrateddna)商购获得。可以使用任何数量的一个或多个负载部分。所述方法可以包括连接两个或更多个负载部分,每个负载部分具有与其结合(连接)的解旋酶或构建体。例如,负载部分可以与目标多核苷酸的每个末端连接。在这种实施方案中,一个负载部分优选是y适配器,另一个负载部分可以是桥连部分,例如,发夹环适配器。一个或多个负载部分可以以任何方式与目标多核苷酸连接。一个或多个负载部分优选与目标多核苷酸共价地连接。一个或多个负载部分最优选与目标多核苷酸连接。一个或多个负载部分可以与多核苷酸的任一端连接,即,5’或3’末端。负载部分可以与目标多核苷酸的两端连接。可以使用本领域已知的任何方法将一个或多个负载部分与多核苷酸连接。可以在不存在atp或使用γ-s-atp(atpγs)代替atp的情况下,将一个或多个负载部分与多核苷酸连接。可以采用连接酶,例如t4dna连接酶、大肠杆菌dna连接酶、taqdna连接酶、tmadna连接酶和9°ndna连接酶将一个或多个负载部分连接。所述连接酶优选在实施例3中所述的条件下使用。一旦负载部分已经与目标多核苷酸连接,解旋酶或构建体优选保持与负载部分结合(连接)。根据本发明,在其连接之后,解旋酶或构建体可以从一个或多个负载部分中解开连接。对于本发明方法所讨论的任何实施方案同样适用于试剂盒。解旋酶可以是上述任一种。针对本发明系列和方法,试剂盒可以包括上述本发明的解旋酶的任何数量和组合。试剂盒还可以包含膜的组分,例如,形成两性分子层,例如脂质双分子层所需的磷脂。本发明的试剂盒可以额外地包含一个或多个能够使上述任何实施方案得以进行的其它试剂或仪器。这种试剂或仪器包括以下一个或多个:合适的缓冲液(水溶液)、从受体(例如,血管或包含针的仪器)获得样品的装置、用于扩增和/或表达多核苷酸的装置、如上所限定的膜或电压或膜片钳装置。试剂可以以干燥状态存在于试剂盒中,使得流体样品使试剂重新悬浮。可选地,试剂盒还可以包括能够使试剂盒用于本发明方法中的说明书或有关所述方法可用于哪种生物体的细节。可选地,试剂盒可以包含核苷酸。设备本发明还提供一种用于表征目标多核苷酸的设备。所述设备包括多个孔和多个本发明的解旋酶或多个本发明的构建体。所述设备优选地还包括用于实施本发明方法的指令。所述设备可以是用于多核苷酸分析的任何常规设备,例如,阵列或芯片。结合本发明方法所讨论的上述任一实施方式同样适用于本发明设备。解旋酶可以是结合本发明构建体所讨论的上述任一种,包括本发明的解旋酶和根据本发明未经过修饰的解旋酶。所述设备可以包括任何数量和组合的本发明解旋酶。所述设备优选地设置用以执行本发明的方法。所述设备优选地包括:传感器装置,其能够支撑多个孔和膜并且可操作地采用孔和膜进行多核苷酸表征;和至少一个端口,用于传送进行表征的材料。可选地,所述设备优选地包括:传感器装置,其能够支撑多个孔和膜并且可操作地采用孔和膜进行多核苷酸表征;和至少一个储存器,用于容纳进行表征的材料。所述设备更优选包括:传感器装置,其能够支撑多个孔与膜,并且可操作地采用孔和膜进行多聚核苷酸表征;至少一个储存器,用于容纳进行表征的材料;流体系统,用以可控地将材料从所述至少一个储存器向所述传感器装置供给;和一个或多个容器,用于接收相应的样本,所述流体系统用于选择性地将样品从所述一个或多个容器向所述传感器装置供给。所述设备可以是申请号为pct/gb08/004127(公开为wo2009/077734)、pct/gb10/000789(公开为wo2010/122293)、pct/gb10/002206(公开为wo2011/067559)或pct/us99/25679(公开为wo00/28312)的国际申请中描述的任一种。本发明解旋酶的制备方法本发明还提供制备本发明的修饰的解旋酶的方法。所述方法包括提供dda解旋酶并对所述解旋酶进行修饰以形成本发明的修饰的解旋酶。所述方法优选还包括确定解旋酶是否能够控制多核苷酸的移动。以上对这种情况的测定方法进行了描述。如果可以控制多核苷酸的移动,则解旋酶已被正确修饰,并且制备出本发明的解旋酶。如果不能控制多核苷酸的移动,则尚未制备出本发明的解旋酶。本发明构建体的制备方法本发明还提供一种制备本发明构建体的方法。所述方法包括将本发明的解旋酶与额外的多核苷酸结合部分连接,优选共价地连接。上述任何解旋酶和部分可用于所述方法中。如上所述,对共价连接的位点和方法进行选择。所述方法优选还包括确定构建体是否能够控制多核苷酸的移动。对以上这种情况的测定方法进行描述。如果可以控制多核苷酸的移动,则解旋酶和部分已被正确连接并且制备出本发明的构建体。如果不能控制多核苷酸的移动,则尚未制备出本发明的构建体。以下实施例对本发明进行说明。实施例1本实施例描述了用以研究mspa-(g75s/g77s/l88n/d90n/d91n/d118r/q126r/d134r/e139k)8(具有g75s/g77s/l88n/d90n/d91n/d118r/q126r/d134r/e139k突变的seqidno:2=mspa突变体1)或mspa-((del-l74/g75/d118/l119)d56n/e59r/l88n/d90n/d91n/q126r/d134r/e139k)8(具有d56n/e59r/l88n/d90n/d91n/q126r/d134r/e139k突变以及缺失l74/g75/d118/l119氨基酸的seqidno:2=mspa突变体2)与t4dda-e94c/a360c/c109a/c136a(具有e94c/a360c/c114a/c171a/c421d突变的seqidno:8=酶突变体1a)之间的相互作用所进行的模拟。利用gromacs软件包版本4.0.5,采用gromos53a6力场和spc水模型进行模拟。mspa突变体1和mspa突变体2模型基于蛋白质数据库中发现的mspa的晶体结构,记录码为1uun。使用pymol进行相关突变,在mspa突变体2的情况下,将残基l74/g75/d118/l119从桶中删除。然后,使用最陡下降算法对所得到的孔模型进行能量最小化。酶突变体1a模型基于蛋白质数据库中发现的ddal993结构,记录码为3upu。同样,使用pymol进行相关突变,并且使用最陡下降算法对模型进行能量最小化。然后,将酶突变体1a模型置于mspa突变体1和mspa突变体2之上。对酶突变体1a/mspa突变体1和酶突变体1a/mspa突变体2系统进行三次模拟,其中酶突变体1a的取向在每次模拟中有所不同(三次不同模拟取向的动画示意图,参见图1)。将孔放入包含dppc分子的脂质膜中,并对模拟箱进行溶剂化处理。在整个模拟过程中,向孔的主干(backbone)施加限制。然而,酶不受限制。使用300k的berendsen恒温器和berendsen恒压器,将所述系统在npt系统中模拟40ns。使用gromacs分析软件和本地写入代码分析酶和孔之间的接触。图2至图5示出了在mspa突变体1(图2和3)和mspa突变体2(图4和5)与酶突变体1a相互作用的氨基酸残基。下表示出了孔和酶中的氨基酸位点,其中,发现所述孔和酶相互作用(表9示出了在mspa突变体1和酶突变体1a之间测量相互作用时所观察到的mspa突变体1氨基酸接触点,表10示出了在mspa突变体1和酶突变体1a之间测量相互作用时所观察到的酶突变体1a氨基酸接触点,表11示出了在mspa突变体2和酶突变体1a之间测量相互作用时所观察到的mspa突变体2氨基酸接触点,图12示出了在mspa突变体2和酶突变体1a之间测量相互作用时所观察到的酶突变体1a氨基酸接触点)。图6示出了孔(mspa突变体2)中哪些氨基酸与酶(酶突变体1a)中的特定氨基酸相互作用。模拟数据可以用于鉴定酶突变体1a的一部分,其是被修饰的以改善酶和纳米孔之间的相互作用,从而提供目标多核苷酸相对于跨膜孔,例如穿过跨膜孔的更一致的移动。表9运行图1运行图2运行图3酶氨基酸残基酶氨基酸残基酶氨基酸残基2180255180199216179202221178122722743514513211774342542121792581178224194177257204197256176522321320121231813082162002072116350202228224210223319191304199209201347434261405260255247表10表11表12实施例2本实施例描述了用以研究两种不同酶(野生型dda1993(seqidno:8))和t4dda-e94c/a360c(具有e94c/a360c突变的seqidno:8)=酶突变体18)和多核苷酸之间的相互作用所进行的模拟。进行模拟是为了评估哪些残基与酶结合位点内的dna接触。利用gromacs软件包版本4.0.5,采用amber-99sb力场和tip3p水模型进行模拟。对两种酶进行了模拟,即,野生型ddal993和酶突变体18。酶突变体18以闭合复合物形式进行模拟,使得在e94c和a360c之间存在二硫键。野生型ddal993的初始结构是基于蛋白质数据库中可用的结构,记录码为3upu。该pdb文件中的结构是ddal993-k38a。因此,在野生型ddal993模拟中,使用pymol将残基38回复突变为赖氨酸。酶突变体18模型也基于3upu中的结构,其中,在pymol中进行相关突变。在两种酶模拟中模拟的dna是存在于3upu的晶体结构中的dna(dna序列是poly(dt))。然后,使用最陡下降算法对得到的酶/dna模型进行能量最小化。然后,对模拟箱进行溶剂化处理,并进行另一轮的能量最小化。在整个模拟过程中,酶和dna不受限制。使用300k的berendsen恒温器和berendsen恒压器,将所述系统在npt系统中模拟20ns。使用gromacs分析软件和本地写入代码分析酶和dna之间的接触。下表示出了在两种酶中与存在于晶体结构3upu中的dna相互作用的氨基酸(表13和表14示出了在野生型dda1993和dna之间测量相互作用时所观察到的野生型dda1993氨基酸接触点,表15和表16示出了在酶突变体18和dna之间测量相互作用时所观察到的酶突变体18氨基酸接触点)。模拟数据可用于鉴定ddal993酶和酶突变体18中的位点,其可以突变以改善酶和dna之间的相互作用,从而提供目标多核苷酸相对于跨膜孔,例如穿过跨膜孔的更一致的移动。实施例3本实施例使用具有多种不同解旋酶的t4dda-e94c/c109a/c136a/a360c(具有e94c/c109a/c136a/a360c突变并且然后(δm1)g1的seqidno:8)(酶突变体1)比较控制dna构建体x(参见图7)穿过纳米孔的移动。所有测试的解旋酶控制dna穿过纳米孔的移动,并在随着dna移位穿过纳米孔时观察电流变化。测试的解旋酶具有a)至少一个与单链dna(ssdna)中的一个或多个核苷酸相互作用的氨基酸取代或b)与跨膜孔相互作用的在解旋酶的一部分中的一个或多个修饰或者a)和b)两种变化。本实施例研究补体向前滑移(complementslipsforward)数量/3.6kb、补体向前滑移数量/kb、由于向前滑移而在构建体x中缺失的%碱基、补体中向前滑移的总长度以及向前滑移的平均长度。本实施例中研究的解旋酶沿着多核苷酸的5’至3’方向上移动。当孔捕获到多核苷酸的5’末端(解旋酶移动远离的一端)时,解旋酶在施加电势而产生的场的方向上工作,并使螺旋多核苷酸移动进入孔中并进入反式腔室。在本实施例中,向前滑移涉及dna相对于孔向前移动(即,朝着其3’末端并远离其5’末端)至少4个连续的核苷酸。材料和方法在建立实验之前,用适当的酶将dna构建体x(最终浓度为0.1nm)在室温下预培养5分钟(参见以下提供的酶列表(添加到纳米孔系统的最终浓度为10nm,在缓冲液(253mmkcl、50mm磷酸钾、ph值为8.0的2mmedta)中提供)。5分钟后,将tmad(添加到纳米孔系统的最终浓度为100μm)添加到预混合物中,并将混合物再培养5分钟。最后,将mgcl2(添加到纳米孔系统的最终浓度为2mm)、atp(添加到纳米孔系统的最终浓度为2mm))和kcl(添加到纳米孔系统的最终浓度为500mm终浓度)添加到预混合物中。在缓冲液(25mm磷酸钾缓冲液、150mm亚铁氰化钾(ii)、150mm铁氰化钾(iii),ph值为8.0)中,从插入嵌段共聚物中的单个mspa纳米孔(mspa-((del-l74/g75/d118/l119)d56f/e59r/l88n/d90n/d91n/q126r/d134r/e139k)8(具有d56f/e59r/l88n/d90n/d91n/q126r/d134r/e139k突变并缺失l74/g75/d118/l119氨基酸的seqidno:2)(mspa突变体3))中获得电测量值。在单孔插入嵌段共聚物得以实现之后,然后将2ml缓冲液(25mm磷酸钾缓冲液、150mm亚铁氰化钾(ii)、150mm铁氰化钾(iii),ph值为8.0)流过系统以除去任何过量的mspa纳米孔。然后将150μlph值为8.0的500mmkcl、25mm磷酸钾流过系统。10分钟后,再将150μlph值为8.0的500mmkcl、25mm磷酸钾流过系统,然后将酶(参见以下列表,最终浓度为10nm)、dna构建体x(最终浓度为0.1nm)、燃料(fuel)(最终浓度为2mm的mgcl2,最终浓度为2mm的atp)预混合物(总计150μl)流入单个纳米孔实验系统。在-140mv下运行实验,并监测经解旋酶控制的dna移动。结果对许多不同的解旋酶进行研究,以为了确定至少一个或多个取代对被认为与dna构建体x相互作用的解旋酶区域或者被认为与纳米孔相互作用的一个或多个修饰的影响。为了鉴定经解旋酶控制的dna移位得以改善的解旋酶,对五个不同的参数进行了研究:1)补体向前滑移数量/3.6kb;2)补体向前滑移数量/kb;3)由于向前滑移而在构建体x中缺失的碱基%;4)补体中向前滑移的总长度;5)向前滑移的平均长度。使用以下步骤计算每千碱基或每3.6kb向前滑移测量值:1)使用hmm算法将经解旋酶控制的dna移动映射到模型;2)然后,将经解旋酶控制的dna移动进行过滤;3)对映射的经解旋酶控制的dna移动进行检查以确保映射准确;4)根据千碱基或3.6kb随着至少4个连续核苷酸的向前滑移移动,确定被分类的转变。由于向前滑移而在构建体x中缺失的%碱基是由于沿着dna构建体x向前滑移而在构建体x中缺失的碱基数量表示为百分比的测量。补体滑移的总长度是链的补体片段中所有滑移的总和。平均滑移长度是链的补体片段中所有滑移的总和除以补体中的总滑移数量。以下表17示出了相比酶突变体1所测试的不同酶。在所测试的酶中,突变体2至13和15至17在与酶突变体1相比时呈现参数1至5中至少一个的改进。突变体5至13具有至少一个核苷酸,其与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用,被包含较大侧链(r基团)并且在与跨膜孔相互作用的解旋酶的一部分中没有一个或多个修饰的氨基酸取代。突变体5至13在与酶突变体1相比时均呈现参数1至5中至少一个的改进,这导致包含较大侧链(r基团)并且与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸被取代。显然,在与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的位点上用较大侧链基团进行至少一个取代导致移动控制得以改善。突变体14具有至少一个氨基酸,其与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用,被包含较小侧链(r基团)并且在与跨膜孔相互作用的解旋酶的一部分中没有一个或多个修饰的氨基酸取代。突变体14在与酶突变体1相比时呈现参数1至5中至少一个的改进,这导致包含较小侧链(r基团)并且与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸被取代。显然,在与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的位点上用较小侧链基团进行至少一个取代导致移动控制变差。突变体4具有至少一个氨基酸取代,其与单链dna(ssdna)中一个或多个核苷酸的一个或多个磷酸基相互作用,至少一个与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的氨基酸被包含较大侧链(r基团)并且在与跨膜孔相互作用的解旋酶的一部分中没有一个或多个修饰的氨基酸取代。突变体4在与酶突变体1相比时呈现参数1至5中至少一个的改进,这导致氨基酸组合被取代,例如,第一种是与单链dna(ssdna)中一个或多个核苷酸的一个或多个磷酸基相互作用;第二种是与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用。此外,突变体4在与酶突变体9相比时呈现参数1至5中至少一个的改进,这导致与单链dna(ssdna)中一个或多个核苷酸的一个或多个磷酸基相互作用的氨基酸被取代。显然,在与一个或多个核苷酸的糖和/或碱基相互作用的位点上用较大侧链基团进行取代以及进行与单链dna(ssdna)中一个或多个核苷酸的一个或多个磷酸基相互作用的取代导致移动控制得以改善。突变体2具有至少一个氨基酸,其与单链dna(ssdna)中一个或多个核苷酸的一个或多个糖和/或碱基相互作用,被包含较大侧链(r基团)并且在与跨膜孔相互作用的解旋酶的一部分中没有一个或多个修饰的氨基酸取代。突变体2在与酶突变体1相比时呈现参数1至5中至少一个的改进,这导致组合发生变化,例如,第一种是与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的至少一个取代;第二种是与跨膜孔相互作用的解旋酶的一部分中的一个或多个修饰。突变体2在与酶突变体9相比时也呈现参数1至5中至少一个的改进,这导致第二种情况,即,在与跨膜孔相互作用的解旋酶的一部分中的一个或多个修饰。此外,突变体2在与酶突变体16相比时呈现参数1至5中至少一个的改进,这导致第一种情况,即,与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的至少一个取代。显然,进行组合变化(第一种是与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的至少一个取代;第二种是与跨膜孔相互作用的解旋酶的一部分中的一个或多个修饰)导致酶的移动控制呈现改进。突变体3具有至少一个氨基酸,其与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用,被包含较大侧链(r基团)并且在与跨膜孔相互作用的解旋酶的一部分中有一个或多个修饰的氨基酸取代。突变体3在与酶突变体1相比时呈现参数1至5中至少一个的改善,这导致组合发生变化,例如,第一种是在与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的至少一个取代;第二种是在与跨膜孔相互作用的解旋酶的一部分中的一个或多个修饰。突变体3在与酶突变体9相比时也呈现参数1至5中至少一个的改进,这导致第二种情况,即,与跨膜孔相互作用的解旋酶的一部分中的一个或多个修饰。此外,突变体3在与酶突变体17相比时也呈现参数1至5中至少一个的改进,这导致第一种情况,即,与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的至少一个取代。显然,进行组合取代(第一种是与单链dna(ssdna)中一个或多个核苷酸的糖和/或碱基相互作用的至少一个取代;第二种是与跨膜孔相互作用的解旋酶的一部分中的一个或多个修饰)导致酶的移动控制呈现改进。酶id酶突变体1=t4dda-e94c/c109a/c136a/a360c(具有e94c/c109a/c136a/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体2=t4dda-e94c/f98w/c109a/c136a/k199l/a360c(具有e94c/f98w/c109a/c136a/k199l/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体3=t4dda-f98w/e94c/c109a/c136a/k194l/a360c(具有f98w/e94c/c109a/c136a/k194l/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体4=t4dda-s83h/e94c/f98w/c109a/c136a/a360c(具有s83h/e94c/f98w/c109a/c136a/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体5=t4dda-e94c/f98w/c109a/c136a/f276k/a360c(具有e94c/f98w/c109a/c136a/f276k/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体6=t4dda-e94c/f98w/c109a/c136a/s287r/a360c(具有e94c/f98w/c109a/c136a/s287r/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体7=t4dda-e94c/f98w/c109a/c136a/s287w/a360c(具有e94c/f98w/c109a/c136a/s287w/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体8=t4dda-e94c/f98w/c109a/c136a/s287f/a360c(具有e94c/f98w/c109a/c136a/s287f/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体9=t4dda-e94c/f98w/c109a/c136a/a360c(具有e94c/f98w/c109a/c136a/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体10=t4dda-p89f/e94c/c109a/c136a/a360c(具有p89f/e94c/c109a/c136a/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体11=t4dda-e94c/c109a/c136a/v150h/a360c(具有/c109a/c136a/v150h/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体12=t4dda-e94c/c109a/c136a/v150i/a360c(具有e94c/c109a/c136a/v150i/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体13=t4dda-e94c/c109a/c136a/p152f/a360c(具有e94c/c109a/c136a/p152f/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体14=t4dda-e94c/f98a/c109a/c136a/a360c(具有e94c/f98a/c109a/c136a/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体15=t4dda-e94c/c109a/c136a/k199l/a360c(具有e94c/c109a/c136a/k199l/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体16=t4dda-e94c/c109a/c136a/k194l/a360c(具有e94c/c109a/c136a/k194l/a360c突变的seqidno:8并且然后(δm1)g1)酶突变体17=t4dda-e94c/c109a/c136a/w195a/a360c(具有e94c/c109a/c136a/w195a/a360c突变的seqidno:8并且然后(δm1)g1)表17实施例4本实施例示出了解旋酶t4dda-e94c/f98w/c109a/c136a/k194l/a360c(具有e94c/f98w/c109a/c136a/k194l/a360c突变的seqidno:8并且然后(δm1)g1)如何控制dna构建体x(参见图7)通过csgg纳米孔(csgg-eco-(y51t/f56q)-strepii(c)9(具有y51t/f56q突变的seqidno:66,其中,strepii(c)是seqidno:67并且在c末端上进行连接)的移动。材料和方法如实施例3的材料和方法部分中所述,制备dna构建体x解旋酶(t4dda-e94c/f98w/c109a/c136a/k194l/a360c(具有e94c/f98w/c109a/c136a/k194l/a360c突变的seqidno:8并且然后(δm1)g1)预混合物。除了纳米孔是csgg而不是mspa之外,以实施例3中所述的类似方法,从插入嵌段共聚物的单个csgg纳米孔(csgg-eco-(y51t/f56q)-strepii(c))9(具有y51t/f56q突变的seqidno:66,其中,strepii(c)是seqidno:67并在c末端上进行连接)中获得电测量值。结果观察到解旋酶控制dna移动,随着t4dda-e94c/f98w/c109a/c136a/k194l/a360c(具有e94c/f98w/c109a/c136a/k194l/a360c突变的seqidno:8并且然后(δm1)g1)控制dna构建体x(参见图7))穿过csgg纳米孔(csgg-eco-(y51t/f56q)-strepii(c))9(具有y51t/f56q突变的seqidno:66,其中,strepii(c)是seqidno:67并且在c末端上进行连接)移动。图8a中示出了解旋酶控制dna移动的电流迹线的示例,图8b和图8c示出了同一迹线的放大视图。实施例5本实施例示出了如何将发夹与rna链的3’末端连接,并对rna链进行逆转录以产生rna/dna杂交体。随后,将非rna多核苷酸与rna/dna杂交体中rna链的5’末端连接以便负载dna解旋酶,t4dda(e94c/f98w/c109a/c136a/k194l/a360c(具有e94c/f98w/c109a/c136a/k194l/a360c突变的seqidno:8并且然后(δm1)g1)。观察到经解旋酶控制的rna/dna构建体穿过纳米孔的移动。材料和方法1.发夹连接将以下表18中列出的试剂混合并置于以下表19中程序的热循环仪装置上。然后使用agencourtampurespri珠以每μl样品1.8μlspri珠的比例对混合物进行纯化。纯化后,使用表20中的lifetechnologiessuperscriptii:试剂进行逆转录,根据厂商协议进行混合,并放置在表21中程序的热循环仪装置上。然后使用agencourtampurespri珠以每μl样品1.8μlspri珠的比例对混合物进行纯化。该样品被称为逆转录样品1。表18循环数量步骤温度(℃)时间1连接162:00:00表19表20循环数量步骤温度(℃)时间1逆转录420:50:002变性700:15:00表21随后,通过混合表22中列出的试剂并将混合物置于表23中程序的热循环仪装置上,将“非rna多核苷酸”(30个spc3间隔物连接到seqidno:69的5’末端,seqidno:69的3’末端连接到4个isp18间隔物的5’末端,4个isp18间隔物的3’末端连接到seqidno:70的5’末端,seqidno:70的3’末端连接到4个5-硝基吲哚的5’末端,4个5-硝基吲哚的3’末端连接到rna序列caaggg)与rna多核苷酸(其在以上步骤中进行逆转录)连接。然后,采用agencourtampurespri珠以每μl样品1.8μlspri珠的比例对混合物进行纯化。该样品称为连接样品1。表22循环数量步骤温度(℃)时间1连接164:00:00表23对以下表24中列出的试剂进行混合并在65℃下进行培养,然后以0.1℃/秒的速率进行冷却。该样品称为dna/rna构建体y。表24电生理学将dna/rna构建体y与2μl17.4μm的t4dda(e94c/f98w/c109a/c136a/k194l/a360c(具有e94c/f98w/c109a/c136a/k194l/a360c突变的seqidno:8并且然后(δm1)g1)培养20分钟。然后向培养过的混合物中添加2.1μl的800μmtmad,并在室温下保持10分钟。然后将该样品稀释到缓冲液(276μl的500mmkcl、25mm的磷酸钾;ph值为8.0)mgcl2(4μl,150mm)和atp(4μl,150mm)中,总体积为300μl。在缓冲液(25mm磷酸钾缓冲液、150mm亚铁氰化钾、150mm铁氰化钾;ph值为8.0)中,从插入嵌段共聚物的单个mspa纳米孔中获得电测量值。在实现单个孔插入嵌段共聚物中之后,然后将缓冲液(2ml,25mm磷酸钾缓冲液、150mm亚铁氰化钾、150mm铁氰化钾;ph值为8.0)流过系统以除去任何过量的mspa纳米孔。在添加dna/rna构建体y和解旋酶之前,将过量的缓冲液(500mmkcl、25mm磷酸钾;ph值为8.0)流过系统。最后,向纳米孔系统添加与dna/rna构建体y结合的t4dda(e94c/f98w/c109a/c136a/k194l/a360c(具有e94c/f98w/c109a/c136a/k194l/a360c突变并且然后(δm1)g1的seqidno:8)),在-140mv下进行实验,并且检测经解旋酶控制的dna移动。结果:本实施例示出了如何将非rna多核苷酸与rna(其已经进行过转录)连接以便负载dna解旋酶,t4dda(e94c/f98w/c109a/c136a/k194l/a360c(具有e94c/f98w/c109a/c136a/k194l/a360c突变的seqidno:8并且然后(δm1)g1),随后观察到解旋酶控制构建体移动。图9中示出了经t4dda(e94c/f98w/c109a/c136a/k194l/a360c(具有e94c/f98w/c109a/c136a/k194l/a360c突变的seqidno:8并且然后(δm1)g1))解旋酶控制的移动的示例。本发明的优选dda解旋酶的比对(seqidno:8至23)序列表<110>牛津纳米孔技术公司<120>经修饰的酶<130>n406654wo<150>gb1417712.5<151>2014-10-07<150>pct/gb2015/051291<151>2015-05-01<160>73<170>patentinversion3.5<210>1<211>552<212>dna<213>耻垢分枝杆菌(mycobacteriumsmegmatis)<400>1ggcctggataacgaacttagcctggtggacggccaagatcgcacgctgacggtgcaacaa60tgggataccttcctgaatggtgtgtttccgctggatcgtaaccgcctgacccgtgaatgg120tttcattccggtcgcgcaaaatatatcgtcgcaggcccgggtgctgacgaattcgaaggc180acgctggaactgggttatcagattggctttccgtggtcactgggcgttggtatcaacttc240tcgtacaccacgccgaatattctgatcgatgacggtgatattaccgcaccgccgtttggc300ctgaacagcgtgattacgccgaacctgtttccgggtgttagcatctctgccgatctgggc360aacggtccgggcattcaagaagtggcaacctttagtgtggacgtttccggcgctgaaggc420ggtgtcgcggtgtctaatgcccacggtaccgttacgggcgcggccggcggtgtcctgctg480cgtccgttcgcgcgcctgattgcgagcaccggcgactctgttacgacctatggcgaaccg540tggaatatgaac552<210>2<211>184<212>prt<213>耻垢分枝杆菌<400>2glyleuaspasngluleuserleuvalaspglyglnaspargthrleu151015thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp202530argasnargleuthrargglutrpphehisserglyargalalystyr354045ilevalalaglyproglyalaaspgluphegluglythrleugluleu505560glytyrglnileglypheprotrpserleuglyvalglyileasnphe65707580sertyrthrthrproasnileleuileaspaspglyaspilethrala859095propropheglyleuasnservalilethrproasnleupheprogly100105110valserileseralaaspleuglyasnglyproglyileglngluval115120125alathrpheservalaspvalserglyalagluglyglyvalalaval130135140serasnalahisglythrvalthrglyalaalaglyglyvalleuleu145150155160argprophealaargleuilealaserthrglyaspservalthrthr165170175tyrglygluprotrpasnmetasn180<210>3<211>885<212>dna<213>人工序列<220><223>α溶血素突变体(alpha-hemolysinmutant)(e111n/k147n)<400>3atggcagattctgatattaatattaaaaccggtactacagatattggaagcaatactaca60gtaaaaacaggtgatttagtcacttatgataaagaaaatggcatgcacaaaaaagtattt120tatagttttatcgatgataaaaatcacaataaaaaactgctagttattagaacaaaaggt180accattgctggtcaatatagagtttatagcgaagaaggtgctaacaaaagtggtttagcc240tggccttcagcctttaaggtacagttgcaactacctgataatgaagtagctcaaatatct300gattactatccaagaaattcgattgatacaaaaaactatatgagtactttaacttatgga360ttcaacggtaatgttactggtgatgatacaggaaaaattggcggccttattggtgcaaat420gtttcgattggtcatacactgaactatgttcaacctgatttcaaaacaattttagagagc480ccaactgataaaaaagtaggctggaaagtgatatttaacaatatggtgaatcaaaattgg540ggaccatacgatcgagattcttggaacccggtatatggcaatcaacttttcatgaaaact600agaaatggttctatgaaagcagcagataacttccttgatcctaacaaagcaagttctcta660ttatcttcagggttttcaccagacttcgctacagttattactatggatagaaaagcatcc720aaacaacaaacaaatatagatgtaatatacgaacgagttcgtgatgattaccaattgcat780tggacttcaacaaattggaaaggtaccaatactaaagataaatggacagatcgttcttca840gaaagatataaaatcgattgggaaaaagaagaaatgacaaattaa885<210>4<211>293<212>prt<213>人工序列<220><223>α溶血素突变体(e111n/k147n)<400>4alaaspseraspileasnilelysthrglythrthraspileglyser151015asnthrthrvallysthrglyaspleuvalthrtyrasplysgluasn202530glymethislyslysvalphetyrserpheileaspasplysasnhis354045asnlyslysleuleuvalileargthrlysglythrilealaglygln505560tyrargvaltyrserglugluglyalaasnlysserglyleualatrp65707580proseralaphelysvalglnleuglnleuproaspasngluvalala859095glnileserasptyrtyrproargasnserileaspthrlysasntyr100105110metserthrleuthrtyrglypheasnglyasnvalthrglyaspasp115120125thrglylysileglyglyleuileglyalaasnvalserileglyhis130135140thrleuasntyrvalglnproaspphelysthrileleugluserpro145150155160thrasplyslysvalglytrplysvalilepheasnasnmetvalasn165170175glnasntrpglyprotyraspargaspsertrpasnprovaltyrgly180185190asnglnleuphemetlysthrargasnglysermetlysalaalaasp195200205asnpheleuaspproasnlysalaserserleuleuserserglyphe210215220serproaspphealathrvalilethrmetasparglysalaserlys225230235240glnglnthrasnileaspvaliletyrgluargvalargaspasptyr245250255glnleuhistrpthrserthrasntrplysglythrasnthrlysasp260265270lystrpthraspargsersergluargtyrlysileasptrpglulys275280285gluglumetthrasn290<210>5<211>184<212>prt<213>耻垢分枝杆菌<400>5glyleuaspasngluleuserleuvalaspglyglnaspargthrleu151015thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp202530argasnargleuthrargglutrpphehisserglyargalalystyr354045ilevalalaglyproglyalaaspgluphegluglythrleugluleu505560glytyrglnileglypheprotrpserleuglyvalglyileasnphe65707580sertyrthrthrproasnileleuileaspaspglyaspilethrala859095propropheglyleuasnservalilethrproasnleupheprogly100105110valserileseralaaspleuglyasnglyproglyileglngluval115120125alathrpheservalaspvalserglyproalaglyglyvalalaval130135140serasnalahisglythrvalthrglyalaalaglyglyvalleuleu145150155160argprophealaargleuilealaserthrglyaspservalthrthr165170175tyrglygluprotrpasnmetasn180<210>6<211>184<212>prt<213>耻垢分枝杆菌<400>6glyleuaspasngluleuserleuvalaspglyglnaspargthrleu151015thrvalglnglntrpaspthrpheleuasnglyvalpheproleuasp202530argasnargleuthrargglutrpphehisserglyargalalystyr354045ilevalalaglyproglyalaaspgluphegluglythrleugluleu505560glytyrglnileglypheprotrpserleuglyvalglyileasnphe65707580sertyrthrthrproasnileleuileaspaspglyaspilethrgly859095propropheglyleugluservalilethrproasnleupheprogly100105110valserileseralaaspleuglyasnglyproglyileglngluval115120125alathrpheservalaspvalserglyproalaglyglyvalalaval130135140serasnalahisglythrvalthrglyalaalaglyglyvalleuleu145150155160argprophealaargleuilealaserthrglyaspservalthrthr165170175tyrglygluprotrpasnmetasn180<210>7<211>183<212>prt<213>耻垢分枝杆菌<400>7valaspasnglnleuservalvalaspglyglnglyargthrleuthr151015valglnglnalagluthrpheleuasnglyvalpheproleuasparg202530asnargleuthrargglutrpphehisserglyargalathrtyrhis354045valalaglyproglyalaaspgluphegluglythrleugluleugly505560tyrglnvalglypheprotrpserleuglyvalglyileasnpheser65707580tyrthrthrproasnileleuileaspglyglyaspilethrglnpro859095propheglyleuaspthrileilethrproasnleupheproglyval100105110serileseralaaspleuglyasnglyproglyileglngluvalala115120125thrpheservalaspvallysglyalalysglyalavalalavalser130135140asnalahisglythrvalthrglyalaalaglyglyvalleuleuarg145150155160prophealaargleuilealaserthrglyaspservalthrthrtyr165170175glygluprotrpasnmetasn180<210>8<211>439<212>prt<213>肠杆菌噬菌体t4(enterobacteriaphaget4)<400>8metthrpheaspaspleuthrgluglyglnlysasnalapheasnile151015valmetlysalailelysglulyslyshishisvalthrileasngly202530proalaglythrglylysthrthrleuthrlyspheileilegluala354045leuileserthrglygluthrglyileileleualaalaprothrhis505560alaalalyslysileleuserlysleuserglylysglualaserthr65707580ilehisserileleulysileasnprovalthrtyrglugluasnval859095leuphegluglnlysgluvalproaspleualalyscysargvalleu100105110ilecysaspgluvalsermettyrasparglysleuphelysileleu115120125leuserthrileproprotrpcysthrileileglyileglyaspasn130135140lysglnileargprovalaspproglygluasnthralatyrileser145150155160prophephethrhislysaspphetyrglncysgluleuthrgluval165170175lysargserasnalaproileileaspvalalathraspvalargasn180185190glylystrpiletyrasplysvalvalaspglyhisglyvalarggly195200205phethrglyaspthralaleuargaspphemetvalasntyrpheser210215220ilevallysserleuaspaspleuphegluasnargvalmetalaphe225230235240thrasnlysservalasplysleuasnserileilearglyslysile245250255phegluthrasplysasppheilevalglygluileilevalmetgln260265270gluproleuphelysthrtyrlysileaspglylysprovalserglu275280285ileilepheasnasnglyglnleuvalargileileglualaglutyr290295300thrserthrphevallysalaargglyvalproglyglutyrleuile305310315320arghistrpaspleuthrvalgluthrtyrglyaspaspglutyrtyr325330335argglulysilelysileileserseraspglugluleutyrlysphe340345350asnleupheleuglylysthralagluthrtyrlysasntrpasnlys355360365glyglylysalaprotrpseraspphetrpaspalalysserglnphe370375380serlysvallysalaleuproalaserthrphehislysalaglngly385390395400metservalaspargalapheiletyrthrprocysilehistyrala405410415aspvalgluleualaglnglnleuleutyrvalglyvalthrarggly420425430argtyraspvalphetyrval435<210>9<211>678<212>prt<213>海洋红嗜热盐菌(rhodothermusmarinus)<400>9metglugluleuserasngluglnglnargvalleuasphisvalleu151015alatrpleugluargasnaspalaproproilepheileleuthrgly202530seralaglythrglylysthrleuleuilearghisleuvalargala354045leuglnaspargargilehistyralaleualaalaprothrglyarg505560alaalaargileleusergluargthrglyasphisalaargthrleu65707580hisserleuiletyrilepheaspargtyrglnleuvalglugluala859095aspargglnthraspgluproleuserleuglnleuhisphealaleu100105110argseralagluhisaspalaargleuileilevalaspglualaser115120125metvalseraspthralaglygluglugluleutyrargpheglyser130135140glyargleuleuasnaspleuleuthrphealaargleuileprolys145150155160argaspargproprothrthrargleuleuphevalglyaspproala165170175glnleuproprovalglyglnservalserproalaleuseralagln180185190tyrleuargaspthrpheglyleuseralagluthralahisleuarg195200205servaltyrargglnarglysglyhisproileleugluthralathr210215220alaleuargasnalaleuglulysglyhistyrhisthrpheargleu225230235240progluglnproproaspleuargprovalglyleugluglualaile245250255gluthrthralathrasppheargargglnasnproservalleuleu260265270cysargthrasnalaleualaarglysleuasnalaalavalargala275280285argleutrpglyarggluglyleuproproglnproglyaspleuleu290295300leuvalasnargasnalaproleuhisglyleupheasnglyaspleu305310315320valleuvalgluthrvalglyproleugluhisargargvalglyarg325330335argglyargproprovalaspleutyrpheargaspvalgluleuleu340345350tyrprohisglulysproargasnargileargcyslysleuleuglu355360365asnleuleugluserproaspglyglnleuserproaspileilegln370375380alaleuleuileaspphetyrargarghisproserleulyshisgly385390395400serserglupheargleumetleualaasnaspalatyrpheasnala405410415leuhisvalargtyrglytyralametthrvalhislysalaglngly420425430glyglutrplysargalathrvalvalpheasnasptrparghisphe435440445arghisalagluphepheargtrpalatyrthralailethrargala450455460argglugluleuleuthrileglyalaproserpheglualaleuser465470475480aspmetargtrpglnproalaproservalproalaprogluglnala485490495alagluasnalathrargpheproleulysalaleugluthrtyrhis500505510glnargleuserglualaleuthralaalaglyilegluthrthrgly515520525valgluleuleuglntyralavalargtyrhisleualaargalaasp530535540argthrthrargileglntyrtyrtyrargglyaspglyglnileser545550555560argilevalthrleuglyglyalaaspaspprogluleuthrglngln565570575alatyralaleuphegluargileleusergluproproalaaspser580585590glygluleuprogluasnproleuleuargglupheleugluargala595600605hisleuargleugluglyserglyileargilevalhistrplysglu610615620metprotyralaleuargleutyrpheseralaaspglygluasnval625630635640thrileaspphetyrtyrasnargargglyvaltrpthrhisalagln645650655gluvalglyargserserserglyalaleuphealaargileglnser660665670leuleuglnalaaspser675<210>10<211>496<212>prt<213>蓝丝菌属(cyanothece)atcc51142<400>10metserglnservalvalvalproaspgluleuglygluileilethr151015alavalilegluphetyrglnaspalavalasplysilegluprolys202530ilevalpheleugluleuarglysasnvalvalasptrpvalserarg354045thrglnleulysilegluglulysgluileglnalathrglyleuthr505560argglnglnglnthralatyrlysglumetileasnpheilegluasn65707580sersergluglntyrpheargleuserglytyralaglythrglylys859095serpheleumetalalysvalileglutrpleulysglngluasptyr100105110lystyrservalalaalaprothrasnlysalaalalysasnleuthr115120125glnilealaargserglnglyilelysileglualathrthrvalala130135140lysleuleulysleuglnprothrileaspvalaspthrglyglngln145150155160serpheglupheasnserglulysgluleugluleulysasptyrasp165170175valileileileaspglutyrsermetleuasnlysaspasnphearg180185190aspleuglnglnalavallysglyglygluserlyspheilepheval195200205glyaspserserglnleuproprovallysglulysgluproileval210215220alaasnhisproaspilearglysseralaasnleuthrglnileval225230235240argtyraspglygluilevallysvalalagluserileargargasn245250255proargtrpasnhisglnthrtyrprophegluthrvalalaaspgly260265270thrileilelysleuasnthrgluasptrpleuglnglnalaleuser275280285hispheglulysgluasptrpleuserasnproasptyrvalargmet290295300ilethrtrpargasnlysthralaasplystyrasnglnalailearg305310315320glualaleutyrglygluasnvalgluglnleuvalvalglyasparg325330335leuilealalyslysprovalpheargserleuproglyglylyslys340345350lysglulyslysileileleuasnasnsergluglucyslysvalile355360365gluthrprolysileasntyrasnglulystyrlystrpgluphetyr370375380glnvallysvalargthraspgluglyglymetilegluleuargile385390395400leuthrserglusergluglulysargglnlyslysleulysgluleu405410415alalysargalaarggluglugluasntyrserglulyslyslysgln420425430trpalailetyrtyrgluleuaspgluleupheaspasnmetalatyr435440445alatyralaleuthrcyshislysalaglnglyserserileaspasn450455460valpheleuleuvalseraspmethistyrcysargasplysthrlys465470475480metiletyrthrglyleuthrargalalyslyscyscystyrvalgly485490495<210>11<211>421<212>prt<213>salinibacterruber<400>11metserthrphealaaspalaprophethrgluaspglnglugluala151015tyrasphisvaltyraspargleualaglnglygluargphethrgly202530leuargglytyralaglythrglylysthrtyrleuvalserargleu354045valgluglnleuleuaspgluaspcysthrvalthrvalcysalapro505560thrhislysalavalglnvalleuseraspgluleuglyaspalapro65707580valglnmetglnthrleuhisserpheleuglyleuargleuglnpro859095lysglnaspglyglutyrgluleuvalalagluglugluargasnphe100105110alagluglyvalvalilevalaspglualasermetileglyargglu115120125glutrpserhisileglnaspalaprophetrpvalglntrpleuphe130135140valglyaspproalaglnleuproprovalasngluaspproserpro145150155160alaleuaspvalproglyprothrleugluthrilehisargglnala165170175alaaspasnproileleugluleualathrlysileargthrglyala180185190aspglyargpheglyserthrphegluaspglylysglyvalalaval195200205thrargasnarggluglupheleuaspserileleuargalapheasp210215220alaaspalaphealagluaspalathrhisalaargvalleualatyr225230235240argasnlysthrvalargargtyrasnarggluileargalagluarg245250255tyrglyalaaspalaaspargphevalgluglyglutrpleuvalgly260265270thrgluthrtrptyrtyraspglyvalglnargleuthrasnserglu275280285gluvalargvallyslysalaglnvalgluthrpheglualaaspasp290295300glnserglutrpthrvaltrpgluleulysileargthrproglyarg305310315320glyleuthrargthrilehisvalleuhisgluglugluarggluarg325330335tyrgluasnalaleugluargargargglylysalagluaspasppro340345350serlystrpaspargphephegluleuarggluargphealaargval355360365asptyralatyralathrthrvalhisargalaglnglyserthrtyr370375380aspthrvalphevalasphisargaspleuargvalcysargglyglu385390395400gluargglyalaleuleutyrvalalavalthrargproserargarg405410415leualaleuleuval420<210>12<211>500<212>prt<213>sullfurimonasgotlandicagd1<400>12metlysileleuasnlysgluthrtyrlysleuserleuhisglnglu151015gluvalphethrglnilevalserglnleuaspthrlysvalserser202530ileleulysserthrasnilegluasptyrleuleuserleuthrgly354045proalaglythrglylysthrpheleuthrthrglnilealalystyr505560leuvalglulysarglysgluserglutyrprometserseraspphe65707580aspphethrilethralaprothrhislysalavalglyvalleuser859095lysleuleuarggluasnasnileglnsersercyslysthrilehis100105110serpheleuglyilelyspropheileasptyrthrthrglygluglu115120125lysphevalvalasplysthrasnlysarglysaspargthrserile130135140leuilevalaspglusersermetileglyasnthrleutyrglutyr145150155160ileleuglualailegluasplysargvalasnvalvalleupheile165170175glyaspprotyrglnleuleuproilegluasnserlysasngluile180185190tyraspleuproasnargphepheleusergluvalvalargglnala195200205gluasnsertyrileileargvalalathrlysleuarggluargile210215220lysasnglnasppheileserleuglnglnphepheglngluasnmet225230235240gluaspgluilethrphephehisasnlysglualapheleugluasp245250255phetyrlysglugluglutrptyrlysgluasnlysileleualathr260265270tyrlysasnlysaspvalaspalapheasnlysileileargasnlys275280285phetrpgluglnlysglyasnthrthrproserthrleuleualagly290295300aspmetileargphelysaspalatyrthrvalglyaspilethrile305310315320tyrhisasnglyglngluleuglnleuglyserthrgluvallystyr325330335hisaspserleuhisileglutyrtrpglucyslysseriletyrala340345350leugluglnglnvalpheargvalvalasnproaspserglualaval355360365pheasnglnlysleuglnserleualathrlysalalysglnalalys370375380pheproaspasnlyslysleutrplysleutyrtyrgluthrargasn385390395400metphealaasnvalglntyrilehisalaserthrilehislysleu405410415glnglyserthrtyraspvalsertyrileaspilepheserleuval420425430hisasnhistyrmetseraspgluglulystyrargleuleutyrval435440445alailethrargalaserlysaspilelysilephemetseralaphe450455460aspargthrseraspglulysvalileileasnasnglnasnserglu465470475480thrmetasnthrleulysglnleuhisaspileaspileileleulys485490495aspleuaspleu500<210>13<211>450<212>prt<213>弧菌噬菌体亨瑞特(vibriophagehenriette)12b8<400>13metalaaspphegluleuthrleuglyglnlysthrvalleuglyglu151015valileserthrileleulysprovalasnleuasnaspthrserarg202530phehisthrmethisglyproalaglyserglylysthrthrvalleu354045glnargileileserglnileproalatyrlysthrileglyphecys505560serprothrhislysservallysvalileargargmetalaargglu65707580alaglyileserhisargvalaspileargthrilehisseralaleu859095glyleuvalmetlysprovalargglyaspgluvalleuvallysglu100105110prophealaglugluargiletyraspvalleuileileaspgluala115120125glymetleuasnaspgluleuilemettyrileleugluserglnser130135140serlysvalilephevalglyaspmetcysglnileglyproilegln145150155160serasnleuproglugluaspglytyrthrprothrserthraspasp165170175valserlysvalphethrgluvalglumetmetseralaleuthrglu180185190valvalargglnalagluglyserproileileglnleualathrglu195200205pheargleualaglnaspaspiletyralaaspleuproargileval210215220thrasnthrthrproaspglyasnglyileilethrmetproasngly225230235240asntrpvalaspseralavalalaargpheglnseraspglnphelys245250255gluaspproasphiscysargilevalcystyrthrasnalametval260265270aspleucysasnaspleuvalarglysargleupheglyalaaspval275280285proglutrpleugluaspgluileleuvalalaglnglumetglyser290295300thrtrpasnasnalaaspgluleuargilevalserileaspasphis305310315320pheaspglnglntyrgluvalprocystrpargmetglnleugluser325330335valgluasphislysleuhisasnalaleuvalvallysglyasptyr340345350ilegluaspphelyspheargleuasnalailealagluargalaasn355360365thrasplysasnmetserglymethistrplysgluphetrpglymet370375380arglyslyspheasnthrphelysasnvaltyralaglythralahis385390395400lysserglnglyserthrpheasptyrthrtyrvalphethrproasp405410415phetyrlyspheglyalathrmetthrilelysargleuleutyrthr420425430alailethrargserargtyrthrthrtyrphealametasnthrgly435440445alagln450<210>14<211>421<212>prt<213>弧菌噬菌体(vibriophage)phi-pp2<400>14metglyleuthrasncysglnglnglyalametaspalapheleuglu151015seraspglyhismetthrileserglyproalaglyserglylysthr202530pheleumetlysserileleuglualaleugluserlysglylysasn354045valthrmetvalthrprothrhisglnalalysasnvalleuhislys505560alathrglyglngluvalserthrilehisserleuleulysilehis65707580proaspthrtyrgluaspglnlyshisphethrglnserglygluval859095gluglyleuaspgluileaspvalleuvalvalgluglualasermet100105110valaspglugluleupheglnilethrglyargthrmetproarglys115120125cysargileleualavalglyasplystyrglnleuglnprovallys130135140hisaspproglyvalileserprophephethrlysphethrthrphe145150155160glumetasngluvalvalargglnalalysaspasnproleuilegln165170175valalathrgluvalargasnglyglntrpleuargthrasntrpser180185190lysgluargargglnglyvalleuhisvalproasnvalasnlysmet195200205leuaspthrtyrleuserlysvalasnserprogluaspleuleuasp210215220tyrargileleualatyrthrasnaspcysvalaspthrpheasngly225230235240ileilearggluhisvaltyrasnthrserglupropheileprogly245250255glutyrleuvalthrglnmetprovalmetvalserasnglylystyr260265270provalcysvalilegluasnglygluvalvallysileleuaspval275280285argglnlysthrileaspglymetleuprolysvalaspasngluala290295300pheaspvalalavalleuthrvalglulysgluaspglyasnvaltyr305310315320gluphethrvalleutrpaspaspleuglnlysgluargphealaarg325330335tyrleuservalalaalaglythrtyrlyssermetargglyasnthr340345350lysargtyrtrpargalaphetrpglyleulysgluglnmetileglu355360365thrlysserleuglyalaserthrvalhislysserglnglythrthr370375380vallysglyvalcysleutyrthrglnaspmetglytyralaglupro385390395400gluileleuglnglnleuvaltyrvalglyleuthrargprothrasp405410415trpalaleutyrasn420<210>15<211>434<212>prt<213>气单胞菌属噬菌体(aeromonasphage)65<400>15metserglusergluilethrleuthrproserglnasnmetalaval151015asngluvallysasnglythrglyhisilethrileserglypropro202530glyserglylysthrpheleuvallystyrleuilelysmetleugly354045aspgluleuglythrvalleualaalaprothrhisglnalalysile505560valleuthrglumetserglyileglualacysthrilehisserleu65707580metlysilehisprogluthrleugluaspileglnilepheaspgln859095serlysleuproaspleuserasnileargtyrleuilevalgluglu100105110alasermethisserlysthrleuphelysilethrmetlysserile115120125proprothrcysargileilealaileglyasplysaspglnilegln130135140proglugluhisalaglnglygluleuserprotyrphethrasppro145150155160argpheserglnileargleuthraspilemetargglnserleuasp165170175asnproileileglnvalalathrlysilearggluglyglytrpile180185190gluproasntrpasnargaspthrlysthrglyvaltyrlysvalser195200205glyilethraspleuvalasnsertyrleuargalavallysthrpro210215220gluaspleuthrlystyrargpheleualatyrthrasnlysvalval225230235240asnlysvalasnserilevalarggluhisvaltyrlysthrlysleu245250255propheilegluglyglulysilevalleuglngluprovalmetval260265270gluhisgluaspaspthrilegluthrilephethrasnglygluval275280285valthrileasngluilegluvalpheaspargthrileargileasp290295300glyserprogluphelysvalasnalaalalysleuservalserser305310315320asptyrserglyilegluhisaspphecysvalleutyrglyserglu325330335serargleuglupheglutyrglnleusergluseralaglyasnile340345350lysglnmetglylysglyglyasnglnargseralatrplysserphe355360365trpalaalalyslysmetpheilegluthrlysserleuglyalaser370375380thrilehislysserglnglyserthrvallysglyvaltrpleuala385390395400leuhisaspilehistyralaaspglugluleulysglnglnleuval405410415tyrvalglyvalthrargprothraspphecysleutyrpheaspgly420425430thrlys<210>16<211>420<212>prt<213>气单胞菌属噬菌体cc2<400>16metalavalaspalavalglnserglythrglyhisilethrileser151015glyproproglyserglylysthrpheleuvallystyrileilelys202530metleuglyaspgluleuglythrvalleualaalaprothrhisgln354045alalysilevalleuthrglumetserglyileglualacysthrile505560hisserleumetlysilehisprogluthrleugluaspileglnile65707580pheaspglnserlysmetproaspleuserthrvalargtyrleuile859095ilegluglualasermethisserlysalaleupheasnilethrmet100105110lysserileproprothrcysargileilealaileglyasplysasp115120125glnileglnprovalasphisalaproglygluleuserprotyrphe130135140thraspserargphethrglnileargmetthraspilemetarggln145150155160serleuaspasnproileileglnvalalathrthrileargglugly165170175glytrpiletyrglnasntrpasnlysglulyslysserglyvaltyr180185190lysvallysserilethraspleuileasnsertyrleuargvalval195200205lysthrprogluaspleuthrlystyrargpheleualaphethrasn210215220lysvalvalasplysvalasnserilevalarglyshisvaltyrlys225230235240thraspleupropheilegluglyglulysleuvalleuglnglupro245250255valmetvalglutyraspaspaspthrilegluthrilephethrasn260265270glygluvalvalthrvalaspgluilegluvalseraspmetasnile275280285argileaspglyserproalapheserileservalalalysleulys290295300valthrserasppheserglyvalthrhisaspilemetservaltyr305310315320glygluaspserlysalaglupheasntyrglnleuserglualaala325330335alavalilelysglnmetglnargglyglnthrlysalaalatrpala340345350serphetrpaspalalyslysthrphethrgluthrlysserleugly355360365alacysthrilehislysserglnglyserthrvallysglyvaltrp370375380leuglyleuhisaspilesertyralaaspthraspleuglnglngln385390395400leuvaltyrvalglyvalthrargprothraspphecysleutyrphe405410415aspglyserlys420<210>17<211>443<212>prt<213>阪崎肠杆菌噬菌体(cronobacterphage)vbcsamgap161<400>17metsergluleuthrpheaspaspleuseraspaspglnlysserala151015hisaspargvalilehisasnileglnasnalailehisthrthrile202530thrglyglyproglyvalglylysthrthrleuvallysphevalphe354045asnthrleulysglyleuglyileserglyiletrpleuthralapro505560thrhisglnalalysasnvalleualaalaalathrglymetaspala65707580thrthrilehisseralaleulysileserprovalthrasngluglu859095leuargvalphegluglnglnlysglylyslysalaproaspleuser100105110thrcysargvalphevalvalglugluvalsermetvalaspmetasp115120125leupheargileileargargserileproserasnalavalileleu130135140glyleuglyasplysaspglnileargprovalasnalaaspglyarg145150155160valgluleuserprophepheaspglugluilepheaspvalilearg165170175metasplysilemetargglnalagluglyasnproileileglnval180185190serargalavalargaspglylysmetleulysprometservalgly195200205aspleuglyvalpheglnhisalaasnalavalasppheleuarggln210215220tyrpheargargvallysthrproaspaspleuilegluasnargmet225230235240phealatyrthrasnaspasnvalasplysleuasnalathrilearg245250255lyshisleutyrlysthrthrglupropheileleuaspgluvalile260265270valmetglngluproleuvalglnglumetargleuasnglyglnile275280285phethrgluilevaltyrasnasnasnglulysileargvalleuglu290295300ileileproargarggluvalilelysalaglulyscysaspglulys305310315320ilegluilegluphetyrleuleulysthrvalserleuglugluglu325330335thrglualaglnileglnvalvalvalaspprovalmetlysasparg340345350leuglyasntyrleualatyrvalalaserthrtyrlysargilelys355360365glnglnthrglytyrlysalaprotrphisserphetrpalailelys370375380asnlyspheglnaspvallysproleuprovalcysthrtyrhislys385390395400serglnglyserthrtyrasphisalatyrmettyrthrargaspala405410415tyralaphealaasptyraspleucyslysglnleuiletyrvalgly420425430valthrargalaargtyrthrvalasptyrval435440<210>18<211>442<212>prt<213>克雷伯氏菌噬菌体(klebsiellaphage)kp15<400>18metsergluleuthrpheaspaspleusergluaspglnlysasnala151015hisaspargvalilelysasnileargasnlysilehisthrthrile202530thrglyglyproglyvalglylysthrthrleuvallysphevalphe354045gluthrleulyslysleuglyileserglyiletrpleuthralapro505560thrhisglnalalysasnvalleuserglualavalglymetaspala65707580thrthrilehisseralaleulysileserprovalthrasngluglu859095leuargvalphegluglnglnlysglylyslysalaalaaspleuser100105110glucysargvalphevalvalglugluvalsermetvalasplysglu115120125leupheargileilelysargthrileprosercysalavalileleu130135140glyleuglyasplysaspglnileargprovalasnthrgluglyile145150155160thrgluleuserprophepheaspglugluilepheaspvalilearg165170175metasplysilemetargglnalagluglyasnproileileglnval180185190serargalaileargaspglylysproleumetproleumetasngly195200205gluleuglyvalmetlyshisgluasnalaserasppheleuargarg210215220tyrpheserargvallysthrproaspaspleuasnasnasnargmet225230235240phealatyrthrasnalaasnvalasplysleuasnalavalilearg245250255lyshisleutyrlysthraspglnpropheilevalglygluvalval260265270valmetglngluproleuvalthrgluglyargvalasnglyvalser275280285phevalgluvaliletyrasnasnasngluglnilelysileleuglu290295300ileileproargseraspthrilelysalaaspargcysaspproval305310315320glnileasptyrpheleumetlysthrglusermetphegluaspthr325330335lysalaaspileglnvalilealaaspprovalmetglngluargleu340345350glyasptyrleuasntyrvalalapheglntyrlyslysmetlysgln355360365gluthrglytyrlysalaprotrptyrserphetrpglnilelysasn370375380lyspheglnthrvallysalaleuprovalcysthrtyrhislysgly385390395400glnglyserthrtyrasphissertyrmettyrthrargaspalatyr405410415alatyralaasptyrgluleucyslysglnleuleutyrvalglythr420425430thrargalaargphethrvalasptyrval435440<210>19<211>438<212>prt<213>寡养单胞菌噬菌体(stenotrophomonasphage)ime13<400>19metvalthrtyraspaspleuthrvalglyglnlysaspalaileglu151015lysalaleuglnalametargthrlysarghisilethrilearggly202530proalaglyserglylysthrthrmetthrargpheleuleugluarg354045leupheglnthrglyglnglnglyilevalleuthralaprothrhis505560glnalalyslysgluleuserlyshisalaleuarglyssertyrthr65707580ileglnservalleulysileasnproserthrleuglugluasngln859095ilephegluglnlysglythrproasppheserlysthrargvalleu100105110ilecysaspgluvalserphetyrthrarglysleupheaspileleu115120125metargasnvalproserhiscysvalvalileglyileglyasplys130135140alaglnileargglyvalsergluaspaspthrhisgluleuserpro145150155160phephethraspasnargphegluglnvalgluleuthrgluvallys165170175arghisglnglyproileilegluvalalathraspileargasngly180185190lystrpiletyrglulysleuaspaspserglyasnglyvallysgln195200205phehisthrvallysasppheleuserlystyrphegluargthrlys210215220thrproasnaspleuleugluasnargilemetalatyrthrasnasn225230235240servalasplysleuasnservalilearglysglnleutyrglyala245250255asnalaalapropheleuproaspgluileleuvalmetglnglupro260265270leumetpheaspileaspileglyglyglnthrleulysgluvalile275280285pheasnasnglyglnasnvalargvalileasnvallysproserarg290295300lysthrleulysalalysglyvalglygluilegluvalglucysthr305310315320metleuglucysglusertyrglugluaspgluaspasptyrargarg325330335alatrpphethrvalvalhisaspglnasnthrglntyralaileasn340345350glupheleuserileilealaglulystyrargserarggluvalphe355360365proasntrplysaspphetrpalaileargasnthrphevallysval370375380argproleuglyalametthrphehislysserglnglyserthrphe385390395400aspasnalatyrleuphethrprocysleuhisglntyrcysargasp405410415proaspvalalaglngluleuiletyrvalglyasnthrargalaarg420425430lysasnvalcyspheval435<210>20<211>442<212>prt<213>不动杆菌噬菌体(acinetobacterphage)ac42<400>20metasnphegluaspleuthrgluglyglnlysasnalatyrthrala151015alailelysalailegluthrvalproserserseralaglulysarg202530hisleuthrileasnglyproalaglythrglylysthrthrleuthr354045lyspheleuilealagluleuileargargglygluargglyvaltyr505560leualaalaprothrhisglnalalyslysvalleuserglnhisala65707580glymetglualaserthrilehisserleuleulysileasnprothr859095thrtyrgluaspserthrthrphegluglnlysaspvalproaspmet100105110serglucysargvalleuilecysaspglualasermettyraspleu115120125lysleupheglnileleumetserserileproleucyscysthrval130135140ilealaleuglyaspilealaglnileargprovalgluproglyala145150155160phegluglyglnvalserprophephethrtyrglulyspheglugln165170175valserleuthrgluvalmetargserasnalaproileileaspval180185190alathrserileargthrglyasntrpiletyrgluasnvalileasp195200205glyalaglyvalhisasnleuthrsergluargservallysserphe210215220metglulystyrpheserilevallysthrprogluaspleupheglu225230235240asnargleuleualaphethrasnlysservalaspaspleuasnlys245250255ilevalarglyslysiletyrasnthrleuglupropheileaspgly260265270gluvalleuvalmetglngluproleuilelyssertyrthrtyrglu275280285glylyslysvalsergluilevalpheasnasnglyglumetvallys290295300valleucyscysserglnthrseraspgluileservalargglycys305310315320serthrlystyrmetvalargtyrtrpglnleuaspleuglnserleu325330335aspaspproaspleuthrglyserileasnvalilevalaspgluala340345350gluileasnlysleuasnleuvalleuglylysseralagluglnphe355360365lysserglyalavallysalaalatrpalaasptrptrplysleulys370375380argasnphehislysvallysalaleuprocysserthrilehislys385390395400serglnglythrservalaspasnvalpheleutyrthrprocysile405410415hislysalaaspserglnleualaglnglnleuleutyrvalglyala420425430thrargalaarghisasnvaltyrtyrile435440<210>21<211>442<212>prt<213>志贺氏杆菌噬菌体(shigellaphage)sp18<400>21metilelysphegluaspleuasnthrglyglnlysglualapheasp151015tyrilethrglualaileglnargargserglyglucysilethrleu202530asnglyproalaglythrglylysthrthrleuthrlysphevalile354045asphisleuvalargasnglyvalmetglyilevalleualaalapro505560thrhisglnalalyslysvalleuserlysleuserglyglnthrala65707580asnthrilehisserileleulysileasnprothrthrtyrgluasp859095glnasnilephegluglnargglumetproaspmetserlyscysasn100105110valleuvalcysaspglualasermettyraspglyserleuphelys115120125ileilecysasnservalproglutrpcysthrileleuglyilegly130135140aspmethisglnleuglnprovalaspproglyserthrglnglnlys145150155160ileserprophephethrhisprolysphelysglnilehisleuthr165170175gluvalmetargserasnalaproileilegluvalalathrgluile180185190argasnglyglytrppheargaspcysmettyraspglyhisglyval195200205glnglyphethrserglnthralaleulysaspphemetvalasntyr210215220pheglyilevallysaspalaaspmetleumetgluasnargmettyr225230235240alatyrthrasnlysservalglulysleuasnasnileileargarg245250255lysleutyrgluthrasplysalapheleuprotyrgluvalleuval260265270metglngluprohismetlysgluleugluphegluglylyslysphe275280285sergluthrilepheasnasnglyglnleuvalargilelysaspcys290295300lystyrthrserthrileleuargcyslysglygluserhisglnleu305310315320valileasntyrtrpaspleugluvalgluserileaspgluaspglu325330335glutyrglnvalaspargilelysvalleuprogluaspglnglnpro340345350lyspheglnalatyrleualalysvalalaaspthrtyrlysglnmet355360365lysalaalaglylysargproglutrplysaspphetrplysalaarg370375380argthrpheleulysvalargalaleuprovalserthrilehislys385390395400alaglnglyvalservalasplysalapheiletyrthrprocysile405410415hismetalaglualaserleualaserglnleualatyrvalglyile420425430thrargalaargtyraspalatyrtyrval435440<210>22<211>439<212>prt<213>耶尔森氏菌噬菌体(yersiniaphage)phir1-rt<400>22metilethrtyraspaspleuthraspglyglnlysseralapheasp151015asnthrmetglualailelysasnlyslysglyhisilethrileasn202530glyproalaglythrglylysthrthrleuthrlyspheileileasp354045hisleuilelysthrglyglualaglyileileleucysalaprothr505560hisglnalalyslysvalleuserlysleuserglymetaspalaser65707580thrilehisservalleulysileasnprothrthrtyrglugluasn859095glnilephegluglnarggluvalproaspleualaalacysargval100105110leuilecysaspglualaserphetyrasparglysleupheglyile115120125ileleualathrvalprosertrpcysthrvalilealaleuglyasp130135140lysaspglnleuargprovalthrproglyglusergluglnglnleu145150155160serprophepheserhisalalysphelysglnvalhisleuthrglu165170175ilelysargserasnglyproileileglnvalalathraspilearg180185190asnglyglytrpleusergluasnilevalaspglygluglyvalhis195200205alapheasnserasnthralaleulysaspphemetileargtyrphe210215220aspvalvallysthralaaspaspleuilegluserargmetleuala225230235240tyrthrasnlysservalasplysleuasnglyileileargarglys245250255leutyrgluthrasplyspropheileasnglygluvalleuvalmet260265270glngluproleumetlysgluleuglupheaspglylyslysphehis275280285gluilevalpheasnasnglyglnleuvallysileleutyralaser290295300gluthrserthrpheileseralaargasnvalproglyglutyrmet305310315320ileargtyrtrpasnleugluvalgluthralaaspseraspaspasp325330335tyralathrserglnileglnvalilecysaspproalaglumetthr340345350lyspheglnmetpheleualalysthralaaspthrtyrlysasnser355360365glyvallysalatyrtrplysaspphetrpservallysasnlysphe370375380lyslysvallysalaleuprovalserthrilehislysserglngly385390395400cysthrvalasnasnthrpheleutyrthrprocysilehismetala405410415aspalaglnleualalysglnleuleutyrvalglyalathrargala420425430argthrasnleutyrtyrile435<210>23<211>441<212>prt<213>沙门氏菌噬菌体(salmonellaphage)s16<400>23metilethrphegluglnleuthrserglyglnlysleualapheasp151015gluthrileargalailelysglulyslysasnhisvalthrileasn202530glyproalaglythrglylysthrthrleuthrlyspheilemetglu354045hisleuvalserthrglygluthrglyileileleuthralaprothr505560hisalaalalyslysvalleuthrlysleuserglymetglualaasn65707580thrilehislysileleulysileasnprothrthrtyrglugluser859095metleuphegluglnlysgluvalproaspleualasercysargval100105110leuilecysaspglualasermettrpasparglysleuphelysile115120125leumetalaserileprolystrpcysthrilevalalaileglyasp130135140valalaglnileargprovalaspproglygluthrglualahisile145150155160serprophepheilehislysaspphelysglnleuasnleuthrglu165170175valmetargserasnalaproileileaspvalalathraspilearg180185190asnglysertrpiletyrglulysthrvalaspglyhisglyvalhis195200205glyphethrserthrthralaleulysaspphemetmetglntyrphe210215220serilevallysserprogluaspleuphegluasnargmetleuala225230235240phethrasnlysservalasplysleuasnserileileargargarg245250255leutyrglnthrgluglualaphevalvalglygluvalilevalmet260265270glngluproleumetarggluleuvalphegluglylyslysphehis275280285gluthrleuphethrasnglyglntyrvalargileleuseralaasp290295300tyrthrserserpheleuglyalalysglyvalserglygluhisleu305310315320ilearghistrpvalleuaspvalgluthrtyraspaspgluglutyr325330335alaargglulysileasnvalileseraspgluglnglumetasnlys340345350pheglnphepheleualalysthralaaspthrtyrlysasntrpasn355360365lysglyglylysalaprotrpsergluphetrpaspalalysarglys370375380phehislysvallysalaleuprocysserthrphehislysalagln385390395400glyileservalaspserserpheiletyrthrprocysilehisval405410415serseraspasnlysphelysleugluleuleutyrvalglyalathr420425430argglyarghisaspvalphepheval435440<210>24<211>65<212>prt<213>人工序列<220><223>优选的hhh域.<400>24glythrglyserglyalatrplysglutrpleugluarglysvalgly151015gluglyargalaargargleuileglutyrpheglyseralaglyglu202530valglylysleuvalgluasnalagluvalserlysleuleugluval354045proglyileglyaspglualavalalaargleuvalproglyglyser505560ser65<210>25<211>299<212>prt<213>细菌噬菌体(bacteriophage)rb69<400>25metphelysarglysserthralaaspleualaalaglnmetalalys151015leuasnglyasnlysglyphesersergluasplysglyglutrplys202530leulysleuaspalaserglyasnglyglnalavalileargpheleu354045proalalysthraspaspalaleuprophealaileleuvalasnhis505560glyphelyslysasnglylystrptyrilegluthrcysserserthr65707580hisglyasptyraspsercysprovalcysglntyrileserlysasn859095aspleutyrasnthrasnlysthrglutyrserglnleulysarglys100105110thrsertyrtrpalaasnileleuvalvallysaspproglnalapro115120125aspasngluglylysvalphelystyrargpheglylyslysiletrp130135140asplysileasnalametilealavalaspthrglumetglygluthr145150155160provalaspvalthrcysprotrpgluglyalaasnphevalleulys165170175vallysglnvalserglypheserasntyraspgluserlyspheleu180185190asnglnseralaileproasnileaspaspgluserpheglnlysglu195200205leuphegluglnmetvalaspleuserglumetthrserlysasplys210215220phelysserpheglugluleuasnthrlyspheasnglnvalleugly225230235240thralaalaleuglyglyalaalaalaalaalaalaservalalaasp245250255lysvalalaseraspleuaspasppheasplysaspmetglualaphe260265270serseralalysthrgluaspaspphemetserserserserserasp275280285aspglyaspleuaspaspleuleualaglyleu290295<210>26<211>232<212>prt<213>细菌噬菌体(bacteriophage)t7<400>26metalalyslysilephethrseralaleuglythralagluprotyr151015alatyrilealalysproasptyrglyasnglugluargglyphegly202530asnproargglyvaltyrlysvalaspleuthrileproasnlysasp354045proargcysglnargmetvalaspgluilevallyscyshisgluglu505560alatyralaalaalavalgluglutyrglualaasnproproalaval65707580alaargglylyslysproleulysprotyrgluglyaspmetprophe859095pheaspasnglyaspglythrthrthrphelysphelyscystyrala100105110serpheglnasplyslysthrlysgluthrlyshisileasnleuval115120125valvalaspserlysglylyslysmetgluaspvalproileilegly130135140glyglyserlysleulysvallystyrserleuvalprotyrlystrp145150155160asnthralavalglyalaservallysleuglnleugluservalmet165170175leuvalgluleualathrpheglyglyglygluaspasptrpalaasp180185190gluvalglugluasnglytyrvalalaserglyseralalysalaser195200205lysproargaspgluglusertrpaspgluaspaspglugluserglu210215220glualaaspgluaspglyaspphe225230<210>27<211>324<212>prt<213>疱疹病毒(herpesvirus)1<400>27metaspserproglyglyvalalaproalaserprovalgluaspala151015seraspalaserleuglyglnproglugluglyalaprocysglnval202530valleuglnglyalagluleuasnglyileleuglnalaphealapro354045leuargthrserleuleuaspserleuleuvalmetglyasparggly505560ileleuilehisasnthrilepheglygluglnvalpheleuproleu65707580gluhisserglnpheserargtyrargtrpargglyprothralaala859095pheleuserleuvalaspglnlysargserleuleuservalphearg100105110alaasnglntyrproaspleuargargvalgluleualailethrgly115120125glnalapropheargthrleuvalglnargiletrpthrthrthrser130135140aspglyglualavalgluleualasergluthrleumetlysargglu145150155160leuthrserphevalvalleuvalproglnglythrproaspvalgln165170175leuargleuthrargproglnleuthrlysvalleuasnalathrgly180185190alaaspseralathrprothrthrphegluleuglyvalasnglylys195200205pheservalphethrthrserthrcysvalthrphealaalaargglu210215220gluglyvalserserserthrserthrglnvalglnileleuserasn225230235240alaleuthrlysalaglyglnalaalaalaasnalalysthrvaltyr245250255glygluasnthrhisargthrpheservalvalvalaspaspcysser260265270metargalavalleuargargleuglnvalglyglyglythrleulys275280285phepheleuthrthrprovalproserleucysvalthralathrgly290295300proasnalavalseralavalpheleuleulysproglnlyshishis305310315320hishishishis<210>28<211>251<212>prt<213>人工序列<220><223>pcna的亚基1.<400>28metphelysilevaltyrproasnalalysaspphepheserpheile151015asnserilethrasnvalthraspserileileleuasnphethrglu202530aspglyilepheserarghisleuthrgluasplysvalleumetala354045ilemetargileprolysaspvalleuserglutyrserileaspser505560prothrservallysleuaspvalserservallyslysileleuser65707580lysalaserserlyslysalathrilegluleuthrgluthraspser859095glyleulysileileileargaspglulysserglyalalysserthr100105110iletyrilelysalaglulysglyglnvalgluglnleuthrglupro115120125lysvalasnleualavalasnphethrthraspgluservalleuasn130135140valilealaalaaspvalthrleuvalglygluglumetargileser145150155160thrglugluasplysilelysileglualaglyglugluglylysarg165170175tyrvalalapheleumetlysasplysproleulysgluleuserile180185190aspthrseralasersersertyrseralaglumetphelysaspala195200205vallysglyleuargglypheseralaprothrmetvalserphegly210215220gluasnleuprometlysileaspvalglualavalserglyglyhis225230235240metilephetrpilealaproargleuleuglu245250<210>29<211>245<212>prt<213>人工序列<220><223>pcna的亚基2.<400>29metlysalalysvalileaspalavalserphesertyrileleuarg151015thrvalglyasppheleuserglualaasnpheilevalthrlysglu202530glyileargvalserglyileaspproserargvalvalpheleuasp354045ilepheleuprosersertyrphegluglyphegluvalserglnglu505560lysgluileileglyphelysleugluaspvalasnaspileleulys65707580argvalleulysaspaspthrleuileleuserserasngluserlys859095leuthrleuthrpheaspglygluphethrargserphegluleupro100105110leuileglnvalgluserthrglnproproservalasnleugluphe115120125prophelysalaglnleuleuthrilethrphealaaspileileasp130135140gluleuseraspleuglygluvalleuasnilehisserlysgluasn145150155160lysleutyrphegluvalileglyaspleuserthralalysvalglu165170175leuserthraspasnglythrleuleuglualaserglyalaaspval180185190sersersertyrglymetglutyrvalalaasnthrthrlysmetarg195200205argalaseraspsermetgluleutyrpheglyserglnileproleu210215220lysleuargphelysleuproglngluglytyrglyaspphetyrile225230235240alaproargalaasp245<210>30<211>246<212>prt<213>人工序列<220><223>pcna的亚基3.<400>30metlysvalvaltyraspaspvalargvalleulysaspileilegln151015alaleualaargleuvalaspglualavalleulysphelysglnasp202530servalgluleuvalalaleuaspargalahisileserleuileser354045valasnleuproargglumetphelysglutyraspvalasnaspglu505560phelyspheglypheasnthrglntyrleumetlysileleulysval65707580alalysarglysglualailegluilealasergluserproaspser859095valileileasnileileglyserthrasnargglupheasnvalarg100105110asnleugluvalsergluglngluileprogluileasnleuglnphe115120125aspileseralathrileserseraspglyphelysseralaileser130135140gluvalserthrvalthraspasnvalvalvalgluglyhisgluasp145150155160argileleuilelysalagluglyglusergluvalgluvalgluphe165170175serlysaspthrglyglyleuglnaspleuglupheserlysgluser180185190lysasnsertyrseralaglutyrleuaspaspvalleuserleuthr195200205lysleuserasptyrvallysileserpheglyasnglnlysproleu210215220glnleuphepheasnmetgluglyglyglylysvalthrtyrleuleu225230235240alaprolysvalleuglu245<210>31<211>608<212>prt<213>枯草芽孢杆菌噬菌体(bacillussubtilisphage)phi29<400>31metlyshismetproarglysmettyrsercysalaphegluthrthr151015thrlysvalgluaspcysargvaltrpalatyrglytyrmetasnile202530gluasphisserglutyrlysileglyasnserleuaspgluphemet354045alatrpvalleulysvalglnalaaspleutyrphehisasnleulys505560pheaspglyalapheileileasntrpleugluargasnglyphelys65707580trpseralaaspglyleuproasnthrtyrasnthrileileserarg859095metglyglntrptyrmetileaspilecysleuglytyrlysglylys100105110arglysilehisthrvaliletyraspserleulyslysleuprophe115120125provallyslysilealalysaspphelysleuthrvalleulysgly130135140aspileasptyrhislysgluargprovalglytyrlysilethrpro145150155160gluglutyralatyrilelysasnaspileglnileilealagluala165170175leuleuileglnphelysglnglyleuaspargmetthralaglyser180185190aspserleulysglyphelysaspileilethrthrlyslysphelys195200205lysvalpheprothrleuserleuglyleuasplysgluvalargtyr210215220alatyrargglyglyphethrtrpleuasnaspargphelysglulys225230235240gluileglygluglymetvalpheaspvalasnserleutyrproala245250255glnmettyrserargleuleuprotyrglygluproilevalpheglu260265270glylystyrvaltrpaspgluasptyrproleuhisileglnhisile275280285argcysgluphegluleulysgluglytyrileprothrileglnile290295300lysargserargphetyrlysglyasnglutyrleulyssersergly305310315320glygluilealaaspleutrpleuserasnvalaspleugluleumet325330335lysgluhistyraspleutyrasnvalglutyrileserglyleulys340345350phelysalathrthrglyleuphelysasppheileasplystrpthr355360365tyrilelysthrthrsergluglyalailelysglnleualalysleu370375380metleuasnserleutyrglylysphealaserasnproaspvalthr385390395400glylysvalprotyrleulysgluasnglyalaleuglypheargleu405410415glygluglugluthrlysaspprovaltyrthrprometglyvalphe420425430ilethralatrpalaargtyrthrthrilethralaalaglnalacys435440445tyraspargileiletyrcysaspthraspserilehisleuthrgly450455460thrgluileproaspvalilelysaspilevalaspprolyslysleu465470475480glytyrtrpalahisgluserthrphelysargalalystyrleuarg485490495glnlysthrtyrileglnaspiletyrmetlysgluvalaspglylys500505510leuvalgluglyserproaspasptyrthraspilelyspheserval515520525lyscysalaglymetthrasplysilelyslysgluvalthrpheglu530535540asnphelysvalglypheserarglysmetlysprolysprovalgln545550555560valproglyglyvalvalleuvalaspaspthrphethrilelysser565570575glyglyseralatrpserhisproglnpheglulysglyglyglyser580585590glyglyglyserglyglyseralatrpserhisproglnpheglulys595600605<210>32<211>318<212>prt<213>疱疹病毒1<400>32thraspserproglyglyvalalaproalaserprovalgluaspala151015seraspalaserleuglyglnproglugluglyalaprocysglnval202530valleuglnglyalagluleuasnglyileleuglnalaphealapro354045leuargthrserleuleuaspserleuleuvalmetglyasparggly505560ileleuilehisasnthrilepheglygluglnvalpheleuproleu65707580gluhisserglnpheserargtyrargtrpargglyprothralaala859095pheleuserleuvalaspglnlysargserleuleuservalphearg100105110alaasnglntyrproaspleuargargvalgluleualailethrgly115120125glnalapropheargthrleuvalglnargiletrpthrthrthrser130135140aspglyglualavalgluleualasergluthrleumetlysargglu145150155160leuthrserphevalvalleuvalproglnglythrproaspvalgln165170175leuargleuthrargproglnleuthrlysvalleuasnalathrgly180185190alaaspseralathrprothrthrphegluleuglyvalasnglylys195200205pheservalphethrthrserthrcysvalthrphealaalaargglu210215220gluglyvalserserserthrserthrglnvalglnileleuserasn225230235240alaleuthrlysalaglyglnalaalaalaasnalalysthrvaltyr245250255glygluasnthrhisargthrpheservalvalvalaspaspcysser260265270metargalavalleuargargleuglnvalglyglyglythrleulys275280285phepheleuthrthrprovalproserleucysvalthralathrgly290295300proasnalavalseralavalpheleuleulysproglnlys305310315<210>33<211>233<212>prt<213>细菌噬菌体rb69<400>33lysglyphesersergluasplysglyglutrplysleulysleuasp151015alaserglyasnglyglnalavalileargpheleuproalalysthr202530aspaspalaleuprophealaileleuvalasnhisglyphelyslys354045asnglylystrptyrilegluthrcysserserthrhisglyasptyr505560aspsercysprovalcysglntyrileserlysasnaspleutyrasn65707580thrasnlysthrglutyrserglnleulysarglysthrsertyrtrp859095alaasnileleuvalvallysaspproglnalaproaspasnglugly100105110lysvalphelystyrargpheglylyslysiletrpasplysileasn115120125alametilealavalaspthrglumetglygluthrprovalaspval130135140thrcysprotrpgluglyalaasnphevalleulysvallysglnval145150155160serglypheserasntyraspgluserlyspheleuasnglnserala165170175ileproasnileaspaspgluserpheglnlysgluleupheglugln180185190metvalaspleuserglumetthrserlysasplysphelysserphe195200205glugluleuasnthrlyspheasnglnvalleuglythralaalaleu210215220glyglyalaalaalaalaalaalaser225230<210>34<211>210<212>prt<213>细菌噬菌体t7<400>34alalyslysilephethrseralaleuglythralagluprotyrala151015tyrilealalysproasptyrglyasnglugluargglypheglyasn202530proargglyvaltyrlysvalaspleuthrileproasnlysasppro354045argcysglnargmetvalaspgluilevallyscyshisglugluala505560tyralaalaalavalgluglutyrglualaasnproproalavalala65707580argglylyslysproleulysprotyrgluglyaspmetprophephe859095aspasnglyaspglythrthrthrphelysphelyscystyralaser100105110pheglnasplyslysthrlysgluthrlyshisileasnleuvalval115120125valaspserlysglylyslysmetgluaspvalproileileglygly130135140glyserlysleulysvallystyrserleuvalprotyrlystrpasn145150155160thralavalglyalaservallysleuglnleugluservalmetleu165170175valgluleualathrpheglyglyglygluaspasptrpalaaspglu180185190valglugluasnglytyrvalalaserglyseralalysalaserlys195200205proarg210<210>35<211>99<212>prt<213>嗜冷嗜盐菌(halorubrumlacusprofundi)<400>35serglyglugluleuleuaspleualaglyvalargasnvalglyarg151015lysargalaargargleupheglualaglyilegluthrargalaasp202530leuargglualaasplysalavalvalleuglyalaleuargglyarg354045gluargthralagluargileleugluhisalaglyarggluasppro505560sermetaspaspvalargproasplysseralaseralaalaalathr65707580alaglyseralaseraspgluaspglygluglyglnalaserleugly859095aspphearg<210>36<211>102<212>prt<213>富盐菌(haloferaxvolcanii)<400>36serglyglugluleuleuaspleualaglyvalargglyvalglyarg151015lysargalaargargleupheglualaglyvalgluthrargalaasp202530leuargglualaasplysproargvalleualaalaleuargglyarg354045arglysthralagluasnileleuglualaalaglyarglysasppro505560sermetaspalavalaspgluaspaspalaproaspaspalavalpro65707580aspaspalaglyphegluthralalysgluargalaaspglnglnala859095serleuglyasppheglu100<210>37<211>55<212>prt<213>人工序列<220><223>(hhh)2域.<400>37trplysglutrpleugluarglysvalglygluglyargalaargarg151015leuileglutyrpheglyseralaglygluvalglylysleuvalglu202530asnalagluvalserlysleuleugluvalproglyileglyaspglu354045alavalalaargleuvalpro5055<210>38<211>107<212>prt<213>人工序列<220><223>(hhh)2-(hhh)2域.<400>38trplysglutrpleugluarglysvalglygluglyargalaargarg151015leuileglutyrpheglyseralaglygluvalglylysleuvalglu202530asnalagluvalserlysleuleugluvalproglyileglyaspglu354045alavalalaargleuvalproglytyrlysthrleuargaspalagly505560leuthrproalaglualagluargvalleulysargtyrglyserval65707580serlysvalglngluglyalathrproaspgluleuarggluleugly859095leuglyaspalalysilealaargileleugly100105<210>39<211>132<212>prt<213>智人(homosapiens)<400>39glusergluthrthrthrserleuvalleugluargserleuasnarg151015valhisleuleuglyargvalglyglnaspprovalleuargglnval202530gluglylysasnprovalthrilepheserleualathrasnglumet354045trpargserglyaspsergluvaltyrglnleuglyaspvalsergln505560lysthrthrtrphisargileservalpheargproglyleuargasp65707580valalatyrglntyrvallyslysglyserargiletyrleuglugly859095lysileasptyrglyglutyrmetasplysasnasnvalargarggln100105110alathrthrileilealaaspasnileilepheleuseraspglnthr115120125lysglulysglu130<210>40<211>123<212>prt<213>枯草芽孢杆菌噬菌体(bacillussubtilisphage)phi29<400>40gluasnthrasnilevallysalathrpheaspthrgluthrleuglu151015glyglnilelysilepheasnalaglnthrglyglyglyglnserphe202530lysasnleuproaspglythrileileglualaasnalailealagln354045tyrlysglnvalseraspthrtyrglyaspalalysglugluthrval505560thrthrilephealaalaaspglyserleutyrseralaileserlys65707580thrvalalaglualaalaseraspleuileaspleuvalthrarghis859095lysleugluthrphelysvallysvalvalglnglythrserserlys100105110glyasnvalphepheserleuglnleuserleu115120<210>41<211>177<212>prt<213>大肠杆菌(escherichiacoli)<400>41alaserargglyvalasnlysvalileleuvalglyasnleuglygln151015aspprogluvalargtyrmetproasnglyglyalavalalaasnile202530thrleualathrserglusertrpargasplysalathrglyglumet354045lysgluglnthrglutrphisargvalvalleupheglylysleuala505560gluvalalaserglutyrleuarglysglyserglnvaltyrileglu65707580glyglnleuargthrarglystrpthraspglnserglyglnasparg859095tyrthrthrgluvalvalvalasnvalglyglythrmetglnmetleu100105110glyglyargglnglyglyglyalaproalaglyglyasnileglygly115120125glyglnproglnglyglytrpglyglnproglnglnproglnglygly130135140asnglnpheserglyglyalaglnserargproglnglnseralapro145150155160alaalaproserasngluproprometasppheaspaspaspilepro165170175phe<210>42<211>301<212>prt<213>肠杆菌噬菌体t4<400>42metphelysarglysserthralagluleualaalaglnmetalalys151015leuasnglyasnlysglyphesersergluasplysglyglutrplys202530leulysleuaspasnalaglyasnglyglnalavalileargpheleu354045proserlysasnaspgluglnalaprophealaileleuvalasnhis505560glyphelyslysasnglylystrptyrilegluthrcysserserthr65707580hisglyasptyraspsercysprovalcysglntyrileserlysasn859095aspleutyrasnthraspasnlysglutyrserleuvallysarglys100105110thrsertyrtrpalaasnileleuvalvallysaspproalaalapro115120125gluasngluglylysvalphelystyrargpheglylyslysiletrp130135140asplysileasnalametilealavalaspvalglumetglygluthr145150155160provalaspvalthrcysprotrpgluglyalaasnphevalleulys165170175vallysglnvalserglypheserasntyraspgluserlyspheleu180185190asnglnseralaileproasnileaspaspgluserpheglnlysglu195200205leuphegluglnmetvalaspleuserglumetthrserlysasplys210215220phelysserpheglugluleuasnthrlyspheglyglnvalmetgly225230235240thralavalmetglyglyalaalaalathralaalalyslysalaasp245250255lysvalalaaspaspleuaspalapheasnvalaspasppheasnthr260265270lysthrgluaspaspphemetserserserserglyserserserser275280285alaaspaspthraspleuaspaspleuleuasnaspleu290295300<210>43<211>177<212>prt<213>人工序列<220><223>ecossb-cterala<400>43alaserargglyvalasnlysvalileleuvalglyasnleuglygln151015aspprogluvalargtyrmetproasnglyglyalavalalaasnile202530thrleualathrserglusertrpargasplysalathrglyglumet354045lysgluglnthrglutrphisargvalvalleupheglylysleuala505560gluvalalaserglutyrleuarglysglyserglnvaltyrileglu65707580glyglnleuargthrarglystrpthraspglnserglyglnasparg859095tyrthrthrgluvalvalvalasnvalglyglythrmetglnmetleu100105110glyglyargglnglyglyglyalaproalaglyglyasnileglygly115120125glyglnproglnglyglytrpglyglnproglnglnproglnglygly130135140asnglnpheserglyglyalaglnserargproglnglnseralapro145150155160alaalaproserasngluproprometalaphealaalaalailepro165170175phe<210>44<211>177<212>prt<213>人工序列<220><223>ecossb-cternggn<400>44alaserargglyvalasnlysvalileleuvalglyasnleuglygln151015aspprogluvalargtyrmetproasnglyglyalavalalaasnile202530thrleualathrserglusertrpargasplysalathrglyglumet354045lysgluglnthrglutrphisargvalvalleupheglylysleuala505560gluvalalaserglutyrleuarglysglyserglnvaltyrileglu65707580glyglnleuargthrarglystrpthraspglnserglyglnasparg859095tyrthrthrgluvalvalvalasnvalglyglythrmetglnmetleu100105110glyglyargglnglyglyglyalaproalaglyglyasnileglygly115120125glyglnproglnglyglytrpglyglnproglnglnproglnglygly130135140asnglnpheserglyglyalaglnserargproglnglnseralapro145150155160alaalaproserasngluproprometasnpheglyglyasnilepro165170175phe<210>45<211>152<212>prt<213>人工序列<220><223>ecossb-q152del<400>45alaserargglyvalasnlysvalileleuvalglyasnleuglygln151015aspprogluvalargtyrmetproasnglyglyalavalalaasnile202530thrleualathrserglusertrpargasplysalathrglyglumet354045lysgluglnthrglutrphisargvalvalleupheglylysleuala505560gluvalalaserglutyrleuarglysglyserglnvaltyrileglu65707580glyglnleuargthrarglystrpthraspglnserglyglnasparg859095tyrthrthrgluvalvalvalasnvalglyglythrmetglnmetleu100105110glyglyargglnglyglyglyalaproalaglyglyasnileglygly115120125glyglnproglnglyglytrpglyglnproglnglnproglnglygly130135140asnglnpheserglyglyalagln145150<210>46<211>117<212>prt<213>人工序列<220><223>ecossb-g117del<400>46alaserargglyvalasnlysvalileleuvalglyasnleuglygln151015aspprogluvalargtyrmetproasnglyglyalavalalaasnile202530thrleualathrserglusertrpargasplysalathrglyglumet354045lysgluglnthrglutrphisargvalvalleupheglylysleuala505560gluvalalaserglutyrleuarglysglyserglnvaltyrileglu65707580glyglnleuargthrarglystrpthraspglnserglyglnasparg859095tyrthrthrgluvalvalvalasnvalglyglythrmetglnmetleu100105110glyglyargglngly115<210>47<211>984<212>prt<213>如甲烷嗜热菌(methanopyruskandleri)<400>47metalaleuvaltyraspalagluphevalglysergluarggluphe151015gluglugluarggluthrpheleulysglyvallysalatyraspgly202530valleualathrargtyrleumetgluargserserseralalysasn354045aspglugluleuleugluleuhisglnasnpheileleuleuthrgly505560sertyralacysserileaspprothrgluaspargtyrglnasnval65707580ilevalargglyvalasnpheaspgluargvalglnargleuserthr859095glyglyserproalaargtyralailevaltyrargargglytrparg100105110alailealalysalaleuaspileaspglugluaspvalproalaile115120125gluvalargalavallysargasnproleuglnproalaleutyrarg130135140ileleuvalargtyrglyargvalaspleumetprovalthrvalasp145150155160gluvalproproglumetalaglygluphegluargleuilegluarg165170175tyraspvalproileaspglulysglugluargileleugluileleu180185190arggluasnprotrpthrprohisaspgluilealaargargleugly195200205leuservalsergluvalgluglyglulysaspproglusersergly210215220iletyrserleutrpserargvalvalvalasnileglutyraspglu225230235240argthralalysarghisvallysargargaspargleuleugluglu245250255leutyrgluhisleuglugluleusergluargtyrleuarghispro260265270leuthrargargtrpilevalgluhislysargaspilemetargarg275280285tyrleugluglnargilevalglucysalaleulysleuglnasparg290295300tyrglyilearggluaspvalalaleucysleualaargalapheasp305310315320glyserilesermetilealathrthrprotyrargthrleulysasp325330335valcysproaspleuthrleugluglualalysservalasnargthr340345350leualathrleuileaspgluhisglyleuserproaspalaalaasp355360365gluleuilegluhisphegluserilealaglyileleualathrasp370375380leuglugluilegluargmettyrglugluglyargleusergluglu385390395400alatyrargalaalavalgluileglnleualagluleuthrlyslys405410415gluglyvalglyarglysthralagluargleuleuargalaphegly420425430asnprogluargvallysglnleualaarggluphegluileglulys435440445leualaservalgluglyvalglygluargvalleuargserleuval450455460proglytyralaserleuileserileargglyileasparggluarg465470475480alagluargleuleulyslystyrglyglytyrserlysvalargglu485490495alaglyvalglugluleuarggluaspglyleuthraspalaglnile500505510arggluleulysglyleulysthrleugluserilevalglyaspleu515520525glulysalaaspgluleulysarglystyrglyseralaseralaval530535540argargleuprovalglugluleuarggluleuglypheseraspasp545550555560gluilealagluilelysglyileprolyslysleuargglualaphe565570575aspleugluthralaalagluleutyrgluargtyrglyserleulys580585590gluileglyargargleusertyraspaspleuleugluleuglyala595600605thrprolysalaalaalagluilelysglyprogluphelyspheleu610615620leuasnilegluglyvalglyprolysleualagluargileleuglu625630635640alavalasptyraspleugluargleualaserleuasnprogluglu645650655leualaglulysvalgluglyleuglyglugluleualagluargval660665670valtyralaalaarggluargvalgluserargarglysserglyarg675680685glngluargserglugluglutrplysglutrpleugluarglysval690695700glygluglyargalaargargleuileglutyrpheglyseralagly705710715720gluvalglylysleuvalgluasnalagluvalserlysleuleuglu725730735valproglyileglyaspglualavalalaargleuvalproglytyr740745750lysthrleuargaspalaglyleuthrproalaglualagluargval755760765leulysargtyrglyservalserlysvalglngluglyalathrpro770775780aspgluleuarggluleuglyleuglyaspalalysilealaargile785790795800leuglyleuargserleuvalasnlysargleuaspvalaspthrala805810815tyrgluleulysargargtyrglyservalseralavalarglysala820825830provallysgluleuarggluleuglyleuserasparglysileala835840845argilelysglyileprogluthrmetleuglnvalargglymetser850855860valglulysalagluargleuleugluargpheaspthrtrpthrlys865870875880vallysglualaprovalsergluleuvalargvalproglyvalgly885890895leuserleuvallysgluilelysalaglnvalaspproalatrplys900905910alaleuleuaspvallysglyvalserprogluleualaaspargleu915920925valglugluleuglyserprotyrargvalleuthralalyslysser930935940aspleumetargvalgluargvalglyprolysleualagluargile945950955960argalaalaglylysargtyrvalglugluargargserargargglu965970975argileargarglysleuarggly980<210>48<211>299<212>prt<213>如甲烷嗜热菌<400>48serglyargglngluargserglugluglutrplysglutrpleuglu151015arglysvalglygluglyargalaargargleuileglutyrphegly202530seralaglygluvalglylysleuvalgluasnalagluvalserlys354045leuleugluvalproglyileglyaspglualavalalaargleuval505560proglytyrlysthrleuargaspalaglyleuthrproalagluala65707580gluargvalleulysargtyrglyservalserlysvalglnglugly859095alathrproaspgluleuarggluleuglyleuglyaspalalysile100105110alaargileleuglyleuargserleuvalasnlysargleuaspval115120125aspthralatyrgluleulysargargtyrglyservalseralaval130135140arglysalaprovallysgluleuarggluleuglyleuserasparg145150155160lysilealaargilelysglyileprogluthrmetleuglnvalarg165170175glymetservalglulysalagluargleuleugluargpheaspthr180185190trpthrlysvallysglualaprovalsergluleuvalargvalpro195200205glyvalglyleuserleuvallysgluilelysalaglnvalasppro210215220alatrplysalaleuleuaspvallysglyvalserprogluleuala225230235240aspargleuvalglugluleuglyserprotyrargvalleuthrala245250255lyslysseraspleumetargvalgluargvalglyprolysleuala260265270gluargileargalaalaglylysargtyrvalglugluargargser275280285argarggluargileargarglysleuarggly290295<210>49<211>853<212>prt<213>大肠杆菌<400>49metseralailegluasnpheaspalahisthrprometmetglngln151015tyrleuargleulysalaglnhisprogluileleuleuphetyrarg202530metglyaspphetyrgluleuphetyraspaspalalysargalaser354045glnleuleuaspileserleuthrlysargglyalaseralaglyglu505560proileprometalaglyileprotyrhisalavalgluasntyrleu65707580alalysleuvalasnglnglygluservalalailecysgluglnile859095glyaspproalathrserlysglyprovalgluarglysvalvalarg100105110ilevalthrproglythrileseraspglualaleuleuglngluarg115120125glnaspasnleuleualaalailetrpglnaspserlysglyphegly130135140tyralathrleuaspileserserglyargpheargleuserglupro145150155160alaasparggluthrmetalaalagluleuglnargthrasnproala165170175gluleuleutyralagluaspphealaglumetserleuileglugly180185190argargglyleuargargargproleutrpgluphegluileaspthr195200205alaargglnglnleuasnleuglnpheglythrargaspleuvalgly210215220pheglyvalgluasnalaproargglyleucysalaalaglycysleu225230235240leuglntyralalysaspthrglnargthrthrleuprohisilearg245250255serilethrmetgluarggluglnaspserileilemetaspalaala260265270thrargargasnleugluilethrglnasnleualaglyglyalaglu275280285asnthrleualaservalleuaspcysthrvalthrprometglyser290295300argmetleulysargtrpleuhismetprovalargaspthrargval305310315320leuleugluargglnglnthrileglyalaleuglnaspphethrala325330335glyleuglnprovalleuargglnvalglyaspleugluargileleu340345350alaargleualaleuargthralaargproargaspleualaargmet355360365arghisalapheglnglnleuprogluleuargalaglnleugluthr370375380valaspseralaprovalglnalaleuargglulysmetglygluphe385390395400alagluleuargaspleuleugluargalaileileaspthrpropro405410415valleuvalargaspglyglyvalilealaserglytyrasngluglu420425430leuaspglutrpargalaleualaaspglyalathrasptyrleuglu435440445argleugluvalarggluarggluargthrglyleuaspthrleulys450455460valglypheasnalavalhisglytyrtyrileglnileserarggly465470475480glnserhisleualaproileasntyrmetargargglnthrleulys485490495asnalagluargtyrileileprogluleulysglutyrgluasplys500505510valleuthrserlysglylysalaleualaleuglulysglnleutyr515520525glugluleupheaspleuleuleuprohisleuglualaleuglngln530535540seralaseralaleualagluleuaspvalleuvalasnleualaglu545550555560argalatyrthrleuasntyrthrcysprothrpheileasplyspro565570575glyileargilethrgluglyarghisprovalvalgluglnvalleu580585590asnglupropheilealaasnproleuasnleuserproglnargarg595600605metleuileilethrglyproasnmetglyglylysserthrtyrmet610615620argglnthralaleuilealaleumetalatyrileglysertyrval625630635640proalaglnlysvalgluileglyproileaspargilephethrarg645650655valglyalaalaaspaspleualaserglyargserthrphemetval660665670glumetthrgluthralaasnileleuhisasnalathrglutyrser675680685leuvalleumetaspgluileglyargglythrserthrtyraspgly690695700leuserleualatrpalacysalagluasnleualaasnlysilelys705710715720alaleuthrleuphealathrhistyrphegluleuthrglnleupro725730735glulysmetgluglyvalalaasnvalhisleuaspalaleugluhis740745750glyaspthrilealaphemethisservalglnaspglyalaalaser755760765lyssertyrglyleualavalalaalaleualaglyvalprolysglu770775780valilelysargalaargglnlysleuarggluleugluserileser785790795800proasnalaalaalathrglnvalaspglythrglnmetserleuleu805810815servalproglugluthrserproalavalglualaleugluasnleu820825830aspproaspserleuthrproargglnalaleuglutrpiletyrarg835840845leulysserleuval850<210>50<211>64<212>prt<213>硫磺矿硫化叶菌(sufolobussolfataricus)<400>50metalathrvallysphelystyrlysglygluglulysgluvalasp151015ileserlysilelyslysvaltrpargvalglylysmetileserphe202530thrtyraspgluglyglyglylysthrglyargglyalavalserglu354045lysaspalaprolysgluleuleuglnmetleuglulysglnlyslys505560<210>51<211>99<212>prt<213>硫磺矿硫化叶菌p2(sufolobussolfataricusp2)<400>51glulysmetserserglythrprothrproserasnvalvalleuile151015glylyslysprovalmetasntyrvalleualaalaleuthrleuleu202530asnglnglyvalsergluilevalilelysalaargglyargalaile354045serlysalavalaspthrvalgluilevalargasnargpheleupro505560asplysilegluilelysgluileargvalglyserglnvalvalthr65707580serglnaspglyargglnserargvalserthrilegluilealaile859095arglyslys<210>52<211>88<212>prt<213>硫磺矿硫化叶菌p2<400>52thrglulysleuasngluilevalvalarglysthrlysasnvalglu151015asphisvalleuaspvalilevalleupheasnglnglyileaspglu202530valileleulysglythrglyarggluileserlysalavalaspval354045tyrasnserleulysaspargleuglyaspglyvalglnleuvalasn505560valglnthrglysergluvalargaspargargargilesertyrile65707580leuleuargleulysargvaltyr85<210>53<211>107<212>prt<213>大肠杆菌<400>53alaglnglnserprotyrseralaalametalagluglnarghisgln151015glutrpleuargphevalaspleuleulysasnalatyrglnasnasp202530leuhisleuproleuleuasnleumetleuthrproaspgluargglu354045alaleuglythrargvalargilevalglugluleuleuargglyglu505560metserglnarggluleulysasngluleuglyalaglyilealathr65707580ilethrargglyserasnserleulysalaalaprovalgluleuarg859095glntrpleuglugluvalleuleulysserasp100105<210>54<211>237<212>prt<213>肠道菌噬菌体λ(enterobacteriaphagelambda)<400>54metserthrlyslyslysproleuthrglngluglnleugluaspala151015argargleulysalailetyrglulyslyslysasngluleuglyleu202530serglngluservalalaasplysmetglymetglyglnserglyval354045glyalaleupheasnglyileasnalaleuasnalatyrasnalaala505560leuleualalysileleulysvalservalgluglupheserproser65707580ilealaarggluiletyrglumettyrglualavalsermetglnpro859095serleuargserglutyrglutyrprovalpheserhisvalglnala100105110glymetpheserprogluleuargthrphethrlysglyaspalaglu115120125argtrpvalserthrthrlyslysalaseraspseralaphetrpleu130135140gluvalgluglyasnsermetthralaprothrglyserlysproser145150155160pheproaspglymetleuileleuvalaspprogluglnalavalglu165170175proglyaspphecysilealaargleuglyglyaspgluphethrphe180185190lyslysleuileargaspserglyglnvalpheleuglnproleuasn195200205proglntyrprometileprocysasnglusercysservalvalgly210215220lysvalilealaserglntrpproglugluthrphegly225230235<210>55<211>60<212>prt<213>中的泉古菌(crenarchaea)<400>55metserserglylyslysprovallysvallysthrproalaglylys151015glualagluleuvalproglulysvaltrpalaleualaprolysgly202530arglysglyvallysileglyleuphelysaspprogluthrglylys354045tyrphearghislysleuproaspasptyrproile505560<210>56<211>136<212>prt<213>智人<400>56metalaargthrlysglnthralaarglysserthrglyglylysala151015proarglysglnleualathrlysalaalaarglysseralaproala202530thrglyglyvallyslysprohisargtyrargproglythrvalala354045leuarggluileargargtyrglnlysserthrgluleuleuilearg505560lysleupropheglnargleuvalarggluilealaglnaspphelys65707580thraspleuargpheglnserseralavalmetalaleuglngluala859095serglualatyrleuvalglyleuphegluaspthrasnleucysala100105110ilehisalalysargvalthrilemetprolysaspileglnleuala115120125argargileargglygluargala130135<210>57<211>89<212>prt<213>肠杆菌噬菌体t4<400>57metalalyslysglumetvalglupheaspglualailehisglyglu151015aspleualalyspheilelysglualaserasphislysleulysile202530serglytyrasngluleuilelysaspileargileargalalysasp354045gluleuglyvalaspglylysmetpheasnargleuleualaleutyr505560hislysaspasnargaspvalpheglualagluthrglugluvalval65707580gluleutyraspthrvalpheserlys85<210>58<211>339<212>prt<213>智人<400>58metalametglnmetglnleuglualaasnalaaspthrservalglu151015glugluserpheglyproglnproileserargleugluglncysgly202530ileasnalaasnaspvallyslysleugluglualaglyphehisthr354045valglualavalalatyralaprolyslysgluleuileasnilelys505560glyileserglualalysalaasplysileleualaglualaalalys65707580leuvalprometglyphethrthralathrgluphehisglnargarg859095sergluileileglnilethrthrglyserlysgluleuasplysleu100105110leuglnglyglyilegluthrglyserilethrglumetpheglyglu115120125pheargthrglylysthrglnilecyshisthrleualavalthrcys130135140glnleuproileaspargglyglyglygluglylysalamettyrile145150155160aspthrgluglythrpheargprogluargleuleualavalalaglu165170175argtyrglyleuserglyseraspvalleuaspasnvalalatyrala180185190argalapheasnthrasphisglnthrglnleuleutyrglnalaser195200205alametmetvalgluserargtyralaleuleuilevalaspserala210215220thralaleutyrargthrasptyrserglyargglygluleuserala225230235240argglnmethisleualaargpheleuargmetleuleuargleuala245250255aspglupheglyvalalavalvalilethrasnglnvalvalalagln260265270valaspglyalaalametphealaalaaspprolyslysproilegly275280285glyasnileilealahisalaserthrthrargleutyrleuarglys290295300glyargglygluthrargilecyslysiletyraspserprocysleu305310315320proglualaglualametphealaileasnalaaspglyvalglyasp325330335alalysasp<210>59<211>375<212>prt<213>海洋细菌jl354(citromicrobiumbathyomarinumjl354)<400>59metlysalathrilegluargalathrleuleuargcysleuserhis151015valglnservalvalgluargargasnthrileproileleuserasn202530valleuileaspalaaspalaglyglyglyvallysvalmetalathr354045aspleuaspleuglnvalvalgluthrmetthralaalaservalglu505560seralaglyalailethrvalseralahisleuleupheaspileala65707580arglysleuproaspglyserglnvalserleugluthralaaspasn859095argmetvalvallysalaglyargserargpheglnleuprothrleu100105110proargaspasppheprovalilevalgluglygluleuprothrser115120125phegluleuproalaarggluleualaglumetileaspargthrarg130135140phealaileserthrglugluthrargtyrtyrleuasnglyilephe145150155160leuhisvalseraspglualaargprovalleulysalaalaalathr165170175aspglyhisargleualaargtyrthrleuaspargprogluglyala180185190gluglymetproaspvalilevalproarglysalavalglygluleu195200205arglysleuleugluglualaleuaspserasnvalglnileaspleu210215220seralaserlysileargphealaleuglyglygluglyglyvalval225230235240leuthrserlysleuileaspglythrpheproasptyrserargval245250255ileprothrglyasnasplysleuleuargleuaspprolysalaphe260265270pheglnglyvalaspargvalalathrilealathrglulysthrarg275280285alavallysmetglyleuaspgluasplysvalthrleuservalthr290295300serproaspasnglythralaalaglugluilealaalaglutyrlys305310315320alagluglyphegluileglypheasnalaasntyrleulysaspile325330335leuglyglnileaspseraspthrvalgluleuhisleualaaspala340345350glyalaprothrleuileargargaspgluasnserproalaleutyr355360365valleumetprometargval370375<210>60<211>12<212>dna<213>人工序列<220><223>实施例3中使用的序列.<400>60tttttttttttt12<210>61<211>3667<212>dna<213>人工序列<220><223>实施例3中使用的序列.<400>61ggttgtttctgttggtgctgatattgcggcgtctgcttgggtgtttaacctgccatcaga60ttgtgtttgttagtcgctttttttttttggaattttttttttggaattttttttttgcgc120taacaacctcctgccgttttgcccgtgcatatcggtcacgaacaaatctgattactaaac180acagtagcctggatttgttctatcagtaatcgaccttattcctaattaaatagagcaaat240ccccttattgggggtaagacatgaagatgccagaaaaacatgacctgttggccgccattc300tcgcggcaaaggaacaaggcatcggggcaatccttgcgtttgcaatggcgtaccttcgcg360gcagatataatggcggtgcgtttacaaaaacagtaatcgacgcaacgatgtgcgccatta420tcgcctagttcattcgtgaccttctcgacttcgccggactaagtagcaatctcgcttata480taacgagcgtgtttatcggctacatcggtactgactcgattggttcgcttatcaaacgct540tcgctgctaaaaaagccggagtagaagatggtagaaatcaataatcaacgtaaggcgttc600ctcgatatgctggcgtggtcggagggaactgataacggacgtcagaaaaccagaaatcat660ggttatgacgtcattgtaggcggagagctatttactgattactccgatcaccctcgcaaa720cttgtcacgctaaacccaaaactcaaatcaacaggcgccggacgctaccagcttctttcc780cgttggtgggatgcctaccgcaagcagcttggcctgaaagacttctctccgaaaagtcag840gacgctgtggcattgcagcagattaaggagcgtggcgctttacctatgattgatcgtggt900gatatccgtcaggcaatcgaccgttgcagcaatatctgggcttcactgccgggcgctggt960tatggtcagttcgagcataaggctgacagcctgattgcaaaattcaaagaagcgggcgga1020acggtcagagagattgatgtatgagcagagtcaccgcgattatctccgctctggttatct1080gcatcatcgtctgcctgtcatgggctgttaatcattaccgtgataacgccattacctaca1140aagcccagcgcgacaaaaatgccagagaactgaagctggcgaacgcggcaattactgaca1200tgcagatgcgtcagcgtgatgttgctgcgctcgatgcaaaatacacgaaggagttagctg1260atgctaaagctgaaaatgatgctctgcgtgatgatgttgccgctggtcgtcgtcggttgc1320acatcaaagcagtctgtcagtcagtgcgtgaagccaccaccgcctccggcgtggataatg1380cagcctccccccgactggcagacaccgctgaacgggattatttcaccctcagagagaggc1440tgatcactatgcaaaaacaactggaaggaacccagaagtatattaatgagcagtgcagat1500agagttgcccatatcgatgggcaactcatgcaattattgtgagcaatacacacgcgcttc1560cagcggagtataaatgcctaaagtaataaaaccgagcaatccatttacgaatgtttgctg1620ggtttctgttttaacaacattttctgcgccgccacaaattttggctgcatcgacagtttt1680cttctgcccaattccagaaacgaagaaatgatgggtgatggtttcctttggtgctactgc1740tgccggtttgttttgaacagtaaacgtctgttgagcacatcctgtaataagcagggccag1800cgcagtagcgagtagcatttttttcatggtgttattcccgatgctttttgaagttcgcag1860aatcgtatgtgtagaaaattaaacaaaccctaaacaatgagttgaaatttcatattgtta1920atatttattaatgtatgtcaggtgcgatgaatcgtcattgtattcccggattaactatgt1980ccacagccctgacggggaacttctctgcgggagtgtccgggaataattaaaacgatgcac2040acagggtttagcgcgtacacgtattgcattatgccaacgccccggtgctgacacggaaga2100aaccggacgttatgatttagcgtggaaagatttgtgtagtgttctgaatgctctcagtaa2160atagtaatgaattatcaaaggtatagtaatatcttttatgttcatggatatttgtaaccc2220atcggaaaactcctgctttagcaagattttccctgtattgctgaaatgtgatttctcttg2280atttcaacctatcataggacgtttctataagatgcgtgtttcttgagaatttaacattta2340caacctttttaagtccttttattaacacggtgttatcgttttctaacacgatgtgaatat2400tatctgtggctagatagtaaatataatgtgagacgttgtgacgttttagttcagaataaa2460acaattcacagtctaaatcttttcgcacttgatcgaatatttctttaaaaatggcaacct2520gagccattggtaaaaccttccatgtgatacgagggcgcgtagtttgcattatcgttttta2580tcgtttcaatctggtctgacctccttgtgttttgttgatgatttatgtcaaatattagga2640atgttttcacttaatagtattggttgcgtaacaaagtgcggtcctgctggcattctggag2700ggaaatacaaccgacagatgtatgtaaggccaacgtgctcaaatcttcatacagaaagat2760ttgaagtaatattttaaccgctagatgaagagcaagcgcatggagcgacaaaatgaataa2820agaacaatctgctgatgatccctccgtggatctgattcgtgtaaaaaatatgcttaatag2880caccatttctatgagttaccctgatgttgtaattgcatgtatagaacataaggtgtctct2940ggaagcattcagagcaattgaggcagcgttggtgaagcacgataataatatgaaggatta3000ttccctggtggttgactgatcaccataactgctaatcattcaaactatttagtctgtgac3060agagccaacacgcagtctgtcactgtcaggaaagtggtaaaactgcaactcaattactgc3120aatgccctcgtaattaagtgaatttacaatatcgtcctgttcggagggaagaacgcggga3180tgttcattcttcatcacttttaattgatgtatatgctctcttttctgacgttagtctccg3240acggcaggcttcaatgacccaggctgagaaattcccggaccctttttgctcaagagcgat3300gttaatttgttcaatcatttggttaggaaagcggatgttgcgggttgttgttctgcgggt3360tctgttcttcgttgacatgaggttgccccgtattcagtgtcgctgatttgtattgtctga3420agttgtttttacgttaagttgatgcagatcaattaatacgatacctgcgtcataattgat3480tatttgacgtggtttgatggcctccacgcacgttgtgatatgtagatgataatcattatc3540actttacgggtcctttccggtgaaaaaaaaggtaccaaaaaaaacatcgtcgtgagtagt3600gaaccgtaagcatgtaggacgtcctgtcgctgtgtctcggacactgattgacacggttta3660gtagagc3667<210>62<211>3617<212>dna<213>人工序列<220><223>实施例3中使用的序列.<400>62ttttttttttttttttttttttttttttcgagacacagcgacaggacgtcctacatgctt60acggttcactactcacgacgatgttttttttggtaccttttttttcaccggaaaggaccc120gtaaagtgataatgattatcatctacatatcacaacgtgcgtggaggccatcaaaccacg180tcaaataatcaattatgacgcaggtatcgtattaattgatctgcatcaacttaacgtaaa240aacaacttcagacaatacaaatcagcgacactgaatacggggcaacctcatgtcaacgaa300gaacagaacccgcagaacaacaacccgcaacatccgctttcctaaccaaatgattgaaca360aattaacatcgctcttgagcaaaaagggtccgggaatttctcagcctgggtcattgaagc420ctgccgtcggagactaacgtcagaaaagagagcatatacatcaattaaaagtgatgaaga480atgaacatcccgcgttcttccctccgaacaggacgatattgtaaattcacttaattacga540gggcattgcagtaattgagttgcagttttaccactttcctgacagtgacagactgcgtgt600tggctctgtcacagactaaatagtttgaatgattagcagttatggtgatcagtcaaccac660cagggaataatccttcatattattatcgtgcttcaccaacgctgcctcaattgctctgaa720tgcttccagagacaccttatgttctatacatgcaattacaacatcagggtaactcataga780aatggtgctattaagcatattttttacacgaatcagatccacggagggatcatcagcaga840ttgttctttattcattttgtcgctccatgcgcttgctcttcatctagcggttaaaatatt900acttcaaatctttctgtatgaagatttgagcacgttggccttacatacatctgtcggttg960tatttccctccagaatgccagcaggaccgcactttgttacgcaaccaatactattaagtg1020aaaacattcctaatatttgacataaatcatcaacaaaacacaaggaggtcagaccagatt1080gaaacgataaaaacgataatgcaaactacgcgccctcgtatcacatggaaggttttacca1140atggctcaggttgccatttttaaagaaatattcgatcaagtgcgaaaagatttagactgt1200gaattgttttattctgaactaaaacgtcacaacgtctcacattatatttactatctagcc1260acagataatattcacatcgtgttagaaaacgataacaccgtgttaataaaaggacttaaa1320aaggttgtaaatgttaaattctcaagaaacacgcatcttatagaaacgtcctatgatagg1380ttgaaatcaagagaaatcacatttcagcaatacagggaaaatcttgctaaagcaggagtt1440ttccgatgggttacaaatatccatgaacataaaagatattactatacctttgataattca1500ttactatttactgagagcattcagaacactacacaaatctttccacgctaaatcataacg1560tccggtttcttccgtgtcagcaccggggcgttggcataatgcaatacgtgtacgcgctaa1620accctgtgtgcatcgttttaattattcccggacactcccgcagagaagttccccgtcagg1680gctgtggacatagttaatccgggaatacaatgacgattcatcgcacctgacatacattaa1740taaatattaacaatatgaaatttcaactcattgtttagggtttgtttaattttctacaca1800tacgattctgcgaacttcaaaaagcatcgggaataacaccatgaaaaaaatgctactcgc1860tactgcgctggccctgcttattacaggatgtgctcaacagacgtttactgttcaaaacaa1920accggcagcagtagcaccaaaggaaaccatcacccatcatttcttcgtttctggaattgg1980gcagaagaaaactgtcgatgcagccaaaatttgtggcggcgcagaaaatgttgttaaaac2040agaaacccagcaaacattcgtaaatggattgctcggttttattactttaggcatttatac2100tccgctggaagcgcgtgtgtattgctcacaataattgcatgagttgcccatcgatatggg2160caactctatctgcactgctcattaatatacttctgggttccttccagttgtttttgcata2220gtgatcagcctctctctgagggtgaaataatcccgttcagcggtgtctgccagtcggggg2280gaggctgcattatccacgccggaggcggtggtggcttcacgcactgactgacagactgct2340ttgatgtgcaaccgacgacgaccagcggcaacatcatcacgcagagcatcattttcagct2400ttagcatcagctaactccttcgtgtattttgcatcgagcgcagcaacatcacgctgacgc2460atctgcatgtcagtaattgccgcgttcgccagcttcagttctctggcatttttgtcgcgc2520tgggctttgtaggtaatggcgttatcacggtaatgattaacagcccatgacaggcagacg2580atgatgcagataaccagagcggagataatcgcggtgactctgctcatacatcaatctctc2640tgaccgttccgcccgcttctttgaattttgcaatcaggctgtcagccttatgctcgaact2700gaccataaccagcgcccggcagtgaagcccagatattgctgcaacggtcgattgcctgac2760ggatatcaccacgatcaatcataggtaaagcgccacgctccttaatctgctgcaatgcca2820cagcgtcctgacttttcggagagaagtctttcaggccaagctgcttgcggtaggcatccc2880accaacgggaaagaagctggtagcgtccggcgcctgttgatttgagttttgggtttagcg2940tgacaagtttgcgagggtgatcggagtaatcagtaaatagctctccgcctacaatgacgt3000cataaccatgatttctggttttctgacgtccgttatcagttccctccgaccacgccagca3060tatcgaggaacgccttacgttgattattgatttctaccatcttctactccggctttttta3120gcagcgaagcgtttgataagcgaaccaatcgagtcagtaccgatgtagccgataaacacg3180ctcgttatataagcgagattgctacttagtccggcgaagtcgagaaggtcacgaatgaac3240taggcgataatggcgcacatcgttgcgtcgattactgtttttgtaaacgcaccgccatta3300tatctgccgcgaaggtacgccattgcaaacgcaaggattgccccgatgccttgttccttt3360gccgcgagaatggcggccaacaggtcatgtttttctggcatcttcatgtcttacccccaa3420taaggggatttgctctatttaattaggaataaggtcgattactgatagaacaaatccagg3480ctactgtgtttagtaatcagatttgttcgtgaccgatatgcacgggcaaaacggcaggag3540gttgttagcgcaaaaaaaaaattccaaaaaaaaaattccaaaaaaaaaaagcgactaaca3600aacacaatctgatggca3617<210>63<211>68<212>dna<213>人工序列<220><223>实施例3中使用的序列.<400>63ggttaaacacccaagcagacgccgcaatatcagcaccaacagaaacaacctttgaggcga60gcggtcaa68<210>64<211>15<212>dna<213>人工序列<220><223>实施例3中使用的序列.<400>64ttgaccgctcgcctc15<210>65<211>786<212>dna<213>大肠杆菌<400>65tgtctgaccgcaccgccgaaagaagcggcacgtccgaccctgatgccgcgtgcacagtct60tataaagatctgacccatctgccggctccgacgggcaaaatttttgttagcgtctataac120atccaggacgaaaccggtcaatttaaaccgtacccggcgagtaatttctccacggccgtt180ccgcagagtgcaaccgctatgctggtcacggcactgaaagattcccgttggttcattccg240ctggaacgccagggcctgcaaaacctgctgaatgaacgtaaaattatccgcgcagctcag300gaaaacggtaccgtggccattaacaatcgtattccgctgcaaagcctgaccgccgcaaac360atcatggttgaaggctctatcatcggttacgaatcaaacgtcaaatcgggcggtgtgggc420gcacgttattttggcattggtgctgatacccagtaccaactggaccagatcgcagttaac480ctgcgcgtggttaatgtcagcaccggcgaaattctgagctctgtgaataccagcaaaacg540atcctgtcttacgaagtgcaggctggtgtttttcgtttcattgattatcaacgcctgctg600gaaggcgaagtcggttacacctcaaacgaaccggtgatgctgtgtctgatgtcggcgatt660gaaacgggtgttattttcctgatcaatgatggcatcgaccgtggtctgtgggatctgcag720aacaaagccgaacgtcaaaatgacattctggtgaaataccgccacatgagtgttccgccg780gaatcc786<210>66<211>262<212>prt<213>大肠杆菌<400>66cysleuthralaproprolysglualaalaargprothrleumetpro151015argalaglnsertyrlysaspleuthrhisleuproalaprothrgly202530lysilephevalservaltyrasnileglnaspgluthrglyglnphe354045lysprotyrproalaserasnpheserthralavalproglnserala505560thralametleuvalthralaleulysaspserargtrppheilepro65707580leugluargglnglyleuglnasnleuleuasngluarglysileile859095argalaalaglngluasnglythrvalalaileasnasnargilepro100105110leuglnserleuthralaalaasnilemetvalgluglyserileile115120125glytyrgluserasnvallysserglyglyvalglyalaargtyrphe130135140glyileglyalaaspthrglntyrglnleuaspglnilealavalasn145150155160leuargvalvalasnvalserthrglygluileleuserservalasn165170175thrserlysthrileleusertyrgluvalglnalaglyvalphearg180185190pheileasptyrglnargleuleugluglygluvalglytyrthrser195200205asngluprovalmetleucysleumetseralailegluthrglyval210215220ilepheleuileasnaspglyileaspargglyleutrpaspleugln225230235240asnlysalagluargglnasnaspileleuvallystyrarghismet245250255servalproprogluser260<210>67<211>10<212>prt<213>人工序列<220><223>stepii(c)的氨基酸序列<400>67seralatrpserhisproglnpheglulys1510<210>68<211>1653<212>rna<213>人工序列<220><223>实施例5中使用的序列.<400>68auggaagacgccaaaaacauaaagaaaggcccggcgccauucuauccgcuggaagaugga60accgcuggagagcaacugcauaaggcuaugaagagauacgcccugguuccuggaacaauu120gcuuuuacagaugcacauaucgagguggacaucacuuacgcugaguacuucgaaaugucc180guucgguuggcagaagcuaugaaacgauaugggcugaauacaaaucacagaaucgucgua240ugcagugaaaacucucuucaauucuuuaugccgguguugggcgcguuauuuaucggaguu300gcaguugcgcccgcgaacgacauuuauaaugaacgugaauugcucaacaguaugggcauu360ucgcagccuaccgugguguucguuuccaaaaagggguugcaaaaaauuuugaacgugcaa420aaaaagcucccaaucauccaaaaaauuauuaucauggauucuaaaacggauuaccaggga480uuucagucgauguacacguucgucacaucucaucuaccucccgguuuuaaugaauacgau540uuugugccagaguccuucgauagggacaagacaauugcacugaucaugaacuccucugga600ucuacuggucugccuaaaggugucgcucugccucauagaacugccugcgugagauucucg660caugccagagauccuauuuuuggcaaucaaaucauuccggauacugcgauuuuaaguguu720guuccauuccaucacgguuuuggaauguuuacuacacucggauauuugauauguggauuu780cgagucgucuuaauguauagauuugaagaagagcuguuucugaggagccuucaggauuac840aagauucaaagugcgcugcuggugccaacccuauucuccuucuucgccaaaagcacucug900auugacaaauacgauuuaucuaauuuacacgaaauugcuucugguggcgcuccccucucu960aaggaagucggggaagcgguugccaagagguuccaucugccagguaucaggcaaggauau1020gggcucacugagacuacaucagcuauucugauuacacccgagggggaugauaaaccgggc1080gcggucgguaaaguuguuccauuuuuugaagcgaagguuguggaucuggauaccgggaaa1140acgcugggcguuaaucaaagaggcgaacugugugugagagguccuaugauuauguccggu1200uauguaaacaauccggaagcgaccaacgccuugauugacaaggauggauggcuacauucu1260ggagacauagcuuacugggacgaagacgaacacuucuucaucguugaccgccugaagucu1320cugauuaaguacaaaggcuaucagguggcucccgcugaauuggaauccaucuugcuccaa1380caccccaacaucuucgacgcaggugucgcaggucuucccgacgaugacgccggugaacuu1440cccgccgccguuguuguuuuggagcacggaaagacgaugacggaaaaagagaucguggau1500uacgucgccagucaaguaacaaccgcgaaaaaguugcgcggaggaguuguguuuguggac1560gaaguaccgaaaggucuuaccggaaaacucgacgcaagaaaaaucagagagauccucaua1620aaggccaagaagggcggaaagaucgccguguaa1653<210>69<211>10<212>dna<213>人工序列<220><223>实施例5中使用的序列.<400>69ccccccccca10<210>70<211>27<212>dna<213>人工序列<220><223>实施例5中使用的序列.<400>70ggttgtttctgttggtgctgatattgc27<210>71<211>28<212>dna<213>人工序列<220><223>实施例5中使用的序列.<400>71gcaatatcagcaccaacagaaacaacct28<210>72<211>48<212>dna<213>人工序列<220><223>实施例5中使用的序列.<400>72cgttctgtttatgtttcttggacactgattgacacggtttagtagaac48<210>73<211>51<212>dna<213>人工序列<220><223>实施例5中使用的序列.<400>73cccccccccacccccccccacccccccccaagaaacataaacagaacgttt51当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1