聚合酶变体的制作方法

文档序号:11519191阅读:384来源:国知局
聚合酶变体的制造方法与工艺
本文尤其提供了含有基于定向进化实验中鉴定的突变的氨基酸改变的经修饰的dna聚合酶,所述定向进化实验被设计用于选择更好地适合于重组dna技术中应用的酶。背景dna聚合酶是一种酶家族,其使用单链dna作为模板以合成互补dna链。具体而言,dna聚合酶可以将游离核苷酸加入新形成链的3’端,导致新链在5’至3’方向的延伸。大多数dna聚合酶是具有聚合和核酸外切活性的多功能蛋白。例如,许多dna聚合酶具有3′→5′核酸外切酶活性。这些聚合酶可以识别不正确掺入的核苷酸,并且酶的3′→5′核酸外切酶活性允许切除不正确的核苷酸(该活性被称为校读)。核苷酸切除后,聚合酶可以重新插入正确的核苷酸,并且复制可以继续。许多dna聚合酶也具有5′→3′外切核酸酶活性。已经发现聚合酶用于重组dna应用,包括纳米孔测序。然而,dna链以1μs至5μs/碱基的速度快速移动通过纳米孔。这使得记录困难并且容易出现背景噪声,不能获得单核苷酸分辨率。因此,在dna链或其片段的测序中可以使用在核苷酸上的可检测标签的应用。因此,不仅需要控制测序dna的速率,而且还提供具有改善性能(相对于野生型酶)(诸如掺入经修饰的核苷酸,例如具有或不具有标签的多磷酸核苷酸)的聚合酶。发明简述本发明提供了基于定向进化实验的经修饰的dna聚合酶(例如,突变体),所述定向进化实验被设计用于选择在工业或研究应用中使用的条件下赋予有利表型的突变(例如催化经修饰的多磷酸核苷酸(例如标记的核苷酸,在高盐浓度下)的掺入)。在一个方面,存在变体聚合酶,其在对应于以下的位置处包含至少一个改变:seqidno:2(pol6(具有his标签))的h223、n224、y225、h227、i295、y342、t343、i357、s360、l361、i363、s365q、s366、y367、p368、d417、e475、y476、f478、k518、h527、t529、m531、n535、g539、p542、n545、q546、a547、l549、i550、n552、g553、f558、a596、g603、a610、v615、y622、c623、d624、i628、y629、r632、n635、m641、a643、i644、t647、i648、t651、i652、k655、w656、d657、v658、h660、f662和l690。在一个实施方案中,提供了具有dna聚合酶活性的经修饰的dna聚合酶,其包含与seqidno:1或2所示的氨基酸序列具有至少70%、至少75%、至少80%、至少90%、至少95%或总序列同一性的氨基酸序列。在第二个实施方案中,提供了具有dna聚合酶活性的经修饰的dna聚合酶,其包含与seqidno:1或2所示的氨基酸序列具有至少70%、至少75%、至少80%、至少90%、至少95%或总序列同一性的氨基酸序列,其具有选自以下的一个或多个氨基酸取代:h223、n224、y225、h227、i295、y342、t343、i357、s360、l361、i363、s365q、s366、y367、p368、d417、e475、y476、f478、k518、h527、t529、m531、n535、g539、p542、n545、q546、a547、l549、i550、n552、g553、f558、a596、g603、a610、v615、y622、c623、d624、i628、y629、r632、n635、m641、a643、i644、t647、i648、t651、i652、k655、w656、d657、v658、h660、f662和l690及其组合。在另一个实施方案中,所述一个或多个氨基酸取代选自h223a、n224y/l、y225l/t/i/f/a、h227p、i295w/f/m/e、y342l/f、t343n/f、i357g/l/q/h/w/m/a/e/y/p、s360g、l361m/w/v、i363v、s365q/w/m/a/g、s366a/l、y367l/e/m/p/n、p368g、d417p、e475d、y476v、f478l、k518q、h527w/r/l、t529m/f、m531h/y/a/k/r/w/t/l/v、n535l/y/m/k/i、g539y/f、p542e/s、n545k/d/s/l/r、q546w/f、a547m/y/w/f/v/s、l549q/y/h/g/r、i550a/w/t/g/f/s、n552l/m/s、g553s/t、f558p/t、a596s、g603t、a610t/e、v615a/t、y622a/m、c623g/s/y、d624f、i628y/v/f、y629w/h/m、r632l/c、n635d、m641l/y、a643l、i644h/m/y、t647g/a/e/k/s、i648k/r/v/n/t、t651y/f/m、i652q/g/s/n/f/t、k655g/f/e/n、w656e、d657r/p/a、v658l、h660a/y、f662i/l、l690m及其组合。具有一个或多个氨基酸取代的经修饰的dna聚合酶相对于亲本聚合酶具有选自酶活性、保真度、持续合成能力、延伸率、测序精度、长连续读取能力、稳定性和溶解度的改变的特征。在一个实施方案中,所述改变的特征是酶活性。在一个实施方案中,所述改变的特征是保真度。在一个实施方案中,所述改变的特征是持续合成能力。在一个实施方案中,所述改变的特征是延伸率。在一个实施方案中,所述改变的特征是稳定性。在一个实施方案中,所述改变的特征是溶解度。在一个实施方案中,所述改变的特征是结合和/或掺入多磷酸核苷酸(例如四磷酸、五磷酸、六磷酸、七磷酸或八磷酸核苷酸)的能力。在第三个实施方案中,提供了经修饰的dna聚合酶,当与seqidno:1或2相比时,其具有选自酶活性、保真度、持续合成能力、延伸率、稳定性或溶解度的改变的特征。在一个实施方案中,所述改变的特征是酶活性。在一个实施方案中,所述改变的特征是保真度。在一个实施方案中,所述改变的特征是持续合成能力。在一个实施方案中,所述改变的特征是延伸率。在一个实施方案中,所述改变的特征是稳定性。在一个实施方案中,所述改变的特征是溶解度。在第四个实施方案中,提供了具有dna聚合酶活性的经修饰的dna聚合酶,其包含与seqidno:1所示的氨基酸序列具有至少70%、至少75%、至少80%、至少90%、至少95%或总序列同一性的氨基酸序列,所述氨基酸序列包括一个或多个氨基酸取代,这种取代选自h223a、n224y/l、y225l/t/i/f/a、h227p、i295w/f/m/e、y342l/f、t343n/f、i357g/l/q/h/w/m/a/e/y/p、s360g、l361m/w/v、i363v、s365q/w/m/a/g、s366a/l、y367l/e/m/p/n、p368g、d417p、e475d、y476v、f478l、k518q、h527w/r/l、t529m/f、m531h/y/a/k/r/w/t/l/v、n535l/y/m/k/i、g539y/f、p542e/s、n545k/d/s/l/r、q546w/f、a547m/y/w/f/v/s、l549q/y/h/g/r、i550a/w/t/g/f/s、n552l/m/s、g553s/t、f558p/t、a596s、g603t、a610t/e、v615a/t、y622a/m、c623g/s/y、d624f、i628y/v/f、y629w/h/m、r632l/c、n635d、m641l/y、a643l、i644h/m/y、t647g/a/e/k/s、i648k/r/v/n/t、t651y/f/m、i652q/g/s/n/f/t、k655g/f/e/n、w656e、d657r/p/a、v658l、h660a/y、f662i/l、l690m及其组合,其中所述一个或多个氨基酸取代相对于亲本聚合酶改变了酶活性、保真度、持续合成能力、延伸率、测序精度、长连续读取能力、稳定性或溶解度。在一个实施方案中,所述改变的特征是酶活性。在一个实施方案中,所述改变的特征是保真度。在一个实施方案中,所述改变的特征是持续合成能力。在一个实施方案中,所述改变的特征是延伸率。在一个实施方案中,所述改变的特征是稳定性。在一个实施方案中,所述改变的特征是溶解度。在一个实施方案中,所述改变的特征是结合和/或掺入多磷酸核苷酸(例如四磷酸、五磷酸、六磷酸、七磷酸或八磷酸核苷酸)的能力。在一个实施方案中,与seqidno:1或2相比具有改变的酶活性的变体聚合酶选自a.h223a;b.n224y/l;c.y225l/i/t/f/a;d.h227p;e.i295f/e/m/w;f.y342l/f;g.t343n/f;h.i357g/l/q/h/w/m/a/e/y/p;i.s360g;j.l361m/w/v;k.i363v;l.s365q/w/m/a/g;m.s366a/l;n.y367l/e/m/p/n;o.p368g;p.d417p;q.e475d;r.y476v;s.f478l;t.k518q;u.h527w/r/l;v.t529m/f;w.m531h/y/a/k/r/w/t/l/v;x.n535l/y/m/k/i;y.p542e/s;z.n545d/k/s/l/r;aa.q546w/f;bb.a547f/m/w/y/v/s;cc.l549h/y/q/g/r;dd.i550a/w;ee.i550t/g/f/s;ff.n552l/m;gg.g553s/t;hh.f558p/t;ii.a596s;jj.g603t;kk.a610t/e;ll.v615a/t;mm.y622a/m;nn.c623g/s/y/a;oo.d624f;pp.i628y/v/f;qq.y629w/h/m;rr.r632l/c;ss.n635d;tt.m641l/y;uu.a643l;vv.i644h/m/y;ww.t647g/a/e/k/s;xx.i648k/r/v/n/t;yy.t651y/f/m;zz.i652q/g/s/n/f/t;aaa.k655g/f/e/n;bbb.w656e;ccc.d657r/p/a;ddd.v658l;eee.h660a/y;fff.f662i/l;ggg.l690m;hhh.s366a+n535l;iii.t651y+n535l;jjj.y342l+e475d+f478l;kkk.t343n+d417p+k518q;lll.n535l+n545k+t651y;mmm.i363v+e475d+y476v;nnn.s366l+g553s+f558p;ooo.s366a+n535l+a547m;ppp.s366a+p542e+n545k;qqq.s366a+p542e+i652q;rrr.s366a+n535l+t529m;sss.s366a+n535l+i652q;ttt.s366a+n535l+n545k;uuu.t651y+p542e+n545k;vvv.t651y+p542e+q546w;www.t651y+p542e+s366a;xxx.t651y+n535l+n545k;yyy.s366a+n535i+i652q;zzz.t651y+s366a+a547f;aaaa.t647g+a547f+y225t;bbbb.a547f+a610t+s366a;cccc.a547f+a610t+y225i;dddd.s366a+t647g+a547f;eeee.t529m+s366a+a547f;ffff.t647e+s366a+a547f;gggg.t529m+t647g+a547f;hhhh.n545k+s366a+a547f;iiii.t647g+a547f+t529m;jjjj.t529m+a610t+a547f;kkkk.m641y+t529m+a547f;llll.t647g+c623g+a547f;mmmm.a610t+i295w+t651y;nnnn.v615a+m531y+t647g;oooo.s366l+f478l+a596s+l690m;pppp.h223a+g553s+a643l+f662i;qqqq.n535l+n545k+t651y+t529m;rrrr.n535l+n545k+t651y+n635d;ssss.n535l+n545k+t651y+i652q;tttt.s366a+n535l+i652q+t529m;uuuu.s366a+s365a+p368g+g603t;vvvv.n535l+n545k+t651y+t647g;wwww.s366a+n535l+i652q+a547y;xxxx.s366a+n535l+a547m+t647g;yyyy.t529m+s366a+a547f+n545k;zzzz.t529m+s366a+a547f+n545r;aaaaa.t529m+s366a+a547f+n552l;bbbbb.t529m+s366a+a547f+y629w;ccccc.n535i+n545k+t651y+t529m;ddddd.n535i+n545k+t651y+n635d;eeeee.n535i+n545k+t651y+i652q;fffff.n535l+n545k+t651y+t647g+c623g;ggggg.n535l+n545k+t651y+t647g+i628y;hhhhh.s366a+n535l+a547m+t647g+s360g;iiiii.n535i+n545k+t651y+i652q+y225i;jjjjj.n535l+n545k+t651y+t647g+k655g;kkkkk.n535l+n545k+t651y+t647g+l549q;lllll.s366a+n535l+i652q+a547y+k655g;mmmmm.t529m+s366a+a547f+n545l+y629w;nnnnn.t529m+s366a+a547f+n545l+y225l;ooooo.t529m+s366a+a547f+n545l+y225f;ppppp.t529m+s366a+a547f+n545l+k655f;qqqqq.t529m+s366a+a547f+n545l+n552l;rrrrr.t529m+s366a+a547f+n545r+m531a;sssss.t529m+s366a+a547f+n545r+g539y;ttttt.t529m+s366a+a547f+n545r+v658l;uuuuu.t529m+s366a+a547f+n545l+y225l+d657r;vvvvv.t529m+s366a+a547f+n545l+y225l+n552l;wwwww.t529m+s366a+a547f+n545l+y225l+i652g;xxxxx.t529m+s366a+a547f+n545l+y225l+i652q;和yyyyy.t529m+s366a+a547f+n545l+y225l+n552m。在一个实施方案中,所述改变的特征是酶活性。在一个实施方案中,所述改变的特征是保真度。在一个实施方案中,所述改变的特征是持续合成能力。在一个实施方案中,所述改变的特征是延伸率。在一个实施方案中,所述改变的特征是稳定性。在一个实施方案中,所述改变的特征是溶解度。在一个实施方案中,所述改变的特征是结合和/或掺入多磷酸核苷酸(例如四磷酸、五磷酸、六磷酸、七磷酸或八磷酸核苷酸)的能力。在一些实施方案中,与具有n535i+n545k+t651y+n635d突变的seqidno:2或seqidno:1或2相比具有改变的酶活性的变体聚合酶选自a.a547f+a610t+y225i;b.y225t+t647g+a547f;c.s366a+t647g+a547f;d.s366a+a547f+a610t;e.t529m+s366a+a547f;f.t529m+t647g+a547f;g.t529m+a610t+a547f;h.n545k+s366a+a547f;i.n545k+t647g+a547f;j.a610t+i295w+t651y;k.v615a+m531y+t647g;l.m641y+t529m+a547f;m.t647e+s366a+a547f;n.t647g+a547f+t529m;o.t647g+c623g+a547f;和p.t651y+s366a+a547f。在一些实施方案中,所述变体聚合酶选自a.n535l+n545k+t651y;b.s366a+n535l+i652q;c.s366a+t529m+n535l;d.s366a+n535l+n545k;e.s366a+n535l+a547m;f.s366a+p542e+i652q;g.s366a+p542e+n545k;h.s366a+p542e+t651y;i.p542e+n545k+t651y;j.p542e+q546w+t651y;k.n535l+t651y;l.s366a+n535l;m.n535l+n545k+t651y+t529m;n.n535l+n545k+t651y+n635d;o.n535l+n545k+t651y+i652q;p.s366a+n535l+i652q+t529m;q.n535l+n545k+t651y+t647g;r.s366a+n535l+i652q+a547y;s.s366a+n535l+a547m+t647g;t.s366a+n535i+i652q;u.n535i+n545k+t651y+t529m;v.n535i+n545k+t651y+n635d;w.n535i+n545k+t651y+i652q;x.n535l+n545k+t651y+t647g+c623g;y.n535l+n545k+t651y+t647g+i628y;z.s366a+n535l+a547m+t647g+s360g;aa.n535i+n545k+t651y+i652q+y225i;bb.n535l+n545k+t651y+t647g+k655g;cc.n535l+n545k+t651y+t647g+l549q;dd.s366a+n535l+i652q+a547y+k655g;ee.t647g+a547f+y225t;ff.a547f+a610t+s366a;gg.a547f+a610t+y225i;hh.s366a+t647g+a547f;ii.t651y+s366a+a547f;jj.t529m+s366a+a547f;kk.t647e+s366a+a547f;ll.t529m+t647g+a547f;mm.n545k+s366a+a547f;nn.t647g+a547f+t529m;oo.n545k+t647g+a547f;pp.t529m+a610t+a547f;qq.m641y+t529m+a547f;rr.t647g+c623g+a547f;ss.a610t+i295w+t651y;tt.v615a+m531y+t647g;uu.t529m+s366a+a547f+n545k;vv.t529m+s366a+a547f+n545r;ww.t529m+s366a+a547f+n552l;xx.t529m+s366a+a547f+y629w;yy.t529m+s366a+a547f+n545l+y629w;zz.t529m+s366a+a547f+n545l+y225l;aaa.t529m+s366a+a547f+n545l+y225f;bbb.t529m+s366a+a547f+n545l+k655f;ccc.t529m+s366a+a547f+n545l+n552l;ddd.t529m+s366a+a547f+n545r+m531a;eee.t529m+s366a+a547f+n545r+g539y;fff.t529m+s366a+a547f+n545r+v658l;ggg.t529m+s366a+a547f+n545l+y225l+d657r;hhh.t529m+s366a+a547f+n545l+y225l+n552l;iii.t529m+s366a+a547f+n545l+y225l+i652g;jjj.t529m+s366a+a547f+n545l+y225l+i652q;和kkk.t529m+s366a+a547f+n545l+y225l+n552m。在一些实施方案中,所述变体聚合酶具有与seqidno:1或2或亲本聚合酶相比改变的酶活性。在一些实施方案中,与具有s366a+t529m+n545l+a547f突变的seqidno:2或seqidno:1或2相比具有改变的酶活性的变体聚合酶选自a.y225l/f/a;b.m531a;c.g539y;d.n552l;e.y629w;f.k655f。在一个实施方案中,所述改变的特征是酶活性。在一个实施方案中,所述改变的特征是保真度。在一个实施方案中,所述改变的特征是持续合成能力。在一个实施方案中,所述改变的特征是延伸率。在一个实施方案中,所述改变的特征是稳定性。在一个实施方案中,所述改变的特征是溶解度。在一个实施方案中,所述改变的特征是结合和/或掺入多磷酸核苷酸(例如四磷酸、五磷酸、六磷酸、七磷酸或八磷酸核苷酸)的能力。在一些实施方案中,所述亲本聚合酶是野生型pol6(seqidno:1)。在一些实施方案中,所述亲本聚合酶是包含his标签的pol6(seqidno:2)。在一些实施方案中,所述亲本聚合酶包含突变s366a+t529m+a547f+n545l/r。在一些实施方案中,所述亲本聚合酶可以是包含一个或多个突变的seqidno:1。例如,s366a+t529m+a547f+n545r使用s366a+t529m+a547f作为亲本聚合酶,然后加入n545r。在一些实施方案中,经修饰的聚合酶具有大于亲本聚合酶的kchem。在一些实施方案中,经修饰的聚合酶具有小于亲本聚合酶的koff。在一些实施方案中,经修饰的聚合酶具有大于亲本聚合酶的至少1.5、2.0或2.5倍的kchem/koff(即比率)。从下面的详述中,本发明的其它目的、特征和优点将变得显而易见。然而,应当理解,虽然详述和具体实施例指示了本发明的优选实施方案,但它们仅以说明的方式给出,因为在本发明的范围和精神内的各种改变和修改对于本领域技术人员而言根据所述详述将变得显而易见。附图简述图1说明在置换测定中使用的示例性模板。参考实施例3。图2显示本文中用于测量多磷酸盐掺入速率的kchem测定的示意图。参考实施例6。图3是本文中用于测量变体聚合酶的动力学性能的基于荧光猝灭的koff测定的概述。参考实施例4。图4是基于荧光偏振的koff测定和示例性数据迹线的描述。参考实施例5。图5是显示来自变体聚合酶的置换测定的代表性数据的图。参考实施例3。图6是来自两种变体聚合酶的基于荧光偏振的koff测定的代表性数据的图。参考实施例5。图7是双层上下的20mmhepes7.5、300mmnacl、3mmcacl2和5mmtcep中的与α-溶血素纳米孔偶联的pol6(s366a+n535l+i652q)-dna复合物在100mv下静态捕获标记的胸腺嘧啶核苷酸的迹线。垂直轴是%开放通道电流(均一化),且水平轴是以秒为单位的时间。参考实施例8。图8是双层上下的20mmhepesph7.5、300mmnacl、3mmcacl2和5mmtcep中的与α-溶血素纳米孔偶联的pol6(s366a+n535l+i652q)-dna复合物在100mv下的静态捕获实验的停留时间vs电流曲线图。dtnp-标记的核苷酸的每次捕获的平均停留时间为1.2秒。参考实施例8。图9是来自用于变体聚合酶的基于荧光猝灭的kchem测定(参见图2)的代表性数据的图。使用kintek停流装置,在mg2+存在下,将聚合酶和荧光素-dna模板的预形成的二元复合物与饱和浓度的dcnp-alexa555快速混合。随着时间推移监测荧光素荧光。从速率限制步骤估计的kchem是0.2s-1。x-轴是以秒为单位的时间(t),且y-轴是相对荧光单位(rfu)。图10是来自用于变体聚合酶的基于荧光猝灭的koff测定(参见图3)的代表性数据的图。将聚合酶、荧光素-dna模板和dcnp-alexa555的预形成的三元复合物在ca2+存在下预温育并用过量天然dctp追踪。随着时间推移监测荧光素荧光。由此测得的koff为0.028s-1。x-轴是以秒为单位的时间(t),且y-轴是相对荧光单位(rfu)。图11是显示滚环测定的扩增产物的凝胶的图。左右端泳道是分子梯。从左侧开始的第二泳道是零时间点。所有其它泳道是各种聚合酶命中的40分钟时间点。参考实施例9。图12是显示当它们被掺入生长中的dna链中时提供标记的核苷酸的记录的电流变化的测序迹线。还显示模板dna序列和新生链的所谓序列,其表明>70%精度(根据出现顺序,分别为seqidno6-8)。参考实施例10。本专利的文件含有至少一个彩图。本专利或专利公开的具有彩图的拷贝在要求和支付必要费用后由专利和商标局提供。详述现在将仅使用以下定义和实施例通过参考的方式详细描述本发明。本文参考的所有专利和出版物,包括所有在这样的专利和出版物中公开的序列都被明确地通过引用并入本文。除非另有定义,否则本文使用的所有技术和科学术语都具有与本发明所属领域的普通技术人员通常理解的相同的含义。singleton等人,dictionaryofmicrobiologyandmolecularbiology,第2版,johnwileyandsons,newyork(1994)和hale&marham,theharpercollinsdictionaryofbiology,harperperennial,ny(1991)为技术人员提供了本发明中使用的许多术语的综合词典。虽然与本文所述类似或等同的任何方法和材料都可用于本发明的实践或测试中,但是描述了优选的方法和材料。关于本领域的定义和术语,请专业人员特别注意sambrook等人,1989和ausubelfm等人,1993。应当理解,本发明不限于所描述的具体方法、方案和试剂,因为它们可能变化。数值范围包括定义范围的数字。术语约在本文中用来表示值的正或负百分之十(10%)。例如,“约100”是指在90和110之间的任何数字。除非另有说明,核酸以5'至3'取向从左到右书写;氨基酸序列以从氨基到羧基取向从左到右书写。本文提供的标题不是本发明的各个方面或实施方案的限制,所述各个方面或实施方案可以通过参考整个说明书来获得。因此,紧靠在下面定义的术语通过参考整个说明书更完整地定义。定义氨基酸:如本文所用,术语“氨基酸”在其最广泛的含义中是指可并入多肽链中的任何化合物和/或物质。在一些实施方案中,氨基酸具有通用结构h2n-c(h)(r)-cooh。在一些实施方案中,氨基酸是天然存在的氨基酸。在一些实施方案中,氨基酸是合成氨基酸;在一些实施方案中,氨基酸是d-氨基酸;在一些实施方案中,氨基酸是l-氨基酸。“标准氨基酸”是指通常在天然存在的肽中发现的二十种标准l-氨基酸中的任一种。“非标准氨基酸”是指除了标准氨基酸以外的任何氨基酸,无论是合成制备的还是从天然来源获得的。如本文所用,“合成氨基酸”包括化学经修饰的氨基酸,包括但不限于盐、氨基酸衍生物(诸如酰胺)和/或取代物。氨基酸,包括肽中的羧基和/或氨基末端氨基酸,可以通过甲基化、酰胺化、乙酰化和/或用其它化学物质取代进行修饰,而不对其活性产生不利影响。氨基酸可以参与二硫键。术语“氨基酸”可与“氨基酸残基”可互换使用,并且可以指游离氨基酸和/或肽的氨基酸残基。无论该术语是指游离氨基酸还是肽的残基,从使用该术语的上下文中都将是显而易见的。应当注意,所有氨基酸残基序列在本文中都由左右取向为氨基末端到羧基末端的常规方向的式表示。碱基对(bp):如本文所用,碱基对是指在双链dna分子中腺嘌呤(a)与胸腺嘧啶(t)或胞嘧啶(c)与鸟嘌呤(g)的配偶体关系。互补:如本文所用,术语“互补”是指通过碱基配对在两个多核苷酸链的区域之间或两个核苷酸之间的序列互补性的广义概念。已知腺嘌呤核苷酸能够与胸腺嘧啶或尿嘧啶核苷酸形成特异性氢键(“碱基配对”)。类似地,已知胞嘧啶核苷酸能够与鸟嘌呤核苷酸碱基配对。dna结合亲和力:如本文所用,术语“dna结合亲和力”通常是指dna聚合酶在结合dna核酸的活性。在一些实施方案中,可以用二条带移位测定来测量dna结合活性。参见,例如,sambrook等人(2001)molecularcloning:alaboratorymanual(3rded.,coldspringharborlaboratorypress,ny)的9.63-9.75(描述核酸的末端标记)。制备反应混合物,其含有在约10μl结合缓冲液(50mm磷酸钠缓冲溶液(ph8.0)、10%甘油、25mmkcl、25mmmgcl2)中的至少约0.5μg多肽。将反应混合物加热至37℃,持续10分钟。将约1×104至5×104cpm(或约0.5-2ng)的标记双链核酸加入反应混合物中并温育另外10分钟。将反应混合物加载到在0.5×tris-硼酸盐缓冲液中的天然聚丙烯酰胺凝胶上。在室温下对反应混合物进行电泳。干燥凝胶并利用标准方法对其进行放射自显影。标记的双链核酸的迁移率的任何可检测的减少表明在多肽和双链核酸之间形成了结合复合物。可以利用标准光密度法来定量上述核酸结合活性以测量相对于在初始反应混合物中的放射性的总量结合复合物中的放射性的量。测量dna结合亲和力的其它方法是本领域已知的(参见例如,kong等人(1993)j.biol.chem.268(3):1965-1975)。延伸率:如本文所用,术语“延伸率”是指dna聚合酶延伸聚合物链的平均速率。如本文所用,高延伸率是指高于2nt/s的延伸率(例如,高于30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140nt/s)。如本申请中所用,术语“延长率”、“延伸率”和“掺入率”可互换使用。酶活性:如本文所用,术语“酶活性”是指dna聚合酶的特异性和效率。dna聚合酶的酶活性也被称为“聚合酶活性”,其通常是指dna聚合酶在催化多核苷酸的模板引导的合成方面的活性。可以利用本领域已知的各种技术和方法来测量聚合酶的酶活性。例如,可以在稀释缓冲液(例如,20mmtris.cl,ph8.0,50mmkcl,0.5%np40,以及0.5%吐温-20)中制备聚合酶的连续稀释物。对于每次稀释,可以除去5μl并加入45μl反应混合物中,所述反应混合物含有25mmtaps(ph9.25)、50mmkcl、2mmmgcl2、0.2mmdatp、0.2mmdgtp、0.2mmdttp、0.1mmdctp、12.5μg活化的dna、100μm[α-32p]dctp(0.05μci/nmol)和无菌去离子水。可以在37℃(或74℃,对于热稳定的dna聚合酶)下温育反应混合物10分钟,然后通过立即将反应冷却至4℃并添加10μl冰冷的60mmedta来终止。可以从每个反应混合物中除去25μl等分部分。可以通过凝胶过滤从每个等分试样中除去未结合的放射性标记dctp(centri-sep,princetonseparations,adelphia,n.j.)。可以使柱洗脱液与闪烁液(1ml)混合。借助于闪烁计数器来定量柱洗脱液中的放射性以测定通过聚合酶合成的产物量。一个单位的聚合酶活性可以定义为在30分钟内合成10纳摩尔产物所必需的聚合酶的量(lawyer等人(1989)j.biol.chem.264:6427-647)。测量聚合酶活性的其它方法在本领域中是已知的(参见,例如,sambrook等人(2001)molecularcloning:alaboratorymanual(第3版,coldspringharborlaboratorypress,ny))。纯化:如本文所用,“纯化的”意味着分子以含有其的样品的至少90重量%、或至少95重量%、或至少98重量%的浓度存在于样品中。分离的:“分离的”分子是与至少一个其它通常与之缔合(例如在其天然环境中)的分子分离的核酸分子。分离的核酸分子包括通常表达核酸分子的细胞中包含的核酸分子,但是核酸分子在染色体外存在或位于不同于其天然染色体位置的染色体位置。%同源性:术语“%同源性”在本文中与术语“%同一性”可互换地使用,并且是指当使用序列比对程序进行比对时,编码本发明多肽的任何一个的核酸序列或本发明多肽的氨基酸序列之间的核酸或氨基酸序列同一性的水平。例如,如本文所用,80%同源性意指与通过明确的算法确定的80%序列同一性相同的事物,且因此给定序列的同源物在给定序列的长度上具有大于80%的序列同一性。序列同一性的示例性水平包括但不限于与给定序列的80、85、90、95、98%或更高序列同一性,例如如本文所述的本发明多肽的任何一种的编码序列。可以用于确定两个序列之间的同一性的示例性计算机程序包括但不限于在因特网上可公开获得的一组blast程序,例如blastn、blastx和tblastx、blastp和tblastn。另见altschul等人,1990和altschul等人,1997。在相对于genbankdna序列和其它公共数据库中的核酸序列评价给定的核酸序列时,通常使用blastn程序进行序列检索。blastx程序优选用于对genbank蛋白序列和其它公共数据库中的氨基酸序列检索已经在所有阅读框中翻译的核酸序列。blastn和blastx两者都使用开放空位罚分(opengappenalty)为11.0和延伸空位罚分(extendedgappenalty)为1.0的默认参数运行,并利用blosum-62矩阵。(参见例如altschul,s.f.等人,nucleicacidsres.25:3389-3402,1997)。使用例如macvector版本13.0.7中的clustal-w程序来执行所选择的序列的优选比对以确定两个或更多个序列之间的“%同一性”,其使用默认参数操作,包括10.0的开放空位罚分、0.1的延伸空位罚分和blosum30相似度矩阵。经修饰的dna聚合酶:如本文所用,术语“经修饰的dna聚合酶”是指这样的dna聚合酶,其源自另一种(即,亲本)dna聚合酶并且与亲本dna聚合酶相比含有一个或多个氨基酸改变(例如,氨基酸取代、缺失、或插入)。在一些实施方案中,本发明的经修饰dna聚合酶源自或修饰自天然存在的或野生型dna聚合酶。在一些实施方案中,本发明的经修饰的dna聚合酶源自或修饰自重组或工程改造的dna聚合酶,包括但不限于嵌合dna聚合酶、融合dna聚合酶或另一种经修饰的dna聚合酶。通常,与亲本聚合酶相比,经修饰的dna聚合酶具有至少一种改变的表型。突变:如本文所用,术语“突变”是指引入亲本序列的改变,包括但不限于取代、插入、缺失(包括截短)。突变的后果包括但不限于在由亲本序列编码的蛋白中未发现的新特征、性质、功能、表型或性状的产生。突变体:如本文所用,术语“突变体”是指经修饰的蛋白,当与亲本蛋白相比时,所述经修饰的蛋白呈现改变的特征。术语“变体”和“突变体”在本文中可互换使用。野生型:如本文所用,术语“野生型”是指当从天然存在的来源分离时具有该基因或基因产物的特征的基因或基因产物。保真度:如本文所用,术语“保真度”是指通过模板依赖性dna聚合酶的dna聚合的精确度或者正确的核苷酸相比于不正确的核苷酸与模板dna的结合的koff的测量的差异。通常通过错误率(掺入不准确的核苷酸,即,不是以模板依赖性方式掺入的核苷酸的频率)来测量dna聚合酶的保真度。通过聚合酶活性和dna聚合酶的外切核酸酶活性来维持dna聚合的精确度或保真度。术语“高保真度”是指错误率低于4.45×10−6(例如,小于4.0×10−6、3.5×10−6、3.0×10−6、2.5×10−6、2.0×10−6、1.5×10−6、1.0×10−6、0.5×10−6)突变/nt/加倍。可以利用本领域已知的测定方法来测量dna聚合酶的保真度或错误率。例如,可以如本文所述或如johnson,等人,biochimbiophysacta.2010may;1804(5):1041–1048中所述来测试dna聚合酶的错误率。纳米孔:如本文所用,术语“纳米孔”通常是指在膜中形成或以其它方式提供的孔、通道或通路。膜可以是有机膜,诸如脂双层,或合成膜,诸如由聚合物材料形成的膜。膜可以是聚合物材料。可以将纳米孔配置为邻近或接近传感电路或耦合到传感电路的电极,诸如例如互补金属氧化物半导体(cmos)或场效应晶体管(fet)电路。在一些实例中,纳米孔具有约0.1纳米(nm)至约1000nm的特征性宽度或直径。一些纳米孔是蛋白。α-溶血素,mspa是蛋白纳米孔的实例。核苷酸:如本文所用,由糖部分(戊糖)、磷酸酯以及含氮杂环碱基构成的dna或rna的单体单元。碱基经由糖苷碳(戊糖的1′碳)而连接至糖部分,并且碱基和糖的组合是核苷。当核苷包含键合至戊糖的3’或5’位置的磷酸酯基团时,它被称作核苷酸。可操作连接的核苷酸的序列在本文中通常称作“碱基序列”或“核苷酸序列”,并且在本文中由这样的式表示,其左方向到右方向是在5’-末端至3’-末端的常规方向。如本文所用,“经修饰的核苷酸”是指多磷酸,例如3、4、5、6、7或8磷酸核苷酸。寡核苷酸或多核苷酸:如本文所用,术语“寡核苷酸”定义为这样的分子,其包括两个或更多个脱氧核糖核苷酸和/或核糖核苷酸,优选多于三个。其确切尺寸将取决于许多因素,其进而取决于寡核苷酸的最终功能或用途。可以合成或通过克隆来获得寡核苷酸。如本文所用,术语“多核苷酸”是指这样的聚合物分子,其由在链中共价键合的核苷酸单体组成。dna(脱氧核糖核酸)和rna(核糖核酸)是多核苷酸的实例。聚合酶:如本文所用,“聚合酶”是指催化核苷酸的聚合(即,聚合酶活性)的酶。通常,该酶将在退火至多核苷酸模板序列的引物的3’-端开始合成,并朝向模板链的5’端进行。“dna聚合酶”催化脱氧核苷酸的聚合。引物:如本文所用,术语“引物”是指这样的寡核苷酸,无论是天然存在的或是合成产生的,当被放置在其中诱导与核酸链互补的引物延伸产物的合成的条件下,例如,在适当缓冲液(“缓冲液”包括ph、离子强度、辅因子等)中存在四种不同三磷酸核苷和热稳定酶的条件下并在适当的温度下,该寡核苷酸能够作为核酸合成的起始点。引物优选为单链,以获得扩增的最高效率,但可选地是双链的。如果是双链的,则在用来制备延伸产物之前首先处理引物以分开其链。优选地,引物是寡脱氧核糖核苷酸。引物必须足够长以在热稳定酶存在的条件下引发延伸产物的合成。引物的准确长度将取决于许多因素,包括温度、引物源以及方法的使用。例如,取决于靶序列的复杂性,寡核苷酸引物通常含有15-25个核苷酸,虽然它可以包含更多或更少的核苷酸。短引物分子通常需要较低的温度以与模板形成足够稳定的杂交复合物。持续合成能力:如本文所用,“持续合成能力”是指聚合酶保持附着于模板以及进行多种修饰反应的能力。“修饰反应”包括但不限于聚合和核酸外切切割。在一些实施方案中,“持续合成能力”是指dna聚合酶进行一系列聚合步骤而没有干预酶与正在生长的dna链的解离的能力。通常,dna聚合酶的“持续合成能力”是通过核苷酸的长度(例如20nts、300nts、0.5-1kb或更长)来测量,其中对核苷酸进行聚合或修饰而没有干预dna聚合酶与正在生长的dna链的解离。“持续合成能力”可以取决于聚合酶的特性、dna模板的序列、以及反应条件,例如,盐浓度、温度或特定蛋白的存在。如本文所用,术语“高持续合成能力”是指与模板的高于20nts(例如,高于40nts、60nts、80nts、100nts、120nts、140nts、160nts、180nts、200nts、220nts、240nts、260nts、280nts、300nts、320nts、340nts、360nts、380nts、400nts或更高)/每次缔合/解离的持续合成能力。可以根据在本文中以及在wo01/92501a1(mjbioworks,inc.,improvednucleicacidmodifyingenzymes,2001年12月06日出版)中所定义的方法来测量持续合成能力。合成:如本文所用,术语“合成”是指用于以模板依赖性方式来制备多核苷酸的新链或延伸现有的多核苷酸(即,dna或rna)的任何体外方法。根据本发明,合成包括扩增,通过使用聚合酶,所述扩增增加多核苷酸模板序列的拷贝数。多核苷酸合成(例如,扩增)导致核苷酸掺入多核苷酸(即,引物)中,从而形成与多核苷酸模板互补的新的多核苷酸分子。形成的多核苷酸分子和其模板可以用作模板来合成另外的多核苷酸分子。如本文所用,“dna合成”包括但不限于pcr、多核苷酸的标记(即,用于探针和寡核苷酸引物)、多核苷酸测序。模板dna分子:如本文所用,术语“模板dna分子”是指这样的核酸链,通过dna聚合酶例如在引物延伸反应中从其合成互补核酸链。模板依赖性方式:如本文所用,术语“模板依赖性方式”是指这样的方法,所述方法涉及引物分子的模板依赖性延伸(例如,通过dna聚合酶的dna合成)。术语“模板依赖性方式”通常是指rna或dna的多核苷酸合成,其中通过众所周知的互补碱基配对规则来决定新合成的多核苷酸链的序列(参见,例如,watson,j.d.等人,in:molecularbiologyofthegene,第4版,w.a.benjamin,inc.,menlopark,calif.(1987))。标签:如本文所用,术语“标签”是指可以是原子或分子或原子或分子的集合的可检测部分。标记可以提供光学、电化学、磁性或静电(例如,电感、电容)特征(signature),该特征可以借助纳米孔检测。标记的核苷酸:如本文所用,术语“标记的核苷酸”是指具有附接的标签的核苷酸或经修饰的核苷酸。所述标签可以共价附接至糖、磷酸(或多磷酸)或碱基。所述标签可以在末端磷酸上。载体:如本文所用,术语“载体”是指设计用于在不同宿主细胞之间转移的核酸构建体。“表达载体”是指能够在外来细胞中并入并表达异源dna片段的载体。许多原核和真核表达载体是可商购的。合适的表达载体的选择在本领域技术人员的知识范围内。本文提供的聚合酶变体可用于如wo2013/188841(geniatechnologies,inc.,chipset-upandhigh-accuracynucleicacidsequencing,2013年12月19日公开)中所述的基于芯片的多核苷酸测序。可用于测序dna的聚合酶的期望特征是:a.慢koff(对于经修饰的核苷酸)b.快kon(对于经修饰的核苷酸)c.高保真度d.低核酸外切酶活性e.dna链置换f.更快的kchem(对于经修饰的核苷酸底物)g.增加稳定性h.持续合成能力i.耐盐性j.与纳米孔的附接相容k.掺入具有4、5、6、7或8个磷酸盐的多磷酸盐,例如四磷酸、五磷酸、六磷酸、七磷酸盐或八磷酸核苷酸的能力l.测序精度m.长读取长度,即长连续读取。命名法在本说明书和权利要求中,使用了氨基酸残基的常规单字母和三字母代码。为便于参考,使用以下命名法来描述本申请的聚合酶变体:原始氨基酸:位置:取代的氨基酸。根据这个命名法,例如,将在位置242由丙氨酸替代丝氨酸显示为:ser242ala或s242a多个突变被加号分开,即:ala30asp+glu34ser或a30n+e34s代表位置30和34的突变,分别用天冬酰胺和丝氨酸替代丙氨酸和谷氨酸。当一个或多个替代的氨基酸残基可以插入给定位置时,其表示为:a30n/e或a30n或a30e。除非另有说明,残基的数目对应于seqidno:2的残基编号。聚合酶的位点定向诱变梭状芽胞杆菌噬菌体phicpv4野生型序列在本文提供(seqidno:3,核酸编码区加his-标签;seqidno:1,蛋白编码区),且可在其它地方获得(国家生物信息学中心(nationalcenterforbioinformatics)或genbank登录号afh27113)。可以使用quikchangelightning2试剂盒(stategene/agilent)遵循制造商的说明引入点突变。引物可以从商业公司例如idtdna订购。纳米孔装配和插入本文描述的方法可以使用具有与纳米孔附着的聚合酶的纳米孔。在一些情况下,期望每个纳米孔具有一个且仅一个聚合酶(例如,使得在每个纳米孔仅仅一个核酸分子被测序)。然而,包括例如α-溶血素(ahl)的许多纳米孔可以是具有多个亚基的多聚体蛋白(例如,对于ahl而言7个亚基)。亚基可以是相同多肽的相同拷贝。本文提供了具有经修饰的亚基(例如a-hl变体)与未修饰的亚基(例如a-hl)的确定比例的多聚体蛋白(例如纳米孔)。本文还提供了用于生产具有经修饰的亚基与未修饰的亚基的确定比例的多聚体蛋白(例如纳米孔)的方法。参考wo2014/074727(geniatechnologies,inc.)的图27,用于组装具有多个亚基的蛋白的方法包含提供多个第一亚基2705并提供多个第二亚基2710,其中当与第一亚基比较时第二亚基被修饰。在一些情况下,第一亚基是野生型(例如,从天然来源纯化或重组生产)。可以以任何合适的方式修饰第二亚基。在一些情况下,第二亚基具有附着(例如,作为融合蛋白)的蛋白(例如,聚合酶)。经修饰的亚基可以包含化学反应性部分(例如,适于形成键的叠氮化物或炔基)。在一些情况下,该方法还包含进行反应(例如,click化学环加成)以将实体(例如聚合酶)附着到化学反应性部分。所述方法还可以包含以第一比率使第一亚基与第二亚基2715接触以形成多个具有第一亚基和第二亚基的蛋白2720。例如,一份经修饰的具有适合于附着聚合酶的反应性基团的ahl亚基可与六份野生型ahl亚基混合(即第一比率为1:6)。多个蛋白可以具有多个第一亚基与第二亚基的比率。例如,混合的亚基可以形成几个具有经修饰的与未修饰的亚基的化学计量分布的纳米孔(例如1:6、2:5、3:4)。在一些情况下,通过简单混合亚基形成蛋白。例如,在ahl纳米孔的情况下,去污剂(例如脱氧胆酸)可以触发ahl单体采取孔构象。纳米孔也可以使用脂质(例如,1,2-双植烷酰基-sn-甘油基-3-磷酸胆碱(dphpc)或1,2-二-o-植烷基-sn-甘油基-3-磷酸胆碱(dophpc))和适度的温度(例如,小于约100℃)形成。在一些情况下,将dphpc与缓冲溶液混合产生大的多层脂质体(lmv),并且向该溶液中加入ahl亚基并将混合物在40℃温育30分钟导致孔形成。如果使用两种不同类型的亚基(例如,天然野生型蛋白和可以含有单个点突变的第二ahl单体),则所得蛋白可以具有混合的化学计量(例如,野生型和突变蛋白的)。这些蛋白的化学计量可以遵循取决于成孔反应中使用的两种蛋白的浓度比例的公式。这个公式如下:100pm=100[n!/m!(n-m)!]·fmutm·fwtn~m,其中pm=具有m个突变亚基的孔的概率n=亚基总数(例如,对于ahl为7)m=“突变”亚基的数目fmut=混合在一起的突变亚基的分数或比率fwt=混合在一起的野生型亚基的分数或比率。该方法还可以包含分级分离多种蛋白以富集具有第一亚基与第二亚基的第二比率的蛋白2725。例如,可以分离具有一个且仅一个经修饰的亚基的纳米孔蛋白(例如,1:6的第二比率)。然而,任何第二比率都是合适的。第二比率的分布也可以被分级分离,例如富集具有一个或两个经修饰的亚基的蛋白。形成蛋白的亚基的总数不总是7(例如,可以使用不同的纳米孔,或者可以形成具有六个亚基的α-溶血素纳米孔),如wo2014/074727的图27所示。在一些情况下,仅具有一个经修饰的亚基的蛋白被富集。在这种情况下,第二比率是每(n-1)个第一亚基1个第二亚基,其中n是构成蛋白的亚基数。第一个比率可以与第二个比率相同,但是这不是必需的。在一些情况下,具有突变的单体的蛋白可以以比不具有突变的亚基的蛋白更低的效率形成。如果是这种情况,那么第一比率可以大于第二比率(例如,如果期望在纳米孔中1个突变的与6个未突变的亚基的第二比率,则形成适当数目的1:6蛋白可能需要以大于1:6的比率混合亚基)。具有不同第二比率亚基的蛋白在分离中可以表现不同(例如,具有不同的保留时间)。在一些情况下,使用色谱分级分离蛋白,例如离子交换色谱或亲和色谱。由于除了修饰之外,第一和第二亚基可以是相同的,所以蛋白上的修饰数目可以作为分离的依据。在一些情况下,第一或第二亚基具有纯化标记(例如,除了修饰之外)以允许或提高分级分离效率。在一些情况下,使用多组氨酸标记(his-标记)、链霉抗生物素蛋白标记(strep-标记)或其它肽标记。在一些情况下,第一和第二亚基各自包含不同的标记,且分级分离步骤基于每个标记进行分级分离。在his-标记的情况下,在低ph下在标记上产生电荷(组氨酸残基在侧链的pka下带正电荷)。利用与其它ahl分子相比ahl分子之一上电荷中的显著差异,可以使用离子交换色谱来分离具有0、1、2、3、4、5、6或7个“电荷-标记的”ahl亚基的寡聚体。原则上,该电荷标记可以是携带均匀电荷的一系列任何氨基酸。图28和图29示出了基于his-标记的纳米孔分级分离的实例。图28显示280纳米处的紫外线吸光度、260纳米处的紫外线吸光度和电导率的曲线图。峰对应于具有各种比率的经修饰的和未修饰的亚基的纳米孔。wo2014/074727的图29​​显示了使用his-标记和strep-标记的ahl纳米孔和其突变体的分级分离。在一些情况下,实体(例如,聚合酶)在分级分离后附着于蛋白。蛋白可以是纳米孔,且实体可以是聚合酶。在一些情况下,该方法还包括将具有第二比率亚基的蛋白插入双层。在一些情况下,纳米孔可以包含多个亚基。聚合酶可以附着到亚基之一,并且至少一个且少于所有亚基包含第一纯化标记。在一些实例中,纳米孔是α-溶血素或其变体。在一些情况下,所有亚基都包含第一纯化标记或第二纯化标记。第一纯化标记可以是多组氨酸标记(例如,在具有附着的聚合酶的亚基上)。附着到纳米孔的聚合酶在一些情况下,聚合酶(例如,dna聚合酶)附着于纳米孔和/或位于纳米孔附近。在纳米孔并入膜之前或之后,聚合酶可以附着到纳米孔。在一些情况下,纳米孔和聚合酶是融合蛋白(即单个多肽链)。聚合酶可以以任何合适的方式附着到纳米孔。在一些情况下,聚合酶附着到纳米孔(例如,溶血素)蛋白单体,并然后组装完整的纳米孔七聚体(例如,以1个具有附着的聚合酶的单体与6个没有附着的聚合酶的纳米孔(例如,溶血素)单体的比率)。然后可以将纳米孔七聚体插入膜中。将聚合酶附着到纳米孔的另一种方法包括将接头分子附着到溶血素单体或使溶血素单体突变以具有附着位点,并然后组装完整的纳米孔七聚体(例如,以1个具有接头和/或附着位点的单体与6个没有接头和/或附着位点的溶血素单体的比率)。然后可以将聚合酶附着到附着位点或附着接头(例如,在插入膜内之前,整批)。在膜中形成(例如,七聚体)纳米孔之后,聚合酶也可以附着到附着位点或附着接头。在一些情况下,将多个纳米孔-聚合酶对插入生物芯片的多个膜(例如,配置在孔和/或电极上)中。在一些情况下,聚合酶与纳米孔复合物的附着发生在生物芯片上的每个电极上。聚合酶可以用任何合适的化学物质(例如共价键和/或接头)附着到纳米孔。在一些情况下,聚合酶用分子订书钉(molecularstaple)附着到纳米孔。在一些情况下,分子钉包含三个氨基酸序列(表示为接头a、b和c)。接头a可以从溶血素单体延伸,接头b可以从聚合酶延伸,然后接头c可以结合接头a和b(例如,通过缠绕接头a和b两者),且从而将聚合酶附着到纳米孔。接头c也可被构造为接头a或接头b的一部分,从而减少接头分子的数目。在一些情况下,使用solulinktm化学法将聚合酶与纳米孔连接。solulinktm可以是hynic(6-肼基烟酸,一种芳族肼)和4fb(4-甲酰基苯甲酸酯,一种芳族醛)之间的反应。在一些情况下,使用click化学(例如可从lifetechnologies获得)将聚合酶连接到纳米孔。在一些情况下,将锌指突变引入溶血素分子中,并然后使用分子(例如,dna中间分子)将聚合酶连接到溶血素上的锌指位点。可用于将聚合酶附接至纳米孔的其它接头是直接的基因连接(例如,(ggggs)1-3(seqidno:4)氨基酸接头),转谷氨酰胺酶介导的连接(例如,rsklg(seqidno:5)),分选酶介导的连接和通过半胱氨酸修饰的化学连接。在本文中有用的特定接头是(ggggs)1-3(seqidno:4),n末端的k-标签(rsklg(seqidno:5)),tev位点(12-25),△tev位点+spycatcher的n末端(12-49)。装置设置纳米孔可以形成于或以其它方式嵌入配置在与​​传感电路(例如集成电路)的传感电极相邻的膜中。集成电路可以是专用集成电路(asic)。在一些实例中,集成电路是场效应晶体管或互补金属氧化物半导体(cmos)。​​传感电路可以位于具有纳米孔的芯片或其它设备中,或者位于芯片或设备外,例如处于芯片外(off-chip)构型。半导体可以是任何半导体,包括但不限于iv族(例如硅)和iii-v族半导体(例如砷化镓)。参见例如wo2013/123450,用于传感核苷酸或标记的装置和设备设置。基于孔的传感器(例如,生物芯片)可以用于单分子的电询问(electro-interrogation)。基于孔的传感器可以包括形成于膜中的本公开内容的纳米孔,所述膜被配置为邻近或接近传感电极。传感器可以包括对电极。膜包括反侧(即,面向传感电极的一侧)和顺侧(即,面向对电极的一侧)。在下面的实验公开内容中,应用以下缩写:eq(当量);m(摩尔);μμ(微摩尔);n(正常);mole(摩尔);mmol(毫摩尔);μmol(微摩尔);nmol(纳摩尔);g(克);mg(毫克);kg(千克);μg(微克);l(升);ml(毫升);μl(微升);cm(厘米);mm(毫米);μm(微米);nm(纳米);℃(摄氏度);h(小时);min(分钟);sec(秒);msec(毫秒)。实施例在以下实施例中进一步解释本发明,这些实施例不以任何方式意图限制所要求保护的本发明的范围。附图应被认为是本发明的说明书和描述的组成部分。所引用的所有参考文献对于其中描述的所有内容都通过引用特别并入本文。提供以下实施例来说明但不限制要求保护的发明。实施例1定向诱变本实施例说明在期望位置将突变引入pol6聚合酶。编码his标记的野生型pol6的dna购自商业来源(dna2.0,menlopark,california)。通过测序验证序列。对于突变体筛选,我们按照原样(n-terhis-pol6)表达聚合酶。为了测试芯片上的pol命中,我们在pol6的n-ter或c-ter中的spycatcher结构域中进行工程改造。基于已知晶体结构的同源建模鉴定影响pol6-核苷酸结合的合理位置。对于初级筛选,使用q5诱变方案将每个合理位置突变为gly、ala、leu、glu、gln、lys、his、tyr、pro、trp、thr或met。每个诱变反应的引物使用neb基本改变方案设计,并以来自idt的96孔板格式排序。使用购自neb的t4多核苷酸激酶(pnk),将正向和反向引物以高通量(htp)形式5'磷酸化。通常的25μl反应物含有15μl10μm的引物、5μl5x反应缓冲液(来自neb)、1.25μlpnk酶、3.75μl水。反应在37℃下进行30分钟,并且将酶在65℃下热灭活20分钟。使用来自neb的q5dna聚合酶进行pcr诱变。通常的25μl反应物含有5μlq5缓冲液、5μlgc增强剂、0.5ul10mmdntp、1.25μl10μm磷酸化诱变正向和反向引物、0.25μlq5聚合酶和1μl5ng/ml野生型pol6模板(即his-pol6)和10.75µlh20。一旦pcr完成,将0.5µldpn1添加至25μlpcr混合物,并在37℃下温育1小时。添加2.5μldpn1处理的pcr产物与2.5μlblunt/ta连接酶主混合物。在室温下温育1小时。将1μl连接混合物添加至20μl96孔bl21de3细胞(emdmillipore),并在冰上温育5分钟。使用pcr装置在42℃下热休克恰好30秒,并在冰上放置2分钟。添加80μlsoc,并在37℃培养箱中温育1小时而不摇动。添加100μlsoc或超纯水,并将其置于具有50-100µg/ml卡那霉素的48孔lb-琼脂平板中。实施例2表达和纯化以下实施例详述如何使用高通量方法表达和纯化pol6变体。将pd441载体(表达质粒)中的编码变体的dna转化至感受态大肠杆菌中并制备甘油储备液。从甘油储备液的小挑取物开始,使1ml起始培养物在具有0.2%葡萄糖和100µg/ml卡那霉素的lb中培养约8小时。将25μl对数期起始培养物转移至96深孔板中的1ml表达培养基(补充有0.2%葡萄糖、50mm磷酸钾、5mmmgcl2和100µg/ml卡那霉素的terrificbroth(tb)自体诱导培养基)中。将板在28℃下以250-300rpm振荡下温育36-40小时。然后经由在4℃下以3200xg离心30分钟来收获细胞。将培养基倾析出,并将细胞沉淀物重新悬浮于200μl预冷裂解缓冲液(20mm磷酸钾ph7.5、100mmnacl、0.5%tween20、5mmtcep、10mm咪唑、1mmpmsf、1xbugbuster、100µg/ml溶菌酶和蛋白酶抑制剂),并在室温下在温和搅动下温育20分钟。然后添加20μl的10x储备液至100µg/mldnase、5mmmgcl2、100µg/mlrnasei的最终浓度,并在冰上温育5-10分钟以产生裂解物。用200μl1m磷酸钾(ph7.5)(最终浓度将为400μl裂解液中的约0.5m磷酸钾)补充裂解物,并经由在4℃下以约1500rpm离心10分钟来过滤通过pall滤板(part#5053,3微米过滤器)。然后将澄清的裂解物应用至平衡的96孔his-purcobalt板(piercepart#90095)并结合15-30分钟。通过以500xg离心3分钟来收集流通物(ft)。然后将ft用400ul洗涤缓冲液1(0.5m磷酸钾ph7.5,1mnacl5mmtcep,20mm咪唑+0.5%tween20)洗涤3次。然后将ft在400ul洗涤缓冲液2(50mmtrisph7.4,200mmkcl,5mmtcep,0.5%tween20,20mm咪唑)中洗涤两次。使用200μl洗脱缓冲液(50mmtrisph7.4,200mmkcl,5mmtcep,0.5%tween20,300mm咪唑,25%甘油)洗脱pol6,并在1-2分钟温育后进行收集。将洗脱液重新应用至相同的his-pur板2-3次,以得到洗脱液中浓缩的pol6。纯化的聚合酶为>95%纯,如通过sds-page所评估。蛋白浓度为~3um(0.35mg/ml),其中260/280比率为0.6,如通过nanodrop所评估。通过荧光置换测定法检查聚合酶活性(参见实施例3)。实施例3活性的测定本实施例提供了测定变体聚合酶的活性的方法。置换测定方案该测定表征突变体聚合酶将多磷酸核苷酸掺入dna链的能力以及其解开和置换双链dna的能力。储备试剂如下:低盐试剂a试剂b试剂浓度浓度kcl21.4mm20mmbicine7.926.75mm25mmedta0.284mmn/atritonx-1000.0535%0.05%dtt5.35mm5mmbsa26.75µg/ml25µg/mldnafret模板71nmn/amgso4n/a20mmn/a=不适用。高盐试剂a试剂b试剂浓度浓度nacl75mm300或150mmhepes7.532.6mm25mmedta0.3mmn/atritonx-1000.065%0.05%tcep6.5mm5mmbsa32.6µg/ml25µg/mldnafret模板87nmn/amgcln/a20mmn/a=不适用。为了筛选单和双突变体:使用试剂a作为稀释剂,以1.42x制备4种不同的核苷酸条件:为了筛选三重突变体:使用试剂a作为稀释剂,以1.42x制备4种不同的核苷酸条件:dnnp是多磷酸核苷酸,其中n是核苷酸(即a、t、c或g),且np是4-8磷酸盐。核苷酸条件1测试高浓度的六磷酸盐下的活性。核苷酸条件2测试低浓度的六磷酸盐下的活性。核苷酸条件3测试错掺入率(即,保真度)。如果突变体聚合酶显示仅4个必需核苷酸中的3个的显著活性,则我们得出结论,其在延伸dna链的同时不区分正确或不正确的核苷酸。核苷酸条件4测试外切核酸酶活性。如果聚合酶显示核苷酸不存在下的显著活性,则我们得出结论,聚合酶表现出外切核酸酶活性。向96孔半区域透明板中的每个反应孔中添加:23μl试剂a/核苷酸混合物2µl聚合酶(1–10µm)在板摇动器上以800rpm摇动~10分钟。向每个孔中添加5µl1.4mnacl,以使nacl浓度高达300mm或向每个孔中添加5µl525mmnacl以使nacl浓度高达150mm。温育30分钟。在bmglabtech平酶标仪中,注入10μl试剂b并读取荧光信号2至10分钟。来自变体聚合酶的置换测定的代表性数据显示于图5中。在存在a.20μmdtnp+15μmda,c,g3p(红色正方形;),b.5μmdtnp+15μmda,c,g3p(蓝色菱形;),c.15μmda,c,g3p(绿色三角形;)或d.在不存在核苷酸(紫色的x)的情况下,使用置换测定法测定聚合酶的活性。a和b显示突变体变体能够沿着dna模板以多磷酸核苷酸掺入和延伸。c显示该变体没有失去其保真度,并且在t核苷酸不存在的情况下没有错误掺入随机核苷酸。d.显示所生成的信号不是所有核苷酸不存在的情况下聚合酶外切核酸酶活性的结果。所有四条曲线都代表在作为聚合酶筛选的一部分的4个不同测定板上测试的单一变体。实施例4koff的测定使用以下停止的流动测定来测定变体聚合酶的koff速率。对于试剂a,在非催化二价金属如ca2+存在的情况下,聚合酶结合至具有cy3(或alexa555)连接的多磷酸核苷酸的荧光素标记的dna模板-引物。这形成fret对,荧光素是供体荧光团,且cy3是受体荧光团。试剂b含有追踪核苷酸。为了该测定的目的,待掺入模板/引物的第一个核苷酸是胞嘧啶。通过混合组分来新鲜制备试剂a(75mmnacl,25mmhepes(ph7.5),2mmcacl2,250nm荧光素-模板/引物,20umdcnp-cy3和>250nm聚合酶),确保最后添加聚合酶。允许聚合酶在试剂a中温育10分钟。制备试剂b(75mmnacl,25mmhepes(ph7.5),2mmcacl2和200umdctp)。当混合试剂a和b时,dctp与dcnp-cy3竞争结合,在dctp浓度过量时观察到荧光增加。该测定可以用停流装置(kintekcorp)或荧光酶标仪进行。将荧光对时间的增加拟合至一阶或二阶指数,以提供该特定聚合酶的动力学常数koff。所选变体的纯化产率和koff呈现于表1中。表1–所选pol6变体的纯化产率和koff。koff(s-1)来自2.5ml制备物的产量(µg)在20um下的良好koff命中和适当良好活性s366a+n535l+a547m0.003977.58来自20mod的命中(在20um六磷酸核苷酸的良好活性,和在0um的非常低或无活性)t651y+p542e+n545k0.05625.16t651y+p542e+q546w0.020164.58s366a+p542e+n545k0.0295125.24来自20msr的命中(在20um的良好活性,在0um的活性)s366a+p542e+i652q0.0440196.63t651y+p542e+s366a0.058310.11来自1msr/1mod的命中且还显示在20um的适度良好活性s366a+n535l+n545k0.010360.25t651y+n535l+n545k0.0273210.66s366a+n535l+t529m0.0327153.09s366a+n535l+i652q0.0097161.55双突变体命中t651y+n535l0.0312281.84s366a+n535l0.0134666.95fp=荧光偏振。对于测定的示意图和示例性反应的图表,参见图3。对于代表性数据,参见图10。实施例5koff的测定本实施例提供了使用荧光偏振来测定koff的替代方法。使用包含25mmtrisph7.0、75mmkcl、0.01%triton-x100、1xbsa(100ug/ml)、0.5mmedta、2mmcacl2、2mmdtt的测定缓冲液来制备含有250nm发夹荧光素标记的dna模板和250nmdc6p-c6-cy3标记的核苷酸的测定主混合物。将五十五微升主混合物添加至黑色96孔costar板的每个孔中;并以高通量(htp)形式添加已从1ml培养物纯化的20μl聚合酶突变体。将平板在平板振荡器上摇动1分钟以允许形成聚合酶-dna模板核苷酸的同质三元复合物。将平板放置在bmgpolarstar酶标仪(bmglabtechinc.,northcarolina)中,并将目标微偏振调节至200mp且10%具有约2000的增益。将激发滤波器设定为485nm,并将发射滤波器设定为590-20nm。用1ml1mmdctp追踪剂核苷酸溶液引发注射器。收集数据,每个间隔每个孔最少30次闪烁,开始总共读取时间为60秒。闪烁增加至50或更高,并且对于显示缓慢解离的命中突变体,取更长读取时间。以注射25μl的1mmdctp开始数据收集。对于测定的示意图和示例性反应的图表,参见图4。对于两种变体聚合酶(s366a+n535l+i652q(b6)和s366a+p542e+i652q(c6))的基于荧光偏振的koff测定的代表性数据,参见图6。mp是微偏振。用天然dctp追踪聚合酶-dna模板-dcnp-alexa555的预形成的三元复合物,并随着时间监测偏振dcnp-alexa555。实施例6kchem的测定本实施例提供了用于测定变体聚合酶的kchem的基于fret的测定法。对于试剂a,聚合酶与荧光素标记的dna模板-引物结合。在催化性二价金属如mg2+存在的情况下,试剂b含有cy3(或alexa555)连接的多磷酸核苷酸。为了该方案的目的,待掺入模板/引物的第一个核苷酸是胞嘧啶。制备试剂a(75mmnacl,25mmhepes(ph7.5),250nm荧光素-模板/引物,>250nm聚合酶)。使聚合酶在试剂a中温育10分钟。制备试剂b(75mmnacl,25mmhepes(ph7.5),10mmmgcl2和20umdcnp-cy3)。当混合试剂a和b时,聚合酶-荧光素-模板-引物复合物结合dcnp-cy3并猝灭荧光。mg2+能够使聚合酶掺入核苷酸,其释放裂解产物,具有附接的cy3的焦磷酸盐,np-cy3。由于释放猝灭剂,荧光增加。该测定可以用停流装置(kintekcorp)或荧光酶标仪进行。对于测定的示意图和示例性反应的图表,参见图2。对于代表性数据,参见图9。实施例7附接至纳米孔本实施例提供了将变体聚合酶附接至纳米孔(例如,α-溶血素)的方法。聚合酶可以通过任何合适的方式与纳米孔偶联。参见,例如pct/us2013/068967(公开为wo2014/074727;geniatechnologies,inc.),pct/us2005/009702(公开为wo2006/028508;presidentandfellowsofharvardcollege)和pct/us2011/065640(公开为wo2012/083249;columbiauniversity)。聚合酶例如变体pol6dna聚合酶通过接头分子与蛋白纳米孔(例如α-溶血素)偶联。具体地,使用spytag和spycatcher系统,其在生理条件下自发形成共价的异肽键。参见,例如,li等人,jmolbiol.2014年1月23日,426(2):309-17。pol6变体spycatcherhistag根据实施例2表达,并使用钴亲和柱进行纯化。将spycatcher聚合酶和spytag寡聚纳米孔的蛋白在4℃在3mmsrcl2中温育过夜。然后使用尺寸排阻色谱纯化1:6-聚合酶-模板复合物。所述接头附接在pol6变体的n末端或c末端。发现n末端附接的变体更稳健,例如更稳定。因此,使用n末端附接的接头。实施例8生物芯片上的活性本实施例证明纳米孔结合的变体聚合酶结合标记的核苷酸并由此允许在聚合酶附接的纳米孔处检测阻断的通道电流的能力。将聚合酶附接至纳米孔,并将其包埋在半导体传感器芯片(也称为生物芯片)上的孔上的脂质双层中。形成脂质双层并插入具有附接的聚合酶的纳米孔,如pct/us2014/061853(标题为“methodsforforminglipidbilayersonbiochips”,并于2014年10月22日提交)中所述。在低盐条件下,变体聚合酶与模板dna复合。在静态捕获实验中测定纳米孔结合-变体聚合酶结合标记的核苷酸的能力,由此标记的核苷酸被聚合酶结合,并且当标记的核苷酸被呈递给纳米孔时,测量阻断的通道电流。在ca2+存在下进行静态捕获实验,所述ca2+阻止dna的催化和延长,并允许检测相同类型的标记核苷酸的重复捕获。在本实验中,使用的标记核苷酸是dtnp-标签。与生物芯片上的α溶血素纳米孔偶联的示例性聚合酶变体pol6(s366a+n535l+i652q),并与模板dna复合。在高于和低于双层的20mmhepes7.5、300mmnacl、3mmcacl2和5mmtcep存在的情况下,以100mv记录pol6(s366a+n535l+i652q)-dna复合物对标记的胸苷核苷酸的静态捕获(标签为t30(seqidno:9))。结果显示于图7和8中。图7中的迹线显示作为时间的函数的通过孔以100mv测量的电解电流。该电压下的开孔电流为约1na(最上面的迹线);并且在相同电压下的阻断的孔电流为约0.33na(中间迹线)。根据系统软件将开放通道电流针对1均一化,并且将阻断的通道电流通过dtnp-t30(seqidno:9)降低至开放通道电流的33%。该迹线中显示的电流阻断与在纳米孔附近发生的变体pol6-dna复合物对胸苷多磷酸结合相关。图7中相应的最上面的柱状图(右)显示在100mv下观察到的电流阻断的频率,其中电流的变化针对同一孔中的开孔电流均一化;并且对应于中间迹线的柱状图(右)显示在100mv下观察到的电流阻断的频率,其中电流的变化针对同一孔中的阻断的孔电流均一化。图8显示图7中所示的标记胸苷的静态捕获的停留时间。图8(左)显示作为针对开放通道电流均一化的电流的函数的变体pol6结合标记的dtnp的发生次数的柱状图。dtnp-标记的核苷酸的每次捕获的平均停留时间被确定为1.2秒。孔中的标签的背景捕获(即非聚合酶介导的)具有在几毫秒范围内的停留时间(数据未显示)。酶进化的目标是提高标记的多磷酸核苷酸的解离速率,因此你可以看到足够长的停留时间来记录与背景完全区分的聚合酶介导的捕获。如图8中所示,1.2秒的平均停留时间远远高于背景。室指标是本实验中使用的芯片上存在的大约8000个室的基于颜色的方案。数据显示,示例性变体聚合酶pol6(s366a+n535l+i652q)能够结合标记的核苷酸并且允许检测通过聚合酶所附接的纳米孔的电流变化。结果提供证据证明,附接至生物芯片上的纳米孔的变体聚合酶可以以高保真度结合标记的核苷酸,并持续停留时间将标记的核苷酸呈递至纳米孔以提供足够的时间来检测核苷酸掺入,并且可能减少在纳米孔测序期间测序错误(例如插入、缺失等)的可能性。实施例9滚环扩增测定本实施例描述了在基于滚环的测定中多核苷酸模板的扩增。使用的模板是室内模板hfcirc10。这是简单的环状模板~150bp长。测定在40μl(28μl试剂a+2μl2μm聚合酶+10μl试剂b)的总反应体积中运行。试剂a:kglu75mmhepes7.525mmedta0.2mmtritonx-1000.05%tcep5mmbsa25µg/ml引发的环状模板100nmdntps/dn6ps/标签25µm试剂b:hepes7.525mmkgluvariedmmtritonx-1000.05%tcep5mmbsa25µg/mlmgcl240mm将2μl2μm聚合酶添加至28μl试剂a中,以便在最终的40μl测定混合物中提供dna与聚合酶(各100nm)的1:1摩尔比。将试剂a/聚合酶混合物在该75mm盐条件下温育10分钟,以使聚合酶结合dna。接下来,将10μl试剂b添加至试剂a/聚合酶混合物中以开始反应。在预定时间点,从反应中取出10μl样品,并用50mmedta添加至10μl甲酰胺中以猝灭反应。在时间点0分钟、10分钟、30分钟和40分钟取样。将甲酰胺样品加热至94℃约3分钟以使蛋白和dna的二级结构变性。不允许样品冷却至4℃。添加2µl100xsybrgreen或gold染料。在100v下,将15μl各样品在1.2%琼脂糖凝胶上运行1小时15分钟。使用蓝色托盘获得凝胶的图像,用于bioradgeldocez成像仪。图11显示测定的40分钟时间点结果。泳道1和19中显示分子梯,从左到右编号。泳道2具有来自t=0的样品;没有产物可见。泳道3-18中的每一个是不同的变体pol6聚合酶。所示的所有变体都能够进行链置换并生成具有所有六磷酸核苷酸的长千碱基dna产物。实施例10使用标记的核苷酸测序模板dna本实施例证明,所述变体聚合酶在生物芯片上的边合成边测序方法中是有功能的。使用pol6-26i-d44a聚合酶在20mmhepes(ph8)、500mm谷氨酸钾和3mmmgcl2下在室温下对异源聚合物模板进行ac测序。如本文所述,将具有附接的聚合酶的纳米孔嵌入脂质双层中。添加引物的dna并使之与聚合酶复合。以25μm的浓度添加四种不同的标记的核苷酸。边合成边测序可以如题为“nucleicacidsequencingusingtags”的wo2014/074727中所述进行。图12中的迹线显示异源聚合物模板的76%的测序精度和96bp读取长度。引文列表专利文献[1]pct/us2005/009702(2006年3月16日作为wo2006/028508公开;presidentandfellowsofharvardcollege;题为methodsandapparatusforcharacterizingpolynucleotides.[2]pct/us2011/065640(2012年6月21日作为wo2012/083249公开;columbiauniversity;题为dnasequencingbysynthesisusingmodifiednucleotidesandnanoporedetection).[3]pct/us2013/068967(2014年5月15日作为wo2014/074727公开;geniatechnologies;题为nucleicacidsequencingusingtags).[4]pct/us2013/046012(geniatechnologies,inc.,题为chipset-upandhigh-accuracynucleicacidsequencing,2013年12月19日作为wo2013/188841公开).[5]us2013/0053544(isisinnovationlimited)题为peptidetagsystemsthatspontaneouslyformanirreversiblelinktoproteinpartnersviaisopeptidebonds.非专利文献[1]altschul,s.f.,等人,j.mol.biol.(1990)215:403-410.[2]altschul,s.f.,等人,nucleicacidsres.25:3389-3402,1997.[3]ausubel,frederick等人,(1992)shortprotocolsinmolecularbiology,currentprotocolsinmolecularbiology,2nded.,greenepublishingassociates&johnwiley&sons.newyork,n.y.[4]gardner等人,nucleicacidsres.(2012)pages1-12(doi:10.1093/nar/gks330;firstpublishedonline:may8,2012).[5]hale&marham,theharpercollinsdictionaryofbiology,harperperennial,ny(1991).[6]johnson,等人,biochimbiophysacta.2010may;1804(5):1041–1048.[7]kong等人(1993)j.biol.chem.268(3):1965-1975).[8]lawyer等人(1989)j.biol.chem.264:6427-647.[9]li等人,jmolbiol.2014jan23;426(2):309-17.[10]sambrook等人,(1989)molecularcloning:alaboratorymanual(2nded.,coldspringharborlaboratorypress,ny).[11]sambrook等人(2001)molecularcloning:alaboratorymanual(3rded.,coldspringharborlaboratorypress,ny)at9.63-9.75(describingend-labelingofnucleicacids).[12]singleton,等人,dictionaryofmicrobiologyandmolecularbiology,2ded.,johnwileyandsons,newyork(1994).[13]watson,j.d.等人,in:molecularbiologyofthegene,4thed.,w.a.benjamin,inc.,menlopark,calif.(1987)).[14]zakari和howarth,(2010)spontaneousintermolecularamidebondformationbetweensidechainsforirreversiblepeptidetargeting,j.am.chem.soc.,132(13):4526–4527.[15]zakari,b.等人,(2012)peptidetagformingarapidcovalentbondtoaprotein,throughengineeringabacterialadhesion,pnas109(12):e690–e697.当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1