酶-孔构建体的制作方法

文档序号:518989阅读:261来源:国知局
酶-孔构建体的制作方法
【专利摘要】本发明涉及包含跨膜蛋白孔亚基和核酸操作酶的构建体。所述孔亚基与所述酶共价结合,从而所述亚基与所述酶均保留其活性。所述构建体可用于产生其上结合有核酸操作酶的跨膜蛋白孔。这些孔特别可用于测序核酸。所述酶操作核酸的方式使得所述孔可通过随机传感来检测其组成核苷酸。
【专利说明】酶-孔构建体
[0001]本申请为分案申请,其原申请的申请日为2009年7月6日,申请号为200980134886.6 (国际申请号为PCT/GB2009/001679),名称为“酶-孔构建体”。
【技术领域】
[0002]本发明涉及包含跨膜蛋白孔亚基和核酸操作酶(nucleic acid handlingenzyme)的构建体。所述孔亚基与所述酶共价结合使得所述亚基与所述酶均保留其活性。所述构建体可用于产生结合有核酸操作酶的跨膜蛋白孔。这些孔特别可用于核酸测序。所述酶操作核酸的方式使得所述孔可通过随机传感来检测其每个组成核苷酸。
【背景技术】
[0003]随机传感是一种依赖于对分析物分子与受体之间个体结合事件的观察结果的传感方法。随机传感器可通过如下方式形成:将纳米尺寸的单孔置入绝缘膜中,并且在存在分析物分子的情况下测量电压驱动的穿过所述孔的离子转运。电流波动的发生频率可揭示在所述孔中结合的分析物的浓度。分析物的种类通过其特征性的电流特征特别是电流阻断的持续时间和程度而示出(Braha, 0., Walker, B., Cheley, S., Kasianowicz, J.J., Song, L., Gouaux, J.E., and Bayley, H.(1997) Chem.Biol.4, 497-505 ; andBayley, H., and Cremer, P.S.(2001)Nature413, 226-230)。
[0004]形成细菌孔的毒素α-溶血素(α-HL)的基因工程改造形式已用于对许多类型的分子进行随机传感(Bayley, H., and Cremer, P.S.(2001) Nature413, 226-230; Shin, S., H., Luchian, T., Cheley, S., Braha, 0., and Bayley, H.(2002) Angew.Chem.1nt.Ed.41, 3707-3709; Guan, X., Gu, L.-Q., Cheley, S., Braha, 0., and Bayley, H.(2005)ChemBio Chem6,1875-1881)。在这些研究的过程中,已发现,试图将a-HL改造以直接结合小的有机分析物的尝试是很费力的,并且鲜有成功的实例(Guan,X.,Gu, L.-Q.,Cheley, S., Braha, 0., and `Bayley, H.(2005) ChemBio Chem6, 1875-1881)。幸运地是,人们发现了一种不同的策略,该策略利用了非共价结合的分子衔接体,特别是环糊精(Gu,L? -Q., Braha, 0., Conlan, S., Cheley, S., and Bayley, H.(1999) Nature398, 686-690)、环妝(Sanchez-Quesada, J., Ghadiri, M.R., Bayley, Η., and Braha, 0.(2000) J.Am.Chem.Soc.122,11758-11766)和葫芦脲(Braha, 0.,Webb, J.,Gu, L.-Q.,Kim, K.,and Bayley, H.(2005) ChemPhysChem6, 889-892)。环糊精可短暂地进入所述a -HL孔中,并产生很大程度但不完全的通道阻断。有机分析物在环糊精的疏水内部发生结合,它们可加强这种阻断,使得可实现分析物检测(Gu, L.-Q., Braha, 0., Conlan, S., Cheley, S., and Bayley, H.(1999)Nature398, 686-690)。
[0005]现在在大范围应用中需要快速且廉价的DNA或RNA测序技术。现有的技术速度慢且价格昂贵,这主要是由于其倚赖于扩增技术产生大量核酸并且需要大量专用的荧光化学物质进行信号检测。随机传感有可能通过减少所需核苷酸和试剂的量提供快速且廉价的DNA测序。
【发明内容】

[0006]发明人出人意料地证明了跨膜蛋白孔亚基与核酸操作酶的共价结合,可产生既能形成孔又能操作核酸的构建体。发明人还出人意料地证明了所述构建体可用于产生一种既能操作核酸又能通过随机传感测序核酸的跨膜蛋白孔。所述酶与所述孔的固定性质与紧密接近是指靶核酸中的核苷酸的一部分会与所述孔相互作用并以特征性的方式影响流过所述孔的电流。因此,包含这种构建体的跨膜蛋白孔是用于随机传感特别是用于测序核酸的有用工具。
[0007]因此,本发明提供了一种包含跨膜蛋白孔亚基和核酸操作酶的构建体,其中所述亚基与所述酶共价结合,其中所示亚基保留其形成孔的能力并且其中所述酶保留其操作核酸的能力。本发明还提供了:
[0008]-一种编码本发明构建体的核酸序列;
[0009]-一种用于测序核酸的改性孔,包含至少一种本发明构建体;
[0010]-一种产生用于测序核酸的经改变的孔的试剂盒,包含:
[0011](a)至少一种本发明构建体;和
[0012](b)形成孔所需的任何其他亚基;
[0013]-一种产生用于测序核酸的经改变的孔的试剂盒,包含:
[0014](a)至少一种本发明的多核苷酸;和
[0015](b)编码形成孔所需的任何其他亚基的多核苷酸序列;
[0016]-一种产生本发明构建体的`方法,包括:
[0017](a)使核酸操作酶与跨膜蛋白孔亚基共价结合;和
[0018](b)确定所得构建体是否能够形成孔和操作核酸;
[0019]-一种产生本发明的经改变的孔的方法,包括:
[0020](a)使核酸操作酶与跨膜蛋白孔共价结合;和
[0021](b)确定所得孔是否能够操作核酸并检测核酸;
[0022]-一种产生本发明的经改变的孔的方法,包括:
[0023](a)使至少一种本发明构建体与其他合适的亚基形成孔;和
[0024](b)确定所得孔是否能够操作核酸并检测核苷酸;
[0025]-一种纯化包含至少一种本发明构建体的跨膜孔的方法,包括:
[0026](a)提供所述至少一种构建体与形成孔所需的其他亚基;
[0027](b)使所述至少一种构建体与其他亚基在合成脂质囊泡上寡聚体化;和
[0028](C)使所述囊泡与非离子表面活性剂接触;和
[0029](d)回收所述寡聚体化的孔;
[0030]-一种测序靶核酸序列的方法,包括:
[0031](a)使所述靶序列与本发明的孔一其包含核酸外切酶一接触,从而使所述核酸外切酶从所述靶序列的一端消化单个核苷酸;
[0032](b)使所述核苷酸与所述孔接触从而使所述核苷酸与所述衔接体相互作用;
[0033](C)测量在相互作用过程中通过所述孔的电流并且从而确定所述核苷酸的种类;和[0034](d)在靶序列的同一端重复步骤(a)到(C)从而确定所述靶序列的序列;以及
[0035]-一种测序靶核酸序列的方法,包括:
[0036](a)使所述靶序列与本发明的孔接触从而使所述酶将所述靶序列推过或拉过所述孔,所述靶序列中核苷酸的一部分与所述孔相互作用;和
[0037](b)测量在每个相互作用过程中通过所述孔的电流并且从而确定所述靶序列的序列。【专利附图】

【附图说明】
[0038]图1示出了核酸外切酶如何催化磷酸二酯键的水解。在所述核酸外切酶的活性位点内,水分子能够与多核苷酸(DNA)的3’末端的磷酸基反应。磷酸基与糖之间的键向5’端的断裂可释放出单磷酸(脱氧)核苷。
[0039]图2示出了实施例中所用的核酸外切酶的晶体结构,对每种核酸外切酶均示出了N和C末端及活性位点:i)适应性修改形式的EcoExoIII ;ii)EcoExoI ;iii)TthRecJ-cd ;和iV)Lambda exo。
[0040]图3示出了装配有a-HL孔的核酸外切酶的示意图。核酸外切酶与所述七聚体的七个单体之一在基因上融合,其中连接臂足够长以使得核酸外切酶部分和a -HL部分可正确蛋白折叠。
[0041]图4示出了所产生的蛋白构建体的通式图,其示出了在α-HL基因中的BspEI插入位点。由编码(丝氨酸/甘氨酸)X5重复物(显示为阴影)的两段DNA界定的连接物AfuExoIII可产生一个融合蛋白,其中在所示T7启动子的转录控制下会产生64.5kDa的蛋白。
[0042]图5示出了 a -HL环I融合构建体与野生型a -HL以不同蛋白比例的寡聚体化。i) HL-Wt-EcoExoII1-L1-H6 ;ii)HL-RQC-EcoExo1-Ll-H6 ;和 iii) HL-RQC-TthRecJ-L1-H6。
[0043]图6示出了通过不同单体比例控制同七聚体和异七聚体的产生。HL-RQ亚基以白色示出,融合亚基以黑色示出。增大融合亚基与野生型亚基的比例可增加2: 5、1:6和0:7的异七聚体和同七聚体的产生。类似地,升高HL-RQ单体的浓度可增加6:1和5:2的异七聚体的产生。
[0044]图7示出了含有刚性聚脯氨酸EcoExoIII C末端接头的HL-RQC-EC0EX0II1-L1-H6融合蛋白的寡聚体化。在纯化的兔红细胞膜的存在下,IVTT表达以5:1的野生型与融合蛋白的比例混合的蛋白。i)HL-RQC-EC0Ex0II1-Ll-{SG}5+{SG}5-H6 ; ii)HL-RQC-EcoExoII1-Ll-{SG}5+5P-H6 ; iii)HL-RQC-EcoExoII1-Ll-4SG+5P-H6;和iv) HL单体。
[0045]图8示出了具有成熟七聚体的单α-溶血素亚基的环2区。亚基I以白色示出,亚基2-7以灰色示出,亚基I的环2区以黑色示出。
[0046]图9示出了其他环2EcoExoIII融合蛋白的寡聚体化。i)
[0047]HL-(RQ)7 ;ii) HL- (RQ) 6 (RQC-EcoExoII1-L2a-H6)! ;iii)
[0048]HL- (RQ) 6 (RQC-EcoExo 111 -L2a-8P_H6)! ; i v)
[0049]HL- (RQ) 6 (RQC-EcoExo111-L2-H48 Δ -H6)! ;v)
[0050]HL- (RQ) 6 (RQC-EcoExo111-L2-D45 Δ -H6)! ;vi)[0051]HL- (RQ) 6 (RQC-EcoExo111-L2-D45-K46 Δ -H6)!;和 vii)
[0052]HL- (RQ) 6 (RQC-EcoExo 111-L2-D45-N47 Λ -H6)!。
[0053]图10示出了其他环2EcoExoIII融合蛋白的寡聚体化。i)
[0054]HL-(RQ)7 ; i i) HL- (RQ) 6 (RQC-EcoExo 111-L2a-H6)! ;iii)
[0055]HL- (RQ) 6 (RQC-EcoExo 111-L2-D45-N47 Δ -H6)! ;iv)
[0056]HL- (RQ) 6 (RQC-EcoExo111-L2-D46-K56 Δ -Η6)! ;ν)
[0057]HL- (RQ) 6 (RQC-EcoExo111-L2-D46 Δ -Η6)! ;ν?)
[0058]HL- (RQ) 6 (RQC-EcoExo 111-L2-D46-N47 Δ -Η6)! ;vii)
[0059]HL- (RQ) 6 (RQC-EcoExoII1-L2-Al-S16 Δ /D46-N47 Δ -Η6)! ;viii)
[0060]HL-(RQ) 6 (RQC-EcoExoII1-L2-F42-D46 Δ -Η6)!;和 ix)
[0061 ] HL- (RQ) 6 (RQC-EcoExo 111-L2-143-D46 Δ -H6)!。
[0062]图11示出了 EcoExoIII C末端融合蛋白的寡聚体化。a)指示溶血素和酶融合蛋白单体均被放射性标记,b)指示仅融合蛋白单体被放射性标记。i)HL-(RQ)6(RQC-EcoExo1-Cter-{SG}8-H6)1;ii)
[0063]HL- (RQ) 6 (RQC-EcoExo1-Cter-DG {SG} 8-H6) 1;iii)
[0064]HL- (RQ) 6 (RQC-EcoExo1-Cter-ffPV {SG} 8-H6)!; iv)
[0065]HL- (RQ) 6 (RQC-EcoExoI—Cter—DGS {P} 12—H6) 1;和 v)
[0066]HL- (RQ) 6 (RQC-EcoExo1-Cter-ffPV {P} 12-H6)
[0067]图12示出了不同表面活性剂对EcoExoIII活性的效应。左图一十二烷基硫酸
钠(SDS):a:0% ;b:0.1% ;c:0.5%。右图-正十二烷基 _D_ 麦芽糖苷(DDM):a:0% ;b:0.1% ;
c:0.25% ;d:0.5%ο
[0068]图13示出了大肠杆菌(E.coli)BL21(DE3)pLyS表达的α-溶血素单体的寡聚体化,用于优先形成和纯化6:1异七聚体。将His-标签纯化用于在异七聚体和野生型同七聚体之间进行选择,以得到大量过量的6:1异七聚体。
[0069]图14示出了单体和异七聚体融合蛋白的核酸外切酶活性。左图——野生型和融合单体的活性:a,10_2稀释的
[0070]HL-RQC-EcoExoII1-L1-H6 ;b, 10-4 稀释的
[0071]HL-RQC-EcoExoII1-L1-Η6 ;c, 1(T6 稀释的
[0072]HL-RQC-EcoExoII1-L1-Η6 ;d, 1(T2 稀释的 HL-RQ。右
[0073]图——HL-(RQ) 6 (RQC-EcoExoII1-Ll-H6)!的活性:a,DDM 粗提取物;b,纯化的N1-NTA ;c,纯化的N1-NTA和缓冲液置换。
[0074]图15示出——HL-(RQ)6(RQc-EcoExoII1-Ll-He)1异七聚体的碱基检测。上迹线获自与ame-amPDP1- β CD衔接体分子共价结合的异七聚体。可观察到其他阻断事件,所述阻断事件是由进行碱基识别的单个单磷酸核苷造成的。下图表示出了上迹线的DNMP事件的相应直方图。从左到右,峰分别对应G、T、A和C。数据在400/400mM KC1、180mV和10 μ MdNMP下获取。
[0075]序列表说明
[0076]SEQ ID NO:1示出了编码野生型α -溶血素(a -HL)的一个亚基的多核苷酸序列。
[0077]SEQ ID NO: 2示出了野生型a-HL的一个亚基的氨基酸序列。氨基酸2_6、73_75、207-209,214-216 和 219-222 构成 α -螺旋。氨基酸 22-30、35-44、52-62、67-71、76_91、98-103、112-123、137-148、154-159、165-172、229-235、243-261、266-271、285-286 和291-293 构成 β-链。所有其他非末端氨基酸,即 7-21、31-34、45-51、63-66、72、92-97、104-111、124-136、149-153、160-164、173-206、210-213、217、218、223-228、236-242、262-265,272-274和287-290构成环区。氨基酸I和294为末端氨基酸。
[0078]SEQ ID Ν0:3示出了编码a-HL Ml13R/N139Q(HL-RQ)的一个亚基的多核苷酸序列。
[0079]SEQ ID Ν0:4示出了 a-HL Ml 13R/N139Q (HL-RQ)的一个亚基的氨基酸序列。在野生型α-HL中构成α-螺旋、β _链和环区的相同氨基酸在此亚基中构成相应的区域。
[0080]SEQ ID N0:5*m7pT7a-HL BspEI 敲除的多核苷酸序列(pT7-SCl_BspEI_K0)。a -HL编码序列在核苷酸2709和3593之间。BspEI其余部分位于核苷酸3781和3782。
[0081]SEQ ID N0:6示出了在位置I(Ll)含有BspEI克隆位点的编码野生型a -溶血素的一个亚基的多核苷酸序列。
[0082]SEQ ID NO: 7示出了在位置2 (L2a)含有BspEI克隆位点的编码野生型α -溶血素的一个亚基的多核苷酸序列。
[0083]SEQ ID Ν0:8示出了在位置2 (L2b)含有BspEI克隆位点的编码野生型α -溶血素的一个亚基的多核苷酸序列。
[0084]SEQ ID NO:9示出了源于大肠杆菌的xthA基因的密码子优化的多核苷酸序列。其编码大肠杆菌的核酸外切酶III。
[0085]SEQ ID NO: 10示出了大肠杆菌的核酸外切酶III的氨基酸序列。此酶以3’到5’方向从双链DNA(dsDNA)的一条链持续消化5’单磷酸核苷。酶在链上的启动需要大约4个核苷酸的 5,突出。氨基酸 11-13、15-25、39-41、44-49、85-89、121-139、158-160、165-174、181-194、198-202、219-222、235-240 和 248-252 构成 α -螺旋。氨基酸 2-7、29_33、53_57、65-70、75-78、91-98、101-109、146-151、195-197、229-234和 241-246 构成 β -链。所有其他非末端氨基酸 8-10、26-28、34-38、42、43、50-52、58-64、71-74、79-84、90、99、100、110-120、140-145、152-157、161-164、175-180、203-218、223_228、247 和 253-261 构成环。氨基酸 I 和267和268为末端氨基酸。酶活性位点通过连接β厂α η β 3- β 4、β 5- β 6、β ΙΠ- Q1^iv-Q11和 βν_βνι 的环区(分别由氨基酸 8-10、58-64、90、110-120、152-164、175-180、223-228 和253-261构成)形成。单个二价金属离子结合于残基Ε34并通过D229和Η259组氨酸-天门冬氨酸催化对辅助对磷酸二酯键的亲核攻击。
[0086]SEQ ID NO: 11示出了源于大肠杆菌的sbcB基因的密码子优化的多核苷酸序列。其编码大肠杆菌的核酸外切酶I (EcoExoI)。
[0087]SEQ ID NO: 12示出了大肠杆菌的核酸外切酶I (EcoExoI)的氨基酸序列。此酶以3’到5’方向从单链DNA(ssDNA)持续消化5’单磷酸核苷。酶在链上的启动需要至少12个核苷酸。氨基酸 60-68、70-78、80-93、107-119、124-128、137-148、165-172、182-211、213-221、234-241、268-286、313-324、326-352、362-370、373-391、401-454 和 457-475 构成 α-螺旋。氨基酸 10-18、28-26、47-50、97-101、133-136、229-232、243-251、258-263、298-302 和308-311 构成 β-链。所有其他非末端氨基酸 19-27、37-46、51-59、69、79、94-96、102-106、120-123、129-132、149-164、173-181、212、222-228、233、242、252-257、264-267、287-297、303-307、312、325、353-361、371、372、392-400、455 和 456 构成环。氨基酸 1-9 为末端氨基酸。所述酶的整体折叠使得三个区域联合以形成一个字母C外形的分子,但无序分布在所述晶体结构中的残基355-358有效地将此C形转化为类O形。氨基末端(1-206)可构成外切酶结构域并与DnaQ超家族具有同源性,如下残基(202-354)构成SH3样结构域并且羧基结构域(359-475)伸出外切酶结构域,以形成该分子的C形。EcoExoI的4个酸性残基与DnaQ超家族的活性位点残基是保守的(对应于D15、E17、D108和D186)。已经提出,单个金属离子被残基D15和108结合。DNA的水解似乎通过以活性水分子攻击易切断的磷酸基进行催化,以H181为催化残基并比对所述核苷酸底物。
[0088]SEQ ID NO: 13示出了源于嗜热栖热菌(T.thermophilus)的recj基因的密码子优化的多核苷酸序列。其编码嗜热栖热菌的RecJ酶(TthRecJ-cd)。
[0089]SEQ ID NO: 14示出了嗜热栖热菌的RecJ酶(TthRecJ-cd)的氨基酸序列。此酶以5’到3’方向从单链DNA持续消化5’单磷酸核苷。酶在链上的启动需要至少4个核苷酸的链。氨基酸 19-33、44-61、80-89、103-111、136-140、148-163、169-183、189-202、207-217、223-240、242-252、254-287、302-318、338-350 和 365-382 形成 α -螺旋。氨基酸36-40、64-68、93-96、116-120、133-135、294-297、321-325、328-332、352-355 和 359-363 构成链。所有其他非末端氨基酸 34、35、41-43、62、63、69-79、90-92、97_102、112-115、121-132、141-147、164-168、184-188、203-206、218-222、241、253、288-293、298-301、319、320、326、327、333-337、351-358和364构成环。氨基酸1-18和383-425为末端氨基酸。仅对嗜热栖热菌(Thermus thermophilus)的RecJ的核心结构域(残基40-463)解析了晶体结构。为确保所述RecJ核心结构域的翻译和体内表达的启动,在其氨基末端添加一个甲硫氨酸残基,这不包含在晶体结构信息中。所解析的结构示出了由一个长α-螺旋(254-287)连接的两个结构域:氨基区(2-253)和羧基区(288-463)。催化残基(D46、D98、H122和D183)配位单二价金属离子用于对磷酸二酯键进行亲核攻击。D46和H120被认为是催化对;然而,大肠杆菌的RecJ中这些保守残基的任一个的突变均显示会完全破坏活性。
[0090]SEQ ID NO: 15示出了源于噬菌`体λ的exo (redX)基因的密码子优化的多核苷酸序列。其编码噬菌体λ的核酸外切酶。
[0091]SEQ ID NO: 16示出噬菌体λ的核酸外切酶的氨基酸序列。该序列是装配为三聚体的三个相同亚基之一。该酶以3’到5’方向高度持续消化dsDNA的一条链的核苷酸。酶在链上的启动优选地需要大约4个具有5’磷酸基的核苷酸的5’突出。氨基酸3-10、14-16、22-26、34-40、52-67、75-95、135-149、152-165 和 193-216 构成 α-螺旋。氨基酸 100-101、106-107、114-116、120-122、127-131、169-175 和 184-190 构成 β-链。所有其他非末端氨基酸 11-13、17-21、27-33、41-51、68-74、96-99、102-105、108-113、117-119、123-126、132-134、150-151、166-168、176-183、191-192、217-222 构成环。氨基酸 1、2 和 226 为末端氨基酸。λ外切酶是一个同三聚体,其形成具有通过中间的锥形通道的环状体,所述通道明显足够大以使dsDNA在一端进入,并且只有ssDNA在另一端出来。催化残基未确定,但单个二价金属离子似乎通过残基D119、E129和L130结合在每个亚基上。
[0092]SEQ ID NO: 17示出了编码实施例中所用的HL-wt-EcoExoII1-Ll-H6的多核苷酸序列。
[0093]SEQ ID NO: 18示出了实施例中所用的HL-wt-EcoExoII1-Ll-H6的一个亚基的氨基酸序列。
[0094]SEQ ID NO: 19示出了编码实施例中所用的HL-RQC-EcoExoII1-L1-H6的多核苷酸序列。
[0095]SEQ ID NO:20示出了实施例中所用的HL-RQC-EcoExoII1-Ll-H6的一个亚基的氨基酸序列。
[0096]SEQ ID NO: 21示出了编码实施例中所用的HL-RQC-EcoExo 1-L1-H6的多核苷酸序列。 [0097]SEQ ID NO:22示出了实施例中所用的HL-RQC-EcoExo1-Ll_H6的一个亚基的氨基酸序列。
[0098]SEQ ID NO: 23示出了编码实施例中所用的HL-RQC-TthRecJ-Ll_H6的多核苷酸序列。
[0099]SEQ ID NO: 24示出了实施例中所用的HL-RQC-TthRecJ-Ll_H6的一个亚基的氨基酸序列。
[0100]SEQ ID N0:25 示出了编码实施例中所用的 HL-RQC-EcoExoII1-L2-D45-N47A-H6的多核苷酸序列。
[0101]SEQ ID N0:26 示出了实施例中所用的 HL-RQC-EcoExoII1-L2-D45-N47A-H6 的一个亚基的氨基酸序列。
[0102]SEQ ID N0:27 示出了编码实施例中所用的 HL-RQC-EcoExo1-Cter-{SG}8-H6 的多核苷酸序列。
[0103]SEQ ID N0:28 示出了实施例中所用的 HL-RQC-EcoExo1-Cter-{SG}8-H6 的一个亚基的氨基酸序列。
[0104]SEQ ID N0:29 示出了编码实施例中所用的 HL-RQC-EcoExo1-Cter-DG{SG}8-H6 的多核苷酸序列。
[0105]SEQ ID N0:30 示出了实施例中所用的 HL-RQC-EcoExo1-Cter-DG{SG}8-H6 的一个亚基的氨基酸序列。
[0106]SEQ ID N0:31和SEQ ID NO:32示出了实施例的核酸外切酶测定中所用的寡核苷酸序列。
【具体实施方式】
[0107]应理解,所公开的产物和方法的不同用途可根据本领域内的具体需要进行调整。还应理解,本文所用的术语只是为了描述本发明的具体实施方案,而非意图进行限制。
[0108]此外,除非上下文另有清楚的指明,否则本说明书和所附权利要求书中所用的单数形式“一个”、“一种”和“该”也包括复数指代物。因此,例如,提及“一个构建体”也包括“多个构建体”,提及“一个跨膜蛋白孔”包括两个或更多个这类孔,提及“一个分子衔接体”包括两个或多个所述衔接体,等等。
[0109]本文中——无论在上文还是下文——引用的全部出版物、专利和专利申请均以引用的方式全文纳入本文。
[0110]构律体
[0111]本发明提供了可用于测序核酸的构建体。所述构建体包含跨膜蛋白孔亚基和核酸操作酶。所述亚基与所述酶共价结合。本发明构建体是形成能够通过随机传感测序核酸的孔的有用工具。本发明构建体特别可用于产生既可操作靶核酸序列又可辨别靶序列中不同核苷酸的跨膜蛋白孔。如下文更详细描述的,所述酶操作靶核酸的方式使得所述孔可识别靶序列中的核苷酸并从而测序所述靶序列。
[0112]所述亚基保留其形成孔的能力。构建体形成孔的能力可使用本领域任何已知方法测定。例如,可将所述构建体和其他合适的亚基一块插入膜中,并可确定其寡聚体化以形成孔的能力。将构建体和亚基插入膜例如脂质双层的方法为本领域所知。例如,可将构建体和亚基以纯化形式悬浮于含有脂质双层的溶液中,这样使其扩散至所述脂质双层,并且通过结合于所述脂质双层并装配为功能状态而插入。或者,可使用M.A.Holden, H.Bayley.J.Am.Chem.Soc.2005,127,6502-6503 和国际申请 PCT/GB2006/001057 (以 W02006/100484公开)记载的“拾取放置(Pick and place)”法将构建体和亚基直接插入到所述膜中。构建体形成孔的能力通常可如实施例中所述进行测定。
[0113]所述酶保留有其操作核酸的能力。这使得所述构建体可形成用于测序如下文所述核酸的孔。构建体操作核酸的能力可使用任何本领域已知的方法测定。例如,可测试构建体或由所述构建体形成的孔操作具体核酸序列的能力。构建体或孔操作核酸的能力通常可如实施例中所述进行测定。
[0114]本发明的一种构建体可形成孔的一部分。或者,构建体可以是分离的、基本上分离的、纯化的或基本上纯化的。如果构建体完全不含任何其他组分如脂质或其他孔单体,则该构建体是分离的或纯化的。如果构建体与不干扰其预计用途的载体或稀释剂混合,则该构建体是基本分离的。例如,如果构建体以包含小于10%、小于5%、小于2%或小于1%的其他组分如脂质或其他孔单体的形式存在,则该构建体是基本分离或基本纯化的。本发明的一种构建体可以以脂质双层的形式存在。
[0115]结合
`[0116]所述亚基与所述酶共价结合。所述亚基可在不止一点例如两点或三点上与所述酶结合。使所述亚基与所述酶在不止一点上结合的方法可用于限制所述酶的可动性。例如,多点结合可用于限制所述酶转动或离开所述亚基的自由度。
[0117]当所述亚基与所述酶结合时(表达后修饰),其可以是单体的形式。或者,当所述亚基与酶结合时(寡聚体化后修饰),其可以是寡聚孔的一部分。
[0118]可使用任何本领域已知的方法使所述亚基与所述酶共价结合。所述亚基和酶可单独产生,然后结合在一起。所述两种组分可以以任意构型结合。例如,它们可通过其末端(即氨基末端或羧基末端)氨基酸结合。合适的构型包括但不限于所述酶的氨基末端结合于所述亚基的羧基末端,反之亦然。或者,所述两种组分可通过它们序列内部的氨基酸结合。例如,所述酶可结合于所述亚基的环区的一个或多个氨基酸。在一个优选实施方案中,所述酶的末端氨基酸结合于一个亚基的环区中的一个或多个氨基酸。末端氨基酸和环区如上文所讨论。
[0119]在一个优选实施方案中,所述亚基与所述酶在基因上融合。如果整个构建体由单个多核苷酸序列表达,则亚基与酶在基因上融合。所述亚基和酶的编码序列可以以任何方式组合以形成编码所述构建体的单个多核苷酸序列。
[0120]所述亚基和酶可以以任何构型在基因上融合。所述亚基和酶可以通过它们的末端氨基酸在基因上融合。例如,所述酶的氨基末端与所述亚基的羧基末端融合,反之亦然。优选将所述酶的氨基酸序列同框内加入所述亚基的氨基酸序列中。换言之,优选将所述酶插入所述亚基的序列内。在这些实施方案中,所述亚基和酶通常在两点上结合,即经所述酶的氨基末端氨基酸和羧基末端氨基酸结合。如果将所述酶插入所述亚基的序列内,则优选使所述酶的氨基末端氨基酸与羧基末端氨基酸紧密接近,并且使每端均与所述亚基或其变体序列中的邻近氨基酸结合。在一个优选实施方案中,将所述酶插入所述亚基的环区中。
[0121]在另一个优选实施方案中,所述亚基与所述酶在化学上融合。如果亚基与酶在化学上结合,例如通过一个接头分子结合,则这两部分在化学上融合。
[0122]所述亚基可通过六-组氨酸标签或N1-NTA短暂地与所述酶结合。还可对所述亚基和酶进行修饰从而使它们短暂地相互结合。
[0123]所述构建体保留有所述亚基的形成孔的能力。所述亚基的形成孔的能力通常由其α-螺旋和β_链提供。β_桶状孔包含由β_链构成的桶状体或通道,而α-螺旋束状孔包含由α-螺旋构成的桶状体或通道。α-螺旋和β_链通常通过环区连接。为避免影响所述亚基的孔形成能力,优选使所述酶与所述亚基的环区在基因上融合,或插入所述亚基的环区中。下面更详细地讨论具体亚基的环区。
[0124]类似地,所述构建体保留有所述核酸操作所述酶的能力,所述能力通常由其二级结构元件(α-螺旋和β_链)和三级结构元件提供。为避免影响所述酶的核酸操作能力,优选使所述酶与所述亚基在基因上融合,或经不影响其二级或三级结构的残基或区域插入所述亚基中。
[0125]所述亚基可与所述酶直接结合。优选使用一个或多个例如两个或三个接头使所述亚基与所述酶结合。可设计一个或多个接头以限制所述酶的可动性。所述接头可与所述亚基和/或酶中的一个或多个反应性半胱氨酸残基、反应性赖氨酸残基或非天然氨基酸结合。合适的接头在本领域是公知的。合适的接头包括但不限于化学交联剂和肽接头。优选的接头是氨基酸序列(即肽接头)。通常对所述肽接头的长度、柔性和亲水性进行设计使其不扰乱所述亚基和酶的功能。优选的柔性肽接头为2-20个,例如4、6、8、10或16个丝氨酸和/或甘氨酸的片段。更优选的肽接头包括(SG)” (SG)2' (SG)” (SG)4' (SG)5^P (SG)8,其中S为丝氨酸,G为甘氨酸。优选的刚性肽接头为2-30个,例如4、6、8、16或24个脯氨酸的片段。更优选刚性接头包括(P)12,其中P为脯氨酸。
[0126]接头可先与所述亚基结合再与所述酶结合,先与所述酶结合再与所述亚基结合,或者与所述酶和亚基同时结合。当所述接头与所述亚基结合时,其可为单体亚基、两个或多个单体的寡聚体的一部分或完整寡聚孔的一部分。所述接头优选在任何除去任何未结合接头的纯化步骤之前反应。
[0127]使所述亚基与所述酶结合的一个优选方法是经半胱氨酸连接。这可通过双官能化学接头或通过末端具有半胱氨酸残基的多肽接头介导。α-HUSEQ ID N0:2)无天然半胱氨酸残基,因此将半胱氨酸引入到SEQ ID N0:2的序列中可实现所述酶与所述亚基受控制的共价结合。可在多个位置引入半胱氨酸,例如SEQ ID NO: 2的位置K8、T9或N17或在SEQ ID N0:2的羧基末端。可对任何双官能接头的长度、反应性、特异性、刚性和溶解度进行设计以确保所述酶相对所述亚基的位置正确并且所述亚基和所述酶的功能均得以保持。合适的接头包括双马来酰亚胺交联剂,例如1,4-双(马来酰亚胺)丁烷(BMB)或双(马来酰亚胺)己烷。双官能交联剂的一个缺点是需要酶不含其他表面可及的半胱氨酸残基,因为所述双官能接头与这些残基的结合不可控制并可影响底物结合或活性。如果所述酶含有几个可及的半胱氨酸残基,那么可能需要对所述酶进行修饰以除去这些残基同时确保所述修饰不影响所述酶的折叠或活性。在一个优选实施方案中,与所述酶在基因上结合的肽接头上存在一个反应性半胱氨酸。这意味着不需要其他修饰来从所述酶除去其他可及的半胱氨酸残基。半胱氨酸残基的反应性可通过修饰例如在肽接头上的邻近残基进行增强。例如,侧翼精氨酸、组氨酸或赖氨酸残基的碱性基团会将半胱氨酸硫醇基团的PKa改变为更大反应性的S_基团的pKa。半胱氨酸残基的反应性可被巯基保护基团例如dTNB所保护。这些保护基团可在接头结合之前与所述酶或亚基的作为单体或寡聚体的一部分的一个或多个半胱氨酸残基反应。
[0128]亚基或酶与它们自身的交联可通过保持接头的浓度远过量于所述亚基和/或酶而防止。或者,可使用“锁匙”配置,其中使用了两种接头。每种接头只有一端可一起反应以形成更长的接头并且接头的另一端各自与所述构建体(即亚基或单体)的不同部分反应。
[0129]选择共价结合的位点以使得:当所述构建体用于形成孔时,所述酶操作靶核酸序列的方式使得靶序列中一部分核苷酸与所述孔相互作用。然后基于核苷酸在相互反应过程中影响流过所述孔的电流的不同方式来识别核苷酸。
[0130] 存在多种使用孔来测序核酸分子的方式。一种方式涉及使用核酸外切酶例如脱氧核糖核酸酶。在此方法中,所述核酸外切酶用于使核苷酸从靶核酸链上序贯分离。然后按核苷酸脱离的顺序通过孔检测并辨别所述核苷酸,从而读出原始链的序列。对于这一实施方案,优选使所述核酸外切酶与所述亚基结合从而使从靶核酸上脱离的一部分核苷酸能够进入一种包含所述构建体的孔的桶状体或通道并与其相互作用。优选使所述核酸外切酶与所述亚基在这样的位置结合,即与所述亚基中的某一部分紧密接近的位点,所述部分形成所述孔的桶状体或通道的开口。更优选地,所述核酸外切酶与所述亚基的结合使所述核酸外切酶的核苷酸离去轨线位点朝向所述亚基中的某一部分,所述部分形成所述孔的开口部分。
[0131]测序核酸的另一种方式涉及使用将所述靶核酸链推过或拉过所述孔的酶。在此方法中,离子电流随着靶链中的核苷酸通过所述孔而波动。所述电流波动指示该链的序列。对于这一实施方案,优选地,所述酶与所述亚基的结合使所述酶能够将所述靶核酸推过或拉过包含所述构建体的孔的桶状体或通道,并且不干扰通过所述孔的离子电流的流动。优选使所述酶与所述亚基在这样的位点上结合,即与所述亚基中的某一部分紧密接近的位点上,所述部分形成所述孔的桶状体或通道的开口部分。更优选地,所述酶与所述亚基的结合使所述酶的活性位点朝向所述亚基中的某一部分,所述部分形成所述孔的开口部分。
[0132]第三种测序核酸链的方法是检测与孔检测器紧密接近的聚合酶的副产物(b1-product)。在此方法中,对核苷磷酸(核苷酸)进行标记从而使磷酸标记物质在将聚合酶加至核苷酸链后释放,并且通过所述孔检测所述磷酸标记物质。所述磷酸物质含有对每种核苷酸特异的标记物。随着将核苷酸序贯加至所述核酸链,加入碱基的副产物被检测。所述磷酸标记物质被检测的顺序可用于确定所述核酸链的序列。
[0133]优选使所述酶与所述亚基的某一部分结合,所述部分形成包含所述构建体的孔的顺面(cis side)部分。在电生理学中,所述顺面为接地面。如果溶血素孔被正确插入电生理学装置中,那么帽区(Cap region)在所述顺面上。公知的是,在正电势下,核苷酸会从用于随机传感的孔的顺面迁移向反面(trans side)。将所述酶置于孔的顺面使得所述酶对靶核酸的操作可将所述序列中的一部分核苷酸进入所述孔的桶状体或通道并与其相互作用。优选地,所述序列中至少20%、至少40%、至少50%、至少80%或至少90%的核苷酸进入所述孔的桶状体或通道并与其相互作用。
[0134]优选地,选择共价结合的位点和方法以使得所述酶的可动性受限。这可帮助确保所述酶以这样的方式操作所述靶核酸序列,即所述方式可以使所述靶序列中的一部分核苷酸与所述孔相互作用。例如,限制酶移动的能力意味着所述酶的活性位点可永远朝向所述亚基的某一部分,所述部分形成所述孔的桶状体或通道的开口部分。所述酶的可动性可通过增加所述酶与所述亚基结合的点的数量和/或使用具体的接头而限制。
[0135]亚基
[0136]本发明的构建体包含跨膜蛋白孔的一个亚基。跨膜蛋白孔是一个多肽或一系列多肽,所述多肽允许由外加电势驱动的离子从膜的一面流过。优选地,所述孔允许核苷酸沿外加电势从膜的一面流至另一面。优选地,所述孔可将核酸例如DNA或RNA推过或拉过所述孔。
[0137]所述亚基是孔的一部分。所述孔可为单体或寡聚体。优选地,所述亚基可构成由几个重复亚基例如6、7或8个亚基构成的孔的一部分。更优选地,所述亚基可构成七聚体孔的一部分。所述亚基通常可构成其中可流过所述离子的桶状体或通道的一部分。所述孔的亚基通常环绕一个中心轴,并促进链进入β桶状体或通道或又跨者膜α-螺旋束状体或通道。当作为本发明构建体的一部分时,所述亚基可为单体或寡聚体孔的一部分。
[0138]所述亚基通常构成孔的一部分,所述孔的桶状体或通道包含有助于与核苷酸或核酸相互作用的氨基酸。优选地,这些氨基酸的位置靠近所述桶状体或通道的收缩区处。所述亚基通常包含一个或多个带正电的氨基酸,例如精氨酸、赖氨酸或组氨酸。这些氨基酸通常通过与核苷酸或核酸中的磷酸基团相互作用或者通过与核苷酸或核酸中的碱基的η-阳离子相互作用而有助于所述孔与核苷酸或核酸之间的相互作用。衔接体可有助于所述核苷酸检测。
[0139]适合用于本发明的亚基可源于β -桶状孔或α -螺旋束状孔。β -桶状孔包含由β -链构成的桶状体或通道。合适的β -桶状孔包括但不限于:β -毒素例如α-溶血素和杀白细胞素,细菌的外膜蛋白/孔蛋白例如外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG)、外膜磷酸酯酶A和奈瑟球菌属(Neisseria)自转运脂蛋白(NalP)。α-螺旋束状孔包含由α-螺旋构成的桶状体或通道。合适的α-螺旋束状孔包括但不限于:内膜蛋白和α外膜蛋白例如WZA。
[0140]优选地,所述亚基源于α -溶血素(a -HL)。野生型a -HL孔由7个相同的单体或亚基构成(即,其是七聚体)。α-溶血素的一个野生型单体或亚基的序列示于SEQ ID Ν0:2。本发明构建体中的亚基优选地包含SEQ ID Ν0:2中所示的序列或其变体。SEQ ID NO:2的氨基酸 1、7-21、31-34、45-51、63-66、72、92-97、104-111、124-136、149-153、160-164、173-206、210-213、217、218、223-228、236-242、262-265、272-274、287-290 和 294 构成环区。优选地,所述酶与SEQ ID Ν0:2的氨基酸8、9、17、18、19、44、45、50和51中的一个或多个结合。更优选地,所述酶插入SEQ ID NO:2的氨基酸18与19、44与45或者50与51之间。
[0141]SEQ ID NO:2的变体是具有从SEQ ID NO:2变化而来但保留有其孔形成能力的氨基酸序列的亚基。所述变体形成孔的能力可如上文所述进行测定。所述变体可包括有助于与所述核酸操作酶共价结合或与其相互作用的修改。优选地,所述变体包含有助于与所述酶结合的一个或多个反应性半胱氨酸残基。例如,所述变体可在SEQ ID勵:2的8、9、17、18、19、44、45、50和51位中的一个或多个和/或氨基或羧基末端上包括半胱氨酸残基。优选的变体包含对SEQ ID N0:2的位置8、9或17上的残基的半胱氨酸置换(K8C、T9C或N17C)。
[0142]可修饰所述变体以有助于所述酶的基因融合。例如,可修饰例如缺失邻近插入位点的一个或多个残基以有助于所述酶和/或接头的插入。如果将所述酶插入SEQ ID NO:2的环2中,那么可缺失SEQ ID N0:2的残基D45、K46、N47、H48、N49和K50中的一个或多个。含有所述缺失的一个优选构建体包含SEQ ID NO:26中所示的序列或其变体。
[0143]所述变体还可包括有助于与核苷酸的任何相互作用或有助于下文讨论的分子衔接体的取向的修饰。所述变体还可含有有助于分子衔接体的共价结合的修饰。
[0144]所述亚基可以是要求美国专利申请61/078,687的优先权并与本申请同时提交的共同待决的国际专利申请[J A Kemp&Co Ref: N.104403A; Oxford Nanolabs Ref: ONLIP004]中记载的SEQ ID NO:2的变体中的任一种。该申请的所有教导均可同等地适用于本申请。具体地,所述变体 优选地在SEQ ID NO:2的139位上具有谷氨酰胺。所述变体优选地在SEQ ID NO:2的113位上具有精氨酸。所述变体优选地在SEQ ID NO:2的119、121或135位上具有半胱氨酸。在所述共同待决申请的SEQ ID N0:4、6、8、10、12和14中所示的SEQ ID N0:2变体中的任一种均可用于形成本发明的构建体。
[0145]所述亚基可以是由生物体例如葡萄球菌属(Staphylococcus)细菌表达的天然变体。变体还可包括通过重组技术产生的非天然变体。在SEQ ID NO:2的整个氨基酸序列长度上,基于氨基酸同一性,变体优选与该序列至少50%同源。在SEQ ID N0:2的氨基酸序列的整个序列上,基于氨基酸同一性,所述亚基多肽更优选地可以与该序列至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%并且更优选地至少95%、97%或99%同源。在200或更多个例如230、250、270或280或更多个连续氨基酸的片段上存在至少80%例如至少85%、90%或95%的氨基酸同一性(“硬同源性”)。
[0146]除上面讨论的以外,还可对SEQ ID NO: 2的氨基酸序列进行氨基酸置换,例如最多多至1、2、3、4、5、10、20或30个置换。保守性置换可例如根据下表1进行。
[0147]表1.保守性置换
[0148]第二列同一格中的氨基酸,优选第三列同一行中的氨基酸可相互置换。
[0149]
【权利要求】
1.一种用于检测核苷酸向核酸链的添加的方法,包括 (a)在存在孔的情况下,使所述核酸链与(i)聚合酶和(ii)经标记的核苷酸接触,从而使得当核苷酸添加至所述核酸链时,磷酸标记物质依次释放,其中所述磷酸物质含有对每种核苷酸特异的标记物;和 (b)使用所述孔检测所述磷酸标记物质,并从而检测所述核苷酸向所述核酸链的添加。
2.权利要求1所述的方法,其中所述孔结合至所述聚合酶。
3.权利要求2所述的方法,其中所述孔共价结合至所述聚合酶。
4.权利要求2所述的方法,其中所述孔在紧密接近所述孔的桶状体或通道的开口的位点处结合至所述聚合酶,并且/或者其中所述聚合酶结合至所述孔从而使得所述酶的活性位点朝向所述孔的开口。
5.权利要求1所述的方法,其中所述磷酸标记物质是通过以下方式检测:使所述物质与所述孔接触从而使得所述物质依次与所述孔反应,并且测量每次反应期间通过所述孔的电流。
6.权利要求1所述的方法,其中所述方法用于测序所述核酸链,并且所述方法还包括(C)使用所述核酸标记物质的顺序来确定所述核酸链的序列。
7.权利要求1所述的方法,其中所述孔来源自α-溶血素。
8.权利要求7所述的方法,其中所述孔包括七个亚基,基于氨基酸同一性,每个亚基与SEQ ID NO:2在其整个序列上具有至少55%的同源性。
9.权利要求8所述的方法,其中至少一个亚基在SEQID NO:2的139位上具有谷氨酰胺,在SEQ ID NO:2的113位 上具有精氨酸或者在SEQ ID NO:2的119、121或135位上具有半胱氨酸。
10.权利要求9所述的方法,其中(a)全部7个亚基均在SEQID NO:2的139位上具有谷氨酰胺并且所述亚基之一在135位上具有半胱氨酸,并且/或者(b)全部7个亚基均在SEQ ID NO:2的113位上具有精氨酸。
11.权利要求1所述的方法,其中所述孔包括有利于所述孔与所述标记物质之间的相互作用的分子衔接体。
12.权利要求11所述的方法,其中所述分子衔接体为环糊精或其衍生物,七-6-氨基-β-环糊精(am7-13⑶)、6_单脱氧-6-单氨基-β-环糊精(amfi?⑶)或七_(6_脱氧_6_狐基)-环糊精(gu7- β CD)。
13.权利要求1所述的方法,其中所述聚合酶为(a)酶分类(EC)组2.7.7.6,2.7.7.7、2.7.7.19,2.7.7.48和2.7.7.49的任一组的成员,或(b)依赖DNA的DNA聚合酶、依赖RNA的DNA聚合酶、依赖DNA的RNA聚合酶或依赖RNA的RNA聚合酶。
14.权利要求1所述的方法,其中所述核苷酸用荧光分子、放射性同位素、酶、抗体、抗原、多核苷酸或配体标记。
15.一种用于检测核苷酸向核酸链的添加的试剂盒,包括孔、聚合酶和经标记的核苷酸。
【文档编号】C12Q1/68GK103695530SQ201310435243
【公开日】2014年4月2日 申请日期:2009年7月6日 优先权日:2008年7月7日
【发明者】L·贾娅辛格, H·贝利, S·切里, B·麦基翁, J·怀特, J·克拉克 申请人:牛津纳米孔技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1