酶突变体的制作方法

文档序号:391971阅读:323来源:国知局
专利名称:酶突变体的制作方法
技术领域
本发明涉及包含核酸结合蛋白和表面的构建体。从所述结合蛋白上除去至少一个天然的可及的半胱氨酸残基。所述结合蛋白通过一个或多个可及的半胱氨酸连接在所述表面上。从所述蛋白质上移除其他可及的半胱氨酸残基使得可控制对所述表面的连接。所述构建体可被用于形成跨膜孔,其连接有核酸结合蛋白。这样的孔尤其可用于测序核酸。所述酶处理所述核酸的方式使得所述孔能通过随机传感来检测所述核酸的每个组成核苷酸。
背景技术
随机检测是一种依赖于对分析物分子与受体之间个体结合事件的观察结果的传感方法。随机传感器可通过如下方式形成将纳米尺寸的单孔置入绝缘膜中,并且在存在分析物分子的情况下测量电压驱动的穿过所述孔的离子转运。电流波动的发生频率可揭示在所述孔中结合的分析物的浓度。分析物的种类是通过其特征性电流特征,特别是电流阻断的持续时间和程度而揭示(Braha,0. ,Walker,B.,Cheley,S. ,Kasianowicz, J. J.,Song,L., Gouaux, J.Ε., and Bayley, H. (1997)Chem. Biol. 4,497-505 ;and Bayley, H. , and Cremer, P.S. (2001)Nature413,226-230) 形成细菌孔的毒素α-溶血素(α-HL)的基因工程改造形式已用于对许多类型的分子进行的随机传感(Bayley,H.,and Cremer, P. S. (2001)Nature 413,226-230 ;Shin, S. -H. , Luchian, Τ. , Cheley, S. , Braha, 0. , andBayley, H. (2002)Angew. Chem. Int. Ed. 41, 3707-3709 ;Guan, Χ. , Gu,L. -Q. ,Cheley, S. ,Braha,0. ,and Bayley,H. (2005)ChemBioChem 6,1875-1881)。在这些研究的过程中,已发现,对α-HL进行改造以直接结合小的有机分析物的尝试是很费力的,并且鲜有成功的实例(Guan, X.,Gu, L.-Q.,Cheley, S.,Braha, 0.,and Bayley, H. (2005)ChemBioChem 6,1875-1881)。幸运地是,已经发现有一种不同的策略,该策略利用了非共价连接的分子衔接体(adaptor),特别是环糊精(Gu,L.-Q., Braha, 0.,Conlan, S.,Cheley, S.,and Bayley, H. (1999) Nature398,686-690),还有环形月太(Sanchez-Quesada, J. , Ghadiri, Μ. R. , Bayley, H. , and Braha, 0. (2000) J. Am. Chem. Soc. 122,11758-11766)和葫芦脲(cucurbituril) (Br aha, 0. ,Webb, J.,Gu,L.-Q. ,Kim, K., andBayley, H. (2005) ChemPhysChem 6,889-892) 环糊精可短暂地进入所述 α-HL 孔中,并产生很大程度但不完全的通道阻断。有机分析物在环糊精的疏水内部发生结合,加强这种阻断可使得分析物可被检测(Gu, L. -Q.,Braha, 0.,Conlan, S.,Cheley,S.,and Bayley, H. (1999)Nature 398,686-690)。现在在大范围的应用中需要快速且廉价的DNA或RNA测序技术。现有的技术速度较慢且价格昂贵,主要是因为它们依赖于扩增技术产生大量核酸并且需要大量专门的荧光化学物质进行信号检测。随机传感有可能通过减少所需核苷酸和试剂的量来提供快速且廉价的DNA测序
发明内容
发明人出乎意料地证明,通过置换除去核酸结合蛋白的所有天然可及的半胱氨酸残基或者仅保留一个天然可及半胱氨酸残基,所述核酸结合蛋白仍保持其功能。发明人还展示了生成仅有一个或多个可及半胱氨酸残基的核酸结合蛋白使得所述蛋白质对表面的连接可受到控制。所述一个或多个可及的半胱氨酸残基可以是通过突变引入的非天然残基。或者,所述一个或多个可及的残基可以是保留的天然残基,条件是除去了其他天然可及的半胱氨酸。因此,本发明提供包含核酸结合蛋白质和表面的构建体,其中从所述结合蛋白质上除去至少一个天然可及的半胱氨酸残基,其中所述结合蛋白通过一个或多个可及的半胱氨酸残基连接在所述表面上,并且其中所述结合蛋白保持其结合核酸的能力。所述核酸结合蛋白优选地是核酸处理酶(nucleic acid handling enzyme)。所述表面优选地是孔或孔亚基。发明人还出乎意料地证明本发明的构建体可被用于产生既能够结合核酸又能够通过随机传感测序所述核酸的跨膜孔。所述核酸结合蛋白的固定特性和与所述孔的紧密接近意味着靶核酸中的一部分核苷酸会与所述孔相互作用并以独特方式影响流经所述孔的电流。因此,包含这样的构建体的跨膜孔可用于随机传感,特别是可用于测序核酸。因此,本发明还提供-用于测序核酸的修饰孔,其包含至少一种本发明的构建体;-用于产生用于测序核酸的修饰孔的试剂盒,包括(a)至少一种本发明的构建体,其中所述表面是孔亚基;和(b)形成孔所需要的其他亚基;-产生本发明的构建体的方法,包括(a)使包含一个或多个可及的半胱氨酸残基的核酸结合蛋白通过所述半胱氨酸残基连接在表面上;并且(b)确定所得到的构建体是否能够结合核酸;-产生本发明的修饰孔的方法,包括(a)使得本发明的至少一种构建体(其中所述表面是孔亚基)与其他合适的亚基形成孔;并且(b)确定所得到的孔是否能够结合核酸并且检测核苷酸;-测序靶核酸序列的方法,包括(a)使所述靶序列与本发明的孔接触,所述孔包含核酸外切酶,从而使得所述核酸外切酶从所述靶序列的一端消化单个核苷酸;(b)使所述核苷酸与所述孔接触从而使所述核苷酸与所述衔接体相互作用;(c)测量所述相互作用过程中通过所述孔的电流,从而确定所述核苷酸的种类; 并且(d)在所述靶序列的相同末端重复步骤(a)至(C),从而确定所述靶序列的序列。-测序靶核酸序列的方法,包括(a)使所述靶序列与本发明的孔接触,所述孔包含核酸处理酶,从而使得所述酶将所述靶序列推过或拉过所述孔并且所述靶序列中的一部分核苷酸与所述孔相互作用;并且(b)检测每个相互作用过程中通过所述孔的电流,从而确定所述靶序列的序列;-包含SEQ ID NO :8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48和50中任意一个所显示的序列或其变体的核酸外切酶;和-编码本发明的核酸外切酶的多核苷酸序列。


图1显示EcoExo I结构的草图,显示天然存在的半胱氨酸的位置和残基数目(从晶体结构得到)。图2显示EcoExo I的表面图,显示可及的半胱氨酸的位置(从晶体结构得到)。图3显示Exo I突变体与野生型比较的相对活性。图4显示EcoExo I的图,显示可引入单个半胱氨酸以与蛋白质纳米孔偶联的位置。图fe和釙显示Exo I突变体与野生型比较的相对活性。图6显示核酸外切酶I测定法的图示。图7显示来自核酸外切酶I测定法的数据的实例。图8显示连接体(linker)对Exo-ATTTT_A83C的连接不影响酶活性。Y-轴是相对活性。左边的一对柱是0NLP1403,右边的一对柱是0NLP1405。在每对柱中,左边的柱(深色的柱)是带有连接体的酶,右边的柱(淡色的柱)是没有连接体的酶。图9显示PNA对EXO-ATTTT-A83C的连接不影响酶活性。Y-轴是相对活性。左边的柱是0NLP1498,右边的柱是0NLP1499。图10显示PEG连接体对Exo-ATTTT或Exo-ATTTT_M184C的连接不影响酶活性。 Y-轴是相对活性。左边的一对柱是Exo-ATTTT,右边的一对柱是Exo-ATTTT-M184C。在每对柱中,左边的柱(深色的柱)是带有连接体的酶,右边的柱(淡色的柱)是没有连接体的酶。序列表说明SEQ ID NO=I显示编码野生型α -溶血素(α -HL)的一个亚基的多核苷酸序列。SEQ ID NO 2显示野生型α -HL的一个亚基的氨基酸序列。氨基酸2至6、73至 75,207至209、214至216和219至222形成α -螺旋。氨基酸22至30、;35至44、52至62、 67 至 71、76 至 91、98 至 103、112 至 123、137 至 148、154 至 159、165 至 172、229 至 235、243 至261、266至271、285至286和291至293形成β -链。所有其他非末端氨基酸,也就是 7 至 21,31 至 34,45 至 51,63 至 66、72、92 至 97,104 至 111,124 至 136,149 至 153,160 至 164,173 至 206,210 至 213、217、218、223 至 228,236 至 242,262 至 265,272 至 274 和 287 至290形成环区。氨基酸1和294是末端氨基酸。SEQ ID NO :3显示编码α-HL L135C/N139Q (HL-CQ)的一个亚基的多核苷酸序列。SEQ ID NO :4显示α-HL L135C/N139Q(HL-CQ)的一个亚基的氨基酸序列。在野生型α-HL中形成α-螺旋、β-链和环区的相同氨基酸在该亚基中形成相应的区域。SEQ ID NO 5显示衍生自大肠杆菌(E. coli) sbcB基因的密码子优化的多核苷酸序列。它编码大肠杆菌的核酸外切酶I (EcoExo I)。SEQ ID NO :6显示大肠杆菌的核酸外切酶I酶(EcoExo I)的氨基酸序列。该酶从5,至3,方向从单链DNA(ssDNA)持续消化5,单磷酸核苷。氨基酸60至68、70至78、80 至 93、107 至 119,124 M 128,137 M 148,165 M 172、182 至 211、213 至 221、234 至 241、268至 286、313 至 324、3洸至;352、362 至 370、373 至 391、401 至妨4 和 457 至 475 形成 α -螺旋。氨基酸10至18J8至洸、47至50、97至101、133至136、2四至232、243至251、258至 263、298至302和308至311形成β-链。所有其他非末端氨基酸,19至27、37至46、51至 59、69、79、94 至 96,102 至 106,120 至 123,129 至 132,149 至 164,173 至 181、212、222 至 228233、242、252 至 257,264 至 267,287 至 297,303 至 307、312、325、353 至 361、371、372、 392至400、455和456形成环。氨基酸1至9是末端氨基酸。所述酶的整体折叠使得三个区域结合形成一个具有字母C外形的分子,但是无序分布在晶体结构中的残基355-358可有效地将该C形转变为0样形状。氨基末端(1-206)形成核酸外切酶结构域,并与DnaQ超家族有同源性,以下残基(202-354)形成SH3样结构域,并且羧基结构域(359-475)伸出所述核酸外切酶结构域以形成所述分子的C样形状。EcoExo I的4个酸性残基与DnaQ超家族的活性位点残基是保守的(对应于D15、E17、D108和D186)。已经提出,单个金属离子被残基D15和108所结合。DNA的水解可能是通过活化的水分子攻击易被切断的磷酸基来催化的,其中H181是催化残基并对准所述核苷酸底物。SEQ ID NO :7 显示编码 EcoExo I C98S/C306S/C330T/C51A (0NLD0393)的密码子优化的多核苷酸序列。SEQ ID NO :8 显示 EcoExo I C98S/C306S/C330T/C51A (0NLD0393)的氨基酸序列。SEQ ID NO :9 显示编码 EcoExo I C98S/C306S/C330T/C144M(0NLD0403)的密码子优化的多核苷酸序列。SEQ ID NO 10 显示 EcoExo I C98S/C306S/C330T/C144M(0NLD0403)的氨基酸序列。SEQ ID NO 11 显示编码 EcoExo I C98S/C306S/C330T/C144T (0NLD0404)的密码子优化的多核苷酸序列。SEQ ID NO 12 显示 EcoExo I C98S/C306S/C330T/C144T (0NLD0404)的氨基酸序列。SEQ ID N0:13 显示编码 EcoExo IC51A/C98S/C144M/C306S/C330T/ V42C (0NLD0415)的密码子优化的多核苷酸序列。SEQ ID NO 14 显示 EcoExo IC51A/C98S/C144M/C306S/C330T/V42C (0NLD0415)的
氨基酸序列。SEQ ID N0:15 显示编码 EcoExo IC51A/C98S/C144T/C306S/C330T/ V42C(0NLD0416)的密码子优化的多核苷酸序列。SEQ ID NO 16 显示 EcoExo IC51A/C98S/C144T/C306S/C330T/V42C (0NLD0416)的
氨基酸序列。SEQ ID N0:17 显示编码 EcoExo IC51A/C98S/C144M/C306S/C330T/ M184C (0NLD0417)的密码子优化的多核苷酸序列。SEQ ID NO: 18 EcoExo I C51A/C98S/C144M/C306S/C330T/M184C(0NLD0417)的氨
基酸序列。SEQ ID N0:19 显示编码 EcoExo IC51A/C98S/C144T/C306S/C330T/ M184C (0NLD0418)的密码子优化的多核苷酸序列。SEQ ID NO :20 显示EcoExo IC51A/C98S/C144T/C306S/C330T/M184C (0NLD0418)的氨基酸序列。SEQ ID NO :21 显示编码 EcoExo I C51A/C98S/C144T/C306S/C330T (0NLD0411)的密码子优化的多核苷酸序列。SEQ ID NO :22 显示 EcoExo I C51A/C98S/C144T/C306S/C330T (0NLD0411)的氨基
酸序列。SEQ ID NO :23 显示编码 EcoExo I C51A/C98T/C144T/C306S/C330T (0NLD0432)的密码子优化的多核苷酸序列。SEQ ID NO :24 显示EcoExo I C51A/C98T/C144T/C306S/C330T (0NLD0432)的氨基
酸序列。SEQ ID NO : 显示编码 EcoExo I C51A/C98T/C144T/C306T/C330T (0NLD0433)的密码子优化的多核苷酸序列。SEQ ID NO 26 显示 EcoExo I C51A/C98T/C144T/C306T/C330T (0NLD0433)的氨基
酸序列。SEQ ID NO :27 显示编码 EcoExo I C51A/C98T/C144M/C306S/C330T (0NLD0451)的密码子优化的多核苷酸序列。SEQ ID NO :28 显示 EcoExo I C51A/C98T/C144M/C306S/C330T (0NLD0451)的氨基
酸序列。SEQ ID NO 29 显示编码 EcoExo IC51A/C98T/C144M/C306T/C330T (0NLD0452)的密码子优化的多核苷酸序列。SEQ ID NO :30 显示 EcoExo I C51A/C98T/C144M/C306T/C330T (0NLD0452)的氨基
酸序列。SEQ ID NO :31 显示编码 EcoExo IC51A/C98G/C144T/C306S/C330T (0NLD0453)的密码子优化的多核苷酸序列。SEQ ID NO :32 显示 EcoExo I C51A/C98G/C144T/C306S/C330T (0NLD0453)的氨基
酸序列。SEQ ID NO :33 显示编码 EcoExo I C51A/C98D/C144T/C306S/C330T (0NLD0491)的密码子优化的多核苷酸序列。SEQ ID NO :34 显示 EcoExo I C51A/C98D/C144T/C306S/C330T (0NLD0491)的氨基
酸序列。SEQ ID NO :35 显示编码 EcoExo IC51A/C98K/C144T/C306S/C330T (0NLD0454)的密码子优化的多核苷酸序列。SEQ ID NO :36 显示 EcoExo I C51A/C98K/C144T/C306S/C330T (0NLD0454)的氨基
酸序列。SEQ ID NO :37 显示编码 EcoExo I C51A/C98L/C144T/C306S/C330T (0NLD0455)的密码子优化的多核苷酸序列。SEQ ID NO :38 显示 EcoExo I C51A/C98L/C144T/C306S/C330T (0NLD0455)的氨基
酸序列。SEQ ID NO :39 显示编码 EcoExo IC51A/C98V/C144T/C306S/C330T (0NLD0456)的密码子优化的多核苷酸序列。
9
SEQ ID NO :40 显示 EcoExo I C51A/C98V/C144T/C306S/C330T (0NLD0456)的氨基
酸序列。SEQ ID NO :41 显示编码 EcoExo I C51A/C98V/C144T/C306T/C330T (0NLD0476)的密码子优化的多核苷酸序列。SEQ ID NO :42 显示 EcoExo I C51A/C98V/C144T/C306T/C330T (0NLD0476)的氨基
酸序列。SEQ ID NO :43 显示编码 EcoExo IC51A/C98T/C144T/C306M/C330T (0NLD0477)的密码子优化的多核苷酸序列。SEQ ID NO :44 显示 EcoExo I C51A/C98T/C144T/C306M/C330T (0NLD0477)的氨基
酸序列。SEQ ID NO :45 显示编码 EcoExo I C51A/C98T/C144T/C306N/C330T (0NLD0478)的密码子优化的多核苷酸序列。SEQ ID NO :46 显示 EcoExo I C51A/C98T/C144T/C306N/C330T (0NLD0478)的氨基
酸序列。SEQ ID NO :47 显示编码 EcoExo IC51A/C98T/C144T/C306D/C330T (0NLD0479)的密码子优化的多核苷酸序列。SEQ ID NO :48 显示 EcoExo I C51A/C98T/C144T/C306D/C330T (0NLD0479)的氨基
酸序列。SEQ ID NO :49 显示编码 EcoExo IC51A/C98T/C144T/C306A/C330T (0NLD04S0)的
密码子优化的多核苷酸序列。。SEQ ID NO 显示 EcoExo I C51A/C98T/C144T/C306A/C330T (0NLD0480)的氨基
酸序列。在SEQ ID NO :7至50所描述的全部突变体中,在野生型EcoExo I中形成α -螺旋、β-链和环区的相同氨基酸在该突变体中形成相应区域。SEQ ID NO :51显示衍生自大肠杆菌的XthA基因的密码子优化的多核苷酸序列。 它编码大肠杆菌的核酸外切酶III。SEQ ID NO :52显示大肠杆菌的核酸外切酶III的氨基酸序列。该酶从3,_5,方向从双链DNA(dsDNA)的一条链上逐个消化5’单磷酸核苷。链上的酶启动需要大约4个核苷酸的 5,突出。氨基酸 11 至 13、15至25、39至41、44至49、85至89、121 至 139、158 至 160、165 至174、181至194、198至202、219至222、2;35至240和248至252形成α -螺旋。氨基酸 2 至 7、四至 33、53 至 57、65 至 70、75 至 78、91 至 98、101 至 109、146 至 151、195 至 197、229 至234和241至246形成β -链。所有其他非末端氨基酸,8至10 J6至观、34至38、42、 43、50 至 52、58 至 64、71 至 74、79 至 84、90、99、100、110 至 120,140 M 145,152 M 157,161 至164、175至180、203至218、223至228、247和253至261形成环。氨基酸1、267和洸8 是末端氨基酸。酶活性位点是由连接β I-α 1、β 3-β 4、β 5-β 6、β III-α I、β IV-α II 禾口 β V-β VI 的环区(分别由氨基酸 8-10、58-64、90、110-120、152-164、175-180、223-228 和253-261构成)形成的。单个二价金属离子结合在残基E34上,帮助和H259组氨酸-天冬氨酸催化对对磷酸二酯键的亲核攻击。SEQ ID NO 53显示衍生自嗜热栖热菌(T. thermophilus)的recj基因的密码子优化的多核苷酸序列。它编码嗜热栖热菌的RecJ酶(TthRecJ-cd)。SEQ ID NO力4显示嗜热栖热菌的RecJ酶(TthRecJ-cd)的氨基酸序列。该酶从 5’_3’方向从ssDNA持续消化5’单磷酸核苷。链上的酶启动需要至少4个核苷酸。氨基酸 19 至 33、44 至 61、80 至 89、103 至 111、136 至 140、148 至 163、169 至 183、189 至 202、207 至 217、223 至 240、242 至 252、2M 至洲7、302 至 318、338 至 350 和 365 至 382 形成 α -螺旋。氨基酸 36 至 40、64 至 68、93 至 96、116 至 120、133 至 135J94 至四7、321 至 325、328 至332、352至355和359至363形成β -链。所有其他非末端氨基酸,34,35,41至43、 62、63、69 至 79,90 至 92,97 至 102,112 至 115,121 至 132,141 至 147,164 至 168,184 至 188203 至 206,218 至 222、241、253、288 至 293,298 至 301、319、320、326、327、333 至 337、 351至358和364形成环。氨基酸1至18和383至425是末端氨基酸。仅对嗜热栖热菌 (Thermus thermophilus)的RecJ的核心结构域(残基40-463)解析了晶体结构。为了确保RecJ核心结构域的翻译起始和体内表达,在其氨基末端加入了甲硫氨酸残基,而这在所述晶体结构信息中不存在。所解析的结构显示通过长α-螺旋(254487)连接的两个结构域,氨基(2-253)和羧基(288-463)区。催化残基(D46、D98、Η122和D183)与单个金属离子配位以亲核攻击所述磷酸二酯键。D46和Η120被认为是所述催化对;但是,对大肠杆菌 RecJ中这些保守残基任意一个的突变都显示可消除活性。SEQ ID NO :55显示衍生自噬菌体λ (redX)基因的密码子优化的多核苷酸序列。 它编码噬菌体λ核酸外切酶。SEQ ID NO :56显示噬菌体λ核酸外切酶的氨基酸序列。所述序列是组装成三聚体的三个相同亚基之一的序列。所述酶高度持续地从dsDNA的一条链上消化核苷酸,方向是 5,_3,(http://www. neb. com/nebecomm/products/productM0262. asp)。在一条链上的酶启动优选地需要大约4个核苷酸的具有5’磷酸的5’突出端。氨基酸3至10、14至16、 22 至洸、;34 至 40、52 至 67、75 至 95、1;35 至 149、152 至 165 和 193 至 216 形成 α -螺旋。 氨基酸 100 至 101,106 至 107,114 至 116,120 至 122,127 至 131,169 至 175 和 184 至 190 形成β-链。所有其他非末端氨基酸,11至13、17至21、27至33、41至51、68至74、96至 99,102 M 105,108 M 113,117 M 119,123 M 126,132 M 134,150 M 151,166 M 168,176 M 183、191至192、217至222形成环。氨基酸1、2和2 是末端氨基酸。λ核酸外切酶是同三聚体,所述同三聚体形成具有穿过中间的锥形通道的圆环结构(toroid),所述通道在一端显然大到足以使dsDNA进入,而在另一端仅能使ssDNA离去。未确定催化残基,但是单个二价金属离子似乎通过残基D119、E129和L130与每个亚基结合。SEQ ID NO 57显示核酸序列,由其可产生优选的核酸连接体。SEQ ID NO :58显示优选的核酸连接体。MAL是马来酰亚胺。该连接体与SEQ ID N0:61结合使用。SEQ ID NO :59显示优选的核酸连接体。MAL是马来酰亚胺。该连接体与SEQ ID N0:62结合使用。SEQ ID NO :60显示优选的核酸连接体。MAL是马来酰亚胺。该连接体与SEQ ID N0:63结合使用。SEQ ID NO :61显示优选的核酸连接体。MAL是马来酰亚胺。该连接体与SEQ ID NO 58互补并且与SEQ ID NO 58结合使用。
SEQ ID NO :62显示优选的核酸连接体。MAL是马来酰亚胺。该连接体与SEQ ID NO 59互补的并与SEQ ID NO 59结合使用。SEQ ID NO :63显示优选的核酸连接体。MAL是马来酰亚胺。该连接体与SEQ ID NO 60互补并与SEQ ID NO 60结合使用。SEQ ID NO :64显示优选的核酸连接体。该连接体与SEQ ID N0:65结合使用。SEQ ID NO 65显示优选的核酸连接体。该连接体与SEQ ID NO 64结合使用。SEQ ID NO 66显示优选的核酸连接体。该连接体与SEQ ID NO 68结合使用。SEQ ID NO 67显示优选的核酸连接体。该连接体与SEQ ID NO 69结合使用。SEQ ID NO 68显示优选的核酸连接体。该连接体与SEQ ID NO 66互补并与SEQ ID NO 66结合使用。SEQ ID NO 69显示优选的核酸连接体。该连接体与SEQ ID NO 67互补并与SEQ ID NO 67结合使用。SEQ ID NO 70显示优选的核酸连接体。该连接体与SEQ ID NO 73互补并与SEQ ID NO 73结合使用。SEQ ID NO 71显示优选的核酸连接体。该连接体与SEQ ID NO 74互补并与SEQ ID NO: 74结合使用。SEQ ID NO 72显示优选的核酸连接体。该连接体与SEQ ID NO 75结合使用。SEQ ID NO 73显示优选的核酸连接体。该连接体与SEQ ID NO 70结合使用。SEQ ID NO 74显示优选的核酸连接体。该连接体与SEQ ID NO 71结合使用。SEQ ID NO 75显示优选的核酸连接体。该连接体与SEQ ID NO -J2互补并与SEQ ID NO 72结合使用。
具体实施例方式应理解所公开的产物和方法的不同应用可根据本领域具体需要而调整。还应理解本文使用的术语仅用于描述本发明的具体实施方案的目的,并且无意限制。此外,如本说明书和所附权利要求书所使用的,除非上下文明确说明相反,单数形式“一种”、“一个”和“所述”包括复数指示物。因此,例如,提及“一种构建体”包括“各种构建体”,提及“一种跨膜蛋白质孔”包括两种或多种这样的孔,提及“一种分子衔接体”包括两种或多种这样的衔接体,等等。本文引用的所有出版物、专利和专利申请,无论是在上文还是在下文中,都以引用的方式全文纳入本说明书。构建体本发明提供用于结合核酸的构建体。具体地,本发明提供用于处理核酸的构建体, 例如当测序核酸时用于处理核酸的构建体。所述构建体包含核酸结合蛋白和表面。从所述核酸结合蛋白上除去至少一个天然可及的半胱氨酸残基。但是,所述核酸结合蛋白包含一个或多个可及的半胱氨酸残基并且通过这些残基连接于所述表面。有限数量的可及半胱氨酸的存在使得可以控制对所述表面的连接。半胱氨酸残基的可电离侧链是用于参与加成反应的强效亲核试剂,因此广泛地被选用于生物缀合(bioconjugation)技术。但是,对于这些技术的有效使用的一个常见障碍是存在于野生型蛋白质中的天然半胱氨酸残基。对一个或多个所述天然半胱氨酸残基的修饰可导致不确定的酶活性和不受控制的连接。本发明涉及核酸结合蛋白的天然半胱氨酸残基的定点诱变。可保留一个或多个可及的天然半胱氨酸,除去其他可及的天然半胱氨酸。或者,可除去全部可及的半胱氨酸残基,并向所述蛋白质中引入一个或多个半胱氨酸残基。特定的可及的半胱氨酸的存在有利于所述结合蛋白与表面的连接,所述表面例如另一个蛋白质、固体支持物或化学试剂。天然半胱氨酸残基的去除和单个或多个半胱氨酸的定点加入改进了之前的方法, 因为它赋予了控制连接的能力,同时还使得所述核酸结合蛋白通过不想要的表面巯基相互之间形成二聚体、三聚体等的可能相互作用最小化。如果所述蛋白质仅在其结构中的设计位点含有单个半胱氨酸残基,那么该残基的巯基基团可用于与其他巯基形成直接的二硫键或者可通过反应活性连接体介导偶联。这些定点半胱氨酸残基确保只有需要数量的酶分子与需要数量的靶分子交联,同时还赋予一定程度的有利构象,从而使得例如活性位点可以最优地取向。存在于野生型酶中的天然半胱氨酸残基使得不容易使用包含巯基反应活性基团的特定连接体,所述连接体例如马来酰亚胺、碘乙酰胺或邻二硫吡啶(ortho-pyridyl disulphide (OPSS))。与任何在结构和催化方面重要的半胱氨酸残基反应的可能性会影响所述结合蛋白的活性,这对于在单个分子应用中应用很重要。优选使用用于生物缀合的连接体以确保一定的空间分离,从而使得结合蛋白的活性不因与另一蛋白质或表面(例如固体载体)紧密接近而受到影响。所述表面优选地为孔或孔亚基。因此本发明的构建体是用于形成能够通过随机传感测序核酸的孔的有用工具。本发明的构建体尤其可用于形成跨膜孔,所述跨膜孔既能够结合靶核酸序列又能够区分所述靶序列上的不同核苷酸。如下文所详细描述的,所述核酸结合蛋白优选地以这样的方式处理靶核酸,即所述孔能够鉴别所述靶序列中的核苷酸,从而测序所述靶序列。尤其是,一旦催化发生,本发明的构建体不仅可将核酸结合蛋白(例如核酸处理酶)共定位至纳米孔,而且可将所述酶活性位点取向以优化碱基移位。所述表面不必须是孔或孔亚基。其他测序技术一般依赖于这样的核酸,即所述核酸被固定在固体载体(例如,小珠)上,之后酶从溶液中结合并加入金属离子来触发催化活性。然后可在下游以多种方式检测释放的碱基。但是,该方法的障碍在于费时、扩增费用昂贵并且需要后续的化学修饰以使所述模板核酸偶联于所述小珠的表面。将核酸结合蛋白预先连接在小珠上可使得对任意核酸修饰的需要最少。现有的酶连接方法不合适,因为它们依赖于核酸结合蛋白的无向大量连接,并由于未知的取向或距离所述表面的空间分离而在结合蛋白质的量以及结合蛋白质的活性方面变化很大。本发明的构建体使得可以受控地将单个核酸结合蛋白加至表面,因此极大地改进了该测序方法。一类重要的核酸结合蛋白是核酸外切酶。核酸外切酶在分子生物学中的常见用途是从PCR反应中除去扩增引物以使得可通过加入特异测序引物来直接使用所述产物进行测序。然而仍需要将所述核酸外切酶变性或者去除以防止所述测序引物的降解。因此需要在该阶段中迅速而方便地将所述核酸外切酶去除的方法,以帮助该过程自动化并且减少昂贵的DNA纯化步骤。包含连接于表面的核酸外切酶的本发明的构建体对于这样的应用是很理想的。上文已经叙述了使核酸外切酶连接于表面(例如载玻片、孔的底部或者小珠)的现有方法的相关问题。使核酸外切酶通过单个半胱氨酸残基与表面(例如琼脂糖小珠)的共价偶联将极大地改进已知的方法,并且能够帮助任何可能的酶溶解性问题。此外,从实施例中可得知,去除天然半胱氨酸能够产生具有改变的活性和稳定性的蛋白质。活性高但稳定性降低的核酸外切酶也可以帮助从所述PCR反应中去除酶活性。还应考虑很多其他商业上重要的酶的类似可能应用。可将本发明的构建体分离、基本上分离、纯化或基本上纯化。如果构建体完全没有任何其他组分(例如脂质或其他孔单体)则其是分离的或纯化的。如果构建体与不会干扰其预期用途的载体或稀释剂混合在一起则其是基本上分离的。例如,如果构建体以包含少于10 %、少于5%、少于2%或少于的其他组分(例如脂质或其他孔单体)的形式存在则其是基本上分离的或基本上纯化的。本发明的构建体可存在于脂双层中。半胱氨酸残基的诱变本发明的构建体包含核酸结合蛋白,所述核酸结合蛋白中至少一个可及的半胱氨酸被去除。所述蛋白质还具有一个或多个可及的半胱氨酸残基。可及的半胱氨酸是可与巯基特定基团反应的残基。确定半胱氨酸残基是否可与巯基特定基团反应的方法是本领域中熟知的。可及的半胱氨酸残基一般存在于所述蛋白质的可及表面上。可及的半胱氨酸残基是未被埋没在所述结合蛋白内部并且/或者没有形成分子内二硫键的半胱氨酸残基。埋没在所述结合蛋白内部并且/或者形成分子内二硫键的半胱氨酸残基不需要从所述结合蛋白中去除,因为它们不会干扰对所述表面的连接。半胱氨酸残基当然能够与所述蛋白质中的半胱氨酸残基形成二硫键或者与其他含有反应活性巯基基团的化学缀合物形成二硫键。可利用序列信息和分子模型定位可及的半胱氨酸残基。这样的建模方法是本领域中已知的。在实施例中还描述了一种方法。一旦所述可及的半胱氨酸被定位,就能够如下文所述除去至少其中之一。可从所述结合蛋白上除去任意数量的天然可及的半胱氨酸残基,例如2个、5个、 10个或更多。在一些实施方案中,从所述核酸结合蛋白除去全部天然可及的半胱氨酸残基。 这将在下文中进一步描述。可使用本领域已知的方法除去天然可及的半胱氨酸残基。天然残基是存在于天然或野生型蛋白质中的残基。可通过缺失来除去天然半胱氨酸残基。优选通过置换来除去天然半胱氨酸残基。可用天然存在的残基或非天然存在的残基置换天然半胱氨酸残基。可用缺少反应活性巯基基团的残基置换天然半胱氨酸残基。优选用具有类似结构的残基置换天然半胱氨酸残基。用于代替半胱氨酸残基的合适残基包括但不局限于,丙氨酸、丝氨酸、苏氨酸、甲硫氨酸和缬氨酸。最优选用苏氨酸置换半胱氨酸残基。从所述核酸结合蛋白上去除的可及半胱氨酸残基的数目当然依赖于存在于天然蛋白质上的数目。在一个实施方案中,从所述结合蛋白上除去全部天然可及的半胱氨酸,并且向所述结合蛋白中引入一个或多个,例如2个、3个、4个、5个或更多个非天然可及的半胱氨酸残基。非天然残基是不存在于天然或野生型蛋白质中的残基。可通过添加来引入非天然半胱氨酸残基。优选通过置换来引入非天然半胱氨酸残基。一般引入非天然半胱氨酸来代替缺少反应活性巯基基团的残基。可用半胱氨酸代替任意残基,例如甲硫氨酸、缬氨酸、丝氨酸或丙氨酸。在另一个实施方案中,除保留一个或多个所述天然可及的半胱氨酸外,从所述结
14合蛋白除去所有天然可及的半胱氨酸残基。在该实施方案中,所述核酸结合蛋白包含一个或多个,例如2个、3个、4个、5个或更多个天然可及的半胱氨酸残基。优选地,除1个或2个所述天然可及的半胱氨酸残基外,从所述结合蛋白上除去所有所述天然可及的半胱氨酸残基。所保留的天然可及半胱氨酸残基被用于使所述结合蛋白以特定方式连接至所述表面。 在该实施方案中,所述核酸结合蛋白还可包含如上文所述引入的一个或多个,例如2个、3 个、4个、5个或更多个非天然可及半胱氨酸残基。所述核酸结合蛋白可通过所述天然残基、 所述非天然残基或者所述天然和非天然残基两者连接至所述表面。在优选的实施方案中,所述核酸结合蛋白仅包含一个或两个可及的半胱氨酸残基。所述半胱氨酸残基可以是如上文所述的天然的、非天然的半胱氨酸残基或两者的组合。 所述核酸蛋白通过这些半胱氨酸残基连接至所述表面。可使用本领域中已知的任何方法来确定仅一个或仅两个可及半胱氨酸残基的存在。例如,所述核酸结合蛋白能够与包含反应活性巯基基团的缀合物反应,可确定与所述蛋白质连接的缀合物的数目。下文更详细地描述了进行此类反应的方法。如果仅有一个缀合物在该反应后连接至核酸结合蛋白,则所述蛋白仅包含一个可及的半胱氨酸残基。如果仅有2个缀合物在该反应后连接至核酸结合蛋白,则所述蛋白仅包含2个可及的半胱氨酸残基。所述核酸结合蛋白保持其结合核酸的能力。这使得所述构建体可结合核酸并且优选如下文所描述的测序核酸。可使用本领域中已知的任何方法来测定构建体结合核酸的能力。例如,可对所述构建体或从所述构建体形成的孔测试它们结合核酸特定序列的能力。一般如实施例中所描述的测定构建体或孔结合核酸的能力。所述核酸结合蛋白还保持其使用标准技术表达的能力。如果一旦除去一个或多个天然半胱氨酸残基就不能表达所述蛋白质,则当然意味着所述蛋白质不能连接至所述表面。很容易确定某种特定突变体是否能够表达。核酸结合蛋白表达的能力一般如实施例中所描述的来测定。核酸结合蛋白本发明的构建体包含核酸结合蛋白。这类蛋白的实例包括但不局限于核酸处理酶,例如核酸酶、聚合酶、拓扑异构酶、连接酶和解旋酶;和非催化的结合蛋白,例如由 SCOP(蛋白质的结构分类)分类在核酸结合蛋白超家族(50M9)下的那些。如上所述,所述核酸结合蛋白被修饰以除去并且/或者代替半胱氨酸残基。核酸是包含两个或多个核苷酸的大分子。由蛋白质结合的核酸可包含任意核苷酸的任意组合。所述核苷酸可以是天然存在的或者是人造的。所述核苷酸可被氧化或者甲基化的。核苷酸一般包含核碱基、糖和至少一个磷酸基团。所述核碱基一般是杂环的。核碱基包括但不局限于嘌呤和嘧啶,更具体地是腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶和胞嘧啶。所述糖一般是戊糖。核苷酸糖包括但不局限于核糖和脱氧核糖。所述核苷酸一般是核糖核苷酸或脱氧核糖核苷酸。所述核苷酸一般包含单磷酸、二磷酸或三磷酸。磷酸可连接在核苷酸的5’或3’侧。核苷酸包括但不限于单磷酸腺苷(AMP)、二磷酸腺苷(ADP)、三磷酸腺苷(ATP)、 单磷酸鸟苷酸(GMP)、二磷酸鸟苷(GDP)、三磷酸鸟苷(GTP)、单磷酸胸苷(TMP)、二磷酸胸苷(TDP)、三磷酸胸苷(TTP)、单磷酸尿苷(UMP)、二磷酸尿苷(UDP)、三磷酸尿苷(UTP)、单磷酸胞苷(CMP)、二磷酸胞苷(CDP)、三磷酸胞苷(CTP)、环单磷酸腺苷(cAMP)、环单磷酸鸟苷(cGMP)、单磷酸脱氧腺苷(dAMP)、二磷酸脱氧腺苷(dADP)、三磷酸脱氧腺苷(dATP)、 单磷酸脱氧鸟苷(dGMP)、二磷酸脱氧鸟苷(dGDP)、三磷酸脱氧鸟苷(dGTP)、单磷酸脱氧胸苷(dTMP)、二磷酸脱氧胸苷(dTDP)、三磷酸脱氧胸苷(dTTP)、单磷酸脱氧尿苷(dUMP)、二磷酸脱氧尿苷(dUDP)、三磷酸脱氧尿苷(dUTP)、单磷酸脱氧胞苷(dCMP)、二磷酸脱氧胞苷 (dCDP)和三磷酸脱氧胞苷(dCTP)。所述核苷酸优选地选自AMP、TMP、GMP、CMP、UMP、dAMP、 dTMP、dGMP 或 dCMP。所述核酸可以是脱氧核糖核苷酸(DNA)或核糖核苷酸(RNA)。所述核酸可以是本领域中已知的任意合成的核酸,例如肽核酸(PNA)、甘油核酸(GNA)、苏糖核酸(TNA)、锁核酸(LNA)或具有核苷酸侧链的其他合成的聚合物。由蛋白质结合的核酸优选地为单链的, 例如(^嫩、1 離、6離、1嫩或1^離。由蛋白质结合的核酸优选地是双链的,例如DNA。结合单链核酸的蛋白质可被用于测序双链DNA,条件是所述双链DNA在其被所述蛋白质结合之前解离为单链优选地,所述核酸结合蛋白的三级结构是已知的。所述结合蛋白的三维结构的知识使得可对所述蛋白质做出修饰以促进其在本发明的构建体或孔中的功能。所述蛋白质可具有任意大小和任意结构。例如,所述蛋白质可以是低聚体,例如二聚体或三聚体。所述蛋白质优选地是从一个单体形成的小的球状多肽。这样的蛋白质容易处理并且干扰所述表面的可能性较小。例如,这样的蛋白质干扰孔亚基的孔形成能力的可能性较小。还优选地,所述蛋白质的活性位点的位置和功能是已知的。这可以防止对所述活性位点做出可消除所述蛋白质的活性的修饰。还允许所述蛋白质连接至所述表面,从而使得所述蛋白质以特定的方式连接至所述靶核酸序列。例如,如果所述蛋白质被连接于用于测序的跨膜蛋白质孔,那么它使得靶序列中的一部分核苷酸与所述孔相互作用,如下所述。 在这样的实施方案中,使所述蛋白质的活性位点的位置尽可能靠近所述孔通道的桶状体的开口并且使得所述蛋白质本身不会阻断电流是有益的。关于其中蛋白质使核酸取向的方式的知识也使得可设计有效的构建体。如将在下文所更详细描述的,可能必须纯化本发明的构建体。优选地,所述核酸结合蛋白能够承受用于纯化所述构建体的条件。本发明构建体中的表面可包含孔。这样的孔可被用于测序核酸。为了使所述靶核酸中的大部分核苷酸可通过随机传感被正确地鉴定,所述蛋白质优选地在缓冲液背景下结合所述核酸,所述缓冲液背景适于所述核苷酸的辨别。所述蛋白质优选地在远高于正常生理水平的盐浓度(例如IOOmM至2000mM)下至少具有残余活性。更优选地,将所述蛋白质修饰以增加其在高盐浓度下的活性。还可对所述蛋白质进行修饰以提高其持续处理能力、 稳定性和保存期限。合适的修饰可通过对嗜极微生物(extremphile)(例如嗜盐和中度嗜盐细菌、嗜热和中度嗜热生物)的核酸处理酶进行表征来确定,以及通过改变嗜温或嗜热核酸外切酶的耐盐性、稳定性和温度依赖性的定向进化方法来确定。所述酶还优选地在10°C至60°C的温度下(例如室温下)保持至少部分活性。这使得所述构建体可在多种温度下(包括在室温下)测序核酸。所述核酸结合蛋白优选地是核酸处理酶。核酸处理酶是能够与核酸相互作用并且改变核酸的至少一种性质的多肽。所述酶可通过切割所述核酸以形成单个核苷酸或较短的核苷酸链(例如二核苷酸或三核苷酸)来修饰所述核酸。所述酶可通过对所述核酸取向或将其移动至特定位置来修饰所述核酸。所述核酸处理酶优选来地自溶核酶。所述酶的构建体中使用的所述核酸处理酶更优选地来自酶分类(EC)组 3. 1. 11,3. 1. 13,3. 1. 14,3. 1. 15,3. 1. 16,3. 1. 21,3. 1. 22、 3. 1. 25,3. 1. 26,3. 1. 27,3. 1. 30和3. 1. 31中任一组的成员。所述核酸处理酶更优选地基于以下酶中的任一种#3.1.11,- 产生5'-磷酸单酯的脱氧核糖核酸外切酶。O 3. 1. 11. 1 脱氧核糖核酸外切酶I。O 3. 1. 11.2 脱氧核糖核酸外切酶III。〇3. 1. 11. 3 脱氧核糖核酸外切酶(λ诱导的)。O 3. 1. 11.4 脱氧核糖核酸外切酶(噬菌体SP3诱导的)。O 3. 1. 11.5 脱氧核糖核酸外切酶V。O 3. 1. 11.6 脱氧核糖核酸外切酶VII。· 3. 1. 13.-产生5'-磷酸单酯的核糖核酸外切酶。O 3. 1. 13. 1 核糖核酸外切酶II。〇3. 1. 13. 2 核糖核酸外切酶H。O 3. 1. 13.3 寡核苷酸酶。O 3. 1. 13.4 Poly (A)-特异的核糖核酸酶。〇3. 1. 13. 5 核糖核酸酶D。· 3. 1. 14.-产生3'-磷酸单酯的核糖核酸外切酶。O 3. 1. 14. 1 酵母核糖核酸酶。#3. 1. 15.-产生5'-磷酸单酯的可作用于核糖核酸或脱氧核糖核酸的核酸外切酶。〇 3. 1. 15. 1 毒液核酸外切酶(Venom exonuclease)。#3. 1. 16.-产生3'-磷酸单酯的可作用于核糖核酸或脱氧核糖核酸的核酸外切酶。〇 3. 1. 16. 1 脾脏核酸外切酶(Spleen exonuclease)。· 3. 1.21.-产生5'-磷酸单酯的脱氧核糖核酸内切酶。〇3.1.21.1 脱氧核糖核酸酶I.〇3. 1. 21. 2 脱氧核糖核酸酶IV (噬菌体-TG)-诱导的)。〇3. 1. 21. 3 I型位点特异的脱氧核糖核酸酶。〇3. 1. 21. 4 II型位点特异的脱氧核糖核酸酶。〇3. 1. 21. 5 III型位点特异的脱氧核糖核酸酶。〇3.1.21.6 CC-嗜性脱氧核糖核酸内切酶(CC-preferring endodeoxyribonuclease)。O 3. 1.21.7 脱氧核糖核酸酶V。· 3. 1. 22.-不产生5'-磷酸单酯的脱氧核糖核酸内切酶。〇3.1.22.1 脱氧核糖核酸酶II。
O 3. 1.22.2 曲霉属(Aspergillus)脱氧核糖核酸酶 K(1)。O 3. 1. 22. 3 转向条目3. 1. 21. 7。O 3. 1.22.4 交换型连接脱氧核糖核酸内切酶(Crossover junction endodeoxyribonuclease)。〇3. 1. 22. 5 脱氧核糖核酸酶X.· 3. 1. 25.-特异性用于改变的碱基的位点特异的脱氧核糖核酸内切酶。〇3. 1. 25. 1 脱氧核糖核酸酶(嘧啶二聚体)。O 3. 1. 25. 2 转向条目4. 2. 99. 18。^3.1. .-产生5'-磷酸单酯的核糖核酸内切酶。O 3. 1. 26. 1 绒胞菌多聚脑磷脂核糖核酸酶(Wiysarum polycephalum ribonuclease)。〇3. 1. 26. 2 核糖核酸酶α。O 3. 1. 26. 3 核糖核酸酶 III。〇3. 1. 26. 4 核糖核酸酶H。〇3. 1. 26. 5 核糖核酸酶P。O 3. 1. 26. 6 核糖核酸酶 IV。〇3. 1. 26. 7 核糖核酸酶Ρ4。〇3. 1. 26. 8 核糖核酸酶Μ5。〇3. 1. 26. 9 核糖核酸酶(poly- (U)-特异的)。O 3. 1. 26. 10 核糖核酸酶 IX。〇3. 1. 26. 11 核糖核酸酶Z。· 3. 1. 27.-不产生5'-磷酸单酯的核糖核酸内切酶。〇3.1.27.1 核糖核酸酶W2)。〇3. 1. 27. 2 枯草芽孢杆菌(Bacillus subtilis)核糖核酸酶。〇3. 1. 27. 3 核糖核酸酶 T (1)。〇3. 1. 27. 4 核糖核酸酶 U (2)。O 3. 1.27.5 胰核糖核酸酶。O 3. 1. 27. 6 肠杆菌属核糖核酸酶(Enterobacterribonuclease)。〇3. 1. 27. 7 核糖核酸酶F。〇3. 1. 27. 8 核糖核酸酶V。〇3. 1. 27. 9 tRNA-内含子核酸内切酶。〇3. 1. 27. 10 rRNA 核酸内切酶。#3. 1.30.-产生5'-磷酸单酯的可作用于核糖核酸或脱氧核糖核酸的核糖核酸内切酶。〇3.1.30.1 曲霉属核酸酶S(I)。〇 3. 1. 30. 2 粘质沙雷氏菌核酸酶(Serratia marcescensnuclease)。· 3. 1. 31.-产生3'-磷酸单酯的可作用于核糖或脱氧核糖的核糖核酸内切酶。3. 1. 31. 1 微球菌核酸酶(Micrococcal nuclease)。所述酶最优选地衍生自核酸外切酶,例如脱氧核糖核酸酶,其切断核酸以形成个
18体核苷酸。脱氧核酸核酸外切酶的优点在于它们可作用于单链和双链DNA并且可从5’-3’ 或3’ -5’方向水解碱基。个体核苷酸是单个核苷酸。个体核苷酸是不与另一个核苷酸或核酸以任何键(例如磷酸二酯键)结合的核苷酸。磷酸二酯键包含结合在另一个核苷酸糖基团上的核苷酸磷酸基团之一。个体核苷酸一般是不与另一个核酸序列以任何方式结合的核苷酸,所述另一个核酸序列具有至少5个、至少10个、至少20个、至少50个、至少100个、至少200个、至少500个、至少1000个或至少5000个核苷酸。用于本发明的优选的酶包括来自大肠杆菌的核酸外切酶I (SEQ IDNO :6),来自大肠杆菌的核酸外切酶III (SEQ ID N0:52)。来自嗜热栖热菌的RecJ(SEQ ID NO :54)和噬菌体λ核酸外切酶(SEQ ID NO 56)以及它们的变体。SEQ ID NO :56的三个相同亚基相互作用以形成三聚体核酸外切酶。所述酶最优选地基于来自大肠杆菌的核酸外切酶I (SEQ ID NO 6)。所述核酸处理酶优选地衍生自包含SEQ ID NO =6,52,54和56所示序列中任一个或其变体的核酸外切酶。换言之,所述酶优选地在如上文所述修饰其半胱氨酸前包含SEQ ID NO =6,52,54和56所示序列中任一个或其变体。SEQ ID NO =6,52,54或56的变体是具有与SEQ ID NO =6,52,54或56的氨基酸序列不同的氨基酸序列但是保持核酸处理能力的酶。所述变体处理核酸的能力可使用本领域中已知的任何方法来分析。例如,可如实施例中所描述的来测定变体处理核酸的能力。如实施例中所述,所述变体还必须保持其被表达的能力。 所述变体可包括有助于处理所述核酸并且/或者促进其在高盐浓度和/或室温下的活性的修饰。所述酶可以是由生物体(例如由大肠杆菌)表达的天然存在的变体。变体还包括由重组技术产生的非天然存在的变体。在SEQ ID而6、52、讨或56的氨基酸序列全长中, 基于氨基酸同一性,变体优选地与所述序列有至少50%的同源性。更优选地,基于氨基酸同一性,所述变体多肽与SEQ ID NO :6、52、讨或56的氨基酸序列在全长上具有至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%,并且更优选至少95%、97%或99%的同源性。在200或更多(例如230、250、270、280或者更多)个连续氨基酸的片段上有至少80% (例如至少85%、90(%或95(%)的氨基酸同一性(“硬同源性 (hardhomology),,)。可以用本领域中的标准方法来确定同源性。例如,UWGCG软件包提供的BESTFIT 程序可以用于计算同源性(例如使用它的默认设置)(Devereux et al (1984)Nucleic Acids Research 12,387-395) 例如,如 Altschul S. Ε. (1993) J Mol Evol 36:290-300; Altschul, S, F et al (1990) JMol Biol 215 :403-10 中所述,可以使用 PILEUP 和 BLAST 算法计算同源性或者对序列进行比对(例如鉴定等价残基或对应序列(一般使用它们的默认设置))。进行BLAST分析的软件可以从美国国家生物技术信息中心(National Center for Biotechnology Information) (http://www. ncbi. nlm. nih. gov/)公开获得。所述算法涉及到首先鉴别高打分序列对(HSP),所述鉴别步骤通过如下方式实现鉴别查询序列中长度为W的短字,所述短字就是在与数据库序列中相同长度的字做比较时,能匹配或者满足一些正值阈值分值T的字。T是指邻近字分值阈值(Altschul et al,见上文)。将这些初始邻近字匹配作为种子启动检索,以发现包含它们的HSP。在沿每条序列的两个方向上进行字匹配延伸,到达累积比对分值能够增加的极限。在每个方向上的字匹配延伸停止的条件是 所述累积比对分值从其所达到的最大值下降X量;由于一个或多个负打分值残基比对的累积,所述累积分值降到0或小于0 ;或者达到任何一个序列的端点。所述BLAST算法的参数 W、T和X决定了比对的敏感度和速度。所述BLAST程序使用的默认字长(W)为11,BL0SUM62 打分矩阵(见 Henikoff and Henikoff (1992) Proc. Natl. Acad. Sci. USA 89:10915-10919) 比对⑶为50,期望(E)为10,M = 5,N = 4,并且是进行双链比较。所述BLAST算法可进行两个序列之间的相似性的统计分析;参见例如Karlin and Altschul (1993) Proc. Natl. Acad. Sci. USA 90 :5873_5787。所述 BLAST 算法提供的一种相似性的量度是最小和概率(P(N)),所述最小和概率表示两个氨基酸序列之间随机出现匹配的概率。例如,如果第一序列与第二序列比较中的最小和概率小于约1,优选小于约0. 1,更优选小于约0. 01,并且最优选小于约0. 001,那么第一序列被认为与第二序列相似。除了上文所描述的那些之外,还可以对SEQ ID NO :6、52、M或56的氨基酸序列做出氨基酸置换,例如,最多达1、2、3、4、5、10、20或30个置换。可根据下表1做出保守性置换。表1-保守性置换在第二列同一格,优选在第三列同一行中的氨基酸可相互置换。
权利要求
1.一种包含核酸结合蛋白和表面的构建体,其中从所述结合蛋白质上除去至少一个天然可及的半胱氨酸残基,其中所述结合蛋白通过一个或多个可及半胱氨酸残基连接在所述表面上,并且其中所述结合蛋白保持其结合核酸的能力。
2.权利要求1的构建体,其中从所述结合蛋白上除去所有天然可及的半胱氨酸,并且将一个或多个非天然可及半胱氨酸残基弓I入所述结合蛋白。
3.权利要求2的构建体,其中通过置换引入所述非天然可及半胱氨酸残基。
4.权利要求1的构建体,其中所述结合蛋白保留一个或多个可及半的胱氨酸残基,除去其他可及的半胱氨酸残基。
5.权利要求2至4中任一项的构建体,其中通过置换除去所述天然半胱氨酸残基。
6.权利要求5的构建体,其中所述天然半胱氨酸残基被苏氨酸置换。
7.前述权利要求中任一项的构建体,其中所述可及的半胱氨酸能够与巯基特定基团反应。
8.前述权利要求中任一项的构建体,其中所述核酸结合蛋白是核酸处理酶并且保持其处理核酸的能力。
9.权利要求8的构建体,其中所述核酸处理酶衍生自核酸酶。
10.权利要求9的构建体,其中所述核酸酶是以下酶分类(EC)组中任一组的成员 3. 1. 11,3. 1. 13,3. 1. 14,3. 1. 15,3. 1. 16,3. 1. 21,3. 1. 22,3. 1. 25,3. 1. 26,3. 1. 27,3. 1. 30 和 3. 1. 31。
11.权利要求10的构建体,其中所述核酸处理酶衍生自核酸外切酶。
12.权利要求11的构建体,其中所述核酸外切酶包含SEQID NO =6,52,54和56中任一个所显示的序列或者其变体。
13.前述权利要求中任一项的构建体,其中所述核酸结合蛋白包含SEQID NO :8,10, 12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48 和 50 中任一个所显示的序列或其变体。
14.权利要求8的构建体,其中所述核酸处理酶衍生自聚合酶、解旋酶或拓扑异构酶。
15.权利要求14的构建体,其中(a)所述聚合酶是酶分类(EC)组2. 7. 7. 6,2. 7. 7. 7,2. 7. 7. 19,2. 7. 7. 48 和 2. 7. 7. 49 中任一组的成员;(b)所述解旋酶是酶分类(EC)组3.6. 1.-和2. 7. 7.-中任一组的成员;或者(c)所述拓扑异构酶是酶分类(EC)组5.99. 1. 2和5. 99. 1. 3中任一组的成员。
16.权利要求15的构建体,其中所述聚合酶是DNA依赖的DNA聚合酶、RNA依赖的DNA 聚合酶、DNA依赖的RNA聚合酶或RNA依赖的RNA聚合酶。
17.权利要求15的构建体,其中所述解旋酶是ATP依赖的DNA解旋酶、ATP依赖的RNA 解旋酶或不依赖ATP的RNA解旋酶。
18.权利要求15的构建体,其中所述拓扑异构酶是促旋酶。
19.前述权利要求中任一项的构建体,其中所述表面是跨膜蛋白质孔或其亚基。
20.权利要求19的构建体,其中所述跨膜蛋白质孔是α-溶血素(a-HL)。
21.权利要求20的构建体,其中所述表面包含SEQID NO :2所示的序列或其变体。
22.前述权利要求中任一项的构建体,其中所述酶通过一个或多个连接体连接于所述表面。
23.权利要求22的构建体,其中所述一个或多个连接体是核酸杂交连接体。
24.—种用于测序核酸的修饰孔,包含至少一个权利要求19至21中任一项的构建体。
25.权利要求M的孔,其中所述孔包含权利要求21的构建体和6个亚基,所述亚基包含SEQ ID NO 2所示的序列或其变体。
26.权利要求25的孔,其中所有7个亚基都在SEQID NO 2的位置139处具有谷氨酰胺,并且所述亚基之一在SEQ ID NO 2的位置135处具有半胱氨酸。
27.权利要求沈的孔,其中所有7个亚基都在SEQID NO :2的位置113处具有精氨酸。
28.权利要求M至27中任一项的孔,其中所述孔包含分子衔接体,其有利于所述孔与一个或多个核苷酸之间的相互作用。
29.权利要求观的孔,其中所述分子衔接体是环糊精或其衍生物。
30.权利要求四的孔,其中所述环糊精是七-6-氨基-β-环糊精(3!117-0^)、6-单脱氧-6-单氨基-β -环糊精(_厂β⑶)或七-(6-脱氧-6-胍基)-环糊精(gu7- β⑶)。
31.一种用于生产用于测序核酸的修饰孔的试剂盒,包括(a)至少一种权利要求19至21中任一项的构建体;和(b)形成孔所需的其他亚基。
32.权利要求31的试剂盒,其中所述试剂盒包含(a)权利要求20的构建体;和(b)各自均包含SEQID NO 2所示的序列或其变体的6个亚基。
33.一种生产权利要求1至23中任一项的构建体的方法,包括(a)使包含一个或多个可及的半胱氨酸残基的核酸结合蛋白通过所述半胱氨酸残基连接于表面;并且(b)确定所得到的构建体是否能够结合核酸。
34.权利要求33的方法,还包括在步骤(a)前(i)从所述结合蛋白上除去所有天然可及的半胱氨酸残基并且向所述结合蛋白中引入一个或多个非天然可及半胱氨酸残基;或者( )使所述结合蛋白上保留一个或多个天然可及的半胱氨酸残基,除去其他天然可及的半胱氨酸残基。
35.一种生产权利要求M的修饰孔的方法,包括(a)使得至少一种权利要求19至21中任一项的构建体与其他合适的亚基形成孔;并且(b)检测所得到的孔是否能够结合核酸并且检测核苷酸。
36.一种测序靶核酸序列的方法,包括(a)使所述靶序列与权利要求M的孔接触,所述孔包含核酸外切酶,从而使得所述核酸外切酶从所述靶序列的一端消化单个核苷酸;(b)使所述核苷酸与所述孔接触以使得所述核苷酸与所述衔接体相互作用;(c)测量所述相互作用过程中通过所述孔的电流,并从而确定所述核苷酸的种类;并且(d)在所述靶序列的相同末端重复步骤(a)至(c),并从而确定所述靶序列的序列。
37.一种测序靶核酸序列的方法,包括(a)使所述靶序列与权利要求M的孔接触,从而使得所述酶将所述靶序列推过或拉过所述孔,并且所述靶序列中的一部分核苷酸与所述孔相互作用;并且(b)检测每次所述相互作用过程中通过所述孔的电流,并从而确定所述靶序列的序列;
38.一种包含 SEQ ID NO :8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、 42、44、46、48和50中任一个所显示的序列或其变体的核酸外切酶。
39.一种编码权利要求38的核酸外切酶的多核苷酸序列。
全文摘要
本发明涉及包含核酸结合蛋白和表面的构建体。将至少一个天然可及的半胱氨酸从所述结合蛋白质上去除。所述结合蛋白通过一个或多个可及的半胱氨酸连接于所述表面。从所述蛋白质上去除其他可及的半胱氨酸使得可控制对所述表面的连接。所述构建体可被用于生成其上连接有核酸结合蛋白的跨膜孔。这样的孔尤其可用于测序核酸。所述酶以这样的方式操作核酸,所述方式即使得所述孔能够通过随机传感检测所述核酸的每个组成核苷酸。
文档编号C12N9/12GK102482330SQ201080014556
公开日2012年5月30日 申请日期2010年1月29日 优先权日2009年1月30日
发明者B·麦克基翁, J·怀特, J·米尔顿, L·贾雅辛格, R·莫伊希, 迈克尔·纳格斯 申请人:牛津纳米孔技术有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1