新型dna聚合酶的制作方法

文档序号:449976阅读:487来源:国知局
专利名称:新型dna聚合酶的制作方法
技术领域
本发明涉及作为遗传工程用试剂有用的DNA聚合酶及其制造方法,以及编码该酶的基因。
背景技术
DNA聚合酶是作为遗传工程用试剂有用的酶,并被广泛用于DNA碱基序列测定、标记、位点特异性诱变等方法。而且,由于近来聚合酶链反应(PCR)方法的发展,耐热DNA聚合酶引起了人们的注意。已经有多种适用于PCR方法的DNA聚合酶得到了发展并获得了商业化。
现在已知的DNA聚合酶根据核苷酸序列的同源性可大体上分为4个家族,其中家族A(pol I型酶)和家族B(α型酶)占大多数。虽然属于各家族的DNA聚合酶一般具有相似的生物化学特征,但详细的比较显示,每种酶在底物特异性、底物类似物的整合、引物延伸性的强度和速度、DNA合成的模式、外切核酸酶活性的伴随、温度、pH等最适反应条件、以及对抑制剂的敏感性等方面都有独特的性质。因此,在相应的实验操作中应在各种现有的DNA聚合酶中选用具有最适性质的DNA聚合酶。
发明公开本发明的目的是提供不属于上述家族的、且具有现有DNA聚合酶没有的生物化学特性的新型DNA聚合酶。例如,引物延伸活性与3’→5’外切核酸酶活性被认为是相反的特性,现存的DNA聚合酶中具备强的引物延伸活性的酶不具有对合成忠实性起重要校正功能作用的3’→5’外切核酸酶活性。同时校正功能优秀的酶的引物延伸活性弱。因此,开发具有强的3’→5’外切核酸酶活性并且引物延伸活性也很强的DNA聚合酶,对试管内DNA合成是很有意义的。
本发明的另一目的是提供上述新型DNA聚合酶的制造方法。
本发明的另一目的是提供编码本发明的DNA聚合酶的基因。
发明人锐意研究的结果是,在极端嗜热性古细菌激烈热球菌(Pyrococcus furiosus)中发现了新型DNA聚合酶的基因,在克隆之后,弄清楚了只有两种新型蛋白质同时存在时,其新型DNA聚合酶活性才能显示。而且,本发明还制备了导入了上述基因的转化子,并成功地大量生产了这种复合型DNA聚合酶,至此本发明完成。
即,本发明的要点涉及(1)具有下列特性的DNA聚合酶①在以单链模板DNA与引物退火形成的复合物为底物时,测定的聚合酶活性比以活化的DNA为底物时显示的活性高。
②具有3’→5’外切核酸酶活性。
③在按下述条件以λ-DNA为模板进行聚合酶链反应(PCR)时,能够扩增约20千碱基对的DNA片段。
PCR的条件(a)反应液组成含10 mM Tris-盐酸(pH9.2)、3.5 mM MgCl2、75 mM KCl、400μM dATP、dCTP、dGTP、dTTP、0.01%小牛血清白蛋白、0.1% Triton X-100、5.0 ng/50μlλ-DNA、10 pmol/50μl引物λ1(序列表的序列号8)、以及引物λ11(序列表的序列号9)、3.7单位/50μl DNA聚合酶。
(b)反应条件以每循环98℃、10秒~68℃、10分钟进行30个循环的PCR反应。
(2)前面(1)记载的DNA聚合酶,其特征为与Taq DNA聚合酶相比,在DNA合成时的错误频率低;(3)前面(1)或(2)记载的DNA聚合酶,用凝胶过滤法测得的分子量为约220千道尔顿或约385千道尔顿;(4)前面(1)~(3)记载的任何DNA聚合酶,其特征为在两种DNA聚合酶组成蛋白(第1种DNA聚合酶组成蛋白和第2种DNA聚合酶组成蛋白)共存时能显示活性;(5)前面(4)记载的DNA聚合酶,其特征是,第1种DNA聚合酶组成蛋白和第2种DNA聚合酶组成蛋白用SDS-PAGE测得的分子量分别为约90,000道尔顿和约140,000道尔顿;(6)前面(4)或(5)中记载的DNA聚合酶,其特征为,构成前面(4)或(5)中记载的DNA聚合酶的第1种DNA聚合酶组成蛋白包括序列表的序列号1中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物;(7)前面(4)或(5)中记载的DNA聚合酶,其特征为,构成前面(4)或(5)中记载的DNA聚合酶的第2种DNA聚合酶组成蛋白包括序列表的序列号3中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物;(8)前面(4)或(5)中记载的DNA聚合酶,其特征为,构成前面(4)或(5)中记载的DNA聚合酶的第1种DNA聚合酶组成蛋白包括序列表的序列号1中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物;构成前面(4)或(5)中记载的DNA聚合酶的第2种DNA聚合酶组成蛋白包括序列表的序列号3中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物;(9)构成前面(4)或(5)中记载的DNA聚合酶的第1种DNA聚合酶组成蛋白,包括序列表的序列号1中所示的氨基酸序列,或包括在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换且具有基本相同的活性的功能等价物的氨基酸序列;(10)构成前面(4)或(5)中记载的DNA聚合酶的第2种DNA聚合酶组成蛋白,包括序列表的序列号3中所示的氨基酸序列,或包括在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换且具有基本相同的活性的功能等价物的氨基酸序列;(11)含有编码前面(9)中记载的第1种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有编码序列表的序列号1中所示的氨基酸序列的碱基序列的全部或一部分,或者编码含有在序列号1的氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换的氨基酸序列且具有第1种DNA聚合酶组成蛋白的功能的蛋白质;(12)含有编码前面(9)中记载的第1种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有序列表的序列号2中所示的碱基序列的全部或一部分,或者含有在严格条件下能与该序列杂交的碱基序列;(13)含有编码前面(10)中记载的第2种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有编码序列表的序列号3中所示的氨基酸序列的碱基序列的全部或一部分,或者编码含有在序列号3的氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换的氨基酸序列且具有第2种DNA聚合酶组成蛋白的功能的蛋白质;(14)含有编码前面(10)中记载的第2种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有序列表的序列号4中所示的碱基序列的全部或一部分,或者含有在严格条件下能与该序列杂交的碱基序列;(15)DNA聚合酶的制造方法,其特征为,培养含有编码前面(11)或(12)中记载的第1种DNA聚合酶组成蛋白的基因和编码前面(13)或(14)中记载的第2种DNA聚合酶组成蛋白的基因两者的转化子,从该培养物中收集DNA聚合酶;和(16)DNA聚合酶的制造方法,其特征为分别培养含有编码前面(11)或(12)中记载的第1种DNA聚合酶组成蛋白的基因的转化子和含有编码前面(13)或(14)中记载的第2种DNA聚合酶组成蛋白的转化子,混合培养物中所含的DNA组成蛋白,收集DNA聚合酶。
附图简述

图1是实施例1中获得的粘粒克隆No.264和粘粒克隆No.491中插入的DNA片段的限制酶切图谱。
图2是质粒pFU1001中插入的XbaI-XbaI DNA片段的限制酶切图谱。
图3是本发明的DNA聚合酶的最适pH的示意图。
图4是本发明的DNA聚合酶的热稳定性示意图。
图5是本发明的DNA聚合酶的3’→5’外切核酸酶活性的示意图。
图6是本发明的DNA聚合酶的引物延伸活性的放射性自显影图。
发明的优选实施方案(1)本发明的DNA聚合酶及其组成蛋白本发明的DNA聚合酶的一个例子具有以下性质
①在以单链模板与引物退火形成的复合物为底物时测定的聚合酶活性,比以活化的DNA(DNase I处理的小牛胸腺DNA)作模板时显示的聚合酶活性高。
②具有3’→5’外切核酸酶活性。
③最适pH6.5-7.0(磷酸钾缓冲液中、75℃)。
④80℃、30分钟热处理后能显示80%的残存活性。
⑤并且,在以λ-DNA为模板进行聚合酶链反应(PCR)时,能够扩增约20千碱基对的DNA片段而不需要添加其他的酶。PCR的条件如下(a)反应液组成含10mM Tris-盐酸(pH9.2)、3.5mM MgCl2、75mM KCl、400μM dATP、dCTP、dGTP、dTTP、0.01%小牛血清白蛋白(BSA)、0.1%Triton X-100、5.0 ng/50μlλ-DNA、10 pmol/50μl引物λ1(序列表的序列号8)、以及引物λ11(序列表的序列号9)、3.7单位/50μl DNA聚合酶。在这里,DNA聚合酶的1个单位按如下方法确定。制备50μl含有待测定活性样品的反应液[20mM Tris-盐酸(pH7.7)、15mM MgCl2、2mM 2-巯基乙醇、0.2mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP、60nM[3H]dTTP(Amersham公司生产)],在75℃反应15分钟。将此反应液40μl点于DE滤纸(Whatman公司生产),用5%Na2HPO4洗涤5次,然后用液闪计数器测定DE滤纸上残留的放射活性,在30分钟内将10nmol的[3H]dTMP掺入底物DNA的酶量定义为1个单位。
(b)反应条件以每循环98℃、10秒~68℃、10分钟进行30个循环的PCR反应。
⑥本发明的DNA聚合酶在引物延伸活性、DNA合成的正确性两方面与Taq DNA聚合酶比较都更优秀。即,本发明的DNA聚合酶的DNA合成反应的延伸活性,例如在PCR反应中被扩增DNA的链长,和反应的正确性(DNA合成时错误频率低)与作为耐热性DNA聚合酶代表的Taq DNA聚合酶(例如宝酒造社生产的TaKaRa Taq)相比都更为优秀。
本发明的DNA聚合酶的分子量用凝胶过滤法测定约为220千道尔顿或约385千道尔顿,在SDS-PAGE上显示的是与约90,000道尔顿和约140,000道尔顿相当的两条带,它是由两种蛋白质组成的酶。在本发明中,约90,000道尔顿的蛋白质(相当于下文的ORF3)被称为第1种DNA聚合酶组成蛋白,约140,000道尔顿的蛋白质(相当于下文的ORF4)被称为第2种DNA聚合酶组成蛋白。经过推定,本发明的DNA聚合酶是由第1种DNA聚合酶组成蛋白与第2种DNA聚合酶组成蛋白以1∶1或1∶2的摩尔比通过非共价结合形成的复合体。
构成本发明的DNA聚合酶的第1种DNA聚合酶组成蛋白包括序列表的序列号1中所示的氨基酸序列,或也可以是具有与其基本相同活性的功能等价物,而第2种DNA聚合酶组成蛋白含有序列表的序列号3中所示的氨基酸序列,或也可以是具有与其基本相同活性的功能等价物。
在本说明书中记载的“功能等价物”的含义如下。除了天然存在的蛋白质的编码基因的多形性及变异之外,生成的蛋白质因在体内或纯化中的修饰反应等可在氨基酸序列中引起氨基酸的缺失、插入、附加、置换等变异,但已知某些蛋白质能显示与没有变异的蛋白质基本上相同的生理活性和生物学活性。这种在构造上有差异但在功能和活性上没有发现大的差异的蛋白质就被称为功能等价物。在这里,只要基本上能显示同等的生理学和生物学活性,变异氨基酸的数目没有特别的限制。具体的例子为1个以上,如1个或几个,更具体为1个至约10个变异(缺失、插入、附加、置换等)。
人为地在蛋白质的氨基酸序列中引入上述变异时也一样,在这种情况下,可以制备各种各样的变异体。例如,虽然在大肠杆菌中表达的蛋白质的N末端存在的甲硫氨酸残基在多数情况下用甲硫氨酸氨肽酶来去除。但这种去除是否完全取决于蛋白质的种类,带有或不带有甲硫氨酸的蛋白质两者都可能生成。尽管如此,在大多数情况下,甲硫氨酸残基的有无并不影响蛋白的活性。而且,已经知道白细胞介素2(IL-2)的氨基酸序列中的特定半胱氨酸残基被丝氨酸置换时,仍能保持白细胞介素2的活性[《科学)》(Science),第224卷,1431页(1984)]。
此外,在用遗传工程方法进行蛋白质的生产时,常以融合蛋白的形式来进行表达。例如,为了增加目的蛋白的表达量,在目的蛋白的N末端附加来自其他蛋白质N末端的肽链,或在N未端或C末端附加适当的肽链,表达该蛋白,通过使用与此类肽链有亲和性的载体来使目的蛋白的纯化更加容易进行。因此,与本发明的DNA聚合酶有部分氨基酸的差异的DNA聚合酶,只要能显示与本发明的DNA聚合酶基本上相同的活性,该酶作为“功能等价物”也属于本发明的范围内。(2)本发明的DNA聚合酶的基因编码构成本发明的DNA聚合酶的第1种DNA聚合酶组成蛋白的DNA,可举出含有编码序列表的序列号1中所示氨基酸序列的碱基序列的全部或一部分的DNA,例如,含有序列表的序列号2中所示的碱基序列的全部或一部分的DNA。即,含有编码序列号1中所示氨基酸序列的碱基序列的一部分的DNA,例如,含有序列表的序列号2中所示碱基序列的一部分的DNA,编码具有第1种DNA聚合酶组成蛋白的功能的蛋白质的碱基序列,也在本发明的范围内。并且,还可举出编码包括在序列号1的氨基酸序列中有一个以上如1个或几个氨基酸缺失、插入、附加或置换的氨基酸序列、并具有第1种DNA聚合酶组成蛋白功能的蛋白质的DNA。并且,能与上述序列在严格条件下杂交、并编码具有第1种DNA聚合酶组成蛋白功能的蛋白质的碱基序列,也在本发明的范围内。另外,编码本发明的DNA聚合酶的第2种DNA聚合酶组成蛋白的DNA,可举出含有编码序列表的序列号3中所示氨基酸序列的碱基序列的全部或一部分的DNA,例如,含有序列表的序列号4中所示的碱基序列的全部或一部分的DNA。即,含有编码序列号3中所示氨基酸序列的碱基序列的一部分的DNA,例如,含有序列表的序列号4中所示的碱基序列的一部分的DNA,编码具有第2种DNA聚合酶组成蛋白的功能的蛋白质的碱基序列,也在本发明的范围内。并且,还可举出编码包括在序列号3的氨基酸序列中有一个以上如1个或几个氨基酸缺失、插入、附加或置换的氨基酸序列、并具有第2种DNA聚合酶组成蛋白的功能的蛋白质的DNA。并且,能与上述序列在严格条件下杂交、并编码具有第2种DNA聚合酶组成蛋白功能的蛋白质的碱基序列,也在本发明的范围内。
在这里,“具有第1种DNA聚合酶组成蛋白的功能的蛋白质”或“具有第2种DNA聚合酶组成蛋白的功能的蛋白质”是指这两种蛋白质共存时,能够提供具有前面①~⑥中所示各种理化性质的DNA聚合酶活性。
在这里,“能在严格条件下杂交”是指在含有0.5%SDS、0.1%小牛血清白蛋白(BSA)、0.1%聚乙烯吡咯烷酮、0.1%Ficol 400、0.01%变性鲑精DNA的6×SSC(1×SSC表示0.15 M NaCl、0.0015 M柠檬酸钠、pH7.0)中与探针在50℃保温12-20小时后,与探针杂交。
在此对本说明书中记载的“含有编码氨基酸序列的碱基序列的DNA”这一用语进行如下说明已知在基因上指导氨基酸的密码子(3碱基组合)依氨基酸的种类存在1-6种。因此编码氨基酸的DNA根据氨基酸序列可有多种存在方式。在自然界中,基因并不一定稳定存在,基因的碱基序列上发生变异并不少见,有时基因上碱基序列的变异并不引起所编码氨基酸序列的变异(称为无声突变)。在这种情况下,产生了编码相同氨基酸序列的不同基因。因此,即使在已经分离了的编码特定氨基酸序列的基因上,在经过含有此基因的生物传代后,也不能否定编码相同氨基酸的多种基因的可能性。
而且,采用各种遗传工程的方法人工制备编码相同氨基酸的多种基因也不困难。例如,用遗传工程方法生产蛋白质时,编码目的蛋白质的原始基因上使用的密码子在宿主中的使用频率很低,此时蛋白质的表达量也低。在这种情况下,在不引起所编码的氨基酸序列变化的前提下,人工用宿主高频率使用的密码子进行变换,能使目的蛋白高表达(例如,特公平7-102146号公报)。因此人工制备编码特定氨基酸序列的多种基因是可能的,在自然界中也能生成。因此含有与本发明公开的碱基序列相同的碱基序列的基因,以及编码本发明公开的氨基酸序列的基因都包括在本发明中。(3)本发明的DNA聚合酶的制造方法发明人从极端嗜热性古细菌激烈热球菌中发现了新型DNA聚合酶的基因,通过克隆,清楚了该基因编码新型DNA聚合酶,该基因上的两种蛋白质在共存时能显示活性。可以通过制备导入了这种基因的转化子来大量生产本发明的DNA聚合酶。在这种情况下,可以通过培养含有前面的编码第1种DNA聚合酶组成蛋白的基因和编码第2种DNA聚合酶组成蛋白的基因两者的转化子,从培养物中收集DNA聚合酶的方法来进行。也可以通过分别培养含有编码第1种DNA聚合酶组成蛋白的基因的转化子和含有编码第2种DNA聚合酶组成蛋白的基因的转化子,然后将培养物中所含的DNA聚合酶组成蛋白混合,然后收集DNA聚合酶的方法来进行。
在这里,“含有编码第1种DNA聚合酶组成蛋白的基因和第2种DNA聚合酶组成蛋白的基因两者的转化子”,可以是分别含有相应基因的两种表达载体同时转化而来的转化子,或者是通过将两种基因重组到能分别表达各自蛋白的一个表达载体上而制备的转化子。(4)下面详细说明本发明的DNA聚合酶基因的克隆、所获克隆的分析、表达产物DNA聚合酶的理化性质、活性、对PCR方法的适用性。
本发明使用的菌株没有特别的限制,例如属于热球菌属的激烈热球菌(pyrococcus furiosis)DSM3628,该菌株可由DeutscheSammlung von Mikroorganismen und Zellkulturen GmbH获得。发明人在适当的增殖培养基上培养该菌株,制备培养物的粗抽提物,进行聚丙烯酰胺凝胶电泳时,发现凝胶内存在多条能显示DNA聚合酶活性的蛋白质带,推测也存在各自对应的基因。即,新型DNA聚合酶基因及其产物可按如下举例程序进行克隆。①从激烈热球菌中抽提DNA。②用适当的限制酶消化①的DNA,用质粒、粘粒等作载体制备DNA文库。③将②中制备的文库导入大肠杆菌,外源基因表达后,收集各克隆的粗抽提物制备蛋白文库。④使用③中制备的蛋白文库测定DNA聚合酶活性,从粗抽提物中有活性的大肠杆菌克隆中提取外源DNA。⑤分析提取的质粒或粘粒中所含的激烈热球菌DNA片段,缩小能编码显示DNA聚合酶活性的蛋白质的区域。⑥确定预计编码能显示DNA聚合酶活性的蛋白质的区域,推导蛋白质的一级结构。⑦构建便于在大肠杆菌中表达⑥中推导的蛋白质的表达载体,纯化所产生的蛋白质,并分析其特性。
上述DNA供体激烈热球菌DSM3638是一种极端嗜热性古细菌,将此细菌在95℃厌氧培养。破碎增殖的菌体后抽提、纯化DNA的方法和用限制酶将所获得的DNA切断的方法等都可采用众所周知的方法。这些方法详见1982年冷泉港实验室出版、T.Maniatis等著《分子克隆实验指南)》(Molecular Coning,A Laboratory Manual)第75-178页中的记载。
制备DNA文库时,可以使用例如三股螺旋粘粒载体(Stratagene公司生产)。激烈热球菌的DNA用Sau 3AI(宝酒造社生产)部分消化,密度梯度离心所获得的长链DNA片段,与上述载体的BamHI位点连接,然后体外包装。将用此方法制备的DNA文库所获得的转化子分别培养,收集菌体,然后超声波处理以破碎菌体,进行热处理使大肠杆菌含有的DNA聚合酶失活。用离心法可以获得含有耐热性DNA聚合酶的上清。该上清即命名为粘粒蛋白文库。用部分上清测定DNA聚合酶活性,可以获得能表达来自激烈热球菌的DNA聚合酶的克隆。DNA聚合酶活性的测定方法可以采用众所周知的方法,该方法在Harparand Row公司出版、D.R.Davis编辑的《大肠杆菌的DNA聚合酶)》(DNApolymerase from Escherichia coli)第263-276页(C.C.Richardson著)中记载。
发明人已经克隆了一种激烈热球菌的DNA聚合酶基因,并清楚了其结构,见《核酸研究)》(Nucleic Acids Research)第21卷259-265页(1993)中记载。该基因的翻译产物由775个氨基酸组成,是分子量为90,000道尔顿的多肽,该氨基酸序列明显含有α-型DNA聚合酶的保守序列。实际上,该基因产物所显示的DNA聚合酶活性可被α-型DNA聚合酶的特异性抑制剂蚜栖菌素(aphidicolin)抑制,与本发明的DNA聚合酶不一样。因此,需从所获得的显示耐热性DNA聚合酶活性的克隆中将上述已经存在的基因除去,这可通过消化含有各克隆的粘粒,以上述基因作探针进行杂交,选择不能杂交的克隆来进行。对含有所获得的新型DNA聚合酶基因克隆的消化粘粒中的DNA插入片段作限制酶切图谱。下一步,将插入DNA片段按限制酶切图谱切成各种区域,分别在质粒中亚克隆,导入大肠杆菌后测定所表达的耐热性DNA聚合酶的活性,从而确定该DNA片段聚合酶基因的位置。通过这种方法能够获得含有DNA聚合酶基因的约10千碱基对的XbaI-XbaI DNA片段。
含有整合了该DNA片段的质粒的重组大肠杆菌,其抽提物经90℃、20分钟热处理后仍有足够的DNA合成活性,而没有整合该DNA片段的质粒则没有此活性。因此结论是,在该DNA片段上存在产生耐热性DNA聚合酶的信息,且在大肠杆菌中带有该信息的基因能够表达。该DNA片段整合进载体pTV118N(宝酒造社生产)所得到的质粒被命名为pFU1001,用该质粒转化的大肠杆菌JM109被命名为Escherichia coli JM109/pFU1001。该菌已在1995年8月11日(原始保藏日)按照布达佩斯条约,在日本茨城县つくば市东一丁目1番3号(邮编305)的通产省工业技术院生命工学工业技术研究所,以保藏号FERM BP-5579进行了保藏。
质粒pFU1001中所插入的DNA片段的碱基序列,可以用常规方法,例如双脱氧法来测定。并且,通过分析所获得的碱基序列,就可以推导出该碱基序列中编码蛋白质的区域-开放阅读框(ORF)。
质粒pFU1001中所插入的约10千碱基对的XbaI-XbaIDNA片段中8450碱基对的序列在序列表的序列号5中表示。在该碱基序列中存在6个连续的ORF,自5’端依次被命名为ORF1、ORF2、ORF3、ORF4、ORF5、ORF6。图2显示了上述XbaI-XbaI片段的限制酶切图谱,以及在该片段上存在的ORF的位置(自图中左侧,ORF1-ORF6)。
上述6个ORF中没有与已知DNA聚合酶显示同源的序列。但是在ORF1和ORF2中存在与啤酒酵母(Saccharomyces cerevisiae)中发现的CDC6蛋白或粟酒裂殖酵母(Schizosaccharomyces pombe)中发现的CDC18蛋白质同源的序列。CDC6、CDC18据推测是酵母菌在向细胞周期的DNA合成期(S期)转变过程中必要的蛋白质,这两种蛋白质调节DNA复制的起始。而ORF6含有与已知在酵母DNA损伤修复及体细胞分裂期和减数分裂期的重组过程中起作用的RAD51蛋白质及其在减数分裂期中的特异性同源物Dmcl蛋白质同源的序列。已知编码RAD51蛋白质的基因在细胞周期由G1向S期转变时也被诱导表达。对于其他ORF,即ORF3、ORF4、ORF5,没有发现与已知蛋白质有同源性的序列。
可以通过将缺失各区域的DNA片段插入来制备重组质粒,测定用这种质粒转化获得的转化子的耐热聚合酶活性,来调查耐热性DNA聚合酶的活性来自上述哪个ORF。用插入了由上述约10千碱基对的XbaI-XbaI DNA片段中缺失了ORF1、ORF2或ORF5、ORF6的重组质粒转化的转化子,保持了耐热性DNA聚合酶活性,而缺失了ORF3或ORF4则活性丧失。由此可以预测ORF3或ORF4编码DNA聚合酶活性。
ORF3、ORF4究竟哪一个编码DNA聚合酶活性,可以通过将各ORF分别插入来制备重组质粒。然后调查所获得的转化子中的耐热性DNA聚合酶活性的表达来进行调查。令人意外的是,单独含有ORF3或ORF4的转化子获得的粗抽提物中仅检测到极弱的DNA聚合酶活性。而在将两种抽提物混合时,可以得到与含有ORF3、ORF4两者的转化子同样的耐热性DNA聚合酶活性,因此这显示,本发明的新型DNA聚合酶必须有这两种ORF的翻译产物起作用。是这两种蛋白质形成复合体后显示DNA聚合酶活性,还是其中一方修饰另一方转变成有活性的酶,可以通过测定DNA聚合酶的分子量来了解。用凝胶过滤法测定该DNA聚合酶分子量的结果表明,上述两种蛋白质形成复合体。
序列表的序列编号2中显示ORF3的碱基序列,序列编号1中显示由该碱基序列推导的ORF3的翻译产物,即第1种DNA聚合酶组成蛋白的氨基酸序列。而序列表的序列编号4中显示ORF4的碱基序列,序列编号3中显示由该碱基序列推导的ORF4的翻译产物,即第2种DNA聚合酶组成蛋白的氨基酸序列。
本发明的DNA聚合酶可以在常规的培养条件下,例如含有100μg/ml氨苄青霉素的LB培养基(蛋白胨10g/升、酵母抽提物5g/升、NaCl 5g/升、pH7.2)中,培养用整合了ORF3及ORF4的重组质粒转化的转化子,如大肠杆菌JM109/pFU1001,来在菌体进行表达。该聚合酶可以从上述培养的菌体中,采用诸如超声波处理、热处理、以及用阴离子交换柱(RESOURCE Q柱,Pharmacia)、HeparinSepharose柱(HiTrap Heparin,Pharmacia公司生产)、凝胶过滤柱(Superose 6HR,Pharmacia公司生产)等进行色谱,纯化至在SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE)上基本上显示两种DNA聚合酶组成蛋白的两条带。而且,也可将单独含有ORF3、ORF4的转化子分别培养后,获得培养菌体,混合其抽提物、或纯化的DNA聚合酶组成蛋白来获得目的DNA聚合酶。在混合两种DNA聚合酶组成蛋白时,不需要特别的操作。可以将相应的两种转化子的抽提物或由其纯化而来的两种蛋白质简单地以适当量混合来获得有活性的DNA聚合酶。
由此获得的本发明的DNA聚合酶在SDS-PAGE上显示与约90,000道尔顿、约140,000道尔顿相当的两条带,分别与第1及第2种DNA聚合酶组成蛋白相对应。
如图3所示,本发明的DNA聚合酶在磷酸钾缓冲液中、750℃时,显示最适pH在pH6.5-7.0附近。而且在不同的温度测定该酶的酶活时,该酶在75-85℃显示最高活性,但由于在高温时,用作活性测定底物的活化DNA的双链结构会被破坏,该酶活性的准确最适温度没有测定。该DNA聚合酶有高热稳定性,图4显示在经过80℃、30分钟的热处理后,仍保持80%以上的残存活性。这种热稳定性使该酶能用于PCR方法。而且,在调查已知的α型聚合酶的特异性抑制剂蚜栖菌素(aphidicolin)的影响时,该DNA聚合酶的活性在2mM蚜栖菌素存在下仍不被抑制。
分析纯化的DNA聚合酶的生物化学活性特性的结果为,本发明的DNA聚合酶在试管内有非常优秀的引物延伸活性,如表1所示,在用引物与单链DNA退火形成的底物(M13-HT引物)测定DNA聚合酶的活性时,能获得比通常活性测定所用的活化DNA(DNAaseI处理的小牛胸腺DNA)高的核苷酸掺入活性。与使用上述M13-HT引物底物的其他DNA聚合酶的引物延伸能力进行比较,本发明的DNA聚合酶能显示与已知的来自激烈热球菌的DNA聚合酶(Pfu DNA聚合酶,Stratagene生产)和来自水生栖热菌(Thermus aquaticus)的TaqDNA聚合酶(TaKaRa Taq,宝酒造社生产)相比更优的延伸活性。更进一步,在反应体系中加入活化DNA作为竞争底物时,上述2种DNA聚合酶的引物延伸活性被强烈抑制,而本发明的DNA聚合酶只被轻微抑制,这表明该酶对引物延伸型底物具有高亲和性(图6)。
表1

<p>而且,本发明的DNA聚合酶在用于PCR方法时,能显示极优的性能。PCR方法中频繁使用的、来自水生栖热菌的DNA聚合酶在单独使用时,扩增10千碱基对以上的DNA片段非常困难,在与其他DNA聚合酶组合使用时,也难以扩增20千碱基对以上的DNA片段《美国国家科学院院报》(Proceeding of the National Academy of Sciencesof the USA,第91卷,第2216-2220页(1994))。而且,据报道,使用Pfu DNA聚合酶所能扩增的DNA链长最大为3千碱基对左右。在使用本发明的DNA聚合酶时,在不添加其他酶的情况下,能够单独扩增20千碱基对的DNA片段。
而且,本发明的DNA聚合酶还伴随有3’→5’外切核酸酶活性,相对于DNA聚合酶活性,外切核酸酶活性很强,已知这种活性强因而DNA合成的准确性非常高,在这点上,本发明的DNA聚合酶能与PfuDNA聚合酶的活性相媲美(图5)。而且,经测定本发明的DNA聚合酶在DNA合成反应中引起的误差频率比Taq DNA聚合酶低。上述各种性质显示,本发明的DNA聚合酶作为PCR方法等遗传工程用试剂非常优秀。
而且,本发明的新型DNA聚合酶基因的发现还提供了更有趣的知识。发明人为了了解含有编码新型DNA聚合酶的ORF3、4的基因的区域在细胞内是怎样转录的,用Northern印迹法、RT PCR法以及引物延伸法对由激烈热球菌中制备的RNA部份进行了分析,结果证明,ORF1-ORF6以一条信使RNA(mRNA)从紧接ORF1的上游开始转录。由此可以设想ORF1和ORF2在细胞内的产生与ORF3、4受到同样的控制,同时考虑到ORF1、2、5、6与同酵母的DNA复制起始调节有关的CDC6、CDC18有序列上的同源性,本发明的新型DNA聚合酶很可能是DNA复制过程中重要的DNA聚合酶。而且激烈热球菌属于古细菌,据推测古细菌的DNA复制系统与真核生物非常接近,由此可以预测在真核生物中存在还没有被发现的、与本发明的DNA聚合酶类似的重要的DNA聚合酶。
而且,还可以预期与本发明的DNA聚合酶类似的耐热性DNA聚合酶,可在与激烈热球菌同属于极端嗜热性古细菌的细菌中,例如除激烈热球菌以外属于热球菌属的细菌、热网菌属(Pyrodictium)、热球菌属(Thermococcus)、葡萄嗜热菌属(staphylothermus)等属的细菌内产生。当这些酶与本发明的DNA聚合酶一样由2种DNA聚合酶组成蛋白组成时,可以期待这些酶的一个DNA聚合酶组成蛋白与相当于另一个DNA聚合酶组成蛋白的本发明的DNA聚合酶组成蛋白组合,能够表现同样的DNA聚合酶活性。
可以期待上述极端嗜热性古细菌生产的、与本发明的DNA聚合酶相似的耐热性DNA聚合酶在有关氨基酸序列、及编码其的基因的碱基序列上,与本发明的DNA聚合酶的氨基酸序列、及编码其的基因的碱基序列之间存在同源性。因此,以本发明中分离的基因或其碱基序列的一部分做探针,用杂交的方法从上述嗜热性古细菌中获得DNA片段,将其导入适当的微生物,用前面记载的粘粒文库同样的方法制备热处理裂解液,用适当的方式检测其DNA聚合酶活性,就能够获得与本发明的DNA聚合酶的碱基序列不同,但具有同样酶活性,且与本发明的酶类似的耐热性DNA聚合酶的基因。
上述杂交可以按下列条件进行。即,固定了DNA的膜与探针在含有0.5%SDS、0.1%小牛血清白蛋白(BSA)、0.01%聚乙烯吡咯烷酮、0.1%Ficol 400、0.01%变性鲑精DNA的6×SSC(1×SSC表示0.15 MNaCl、0.015 M柠檬酸钠、pH7.0)中,50℃温育12-20小时。温育终止后,于含有0.05%SDS的2×SSC中、在37℃开始洗涤,将SSC的浓度变化至0.1×、温度变化至50℃,洗净至来源于固定DNA的信号与背景可以区别。
这样,以本发明中分离的基因或其碱基序列的一部分作引物,以由上述嗜热性古细菌中获得的DNA为模板进行基因扩增,将得到的片段或以该片段为探针进行杂交而从上述嗜热性古细菌中获得的片段导入适当的微生物,按与前面一样的方法检测DNA聚合酶活性,就能够获得与本发明的DNA聚合酶的活性不一样、但具有同一水平的、与本发明的酶类似的耐热性DNA聚合酶基因。
下面说明本发明的实施例,但本发明并不限于下面的实施例。而且,实施例中的%的意思是重量%。
实施例1(1)激烈热球菌基因组DNA的制备激烈热球菌DSM3638的培养按下面的方法进行
将组成为蛋白胨1%、酵母抽提物0.5%、可溶性淀粉1%、JarmarinS Solid(Jamarin实验室生产)3.5%、Jarmarin S Liquid(Jamarin实验室生产)0.5%、MgSO40.003%、NaCl 0.001%、FeSO4·7H2O 0.0001%、CoSO40.0001%、CaCl2·7H2O 0.0001%、ZnSO40.0001%、CuSO4·5H2O0.1ppm、KAl(SO4)20.1ppm、H3BO30.1ppm、NaMoO4·2H2O 0.1ppm、NiCl2·6H2O 0.25ppm的培养基装入2升的培养瓶中,120℃、20分钟灭菌,充入氮气以去除溶解氧后,接种上述细菌,在95℃静置培养16小时,培养后,离心收集菌体。
然后,在4ml含25%蔗糖的0.05 M Tris-HCl(pH8.0)中悬浮收集的菌体,在悬浮液中加入0.8ml的溶菌酶[5mg/ml、0.25MTris-HCl(pH8.0)]和2ml的0.2M EDTA,在20℃保温1小时。然后加入24ml的SET溶液[150mM NaCl、1mM EDTA、20mMTris-HCl(pH8.0)],再加入5%的SDS 4ml和蛋白酶K(10mg/ml)400μl,37℃反应1小时。反应终止后,用酚氯仿抽提,接着用乙醇沉淀,制备了约3.2mg的基因组DNA。(2)粘粒蛋白文库的制备激烈热球菌DSM3638的基因组DNA 400μg用Sau 3Al部分消化,用密度梯度离心分离成35-50 kb大小的片段。接着,1μg的三股螺旋粘粒载体(Stratagene公司生产)用XbaI消化,然后用碱性磷酸酶(宝酒造社生产)去磷酸化,并用BamHI消化,与上面分级的30-50 kb的DNA 140μg混合,进行连接,使用GIGAPACK GOLD(Stratagene公司生产)按体外包装法将激烈热球菌的基因组DNA片段包装入λ噬菌体颗粒中,制备文库。接着,将所得到的文库的一部分转入大肠杆菌DH5αMCR中。选择几个获得的转化子制备粘粒DNA,在证明有适当大小的插入片段后,另从上述文库中选择500个转化子,分别接种在150ml含有100μg/ml氨苄青霉素的LB培养基(蛋白胨10g/升、酵母抽提物5g/升、NaCl 5g/升、pH7.2)中培养。将该培养物离心,收集的菌体悬浮于1ml的20mM Tris-HClpH8.0中,在100℃热处理10分钟。接着进行超声波处理,然后再次在100℃热处理10分钟。离心后的上清即获得的裂解物作为粘粒的蛋白文库。(3)DNA聚合酶活性的测定DNA聚合酶活性测定用DNAaseI处理而活化的小牛胸腺DNA(Worthington生产)(活化DNA)作底物。DNA的活化和DNA聚合酶活性的测定按Harpar and Row公司出版、D.R.Davis编辑的《大肠杆菌的DNA聚合酶》(DNA polymerase from Escherichia coli)第263-276页(C.C.Richardson著)中记载的方法进行。
酶活性的测定按下面的方法进行。即,制备50μl含有待测定活性样品的反应液[20 mM Tris-盐酸(pH7.7)、15 mN MgCl2、2 mM 2-巯基乙醇、0.2mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP、60 nM[3H]dTTP(Amersham公司生产)],在75℃反应15分钟。将此反应液40μl点于DE滤纸(Whatman公司生产),用5%Na2HPO4洗涤5次,然后用液闪计数器测定DE滤纸上残留的放射活性。按上述酶活性测定方法,在30分钟内将10 nmol的[3H]dTMP掺入底物DNA的酶量定义为1个单位。(4)含有DNA聚合酶基因的粘粒文库的选择制备含有20mM Tris-盐酸(pH7.7)、2mM MgCl2、2 mM 2-巯基乙醇、0.2mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP、60 nM[3H]dTTP(Amersham公司生产)的反应液,在45μl此反应液中加入分别来自粘粒文库的5个克隆的抽提物各1μl。即每个反应加入5μl,在75℃反应15分钟后。分别在DE滤纸(Whatman公司生产)点样40μl。用5%Na2HPO4洗涤5次,然后用液闪计数器测定DE滤纸上残留的放射活性。在第一次检测中被确认含有活性的含有5个克隆的一组,接着将5个克隆分成单个克隆进行第二次检测。粘粒文库中含有已知的DNA聚合酶的克隆,这是以该基因为探针进行杂交而推测的,它们分别为克隆No.57、154、162、363。除此之外,还发现5个克隆No.41、153、264、462、491含有DNA合成活性。(5)限制酶切图谱的制备从上述5个克隆中分离粘粒,分别用BamHI消化,检测电泳图谱,发现几条相同的带。预计5个克隆整合有重叠和轻微错动的区域。因而制作克隆No.264和491的插入DNA片段的限制酶切图谱。从两个克隆制备的粘粒用各种限制酶消化的结果是,KpnI、NotI、PstI、SmaI、XbaI、XhoI(均为宝酒造社生产)都能切出适当大小的片段,其相应的酶切位点确定的结果就获得了图1所示的图谱。(6)DNA聚合酶基因的亚克隆在图1所示的限制酶切图谱的基础上,由来自克隆264或491的粘粒切下10千碱基对左右的各种DNA片段,亚克隆到pTV118N或pTV119N载体(宝酒造社生产)。对来自所获重组质粒的转化子检测耐热性DNA聚合酶活性的结果,证明约10千碱基对的XbaI-XbaI片段上有能产生强耐热性DNA聚合酶的基因。重组了该XbaI-XbaI片段的pTV118N载体被命名为pFU1001,用该质粒转化的大肠杆菌JM109被命名为Escherichia coli JM109/pFU1001。实施例2含有新型DNA聚合酶基因的DNA片段的碱基序列的测定从实施例1中获得的质粒pFU1001中再次用XbaI将含有DNA聚合酶基因的上述XbaI-XbaI片段切出,用DNA平末端化试剂盒(宝酒造社生产)平末端化,然后与用SmaI线性化的新载体pTV118N连接,来制备用于制备缺失突变体的质粒,依插入片段方向的不同,质粒被分别命名为pFU1002和pFU1003。使用这两种质粒,由插入DNA片段的两端开始,顺次制备缺失突变体。制备应用Henikoff的方法(《基因》(Gene)第28卷、第351-359页),并使用kilo-sequence用缺失试剂盒(宝酒造社生产)。3’突出型和5’突出型限制酶分别采用PstI和XbaI。以得到的各种缺失突变体为模板,用BcaBE-ST双脱氧测序试剂盒(宝酒造社生产)按双脱氧法确定插入DNA片段的碱基序列。
序列表的序列号5显示了所获得的碱基序列的8450碱基对的序列。对该碱基序列进行分析的结果发现了6个编码蛋白质的开放阅读框(ORF),分别存在于序列表的序列号5中所示的碱基序列的碱基号123-614、(ORF1)、611-1381(ORF2)、1384-3222(ORF3)、3225-7013(ORF4)、7068-7697(ORF5)、7711-8385(ORF6)的位置。图2中显示了重组在质粒pFU1001中的约10千碱基对的XbaI-XbaI DNA片段的限制酶切图谱和该片段上上述ORF的位置。
此外,用上述各种缺失突变体检测了DNA聚合酶活性,结果显示不管是从上游缺失还是从下游缺失,当ORF3和ORF4区域缺失时,DNA聚合酶的活性都丧失。这显示ORF3和ORF4的翻译产物对DNA聚合酶活性的表达都非常重要。ORF3的碱基序列在序列表的序列号2中显示,由该碱基序列推导的ORF3的翻译产物的氨基酸序列在序列号1中显示。ORF4的碱基序列在序列表的序列号4中显示,由该碱基序列推导的ORF4的翻译产物的氨基酸序列在序列号3中显示。
实施例3纯化DNA聚合酶标准品的制备将实施例1中获得的Escherichia coli JM109/pFU1001在含有浓度为100μg/ml的氨苄青霉素的500ml LB培养基(蛋白胨10 g/升、酵母抽提物5g/升、NaCl 5g/升、pH7.2)中培养。当培养物的浊度达到0.6 A600时,加入诱导物异丙基-β-D-硫代半乳糖苷(IPTG),培养16小时,收集菌体,然后用37ml的超声缓冲液(50mMTris-HCl、pH8.0、2 mM 2-巯基乙醇、10%甘油、2.4 mM PMSF(苯甲基磺酰氟)悬浮菌体,用于超声波破碎仪。12000rpm、10分钟离心,回收42ml作为粗抽提物的上清,然后在80℃热处理15分钟。然后再以12000rpm、10分钟离心,获得33ml的热处理酶液。接着将此溶液以800ml缓冲液A(50mM磷酸钾、pH6.5、2mM 2-巯基乙醇、10%甘油)作外液透析2小时×4。透析后的酶液32ml上用缓冲液A平衡的RESOURSE Q柱(Pharmacia公司生产),使用FPLC系统(Pharmacia公司生产)进行色谱。展开用0→500 mM线性浓度梯度的NaCl进行。DNA聚合酶活性在340mM NaCl时洗脱。
收集含活性的级分所得到的10ml酶液用超滤进行脱盐、浓缩,溶于缓冲液A+150 mM NaCl,得到3.5ml酶液,然后将其上用同样的缓冲液平衡的HiTrap Heparin柱(Pharmacia公司生产),用FPLC系统以150→650mM线性浓度梯度的NaCl进行展开。在400mM NaCl的洗脱级分中获得活性成分。将此级分5ml用超滤反复脱盐、浓缩,使之最后浓缩为120μl含50mM磷酸钾、pH6.5、2mM 2-巯基乙醇、75 mM NaCl的溶液。将此溶液上用同一缓冲液平衡的Superose 6凝胶过滤柱(Pharmacia公司生产),并用同一缓冲液进行洗脱,结果,DNA聚合酶活性在保留时间为34.7分钟和38.3分钟的位置洗脱出来。与同一条件下分子量标准的洗脱位置进行比较的结果,预计此活性具有的分子量分别为约385千道尔顿和约220千道尔顿,这些分子量相当于0RF3的翻译产物与ORF4的翻译产物以1∶2的摩尔比形成的复合体以及以1∶1的摩尔比形成的复合体。由于在高分子量时,分子量测定的误差较大,不能否定前者是2种翻译产物以2∶2的摩尔比形成复合体的可能性。
实施例4(1)DNA聚合酶的生物化学特性对于实施例3中获得的0RF3和ORF4的翻译产物,即第1种DNA聚合酶组成蛋白和第2种DNA聚合酶组成蛋白以1∶1形成的复合体的DNA聚合酶标准品,首先寻找其最适MgCl2和KCl浓度。在反应体系为20 mM Tris-盐酸、pH7.7、2 mM 2-巯基乙醇、0.2mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP,并存在2 mM MgCl2时,KCl的浓度在0-200 mM的范围内以20mM进行增加,测定DNA聚合酶活性。结果为在KCl为60mM时显示最大活性。然后用上述反应体系,并在60mM KCl的条件下,这次MgCl2在0.5-25 mM范围内每次增加2.5mM进行比较,结果在10mM时显示最大活性,在不含KCl的情况下进行比较时,在17.5mM时显示最大活性。
然后调查最适pH。使用各种pH的磷酸钾缓冲液,制备含有20mM磷酸钾、15mM MgCl2、2mM 2-巯基乙醇、0.2mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP、60 nM[3H]dTTP的反应液,用来在75℃时测定DNA聚合酶活性。其结果在图3中显示。图中横轴表示pH,纵轴表示掺入高分子DNA的放射活性。图中显示本发明的DNA聚合酶在pH6.5-7.0时显示最大活性,在用Tris-盐酸取代磷酸钾的情况下,在碱性一侧活性较高,在测定所用最高的pH8.02时,显示最大活性。
本发明的DNA聚合酶的热稳定性按以下的方法进行调查,制备含有纯化DNA聚合酶的20 mM Tris-盐酸(pH7.7)、2 mM 2-巯基乙醇、10%甘油、0.1%小牛血清白蛋白的溶液,在各种温度下保温30分钟,检测残存的DNA聚合酶活性。结果示于图4。图中横轴表示保温温度,纵轴表示残存的活性。图中显示,本发明的酶在80℃、30分钟的热处理后,仍能保持80%以上的残存活性。
为比较抑制剂的抑制模式,使用α型DNA聚合酶的特异性抑制剂蚜栖菌素,将本发明的DNA聚合酶与已知的来自激烈热球菌的α型DNA聚合酶(Pfu DNA聚合酶,Stratagene公司生产)的抑制方式进行比较。在20 mM Tris-盐酸(pH7.7)、15 mM MgCl2、2 mM 2-巯基乙醇、0.2 mg/ml活化DNA、40μM dATP、dCTP、dGTP、dTTP存在下,蚜栖菌素从0到2.0 mM增加,检测活性的变化,Pfu DNA聚合酶在1.0mM时活性减少至20%,而与之相对,本发明的新型DNA聚合酶在2.0mM时,也完全未被抑制。(2)引物延伸反应接着,为比较本发明的DNA聚合酶对底物DNA形式的选择性,检测了下面的模板-引物。除常规的活性检测中使用的活化DNA外,制备的底物还包括85℃热处理5分钟的活化DNA(热变性DNA)、M13噬菌体单链DNA(M13mp18ss DNA,宝酒造社生产)以序列表的序列号6所示序列的45个碱基的合成脱氧核糖寡核苷酸为引物退火的产物(M13-HT引物)、相同的M13噬菌体单链DNA以序列表的序列号7中所示序列的17个碱基的合成脱氧核糖寡核苷酸为引物退火的产物(M13-RNA引物)、聚脱氧腺苷酸(poly dA,Pharmacia公司生产)与寡聚胸苷酸(Oligo dT、Pharmacia公司生产)以20∶1的摩尔比混合(polydA-Oligo dT)的产物、聚腺苷酸(poly A,Pharmacia公司生产)与寡聚脱氧胸苷酸以20∶1的摩尔比混合的产物(polyA-Oligo dT)。
用这些底物代替活化DNA测定DNA聚合酶活性,以底物用活化DNA时所获得的活性为100,表1中显示用各底物时的相对活性。为了比较,对Pfu DNA聚合酶、来自水生栖热菌的Taq DNA聚合酶(TaKaRa Taq,宝酒造社生产)也进行了同样的检测。如表1所示,本发明的新型DNA聚合酶与其他DNA聚合酶相比,在用M13-HT引物而不是以活化DNA为底物时,所得到的活性高,因而对引物延伸反应有特别高的适用性。
接着对引物延伸活性进行更详细的检测。使用M13-HT引物作底物,引物的5’端用[γ-32P]ATP(Amersham公司生产)和T4多聚核苷酸激酶(宝酒造社生产)标记。制备10μl含终浓度为0.05μg/μl的上述底物和在以活化DNA为底物的活性测定中的酶量为0.05单位的各种聚合酶的反应液(20 mM Tris-盐酸(pH7.7)、15 mM MgCl2、2 mM 2-巯基乙醇、270μM dATP、d CTP、dGTP、dTTP),在75℃反应1、2、3、4分钟,反应结束后,加入2μl的反应终止液(95%甲醛、20 mM EDTA、0.05%溴酚兰、0.05%二甲苯青),在95℃热变性处理3分钟,然后取2μl反应液用含8M尿素的聚丙烯酰胺进行凝胶电泳,然后制备放射性自显影。并且,为调查在作为竞争底物的活化DNA存在下的引物延伸活性,在上述反应液中加入活化DNA至终浓度为0.4μg/μl,按上面同样的方法制备放射性自显影,所得到的放射性自显影在图6中显示。
在图中,Pol、Pfu、Taq分别表示本发明的DNA聚合酶、Pfu DNA聚合酶、Taq DNA聚合酶所获得的结果,1、2、3、4分别表示反应时间(分钟)。而且,图中的-、+分别代表在活化DNA不存在和存在下所获得的结果。而图左端用G、A、T、C表示的条带是用与上面相同的底物用双脱氧法终止反应所得到的反应物的电泳结果,用来推定延伸反应的长度。图中显示本发明的DNA聚合酶与Pfu DNA聚合酶、TaqDNA聚合酶相比显示更优的引物延伸活性。而且还显示,在活化DNA不存在时显示比较高的引物延伸活性的Taq DNA聚合酶在加入大量过剩的活化DNA时明显被抑制,而与之相对,本发明的DNA聚合酶不被活化DNA抑制。这证明,本发明的DNA聚合酶特别对引物与单链模板退火形成的引物延伸型底物具有高亲和性。(3)伴随外切核酸酶活性的有无本发明的DNA聚合酶伴随的外切核酸酶活性用下述方法进行调查。5’→3’外切核酸酶活性检测所用的底物是pUC119载体(宝酒造社生产)用SspI(宝酒造社生产)消化,用琼脂糖凝胶电泳分离所获得的386碱基对的DNA片段,纯化,用[γ-32P]ATP和多聚核苷酸激酶制备5’末端32P标记的DNA片段。3’→5’外切核酸酶活性检测所用的底物是pUC119载体(宝酒造社生产)用Sau3AI消化,所获得的341碱基对的DNA片段用琼脂糖凝胶电泳分离、纯化,用[γ-32P]CTP(Amersham公司生产)和Klenow片段(宝酒造社生产)进行补平反应制备3’末端32P标记的DNA片段。标记DNA用NICK柱(Pharmacia公司生产)凝胶过滤进行纯化,并用于以下反应。在含有这种标记DNA 1 ng的反应液(20 mM Tris-盐酸(pH7.7)、15 mM MgCl2、2mM2-巯基乙醇)中,加入0.015单位的DNA聚合酶,在75℃反应2.5、5、7.5分钟后,加入乙醇沉淀DNA。上清中存在的放射性活性用液体闪烁计数器进行测定,求出外切核酸酶活性的分解量。在本发明的DNA聚合酶中没有发现5’→3’外切核酸酶活性,而显示带有很强的3’→5’外切核酸酶活性。已知3’→5’外切核酸酶活性很强的Pfu DNA聚合酶也用同样的方法测定3’→5’外切核酸酶活性,其结果一起在图5中显示。
图中横轴表示反应时间,纵轴表示上清中游离的放射性活性在全部反应液的放射性活性中的比例。而图中空心圈表示本发明的DNA聚合酶所测得的结果,实心圈表示Pfu DNA聚合酶所测得的结果。图中显示本发明的DNA聚合酶具有与Pfu DNA聚合酶相同程度的3’→5’外切核酸酶活性,已知由于具有很强的3’→5’外切核酸酶活性的PfuDNA聚合酶的DNA合成的忠实性很高。(4)DNA合成反应的正确性的比较DNA聚合酶在DNA合成反应中的正确性,以部分单链化的pUC118载体(宝酒造社生产)(开环型双螺旋质粒)为模板来检测。单链pUC118以大肠杆菌MV1184(宝酒造社生产)为宿主,使用辅助噬菌体M13K07(宝酒造社生产),按1989年冷泉港实验室出版、T.Maniatis等编辑、《分子克隆实验室指南第2版》4.44-4.48中记载的方法,进行制备。而双链DNA用PvuII(宝酒造社生产)消化pUC118载体后,进行琼脂糖凝胶电泳,回收约2.8千碱基对的DNA片段,进行制备。
将上述单链DNA 1μg和双链DNA 2μg混合在180μl的灭菌蒸馏水中,在70℃保温10分钟,然后加入20μl的20×SSC,在60℃静置10分钟。进行乙醇沉淀以回收DNA,取一部分进行琼脂糖凝胶电泳,证明获得了开环型双链质粒。制备含1/10量的所获开环型双链DNA质粒的反应液(10mM Tris-盐酸pH8.5、50mM KCl、10mMMgCl2、1mM dATP、d CTP、dGTP、dTTP)30μl,在70℃保温3分钟后,加入0.5单位的DNA聚合酶,在70℃进行10分钟的DNA合成反应。反应结束后,用10μl的反应液转化大肠杆菌DHSα(BRL公司生产)。在含有100μg/ml氨苄青霉素、0.1mM IPTG、40μg/ml的5-溴-4-氯-3-吲哚-β-D半乳糖苷的LB平板上,于37℃培养18小时。记录平板上出现的白色及青色克隆数。计算DNA合成时由于错误而产生的白色克隆的出现率。结果为,用Taq DNA聚合酶作为DNA聚合酶时的出现率为3.18%,而相应地,用本发明的DNA聚合酶的出现率为较低的数值1.61%。(5)PCR中的应用在本发明的DNA聚合酶在PCR反应中的性能与Taq DNA聚合酶进行比较时,以λ-DNA为模板进行PCR反应。本发明的DNA聚合酶所用的反应液的组成包括10mM Tris-盐酸(pH9.2)、3.5mM MgCl2、75mM KCl、400μM dATP、d CTP、dGTP、dTTP、0.01%牛血清白蛋白、0.1%Triton X-100,Taq DNA聚合酶所用的反应液的组成包括10mM Tris-盐酸(pH8.3)、1.5mM MgCl2、50mM KCl、400μM dATP、d CTP、dGTP、dTTP。制备50μl含有5.0 ng/50μl λ-DNA(宝酒造社生产)、10pmol/50μl引物λ1和引物λ11、3.7单位/50μl DNA聚合酶的反应液。引物λ1和引物λ11的碱基序列分别表示在序列表的序列号8和序列号9中。上述反应液按每循环98℃、10秒~68℃、10分钟进行30个循环的PCR反应,然后取5μl反应液进行琼脂糖凝胶电泳,用溴化乙啶染色来确认扩增的DNA片段。结果证明,在使用Taq DNA聚合酶时没有发现DNA片段的扩增,而用本发明的DNA聚合酶时,有约20千碱基对的DNA片段的扩增。
接着,将引物变为引物λ1和引物λ10进行实验。引物λ10的碱基序列在序列表的序列号10中表示。按上面同样的反应液组成,制备25μl含有2.5 ng的λ-DNA、10 pmol的引物λ1和引物λ10、3.7单位的DNA聚合酶的反应液。按上面同样的反应条件进行5个循环的反应,取5μl反应液进行琼脂糖凝胶电泳,用溴化乙啶进行染色。结果证明,在使用Taq DNA聚合酶时没有发现特异性扩增,而用发明的DNA聚合酶扩增了约15千碱基对的DNA片段。
实施例5(1)用于单独ORF3翻译产物表达的质粒的构建以通过将实施例2中记载的质粒pFU1002(在该载体上ORF1-6位于载体上的lac启动子的下游)中插入DNA片段中ORF3的紧邻下游部分缺失而制备的突变体质粒6-82为模板,用引物M4(宝酒造社生产)及碱基序列示于序列表的序列号11的引物NO3进行PCR反应。并在PCR反应中使用DNA聚合酶的合成反应正确性较高的Pfu DNA聚合酶(Stratagene公司生产)。制备100μl含有1ng模板DNA、各25 pmol的两种引物和2.5单位的Pfu DNA聚合酶的PCR反应液[20 mM Tris-盐酸、pH8.2、10mM KCl、20mM MgCl2、6mM(NH4)2SO4、0.2mM dATP、dCTP、dGTP、dTTP、1%Triton X-100、0.01%小牛血清白蛋白],以每循环94℃、0.5分钟~55°、0.5分钟~72℃、2分钟进行25个循环的PCR反应。所扩增的约2千碱基对的DNA片段用NcoI、SphI(均为宝酒造社生产)消化,然后整合到pTV118N载体(宝酒造社生产)的NcoI-SphI位点间,制备质粒pFU-ORF3。该质粒的插入DNA片段中含有可翻译的单独的ORF3。(2)用于单独ORF4翻译产物表达的质粒的构建以通过将上述质粒pFU1002中的插入DNA片段中ORF4中央部分的下游部分缺失而制备的突变体质粒6-2为模板,用引物M4及碱基序列示于序列表的序列号12的引物NO4进行PCR反应。除模板DNA变为质粒6-2、引物NO3变为NO4外,按上述实施例5(1)相同的条件进行反应。所扩增的DNA片段用NcoI、NheI(宝酒造社生产)消化,获得约1.6千碱基对的DNA片段,将此片段与由上述质粒pFU1002中分离的约3.3千碱基对的NheI-Sal片段(含有ORF4的后半部分)一起重组到pET15b载体(Novagen公司生产)的NcoI-XhoI位点间,制备质粒pFU-ORF4。该质粒的插入DNA片段中含有可翻译的单独的ORF4。(3)由ORF3、ORF4的翻译产物重新组成DNA聚合酶分别培养用上述质粒pFU-ORF3转化大肠杆菌JM109所得到的Escherichia coli JM109/pFU-ORF3及用上述质粒pFU-ORF4转化大肠杆菌HMS174所得到的Escherichia coli HMS174/pFU-ORF4,纯化菌体中表达的两种ORF的翻译产物。转化子的培养及粗抽提物的制备按实施例3中记载的方法进行。而两种翻译产物的纯化用RESOURCEQ、Hitrap Heparin、Superose 6等柱进行,并用SDS-PAGE上翻译产物的表现进行确定。已经确认,虽然这样纯化的两种ORF翻译产物单独都不显示DNA聚合酶活性,但将2者混合时,能表现出耐热性DNA聚合酶活性。
工业上的利用可能性本发明提供具有高的引物延伸活性和3’→5’外切核酸酶活性的新型DNA聚合酶。该酶适用于PCR方法,在遗传工程研究中非常有用。而且该酶可通过遗传工程的方法用编码本发明的DNA聚合酶的基因进行生产。序列表序列号1序列长度613序列类型氨基酸链型单链拓扑构型直链型序列种类多肽序列Met Asp Glu Phe Val Lys Ser Leu Leu Lys Ala Asn Tyr Leu Ile5 10 15Thr Pro Ser Ala Tyr Tyr Leu Leu Arg Glu Tyr Tyr Glu Lys Gly20 25 30Glu Phe Ser Ile Val Glu Leu Val Lys Phe Ala Arg Ser Arg Glu35 40 45Ser Tyr Ile Ile Thr Asp Ala Leu Ala Thr Glu Phe Leu Lys Val50 55 60Lys Gly Leu Glu Pro Ile Leu Pro Val Glu Thr Lys Gly Gly Phe65 70 75Val Ser Thr Gly Glu Ser Gln Lys Glu Gln Ser Tyr Glu Glu Ser80 85 90Phe Gly Thr Lys Glu Glu Ile Ser Gln Glu Ile Lys Glu Gly Glu95 100 105Ser Phe Ile Ser Thr Gly Ser Glu Pro Leu Glu Glu Glu Leu Asn110 115 120Ser Ile Gly Ile Glu Glu Ile Gly Ala Asn Glu Glu Leu Val Ser125 130 135Asn Gly Asn Asp Asn Gly Gly Glu Ala Ile Val Phe Asp Lys Tyr140 145 150Gly Tyr Pro Met Val Tyr Ala Pro Glu Glu Ile Glu Val Glu Glu155 160 165Lys Glu Tyr Ser Lys Tyr Glu Asp Leu Thr Ile Pro Met Asn Pro170 175 180Asp Phe Asn Tyr Val Glu Ile Lys Glu Asp Tyr Asp Val Val Phe185 190 195Asp Val Arg Asn Val Lys Leu Lys Pro Pro Lys Val Lys Asn Gly200 205 210Asn Gly Lys Glu Gly Glu Ile Ile Val Glu Ala Tyr Ala Ser Leu215 220 225Phe Arg Ser Arg Leu Lys Lys Leu Arg Lys Ile Leu Arg Glu Asn230 235 240Pro Glu Leu Asp Asn Val Val Asp Ile Gly Lys Leu Lys Tyr Val245 250 255Lys Glu Asp Glu Thr Val Thr Ile Ile Gly Leu Val Asn Ser Lys260 265 270Arg Glu Val Asn Lys Gly Leu Ile Phe Glu Ile Glu Asp Leu Thr275 280 285Gly Lys Val Lys Val Phe Leu Pro Lys Asp Ser Glu Asp Tyr Arg290 295 300Glu Ala Phe Lys Val Leu Pro Asp Ala Val Val Ala Phe Lys Gly305 310 315Val Tyr Ser Lys Arg Gly Ile Leu Tyr Ala Asn Lys Phe Tyr Leu320 325 330Pro Asp Val Pro Leu Tyr Arg Arg Gln Lys Pro Pro Leu Glu Glu335 340 345Lys Val Tyr Ala Ile Leu Ile Ser Asp Ile His Val Gly Ser Lys350 355 360Glu Phe Cys Glu Asn Ala Phe Ile Lys Phe Leu Glu Trp Leu Asn365 370 375Gly Asn Val Glu Thr Lys Glu Glu Glu Glu Ile Val Ser Arg Val380 385 390Lys Tyr Leu Ile Ile Ala Gly Asp Val Val Asp Gly Val Gly Val395 400 405Tyr Pro Gly Gln Tyr Ala Asp Leu Thr Ile Pro Asp Ile Phe Asp410 415 420Gln Tyr Glu Ala Leu Ala Asn Leu Leu Ser His Val Pro Lys His425 430 435Ile Thr Met Phe Ile Ala Pro Gly Asn His Asp Ala Ala Arg Gln440 445 450Ala Ile Pro Gln Pro Glu Phe Tyr Lys Glu Tyr Ala Lys Pro Ile455 460 465Tyr Lys Leu Lys Asn Ala Val Ile Ile Ser Asn Pro Ala Val Ile470 475 480Arg Leu His Gly Arg Asp Phe Leu Ile Ala His Gly Arg Gly Ile485 490 495Glu Asp Val Val Gly Ser Val Pro Gly Leu Thr His His Lys Pro500 505 510Gly Leu Pro Met Val Glu Leu Leu Lys Met Arg His Val Ala Pro515 520 525Met Phe Gly Gly Lys Val Pro Ile Ala Pro Asp Pro Glu Asp Leu530 535 540Leu Val Ile Glu Glu Val Pro Asp Val Val His Met Gly His Val545 550 555His Val Tyr Asp Ala Val Val Tyr Arg Gly Val Gln Leu Val Asn560 565 570Ser Ala Thr Trp Gln Ala Gln Thr Glu Phe Gln Lys Met Val Asn575 580 585Ile Val Pro Thr Pro Ala Lys Val Pra Val Val Asp Ile Asp Thr590 595 600Ala Lys Val Val Lys Val Leu Asp Phe Ser Gly Trp Cys605 610序列号2序列长度1839序列类型核酸链型双链拓扑构型直链型序列种类基因组DNA序列ATGGATGAAT TTGTAAAATC ACTTCTAAAA GCTAACTATC TAATAACTCC CTCTGCCTAC 60TATCTCTTGA GAGAATACTA TGAAAAAGGT GAATTCTCAA TTGTGGAGCT GGTAAAATTT 120GCAAGATCAA GAGAGAGCTA CATAATTACT GATGCTTTAG CAACAGAATT CCTTAAAGTT 180AAAGGCCTTG AACCAATTCT TCCAGTGGAA ACAAAGGGGG GTTTTGTTTC CACTGGAGAG 240TCCCAAAAAG AGCAGTCTTA TGAAGAGTCT TTTGGGACTA AAGAAGAAAT TTCCCAGGAG 300ATTAAAGAAG GAGAGAGTTT TATTTCCACT GGAAGTGAAC CACTTGAAGA GGAGCTCAAT 360AGCATTGGAA TTGAGGAAAT TGGGGCAAAT GAAGAGTTAG TTTCTAATGG AAATGACAAT 420GGTGGAGAGG CAATTGTCTT TGACAAATAT GGCTATCCAA TGGTATATGC TCCAGAAGAA 480ATAGAGGTTG ACGAGAAGGA GTACTCGAAG TATGAAGATC TGACAATACC CATGAACCCC 540GACTTCAATT ATGTGGAAAT AAAGGAAGAT TATGATGTTG TCTTCGATGT TAGGAATGTA 600AAGCTGAAGC CTCCTAAGGT AAAGAACGGT AATGGGAAGG AAGGTGAAAT AATTGTTGAA 660GCTTATGCTT CTCTCTTCAG GAGTAGGTTG AAGAAGTTAA GGAAAATACT AAGGGAAAAT 720CCTGAATTGG ACAATGTTGT TGATATTGGG AAGCTGAAGT ATGTGAAGGA AGATGAAACC 780GTGACAATAA TAGGGCTTGT CAATTCCAAG AGGGAAGTGA ATAAAGGATT GATATTTGAA 840ATAGAAGATC TCACAGGAAA GGTTAAAGTT TTCTTGCCGA AAGATTCGGA AGATTATAGG 900GAGGCATTTA AGGTTCTTCC AGATGCCGTC GTCGCTTTTA AGGGGGTGTA TTCAAAGAGG 960GGAATTTTGT ACGCCAACAA CTTTTACCTT CCAGACGTTC CCCTCTATAG GAGACAAAAG 1020CCTCCACTGG AAGAGAAAGT TTATGCTATT CTCATAAGTG ATATACACGT CGGAAGTAAA 1080GAGTTCTGCG AAAATGCCTT CATAAAGTTC TTAGAGTGGC TCAATGGAAA CGTTGAAACT 1140AAGGAAGAGG AAGAAATCGT GAGTAGGGTT AAGTATCTAA TCATTGCAGG AGATGTTGTT 1200GATGGTGTTG GCGTTTATCC GGGCCAGTAT GCCGACTTGA CGATTCCAGA TATATTCGAC 1260CAGTATGAGG CCCTCGCAAA CCTTCTCTCT CACGTTCCTA AGCACATAAC AATGTTCATT 1320GCCCCAGGAA ACCACGATGC TGCTAGGCAA GCTATTCCCC AACCAGAATT CTACAAAGAG 1380TATGCAAAAC CTATATACAA GCTCAAGAAC GCCGTGATAA TAAGCAATCC TGCTGTAATA 1440AGACTACATG GTAGGGACTT TCTGATAGCT CATGGTAGGG GGATAGAGGA TGTCGTTGGA 1500AGTGTTCCTG GGTTGACCCA TCACAAGCCC GGCCTCCCAA TGGTTGAACT ATTGAAGATG 1560AGGCATGTAG CTCCAATGTT TGGAGGAAAG GTTCCAATAG CTCCTGATCC AGAAGATTTG 1620CTTGTTATAG AAGAAGTTCC TGATGTAGTT CACATGGGTC ACGTTCACGT TTACGATGCG 1680GTAGTTTATA GGGGAGTTCA GCTGGTTAAC TCCGCCACCT GGCAGGCTCA GACCGAGTTC 1740CAGAAGATGG TGAACATAGT TCCAACGCCT GCAAAGGTTC CCGTTGTTGA TATTGATACT 1800GCAAAAGTTG TCAAGGTTTT GGACTTTAGT GGGTGGTGC 1839序列号3序列长度1263序列类型氨基酸链型单链拓扑构型直链型序列种类多肽序列Met Glu Leu Pro Lys Glu Ile Glu Glu Tyr Phe Glu Met Leu Gln5 10 15Arg Glu Ile Asp Lys Ala Tyr Glu Ile Ala Lys Lys Ala Arg Ser20 25 30Gln Gly Lys Asp Pro Ser Thr Asp Val Glu Ile Pro Gln Ala Thr35 40 45Asp Met Ala Gly Arg Val Glu Ser Leu Val Gly Pro Pro Gly Val50 55 60Ala Gln Arg Ile Arg Glu Leu Leu Lys Glu Tyr Asp Lys Glu Ile65 70 75Val Ala Leu Lys Ile Val Asp Glu Ile Ile Glu Gly Lys Phe Gly80 85 90Asp Phe Gly Ser Lys Glu Lys Tyr Ala Glu Gln Ala Val Arg Thr95 100 105Ala Leu Ala Ile Leu Thr Glu Gly Ile Val Ser Ala Pro Leu Glu110 115 120Gly Ile Ala Asp Val Lys Ile Lys Arg Asn Thr Trp Ala Asp Asn125 130 135Ser Glu Tyr Leu Ala Leu Tyr Tyr Ala Gly Pro Ile Arg Ser Ser
140 145 150Gly Gly Thr Ala Gln Ala Leu Ser Val Leu Val Gly Asp Tyr Val155 160 165Arg Arg Lys Leu Gly Leu Asp Arg Phe Lys Pro Ser Gly Lys His170 175 180Ile Glu Arg Met Val Glu Glu Val Asp Leu Tyr His Arg Ala Val185 190 195Ser Arg Leu Gln Tyr His Pro Ser Pro Asp Glu Val Arg Leu Ala200 205 210Met Arg Asn Ile Pro Ile Glu Ile Thr Gly Glu Ala Thr Asp Asp215 220 225Val Glu Val Ser His Arg Asp Val Glu Gly Val Glu Thr Asn Gln230 235 240Leu Arg Gly Gly Ala Ile Leu Val Leu Ala Glu Gly Val Leu Gln245 250 255Lys Ala Lys Lys Leu Val Lys Tyr Ile Asp Lys Met Gly Ile Asp260 265 270Gly Trp Glu Trp Leu Lys Glu Phe Val Glu Ala Lys Glu Lys Gly275 280 285Glu Glu Ile Glu Glu Ser Glu Ser Lys Ala Glu Glu Ser Lys Val290 295 300Glu Thr Arg Val Glu Val Glu Lys Gly Phe Tyr Tyr Lys Leu Tyr305 310 315Glu Lys Phe Arg Ala Glu Ile Ala Pro Ser Glu Lys Tyr Ala Lys320 325 330Glu Ile Ile Gly Gly Arg Pro Leu Phe Ala Gly Pro Ser Glu Asn
335 340 345Gly Gly Phe Arg Leu Arg Tyr Gly Arg Ser Arg Val Ser Gly Phe350 355 360Ala Thr Trp Ser Ile Asn Pro Ala Thr Met Val Leu Val Asp Glu365 370 375Phe Leu Ala Ile Gly Thr Gln Met Lys Thr Glu Arg Pro Gly Lys380 385 390Gly Ala Val Val Thr Pro Ala Thr Thr Ala Glu Gly Pro Ile Val395 400 405Lys Leu Lys Asp Gly Ser Val Val Arg Val Asp Asp Tyr Asn Leu410 415 420Ala Leu Lys Ile Arg Asp Glu Val Glu Glu Ile Leu Tyr Leu Gly425 430 435Asp Ala Ile Ile Ala Phe Gly Asp Phe Val Glu Asn Asn Gln Thr440 445 450Leu Leu Pro Ala Asn Tyr Val Glu Glu Trp Trp Ile Gln Glu Phe455 460 465Val Lys Ala Val Asn Glu Ala Tyr Glu Val Glu Leu Arg Pro Phe470 475 480Glu Glu Asn Pro Arg Glu Ser Val Glu Glu Ala Ala Glu Tyr Leu485 490 495Glu Val Asp Pro Glu Phe Leu Ala Lys Met Leu Tyr Asp Pro Leu500 505 510Arg Val Lys Pro Pro Val Glu Leu Ala Ile His Phe Ser Glu Ile515 520 525Leu Glu Ile Pro Leu His Pro Tyr Tyr Thr Leu Tyr Trp Asn Thr
530 535 540Val Asn Pro Lys Asp Val Glu Arg Leu Trp Gly Val Leu Lys Asp545 550 555Lys Ala Thr Ile Glu Trp Gly Thr Phe Arg Gly Ile Lys Phe Ala560 565 570Lys Lys Ile Glu Ile Ser Leu Asp Asp Leu Gly Ser Leu Lys Arg575 580 585Thr Leu Glu Leu Leu Gly Leu Pro His Thr Val Arg Glu Gly Ile590 595 600Val Val Val Asp Tyr Pro Trp Ser Ala Ala Leu Leu Thr Pro Leu605 610 615Gly Asn Leu Glu Trp Glu Phe Lys Ala Lys Pro Phe Tyr Thr Val620 625 630Ile Asp Ile Ile Asn Glu Asn Asn Gln Ile Lys Leu Arg Asp Arg635 640 645Gly Ile Ser Trp Ile Gly Ala Arg Met Gly Arg Pro Glu Lys Ala650 655 660Lys Glu Arg Lys Met Lys Pro Pro Val Gln Val Leu Phe Pro Ile665 670 675Gly Leu Ala Gly Gly Ser Ser Arg Asp Ile Lys Lys Ala Ala Glu680 685 690Glu Gly Lys Ile Ala Glu Val Glu Ile Ala Phe Phe Lys Cys Pro695 700 705Lys Cys Gly His Val Gly Pro Glu Thr Leu Cys Pro Glu Cys Gly710 715 720Ile Arg Lys Glu Leu Ile Trp Thr Cys Pro Lys Cys Gly Ala Glu
725 730 735Tyr Thr Asn Ser Gln Ala Glu Gly Tyr Ser Tyr Ser Cys Pro Lys740 745 750Cys Asn Val Lys Leu Lys Pro Phe Thr Lys Arg Lys Ile Lys Pro755 760 765Ser Glu Leu Leu Asn Arg Ala Met Glu Asn Val Lys Val Tyr Gly770 775 780Val Asp Lys Leu Lys Gly Val Met Gly Met Thr Ser Gly Trp Lys785 790 795Ile Ala Glu Pro Leu Glu Lys Gly Leu Leu Arg Ala Lys Asn Glu800 805 810Val Tyr Val Phe Lys Asp Gly Thr Ile Arg Phe Asp Ala Thr Asp815 820 825Ala Pro Ile Thr His Phe Arg Pro Arg Glu Ile Gly Val Ser Val830 835 840Glu Lys Leu Arg Glu Leu Gly Tyr Thr His Asp Phe Glu Gly Lys845 850 855Pro Leu Val Ser Glu Asp Gln Ile Val Glu Leu Lys Pro Gln Asp860 865 870Val Ile Leu Ser Lys Glu Ala Gly Lys Tyr Leu Leu Arg Val Ala875 880 885Arg Phe Val Asp Asp Leu Leu Glu Lys Phe Tyr Gly Leu Pro Arg890 895 900Phe Tyr Asn Ala Glu Lys Met Glu Asp Leu Ile Gly His Leu Val905 910 915Ile Gly Leu Ala Pro His Thr Ser Ala Gly Ile Val Gly Arg Ile
920 925 930Ile Gly Phe Val Asp Ala Leu Val Gly Tyr Ala His Pro Tyr Phe935 940 945His Ala Ala Lys Arg Arg Asn Cys Asp Gly Asp Glu Asp Ser Val950 955 960Met Leu Leu Leu Asp Ala Leu Leu Asn Phe Ser Arg Tyr Tyr Leu965 970 975Pro Glu Lys Arg Gly Gly Lys Met Asp Ala Pro Leu Val Ile Thr980 985 990Thr Arg Leu Asp Pro Arg Glu Val Asp Ser Glu Val His Asn Met99510001005Asp Val Val Arg Tyr Tyr Pro Leu Glu Phe Tyr Glu Ala Thr Tyr101010151020Glu Leu Lys Ser Pro Lys Glu Leu Val Arg Val Ile Glu Gly Val102510301035Glu Asp Arg Leu Gly Lys Pro Glu Met Tyr Tyr Gly Ile Lys Phe104010451050Thr His Asp Thr Asp Asp Ile Ala Leu Gly Pro Lys Met Ser Leu105510601065Tyr Lys Gln Leu Gly Asp Met Glu Glu Lys Val Lys Arg Gln Leu107010751080Thr Leu Ala Glu Arg Ile Arg Ala Val Asp Gln His Tyr Val Ala108510901095Glu Thr Ile Leu Asn Ser His Leu Ile Pro Asp Leu Arg Gly Asn110011051110Leu Arg Ser Phe Thr Arg Gln Glu Phe Arg Cys Val Lys Cys Asn
111511201125Thr Lys Tyr Arg Arg Pro Pro Leu Asp Gly Lys Cys Pro Val Cys113011351140Gly Gly Lys Ile Val Leu Thr Val Ser Lys Gly Ala Ile Glu Lys114511501155Tyr Leu Gly Thr Ala Lys Met Leu Val Ala Asn Tyr Asn Val Lys116011651170Pro Tyr Thr Arg Gln Arg Ile Cys Leu Thr Glu Lys Asp Ile Asp117511801185Ser Leu Phe Glu Tyr Leu Phe Pro Glu Ala Gln Leu Thr Leu Ile119011951200Val Asp Pro Asn Asp Ile Cys Met Lys Met Ile Lys Glu Arg Thr120512101215Gly Glu Thr Val Gln Gly Gly Leu Leu Glu Asn Phe Asn Ser Ser122012251230Gly Asn Asn Gly Lys Lys Ile Glu Lys Lys Glu Lys Lys Ala Lys123512401245Glu Lys Pro Lys Lys Lys Lys Val Ile Ser Leu Asp Asp Phe Phe125012551260Ser Lys Arg序列号4序列长度3789序列类型核酸链型双链拓扑构型直链型序列种类基因组DNA序列ATGGAGCTTC CAAAGGAAAT TGAGGAGTAT TTTGAGATGC TTCAAAGGGA AATTGACAAA60GCTTACGAGA TTGCTAAGAA GGCTAGGAGT CAGGGTAAAG ACCCCTCAAC CGATGTTGAG 120ATTCCCCAGG CTACAGACAT GGCTGGAAGA GTTGAGAGCT TAGTTGGCCC TCCCGGAGTT 180GCTCAGAGAA TTAGGGAGCT TTTAAAAGAG TATGATAAGG AAATTGTTGC TTTAAAGATA 240GTTGATGAGA TAATTGAGGG CAAATTTGGT GATTTTGGAA GTAAAGAGAA GTACGCTGAA 300CAGGCTGTAA GGACAGCCTT GGCAATATTA ACTGAGGGTA TTGTTTCTGC TCCACTTGAG 360GGTATAGCTG ATGTTAAAAT CAAGCGAAAC ACCTGGGCTG ATAACTCTGA ATACCTCGCC 420CTTTACTATG CTGGGCCAAT TAGGAGTTCT GGTGGAACTG CTCAAGCTCT CAGTGTACTT 480GTTGGTGATT ACGTTAGGCG AAAGCTTGGC CTTGATAGGT TTAAGCCAAG TGGGAAGCAT 540ATAGAGAGAA TGGTTGAGGA AGTTGACCTC TATCATAGAG CTGTTTCAAG GCTTCAATAT 600CATCCCTCAC CTGATGAAGT GAGATTAGCA ATGAGGAATA TTCCCATAGA AATCACTGGT 660GAAGCCACTG ACGATGTGGA GGTTTCCCAT AGAGATGTAG AGGGAGTTGA GACAAATCAG 720CTGAGAGGAG GAGCGATCCT AGTTTTGGCG GAGGGTGTTC TCCAGAAGGC TAAAAAGCTC 780GTGAAATACA TTGACAAGAT GGGGATTGAT GGATGGGAGT GGCTTAAAGA GTTTGTAGAG 840GCTAAAGAAA AAGGTGAAGA AATCGAAGAG AGTGAAAGTA AAGCCGAGGA GTCAAAAGTT 900GAAACAAGGG TGGAGGTAGA GAAGGGATTC TACTACAAGC TCTATGAGAA ATTTAGGGCT 960GAGATTGCCC CAAGCGAAAA GTATGCAAAG GAAATAATTG GTGGGAGGCC GTTATTCGCT 1020GGACCCTCGG AAAATGGGGG ATTTAGGCTT AGATATGGTA GAAGTAGGGT GAGTGGATTT 1080GCAACATGGA GCATAAATCC AGCAACAATG GTTTTGGTTG ACGAGTTCTT GGCCATTGGA 1140ACTCAAATGA AAACCGAGAG GCCTGGGAAA GGTGCAGTAG TGACTCCAGC AACAACCGCT 1200GAAGGGCCGA TTGTTAAGCT AAAGGATGGG AGTGTTGTTA GGGTTGATGA TTACAACTTG 1260GCCCTCAAAA TAAGGGATGA AGTCGAAGAG ATACTTTATT TGGGAGATGC AATCATAGCC 1320TTTGGAGACT TTGTGGAGAA CAATCAAACT CTCCTTCCTG CAAACTATGT AGAGGAGTGG 1380TGGATCCAAG AGTTCGTAAA GGCCGTTAAT GAGGCATATG AAGTTGAGCT TAGACCCTTT 1440GAGGAAAATC CCAGGGAGAG CGTTGAGGAA GCAGCAGAGT ACCTTGAAGT TGACCCAGAA 1500TTCTTGGCTA AGATGCTTTA CGATCCTCTA AGGGTTAAGC CTCCCGTGGA GCTAGCCATA 1560CACTTCTCGG AAATCCTGGA AATTCCTCTC CACCCATACT ACACCCTTTA TTGGAATACT 1620GTAAATCCTA AAGATGTTGA AAGACTTTGG GGAGTATTAA AAGACAAGGC CACCATAGAA 1680TGGGGCACTT TCAGAGGTAT AAAGTTTGCA AAGAAAATTG AAATTAGCCT GGACGACCTG 1740GGAAGTCTTA AGAGAACCCT AGAGCTCCTG GGACTTCCTC ATACGGTAAG AGAAGGGATT 1800GTAGTGGTTG ATTATCCGTG GAGTGCAGCT CTTCTCACTC CATTGGGCAA TCTTGAATGG 1860GAGTTTAAGG CCAAGCCCTT CTACACTGTA ATAGACATCA TTAACGAGAA CAATCAGATA 1920AAGCTCAGGG ACAGGGGAAT AAGCTGGATA GGGGCAAGAA TGGGAAGGCC AGAGAAGGCA 1980AAAGAAAGAA AAATGAAGCC ACCTGTTCAA GTCCTCTTCC CAATTGGCTT GGCAGGGGGT 2040TCTAGCAGAG ATATAAAGAA GGCTGCTGAA GAGGGAAAAA TAGCTGAAGT TGAGATTGCT 2100TTCTTCAAGT GTCCGAAGTG TGGCCATGTA GGGCCTGAAA CTCTCTGTCC CGAGTGTGGG 2160ATTAGGAAAG AGTTGATATG GACATGTCCC AAGTGTGGGG CTGAATACAC CAATTCCCAG 2220GCTGAGGGGT ACTCGTATTC ATGTCCAAAG TGCAATGTGA AGCTAAAGCC ATTCACAAAG 2280AGGAAGATAA AGCCCTCAGA GCTCTTAAAC AGGGCCATGG AAAACGTGAA GGTTTATGGA 2340GTTGACAAGC TTAAGGGCGT AATGGGAATG ACTTCTGGCT GGAAGATTGC AGAGCCGCTG 2400GAGAAAGGTC TTTTGAGAGC AAAAAATGAA GTTTACGTCT TTAAGGATGG AACCATAAGA 2460TTTGATGCCA CAGATGCTCC AATAACTCAC TTTAGGCCTA GGGAGATAGG AGTTTCAGTG 2520GAAAAGCTGA GAGAGCTTGG CTACACCCAT GACTTCGAAG GGAAACCTCT GGTGAGTGAA 2580GACCAGATAG TTGAGCTTAA GCCCCAAGAT GTAATCCTCT CAAAGGAGGC TGGCAAGTAC 2640CTCTTAAGAG TGGCCAGGTT TGTTGATGAT CTTCTTGAGA AGTTCTACGG ACTTCCCAGG 2700TTCTACAACG CCGAAAAAAT GGAGGATTTA ATTGGTCACC TAGTGATAGG ATTGGCCCCT 2760CACACTTCAG CCGGAATCGT GGGGAGGATA ATAGGCTTTG TAGATGCTCT GGTTGGCTAC 2820GCTCACCCCT ACTTCCATGC GGCCAAGAGA AGGAACTGTG ATGGAGATGA GGATAGTGTA 2880ATGCTACTCC TTGATGCCCT ATTGAACTTC TCCAGATACT ACCTCCCCGA AAAAAGAGGA 2940GGAAAAATGG ACGCTCCTCT TGTCATAACC ACGAGGCTTG ATCCAAGAGA GGTGGACAGT 3000GAAGTGCACA ACATGGATGT CGTTAGATAC TATCCATTAG AGTTCTATGA AGCAACTTAC 3060GAGCTTAAAT CACCAAAGGA ACTTGTGAGA GTTATAGAGG GAGTTGAAGA TAGATTAGGA 3120AAGCCTGAAA TGTATTACGG AATAAAGTTC ACCCACGATA CCGACGACAT AGCTCTAGGA 3180CCAAAGATGA GCCTCTACAA GCAGTTGGGA GATATGGAGG AGAAAGTGAA GAGGCAATTG 3240ACATTGGCAG AGAGAATTAG AGCTGTGGAT CAACACTATG TTGCTGAAAC AATCCTCAAC 3300TCCCACTTAA TTCCCGACTT GAGGGGTAAC CTAAGGAGCT TTACTAGACA AGAATTTCGC 3360TGTGTGAAGT GTAACACAAA GTACAGAAGG CCGCCCTTGG ATGGAAAATG CCCAGTCTGT 3420GGAGGAAAGA TAGTGCTGAC AGTTAGCAAA GGAGCCATTG AAAAGTACTT GGGGACTGCC 3480AAGATGCTCG TAGCTAACTA CAACGTAAAG CCATATACAA GGCAGAGAAT ATGCTTGACG 3540GAGAAGGATA TTGATTCACT CTTTGAGTAC TTATTCCCAG AAGCCCAGTT AACGCTCATT 3600GTAGATCCAA ACGACATCTG TATGAAAATG ATCAAGGAAA GAACGGGGGA AACAGTTCAA 3660GGAGGCCTGC TTGAGAACTT TAATTCCTCT GGAAATAATG GGAAGAAAAT AGAGAAGAAG 3720GAGAAAAAGG CAAAGGAAAA GCCTAAAAAG AAGAAAGTTA TAAGCTTGGA CGACTTCTTC 3780TCCAAACGC 3789序列号5序列长度8450序列类型核酸链型双链拓扑构型直链型序列种类基因组DNA序列CATAACTAAA TTATTACATT TAGTTATATG GATGGGGGAA AAATTAACAA CATGTGTTAT 60GTTTCCTCTG GAAAATTGAT CTATAATAAT CTAGGAGCAC AATTTCCAAT GGAGGGTCAT 120CAATGAACGA AGGTGAACAT CAAATAAAGC TTGACGACCT ATTCGAAAAG TTGCTCCGAG 180CTAGGAAGAT ATTCAAAAAC AAAGATGTCC TTAGGCATAG CTATACTCCC AAGGATCTAC240CTCACAGACA TGAGCAAATA GAAACTCTCG CCCAAATTTT AGTACCAGTT CTCAGAGGAG300AAACTCCATC AAACATATTC GTTTATGGGA AGACTGGAAC TGGAAAGACT GTAACTGTAA360AATTTGTAAC TGAAGAGCTG AAAAGAATAT CTGAAAAATA CAACATTCCA GTTGATGTGA420TCTACATTAA TTGTGAGATT GTCGATACTC ACTATAGAGT TCTTGCTAAC ATAGTTAACT480ACTTCAAAGA TGAGACTGGG ATTGAAGTTC CAATGGTAGG TTGGCCTACC GATGAAGTTT540ACGCAAAGCT TAAGCAGGTT ATAGATATGA AGGAGAGGTT TGTGATAATT GTGTTGGATG600AAATTGACAA GTGGTAAAGA AGAGTGGTGA TGAGGTTCTC TATTCATTAA CAAGAATAAA660TACTGAACTT AAAAGGGCTA AAGTGAGTGT AATTGGTATA TCAAACGACC TTAAATTTAA720AGAGTATCTA GATCCAAGAG TTCTCTCAAG TTTGAGTGAG GAAGAGGTGG TATTCCCACC780CTATGATGCA AATCAGCTTA GGGATATACT GACCCAAAGA GCTGAAGAGG CCTTTTATCC840TGGGGTTTTA GACGAAGGTG TGATTCCCCT CTGTGCAGCA TTAGCTGCTA GAGAGCATGG900AGATGCAAGA AAGGCACTTG ACCTTCTAAG AGTTGCAGGG GAAATAGCGG AAAGAGAAGG960GGCAAGTAAA GTAACTGAAA AGCATGTTTG GAAAGCCCAG GAAAAGATTG AACAGGACAT 1020GATGGAGGAG GTAATAAAAA CTCTACCCCT TCAGTCAAAA GTTCTCCTCT ATGCCATAGT 1080TCTTTTGGAC GAAAACGGCG ATTTACCAGC AAATACTGGG GATGTTTACG CTGTTTATAG 1140GGAATTGTGC GAGTACATTG ACTTGGAACC TCTCACCCAA AGAAGGATAA GTGATCTAAT 1200TAATGAGCTT GACATGCTTG GAATAATAAA TGCAAAAGTT GTTAGTAAGG GGAGATATGG 1260GAGGACAAAG GAAATAAGGC TTAACGTTAC CTCATATAAG ATAAGAAATG TGCTGAGATA 1320TGATTACTCT ATTCAGCCCC TCCTCACAAT TTCCCTTAAG AGTGAGCAGA GGAGGTTGAT 1380CTAATGGATG AATTTGTAAA ATCACTTCTA AAAGCTAACT ATCTAATAAC TCCCTCTGCC 1440TACTATCTCT TGAGAGAATA CTATGAAAAA GGTGAATTCT CAATTGTGGA GCTGGTAAAA 1500TTTGCAAGAT CAAGAGAGAG CTACATAATT ACTGATGCTT TAGCAACAGA ATTCCTTAAA 1560GTTAAAGGCC TTGAACCAAT TCTTCCAGTG GAAACAAAGG GGGGTTTTGT TTCCACTGGA 1620GAGTCCCAAA AAGAGCAGTC TTATGAAGAG TCTTTTGGGA CTAAAGAAGA AATTTCCCAG 1680GAGATTAAAG AAGGAGAGAG TTTTATTTCC ACTGGAAGTG AACCACTTGA AGAGGAGCTC 1740AATAGCATTG GAATTGAGGA AATTGGGGCA AATGAAGAGT TAGTTTCTAA TGGAAATGAC 1800AATGGTGGAG AGGCAATTGT CTTTGACAAA TATGGCTATC CAATGGTATA TGCTCCAGAA 1860GAAATAGAGG TTGAGGAGAA GGAGTACTCG AAGTATGAAG ATCTGACAAT ACCCATGAAC 1920CCCGACTTCA ATTATGTGGA AATAAAGGAA GATTATGATG TTGTCTTCGA TGTTAGGAAT 1980GTAAAGCTGA AGCCTCCTAA GGTAAAGAAC GGTAATGGGA AGGAAGGTGA AATAATTGTT 2040GAAGCTTATG CTTCTCTCTT CAGGAGTAGG TTGAAGAAGT TAAGGAAAAT ACTAAGGGAA 2100AATCCTGAAT TGGACAATGT TGTTGATATT GGGAAGCTGA AGTATGTGAA GGAAGATGAA 2160ACCGTGACAA TAATAGGGCT TGTCAATTCC AAGAGGGAAG TGAATAAAGG ATTGATATTT 2220GAAATAGAAG ATCTCACAGG AAAGGTTAAA GTTTTCTTGC CGAAAGATTC GGAAGATTAT 2280AGGGAGGCAT TTAAGGTTCT TCCAGATGCC GTCGTCGCTT TTAAGGGGGT GTATTCAAAG 2340AGGGGAATTT TGTACGCCAA CAAGTTTTAC CTTCCAGACG TTCCCCTCTA TAGGAGACAA 2400AAGCCTCCAC TGGAAGAGAA AGTTTATGCT ATTCTCATAA GTGATATACA CGTCGGAAGT 2460AAAGAGTTCT GCGAAAATGC CTTCATAAAG TTCTTAGAGT GGCTCAATGG AAACGTTGAA 2520ACTAAGGAAG AGGAAGAAAT CGTGAGTAGG GTTAAGTATC TAATCATTGC AGGAGATGTT 2580GTTGATGGTG TTGGCGTTTA TCCGGGCCAG TATGCCGACT TGACGATTCC AGATATATTC 2640GACCAGTATG AGGCCCTCGC AAACCTTCTC TCTCACGTTC CTAAGCACAT AACAATGTTC 2700ATTGCCCCAG GAAACCACGA TGCTGCTAGG CAAGCTATTC CCCAACCAGA ATTCTACAAA 2760GAGTATGCAA AACCTATATA CAAGCTCAAG AACGCCGTGA TAATAAGCAA TCCTGCTGTA 2820ATAAGACTAC ATGGTAGGGA CTTTCTGATA GCTCATGGTA GGGGGATAGA GGATGTCGTT 2880GGAAGTGTTC CTGGGTTGAC CCATCACAAG CCCGGCCTCC CAATGGTTGA ACTATTGAAG 2940ATGAGGCATG TAGCTCCAAT GTTTGGAGGA AAGGTTCCAA TAGCTCCTGA TCCAGAAGAT 3000TTGCTTGTTA TAGAAGAAGT TCCTGATGTA GTTCACATGG GTCACGTTCA CGTTTACGAT 3060GCGGTAGTTT ATAGGGGAGT TCAGCTGGTT AACTCCGCCA CCTGGCAGGC TCAGACCGAG 3120TTCCAGAAGA TGGTGAACAT AGTTCCAACG CCTGCAAAGG TTCCCGTTGT TGATATTGAT 3180ACTGCAAAAG TTGTCAAGGT TTTGGACTTT AGTGGGTGGT GCTGATGGAG CTTCCAAAGG 3240AAATTGAGGA GTATTTTGAG ATGCTTCAAA GGGAAATTGA CAAAGCTTAC GAGATTGCTA 3300AGAAGGCTAG GAGTCAGGGT AAAGACCCCT CAACCGATGT TGAGATTCCC CAGGCTACAG 3360ACATGGCTGG AAGAGTTGAG AGCTTAGTTG GCCCTCCCGG AGTTGCTCAG AGAATTAGGG 3420AGCTTTTAAA AGAGTATGAT AAGGAAATTG TTGCTTTAAA GATAGTTGAT GAGATAATTG 3480AGGGCAAATT TGGTGATTTT GGAAGTAAAG AGAAGTACGC TGAACAGGCT GTAAGGACAG 3540CCTTGGCAAT ATTAACTGAG GGTATTGTTT CTGCTCCACT TGAGGGTATA GCTGATGTTA 3600AAATCAAGCG AAACACCTGG GCTGATAACT CTGAATACCT CGCCCTTTAC TATGCTGGGC 3660CAATTAGGAG TTCTGGTGGA ACTGCTCAAG CTCTCAGTGT ACTTGTTGGT GATTACGTTA 3720GGCGAAAGCT TGGCCTTGAT AGGTTTAAGC CAAGTGGGAA GCATATAGAG AGAATGGTTG 3780AGGAAGTTGA CCTCTATCAT AGAGCTGTTT CAAGGCTTCA ATATCATCCC TCACCTGATG 3840AAGTGAGATT AGCAATGAGG AATATTCCCA TAGAAATCAC TGGTGAAGCC ACTGACGATG 3900TGGAGGTTTC CCATAGAGAT GTAGAGGGAG TTGAGACAAA TCAGCTGAGA GGAGGAGCGA 3960TCCTAGTTTT GGCGGAGGGT GTTCTCCAGA AGGCTAAAAA GCTCGTGAAA TACATTGACA 4020AGATGGGGAT TGATGGATGG GAGTGGCTTA AAGAGTTTGT AGAGGCTAAA GAAAAAGGTG 4080AAGAAATCGA AGAGAGTGAA AGTAAAGCCG AGGAGTCAAA AGTTGAAACA AGGGTGGAGG 4140TAGAGAAGGG ATTCTACTAC AAGCTCTATG AGAAATTTAG GGCTGAGATT GCCCCAAGCG 4200AAAAGTATGC AAAGGAAATA ATTGGTGGGA GGCCGTTATT CGCTGGACCC TCGGAAAATG 4260GGGGATTTAG GCTTAGATAT GGTAGAAGTA GGGTGAGTGG ATTTGCAACA TGGAGCATAA 4320ATCCAGCAAC AATGGTTTTG GTTGACGAGT TCTTGGCCAT TGGAACTCAA ATGAAAACCG 4380AGAGGCCTGG GAAAGGTGCA GTAGTGACTC CAGCAACAAC CGCTGAAGGG CCGATTGTTA 4440AGCTAAAGGA TGGGAGTGTT GTTAGGGTTG ATGATTACAA CTTGGCCCTC AAAATAAGGG 4500ATGAAGTCGA AGAGATACTT TATTTGGGAG ATGCAATCAT AGCCTTTGGA GACTTTGTGG 4560AGAACAATCA AACTCTCCTT CCTGCAAACT ATGTAGAGGA GTGGTGGATC CAAGAGTTCG 4620TAAAGGCCGT TAATGAGGCA TATGAAGTTG AGCTTAGACC CTTTGAGGAA AATCCCAGGG 4680AGAGCGTTGA GGAAGCAGCA GAGTACCTTG AAGTTGACCC AGAATTCTTG GCTAAGATGC 4740TTTACGATCC TCTAAGGGTT AAGCCTCCCG TGGAGCTAGC CATACACTTC TCGGAAATCC 4800TGGAAATTCC TCTCCACCCA TACTACACCC TTTATTGGAA TACTGTAAAT CCTAAAGATG 4860TTGAAAGACT TTGGGGAGTA TTAAAAGACA AGGCCACCAT AGAATGGGGC ACTTTCAGAG 4920GTATAAAGTT TGCAAAGAAA ATTGAAATTA GCCTGGACGA CCTGGGAAGT CTTAAGAGAA 4980CCCTAGAGCT CCTGGGACTT CCTCATACGG TAAGAGAAGG GATTGTAGTG GTTGATTATC 5040CGTGGAGTGC AGCTCTTCTC ACTCCATTGG GCAATCTTGA ATGGGAGTTT AAGGCCAAGC 5100CCTTCTACAC TGTAATAGAC ATCATTAACG AGAACAATCA GATAAAGCTC AGGGACAGGG 5160GAATAAGCTG GATAGGGGCA AGAATGGGAA GGCCAGAGAA GGCAAAAGAA AGAAAAATGA 5220AGCCACCTGT TCAAGTCCTC TTCCCAATTG GCTTGGCAGG GGGTTCTAGC AGAGATATAA 5280AGAAGGCTGC TGAAGAGGGA AAAATAGCTG AAGTTGAGAT TGCTTTCTTC AAGTGTCCGA 5340AGTGTGGCCA TGTAGGGCCT GAAACTCTCT GTCCCGAGTG TGGGATTAGG AAAGAGTTGA 5400TATGGACATG TCCCAAGTGT GGGGCTGAAT ACACCAATTC CCAGGCTGAG GGGTACTCGT 5460ATTCATGTCC AAAGTGCAAT GTGAAGCTAA AGCCATTCAC AAAGAGGAAG ATAAAGCCCT 5520CAGAGCTCTT AAACAGGGCC ATGGAAAACG TGAAGGTTTA TGGAGTTGAC AAGCTTAAGG 5580GCGTAATGGG AATGACTTCT GGCTGGAAGA TTGCAGAGCC GCTGGAGAAA GGTCTTTTGA 5640GAGCAAAAAA TGAAGTTTAC GTCTTTAAGG ATGGAACCAT AAGATTTGAT GCCACAGATG 5700CTCCAATAAC TCACTTTAGG CCTAGGGAGA TAGGAGTTTC AGTGGAAAAG CTGAGAGAGC 5760TTGGCTACAC CCATGACTTC GAAGGGAAAC CTCTGGTGAG TGAAGACCAG ATAGTTGAGC 5820TTAAGCCCCA AGATGTAATC CTCTCAAAGG AGGCTGGCAA GTACCTCTTA AGAGTGGCCA 5880GGTTTGTTGA TGATCTTCTT GAGAAGTTCT ACGGACTTCC CAGGTTCTAC AACGCCGAAA 5940AAATGGAGGA TTTAATTGGT CACCTAGTGA TAGGATTGGC CCCTCACACT TCAGCCGGAA 6000TCGTGGGGAG GATAATAGGC TTTGTAGATG CTCTGGTTGG CTACGCTCAC CCCTACTTCC 6060ATGCGGCCAA GAGAAGGAAC TGTGATGGAG ATGAGGATAG TGTAATGCTA CTCCTTGATG 6120CCCTATTGAA CTTCTCCAGA TACTACCTCC CCGAAAAAAG AGGAGGAAAA ATGGACGCTC 6180CTCTTGTCAT AACCACGAGG CTTGATCCAA GAGAGGTGGA CAGTGAAGTG CACAACATGG 6240ATGTCGTTAG ATACTATCCA TTAGAGTTCT ATGAAGCAAC TTACGAGCTT AAATCACCAA 6300AGGAACTTGT GAGAGTTATA GAGGGAGTTG AAGATAGATT AGGAAAGCCT GAAATGTATT 6360ACGGAATAAA GTTCACCCAC GATACCGACG ACATAGCTCT AGGACCAAAG ATGAGCCTCT 6420ACAAGCAGTT GGGAGATATG GAGGAGAAAG TGAAGAGGCA ATTGACATTG GCAGAGAGAA 6480TTAGAGCTGT GGATCAACAC TATGTTGCTG AAACAATCCT CAACTCCCAC TTAATTCCCG 6540ACTTGAGGGG TAACCTAAGG AGCTTTACTA GACAAGAATT TCGCTGTGTG AAGTGTAACA 6600CAAAGTACAG AAGGCCGCCC TTGGATGGAA AATGCCCAGT CTGTGGAGGA AAGATAGTGC 6660TGACAGTTAG CAAAGGAGCC ATTGAAAAGT ACTTGGGGAC TGCCAAGATG CTCGTAGCTA 6720ACTACAACGT AAAGCCATAT ACAAGGCAGA GAATATGCTT GACGGAGAAG GATATTGATT 6780CACTCTTTGA GTACTTATTC CCAGAAGCCC AGTTAACGCT CATTGTAGAT CCAAACGACA 6840TCTGTATGAA AATGATCAAG GAAAGAACGG GGGAAACAGT TCAAGGAGGC CTGCTTGAGA 6900ACTTTAATTC CTCTGGAAAT AATGGGAAGA AAATAGAGAA GAAGGAGAAA AAGGCAAAGG 6960AAAAGCCTAA AAAGAAGAAA GTTATAAGCT TGGACGACTT CTTCTCCAAA CGCTGACCAC 7020AACTTTTAAG TTCTTTCTTG AGAATAAATT CCCAGGTGGC TTAGAGAATG AAGATTGTGT 7080GGTGTGGTCA TGCCTGCTTC TTGGTGGAGG ATAGGGGGAC TAAGATACTA ATCGATCCAT 7140ACCCAGACGT TGATGAAGAC AGAATAGGCA AGGTCGATTA CATTCTAGTT ACCCACGAGC 7200ACATGGATCA CTACGGTAAG ACCCCACTAA TAGCAAAGCT CAGTGATGCC GAGGTTATAG 7260GGCCGAAAAC AGTTTATCTC ATGGCAATAA GTGATGGGCT AACAAAGGTC AGAGAGATAG 7320AGGTGGGACA GGAAATCGAG CTGGGAGATA TTAGGGTTAG GGCATTTTTC ACAGAGCATC 7380CAACAAGCCA GTATCCCCTG GGATATCTAA TTGAAGGAAG CAAAAGAGTG GCTCACTTGG 7440GAGATACATA CTACAGTCCA GCTTTTACAG AGTTGAGGGG AAAGGTTGAT GTTCTTTTGG 7500TTCCAATAGG TGGGAAGTCC ACCGCTAGTG TAAGGGAGGC TGCGGATATA GTGGAGATGA 7560TAAGGCCCAG GATAGCAGTT CCAATGCACT ATGGAACGTA CAGCGAGGCC GATCCTGAAG 7620AGTTCAAGAA GGAGCTCCAA AAAAGGCGCA TATGGGTTTT AGTAAAGGAT CTTAAGCCCT 7680ATGAGGGTTT TGAAATCTGA AGGTGTTTCA ATGCTAAATA CTGAGCTCTT AACCACTGGA 7740GTCAAGGGGT TAGATGAGCT TTTAGGTGGT GGAGTTGCTA AGGGAGTAAT ACTCCAAGTT 7800TACGGGCCAT TTGCCACCGG GAAGACAACT TTTGCAATGC AGGTTGGATT ATTGAATGAG 7860GGAAAAGTGG CTTATGTTGA TACTGAGGGG GGATTCTCCC CCGAAAGGTT AGCTCAAATG 7920GCAGAATCAA GGAACTTGGA TGTGGAGAAA GCACTTGAAA AGTTCGTGAT ATTCGAACCT 7980ATGGATTTAA ACGAGCAAAG ACAGGTAATT GCGAGGTTGA AAAATATCGT GAATGAAAAG 8040TTTTCTTTAG TTGTGGTCGA CTCCTTTACG GCCCATTATA GAGCGGAGGG GAGTAGAGAG 8100TATGGAGAAC TTTCCAAGCA ACTCCAAGTT CTTCAGTGGA TTGCCAGAAG AAAAAACGTT 8160GCCGTTATAG TTGTCAATCA AGTTTATTAC GATTCAAACT CAGGAATTCT TAAACCAATA 8220GCTGAGCACA CCCTGGGGTA CAAAACAAAG GACATCCTCC GCTTTGAAAG GCTTAGGGTT 8280GGAGTGAGAA TTGCAGTTCT GGAAAGGCAT AGGTTTAGGC CAGAGGGTGG GATGGTATAC 8340TTCAAAATAA CAGATAAAGG ATTGGAGGAT GTAAAAAACG AAGATTAGAG CCTGTCGTAG 8400ACCTCCTGGG CAATCCTCAG CGTTGCCTTA TAGAGCTTCT CACTAATAAT8450序列号6序列长度45序列类型核酸链型单链拓扑构型直链型序列种类其他核酸(合成DNA)序列CCGGAACCGC CTCCCTCAGA GCCGCCACCC TCAGAACCGC CACCC 45序列号7序列长度17序列类型核酸链型单链拓扑构型直链型序列种类其他核酸(合成RNA)序列GUUUUCCCAG UCACGAC 17序列号8序列长度23序列类型核酸链型单链拓扑构型直链型序列种类其他核酸(合成DNA)序列GATGAGTTCG TGTCCGTACA ACT 23序列号9序列长度22序列类型核酸链型单链拓扑构型直链型序列种类其他核酸(合成DNA)序列ACAAAGCCAG CCGGAATATC TG 22序列号10序列长度22序列类型核酸链型单链拓扑构型直链型序列种类其他核酸(合成DNA)序列TACAATACGA TGCCCCGTTA AG 22序列号11序列长度32序列类型核酸链型单链拓扑构型直链型序列种类其他核酸(合成DNA)序列CAGAGGAGGT TGATCCCATG GATGAATTTG TA 32序列号12序列长度32序列类型核酸链型单链拓扑构型直链型序列种类其他核酸(合成DNA)序列TTTAGTGGGT GGTGCCCATG GAGCTTCCAA AG 3权利要求
1.特征为具有下列性质的DNA聚合酶①在以单链模板DNA与引物退火形成的复合物为底物时,测定的聚合酶活性比以活化的DNA为底物时显示的活性高;②具有3’→5’外切核酸酶活性;③在按下述条件以λ-DNA为模板进行聚合酶链反应(PCR)时,能够扩增约20千碱基对的DNA片段;PCR的条件(a)反应液组成含10 mM Tris-盐酸(pH9.2)、3.5mM MgCl2、75 mM KCl、400μM dATP、dCTP、dGTP、dTTP、0.01%小牛血清白蛋白、0.1%Triton X-100、5.0 ng/50μlλ-DNA、10 pmol/50μl引物λ1(序列表的序列号8)、以及引物λ11(序列表的序列号9)、3.7单位/50μl DNA聚合酶;(b)反应条件以每循环98℃、10秒~68℃、10分钟进行30个循环的PCR反应。
2.权利要求1记载的DNA聚合酶,其特征为与Taq DNA聚合酶相比,在DNA合成时的错误频率低。
3.权利要求1或2记载的DNA聚合酶,用凝胶过滤法测得的分子量为约220千道尔顿或约385千道尔顿。
4.权利要求1~3中任一项记载的DNA聚合酶,其特征为在两种DNA聚合酶组成蛋白(第1种DNA聚合酶组成蛋白和第2种DNA聚合酶组成蛋白)共存时能显示活性。
5.权利要求4记载的DNA聚合酶,其特征是,第1种DNA聚合酶组成蛋白和第2种DNA聚合酶组成蛋白用SDS-PAGE测得的分子量分别为约90,000道尔顿和约14,000道尔顿。
6.权利要求4或5中记载的DNA聚合酶,其特征为,构成权利要求4或5中记载的DNA聚合酶的第1种DNA聚合酶组成蛋白包括序列表的序列号1中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物。
7.权利要求4或5中记载的DNA聚合酶,其特征为,构成权利要求4或5中记载的DNA聚合酶的第2种DNA聚合酶组成蛋白包括序列表的序列号3中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物。
8.权利要求4或5中记载的DNA聚合酶,其特征为,构成权利要求4或5中记载的DNA聚合酶的第1种DNA聚合酶组成蛋白包括序列表的序列号1中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物;构成权利要求4或5中记载的DNA聚合酶的第2种DNA聚合酶组成蛋白包括序列表的序列号3中所示的氨基酸序列或是在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换并具有基本相同的活性的功能等价物。
9.构成权利要求4或5中记载的DNA聚合酶的第1种DNA聚合酶组成蛋白,包括序列表的序列号1中所示的氨基酸序列,或包括在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换且具有基本相同的活性的功能等价物的氨基酸序列。
10.构成权利要求4或5中记载的DNA聚合酶的第2种DNA聚合酶组成蛋白,包括序列表的序列号3中所示的氨基酸序列,或包括在该氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换且具有基本相同的活性的功能等价物的氨基酸序列。
11.含有编码权利要求9中记载的第1种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有编码序列表的序列号1中所示的氨基酸序列的碱基序列的全部或一部分,或者编码含有在序列号1的氨基酸序列中有一个以上的氨基酸缺失、插入、附加或置换的氨基酸序列且具有第1种DNA聚合酶组成蛋白的功能的蛋白质。
12.含有编码权利要求9中记载的第1种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有序列表的序列号2中所示的碱基序列的全部或一部分,或者含有在严格条件下能与该序列杂交的碱基序列。
13.含有编码权利要求10中记载的第2种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有编码序列表的序列号3中所示的氨基酸序列的碱基序列的全部或一部分,或者编码含有在序列号3的氨基酸序列上有一个以上的氨基酸缺失、插入、附加或置换的氨基酸序列且具有第2种DNA聚合酶组成蛋白的功能的蛋白质。
14.含有编码权利要求10中记载的第2种DNA聚合酶组成蛋白的碱基序列的DNA,其特征为含有序列表的序列号4中所示的碱基序列的全部或一部分,或者含有在严格条件下能与该序列杂交的碱基序列。
15.DNA聚合酶的制造方法,其特征为,培养含有编码权利要求11或12中记载的第1种DNA聚合酶组成蛋白的基因和编码权利要求13或14中记载的第2种DNA聚合酶组成蛋白的基因两者的转化子,从该培养物中收集DNA聚合酶。
16.DNA聚合酶的制造方法,其特征为分别培养含有编码权利要求11或12中记载的第1种DNA聚合酶组成蛋白的基因的转化子和含有编码权利要求13或14中记载的第2种DNA聚合酶组成蛋白的转化子,混合培养物中所含的DNA聚合酶组成蛋白,收集DNA聚合酶。
全文摘要
本发明涉及具有如下性质的DNA聚合酶:(1)在以单链模板与引物退火形成的复合物为底物时测定的聚合酶活性,比以活化的DNA作模板时显示的聚合酶活性高。(2)具有3’→5’外切核酸酶活性。(3)在使用λDNA作为模板进行PCR反应时,能够扩增约20千碱基对的DNA片段而不需要加入任何其他的酶;构成该DNA聚合酶的蛋白质;含有编码该酶的碱基序列的DNA;以及制备该DNA聚合酶的方法。本发明所提供的是一种同时含有高引物延伸活性和3’→5’外切核酸酶活性的新型DNA聚合酶。
文档编号C12N15/54GK1209170SQ9618012
公开日1999年2月24日 申请日期1996年12月26日 优先权日1995年12月27日
发明者上森隆司, 石野良纯, 加藤郁之进 申请人:宝酒造株式会社 被以下专利引用 (3),
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1