质粒的制作方法

文档序号:451116阅读:5796来源:国知局
专利名称:质粒的制作方法
技术领域
本发明涉及可在基因重组技术中使用的质粒载体,以及用该质粒载体表达基因的方法。本发明还涉及用该质粒载体分离目的基因的方法。另外,本发明还涉及可用作基因工程试剂的限制性内切核酸酶及其基因,更具体地说是AccIII限制性内切核酸酶及其DNA。
背景技术
在用基因工程技术构建目的基因的表达系统时,将其放在被所用宿主RNA聚合酶识别的启动子的支配之下,以控制该基因的表达。但是,在编码对所述宿主有害的蛋白质的情况下,由于不能严格控制所用启动子的表达,有时质粒本身的构建由于基因产物的表达而变得不可能。
作为解决上述问题的表达系统,开发了有利用大肠杆菌作为宿主和感染大肠杆菌的T7噬菌体的RNA聚合酶的PET系统(Novagen制)〔分子生学物杂志(J.Mol.Biol)189卷,113-130页(1986);基因(Gene),56卷,125-135页(1987)〕。pET系统使启动子识别特异性及转录活性高的T7RNA聚合酶在大肠杆菌中表达,并且该T7RNA聚合酶使表达载体上T7启动子下游配置的目的基因转录和高表达。由于是在T7RNA聚合酶的存在下进行目的基因的转录,只要该宿主不产生该聚合酶,不表达目的基因的情况下也可在宿主中进行质粒构建;如构建目的基因被置于由宿主RNA聚合酶所识别的启动子的控制之下这样的表达系统,则不同质粒构建本身不受到阻碍。
但是,由于T7RNA聚合酶基因己被克隆进入噬菌体载体并溶原进表达宿主,宿主就不能自由选择了,宿主的更换需要烦杂的操作。另外,由于宿主中T7RNA聚合酶表达不受严格控制,非诱导状态的宿主内T7RNA聚合酶也表达,结果引起配置在表达载体上T7启动子下游的目的基因在非诱导状态表达。为了使这种非诱导状下目的基因的表达降低,使用T7RNA聚合酶抑制剂即T7溶菌酶抑制T7RNA聚合酶活性〔分子生物学杂志(J.Mol.Biol)219卷,37-44页(1991)〕;或在T7启动子的下游放置乳糖操纵子以防止T7RNA聚合酶接触到T7启动子〔分子生物学杂志(J.Mol.Biol)219卷,45-59页(1991)〕。
但是,这些措施对转录活性高的T7RNA聚合酶不是很满意,不能完全抑制非诱导状态下T7RNA聚合酶的活性。因此,在目的基因产物对宿主致死的情况下,既使能构建质粒,也不能制备用于表达该基因的转化子。总之,PET系统中有两个问题需要解决,即宿主不能自由变更,和T7RNA聚合酶的表达控制不准确。
另一方面,当T7噬菌体性质类似的噬菌体有感染沙门氏菌属细菌(鼠伤寒沙门氏菌)的SP6噬菌体〔科学(Science,133卷,2069-2070页(1961)〕。SP6噬菌体生产的RNA聚合酶是分子量约10万的单一肽,由于其启动子识别特异性强转录活性也高,常将其用于体外RNA合成〔生物化学杂志(J.Biol.Chem)257卷,5772-5778页(1982)。生物化学杂志(J.Biol.Chem)257卷,5779-5788页(1982)〕。另外,已将SP6RNA聚合酶基因克隆进了大肠杆菌内,进行大量的表达〔核酸研究(Nucl.Acids.Res)15卷,2653-2664页(1987页)〕。
对宿主来说表达产物为致死性的基因的例子有限制性内切核酸酶基因。基本上,限制性内切核酸酶被用于通过对进入产限制性内切核酸酶的微生物细胞中的噬菌体和其它外源DNA进行切割以进行自身防御。另一方面,多数产限制性内切核酸酶的微生物产修饰酶,该修饰酶如这些限制性内切核酸酶一样识别相同的碱基序列,以保护其自身的DNA不受这些限制性内切核酸酶的切割。具体地,修饰酶通过向所识别的碱基序列中的一个或多个碱基上加上甲基基团修饰DNA,使与识别与修饰酶相同序列的限制性内切核酸酶结合并切割该DNA成为不可能。该机制称为限制修饰系统,构成限制修饰系统的限制性内切核酸酶和修饰酶基因对称为限制修饰系统基因。因此,当限制性内切核酸酶基因在缺少限制修饰系统基因中的修饰酶基因的微生物中表达时,微生物DNA被切割,导致细胞死亡。实际上,在MobI限制修饰系统基因中有两个修饰酶基因;已有报道,由于在另一修饰酶基因的共存下的不完全甲基化使宿主DNA修饰不完全,就不可能对限制性内切核酸酶基因进行克隆〔核酸研究(Nucl.Acids.Res)21卷,2309-2313页(1993)〕。
还有,如果在携带限制修饰系统基因的细胞中缺失限制修饰系统基因,细胞中修饰活性的缺失导致基因组DNA的不完全甲基化,如果是残留的非常小量的限制性内切核酸酶导致其自身基因组DNA的致死性断裂〔科学(Science)267卷,897-899页(1995)〕。总之,在缺少构成限制修饰系统的修饰酶的情况下,修饰酶代表对细胞非常有害的蛋白质;用现有技术分别克隆和表达其基因还是不可能的。
就限制性内切核酸酶来说,可根据酶特征分为三种类型I、II和III。具体地,II型限制性内切核酸酶,每一种识别特定的DNA碱基序列并在特定的位点或附近切割该序列,该型酶被广泛地用于基因工程领域,并且有各种特征的限制性内切核酸酶己从各种微生物中分离出来〔核酸研究(Nucl.Acids.Res)24卷,223-235(1996)〕。在本说明书中,下文中将II型限制性内切核酸酶称为“限制性内切核酸酶”。但是应该指出的是,一些微生物产生很少量的限制性内切核酸酶,而其它的微生物产生大量的限制性内切核酸酶。例如,限制性内切核酸酶AccIII由乙酸钙不动杆菌(下方称为Acc细菌)产生,该菌己于昭和60年11月9日(最初保藏日期)被以保藏号FERM BP-935保藏于通商产业省工业技术院微生物工业技术研究所〔地址日本茨城县筑城市谷田部镇东1丁目1番3号(邮区号305)〕,但是产生的酶量少且该微生物还同时产生限制性内切核酸酶AccI和AccII。因此,需要更先进的技术用该微生物高纯度和低花费的提供作为试剂的限制性内切核酸酶AccIII。在提供高纯度和低花费的作为试剂的限制性内切核酸酶时,可有效地利用基因工程技术分离目的限制性内切核酸酶基因和选择性大量生产目的限制性内切核酸酶。为此目的,己报道了一些分离限制性内切核酸酶基因的方法。
首先,要提到“鸟枪”法,其中将产限制性内切核酸酶微生物的基因组DNA用合适的限制性内切核酸酶切割,将得到的片段插入到合适的质粒载体中,并筛选一个表达该限制性内切核酸酶基因的克隆。筛选目的基因的方法可例举出这样一个方法,其中以导入了限制修饰系统基因的宿主所需要的自身防御功能为基础,以对噬菌体感染的抗性为指标,分离了限制修饰系统的基因〔美国国家科学院院刊(Proc.Natl.Acad.Sci)78卷,1503-1507页(1981)〕。但是,在本方法中,限制修饰系统基因的大小必须在允许分离的范围之内,并且所分离的限制修饰系统基因的表达表现出对噬菌体的足够的抗性,以允许宿主的选择性存活。另一方面,作为限制修饰系统基因的一般特征,应该提到在基因组上限制性内切核酸酶和修饰酶基因的较近的定位;实际上,在己获得的许多限制修饰系统基因中得到了确认〔核酸研究(Nucl.Acids.Res)19卷,2539-2566(1991)〕。因此,有这样一种方法,其中在上述特征的基础上,以修饰酶基因的表达作为指标筛选限制修饰系统基因〔特开昭63-87982核酸研究(Nucleic.Acids.Res)19卷,1831-1835页(1991)。但是,当限制性内切核酸酶基因不与修饰酶基因接近时,该方法不能产生限制性内切核酸酶基因。
而且,上述的“鸟枪”法有一个与基因组DNA来源生物体与宿主之间转录-译差异相关的基本问题。例如,由于伴随限制修饰系统基因启动子和核糖体的结合位点在宿主中很好的起作用的失败使基因不能充分表达时,即使得了也需要大量的劳动选择转化子。为了避免该缺点,有这样一种方法,其中分析了限制性内切核酸酶蛋白质的氨基酸序列,在所得序列的基础上以PCR为基础的DNA扩增方法,限制性内切核酸酶基因从产限制性内切核酸酶的微生物的基因组DNA得到,并且其中利用了已知的蛋白表达系统〔特开平6-277070〕。由于在常规的蛋白表达系统中限制性内切核酸酶的存在对宿主是致死的,就需要通过例如让构成限制修饰系统的修饰酶与该限制性内切核酸酶共存在以保护宿主。
尽管在上述的限制性内切核酸酶基因的分离方法中,在分离该基因的同时,还必须分离构成限制修饰系统基因的修饰酶基因,也已报道了只分离限制性内切核酸酶基因的分离方法〔核酸研究(Nucleic.Acids.Res)22卷,2399-2403页(1994)〕。但是,在该方法中,为了分离编码的限制性内切核酸酶,其酶活性的最适温度为约70℃的基因,当要分离的编码在接近培养温度时有高的比活性的限制性内切核酸酶的基因时,修饰酶基因的共存是必需的。
例外情况,象限制性内切核酸酶DpnI一样,除非其DNA识别序列中的特定的核酸碱基没有被甲基化修饰,其限制性内切核酸酶不表现出切割活性。具有该特性的限制性内切核酸酶基因被认为是例外是因为,即使在缺少另一个特定的基因时,通过选择合适的宿主生物体也可被分离。实际上,己分离了编码Mrr蛋白质的Mrr基因,该Mrr蛋白质不是II型限制性内切核酸酶并识别含甲基化核酸碱基的特定的碱基序列并具有DNA切割活性〔细菌学杂志(J.Bacterio1)173卷,5627-5219页(1991)〕。
如上所述,除了特殊情况,用现有技术分离限制性内切核酸酶基因,必须同时表达该基因和构成限制修饰系统基因的修饰酶基因。
发明公开因此,本发明的第一个目的是提供能分离此类基因并能导入宿主中有效表达蛋白质的质粒载体,因为该基因产物对宿主是致死的或有害的因此该基因的分离或表达系统的构建在现有技术中是有困难的。本发明的第二个目的是提供用该质粒载体表达目的基因的方法。本发明的第三个目的是提供用该质料载体分离目的基因的方法,特别是在不需要构成限制修饰系统的修饰酶基因的共存下分离限制性内切核酸酶基因。本发明的第四个目的是提供具有AccIII限制性内切核酸酶活性的多肽。另外,本发明的第五个目的是提供编码具有AccIII限制性内切核酸酶活性多肽的基因。
首先,为了解决pET系统中的问题,本发明人己构建了用SP6 RNA聚合酶作为新的精确的表达控制系统的表达系统并评估了该系统。
由于该表达载体是用将SP6RNA聚合酶基因导入了miniF质粒的系统质粒构建的,因此可通过向宿主中同时导入携带有克隆在SP6启动子下游的目的基因的表达载体和该系统质粒而将目的基因的表达系统构建在各种大肠杆菌菌株中。另外,应用lac启动子和反义技术,本发明人使在系统质粒上精确控制SP6RNA聚合酶基因的表达成为可能。用β-半乳糖苷酶基因作为报告基因评估该表达系统表明在该系统中SP6RNA聚合酶基因受到精确控制,并且在非诱导条件下几乎设有表达,并且在诱导之后有足够量的SP6RNA聚合酶,以有效地表达目的基因和随后高水平地表达该目的基因。
但是,己证明当所用的宿主是大肠杆菌时,由于SP6启动子非常弱但可被大肠杆菌RNA聚合酶精确识别,在非诱导条件下SP6启动子下游的目的基因表达量非常小。因此证明当基因产物对大肠杆菌非常有害和可致死时,表达系统的构建是不可能的,因此本发明的目的无法很好的实现。
有了这些发现,本发明进行了更广泛的调研并意外地发现(i)非诱导条件下目的基因的表达可被抑制到不可检测的水平,以及(ii)表达诱导增加了含目的基因的质粒的拷贝数并引起RNA聚合酶的表达,导致置于可被该RNA聚合酶识别的启动子下游的目的基因的转录和翻译,这是通过结合两种控制方法用新的控制目的基因的表达的系统进行的,即基因拷贝数的控制和通过启动子对转录进行控制。换句话说,本发明的质粒载体是具有独特的解决上述基因工程领域中问题的质粒载体。本发明人在此发现的基础上进行了更进一步的研究,并开发了用该载体表达目的基因的方法。
本发明人还开发了应用上述质粒载体分离其表达产物对宿主致死的基因的方法,更具体地说是一种分离限制性内切核酸酶基因的方法,但无现有技术的缺点。
本发明人还发现在设有AccIII修饰酶的共存下,能够分离以前尚未得到过的编码AccIII限制性内切核酸酶的DNA,并能用上述的方法大量表达AccIII限制性内切核酸酶。
即本发明的要点有(1)一种质粒载体,其特征在于包括一种控制目的基因表达的启动子序列,该启动子序列可被非宿主内在的RNA聚合酶识别,和一个在外源因子的诱导下可增加拷贝数的复制起点;(2)上述(1)中所述的质粒载体,其中启动子序列由来源于噬菌体的RNA聚合酶所识别;(3)上述(2)中所述的质粒载体,其中启动子序列被来源于SP6噬菌体的RNA聚合酶识别;(4)上述(3)中所述的质粒载体,其中启动子序列含序列表中SEQID NO30所示的碱基序列;(5)上述(1)到(4)任一项所述的质粒载体,其中复制起点在启动子的控制之下;(6)上述(1)-(5)任一项所述的质粒载体,其中复制起点在1ac启动子的控制之下;(7)上述(1)-(6)任一项所述的质粒载体,包括作为选择标记的药物抗性基因;(8)上述(7)中所述的质粒载体,其选自pACE601、pACE611、pACE701、pACE702;(9)一种质粒载体,其中氨被表达的目的基因被掺入到上述(1)至(8)任一项的质粒载体中;(10)一种表达目的基因的方法,其特征在于在宿主中导入了质粒载体,其中目的基因被掺入到了上述(1)至(8)任一项所述的质粒载体中,和识别质粒载体中的启动子序列的RNA聚合酶基因,并用外源因子诱导质粒载体拷贝数的增加和RNA聚合酶的表达以转录和翻译目的基因;(11)上述(10)中的表达目的基因的方法,其特征在于质粒载体的拷贝数的增加和RNA聚合酶的表达是由不同的外源因子诱导的;(12)上述(10)中所述的表达目的基因的方法,其特征在于质粒载体拷贝数的增加和RNA聚合酶的表达是由相同的外源因子诱导的;(13)上述(10)-(12)任一项所述的目的基因的表达方法,其中诱导质粒载体拷贝数增加的外源因子是选自添加异丙基-β-D-硫代半乳糖苷(IPTG),添加乳糖,添加半乳糖,阿拉伯糖的添加,色氨酸浓度的降低和转换子培养温度的调整中的一种或几种;(14)上述(10)-(12)任一项的目的基因的表达方法,其中诱导RNA聚合酶表达的外源因子是选自异丙基-β-D-硫代半乳糖苷(IPTG)的添加,乳糖的添加,半乳糖的添加,阿拉伯糖的添加,色氨酸浓度的降低和转换子培养温度的调整中的一种或几种;(15)上述(10)所述目的基因的表达方法,其特征在于其它的质粒载体或噬菌体将RNA聚合酶基因导入宿主中;(16)上述(10)中所述的目的基因的表达方法,其特征在于RNA聚合酶基因被整合到了宿主的染色体中;(17)上述(15)或(16)中所述目的基因的表达方法,其特征在于RNA聚合酶基因来源于SP6噬菌体;(18)上述(10)到(17)任一项所述的目的基因的表达方法,其中目的基因编码对宿主致死或有害的蛋白质;(19)上述(10)-(18)任一项所述的目的基因的表达方法,其特征在于大肠杆菌被用作宿主;(20)一种分离目的基因的方法,其特征在于上述(1)到(8)任一项所述的质粒载体被应用于目的基因的分离方法中;(21)上述(20)中所述的目的基因的分离方法,其中目的基因编码一种对宿主致死或有害的蛋白质;(22)上述(21)中所述的目的基因的分离方法,其中编码一种对宿主致死或有害的蛋白质的基因是一种限制性内切核酸酶基因;(23)一种多肽,其含有序列表中序列号1所示的氨基酸序列的全部或部分并具有AccIII限制性内切核酸酶活性;
(24)一种多肽,其具有由序列表中序列号1所示的氨基酸序列或其部分中一个或多个氨基酸残基的缺失,添加插入或置换之一得到的氨基酸序列,并具有AccIII限制性内切核酸酶活性;(25)一种编码多肽的RNA,该多肽含有序列表中序列号1所示的氨基酸序列的全部或部分,并具有AccIII限制性内切核酸酶活性;(26)一种DNA,其有序列表中序列号2所示的DNA的全部或部分的DNA,其中该DNA的表达产物具有AccIII限制性内切核酸酶活性;(27)一种编码多肽的DNA,该多肽是由序列表中序列号1中所示的氨基酸序列或其部分中一个或多个氨基酸残基的缺失,添加,插入或替代至少之一而得到的,并具有AccIII限制性内切核酸酶活性;(28)一种能与上述(25)到(27)中任一项所述的DNA杂交并编码一种具有AccIII限制性内切核酸酶活性多肽的DNA。
附图简述

图1示模板表达质粒pMSP6L和pMSP6F的组成。
图2示模板表达质粒pMSP60的组成。
图3(A),(B)示失控质粒pHS2870的构建程序。
图4示失控质粒pHS2870的组成。
图5(A),(B)示质粒pCRS04的构建程序。
图6示质粒pCRS04的组成。
图7示质粒pCRA19的组成。
图8(A),(B),(C),(D),(E)示系统质粒pFSP6的构建程序。
图9(A),(B)示质粒pACE601的构建程序。
图10示质粒pACE611的组成。
图11(A),(B)示质粒pACE611的构建程序。
图12(A),(B)示质粒pCRS70的构建程序。
图13(A),(B)示质粒pACE701和pACE702的构建程序。
图14示在将pFSP6和pACE601或pFSP6和pACE601-NspIII导入大肠杆菌HB101中之后,根据IPTG诱导或非诱导通过λ-DNA降解反应溶液琼脂糖凝胶电泳所示出的Nsp7524III限制性内切核酸酶的活性。在该图中,M指λ-EcoRT141大小标准;1指AvaI消化的λ-DNA;2指诱导后的HB101/pFSP6/pACE601;3指诱导前的HB101/pFSP6/pACE601;4指诱导后的HB101/pFSP601/pACE601NspIII;5指诱导前的HB101/pFSP6/pACE601-NspIII。
图15示在将pFSP6和pACE601或pSFP6和pACE601-NspIII导入大肠杆菌HB101之后,根据IPTG的诱导或非诱导对λ-DNA延长降解2和3小时后的琼脂糖凝胶电泳的结果。在该图中,M指λ-EcoT141大小标准;1指AvaI消化的λ-DNA;2指1小时(诱导)后的HB101/pFSP6/pACE601;3指2小时后(诱导)的HB101/pFSP6/pACE601;4指3小时后(诱导)HB101/pFSP6/pACE601;5指1小时后(非诱导)的IIB101/pFSP6/pACE601;6指2小时(非诱导)后的HB101/pFSP6/pACE601;7指3小时后(非诱导)的HB101/pFSP6/pACE601;8指1小时后(诱导)的HB101/pFSP6/pACE601-NspIII;9指2小时后(诱导)的HB101/pFSP6/pACE601-NspIII;10指3小时后(诱导)的HB101/pFSP6/pACE601-NspIII;11指1小时后(非诱导)的HB101/pFSP6/pACE601-NspIII;12指2小时后(非诱导)的HB101/pFSP6/pACE601-NspIII;以及13指3后(非诱导)的HB101/pFSP6/pACE601-NspIII。
图16示AccIII限制修饰系统基因的构建。
实施本发明的最佳方式本发明的第一个方面涉及质粒载体。更具体地说,本发明涉及一种质粒载体,其特征在于该质粒载体包含一个启动子序列,该启动子可被非宿主内在的RNA聚合酶识别并可控制目的基因的表达和在外源因子的诱导下可增加拷贝数的复制起点。质粒载体中所含可以控制目的基因的表达的启动子序列,它可以是任何启动子序列;可使用被特定的RNA聚合酶,例如来源于T7,T3,SP6和其它噬菌体的RNA聚合酶识别的启动子序列,优选被来源SP6噬菌体的RNA聚合酶所识别启动子序列。可被来源于SP6噬菌体的RNA噬菌体的RNA聚合酶识别的启动子即SP6启动子最小区域的碱基序列如序列表中序列号30所示。而且,该质粒载体还可含有作为选择标记的药物抗性基因。
本发明控制质粒载体拷贝数即作用于质粒载体复制起点的外源因子包括但不限于,例如添加各种化学物质如乳糖或结构相关物质象异丙基-β-D-硫代半乳糖苷(IPTG)半乳糖或结构相关物质,以及阿拉伯糖或结构相关物质;色氨酸浓度的降低;和转化子培养温度的调整。通过将复制起点置于可被这些因子控制的启动子的控制之下,使拷贝数的控制成为可能。可用于此目的启动子只要能达到此目的即可无特别限制,例如当用大肠杆菌作宿主时可用lac、trp、tac、gal、ara、和PL启动子等。这些启动子也可用于诱导RNA聚合酶基因的表达。
本发明质粒载体复制起点的例子包括但不限于如在lac启动子的控制之下用作失控质粒复制起点的质粒载体。在这种情况下,拷贝数的控制是通过添加乳糖和结构相关物质,特别是优选添加异丙基-β-D-硫代半乳糖苷(IPTG)实现的。
本发明的第二方面涉及表达目的基因的方法,其特征在于将本发明的由整合目的基因进入质粒而制备的质粒载体和识别质粒载体上的启动子序列的RNA聚合酶基因导入宿主中,并用外源因子诱导质粒载体拷贝数的增加和RNA聚合酶的表达以转录和翻译目的基因。识别质粒载体上启动子序列的RNA聚合酶基因包括但不限于来源于上述噬菌体的RNA聚合酶基因,优选来源于SP6噬菌体的RNA聚合酶基因。诱导此类RNA聚合酶表达或质粒载体拷贝数增加的外源因子包括但不限于例如添加各种化学物质,如乳糖或结构相关物质异丙基-β-D-硫代半乳糖苷(IPTG),半乳糖或结构相关物质,以及阿拉伯糖或结构相关物质;色氨酸浓度的降低;以及转化子培养温度的调整。
质粒载体拷贝数的增加和RNA聚合酶表达的诱导由不同的外源因子或相同的外源因子的作用实现。而且,在这种情况下,编码RNA聚合酶的基因可被整合到宿主的染色体上,或由本发明的质粒载体以外的其它质粒载体或噬菌体载体导入宿主中。在后者,可根据目的适当的改变宿主。在该情况下,含RNA聚合酶基因的载体向宿主中的导入可在导入本发明的质粒载体之前或之后进行。
尽管本发明的目的基因不受限制,但只有在其编码的蛋白对宿主致死或有害时,才有意义。此类蛋白质包括,例如上述的限制性内切核酸酶,其它核酸酶,核酸结合蛋白和蛋白酶。
本发明提供了一种通过两种控制方法联合控制目的基因表达的系统,即对基因拷贝数的控制和如上所述通过启动子对转录的控制,不同于常规方法,对克隆至本发明的质粒中的目的基因表达的控制是非常严紧的,在非诱导条件下其表达可被抑制至不可检测的水平。通过表达诱导当质粒的拷贝数增加时,即目的基因的拷贝数增加时,随着RNA聚合酶的同时表达,通过RNA聚合酶的作用,目的基因即在启动子的控制下转录和翻译。
因此可用本发明的质粒制备含对宿主致死或有害的基因的转化子并表达该基因,这是现有技术难以实现的。
例如,当用本发明的质粒载体尝试克隆编码Nsp7524III限制性内切核酸酶的基因时,在设有对应的修饰酶基因共存下,该基因被成功的保持在大肠杆菌中,还可通过将含RNA聚合酶基因的系统质粒导入该转化子中诱导Nsp7524III限制性内切核酸酶的表达,从而可在得到转化子的细胞中表达Nsp7524III限制性内切核酸酶。
另外,用本发明的质粒载体作为克隆载体制备基因文库,就可分离用常规方法不能分离的基因,并确定在单一宿主中其表达产物的活性。当然,本发明的质粒载体的用途不限于克隆编码对宿主有害产物的基因,而且可用作普通目的的质粒载体。
可用,例如,质粒pFSP6和噬菌体M13sp6将本发明的RNA聚合酶基因导入宿主中。质粒pFSP6构建的细书如参考实施例(2)所示。用该质粒转化的大肠杆菌HB101命为HPB101/pFSP6,己于平成7年12月22日(原保藏日)保藏于通商产业省工业技术院生命工学工业技术研究所〔地名日本茨城县筑城市东1丁目1番3号(邮区号305)〕保藏号FERMBP-5742。噬菌体M13sp6的构建方法见实施例2(b)中所述。
下面以质粒pFSP6为例,更详细地说明本发明。
首先描述的是用己构建的多拷贝模板表述质粒pMSP6L,pMSP6F(图1)和pMSP60(图2)进行实验的结果,所有的模板表达质粒含有可被SP6RNA聚合酶识别的启动子序列和作为报告基因的β-半乳糖苷酶基因,并且都可用上述的系统质粒pFSP6表达目的基因。
模板表达质粒的构建实例参考实施例(3)所示。这些质粒分别整合有SP6启动子的最小区域(pMSP6L),内在的SP6启动子区域(pMSF6F),或SP6启动子最小区域和lac操纵子区域(pMSP60),作为SP6质粒序列。
当质粒pMSP6L或pMSP6F被单独导入如表1中所示的大肠杆菌菌株中时,如表2中所示,尽管宿主大肠杆菌不表达SP6RNA聚合酶,观察到了β-半乳糖苷酶活性,其量比用不含SP6启动子的质粒pMS434得到的要高。简而言之,可以推测SP6启动子被来源于大肠杆菌的RNA聚合酶识别,并且其下游的β-半乳糖苷酶基因被转录和翻译,还有,当大肠杆菌MRi80被用作宿主时,β-半乳糖苷酶的活性也降至MRi7的1/7到1/14,其中象上述的表达质粒模板一样,该菌株在pcnB基因中有突变并且其中具有来自ColE1的复制起点的质粒的拷贝数减少至本菌株MRi7的1/6到1/13。这提示了β-半乳糖苷酶基因表达水平和所导入的质粒的拷贝数之间的相关。
表1

接下来,如表3所示,当将同样的模板表达质粒当上述的系统质粒pFSP6一起导入大肠杆菌中并在SP6RNA聚合酶基因未被诱导表达时测定β-半乳糖苷酶活性,发现半乳糖苷酶的活性和在不含系统质粒的大肠杆菌中得到的一样高。这表明在非诱导条件下,质粒pFSP6上SP6RNA聚合酶基因的表达几乎被完全抑制。另一方面,当SP6RNA聚合酶基因

(?)未确定实施例4下面的实验可检测在病情不再进展的病人体内的中和多种HIV分离株,尤其是BRU和NDK的抗体,同样的病人有抗-R7V抗体。这可以使中和作用与经过本发明治疗产生抗体的预防HIV的特性显示出较好的相关性。材料与方法MT4细胞的培养MT4是无限增殖化细胞(CD4+),对HIV的致细胞病变效应非常敏感,是由成人的T白血病中衍生的细胞。细胞在补加10%胎牛血清,1%谷氨XbaI位点而得到质粒pHS2870,其中RNA1870片段是用靠近RNAII区排列的(质粒的复制起点)RNAIIA引物(碱基序列如序列表中序列号5所示)和靠近106NdeI序列的末端的1870引物(碱基序列如序列表中序列号6所示)和用该质粒为模板通过PCR得到的。如此构建的质粒pHS2870如图4所示。通常,该质粒以每个大肠杆菌细胞约30个拷贝存在,但是IPTG的添加使该拷贝数增加到几百个。
然后从该质粒中去除含有衍生自质粒pSTV28的P15A复制起点的AccI-NspI片段(质粒pCRS01),接着进一步删去含非必需的限制性内切酶位点的EcoRI-XbaI片段(质粒pCRS02),之后再导入来源于质粒pMJR1560〔基因(gene)51卷,225-267页(1987)〕的含乳糖阻遏子(lac Iq)基因的DNA片段以产生质粒pCRS04。从质粒pHS2870构建质粒pCRS04的流程图如图5所示。如此构建的质粒pCRS04如图6所示。该质粒是一个被IPTG诱导的失控质粒,该质粒在每个大肠杆菌细胞中的拷贝数是1-2个拷贝,但是IPTG的添加使该拷贝数增加至几百个。
为了控制己被插入至质粒中的目的基因的表达,Psp6-Olac EX接头,即含SP6启动子序列和lac操纵子序列的双链寡核苷酸,可被导入到质粒的NheI位点以构建质粒pACE601。Psp6-Olac接头是从其碱基序列如序列表中序列号7和8所示的两个DNA链制备而来的。质粒pACE601是含有作为选择标记的氯霉素抗性基因的失控质粒载体。
并且,通过将含有来源于质粒体pUC118(宝酒造社制)的β-半乳糖苷酶基因的BspHI片段导入至上述质粒pCRS04的NheI位点(质粒pCRS70),接着去除含氯霉素抗性基因的NcoI-BsaAI片段,并用上述的Psp6-Olac接头置换,构建了质粒pACE701和pACE702,在这两个质粒中接头以相互相反的方向插入。这些质粒是含有作为选择标记的氨苄青霉素抗性基因的失控质粒载体。
如上所述,可用β-半乳糖苷酶基因作为报告基因测定上述得到的质粒pACE601、pACE701和pACE702控制目的基因表达潜力。可通过将β-半乳糖苷酶基因的DNA片段导入上述三质粒的每一种的SP6启动子下游的NcoI位点而构建模板表达质粒,该DNA片段是用引物trpA-N-NcoI和lacZ-C-NcoI以质粒pMS434〔基因(gene),57卷,89-99页(1987)〕为模板通过PCR扩增得到的。引物trpA-N-NcoI和lacZ-C-NcoI的碱基序列分别如序列表中序列号9和10所示。由此得到质粒被分别命名为pACE601Z,pACE701Z和pACE702Z。在用这些模板质粒转化的大肠杆菌中,绝对未检测到β-半乳糖苷酶的活性,表明了对β-半乳糖苷基因表达的精确控制。
使用Nsp7524III限制性内切酶基因,可以证明可用本发明的质粒分离和表达其表达产物对宿主致死的基因。质粒pBRN3含有Nsp7524III限制修饰系统基因。用该质粒转化的大肠杆菌MC1061,命名为大肠杆菌MC1061/pBRN3,己于平成7年9月28日(原保藏日)保藏于通商产业省工业技术院生命工学工业技术研究所〔地址日本茨城县筑城市东1丁目1番3号(邮区号305)〕,保藏号FERM BP-5741。以引物对L-ORF种NspR-ORF和从转化子制备的质粒pBRN3模板通过PCR为基础的DNA扩增,可得到只含Nsp7524III限制性内切酶基因的DNA片段。引物L-ORF和NspR-ORF的碱基序列分别如序列表中序列号11和12所示。通过向大肠杆菌HB101中导入质粒pACE601-NspIII,可得到转化子大肠杆菌HB101/pACE601-NspIII,其中的质粒是通过将得到的DNA片段插入到上述质粒pACE601 SP6启动子下游的NcoI位点而得到的。尽管缺乏Nsp7524III修饰酶基因,转化子也可使宿主稳定的保持有Nsp7524III限制性内切酶基因。
而且,可以通过将上述的系统质粒pFSP6导入该转化子从而制备转化子大肠杆菌HB101/pFSP6/pACE601-NspIII。通过培养转化子和在合适的时间添加IPTG诱导表达,在培养中产生Nsp7524III限制性内切酶的可能性即可被证实。
本发明的第三个方面提供了分离目的基因的方法,其特征在于使用了上述的质粒载体。本发明的分离方法特别适用于其表达产物是对宿主致死或有害的基因的分离,特别是限制性内切酶基因。使用本发明的方法,可以分离以前尚未分离的限制性内切酶基因,例如在甚至缺少AccIII修饰酶基因时分离AccIII限制性内切酶。限制性内切酶基因的分离不仅可使用“鸟枪法”而且可以使用产限制性内切酶微生物基因组DNA的盒式文库;而所谓的“鸟枪法”是产目的酶的微生物的基因组DNA被合适的限制性内切酶切割并且得到的DNA片段被有接插入到例如质粒pACE611中。通过用盒式文库为模板以DNA扩增获得一个基因,就可能表达一个从其转录机制不同于宿主的微生物中制备而来的基因。用盒式文库分离限制性内切酶基因的方法的描述,可参照一个包括AccIII限制性内切酶的实施例。
产AccIII限制性内切酶的微生物即Acc细菌基因组DNA盒式文库的制备如下从Acc细菌培养物中提取基因组DNA,并用合适的限制性内酶消化,之后将得到的DNA片段当含有与该片段有互补突出来末端的盒相连。用不同的限制性内切酶制备基因组DNA断裂物的几个类似的盒式文库。通常将这些文库称为Acc基因组盒式文库。其次,从Acc细菌纯化得到的目的限制性内切酶,其氨基酸序列被部分确定,并在此序列的基础上合成了一个引物。使用该引物和盒式引物,以每个盒式文库为模板进行以PCR为基础的DNA扩增反应,以得到含AccIII限制性内切酶基因片段的DNA片段。可通过,例如直接对PCR产物测序确定所得到的DNA片段的碱基序列,以确定AccIII限制性内切酶基因的全长碱基序列。
通过从该碱基序列设计一个能扩增AccIII限制性内切酶基因全长序列的引物,并使用该引物以Acc细菌基因组DNA为模板进行基于PCR的DNA扩增反应,即可获得了含AccIII限制性内切酶基因全长序列的DNA片段。获得的DNA片段被插入到质粒pACE611SP6启动子的下游使密码子框被调整,并将得到的重阻质粒导入例如大肠杆菌JM109中以产生转化子。通过培养各转化子,用本发明的基因表达方法诱导基因表达,并测定得到的各培养物的AccIII限制性内酶活性,以及画出被各转化子携带的质粒DNA的限制性内切酶图谱,即可在可表达条件下对含AccIII限制性内切酶基因的转化子进行筛选。
由此得到的AccIII限制性内切酶基因被准确地插入到质粒pACE611中,并将得到的质粒命名为pCRA19该质粒的限制性内切酶图谱如图7所示,其中粗实线指含AccIII限制性内切酶基因的DNA片段。整合有质粒pCRA19的大肠杆菌JM109,被命名为大肠杆菌JM109/pCRA19,己于平成8年5月28日(原保藏日)保藏于通商产业省工业技术院生命工学工业研究(地址日本茨城县城市东1丁目1番3号(邮区号305)],保藏登记号FERM BP-5743。尽管该转化子中缺少-AccIII修饰酶基因,它稳定地保持有该限制性内切酶基因。通过上述的方法,不需要构成限制修饰系统基因的修饰酶基因的共存,即可分离限制性内切酶基因。
本发明的第四个方面提供了具有AccIII限制性内切酶活性的多肽。
在本说明书中,在一些情况下术语AccIII限制性内切酶可作为具有AccIII限制性内切酶活性多肽的通用术语。例如,本发明的限制性内切酶包括序列表中序列号1所示的氨基酸序列。
不局限于上述,本发明的限制性内切酶还包括含序列表中序列号1所述全部氨基酸序列或部分序列并有AccIII限制性内切酶活性的多肽。而且,具有由序列表中序列号1所示氨基酸序列的全部或部分缺失,添加,插入或取代一个或多个氨基酸残基中的至少之一而得到并有AccIII限制性内切酶活性的多肽也在本发明的范围之内。
通常,由于体内或纯化中的蛋白质的修饰以及由于编码该蛋白质的基因的多型性或变异天然存在的蛋白质在其氨基酸序列中有氨基酸残基的缺失,插入,添加,取代或其它变异。但无论如何,己知有一些多肽在生理或生物活性上与无变异的蛋白质基本等价。因此,这些与相应的蛋白质结构上不同,但与该蛋白质在功能或活性上无显著差异的多肽也在本发明的范围之内。而且当人工向该蛋白质的氨基酸序列中导入变异时,也是相同的,并且可产生更多样化的变异体。例如,据报道在于大肠杆菌中表达的蛋白质的N末端的甲硫氨酸常常由于甲硫氨酸氨肽酶的作用而被去除,但依据不同的蛋白质类型并不是都去除,由此一些表达蛋白有甲硫氨酸残基而其它的蛋白质却没有。但是,在大多数情况下,甲硫氨酸残基和存在与否不影响蛋白质的活性,还已知在人白介素2(IL-2)的氨基酸序列中用特定的丝氨酸取代半胱氨酸得到的多肽仍保持着IL-2的活性〔科学(Science,224卷,1431页(1984)〕。
另外,在用基因工程技术生产目的蛋白时经常将目的蛋白表达为融合蛋白。例如,来源于另一个蛋白质的N未端肽链被添加到目的蛋白的N未端以增强目的蛋白表达,或者通过向目的蛋白的N或C未端添加合适的肽链表达该蛋白使用时添加的蛋白有亲合性的载体以易化目的蛋白的纯化。因此,尽管该多肽的氨基酶序列与本发明的AccIII限制性内切酶的有部分不同,只要其具有与本发明的限制性内切酶基本等价的活性,该多肽就属于本发明的范畴。
AccIII限制性内切酶的获得可以通过,例如,培养上述含AccIII限制性内切酶基因的转化子大肠杆菌JM109/PCRA19,在培养的合适时间添加诱导剂IPTG以增加pCRA19的拷贝数,随后用噬菌体M13sp6感染进行。
从转化子培养物中收获AccIII限制性内切酶可以通过,例如,从培养物中收集细胞,随后通过起声破碎,超速离心等提取酶,并接着结合核酸去除,盐析,亲合层析,凝胶过滤,离子交换层析等纯化该酶。由于作为该纯化起始物质的上述培养中不含有其它的限制性由切酶如AccI和AccII,可比其它常规纯化方法更容易得到目的纯度的酶制品。
本发明的第五个方面提供了编码具有AccIII限制性内切酶活性的多肽的DNA。
本发明的DNA编码具有限制性内切酶活性的多肽,包括例如编码序列表中序列号1所示氨基酸序列的DNA还包括但不局限于包括序列表中序列2中所述碱基序列的DNA。具体地说,下述的DNA在本发明的范围之内(1)编码一种多肽的DNA,该多肽含有序列表中序列号1所述的氨基酸序列的全部或部分并具有AccIII限制性内切酶活性;(2)含有序列表中序列号2中所示的DNA的全部或部分,其中该DNA的表达产物具有AccIII限制性内切酶活性;(3)编码一种多肽的DNA,该多肽是由序列表中序列号1的氨基酶序列或其部分中一个或多个氨基酸残基的缺失,添加,插入或取代而得到的并具有AccIII限制性内切酶活性;以及(4)能与上述(1)-(3)中的DNA杂交并编码具有AccIII限制性内切酶活性等的DNA。
另外,如果用上述得到的DNA作为探针在严紧的条件下进行杂交,可得到与以上所得到的DNA序列号2)类似但都有些不同但又编码有相同酶活性的多肽的DNA。这样的DNA也包括在本发明的范围之内。
此类严紧条件指例如,固定有DNA的膜被在含有6×SSC(1×SSC是在1升水中含8.76g NaCl和4.41g柠檬酸钠的溶液),1%SOS,100μg/ml醋精DNA0.1%牛血清白蛋白,0.1%聚乙烯吡咯烷酮和0.1%Ficoll的溶液中,在65℃温育20小时。
通过杂交获得编码AccIII限制性内切酶的类似的DNA的各种方法包括,例如如下的方法。
首先,通过常规方法将从合适的基因源得到的DNA与质粒或噬菌体载体连接以产生DNA文库。该文库被导入合适的宿主中;得到的转化子培养在平板上;长出的克隆或噬菌斑被转移至硝酸纤维素或尼龙膜上并变性,之后将DNA固定到膜上。在上述的条件下,将这些膜在含预先用32P标记的探针等组成的上述溶液中温育杂交(所用探针可以是编码序列表中序列号1所示氨基酸序列的全部或部分的任意多核苷酸,代表性的多核苷酸由序列表中序列号2的碱基序列的全部或部分组成,或包含之)。杂交结束后,洗掉非特异性结合的探针,之后进行放射自显影等,以识别己与探针杂交的克隆。重复该方法直至目的杂交克隆被分离。由此得到的克隆保持有编码具有目的酶活性的多肽的DNA。
通过例如,下述方法确定得到的DNA的碱基序列以确证其编码目的酶蛋白质。
为了碱基测序,将转化子培养在试管中,当宿主是大肠杆菌,并且用常规方法制备了质粒,前提是转化子是用质粒制备的,当用得到的质粒为模板或在将插入片段取出并亚克隆入M13噬菌体载体中之后,用双脱氧法确定碱基序列,在用噬菌体载体制备转化子的情况下,也可用基本相同的方法确定碱基序列。
这些从培养到碱基测序的基本实验方法在例如,《分了克隆实验手册》(Molcular.CloningA Laboratory Manual,1982,T.Maniatis等冷泉港实验室出版社出版)中有描述。
不管如何,通过将所确定的碱基序列与序列表中序列号2所示的碱基序列相比较,或将由所确定的碱基序列推导而来的氨基酸序列与序列表中序列号1所示的氨基酸序列相比较,可以证实所得到的DNA与编码目的AccIII限制性内切酶的DNA类似。
当得到的DNA不含目的限制性内切酶编码区的全部时,可以通过在所得DNA碱基序列的基础上合成引物,并用该引物通过PCR扩增缺失区域,或者用得到的DNA片段为探针重复筛选DNA文库而得到整个编码区。
可以制备含由此所得编码AccIII限制性内切酶的类似DNA的转化子,使转化子表达该DNA所编码的酶蛋白,并纯化所表达的酶蛋白。转化子的制备以及酶蛋白的表达和纯化都可用本发明的质粒完成。这样得到的酶蛋白保留有AccIII限制性内切酶活性。
另外,AccIII修饰酶以及编码该酶的DNA,此二者在目前尚未得到,也可用上述的编码AccIII限制性内切酶基因的DNA得到。
例如,根据在许多情况下限制性内切酶基因与修饰酶基因位置靠近,该目的可如下实现用盒式文库为模板通过DNA扩增反应得编码靠近限制性内切酶基因的蛋白质的基因区,将其导入合适的表达载体使基因表达。并用合适的方法确定AccIII修饰酶活性。还可根据,例如从该转化子制备的DNA对AccIII限制性内切酶断裂活性的抗性,确认AccIII修饰酶活性。只要测定了上述基因区的碱基序列以证实它与已知的限制修饰系统的修饰酶基因之间保守区同源〔分子生物学杂志(J.Mol.Biol)206卷,305-321页(1989)〕,就可基因表达之前在一定程度上预料到该基因是修饰酶基因。
通过使用上述的Acc细菌基因组DNA的盒式文库,可得到AccIII修饰酶及编码它的DNA。其氨基酸序列和碱基序列分别如序列表中序列号13和14所示。
本文的AccIII修饰酶不仅限于如上所述。如在AccIII限制性内切酶说明中所指出的,它是一个含有序列表中序列号13所述的氨基酸序列的全部或部分并有AccIII修饰酶活性的多肽。而且,由序列表中序列号13的氨基酸序列或其部分的一个或多个氨基酸残基的缺失,添加,插入或取代至少之一而得到并具有AccIII修饰酶活性的多肽也在本发明的范畴之内。
本发明的AccIII修饰酶编码DNA包括编码序列表中序列号13所述氨基酸序列的DNA,还包括,但不局限于,例如,包含序列表中序列号14碱基序列的DNA。具体地说,下述的DNA在本发明的范畴之内。
(1)编码一种多肽的DNA,该多肽含有序列表中序列号13中所述的氨基酸序列的全部或部分并具有AccIII修饰酶活性;(2)含有序列表中序列号14所示DNA的全部或部分的DNA,其中该DNA的表达产物具有AccIII修饰酶活性;(3)编码一种多肽的DNA,该多肽是由序列表中序列号13的氨基酰序列或其部分中的一个或多个氨基酰残基的缺失,添加,插入或取代至少之一而得到并具有AccIII修饰酶活性;以及(4)能与上述(1)(3)中所述的DNA杂交并编码具有AccIII修饰酶活性等多肽的DNA。
下文将通过参考实施例和工作实施例更详细地描述本发明,这些实施例并不是限制性的。在本文所述的方法中,一些基本的如质粒制备,限制性内切酶消化等是根据《分子克隆实验手册》,第二版(MolcuelarCloning.A Laboratory Manual2nded.),T.Maniatis等编,冷泉港实验室出版社出版中所述的方法实现的。
参考实施例(1)培养基和培养条件将大肠杆菌用LB培养基(1%蛋白胨,0.5%酵母提取物,0.5%NaCl,pH7.0)在37℃通气培养。根据大肠杆菌所携带的质粒向培养基中各自加入各种抗生素pFSP6加入卡那霉素25μg/ml,pXX325加入氨苄20μg/ml,对氨苄抗性的Col E1型质粒加入50μg/ml氨苄,以及对氨苄抗性的pUC型质粒加入100μg/ml氨苄。在表达诱导实验中,将培养至平台期的培养肉汤以1%接种到新鲜培养基中,然后于37℃通气培养,之后在达到OD6000.6时(6×108细胞/ml)加入异丙基β-D半乳糖苷(IPTG)至终浓度0.2mM,接着进一步培养。
(2)系统质粒pFSP6的构建根据图8所示的方法,用大肠杆菌JM109为宿主构建系统质粒pFSP6。用HindIII(宝酒造社制)消化质粒pSP6-2[核酸研究,15卷,1653-2664页(1987)]并使两个末端平齐,之后进一步用BamHI(宝酒造社制)消化以产生一个约2.8kb的含SP6 RNA聚合酶基因的DNA片段,将该片段与预先用Bam HI和HincII(宝酒造社制)消化的质粒载体使pUC18(宝酒造社制)混合以便连接构建质粒pUCSP。其次,将质粒PMJR1560[基因(gene),51卷,225-267(1987)]用KpnI消化并使其两个末端平齐化,之后进一步用PstI(由宝酒造社制)消化以生产一个约1.3kb的含lacIq基因的DNA片段,然后将其分离。将上述的质粒pUCSP用HindIII消化并使两个末端平齐,之后进一步用PstI消化以产生一个DNA片段,将该DNA片段与上述的约1.3kb DNA片段混合连接以构建质粒pUCSPlac。
而且,将一个由用PstI消化pUCKm[分子生物学杂志(J.mol.Biol)47卷,217-226页(1981)]得到的含有卡那霉素抗性基因的约1.5kb的DNA片段,导入上述质粒pUCSPlac的PstI位点以构建质粒pUCSPlacKm。用AatII(东洋纺社制)消化该质粒,之后用NspI(宝酒造社制)部分消化以分离一个约6.5kb的DNA片段,然后使其两端平齐。
另一方面,用HindIII消化质粒pXX325[美国图象科学院院刊(Proc.Natl.Acad.Sci.USA),80卷,4784-4788页(1983)]并使两端平齐,之后进一步用SalI消化以产生一个含mimiF质粒复制起点的约6.8kb的DNA片段,将该片段与上述的约6.5kb的DNA片段混合连接以构建质粒pFSP6。用该质粒转化大肠杆菌HB101以形成大肠杆菌HB101/pFSP6。
(3)多拷贝模板表达质粒的构建从其碱基序列如分别从序列表中序列号15和16所示的两条DNA链制备了Psp6接头,它含SP6启动子最小区的双链寡核苷酸,将它们与事先用XhoI(宝酒造社制)和HindIII消化的质粒pMS434[基因,(gene),57卷,89-99页(1987)]混合连接以构建模板表达质粒pMSP6L,该质粒中在β-半乳糖苷酶基因的上游插入了上述的启动子序列。
另一方面,可通过将含有用AccII和HindIII消化pSP64[核酸研究,12卷,7035-7056(1984)]而得到的内在SP6启动子序列的DNA片段导入至上述质粒pMS434的XhoI-HindIII位点,从而构建了模板表达质粒pMSP6F(图1)。而且,含有SP6启动子最小区和lac操纵子区的Psp6-Olac接头被插入到上述质粒pMS434的XhoI-HindIII位点,从而构建了模板表达质粒pMSP60(图2),其中,Psp6-OLac接头是从其碱基序列分别如序列表中序列号17和18所示的两条DNA链制备而来的。
(4)SP6启动子对大肠杆菌RNA聚合酶的启动子活性参考实施例(3)中构建的质粒pMSP6L和pMSP6F和作为对照的不合SP6启动子序列的质粒pMS434,被各自导入了表1中所示的大肠杆菌中。用参考实施例(1)的方法分别培养得到的转化子,之后各自收集对数生长期的细胞培养肉汤。用一部分测定收集的各培养肉汤的OD600值,而将剩下的部分转移到预冷的试管中并补加氯霉素至终浓度为100μg/ml。用该培养肉汤作样品,用J.H.Miller所编的《分子遗传学实验》(Experiments in Molecular Genetics)冷泵港实验室出版社出版,1972中所述的方法,测定β-半乳糖苷酶活性。
如表2所示,整合有模板表达质粒pMSP6L或pMSP6F的大肠杆菌MC4100,其中上述二质粒都指带有含SP6启动子的序列,表现出相似的低β-半乳糖苷酶活性,尽管其中插入启动子序列。但是,整合的不含SP6启动子的质粒pMS434表现出更低的酶活性。另外,对比作为宿主的大肠杆菌MRi7和MRi80发现MRi80中β-半乳糖苷酶活性降低了,其中该质粒的拷贝数也减少了。
(5)系统质粒pFSP6的评价将参考实施例(4)中制备的其中进行导入了系统质粒PFSP6的转化子,用参考实施例(1)中所述的方法培养,测定IPTG加入前后非诱导条件下和诱导条件下的β-半乳糖苷酶活性。结果如表3所示。在非诱导条件下,所有的转化子所表现出的β-半乳糖苷酶活性都与表2中所示的不存在质粒pFSP6时得到的水平相似。
另一方面,随着IPTG添加的诱导,与非诱导条件下的相比,整合有质粒pMSP6L和pMSP6F的转化子的β-半乳糖苷酶活性是18到32倍,而在整合了质粒pMS434的转化子中无活性的增加。
(b)Lac操纵子的表达控制作用用参考实施例(1)所述的方法培养由向整合有质粒pFSP6的大肠杆菌MC4100中分别导入质粒pMSP6L,pMSP6F,pMSP60和pMS434而得到的转化子,测定了非诱导条件β-半乳糖苷酶的活性。结果如表4所示。尽管活性水平比用质粒pMSP6L和pMSP6F得到的转化子低,但是整合了含lac操纵子序列的质粒pMSP60的转化子仍表现出一些β-半乳糖苷酶活性。简而言之,通过简单地导入lac操纵子序列不能完全抑制非诱导条件下的表达

实施例1(1)培养基和培养条件用LB培养基(1%蛋白胨,0.5%酵母提取物,0.5%NaCl,pH7.0)于37℃通气培养大肠杆菌。根据大肠杆菌所含质粒向培养基中各自加入各种浓度的抗生素,具体如下pFSP60加入卡那霉素25μg/ml,氨苄抗性Col E1型质粒加入氨苄50μg/ml,氨苄抗性pUC型质粒加入氨苄100tg/ml,氯霉素抗性失控质粒加入氯霉素30μg/ml,和氨苄抗性失控质粒加入氨苄30μg/ml。在表达诱导实验中,培养至平台期得到的培养肉汤以1%加入到新鲜培养基中,然后在37℃通气培养,之后在达到OD600值为0.6(6×108细胞/ml)时添加异丙基-β-D-硫代半乳糖苷(IPTG)至终浓度为0.2mM;接着进一步进行培养。
(2)失控质粒pHS2870的构建表达质粒构建基础上形成的失控质粒pHS2870,以图3中所示的方法构建。将从其碱基序列分别如序列表中序列号3和4所示的两条DNA链制备而来的106 Nde I.DNA片段与预先用NdeI消化的质粒载体pUC19混合以便连接。将由此得到的质粒pUC106A用PvuII消化并进行自身连接以产生质粒pUC106AdPO。用该质粒为模板,使用RNAIIA引物(其碱基序列如序列表中序列号5所示)和1870引物(其碱基序列如序列表中序列号6所示)进行PCR以产生一个扩增的DNA片段,然后将其用XbaI消化并与预先用XbaI消化的质粒pSTV28混合连接以产生质粒pHS2870。质粒pHS2870的构建如图4所示。
(3)构建失控制质粒pCRS04在用AccI(宝酒造社制)和NspI消化之后,将上述的质粒pHS2870两端平齐并进行自身连接以产生质粒pCRS01,该质粒缺失P15A复制起点。然后用EcoRI(宝酒造社制)和XbaI消化该质粒,之后用如上同样的方式使其两端平齐并进行自身连接以产生质粒pCRS02。在将用KpnI(宝酒造社制)和PstL消化质粒pMJR1560得到的约1.2kb DNA片段两末端平齐之后,将其与预先用NspV和VspI(均由宝酒造社造)消化并且两端平齐的上述质粒pCRS02混和,连接以产生质粒pCRS04。构建质粒pCRS04的流程图如图5所示,而构建质粒pCRS04的构建如图6所示。
(4)失控表达载体pACE601的构建将上述的预先用NheI(宝酒造社造)消化并随后使两未端平齐的质粒pCRS04与Psp6-OlacEX接头混合,连接以构建质粒pACE601,其中Psp6-OlacEX接头由两条其碱基序列如序列表中序列号7和8所示的DNA链制备而来。质粒pACE601的构建流程图如图9所示。这些质粒的构建选用大肠杆菌JM109为宿主的。
(5)失控表达载体pACE611的构建将失控表达载体pACE601用XhoI-HmdIII消化,并将由序列表中序列号15和16所示的合成Oligo-DNA,组成的Psp6接头插入到其中的位点中以构建失控表达载体pACE611,pACE611构建物如图10所示。质粒pACE611的构建流程图如图11所示。
(6)失控表达载体pACE701和pACE702的构建用BspHI(由NEB产)消化质粒载体pUC118(宝酒造社制)并使其末端平齐而得到的一个约1kb的DNA片段,之后将其与上述的预先用NheI消化并使末端平齐的质粒pCRS04混合,以连接构建质粒pCRS70。质粒pCRS70构建的流程图如图12所示。其次,用NcoI(宝酒造社制)和BsaAI(NEB制)消化该质粒,之后使两末端平齐并与上述的Psp6-OlacEX接头混合,以连接构建两个质粒pACE701和pACE702,该两个质粒以相互相反的方向整合了所插入的接头。质粒pACE701和pACE702的构建流程图如图13所示。使用了大肠杆菌作为这些质粒构建的宿主。
(7)模板失控表达质粒的构建以上述的质粒pMS434为模板,使用引物trpA-N-NcoI和lacZ-C-NcoI进行PCR,以产生含β-半乳糖苷酶基因的DNA片段。引物trpA-N-NcoI和lac Z-C-NcoI的碱基序列分别如序列表中序列号9和10所示。在用NcoI消化之后,将该片段与所有却用NcoI消化的上述质粒pACE601,pACE701和pACE702各自混合,连接产生模板失控质粒pACE601Z,pACE701Z,和pACE702Z。所有的都整合]被导入Psp6-0lac序列下游的β-半乳糖苷酶基因。这些质粒的构建是以大肠杆菌JM109为宿主的。
(8)非诱导条件下失控表达质粒表达水平的评价将分别向整合有上述的系统质粒pFSP6的大肠杆菌MC4100(下方作为MC4100/PFSP6)导入了上述的模板失控表达质粒pACE601Z,pACE701Z和pACE702Z而得到的转化子MC4100/pFSP6/pACE601Z,MC4100/pFSP6/pACE701,和MC4100/pFSP6/pACE702Z分别培养在实施例(1)所述的条件下;用上述参考实施例(4)所述的方法分别分折在对数生长期收集的各培养肉汤的β-半乳糖苷酶活性。在所有的检测的转化子中,β-半乳糖苷酶活性低于检测限度,表明了比参考实施例(4)中用多拷贝质粒得到的转化子的更大的表达抑制作用。
(9)Nsp7524III限制性内切酶基因表达质粒的构建含有Nsp7524III限制修饰系统基因的质粒pBRN3是从大肠杆菌MC1061/pBRN3(FERM BP-5741)制备而来的。用该质粒为模板使用引物L-ORF和NspR-ORF3进行PCR以产生一个约1kb的仅含Nsp7524III限制性内切酶基因的DNA片段。引物L-ORF和NspRORF3的碱基序列分别如序列表中序列号11和12所示。在用NcoI消化之后,将该片段与上述的预先用NcoI消化的质粒pACE60混合,以连接构建质粒pACE601-NspIII,该质粒整合有仅在Psp6-Olac序列的下游导入了Nsp7524III限制性内切核酸酶基因。该质粒被稳定的保持在不含Nsp7524III修饰酶基因的大肠杆菌JM109中。
(10) Nsp7524III限制性内切酶基因表达系统的构建将在向整合有上述的系统质粒pFSP6的大肠杆菌HB101(下文称为HB101/pFSP6)中导入了上述的含Nsp7524III限制性内切酶基因的质粒pACE601-NspIII以及质粒pACE601而得到的转化子HB101/pFSP6/pACE601-NspIII,和HB101/pFSP6/pACE601分另培养于LB培养基中直至平台期;将收集的各培养肉汤以1%接种到两试管新鲜基中并于37℃通气培养。在OP600值达到0.6之后,向每个试管中加入IPTG至终浓度0.2mM,之后继续培养。培养结束后,收集细胞,悬浮于细胞破碎缓冲液A中(20mM Tris-HCl,pH7.510mM2-巯基乙醇),并超声破碎,接着高心产生粗提取物。
将1μl该粗提物加入到30μl反应混合物中(10mM Tris-HCl,pH7.5,10mM MgCl2,1mM DTT,50mM NaCl,1μgλ-DNA),之后将反应混合物与琼脂糖凝胶电泳以检查λ-DNA的消化和证实限制性内切酶的活性。如图14所示,只有在加入IPTG诱导表达的HB101/pFSP6/pACE601-NspIII中,观察到了,限制性内切酶活性,并且其λ-DNA断裂带型同Aval,即Nsp7524III的一个同裂酶的带型一致。
上述λ-DNA消化反应延长至2和3小时的结果如图15所示。这时,由于本实验所用的粗提取物所含有来自大肠杆菌核酸酶,由Nsp7524III活性得到的DNA片段由大肠杆菌核酸酶进行了进一步的降解,在泳道8到泳道10得到随时间增加而其密度降低的带,而泳道10没有带。由于Nsp7524III诱导的缺乏;甚至在延长反应时间时也在泳道11到13上没有产生Nsp7524III消化片段,表明由于大肠杆菌核酸的直接作用,λ-DNA被变成了低分子量的片段。在来自HB101/pFSP6/pACE601的粗提物中没有检测到限制性内切酶活性。实施例2AccIII限制性内切酶基因的分离和表达(1)测定AccIII限制性内切酶蛋白质N-末端氨基酸序列以及合成对应于该氨基酸序列的引物DNA将大约2ku的AccIII限制性内切酶的商业产品(宝酒造社制)上Sephacryl5300柱(Pharmacia造)进行凝胶过滤以测定AccIII限制性内切酶的分子重。从检测到活性的洗脱位置判断,表明AccIII限制性内切酶的分子量约为70,000。由于大多数的限制性内切酶的蛋白质是二聚体,预测AccIII限制性内切酶蛋白在SDS聚丙烯酰胺凝胶电泳上会迁移到分子量35,000的位置。
接下来,为了得到AccIII限制性内切酶蛋白质N末端氨基酸测序用的样品,将大约2ku的AccIII商业产品与一个蛋白质分子量标准一起进行SDS聚丙烯酰胺凝胶电泳,之后将蛋白质转移到PVDF膜上并用溴酚蓝染色以确认蛋白质的位置。在用10%乙酸-50%甲醇脱色之后,切下印迹有约35,000分子量蛋白质位置的PVDF膜,并用蛋白质测序仪G1000A(Hewlett-Packard)进行自动Edman降解以确定如序列表中序列号19所示的N末端氨基酸序列。以该序列为基础,然后合成了分别如序列表中序列号20和21所示的AccIII引物1和2以用作一对盒式引物。
(2)Acc细菌基因组DNA的制备根据喜多等在核酸研究(Nucleic Acid Research)13卷,8685-8694(1985)中所述的方法,培养Acc细菌并得到湿菌体。将得到的2g湿菌体悬浮于10ml缓冲液B[25mM Tris-HCl(pH8.0),50mM葡萄糖,10mM EDTA],在以2mg/ml于缓冲液B中存在的1ml溶菌酶的存在下搅拌,并于37℃放置20分钟。接着,向该溶液中加入28ml缓冲液C[100mM NaCl,100mM Tris-HCl(pH80)],随后搅拌。进一步加入1ml以20mg/ml溶于TE[10mM Tris-HCl,1mM EDTA(pH8.0)]中的蛋白酶K和4ml10%SDS溶液,随后搅拌,之后将混合溶液于37℃放置1小时。
向该溶液中加入6ml5M氯化钠水溶液和6ml缓冲液D[CTAB(十六烷基三甲基溴化铵),0.7M NaCl),随后搅拌,接着将混合液于60℃放置20分钟。将该溶液用某酚和随后用氯仿处理,之后分离水相。向该水层中加入在TE中配制的10mg/ml的RNAareACSigma严)50μl,随后搅拌,之后将混合液在37℃放置40分钟。溶液静置后,用苯酚处理,随后用氯仿处理,之后分离水相。向水相中加入等体积的冷乙醇,通过在一玻璃毛细管上缠绕回收所沉淀的DNA。用70%乙醇洗该DNA并在3mlTE中溶解以产生约200μg的基因组DNA。
(3)Acc基因组盒式文库的制备下面的方法基本上根据宝酒造社在《基因工程指南》(1995-1996)F16-F17页所述的方法进行实施。
将(2)中所得的基因组DNA用EcoRI(宝酒造社制)完全消化;将得到的DNA片段当互补具有与其的粘末端的EcoRI盒酒造社制)连接,产生EcoRI盒式文库。类似地,将基因组DNA分别用限制性内切酶BglII,EcoT14I,EcoT22I,HindIII,PstI,SalI和XbaI(均由宝酒造社制)完全消化。将得到的每一种基因组DNA片段分别与几个具有互补突出主要的盒(宝酒造社制)中的一种结合,以分别产生BalII,EcoT14I,EcoT22I,HindIII,PstI,SalI和XbaI盒式文库。这些盒式文库被通称为AccIII基因组盒式文库。
(4)AccIII限制性内切酶基因的分折用(3)中所得到的EcoRI盒式文库为模板,以AccIII引物I和盒式引物C1(宝酒造社制)作为引物时进行基于PCR的DNA扩增反应。为了有效和特异性地扩增目的区,用AccIII引物2和盒式引物C2(宝酒造社制)为引物对以所得的反应液的一部分为模板进行了第二个基于PCR的DNA扩增反应,以产生扩增的DNA片段。类似地,分别以BglII,EcoT14I,EcoT22I,Hind,PstI,SalI和XbaI盒式文库为模板,分别实施上述的两步基于PCR的DNA扩增反应,以得到扩增的DNA片段。用琼脂糖凝胶电泳分析每个扩增的DNA片段;来源于XbaI盒式文库的扩增的DNA片段表现出特别高的扩增效率。
因此,用XbaI盒式文库为模板以AccIII引物1和盒式引物C1为引物对,再次进行基于PCR的DNA扩增反应。将反应混合物进行琼脂糖凝胶电泳;从凝胶中回收了一个约0.5kb的扩增的DNA片段。以所得的DNA片段为模板,以AccIII引物2和盒式引物C2为引物对进行了第二个基于PCR的DNA扩增反应。所得的约0.5kb的扩增的DNA片段的碱基测序表明该片段编码子(1)中测定了其N末端氨基酸序列的蛋白质的一部分。另一方面,推测的AccIII限制性内切酶蛋白质的分子量约为35,000因此,估计编码该蛋白的基因文库为约1kb。因此除了上述的约0.5kb碱基序列的信息是之外,只要有了与AccIII引物1和2退火的5′-末端区域准确碱基序列的信息,和剩下的3区约0.5kb碱基序列的信息就有希望确定AccIII限制性内切酶基因的碱基序列。
因此,为了确定AccIII限制性内切酶5′末端区域的准确的碱基序列,合成了AccIII 3′物了(如序列表中序列22所学)和AccIII引物4(如序列表中序列23所示)。接下来,以(3)中所得的EcoRI盒式文库为模板用AccIII引物4和盒式引物C1为引物对进行了基于PCR的DNA扩增。用一部分该反应液为模板,使用AccIII引物3和盒式引物C2的引物对进行了基于PCR的DNA扩增反应。类似地,分别用BgIII,EcoT14I;EcoT22I,HindIII,PstI,SalI和XbaI盒式文库为模板,分别实施了上述的两步基于PCR的DNA扩增反应。在所扩增的DNA片段中,确定了最短的,即约1kb的用EcoT14I盒式文库为模板得到的DNA片段的碱基序列。
而且,为了确定假定的编码AccIII限制性内切酶蛋白的基因区的引端的约0.5kb的序列,合成了如序列表序列号24所示的AccIII引物5,和如序列表序列号序列26所示的引物6。以(3)中所得的EcoRI盒式文库为模板,使AccHI引物5和盒式引物C1引物对进行基于PCR的DNA扩增反应。用该反应混合物的一部分当为模板,使用AccIII引物6和盒式引物C2引物对进行了基于PCR的DNA扩增反应。类似地,分别以BgIII,EcoT14I,EcoT22I,HindIII,PstI,SalI和XbaI盒式文库为模板,进行了上面两步基于PCR的DNA扩增反应。
在所扩增的DNA片段中,分别以EcoT22I和HindIII盒式文库为模板得到约0.5kb和0.8kb的DNA片段,这两个片段进行了碱基测序。结合所确定的三个碱基序列的结果,得到了一个约1.6kbDNA片段的碱基序列信息。其碱基序列如序列表中序列号26所示。而且,能够编码该蛋白质的开放阅读框的查找结果表明;在碱基编号558到1442为ORF1,在碱基编号1588到1434被认为是ORF2,以及在碱基编号1到535是ORF3。由于其编码(1)中N末端氨基酸序列确定的蛋白质,认为ORF1是AccIII限制性内切酶基因。AccIII限制性内切酶基因的碱基序列如序列表中序列号2所示,其中从5′端数第4个碱基是C。从该碱基序列推导而来的氨基酸序列如序列表中序列号1所示,其中从N末端数第2个氨基酸是Leu。ORF2的翻译方向与ORF1和ORF3相反。
(5)质粒pCRA19的构建接下来,构建了表达AccIII限制性内切酶基因的质粒。首先,为了得到该基因,合成了如序列表中序列号27所示的引物Acc-RL和如序列表中序列号>8所示的引物Acc-RR。在两个引物中导入了限制性内切酶NcoI识别序列位点。用上述的引物sh3,就可能用限制性内切酶NcoI从一个扩增的DNA片段切出AccIII限制性内切酶基因,而该DNA片段是用Acc细菌的基因组DNA为模板通过PCR扩增得到的,并且当该基因被插入到pACE611载体的NcoI位点时,翻译密码子框在SP6启动子的一致控制之下。另一个方面,该引物对的使用引起从AccIII限制性内切酶基因5′端数第四个碱基的取代即C到G,以及从该基因所编码的蛋白质N端数第2个氨基酸的取代基Leu到Vol。使用上述的引物时并以(2)所得Acc细菌的基因组DNA为模板,进行了基于PCR的碱基扩增。用限制性内切酶NcoI(宝酒造社制)完全消化该DNA片段,之后进行琼脂糖凝胶电泳;收回了一个约900bp大小的DNA片段。接下来,将该DNA片段插入到pACE611载体的NcoI位点,从而使其定位于SP6启动子的下游。
将重组DNA导入大肠杆菌JM109中产生转化子。随后挑选30个转化子,并将每个转化子接种到5ml含30μg/ml氯霉素的LB培养基并于37℃培养。当细胞培养肉汤OD600达到0.6小时,加入IPTG至终浓度2mM以增加质粒拷贝数,接着于37℃培养2小时,之后从各培养物分别制备质粒DNA,所获得的每种质粒DNA同时用限制性内切酶HindIII和XbaI切割,接着用琼脂糖凝胶电泳确定得到的DNA片段的长度;检测到了一个以正确的方向插入的含基因区的质粒。被命名为pCRA19的质粒被导入至大肠杆菌JM109中以产生转化子,该转化子被称为大肠杆菌JM109/pCRA19(6)AccIII限制性内切酶基因表达系统的构建首先,将SP6 RNA聚合酶基因导入大肠杆菌JM109中以构建一个可进一步表达该基因的噬菌体基因。具体地说,通过将由用BarmHI-HindIII消化pSP6-2而得到的SP6RNA聚合酶基因片段插入至商业产品噬菌体载体M13mp18(宝酒造社制)的多克隆位中的BamHI-HindIII位点,从而构建了SP6RNA聚合酶表达基因噬菌体MI3sp6。
接着,转化子大肠杆菌JM109/pCRA19被接种到5ml含30μg/ml氯霉素的LB培养基中并于37℃培养。当细胞培养肉汤的OD600达到0.6时,加入IPTG至终浓度2mM以增加拷贝数,随后在37℃进一步培养2小时。然后用噬菌体M13sp6感染这些细胞以表达由AccIII限制性内切酶基因所表达的蛋白质,随后于37℃进一步培养16小时。将得到的湿细胞中的一部分11mg悬浮于180μl的细胞破碎缓冲液E中〔20mMTris-HCl(pH7.5),10mM 2-硫基乙醇〕,之后超声碎破细胞,然后离心(18000g,10分钟)将固体与液体分离。
在宝酒造社所产生AccIII限制性内切酶所附资料页所示的活性测定条件下测定上清的活性,测定表明产量为每克湿细胞产生约8000单位的AccIII限制性内切酶,约是同每单位重量湿Acc细胞得到活性的16倍。在所得上清既没有看到AccIII之外其它限制性内切酶的活性,也没有看到AccIII修饰酶活性。对导入到质粒pCRA19中的AccIII限制性内切酶基因来说,表明从翻译起点碱基开始数,第4个碱基在用PCR扩增DNA时被由C置换成了G,结果导致从所翻译的蛋白质的N-末端数第2个氨基酸被取代,即由Leu到Val,并且该蛋白质具有AccIII限制性内切酶活性。
由此开发了一个不存在AccIII修饰酶的AccIII限制性内切酶基因的分离/物质生产系统。
(7)AccIII修饰酶基因的分离修饰酶基因的限制性内切酶基因定位经常很靠近。因此,为了确定上述(4)中所推测的ORF2区域,从而测定了一个约1.4kb DNA片段的碱基序列,该DNA片段是以用EcoRI盒式文库为模板所制备的用于测定上述(4)AccIII限制性内切酶基因3′区的扩增的DNA片段中得到的。为了测定上述(4)中所推测的ORF3区域,从用BglII盒式文库为模板制备的用于测定上述(4)中的AccIII限制性内切酶基因5-末端区的扩增的DNA片段中得到一个约2.2kb的DNA片段,测定了其碱基序列。结合这些碱基序列和上述(4)中测定的含有AccIII限制性内切酶基因的约1.6kb DNA片段的碱基序列,从而得到了如序列表中序列号29所示的约4.2kb碱基序列的信息。AccIII限制性内切酶基因定位于碱基编号1913到2797,ORF2位于碱基编号3712到2789,而ORF3位于碱基编号的691到1890。在这些ORF中,证明ORF2含有一个与已知的各种限制修饰系统的修饰酶的保守区高度同源的部分。
接着,为了得到ORF3区,用EcoT22I和HpaI(均由宝酒造社产)从扩增的DNA片段切下了一个约1.1kb的含ORF2的部分,其中扩增的DNA片段是在各自的步骤中分别使用Acc引物6和盒式引物C1引物对及另一引物对Acc引物5和盒式引物C2以EcoRI盒式文库作模板通过两从扩增的DNA片段切下了一个约1.1kb的含ORF2的部分,其中扩增的DNA片段是在各自的步骤中分别使用Acc引物6和盒式引物C1引物对及另一引物对Acc引物5和盒式引物C2以EcoRI盒式文库作模板通过两步PCR得到的,并将该1.1kb片段插入到了pUC118载体lac启动子下游的SmaI位点。如果该重组质粒含AccIII修饰酶基因,并且如果AccIII修饰酶可在大肠杆菌中表达,则由通过将该重组质粒导入大肠杆菌JM109中而得到的转化子培养物中的DNA将会被AccIII修饰酶甲基化并获得对AccIII限制性内切核酸酶切割的抗性。
但是由于用于构建该重组质粒的pUC118载体不含有AccIII限制性内切核酸酶识别序列,用该重组质粒本身去确证AccIII修饰酶活性就不太适合了。另一方面,在质粒pSTV29中有AccIII限制性内切核酸酶识别序列,它可与该重组质粒在大肠杆菌JM109中共存。因此,用pSTV29作为AccIII修饰酶表达的指示,将上述的重组质粒和pSTV29同时导入大肠杆菌JM109中以产生转化子。将3个转化子各自于37℃在含100μg/ml氨苄,30μg/ml氯霉素和2mM IPTG的LB培养基中培养16小时,之后从各培养物中制备质粒DNA。
由此制备的DNA是质粒pSTV29和上述重组质粒的混合物。当用AccIII限制性内切核酸酶消化每种DNA样品时,所有样品中的pSTV29都表现出对AccIII限制性内切核酸酶的抗性,表明AccIII修饰酶基因被插入到了DNA样品中所含的重组质粒中。而且,当用限制性内切核酸酶HindIII和XbaI同时消化该DNA样品并随后用琼脂糖凝胶电泳分析所得到的DNA片段的长度时,证实了重组质粒中ORF2的存在。从而证明ORF2是AccIII修饰酶基因。所得的AccIII修饰酶基因和由其推导而得的氨基酸序列分别如序列表中序列号14和序列号13所示。
根据本发明所证明的AccIII限制修饰系统基因的结构如图16所示,其中M,R和箭头分别代表修饰酶基因,限制性内切核酸酶基因和ORF的方向。
工业应用性本发明首次提供了一种能将其编码的蛋白质对宿主致死或有害的外源基因导入宿主中的质粒,以及一种能用该质粒载体有效表达该蛋白质的方法。还提供一种在现有技术中是困难的在无修饰酶基因共存时分离构成限制修饰系统的限制性内切核酸酶基因的方法。而且,本发明分离了AccIII限制性内切核酸酶基因和AccIII修饰酶基因,并且与现有的纯化方法相比用含该基因的质粒转化的大肠杆菌,可以容易的得到目的纯度的在基因工程中有用的AccIII限制性内切核酸酶或AccIII修饰酶的酶制品。
序列号1序列长度295序列类型氨基酸链型单链拓扑学线性序列种类肽序列特征2(Val或Leu)序列Met Xaa Pro Leu Asp Lys Asp Leu Gln Lys Ala Lys Ile Ser Ile1 5 10 15Thr Asp Phe Phe Glu Ile Thr Asn Arg Val Leu Asp Tyr Phe Pro20 25 30Asn Val Ile Asn Asn Thr Val Glu Lys Gly Asp Tyr Leu Ile Ser35 40 45Ser Ser Asn Ile Ala Gly Thr Ile Lys Phe Leu Arg Pro Ile Asn50 55 60Arg Lys Leu Phe Ile Gln Glu Lys Lys Val Phe Asn Asp Tyr Phe65 70 75Gln Lys Leu Ile Ile Val Phe Glu Asn Ile Arg Asn Lys Lys Thr80 85 90Val Thr Glu Glu Asp Lys Ile Ile Ile Asp Arg Val Ile Tyr Thr95 100 105Ile Gln Gln Ser Ile Gly Ile Gly Leu Asp Leu Met Val Asn Gln110 115 120Asn Ser Ala Arg Lys His Val Gly Asn Arg Phe Glu Glu Leu Ile125 130 135Arg Val Ile Phe Thr Glu Ile Ser Val Ser Asn Lys Arg Thr Val140 145 150Leu Gln Ile Pro Tyr Glu Thr Asp Glu Gly Gln Lys Ile Tyr Lys155 160 165Cys Glu Asn Asp Leu Ile Ile Ser Pro Phe Glu Asn Val Glu Ser170 175 180Thr Asn Lys His Leu Asp Glu Asn Glu Ile Val Val Ser Ile Lys185 190 195Thr Thr Ser Lys Asp Arg Met Gly Lys Met Phe Ile Asp Lys Ile200 205 210Leu Leu Glu Arg Phe Val Lys His Pro Gln Lys Val Ile Gly Ile215 220 225Phe Leu Asn Asp Val Gln Arg Lys Glu Asp Asn Asn Ile Ser Phe230 235 240Thr Leu Val Ser Gly Leu Phe Met Val Tyr Thr Lys Phe Leu Thr245 250 255Thr Leu Glu Gly Ile Tyr Tyr Leu Asp Pro Pro Pro Asn Ala Leu260 265 270Lys Leu Pro Tyr Ser Asn His Met Lys Arg Phe Ser Asp Leu Ile275 280 285Thr Glu Asp Leu Glu Lys Leu Phe Ser Ser290 295序列2序列长度885序列类型核酸链型双链拓扑学线性序列种类基因组DNA序列ATGSTACCAC TGGATAAAGA TTTACAAAAA GCAAAGATTT CAATTACTGA TTTTTTTGAA 60ATTACAAATA GAGTTTTAGA TTATTTCCCC AATGTAATCA ATAATACAGT TGAAAAAGGA 120GATTATTTAA TATCCTCATC AAATATTGCT GGAACAATAA AATTCCTAAG ACCAATCAAT 180AGAAAGTTAT TTATTCAGGA AAAAAAAGTT TTCAATGATT ATTTTCAAAA ACTGATTATA 240GTTTTTGAAA ATATAAGGAA CAAAAAAACT GTAACAGAGG AAGATAAAAT TATTATTGAT 300AGGGTAATTT ACACAATACA GCAATCTATT GGAATTGGTT TAGATTTAAT GGTTAATCAA 360AATAGTGCTA GAAAGCACGT TGGTAACCGA TTTGAAGAAT TAATTAGAGT CATTTTTACA 420GAAATATCAG TATCGAATAA AAGAACTGTA TTACAAATTC CATATGAAAC TGATGAAGGA 480CAGAAAATTT ACAAATGCGA GAATGACCTC ATTATTTCTC CTTTTGAAAA TGTAGAATCT 540ACAAACAAAC ATCTAGATGA AAATGAGATT GTTGTTTCAA TAAAGACAAC ATCAAAAGAT 600AGGATGGGAA AAATGTTTAT AGATAAAATT TTACTTGAAA GGTTTGTTAA ACACCCTCAA 660AAAGTTATAG GGATTTTCCT CAATGATGTA CAAAGAAAAG AAGACAACAA TATCAGCTTT 720ACACTTGTTT CAGGATTATT TATGGTGTAT ACTAAATTCT TAACTACTCT TGAAGGGATC 780TATTATTTAG ATCCACCACC TAATGCATTG AAACTACCAT ATTCTAATCA TATGAAAAGA 840TTTTCAGATT TAATTACAGA AGACCTTGAA AAATTATTCT CCTCT 885序列号3序列长度215序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列TATGGATATG TTCATAAACA CGCATGTAGG CAGATAGATC TTTGGTTGTG AATCGCAACC 60AGTGGCCTTA TGGCAGGAGC CGCGGATCAC CTACCATCCC TAATGACCTG CAGGCATGCA 120AGCTTGCATG CCTGCAGGTC ATTAGGTACG GCAGGTGTGC TCGAGGCGAA GGAGTGCCTG 180CATGCGTTTC TCCTTGGCTT TTTTCCTCTG GGACA 215序列号4序列长度215序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列TATGTCCCAG AGGAAAAAAG CCAAGGAGAA ACGCATGCAG GCACTCCTTC GCCTCGAGCA 60CACCTGCCGT ACCTAATGAC CTGCAGGCAT GCAAGCTTGC ATGCCTGCAG GTCATTAGGG 120ATGGTAGGTG ATCCGCGGCT CCTGCCATAA GGCCACTGGT TGCGATTCAC AACCAAAGAT 180CTATCTGCCT ACATGCGTGT TTATGAACAT ATCCA 215序列号5序列长度28序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列AGATCTAGAG CAAACAAAAA AACCACCG 28序列号6序列长度24序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列GGTCTAGATC CCAGAGGAAA AAAG 24序列号7序列长度100序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列CTCGAGATTT AGGTGACACT ATAGAATACG GAATTGTGAG CGGATAACAA TTCCAAGCTT 60CACAGGAAAC AGACCATGGC TTAAGTAACT AGTGAATTCG 100序列号8序列长度100序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列CGAATTCACT AGTTACTTAA GCCATGGTCT GTTTCCTGTG AAGCTTGGAA TTGTTATCCG60CTCACAATTC CGTATTCTAT AGTGTCACCT AAATCTCGAG 100序列号9序列长度27序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列AATCCCATGG AACGCTACGA ATCTCTG 27序列号10序列长度29序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列CCGGCCATGG TTATTTTTGA CACCAGACC 29序列号11序列长度26序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列TAACTTGAAT CCATGGGTTC TCACCG 26序列号12序列长度29序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列TACTCAGTAG CCATGGCTCT CATAGACCG 29序列号13序列长度308序列类型氨基酸链型单链拓扑学线性序列种类肽序列Met Asn Glu Ile Ala Phe Asp Asn Tyr Ser Tyr Ile Pro Lys Leu1 5 10 15Lys Leu Tyr Ser Glu Ile Glu Leu Lys Pro Phe Phe Ile Ser Lys20 25 30Asn Gly Ser Leu Phe Asn Val Asp Ala Ile Asp Phe Leu Arg Lys
35 40 45Leu Glu Ser Asn Ser Val Asp Leu Ile Phe Ala Asp Pro Pro Tyr50 55 60Asn Ile Lys Lys Ala Glu Trp Asp Ile Phe Ser Ser Gln Asn Glu65 70 75Tyr Leu Glu Trp Ser Lys Glu Trp Ile Met Glu Ala His Arg Val80 85 90Leu Lys Asp Asn Gly Ser Leu Tyr Val Cys Gly Phe Ser Glu Ile95 100 105Leu Ala Asp Ile Lys Phe Ile Thr Ser Lys Tyr Phe His Ser Cys110 115 120Lys Trp Leu Ile Trp Phe Tyr Arg Asn Lys Ala Asn Leu Gly Lys125 130 135Asp Trp Gly Arg Ser His Glu Ser Ile Leu Leu Leu Arg Lys Ser140 145 150Lys Asn Phe Ile Phe Asn Ile Asp Glu Ala Arg Ile Pro Tyr Asn155 160 165Glu His Thr Val Lys Tyr Pro Gln Arg Thr Gln Ala Glu Ser Ser170 175 180Gln Tyr Ser Asn Ser Lys Lys Gln Tyr Ile Trp Glu Pro Asn Pro185 190 195Leu Gly Ala Lys Pro Lys Asp Val Leu Glu Ile Pro Thr Ile Ser200 205 210Asn Gly Ser Trp Glu Arg Ser Ile His Pro Thr Gln Lys Pro Val215 220 225Glu Leu Leu Lys Lys Ile Ile Leu Ser Ser Ser Asn Lys Asp Ser
230 235 240Leu Ile Leu Asp Pro Phe Gly Gly Ser Gly Thr Thr Tyr Ala Val245 250 255Ala Glu Ala Phe Gly Arg Lys Trp Ile Gly Thr Glu Leu Asp Lys260 265 270Asn Tyr Cys Leu Glu Ile Gln Lys Arg Leu Lys Asp Glu Ser Met275 280 285Ile Asn Arg Ile Phe Ser Gly Asp Asp Asp Ser Asn Ser Gln Asn290 295 300Arg Arg Lys Lys Leu Arg Gly Glu305序列号14序列长度924序列类型核酸链型双链拓扑学线性序列种类基因组DNA序列GTGAATGAAA TAGCGTTTGA TAATTACAGT TATATACCAA AATTAAAACT TTATTCGGAA60ATCGAGCTTA AACCATTTTT TATTTCAAAA AACGGTTCAC TTTTCAATGT TGATGCTATT 120GATTTTTTAA GAAAATTAGA GAGTAATTCT GTGGATTTAA TTTTTGCAGA TCCACCTTAT 180AACATTAAAA AGGCAGAGTG GGATATTTTT TCTTCTCAAA ATGAATATCT CGAATGGAGT 240AAAGAATGGA TAATGGAAGC TCATAGAGTT TTAAAAGATA ATGGCAGTTT ATATGTTTGT 300GGCTTTTCAG AAATTCTGGC AGACATAAAA TTTATCACTT CAAAATATTT TCACAGTTGT 360AAATGGTTGA TTTGGTTCTA TAGAAACAAG GCAAATTTAG GTAAAGATTG GGGACGTTCA 420CACGAAAGTA TACTGTTATT AAGAAAATCT AAAAATTTTA TTTTTAATAT TGATGAGGCA 480CGAATCCCGT ATAATGAGCA TACAGTTAAA TATCCACAAA GAACCCAGGC CGAATCTTCG 540CAATATTCGA ACTCAAAAAA GCAATATATT TGGGAGCCAA ACCCATTAGG AGCTAAGCCA 600AAAGATGTTT TGGAGATTCC CACAATTTCA AATGGTTCTT GGGAAAGAAG TATTCACCCT 660ACGCAAAAGC CAGTAGAATT GCTTAAAAAA ATAATTTTAT CTTCATCTAA TAAAGATAGT 720TTAATTCTTG ATCCATTTGG TGGTTCGGGA ACTACATATG CTGTTGCGGA AGCTTTTGGC 780AGAAAATGGA TTGGAACAGA GTTAGATAAA AATTATTGTC TGGAAATTCA AAAGCGATTG 840AAAGACGAAA GTATGATCAA CAGGATTTTT TCAGGCGATG ATGATTCAAA TTCTCAAAAT 900AGAAGAAAAA AATTAAGAGG AGAA 924序列号15序列长度29序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列TCGAGATTTA GGTGACACTA TAGAATACA 29序列号16序列长度29序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列AGCTTGTATT CTATAGTGTC ACCTAAATC 29序列号17序列长度54序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列TCGAGATTTA GGTGACACTA TAGAATACGG AATTGTGAGC GGATAACAAT TCCA 54序列号18序列长度54序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列AGCTTGGAAT TGTTATCCGC TCACAATTCC GTATTCTATA GTGTCACCTA AATC 54序列号19序列长度20序列类型氨基酸链型单链拓扑学线性序列种类肽序列Met Leu Pro Leu Asp Lys Asp Leu Gln Lys Ala Lys Ile Ser Ile1 5 10 15Thr Asp Phe Phe Glu20序列号20序列长度23序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列特征6、9、12(肌苷)序列ATGTTNCCNY TNGAYAARGA YYT23序列号21序列长度23序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列特征9(肌苷)序列AAGGATTTNC ARAARGCNAA RAT23序列号22序列长度30序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列TAAATCTAAA CCAATTCCAA TAGATTGCTG30序列号23序列长度30序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列CAAATCGGTT ACCAACGTGC TTTCTAGCAC30序列号24序列长度30序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列GAACTGTATT ACAAATTCCA TATGAAACTG30序列号25序列长度30序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列GACAGAAAAT TTACAAATGC GAGAATGACC30序列号26序列长度1588序列类型核酸链型双链拓扑学线性序列种类基因组DNA序列CCATGGCACA CGTTTCAAAA AAGAAATCCT CGAAGTCAAA TATGATGAGA AAAACATCTC60AGACATCCTG CATATGACGG TGGATGAAGC ATTGGAATTT TTCTCGGAAA ATCACGAAGA 120AAAAATTGTA ACCAAACTAA AACCTTTGCA GGACGTTGGT TTGGGTTATC TTCAGTTAGG 180CCAGTCCTCC TCTACTCTTT CCGGCGGTGA AGCCCAAAGA GTGAAGCTCG CCTCTTTCCT 240TGTGAAAGGT GTAACGACGG AAAAAACGTT ATTTGTTTTT GATGAACCAT CAACAGGATT 300ACATTTCCAC GACATTCAAA AATTACTGAA ATCACTTCAG GCACTGATAG AATTAGGGCA 360TTCGGTTGTA GTGATTGAGC ATCAGCCGGA TATTATCAAA TGCGCCGATT ACATCATCGA 420TGTCGGACCC AATGCCGGAA AATACGGTGG CGAAATTGTT TTCACAGGAA CTCCGGAAGA 480TTTGGTAAAA GAGAAAAAGT CGTTTACAGG GAAGTATATT AAGGAGAAGT TAAAGTAATT 540TATTTATATT TGAAGTTATG CTACCACTGG ATAAAGATTT ACAAAAAGCA AAGATTTCAA 600TTACTGATTT TTTTGAAATT ACAAATAGAG TTTTAGATTA TTTCCCCAAT GTAATCAATA 660ATACAGTTGA AAAAGGAGAT TATTTAATAT CCTCATCAAA TATTGCTGGA ACAATAAAAT 720TCCTAAGACC AATCAATAGA AAGTTATTTA TTCAGGAAAA AAAAGTTTTC AATGATTATT 780TTCAAAAACT GATTATAGTT TTTGAAAATA TAAGGAACAA AAAAACTGTA ACAGAGGAAG 840ATAAAATTAT TATTGATAGG GTAATTTACA CAATACAGCA ATCTATTGGA ATTGGTTTAG 900ATTTAATGGT TAATCAAAAT AGTGCTAGAA AGCACGTTGG TAACCGATTT GAAGAATTAA 960TTAGAGTCAT TTTTACAGAA ATATCAGTAT CGAATAAAAG AACTGTATTA CAAATTCCAT 1020ATGAAACTGA TGAAGGACAG AAAATTTACA AATGCGAGAA TGACCTCATT ATTTCTCCTT 1080TTGAAAATGT AGAATCTACA AACAAACATC TAGATGAAAA TGAGATTGTT GTTTCAATAA 1140AGACAACATC AAAAGATAGG ATGGGAAAAA TGTTTATAGA TAAAATTTTA CTTGAAAGGT 1200TTGTTAAACA CCCTCAAAAA GTTATAGGGA TTTTCCTCAA TGATGTACAA AGAAAAGAAG 1260ACAACAATAT CAGCTTTACA CTTGTTTCAG GATTATTTAT GGTGTATACT AAATTCTTAA 1320CTACTCTTGA AGGGATCTAT TATTTAGATC CACCACCTAA TGCATTGAAA CTACCATATT 1380CTAATCATAT GAAAAGATTT TCAGATTTAA TTACAGAAGA CCTTGAAAAA TTATTCTCCT 1440CTTAATTTTT TTCTTCTATT TTGAGAATTT GAATCATCAT CGCCTGAAAA AATCCTGTTG 1500ATCATACTTT CGTCTTTCAA TCGCTTTTGA ATTTCCAGAC AATAATTTTT ATCTAACTCT 1560GTTCCAATCC ATTTTCTGCC AAAAGCTT1588序列号27序列长度25序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列ATATTTGAAG CCATGGTACC ACTGG 25序列号28序列长度26序列类型核酸链型单链拓扑学线性序列种类其它核酸(合成DNA)序列GATGATTCAA ATTCTCACCA TGGAAG 26序列号29序列长度4146序列类型核酸链型双链拓扑学线性序列种类基因组DNA序列AGATCTGGTC ATCCCAAACA AAAATCTTTC GGTTTACGAA GATGCAGTCG CTTCCTGGAA60AGGCGAAAGT ATGAGCGAAT GGAAAAAGGA ATTCATCAAA AAAGCCAAAG ATTTCCCAAT 120TCACAAGCCT TATCATCAAC TCACAAAAGA GCAGAAACAG TTCCTTTGGA AAGGCGATAA 180AACCAGAAGT TTCCCAAGTA TTGATAATTT TTTCAAAATG CTTGAAGAGA ATCTTTACAA 240GATCCAATAC CGCGTAATGC TTTCGCGCTA TCGTGGGAAA ACACTTTGCC CCGATTGCGA 300AGGATTACGA TTGCGGGAAG AAACAAGCTG GGTGAAGATT GACGGACACA ACATTCAGTC 360TTTGATTGAA TTACCTTTGG ATGAACTCCT GCCATTGATC AAAAGCTTAA AACTGAACGT 420CCACGACAGA GAAATTGCCA AACGCCTGAC TTACGAAATC GAAACGAGAT TAGAATTCCT 480GACGAAAGTC GGCCTTGGAT ATCTGACTTT GAACCGAACA TCCAACACGC TTTCCGGAGG 540AGAAAGCCAG AGAATCAATC TGGCGACAGC TTGGGAAGTT CGCTGGTTGG TTCTATTTAT 600ATTTTGGATG AGCCGAGCAT TGGTCTGCAT TCCCGCGATA CAGAAAATCT GATTGGTGTC 660CTCAAACAAC TCCGCGATTT GGGAANTACC GTGATTGTTG TAGAACACGA CGAAGATGTG 720ATGCTTGCGG CAGNTTACAT TATAGATATT GGCCCNGNAG CGGGCTACCT TGGTGGCGAT 780CTTGTTTTCA GCGNGGATTA TAAAGAGATG CTGAAGTNTN ATACTTTAAC CGCAAAATAC 840CTGAATGGCG AACTGAAAAT AGAAGTTCCT GAAAAACGAA GAAAACCGAA GGAATTCATC 900GCAATAAAAG GTGCCCGCCA GAATAATTTA AAAAATATTG ACGTTGATGT TCCGTTAGAA 960TGTCTGACAG TTATCACAGG CGTTTCTGGA AGCGGGAAAT CCACTTTGAT GAAGGAAGTG 1020ATGACCAATG CCATCCAGAT CCAACTGGGA ATGGGCGGCA AAAAAGCCGA TTACGATTCG 1080GTGGAATTCC CGAAAAAGCT GATCCAGAAT ATCGAACTGA TTGACCAGAA CCCAATCGGG 1140AAATCGTCCC GCTCCAACCC CGTGACTTAT CTGAAAGCTT ACGACGATAT CCGGGATCTT 1200TTTGCGAAAC AAAAATCCGC AAAAATCCAG GGTTACAAAC CGAAGCATTT CTCCTTCAAT 1260GTGGATGGCG GAAGATGTGA CGAGTGCAAA GGCGAAGGTA TCATTACCGT ATCAATGCAG 1320TTTATGGCGG ACATCGAGCT GGAGTGTGAG CATTGCCATG GCACACGTTT CAAAAAAGAA 1380ATCCTCGAAG TCAAATATGA TGAGAAAAAC ATCTCAGACA TCCTGCATAT GACGGTGGAT 1440GAAGCATTGG AATTTTTCTC GGAAAATCAC GAAGAAAAAA TTGTAACCAA ACTAAAACCT 1500TTGCAGGACG TTGGTTTGGG TTATCTTCAG TTAGGCCAGT CCTCCTCTAC TCTTTCCGGC 1560GGTGAAGCCC AAAGAGTGAA GCTCGCCTCT TTCCTTGTGA AAGGTGTAAC GACGGAAAAA 1620ACGTTATTTG TTTTTGATGA ACCATCAACA GGATTACATT TCCACGACAT TCAAAAATTA 1680CTGAAATCAC TTCAGGCACT GATAGAATTA GGGCATTCGG TTGTAGTGAT TGAGCATCAG 1740CCGGATATTA TCAAATGCGC CGATTACATC ATCGATGTCG GACCCAATGC CGGAAAATAC 1800GGTGGCGAAA TTGTTTTCAC AGGAACTCCG GAAGATTTGG TAAAAGAGAA AAAGTCGTTT 1860ACAGGGAAGT ATATTAAGGA GAAGTTAAAG TAATTTATTT ATATTTGAAG TTATGCTACC 1920ACTGGATAAA GATTTACAAA AAGCAAAGAT TTCAATTACT GATTTTTTTG AAATTACAAA 1980TAGAGTTTTA GATTATTTCC CCAATGTAAT CAATAATACA GTTGAAAAAG GAGATTATTT 2040AATATCCTCA TCAAATATTG CTGGAACAAT AAAATTCCTA AGACCAATCA ATAGAAAGTT 2100ATTTATTCAG GAAAAAAAAG TTTTCAATGA TTATTTTCAA AAACTGATTA TAGTTTTTGA 2160AAATATAAGG AACAAAAAAA CTGTAACAGA GGAAGATAAA ATTATTATTG ATAGGGTAAT 2220TTACACAATA CAGCAATCTA TTGGAATTGG TTTAGATTTA ATGGTTAATC AAAATAGTGC 2280TAGAAAGCAC GTTGGTAACC GATTTGAAGA ATTAATTAGA GTCATTTTTA CAGAAATATC 2340AGTATCGAAT AAAAGAACTG TATTACAAAT TCCATATGAA ACTGATGAAG GACAGAAAAT 2400TTACAAATGC GAGAATGACC TCATTATTTC TCCTTTTGAA AATGTAGAAT CTACAAACAA 2460ACATCTAGAT GAAAATGAGA TTGTTGTTTC AATAAAGACA ACATCAAAAG ATAGGATGGG 2520AAAAATGTTT ATAGATAAAA TTTTACTTGA AAGGTTTGTT AAACACCCTC AAAAAGTTAT 2580AGGGATTTTC CTCAATGATG TACAAAGAAA AGAAGACAAC AATATCAGCT TTACACTTGT 2640TTCAGGATTA TTTATGGTGT ATACTAAATT CTTAACTACT CTTGAAGGGA TCTATTATTT 2700AGATCCACCA CCTAATGCAT TGAAACTACC ATATTCTAAT CATATGAAAA GATTTTCAGA 2760TTTAATTACA GAAGACCTTG AAAAATTATT CTCCTCTTAA TTTTTTTCTT CTATTTTGAG 2820AATTTGAATC ATCATCGCCT GAAAAAATCC TGTTGATCAT ACTTTCGTCT TTCAATCGCT 2880TTTGAATTTC CAGACAATAA TTTTTATCTA ACTCTGTTCC AATCCATTTT CTGCCAAAAG 2940CTTCCGCAAC AGCATATGTA GTTCCCGAAC CACCAAATGG ATCAAGAATT AAACTATCTT 3000TATTAGATGA AGATAAAATT ATTTTTTTAA GCAATTCTAC TGGCTTTTGC GTAGGGTGAA 3060TACTTCTTTC CCAAGAACCA TTTGAAATTG TGGGAATCTC CAAAACATCT TTTGGCTTAG 3120CTCCTAATGG GTTTGGCTCC CAAATATATT GCTTTTTTGA GTTCGAATAT TGCGAAGATT 3180CGGCCTGGGT TCTTTGTGGA TATTTAACTG TATGCTCATT ATACGGGATT CGTGCCTCAT 3240CAATATTAAA AATAAAATTT TTAGATTTTC TTAATAACAG TATACTTTCG TGTGAACGTC 3300CCCAATCTTT ACCTAAATTT GCCTTGTTTC TATAGAACCA AATCAACCAT TTACAACTGT 3360GAAAATATTT TGAAGTGATA AATTTTATGT CTGCCAGAAT TTCTGAAAAG CCACAAACAT 3420ATAAACTGCC ATTATCTTTT AAAACTCTAT GAGCTTCCAT TATCCATTCT TTACTCCATT 3480CGAGATATTC ATTTTGAGAA GAAAAAATAT CCCACTCTGC CTTTTTAATG TTATAAGGTG 3540GATCTGCAAA AATTAAATCC ACAGAATTAC TCTCTAATTT TCTTAAAAAA TCAATAGCAT 3600CAACATTGAA AAGTGAACCG TTTTTTGAAA TAAAAAATGG TTTAAGCTCG ATTTCCGAAT 3660AAAGTTTTAA TTTTGGTATA TAACTGTAAT TATGAAACGC TATTTCATTC ACAAATGAAT 3720CAATCTGCTG TTGTGTATAA ACCCTGTAAT TATTAATAGG ATGTCTTAAA CTTTTGAATT 3780TTCCAGAATT ATCGCATCTT GCTTAATGTC TCAGAGTTAA CATCTAATAA TTTCGCCGCT 3840TCTTTTATTG ATAAATAATC ATCCATATCT TACACAACAT TACACAAGTT TATACAGCAA 3900ATATAAATAT TTTTTATACA TTGTAAAAAT TTTATTTAGT TTTATTTTGT TCAATTGTCT 3960CAATAAATAG TTAATCGAAA TACATTTTGA ATATGATAAA ATTGACTCCA ACAAATCTAA 4020CACAATGACA TTAAAACCAA TAAAAAGGGA AGAAGATTAC AATCAGGTTT TAGAAAGACT 4080TTCACAAATT TTCGACGCTA AACCAAATAC CAAAGATGGA GATGAATTGG GAAATCTTGG 4140GAATTC 4146序列号30序列长度23序列类型核酸链型双链拓扑学线性序列种类基因组DNA序列ATTTAGGTGA CACTATAGAA TAC2权利要求
1.一种质粒载体,基特征在于其具有能被非宿主内在的RNA聚合酶识别并控制目的基因表达的启动子序列和在外源因子的诱导下拷贝数增加的复制起点。
2.权利要求1所述的质粒载体,其中启动子序列可被来自噬菌体的RNA聚合酶识别。
3.权利要求2所述的质粒载体,其中的启动子序列能被来自SP6噬菌体的RNA聚合酶识别。
4.权利要求3所述的质粒载体,其中启动子序列含序列表中序列号30所示的碱基序列。
5.权利要求1-4任一项所述的质粒载体,其中复制起点在启动子的控制之下。
6.权利要求1-5任一项所述的质粒载体,其中复制起点在lac启动子的控制之下。
7.权利要求1-6任一项所述的质粒载体,其中含有作为选择标记的药物抗性基因。
8.权利要求7所述的质粒载体,其中自pACE601、pACE611、pACE701、pACE702。
9.一种质粒载体,其中整合有将在权利要求1-8任一项的质粒载体中表达的目的基因。
10.一种目的基因的表达方法,其特征在于向宿主中导入整合了将在权利要求1-8任一项的质粒载体中表达的目的基因的质粒载体和识别该质粒载体上的启动子序列的RNA聚合酶基因;并用外源因子诱导质粒载体拷贝数的增加和RNA聚合酶的表达以进行目的基因的转录和翻译。
11.权利要求10所述的目的基因的表达方法,其特征在于质粒载体拷贝数的增加和RNA聚合酶的表达是由不同的外源因子诱导的。
12.权利要求10所述的目的基因的表达方法,其特征在于质粒载体拷贝数的增加和RNA聚合酶的表达是由同一外源因子诱导的。
13.权利要求10-12任一项所述的目的基因的表达方法,其中诱导质粒载体拷贝数增加的外源因子选自异丙基-β-D-硫代半乳糖苷(IPTG)的添加,乳糖的添加,半乳糖的添加,阿拉伯糖的添加,色氨酸浓度的降低及转化子培养温度的调整其中之一。
14.权利要求10-12任一项所述的目的基因的表达方法,其中诱导RNA聚合酶表达的外源因子选自如下之一异丙基-β-D-硫代半乳糖苷(IPTG)的添加,乳糖的添加,半乳糖的添加,色氨酸浓度的降低以及转化子培养温度的调整。
15.权利要求10所述的目的基因的表达方法,其特征在于通过其它的质粒载体或噬菌体载体将RNA聚合酶基因导入到了宿主中。
16.权利要求10所述的目的基因的表达方法,其特征在于RNA聚合酶基因被整合进了宿主的染色体中。
17.权利要求15或16所述的目的基因的表达方法,其特征在于RNA聚合酶基因来自SP6噬菌体。
18.权利要求10-17任一项所述的目的基因的表达方法,其中目的基因编码对宿主为致死性的或有害的蛋白质。
19.权利要求10-18任一项的目的基因的表达方法,其特征在于用大肠杆菌作为宿主。
20.一种分离目的基因的方法,其特征在于在目的基因的分离方法中应用了权利要求1-8任一项所述的质粒载体。
21.权利要求20所述的目的基因的分离方法,其中目的基因编码对宿主为可致死或有害的蛋白质。
22.权利要求21所述的目的基因的分离方法,其中编码对宿主可致死或有害的蛋白质的基因是限制性内切核酸酶的基因。
23.具有AccIII限制性内切核酸酶活性的多肽,其具有序列表中序列号1中所示的全部氨基酸序列或其一部分。
24.一种多肽,其具有由序列表中序列号1所示的氨基酸序列中的1个或多个氨基酸残基的缺失,添加,插入或置换至少之一而得到的氨基酸序列或其一部分并具有AccIII限制性内切核酸酶活性。
25.一种编码多肽的DNA,其中该多肽具有序列表中序列号1所示的氨基酸序列的全部或一部分并有AccIII限制性内切核酸酶活性。
26.一种DNA,该DNA具有序列表中序列号2所示的DNA的全部或其一部分,该DNA的表达产物具有AccIII限制性内切核酸酶活性。
27.编码一种多肽的DNA,该多肽具有由序列表中序列号1所示的氨基酸序列中的一个或多个氨基酸残基的缺失,添加,插入或置换至少之一而得到的氨基酸序列的全部或一部分并有AccIII限制性内切核酸酶活性。
28.能与权利要求25-27任一项的DNA杂交并编码具有AccIII限制性内切核酸酶活性多肽的DNA。
全文摘要
一种质粒载体,其特征在于其具有能被非宿主内在的RNA聚合酶识别并控制目的基因表达的启动子序列和具有能在外源因子的诱导下增加拷贝数的复制起点;利用该载体表达和分离目的基因的方法,具有AccⅢ限制性内切核酸酶活性的多肽以及编码该多肽的DNA。本发明首次提供了导入的外源目的基因所偏码蛋白质对所说宿主是致死性的或有毒性的质粒载体,利用该载体有效表达所述蛋白质的方法。而且提供了对现有技术来说是困难的,在不存在修饰酶基因的情况下分离构成限制修饰系统的限制性内切核酸酶基因的方法。
文档编号C12N1/21GK1193354SQ97190500
公开日1998年9月16日 申请日期1997年3月10日 优先权日1996年3月13日
发明者佐川裕章, 上野春美, 大岛淳, 加藤郁之进 申请人:宝酒造株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1