具有增加的耐盐性的T4DNA连接酶变体的制作方法

文档序号:30699579发布日期:2022-07-09 19:10阅读:136来源:国知局
具有增加的耐盐性的T4DNA连接酶变体的制作方法
具有增加的耐盐性的t4 dna连接酶变体


背景技术:

1.dna连接酶是活生物体中不可或缺的修复蛋白,其催化双链dna中单链断裂的修复。t4 dna连接酶利用生物分子atp的能量来修复带切口的双链dna,还连接具有互补单链突出端(粘性末端)以及平末端片段的双链dna,使其成为用于在体外组合较小dna片段以产生双链dna构建体的有用工具。
2.dna连接酶在并置的5'磷酸和3'羟基末端的交叉处形成双螺旋核酸片段之间的磷酸二酯键。通过设计每个双链片段之间的互补突出端,连接可以是位置特异性连接和定向连接二者。这允许dna或rna片段特异性整合到更大的载体中,以满足分子生物学研究的需要。在可商购获得的连接酶中,t4 dna连接酶是一种多功能的酶,其催化在突出端和平末端二者处连接双螺旋dna或rna的键,具有快速的连接速度,并经由连接修复带切口dna中存在的错配。因为t4 dna连接酶是许多分子生物学方案的支柱,并且被持续需要,因此由于它在分子生物学试剂市场中的重要性而使它为许多生命科学产品公司创造了很大份额的收入。
3.通常,野生型(wt)t4 dna连接酶由于反应缓冲液中存在盐(诸如氯化钠)而受到抑制;在200mm或以上的盐浓度下在大多数情况下可以看到连接被完全抑制。因为连接反应的插入物和载体样品中存在盐污染物并不罕见,因此在进行连接之前通常需要纯化步骤。此类增加的纯化步骤增加了实验的时间和复杂性,并且纯化程序通常会导致样品损失-这可能是重大损失。另外,如果连接酶不受使用其他酶时通常需要的缓冲液中的盐的抑制,则有可能在一个反应容器中实现与连接组合的多个程序。对反应混合物中的盐具有增强耐受性的t4 dna连接酶变体具有大量的分子生物学应用。因此,非常需要一种能够在高盐环境中操作的连接酶。


技术实现要素:

4.本发明涉及与野生型t4 dna连接酶相比,对反应混合物中盐(包括nacl、kcl和其他盐)的存在表现出增加的耐受性的t4 dna连接酶变体。以下t4 dna连接酶突变体(在指定位置处具有取代,并且其中每种突变体的氨基酸序列是指定取代后面的序列标识号,并且其中每种这样的突变体的dna序列是每种突变体的氨基酸序列标识号之前的序列表中的奇数编号的序列标识号)被鉴定为对nacl的存在具有这种增加的耐受性:e88k(seq id no:4)、e132k(seq id no:6)、e222k(seq id no:8)、k306e(seq id no:10)、d340r(seq id no:12)、k365e(seq id no:14)、d371a(seq id no:16)、d371g(seq id no:18)、d371h(seq id no:20)、d371i(seq id no:22)、d371k(seq id no:24)、d371l(seq id no:26)、d371m(seq id no:28)、d371r(seq id no:30)、d371t(seq id no:32)、d371y(seq id no:34)、e438k(seq id no:36)、e440a(seq id no:38)、e440h(seq id no:40)、e440k(seq id no:42)、e440n(seq id no:44)、e440r(seq id no:46)、e440s(seq id no:48)、e440w(seq id no:50)和d448r(seq id no:52)。
5.这些变体中的每一种的完整序列在说明书描述性部分之后的序列表中示出。本发明还包括作为这些突变位点中的一个或多个的组合的变体,使得一些这样的变体可以具有
这些突变位点中的两个,或这些突变位点中的三个或更多个。
6.本发明进一步包括具有至少一种上述突变的t4 dna连接酶突变型氨基酸序列,但其中t4 dna连接酶突变型氨基酸序列的其余部分仅具有保守取代,使得所述分子与序列表中相应的t4 dna连接酶突变型氨基酸序列(以下称为“变体序列”)具有至少70%、80%、90%、95%、96%、97%、98%或99%的同一性。
7.本发明进一步包括上述突变体的每个氨基酸序列之前的dna序列(即分别为从seq id no:3至seq id no:51的奇数编号的seq id no),并且进一步包括前述dna序列和编码(i)上述t4 dna连接酶突变体中的每一种和(ii)所述变体序列中的任一种的氨基酸序列的其他简并核酸序列(统称为“简并核酸序列”)。
8.本发明进一步包括掺入有任何简并核酸序列的载体;以及用任何这样的载体或简并核酸序列转化并且能够表达任何上述t4 dna连接酶突变型氨基酸序列或变体序列的细胞。
9.本发明进一步包括一种组合物或试剂盒,其包含任何上述t4 dna连接酶突变型氨基酸序列或变体序列、简并核酸序列、或掺入有这种简并核酸序列的载体。本发明还包括一种扩增靶核酸的方法,其中在设计用于扩增靶核酸的反应混合物中采用任何上述t4 dna连接酶突变体或变体序列,并且使试剂混合物经受用于扩增靶核酸的条件。
10.与野生型相比,上述突变型t4 dna连接酶突变体在增加的盐浓度中、在扩增靶dna序列方面具有更高的活性,并且预期所述变体序列也具有这种更高的活性。
附图说明
11.图1a至1c示出了描绘dna底物连接的琼脂糖凝胶(1.2%)图像,其来自在零浓度和然后七种不同nacl浓度(即nacl浓度,其中0mm、50mm、100mm、200mm、250mm、300mm、400mm和500mm)下连接酶活性的顺序测试,其中反应混合物在16℃下孵育60分钟。图1a示出了wt t4 dna连接酶和t4 dna连接酶变体e88k(seq id no:4)、e132k(seq id no:6)、e222k(seq id no:8)、k306e(seq id no:10)、d340r(seq id no:12)、k365e(seq id no:14)、d371a(seq id no:16)和d371g(seq id no:18)。图1b示出了wt t4 dna连接酶和t4 dna连接酶变体d371h(seq id no:20)、d371i(seq id no:22)、d371k(seq id no:24)、d371l(seq id no:26)、d371m(seq id no:28)、d371r(seq id no:30)、d371t(seq id no:32)和d371y(seq id no:34)。图1c示出了wt t4 dna连接酶和t4 dna连接酶变体e438k(seq id no:36)、e440a(seq id no:38)、e440h(seq id no:40)、e440k(seq id no:42)、e440n(seq id no:44)、e440r(seq id no:46)、e440s(seq id no:48)、e440w(seq id no:50)和d448r(seq id no:52)。
具体实施方式
12.术语“生物活性片段”是指t4 dna连接酶突变体的任何片段、衍生物、同源物或类似物,其具有生物分子特有的体内或体外活性;包括例如连接酶活性,或经由连接修复带切口dna中存在的错配。在一些实施方案中,突变型t4 dna连接酶的生物活性片段、衍生物、同源物或类似物在任何感兴趣的体内或体外测定中均具有突变型t4 dna连接酶的任何程度的生物活性。
13.在一些实施方案中,生物活性片段可以任选地包括突变型t4 dna连接酶的任何数量的连续氨基酸残基。本发明还包括编码任何这种生物活性片段的多核苷酸。
14.生物活性片段可以来自转录后加工或可替代剪接rna的翻译,或者可替代地可以通过工程化、批量合成或其他合适的操作产生。生物活性片段包括在天然或内源细胞中表达的片段,以及在表达系统(例如像细菌、酵母、植物、昆虫或哺乳动物细胞)中产生的片段。
15.如本文所用,短语“保守氨基酸取代”或“保守突变”是指一个氨基酸被另一个具有共同特性的氨基酸替换。定义单个氨基酸之间共同特性的功能性方法是分析同源生物体的相应蛋白质之间氨基酸变化的归一化频率(schulz(1979)principles of protein structure[蛋白质结构原理],springer-verlag)。根据此类分析,氨基酸组可以定义为组内的氨基酸优先相互交换,因此在它们对整个蛋白质结构的影响方面彼此最相似(前述schulz(1979))。以这种方式定义的氨基酸组的实例可以包括:“带电荷/极性组”,包括glu、asp、asn、gln、lys、arg和his;“芳族或环状组”,包括pro、phe、tyr和trp;以及“脂族组”,包括gly、ala、val、leu、ile、met、ser、thr和cys。在每个组内,还可以鉴定亚组。例如,带电荷/极性氨基酸的组可以细分为多个亚组,包括:“带正电荷的亚组”,包括lys、arg和his;“带负电荷的亚组”,包括glu和asp;以及“极性亚组”,包括asn和gln。在另一个实例中,芳族或环状组可以细分为多个亚组,包括:“氮环亚组”,包括pro、his和trp;“苯基亚组”,包括phe和tyr。在另一个进一步的实例中,脂族组可以细分为多个亚组,包括:“大脂族非极性亚组”,包括val、leu和ile;“脂族弱极性亚组”,包括met、ser、thr、和cys;以及“小残基亚组”,包括gly和ala。保守突变的实例包括上述子组内氨基酸的氨基酸取代,诸如但不限于:lys取代arg,反之亦然,使得可以保持正电荷;glu取代asp,反之亦然,使得可以保持负电荷;ser取代thr,反之亦然,使得可以保持游离-oh;以及gln取代asn,反之亦然,使得可以保持游离-nh2。“保守变体”是包括一个或多个氨基酸的多肽,所述一个或多个氨基酸已被取代以用具有共同特性的氨基酸(例如,属于如上所述的相同氨基酸组或子组)替换参考多肽(例如,其序列在出版物或序列数据库中公开,或其序列已通过核酸测序确定的多肽)的一个或多个氨基酸。
[0016]
当提及基因时,“突变体”意指相对于天然或野生型基因,所述基因具有至少一个碱基(核苷酸)改变、缺失或插入。突变(一个或多个核苷酸的改变、缺失和/或插入)可以在基因的编码区中,或者可以在内含子、3'utr、5'utr或启动子区域中。作为非限制性实例,突变基因可以是在启动子区域内具有插入的基因,所述插入可以增加或减少所述基因的表达;可以是具有缺失的基因,导致无功能蛋白、截短蛋白、显性阴性蛋白或无蛋白的产生;或者,可以是具有一个或多个点突变的基因,导致所编码蛋白质的氨基酸改变或导致基因转录物的异常剪接。
[0017]
术语“本发明的突变型t4 dna连接酶”和“突变型t4 dna连接酶”在该“具体实施方式”部分中使用时,根据上下文,共同或单独地是指在足以显著降低野生型t4 dna连接酶的连接活性的盐浓度存在下测试并表现出显著连接活性的突变型t4 dna连接酶多肽,它们是:e88k(seq id no:4)、e132k(seq id no:6)、e222k(seq id no:8)、k306e(seq id no:10)、d340r(seq id no:12)、k365e(seq id no:14)、d371a(seq id no:16)、d371g(seq id no:18)、d371h(seq id no:20)、d371i(seq id no:22)、d371k(seq id no:24)、d371l(seq id no:26)、d371m(seq id no:28)、d371r(seq id no:30)、d371t(seq id no:32)、d371y
(seq id no:34)、e438k(seq id no:36)、e440a(seq id no:38)、e440h(seq id no:40)、e440k(seq id no:42)、e440n(seq id no:44)、e440r(seq id no:46)、e440s(seq id no:48)、e440w(seq id no:50)和d448r(seq id no:52)。
[0018]
和/或变体序列和/或简并核酸序列,这些术语在发明内容部分中定义。
[0019]“天然存在”或“野生型”是指在自然界中发现的形式。例如,天然存在或野生型多肽或多核苷酸序列是存在于生物体中的序列,其没有被人为操作有意修饰。
[0020]
关于核酸或多肽序列的术语“同一性百分比”或“同源性”定义为在排列序列以获得最大同一性百分比并引入缺口(如果需要)以实现最大同源性百分比之后,候选序列中与已知多肽相同的核苷酸或氨基酸残基的百分比。n-末端或c-末端插入或缺失不应被解释为影响同源性。核苷酸或氨基酸序列水平上的同源性或同一性可以通过blast(基本局部比对搜索工具(basic local alignment search tool))分析来确定,所述分析使用由程序blastp、blastn、blastx、tblastn和tblastx采用的算法(altschul(1997),nucleic acids res[核酸研究].25,3389-3402和karlin(1990),proc.natl.acad.sci.usa[美国国家科学院院刊]87,2264-2268),所述程序是为序列相似性搜索定制的。blast程序使用的方法是首先考虑查询序列和数据库序列之间的相似片段(有或没有缺口),然后评估被鉴定的所有匹配的统计显著性,最后仅总结满足预先选择的显著性阈值的那些匹配。关于序列数据库相似性搜索中基本问题的讨论,参见altschul(1994),nature genetics[自然遗传学]6,119-129。直方图、描述、比对、期望(即,用于报告与数据库序列匹配的统计显著性阈值)、截止、矩阵和过滤器(低复杂度)的搜索参数可以是默认设置。blastp、blastx、tblastn和tblastx使用的默认评分矩阵是blosum62矩阵(henikoff(1992),proc.natl.acad.sci.usa[美国国家科学院院刊]89,10915-10919),推荐用于长度超过85个单位(核苷酸碱基或氨基酸)的查询序列。
[0021]
在一些实施方案中,本发明涉及用于进行连接反应的方法(以及相关试剂盒、系统、设备和组合物),所述方法包括或由以下组成:在一种或多种核苷酸存在下,使突变型t4 dna连接酶或其生物活性片段与核酸模板接触,并使用突变型t4 dna连接酶或其生物活性片段连接所述一种或多种核苷酸中的至少一种。
[0022]
在一些实施方案中,所述方法可以包括将双链rna或dna多核苷酸链连接到环状分子中。在一些实施方案中,所述方法可以进一步包括通过使用传感器检测指示连接的信号。在一些实施方案中,传感器是isfet。在一些实施方案中,传感器可以包括连接反应中的可检测标记或可检测试剂。
[0023]
在一些实施方案中,本发明涉及用于进行核酸的滚环扩增(参见美国专利号5,714,320,通过引用并入)的方法(以及相关的试剂盒、系统、设备和组合物),所述方法使用突变型t4 dna连接酶作为扩增过程的连接步骤中的酶。扩增包括在溶液中扩增核酸,以及在固体支持物(诸如存在于固体支持物表面上的核酸珠、流动池、核酸阵列或孔)上克隆扩增核酸。
[0024]
制备突变型t4 dna连接酶
[0025]
本发明的突变型t4 dna连接酶可以在任何合适的宿主系统中表达,所述宿主系统包括细菌、酵母、真菌、杆状病毒、植物或哺乳动物宿主细胞。对于细菌宿主细胞,用于指导本公开核酸构建体转录的合适启动子包括从以下获得的启动子:大肠杆菌(e.coli)乳糖操
纵子、天蓝色链霉菌琼脂糖酶基因(daga)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacb)、地衣芽孢杆菌α-淀粉酶基因(amyl)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amym)、解淀粉芽孢杆菌α-淀粉酶基因(amyq)、地衣芽孢杆菌青霉素酶基因(penp)、枯草芽孢杆菌xyla和xylb基因和原核β-内酰胺酶基因(villa-kamaroff等人,1978,proc.natl acad.sci.usa[美国国家科学院院刊]75:3727-3731),以及tac启动子(deboer等人,1983,proc.natl acad.sci.usa[美国国家科学院院刊]80:21-25)。
[0026]
对于丝状真菌宿主细胞,用于指导本公开核酸构建体转录的合适启动子包括从以下酶的基因获得的启动子:米曲霉taka淀粉酶、米黑根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaa)、米黑根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉乙酰胺酶和尖孢镰孢胰蛋白酶样蛋白酶(wo 96/00787),以及na2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶的基因的启动子的杂交体),及其突变、截短和杂交启动子。
[0027]
在酵母宿主中,有用的启动子可以来自以下酶的基因:酿酒酵母(saccharomyces cerevisiae)烯醇化酶(eno-1)、酿酒酵母半乳糖激酶(gal1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh2/gap)和酿酒酵母3-磷酸甘油酸激酶。酵母宿主细胞的其他有用的启动子由romanos等人,1992,yeast[酵母]8:423-488描述。
[0028]
对于杆状病毒表达,来源于鳞翅目(蛾和蝴蝶)的昆虫细胞系,诸如草地贪夜蛾被用作宿主。基因表达受强启动子(例如,ppolh)的控制。
[0029]
植物表达载体基于根癌土壤杆菌(agrobacterium tumefaciens)的ti质粒,或基于烟草花叶病毒(tmv)、马铃薯x病毒或豇豆花叶病毒。植物表达载体中常用的组成型启动子是花椰菜花叶病毒(camv)35s启动子。
[0030]
对于哺乳动物表达,培养的哺乳动物细胞系诸如中国仓鼠卵巢(cho)、cos,包括人细胞系诸如hek和hela,可以用于产生突变型t4 dna连接酶。哺乳动物表达载体的实例包括腺病毒载体、psv和pcmv系列质粒载体、牛痘病毒和逆转录病毒载体以及杆状病毒。巨细胞病毒(cmv)和sv40的启动子通常用于哺乳动物表达载体中以驱动基因表达。非病毒启动子,诸如延伸因子(ef)-1启动子也是已知的。
[0031]
用于表达的控制序列也可以是合适的转录终止子序列,即,由宿主细胞识别以终止转录的序列。终止子序列可操作地连接至编码所述多肽的核酸序列的3'末端。可以使用在所选择宿主细胞中具有功能性的任何终止子。
[0032]
例如,用于丝状真菌宿主细胞的示例性转录终止子可以从以下酶的基因获得:米曲霉taka淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖孢镰孢胰蛋白酶样蛋白酶。
[0033]
用于酵母宿主细胞的示例性终止子可以从以下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素c(cyc1)和酿酒酵母甘油醛-3-磷酸脱氢酶。
[0034]
用于昆虫、植物和哺乳动物宿主细胞的终止子也是熟知的。
[0035]
控制序列也可以是合适的前导序列,即对由宿主细胞进行的翻译很重要的mrna的非翻译区。前导序列可操作地连接至编码所述多肽的核酸序列的5'末端。可以使用在所选择宿主细胞中具有功能性的任何前导序列。用于丝状真菌宿主细胞的示例性前导序列从米曲霉taka淀粉酶和构巢曲霉磷酸丙糖异构酶的基因获得。用于酵母宿主细胞的合适的前导
序列从以下酶的基因获得:酿酒酵母烯醇化酶(eno-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子、以及酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(adh2/gap)。
[0036]
控制序列还可以是多腺苷酸化序列,一种可操作地连接至所述核酸序列的3'末端并且当转录时由宿主细胞识别为将多腺苷酸残基添加至所转录的mrna的信号的序列。在所选择宿主细胞中具有功能性的任何多腺苷酸化序列均可以用于本发明中。用于丝状真菌宿主细胞的示例性多腺苷酸化序列可以来自以下酶的基因:米曲霉taka淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖孢镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
[0037]
控制序列还可以是编码与多肽的氨基末端连接的氨基酸序列并指导所编码多肽进入细胞的分泌途径的信号肽编码区。核酸序列的编码序列的5'端本身可以含有在翻译阅读框中与编码分泌的多肽的编码区的区段天然连接的信号肽编码区。可替代地,编码序列的5'端可以含有对编码序列是外源的信号肽编码区。在编码序列天然地不含有信号肽编码区的情况下,可能需要外源信号肽编码区。
[0038]
可替代地,外源信号肽编码区可以单纯地替代天然信号肽编码区以便增强多肽的分泌。然而,可以使用指导已表达多肽进入所选择宿主细胞的分泌途径的任何信号肽编码区。
[0039]
用于细菌宿主细胞的有效信号肽编码区是从以下酶的基因获得的信号肽编码区:芽孢杆菌ncib 11837麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprt、nprs、nprm)、以及枯草芽孢杆菌prsa。进一步的信号肽由simonen和palva,1993,microbiol rev[微生物评论]57:109-137描述。
[0040]
用于丝状真菌宿主细胞的有效信号肽编码区可以是从以下酶的基因获得的信号肽编码区:米曲霉taka淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米黑根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、以及疏棉状腐质霉脂肪酶。
[0041]
用于酵母宿主细胞的有用的信号肽可以来自酿酒酵母α-因子和酿酒酵母转化酶的基因。用于其他宿主细胞系统的信号肽也是熟知的。
[0042]
控制序列还可以是编码位于多肽的氨基末端处的氨基酸序列的前肽编码区。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为成熟的活性多肽。前肽编码区可以从以下酶的基因获得:枯草芽孢杆菌碱性蛋白酶(apre)、枯草芽孢杆菌中性蛋白酶(nprt)、酿酒酵母α-因子、米黑根毛霉天冬氨酸蛋白酶、以及嗜热毁丝霉乳糖酶(wo95/33836)。
[0043]
在信号肽和前肽区二者都存在于多肽的氨基末端处的情况下,所述前肽区位于紧邻多肽的氨基末端,并且所述信号肽区位于紧邻前肽区的氨基末端。
[0044]
还可期望的是添加调节序列,其允许相对于宿主细胞的生长调节突变型t4 dna连接酶的表达。调节系统的实例是响应于化学或物理刺激(包括调节化合物的存在)而引起基因表达被开启或关闭的那些。在原核宿主细胞中,合适的调节序列包括lac、tac和trp操纵子系统。在酵母宿主细胞中,合适的调节系统包括例如,adh2系统或gal1系统。在丝状真菌中,合适的调节序列包括takaα淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子。用于其他宿主细胞的调节系统也是熟知的。
[0045]
调节序列的其他实例是允许基因扩增的那些序列。在真核系统中,这些包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下,编码本发明kred多肽的核酸序列将与调节序列可操作地连接。
[0046]
另一个实施方案包括重组表达载体,其包含编码工程化突变型t4 dna连接酶或其变体的多核苷酸,和一个或多个表达调节区诸如启动子和终止子,以及复制起点,这取决于它们将被引入的宿主的类型。上述各种核酸和控制序列可以连接在一起以产生重组表达载体,所述重组表达载体可以包括一个或多个便利的限制位点以允许编码突变型t4 dna连接酶的核酸序列在此类位点处的插入或取代。可替代地,可以通过将核酸序列或包含所述序列的核酸构建体插入用于表达的适当载体中来表达突变型t4 dna连接酶的核酸序列。在产生表达载体时,编码序列位于载体中,使得编码序列与用于表达的适当控制序列可操作地连接。
[0047]
重组表达载体可以是可以方便地经受重组dna程序并且可以引起突变型t4 dna连接酶多核苷酸序列表达的任何载体(例如,质粒或病毒)。载体的选择将通常取决于载体与待引入载体的宿主细胞的相容性。载体可以是直链质粒或闭合环状质粒。
[0048]
表达载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制不依赖于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何手段。可替代地,载体可以是这样的载体,当它引入宿主细胞中时被整合到基因组中并与其中已整合了它的一个或多个染色体一起被复制。此外,可以使用单独的载体或质粒或共同含有待引入宿主细胞基因组的总dna的两个或更多个载体或质粒,或可以使用转座子。
[0049]
本文表达载体优选地含有一个或多个选择性标记,其允许容易地选择转化的细胞。选择性标记是一种基因,其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原营养等。细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性(诸如氨苄青霉素、卡那霉素、氯霉素(实施例1)或四环素抗性)的标记。用于酵母宿主细胞的合适标记是ade2、his3、leu2、lys2、met3、trp1、和ura3。用于丝状真菌宿主细胞中的选择性标记包括但不限于amds(乙酰胺酶)、argb(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niad(硝酸还原酶)、pyrg(乳清酸核苷-5'-磷酸脱羧酶)、sc(硫酸腺苷酰基转移酶)和trpc(邻氨基苯甲酸合酶)、以及其等效物。用于曲霉属细胞中的实施方案包括构巢曲霉或米曲霉的amds和pyrg基因,以及吸水链霉菌的bar基因。用于昆虫、植物和哺乳动物细胞的选择性标记也是熟知的。
[0050]
本发明的表达载体优选地含有允许载体整合到宿主细胞的基因组中或载体在细胞中不依赖于基因组的自主复制的一个或多个元件。对于整合到宿主细胞基因组中,载体可以依赖于编码所述多肽的核酸序列或用于通过同源或非同源重组将载体整合到基因组中的所述载体的任何其他元件。
[0051]
可替代地,表达载体可以含有另外的核酸序列,用于指导通过同源重组整合到宿主细胞的基因组中。另外的核酸序列使得载体能够整合到宿主细胞基因组中一个或多个染色体的一个或多个精确位置处。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码或编码核酸序列。另一方面,载体可以通过非同源重组整合到宿主细胞的基因组中。
edta、30%甘油、50mm tris-hcl ph 8.0、0.0125%溴酚蓝、0.1%sds和5x凝胶红核酸染色剂(加利福尼亚州弗里蒙特的biotium公司(biotium,fremont,ca)))。
[0067]
使用1.2%琼脂糖凝胶在180v下运行35分钟进行凝胶电泳。每个凝胶一式两份展示野生型t4 dna连接酶样品和47个变体t4 dna连接酶样品。通过在任何浓度下比wt更有效地完成连接而表明具有更高耐盐性的变体被鉴定用于二次筛选和确认。
[0068]
二次筛选包括用盐滴定挑战每个先前选择的突变体以及野生型。该滴定中测试的nacl浓度为:0mm、50mm、100mm、200mm、250mm、300mm、400mm和500mm。每个反应含有400ng总蛋白(4μl储备蛋白),加上16μl主混合物,所述主混合物由1x t4 dna连接酶反应缓冲液(新英格兰生物实验室,目录号b0202a:50mm tris-hcl、10mm mgcl2、1mm atp、10mm dtt)、10ng底物、实现每种盐浓度所需体积的5m nacl和足够的水(以实现每个反应的总体积为20μl)组成。将连接反应在16℃下孵育60分钟,然后在80℃下经受2分钟的热休克以停止任何进一步的活动。最后,向每个反应中添加6μl终止液(120mm edta、30%甘油、50mm tris-hcl ph 8.0、0.0125%溴酚蓝、0.1%sds和5x凝胶红核酸染色剂(加利福尼亚州弗里蒙特的biotium公司))。
[0069]
使用1.2%琼脂糖凝胶在180v下运行35分钟进行凝胶电泳。每个凝胶展示野生型t4 dna连接酶样品和11个变体t4 dna连接酶样品,每个样品在8个泳道上的盐范围为0-500mm。鉴定了与野生型t4 dna连接酶相比,对反应混合物中盐的存在表现出增加的耐受性的变体,结果在图1中示出;并且还在表1中列出了每种突变体在保持活性的同时对盐浓度的耐受限值。这些变体是e88k、e132k、e222k、k306e、d340r、d371h、k365e、e438k、d448r、d371a、d371g、d371i、d371k、d371l、d371m、d371r、d371t、d371y、e440a、e440h、e440k、e440n、e440r、e440s、e440w和d448r。
[0070]
与野生型相比,显示变体的连接活性的合成琼脂糖凝胶图像显示于图1中。所述图像显示双链连接的超螺旋质粒为最低条带,未连接的线性化质粒为中间条带,并且微弱的上条带为超螺旋单链连接的带切口环状dna。随着每个连接系列上盐浓度从左到右增加,连接的底物最终消失,并且由于反应缓冲液中存在过量nacl使连接酶灭活,因此仅剩余未连接的底物和超螺旋的带切口环状dna。
[0071]
表1:工程化t4 dna连接酶变体的摩尔盐浓度限值
[0072]
突变nacl(mm)e88k250e132k250e222k250k306e250d340r250k365e250d371a250d371g400d371h250d371i300d371k300
d371l300d371m300d371r400d371t300d371y300e440s250e438k200e440a300e440h400e440n300e440k400e440r400e440w300d448r300
[0073]
本文所述的具体方法和组合物是优选实施方案的代表,并且是示例性的且不旨在限制本发明的范围。考虑到本说明书,本领域技术人员将想到其他目的、方面和实施方案,并且包含在由权利要求书的范围所限定的本发明的精神内。对于本领域技术人员来说,将显而易见的是,在不脱离本发明的范围和精神的情况下,可以对本文公开的发明进行各种替换和修改。可以在不存在本文没有明确公开为必要的任何一种或多种要素、或者任何一种或多种限制的情况下适当地实践本文说明性描述的本发明。因此,例如,在本文的每种情况下,在本发明的实施方案或实例中,术语“包含”、“包括”、“含有”等中的任一项都应该被广泛而无限制地阅读。本文中示例性描述的方法和过程可以不同的步骤顺序适当地实施,并且它们不必限于本文或权利要求中指示的步骤顺序。还应注意,除非上下文另外清楚地指出,否则如在本文以及在所附权利要求所用的,单数形式“一个/一种”以及“所述”包括复数指示物,并且复数包括单数形式。在任何情况下,都不能将本专利申请解释为限于本文具体公开的具体实例或实施方案或方法。在任何情况下,本专利申请都不应被解释为受专利商标局的任何审查员或任何其他官员或雇员所做的任何声明的限制,除非此声明由申请人在响应性书面材料中明确且无条件或专门保留地采用。
[0074]
已经在本文中宽泛且概括地对本发明进行了描述。落在类属公开之内的更窄的种类和亚属的分类中的每一个也形成了本发明的一部分。已经采用的术语和表达被用作描述的术语且没有限制性,并且并非旨在使用此类术语和表达而将所示出和描述的特征的任何等效物或其部分排除在外,但是将认识到的是提出要求保护的本发明范围内的不同修改是可能的。因此,应当理解,虽然已经通过优选实施方案和任选特征具体地公开了本发明,但本领域技术人员可以采用本文所公开概念的修改和变更,包括但不限于变体序列,并且认为此类修改和变更在由所附权利要求限定的本发明范围内。
[0075]
seq id no:1t4 dna连接酶ch野生型dna
[0076][0077]
seq id no:2t4 dna连接酶ch野生型蛋白
[0078][0079][0080]
seq id no:3t4 dna连接酶ch e88k dna
[0081][0082]
seq id no:4t4 dna连接酶ch e88k蛋白
[0083][0084]
seq id no:5t4 dna连接酶ch e132k dna
[0085]
[0086][0087]
seq id no:6t4 dna连接酶ch e132k蛋白
[0088][0089]
seq id no:7t4 dna连接酶ch e222k dna
[0090][0091]
seq id no:8t4 dna连接酶ch e222k蛋白
[0092][0093]
seq id no:9t4 dna连接酶ch k306e dna
[0094][0095]
seq id no:10t4 dna连接酶ch k306e蛋白
[0096][0097]
seq id no:11t4 dna连接酶ch d340r dna
[0098]
[0099][0100]
seq id no:12t4 dna连接酶ch d340r蛋白
[0101][0102]
seq id no:13t4 dna连接酶ch k365e dna
[0103]
[0104][0105]
seq id no:14t4 dna连接酶ch k365e蛋白
[0106][0107]
seq id no:15t4 dna连接酶ch d371a dna
[0108][0109]
seq id no:16t4 dna连接酶ch d371a蛋白
[0110][0111][0112]
seq id no:17t4 dna连接酶ch d371g dna
[0113][0114]
seq id no:18t4 dna连接酶ch d371g蛋白
[0115][0116]
seq id no:19t4 dna连接酶ch d371h dna
[0117]
[0118][0119]
seq id no:20t4 dna连接酶ch d371h蛋白
[0120][0121]
seq id no:21t4 dna连接酶ch d371i dna
[0122][0123]
seq id no:22t4 dna连接酶ch d371i蛋白
[0124][0125]
seq id no:23t4 dna连接酶ch d371k dna
[0126][0127]
seq id no:24t4 dna连接酶ch d371k蛋白
[0128][0129]
seq id no:25t4 dna连接酶ch d371l dna
[0130]
[0131][0132]
seq id no:26t4 dna连接酶ch d371l蛋白
[0133][0134]
seq id no:27t4 dna连接酶ch d371m dna
[0135]
[0136][0137]
seq id no:28t4 dna连接酶ch d371m蛋白
[0138][0139]
seq id no:29t4 dna连接酶ch d371r dna
[0140][0141]
seq id no:30t4 dna连接酶ch d371r蛋白
[0142][0143]
seq id no:31t4 dna连接酶ch d371t dna
[0144][0145]
seq id no:32t4 dna连接酶ch d371t蛋白
[0146][0147]
seq id no:33t4 dna连接酶ch d371y dna
[0148]
[0149][0150]
seq id no:34t4 dna连接酶ch d371y蛋白
[0151][0152]
seq id no:35t4 dna连接酶ch e438k dna
[0153][0154]
seq id no:36t4 dna连接酶ch e438k蛋白
[0155]
[0156][0157]
seq id no:37t4 dna连接酶ch e440a dna
[0158][0159]
seq id no:38t4 dna连接酶ch e440a蛋白
[0160][0161]
seq id no:39t4 dna连接酶ch e440h dna
[0162]
[0163][0164]
seq id no:40t4 dna连接酶ch e440h蛋白
[0165][0166]
seq id no:41t4 dna连接酶ch e440k dna
[0167][0168]
[0169]
seq id no:42t4 dna连接酶ch e440k蛋白
[0170][0171]
seq id no:43t4 dna连接酶ch e440n dna
[0172][0173]
seq id no:44t4 dna连接酶ch e440n蛋白
[0174][0175]
seq id no:45t4 dna连接酶ch e440r dna
[0176][0177]
seq id no:46t4 dna连接酶ch e440r蛋白
[0178][0179]
seq id no:47t4 dna连接酶ch e440s dna
[0180]
[0181][0182]
seq id no:48t4 dna连接酶ch e440s蛋白
[0183][0184]
seq id no:49t4 dna连接酶ch e440w dna
[0185][0186]
seq id no:50t4 dna连接酶ch e440w蛋白
[0187]
[0188][0189]
seq id no:51t4 dna连接酶ch d448r dna
[0190][0191]
seq id no:52t4 dna连接酶ch d448r蛋白
[0192]
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1