具有增加产率的支链淀粉酶变体的制作方法

文档序号:438877阅读:243来源:国知局
专利名称:具有增加产率的支链淀粉酶变体的制作方法
技术领域
01本发明涉及酶促肽支链淀粉酶的新型变体,编码所述新型肽 的基因序列,包括那些基因序列的表达载体以及表达新型支链淀粉酶 变体的生物。而且,本发明涉及这些新型支链淀粉酶肽在纺织、发酵、 食品和其它工业中的应用。
背景技术
02支链淀粉酶是在许多工业应用,特别是在食品和饮料工业中 被发现有用的酶。支链淀粉酶是淀粉脱支酶,并在淀粉水解产物的脱 支(用于改进面团性质)、(3-极限葡聚糖((3-limitdextmns)的脱支(用于酿 造啤酒和强麦酒(ales))以及从例如玉米、马铃薯、小麦、木薯和水 稻生产糖浆中是有效的。支链淀粉酶是分类为EC3.2丄41的酶,并且 这种酶的特征是它们水解例如支链淀粉和普鲁分支葡聚糖中a-I,6-糖苷 键的能力。
03支链淀粉酶是细菌,特别是芽孢杆菌属的产物。用于工业应 用的支链淀粉酶的生产并非没有问题。支链淀粉酶可被同样由细菌产 生的各种蛋白酶快速降解,从而使大量支链淀粉酶的回收低效且昂贵。 本领域技术人员已经设计了方法,以通过限制培养物中支链淀粉酶的 降解来增加产量。例如,我们以前已经示出,从支链淀粉酶生产菌株 删除AprL和Mpr基因(它们表达蛋白酶)对于经济表达活性支链淀粉酶是必要的。而且,发酵时间限制在51-60小时,以限制支链淀粉酶产物
的蛋白水解性降解和活性损失。Svendsen设计了支链淀粉酶变体,所 述支链淀粉酶变体改变酶的三维构象,以增加酶的热稳定性或改变酶 如何降解其底物(见美国专利6,350,599和6,838,257以及美国申请第 2004/0082028号)。
04最近,我们已经示出,支链淀粉酶降解的时间被测定,结果 如下在30和50小时之间,观察全长支链淀粉酶分子部分剪切成分 别缺少N-端98和102个氨基酸的截短的分子。剪切分别发生在谷氨酸 残基E99和E103的N-末端,并且可以通过HPLC可见。意料不到地, 1-98和1-102被截短的支链淀粉酶分子保留支链淀粉酶活性,并且, 甚至更意料不到的是,表明这种活性高于全长支链淀粉酶的活性。51 小时后,支链淀粉酶分子进一步降解导致活性降低,最后所有活性消 失。
05尽管如此,支链淀粉酶肽和编码这些肽的核苷酸序列的设计 仍有改进的余地。因此,所需要的是更高效地生产支链淀粉酶的化合 物和方法,例如,通过限制蛋白水解性降解,增加发酵滴度(fermentation titer)或增加支链淀粉酶活性。
发明概述
06本发明涉及支链淀粉酶——一种肽酶——的新的和非显而易 见形式。本发明的支链淀粉酶包括新的修饰,所述新的修饰导致生产 滴度和/或耐受降解(例如,由蛋白酶引起的酶促降解)方面的优越性能 和/或在靶向底物材料的分解中比亲本("野生型")肽更具有活性。
07在这方面,本发明涉及肽SEQIDNO: 2、 SEQIDNO: 4和 SEQIDNO: 6的支链淀粉酶,分别如图7(b)、 8(b)和9(b)所示。本发 明还涉及编码氨基酸序列SEQ ID NOS: 2、 4和6的核苷酸序列。各 自的核苷酸序列还分别作为SEQ ID NOS: 1、 3禾B 5在图7(a)、 8(a) 和9(a)中示出。如本领域所熟知,遗传密码冗余,多个核苷酸密码子编 码相同氨基酸。因此,本发明又涉及编码肽SEQ ID NOS: 2、 4和6 的任何可选的核苷酸序列。本领域普通技术人员能够基于本说明书和 本领域知识的教导,确定编码本发明肽序列的核苷酸序列。08本发明涉及编码本发明肽的表达构建物。本发明不限于任何 特定的表达构建物,只要其能够表达本发明的肽。在这方面,合适的
表达构建物的非限制性实例示意地显示在图4-6的(a)部分。
09如在本说明书的详述和实施例部分中的更详细的解释,在一 种实施方式中,通过密码子优化技术来修饰编码亲本支链淀粉酶肽(来 自^c/〃^^ra柳:/kww)的序列,以产生密码子优化的核苷酸序列[SEQ ID NO: 1],所述优化的核苷酸序列编码野生型(即,亲本)支链淀粉 酶氨基酸序列[SEQIDNO: 2]的复制品。编码氨基酸序列[SEQIDNO: 2]的核苷酸序列在两个方向上被克隆至地衣芽孢杆菌(A //c/7em/or,》 整合载体pICatH的Xhol位点,产生表达构建物的Oril (pICatH-PUL-Oril)和Ori2 (pICatH- PUL-Ori2)形式。
10在另一种实施方式中,编码亲本支链淀粉酶肽的序列被修饰, 以产生支链淀粉酶肽,其中N-端的104个氨基酸已被删除。在-种实 施方式中,编码这种新型支链淀粉酶的核苷酸序列也是密码子优化的 [SEQIDNO: 3]。由该构建物,PULm 104表达的肽在SEQIDNO: 4 中给出(见,图8(b))。编码[SEQIDNO: 4]的核苷酸序列在两个方向 上被克隆到地衣芽孢杆菌整合载体pICatH的屈ol位点,产生表达构 建物的Oril(pICatH-PULml04-Oril)和Ori2 (pICatH-PULml04-Ori2)形式。
11在另一种实施方式中,编码亲本支链淀粉酶肽的序列被改变, 以将99和103位上的氨基酸残基从谷氨酸(E)置换为谷氨酰胺(Q),从
而使所产生的肽更能抵抗在这些位置的蛋白水解降解。在一种实施方 式中,编码这种新型支链淀粉酶的核苷酸序列也是密码子优化的[SEQ ID NO: 5]。由该核酸序列PUL—E99Q—E103Q表达的肽在SEQIDNO: 6中给出。编码[SEQIDNO: 6]的核苷酸序列在两个方向上被克隆到地 衣芽孢杆菌整合载体pICatH的Xhol位点,产生表达构建物的Oril (pICatH-PUL—E99Q—E103Q-Oril) 禾B Ori2 (plCat-
PUL—E99Q—E103Q-Ori2)形式。
12本发明还涉及将本发明的表达构建物转染到适合的宿主生 物。本发明不限于任何具体宿主生物。宿主生物可以是,例如,微生 物、真核细胞或组织培养物、植物细胞或组织培养物、或真菌细胞或 组织培养物。在优选的实施方式中,宿主生物为微生物。优选的宿主
7生物包括但不限于芽孢杆菌种(B"C,7/W (特别是枯草芽孢杆菌
(Bac〃/i^ w6"to)、 i也衣芽 包杆菌(及//c/ze"i/^/7m'i0禾口及deram折"'cflmO, 埃希氏大肠杆菌,里氏木霉,啤酒酵母或黑曲霉。在最优选的实施方 式中,宿主生物是地衣芽孢杆菌。
13本发明涉及从培养本发明的宿主生物的培养基中分离和纯化 本发明的肽。在这点上,本发明不限于任何特定的分离和纯化技术, 只要其产生10%的最低纯度。在更优选的实施方式中,分离和纯化的 肽的最低纯度为25%,在甚至更优选的实施方式中,分离和纯化的肽 的最低纯度为50%。还在更优选的实施方式中,分离和纯化的肽的最 低纯度为75%。在最优选的实施方式中,本发明分离和纯化的肽的最 低纯度为90 %。最低纯度可通过总干重百分比或本领域已知的其它适 合的方法测量。
14本发明不限于任何分离和纯化本发明的肽的具体纯化方法。 本领域已知的任何肽纯化方法都是适合的。合适的纯化方法非限制性 实例包括亲和层析、沉淀、大小排阻层析、薄层层析、电泳、大小过 滤等。
15本领域普通技术人员将认识到本发明的支链淀粉酶生物学 活性片段可用于替代本发明上下文中的全长序列或等价物。"生物学 活性片段"意图包括本发明序列的任何类似物、模拟、平截、缺失和/ 或置换。本发明的支链淀粉酶的模拟肽和支链淀粉酶活性结构域可应 用结构数据进行计算机设计,如本领域已知的。另外,在本发明一种 实施方式中,考虑本发明支链淀粉酶核苷酸序列的类似物和突变可通 过定向分子进化产生。所述定向分子进化的技术在本领域是已知的 (见,例如,Stemmer等人的美国专利第5,605,793号或Short的美国专 利第6,537,776号,其通过引用在此并入)。与本发明的肽相比,由定向 分子进化产生的蛋白质将具有更小、更大或相同的作为支链淀粉酶起 作用的能力。
16在本发明另一种实施方式中,本发明的肽被用作融合蛋白, 其具有例如,其它的结构性或功能性肽结构域。这种结构域可以,例 如,赋予融合蛋白其它的酶促能力或将肽限定在表面。
17本发明的肽还包括那些由于存在多个基因、可选的转录事件、可选的RNA剪接事件和可选的翻译和翻译后事件而出现的肽。多肽可 在体系例如培养的细胞中表达,当表达的支链淀粉酶在天然细胞中表 达时所述体系导致出现基本上相同的翻译后修饰,或在这样的体系中 表达,当在天然细胞中表达时所述体系导致出现的翻译后修饰删除。
18本发明还包括组合物,所述组合物包括一种或多种支链淀粉
酶肽(或编码它的核酸)和一种或多种另外的成分,例如载体、稀释剂 或溶剂。所述另外的成分可以是使组合物可用于体外、体内、制药或 兽医应用的成分。
19在另一方面,本发明提供基本上纯的核酸,所述核酸具有或 包括编码肽的核苷酸序列,其氨基酸序列包括或者是本发明支链淀粉 酶肽的序列。
20在优选的实施方式中,本主题支链淀粉酶核酸将包括转录调
控序列,例如,转录启动子或转录增强子序列中的至少一个,其可操 作地连接至支链淀粉酶基因序列,例如使支链淀粉酶基因序列适合用 作表达载体。
21而在进一步优选的实施方式中,编码本发明支链淀粉酶肽的 核酸,在严格条件下与核酸探针杂交,所述核酸探针对应于SEQ ID NOS: 1、3或5的至少12个连续核苷酸,更优选地对应于SEQ ID NO: 1、 3或5的至少20个连续核苷酸。
22本发明的另一种优选实施方式提供本文描述的支链淀粉酶在 多种工业装置中的应用。例如,本发明涉及本发明的新型支链淀粉酶 变体在食品原料(包括,但不限于各种生面团和糖浆)、饮料(包括且不 限于各种酿造饮料,如啤酒和强麦酒)、生物乙醇和众多本领域普通技 术人员已知的其它产品的生产中的应用。
附图简述
23

图1显示在本方案中设计的支链淀粉酶方法和支链淀粉酶变 体的示意图。
24图2示出存在于本发明制造的支链淀粉酶表达菌株中的构建 体的分子结构,其与菌株BMP 139中的支链淀粉酶表达构建物相比较。25图3示出pICatH载体的示意图。pICatH载体包含温度敏感
9的复制起点(oripE194,用于在芽孢杆菌Cgacz'〃w力中复制)、ori pBR322
(用于在大肠杆菌(£.中扩增)、用于筛选的新霉素抗性基因和具
有重复的天然地衣芽孢杆菌(及/z'c/^m/om^)氯霉素抗性基因(cat)—
一用于筛选、染色体整合和盒扩增。
26图4示出pICatH-PUL0ril构建物的示意图。
27图5示出pICatH-PULml04Oril构建物的示意图。
28图6示出pICatH-PUL—E99Q_E103Q Ori构建物的示意图。
29图7A-B示出密码子优化的"野生型"支链淀粉酶(PUL)
的(a)核酸序列[SEQIDNO: l]和(b)氨基酸序列[SEQ ID NO: 2]。
30图8A-B示出PULml04支链淀粉酶的(a)核酸序列[SEQ ID
NO: 3]和(b)氨基酸序列[SEQIDNO: 4]。
0031图9A-B示出PUL_E99Q—E103Q支链淀粉酶的(a)核酸序
歹U[SEQIDNO: 5]和(b)氨基酸序列[SEQIDNO: 6]。
定义部分
32应当注意,如本说明书和所附权利要求书中使用的,单数形 式"一"(a) 、 "一" (an)和"该"("the")包括复数指代物, 除非上下文另外明确说明。因此,例如,提及含有"化合物"("a compound")的组合物包括两种或多种化合物的混合物。还应注意, 术语"或"通常使用的意义包括"和/或",除非上下文另有明确说明。
33术语"支链淀粉酶"是指一种特定种类的葡聚糖酶,降解普 鲁分支葡聚糖的淀粉分解内酶。它是由例如克雷伯菌属 的革兰氏阴性细菌作为细胞外的细胞表面锚定脂蛋白产生的。但是, 革兰氏阳性细菌产生支链淀粉酶作为分泌蛋白。I型支链淀粉酶特定地 攻击a-l,6键,而II型支链淀粉酶也能够水解oc-l,4键。它还可由某些
其它细菌和古细菌产生。支链淀粉酶在生物技术中用作去污剂。支链 淀粉酶(EC 3.2丄41)还被称为普鲁分支葡聚糖-6-葡聚糖水解酶(脱支 化酶)。普鲁分支葡聚糖被认为是由a-l,6-糖苷键连接的麦芽三糖单位的 链。支链淀粉酶水解切割普鲁分支葡聚糖(a-葡聚糖多糖)。
34术语"密码子优化"是指提高表达水平的技术,其通过用编 码相同氨基酸但被宿主生物更有效处理的密码子置换编码序列中的核苷酸密码子进行。不同物种之间的密码子偏好性可显著不同。为提高 外源蛋白在特定表达系统(细菌、真菌、酵母、昆虫、植物或哺乳动物 细胞)中的表达水平,很重要的是调整外源蛋白密码子的频率,以匹配 宿主表达系统密码子的频率。 一个典型的实例是GFP(绿色荧光蛋白,
green fluorescent protein),其被优化以在哺乳动物细胞中获得高水平表 达。因此,可将密码子优化用于在多种宿主生物中表达本发明蛋白一 一在所述宿主生物中这种序列可能不能有效表达,如果进行表达的话。35术语"表达载体"如本文使用是指重组DNA分子,其含有 所期望的编码序列和适合的核酸序列,它们对于可操作连接的编码序 列在具体宿主生物中表达是必需的。原核生物表达所必需的核酸序列 包括启动子,任选地,操作子序列,核糖体结合位点和可能的其它序 列。
36如本文使用的"异源启动子"是指天然地不与基因或纯化的 核酸连接的启动子。术语"启动子"、"启动子元件"或"启动子序 列"如本文使用是指当连接至感兴趣的核苷酸序列时,能够控制感兴 趣的核苷酸序列转录为mRNA的DNA序列。启动子典型地,虽然不 是必要地,位于感兴趣的核苷酸序列的5,(即上游),启动子控制到 mRNA的转录并提供用于RNA聚合酶特异结合的位点和用于转录起始
的其它转录因子。
37应用于调控元件的术语"细胞类型特异的"或"宿主生物特 异的"或等同术语是指这样的调节元件,其能够指导感兴趣的核苷酸 序列在特定类型的细胞或生物中选择性表达——所述相同的感兴趣核 苷酸序列在不同类型细胞或生物中、相同组织内相对地没有表达。当 被应用于调节元件时,术语"细胞类型特异的"或"宿主生物特异的" 也指这样的调控元件,其能够促进感兴趣的核苷酸序列分别在单一组 织或生物内的区域中选择性表达。
38肽的"分离"、"纯化制备"或"基本上纯的制备物"如本 文使用是指这样的多肽,其已被鉴定并从至少一种通常与其天然状态 结合或从其实际来源获得的污染物中分离。所述至少一种其它污染物 可以是,例如,与其一起天然发生的其它蛋白、脂肪和核酸。优选地, 多肽还从例如抗体或凝胶基质的物质分离,所述凝胶基质例如聚丙烯
ii酰胺,用于纯化所述多肽。优选地,多肽占纯化制备物干重的至少10、
20、 50、 70、 80或95%。优选地,制备物包含足够的多肽用于蛋白 测序;至少l、 10或100毫克的多肽;至少l、 10或100毫克的多肽。
39"纯化的细胞制备物"如本文使用是指在植物或动物细胞的 情况下,细胞的体外制备物而不是全部完整的植物或动物。在培养的 细胞或微生物细胞的情况下,其由至少10%和更优选地50%的目标 细胞制备物组成。
40"基本上纯的核酸",例如,基本上纯的DNA,是指这样 的核酸,其是如下的一种或两种不与一个或两个序列例如编码序列 直接邻近,其与所述编码序列在核酸所来源的生物的天然发生的基因 组中直接邻近(即, 一个在5'端而一个在3'端);或其基本上没有这样的 核酸序列^其在所述核酸来源的生物中存在。术语包括,例如,重 组DNA,其整合到载体中,例如,整合到自主复制的质粒或病毒中, 或到原核生物或真核生物的基因组DNA中,或作为独立于其它DNA 序列的单独分子(例如,由PCR或限制内切酶处理产生的cDNA或基因 组DNA片段)存在。另外,术语"分离的",当用于涉及核酸时,如 在"分离的核酸序列"中是指这样的核酸序列,其被鉴定并从至少--种通常与其以天然状态结合或从其实际来源获得的污染物核酸中分 离。分离的核酸是以不同于在自然中发现的形式或设置存在的核酸。 相反地,未分离的核酸是指核酸例如DNA和RNA,它们以天然状态 存在。例如,给定的DNA序列(例如,基因)在宿主细胞染色体上发现, 与比邻基因(neighboring gene)相邻;RNA序列,如编码特定蛋白的 特定mRNA序列,在细胞中发现,作为与众多编码众多蛋白质的其它 mRNA—起的混合物。然而,包含例如SEQIDNO:l的分离的核酸序 列包括,例如,在细胞中的核酸,所述细胞通常含有SEQ ID NO:l, 其中所述核酸序列在不同于天然细胞的染色体内或染色体外位置,或 另外地,由与在自然中发现的核酸序列不同的核酸序列侧翼。分离的 核酸序列可以单链或双链形式存在。当分离的核酸序列被用于表达蛋 白质时,所述核酸序列将包含(最少)有义或编码链的至少一部分(即, 核酸序列可以是单链的)。可选地,它可包含有义和反义链(即,核酸 序列可以是双链的)。41"同源"如本文使用是指两个多肽分子之间或两个核酸分子 之间的序列相似性。当两个对比序列的一个位置被相同碱基或氨基酸
单体亚单位占据时,例如,如果两个DNA分子中的每个DNA分子的
一个位置被腺嘌呤占据,那么,在那个位置上分子同源。两个序列之 间的同源性百分比是两个序列共有的匹配或同源位置的数目除以对比
位置的数目xl00的函数。例如,如果在两个序列中10分之6的位置匹 配或同源,那么两个序列是60%同源。例如,DNA序列ATTGCC和 TATGGC具有50。/。同源性。通常,比较在比对两个序列时进行,以 给出最大同源性。
42术语"肽(一个或多个)"、"蛋白(一种或多种)"和"多 肽(一种或多种)"于此可互换使用。
43术语"蛋白酶"是指蛋白质或蛋白质的多肽结构域或多肽, 它们源于微生物例如真菌、细菌,或源于植物或动物,并且具有催化 蛋白骨架上一个或多个不同位置上的肽键的切割的能力。
44优选地,根据本发明的支链淀粉酶蛋白是分离的或纯化的。 纯化或分离的意思是由于将支链淀粉酶从某些或所有自然发生的、与 其自然结合的组分中分离,支链淀粉酶蛋白从其自然状态发生改变。 这种分离或纯化的完成可以通过本领域公认的分离技术,例如离子交 换层析、亲和层析、疏水分离、透析、蛋白酶处理、硫酸铵沉淀或其 它蛋白质盐沉淀、离心、大小排阻层析、过滤、微过滤、在梯度上的 凝胶电泳或分离进行,从而去除在最终组合物中不期望的完整细胞、 细胞碎片、杂质、外来蛋白或酶。进一步可能的是随后将组分加入到 含有支链淀粉酶的组合物,这可提供额外优势,例如,活化剂、抗抑 制剂、希望的离子、控制pH的化合物或其它酶。优选地,根据本发明 的支链淀粉酶蛋白通过重组方法产生。
45如本文使用的"微生物"是指细菌、真菌、病毒、原生动物 和其它微生物或微小生物。在本发明中,微生物用作外源肽表达的宿 主。
46如本文使用的"衍生物"、"变体"或"修饰的肽、多肽或 蛋白质"表示来源于前体蛋白(例如天然蛋白)的蛋白质,其是通过在 C-和N-端的任一端或两端加入一个或多个氨基酸,在氨基酸序列的一
13个或多个不同位点置换一个或多个氨基酸,在蛋白质任一端或两端或 者在氨基酸序列中的一个或多个位点缺失一个或多个氨基酸,或在氨 基酸序列中的一个或多个位点插入一个或多个氨基酸而得到。优选地 如下获得支链淀粉酶衍生物制备物修饰编码天然蛋白的DNA序列,
将该DNA序列转化至适合的宿主,并且表达修饰的DNA序列以形成 支链淀粉酶衍生物。本发明的"衍生物"包括肽,其包括与前体氨基 酸序列(例如野生型或天然状态的支链淀粉酶)相比改变了的氨基酸序 列,其中所述肽保留前体支链淀粉酶特有的支链淀粉酶性质,但是在 某些具体方面具有改变的性质。例如,支链淀粉酶衍生物可具有增加 的最适pH,对酶促降解或其它降解增加的抗性,增加的酶促有效性, 增加的温度或氧化稳定性,但保留其特有的酶促修饰活性。类似地, 根据本发明的衍生物包括蛋白质、或其它底物、结合结构域,其已被 添加或修饰以改变其底物结合能力。可考虑的是根据本发明的衍生物 源于编码支链淀粉酶衍生物的DNA片段,其中表达的支链淀粉酶衍生 物的功能性活性被保留。衍生物进一步包括改变支链淀粉酶特性的化 学修饰。
47通常地,支链淀粉酶衍生物将具有至少约50%、 "70。/。或85 %氨基酸序列同一性,优选地至少约85 %氨基酸序列同一性,更优 选地至少约90 %氨基酸序列同一性,甚至更优选地至少约95 %氨基 酸序列同一性,还更优选地98%氨基酸序列同一性。优选地,任何氨 基酸置换是使用L-氨基酸的"保守氨基酸置换",其中一种氨基酸被 另一种生物学相似的氨基酸置换。保守氨基酸置换是保持被取代氨基 酸的通常的电荷、疏水性/亲水性、和/或空间排列体积(stericbulk)的 那些置换。保守置换的实例是在下列组之间的那些Gly/Ala, Val/Ile/Leu, Lys/Arg, Asn/Gln, GIu/Asp, Ser/Cys/Thr和Phe/Trp/Tyr。 衍生物可例如只有l至10个氨基酸残基不同,如6-10个,只有5个、 只有4、 3、 2或甚至1个氨基酸残基不同。表1于此示例性说明在本 领域公认的氨基酸置换。
48如在此使用的,支链淀粉酶的"天然序列"或支链淀粉酶的"野 生型"序列包括多肽,其具有与源于天然的亲本菌株的支链淀粉酶相同 的氨基酸序列,或与来自从其制备修饰或衍生支链淀粉酶的支链淀粉酶相同的氨基酸序列,例如,由本发明的亲本菌株R deram折cara (BMP 139)表达的支链淀粉酶。这种天然序列的支链淀粉酶可从自然界分离或 可通过重组或合成方法产生。在一种实施方式中,术语"野生型,,或"天 然序列"的支链淀粉酶是指这样的支链淀粉酶肽,其中本发明变体从其 衍生,并且为图7b中的SEQIDNO: 2。
49如此处使用的,关于此处鉴定的氨基酸或核苷序列的"百分 比(%)序列同一性"被定义为候选序列中与支链淀粉酶序列中的氨基酸 残基或核苷相同的氨基酸残基或核苷的百分比,如有必要,在经过比 对序列和引入空位(gap)后,以获得最大百分比序列同一性,并且不 考虑将任何保守置换作为序列同一性的部分。进行序列比对和确定序 列同一性的方法是普通技术人员己知的,其可以进行而无不适当的实 验,并且同一性数值的计算可以明确获得。参见,例如,Ausubel等人, eds. (1995) Current Protocols in Molecular Biology,第19章(Greene Publishing and Wiley-Interscience , New York);禾卩ALIGN程序(Dayhoff (1978) in Atlas of Protein Sequence and Structure 5:Suppl. 3 (National Biomedical Research Foundation, Washington, D.C.)。许多算法可用于对 比序列和确定序列同一性,并且包括,例如同源性比对算法,Needleman 等人,(1970)J.MoI.Biol.48:443;局部同源性算法,Smith等人,(1981) Adv. Appl. Math. 2:482;搜索相似方法'Pearson等人,(1988) Proc. Natl. Acad. Sci. 85:2444; Sm池-Waterman算法(Meth. Mol. Biol. 70:173-187 (1997);以及BLASTP、 BLASTN和BLASTX算法(见Altschul等人, (1990) J. Mol. Biol. 215:403-410)。使用这些算法的计算程序也是可用 的,包括但不限于ALIGN或Megalign (DNASTAR)软件,或 WU-BLAST-2 (Altschul等人,Meth. Enzym., 266:460-480 (1996));或 GAP、 BESTFIT、 BLAST (Altschul等),见上文,FASTA和TFASTA, 可获自Genetics Computing Group (GCG) package, Version 8, Madison, Wis., USA;禾Q Intelligenetics, Mountain View, Calif的PC/Gene程序中 的CLUSTAL。本领域普通技术人员可确定用于测定比对的适合参数, 包括为获得被比较的序列长度上的最大比对所需的算法。优选地,使 用由程序确定的默认参数测定序列同一性。具体地,可通过 Smith-Waterman同源性搜索算法测定序列同一性(Meth. Mol. Biol.70:173-187 (1997)),如使用仿射空位搜索在MSPRCH程序(Oxford Moecuar)中执行的,所述仿射空位搜索具有下列搜索参数空位开放 罚分(gap open penalty )为12并且空位延伸罚分(gap extension penalty) 为1。优选地,成对氨基酸比较可使用Genetics Computer Group, Inc., Madison, Wis.的GCG序列分析软件包的GAP程序进行,使用 blosum62氨基酸置换矩阵,其空位量为12并且长度量为2。对于两个 氨基酸序列的最适比对,变体氨基酸序列的连续片段相对于参考氨基 酸序列可具有额外的氨基酸残基或缺失的氨基酸残基。用于与参考氨 基酸序列比较的连续片段包括至少20个连续的氨基酸残基,并可以是 30、 40、 50或更多个氨基酸残基。与衍生物的氨基酸序列中包括空位 有关的增加的序列同一性的修正可通过指定空位罚分进行。
50如本文使用,"表达构建物"(或"表达载体")是指DNA 构建物,其包括被可操作连接到适合的控制序列的DNA序列,所述 适合的控制序列能够影响DNA在合适宿主内的表达。这种控制序列 可包括影响转录的启动子、任选的控制转录的操作子序列、编码 mRNA上合适的核糖体结合位点的序列以及控制转录和翻译终止的序 列。本发明不限于使用任何具体表达构建物。不同细胞类型优选地使 用不同的表达载体。例如,用于枯草芽孢杆菌的载体的优选启动子是 AprE启动子;用于5a"7/"5 oferam诉cam的载体的优选启动子是amyL 启动子;用于大肠杆菌(£. //)的优选启动子是Lac启动子;用于啤酒 酵母的优选启动子是PGK1;用于黑曲霉的优选启动子是glaA;以及用 于里氏木霉的优选启动子是cbhl。载体可以是质粒、噬菌体粒或仅仅 是可能的基因组插入。
51
一旦被转化(或转染)至适合的宿主,表达构建物可不依赖 于宿主基因组进行复制和发挥功能,或者可以在适合的条件下,整合 到宿主本身的基因组中。在本说明书中,术语"质粒"、"载体"和 "表达构建物(一种或多种)"有时互换使用。然而,本发明意图包 括其它形式的表达载体,其发挥等同功能并且其是或成为本领域已知 的。因此,大量的宿主/表达载体组合可用于表达本发明的DNA序列。
本说明书的其它地方未提及的对本发明有用的表达载体,例如,可由 染色体片段、非染色体和合成的DNA序列组成,例如各种已知的SV40衍生物和已知的细菌质粒,例如,来自大肠杆菌(eco")的质粒,其
包括colEl、 pCRl、 pBR322、 pMb9、 pUC19和其衍生物;更宽宿主范 围的质粒,例如RP4;噬菌体DNA,例如噬菌体X的众多衍生物,例 如NM989;其它DNA噬菌体,例如M13和丝状单链DNA噬菌体; 酵母质粒,例如2d质粒或其衍生物,用于真核细胞的载体,例如用于 动物细胞的载体和源于质粒和噬菌DNA组合的载体,如被修饰从而使 用噬菌体DNA或其它表达控制序列的质粒。
52使用本发明表达载体的表达技术是本领域已知的并通常描述 在,例如Sambrook等人,MOLECULAR CLONING: A LABORATORY MANUAL,第二版,Cold Spring Harbor Press (1989)。通常,包括本发 明DNA序列的这种表达载体被转化至单细胞宿主,其通过整合事件直 接插入至特定物种的基因组中进行(参见,例如Bennett & Lasure, MORE GENE MANIPULATIONS IN FUNGI, Academic Press, San Diego, pp. 70-76 (1991)和其引用的描述靶向基因组插入到真菌宿主的 文章)。
53术语"可操作连接"、"可操作组合"和"可操作顺序"如 本文使用是指连接核酸序列,以使它们发挥它们预期的功能。例如, 可操作连接启动子序列至感兴趣的核苷酸序列是指连接启动子序列和 感兴趣的核苷酸序列,以使启动子序列能够指导感兴趣的核苷酸序列 的转录和/或感兴趣的核苷酸序列编码的多肽的合成的方式进行。类似 地,将具有年龄-相关调节活性的核酸序列可操作连接到启动子序列和 到感兴趣的核苷酸序列是指,连接具有年龄-相关调节活性的核酸序列、 启动子序列和感兴趣的核苷酸序列,以使具有年龄-相关调节活性的核 酸序列能够在一段时间改变感兴趣的核苷酸序列转录至mRNA的水平 和/或由感兴趣的核苷酸序列编码的多肽的合成的方式进行。
54如本文使用"宿主生物"、"宿主菌株"或"宿主细胞"是 指对于包括根据本发明DNA的表达载体适合的宿主。用于本发明的宿 主细胞通常是原核或真核宿主,其包括任何可转化的微生物,其中可 获得表达。在本发明的内容中,例如,宿主菌株可以是枯草芽孢杆菌 (5ac/〃w sm6///^) 、 Bac/〃ws oferamz/toam (或其它芽孢杆菌种)、埃希 氏大肠杆菌(£^eWc/z/a co//)、里氏木霉(7Wc/wo^ma陋e/)、啤酒酵母(Sacc/wromyces cereWw'ae)或黑曲霉(^5/ erg/〃1^ w'ger)。以应用重组 DNA技术构建的载体来转化或转染宿主细胞。这种转化的宿主细胞能 够复制编码支链淀粉酶和其衍生物或变体(突变体)的载体或表达所期 望的肽产物或二者兼有。
55术语"培养"或"培养条件(一种或多种)"当用于生长宿 主生物群体时,是指培养容器、培养基和培养条件,其适合宿主生物 的生长,并且在用本发明核苷酸序列及其变体转染的宿主生物的情况 下,适合产生本发明的支链淀粉酶。本发明不限于任何具体培养或培 养条件,只要前述是令人满意的。
56如本文使用,"功能性附着"或"可操作连接"是指调节区,例 如启动子、终止子、分泌信号或增强子区,其附着到或连接至结构基 因并控制该基因的表达。
57如本文使用,物质(例如多核苷酸或蛋白质)"源自"微生物是 指该物质是该微生物本身的。
58"木霉(7Wc/zot/wwa)"或"木霉种(Tn'cWe画^.)" 是指任何真菌菌株,其以往被分类为木霉(7Wc/w&,a)或目前被分 类为木霉(7Wc/2o&ma)。优选地,该物种是长柄木霉(7Wc/7^fe,a /o"g/6rac/z/af画)、里氏木霉 (7h'c/2ocfer腿麼緒.)或绿色木霉 (7Wc/7oArmavzW^)。在本发明中,木霉种可作为本发明的宿主生物 使用。
59如本文所述,本发明的一个方面以"基本上纯的"(或重组的) 核酸和/或这种核酸的等价物为特征,所述核酸包括编码支链淀粉酶多 肽的核苷酸序列。术语核酸如本文使用可包括片段和等价物。术语"等 价物"是指编码功能上等同的多肽或功能上等同的蛋白质的核苷酸序 列。等同的核苷酸序列包括由于一个或多个核苷酸置换、添加或缺失 而不同的序列,例如等位变体,并且包括与SEQ ID NO: l中示出的 支链淀粉酶的核苷酸序列不同的序列,原因在于遗传密码的简并性。
60除非另有所述,本发明实践采用细胞生物学、细胞培养、分 子生物学、转基因生物学、微生物学、重组DNA和免疫学的常规技术, 其在本领域的技术范围之内。这种技术描述于文献中。于此引用的所 有出版物、专利和专利申请通过引用为所有目的全部引入于此。见例
18如Molecular Cloning A Laboratory Manual, 2nd Ed., Sambrook, Fritsch 禾口 Maniatis编辑(Cold Spring Harbor Laboratory Press: 1989); DNA Cloning, Volumes I或II (D. N. Glover编辑,1985); Oligonucleotide Synthesis (M. J. Gait ed., 1984); Mullis等,美国专利号4,683,195; Nucleic Acid Hybridization (B. D. Hames禾Q S. J. Higgins编辑,1984); Transformation And Translation (B. D. Hames禾口 S. J. Higgins编辑, 1984); Culture Of Animal Cells (R. I. Freshney, Alan R. Liss, Inc., 1987); Immobilized Cells And Enzymes (IRL Press, 1986); B. Perbal, A Practical Guide To Molecular Cloning (1984); the treatise, Methods In Enzymology (Academic Press, Inc., N.Y.); Gene Transfer Vectors For Mammalian Cells (J. H. Miller and M. P. Calos编辑,1987, Cold Spring Harbor Laboratory); Methods In Enzymology, Vols. 154 and 155 (Wu等人,编辑), Immunochemical Methods In Cell And Molecular Biology (Mayer禾口 Walker编辑,Academic Press, London, 1987); Handbook Of Experimental Immunology, Volumes I-IV (D. M. Weir and C. C. Blackwell,编辑, 1986); Manipulating the Mouse Embryo, (Cold Spring Harbor Laboratory Press,ColdSpringHarbor,N. Y., 1986)。同样,关于蛋白酶的制备、表 达、分离和使用方法的信息可通过美国专利第6,768,001号获得,其于 此通过引用完整引入。
61在下列具体描述和权利要求中,本发明的其它特征和优势将 明显可见。
发明详述
62本发明现仅使用下述定义和实例,通过引用方式详述于此。 所有专利和出版物,包括在这些专利和出版物内公开的所有序列,于 此明确地通过引用而并入。
63除非于此另外定义,如本文使用的所有技术和科学术语具有 本发明所属领域的普通技术人员通常理解的相同含义。Singleton等人 的 DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY, 2D ED., John Wiley和Sons, New York (1994)和Hale & Marham, THE HARPER COLLINS DICTIONARY OF BIOLOGY ,
19Harper Perennial, NY (1991)提供给技术人员在本发明中使用的许多术 语的通用字典。虽然任何类似或等同于那些在此所述的方法和材料可 在本发明的实践或测试中使用,但是优选的方法和材料被描述。数值 范围包括定义该范围的数值。除非另有所述,分别地,核酸以5'至3' 方向从左向右书写;氨基酸序列以氨基至羧基的方向从左向右书写。 对本领域的定义和术语,专业人员可具体注意Sambrook等人,1989 和Ausubel FM等人,1993。应该理解本发明不限于所描述的具体方法、 方案和试剂,因为这些可变化。
64数值范围包括定义该范围的数值。
65除非另有所述,分别地,核酸以5'至3'方向从左向右书写; 氨基酸序列以氨基至羧基的方向从左向右书写。
66本文提供的标题不限制本发明的各个方面或实施方式,其可
通过作为整体参考说明书而理解。因此,紧接在下面定义的术语通过 作为整体参考说明书而被更充分地定义。
分子生物学
67在一种实施方式中,本发明提供在amyL启动子控制下异源 基因的表达。因此,本发明依赖于重组遗传领域的常规技术。公开用 于本发明的普通方法的基本文本包括Sambrook等人,Molecular Cloning, A Laboratory Manual (2nd ed. 1989); Kriegler, Gene Transfer and Expression: A Laboratory Manual (1990)禾口 Ausubel等人编车葺,Current Protocols in Molecular Biology (1994))。
68包括丝状真菌的纤维素酶基因启动子序列的异源基因,在被 转化到里氏木霉细胞用于复制和/或表达之前,通常被克隆到中间载体 中。这些中间载体典型地是原核载体,例如质粒或穿梭载体。
69为了获得克隆基因的高水平表达,异源基因优选地位于与自 然发生纤维素酶基因距启动子的距离大约相同的距离上。但是,如本 领域已知的,该距离的一些变化可允许而不损失启动子功能。
70本领域普通技术人员可意识到自然启动子可通过置换、取 代、添加或去除一种或多种核苷而不改变其功能来修饰。本发明实践 包括并不限于这种对启动子的改变。71表达载体/构建物典型地包含转录单位或表达盒,所述转录 单位或表达盒包含所有异源序列表达所需的附加元件。因此,典型的 表达盒包含可操作地连接至异源核酸序列的启动子和转录物有效多聚 腺嘌呤化作用所需的信号,核糖体结合位点和翻译终止。所述盒的附
加元件可包括增强子和,如果基因组DNA用作结构基因,具有功能
性剪接供体和受体位点的内含子。
72本发明的实践不受遗传构建物中启动子的选择的限制。但是, 示例性启动子是里氏木霉cbhl、 cbh2、 egl、 eg2、 eg3、 eg5、 xlnl和 xln2启动子。
73除启动子序列之外,表达盒还应包含结构基因的转录终止区 下游,以提供有效终止。终止区可从与启动子序列相同的基因获得, 或可从不同基因获得。
74虽然任何真菌终止子在本发明中可能具有功能,但优选的终 止子包括来自构巢曲霉(」^ e/^7/wmWM/"ra) trpC基因的终止子 (Yelton,M.等人,(1984) PNAS USA 81 :1470-1474; Mullaney, E丄等人, (1985) MGG 199:37-45),泡盛曲霉(A; erg/〃Ms awomon')或黑曲霉
"^e,7/M "/ger)葡糖淀粉酶基因(Nunberg, J.H.等(1984) Mol. Cell Biol. 4:2306, Boel, E.等(1984) EMBO J. 3:1581-1585)和米黑毛霉 (MMcorm/e/2e/)羧基蛋白酶基因(EPO
发明者B·S·米勒, C·弗勒门, G·英格兰德, M·孔克曼 申请人:美国丹尼斯克有限公司杰能科子公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1